【摘 要】[目的]探讨学术期刊话语影响力相关指标的特征及关系,为更清晰地认识我国英文期刊话语影响力的现状与差距提供参考[方法]融合多源异构数据,采用文献调研、比较分析、描述性统计分析和多元逐步回归分析等方法,从宏观、中观和微观视角对中国英文学术期刊话语影响力评价指标特征与关系进行研究。[结果]从宏观层面来看,目前中国英文学术期刊数量少、规模小、实力不强,且与中国快速增强的科研竞争力不相匹配。从中观层面来看,我国英文学术期刊数量在学科领域的分布上呈现不均衡特点;12个指标的分布规律和分布特征存在较明显差异;无论是在国内还是在国际上,我国英文学术期刊个体的话语影响力差距较大。从微观层面,由建立的多元线性回归模型发现,总被引频次、CiteScore、国内他引频次、SJR、国际合作率和OA论文数占比对h5指数的影响或贡献度依次减弱,而SNIP、发文量和参考文献数3个指标虽与h5指数呈正相关关系,但对h5指数不存在显著影响。[结论]我国英文学术期刊应发挥中国学术话语的重要代言人这一优势,为中国学术成果走出去和提升我国国际学术话语影响力贡献力量。
【关键词】中国英文学术期刊;话语影响力指标;特征分析;关系研究
2019年8月中国科协等四部委联合印发了《关于深化改革培育世界一流科技期刊的意见》。2019年11月,中国科协等公布了《中国科技期刊卓越行动计划拟入选项目》。2020年9月11日,习近平总书记在科学家座谈会的讲话中提到,要办好一流学术期刊和各类学术平台,加强国内国际学术交流。学术期刊作为学术传播和交流的重要载体,在学科体系、学术体系和话语体系建设中发挥了重要作用。英语是国际学术交流的主流语言,英文学术期刊是融入世界科学共同体的重要途径。中国英文学术期刊不仅在推进我国理论创新、知识创新以及一流学科建设等方面具有重要作用,同时在促进我国国际学术交流、提升我国学术期刊国际化程度和中国国际学术话语权等方面发挥关键作用。
经文献梳理发现,近几年学者们以学术期刊为对象,从不同视角、不同主题进行了丰富的研究。例如:任胜利等[1]对我国英文科技期刊发展现状进行了分析,并指出发展中存在的问题以及发展建议;俞立平等[2]对国内LIS期刊载文量与影响因子的特殊互动机制进行研究;段宇锋等[3]选取218种生物学、物理力学、地质学中文期刊,对期刊特征与被引频次的关系进行了研究。鲜有学者从中国英文学术期刊话语影响力层面进行系统性的探索研究。鉴于此,本文试图融合多源异构数据,采用文献调研、比较分析、描述性统计分析和多元逐步回归分析等方法,试图从横向和纵向视角比较分析中国英文学术期刊被国际数据库收录的整体概况,挖掘中国英文学术期刊话语影响力的相关指标分布特征和潜在分布规律,解析并探究指标间的相互关系,旨在为更清晰地认识我国英文期刊话语影响力的现状与差距,创建世界一流学术期刊,进而提升中国学术期刊话语影响力提供参考。
1 概念界定与数据来源
1.1 概念界定
“话语”源自语言学领域,是特定历史和文化关系中人们运用语言及其他手段和渠道所进行的具有某种目的和效果的社会交往活动[4]。“影响力”起源于心理学,指以别人愿意接受的方式影响和改变他人的想法与行为的能力,后广泛应用于新闻传播和情报学等学科[5]。对文化活动来说,影响力是指文化活动者以一种受人喜爱的方式左右他人行为的能力;对传媒活动来说,其本质特征是它作为信息传播渠道而对受众的社会认知、社会判断、社会决策和社会行为所打上的属于自己的“渠道烙印”[6]。学术期刊话语影响力是指以学术质量为基础的学术内容(包括期刊或其刊载论文的学术观点、思想、理念、方法、发现、事实、情感等)在传播过程中对学界、业界所产生的直接或间接的话语影响力。
学术期刊话语影响力主要有两层内涵:(1)学术期刊本身所具有的内在价值和品质引发受众的关注和思考,取得认同或改变其观点看法并进行引用的能力,具体可由学术期刊在全球最大的Google学术搜索引擎中的h5和h5中位数,或在全球收录最全的文摘数据库Scopus中的h指数、总被引频次,或在全球最大中文数据库CNKI中的国内他引频次等指标来表征;(2)学术期刊在具备第一层内涵的基础上,其学术声誉、学术品牌和学术质量等为学术期刊带来的话语控制力,表现为学术期刊刊发论文的国际合作水平或实施开放获取(Open Access,OA)的传播控制力等,具体可由学术期刊刊发论文的国际合作率、OA论文数占比、CiteScore、SNIP、SJR等指标来表征。
1.2 数据来源
在中国英文学术期刊被国际数据库收录的整体概况分析部分,数据主要来自Web of Science和Scopus数据库,检索时间为2021年1月8日。在中国英文学术期刊话语影响力指标的特征分析和关系研究部分,以2019年10月发布的《中国学术期刊影响因子年报》和《中国英文学术期刊国际国内引证报告》中收录的中国英文学术期刊为基础样本进行筛选,该年报中一共包含314种英文版中国学术期刊。考虑到在Scopus数据库和SCImago数据库与Google Scholar也能获取到该样本数据,本研究最终选择238种中国英文学术期刊(仅指在中国大陆地区正常出版发行的英文学术期刊,以下统称为“中国英文学术期刊”),同时获取这些期刊的国内他引频次这一指标数据。
利用期刊名称和ISSN号,在Scopus数据库和SCImago Journal Rank(SJR,2018版)数据库中进行检索、统计并计算,依次获取中国英文学术期刊的h指数、SJR指标、SNIP、CiteScore、发文量、参考文献数、总被引频次、国际合作率、OA论文数占比9个指标数据,检索时间为2019年11月10日。在Google Scholar搜索引擎中,利用其2019版Google学术指标(Google Scholar Metrics),输入学术期刊名称,检索得到出版物的h5指数和h5中位数2个指标数值,检索时间为2019年11月11日。Google(2019版)学术指标涵盖了2014—2018年各期刊发表的论文,并包括这些论文截至2019年7月在Google Scholar中被引用的记录。
本研究融合了多源异构的指标数据,为了保证研究结果的可靠性,需要对指标数据做标准化处理,以使指标数据之间具有可比性。采用离差标准化对所有原始的中国英文学术期刊话语影响力正向指标数据进行处理,该方法的优点在于消除了指标数据处于不同单位值的缺陷,将其转化为无量纲值,并将数据统一映射到[0,1]区间,以便对不同单位或数量级的指标进行比较和加权。
2 结果与分析
2.1 宏观视角:中国英文学术期刊被国际数据库收录的整体概况
2.1.1 国家层面收录期刊数量分布比较
截至2021年1月,2019版JCR收录的期刊总数为12819种。表1为JCR收录前15位国家的期刊数量情况。由表1可知,2019版JCR收录中国期刊数量为252种,仅占期刊总数1.97%;收录期刊数量最多的国家主要来自欧美发达地区,且超过一半期刊来自美国或英国。表2所示为2020年度来源于Scopus数据库的SJR收录前15位国家的期刊数量情况。由表2可知,2019版SJR收录的中国期刊数量为649种,占期刊总数的2.48%,居第6位(事实上,这600多种期刊中包含了中文期刊和英文期刊,英文期刊数量仅为200多种)。从整体来看,2019版JCR中排在前10位的国家期刊数量占收录期刊总数的83.71%;2019版SJR中,排在前15位的国家期刊数量占收录期刊总数的82.79%,说明期刊数量在国家分布上呈现高度集中的特点。美国和英国期刊数量遥遥领先于其他国家,在数量规模上位居第一方阵;荷兰和德国的期刊数量规模位居第二方阵;日本、中国、西班牙、法国和瑞士等期刊数量规模只能排在第三方阵。由此表明,就期刊数量而言,中国与美国、英国、荷兰和德国仍存在较大差距。
表1 JCR收录前15位国家期刊数量
序号 | 国家 | 收录期刊数量 /种 | 占比 /% |
1 | 美国 | 4463 | 34.82 |
2 | 英国 | 3124 | 24.37 |
3 | 荷兰 | 1013 | 7.90 |
4 | 德国 | 771 | 6.01 |
5 | 瑞士 | 330 | 2.57 |
6 | 中国 | 252 | 1.97 |
7 | 日本 | 251 | 1.96 |
8 | 法国 | 198 | 1.54 |
9 | 澳大利亚 | 179 | 1.40 |
10 | 俄罗斯 | 150 | 1.17 |
11 | 波兰 | 143 | 1.12 |
12 | 韩国 | 138 | 1.08 |
13 | 加拿大 | 130 | 1.01 |
13 | 西班牙 | 130 | 1.01 |
15 | 巴西 | 127 | 0.99 |
前15合计 | 11399 | 88.92 | |
总计 | 12819 | 100.00 |
表2 SJR收录前15位国家期刊数量
序号 | 国家 | 收录期刊数量 /种 | 占比 /% |
1 | 美国 | 6359 | 24.27 |
2 | 英国 | 6088 | 23.23 |
3 | 荷兰 | 1935 | 7.38 |
4 | 德国 | 1579 | 6.03 |
5 | 中国 | 649 | 2.48 |
6 | 西班牙 | 648 | 2.47 |
7 | 瑞士 | 619 | 2.36 |
8 | 法国 | 573 | 2.19 |
9 | 俄罗斯 | 552 | 2.11 |
10 | 意大利 | 545 | 2.08 |
11 | 印度 | 543 | 2.07 |
12 | 日本 | 491 | 1.87 |
13 | 波兰 | 429 | 1.64 |
14 | 巴西 | 398 | 1.52 |
15 | 加拿大 | 285 | 1.09 |
前15合计 | 21693 | 82.79 | |
总计 | 26202 | 100.00 |
从发表论文数量方面来看(表3),2010年1月1日至2020年12月31日,美国在JCR收录期刊的发文量遥遥领先,雄踞第1位;中国发文量排在第2位,总被引频次也排在第2位,但篇均被引频次在这15个国家中居第14位。由表4所示的发文情况可知,1996—2019年,美国发文总数、总被引频次和h指数均遥遥领先,雄踞第1位;中国发文总数排在第2位,总被引频次排在第4位,h指数排在第11位。由此可见,中国发文量呈“大而不强”的特点,在发文数量上占绝对优势,仅次于美国,但从总被引频次和h指数排名来看,与其他发达国家仍存在较大的差距。
表3 JCR收录期刊发文量前15位国家近10年发文情况(2010—2020年)
序号 | 国家 | 发文量 /篇 | 总被引频次 /次 | 篇均被引频次 /次 |
1 | 美国 | 4290881 | 83735562 | 19.51 |
2 | 中国 | 3112878 | 37985767 | 12.20 |
3 | 英国 | 1092723 | 22166668 | 20.29 |
4 | 德国 | 1154997 | 21545863 | 18.65 |
5 | 法国 | 788619 | 14380057 | 18.23 |
6 | 加拿大 | 727537 | 13603418 | 18.70 |
7 | 意大利 | 721703 | 12361478 | 17.13 |
8 | 澳大利亚 | 652296 | 11868281 | 18.19 |
9 | 日本 | 863992 | 11739717 | 13.59 |
10 | 西班牙 | 624190 | 10353485 | 16.59 |
11 | 荷兰 | 429669 | 9750300 | 22.69 |
12 | 瑞士 | 321688 | 7635237 | 23.73 |
13 | 韩国 | 601170 | 7617345 | 12.67 |
14 | 印度 | 673767 | 7121635 | 10.57 |
15 | 瑞典 | 290243 | 5819304 | 20.05 |
前15合计(占比) | 16366353(71.67%) | |||
总计 | 22836829(100.00%) |
表4 SJR收录期刊发文量前15位国家近24年的发文情况(1996—2019年)
序号 | 国家 | 发文量 /篇 | 总被引频次 /次 | h指数 |
1 | 美国 | 12839607 | 339229687 | 2386 |
2 | 中国 | 6589695 | 61658138 | 884 |
3 | 英国 | 3715590 | 89357199 | 1487 |
4 | 德国 | 3222549 | 70371678 | 1298 |
5 | 日本 | 2893614 | 48232916 | 1036 |
6 | 法国 | 2249498 | 48364784 | 1180 |
7 | 意大利 | 1881818 | 37430348 | 1030 |
8 | 加拿大 | 1877183 | 45766661 | 1193 |
9 | 印度 | 1873277 | 18243852 | 624 |
10 | 澳大利亚 | 1489730 | 32118547 | 1001 |
11 | 西班牙 | 1483214 | 27612970 | 904 |
12 | 俄罗斯 | 1202476 | 9135422 | 580 |
13 | 韩国 | 1196961 | 17047690 | 687 |
14 | 荷兰 | 1038372 | 29678428 | 1032 |
15 | 巴西 | 1027748 | 12224442 | 578 |
前15合计(占比) | 44581332(75.81%) | |||
总计 | 58807729(100.00%) |
以上分析表明,目前中国英文学术期刊数量少、规模小、实力不强,话语影响能力仍较低,且与不断增加的中国科研论文数量和不断增强的中国科研竞争力状况不匹配,与其他发达国家相比,仍存在较大差距。学者们对造成此种局面的深层次原因进行了讨论[7],主要原因包括:(1)我国科技期刊运营管理机制不够灵活,单刊形式的“小作坊”运作较多,市场化程度不高;(2)缺乏国际一流数字出版与传播平台,数字融合出版服务与传播手段较落后,在全球范围内整合学术资源能力较弱;(3)唯SCI马首是瞻的科研评价现象突出,大量优秀科技论文外流,致使我国科技期刊缺乏优质稿源、学术话语权低下。
2.1.2 历年收录期刊数量分布
(1) JCR与SJR收录期刊数量及占比分布。图1所示为近10年JCR收录中国英文学术期刊及其占比分布情况。由拟合方程可知:JCR收录学术期刊总数和JCR收录的中国英文学术期刊数量均呈指数增长的趋势;尽管中国英文学术期刊数量占比也呈现出缓慢的上升趋势,但是相对于JCR收录的学术期刊总数,其所占的份额仍较小。图2所示为近10年Scopus数据库的SJR收录的中国学术期刊数量及其占比分布情况。由拟合方程可知,SJR收录的学术期刊总数和SJR收录的中国学术期刊数量均呈线性增长的趋势,收录的中国学术期刊数量占比呈振荡上升趋势。

图1 JCR历年收录中国英文学术期刊数量及占比分布情况

图2 SJR历年收录中国学术期刊数量及占比分布情况
(2) OA期刊数量及占比分布。20世纪90年代末,OA运动率先在欧美国家兴起,之后在“3个宣言”的推动下快速发展。OA期刊已成为一类重要的学术资源,并呈现“主流化”趋势,推动全球知识创新发展与传播[8]。近年来,关于OA期刊对科学论文引用的影响研究一直是热点。已有研究表明,OA期刊论文确实比非OA期刊论文获得更多的引用[9]。Wang等[10]比较了发表在《自然通讯》上的OA和非OA论文,发现OA论文的被引频次和页面浏览量更多,被下载时间更长,在社交媒体上的表现也更突出。图3和图4所示分别为JCR和SJR历年收录中国OA学术期刊数量及占比分布情况。由拟合方程可知,JCR和SJR收录OA学术期刊数量和中国OA学术期刊数量都在增加,分别呈现出指数和线性的增长趋势,中国OA学术期刊数量占比也在不断增大。但相比于JCR和SJR收录的OA学术期刊数量,我国所占比例仍较小,比如2020年占比分别仅为4.55%和1.23%,目前我国全面实施OA出版仍任重道远。

图3 JCR历年收录中国OA学术期刊数量及占比分布情况

图4 SJR历年收录中国OA学术期刊数量及占比分布情况
2.2 中观视角:中国英文学术期刊话语影响力指标特征分析
(1)学科分布情况。OECD学科分类体系更适合从宏观层面对学术期刊进行学科归属划分。根据该学科分类体系,本研究将238种中国英文学术期刊按照学科大类进行分类,包括自然科学、工程与技术、医学与健康科学、农业科学和人文与社会科学5个大类。238种英文学术期刊中,自然科学、工程与技术两大类共有181种期刊,占比为76%;医学与健康科学大类有37种期刊,占比为15%;农业科学大类有7种期刊,占比为3%;人文与社会科学大类有13种期刊,占比为6%。可以发现,科技期刊所占比例较大(94%),而人文社科期刊所占比例较小(6%),我国英文学术期刊在学科领域的分布上呈现不均衡特点。
(2)描述性统计分析。表5为中国英文学术期刊话语影响力指标的描述性统计分析结果,其中列出了238种期刊话语影响力指标的第一四分位数、中位数、第三四分位数、最大值、均值、标准差、偏度和峰度等统计量。CiteScore可看作是3年影响因子;SNIP反映了学术期刊在其领域的影响力,可对不同主题领域的学术期刊进行直接比较。由表5可知,h5指数、h5中位数、h指数、CiteScore、SNIP、SJR和国际合作率7种指标的均值与中位数较为接近,且标准差相对较小,表明整体上他们具有向中心集中的程度较高、离散程度较低的特征;而国内他引频次、总被引频次、发文量、参考文献数和OA论文数占比5种指标的均值与中位数存在显著差异,标准差亦较大,表明整体上他们具有向中心集中的程度较低、两极化离散程度较高的特征。从表5还可以看出,除了国际合作率外,其余11种指标数值的极大值与其第一四分位数的差距均十分明显,表明指标数值的波动范围极大。另外,从分布形态来看,OA论文数占比的偏度为正值,而峰度为负值,其分布呈现长尾偏右的平峰分布曲线特征;其余11个指标数值的偏度、峰度均为正值,其分布均呈现长尾偏右的尖顶曲线特征。
表5 中国英文学术期刊话语影响力指标的描述性统计
指标 | 集中趋势与离散程度 | 分布形态 | ||||||
第一四分位数 | 中位数 | 第三四分位数 | 最大值 | 均值 | 标准差 | 偏度 | 峰度 | |
h5指数 | 12 | 19 | 27 | 77 | 20.78 | 12.09 | 1.39 | 3.91 |
h5中位数 | 17 | 28 | 39 | 122 | 29.76 | 18.47 | 1.53 | 4.31 |
h指数 | 14 | 23 | 34 | 143 | 26.58 | 18.62 | 2.06 | 7.57 |
国内他引频次 | 159 | 412 | 1112.5 | 7945 | 887.28 | 1242.16 | 3.01 | 10.94 |
总被引频次 | 154.25 | 414 | 880.5 | 8660 | 687.51 | 928.1 | 3.93 | 24.56 |
CiteScore | 0.91 | 1.69 | 2.8 | 15.01 | 2.16 | 2.08 | 2.89 | 12.23 |
SNIP | 0.51 | 0.83 | 1.21 | 5.1 | 0.95 | 0.68 | 2.09 | 8.19 |
SJR | 0.3 | 0.51 | 0.84 | 7.5 | 0.75 | 0.88 | 4.21 | 23.54 |
发文量 | 132 | 228 | 391 | 3220 | 321.83 | 341.74 | 3.95 | 24.69 |
参考文献数 | 1438.5 | 3103.5 | 5895 | 42485 | 4332.9 | 4668.75 | 3.56 | 21.96 |
国际合作率 | 0.1 | 0.16 | 0.25 | 0.9 | 0.18 | 0.12 | 1.4 | 4.8 |
OA论文数占比 | 0 | 0.0325 | 0.825 | 1 | 0.324 | 0.421 | 0.779 | -1.228 |
(3) SJR指标分布特征。SJR指标是利用Google的PageRank算法来测量基于Scopus数据库的期刊声望,该指标同时考虑了期刊引文数量和引文质量,着重于被引频次和引用者自身的学术话语影响力(名人认同效应)。具体而言,越多知名专家学者引用了同一篇论文,该文的SJR指标越高,说明该文作者的学术话语影响力越高,所在的期刊学术话语影响力也越高。在238种英文学术期刊中,SJR大于2.2的学术期刊有9种。经统计得到238种期刊的SJR均值为0.754,SJR值小于或等于均值的期刊有171种,占期刊总数的71.85%。SJR≥1的期刊有44种,占期刊总数的18.49%。由此说明,我国英文学术期刊中,SJR值低者占多数,学术话语影响力偏低者占多数。
(4) h指数与h5指数指标分布特征。对我国英文学术期刊的h5指数(来源于Google Metrics)和h指数(来源于SCImago)的分析得到,238种期刊的h5指数和h指数均值分别为20.78和26.58。132种期刊的h5指数小于均值,占比为55.46%;141种期刊的h指数小于均值,占比为59.24%。由此可见,Google Metrics与SCImago数据库所提供的h系列指标数据在一定程度上具有一致性,从侧面较为一致地反映了中国英文学术期刊话语影响力的分布情况。
(5)其他指标分布特征。为了进一步了解中国英文学术期刊在国内和国际上学术话语影响力状况,分别以国内他引频次指标数据为x轴,CiteScore指标数据为y轴,总被引频次指标数据(3年)为z轴,绘制了3种指标的三维特征分布图(图5)。由表5所示的描述性统计分析结果可知,3种指标的均值分别为887、2.16和687。结合图5和表5可以发现:绝大部分期刊的3种指标数据值都小于均值,且基本上都处于三维立体图的下游区域;少数期刊处于三维立体图的上游或中游位置,这些期刊的3种指标数据都远远大于其均值,如Nano Research、Cell Research、Light: Science & Applications、Chinese Medical Journal、Melecular Plant、Science Bulletin等英文期刊。以上分析从侧面说明,无论是在国内还是在国际上,我国英文学术期刊个体的话语影响力差距较大,个别期刊拥有较高的话语影响力,而大部分期刊的话语影响力较低。

图5 中国英文学术期刊话语影响力三维特征分布图
2.3 微观视角:中国英文学术期刊话语影响力指标关系的多元逐步回归分析
本节采用相关性分析和多元逐步回归方法分析中国学术期刊话语影响力指标内部、外部关系的强弱及影响,从而更加深刻地理解指标内涵和特征。
2.3.1 相关性分析
由Q-Q图分析结果可知,12个指标数值均不服从正态分布,因此使用斯皮尔曼相关性分析法,分析结果如表6所示。由表6可知,大部分指标间呈正相关关系,而发文量指标与国际合作率指标呈弱负相关关系,发文量指标与SNIP指标不相关,国际合作率与国内他引频次不相关,OA论文数占比与国内他引频次、发文量不相关。
表6 话语影响力指标间的相关性分析结果
h5指数 | h5中位数 | h指数 | 国内他引频次 | 总被引频次 | CiteScore | SNIP | SJR | 发文量 | 参考文献数 | 国际合作率 | OA论文数占比 | |
h5指数 | 1 | 0.97** | 0.79** | 0.58** | 0.88** | 0.83** | 0.67** | 0.80** | 0.47** | 0.66** | 0.39** | 0.43** |
h5中位数 | 0.97** | 1 | 0.75** | 0.50** | 0.85** | 0.85** | 0.70** | 0.81** | 0.41** | 0.60** | 0.42** | 0.45** |
h指数 | 0.79** | 0.75** | 1 | 0.74** | 0.84** | 0.60** | 0.47** | 0.61** | 0.66** | 0.68** | 0.24** | 0.16* |
国内他引频次 | 0.58** | 0.50** | 0.74** | 1 | 0.69** | 0.35** | 0.21** | 0.32** | 0.73** | 0.65** | -0.04 | -0.05 |
总被引频次 | 0.88** | 0.85** | 0.84** | 0.69** | 1 | 0.75** | 0.59** | 0.71** | 0.72** | 0.82** | 0.24** | 0.33** |
CiteScore | 0.83** | 0.85** | 0.60** | 0.35** | 0.75** | 1 | 0.87** | 0.92** | 0.16* | 0.48** | 0.54** | 0.60** |
SNIP | 0.67** | 0.70** | 0.47** | 0.21** | 0.59** | 0.87** | 1 | 0.82** | 0.04 | 0.27** | 0.56** | 0.57** |
SJR | 0.80** | 0.81** | 0.61** | 0.32** | 0.71** | 0.92** | 0.82** | 1 | 0.16* | 0.45** | 0.56** | 0.58** |
发文量 | 0.47** | 0.41** | 0.66** | 0.73** | 0.72** | 0.16* | 0.04 | 0.16* | 1 | 0.74** | -0.21** | -0.09 |
参考文献数 | 0.66** | 0.60** | 0.68** | 0.65** | 0.82** | 0.48** | 0.27** | 0.45** | 0.74** | 1 | 0.13* | 0.17** |
国际合作率 | 0.39** | 0.42** | 0.24** | -0.04 | 0.24** | 0.54** | 0.56** | 0.56** | -0.21** | 0.13* | 1 | 0.44** |
OA论文数占比 | 0.43** | 0.45** | 0.16* | -0.05 | 0.33** | 0.60** | 0.57** | 0.58** | -0.09 | 0.17** | 0.44** | 1 |
有研究发现,参考文献数量越多,越有可能提高论文的被引频次[11-12]。科研合作是重要的学术交流方式,可促进不同学术背景的研究者交换、共享学术资源,已有研究证实,国际合作可以提高科学产出的数量与质量、增加被引频次[13-14]。同时,由表6可知,h5指数、h5中位数与其他指标均呈较强的正相关关系。本研究的统计数据也支持了盛丽娜[15]和赵星等[16]的研究结论,即被引频次、h指数、CiteScore、SNIP、SJR、发文量、参考文献数、国际合作率等指标间均呈正相关关系。
2.3.2 多元逐步回归分析
采用多元逐步回归分析的优势在于每引入一个变量,都会对已在方程中的变量进行检验,旨在将对因变量影响强的自变量引入回归模型,并尽可能发现对因变量影响弱的自变量后进行逐一剔除。h5指数是由Google Scholar推出的对学术期刊进行评价的指标。Google Scholar是目前使用最广泛的免费学术搜索引擎之一,2018年有学者通过调查101项学术交流创新项目发现,92%的受访学者使用Google Scholar进行学术搜索。学术期刊被其收录有助于提升可访问性、可到达性,提高阅读、共享和在线引用的概率,从而扩大学术期刊的话语影响。Gusenbauer[17]研究发现,Google Scholar收录了3.89亿条记录,是世界上最全面的学术搜索引擎。因此,有必要对影响h5指数的变量进行探究,为提升中国英文学术期刊话语影响力提供定量参考。
(1)绘制散点矩阵图。由相关性分析与散点图矩阵(见图6,篇幅有限,仅列出部分)可知,h5指数与其他指标数值均呈正相关关系,且呈一定的线性关系,整体上具有显著的一致性。本节将其作为中国英文学术期刊话语影响力的代表性指标做进一步的回归分析,以探究h5指数的影响因素,并深入挖掘这些指标的特征。因此,以h5指数为因变量,以总被引频次、国内他引频次、国际合作率、OA论文数占比、CiteScore和SJR为自变量,采用逐步回归方法进行分析。

(a)h5指数与总被引频次的散点图

(b)h5指数与国际合作率的散点图

(c)h5指数与国内他引频次的散点图

(d)h5指数与CiteScore的散点图

(e)h5指数与SNIP的散点图

(f)h5指数与SJR的散点图
图6 散点图矩阵
(2)结果分析。表7所示为所设计模型的拟合情况,模型1至模型6中的复相关系数(R)、决定系数(R2)、调整后的R2逐渐增大,随机误差估计值逐渐减小,说明模型可解释的变化占总变化的比例越来越大。最终的回归模型6中包含了6个变量(总被引频次、CiteScore、国内他引频次、国际合作率、OA论文数占比、SJR),复相关系数R=0.900,表明模型中的6个自变量与因变量线性相关密切;决定系数R2=0.810,说明因变量h5(Y)变异的81%可由预测变量总被引频次(X1)、CiteScore(X2)、国内他引频次(X3)、国际合作率(X4)、OA论文数占比(X5)和SJR(X6)来解释,表明模型对数据的拟合程度较好;调整后的R2=0.805,也表明模型的拟合效果较好;随机误差估计值为0.070192,接近于0,说明回归方程效果较好。同时,根据方差分析的结果,6个模型的偏回归系数都为0(P<0.001),表明所拟合的模型具有统计学意义。
表7 模型汇总表
模型 | R | R² | 调整后的R² | 随机误差估计值 |
1 | 0.798a | 0.637 | 0.635 | 0.096046 |
2 | 0.882b | 0.779 | 0.777 | 0.075185 |
3 | 0.892c | 0.795 | 0.793 | 0.072428 |
4 | 0.896d | 0.802 | 0.799 | 0.071405 |
5 | 0.898e | 0.807 | 0.802 | 0.070709 |
6 | 0.900f | 0.810 | 0.805 | 0.070192 |
表8所示为各模型的常数项以及各自变量的偏回归系数估计值。由模型6可知,经t检验得到所有偏回归系数检验的P值均小于0.05(在α=0.05的检验水平下),偏回归系数均不为0,有显著性意义,均可纳入到最终的回归模型中。因此,本研究建立的多元线性回归模型为:Y=0.1+0.631×X1+0.317×X2+0.196×X3+0.09×X4+0.031×X5+0.182×X6。偏回归系数B解释了自变量对因变量的影响程度,如总被引频次的偏回归系数为0.631,说明在其他因素不变的情况下,总被引频次每增加1个单位,h5指数就增加0.631个单位。而标准化回归系数可以比较各自变量对因变量的影响大小,标准化回归系数的绝对值越大,对自变量的影响越大。从表8可以看到,6个自变量按标准化回归系数的绝对值大小排序,依次为总被引频次、CiteScore、国内他引频次、SJR、国际合作率和OA论文数占比,他们对h5指数的影响或贡献度依次减弱。另外,在已排除的变量中,SNIP、发文量和参考文献数变量t检验的显著性概率P值分别为0.647、0.645和0.578,均大于0.05,故将其排除,由此说明SNIP、发文量和参考文献数3个指标虽与h5指数呈相关关系,但对h5指数不存在显著影响。
表8 系数表
模型 | 自变量 | 未标准化系数 | 标准化系数 | t | P | |
B | 标准误差 | β | ||||
1 | 常量 | 0.166 | 0.008 | 21.427 | <0.001 | |
总被引频次 | 1.185 | 0.058 | 0.798 | 20.352 | <0.001 | |
2 | 常量 | 0.124 | 0.007 | 17.779 | <0.001 | |
总被引频次 | 0.829 | 0.054 | 0.559 | 15.352 | <0.001 | |
CiteScore | 0.509 | 0.042 | 0.446 | 12.253 | <0.001 | |
3 | 常量 | 0.114 | 0.007 | 16.145 | <0.001 | |
总被引频次 | 0.591 | 0.075 | 0.398 | 7.854 | <0.001 | |
CiteScore | 0.559 | 0.042 | 0.490 | 13.434 | <0.001 | |
国内他引频次 | 0.196 | 0.045 | 0.192 | 4.386 | <0.001 | |
4 | 常量 | 0.098 | 0.009 | 10.740 | <0.001 | |
总被引频次 | 0.620 | 0.075 | 0.418 | 8.277 | <0.001 | |
CiteScore | 0.480 | 0.050 | 0.421 | 9.630 | <0.001 | |
国内他引频次 | 0.200 | 0.044 | 0.197 | 4.553 | <0.001 | |
国际合作率 | 0.121 | 0.043 | 0.102 | 2.784 | 0.006 | |
5 | 常量 | 0.094 | 0.009 | 10.263 | <0.001 | |
总被引频次 | 0.635 | 0.074 | 0.428 | 8.532 | <0.001 | |
CiteScore | 0.442 | 0.052 | 0.387 | 8.516 | <0.001 | |
国内他引频次 | 0.200 | 0.044 | 0.197 | 4.591 | <0.001 | |
国际合作率 | 0.114 | 0.043 | 0.096 | 2.643 | 0.009 | |
OA论文数占比 | 0.029 | 0.012 | 0.076 | 2.368 | 0.019 | |
6 | 常量 | 0.100 | 0.010 | 10.487 | <0.001 | |
总被引频次 | 0.631 | 0.074 | 0.425 | 8.526 | <0.001 | |
CiteScore | 0.317 | 0.079 | 0.278 | 4.039 | <0.001 | |
国内他引频次 | 0.196 | 0.043 | 0.192 | 4.516 | <0.001 | |
国际合作率 | 0.090 | 0.044 | 0.076 | 2.038 | 0.043 | |
OA论文数占比 | 0.031 | 0.012 | 0.083 | 2.581 | 0.010 | |
SJR | 0.182 | 0.087 | 0.136 | 2.105 | 0.036 |
3 结论与展望
本研究以中国英文学术期刊为例,对其学术期刊话语影响力的相关指标及其关系进行分析,主要得到以下结论:(1)从宏观层面来看,目前中国英文学术期刊数量少、规模小、实力不强,且与中国快速增强的科研竞争力状况不相匹配。(2)从中观层面来看,我国英文学术期刊在学科领域的分布上呈现不均衡特点;12个指标的分布规律和分布特征存在较明显差异;无论是在国内还是在国际上,我国英文学术期刊话语影响力差距较大,个别期刊话语影响力较大,而大部分期刊话语影响力较小。(3)从微观层面,由建立的多元线性回归模型发现,总被引频次、CiteScore、国内他引频次、SJR、国际合作率和OA论文数占比对h5指数的影响或贡献度依次减弱,而SNIP、发文量和参考文献数3个指标虽与h5指数呈正相关关系,但对h5指数不存在显著影响。
中国英文学术期刊应发挥中国学术话语的重要代言人这一优势,为世界真正了解“学术中的中国”“理论中的中国”和“实践中的中国”,最终加快学科体系、学术体系和话语体系建设,提升我国国际学术话语影响力贡献力量。本研究尚存在不足之处,如选取的样本量偏少、未构建相关评价指标体系等。在后续研究中,笔者将在本研究的基础上,尝试扩大数据源、构建相应的评价指标体系和评价模型,进行中国英文学术期刊话语影响力评价的相关研究,并提出有针对性地提升我国英文学术期刊话语影响力的建议和对策。
参考文献
[1]任胜利,宁笔,陈哲,等.2019年我国英文科技期刊发展回顾[J].科技与出版,2020(3):6-13.
[2]俞立平,张再杰,琚春华.载文量与影响因子特殊互动机制研究:兼谈两者关系研究的误区[J].情报科学,2019,37(7):11-15.
[3]段宇锋,刘俊茹,步坤.期刊特征与被引频次的关系研究[J].情报资料工作,2018(2):13-18.
[4]施旭.什么是话语研究[M].上海:上海外语教育出版社,2017.
[5]邱均平,余厚强.基于影响力产生模型的替代计量指标分层研究[J].情报杂志,2015,34(5):53-58.
[6]周舟.提升科技期刊影响力的“哑铃型”模式研究[J].湖南师范大学社会科学学报,2010,39(5):140-144.
[7]任胜利.培育世界一流科技期刊背景下我国学术期刊国际竞争力的提升[J].科学通报,2019,64(33):3393-3398.
[8]张晓林,李麟,刘细文,等.开放获取学术信息资源:逼近“主流化”转折点[J].图书情报工作,2012,56(9):42-47.
[9]Kousha K,Abdoli M.The citation impact of open access agricultural research[J].Online Information Review,2010,34(5):772-785.
[10]Wang X W,Liu C,Mao W L,et al.The open access advantage considering citation,article usage and social media attention[J].Scientometrics,2015,103(2):555-564.
[11]谢娟,成颖,李江,等.文化资本与论文影响力的关系[J].情报学报,2019,38(9):943-953.
[12]Didegah F,Thelwall M.Which factors help authors produce the highest impact research?Collaboration,journal and document properties[J].Journal of Informetrics,2013,7(4):861-873.
[13]陈悦,宋超,周京生,等.文献计量学视角下的论文被引频次影响因素研究:兼评使用与被引之间关系[J].情报杂志,2019,38(4):96-104.
[14]Abramo G,D'Angelo C A,Solazzi M.The relationship between scientists' research performance and the degree of internationalization of their research[J].Scientometrics,2011,86(3):629-643.
[15]盛丽娜.CiteScore、CiteScore百分位与常用期刊评价指标的相关性分析[J].中国科技期刊研究,2018,29(6):605-611.
[16]赵星,高小强.期刊h型指数与论文数量和被引的关系实证[J].图书情报工作,2009,53(20):131-134.
[17]Gusenbauer M.Google Scholar to overshadow them all?Comparing the sizes of 12 academic search engines and bibliographic databases[J].Scientometrics,2019,118(1):177-214.