SJR指数及其与影响因素的比较研究_影响因子论文

SJR指数研究及其与影响因子的比较分析，本文主要内容关键词为：因子论文,指数论文,SJR论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

中图分类号 G35 文献标识码 A 文章编号 1002－1965（2009）11－0027－04

0 引言

学术期刊在学术活动中一直起着非常重要的作用，它是学术成果交流的重要的信息平台和载体。为此，常常需要对学术期刊在科学活动和文献交流中所起的作用及其质量做出客观、全面的评价。引文分析方法是达到这一目的最有效的方式之一，它通过各种计量指标，能对学术期刊的学术影响力进行相对客观的评价。1955年，美国科技信息研究所的创始人加菲尔德基于引文分析的方法提出了期刊影响因子的设想[1]，此后随着科学引文索引（SCI）和期刊引证报告（JCR）的问世，期刊影响因子在世界范围内被广泛用作评价学术期刊的重要指标之一。

尽管影响因子几十年来得到了广泛的认可和应用，但影响因子在计算过程中存在的缺陷一直备受学术界的批评。因此，学术界一直在提出其他一些更客观的学术期刊评价方法。其中有相当一部分研究是对引用行为的质量进行评估。引用质量可以通过对引用网络使用复杂的数学算法计算得出，而Google的通过网页互相链接关系计算网页重要程度的PageRank算法本身就是一个与学术文献互相引用类似的评价模型。事实上，学术界一直在研究如何利用类似PageRank算法的模型来评价科技期刊。西班牙的一个研究小组基于Elsevier的Scopus数据库的数据应用与PageRank类似的算法提出了SJR（SCImago Journal Rank）[2]，该指标2008年得到了《Nature》的报道并被认为是对ISI的期刊影响因子的强有力的挑战[3]。正因为如此，本文试图分析评估SJR与期刊影响因子的主要特征以及各自的优缺点。

1 影响因子的局限性

影响因子在计算过程中存在的缺陷一直备受学术界的批评，其中最主要的反对观点包括：

a.期刊影响因子在计算过程中并没有对引用行为的质量进行评估，只是对引文的绝对数量的统计。一篇学术权威发表的文章中引用的参考文献与一些作者毫不相关的引用相比，谁的价值更高不言而喻。

b.在计算过程中未能排除期刊的自引行为，这使得期刊可以通过增加自引来提高影响因子。

c.期刊影响因子计算方法采用的时间段为两年，由于研究领域差异性导致不同领域的论文的被引频次有较大差异。对于研究成果时效性强、持续时间较短的热点研究领域论文，出版周期快的话容易得到更多的引证。例如，美国临床医学方面的论文发表周期只有几周，83％的论文于发表当年被美国科学家引用（包括自引）。而有些领域科研周期较长，发表周期也相对较长，就有可能出现引用行为因超出两年的时限不能被计入被引频次，进而影响影响因子的计算结果。

d.SCI收录的不同学科的期刊数目差别很大（即SCI检索的不同学科的论文数和引文数相差较大）。而相同或相近研究领域的论文倾向于相互引证，这又反过来加大了不同学科间刊物的影响因子的差异。例如[4]，2006年肿瘤学（Oncology）类期刊最高影响因子为CA－A Cancer Journal for Clinician的63.342，中位数（即同类期刊中按影响因子排序第50％个期刊的影响因子）为2.396，而电气电子工程类（Engineering-Electrical and Electronic）期刊影响因子最高为Progress in Quantum Electronics的4.500，中位数只有0.72。

e.基于少量期刊刊载大量有重大意义和影响的科研成果的研究结果，ISI只对其收录的期刊进行数据采集和评价。而SCIE收录期刊只占全世界期刊总量的3.6％，而且语种分布也极不平衡，极少收录英文之外的语种。这种收录期刊数和语种分布，非常有利于以英语为母语的国家的刊物获得高影响因子。反之，对于其他国家的非英文刊物来说，获取高影响因子的难度相对较大。

2 SJR指数介绍及其与影响因子的比较

SJR指数是西班牙的一个研究小组基于Scopus数据库的数据应用与PageRank类似的算法提出的指标，它利用期刊之间的引用关系来计算期刊的重要性，将期刊A引用期刊B的次数解释为期刊A对期刊B所投的票数。这样，期刊B在期刊A处得到的分数为期刊A的得分（代表期刊A的重要性）乘以期刊A对期刊B所投的票数。SJR指数的数学定义如下[5]：

Dangling－nodes：整个期刊引用网中的孤立节点，它们与其他期刊没有任何引用关系。

与PageRank算法一样，由于每本期刊SJR指数的计算都依赖于其他期刊的SJR指数，所以必须采用多次迭代计算的方式才能使SJR指数值稳定下来。在计算过程中，首先假定每本期刊的SJR指数都一样，并给它设定一个初始值，由于要进行多次迭代计算，初始值并不会影响最终的结果，只会影响迭代的次数而已。当两次迭代计算之间SJR值的变化小于某一个阈值时就意味着期刊SJR值趋于稳定，此时就得到了期刊最终的SJR指数值。

SJR指数与期刊影响因子的主要特征在表1中总结出来。一本期刊的影响因子是该刊前两年发表论文在统计当年被来源期刊引用的总次数（包含了该刊本身）除以该刊前两年发表的可被引论文总数。期刊的可被引论文主要指原创性论文和评论文章。一本期刊的SJR指数是通过迭代计算三年内该刊获得的“声望”而得到的，而这种“声望”可以通过期刊引用网中其他期刊的声望计算得到，声望的初始计算方法是用该刊过去三年发表论文在过去三年被引总次数除以该刊前三年发表的论文总数。一本期刊在引用中传递给另一半期刊的声望值由前者引用后者的引文占其总引文数的比例决定。

3 SJR指数与期刊影响因子的效果对比

为了将SJR指数与期刊影响因子的效果做一个对比，本文搜集到了2007年JCR中影响因子排名前100的期刊，然后通过ISSN号在SCImago上查出它们的SJR值。同时，本文列出了SJR排名前100的期刊，找到它们的影响因子排名。最后我们分别计算出这两种指标排名前100的期刊在另外那个指标的排名次序变化绝对值的中位数、上四分位数、下四分位数。

表2和表3显示了按照两种指标分别排名前20的期刊以及这种期刊按照另一种指标的排名。在影响因子排名最高的20种期刊中，有12种也在SJR排名最高的20种期刊之列，反之亦然。同时，通过计算在2007年影响因子排名最高的100种期刊的排名在SJR排名中的变化的绝对值，得到这100种期刊的排名的变化值，最终发现排名变化值的中位数为35（下四分位数为12，上四分位数为90），而在2007年SJR值排名最高的100种期刊相对于其在影响因子排名的变化绝对值排序中，中位数为35（下四分位数为12，上四分位数为61）。

4 结果分析

在SJR排名中相对于影响因子排名有着明显提升的期刊包括如ANNUAL REVIEW OF CELL AND DEVELOPMENTAL BIOLOGY、IMMUNITY和MOLECULAR CELL，而相对于影响因子排名有着明显降低的期刊包括如NEW ENGLAND JOURNAL OF MEDICINE、REVIEWS OF MODERN PHYSICS、LANCET和JAMA－JOURNAL OF THE AMERICAN MEDICAL ASSOCIATION。

经过仔细分析后发现，大名鼎鼎的NEW ENGLAND JOURNAL OF MEDICINE、LANCET和JAMAJOURNAL OF THE AMERICAN MEDICAL ASSOCIATION在SJR中表现不佳的主要原因是SJR在评价期刊时采用的是期刊所有刊载的文章，而在期刊影响因子的计算中刊载论文数仅统计论文、简讯和综述，而对评论、来信、通讯等其他栏目的文章则不进行统计。如LANCET，在2007年期刊影响因子的计算中，2005年和2006年的刊载论文数分别为360和301，而在SJR的数据中，2005年和2006年的刊载论文数分别为1624和1794。正是因为这项数据存在显著的差别，这些期刊的SJR值的排名相对于期刊影响因子排名有明显的降低。

从前100名的期刊排位来看，SJR指数的排名相对影响因子的排名并没有发生颠覆性的变化，影响因子排名前100的期刊中有半数利用SJR排名时排名变化幅度不超过32位。国外有学者曾利用产生影响因子的数据使用加权PageRank算法得出结论与其显著相关，但这种相关只是中等强度，并且在诸如医学领域内存在较大差别[7]。

从SJR指数和期刊影响因子的实际差异来看，两者主要的不同是由于来源数据以及计算方法不同造成的。而计算方法不同主要涉及引用关系的权重、处理自引的方式、刊载论文的统计方式。

从来源数据上来比较两种指标，SJR指数以Scopus数据库的数据为基础，由于Scopus相对于Web of Science收录了大量的非英语期刊，因而能够对科技期刊提供一个更为全面的评估，尤其是对于非英语国家的期刊。以中国为例，Scopus数据库中2007年收录了521种中国期刊，而Web of Science在2007年仅仅收录了76种中国期刊。

从计算方法上来比较两种指标，最大的不同在于SJR指标不仅考虑了绝对数量也考虑了引文的质量，而影响因子只能从绝对数量上来考虑。

由于影响因子的计算方法比较简单，促使编辑们针对性地使用各种手段去提高他们期刊的影响因子。最为常见的包括提高自引，多刊载综述论文，降低计入刊载论文的论文数量。相比而言，由于期刊的影响力是由其他引用它的期刊而不是其本身来影响的，SJR指标的计算与自引并不相关。应该说，SJR指数和期刊影响因子都属于“篇均”指标，因而综述性期刊因为综述论文被引次数多，持续时间长等特点数值出现膨胀，这对偏重原创性研究论文的期刊不利，然而在两种指标的计算过程中，都没有为原创性研究论文和综述论文赋予不同的权重。

SJR指数一个最主要的缺点是通过期刊所有类型的文章的被引情况来计算其影响力，而不是通过期刊中的学术论文，而期刊影响因子则相反。由于理论上所有文章都可能被引用并且所有引文都能被计算到分子中，SJR的计算策略在数学上是正确的，但实际上，诸如通讯、读者来信、评注、观点、新闻、讣告、社论、采访和致谢不大可能被引用[8]。在这方面，有一些期刊为了吸引读者，往往有大量这些类型的文章，从而在SJR指数上会略微吃亏。然而，值得注意的是，在这方面影响因子也不是最优的指标，因为它没有考虑期刊所获得的引文大部分来自于其一小部分文章。

5 结论

SJR指标是一种新型的科技期刊评价方法。相对于期刊影响因子，它以Scopus更为庞大的期刊数据库数据为基础进行计算，并能从网上免费获取，此外，它主要考虑期刊获得的被引的质量，而不是绝对数量。然而，这种复杂的算法还有待充分验证，并根据情况重新调整指标的具体计算方法。SJR代表的类PageRank算法指标在引文分析中的应用还有待进一步研究改善。

收稿日期：2009－06－09

修回日期：2009－07－27

标签：影响因子论文; 科普论文;

SJR指数及其与影响因素的比较研究_影响因子论文

猜你喜欢