SCI及其影响因素:学术评价与企业经营:第三次自然的实证研究_影响因子论文

SCI和影响因子:学术评估与商业运作——Nature实证研究之三,本文主要内容关键词为:因子论文,之三论文,商业运作论文,学术论文,实证研究论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

       中图分类号:G301 文献标识码:A 文章编号:1008-7095(2015)05-068-13

       英国《自然》杂志(Nature)创刊于1869年,如今已成科学神话。它在中国科学界更是高居神坛,据2006年《自然》杂志上题为“现金行赏,发表奖励”的文章中说,当年中国科学院对一篇《自然》杂志上的文章给出的奖金是25万人民币,而中国农业大学的类似奖赏高达30万人民币以上,这样的“赏格”让《自然》杂志都感到有点受宠若惊。①

       《自然》之所以被学界捧上“神坛”,主要的原因,是它在风靡全球的“刊物影响因子”(Impact Factor)游戏中,长期以来遥遥领先于世界上绝大部分科学杂志——2014年,它的影响因子高达41.5,在SCI期刊中位居第七。换言之,对《自然》的迷信,很大程度上就是对SCI和期刊“影响因子”的迷信。

       但奇怪的是,与这种“迷信”形成鲜明对照,学界对SCI和期刊“影响因子”的历史形成过程,了解却十分有限,而且几乎完全没有注意到这两者纯粹的商业性质。当前的研究仍然集中在把SCI和期刊“影响因子”当成理所当然的权威学术评估手段,用于衡量个人、学术团体、研究单位、甚至一个国家的整体学术水平。另一方面,由于对相应历史缺乏必要的了解,即使对“游戏规则”的合理性有所质疑,也难以形成深入的看法。

       本论文将从科学史研究视角出发,结合SCI和期刊“影响因子”的历史形成过程,从源头上对其规则设计的合理性进行深入考察,并揭示这两种学术评估手段背后的商业化运作过程,这是前人未曾涉及的工作。

       一、科技信息的商业价值

       科学情报研究所(Institute for Scientific Information,以下按通行习惯简称ISI)逐年发布的科学引用索引(Science Citation Index,简称SCI)和期刊引证报告(Journal Citation Report,简称JCR),被当今科学界视为两种最权威的学术评估数据。许多人误以为它们是由“科学界权威机构”发布的——尽管实际上这家“科学情报研究所”从一开始就是一家地地道道的商业公司,1992年又被汤森路透(Thomson Reuters)收购。只是ISI的这一性质,多年来一直不太为普通公众和许多学界人士所知。

       行用半个多世纪以来,两种数据已经彻底改变了科学界的学术生态和发表机制。创立者尤金·加菲尔德(Eugene Garfield,1925~),个人经历显得中规中矩,没有任何“出格”之处。他1925年出生于纽约布朗克斯区,1949、1954年先后从哥伦比亚大学获得化学学士学位和图书情报学硕士学位,1961年获得宾夕法尼亚大学结构语言学博士学位。

       1956年,在职攻读博士的加菲尔德注册成立一家名为DocuMation的小公司,推出的第一款信息产品——目录快讯(Current Contents,简称CC),是一种对管理类杂志目录进行定期汇编的小册子。除了零售散卖,贝尔实验室(Bell Lab)成为他第一家企业用户。加菲尔德后来回忆,为了完成与贝尔签订的500份订单,需要先投入500美元作为印刷经费,他靠从私人银行贷款才勉强渡过难关。②

       加菲尔德的事业转折发生在1960年。这年他将公司正式定名“科学情报研究所”,此前曾一度改名“尤金·加菲尔德学会”(Eugene Garfield Institute),与美国国家健康学会(The National Institute)合作,获得国家科学基金(NSF)30万美元政府资助,共同承担建设基因文献引用索引库(Genetics Citation Index)项目。

       项目对1961年28个国家出版的613家期刊20000本杂志上的140万条参考文献,建立引用索引,进行编目,最终结果共得五卷,其中基因类文献的引用索引独立成一卷。1963年,基因引用索引数据库顺利结项,加菲尔德原本期望国家科学基金能进一步提供资助,将余下四卷一起出版,但后继申请计划被拒。加菲尔德决定独立承担出版事宜,并将其统一命名为科学引用索引(Science Citation Index),即学界现今所熟知的SCI。

       二、SCI和JCR的历史起源

       SCI收录一定范围数量的期刊——这通常也被称为“源刊”(Source Journals),通过在源刊文本和源刊参考文献之间建立“引用索引”(Citation Index),可提供检索学者的SCI论文发表数量和被引用次数——在理工科领域,对学者学术水平的评判现今主要取决于这类数据。

       1964年,ISI首次出版1961年SCI报告,此后逐年出版,延续至今。ISI在1973、1978年相继推出的社会科学引用索引报告(Social Science Citation Index,简称SSCI)和艺术&人文科学引用索引报告(Arts & Humanities Citation Index,简称A&HCI),完全套用了SCI的产品思路和模式。

       从方法上来说,SCI采用的“引用索引”受到的是美国一种判例援引法律工具书的启发。美国法律遵照“判例”原则,法院进行判决时,必须与本院或上级法院此前对相似案例做出的判决保持一致。1873年,芝加哥一个叫弗兰克·谢帕德(Frank Shepard,1848~1902)的法律出版商,开始出版一种他自己编印的工具书,在判例和援引案例之间建立索引,统一进行编列,并标记判例是否已被推翻、撤销、修改或加入限制条件。这种工具书能帮助律师快速了解一个判例是否仍然适宜援引,出版后大受欢迎,法律人士几乎人手一本。谢帕德的名字甚至衍化成了一个法律术语“Shepardize”,意为“查阅《谢帕德引证》”。③

       JCR,即“期刊引证报告”,本质上是SCI的衍生产品,它逐年发布的期刊影响因子(详见下文),是基于对SCI(后来包括SSCI和A&HCI)“引用索引”数据进行整合处理后得到的结果,该数据现今已成为学界评判期刊优劣的权威指标。④1975年,JCR首次以SCI附卷的形式出版,1979年,它被独立推向市场。

       作为一种期刊评估手段,JCR的思想源头可追溯至格罗斯(Gloss)夫妇1927年《科学》(Science)上的一篇文章。他们试图解决这样一个问题:在图书馆预算有限的情形下,应该参照什么标准为学生购买供查阅的化学期刊?⑤⑥

       最简便的方法,当然是找一个权威专家为图书馆开列一个目录清单,但这会受到专家本人阅读经验和个人好恶的左右,特别在购买范围较大的情形下,并不太适用。

       格罗斯夫妇提出的解决方案是,选取知名刊物《美国化学学会杂志》(Journal of the American Chemical Society),对它1926年发表的247篇文章的3633条参考文献进行统计,按引用次数对所有被引刊物进行排序,刊物重要性与排序结果直接对应,图书馆可参照此清单进行购买。这种筛选方式操作简便,且不存在太高专业“门槛”,很快被其他信息科学家借鉴推广到别的学科领域(参见表1先前学者的整理结果)。⑦

      

       SCI作为JCR的数据基础,相较前人有所突破的地方在于,不再区分学科类别,收录期刊海量增加。

       但这并不是它们之间根本的区别,根本区别在于,格罗斯夫妇及其后继者们采用同样的方案对期刊进行筛选时,还保持着非常“纯洁”的动机,为的是创造便利、服务学术。SCI和JCR却不是这样,它们从一出生就是商业信息产品,“赚钱”才是它们与生俱来的属性。

       这种属性也是加菲尔德千方百计让它们位居高端,凌驾于学术之上的真正动力。其中力证SCI可以预测诺奖,对帮助实现这一目标,起到了关键作用。

       三、SCI推广之诺奖预测

       1965年,即SCI推向市场的次年,在美国海军研究办公室(Office for Naval Research)主办的一次学术会议上,加菲尔德和他的助手提交论文做了大会报告。⑧当时ISI迫切需要打开SCI的市场,所以这次大会报告很大程度上也是一次不失时机的产品推介。加菲尔德的报告从五个方面阐释了SCI的功能:

       1.便于学者了解前人工作,减少不必要的重复研究;2.作为评估研究成果的手段;3.便于追踪发表成果的来源和出处;4.可用于计算期刊的“影响因子”(参见本文第5节);5.为科学史研究提供一种有效的辅助手段。

       在阐述第2项功能时,加菲尔德选择了最能撩拨学界敏感神经的“诺奖预测”来进行论证。他利用1964年首次出版的1961年度SCI报告比较了两组数据:

       (1)1961年共有257900位学者的成果被SCI论文引用,统计他们的引用情况;

       (2)1962、1963年共产生13位物理、化学和医学诺奖获得者,统计他们1961年度被SCI论文引用的情况。

       从数据结果可看出(参见表2),13位学者在得诺奖的前一年,他们的成果被SCI论文引用的平均数量和次数远高于一般水平。这确实能说明,优秀科学家群体有着更高的SCI论文被引用数,但并不足以支撑加菲尔德的论断:SCI论文引用数可以反过来用于评估单个学者的学术水平。

       事实上,就在两年前的一篇文章中,加菲尔德还主动发出警告,利用论文引用次数评估科学家和科学成果可能存在风险,理由是“论文的影响和论文的重要性及意义是两码事”。他甚至非常恰如其分地引用了苏联李森科(T.D.Lysenko,1898~1976)的例子,说如果引用次数最多的作者应该获得诺奖,那会得出李森科是苏联最伟大科学家的荒谬结论。⑨

       其实13位诺奖获得者中,已经存在一个明显的反例。按照加菲尔德的统计,1963年度物理学诺奖获得者,约翰内斯·詹森(J.H.Jensen,1907~1973)1961年3篇论文的SCI引用才4次。如果单凭SCI论文引用次数来衡量詹森的成果,会得出一个荒谬的结论,这位诺奖得主的学术水平连平均线(5.51次)都没达到。

      

       但是,加菲尔德在随后持续打造SCI“产品形象”的过程中,却似乎完全忘记了当初发出的警告。从1965至1983年间,他先后撰写了30余篇文章,力图证明SCI论文引用可以“预测”诺奖。在1990年的一篇综述文章中,加菲尔德对这些文章的讨论结果进行了归纳(参见表3)。⑩

      

       列表中的数据,以1967年为例,该年度论文被引用数排名前50的学者中,包括8位已获诺奖的人士,1967年至1990年共产生145位科学(物理、化学和医学)诺奖获得者,其中有6位出现在这个名单上。余下5组数据,包含了类似的信息。

       这些结果中,SCI“高引名录”中已获诺奖的人数不能说明问题。因为一旦某位学者获得诺奖,立马会被当成首屈一指的“大权威”供奉起来,他的论文自然会受到更多关注,也就可能获得更多的SCI引用。

       要检验引用是否可以预测诺奖,主要还得看“高引名录”未来究竟产生了多少诺奖获得者。从加菲尔德呈现的6组数据来看,“高引名录”获诺奖的概率确实比较大,两者存在“正相关关系”。如果把抽样年限加长、名单扩大,这种相关性还会得到加强。

       不过,只要稍微深入探究一下,就会发现加菲尔德对数据的处理存在三个问题:

       首先,非常明显的一个问题是,加菲尔德有对结果进行“选择性呈现”的重大嫌疑。我们知道,学界每年新增SCI论文数以万计,这些论文产生的引用会让SCI高引作者名单各年大不相同,而且截取年限不同,高引名单的结果也不一样。加菲尔德6组数据起始年份各不相同(最早为1961年),截止都在1990年(综述写于这一年),截取年限依次为1年、1年、11年、14年、13年和15年,并无章法可循。套用他的做法,如果把1961到1990年30年按所有可能截取的持续年限进行排列,会得到465种结果,对应排列出来的高引名单应该有465份——而加菲尔德仅仅给出了其中6份,呈样率仅为1.2%,他没有交代如此选择的任何理由(哪怕宣称是“随机抽取”)。

       其次,没有说明“高引名单”人数的选取标准。通常情形下,名单越长,出现诺奖得主的概率也就越大。加菲尔德的6组数据,名单人数从最初的50扩大到了后来的1000,并没有给出任何解释理由。

       再次,没有明确预测的有效年限。通常来讲,预测事件发生是有时限要求的。加菲尔德6组数据的预测年份截止于1990年,只是因为他的综述写于这一年,意味着“高引名单”的预测有效期限可能止于任何年份,也可能永久有效,这完全背离了“预测”的基本要求。

       在加菲尔德之后,有学者采用相同路径加入“预测”行列,(11)这些研究对引导学界相信SCI论文高引名单可成功预测诺奖,起到推波助澜的作用——实则是在自觉不自觉帮助SCI树立产品形象。

       ISI 2014年最新公布的“高引名录”(Highly Cited-2014),包括的科学人士多达3216位。尽管该名录2014年诺奖命中为零,但这并不妨碍它继续受学界追捧。因为在“SCI引用”风行整个学界的年代,能进入“高引名录”已经被当成学术水平突出的象征。另一方面,按照加菲尔德早就备好的逻辑,它放眼的是未来,2014不中,但保不准名单上会出现2015、2016年乃至未来更远年代的诺奖得主。

       事实上,SCI引用数据究竟能不能预测诺奖,学界当前还存在相当大的异议。学者金格拉斯(Y.Gingras)和华莱士(M.Wallace)2010年做了一项研究,他们对比物理和化学领域的两组数据:逐年统计1901—2007年排名前500的高引作者的被引用情况,(12)和1901—2007年330位诺奖得主的被引用情况。统计结果显示,1900—1945年间,诺奖得主在获奖当年的平均被引用次数明显高于其他高引作者,出现一个突出的峰值;但是从1946年至2007年,这样峰值再未出现。这意味着,1900—1945年间,成果引用确实可以看作预测诺奖的有效风向标,但是从20世纪50年代开始,试图凭借成果引用从高引学者中鉴别出诺奖得主,已经完全没有可能。(13)

       金格拉斯两人把解释的理由归结为两点:20世纪50年代以来科研人数在急剧增加;物理、化学领域专业分支在不断细化。如果他们的研究结论成立,这会导致一个加菲尔德不愿意看到的事实,在SCI开发出来的大约20年前,它在“预测”诺奖这件事上就已经失效了。

       四、学界对SCI的争议

       值得注意的是,SCI还处于早期推广阶段的时候,在学界已经引发争议。1970年,围绕加菲尔德在《自然》杂志上宣传SCI功能的文章《研究科学的引用索引》——其实就是1965年报告的缩减版(参看本文第三节),(14)一些学者表达了异议。

       争论焦点主要集中于这个问题:利用SCI论文引用次数来衡量学者的学术水平,是否是一种合理的做法?科学人士的主要观点可归纳如下:(15)

       1.引用并不仅仅表示赞同,还包括对前人成果的批评或一般性综述。一些作者为了获得引用,可能有意制造耸人听闻的“诈文”。

       2.引用带有很大主观性,某些情形下,论文被频繁引用只是因为作者是知名学者,和论文学术水平无关。

       3.一些学者虽然有着可观的论文引用数量,但引用发生在早前的年代,实际情形是他们当前的学术创造力已经枯竭。

       4.没有出现在论文参考文献中的成果,并不意味着完全没有影响。一些在相关领域被普遍接受的专业术语,同行在论文中提及一般不会给出原始出处。

       5.论文引用与奖励、基金申请、职位申请等直接挂钩,会导致配合引用等作假手段。

       6.SCI在收集处理引用数据的过程中,存在不容忽视的误差。

       7.对于集体成果,只计算论文第一作者引用次数的做法不合道理。典型例证是生化学家奥利弗·罗瑞(O.Lowry,1910~1996)1951年与另外三位作者共同发表的一篇论文(16),在加菲尔德1967年统计的“高引作者前50名”中,罗瑞因这篇论文位居第一,它当时被引次数已达2350次,但另外三位合作者并没有出现在名单上。

       针对这些质疑,加菲尔德公司团队做出了回应,ISI欧洲分公司高管考克尔(A.E.Cawkell)反驳说,学者们列举的SCI缺陷都属于“可能事件”,而非“必然事件”,所以不会影响SCI作为评估手段的有效性,加菲尔德则再次强调诺奖预测的有效性。(17)(18)

       与《自然》杂志类似,《科学》(Science)杂志上两位学者1972年的一篇文章也引发同样争议,他们利用1965年SCI报告对物理学家的研究成果进行评估,得出结论认为只有少数精英科学家对物理学发展做出贡献。(19)

       两份期刊关于SCI的讨论只是短暂一现,随后很快归于沉寂,但这些争议对我们当下重新审视SCI对学界产生的影响及后果,却有很好的参照和启发作用。

       到20世纪90年代,当一些学者开始意识SCI的使用正在失控,并试图重新质疑其合理性时,SCI“权威学术评估手段”的地位已无可动摇。学界最终“跪倒”在SCI面前的结果是,早期少数学者发出的警告不仅一一应验,甚至其他更夸张、更离谱的事情也正在发生。这样的情形下,回头再看学者阿兰·麦凯(Alan Mackay)1974年《自然》上的文章《发表还是毁灭》(Publish or Perish)——他把SCI称为“学术独裁”(Tyranny),确实具有超前的预见性。(20)

       五、对“影响因子”两项准则合理性的质疑

       1955年,“影响因子”首次作为一个专门术语出现在加菲尔德在《科学》杂志上的一篇文章中,他在两个地方谈及“影响因子”:(21)

       通过该系统(注:指科学引用索引),可以有效检索收录期刊论文被哪些文章引用过,这在历史研究中将发挥明显作用,当人们尝试评估某项研究成果的意义,或它对同时期的文献或思想产生的影响时,“影响因子”应该比科学家出版成果的绝对数量更具说服力。

       对于意义重大的文章,引用索引具有量化价值,它能帮助历史研究者评估文章的影响——这也就是“影响因子”。

       从这两段话可以看出,加菲尔德最初是将一篇文章的被引用次数当成“影响因子”。

       后来在1963年的一篇文章中,加菲尔德把“影响因子”定义重新修正为“期刊文章的平均被引用次数”。(22)这主要是为了解决期刊“体量”(Size)差异带来的问题。按照格罗斯夫妇首创的传统期刊评估方法,期刊优劣取决于它总的被引用次数,但通常情形下,期刊发表文章的数量越多,获得的引用次数也就越多。对一些“体量”小的期刊而言,传统方法无疑是不公平的。

       汤森路透现今逐年发布的JCR报告上,影响因子算法的标准定义是:期刊X在前面两年发表的源刊文本(Source Items)在当年度的总被引用数,除以期刊X在前面两年发表的文章(Article)总数量,即为期刊X当年度影响因子的得数。(23)其中“源刊文本”,指的是SCI(后来包括SSCI和A&HCI)任一收录期刊上发表的所有文本。算式表达为:

      

       从算式可看出,计算期刊“影响因子”需遵守两项基本准则:

       第一准则,源刊文本的“引用窗口”(Citation Window)是两年。通俗的解释就是,SCI期刊文本只在发表后第二、三年度发生的引用,对期刊“影响因子”产生有效贡献——尽管实际上它们可能一直会被引用。

       加菲尔德在1972年《科学》杂志上的文章中,对这一准则的设定进行了解释(参见该文注释29)(24),他通过逐年统计1964至1970年SCI收录期刊的参考文献,发现发表年限在三年内的比例依次为:31.09%、30.24%、26.60%、25.91%、25.32%、25.18%和23.95%(换一种呈现方式就是,期刊参考文献和注释发表年限在三年以上的比例依次为:68.91%、69.76%、73.40%、74.09%、74.68%、74.82%、76.05%)。

       从这组数据,加菲尔德还总结出一种趋势,随着SCI收录期刊数量逐渐增加,发表年限三年内的被引用文献比例在逐渐下降——这意味着如果这种趋势保持下去,比例可能越来越小。但不知何故他居然就得出判定,“论文被引用主要发生在发表当年后的两年内”。

       照理来说,“两年有效引用”作为“影响因子”算法非常重要的一项准则,加菲尔德有必要在文章中(或单独撰文)详细说明缘由,但他居然只用一条注释草草带过。这也难怪一些西方学者在讨论中,甚至无从知晓“两年”标准是按什么依据得来的。(25)

       事实上,针对这一问题,学者格兰采尔(W.Glanzel)和莫伊德(H.Moed)2002年的一篇论文,已经提供了一个非常有力的反驳案例。(26)他们抽样考察医学期刊《柳叶刀》(Lancet)和社会学期刊《美国社会学逻辑评论》(American Sociological Review),对两份期刊1980年发表文章在之后十年的平均被引用率进行逐年比较。发现在前面三年,《柳叶刀》1980年论文的平均引用率明显高于《美国社会学逻辑评论》,但随着年限逐渐累积,《美国社会学逻辑评论》的引用率大大高于《柳叶刀》(参见表4)。

      

       这一结果意味着,对医学期刊和对社会学期刊采用同样的“引用窗口”年限并不合理。医学作为最活跃的研究领域,新旧理论的更迭在频繁发生,其中某些成果发表后引发的关注甚至是“爆发式”的。而在人文社会学领域,新的思想和观点提出后,往往需要等待若干年的“发酵”,才可能引发关注。换言之,汤森路透ISI逐年公布的“影响因子”结果,很难讲是一个客观的结论。

       不过,在“影响因子”被捧上神坛的今天,学界即使意识到这一点,“路径依赖”已让他们别无选择。2003年,加菲尔德对“两年有效引用”的回应,就完全是一副“木已成舟能奈我何”的架势:

       我们不想等若干年后才了解一份期刊的被引用情况。ISI完全有能力计算3年、5年的影响因子。我们甚至有10年、15年的影响因子数据库,但它们需要单独订阅。(27)

       在这个傲慢的表态中,“影响因子”的合理性是无所谓的,商业利润才是王道——“它们需要单独订阅”。

       第二准则,“影响因子”算式分母的“文章”只包括“原创研究论文”(Original Research Paper)和“评论”(Review)。

       这一准则专门针对的是那些除了发表原创论文和评论,还发表社论、技术通信、来信、通告、读者来信、科学讯息观察和报告、书评等文本的刊物,当今世界上最知名的几家刊物——《自然》、《科学》、《柳叶刀》、《美国医学会杂志》(The Journal of the American Medical Association),以及《新英格兰医学杂志》(The New England Journal of Medicine),都属于这一类型。对单纯发表原创论文的期刊,如知名的《现代物理评论》(Reviews of Modern Physics)和《化学评论》(Chemical Reviews),就不需要进行这种区分,因为它们的“源刊文本”数量就等于“文章”数量。

       这一准则的形成也有一个渐变的过程。1972年,加菲尔德发表在《科学》杂志的一篇文章中,(28)以1967、1968和1969三年的SCI数据为基础,计算1969年度的期刊“影响因子”,他当时的做法是将《自然》、《科学》、《柳叶刀》、《美国医学会杂志》这类刊物上的所有文本都计入算式分母,理由是(参见该文注释28):“全部计入”不失为较为便捷的处理手段;更重要的是,“这些期刊上的非学术文本也是潜在的被引用文本”。

       这种做法显然对《自然》、《科学》之类的期刊非常不利,庞大的分母直接拉低它们的影响因子,排名结果全都落到40之后(参见表5)。

       针对这一情况,在1975年首次作为SCI附卷发布的JCR报告中,加菲尔德对规则进行调整,规定分母项只包括三类“学术文本”:原创研究论文(Original Research Articles)、评论文章(Review Articles)和技术报告(Technical Notes)。“非学术文本”不再计入的理由是,它们“很难获得引用”。(29)(30)

       分母数大幅减小对《自然》、《科学》这类期刊的影响因子结果产生了立竿见影的效果——尽管加菲尔德只委婉地承认“部分归结于这个原因”,但相较1969年,它们的排名全部大幅上升,其中《美国医学联合会会刊》惊人地提升了100位(参见表5)。

      

       分母规则在1995年度的JCR报告中再次被调整,范围进一步缩小,“技术报告”被剔除,只保留“原创研究论文”和“评论文章”两项——这一做法基本保持到今天。(31)

       关于“准则二”还有很大的讨论空间,此处姑先指出这一点,后文将做进一步探讨。

       相较SCI推广阶段引发的争议,一个饶有意味的对比结果是,尽管“影响因子”从提出到算法定则最终确立,与《自然》和《科学》有着极深的渊源——1955年,它首次作为专门术语出现在《科学》上;1972年《科学》刊登了1969年度期刊“影响因子”报告;1976年,《自然》摘载了JCR报告的减缩版——考虑到JCR在1975年才首次出版,这几乎等同于这两份大牌期刊在帮助它进行市场“预热”和产品“推广”了,(32)而且这两份期刊当时没有出现任何对它的质疑或讨论文章。(33)

       一种可能的解释是,“影响因子”当时没有引起学界的关注。但这种解释不合常理,因为“影响因子”是基于SCI报告的数据得出的,如果SCI存在诸多不合理之处,“影响因子”当然也会存在缺陷,何况加菲尔德提出把“影响因子”作为衡量学术期刊优劣的标准,涉及的同样是学界非常敏感的问题,很难想象学者们能对SCI提出犀利的质疑,对“影响因子”的缺陷却完全视而不见。

       关于“影响因子”和《自然》杂志之间的微妙关系,笔者将在后续论文“Nature实证研究之四”中,展开进一步的专题研究。

       六、为商业机构打造高端学术形象

       ISI创立之前,美国的科技情报通常由政府学术机构牵头采集、整理和公布,套用今天时髦的话来讲,加菲尔德一手开创了科技情报的商业化经营模式。《科学》杂志1978年的一篇文章称他为“把信息王国建立在脚注上的百万富翁”,可谓十分贴切。(34)

       对加菲尔德而言,1964年投产SCI完全是背水一战的商业冒险。为了弥补资金缺口,他把公司20%股权以50万美元价格卖给华尔街风投。SCI当年的市场发售价格为700美元,老年加菲尔德在一次访谈中回忆,它的第一份订单来自美国中央情报局(CIA)图书馆,出人意料的是第二份订单——它来自中国。(35)(36)

       事实证明,加菲尔德对SCI的产品决策堪称“高风险高收益”。SCI从1964年推向市场到1971年短短七年时间,ISI的利润平均每年以27.5%增长,随后又开发了十余款新品,公司业务迅速拓展到全球近十个国家,成为世界第一大科技信息服务咨询公司。(37)

       1988年,加菲尔德把ISI超过50%的股权卖给JPT出版公司(JPT Publishing)。1992年4月,汤森路透以2.1亿美元价格收购JPT出版公司。据汤森路透首席运营官说,交易主要是为了得到ISI,“ISI在全球拥有30万客户,每年净利润约为1500万美元”。(38)

       当前,汤森路透和英国里德·爱思唯尔集团(Reed Elsevier,成立于1993年)、荷兰威科集团(Wolters Kluwer,初建于1836年),共同占据全球情报市场90%的份额。(39)

       除了SCI和JCR这样的“灵魂产品”,ISI开发的其他知名产品还包括:(40)

       目录快讯(CC),1956年首次面市,对各类期刊和书籍的目录进行汇编,以周刊形式出版,订阅者可通过它快速了解相关领域最新发表的前沿消息。CC最早只对管理类期刊的目录进行汇编(前面提到贝尔实验室购买的就是这种),1957年,它将汇编对象拓展到医药、化学、生命科学等领域的学术期刊。作为ISI开发的第一个产品,CC在SCI出现之前一直是公司最赚钱的产品。

       化合物索引库(Index Chemicus,简称IC),这一数据库除了有助研究者了解新出现化合物的相关研究数据,还可获得重要有机化学期刊对它的评价结果。1960年开发推出后尽管一直只赔不赚,但加菲尔德对其倾注巨大热情,手下四名主要副手集体辞职也未能迫使他终止,IC如今已成为汤森路透的又一热门产品。

       由于ISI经营的客户对象以学者和学术机构为主,所以尽可能让自身显得“学术”,也是一种非常重要的营销手段。

       在公司草创阶段,加菲尔德对公司的冠名,已经带有明显的学术包装意味。如果说“尤金·加菲尔德学会”的前用名还显出几分“伪学术”的话,“科学情报研究所”听起来就完全像一家政府科学机构了(这对中国这样的发展中国家来说尤其如此)。加菲尔德非常坦率地承认,他要的就是这种容易引起混淆的效果——为的是与化学摘要(Chemical Abstracts)和国家医学图书馆这类政府学术机构争夺市场,“特别是在国外,‘科学情报研究所’这样的叫法,很容易被当成一家非营利机构”。(41)

       ISI商业运转正式上轨之后,接纳了两位诺奖获得者成为公司董事会成员,这其中当然也有打造高端“学术”形象的考虑。(42)

       此外,为了拉近和学术圈的关系,ISI为学术机构、大学图书馆设立专项奖学金,奖金可作为这些机构购买ISI产品的抵扣——这其实相当于发放某种商业“抵扣券”。(43)

       当然,最有效的手段还是发表学术论文和参与学术研讨会,产生的效果可谓一举两得,除了提升企业学术形象,还可以把论文发表期刊和研讨会作为ISI产品的推广平台。

       加菲尔德本人在这方面充分发挥了表率作用,他一生勤奋高产,对倾力打造的各种信息产品相关的科学写作,始终保持着高昂的兴趣——其中不少成果发表在《自然》、《科学》这类被学界认为高端的期刊上。据作者统计,从20世纪50年代至2012年,加菲尔德发表文章400余篇。1986年,他还创办了《科学家》(The Scientist)杂志。

       ISI的学术“包装”是如此卓有成效,以至有被误导的公众经常写信抗议,指责ISI作为一家政府科技情报机构,履行职责并不到位。为此加菲尔德又不得不反复澄清,表示ISI完全是一家以市场盈利为目的的商业公司。(44)

       七、“黄金俱乐部”的准入门槛

       加菲尔德1985年写过一篇文章专门谈论他的“生意经”,标题是“为你的钱袋子着想”。(45)大意是,在收录期刊增加、通货膨胀导致成本投入增加的情形下,ISI两种主要产品——CC和SCI的价格涨幅,仍然大大低于行业同类产品的平均增长水平,这主要得自公司不断改进技术,完善产品功能,吸引更多用户,达到了薄利多销的目的。为了贴补成本,《目录快讯》从1982年开始刊登商业广告。(46)

       这些做法都表明,ISI经营方式和一般商业公司并无二致,都要参照成本预算、销售业绩的前提下考虑可能赚取的利润。所以ISI每年都要做严格的预算,控制期刊的收录数量,对什么样的期刊满足收录条件,设定相应的准入门槛。

       以SCI为例,早期对收录期刊的选择并没有统一标准,主要由加菲尔德的团队根据经验进行鉴选。但人为经验往往存在很大局限,比如,1964年发布的首期SCI报告,居然没收录在科学界享有很高声誉的《哲学通汇》(Philosophical Transactions)(47),而另一份当时享有世界声誉的苏联期刊《热工程杂志》(Teploenergetica),直到1968年才首次被收录。(48)

       JCR的出现,为SCI筛选期刊提供了一项相对独立的参照评估指标:通过计算待选刊物的“影响因子”,可以了解它被SCI期刊引用的情况。(49)

       以此为基础,加菲尔德将SCI筛选收录期刊的标准归纳为三条:

       待选刊物的SCI引用情况;

       杂志本身需要满足的各种形式要件(出版周期、编辑团队、作者国际多样性等);

       相关领域专家的评估意见。(50)

       汤森路透基本沿用了这三条筛选标准。(51)其实,按加菲尔德的说法,这样的规则在早期运用过程中,由于存在成本控制的问题,已经存在“灵活操作”的余地:

       我们每年做完杂志收录预算,一如既往总有一些杂志出版社或编辑会表达意愿,希望他们的杂志能被收录进来。如果杂志完全满足筛选要求,那怎么办?我们要么告诉杂志主办方等下一年,要么让他们同意自己支付杂志收录的相关费用,这样做可以帮助我们在预算允许的情形下继续经营下去。(52)

       当然,加菲尔德也不忘记澄清,“原则上这是好事。但也造成一些下意识的猜测,认为杂志可以靠钱买进CC或SCI的收录名单。”(53)

       而这样的事也确有发生,1995年8月,《科学美国人》(Scientific American)在一篇文章中披露,墨西哥一家期刊为了能被SCI收录,每年被要求花10万美元订阅ISI的信息产品。(54)汤森路透为此大为光火,威胁要将《科学美国人》告上法庭,后者迫于压力,在10月号上做了更正声明,才算了结此事。(55)(56)

       SCI如今俨然已被打造成学界的“黄金俱乐部”,准入门槛今非昔比,特别在发展中国家,学术期刊一旦被SCI收录,即被看成“权威”的标志。

       日常生活中常见的情形是,一些高级“俱乐部”对申请加入的成员,除了必要的资质考量之外,还要求交纳高昂的“会员费”。在SCI面世不到十年的时候,一些符合收录要求的杂志,已经被要求自己为“准入”费用埋单。而如今,在坐落于美国纽约时代广场的汤森路透公司独家经营下,SCI和JCR背后究竟是怎样的光景,确实给人留有很大的想象空间。

       收稿日期:2015-07-14

       注释:

       ①I.Fuyuno & D.Cyranoski.Cash for papers:Putting a premium on publication[J].Nature.2006,441:792.

       ②E.Garfield.How it all begain-with a loan from HFC.Current Contents.1980-01-21.3:5-8.

       ③W.C.Adair.Citation Indexes for Scientific Literature.American Documentation.1955.6:31-32.

       ④E.Garfield.How can impact factors be improved.British Medical Journal.1996.313:411-3.

       ⑤E.Garfield.Science citation index.Science.1955; 122:108-110.

       ⑥P.L.K.Gross,E.M.Gross.College libraries and chemical education.Science,1927,66(1713):385-389.P.L.K.Gross& A.O.Woodford.Serial literature used by American geologists.Science,1931,73(1903):660-664.I.Hackh.The periodicals useful in the dental library.Bull Med Libr Assoc.1936,25(1-2):109-112.

       ⑦

Archambault,Vincent Larivière.History of the journal impact factor:Contingencies and consequences[J].Scientometrics.2009.79:635-649.

       ⑧I.Sher and E.Garfield.New tools for improving and evaluating the effectiveness of research[J].Research Program Effectiveness,Proceedings of the Conference Sponsored by the Office of Naval Research Washington,D.C.,July 27-29,1965.

       ⑨E.Garfield.Citation Indexes in Sociological and Historical Research[J].American Documentation,1963,14(4):289-291.

       ⑩在这篇综述中,加菲尔德对此前的30余篇文章皆有具引:E.Garfield.Of Nobel Class':Part 1.An Overview of 1S1 Studies on Highly Cited Authors and Nobel Laureates[J].Current Contents.1992-08.15:116-126.

       (11)D.Pendlebury.The 1989 Nobel prize in medicine:20 who deserve it[J].The Scientist.1989-10-02.3(19):14; 16; 19.A.Martello.Scientists with the right chemistry to win a Nobel[J].The Scientist.1990-09-17.4(18):16-7.

       (12)汤森路透已把SCI数据补充到1900年至当前,可通过Web of Science查询(需订阅)。

       (13)Yves Gingras,M.L.Wallace.Why it has become more difficult to predict Nobel Prize winners:A bibliometric analysis of nominees and winners of the chemistry and physics prizes(1901-2007)[J].Scientometrics.2010-02,82(2):401-412.

       (14)E.Garfield.Citation Indexing for Studying Science[J].Nature.1970-08-15.227,669-671.

       (15)D.Croom.Dangers in the Use of the Science Citation Index[J].Nature.1970-09-12.227:1173.P.T.P.Oliver.Citation Indexing for Studying Sciencer[J].Nature.1970-08-22.227:870.

       (16)O.H.Lowry; N.J.Rosebrough; A.L.Farr; R.J.Randall.Protein measurement with the Folin phenol reagent[J].Journal of Biological Chemistry.1951.193(1):265-75.

       (17)A.E.Cawkell.Science Citation Index[J].Nature.1970-11-21.228:789-790.

       (18)E.Garfield.Citation and Distinction[J].Nature.1973.242:485.

       (19)J.R.Cole and S.Cole.The Ortega Hypothesis[J].Science.1972-10-27.17(4059):368-375.

       (20)A.Mackay.Publish or perish[J].Nature.1974-08-30.250:698.

       (21)E.Garfield.Science citation index:A new dimension in indexing[J].Science.1955.144:649-654.

       (22)E.Garfield,& I.Sher.New factors in the evaluation of scientific literature through citation indexing[J].American Documentation,1963,14(3),195-201.

       (23)考虑到影响因子定义在本研究系列讨论中的重要性,有必要附上原文:The impact factor of journal X would be calculated by dividing the number of all current citations of source items published in journal X during the previous two years by the number of articles journal X published in those two years.

       (24)E.Garfield.Citaition analysis as a tool in journal evaluation[J].science.1972.178:471-479.

       (25)

Archambault,Vincent Larivière.History of the journal impact factor:Contingencies and consequences[J].Scientometrics.2009.79:635-649.

       (26)W.

,H.Moed.Journal impact measures in bibliometric research[J].Scientometrics,2002.53(2):171-193.

       (27)E.Garfield.The meaning of the Impact Factor[J].International Journal of Clinical and Health Psychology.2003.3(2):363-369.

       (28)E.Garfield.Citation analysis as a tool in journal evaluation[J].Science.1972-11-03.178(4060):471-479.

       (29)E.Garfield.Preface to Journal Citation Reports-Vol.9 of SCI.published by Institute for Scientific Information(philadephia).1975.7-8.

       (30)E.Garfield.Journal Citation Reports[J].Current Contents.1976-08-30.35:7-20.

       (31)1995 Journal Citation Reports.published by Institute for Scientific Information(philadephia).1996.11.

       (32)E.Garfield.Significant journals of science[J].Nature.1976-12-16.264:609-615.

       (33)M.Benarie.Significant journals of science[J].Nature.1977-01-20.265,204.

       (34)W.Broad.Librarian turned entrepreneur makes millions off mere footnotes[J].Science.1978-11-24.202:853.

       (35)Transcript of an Interview Conducted by Robert V.Williams at Philadelphia,Pennsylvania.P 30、P 56[EB/OL](1997-07-29)[2015-03-20].http://garfield.library.upenn.edu/papers/oralhistorybywilliams.pdf.

       (36)New Books[J].Science.1964-06-05.144(3623):1211.

       (37)S.Lazerow.Institute Scientific Information[M]//Encyclopedia of Library and Information science ed.A.Kent et al.New York:Marcel Dekker.1974.12:89-97.

       (38)The Thomson Corporation History.[EB/OL][2014-12-05] http://www.fundinguniverse.com/company-histories/the-thomson-corporation-history/.

       (39)Laurence Bianchini.Scientific publication:The model and scandals.[EB/OL](2011-07-19)[2015-01-05] https://www.mysciencework.com/news/2852/scientific-publication-the-model-and-scandals.

       (40)作者任职的大学当前就订阅了汤森路透七种信息产品:Web of Science(包括SCI,SSCI,A&HCI等),JCR, BIOSIS Previews(生物科学数据库),Current Contents(目录快讯),Derwent Innovations Index(德温特专利情报数据库),Essential Science Indicators(基本科学指标,ESI),ISI Emerging Market(ISI新兴市场信息服务)。

       (41)E.Garfield.Chemical Information Entrepreneurship-A Personal Odyssey[J].Joseph Priestley Society Symposium "Knowledge:Our Competitive Weapon" at The Chemical Heritage Foundation,Philadelphia,PA.2004-11-09.

       (42)W.Broad.Librarian turned entrepreneur makes millions off mere footnotes[J].Science.1978-11-24.202:853-857.

       (43)E.Garfield.The ISI grant program[J].Current Contents.1977-05-02.(18):5-6.

       (44)E.Garfield.The who and why of ISI[J].Current Contents.1975-01-06.1:5.

       (45)E.Garfield.More for Your Money:Technology,Marketing and Hard Work Help ISI Beat Inflation and the Information Explosion[J].Current Contents.1985-10-14.41:3-8.

       (46)E.Garfield.Will Advertising Change Current Contents? Yes and No[J].Current Contents.1981-12-14.50:5-6.

       (47)P.Wouters.The Citation Culture.Doctoral Thesis(University of Amsterdam in the Netherlands).1999.19.

       (48)M.Weinstock.Citation index[J].Essays of an information scientist.1962-1973.1:208.

       (49)E.Garfield.Is citation frequency a valid criterion for selecting journals?[J].Current Contents.1972-4-5.13:289-290.通常情形下,SCI收录期刊的参考文献(和注释)的范围要远远大于SCI收录期刊范围本身,所以一份刊物即使没有被SCI收录,也可以统计它被SCI期刊引用的情况,计算它的影响因子。

       (50)E.Garfield.How ISI selects journals for coverage:Quantitative and qualitative considerations[J].Current Contents,1990-05-28.22:5-13.

       (51)Jim Testa.The Thomson Reuters Journal Selection Process.[EB/OL](2012-05)[2014-12-05] http://wokinfo.com/essays/journal-selection-process/.

       (52)E.Garfield.Citation Frequency and Citation Impact[J].Current Contents.1973-02-7.5-6.

       (53)E.Garfield.The Economics and Realpolitik of Exponential Information Growth; or,Journal Selection Ain't Easy![J].Current Contents.1973-08-22.34:5-6.

       (54)W.Gibbs.Lost Science in the Third World[J].Science American.1995-08.92.

       (55)Clarifications and Errata[J].Science American.1995-10.10.

       (56)Transcript of an Interview Conducted by Robert V.Williams at Philadelphia,Pennsylvania.P 75-77[EB/OL](1997-07-29)[2015-03-20].http://garfield.library.upenn.edu/papers/oralhistorybywilliams.pdf.

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

SCI及其影响因素:学术评价与企业经营:第三次自然的实证研究_影响因子论文
下载Doc文档

猜你喜欢