Web2.0语境下的科学计量：选择性计量_科学论文

Web 2.0环境下的科学计量学：选择性计量学，本文主要内容关键词为：计量学论文,选择性论文,环境论文,科学论文,Web论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

对学术文献进行及时、恰当的评估是进行学术评价的前提。目前，国内外常用的评价体系[1-3]都是基于论文发表的期刊及基于某一数据库中的该论文出版后的总被引次数进行，缺乏对论文本身进行评价的论文评价方式。随着数字出版的发展，出版形式逐渐多样化，科研成果的发布已不再仅仅局限于期刊发表，越来越多的原创性的最新学术成果发表在开放存取的数字出版平台[4-5]上并通过学术社交网络[6-10]实现快速的科技信息传播，对这类论文无法按照旧有的评价体系进行评价。在这一背景下，科学计量学领域正在进行一次科学计量学的Web 2.0革命，国际科学计量学、信息应用科学和出版发行学专家们开展了一次有重大意义的理论和实践探索。这就是基于使用和学术社交网络的学术影响力计量——选择性计量学(altmetrics[11]，或表述成“distributed scientific evaluation”[12](分布式科学评价)、“alternative peer review models”(选择性同行评审)、“scientometrics 2.0”[13](科学计量学2.0)，但altmetrics在文章和会议中的使用频率最高)。

1 选择性计量学的定义

选择性计量学的相关研究始于2008年，Taraborelli[12]在对影响因子作为主要评价指标提出质疑后，呼唤一种基于社会软件的分布式科学评价；2009年，Neylon和Wu[14]以PLoS和Faculty of 1000为例，分别从计量数据的来源和专家评论的激励机制两个角度指出论文层面的科学影响力计量(article-level metrics)方案的可行性；2010年，Priem和Hemminger[13]提出基于社交网络的科学计量学2.0，并总结了科学计量学2.0研究的各种类型的学术社交网络数据资源。

越来越多的像CiteULike、Mendeley、Twitter网络学术工具的使用和博客风格的文章评论为创造新的文献过滤器提供机会。基于社会资源的多样化组合的计量能产生更广泛、更丰富、更及时的当前和潜在学术影响力的评估[15]。Priem等[13]认为选择性计量学是“基于社会网络文献的使用与科技交流活动的测度的新兴计量学的创造与研究”，网络计量学是metrics on Web1.0，即网络计量学1.0，而选择性计量学的研究是scientometrics 2.0。

通过大量的文献阅读与综合分析，笔者认为选择性计量学是Web 2.0环境中的科学计量学研究，是建立在社交网络工具与开放存取分别在科学交流活动与科学成果出版平台中广泛应用的基础上而产生的。因此，选择性计量学与网络计量学既有联系也有区别。二者均是基于网络的科学计量学的衍生体，扩大了传统引文网络的研究范围，提出了更大覆盖面、更迅速和更开放的科学影响力计量方法。二者的差别主要在于，网络计量学是将万维网看作引文网络，在传统科学计量学中增加了网络链接和点击次数的计量，提出网络影响因子的评价指标；而选择性计量学是将开放存取平台和学术社交网络看作引文网络，研究基于Web2.0的科学交流平台上学术论文各种类型使用与评价的计量，提出知名度、热点、合作注释、标签密度等评价指标。与网络计量学相比，选择性计量学更重要的是强调对学术论文影响力的评价，而不是基于期刊的评价。

2 选择性计量学的研究对象

选择性计量学的研究对象可以概括为开放存取平台与学术社交网络中科技论文的各种使用、交流活动。选择性计量学中的学术影响力评价拓展了先验和后验科学质量评价的内涵。

传统科学计量学中的先验科学质量评价指评价者对论文出版前的同行评审，评价结果一般是论文发表、项目资助。论文通过期刊的出版前同行评审，达到该刊学术论文发表水平的要求，可以通过期刊影响因子等指标予以计量。而选择性计量学中的先验科学质量评价还包括开放存取平台提供论文即时上网，即完成编校的论文在线提前发表，预印本、手稿、修改稿等版本的论文在网上提前公开，供开放使用、推荐与讨论。

传统科学计量学中的后验科学质量评价是指论文出版后的同行评审，主要包括论文在各种数据库(如Web of Science 等)和检索平台(如Google Scholar等)中的被引用次数以及在正式出版物中的评论等。而选择性计量学中的后验科学质量评价不仅指在正式与非正式出版物中的同行引用、评论，还涵盖开放存取出版平台上论文的各种使用和在各种学术社交网络上的科技信息传播活动的计量。

20世纪中期，普赖斯[16]认为学者80％的信息通过非正式渠道交流获取，科学研究重要的信息往往通过会议或者面谈等其他交流方式获取。传统科学计量学只考察了先验和后验科学质量评价内涵中的一小部分，远远脱离了论文学术影响力多途径传播的客观现实。选择性计量学将能在某种程度上弥补传统科学计量学研究中的不足。

3 选择性计量学的研究意义

选择性计量学在时效性、覆盖面和科学交流过程方面具有独特的研究意义，主要表现在以开放的、即时的和个性化的文献过滤器为研究对象，扩大影响力覆盖范围，基于科学交流过程的评价。

3.1 开放、即时和个性化的过滤器

社交网络环境下，学者们更愿意使用学术社交在线社区与开放存取平台进行学术交流和评论。基于出版物的引用已经不是学术成果传播的主要渠道，科学思想不总是通过科学论文的出版进行传播。越来越多的学者选择在学术网络社区中进行评论和推荐[17-18]。一篇学术论文出版后，要经过至少一年的时间，才能被其他学者引用。因此，科学论文的引用影响力只能在它被发表几年以后才能测量。Brody[19]认为“一篇论文从被期刊出版到被引用要经过科学论文同行评议后，被出版社出版、被其他作者阅读、被其他作者在科学论文中引用、引用文章被同行评议，修改和出版的漫长等待，可能在全世界需要3个月至1～3年甚至更长的时间不等”。这其中的影响因素包括研究领域、出版延迟、期刊的可存取性、研究领域阅读和引用的周转时间等。然而，选择性计量学可能仅需要数天时间，就可以在开放存取平台上浏览、下载，在学术社交网络上进行标签(Tags)、挖掘(Diggs)、推荐(Tweet)等各种类型的引用活动。Priem和Costello[17]研究发现Twitter的一个研究样本中近半数的同行评审论文微博客(Twitter)在一周内的链接出现在开放存取出版平台上。因此，选择性计量学的一个研究意义在于开发开放、即时、个性化的文献过滤器，告知学者在更广泛的领域有哪些开创性研究成果。

3.2 扩大影响力覆盖范围

如果一篇论文在某一出版物中被引用，可能表明该论文有一定的学术影响力。但是这种引文影响力的内涵是狭隘的。如果一篇论文通过被阅读、讨论，可以给学者提供一种研究思路，但还不足够重要到被引用，并不代表这篇论文没有产生影响力。

论文的正式引用忽略了许多其他科技交流活动产生的其他种类的影响力。在Web 2.0环境中，学者们使用在线学术社交网络工具CiteULike、Mendeley、Zotero管理个人参考文献，使用Faculty of 1000专家推荐工具浏览论文，使用Twitter、FriendFeed和ResearchBlogging.org讨论文献。这些开放存取平台和学术社交网络工具及其提供的开放API将扩大科学计量学研究者的视野，便于观察科学交流活动的本来面目。选择性计量学将开发更丰富和更细致的学术影响力地图。

3.3 提出基于科学交流过程的评价

一些被广泛接受以至于被忽视的知识[20]，如默顿理论和孟德尔遗传学，虽然不被引用也同样具有强大的学术影响力；M.H.MacRoberts和B.R.MacRoberts[21]研究指出生物地理学和动物地理学的相关论文中普遍使用了大量植物、动物群区系分布类型数据库中的数据，但很少引用这些相关数据。这种通过正式文献引用程序被忽视的科学知识，在基于科学交流的过程评价中将被足够重视。

选择性计量学将打破以专著和期刊作为主要科学交流媒介的思想。除了测量学术论文的正式引用情况，还可以测量它的博客发帖数、数据集合和科研用视频资料。如果在学者偏好的学术社交网络中观察到某一论文被大量评论、转帖、回贴，那么这篇论文将可能有很大阅读价值。基于开放存取平台和学术社交网络的选择性计量学是一种基于出版前开放同行评审与出版后科学交流过程的非正式评价。Taraborelli[12]也将选择性计量学称作“软同行评审”。

选择性计量学可能会随着时间的推移发挥更大的作用。在选择性计量学的理论研究阶段，可能通过观察学者的各种交流行为，研究科学论文通过各种交流平台与网络的学术影响力传播方式；理论成熟后，将会有学校、政府机构的科研管理者尝试将选择性计量学理论应用于学者职称晋升、成果评价和项目评审的科研相关评价试验。通过理论与实践的发展，将会开发出各种过滤工具，帮助学者遴选重要和相关学术论文与成果。因此，选择性计量学具有很大的研究价值，不仅在理论层面，而且有很大的实践应用价值。

4 选择性计量学的评价指标

选择性计量学的研究指标可以在许多开放存取平台和学术社交网络中提取，作为传统的科技论文影响力计量指标的补充。许多社会软件工具允许用户将在线数据库中科学参考文献存档并进行简单操作，如检索、注释、分类，并与合作者分享。社会书签允许使用者将学术期刊的一篇论文编辑到个性化图书馆，并进行标签、评级和注释等操作。

4.1 标签密度

标签是一种合作元数据，被用作语义描述符。标签可以提供与科学文献语义相关的词，往往比作者添加的那些关键词更准确、更详细[12]。标签密度是指在学术社会书签系统中，作者和其他人员关于一篇论文所选择的各种标签按用户数量排序得到的标签频次。许多用户编译多个标签描述学术论文的参考文献，允许聚合标签的服务实际上可以提供免费、大量的文献协作聚合语义元数据；标签按用户数量排序具有较高的价值，对社会软件中每个条目的标签密度的测量将是一种不依赖于专家反馈的、评估一个参考文献条目是否语义相关的比较可靠的策略。

4.2 知名度

知名度指标是从用户数量的角度评价一篇论文的学术影响力，与CiteSeer、Web of Science或Google Scholar中被引次数指标的评价作用相近。知名度反映了有多少用户在他们的参考文献个人图书馆中对同一个论文条目添加标签。知名度指标将在评估科学内容方面同传统引文分析指标同等重要。社会书签是用户为今后使用一个论文条目而自愿添加标签的网络行为，这也许是一个更相关的学术行为[12]。因此，社会书签系统可能提供关于一个既定科学领域专家经常阅读和引用论文的更准确的数据。知名度指标中有代表性的是Del.icio.us中的Tagometer，又叫标签尺。

4.3 热点

热点可以被描述成一个科学重要性的短期指标，与即年指数、被引半衰期指标的评价作用相近，是在特殊社区中识别一个新兴的研究趋势的有用方法，可以帮助专家尽可能迅速地抓住出版时间不久的有影响力的文章。社会软件服务如Del.icio.us、Technorati、Flickr采用热点指标进行论文排名，评价哪些是热门研究，如Top 100 blogs; CiteULike和Mendeley中的知名度指标(popular)通过明确地让用户为他们喜欢的文章投票来测量热点。

4.4 合作注释

合作注释与传统的共引度指标相近，是指多名专家在学术社交网络中共同注释和评论同一篇论文。实现合作注释的功能平台主要有Naboj和Philica,Naboj允许arXiv预印本的合作注释，而Philica允许将期刊的特色论文进行开放同行评论。

一些学术社交网络和开放存取平台免费开放自己的API资源供研究人员使用，可以从中提取科学文献的社会聚合元数据，如FriendFeed、Digg和Reddit。通过从整个的用户社区中聚合用户使用的元数据，可以实现基于大规模元数据的选择性计量，这将在覆盖面、速度和效率上胜过传统的论文影响力评估程序；通过使用协作聚合元数据，可以实现基于学术社交网络和开放存取平台中论文使用的计量指标和传统评价指标如被引次数等之间的关联[12]。学术社交网络和开放存取平台可以提供自下而上的分布式论文影响力评价模式所需要的数据，在覆盖范围、效率和可测量性、扩展性方面具有重要价值。对学术社交网络和开放存取平台中论文学术影响力选择性计量指标的聚合将是选择性计量学研究和科学交流工具研究与开发的方向。

5 选择性计量工具的使用

国外相关研究机构已经开始着手尝试开发选择性计量工具。2011年3月，Mendeley公司的william在官方博客上发布了“The Mendeley API Binary Battle”的消息，并宣布竞赛冠军将获得10 001美金的奖励。随后不久，Mendeley和PLoS合作，邀请参赛者利用Mendeley和PLoS的开放应用程序界面所能提供的丰富信息(包括研究论文使用统计数据集、读者个人资料、社会书签和研究论文的相关推荐次数等)建立最具创新性、最受欢迎和最有用的应用程序，用来将程序控制后的数据回归到科学交流社区，并促使科研更合作化、更开放以及更加有效。参赛作品丰富多样，但单篇论文选择性计量工具——Total-Impact[22]最为引人注目。

Total-Impact是一个快速、便捷地观察研究成果的社会影响力网站，除了传统评价指标——论文被引量外，它还包括了开放存取平台和学术社交网络中论文影响力分布情况，并允许用户下载基于使用情况的统计数据。通过这个即时评价软件，研究者可以了解自己的成果被下载、添加书签和转发博文的次数；研究团体可以观察到科研成果更广的社会影响力。Total-Impact可以跟踪各种类型的研究成果，包括论文、数据集、软件、预印本和幻灯片5种类型。在输入窗口可以识别的数据格式主要有文献标识号DOI、Pubmed ID、SlideShare的URL等。系统运行共分三个阶段：首先是研究目标收集，然后是收藏浏览，最后是生成报告。以2005年Ioannidis在PLoS Medicine上发表的Why Most Published Research Findings Are False为例：

步骤1：在PUBMED网站(http://www.ncbi.nlm.nih.gov/pubmed/)上输入“Why Most Published Research Findings Are False”，检索到论文，打开题录页面，点击“Display Settings”列表选择用XML格式显示页面。在打开的XML页面中，找到语句〈ArticleId IdType="doi"〉10.1371/journal.pmed.0020124〈/ArticleId〉获得DOI号。

步骤2：将DOI号“10.1371/journal.pmed.0020124”输入到“Paste object IDs”选项框中，点击“Add to collection”按钮，将论文信息添加到数据库中，系统开始运行资源浏览程序，显示“1 objects in this collection”及有哪些被添加论文的PMID号。

步骤3：在“Name your collection”框中输入论文的文件名，点击“get my metrics！”按钮，生成论文的选择性计量报告，如图1所示：

图1 单篇论文的选择性计量结果

在图1中可以看到论文在22种开放存取平台和学术社交网络中的选择性计量情况。任意点击某个计量数据，会进入到选择性计量数据提取的来源页面，观察论文被使用和被讨论、引用、标签等行为的具体施引信息，与传统的“施引文献”相类似。如图2所示：

图2 单篇论文在CiteULike中的“施引文献”列表

笔者对Total-Impact的选择性计量统计变量进行注释，并对数据类型加以划分，如表1所示：

数据来源主要包括PLoSALM、PubMed Central、Scopus、Wikipedia、CrossRef、Research Blogging、CiteULike、Mendeley和Postgeonomic共9个开放存取平台和学术社交网站。选择性计量类型归纳为三大类：①开放存取平台上浏览、下载和链接次数；②数据库检索网站、参考文献管理网站中的被引量；③学术社交网络和开放存取平台中博文、书签、阅读、讨论次数。将三类数据分别求均值，得出Total-impactl=69485.13；Totalimpact2=252.2；Total-impact3=84.8571。由此可见各类选择性计量数据均值降序排列顺序是Total-impact1＞Total-impact2＞Total-impact3。

6 结语

选择性计量工具如Total-Impact在传统引文数据外，挖掘了各种类型的论文使用数据，实现了更丰富、更开放和更迅速的社会影响力选择性计量。然而，选择性计量学的研究现在处于早期开发阶段，提取的有些数据还不够准确，还存在很多问题：①不同数据库和开放存取平台下的引用合并问题，如从CrossRef、PubMed和Scopus中的引文统计有交叉部分，需要去重处理才能汇总；②被不同网站索引的论文链接次数的合并问题，如来自Dostgenomic、Nature Blog、Blogines和Research Blogging.org这4个博客聚集服务中的关于指向论文的博客记录链接有交叉部分，也需要去重处理才能汇总；③网络引用和传统引用行为一样，也存在引文规范、引文动机、科学评价适用性等问题，有待科学计量学专家们进行探索。

收稿日期：2011－12－22 修回日期：2012－04－18 本文起止页码：52－56，92

标签：科学论文; 开放存取论文; 文献计量学论文; 社会网络论文; 社交平台论文; mendeley论文;

Web2.0语境下的科学计量：选择性计量_科学论文

猜你喜欢