H类指标的发展与研究路径研究_citespace论文

h类指数发展概况与研究路径探究,本文主要内容关键词为:路径论文,指数论文,发展概况论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

在计量个人科研绩效产出时,一般以公开发表的文献量和被引次数为计量的基础,从而测量科研人员的发表文献的数量和文献的影响力。因此,在研究科研人员的绩效时,由发表文献及引用情况为基础衍生出了很多评价指标,如发文量、论文发表期刊的影响因子、发表论文的总被引次数、篇均被引数、篇均引文量等。这些指标在一定程度上,基本都是反映科研人员产出的质或量的某一方面指标,但一直缺少一个能够把这两者很好结合起来的指标。

2005年Hirsch提出了一种评价科研人员绩效的新型指标h-index[1]。一个科研人员的h指数是指在一定时期内他发表的论文至少有h篇的被引频次不低于h次。h指数兼顾了论文数量和质量,克服了传统指标要么重“质”或要么重“量”的缺陷和不足,能够更全面地反映科学家个人学术产出和学术的影响力。该指数一经提出,在国际学术界引起了高度关注和广泛研究。随着研究的深入,h指数的缺陷也被学者不断发现出来。因此,很多相关的改善h指数缺陷的相关指标被提出来,如Egghe提出的g指数[2]是针对h指数对高被引的文章不敏感的缺陷提出。金碧辉[3]针对h指数在科学家个人科研绩效评价中的三个缺陷,即缺乏灵敏度、区分度和波动性,提出了A指数、R指数和AR指数。为了反映不同时间跨度科研人员的科研成就和学术影响,Liang[4]构建了h指数序列和h指数矩阵。Molinari等针对h指数不能直接用来评价不同大小的机构或期刊,提出了h[,m]指数。

在本文,将h指数衍生的相关指数统称为h类指数。本文对h类指数相关的文献进行分析,并结合citespace可视化软件,通过可视化的方式揭示h类指数的发展概况、发展历程以及研究热点。

1 数据来源

笔者于2011年5月31日利用“h-index”为主题在wos中进行检索,发现相关文献有628篇。而在wos中检索2005年Hirsch发表的第一篇关于h-index的文章An index to quantify an individual’s scientific research output,然后根据该文献找出其施引文献,共743篇,但是点开链接之后只有726篇记录。通过仔细鉴别发现,在wos平台中直接用h指数为主题搜索出的文章有很多还是其他学科的指数,并不完全是本文要探索的h指数。由于h指数还是一个新型指标,研究人员在研究相关问题时会标引出来。因此,经过综合考虑,认为采用Hirsch关于h指数文章的726篇施引文献作为研究h指数的数据来源是较为合理的。

2 数据分析

2.1 文献量分析

表1和图1揭示了关于h指数从2006-2011年间所发表的相关文献量。从图1可以清晰看出,h指数一经提出,其关注度和相关文献量呈现不断增长的趋势。特别是在2009年和2010年,其公开出版的相关文献接近200篇,这说明近年来关于h指数的研究领域越来越活跃。由于本文的数据是在2011年5月31日收集的数据,因此2011年的文献量还不是很完整,不过不到半年的时间,已经有81篇施引文献,说明2011年对于h指数相关领域的研究热度依然不减。

2.2 来源期刊分析

关于公开出版物对h指数的相关文献量,发表文章最多的是荷兰的Scientometrics期刊,占据了所有施引文献的18.04%。其次是Journal of Informetrics和Journal of the American Society for Information Science and Technology,这两种期刊的刊文量在总量中所占的比例分别是10.06%和7.99%。以上三种期刊都是情报学界的核心期刊,有较广泛的影响力。表2列出了发表文献在7篇以上的期刊,从表2的数据来看,关于h指数相关文献的出版情况,情报学学科的期刊占据绝对优势的比例。

图1 2006-2011年引文文献增长量柱形图

2.3 著者分析

本文根据发文量的多少排序,提取了在该领域发文量在6篇以上的研究者,共15位,具体情况见表3。发文量代表了科研人员的产出,本文统计的发表文献数则代表了科研人员在h指数研究领域的产出。从表格中可以看出,在关于h指数的论文发表方面,发表文献在10篇以上的著者共八位,分别是Egghe、Rousseau、Bornmann、Schreiber、Daniel、Glanzel、Schubert和Prathap。以上都是情报学领域的专家,也是h指数领域研究的高产者。

篇均被引频次可以反映平均每篇文献对他人的影响力,本文研究的来源是Hirsch提出h指数的An index to quantify an individual's scientific research output的施引文献,因此该篇文章具有最大的影响力。其他篇均被引频次排在前五位的作者是Glanzel、Daniel、Schubert、Bornmann和Egghe。这说明以上5位作者在h指数研究领域具有较大的影响力。

由于本文的数据来源于WOS平台,因此在分析的过程中引入Citespace软件来进行相关文献可视化分析。Citespace[5]是用来分析和可视共引网络的JAVA应用程序。主要是用来帮助分析知识领域中的新趋势。它使用户可以将某个领域顺时进行“抓拍”,然后将这些抓拍的图片连接起来。

通过citespace软件做出了关于著者情况的可视化结果,具体见图2。该可视化结果的节点类型选择Author,阙值设置为(2,2,20),(3,2,20),(3,2,20)。从图2中可以明显地看出h指数的主要研究者是Rousseau、Egghe、Bornmann、Schreiber、Daniel和Schubert等(citespace由于对于人名的辨别不是很完善,因此分出了Leo Egghe和L Egghe,其实两位著者是一个人)。可视化结果中的连线代表了研究者之间的合作,从合作的情况看,Rousseau和Egghe的合作较为密切,Glanzel和Schubert的合作较密切,Daniel和Bornmann之间的合作也较为密切。除了对于人名的识别效果不太好之外,图2可视化结果基本和表3所展示的信息相符。

图2 著者分析可视化结果

2.4 论文机构和国别分析

在citespace中设置阈值为(2,1,10),(2,1,10),(2,1,10),然后以Institution为节点类型,得到关于机构分布的可视化结果,如图3。

图3 h指数研究机构可视化图谱

从图3中可以看出,目前国际上研究h指数主要研究机构有:Univ Antwerp,Univ Hasselt,Hungarian Acad Sci,Katholieke Univ Leuven,Tech Univ Chemnitz,Univ Zurich,ETH、Univ Sao Paulo,Indiana Univ,Leiden Univ,Univ Hawaii等。

图4是国别和著者的混合网络,可以看出h指数研究的主体有美国、比利时、西班牙和德国等。其中,中国在研究h指数中也处于一个较为中心的位置,与英国、比利时、荷兰等国都有一定的合作。

3 h指数的基础与前沿研究

3.1 h指数的知识基础

在文献计量学中,引文形成了研究前沿,被引文献组成知识基础。而citespace提供的时间视图中,我们可以找到以前的被引文献,也就是我们要探索的知识基础。如图5,我们可以看到最中心的文献就是Hirsch提出h指数的那篇文章。在该视图中,我们还可以看到对于h指数研究影响最早的文章是Lotka在1926年发表的一篇文章(LOTKA AJ,1926,J WASHINGTON ACADEMY,V16,P317),从节点大小来看Bradford在1934年(BRADFORD SC,1934,ENGI-NEERING-LONDON,V137,P85)发表的一篇文章,Garfield在1955年(GARFIELD E,1955,SCIENCE,V122,P108)、1972年(GARFIELD E,1972,SCIENCE,V178,P471)和1976年(GARFIELD E,1976,NA-TURE,V264,P609)发表的三篇文章,Pinski在1976年(PINSKI G,1976,INFORMATION PROCESSI,V12,P297)发表的一篇文章等都是h指数研究过程中重要的知识基础,对于h指数相关主题的研究具有持久的影响力。

图4 国别与著者的混合网络

图5 被引文献的共被引聚类网络时间视图

3.2 h指数研究的前沿热点

在研究前沿的时候,利用citespace的关键词突变检测功能,来检测h指数相关研究主题突然出现的关键词。这样的关键词一般代表着新的趋势和前沿领域。利用citespace软件,探测到在2006-2010年间的研究前沿术语23个,可视化结果见图6。

图6 2006-2010年间涌现的研究前沿术语

经过整理,将2006-2010年间涌现的研究前沿术语制成表格,见表4。本文利用citespace检测突发词来探测热点和趋势,表4列出的23个突发词在一定程度上反映了和h指数相关主题研究的热点和趋势。如2010年术语“subject category(学科分类)”突显,频次为6,在对于已有文献的验证中发现,该术语体现的是将h指数引入不同学科的期刊评价中时,更加注重期刊的学科分类;2009年的“network analysis(网络分析)”和“social network(社会网络)”术语的突显,体现的是将h类指标应用于社会网络分析的兴起。如Egghe[6]将洛特卡定律应用于社会网络,并且应用到h指数和g指数等绩效评价指标。在对于引文的分析中发现,最早将社会网络分析和h指数联系起来的文章是在2007年。在2009年出现了突发的增长,说明将社会网络和h类指数联系起来进行研究可能会是未来该领域研究的一个趋势。2008年,突发词频率最高的术语是“google scholar”,共15次。这个术语的突显体现很多学者基于google scholar平台对h指数相关主题进行研究,同时对于数据库的不同可能造成指数大小不一进行探讨。如Bar-Ilan[7]以google scholar,Scopus和Web of science为平台探讨以色列研究人员h指数在不同数据库之间的差异,认为google scholar平台得到的结果和Scopus以及Web of science平台得到的数据差异较大,而其中数据清洗不同是主要原因。Jacso[8]探讨了F W.Lancaster实际的h指数在google scholar,Scopus和Web of science中的差异;2007年出现的突显词“successive h indices(继承型h指数)”,从引文的记录来看,在随后的几年中,关于“successive h indices(继承型h指数)”的研究依然频繁,是一个持续的热点。“successive h indices”是由Schubert[9]提出的,旨在制定一个多层次的评估框架,来确定各领域科学的绩效,以及该机构的整体表现。

因此,从以上分析的几个突发词来看,我们可以利用citespace检测突发词的功能在一定程度上确定h指数研究相关领域的热点和预测未来的研究趋势。但是,在探测到的突发词方面,有些名词术语很宽泛,并不能够代表研究的前沿术语等。如“high impact”,“single number”等突发术语,由于比较宽泛,不能很好地与前沿和热点联系起来。另外,突发词是否能够代表前沿领域的研究热点和方向,这是需要研究者对研究主题的熟悉程度来进行判断的,甚至有时需要该领域的专家给予评定才能够下结论。本文只是在利用citespace工具和已有文献在一定程度上判断h指数相关领域的热点和前沿,并不能保证对于热点和前沿预测的准确性和完整性。

4 h类指数的研究路径探究

h指数的提出,引起了广泛的关注,很多研究者都致力于h指数相关研究的活动。从本文以上的统计情况来看,研究h指数主题的学者在不断增多,其应用的范围在不断扩展,而其研究文献在数量方面呈现出历年不断递增的趋势。因此,以h指数为主题的研究仍是现阶段的一个热点问题。

h指数的衍生指数越来越多,研究者对h类指数的研究范围也越来越广,其研究的大致路径可以总结为以下两条:h类指数的合理性探究与模型的改善以及h类指数的应用。

4.1 h类指数的合理性探究及模型的改善

h指数虽然是一个很好的个人科研绩效评价工具,但其还有一些缺点。由于这些缺点的存在,引起了很多科研人员的注意。在研究过程中,主要是对h指数合理性进行探究,找出缺点并进行某些方面的改善,以增强其适应性、科学性和公平性。

学者在进行h类指数的合理性探究及模型的改善方面主要从以下几方面进行:

4.1.1 h指数优缺点的分析

h指数自从提出之后,就一直有学者对其可能存在的优缺点进行探讨和研究。在对于h指数存在的优点上,Hirsch本人在提出h指数后,就指出h指数是一个计算简单且易于理解的综合指标,综合了学术影响力和论文产出的量两方面因素,并且能够测量科学家终生的成就[1]]。随后的学者总结了h指数的优点[10-13]主要有:

(1)h指数是一个相对稳健的累积指标,单纯发表论文数量的增长对其不产生直接的影响;

(2)h指数测量的是持久绩效;

(3)h指数不随着引文数量的增加而增大;

(4)h指数很难通过自引达到膨胀;

(5)与其他计量指标相比,h指数可以遏制科研人员片面追求论文数量的不良倾向,同时又能够激发其探索深层次科学问题的热情。

关于h指数的缺陷[14-18],研究者发现的主要有:

(1)对于那些从事科研时间较短的年轻工作者不利,因为其发表文章数量和得到的被引量都相对较低;

(2)敏感度低。h指数不能区分h值相同但论文被引频次相差悬殊的情况;

(3)h指数是一个只上升,不下降的指标,在时间序列上没有波动性;

(4)不适用于跨学科的比较;

(5)大规模的自引会影响h-指数的大小;

(6)存在精确注水问题。即处于h值附近的文献,其被引量微不足道的增长就可显著改变h-指数的大小;

(7)不利于那些发表论文数量较少但被引次数却很高的科学家,不能兼顾体现“少而精”型被评对象的业绩。

4.1.2 针对h指数缺陷提出新的指数

h指数的优缺点在上文已经做了一些大致的总结。正是由于一个新指标的出现,在解决一些问题的同时,不可避免地也会出现许多其他的问题。因此,h指数的衍生指标会不断地出现,即h类指标不断繁荣起来。

基本上,每一个h类指数的提出都是基于矫正h指数在某方面的缺陷,如在本文开篇提到的g指数是针对h指数对高被引的文章不敏感的缺陷提出;A指数、R指数和AR指数是针对h指数缺乏灵敏度、区分度和波动性提出的;h指数序列和h指数矩阵是针对不同时间跨度科研人员的科研成就和学术影响提出的。其实,除了上面提到的几种衍生指数,还有很多其他的衍生指数。如hg指数[19]是基于较高被引论文及高质量论文矫正的h类指数,hm指数[20]是基于样本大小矫正的h类指数,e指数[21]考虑到h核心区全部的被引频次的h类指数等。

对于h类指数的分类,Bornmann等人[22]通过对h类指数的对比研究,认为关于h指数及其衍生指数可以分为两种类型:第一种是能够更好地反映核心作品集的数量的指数,包括h指数、m商、g指数、h(2)指数;第二种是能够更好地反映核心作品集的影响力的指数,包括A,m,R,AR等指数。所谓核心作品集是指落入到h指数范围的文章。

笔者比较赞成Bornmann对于h类指数的分类,但笔者在本文提出另一种分类方法,即依据衍生指数是否根据h指数规定的计算方法来分类。这样的话,可以将h类指数分为:基于h指数的改进指标和基于新计算方法的改进指标。在基于h指数改进的指标中,A指数、R指数、AR指数、e指数和h指数序列等都属于此类;基于新计算方法的指标主要有g指数、h(2)指数[23]等。

4.1.3 h类指数之间以及与传统计量指标的对比分析

在对于h指数是否有效,更加先进的问题上,有不少研究者对于h类指数之间以及h指数和其他传统计量指标之间进行了对比研究。

H类指数已经由单独的h指数衍生成了以h指数为主,多种衍生指标共同发展的情况。在对于h类指数之间的比较分析和它们之间相关性的研究中,Born-mann等人通过对比分析,认为h指数的主要衍生指标可以分为两大类;Zhang[24]具体分析了h指数、g指数与e指数之间的关系。这类对比h类指数之间关系的文章还有很多,在此不一一列出。

在h指数和其他传统计量指标的对比研究中,Bornmann等人[25]收集了欧洲分子生物学组织青年研究者项目基金申请人的综合性数据。通过比较,他们证实了h指数和其他三项传统的文献计量指标(论文总数、论文被引总数和期刊影响因子)一样,都和同行评议的结果高度吻合的;Costas等人[26]利用Wos平台上西班牙CSIC科学家们在Natural上的数据,分析在微观层次上的h指数与其他文献计量学指标指数的关系;Van Leeuwen[27]比较了h指数和各种文献计量学指标在研究和测试评估程序中的效用。

4.2 h类指数的应用探究

h指数的初衷是计量个人科研绩效的指标,但已扩展至期刊、科研团队、机构以及地区和国家等多方面的科研产出评价。总体而言,h类指数随着指标数量的增加以及应用范围的扩展,在对于科研产出计量的领域显示出了很大的发展空间。

在个人科研产出计量方面,Hirsch最初提出用h指数来对比杰出的物理学家。而Schreiber[28]则用h指数研究了26位非杰出的物理学家。Imperial[29]等人用h指数评估了生物学和生物医药学领域专家的科研产出。Oppenheim[30]用h指数排列了情报学界专家的影响力。在应用的情况来看,在个人科研产出,h指数的应用较多。

h指数同样可以应用于团体、机构和一群研究者的科研产出评估。如Van Raan[31]以147所大学化学研究团队为评估对象,比较了h指数与标准文献计量学指标及同行评审之间的关系。结果显示h指数同总被引次数之间具有很强的相关性,并且和同行评审之间的结果具有很好的相关性。Mugnaini等人[32]提出基于h指数来比较了巴西科学院和美国国家科学院的科研产出。

在评价期刊方面,Braun[33]等人提出将h指数用于期刊的评价,指出h-指数可作为一个稳定的计量指标评价期刊,是期刊影响因子的有益补充。Vanclay[34]运用h指数评价期刊的方法对林业类期刊进行了排序。

除了以上方面的应用研究,还有学者将h指数应用于专利的评价上[35],应用于预测个人的未来学术成就[36]和热点界定[37]等方面。

5 总结

科研评价需要公平、科学的指标来构建评价的体系。随着科学计量学的不断发展,定量的评价指标在科研评价中的应用越来越广泛。传统的计量指标大多数是单一的指标,而h指数很好地做到了“质”与“量”的结合。从h类指数相关研究主题的发展过程来看,人们对于该主题的不断深入研究证明了人们更希望能够在科研评价中使用一些综合性的评价指标。虽然h指数及其衍生指数还没有作为一个权威的评价指标应用于权威的科研绩效评价中,但该类指标的综合性、有效性、扩展性、科学性和公平性会不断被实践所验证。相信在不远的未来,h类指数一定能够在科研评价中发挥重要的作用。

标签:;  ;  ;  ;  

H类指标的发展与研究路径研究_citespace论文
下载Doc文档

猜你喜欢