一种改进h指数的方法_h指数论文

一种改进h指数的方法，本文主要内容关键词为：指数论文,方法论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

1 引言

2005年8月，加州大学圣地亚哥分校物理学家乔治·赫希提出一种定量评价科研人员学术成就的方法——h指数。由于这项指标测量的结果在一定程度上能够解决传统的文献计量学指标在科学家个人绩效评价中的局限性，比传统评价指标更简单、更科学。因此，该指标一经问世，立即引起人们的广泛关注，已经被运用到评价专家学者、科技期刊、科研机构、国际会议、学科领域等诸多方面。

“h指数”的定义为：h代表“高引用次数”，如果一个科研工作者发表的N篇论文中有h篇论文的被引次数至少为h，那么这个人的h指数为h[1]。例如一名科研人员的“h指数”是20，则表示这名科研人员至少发表了20篇被引频次在20次以上的论文。

由于h指数具有对被引频次和论文数量两个指标的制衡的特点，因此和其他单项文献计量学指标相比具有更多的优势。例如对于论文数量很多，但论文被引频次不高的科研工作者，他的h指数一定不高；对于被引频次很高，但论文数量不多的作者，h指数也会被论文数量所限，而不能得到高h值；只有当论文数量多，而且多数论文具有高被引频次时，才能获得高h指数。因此，用h指数评价科研人员的绩效可以遏制片面追求论文数量的不良倾向，同时又能够激发科研人员探索深层次科学问题的热情[2]。

但是h指数的不足之处也相当明显，笔者认为，这些不足如不能得到有效的改善，会影响h指数用于科研评价的科学性和公正性，甚至有可能使某些科研工作者不再对其成果精益求精，这对于科学研究来讲是十分危险的。

2 h指数的缺陷

h指数的不足除外在因素影响外[3]，更多来自于h指数本身，许多学者对这些问题已经广为探讨，如h指数对刚起步的科研人员很不利，h指数允许科学家吃老本，对某一个领域中较优秀的科学家进行比较时h指数才会比较有效，而对普通科学家进行比较时，h指数并不具备鉴别力等等[4]。除上述不足外，笔者认为以下这些问题也应值得关注和重视。

2.1 h指数不关心高被引论文的被引频次

如上所述，h指数关心的是高被引（h排名以上）论文的数量，这使得它突破了以论文数量、被引总量等传统评价指标的局限，把目光投向了高质量论文，但是这种关心在科研评价中却有很大的局限性。以同一学科领域A、B、C三位科研工作者的论文被引统计为例，具体数据见表1。

表1 三位科研工作者论文被引数据

从表1可以看到，A、B、C三位科研工作者的h指数分别5、5、3，若以此作为科研评价的依据，显然欠缺科学性和公平性：A、B两位科研工作者虽然h指数相同，但是论文被引次数差别很大，被引200次和100次的论文显然不是一个概念，而被引100次和50次的论文影响也是不同的，但是在运用h指数的过程中这些具体被引次数并没有被体现出来。当然，由于所举例子比较特殊，我们可以通过一些手段来判断两者的差别；B、C两位科研工作者的h指数不同——前者大于后者，但是正如上面所讨论的，高被引的论文由于被引次数的不同，两者并不是等价的，由于B科研工作者两篇被引40次和5次的论文而冲淡了C科研工作者3篇高被引论文的价值，对于C而言也是不公平的，通过h指数也体现不出。h指数不关心高被引论文的被引频次，会严重挫伤科研工作者的科研积极性。

2.2 h指数不关心低被引论文

h指数关心高被引（高质量）论文无可厚非，但是完全放弃低被引（h排名以下）论文则值得商榷。因为通过研究发现，一般情况下论文被引用的次数和累计时间长短有关，高被引论文被引次数比较高是在多个时间段内被引次数的叠加形成的，累计时间一般比较长，而低被引文献大多由于累计时间较短，形成了被引次数较少的结果。因此，低被引论文被引次数较低的原因有两种：可能因为论文质量比较低得不到其他科研工作者的认可，也可能因为累计时间比较短，而不能得到相对较高的被引次数，但是这部分论文里可能隐藏高质量文献，随着累计时间的增加会逐渐被发现，而形成高被引论文。因此，完全忽视低被引文献也有失h指数科研评价的科学性和公平性。

另外，h指数不关心低被引论文有可能被一些学术造假者实施精确注水——有目的的对h排序以下，但是被引次数相对较高的论文进行自引，进而大幅度提高h指数[5][6]。

2.3 h指数不关心最高被引论文

h指数提出的初衷就是因为传统的科研评价指标存在着缺陷，如总被引次数、平均被引次数和作品（包括论文和专著）总数等，没有给予高被引文献足够的重视，而高被引文献才是科研评价中最重要的一个标准。但是，h指数虽然给予高被引文献更多的关注，2008年6月2日，中国科学技术大学管理学院吴强博士还提出了h指数的另外一个变种——w指数，更强调关注高被引论文[7]，但是对高被引论文中的最高被引论文却没有引起足够的重视。

我们知道，尽管引文动机比较复杂，但是在一般情况下，论文被参考和引用多数仍是在得到了作者对论文质量认可的基础上进行的，如果作者对该论文的质量不认可，这种参考和引用的行为不会发生。大量作者都对该论文的质量认同，并对其进行参考和引用形成了高被引论文，因此经过多个作者把关后的高被引论文，其质量是有保证的[7]。而最高被引论文恰恰是科研人员高质量成果中最具代表性的，它反映了科研人员的最高水平，对科研人员的成果贡献应该最大，但是从h指数的定义并结合表1来看，最高被引论文在h指数的形成过程中，对科研工作者没有产生应有的贡献，最高被引论文的价值没有体现出来，这可能会影响到科研人员发表高质量成果的积极性。完全忽视最高被引论文，有失h指数科研评价的科学性和公平性，尽管科研工作者对科研成果的质量普遍比较重视，但是也有可能导致部分科研工作者不再对科研成果精益求精，这对科学研究来讲也是非常危险的。

笔者认为最高被引论文对于科研工作者而言，其重要性是其他高被引论文所无法代替的，在越来越重视科研成果质量的今天，我们在关注科研成果的数量的同时，更应该把目光投向科研成果的质量上，而那些高质量科研成果，应该通过一定的指标将之体现在科研工作者的评价上。

3 h指数的改进及实证研究

针对h指数的缺陷，国内外很多学者都提出了相关的改进措施，并提出了一些变种[8][9][10]。但是这些方法、变种与h指数相比都存在一个缺陷——计算复杂，失去了h指数原有的简洁性和易用性，而h指数的简洁性和易用性正是其提出后引起国内外广泛关注的重要原因，中国科学技术大学管理学院吴强博士提出的w指数[11]虽然保持了h指数的简洁性和易用性，但是也存在不关心高被引论文被引的次数以及最高被引论文的问题。

3.1 改进h指数的方法

在这里，笔者认为可以以h指数为基础，将h排序及以上的论文被引次数进行叠加，得出这部分论文总的被引次数n，以n值的大小来比较科研工作者的影响。具体步骤如下。

(1)对科研工作者发表的论文（包括合著论文）按照每篇论文的被引频次进行排序，对于被引频次相同的论文也给出不同的序号。当前h篇论文每篇的被引用次数为h及以上，并且第h+1篇论文的被引用次数低于h+1时，得到该科研工作者的h指数h。

(2)统计h排序及以上的论文被引次数，并叠加得到部分总被引次数n，以n来比较科研工作者的学术成就。

我们认为，以部分总被引次数n评价科研工作者是一种建立在h指数基础上，比较可行的一种方法。这种方法从形式上看和R指数[12]有相似之处，但是两者之间区别也比较明显。

(1)R指数需要对部分总被引次数n开根号，无形中增加了计算的复杂性，而h指数之所以引广泛起国内外学者的兴趣，除了科学，另一个重要原因就是简单易用，显然部分总被引次数n比R指数更简单。

(2)R指数具体含义不明显，h指数指某个期刊至少有h篇被引次数为h的论文，部分总被引次数n指h排序及以上被引次数的和，R的具体含义则是什么？为了追求和h指数形式上的一致性使R指数的具体意义比较模糊，显然部分总被引次数n比R指数表达的含义更清晰。

(3)R指数的最终表示形式不方便，一般情况下R指数最终会取正实数，小数点后的数值可能比较多，表示起来相对来讲不是很方便，但部分总被引次数n则不存在上述情况。

3.2 实证研究

为了验证本文所提方法的正确性，我们对我国图书情报领域9位知名学者发表的论文进行了统计，为分析方便仅取被引文献的第一作者，统计时间为1998-2008年，统计结果如表2所示。

表2 我国9位图书情报领域著名学者发表论文

注：数据来源于中国期刊网引文数据库

在这里有必要指出的是，由于统计对象仅为第一作者且类型仅为论文，表2中数据可能会和学者们实际的学术影响力有所差别。

从表2中我们可以看到，若以h指数来对科研工作者进行评价，论文第二部分所讨论的问题一一暴露：所有学者无论其被引论文次数如何，在h指数中都得不到体现；所有学者的最高被引论文，包括张晓林先生的超高被引426次的论文都被忽视；每位学者都可以通过在h排序下方附近有目的的进行少量自引从而提高h指数，当然9位学者作为图书情报界的“名家”，以治学严谨著称并不会这样做，笔者在这里为做出这样的假设向9位先生致歉。因此，h指数作为一个评价科研工作者的新指标，如不进行改进，对科研工作者的评价有失科学、完整和公平。

9位学者h指数和n值的比较见表3。

表3 9位学者h指数和部分总被引次数n的比较及变化

注：数据来源于中国期刊网引文数据库

从表3的结果可以看到，以部分总被引次数n评价科研工作者的优点如下。

(1)保持了h指数的简洁性和易用性。相比其他改进措施和变种复杂的计算，这种方法只需在得到h指数后统计h排序及以上论文的总被引次数n，计算简便，有较强的易用性。

(2)解决了h指数不关心高被引论文被引频次和最高被引论文的问题。通过h排序及以上不同论文被引次数的叠加，高被引论文具体的被引次数得到关心，最高被引论文的价值得到体现，不同被引次数的高被引论文共同构成了对科研工作者的贡献。

(3)考虑了低被引论文对科研工作者的影响，避免了h指数被精确注水的可能性。由于h指数精确注水是对h排序以下，但是被引次数相对较高的论文进行自引，如果h排序下被引次数相对较高的论文比较多，显然是可以大幅度提高h指数的，但是改进后由于是利用h排序及以上的累积被引次数n做比较，少量的自引不会对总被引次数产生大的影响。以表2中学者蒋永福的被引论文数据为例，对排序22-27的论文分别进行1、3、3、4、4、5共20次自引即可使其h指数由24提高到27，从而轻易改变9位学者的原有排序，而如果使用部分总被引次数n评价科研工作者，从表3来看，20次的自引不会对以部分总被引次数n的排序结果构成显著影响。

(4)解决了h指数相同情况下科研工作者的评价问题。改进前，在h指数相同的情况下，没有办法对科研工作者进行评价，当然可以结合h指数，通过其他方法展开评价，但是计算和评价过程复杂；改进后，虽然科研工作者的h指数相同，但是利用h排序及以上论文被引总次数的差别很容易对科研工作者的科研能力进行区分。

4 结束语

h指数是一个富有创意的评价指标，但也存在很多缺陷。h指数不关心最高被引论文和低被引论文，对高被引论文具体被引次数的忽视，大大降低了h指数作为一个新的科学评价指标的信度。文章针对h指数的缺陷，在保持h指数原有简洁性和易用性的基础上，提出的改进h指数，使之在科研评价中更科学、完整、公平，虽然从实证结果来看比较符合预期效果，但是论文的被引本身就是一个比较复杂的过程，其中可能有其他很多因素笔者未必能考虑到，并且这种方法也没有在理论上进行推导和证明。如何在保持其原有简洁性的同时，更能科学、客观的体现h指数对科研工作者评价的作用，还需要更多的专家、学者进行思考和探讨，希望本文可以为h指数的科学应用提供一定的启发。

收稿日期：2009-06-24

标签：h指数论文; 高被引论文; 科研评价论文;

一种改进h指数的方法_h指数论文

猜你喜欢