近十年中国旅游学术界成就的H指数测度与评价_第一作者论文

近十年我国旅游学术共同体成果的h指数测度与评价,本文主要内容关键词为:共同体论文,近十年论文,成果论文,学术论文,指数论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

      一、问题的提出

      笔者的《近十年我国旅游学术共同体的发展格局与分类评价——基于旅游学术期刊论文大数据的视角)》(以下简称“前文”)一文(载《旅游学刊》2013年第10期)对2003-2012年我国旅游学术共同体成员的成果进行了梳理和评价。该文发表后,不仅引起了我国旅游学术界的普遍关注,也被国外学者所引用[1]。同时,也有学者对其评价指标的选取和方法提出了一些批评意见和建设性建议。正如笔者在该文“结论与讨论”中指出的那样,“论文数量只是衡量学术影响力和学术贡献度的一个侧面,论文质量还与被引频次和下载量相关”[2]。为此,笔者在“前文”的基础上,增加了学术影响力和影响因子维度——h指数,对近十年我国旅游学术共同体成果进行测度和评价。

      必须指出的是,本文的h指数是从2003-2012年的载文中经统计、运算处理后得到的。这样做的目的主要是为了保证与“前文”的样本数一致,也便于与“前文”的研究结果做比较。但缺陷是没有充分利用三大数据库的文献资源,中国科学引文数据库(Chinese Science Citation Database,CSCD)收录的文献最早是1989年,中国知识基础设施工程数据库(China National Knowledge Infrastructure,CNKI)是1992年,中文社会科学引文索引(Chinese Social Sciences Citation Index,CSSCI)则是1998年。笔者通过对2003年之前三大库中的文献,以旅游、旅行、游憩、闲暇、休闲、观光、度假、客源、游客、导游、酒店、饭店、住宿、宾馆、饭馆、景区、景点、景观、风景、公园、会展、展览、目的地、节事、节庆等25个字段进行“题名”或“关键词”的搜索,并经跨年度和跨库查重,删除关键词不相关文献及周期小于月度的期刊所载文献,得到的文章数为4548篇,作者为7012人。由此可见,在2003年之前,无论在文章篇数,还是在作者人数都远少于2003年以后的十年,因此,以2003-2012年的文献数据可以反映我国旅游学术共同体发展的总体格局和基本走向。

      二、研究方法综述

      h指数是由美国加州大学圣迭哥分校的赫希(Hirsch)教授于2005年提出的一项评价科学家科研绩效的定量指标。其含义为:一个人在其所有学术文章中有N篇论文分别被引用了至少N次,他的h指数就是N[3]。一个人的h指数越高,表明他的论文影响力越大。h指数的计算基于两个指标:研究者发表的论文数量和其论文被引用的频次,对某研究者来说,快速确定其h指数的方法为:(1)将该研究者发表的所有论文按被引频次从高到低排序并以1,2,3…赋以序号;(2)在排序列表中从前往后看,直到某篇论文的序号大于该论文的被引频次;(3)所得序号减去1即为h指数。由于h指数的计算兼顾了论文的数量和质量,较为全面客观地反映了某个评价主体(个人、机构和期刊等)的科研生产力和学术影响力,因而,h指数被国际学术界所认可,在科学计量学界得到了广泛的应用。

      然而,h指数的应用同时存在一定的局限性和缺陷:(1)对作者被大量引用的某一篇或几篇文章并不敏感,对h值相同但论文被引频次相差悬殊的情况不作区分;(2)没有扣除作者自引的情况;(3)h指数的大小很大程度上依赖于作者的学术生涯时间,随着时间的推移,作者的h指数只增不减,或者保持不变;(4)对于多人合作的论文,h值的计算会出现因合作者贡献和荣誉分配不一致而导致不同的计算结果。为了衡量作者的合作规模,科学计量学界以人为单位对期刊论文的作者合作规模进行度量,引入了期刊论文的作者合作度(co-authorship degree)的概念,即一篇论文的作者个数即为该论文的作者合作度[4],增加了h指数计算的不确定性。

      

      (一)张春霆h指数算法

      我国学者张春霆院士提出了一种根据作者排序计算带权重的引用次数方案,并提供在线查询功能(http://www.wcitation.org)[6]。张春霆提出两项原则来计算作者的权重系数:一是荣誉三分原则,即将一篇论文所获得的荣誉等分为3份,通讯作者和第一作者的权重系数均为1,其他作者的权重总和为1;二是线性原则,除通讯作者和第一作者外,其余作者所分得的荣誉按其作者排序顺序以等差级数递减,给出的权值公式是:C(k,n)=2(n-k+1)/(n+1)(n-2),n≥4,2≤k≤n-1,特例是C(2,3)=0.7。

      在其计算器模式中,一共有4个项目,即:论文作者数目、考察作者排名、文章常规引用次数和通讯作者排名(若无通讯作者则填0)。此外,针对文章数量较多的情况,其在线网站提供了批处理模式。但作者提供的方法主要是针对理工科学术背景的学者在SCI期刊上发表的论文,且这一算法也未得到人文社科学界的普遍采用。

      在h指数的方法研究和实践探索中,一般采用以下几种常用的方法:(1)所有作者同时获得文章的所有贡献;(2)仅计算主要贡献者(包括第一作者/通讯作者)[7-15];(3)平均分配作者贡献[16-20]。这一方法计算方便,但在各作者的贡献度上平均分配不尽科学合理。教育部学位与研究生教育发展中心在解决成果等信息的跨单位、跨学科“重复使用”问题时,提出了“归属度”的概念[21]。同样,在利用h指数进行科研评价时,也可以借鉴这一方法对涉及多个作者的科研成果分为若干归属部分。在此基础上,又有不少学者提出以下多种基于作者权重和荣誉度分配的计算方法。

      (二)调和方法

      哈根(Hagen)在2008年提出了调和(harmonic)方法[22],即在有N个作者的论文中,排名第R的作者的贡献比例被估算为

      (三)按比例分配的方法

      范·霍伊顿克(Van Hooydonk)在1997年提出根据作者排名按比例分配的方法[23],即在N个作者的论文中,排名第R的作者的贡献值为

      (四)几何分配方法

      埃格赫(Egghe)于2000年提出了几何分配方法[24],即在N个合著者的论文中,排名第R的作者的贡献值为

      (五)谢凯尔吉奥卢法

      谢凯尔吉奥卢(Sekerciouglu)于2008年提出了基于作者排序的第k个作者是第一作者贡献率的1/k的计量方法,第2至第10位作者的计算结果同调和方法[25]。

      (六)根据作者平均贡献值进行分配的方法

      在理论上合理推断每个作者贡献比例的最大值和最小值,然后计算这两者的平均值作为作者的贡献比例值。作者贡献的最小值计算方法是,在N个合著者的文章中,第一作者贡献比例的理论最小值为1/N,其他作者贡献比例的理论最小值为0.1。作者贡献比例的最大值计算方法是,第一作者贡献比例的理论最大值为1,其他作者贡献比例的理论最大值为1/R(R为作者排名)。

      (七)

指数

      赫希教授于2010年又提出了考虑合作者的影响力,指的是作者拥有的

篇论文在其核中,

核中的每篇论文的被引频次均大于等于

次,而

核外的其他论文则属于各篇论文合作者的

核。其具体计算方法如下:(1)计算出作者的h指数以及合著者的h指数。(2)h核中作者独著的论文保留,对于有合著者的文章,首先将合著者h指数

与原著者h指数

进行对比。第一种情况:

,在这种情况下,直接保留文章。第二种情况:

,这种情况下再对比合著者h指数与被引频次(C)的大小,若

>C,则将该篇文章从h核中删除;若

<C,则保留该文章。(3)对比完h核中的文章之后,再对比后面有没有新的文章递补,如果有的话,再按照之前的方法重复判断[26]。但这种方法未考虑作者排序问题。

      (八)三种主要的作者贡献度分配算法

      综合上述各种方案,我们选取其中三种最主要的作者贡献度计算方法,即调和法、按比例分配法和几何平均法(表1)。只有出现两位作者时,这三种方法的计算结果才是一致的,其余各不相同。

      

      (九)中国知网引文数据库算法

      中国知网数据库(CNKI)由清华大学、清华同方发起,始建于1999年6月,建成了世界上全文信息量规模最大的CNKI数字图书馆。其引文数据库可提供对作者、作者机构、期刊和出版社的h指数等相关查询,其中,“作者h指数”是指该作者至多有h篇论文分别被引用了至少h次;“机构h指数”是指该机构至多有h篇论文分别被引用了至少h次;“期刊h指数”是指该期刊至多有h篇论文分别被引用了至少h次。

      在具体计算上,以“作者h指数”为例(“机构h指数”也类似,因为机构对应每篇文章的相应作者),设有诸多选项:作者姓名、第一作者、作者单位、曾经工作单位一、曾经工作单位二、单位匹配方式(模糊、精确)、资源范围。以“保继刚”为例,“作者姓名=保继刚”h指数为55,“作者姓名=保继刚”+“作者单位=中山大学”h指数为51,“第一作者=保继刚”h指数为31。由于查询条件(组合)不同,得出的h指数也不尽相同,且有可能相差较大。如只查询作者姓名,h指数最大,但无法排除可能存在的多个同名同姓作者被合并计入的情况(尤其是在海量数据情况下,不同学术领域的作者同名同姓的情况较普遍)。此外,CNKI数据库的h指数算法本身也还存在不尽完善的地方,即在其计算过程中不区分存在多个作者的情况下作者署名顺序和机构顺序,没有根据作者署名次序赋予权重。例如,一篇文章有5个作者,那么对于第五作者来说,该篇文章也算作他的一篇文章,若被引用1次,算作他的1次引用。也就是说,一篇论文的作者人数越多被重复计算的次数越多。但若仅考虑第一作者,通过该库的“第一作者”栏可统计仅计第一作者的h指数。

      由此可见,尽管CNKI数据库可以直接为每一位作者(机构也类似)提供h指数的在线查询,但如果以此应用于对旅游学术共同体成员的整体评价,显然是不适宜的。

      三、本研究采用的数据与方法

      (一)数据来源

      本研究是“前文”的补充和深入,也为了便于与前期成果进行比较,本研究仍然采用同样的数据样本,期刊总样本数为784种,文章为16024篇,作者为13608人,作者所在机构2565家。其中合著论文(两位及以上作者)篇数为8870,占比55.35%(表2)。由此也可看出,本研究不能采用不区分作者人数和顺序的方法。

      (二)期刊h指数计算

      期刊不存在合作者的问题,因此h指数的计算相对较为简单,主要考察列入本文范围的期刊文章在CNKI中的被引用情况,即对于一种期刊,如果它发表的全部论文中最多有h篇文章的被引用次数至少为h的话,那么h即为该期刊的h指数的数值。当h指数相同时,以刊发的旅游类论文篇数排序。

      从期刊的h指数计算结果看(表3),前110位期刊h指数在9以上,《旅游学刊》的h指数最高,达到了88。即在2003-2012年的十年间,在发表的1944篇论文中,最多有88篇论文被引用了不少于88次,《人文地理》和《经济地理》的h指数分别为51和48,分列第二、第三位。这些期刊中,地理学期刊占据着明显的优势,在h指数大于20的前19种期刊中,有10种是地理学期刊,其中包括《地理学报》《地理研究》和《地理科学》等地理学领域内的权威期刊。虽然《地理学报》在刊载旅游论文的数量上最低,十年仅55篇,但学术影响力较大,其中的24篇,至少被引用了24次以上。此外,《干旱区地理》《地理科学进展》《生态学杂志》《长江流域资源与环境》《自然资源学报》《山地学报》《热带地理》《世界地理研究》《水土保持研究》《中国岩溶》等地理学或地学类期刊的h指数都在10以上。显然,在旅游学术生态圈中,地理学成为旅游学科的“建群种”和“优势种”。而经济学、管理学、社会学、心理学等与旅游学科相关学科的顶级刊物并未出现在表3中,说明了这些学科对于旅游学科的贡献度不及地理学,这与“前文”通过论文数量分析得出的结论相吻合。

      

      (三)基于权重的作者h指数计算

      作者h指数的计算首先依据调和法对不同顺序的作者进行赋权,权重与该篇文章的被引频次相乘得到每位作者的“分权被引频次”,再依照h指数的计算方法得到。为进一步区分在h指数相同情形下的排序,我们还对每一位作者进行评分,假设一篇文章有N个作者,则每个作者的得分为1/N,将该作者每篇文章的得分相加得到的分值,作者出现的频次即为文章篇数。排序按照h指数、分值和文章篇数(频次)依次排定,即如果h指数相同则按照分值高低,如果分值相同则按照文章篇数多少来定,依次类推。为了防止出现不同作者同名同姓的情况,按照数据库中作者的个人信息(如出生年月、性别、毕业院校、研究方向等)逐一进行核对,作者所在的机构资料是经笔者通过各作者所在机构的官方网站核实后确认(查询时间为2014年3月)。

      

      

      2.表中有的大学(学院)学报括号内的简称含义如下:自科=自然科学版;人社=人文社会科学版;社科=社会科学版;哲社=哲学社会科学版。

      从作者的h指数计算结果分布看(表4),保继刚的h指数19为最高值,吴必虎和陆林的h指数为18和17,分别列第二、第三位。作者的h指数几乎呈等差数列的连续分布,且呈现金字塔结构。位于前十名的作者学术背景大多都是来自地理学。可喜的是,在高h指数的名单中,发现了不少中青年学者,可以看出,我国旅游学术研究的人才梯队已经形成,后继有人。

      此外,表4的h指数计算结果与CNKI提供的作者在线查询得出的h指数结果不同。这是因为,首先,CNKI收录的文献是从1992年开始的,样本时间要比表4中的统计时段早12年;其次,表4中样本来源除了CNKI收录文献外,还包括CSSCI数据库和CSCD数据库,尽管CNKI收录的文献量是最大的,但这三大数据库的文献资料并不完全重叠;最后,对于各合作者的贡献度计算方法不同。

      (四)基于权重的机构h指数计算

      机构h指数的计算步骤如下:(1)在作者h指数计算中对不同顺序的作者i进行赋权

。(2)若作者i有n个单位,则该作者所属的每个机构权重均为

/n。(3)用机构权重

/n乘以该篇文章的被引频次即为某机构的“分权被引频次”。(4)假设一篇文章有N个作者,某一作者分属M个作者机构,则该文章下属的每个作者机构分值为1/NM。频次A指某一机构在A篇文章中出现过的次数。此外,一些作者先后在多个机构服务过,该作者成果的机构归属,以论文发表时所署名为准。

      从高等院校(科研院所)等机构的h指数计算结果分布看(表5),h指数在10以上的机构有104家,中山大学、安徽师范大学和北京大学位列前三名,h指数前七名的高等院校从事旅游学科研究的团队全部都是以地理学为主,这再次说明地理学在旅游学科中所处的特殊地位。

      四、结论与讨论

      本文研究得出的结论与我们对国内旅游学术研究现状的直观印象基本吻合。一般来说,表5中排名靠前的学术机构,其机构名下的学术团队进入表4的人数也较多,如中山大学、安徽师范大学、华东师范大学等,由此可看出这些院校学术团队和梯队建设较为成功。也有一些学员如北京大学,虽然没有设立旅游院系,但一些从事人文地理学研究的教师及其指导的博硕士研究生每年都撰写了不少旅游学科方面的论文。所以,尽管在表4中北京大学只有一人进入h指数前百名之列,但机构排名也很靠前(表5)。也有一些旅游院校出现类似情况,可能是由于一些h指数较高教师的工作调动造成发表论文时署名的机构与目前所在的机构不一致造成的。如果将表4和表5进行多个指标综合比较的话,可以得到更多的有关学者个人、学术机构论文数量和被引数量之间关系方面的信息。利用现有的文献数据库也可以进行他引数量(剔除自引量)的统计,对h指数进行修正。还可以通过数据挖掘对引文和被引文所在学术期刊等级进行更深入的研究。

      总之,引入h指数研究2003-2012年我国旅游学术共同体的发展格局,弥补了单纯以论文数量来测度和评价学术共同体成员(如学术期刊、研究者和学术机构等)成果学术影响力和贡献度的不足,增加了旅游学术影响力的评价维度,也有利于我国旅游学术共同体走出去,参与国际学术界交流,便于国外同行从整体上认识近年来我国旅游学术共同体的发展格局。

      比较本文通过h指数计算得到的评价结果,与“前文”不尽相同,但从这两个不同的维度可以更加全面地认识我国旅游学术共同体的发展格局。然而,任何一种评价方式都难以做到完美无缺,h指数也一样。虽然《旅游学刊》的h指数高达88,说明有88篇论文至少被引用了88次,但这88篇论文作者们的个人h指数没有一人是超过20的。这就是说,h指数对作者被大量引用的某一篇或几篇文章并不敏感。因此,即使是h指数较低的作者,也可能有某一篇或几篇论文的引用量大大超过h指数较高作者的论文。此外,h指数使用的引文频次包含了作者的自引频次。因此,要克服h指数的这些弱点,还应该增加新的评价维度,如增加对于最高他引频次论文、作者最高他引频次、作者平均他引频次等单项指标的研究。更深入地看,其实不同性质的引文对于学术贡献度也不相同,即有所谓的“积极引用”和“消极引用”之分,如一些作者的论文观点明显不严谨、不科学,但由于非常“惊世骇俗”,往往成为这一领域的反面教材,从而提高了论文作者的引文频次。要区分此类的引文现象,需要利用大数据技术,对于引文文本结合语境进行语义分析,从而判定引文的性质。此外,由于研究的领域和方向不同,不同研究选题之间,论文产出的总体数量也很不平衡。目前,旅游学界对于基础理论研究还很薄弱,无论是论文数量,还是作者人数都处于边缘状态,尽管其引文频次可能不高,但不能据此就说其学术影响力和贡献度低,这就有待于进一步探索和寻找更加科学严谨、更加全面客观的评价方法。

      

      

      

      

标签:;  ;  ;  ;  

近十年中国旅游学术界成就的H指数测度与评价_第一作者论文
下载Doc文档

猜你喜欢