引文网络主要路径分析的演变与研究现状的文献计量学分析_路径分析论文

引文网络主路径分析法演化脉络及研究现状的文献计量分析,本文主要内容关键词为:引文论文,脉络论文,路径论文,分析法论文,文献论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

      1 引言

      科学文献是科学研究活动产出的主要形式,也是记录和传播科学知识的重要方式[1]。不同时期的科学文献承载着不同时期的科学创新成果,然而科学文献之间并不是相互孤立存在的,一项新的研究往往是建立在已有研究的基础上,这种知识继承的重要体现方式之一就是科学文献的引用与被引用关系,对这种关系的研究就是引文分析。引文分析对象是文献的引用与被引用关系,这种关系是一个分布式的信息网络系统[2],我们称之为引文网络。对于一个特定领域或学科来说,引文网络能够呈现出其发展历史与演化过程。如1964年加菲尔德[3]就对DNA研究领域的引文网络进行了分析,并描绘出了该领域的知识演化图谱,成为引文网络分析的经典案例。继加菲尔德之后,Goffman等[4-6]也对不同领域的引文网络进行了探究。从他们的研究成果中可得出一个重要的结论:一个特定领域或学科的诞生与发展取决于为数不多的关键文献的出现[7]。

      如何从引文网络中找出关键文献是引文分析的重要问题。有学者提出了不同的解决方案,如文献时间优先方案和高被引论文遴选方案,但这些方案提取出来的关键文献相互之间却不一定具有引用关系,从而很难科学地展示领域知识的演化脉络。为了解决这一系列问题,Hummon和Doreian[8]另辟蹊径,从图的连通性视角出发,提出了引文网络主路径分析法。主路径分析法(main path analysis)是从引文网络节点与节点的关系(即文献与文献的关系),而非仅仅从节点的入度大小(即文献被引量大小)来识别关键文献,有效地避免了高被引方法识别出来的“关键文献”可能不联系的问题,从而能够更好地刻画领域内发展脉络[7]。自提出引文网络主路径分析法以来,该方法得到不断地完善和发展,越来越多地被应用到识别各研究领域的关键文献、关键人物、关键事件中,从而概述特定领域的发展态势和知识演化过程[7]。本文旨在通过引文编年图法和主路径分析法对引文网络主路径分析法研究领域的引文网络进行分析,以发现该领域的关键文献、关键人物、关键事件,从而揭示该领域的演化脉络和发展状态。

      2 数据与方法

      2.1 数据收集

      以引文网络主路径分析法领域为研究对象,以“TS=("main path analysis" or "main path")AND TS=("citation network*" or" citation analysis*" or "citation index*" or "scient* citation" or "co*citation" or citation)”为检索式,在ISI数据库中的引文索引数据库Web of Science(Web of Science数据库共包括8000多种世界范围内最有影响力的、经过同行专家评审的高质量期刊,回溯数据目前到1970年,该数据库每周更新)内进行文献检索,检索时间为2016年2月3日,经相关性判断与整理分析,得相关文献38篇。文献时间分布见图1。

      

      2.2 研究方法和工具

      2.1 引文编年图法

      引文编年图将引文网络按时间序列进行序化,以呈现引文分布规律及其知识传播脉络。文中采用加菲尔德研究团队基于Web of Science平台开发的HistCiteTM软件系统对领域内的引文编年图进行分析和可视化。

      2.2.2 主路径分析法

      主路径分析法是以引文网络节点与节点的关系为切入点,通过主路径析取算法找出引文网络中的关键文献集合,以发现特定领域的以关键文献为参考的知识演化脉络。Pajek软件集成了主路径析取的三大算法:路径计数方法(Search Path Count,SPC)、路径链接计数方法(Search Path Link Count,SPLC)、路径节点对方法(Search Path Node Pair,SPNP)[9]。本文将借助Pajek软件,以发现引文网络主路径分析法研究领域的关键文献,描绘引文主路径图谱。

      3 引文网络主路径分析法研究领域演化脉络分析

      3.1 引文编年图分析

      将保存好的题录文本导入HistCiteTM软件系统中,以本地引文数为参考,描绘出领域内38篇文献的引文编年图,如图2。

      

      在引文网络主路径分析法研究领域的引文编年图中,共有38个圆圈节点,每个节点代表着“引文网络主路径分析法”研究领域的一篇相关文献。节点以文献在HistCiteTM中的编号命名(以下分析皆采用此编号结果),节点形状大小与LCS(本地引用次数,即在当前文献集合中被引用的次数)正相关,LCS最大值为33;图2中共有128条连接,箭头由施引文献指向被引文献;左侧的时间与文献发表年代分布一一对应,括号内表示各年发文总数量,最新文献是2016年Liu和他的同事在OMEGA-International Journal of Management Science上发表的Research fronts in data envelopment analysis,编号为38。

      从图2中可看出一些核心节点,如1、5、8、9、4、22等,这些节点的被引用频次较高,被称为高被引文献,是引文网络主路径分析法应用与发展的重要文献,也是该研究主题知识传承的关键节点。图2中还存在一些边缘孤立点,如6、14,这两个节点对引文网络主路径分析法主题演化脉络不起重要作用,文中不予讨论。其余节点虽不突出,但在引文关系网络中有着重要的连接作用。需要指出的是,文献1位于引文编年图的最上方,其LCS=33为最高值。该文献就是1989年Hummon和Doreian在Social Networks上发表的Connectivity in a citation network:the development of DNA theory,首次提出引文主路径分析方法,并以DNA研究领域为例,验证了该方法的可行性,此后与引文网络主路径分析法相关的研究在此基础上逐步展开[10]。

      3.2 基于主路径分析法的关键文献发现与领域演化路径提取

      将HistCite中的作图信息保存为.net文件并导入Pajek软件中,采用其集成的SPC、SPLC、SPNP三大算法提取领域内关键文献及其演化主路径。结果显示,SPC和SPLC析取算法的输出结果在关键文献和主路径上完全相同(见图3),而SPNP析取算法输出的主路径与前两者相比没有1→4这条知识扩散路径(见图4),但总体来说三大算法所识别出的主路径具有较高的稳定性[11]。

      

      

      图3和图4中描绘的主路径是引文网络主路径分析法研究领域的主干架构,显示了其研究的知识扩散主要路径和领域演化脉络。从计算结果来看,引文网络主路径分析法研究领域的引文网络中共析取出9篇关键文献(详见下页表1),图3和图4中每个节点代表一篇关键文献,有向箭头表示施引文献对被引文献的引用关系,节点间连线上的数值是该连接的重要程度权重值(该权重越大则表示两节点间的连接在领域知识演化中的重要性越大)。可以发现主路径构成中的早期文献有较大优势,这体现了主路径具有一定的先发效应[11],即在主路径开始阶段有1→2→4,1→3→4,1→4等不同的知识扩散路径,随后有且仅有一条通路构成知识扩散路径。由图3可见,作者Hummon出现4次,作者Liu出现3次,Moore和Chuang各出现1次。Hummon和Liu是引文网络主路径分析法研究领域的两个核心作者,即重要贡献人或关键人物,对引文网络主路径分析法的发展起到了关键作用。

      3.3 引文网络主路径分析法发展脉络分析

      通过对主路径算法析取的关键文献(见下页表1)的主题分析,发现主路径研究方法在历史上发展有三个重要阶段,需要指出的是,Batagelj[13-14]主路径分析方法的发展做出了重要贡献:他提出了更有效的主路径算法SPC(the Search Path Count),并将主路径SPC、SPLC、SPNP三大算法集成到社会网络分析软件Pajek中,为主路径分析法的优化推广及应用作出了重大努力。Batagelj的研究成果以专著出版或会议论文形式出现,其引文数据信息没有被收录到Web of Science中,故而通过主路径算法析取的关键文献中没有他的研究成果,但经对发现的主路径关键文献的研读,发现其相关研究成果的重要性及影响力足以成为该领域发展的一个重要拐点。这也说明,主路径分析法对引文数据的完整性依赖较强,在数据非完整情况下,主路径分析法最大的作用在于从复杂的引文网路中找到部分关键文献,以为研究某领域主题演化提供研究线索,进而分析领域主题演化全貌。

      (1)第一阶段:引文网络主路径分析法的提出与验证推广。1989年Hummon和Doreian[7]提出了一种完全不同于以往的引文网络分析法——通过使用变型的深度优先算法来发现特定领域或学科的主流文献(the mainstream of the literature),进而发现该领域的知识传播脉络,并且利用Garfield等人[15]已经证实的文献数据对此方法进行验证。随后Hummon等[16]于1990~1993间发表多篇关于引文网络主路径分析法的相关研究文献,一方面进一步检验了主路径分析法的可用性和可信性;另一方面,对该方法的应用推广做出了重大贡献,主要代表有编号2~4的文献[16-18]。至此,主路径分析法成为公认的引文网络分析的重要方法之一,并作为一种研究工具被不同领域专家应用到各自领域知识演化脉络分析或知识传播主路径分析中,取得了较多的研究成果。其中最典型的跨领域应用的代表为编号7的文献,该文中,Moore等人将主路径方法用于分析公共健康社会资本引文网络中,发现了公共健康社会资本概念的演化主路径,进而得到公共健康社会资本研究领域的知识起源、有影响力的文献及其演化情况。

      (2)第二阶段:引文网络主路径分析法算法优化与集成软件推广。社会网络分析学家Batagelj[13]敏锐地注意到主路径分析法的价值和意义,在对Hummon提出的NPPC、SPLC、SPNP三大主路径算法基础上提出了更优化的SPC算法,并将SPC、SPLC、SPNP三大算法集成到社会网络分析软件Pajek中,并于2003年对其进行了全面公开的描述和说明。他的这一贡献使主路径分析法操作程序变得简化,对主路径分析法的应用推广作出了重大贡献,其后的大多数有关主路径分析法应用与研究都是在SPC、SPLC、SPNP三大算法及Pajek软件基础上进行的。

      

      

      (3)第三阶段:引文网络主路径方法的变型与新应用阶段。继Batagelj等人提出优化的主路径算法之后,该方法的另一个发展时期以Liu John S等人于2012年发表的An integrated approach for main path analysis:Development of the Hirsch index as an example为标识[10]。该文指出“经典”主路径分析法(classical main path analysis)存在的诸多局限性,进而在“经典”主路径分析法基础上提出了包括全局主路径分析法(the global main path)、后向局部主路径分析法(the backward local main path)、多主路径分析法(multiple main paths)、关键路径分析法(key-route main paths)等方法在内的综合主路径分析法(详见图5),这一综合分析方法与之前的主路径分析方法相比,主要优于其视角的多样化,通过这些变型的主路径分析法,研究者能够从更广泛的视角揭示特定领域或学科演化发展历史。Liu等人[10]以H指数(Hirsh Index)研究领域为例,发现综合主路径分析方法“捕捉”到了原始主路径分析方法所没有“捕捉”到的多条领域演化主路径。此后,Liu和他的研究团队对综合主路径分析法进行了验证和应用推广,代表文献为[20-22],其对应的编号为25、35和38。随着研究向广度和深度发展,综合主路径分析法也逐渐被专家学者应用到自己的研究领域,这是Hummon提出引文网络主路径分析法后,此方法研究的重大发展,时至今日,引文网络主路径分析方法作为文献计量学中的重要方法,已经成为不可缺少的研究工具,其与知识图谱方法、寻径网络算法、HistCite软件的整合使用更是为控制复杂结构的网络、分析知识传播路径提供了系统性方法[8]。

      4 研究结论

      (1)通过引文编年图分析和主路径分析,并结合内容分析,对引文网络主路径分析法研究领域的引文网络进行挖掘分析。从38篇文献中找到9篇关键文献(见表1),发现了以文献为载体的引文网络主路径分析法研究领域知识演化主路径,对析取的关键文献进一步的内容分析后发现,促进主路径分析法的发展有三大“重要事件”和三大“核心人物”,以此划分为该领域发展的三个阶段。经过不断地发展和演化该方法日臻成熟,对特定领域或学科的知识演化脉络的分析更加全面,更加准确。

      

      (2)结合国内外引文网络主路径分析法研究来看,中国大陆对此方法的引入较晚,最早由国内学者韩毅在2010年第六届中国科技政策与管理学术年会上公开引入引文网络主路径分析法。随后韩毅等人对主路径分析法展开了深入的剖析与研究[7,11-12,22-24],为国内引文网络主路径分析法的应用推广做出了重大贡献。相较于中国大陆,台湾学者的表现更为积极,以Liu为代表的台湾研究者,在发现“经典”主路径分析法的局限性的基础上,提出了综合主路径分析法,可以说是对主路径分析法的发展与完善,从而使得主路径分析法成为引文网络分析的一个系统性分析方法。

      (3)引文网络主路径分析法是建立在引文网络的基础上的,对数据的完整性依赖较高,可以说数据的完整性决定了分析结果的准确性。为了避免分析结果的不准确或片面性,还需要通过对析取的关键文献做进一步的内容分析,文献计量分析与文献内容分析相结合,才能更加精准地揭示特定领域的发展历史或主题演化脉络。

      5 结语

      引文网络主路径分析法是文献计量方法的重要组成部分,经历了诞生与发展的过程。本文通过文献计量分析法,并结合内容分析,提取出了该领域的关键文献,发现了该领域的关键人物和关键事件,进而将引文网络主路径分析法的发展分为三个重要阶段,并详细阐述了各阶段的发展情况,从而描绘出该领域的演化历史,以期为各领域研究者对此方法的认识和应用提供科学参考。需要指出的是主路径分析法析取的关键文献是形式上的“知识”,以文献为单位,其分析得出的领域演化脉络是粗线条的,还不能够直接反映以“知识”为单位的演化脉络,这也是此方法在未来很长一段时间内需要解决的难题,当然此问题的解决依赖于知识计量相关研究的进步和发展,故而现阶段的主路径分析还应佐以文献内容分析或与其他方法(如知识图谱方法、PFNET、引文编年图分析)整合使用,从而达到分析结果更为精准的目的。

标签:;  ;  ;  

引文网络主要路径分析的演变与研究现状的文献计量学分析_路径分析论文
下载Doc文档

猜你喜欢