网络环境下引文分析与评价方法的再认识_文献分析法论文

网络环境下引文分析与评价方法的再认识_文献分析法论文

对网络环境下引文分析评价方法的再认识,本文主要内容关键词为:再认论文,引文论文,评价论文,环境论文,方法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 引文分析的评价功能和影响因素

引文分析是利用各种数理统计和比较、归纳、抽象等逻辑方法,对期刊、论文、著者等对象的引用或被引用现象进行分析,以揭示其数量特征和内在规律的一种文献计量研究方法。近年来,利用引文分析的定量评价方式对个人、机构的科研成果和水平进行评价越来越普及。

1.1 评价期刊的价值

引文分析是确定核心期刊的常用方法之一,主要从文献被利用的角度来评价和选择期刊。对于来源期刊引文的分布呈现明显的集中与分散趋势。期刊的被引用次数反映了该期刊读者的多少,间接反映出该期刊在某一专业领域中的影响力。研究期刊引文的分布可以科学地评价和选择期刊,不仅可以确定某个学科的核心期刊,还可以确定与专业关系比较密切的期刊,可得出刊物在相关领域内的学术地位。期刊的学术价值可以采用“影响因子”来表示,某期刊发表的论文被引用次数越多,即影响因子越大,说明该刊的影响越大,质量越高。如美国的《科学》(Science)和英国的《自然》(Nature)的影响因子都比较高,因而被公认是权威的学术期刊。引文分析还可以用来研究期刊论文老化规律。对引文的年代分布曲线进行分析,可以测定各学科期刊的“半衰期”和“最大引文年限”,从而为制定文献的最佳收藏年限进行定量分析提供依据。

1.2 评价用户的信息需求

根据文献的引文情况可以研究用户的信息需求特点。一般来说,附在论文末尾的参考文献是用户所需要的最有代表性的主要参考文献,基本上反映出用户信息需求的主要特点。对用户群体的引文分析研究,还可以建立用户行为模型,有针对性地提供信息服务。例如,引文分析法对确定期刊语种比例具有参考作用。期刊管理人员要想确定本馆期刊合理的语种结构,就必须找到订购各语种期刊的依据,而引文的语种分布对确定合理的馆藏期刊语种结构有重要的实用意义,通过对本馆读者在一定时期内发表学术论文的语种进行引文分析,能揭示出读者掌握各语种的人数及对各语种期刊的需求情况。

1.3 评价学科的相互关系与发展规律

引文通常都具有一些基本要素和特征,例如文献类型、学科主题、语种、出版年代、引文来源等。按不同的要素和特征进行描述,可以得到引文的各种分布类型。如按出版年代、学科主题、文献类型等的分布类型的研究可揭示文献信息在科学交流系统中的规律。引文与被引文之间往往有着学科内容上的联系,具有在学科上的相关性和在时间上的继承性。通过引文聚类分析,可以探明有关学科之间的亲缘关系和结构特点,发现某学科的作者群体,分析推测学科间的交叉、渗透和衍生趋势,还能对某一学科的产生背景、发展概貌、相互渗透情况和发展方向进行分析,从而揭示科学的动态结构和某些发展变化规律,为制定有关学科的发展规划提供依据。

1.4 评价人才的学术水平和影响

在人才评价方面,国际上通常采用引文分析方法,这是因为某著者的论文被引用的程度可作为衡量该文的学术价值和影响的一种测度,同时也从科研成果被利用的角度反映了该著者在本学科领域内的影响和地位。因此,引文数据为人才评价提供了定量依据。加菲尔德曾经利用《科学引文索引》进行统计,以此来评选杰出的科学家,并成功预测出多位诺贝尔奖金获得者。从对历年诺贝尔奖金获得者的论文被引用情况的统计来看,物理学、化学等领域中诺贝尔奖金获得者,其论文被引次数都是比较高的。

1.5 评价科研工作的绩效

过去科学研究成果的评价主要依靠专家的定性分析,受主观因素影响较大。随论文数量增加,用定性分析方法评价科研工作的绩效变得越来越困难。近年来国际上越来越多利用引文分析来评价科研绩效。论文是否被引用和被引用的多少可以说明它对研究工作的影响和作用。据美国科学信息研究所统计,出版发行的大量论文中被引用的只是其中一部分,而长期大量被引用的更是很少一部分。论文被引用的次数越多,就可以认为作者的影响越大。对一个国家而言,有多少刊物进入科学引文索引(SCI)数据库及影响因子如何,成为衡量这个国家科研实力及学科地位的尺度之一。我国自1989年起引入SCI国外工具作为科技工作评价依据,并对科研机构和高等院校的科研产出进行评价和排序,以此反映各个单位的科研水平。网大(中国)有限公司主持的中国大学排行榜中科研成果排序也利用了科学引文索引工具的数据。

引文分析评价法虽然具有不同的功能和意义,但目前并不完善,根本原因在于引用是一种复杂的过程,引用分析仅是宏观的、表面的联系和测度。影响引文分析有效性的因素是多方面的,其中主要有:(1)受制于文献的可获得性,通常作者选用的参考文献以方便获得为准,因此引文并不一定是最好和最恰当的;(2)引用动机具有复杂性,文献被引用并不完全等于重要,被引次数较少乃至于未被引用的不能一概认为不重要,但在引文分析中通常只在引用频率上反映,对引用动机不加区别,因而结果往往是不全面的;(3)引文方式具有多样性,引文价值也不一样。目前引文分析一般只考察引文的数量,而批评性的引证并不能表征被引用论文的质量。不加区别地依据被引用量来进行引文分析难免会失之偏颇。(4)不同学科引用具有差异性,由于不同的学科研究内容和研究方法不同,从而决定了不同学科具有不同的引文模式和规律。此外,不同类型的文献也具有各自的特点,它的被引率也会受到影响。(5)编辑部门对参考文献处理方法不同,也会影响引文分析的有效性。(6)引文分析技术的有效性,目前引文分析手段比较落后,大部分引文检索工具都存在一些不足,利用它们进行分析评价会有一定的局限性。如采用手工统计分析难免会出现错漏,有些问题不借助计算机等先进工具也难以得出正确的结论。

2 网络化对引文分析评价方法的影响

随着网络技术和电子出版的发展,网络电子出版物已逐步成为人们获取信息的重要来源。目前国内外出版的论文的参考文献中,已经有不少以网址形式出现的参考文献,并且所占的比例越来越大,网络文献正逐渐成为论文的重要参考文献。因此,引文类型和引用方式的变化给引文分析评价法带来许多挑战。

2.1 引用文献的来源进一步扩大

在网络环境下,人们获取信息的途径已经十分便捷,参考文献来源的时空限制将日益缩小,被引文献的易得性增强;引文的直接引用将进一步增加,转引行为将会大幅度减少;作者实际使用的参考文献和所列引文也将会与其论文关系更加密切,引文分析结果的可靠性也将进一步提高。同时,在全文数据库中,可以方便地找出引用文献的全文内容并与来源文献引证处的内容加以比较,对了解引用者引用动机、分析其引用行为提供了便利,并将使引文分析评价在更具体、更精确的层次上进行。

2.2 网络引用文献的时间差在缩短

时效性强、发行简便是网络出版的突出特点。网络出版发行使文献的出版周期大大缩短,就文献的发表时间和引用者的使用时间的间隔来看,网络参考文献时差相对较短。参考文献的时效性问题关系到科研成果的质量和水平,它反映了文献对当前研究动态的掌握情况。网络参考文献时效性强的特点使参考最新文献这一原则能够得到最大程度的满足和实现。充分利用网络参考文献,可以改变过去论著的引用文献过于陈旧的状况。

2.3 网络引用文献的载体具有多样性

传统的参考文献如期刊只能提供文字等静态信息,而网络文献却可以通过多媒体提供多种形式的信息,它集文本、动静态图像、图形和声音视频等于一身,可使人们在阅读文本的同时看到相关的图像或影像,甚至还可以听到相关的音乐或解说。网络文献信息载体的多样性与灵活性使得网络引用文献能够很好地说明、解释与验证文中的内容,使其评价的功能得到更好的发挥。但目前我们对多媒体文献的引用机理和分析评价方法还是空白。

2.4 网络引用文献的链接比较灵活

以纸张等为载体的参考文献,所提供给使用者的信息是固定的,使用者若想进一步了解有关的信息时,则不得不去寻找另外的图书、杂志等。网络文献通过超文本方式,可使有关的信息与该文献以一定的方式链接。网络引用文献链接比较丰富,使参考文献引用中的转引现象大大减少甚至被消除。而且,网络引用文献上所链接的许多信息,对实现参考文献的多种功能有较大的帮助,便于用户的检索和查找。查阅者只要在浏览器地址栏中键人某一网络参考文献的网址,或通过超文本链接就可以方便地查阅相关的文献。

2.5 网络参考文献的稳定性较差

网络文献的更新和变化快。网上每天都增加大量新的网站,网页的数量每时每刻都在发生新的变化,网络信息资源老化具有不确定性。作为引文的网络文献,大多是从某网页中获得的,而网页的不断更新维护会使该文献在一定时间后消失,也有可能因各种原因关闭不能链接,即使编制有引文索引,也无法从引文入手,进一步了解和查询相关信息。许多网络出版物的出版者并不在网络上长期保存信息,旧的网络文献较难在网上找到。有的可能因时间排列顺序已经消失,甚至网站也可能因各种原因关闭或无法链接,有时无法进一步了解和查询相关的文献。因此,网络文献的稳定性和安全性无法保障。

2.6 网络引用文献的著录需要规范

目前网络文献引文还没有统一的著录项目和著录格式,著录方式五花八门,有的甚至只列出网站名称;有的将网址标识“http://”统统省略掉,只著录其后的部分,显得相当杂乱;有的引文著录文献题名和网址,分为两段或连续著录,无引文著录特有的标识符号;有的只著录文献信息所在的网址,没有具体文件名称;还有的在网址后用括号标注网络文献获得的具体时间,有的则没有。如此等等,给引文分析评价带来许多困难。网络文献著录内容比较复杂,如何准确地著录需要进行探讨。

2.7 网络文献对分析工具有较大的影响

网络文献具有超文本连接、快速更新和分布较广的特点,一方面为引文分析开辟了新的研究领域,另一方面也对传统的评价方法提出了挑战。网络文献引文评价功能等问题会随网络环境的变化而不断增加。在目前的引文分析中,只要统计参考文献的数据即可完成分析任务,而网络文献的引用关系十分复杂。网页既有论文引用的参考文献,又有网页之间包含的链接关系。网页的链接机制与引文机制有许多相似之处,但也存在一些区别。网页链接的数据已经数字化,可以利用计算机自动操作,交互性强,并能对有关的数据进行多方面的深度分析。网页链接的范围较广,除了引证外,还包括参考、应用、相关等,有时甚至是一些意义不太大的广告;链接涉及的载体类型多,动态性强、数量多、数据量大。因此,编制网络文献引文分析工具和进行相关的分析有许多新的问题需要进一步研究。

3 引文分析评价方法的改进

引文分析评价具有其他一些分析方法不能替代的作用,但由于各种因素的影响,特别是网络环境下提出了许多新的问题,其有效性受到一定的局限。为了更客观地描述引文事实,深入地反映引用现象所揭示出来的本质,尽量减少评价的偏差,应该采取一定的改进措施,使其进一步完善,更好地充分发挥其评价分析的作用。

3.1 规范引用文献的方式

要充分发挥引文分析评价的作用,首先需要引文本身的规范。目前引文的著录完整性和准确性较差,为了使引文统计数据比较真实地反映引用事实,必须规范文献引用行为。首先要规定学术论著一般都应附有参考文献,以说明其学术渊源。其次要求作者列出的参考文献应实事求是,只能列出确实参考过的、并有参考价值的文献,减少无关的引文和伪注。再次要根据作者利用文献的方式,分为参考文献、引用文献、注等不同类型,便于从质的方面考察引文现象。最后要规范参考文献的表达方式,著录引文要严格按照国家规定的格式。期刊编辑在编发论文时,要把参考文献作为不可缺少的有机组成部分,不能因各种原因省略或缩减;而且要按有关规定格式进行编排。目前应尽快制定引用网络文献的规范和标准。

3.2 改进引文数据的统计方法

目前我国引文分析研究大多以个体为主,由于在网络环境下引文量大、分布广泛并且关系复杂,要提高引文分析有效性,关键是统计数据要准确,因此要加强合作。当前特别要注意利用现代化技术手段处理和利用引文数据,全面收集引证数据,保证数据的充分性。引文分析的引证数据不全面,其结果便不正确,适用性也不强。利用计算机对有关问题进行分析、判断和推理,不仅能提高效率,而且能提高准确性。引文是由测度指标来衡量的,应该根据不同的需要制定不同角度进行引文测度的各种指标。如在引文分析中加入引文方式及引用程度评价因子进行深入的分析,对于发现引文规律,全面客观地评价引文将具有实际的意义。

3.3 建立数字化网络化的引文评价工具

美国于1962年出版了《科学引文索引》,以后创建了《社会科学引文索引》和《艺术与人文科学引文索引》,近年来还开发了网络型引文分析工具“Web of Science”,组成了庞大的引文分析工具系统,在学术研究和评价工作中日益显示出重要作用。《科学引文索引》已经成为国际公认的对科学期刊、科研成果水平进行客观的定量评价的权威工具。近年来,我国相应建立了中国科学引文数据库和中国科技文献引文数据库,南京大学研制开发电子版《中文社会科学引文索引》,并且在网上提供检索服务。这些引文数据库对我国的引文分析评价起到很大的作用,但目前仍然存在一定的问题。应加强我国引文数据库的规范化建设,逐步确立统一的引文数据评价标准,使引文定量评价工作更加准确和合理。要加强对有关的数据资源开发利用,进一步提高效益。

3.4 完善引文分析评价方法

当前的引文分析仍然处于经验描述阶段,对引文现象的本质进行定量研究还显得不够,科学的数学模型公式还很少,由此导致引文分析结论不够精确和深入。目前国外已运用概率论、矩阵模型、聚类分析、多元回归分析、模糊数学等方法进行引文分析,从而更准确地揭示引用规律,得出相应的科学结论。因此,要注意应用数学、统计学、计算机技术等相关学科的成果,使分析更加精确和科学。要注意各种影响因子的运用,要注意将引文分析法与其他方法结合起来,不断改进引文分析方法,提高引文分析结论的科学性。

3.5 注意与其他评价方法相结合

目前引文分析一般是以单个学科为对象,依靠单一方法。作为一种研究方法,引文分析有其优点,但同时也有它的不足。所以,在实际应用中就应该和其它方法结合起来,互相取长补短,进行综合比较分析。如确定核心期刊,除了引文分析法外,还有布拉德福定律法、文献法、累积百分比法、多元回归分析、相关分析法、问卷调查法、层次分析法和流通率法等,都可用以判断期刊的重要性,但它们各有特点,因此可以采取综合的评价分析方法。此外,引文指标也不可能完全反映期刊的整体质量。对期刊的综合评价应包括政治质量、编辑质量、印刷质量及发行数量等多项指标,引文指标只是评价期刊的多项指标之一。又如,利用引文分析法评价科研成果绩效时,除了利用引文分析的测评指标外,还要对科研成果的研究者实际工作能力进行客观评价。

3.6 充分利用现代信息技术进行分析

引文分析评价研究手段的信息化是一种发展趋势。随着引文分析应用范围的拓宽,新的分析方法和指标体系层出不穷,引文统计的数量越来越大,数据的时间跨度也越来越长,传统的手工方式已远不能满足高层次分析的需求。计算机和网络技术的不断发展,给引文分析评价提供了条件。在处理数据方面,计算机具有独特的功能和极高的效率,可及时更新数据、统计极其容易,可方便地获得动态数据;还可进行复杂的计算与模型处理,能对收集到的数据进行深度开发。计算机辅助引文分析将为解决引文分析评价所需要的数据和分析统计等提供强有力的技术支持,为引文分析的正确性和可靠性提供保障。目前应当加强对引文分析的数据库、数据仓库、多维联机数据分析、数据挖掘和知识发现等方面应用的研究。

3.7 加强网络化引用行为的研究

目前网络文献的稳定性和著录规范化等问题尚未解决,与引文分析评价的要求有一定的距离。尽管存在许多问题,网络文献作为引文是一种客观存在和发展趋势。根据网络文献的引用链接结构,可以了解网络信息的分布情况,掌握网络信息交流规律;可以分析站点的集中度和联系程度,确定核心信息来源;可以优化网络站点的结构,进行合理配置资源;有助于网络信息资源的开发利用;有利于研究网上的信息交流和学科知识结构特点,掌握学科发展状况和发展趋势。总的来说,研究网络环境下引用行为具有十分重要的意义,网络的引用分析评价问题还有待进一步探讨。

收稿日期:2004-01-19

标签:;  ;  ;  ;  ;  ;  ;  

网络环境下引文分析与评价方法的再认识_文献分析法论文
下载Doc文档

猜你喜欢