基于对象行为的信息关注模型研究_计算机科学论文

基于对象行为的情报关注模型研究,本文主要内容关键词为:情报论文,模型论文,对象论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

在“大科学”时代背景下,合作现象在科研活动中迅速扩展,并引起了科学家和科研决策者们的广泛兴趣[1]。从理论上说,合作研究,尤其是国际合作研究,能集中众多优秀研究者的智慧,为研究者们提供更丰富的研究思想、方法和资源,从而提高科研产出的数量和质量[2]。因此,人们往往认为,国际合作研究的成果应该具有更高的影响力。然而,科研合作实际上是一种非常复杂的现象,容易受到社会环境、技术条件、科技政策等各种因素的影响[3],国际合作更是如此。国际合作是否确实能促进科学研究的发展?国际化程度和科研成果的影响力之间是否真的存在相关关系?

围绕这些问题,众多研究者们从不同的学科角度对不同国家地区的情况展开了实证研究。Glnzel在2011年的研究中发现,在全球的化学领域研究中,国际合著论文比单一国度论文具有更高的平均被引频次,但是合作强度和被引情况之间不存在相关关系[4]。Leimu和Koricheva研究了不同类型的合作对1998—2000年期间发表在Oecologia上的论文被引频次的影响,发现跨学科合作提高了被引频次,但国际合作对被引频次没有影响[5]。Adams等人在2007年提交给英国科学创新国家办公室(UK Office of Science and Innovation)的报告中指出,国际合作研究成果的平均影响力明显高于所有成果的平均影响力[6]。上述相关研究表明,合作与被引之间的关系会因学科、国家的差异而不同。本文以我国计算机科学领域为对象来开展实证研究,试图回答这样几个问题:国际合作是否能提高我国计算机科学领域研究成果的影响力?如果是,两者之间的关联程度有多大?是否所有的国际合作、所有的国家都对科研影响力发挥了促进作用?

1 数据来源与研究方法

1.1 数据来源

SCIE是Web of Science(WoS)的一个子库,由美国科技信息所(ISI)出版。SCIE收录了自然科学领域大量高影响力的国际学术期刊,是检索科学技术文献的权威工具。它不仅提供最新的科研文献,同时还统计了它们的被引数据。因此,本文选择WoS作为数据检索平台。具体检索方式为:将“Citation Databases”限定为“Science Citation Index Expanded(SCI-EXPANDED)—1999-present”,检索式为SU=“Computer Science” and AD=“Peoples R China”;考虑到论文发表与被引之间的时滞性,选择了2007—2009年期间发表的论文作为分析对象,因此“Timespan”被设定为2007-01-01至2009-12-31。笔者下载了检索结果中的所有文献记录共11 986条,检索和下载日期为2012年11月30日。

1.2 研究方法

首先提取每一条文献记录中的被引频次字段和地址字段,从地址信息中抽取了国家信息,并统计了每条文献的国家数量。其中,England、Wales和Scotland的数据被合并到UK的数据中。然后,比较了国内论文(由国内作者独著的论文或所有作者都是国内作者的论文,下同)和国际合作论文(由两国或多国作者合作完成的论文,下同)被引频次,以检验国际合作论文是否具有比国内论文更高的影响力。相关性分析是研究两个或多个变量之间关联程度的一种有效的分析方法,为了进一步分析被引频次与国际合作之间是否存在相关性,并确定其相关程度,笔者使用SPSS软件展开了相关性分析;为了了解具有不同的国家数量的论文的被引情况,开展了比较分析。最后,分析了合作网络,以找出与我国合作最频繁的国家,以及对提高我国计算机科学领域科学研究影响力贡献最大的国家。

2 研究结果

2.1 基本指标

在所有11 986篇文献中,8253篇由我国作者撰写,3733篇由两国或多国作者合作完成。其中,国际化程度最高的论文由来自7个国家的作者合作完成。

合作率和合作度是衡量合作程度的最常用的两个指标。根据合作率和合作度的计算公式,笔者提出了国际合作率和国际合作度,它们的计算公式如下:

国际合作率=国际合作论文数量/论文总数

国际合作度=国家总数/论文总数

本文研究的11 986篇文献的国际合作率为3733/11986=0.3114,国际合作度为16410/11986=1.3690,这两个指标的数值都不高,说明我国计算机科学领域的科研活动中的国际合作程度处于较低水平。

国内论文的平均被引频次为6.162,最高被引频次为169;而国际合作论文的平均被引频次为8.650,最高被引频次为836。因此,从基本指标来看,国际合作论文的被引情况在总体上优于国内论文。

2.2 相关性分析

笔者使用SPSS 13.0实现了相关性分析,以研究国家数量和被引频次两个变量之间的关联程度。

为了初步观察这两个变量之间是否存在相关趋势,将X轴设定为国家数,Y轴设定为被引频次,使用SPSS绘制了散点图,如图1所示。

图1 国家数量与被引频次分布的散点图

图1显示,由2个或3个国家合作撰写的论文更有可能获得200次以上的被引频次,由4个以上国家合作撰写的论文获得0次被引的可能性更低。然而,该散点图并没有表现出国家数量与被引频次之间的相关性趋势,且被引频次位于0~150之间的散点过于密集,不能清晰地展示该区段的散点分布情况。

为了进一步确定两个变量之间是否存在相关关系并定量分析相关程度,笔者在SPSS软件中依次使用“Analyze”—“Correlation”—“Bivariate”菜单,并选择。Pearson作为相关系数选项,选择Two-tailed作为显著性检验选项,实现了相关性分析。相关性分析的结果如图2所示。

图2 相关性分析结果

图2显示,该相关性分析的皮尔逊系数为0.124,大于0而小于0.3,这说明国家数量和被引频次之间虽然存在正相关关系,但关系程度非常微弱。也就是说当国家数量增大时被引频次会随之增大,但增长幅度不明显。

2.3 比较分析

表1列出了具有不同国家数量的论文的被引情况,包括论文数量、论文比例、最高被引频次、平均被引频次、最低被引频次。从表1可以看出,国家数量越大,论文数量越少,大多数论文仅由一国(中国)作者完成。国际合作论文中的一半以上是由两个国家(中国和一个其他国家)的作者完成。由4个、5个或7个国家的作者完成的论文数量极少。没有由6个国家的作者完成的论文。

由2个或3个国家的作者合作完成的论文的最高被引频次明显高于国内论文。另外,由4~7个国家的作者合作完成的论文的最高被引频次也同样很低,这可能是由于论文数量较少(共70篇)的缘故,毕竟过低的样本量不具备足够的代表性。

如果把视角切换到平均被引频次和最低被引频次,则国际合作论文显示出了它们的优越性。所有的国际合作论文(尤其是由5个国家的作者合作完成的论文)的平均被引频次都大于国内论文的平均被引频次。由1~5个国家合作完成的论文的最低被引频次都是0,而具有最大国家数量(7个国家)的论文的最低被引频次为2,不存在未被引用过的论文。

为了具体了解具有不同国家数量的论文的被引频次分布情况,笔者将被引频次划分为6个区间,即0,1~10,11~20,21~50,51~100,以及100以上。由于高被引频次的论文较少而低被引频次的论文较多,因此使用了不等距划分的方式。图3所示的是使用Excel绘制的条形图。

图3 不同国家数量的论文的被引频次区间分布

图3左侧的数字表示国家数量,图中的每一种填充图案表示一个被引频次区间,条形的长度表示被引频次位于该区间的论文数量在具有左侧数字所示国家数量的论文总数中所占的百分比。

图3显示,当国家数量为1~4个或7个时,代表11~20这个区间的条形总是最长。只有当国家数量为5时才出现了唯一的例外。也就是说,除了由5个国家的作者合作完成的论文以外,大多数论文的被引频次都位于11~20之间。从国家数量为1~4的论文的情况来看,最明显的趋势是,当国家数量增大时,代表11~20这个区间的条形的长度逐渐缩小,但仍然是所有条形中最长的。而代表其他区间的条形并没有表现出任何趋势。至于由5个国家的作者合作完成的论文,它们中33.33%的被引频次为0,22.22%位于11~20这个区间,其余的论文平均分布在其他4个区间。由7个国家的作者合作完成的论文中,2/3的论文位于11~20这个区间,1/3的论文被引用0~10次,没有分布在其余4个区间的论文。总之,图3没有表现出被引频次随国家数量增长的趋势。

2.4 合作网络分析

现在把目光聚焦于各个国家在提高我国计算机科学研究的影响力方面所发挥的不同影响与作用上。根据上文的分析已经知道,国际合作论文的被引频次分布和国内论文一样离散而不均匀。那么哪些国家和我国合作次数最多,哪些国家发挥了正面的影响,哪些发挥了负面的影响?为了回答这些问题,笔者使用自编程序生成了国家合作矩阵,然后使用可视化软件Netdraw绘制了合作网络图。

完整的合作网络图如图4所示,图中每个节点表示一个国家。除了我国以外的其他节点的面积大小由与该国合作的论文的平均被引频次来决定,我国的节点面积由国内论文的平均被引频次决定。节点之间的连线表示两个国家之间存在合作关系。线条粗细由关系强度,即两国合作发表的论文数量来决定。

2007—2009年,在计算机科学领域的科学研究活动中,我国与65个国家之间存在合作关系,平均合作次数为68.06。图4显示,在不考虑合作频次的前提下,与丹麦、委内瑞拉、阿曼、哥伦比亚、古巴等国合作的论文平均被引频次最高。

由于图4所示网络图连线过于密集,无法显示各国与我国合作关系的紧密程度。为了找出合作频次最高的国家,笔者将网络阈值设置为20,重新绘制了合作网络图,如图5所示。

由图5可以看出,与我国合作发表论文不少于20篇的国家有21个,其中美国与我国的合作频次高达1502次,也就是说,接近一半的国际合作论文都有美国作者的参与。与英国、加拿大、澳大利亚、新加坡、日本、法国、韩国、德国8国的合作频次也分别都在100次以上。

图4 完整的国际合作网络图

图5 阈值为20的国际合作网络图

这21个国家中,除了爱尔兰和挪威以外,与其余19个国家合作的论文的平均被引频次都大于国内论文的平均被引频次,也就是说,这19个国家不仅与我国合作关系密切,并且对我国计算机科学研究的影响力发挥了正面影响,其中以丹麦最为突出,其平均被引频次为35.27,与西班牙、英国、以色列、新西兰、奥地利、加拿大、芬兰、美国、新加坡、澳大利亚10国合作的论文的平均被引频次也在8以上。

爱尔兰和挪威两国虽然与我国合作较多,但对我国计算机科学领域的科研影响力未发挥积极影响。

与阿曼、委内瑞拉、哥伦比亚、斯洛伐克、古巴、卡塔尔、捷克、孟加拉国等国合作的论文虽然被引频次很高,但由于合作频次过低(小于等于5次),较容易受到各种偶然因素的影响,因此不足以显示其在促进我国计算机科学领域科研影响力方面是否具有稳定的积极作用。

而摩洛哥、科威特、乌克兰、朝鲜、马其顿、韩国、阿尔及利亚等国则不但合作极少,与其合作的论文的被引频次也很低。当然,同样由于合作频次过低的关系,不能断定其必然对我国计算机科学领域的科研影响力发挥了负面影响。

3 结束语

本文的主要研究结论是,在计算机科学领域,国际合作论文的被引情况总体优于国内论文,国家数量与论文的被引频次之间存在微弱的正相关关系。

相关性分析的结果中的皮尔逊系数大于0,这证明国家数量与被引频次之间的确存在正相关关系。与国内论文相比,国际合作论文获得0次被引的可能性更小,它们的最高被引频次明显大于国内论文。然而,图1所示的散点图、图3所示的条形图以及表1所示不同国家数量论文的平均被引频次却表明,被引频次与国家数量之间不存在明显的增长趋势。

在计算机科学领域,我国在2007—2009年期间共与65个国家存在合作关系。其中19个国家不仅与我国合作密切且在提高研究成果影响力方面发挥了积极作用,它们是美国、英国、加拿大、澳大利亚、新加坡、日本、法国、韩国、德国、荷兰、比利时、西班牙、意大利、新西兰、瑞士、丹麦、以色列、奥地利和芬兰。其他46个国家的影响与作用则各不相同。

总之,在我国计算机科学领域的科学研究中,国际合作在提高科研成果影响力方面并没有发挥显著的促进作用,这与笔者预期的情况不太一致。当国家数量增大,即国际合作程度增大时,论文的被引频次并没有随时明显提高。部分国家发挥了显著的积极作用,而另一些国家作用并不显著甚至发挥了负面影响。

当然,研究结论有其局限性。首先,本研究是基于上文所述的3个假设前提,然而事实并不总是符合这3个假设,科研成果并不是全部以论文形式出现,它们的影响力并非完全体现为被引频次,国际合作研究也并不一定会有科研论文产出,那些不符合假设的情况无法被纳入研究范围,这在一定程度上会影响研究结论的准确性。其次,国内论文不仅包括在国外期刊或国际会议论文集中发表的外文论文,还包括在国内期刊发表的中文论文,但是由于数据统计平台的差异,将中文数据库中收录的中文论文的被引频次与WoS中收录的外文论文的被引频次进行比较显然是不科学的,因此中文论文未纳入本文的研究对象。最后,作为一个实证研究,仅研究了我国计算机科学领域2007—2009年期间的情况,其他学科、其他国家、其他时期的情况可能并不相同。

收稿日期:2013-03-18

标签:;  

基于对象行为的信息关注模型研究_计算机科学论文
下载Doc文档

猜你喜欢