用ABCA方法识别和解释中国当代情报学研究领域_情报学论文

用ABCA方法识别和阐释我国当代情报学研究领域,本文主要内容关键词为:情报学论文,研究领域论文,当代论文,我国论文,方法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

doi:10.3772/j.issn.1000-0135.2013.01.001

1 引言

情报学研究领域的确定是一个十分重要的课题,通过它可以把握情报学发展脉络,明确情报学研究对象。解决这个课题不能采取纯理论推演的方法,而应当以实证研究为主。国内外的许多研究也证明了这一点。国内外对情报学研究领域进行了一些研究,其中有的面向情报学总体,有的面向情报学某一领域,采用的计量方法、时间跨度以及样本选择均有较大差异。在计量方法上,作者同被引(Author Co-citation Analysis,ACA)分析是主流方法。在过去的二十多年里,学者们通常用它来识别情报学的研究领域。然而,作者同被引分析结果所显示的实际上是对情报学某一研究领域里活跃作者的主观感知的研究领域,其客观性略显不足。本文拟采用作者文献耦合分析(Author Bibliographic Coupling Analysis,ABCA)方法对我国当代情报学(1990-2009年)的研究领域进行识别,以明确情报学活跃作者本身的客观研究活动,最终得到我国情报学研究领域近20年发展的图景。

2 文献综述

国外在识别情报学研究领域方面,比较早而且规模最大的一次研究是由Howard D.White和Katherine W.McCain[1]完成的,该研究主要采用作者同被引分析方法识别了1972-1995年的情报学研究领域。Frizo Janssens等[2]使用共词分析方法分析了2002-2004年的情报学研究领域。Fredrik strm[3]采用作者同被引方法对1990-2004年的3个五年阶段里产生的在情报学领域有重大影响的论文进行了分析。Dangzhi Zhao和Andreas Strotmann[4]利用作者同被引分析方法研究了1996-2005年情报学研究领域的演变情况,并比较了这十年情报学研究领域与1972-1995年的情报学研究领域的异同。Dangzhi Zhao和Andreas Strotmann[5]从文献耦合的角度出发提出了作者文献耦合的概念,并利用此方法识别了1996-2005年情报学研究领域及其演变特点。该项研究是对他们先前研究的一个补充和验证,两次研究结果的对比显示,采用作者同被引和作者文献耦合两种方法在识别情报学研究领域方面既有共性也有区别,同时采用两种方法能够更好地解释情报学研究领域。Frizo Jannssens等[6]将费舍尔倒卡方作为文本内容分析和文献耦合的桥梁,提出了一种识别情报学研究领域的混合方法。

国内采用文献计量方法对情报学研究领域的研究从2006年开始明显增多,主要以ACA方法为主。马费成和宋恩梅[7]以ACA为研究方法,选取1994-2005年CNKI的数据为分析对象,对我国情报学领域的核心作者进行了同被引分析,描绘了情报学研究领域发展情况。赵勇和沙勇忠[8]受White和McCain的研究启发,使用ISI的Web of Knowledge中的SSCI数据库,对1996-2008年8月收录的24种情报学核心期刊论文进行了ACA分析,并绘制了相应的知识图谱。邓三鸿和顾婷婷[9]以CSSCI的回溯数据(1999-2007年)为统计样本,采用作者同被引分析方法对我国图书馆学、情报学和文献学期刊论文作者同被引情况进行了分析。马瑞敏和倪超群[10]以CSSCI三个时间段(1998-2007年、1998-2002年、2003-2007年)的数据为样本,使用ACA方法识别了我国图书情报学的研究领域,该研究既有总体上的分析,也有分阶段的分析,对图书情报学研究领域十年间的发展进行了比较细致的描绘。陈远和王菲菲[11]首次利用Zhao和Strotmann提出的作者文献耦合方法对CSSCI收录的2000-2009年情报学期刊论文引文数据进行了深入挖掘,识别了这十年间情报学的研究领域。

目前国内外在识别情报学研究领域上采用的主流方法是ACA,但由于ACA的固有缺陷,国外一些学者已经开始注意采用其他方法作为该方法的补充甚至替代,其中作者文献耦合是一个很有潜力的方法。在研究的连续性方面,国外和国内有所不同,国外的研究虽然是由不同学者完成,但他们选取的数据源、采用的研究方法等都较为一致,拼接起来可以基本实现对1972-2005年间情报学的完全描述。国内虽然也对20世纪90年代以来情报学进行了分段研究,但在选取的数据源种类和规范程度上有较大差别;时间上的衔接也出现了断层,特别是对1998年前的情报学领域的研究较为薄弱(部分原因是CSSCI尚未提供1998年前的引文数据)。所以对我国20世纪90年代以来的情报学领域的研究亟须统一和规范。本研究将采用Zhao和Strotmann提出的ABCA方法对我国当代(1990-2009年)情报学研究领域进行揭示。研究结果可以与采用ACA的研究成果进行对照、互证,以更全面地揭示我国当代情报学在大时间跨度里的发展面貌。

3 研究方法

3.1 样本选择

每个学科的核心期刊所刊载的论文是该领域学术研究的主要体现。本研究选择九个情报学CSSCI来源期刊作为研究样本,时间跨度为1990-2009年,选择CNKI(1990-1997年)和CSSCI(1998-2009年)两个数据库作为引文数据来源,如表1所示。

图1 CSSCI引文数据的获取流程

图2 CNKI引文数据的获取流程

3.2 数据获取和处理

由于引文数据来自两个数据库,因此数据获取过程也不相同,如图1和图2所示。

尽管原始引文数据分别来自CSSCI和CNKI,但通过以上两个流程的处理,最终将来自两个数据库的数据全部转化为同一种格式(SCI格式),为下一步的数据分析奠定了基础。需要说明的是,在两种途径的第一步即下载原始数据时就人工剔除了两部分内容:①会议通讯、通知、目次索引、贺词等消息;②纯图书馆学或纯档案学的论文。

3.3 数据分析

作者文献耦合是将文献耦合的方法扩展到作者,通过作者所有作品中参考文献的耦合强度来建立作者之间的关系。对不同的耦合对象,可以形成具有不同特点的引文耦合群,从而使大量文献通过耦合关系形成不同的簇群,揭示文献之间的内在联系和结构关系,进而反映当前某一学科的研究领域及其变迁。文献耦合强度是指两篇文献共同引用的参考文献数量,篇数越多则这两篇文献的耦合强度越大。

本文的研究步骤如下:

(1)确定核心作者 利用Bibexcel软件工具统计作者的发文量,依发文量降序排列,选取前200位,抽取参考文献,计算文献耦合强度,并计算200位作者的平均文献耦合强度。根据平均文献耦合强度选取前100名作者作为该时段的核心作者。

(2)生成核心作者耦合矩阵 ①选取上一步确定的100位核心作者,与作者文献耦合强度中的作者进行匹配,计算两两作者之间的文献耦合强度。Bibexcel自动生成一个三列表格:第一列为两个作者的耦合强度,第二列和第三列分别是两个作者名。②将该表格复制到txt文件中,利用Ucinet软件工具转换生成扩展名为.##h的文件,通过transform功能将其转换成对称矩阵,另存为.xls文件,即为核心作者耦合矩阵。

(3)核心作者耦合矩阵的分析 将核心作者耦合矩阵通过SPSS 18.0转换为Pearson相关矩阵,以消除耦合强度过高和过低的作者在规模上的差别,进而明确作者间的相似程度。转换后的相关矩阵以作者名为变量,对角线上值全部为1,是某行某列上最大的,能够很好地反映对角线值的意义。然后采用SPSS 18.0对Pearson相关矩阵进行分析:①因子分析。主要采用主成分分析法提取因子,根据特征值大于1来确定因子的个数,选取系数在0.3~0.5以上水平的因子负荷。对因子模型使用斜交旋转,输出成分相关矩阵。据此对相似的因子做出调整、合并,最终识别出合理的因子。这些因子就是被识别出来的情报学研究领域。②聚类分析。采用系统聚类模式,根据因子分析的结果确定聚类成员的单一方案,聚类方法选用组件连接,度量标准选取平方Euclidean距离,输出树状图。③多维尺度分析。借助因子分析和聚类分析的结果,确定点群的边界和数目,选择ALSCAL或PROXSCAL算法,输出散点图。

本研究对1990-2009年引文数据进行总体分析和时段分析,分为五个时段:1990-2009年、1990-1994年、1995-1999年、2000-2004年和2005-2009年,对每一时段均进行上述数据分析。因篇幅所限,以下仅展示1990-2009年的数据分析结果,4个时段的分析结果只对因子分析加以说明。

4 研究结果

4.1 因子分析结果

根据特征值大于1来确定因子的个数,共提取出9个因子,这9个因子模型能够解释总变异量的90.72%,公因子方差在0.62-0.99之间,只有3个(3%)小于0.7,7个(7%)小于0.8,这表明因子分析能够很好地揭示模型的拟合度。因子代表研究领域,初步识别出1990-2009年情报学的9大研究领域。然后对因子模型使用斜交旋转产生成分相关矩阵,如表2所示。相关系数大于0.3的因子之间的相关性比较强:因子1、3、6和9,因子4和7。这表明1990-2009年情报学研究领域交叉性较大,不同领域之间的借鉴、引用相当频繁。

表2展示了各个因子间的相关程度,据此可以对相似的因子进行合并,得到5个因子,作为1990-2009年我国情报学的五大研究领域,如表3所示。

图3 1990-2009年我国情报学核心作者聚类

4.2 聚类分析结果

聚类分析采用系统聚类模式,根据因子分析结果确定聚类成员的单一方案,使聚类数等于9,聚类方法选用组件连接,度量标准选取平方Euclidean距离,输出树状图如图3所示。

4.3 多维尺度分析结果

采用ALSCAL和PROXSCAL两种多维尺度分析方法对该时段的核心作者进行分析,发现ALSCAL分析产生的结果与聚类分析、因子分析更吻合,输出散点图如图4所示。

4.4 四个时段的分析结果

四个时段的因子识别结果如表4所示,每个时段的因子代表我国情报学的某个研究领域。

图4 1990-2009年我国情报学核心作者散点图

5 分析和讨论

5.1 我国当代情报学研究领域总体分析(1990-2009年)

从1990-2009年的20年间,我国情报学研究领域主要包括以下五个方面:

(1)竞争情报。因子1包含14位核心作者,占核心作者总数的14%。研究内容包括三个主要方面:竞争情报基本理论、竞争情报实践、竞争情报和情报科学其他学科关系的研究。由图4可见,因子1竞争情报研究与因子3文献计量学和因子4知识管理相关性较强,这反映了文献计量学是竞争情报的重要分析工具,知识管理则由于与竞争情报在研究对象和目的上的重叠而经常被论及。

(2)情报学基础理论。因子2包含34位核心作者,占核心作者总数的34%,该领域的核心作者较多,是情报学研究的主要领域。研究内容包括:情报学学科发展、情报学学科基础、情报学研究对象、情报学相关学科、情报学方法论、情报学范式等。我国情报学至今在研究对象和方法等重要理论问题上仍没有形成一致的意见,这种现象已经严重影响到情报学的健康和可持续发展。另外,情报学理论似乎与生机勃勃的情报实践有些脱节,因此情报学理论及其实用化应当成为学术界研究的重点。

(3)文献计量。因子3包含7位核心作者,占核心作者总数的7%。研究内容包括文献计量学的学科基础和理论基础,如文献半衰期、引用半衰期、文献老化规律、科学计量学、信息计量学等;应用文献计量方法对相关领域进行的实证分析,如专题文献高被引论文的时间分布、高被引论文的主题词链聚类分析、合著网络系统、期刊评价等。虽然该领域核心作者不多,但作为情报学“安身立命”的根本一直保持了较大的活力。

(4)知识管理。因子4包含21位核心作者,占核心作者总数的21%。研究内容包括基本的理论研究,如知识标引、知识挖掘、知识本体、知识组织、知识审计、知识协同等;对知识管理学科发展的研究,如知识管理与情报学关系、知识管理与图书馆学关系、知识管理自身学科建设等;对知识管理应用实践的研究,如知识服务的技术平台构建、企业知识门户中的知识组织、企业知识管理战略等。知识是情报学研究对象中的一个较高层次,因此知识管理必然成为情报学研究的重要领域。

(5)信息检索。因子5包含21位核心作者,占核心作者总数的21%。研究内容包括传统信息检索和现代信息检索两大部分,前者如汉语叙词表、主题词表等,后者如Web挖掘、多媒体检索、数字图书馆等。相关研究还包括信息可视化、信息构建和Web2.0等。信息检索在网络普及之前曾一度是情报学的看家本领,虽然目前有计算机、人工智能等领域的学者介入,但它仍是情报学的一个主要阵地。

由此我们可以看出,我国当代情报学研究领域呈现“一体四翼”的发展格局,“一体”指情报学基础理论,“四翼”分别指竞争情报、文献计量、知识管理和信息检索。可以预期,在未来的相当一段时期内,情报学将会继续沿着这种研究格局发展下去。

5.2 我国当代情报学研究领域发展路径分析

在表4的基础上,用相同的特殊符号表示4个时段中出现3次以上的相同(或相似)因子,可以清晰展示我国情报学20年来的发展路径,如表5所示。

(1)情报学基础理论是情报学研究的重中之重。该因子在4个时段全部出现,足见我国对情报学基础理论的关心和努力,随着外部条件的变化,这种探索将不断更新升级:第二个时段尤其关心情报学学科体系;第三个时段出现了网络时代的情报学基础理论研究,这一方面表明情报学基础理论的薄弱,另一方面也表明情报学作为一门年轻学科的活力和朝气。

(2)竞争情报成为我国情报学发展的排头兵。该因子在4个时段中全部出现,是情报学研究的重点。虽然我国竞争情报发展于1995-1999年,但1990-1994年的“情报研究”应该视为我国竞争情报的前身。原因有二:一是情报研究领域的专家后来很多成为竞争情报领域的专家;二是情报研究和竞争情报的理论和方法有许多相似和共通之处,可以互相借鉴。在“information的intelligence化”的大背景下,竞争情报在我国的崛起和兴盛是我国情报学界对情报学本质和功能进行认真反思的一大成果。

(3)信息检索始终是情报学的中坚力量。该领域在4个时段中全部出现,是情报学研究的重点。从1995年开始,“信息检索”逐渐取代“情报检索”。在第二个时段,信息检索在基础理论和具体技术得到了较大发展,可能与该时期计算机技术的普及有关,另外该时期信息检索和数字图书馆联系紧密;第三个时段信息检索则与信息服务联系较大。

(4)文献计量在巩固原有成果基础上需要较大的创新和突破。文献计量作为情报学的特有领域在前三个时段中都出现了,但文献计量理论和方法创新不多,基本上限于传统的文献计量。在第四个时段,没有识别出文献计量,原因可能是新兴的网络计量学、信息计量学等未能与这一时期的信息活动实践相适应,出现了理论滞后于现实的情况。因此文献计量学若想要在信息时代继续发扬光大,必须要有较大的理论创新和突破,否则将失去竞争力。

(5)有关信息服务的研究保持了较高的连续性。该领域出现在第一、第三和第四个时段,也是情报学研究中较为重要的部分。每个时段中信息服务均体现了当时的时代特征,第一个时段主要研究传统环境下的信息服务与用户,第三和第四个时段则持续关注了网络环境下的信息服务与用户,如用户信息行为和信息服务评价等。

(6)信息经济兴盛一时。信息经济出现在第一、第二个时段,成为情报学当时的研究热点。信息经济的兴起与信息化浪潮或信息技术对情报学的冲击有关。随着知识经济的崛起,学者对信息经济的关注度有所下降。

(7)某些领域昙花一现。一些研究领域只出现在一个时段中(除第四个时段),如“社会科学情报”、“信息政策”、“信息化”和“信息素养”等。这些研究领域在较短的一个时期内形成了一个热点,反映了当时的时代特点和研究兴趣。

纵观我国当代情报学研究领域的发展,其特点可以归纳为“主线+珠子”结构,“主线”包括情报学基础理论、竞争情报、信息检索、文献计量和信息服务,“珠子”包括信息经济、社会科学情报、信息政策、信息化、信息素养、数字图书馆。可见,今后我国情报学总的发展趋势会以4~5条主线为纲,带动其他几个较小领域(珠子)。

5.3 我国当代情报学研究领域研究强度分析

因子大小即核心作者人数可以代表某一时期内对某一领域的研究强度,对在4个时段出现两次或两次以上的研究领域的因子大小进行列举,其研究强度变化情况如表6所示。

“情报学基础理论”在第一个时段的研究强度较小,后三个时段猛增且比较稳定;“竞争情报”的研究强度呈“锯齿”状变化,第一、第三个时段较小,第二、第四个时段较大;“信息检索”在第一个时段研究强度较大,后面3个时段研究强度较小且比较稳定;“文献计量”的研究强度在前三个时段先增后减,增加的幅度大于减小的幅度;“信息服务”第一、第三、第四个时段的研究强度递减;“信息经济”的研究强度在第二个时段远远大于第一个时段。

最大的研究强度是“34”,分别属于第四个时段的“情报学基础理论”和第一个时段的“信息检索”。最小的研究强度是“6”,属于第一个时段的“情报学基础理论”。从研究强度的变化情况来看,情报学基础理论、信息检索和文献计量的稳定性较好,竞争情报、信息服务和信息经济的稳定性一般。

6 结语

本文采用作者文献耦合分析(ABCA)方法分析了我国情报学1990-2009年的引文数据,识别出该时期情报学总体和时段的研究领域。结论如下:第一,我国情报学20年来的研究领域可以包括5个部分:情报学基础理论、竞争情报、文献计量、知识管理和信息检索,即“一体四翼”结构;第二,我国情报学20年的发展路径可以概括为“主线+珠子”结构,“主线”包括“情报学基础理论”、“竞争情报”、“信息检索”、“文献计量”、和“信息服务”,“珠子”包括不同时期出现后又消失的较小领域;第三,我国情报学各个研究领域在20年里的研究强度变化规律各不相同,有的递增、有的递减、有的先升后降等,变化多样。

ABCA方法经过国外学者的验证,证明其在识别研究领域方面具有ACA方法所不具备的优点。国内目前使用ACA方法对情报学研究领域进行识别的不少,而使用ABCA方法的则只有一例。由于ABCA和ACA两种方法各有优劣,所以本文的研究结果可以与使用ACA方法的其他研究结果进行比较和验证,以更全面地揭示我国情报学研究领域。这既是对情报学研究领域的贡献,也是对进一步明确情报学研究对象,建立我国21世纪情报学理论体系的贡献。

标签:;  ;  ;  ;  ;  

用ABCA方法识别和解释中国当代情报学研究领域_情报学论文
下载Doc文档

猜你喜欢