图书馆学情报学文献中的自引研究_情报学论文

图书馆学和情报学文献中的自引研究,本文主要内容关键词为:情报学论文,图书馆学论文,文献论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

引言

引用是学术交流中的重要组成部分。按照其基本功能,所有的引用可以分成3大类:①把当前的工作和过去的工作联系起来; ②给予荣誉和表示敬意;③提供支持的依据和诠释。

自引是引文中要辨别的一个组成部分,但很少有文章提到它,尤其是与图书馆学和情报学(LIS)文献相关的自引。因此, 也很少有可用的统计数字考虑到自引实践在图书馆学和情报学文献中的使用程度。

自引有几种定义,在本文里,“自引”一词是指:论文的引文是由进行引用的论文作者中的一名作者所写或与人合写而成的。虽然,关于“对自引做法的普遍的责难情绪”已经有人报导过了,但自引是学术性专著的惯常做法,并且“与其他形式的引用一样具有重要的功能”。

在一篇探讨引文分析问题的文章里,M·H·麦克罗伯特和B·R·麦克罗伯特引用了一个介于10%和30%之间的自引数,但说明“除了一些基本的表面特征之外,自引尚未被研究到”。他们提出:自引是一个“问题”,但表明自引“过多”这个观点的数据还没有人搜集。

本研究的目的是考察图书馆学和情报学文献作者自引的特征。之所以选择图书馆学和情报学文献是因为对该学科的自引模式还没有人进行深入的研究。关于图书馆学和情报学文献自引模式的研究,能找到的只有一篇论文,而且其研究局限于5种期刊中的文献。

本研究具体考察的因素有:自引频率,自引与总引用之比,作者的专业特征和论文的主题分析。为了描述自引实践在该学科中的当前状况,我们从一组图书馆学和情报学核心期刊中搜集数据并进行了分析。

1 相关文献

前面已经提到,尽管自引会带来一些消极的批评,事实上,这种做法可以被证明是完全正确的。加菲尔德为科学家的自引做法进行了辩护,他指出:研究者倾向于“依靠他们自己的著作……而一个较高的自引数并非常常表现得与一个狭窄的专业一样的不利”。加菲尔德自己的自引做法被巴德和奥本海姆举作一个有趣的例子,他们对当前的引文问题提出了总的看法。加菲尔德也指出,不恰当的自引在读者看来是十分明显的,应当在编辑的或同行的述评加工中进行更正。

在探讨作者自引的文献中,通常有两种评估自引的方法。①统计总引用及自引数,算出自引占总引用的比例;②分析论文,计算有一条或一条以上自引的论文数,再把所得的数字与样本论文总数相比(自引率)。在审核下面部分的时候,应注意这个区别。本文将讨论图书馆学和情报学文献中的自引率。

在塔利亚科佐一项早期关于植物生理学和神经学论文的自引研究中,他发现“在两个领域里,完全不含自引的论文不到总数的8%”。 这项研究考察了一组相关的论文(植物生理学93篇,神经学90篇)。在检查引用总数的时候,塔利亚科佐发现16.6 %的植物生理学文献引用和17.5%的神经学文献引用是自引。 塔利亚科佐还发现:在进行引用的论文里,自引比引用其他作者的引文更新、引用更为频繁;自引与作者的数目、进行引用的论文的参考文献数或作者的生产能力无关。

在一份印度航空工程师研究里,斯莱德赫发现了一个包含一切的自引率为35%,平均每篇论文的自引数是3.44,15%的论文只有一条自引。

斯奈德和邦兹在一篇关于作者自引动机的论文里声称:44.2%的环境科学领域的作者引用他们自己的著作。他们发现,作者引用自己著作或引用他人著作的原因几乎不存在差别。他们得出结论:自引的决定以符合逻辑的智力理由为基础,而非出于自夸的需要。然而,他们的取样很少,只有13名作者和52条引文。

在另一篇论文里,邦兹和斯奈德比较了自然科学(化学和地质学)与行为科学(经济学和社会学)的自引模式。他们发现:自然科学文献中15.5%的引用是自引,这证实了塔利亚科佐的发现,但是他们没有给出每篇论文占有自引的百分比;而社会科学文献中的数据表现出了较低的自引率,仅3.4%。“显然, 化学和地质学的样本比另外两个学科的样本更倾向于自引”。他们所取样本比较少,总共才有120篇论文, 并且是在10年的时间段里任意选取的。

哈米尔顿举科学情报研究所的戴维·彭德伯里为例,说明在科学论文里自引数占总引用5—20%, 但是并没有给出每一篇论文占有自引的百分数。

在另一份关于社会科学文献的研究里,约翰·巴德研究了3 种高等教育核心期刊的引用模式。尽管他没有给出精确的数字进行考察自引,但是他确实发现被引者频率与排除自引的被引者频率之间有重大的差别。他说他的发现表明“在考察个体对一个学科文献的影响上,自引是一个重要的因素”。

在一项关于5种国际图书馆学期刊作者特征的研究里, 拉普提斯发现了27.6%的自引率。除了一名作者自引29次之外, 大多数作者自引1—3次。该研究考察了192篇论文里的3273条自引。

所有这些以前的研究得出了变化很大的自引率。其原因是采用了几种不同的测度方法,并且抽取的样本很少。另外,只有一名作者(拉普提斯)从事图书馆学和情报学文献自引模式的研究。

2 方法

本研究所采用的论文取自28种图书馆学和情报学核心期刊。这一组核心期刊来源于以前发表的图书馆学和情报学核心期刊目录。本研究选取了在4个核心期刊目录中出现了3次的期刊。

从1992年和1993年前6个月中找出了所有有引文的论文。 全文的报导、讨论、短论、信息摘要和文献评述都包括在“论文”里。论文的各方面情况几乎都考虑到了。其中有的论文不适于进行考察,在这种情况下我们作了社会科学引文索引(SSCI)查找,并采用了其中的记录。这些论文只有39篇,而且都来源于同一种期刊。总计起来,数据是从1058篇源论文中搜集起来的。这组图书馆学和情报学期刊论文体现了这一时期自引模式值得注意的范围概览。

在搜集数据的时候,考虑到每一篇论文的发表年份、作者分布、引文、论文体裁和一般主题类型。所有的数据都以代码形式输入一个机读文件里,数据分析用的是Minitab统计软件包。

3 发现

3.1 图书馆学和情报学论文的特征

从表1中可以找到1992年——1993 年上半年图书馆学和情报学文献的描绘性统计。在1058篇论文中,437(41.3%)篇是全文的研究论文。研究论文的概念是以前的图书馆学和情报学文献研究所使用的。需要指出的是,一篇论文所描述的工作不得不成为一种探询目标所在以及通过系统的方法,引出一些新的现象、概念或观点的做法。除了一个例外,本研究所得到的研究论文百分比略高于以前的图书馆学和情报学文献研究中所得到的研究论文百分比:佩里兹考察了1950年——1975年图书馆学和情报学期刊文献,发现1975年达到了31%的最高点;诺尔发现1980年的抽样为24.4%;菲恩从1984年的抽样中得到23.5%;贾瓦林和瓦卡里1995年发表的大量的图书馆学和情报学文献抽样研究中得出一个较高的研究论文百分比(54%)。

图书馆学和情报学论文的作者可以分为3 种类型:情报实际工作人员、图书馆学和情报学专家以及所有其他广泛的作者类型。这些“其他”作者包括独立的咨询人员、非图书馆学和情报学部门的专家及非团体作者。

表1 研究论文特征

n(n=1058)%

是否自引?

529

50.0

529

50.0

研究类(全文的)

437

41.3

研究类(信息摘要) 646.1

非研究类 503

47.5

书评或介绍文章545.1

图书馆/信息中心 406

44.1

图书馆学和情报学研究部门 327

30.9

其他 265

25.0

主题(见附录A的详细目录)

总论 938.8

职业工作 131

12.4

理论的

333

31.4

应用的

491

46.4

相关领域 101.0

情报实际工作人员比其他类型的作者群发表更多的图书馆学和情报学文献,达446篇论文(30.9%);其他作者则发表了265篇(25.1%)。虽然情报实际工作人员比其他作者群发表的论文要多,但事实上他们在人数上远远超过了图书馆学和情报学专家。1992年,美国有182000各在职图书馆工作人员,而1991年只有631名图书馆学和情报学专家。

表2 论文类型与作者分布

表2体现了论文类型与作者分布的关系。根据X[2]检验(P<0.01),在这两组变量之间有可以统计的重大联系。图书馆学和情报学专家撰写研究论文的比重大于其他作者。相反,与图书馆学和情报学专家相比,情报实际工作人员更主要撰写非研究的论文。这就证明了关于这两个群体的兴趣的普遍观点:实际工作人员探讨相关的问题,写作与他们工作相关的文献;而专家拥有学术资源,同时有评论的基础并以此为动机指导更多的理论研究。

在表1中可以找到全部研究样本的主题分布状态。 应用主题是最普遍的主题类型,共491篇论文(46.4%);有333篇论文(31.5%)主题是图书馆学和情报学理论;其余的为职业工作主题(131篇论文,12.4%)和总论性主题(93篇论文,8.8%); 叙述与图书馆学和情报学相关领域主题的论文只有10篇(1%)。

表3 把研究论文主题分布与以前两个采用同样分类体例的图书馆学和情报学文献研究所确定的主题分布相比较。这里所鉴别的数据迥异于早期研究所得出的结果。特别是在抽样中,划分为“理论的”的论文所占百分比(48.1%)比以前两个研究中的要高得多;同时,划分为“应用的”论文所占百分比(27.5%)相应减少。

表3 图书馆学和情报学研究论文主题分布

迪米托夫和阿利

迪米托夫 菲恩等

兹赫(n=501)(n=365) (n=123)

总 论11.8%

11.6%11.3%

职业工作 11.4%

13.2%16.2%

理论的

48.1%

29.2%13.0%

应用的

27.5%

46.7%50.5%

相关领域

1.0%0.3% 9.0%

据统计,每篇论文的作者数从1——6个不等,平均值为1.43个;每篇论文引用数由1—283条不等,平均值为20.19条(中间值为13)。 在这些引用中,自引数在0—24 条之间变化,平均每篇论文自引数为1.34。

3.2 自引模式

按有自引和无自引的区别,本研究所用的论文可以分成相等的两部分,每部分各有529篇文献,各占总数的50%。 这个百分数远远高于以前所报导的数字,而该统计数字就是下文分析的重点。

在本研究里,论文的类型、作者分布、主题、作者总数和期刊都同是否具有自引进行比较。我们对前面4个变量进行了考察;至于期刊, 我们认为不适合对其进行统计分析,所以在后面列出了所考察期刊的目录。

表4对论文类型和自引率进行了比较。然而我们在统计中发现(P<0.01),从论文所有的类型看,自引的有无没有差别。全文的研究类论文和非研究类论文是两个意想不到的分布源。其实这并不奇怪,全文的研究类论文促使自引大量增加,而非研究类论文则提供了数量较少的自引。

表4 论文类型与自引

自引 无自引

总计

研究类

(全文的) 247(23.6%) 190(18.0%) 437(41.3%)

研究类

(信息摘要) 32(3.0%) 32 (3.0%)

64 (6.1%)

非研究类 226(21.4%) 277(26.2%)

503(47.5%)

书评和介

绍文章24(2.3%) 30 (2.8%)

54(5.1%)

总计 529(50.0%) 529(50.0%) 1058(100%)

X[2]=13.27;df=3;P<0.01。

表5 作者分布与自引

自引无自引

总计

工作人员 163(15.4%) 303(28.6%)

466(44.1%)

图书馆学和

情报学专家189(17.9%) 138(13.0%)

327(30.9%)

其他 177(16.7%)

88 (8.3%)

256(25.1%)

总计 529(50.0%) 529(50.0%) 1058 (100%)

X[2]=79.9;df=2;P<0.01。

图书馆学和情报学专家与那些被划分成“其他”的作者比情报实际工作人员更多地引用自己的文献(如表5数据所示)。这也不奇怪, 因为专家有发表研究报告的压力。长期的研究项目导致了描述冗长项目进展的复合论文的发表。文献的“出版和匿亡”现象也导致了一种被怀疑的做法,比如20年前发表的1份研究项目结果的单独报告, 现在很有可能象树枝一样被分解成最小的出版单元。这确实是“各个学科领域学术期刊数目……在过去20年里从70000种上升到108590 种……”的原因之一。因为这些被“分解”的论文实际上是相互联系的,所以作者必须引用其他分枝文献,因而就有可能提高自引率。

另一方面,情报实际工作人员很少有发表论文的压力。因此有一点可以推断的是:随着情报实际工作人员个体发表论文的减少,由于个人先前发表的论著数目较小,自引数也会减少。

阐述理论主题的论文比其他主题的论文包含有更多的自引。相反的,在研究应用主题的论文里找到的有自引的论文篇数比预计的要少。这些数据都列在表6中。因为原始研究建立在现存的知识体基础上, 而知识唯一的人工制品是文献,因此理论研究者更多地引用他们自己的文献就不足为奇了。引用最基本的目的之一就是把现在的发现和已经存在的知识联系起来;在现存的知识当中,有一些是由同一个作者或研究者创造出来的。虽然本研究不能证实自引者的动机,但是以前的一份研究已经指出过:作者“可能是该领域里仅有的一个研究者或最有权威的人……其工作是以前研究的延续……”。

表6 主题与自引

自引 无自引 总计

总 论40 (3.8%) 53 (5.0%)

93 (8.8%)

职业工作

53 (5.0%) 78 (7.4%)

131(12.4%)

理论的

234(22.1%) 99 (9.4%)

333(31.5%)

应用的

198(18.7%)293(27.2%)

491(46.4%)

相关领域4(0.4%) 6 (0.6%) 10(1.0%)

总 计

529(50.0%)529(50.5%) 1058(100%)

X[2]=80.09;df=4;P<0.01。

此外,与论文相关的作者越多,论文就越有可能包括一条与其中至少一位作者以前工作相联系的引文(见表7)。同样地, 得出这个结果也不意外,因为作者数目越多就越增加这样一种可能性:这些作者当中的一位或更多位会有一篇他们以前发表的可供参考的论文。然而,这就与塔利亚科佐的结论大不一样:“在我们抽取的论文样本里,自引程度看来与合著者的数目无关。”

表7 作者数目的自引

自引

无自引

总计

1名作者 318(30.1%) 406(38.4%)

724(68.4%)

2名作者 150(14.9%) 100 (9.5%)

250(23.0%)

3名作者 40 (3.8%)

20 (1.9%)60 (5.7%)

4名作者 13 (1.2%)3 (0.3%)16 (1.5%)

5名作者

5 (0.5%) 0(0%) 5 (0.5%)

6+名作者 3 (0.3%) 0(0%) 3 (0.3%)

总 计 529(50.0%) 529(50.5%) 1058 (100%)

X[2]=41.61;df=5;P<0.01。

本研究最后考察的变量是期刊。数据表明,和其他期刊相比,一些图书馆学和情报学期刊有很多论文都具有自引(X[2]=181.2;df=7;P<0.01 )。 其中自引率高于50 %的期刊有: Aslib Proceedings,Information

Proceeding

&Documentation, InternationalInformation and Library Review, Journal of Documentation,Journal of the American Society for Information Science (JASIS ), Library & Information Science Research, Library Quarterly,Library Trends。在这11种期刊当中,有7种是本学科中历史悠久的重要期刊。与其他类型期刊相比,这7 种期刊有发表更多的研究论文(比其他论文类型),发表更多的由专家所写的论文(比其他作者类型)和发表更多的理论主题的论文(比其他主题类型)3 个特征;有5种比其他期刊发表更多上述3种特点的论文。JASIS 比其他期刊更注重发表理论主题的研究报告。

上述3个特征:专家作者, 研究报告和理论主题都是与具有较高的自引率相关的基本特征,也说明了在这一组期刊中具有较高自引率的原因。

(3)自引和总引用的比较

抽取的样本包括21,363条引用。在这些引用中,有1415条是自引,占总引用的6.6%。 这个数字与以前仅有的两项研究所得到的统计数字不一致。其中一项研究发现在其研究的两个学科里,总计近20000 条的引用有16.6%和17.5%是自引,这两个百分数比本研究考察的21363 条引用中的6.6%要高得多。邦兹和斯奈德发现, 在他们考察的样本中,自然科学文献有15.5%的引用是自引,而社会科学文献为3.4%。 这使他们断定,自然科学“综合自引程度比行为科学要高”。显然,自然科学文献平均每篇论文的引用数比图书馆学和情报学文献要高得多。虽然本研究所得到的6.6 %的数字与邦兹和斯奈德报导的社会科学文献的自引数接近,但同时也表明图书馆学和情报学文献并不遵循与其他社会科学文献一样的一般准则。

4 结论

本研究认为,自引在图书馆学和情报学文献引文分析中占有相当重要的位置。本研究最重要的是发现50%的被考察论文中至少有一条自引。除了塔利亚科佐的发现之外,这个数字比那些以前报导的要高,且高于设想中的数字。在学科领域上,图书馆学和情报学被当作一门社会科学:但是现有研究的统计数字(6.6 %的总引用是自引)表明:图书馆学和情报学文献中的引用模式不同于邦兹和斯奈德考察的其他社会科学文献中的引用模式。从作者的自引行为出发,这些结果表明图书馆学和情报学相应的模式既不是社会科学的,也不是自然科学的,而是处于两者之间的。

把自引率与论文的层面相联系,可以发现,全文的研究论文比其他任何类型的论文占有更多的自引;图书馆学和情报学专家比工作部门的图书馆工作人员和其他图书馆学和情报学文献作者更为频繁地引用他们自己的著作;阐明理论主题的论文比其他主题类型的论文占有更多的作者自引;论文的作者越多,当中的一名或更多的作者引用他们以前著作的可能性就越大。

同时,本研究也分析了一组期刊。与其他期刊相比,这些期刊既有较高的自引占总引用的百分比,同时也发表绝大部分由专家撰写的理论主题的研究论文。这些数据证实了传统的关于自引者特征的智力考察。

然而,这些提供的数据并不能代表一切,它只是1992年——1993年上半年期间图书馆学和情报学文献特征的概貌;它仅提供一组大致的标识以及图书馆学和情报学或者另一个可比较学科的文献自引研究。本研究使用了大量的抽样,这就弥补了以前的图书馆学和情报学文献及其他学科文献研究的最大不足。

对自引和其他引用之间关系的深入研究将会给自引实践提供一个广阔的图景。比如,了解所记录的调查结果之间的差异是由于取样的错误,或是由于时间跨度过大,还是由于两个学科之间的交流标准所造成,这是一件十分有趣的事情。本研究报导的数据可以为此类深入研究提供对照。

译自 Journal of Documentation,Vol.51,No.1,March 1995,P44—56

标签:;  ;  ;  

图书馆学情报学文献中的自引研究_情报学论文
下载Doc文档

猜你喜欢