期刊作者的定量研究_文献论文

期刊作者的量化研究,本文主要内容关键词为:期刊论文,作者论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

2 普莱斯定律

2.1 基本描述

在描述科技期刊论文作者行为方面,普莱斯定律也是素浮盛名。普莱斯(Price)是著名的科学家与科学史学家, 他在其代表名著《小科学,大科学》一书中曾有如下的论述:“在同一主题中,半数的论文为一群高生产能力作者所撰,这一作者集合的数量上约等于全部作者总数的平方根”[7]。其实,社会科学中早在18世纪前, 业已由法国政治学家卢梭(Jean—Jacques Roussean 1712—1778)开发出来, 卢梭本人对此曾有这样的表述:“在任何产品集合N中,品质优良的产品数量, 约等于全部产品N的平方根,亦即

。”[8]如果我们欲用数学语言来进一步表达普莱斯定律时, 还要作一些规定:

N为全部作者人数;M为全部作者所撰写的文章数量;X[,max] 为撰写文章最多的那位作者撰文数量,亦即这一作者集团中最高产作者的撰文数量;m为高产集团的临界值,亦即高产集团中, 撰文量最低的那位作者的撰文数;y[,x]为撰写x篇论文的作者数目。

根据普赖斯的论述可有:

式(10)表明,高产作者集团(即从撰写m篇到最高产篇x[,max])撰写论文的数量占全部论文的一半。

式中

即为M。

m恰恰是提供论文总数50%高产作者的起点,亦即m~x[,max] 为高产作者集团。那么,m处于何处呢?经推导(过程从略)可知:

m=0.749(x[,max])[0.5] ………………………(12)

意即高产作者集团的起点作者的著文量,为x[,max] 为最高产作者著文量平方根的0.749倍。同时, 高产作者集团作者人数与作者总数之间的比(R),经推导为x[,max]为最高产作者著文量平方根的0.812 倍。即:

x(m→x[,max])

0.812

R=────────=────────…………………(13)

x(1→x[,max]) (x[,max])[0.5]

(13)式表明,高产集团的作者数量为全体作者数的平方根,平方根定律盖因此而得名。文献计量学的定量实践表明,这一定量规律的准确性较差,一旦运用便会发现误差非常大,多数情况下实际的数据集合并不大符合上式的定量关系。

下面例举数据加以证明。顾帕德(Gupta B.M.)的文献[9] 提供了有关人口遗传学领域论文著述的数据。就此,我们可以在这一数据的基础上开展进一步的一些分析。顾帕德的数据规模是充分且足够的,前后累积了80年。该领域的作者共有3194位作者,总计撰写11136篇文章。 文献[9]中集合的数据有两种形式,其一,每间隔10 年的分段统计数据;其二,以10年为单位的逐年累积一体的统计数据。我们选择后者,查看一下不同数量平方根的作者撰写的论文百分比。详见表4。

表4人口遗传学领域的作者著述情况

序号累积期作者总数论文总数

1 2 34

1 1900-20

37

79

2 1900-30 109 309

3 1900-40 221 708

4 1900-50 301 930

5 1900-60 556 1859

6 1900-70 1532 4849

7 1900-80 319411136

序号作者总数的平方根对应论文的%

1 5 6

16.08 49.67

2

10.44 53.13

3

14.86 53.51

4

17.34 48.07

5

23.57 38.64

6

39.01 30.46

7

36.51 27.05

从上表可见,对于不同数量平方根的作者,对应论文的百分比浮动于27.01~53.51%。开始略微上升,及至第3期(1940 年)则开始下降,随着作者规模的不断扩大,对应的百分数呈明显的递降趋势。两者间的定量关系还是隐约可见的,开始呈上升状,然后迅速下落。对该定律这种现象可以这么解释,在规模很小的时候尚可成立,而被观察的数据规模过大,就明显渐渐背离了。因此我们不应机械地、孤立地去理解普莱斯定律,应当辩证地对待。亦即在数值上建立起下式:

式(14)中若a=θ=0.5时,这恰恰是普莱斯定律的本意。但是大量数据都如同表4那样不予支持。因此应予改进或修正。

2.2 Egghe的修正[10]

Egghe 认为:式(14)中的a≠θ,而且a是θ的函数,亦即θ影响a的变化。同时Egghe还提供一组理想的标准(y[,x]=C/x[2])数据群(表5)加以验算。应当说Egghe的改进只有理论意义,意在强调不应当固定不变地看待普莱斯定律。

表5 Egghe的典型计算数据

作者yx 期刊论文数x yx·x ∑yx·x yx·/∑yx·x

1 30 30 300.0085

1 29 29 590.0167

1 28 28 870.0246

1 27 271140.0322

1 26 261400.0396

1 25 251650.0466

2 24 482130.0602

2 23 462590.0732

2 22 443030.0857

2 21 423450.0975

2 20 403850.1088

2 19 384230.1196

3 18 544770.1349

3 17 515280.1493

4 16 645920.1674

4 15 606520.1843

5 14 707220.2024

5 13 657870.2206

6 12 728590.2408

7 11 779360.2624

9 10 90

10260.2876

11 9 99

11250.3154

14 8112

12370.3468

18 7126

13630.3821

25 6150

15130.4242

36 5180

16930.4746

56 4224

19170.5373

100 3300

22170.6215

225 2450

26670.7477

900 1900

35671.0000

∑1149 3567

35671.0000

Egghe提出的修正公式如下:

式中:E为欧拉系数,即为0.5772。θ为任意给定值, 亦即部分论文值与全部论文值的比例,如0.8。首先将表5的数据代入式(16),计算出μ=2.46;将有关数据代入式(15),得出a等于0.9019。 这表明全部论文的80%系由数量为N[0.9019]作者完成的。

为了检验其正确性,可进行如下的验算:

(1449)[0.9019]=710

自表6稍加计算即可知:710位作者撰文2828篇,而2828恰是全部论文3567篇的79.28%,这与初设的0.8是吻合的。

2.3 文献[11]的改进

普莱斯定律仅仅是一个定量性的判断与论断,不仅是文献[10]指出了平方根理论非普适性,本文作者也著文指出该定律的缺欠[11]。王崇德的改进也是基于式(14),亦即:全部的a次方的作者(1>a>0)撰写了全部作者的θ%。如果我们规定θ%=50时,那么撰写全文论文50%的作者份额则是可以相应地求出的。反之亦然。即有N[a], 且a为任意正整数。修正工作援引了英国文献计量学家Burrel一个文献计量学公式的公式[12],稍加以变通,并赋予各参数以本文意属的意义:

θ=β·(γ 1nx+1) ……………………(17)

上式中,θ为普莱斯定律规定值,如规定50%;γ可由下式来计算求出:

式(17)是改进所引入的修正式,内有系数β。我们规定了它与θ(亦即y)值的对应关系,如表6所示:

表6 不同y值下的β值

y值范围 0.1~0.2

0.2~0.3

0.3~0.4

0.4~0.5

0.5以上

β 2.0

1.8 1.6

1.4

1.2

下面我们引用文献[13]的数据(表7)加以验证。 意即在不同的α、β值下的普莱斯定律的形式。表8中,x代表撰写论文的数目;n (x )为发表x篇论文的作者人数;相应发表论文的数量为n(x)·x。 同时对n(x)和n(x)·x分别进行累积值的计算与显示。t=∑n(x)=1302(作者总人数);s=∑n(x)·x=2784(论文的总篇数)。 ∑n(x)/t为作者人数累积的百分比;∑n(x)·x/s为发表论文的百分比。

将一应数据代入式(19、18),计算得知:

2.784

μ=───=2.1382

1320

γ=[2.1382·1n(1-1/2.1382)][-1]=-0.7417

令y=0.4619,取β=1.4。得到:

0.3299=x(-0.7341·1nx+1)

x=0.1320

上述计算的结果意味着:y=0.4619即α=0.4619,而对应表8的数据为0.1329。为了考虑计算的准确性,我们分别依公式(17)等计算部分数据(供检验数据,从略),顺利地通过X[2]检验。

文献[14]在文献[12]的基础上,又提出更进一步的修正。不是按 y(θ)值分段给予修正值,而是按文献量分别给予β值,这样就提高了式(17)的精度。表7就是文献[11]与文献[14]给予的β 值及相应计算值的对比。

表7 文献[13]的数据(重新加以整理)

xn(x)n(x)·x∑n(x) ∑n(x)·x

1341

841

1302 2784

2207

414461 1943

3 81

243254 1529

4 47

188173 1286

5 32

160126 1098

6 17

102 94 938

7 1498 77 836

8 14

112 63 738

9 1090 49 626

10 880 39 536

1110

110 31 456

12 336 21 346

13 452 18 310

14 456 14 258

15 230 10 202

16 232 8 172

17 117 6 140

20 120 5 123

21 121 4 103

23 123 3

82

26 123 2

59

33 126 1

33

x∑n(x)/t∑n(x)·x/s

1 1.0001.0000

2 0.3541

0.6975

3 0.1951

0.5492

4 0.1329

0.4619

5 0.0968

0.3944

6 0.0722

0.3369

7 0.0591

0.3003

8 0.0484

0.2651

9 0.0376

0.2249

10 0.0300

0.1925

11 0.0238

0.1639

12 0.0161

0.1243

13 0.0138

0.1114

14 0.0108

0.0927

15 0.0077

0.0726

16 0.0061

0.0618

17 0.0046

0.0503

20 0.0038

0.0442

21 0.0031

0.0370

23 0.0023

0.0295

26 0.0015

0.0212

33 0.0008

0.0119

上表数据累积计算系从下而上来计算,这样为了容易看清m 的位置,有利于判断数值的百分比。

表8 文献[11]与文献[14]计算结果的比较

β

x

y[,x]文献[12]文献[15]观察值

4

0.4919 1.41.4

0.1329

6

0.3369 1.61.6

0.0722

8

0.2651 1.81.7

0.0484

10 0.1952 2.01.8

0.0300

11 0.1639 2.01.8

0.0238

计算值差值(绝对值)

x

文献[12]文献[15]文献[12]文献[15]

40.1320 0.1322

0.0009 0.0007

60.0710 0.0714

0.0012 0.0008

80.468

0.0480

0.0016 0.0004

10

0.0254 0.0297

0.0046 0.0003

11

0.021

0.0241

0.0027 0.0003

显然,文献[14]的修正提高精确性,是更为可取的。(待续)收稿日期:1998年5月16日

标签:;  

期刊作者的定量研究_文献论文
下载Doc文档

猜你喜欢