电子期刊及其他电子出版物检索的调查研究_用户研究论文

电子期刊与其它电子出版物检索的调查研究,本文主要内容关键词为:调查研究论文,期刊论文,电子出版物论文,电子论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

摘要 文章报告了最近于Internet上出现的学术性及评论性的电子期刊的检索问题与讨论结果。报告中的数据关于指南信息的精确性、电子期刊文章的可检索性、电子期刊文档的状态、检索现刊与过期刊物的方法,以及电子期刊使用的数据格式的多样性。提出了被电子期刊参考的电子出版物文本的可查检性数据。研究结果阐述了用户检索电子出版物文本时出现的实际问题,揭示了所研究的电子期刊相当低的可检性与可用性。

1 研究问题

目前大部分文章讨论的是电子期刊的潜力,而不是对现有电子期刊的实际研究。尽管成千上万的电子期刊、新闻通讯与其它的电子连续出版物现在可从网上获取,人们对它们的兴趣也大大提高,但几乎没有做过实际研究。

Hazel Woodward与Cliff Mcknight提出必须考虑电子期刊检索的三个层次。第一是检索电子期刊的目录信息和出版者,包括名字和地址。第二层次检索是对被电子期刊出版的独立文章信息的索引与文摘服务的检索。第三层次检索是检索电子期刊文献的文本。

好几种电子期刊指南可以用电子和印刷形式得到,一些文摘与索引服务最近也开始对一些电子期刊进行索引。但是,就作者了解,还未出版过实际研究检索最近可从网上获得的电子期刊文献文本的问题与讨论。如果电子期刊要作为一种新的正式的学术通讯媒介,可靠的检索性与利用性是关键。

一个有关的讨论问题是对印刷型或电子期刊中引用的电子期刊文献与其它种类的电子出版物的检索。即,一个作者引用一种电子出版物,假使引文中提供来源信息,条目的可检性如何呢?这一点,就作者了解,还没有研究过这个问题。

本文记载的研究问题包括:

·电子期刊指南提供的信息可在何种程度上用来检索文献的文本?在此提出问题的准确性、新颖性,提供信息的完整性与这些文档地址的稳定性。

·如果不能从指南条目提供的信息找到电子期刊,可通过独立的方法(如利用查询系统)找到吗?

·用户查找电子期刊时会遇到何种困难?

·电子期刊文档在何种程度上存在?

·存在的电子期刊文档完整性如何?

·用何种方法检索现期与过期电子期刊?

·电子期刊使用什么数据格式?这对易于使用、复制具有意义。

作为大规模研究的一部分,统计电子期刊文献的参考文献测定电子期刊对学术通讯的影响。也检测了电子期刊文献与其它电子出版物的联机参考文献的可查检性与来源类型。因此,提出了两个额外的问题。

·电子期刊文献中作参考文献的电子出版物的频率与类型是什么?

·电子期刊中对参考的电子出版物提供的信息在何种程度上是可查检的?

2 研究方法

研究者亲自抽样检索与研究电子期刊文献,亲身体验了各种各样的问题。

确定样本来源为收录有电子期刊信息的两种印刷式指南:Mecklermedia 公司出版的Internet world's on Internet 94,研究图书馆学会(The Association of Research libraries,ARL)出版的Directory of Electronic journals,Newsletters and Academic discussion listes。1995年6月进行的选择样本的过程为:

·从ARL指南中选择的电子期刊取自确定为“评论性”的“电子期刊、杂志与Zines”部分,所有达到标准的电子期刊都成为研究对象。

·选自Mecklermedia指南的电子期刊取自确定为“审定性的”“电子期刊与新闻通讯”部分,达到标准的电子期刊都成为研究对象。

·结合两项选择,去掉重复的,最后的列表上有131种学术的和评论的或审定的电子期刊(以下所指的电子期刊皆指这些抽样的电子期刊)。研究者访问所有的电子期刊,作抽样研究。

大部分电子期刊使用多种检索途径。研究者使用了ARL与Mecklermedia指南提供的所有检索方法去访问电子期刊。如果用提供的任何一种检索方法都查不到电子期刊,这时就使用其它方法。首先,使用Internet查询系统,如:Infoseek,Webcrawler,Lycos,Yahoo等等。第二,研究者查检各种各样的电子期刊的收藏地址,如一种被研究协作会(The Committee on Institutional Cooperation,CIC)藏有的电子期刊。第三,按照指南中提供的部分地址,研究者浏览主服务器中的指南。尽管这种方法直观而费时,但它很有用,因为许多不可检的电子期刊的URL[,s]在指南中都不完整。最后,当以上方法都失败时,他们就与编者联系。

尽了最大努力检索电子期刊,研究者确定了每种电子期刊的可检程度,用户在检索电子期刊时会遇到的问题以及引起这些问题的可能的原因。此外,研究者调查了电子期刊的文档是否存在,如存在,它们的完整性如何。最后,研究者致力于确定电子期刊的生命状态。如果一种电子期刊的文档存在,且1995年包含有至少一期或一篇文章(截止1995年9月1日),就称其为“活的”。否则,研究者就假定其已停刊。

3 研究结果

3.1 检索方法与数据格式

表1说明了检索电子期刊最常使用的方法。大部分使用两种或更多的检索与分发方法。WWW是最常用的分发途径。表1也说明许多电子期刊出版者明显地认识到Listserv系统的局限与实力,而努力用其它方法补充它。无论何时一期新刊或文章都可通过email传输,获取其目次表和文摘,有时甚至是全文。如果一种电子期刊只能通过Listserv获取,检索电子期刊,特别是过刊,就比较困难,特别是对非购买者来说,过程费时且对用户知识要求相当高。另一方面,利用e-mail发行新刊和文章可能是最便利的方式。因此,Listserv软件与其它分发方法并用就不奇怪了。

表1 最常用的检索电子期刊的方法组合

组合方法

电子期刊数

只有WWW

24

Listserv,FTP,Gopher,WWW 9

Listserv,WWW8

Listserv,FTP,Gopher 7

Listserv,FTP,WWW7

Listserv,Gopher 6

FTP,Gopher,WWW,e-mail

6

只有Gopher 6

表2 当前与过期电子期刊(N=125)的检索方法

检索方法 利用此法的

占百分

电子期刊数

WWW83 66.4%

Gopher 53 42.4

FTP52 41.6

Listserv

48 38.4

E-mail 21 16.8

Guidon 7

5.6

Paper (for current 3

2.4

issue only)

Telnet tofreenet1

0.8

* 一种期刊可能提供几种检索方法

表2表明大约三分之二的电子期刊至少使用WWW作为一种分发方法。值得一提的是,e—mail是一种相当简单的分发方法,但仍被六分之一的电子期刊用作分发方法。

表3 电子期刊使用的数据格式

表4 访问电子期刊文档的成功率

访问结果电子期刊数百分比

指南提供的所有方5845.0%

法第一次就成功

一种或多种方法访问失败 7155.0

* 因研究者没有订购,两种

收费电子期刊不能访问

表5 访问文档失败的总结

问题的类型电子期刊数 百分比

指南数据的确认问题55 42.6%

对Listserv与e-mail无反应 9

7.0

三天中的不同时间访问

6

4.7

Gopher URL失败

更改地址,提供新地址

6

4.7

更改地址,未提供新地址 5

3.9

三天中的不同时间访问

3

2.3

Web URL失败

三天中不同时间访问 3

2.3

FTP URL失败

Listserv有反应但并未接 1

0.8

受对电子期刊的订购

* 一种电子期刊可能不只一种结果(N=71)

表3列出了电子期刊使用的不同数据格式。其中,简单的ASCII局限于信息表达能力,因其不能处理图形或特殊字符,如数学符号。另一方面,对于某种学术形式(如评论)和许多领域(如英语和社会学),ASCII完全够用,而且是更好的选择仯普通的ASCII文本也有明显的优势,它们易于被各种计算机软硬件读取与复制,并易于使用浅显的email和listserv技术分发。HTML是WWW使用的标准的显示超媒体文献的语言。PostScript是Adobe的页面设计语言,用来在Internet上分发,打印复杂的文献,包括:分层、字体描绘与图形。表3也表明多媒体出现所需的各种数据格式,如DVI,GIF,MPEG,QuickTime,已开始为电子期刊所使用。

3.2 电子期刊文献的可查检性

表4揭示了研究者访问电子期刊文档的成功率。不到一半的电子期刊可用提供的方法与地址首次检索到。这是一个令人失望的结果,因为电子期刊比起印刷期刊最重要的优点之一就是检索速度。如此低的成功率必须引起重视。用户需要时查不到电子期刊文献,它们的价值就不存在了。

表5列出了研究者访问电子期刊文档失败的结果。超过40%的电子期刊在一种或两种指南中有一个或更多的问题。几乎10%的电子期刊根本不能通过列出的URL[,s]查检到,尽管研究者于三天中用不同的时间访问。11种电子期刊(8.6%)更改了地址,但只有6个在旧址上提供“更改启事”而提供新地址,其余的通过其它方法努力确定新址。9种电子期刊对研究者的listserv和email查询未有任何反应,研究者确定为或者它们已停止出版,不再利用email分发期刊,或是有了新的编者。

研究者联系电子期刊时经历的几乎半数的问题都可归因于印刷指南不准确的数据(见表6)。20种电子期刊的URL信息不全,但仍可通过这部椫信息确定正确的地址。

通过研究者努力发现了14种电子期刊的Gopher,FTP,Web地址,但这信息却未提供于指南条目中。这也可能因为指南信息已收集出版而电子期刊才增加新地址。

提供的9种URL是完全不正确的,大部分可能因为文档已被移到一个完全不同的地址。

表6 印刷指南提供的数据问题

问题的类型 问题出现的次数

部分URL类型20

URL遗漏 14

打印错误 9

给了不正确的Listserv命令 9

URL完全不正确 9

部分URL不正确3

email地址不正确

2

* 一种期刊可能不只一种问题

表7 文档的完整性

文档的状态 电子期刊数百分比

各种方法的文档都完整 8766.4%

一种或多种方法的文档不完整2821.4

不能确定文档的完整性 1612.2

总计 131100%

表8 电子期刊的生命状态

生命状态电子期刊数百分比

文档存在与1995年有出版

9572.5%

文档存在但1995年未出版一期

2821.4

(可能已停止出版)

无法访问到(可能停止出版) 4 3.1

无法确定生命状态

4 3.1

总计 131 100%

另一个决定电子期刊可检性而值得考虑的重要问题是文档的完整性。许多电子期刊提供几种不同的检索方法,也保持适合这几种方法的文档格式。表7报告了每种电子期刊保持文档的完整性的结果。研究者不能确定16种电子期刊文档的完整性。为了尽可能快地出版,一些电子期刊没有一期的概念,尽管他们仍保留一卷与一年的概念。期刊中的文章在被接受后,是独自分发(出版)的,这为电子期刊独特的系统加快了出版过程,因为不必在出版一期前等待足够的文章。但也因此不可能确定文档中是否遗失了文章,因为没有已出版文章的索引。

表8表明了电子期刊的生命状态。4种电子期刊不能确定其生命状态。两种收费的电子期刊研究者尚未订购。另两种没有卷、期、出版年的标识,文档中虽有文章,但不能判别是何时放在上面的。

3.3 电子期刊的收费与检索

一种电子期刊是否收费会影响请求图书馆提供检索帮助的程度。研究者对电子期刊确定了8种价格模式(见表9)。所有的125种电子期刊中仅有13种被确定为收订购费。

研究者使用Chisquare公式测定了几种检索因素与是否收费之间的关系。结果发现,是否索取订购费与成功访问电子期刊文档(见表4)间有着重大关系,免费的电子期刊显然地更可能有检索问题。

表9 电子期刊收费办法

* 如果没有印刷式期刊(N=101)

所有的电子期刊都免费 9190.0%

现期与过期刊物都收费 87.9

现期收费过期免费11.0

订购电子版需是会员11.0

*如果有对应的印刷式期刊 (N=24)

收费办法 电子期刊数

百分比

电子版免费;印刷版收费 16 66.7%

电子与印刷版都收费

4 16.7

电子版免费;但不能

2 8.3

判断印刷版

电子版免费;订购印刷 2 8.3

版需是会员

总计(收费)13 10.4%

总计(免费)

112 89.6%

表10 引用的联机资源的类型、数量与可检性

3.4 对被参考的电子出版物的研究

131种电子期刊中的74种被确定为学术的与评论性的,是可以检索到并带参考文献出版文章的。研究者查检并打印了这样的每种电子期刊出版的最后四篇文章。当1995年9月收集数据时,有6种电子期刊出版了不到四篇文章。74种学术与评论性电子期刊最近出版的279篇文章中,总共有4317篇参考文献。研究者按照其格式将每篇参考文献分类(书、连续出版、书中章节、联机资源等等),更将联机资源细分为Web页面、mmail、电子期刊文献等等。最后他们检索联机参考文献的文本。

总共有83项联机资源(占总量4317篇参考文献的1.9%)被引用。表10按来源(Web页面、listserv posting等等)内容安排,展示了联机的参考文献的类型与频率。研究者发现许多联机参考资源易变、不完整、不可检索,许多根本不导向被引用的联机资源的文本。研究者确定不了12种联机资源(14.5%)的类型,因为目录信息不完整,联机资源检索不到,因而不能进行深层次的调查。

研究者研究了每一篇参考文献,试图获取引用的资料文本。表10的第三项说明了检索83篇参考文献文本的结果,只有约半数被引用的联机资源的文本可检。

表11以另一种窛法分析了这些结果。联机信息资源可以用几种检索协议获取。被引文献中的47篇用了UR兲,研究者利用了Netscape,Web浏览器检索这些URL[,s],但是仅三分之二的URL[,s]导向资料文本。其余三分之一,研究者获得这样的信息“服务器没有DNS entry”或服务器错误信息“无404 URL”。以email提供的信息资源,研究者也以email联系。只有4篇参考文献导向被引用的联机资源。兎种收到邮件服务器信息“未知用户”,另两篇则根本未反应。研究者根据参考文献中的listserv检索信息,使用listserv命令查检到9条中的6条,这需要相当丰富的知识与努力。失败则归因于缺少listserv文档或需求的时间内的文档。这也是不能找到7项被引用的Usenet newsgroup posting的原因。因为研究者可以检索收费的Lexis/Nexis,在两篇电子报纸上的文章找到了。

表11说明除了通过商业服务获得的电子报纸外,没有任何方法可达到全部获取的情况。研究者认为如果一个要引用的作者认为联机资源非常重要,51.8%的比例是相当低的,而且仅仅在一两年后,几乎一半参考文献文本就不可联机检索到。如果作者认为通过查询系统或通过listserv命令知识找到文本是不同的类型,而要求简易查检(即仅通过敲击URL就可获得资料)时,则成功的比例更低。如果这样看待数据,表12总结了可检性的结果。

表11 83篇联机参考文献的检索协议与可检性

检索协议联机参考 可检索参考文献

文献数数与百分比

URL47 31(66.0%)

Email信息 13

4 (30.8)

Listserv信息

9

6 (66.7)

Usenet newsgroup

70 (0.0)

电子报纸

22 (100.0)

提供的信息不完整

50 (0.0)

总计 83

43 (51.8%)

表12 电子出版物联机参考文献可检性结果总结

可检性测定结果 参考文献数量 百分比

可对引用的参考文献进行简易检索 3137.3%

根据引文中信息,经过1214.5

相当努力,引用的参考文献

的文本可查到

根据引文提供的信息查不 4048.2

到引用的参考文献的文本

表12表明仅有37.3%的参考文献提供了可简易检索原文本的信息。14.5%的参考文献,通过努力可以找到文本。几乎一半的参考文献经过努力后也找不到文本。

对引用的电子期刊文章与其它联机资源的直接检索,会给读者以绝对的方便,也是电子期刊超越印刷型期刊的一个大优点。同样地,如果读者查不到所参考的资料,电子资源比起印刷式资料的参考文献用处就小得多。研究者强调,研究的参考文献出版于最近的电子期刊,大部分出版于数据收集的当年。研究者有理由希望这些参考文献的绝大多数是正确与完整的——至少足以令读者找到参考资料的文本,事实却并非如此。研究者总结认为:引用的联机资源的可检性对电子期刊和更普遍地引用电子出版物来说是一个非常严重的问题。

4 结论

这次研究的结果简述了用户检索Internet上如今可获取的出版于学术和评论性的电子期刊文章的文本时所出现的实际问题,这些问题提出了图书馆应该考虑的几个重要问题。

如果学院与研究图书馆要对用户提供电子期刊文本的检索,适当的硬件与软件是必须的。抽样的多数电子期刊运用了两种或更多的检索与分发方法,数据格式,以及为了丰富信息形式的音像功能。因为缺少适当的软硬件,许多用户在自己的计算机上不能完全运用这样的电子期刊。如同院校图书馆为不能个人订购学科领域的许多期刊的用户订购印刷式期刊,他们也必须提供适当的设备与软件给用户,不仅仅包括检索电子期刊,而且包括打印文章与复制有关文档。此外,如果用户要有效地使用提供的设备,用户培训也是必要的。

这项研究结果的问题之一是使用的两种印刷式的电子期刊指南中找到的信息。尽管指南是最近出版的,超过一半的电子期刊不能由指南中提供的一种或多种方法检索到。检索失败的最大原因是不精确的指南信息。研究者认为不精确的主要原因是:指南是年度编辑与出版的,不能跟上相关信息的快速变化。只要电子期刊继续旺盛地增长与变化,印刷型方式不可能适合作电子期刊的指南。事实上,ARL的指南就有印刷型与电子式两种方式。但是电子版只在Gopher上可取,是年度印刷式电子期刊指南的缩略版,而且不是随时更新的。就这点看来,并未充分利用其电子特性。为了跟上电子期刊的快速变化,最新信息应该可以获得——那意味着指南本身就在Internet上,并且不断更新。

另一重要的问题是需要创造与保留电子期刊文档。全部抽样电子期刊的55%不能在第一次以指南提供的一种或更多种方法查检到。超过半数的检索失败因为电子期刊自身的问题,如服务器中断或地址更改。此外,大约五分之一的电子期刊文档不完整,四分之一可能停止出版。研究数据提出了严重的电子期刊文档的持续性与可靠性问题。

院校图书馆传统地进行着不考虑载体形式的与学术相关文献的连续出版物的收藏,电子期刊也不例外。院校与研究图书馆应如何和以何种形式保存电子期刊——纸、缩微胶片、缩微平片、软盘、CD—ROM,或是在公共服务器上,这仍将取决于个人图书馆或者是决定文档保留的合作体。研究者已报告的电子期刊的不可靠的检索使得它们成为新的学术通讯媒体有一定的难度。

传统的学术期刊系统并不是在一日之间建成的。印刷式期刊转变成目前的形式与功能也持续进行了两个多世纪,期刊必须不断发展以更好地完成它作为学术通讯主要媒体的功能。另一方面,学术电子期刊80年代后期可从网络上获取已有较短的历史,学校图书馆在更近的时期内掌握了它们。电子期刊仍处于早期发展阶段,大部分有关于它的问题仍在不断变化。毫无疑问,电子期刊比印刷式期刊有着独特的优势,对至今仍被传统的印刷期刊控制的学术通讯系统提供了革新的潜力。

电子期刊当然是电子出版物的一种形式,尽管研究图书馆认为是最重要的之一。在此对电子出版物的参考文献的研究说明被引资料文本的检索不比检索电子期刊的文章可靠。解决这个问题的方法并非显而易见,因为WWW上有着比电子期刊文献多得多的非电子期刊的各种可引用的电子出版物。

标签:;  ;  ;  ;  ;  

电子期刊及其他电子出版物检索的调查研究_用户研究论文
下载Doc文档

猜你喜欢