我国网络论文数据库的比较研究_数据库系统论文

对我国网络型学位论文数据库的比较研究,本文主要内容关键词为:学位论文,我国论文,数据库论文,论文论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

学位论文是高等院校或研究机构的本科生、研究生为取得学位资格而撰写的学术性研究论文,由于所有取得学位的学生都必须提交学位论文,所以学位论文的数量非常可观。学位论文一般分为三种,即学士论文、硕士论文和博士论文,它是一种原始研究的成果,其中不少具有一定的独创性和学术价值,是一种重要的信息资源。学位论文除一部分在答辩通过后发表(大多是节选一部分或经缩写后发表)或出版外,多数不公开出版发行,作为内部资料,只在授予学位的院校或研究机构的图书馆和按国家规定接受呈缴本的图书馆保存有副本。学位论文的检索也不太方便,在手工检索时代,我国的学位论文主要是通过《中国博士学位论文提要》(北京图书馆学位学术论文收藏中心编,书目文献出版社出版)、《中国博士科研成果通报》(国务院学位委员会编辑,北京理工大学出版社出版)、《中国学位论文通报》(双月刊,中国科技情报所编辑)等检索工具进行检索,学位论文的原文获取就更加困难。

随着计算机技术的发展,学位论文的检索向计算机化发展,有条件的大学开始建设本校的学位论文数据库,也出现了全国性的学位论文数据库,如中国科技信息研究所的《中国学位论文数据库》(Chinese Dissertations Database,简称CDDB)。在Internet迅速发展的情况下,数据库都向网络版发展。目前检索我国的学位论文,除了可以通过各校的网站检索该校的学位论文外,综合性的学位论文网络型数据库主要有:万方数据资源系统的科技信息子系统,其中的“中国学位论文数据库”,实际上是CDDB的网络版,收录各高等院校、研究生院及研究所向中国科技信息研究所送交的学位论文;“中国高等学校学位论文检索信息系统”,是由清华大学图书馆提出并与北京大学图书馆、北京邮电大学图书馆、电子科技大学图书馆、东北大学图书馆、东南大学图书馆、华南理工大学图书馆、华中理工大学图书馆、上海交通大学图书馆、西安交通大学图书馆、北京化工大学图书馆等单位合作建设的网络共享型数据库;“CALIS高校学位论文数据库”,是由CALIS全国工程文献中心(清华图书馆)牵头组织,协调全国83余所高校合作建设的文摘索引数据库。这些数据库各有特色,对它们进行比较研究,有利于进一步完善我国学位论文信息的获取和传递系统,可以更好地发挥这一宝贵的信息资源的作用。

1 几种网络型学位论文数据库介绍

1.1 中国学位论文数据库

《中国学位论文数据库》是由中国科技信息研究所万方数据公司开发研制的,其前身是由中国科技情报所1984年创刊的双月刊《中国学位论文通报》,该刊于1993年停刊。其后《中国学位论文数据库》光盘问世,该数据库还可以提供联机检索[1]。目前,《中国学位论文数据库》同时提供联机检索、光盘版和网络版数据库。我们在此主要是介绍网络版数据库的情况并与其它数据库进行比较。万方数据资源系统1997年8月面向社会开放,《中国学位论文数据库》是其科技信息子系统中的一个数据库。该数据库虽然介绍其内容是收录我国自然科学领域的硕士、博士和博士后的论文,实际上,也包括社会科学领域,如哲学、经济、管理、语言、文学等,目前已有27万余条学位论文信息,并以每年3万余条的速度增长。

1.2 中国高等学校学位论文检索信息系统“中国高等学校学位论文检索信息系统”是清华大学图书馆和IBM中国研究中心合作进行的电子图书馆系统的研究与开发项目的一部分,参加该系统建设和数据提供单位有11家,共收录了25432条记录[2]。目前,这些数据已并入“CALIS高校学位论文数据库”,也不再录入新的数据,所以,“中国高等学校学位论文检索信息系统”可以看作高校系统建设学位论文数据库的试验性项目,当然它存在着收录论文的数量少、地域分布范围有限、学科覆盖面小、检索途径单一等缺陷。目前,“中国高等学校学位论文检索信息系统”中的数据已全部汇入“CALIS高校学位论文数据库”,对这些信息可以通过“CALIS高校学位论文数据库”进行检索,因此,“中国高等学校学位论文检索信息系统”可以说已基本完成了自己的历史使命,我们在下面的比较研究中也不把它作为重点。

1.3 CALIS高校学位论文数据库

“CALIS高校学位论文数据库”是CALIS的自建数据库项目之一,由CALIS全国工程文献中心负责组织、协调进入“211工程”的61所高校合作建设。它采用统一规范、分散加工、集中建库的运作模式,由工程文献中心制定数据规范,各个参建单位使用统一的录入软件,分散加工数据,并定期通过FTP方式向工程文献中心提交数据,工程文献中心对汇总的数据进行质量控制和检测后,通过CERNET提供服务[3]。该项目于1999年3月启动,自2000年4月开始向高校用户提供服务。由于CALIS作为高校文献资源保障体系,其建设得到全国高校的普遍支持,目前已经参加和提出申请参加该项目建设的学校有近90家,“CALIS高校学位论文数据库”的规模正越来越大。每篇学位论文除提供中文摘要外,大多数还提供英文摘要。

各数据库的其他基本情况可见表1。

表 1 各数据库的基本情况

2 《中国学位论文数据库》与《CALIS高校学位论文数据库》的比较

2.1 数据库基本数据的比较

从两者的基本特征看,它们都是一个大的信息系统中的子系统。《中国学位论文数据库》属于万方公司万方数据资源系统的科技信息子系统中的一个数据库,而《CALIS高校学位论文数据库》则是“CALIS联机公共书目查询、馆际互借系统”中的联机公共数据库之一。所以,两者无论在检索途径、检索方法还是输出形式、提供的其它服务等方面,都与其所在系统保持了一致性,并带有各自的特色。前者从1995年开始建设,而后者是1999年才开始起步的,所以,从数据量和数据的完整性看,前者要远远高于后者,特别是回溯数据,后者大多数数据都是1997年以后的。在更新速度上,目前《中国学位论文数据库》约年更新3万条,而《CALIS高校学位论文数据库》还没有明确的年更新数据统计,从开始建设到目前的数据量计算,年更新约2万条以上,但随着加入学校的增加,年更新量还会增长,其数据的完整性将视参加学校的数量和各校加工数据的情况而定。从信息的时效性看,因万方数据股份有限公司提供有会员用户、服务中心、镜像用户、光盘服务、网上检索、定题服务和网上定购等多种服务方式,其中光盘和镜像的时效性较差,而CALIS则是一个基于网络的信息服务系统,其数据是随时更新的。两个数据库论文的收录范围基本相同,都包括了所有专业。

2.2 记录字段的比较

《中国学位论文数据库》的记录字段有:主文件记录号、论文题名、作者、作者专业、所授学位、导师、授予学位单位、原文馆藏号码、中图法分类号、论文页数、出版时间、关键词、文摘;《CALIS高校学位论文数据库》著录的字段有:论文题名、作者、作者单位、作者专业、并列题名、学位级别、导师、中文文摘、英文文摘、索书号、主题词、分类号、论文答辩日期、论文页数、文献语种、记录来源、记录流水号。总体上看,两种数据库都著录了表示学位论文外部特征和内部特征的最基本信息,两者比较,后者的记录字段更多一些,对摘要的著录也更加详细,有利于用户更清楚地了解文献的内容,其中较有特色的是并列题名、英文文摘等字段,有了这些字段,为数据库信息在世界范围内使用奠定了基础。

2.3 检索途径的比较

两种数据库的检索各具特色。《中国学位论文数据库》设计了普通检索和专业检索两种检索方法,在普通检索中可对全文、题名、作者、导师、分类号等字段进行单字段或二个字段间的组配,专业检索则可以用逻辑运算符进行复杂组配检索,对于检索结果都可以进行二次检索,用户可以根据检索结果不断调整自己的检索策略,缩小文献范围;《CALIS高校学位论文数据库》设计了基本检索和高级检索两种检索方法,在基本检索中,可对题名、作者、导师、作者单位、作者专业等字段进行单字段简单查询,同时设有时间限定,高级检索除了基本检索中提供的字段外,还增加了摘要、本地分类号、全面检索、主题等字段,并可在四个字段间进行组配,也可执行时间限定,由于设“并列题名”的字段,所以,也能通过题名用英文进行检索,这是它较有特色的一个地方。

从实际检索效果来看,在已知某一论文的相关信息(如题名、作者、导师等)时,两种数据库都能较为方便准确地查到。而查询特定内容的论文,则两种数据库的查全率和查准率都不尽如人意。由于没有对同义词、近义词的说明和指引,很容易造成漏检,对题名或主题字段的检索,也会造成漏检,而全文检索则会带出许多不相关的文献。从组配功能来看,两者差别不大,《CALIS高校学位论文数据库》的检索入口和组配功能强于《中国学位论文数据库》,但后者的再次检索功能在很大程度上弥补了这一缺陷。时间限定随着数据库累积数据的增多会越来越显出其作用,《中国学位论文数据库》由于没有时间限定,不能检出某一时间段的文献,只能通过再次检索,限定特定年份的文献。从数据库的易用性和友好性看,《中国学位论文数据库》更好一些,对非专业人员和普通用户来说更容易掌握,它的再次检索功能,可以使用户根据检索结果不断调整自己的检索策略,直到结果较为满意,同时它也设置了检索帮助,对初学者是十分有用的。相对来说,《CALIS高校学位论文数据库》更适合专业人员使用,从数据库与馆际互借同属一个系统的设计来看,它也是更多地为专业人员设计的。

2.4 其他功能比较

检索结果的显示两者不同且各有特色。《中国学位论文数据库》提供了全记录格式、参考文献格式和论文题名目录三种输出形式供选择,其中全记录格式直接显示检索结果的各字段的形式,参考文献格式显示作者、所获学位、授予学位单位、题名和出版时间,每屏皆显示20条记录,而《CALIS高校学位论文数据库》则先显示检索结果的简单记录,每屏显示20条记录,点击后显示每条论文的详细记录。前者的直观性较强,但不能对检索结果进行选择,下载记录只能一屏一屏进行,而后者可以对每条记录作标记,选择确定最后的输出条目。在其他功能的设计上,《CALIS高校学位论文数据库》做得更好一些,如可以对检索结果进行选择,并选择保存所选记录的简单或详细形式,还能直接用E-mail发送检索结果,同时,由于数据库查询与馆际互借属于同一系统,原始文献的获取就可以通过CALIS的馆际互借系统进行传递和经费结算。

3 小结

网络为我们查询学位论文提供了有利条件,使得学位论文这一宝贵的信息资源能够得到更多的开发利用,也使原来作为内部资料的学位论文具有更多的公共性。《中国学位论文数据库》和《CALIS高校学位论文数据库》这两个我国各具特色的全国性学位论文数据库,前者属于商业数据库,由数据公司的专业人员对数据进行集中标引和著录,统一性较好,但著录略显简单;而后者属于资源共享型数据库,由参建单位分散进行标引和著录,在数据的详略和标引质量上各校有所差别,统一性略逊。这两种数据库如能互相取长补短,将使用户的检索和使用更加方便。

标签:;  ;  ;  

我国网络论文数据库的比较研究_数据库系统论文
下载Doc文档

猜你喜欢