文献资源共享与书目数据质量控制_大数据论文

文献资源共享与书目数据质量控制_大数据论文

论文献资源共享与书目数据的质量控制,本文主要内容关键词为:质量控制论文,资源共享论文,书目论文,数据论文,论文论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号:G253文献标识码:A 文章编号:1005-8753(2002)04-0048-03

计算机与现代通信技术的结合构建了高速、广域型的网络环境。随之也带来了一种高效率、能满足读者全方位、多层次信息需求的馆际协作方式——文献资源共享。以文献资源共建共享为最终目的,通过各馆的协同发展,形成优势互补、分工合作、合理布局的信息资源保障体系,使其发挥更大的社会效益,已成为图书馆界的共识和努力方向。书目数据是构成资源体系的基础,如没有规范、一致的书目数据作前提条件,共享将无法进行和开展。因此,树立“大图书馆”观念,研究书目数据质量控制的方法和途径,以确保数据的质量具有极其重要的现实意义。

1 质量控制在实现资源共享中的意义

书目数据的质量控制是指:为保护数据准确、规范、一致所进行的一系列管理和检查工作。在图书馆,书目数据是由编目人员具体完成的。众所周知,编目是图书馆行业中技术含量高的业务工作,质量问题历来倍受重视。实现计算机编目后,对书目数据质量要求非但没有减弱,反而更高、更严格了。这是由于:

1.1 书目数据的质量问题已引起全社会的关注

网络化的迅速推进,使社会在利用高质量信息资源过程中得到发展。为人们提供即时的网上书目信息服务,营造对文献资源共享系统高效开发、利用的良好环境和条件,是社会赋予图书馆人的责任。书目是信息数据库的重要组成部分,社会对其需求是迫切的,竞争也是激烈的。因而书目的质量也受到了广泛的重视,特别是大型的联机编目数据库中,数据的准确性和规范性已成为对数据库评价的重要依据。人们已经认识到了书目数据的规范化是推动信息和文献工作按科学技术规律发展的重要技术基础,是实现文献共享的前提条件,是与国际接轨的重要措施。

1.2 书目数据的质量直接影响读者的检全、检准率

文献的价值在于利用。书目是馆藏文献的缩影。它通过编目语言客观、准确地描述与揭示,使文献和用户达到顺利沟通。书目数据的质量关系到馆藏的收集、整序、组织管理以及用户服务的效果。试想如果数据库的数据有错输、漏输现象,势必造成读者误检、漏检,使得该条数据无法进入正常使用。因此,在编制数据时,必须强调质量的管理和监督。

1.3 非规范数据将面临淘汰

现在,人们已经清楚地看到:由于数据库类型和应用环境的多层次和复杂化,那些在数据库建设之初因急于上马,低水平编制的书目数据,不得不回过头来重新进行数据著录规范工作,所付出的代价是昂贵的。数据库的建设是一项需要花费大量人力、物力和长期积累的过程,忽视了质量控制,势必造成数据库中的无序而变成无用,使得众人的辛苦付之东流。

1.4 书目数据不规范影响数据交换工作和图书馆各项业务工作的开展

目前,国内和国际进行书目数据交换是通过MARC格式进行的。各国的实际情况不同,所制定的MARC格式也不尽相同,但都可以通过一定的程序转换成UNIMARC格式。如著录的数据不规范,将不能生成正确的CNMARC格式,也就无法用于国内、国际间的数据交换与馆际合作的开展。所以说,标准、规范、一致的书目数据对实现文献共享意义重大。

2 资源共享中的书目数据质量控制工作

解决书目数据规范化的最终途径是联采统编,基于种种原因,目前有些地方尚不具备开展此项工作的条件。但用共同的语言和技术手段进行数据的编制,强化对数据的质量控制,以便待到条件成熟后于共享体系挂接,则是明智之举。界定质量控制的内容,是开展此项工作的前提。内容包括:统一著录依据,执行数据格式标准,规范文献标引。

2.1 统一著录依据

编制书目数据遵循的依据包含著录规则,标引规则,机读目录格式,格式中使用的代码标准四个方面。为了满足人们对数据标准化的渴望与需求,近几年,与文献编目相关的法规、标准、规则、手册等陆续出台。仅CNMARC及其手册就有多个版本问世。图书馆工作人员在实际使用中发现:

2.1.1 各馆著录依据的蓝本不同,必然造成书目数据不一致。例如:有些馆中文图书主题标引使用《中国分类主题词表(1994)》本,用《汉语主题词表自然科学(增补本)》作为其补充。而有些馆则以《汉语主题词表》或《中国分类主题词表》为依据。依据词表的主次位置不同,必然造成同种文献选取标引词的差异。

2.1.2 所见的每一种“规定”都是瑕瑜互见,有其不完善之处,且文献编目中的许多情况在“规定”中得不到解释,加之编目人员水平参差不齐,也会造成数据质量不同。例如:对原著非初版影印书版次的著录,出于遵循规则的不同,有的将其作为不同版本著录于版本项,有的将其放在副书名中。

迄今为止,国内一些馆,特别是中小型馆仍不肯放弃“本馆特色”,尚未采用或未完全采用国际和国内标准,导致书目数据著录不规范,组织系统不匹配,致使许多馆建数据库处于“休眠”状态,严重阻碍了我国文献资源共享的进程。因此,统一书目著录的依据,是书目数据走向标准化关键的一步,是实现资源共享的保障。理想的模式是:由国家权威机构制定出一整套书目数据编制的标准依据,并组织跟踪使用,不断修改,不断完善。待条件成熟后,以法令的形式向图书馆界推广,同时废止其他相关标准。为统一著录依据提供法律上的保障。

2.2 原始编目格式标准化

目前,图书馆编制书目数据多采用套录源数据与原始编目相结合的方式。源数据为图书馆界中享誉高的权威机构所编制。源数据数据规范,揭示内容丰富,数据质量有保证,但由于目前图书出版形式多样、发行渠道复杂、图书数据滞后等原因,源数据命中率仅为50—60%,大量新书仍需进行原始编目,因而对原始编目格式进行质量控制是非常必要的。原始编目中容易出现的问题主要是:

2.2.1 字段、指示符和代码使用不当。一些工作人员习惯用手工编目的观念去对待机读书目编制工作,只重视八个著录项目的字段,忽视头标区和编码手段,致使这些字段的填充混乱不堪,影响了机读目录的检索效率,因为MARC正是根据这些代码抽取检索点的。

2.2.2 对MARC格式中的连接对应问题不够重视。字段与连接是环节与线索的关系。有了连接对应,MARC的结构将变得清晰有序。在编制书目数据时,应特别注意头标区与225、4××字段的连接,105与215、320字段的连接对应,以及200与5××字段,690与905字段的连接对应问题,以保证数据前后一致。

2.2.3 尽可能使用完全著录级次。手工著录阶段,因受卡片目录检索不便的限制,著录级次较低,计算机内存容量大、检索点任意,现阶段,图书馆编目应尽量采用完全级著录,充分发挥书目揭示文献的作用。

由此可见,格式质量控制的含义不仅包含对录入易错问题的控制,还包含对著录格式标准的控制。编目格式实行标准化,是提高书目数据质量关键所在。从文献资源网络系统的发展趋势看,标准的机读目录格式将有利于数据的传播与交换,也使质量控制更具可操作性。

2.3 文献标引规范化

文献标引是把自然语言转化成人工语言的过程,可分成主题和分类标引两种。其中主题标引根据文献内容主题,以主题词表为依据对文献进行描述和揭示,具有专指、灵活和直接的特点,可将杂乱无序的文献转变为有序、规范的文献检索体系,能将某一主题概念的文献资料准确地、集中地、全面地提供给用户,这在信息激增的今天,越来越受到人们的重视。因此,标引的规范化问题也被提到议事日程上来。主题标引规范化应从以下几个方面着手:

2.3.1 全面标引。即要对文献中显性和隐性的主题充分揭示。利用计算机存储量大,可在检索系统中经过逻辑运算,进行主题词的组配的优势,逐步逼近目标,满足专指性检索需求。进行主题标引时,应仔细、全面地阅读该文献慎重标引,以免影响数据质量。

2.3.2 准确选词。是指所选择的主题词切题、规范,能够表达文献主题概念的内涵和外延。特别是边缘学科、新兴学科和交叉学科,含有多个主题的文献需用主题词相配,组配又是容易产生分歧和误差的。这就要求标引人员能精确地把握住专业词汇的内涵及相互关系,通过词表查找到与之相应的主题词。

2.3.3 规范控制。由于文献本身的复杂性、著者形式的多样化以及不同编目人员或同一编目人员在不同时间对文献处理的不一致,常出现检索点形式不同的情况,如:同主题文献标引用了不同的主题词。为避免这种现象的发生,就必须进行规范控制,保证书目数据中主题标引的一致性。

3 实现质量控制的保障

3.1 开展业务交流,提高编目水平

书目数据质量控制工作中,人是决定因素。工作人员的文化素质、对依据的理解程度及责任心都会影响数据质量,编目中要注意把人的积极性转化成数据的高质量。通过日常沟通或专题会议等方式交流编目心得、总结经验、修正错误。或委派人员参加各种与著录规则有关的会议,或在网上链接国家书目数据中心的网站,及时了解新的动态、借鉴先进经验、贴近国家标准,以提高本馆编目水平。

3.2 数据的校验与维护

严格审校制度不仅是数据质量控制中的重要环节,还是质量控制的表现形式。校验应首先制定审校指标,用人工或计算机对数据中每条记录逐一进行校对,将差错率降到最低点。因软件升级换代及数据录入不规范等原因,数据库需要经常维护。可根据使用部门反馈的信息,集中进行清除冗余,合并数据等工作。

3.3 树立“大图书馆”观念

过去,孤立办馆的结果在数据著录上保留许多“本馆特色”规定,这是书目数据走向标准化的障碍。编目人员从思想上要树立“大图书馆”观念,从图书馆事业整体利益的高度出发,摒弃不符合标准的做法,积极采用国家规定的统一编目标准。

综上所述,在建设书目数据库,必须有明确的质量控制意识,切实可行的操作方法,以保证数据的准确、完善,才能为文献资源共享环境的建立奠定坚实的基础。

标签:;  ;  ;  

文献资源共享与书目数据质量控制_大数据论文
下载Doc文档

猜你喜欢