我国书目信息标准化的现状与发展对策_数据标准化论文

我国书目信息标准化的现状与发展对策_数据标准化论文

我国书目信息标准化的现状与发展对策,本文主要内容关键词为:对策论文,书目论文,现状论文,我国论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

〔中图分类号〕G254.3〔文献标识码〕A

〔文章编号〕1002-1167(2000)06-0003-04

1 我国书目信息标准化的进展与问题

书目信息标准化是一项系统工程,它包含着诸多子项目,而每个子项目都对整体工程产生直接的影响。

1.1 著录标准化

书目数据的质量在很大程度上取决于著录的标准化。国际图联编制了《国际标准书目著录》(ISBD)以后,使得不同国家编目数据的互换及著录项目的识别成为可能,也为手工的目录数据转换为机读数据奠定了基础。因此它很快就成为各国制订编目的指导性文献。我国于1979年成立了全国文献编目标准化组织,即全国文献工作标准化技术委员会第六分委员会(文献著录分委员会)。80年代,陆续颁布了《文献著录总则》(GB3792.1-83)以及适用于普通图书、连续出版物、非书资料、档案、地图、古籍等不同类型文献著录的一系列国家标准。此外,还制定了《检索期刊条目著录规则》、《文献编写规则》、《文后参考文献著录规则》等国家标准,基本上形成了比较完备的著录标准体系。[ 1]。在西文文献著录方面,第六分委员会与中国图书馆学会合作,组织有关单位共同制订了《西文文献著录条例》,于1985年8月正式问世。 该条例主要参照了AACR-2,也适当考虑了我国的西编工作实际, 对西文文献著录标准化起着重要的促进作用。

新的著录规则国家标准注意了与国际编目标准的一致性, 采用ISBD的符号标识系统与格式,因而可以与国际条例兼容和进行国际书目数据互换。从实践来看,新的著录规则的实行也是比较成功的。在我国各类型图书馆已被普遍采用。90年代以来,根据我国《标准化法》的有关规定,GB3792系列国家标准又陆续作了修订,以便与ISBD进一步统一,同时也有利于计算机编目的操作。1996年,全国情报文献工作标准化技术委员会第六分委员会又组织制定了《中国文献编目规则》,更详细全面地对各类文献的著录作出规定。

但我国的文献著录标准化仍然存在一些问题。其一,标准化水平有待提高。现行文献著录标准中的“非标准化”现象还较严重,在著录项目、著录格式、著录详简的规定上,各标准之间存在着不统一现象。《西文文献著录条例》在著录格式等方面也与国家标准《文献著录总则》不尽相符,使中外文目录的统一仍难以实现。其二,标准的修订工作亟需规范。目前我国标准修订过程太长,如GB3792系列早在1990年就开始修订,但至今尚未正式批准颁布,而标准修订稿又已在有关文件中公布,因而造成原来正式的国家标准与标准修订稿并存的局面,编目人员无所适从。同时,标准修订后相关标准修订不能及时跟上,使得标准自身不标准、不统一,按有关标准编制的目录也不统一。其三,标准的实施和执行不力,标准化的宣传推广工作有待加强。

1.2 标引标准化

文献标引是揭示文献内容特征的一种手段。分类标引和主题标引的结果将形成文献检索系统中两种重要的检索点。因此,标引质量是书目数据标准化直接和重要的影响因素。为了保证文献标引的标准化,必须有统一、兼容的检索语言。在这方面,中国情报文献标准化技术委员会已积极开展了一系列标准化活动,如:推荐《中国图书馆分类法》和《汉语主题词表》作为候选的国家标准分类法和叙词表,目前《中图法》虽未转为正式标准,但全国大多数的图书情报机构都在使用它,实际上占有国家标准分类法的地位;制订《汉语叙词表编制规则》、《多语种叙词表编制规则》、《文献主题标引规则》、《档案分类标引规则》等并以国家标准的形式正式公布,《文献分类标引规则》、《同类书排列书次号编制规则》等也作为标准草案提出[2]。 但在检索语言的标准化、兼容化方面,仍然存在不少问题,表现在:①已颁布的国家标准如《汉语主题词表》并未被普遍使用,不少单位仍在使用自行设计的检索语言,而这些检索语言在编制使用上各行其是,只顾满足本系统、本单位一时的需要,很少从全局考虑。新生产的数据库没有严格按照国家标准进行标引的情况,也不同程度地存在。②检索语言的兼容还停留在较低的水平,一般只是在选词、结构安排、关系显示、标引规则等方面参考现存检索语言,对一些较为先进的兼容技术,如词汇的自动转换等没有系统的研究和应用。

即使在检索语言统一的情况下,标引标准化仍有不少问题需要解决。如在分类法统一的条件下,如何在分类标引的细则上保持一致,比如对多卷书的处理、复本书的处理、交替类目的选用、复分表的使用等,应用统一的规定。采用《汉语主题词表》、《中国分类主题词表》进行主题标引,在具体操作时还需要有一系列的标引规则和统一的实施条例,以便标引人员共同遵守,达到一致性的要求。[3]

1.3 在版编目

在版编目(CIP)是推动图书编目工作的标准化、规范化, 保证书目信息与图书出版同步传递的重要措施,70年代末被介绍到我国,立刻受到出版、发行、图书馆、情报等各界的关注。经过80年代的酝酿、准备,国家技术监督局1990年7月批准并于1991年3月实施《图书馆名页》和《图书在版编目数据》两项标准,标志着CIP在我国正式采用。[4]

近10年来,CIP在我国逐步推行。 目前全国已有一半以上的出版社实施CIP。国家新闻出版署信息中心成立了在版编目处, 全面负责我国有关CIP的组织、规划、协调、审核、 数据库建设以及人员培训等工作。有关方面也为规范CIP做了大量工作,制订了一系列规范CIP书名页排版印刷、著录、标引、机读目录格式等的法规、标准,促进了CIP 逐渐标准化、规范化。

但我国的CIP并未取得预期的效果。对图书馆而言, 最突出的是编目数据的质量问题。部分CIP数据著录格式、标识符号不标准, 主题标引、分类标引不规范。更有甚者,个别出版社出于某种不良目的,有意为出版的图书配一个不正确的分类号。因此,CIP数据出来后, 图书馆系统往往不敢使用,因为下载或摘录其中几项既费力,又不实用,还不如另起炉灶再编一套适合自己图书馆使用的数据。这就不仅造成了人力、物力、财力和时间的浪费,而且加剧了书目信息的不标准、不规范。所以,保证在版编目数据的质量,应该引起有关方面的重视。

1.4 机读目录格式规范化

机读目录格式是书目信息在数据库中的组织形式,是计算机识别、处理书目信息的特定数据结构。从图书馆自动化、网络化的发展趋势来看,不仅要有统一的著录标准和标引工具,还必须有规范的机读目录格式,这样才能在国家乃至世界范围内实现书目数据的通讯和交换,也便于对书目数据进行质量控制。

早在60年代初,美国国会图书馆首先研制出最初形式机读目录MARCⅠ, 1968 年又推出更具灵活性和通用性的MARC Ⅱ格式(亦称LCMARC或USMARC)。1973年, ISO 审核MARC Ⅱ格式后,将其定为国家标准。MARCⅡ的出现是书目工作发展史上一次重大的突破,对全世界图书情报工作产生了巨大影响。许多国家如英国、德国、法国、加拿大、澳大利亚、日本等国都先后采用了这一标准格式结构。为了实现机读目录国际交换,国际图联又制定了一整套书目记录内容标识符,于70年代和80年代先后出版了《UNIMARC:通用MARC格式》和《UNIMARC手册》,并要求各图书馆以此作为机读目录的国际交换格式。

我国的机读目录格式是在研究、吸收国外成果的基础上不断完善起来的。1982年,我国颁布了国家标准《文献目录信息交换用磁带格式》(GB2901- 82),具体规定了MARC 格式的逻辑组织原则与实施方法。1986年,北京图书馆等单位编写了《中国机读目录通讯格式(讨论稿)》(CNMARC),1994年重新修订,增加了地图、乐谱、非书资料、计算机文档及拓片等内容,定为《中国机读目录格式》,于1995年通过评审鉴定,被确定为文化部行业标准。目前,我国图书馆已经运行和正在研制的自动化系统都采用了CNMARC和LCMARC作为中文和西文的书目数据格式。

机读目录格式的确定,为我国各种书目数据库建设的规范化及书目数据的共享奠定了基础。但由于各操作单位对MARC格式字段的理解、做法不一,因而仍然影响了书目数据标准化和规范化。此外,由于许多文献机构早期自编的书目数据存在着不规范的情况,无法进行数据的交换与共享。怎样用规范化的数据去更换这些非规范数据,工作量是很大的。[5]

1.5 规范控制

由于文献主题的复杂性、著者名称的多样化以及不同的编目人员或同一编目人员在不同时间对文献处理的不一致,常常会出现标目(检索点)形式不同的情况,为避免这种现象的发生,就必须实行规范控制,在机读编目中又称为规范文档,包括主题规范文档和名称规范文档(人名、团体名称、会议名称、地理名称、统一题名、丛编名)。编目人员或计算机通过查检规范文档,选定某个名称作为标目,从而将与该名称相关的记录集中在同一规范、标准的标目下,以保证标目的一致性、规范化。因此,规范控制是在文献著录标准的基础上,进行标目规范化,对编目工作实行全面标准化的工作。

由于在文献著录方面各国已普遍实行《国际标准书目著录(ISBD)》原则,我国亦据此制定了国家标准《文献著录总则》以及有关文献类型的著录标准,《中国文献编目规则》又按照文献著录、国家标准的框架加以细化,使其成为可操作的编目工具,所以,文献著录标准化的问题在国内外图书馆界已基本解决。然而标目规范问题涉及各国目录传统,文字特点和检索习惯问题,不可能世界范围内实现不同文种文献标目的统一。为实现文献检索的规范化,提高书目系统效能,各国必须自行制定编目规则,力求在同一文种书目系统进行规范控制[6]为此, 我国自80年代末以来积极开展了规范数据标准化的研究,并于1990年由北京图书馆制定了《规范数据款目规则》和《中国机读规范格式》两项规范款目标准草案。1997年,北京图书馆又编写了《中国机读规范格式使用手册》、《中文图书主题规范著录规则》、《中文图书名称规范数据款目著录规则》,使各图书馆在编制规范数据时有了依据。

就整体而言,我国的书目规范控制仍然是薄弱环节。从图书馆来看,主要是一些编目人员对规范控制缺乏认识,特别是由于一些图书馆要快速建库,往往就忽视了规范控制,因而产生了大量名称标目和主题标目与规范名称不相符的情况,降低了书目(数据库)的检索效率。从宏观角度来看,我国目前还没有全国性书目规范控制计划,没有建立大规模的规范控制系统,地区或部门之间也没有开展规范控制数据交换,许多书目系统根本就没有规范的控制[7],这种状况亟待改变。

2 推进我国书目信息标准化的若干思考

如上所述,我国书目信息标准化已经有了令人瞩目的进展,但仍然存在不少问题。这些问题,有属于技术层面的,但更多的则是观念、管理、制度层面的问题。如何进一步推动我国书目信息标准化的进程,笔者认为:

2.1 完善书目工作标准化体系

面对现代信息技术条件下,特别是网络环境中迅速发展的书目工作实践,我国的书目工作标准化体系需要不断完善。一是要紧跟新技术的发展和文献信息载体的变化,及时制订有关标准,对目前尚付厥如的书目工作标准及相关的信息技术、管理标准,要尽快制订。在制订标准时,要尽可能向国际标准靠拢。只有与国际接轨,才有利于促进文献信息的国际交流,实现文献信息资源的国际共享。二是依据我国的《标准化法》的有关规定,标准在实施一段时间后,应根据具体情况对标准进行修订,这样才能适应信息环境变化。对目前已经过修订的著录规则,应尽快正式批准为国家标准,以避免编目中两种标准并存的情况。三是目前有些标准还缺乏可操作性,或者人们对它的理解不一,有关权威部门应该制定一些实例细则或条例,以指导具体的编目工作。

2.2 强化图书情报界的标准化意识,加大推广标准的力度

制订标准的目的在于应用,标准订得再多再好而得不到实施,就不会产生效益。由于我国传统的图书馆长期以来是在孤立、封闭的状态中运行的,图书馆之间缺乏协作,更谈不上资源共享。没有协作精神、全局观念,标准化意识必然淡薄。因而在著录、标引、馆藏数据库建设中,自行其事,较多地考虑本单位的“特殊性”、“传统”,而很少从全局考虑标准化问题。因此,必须在图书情报界大力宣传标准化,强化图书情报工作人员,特别是编目人员的标准化意识,加大推广执行标准的力度,可以通过举办各种类型的培训班、编印有关标准化的资料、开展有关标准化的学术研讨活动等形式,加大宣传推广的力度。同时要明确要求“有标准必依,执行标准必严”,维护标准的严肃性、权威性。

2.3 加强标准化工作的管理与协调

书目信息标准化不仅有诸多环节,而且涉及到若干部门。各部门都有自己的需要和利益,如果缺乏宏观的管理与协调,标准化工作就会受到影响。比如说,现在出版社、书店、图书馆都有编目工作,但由于缺乏协调,各部门都根据自己的需要,选取适用于本行业的规则来进行编目。书业书目中多数征订目录按照《中图法》或《人大法》在进行分类,按《征订目录编排格式》在进行编目;出版社图书在版编目数据的,是按照《普通图书著录规则》著录、《中图法》分类,《文献主题标引规则》进行主题标引;图书馆的编目,是按照《中国文献编目规则》在进行。这样编制出来的书目信息,怎么能够互换和共享?又谈何标准化?因此,必须加强对各部门书目工作的宏观控制和协调,要求各部门切实按照国家标准进行编目。

2.4 深化对书目信息标准化的理论研究

书目信息标准化的实践必须有理论的指导。理论研究要不断总结标准化实践中的新经验,分析新情况,关注信息环境的变化及其对书目信息标准化的影响。要紧紧跟踪国外理论研究与实践发展的新动向,提出新对策。例如,随着因特网的迅速扩展,网络信息资源日益庞大,为便于用户准确快速地找到自己所需要的信息,就必须对无序的网络信息进行组织(著录、标引),因此,元数据(Meta-data )的概念应运而生。目前国外已有多种用于组织网络信息资源的元数据格式,而且特别看好Dublin Core。我们必须密切关注这一研究领域, 对元数据格式标准化问题,及时提出我们的对策。

〔收稿日期〕2000—05—30

标签:;  ;  ;  ;  ;  ;  ;  

我国书目信息标准化的现状与发展对策_数据标准化论文
下载Doc文档

猜你喜欢