中国现代文献编目的发展与问题(1996-2000)(续)_国家图书馆论文

我国现代文献编目的发展及其问题(1996-2000年)(续),本文主要内容关键词为:目的论文,文献论文,我国论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号:G254.3

文献标识码:A

文章编号:1004-1680(2001)01-0001-10

5 对计算机编目技术的研究

近年来,随着计算机在图书馆的应用以及机读目录格式的推广,从传统手工制作的束缚中解放出来,探讨文献的深层揭示与广泛利用,使读者从不同角度方便、快速地查找所需资料,充分利用计算机技术使其更好地为读者服务,这些都促使图书馆工作者对中国机读目录格式(CN-MARC格式)进行深入细致的研究与探讨。

1996年2月文化部发布文化行业标准,规定自1996年7月1日起,全国公共图书馆系统均需采用《中国机读目录格式》(简称CNMARC格式)进行图书编目。目前,各高校图书馆与大中型公共图书馆都选择用CNMARC格式进行图书编目。早在1991年,由国家图书馆自动化发展部根据UNMARC起草《中国机读目录通讯格式》后,国家图书馆、高校系统、一些大型公共图书馆先后采用CNMARC格式进行编目。仅国家图书馆积累的CNMARC数据就有100万多条,加上文化部组织国家图书馆、上海图书馆、广东省中山图书馆、深圳图书馆四馆联合编制的《国家回溯书目数据库》第一期工程的16万条数据,以及全国高校联合编目、上海申联统一编目、北京高校统一编目与各个图书馆自建的CNMARC数据库,据笔者大约估计,我国现有的CNMARC数据总量当在300万条以上,这是一笔非常宝贵的精神财富。我国CNMARC格式编目中的主要问题及其研究有:

5.1 对题名中字符排序的处理 对题名中字符排序主要有3种不同做法:

其一是将指示符2作为非排序的字符值标识。国家图书馆发行的CNMARC数据采用了这种方法。

例1:20018@a全国绣像三国演义

例2:20012@a《红楼梦》心理趣谈

这种方法的优点是无论编目人员或计算机都比较容易处理,简洁直观。持反对意见的人认为该方法只能对位于数据元素开始位置的非排序字符值加以控制,对位于中间位置的非排序字符值则无能为力。如例2,若检索者用“《红楼梦》心理趣谈”检索则不能命中该文献,只能输入“红楼梦心理趣谈”才行;同时对不参予排序的字符超过9个时也无法处理。有人认为,对于以上两个问题的处理很简单,数据元素中间有不参予排序的字符时,可规定正题名无检索意义,另在517字段补充一个完整“干净”的题名代检索。

其二是直接采用UNIMARC的规定,当数据中有不参加排序的字符时,可用《书目控制集》(ISO6630)中的“非排序控制功能”符加以控制,以NSB表示不排序字符开始,紧插在不排序字符之前,以NSE表示不排序字符结束,紧插在不排序字符之后。

其三是采用软件控制法,可以在编目软件中用一文件(以下称“非排序字符文件”)来定义一些明确规定不参予排序的汉字或符号,如常用的“全图绣像”、“《”、“》”、"("、"and"、"&"等等。当然这个文件是可以由用户自己修改的。软件在数据存盘时先将拟写入索引档的键词以该“非排序字符文件”过滤掉不排序的字符,直接以比较“干净”的文字存入倒排档;在进行检索时也需用“非排序字符文件”过滤掉检索式中不参予排序的字符,才能准确查找到它。

5.2 交替题名与并列题名的处理 CNMARC文本规定,交替题名重复用"@a"子字段表示,第二个"@a"后著录为“又名,××××”。例如:2001@a西行漫记@a又名,红星照耀中国。但有人认为,交替题名为正题名的一个组成部分,著录在一个@a后即可,例如,2001@a西行漫记,又名,红星照耀中国。

CNMARC文本规定,“ISBD规定的标点符号,一般不在著录块的子字段范围内记载。”不进入机读数据,但200字段中的“@d并列题名”情况却不同。CNMARC文本及国家图书馆发行的机读数据均在"@d"后加"="。对此,许多单位表示异议,并在自己的机读数据中不加"=",改由软件自动生成。例如:2001@a默克诊疗手册@d=The merck manual。

笔者认为,交替题名是一个有机整体,两部分都属于正题名,可以只著录一个@a。而"="符号具有特殊性,有别于其他标识符号,保留为宜,如果将其省略则有可能产生歧义。

5.3 统一题名的处理 当一著作题名同时具有数个,或不同版本、不同译本题名出现差异时,是否使用统一题名,按《中国文献编目规则》规定,应依以下情况作出选择:a、著作的知名度;b、著作不同版本或译本的多寡;c、著作原文是否为外文;d、著作不同版本或译本有无必要集中检索。但我国图书馆界大都没有起用500字段,尚未严格按这些原则处理统一题名,或根本不去考虑统一题名问题或在200字段确定一个可供检索的题名,其他用"517"标识为其它题名,造成概念的混淆,亦影响读者使用。这是需要在计算机编目工作中,强化检索功能意识,认真加以解决的。

5.4 书目数据库目次著录的研究 2000年初,国家图书馆组建了“国家图书馆文献数字化中心”,日生产16-20万页图书影像数据,但它未经OCR识别和后续的人工干预,无法直接用于文献检索。尽管通过软件手段,已初步实现了全文影像数据库与OPAC书目数据库挂接,网上读者可以通过检索书目数据,跳转到相应的图书影像数据,进而逐页浏览图书。但读者在浏览中无法一步到位准确地查找到所需文献,给全文影像数据库的利用带来不便。为解决这一问题,国家图书馆正考虑在书目数据与全文数据库之间建立中间层次的字符型全文检索数据库,其主要内容是在书目记录内增加目次信息。具有三种不同做法:第一种是在书目记录中设立505字段,通过该字段的@a子字段集中描述图书的章节信息。章节信息的具体组织结构类似CNMARC的327内容附注,即对章节号、章节名称、章节责任者等内容不做子字段层次的区分,而是通过一些符号,便于阅读的简单切分;第二种做法是仍采用505字段,但明确规定子字段定义。如@g为章节序号,@t为章节,@r为章节责任者等。通过从"@g"子字段开始到@r子字段结束的一个子字段组来精确描述一个单位的章节信息,再通过重复若干子字段组的方式来描述图书完整的目次信息;第三种做法是在MARC格式中设立970字段。每一个970字段用于描述一个单位的章节信息,并且其子字段定义更为细致,如增加了责任者规范名称,对照页码的子字段等。第二种做法与第三种做法相比,主要区别在于后者采取了重复970字段的方式来描述整体图书的章节信息,而前者是以在一个字段中重复子字段组的方式来描述整部图书的章节信息。

5.5 7--知识责任块的处理 对7--字段的处理差异较大。由于《中国文献编目规则》不采用“主要款目”的概念,按照《中国机读目录格式使用手册》的解释,“如果记录是按照不承认主款目概念的编目条例编制的,或源格式不分别标识主款目,则所有用作检索点的个人名称均可记录在701字段”,以检索点形式出现的对作品负有等同知识责任的个人名称记录在701字段,而对作品负有次要知识责任的个人名称著录于702字段。这是以国家图书馆为代表的7--字段处理主流方案,这种办法处理起来比较简单、省事。由于将对该文献负有“等同知识责任”的责任者著录于701、711字段,而将“对作品负有次要知识责任的责任者”著录于702、712字段,格式未将“等同责任”和“次要责任”从总体上加以明确,因而701、711字段著者、编者、译者等混杂在一起。

一些高校图书馆为避免各种著作方式的责任者相混的问题,把对著作负有主要知识责任的责任者著录于701、711字段,而将负有次要知识责任的责任者著录于702、712字段,这实际上变通执行了主要款目的规定,这是对7--字段处理的第二种方案。采用这种办法,虽然承认了责任方式的主次之分,但不启用700字段,而试图区分知识责任大小。也有人认为,既然要向国际标准靠拢,为向国外发行中文书目数据,就应采用“主要款目”这一国际通用概念,启用700字段,将主要责任者著录于此字段,其余等同责任者著录于701字段。若一篇文献无主要责任者,则将所有责任者著录于702、712字段。这是以上海申联文献信息公司为代表对7--字段处理的第三种方案。

笔者认为,问题争论的焦点在于有无必要将著者、编者、译者……分开,互相混合会不会影响检索。如果不影响检索,将它们逐一加以区分,只是盲目的徒劳;著作方式不同是否一定可以从中辨别其对著作责任的主次与大小,比如,编著、译著如何界定著作责任的主次。即使是注释亦不定就可认定为次要责任者,倘若注释完全歪曲了原著,其著作质量好坏的主要责任就不在原著者而是注释者。人为地区分著作责任不仅难以准确、合理,甚至可能违反著作版权法;如何理解向国际标准靠拢,首先,UNIMARC不是ISO国际标准,只是IFLA的通用文件。其次,对UNIMARC的理解应与ISBD相一致,即它仅要求对文献外表特征描述、记录格式相同,并不强调在文献检索上完全一致,因为这涉及各国的文献特点、目录传统、检索习惯问题。既然UNIMARC、CNMARC都容许选择“主要款目”概念就没有必要去尾随西方编目传统,而不顾自己的民族文化发展潮流。再者,不使用700、710字段,扬弃主要款目概念并不影响书目信息交流,为何还要对它们情有独钟、弃简就繁给编目人员增加负担。

5.6 关于拼音问题 CNMARC文本规定,200字段的正题名及其它用作检索点的5--字段、7--字段都应进行汉语拼音注音,但是按字注音还是按词注音现在CNMARC格式编目中一直存在着分歧。

赞成按词注音的人认为,按词注音是国家语委规定的,是国家标准。国外也采用按词注音,按词注音还有利于向国外发行CNMARC数据和大大有利于机器自动翻译。1996年出版的《中国文献编目规则》也规定按词注音。赞成按字注音的人认为,汉字并不同于西文单词,对汉字而言,有时单字就是词,有时不同意义的词连在一起又成了另外意义的词,编目人员如果水平不同,在截词时会出现较大的差异。国家图书馆发行的CNMARC数据就采用按字注音。

笔者认为:按字注音,除多音字需人工干预外,其余可由机器自动完成;按词注音除了对多音字进行人工干预外,还要先对汉字进行分词,可能要增加工作量。但这是国家标准,而且国家语委会已制定有分词规则,没有理由不照办。目前,人名与地名、物品名、出版物、宣传品都以汉语分词拼写。为提高编目工作质量,促进中外文化交流,让国际社会更多了解中国文化,采取按词注音是必要的,也是可能的。目前上海申联编目中心正是按这种方法对5--字段、7--字段进行汉语拼音注音,取得效果良好。

6 对规范控制的研究

规范控制的发展历史悠久,早在书本式、卡片式目录时代即具有这种观念及具体做法。我国汉代刘向《七略》中的互见、另裁方法,就是现代所谓参照(Cross-Reference)中的一种。自清末西方图书馆学传入之后,从分类编目到规范控制,几乎全据西方图书馆方法。20世纪初,美国编目专家卡特(Cutter,C.A)为建立字顺目录主张用著者全称形式,首先提出规范控制概念。近二十年来,书目规范控制随着图书馆自动化的发展而日益引起图书馆界的重视。英美等国在制订编目规则、编制名称规范表和建立规范控制系统等方面开展了许多工作。美国的联机规范控制数据已发行到各国。我国对规范控制的研究起步较晚,70年代末到80年代的有关研究课题主要包括:①规范控制与图书馆的关系;②机读目录中的规范控制;③书目数据库组织与规范文档控制。90年代以来,受计算机普及、资源共享国际化及全球信息高速公路建设热等因素的影响,我国对规范控制的研究有了新进展,制订了《中国文献编目规则》、《中国机读规范格式》、《规范款目著录规则》等一些标准,发表了不少研究论文和编译著作,将理论研究的成果用于规范控制的实践中。在研究深度上也有所加强,研究领域也有所拓宽。

6.1 规范控制的概念 规范控制的实践离不开理论的指导,要想使规范控制形成规模,必须加强基础理论研究。目前我国对此的研究多集中在对规范控制的原理、概念、作用等方面。有关规范控制的概念在许多论文中均有所提及,主要观点有:

(1)确保著录标目在目录里的一致性和唯一性,建立、维护和使用规范文档的过程。

(2)始终如一地使用和维护在书目记录文档中作为标目的名称、主题、统一题名等规范形式的过程……包括规范记录文档……自动更新所有记录以保持与规范文档一致的机制。

(3)是一种施行于图书馆目录并为图书馆目录提供组织机构的技术过程。

(4)为了确保检索标目在书目款目及书目系统的唯一性和稳定性,而建立、维护、使用规范款目和规范文档的工作过程。

书目规范控制在编目规则中亦称为标目法,其目的在于实现检索点(标目)规范化,即确定标目范围,并以一定理论、原则,确定统一标目形式,编制规范款目,同时,建立不同名称之间的参照关系。

具体说来,规范控制工作包括:(1)确定标目范围及其规范名称形式;(2)编制规范款目,并以其中的统一标目编制各种检索编目;(3)将规范款目、参照款目和说明款目按一定方法组织成规范文档(Authority File)或称为规范表、权威清册(Authority List);(4)将规范文档与检索款目通过某种形式连接起来,形成规范的书目检索系统;(5)对规范文档和书目系统进行维护和评估。

6.2 规范控制的因素 标目的统一对图书馆目录是极为必要的。特别在计算机编目中,书目数据是图书馆书目自动化系统的基础,而规范控制作为数据库的重要组成部分,在联机和网络检索环境下,又是书目系统永葆生命力和实现资源共享的关键。进行规范控制,具有以下四个方面的因素:

(1)目录职能。字顺目录的职能在于:①揭示藏书中有无著录某一题名或责任者的文献;②把文献外表特征与著作统一题名及责任者名称,在认识上统一起来,并且把同一责任者的各种著作和同一著作的各种版本和译本联系起来。以上两个职能,简言之,一为揭示,一为集中。显然,如果一个责任者在他所有的著作中都用统一的、特定的姓名,一种著作不论在何种文献上都只用一个题名,达到上述两个职能,是没有什么问题的。但当一个责任者各种著作以不同署名或是一种著作以不同题名出版,如直接以文献所载的责任者姓名和题名作标目,就只能实现上述第一个职能——”客观地揭示,不能满足第二个职能——科学地集中的要求。而必须解决标目统一的问题,才能顺利实现目录的集中职能。

(2)目录结构。在目录的结构上,存在着两种结构形式:一是由款目组成目录,由目录组成系统(网络)的层层包容扩大的结构;二是款目与款目组成目录之间,通过排检法整序和参照法沟通,而互相串连延续的结构。款目始终是目录结构的基础,而款目的作用又通过标目去实现,因此,统一标目成为文献检索的关键。

(3)读者检索心理。从读者检索心理上,读者通常是根据自己所知名称进行检索,而且关心的是著作而不在文献类型,当文献或责任者出现异名变名时,即发生误检和漏检。因此,在编目工作中,需要把著作(Works)和文献(Documents)或出版物(Publications)加以区别。一种著作从它一出现就没有被作为单独的个体,它总是与某种载体类型或出版方式联系在一起,看成是某一责任者(著者)的某一著作的一种版本。鉴于文献庞杂所产生的异化,构成了一种检索阻力,如果没有一种恰当的形式去促使文献的顺利交流,人们就不可能自由地获得应有的信息。因此,文献检索对于一种著作、一个著作责任者必须采取统一标目。诚然,这种统一也不是绝对的,只能在可能的情况下进行。因为编目员的工作对象是一种表现为具体出版物的著作,不能象专门从事文献研究的学者一样全面地研究文献;编目员的任务主要在于根据已知的资料,对文献中出现的同一责任者的不同名称、同一著作的不同题名进行选择,从而达到标目的统一。

(4)编目工作的现状。目前我国不少编目工作人员往往混淆著录法与标目法的关系,在手工编目时不设排检项,将客观著录的题名、责任者直接作为标目,计算机编目也以客观描述的或自行修改的200字段自动生成500题名、700责任者检索字段。同时,对编目方法与编目手段缺乏认识,认为计算机编目之后只要通过机读格式输入,而不再需要编目规则。其实,这是本末倒置,编目规则是编目工作的首要根据,手工编目的卡片格式、书目格式,以及机编机读格式,都必须按编目规则进行操作,否则将不可避免地出现书目数据错误和标目纷乱,而影响书目系统的查准率和查全率。由于标目的规范控制在编目工作中尚未完全实现,对于不同称谓的题名和个人责任者、团体责任者名称等标目的选取、目标形成的确定,各个图书馆分歧颇大,缺乏整体的规范控制。为此,《英美编目规则(AACR2)》、《中国文献编目规则》,以及《中国编目规则》(台湾)都分为著录法和标目法两部分。在著录法规定的以客观描述为原则,对文献形式特征和内容特征进行客观著录的基础上,在标目法中对规范款目的构成、标目范围、标目名称的表示、标目规范、标目参照等问题逐一作出了明确的规定。为提高我国文献编目工作的水平,使书目系统达到科学、规范、高效、实用的目标,规范控制工作是必不可少的。

6.3 规范控制的目的 规范控制是在文献著录标准的基础上,进行标目规范化,对编目工作实行全面标准化的工作。在文献著录方面各国已经普遍实行《国际标准书目著录(ISBD)》原则。我国据此亦制定了国家标准《文献著录总则》(GB3792.1-83)及有关文献类型的著录标准。《中国文献编目规则》又按照文献著录、国家标准的框架加以细化,使其成为可操作的编目工具。应该说,文献著录标准化问题在国内外图书馆界已经基本解决,项目的设置、排列及标识符号可以互相识别、交流,唯有著录细则的区别。而标目规范问题涉及各国目录传统、文字特点和检索习惯问题,不可能在世界范围实现不同文种文献标目的统一。为实现文献检索的规范化,提高书目系统效能,各国必须自行制定编目规则,力求在同一文种书目系统进行规范控制。规范控制的目的就主要表现在确保标目的正确性、一致性、关连性和稳定性。

所谓标目的正确性,指检索款目的标目必须按照一定的原则选取,能足以反映事物的实质及其规律,并能在检索实践中经得起时间的考验,得到社会公认。

所谓标目的一致性,指检索款目选定的标目的字词是控制字汇的一种,尽管某一事物名称具有多种形式,但一经确定,藉其形式建立的统一标目,都是一致的。使其显示名称的正确、权威,具有集中同一事物的功能(同一责任者、同一著作、同一主题),并能将同一事物而不同外表特征的文献,用一致标目表示,实现文献检索的查全率。标目的一致性也是标目的统一性,即检索款目选定的标目形式(统一标目)属于唯一特定标识,能识别某一责任者、某一著作、某一主题的名称,并足以区别其他名称,不致混淆,以实现文献检索的查准率。

所谓标目的关连性,指强化书目的检索功能,藉参照款目的指引,将不同的新旧标目相互联系,以增加检索途径,使相关的资料集中,提高书目检索效率。

所谓标目的稳定性,指检索款目需相对固定,而不可朝令夕改。当然,标目也不可能一成不变,但必须持慎重态度,有规可循,并记录在案,便于核查。

6.4 规范控制的类型 规范控制主要是对各种名称标目的规范和主题标目的规范,前者称为名称规范,包括对人名、团体名称、会议名称、地理名称和统一题名、丛编题名;后者称为主题规范,包括规范词汇名称(即主题词表)和非控制词汇或自然语言。实现上,规范控制的过程就是编制规范款目的过程,在名称规范中的人名、团体名称、会议名称和地理名称都属于编制责任者(著者)规范款目,统一题名或丛编题名规范为编制统一题名款目或丛编题名款目,主题规范则系编制主题规范款目。如下图表示:

规范控制同文献著录一样,都可以通过手工编目或计算机编目实现。尽管它们都必须遵循《中国文献编目规则》第二部分标目法的有关规则运作,但由于实现的手段不同,载体不同,也就具有规范款目的两种不同格式(卡片格式和机读格式)。同时,专业术语的称谓亦有些差别。例如,手工编目所产生的款目和目录,在计算机编目中即称为记录和书目档或书目文档、规范记录或规范文档、权威文档。在手工编目中原先只有“标目”概念,随着编目工作标准化、自动化的进展,又出现了“检索点”的不同称谓。我们在图书馆工作及专业书刊中,往往发现会交叉使用这些名词术语,这正反映着手工编目与计算机编目处于过渡阶段。由于我国图书馆事业发展不平衡,手工编目的工作手段将较长期存在,即使全国图书馆文献工作都普遍实现了自动化,局部的手工文献著录及规范控制仍然是不可避免的。

6.5 名称的规范控制 标目名称的复杂性决定了实施名称规范的重要性。名称规范按标目性质分为个人、机关团体及统一题名三种规范档形式,也有将丛编规范档单独列出加以论述的。

总论名称标目规范控制的文章不多,除对规范对象的不同划分方法外,主要集中于对标目选取原则的讨论上。一般认为应遵循下列原则:可检性;便捷性;通用性;唯一性;简明性。关于并列题名是否应选作标目存在如下分歧:①不应选作标目。因为我国的分立式目录按标目语种排列标目,正文应与标目语种保持一致;②区别对待。手检目录中可将并列标目排入中文字顺目录,以满足读者从外文名查找的需要;亦可排入外文字顺目录,告诉读者该文本的不同版本;还可排入公务目录以利查重。机读目录中每一著录单元均可作为检索点,并列标目不必重复著录。③机读目录中也以并列题名为标目。如在规范款目规则中的统一标目下设并列题名为标目。如在规范款目规则中的统一标目下设有并列标目项。

关于个人名称规范的研究主要是对规范对象与方法的探讨。除对现有中西文编目规则中有关条文的解释与应用外,有些论文还对某学科、某类型文献中的个人名称规范进行了专项研究,使其进一步深入、具体化。

机关团体名称包括地名、国名、机关团体名、会议名及其它属于团体性质的实体名等。作为一种特殊的机关团体名称,会议名的规范控制问题引起了广泛的关注。关于会议录标目的选取大家讨论颇多,一般认为有如下原则:参考LC光盘数据源或CIP标目数据;根据标目结构确定不同的形式;与专家协商选择;以会议名作标目,用数字辅助区分系列会议录。建立会议录标目规范档的方法(过程)为;确定标目形式;选择款目内容及形式;与目录连接;检查新标目的合法性、准确性并视需要修订标目;注意规范标目的权威性与稳定性,维护参照。

对机关团体名称规范的其它研究集中于对规则的解释与补充上。有人认为:对部分团体责任者名称应以个人名称为标目,原因是我国有些个人责任者的著作以机关团体的名义出版了,对此应从题名页以外的部分查证个人责任者并优先选作标目;对未冠机关团体名的团体责任者可作责任者附加标目。以上建议对减少团体责任者标目的重复次数及保护个人著作权都有益,在机编环境下也较易实现。但在我国目前以手检为主的情况下做到这一点并不容易。另外,题名页上责任者以团体方式出现;读者在使用过程中也习惯于从题名页上所显示的责任者入手查找文献;出现个人责任者被冠以机关团体责任者形式出版的情况也较少,所以我们认为不值得为此类例外情况改变著录规则。

统一题名规范控制是名称标目规范控制的一项重要内容。关于统一题名规范的应用范围主要有:同一文献的不同版本或不同名称;同一文献的区分;古典佚名文献著录;丛书、连续出版物名称规范;含非文献内容用文字题名的规范等。统一题名标目的选取原则除大家熟知的通用性等外,有人提出题名中含其它语种文字的应译为正文用文字后选作标目。

从以上介绍可以看出,关于名称规范控制,大家论述较多的是各类名称标目的选取原则。除对以前所提出的原则(如通用、习用等)加以解释和补充外,还对各类具体名称作了较深入的规范控制研究。其中有许多例子,可供理论工作者和实际工作人员研究参考。另外,许多人已注意到了计算机用于编目后对标目带来的影响,由此提出了一些新的标目选取原则。由于各种名称具体情况不同,所以泛论名称规范控制的几乎没有。

6.6 书目数据与规范数据的组织 书目数据和规范数据是文献编目过程中形成的两种数据类型,编目系统是利用这两种数据来实现其书目功能的。书目数据描述图书资料,而规范数据描述书目款目中的标目,且为书目记录的重要组成部分,是为书目数据的使用服务的。它们之间有着自然的密切联系。因此,在数据库设计时,如何建立这两种款目数据的连接,合理设计数据库的结构,是编目系统设计的一个根本问题。

在传统的卡片目录或书本目录中,书目款目和规范款目大致存在以下三种:

(1)书目款目与规范款目各自组织,各成系统,而且两者之间没有联系,即书目款目的统一标目不一定使用规范款目中的规范目标,规范款目中的规范标目对子款目的统一标目只起参考作用,因而规范目录(档)不对书目款目的标目起规范控制作用。规范目录形同虚设,失去了存在的必要。

(2)规范款目、参照款目和一般说明款目编制出来后不单独组织成规范目录,而是作为公务目录的组成部分分别组织到公务目录中。这种联系方法不太适合于分立式公务目录,同时也不利于规范款目的管理与维护。其中最重要的是不利于馆员的使用,因为规范目录(档)不仅供编目人员使用,同时也适合采访人员、参考馆员和特殊读者的使用,但若它与公务目录一起组织就不便使用了。

(3)规范款目与书目款目各自组织、各成系统,但是两者之间联系紧密,也即书目款目中的统一标目必须采用规范款目中的规范标目。但规范款目单独组织时需要考虑以下两个问题:一是规范目录的放置位置要便于所有使用和维护规范目录的人员;二是配备足够大的空间,以适应随时间而不断增长的规范档扩展。规范目录应用专门的抽屉存放,而且应做到科学合理、井然有序。

在编制机读目录和机读文档的情况下,规范文档与书目文档之间通过电子链针经过ISADN而自动连接。目前,这种联系方式,是最好的联系方式,因为一旦规范档中的某一标目进行修改后,与之相连的书目文档中的有关标目也会自动得到修改。而在第三种联系方式中,则需人工逐条修改,对于维护文献目录和规范目录的工作显得十分繁重。

因此,在使用计算机编目时应采用机器自动联系,而在手工编目的情况下应提倡和推广第三种联系方式,尽管这种联系方式还存在着许多不尽人意的地方。最后需要强调,建立规范档的意义和作用都非常重要,中、小型图书馆可以采取“拿来主义”的方针,即使一些大型图书馆,也应采取“一馆为主、各馆补充”的方针,否则各自为政,将造成浪费(建立规范目录是一项需要耗费大量人力物力的工作),不能得到应有的效果。

6.7 机读目录的规范控制 机读目录的规范控制问题是信息自动化大环境下一个久热不衰的课题。近年来对此的研究除与80年代一样对其原理、作用、必要性等探讨较多外,还涉及了一些新的领域。诸如,规范控制在联机环境下的变化;规范控制从编目前向编目后转移;机械劳动与脑力劳动相分离;在不同级别上实施规范控制。有的文章还指出:应提高对规范控制重要性的认识;加强基础理论与实际应用研究;引进国外先进经验;与自动化相结合。还有些文章则将机编环境下书目记录与规范记录的建档方法分两类:连接或相互独立。并将连接文档连接方法分为:a相互协调; b规范文档作为书目文档的组成部分; c以电子链针连接。还分别论述了三种方式的利弊,并提出了一种新的合理模式。文中还着重就规范数据对象、建立规范记录的依据、规范数据的界面、规范控制的级别等问题提出了独到的见解。

我国机编规范文档的编制尚处于探索阶段,为此就有必要借鉴一些成熟系统的做法。有人还通过考察介绍了台湾地区规范档的权威控制方式、建档途径及机读资料的转换原则,还提出了今后研究的方向:中西文权威记录的整合,权威机读编目格式的修订;合作建档以及本土化权威记录研究等。对国外机编规范档的研究则主要是评介美国几大有名的规范档的编制方法、特点、使用情况及存在的问题。既有对LC 等系统的单独介绍,也有对OCLC、WLN、RLIN等的比较分析,就文档收录全面性、重复与冲突记录等问题提出了改进意见。

比较国内外机编规范控制的理论与实践,许多人对我国目前此方面存在的问题进行了总结,主要为:没有统一的正式标准和计划;没有统一的规范表;规范工作难以保障;未形成统一的规范系统。针对上述问题,任有标论述了我国建立和发展规范档体系的途径;还有人分析了建立我国回溯性书目规范系统的标准、实践、人员培养和数据源基础,提出了与国际联机、强化理论研究、使用统一的编目软件等具体措施。

总的说来,对规范控制基础理论的研究涉及到各方面,如概念、重要性、作用、标目选取原则及机编规范控制等,论述比较全面。但仔细考察后我们发现,除了对国外一些理论与方法的介绍外,真正结合我国国情的研究并不多,尤其是关于我国规范档的建档方法、使用及维护规则、联合建档的可行性与途径等论述少,不利于指导我国建档实践。

7 对编目工作组织及其发展趋势的研究

我国20年来编目工作组织方式取得了长足的发展。进入90年代以后集中编目有了较大飞跃,国内出现数家颇具规模的集中编目机构。这些机构将新书发行与集中编目结合起来,实行“随书配盘”,采取商业运作模式,形成良性竞争局面。受经济规模的驱动,各机构及时采用国家著录标准制作书目数据,积极满足客户需要,提高编目质量。其服务范围已涵盖了全国大部分地区,使我国集中编目初具规模,为发展联机合作编目打下了坚实基础。集中编目中书卡脱节、时差大、图书覆盖面不足等“老大难问题”得以解决,面貌一新。

我国在版编目历经70年代末的概念引入;80年代中后期的数家图书馆与出版社的结对合作试验以及《图书在版编目数据》、《图书书名页》等有关国家标准的制定;90年代初的实施CIP国家标准、确定CIP实施方案以及业务培训,于1993年正式试行CIP。试点单位由最初的41家在京出版社扩展至辽宁、湖北、广东等地的出版社。截止1997年底,新闻出版署信息中心在版编目处已为全国近250家出版社编制了CIP数据10万条。目前新闻出版署正筹建CIP信息网,准备全面推行CIP。

7.1 在版编目的研究 在集中编目、联合编目、在版编目等编目方式的研究中,在版编目这20年来一直处于“沸点”状态。1979-1992年间可说是“舆论准备”阶段。1979年阎立中发表《图书在版编目》首先在国内引进CIP概念,介绍国外CIP起源、发展及现状。随后探讨在我国实行 CIP的意义、作用、必要性、可行性及实施方法,文章不断增加。

在1993-2000年我国实施CIP试点工作后的研究阶段,论文数量猛增,共130多篇。这一阶段的文章基本可分为两大类:①继续探讨CIP的意义、原理,介绍现状,展望未来。②研讨我国CIP数据质量及CIP的操作方式。第一类文章的主要观点有:在中国实施CIP还只是开端,其质量有待提高、规范有待扩大、审核周期有待缩短、实际应用有待拓宽。此外,在维护CIP的严肃性,健全、扩大CIP机构,提高出版社对实施CIP的积极性,合作实施CIP,利用网络管理CIP,增加CIP机读目录功能等方面还须认真研究。第二类文章大多从CIP数据的物理差错、分类标引、主题标引、数据的规范化和标准化方面对其进行批评,进而对其具体操作方式提出不同看法。对于CIP具体操作方式主要有两种主张:一是集中控制,即由国家图书馆负责CIP工作或由北图与版本图书馆联手,这样做的优点是数据质量高,但投入的人力多、经费大,在没有全国联网的条件下,会影响出书速度。二是分散控制,即由各省包干,各出版社自行负责。这样可较少地投入人力和经费,CIP速度也可加快,但数据质量难以保证。

近年来,编目研究的热点与编目实践的发展保持同步,两者互为作用。如目录组织与目录体系方面的文章,1995年以前,每年约有20-30篇,但1995年以后,每年只有几篇。这恐怕与机读目录的发展与卡片目录的蒌缩不无关系。总的来说,我国编目理论研究由于与发达国家的差距较大,一直处于追赶的角色,“原创”性的研究极少,这是历史原因造成的。在国际著录标准化方面往往处于被动的地位,对此我们只能加快追赶的步伐。另外,有些领域的研究重复、过滥(如在版编目数据的质量批评);研究的理论深度有待进一步提高(如20多部专著中,多数是教材,理论著作较少);在未来编目环境下编目人员的角色定位、培训教育研究有待重视;对国际上新的编目研究动态反应仍不够迅速(如Metabata、NetFirst、Intercat、Scorpion Project、PURLS等一系列Internet资源编目计划和研究课题的介绍文章几乎未见;电子出版物的著录1995年以前没有,1996年1篇,1997年未见,1998年2篇)。

预计未来的研究热点和突破口仍会集中于标准化(特别是电子出版物及网上信息的描述规范)、机读目录数据库的建设、联机联合编目工作等方面。

7.2 联机合作编目的研究 我国计算机编目历经最初的编目单系统、1988年以后的集成系统中的编目子系统,正开始走向筹划和实施联机合作编目。在一些经济较发达地区,正开始实现地区或行业图书馆的联网一体化,如北京中关村APT网络、广东省公共图书馆网、上海申联公司、北京图联公司、广东粤深文献中心等。虽然这些网络目前仍主要提供集中编目、随书配盘(片)等编目服务,但多已有联机合作编目的计划或已开始实施。如APT网就有明确的联机编目试验计划并已完成软件编程;北京金信图公司也提出了类似于早期OCLC以民间公司的方式发展联机编目的方案;CERNET已完成第一期工程,在其发展图书馆网络应用计划CALIS中,也已涉及到联机合作编目这一具体目标。广东省文献编目中心1998年2月起通过169中国公众多媒体信息网对国内图书馆界服务,成员馆可实时检索和套录编目中心的数据,并可向中心写入数据,成为国内首家实施联机合作编目的机构。

1997年10月,国家图书馆联合编目中心成立。这标志着我国联机合作编目被提上了议事日程并有组织有计划地开始进行。为保证全国图书馆联机编目的书目数据质量,实施网上编目标准,中心已于1998年5月起着手制定联合编目标准。

联机合作编目是计算机编目的发展方向,是网络环境下计算机编目效益的最全面体现。近两年每年都有文章论及此问题,但几乎都是介绍性和前瞻性的,多数文章是从考虑其他问题的出发点上涉及到这一概念的。相信联机编目将是未来的研究热点。

7.3 书目数据制作企业化的研究 随着联合编目的发展,书目数据制作企业化的研究亦初见端倪。目前除中国数字图书馆有限责任公司属于国务院批准的国营经济实体,向全国提供书目数据服务之外,还有由集体或私营兴办的上海申联文献信息技术公司、北京图联文献信息咨询公司等具有一定规模的书目数据制作企业化实体。

对于两种企业运作都有专文研究。前者强调全局利益,全国协调,统一规划,统一标准,坚持以公益为主,兼顾经济效益。《书目数据制作企业化与我国图书馆编目工作改革》则认为,应该开创一条图书馆统一编目的新路。

继续维持传统的文献编目工作体制,单纯依靠行政和事业单位的管理办法开展书目数据制作业务,很难全面满足全国各类型图书馆的需求。面临市场经济社会和改革开放大环境,书目数据制作企业化,正如北京丹城公司与北京图书大厦联合经营的书目制作业,无疑是对我国图书馆界传统的文献编目工作体制颇具威胁力的挑战。

7.4 西文编目工作组织及其发展趋势研究 随着计算机技术在图书馆的应用,西文文献编目自动化管理系统以实现世界文献信息资源共享为追求目标。在此新的形势下,国家科委决定有计划、有步骤,分批、分期地组织各个文献信息单位共同建设一个全国性的科技文献共享系统,并首先建立西文文献信息计算机联合编目系统。1997年由国家科委信息司、全国情报文献工作标准化技术委员会秘书处邀请国内文献信息处理方面的专家组成“全国西文文献信息计算机联合目录系统”第一专题组编制了《西方文献数据库数据处理手册》,给各承担西文文献数据库建库任务的数据处理人员提供统一的、规范的、操作性、适用性强的工作手册,以保证所建系统能够实现共享。

为了使西文文献MARC记录所包含的信息量比传统目标更全面、更丰富、更准确,为用户提供基于MARC的各种优质服务,就要在编制过程中使用统一的标准。1998年北京大学图书馆编出版了《USMARC格式使用手册》,从实用的角度出发,对USMARC书目格式作了较全面的介绍和分析。这些工作都为联机编目打下了基础。在这样的环境下,OCLC的发展为我国西文文献计算机编目提供了新的契机。国内的一些大中型图书馆如国家图书馆、上海图书馆、天津图书馆以及一些高校图书馆如上海复旦大学图书馆、上海交通大学图书馆等都陆续引进了OCLC CD -ROM光盘系统或与OCLC 联网。到目前为止,我国已有15个图书馆成为OCLC的成员馆,并且还有一些图书馆正准备加入OCLC。

综观国内外西文文献计算机编目的发展历程,图书馆之间应加强合作,互相学习新技术、新方法,顺应联机编目潮流。共享书目数据资源OCLC是运用高科技来实现图书馆馆际合作的典范,我国西文文献计算机编目工作可充分利用这一优越条件,促进共享。

(1)利用OCLC视窗光盘( OCLC CatCD for Windows):其中的新书编目集成(The Recent Books Cataloging Collection)与旧书编目集成(The Older Books Cataloging Collection)各两张光盘,收录300多万条文献编目记录,提供按主题和出版形式分类的数据库、美国国会图书馆(LC)规范档的完整文档、先进的编目索引和检索功能,包括标准号、主题、出版商等检索方式。可在光盘上从10个方面查访世界上最大和最具有综合性的编目目录数据库—OCLC联机联合编目目录(OCLC Online Union Catalog)。它的功能还有,能在非联机和单机环境中进行编目作业,进行CD-ROM检索,进行记录改写、原始编目、印刷书标、印制编目卡片,输出规范档和文献编目MARC记录,向 OCLC成批送回馆藏记录,达到局网兼容。

(2)利用网上联合目录(WorldCat);除了利用光盘数据之外,有条件的图书馆还可利用OCLC网络联合目录(WorldCat)进行检索编目。就同一数据源而言,光盘选录的数据只是其中的一小部分,而基于网络的联合目录是更为完整的数据库。可以检索、下载他馆建立的目录,编辑成为适合本馆的书目资料,存入自己的数据库,节省原始编目的人力与时间。它的检中率比光盘系统要高得多,可达99%以上。利用本系统编目新书,比较经济实用,而光盘更适应于回溯建库。

OCLC把各馆的馆藏记录存入 OCLC系统,各馆可利用OCLC系统检索进入OCLC系统的各馆的馆藏记录。这样千万个图书馆的馆藏,每种只需做一次原始编目,大大减少了编目工作量,提高了编目工作的效率、质量和标准化程度,达到了馆际合作、资源共享可在全世界范围内进行。因此有效地利用OCLC系统可极大地促进我国西文文献编目标准化与自动化的进展,为西编工作在网上与无网络条件下实现国际书目资源共享创造了条件。

未来西编工作自动化网络化的飞速发展,将打破图书情报部门各自为政的局面。在资源建设方面进行分工协作是实现资源共享的关键。协调合作应结合数据库的建设、进行合理配置,提高规范化程度,加强网络化使用。在进行数据库建设的过程中,使公共图书馆、高校图书馆、信息情报部门等各种类型的图书馆,都融入了社会总资源的体系中去,以促进文献资源共享的深入发展,建立一个系统、地区有机结合,整体与层次互为补充,纵横交错的立体网络的文献资源布局模式。只有这样,才可避免各图书馆单独进行数据录入,包括新书编目和回溯建库,减少许多低水平的重复,提高标准化水平与兼容程度,减少全国性的大浪费。

目前我国尚无一个权威机构统筹西编建设事宜,各地区各图书馆单独开发研制或引进系统软件,单独进行数据录入,以致造成低水平重复编目,带来极大浪费。建议由国家权威机构如国家图书馆、中国图书馆学会和文献工作标准化,自动化组织牵头,制定具体的计划,设计具体的目标,立项合理规划布局,组织专门力量对西文文献编目的自动化统筹管理,强化网络协作关系,防止技术力量、资金分散,共同建立和维护共享书目数据库。

标签:;  ;  ;  

中国现代文献编目的发展与问题(1996-2000)(续)_国家图书馆论文
下载Doc文档

猜你喜欢