MARC格式在网络信息资源编目中的应用研究_元数据论文

利用MARC格式对网络信息资源编目的研究,本文主要内容关键词为:目的论文,信息资源论文,格式论文,网络论文,MARC论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

网络作为一种新的传播媒体出现以来,网络信息资源迅猛发展,给人们展现了网络资源的巨大魅力和潜能,但也带来了信息的无序甚至污染,阻碍了读者充分有效地利用网络信息资源。读者迫切希望能在庞大网络信息资源中,去伪存真,迅速查获所需信息,并得到最为相关的信息以便进一步检索。这就要求作为文献信息重要集散地的图书馆,提供高效、准确、有序可靠的网络信息资源的组织形式。针对网络信息资源的特点,选择适合的数据格式进行编目,是提高网络信息资源组织效率的重要方式。

1 网络信息资源编目的难点

信息资源编目是图书馆的一项重要基础业务,编目(Cataloging)包括:著录(Description)和主题标引(Subject heading)两部分工作。在著录的过程中,提供对资源的题名、责任者、出版情况、载体形式等方面的信息;主题标引主要是通过受控语言,如主题词和分类号,来揭示资源的主题。由于网络信息资源具有信息量大,种类繁多,信息庞杂,不易控制以及稳定性差等多种原因,使网络信息资源的编目与图书馆传统文献编目相比,有着很大的不同,主要存在着以下的难点:

1.1 网络信息资源的主要著录根据难于确定

传统文献的书目记录描述充分,各种项目真实可靠、读者可以有把握地利用它。但网络信息资源的各项目是变化的,如:网络信息资源的题名、内容、地址等,其中任何一项的变动都会打破书目记录与网络资源的联系。因此如何使书目记录与所描述的网络资源保持一致是编目的一个关键问题。其次,网络资源极易复制,具有很强的可获得性,同一文本可能被保存在不同的网址上,编目要做到能准确反映书目记录与这些网址的关系,是网络资源编目的另一个关键问题。

1.2 网络信息资源的格式多样

网络信息资源的文件格式很多,例如:ASCⅡ、PostScript、SGML、WORD、HTML、MPEC、JPEC、Tex等。格式不同,文献类型也不同,而不同的格式对所需的硬件和软件都有一定的要求,因此在对网络信息资源文献著录时,必须注明利用该文献所需的硬软件要求,否则会影响利用。同时,多种格式的文件在目录中如何处理给编目人员著录带来新的问题。

1.3 对网络资源的检索方式需要描述

传统文献编目的结果之一,是给读者指明文献所在位置,而在网络环境下,用户的检索位置与资源的实际存贮位置可能十分遥远。用户必须要有特定的通讯地址(主机的IP地址),精确的地址说明特定资源的位置。除了资源地址外,编目还必须要提供通讯功能,便于用户直接登录检索有关资源,或提供从另外计算机连接所需要的信息资源。

2 MARC格式组织网络信息资源的方式

MARC格式是目前系统最完善、结构最复杂、标识最严谨的元数据格式。对于印刷型的资料如图书、期刊等,已经采用历史悠久的MARC格式来编目,国内现在一般采用CNMARC和USMARC两种标准分别处理中西文图书。国内通过10年的发展,在图书馆领域的MARC建设已经比较完善,可以实现联合编目和目录共享等区域合作,MARC数据的交换和共享通过Z39.50协议实现。那么对于数字资源,MARC格式是否还适用呢?鉴于MARC格式已在图书馆界得到广泛应用,让人们放弃其原有的格式而采用具有新内容特征的格式是不现实的。在网络环境下,MARC格式也在不断地完善和修改,为了适应网上资源的编目,其描述模式更加丰富,并扩展采用了516字段、538字段、753字段和856字段,成为了MARC格式发展的重要标志。

2.1 采用516字段记录计算机文件类型

由于在网络资源中有丰富的正式和准正式的标准——ASCII、PostScript、Tex、RTF、Adobe、Acrobat、SGML、HTML、Word、WordPerfect、gif、tif、JPEG、MPEG、QuickTime等,在MARC格式中,采用516字段来记录有关资源格式的信息,可以反映书目记录中不同的文献类型的各种附注。可以解释文本、标注文本、图形显示文件、影像、声像和动画文件。用户可以鉴别、检索与其计算机环境相一致的资源。例如:

516 Electronic serial in ASCⅡformat

516使用ASCⅡ、PostScript和HTML格式的电子连续出版物

516使用Wordperfect5.1格式的单独文件

2.2 采用538字段反映系统要求和检索方式

538字段(系统细节附注项)主要描述网络信息资源对系统的要求和检索方式,著录对计算机系统的要求,包括计算机型号、软件要求、所需外部设备等,在网络环境中,主要是指与网络连通的方式。例如:

538系统要求:PC;World Wide Web检索

538检索方式:World Wide Web

538检索方式:通过Internet的World Wide Web

538检索方式:通过Internet的E-mail

2.3 采用753字段反映检索计算机文件的系统细节描述

该字段主要是提供给读者对该资源进行检索所必备的计算机环境的技术要求,它包括两个未定义的指示符及5个子字段,$a子字段是检索用机器类型,$b子字段为机器使用的程序语言,$c子字段为机器的操作系统等。

2.4 采用856字段记录电子资源的检索方式与地址

856字段是MARC记录中对电子资源最能完全和准确揭示的一个专门字段。该字段的设置开创了编目的新时代,被称为是“连接Internet资源和图书馆OPAC中书目的一座桥梁”,专供对网络信息资源的URL进行著录,并实现了超文本链接。也适用于一些不能以URL表示的电子网址和检索信息,如模糊检索等,正式名称是“电子网址和索取”字段。包含查找电子文献所需要的信息。这些信息确定文献的电子地址或可以获取文献的电子地址,也包含通过第1指示符的值所定义的查询文献的检索方法,可用于生成与检索方法相关的ISBD(ER)电子资源附注,为可重复字段。856字段由指示符和子字段构成。

(1)指示符:指示符1:表示检索方式。#-无信息显示;1-文件传输(FTP);2-远程登录(Telnet);0-电子邮件(Email);3-拨号上网(Telnet);4-超文本传输协议(HTTP);7-在本字段的$2中说明检索方法(Method specified in subfield $2)。指示符2:表示该编目记录与856字段中所描述的网上电子资源之间的关系。#-无信息显示;0-编目记录为网上电子资源(Resource);1-网上电子资源与编目记录的电子版本(Versionofresource);2-网上电子资源与编目记录相关,详细内容在$3子字段中描述(Re-latedresource);8-不显示标题(No display constant generated)

(2)子字段:856字段包含28个子字段,能著录主机地址、检索地址、电子文献名称、统一资源名称、用户名、口令、帮助信息、操作系统、电子文献格式、文件大小、统一资源定位器、可检索电子资源的时间等。这些子字段都是可选择事项,是否使用往往由检索方式来确定。举例如下:

856 41$uhttp://www.jstor.org/journals/0277903x.html

856 7#$uhttp://www.the-scientist.library.upenn.edu/$2http

而对于CNMARC格式,856字段也得到运用。在中文文献编目中,CALIS联机合作编目中心规定:对所编文献是非电子资源,但具有相应的电子版本或相关的电子资源时,启用856字段。目前,该字段第2指示符为#(未定义),例如:

010##$a7-80615-356-X$b1995

200 1#$a海口年鉴$Ahai kou nian jian

210 ##$a深圳$c海天出版社$d1996-

8564#uhttp://www.gov.hk.hi.cn/pandect/index.html$qtext/html$2海口年鉴(电子版)$z1996-

注:《海口年鉴》在Internet上的统一资源定位地址著录在$u,电子格式类型为全文及html类型,显示链接的文本著录于$2,$2公共附注说明可检索到的该年鉴的电子版所涉及的年代范围。

3 MARC格式组织网络信息资源的优点

3.1 标准化程度高。

MARC有一套规则来定义项目的内容,MARC的任何规则修订都经过长时间的讨论,标准较为规范,它要求编目人员严格遵循标准的编目规则,如:AACR2、受控词表、标准分类体系等等。用MARC格式进行网络资源组织实际上是属于受控编目,编目数据元素组成具有统一性,有利于资源交换;MARC系统完善、字段完备、数据结构严密,能对信息进行完整层次的分析描述,使信息完整准确;同时编目信息经过编目人员过滤、筛选和规范,标准化程度高。

3.2 兼容性强。

MARC的资料描述项目多而完整,与其它种类的元数据兼容性强。由于各种元数据系统在广度、深度侧重点和覆盖范围等方面存在不同之处,描述项目少且结构简单的元数据若要与结构完整的元数据MARC格式对照,则结构简单的元数据的每个项目都可以顺利对应到。举例来说,若将Dublin Core的描述项目转换成MARC的项目,因为MARC的项目较Dublin Core的描述项目多,所以Dublin Core的每个描述项目都可以顺利对应到。反之,若将结构完整的元数据与结构简单的元数据作对照,则有无法对应的项目,会有空项目,或是多个项目使用一个描述项目。目前,一些图书馆的自动化系统可以将其它非MARC记录自动转换成MARC的格式,MARC记录通过Z39.50通讯协议来传输,凭借856字段在OPAC(Online Public Access Catalog)上进行记录的查询与交换,并可以输入与检索。

由于目前世界各国的图书、情报、出版部门中业已存在的庞大的MARC机读书目数据库,MARC被当作通用编目模式具有强大的优势,越来越多的图书馆用MARC格式对网络信息资源进行组织,MARC格式为网络信息资源编目,已成为图书馆组织网络信息资源的一种有效方法。

4 网络信息资源编目的思考

4.1 MARC格式需进一步改善。发展后的MARC格式虽然可用于网络信息资源的编目,但在网络资源整理和组织方面依然存在着一定的局限性,如:856字段需要维护,以确保所提供信息资源的准确性;格式过于复杂,专业性太强,编制记录需经专业训练等,MARC繁琐的著录规则、标准以及数量众多的字段、子字段限制了编目的简易、通俗和效率;对著录的软件系统要求严格,MARC必需在专门的软件系统中使用,如要将MARC书目数据库转化为可以在因特网上浏览的数据库,必须先将著录结果用HTML语言加以标识,过程复杂。而且格式标识缺乏灵活性,没有文本标识灵活等。

4.2 加快CNMARC研究,形成统一的标准,增强对网络虚拟资源的处理能力。随着网络资源信息量的迅速增长,网络资源的编目将成我国图书馆编目工作发展的一个方向。CNMARC对网络虚拟资源的处理能力还很有限,因而需要在MARC的基础上,加快CNMARC研究,开发出统一、标准的数据格式,增强对网络信息资源的处理能力。

4.3 电子信息资源出版规范化。电子出版物目前在我国正以较快的速度发展,尤其是最近几年,品种和数量已经具有一定的规模。但是由于国家对电子出版物没有制定统一的出版物规范,电子出版物信息资源所提供的信息比较混乱。有的缺少必要的信息,有的信息内容和格式极不规范,给图书馆编目工作带来了一定的难度。因此,电子出版物制作、出版的规范化是当前亟待解决的问题。

标签:;  ;  ;  

MARC格式在网络信息资源编目中的应用研究_元数据论文
下载Doc文档

猜你喜欢