MARC在网络资源编目中的应用分析_互联网论文

MARC在因特网资源编目中的应用分析,本文主要内容关键词为:编目论文,因特网论文,资源论文,MARC论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号 G254文献标识码 A文章编号 1007-7634(2004)06-0746-03

MARC(Machine—readable Catalogue)格式是用于描述、存储、交换、控制和检索的一套机读书目数据标准,设计于20世纪60年代,是发展历史最悠久、最成熟的元数据格式,是传统编目的典范,在图书情报界得到了广泛应用。

虽然因特网资源较之传统印刷资源有诸多不同之处,但笔者以为,MARC仍能在因特网资源编目中大显身手。

1 可行性分析

1.1 OCLC所做的可行性实验

1991年,OCLC主持了一项旨在获取对当时在因特网上可获取资源的类型和本质更广泛的了解,并测试使用MARC/AACR为因特网资源编目的适宜性和适应性的因特网编目实验。

来自全世界的30个计算机文档、编目经验从2年~20年的编目员,自愿参加了对因特网资源样本的编目。工程人员随机收集了300个因特网资源的样例。他们将这些样例分成30组,分发给编目员们。

通过试验,有关人员得到了一个重要发现就是除了一些例外,MARC/AACR能适应因特网资源的著录。而且,OCLC陆续推出的InterCat、NetFirst、CORC一系列因特网资源编目项目都验证了MARC在因特网编目中的可行性。

1.2 MARC自身的优势

(1)标准的通讯格式。

MARC是整个图书馆行业内通行的标准,其主要目的在于加强信息的交流。MARC标准的利用,允许各类系统共享信息资源,允许一个系统替代另一个系统而仍能保证数据可以兼容。

(2)适用于各种著录级别的简洁的记录结构。

MARC提供了一种单一而简洁的记录结构,允许对信息进行不同级别的灵活著录。各信息机构可根据自己的需要对信息采取不同级别的著录。每条书目记录由3个主要部分组成:头标区(Leader)、目次区(Directory)和可变长字段(Variable field)。如图1USMARC记录的结构。

图1

(3)灵活的显示格式。

MARC记录是为提供系统间信息的存储和交换指标而设计的。一旦记录被下载到本地的系统内,就可以根据不同的目的编写形成MARC记录的程序。在OPAC中,人们能够选择不同的格式显示同一条书目记录,如MARC格式的、完全标识的和卡片式书目记录。

(4)多种检索点。

除通常的作者、题名和主题索引外,MARC格式允许根据关键词检索的需要对每个字段标识符进行标引,并提供检索,而且,许多数据单元可被用作为限制检索的限定词,如记录类型、资料类型、语种、出版的国家和日期等。

(5)各类信息资源在图书馆目录中的集成。

利用现存MARC标准,把所有的对各种类型信息资源进行编目的记录集成到图书馆的OPAC中。研究者和学者们将由此获得极大的收益,能够检索世界上所有类型的信息资源,却只需使用一套检索命令。

1.3 MARC为适合因特网资源编目所作的一系列修改

在网络环境下,MARC能及时根据资源变化调整自己的格式,这也是其能够适合因特网资源编目的一个重要原因。下面以USMARC为例说明MARC所做的一系列改造。

(1)采用5..字段,用于记录网络资源信息的格式,如:用500,520字段反映一般性附注摘要附注,用516字段反映计算机文件类型或数据注释等,用538字段反映系统需求和存取注释。

(2)采用753字段,这是检索计算机文件的系统细节描述,主要是提供给读者对该资源的检索所必备的计算机环境的技术要求,它包括两个未定义的指示符及5个子字段,$a字字段是检索用机器类型,$b子字段为机器使用的程序语言,$c子字段为机器的操作系统,还有$6和$8子字段是与880字段相连接的连接子字段。

(3)USMARC在008字段的第26位计算机文件类型的代码中增加了一新的代码j,即联机系统或服务。因特网上资源属于计算机文件,USMARC中适用于计算机文件的字段均可对网上资源编目时使用。但它又与馆藏的计算机文件资源不同,网络资源是远程的虚拟资源,图书馆并非真正拥有,因此,在编目时应告诉读者该资源存在何处,为读者提供一个网上资源的链接点。

(4)增加856字段,专用于虚拟资源的检索方式及存储地点等事项的描述。它为读者提供获得资源的方法及地点,提供信息使读者找到馆藏或连接到服务器上。856字段的指示符有两位。第一位表示检索方式,目前定义了6个值,0—Email(电子邮件方式),1—FTP(文件传输方式),2—Telnet(远程登录方式),3—Dial—up(拨号方式),4—HTTP(超文本链接方式),7—method specified in subfield $2(表示该方式使用本字段中的$2子字段说明),#—空格(表示无信息提示);指示符的第2位表示该编目记录与856字段中所描述的网上电子资源之间的关系,目前定义了4个值,0—Resource(表示编目记录为网上电子资源),1—Version of resource(表示网上电子资源为编目记录的电子版本),2—Related resource(表示网上电子资源与编目记录相关,详细内容在$3子字段中描述),8—No display constant generated(没有产生可显示内容),#—空格(表示无信息显示)。856字段的子字段目前共有28项分别包括主机名、检索号、压缩信息、路径、所要检索的文件名、URN(统一资源名)、处理器要求输入的指令、口令、登录名、文件大小类型、URL(统一资源定位器)、记录控制号等著录内容,这些子字段都是可选择事项,是否使用往往由检索方式来确定。856字段为可重复字段,最常见的是有不同的检索方式、不同的电子地址、不同的版本形式表示同一种信息资源,即可使用多个856字段,读者检索时,可选择直接链接到远程的计算机上,从而获得信息资源。

其他MARC格式,象UNIMARC也仿照USMARC进行了修改。我国CNMARC还有大量的剩余字段,也完全可以借鉴USMARC的成功经验,采用增加字段的方式来适应因特网资源编目的需要。

2 必要性分析

由于因特网的发展,使得信息的产生、储存、传递及检索方式都发生了巨大的变化。面对因特网所提供的海量信息,人们起初无比惊喜,但网上信息资源分布广泛、形式庞杂、质量参差不齐且变化频繁,因此对广大用户来说,都深感网上可以利用的有效信息越来越少,检索日趋困难,急切希望有专人进行筛选、加工、组织。虽然网上信息系统和检索工具的开发与不断完善使网络信息资源的有序度得到了一定的改善,但并不能使网络信息资源完全处于一种有序的状态之中。如目前已得到广泛应用的搜索引擎,其检准率低、命中记录重复出现、检索结果显示过于简单的缺陷使得它不能担当因特网资源组织之重任。

于是,一些新兴的组织网络资源的元数据应运而生,如TEI标题、都柏林核心(DC)、统一资源特征(URC)等。因特网编目项目(InterCat)的有关人员就各种数据结构的相对灵活性、兼容性、可靠性、综合性和复杂程度,将上述元数据与USMARC进行了对比,他们发现,就对新的数据单元生成的灵活性而言,USMARC排在最后,就表达电子对象的综合性而言,它位于第二,仅次于TEI标题;但就它与现存书目数据库的兼容性、检索的可靠性和数据结构的混合而言,在较新的元数据标准中,它都居于首位。因此,有必要把MARC应用于因特网资源编目中。尤其在我国,图书馆现代化程度低,数字图书馆才刚刚起步,中文元数据研究还很不成熟,甚至一些资深的图书馆也没有足够的资金来引进先进的元数据软件系统。况且大部分图书馆都采用MARC格式,引进一套全新的编目系统会给图书馆业务管理等各个方面都将带来麻烦,所以从实际出发,对MARC进行改造和完善不失为一种最佳的对因特网资源进行编目的方案。

3 应用实例分析

下面是WordCat数据库中用USMARC对网络信息资源编目的实例。

USMARC Record for City of Bits

001 32437789

003 OCoLc

005 19000000003748.0

008 950508s1995 maun d eng d

040 MYG $c MYG

090 TK5105.5 $b.M57 1995b

100 1 Mitchell,william J.

245 10City of bits $h [interactive mutitmedia]:$b space,place,and the Infobahn/$c by William J.Mitchell

250 World—Wide Web ed.

256 Computer data

260 [Cambridge,Mass.]:$b MIT Press,$c 1995.

516 Text(HTML),images(GIF),and video(MPEG,Quick Time).

538 System requirements:Web brower,video viewer such as QuickTime or MPEGPlay required for video applications.

538 Mode of access:Internet.Address:http://mitpress.mit.edu/CityofBits/.

500 Title from title screen.

530 Also available in printed ed.

520A hyperlinked exploration of the“virtual city”which is now emerging through our hurgeoning use of the information superhighway.Re—examines architecture and urbanism in light of our increasingly digital means of commuication.

505 0 1 Pulling glass—2.Electronic agoras—3.Cyborg citizens—4.Recombinant architecture—5.Soft cities—6.Bit biz—7.Getting to the good bits.

504 Includes bibliographical references.

650 0 Computer networks.

650 0 Information technology.

650 0 Virtual reality

650 0 Computers and civilization.

856 7 $2 http://mitpress.mit.edu/City—of—bits/

$u http://purl.oclc.org/OCLC/OLUC/32437789/1

001,003,005,008为控制字段,用于处理MARC书目记录。001为控制号字段,用于存储系统控制号,具有唯一性。003为控制号所属机构代码字段。005为记录最后处理日期与时间,共由16位字符组成,可由系统自动生成。008字段为定长数据元素字段,提供书目记录整体的编目信息以及所编文献特有的书目特征,包含40个字符位(0—39),分别表示记录生成时间(0—5)、出版日期类型(6)、出版日期(7—14)、出版地(15—17)、图表代码(18—21)、阅读对象代码(22)、文献类型代码(23)、内容特征代码(24—27)、政府出版物代码(28)、会议出版物代码(29)、纪念文集代码(30)、索引代码(31)、未定义(32)、文学体裁代码(33)、传记代码(34)、语种代码(35—37)、修改记录代码(38)、编目来源代码(39)。040为编目源字段,表示把目录信息转成机读形式的机构代码。090为由其它成员馆分配的国会图书馆类型索书号字段。100为个人名称主要款目字段。245为题名责任者项事段,其中10为字段指示符;$h、$b、$c为子字段指示符,分别表示载体、并列题名和责任者。250为版本说明字段;256为计算机文件特征字段;260为出版发行项字段;516为计算机文件类型或数据附注字段;538为系统细节附注和存取注释手段;500为一般性附注;530为其他载体形态附注;520为摘要等附注字段;505为格式化内容附注,包括著作内篇名或章节题名、目次等;504为书目等附注;650为主题附加款目,其中,0表示主题标目,来自LCSH(Library of Congress Subject Heading);856为电子资源定位与检索字段,由于前面已经作过叙述,这里不再解释。

4 用MARC进行编目的两点思考

一是在目前多种元数据并存的情况下,要增强MARC在网络环境下的适用性,除了自身必要的调整和修改外,整合各国MARC为统一格式,以及加强MARC与其他新兴元数据的映射转换是十分必要的。

二是在对因特网资源编目时,各图书馆应根据自己的馆藏特色,选择一些利用价值高、且较稳定的资源进行编目。另外,在进行网络资源编目时,为了避免传统编目各行其是的状况,推行联机联合编目是十分必要的。

标签:;  ;  ;  ;  

MARC在网络资源编目中的应用分析_互联网论文
下载Doc文档

猜你喜欢