图书馆数字资源整合的技术层次与实现模式探讨_图书馆论文

图书馆数字资源整合的技术层面与实现模式探讨,本文主要内容关键词为:层面论文,资源整合论文,图书馆论文,模式论文,数字论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

随着图书馆数字资源的剧增,资源载体形式和利用手段均日趋多元化,数字资源在为用户提供便利的同时也逐渐暴露出诸多问题,如资源之间互不关联、内容交叉,平台各异、用法不一等。如何解决这些问题,实现数字资源的有效整合,国内外的研究者进行了各种各样的研究和探讨。从S.Pinfield的“无缝整合”理论,到H.Sompel的“OpenURL框架下的数字资源参考连接”解决方案。“数字化资源整合”正越来越引起图书情报界的重视,正逐步成为研究热点。

在目前国内兴起的信息资源整合浪潮中,有一种误解认为整合将一蹴而就,用一个平台软件或是购买大容量存储设备就可以做得到。实际上,图书馆的数字化资源整合是一项长期和系统地积累的过程,决不是一朝一夕就能实现的。它是图书馆管理理念的一场变革,也是信息自动化应用技术的一次提升。重技术、讲方法是实现资源整合的关键。

1 资源整合的技术层面

图书馆资源整合可分解为以下几个技术层面(如图1):

附图

图1 图书馆资源整合技术层面图

1.1 资源加工层

加工层整合是将各种类型的资料转化为有序的数字资源。它既指将各种印刷型资料、音频资料、视频资料进行数字化加工,转化为数字格式的资源;也指将各种数据库、电子图书、电子期刊等进行必要的格式转换、元数据标引等处理;还包括有目的有方向地采集原本无序分散的网络资源,将之进行初步有序化处理。用以上技术方法使各种资料具备数字图书馆的基本管理和服务需求。

转化后数字资源类型主要包括元数据与对象数据两种。对象数据包括全文文本(包含文本中的目次)、图像、动态影像、音频等多种文件格式的数字信息。元数据通常被定义为“关于数据的数据”。元数据技术在资源的加工、调度、检索等方面发挥着关键性的作用。在数字图书馆系统框架中有重要地位。目前信息资源组织中比较常用的元数据格式包括:MARC(Machine-ReadableCataloging)格式、文献编码计划书(TextEncodingInitative,TEI)、都柏林核心数据(DublinCore)等等。

资源加工层的工作可以从根本上融合不同的数字资源,实现资源与应用服务(尤其是个性化服务)的高度整合,从而把数字图书馆的服务上升到一个新的高度。但对一般的图书馆而言,不可能持续合法地获取各类引用数据库的元数据。对于这部分资源整合,我们可以通过资源应用层和表现层实现。

1.2 资源应用层

应用层整合通过与整合对象的互操作获取元数据和对象数据,实现对不同资源的透明访问。应用层包含复杂的事务处理逻辑,主要由中间件组件构成。中间件是一种独立的系统软件或服务程序,分布式应用软件借助这种软件在不同的技术之间共享资源,中间件位于客户机与服务器的操作系统之上,管理计算资源和网络通信。它的主要作用是用来屏蔽网络硬件平台的差异性和操作系统与网络协议的异构性,使应用软件能够比较平滑地运行于不同平台上,为数字资源的整合提供技术基础,中间件具有标准程序接口和协议,可以实现不同硬件和操作系统平台上的数据共享和应用互操作。

应用层整合从内容上提供对分布式资源的深度交叉关联,并用更符合用户习惯的使用方式完成对不同资源系统的透明访问,从而在一定程度上解决了各种资源之间存在的内容交叉、互不关联、各自孤立等问题。通常不直接改变资源对象的底层元数据,而是通过标准化的数据接口与数据源进行互操作,因此,资源对象的数据接口是否标准规范将对整合效果和持久性有很大影响。

1.3 资源表现层

通过加工层和管理应用层的整合后,表现层为多样化、分布式存在的信息源(如数据库)提供逻辑组织和导引,将资源有序地呈现给用户,为用户提供方便快捷的、个性化的、安全可靠的服务。表现层整合利用多种逻辑主线(如资源类型、学科主题、字顺等)把信息源串接起来,好比在画一幅资源分布图,能够为用户(尤其是对资源不熟悉的用户)提供很好的导航,方便用户快速定位到目标资源。

目前采用的较多的主要有三种表现方式:资源导航、统一检索和个性化服务。用户可以根据不同的分类导航到所需的资源;选择所需的数据库进行统一的检索,得到一个统一的检索结果页面;也可以订制自己所关注的资源信息,及时获取。

2 模块化的资源整合模式

图书馆馆藏是由不同学科、不同文献类型、不同文种、不同深度和一定数量的文献组成的具有特定功能的整体。20世纪以来,文献信息的急速增长以及读者需求的日益增多,图书馆馆藏也以前所未有的速度增加,馆藏结构随之产生重大变化。现阶段图书馆馆藏一般是以印刷文献与电子文献共存互补的形式存在的,既包括书刊等纸质实体馆藏,还包含了自建数据库、引用数据库等虚拟馆藏。根据这种复合式的馆藏特点,图书馆资源整合的具体实现,可从实体馆藏和虚拟馆藏两个方面入手,分别建成以这两类馆藏为核心的资源整合模块,再逐步实现两大模块的融合,最终实现信息资源的完全整合。

2.1 建立以实体馆藏为核心的整合模块

虽然数字化信息资源在馆藏资源中占据越来越大的比重,发挥越来越大的作用,但是,传统纸质文献资源在一个相当长的时间里,依然是馆藏资源不可取代的重要组成部分,其作用不可忽视。在数字资源系统的整合中,必须做好实体馆藏的数字化及其整合。

(1)OPAC系统的构建。OPAC,全称为Online Public Access Catalogue System,公共联机书目查询系统,这是利用计算机终端来查询基于图书馆的馆藏数据资源的一种现代化检索方式。是图书馆数字资源最基本的整合方式。OPAC系统的构建需对实体馆藏回溯建库,将馆藏书目数据以标准格式录入到数据库,转化为数字信息。它还需要建立完整的读者信息资源库、期刊题录、文摘等等信息数据。它使书目数据服务与信息服务有机结合,实现预约、续借、读者信息查询等交互功能,为更深层次的个性化服务奠定了基础,是数字化图书馆馆藏主体资源系统。

(2)馆际间OPAC资源系统之间的整合。它的主要任务是建立联机合作编目、资源共享系统,为读者提供书刊文献资源网络公共查询,支持馆际间的联机合作编目,为成员馆之间实现馆藏资源共享、馆际互借和文献传递奠定基础。通过执行Z39.50协议,聚合不同平台上的异构OPAC数据库,建立书目整合检索系统,用户只要通过一个OPAC系统界面即可检索相关图书馆的OPAC。江苏省高校目前普遍采用的“汇文分布式虚拟联合目录查询系统”,就是一个馆际间OPAC资源系统整合的产品。它可以访问国内外主要的图书馆系统的OPAC平台,包括Innopac、Sersi、Horizon、ILAS、汇文等系统,一次查询即可涵盖国内外数百所大学图书馆。同时,它可以和馆际互借、文献传递服务相衔接,通过这些附加的服务,索取所需的图书、文献,从而实现地区甚至全国范围内的资源共享。

2.2 建立以虚拟馆藏为核心的整合模块

虚拟馆藏主要包括:①图书馆自建的学位论文数据库、特藏资源数据库;②图书馆购买的拥有使用权限的联机数据库或者安装在馆内的镜像站点;③图书馆订购的光盘数据库;④从网络获取的数字资源;⑤随书光盘等。

(1)虚拟馆藏的加工。将网络获取的数字资源与随书光盘,按照CALIS推荐的元数据标准和自建库技术规范,分别建立专门的数据库。使之与学位论文数据库、特藏资源数据库一样采用通用的国际、国内和行业标准,实现开放接口,便于资源深度关联。

(2)实现虚拟馆藏的跨库统一检索。将不同类型、不同结构、不同环境、不同用法的各种异构数据库纳入统一的检索平台,以便于用户更方便、更高效地获取信息。在跨库检索技术中,目前主要有两种方式实现,一种是通过开放检索协议,另一种是通过Web检索代理。前一种实现方式需要被整合的数据库必须开放相应的协议支持,如Z39.50和OAI协议。这在目前的数据库,特别是中文数据库中尚很难普遍做到。而Web检索代理方式只要网络数据提供Web访问,就可以实现跨库检索。对提供文献信息服务的图书馆来说,大多数有价值的文献都是以Web可访问的数据库方式存在的,因此目前来看Web检索代理方式具有较强的通用性。

(3)实现虚拟馆藏的参考文献链接。参考文献链接(Reference Linking)是因特网环境下索引、文摘等二次文献和文献全文之间的相互链接。用户在因特网上使用电子文献,希望能够从电子文献的索引文摘“透明”地链接到对应的全文。特别是希望从现有的文摘型数据库“无缝”地链接到“全文数据库”。数字对象的知识产权和所有权归属于不同的机构。这种需求不是简单的URL地址的静态链接,而是需要不同类的数字对象之间采用开放的链接方式。DOI系统参考文献链接技术和OpenURL开放链接技术,是目前实现参考文献链接的主要技术。

2.3 实现两大整合模块间的融合

在OPAC系统中提供超链接功能,以便读者在OPAC系统中检索到所需电子图书或电子期刊的同时直接打开全文。实现这样的融合,通常可采用以下两种方式。

(1)一般是通过依据MARC格式要求和相关著录规则,对电子期刊进行编目。或直接从数据库厂商获取电子期刊的MARC数据,导入OPAC系统中。启用MARC纪录856字段,可用856字段@u来标注与电子期刊系统的URL链接,用@z来标注与刊名连接的注释;同时采用530字段附注说明,注明相关订购信息。读者可以在检索到所需电子文献后,直接点击链接,阅读全文。这种方式使用于自建数据库与OPAC之间的融合。

(2)由于引用数据库的后台数据库一般不可以直接访问。对于这类数据,可采用代理实现,OPAC在后台将对应的参数传递给代理,代理分别调用各个电子期刊数据库的OpenURL信息,进行必要的认证系统登陆和检索式构建,返回OPAC完成后的OpenURL链接。当用户在OPAC系统中点击所需电子文献链接时,由相应数据库执行检索操作,并返回检索结果。

标签:;  ;  ;  ;  ;  ;  

图书馆数字资源整合的技术层次与实现模式探讨_图书馆论文
下载Doc文档

猜你喜欢