论数字馆藏的管理_图书馆论文

论数字馆藏的管理_图书馆论文

论数字馆藏的管理,本文主要内容关键词为:数字论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

随着图书馆计算机网络化的发展,读者对图书馆通过网络开展信息服务的需求逐步提高,使得各馆更加重视数字化信息资源——数字馆藏的建设、开发和利用。数字馆藏的急剧增加,使得现代图书馆在海量数字化信息资源的存储与管理上的矛盾日益突出。因而,如何有效地存储、管理、开发和利用这部分数字馆藏,是当前图书馆急需研究、解决的重要问题之一。

1 数字馆藏的含义与特点

1.1 什么是数字馆藏(Digital holdings)

数字馆藏又叫数字化馆藏、数字式馆藏或电子馆藏等。近些年来,随着出版技术、信息技术、存储技术和网络技术的发展,馆藏资源的类型和载体形式都发生了很大的变化。其中,各种类型的数字化信息资源的快速增长,使得各馆日益重视数字化信息资源的建设。今天,数字化信息资源已经成为现代图书馆馆藏中不可或缺的重要组成部分。因而,数字馆藏的建设与发展不仅是数字图书馆,而且是现代复合图书馆的中心工作之一。

什么是数字馆藏呢?有关文献如是说:数字化馆藏是相对于印刷型馆藏而提出的,即指图书馆馆藏中以数字化形式(即用0或1来表示)存储于特定的设备上如硬盘、光盘上的那一部分馆藏[1]。数字馆藏是指经过数字化处理,借助计算机或计算机网络利用的文献信息[2]。

概括地说,数字馆藏是图书馆整个馆藏的组成部分之一,是图书馆馆藏中以数字形式保存的和借助于计算机网络可以利用的(如仅有网络使用权的外文数据库,以及其他形式的虚拟馆藏等)那部分信息资源的集合。具体地说,它是图书馆馆藏中必须借助计算机等信息技术设备进行管理和利用的数字信息资源的总和。

1.2 数字馆藏的特点

数字馆藏是现代图书馆馆藏中发展最快,利用率最高,最具活力的一部分信息资源。数字馆藏不仅在存放形式上区别于传统馆藏,而且其高度的可共享性和不受时间、地点的限制的服务能力,使得人们日益重视数字馆藏的建设和发展。概括地说,数字馆藏具有许多优点,但它也有许多不足,具体特点如下:

高度可共享性。一份数字馆藏,如一种电子期刊或一个数据库,借助于计算机网络可以供多个读者利用。

易于管理。数字馆藏完全可以依赖计算机进行自动管理。特别是对于构建在存储局域网上的数字馆藏,数据资源的存放完全可以根据读者利用率的高低自动地进行调度。

开放时间长,不受图书馆作息时间的限制。

服务范围大,不受地域限制。读者不必到图书馆,可以在校园网,甚至因特网上查询、下载、打印自己需要的文献信息。

占用馆舍空间小。

对设备的依赖性强。数字馆藏必须借助一定的信息技术设备才能被有效地利用。如光盘塔、光盘库、光盘镜像服务器、磁带库、磁盘阵列和服务器等等。

对环境要求高。这主要是指存储数字信息的存储设备、服务器和网络设备对环境的要求,如温度、湿度、防尘、防静电等等。

易受损害。这有两方面的含义,一是数字馆藏易受病毒等的感染而导致不能正常使用;二是由于存储设备(如磁盘、光盘等)的损坏,而导致数据的丢失。

管理难度大。数字馆藏虽然可以依赖计算机进行自动管理。但由于构成数字馆藏的数字信息资源的知识产权问题,存储设备的更新换代问题,阅读有关资源的软件的升级问题以及数字馆藏的不定期迁移问题等等,其管理过程中涉及的因素多,难度大。

2 现代图书馆的馆藏构成及其数字馆藏的形成方式

数字馆藏不仅是数字图书馆的重要组成部分之一,而且它在现代复合图书馆(hybrid library)的馆藏建设中地位也越来越重要。数字馆藏虽然建设时间很短,但发展很快。而且,各馆在建设数字馆藏时所采取的方式也多种多样。不过,不同途径或方式形成的数字馆藏,在知识产权、馆藏形式和管理模式等方面也存在着较大的差异。因而,我们要对数字馆藏进行科学管理,必须首先弄清现代图书馆数字馆藏的形成方式。

现代复合图书馆的馆藏从信息内容的表现形式看,主要由两大部分构成:一是传统的非数字化的馆藏(如:纸基介质的印刷型文献和胶片等);二是数字馆藏。数字馆藏又可细分为:实体数字馆藏和虚拟数字馆藏。

数字馆藏从形成方式来看,主要有三种方式。一是购入式数字馆藏(如购买的各类数据库等),二是自建式数字馆藏(如本馆自己建设的各类特色数据库等),三是开发式数字馆藏(如基于因特网组织的虚拟馆藏等)。从目前来看,由于人才、设备、资金等条件的限制,数字馆藏的形成主要是通过购买现成的数据资源的方式来建设。具体地说,购入式也有两种方式:基于版权的购买和基于使用权的购买[3]。基于所有权的购买,图书馆一般拥有数字化信息资源的实体物权和使用权,如光盘等。而基于使用权的购买,主要是购买某种数字资源在某个范围和某个时段内的使用权。这类资源一般是一些大型数据库,主要购买许可使用协议,通过计算机网络为读者提供服务,如EI(工程索引数据库)等。这类资源对图书馆来说,只是为读者提供了获取信息的权利,是虚拟馆藏资源。不过,我国一些大学图书馆在特色数据库的建设上也很有成效。如:北京农业大学图书馆自建的农书古籍图片数据库和肉牛养殖专题数据库等。另外,通过对因特网上信息资源的开发和利用,建立自己的虚拟馆藏也是数字馆藏建设的重要方法。如Calis组织的学科导航,解放军医学科学院图书馆的学科指引库等都很有特色[4]。这也是目前我们各馆组织建设自己数字馆藏的一种行之有效的方法。这种方法,不仅可以弥补我们经费的不足,而且又能丰富我们馆藏资源,形成特色馆藏,满足读者的信息需求。

在建设和发展数字馆藏时,要结合本馆的实际和特点,既可以选择某一种方式,也可以同时选择几种方式协调发展。但不同方式构建的数字馆藏具有不同的特点,满足读者不同的需求。因而,我们在建设时,要在分析读者需求,评价馆藏价值的基础上,制定数字馆藏发展政策,使数字馆藏建设更加科学合理[5]。

3 数字馆藏管理的含义

现代图书馆中数字信息资源虽然早已存在,但过去由于数量少,规模小,其管理问题一直未能引起人们的重视。近几年随着因特网的普及和数字信息资源的快速发展,馆藏中数字信息资源急剧增加,在管理和服务等方面的矛盾日益突出,这时一些有远见卓识的专家学者便开始呼吁海量数据(数字馆藏)的存储管理问题。无论是在复合图书馆发展时期,还是在数字图书馆的建设过程中,数字馆藏的建设和管理都是极其重要的。

数字馆藏不同与传统的纸介质的馆藏,依据存放载体形式和服务要求的不同,其管理方式有很大的区别。如以光盘和磁带为载体的电子文献具有一定的物理形状,它们通常类似于图书的管理,可以分类、加工,并存放在特制的书架上或光盘柜内。与纸质文献不同的是,可以利用它们实现在线服务。但要实现在线管理与服务,就必须使用特定的设备和相应的管理软件,如光盘塔、光盘镜像服务器、光盘库、磁带库和磁盘阵列等等,必要时还得组成存储网络。除此之外,大多数数字馆藏是以数据库方式存储在磁盘或磁盘阵列或因特网上(如虚拟馆藏)。这部分数字馆藏,通常没有物理形式,需要特定的存储设备和管理软件。其管理方法还会因所使用的设备和软件的不同而不同。其服务效果,也会因为各馆所使用的设备、管理软件以及网络环境的不同而有很大的差异。可以说,数字馆藏在表现形式、存储方式等方面较传统馆藏更为多样,技术性强,管理难度大。

数字馆藏管理实际上就是决定什么信息如何存放和存放在哪里,哪些信息需要长期存放(保藏),哪些信息需要不定期地迁移或删除,以及何种设备和存储形式适宜本馆的需要,何种访问策略有利于数据的安全和对本馆读者权利的保护等等。概括地说,对数字馆藏管理的目的就是在读者有需要时,能够及时准确地为其提供服务,同时在有效保护信息所有人利益的前提下,又要保证读者的合理利用。

4 数字馆藏管理的内容

数字馆藏管理对图书馆馆员来说是一项全新的富有挑战性的工作。它不仅没有可供参考的管理理论,而且它涉及的技术因素较多,知识范围较广。可以说,数字馆藏的管理既有技术的,又有法律的,还有经济和管理的因素。数字馆藏的管理应贯穿于图书馆采访、编目、保存、检索和阅览等环节。可以预见,在不远的将来,数字馆藏的管理,将是现代图书馆中一个十分重要的工作岗位。从目前的实践来看,数字馆藏的管理应包括以下方面的内容:数字馆藏建设与知识产权问题,数字馆藏的长期保存与存储安全问题,数字馆藏技术管理问题——存档和迁移,数字馆藏的访问管理,数字馆藏存储体管理和数字内容的管理等等。

4.1 数字馆藏建设中的版权问题。

数字资源由于其易于复制,为不法分子的盗版提供了可乘之机。我们一些图书馆由于缺乏有关版权方面的知识,在购买数字资源时,往往忽视其版权问题。这样常常使得由于资源供应商的侵权给我们图书馆造成不必要的连带责任。可以说,数字资源,即数字馆藏建设中的版权问题是目前数字图书馆建设中矛盾最为突出的。因而我们必须了解有关的问题,以免我们苦心经营的数字馆藏成为侵权的祸根。数字馆藏不同于传统纸质文献的存储、处理和传递方式,对以纸质文献为基础建立起来的版权制度构成了强大冲击。数字版权问题已成为世界图书馆理论研究的焦点之一,问题主要集中在合理使用、信息资源建设以及用户服务等方面[6]。由于数字馆藏的形成方式不同,所涉及到的版权问题也不尽相同,下面我们分而述之。

4.1.1 购入式数字馆藏

购入式数字馆藏是我们数字馆藏建设的主要形式之一,它主要是通过购买市场上现成的数据库等数字资源来丰富自己的馆藏。这种方式的特点有四:一是速度快,也就是说很快就能增加馆藏,为读者服务。这对于一些馆藏严重不足,希望迅速增加馆藏的图书馆来说,无疑是一条捷径。二是这类资源通常标准化程度高,资料加工规范,错误率低;三是系统功能较强,售后服务较好;四是相对于我们自己加工更为经济。以电子图书为例,目前市场上每册电子图书的价格多在2~5元之间,而我们自己加工一本电子图书一般需要100~200元工本费。因而,一般情况下,市场上出售的成熟的数字化资源,应以购买为主,尽量避免不必要的重复加工。但是,从国内外的有关数字资源(主要是数据库)产品看,一些数据库程度不同地存在侵权问题,在购买时要多加注意。这方面的侵权问题,反映在数据供应商和图书馆两个方面。以市场上销售的一些中文电子图书全文数据库为例。一方面,数据库中的许多图书未经所有权人授权,不时有著作权人将有关公司告上法庭;另一方面,图书馆在服务中没有科学的访问管理控制,使得图书被任意下载和复制。

4.1.2 自建式数字馆藏。

这种方式涉及到的知识产权问题,依据目的不同、数据库的形式不同而不同。一般有三种情况:

为了保存古籍、特藏等将本馆中一些特色资源经过扫描、加工成数字化形式加以保存,这种目的生产的数字化资源不存在侵权问题。

一些图书馆为了解决印刷本图书共享性低的问题,利用数字化加工工具将印刷版图书数字化后,在校园网上发布,供读者使用。这种目的,需要著作权人授权,否则将构成侵权。

一些图书馆为了提高馆藏文献信息的利用率,自主开发建设的二次文献数据库,如书目数据库,题名摘要数据库等。由于被加工对象大部分享有著作权保护,尤其是期刊论文,享有双重著作权保护,在将其收入数据库时就更容易涉及到著作权问题。我们一些馆员,往往认为,开发建设题名摘要数据库,不存在侵权问题,实际上不是这样。二次文献的目录、题录、文摘等也涉及了著作权中的演绎权,故在建立文摘索引库及编制检索工具时,应了解有关版权法规定,以避免侵权[7]。

4.1.3 开发式数字馆藏。

虚拟馆藏是开发式数字馆藏的一种形式。它是利用计算机网络动态链接技术,通过对因特网上信息资源的挖掘、加工、组织来实现的。链接的方式有正常链接和埋藏式链接两种。对于正常链接,用户在链接的导引下访问被链接对象时,就离开了设链者的主页,用户浏览器会清楚地显示地址的变化,用户能否浏览被链接网页的信息,完全取决于被链接网页的控制,这种情况不存在侵权行为。采用埋藏式链接,被链接网页不再以本来的面目出现在用户计算机屏幕上,使作品的完整权受到侵害。

4.2 数字馆藏的安全管理

数字馆藏建设受到各馆领导的高度重视,但数字馆藏存在的问题,特别是安全问题还未引起大家的重视。数字资源共享性高是其优点,同时也易于丢失和被病毒侵害。实际工作中,经常出现一些图书馆数百G的馆藏信息被丢失或因为受到病毒的侵害而不能工作。造成这种情况的原因是多样的,但数据的安全问题不能小视。依据工作实践,我认为数字馆藏的安全管理有两方面的含义,一是信息安全(information security),防止馆藏中的数字化信息被病毒感染或被黑客恶意的攻击或由于管理员的误操作而丢失。二是版权保护(copyright protection),要有恰当的加密和保密措施,防止数字馆藏未经授权非法使用或不尊重知识产权人的利益的非法的复制与扩散。

4.3 数字馆藏的技术管理

数字资源难以长期保存的一个重要原因,就是存储体和有关的存储设备的使用寿命较短。通常磁性载体的寿命一般为10至30年。光盘的寿命为100年。而记录和存储信息的设备和软件每3~4年就要更新换代。因而,凡是有数字文献的图书情报单位都面临着承载数字文献的载体退化而带来数字文献丢失的危险,以及因数字文献格式的多样化与读取、利用这些文献所使用的软硬件设备更新换代频繁而造成管理与使用上的不便[8]。数字化信息资料的长期保存正成为馆藏管理的一个重要研究课题。数字化信息的易变性,不仅造成了馆藏组织的困难,而且给长期保存带来了更大的难题。由于技术的发展,记录信息(数据)的格式还经常被新版本所替代。10年前普遍采用的字处理和图象格式已经废弃而难以使用。因而,对于图书馆而言,不仅要保存各类数字化的信息资料,而且还必须注意收藏能够正确打开、显示和阅读以往这些数字化馆藏的系统软件或浏览器。也就是说,存档不是简单地将位串从一个旧的介质上拷贝到一个新的介质上,还需要保留解释和处理这些位串的方法。数字化存档对应的技术是刷新(保持精确位串)和移植(保持语义层的内容、而不是位串)。刷新和存档需要定期进行[9]。但关于数字馆藏的技术管理目前还没有十分完善的方案,但可以借鉴现行做法中的经验和教训从以下四个方面加以考虑,即存储载体、迁移技术、转换技术和管理工具[10]。

4.4 访问管理

访问管理也叫访问控制,一些人称之为访问条款和访问条件,出版业通常称之为“权利管理”。它们侧重点不同,但本质是一样的,都是指如何对数字馆藏进行合理使用加以管理。既保证版权所有人的利益,又能使公众能够有效地利用。图书馆对数字馆藏进行访问管理,一方面是遵守版权法,维护知识产权人的利益;另一方面也是维护我们图书馆读者的利益,我们要优先保护合法读者对这些数字资源的阅览权,而限制其他未经授权的非法读者的访问;再者经济因素也是对数字馆藏进行访问控制的一个重要因素。实际上对数字馆藏进行访问管理,最主要的就是制定对资源的访问政策。

4.4.1 访问管理的基本元素

在制定政策时,我们还必须了解访问管理的基本元素。

访问管理的基本元素有四个,即信息管理员、用户、数字资料和访问(准许用户访问的政策)。信息管理员是网络时代数字图书馆或复合图书馆中派生的一个新的工作岗位。他既不同于我们通常所说的系统管理员,也不同于传统图书馆管理印刷型书刊的图书馆馆员,其主要职责是对数字馆藏进行维护和管理。对于我国的一些图书馆来说,由于数字馆藏数量较少,绝大多数图书馆还没有设立这个岗位,通常是系统管理员兼任。但从发展看,这个岗位必不可少。

用户管理是访问管理的重要内容之一。它主要包括两个方面:一是对用户身份的认证;二是对用户对数字馆藏操作行为的限定(由访问管理政策来实现)。认证用户身份的技术很多。一些技术易于实现,却容易被攻破;较为安全的技术往往又比较复杂。通常身份认证的技术可以分为四大类:

用户名和密码。这是一个标准的、广泛使用的身份认证方法。目前,图书馆的许多数字化资源的访问管理就是采用这种方法。这种方法容易导致滥用。由于人们经常选用容易记忆的密码,使得密码很容易被猜中和窃取。这个问题十分突出。如我们订购的一些在线资源,通常只有一个用户名和密码,为了方便本馆读者的利用,管理员往往将其在主页上公布,这样实际上也就失去了身份认证的意义。

智能卡。智能卡是最好的身份认证系统之一,安全性很高,使用也很方便。这种方法在国内的一些学校的电子阅览室也已使用。现在,一些学校为了方便管理,在校园内实行“一卡通”,既方便了管理,又保证用户的合法利益。但这种方法也有弊端。它必须有相应的读卡设备,一些公共场所设立这样的装置是可行的,但对于学校的老师来说,要让他们每人在家里的计算机上安装这样一个读卡设备就比较困难。对于公共图书馆就更难实现了。

IP地址。只要能访问该IP地址的计算机的人,就可以访问有关的数字馆藏。这对于图书馆的一些特定资源或特定的用户是可行的。图书馆可以提供这样的一些经过许可的,具有这样IP的设备供读者使用。目前,有一些数字资源还通过IP地址和用户名与密码的双重身份认证方法。如书生之家的电子图书等。

用户身体的特征。用户身体的某写特征,如声音、指纹等,在某些高级应用中也被用于身份认证。这种方法在数字图书馆中还很少使用。

4.4.2 访问管理政策

访问管理政策或叫访问管理策略,是由信息管理员制定的,它规定了谁被授权可以对哪些资料完成什么样的操作[9]。以下是我们郑州大学工学院图书馆的数字馆藏的访问政策:

馆藏书目数据库,任何人都可以查询,但只有负责分编的馆员才能修改。

郑州大学工学院学位论文数据库(自建的题名摘要数据库),任何人都可以查询、下载或打印某条记录。

清华中文期刊全文数据库、篇名目录和摘要数据库可以免费查询,全文内容只允许图书馆合法读者访问。读者对所需的论文,可以按篇下载或在线打印。

北京书生电子图书全文数据库,全文内容只允许图书馆合法读者阅读。读者对所需的内容,只能将选订的部分下载或在线打印,不允许对整本书进行拷贝或打印。

对一些仅购买了使用权的外文数据库(如EI,在线方式),图书馆的合法读者可以查询、阅读题名和摘要,要获取原文必须给图书馆信息管理员联系,并预付费用,才能与EI公司联系进行全文传递服务。

访问管理政策依据各馆所拥有的资源不同,读者类型不同和服务政策不同会有较大的差别。另外,访问管理不仅仅是制定适当的政策,关键是大家能够遵守。实际管理中,一些政策可以通过技术手段实施,但并非所有都如此。从技术上讲,可以规定谁可以更改馆藏中的数字内容,谁只能查询馆藏。但却难以限制对资料的恶意剽窃或者隐私权的侵犯,也无法限制所有使用都出于教育目的。再者,还要权衡政策实施的严格性和用户使用的方便性。有时,实施访问管理政策的技术方法可能会使用户感到厌烦而远离图书馆。因而,制定一个科学合理的访问政策很重要,必须在知识产权保护与合理利用之间找到一个平衡点。任何由于对知识产权的保护,而限制了读者的利用,实际上也就是限制了知识的有效传播;以及为了便于读者利用,而侵害了所有权人的利益,都是不正确的。这样的访问政策是不科学的。

4.4 数字内容的管理

一个数字图书馆是一个有效管理的数字对象集(内容)和服务集(功能)[11]。对数字内容的管理是数字馆藏管理的重要内容之一。在这里所说的内容管理主要是如何对海量数据资源进行组织,以便用户访问。数字馆藏由多种类型的数字资源所组成,如文本型、图片型、音频型和多媒体型等等。不同种类的信息资源,其组织方式、管理方式也不尽相同。目前,对海量数据的管理,一般都是采用元数据管理和数字对象及对象集类管理。对于海量信息,特别是多媒体信息,检索的准确和速度都非常需要元数据。对数字对象的访问,特别是多媒体、超文本的信息,都是通过元数据实现的。元数据根据其功能的不同,可以划分为描述性元数据、结构性元数据和功能性元数据。对数字馆藏的管理,很大程度上就是对元数据库的管理。

4.5 数字馆藏存储环境的管理

存锗设备不仅关系到信息服务的效果,而且与数字馆藏的长期保存直接相关。对数字馆藏的存储环境的管理,主要是指存储数字资源的有关的设备及其网络环境的管理。可以说,数字馆藏的安全与否,首先是存储设备的安全与否。存储环境的管理应包括对存储设备、网络的维护,对有关设备的更新换代等。

总之,数字馆藏管理是现代复合图书馆和未来数字图书馆建设的一项新的重要内容之一。在数字化信息资源日益丰富,数字馆藏逐渐增加的今天,加强对数字馆藏的建设与管理的研究,有利于各馆的建设和发展。但由于一些图书馆数字资源相对较少,对数字馆藏的管理还未引起足够的重视,结果在存储和利用数字化资源时往往出现了许多问题,甚至造成了巨大的损失。数字馆藏管理是一项复杂的系统工程,是现代图书馆一项全新的富有挑战性的工作,因而我们工作中必须注意以下几方面的建设和研究:数字馆藏基础设施的建设,管理人才的培养,有关管理技术的研究,相关法律、法规的学习和标准的制定。

标签:;  ;  

论数字馆藏的管理_图书馆论文
下载Doc文档

猜你喜欢