从勤劳建设看欧洲数字图书馆的发展_数字图书馆论文

从DILIGENT建设看欧洲数字图书馆发展,本文主要内容关键词为:欧洲论文,数字图书馆论文,DILIGENT论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 引言

随着网格技术的发展和e-Science的出现,近年来.国际数字图书馆界开始探讨e-Science环境下数字图书馆的建设模式与发展策略。2004年9月,欧盟拨款630万欧元启动DILIGENT原型项目[1]。作为一个为期3年的原型项目,DILIGENT的目标是创建一个先进的试验平台,使动态虚拟的组织成员能够以安全、协调、动态和低成本高效益的方式开展合作,存取共享的知识。来自ISTI-CNR的Donatella Castelli指出[2],事实上,启动DILIGENT项目是为了创建一个由网格技术支持的先进数字图书馆基础架构。该架构允许来自动态虚拟组织的成员在共享计算资源、存储资源、多媒体资源、多类型内容资源以及多类型应用资源的基础上建立一个临时的虚拟数字图书馆(virtual digital library,VDL)。DILIGENT原型项目的建设目标表明,欧洲数字图书馆的建设正朝着与网格技术结合、面向e-Science需求的虚拟数字图书馆迈进。

2 虚拟数字图书馆的原型—DILIGENT

2.1 DILIGENT技术解决方案

DILIGENT以EGEE项目的建设成果为依托,其技术解决方案主要涉及七方面。首先是虚拟数字图书馆的创建。即是说,在e-Science环境下,用户在寻求可以满足自身需求的资源前可以根据个人喜好、研究背景自行构建个人虚拟数字图书馆;其次是个性化服务、流程设计与验证、资源搜索、内容与元数据的管理及注解、内容来源的描述等方面的服务。在以往,上述七方面有可能只是由作为服务提供方的数字图书馆单独完成。而在e-Science环境下,随着支撑创建个人虚拟数字图书馆的各项技术逐渐走向成熟,上述七项操作更有可能是由用户特别是科研主体独立完成。

DILIGENT原型与EGEE开发出来的各类中间件兼容,为了更好地嵌入到e-Science环境中并提供虚拟数字图书馆的创建与管理服务,DILIGENT构造了三层体系结构(图1所示)。

图1 遵循OGSA的DILIGENT系统框架

DILIGENT原型的第一层是资源层。它是数字图书馆与网格兼容中间件进行交接的层面,它通过支撑、管理数字图书馆层需要的复杂服务交互,进一步增强了当前网格合作服务能力。该层提供的服务与具体资源无关,而是面向所有的资源类型。

DILIGENT原型的第二层是数字图书馆层。为了充分发挥e-Knowledge、e-Science等应用领域必需的基本功能,数字图书馆层负责将各类数字图书馆项目开发出来的、各种独立的高质量服务加以选择、集成与扩展。该层提供的服务包括:多媒体(包括文档、视频、图像、环境数据等等。)对象的提交、索引和发现;通过注解、撰写和合作编辑的方式对多媒体对象进行管理和处理;支持动态创建临时性的虚拟数字图书馆。

DILIGENT原型的第三层是具体应用层,包含了面向特定领域的服务。第三方可以将自身的数据或者功能通过这一层加入到DILIGENT框架中。在随后的建设中,DILIGENT将通过制定或者引进一系列规范协议,为各类可满足特定用户需求的即插即用组件提供应用上的便利并推进各类内容与应用的重复使用。

2.2 DILIGENT的服务流程

DILIGENT利用相关组件对资源进行采集后,使用符合资源选择标准的格式描述资源,并分配特定的标识号给已经描述过的各种资源。在此基础上,它还要对资源的权威性做出认证。当用户通过用户界面提出资源需求后,资源选择系统向资源调度程序发出请求,要求将符合用户需求的资源加以汇集,此时,调度程序将资源请求发送给虚拟数字图书馆,接到请求后,虚拟数字图书馆即根据需求内容在自身可调控的资源范围内进行探索,并将可能满足需求的资源标识号反馈给调度程序。调度程序经过确认后,将符合需求的资源标识号再次发送给虚拟数字图书馆。之后,虚拟数字图书馆再将与该标识号相匹配的资源实施融合,融合结果通过用户界面返回给用户。

2.3 DILIGENT的功能定位

DILIGENT的建立,将集成数字图书馆的服务,并以EGEE所开发出来的基础架构为基础。随着建设的逐步完善,在e-Science环境下,DILIGENT将可以被无缝地集成到OGSA中。在功能上,它将突出显示数字图书馆与e-Science的核心技术——网格技术结合后的特色。具体地说,DILIGENT的功能定位包括五个方面:

(1)数字图书馆的创建与管理。包括:信息服务、守护者服务、代理与匹配生成器服务、虚拟组织支持服务、虚拟数字图书馆生成器服务。

(2)流程管理。包括:流程设计与认证服务、流程执行与可靠性服务、流程最优化服务。

(3)内容与元数据管理。包括:内容管理服务、元数据管理服务、元数据代理、内容安全、注释管理服务。

(4)索引与检索服务。包括:特征抽取、索引服务、内容来源的描述与选择服务、数据融合服务、搜索服务、个性化服务。

(5)终端用户的服务。DILIGENT创建了一个功能强大的用户界面。一方面,这有助于基础架构的管理与维护;另一方面,这可以方便用户使用,从而使数字图书馆系统的潜能得到全面的开发。为了使得开发出来的系统可以跟绝大多数的门户引擎兼容,DILIGENT采用各种技术建立起来的图形portlets将以各种工业标准为基础。最后,用户与管理者可以通过个性化网络门户提供的,更为直觉的操作界面来使用、管理DILIGENT平台。

除了提供一种能够让终端用户与系统进行交互的机制,在项目的初期工作计划中,DILIGENT还将为两个应用领域的主要信息类型提供可视化的基本组件。

2.4 DILIGENT的建设特色

(1)面向EGEE的建设需求。EGEE由欧盟委员会资助,汇集了超过27个国家的专家。EGEE项目的目标是基于网格技术取得的最新进展,开发一个欧洲的服务网格基础设施,可供科学家全天24小时使用。该网格获得了欧盟3000万欧元的资助,是同类网格项目中最大的一个。该项目将主要集中于三个方面:建立一个一致、健壮和安全的网格,可以吸引其他计算资源的加入;不断地改进和维护中间件以提供给用户可靠的服务;吸引科研和工业领域的新用户,并确保他们获得高标准的培训和支持。作为欧洲开展e-Science的基础设施之一,DILIGENT将自身的建设置身于EGEE的建设环境中并以EGEE提供的服务保证功能的正常发挥[3]。

(2)遵循OGSA协议。OGSA主要是将Web Services、数据库存取、J2EE等技术规范纳入网格计算,使得网格服务统一以Services的方式对外界提供。在DILIGENT构建的系统架构中,与OGSA协议相兼容的中间件是其资源层的重要组成部分。通过这种方式,DILIGENT确保自身提供的服务均遵循OGSA协议,让第三方可以将DILIGENT提供的各类服务以统一服务的方式进行集成并提供给最终用户使用。

(3)瞄准e-Science环境下数字图书馆的发展趋势。在未来,无论是个人学习,还是从事科学研究,均需要数字图书馆的支持[4]。面对数字图书馆的发展趋势,来自ISTI-CNR的学者指出[5],数字图书馆未来的发展走向集中表现为三点:支持内容与服务资源的共享;数字图书馆系统具有保证数字图书馆功能正常发挥所需要的一切关键服务与管理特征;数字图书馆作为通用共享基础设施的重要组件。DILIGENT的建设将以此为重要导向,力求站在未来数字图书馆的发展前沿。

3 向虚拟数字图书馆迈进——欧洲数字图书馆的发展动向

早在e-Science出现之前,有关虚拟数字图书馆的问题就已成为数字图书馆界的讨论点。2000年,美韩数字图书馆双边研讨会就虚拟数字图书馆的原型架构展开了讨论。经过激烈的争论,与会者一致认为,建立虚拟数字图书馆,其目的乃是为涉及教育或者文化遗产的数字图书馆提供支持。一般而言,虚拟数字图书馆是一种数字对象的动态集,而且这些数字对象可以让人们通过当前的或者是动态生成的界面加以获取。除了理论上的探讨,欧洲在1998年启动了虚拟数字图书馆建设项目。

欧洲虚拟数字图书馆建设项目VILIB可以说是最早的虚拟数字图书馆项目。该项目由欧共体支助,持续时间为1998年1月到1999年12月[6]。项目计划开发出一个数字图书馆,其规模横跨整个欧洲,研究成果支持使用者对连接到互联网并且支持Z39.50图书馆协议的各个欧洲图书馆的目录名称和全文文档进行“跨语言”检索,用户可以使用自然语言进行检索。

在检索的过程中,用户可以根据自身的需要选择图书馆目录,也可以选择他所喜欢的语言提交检索词,更可以利用系统提供的自动翻译功能将这些检索词翻译为某种语言后再进行检索,实现跨语言检索。在检索过程中,系统将从检索式中提取关键词,并使用与检索式相同的语种来表达关键词进而实施检索。与此同时,如果用户使用了跨语言检索,那么,系统也会根据用户所选择的目标语种对关键词进行翻译,之后再进行检索。这样一来,检索结果使用的语种将与用户所选择的目标语种一致。到目前为止,VILIB项目提供的可以实现跨语言检索的语种有德语、法语、英语和西班牙语四种。在搜索图书馆目录时,用户将使用LIBRARIES项目所开发出来的系统进行搜索。VILIB系统使用WWW的用户界面。用户通过web页提交检索式,并经由采用html语言编写的web页获得检索结果。利用这种用户界面,用户不仅可以获得相关文献资料的标题、全文,还可以获取图像、声频和视频等资源。

尽管VILIB较早就投入了研究与建设,但却因技术支撑的不完善使得自身并不具备明显的虚拟数字图书馆特色。

4 虚拟数字图书馆的组成与功能特征

4.1 虚拟数字图书馆的组成

如果说e-Science出现之前,数字化资源是一切数字图书馆的生存之本,是数字图书馆体系结构的重要组成部分。那么,在e-Science环境下,这种局面将被打破。以网格为代表的多种e-Science技术,将使得虚拟数字图书馆能够在极短时间内汇集全球范围内一切可供调用的资源,包括信息资源、设备资源、仪器资源等,或者是帮助用户在极短时间内构建个人虚拟数字图书馆并让虚拟数字图书馆自身去收集所需资源。e-Science环境下,尽管虚拟数字图书馆将不再以拥有资源作为建设重点,但是,只要权限许可,处处资源都是它可以支配与调度的对象。

提供资源采集、组织与管理的规则与协调机制,让符合用户特定需要的资源在极短的时间内响应用户需求,让用户根据自身研究课题、学习需要以及参与VO的需要而创建极富个性化的虚拟数字图书馆,这将成为数字图书馆继以资源库建设为核心之后的一个重要关注点。实际上,e-Science环境下的个人虚拟数字图书馆在功能上将比当前的个人数字图书馆更强大、操作起来也更有人性化。e-Science环境下,虚拟数字图书馆这一新范式将至少包括规则库(包括用户创建、管理、维护个人虚拟图书馆的规则;虚拟数字图书馆汇集资源、联合服务的调度规划与响应机制等)、命名系统、索引与搜索服务、数字图书馆生成器与用户界面等组件,同时将把面向用户需求、提供数字图书馆生成器服务作为自身的重要标志。

总之,虚拟数字图书馆最终的目标就是让用户建立起完全满足自身资源需求的myLibrary。它与当前数字图书馆提供的My Library完全不同。这种不同表现在,它可以从用户自己的计算机出发,使用户可以使用自我定义的标准创建个人虚拟数字图书馆,把所有的信息动态地集成到一起,并与e-Science环境结合在一起,最终使它成为以用户信息活动为基础的数字信息环境。

4.2 虚拟数字图书馆的功能特征

(1)交互性增强。虚拟数字图书馆将不再只是信息服务的主体,更是身兼信息服务的客体。也即是说,在为用户提供信息的过程中,虚拟数字图书馆也接受用户个人或者是来自VO所提供的资源以进一步充实自身的资源。用户在成为资源接受者的同时,也作为资源贡献者加入到数字图书馆的资源建设阵营中。与e-Science到来前仅仅是让数字图书馆通过提供参考咨询服务、电子邮件来与用户交流的方式相比,这种方式使得数字图书馆与用户个人、与VO之间的交互作用在程度上更加深入。

(2)个性化增强。虚拟数字图书馆通过汇集分布于各处的资源,利用网格技术构建集成服务。之后通过为用户提供可以自由定制的界面,让用户进行资源与服务的定制。再将经过用户定制后的服务打包(wrapped)嵌入到用户系统中供用户使用。采用网格技术后数字图书馆在个性化服务上功能将更加强大。DILIGENT项目的建设目的就是建立一个依托网格技术的数字图书馆基础设施。利用这一基础设施,用户将可以方便地构建适合自身研究需要的个人虚拟数字图书馆。

(3)动态集成性增强。虚拟数字图书馆的集成服务建设是一个庞大的信息工程,涉及许多方面,只有协同工作,才能保证正常地运转。在e-Science环境下,利用其核心支撑技术——网格,将分布在不同地理位置的资源通过高速的因特网进行资源集成,从而提供一种高性能计算、管理及服务的资源能力。在分布式的异构环境中,网格技术能够精确定位所需的数据集(data set),并为后续处理提供支持。人们利用这些资源就像利用电源一样,不必在乎这些资源的来源和负载情况。此外,网格技术可以合理而有效地将远程资源组织起来,形成网格虚拟计算机,形成超强的能力。网格已经发展成为连接和统一各类远程异构资源的一种重要途径。利用网格这一技术优势,数字图书馆在建设时,就可以将权限管理、知识库、各项服务进行汇集,并由网格技术实施资源调度,最后以一个统一的访问界面提供给用户访问。利用这一界面,用户可以接受由单个数字图书馆或者多个数字图书馆组成的联盟数字图书馆提供的服务。

(4)知识性增强。网格的知识生产特性是网格与因特网两者之间质的区别,因特网本身不生产知识,人们都是先把信息知识用其他方式生产出来以后再放到网上,供用户查找利用,而网格则能根据用户的要求自动地生产知识。在知识生产的过程中,高性能计算机将起到关键作用,它把从数据源得到的各种原始数据,运行特定的程序加工成信息和知识。此外,网格还可以自动地找到有关的数据源,进行综合分析和知识发现,形成新的认识。可见,随着网格技术的不断发展,虚拟数字图书馆的功能在知识性上将得到全面提高。在客户提出请求或查询时,依托网格建立的数字图书馆服务系统将会进行自动处理分析,并把有关的结果传送到客户登录的节点(node)上,从而使得数字图书馆的知识服务更加完善。

(5)及时性增强。在e-Science出现前,数字图书馆的服务是“游离”于科研活动过程之外的。因此,数字图书馆在满足用户需求时,更多的是采取一种“后发制人”的方式,也即是说,在接收到科研人员的信息需求后,数字图书馆才根据需求开始着手响应需求的各种操作。在e-Science环境下,由于科研人员、VO对于信息以及各种资源在响应速度上要求更高,因此,虚拟数字图书馆在提供服务时更需要精确、及时。正是这种需求使得数字图书馆在服务方式上必须改为“先发制人”,即是说,e-Science环境下,数字图书馆提供的服务要做到能够根据用户提供的背景文档(包括科研人员的学历、专业与研究方向;正在着手研究的课题等)进行长期跟踪,一旦发现网格上最新的、有参考价值的资源,就主动推送给科研用户。利用这种积累与服务机制,在用户提出需求时,虚拟数字图书馆即可作出最为及时的响应。

(6)共享性增强。首先资源共享主体与客体在范围上进一步扩大。信息资源实现共享的基础包括:信息可以通过多项渠道进行传递;同一信息可以同时为众多的用户接收、利用,而且不影响信息的再传递和再利用;信息可以以多种形式进行大量复制、加工、整理和利用。上述条件的实现基础是使用数字化形式来表达信息。对于以数字化资源作为核心资源与馆藏的数字图书馆来说,信息资源共享是它的一项优势。在e-Science的推动下,数字图书馆与科研机构之间以及数字图书馆与数字图书馆之间可以共享的资源将由e-Science出现前的信息资源扩展到设备资源、仪器资源、计算资源、通讯资源、专家资源等。无论是共享的主体,还是共享的客体,其范围都在扩大。

其次,虚拟数字图书馆将实现真正的知识共享。信息共享很大程度上依赖于信息技术和系统来实现。高度发达的技术系统,包括信息的索引、组织控制、查询和传递的技术,可以大大提高信息共享的效率和成果。知识共享可以理解为在知识发展和利用层面上,通过人与人之间建立紧密关系、相互接触和会话,实现的知识资源的复用和知识创新的不断推进。对知识共享来说,单是有技术和系统还远远不够。

信息是由信息载体、信息符号及信息内容构成的,通常载体形式的变化、符号系统的转换不影响信息内容,这也是信息共享效率高的根本原因。而知识共享依赖于人的思想、价值、文化以及体制、环境,它的实现要难得多。然而,当社会的分工越来越细致,人们往往不希望通过共享原始的信息并自行加工,使之上升为知识,而是直接对具有行动价值的知识提出了更高的要求,以增强适应环境变化的能力。在e-Science环境下,在信息共享上表现出色的虚拟数字图书馆将紧紧抓住e-Science带来的发展契机推进知识共享。借助各种更为实时化、生成图像更为清晰化的工具,虚拟组织内部的成员之间、不同虚拟组织的成员之间的相互信任程度因为有了协议的保证从而使得它比面对面的信任程度更深,这为开展知识共享提供了非常有利的前提条件。

5 结论

除了DILIGENT项目,欧洲已有多家组织与研究机构开始致力于网格技术与数字图书馆技术结合的研究。DELOS网络组织实施了一个联合的计划,其目的在于整合与协调欧洲地区从事数字图书馆领域的一些主要团队正在进行的研究工作。目前,这些团队的目标是发展e-Science环境下的数字图书馆技术。这种技术将支撑任何用户在任何地方的任何时刻以一种友好的、多模式可选的、高效的方式去存取人类知识[7]。

欧洲虚拟数字图书馆原型项目DILIGENT的启动表明,以网格为基础的e-Science将直接影响知识创新与科学研究的模式,并将成为下一代数字图书馆的工作环境,这将是一种必然。一方面,e-Science不仅给数字图书馆带来更多更为先进的技术,而且将进一步扩大数字图书馆可支配资源的范围,提升数字图书馆的服务能力;另一方面,数字图书馆将会以应对e-Science带来的各种复杂信息需求、知识需求为发展重点,将自身的各项业务置身于整个e-Science环境中加以考虑,并逐步向虚拟数字图书馆发展。

总之,DILIGENT以EGEE为支撑,底层采用与OGSA兼容的构件组建,建设理念与服务机制符合e-Science环境下数字图书馆的运作模式。DILIGENT试验平台建立在网格技术与数字图书馆技术加以集成的基础之上。这种集成将为部署下一代e-Science知识基础设施打下坚实的根基。事实上,尽管e-Science目前还处于起步阶段,e-Science环境下数字图书馆建设还不够全面与深入,但是,密切关注欧洲数字图书馆的发展趋势,借鉴其虚拟数字图书馆的建设模式与发展策略,将有利于我们更好地在e-Science环境下建设和利用数字图书馆。

标签:;  ;  ;  ;  ;  ;  ;  ;  

从勤劳建设看欧洲数字图书馆的发展_数字图书馆论文
下载Doc文档

猜你喜欢