数字图书馆系统体系结构研究综述_数字图书馆论文

数字图书馆系统架构研究评述,本文主要内容关键词为:架构论文,数字图书馆论文,系统论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

D0I:10.3772/j.issn.1673—2286.2011.09.005

1 引言

“要素说”认为,图书馆工作的核心在于“厘清要素”从而达到“自动实用”。在“书、人、法”的关系中,“书”是图书馆存在与服务的基础,是根本;“人”作为服务的提供者和服务对象,是图书馆服务的目的与归属,是本质;“法”包括服务之法、管理之法、业务之法,体现图书馆的业务模式、管理模式及其实现手段,在“书”与“人”之间起到联络者的作用。数字时代的图书馆更是这样,在数字资源、用户服务与数字图书馆系统三者之间,系统是业务模式与管理模式的具体体现,数字资源的创建、存取、用户服务的实现离不开系统的支撑,系统比以往更紧密地把资源及服务连接起来,系统的性能在一定程度上决定了数字图书馆建设的水平与能力。

构建系统的目的是为了满足组织的需求,这些需求决定了系统的性能、可用性、安全性、与其他系统的兼容性以及在生命期内适应变化的能力,而这些属性影响着软件的设计选择,都受到软件架构制约。软件架构关注软件系统结构问题,Len Bass等认为“尽管目前尚未对架构形成统一、公认的定义,但对软件系统架构重要性的认识却是基本一致的,包括:系统架构设计处于软件开发的初始阶段,对软件生命周期有重要的影响,是系统开发成败的重要因素与前提;架构是对系统结构的一种描述,架构可以用作系统的蓝图,架构是用于交流的工具,是早期设计决策的体现;架构是影响开发组织的一种潜在的核心资产,是可以传递到新系统中的可重用的抽象”[1],是否有一个稳定的软件架构,对软件的质量和成本影响很大,并影响着企业的未来。也正因如此,如何获得一个良好的架构成为了当今软件界的一个研究重点。

基于以上对系统与架构重要性的认识,本文尝试对2004年至2010年以来国内外有关数字图书馆系统架构研究的相关文献进行归纳总结,以获得对数字图书馆架构研究整体状况的基本了解,期望可以为数字图书馆系统建设的进一步实践提供有益的参考。

2 架构研究概况

我们对2004年至2010年中,CNKI下的中国期刊全文数据库、中国博士学位论文全文数据库、中国期刊全文数据库,以“数字图书馆”、“数字图书馆系统”、“系统设计”、“系统框架”、“系统架构”等为关键词,进行跨库组配关键词检索;以“Digital Library”、“System*”、“Architecture”等为关键词,对Web of Science包括SCI、SSCI、H & ACI所收录的文献,进行组配主题检索,以获得国内外对数字图书馆系统架构研究的总体概况。

表1对CNKI、Web of Science中相关研究论文的收录情况进行了统计。

对表1中的数据作进一步处理可以得到:国内对数字图书馆系统的研究占了国内数字图书馆研究总量的18.5%,对数字图书馆系统架构的专题研究占了系统研究总量的2.5%;国外对数字图书馆系统的研究占了国外数字图书馆研究总量的35.9%,对数字图书馆系统架构的专题研究占了系统研究总量的11.3%。统计数据表明:对数字图书馆系统的研究得到了一定程度的重视,总体上具有一定研究规模。但对系统与系统架构的关注国内外差距比较大,特别是对系统架构的关注十分明显,这或许说明了我们对数字图书馆系统建设的顶层设计关注程度之间的差距。

图1对架构研究的时间分布进行了统计。图1说明,架构研究作为专题研究在国内尽管占了较小的比例,但是从发文的数量与时间分布来看,近年来总体呈现增长的趋势,在领域内得到了一定的程度重视。从架构之于系统意义来看,加强对系统架构研究无疑会对我国数字图书馆事业的发展起到更加积极的推动作用。图1同时表明,被Web of Science所收录的关于数字图书馆系统架构研究的论文数量虽然比较稳定,但近年来稍有下滑,一方面可能是这方面的研究缺少高质量的论文,也有可能预示着在不久的未来可能出现新的研究增长点。

数据来源:CNKI,Web of Science

图1 架构研究的时间分布

对Web of Science检索结果的分析表明,系统架构的研究主要涉及计算机科学理论与方法(19篇)、图书情报学(18篇)、信息系统(9篇)、电子工程(4篇)等学科类别。文献类型以学术论文(33篇)与会议文献(26篇)为主,兼有少量的综述文献(3篇)。

3 架构研究的主题与内容

我们对上述检索结果集中的184篇数字图书馆系统架构研究相关文献作了进一步的人工筛选,对CNKI所收录的文章以核心期刊、且省级以上项目资助,以及文章的内容作为选取的依据;对Web of Science所收录的文章则以文章内容作为选取的主要依据。同时,从业务视角对所选取样本的研究内容与主要关注点进行了分类分析。需要说明的是对相关研究的分类与定类是相对的,这取决于我们观察问题的视角及既有的知识面,而且某篇论文通常会和几个研究主题相关。

3.1 人机界面与跨界检索研究

架构的适应性、可用性是人机界面研究关注的热点。用户通过采用不同的设备与不同的互动模式来获取信息服务,这取决于用户的个人特征(包括残疾人)和用户所处的使用(信息)环境。文献[2]对统一认证与用户界面定制服务中相关的适配服务(调适服务)的角色及其关系进行了研究,通过创建用户分类的立体模型和供用户操作与调谐使用的灵活参数集,把个体具体的使用特征与各自内容的代表性参数相关联,展现了具有不同设备特征的用户配置的整合途径的可能性与可行性。文献[3]对信息检索的界面风格、终端用户搜索、查询形式(方式)、结果反馈和浏览等基本界面问题,以及用户界面指南、可用性评估方法、界面工程技术等用户界面工程的热点问题进行了讨论,对未来的信息检索界面设计所应采取的以用户为中心的设计方法的主要活动进行了识别。文献[4]介绍了在复杂系统中利用增强现实(AR-)和虚拟现实(VR-)技术来实现数字图书馆中3D数据的可视化,从而实现通过直觉可理解的人机界面的一种系统架构。文献[5]等针对生物医学图书馆中3D解剖图的浏览问题给出了一个基于JAVA的3D数字图像浏览软件的架构。

许多学者对专用系统检索及跨库、跨界信息检索问题进行了研究。文献[6]聚焦于系统可扩展性和互操作性方面,开发一个面向服务扩展架构PSOA(Peer-based SOA),同时就如何结合语义Web和Web服务以支持异构的图书馆服务方面进行了描述,并给出了查询服务的案例。文献[7]对CiteSeer系统部署结构框架CiteSeer Plus进行了描述,CiteSeer Plus框架支持为实现负载平衡和容错处理而采用的分布式索引和存储,为增强系统的灵活性、减少维护的费用采用了模组化服务部署结构,为了达成一种新的信息抽取方式在系统架构中运用了黑板结构。文献[8]给出了DC字段和常用的MARC数据格式之间的映射关系,并以所提出的一种数字资源参数模型为基础,采用分层次、组件化、模块化的方式,设计一个DRMS系统框架,实现了整合图书馆馆藏文献和本地其他信息资源的跨平台原型系统,为用户提供了多平台操作系统下的统一人机交互界面和检索方法。文献[9]在对跨界信息检索系统代表性项目分析、总结的基础上,探讨了基于Mashup理念的跨界信息检索系统架构及其实施中的相关问题,给出了基于元数据共享的跨界检索系统架构和基于Mashup的跨界检索系统架构,并对两者进行了比较。文献[10]、文献[11]、文献[12]也对数字图书馆系统检索架构进行了研究。

3.2 内容注解与个性化服务研究

将使用者的工作方式整合进数字图书馆系统将是数字图书馆的一个进化趋势,数字图书馆管理系统应当成为包括促进智力产品生产的一种工具。注解服务(annotations of digital content)是用户与数字图书馆系统之间互动的有效方法。注解不仅提供了一种解释方法、丰富了信息的内容,同时也为改善协同工作实践提供了共享与传递思路的方法。注解在读与写之间建立了桥梁,促进了用户对信息资源的处理,提供注解服务的数字图书馆系统更能够满足用户的需求。文献[13]对被作者称为“灵活注解服务工具”(Flexible Annotation Service Tool,FAST)的系统设计选择及其特性进行了详细的介绍,该系统设计的灵活性使得它可以不受特定系统架构的限制并以自动的方式对注解实现管理。文献[14]对来自于不同的信息管理系统并被不同的数字图书馆管理系统管理的数字内容如文本文件、图像和多媒体文件的注解相关主题和议题进行了研究,并提出了一个统一的整合的注解模型视图,范围从定义注解是什么到提供一个正式的模型。模型的主要理念包括三个部分:注解语义及注解实体;注解维度的模式化;数字内容与注解之间的分布式超链接。被提出的正式模型是在先前已存在的模型基础上构建起来的,捕获了注解的句法与语意两个方面内容。

在个性化服务方面,文献[15]在综合考虑用户的环境、偏好、需求以及数字图书馆服务组件功能的基础上,提出一个基于用户个性化需求的数字图书馆集成服务框架。该框架利用Web services技术实现不同数字图书馆系统中符合用户需求的子系统和组件的动态集成,以满足用户的个性化需求。文献[16]参考Refworks、360DOC、MyLibrary@LAN、Skolr等系统项目的实现方案,提出类MyLibrary的概念,并从类MyLibrary个人数字图书馆资源元数据描述框架、主要功能模块、整体实现三个方面论述了类MyLibrary个人数字图书馆构建方案。

文献[17]对卡尔斯鲁厄大学(the University of Karlsruhe)图书馆基于用户行为的推荐服务系统RecoDiver的分布式Web服务架构及基于图表的用户推介服务界面进行了介绍。RecoDiver将一个Java小程序整合进图书馆的在线目录以动态展现所推介的文献。点击图表中用户感兴趣的文献,相关的推介文献将被置于图表的周围。完整推介图表的本地示图是以一种放射树层状结构予以揭示的。对不同类型的推介服务系统的使用调查表明,与列表式推介服务相比较,用户更加偏爱RecoDiver这种基于动态图形的推介服务方式。文献[18]给出了一个基于数据挖掘技术的数字图书馆推荐服务系统的软件架构。该架构从用户类群的相关性及用户存取信息的相关性入手,进行基于相关性规则与聚类方法的挖掘,并对所获得的数据进行高级过滤,从而使得所获得信息更加接近用户的需求。文献[19]描述了一个基于本体的用户浏览和搜索个性化推荐的系统框架。该框架将本体的优点应用于检索周期中,包括提问相关测度、语义化的用户兴趣表达和自动更新,以及个性化的检索结果排序等。在用户访问数字图书馆的交互过程中,可通过本体来构造用户提问和文档内容的匹配机制以实现语义化的内容检索,并可进一步使用本体来构造用户兴趣偏好的概念向量以实现面向用户的个性化推荐反馈。

3.3 系统互操作与集成整合研究

文献[20]讨论了CCCML(中国文化名人手稿馆)的语义架构设计与典型数字图书馆系统的相似性,认为语义架构是分布式环境中数字图书馆应用的一个关键问题,解决语义互操作问题的方法通常是由元数据解决方案和开放系统架构来实现的。文献[21]描述了aDORe资源库架构,并给出了一个OAI-PMH数据模型。aDORe被设计用于摄取、储存和访问洛杉矶Alamos国家实验室研究图书馆(Research Library of the Los Alamos National Laboratory)的数字馆藏。aDORe架构是高度模组化和标准化的,该架构使用MPEG-21数字项目公告语言(Digital Item Declaration Language)作为基于XML的格式来表示数字对象,而多媒体数据流作为开放归档信息系统,归档信息包组成了数字对象(Open Archival Information System Archival Information Packages,OAIS AIPs)。通过摄取程序处理,将这些OAIS AIP储存于多维的自治资源库之中,一个资源库索引掌握了所有资源库创建和位置的信息,一个识别定位器则反映了给定的数字对象或者OAIS AIP驻留在哪一个自治资源库之中。文献[22]介绍了一个基于Web的、模组化的、分布式架构的电子临床指南数字图书馆(the Digital Electronic Guideline Library,DeGeL)的设计与实现。DeGeL合并元数据本体包括所有诊断指南本体中的公共元素,如语义分类、领域知识,也同时包含了四种内容表示格式:自由文本、半结构文本、半正式表示、正式表示格式。这些格式支持逐渐复杂的计算任务,以不同形式化层次存在的诊断指南也因此可以合并表示。DeGeL提供了诊断指南从文本形式逐渐转换为所选择目标诊断指南本体的正式表示方法的工具。文献[23]对EUCLOCK项目下的EUCLOCK信息系统(EUCLIS)进行了介绍,EUCLIS强调数据库集成及数字图书馆管理功能的整合,为了满足研究社区的信息需求使用了灵活的系统框架,建立了参考模型和标准,给出了数据库模组化结构。

整合和透明存取由不同机构自治管理的、存贮于分布式数字图书馆和资源库中的混杂的信息资源,是数字图书馆研究领域的一个重要的挑战。文献[24]讨论了在不同的数字图书馆之间实现互通性这一重要问题:不同的技术解决方案、不同层次与水平的互通、联邦系统架构、版权问题以及互通解决方案的评估参数;并对信息技术与语义网络(Semantic Web)的新进展如何应用于改进数字图书馆系统间互通性等问题进行了分析,对面向下一代数字图书馆研究相关的其他主要问题进行了讨论。基于策略的管理(Policy-Based Management,PBM)作为一种设计和实行分布式系统存取管理的方法,随着数字图书馆联邦信息共享需求的快速增长,面临着在安全管理方面的挑战。一方面策略要合并个别系统存取管理的需要,另一方面横跨多个系统的策略必须以一致的样式来设计,以使得它能够在联邦制的系统中以统一的方式开发、部署和整合。文献[25]为联邦系统给出了一个PBM解决方案X-FEDERATE,X-FEDERATE框架对基于角色的存取控制(Role-Based Access Control,RBAC)模型进行了扩展,X-FEDERATE框架由基于XML的策略规范语言、基于UML的元数据模型以及实施架构组成。文献[26]从一个以建立EAD编码发现与关系型数据库映射为目标的原型系统开发开始,以元数据抽取、映射、转换以及管理,将基于MARC的元数据处理成非MRAC模式的数字馆藏系统设计为关键,提供了可在所有CMS架构中使用的Dublin Core Abstract Model的有关信息以及以数字馆藏为中心的灵活的、适应性强的方法。文献[27]向我们呈现了一个基于数字图书馆的环境(a digital-library-based environment),该环境已经被开发用于支持整合、散播和探索那些从分散的非结构化的生态网站网络中收集的生态数据,该环境以一个称作为BDiG-PELD(PLED,巴西长期生态研究计划)的地理参考数字图书馆为中心,BDiG-PELD架构使用OAI-PMH协议和ODL(Open Digital Library)框架整合网络上的生态网站,通过合并简单有效的分散的用户界面来处理非结构化来源的混杂数据。研究人员在使用BDiG-PELD时,需要在文本电子表格中填写强制性的、受约束的字段,该电子表格由本地输入界面处理并转换进EML(Ecological Metadata Language)元数据资源库,并可以进一步被中央BDiG-PELD资源库收割和整合。BDiG-PELD组合了一个空间定位系统所支持的地理参考工具提供探索性的搜索和浏览服务。文献[28]介绍了UCMC(University of Cincinnati Medical Center,辛辛那提大学医疗中心)开发的一个由数据结构、Web服务和用户界面构成的信息架构,该架构使得个体可以管理超载的信息来创建新的知识,个体可以可靠、安全地存取经过过滤、组织且与特定的任务和个人需求高度相关的信息资源。文献[29]给出了一个基于网格服务的数字图书馆架构gDisDL,以实现对RDF元数据以安全和分布式的方式进行存储和查询。

文献[30]提出数字图书馆资源集成的三种体系结构框架,即数据集成、知识集成与服务集成。在这个体系框架之下,数字资源集成包括三个层次:最底层是数据集成层(基于语法的集成),完成异构和分布数据源在语法层面上的数据集成;第二层是知识集成层(基于语义的集成),按照既定的知识组织体系和知识本体结构对数字资源进行描述与组织,形成一个能够高效利用数字资源的知识网络;第三层是服务集成层,即根据用户的个性化需要动态地构建出应用系统,为用户提供智能化的知识服务。文献[31]从设计策略、组织架构、核心服务等角度分析了Pathways系统的先进性,对构建个性化学术存储库的全过程及学术存储库互操作的发展方向进行了描述,指出Pathways系统的互操作主要是通过提供支持跨学术存储库数字对象的数据模型,支持通过代理维持数字对象与数据模型的一致性,以及支持一系列核心服务和接口共三种基本支持来实现的。文献[32]探索了基于元数据本体的数字图书馆系统间的互操作策略,认为将语义网格技术与数字图书馆互操作技术之一的元数据采集方法相结合,不但可以解决DL互操作中的动态性和异构性问题,还可以更好地解决资源发现、整合、安全、语义理解等问题,从而弥补传统DL互操作方案的局限性,实现大规模DL信息资源共享和跨仓储无缝语义查找。该文献对语义网格环境下的数字图书馆互操作概念模型、基于本体的DL元数据互操作模型、语义网格环境下数字图书馆资源互操作框架及语义网格环境下数字图书馆资源互操作框架的三层结构等进行了详细的描述。此外,文献[33]、文献[34]在研究了基于传统数据仓库、虚拟数据整合系统和联邦数据库系统的集成架构,以及数据交换语言XML、支持信息组织与利用的数据仓库和.NET分布式应用技术等集成方案的基础上,构建了一个数字图书馆数据集成系统的五层系统架构。文献[35]提出一种基于元搜索引擎的数字图书馆互操作框架,用以实现跨越异构、分布式数字图书馆的馆藏发现有用的信息,并向用户提供统一、透明的服务的目的。文献[36]提出一个基于P2P技术的数字图书馆虚拟联盟系统框架。文献[37]给出了区域图书馆信息资源共享系统的互操作技术概念框架和系统应用技术框架。文献[38]把信息集成系统分为资源整合和服务联合两种模式,并对模式框架及其与层次基础架构的映射关系进行了分类梳理。

3.4 联邦系统与专用系统架构研究

文献[39]针对基于Dspace开放源码数字资产管理系统所面临的系统架构变化方面的挑战,给出了Dspace 2.0架构解决方案的建议。文献[40]提出了一种基于XML的数字图像图书馆构建的三层架构:基于SQL的数据层、基于IIS的管理层、基于XML的展现层。文献[41]、文献[42]对韩国国家数字科学图书馆归档电子期刊项目KESLI(the Korean Electronic Site License Initiative,韩国电子网站授权倡议)的系统架构的确定、元数据集、期刊和出版商的选择标准等进行了描述,较为具体地讨论了生产系统、归档系统、文献传递系统以及永久保存策略。文献[43]给出了一个应用于文献传递服务中的版权电子签名解决方案。作者描述了已经实现了电子版权签名的英国普利茅斯大学数字图书馆系统架构,该系统通过建立电子“请求-传递”服务,提供快速、有效的文献传递服务能力,使得用户无论何时何地发出请求都能获得标准的文献传递服务。文献[44]从数字图书馆如何满足利益相关者的需求切入,讨论了企业架构的Zachman框架应用于数字图书馆系统实践的方方面面,给出了基于Zachman框架的以馆际协作为目的的数字图书馆业务模型与系统模型,从系统规划者、拥有者和设计者的不同视角讨论了与之相关的6个维度(动机、数据、角色、行为、地点和时间)的数字图书馆特性和功能的抽象,并对其结构进行了解释。文献[45]对CALIS联合电子学位论文数字图书馆(CALIS-ETD-DL)的体系结构、互操作协议和CALIS-ETD-DL的标准接口、ETD数字版权保护系统、CALIS-ETD元数据规范、ETD永久标识符和ETD长期保存格式进行了研究。

文献[46]通过对开放源代码的Fedora系统框架的研究,以及Fedora和DSpace系统的比较,提出了基于Fedora的数字资源管理方案,为解决不同种类数字资源统一存储管理问题提供了思路和方法。作者认为,Fedora开放源软件提供了灵活的接口,基于它扩展建立的DRM系统不仅能够保存简单的图像、文本,而且实现了对具有复杂结构的数字对象的存储管理。基于Fedora的数字资源管理方案在实现过程中采用的Java语言及相关技术,具备良好的跨平台、可移植的特点,具备了扩展为国际化应用的能力;采用的METS元数据编码方案具备良好的开放性和扩展性,允许元数据类型具备一定的灵活性,可以被借鉴应用到以后项目的研究开发中。文献[47]对各国(组织)广泛开展的数字资源长期保存实践项目,从技术方法的选择、系统功能和整体框架角度,分析和研究数字资源长期保存的技术方法、系统和框架;重点介绍了数字资源长期保存框架中具有代表性的LOCKSS系统、NEDLIB项目、NDIIPP项目的系统框架。作者认为数字资源长期保存中的技术选择、系统框架选择等内容是实践长期保存的技术基础,技术的过时是引起数字资源保存问题的重要因素,也是解决数字资源保存的重要手段。文献[48]在分析了SOA、网格和P2P技术在国外数字图书馆领域内应用研究及原型系统的基础上,认为下一代数字图书馆的体系结构将是一种全新的体系结构,它将由集成的、集中控制的数字图书馆系统转向可动态配置的数字图书馆联盟,面向服务的体系结构(SOA)、网格(Grid)技术以及对等网(P2P)技术为数字图书馆的这种转变提供了技术基础。文献[49]对语义数字图书馆系统BRICKS、Fedora和JeromeDL在系统技术框架、内容和元数据、语义技术应用三个方面进行了分析比较。

此外,文献[50]在介绍J2EE框架和集中索引分布式数字图书馆系统结构及剖析J2EE平台优势和核心技术的基础上,给出一个基于J2EE的集中索引分布式数字图书馆系统框架。文献[51]提出了分层数字化图书馆基础架构(Layered Digital Library Infrastructure,LDLI)和信息对象的概念。应用面向对象方法提出了分层数字化图书馆基础架构LDLI的设计方案,详细分析了该架构中的LDLI分层模型、信息对象抽象模型、信息对象仓库分层逻辑结构以及信息存取的运动流程。文献[52]对国家科学数字图书馆数字参考咨询系统的主体流程、结构框架、角色定义以及读者服务系统和后台管理系统的主要功能进行了阐述。为了存储和管理大量的文本信息并提供方便的查询,文献[53]建立了一个支持数字图书馆的并行文本数据管理原型系统PDoc,给出了PDoc系统的功能和总体框架。PDoc的功能包括文本数据采集、格式标准化、信息提取、自动分类、数据加载、数据分布、查询等。文献[54]认为将数字图书馆、数字化学习和创作支持结合成一个适应性很强的授权管理框架是实现数字化内容获取和数字化学习的关键,是营造生动的数字化学习环境的一种有效途径。作者对作为内容到社区仲裁者的数字图书馆及数字化授权框架结构进行了研究。文献[55]参考IBM知识管理研究院(IKM,Institute of Knowledge Management)给出的具有实践意义的知识管理研究主题,构建了应用于合作数字参考咨询服务的知识管理框架。

3.5 数字图书馆系统架构理论研究

文献[56]认为数字图书馆服务系统架构对系统的能力有着直接的影响。该文献对分布式图书馆系统OpenDLib,以及为更好地满足用户需求而开发的基于网格的面向服务的数字图书馆基础架构DILIGENT所关注的焦点进行了比较,特别是在系统架构方面对创建与管理数字图书馆所必须控制和支持的特征进行了深入的讨论。文献[57]通过对来自加拿大、美国和英国三个国家6个医学数字图书馆的使用评估,讨论它们在系统设计上的优劣,为系统组织与存取学术资源提供基本的建议。评估从用户的视角在6个方面切入:管理员观点与网站架构、知识组织、结果管理、资源的互操作、增值信息服务、可用性与个性化。文献[58]对本体论在数字图书馆应用中的目的、范围、用法、方法学、交叉映射、本体编码进行了总结,对与现在研究与开发相关的可用工具、本体、查询引擎及它们的应用进行了描述,对与现在的和潜在的图书馆本体应用相关的利益、问题、经费、可行性及可用性进行了讨论。该文认为,本体应用将会对知识管理、企业整合、电子商务等产生极大的冲击,本体应用的可行性取决于对各种不同进化因素的评估,包括现有的工具和系统、领域采纳的水平、时间和专业可用性、经费障碍等。文献[59]认为数字图书馆研究整体上有从纯技术问题向实际应用、使用和效率问题转移的趋势。文献[60]初步定性分析了前Web与后Web时代知识组织的主流趋势。在对前后Web时代的知识组织原则的比较后发现:元数据研究是两个时代的热点问题,前Web时代的文献更多的是关于索引与摘要的研究,后Web时代则更多的关注于目录与分类议题。文献[61]对开放源码研究进行了广泛的文献回顾,并对618篇同行评论文章进行了分类组织,认为开放源码运动近几年稳健成长并成熟起来,是开放源码相关研究提高的反映。文献[62]在回顾相关文献及项目研究的基础上注意到:数字图书馆及数字资源永久保存在信息使用者及信息背景方面的研究具有共通性,数字资源永久保存研究团体和数字图书馆研究团体一样面临着捕获、储存及利用与使用者及背景相关的信息的挑战。该文进一步描述了处理使用者和背景信息以构建未来的数字永久保存系统当前所进行的研究及该领域面临的主要挑战。战略释放计划(Strategic release planning,有时被称为路线图,road-mapping)是需求工程过程在产品级执行的一个重要阶段,它关乎需求选择与确认的顺序及重要技术与资源的限制。文献[63]调查了一些已被提出的路线图模型,包括它们的经验确认程度、影响需求选择的因素,以及市场驱动背景等,发现了24个路线图模型,建立了它们彼此之间的映射关系,并构建了一个分类法对需求选择的影响因素进行了分类。作者认为,在提到路线图这个问题的时候,许多模型彼此相关并使用了相似的技术措施;一些需求选择影响因素覆盖了不同的路线图模型,但很多方法没有提到利益相关者的价值观因素对需求选择所产生的影响。

3.6 模组化系统构建相关问题研究

模组化系统构建相关研究在数字图书馆系统架构研究中随处可见,其中,尤其让人印象深刻的是SOA(Service Oriented Architecture,面向服务架构)应用研究以及“5S”系列研究。文献[64]认为,Web服务范式之下的面向服务架构被视为分布式计算的未来。SOA以及面向服务组件的架构对于建立灵活的、有效率的数字图书馆系统是适用的,主要表现在简单、易理解、可重用性、扩展性和性能方面。文献[65]认为应用SOA图书馆成为了一种动态可配置的架构体系,作者将SOA与Web服务技术相结合,提出了面向服务SOA架构的数字图书馆的应用集成系统的构建过程。文献[66]描述了一个Library 2.0供应链管理(Subsection Circulatory Management,SCM)模型,阐述了Library 2.0系统架构的设计理念,认为图书馆需要整合文献资源、整合知识资源、整合操作管理,而所有的这些整合都是以用户服务为基础的。在这个意义上,Library 2.0技术与观念的实现与SOA模型是极为相似的。通过应用SOA实现基于模组化的多层架构可以改进现代管理系统的灵活性与适应性。文章提出并分析了一个基于SOA的5列模型:硬件列、系统列、数据列、操作管理列、知识服务列。按照这样的架构,他们设计了基于馆员的图书馆管理系统、基于伙伴的知识服务系统和知识搜索引擎三个应用系统。文献[67]提出基于Web服务的共享与互操作解决思路,并给出基于SOA和Web Services技术的分布式数字文献信息系统集成框架,是分布异构文献信息系统的访问和分布异构文献信息数据的集成框架。该框架通过建立全局数据注册中心和建立UDDI服务中心的方式,构建一个基于网络的数字文献资源共享平台,用于实现分布、异构文献信息资源的集成与共享。文献[68]认为基于SOA的数字图书馆本质上是将数字图书馆当做一个提供一系列图书馆信息服务的系统,通过将孤立不兼容的图书馆信息系统和异构的信息资源以组件的方式封装成标准的服务,并经SOA总线进行服务集成,就可以以服务的方式加以利用,从而最大限度地实现信息资源的整合,通过各种服务组合能够实现图书馆业务流程的自动化,以灵活应对图书馆业务需求的变化。文献[69]运用面向服务的分析方法对图书馆编目系统随需应变机制进行了研究,构建了图书馆基于SOA的随需应变编目模型。

在“5S”研究方面,弗吉尼亚理工大学数字图书馆研究实验室的研究团队进行了系列研究,“5S”结构本质上数字图书馆系统构建的要素模型。文献[70]以“Streams,Structures,Spaces,Scenarios,Societies(5S):A formal model for digital libraries”为题,提出了5S正式模型(见表2),包括能促进用户信息交流的流体性要素(Streams);以有用方式组织信息的结构性要素(Structures);以有用方式展示信息的空间性要素(Spaces);提供相应信息服务的情境性要素(Scenarios);能够满足人们信息需求的社会性要素(Societies)。文献[71]认为,基于本体的事物在本质上具有不同的属性,不同的项目研究与不同的人因为不同的切入点,可能以不同的方式、使用不同的系统来描述同一事物的不同方面,并通过互不相关的系统来组织存储他们的信息,这增加了不同项目合作与研究以及一般目的的信息检索的困难。5S框架在模型化数字图书馆方面,为理解海量复杂信息空间提供了便利,在设计与原型化数字图书馆方面,则满足了不同用户团体的信息需求。文献[72]在详述数字图书馆质量意义的基础上,基于5S框架,为每一个数字图书馆的主要概念都制定了质量标准,并且为这些质量标准提出了一套数量指标,尤其考虑了微型数字图书馆的重要概念,如目录、收藏、数字对象、元数据规范、存储及服务等。在质量标准或考量维度方面,考虑了易获得性、准确性、完整性、可组合性、适用性、一致性、有效性、效率、扩展性、针对性、保存性、相关性、可靠性、可重用性、重要性、相似性、及时性。在评判标准方面,考虑了响应时间、迁移成本、服务失败的次数。关于关键的概念如质量维度与数量指标的配对,则通过现实图书馆的实际使用情况来加以阐述。该文还讨论了数字图书馆的质量维度确定与数字图书馆关于信息生命周期共同观点之间的联系。这些联系可被用来确定哪些质量要素在何时何地可以被测量、评估和改进,以及哪些质量问题可以被阻止、察觉和消除。文献[73]提出了基于5S框架的全面解决方案,给出了一个由5S概念引出的定义性结构,以及应用5S框架整合特定域的数字图书馆及整合过程中关键问题的解决办法。该案例作为个案研究来证实并评估数字图书馆的整合途径。特别是研究团队在5S的理论框架内,开发了一个微型原模型——5S套件及其组成,提出了基于5S理论的整合途径的系统方法。文献[74]提出了基于5S理论的5Squal数字图书馆系统质量自动评估模型及其架构。5Squal是个通用体系结构,适用于各种DLS和方案,5Squal包括8个质量方面的相关指标,涉及数据对象、元数据、服务等。该文认为,数字图书馆是复杂的信息系统,其结构、内容和服务处在不断变化之中。由于这些复杂性,动态进行系统维护是一个不平凡的任务,因为它需要对不同DL的组成部分进行评价,一般来说,这些评价都是定制在每个系统进行,并且只有当问题发生时,管理员的干预才是必要的。

4 架构研究的特征与趋势

4.1 研究特征分析

数字图书馆系统架构研究是技术驱动和问题(需求)驱动的。架构研究所要解决的问题涉及数字图书馆系统建设的方方面面,研究多以基于特定的技术、针对特定的问题而展开,所收集到的研究论文多以基于某种特定技术的系统架构研究,或以基于某种特定应用(特定目的、解决特定问题)的专用系统架构研究为题,满足新需求、使用新技术是其显著的特点。这在一定程度上说明了数字图书馆系统架构研究是技术与人文互动的结果,体现了图书馆事业发展与技术发展相同步的原则。

从要素维度来看,大致可以将目前的研究分为以资源为中心的系统架构研究、以用户为中心的系统架构研究、以系统为中心的系统架构研究、以服务为中心的系统架构研究四种类型。这种分类一定程度体现了数字图书馆系统构建的理念。

(1)以资源为中心的系统架构研究

以资源为中心的系统架构研究,强调把5S作为数字图书馆建设理念与目标。程焕文等认为:“我们认同信息资源共享的最终目标:使任何人在任何时候、任何地点,均可以获得任何图书馆的任何信息资源”。[75]这类研究围绕分布的、异构的、多样化的数字信息资源及系统,以构造统一的信息服务系统、实现信息资源与服务共享为核心,研究的主要问题包括分布式系统结构、系统互操作、数据集成、系统集成、服务集成整合等。

(2)以用户为中心的系统架构研究

以用户为中心的系统架构研究,强调把5R作为数字图书馆建设理念与目标。Richard J.Harrington在第11届EBIC会议上描述Web of Science的开发理念时说道:我们需要把合适的信息(the right information)在合适的时间(the right time)通过合适的方法(the right applications software)提供给合适的人(the right people)以使得他们可以做出合适的决定(the right decisions)[76]。我们认为,将这样的描述作为以用户为中心的数字图书馆系统架构理念也是相当合适的,权且称作为“五个合适理论”或者“5R理论”。这类研究围绕用户信息活动和用户信息系统,以支持用户灵活地处理信息、提炼知识和交流协作为核心,研究的主要问题包括人机界面、信息检索、个性化推介、内容注解等。

(3)以系统为中心的系统架构研究

以系统为中心的系统架构研究,以5S系列研究最为引人注目。5S本质上是关于数字图书馆系统自身建设的一种要素模型,强调从系统自身构建要素及要素关系的角度来考察分析数字图书馆系统构建的目标,对系统质量属性的考察则是其主要的关注点。目前5S研究主要涉及框架、模型、工具、设计、整合、评估等议题。值得一提的是文献[44]在考察5S的基础上,结合Zachman框架,从动机、数据、角色、行为、地点和时间6个维度对数字图书馆特性和功能进行了抽象。

(4)以服务为中心的系统架构研究

以服务为中心的系统架构研究,以对SOA的研究最受关注。SOA为数字图书馆系统建设提供了一种灵活的架构模式,特别是SOA强调系统的“随需应变”,可以满足技术与人文的进化对业务模式创新和系统自身建设的双重需求,SOA强调“业务与IT对齐”,使得基于SOA所构建的系统更加易于理解、更加易于快速构建与部署。

4.2 研究趋势分析

张晓林等在对数字图书馆的目标任务、模式架构、功能实现以及相关的技术集描述与分析的基础上,给出了数字图书馆系统架构的三类范式[77]。张晓林认为“数字图书馆将从基于数字化资源的数字图书馆向基于集成信息服务的数字图书馆、基于用户信息活动的数字图书馆范式发展”。数字图书馆范式的演变在数字图书馆建设和信息服务理念、模式等方面存在诸多挑战。“数字图书馆建设是一个逐步深化的过程,前一代系统为后一代机制提供发展基础,而后一代机制又对前一代系统提出宏观参照框架和长期发展制约”。“新型数字图书馆形态本身体现了关于信息服务和信息系统的新理念,并要求在信息结构、组织体系、服务功能和运营机制等方面有新的模式来支持和保障其有效发展”。“数字图书馆范式演变体现了一个系统研究开发的基点从信息资源逐步过渡到信息服务机制再到用户信息活动的过程”。这些都对我们长期熟悉的许多根本理念和模式包括系统模式、信息模式、信息服务模式等提出了挑战。这样看来,现在所进行的研究十分关键的一点就在于其是否充分考虑了对后续系统机制的影响,这一点十分重要。

总体而言,目前关于数字图书馆系统架构的研究未能超越上述三种机制范式的概念范畴,是对其内容的深化,同时也出现了一些新热点、新趋势。

1)由以资源为中心、用户为中心到服务为中心的发展趋势。这是“书人法”理论的理性回归。

2)模组化系统方法得到充分重视,并且更加关注系统可重用性、可扩展性及系统的灵活性等自身的问题。

3)以系统为中心的5S研究及以服务为中心的SOA研究成为架构研究新的生长点。

我们认为,以SOA为代表的以服务为中心的数字图书馆系统研究,体现了数字图书馆系统构建一体化的思想,不仅关注业务需求、用户需求等基本问题,更加关注系统本身的可持续发展相关问题;关注用户需求的不确定性,以及随需应变的系统构建问题。就系统构建理念与目标而言,则更加强调资源、用户、服务与系统目标的融合以及系统目标与业务目标的一致性。如果可以成为新突破的话,以服务为中心的数字图书馆系统也许可以称为是第四代数字图书馆系统。

4.3 存在问题评述

目前架构研究涉及不同内容与层次主要是由研究所关注的问题域而决定的。总体而言存在以下不足:

(1)从系统架构的内涵与本质来看,目前研究缺乏对架构的内涵、作用以及如何被利用的清楚表述,没有形成关于架构的一般性概念框架。

(2)从架构研究的理论性和普适性来看,目前研究以关于专用系统架构相关的解决方案居多,主要关注为特定的目的开发系统及其模型这一基本事实,一般只能联系到某个特定的使用场景。

(3)从业务域与技术域的研究视角来看,目前研究突出了对技术域相关问题的关注,就SOA而言,忽略了业务域视角的观察与研究,尤其缺少与SOA相适应的、与本行业具体实践相适应的系统分析方法。

5 小结

总的说来,数字图书馆系统架构研究是技术与人文互动的结果,与图书馆自身的发展理念一脉相承。一是体现了与技术发展相同步的原则,二是体现了数字图书馆的建设理念,三是对以往研究的继承,是个不断演化的过程。目前关于数字图书馆系统架构的研究出现了一些新热点、新趋势,但未能超越三种机制范式的概念范畴。我们认为,如果可以成为新突破的话,以服务为中心的数字图书馆系统也许可以称为是第四代数字图书馆系统。

就以服务为中心的SOA在图书馆的应用研究而言,SOA更加强调资源、用户、服务与系统目标的融合以及系统目标与业务目标的一致性,要求我们不仅要关注业务需求、用户需求等基本问题,更加要关注系统本身的可持续发展等相关问题。而当前的研究对于如何将SOA与图书馆具体实践结合起来、如何在图书馆的应用中找准切入点等方面的关注则相对较少。特别是,SOA所强调的系统“随需应变”、“业务与IT对齐”目标的实现,首先依赖于系统架构层面的两个领域(包括业务领域和IT领域)的共同努力与充分交流,而从业务领域视角、从系统架构层面需要有一种与SOA框架相适应的、与本行业具体实践相适应的系统分析方法,在数字图书馆领域关于这方面的研究十分欠缺。我们设想,如果可以像构建元数据行业标准体系一样,建立一种标准化的数字图书馆系统服务体系,那么,随需应变的系统构建问题将会迎刃而解,数字图书馆系统一体化建设构想成为现实也或许不再遥远。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

数字图书馆系统体系结构研究综述_数字图书馆论文
下载Doc文档

猜你喜欢