可信数字仓库的建设与认证--浙江天宇信息技术有限公司的合作_信息技术服务论文

可信数字仓储的构建与认证——浙江天宇信息技术有限公司协办,本文主要内容关键词为:浙江论文,信息技术有限公司论文,可信论文,天宇论文,数字论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 可信数字仓储

1.1 数字仓储

信息技术的飞速发展,带来数字资源的爆炸式增长。为了对数字资源进行长期而有效的集中保存,必须构建专门的系统,用以管理和维护数字资源,并提供利用,使其发挥应有的作用。因此,数字仓储应运而生。

“数字仓储”概念的创始人Inmom WH认为,数字仓储是面向主题的、集成的、稳定的、随时间变化而不断更新的数字资源集合,是提供数字资源保存、管理和访问的综合性系统。它以开放式存取服务为特征,支持数字资源整个生命周期的活动,包括收集、归档、管理、发布、访问以及保存等。[1]

从20世纪90年代开始,许多大型的数字资源保存机构就开始构建数字仓储,使其承担长期保存机构内数字信息资源的职责。

1.2 可信数字仓储

在当前信息技术变革速度不断加快的条件之下,构建了数字仓储并不一定能够应对数字资源的急剧增长,数字存储技术的迅速发展以及数字资源天然的脆弱性所带来的一系列挑战。数字仓储能否确保数字资源的长期可靠保存,维护其真实性、完整性以及可用性?这一问题引起了国内外科学界、图书情报界专家的高度关注。

美国研究图书馆协会(Research Library Group,RLG)于1996年发表的“保存数字信息”(Preserving Digital Information)报告指出:“数字化归档基础建设的一个必不可少的组成部分就是构建相当数量的可信组织(Trusted Organizations)”。报告强调,在数字资源的长期保存、有效管理过程中,可信数字仓储(Trusted Digital Repository,TDR)能够发挥关键作用。

2002年5月,OCLC/RLG的TDR项目组发布“可信数字仓储:属性和责任”报告(RLG-OCLC Report.Trusted Digital Repositories:Attributes and Responsibilities),报告中明确指出,TDR是负责数字资源长期、可靠的管理以及维护的系统,它按照普遍接受的协议和标准设计并运行,具有切实可行的政策和实施方案,并且有持续稳定的财政支持和规范的评价机制,能够对数字资源提供者和用户长期负责,其使命和目标是长久地为用户提供可靠的数字资源访问服务。[2]

对于数字资源所有者或生产者而言,可信数字仓储能够为其数字资源提供可靠的、值得信赖的存储环境;对于数字资源用户而言,可信数字仓储能够为其提供方便、快捷、权威、可信的检索和利用环境;对于合作伙伴而言,可信数字仓储能够为其提供互相了解、互相信任以及互相合作的数字资源共享基础。

2 可倍数字仓储的构建要求

可信数字仓储承担着长期保存可靠数字资源并提供服务的职责,因此构建可信数字仓储必须紧紧围绕这一职责,可信数字仓储的构建要求主要包括:

2.1 基于实际需求而构建

可信数字仓储的构建必须立足于实际需求,判断一个机构是否有必要构建可信数字仓储的标准主要有两方面:

一是机构是否拥有大量需要保存的数字资源;二是机构所保存的数字资源是否具有特定用户群(Designated Community)。如果一个机构同时满足了上述条件,它就有了构建可信数字仓储的需求和必要性。以下笔者举例说明何种机构具备构建可信数字仓储的需求。

例一:某国家图书馆,负责保证大量分散且不断增长的数字馆藏的长期存取,这些数字资源包括在线出版物、多媒体文件、大型图像文件和各种专门数据库等。数字资源的创建者几乎包括任何人与组织:向图书馆提供纸质文献的大型商业出版机构、新兴电子商业出版机构、自费出版的个人、学术研究网站、政府机构等。它服务的用户相对分散,任何人在任何地方任何时间都可以对不同数字资源实现同步访问。图书馆所构建的数字仓储作为存储系统的重要组成部分参与运作,提供它所保存馆藏的安全、长期访问。

例二:某大学图书馆,在教学和科研活动中,数字馆藏不断增长,包括在线数据库、电子期刊、数字化文献、教师和学生的数字作品(如论文和专题论述)、数字课件以及数字化的机构文件等。这些数字资源的创建者包括学者、学生、大型商业出版机构以及学校行政机构等。该图书馆的数字仓储基于OAIS参考模型而构建,主要服务于大学教师、行政人员和学生,除此之外,还为其他学术团体和购买了图书馆阅读权的个人提供服务。所有用户的访问权限都由用户身份识别系统进行控制,以满足许可要求并维护数字资源的知识产权。

例三:某博物馆,拥有不断增加的数字馆藏,包括馆藏文物的数字复制品、为网上展览而创建的复制品以及原始的数字艺术品。博物馆数字馆藏的创建者通常为单个艺术工作者或者文化机构。该博物馆承担了长期保存数字馆藏,保管文化遗产的职责,其服务的用户范围广泛,包括学生、研究人员、艺术家、一般公众以及为商业目的利用数字文献的机构。由于该博物馆缺乏技术基础和专业技术人员,因此它与第三方机构合作,开发数字仓储,以便其馆藏得到专业级的管理,有效履行其长期管理的职责。

上述三个机构由于拥有大量需要保存的数字资源以及特定的用户群,因此都以不同的方式构建了数字仓储。

2.2 具备良好的外部基础设施

构建可信数字仓储必须具备良好的外部基础设施,所谓外部基础设施主要体现在可信数字仓储的构建机构中,构建可信数字仓储的机构必须做到:2.2.1 承担可信数字仓储的运作和管理职责

机构必须具备良好的运作和管理各项工作并提供服务的能力,能够随着技术的不断进步而改进和提升其运营能力,从而保证可信数字仓储的可持续发展。例如,采用国际或国家通用的标准和业内最佳实践,定期组织外部专家对构建可信数字仓储的相关过程和措施进行论证和审查等;与数字资源创建者就数字资源的获取、管理、存储和撤销等方面签订合理的书面协议;制定不断改进的风险管理和应急方案;保证所有的运作过程公开化和透明化。[3]

2.2.2 提供长期稳定的财政支撑

由于数字资源的保存需要根据技术的变革进行更新,与传统文献资源的保存相比,它需要更多持续的资源和经费投入。因此,可信数字仓储要长期、稳定地发展,就必须具备支持其持续发展和运行的经费保障。

构建机构必须拥有足够的财政实力,遵循商业运作规则,制定长期的商业运作计划,定期对数字仓储运作所需的经费以及效益进行审核,并根据审核结果制定可行的财政预算规划。

机构对数字仓储的商业运作规划应当包含下列内容:数字仓储如何盈利?数字仓储运作所需要的经费如何在构建机构、捐赠机构、托管机构以及其他支持机构之间分担?对于数字仓储将来可能出现的突发性灾难故障,机构是否具备足够的财政能力应对?如果出现财政危机,应采取何种应急计划对其进行挽救?

构建机构的财政政策必须透明,确保符合相关的会计标准和惯例,并由第三方机构根据当地的法律规则对其进行定期审核。

2.2.3 具有严密的组织结构以及专业的技术人员

可信数字仓储的构建和管理机构必须具有严格的组织结构,各部门之间必须分工合作,共同为数字仓储的运作和维护承担相应的职责。机构必须拥有具备一定技能的专业人员,对数字仓储进行构建和管理。对于人员的必备技能、角色、工作职责以及发展规划等都必须制定专门的政策或条例进行规定。

对于长期负责运作和管理数字仓储的人员必须进行能力和经验鉴定,确保他们都具备相关的专业技能,例如数字信息管理技能、计算机操作技能以及相关的法律知识等。

机构必须为员工提供有效的职业培训计划,尤其是技能和专业知识的培训,其目的在于使员工适应日新月异的技术发展,应对新技术带来的挑战。对于有条件的机构,可以制定员工终身学习和培训规划。

2.2.4 构建合理的综合性政策框架

为了对数字仓储实施有效的管理,机构必须从宏观层面上构建一个综合性的政策框架,该框架应当包含一系列规范、标准以及操作指南在内,能够从宏观上对数字仓储的运作进行指导和规划。

综合性政策框架可以包含以下内容:对数字仓储所保存的数字资源及其管理水平和技术基础设施进行说明;对数字仓储的特定用户群及其访问权限进行说明;对数字仓储如何为公众提供数字资源服务的流程进行说明;对政策框架的定期审核、更新和修改的流程进行说明;对机构各部门和人员职责进行说明;对机构支撑数字仓储的财政政策进行说明;对数字仓储所拥有的法律许可以及必须履行的法律义务进行说明;对数字仓储应对风险的管理机制进行说明;对数字仓储定期自我认证和外部认证的流程进行说明;对数字仓储构建机构、托管机构、赞助机构以及特定用户群之间的权利和义务进行说明。

2.3 具备优化的内部数字资源管理实施模型

外部基础设施仅仅为可信数字仓储的构建提供了实现的条件和外部支撑,真正决定数字仓储是否可信的关键在于数字仓储内部是否有一个合理完整的数字资源管理实施模型,该模型是否能够维持数字信息的可靠性、真实性、完整性以及可用性。

OAIS参考模型的出现为可信数字仓储的构建提供了一个可供参考的标准。2002年1月,由美国空间数据系统咨询委员会(CCSDS)与国际标准组织(ISO)合作开发的OAIS参考模型(A Reference Model for an Open Archival Information System)最终通过审核,正式成为一项新的国际标准(ISO:14721)。OAIS模型适用于任何存档机构,尤其适用于具有长期保存数字信息并提供利用职责的机构,它为长期保存数字信息资源并提供利用构建了一个可供参考的标准和模型。图1为OAIS的功能模型:

OAIS系统包括以下6个功能模块:

(1)接收(Ingest):从信息生产者那里接收按照一定格式组织的提交信息包(SIP)。这些信息包经过检验后建立相应元数据,元数据交给数据管理模块,信息包被转换成按照规定格式组织的长期保存的归档信息包(AlP),然后传递给归档存储模块保存。

(2)归档存储(Archival Storage):实际存储AIP,负责建立具体存储系统,并在存取功能模块提出请求时将AIP提供给该模块。

(3)数据管理(Data Management):存储关于数字信息单元的元数据和关于长期保护的处理政策、程序、技术和系统的元数据,并对这些元数据进行检索与管理。

(4)存取(Access):提供用户检索元数据和索取数字信息单元的界面,提供检索机制,并将AlP转换为适合信息用户利用的分发信息包(DIP),还可能承担身份认证、授权管理以及接受用户咨询等责任。

(5)管理(Administration):通过有关政策、规范、程序、工作流等来监控整个长期保存系统的运行和各个子模块的运行。

(6)保存规划(Preservation Planning):是监控OAIS环境,并保证在技术过时的环境下,为其提供建议的服务和功能模块,确保OAIS系统长期可用。具体包括评估存档内容和定期建议存档信息迁移、就存档机构标准和政策提出建议、监控技术发展及用户服务需求和知识储备的变化、制定具体的迁移计划、软件原型、测试计划以保证管理迁移目标的实施等。[5]

可信数字仓储可以根据上述功能模型构建符合自身情况和要求的数字资源保存模型。通过一定的机制和流程,实现SIP(提交信息包)、AIP(归档信息包)以及DIP(分发信息包)在信息生产者、管理者以及信息用户之间的顺利流转。

3 可倍数字仓储的认证

机构所构建的数字仓储是否可信,并非由构建机构自己宣称。为了获得用户以及数字资源创建者的信任,必须由公正客观的第三方机构对数字仓储进行认证,只有经过严格认证流程,遵循规范认证标准并最终通过认证的数字仓储,才能宣布为可信数字仓储。

对数字仓储的认证研究始于1996年,美国研究图书馆协会RLG在其发表的“保存数字信息”报告中指出,“数字化存档需要一套完整的认证过程,通过认证能实现人们对存储数字信息机构的信任”。

图1 OAIS功能模型[4]

但在当时,认证引起了强烈的争议。因为业界很多人认为将严格的认证指标强加给正处于萌芽和形成阶段的数字仓储是不可行的。另外,当时几乎没有实际运作数字仓储的机构,所以该组织停止了认证程序的细节制订。然而,随着时间的推移,业界普遍认为数字资源的长期保存需要付出更多的代价、技能和资源。即使保存机构具有多年在保存非数字资源方面的良好信誉,也不能断言,这些机构在长期保存数字资源方面同样值得信任。数字资源的保存风险是与生俱来的,保存机构必须通过对数字仓储的认证方可证明其具有保存数字资源可信任的能力。[6]

2002年,RLG和OCLC共同发表了《可信数字仓储:属性和职责》报告,对于不同规模的文化和学术机构所运行的数字仓储的可信任性和可持续性进一步构建了一个属性和职责框架。这个框架非常宽泛,足以包容各种环境、技术基础和机构职责,为可信数字仓储提供了认证基础。

2007年2月,OCLC正式发布“可信数字仓储审核与认证:标准与审核表(Trustworthy Repositories Audit & Certification:Criteria and Checklist,TRAC)”的认证标准。TRAC的正式发布标志着数字仓储开始趋向国际化认证,它融合了来自RLG、英国数字管理中心(Digital Curation Centre,DCC)以及德国的数字资源长期保存项目组(Network of Expertise in Long-Term Storage of Digital Resources)等国际权威数字保存研究中心的近百名研究人员的思想和研究成果,设计和构建了一套全球范围内适用的数字仓储统一认证体系和标准。[7]

TRAC提出的较为合理的统一认证标准,为可信数字仓储的规划和构建提供了客观的框架模型。正在构建或者已经建成的数字仓储,不仅可以将其作为构建数字仓储的指南,提高未来数字仓储的可信赖度,还可以借鉴TRAC作为自我评估和认证的工具,并据此对数字仓储进行不断改进和更新。

收稿日期:2008-07-31

标签:;  

可信数字仓库的建设与认证--浙江天宇信息技术有限公司的合作_信息技术服务论文
下载Doc文档

猜你喜欢