网络档案信息资源整合研究_档案管理系统论文

网络档案信息资源整合研究,本文主要内容关键词为:资源整合论文,档案论文,网络论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

信息资源整合是指将某一范围内的,原本离散的、多元的、异构的、分散的信息资源通过逻辑的或物理的方式组织为一个整体,使之有利于管理、利用和服务①。网络档案信息资源整合是指在兼顾网络档案信息资源现有配置与管理状况的条件下,通过建立统一的信息交换与共享平台,对分散异构的网络档案信息资源系统进行优化组合与无缝联结,从而实现网络档案资源的合理组织、高效利用与价值增值。作为社会信息化背景下档案信息资源开发与利用的有效途径,网络档案信息资源整合既是一个过程,同时也是一个结果。从过程的角度看,它强调的是将孤立分散的网络档案信息资源一体化、系统化的行为过程;从结果的角度看,它强调的是网络档案信息资源的便捷利用以及最终获得的价值增值。

图1档案信息化建设的三个层次

一、网络档案信息资源整合的必要性

近年来,随着计算机技术、通信技术以及二者相结合的网络技术在档案部门的应用,我国档案信息化建设进展迅速,档案数字化工作取得了一定成绩。网络档案信息资源数量越来越多,种类越来越丰富,一些条件好的档案部门还纷纷建立了各种类型的数据库,并提供网上检索。但与此同时,“信息资源海量化”、“信息渠道多元化”、“信息载体多样化”伴生的数据冗余和信息孤岛现象,让用户在众多分散的网络档案信息面前无所适从,检索系统的异构性和检索方式、检索手段的多样化也加重了用户的检索负担。另一方面,网络环境下用户对档案信息产品和服务的要求越来越高。这样,网络档案信息资源的分布和利用现状与用户对网络档案信息服务高效优质的需求之间就出现了矛盾。从某种程度上说,当前是我国档案信息化进程从资源建设阶段向资源管理阶段过渡的关键时期,即在经历了网络基础设施建设和办公业务电子化建设两个阶段后,档案部门应该将工作重点转移到档案信息资源整合管理平台的建设上来,采取有效的手段,实现各种分散、异构的网络档案信息资源的集中、整序和关联,同时集成各种档案检索系统,便于用户查找和检索档案信息。图1描述了档案信息化建设的三个层次。

从国外网络档案信息资源整合实践来看,美国档案与文件署(NARA)早在20世纪90年代中期就建成了全国范围的档案信息导航系统(NAIL),将国内所有数字化档案信息资源,按地区、来源和利用对象分别纳入统一的档案管理网络中,形成联网可检索数据库,实现全美数字档案资源的网上集成检索和利用。近年来,档案信息导航系统(NAIL)已经发展为档案检索目录(ARC),其功能与NAIL相比更加强大。美国档案与文件署计划在2009年以前将其全部档案数字化,届时美国档案信息网络将成为真正意义上的一体化无缝网络,用户通过总网站即可检索到全美所有的数字档案资源。在英国,英格兰档案网站与苏格兰、威尔士及高教系统等的档案子网络共同构成了全英联合王国的一体化档案网络,通过该网络全国各种档案部门所提供的档案信息都能展示给用户。与美英等发达国家相比,我国网络档案信息资源整合实践相对滞后。目前统一的全国档案信息网与大规模的国家档案数据库还没有建立,还无法实现对外一体化的档案信息服务,使得档案信息化的效用大打折扣,不能很好地满足网络条件下社会公众对档案信息的需求。国家档案管理部门仍然没有出台实质性的网络档案资源整合措施,地区之间、部门之间的合作与协调仍然没有引起足够的重视并付诸实践,这将严重阻碍我国档案信息化建设的进一步发展,使档案信息化水平与其他领域之间的差距可能进一步扩大。总之,实现网络档案信息资源整合是信息时代档案部门谋求发展的重要出路,也是档案信息化建设的核心战略之一。

二、网络档案信息资源整合的原则

网络档案信息资源整合不只是对信息资源的简单集中和利用,而是一项复杂的系统工程,需要通过自上而下的规划和自下而上的设计来完成。只有这样,才能保证资源配置的最优化和信息管理的最佳化,从而满足面向用户的资源整合和服务集成要求。因此,在网络档案信息资源整合项目的实施过程中需要遵循如下原则:

1.完整性原则。在网络档案信息资源整合过程中要保持档案信息资源对象的完整与全面,它主要体现在以下三个方面:①整合后的网络档案信息资源在内容上具有多维性。横向必须涵盖社会实践的各个专业领域,纵向要有各个层次、多种形式的档案信息产品存在。②整合后的网络档案信息资源相互之间具有联结性。要将分布的资源有机关联,揭示数据对象间的内在关系,确保网络档案信息资源在逻辑上形成一个整体。③整合后的信息资源管理系统功能具有全面性。要将分散异构的档案信息资源管理系统进行优化组合与无缝连结,通过网络建立起新的信息交换与共享平台,该平台不仅应涵盖原有分散系统的所有功能,而且应当能实现新的应用。

2.科学性原则。对网络档案信息资源整合项目应进行系统规划,科学论证,要保证整合的合理性、科学性和规范化。科学性原则包含以下几个方面:①整合资源选择的科学性,根据档案部门的服务对象和财力合理地规划和自建资源,不能盲目求全,浪费人财物力。②整合资源组织的科学性,建立各类资源间的多重关联并进行科学地组织,使有限的资源产生出最大的信息量。③资源整合系统在交互接口上的科学性,系统的交互既包括数据处理过程的后台交互,也包括用户和检索系统的交互,交互的科学性主要体现在处理接口的无缝连接,处理过程简洁快速,检索界面方便有效。

3.层次性原则。档案部门为满足用户的信息需求,在构建网络档案信息资源整合系统和为网络档案用户服务的过程中,要注重以下几个方面的层次性:①整合数据的层次性,由于档案信息用户具有不同的知识背景和信息需求,因此需要整合不同知识层次的信息。②资源整合的结构性,由于用户的查询需求可能是多方面的,为满足多维化的用户需求,需要能够实现数据的多维整合。③检索操作的层次性,整合后的网络档案信息资源管理系统应能提供多层次的检索界面(如简单检索、复合检索和专家检索),以满足不同层次用户的检索要求。

4.经济性原则。网络档案信息资源的整合要用尽可能小的成本取得尽可能大的效益,避免资源的闲置和浪费。经济性原则主要从以下两个方面反映出来:①在档案部门经济力量有限的情况下,应根据档案信息资源整合的目标,有针对性地选择信息资源、挑选恰当的整合工具和整合方法,尽量以较少的经济投入实现整合功能的倍增。②在人财物力投入一定的情况下,应使整合后的网络档案信息资源系统达到最佳的使用效果,实现网络档案信息资源服务范围的扩大,服务能力的提升和服务手段的多样化,从而产生最大的社会效益和经济效益。

三、网络档案信息资源整合的内容

网络档案信息资源的整合不仅仅是技术问题,也不只是档案信息资源的集成问题,而是一个系统的大工程,其主要内容包括数据整合、系统整合和服务整合三个方面(如图2所示)。三个方面的内容相互支撑,相互依赖,逐步从后端的数据层向前端的应用转化。

1.数据整合。网络档案信息资源数量浩繁,类型多样,它们以异构数据库的形式分散于网络中的不同位置,总体上处于一种无序、凌乱的状态。数据整合就是要整合网络环境中各种类型的档案数据库,将其连接成一个相互关联的数据库群,从而实现数据的自由流动。实现数据整合目前主要有两种方法:一种是采用基于中间件的代理技术,另一种是建立实际资源数据库与资源概念数据库的映射规则②。这两种方法都能使各种类型的数据库实现互联,在面向查询和访问时成为一个整体,实现数据的集成和整合,从而大大提高网络档案信息资源的利用率。

2.系统整合。档案信息资源管理系统是指各档案部门所使用的信息管理软件。在社会信息化的大背景下,近年来,各级各类档案机构,尤其是国家综合性档案馆纷纷开展档案信息化建设,在档案管理系统的构建上已经有所突破。但是,由于各自为政,独立开发,致使各机构的档案管理基础软件标准不一,造成档案信息资源的分散孤立,难以共享。要实现网络档案信息资源的整合,就要利用先进的技术手段,构建统一的网络档案信息资源交换与共享平台,使之能联结各个异构的应用系统,从而为网络档案信息资源的共享创造基础条件。

3.服务整合。网络档案信息资源整合不同于档案资源上网。目前,我国已有相当多的档案馆在公众网上开辟了站点,其中一些网站在注重宣传档案、档案工作和档案事业的同时,也向社会公众提供一定的网络档案信息服务。但这些档案网站之间终究是分离的,尚不能实现彼此之间的无缝连接,不能为用户提供一体化、全方位和深层次的网络档案信息服务。网络档案信息资源整合致力于实现分散、异构的网络档案信息资源的无缝联结、高效利用和价值增值,必然要求向用户提供统一的用户界面和共同的检索方法,实现“一站式”服务,从而使得用户获取档案信息不受时间、空间和形式上的限制。

四、网络档案信息资源整合的技术保障

网络档案信息资源整合的核心在于充分地运用网络技术、计算机技术等先进的技术手段来解决长期困扰档案界的信息资源分散性、孤立性、封闭性和社会对档案信息资源需求的多样性、综合性、递增性之间的矛盾。因此,网络和信息技术是实现网络档案信息资源整合的关键因素和基本保障。

1.数据的组织、转换相关技术。数据的组织技术上要解决不同类型、不同结构的数据如何组织在一起的问题,如档案信息资源涉及到的分类控制方法等资源分类组织技术。数据转换技术主要解决不同格式、不同平台下数据的转换问题,如MARC、DOC、PDF、TXT等不同格式文件的格式分析技术、数据交换和转换技术、数据的查重去重技术等,此外还包括数据封装技术,如XML技术。

2.数据存储与压缩技术。网络档案信息资源信息量庞大,冗余信息多,给存储和传输带来极大的困难。如何采用最低的成本对其进行有效的压缩、保存和方便使用就成了档案信息资源整合的一个首要的技术问题。目前,数字档案信息存储包括磁存储、光存储和半导体存储三种类型,有效的数据压缩技术可以检测并消除数字信号中的冗余,使压缩后的档案信息,尤其是音频和视频档案信息的传输及存储性能大大提高。

3.分类、索引和检索技术。网络档案信息资源整合一开始就必须定义能够覆盖包括各种媒体类型的元数据规范,以及基于此规范的内容索引方法和分类方法。同时,为了支持海量数字化资源的自动分类和检索,需要研究基于内容多媒体处理技术、索引技术的研究,主要解决整合后的索引如何构造的问题,这些索引要满足不同检索算法和检索需求,如全文检索、同义词检索、排除检索、扩检和缩检、集成(整合、跨库、一站式)检索技术、概念检索技术(利用同义词词典、概念词典)等进行基于概念(或基于语义、基于本体)的检索。

4.用户界面和系统集成技术。智能化用户界面是档案信息资源管理系统与用户交流的窗口,它的核心目的是为用户使用网络环境下的数字档案信息资源提供方便的支持。如何充分利用图形、语音及其融合技术,设计一个具有人性化、智能化的友好、直观、方便的接口,还有待进一步研究。长期以来,各地档案信息化建设都是在分散、孤立的情况下开展的,软硬件的使用没有遵循统一的标准,而网络档案信息资源的整合则需要将这些异构的系统实现无缝连接,因此,必须加强系统集成技术的研究。

5.安全技术。网络系统的安全技术水平如何直接关系到网络档案信息的安全和档案信息资源的共享。目前,国内外所采用的安全保护技术主要有防火墙技术、硬件隔离技术、加密技术、认证技术等。虽然这些技术在一定程度上解决了网络系统的安全问题,但是它们自身也存在许多缺点,如防火墙不能防备内部人员的攻击,不能防止感染病毒的软件或文件的传输,正是这些缺点给非法用户提供了可乘之机。因此,当前需要尽快研制一些关键技术,如唯一性身份识别技术、数字签名技术、信息的完整性检验检测技术、安全审计跟踪评测技术等等。

图2网络档案信息资源整合的内容

总之,网络环境下,随着整个社会信息化水平的提高和档案信息化建设的推进,实现档案信息资源整合已是大势所趋。各级档案部门应顺应这种趋势,通力合作,本着完整性、科学性、层次性和经济性的原则,在广泛采用先进技术基础上,协力构建全国统一的网络档案信息资源整合平台,向社会公众提供优质高效的档案信息服务的同时,谋求档案部门和档案事业自身的发展。

注释:

①苏新宁、章成志、卫平:《论信息资源整合》,《现代图书情报技术》2005年第9期。

②徐彬荣:《多数据源集成新技术》,《情报杂志》2003年第1期。

标签:;  ;  ;  ;  

网络档案信息资源整合研究_档案管理系统论文
下载Doc文档

猜你喜欢