异构系统中电子档案文献保障的总体构想_语义分析论文

异构系统中电子档案凭证性保障的整体构思,本文主要内容关键词为:凭证论文,构思论文,异构论文,档案论文,系统论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 引言

国家信息化的快速推进、电子政务的深化应用,对我国档案事业的发展和档案工作的开展产生着巨大影响。大量的电子档案已经开始越来越广泛地在电子政务、电子商务以及社会生活的各个领域发挥不可替代的作用。由于电子档案具有易修改且修改后不易留下痕迹的特点,在异构系统环境下形成的各种门类和各种格式的电子档案在向档案馆移交过程中难以保存其原始文件的格式、原貌和内容的真实与完整性,信息系统因技术升级也会导致电子档案格式的升级、转换和迁移,使得电子档案重要的凭证作用是否能够在长期保存过程中确保有效成为了世界性的难题[1]。而在档案的凭证、查考、传播等诸多作用中,普通公民主要还是利用档案的凭证作用。也正是由于档案具有真实性和原始性等特点,具有其他任何材料不可替代的依据和凭证作用,因而具有极强的法律凭证效力。当然,保障电子档案凭证性长期有效已经不单单是档案部门亟待解决的问题,而是整个信息化社会所面临的迫在眉睫的难题。本文针对这一挑战,提出一种基于电子档案身份证的凭证性保障的思路和方法,并结合异构系统的相关特征,研究关键技术,探讨解决方案。

2 电子档案身份证

就像每个人拥有一个身份证,并在各种场合用身份证来证明其身份一样,本文认为应为电子计算机系统中每份电子档案设计一个身份证,以辨别其身份,证明其真伪,并在电子档案生命周期的各个环节呈现其凭证性功能。事实上,电子系统中的每个数字对象需要确定唯一标识在信息资源管理领域已初步形成共识。譬如,DOI(数字对象标识系统)是应用在图书馆领域的用来标识图书馆的数字对象的一套全球资源管理标识系统,每一个数字对象都将分配唯一的一个标识符,从而为后面的时候提供了唯一区分作用[2];CDOI(中国国家数字图书馆唯一标识符系统)是在DOI基础上,设计出来的一套中国国家图书馆唯一标识系统,它本质上和DOI基本一致,都是用于标识资源的唯一性[3]。但是,DOI和CDOI主要用来区分某个资源(数字对象资源或者用户)应该是谁,但是不能保证某个资源的确就是真正的谁,因为它们并不具有数字对象来源身份的真假识别能力。而对于电子档案而言,需要在系统中明确标识它的来源真实性、保存过程中的安全性和使用环节的有效性,因而,设计电子档案的身份证不仅便于它在系统中区别于其他的档案,还在于要用身份证来维持其来源凭证性和管理过程凭证性的作用。因而需要基于来源原则明确身份证的构成要素,需要采用语义方法构造身份证的呈现方法,需要采用安全机制确保电子档案凭证性保障功能的具体实现。

2.1 电子档案身份证的概念

能否确保电子档案在其长期保存过程中仍能维系其真实、完整、可用和安全,主要取决于电子档案在收集、管理、保存、使用等各工作环节中的机密性、完整性、不可否认性和真实性是否得到保障。现有的研究中,注重对信息的机密性、完整性及其不可否认性的保障,目前相关的研究中并未形成相对完整的理论体系和可操作的实践指导方法。陶水龙等提出的“电子档案身份证”(电子档案凭证)基本概念,认为电子档案身份证,是通过特定的计算方法,将电子档案的核心构成要素进行特征抽取,形成的一个具有语义属性的凭证代码,用于唯一标识电子档案,并能验证电子档案真实、完整、可用、安全和唯一身份的证件[1],探讨将电子档案身份证作为在档案数字资源综合管理系统中识别和鉴定某一电子档案身份的唯一凭证,在分析电子档案元数据和设置一定的语义规则基础上,通过一定的算法生成电子档案凭证数列,最后利用数字签名技术,将这个电子档案凭证以数字形式存在于电子档案的信息包结构之中,表明档案移交单位对该电子档案中包含的内容信息的确认,在电子档案的管理活动过程中其值是固定不变的。本文后面部分在此设想的基础上,进一步探讨电子档案身份证的构成要素及其作用原理,分析在异构系统中保障其凭证性的关键技术和工作原理。

2.2 电子档案身份证的构成

系统中电子档案的身份证是用来证明一份电子档案身份的真凭实据,它是一种能够保证电子档案唯一性、原始性和真实性的身份证件,也是电子档案作为司法证明的重要依据。它的构成要素不仅应包括系统中明确的一个通用编号即身份证号,而且应具有电子档案的来源属性与代表其本质特征的内容要素,本文认为电子档案的身份证应由至少由三部分组成,即电子档案身份证编号、电子档案有效元数据集合、电子档案形成单位数字签名(带时间戳),而且,电子档案的身份证号也应通过语义规则和算法生成系统中唯一的身份证号,如图1。

图1 电子档案身份证

图1所设计的电子档案身份证与以往数字资源标识符相比,主要具有以下两个特点:

2.2.1 电子档案身份证具有更多的语义性 传统的资源标识符,更多强调的是能够快速定位并发现资源的位置,几乎不带有其他任可语义性[2]。而本课题提出的电子档案身份证,不仅具有能够快速定位与发现的电子档案身份证的唯一编号,同时还具有能够标识档案本身的语义元数据及其由档案移交单位签发的数字签名,它具有更多的语义性。

2.2.2 电子档案身份证同时具有凭证性验证作用 与传统的资源标识符相比,电子档案身份证不仅具有唯一标识定位作用,还具有凭证性验证作用。电子档案身份证里包含了电子档案形成阶段的核心元数据及相关内容,同时它与电子档案本身封装到一起存在于系统中。一旦电子档案内容出现非授权篡改,系统中验证机制中重新生成的身份证与原始身份证产生差异,在校验过程中则会引起其电子身份的验证失败,从而确认该份档案在处理的环节中被变更,其凭证性作用可能会丧失。因此说电子档案身份证在系统中具有凭证性验证作用,能更好地保障电子档案保管过程中的安全性。

2.3 电子档案身份证号的生成

为了生成电子档案身份证号码,本文研究采取了相关的语义算法(如图2所示)。从中可以看出,通过事先确定的特定的元数据语义选择算法抽取电子档案有效元数据集,再通过特定的电子档案身份证语义生成算法制作电子档案身份证号码。

图2 电子档案身份证的制作

2.3.1 元数据语义选择算法 不同于其他的语义计算算法,本文提出的元数据语义选择算法更注重“人”的意念,其语义来自于“人”的想法。这里的“人”主要是指档案学领域专家,由档案学领域专家经过精心设置和筛选后,得出的那些最能够代表档案本身的部分核心元数据,即构成了有效元数据集合,也就是将用于生成电子档案身份证号的元数据集合。

2.3.2 电子档案身份证号的语义生成算法 传统的各类“身份证”编号,一般注重设定一个全球唯一的编号,即一串具体的数字。不同于传统资源标识编码和居民身份证号码、社保号码等,电子档案身份证编号不仅具有全球唯一性的编号,同时也在一连串编号中的某一段增加了具有电子档案元数据语义的含义。电子档案编号规则如图3所示的一个参考示例,从图中可以看出电子档案身份证编号由六大部分组成,大体归结为三类:

(1)可以由语义规范来约束的部分,主要包括:省市编号、区县编号、立档单位编号及其档案形成日期;

(2)由特殊语义算法生成的8位编号:该编号将包含电子档案自身内容的一些语义信息,具体包含的元数据项,由北京市的档案行业专家确定。编号则通过计算机自动编码技术对档案专家设定的具体内容进行处理后得出一串具有某些特定语义的字符串;

(3)档案序号:由档案移交单位人工或计算机自动赋予电子档案的一个编排序号(不能重复)。

图3 电子档案身份证号编号规则

2.4 电子档案真实性保障的基本原理

本课题所提出的电子档案凭证性保障的解决方案与传统的文件档案及数字资源管理领域的安全保障方案相比较,其重要的不同点在于增加了电子档案身份证的证书库及其管理,如图4和图5所示。

图4 传统的电子档案凭证性安全保障方案

图5 本课题的电子档案凭证性安全保障方案

比较图4与图5可以看出,传统的安全保障方案仅仅通过验证与电子档案一并加密发送的Hash码(电子文件校验编码)来验证电子文件的原始性[3],但无法有效验证Hash码自身的合法性及其有效性,从而导致电子档案的验证无法确保真实。本方案中设计了一个电子档案身份证的证书库,验证过程中可以在该库中进行电子档案身份证的证书查询,看其是否合法和有效。当然,这一方法的提出将会增加有关证书管理和验证审查等相关研究工作的启动与开展,需要在数字档案馆系统建设和运行的过程中增加新的内容,本文研究的课题组将会随着研究工作的深入,另撰文阐述相关问题。

3 基于身份证的电子档案真实性保障的工作原理

现有的技术和实现方法只能对机密性、完整性及其不可否认性提供相应的保障,而对伪造的电子档案的身份和真实性很难得到有效的保障,因此为确保电子档案本身的身份,系统的实现需要建立电子档案身份证库,就像公安局建立居民身份证库一样具有权威性和身份认证性。下面结合两个案例分析基于身份证保障电子档案的凭证性保障的作用原理。

第一种情况:伪造电子档案但是无法获得合法身份证,图6为其基本工作原理。

图6 电子档案真实性验证原理示意图

(1)电子档案身份证入库。每份真实的电子档案在制作后要经过严格的审查,由于伪造档案不可能在权威电子档案身份证库中有其合法的电子档案身份证,因而那些伪造的电子档案不能在权威的电子档案身份证库通过这种严格的审查。

(2)获取电子档案身份证。接收方在接收到所有的电子档案后,会取出接收到的所有的电子档案的身份证,用于对电子档案身份的真实性进行验证。

(3)从库中获取电子档案身份证。从权威的电子档案身份证库中获取所需的电子档案身份证,以便用于对比校验。

(4)验证结果。将(2)与(3)的身份证进行比对,那些身份真实的档案能够顺利通过,而那些伪造的电子档案在这一关将不能通过验证。

第二种情况:伪造电子档案但是窃取了某份电子档案的合法身份证

这是一种极为隐蔽的安全隐患,有可能某些非法分子本身窃取了一些合法的真实身份证,然后冒用这些真实身份证的身份,通过将窃取到的真实身份证附加到伪造的档案中来伪造虚假档案。这种情况下,为了确保安全,需要进一步增加重新生成电子档案身份证的处理流程,工作原理如图7所示。

图7 电子档案真实性验证原理示意图

图7展示了这种特殊情况下的电子档案真实性验证的一个原理示意图,主要包括如下几个基本的验证步骤。

其中步骤(2)(3)(4)与图1中一致,在此不再重复;

步骤(5):获取与电子档案封装在一起的电子档案身份证;

步骤(6):对电子档案(包括伪造的电子档案)重新执行一次电子档案身份证生成算法,生成新的电子档案身份证;

步骤(7):将这些新生成的电子档案身份证提交验证。

步骤(8):那些真实电子档案且有真实电子档案身份证的电子档案将会通过安全性验证;而那些虽然窃取了真实电子档案的电子档案身份证,但是伪造后的档案所重新生成的电子档案身份证不可能与窃取的电子档案身份证一致,从而这种虽然窃取了真实电子档案身份证,但是档案本身是伪造的这种电子档案也将不会通过验证,从而达到验证真实性目的。

4 异构系统中电子档案凭证性保障的关键技术

电子档案身份证主要从电子档案的真实性角度进行保障,除此之外,电子档案的机密性、完整性及其不可否认性等都非常重要,而这些处理过程中会用到各类技术手段对之实施行之有效的安全保障,下表根据电子档案处理过程列出各个阶段可能采取关键技术和方法。

5 结语

本文针对异构系统环境下电子档案凭证性保障的核心问题,设计了电子档案身份证的构成要素和构造方法,分析了基于身份证的电子档案凭证性保障的工作原理,并进一步探讨了电子档案凭证性保障相关核心技术等的概念描述、产生及其应用场景,这些探索性工作的开展为数字档案馆的总体设计奠定了思路、方法和原理级的基础,未来的研究将主要集中在:

(1)电子档案身份证的生成算法研究。需要研究一种语义性比较强的、能够比较权威反映档案学领域专家对元数据理解的最核心的元数据融入到算法中去,并将这些元数据以某种形式能够体现在电子档案身份证中。

(2)电子档案凭证性保障的并行验证机制研究。随着电子档案的数量越来越多,针对海量的电子档案的各种验证对速度要求越来越高,我们需要研究其具体的实现机制和相应的计算程序,确保在面对海量的数据时候仍然能够较好地满足对验证的效率的需求。

(3)电子档案安全传输信道的实现方法研究。通过政务网在线传输电子档案,必须首先解决安全传输信道,我们需要通过反复测试和对比,经过缜密的研究过程,设计出符合电子档案在线传输安全需求的技术方案,确保在复杂的网络环境下仍然可以确保电子档案的真实性在传输过程中不会被破坏,同时,确保电子档案在复杂网络环境下不会被非授权获取,杜绝数据篡改和数据突破(泄漏)的可能性。

(4)电子档案身份证的长期保存和管理机制的研究。档案的保存期限不止于5年、10年,当一份电子档案进入档案馆后,生命周期将达到不可预知的未来。当电子档案随着信息技术的不断发展而不断迁移之后如何确保电子档案身份证仍能有效,将是我们研究的重点之一。

标签:;  ;  ;  ;  

异构系统中电子档案文献保障的总体构想_语义分析论文
下载Doc文档

猜你喜欢