我国电子文档管理元数据研究现状分析及在文献集成应用中的思考_元数据论文

我国电子文件管理元数据研究现状分析及其在文档一体化运用中的思考,本文主要内容关键词为:文件管理论文,现状分析论文,文档论文,我国论文,数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

电子文件管理元数据是文档管理一体化的“命脉”,这已成为信息时代人类的共识。同时也说明,在我国文档一体化建设中不能不对电子文件管理元数据进行研究与运用。本文通过对1994年至2007年我国档案相关报刊上所发表的有关电子文件管理元数据的研究文献进行量化统计,从而展示我国电子文件管理元数据研究现状,藉此为我国文档一体化建设如何科学运用电子文件管理元数据提供进一步的研究思路。

一、我国电子文件管理元数据研究现状统计

在中国期刊全文数据库(CNKI)中检索,从1994年起至2007年,我国报刊发表的有关电子文件的文献共2441篇,发表有关元数据的文献共2493篇,而有关电子文件管理元数据的文献全文检索共84篇(其中2007年发表文献共17篇,包括期刊、研讨会论文集、报纸相关报道),从而可看出电子文件管理元数据占电子文件总数的4%,占元数据总数的4%,该调查结果可以从多个角度进行分析,其分析统计模型如图1所示。

图1:电子文件管理元数据统计模型图

从图1可看出,该统计模型是从宏观和微观的哲学方法入手,由浅入深地对电子文件管理元数据的相关文献进行研究。

1.在宏观层次上,时间维——按照文献发表年度分析;空间维——按照作者分析;内容维——按照文献研究内容分析。

2.在微观层次上,即对文献内容作进一步分析,分三个角度进行分析。理论维——按照文献内容所涉及的理论研究进行分析;实践维——按照文献所涉及的实践研究进行分析;标准维——按照文献所涉及的国内外标准研究进行分析。

二、宏观统计分析

在时间维上,将电子文件管理元数据研究成果按年度进行统计得出,我国关于电子文件管理元数据的研究始于1999年,发表1篇;以后各年发表文献为:2000年1篇,2001年3篇,2002年8篇,2003年10篇,2004年14篇,2005年17篇,2006年14篇,2007年17篇。

在空间维上,将按照文献作者统计电子文件管理元数据相关文献,将发表三篇以上的作者列入统计范围,经统计得出,张正强教授发表13篇有关电子文件管理元数据的文献;程妍研7篇;金更达4篇;金更达与何嘉荪二人合作4篇;张弛4篇;何嘉荪3篇;崔屏3篇;孙丰满3篇;徐维3篇;刘越南3篇;其他作者2篇。在我国研究电子文件管理元数据方面,南京政治学院上海分院信息管理系的作者占了绝大部分,如张正强、程研研、张弛、崔屏、孙丰满及徐维等,他们所发表的电子文件管理元数据论文占全部统计的电子文件管理元数据的三分之一强。何嘉荪教授与金更达副教授是浙江大学的,刘越南副教授是人民大学的。从以上统计可分析出我国研究电子文件管理元数据方面的专家学者主要集中在高校,为今后的研究提供一定的借鉴意义。

在内容维上,经统计分析得出,电子文件管理元数据研究方向大致分为五种(其中,有一些研究文献的内容涉及多个方面),分别为电子文件管理元数据标准化、概念、功能、置标语言和管理,其实对置标语言的研究,也就是对电子文件管理元数据语法标准化的研究,因而可划入电子文件管理元数据标准化研究范畴,也就是合并为四个方向研究。

三、微观统计分析

通过以上宏观统计分析,可对我国电子文件管理元数据研究现状有一个基本了解,但若需对其有更深入的研究,则需进行微观统计分析,即对相关文献的内容作进一步的研究,最后形成我国电子文件管理元数据研究的理论体系,为我国档案学者在此方面的进一步研究提供参考。

(一)电子文件管理元数据标准化研究

电子文件管理元数据的标准化分为宏观标准化和微观标准化。宏观标准化即使其与“国际通用标准相一致”,与“现有国家标准相一致”,与“专业领域标准相一致”。而微观标准化是使得每一个电子文件管理元数据的语义结构和语法结构都达到标准化,即电子文件管理元数据微观标准化=语义结构标准化+语法结构标准化[1]。

1.电子文件管理元数据标准设计框架研究

电子文件管理元数据设计框架为设计电子文件管理元数据标准提供了需要遵循的规则、方法和设计流程等内容,我国档案界学者提出了三种设计框架,分别为由金更达、何嘉荪提出的电子文件管理元数据标准框架、电子政务元数据设计规范,由张正强教授提出的框架观点,其中,张正强教授指出在选择电子文件管理元数据标准顶层框架的基础性标准时,应该首先选择国际标准23081第二部分元数据的顶层框架。

基于第三种框架观点,笔者也认为采用国际标准23081第二部分的顶层框架为宜,因为与澳大利亚维多利亚州《电子文件管理元数据标准》采用的元数据线型结构相比较,国际标准23081第二部分的顶层框架采用了分面的方法来架构电子文件管理元数据的宏观结构,对于电子文件管理元数据能多维、灵活、全面描述电子文件特征奠定了基础。

2.电子文件管理元数据语义结构标准化研究

在语义结构标准化的研究中,又细分为元素语义结构标准化和值语义结构标准化两个方面,由我国档案学者张正强教授及孙丰满提出研究。

(1)电子文件管理元数据元素语义结构标准化

张正强教授对电子文件管理元数据的四个核心元素进行研究,分别是主题元素、责任者元素、时间元素和关系元素,对每一个核心元素都进行了深刻透彻的研究,单独成文发表。

基于元素语义结构标准化,孙丰满也认为这是最基本的语义结构化,是语法结构化的基础,对元数据基本元素语义结构和子元素语义结构化进行分析,得出标准的元素语义结构化才能有效地实现电子文件管理元数据描述电子文件的准确性,从而保证电子文件的凭证价值。

(2)电子文件管理元数据值语义结构标准化

关于这个方面的研究,目前我国只有孙丰满研究,他认为元数据值语义结构化就是对元数据值的语义及其关系进行系统地揭示并加以标识的过程,其意义在于其表达了从无序到有序的规范化过程;表达了从单维揭示到多维揭示的多维化过程;表达了从笼统到具体,从模糊到精确的具体化和精确化过程。

3.电子文件管理元数据语法结构标准化研究

对于电子文件管理元数据语法标准化研究,目前我国还处于刚刚起步阶段。元数据语法结构即定义了元数据的格式结构及其描述方式,对元数据的格式结构的定义在国际上通常采用DTD或XMLSchema来完成[2];而对元数据的描述方式,则可采用TEXT、HTML、XML等置标语言。关于TEXT置标语言,是指以文本字符作为标识对电子文件管理元数据进行置标;关于HTML超文本置标语言,是标准的通用置标语言的子集,其通过规定一种简单的结构和一个标识集将信息显示出来;关于XML置标语言,将许多较复杂且不常用的特征去掉,同时保留其原有的强大功能和灵活性而形成的置标语言。

(二)电子文件管理元数据概念研究

电子文件管理元数据概念是对电子文件管理元数据研究的基础,目前我国存在多种表述,在此仅表述其三种代表性的观点:第一,由戴维·比尔曼提出的定义,即关于数据的数据,此定义与计算机通信领域中的含义相同,因而此定义过于抽象、泛指;第二,由国际标准组织制定的国际标准《ISO/IEC11179-1信息技术——元数据注册——第一部分:数据元素的说明及标准化框架》定义:元数据是定义和描述其他数据或过程的数据;第三,国际标准《ISO 15489-1:2001信息与文献——文件管理》,规定元数据就是自始至终地描述文件的背景、内容和结构及其管理的数据。该国际标准所提出的电子文件管理元数据的概念目前已被国际文件与档案领域普遍认可与采用。

(三)电子文件管理元数据功能研究

我国档案学者在电子文件管理元数据功能方面的研究人数较多,但概括起来主要从四个方面来描述其功能:第一,根据国际标准《ISO 23081-1信息与文件——文件管理过程——文件元数据》,对电子文件管理元数据的控制功能加以研究;第二,根据系统论的观点,将电子文件管理元数据功能分为总体功能与局部功能;第三,从应用和发展角度对电子文件管理元数据功能进行研究;第四,从信息资源角度,对电子文件管理元数据的具体功能进行研究。

(四)电子文件管理元数据结构体系研究

关于电子文件管理元数据体系,典型是以通用国际标准档案著录标准ISAD(G)、永久保护电子文件真实性国际研究项目(InterPARES)、David Bearman元数据规范(BAC)为代表,其中,ISAD(G)将元数据模型划分为7个层次,分别为“识别声明区、背景区、内容结构区、检索与使用情况区、相关资料区、附注区、著录控制区”;InterPARES的元数据模型的五个部分分别为:载体说明、外部特征、内容特征、背景信息、附注说明;BAC元数据模型包括六个层次:处理层、条件层、结构层、背景层、内容层、利用理事层。

(五)电子文件管理元数据方法研究

关于电子文件管理元数据方法研究,学者程妍妍提出了模型法,即电子文件管理元数据标准化研究中,需要运用模型对电子文件管理原型进行抽象,以揭示电子文件管理元数据的本质、关系并上升至理论,以此来指导电子文件管理实践。并认为,模型法其功能有三个方面:一是明确电子文件管理元数据标准元数据种类,二是明确电子文件管理元数据标准元数据描述对象级次,三是明确电子文件管理元数据标准元数据结构。

(六)电子文件管理元数据在电子文件管理中运用研究

1.在电子文件管理全过程中电子文件管理元数据运用研究

我国学者黄萃指出,对基于元数据的电子文件全程管理,应该在电子文件管理系统的设计阶段、电子文件形成阶段、运行阶段、维护阶段、鉴定阶段、归档阶段、整理阶段、保管阶段、利用阶段、脱机电子文件管理各个阶段进行管理,同时在各个阶段中元数据的技术得到相应的应用。

2.在电子文件集成管理中电子文件管理元数据的运用研究

集成管理与服务是消除信息孤岛、实现元数据交换和共享的重要手段,同时也是实现电子文件管理的重要手段。集成管理是对多种系统平台以及产生于其中的电子文件——具有分布性、自治性和异构性的电子文件运动全过程施行的,足以保障电子文件真实性的、动态的、有效的和全方位的综合统一管理。

3.在电子文件内容管理中电子文件管理元数据的运用研究

所谓内容管理普遍采用了Bob Boike的观点,即指在目标出版物中有效地收集、管理和形成可利用的信息。我国学者金更达指出,在数字档案馆集成模型构建中,内容管理的内容是内容元件和元数据,还要结合内容扩展及内容创建与服务。从而可看出内容管理不仅仅是一个概念或者是某种单独的技术,而是结合人的活动与各种传统和先进技术的综合应用,目前已经比较成熟和稳定。

四、对我国电子文件管理元数据在文档一体化运用中的研究与发展的思考

纵观我国电子文件管理元数据研究的现状,可以看出,我国电子文件管理元数据研究的时间短,但是取得的成果不小,尤其是最近两年,成绩显著。根据我国电子文件管理元数据的研究现状,可以得出我国电子文件管理元数据研究的理论体系,即分别从电子文件管理元数据理论研究、电子文件管理元数据实践研究及电子文件管理元数据标准化研究三个方面着手研究,如图2所示。

图2:电子文件管理元数据理论体系图

从图2可看出,我国电子文件管理元数据研究的理论体系是完整的,而且是我国档案学者在极短的时间内便形成了这个理论体系,可以说,我国档案学者对电子文件管理元数据的研究取得了显著成绩,但是在这个理论体系的研究中,仍然存在着不足以及将来急需研究之处,这是值得我国电子文件管理元数据在文档一体化运用中需要十分加以关注的。

(一)我国电子文件管理元数据在文档一体化运用中在理论方面应注意:

第一,从研究理论来看,对于电子文件管理元数据的内涵与外延的研究应加强,因为这是研究电子文件管理元数据的基础,研究某一对象,首先要准确把握对象的定义,这样才能准确认识某一事物。

第二,从研究广度来看,我国档案学者应加强电子文件管理元数据研究方法的科学性,要进一步开拓新的研究方法,以便更好地研究电子文件管理元数据,因为只有方法的科学,才能保证研究结果的科学。

第三,从研究对象上来看,不但要注意文书类电子文件管理元数据的研究,更要注意对科技电子文件管理元数据研究,这方面的研究成果在我国还很少,但潜在需求很大。

第四,从研究内容上来看,要加强对我国电子文件管理元数据的需求研究,因为,在我国电子文件在文档一体化中的研究与管理中,需求将直接引导文档一体化的实践,因此,需要我们加大研究力度。

(二)我国电子文件管理元数据在文档一体化运用中在实践方面应注意:

第一,从研究的实践性上,要加强电子文件管理元数据在文档一体化中的标准的制定,因为,电子文件管理元数据是一项应用性、实践性很强的研究,只有实现标准化才能充分显示出其效益来,而对加快我国信息化建设而言更是如此,目前,应该尽快启动我国电子文件管理元数据标准的起草与制定,推动我国文档一体化的快速发展。

第二,从研究内容上,目前急需要制定的是我国公文类电子文件管理元数据标准,因为,这类元数据覆盖面最广,应用性最强,实行文档案一体化的需求最迫切,因此,加强对我国公文类电子文件管理元数据标准的制定无疑会推动电子文件管理元数据在我国电子文件管理中的运用。

(三)我国电子文件管理元数据在元数据标准化方面应注意:

第一,从我国文档案一体化的整个生命周期来看,电子文件管理元数据覆盖其各个阶段,因此,并不是制定一、二项电子文件管理元数据标准就可以解决的,而是需要一个标准体系,只有构筑起一个多维的我国电子文件管理元数据标准化系统才能全面、有效的、充分地使我国文档一体化建设出成效。

第二,从我国文档一体化的建设来看,需要大量有关电子文件管理元数据标准化方面的人才,但目前,这方面的培训、教育、研讨还很缺乏,由此,制约了我国文档一体化建设的进程,因此,加强我国关电子文件管理元数据标准化培训、教育与研讨已迫在眉睫。

标签:;  ;  ;  ;  ;  ;  

我国电子文档管理元数据研究现状分析及在文献集成应用中的思考_元数据论文
下载Doc文档

猜你喜欢