档案异构数据库资源集成研究综述_异构数据库论文

档案异构数据库资源集成研究综述_异构数据库论文

档案异构数据库资源整合研究综述,本文主要内容关键词为:资源整合论文,异构论文,数据库论文,档案论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

在信息化条件下,实现最为广泛的信息资源社会共享是档案馆的根本目标,因此档案异构数据库资源整合是实现档案馆根本目标的具体体现。国内对档案异构数据库资源整合这一方面的研究还未完全开始深入研究,目前还没有相关研究的专著和书籍,主要是对档案资源整合的研究。对于从异构数据库这个角度来讨论档案资源整合还有待进一步研究。对于信息资源的整合,国内外的图书、情报部门已经研究得较为深入,而档案界对于档案异构数据库资源整合的研究才刚刚起步。本文通过中国期刊网数据库和万方硕博士论文数据库进行检索,对2000年~2009年图书、情报和档案有关档案信息整合研究进行调查统计分析,时间截至2009年8月10日,希望对于我国档案界对档案异构数据库资源整合起到抛砖引玉作用。

1 档案界对信息资源整合研究概况

本人采用的检索方法为首先是对中国期刊网数据库所收录的图书、情报和档案期刊有哪些进行统计。对于档案界期刊的检索,先以档案整合为关键词对篇名进行检索,时间设定也是在2000年~2009年,检索到总数有163条记录,再以每个年度再次进行统计;并且最后再对档案学核心期刊这10年的时间内所收录的论文进行逐一统计,下述表格一为统计结果。而对于图书情报界的检索采用先以刊名为一次检索进行精确检索,年度设定在2000年~2009年;然后再以篇名中包含“整合”二字对第一次检索的结果进行再次筛选,得到最后此刊名2000年~2009年有关资源整合的论文名称、作者、期数、期刊名称等内容。下面的表格二为图书馆和情报学期刊2000年~2009年所收录的有关资源整合论文的统计,其中此表格只包含检索结果在10条记录以上的,因为篇幅有限,所以10条记录以下的没有在此表格中体现出来。同时对于2009年的论文中国期刊网数据库也只收录上半年,下半年的材料尚未收录进去。

通过调查分析,我国档案界对档案信息资源整合主要集中在对档案信息资源整合基础理论、整合方法、整合措施、整合技术等方面的研究。对于档案,信息资源整合基础理论的研究主要集中在对档案资源整合的定义、基本原则、必要性、特点等方面的研究,具体包括以下几个方面:

1.1 档案信息资源整合基础理论研究

1.1.1 档案资源整合的定义与基本原则。对于档案资源整合的定义,档案界尚未形成明确的定义,何振与蒋冠在《档案学研究》2004年第4期发表的《试论电子政务环境下档案资源整合与共享的实现形式》一文中提出:所谓档案资源的整合与共享,就是指在兼顾档案资源现有配置与管理状况的条件下,通过网络建立统一的信息交换与共享平台,对分散异构的档案资源系统进行优化组合与无缝联结,在此基础上强化档案资源的联系性、动态性、可控性和开放性以及与社会其他信息资源的融合集成性,从而实现档案资源的合理组织和优化配置以及档案资源的充分利用和最大增值[1]。徐佳在《档案与建设》2005年第6期发表的《谈数字化条件下档案信息整合》一文中认为:档案信息整合,就是从海量的档案信息中,就某一专题或某一方面提取出相关信息,提供信息服务,以有效地实现信息资源的增值效益的工作[2]。戴志强在《档案学通讯》2003年第2期发表的《国家档案资源整合的涵义及其运作机制探讨》一文中提出:国家档案资源的整合,不仅是指一般意义上对国家和社会具有永久保存价值的档案的管理由分散到集中、由无序到有序的过程,而且主要是指在我国档案工作“统一领导、分级管理”的体制下,对国家和社会档案资源的有效配置,以适应经济全球化时代增强区域综合竞争力需要的一项社会系统工程[3]。仇壮丽等在《兰台世界》2005年第11期发表的《论电子政务环境下档案资源的整合》也对档案资源整合的定义进行了阐述,即“档案资源整合是档案资源优化组合的一种存在状态,即根据一定的需要,对各个相对独立的信息系统中的档案资源、功能结构及其互动关系进行融合、类聚和重组,重新结合为一个新的有机整合,形成一个效能更好、效率更高的新的资源系统”[4]。同时,对于档案资源整合主要从更广的角度来定义,提出在电子政务环境下,档案资源整合的对象应考虑与其他信息资源,例如图书、情报及其他部门的各种信息整合为一个更大的系统,并将其融合到电子政务信息系统中,作为政务信息系统的数据库基础。因此可以看出,大家对档案资源整合的定义虽各不一样,但是都离不开对资源进行集中有序化,实现其增值。对于档案资源整合的基本原则国内的档案学者较为统一,主要集中在坚持系统性、层次性、发展性、整体性、有效性与共享性等原则。

1.1.2 档案资源建设的现状及整合的必要性研究。由于档案异构数据库资源整合主要是在档案资源建设的前提条件下实施的,因此国内档案学者从档案资源建设的角度来探讨档案异构数据库资源整合的必要性。如徐瑞鸿在《兰台世界》2006年第17期发表的《档案信息资源整合研究》一文中阐述了档案信息资源的现状及整合的必要性[5];倪红在《北京档案》2004年第5期发表的《信息化在档案资源整合中的作用》阐述了档案资源整合的现状[6];郭建平在《兰台世界》2004年第2期发表的《我国档案信息资源的科学配置与逻辑整合》提出我国档案信息资源结构与布局的现状主要集中在结构的单一性、布局的分散性,并且提出解决问题的方法与措施,即对档案信息资源进行科学配置和逻辑整合[7]。张东华在《档案学通讯》2005年第3期发表的《网络环境下档案信息资源整合探讨》从网络环境下档案信息服务的角度探讨信息资源整合的必要性[8]。

1.1.3 档案资源整合的理论与实践依据。谭必勇和王新才在《档案学研究》2006年第4期发表的《国家档案资源整合与共享的控制机制探讨》提出“书目控制”是国家档案资源整合与共享控制机制的理论基础[9];何振、蒋冠在《档案学研究》2005年第4期发表的《国家档案资源整合与共享工程建设构想》提出国家档案资源整合与共享工程建设的理论依据为信息资源建设阶段向信息资源管理阶段的过渡;而实践依据为相关领域的信息化经验与档案部门的信息化状况,如图书馆、情报系统的资源整合与共享实践;同时还提出国家档案资源整合与共享工程建设的实践思路总体目标是充分利用现代化高新技术手段,国家骨干通讯网络系统,整合国内各级综合档案馆、专业档案馆以及部分企业档案机构的馆藏档案信息资源,建立一个基于互联网的档案信息共享与服务平台,实现全国档案资源的共建共享,充分开发档案信息资源,发挥档案的社会效益和经济效益,以满足国家、社会和大众日益增长的档案信息需求[10]。

1.2 信息化与档案资源整合的关系问题

秦美峰在《兰台世界》2008年第15期发表的《加强信息化建设,整合档案资源》一文中提到:信息化建设为档案资源整合提供了有效平台;信息化建设促进档案资源优化整合表现在建立各具特色的数据库:建立高效的档案检索系统,提高信息服务质量;建立档案信息标准化体系;加强档案信息网站建设[11];倪丽娟在《中国档案》2005年第10期发表的《档案信息资源的整合与信息化》一文中提出档案信息资源整合与信息化对策有:思想观念的转变是实现档案信息资源整合与信息化的前提;在市政当局统一协调下,与城市基础设施建设部门、信息技术开发部门、网络公司合作,开展档案信息资源数字化工程[12]。倪红在《北京档案》2004年第5期发表的《信息化在档案资源整合中的作用》一文中提到信息化建设应积极参与档案资源整合,如,通过建立各具特色的数据库,建立高效的档案检索系统;建立档案信息标准化体系;加强档案信息网络建设等方面[13]。徐佳在《档案与建设》2005年第6期发表的《谈数字化条件下档案信息整合》提出数字化对档案信息整合的深刻影响主要表现在数字化带来了档案信息服务的多元化;数字化促进了信息整合方式的智能化[14]。

1.3 档案资源整合的措施

对于如何实现档案资源的整合,国内档案界展开了激烈的讨论,主要观点体现在以下几个方面:

1.3.1 从实现档案、图书、情报资源的一体化整合的角度来描述档案资源整合的措施。如胡建光、杨宏伟在《科协论坛》(下半月)2007年第4期发表的《网络环境下档案信息资源整合的实现形式研究》一文中提出网络环境下档案信息资源整合的实现形式主要包括建立档案室文件档案信息资源管理系统、档案馆档案信息资源管理系统及信息中心图书、档案、情报信息资源管理系统[15]。徐佳在《档案与建设》2005年第6期中《谈数字化条件下的档案信息整合》一文中提出数字化条件下档案信息整合的方式主要有档案馆自身的信息整合、馆际之间的信息整合、档案部门与其他部门之间的信息整合[16]。

1.3.2 从馆藏资源整合入手研究档案资源的整合。如徐瑞鸿在《兰台世界》2006年第17期发表的《档案信息资源整合研究》一文中认为档案信息资源整合的措施应包括微观整合和宏观整合两个方面,其中微观整合主要是通过基础性整理与研究性整理来实现,而宏观整合包括制定相关的法律法规;加强档案各个部门的合作,建立互动多赢的机制;注重数字化建设;宣传档案信息资源等[17]。

1.3.3 从档案管理制度进行改革入手研究档案资源整合。许兆来在《北京档案》2007年第3期发表的《变革恒久,应对恒艰——对档案资源整合的思考》一文中提出不仅需要对原有的管理思想技术手段进行变革,更需要设计出灵活务实的档案资源整合战略方案;纵观目前档案资源整合的内部与外部环境,应以科技强档为支撑,以建立档案信息资源中心为抓手,以整合档案信息资源为突破口,方能在档案管理模式上实现新的突破(首先,档案资源整合的核心是聚集量广质高的档案信息资源,使之能被社会共享,实现档案资源向档案资本的转变;其次,整合档案信息资源的理念广泛深入人心,不仅成为社会共识,且成为档案界正在践行的目标;再次,科技的发展尤其是虚拟整理技术与数字化技术的应用,为档案信息资源整合与共享提供了技术上的保障)。[18]

1.3.4 从建立国家档案信息中心研究入手。如何振、蒋冠在《档案学研究》2005年第4期发表的《国家档案资源整合与共享工程建设构想》一文中提出:建立由国家中心、省级分中心、基层中心组成的整合与共享体系;构建技术平台;建设与整合数字资源;实施策略为:充分认识实施国家档案资源整合与共享工程的重要意义;加强合作,充分调动各方面的积极因素;科学论证,统筹规划,统一标准;积极创造条件,试点推广[19]。谭必勇、王新才在《档案管理》2007年第1期发表的《国家档案资源整合与共享的控制机制探讨》一文中认为:全国档案文件目录中心是国家档案资源整合与共享控制机制的核心机构,并且对建立全国档案文件目录中心的可行性进行了详细的分析[20]。

1.4 档案资源整合的方法

张东华在《档案学通讯》2005年第3期发表的《网络环境下档案信息资源整合探讨》一文中提出网络环境下档案信息资源整合的方法有分类法、主题法、数据库法。整合的步骤:首先是对本馆信息资源实施集成化组织与整合,逐步实现馆内信息资源跨类型、跨载体、跨时空的信息检索和利用模式;其次是在各馆信息资源整合与集成的基础上,实施档案信息资源的整体化组织与建设,形成信息资源分布式存储与管理、集成化“一站式”信息检索与利用格局;再次是进行档案信息资源的深层次开发和知识挖掘,使档案信息资源的组织与管理从形式组织转至内容组织、知识组织的发展方向。网络环境下档案信息资源整合应采取的措施:一是提高认识,重新定位,强化馆内资源整合与集成意识;二是统筹规划,相互协调,树立档案馆整体化理念;三是制定并推行相关标准,围绕标准化来推进档案信息资源整合;四是健全并完善信息立法,注重信息资源的知识产权保护,为档案信息资源整合提供法律保障[21]。

1.5 档案资源整合的技术

杨勇在万方硕博士中国学位论文全文数据库发表的硕士论文《档案网络信息资源的整合研究》一文中对档案资源整合中涉及的技术进行了描述,提出对于数据的整合采用数据仓库技术和中间件技术来整合;同时还提出数据存储技术采用元数据技术、都柏林核心元素集、XML技术;同时数据库技术主要有WEB数据库技术、基于WEB数据挖掘技术、搜索引擎技术、指引库技术、WEB信息抽取与整合技术。同时上海市档案局的陶碧云在《档案与建设》2006年第9期发表的《档案异构数据库与网格技术》一文中提出采用先进的网格技术来实现对档案异构数据库资源整合操作[22]。

2 档案与图书情报界有关资源整合的研究比较分析

对于信息资源的整合研究,图书、情报和档案界都对此做了研究。从调查统计表格分析可以看到,档案界对异构数据库资源整合的研究与图书情报界有关信息资源整合的研究存在着共同之处,同时也存在差别。

2.1 共同特征

首先,不论是图书情报界还是档案学界,对于信息资源整合的研究都呈现逐年递增的态势,而且研究的高峰期集中在自2005年以来。其次,通过调查分析发现,学者对于档案信息资源整合的研究,其目的都在于有着共同的目标,即实现信息资源的社会共享。再次,图书情报档案界有关信息资源整合的研究主要是从整合的基础理论入手,如对信息资源整合的定义、基本原则、必要性、理论基础的研究,进而从技术和方法方面来研究,提出具体的措施。

2.2 不同之处

档案学界与图书情报界有关资源整合研究的不同之处主要体现在:

首先,研究的起始时间存在差异,对于图书情报界有关信息资源整合的研究起步较早,国内图书情报界对异构数据库资源的整合研究于2000年开始,同时研究力量也较为雄厚,而档案界,在起点上与图书情报界相差甚多,同时研究力量存在很大的差距。档案界对信息资源整合的研究主要代表为何振、蒋冠、陶碧云等人。对于档案异构数据库资源整合的研究在档案界尚未引起档案界学者专家的高度重视。这些人对档案异构数据库资源整合的研究还处于起步摸索阶段。

其次,在对档案异构数据库资源整合研究内容上存在着差异,图书情报部门现在主要集中在对整合技术和整合系统的分析比较、整合层次和整合模式的研究。如提出整合的层次有三个方面,即数据层、中间层和表现层。在整合的方法技术上,目前国内图书馆对异构数据库整合的研究主要集中在采用数据库技术、数据仓库技术、数据挖掘技术、超级链接技术等研究。整合技术:元搜索技术;元搜索引擎;中间件技术。而档案学对于整合所涉及的技术研究还不够激烈,而对于整合系统的研究更是少数。

最后,体现在对信息资源整合的研究程度上,目前图书情报部门已开始研究基于服务的异构数据库资源整合,不仅对异构数据库进行资源整合,同时根据用户的需求提供用户个性化服务的整合系统服务平台研究也开始起步,提出基于知识管理的异构数据库整合,将来的整合已上升到知识层面,而不仅仅停留在信息层面。而档案界则才开始集中研究整合技术和模式,这与图书情报界存在较大的差距。

3 我国档案异构数据库资源整合研究的方向

通过上述调查统计分析,并且与图书情报界进行了比较,发现我国对档案异构数据库资源整合研究还需要进一步加强。笔者认为可以从以下几个方面来实行:

3.1 研究档案异构数据整合与共享的基础理论

进一步研究和分析档案异构数据整合与共享的相关定义、原则、必要性、层次、模型,形成适合我国各级档案馆的异构数据整合与共享的基础理论体系。研究和分析档案异构数据整合及其在档案信息资源共享平台上的利用实现中应注意的问题,如从异构数据整合的安全性及保密性、重视知识产权和版权的保护等角度加以不断深入研究,并从而提出异构档案数据整合的范围。加强研究档案异构数据整合与在档案信息资源共享平台上利用实现的可行性方式方法。

3.2 研究档案异构数据整合与共享的方法技术

分析比较国内外应用较多的信息资源整合系统的特点及功能,探讨一套适合我国各级档案馆的异构数据整合系统的评价与选择标准。研究分析国外档案界对异构数据整合的成功经验,对其整合系统功能进行比较研究,同时借鉴图书馆学、情报学界的研究成果,结合计算机技术、网络技术等学科分析研究数据仓库技术、数据挖掘技术、元数据技术等在整合各级国家档案馆异构数据中的应用,利用XML技术来实现与异构数据库之间数据的交换与集成,形成一套对异构数据整合的评价标准体系,构建档案信息资源共享平台。同时时刻关注计算机高新技术的进展,将其与档案异构数据库资源整合结合在一起加以研究分析,给我国档案异构数据库资源整合提供新的思路与方法。

3.3 研究档案异构数据整合实践经验

通过对我国各级国家档案馆异构数据库资源整合实践的研究,介绍整合方法及整合技术应用,分析其实践方面的经验和不足之处,借鉴其他单位或图书情报部门的相关经验,结合相关技术对其提出改进的意见。同时根据用户需求变化以及信息化不断发展变化的趋势对各级国家档案馆异构数据库资源整合的经验加以思考,提出适合新时期和用户需求的整合系统平台。同时还可根据实践经验提出自己的设想,如上海市档案局在对档案异构数据库资源进行整合的研究中,提出采用网格技术来实现资源整合。通过实践经验分析,形成自己特有的想法,这对于今后我国档案异构数据库资源整合研究具有重要的参考价值。

4 结束语

本文通过调查分析我国目前对档案异构数据库资源整合的研究主要集中在对信息资源整合的研究,并且主要集中在对整合基础理论的研究。通过与图书情报界有关资源整合研究进行分析比较指出我国档案界存在的差距,提出今后研究的具体思路及方向。希望通过档案学者们对异构数据库资源整合的研究能在一定程度上解决我国档案数据库异构问题,为数据库互访提供思路,使得资源社会共享指日可待。

来稿日期:2009-08-09

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

档案异构数据库资源集成研究综述_异构数据库论文
下载Doc文档

猜你喜欢