基于内容管理的文献网络建设_档案管理系统论文

基于内容管理思想的文档网络构建,本文主要内容关键词为:管理思想论文,文档论文,内容论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

在文件档案信息化进程中,无不与社会进步息息相关,伴随着一系列现代管理思想和技术的借鉴和应用,档案现代化管理随社会发展不断深化与加强。

80年代档案计算机管理起步时期,成功运用办公自动化、标准化、一体化、程序化等管理思想和技术,建立了以数据库信息存取为中心的MIS(Management Information System管理信息系统)系统,提高了文件档案的管理水平,引发了文件档案载体形态和管理工作流程的一场革命,或者称为以文件档案业务处理自动化为主旋律的OA(Office Automation办公自动化)革命;这一阶段的遗留问题是“信息孤岛”。

90年代档案信息化起步,文件与档案管理由形式向内容延伸,成功地运用了网络技术、知识管理、信息资源管理、信息构建等管理思想和技术,建立了基于数字媒体信息存取为中心的NMIS(Network Management Information System网络管理信息系统)系统,进一步深化了文件档案管理,引发了文件档案管理知识形态和信息流程的一场革命,或者称为以文件档案管理网络化为主旋律的IS(Information Shard信息共享)革命,这一阶段为DA(Digital Archives数字档案馆)建设打下了坚实的基础,但遗留问题是“信息异构”。

21世纪档案信息化深入开展,需要解决异构和非结构化的文件档案管理问题,建立以数字信息资源管理为中心的数字档案馆管理系统DAMS(Digital Archives Management System),其中内容管理思想是解决方案中的一个重要方面。

1 内容管理思想

1.1 内容管理思想起源于信息异构和非结构化产生的信息共享危机

内容管理思想产生了非结构化和异构信息的迅速增长所带来的一系列问题。有人将可共享的信息看成是“冰山一角”,即信息共享革命只实现了极少一部分的信息资源的共享利用问题,而大部分的信息由于组织形式的不同而无法共享,而这部分信息往往是价值很高的信息。

信息异构是相对于信息同构而言的,简单地说就是信息表示和揭示上的差异,或信息类型的不同。无差异的信息表示和揭示为同购,否则为异构。

信息异构通常表现为信息格式异构、信息平台异构、信息环境异构、存取模式异构等。我们知道,计算机硬件不同,会产生兼容性故障;操作系统不同,会产生通信障碍;标准和协议不同会产生信息解释和传递失真;信息编码格式不同,会产生信息呈现与编辑错误;信息语义不同,会产生概念冲突;信息约束的不同,会导致信息完整性缺陷等等。

信息异构的情形比较复杂,常伴随着背景信息、信息元数据、信息访问权限等一系列问题,而许多信息系统供应商经常提出的跨平台、无缝对接、数据兼容、支持多种数据格式、信息系统集成等承诺就是针对信息异构现象提出的。信息异构现象不但制约了信息的存储与获取,阻碍了信息的正确利用,还严重地影响了信息处理的效率。

如果说信息异构是信息之间存在差异的话。非结构化信息是信息自身的差异问题。非结构化信息通常是指难以用以关系型为主的数据库进行管理的信息,即关系型信息或行信息,反之则为结构化信息。下列类型的信息都是非结构化信息:直读载体记录的信息如信件、邮件、传真、原始凭证、会议记录、公文等;数字载体信息如电子表格、字处理文档、演示文稿、文本、图形、图像、音频、视频等大对象信息;模拟载体信息如影片、照片、录音和录像等。

虽然技术进步解决了网络通讯技术上的“信息孤岛”和“信息共享”问题,但是,异构和非结构现象的存在,导致了信息内容上的孤岛和冰山现象,即网络的互联解决了同构化和结构化信息的共享难题,但对占信息量绝大多数的异构化和非结构化信息共享问题的处理却不仅完善。

上述现象引发的信息资源共享与利用问题也有一些解决方案,如对异构信息,传统的做法中常用直接硬件协议支持、多协议枚举支持和多协议中间件支持等技术措施;对非结构化信息,传统的做法是利用数字化技术,建立以数据库存取为中心的,以链接存取、数据库大二进制数据存取等手段为辅的技术措施等。但是,这些方案只能局部解决问题,还需寻找一种根本性的解决方案,内容管理思想就是在这种情况下提出来的。

对档案信息化和数字档案馆建设来说,也必然面临这样的问题,为了提高电子文件和电子档案管理水平和效率,在档案信息化建设中,必须关注内容管理的方法和技术,以提高信息化建设的效率和质量。

1.2 内容管理的概念

内容管理CM(Content Mangement)的内容(Content)主要指被处理对象的含义,内容管理就是基于被处理对象含义的管理。这个基于内容的被处理对象包括数据对象(Data)、文档对象(Document)、多媒体对象(Multimedia)、程序对象(Information)和知识对象(Knowledge)等等。

数据是传统关系数据库管理系统处理的对象,是结构化的信息,当该对象经过一系列附加信息如结构、属性、取值、操作范网和相互关系等加以约束时,数据就具有了特定的含义,也就是说数据有了对内容的表达。可以看出,数据是内容管理的基础。

除数据对象外,其余的被处理对象都是非结构化的信息。这些对象只有附加了元数据(Netadata)和背景数据(Background Data)等描述、规则和约束时,才能作为内容加以管理。

知识对象应当是内容管理的高级对象,它除包含附加规则的信息外,还具有回答特定问题的功能,是应用中最受欢迎的要素。因此,对知识对象的管理是内容管理的高级形式。这个意义上讲,内容管理具有低级到高级的渐进过程,即有数据管理到信息管理,进而发展到知识管理。

从上述分析可以看出,内容管理应当是注重信息含义的管理,它忽略了信息载体因素,更多地考虑了数据和信息的意义和语义,因此其管理过程应当包括直读载体信息到机读载体信息全过程的管理。

从技术层面上看,内容管理是一种思想或策略,由于对复杂的异构和非结构化信息不能仅依靠单一的独创技术手段解决,因此,内容管理必然是许多先进技术集成和一体化应用的规则。

1.3 内容管理的应用范围

内容管理重点解决的是异构的和非结构化的信息的网络管理问题,它的应用范围一般有如下三个方面:

1.3.1 网站内容管理:是面向内容的网站建设与管理,实现网站信息的生成、更新、发布和管理并实现网络办公、业务处理等系统的集成和一体化。

1.3.2 专用内容管理:针对特定应用的管理。如基于内容的信息检索系统、数字图书馆和数字档案馆系统等。

1.3.3 通用内容管理:通用内容管理注重非结构化信息平台的开发和建设,比较全面地完成管理活动对内容管理的要求。这类应用往往是企业内容管理和行业内容管理。

2 基于内容管理思想的文档网络构建原则

传统的文档网络是面向网络文档信息收集和利用的后台数据库与前台管理系统的集成,其实质是面向数据的网络管理系统。依据内容管理思想,文档网络的构建原则有如下几方面:

2.1 异构信息整合原则

文档网络建设过程中,首先保证异构信息的同一化处理。即对载体异构、格式异构、系统异构、环境异构等异构信息进行整合处理。如不同的载体形态信息的数字化处理、建立多种文档和媒体格式的支持平台等。在此基础上,建立统一的非结构化信息的存取和传递系统,实现信息内容的集成。

2.2 主辅信息同步原则

内容管理要求待处理的信息对象连同其附加信息构建在统一的系统平台上,实现信息收集、处理、描述、传递和利用的同步性。例如,一份文件数字化后不是内容,只能是一种信息,只有对其进行著录和标引后才能表达其身份,才能区别于其他文件并具有利用的价值。著录和标引的信息应当是文件的属性信息,是一种元数据。元数据以外,文件对象还有背景数据及其他权限之类的附加标志,相互间共同构成辅助信息。只有主信息和辅助信息同步表述,文件对象才具有含义上的完整性,才能作为内容管理的元素。

在内容管理中,辅信息为计算机提供信息对象的多重检索入口、存取地址、处理标志、关联属性等附加信息,为内容管理系统提供导航。主辅信息同步是内容管理的重要原则和技术思想,可以指导相关应用系统在数字对象,尤其是非结构化的大二进制对象描述、存取和利用上的一致性、完整性和高效访问性。

2.3 技术协同应用原则

内容管理要求技术集成应用。基于内容管理系统的文档网络不但要求现有业务管理系统、数据库管理系统、操作系统、开发平台的有机结合,还必须利用各种WEB技术实现程序与数据之间的调用与交换。

目前,能满足这一要求的应用技术有JAVA技术、内容存取技术、Oracle数据库管理技术、XML技术、工作流管理技术、文件分类技术、数据检索技术、内容挖掘技术、智能关联技术、组件技术、Web Services技术利中间件技术等。

另外,基于内容管理的文档网络构建是集人、管理、技术于一体的系统工程,强调的是集成的有机性和应用的一体化。

2.4 存取和传输标准化

内容存取和传输涉及文件语种、数据转换、全文检索、自然语言等方面的问题,这些问题需要制定统一的标准才能得到有效的解决。这里需要说明一点的是,在文档网络的构建中建立基于XML可扩展标记语言的文档内容管理标准是一条可行方案。

2.5 业务内容控制原则

在基于内容管理思想的文档网络应用系统中,文件收发、归档和档案业务处理过程也必须是内容管理模式。从系统应用角度出发,无论是电子文件管理系统还是数字档案馆系统都必须具有业务处理功能,而且业务处理过程产生的信息、对信息的处理都应当是内容管理标准所要求的。也就是说,文档网络的业务处理和控制也必须是基于内容的控制。例如,基于内容管理的数字档案馆系统中,业务人员要对检索到的文件进行加工,可以利用系统提供的管理功能进行业务处理,处理的结果自然符合内容管理的要求。

2.6 充分共享传递原则

充分共享传递原则是基于内容管理思想的文档网络系统的目的之一。大量的非结构化信息可以通过网络的信息发布功能、信息检索功能为用户获取和利用。在文档网络构建中,要遵循信息充分共享传递原则,只有这样才能最大限度地发挥文件和档案的作用,实现档案信息资源的价值。

3 基于内容管理思想的文档网络系统框架

基于内容管理思想的文档网络系统是不同类型信息统一存储、管理、综合检索、发布的系统平台。系统构建包括信息网站构建和数字文件档案管理系统构建两大部分。两部分共同完成如下功能:电子文件处理和归档功能、文件与档案数字化功能、文档著录标引和统计功能、电子文件与档案收集功能、多媒体信息采集存取功能、数字档案信息安全存储功能、数字档案信息加工处理功能、文件档案信息网络发布检索与利用功能。

3.1 基本流程

传统的文档网络管理是基于文件档案收集、加工、管理和利用的流程。基于内容管理思想的文档网络并没有改变这种流程,只是在管理环节加上了内容管理的平台,如下图1所示。

图1 基于内容管理的文档管理流程

文档网络构建中,将传统的管理业务环节提升为内容管理过程,是基于内容管理思想的文档网络管理的重要特点,也是与传统管理的区别所在。文档网络内容管理流程应当包括文档内容构建、文档内容整合、文档内容控制、文档内容存取四个阶段,为以电子文件和电子档案资源为基础的网络知识管理打下良好的应用基础。

3.2 基于内容管理思想的文档网络框架

基于内容管理思想的文档网络构建的实质是以内容管理为核心的文件档案网络管理方案。基于内容管理思想的文档网络构建的基本框架如图2所示。图2中,文档内容管理平台是一个应用平台,通过这个平台实现文档网络的内部业务管理、外部信息收集、信息发布和利用。而内容管理平台又是建立在底层硬件和软件平台之上的,这是实现内容管理的技术集成和应用的必备条件。系统构架中,通过文件档案处理的八个功能集成应用和通过外部信息环境的信息交换,实现文件档案内容的异构信息整合、主辅信息同步、技术协同应用、存取和传输标准化、业务内容控制和信息的充分共享传递等要求。

图2 基于内容管理思想的文档网络框架

对于文档内容管理平台本身的构建,档案信息化领域的研究还不多见,因此,该平台的技术和管理层面理论和实践问题还需进行深入的研究。根据企业内容管理的研究成果,文档网络内容管理流程包括文档内容构建、文档内容整合,文档内容控制、文档内容存取四个阶段,而建成的文档内容管理平台则应具有文档内容获取、辅助信息处理、文档内容存储、内容挖掘、文档内容传输和内容操作等功能。

就内容管理的应用情况来看,内容管理在电子政务、电子商务和数字图书馆等领域已经有比较成功的应用,但在档案信息化中的直接应用还没有出现。

应当说,基于内容的文档网络管理思想有一个从低级到高级的发展过程。就已经建成和正在建设中的数字档案馆工程项目而言,人们在数字化信息采集、多媒体信息处理、文档存储管理、信息数据库建设、管理系统开发和档案信息网站构建等环节的实施过程中已经自觉或不自觉地运用了内容管理的思想,这是文档内容管理应用的初级形式。但是,基于内容管理的文档网络构建还没有形成完整的思想和方法体系,这种情况下,数字档案馆建设则是仁者见仁智者见智,其建设水平很难有大幅度的提高,也不能保证档案信息化建设的整体上的协调性和一致性。

值得欣慰的是,一些数字档案馆软件供应商已经开始内容管理思想的应用尝试,并将其作为数字档案馆系统产品的功能优势加以宣传和推荐,这无疑是个非常好的开端。但愿基于内容管理思想的文件档案网络应用能得到更多的关注和研究,研究成果如能及时应用于档案信息化建设工作中,对提高档案信息化建设的质量和效率,充分实现文件档案信息网络的价值和发挥其作用将具有十分重要的意义。

标签:;  ;  ;  ;  ;  

基于内容管理的文献网络建设_档案管理系统论文
下载Doc文档

猜你喜欢