普适知识环境下数字图书馆知识空间构建研究_数字图书馆论文

泛在知识环境下数字图书馆知识空间构建研究,本文主要内容关键词为:知识论文,数字图书馆论文,环境论文,空间论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号:G250文献标识码:A文章编号:1007-7634(2008)07-0971-07

1 引言

现代信息环境变化的基础特征是网络化、数字化,数字信息资源的主流化、用户工作空间和交流空间的数字化,使数字图书馆赖以生存和发展的基础结构环境正面临着重要的转折。目前,美国正在从NII(National Information Infrastructure)向ACP (Advanced Cyberinfrastructure Program)[1]转变,其实质是从Web信息空间(Web 1.0)向语义Web知识空间(Web 2.0)的渐进与渐变(如图1所示[2])。

知识网络是数字图书馆发展的新阶段,也可称之为第二代数字图书馆,相对于传统的资源网络而言,其特点如表1所示[3]。

Cyberinfrastructure是指由网络设施、硬件、软件、信息资源、人等有机组成的新一代科技知识基础结构,是未来知识型社会的一种综合的全面的数字化信息基础设施,是通过计算、存储和通信方面的最大便利,使人、数据、信息、工具、设备等资源能够更为完全彻底地发挥作用而构建的一种普遍的、综合性的知识环境——泛在知识环境(Ubiquitous Knowledge Environment)[4]。

泛在知识环境的提出昭示了数字图书馆未来的发展路径——协同其它的信息服务机构,协同以“先进信息基础设施”、e-learning、e-research、e -science、e-government、e-business等为代表的知识基础设施,共同致力于实现创建泛在知识环境,成为普遍访问全人类知识的工具,促进人们对知识的理解、共享和利用[5]。

2 泛在知识环境下数字图书馆发展方向与发展战略

与传统知识环境不同,泛在知识环境是一个人人参与的信息共享环境。在泛在知识环境下,知识链(知识提供者→供应商→中间商→消费者)不再是单向、线性的,而是变成一个非常复杂的网状结构的信息网络(如图2所示)。从图2可以看出,在新的知识环境中,知识提供者有了更多发布、交流其研究成果的渠道。知识链中各种角色也表现为不固定和具有模糊性,各种角色是可以相互转化的[6]。每个人都是潜在的专家,都可能参与知识的发布和传递;每个人都可能成为出版者、在线的知识供应商、图书馆或一个信息系统。这使得知识链极为混乱和难以控制,知识出版和交流系统呈现出前所未有的低进入壁垒,这一产业的竞争的激烈程度也是空前的。

图2 泛在知识环境下的知识交流网络[7]

泛在知识环境下的知识链发生了根本的改变,数字图书馆在知识链中的重要中介作用正在发生变化,一方面正面临着所有与知识有关的潜在进入者(如搜索引擎、电子出版商等)的冲击和竞争;另一方面,这个复杂的信息网络也给数字图书馆开辟了更为广阔的发展空间。泛在知识环境的未来不是属于那些仅仅提供虚拟空间导航的人,也不属于那些堆积数据的人,而是那些帮助人们识别、掌握所有可获取知识的人。因此,数字图书馆面临着新的定位,数字图书馆的准确定位事关其可持续发展。

2004年,DELOS Network of Excellence for Digital Libraries在欧盟第六框架计划(FP6)的资助下,邀请数字图书馆研究领域25位著名专家,举办了DELOS第三次头脑风暴研讨会,进一步探讨数字图书馆的未来发展方向和发展战略,并产生了《数字图书馆未来研究方向》(Future Research Directions)报告[8]。报告对数字图书馆未来发展方向和发展战略进行重大调整。

2.1 关注数字图书馆的功能性和互操作环境

当前数字图书馆建设的主要困难在信息集成方面,必须解决异构性、分布性和自治性三大挑战。其中,异构性体现在三个方面:①平台异构,数字图书馆包含着不同的硬件平台、操作系统、通信协议和数据库管理系统;②信息源异构,数字图书馆拥有多种不同的信息源;③语义异构,使用相同的术语表示不同的概念,或使用不同的术语表示相同的概念。

桥接数字图书馆之间的异构性是信息集成面临的最大困难。而分布性主要是由于数字图书馆有三种信息源:①现有图书馆特种馆藏的数字化;②各种商用的联机电子出版物或数据库;③互联网上各种有用的文献信息资源。

将分布在Web上众多数字图书馆中的信息源进行无缝集成,是信息集成面临的一大挑战。另外,数字图书馆的高度自治性也是信息集成面临的一大挑战,数字图书馆馆藏资源和服务由各组织独立维护和管理,其访问原则、支付方式和认证等也由各组织自己决定[9]。未来的数字图书馆系统要体现以人为中心、以交流/协作为中心、基于通用技术的系统、最大限度的重复使用、全球分布式系统以及泛在性等特征。

2.2 对数字图书馆的概念框架进行调整

指出概念框架是由内容层(底层)、内容管理和功能层(中间层)和用户交互层(顶层)三个主要的层构成(参见图3)。当前数字图书馆建设的发展受到传统观念的影响,普遍是从内容开始向上构建,呈现出以内容为中心、以存储为中心、基于特定环境的系统、重复建设、并且是相互孤立的系统等特征(参见图4)。而未来的数字图书馆系统是从用户需求开始向下构建,每个系统都有相同的、通用的数字图书馆管理系统来实施它的基本的管理功能,并有专门的模块来实现其它的功能,并且所有的系统之间都是相互连接的,用户之间则可以通过这一网络系统进行交互和交流(参见图5)。

图3 数字图书馆系统

(引自:DELOS Future Research Directions,2004)

2.3 新技术在数字图书馆建设中的应用

未来的数字图书馆建设重视信息和知识的“语境”,结合网格技术、语义技术对知识、知识元之间的关系及其语境进行描述,关注知识创建、获取、传播、组织和利用的整个生命周期,最大限度地实现知识和信息的重复使用。

3 泛在知识环境下数字图书馆渐进与渐变的路径

泛在知识环境对DL未来发展目标的定位与战略调整的变化中,我们可以看出,目前,数字图书馆建设正在从信息构建(IA)向知识构建(KA)转变。从信息构建到知识构建,就其本源来说,则对应着从信息到知识的转化;就其管理机制来说,则对应着从信息管理到知识管理的发展;就其服务体制来说,则对应着从信息服务到知识服务的进化。在知识构建的理念下,数字图书馆建设更加重视用户需求的范畴分类和界面设计,使之更具个性化和可视化。在内容方面,重视知识与信息的转化、知识元的抽取与标引、基于知识元链接的知识网络的形成与应用、知识结构的学科分类与完整性,以及知识仓库和知识元数据库的建设与应用,从而为数字图书馆服务营造一个和谐的知识生态环境。

3.1 数字图书馆知识空间

知识构建是在传承信息构建精华后又吸收了知识管理理论而形成的。泛在知识环境下,DLs知识构建的主要任务是实现知识的有序和开放式流动,DLs知识构建越来越凸显出其空间特征,知识构建的空间意义越来越大。数字图书馆为终端用户提供开放存取环境下的信息共享空间已经成为现代图书馆发展的必然潮流。

从广义空间来看,信息机构、数字图书馆、网站、甚至个人等都是空间中的知识存储点,信息机构通过在社会、自然空间中搜集知识,建立知识系统;通过对知识集合的加工处理,构建知识存取点。知识实体在信息机构中被划分为不同部门的知识集合,把知识按一定的关系组合成逻辑系统。同时信息机构也是知识的集散地,它通过不断地向外部空间输出知识而实现知识分配功能。

从知识空间构建的视角看,我们可以把知识分为三个层次来研究:知识元、知识点、知识。这种层次划分来源于物质划分为三个层次:原子、分子、物质的思想。

(1)知识元是构成知识的最基本元素。它是独立的,即它的内涵具有相对确定的性质;但不是孤立的,即它们之间通过链接而相互关联;知识元的内涵由知识元的属性描述;知识元依据属性分类。

(2)知识点是知识空间的基本成份。在基于知识点的知识空间理论中自底向上看,知识点由知识元通过知识元链接构成,它是一个知识元网络;自上而下看,知识点是将知识按照一定的原则划分出来的知识块,它是构成知识的基本成份。知识点的划分原则依照领域不同而有别,在基于知识点的知识空间理论中,强调研究的知识点在知识意义上的相对独立性和知识结构上的完整性。对知识点的分类,可以是意义上的,也可以是结构上的。

(3)知识是知识空间中的一种复杂结构。知识是一个知识点集合,通过知识点之间的关系而连接成的一个复杂的结构,形成一个知识点网络。为了深入研究这个复杂的结构,引进知识组件来将结构复杂度降低。

数字图书馆知识组织的任务就是要在庞大的空间中方便用户利用。通信设施、网络等是联结空间中各知识点的路径,负责知识的传输。各种知识组织方法实质上就是在空间中建立知识结构和知识路径,实现对知识的控制,使知识的空间分布合理化,建立知识存取的空间秩序,实现快速存取知识的目标。

3.2 DLs知识构建的宏观空间与微观空间

DLs知识构建的宏观空间是指知识单元在电子空间中的秩序排列状态。在宏观空间中,传统DL信息构建的任务是实现知识分布的合理与有效,比如规划各种DLs的布局,以解决知识资源配置与共享的距离障碍,降低知识开发利用的成本。泛在知识环境下DLs知识构建则是要建立知识存取秩序,用人工控制和网格技术等支持构建电子知识空间,摆脱知识分布的自然状态,引导人们到知识空间中存取知识资源。

在宏观空间中,知识组织的目标是:合理分布空间中的知识点,实现知识资源的有效配置;建立宏观知识存取秩序与存取机制;通过空间集合实现对DLs知识资源的宏观控制。

数字图书馆知识构建的微观空间是指宏观空间中的各种形式(文本、音频、视频等)各种层次(数据、信息、知识元)的信息集合点,知识在DLs中以知识点、知识路标的形式实现了知识集合在空间中的分布秩序和存取秩序。

3.3 数字图书馆知识空间的特征

知识单元(最基本的知识单位)是空间中最基本的知识点,它不但构成数字图书馆空间中的点,其本身是知识空间的组成部分,而且是被空间化了。所谓空间化,是指知识单元本身以不同维度被元数据结构化处理之后,也具有了空间特征。这种空间特征表现在以下方面:①数字资源以知识本体、主题图等形式展示其各部分内容在数字图书馆中的空间位置。②在被描述的知识本体和其他元数据格式中,代表知识的各种特征被分割为不同部分,在数字图书馆系统中分属不同的意义(关系)空间,因而具有了空间向度。③最小单位的知识单元在被描述后也被空间化了,它们以链接的方式被不同空间所存取,在查询时构成一定的空间秩序;同时在知识组织时,知识单元被各种元数据和资源描述框架定位在某个空间,成为有序知识的一个位点。知识单元或知识片断的内容在微观空间中以不同的方式连接成有序系统,各种信息体(实体与虚拟体)形成了不同的物理空间(知识实体的分布空间)与逻辑空间(虚拟知识体的分布空间)。在微观空间中,数字图书馆知识构建的主要目标是:按知识的内在联系构建知识存取系统,使知识单元或片断组织化、系统化、集合化。用词语或其他符号合理(有意义或有效)地代表知识体,构建知识查询系统,建立基本的存取秩序,实现对知识体的有效控制。用编码方法实现知识体电子空间中的定位。

综上,我们不难得出如下结论:①DLs知识空间是物理空间的“影子”,是知识组织物理空间的虚化或镜像化(化物理知识体为数字知识体),因而是物理空间和知识实体的代表或个别体。②抹平了物理空间产生的距离鸿沟,因而也推倒了时间障碍(时间产生于信息位移的需要)。③跨越了微观空间、物理空间与宏观空间的藩篱,在电子环境中实现了知识组织的零时空特征,组织好的知识以最低成本、最快的速度传递给用户。④数字环境是知识组织各种方法、技术的集合体,它成功地把各种知识组织技术和方法汇聚在一起,成为知识组织技术创新的苗圃。所以数字空间在本质上使数字图书馆知识组织的空间特性意义更为重大,它使知识组织超越了时空阻碍,使空间在知识组织中具有更高的地位,使知识能够在电子环境中更自由地成族、显示或流动。泛在知识环境下数字图书馆知识构建的实质是在电子空间中把知识集合结构化,构建知识集合的各种路径,实现知识组织在空间中的有序集合。

3.4 数字图书馆知识空间的层次

根据在知识空间活动主体及行为的不同,我们可以将知识空间分为3个层次:——以个人知识生产、交换和消费为主体的微观知识空间;——以知识系统的生产、交换和消费为主体的中观知识空间;——以社会知识生产、交换和消费为主体的宏观知识空间。

就状态变化而言,存在着循环变化的因素,如就微观知识空间而言,个人知识生产者和消费者既有从未知到已知、从客观到主观知识的运动状态变化,也有从已知到未知、从主观到客观知识的运动状态变化(见表2)。

4 泛在知识环境下数字图书馆知识构建的空间方法

知识构建是在传承信息构建精华后又吸收了知识管理理论而形成的。从空间角度来看,知识构建是个不断优化知识秩序的过程,由于知识秩序总是低于用户需要的秩序,所有人工构建的知识系统,对用户来说总是一个陌生的空间秩序,需要了解与利用。

知识构建的困难始终是一个空间秩序问题。首先,传统数字图书馆服务的主要障碍是空间距离,在现代主要是空间混乱问题。所谓“空间混乱”,主要表现在随着信息技术的发展,用户面临的知识集合在空间分布上几乎是无限的,用各种语言和不同的方法建立的知识体系混乱庞杂,要全面利用现代的知识存量对用户来说是一个巨大的困难。其次,从用户角度来看,知识组织的空间问题始终是一般知识组织结构与用户特殊的知识需求之间的矛盾,知识提供的个性化始终是一个困难问题。因而知识构建的空间方法主要是空间规范、空间结构与空间路径。

4.1 空间规范方法

空间规范主要是指知识的描述与组织规范,它是知识组织的基础和依据。现代知识组织越来越依赖各种通用的知识描述组织框架,以便形成统一的知识处理格式,为知识识别、定位、选择与查询奠定基础。各种文献著录规则以及各种元数据对信息、知识组织与数据交换具有重要意义。知识空间规范的主要方法是把各种类型的资源特征一般化,以实体、属性、成份等形成知识点或检索点。一般知识资源可以据此形成规范的、简要的知识特征或知识结构,这种方法对知识定位与发现具有重要价值。所有的知识体(如文本、图像、声音等)都可以方便地形成规范的空间分布,网站、网页、文本之间及其内部,都构成了有序的知识点。

随着研究的日渐深入,未来一段时间对KOS的研究热点将呈现标准性、系统性以及效用可见性的特点,集中体现在标准、协议的研究与制定,知识组织系统登记注册,互操作以及应用研究上。

(1)知识组织体系描述标准。在网络环境和数字环境下遵循一定的标准规范构建、表示和应用知识组织体系,是实现知识组织体系互操作的重要保证。目前,针对术语表、分类表、叙词表、主题图、元数据、本体等不同的知识组织体系类型有适应各自特点的可参考遵循的描述标准规范。

(2)知识组织体系注册机制。知识组织体系注册机制的建立与实施,是知识组织体系互操作的有效方法。知识组织体系登记系统是对知识组织体系进行描述、组织,提供登记发布、检索识别、管理等功能,并支持开放环境下知识组织体系的转换、集成与复用。

在知识组织体系注册方面,国内外对元数据登记系统的研究与实践比较多,如DC元数据登记系统,但随着本体建设的发展,本体互操作成为新热点,越来越多的本体登记系统已出现,对本体登记注册的研究逐渐受到关注。

(3)知识组织体系映射机制。在不同知识组织体系之间建立映射机制,是实现不同知识组织体系集成、整合,进而实现互操作的一种方法。在多种知识组织体系并存的环境下,在不同的分类法、叙词表、元数据、本体之间建立映射与转换关系,有助于互操作的实现。国内外许多机构、学者正在进行相关的研究与实践。

4.2 空间结构方法

知识组织的目标是要把知识存在的无序空间转化为有序空间,即把自然状态的知识结构化,把难于查询的知识空间形成便于查询的知识空间。空间结构是知识序化的基本方法。因此,可以把所有人工构成的知识组织体系看作一种人工规范的、可以查询的空间结构。空间结构的方法很多,如图6所示。

图6 知识组织系统(KOS)空间结构一览

传统的分类法可以看作由等级关系形成的知识结构,它的空间结构特点是以学科体系为基础,把所有的知识点(以类目表示的检索点)以从属、并列、相关关系形成可以理解的层次结构,各种知识实体(以各种载体记录的知识内容)通过赋予代表其内容的号码而在空间中实现了定位,并与其他知识实体形成相应的关系结构。主题法以概念作为代表各个知识点的符号,以概念(主题题词)之间的形式关系为基础形成体系结构。各种知识实体通过词表赋予的词汇实现空间定位、识别。现代知识资源的快速流动要求各种资源交换更规范、更有可读性,所以一般的知识处理标准更重视资源的结构化特征。与传统方法相比,现代信息处理对知识的空间结构处理更深入、更科学,并不断地向智能化(结构自动生成)、语义化(语义网络结构)、知识本体结构化的方向发展。与传统的知识空间结构重视物理空间结构和宏观知识结构不同,现代知识结构更重视资源本身的结构化,各种电子文件、网页、多媒体信息的处理规范都旨在使资源内容结构化,以便实现以知识单元化为基础的知识组织。

(1)从词单到分类、聚类再到关系组织,三类系统对词汇的控制是从简到繁、由弱到强的控制过程,且词间的语义关系得到加强,最后组成语义网络;词单类侧重词义消歧和词义控制,分类、聚类侧重词汇等级关系的控制,关系组织类则侧重词间各类关系的控制。

(2)从自然语言向受控语言、从弱结构向强结构的延伸,体现了KOS在表示语言和结构上发展的双向性。为方便理解和掌握,表3对各类型KOS间的比较准则进行了总结[10]。

对知识组织体系发展产生最大影响的理念就是本体和语义Web。本体使知识组织体系从传统的树型结构向网状结构进化,为各类不同知识体系的结构和结合方式提供理论基础,很可能会极大促进信息/知识检索和导航功能的更新换代[11]。国外许多学术团体相继进行了利用现有叙词表转换建立本体的尝试,已经有十多种叙词表被用各种方法转换为本体2[1]。

在对叙词表向本体的转换中,学者们尝试了很多方法,最常用的转换方式就是基于本体描述语言RDF/RDF Schema。RDF是W3C推荐的一种Web资源描述语言,它提供了一种描述资源的通用的框架,使得信息可以在应用程序间交换并保持原来的语义。RDF本身没有提供专门的机制来描述属性及其关系,RDF Schema是RDF词汇描述语言,用来描述资源类之间以及类与属性之间的关系和约束。

RDF Schema定义了包括描述类之间关系的rdfs:Class和rdfs:subClassOf,描述特性的rdf:Property、rdfs:domain(定义域)、rdfs:range(值域)以及rdfs:subPropertyOf等等。采用RDF Schema语言所定义的词汇描述(schemas)也是合法的RDF图。国外已经开展应用RDF Schema进行本体转换的研究,一些具有代表性的项目包括:加州环境资源评估系统(CERES)和国家生物信息基础工程(NBII)联合开发一套基于RDF的集成的有关环境的叙词表和叙词网络工具;联合国粮农组织(FAO)利用RDFS将Agrovoc叙词表转换为农业本体;阿姆斯特丹大学的J.Wielinga等将艺术和建筑叙词表(AAT)转换为本体。从以上项目可以看出,RDF Schema作为一种本体描述语言在灵活性以及易用性方面适合表达传统的知识组织体系。

语义Web将改变传统互联网只是实现计算机硬件和网页的连接,而数据和信息资源零散分散在各个网站的情况,对信息进行解释、交换和处理,更关注网络结构和语言的设计,可使分布于全球的成千上万的独立数据库融合,最终使用户独立运用Internet上庞大的信息资源。这种知识组织体系是采用自下而上的方式形成的,与文本秩序中的组织体系是自上而下的方式不同。这种组织不是从整个知识领域入手,而是为专门的知识领域开始的,创建一个个较小的块,最终形成一个更大的、更综合的结构[1]。

语义Web技术的理论和实践研究日益为图书情报界所关注和热衷。在语义Web技术的驱动下,知识表达和知识组织从物理层次上的文献单元上升到认知层次的知识单元,从单纯的语法处理(主题法、分类法)转变为语义处理(如专家系统,语义网络表示法),从语义处理到模拟个体知识记忆结构的考虑语境的语用处理方式。从而使知识组织的理论和实践都发生巨大的变化,使其本身具有更大的发展空间和更强的生命力。特别是在知识组织的原则、方法和技术等方面语义Web技术必将显示出巨大的优势和强大的驱动作用,需要图书情报界给予持续关注和不断深入的研究。

总之,信息/知识流在空间的有序流动是数字图书馆知识组织的中心问题。研究数字图书馆知识组织的空间问题,从宏观世界与微观角度研究数字图书馆知识组织的空间顺序和路径,构建空间知识流的模式与方法,是数字图书馆信息/知识组织的主要任务。数字图书馆知识组织发展的趋势之一是要在空间中以知识本体(如Ontology)代表知识结构与关系,从而在电子空间中展示知识点及其关系结构模式,有效地组织、表达与重建知识关系,这将为数字图书馆知识组织开辟新的领域[11]。

5 结语

泛在计算环境的产生与发展,不仅仅是一场技术革命,更重要的是一场对人们思想和理念的变革。泛在知识环境下的数字图书馆将是无所不包并且融入到人们的日常生活中的一个社会知识库,它真正力量在于将成为“知识信息社会的动力发动机”。

泛在知识环境下的数字图书馆构建的是一个多语言、多媒体、移动的、语义的数字图书馆知识空间来存取人类知识,服务范围从信息服务转向知识服务,要以前所未有的规模和速度来推动知识进步。泛在知识环境必将对数字图书馆的未来发展产生深刻的影响,并为数字图书馆的未来发展创造新的机遇。

标签:;  ;  ;  ;  ;  ;  ;  

普适知识环境下数字图书馆知识空间构建研究_数字图书馆论文
下载Doc文档

猜你喜欢