信息资源管理技术革命--信息网格_信息资源管理论文

信息资源管理技术的革命——信息网格,本文主要内容关键词为:网格论文,信息资源论文,技术论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

上个世纪席卷全球的以互联网技术为代表的信息技术给信息资源的管理带来革命性的变化。人们在享受因信息技术带来的方便和快捷的同时,互联网技术的缺陷逐渐显露出来,互联网技术最被信息用户诟病之处是所谓“信息孤岛”效应。这种状况是与因特网技术本身的技术特征有关系的。我们知道因特网是一个分散管理的结构体系,任何符合条件的个人或团体都可以在上面建设网站、发布信息,这就与因特网本身的机构体系发生矛盾,网上信息的混乱就不可避免,其结果便是产生无数的信息垃圾。尽管随着搜索引擎技术的不断发展,在信息搜索这方面有所改善,但是对于作为信息资源管理技术核心的信息组织仍是没有实质进展。随着一个新名词的出现使人们看到了转机——这就是网格(Grid,又称Great Global Grid)技术的出现。网格是构筑在互联网上的一组新兴技术,它将高速互联网、高性能计算机、大型数据库、传感器、远程设备等融为一体,实现计算资源、存储资源、信息资源、知识资源等的全面共享,消除信息孤岛和资源孤岛[1]。早期的互联网实现了计算机硬件等物理设备的连通;随着HTIP协议和WWW的使用,互联网实现了网页信息之间的联通;而网格则更进一步,它试图实现互联网上所有资源的全面联通,以便在动态变化的多个虚拟机构间共享资源和协同解决问题。

网格技术早在互联网技术风靡全球之时就已浮现出来,欧美各大国特别是信息技术第一大国美国更是投入巨资进行相关技术的研究,据有关媒体报道美国国防部准备投入300亿美元,IBM公司准备投入100亿美元进行研究。但是与网格技术带来的收益相比,这点投入只能算九牛一毛——据美国《福布斯》杂志预测,网格技术将在2005年左右出现一个高峰,推动信息产业市场的持续高速发展,在2020年将产生一个年产值为20万亿美元的大工业。由于各国信息技术水平的差异及对于信息技术在国民经济中所扮演角色的不同,对于网格技术研究的侧重点也有所差异,如图1所示。

图1 网格的研究侧重点分类

欧洲侧重于计算和数据网格(Data Grid)的研究和使用,美国则从全方位研究网格的同时对于网格技术在国防军事方面的应用异常重视。我国对于网格技术的研究也是与国家实际需要相结合的,即主要侧重于信息网格(Information Grid)的研究。

1 信息网格的概念和特点

所谓信息网格就是用网格技术实现信息的共享、管理和提供信息服务的系统,主要解决广域分布、异构信息源的互连和互操作问题,以满足企业、政府部门等组织信息共享的需求[2]。信息网格就是要利用现有的网络基础设施、协议规范、Web和数据库技术,为用户提供一体化的智能信息平台,其目标是创建一种架构在操作系统和Web之上的基于互联网的新一代信息平台和软件基础设施。按照这个设想,在使用互联网时所碰到的困扰,将迎刃而解。在信息网格中,对信息资源的管理首先是分布式、协作式和智能化的,这将从根本上克服互联网因分散管理所带来的缺陷;其次,在信息网格中,信息用户将通过单一人口访问所有信息,这与互联网环境下,用户必须面对上千万个网站而束手无策的情况形成鲜明对比。信息网格追求的最终目标是能够做到服务点播(Service On Demand)和一步到位的服务(One Click Is Enough)。

根据我国信息技术水平的实际,信息网格的研究重点主要侧重于以下几个方面[3]:

1)体系结构。信息系统从刚开始的简单的DOS平台界面,发展到C/S,最后是B/S/S,每一次的改变都是对信息系统构建及信息资源管理技术的革命。为了重用业务处理逻辑和界面表示逻辑,提高系统的伸缩性,现在的体系结构已逐渐向N层结构发展,包括客户端的显示、服务端的表示逻辑、服务端的处理逻辑、后台数据库系统等。支撑信息网格的协议从顶层的统一服务互操作协议直到UDDI、SOAP、XML、HTTP,组成了一个从上至下的多层次协议栈,各层次协作服务实现了跨越Web的信息分布和集成应用程序逻辑。这些技术是实现网格信息完全联通的物理基础。目前,信息网格体系结构研究的重点是底层的信息存储、表示、对外发布、呈现给用户的各层应用程序逻辑具体分层、实现和集成以及各中间层的数据存储、接口界面、通信机制等方面。

2)信息的表示和元信息。信息的表示体现在两个方面:其一是将信息存储于数据库或其他存储介质中的表示;其二是将其呈现给用户时的界面表示。信息网格是应用层的软件基础设施,各行各业都有将该行业的数据信息发布到网格上的需要,因此出现在信息网格上的信息种类是多种多样的,包括结构化、半结构化和非结构化的数据,如何将它们映射成数据库或其他存储机制(比如文件系统)的数据实体是信息网格要解决的首要问题。元信息抽象化了对数据对象的描述,使得各种信息可以通过元素属性与值之间的关系对来表达。我们将这种元信息叫做数据表示的中间层。一般来说,数据的表示可以建立多个中间层,在各个应用程序逻辑层中都有相应的数据中间层。XML实现了Web文件的内容和数据表示形式的分离,是一种有效的数据页面表示和描述语言。XML与元信息的结合将使界面表示和数据存储统一起来。

3)信息的联通性。信息的联通性是相对于信息“孤岛”而言的。“信息孤岛”是指将信息像倾倒垃圾一样简单地堆放在网上,信息用户在查找信息时只能通过搜索引擎或直接访问信息网站来进行查询,但是相对数以千万计的网站和几十亿的Web网页,无论多么强大的搜索引擎都不可能将信息一网打尽。对于信息用户而言,网上的信息仍是被孤立地保存在各个网站数据库中。而信息的联通性是把有一定关系(包括语义和逻辑)的数据从逻辑上连接在一起,在不考虑安全限制的前提下,从一个信息源可以到达联通的其他任何信息源。虽然这些信息可能存储在不同的位置,但对访问者来说,它们就像是存储在同一位置,访问者不必关心它们的实际存储位置。要真正解决信息的联通性,信息网格必须解决与信息表示和用户个性化密切相关的信息联通性模型的定义与实现问题。

4)信息网格的智能化特性。从信息存储到用户的浏览服务,信息网格纵向地为用户提供集成一体的方案。它不需要程序员进行二次开发,只需要管理员做简单的配置,就可建立服务平台。信息网格的智能化特性关系到用户是否接受的问题,也是其生命力的体现。智能化包括使用方便、界面一致、“主动”特性、用户输入和操作最少、平台的灵活性和柔性特征以及方便的个性化服务。

5)安全技术。信息网格的目标是将网上提供信息服务的站点连接在一起,让所有用户都可以享受这些信息服务。另一方面,这些站点又可能分属于不同的组织机构,各组织机构可以独立地管理属于自己的网络节点。在实际应用中,信息网格必须为站点管理者提供访问控制等安全管理机制,管理者可以自由地决定可以共享哪些信息、共享给谁和不能共享哪些信息。当然,这种权限控制必须是易维护且独立于数据源本身,同时应该在逻辑上提供不同的安全管理层次和控制粒度(控制粒度是指被控制对象具有更多可供控制的细节和方面,控制者具有更多的控制选择)。

显然,如果上述重要技术得以实现,信息网格将从根本上改善现有信息资源管理技术落后于信息用户期望的现状。

2 信息网格的体系结构

我国2002年“863”计划所制定的课题中,包括“空间信息网格框架体系和关键支撑技术”与“基于空间信息网格框架的城市空间信息应用服务系统”。与此同时,中科院计算机所联合清华大学等有关科研院所提出的“织女星网格”(Vega Grid)计划也进入实际研究和试验网格的构建阶段。“织女星网格”基本上代表今后我国信息网格的研究和发展方向。

信息网格从体系结构方面与互联网有着本质的区别,以“织女星网格”为例,与互联网相比(见表1),信息网格具有如下优势[4]:①高性能。网格具有更强大的资源,并能更有效地使用这些资源。②单一映像,用户看到一个网格整体。所有服务请求向网格发出,而不是某个网站或某台服务器。③一体化。网格中的所有资源都联成了一个整体,实现了全面的资源共享和协同工作。④自动化。网格支持信息和知识的自动生产。“织女星网格”所具有的这些优势正是信息网格的特点所在。

表1 织女星网格与互联网比较

  微机

 网格

织女星网格

应用 办公、上网、游戏等

 网格应用

 知识网格、信息网格

 命令行、视窗,Web,

  网格计算协议栈

界面

 网格界面

Basic,C,Java,COM

(GCP)

织女星网格操作系统

操作系统 Windows,MacOS,Linux 网格操作系统

 (Vega GOS)

 IBM体系结构、

曙光高性能计算机、

硬件

 网格硬件

Intel/AMD处理器

面向网格的超级服务器

信息网格的研究重点在于信息的表示和呈现。信息网格需要对分布在广域网环境中的信息资源进行抽象描述,以更好地支持网格应用对资源访问的透明性目标。因此,有学者认为信息资源空间模型应该分为3个层次,分别从信息资源的物理特性、逻辑特性、用户使用特性进行不同层次的抽象,来构建信息网格资源管理的空间模型。这种空间模型将网格资源空间分为物理、虚拟和有效3个资源层,为解决资源的全生命周期所面临的问题,包括组织、部署、发现、使用、更新、凋亡,以及底层管理提供支持。如图2所示[5]。

图2 信息资源空间模型的三层结构

在网格信息资源的空间结构设定之后,下一步的工作便是研究各个层次信息资源的表示方式。欧洲数据网格计划的研究者A.Rajasekar等提出使用元数据表示法[6],并在此基础上设计相关软件SBR进行测试。我们知道,在互联网上,信息的表示和呈现方式是多种多样的,这种异构性也为信息的统一呈现带来了困难,因此信息异构特性是网格必须克服的障碍。在信息网格中,通过元数据表示法可以为用户提供一个访问文件系统、档案系统、数据库系统等多种异构存储系统的统一接口,屏蔽了存储系统的异构特性。

由于信息网格资源空间模型对资源的多层抽象,使得描述信息资源不同抽象形式的元数据也形成一种层次化的结构体系,见图3[5]。

图3 元数据的层次结构体系

1)物理层元数据描述两种对象,存储系统和数据集。描述存储系统物理特征的元数据称为存储系统元数据,存储系统元数据的内容元素包括:①Identify,即系统标识,它表示一个存储系统的唯一标识;②Location,即位置,它表示存储系统所在位置信息;③Driver,即驱动器,它表示访问存储系统需要的驱动器,包括存储系统支持的访问接口类型或协议类型,执行查询需要的驱动程序;④Language,查询语言,它表示存储系统支持的查询语言。

描述存储系统发布的数据集的元数据称为数据集元数据,由3个内容元素组成:①Identify,即数据集标识。数据集标识是数据集在所属存储系统中的唯一标识,同时我们认为存储系统在信息网格物理层中也具有唯一性,这样通过“存储系统标识—数据集标识”可以唯一确定网格中特定数据集。②Schema Mapping,模式映射。元素是描述数据集局部(Local)模式到业务对象的全局(Global)模式之间的对应关系,也就是说将局部分散的数据信息通过模式映射形成一个全局的整体。由于映射到相同业务对象的不同数据集是局部分散的,所以在模式的设计上就不可避免地存在差异。通过模式映射,透明地访问具有模式差异的数据集就有了可能,所谓透明就是将数据信息的局部差异性进行屏蔽,数据信息用户所面对的是一个通过模式映射所形成的全局数据集。同时,当数据集模式发生变化时,通过对数据集元素值的修改,可以将这类变更在物理层进行屏蔽。③Belong To,即所属系统,表示与存储系统的所属关系。

2)逻辑层元数据。构建在物理层上的元数据都是针对特定行业的,所以逻辑层根据不同行业进行数据的描述。描述的结果就是各业务领域的行业对象元数据,也称应用领域元数据。

应用领域元数据包括:①Name,即对象名称,业务对象的名称;②Atributes,属性集,业务对象的逻辑结构;③Relationships,即对象间关系,对业务对象的依赖、引用等关联关系的描述;④DataSet Group,可调用数据集,记录为相同业务对象的不同数据集以及它们各自提供的信息内容。数据集提供的信息内容是采用分类的方式进行描述,每个数据集对应一个确定的类别,因此通过访问请求中指定数据集信息的类别就可以确定业务对象调用的数据集。

3)视图层元数据。所谓视图,即在底层数据的基础上经过特定的规则整理和排序之后呈现给信息用户的信息表现形式。视图层的信息元表现方式是通过视图层元数据来实现的。视图层的元数据主要是描述虚拟视图外部特征和组合公式的视图元数据,包括以下元素:①Name,即视图名称;②Attributes,用户可见的数据集合;③Expression,整合公式;④Refering,引用对象。上述三层结构体系构成了信息网格中信息资源表示的基本架构体系。

信息资源表示是信息网格的基础,而信息资源的发现和发掘机制则是信息网格的灵魂。资源发现机制面对的是封装成服务的资源,而不是各种各样原始的物理资源,因此资源发现机制的实现更加简单。如上文所述信息资源表示的三层元数据结构,在信息网格中信息资源的发掘也采用分层的虚拟机模型,自顶向下依次由用户层、资源路由器层和资源层3个层次组成,如图4所示[7]。

图4 信息网格信息资源发掘的三层结构

资源发现机制主要通过两个技术来解决资源发现的问题:基于资源信息的路由转发的资源定位模型和三层资源表示模型。资源定位模型主要在资源路由器上实现,是资源发现机制的核心。负责解决包括路由器网络的生成和维护、路由更新策略、资源信息聚类策略和资源请求处理策略等多个问题。三层资源表示模型试图满足资源发现机制的各个层次对资源表示的不同需求。它包含了各个层次上资源的表示方法和层次之间的映射。在资源表示模型中,资源在用户本地的表示方式是与在路由器上的全局表示明确分开的。这就为用户部署独立的资源命名空间提供了可能。在私有的资源表示空间中,用户可以使用多种方式来描述一个用户请求,只需保证它能映射成有效的路由器层表示。同理,资源的提供者也可以在物理层使用内部方式来组织自己的资源。这一特性,一方面增加了易用性,另一方面也使得异构的资源和应用可以整合到一个网格系统中来,实现信息网格通用服务的原则。

3 结束语

从上面的论述中可以看到,信息网格给信息资源管理带来的变化不仅仅是技术方面的,而且将对传统信息资源管理的概念也有很大突破。尽管如此,技术的进步仍是在向更高性能、更具易用性方面作出努力。以后的研究重点仍是集中在网格技术在信息资源管理应用方面整合,以及传统的信息资源管理技术和理念在网格时代的具体呈现方式,进而达到推陈出新和迅速提高信息资源管理水平的效果。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

信息资源管理技术革命--信息网格_信息资源管理论文
下载Doc文档

猜你喜欢