信息共享在我国可持续发展中的理论与实践_元数据论文

中国可持续发展信息共享的理论与实践,本文主要内容关键词为:中国论文,可持续发展论文,理论论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号:NO

文献标识码:A

文章编号:1007-7588(2001)01-0003-09

中国可持续发展的核心是人口、资源、环境与发展的综合协调、平衡和决策,这样的综合平衡必须要基于可持续发展领域的大量信息才能实现,而可持续发展信息共享正是实现这种平衡和决策的主要途径,并且是实现可持续发展战略的基本保障。多年来国家在人口、资源、环境和灾害领域投入了大量资金,积累了大量的数据库,但由于管理体制、科研体制、历史渊源等原因,造成了共享意识和认识的不足(谁提供数据共享,谁吃亏)和共享机制的缺乏,导致了资源和有限资金的极大浪费,不仅数据的科学性、完整性、权威性得不到保证,而且许多数据库成了死库,公共使用率非常低。至使信息共享的标准规范、权益机制和知识产权等政策问题,数据集成、空间化表达、海量数据传输等技术问题,以及信息深加工、信息服务平台和产业化等信息产品和服务问题,都成为可持续发展信息共享的障碍。

1 可持续发展信息共享的内涵

1.1 数据

1.1.1 数据的定义 数据是描述客观事实、概念的一组文字、数字或符号。包括数值数据与非数值数据,例如资源调查中的地名、通讯地址等。中国可持续发展信息共享的数据是指直接反映资源、环境和发展事件的、基础性的观测数据、遥感数据、调研数据和历史记录的整理数据等。

1.1.2 数据的度量 计算机上的数据量,用所占的磁盘空间字节数的大小来衡量。由于目前存在许多数据文件的管理系统,磁盘空间占用量有较大的差异。因此,磁盘空间占用量仅具有一定的代表和比较意义,对数据的度量必须确定文件管理方式。

为了便于对海量公用数据进行组织和管理、修改和更新,便有了数据库及其管理系统,并按数据类型有关系式数据库管理系统、多媒体数据库管理系统和空间数据库管理系统等。

1.2 信息

1.2.1 信息的主要特征 信息在宇宙中具有普遍性与无限性。信息无论在空间上还是在时间上都具有传递性,它的传递与物资和能源的运输不同,物资和能源在运输时,发出点发出物资或能源,其本身的数量就要减少。它们遵守质量守恒或能量守恒定律。而信息传递则不同,信源发出信息后,其自身信息并不减少,而且同一信源可供给多个信宿(信息接收者),这是信息的一个重要特征,既信息的共享性。由于信息是事物运动的状态和方式而不是事物本身,因此,一方面,它必须借助某种符号才能表现出来,而这些符号又必须寄载于某种物体上;另一方面,同一信息的载体是可以变换的。

客观意义上,信息也可定义为人们在获得数据前后的知识差。信息这一定义揭示了信息价值的基础所在,信息之所以存在价值,关键在于存在知识差,知识差能使人们改善决策环境而获得信息效益。

1.2.2 可持续发展信息 信息的共享性占有重要的地位。但不同领域的人对信息的理解却远不如对数据的理解那样直观,对信息的解释千差万别,单就信息一词的定义来讲,目前已有几十种以上。可持续发展信息应该是以可持续发展数据作为信息源,以数值化的形式通过计算机网络传播的信息。

1.2.3 信息的度量和信息的价值 在计算机网络上,如何度量数据所含的信息量,如何度量信息所具有的价值,是值得探讨的问题。仿照信息论中“熵”的定义,用 H(j)=-∑P(Xij) logP(Xij) j=1,2,...,N来度量数据所含的信息量。这里,P(Xij)为数据中所含信息事件Xij(i=1,2,…,N;j=1,2,…,Mj)的概率;N为数据总体共享的用户数;Mj为按照第j个用户将数据总体划分的互斥、完备的信息事件群Xij的个数。由于计算机网络上数据有着广泛的共享性,用户数N通常很大,难以确知,且随时在变化。

由此可见,信息论中讨论的信息及其传输与计算机网络上的信息共享不同。在信息论中,信息源和用户(信宿)是一对一的关系,N=1,多对多的关系较少,且信息用后不会有再次使用的价值;计算机网络上的数据共享是多对多的,用户从海量数据源中通过检索得到自己需要的信息,不同用户需要的信息互不相同,用后的数据通常有再次应用的价值。H为一个随机变量,通过抽样调查得到H的一个子样,再经过统计分析,给出H的渐近分布和均值、方差等统计参数的估计值。

信息价值的度量。如仿照诺贝尔经济学奖获得者K.J.Arrow把信息的价值定义为信息使用价值的函数来定义计算机网络上信息的价值,即用Vj表示第j个用户使用信息的价值(j=1,2,…,N)。假设系统存在着Mj种不同的状态,Pij表示系统处于第i种状态下的概率,Xij=Xij(2)-Xij(1)>0,其中Xij(2)表示在该种状态下使用信息时的收益,Xij(1)不使用信息时的收益,Xij为使用信息和不使用信息时的差额(i=1,2,...,Mj),则有:

Vj=∑PijlogXij j=1,2,…,N信息的价值V为各用户取得的信息价值Vj之和,即:V=∑Vj由此可见,要想使数据取得高的效益,一是必须提高数据网站的知名度,扩大信息共享度,即上式中的求和用户数N;二是提高数据的信息量、含金量和时效性,即提高用户使用信息时取得的实效和收益差额Xij;三是改善数据的检索查询方法和软件工具,降低用户使用数据的费用、节省用户查询得到信息的时间。如果用户在该种状态下使用信息时的收益为Xij(2),则有:Xij(2)=Sij(2)-[Vij(2)+Tji(2)+Rji(2)]式中,Sij(2)为用户使用信息完成任务后得到的总收入,Vij(2)为用户使用信息所花费的信息费,Tij(2)为用户使用信息所花费的时间机会成本,Rij(2)为用户使用信息时其他成本,如人员成本费、电费、设备折旧等等费用。二、三两项措施,就是帮助用户降低费用Vij(2)、Tij(2),并能以此取得扩大信息共享度和用户数N的效果。

在计算机网络上,如何通过对解码数据的查询和检索得到信息,是一个倍受重视的问题,方法研究和软件开发工作经久不衰。文件名检索、关键词检索和全文检索是常用的3类信息检索方法,查准率、查全率和搜索速度(搜索占用机时)是衡量一个检索查询系统好坏的3个重要标准。随着因特网的发展和普及,搜索引擎成了Web上最重要的信息查询检索工具,而对多媒体数据基于内容的查询检索倍受青睐。

1.3 知识

网络上的“知识”是通过对海量数据的分析和挖掘、过滤、提炼、总结出数据中存在的可用一定模式表示的、事先未知的、数据间新的特性、关系/规律。所以,知识和信息相比,有着更长的时效性,更大范围的的整合性,更完整的系统性,更广的应用面和更高的应用价值。可以用衡量信息量和信息价值的方法和公式来计算知识含量和知识的价值,但知识和信息相比,有更高的价值。

在计算机上,数据库中的知识发现KDD(Knowledge Discovery in Database)和知识管理(Knowledge Management)是计算机上两个倍受重视的方法和技术,是一种人与信息资源的动态管理过程,是以“人”为中心、以信息为基础、以知识创新为目标的管理思想,是两个正在研究和开发的领域。

1.4 可持续发展信息共享

可持续发展信息共享就是针对人口、资源、环境和灾害等可持续发展领域异构环境中的数值化信息,在统一的机制、规则和规范下,以统一的标准,通过计算机网络形成集中和分布式系统相结合的共享体系,在解决数据传输、异构环境的数据使用、数据集成、空间化表达等技术问题的基础上,实现信息的相互自由传递以及信息的无偿和有偿共享。这些共享的信息,经过集成和分析可以形成用于解决一个/一类问题的信息和知识。

可持续发展信息共享的实现,可以避免海量数据的重复采集、校对、录入、管理,可节省大量的人力、物力和财力;数据实现统一管理,大大方便了数据一致性和可比性;通过计算机网络实现数据资源共享,打破了时空的局限性,提高了数据处理和分析的能力和效率,对实现社会和经济的可持续发展提供了保障。

1.5 数据、信息和知识的关系

数据是人们用各种工具和手段观察外部世界所得到的原始材料数字化后存入到计算机内0、1的海量数集合,是加工信息和知识的原材料。数据只是描述发生了什么事情,不足以构成判断、解释和行动的可靠基础,对数据进行分析、综合,找出其中关系,赋予数据以某种意义和关联,这就形成信息。信息虽给出了数据中一些有一定意义的东西,但它往往还比较简单,还不能做为判断、决策和行动的依据。对信息进行再加工,进行深入洞察、理解其模式,总结出原理和法则,才能上升到知识。

数据、信息和知识的关系可以在图1中看出,只能通过其所含的信息的价值和知识的价值来度量,即数据的价值只能通过应用才能体现出来。显然,数据量越大,共享度越高,能提炼出来的信息和知识的可能性就越大,其价值也就越大,但其价值和数据量的大小并不是一种简单的线性正比关系。一大堆难以导出信息和知识的无用数据,只能是“数据垃圾”,不但无价值,还会形成负担,如存储的负担,检索查询的负担等。

2 可持续发展信息共享的实现方式

实现可持续发展信息共享必须要解决如下问题 ①共享政策和机制的问题; ②共享数据标准和规范的问题; ③共享统一的信息平台问题; ④异构环境和数据库共享使用的问题; ⑤集中和分布式信息共享体系如何建立的问题; ⑥数据集成及在统一平台上的空间化表达问题。

如图2所示,政策和机制、标准和规范以及技术上的支持是实现信息共享的基础,在此基础上建立的公共基础地理信息平台和集中与分布式相结合的网络共享体系,是实现可持续发展信息共享的主要途径。

2.1 建立共享的政策和机制

建立信息共享的政策机制和制定共享的管理办法是开展可持续发展信息共享的前提和依据,是保障包括共享行为、经济和社会效益以及法规因素在内的可持续发展信息共享的基础。用市场机制激活可持续发展信息共享,用管理机制调节和保障可持续发展信息共享。

行为因素即数据的拥有者是否愿意将数据与他人共享,这是进行数据共享的先决条件。信息参与共享后,随着用户增多效益就会增大。价格问题必然出现。不同的系统、环境中的共享将带来额外的开销。因此必须规范数据的价格,制定政策和法规,鼓励和吸引数据提供者参与信息共享,对数据共享的范围和数据的使用权限等进行约束。可持续发展的信息共享涵盖自然资源、环境保护和自然灾害等许多跨行业的领域。

2.2 建立统一的标准和规范

只有系统之间享有一种共同的数据规范和标准如术语的解释,概念模式以及对数据的描述,才能解决不同领域之间的数据共享问题。语义的研究主要是为了在信息共同体内制定的准则演化到更加广泛的范围中,制定完整的、统一的、普遍接受的标准和规范。

可持续发展信息的标准化、规范化是实现信息共享的关键,也是信息系统建设的基础性工作。为此,需要确定数据分类及编码体系的框架、信息共享的数据转换标准、可持续发展共享信息标准及GIS技术标准,并且建立公共基础地理信息共享平台。

与国际标准化组织(ISO)地理信息/地球信息业技术委员会(ISO/TC211)正在制定的国际标准接轨,研制适合中国可持续发展的数据分类及编码结构,包括数据分类及数据字典的结构设计方案、数据字典库;制定中国可持续发展信息共享的数据转换标准,主要是空间型矢量数据转换标准格式与空间定位统计数据转换标准格式;制定可持续发展共享信息标准化,包括地理信息系统名词术语标准、元数据标准框架、统一的基础地理数据分类与代码国家标准、地理信息质量控制内容、指标及质量评价过程标准等。

2.3 集中和分布式共享体系的建设

我国可持续发展领域的数据是分散在各个部门和研究机构中。数据种类多样,结构千差万别。数据的完全集中在技术和管理上是不可行的,而数据完全按分布式的方式管理也存在协调、数据质量控制、高层次集成等问题,因此必须建立集中和分布相结合的共享体系。以统一的元数据标准和基础地理信息平台建立分布式数据库系统,并将可无偿使用的、带有一定共性的、可集成的数据集中在网络中心,形成以分布式为主、集中和分布相结合、集中带动分布的完整的共享体系。为此,必须有统一的基础地理信息平台,内容必须包括一定比例尺的境界、水系、交通、居民点、地形等基本地理要素,为上述信息提供空间定位的依据。在这个统一的平台上,来自不同数据库的信息可以互相叠加,进行综合分析。基础地理信息平台还为各数据库原有的图形信息提供了一个配准的依据。整个系统有统一的数据字典(元数据),各个分中心有各自数据库的数据字典,网络中心有全局数据字典。在全局数据字典的控制下,可支持全局的数据查询和信息分析。在网络中心有全局调度的软件,因而可以进行全局性的操作。

各分中心可以在自己的共享平台和公共基础地理信息平台上进行数据和信息的集成,网络中心可以在公共基础地理信息平台上进行进一步的集成,形成决策部门、社会公众以及各行各业服务的信息产品,同时网络中心的数据和信息集成还可以对数据质量进行控制。

2.4 异构环境下的信息共享

信息共享技术上最大的障碍是存在大量的异构系统和环境。产生异构问题的原因,归结起来主要有:①计算机类型的差异;②操作系统的差异;③网络协议标准的差异。各种协议支持的应用系统越来越丰富,协议之间存在兼容性的问题。除此之外,还存在数据库的异构问题以及多媒体和空间数据因格式和执行标准不同而产生的异构问题。所有这些使得用户面临着,在异构环境下各应用之间如何进行信息交流和共享的问题。

解决的方式之一是异构环境的集成处理。常见的方法有:①直接法。该方法运用网桥(Bridge)、路由器(Router)和网关(Gateway)等网络设备直接实现集成。适用于对所需要的协议间的通讯是明确的情况,不足之处在于方法的通用性较差;②枚举法。在同一台机器上保存多种协议,根据不同的应用调用相应的协议驱动模块。这种方法实现起来非常方便,但执行时要增加对协议的全局控制使得数据处理效率受到影响;③中间件法。可以看做枚举法的扩展,它通过在应用层和协议之间加入中间构件来完成集成功能,当协议发生改变时只需更新驱动模块,从而增加了灵活性,但该方法选择合适的中间构件比较困难,而且集成的执行效率比直接法低。

2.5 异构数据库之间的共享

对于异构数据库系统,数据库转换和数据的透明访问是实现数据共享的两个关键问题,最终目标是实现不同数据库之间的数据信息资源、硬件设备资源和人力资源的合并和共享。异构数据库系统是相关的多个数据库系统的集合,每个数据库系统在加入异构数据库系统之前就具有各自的自治性,实现数据共享的同时,每个数据库系统仍保有自己的应用特性、完整性控制、安全性控制和分布式的特点。异构数据库系统中关键的一点就是以局部数据库模式为基础,建立全局的数据模式或全局外视图。这种全局模式对于建立高级的决策支持系统尤为重要,因而建立集中式数据库管理系统并以此为基础建立全局模式,是解决异构数据库的统一联接和控制的重要途径。集中式数据库管理系统可以从异构数据库系统中的多个数据库中收集信息,并建立统一的全局模式,同时收集的数据还支持对历史数据的访问,用户通过统一的数据接口进行决策支持的查询。

2.5.1 异构数据库的转换 将一种数据库系统中定义的模型转化为另一种数据库中的模型,然后根据需要再装入数据,这时用户就可以利用自己熟悉的数据库系统和熟悉的查询语言,实现数据共享的目标。为此必须建立数据库转换工具,首先进行类型转换,访问源数据库系统,将源数据库的数据定义模型转换为目标数据库的数据定义模型,然后进行数据重组,即将源数据库系统中的数据装入到目的数据库中。但在转换的过程中,有时要想实现严格的等价转换是比较困难的。首先要确定两种模型中所存在的各种语法和语义上的冲突,这些冲突可能包括:①命名冲突。即源模型中的标识符可能是目的模型中的保留字,这时就需要重新命名;②格式冲突。同一种数据类型可能有不同的表示方法和语义差异,这时需要定义两种模型之间的变换函数;③结构冲突。如果两种数据库系统之间的数据定义模型不同,如分别为关系模型和层次模型,那么需要重新定义实体属性和联系,以防止属性或联系信息的丢失。

2.5.2 数据的透明访问 在异构数据系统中实现了数据的透明访问,用户就可以将异构分布式数据库系统看成普通的分布式数据库系统,用自己熟悉的数据处理语言去访问数据库,如同访问一个数据库系统一样。但目前还没有一种广泛使用的数据定义模型和数据查询语言,实现数据的透明访问可以采用多对一转换、双向的中间件等技术。开放式数据库互连(ODBC)是一种用来在相关或不相关的数据库管理系统中存取数据的标准应用程序接口。ODBC为应用程序提供了一套高层调用接口规范和基于动态链接库的运行支持环境。目前,常用的数据库应用开发的前端工具如PowerBuilder、Delphi等都通过开放数据库互联(ODBC)接口来连接各种数据库系统。而多数数据库管理系统(如:Oracle、Sybase、SQLServer等)都提供了相应的ODBC驱动程序,使数据库系统具有很好的开放性。Java与数据库接口规范JDBC(Java Database Connectivity)是支持基本SQL功能的一个通用的应用程序编程接口,它在不同的数据库功能模块的层次上提供了一个统一的用户界面,为对异构数据库进行直接的Web访问提供了新的解决方案。

2.6 集中共享数据的空间集成

针对数据来源和类别多种多样,采用的比例尺、投影方式、数据精度等都不同,必须统一到同一种坐标体系中,以便在同一基础上进一步工作。主要途径是以经纬度作为参考坐标系,对集中共享的空间图形数据,既以空间坐标或坐标串描述实体空间分布特征的数据,以及可空间化的属性数据,既可以与空间图形数据库中的实体(以下简称“空间实体”)建立关联的数据,采用公共基础地理信息共享平台所提供的统一的空间定位框架,根据1:100万和1:400万比例尺的底图进行投影转换,并将各数据层与底层平台叠加,把各种地理要素转入统一的空间定位系统,利用建立的关联,可以以空间图形数据为基础,通过空间位置访问这些属性数据。同时在统一的基础地理信息平台上对各类信息进行集成,以达到既可以对不同的可持续发展信息进行多层叠加产生不同的空间数据产品,也可以进行空间分析,对决策进行支持,还可以通过网络中心和分中心对社会开展服务。

3 中国可持续发展信息共享的应用实践

针对我国可持续发展领域的信息资源多、信息量大、共享将为社会带来巨大效益但共享又很困难的局面,在国家科技攻关计划的支持下,“九五”期间实施了国家攻关项目“中国可持续发展信息共享示范”,目标和任务是研究中国可持续发展信息的标准和规范、研究信息共享的政策机制和管理办法、解决信息共享系统的软硬件集成技术、建立公共基础地理信息共享平台并建成中国可持续信息共享系统的网络中心,并以此为基础,根据项目的试点选择原则和各有关部门的现有工作基础,选择资源、环境和综合自然灾害方面的信息开展共享示范,逐步建立起分布式与集中式共享相结合的中国可持续发展信息共享示范系统和网络站点。并借此推动我国信息共享事业的发展,深入挖掘共享数据资源,为更大范围的可持续发展信息共享提供示范性经验,为信息资源的国有化改革提供实践基础。这个项目的实施可以说真正拉开了中国信息共享的序幕。

3.1 可持续发展信息共享信息源的选择标准

从可持续发展领域的实际特点出发,根据以下原则选择信息:①社会应用面广,数据覆盖全国尺度;②数据具有权威性和更新能力;③数据已有相应标准;④数据的发布与共享不损害国家利益、不牵涉地方和部门保护利益;⑤数据具有实用性。

所选择的信息包括:物种与植被资源信息;农作物品种资源信息;森林资源信息;生物多样性资源信息;宏观国土资源信息;地质矿产资源信息;海洋资源信息;环境保护信息;环境无害化技术信息;综合自然灾害信息;气候气象信息;中国经济信息与综合遥感信息。

3.2 主要成果

中国可持续发展信息共享示范项目经过3a的实施,建成了以分布式为主、集中和分布相结合的数据共享系统。该系统以中国自然资源环境保护和防灾减灾信息为主,集元数据、属性数据、空间数据和多媒体数据于一体,成为专门为中国可持续发展服务的网络系统。主站点上集中了网上无偿共享的、公共的尺度涵盖全国范围的、宏观的可持续发展数据;分站点上集中了有专业特色的、无偿和有偿共享的宏观和微观的可持续发展数据。每个数据库都建立了元数据,通过元数据和其它多样化的信息检索工具对数据库进行查询和访问,同时还可以访问与可持续发展密切相关的国际国内的其它网址、数据库站点和相关的政策和法规。具体成果如下:

3.2.1 建立起了完整、全面、权威和易用的大型资源环境数据库系统 在中国科学院、中国农业科学院、中国林业科学院、中国地质科学院、中国气象科学研究院、国家环境总局、国家地震局、国家海洋信息中心和中国21世纪议程管理中心等项目参与单位的分工合作、共同攻关的努力下,研制开发了我国目前集完整、全面、权威和方便使用为一体的中国可持续发展大型资源环境数据库系统,其中包括中国植物资源数据库集,中国植被资源数据库集,中国动物物种资源数据库集,中国微生物资源数据库集,中国农作物种质资源数据库集,森林资源数据库集,自然保护区与生物多样性数据库集,宏观国土资源数据库集,地质矿产资源数据库集,海洋资源数据库集,环境保护数据库集,综合自然灾害数据库集,气候气象资源数据库集,环境无害化技术数据库集等约90个数据库。该系统也是目前在网络上最重要的可持续发展信息资源之一,目前集中共享的数据总量已超过2GB。

同时对所有上网数据库的查询检索功能都进行了改造,增加了数据查询方式,提高数据检索速度,建立了元数据库并开发了元数据库查询和编辑功能,完善了数据库的数据字典。有些专题在查询结果中还可以随时显示数据项的描述信息和计量单位的内容,同时对有些查询结果还实现了动态统计图生成,使得数据查询更加迅速、明了、方便。还开发研制了资源共享信息中空间数据的检索查询系统,使用者可以进行属性数据与空间数据的交互查询、对空间信息查询结果可以进行图形显示、放大(缩小)、打印、图层叠加、属性数据显示等操作,查询操作简便、速度较快可以满足使用者的需求。

中国可持续发展信息共享数据库,既可在中国可持续发展信息共享网络总站点上、通过http://www.sdinfo.net.cn/对项目提供的无偿共享的信息资源进行检索和查询,也可在中国可持续发展信息共享网络分站点上对项目各专题、子专题提供的无偿及有偿共享的信息资源进行检查和查询。在这些站点上,还可以查询到和中国可持续发展及其信息共享项目有关的更广泛的信息。

3.2.2 提出了一系列有影响、有价值的共享政策和立法意见 在完成了国内信息标准、信息共享现状调研分析的基础上,提出了我国当前信息共享的主要对策,研究并提出了信息共享管理办法框架方案和信息共享机制的初步方案。研究成果有:完成了《地理信息标准、共享和立法情况分析与对策研究》报告;编辑了《可持续发展信息共享政策机制》;完成了可持续发展信息共享管理办法第二稿;编制了“地理信息共享立法的可能性、内容和程序的研究报告”;正在编辑专著《地理信息共享法学导论》。

3.2.3 制定了信息共享元数据两级标准及操作和管理工具 在《中国地理信息元数据标准研究》的基础上,进一步跟踪分析国际ISO/TC211正在制定的元数据最新方案和在初步制订了本项目内部使用的《中国可持续发展信息共享元数据标准》(讨论稿),提交各有关单位征求意见的基础上,结合最新版本国际标准草案,修改原讨论稿,重点研究了二级元数据的内容标准,形成了标准初稿。为使中国可持续发展信息共享元数据标准方案具有更加广泛的基础和延续性,避免或减少重复工作,在制定的初稿中,保留一级元数据内容不变,二级元数据内容进行了更新和适当删减,使其与ISO/TC211最新版元数据标准方案尽可能协调。按照本项目制定的元数据标准方案,先建立和发布初版国家基础地理信息系统各数据库的一级元数据库(共70项元数据元素)。完成了全国1:400万、1:100万和1:25万一级元数据编写及网上发布,完成1:100万分幅一级元数据的编写录入。

3.2.4 研究和制定了中国可持续发展数据分类与编码标准体系框架以及数据字典标准 中国可持续发展数据分类体系框架的内涵是,在基础地理信息和各种专题信息本身已经或将要制定的分类编码的基础上,在更高级别上研究制定所有可持续发展信息的总体分类体系框架及其编码方案,以便在数据交换的过程中和交换后,能够容易地区分和识别各种不同种类的信息,而不会产生矛盾和混淆。提出了《中国可持续发展数据分类与编码体系框架》(初稿)以及《中国可持续发展信息共享数据库数据字典内容标准》(初稿)。

3.2.5 建立了统一的公共基础地理信息共享平台 根据确定的用于我国可持续发展数据信息共享的基础地理信息内容,从已建国家基础地理信息系统全国1:100万数据库中提取所需信息、进行数据类型的转换、数据综合和重组,建立了用于可持续发展数据信息共享的基础地理信息数据集,即公共基础地理信息共享平台。1999年请国家测绘局审图办公室对1:400万数据库国界和省界数据进行了3次审查,为公开发布公共基础地理信息共享平台数据打下了基础,2000年3月已经开始提供新的国、省界及政区数据,便于数据配准和信息发布。按照项目的统一规定,设计、编写、制作了国家基础地理信息系统的主页和查询检索工具,以便用户进行访问。通过对国内外现有各种WebGIS软件进行对比分析和试验的基础上,选择了Mapinfo公司的MapXtreme,开发一系列配套的应用程序,实现了全国1:400万数据网上浏览、查询和部分数据免费下载。

3.2.6 建成了集中共享的网络中心和分布式的分中心 建成了以集中和分布式信息管理的网络系统。网络中心和分中心位于北京、天津、南京3个城市的9个节点,通过Internet相互连接,这些节点又分别同国内的教育科研网(CERNET)、科技网(CSTNET)、金桥网(CHINAGBN)、中国公用互连网(CHINANET)四大互连网连接。它们在Internet这一大平台上,把不同单位的各种数据库联系起来,形成一个统一的整体,使用统一的技术体系(包括数据库的建设、信息发布的方式、前端浏览的方式、信息管理方式等等),在网络中心的协调下,形成了一个对于外部用户来说就象一个集中的数据库群一样的体系。集中共享的网络中心和各分中心的软硬件环境都已初具规模,网络中心的内部骨干是凭借一台以太网交换机建立起来的,能支持100Mbps快速以太网,并能进行10M/100Mbps自适应。该交换机的3个100Mbps端口用于连接3个服务器,保证每台服务器独享100M的带宽。各分站点都根据要求扩建了局域网,配备了高性能的服务器,网络出口带宽都超过了64Kbps的基本要求,并建立了简便、快捷、内容丰富的网页和查询工具,为用户提供内容丰富的服务。

图2给出了系统相互关系的基本体系结构,除用户与计费管理依然集中在网络中心外,其它体系结构各站点间完全保持一致。即每个站点都建立自己的web服务器、应用服务器、数据库管理系统及其元数据库。元数据库系统是一个按类分级的分布式数据库系统,整个网络依靠该分级分类元数据库系统的逻辑结构,保持其整体性。各元数据库中除存放本地数据库的元数据,还存放其下级站点数据信息的入口地址。在统一的元数据标准的支持下,基本形成了集中和分布式相结合的共享体系。

3.2.7 解决了网络共享技术支撑体系所需的一些关键技术 ①中国可持续发展信息共享的软硬件体系结构;②大容量空间信息共享的服务器和浏览器间的前后端交换协议;③中国可持续发展信息共享的安全问题;④中国可持续发展空间信息共享的服务器空间索引问题;⑤中国可持续发展信息共享系统所涉及到的各种地图投影的自动变换技术;⑥中国可持续发展信息的中英文全文检索技术;⑦不同比例尺的空间数据整合和配准技术;⑧初步解决了多站点数据的分布式计算和综合分析技术。

3.2.8 为社会各界提供了丰富的服务 为了在网上宣传、普及可持续发展知识,在网络中心网页上开发了可持续发展论坛、动态、法规、书目、小词典等诸多栏目。丰富了网站的内容,提高了网站信息的时效性。目前可持续发展信息共享网站已在社会上小有名气,据不完全统计,主站点和各分站点的用户访问次数总计已达几十万次,社会上一些著名的网站,如搜狐、北大天网等在检索“中国可持续发展”时,21世纪议程管理中心的网站、可持续发展信息网站总是在前几条之内。许多分站点都已为信息的社会化服务作出了贡献,如农作物品种资源专题通过本项目建立起来的数据库,是目前最受欢迎的农业网站之一,同时该网站在网际上也有一定的影响,并已经开展国际交流与合作,仅与澳大利亚的合作就获近百万收入。专题2000年3月信息共享网络中心刚刚换上新的页面不久,就有用户对新网页的设计提出建议,说明确定有许多有识之士在不断地关注着可持续发展的事业。

3.3 存在的主要问题

应该说经过几年的信息共享实践取得了一定的进展,极大地促进了资源、环境和灾害等领域的共享意识的提高,部门壁垒和行业隔阂的障碍正在消除。冰冻三尺,非一日之寒,要想达到可持续发展领域信息的全面共享,还需要国家的大力支持,需要各界的共同努力。目前存在的主要问题是:

3.3.1 仍缺乏对可持续发展信息的体系化建设 “可持续发展信息共享示范”项目的成功实施,只能说是在可持续发展信息共享方面迈出的第一步,离体系化建设还有很大距离。大量的可持续发展信息仍处于分散、项目和部门各自为政的状态,既缺乏稳定的可持续发展基础数据信息建设队伍,又缺乏系统的可持续发展信息体系的建设规划,从而使各类可持续发展信息及其建设工作的连续性、完整性和权威性受到了很大限制,宝贵的科学数据不但得不到充分利用,有的信息还遗失殆尽,以致造成了有限人力、物力和财力的巨大浪费。

3.3.2 缺乏对可持续发展信息的综合集成 虽然各部门均积累了大量的可持续发展基础数据和信息,部分数据还建成了数据库和信息网络,但由于这些数据和信息均主要是为专业领域的专门问题服务的,因此十分缺乏为“可持续发展综合决策”服务的综合性的信息集成研究与建设,这包括信息集成平台、各类信息的数字化和网络化建设等方面。

3.3.3 缺乏强有力的可持续发展信息共享体系 通过国家“九五”科技攻关项目“中国可持续发展信息共享示范”的研究和推动,“可持续发展信息共享”概念已逐渐为社会所接受。但由于尚未形成符合中国国情的和有效的信息共享机制,信息共享仍不通畅,不能满足政府、市场和社会的信息服务需求。这一现状,既影响了全社会可持续发展意识的普遍提高,更重要的是限制了政府可持续发展综合决策的科学制定,影响了中国可持续发展长远战略的有效实施。

3.3.4 许多共享关键技术需要攻关解决 亟需解决许多共享的关键技术,为全面实施可持续发展信息共享提供技术保障。这些技术包括统计数据与站点观测数据的空间化表达、多源、多类型属性与空间数据的提取与整合技术、大容量数据管理和传输的空间索引和导航技术、特定应用目标的数据库重组与动态决策支持技术、可持续发展系统分析模型和网络化应用、基于因特网的可持续发展信息智能表达等。

3.3.5 缺乏系统的可持续发展综合决策支持系统 可持续发展综合决策支持系统既是国家制定各项可持续发展战略决策和具体措施的基础依据,又是可持续发展信息的体系化和共享化建设的直接目标。然而,目前为止,只有少数专业部门的为本专业领域服务的信息系统和信息网络,具备了一定的综合决策支持功能,而跨越专业领域、服务于国家各级政府和为可持续发展综合决策服务的“可持续发展综合决策支持系统建设”,在国内尚属空白。

3.3.6 缺乏针对可持续发展信息的产品化和市场化的开发和应用 在信息产业蓬勃发展的今天,如何充分利用可持续发展领域的巨大资源,利用可持续发展信息共享的优势,在共享的基础上集成、加工开发可持续发展的信息,形成产品并产业化是我们必须探讨的问题。

聂高众研究员和程光同志对文章的修改提供了极大帮助,特此致谢!

收稿日期:2000-11-15

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

信息共享在我国可持续发展中的理论与实践_元数据论文
下载Doc文档

猜你喜欢