如何应对21世纪中国信息产业的挑战_数据库系统论文

如何应对21世纪中国信息产业的挑战_数据库系统论文

中国信息产业如何面对21世纪的挑战,本文主要内容关键词为:世纪论文,中国信息产业论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

摘要 数据库产业是现代化信息产业的基础,本文分析国内数据库和信息服务业与国外的差距,建议开发国家级的综合性大型数据库,扩大数据库的覆盖面,保证数据库质量。作者认为,我国应将数据库生产和数据库检索服务分家,由信息服务部门对数据库进行高质量的增值处理,同时建立配套的文献源服务体系。我国以INTERNET为基础的信息服务技术起步并不算晚,应该尽快培养一批跨世纪的信息人才,首先建立我国信息服务业在亚洲的领先地位,缩小与发达国家间的差距。

关键词 信息产业 数据库 信息服务

Information Industry in China:

How to face Challenges of the 21st Century

Lei Zeng Foster J.Zhang(Kent State University,Ohio,USA)(Knight—Ridder Information,Inc,CA,USA)

Abstract This paper analyzes existing distance of databasedevelopment between China and developed countries.It is the authors’concern that large—scale comprehensive databases should be developedat national level;coverage of subject areas should be extended,anddatabase quality be ensured.In order to develop competitive productsand to advance China’s information industry,the authors suggest thatdatabase production should be separated from information servicedevelopment.Information services should apply value—added process tothe domestically—constructed

databases. Corresponding

documentclearinghouses and document delivery services should

also

beestablished.As the increase of Interner—based information servicesall over the world,Chinashould prepare a high quality team throughextensive training and education.It shall be the goals of the Chineseinflrmation industry to establish its leading position in Asia and toeliminate the gaps between China and the developed countries.

Keyword information industry.database,information service

1996年夏我们应邀回国参观访问和举办有关信息技术的讲习班,短短数周中,国内为面向21世纪而广泛开展的培养跨世纪人才和建立跨世纪工程(特别是信息网络方面的项目)的热潮给我们留下了深刻印象。同国内一样,1994年以来,信息高速公路的未来前景和对21世纪全社会的影响一直是全球的讨论热点,世界上许多国家将信息高速公路的建设提到最高层领导人的决策议题中。1997年新年伊始,美国联任总统克林顿即在其就职演说和施政纲领演说中宣布了面向21世纪的总体精神,并一再提到“信息时代”这一时代特征。几年来,美国国家科学基金会等已出资几千万美元开展电子信息库/图书馆(DIGITAL LIBRARY PROJECT)的各方面问题的先期研究,以解决信息高速公路上的“车”与“货”的来源及管理问题。冷战结束后,经济发展日益成为国家强盛的关键,而任何一个国家想成为一个经济大国,首先必须是一个信息大国,信息资源是一个国家发展进程中举足轻重的战略资源,这里信息资源主要指数据库建设,尤其是科技信息资源的建设,以及提供服务的手段。

我们高兴地看到作为提供信息服务基础的通讯网络系统在全国的快速发展,从中央(国家各部委)到地方(上海、广东等)都在建设网络。信息高速公路上无车可跑和无货可载的现象也得到部分改善,新华社的新闻信息库和国家信息中心的信息库都已经开始提供网上服务。

信息资源包罗万象,其中新闻和金融信息以开发容易、获益迅速为特点。我国目前发展较快的信息资源正是属于这一类。它为国内外用户了解中国市场,进入甚至占领市场起了很重要的作用。但是,这类信息库累计性差,随着时间的推移,信息很快失效,因而不能构成一个国家信息资源的主体。本文要谈的是对我国科学技术发展有直接推进作用的科技信息的资源开发。这类数据库的建设需要大量的投资,技术性强,而且发展缓慢。中国科技数据库建设及服务的发展速度会直接影响我国高科技工业与国际的接轨。没有科技信息业的支持,中国的科学技术就很难赶上世界先进水平,中国的经济发展就不可能处于世界领先地位。

国内外信息业的同仁都十分关心中国信息产业的命运,目前的信息时代无疑给信息工业带来极好的机会,但也对中国几十年来形成的信息产业结构提出了挑战。国际网络的发展,尤其是万维网(WWW)的出现为有效使用信息资源提供了一个新的途径。在这种形势下,如何加快我国信息产业的发展(特别是科技数据库的生产)的确是一个迫在眉睫的问题。下面结合我们在国外的经验就这一问题谈谈我们的一些想法。

1 中国与国际信息产业与服务业的差距

数据库产业是现代化信息产业的基础,一个国家拥有多少自己的数据库,能向国内外提供多少有特色的数据库服务,能在世界上吸引多少用户,直接体现这个国家的现代化水平。实际上,50年代的中国科技情报研究所(现名中国科技信息研究所)与当时的全苏科技研究所(VINITI)和日本科技情报中心(JICST)拥有相似数量和水平的人员、设备、文献收藏量和覆盖量。但是,30年来VINITI和JICST得到了极大的发展,在世界科技情报界建立了不可动摇的地位,以其系统性强、覆盖面大、信息源质量高而著称于世。相比之下。在世界信息市场上,中国生产的数据库廖廖无几。总部座落在旧金山的KNIGHT—RIDDER(即DIALOG)公司,是世界上最大的跨国信息数据库服务商,在其1996年的数据库目录上,列有来自世界各国的600多个数据库,覆盖面可以说是无所不包。但是,其中来自中国的仅占一席:中国专利数据库。而在世界上其他的主要信息服务系统(如STN,OVID,Questel—Orbit等)中已开始出现来自中国台湾地区的数据库。

虽然KNIGHT—RIDDER和其他英语为主的信息商占据了世界绝大多数信息市场,非英语国家从来放弃争夺和扩大地盘,以法国为例,该国一直推行信息自力政策。自1984年以来,法国科技中心的信息中心将其PASCAL数据库的覆盖范围扩大到世界范围,建成年产43万条的具有国际规模的多学科数据库,无视已经相当完善的英语数据库的存在,实践证明这是成功的一举。德国PHYSICS BRIEFS数据库不甘示弱地与老牌英语库INSPEC竞争,也是突出的一例。日本政府曾长期以面向国内信息需求服务为主,但在国际化压力之下,也开始大力发展打入国际市场的信息产品,自1986年以来,其著名的JICST日文科技数据库开始有了相应的英文库JICST—E,在欧洲和美国均可联机检索。更有甚者,JICST又成为近年崛起的世界大型联机检索系统STN的所有者之一,与其美、德、澳大利亚同行共同开展全球性业务。这些西欧国家和日本的方针很明显,他们力图在世界范围内激烈竞争的数据库领域占据一席之地,有重点地集中生产一批优质数据库,主要面向本语种用户,同时开拓国际市场。欧洲共同体、美国、日本等发达国家的信息产业年产值都在几十亿美元以上,相比之下,中国的数据库和信息服务年产值估计不足亿元人民币,与国际水平无法相提并论,更与如此偌大一个国家的发展节奏极不协调。

发达国家长期以来采取相对独立自主的信息发展政策,建设自己完善的数据库和信息检索体系,注重数据库开发的经济效益,积极推动数据库商品化的实现。法国、日本、前苏联都是在中心控制的模式下发展和协调数据库生产的,美国则完全相反,一切由各个商业性数据库生产机构和国家机构自行发展,在竞争中协调。前西德属于中立形式,其数据库是由各个机构自行生产,但有一个总协调机构将生产统一协调起来。这些国家的不同模式和经验对中国数据库发展规划应该说是很有启发作用的。

2 中国信息数据库生产及检索服务的问题

随着中国科技、经济、文化、社会的不断发展,整个社会对信息需求的不断增加,中国电子信息产业自80年代中期以来得到逐渐发展。如同世界上的任何一个联机信息服务系统一样,提供有效的电子信息服务必须首先拥有一批质量可信,学科领域覆盖面广、数据量大、且数据类型多样的信息数据库。近年来,中国已形成以三大类型数据库服务为骨干的电子信息服务框架,即:(1)直接查询国外数据库的国际联机检索业务;(2)在进口数据库产品基础上开展的定题检索和回溯检索业务;(3)国内自建的数据库及配套的检索服务。这些成就已有许多文章介绍,本文不再赘述,在此仅就一些存在问题展开讨论。

目前,由于多方面的原因,中国数据库生产和服务的质量、数量、服务水平都还未达到国际水平,正如以下所示:

(1) 我国的国际联机检索服务虽已普及到各大中城市,可查找几百个国外科学技术数据库,全国年查询课题却大约仅相当于美国一个中小城市的年查询量。而高费用和在国内难以获得原始文献是若干主要问题当中较为突出者。

(2) 建立在进口数据库基础上的定题和回溯检索服务始于70年代末,逐渐形成了今天可见到的一套有中国特色的信息检索系统。但是,这种以进口库为基础的系统实际上不具备很强的功能,比如,a)由于主机内存局限,为数据库做的索引档极有限,非常好的数据库只配备有相当少的检索入口,因而大大降低了数据库的有效实用率;b)检索系统分布不均,全国可提供这类服务的系统有90%集中在北京和上海两市;c)数据库主题覆盖范围存在严重的局限性和重复性,而所有这些数据库覆盖的主题范围又有很大局限性。

(3) 随着中国成为世界出版最多的国家,开发和建立中文数据库已成为相当关键的问题。自1982年《中国药学文摘数据库》建成到1995年底,全国已有几百个数据库达到具有一定容量、并能对外提供服务的水平。然而,中国数据库尚不能在国内形成有规模的市场,更谈不上与国际同类信息业接轨。其主要问题已在全国信息资源调查领导小组办公室的《全国信息资源调查分析报告》中被列出。我们认为,现在这方面的关键问题一是长期存在的低水平重复问题,二是始终未形成有权威性的、能拿到世界市场去竞争的大型数据库。整个数据库生产和服务的质量、数量、规模大约相当于发达国家70年代中期的水平。

3 我们对数据库生产和信息服务两大行业的建议

3.1 数据库的生产

(1)制定国家数据库发展计划 国家有关决策机构和信息产业的主要领头机构应当意识到,在中国信息数据库和信息服务业,长期以来缺乏控制和协调,又没有合理的商业竞争机制,因此,已建数据库,特别是新建库在主题覆盖面、学科分布、地理分布、数据质量和数量、系统间的兼容性、信息的查找途径等多方面都存在许多问题,导致中国信息数据库落后于世界水平。1995年全国信息资源调查中,上报数据库中有一定容量、能对外服务的自建库总数达1038个,仅从数量上看,比1992年在国家科委登记的数量多出近十倍,这的确令人鼓舞(试想美国稳定服务和赢利的数据库数量约4000多个,欧共体有1000多个)。且然而如果我们去掉数据量太小的微型数据库、图书馆馆藏目录数据库,以及为本单位设计的管理型数据库,真正能有市场价值的数据库只有百十个,有仍以有较长历史的文摘、全文和科学数据库为主。数据库内容的重复可以国际国内标准文献数据库为例,用户面前有十多个库可选,小的仅几个MB,大的有几百MB,从名称和数据库描述上看不出什么不同,不知用户需要试多少个库才能找到所需的标准文献。另一方面,关于同一地区的数据分散于众多的数据库中的情况相当严重。为此,我们建议国家科委在1995年全国信息资源调查工作的基础上,对现有数据库进行深入分析,以揭示中国自建数据库对不同领域和地域的覆盖程度、数据库中不同学科领域内学术文献的丰富程度、数据库信息源和质量、数据库的可检水平、影响信息产业发展的有关经济和技术原因、兼容和标准化手段等问题。根据调查和分析的结果,对中国信息数据库的布局、发展、与国际信息界接轨的方针等作出有效可行的计划。

(2)开发国家级的综合性大型数据库 从目前最紧迫的任务来看,中国应尽快生产出能代表国家级科技水平的综合性大型数据库,这可以在现有的中科院和各部委信息所已建数据库和高校学报数据库的基础上建成。具体来说,如果能建立一个英文版的中国科技文献数据库,类似于日本科技情报中心(JICST)的英文库JICST—E,除了可以迅速向世界展示我国的科研成就与水平,还可以得到信息资源应有的经济效益。JICST英文版在装入DIALOG后,每月联机收入已达上万美元。

(3)扩大数据库的覆盖面 中国地域辽阔,信息资源丰富,光靠中央少数单位难以解决全面的信息资源开发,要鼓励地方有关部门积极投入和商业性开发地方信息。同时应有计划地将地方和专业的数据库按类型及学科,汇集成大型的数据库,以便更好地发挥作用。目前有些省信息资源数据库的建立很有起色,只是普遍存在数据库内容单一、规模极小、更新缓慢等明显的问题。国家应有意识地制定相应标准,提供建库指导和培训,协作建库。

(4)保证数据库质量 数据库的开发属于电子出版物范围,应有版权保护。对宣称国家级的数据库应有合理的检验,以减少资料不全、或数据不正确的问题,为进入世界信息产业的中国数据库把好质量关。建议有关机构对出口、或通过网络对外服务的信息公司建立质量许可证的制度。数据库组织要采用国际、国内标准,或通用格式,主题词与索引要规范化,有关方面对数据库类型(如书目、全文)要制定明确的规定。同时,要注意保护国家和产业机密,制定数据库密级制。

3.2 信息服务

(1)让数据库生产和数据库检索服务分家 长期以来我国信息产业存在着“自己生产,自己销售”的方针,数据库生产者一般必须同时提供数据检索服务。这样的结果,一是数据库生产者因应付联机服务而不能将精力集中在数据库的生产和更新上,造成数据库的水平、重复和停滞;二是一个数据库生产单位很难同时保证拥有高水平的用于联机服务的计算机硬件、软件、网络系统和人员等。检索服务只能勉强维持初级水平的运转,这是造成低水平信息检索服务以及多数信息服务单位长期亏损和长期由政府补贴的原因之一。这种局面不打破,我国信息产业不仅不可能冲出亚洲,走向世界,甚至连在本国的信息服务质量也不能保证。

我们认为数据库生产和数据库检索服务应该分家,就象写书的不一定要管卖书一样。同时,应引进竞争机制,打破过去按专业领域、按中央和地方、按部委、公司划分的信息服务设置,建立全国或地方的,跨专业、跨部门的,国营或私营的信息服务单位。在此基础上产生有世界竞争水平的信息数据库超级市场,提供与世界先进水平相当的信息服务。

(2)由信息服务部门对数据库进行增值处理 一旦有了为数不多但服务质量高的信息数据超级市场,信息服务部门或公司应针对用户的需要,对数据库进行二次加工或增值处理(VALUE—ADDED PROCESS),增加检索深度和扩充索引点,从而提高信息的价值。

①增加索引深度。以INSPEC数据库为例,世界上几乎所有大的检索系统都提供INSPEC的查找,但各系统对数据库的增值处理水平不同。在DIALOG上使用INSPEC数据库,用户可以从几十种途径查找,除了大家都用的主题、分类、关键词等外,DIALOG为其建有多种化学查找途径(CHEMICAL INDEXING)和数值查找途径(NUMERICAL INDEXING),文摘中提到的各种数据都被分析出来形成检索点。目前我国的数据库往往由于硬件的限制甚至连最基本的一些检索途径都无法提供,这样会造成用户难以查到最合适的文献和系统难以使用等问题,而这后面的影响便是那些一去不复返的“伤心户”,这无疑是任何系统都应避免的败笔。

②扩大索引的兼容性。从单个数据到整个数据库,从一个数据库到多个数据库联检,对联机服务来讲,是一个从量变到质变的过程。信息服务单位如果在设计上注意到索引格式的通用性,用户可以一次从评论性文摘一直查到有关专利而无需改变检索词。提供联机服务,不是简单的将几十种数据库汇集在一起,而是通过数据的再加工,将他们变成互相关联的整体。

③提供联机检索工具。由于多种数据库可以一起检索,这就提供了一些新的检索要求。例如除去检索中来自不同数据库的重复记录、比较各数据库中的类似信息,或选择部分数据库进行联检。信息服务单位需要根据用户的需求,在整体设计的基础上,提供多种辅助检索工具。

(3)建立配套的文献源服务体系 国际上大型数据库的生产者都建有配套的文献库(Clearinghouse)和相应的文献递送系统,通过数据库服务商统一管理文献的全文递送是十分普及的手段。我国在各行业内部和高校系统内部也有多年合作历史,但目前这种体系和手段都无法应付较大规模的文献需求,急需改善。这不仅是及时递送文献的问题,也是协调资源、节省不必要的开支和重复、避免侵权违法行为、实现科学管理和经营,提高经济效益的问题。信息服务机构和数据库生产者应共同参与这一体系的建设。获取全文已经成为许多用户查找信息的目的,信息服务单位在提供文摘性数据库的同时,也要注意收集提供文献源的题录性索引。

(4)培养世界水平的信息生产和加工人员 目前,利用INTERNET技术提供联机检索和用万维网(WWW)为终端检索界面的方法已在国际信息检索系统中日益普及,INTERNET和WWW走入普通人家是发达国家拟定的21世纪目标之一。在以INTERNET为基础的信息服务技术方面,我国起步并不太晚,如果能抓紧时间赶快培养一批跨世纪的信息人才,应能使我国的信息产业缩小与发达国家的差距。国家科委应和各大信息研究所、高等院校信息管理系合作,针对数据库生产和联机信息服务两方面,建立系统化地培养中国信息生产者的教育培训项目,以培养具有世界水平的数据库设计和加工专业人员和专家。在这方面,特别应注意我国与发达国家间的差距。

(5)利用中国的优势,快速发展高水平的信息服务系统 根据我国国情,利用现行体制,在国家科委或其他政府机构的协调下,进行跨行业合作。利用邮电部、电子工业部、和国防科工委的网络条件,利用信息所、高校和中科院已有数据资源,以及我国在中文信息开发技术领先的地位,首先建立我国信息服务业在亚洲的领先地位。欧美国家不会十分注重亚洲文字的数据库开发,如果我们与日本、新加坡、韩国进行互利开发,提高信息服务系统的地位,就可以以优惠条件从欧美大信息系统公司获取西方信息资源。甚至兼并西方大信息公司,就象日本JICST成为STN的拥有者一样。

我们认为,只有当中国完善了自己的信息生产和服务系统,才可能促进世界对中国文化和科学财富的了解,促进国际交流和合作,并在世界信息市场上建立起中国的牢固地位和声望。

本文系作者在1996年递交给国家自然科学基金会的《图书馆信息科学留美学者1996年夏回国参观讲学活动汇报》报告及附件的基础上扩展而成。

标签:;  ;  ;  

如何应对21世纪中国信息产业的挑战_数据库系统论文
下载Doc文档

猜你喜欢