信息工作现代化--中国数据库资源的合理配置_数据库系统论文

信息工作现代化--中国数据库资源的合理配置_数据库系统论文

信息工作现代化——中国数据库资源的合理配置,本文主要内容关键词为:中国论文,数据库论文,工作论文,资源论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1中国数据库资源储存现状与存在问题

1.1 建立数据库资源的机构情况

中国的二次文献数据库分布在全国不同等级的机构中,并且自成系统。若从数据库类型的 角度来看,可以区别出三种情况:一是专利、标准和档案信息资源,已由国家专门职能部门 管理和建库,基本上形成了国家级和地方省、市级保障体系。如中国专利数据库、中国产品 标准数据库等;国内正式出版物和学位论文,也有了法定的呈缴本制度,构成了比较完备的 国家储存体系;二是科技报告、会议文献、产品目录、政府出版物等特种文献数据库,虽然 习惯上已作为有关信息部门建库的重点,但没有明确其法定义务,从而未能形成可靠的保障 ;三是图书与期刊存在着比较普遍的重复收藏建库现象。在我国,政府下属各级信息管理部 门在条块分割、内容重复的馆藏体系中出现了不合理的重复建库弊端,应当成为今后我国加 强数据库宏观协调的首要任务。

1.2 数据库收藏信息范围及其状况

1992年我国出版的《数据库指南》仅收入137个数据库,其中大部分是在10mb以下的;而19 95年经筛选收入《中国数据库大全》中的有关文摘、索引、题录数据库已有1028个,其中10 0mb以上的占25%。除了在1994年我国正式接通因特网的中国科技网(cstnet)、中国公用计算 机互联网(chinanet)、中国教育网(cernet)和中国金桥信息网(china)外,还有中国人民大 学书报资料中心(光盘),是在数据库建设史上起步最早、收集学科内容最多的数据中心,也 是我国数据库建设的领头羊;在书目数据库中,北京图书馆书目数据中心整理并制作的从19 49年至1998年全国书目数据是数量最多、品种最齐的书目数据库,为全国书目数据库建设起 到了保障作用;到目前为止,上海图书馆收集并输入社科类中文期刊约4000种(不包括科技 类期刊),是上海中文期刊与制作的一级库;中共上海市委党校图书馆建立《中国社科参考 信息数据库》收入当代中国哲学社会科学现刊约3200种,基本上覆盖了全国邮发和非邮发的 期刊。目前,第一张光盘(约70万条)已发行,是全国党校系统第一家社科类数据库;尤其是 近年来,又涌现出一大批大型源数据库。如《人民日报》、《中国学术期刊(光盘)·专题文 献 数据库》(简称“CAJCD”全文数据库),附图形、数据、图像和多媒体技术,将我国数据库 建设推向一个新的局面。“CAJCD”集中国3000种中英文科技、社科期刊全文集成,分16个 专业系列,82个专题,96张光盘,可称为“中国理工科、社科类期刊思想库”;此外,在19 98年1月中国社会科学院实现了联网,建成了1个主干网和8个局域网,2200个节点联网系统 。

从上述资料和统计情况可以得出:“CAJCD”综合性数据库类期刊(包括工业技术)和社科类 期刊几乎包括了所有中国刊物。按照《中图法》基本大类统计,在38个大类中,“CAJCD” 数据库就占有32个大类,占全大类的84%;北京图书馆书目数据中心所收录中文书目数据总 量占整个《中国法》类目的95%以上,是我国书目数据最后的保障体系。由各系统组成了庞 大的信息资源转化为数字化信息上网后,将会极大地提高我国信息资源共享的程度和科研的 效率。从学科划分的优势来看,建库工作应该先从基础好、经济投入有保证、各种专业人才 齐全的馆或信息机构着手,集中力量建重点库,以提高中国数据库建设的整体水平和数据库 建设的保障能力。综观当前全国各省、市和各部委已建成的各种类型数据库来看,大部分图 书馆组建的数据库优势还比较薄弱,个别馆“孤军奋战”,或者借助外界力量协助建库,仍 尚未形成快速、方便和可靠的保障体系。

1.3 数据库内容大量重复

产生数据库内容大量重复的主要原因,与各个建库部门订购和搜集的期刊和图书内容雷同 是分不开的。据1992年我国出版的《中国数据库指南》报道,137个数据库所收入中文期刊 和中文图书品种与内容相同的占整个266个学科的25%;依据《中国数据库大全》1995年统计 的文摘、索引、题录数据库共1028个,按照《中国法》分类体系划分,理工科(包括工业类) 数据库重复率约占27%;社科类数据库重复率约占42%。其中还不包括一部分交叉学科内容上 的 重复现象。从建库情况看,主要表现在按国家标准输入的数据少,建库队伍规模小,类型单 一,缺乏市场竞争能力;多数数据库存在生产周期长、质量控制差等问题。究其原因有,对 数据库投资不足,技术力量薄弱,宏观控制滞后等问题,而且大多数数据库只供本单位、本 系统内使用,能够上网服务的不足10%。另外,对数据库发展的调控不利,也会造成重复建 设的问题。如:在已经建成了“中国学术期刊(光盘版)·专题文献数据库”后,相继又出现 了“中国医药信息网”,下属8个数据库的总容量已达50万条,其中大多数内容与“CAJCD ”医药卫生大类重复。类似这种现象,在社科数据库中同样存在。如:北京文津、上海图书 馆、中国社科院、中国人民大学等数据库光盘的内容都存在不同程度的重复。

2中国数据库配置的原则及指导思想

2.1 配置原则

中国数据库配置是一项十分艰巨而又复杂的社会工程,应当遵循下述几项原则:

(1)符合国情原则。要从中国地域辽阔、交通不便、文献信息事业不够发达、投入经费少的 实际情况出发;并按照我国部、委、办纵向和横向领导体制特点,建立全国上下有机互联的 文献数据库资源的保障体系;还要充分考虑已经建成的各种类型数据库的系统分布和地区宏 观格局,发挥不同类型、不同级别数据库的基础作用。

(2)一库完备性原则。一个数据库要力求做到收齐某一学科门类文献,保证每一学科至少有 一个数据库负责收藏。不论哪一类学科信息资源的收集都要达到相对完备,以满足用户对这 一学科需求的95%为目标。

(3)多级保障原则。我国为树状管理模式,应该建立树状的数据库保障体系原则。基层库只 满足本单位用户需求,基层库无法满足的用户需求,由地区库或者上一级库保障体系来满足 ;省、市一级数据库保障体系应当力争满足本地区用户需求80%左右;国家级保障体系为所 有用户的保障。

(4)分工协调原则。分工协调,是指承担某一学科领域范围文献资源的收藏任务。所承担的 学科类型,要考虑该馆文献数据库建设的基础和优势。在坚持这个原则的前提下,数据库建 设要抓好两头:一是集中人力、财力,建设若干个国家级大型数据库;二是要抓有特色的小 型数据库的评估和改建工作;利用网络化平台,实现数据库查重、协调采购,减少不必要的 重复,达到各个系统、各个学科之间数据库资源的合理布局与建库经费的合理使用。

(5)数据库资源共享原则。应该打破“条块”、“地区”、“行业”界限,允许所有上网用 户的合法使用;政府要制定数据库资源管理和共享的方案,建立高效、方便和经济实用的数 据库存取和传递系统,充分调动和发挥各系统特色数据库的作用。

2.2 指导思想

合理配置中国数据库资源的指导思想应以学科布局为基础,充分发挥综合性数据库的核心 作用。建立一个学科数据库管理中心。在各级文献数据保障体系中,只有根据不同的情况, 按照学科门类合理布局的原则,才能使全国的数据库资源保障体系更加完善、可靠。国家一 级数据库保障体系,也应该按照学科门类布局模式建立,其好处如下:

(1)某一数据库由某一学科所在部门组织建库。其优点是:对这一学科应该收集的文献信息 资源在收集范围、数量上有一个限定,达到在这一学科领域内信息资源收集的完整性、专业 性以及系统性。同样,可以进一步提高该学科数据库的建库质量。

(2)避免重复,节省建库经费,培养人才。将全面收集各学科文献信息的任务,分配给众多 的在这些学科方面已经具备优势的文献信息机构,由他们负责组织建库。这样,既可以促进 这些单位将力量集中到所承担的学科门类研究上,又不致于过多地增加国家建库经费的负担 ;避免重复和浪费,通过实施这一措施,可以培养出一大批复合型的信息管理人才。

(3)有助于网上检索与交流。按学科门类布局建库,有助于相关学科之间上网、联网;有助 于有针对性地检索和交流,节省时间与上网费用;减少网上拥挤现象,并可提高用户的特殊 需求检索的查全率和查准率。

3 中国数据库配置的对策与措施

3.1 建立中国数据库发展协调委员会

在文献数据库分属于不同系统和部门,分布在不同地区的情况下,没有中央的宏观规划指 导和调控,没有一个权威的行政领导机关,组织协同将难以取得成功。

中国数据库发展协调委员会应该是国家一级行政管理单位,它有责任、有能力组织和协调 全国各大数据库的经费支出和发展规划。其任务是负责制定全国文献信息机构在建库方面进 行跨学科、跨系统地进行评估和验收,并制定上网运行措施,确立其建库的信息资源共享原 则。

3.2 按学科性质建库,制定我国数据库发展的合理布局方案

为使我国二次文献数据库顺利地发展和进行合理配置方案得以实现,在制定我国第十个五 年计划之前,应当制定我国信息产业长远的规划以及确定国家级、地区级、系统级不同数据 库布局方案。比如:国家级数据库保障体系的建立,可以分三个阶段实施:首先,完成国内 完备性较强学科的布局任务,使国家级保障体系的学科覆盖率达到60%以上;第二,对文献 信息资源完备性不高甚至空白的学科,选择文献信息基础较好的单位强化收藏并建库,使国 家级保障体系的学科各门类数据库覆盖率达到或者接近100%;第三,对于各地区、各系统和 各 部门所属成员单位所建的不同类型数据库,通过专家评估和鉴定后,对于那些学科性质完全 重复、数据内容相同的建库机构或部门,采取停建、改建或者合建的方案,予以必要的调整 。

3.3 发挥综合性数据库的导航作用

各系统有特色的综合性数据库,是国家重点投资与建设的数据库出版、发行中心,是国家 重点保障体系之一。如:北京图书馆、中科院图书馆、中国社科院图书馆、上海图书馆。还 有“中国学术期刊(光盘)·专题文献数据库”,它们应该在全国文献数据库配置中起到导航 作 用。在全国数据库保障体系中,综合性数据库的性质和作用是任何一个学科数据库都无法替 代的,他们有综合性学科、交叉学科和新兴学科文献收藏的基础及其优势,甚至有特殊文献 储存于数据库中,他们一般是独立的数据库,便于组织协作,便于协调订购或者进行联合 攻关,是用户了解和利用综合性数据库的有效中介;他们可以对其他筹建数据库的单位提供 培 训与指导,促进数字化联网与资源共享。当前,我国政府应该采取有效的行政干预措施,优 先发展国家级综合性数据库,发挥其在全国各系统、跨学科领域信息资源互补、共享以及上 网联网等项任务上的导航作用。

3.4 建立全国“一盘棋”的数据库网上互借体系

由中国数据库配置发展协调委员会负责制定这一系列保障数据库在网上互借畅通的措施, 颁发全国统一的网上文献源互借规则,包括网上互借协议、具体方法、期限、费用等,形成 一个全国网上互借法规。从目前我国实际情况出发,可以采用以下三个层次的网上互借模式 :

(1)地区互借网。这是网上互借主体部分,由三部分组成:一是地区数据库的互借中心,设 在本地区馆藏资源较为齐全的馆内;二是综合性互借网,主要由综合性大学图书馆,省、市 级信息机构组成;三是专业性网上互借体系,由科学院,科委系统研究所,单科性或专业性 高校图书馆及省、市工业系统研究所组成。

(2)国家级网上互借中心。这是地区性互借网上最后的数据库保障体系;由北京图书馆、中 国科学院、中国社科院等国家一级数据库构成并承担国际范围内的网上互借任务。

(3)地、市级网上互借体系。这是网上互借的基础,其特点是不分图书馆、情报机构类型, 就近组织网上互借,以求得能够尽快满足邻近用户在网上互借的需求。

标签:;  ;  ;  

信息工作现代化--中国数据库资源的合理配置_数据库系统论文
下载Doc文档

猜你喜欢