电子信息资源管理与书目_电子信息论文

电子信息资源管理与书目_电子信息论文

电子信息资源管理与目录学,本文主要内容关键词为:目录学论文,电子信息论文,资源管理论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

[中图分类号]G257

[文献标识码]A

因特网的迅速发展改变了信息的服务环境,加快了信息社会化和社会信息化的进程,人们获取信息的方式多种多样,对信息的需求呈现多元化的趋势。电子信息资源如雨后春笋般出现,对电子信息资源进行科学的组织管理和利用成为图书情报信息机构亟待解决的问题。目录学有着显著的民族文化色彩与时代特征。一个国家的一定时期的目录学总是与那个国家的一定时期的政治、经济、文化和科学技术发展分不开的,是在那个国家民族文化经济建设的历史的土壤中生长起来的。因而作为实用性很强的目录学,当然首先应站在时代的前列,探讨新的理论和方法,通过对电子信息资源实行科学管理,有效地揭示报导电子信息资源,以满足不同读者的多种信息需求。

本文拟从目录学知识在电子信息资源的组织管理,揭示分类和检索中的运用分析入手,探讨网络环境下,目录学在电子信息资源组织管理中的应用与发展。

1 电子信息资源的发展与目录学的困惑

电子信息资源是随计算机技术的发展,网络通讯技术的应用,因特网的广泛普及而产生的。目录学是一门历史悠久的传统学科,在中国有着悠久的历史和丰富的遗产。目录学又是一门实践性很强的方法科学,将目录学的方法应用到其他学科或社会领域中,会起到很大的推动作用,而对这些实践活动的总结又将极大地丰富、充实目录学的内容。当前电子信息资源管理与目录学的关系正是这种辩证关系的体现,也是目录学发展征途上一个新的十字路口。

1.1 电子信息资源快速发展

电子信息资源通常是指电子出版物(当然也包括人和机器)。电子出版物的概念目前有多种说法。依国家新闻出版署在1048号文《关于加强电子出版物管理的通知》中给出电子出版物的定义是:“系指以数字代码方式将图、文、声、像等信息存储在磁、光、电介质上,通过计算机或类似设备阅读使用,并可复制发行的大众传播媒体。”电子出版物的分类还没有统一的标准。有人认为可以将电子出版物划分为两大类型:一是光盘、磁盘等数字媒体脱机出版的数字资源;二是网络上出版的网上资源。网上资源又可分为两大类:一类是可自由存取的网上出版物,一类是限定使用的网上出版物[1]。电子出版物具有丰富多彩媒体信息表现;信息存储容量大,体积小;方便快速的信息检索查询;便于建立网络有利于资源共享;制作高效、出版迅速、发订速度快等特点[2]。进入九十年代以来,计算机、多媒体迅速发展,电子类图书、期刊相继出现,由于电子类文献集“图、文、声、像”于一体,且具有比印刷型文献优越的特点,使得电子信息资源正以惊人的速度增长。因特网上信息资源丰富,几乎包括科技、经济及社会中的各类信息。目前与因特网相连的网络已超过2000个,联网主机超过了500万台。全球用户已达9000多万个并且以17%的速度增长[3]。人们通过上网可以免费或付费方式借阅到因特网上的信息及其他图书馆的丰富馆藏资源。

1.2 目录学的困惑

目录学是实践性很强的科学,是书目工作实践活动的概括和总结。彭斐章先生认为:“目录学是研究文献的揭示报导与人们对文献的特定需求之间的矛盾”,陈光祚先生认为:“目录学是研究文献流的整序、测度和导向的科学”[4]。目录学从书目工作实践中形成与发展起来,并不断丰富具体的书目工作实践活动的内容。传统文献的揭示和整序是依文献的外部特征和内容特征来组织的。外部特征指书(刊)名、编著者、出版地、版次、刊期、引文等。文献内容特征的揭示主要有文摘、提要、注释、说明以及各种索引等。文献目录信息的组织方法有:分类组织法、主题组织法、引文组织法、时序组织法、地序组织法。传统目录索引组织传递的信息是固定的、小批量的线性结构的。而电子信息资源无论从文献载体形式、内容特征、传播方式等都与传统文献有所不同,因而目录学对电子文献信息的组织也必须有所创新,即使延用旧的组织方法,也必须将旧方式方法赋予新的内涵。

当这种种类繁多的电子信息资源海量涌现之时,目录学家不去研究如何适应这一现实,如何用现代信息技术手段参与到信息处理的大会战中去,突破现有的樊篱,开拓新的研究领域,自然就会感到迷惘和困惑。有人认为:“无论是在目录学的理论还是目录工作,目录服务的方法和技能方面,在现阶段都已很难独立于学术之林了。比如随着当今以光盘为中心的现代计算机存储技术的普遍应用,文献检索中全文检索已逐步取代了目录学所能提供的线索检索。需求发生了变化,服务也将随着发生变化。……此外目录学的学科的特点决定了目录学无法对社会文化、经济的发展提供直接支持,自然不能从社会获得相应的回报。如若不然,必将为社会所淘汰”[5]。还有一些文章也表述了类似的意见,一些院系取消了目录学课程也是这种困惑的反映。我们认为一个时期内目录学界出现这种困惑是部分目录学者未能或无力参与电子信息管理的焦急心理的反映,也可以说是目录学从一个旧的阶段向新阶段转变时期的必然表现,是一种凝视、观察、思考的精神状态。这意味着在沉思之后,开始新的探索,走向新的征程。计算机技术、现代通讯技术等现代化信息技术的发展与应用,固然给目录学带来的困惑提出了挑战,但同时也给目录学提供了新的机遇。实际上已早有人看到,“书目控制这一基础性文献管理技术事实上已被应用于网络资源的组织”[6]。不仅仅是已有的目录学知识和方法技术如何应用于现代信息资源的管理,更重要的是如何适应已经变化了的形势,适应电子信息资源的揭示和整序的需要,开辟新的研究领域,创造新的方法和技术,以在网络电子信息资源管理的新时代发挥重要作用。

2 目录学在电子信息资源管理中的应用

计算机的大量普及,加快了社会信息化、信息社会化的进程,而社会信息化、信息社会化的必然产物是网络化。网络环境改变了传统图书馆的信息源,大大丰富了图书馆的馆藏资源,将图书馆的藏书量从有限扩大到无限。网络信息资源无限无序,质量参差不齐,检索工具难于使用等,所有这些又给读者上网检索、利用电子信息资源带来了许多困难。有人曾对20个省市,17个专业系统446个单位的部分科技人员利用文献情况进行调查,发现查找文献来源只需花“较少时间”的人仅为25%,需要“较多时间”和“很多时间”的为75%;获关键性文献“比较困难”和“非常困难”的占83%,感到“不困难”的仅占17%[7]。随着因特网的迅速发展,信息污染、信息垃圾日益严重,人们查找、利用网络信息资源就越来越困难。即使在因特网发源地的美国,仍有绝大多数人不了解因特网,更谈不上如何利用它。匹茨堡大学的Taylor形容因特网上没有目录就如同无目录的一堆地上的书。针对因特网信息难查的问题,有关专家学者在短短几年的时间,开辟了网络导航方法及各种各样的搜索引擎。Taylor认为过去图书馆员所熟悉的对印刷信息进行组织的原理正在被人们无意地用来使混沌状态的联机信息有序化。有人已意识到“将图书馆学情报学在组织文献信息及书目控制方面的知识和经验从印刷世界转移到联机网络环境,是图书情报机构参与网络建设,管理网络信息资源的重要理由之一”[6]。人们已逐渐将目录学在组织印刷型文献方面的知识与经验运用到电子信息资源组织工作中去。

2.1 电子信息资源的组织

为了方便人们对电子信息资源特别是网络资源的检索、利用,图书情报机构必须利用科学有效的方法组织电子信息资源使之有序化。目前有些机构或组织正从事专门电子文献信息的收集,把它们收录到一个浏览服务器中,便于人们查找。如http://classics.mit.com/的“网上古典文学作品库”,其中收集了400多部著名作家的电子版作品,如哥白尼、亚里士多德、荷马等名作家的作品[8]。电子信息资源组织的数据结构与传统图书馆文献信息组织的数据结构是不同的。传统图书馆的文献组织是由排架号、目录和文献本身三部分组成。电子信息资源的信息组织则由指针、元数据和数据三部分组成。指针对应于排架号,用来标识数据的唯一指示符;元数据对应于目录,是一组用来描述数据本身特征的数据集;数据则对应于文献,是电子文献的基本信息内容。电子信息资源的信息组织从表面上看和传统目录对文献的组织没有太大的区别,当然信息组织的基本内容有本质的不同。电子信息资源的信息组织的基本内容包括:选择(从信息海洋中选择有用的信息),生成(搜索引擎、导航库等的建立过程),标识(用符号指示信息对象的实际位置),描述(利用规范化的检索语言揭示信息内容特征即所谓标引),整合(实现其它链路的连接)。电子信息资源的知识结构为网状结构,这个信息网的任何一个信息单元都与其相关联的信息点相联。对任何一个信息单元的搜寻都可带动其他若干信息单元的搜寻[9]。有人将网络信息划分为网上一次信息和网上二次信息两个层次,相当于传统文献的一次文献与二次文献。网上一次信息的组织方法有:(1)用于全文数据库建造的自由文本方式。根据文献中的自然语言揭示文献所含的知识单元,按文献全文的自然状况直接设置检索点。(2)超文本方式。将网络相关文本的信息有机地编织在一起,以节点为单位,节点间链路相连。(3)主页方式。将有关机构或个人的信息集中组织在一起。网上二次信息是将目录学关于知识信息组织的理论原理和方法运用到网络信息资源的控制上,构建网上一次信息的检索工具。起到相当于目录索引的作用。其组织目录形式主要有(1)查询器形式,是报导存贮网上一次信息的检索工具。(2)指示数据库。存贮有关网上一次信息的地址以及相关的关于信息的描述信息。(3)菜单方式。用来浏览网上二次信息,一般是围绕某一专题,采用分类法、地序法、时序法、主题法等方式,将与该专题有关的网上一次信息的网址和有关描述信息依次罗列。这种方式类似于手工检索中在某一专题下对款目的浏览[10]。

2.2 电子信息资源的分类

电子出版物与印刷型文献无论在载体上还是在内容表现形式上都有所不同,因而传统图书馆对文献的分类不完全适合对电子出版物的分类。电子出版物的分类又分为二种:一种是光盘、磁盘、磁带等脱机电子文献的分类;一种是网络上出版的网络资源的分类。

对于光盘型电子出版物,当前国内还没有关于光盘编目的详细、明确的规定。目前国内光盘主要用三种号码来标识,电子图书用国际标准号ISBN来标识;音乐、影像资料类光盘则采用ISRC号标识;定期或不定期连续出版物的光盘采用国际标准连续出版物号ISSN来标识。光盘编目中题名等著录信息源来自于其题名帧(相当于印刷型出版物的题名页,但必须依靠计算机来阅读和查找)。此外题名帧上的责任者未著录的,音像资料的演出者未作为责任者著录的,音乐作品中的详细曲目或其它文献中的有关内容未作分析著录的等项目内容,应该在附注项中的相关字段加以著录[11]。

为了更好地利用电子信息资源,认为“因特网信息资源确实需要编目和分类技术”的人日渐增多。对于网络资源的分类有人认为有自动分类、主题分类两种。

采用自动分类有如下几种:(1)北欧WAIS/万维网项目。该项目就是一个自动分类的实验项目。该项目通过使用UDC词汇和符号系统来提供对WAIS数据库的统一检索主题。当UDC词汇与数据库中的词相匹配时,匹配词就添加到关键词表中并赋予权重。这时WAIS数据库中的条目会被加上符号并链接到WAIS/UDC主题树中。(2)概念分析:诺伊斯指出,概念分析通过以概念等级形式来表现用户的解释能力,可以为知识和文献提供自动分类。这些概念等级对应于阮冈纳赞的《冒号分类法》之类的综合分类法中的分面。(3)UDC-AUTCS(国际十进分类法数字自动组合系统)。该系统首先以已被系统识别可作为文献核心的一个或数个术语为基础,从分类表中选出基本类号,随后系统再按照组配规则将这些类号组配成复合类号。(4)KBS-CROSS(用于分类体系自动交叉参照的基于知识的系统)项目。它是“一种计算机化的工具,它能就建筑学领域在UDC和LCC(《国会图书馆分类法》)之间进行交叉参照”。创建了一种类似于转换语言机制的东西,它允许把不同来源、不同语言的现有记录一起纳入一种可检索的索引中。实事上自动分类就是将《国际十进分类法》、《冒号分类法》、《国会图书馆分类法》应用到网络信息资源分类组织当中。

主题树的分类是传统分类法在因特网上的应用与发展,采用的是分类法的等级结构。用主题树分类的有如下几种:(1)Cyber Dewey。在该网站中,因特网资源都被赋以一个基于分类法的符号,不过它们并未经过完全编目,而且主题检索也很有限。用户在主题树的每一层级缩小检索范围,并逐层选择,一直到发现检索对象为止。(2)WWW Virtual Library(万维网虚拟图书馆)、赛伯书库和“图书馆公告板”。这些网站都是利用LCC(国会图书馆分类法)对学科专家和用户们所选择的资源进行分类。(3)NISS(全国信息服务与系统)项目。它代表的是在没有刻板的规则、专业编目经验和集中编目组织的情况下充分利用传统编目的长处的成功尝试。项目组请全英的图书馆员填写可以从NISS网页上联机获得的“资源描述模板”,而后把有关资源添加到NISS网页中。通过研究资源描述著录的产生、收集和分发,来提供透明地存取网络化资源。(4)OMNI(组织网络化医学信息)项目,该项目通过发现、过滤、描述、分类和标引等一系列过程,把网络医学信息资源加到网关中。事实上该网站就是传统目录学中的专科目录。(5)瑞典的有关项目。瑞典伦德大学电子图书馆和瑞典理工大学图书馆的工程电子图书馆合作创建了基于UDC的主题树。他们打算借图书馆学、情报学的方法,创建一个经过标引的可浏览和检索因特网电子信息资源的入口点[12]。综观对网络信息资源的组织分类,事实上目录学中对印刷型文献的组织加工方法已被应用到对网络信息资源的组织管理中。河内加州大学图书馆30多位馆员根据综合性大学的教学与科研的需要,重点选择学术性网络资源而研建的信息矿藏(InfoMine),及伯克利公共图书馆的“图书馆员因特网索引”(Librarians Index to the Internet)就是典型的目录学加工技术用于网络资源组织的成功案例。

2.3 搜索引擎的结构与利用

搜索引擎是因特网上一种网上搜索工具,通过对网络信息资源进行筛选、索引、加工,将搜索结果组织成一个有序的数据库,相当于目录学中的书目、索引、文摘等。搜索引擎通过对所需网络信息资源或网址进行自动索引,并将检索到的内容存储于可供查询的大型数据库中。其功能在于将集中起来的网址,分类提供给用户,以便用户快速查找到所需的信息。[13]搜索引擎都有其检索语法规则,大部分的搜索引擎都采用布尔逻辑操作符作为基本的语法规则。用NOT、AND、OR或括号、双引号、通配符、英文句点、字母T、U等符号作为其操作符。这些布尔逻辑操作符相当于目录学中对书目、索引、文摘的编排方法的规则,也即是著录标准。搜索引擎的编排原理也是和书目、索引、文摘一样。如有按主题编排的主题指南类搜索引擎Yahoo,其主题编排是依据印刷型目录工具的主题分类规则来编排的。还有按学科类型分类的搜索引擎如:专门收录美国1970年以来的所有专利信息的IBN美国专利。专门检索世界著名的Dialog系统中的科技数据网址的(KR Science Base)。专门提供免费检索的Medline医学数据库。全面收集学术性刊物为主的UnCover数据库等。据此不难看出搜索引擎即是网络信息资源的“目录检索工具”。

搜索引擎的出现给用户检索网上信息资源提供了方便,但搜索引擎不是万能的。据调查没有哪一个搜索引擎可以覆盖整个因特网的资源,就目前最大的Inktomi也只覆盖了一半可被索引的页面。各类搜索引擎各有特点,为了充分利用各搜索引擎的优缺点,有些搜索引擎相互联合起来,彼此利用对方现有资源,如FAST和Lycos的结盟。另外一种有效利用搜索引擎的方法就是捆绑方法。将若干个搜索引擎的检索入口放到同一个界面上,输入一个检索提问,可以利用所有这些搜索引擎同时检索。如Metacrawler就结合了Lycos、Webcrawler、Infoseek、Yahoo、和Galaxy等检索工具的检索结果来回答各种检索提问[14]。要想熟悉并灵活运用搜索引擎,就必须掌握其语法规则、布尔逻辑操作符及各种搜索引擎的特点和功能,只有这样才能运用自如。

2.4 基于电子信息资源的参考服务

面对高速增长的电子信息资源,图书情报机构如何提供电子信息资源的服务。笔者认为应从如下几方面入手:1、利用电子信息贤源扩大传统图书馆的服务项目的功能,其中当然包括目录信息服务的功能。如利用各种检索手段拓展网上信息服务。开展网上定题跟踪服务,为读者代查、代找网上信息,并及时将读者所需的信息通过网络传送到用户的计算机终端上。利用计算机网络建立虚拟馆藏,为读者提供网上馆际互借服务,通过本馆计算机系统借阅与本馆系统相链接的其它图书馆的丰富资源,实现资源共享。同时注意对搜索引擎进行分类、比较、掌握各搜索引擎的优缺点及检索模式,并及时将收集到的有关信息通过网络告知读者,方便读者查找、利用网络信息资源。2、建立指引库。指引库类似于专题库,专门存放有关主题或用户所需信息的网址。通过指明电子信息资源的信息分布情况,充当信息导航员。3、充分利用电子信息资源为企业建立虚拟资料室。企业的发展离不开各种有价值的信息,但因历史的原因,许多企业都没有建立自己的资料室。电子信息资源的出现为企业建立资料室创造了条件。图书情报机构可以通过搜集电子信息资源中对企业有用的信息资源进行组织、分类、加工,并存贮在某一网站上,为企业建立虚拟资料室。

通过以上分析可知,目录学知识和方法已经自觉或不自觉地应用于电子信息资源的组织管理、分类编目、检索利用,并且已经有人对这种应用开始进行经验总结,以便在电子信息资源管理的行程中少走弯路,提高效率。目录学研究者应该破除门户之见,更新知识,积极参与电子信息网络这一庞大的世纪工程中来,为21世纪目录学的发展开辟一块新的沃土。

标签:;  ;  ;  ;  ;  ;  ;  

电子信息资源管理与书目_电子信息论文
下载Doc文档

猜你喜欢