现代信息组织的特点及发展策略研究_数据库系统的特点论文

现代信息组织的特点及发展策略研究_数据库系统的特点论文

现代信息组织特点与发展策略研究,本文主要内容关键词为:策略论文,组织论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

现代信息组织是对具有科学价值的文本、图像、声频、视频、影像和软件以及科学数据等多种媒体信息进行选择、著录(或称编目)、标引、存储、整序与维护,实现序化与知识增值,并提供手工与计算机高速跨库连接的电子存取过程[1]。它起源并包括传统图书馆学情报学中的文献编目、分类标引、主题标引、文摘编写、现代网络信息索引数据库建设及现代电子信息存取系统建设等内容。当前信息组织发展面临的挑战来自两个方面:其一,世界经济和科学技术的突飞猛进,使现代信息组织的用户不仅涉及面广,而且多为终端用户,他们对信息组织技术及其成果的易用性和透明性具有明确的要求;其二,信息载体的多样化和信息资源的海量增长使信息组织对象从单一文本迅速扩展到包括文本、图像、声音、动画等在内的各种媒体信息。事实表明,以电子计算机、网络技术、多媒体技术为主的现代信息技术的发展不仅把信息管理推上了一个新的发展水平,也将信息组织的手段与技术带入到一个新境界,现代信息组织的技术与水平已成为人类社会文明程度的重要标志之一。研究现代信息组织的特点与发展策略有助于深化与拓展信息组织的理论研究与实践,促使信息组织在保障社会信息资源的有效管理和充分利用方面发挥越来越大的作用。

1 现代信息组织的特点

1.1 现代信息组织社会化

现代信息组织(Information Organization,简称IO)作为科学文化发展的催化剂,它和人类社会的发展演变息息相关。近20年来,伴随着社会信息化的进程和信息处理技术的进步,“愈演愈烈的信息爆炸”和层出不穷的信息媒体使信息的揭示、描述、整理和加工、控制与重组等系列过程及方法拓展到各类行政管理与办公部门,有关信息组织的理论研究和技术也成为软件生产、数据库设计与研制、人工智能、超媒体、术语学、数据仓库、可视化研究、办公自动化等领域共同关注的课题——这是现代信息组织社会化特点的重要表现方面。

再者,信息组织活动打破了信息单位各自为政的桎梏,走上联合与协作发展的道路。从实践考察,信息组织活动的联合与协作起源于网络化的联机编目工作。20世纪60年代,计算机逐步应用于编目领域,自LC(美国国会图书馆)先后研制成功MARCI及MARCII后,采用电子及光电技术进行编目成为60年代后期新型的计算机编目手段,其优点是:①可促进编目工作标准化;②缩短编目流程,加快书目信息的存储与传递速度;③可一次输入,多次输出;④为编目工作网络化提供条件。美国是世界上实现联机网络编目最早的国家,其中最大、最著名、影响最广的联机编目网络系统是OCLC。至90年代中期,全美已有8000多个图书馆,约96%的新到资料利用这个联机系统中的书目记录进行编目,各馆还可以同时向该系统输入本馆的原始目录记录,以供其他单位享用。与此同时,RLIN(Research Libraries Information Networks)研究图书馆信息网络编目也拥有广泛的用户。美国是社会化联机编目网络的先驱,它为世界各国编目工作的社会化与网络化积累了宝贵经验。

我国图书情报部门文献编目工作社会网络化起始于20世纪90年代中期。从19世纪中叶开始,其管理方式逐渐由图书情报单位各自为政转向本国范围集中编目(Centralized Cataloging),即由一个编目中心负责统一编制款目记录,以便为多个文献管理单位提供书目信息,这是我国信息组织社会化的一个里程碑。集中编目有助于编目工作标准化,可避免重复劳动,降低成本,提高目录质量。合作编目也称为分担编目,它是在集中编目与联合编目的基础上发展起来的一种编目形式,它也是在Internet互联网环境下,在编目工作标准化和自动化的基础上所形成的一种新型的联机书目信息交流形式。这种社会化的信息组织形式大大提高了人类信息资源的共享程度。经国务院批准的我国高等教育“211工程”总体建设规划中的CALIS,其重要功能之一就是实现高等学校联机共享编目信息。社会信息化促使信息组织活动从图书情报档案机构的封闭王国走向开放,从个体分散经营走向社会化,这是由信息资源的社会性、信息用户的社会性和信息交流的社会性所决定的。

1.2 现代信息组织产业化

近30年来,在我国社会主义市场经济体制不断完善和信息产业化程度日益提高的大环境中,信息组织产品的商品属性逐渐为人们所认识,信息组织产品的加工与研制(如书目与索引编制、数据库开发、信息存取系统建设等)已经走向市场,有偿信息产品服务已逐步为用户所接受。据考查,国外信息组织产业化孕育于20世纪50年代,至70年代中期进入稳步发展时期。由于信息组织产品可以转化为商品,大量文摘索引服务社和书目数据公司便产生与发展起来,使具有特殊社会经济价值的信息组织产品的生产和流通逐渐呈现产业化和商业化的趋势。主要体现在以下三个方面:其一,随着社会信息需求的不断增长,数据库等信息组织产品的研制与服务已由早期分散的、小规模形式发展成为集中的、多种数据库的大规模生产与销售服务,并已在全世界形成了几十个大型的跨国数据库服务中心,逐步形成国际性的数据库销售体制。与此同时,数据库服务业和数据库生产逐渐分离,走向了专业化和商业化的道路。其二,一些国际与国家范围内的商用信息存取系统层出不穷。国际联机存取系统DIALOG、STN、OCLC等早在20年前就先后投入商业营运;传统的印刷型文摘书目等检索刊物也在20世纪80年代由单一印刷型产品纷纷转为磁带型、网络型书目数据库等多类型共存的产品。目前,80%的综合性与专业性存取系统实现了网络型、磁带型与印刷型检索刊物的并驾齐驱,如著名的检索刊物《化学文摘》CA、《生物学文摘》BA、《科学文摘》SA等均同时出版印刷型、缩微胶片型、磁带型与网络版,各类书目数据库开发的产值逐年增加;其三,信息组织产品类型和数量不断增加,其产品提供与传递服务产值不断增长。除传统的目录、索引、文摘等外,电子信息产品十分丰富,如各类书目数据库、事实数据库、导航系统等层出不穷。并且,其信息产品的传递与提供服务已突破其单一的公益性,迈上有偿与公益相结合的台阶。20世纪90年代以来,联机检索服务直接通过WWW网络向用户提供个别服务等商业活动的模式也十分丰富。

总之,信息组织活动社会化,产业化和商业化是信息时代的产物,是网络技术革命发展的必然结果,也是现代信息组织的重要特点。

1.3 现代信息组织标准化

信息组织的标准化问题历来是学术界普遍关心的问题。现代信息描述与著录经过了100多年的实践,从随意编目到一国和跨国统一编目,直到20世纪才迈开国际标准化的步伐。目前,国际上普遍认可的三个标准是《文献工作—磁带上文献书目信息互换标准(ISO2709-1973(E))》、《通用信息技术—置标语言SGML(ISO8879-1992)》、《管理、商务、交通的电子数据交换EDIFACT(ISO9335-1989)》。此外,西方国家,如英、美、加等英语使用国的文献分类工具基本统一使用“LCC”和“DDC”,这两个分类法经过一个世纪的实际使用,屡次修订,已成为国际公认的比较成熟、质量较高、为世界各国广泛采用的文献分类组织工具。我国目前普遍使用的《中图法》和《科图法》经过不断修订,其科学性和逻辑性也在不断加强。不仅如此,文献主题标引工作标准化于20世纪80年代在西方国家普遍推广,除LCSH外,分类主题一体化的模式也备受信息组织理论研究与实践领域的关注。我国的一体化分类主题词表——《中国分类主题词表》也于1994年正式出版发行,“在版编目”(CIP)则是我国于1999年启动的一项信息组织标准化的重要措施。当前,在图书馆自动化管理集成系统中,CNMARC作为一种数据交换格式已广泛应用于国内图书情报部门。另外,随着Internet网络信息资源的指数级增长,DC作为专门用来描述Internet信息资源的元数据标准也处在不断完善充实之中。自1995年DC问世以来,经过不断的改进与发展,逐渐以其使用简单、灵活、易于理解而成为一种较为成熟的元数据标准格式。目前,关于因特网网络信息组织的标准化问题已在学术界引起广泛重视,笔者深信,随着网页信息组织相关标准SGML、HTML,特别是新一代因特网基础语言XML的发展应用,网络信息组织的标准化工作将会有一个质的飞跃。

1.4 现代信息组织手段与技术的现代化

自1946年第一台电子计算机在美国诞生后,计算机技术便被逐渐应用于信息组织工作。如1954年,美国海军兵器试验站首次将计算机引入书目工作,该站采用IBM-701型计算机建立了世界上第一个书目存取系统;同期卢恩(Luhn)创造了题内关键词索引,开创了机编索引之先河。进入20世纪60年代以后,书目工作自动化有了进一步发展,首先是机读目录MARC研制成功,它极大地推进了信息组织现代化的进程。20世纪70-80年代以来,信息组织的现代化领域不断扩展,从文献编目自动化走向文摘自动化、检索网络化、翻译自动化、索引自动化,其实现方案也层出不穷。如我国上海交大王永成教授等人对自动文摘的研究与实践是对主题标引自动化的一种尝试,目前已取得令人鼓舞的成绩。另一方面,在此期间除机编书目、机编文摘之外的其它信息组织载体与技术也发展很快。如自1978年光盘技术问世以后,1979年第一个实用光缆通信系统在芝加哥投入使用,20世纪70年代末80年代初,可视数据存取系统在英、法等国得到实际使用,所有这一切,极大地促进了信息组织手段与技术的现代化。更可喜的是,与计算机自动索引、文摘,网络联机编目等信息组织技术发展同步的信息资源自动标引在此阶段也取得了十分显著的成绩。特别是有关自然语言的自动标引将信息揭示与标引推向了一个崭新的发展阶段。当前,随着自动分类、自动标引、元数据及数据仓库技术和信息推送技术的进步,有关信息组织人工智能技术的研究与应用有了进展,如自然语言理解、知识的表示与获取、超媒体、专家系统等均取得了一些成果,一些用于自动分类标引、自动抽取、收集和产生元数据的软件已经问世。它们将对网络信息的深层次揭示与挖掘,更好地满足用户不同的信息需求产生积极的推动作用。

2 现代信息组织发展策略

由于因特网目前已成为世界上规模最大的信息资源库和全球范围交流信息最主要的渠道,因此,网络信息组织成为现代信息组织的主要对象。当代信息环境要求网络信息组织以用户为中心,综合运用自然语言和人工语言(分类语言、主题语言)的原理与方法,充分采用新兴技术,遵循实用性和易用性原则,以满足用户不断增长的信息组织需要。具体来说,推进现代信息组织理论研究与实践发展宜从以下几个方面着手:

2.1 注重现代信息组织理论研究与学科建设

由于信息组织对信息资源的控制与管理具有全面、准确与持久的特点,可弥补人脑记忆之不足,因此,在人类发展的历史长河中,信息组织为社会信息资源的有效控制与管理、有效开发与利用承担着无可替代的作用。而现代信息组织则是现代信息技术在网络环境下与传统的书目工作、编目工作、分类标引、主题标引、索引工作、文摘工作等的有机集成。学术界应加强对现代信息组织的理论、方法、概念系统等全方位研究和学科建设,促进信息组织从传统的分类学、编目学、索引学、检索语言等专题研究向着以网络信息组织为主导的现代信息组织学转型,为满足用户对网络信息的精确性、动态性、全方位需求打下了理论与实践的基础,当前尤其应加强以下方面的研究:其一,有关现代信息组织的概念、原理及现代信息组织学研究对象,学科基础与学科体系研究;其二,如何利用现代信息技术迅速实现信息组织从手工操作向数字化、自动化、网络化、智能化转变的理论与技术;其三,现代信息组织发展过程中所出现的新问题及如何通过信息组织实现信息过滤的理论、技术与方法等。

2.2 推进信息组织活动国内合作与国际协作

如前所述,网络环境下的信息组织工作不再仅限于图书情报机构专业人员,更多的信息用户将成为信息组织的直接参与者。信息组织和检索活动已渗透到社会的各个行业、各个领域,成为各行业部门业务的组成部分,工商企业、金融机构、政府机关、公安检察和交通运输等部门也会不断组织加工处理本领域的各类专门信息,建设专门的信息存取系统,信息组织的方法与技能将成为人们求职与发展的职业技能。

由于网络信息组织是一项涉及面广,需要多方面力量付出巨大代价的持久性工作。因此只有世界范围内的联合与协作才能有助于提高信息组织的质量并实现规模效益,因此,应该强化网络信息组织的国际协作。近十年来,国内外图书情报界已经开展了多项网络信息组织合作化的有关活动[2]。如IFLA发起的“全球书目控制和国际机读目录核心活动”(Universal Bibliographic Control International MARC Core Activity,简称UBCIM)以及所编辑和出版的《国际编目与书目控制》(International Cataloguing Bibliographic Control,简称ICBC)杂志等,为国际信息组织的联盟与合作提供了国际舞台。众所周知,OCLC一直在书目控制与资源共享的协作中扮演着世界中心的角色,国际图书馆协作体联盟(International Coalition Of Library Consortia,简称ICOLC)则是将各种协作体组织起来进行管理的组织机构,目前其成员有来自世界各地的约160多个图书馆协作组织。笔者认为网络信息组织的国内外协作有必要超出图书情报领域,扩大到包括整个信息生产链上的其他所有参与者,包括网站内容创作者、出版商和信息资源系统建设的合作和集成者等。总之,网络信息组织已经成为一项超越学科、超越部门、超越语言和国界的国际信息社会化工作,如果没有国内外的相互合作与专业化、自动化,仅仅依靠传统的、分散的个体经营方式是无法满足当今社会对信息资源组织的自动化、高效化及精确化要求的。

2.3 增强信息组织的过滤功能

网络信息的来源复杂多样,随意性大,信息的生产和传播缺乏筛选和审定,其信息的可靠性、质量和价值经常受到用户的置疑。为此,增强信息组织的过滤功能成为广大信息用户的紧迫要求。当前国内外有关信息过滤的研究主要集中在两个方面:一是过滤不良信息,即在信息组织的过程中,设置一定条件限制用户获取某些不良信息,以净化网络环境,维护网络安全。二是过滤不相关信息,即采用相关技术手段建立用户模板、资源模板与匹配机制以确保向用户提供密切相关的信息。目前,因特网上信息过滤的主要方式是通过编制软件或在网络信息组织与利用程序中附加过滤功能,也允许用户设置过滤条件,例如用不希望获取的网址、某类主题、某种类型或范围的信息等。如基于内容的过滤、基于网址的过滤和将内容和网址结合起来对某些信息加以控制;还可以采用其他多种设备进行信息过滤。1995年由Microsoft,Netscape,American,American Online等39家公司公布的一种标签(Label)格式过滤标准,即因特网内容选择平台[3](the Platform for Internet Content Selection,PICS),它为因特网信息混乱的局面提供了一个行之有效的过滤手段和管理方案。目前我国也成功开发了若干因特网内容的选择和过滤系统(SICS),此系统通过对信息采用贴标签的方式,对信息进行内容的分级过滤,同时也给予不同用户以不同内容级的访问权限,以此实现对因特网内容的高效访问和有效管理。由此可见,网络信息过滤是网络环境下信息组织的重要任务之一,有必要将智能方法与推送技术融入信息组织,实现网络信息的有效过滤与筛选,以满足用户对网络信息的精确要求。

2.4 促进信息组织技术的智能化发展

信息技术的迅猛发展使信息资源的组织逐步趋于智能化,现代信息组织发展的趋势之一是实现智能程度更高的“知识组织”[4],即采用高度模拟人脑思想机制与习惯的方法来组织知识。智能化系统的特点是利用电子计算机,模拟人脑的推理、学习、思考,其基本建构程序包括知识获取、知识组织、知识推理、数据库配置以及解释单元等[5]。通过人工智能技术,可促进网络信息资源的深层次挖掘和揭示,更好地满足用户的不同需求,智能化的信息组织技术将能理解人们采用自然语言输入信息和正确回答用户提出的有关问题,能自动对输入的信息进行摘要,使用不同词语复述输入内容,还可将某一种自然语言表示的信息自动翻译为另一种自然语言等。有关信息组织智能化的关键技术包括:超文本、专家系统、自然语言理解、本体语义网、数据仓库、知识挖掘、跨语言翻译技术等[6]。笔者深信,信息组织的高度智能化必将给网络用户带来更大的实惠,使信息组织、信息检索与信息过滤更加方便、快捷和高效。

2.5 加速信息组织标准化与兼容性步伐

吴慰慈教授在《网络信息资源管理的标准化体系研究》[7]中指出“网络信息资源的特性要求我们必须规定信息揭示的统一标准和获取、使用信息的具体规则,以保证所有的信息资源都可以得到充分利用,同时也可确保每一个用户的信息需求都可以得到满足。”当前人们在利用数据库、联机系统和其他信息存取系统进行信息查询时,面对一些存取系统由于数据类型相异,往往表现出文档格式、记录方法、标引规则、检索方式、输出格式等不同,这就要求用户预先熟悉并了解所用存取系统的基本规则与标准才可能正确有效地使用。这无疑会增加用户的认知负担,从而影响信息资源共享,因此,信息存取系统组织结构与方法的兼容性和标准化问题成为网络信息开发与利用日益突出的问题。

如前所述,在信息组织的兼容性和标准化问题上,人们曾进行过有益的探索,如检索语言的标准化与各类编目规则的兼容等,其目的是为实现分类法之间的兼容互换及其与主题法的兼容[2]。例如,UDC与DDC正在计划合作编制地区表,希望在国家及地区概念的表达上取得一致。目前,我国几个重要网站都有自己的分类组织体系,彼此差异较大,无法兼容,给用户使用带来很大不便,因此,研究具有兼容性的网络信息分类标准,对规范网络信息资源的组织整序和方便用户检索具有重大意义。并且,随着国际互联网的普及和信息组织活动的国际合作化,信息组织相关标准的制订与推行问题变得日益紧迫,它是网络信息资源共享的必要前提。笔者建议应尽早成立相关机构或组织,以便有组织有计划地逐步推进网络信息组织的标准化与国际兼容的进程。

2.6 加强信息组织与利用的集成服务

当前,网络信息资源的多样性和广泛性客观上影响着用户对网络资源的有效利用,如何将网络资源按照某一标准采用有效的方式组织于同一界面或同一网络以方便用户甄别选用成为社会的迫切需求。信息组织与利用的集成服务是指将海量信息集成组织后通过一致的对外接口,使用户能方便快捷地浏览和访问各种异构信息[2],其中包括文档信息、电子邮件信息、共享代码、多媒体信息和数据库信息等。换句话来说,就是将网络信息资源和其他资源组织成集成化的信息存取系统,以便于用户在一个资源丰富的“信息超市”中浏览和选择所需信息,使用户获得对信息的“一站式获取”。这就要求信息存取系统能够为用户在同一界面上提供多种服务。目前,关于网络信息集成管理与服务正在成为业界的研究热点。学术界应该花大力气探讨如何通过现代信息组织方法和信息技术,使网络信息的集成组织与服务能够满足用户获取信息的便利快捷的要求,使用户能利用同一检索表达式或检索词对网络上的数字资源进行同步检索,以实现“全球获取,集成服务”的理念。笔者认为,面对丰富的网络资源,可以由一个网络资源管理中心进行统一规划,从宏观上进行协调组织与控制,首先可建立起若干个分工协作的导航系统,使之成为一个集成与分散相结合的网状放射型开发模式,供用户选用,对于学科专业性较强的信息资源则可根据需要建立专业性信息资源指引库。

2.7 加强用户界面可视化研究与实践

可视化是现代信息组织透明化和易用性的重要特点之一。由于多数用户缺乏计算机数据处理知识和必要的信息检索技能,他们要求信息组织方式和提供的检索方法简便易行,加强信息组织可视化研究与实践有助于这一目标的实现。信息可视化研究包括信息对象特征描述与组织的可视化、信息检索操作的可视化和检索结果的可视化。“一幅图胜过一千句话”这是对信息可视化作用的生动写照[8]。根据各类对象的不同特征,并结合数字图书馆、数字档案馆、电子商务、电子政务的信息资源管理的需要,对信息对象采用可视化的组织模式,实施信息组织的可视化可使用户勿需接触各类指令,避免繁琐的操作格式或规格而达到获取信息的目的。探讨和研究符合人性化的可视化界面操作菜单和按钮,可使用户能够更直接、方便、快速、高效地获取信息。当前,网络信息组织中用于指明信息资源方位与联系、具有导航功能的信息地图便是一种行之有效的可视化工具,它在解决信息迷航问题上具有明显的优势;相对于搜索引擎,信息地图不仅可以揭示信息的方位,而且能够展现各类信息之间的联系,使用户可从全局了解信息的分布状况。目前,可视化信息组织技术已经在地理信息系统(GIS)、产品设计、数字城市、数字地球等领域得到广泛的应用。因此加强信息组织过程中用户界面可视化的研究与实践是促进现代信息组织更加实用高效的里程碑。

收稿日期:2006-05-22

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

现代信息组织的特点及发展策略研究_数据库系统的特点论文
下载Doc文档

猜你喜欢