信息技术与信息科学的发展_情报学论文

信息技术与信息科学的发展_情报学论文

信息技术与情报学的发展,本文主要内容关键词为:情报学论文,信息技术论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 信息技术及情报学的产生与发展

信息技术的飞速发展和不断突破是人类在20世纪取得的最伟大的科技成就之一,信息技术差不多每十年就有一次技术创新,20世纪的第三次技术革命带来信息革命浪潮,不仅具有改天换地般的巨大技术能量,而且正深刻影响着社会的经济、政治、科技、文化、生活、价值观念等诸多方面。

得益于信息技术的进步,情报科学的产生和发展也在不断地呈现出崭新的面貌。从20世纪二三十年代开始,特别是第二次世界大战以后,现代科学技术进入高速发展的时期,现代化“大科学”的出现导致了所谓“情报爆炸”的局面。在这种形势下,科学情报工作不但作为一种独立的社会职业,而且作为国家科学技术事业不可分割的重要组成部分进入了崭新的发展阶段。50年代以后,情报学(Intelligence Science)也就作为一门崭新的科学学科诞生了。可以说由于社会信息量的剧烈增长,催促这门学科的产生,“情报爆炸”是情报学产生的前提。计算机等科学技术的发展,使这门学科的产生成为可能。目前,情报学已发展成为最充分体现现代科学技术水准的尖端科学之一,以计算机技术、网络技术、通讯技术等为代表的信息技术,已成为现代情报学的关键技术。信息技术体现在操作信息和利用计算机等工具处理信息方面,包括信息采集、传输、处理、存储、检索、分析、服务等。情报学的目标和基本任务是研究解决由“情报爆炸”带来的情报积累与利用之间的尖锐矛盾,运用现代信息技术等手段与方法组织知识信息,使之有序化,并以最快速度满足用户的信息需求,促进科学技术和经济的发展。因此,信息技术无疑是现代情报学的支柱之一,信息技术的发展推动着情报学理论和实践的向前发展。围绕信息技术进行的情报学研究会是情报学研究的重要内容,基于信息技术形成的情报理论及情报管理研究可构成信息技术主导论思想。利用信息技术,可以实现信息资源的数字化、网络化,实现检索工具的智能化和个性化,实现信息传递的全球化、网络化,实现信息服务的主动化和人性化,由此在技术层面推动和完善情报学理论。

2 理论界如何看待信息技术的推动作用

1983年7月2日,钱学森教授就“情报工作的科学技术”发表了重要讲话,指出我们应该把情报工作作为一门科学技术来研究,我们的情报工作再也不能像以前那样,仅仅是看作一项工作,必须把它考虑为一门科学技术,即把它纳入科学技术的范畴。

由中国国防科技信息学会情报学术专业委员会和中国科技情报学会理论方法与教育专业委员会联合召开的“新世纪初情报学学科建设、发展与应用研讨会”于2001年12月1日—5日在湖北省老河口市召开。以安卫国副理事长提出的“需求牵引、技术推动、基础保障”为主线,就新世纪初情报学学科建设、发展与应用等有关问题进行了热烈讨论。与会代表普遍认为,新世纪初情报学学科建设与发展要注重“信息技术推动”的作用,研究情报工作的科学性与研究情报工作的技术性并举,形成学科推动力。代表们还认为,18年来,钱学森教授这一重要论断为我们认识、发展、管理科技情报工作开拓了新的视野与原则,为探索科技情报工作自身规律,推动情报学学科建设指明了方向。发展情报学,不但要研究科技情报工作的科学问题,也要研究科技情报工作的信息技术问题。新世纪初,信息新技术应用日新月异,新经济形态的兴起,将会为我们发展情报学提供更为广阔的空间。

严怡民先生认为在20世纪60年代到70年代计算机技术得到迅速发展,在70年代后期和80年代计算机技术与现代通信技术的结合,使传统的情报信息工作面临严重的挑战,同时,也为情报信息服务工作现代化提供了重要物质技术基础。特别是20世纪80年代以后,信息技术的迅速发展,社会日益走向信息化,使情报学家认识到开展情报科学理论研究的重要性,从而加强了对情报学基础理论的研究。

情报学界普遍认为情报学在理论与实践方面,都充分利用了信息技术,不断完善自己的学科理论体系,情报学已逐渐发展为一门新兴的综合性交叉学科,正在迅速成长并显示了其旺盛的生命力。

3 网络环境下信息技术在情报学领域的应用

3.1网格(GGG)技术

中国科学院计算所所长李国杰院士认为,网格是继传统因特网、Web之后的第三次互联网浪潮,可以称之为第三代因特网应用。传统因特网实现了计算机硬件的连通,Web实现了网页的连通,而网格则试图实现互联网上所有资源的全面连通,其中包括计算资源、存储资源、通信资源、软件资源、信息资源、知识资源等。第三代Internet可称为信息服务网格(Information Service Grid),其主要特点是不仅仅包括计算机和网页、而且包括各种信息资源,例如数据库、软件以及各种信息获取设备等。它们都连接成一个整体,整个网络如同一台巨大无比的计算机,向每个用户提供一体化的服务。网格的根本特征不是它的规模,而是实现信息资源和知识资源的智能共享,消除资源孤岛。知识资源共享更具目的性。目的性体现在它已经不再是简单的资源互连和单一使用,而是通过互连、组合、协作解决用户需要解决的问题,产生具有附加值的新服务、数据、信息等资源,满足用户的新需求。

正在兴起的网格技术,为人们对知识信息的需求由文本单元向知识单元深度发展提供了实现的可能性,同时也要求人类采用新的知识组织方式来建立知识管理的大平台。它将改变人类知识生产、知识传播、知识创新、知识分配的传统方式。传统的图书馆学、情报学已难以完成新的历史任务,网格技术将会对知识管理带来革命,信息服务网格将成为知识创新服务的大平台,知识网络通过网格计算实现知识动态调用,达到知识动态利用。

3.2 知识组织技术

知识组织在文献、信息组织的基础上产生,伴随信息技术而发展。随着信息科学及其他领域的先进技术发展,信息技术必将对知识组织产生重大影响,知识组织必然走向智能化方向,这已成为研究学者们的共识。马费成早在1989年就对人工智能作用于知识组织作了专节论述,分析了人工智能研究和专家系统将为知识组织带来的前景。后来的研究者们还对智能化组织方法和技术进行了较具体的论述。蒋永福指出:专家系统是一种智能计算机程序,它由计算机支持知识库、推理功能、知识获取功能和用户界面组成,它的性能决定了它的知识表示方法比以往任何方法都显得灵活和先进。邱均平等也列举了数据仓库、群件、知识挖掘、知识发现、数据融合、推送技术、智能搜索等多种智能技术和软件技术;周宁还对专家智能系统的知识表示方法以及数据仓库、知识发现和知识挖掘技术作了具体介绍。司莉、柳晓春等也都对网络资源的知识组织技术有所介绍。

3.2.1知识发现(KDD)、数据挖掘(DM)技术

知识发现“Knowledge Discovery in Databases”即数据库知识发现(简称KDD)和数据挖掘(Data Mining简称DM)是近年来兴起的新领域,并处于信息管理和知识管理研究的前沿。伴随着因特网(Internet)、数据库技术和数据应用的成熟和普及,人们可以跨越时空地在网络上交换数据信息和协同工作。由于Internet上网络知识资源多以各种数据库的形式存在,面临浩渺无际的数据,人们呼唤从数据汪洋中来一个去粗存精、去伪存真的技术。从数据库中发现知识(KDD)及其核心技术——数据挖掘(DM)便应运而生了。所谓数据挖掘,就是从数据库中抽取隐含的、以前未知的、具有潜在应用价值的信息的过程。数据挖掘与传统分析工具不同的是数据挖掘使用的是基于发现的方法,运用模式匹配和其它算法决定数据之间的重要联系。

目前,国内外情报学专家已经认识到,情报学原来基于文献信息的学科框架将难以适应新世纪的要求,需要建立一个基于数据、事实和知识的学科框架,即要建立以信息管理和知识管理为核心领域的情报学。信息、系统、网络、管理用户等要素将成为情报学研究的主要内容,其中关键问题之一就是知识发现和数据挖掘。知识发现与数据挖掘是情报学的一个核心问题。

3.2.2知识仓库(KDB)技术

知识仓库(Knowledge Database 简称KDB)技术是数据库管理技术与人工智能技术结合的产物,主要用于知识型组织信息存储、诊断、计划、设计和分析等方面的决策支持。KDB是组织构建的基于WWW网络技术的服务项目,成员可以利用Internet或Intranet 24小时进行访问,检索所需求的知识。

知识仓库中的知识资源必须是员工所需要的,但并不限于只是本企业产生的知识,知识是否存储到知识仓库中去,看是否是员工学习所需要的,能否帮助员工有效地完成他的学习和商业目标,员工可以根据实际情况上传别的员工和企业所需的知识信息。很多企业知识仓库中还有他们的竞争对手及其产品和服务的信息。显性的知识资源,很容易用语言、数据、公式等来表达。很多这样的知识信息已经存在于文件、传统出版物或报告中,但由于分发有限未能到达最需要他们的人手中,存储于知识仓库中就可以解决这个问题。员工拥有的一部分知识是隐性的,来自于经验多于事实,一些企业作了很大努力来让这些隐性知识变成显性知识。由于每个员工只拥有整个过程某一环节的隐性知识,作为知识管理部门要把员工各自拥有的知识集成为过程的知识。集成的程度既取决于隐性知识显性化的难易程度,又取决于企业隐性知识保密的难易程度,因为这部分知识是企业核心能力的最重要的部分,对它进行管理的目的是扩大这类知识在本企业内的作用范围,但又要防止这类知识流传到其它企业中去,为其它企业的效仿提供一定的可能性。

3.3网络信息检索技术

运用智能科技的思想和方法研究网络信息检索技术,形成智能网络信息检索技术,这是未来网络信息检索与信息技术的重点发展方向。一些高新技术如人工智能、知识工程等一旦应用于情报领域,必将产生独特新颖的成果,尤其是在诸如自动标引、自动文摘、机器翻译等正在蓬勃发展的智能信息处理领域。

网络信息检索技术面对的中心问题,是如何利用先进的信息技术改善网络信息资源易用性、如何利用信息技术提高网络信息资源利用率和如何利用信息技术促进网络信息资源再生产,目前值得关注的研究重点包括网络信息处理技术、智能搜索引擎技术、信息挖掘技术等。尤其是智能搜索引擎技术和可视化信息检索技术,应是智能网络信息检索技术的重中之重。

有研究学者认为目前Web信息检索多采用浏览方式和搜索引擎方式,基于简单文本字符匹配形式进行,仅能提供网络分类目录浏览的查询方式和关键词全文检索方式,缺乏概念的、主题的、特定学科的等多种检索途径,检索的相关性、知识性及检索效果都不够理想。因此,以前的Web检索技术已经不能适应现代Web网页检索的需要,必须突破原有的Web信息检索技术,倡导新的途径与方法。如(1)在等级分类法(Hierarchical Classification)的基础上,多运用分面组配分类法(Faceted Classification);(2)引用本体论(Ontology)的概念,在Web网页上实现概念匹配检索;(3)在使用规范化信息检索语言的基础上,建立后控制词表,并对元数据实行标准化管理;(4)为信息检索人员设计一套高效率的信息检索系统;(5)利用“布拉德福等级排序法(Bradford Distribution)”,对Web检索实行定量分析;(6)为信息检索设计规模、结构、功能匹配的数据库;(7)重视信息检索专家的作用。

3.4 Web页面信息检索智能代理

利用信息检索智能代理检索Web页面的思想是:用户把自己的信息需求提交给信息检索智能代理,信息检索智能代理启动信息检索代理程序,分析和理解用户的信息需求,自动地进入Internet,自动地与Internet机器对话,自动地检索、分析和处理Web页面,并且对检索结果按照信息用户的需求和思维方式进行处理和优化,最后把优化的结果返回给信息用户。智能代理Agent是一种超越面向目标、客户/服务器系统技术的最新的软件设计模式。比尔?盖茨在其所著的《未来之路》谈到Agent软件在将来的信息高速公路中将产生巨大作用,称它是软件中的软件。信息检索智能代理就是按照智能代理Agent软件设计模式,以适应国际互联网Internet环境而设计的一种能按照信息用户的特点和思维方式自动检索Web页面、Internet数据库、甚至整个Internet信息资源而设计的信息检索系统。它将极大地推动信息检索乃至整个信息技术的发展。这种信息检索方式的特点是:信息用户只要一次输入信息要求,或按照系统的要求结合自己的信息需求对系统进行应答,然后,信息检索系统的启动和运行都是自动地进行,而不需要人工去干涉它,系统会自动地在Internet网络上进行漫游和检索,在检索的过程中,可以进行移民或多个移民,并能与所在主机进行对话和交互,最后把得到的满意的结果返回给信息用户。信息检索智能代理由网络智能检索用户界面、网络智能检索漫游程序、移民程序、移民协调程序等四个部分组成。

3.5网络信息过滤技术

目前,网络信息出现“信息过载”与“信息污染”问题,用户在繁杂的网络信息资源中寻找自己所需的信息,常混合“信息噪声”,为了能够满足用户自己的信息需求,提供给用户真正所需的信息,尽量屏蔽那些无用的信息,信息过滤技术应运而生。信息过滤技术主要涉及到文本过滤与文本检索(也含文本标注、文本摘要、文本分类等),信息过滤关注的是用户的长线需求(指在一段时间内比较固定的信息需求),即对相对稳定的专业或课题研究所需的信息在动态信息源中进行跟踪搜索。文本过滤的主要流程是识别、跟踪用户的信息需求,建立用户需求模型,然后在相应的文本流中搜索符合用户需求的文本,再利用反馈机制,改进需求模型。实现这一过程的关键技术是获得用户信息需求和解决信息过滤(推荐)的算法。即在时刻跟踪网上用户信息需求及其变化的同时,利用智能技术对它们进行匹配,并及时、主动地通知用户,也就是说,信息过滤应当集中在解决用户模版(Profile)的表示以及Ranking的方法上。其实现的基本技术:一是根据用户提交的主题词或示例文本建立用户需求模型,即用户模版;二是构建文本向量空间模型的文本表示技术;三是用户模版与文本的匹配技术;四是信息反馈机制。

3.6 XML技术对情报学领域的挑战

XML全称是“可扩展标识语言”(Extensible Markup Language)。从高级角度分析,XML是一种元语言,是一种自描述语言,用来描述其他语言的语言。它允许你自己设计你的标识。由于XML语言及其标准技术的开放性和可扩展性,许多领域正积极建立基于XML的信息处理与交换框架体系,促使整个应用领域或某一业务流程中所有各方都利用XML来定义、组织和交换信息。随着XML技术体系的进一步完善,它将成为各个应用领域普遍的信息处理和交换基础。

根据文献和本文的分析,我们相信XML技术体系为网络化数字化信息环境提供了新的信息组织与处理的核心能力,从而保证信息系统能够开放地进行用户所要求的各种复杂信息组织和处理操作,允许以前所未有的灵活性和深度对信息进行动态加工来提取和组织知识,并能在各个应用领域或不同信息系统间有效实现无缝交换、虚拟集成和互操作性。掌握XML技术及其应用,不仅能促进我们有效地组织数字化资源和网络化信息服务系统,还保障我们对飞速增长的基于XML/HTML的网络信息资源的处理能力和与其它领域信息系统的互操作性,帮助我们有效参与各应用领域基于XML的信息处理交换体系、充分发挥和扩展我们作为信息组织与处理专家的作用。

我们应该充分认识XML技术体系对开放式可扩展智能化信息处理机制的促进作用和对未来信息处理与交换环境的整合作用,充分认识XML为我们改造提升图书情报系统能力和参与其它应用领域信息系统所提供的战略机遇,积极探索利用XML技术进行信息组织、处理和交换的方法和机制,使我们对这个网络化数字化信息环境信息处理核心技术能做到领先一步、技高一筹,并在此基础上充分开发网络化知识化信息服务的能力,从而开创信息服务与信息系统的新境界。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

信息技术与信息科学的发展_情报学论文
下载Doc文档

猜你喜欢