网格:图书馆实现知识管理的新一代互联网技术_图书馆论文

网格:图书馆实现知识管理的新一代互联网技术_图书馆论文

网格:图书馆实现知识管理的新一代互联网技术,本文主要内容关键词为:新一代论文,网格论文,知识管理论文,互联网技术论文,图书馆论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

不管大家对时下的图书馆学怎么看,本栏目是一直要“新”下去了,这是栏目性质所决定的。然而图书馆是最惯于“尝新”的,不新就难以发文,于是造成新概念新理论泛滥,新技术浅尝辄止,整个学科喜新厌旧,缺乏根基,浮夸浮躁,遭人诟病。本栏目也难以新出特色,新出水平。

戏法人人会变,巧妙各有不同。同样是新,要么新得彻底,代表行业发展方向,要么新得实在,新而有用,理论与实践相结合,技术与应用相结合,有时即使不那么新,也是可取的。信息技术在各方面改变着图书馆,图书馆将长期经历变革的阵痛,新的课题层出不穷,这些新的内容应该成为图书馆学学科建设的主题,而不是现在充斥于专业刊物上的唯新而新的东西。图书馆学归根到底是图书馆人的学问。

“新”的难题最终所难之处还不在于以别人的“新”为新,老是“尝新”,“试新”,一个行业的精英都以其他行业的马首是瞻,终究是很难使这个行业蓬勃发展的。能够创新,能够创出为其他行业的人士所“尝新”的内容,这才是发展的根本,才能真正解决“新”的难题。况且我们并不缺乏创新所需的需求或动力,数字图书馆的建设、新技术的运用,都需要我们做出加倍的努力,走出一片新的天地。

网格计算即是目前网络技术发展的最前沿的科学,随之而来的信息网格、知识网格都是这一技术应用于信息内容管理组织的衍生产物。本栏目本期刊用的张敏勤一文《网格:图书馆实现知识管理的新一代互联网技术》,介绍了网格计算的相关知识,并探讨了其在图书馆实现知识管理的应用技术。蒋福兰一文《国内基于Web的著名FTP搜索引擎的比较研究》则仔细比较与研究了不为人所重视的国内FTP搜索引擎的特点与优劣,具有较强的实用参考价值。

1 现代图书馆:由信息管理机构向知识管理机构的转型

传统上认为,图书馆是信息管理部门,其核心任务是将收藏进馆的文献信息资料用最能揭示其内容或形式的数据表示出来,图书馆工作人员将这些数据序化,将序化过的数据及其主体提供给到馆读者检索利用。简单地说,传统图书馆的工作重心即是对数据进行序化,对文献信息进行采集、分类、编目、加工等程序的采编部门是传统图书馆的主要职能部门。随着时代的发展,信息技术也在不断更新,图书馆这个信息管理部门正在发生日新月异的变化,这从美国学者Michael Goman的新图书馆学五定律中可充分体现出来。新五定律的内容是:(1)图书馆服务于人类文化素质(Libraries serve.humanity)——体现图书馆教育职能的加强和适应素质教育的新形势;(2)掌握各种知识传播方式(Respect all forms by which knowledge is communicated)——强调图书馆员应完成从图书管理员向信息传播员的转换,提高自身的综合素质;(3)明智地采用科学技术提高质量(Use thchnoledge intelligently to enhance service)——信息技术与图书馆信息服务密切相关;(4)确保知识的自由存取(Protect free access to knowledge)——检索的便利性仍然是图书馆质量的表现,甚至比在传统图书馆中的地位更为重要;(5)尊重过去,开创未来(Honor the past and create the future)——创造性是一切进步的原动力。所有变化在图书馆形成的结果是:图书馆由信息管理部门转换为知识管理部门,图书馆的工作核心由序化数据变成了序化知识。尽管只是一词之差,在图书馆内部却发生了许许多多的变化。严格意义上讲,知识包括了各种数据,也包括由各种数据组成的信息集合,它是由信息构成的复杂的有机体。大连轻工业学院的研究馆员于鸣镝先生认为:现代图书馆人就是要研究如何使文献中的知识或知识单元有序化,以保证读者获得有序化的知识。知识替代信息成为图书馆提供的主要服务产品。图书馆由信息管理机构转变为知识管理机构的主要标志为信息产品开发部门成了现代图书馆的主要职能部门,其质量评估标准也由收藏齐全转化为利用率高和用户对服务的满意度。

2 信息技术:从WWW到CGG(网格)

众所周知,图书馆是信息技术的主要及前沿应用领域,从纸质图书馆到缩微图书馆到虚拟图书馆最后到现时最为炙手的数字图书馆,无不留下了信息技术的坚实足迹。信息技术的发展亦是突飞猛进的,因特网代替了小型局域网,用TCP/IP协议将分布于世界各地的计算机连接起来,实现了计算机硬件的连通,掀起了第一次互联网技术浪潮;万维网实现了网页之间的互联,掀起了第二次浪潮,并为因特网赢得了更为广泛的发展空间。那么因特网和万维网之后是什么?计算机专家认为:网格(Grid)将掀起因特网和万维网之后的又一次技术浪潮。此次浪潮以全球大网格GGG(Great Global Grid)替代万维网WWW(World wide web)为标志。

2.1 什么是网格

网格一词源于数学用语“计算网格”(Computational Grid),计算网格作为一种计算方法被广泛应用于大气、海洋等资料模拟计算、受自然环境影响的飞机、火箭等工程设计及高能物理实验中,其被用于信息技术的研究,始于20世纪60年代,但对其大规模的开发研究只是近10年的事。因特网的迅速发展使人们对宽带的需求急剧增加,由此导致了波分复用系统在骨干网上的大量使用。同时随着xDSL、千兆以太网和无源光网络(PON)等迅速接入技术的出现和推广,局域网的容量得到了极大的提升,但与因特网用户增长的速度相比仍然存在较大的差距,原本被认为具有足够带宽资源的SDH环路,随着这种差距的扩大,正在逐步形成瓶颈效应,无法适应网络增长的需要。如何增加网络的带宽并合理使用带宽是目前互联网急需解决的技术难题。为改善网络的瓶颈现象和适应性,计算机专家引入了网格计算方法,将原来的平面波分复用技术用于不同环节的网格结点上,改变了传统的静态平面结构,建立网格结构。该结构优点在于能根据突发性的业务动态地调配带宽,同时又能独立于上层协议和速率进行透明传输。关于网格的概念,经典的论述是美国计算网格项目的领导人之一伊安·福斯特在其1998年主编的题为《网格:21世纪信息技术基础设施的蓝图》中的描述:“网格是构筑在互联网上的一组新兴技术,它将高速互联网、高性能计算机、大型数据库、传感器、远程设备等融为一体,为科技人员和普通百姓提供更多资源、功能和交互性。互联网主要为人们提供电子邮件、网页浏览等通信功能,而网格的功能则更多更强,它能让人们透明地使用计算、存储等其他资源。”中科院计算所所长李国杰院士认为,网格实际上就是继传统Internet和Web之后的第三个大浪潮,亦可称之为第三代因特网,传统的因特网实现了计算机硬件的连通,万维网实现了网页的连通,而网格则试图实现互联网上所有资源的全面连通,包括计算资源、存储资源、通信资源、软件资源、信息资源、知识资源等。网格的目标是将所有的计算机连接成一个整体,整个网格如同一个硕大无比的计算机——高度的资源共享,高速的信息存取,向每个用户提供一体化的信息服务。

2.2 信息网格的基础理论

网格技术的产生和发展有三个基本条件:广泛分布的计算资源、网络技术和对网络资源共享不断增长的需求。三者缺一不可。

网格系统是由资源层、中间件层和应用层三个基本层次构成。网格资源层是构成网格系统的硬件基础,它包括各种计算资源,如超级计算机、贵重仪器、可视化设备、现有的计算及应用软件等。网格资源层的连通,可以实现计算资源之间物理上的连通;中间件层包括一系列的工具和协议软件。中间件层也称为网格操作系统,顾名思义,其作用是承上启下,将计算资源中散布的、异构特性的资源向网格应用层提供透明、一致的使用接口;网格应用层是为用户的具体使用而设的,用户可以在网格应用软件上根据自己的需要开发出不同的应用系统以解决各种大型的计算问题或各种资源共享的矛盾。

信息网格的兴起将改变传统的Client/Server和Client/Cluster结构,形成新的Pervasive/Grid体系结构,客户端是各种各样的上网设备,而连在网上的各种服务器将组成单一的逻辑上的网格。网格系统的工作程序如下:

①由网格资源层(即各种计算资源)向网格中提供可供共享的资源,该资源可以是物理实体(如网格资源、分布式计算机池、计算机集群等),亦可为逻辑实体(如计算处理能力、存锗系统、分布式文件系统等)。

②工具组件过滤。网格工具中的相应组件负责侦测资源层提交的软、硬件资源的可用性、特性、当前负荷及状态等信息,并将检测后的信息打包供上层协议调用。

③协议层负责将打包的信息通过传输渠道、路由器及名字解析等技术分析处理实现数据交换。目前支持网格系统的协议包括。XML、SOAP、UDDI、WSDL等支持Web的协议和网格安全基础协议(GSI)。

④将协议层处理过的元信息实施控制,与可用资源进行安全握手,对资源做初始化、监测资源运行状况、统计有关的资源使用数据并计付费用。

⑤将受控信息资源汇集起来,以备虚拟组织的应用程序共享、调用。

⑥网格上的用户根据自己的需要启用应用程序,应用程序通过各个层的服务、API和SDK协议调用相应的服务,继而应用网格中的资源来完成任务。

2.3 关于网格的研究

互联网作为一种朝阳产业,其应用技术的研究开发当然蕴含着无限商机,目前,英国政府已投资1亿英镑,用来研制“英国国家网格(UK National Grid),美国政府用于网格技术基础研究经费则达5亿美元。美国军方正规划实施一个宏大的网格计划,叫做“全球信息网格(Global Information Grid),预计在2010年完成。企业也预感到网格潜藏的巨大市场,纷纷加入到网格技术的开发队伍,惠普、IBM、微软、Sun等信息产业的巨头都已着手有关网格计算的研发计划。我国的中科院计算机研究所也开发了网格研究工作计划,该计划称之为“织女星网格(vega Grid),目前该计划已涉及包括网格超级服务器,网格计算协议栈(Grid Computing Protocal Stack)、织女星网格操作系统(Vega GOS)、信息网格和知识网格的研究、网格的性能、映像、服务、应用等各个层面的研究。专家们预计:网格的重要技术标准将在2004~2005年这一时段出现,并将主导2004~2020年期间信息技术的发展。

3 网格技术为图书馆知识管理提供的平台

关于知识管理的涵义,到目前为止,尚无统一定论,研究者们仁者见仁,智者见智,但大多研究者都认为知识管理即是以人为本、以信息为基础、以创新为目标的管理活动。其涉及的学科包括:认知科学;专家系统、人工智能与基于知识的管理系统(KBMS);机助协作工作(组件);图书馆学与情报学;决策支持系统;语义网络;关系与对象数据库和组织管理学等。尽管知识管理源于企业,是企业面对日益增长的信息环境而采取的针对组织的适应性、组织的生存和竞争能力等重要方面的一种迎合性措施,与图书馆好象并不相关,但图书馆作为传统的信息管理机构,实施知识管理极有必要而且可行。原因在于:(1)知识管理涉及到了图书馆学情报学方面的内容,属于图书情报学研究范畴,作为学科的应用机构之一的图书馆实施知识管理有理论上的前瞻性和优势:(2)信息技术的发展使信息领域的范围扩大,各种信息咨询机构、网络服务中心等的出现使图书馆作为传统的文献信息中心的垄断优势荡然无存,图书馆必须改革自身的组织管理运作才能适应当前形势的需要;(3)图书馆是传统的信息管理机构,信息管理本身就是知识管理的一个体系,随着信息技术的发展,信息管理已逐步转向了知识管理,图书馆不应逆时代之潮流;(4)图书馆用户对服务的个性化需求使图书馆早已着手知识的组织研究,如元数据、知识结构、知识发现、知识挖掘、知识仓库及知识库管理系统等,并取得了不小的进展,而这些研究均属知识组织范畴,其实际应用标志着图书馆中已有知识管理的行为。网格技术应用于图书馆,将给图书馆的知识管理带来更为广阔的技术和发展平台。网格为图书馆知识管理提供的平台有:

3.1 网格提供广域的高性能的计算环境

计算网格(Computational Grid)为图书馆知识管理提供广域的高性能计算环境。计算网格提供原始计算能力、高速带宽和数据处理能力。其计算过程是将各网格结点的资源相连接,并采用浮点计算和逻辑计算来完成的。在图书馆知识管理中,涉及到原始计算能力的有:图书馆的各种信息计量活动,包括核心期刊的测定、期刊(图书)利用率的测定、引文及被引率的计算、期刊或网页影响因子的测定等;各种业务量统计及绩效评估,如采访质量测评、流通业务计量、参考咨询服务质量评价、用户培训绩效测评、技术服务质量评估等;用户对图书馆综合服务的满意度计算等等。计算网格提供的高速带宽及数据处理能力,一方面可以为图书馆数据处理人员包括采访、编目、参考咨询、技术开发等部门的馆员提供更加宽松友好的数据处理界面,一方面可以改善图书馆网页的质量,保证用户的查询速度,满足用户的信息需求。

3.2 网格为知识组织提供了更为先进的技术

网格有六个部分组成,即网格结点、数据库、贵重仪器和设备、可视化设备、宽带网和网格软件。其中计算与信息处理的源是网格结点上的数据,网格结点是地理上独立的计算和信息中心,根据其功能可分为两类结点:计算结点和信息处理结点,计算结点组成3.1中提到的计算网格,而信息处理结点组成的称之为信息网格(Information Grid)。图书馆现阶段的主要任务之一,是将无序的网络信息有序化,并有目的地揭示知识,以提供利用。在Internet和Web上,信息资源零散地分布在各个网络站点,信息网格采用接口连接这些信息资源,网格软件通过各种协议将同质的和非同质的信息进行连接,并通过高级分析减少由各种形式的信息所带来的技术的复杂性。网格操作系统还可以提供自动生成目录和缓存等技术,可以大大提高网格信息查询和浏览速度,减少网络流量。这样网络用户可以通过网格门户(Portal)技术透明地使用整个网格上的资源,减少盲目浏览查询的时间,提高知识的利用效率。

3.3 网格为知识挖掘提供更加成熟的开发工具和软件

知识挖掘是知识信息管理与服务的重要技术。在网格系统中,使用基于知识的方法学和技术学而生成的网格叫做知识网格(Knowledge Grid),知识网格包括元计算(Metacomputing)、对等计算(Peer-to-peer Computing)、分布计算(Distributed Computing)等计算基础及知识工程工具、决策咨询智能软件、知识存储、数学建模、模拟计算等网格软件。这些都可以做为知识挖掘的工具加以利用。元计算的基础是建立知识元结构,知识元的独立性和链接方法是生成新知识的主要途径,网格可以将整个科学分类体系立体分布在网格结点上,通过不同的结构链接方法使诸多交叉学科体系由隐性知识转化为显性知识或创造出新的学科研究领域,达到知识创新的目的。知识创新是知识管理的最终目的,也是图书馆教育职能的最高境界。

3.4 网格应用层为图书馆知识管理提供诸多的应用平台

网格有三种基本功能:任务管理、任务调度和资源管理。以上所述均为网格的资源管理功能。知识管理则要求图书馆改变原有的组织机构模式,进行业务、机构重组,实施全面质量管理以适应知识经济时代的要求。网格的应用层笔者在前面的论述中已提到,是由用户根据自己的具体需求开发使用的,根据知识管理的要求,图书馆可以利用网格开发的应用平台有:

①图书馆任务管理平台,该平台由用户向网格提交任务组成网格,开发中应建立相应的库函数,如任务的各种运行状态、为任务指定所需资源、需增、删或监测的任务标准等。

②图书馆数据处理平台,该平台可用于开发特色数据库,由图书馆各职能部门(或数据库开发人员)向网格系统提交数据组成网格,建立相应的数据库所需的库函数。

③知识标引与检索平台,该平台的关键在于建立不断更新的知识元结构,以适应知识创新的需求。

④知识服务平台,不同于国外其他网格研究项目的是,我国侧重于“服务网格”(Service Grid)研究,因此其应用软件可以为图书馆提供高质量的知识服务平台。该平台除了能提供各种知识服务外,其形式之简便、手段之完美及评价指标之完善可能是现时任何信息服务体系都不能达到的。

4 有关图书馆知识管理网格的质量控制

图书馆知识管理网格的质量受其网格结点上知识元的选择质量、网格生成技术中几何外形的描述、复杂构型的区域划分及库函数的完整性等因素的影响。高质量的知识网格,必须解决好以下问题:

4.1 建立高质量的知识元库

图书馆中的知识包含了有史以来人类全部文明成果的各个学科分类体系,对其基本知识元的描述,要尽量准确无误且具有权威性,要尊重学科专家的认定,选择公认的术语建立知识元库,并根据学科的不断发展,及时补充知识元的必要规范,以保证知识元库的时效性和高质量。

4.2 网格结构描述及分区技术

对于结构网格生成系统,分区技术是处理复杂构型问题的必要和通用技术。首先,根据需求用户的分区要求,系统能够生成多种形状的曲线,其数据满足一定的分布规律,我们称之为自由段;其次,为使网格数据和区分信息与流场解自动匹配,依不同的边界条件类型,将自由段合成边界段,通过拓朴结构,将边界段组成恰当的子边界区。自由段和边界段的结合使用,可以组成不同的分区边界,从而提高网格生成质量。

4.3 建立尽量完善的库函数

完善的库函数是网格质量保证的又一因素。要求应用开发人员必须是图书馆学理论与实践的专家。

4.4 网格质量检查

对网格质量进行检查,目的仍然在于提高网格质量,帮助解决流场求解时出现的某些问题。检查方法因涉及复杂的计算,笔者不再细述。

标签:;  ;  ;  ;  

网格:图书馆实现知识管理的新一代互联网技术_图书馆论文
下载Doc文档

猜你喜欢