对云时代图书馆的思考_云计算论文

图书馆在云时代的思考,本文主要内容关键词为:图书馆论文,时代论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

D01:10.3722/j.issn.1673-2286.2009.06.005

1 计算机发展历程

1.1 计算机分类

自20世纪40年代以来,从军事为目的的计算机应用到进入千家万户的计算机的使用,计算机系统体系结构并没有发生根本的变化,而是半导体技术、网络技术使得计算机的性能更好,计算机相互连接的成本更低了。

首先回顾一下计算机的类型[1],从计算机类型的变化方式看,可以分为(见图1):

图1 按照内连结的特点计算机分类

如果从计算机类型之间的外部连结的方式看,则可以分为(见图2):

图书馆信息网络化服务而言,已经广泛使用了网络计算机和各种计算机终端。计算机有各种各样的应用,从工程角度,关心网络计算机的应用分类,通过网络计算机的应用分类来寻找类似的或者可以改造的应用方式。对于一个应用工程设计,首先参考已经有的应用,再根据新的应用特点进行修正,这样的系统应用设计就是在继承了已经成功的经验后,又适应了变化的需要。网络计算机的应用分类见图3。

图2 网络计算机分类

图3 网络计算机应用主要分类

自从上个世纪80年代出现个人计算机以后,各行各业利用计算机在各自专业应用上取得了很大的成功。图书馆界是在上个世纪60年代开始利用计算机和终端通过通信链路进行联机编目工作的,情报工作人员在上个世纪70年代就能利用通信线路和终端进行计算机联机检索查询工作。由于网络和个人计算机的发展,从上个世纪80年代中开始,中国的图书馆都逐步进入到了计算机网络化时代,利用图书馆自动化管理系统和电子阅览室系统为主的各种局域网应用。上个世纪90年代中期互联网的应用,极大的推动了图书馆的数字图书馆系统(信息网络化服务)的发展,由局域网时代走向了互联网时代。

按照计算机分类,图书馆继续在使用的有:

●各种PC服务器;

●各种Unix服务器;

●各种高性能、集群服务器;

●各种PC;

●各种NC;

●各种移动终端。

实际上早期的计算机连接方式是利用专线和通信线路连接的,这类线路的可靠性高,点对点连接,成本高。现在的计算机连接的方式是通用网络连接的,这类线路的连接成本低,可以多点对多点连接,而且网络变成了基础设施,谁都可以搭载。1982年,美国太阳微系统公司提出了[2]“网络就是计算机”观点,1990年初期,科学界的计算开始使用网格计算了。

1.2 网络计算发展历程中的问题

(1)在金融保险电信等行业,数值型事务处理的网络计算机应用,但是这些应用共同的特点都是在企业内部,最主要的核心部分并非是公众可以使用。到上个世纪90年代以后,公众实际上是利用互联网看到或者定制自己的信息。那么,公众要修改自己的相关信息怎么办呢?所以,金融保险电信行业发展了客户关系管理(CRM)中心,负责接电话,处理非公开查询的事务。随后出现了客户界面的软件即服务(SAAS)的模式。那么计算机应用的历程中的第一个问题就出现了,是自己建呼叫中心,还是购买公共的呼叫中心的坐席?中国目前大部分的金融保险电信等行业都是自己建立客户呼叫中心。这类自建的中心,忙时线路拥塞、闲时大量的浪费线路和坐席设备。是否可以同类共享客户服务中心呢?

(2)在大部分的互联网的应用中,非数值型的事务处理变得越来越多,越来越重要了。但是随之而来的烦恼也就产生了。美国谷歌公司(Google)已经发现[3]的是:

●十多万台计算机的发热,对于环境的影响;

●巨大的电力消耗,成为日常开支的负担;

●保障十多万台计算机的故障自动切换、自修复的操作系统,网络管理成为提高维护能力的关键;

●故障最多的是风扇、每天坏大约1000个磁盘、低利用率时如何节约电力。

维护和保养系统,减少热排放,节省电力,提高计算机和存储的利用率对于大量赚钱的美国谷歌公司都成为了重要的问题进行思考了。

在我国,很多机构都是为一个应用使用一个服务器,为了减少应用之间以及投资主体之间的矛盾。但是,事实上这些服务器的平均利用率很低,基本都是没有很好利用3到5年就被淘汰,形成了大量的电子垃圾,极不利于环保和节能。

(3)由于不同性质的单位人力资源问题,在非IT单位的IT人员,特别是有经验的、高水平的IT人员很难在非IT企业中生存下去。这样就变成了在非IT单位需要的技术支撑能力很长时间在低水平的循环。为了使维护专业化,提高服务的质量和水平,出现了服务外包(ITS)的商业模式。可是ITS在不成为规模时,非营利机构的费用不能满足承包商利润时,就造成了有承包商没有服务保障的结果,由于应用与IT基础环境紧密相关,大部分的ITS承包商都不能很好地理解与保障用户的业务流程的需要,造成了ITS的困境。

(4)在构造网格应用时,宗旨是享用空闲的计算资源(计算机资源、存储资源、专业软件资源、内容资源等),而由于计算资源属于不同的出资机构,我国建立了两个全国性的网格,教育网格和科研网格,本意是利用空闲的计算机、存储设备、共享大型的应用软件,而实际上,又组建了很多由集群和高性能计算机组成的网格节点,这些基础设备的大量投入,造成了新的浪费。因为在利用空闲资源上,并非像网格设计者最初的一厢情愿那样有很好的共享和分享的应用成果。

(5)各种计算机上可以利用的历史资源的迁移、转换、仿真、再利用首先不是一个服务方面的任务,而是一个资源组织和资源保存方面的任务。由于操作系统、计算机、存储设备、应用软件的升级、更新、换代,使得很多历史累积的依赖于当时环境的资源面临危机。负有文化传承责任的图书馆、档案馆、博物馆等遇到了巨大的压力。文化部艺术研究院利用现代技术抢救非记忆遗产就是一个实证。那些清朝遗留下来的蜡的留声筒,各种规格型号的声音录音带、录音钢丝轨,清朝时期留下来的老唱片等等,除了改造技术装备以外,还需要懂得这个方面的专业人士,否则是无法进行抢救的。所以,计算机问世以后,带来的历史累积资源的再利用的挑战也是今天的计算机时代还没有解决的问题之一。

1.3 可能的几个解决方案

(1)同行业同行政体系的,在一个点的主服务器安装应用,在其他的点通过各种终端利用这个服务器。这个模式已经比较多了。公用的电子邮件、搜索引擎等系统,目前图书馆兴起的总分馆方式等属于这类解决方案。主要优点:对于应用系统,一套维护队伍。主要缺点:性能取决于网络,安全性取决于应用系统的构造,不同使用者的数据在一个服务器的安全性的顾虑。

(2)虚拟服务器和虚拟存储空间的技术体系。在多应用多服务器的模式上,把服务器进行虚拟化,搭载不同的应用,可以提高单服务器的有效应用。很多图书馆已经做到服务器虚拟化了。主要优点:对于没有峰值的应用,这个虚拟服务和虚拟存储的模式可以有效的提高服务器和存储空间的利用率。主要缺点:对于有峰值的应用,并峰值出现时段一致的时候,降低了服务器的服务质量。

(3)异构集群技术[4]。大部分单位有不同操作系统的服务器(操作系统异构、处理器异构),如何利用集群技术把这些异构服务器构成可管理的集群?目前,异构集群组件已经作为曙光公司的产品配属到各种动态资源调整可控集群的核心上了。当服务压力低于预警值的时候,就关掉集群内的空闲服务器(能源节约策略),达到预警值以上时再逐步开启;核心部分利用高性能计算机,在数据核心、安全核心上有保障;在一个监控台上管理各种异构集群等。这个方案适合那些大型的信息服务系统的使用。

(4)网格技术[1]。本来在构建全国教育网格和科技网格的时候,应该有机会把图书馆的一部分应用构造在网格节点上,并服务于一个地域的教育与科研工作者的。但是,目前的网格节点中,教育课件网格节点、虚拟博物馆网格节点都在设计并实施中,缺失了数字图书馆网格节点。

最近几年又出现了云计算,本文用对比研究的方法,给出对于云的计算环境、运行基础等特征,并研究在图书馆是否可利用,仅供大家参考。

2 云计算解决方案

2008年年初,在美国旧金山参加美国太阳微系统(SUN)公司的教育与科研大会(ERC)上,该公司总裁对于云计算进行了通俗解释。首先,什么是天?连接全世界的漫无边界,无限可延伸的互联网络基础就是天。那什么是云呢?就是互联网上已经存在的一组一组的应用,就像一朵一朵的云彩。那么什么是云计算呢?就是互联网为IT平台的,虚拟化的,计算机网络磁盘产品化的,各种应用是标准化的,以在线服务为支撑的,以开放源代码为支撑的计算平台。

云计算要解决什么问题呢?

●相对稳定的基础技术、系统架构、高性能的网络环境,有助于提高硬件的利用率。节省能源,减少热量,有利于环保。

●利用虚拟技术,在一个主机上搭载不同的操作系统,适应不同的应用;在一种应用软件上,租借搭载更多的用户;有利于应用软件的优化(功能、性能、稳定性)。灵活的各种应用搭载,最大限度的提高支撑环境的利用率。

●让一组专业人士维护系统,减少系统故障,减少故障恢复时间,更专业化的管理系统,减少每个机构的专业维护队伍,而保证服务水平一致(减少机构维护成本)。

●每个云团的组合合理,可以节省进入云团的机构的成本。

●每个云团的利用合理,可以吸引广告投放,形成完整的商业价值链并正常的运维。

2.1 六个主流云综述

(1)亚马逊基础结构云(Amazon,Infrastructure Cloud)。提供可以选择基础架构内容的服务:弹性云计算(EC2)、简单存储服务(S3)、简单序列服务(SQS)、简单数据库服务(DB)。主要的特点:随时可以使用、与亚马逊公司共享基础结构、现收现付的电子商务模型、标准的Web Services接口、与语言无关。主要的缺点:没有IDE支持、有限的服务等级协议、新的企业级市场适应。

亚马逊公司利用已经建立的网上书店基础设施,以现收现付为基础的电子商务结算平台,提供以营销为主要应用的云计算环境。但是,对于需要更多服务等级,对于服务质量要求更高,要改变现有商业模式等需求的应用目的,目前亚马逊提供的云计算环境还无法满足。

(2)谷歌的应用引擎(Google,App Engine)。对于互联网应用,提供高度集成开发和托管环境:动态运行时间、持续的数据内容存储、用户验证、电子邮件、服务监测、日志分析等。主要的特点:已经有大量的计算资源,成熟的网络规模基础设施,丰富的服务应用程序编程接口,低的进入门槛(免费尝试)等。主要的缺点:缺少满足机构和企业的请求驱动模式、缺少网页导向模型、不能直接进入谷歌基础设施、不签署服务水平协定等。

谷歌公司是以搜索引擎、电子邮件、网络地图、网上办公文件处理等为基础的互联网服务公司。该公司由于搜索引擎的需要,有大量的基础设施不间断的进行互联网爬虫、索引、摘要等活动。在此基础上,提供应用引擎,可以享受该公司的很多成型的服务内容,这是谷歌云计算的特色。但是,如果用户只是用谷歌的基础设施,不利用谷歌的服务引擎,那么谷歌是不接受的。同时,利用谷歌的服务引擎,但是要做大量的用户的网页导向,谷歌也不提供这类服务。由此可见,利用谷歌的服务内容进行应用,是谷歌云计算环境的主要特点。由于不签署保证服务水平的协议,那么对于在服务质量、服务的性能上有很高的要求的应用目的,是很难利用谷歌云计算环境的。

(3)国际商用机器公司蓝云(IBM,Blue Cloud)。为建立私有的云提供系列的硬件和软件:刀片与基于Linux的服务器,网格计算引擎,Xen和PowerVM,Hadoop,Tivoli。主要优点:在开发环境和办公室的存储定位、开源组件、定制等。主要的缺点:提供特殊的硬件、复杂、高的费用等。

蓝云的目的,是为了向建立云计算服务应用的企业提供完整的基础设施。在这个基础设施上,企业可以建立自己的云计算环境(主要商业应用模型),也可以利用开源软件构造自己的云服务。当然,如果这些企业有足够的经费给IBM,IBM很乐意笑纳,帮助企业做云服务软件的定制开发。如果企业试图构造高性能的、高可靠性的、为电信金融服务的云计算环境,IBM的产品质量和服务是可信赖性的。

(4)微软视窗天蓝(Microsoft,Windows Azure)。提供软件+服务的混合模式:同一个功能,可以通过一组核心网上服务(例如,存储、身份认证、数据服务等),在云和桌面客户端提供应用程序编程接口等。主要优点:具有远见的投资规模和完整性、大的开发社区、现有的工具和能力、对于其他的微软基础的应用服务适合一体化等。主要缺点:在市场有限时间内,选择商业模式的复杂性等。

微软公司是一个纯的软件和服务的提供商,首先的目的是销售软件,帮助企业构造企业需要的云计算环境。同时,微软也是一个负责任的互联网服务商,很多的产品类似于谷歌公司,或者说谷歌公司正在成为微软互联网的楷模,就像当年苹果公司是微软开发视窗产品的楷模一样。微软公司仍然努力进行着收购雅虎公司的互联网业务的工作。微软公司和谷歌公司的理念有所不同,微软奉行的是依靠收支平衡的商业价值关系提供服务质量的保证。谷歌奉行的是廉价适度可用原则,通过搭载的广告维持商业平衡。从目前看,这两个理念的较量还会持续发展下去。IBM公司不发展自己为主的互联网服务业务,只坚持依靠收支平衡的商业价值链提供服务的原则。所以,从微软公司的学习态度、危机意识上看,微软公司仍将是最好的充满活力和竞争能力的公司之一。

(5)销售团队(Salesforce,Force.com)。从应用交换平台转换开发而来的团队网。新的一些工具,如虚拟团队(客户用户接口建立)和Apex码(商业逻辑和数据的操作,类似Java语言)。主要优点:已有客户群为核心的CRM应用(云计算——CRM)程序、多租借、相对成熟的业务逻辑和数据等。主要缺点:专有语言(Apex)、可扩展(但是没有互联网规模的基础框架)等。

这个租借模式,是该云计算环境生存的基础。因为事实上,很多CRM的客户资料部分是大量重叠的,如何构造一体化的CRM,多租借,就可以实现客户资料的共享与扩大,业务的私有相结合的云模式。美国花旗银行就是租借这个销售团队网建立了3万个席位为本银行用户服务。这个也是类似亚马逊的一种以客户关系为应用模型的云计算环境。

(6)虚拟机虚云(VMware vCloud)。建立虚拟数据中心操作系统,该操作系统由用于虚拟云环境中的、管理虚拟机运行的一系列有代表性的建立在转换基础上的应用程序接口组成。主要优点:在云数据中心中,对于特定的虚拟基础框架和扩展的虚拟机之间的可移植性。主要缺点:仍然只是一个服务伙伴之间的想法,不清楚什么时候变成现实。

IBM和SUN公司有多种虚拟机的解决方案,但是,基本上都是硬件、操作系统环境的虚拟过程。如果有一个Power的主机,一个Intel的主机,当两个主机都能使用Windows操作系统的时候,这个属于操作系统可以虚拟转换的。而在Power的主机中,插Intel的处理器板,当有Windows运行需求时,自动的切换到Intel处理器版进行应用。这个属于异构处理器的主机的一些解决方案。在Intel处理器和AMD处理器的系统上,Windows操作系统都是可以运行的,同时通过虚拟机再安装Linux操作系统,使得在一个硬件的前提下,Windows运行环境和Linux运行环境都可以运行了。如果不更换硬件环境和操作系统环境,把一个环境中的运行程序平滑的移植到另一个环境中去成为基础软件攻坚的一个部分。其实,对于数据中心,数据的移植和转换已经没有更大的困难了,主要是数据应用的平滑转移有困难。

2.2 云计算环境的基本特点

(1)云运行的基础框架。现有的计算资源的基础框架是存在的,但是,这个框架对于内部是相对健全与稳固的,对于外部可能是需要加固和扩展的。维持云运行的基础框架的成本是很高的,比如为了云环境,由于接入的增加,传输的增大,需要提升网络带宽的成本;为了更好的保护内部,需要提升的网络安全成本;为了吸引搭载,需要大量的提升存储空间的成本;为了数据可靠,需要进行数据备份的成本等。所以,利用已有的基础框架搭载云计算是互联网公司的主要模式,而不是为了建云环境而增加很多投资,谷歌公司、亚马逊公司就是实证。对于没有基础运行环境,又想开发云计算获得用户使用的企业,需要仔细的衡量投资与回报的风险。

(2)云的应用模型的确定。对于大部分的企业,应用是相对固定的,如何在这个相对固定的业务模式上,搭载更多的用户,这个是很多互联网企业能思考与定位的。利用已有的应用模式去扩展搭载用户是相对简单的,谷歌、亚马逊、销售团队等都属于利用已有应用模式进行云的应用模型的。而对于没有应用模型想要进入云计算机的,要慎之又慎,因为建立一个全新的应用模式,说服其他机构和企业转向自己的应用模式的推广是一个艰巨而复杂的工作。

(3)云应用的实现。尽管很多场所很多企业都说开放源代码是云实现的基础,事实上并非如此。建立或者依靠专业性的软件团队,是利用开源软件实现云应用的关键。并非简单的直接使用开源软件就能构造云环境期望搭载的用户数、应用的功能、应用的稳定性、应用的优化等目标。可以证实的是,谷歌、亚马逊、销售团队等云应用都不是靠开放社区支撑完善的,而是靠专业的软件团队来完善的。只是这个团队是自己的,还是专业软件公司的差别而已。

(4)云的商业模式。综合上面六个主要的云,我们清楚的看见有三种商业模式:①以商业销售硬件、软件帮助别人建立云计算环境的商业产品的模式。以IBM、SUN、微软为典型代表。②以互联网运营商提供免费服务获得更多广告,获得广告费的云的支撑模式。以谷歌、亚马逊、微软为代表。③为有商业价值的传统行业专门服务收费的云的支撑模式。以销售网为代表的。这个商业平衡是衡量一个新的趋势能否变成现实的重要的因素之一。所以,基本上云计算环境都是需要有收入来源的(直接、间接),可以抵消运行成本的(设备、网络带宽、电力、人力资源、软件更新等),如果没有这个商业平衡模式,那么那个云团很快就会被别的云团吞并,或者下几场雨(造势、短期的应用)后就消失了。

以上这四点,是图书馆在云计算出现时候,应该关注、应该注意的地方。

3 云时代图书馆的思考

(1)全国性的联合编目云计算环境

在美国OCLC公司的联合编目系统就是一个典型的云计算模式。中国目前在CALIS、国家图书馆、很多省市图书馆都不同程度的建立了联合编目系统。如果图书馆建立云计算应用,这个是第一个可以讨论与实现的。美国的运行成功,是因为OCLC是一个非营利的企业,与各个图书馆的利益相关,不是只和某个图书馆的利益相关,这点也是中国有多个联合编目中心的基础。

事实基本证明,联合编目、检索、文献定位是这个云计算平台能实现的应用功能。但是,不能夸大,比如把功能扩展到实时借阅和统计,由于网络问题,就会影响到读者现场服务质量。

(2)地域性的总分馆图书馆自动化云计算环境

在有条件的地方,建立以省馆为核心的总分馆制的图书馆自动化系统。目前有些省已经建立了或者正在建立。建立总分馆制的云应用模式,很多图书馆自动化商业软件已经实现了,主要是规划和整合的问题,这个是图书馆的内部问题。而这种云计算主要需要解决管理运行长效机制问题。

(3)利用互联网运行公司,搭载图书馆的某些应用。在谷歌、亚马逊公司可以分别搭载书目、自荐数据、电子资源目录的检索、定购、电子邮件、博客等业务。但是,数字对象的链接、镜像由于知识产权等因素,还是需要单独处理,无法进行云计算,因为这个商业资源部分的权利不是我们图书馆。

(4)利用虚拟机技术,把各自图书馆的多种应用和服务整合成内部云计算环境,可以有效的节省能源、减少热排放、这部分是图书馆今天就可以逐步去实现的。

(5)利用网格节点搭载图书馆的业务。在高校的图书馆,应该思考国家建立的网格节点利用率不高,内容不多这个现实,把图书馆可以共享的业务搭载到网格节点上去建立云应用。所以,如何利用好国家已经投资建立的网格节点这个优势,去演变成云计算的应用是可以有所作为的。只是需要确定网格节点给图书馆应用的标准规范,基本就可以实现云计算了。

(6)混搭模式的云计算。可以利用互联网运行公司的云计算、可以利用资源供应商的专项服务、利用本地门户构造混搭云计算模式,这个是图书馆需要思考的问题。完全把业务交给云计算环境暂时是不现实的,因为目前还没有出现专门为图书馆应用构造的云计算环境,也没有一个商业运行公司先期构造一个为图书馆服务的云基础环境。所以,混搭模式可能是一个较好的混合云的方式。

4 结束语

云计算是在应用模式、基础设施、软件技术三个主要的支撑下构成的。而云的商业模式决定了云计算生命周期。对于图书馆,应该在虚拟技术与互联网运营商专门的云构造混搭模式为目前的主要策略。节省电能、减少热排放、提高计算机和存储的利用率是今后一个时期图书馆应该重点思考的问题。能否构造图书馆专业的完整的云,将是一个长期与艰苦的工作。

收稿日期:2009-05-16

标签:;  ;  ;  ;  ;  ;  ;  ;  

对云时代图书馆的思考_云计算论文
下载Doc文档

猜你喜欢