论个性化信息服务_搜索引擎论文

谈谈个性化信息服务,本文主要内容关键词为:信息服务论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 个性化信息服务的产生背景

1.1 信息环境的变化

1945年,Vannevar Bush在《Atlantic Monthly》上发表了著名的《As We May Think》一文。Bush在此文中对未来社会做了精彩的预言,并激励当代的科学家们将他们的注意力从战争中解脱出来,转向研究如何更好地获取已有的知识。他在文中提到:我们用以发布和获得研究成果的方法已经过时了,现在这些方法完全不足以达到目的。许多重大的成就就这样被淹没在大量细枝末节当中。问题其实就在于出版物的数量已经远远超过了我们现有的利用这些成果的能力。(注:Vannevar Bush.As We May Think.The Atlantic Monthly.July,1945.Available at http://www.theatlantic.com/unbound/flashbks/computer/bushf.htm)

然而,在Bush发表这篇文章的55年之后的今天,人类社会依旧面临着信息产生与信息获取之间的矛盾,而且愈演愈烈。其中经历的这半个世纪,是人类科技发展速度最快的一个阶段:从计算机的发明到今天遍及世界每个角落的Internet。人类的信息总和在不断地以指数增长,尤其是数字化的信息。信息技术和网络技术的飞速发展,给人们的交流、信息的传播带来了革命性的变化。我们不能否认信息技术给人们生活、研究和工作等各方面带来的方便,但同时我们不能不承认另一个事实:人们逐渐被淹没在形形色色、各式各样的信息海洋中。

我们是幸运的,因为我们处在一个前所未有的时代,这是一个信息技术不断更新换代的时期。信息技术的发展使得信息产生和信息获取都变得比以往更加容易。我们也是不幸的,因为我们所处的信息环境越来越得不到应有的控制。因特网上的信息是极其无序的,而且信息量越大,就越难被利用。

在中国互联网络信息中心(CNNIC)于2000年1月发布的第五期中国互联网络发展状况统计报告中,有如下的数据:过半的用户(57.90%)上网的主要目的是获得各方面的信息;在用户最常使用的网络服务中,搜索引擎排在第二,仅次于电子邮件服务。(注:中国互联网络信息中心.中国互联网络发展状况统计报告(2000/1).Available at http://www.cnnic.net.cn/develst/cn nic2000.shtml)可见,大部分用户上网还是希望能从网上获得自己需要的信息,而且通常是利用搜索引擎来查找信息。在茫茫的信息海洋中,搜索引擎不失为查找信息的有力工具。但是,搜索引擎是否能让用户满意,是否能彻底解决信息过量的问题呢?

1.2 搜索引擎的尴尬

搜索引擎无疑是目前获取和利用因特网上信息的最佳途径。但是,我们经常会有这样的经历:通过搜索引擎查找了一整天,却只查出一堆无关的信息,有用的信息只是凤毛麟角,甚至毫无收获。

为什么会有这样的结果?因特网上的信息越来越多,于是满足某个特定查询条件的信息也越来越多。以前一个查询可以查出来几十个符合条件的结果,现在则往往会返回几千条结果给用户,使用户感到很困惑。是否还有别的原因导致了这样的调查结果呢?首先,如果被调查对象中有更多的网络新手,就可能由于被调查对象缺乏使用搜索引擎的经验而降低了调查结果中搜索引擎的成功率。其次,一些新搜索引擎的加入,如Google、Ask Jeeves和GoTo,会不会对调查结果产生负面的影响呢?NPD New Media Services公司的负责人Manuzza否定了这两个因素,而且认为这几个新搜索引擎反而遏制了更坏的调查结果的出现。她说,"In fact,these newer services have actually helped keep the overall success rate from slipping further."(注:Search Satisfaction And Behavior Results Released.April,2000.Available at http://www.searchenginewatch.com/sereport/00/04-npd.html)可见,网上过量的信息是导致搜索引擎查询效率降低的罪魁祸首。

2 个性化信息服务

2.1 个性化信息服务的定义

我们应该提供怎样的网络信息服务才能满足用户的信息需求,才能让每一个用户都能满意呢?这一切,只要我们能够发现并利用一个事实就有了希望,那就是:每一个用户都有着不同的兴趣爱好,有着不同的信息需求。尽管设计与实现能够满足用户各自不同需求的系统具有一定的难度,但只有很好地利用这一点,网络信息服务才会取得显著的进步。

在Vannevar Bush的《As We May Think》一文中,我们看到了个性化信息服务思想的雏形。"Consider a future device for individual use,which is a sort of mechanized private file and library...A memex is a device in which an individual stores all his books,records,and communications,and which is mechanized so that it may be consulted with exceeding speed and flexibility."(注:Vannevar Bush.As We May Think.The Atlantic Monthly.July,1945.Available at http://www.theatlantic.com/unbound/flashbks/computer/bushf.htm)尽管在当时还没有个人电脑、没有互联网、没有WWW的情况下,Bush就很有远见地提出了现代信息社会许多新事物的雏形,如超链接。Bush描述了Memex的概念和功能,我们可以从中看见个性化信息服务的思想:每人有一个属于自己的memex,自己喜爱的书籍、资料存放在其中,需要的时候直接从中取用即可。

在因特网不断发展、网上信息呈爆炸式增长的今天,面对纷繁复杂的信息世界,人们只对其中的一小部分感兴趣,因此个性化信息服务开始成为网络信息服务需要考虑的一个关键问题。

网上个性化信息服务是指作为互联网络使用者的个人,可以按照自己的目的和需求,在某一特定的网上功能和服务方式中,自己设定网上信息的来源方式、表现形式、特定网上功能及其他的网上服务方式等,以达到最为方便快捷地获取自己所需的网上信息服务内容的目的。个性化信息服务将接受信息的控制权交到了用户的手中。

2.2 个性化信息服务的原理

2.2.1 动态页面

在因特网上,我们用URL(Universal Resource Locator)来定位信息。通过URL中协议、主机名称、文件路径三个因素的有效结合,为WWW上的信息生成、浏览、传递、定位提供了基本的保证。在WWW信息世界里,信息的基本单位是页,通过在页面中设置超链接,点击链接即可索取感兴趣的页面。目前,信息的基本单位页有两种基本的组织形式:

(1)静态页面。它是WWW信息的基本组织形式,最原始,但也是最通用的形式。信息提供者通过将信息用html语言进行组织,以一个或多个固定形式的页面提供信息;

(2)动态页面。动态页面是互联网络用户通过选择一定的条件提交给WEB服务器,WEB服务器依据提交的条件从数据库中选择符合条件的信息组织成新的页面提供给用户。从浏览器端看来,由于选择的条件不同,每次看到的信息页面的内容也是不同的,因为这些页面是根据不同的条件,从数据库中动态生成的。随着信息技术和数据库技术的日趋成熟,人们越来越趋向于选用动态页面,因为它能提供更高的交互智能,并能减少开发者的开发更新时间。

2.2.2 原理

因特网上的信息是难以计数的,没有人能清楚地知道每一页面准确的位置,但人们总可以通过超链接到达特定的页面。如果用结点表示页面,边表示页面之间的连接,那么,因特网上的所有信息页面可以抽象地表示成一个有向图,如图1表示:

如果把图1中的双向连通的结点抽取出来,单独作一层看待,作为第1层,仅单向连通的结点作另一层看待,作为第2层,则由图2所示。由图2可以看出,从位于第1层中的任意结点出发,可以到达整个图中的任意结点,就是说,在理论上,浏览者只要知道位于第1层中的1个结点,即可访问整个因特网世界。然而,Web的使用者们所知道的只是其中的一部分结点位置,即使通过链接,用户们可以到达其它任何结点,但往往会在搜索时迷失方向或不愿意花过多的精力在因特网上搜索。在某种情况下,当到达某一页面时,甚至会发现没有自己关心的信息,此时,蕴涵在结点中的超链接信息就失去了它原有的意义;或者说,对特定的浏览者而言,他需要的不是到达该页面的漫长的路径,而是该页面到底包含何种信息,以及到达该页面的直接途径。因此,如果能将路径的搜索交给Web服务器自动处理,而用户只需要关心所要搜索的信息类别,不仅可以大大简化因特网上不必要的页面传递,同时可以节省浏览者的精力。于是,就有了个性化信息服务。将这种服务方式的信息搜索方式与原有的信息搜索方式对比,有如下结果:

原有的信息搜索方式:

已知信息路径→点击超链接→到达指定页面个性化信息服务的信息搜索方式:

已知信息类别→点击超链接→到达指定页面可以看出个性化信息服务方式对用户提出了更低的要求,用户只要提供所需信息类别即可,具体的信息路径由Web服务器给出。也就是说,个性化的信息服务依据的是结点信息的类别,直接定位结点的位置。

其实,个性化信息服务站点的建立,并不防碍原有站点的建设。相反,它是在原有站点的基础上,通过对信息的深加工处理,也就是信息的分类与重组,而形成的一种方便个人的一对一的信息服务方式。事实上,它并没有给服务器增加新的页面,而只是利用数据库,将原有的信息页面,依据信息的分类原则,结合个人的兴趣爱好,以动态信息页面的形式呈现给个人用户。从更深的层次上说,它改变了以往的信息发布方式,由单纯的网络信息发布,向交互式的信息服务迈出了一大步。

2.3 个性化信息服务的应用现状

个性化信息服务的思想在国外网站设计与发展中已经盛行,很多网站都为用户提供个性化的服务。

例如,Yahoo网站提供的My Yahoo!(http://my.yahoo.com)功能,让访问者可以在所提供的多个新闻来源中,按照自己的兴趣和要求来设定新闻实现方式和选择新闻的来源;选择自己常用的搜索引擎;查看自己的免费Email邮箱等。在这里,还可以对这个页面的风格作出某些相关的设定,在一系列的选择完成后,产生的页面就是你自己在Yahoo站点中的起始页面,在下一次再来到My Yahoo!连接时,这个被设定好的页面就显示出来。提供这项服务的其他国外站点还有My Excite、My DejaNews等等。另外,国内也有少数几个站点提供了个性化的信息服务,如中文在线服务商ChinaByte在搜索客(http://my.cseek.com)中开通了名为“我的搜索客”的个性化服务,这是国内首家推出个性化信息服务的网站;网易也开通了个性化的“我的网易”(http://my.163.com)。

但是,目前的这些个性化网站服务有一定的局限性:它们为用户提供的通常只是一般性的消息,如新闻、天气预报等,而不能够象图书馆那样为用户提供学术性的研究资料,不能够满足用户寻找专业知识的需求。然而,广大网络用户对学术资料的需求是很大的,目前的网络信息服务方式,如搜索引擎,很难满足这方面的需求。学术资料的集散地是图书馆,无论是传统图书馆,还是数字图书馆,都富涵各个学科的学术资料。尽管这两者在概念上有着很大的区别,但它们有着一个共同的任务:信息服务。所以,在包括学术信息在内的各种信息资源爆炸式增长的今天,如果图书馆能够向用户提供个性化的信息服务,学者和研究者们一定会获益匪浅。

标签:;  ;  ;  

论个性化信息服务_搜索引擎论文
下载Doc文档

猜你喜欢