主题导航网站的信息采集理论与性能优化_网站性能论文

信息觅食理论与学科导航网站性能优化,本文主要内容关键词为:学科论文,性能论文,理论论文,信息论文,网站论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

      美国数字图书馆联盟(Digital Library Federal,DLF)和图书馆与信息资源联合会(Council on Library and Information Resource,CLIR)从2010年以来连续三年的研究报告中,都将数据清洗、数字学术资源作为研究专题,可见全球对科学信息资源组织和利用的关注程度之高。学科导航是实现学科服务的有效方式之一,通常是指采用一定的规范或者标准搜集、整理、加工各种学科相关的信息,如学术会议、学科发展动态等学科信息资源,并且通过一个学科导航网站平台集中在一起,以便用户能够“按图索骥”,快速、准确地查找到学科相关的信息资源。典型的学科导航网站主要有英国的Intute、美国的Infomine、澳大利亚的学术与科研图书馆网络以及中国的CALIS重点学科网络资源导航门户等。令人遗憾的是,国内外这些学科导航网站并没有实现其预期功能,统计表明CALIS重点学科网络资源导航门户中73.51%的资源从未被用户点击,很多服务处于关闭、更新缓慢、访问不畅通的状态,学科导航建设的鼻祖和领导者——英国的Intute已经于2011年停止更新学科导航服务。可见,学科导航服务正面临着严峻的考验,迫切需要寻求一种新的思路与方法,以便优化学科导航网站的性能,使其能够以用户方便获取的方式提供让用户满意的学科服务,从而提高学科导航服务的效率与质量。

      19世纪70年代,生态学家和人类学家为了研究动物的觅食行为和策略,提出了觅食理论(Foraging Theory)。20世纪后期,生态学家与人类学家发现:人类在互联网上寻找信息的行为和动物寻找食物的行为存在着一些惊人的相似之处[1]。人类在网络环境下寻找信息的过程中,与动物一样需要不断地改进对信息环境的认知,并且做出正确的信息觅食决策,以便在信息投入(如:浏览检索结果、修正检索方式等方面所花费的时间、精力)与信息收益(所获得信息的价值及其附加值)之间寻求一种平衡,以便提高信息觅食的效率,达到最优化信息觅食的最终目标。信息觅食理论的出现,为学科导航网站性能的优化提供了一种思路,信息觅食理论中的“信息线索”(Information Scent)对信息环境的认知影响深远,通过改进学科导航网站中的“信息线索”,可以达到影响用户的学科信息行为、提高学科信息服务效率的目的。关于信息觅食理论与学科导航网站的相关研究主要集中在以下几个方面:信息觅食与信息查询[2-6]、信息觅食与信息导航[7-8]、信息觅食与信息服务[9-10]以及信息线索与信息服务[11-12]等。

      有关文献综述表明,国内外有一些关于信息觅食与信息检索、信息觅食与信息导航等方面的研究。虽然这些研究在数量上达到一定规模,内容上也多有新意,但是仍存在一些局限,如:研究主题与学科导航网站结合不够紧密;研究比较零散,信息线索特征、用户信息觅食规律等方面欠缺系统而深入的研究等。本文首先回顾信息觅食理论的理论基础和基本模型;然后将信息线索划分为文字型、图像型、音频型和视频型四种类型,设计信息线索在学科导航网站中应用的五个原则;最后,构建基于信息觅食理论的学科导航网站性能优化模型,选择美国的Infomine学科导航网站进行案例分析。

      1 信息觅食理论

      20世纪90年代,信息觅食理论的先驱Pirolli在其著作Information Foraging Theory中正式提出了“信息觅食理论”的概念。Pirolli提出的信息觅食理论(Information Foraging Theory)认为用户信息行为和动物觅食行为非常相像,用户需要在寻觅信息时所花费的时间、精力等信息投入与信息能够带来的收益之间寻求一种最优平衡,而信息环境中的导航、链按说明文字或图片等信息线索(Information Scent)可以提高信息产品的可用性[13]。下面主要介绍信息觅食的理论基础和基本模型。

      1.1 理论基础

      信息觅食的理论基础主要有:社会心理学家布伦斯维克的透镜模型(Lens Model)、安德森的归类适应性理论(Adaptationist Theory of Categorization)与记忆适应性理论(Adaptationist Theory of Memory)以及麦克法登的随机效用模型(Random Utility Model)。

      (1)透镜模型。布伦斯维克的“透镜模型”假设人类(Human Race)的思维特征是通过某些提示性质线索(Clues)来评估或判断某些事件或者决策的。该模型主要关注人们通常是怎样利用这些提示性的线索,以及这些提示性的线索在人们的整个觅食决策过程中所占的比例进行研究,有利于理解人们的评估和判断策略[14]。

      (2)归类适应性理论和记忆适应性理论。安德森的“归类适应性理论”是一种关注组织是如何利用过去已经观察到的内容来预测尚未观察到的内容的理论[15];而“记忆适应性理论”是一种关注如何在人们已有的信息背景中检索到人们所需要信息的理论[16]。

      (3)随机效用模型。Mcfadden的随机效用模型是一个非常经典的选择理论模型[17]。

      1.2 基本模型

      信息觅食理论的基本模型主要有Stephens和Krebs给出的两个传统模型:斑块模型(Patch Models)和食谱模型(Diet Models)[18]。

      (1)斑块模型。“斑块模型”的假设是:将动物生存环境中各种食物资源划分为“斑块”形状,动物将会面临各种食物资源的分布不平衡和如何选择觅食斑块的问题;动物需要考虑两个问题,一是如何选择在不同的“觅食斑块”中觅食的时间;二是怎样在合适的时间内结束当前“觅食斑块”的觅食,以便寻找新的“觅食斑块”。在学科网络信息环境中,学科信息也可以视为呈斑块分布的,学科导航网站的学术机构、学术期刊、学术会议等栏目都可以视为块状的信息;用户访问的学科导航网站的每个链接页面也可以视为一个信息斑块,甚至页面中的图片、文字、音频、视频等资源也可以看作是一个斑块单元。

      (2)食谱模型。“食谱模型”的构建是用来解释动物如何选择觅食对象问题的,该模型关注的是动物在面对不同环境时应该选择哪些食物资源作为觅食对象更合理,效率更佳。食谱模型假设:动物寻找到猎物的速率是一定的,这个速率与搜索时间有关;寻找猎物和处理猎物(包括追赶)是两个互斥的过程;觅食者对猎物和环境的知识了解得很充分,这些知识包括分布率、能量值和搜索处理所需的时间等;关于猎物的信息掌握得很完善且一旦遇到猎物,立刻就能用于实践。在学科网络信息环境中,信息用户同样会面临着时间、精力等资源的分配和选择问题,在学科导航网站中,有着不同类型的学科信息,获取各种类型学科信息资源所需要花费的时间和精力学科信息用户事先是有一定了解的,在用户访问学科导航网站的信息时,用户能够将这些事先掌握的知识应用于信息觅食的实践中去,在信息觅食所需要花费的时间和精力等成本和信息能够带来收益之间做出权衡,选择合适的信息资源作为觅食对象。

      2 信息觅食理论在学科导航网站中的应用分析

      学科导航网站性能优化的最终目的是通过解释并预测人们如何采取最优化策略来改变自己的行为以适应信息环境来构建最优化的信息环境,让每个学科信息用户都能成为“最佳信息觅食者”,而学科导航网站用户的信息觅食行为与决策受学科信息环境中信息线索(Information Scent)的引导和驱使。信息线索是信息觅食理论的一个非常重要的概念。简单而言,信息线索就是在用户寻求信息的环境中,能够捕获用户注意并对用户的后续行为有引导或暗示作用的信息。

      根据心理学的研究,捕获人的注意需要考虑两个方面的影响因素:一方面是人当前的任务目标,强调人的期望和有关目标刺激的假设对个体选择信息的影响;另一方面是外界的信息特征,强调刺激特征对个体信息加工的影响[19]。因而,如何捕获用户的注意是提高用户信息觅食效率的关键,而对学科导航网站的信息线索的类型及其对用户学科信息行为的影响分析显得非常有必要。

      2.1 学科导航网站的信息线索分析

      学科导航网站的信息线索是指学科导航网站上那些能够吸引学科信息用户的注意力,对学科信息用户的信息行为能够起到导航、引导或者暗示作用的信息,这些信息的表现形式可以是多种多样的,常见的信息线索表现形式主要有文字、图像、音频和视频,如表1所示。

      

      Theeuwes等的观点认为:在用户进行信息觅食的时候,某个提示性“线索”的刺激是否能够成功地捕获到用户的注意力,从而起到“线索”应起的作用,这在很大程度上取决于该“线索”相对于其他“线索”给用户带来的刺激的显著性程度,刺激相对于其他刺激的显著性越高,捕获用户注意的可能性就越大[20]。因此,学科导航网站中用来作为信息线索的文字、图像、音频以及视频等应该具有较强的显著刺激,才能够起到信息线索的作用,成功地引导、暗示用户,进而影响学科用户的信息行为。

      2.2 学科导航网站信息线索设计原则

      格式塔心理学是西方现代心理学的主要流派之一。20世纪初,奥地利及德国的心理学家创立格式塔理论(Gestalt),认为当若干个元素具有一个或者多个相同的属性时,人的认知系统倾向于将这些相似的元素组合成一个整体的视觉元素。格式塔理论认为人们的认知过程是一个“眼”和“脑”相互作用且不断地作用、调整、简化、统一的过程,只有通过这样的相互作用的过程,才能够产生方便人们理解、协调和认知的整体[21]。

      格式塔理论的创始人们提出了五项法则:接近(Proximity)、相似(Similarity)、闭合(Closure)、连续(Continuity)、简单(Simplicity),这五项原则也可以应用于学科导航网站信息线索的设计过程之中。

      (1)接近原则。接近原则是指互相接近的对象可以被看作是一个整体。在设计学科导航网站的信息线索时,应该遵守接近原则,将不同类型的学科信息组织按照不同的格式进行规范和统一,从而让学科信息用户在浏览这些不同类型的学科信息时,能够从视觉上对每类学科信息进行自然的引导,从视觉上按照类别行为整体的认知,让用户对不同类型的学科信息更容易识别。

      (2)相似原则。接近原则和相似原则是两个比较容易搞混淆的概念。两者的区别是:接近原则强调的是位置上的接近,而相似原则则强调的是内容上的接近。在人们的认知中,通常倾向于把那些明显具有共同特性(如形状、运动、方向、颜色等)的事物组合在一起。学科导航网站可以利用相似原则设计信息线索,例如,在设计学科网站的导航条时,可以用颜色或者字号、字体等区别一级栏目、二级栏目、三级栏目等,这样学科信息用户只要看到类似一、二、三级栏目的颜色或字号就可以判断当前访问的是几级栏目。

      (3)闭合原则。闭合原则通常指的是闭合的图形可以理解为统一整体,但有趣的是,不完全闭合的图形有时候也会被用户认为是统一的整体。这种现象在心理学上也叫做“心理补偿”。闭合原则在学科导航网站信息线索设计中的应用可以是通过刻意设计一些不完全闭合的图形或者有意识地去掉某些闭合图形的某些部分,让学科信息用户浏览这些图形时,通过运用自己的认知思维去主动闭合这些图形,从而达到吸引用户的兴趣和注意的目的,起到信息线索的作用。

      (4)连续性原则。连续性原则是指以实物形象上的不连续使浏览者产生心理上的连续知觉,如:间断短线的连续分布将会被看作是一个整体,这个原则与闭合原则有些相似。在应用连续性原则进行学科导航网站信息线索设计的过程中,可以将具有连续性的图标、图像等网站元素进行连续分布,从而让学科信息用户在浏览学科导航网站时对这些元素形成一种连续性的整体感觉。

      (5)简单原则。简单原则可以说是设计追求的较高目标,“少即是多”是目前流行的设计法则,关注所需要表达的信息本身,而不是冗余的界面元素,可以减轻用户浏览信息时的负担,更好地起到引导、提示的作用,提高信息觅食的效率。

      3 信息觅食理论与学科导航网站性能优化

      3.1 基于信息觅食理论的学科导航网站性能优化模型

      基于以上的分析和论述,我们可以构建基于信息觅食理论的学科导航网站性能优化模型,如图1所示。

      

      由图1可知,基于信息觅食理论的学科导航网站性能优化模型主要由三部分组成:信息觅食理论、格式塔五原则以及学科导航网站优化。

      (1)信息觅食理论。主要包括信息觅食的理论基础与信息觅食基本模型,正如前文所述,信息觅食理论的这些理论基础和基本模型是学科导航网站性能优化的主要基础与基本思路,贯穿于学科导航网站性能优化的整个过程。

      (2)格式塔五原则。正如前文所述,格式塔五原则是心理学的重要理论,该理论与用户的认知有关,将格式塔五原则应用于学科导航网站性能优化实践,对于“信息线索”的设计、学科导航网站结构的设计、学科导航网站信息内容的组织与描述等都可以起到较好的实践指导作用,有利于提高学科导航网站性能优化工作的质量与效率。

      (3)学科导航网站优化。学科导航网站优化部分主要以信息觅食理论的核心概念“信息线索”为基础,分别从文字型、图像型、音频型以及视频型四种信息线索出发,对学科导航网站性能的优化进行分析,从操作层面为学科导航网站性能优化提供了方法的指导。

      基于信息觅食理论的学科导航网站性能优化模型的工作原理为:首先,信息觅食的理论基础和基本模型为学科导航网站结构的设计、学科网络信息的组织与描述以及学科导航网“信息线索”的描述等提供理论的指导;然后,格式塔五原则主要为学科导航网站的设计、学科信息的组织与描述以及学科导航网站“信息线索”的描述提供具体的、可操作的实践指导,为学科导航网站性能优化实践提供支持;最后,学科导航网站性能优化的实现主要包括四个方面的内容:文字型信息线索的优化、图像型信息线索的优化、音频型信息线索优化以及视频型信息线索优化,通过对学科导航网站这四种类型信息线索进行优化,可以达到提高学科导航网站性能的最终目的。

      3.2 案例分析

      如前文所述,国内外典型的学科导航网站主要有英国的Intute、美国的Infomine、澳大利亚的学术与科研图书馆网络、德国的SSG-FI以及中国的CALIS重点学科网络资源导航门户等。本文选择美国的Infomine进行案例分析。

      3.2.1 案例介绍

      Infomine(http://infomine.ucr.edu/)是一个为高校学生、教学科研人员提供网络学术资源的虚拟图书馆。Infomine起始于1994年California大学River Side分校图书馆的项目:iVia开放资源虚拟图书馆系统。从1999年3月到2004年6月,iVia项目先后发布了10个版本的iVia系统软件。iVia是Infomine的平台,它将专家和机器整合在一起,进行资源收集、创建和管理,使之成为图书馆组织网络信息资源、开发网上虚拟图书馆的成功实例[22]。后来陆续有Wake Forest、California State等大学图书馆加入Infomine项目,目前Infomine的成员主要由来自这些大学的人员组成,分为“Content Development”、“Programming and System Administration”、“iVia Software”等团队。

      3.2.2 案例分析

      运用基于信息觅食理论的学科导航网站性能优化模型对美国的Infomine学科导航网站进行分析,我们得到以下发现:

      (1)Infomine学科导航网站的设计符合基本上符合格式塔五原则。Infomine学科导航网站设计符合“接近性原则”,在Infomine学科导航网站的首页(http://infomine.ucr.edu/),采用不同颜色的图标表示不同类型的学科信息(如:Biological,Agricultural&Medical Sciences为浅绿色的按钮),点击进入某种学科信息检索和浏览页面后,该学科的颜色与首页图标的颜色一致,均为浅绿色(http://infomine.ucr.edu/cgi-bin/searchcategory=bioag),这样学科用户只要看到学科相应的“颜色”就可以知道目前打开的是哪个学科信息的浏览或检索页面。Infomine学科导航网站设计符合“相似性原则”,每个学科信息浏览和检索页面的风格都是一致的,检索结果所能够包含的信息也是一致的。Infomine学科导航网站设计还符合“简单原则”,从首页界面和某学科信息检索和浏览界面可知,Infomine学科导航网站的设计风格是简洁的。

      (2)Infomine学科导航网站的“信息线索”情况分析。就文字型信息线索而言,Infomine学科导航网站文字的字号的大小、字体的颜色等方面有一些变化,打开首页和某学科资源导航网页看出来,有些地方的字号还是稍嫌不够大,特别是图2所示的页面,“Searchfor”上面的导航条的文字由于太小阅读起来比较费劲。

      

      图像型信息线索,Infomine学科导航网站上面有一些图像型的导航信息线索,但是其导航作用不够明显。比如:首页图像,鼠标移动到图像的字母“i”所在的位置,是一个图像链接,可以链接到关于Infomine介绍的页面,鼠标不移动到该处,其链接作用很难发现,这样的图像型线索由于其显著性很差而无法起到引导和导航的作用,是不符合信息线索设计的原则的。

      音频和视频型信息线索,通过访问Infomine学科导航网站可以发现,该网站目前尚未用到音频和视频型的信息线索,事实上音频和视频信息线索是两种更加丰富、更加有效的信息导航工具,对于一些适合于用音频和视频型信息线索引导或者导航的学科信息资源可以考虑采用这两条信息线索来进行引导。另外,音频和视频型信息线索还可以作为具有视觉障碍用户的导航工具。

      (3)Infomine学科导航网站对学科信息的“斑块”(Patch)特征关注不够。信息觅食理论的斑块模型认为网络环境中的信息是呈“斑块”的形式分布的,比如:按照学科的不同有不同分布的学科信息斑块,按照信息来源的不同可以分为不同的信息斑块,由图2所示的Infomine首页界面可知,Infomine学科导航网站将“Electronic Journals”、“Government Information”与“Business and Economics”等学科信息并列到一起,这种做法是与信息觅食理论中的“信息斑块”理论是不相符的。

      4 结语

      国内学科导航服务始于20世纪90年代末,起步较晚,在规模、数量、质量方面都不及欧美国家,学科的覆盖范围也比较有限。另外,虽然构建了一些学科导航网站,如:CALIS学科导航库、中科院国家科学数字图书馆(CSDL)的图书情报等5个学科信息门户和长江流域生态和环境等9个特色专业信息门户、国家科技图书文献中心(NSTL)的纳米科技等17个科技热点门户等,但是这些学科导航网站的信息质量和效率有待提高,用户接受和利用率普遍不高。本研究对信息觅食的理论基础和基本模型进行回顾,将信息线索分为文字型、图像型、音频型以及视频型信息线索四种类型,并设计信息线索在学科导航网站中应用的五个原则,构建基于信息觅食理论的学科导航网站性能优化模型,为学科导航网站优化的实践提供了一种新的思路;同时本研究选择美国的Infomine学科导航网站为例,对信息觅食理论在学科导航网站优化中应用的情况进行分析,从一定程度上检验了本研究构建的基于信息觅食理论的学科导航网站性能优化模型的效度。

      需要注意的是,由于目前国内外关于信息觅食理论在学科导航网站中应用的研究还不多,本研究设计的“模型”的效度检验有待条件成熟时的后续研究进一步开展。而学科导航网站的互操作性、学科网络信息的共享、信息描述的标准和规范、学科导航网站的可持续发展等都是值得进一步研究的问题。

标签:;  ;  

主题导航网站的信息采集理论与性能优化_网站性能论文
下载Doc文档

猜你喜欢