信息可视化在图书馆OPAC中的应用--以水上图书馆为例_人机交互论文

信息可视化在图书馆OPAC中的应用--以水上图书馆为例_人机交互论文

信息可视化在图书馆OPAC中的应用——以Aquabrowser Library为例,本文主要内容关键词为:为例论文,图书馆论文,信息论文,OPAC论文,Library论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

信息可视化可以将信息对象的特征进行抽取、转换、映射和界面比拟,用各种具象的图示表现信息对象内容特征和语义。[1]目前,信息可视化技术已经受到图书馆学、情报学界的高度重视。尤其值得研究的是信息可视化在图书馆OPAC中的应用。通过视觉化图形界面,OPAC能将无序、抽象的书目信息转换为有语义层次的具象信息提供给用户使用。用户通过图形,视觉和联想不仅可以获取满意的检索结果,也能提高和放大自身认知功能。

1 信息可视化(Information Visualization,Ⅳ)

信息可视化是指使用由计算机支持的、交互的、用视觉方式表达抽象数据以使人们认识放大加深的过程。[2]信息可视化技术涉及和融合了多种学科,如计算机科学、图书馆学、情报学、语言学、心理学和教育学等。G.Robertson和S.K Card(1989)最早设想了信息可视化的原型,[3]认为可以利用二维、三维动画来表示信息之间结构关系。随着人机交互、数据挖掘、语义与本体论等多种理论的发展,信息可视化技术无论是在理论还是在应用层面已日趋成熟。

运用信息可视化技术,用户可以通过计算机屏幕浏览观察图形,并借助工具处理信息,再利用人脑的观察、阅读、判断能力去理解,并将其转换为视觉行为的抽象信息。[4]抽象的信息可以转化为二维、三维或多维图形和各种技术工具,使数据、语言层面的信息处理过程转移到了认知层面过程。借助信息可视化技术,用户能在无序的信息体系中对数据和信息进行观察、加工、挖掘和交互,以便获取所需的准确而有价值的信息。实现信息可视化的目的也在于此。

视觉设计和人机交互是信息可视化的两大重要特征。[5]抽象的信息通过映射由图像显示给用户,用户经视觉感受对信息做出定义、判断,因而可视化的视觉设计直接影响用户的感知能力。用户与计算机之间的人机交互保证了用户以习惯的方式与计算机进行信息交互,计算机也可以通过各种分析方法来更准确地理解用户搜索目的,从而圆满地完成整个信息可视化的过程。

1.1 信息可视化的视觉设计

如何形象地显示信息主题与相关对象之间的关系是可视化视觉设计的重要内容。这种关系由图示来表现。视觉设计决定了图示表现方式,由特定算法映射的这些图示可以使用户一目了然地获取信息。可视化的视觉设计主要取决于信息的抽取、转换、映射和隐喻等过程。[6]其中,信息抽取是从信息对象中抽取外部特征和内容特征,建立专用数据表,为可视化做准备。信息转换是在信息降维的过程中抽取高维信息的特征后高维信息转为低可视化维。信息映射是可视化技术的核心,其过程是通过算法产生一个有效的文献描述特征值的集合。它将数据转化为可以绘制成图形的抽象可视化对象,用图元有效地表现数据的实质,从而实现视觉化建模。信息隐喻是用合适的可视化模型隐喻高信息维的值,并将信息处理中的认知负担转变为感知任务,从而使用户能很快理解并发现规律,提高认知水平。[7]

现阶段信息可视化的视觉设计有多种表现形式,以二维和三维视觉形式为主。以下是视觉设计的主要表现形式:

树形图(Treemap):可显示数据层次里面的所有节点,还能在同一视图显示单个节点的信息。树形图中的图形大小表示了它在整个层次中的相对大小,其他属性由颜色等方式表示。[8]

刷图(Brushing):在一点阵图中,用户在一块区域内选中一个子集,其他任何支持刷图事件的具有相同属性的数据也同时被选中。

双曲线浏览(Hyperbolic Browser):通过两条空间曲线显示节点,根据节点到焦点节点的距离而逐渐缩小图示,保证在有限的视觉范围内显示更多的节点。用户可以使用鼠标转移焦点来观察该结构图示。

表透镜(Table Lens):可支持在大数据表浏览的同时,可以径向分离出需要细览的子表。

锥形树(Cone/Cam Tree):半透明的锥形三维空间图,为了让用户可以观察到所有的数据,根结点即能放置在锥形树的顶端,又可放置在空间(凸轮树)最左端。子节点均匀地分布在根结点的下方或者右侧的锥形延展部分。当用户用鼠标点击了某个节点时,这个节点就会高亮度显示,同时这个锥形树的整体会产生旋转,将该节点旋转到图形的前端位置。

文档透镜(document lens):把多页的一维文档数据像透镜一样缩小映象成三维物体,用户可从多页文档中直接查阅某一页。

透视墙(Perspective Wall):将二维设计转化为三维墙的概念,利用投影方式将对象以贴图的方式贴在三维主体墙上,用户在一个透视区域内观察细节内容,通过水平旋转进行信息浏览。这种视觉变形设计可以扩大可视范围并提供流畅的视觉过度。透视墙技术可以有效地支持空间维和时间维。[9]

场景图(scene graphs):一个树形结构图,根节点表示场景,节点表示场景的各个成分,每一个节点由一个对象实现,所有这些对象的几何属性聚合在一起,构成了三维用户界面的“物理”模型。[10]

信息可视化的视觉设计采用了各种界面比拟来表现。可视化界面比拟是用模拟和比喻来表示系统需完成的操作或命令。其优点在于用户能通过屏幕上的模拟表示(如图标等),直接感受信息内容,缺点是需要占用大屏幕空间,对于抽象程度较高的信息支持较差。界面比拟一般有以下主要表现手段:

颗粒图(Bead):在三维空间内,文档按字顺以颗粒形式排列,通过其空间位置来表示文档间关系。颗粒间的作用力可以使相近的文档相互靠近,相近度差的文档相互远离。该技术也常用在多维可视化中。[11]

主题地图(Themescape):该三维图示可以表达各主题词之间的关联度。它可以将数千份在线文档按照内容进行归纳,以三维“信息地图”的形式表现出来。用户在“地图”上单击即可放大查看源文档。

鱼眼视图(Fisheye View):这是一种放大某一显示画面中的某块小的局部区域的透镜技术,放大区域的周围退到背景显示,但仍然是可见的。鱼眼视图是根据“按需提供细节”(Details on demand)技术而产生的。“按需提供细节”技术是基于逐点详述原理,支持用户在概览完整的信息概念的同时,可交互地细览被选中的数据。用户通过鼠标悬浮的方式展开细节视图,按需查看具有相关度的信息,在无需改变视角的前提下获得可视化结构。[12]

1.2 信息可视化的人机交互

在信息可视化中,人机交互的设计是了解用户和可视化界面的关键。[13]人机交互主要研究人与计算机(人脑和电脑)之间的信息交换,一般包括人到计算机和计算机到人的信息交换两部分。[14]在与信息可视化融合的过程中,人机交互在现阶段主要采用的是以二维图形为主的图形用户界面(GUI)和多媒体用户界面。就人机界面中的信息维的处理过程来看,以文本流为主的一维信息已过度到了以偏重于图形颜色、形状、纹理的维度信息为主的二维信息和显示技术仍以二维平面方式为主的三维信息,其未来是向多维信息发展。现行的交互的主要表现形式是图形用户界面(GUI),用户可以直接对屏幕上的对象进行操作,如拖放、旋转等,信息搜索结果会立即显现在屏幕上。通过不同的主题、颜色、位置和形状等表现形式,可以使交互界面的区域放大,从而提高用户的认知程度。[15]

人机交互的原则应该是界面简单易用,美观而富有启发性,可激发用户的创造性和认知能力的提高。界面的表现力将影响人机交互的效果。对于各种图形元素、字体、色彩等界面因素的合理运用能增加界面的美感,增加用户的兴趣。有试验表明,界面的美观程度可以影响用户对系统可用性的评价(Tractinsky 1997)。而且界面的“外观和质感”令人心情舒畅,如图形优美,色彩协调,字体美观,用户更易容忍系统可用性方面的不足,如容忍导入页面的速度等,而这种现象在信息可视化过程中经常出现。

在信息可视化中,用户可以通过视图交互,变换地重组信息结果图形已达到信息查询的目的。设计优秀的交互界面可以让用户不断地获得认知的体验。用户通过操作可视化控制来改变变换过程中的参数,以达到交互的目的。[16]

2 OPAC与信息可视化

目前,大部分图书馆的OPAC主要功能是向读者揭示图书馆馆藏书目信息。它的主要设计思路还是倾向于图书馆的业务流程,而没有周密考虑到用户的检索行为。其提供的检索结果都是基于文本的线性列表,显示方式比较死板,不易对用户产生视觉冲击力。一旦检索结果命中数比较大的话,用户极易引起视觉疲劳而失去检索兴趣;且线性列表的排列方式根本无法揭示书目信息之间隐藏的信息特征,用户不易理解和掌握书目信息资源之间的语义关系,因而在影响了用户检索的查全率和查准率同时,也让用户失去了提升认知能力的机会。

实际上,图书馆拥有丰富书目数据资源,OPAC也具有信息描述、信息检索甚至是受控词表查询等多种功能,但是用户往往就是不了解如何高效地使用这个工具。OPAC是图书馆资源与用户的交互点,一旦OPAC满足不了用户的需求,图书馆资源将淹没在信息的海洋下,图书馆也就成为知识的博物馆,从而失去了其作为知识提供者、服务者的功能。[17]

和传统的检索结果线性列表相比,基于图形界面的可视化检索结果可以为用户提供更多的信息和更全面的整体浏览效果。有信息可视化技术的支持,OPAC不仅能帮助用户在信息检索的过程中探索、过滤和发现隐藏在书目信息内部的知识体系和信息特征,而且还可提高用户检索行为的效率。通过视觉化的多维视图,不仅在语义层面来引导用户的决策,也可以从知识管理的角度去揭示数据、信息和知识的内在联系,使用户原本并不注意的信息查全率以及查准率得到提高。采用可视化技术的OPAC可以整体反映检索过程,让信息检索过程透明,也可以为用户提供友好的人机对话和交流的环境。通过具有信息可视化功能的OPAC与用户之间的这种良好的人机对话和交流的环境,用户的认知能力可以自然地融入信息检索和信息浏览过程之中。这样的OPAC已经不再是一个简单意义上的图书馆书目查询系统,它理应成为用户进行数据挖掘、信息处理和知识管理的可视化工具。[18]当然OPAC还可以赋予更多的功能,如自然语义检索、社会化标签等等以展示信息之间关系的可视化功能。采用信息可视化的OPAC可以提高图书馆资源信息检索的层次,丰富用户的体验。可以预言,它将成为下一代OPAC的发展方向之一。

2.1 Aquabrowser Library

AquaBrowser Library是荷兰Medialab Solutions公司推出的,[19]由TLC公司代理的,具有信息可视化功能的OPAC系统。[20]全球书目信息处理巨头P.R.Bowker公司于2007年6月收购了Medialab Solutions公司,这将使Aquabrowser Library能更顺利、更迅速地扩展其未来的业务。截止2007年6月底,全球已有200多家图书馆和信息机构在使用AquaBrowser Library,其中包括荷兰阿姆斯特丹公共图书馆,纽约皇后区图书馆,[21]新加坡国家图书馆等。

2.1.1 Aquabrowser Library的视觉设计

Aquabrowser Library的信息可视化是利用目前最为常见的树形图(Treemap)来表示,[22]用空间定位来体现书目信息之间的关系,空间节点的邻近度、布局表达主题词相关度,主题词用节点与连线表示层次。系统界面遵循了由Shneiderman(1994)倡导的可视化信息查询规范:整体浏览—缩放—过滤—根据需要选择细节(demand on detail)。[23]

Aquabrowser Library采用的是主题词云图的可视化(Visual Thesaurus),就是用线条连接起来的主题词分布在网状结构的概念空间内。录入的主题词转换为节点来表示,它出现在网状结构的中心位置。用户可以从整体上观察和了解主题词相关书目信息。节点的大小表示包含主题词的书目信息数量大小,节点的颜色表示用户访问历史。不同的主题词与录入的主题词相邻的物理距离表示这些主题词之间的相关度。与录入检索字段相关度大的主题词显示的字体较大、空间距离较近。此时用户查询与系统返回的命中记录被二维树状结构示意图所代替。当用户点击感兴趣的主题词后,二维图示会随之变化以调整各主题词之间的空间关系,同时用不同的颜色来显示主题词的属性,如拼写变异,已经浏览过的主题词等。用户的检索行为由图示引导。当查询的主题词具有更多的相关主题词时,所形成的树状结构图形也更为复杂,节点数量也会增加。通过点击放大相关检索结果的二维图示,用户在系统提供的多维可视化示意图抽取所需的结果。[24]

Aquabrowser library可将MARC自动转成XML记录。系统工具对于每个XML记录进行特征抽取和共现性分析,建立关键词库,用索引将每个信息对象与关键词库进行可视化链接。系统根据主题词访问频率的大小实现映射。在映射的过程中,相关性差的主题词被自动过滤。系统能自动扩展主题词检索获取可视化检索结果,其中包括词干搜索(stem search)和按照作者名字段衍生而来的相近参考链接。系统分面搜索生成的可视化列表按主题词检索的命中结果进行聚类。

AquaBrowser Library的引擎核心是Lgor的全文词干搜索引擎,各部分包括文本索引引擎、排名和排序器、共现性分析器、编译器和智能拼写生成器以及支持对大于65000个分面的进行精炼的搜索引擎。

2.1.2 Aquabrowser Library的人机交互

考虑到非专业用户的检索要求和习惯,Aquabrowser Library系统的交互功能和界面比较简单、易用。Aquabrowser Library的屏幕布局比较注意平衡,节点之间不显得拥挤。主题词采用的字体不同,用户输入的主题词字体最大,其余与该主题词相关度大的主题词字体稍小,非英语的主题词字体最小。字体大小混合排列的策略可以突出主题词以及各主题词之间的相关度,并能加快用户的浏览速度。

此外,Aquabrowser Library也注意到了交互强调的色彩和布局等因素。人机交互中色彩起着很关键的作用。Aquabrowser Library选择了黄色、绿色和灰色等不易引起视觉疲劳的色彩用于表现节点。有趣的是黄色和绿色光源较其他色彩敏感,这样也能突出节点空间位置,具有相关性的节点用同样的色彩表示,让用户一目了然。[25]

在人机交互的理论中,Washburne的研究认为连线更适合于发现趋势。Aquabrowser Library节点之间采用连线相连,而不是别的表现方式,如折线等。这种可视化交互技术能更好地揭示主题词的相关度以及他们的演化关系,便于用户定义和判断。

3 信息可视化应用于OPAC的问题

事实上,信息可视化在OPAC上的运用正越来越受到图书馆界的关注。同时,Aquabrowser Library也不是唯一使用信息可视化技术的OPAC。美国宾汉顿大学(Binghamton University)图书馆与格鲁克公司(该公司以提供可视化搜索引擎Grokker而闻名)合作,将Grokker搜索引擎移植在其OPAC上使用,同样也获得了不错的效果。但是,这些信息可视化技术的应用尚处于初始阶段,需要在技术的各个层面加以改进。从Aquabrowser Library的实际应用来看,信息可视化应用于OPAC需要在以下一些方面值得关注:

3.1 可变性

图书馆书目资源的规模大小会在一定程度上影响OPAC的功能。信息可视化技术应该适应不同规模资源的检索,同时能响应大数据集处理的要求。Aquabrowser library数据处理能力仅限于15万条书目记录以下,因而提高可视化软件大规模数据并行计算能力,增强系统的可变性,也是信息可视化需要提高的一项重要技术。

3.2 个性化差异

用户的人机交互是信息可视化技术出色与否的重要评价指标。事实上,用户个人的使用偏好和对视觉呈现方式适应程度往往会妨碍检索行为,如有的用户不习惯显示信息层次的锥形树图示的视觉表现手法,有的用户习惯基于文字或数字的线性列表等。而现行的信息可视化软件在做数据预处理和映射时并没有考虑到用户对于视觉表现的接受度,图形界面也只提供单一的图示表现,影响了用户的使用心理和行为,不利于人机交互。OPAC界面的多种人机交互策略应该得到重视。

3.3 算法与标准

信息可视化的建模标准和需要的各种算法和语言标准是这项技术的基本条件。其中三维信息可视化的标准作为丰富,主要有以下三种:虚拟现实建模语言VRML(Virtual Reality Modeling Language),VRML的改进版,由Web3D联盟推出的三维图形标准语言X3D(Extensible 3D),W3C推出的基于XML的可缩放的矢量图形标准SVG(Scalable Vector Graphic)。[26]但是基于这些标准的各种API功能开发和支持标准的OPAC的集成还是比较困难。

3.4 软件评价

信息可视化表现形式在不断增加,有高维数据分析的,有表现知识体系的等等。目前还没有一整套评价指标对信息可视化技术进行评估。作为软件,信息可视化的OPAC也只能靠一些客观的量化数据进行性能评价,如完成书目检索的时间,成功交互与失败交互之比等。可视化两个核心技术视觉表现形式和人机交互机制的评价目前很难完成。建立信息可视化的OPAC评价原形与标准是非常必要的。

3.5 适用人群

视觉表现形式是信息可视化的手段,因而无论二维或是三维图示前提都是以视觉为条件,一旦图书馆用户在视觉方面存在某些障碍的话就会严重影响信息检索行为,如患有色弱或是色盲病症的用户。解决的技术手段之一,就是OPAC能向这些用户提供辅助功能语音提示系统,在语音帮助下让他们准确地完成检索行为。事实上信息可视化不应局限于用户的视觉范畴,还应该扩大到听觉等其他的感知领域。如何将视觉和听觉等表现技术手段结合起来,在不影响用户检索速度的前提下,实现信息感知化应该是OPAC与信息可视化技术的共同的发展方向之一。现阶段可用来制定交互语音应答的标准,如VoiceXML Schema等已完成这方面的标准。影响OPAC语音交互的障碍在于语音插件开发,如语音的机器学习、识别和应答过程等技术还需改进。

3.6 移动界面

现有的OPAC系统已经逐渐跟上了移动通讯技术发展的脚步。有些OPAC,如Talis的Primo就开发了功能全面的支持移动设备的模块供用户使用。目前,实现同时支持信息可视化和移动技术的OPAC还没有出现。开发可视化OPAC移动界面是一项复杂的任务。在考虑各种互联网接入方案的同时,还要考虑不同型号移动设备的硬件差异,同时也必须满足OPAC与移动设备操作系统的无缝集成。[27]因此,在选择.Net J2ME还是BREW作为OPAC可视化移动模块系统架构时,必须充分考虑以上各项因素。同时还应注意照顾到应用于移动设备的浏览标准,如WAP,WML,XHTML等。

3.7 人机交互

OPAC的可视化显示应该清晰、醒目、易读,减少噪音,避免安排过多的书目信息而导致界面混乱。色彩选用要慎重,界面要有艺术化,目的是激发用户的书目信息探索愿望,如可以将一些附加的书目信息隐藏起来,让用户自发地通过学习的方式来挖掘,进而在有意无意之间提高自我的认知水平。用户使用软件的行为可以决定人机交互的方式。从OPAC的功能观察,用户在使用的行为与他们的信息任务有关,如对图书的某些属性、典藏地点、出版商等进行检索和查询,支持这种行为的交互方式采用指示性交互比较适合,也就是更多地由界面提示信息;当用户希望检索特定主题书目而又无法完成检索词输入的时候,最为适合的交互方式应该是对话性的交互,即人与计算机不断地进行信息反馈。而这种基于活动的交互方式在Aquabrowser library的概念模型中没有充分考虑到,其界面的交互方式只有单一的指示性交互,这限制了用户的某些查询行为。

4 结语

信息可视化不仅用图像来显示多维的非空间数据,使用户加深对数据含义的理解,而且用形象直观的图像来指引检索过程,加快检索速度。信息可视化的最大优势就在于将大量抽象的信息映射在图像上,用户通过它们的结构特征来完成认知过程。信息可视化技术或许预示着未来人机互动界面的发展趋势。作为图书馆信息资源与用户之间的交互平台OPAC应适应这种趋势。合理地采用信息可视化来提高OPAC的功能,丰富用户体验,提升他们的认知过程,既避免了用户在信息海洋中迷失方向,也可以避免“图书馆资源将淹没在信息的海洋下”的预言发生。

收稿日期:2007-12-14

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

信息可视化在图书馆OPAC中的应用--以水上图书馆为例_人机交互论文
下载Doc文档

猜你喜欢