新一代开源OPAC系统的比较研究_开放源代码论文

新一代开源OPAC系统比较研究,本文主要内容关键词为:新一代论文,开源论文,系统论文,OPAC论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

联机公共检索目录(Online Public Access Catalog,OPAC)是图书馆的公共检索系统,用于查询图书馆的馆藏资源。自2006年初美国北卡罗来纳州立大学(North Carolina State University,NCSU)发布具有革命性的基于Endeca 的新一代OPAC后,国内外连续出现了多种OPAC系统的改进、更新与应用实例,在此基础之上也涌现了一批具有Web2.0特点的新一代开源OPAC系统。除集成于开源ILS系统Koha3.0的OPAC之外,还有一系列独立于ILS的新一代开源OPAC系统,如Blacklight、VuFind、Scriblio、LibraryFind、OPACIAL、Rapi、SOPAC等,这些新一代的开源OPAC系统给用户带来全新的使用体验。本文通过对多种新一代开源OPAC系统的比较研究,为国内图书馆选用新一代开源OPAC系统提供指导及借鉴。

1 新一代开源OPAC系统发展现状

目前,国外对开源OPAC系统的理论研究与应用实践远远走在国内之前,不但有大量的研究文章,而且还有若干的开源OPAC实践项目,表1列出了一些开源OPAC项目①。

据Breeding的统计,目前已有43家图书馆使用新一代开源OPAC系统[1],包括大学图书馆、地区图书馆和公共图书馆。

2 新一代开源OPAC系统调查与分析

为了对新一代开源OPAC系统所具有的功能做最详尽的调查,笔者访问并使用了基于Scriblio、SOPAC、VuFind、Blacklight、LibraryFind、OPACIAL、Koha3.0构建的多个图书馆OPAC站点和测试站点,包括:

(1)使用Scriblio的香港科技大学图书馆[2]、Collingswood公共图书馆[3];

(2)使用SOPAC的Darien图书馆[4]、Ann Arbor地区图书馆[5];

(3)使用VuFind的耶鲁(Yale)大学图书馆[6]、澳大利亚国家图书馆[7]、科罗拉多(Colorado)州立大学图书馆[8];

(4)使用Blacklight的弗吉尼亚(Virginia)大学图书馆[9]、斯坦福(Stanford)大学图书馆[10];

(5)使用LibraryFind的俄勒冈(Oregon)州立大学图书馆[11];

(6)使用OPACIAL的希腊的Panteion大学图书馆[12];

(7)使用Koha3.0的Koha官方测试站点[13]和哈佛(Hartford)大学图书馆[14]。

一些正在开发、尚未投入实际应用(如eXtensible Catalog)或无法访问的新一代开源OPAC(如Rapi)则不在此次调查范围之内。

2.1 对选定新一代开源OPAC调查内容的确定

笔者通过多次浏览和使用选定的开源OPAC站点,以Babu等所提到的评估特性为基础[15],参考了宋登汉等的调查表[16]及Chalon等[17]使用的测试特性,围绕基本技术信息、检索功能、检索结果的显示和输出、Web2.0功能等方面进行调查。对七种开源OPAC调查数据汇总(调查截止于2010-11-14),结果如表2所示。

2.2 对选定开源OPAC调查结果分析

(1)系统的基本技术信息

通过对七个系统的基本技术信息以及维护信息的分析和比较,可以看出这些开源软件都具有较好的通用性、开放性和可扩展性。主要体现在:

①可以在当前主流的操作系统平台下运行,如Windows 或Linux。

②可以通过对代码的直接修改或通过增加该软件的语言包或语言模板实现用户界面的本地化;VuFind和Koha则直接提供了中文的显示界面。

③可以根据自己需要选择相应模块,既可对其进行二次开发,自行扩展其功能,也可通过修改界面模板或相关显示页面,对系统界面实现定制,使其各具特色。如使用Scriblio 的香港科技大学图书馆和Collingswood公共图书馆,其OPAC 就不相同,功能也存在一定区别,香港科技大学图书馆对Scriblio的简单检索进行了扩充,实现了既可单独使用题名、作者、主题作为限制字段进行简单检索,也可三者一起使用,实现高级检索,并可采用RDF用于描述并获取最终的检索结果;Collingswood公共图书馆所使用的Scriblio则利用Ajax 技术,在用户输入检索词时,可动态得到组配了某一检索入口如题名、主题、作者的检索词输入提示,从而增加系统与用户的交互。

④提供了系统安装、调试及使用的帮助文档,有些文档图文并茂,Scriblio还提供了安装、使用的视频帮助。

⑤SOPAC、VuFind和Koha目前有商业公司提供从安装、定制到集成的技术支持,具有良好的发展前景。

⑥使用了其他开源程序或组件,如VuFind、Blacklight使用开源的Solr作为其检索引擎;Koha使用Zerban作为其检索引擎;在界面模板上,VuFind使用了开源的PHP模板引擎Smarty;SOPAC、Scriblio建立在开源CMS、Blog软件Drupal、WordPress之上。

(2)检索功能方面

由于开源软件的开放性、灵活性,使得这些开源OPAC系统的功能较传统OPAC系统有明显增多;开源软件的可定制性使得同一款开源OPAC系统功能、用户界面都有所区别。Web2.0理念以及相关技术的使用,使得系统与用户的交互更为广泛。隐含布尔逻辑的关键字检索技术和分面浏览的普遍使用更给用户带来一种与传统OPAC系统完全不同的检索体验。

①检索方式

OPAC的检索方式通常包括简单检索、高级检索和浏览检索。简单检索通常由一个简单的检索框和一个可选择的检索入口下拉式列表构成,用户输入一个检索词(只能是一个),选择一个检索字段如题名、作者、主题、索书号、ISBN/ISSN等作为检索入口进行检索。

七款开源OPAC系统均使用类Google式长条形检索框的简单检索,随着隐含布尔逻辑的关键字检索(Implied Boolean Logic with Keyword Searching)技术在这些开源OPAC系统中的应用,传统OPAC系统中简单检索的使用方法和功能得到扩展。隐含布尔逻辑的关键字检索是一项普遍应用在搜索引擎中的技术,是指采用某些特定符号代替布尔逻辑的运算符,搜索引擎通常将空格符号默认为布尔逻辑的AND运算符。用户在使用简单检索时,可任意输入一个或多个以空格间隔的关键词进行检索[18]。这些开源OPAC系统中简单检索所使用的这种“Google-like”的检索方式和检索界面不但使传统的简单检索真正的“简单”,而且更能贴近用户的使用习惯。

由于隐含布尔逻辑的关键字检索技术的应用以及用户在二次开发过程中不同的设计理念等因素,这些开源OPAC系统的简单检索也存在差异:如使用VuFind的耶鲁大学图书馆在其简单检索页面无可选择的检索字段,使用Scriblio的Collingswood公共图书馆的简单检索虽然也未提供选择的检索字段,但是在输入检索词时,则会出现组配了相关检索字段辅以类似于搜索引擎的检索词输入的动态提示;香港科技大学图书馆在简单检索界面额外提供了多个不同检索字段的检索输入框。使用VuFind的澳大利亚国家图书馆和使用SOPAC的图书馆均采用下拉列表提供了检索资源类型的限制条件,OPACIAL则是通过点击检索输入框下面的图标对检索资源类型进行限制。

七种开源OPAC均提供浏览检索方式,并且都采用了传统OPAC系统所不具有的分面浏览(Faceted Browsing)。分面浏览又叫分面导航(Faceted Navigation)、分面检索(Faceted Search),是用户通过选择有效的限定条件并以任意组配,动态地、多维地在检索结果集中逐步缩小范围直到获取所需信息的交互过程[19],体现了Web2.0所提倡的以用户为中心,用户参与、用户交互的核心理念。分面浏览与传统的限定方法相比,用户操作更加方便,在检索前不需要了解限定的内容,因此所需要记忆的检索条件也更少,避免了用户对数据库内容预期不足,导致限定条件后没有命中的情况发生,分面通常包括馆藏位置、格式、语言、主题等。

分面浏览在这些系统中实现的方式也不一样,如:VuFind和Blacklight既可直接进行分面浏览也可在检索过程中进行分面浏览,如图1和图2所示;而其余的系统的分面浏览均是在检索过程中实现,以LibraryFind和Scriblio为例,如图3和图4所示。

图1 使用VuFind的科罗拉多州立大学图书馆的分面浏览

②检索策略和检索入口

检索策略广义讲是指用户为实现检索目标而制定的计划和方案;狭义讲则是指检索提问式。检索提问式是计算机信息检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符、截词符以及系统规定的其他组配连接符号组成。检索提问式的构建是否合理,将直接影响查全率和查准率。

图2 使用Blacklight的斯坦福大学图书馆的分面浏览

图3 使用LibraryFind的俄勒冈州立大学图书馆的分面浏览

图4 使用Scriblio的香港科技大学图书馆的分面浏览

这七种开源OPAC都支持布尔逻辑检索与分面检索。比较而言,Blacklight和OPACIAL支持的检索策略较少,VuFind支持的检索策略最多。此外一些在搜索引擎使用的检索技术如词根检索(Stemming)、模糊检索(Fuzzy Search)也在这些开源OPAC系统中得到了应用。词根检索是指在检索过程中系统能根据对词根的分析检索相关词,如对win 的检索将同时包含对winning和wins的检索[20]。模糊检索指可以按照相似度或者各种转义字符查找,比如查找“roam~”就可能查找到foam或者roams[21]。Blacklight、VuFind均使用了词根检索和模糊检索,Scriblio、VuFind还可以设置检索时匹配项的相似度。这些都是传统的OPAC系统所不具备的。

从检索入口来看,除了提供对任意字段的检索外,这些OPAC系统均提供题名、著者、主题检索字段,SOPAC、VuFind、OPACIAL和Koha3.0版的OPAC提供的检索入口都比较多,如连续出版物、出版者、出版年等。SOPAC、VuFind和OPACIAL还能以用户Tag为检索入口,SOPAC甚至提供了用户评论的检索入口。

③检索限定

由于在检索过程中七种开源OPAC系统都提供了分面检索功能,因此,分面成为这些OPAC中最主要的限定方式。此外这些OPAC中还使用了一些常见的分面限定条件如馆藏地、地区、分类、是否是连续出版物等,OPACIAL提供的分面限定最少,SOPAC和Koha还根据读者年龄提供了读者类型的限定。Koha可使用“图书在架状态”作为分面限定条件,避免用户检索成功后却无法获取图书的情况发生。Scriblio、VuFind和Blacklight还记录了用户在分面限定过程中所使用的分面过程,用户在使用过程中只需要点击鼠标就可重新设定或选择分面限制,方便用户在检索过程中灵活地制定检索策略而不需要重新开始,如图5、图6和图7所示。

图5 使用Scriblio的香港科技大学图书馆的分面限定过程

图6 使用VuFind的耶鲁大学图书馆的分面限定过程

图7 使用Blacklight的弗吉尼亚大学图书馆的分面限定过程

④检索帮助

这些系统具有的实时检索帮助充分体现了Web2.0以用户为中心这一核心理念。在检索中,Scriblio提供主题帮助(Did You Mean?);Scriblio、VuFind和OPACIAL都提供了相关检索结果的参照;Scriblio、SOPAC、VuFind都有拼写检查,在拼写错误时给用户以提示;而Koha3.0虽然也提供了拼写检查,但是该系统并不提示错误,而是自动使用正确的拼写方式进行检索。开源软件可定制的特点也在检索帮助中体现出来:使用VuFind的澳大利亚国家图书馆则提供了“From Our Finding Aids”的检索帮助;耶鲁大学则在用户检索失败时会给出“Were You Looking for an Article?”的提示,并提供链接到其他资源的检索链接;科罗拉多州立大学还给出了更改检索式的建议。使用Scriblio的Collingswood图书馆在进行检索输入时,则会出现动态的检索建议,用户可根据需要选择不同的检索入口。Scriblio、VuFind、Blacklight 还为用户提供灵活修改检索策略的机制。

(3)检索结果优化、显示

①检索结果的优化

检索结果过多或过少,检索结果无序都会影响用户对检索结果的获取,从而影响检索效果、降低用户的满意度。检索结果优化包括多种方法,如二次检索、分面/过滤、排序等。七种开源OPAC系统都提供了对检索结果分面/过滤,VuFind还提供了二次检索功能,此外,通过排序组织检索结果列表也是消除大量无序的检索结果难以选择的有效方法,除了Scriblio是使用系统定制的排序方式以外(相关性或时间),其他系统都可以由用户选择排序方式,如相关性排序、时间排序、题名排序、作者排序。其中VuFind和Blacklight还提供了索书号排序,SOPAC更独创地使用了根据用户的评级以及该图书“热门”程度的排序方式。

②检索结果显示

七种开源OPAC在检索结果显示列表页面使用的是带书籍封面的简单显示,包括题名、作者、出版信息、馆藏状态、资料类型,Blacklight还可使用书籍封面的列表作为其简单显示页面。仅LibraryFind是直接跳转到原OPAC的记录显示页面,其余开源OPAC的详细页面包括书籍封面、作者、文献资料种类、出版信息、主题、索书号、物理载体形式、馆藏状态、评论、用户评分等信息。VuFind、OPACIAL、Koha提供了MARC显示,OPACIAL还提供了MarcXML、HTML的显示格式,Koha还提供传统的书目卡片显示格式。Scriblio、Blacklight和Koha无具体的馆藏地理位置信息,OPACIAL和科罗拉多州立大学定制的VuFind使用具体的书库平面图显示馆藏地理位置信息。Scriblio(Related Items)、VuFind(Similar Items)提供了与检索结果有关的其他记录,Koha使用浏览书架(Browse Shelf)按照索书号顺序显示同一书架的其他书目记录信息,斯坦福大学图书馆定制的Blacklight也具有这一功能。

这些开源OPAC均使用了一些外部开放的API实现了对检索结果内容的扩展和对其他外部资源的链接。在命中记录数的显示上,除SOPAC外,其余开源OPAC都未提供限定命中记录数,仅有Blacklight提供用户选择每页显示记录数的功能。

(4)检索结果获取

七种开源OPAC均提供多种检索结果获取方式,SOPAC可将检索结果保存在个人账户信息中;OPACIAL可将记录导入文献检索工具BibTeX和多个社会书签中,如Delicious等;Blacklight可通过RSS方式订阅检索结果或保存在社会书签中;使用Scriblio的Collingswood图书馆可将检索结果以E-mail或手机短信方式发送或保存到多个社会书签中;而香港科技大学图书馆则可用RDF格式保存书目记录,也可将结果导入到联机个人文献书目管理系统RefWorks中。Koha可打印检索结果,也可将结果添加到我的书车(Add to Your Cart)或保存到列表(List)中,还能将检索结果以MODS、Dublin Core、MARCXML和MARC格式导出。VuFind获取检索结果的方式最多,不但能将检索结果以E-mail、RSS、添加到社会书签、发送到手机、导出引文格式、添加到我的收藏夹(Add to Favorites)、导入到联机个人文献书目管理系统RefWorks中外,还可导入到EndNote、Zotero专业文献管理软件中。

(5)Web2.0功能

以用户为中心,即在特定使用环境下为特定用户在有特定用途时所具有的有效性(Effectiveness)、效率(Efficiency)和用户主观满意度(Satisfaction),延伸开来还包括对特定用户而言,产品的易学程度、对用户的吸引程度、用户在体验产品前和使用产品后的整体心理感受等[22]。

通过对开源OPAC的使用,笔者认为简洁的用户界面、“Google-like”的使用方式极大地提高了这些开源OPAC的易学、易用性;分面浏览的使用改善了用户体验,并提高了信息的易获取性,实现了用户在检索过程中与系统的交互。众多开放API和用户在使用过程中的参与互动不但丰富了传统OPAC的内容,而且增加了用户使用OPAC系统的乐趣。

这些开源OPAC都通过调用Amazon提供的开放的API获取书籍封面,Scriblio、VuFind和Koha还获取了Amazon的书评。Scriblio、VuFind、OPACIAL通过使用Google的Books Viewability API可在线浏览部分全文内容。通过Wikipedia的API,VuFind实现了对作者生平的介绍,科罗拉多州立大学定制的VuFind还能将用户指引到谷歌图书、LibraryThing、AddAll等网站中以该书的ISBN号为检索词的检索结果页面。使用Blacklight的斯坦福大学图书馆还在其中增加了SFX服务。

VuFind、SOPAC和OPACIAL还允许用户给书目记录添加Tag,可让用户建立自己的分类模式,对于这些由用户自发定义的平面非等级标签分类,则被称为分众分类(Folksonomy)。分众分类给用户提供最直观的主题浏览方式,使用户一定程度上免去了传统的受控词表中所提供的对于某些普通用户存在理解障碍的主题词而带来的浏览困扰。

Scriblio、SOPAC、VuFind、OPACIAL和Koha都允许用户发表评论。SOPAC和OPACIAL还允许用户评定图书的等级、为图书打分,这些都实现了用户参与图书馆的书目建设。Scriblio、VuFind、Blacklight、OPACIAL都具有添加社会化标签功能,以实现信息的共享。值得一提的是SOPAC通过用户对图书的评级行为,实现了一种基于用户行为的排序和推荐方式(Top Rated),使用Koha3.0的哈佛大学图书馆根据流通数据提供了基于用户借阅率(Most Popular)的浏览方式。

此外灵活的检索策略制定机制、检索中的动态帮助信息、检索失败的建议、拼写检查、多种检索结果保存方式都体现了以用户为中心、用户参与、用户交互的Web2.0精神。

3现有开源OPAC系统存在问题

(1)一站式检索

尽管七种开源OPAC在其项目站点上都说明其具有一站式检索功能,但在实际使用过程中除LibraryFind无需用户干预能同时实现对图书馆目录和EBSCO数据库的检索,其余的开源OPAC系统均未能实现真正意义上的一站式检索,仅是检索不同载体形态的馆藏信息资源。如何实现一站式检索仍然需要探索,这也是开源OPAC未来的发展方向。

(2)相关性及相似度

这些开源OPAC系统所提供的相关性以及相似度仅仅是从检索词的角度进行的排序,而未与图书馆的流通数据、用户借阅数据等密切联系,在后续的发展过程中若能提供类似于Amazon的“购买建议”、“也读过”等功能,则能给用户带来更好的使用体验,增加用户的使用兴趣。

(3)后续发展

任何一款软件都有其生命周期,开源软件也不例外,在对开源软件的选择使用过程中需要关注其生命周期。由于开源软件有很多,其生命周期受开源社区的影响,有些软件可能不被开源爱好者使用而逐渐被忽略,而那些技术上比较好的软件可能会被开源爱好者经常使用,从而得到延续,这使开源软件技术方面的维护周期可能会受到开源社区的影响而延长[23]。在笔者的调查过程中发现曾经参与开发并使用Fac-Back-OPAC的保罗史密斯学院(Paul Smith's College)图书馆现在已开始使用VuFind,而开发Scriblio的普利茅斯州立大学拉姆森图书馆(Plymouth State University Lamson Library)则转而使用WorldCat。

七款开源OPAC系统中VuFind与Koha的开源社区最为活跃,并且有专门商业公司对其提供技术支持,其实际用户数远远多于其余几款。此外开源OPAC系统这种自主开发的软件其应用和维护对图书馆技术人员的要求比较高,这也使得同一款开源OPAC软件在不同的图书馆二次开发的程度不同,系统功能的扩展程度也不尽相同。因此在开源OPAC系统的选择上,其后续发展情况也是需要重视的一个方面。

在Web2.0环境下,这些新一代开源OPAC较图书馆原有OPAC在系统功能、检索界面、操作性、用户使用体验上都有了长足的进步,吸引更多的用户利用图书馆及其服务,也为今后图书馆在购买、改进图书馆OPAC系统提供了更多的借鉴。

注释:

①数据来源http://www.google.com和http://www.sourceforge.net.

标签:;  ;  

新一代开源OPAC系统的比较研究_开放源代码论文
下载Doc文档

猜你喜欢