态势敏感数字图书馆服务系统中用户场景的本体建模_数字图书馆论文

情景敏感数字图书馆服务系统用户情景的本体建模，本文主要内容关键词为：情景论文,本体论文,建模论文,数字图书馆论文,敏感论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

用户情景敏感的数字图书馆服务是根据用户特定信息活动情景自动揭示、推荐可使用资源和服务的一种数字图书馆个性化服务，充分考虑了用户身份、行为、关注对象及偏好等。实现用户情景敏感数字图书馆服务最为基础和关键的任务就是对用户情景信息及其特定情景的信息活动信息进行可计算的描述，这就是我们所说的用户情景建模。用户情景建模用于捕捉并记录用户情景信息，通过建立模型来记录、管理用户的情景，描述用户特定情景下可能的潜在兴趣需求，并记录下特定情景下用户行为的历史，便于将来情景检索和推理。

图书情报领域开始对用户情景相关应用的研究时间还不长，研究和实践都比较少，而用户情景应用相关的研究在普适计算(Pervasive Computing)的情景感知(context-aware)（移动通信手机等手持设备上提供相关情景应用）中，早在1994[1]年就开始了，如今理论和实践方面都已取得了较为丰富的成果。普适计算的情景感知和用户情景敏感的数字图书馆服务对于用户情景应用具有很大的相似性，本文用户情景建模方法就是借鉴了情景感知相关成果。本文先提出了用户情景敏感数字图书馆中间件系统框架并简单论述用户情景本体建模方法的研究现状，然后根据数字图书馆的实践特殊需要确定用户情景敏感服务所要描述的情景，最后利用OWL对这些情景进行本体建模，并对情景模式的初建和更新进行了探讨。

1 用户情景敏感的数字图书馆服务系统及本体建模方法

1.1 用户情景敏感的数字图书馆服务系统

用户情景敏感的数字图书馆服务需要借助于相关的应用系统来实现，这种应用系统实际上只是一个中间件系统，主要功能就是将现有的数字图书馆资源和服务按照用户信息活动情景进行调整，根据用户设备需要调整服务的界面，为用户自动配置其该情景下需要的资源，预测下一步用户将要进行的信息活动，推荐相关的服务等。图1是用户情景敏感的数字图书馆中间件系统框架。

图1 用户情景敏感的数字图书馆中间件系统

图1中用虚线圈定部分是系统的情景预处理模块。目前用户对于数字图书馆的利用主要采用两大类方法：一种是通过安装在个人桌面的工具，比如中科院国家科学图书馆的e划通；另一种方法是用户通过访问图书馆网站利用数字图书馆资源和服务。因此，中间件系统主要需要考虑的是这两种环境下的用户情景。据Dey博士的界定，情景是用于标识某一实体（与用户和应用程序之间互操作相关的人、地点或对象等，包括用户和应用程序本身）情况的任何信息。[2]简单说，用户情景是指用户在某个特定时间段在某特定软件硬环境下对某对象进行的一系列行为及利用的资源和服务。图1的系统通过对用户网络利用情景和桌面利用情景中行为、对象、软件硬件环境、时间等要素的捕获，建立用户情景配置文档，记录了用户在某个情景下利用的资源和数字图书馆服务，其中包括通过隐性反馈获得的用户兴趣。

中间件系统另一部分是数字图书馆资源服务登记库，记录了数字图书馆能够提供资源，包括了提供数据库列表名称、各数据库主题内容、数据库权限分配表、数字图书馆服务形式列表、服务内容等。这部分内容通过资源服务管理模块，存在于资源服务登记库中，是下一步根据用户的情景进行推荐资源服务的基础。

中间件系统另一个关键部分是匹配推理模块，在用户情景和数字图书馆资源服务之间建立联系，实现资源服务推荐排序、界面调整等功能。这里主要利用两种机制：一种是匹配引擎，这是一种基于规则的匹配，实现简单的情景到资源服务关联。比如：如果检测出用户使用手机等移动设备利用数字图书馆网站服务，那么就会提供无图片或少图片的服务界面；另一种机制是推理引擎，借助于一定的推理方法（如本体OWL），实现较为复杂的情景到资源服务的关联。比如用户情景配置文件显示该用户为合法用户，但其当前访问情景的IP地址却不在权限范围内，推理出用户可能在外地出差或学习等，向用户推荐随意通服务。

1.2 本体用户情景建模方法现状调查分析

用户情景建模的好坏直接关系到用户情景敏感数字图书馆服务的质量，而用户情景建模的好坏，建模方法在其中发挥着非常重要的作用。图书情报领域对于用户情景建模的研究还没有见到，相关研究主要来自于情景感知。2004年，Thomas Strang等人经过调查将情景感知的情景建模总结为键值对建模、置标方案建模、图形化建模、基于对象的建模、基于逻辑的建模和基于本体的建模6大类。[3]其中，基于本体的用户情景建模最大的优势就是它具有很强的形式化和语义化表达的能力，便于情景化知识和信息的复用和共享，而且本体构建和推理工具也可以在用户情景本体建模中应用，这使得目前相当多的用户情景建模都是基于本体。

用户情景本体建模过程实际也就是利用用户情景要素构建成本体的过程。Reto Krummenacher等2007年探讨了本体情景建模的标准和工程标准，并对部分本体情景建模进行介绍。[4]对于用户情景本体的构建方法，较重要的有Strang等人在Aspect-Scale-Context Information(ASC)基础上构建情景本体描述语言(CoOL)，利用F-Logic进行情景推理；[5]wang等人利用OWL构建了CONON情景本体；[6]Harry Chen等人在CoBra中使用的COBRA-ONT本体，提供了物理地点、设备、时间、隐私需要和其他对象信息，使用OWL进行描述。[7]对于本体的具体构建：ConOnto[8]本体利用根概念ContextView宣告情景信息，相关实体描述时至少有一个ContextView，另外两个属性是ContextFeatures和ContextEngagements；CoOL[5]本体采用了相似的做法，实体根概念是ContextInformation，使用ASC模型定义并设置内部的链接。CoDAMos[9]使用了类似的方法，一个根概念，围绕Users、Environment、Platforms和Services定义了本体，进行建模。

总起来说，目前用户情景本体建模大都采用了OWL语言描述和推理，具体构建过程中使用根概念对整体情景进行概括，利用核心类目对主要情景进行分类，然后利用属性、属性值和关系对本体进行描述。

2 用户情景要素的确定

对于情景相关的应用来讲，确定要获取的情景要素是一切后续工作的基础。情景要素确定相关的研究，大部分都是通过情景要素分类枚举的方法实现。情景感知领域对于情景要素确定最典型的是Schilit1994年的三类情景要素：[1]①计算情景，如网络链接、通信带宽、附近的资源（打印机等）；②用户情景，比如用户的个人资料、地点、附近的人、现有的社会环境；③物理情景，比如灯光、噪音水平、温度等。Guanling Chen，David Kotz在Schilit三类的基础上又增加了两类情景，从而使情景的描述更加全面：①时间情景，时间、时刻、季节等；②情景历史，用于某些特定应用，比如根据历史情景进行下一步的推理。[10]情景注意元数据研究人员Andreas Dengel等人[11]的情景要素则包括信息对象、运行情况、组织方面、环境、历史、注意、行为、原因六个方面。美欧数字图书馆个性化和推荐系统工作组也将情景要素分成认知能力、个体差异、行为模式、主题领域、工作任务、工作环境六大类。[12]

综合情景感知系统研究、图书情报领域研究以及CAM的相关研究，并结合数字图书馆信息服务实践实际情况，本文认为用户情景敏感的数字图书馆服务用户情景主要可以包括五大类情景要素（见表1）。本质上讲，情景描述的主要任务就是描述用户5W(Who，What，Where，When，How)信息。表1列出的情景要素中，“个人信息情景要素”主要描述了“who”、“where”，“处理资源情景要素”和“接受服务情景要素”主要解决了“what”的问题，“时间历史情景要素”解决的是“when”的描述问题，而“信息行为情景要素”则解决在做处理资源和接受服务中如何做的问题，即“how”，这一部分行为情景的确定借鉴了Xavier Ochoa[13]和Oard[14]等人的总结。确定的要素中增加了接入设备、网络情况、操作系统、浏览器等要素，数字图书馆应该在提供各项网络服务时根据用户PDA等小屏幕设备、网络带宽等因素，提供适合不同情况的网页。

表1 用户情景敏感数字图书馆服务用户情景要素

情景要素类目

情景要素属性

个人信息情景要素用户身份、所处地点、所属机构、任务、项目、工作、兴趣、偏好、

接入设备、网络情况、操作系统、浏览器等

信息行为情景要素行为类型（创建、删除、打开、关闭、选择、检索、浏览、保存、打

印、收藏、复制、粘贴等）、行为参数（输入的检索词等）

资源名称、资源载体类型（文件、文件夹、网页、数据库等）、资源

处理资源情景要素内容类型（期刊全文、目录、文摘、会议、专利、统计数据等）、资

源学科主题、资源使用权限等

时间历史情景要素记录用户行为发生的时间，行为持续时间等

服务类型（参考咨询、原文传递与馆际互借、科技查新、定题检

接受服务情景要素索、情报服务、网络资源导航、培训讲座、学位论文提交、随意通

等）、服务说明等

图2 用户情景敏感数字图书馆用户情景模型示例

3 用户情景敏感数字图书馆服务用户情景本体建模

3.1 用户情景本体建模

用户情景敏感的数字图书馆服务是根据用户的不同情景自动配置和推送不同的服务，表1提供的各类情景要素需要借助于各种关系的连接才能组成一个个不同的情景。表1列出的五类情景要素中，前四类是低层次的情景要素，第五类是高层次情景要素，每种类型的服务情景都由前四类要素中某些要素属性、属性值再加上一定关系组成。用户情景本体建模将用户情景以本体的“类”、“属性”和“关系”形式进行描述。下面抽取用户的某一个情景进行建模说明。比如，用户A在图书馆网站查询资源B这样情景，就会涉及用户身份、所属机构、所处地点、接入设备等个人信息情景要素，会涉及选择、检索、浏览、保存、打印，甚至复制、粘贴这样的信息行为情景要素集C，会涉及数据库类型、数据名称、资源学科主题、使用权限这样一些处理资源情景要素集D以及用户实施查询的时间这样时间历史情景要素。图2是用本体构建的用户该段情景的模型。

借鉴前文本体情景建模调查的结果，本文使用“服务情景”作为用户情景本体的根类，四个关键类是“用户”、“行为集”、“时间集”、“资源”，箭头用于表示各层次类之间的关系，其中实线箭头表示根类与关键类之间关系，虚折线箭头表示关键类和下级类或属性值之间的关系，虚点线表示关键类之间及不同关键类下级类之间的关系。该用户情景模型示例用OWL[15]语言表示形成可供下一步利用的文件，下面抽取其中的一个片段进行说明：

3.2 用户情景初始建模与更新

用户情景敏感的数字图书馆服务情景的获得是由系统自动实现，因此需要较长时间记录情景下用户的行为，才能在下次情景出现时自动推送相关的服务和资源。由于用户的IP地址、操作系统和浏览器的情景要素在用户登录网站时可以很容易获得，通过查询图1中资源服务登记库中IP地址与IP地址所在机构对应表，就可以根据用户的IP地址确定用户所属机构（院系所），确定了所属机构，就可以初步确定用户兴趣的学科领域，通过查阅机构资源权限表可以确定用户可使用资源等。用户登录数字图书馆网站时，用户的简单初始情景就形成了，被存放到用户情景配置文件中便于将来补充和更新。

更为复杂情景的获取需要中间件系统用户情景获取模块跟踪记录用户在利用桌面工具和登陆数字图书馆获取相关服务时的行为、资源、时间等情景信息。一般来说，数字图书馆网站就是按照服务类型来组织网站资源，对于服务类型的识别，可以借助于服务IP地址（段）和服务类型映射表来实现，也可以通过网页相应网址或网页中明显特征来推理识别出相关的服务类型。情景化注意元数据领域的开放源代码插件Attention Toolkit[16]可以应用于用户网络使用情景获取。而对于个人信息情景要素中的偏好和兴趣，个性化信息服务兴趣隐式跟踪和反馈研究中已经进行了较多的探讨，研究根据用户查询、标记书签、点击鼠标、拖动滚动条、网页浏览时间等推断用户感兴趣页面，然后利用支持向量机(SVM)、K最近邻方法(KNN)、神经网络、朴素贝叶斯等方法对文本进行自动分类、统计、抽取用户感兴趣的内容，也有些诸如WebMate[17]等之类的相关系统出现。

用户情景是一个动态的过程，尤其是用户的位置、工作任务、兴趣、爱好都会随着时间的迁移发生变化，这就涉及了用户情景更新的问题。用户较短时间内位置的变化（最为明显是IP地址脱离原有的机构的IP段），如果超出资源使用权限范围，将保留原有情景，推荐使用随意通等校外用户访问资源的服务，并更新情景模型。如果没有超出使用权限范围，保留原有情景，增加部分新情景，并更新情景模式，以便于将来位置返回恢复原有情景。对于兴趣、偏好之类的变迁，则可以借鉴个性化信息服务中对于长期兴趣和近期兴趣的划分并采用“渐进遗忘+滑动窗口”方法[18]方法等进行用户兴趣的更新，并实现情景模型的更新。

4 结语

用户情景敏感的数字图书馆服务涉及用户情景的获取、情景建模描述、情景推理、情景服务等多个方面，本文只是对其中用户情景建模进行了初步的探讨，用户情景建模的结果实际上就是构建一个用户情景敏感数字图书馆服务用户情景本体，本体的具体构建需要在现有情景要素的基础上继续细化，深入把握情景要素之间的关系。情景获取算法和推理算法也是需要深入展开研究，这些都是下一步要进行的工作。

收稿日期：2008-09-02

标签：数字图书馆论文; 用户研究论文; 建模软件论文;

态势敏感数字图书馆服务系统中用户场景的本体建模_数字图书馆论文

猜你喜欢