开放个性化定制机制:基本概念与逻辑框架_元数据论文

开放个性化定制机制:基本理念与逻辑框架,本文主要内容关键词为:框架论文,逻辑论文,理念论文,机制论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 开放信息环境对个性化定制的挑战

现代信息服务环境是一个由众多分布、异构和多样化的信息资源构成的开放信息空间。为了有效发现和利用信息,用户希望按照自己的认知体系将开放信息空间中自己所需的信息资源构建为集成化的虚拟个人信息空间,这就是个性化定制的实质。

图书情报领域对个性化定制的反应是非常积极的。以美国北卡罗来纳州立大学的MyLibrary@NC为代表的“MyLibrary”机制迅速发展,成为数字环境下图书馆的一种基本服务[1-2]。然而,“MyLibrary”机制主要针对特定机构的资源集合进行定制,属于本地个性化,在提供实际效用的同时却存在不少限制。例如,定制的资源对象限制在本地系统提供的资源范围,定制组织结构受本地系统资源组织体系的限制,定制技术实现也依赖于本地系统自身技术机制。因此,“MyLibrary”实际上是本地系统的一个同构、封闭子集,带来了以下问题:

·用户需要利用多个系统的多种信息资源来满足自己的需求,但传统的“MyLibrary”很难将其他系统的资源有机纳入。换言之,一个用户可能需要多个本地化的“MyLibrary”,造成用户在定制和资源利用上的重复、混乱。

·用户总是希望按照自己的认知方式来构建其信息空间,而本地个性化是依赖于本地系统的组织体系和技术实现机制的,用户只能按照本地系统固有的资源类型、主题类别、利用方式等来组织资源,难以实现“MyLibrary”信息结构的量身定做。

·本地个性化实际生成本地系统的一个“附属产品”,即使一个用户愿意在多个系统上分别定制若干“MyLibrary”,它们在组织结构、资源描述、利用方式上也各不相同,很难进行交换、转换和整合,更难将它们和用户的其他资源(如科研数据库、管理信息系统、科研团队网站资源乃至用户计算机上的资源等)集成起来,构成真正的“MyLibrary”。

在开放信息环境下,图书情报服务已经从仅仅利用本地资源提供服务,转变到以用户为中心、利用整个信息环境中的所有可能资源来提供服务。为此,必须构建开放个性化定制机制(OpenMyLibrary,简称OpenML)来支持用户对开放环境信息资源的集成个性化定制。

2 对开放个性化定制的要求

2.1 开放个性化定制所应提供的用户支持

为实现在开放环境下构建集成个性化信息空间的目标,OpenML应该能够:

·支持一对多(一个用户对多个系统)的集成个性化定制,帮助用户不受具体系统限制地在开放信息环境中选择和连接所需要的资源。

·支持用户按照与具体系统无关的方式来描述资源(包括资源类型、主题类别、时空范围、权重因子、提供者类别、利用方式等),来定义自己的资源组织结构(如类型分类栏目、主题体系、时空体系、权重顺序等)。

·支持用户按照与具体系统无关的方式来定义集成界面(包括栏目设置、栏目布局、显示控制参数、资源捆绑形式、外部接口形式等),或者定义其个性化扩展方式。

·支持用户之间对定制信息的共享,包括不同用户对其他用户定制信息的共享和团队用户共享个性化定制信息(group personalization),同时提供可靠的安全性和隐私保护。

2.2 对开放个性化定制的技术要求

为了实现上述要求,OpenML在技术上需要:

·支持对开放环境中分布、异构信息资源的开放描述,支持在基本开放描述语言基础上的个性化扩展,保证用户能为自己的OpenML定制合适、开放的资源描述机制。

·支持对资源集合组织机制的开放描述,支持在基本开放描述语言基础上的个性化扩展,保证用户能为自己的OpenML定制合适、开放的集成组织机制。

·支持对OpenML的呈现机制进行开放描述,支持在开放描述语言(如样式单、接口绑定、Web Service机制)上的个性化扩展,保证用户能为自己的OpenML定制合适、开放的呈现方式。

·支持对定制结果(定制机制和定制内容)的公开发布、公共登记和开放搜寻,帮助用户发现、复用和扩展可共享的定制结果。

·支持用户利用多种方式搜索定制结果(如直接搜索、利用搜索引擎、利用登记系统、P2P交换等),支持用户按照定制机制描述组织资源、呈现形式、共享形式。

· 进一步地,支持OpenML开放嵌入关于资源利用的相关控制机制或者相应描述信息(如版权管理、使用控制、资源评鉴、隐私保护、推送服务等)。

·支持根据用户需求的开放描述来自动配置OpenML,包括匹配过滤可共享的个性化定制结果、匹配过滤公共的虚拟资源定制集合以及自动搜寻资源集合描述。

·支持OpenML的灵活配置,例如可以依托于一个信息系统(系统端),也可以作为一个相对独立的服务(中间件),或者依托于用户系统(用户端)。

·支持OpenML根据用户利用情况实现动态个性化定制(Adaptive Personalization,如动态调整用户需求描述,动态调整OpenML资源选择、组合和呈现形式等),其中某些功能(如用户使用情况跟踪捕获)可能借助第三方系统。

OpenML可以被看成是传统MyLibrary的推广。OpenML针对任意N个不同资源系统来进行个性化定制,当N=1时,就是传统的MyLibrary。不过,N从1推广到任意数时,由于N个系统具有分布和异构性,所以开放个性化定制必须建立在新的模式上。

3 OpenML的逻辑框架

为了构建开放个性化定制机制,需要分析定制过程中涉及的各种逻辑对象及其相互关系。我们可以将个性化定制看成是用户、资源和个性化组织机制的选择绑定,即一定的用户根据自己的需要,选择一定的资源,按照一定的个性化组织机制来组织和呈现。用户、资源和个性化组织机制分别由3个描述集代表(见图1)。

图1 个性化定制的逻辑框架

·用户描述集(user profile):描述用户身份、用户特征(如身份类型、专业、单位地点等)和用户偏好(如资源类型、主题、内容时空、评鉴级别、授权条件等的选择)。

·资源描述集(resource profile):描述资源标识、资源内容特征(如类型、主题、时空范围等)和资源管理要求(如评鉴等级、授权条件、适用对象等)。

·信息结构描述集(information architecture profile):描述个性化定制最终呈现形态的类型、结构要求(如栏目类型、数量、布局、控制条件)和内容要求(如栏目内容、内容结构、内容顺序等)。

每个描述集的各个参数(attributes)都按照一定的内容编码体系来具体赋值。

3个描述集一般用相应元数据格式具体化,可以使用一致的内容编码体系(如资源类型体系、主题分类体系、内容时空描述体系等)来表示相同或相似的参数从而支持三者之间按照参数及其取值自动匹配。当然,某个描述集可以对某个参数采用自己的内容编码体系(如用户自定义资源类型体系),并将其他描述集的资源类型参数映射为自己的编码体系取值。如此,即可按照自己的个性化编码体系来描述和定制。

在上述基础上,可以利用个性化描述文件(personalization description file)具体描述三者之间的个性化绑定。如果这个文件本身是基于XML的,则可以在支持XML的系统上解析该文件,并通过XSLT样式单来实现个性化定制的开放呈现。另外,我们也可不具体描述实际的个性化绑定,而是建立个性化绑定规则(personalization biding rules),让系统在需要的时候具体执行这些规则,动态地生成相应的绑定结果。

4 OpenML机制的位置与作用

根据OpenML在用户信息环境中的位置,可有系统端、中介端和用户端3种配置。

4.1 系统端OpenML

依托于一定的信息系统,利用本地系统现成的技术机制,对本地资源进行定制,容易与本系统具体服务捆绑,跟踪用户使用本系统的情况,同时也可以通过搜索、描述和组织其他资源的机制来提供“开放”定制。但是,这类机制在认知、结构和技术上很难摆脱本地限制,多个系统端OpenML可能同时存在,定制结果难以在多个系统端OpenML间共享,而且也难以跟踪用户对多个系统的使用。

4.2 中介端OpenML(或称为OpenML引擎)

通过独立中介形式的定制引擎,可对多个资源系统进行开放的集成定制,支持定制结果的共享,在一定程度上可跟踪用户通过OpenML对多个系统的使用。但是,这类机制需要较强的开放描述能力和开放的技术结构,与具体资源或服务的绑定比较困难,同时需要专门的系统支持和管理能力。

4.3 用户端OpenML

直接将OpenML建立在用户信息系统端,易于实现开放定制,并易于将定制结果与用户信息系统的功能进行嵌接,全面跟踪用户对外部资源和个人资源的利用。但是,它也需要较强的开放描述能力和开放技术结构,同时需要较强的资源搜索或登记机制的支持。

随着开放元数据机制[1]的发展,OpenML引擎的技术基础逐步成熟,可以提供功能强大、可共享和可管理的开放个性化定制服务。如进一步,OpenML引擎可作为WebService[1],被发布、登记和发现,有效支持开放定制及其共享。另外,作为WebService,OpenML引擎可以被有机地嵌入信息资源系统和用户信息系统,支持系统端或用户端OpenML。

5 OpenML引擎的逻辑流程

我们可用图2表示OpenML引擎的逻辑流程。

图2 OpenML引擎的逻辑流程

5.1 搜索资源信息

OpenML引擎利用多种方式在开放环境中搜索资源描述信息,例如:①按照开放协议(如OAI),从信息系统公知位置上搜索其发布的本地资源描述目录。②从公共登记系统(resource registry)检索公开发布的资源描述目录或资源描述信息。③直接利用浏览器或公共搜索引擎从网站上搜索资源描述信息。当然,如果OpenML引擎作为服务系统而不是作为一个公共工具,则需要界定它的资源搜索范围。

5.2 组织基准资源目录

OpenML按照资源的基准元数据格式,对资源进行描述,建立基准资源目录。基准资源目录的作用主要不是直接提供检索或浏览,而是提供一个可供重新选择、描述、分类、组合的“底本”,支持用户利用它生成个性化资源集合。因此,基准格式支持开放、可扩展结构,支持独立命名域的内容编码体系,实际上支持用户利用它来生成自己的元数据应用协议(application profile),并据此描述自己的个性化资源集合。

5.3 组织虚拟分类目录

基准元数据格式可以为各个元素(参数)定义基准内容编码体系,描述资源细节(如资源类型、主题类别、时空范围、评鉴等级等)。OpenML引擎可以按照其中任何编码体系来组织相应的虚拟分类资源目录。但是,由于这些编码体系是独立的元数据命名域,只是“默认”编码体系,可以被其他元数据命名域所取代或扩展,因此基准元数据格式可以支持用户自定义内容编码体系(例如主题分类),对资源进行个性化描述和组织。

5.4 组织用户个人资源目录

OpenML引擎按照用户元数据格式,从基准资源目录中选择资源组织成用户个人资源目录。用户元数据格式可采用基准元数据格式,也可对它进行扩展,例如重新定义或复用有关内容编码体系,扩展必要的元素或属性。选择资源时、可按照用户特征和用户偏好从基准目录中过滤资源,将某个虚拟分类目录推荐为默认目录,或将某个相似用户的可共享个人目录推荐为默认目录,同时,可支持用户对基准目录、分类目录和可共享个人目录搜索选择。用户可利用个性化编码体系对资源重新标引,并确定个人目录可否共享。另外,支持利用浏览器直接从开放环境中搜索资源,添加到个人资源目录中。

5.5 建立信息结构定义

信息结构(information architecture)是将资源集合组织成可视空间的组织结构,包括对栏目类型、数量、内容结构、内容顺序、附加内容、控制形式、显示参数、总体布局、数据绑定等的定义。OpenML引擎提供基于XML的信息结构标记语言,可按照不同风格、学科、不同层次用户等定义若干公共信息结构。用户可直接采用或者修改某个公共结构来形成自己的信息结构,并按照自己的认知体系来组织个性化信息空间。

5.6 建立开放呈现机制

在OpenML引擎中,信息结构各栏目以一定方式与相关资源描述记录绑定,这些记录按照元数据格式描述、通过(基于标引参数的)过滤机制选择,按照信息结构规定的内容结构显示。由于信息结构和信息内容都基于XML,因此OpenML引擎可利用XSLT技术来建立默认呈现机制,也可提供开放接口支持第三方XML-capable系统读入信息结构文件及其绑定数据,从而灵活地将OpenML服务嵌入自己的系统。

6 OpenML引擎的功能结构(见图3)

图3 OpenML引擎的功能结构

6.1 资源目录搜索器

负责从开放环境中发现资源及描述信息,载入资源描述管理器。在开放环境中,各个系统可按照资源目录开放描述语言对可供公开使用的资源进行描述,描述文件存放在本地系统公知位置供第三方系统公开搜寻,或者在公共登记系统进行注册以支持开放搜寻。资源目录搜索器可以对这些信息进行自动搜索、转换和载入,同时也支持通过浏览器或通用搜索引擎直接查找有关资源的信息。另外,资源目录搜索器还支持基准资源目录内容的定期链接有效性检验。

6.2 资源描述管理器

负责建立和维护基准资源目录以及虚拟分类资源目录,其主要功能包括:①建立基准元数据模板和基准内容编码体系模板。②对通过资源目录搜索器载入的资源信息进行编辑,利用资源类型、主题类别、时空范围、评鉴权重、授权范围、适用对象等基准内容编码体系分类。③利用一定的过滤标准(如日期、地理范围、提供者范围、资源类型、主题类别等),从基准目录中选择生成基于资源目录开放描述语言的专项资源目录,并将这些目录传送给第三方系统(如系统端OpenML或用户端OpenML)。

6.3 用户管理器

负责定义和管理用户信息和用户偏好信息,其主要功能包括:①建立用户描述模板和用户偏好描述模板。②登记注册用户信息和用户偏好信息。③管理用户注册数据库(user registry),支持对用户使用OpenML引擎情况的跟踪,计算用户使用偏好的变化,修改用户偏好。④支持与第三方用户偏好跟踪分析系统的链接,引入相关信息来修改用户偏好。

6.4 个性化定制管理器

负责定义和管理用户个人资源目录,其主要功能包括:①选择或扩展基准元数据格式,构建个性化元数据格式。②选择默认内容编码体系,或者建立个性化内容编码体系及其与基准编码体系的转换表。③按照用户偏好要求,自动匹配合适的虚拟分类目录或可共享个人目录,形成默认的个人资源目录。④按照用户个性化元数据格式和内容编码体系对资源进行重新描述。⑤选择确定个人资源目录的可共享程度。⑥选择生成基于资源目录开放描述语言的个性化资源目录传送给第三方系统。

6.5 信息结构管理器

负责定义和管理基于开放语言的信息结构描述文件,包括:①定义公共信息结构,设置或修改公共信息结构的有关参数,并利用虚拟分类目录进行显示测试。②与个性化定制管理器结合,浏览选择合适的公共信息结构作为用户默认信息结构,支持用户修改公共信息结构的参数来构建个性化信息结构。

6.6 资源目录管理系统

负责对资源目录数据进行管理,包括基准(和个性化)元数据定义、基准(和个性化)内容编码体系定义、基准资源目录、用户个人资源目录等数据。

标签:;  ;  ;  ;  ;  ;  ;  

开放个性化定制机制:基本概念与逻辑框架_元数据论文
下载Doc文档

猜你喜欢