移动浏览内容服务集成框架研究_元数据论文

面向移动浏览的内容服务集成框架研究,本文主要内容关键词为:框架论文,内容论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

[分类号]C931.6

修回日期:2009-03-30

1 引言

“在移动服务中,移动浏览是最重要的手机应用之一”[1],这种服务是在移动环境下以提供给用户感兴趣的内容并使服务商获取利润为目标,通过用户主动检索或被动接收的方式,接受内容服务商提供的特定应用领域(新闻、天气预报、游戏、商业交易等)的文本、图片、音频、视频等按用户需求聚集的信息。移动浏览作为一种基本的商业应用,可以衍生出更多复杂的服务模式。

从用户体验的角度看,内容服务的质量体现在移动环境下,稳定、高效地为用户提供个性化的内容。从移动的特性出发,改善内容服务质量的研究可以分为两类:①如何利用移动特性提高服务的质量;②如何减弱移动特性对服务质量的消极影响。众多研究都基于这两个视角,如利用移动特有的“场景(Context)”[2]从海量资源中过滤有价值的信息[3-4];针对网络传输和终端存储、计算的局限性,利用语义技术和“场景”提高服务的发现、获取、组合能力[5-6];从内容管理的角度探讨内容资源的采集、描述、组织和应用等操作[7-8],以提供给用户最合适的内容;从网络架构、协同代理机制等系统开发角度探讨如何克服移动环境的“瓶颈”,提高服务的实施效率[9-10]。

总体来看,目前研究相对集中于微观层面,缺乏用系统视角阐述移动商务中内容服务的全过程,特别是资源的聚集和个性化服务间的动态关联以及如何受移动环境的影响、和环境如何互动等问题。因此本文以面向移动浏览的内容服务为切入点,探讨内容服务的全过程,然后提出一个一般性系统集成框架满足这种关联需求,并分析系统的核心实现机制。

2 面向移动浏览的内容服务的生命周期

采用信息资源处理的视角,结合大量实际商业应用,可以将内容服务的过程归纳成AASIpI过程,即内容聚合(Aggregation)、标注(Annotation)、存储(Storage)、个性化整合(Integration & Personalization)、交互(Interaction)5个阶段(见图1)。

图1 面向移动浏览的内容服务的AASIpI过程

2.1 内容聚合

内容聚合是根据服务模式的设定,从多数据源获取多样性的资源,这种资源可以作为“原料”,最终加工为内容“成品”提供给用户。内容“原料”的个体作为一种实体,可称为微内容单元(Micro-Content Asset)——上传到网上并呈现给用户的电子形式的媒体,如文本、图像、声音、视频或任何其他类型的数据。微单元可以集合或分拆成新的微单元,可通过合理的机制查询、发现、获取和复用。微内容的分类取决于不同视角,通过分类可以识别出微内容的特征差异,并提供微内容的“场景”[2]特征获取的途径。收集什么样的资源、从何处收集,如何收集、收集资源的什么特征信息是该阶段要解决的主要问题。

2.2 内容标注

机器要具备更高的信息处理能力和智能服务能力,必须要理解内容的“场景”[2]。场景的描述取决于对内容的类型辨识,一个微内容单元可以理解为同时处于多个分类体系中,是映射到不同体系维度上的多维“场景”特征的集合,这种特征集合需要一种有效的描述机制。元数据(Metadata)是“关于数据的数据”[11],是当前主流的资源描述机制。描述微内容单元的元数据可分为语法元数据和语义元数据两大类。前者描述了微内容非应用领域的关联特征,如语言、长度、日期、比特(bite)率、流量、存储地址等,主要是关于微内容创建、使用过程等的技术范畴的数据以及使用过程中的存取权限、知识产权、保存控制等的数据,以支持微内容的存储、迁移和有效管理[11]。这些元数据一般源自复杂多变的系统环境中,易随环境而变化;后者描述了微内容特定应用领域的特征,如内容来自足球领域,相关元数据项则包含球队、联赛、教练、球员、积分、赛制等。这些元数据一般“固化”在特定微内容单元上,不随环境而变化。元数据是对微内容单元的特征分析后获取的属性集,即微内容的“标注”。通过元数据标注微内容的特征能够“填补语义沟壑”,使计算机能“理解”内容,从而为机器具备更智能的资源处理能力奠定基础,提升资源的利用价值。

元数据对内容的语义标注需要重点关注两个问题:语义标准化和语义关联。前者解决微内容描述中的语义多样性,主要表现在同一类别(比如同一应用领域)的微内容应该具有相同的语义元数据结构而不在乎其语法的异构性,并且元数据项如果存在多个“称谓”,这些“称谓”要统一于一个规范的表述中,这需要实现相对应概念间的映射;后者则是要根据领域类别建立元数据关联,最基本的即层级关系,而复杂关联可借助各种增强的逻辑机制,通过规则或规则的组合来定义。

2.3 内容存储

通过内容标注形成的内容“资产”包含两个部分:微内容的数字载体以及对应的元数据集。数字载体一般分布式地存储在网络中,通过唯一标识符机制标定其逻辑地址,唯一标识符作为微内容的属性标注在相应的微单元元数据中。元数据一般以XML或RDF(Resource Description Framework)的结构表达,存储在文本型或关系型数据库中,形成元数据库(Meta Base)。大量元数据存储在元数据库中,就形成了一种企业“资产”的汇集。

2.4 内容的个性化整合

图2 内容个性化整合流程

内容要实现个性化整合,关键是整合过程中的场景感知(Context-Aware)以及情境推理,整合过程可抽象为基于场景的需求确认、情境模式选择、内容组织模式选择、内容整合任务制定和任务执行五个步骤(如图2所示)。需求源提供的场景信息可分为三种类型:①用户通过手机终端的UI(用户界面)提交的服务请求(实时提交的检索要求、提前定制的服务等);②用户的预置信息(驻留在移动终端操作系统中的个人电子日程表、预先提交给系统的个人注册信息、来自偏好库的用户偏好等);③用户时、空数据(用户所处的位置、接入服务的时间点)。对需求源的信息进行聚合和抽象后,可形成一组机器能理解的结构化用户需求集;然后经由系统的推理机制,决定出系统哪些情境模式(内容服务商预置的典型的个性化需求的抽象描述)以及内容组织模式(内容服务商预置的基本信息处理流程的抽象描述)可以满足或近似满足用户的这种内容需求,以形成个性化的内容整合任务;该任务包含了从内容库中获取相应资源并按整合方案实施的内容组织活动。

2.5 内容交互

个性化整合的内容最终将通过移动终端呈现在用户眼前,移动用户通过一种动态交互的方式体验服务。从内容供应的方式看,可分为“拉(Pull)”式和“推(Push)”式。“拉”式服务强调用户主导何时基于移动情境的内容展示;“推”式服务强调基于情境的特定内容展示必须经由情境的改变来触发[13]。值得注意的是:要在系统能预先根据用户情境的改变触发反应(内容提供)的能力与这种反应对用户的最小干扰能力间取得平衡。也就是说当用户预定了某种旅游内容服务,虽然根据用户当前地点触发了这种服务,系统将旅游信息“推”给移动终端,但要考虑是否要干扰或中止终端用户正在进行的内容浏览行为,展示该旅游信息;还是将该信息暂存,以让用户自己决定何时“拉”出该信息,但用户的移动可能导致暂存的该地点附近的旅游景点信息已失去其推荐效用了。对用户习惯、要求和服务特征进行调查、评估,是建立合适的平衡机制的关键[13]。

3 移动内容服务的集成框架

图3 面向移动浏览的内容服务平台的体系架构

通过内容服务全过程分析,以支持语义推理,实现资源整合和个性化服务的统一为目标,可以设计出内容服务的一般性系统框架(见图3)。该框架处于一个开放的、多角色参与、互操作的异构环境中。从纵向看,分别向移动手持终端的用户群、内容服务商以及领域专家提供用户接口,权责不同的用户通过普适网络(Ubiquitous Network)的分布式终端参与操作。从横向看,是一个5层的架构:需求层、服务层、推理层、知识层以及资产层。可划分为内容服务中心、用户偏好注册中心、内容资产注册中心、服务注册中心、知识注册中心5个系统。

3.1 内容资产注册中心

内容资产注册中心主要负责微内容的聚合、标注和相关维护。元数据推理引擎支持微内容单元的领域类别与知识库中的领域本体进行匹配,以确定微内容单元的属性集,通过数据挖掘实现这些属性概念的实例化,并以概念化的规范描述,形成微单元元数据集,经过映射,存储到元数据库中。

其中,元数据推理引擎实现对微内容的语法、语义元数据的抽取。抽取通过两种途径实现:一种是元数据结构根据领域本体直接获取。整个元数据抽取流程可以描述为:当系统根据预先配置,明确了待标注的微内容单元的领域类别和对应的数据源后,激活元数据抽取引擎,依据本体库中匹配出的领域本体,形成相应的元数据结构,结构中的每个元数据项实质都是概念化的内容特征属性,而元数据项的值或范围可以由推理引擎对微内容单元的语义和语法的挖掘得到。

另一种是元数据并不能直接从知识库的领域本体中获取。推理引擎要基于一些增强的推理规则和算法,挖掘出一些新的属性,创建新的元数据。比如在一篇关于球队“曼联”的新闻报道中,推理引擎根据对应的领域本体—“球队”,知道该微内容对应的元数据项包括:“球队”、“球员”、“教练”、“目前积分”、“排名”、“联赛”、“所属城市”等;推理引擎还通过文本挖掘算法和已有知识知道“所属城市”是“曼彻斯特城”,同城还有一支球队—“曼城”;而根据规则“当两队位于同一城市或邻近地区,则互称为德比对手”,因此可创建出该微内容的新的元数据项:“德比对手”。这种额外增加的元数据能进一步提高系统的推理能力。

3.2 用户偏好注册中心

用户在内容服务商的服务器驻留的客户信息、预定某些服务时的注册信息、用户的历史行为痕迹(如访问的站点、链接、Web日志等)都可以被该中心采集、过滤、更新,并借助推理引擎和知识库中的知识对采集的结果进行分、聚类和规范描述,形成特定用户(用户群)的偏好集合。这些信息反映用户个性、喜好,具有相对稳定性,因此可将其存储在用户偏好库中,便于企业级的信息共享。用户偏好注册中心的工作一般经过配置后由系统自动执行。

3.3 知识注册中心

知识注册中心是一个知识管理系统,核心工作是内容服务领域中相关知识(用户偏好、资源特征、资源组织方式、用户需求等中的各种抽象概念和概念间关系)的构建、更新、发布、共享、存储等。可以利用本体描述语言描述,完成知识构建。领域专家通过UI编辑、修改、删除各种本体,也可以从外部导入第三方的本体进行扩展。

3.4 服务注册中心

从信息系统的角度理解,营销策略体现在内容服务商根据潜在市场和用户群的细分,结合自身的服务能力抽象描述的不同粒度、不同级别的服务模式,可以被机器识别和使用。移动浏览的内容服务模式可理解为两部分:情境模式和内容组织模式。操作者(一般是营销、服务领域专家和企业高层人员)在UI上将企业提出的营销策略进行抽象定制和编码形成服务模式,如果是基于本体技术构建,则主要形成情境本体和内容组织本体,本体的创建方式可以是自行创建也可以是基于外部或顶层本体的扩展。这种内容服务模式可以在特定应用场景下结合知识库中的规则、公理等被内容服务子系统的推理引擎读取,以驱动内容的整合活动。服务注册中心负责定义、修改、存储、维护、发布这些服务模式。通过这种方式,营销策略可以灵活地描述、改进,也可以被广泛地识别、复用和快速部署,以促进商业模式的快速实施。从知识管理的角度讲,服务注册中心实现了对企业特定的服务模式关联知识的管理。

3.5 内容服务中心

内容服务中心的工作涵盖了内容的个性化整合和内容交互两阶段。服务中心对用户请求进行实时监听,一旦触发服务,则实施用户实时需求的抽象描述和编码;需求与服务模式的匹配推理,形成特定内容组织方案;并驱动和监控方案的执行,将最终的个性化内容以人机交互方式提供给用户终端。其中,核心是服务推理引擎的工组机制。

推理引擎可以利用本体依赖的逻辑推理能力——框架逻辑(FL,Frame Logic)、描述逻辑(DL,Description Logic),也可以将基于本体的逻辑系统转换为常用的逻辑系统,使用更成熟的推理技术如Horn Logic进行推理,以加强推理能力。推理引擎包括两个推理步骤:情境模式匹配、内容组织模式匹配。

情境模式匹配的输入包含三个部分:①由检索引擎提供的对应特定场景的用户情境需求;②一般性的领域知识如匹配算子和规则;③由情境模式库提供的情境模式集。用户的抽象需求通过匹配算子和规则与情境模式集进行匹配,选定适合当前情境的情境模式并进行实例化,用户也许位于这些情境之中或者对处于某些情境中感兴趣。

内容组织模式匹配是将上阶段的输出和内容组织模式库中的组织模式集进行语义匹配。匹配的思路类似上一步骤,输入包括上一步骤选定的情境模式实例,内容组织本体、匹配算子、规则、组织模式集以及必要的一些用户信息,经过推理匹配,选定出适合的内容组织模式的实例集。如针对“就近用餐”、“工作”以及“就近观光”三种情境模式,匹配出的内容组织模式包括信息聚合(聚合比赛信息、记者招待会、登记处、餐饮信息、艺术展信息、公交路线等);分类(按工作、餐饮、休闲分类);排序(餐饮地点、艺术展厅地点按乘车距离排序等)。

4 结论

本文探讨了面向移动浏览的内容服务的全过程,明确了服务过程中资源整合和个性化服务间的内在关联,提出了一个满足这种关联需求的一般性系统集成框架,为资源整合和个性化服务的移动服务平台开发提供了思路。未来将围绕移动股票内容服务这一具体领域展开研究,分析其移动场景关联的资源融合和个性化问题,并依据此集成架构建立一个实际系统以评估架构的实用性,对开发过程中的具体问题进一步深入研究。

标签:;  ;  ;  ;  ;  ;  

移动浏览内容服务集成框架研究_元数据论文
下载Doc文档

猜你喜欢