关联媒体研究及应用进展,本文主要内容关键词为:进展论文,媒体论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
0 引言 2007年W3C启动了关联开放数据(LOD)项目[1],其主要目标是使用语义网技术,如资源描述框架(RDF)、SPARQL查询语言等,来发布结构化数据集,从而推动语义网的发展。截至2014年9月,LOD云已包含2909个链接集(linksets)所连接的570个关联数据集[2]。尽管开放数据集的出版一直在快速地增长,但是关联数据集大多处理的是文本资源[3]。数量众多的多媒体资源与LOD云的整合却处于起步阶段,原因是缺乏一种用于描述网络多媒体资源的综合方法。“互联网之父”Tim Berners-Lee认为:“文本信息已不再是下一代网络的主要内容,未来的网络是一个充斥着复杂语义的多媒体环境。”[4]因此,如何将多媒体资源及其元数据发布为关联数据逐渐引起了人们的研究兴趣。2008年,Burger T等提出了“互联多媒体”(Interlinking Multimedia)的概念,在其文章中阐述了互联多媒体的准则与要求;2012年,Nixon L J B在Burger T研究的基础上提出了“关联媒体”(Linked Media)的概念[5]。按照Lyndon的定义,关联媒体是指一个结构化、互联的媒体标注网络规模层,媒体资源对象根据它们之间的语义关系而互相连接在一起。 关联媒体受关联数据运动的启发,目的是为媒体资源提供结构化、互联的描述。它可以将媒体资源片段及其元数据出版为关联数据,从而建立起媒体资源片段之间、媒体资源片段与其元数据之间以及媒体资源片段与其他关联数据之间的语义关系。关联媒体可最大限度地满足用户分享、重用媒体资源的需求,发布的媒体资源元数据可以被用户重复使用,从而提高媒体资源元数据标注的效率。另外,用户可以根据媒体资源的内容发现与资源内容相关的人物、地点、机构等信息,或者根据人物、地点等信息查找与此相关的媒体资源,从而为用户提供更多丰富的信息资源。 本文将从关联媒体的规则与要求、关联媒体的互联方法、关联媒体的检索以及关联媒体的应用几个方面论述关联媒体研究与应用的最新进展,以期为关联媒体的研究提供策略参考。 1 关联媒体发布的规则与要求 关联数据将互联网上任一信息资源看成是一个可采用标准方法进行规范描述的知识对象,借助语义网技术实现对不同知识对象以及知识对象之间关系的规范化描述,从而实现对不同来源的知识对象的关联发现。与关联数据一样,关联媒体的发布同样需要遵循一定的规则与要求。与关联数据只发布元数据不同,关联媒体除了要发布媒体资源的元数据之外,还需将媒体资源本身发布为关联数据。因此,为了将媒体资源内容与其元数据发布为关联数据就需要满足以下几个规则与要求[6]: (1)关联媒体首先必须符合关联数据的4个规则; (2)若要符合关联数据四规则并实现媒体片段之间的语义互联,就必须有一种能够标识媒体片段的机制; (3)为了能够参引并整合所描述的媒体资源片段,描述媒体资源内容的元数据之间必须是可交互的。 1.1 媒体片段标识 媒体片段标识是实现媒体资源片段之间的语义互联与发布的基础,可以提高对媒体资源片段的处理与检索,促进当前以及未来网络基础设施中对这些媒体片段的再利用。一个完整的媒体资源可以使用传统的URI来表示,但是如何使用URI来标识媒体片段则关系到媒体资源能否发布为关联数据。2012年9月W3C媒体工作组发布了Media Fragments URI 1.0(basic)[7],它提供了一种基于URI来处理媒体资源片段的机制[8]。媒体片段是指根据不同维度,如:时间、空间以及轨道等,而把媒体资源划分为不同的片段。 时间维度(Temporal axis):指源媒体的一个特定的时间范围,如“从10秒开始,至20秒结束”。时间片段由标识符“t”表示,它有一个开始时间与一个结束时间。如:http://example.com/video.mp4#t=20,90,表示20秒至90秒的视频片段。 空间维度(Spatial axis):表示源媒体资源中一个特殊的空间矩形,该矩形可被指定为像素坐标或者百分比。使用标识符xywh来表示,其值用逗号隔开的整数表示。(x,y)表示矩形左上角的一个坐标点,而w,h分别表示矩形的宽度与高度。如:http://example.com/video.mp4#xywh=pixel:160,120,320,240(像素)。 轨道维度(Track dimension):表示媒体容器所支持的不同轨道对象(如:音频、视频以及字幕等),使用标识符track表示,其值为字符串(string)类型。如:http://example.com/video.mp4#track=subtitles。 命名维度(Named dimension):指源媒体已命名的章节,如某部电视剧的“第一集”。实际上它是上述3个维度的语义替代。使用标识符id来表示,其值为字符串类型。如:http://example.com/video.mp4#id=chapter-1。 组合维度(Combined dimensions):时间、空间以及轨道维度逻辑上是独立的,但是也可以把这些维度组合起来标识,如: http://example.com/video.mp4#t=10,20&track=vid&xywh=pixel:0,0,320,240. 在实现对媒体片段的标识后,就需要探讨如何将关联数据规则应用于媒体片段。 1.2 关联数据规则 为了能够在网络上分享并连接结构化数据,Tim Berners-Lee于2006年提出了关于资源对象描述的关联数据规则[9]: (1)使用URIs来标识事物; (2)使用HTTP URIs使人们可以访问到这些标识; (3)当有人访问这些标识时,可以使用一些标准(如RDF、SPARQL等)来提供有效的信息; (4)与其他URIs链接,以便可以发现更多的信息。 前两条规则主要用于建立规范化命名机制和获取资源对象的机制,根据上文所述媒体片段标识符的语法,可以很容易满足这两条规则,如:http://example.com/video.mp4#t=20,90是一个有效的HTTP URI。当用户请求该URI时,根据内容协商机制[10],智能用户代理引擎在对该URI处理后,会向服务器端发送GET请求: GET http://example.com/video.mp4 Accept:application/mp4 Range:seconds =20-90 服务器端在接收到请求后会根据请求的内容返回相对应的视频片段。 第三条规则要求用结构化、规范化的方式来描述资源对象,也就是获取媒体片段的语义描述。使用以下GET请求可以获取到关于视频片段http://example.com/video.mp4#t=20,90的RDF语义描述: GET http://example.com/video.mp4 Accept:application/rdf+xml Range:seconds=20-90 服务器端根据GET请求返回该视频片段的RDF文件,“HTTP Link:header”使用rdfs:seeAlso属性建立起mp4文件与其RDF文件之间的关系。如下所示: HTTP/1.1 200 OK Accept-Ranges:bytes,seconds Content-Length:1088 Content-Location:http://example.com/video.rdf Content-Type:application/rdf+xml Link:〈http://example.com/video.mp4〉; rel="http://www.w3.org/2000/01/rdf-schema#seeAlso"; Vary:accept 第四条规则要求建立资源对象与其他资源对象的关联,从而可以从某个资源对象出发检索到与之关联的资源对象。有许多(半)自动与人工的方法可以建立媒体资源的RDF文件与其他数据集之间的关系,本文将在第2节详细论述媒体资源的关联方法。 内容协商机制可以很好地处理文本数据,但是对于媒体资源而言这种处理机制还存在一些问题。首先,描述媒体资源的RDF文件并不等同于媒体资源内容本身,只有当描述媒体资源的RDF文件与媒体资源本身传达的信息完全相同时,内容协商机制才能发挥出最好的效果。另外,当解析某个URI如:http://www.example.org/myPodcast.mp3#t=15,45时,用户期望同时获取音频信息以及对该音频信息的语义描述,而不是其中的某一个。还有一个问题是,通常来讲RDF文件描述的是整个媒体资源,但是当用户请求某个媒体资源片段时,系统是返回整个媒体资源的RDF文件还是对应媒体片段的RDF文件?当前还不能有效地将整个媒体资源的RDF文件分割为描述各个媒体片段的RDF文件片段,如果想获取媒体片段的RDF描述文件,只有重新构建一个新的RDF描述文件。以上这些问题将会是未来关联媒体的重点研究内容。 1.3 媒体资源本体 在使用RDF描述媒体资源时,就必须选择一种用于描述媒体资源的元数据。由于多媒体所涉及的领域特别广泛,用于描述媒体资源的元数据标准层出不穷,如EXIF、XMP以及Dublin Core等,在搜索与标注相关媒体资源时出现了不同元数据格式之间的交互性问题。因此,为了能够引用并整合所描述的媒体资源片段,就需要一种可以对多媒体内容的语法以及语义特征进行描述与表示的通用框架。基于此,W3C媒体标注工作组(Media Annotation Working Group)在2012年2月开发完成了“媒体资源本体1.0”(Ontology for Media Resources 1.0)[11]。媒体资源本体定义了一组用于描述多媒体内容的最小标注属性集以及一组这些属性与当前主要元数据格式之间的映射集。如:某个应用程序只支持MPEG-7元数据标准,此时没有必要重写此元数据格式,只需要使用媒体资源本体将其映射为MPEG-7元数据即可[12]。 在关联媒体的应用中,不但可以使用媒体资源本体来描述不同元数据类型的媒体资源,也可以用它来连接媒体资源与媒体片段[13]。利用媒体资源本体,结合媒体片段URI,可以完成媒体资源片段之间以及与其他网络资源之间的语义互联,如图1所表示。 图中实现了视频资源http://site1.org/frag1.ogg与其视频片段http://site1.org/frag1.ogg#t=80,90之间的互相连接,以及与其他视频片段(http://site2.org/frag2.mp4#t=20,500)的关联;同时又把视频片段与网络文本内容关联(http:www.v3.org/Designlssues/LinkedData.html)到了一起。 2 关联媒体的互联方法 关联数据的第四条规则要求建立资源对象与其他资源对象的关联,以便可以发现更多的信息。媒体资源之间的关联方法决定着资源之间能否建立有效的连接。当前媒体资源互联方法主要有人工方法、协作互联、半自动方法与自动方法[15]。联合媒体的研究与应用进展_元数据论文
联合媒体的研究与应用进展_元数据论文
下载Doc文档