O/O模型:多媒体数据库建模的最佳方法_数据建模论文

O/O模型:多媒体数据库建模的最佳方法_数据建模论文

O-O模型:多媒体数据库建模的最佳途径,本文主要内容关键词为:建模论文,模型论文,途径论文,多媒体论文,数据库论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

多媒体对数据库技术影响十分巨大[1]:数据量大且媒体间差异大,这就需要改变传统 数据库的组织和存储方法,媒体种类的增多也增加了数据处理的困难等,这涉及数据库的用 户接口、数据模型、体系结构等许多方面。

多媒体系统,尤其是多媒体数据库系统,对文本、数据、图像、音频、视频等进行综合处 理,其成熟的标志就是多媒体处理的集成性、交互性。欲使之达到成熟,有许多问题需要研 究。目前,多媒体数据库研究的主要问题有[2]:开发复杂数据模型,它必须有丰富的语 义 表现能力,以表示复杂多媒体对象和表达同步需求;设计强有力的多媒体查询语言;设计强 有力的多媒体数据索引和组织技术;开发管理实时多媒体数据的高效存储布局模型,等等。 在这些问题中最关键的就是建立理想的多媒体数据模型。因为要从根本上实现一个成熟的数 据库系统,必须从数据模型出发,进行数据库系统的设计。所谓数据模型[3],就是数据 库系统中用于提供信息表示和操作手段的形式构架,是数据库系统的核心和基础。下文将对 多媒体数据建模的需求进行考察,然后比较、分析现有的层次、网状、关系、O-O等数据模 型技术,得出哪一种最适合于多媒体数据库数据建模。

1多媒体数据建模的需求

传统的数据库处理的是字符、数值等,它们是结构化的数据,使用关系数据模型技术就很 容易对之进行建模,支持关系数据模型的理论已十分完善,该类数据库管理系统在产品开发 上也已达到十分成熟的程度,现在市面上流行的商用数据库管理系统如Orade、Sybase、Fox Pro等都是支持关系数据模型的。但多媒体数据不仅仅是结构化数据,而且还有非结构化数 据如视频、音频、图像等。这些不同种类的媒体数据又具有千差万别的时间、空间以及媒体 间时空关系组织安排的属性等等。这样,多媒体数据建模按要求就可分为两大部分[4]: 一是数据(包括结构化数据和非结构化数据)的表示及其属性特征的描述;二是多媒体数据的 表现(Presentation)建模。如此复杂的建模要求远非关系数据模型可胜任。

多媒体数据表示(representation)建模需求特点具体说来就是:(1)数据信息量大,尤其是 视频等媒体类型。例如[8],一幅具有中等分辨率的彩色图像,它的数据量约为7.37Mb/帧 ,若要达到每秒25帧的全动态显示要求,仅每秒所需的数据量为184Mb,若要存储1.5小时的 影像视频,其数据量之大是惊人的。(2)媒体类型繁多,差异极大。从种类上讲,有图像、 音频、文本、图形、视频等,而且随技术的进步,种类仍将不断增加;从差别上讲,每类媒 体存储数量、格式、内容等差异极大。(3)版本控制。这是软件工程应用中常遇到的一个问 题,它有两层含义:一是历史性版本,如一份CAD设计的不同版本,要随时间变化而变化; 二是可选择性版本,如某软件的中文版、英文版等;这就产生了版本控制问题。(4)声音、 视频等连续媒体具有时间敏感性等特点。(5)多种媒体类型因需要进行集成性处理而又引出 的一系列问题等等。这是对多媒体数据进行内容或结构建模部分,也即语义建模部分。

多媒体数据除对内容建模外,还有一个重要组成部分即是对表现建模。所谓表现[1],就 是活动,以时间为线索来安排多种媒体的合成表现。这是由多种媒体所具有的时间、空间属 性以及它们的交互而产生的时空安排而决定的。它涉及多媒体同步、多媒体合成、多媒体时 态 合成、活动及它们间的关系等问题。

2现有的数据模型技术

数据模型技术是按计算机系统的观点对数据建模的技术。数据模型按组织数据的方式大致 可分为以下几种:层次模型、网状模型、关系模型、O-O模型(Object-Oriented Model,面 向对象模型)。前三种模型统称为传统数据模型。

2.1 传统数据模型[3]:

(1)层次模型:它按照层次结构的形式来组织数据。层次模型组织数据的特征是:根结点有 且仅有一个结点无双亲;其他结点有且仅有一个双亲。

(2)网状模型:它是除树结构外任意一个连通的基本层次联系的集合。它组织数据的特征是 :有一个以上的结点没有双亲;结点可以有多于一个的双亲。

(3)关系模型:它以关系数据理论为严格的数学基础,数据以关系的形式组织,在用户观点 下的逻辑结构是一张二维表。它的基本概念包括关系、元组、属性、主码、域等。其具有概 念简单、清晰、用户易懂易用等特点,是目前发展最为成熟的数据模型技术。

2.2 面向对象数据模型(O-O模型,Object-Oriented Model)

面向对象[5]是一种认知方法,它既提供了从一般到特殊的演绎手段(如继承等),又提供 了从特殊到一般的归纳形式(如类等)。它基于信息隐蔽和抽象数据类型概念,把系统中所有 资源,如数据、模块以及系统都看成“对象”,每个对象封装数据和方法,而方法实施对数 据的处理。它的概念最初源于程序设计语言,后来作为一种思维方式逐渐推广应用到计算机 科学的各个领域。用O-O方法进行数据建模,形成全新的O-O数据模型技术。

2.3 传统数据模型与O-O数据模型的比较

(1)数据抽象能力

传统数据模型缺乏对数据进行抽象的机制;而O-O模型恰恰拥有一套完整的数据抽象机制, 把一组数据对象及作用其上的操作组成一个程序实体,使得外部只知道它做什么,而不知它 如何做,也不知道其数据对象如何表示。例如对字符、图形、声音等媒体进行建模时,传统 数据模型必须对它们进行专有媒体的分别建模,而O-O模型可定义“媒体”类对象,而“文 字”、“图形”、“声音”等媒体类型作为“媒体”类的子类,继承它的属性,使对象在系 统中是独立的,具有良好的封闭性,封闭了各媒体间的巨大差异,易于处理。

(2)语义表达能力

传统数据模型是面向计算机系统的,而不是面向用户的模型,所以语义表达能力差;O-O模 型是面向用户的,它可不受具体的实现结构限制,通过聚类关联、概括关联、相互作用关联 、示例关联等来表示数据及数据间的关系。这样O-O模型就具备处理复杂对象(数据)的能力 ,通过对象、消息、类、实例、方法等对多媒体数据的内容、结构及表现建模,而传统数据 模型只能处理大量简单的数据,即对结构化数据建模,根本难以对表现建模。

以上只是两个最基本的建模能力方面的差异。这些差异是传统数据模型的先天不足造成的 ,而O-O模型自身特点弥补了这些不足。

3.O-O模型:多媒体数据库建模的最佳途径

多媒体数据库研究主要有两条途径[6][7]:一是对现有数据库管理系统进行扩充;二 是从数据库系统的根本——数据模型出发,建立理想的全新的多媒体数据模型。

(1)对现有数据库系统的扩充

①对关系数据库的扩充:NF2数据模型。传统数据库中发展最为成熟的类型就是关系型数 据库,其他两种类型数据库产品在70年代随关系型数据库的流行而遭淘汰,人们曾利用网状 数据模型的特点开发多媒体数据库也以失败告终。由于关系型数据库产品在市场上占据了绝 对 优势,所以对关系数据库进行改造以适应多媒体信息处理的需求就成了最方便的事情。于是 NF2(Non First Normal Form,非第一范式)数据模型应运而生,它通过扩展来提高关系数 据库处理多媒体数据的能力。文献[9]所设计的系统即以NF2数据模型为基础的。在新的 多媒体数据库产品出现以前,其存在是有其合理性的,但其存在很大局限性:[1][8]建 模能力不强、无法实现多媒体信息的高级查询方式等。

对传统数据库建模方法扩充的局限在国外一系列实验系统Dramond、MINOS、CCWS、ORION等 [9]项目中越来越明显地暴露出来。很明显,这条途径不是长久之计,只是一种过渡形式 。

②现有面向对象数据库的扩充。首先需要说明的是,面向对象数据库与多媒体数据库不是 一个概念。人们在80年代研究面向对象数据库时,对多媒体信息处理的需求并不像今天这样 迫切,因此就没有把多媒体的因素考虑进去,单独开发的面向对象数据库如GEMSTONE、ONTO S、Objectstore、VERSANT等[7],它们只能处理单一媒体,且本身就存在许多缺陷。专家 预计成熟的O-O数据库管理系统出现尚需10年时间[7],所以在它上面扩充有一些困难。

(2)从底层出发建立全新的O-O多媒体数据模型

O-O模型拥有抽象、封装、继承、相关、消息通信等功能,适合内容和结构的多媒体表示建 模 及通过定义在类对象上的操作进行表现建模,由于面向对象方法本身具有持续性,多媒体数 据的版本控制问题也得以解决。从底层出发,把媒体对象作为元类从元级进行定义,元类是 表示数据模型概念的对象,它们可象对象和类一样被定义和利用,能用来作添加到一个内 核数据模型的新建模原语。元类作为对象不仅仅表示多媒体对象的内容和结构,而且包括对 对象的操作。所以,从底层出发建立全新的面向对象多媒体数据模型是多媒体数据库建模的 最佳途径。我们的工作正是以此为出发点。

标签:;  ;  ;  ;  ;  

O/O模型:多媒体数据库建模的最佳方法_数据建模论文
下载Doc文档

猜你喜欢