基于语义的数据格式转换

基于语义的数据格式转换

陶媛[1]2016年在《基于FME与ArcEngine的城市规划成果数据互操作及其应用研究》文中研究指明随着智慧城市和数字城市概念的提出以及我国城市规划信息化水平的不断提高,规划管理工作中产生的数据量快速膨胀。由于城市规划数据通常以AutoCAD格式为主,而基于这种格式的数据具有不宜查询、更新难、信息无法共享等缺点,使城市规划工作效率大大降低。利用ArcGIS中的Geodatabase数据模型,可为海量空间数据存储和管理提供优良的技术支撑,从而有效的弥补这些缺点,因此产生了大量城市规划成果数据从AutoCAD到Geodatabase格式转换的需求。为此,本文在保证数据质量的前提下,通过对比分析异构城市规划成果数据在AutoCAD与Geodatabase数据模型的映射关系,基于FME数据转换平台,结合ArcEngine二次开发技术,构建城市规划成果空间数据AutoCAD与Geodatabase两种格式的互操作平台,实现两平台数据格式之间基于语义的互操作。本文主要工作与成果如下:(1)分析了目前异构空间数据互操作的主要互操作模式特征及其优缺点,探讨本文中基于语义信息的空间数据互操作模式以及相关实现技术。(2)从关系、尺度、几何、属性等角度,对城市规划成果数据进行特征分析,为AutoCAD与GIS平台下的规划成果数据互操作研究奠定了基础。阐述目前城市规划成果数据中基于AutoCAD和Geodatabase两个管理模式的原理及其优劣性,确保转换模型中语义映射文件制定的科学合理性。(3)在进行CAD与GIS数据的差异性分析的基础上,搭建基于FME平台的规划成果数据AutoCAD与Geodatabase间的语义转换模型;采用符号与要素分离处理的方式,利用ArcEngine组件技术实现两数据平台下的符号共享;基于此,构建规划成果数据AutoCAD与Geodatabase的双向无损互操作方法。(4)基于FME与ArcEngine二次开发技术,以重庆市为例,在VS2012.NET平台下,实现城市规划成果AutoCAD与Geodatabase数据间的双向无损转换。针对不同的几何要素类型(点、线、面)分别采用不同的符号映射方案,达到图形表达一致性效果。从而实现CAD与GIS平台下的图形、属性、符号共享,构建了城市规划成果数据互操作平台。基于本文提出的基于FME和ArcEngine的城市规划成果数据语义互操作方法,与目前运用较为广泛的两种转换方法:FME Quick Translator平台和ArcToolbox工具,进行对比分析,验证了本文基于FME与ArcEngine互操作方法的可行性、正确性及高效性。本文所建立的互操作方法能够有效的解决AutoCAD与Geodatabase数据转换前后的图层结构不一致、几何要素丢失,属性信息不完整以及符号共享中存在的问题,实现了AutoCAD与Geodatabase格式数据中的几何对象、属性、符号统一表达,消除了城市成果数据不同平台间的数据互操作障碍,促进了AutoCAD数据与Geodatabase数据之间的集成和共享,提高了城市规划空间成果数据的可用性和复用性,为地理信息共享提供了新的研究方法与手段,对提升地理信息共享标准化具有重要意义。

陈年松[2]2008年在《基于FME的CAD与GIS数据共享研究》文中提出CAD格式数据和GIS格式数据共享的问题,一直是GIS技术发展中核心的问题之一。CAD软件和GIS软件的数据模型之间存在极大的差异,导致了它们对同一地理实体的描述方式不一致,这是两种格式数据难以共享的主要原因。在我国,各行业各部门的专业需求不同,制定的数据共享标准不同,这在客观上增加了数据共享的难度。此外,传统的数据共享实现技术,没有考虑对语义的处理,或者不能保证在转换过程中所有信息的正确性,也成为CAD与GIS数据共享中存在的问题。综上所述,这些原因造成了相关行业部门中CAD数据和GIS数据不能共享,或者说不能及时共享,使行业之间,甚至在行业内部形成信息孤岛,极大的浪费了宝贵的数据资源。本文从典型的CAD软件AutoCAD和GIS软件ArcGIS的研究入手,从数据结构、数据组织、拓扑关系存储、地图符号表达以及坐标系统五个角度去分析数据模型的特征,剖析了实现CAD与GIS数据共享的几种传统技术方法上的问题,提出了利用FME的语义转换技术解决共享问题的思路。本文以基础地理信息数据为例,在CAD格式数据与GIS格式数据之间构建映射关系表,并基于这个关系表在FME Suite的平台上实现了CAD与GIS的基础数据的共享。通过以上理论研究和实例验证,本文得出以下结论:数据模型的差异,是CAD和GIS的数据共享在技术上存在的主要障碍,因此首先要充分了解两种软件的数据模型,进而建立模型间的映射关系;数据组织、标准的混乱,是在应用中产生的问题,需要各部门间建立统一的数据标准,并通过质量检查控制的手段,保证标准的执行;基于FME平台实现GIS和CAD的数据转换,是解决CAD和GIS数据共享课题的行之有效的方法之一。本文所做的研究,有助于多年积累下来的数据资源的充分利用,有助于数据的及时更新,有助于促进CAD与GIS共享技术的发展。最后,本文对今后的研究提出了展望。

李晓琳[3]2008年在《基于语义的网格工作流智能复用》文中进行了进一步梳理网格工作流将工作流管理和网格技术两个领域结合在一起,提供了一种很有前景的分布式协同系统的实现方案。作为网格环境的一项基础设施,网格工作流不仅是工具和解决问题的手段,更是一种特殊类型的可重用的知识。因此,要使网格最终成为问题求解的智能化集成环境,网格工作流的大规模共享和智能复用是一项亟待解决的核心技术。借助语义技术更着重从意义和联系来描述模型,以及属于人工智能范畴的规划理论所研究的问题与工作流的相似性,本文以规划理论为基础,提出并实现了基于语义的网格工作流智能复用架构。基于这一架构的工作流共享和复用过程,是指对目前分散、异构存在的大量模型进行统一表达、集中存储以作为先验知识,进而在遇到新问题时通过对已有解决方案的复用来智能化生成或帮助生成新解决方案的过程。将工作流复用分为两种,一是通过模型搜索和匹配复用单个模型以解决相似案例,二是通过规划方法组合复用多个模型以解决新的复杂问题。其目的在于简化复杂网格应用问题的开发,节省对问题重复建模造成的浪费,为充分发挥网格环境大规模智能协同的潜力创造条件。这一体系结构包括两种信息描述格局――工作流语义描述和基于ECA规则的逻辑描述,以及实现模型复用的四个核心模块,包括由语义检索和规划组成的复用模块、语义配置、工作流切片和模型适配器,支持完整的工作流建模和复用周期。语义描述框架具备面向对象的继承思想和可扩充可配置特性,支持层次化的工作流查询,以实现第一种复用机制。基于ECA规则的工作流统一表达方式和模型“双向适配器”,支持不同格式模型的相互转换以充分利用目前大量存的工作流模型。将规划理论应用到工作流的复合过程中,以实现第二种复用机制。最后,本文提出了工作流切片技术,进行工作流模型中具有强内聚性、高复用价值片断的识别和分离,从而使可重用的模型资源迅速扩充。

王桥[4]2007年在《基于语义的集成研究及配套工具的开发》文中研究表明如今越来越多的应用集成需要从分散在不同地理位置的、具有各种自治语言并处于不同工作环境下的数据对象中实现信息的实时交换以完成集成。这就需要有一个可以排除支撑平台、语言分歧的在线集成环境。在这种背景下基于语义的集成应运而生,在一个统一的信息交换模式下,以语义数据数据对象来联系横贯整个企业的应用系统、数据源,而集成设计人员只需在语义传输的层面上开发出面向业务的集成应用组件。此外,人与机器间也可以在某种定义语义环境下通过语义规则进行交流,实现操作层面的广义集成。本文对基于语义的集成技术进行了相关研究,设计了基于语义数据对象的多层次集成模式及整体架构体系,实现了信息交换、语义转换和动态可裁剪的集成模式的信息系统集成软件框架。设计集成框架以创建一个平等、开放的集成环境,以能够降低应用系统间集成的难度,减少集成风险,缩短集成时间,提高集成广度和深度,提高企业运行效率为设计目的。另外还给出了基于语义解析动态获取数据源处理规则以实现灵活多变的数据源处理规则的集成方式。在研究过程中,针对语义对象的转换、通信功能的实现、不同集成策略的实现、配套工具的设计等集成中的技术难点,提出了对应的解决方案,并应用在集成框架中。为了缩短集成时间,提高集成效率,为应用系统制定了详细语义描述的规范,集成框架配套了语义转换工具实现面向对象的语义转换,保证了语义非二义性。同时也使得集成框架能以松耦合的方式和应用系统连接,便于扩展集成配套工具。根据基于语义解析动态获取数据源处理规则的集成方式,规划了基于语义解析动态获取规则的树控件。最后通过开目CAPP与办公软件的文件格式集成和PDM即时提示系统的设计两个应用实例介绍了集成框架的应用,验证了集成框架的可行性和可用性。

刘雪凯[5]2005年在《基于语义国土资源异构空间数据转换模型研究与实践》文中指出本文首先从异构空间数据共享相关理论研究着手,在对国内、国外关于异构空间数据共享理论、技术、方法研究的基础上,对GIS数据语义共享进行了详细地介绍。认为只有基于语义层次的异构空间数据共享才能使真正意义的空间信息共享得以实现。进而对基于语义异构空间数据转换模型进行了深入地研究,从模型的定义、原理、组织构成进行了详细地阐述。为了使模型研究满足于实际应用的需要,对模型物理实现的技术路线做了进一步的探讨。最后通过江苏省国土资源信息化示范项目——《国土资源空间/非空间数据一体化管理技术及信息化管理》的研究课题——江苏省国土资源异构空间数据模型研究及空间数据转换平台软件开发项目为例,对模型进一步的实际应用进行了实践。本论文研究的主要内容有: 1、对空间信息共享的几种方式进行比较,认为基于语义的空间数据共享是当前空间信息共享的主流方式。 2、GIS数据语义进行研究。明确地理信息共享得以实现的层次机构。 3、多源空间数据的研究。对当前主流GIS平台、辅助制图平台以及数据库管理信息系统的数据格式、逻辑组织方式进行了研究。 4、对基于语义异构空间数据转换模型进行研究,提出在空间数据转换时,各种空间数据模型之间的冲突可以通过语义信息的继承和扩展来解决和代替。 5、对模型实现的技术路线进行进一步的探讨。针对以模型为依托的空间数据转换引擎的结构进行设计以及应用设计。 6、江苏省国土资源异构空间数据转换平台的构建。在对江苏省国土部门的国土空间数据现有情况进行综合分析的基础上。采用加拿大Safe Software公司的FME提供的COM组件接口(FME objects)进行构件式开发,从而构建针对江苏省国土部门量体裁衣的新一代空间数据转换共享平台软件。 7、研究在平台建设过程中必然处理的诸如:数据逻辑模型映射、模型控制转换、语义控制转换(语义定制、数据风格处理)等

郝亚南[6]2003年在《基于语义的数据格式转换》文中指出随着Internet的迅猛发展,各种基于Web的应用系统不断涌现,同时,对信息资源的共享与交换要求也越来越高。在现有的各种基于Web的应用系统中存在大量的,复杂的不同格式的数据。如何进行Web上各系统之间的数据交换成为一个十分重要的问题。其中的核心是Web上的各种数据格式之间的相互转换,其中一些转换涉及到语义的问题。但是,现有的格式转换技术一般仅能完成语法的转换,没能很好的解决语义转换的问题。 本文在分析现有的各种数据格式转换技术的基础上,提出了基于语义的数据格式转换方法。该方法以Word文档为例,对Word文档的转换采用基于模板和基于学习的两种策略,自动地将Word文档转换为XML。同时,为了进行高效的查询,又将转换结果转换为关系型数据作为副本。Word文档只有编辑和显示信息,无语义信息;将之转换为XML后,生成具有语义信息的文档数据,从而完成了基于语义的数据格式转换。该方法支持所见即所得,应用环境没有特殊性,方便了用户使用。另外,该方法采用了领域知识库与文档库相结合的办法,通过图形用户接口,用户可以按领域,根据自己感兴趣的信息,对文档库数据进行查询;也可以对大量Word文档进行精确的基于语义的查询和管理,大大提高工作效率。

童昊昕[7]2008年在《基于语义的GIS数据转换模型的研究及实现》文中进行了进一步梳理介绍了GIS数据语义共享模型的研究现状,利用FME Object搭建了异构简单的语义数据转换平台。

张波[8]2004年在《PDF文档语义信息抽取研究》文中指出PDF文档应用范围十分广泛,数量极其巨大,而且PDF的应用仍然处于继续发展的状态,它在不断地被更多的用户所接受和采纳。PDF应用的广泛性和它继续蓬勃发展的状态与对PDF文档的有效管理的滞后性形成了一对十分尖锐的矛盾,对PDF基于语义的精确查询和管理势在必行。 本系统的将信息抽取技术和机器学习技术的思想相结合,实现了从PDF文档中按语义抽取出有用的数据,并包装成XML文档。本系统的实现主要分为两个过程,一是通过样本学习生成抽取规则,即用户先在PDF视图环境中根据对PDF样本文档理解,创建语义模式,对页面信息附加语义,然后通过用户标记PDF样本文档中的数据项,并在用户创建的语义模式中选择相应的语义项,在语义模式语义项与PDF样本文档中数据项之间建立映射关系;在创建语义模式、建立映射关系的同时,用户将PDF样本文档也提交到预处理模块,经过转化得到样本XML文档;系统针对前面建立的映射关系和样本XML文档进行自动地学习,生成抽取规则;二是利用抽取规则从文档集中抽取出有用数据,并自动包装成包含语义的数据,即用户将PDF文档集及其领域信息一起提交给系统,系统自动地将文档集通过预处理生成Well-formed XML文档集,同时根据领域知识获取相应的抽取规则,然后自动地将抽取规则应用于Well-formed XML文档集,得到具有自描述性的包含语义的XML文档。本系统对于实现PDF文档基于语义的精确查询和管理具有十分重要的现实意义。

刘炜[9]2006年在《基于本体的数字图书馆语义互操作》文中研究表明数字图书馆是一个没有明确边界的研究领域,关注的是对一个有组织(或称为有序)的信息体的构造,不论这个信息体是分布的还是集中的、虚拟的还是实在的,以满足特定的信息需求,不论这个需求来自真实的用户还是机器代理。数字化和网络化,特别是近20年来互联网的指数级发展带来了严重的信息超载(Information Overload)。为了更好地组织信息,满足人们的信息需求,数字图书馆应运而生,然而要从根本上提高数字图书馆对大规模分布式信息的处理能力,准确而全面地提供信息服务,有赖于机器对网络信息的自动处理和“理解”能力。因此实现语义信息的组织和检索,是一个很有前途的突破口。 “语义”指“信息的含义”,“互操作性”是不同平台或编程语言之间交换和共享数据的能力。解决异构信息环境中信息系统之间的高层互操作问题是数字图书馆的一项重要研究内容,而语义互操作是其中的重点和核心问题。这并不是说目前的互操作解决方案中没有考虑语义互操作,而是没有把语义互操作当作独立的目标来考虑。本论文提出对于数字图书馆须定义和设计一个独立的语义互操作层,使数字图书馆所包含的信息资源获得语义的“显性”化,而不是隐式地、内含地包含在语法和具体的系统实现中。 本文研究的内容主要包括两个方面:针对数字图书馆的体系结构和互操作需求特点,将本体论作为语义描述和实现语义共享和互操作的基础,提出了一种以规范的元数据表述和本体服务架构的表示模型和数字图书馆语义的结构化、形式化方法,并研究了相关策略和理论;同时针对数字图书馆资源集成和服务集成的特点和需求,以及现有各类互操作协议,提出了一种基于SOA的语义Web服务架构,并根据该模型架构提出了一套具体操作方法和策略。本文以集成模型为基础,以面向对象模型进行数字图书馆的语义表示,以元数据和本体作为共享的基础,将资源的组织、结构与服务模型有机结合起来,本文的主要特点如下: ● 在总结数字图书馆互操作现有技术和模型的基础上,提出了基本的语义互操作需求,研究并设计了一套数字图书馆语义结构模型,并总结了其表示和实现形式,为数字图书馆语义的提取和形式化表示提供了框架。 ● 提出规范的数字图书馆语义化方法,包括规范的元数据方法和本体模型的建立方法;采用结构化、层次化方法对数字图书馆语义信息进行组织和存储。所提出的资源集合(站点)元数据方案正在申报作为科技部标准。 ● 对于应用Web服务实现基于本体的语义互操作服务,包括语义模型的动态映射、转换和服务合成,提出了一套实施架构,并提出两种具体的操作方法可以应用于建立数字图书馆语义架构:自底向上法和自顶向下方法,前者通过各类语义规范的实施应用于建设全新的具有语义互操作层的数字图书馆,后者通过语义抽取、标注等方法应用于对目前提供网络服务的各类资源集合和数字图书馆进行资源集成和服务集成。 ● 在一个应用实例——名人手稿数字图书馆的体系设计和系统开发中建立了基于本体的语义互操作原型,实现了规范的语义描述架构和基本的与其它数字图书馆和资源库的语义互操作。 本文的研究从对数字图书馆宏观结构模型和微观数字对象模型的探讨出发,以形式化、外显化的元数据和知识本体为要素构建数字图书馆语义架构,作为实现数字图书馆语义互操作的基础。在大量调研现有理论模型和方法论的基础上,将资源的组织、结构与服务模型有机结合起来,对数字图书馆的结构模型在语义表示方面进行了许多扩展,对元数据资源及资源集合描述术语体系、元数据和本体的形式化表示、基于Web服务的数字图书馆语义服务的架构等方面提出了一套较为完整的方案。对于数字图书馆系统的创建或信息与服务集成,本文所研究的理论和技术提供了一个具有普遍意义框架模型,并为深入研究,完善各类基于语义的自动服务提供了一个可行的起点。

张威[10]2008年在《多源空间数据集成方法研究》文中进行了进一步梳理随着GIS应用不断拓展与深入,对空间数据的需求越来越大,为了建立所需的地理信息系统,往往花费大量的人力、物力、财力进行多种的数据采集,空间数据量日益庞大;各应用部门总是根据自己的应用需求选取不同的GIS软件平台、采用不同的数据模型和投影方式,从而导致空间数据在数据模型、数据结构、语义信息等方面存在着很大差异。针对空间数据的多语义性、存储格式的多样性,为了能够更好的共享格式互异的海量数据,本文对多源空间数据集成方法做了探索性的研究。本文提出了一种基于通用空间数据模型的多源空间数据集成方法,建立通用数据模型与各类数据模型的对应关系,在任意两种数据格式之间建立“数据通道”,使得任意两种数据格式和模型之间可以进行最大限度不丢失信息的相互转换和表达。建立常用GIS数据模型与通用数据模型映射关系,通过相应的转换算法,采用中间件技术的集成方式,将多源空间数据集成到同一平台中。本文的研究工作主要体现在以下几方面:1、基于空间数据模型、地理要素语义信息和空间基准统一等多源空间数据集成的理论,总结了空间数据模型集成的方式和应用到的新技术。在分析语义异构原因的基础上,介绍了分类分级、重新编码和本体的语义集成方法,并从坐标系统转换、投影变换和高程基准统一等叁方面实现了空间基准的统一。2、在分析典型空间数据模型特点、比较国内外常用GIS数据模型的优缺点和开放式地理空间数据模型深入研究的基础上,设计了通用空间数据模型,并详细阐述了通用空间数据模型组成、空间数据结构和实现方法。3、采用动态链接库和中间件技术,建立了常用各数据模型与通用数据模型映射关系,解决了数据格式转换过程中出现的问题,实现不同格式GIS数据的集成。4、在通用空间数据模型设计和数据集成技术的基础上,自主开发多源空间数据集成平台系统,实现了在同一平台下对多源空间数据的集成。

参考文献:

[1]. 基于FME与ArcEngine的城市规划成果数据互操作及其应用研究[D]. 陶媛. 西南大学. 2016

[2]. 基于FME的CAD与GIS数据共享研究[D]. 陈年松. 南京师范大学. 2008

[3]. 基于语义的网格工作流智能复用[D]. 李晓琳. 上海交通大学. 2008

[4]. 基于语义的集成研究及配套工具的开发[D]. 王桥. 华中科技大学. 2007

[5]. 基于语义国土资源异构空间数据转换模型研究与实践[D]. 刘雪凯. 南京师范大学. 2005

[6]. 基于语义的数据格式转换[D]. 郝亚南. 河北大学. 2003

[7]. 基于语义的GIS数据转换模型的研究及实现[J]. 童昊昕. 软件导刊. 2008

[8]. PDF文档语义信息抽取研究[D]. 张波. 河北大学. 2004

[9]. 基于本体的数字图书馆语义互操作[D]. 刘炜. 复旦大学. 2006

[10]. 多源空间数据集成方法研究[D]. 张威. 解放军信息工程大学. 2008

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

基于语义的数据格式转换
下载Doc文档

猜你喜欢