基于语义网的信息内容检索

基于语义网的信息内容检索

黎明[1]2007年在《基于语义网的信息检索技术的研究》文中进行了进一步梳理Tim Berners-Lee于2000年12月在XML2000会议上,提出下一代互联网的概念——语义网(Semantic Web),目的在于赋予万维网上所有资源唯一的标识,并在资源之间建立起机器可处理的各类语义联系。语义网对当代万维网延伸和扩展,以一种明确的、形式化的方式来表示信息资源,提高异构系统之间的有效检索和访问,实现信息资源在语义层上的全方位互联,并在此基础上,实现更高层的、基于知识的智能应用,促进知识共享。目前因特网在信息表达和检索方面存在严重的缺陷,主要在于其设计目的是面向用户直接阅读与处理,没有提供计算机可读的语义信息,因此限制了计算机在信息检索中的自动分析处理以及进一步智能化的信息处理能力。实现信息资源的语义检索,提高数字化信息资源的利用率,这些问题是信息检索领域所面临的挑战。本文分析研究了传统信息检索的基本原理、技术及工具、信息检索发展现状,结合万维网的具体特点,构建了基于语义网的信息检索体系框架,对信息检索系统的设计思想和检索流程进行了详细描述,并对系统模型的合理性进行了论证。本文通过深入的分析研究智能信息检索模型中所涉及的若干关键技术,提出了有效的解决方案,奠定了智能检索实验系统的顺利实施的良好基础,这些技术主要包括:领域本体构建、信息资源收集、语义推理和检索结果排序。最后在理论分析的基础上,设计了基于语义网的文献检索实验系统,该实验系统以计算机领域的科技文献为检索对象,构建出领域本体——文献本体和语义词典本体。通过各种文献资源向知识本体层映射和语义推理处理,可充分发掘各文献之间蕴含的语义关联,从而在根本上解决了检索中资源对象语义信息缺乏的问题,满足用户对资源对象语义检索的需求。文献检索实验系统实现相对比较复杂的知识检索和二次检索功能,提供领域资源的增值服务。传统的基于关键字的检索方式难以实现以上功能,本文通过实践验证了信息检索系统模型的可行性。

黄新平[2]2017年在《政府网站信息资源多维语义知识融合研究》文中研究指明近年来,我国政府信息公开工作进展迅速,越来越多的政务信息资源通过政府门户网站发布,这些信息涉及到各个领域,关系到国计民生和群众的切身利益,群众对其有着广泛的需求。然而由于政府机构的层次性,且行政机关的隶属不同、分工不同,造成政府网站发布的公开信息具有层次性、地域性、分散性等特点,这些海量的、孤立的、分散状态存在的碎片信息往往使人们束手无策,给公众获取有效信息造成障碍,影响政府公开信息的有效利用。政府网站信息资源数量的急剧增长在为人们获取所需的信息和知识带来更多机遇的同时也带来了更大的挑战。因此面对“信息海洋”与“知识匮乏”的对峙局面,迫切需要采取一定的方式和手段对多来源、多类型的政府网站信息资源进行类聚、重组和融合,构建一个有序高效的政府信息知识体系,为用户提供知识的有效获取与利用。知识融合能够针对多源分布信息的碎片化、冗余性、不完整性等问题,从众多数据源中抽取相关知识,经过知识转换、集成与合并等处理,产生新的集成化知识对象,从而为领域决策问题求解构造有效的知识资源。它为解决政府网站信息资源领域的知识服务问题提供了新思路、新方法和新途径。本文以实现政府网站信息资源的深层次开发和利用为立足点,以满足公众的高效率知识服务为目标,综合运用信息管理学、计算机科学、知识科学、系统科学等多学科的理论方法,拟从知识组织的角度架构政府网站信息资源知识融合框架模型,试图改变知识获取的固有流程,形成新的知识获取过程模型,提出对多源的、分散重复、被淹没的政府网站信息资源进行知识融合的理论框架与解决方案。在此基础上,以语义网、知识本体、知识发现等语义信息组织技术为支撑,尝试在语义环境下分别从内容维度、结构维度、应用维度叁个不同维度探索政府网站信息资源知识融合的实现方法。具体研究内容包括:(1)通过对政府网站信息资源和知识融合等相关概念的阐述,进一步明晰了本文研究对象与研究内容的范畴。同时对本研究具有重要指导意义和参考价值的知识空间理论、知识组织理论、本体理论、知识发现理论进行了理论溯源。其中,知识空间多维度的知识分类与知识管理为本文政府网站信息资源多维度知识融合框架的构建提供了重要的理论支撑。知识组织理论对确定不同维度层级政府网站信息资源知识融合所需要实现的知识表示、知识重组、知识关联、知识聚类等过程具有重要的理论指导作用。本体是实现政府网站信息资源知识融合的有力工具,而知识发现理论则提供了解决政府网站信息资源知识融合问题的技术方案。(2)确定了政府网站信息资源知识融合的目标和原则,从用户信息需求和知识融合功能需求两个方面分析了知识融合需求,明确了知识融合的流程与体系结构等框架构建依据。然后对语义环境下政府网站信息资源知识融合过程中涉及的构成要素、功能要素及要素之间的关系进行了分析,并依此提出了基于语义的政府网站信息资源知识融合逻辑框架,从概念与逻辑层面回答了政府网站信息资源知识融合“做什么”的问题。在提出的基于语义的政府网站信息资源知识融合逻辑框架的基础上,以知识空间理论多维度的知识分类与知识管理,知识融合研究领域对知识类型的划分,以及信息融合研究领域中多源信息融合系统的结构与功能框架为依据,提炼出了由数据级融合、概念级融合、决策级融合构成的知识融合功能结构,并依此分别从内容维度、结构维度、应用维度叁个维度构建了政府网站信息资源多维度知识融合框架,从结构与功能层面回答了政府网站信息资源知识融合“怎么做”的问题。(3)内容维度上数据级融合要解决的关键问题是如何对描述统一的政府网站信息资源内容进行有效的数据关联,通过数据关联,形成知识网络。为此,本文通过对特定主题政府网站信息资源进行细粒度信息抽取、预处理,采用本体驱动的元数据模型对其进行统一的语义描述,构建了政府网站信息资源领域知识本体,并以语义网络表示法为参考,实现了政府网站信息资源的知识表示。在此基础上,引入知识元、知识元—本体映射的概念,利用基于知识元语义链接的数据关联方法实现知识元的统一对象化表示、知识元对象的抽取、知识元对象的属性获取、知识元语义关联度计算等,并依此构造生成对特定主题资源内容进行宏观描述的知识网络。(4)结构维度上概念级融合要解决的关键问题是如何从数据级融合生成的政府网站信息资源知识网络中获取领域概念,并识别领域本体概念关系,通过本体合并,形成能够便于发现彼此间关联规则和模式的分类知识组织体系。针对该问题,本文提出了采用RDF链接定性推理与Voronoi图定量推理相结合的本体形式化表示方法来获取政府网站信息资源领域概念。通过识别领域本体概念关系,构建领域本体概念关系的层次结构,依此获得领域本体概念分类体系。在此基础上,设计基于概念分类的领域本体映射模型,并采用本体概念间语义相似度的计算方法,实现基于概念分类的政府网站信息资源领域知识本体合并,消除政府网络信息资源知识网络中的冗余知识,达到对其进行有效分类组织的目的。(5)应用维度上决策级融合要解决的关键问题是如何对政府网站信息资源知识网络和分类知识组织体系结构中具有关联关系和相似关系的领域知识进行关联聚类,经过知识关联聚类,生成面向决策应用的完整领域知识。基于此问题,本文通过对已有领域知识关联聚类方法进行比较分析,提出基于关联挖掘和语义聚类的领域知识融合方法,该方法涵盖时序关联融合、因果关联融合、凝聚层次聚类融合3种核心领域知识融合算法,进而通过因果关联、时序关联、知识聚类等方法生成能够辅助用户决策的完整领域知识。(6)前文按照政府网站信息资源多维度知识融合框架的结构与功能划分,提出了不同维度层级知识融合实现所需要的方法,这些方法的效果如何,还需要通过实验进行验证。为此,本文搭建了实验所需的软硬件环境,介绍了实验需要应用到的相关工具。对实验数据来源及其主题分布情况进行了描述,明确了不同维度层级知识融合的实验内容。在具体的实验验证上,以政府网站发布的“雾霾防治”主题相关的领域信息资源为例,构建了政府网站“雾霾防治”领域知识本体实例。并以构建的“雾霾防治”领域知识本体为依据,分别对数据级融合提出的基于知识元语义链接的知识网络实现方法、概念级融合提出的基于概念分类的领域知识本体合并方法以及决策级融合提出的基于关联挖掘和语义聚类的领域知识融合方法进行了实验验证,并通过设计定性与定量相结合的评价指标对案例实验结果进行了分析与评价。

张洪彬[3]2004年在《基于语义网的信息内容检索》文中指出信息时代,信息检索是人们的一种重要社会活动,遗憾的是现在的检索的结果往往难以令人满意。如何通过信息检索获取令人满意的检索结果成为一个重要的研究课题。 传统的信息检索在同一语义空间描述信息资源和信息需求,提取他们的特征信息,通过匹配和计算这些特征信息,从而判定信息资源与信息资源的相似程度,检索出与信息需求相关的信息资源。 语义网是一个多层技术框架体系,能够表达信息资源含义,描述信息资源之间的关系,建立统一的概念体系,通过代理程序计算机能够自动进行数据处理、交换和重复使用。 信息内容检索是建立一种对信息资源本身的语义定性和语用定量评价体系,区分不同信息资源的知识内涵,从而检索出具有较多信息内容的信息资源。信息内容检索技术是语义网技术应用于传统信息检索技术的产物,语义网技术提供了定性分析手段,扩展了信息检索的语义空间。信息内容检索技术引入了定量分析手段,检索的过程也是定量分析的过程。信息内容检索是未来检索技术发展的重要方向,必将带来信息检索的革命性变化。 本论文研究基于语义网的信息内容检索,以“信息计量学”为主题,利用语义网技术定性分析了不同科技文献的语义内涵,利用引用关系定量分析了不同的科技文献的知识内涵,构建了基于语义网的信息内容检索模型,实现了检索出相关核心科技文献的实例。 本论文共7章。第1章,提出了信息内容检索的必要性和客观需要性。第2章,详细阐述了信息检索技术涉及的语义空间、信息表示、信息检索过程和信息检索结果四个重要方面。第3章,阐述了如何利用语义网表示含义、描述关系、建立概念和规则体系。第4章,构建了基于语义网的信息内容检索模型,从定性和定量两个方面判断信息资源的知识内涵。第5章,实现了“信息计量学”信息内容检索实例。第6章,客观分析了信息内容检索存在的问题,展望信息内容检索的发展方向。第7章,总结信息内容检索的意义。关键词:语义网信息内容检索语义分析语用分析分类号:G25O

陈志伟[4]2008年在《本体的构建及其在信息检索系统中的应用》文中研究表明随着网络的发展,信息呈几何级增长,而网络信息资源的载体多种多样,加上所处的平台及其使用的语言和标准并不一致这就给各个领域信息资源的管理和使用带来了诸多困难。人们面对庞大的信息资源感到无所适从。一方面网络信息资源高速增长,数量庞大,一方面人们想要找到自己真正需要的信息反而变得越来越困难。“信息过载”和“信息迷航”成为人们谈论最多的话题之一。要解决上述问题,必须克服传统检索技术的不足。而目前网络在信息表达和检索存在上面的缺陷,主要是因为设计目的是面向用户直接阅读与处理,而计算机是不能“理解”的。因此限制了计算机在信息检索中的自动分析与处理以及进一步智能化信息处理的能力。语义网的出现就是为了充分发挥网络的“最大潜能”,语义网相关技术能够为网络上的资源提供计算机可以理解的信息,给出计算机可以理解的表示资源的方法,最终使得人们能够更加充分利用网络资源。而作为语义网的基础——本体也是人们现在研究的热点之一。本文详细介绍了传统信息检索技术并指出它的缺陷与不足,在此基础上引入了语义网的概念,介绍了作为语义网基础的本体的概念以及实现语义检索的原理与优势,并对构建本体方法以及构建本体工具做了详细介绍。本文利用protégé,结合基于软件生命周期的建模方法构建了一个大学领域本体UO,并在此基础上设计了基于大学本体的检索系统的叁层体系结构,实现了查询生成与优化,同时给出了查询的推理算法。本文最后利用JenaAPI实现了基于本体检索的系统原型。

孔楠[5]2008年在《基于本体的垂直搜索系统的设计与实现》文中研究表明随着信息技术的迅猛发展,网络成了人们获取信息的主要手段,它在给人们带来便利的同时,但也带来了困惑。因特网上的信息浩如烟海,内容庞大,组织松散,人们经常要耗费大量的时间去搜索特定的主题来完成工作。所以信息检索已经成为我们工作、生活必不可少的一种网络服务。随着使用的普及,大量的潜在需求使信息查询技术得到了突飞猛进的发展。其中的主要支撑工具——搜索引擎的性能将极大的影响人们搜索有效信息的速度,因此如何优化搜索引擎的性能在该领域备受关注。Web上的大量信息造成了“信息过载”,实现快速、准确的检索信息已经成为一个亟待解决的问题。本论文利用软件工程的相关知识,分析了国内外搜索引擎的现状以及存在的不足,研究了语义网和本体的知识,以及它们在信息检索的应用,深入研究垂直搜索引擎设计理论,通过对特定专业领域或行业内容进行精细挖掘和分类,过滤筛选等工作后,得出的一个优化了的信息检索模式。它排除与用户检索内容不相关的杂项,提高检索准确率,信息定位更精准,因此在特定领域或行业中,垂直搜索提供的搜索服务势必更好更强,更为用户所欢迎。本文的研究重点放在以垂直搜索引擎理论为基础构建了一个基于本体的信息检索的框架,采用特定算法设计面向主题的搜索引擎信息抽取系统。经过研究分析,提出了基于本体的个性化搜索引擎设计,摒弃了目前搜索引擎中普遍存在的问题。它借助用户的个人兴趣知识,参照共享本体知识库对查询进行语义分析,对查询结果进行过滤,基本实现了个性化查询。目标系统由页面获取、网页预处理、主题信息抽取、查询内容匹配等组成。用Java环境进行框架构建,MVC模式及Struts进行开发,protégé本体建模工具构建本体,选择XML语言描述本体。该系统从实际应用的角度出发,通过搜索内容的主题进行分类,更有效地从web上抓取相关的网页,再进行整理、综合,提取出有用的信息再以一定的方式展现给用户。应用结果证明本文研究实现的搜索引擎信息抽取系统极大的提高了信息获得的准确率和时效性。

纪明奎[6]2007年在《基于语义网的个性化信息检索模型研究》文中提出语义网(Semantic Web)是现有互联网的延伸,语义网上的信息具有定义良好的含义,使得计算机之间以及人类能够更好地彼此合作。个性化信息检索是以用户的个性需求为核心,根据用户的兴趣和特点进行检索,以满足用户的个性检索需求。本文首先对语义网的基础理论进行了研究,阐述了语义网的概念、体系结构及关键技术。然后对个性化信息检索的相关技术进行了论述,阐释了个性化信息检索的内涵,分析了个性信息检索的功能模型。接着对基于Ontology的信息检索进行了探索,阐述了本体描述语言、构建本体的原则和步骤,对基于Ontology的信息检索的基本原理进行了论述。在此基础上本文提出了一个基于语义网的个性化信息检索模型。

许琦[7]2007年在《个性化信息服务技术研究》文中提出个性化信息服务是当前网络信息技术领域的一个非常重要的研究课题,它针对用户不同的需求,采用不同的服务方式,提供不同的服务内容,帮助用户快速、及时、有效地获取资源信息。论文针对网络信息服务的特点和服务需求,提出了个性化信息服务的体系框架,对Web文本资源特征建模、组织管理和用户建模等关键技术进行深入研究,并将个性化信息服务技术应用于资源搜索与导航、个性化信息定制和知识主动推送等方面。论文的主要研究内容如下:第一章首先介绍了论文的研究背景和应用意义。针对网络信息服务的研究内容,介绍了相关领域如搜索引擎、语义网、个性化信息服务等的研究现状,着重对当前叁类个性化信息服务系统的服务特点和技术功能进行了对比分析。最后给出了论文研究的主要内容和组织结构。第二章阐述了个性化信息服务的概况,对个性化信息服务的概念、逻辑流程、特点和服务模式进行了研究。在此基础上,提出了论文研究的个性化信息服务系统的体系结构和功能组成。第叁章主要探讨了网络文本资源的形式化描述(特征建模)方法,提出了一种基于向量空间模型和知网的特征建模方法。研究了特征项权重计算、语义消歧、语义相似度计算等具体实现技术。同时,为了实现网络资源效用的最大化,对如何实现网络文本资源的分类进行了研究。最后,通过实验对上述理论方法的有效性进行了验证。第四章主要探讨了面向用户需求的用户建模技术。对数据收集、模型表示和模型更新等叁个建模子任务进行了研究,包括采用类重心分类算法建立用户模型、基于知网优化用户模型以及应用Rocchio反馈算法更新用户模型等。在建立用户模型的基础上,研究了信息过滤技术。最后,对论文提出的用户建模技术进行了实验验证。第五章以宁波机械行业的Web资源发现与共享为应用背景,从资源搜索与导航、个性化信息定制、知识主动推送几个方面,介绍了个性化信息服务在机械制造行业相关领域的具体应用实例,对论文研究的技术和理论进行了初步验证。第六章总结论文的研究工作和主要创新点,对未来的研究方向和重点进行了展望。

刘建飞[8]2013年在《领域本体的构建及语义检索模型研究》文中研究指明在信息社会,及时有效的获取信息成为推动社会发展和进步的重要力量。随着互联网络的迅猛发展,信息资源呈现出急剧增长的势头。传统的基于关键字的检索技术因其无法理解信息所含的语义,对用户检索关键词只能是在字、词的层面进行简单的匹配,所以无法避免自然语言中影响检索结果的一词多义和一义多词等现象的出现,已无法满足用户的需求。而语义检索技术则为解决传统检索系统的不足提供了一种基于语义理解的检索方法,该方法充分利用信息资源之间的语义关联,从语义层面实现了对信息资源的检索,成为目前信息检索技术研究的热门方向。本论文在研究了语义检索研究现状的基础上,重点研究和分析了语义Web、本体的相关理论和信息检索概况,之后介绍了领域本体构建的原则和方法、本体构建工具以及对会计核算领域本体的建模,将会计核算领域的概念及其对象属性关系、数据属性关系模型化和语义描述化,形成一个会计核算领域本体。在构建了会计核算领域本体的基础上,本文首先对基于领域本体的检索模型进行分析,描述了其拥有的功能,探讨了检索模型的设计原理和基本思路,提出了一种基于领域本体的语义检索模型并对模块进行了较为详细的介绍。并研究了本体语义扩展查询技术,实现了对会计核算领域一定程度的语义检索。本文的研究是一个探索的过程,处在非常基础的阶段,在今后的工作中,将结合Jena等本体扩展工具以及相关的开发环境真正完全的实现基于本体的语义检索,希望能将其应用在互联网上,方便用户学习和研究使用。

董克[9]2014年在《数字文献资源多元深度聚合研究》文中进行了进一步梳理图书馆是社会文化公共基础设施的重要组成部分之一,在社会文化事业发展中将起到十分重要的积极作用。无论是图书情报学的理论研究还是现实的图书馆事业,均越来越强调实现知识服务的重要性。深化图书馆知识服务能力,提升图书馆知识服务水平已经成为当前亟需解决的问题;此外,随着科学发展所累积的数字文献资源规模越来越庞大,如何高效利用这些数字文献资源也逐渐成为提升知识服务能力的重要研究命题。本文的选题“数字文献资源多元深度聚合研究”正是在这样的大背景下提出来的。本研究综合运用语义挖掘、自然语言处理、信息计量、网络结构分析等多学科交叉的方法,创新地提出数字文献资源多元深度聚合理论是衔接信息计量与信息检索的重要桥梁,并在此基础上构建了数字文献资源多元深度聚合理论体系,从多个方面论述了其多元性特征和深度特性;进一步明确了多元深度聚合的技术流程和方法,通过两类典型的数字文献资源特征项关联网络论证了该方法体系的实用性和可操作性。本研究力求从新的途径来实现数字文献资源语义揭示与深度聚合,改进图书馆服务方式,提升服务效率和水平,为数字图书馆的建设和多学科交叉的方法体系提供有益的探索成果。本文坚持“理论结合实践,用实践验证理论”的思想,从理论基础研究,理论体系研究,核心技术流程,典型聚合方式实证等多角度系统化进行数字文献资源多元深度聚合研究。论文第0章引言论述了选题背景、研究意义、国内外研究现状、技术路线与目标,第六章为研究总结和展望;其余核心部分包括如下五章:第一章是数字文献资源多元深度聚合的理论基础研究,目的在于明确问题来源和理论定位。首先对数字文献资源的概念和构成要素进行分析;进一步阐述了作为聚合前阶段的数字资源整合的主要内容以及与聚合的关联;论述了当前研究中与数字资源聚合最相关的领域-信息检索的基本思想及其与聚合的关联;分析了信息计量学中的集中与离散分布现象,说明这是能够实施聚合的基础,在此基础上将数字文献资源多元深度聚合定位为衔接信息计量学和信息检索的纽带。第二章是数字文献资源多元深度聚合的内涵和理论框架研究。多元深度聚合是用户和以资源集合为表现形式的知识世界的交互过程;数字文献多元深度聚合的理论模型包括聚合的对象类型、关联网络、测度方法和聚合目的等四个要素,这些要素所具有的多元性特征反映了数字文献资源聚合的多元性。从基于元数据的聚合、基于计量的聚合到基于语义的聚合是一个不断深化的过程,其中包含了多粒度的层次,不同对象的聚合重点也是体现聚合深度特性的一个重要内容。理论框架的建立为进一步明确技术流程提供了基础。第叁章是数字文献资源多元深度聚合的技术体系研究。首先构建了多元深度聚合的通用流程框架,进一步将之归纳为叁个核心技术问题,即聚合对象的重要性评价、资源聚合的获取、资源聚合的语义揭示。对比了局部重要性和全局重要性指标,分析了全局重要性评价的优点。针对基于节点和基于聚类的两类现有方法,创新地提出了相对重要性聚合方法。归纳了从词频,共现再到主题模型的语义发现路径,总结了主题语义挖掘的灵活性和可操作性。第四章是引文网络中核心资源多元深度聚合的实现。引文网络是特征项关联网络中有向-二值网络最典型的代表。本章系统分析了传统引文网络中的重要性评价单一、结构分析粒度过大的问题,并提出改进指标和方法,将多元深度聚合技术流程应用于XML研究论文的引文网络中,发现相对值聚合方法能够揭示网络中最具层次丰富性的核心资源聚合。结合主题语义分析,能够实现聚合中所包含语义内容的深度揭示。基于引文网络的资源深度聚合结果是本文所构建的理论和方法体系有效性的重要体现。第五章是作者知识关联网络多元深度聚合实现。作者关联网络的类型最丰富,明确作者复合关联网络的聚合流程也就解决了其他多种特征项的聚合问题。本章详细描述了作者数据的着录问题和清洗策略,构建了作者合作、互引、共被引、基于文献的耦合、基于关键词的耦合和基于出版物的耦合等六种关联网络,对网络间的关联性进行分析,为各种共现网络分析方法的结合使用提供更多的支持。利用加入作者的语义主题模型挖掘出作者的主题语义分布,发现作者合作网络、共被引网络、基于文献的耦合网络的聚合均有其独特之处,而互引、基于关键词的耦合、基于出版物的耦合则有许多使用上的限制条件。基于作者关联网络的资源深度聚合能够为满足用户知识需求提供更多角度的支持。

李淑霞[10]2009年在《地名本体及其在地理空间数据组织中的应用研究》文中进行了进一步梳理相对于地理坐标而言,通过地名查找地理位置信息是一种更符合人类地理认知需求的方法。但是,目前基于关键词的WEB信息检索机制不利于人们查找与某个地名相关的具体地理位置,主要原因是无法解决地名的语义问题。地名本体通过对命名地理实体的建模,可以有效地解决地名的语义问题。语义网是一种可以克服目前基于关键词的WEB检索机制不足的新型信息检索环境,它提供了一种能够实现语义检索的信息组织框架。相应地,地理空间语义网的目标是提供基于语义的地理空间信息检索服务。因此,地名本体与地理空间语义网的结合为实现基于地名的语义检索提供了有效的解决方案。论文以实现基于地名的WEB地理信息语义检索为目标,围绕地名本体相关的理论和技术及其应用问题进行了系统的研究。重点是地名本体的概念设计、地名本体的形式化表达以及地名本体在基于语义网的地理空间信息检索(Geospatial Information Retieval, GIR)信息组织中的应用研究。论文的主要研究内容和贡献包括:1.针对目前基于关键词的WEB地理信息检索机制的不足,提出了基于地名本体的WEB地理信息组织的理论和方法,并对相关的理论和技术研究现状进行了系统的总结,提出了论文研究内容和解决思路。2.在系统介绍本体论和本体概念和理论的基础上,创新性地提出了广义本体和狭义本体的概念。这种提法有利于对本体理论和技术方法的认识和理解,是对本体理论的丰富和拓展。3.介绍了语义网的概念及其与本体和信息检索的关系,通过对语义网体系结构的剖析,提出了基于语义网的GIR信息组织框架,即由GIs数据源,元数据和地名本体叁层构成的信息组织框架,为解决基于语义的地理信息共享提供了理论和技术基础。4.针对普通用户基于语义网的GIR的认知需求,提出了地名本体的概念及其解决地名语义问题的理论方法。创造性地提出了复用地名词典和地理主题词表的地名本体概念设计框架,并对地名本体的构成及其构建方法进行了系统研究。5.对地名本体的形式化表达的理论和技术方法进行了系统研究。在对WEB本体表示语言进行系统介绍和比较之后,分析了OWL在表达空间本体及空间推理规则能力方面的不足,提出了OWL与语义网规则语言(SWRL)结合表达空间本体的方法,为解决地理领域本体研究中目前面临的空间本体表达的普遍性问题提供了解决思路。6.对地名本体在GIR信息组织中的应用进行了系统研究。针对目前GIs数据源和地理空间元数据机制中存在的数据组织问题,按着基于地名本体的GIR信息组织框架,对现有GIS数据进行重新组织,以解决基于WEB的GIR中存在的语法异构、结构异构和语义异构问题,从而实现基于地名本体的GIR。论文最后进行了实验,通过对基于关键词和基于地名本体的语义检索两种检索方式的对比,验证了后者的优越性。

参考文献:

[1]. 基于语义网的信息检索技术的研究[D]. 黎明. 南京理工大学. 2007

[2]. 政府网站信息资源多维语义知识融合研究[D]. 黄新平. 吉林大学. 2017

[3]. 基于语义网的信息内容检索[D]. 张洪彬. 四川大学. 2004

[4]. 本体的构建及其在信息检索系统中的应用[D]. 陈志伟. 华中师范大学. 2008

[5]. 基于本体的垂直搜索系统的设计与实现[D]. 孔楠. 北京交通大学. 2008

[6]. 基于语义网的个性化信息检索模型研究[D]. 纪明奎. 黑龙江大学. 2007

[7]. 个性化信息服务技术研究[D]. 许琦. 浙江大学. 2007

[8]. 领域本体的构建及语义检索模型研究[D]. 刘建飞. 吉林大学. 2013

[9]. 数字文献资源多元深度聚合研究[D]. 董克. 武汉大学. 2014

[10]. 地名本体及其在地理空间数据组织中的应用研究[D]. 李淑霞. 解放军信息工程大学. 2009

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

基于语义网的信息内容检索
下载Doc文档

猜你喜欢