文本挖掘及其在UDDI Registry智能检索中的应用

文本挖掘及其在UDDI Registry智能检索中的应用

谭德坤[1]2004年在《文本挖掘及其在UDDI Registry智能检索中的应用》文中研究表明随着Web Services技术的不断成熟和发展,存储在UDDI Registry中的Web Service信息将会变得越来越庞大,如何从UDDI Registry浩如烟海的信息资源中为用户快速、方便、准确地检索出满足需求的Web Service,将变得十分重要。而传统的基于关键词匹配的检索技术已不能满足用户准确而全面定位信息的要求,因此,本文就以Web Service的文本描述信息为研究对象,提出了应用于UDDI Registry的智能信息检索技术。 对文档集进行特征化表示是文本挖掘和信息检索的前提和基础。本文用频繁序列模式挖掘算法挖掘出扩展短语,用扩展短语代表文档的特征项,并用概念秩算法和HITS算法挖掘出文档的主题概念,文档的特征就用主题概念加以表示。 智能检索的核心是概念检索和个性化服务。为了对文档进行概念检索,必须发现某个领域内的概念及其之间的关系,即构建出概念空间。本文通过文本挖掘相关技术挖掘用户访问文档信息,从而构建出用户私有的概念空间,核心算法是改进的K—Means文档聚类算法和FP-树频繁模式发现算法。由于概念空间是通过挖掘用户访问文档信息生成的,它也包含用户的个性化信息,在概念检索时候,也实现了个性化服务的目的。 概念检索是智能检索的具体体现。在概念检索过程中,为了帮助用户更加准确的表达自己的查询意图,本文采用Hopfield神经网络算法对用户的检索关键词集进行概念联想,将联想的结果供用户再次反馈。对用户反馈后的查询表示与文档特征表示,本文给出了概念匹配运算的方法,并讨论了检索结果如何组织的方法。 最后,为验证本文的研究结果,提出了一个将上述几个方面有机结合起来的智能检索系统模型,并给出了一个具体的检索验算。

崔道江, 陈琳, 李勇[2]2017年在《智能检索引擎中的网络数据挖掘技术优化研究》文中进行了进一步梳理随着计算机网络技术的不断发展,对于Web Service检索技术的要求也越来越大;并且现在网络环境当中数据信息流量十分庞大,对于信息可以做到深入搜索,实现全方位信息查询是非常有必要的;为此,利用网络数据挖掘技术在智能检索引擎中的应用,以文本描述为信息作为文章的研究对象,为用户提供运用查询要求,实现概念检索功能;其中强调在智能搜索引擎当中的网络数据挖掘技术进行优化研究,从结构设计以及算法分析上总结出当前网络数据挖掘应用智能检索的可能性;最终设计出一种利用数据挖掘技术的智能检索模型,实现在众多网络数据中可以准确快速的进行详细的信息检索功能。

么炜[3]2007年在《基于Web服务的集中型广域农业信息服务系统的研究》文中研究说明进入21世纪,信息技术在迅速发展,同时也加快了农业信息化的进程。农业信息服务作为农业信息化进程中具有支撑作用的资源要素,为农业信息化提供了各类服务保障。随着我国信息化进程的推进,我国的农业信息服务体系已初具规模,出现了许多与农业有关的网站,如中国农业信息网、中国农业科技信息网、中国叁农网等七千余家,但大多只是信息发布、科普知识登载或以留言的方式提问,等待管理员解答,而缺乏专家与用户之间的互动,使得农民遇到问题时,难以得到专家的及时帮助。由于农业的适时性,这样往往造成很大的经济损失。另外,目前国内农业软件也不少,但大多是比较专业和单纯的,用于研究用的较多,真正科学实用且易于掌握的极少,甚至可以说推广到广大农民中的软件系统还没有。在国外,由于国情不同,类似的研究也不多见。针对这些问题,本论文提出研究和开发一个集中管理的,易使用、易掌握,交互性强的农业信息服务系统的设想,使用户通过此系统提交他们遇到的问题并能及时得到解决方案。研究一个中央集中型的互联网系统可以彻底解决推广难的问题,基于网络技术可以让众多用户访问这一个中央系统,而无需在每个用户的机器上都安装此软件。此系统涉及各个专业,所以从地域和专业领域都可谓是一个“广域”系统。本文全面、详尽地调研了农业信息服务系统与Web服务的研究现状:阐述了与农业信息服务相关的一些基本问题;分析了面向服务的体系结构并比较了其多种实现方式的优点和不足;探讨了Web服务的架构及核心技术。深入研究了基于J2EE的Web服务模型、工作机制以及基于J2EE的Web服务的技术框架。本文详细设计了集中型广域农业信息服务系统的框架,建立了系统结构图,系统功能图,系统业务流程图;着重研究了四个功能模块:智能检索、问题解答、信息增值和个性化服务模块。本文采用基于J2EE的Web服务技术实现了该系统的部分功能,其中包括:个性化服务模块中订单发布、订单响应,以及UDDI私有注册中心的查询服务、发布服务、更新服务、删除服务操作。

谭德坤, 赵珑, 吴润秀, 孙辉[4]2007年在《基于UDDI Registry的智能检索引擎的研究》文中指出随着Web Services技术的不断成熟和发展,存储在UDDI Registry中的Web Service信息将会变得越来越庞大,如何从UDDI Registry浩如烟海的信息资源中为用户快速、方便、准确地检索出满足需求的Web Service,将变得十分重要。而传统的基于关键词匹配的检索技术已不能满足用户准确而全面定位信息的要求。因此,以WebService的文本描述信息为研究对象,运用文本挖掘相关方法,构建出用户概念空间,对用户提出的查询要求进行概念检索。着重介绍了用户概念空间的构建方法以及概念检索的匹配运算过程,并给出了应用于UDDI Registry的一种智能检索引擎系统模型。

崔运鹏[5]2007年在《基于本体论的农业知识管理关键技术研究》文中提出从信息管理提升到知识管理是信息化发展的必然和提高信息服务质量的迫切需求。开展基于农业知识管理技术的研究,将为农业知识管理提供高效和科学的手段和技术支撑。本体论是起源于哲学领域的概念,近年来为信息技术领域使用并用于知识的组织和管理。本体的定义是“An ontology is a specification of a conceptualization”,即本体是对概念化的规范说明。本体论是关于基于本体的用计算机语言规范知识概念表示、进行知识组织、开展知识服务的科学方法论。运用本体论的理论、技术和方法进行农业知识管理,引起国内外广泛关注,成为学术研究的前沿和热点。本研究的目的是设计基于农业本体论的完整的农业知识管理解决方案,重点研究农业知识组织、农业知识检索和农业知识评价的关键技术,同时对其他相关的关键技术进行较深入的研究。所采用的主要研究方法是,在整体方案设计阶段,通过用户需求调查,收集不同用户对农业知识管理的需求。在具体环节的关键技术研究时,结合主流技术,在本体论的基础上提出各个环节关键问题的解决思路,并在一些重点环节加以实现。本研究在设计的农业知识管理整体解决方案的基础上,针对农业知识管理的获取、组织、检索、表示、评价环节的技术做了深入细致的研究。此外,还对知识服务和知识网格进行了较为深入的研究。在农业知识获取方面,研究了目前网络信息获取的模式和方法,以及基于RSS的知识获取,利用VB.NET实现了基于RSS的知识获取的核心功能,论述了基于本体论和语义网的知识获取。在农业知识组织方面,研究了利用元数据、分类法和本体论实现知识组织的方式和方法。实现了基于元数据的农业知识的组织,制定了农业科技信息核心元数据标准(ASTICM)及其扩展原则,设计实现了基于ASTICM的计算机着录信息管理系统。农业知识检索方面,研究了知识检索的一般模型以及基于本体的知识检索方法,实现了基于本体的农业科技文献知识的组织和智能检索平台,构建了一个基于本体的智能化猪病诊断系统。在农业知识评价方面,利用数理统计方法建立了领域本体和知识检索的评价模型,设计了一个基于层次分析法的动态指标管理系统,用于评价结果的计算和输出。在知识服务和知识网格的研究方面,比较了知识服务和信息服务的异同点,以及知识服务的模式和发展方向,论述了本体论和语义网技术与知识服务的关系;提出了一个基于本体论的SOA的农业知识网格架构。本研究提出了基于本体论进行农业知识管理的思路和整体解决方案。对农业知识管理各环节的关键技术进行了深入的研究,实现了农业知识管理过程中利用元数据和本体进行知识组织、基于本体的知识检索和知识推理、利用数理统计方法进行知识评价等几个关键技术,并对其他环节的关键技术进行了探索和尝试。因为本体论的研究核心是提出知识组织和管理的理论、技术和方法,本研究所涉及到的技术也都是国际上最新的主流技术,本研究具有前沿性和新颖性。整个研究将提升我国农业本体论的研究深度和广泛应用,并与国际上相关领域的研究接轨。

许泉立[6]2006年在《Web环境下基于Ontology的空间信息查询检索机制研究》文中认为随着Internet技术的飞速发展,万维网已经成为人们获取各种信息资源(包括地理空间信息)的主要途径和载体。一时间,网络搜索不仅成为了人们茶余饭后谈论的时髦话题,而且也越来越成其为人们日常生活中不可或缺的信息查询检索利器。然而,随着网络信息的急剧增长以及快速更新,“信息爆炸”时代的到来让网络搜索面临巨大的挑战,传统的基于关键字的信息查询检索机制由于不能“理解”信息语义而导致其在查准率和查全率方面存在着严重的不足,这使得当前网络搜索引擎越来越不能满足人们日益增长的信息检索需求。一种新的能理解信息语义的网络信息检索机制和搜索引擎成为摆在研究者面前的新课题。另一方面,WebGIS的广泛应用推广了网络地理空间信息的使用范围和方式,空间信息同样呼唤着智能检索时代的到来。 当前,基于本体论的语义网技术是解决上述信息检索问题的关键。本文结合艾滋病空间信息的特点,较系统地论述了Web环境下本体驱动的空间信息查询检索系统的原理、方法和应用,具体来讲,文章主要展开了如下的研究工作。 首先,文章在分析了当前包括地理空间信息在内的网络信息及其检索工具面临的尴尬局面后,论述了语义网是解决当前网络信息知识化表达和智能化处理的核心,而本体论是实现语义网目标的基本和关键技术,并由此引出了本文的研究目的和主要内容。接着文章介绍了语义网的基本概念、层次结构以及本体论的定义和相关技术(包括形式化表达语言、构建工具和知识处理平台等),并给出了地理本体的概念及其与地理认知、地理信息智能化处理之间的关系,阐述了地理本体的信息本体模型和服务本体模型是本文研究的核心。 之后,文章分别从叁个主要的章节(第叁、四和五章)详细论述了本体驱动的艾滋病空间信息查询检索系统(ODRIS4AIDS)的总体框架、信息本体模型和服务本体模型的设计与构建过程。其中: 1.第叁章给出了基于语义网服务的ODRIS4AIDS总体结构和运行机制,并且讨论了两种运行机制(广义和狭义)的概念以及相互关系,阐述了语义网服务和艾滋病地理本体支持下的ODRIS4AIDS能够有效的解决艾滋病异构空间信息的共享与互操作以及完成基于空间语义的查询检索。 2.第四章探讨了艾滋病信息的空间化原理和方法,并在此基础上结合地理本体的构建准则、方法和步骤,建立了基于OWL-DL的艾滋病地理空间信息本体模型。

李昌贵[7]2011年在《基于网格的网络导航服务关键技术研究》文中研究说明从导航叁要素(载体的当前位置、目标位置以及二者之间的路径)的角度出发,给出了网络导航服务的定义:根据用户的需求,在必要的情况下,通过网络计算技术将分布在网络上的导航资源有效地整合在一起,使得导航叁个基本要素的确定包括定位、目标要素检索和路径规划都可以通过分布在网络上的导航资源之间的协作完成,最后通过网络传输将定位结果、目标要素检索结果和路径规划结果集成在一起,从而向用户提供满足其需求的导航服务。从定位、目标要素检索和路径规划叁个方面研究了网络导航服务的关键技术:1.网络导航定位服务网络导航环境下,通过分布在网络上的多种定位相关资源的协作,可以充分发挥不同定位技术的优势。主要存在叁种协作模式:不同定位技术的协作。根据用户的定位需求,随着环境的变化动态地选择不同技术下的定位服务,向用户提供自适应的“按需服务”。同一种定位技术下不同定位服务系统的协作。连续运行参考站网系统(CORS)是近年来发展快速的定位服务系统,能为车道级的汽车导航、汽车自动驾驶、行人导航、盲人导航等导航应用提供高精度的定位服务。本文提出了一种基于网格的虚拟CORS技术来实现不同CORS系统之间的协作。同一定位服务系统内定位资源与非定位资源的协作。研究了载波相位基线的网格解算。通过一定的数学模型对计算进行分解,将分解后的子计算分配到多个网格节点上同时执行,从而成倍地提高解算速度。2.网络导航目标要素检索服务用网格工具集GT4中的OGSA-DAI组件建立目标要素检索网格服务,解决导航地理数据库的分布性、DBMS的多样性、格式上的异构性等问题。基于描述逻辑建立导航地理要素资源的知识库,实现目标要素的智能检索。3.网络导航路径规划服务在网络导航环境下,我们试图通过分布式道路网的实时协作向导航用户提供路径规划服务。提出了一种分布式道路网的动态联合路径规划方法:根据导航用户给出的起始点和目标点等需求参数,在网络上分布的道路网数据源中动态地选择若干道路网,让它们分别独立地进行局部的路径规划,最后综合所有局部路径规划的结果,形成完整的从起始点到目标点的路径。

潘伟森[8]2013年在《多维语义感知的Web服务社会建模及关键问题研究》文中研究指明当前互联上的Web服务不仅数量庞大,而且呈现多样性和复杂性的特点,使得如何精确的发现所需的服务并将它们组织成复杂的业务流程或复合服务成为当前面向服务计算的关键问题。然而目前绝大部分研究工作仅从接口功能单一视角描述Web服务的语义,而忽略了时空、上下文和性能等语义信息,尤其是对服务交互的本质和服务间的关联关系缺乏足够的重视,从而阻碍了Web服务的自动发现与组合。本文将Web服务的多维度语义赋予社会性并引入到Web服务的组织和管理中,将语义Web、社会计算和复杂网络理论知识融入到服务计算模式中,以构建一套完整的以应用为中心的Web服务社会模型为研究目标,并对Web服务社会建模中的关键问题进行了深入的研究,取得了如下的研究成果:⑴提出了Web服务社会参考概念模型及体系结构。综合考虑服务的功能、时空、上下文和交互关系等多维语义,设计了遵循动态增长和优先情节原则的服务社会参考概念模型;提出了服务本体的概念,即利用本体对Web服务多维度语义进行一致化建模;在分析服务社会模型各组件元素及实现原理的基础上,设计了Web服务社会的体系结构,用于指导多度语义感知的Web服务社会的构建。⑵设计了基于社会计算的Web服务自动聚类方法。通过分析互联网上同现标签之间的协作意图提出了基于标签间同现关系的社会标签网络;将Web服务的自动聚类转化为基于社会标签网络的社区发现问题,并依据网络的拓扑结构提出了一种基于子图密度和一致度的Web服务自动聚类方法,最后通过实验证明了该方法的正确性与有效性。⑶研究了服务本体的自动生成及演化机制。融合自然语言处理和语义Web等相关技术,在分析WSDL文档结构及其与本体对应关系的基础上,设计了一种服务本体的自动生成及演化的方法,对比实验表明该方法具有较高的准确性和较好的实用性,并最终通过构建的服务本体实现了对Web服务进行全方位、多层次和多视角的语义描述。⑷从Web服务组合的角度,详细定义了参数级、操作级和服务级叁种粒度的Web服务语义关系,通过服务之间的关联关系将众多孤立的Web服务组织成复杂的网状关系系统,真正实现Web服务之间的彼此语义感知;设计了基于关系的组合服务发现方法,并通过案例对比分析对其可行性和优越性进行了验证。总之,本文将互联网上散落的Web服务组织成多维语义感知的Web服务社会,并提出了相应的方法用于解决Web服务社会建模及应用过程中的关键问题,从而为面向服务计算的研究提供新的途径和理论支持。

蒋哲远[9]2006年在《基于Web服务的特定领域软件体系结构及其关键技术研究》文中指出作为构建柔性的大规模分布式企业级系统的一种新的工具,以Web服务为基础的面向服务软件体系结构(SOA)扮演着越来越重要的角色,其开发方法和建模研究正成为软件工程领域一个新的热点问题。其中,定义面向服务的软件体系结构是研究、开发与集成分布的、自治的Web服务的基础。 鉴于面向服务软件体系结构的研究与应用尚不成熟、概念也不统一、更缺少以服务为首要建模元素的可操作体系结构构造、描述和建模方法等不足的现状,本文对面向Web服务的领域体系结构的研究现状和发展趋势进行了系统的分析和探讨,围绕其中的几个关键技术,包括构建面向Web服务的软件体系结构模型,使用UML为面向Web服务的软件体系结构建模,使用XML定义面向服务体系结构,以及支持QoS约束的Web服务智能发现方法、优化技术和集成框架等几个方面进行了深入的研究,取得主要研究成果如下: (1) 综述了Web服务的基本概念和软件体系结构的主要描述,并从解决软件体系结构驱动的Web服务软件开发和建模角度出发,介绍了一种基于交互与集成的Web服务形式化描述,给出了软件体系结构的一个新定义。 (2) 提出了一种基于Web服务软件体系结构的领域系统构造过程,对其主要元素角色、操作、服务构件和服务构件类等进行了较为详细的描述,并从服务构件交互与集成的角度分析了服务构件的组合语义。鉴于Web服务是一个无状态服务,给出了一种Web服务与网格技术相融合机制,并使用BPEL4WS来组合网格服务的高层体系结构。 (3) 提出了一种基于Web服务的领域服务原型系统的快速模型驱动建模框架。从服务构件的概念和标准UML 2.0的建模构造出发,给出了一个综合的服务软件建模过程。在此基础上,讨论了模型驱动的Web服务的特性描述,重点是介绍一种基于UML扩充机制的面向Web服务描述语言(WSDL)的建模技术。通过一个流通领域的面向服务ERP系统的实际建模,展示了所提方法的切实可行性。 (4) 提出了一种新的基于XML的用来描述服务软件体系结构的体系结构描述语言WS-XADL。WS-XADL规约采用XML作为元语言,集成了相关的UML 2.0 Profile规则、OCL语言和MSC表示法,除具备传统的ADL描述软件系统高层结构的能力,还为定义服务的交互集成模式和把服务映射到目标构件配置提供了建模元素。讨论了一个叁阶段的软件体系结构迭代改进过程,该过程把服务视为首要的类建模元素,并认为服务是横切体系结构的方面,通过解除服务模型和来自目标构件配置实现之间的耦合,可实现相同服务集的多种不同体系结构。

周绪倩[10]2010年在《基于电子商务的Web数据挖掘系统架构研究》文中指出随着网络技术的发展和Internet的普及,电子商务这一现代新兴商业模式也以惊人的速度蓬勃发展起来,正在影响着整个社会的经济运行结构。电子商务系统每天都会产生蕴涵着大量重要信息的原始交易数据和访问数据,这些数据主要以Web日志文件格式存储于Web服务器中。如何将这些异构的、不确定性的和非结构化的海量数据转化为有用的信息成为当前电子商务系统建设的重要任务之一。数据挖掘技术是从大量复杂的数据中,提取潜在有用的信息和知识的过程。把Web数据挖掘技术应用于电子商务系统的建设具有重要的意义。目前,几乎所有的大型电子商务系统,都不同程度地使用了各种形式的数据挖掘技术,为客户提供个性化服务,如Amazon(亚马逊)、dangdang(当当网)等。但是多数系统仅提供基于OLAP的简单统计分析,且多数系统的挖掘架构均是基于封闭体系设计的,在需求多变的电子商务挖掘应用中显得不足。本课题致力于构建一个基于电子商务环境下的开放式的数据挖掘架构,把Web服务和移动Agent技术应用到此架构中。本文主要做了如下工作:(1)分析和总结了目前电子商务系统架构的研究现状与动态,指出了传统用于电子商务的Web挖掘系统所存在的问题。通过研究Web服务和移动Agent技术的相关理论,提出了利用Web服务分布式思想和移动Agent的智能性,实现电子商务环境中Web数据挖掘架构的优越性。(2)在研究应用于电子商务环境的多种Web挖掘算法的基础上,对关键的Apriori关联规则和k-means聚类核心算法存在的不足进行了改进,并对改进的算法用实验检验了其有效性。同时在挖掘架构阶段对多种Web算法做了封装,共同完成挖掘任务。(3)研究了电子商务系统的实现技术,并对基于J2EE平台的实现和应用其它平台的实现进行比较。最后采用基于J2EE平台的叁层结构模式和MVC等设计模式进行原型系统的简单设计。

参考文献:

[1]. 文本挖掘及其在UDDI Registry智能检索中的应用[D]. 谭德坤. 昆明理工大学. 2004

[2]. 智能检索引擎中的网络数据挖掘技术优化研究[J]. 崔道江, 陈琳, 李勇. 计算机测量与控制. 2017

[3]. 基于Web服务的集中型广域农业信息服务系统的研究[D]. 么炜. 河北农业大学. 2007

[4]. 基于UDDI Registry的智能检索引擎的研究[J]. 谭德坤, 赵珑, 吴润秀, 孙辉. 计算机工程与设计. 2007

[5]. 基于本体论的农业知识管理关键技术研究[D]. 崔运鹏. 中国农业科学院. 2007

[6]. Web环境下基于Ontology的空间信息查询检索机制研究[D]. 许泉立. 云南师范大学. 2006

[7]. 基于网格的网络导航服务关键技术研究[D]. 李昌贵. 解放军信息工程大学. 2011

[8]. 多维语义感知的Web服务社会建模及关键问题研究[D]. 潘伟森. 天津大学. 2013

[9]. 基于Web服务的特定领域软件体系结构及其关键技术研究[D]. 蒋哲远. 合肥工业大学. 2006

[10]. 基于电子商务的Web数据挖掘系统架构研究[D]. 周绪倩. 河北工程大学. 2010

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

文本挖掘及其在UDDI Registry智能检索中的应用
下载Doc文档

猜你喜欢