基于分类模型的知识发现机理和方法研究

基于分类模型的知识发现机理和方法研究

蒙祖强[1]2004年在《基于分类模型的知识发现机理和方法研究》文中研究指明知识发现(KDD,Knowledge Discovery in Databases)是从数据中获取知识的一种智能信息处理技术。本论文在深入分析国内外相关研究成果的基础上,首先利用粒度计算理论,独立于具体算法,展开对基于分类模型的知识发现机理的研究,以探讨信息系统中知识形成的一般性规律和内在机制,并由此分析KDD研究中若干问题及其存在的根源。然后,在充分研究多种面向KDD的计算方法的基础上,提出新的理论和方法,对个性化知识发现、效率和准确率问题以及KDD算法的早熟收敛等问题展开了研究,形成一套有效的解决方法,拓展了传统的知识发现方法。本文的主要工作及创新性成果如下: 提出并构造信息系统的知识粒度空间——超粒度空间(S_GS)和全粒度空间(AllGS),找到了定义于超粒度空间之上的格和布尔代数。利用格的性质,得到了全粒度空间.的结构模型——超树,其节点代表全粒度空间中的粒度。布尔代数、格和超树及其有关性质,进一步丰富和完善了KDD的几何和代数理论体系,初步形成了信息系统知识空间的数学模型和拓扑结构。在现有决策逻辑语言的基础上,定义用于粒度描述的正基语言,提出并研究“全粒度空间+正基语言”的粒度计算模型,找到了正基语言系统、全粒度空间和基本概念空间的关系,证明了这种关系是正基语言系统到全粒度空间的一个满射。进而分析了知识的形成机理和个性化知识发现问题存在的根源,把知识发现归结为,在全粒度空间(或超树)中搜索各目标概念的最佳粒度表示并形成其有效描述的过程。显然,该过程是基于提出的模型,而粒度空间、超树、格和布尔代数等的有关性质由此而得到完美的结合并在搜索过程中发挥重要的启发作用。同时,分析了一些KDD算法存在早熟收敛、局部知识产生的原因等,提出本文解决方法的基本思路。 基于RS理论提出完备的个性化属性约简算法——DA-FPR算法。该算法的特点是,首先构造分辨矩阵的极小全空间以及基于空间的Θ_简化运算和x_子化运算;然后在用户偏好的作用下,通过交替用运这两种运算(交替次数不超过条件属性集的大小),逐步去除用户不感兴趣的条件属性,最终使得极小全空间收敛于单目空间;最后可由单目空间直接得到所需的约简。实验表明,极小全空间的规模与训练集规模几乎无正比关系,算法时间开销主要是用于构建极小全空间;而之后的操作基本上是基于条件属性集合的简单运算,其时间开销与前面相比,是非常小的,所以算法具有较高的效率;并在与已有方法对比的基础上证实了算法的有效性。文中还从理论上证明了DA-FPR算法的有效性、收敛性和完备性。 提出规则约简算法——DA-FPDR算法和决策算法极小化算法——PA-MRS算法。前者对每一条规则去除其中用户不感兴趣的属性-值对,后者则进一步去掉用户不感兴趣的整条规则。这

谭天乐[2]2003年在《基于粗糙集的过程建模、控制与故障诊断》文中研究表明传统的工业过程建模、控制及故障诊断技术大多基于精确的数学模型,适用于已知运行机理和过程特性的工业系统。然而,工业系统的结构、参数和运行模式在不断的变化,对过程机理的透彻分析和精确数学模型的建立常常需要付出无法接受的代价,系统的控制和故障诊断也就因此面临一个精确建模问题。在实际工业生产中,工程技术人员在对系统机理和数学模型知之甚少的情况下通过观察和经验总结,仍然能够对系统进行良好的手动控制和及时的故障诊断,因此完全可以采用机器学习的智能方法模拟人的这种通过观察学习进行控制的能力。 粗糙集理论是一种通过等价关系和近似概念对数据进行约简以获取知识的方法。粗糙集信息系统是一个基于规则的知识系统,一个基于规则的系统不需要对过程进行数学描述,而是对过程进行经验总结,形式上是“如果…那么…”的规则的集合。规则系统提供了一种了解工业过程的更加直观、简单、易于理解和人性化、智能化的方法。粗糙集理论为基于知识的过程建模、控制与故障诊断提供了理论基础和研究思路。本文的主要目的是试图解决粗糙集在知识获取、机器学习以及工业生产实际运用中所遇到一些主要问题,利用粗糙集在分析处理不完全、不精确和不一致数据中所具有的优势,对复杂工业过程进行基于规则的非机理知识建模,在规则模型的基础上,结合现代控制理论中的有关概念和方法,构造粗糙控制的初步框架,并将粗糙集方法运用于故障诊断。 本文的主要贡献如下: 1、回顾和总结了粗糙集理论的发展和国内外的研究现状,讨论了其在复杂工业过程建模、控制与故障诊断中应用的一般方法。对于粗糙集的开发工具、研究及应用成果以及在工业控制中的发展过程作了系统深入的综述,重点分析和评述了粗糙集理论在工业过程建模、控制与故障诊断中所面临的问题。 2、介绍了粗糙集信息系统中数据预处理的几种方法,分析了连续属性离散化对知识获取的影响。基于布尔逻辑与粗糙集相结合的离散化方法,提出了连续/离散属性混合系统离散化的策略和启发式算法,在信息熵的基础上,提出了一种对离散化结果进行评判的标准,并对布尔逻辑离散化方法和混合离散化算法进行了评价。 3、在等价矩阵概念的基础上,分析了粗糙集知识系统中等价划分与等价摘要 矩阵的关系,采用等价矩阵来表示粗糙集的等价关系,提出了一种对 数据库知识系统进行数据清洗以及从中提取决策规则的矩阵算法,分 析了该算法的计算复杂性。基于已有的决策规则根据对象增减,提出 了在粗糙集信息系统中对决策规则进行动态调整的新策略,并进一步 给出了实现该策略的改进矩阵算法。4、从非线性系统分析方法出发,构造了基于粗糙集决策规则的非线性算 子方程和粗糙状态空间,分析了粗糙状态空间模型的一致性和完备性, 给出了对不一致和不完备的粗糙状态空间模型进行补充的方法。初步 讨论了粗糙状态空间模型的稳定性和可达性,提出了基于粗糙状态空 间模型的非线性过程建模和粗糙控制器设计方法。以一个具有非线性 特性的自来水加药混凝沉淀系统为背景进行了仿真研究,结果表明了 基于粗糙集决策规则的粗糙状态空间模型和粗糙控制器在非线性过程 建模与控制中的有效性。5、利用粗糙集理论自动获取过程工业生产系统中的故障知识,从信息嫡 的角度分析系统知识不确定性的变化,提出了一种基于粗糙集理论的 故障诊断新方法,在前向推理、反向推理以及混合推理的基础上,给 出了针对故障点建立决策表以及利用粗糙集约简所获得的诊断规则进 行正、反向故障诊断的步骤,讨论了这种故障诊断方法的诊断性能及 其在计算上的复杂度。利用粗糙集进行故障知识的发现,寻找系统各 个故障源信号之间合理的逻辑关系,提出了一种构造逻辑故障树的智 能方法,并给出了相应的故障树评价标准。以双效蒸发器系统为背景, 进行了基于粗糙集的故障诊断实例仿真。6、对下一步在基于粗糙集的过程建模、控制和故障诊断等方面将要进行 的工作进行了展望。

任海英, 赵育慧, 于立婷[3]2018年在《基于知识网络的科学研究机会发现的机理和应用》文中进行了进一步梳理[目的/意义]识别潜在的科学研究机会是科研人员进行研究的前提,探讨科学研究机会发现的机理和方法有助于提高科研人员的研究效率。[方法/过程]综合相关文献知识发现和技术机会发现的理论和方法,对科学研究机会进行概念界定和形态表示,并以知识网络的形式阐述了4种发现机理,最后基于链路预测的方法,对单词级别的知识网络构建科学研究机会发现模型。[结果/结论]将该模型应用于自然语言处理领域,预测动态准确率达75. 1%,预测结果表明该模型能够有效进行科学研究机会发现。在理论上填补科学研究机会发现机理研究的空白,方法上将预测的知识单元扩展到单词级别,从而从新的角度发现具有创造性的科学研究机会。

姜永常[4]2007年在《基于知识构建的数字图书馆知识服务研究》文中研究表明随着知识经济的来临,走向知识服务已成为的时代必然需求。在知识服务转型中,需要在管理机制、技术应用、资源构建和服务主体上分别向知识管理、知识技术、知识构建和数字图书馆的范式演进,而这些演进最终体现在数字图书馆知识构建的实现上。面向知识服务,我们对信息构建已有了比较系统的研究,但对知识构建的研究却刚刚开始。所以对数字图书馆知识构建和知识服务的深入研究,需要借助信息构建的理论并通过比较研究,来探讨知识构建的基本原则和机理及知识技术的应用。为此,本文从Brookes信息科学基本方程对知识构建中的信息与知识转换理论进行了解读,并对基于知识元的知识构建机理进行了理论探源,从中明确了知识元在知识构建中的核心作用和构建原则,为数字图书馆知识构建的的实施奠定了理论基础。在数字图书馆知识构建的过程中,需要知识建筑师在计算机技术和和认知理论的支持下,从文本知识结构分析中发现知识元,并结合知识构建的基本原则进行数字图书馆知识元的抽取与实体描述;按照人类知识体系结构并结合语义Web技术来进行知识元的分类标引和本体建构、表示;从而使数字图书馆的知识元库和知识仓库得以构建,并应用本体技术进行语义标注,使数字图书馆的知识组织系统得以语义互联和互操作,为数字图书馆建立了基于本体的知识推理检索机制;由于不同服务主体在知识组织上的异构性、在存储上的分布性,要求数字图书馆应建立多空间的知识网格体系结构和语义网格,来优化数字图书馆知识服务体系的知识空间、语义空间和用户空间,达到彼此互融互通,以此实现数字图书馆分布异构知识的动态智能聚合,从而实现数字图书馆知识构建的复杂任务,完成用户需求与知识库的相互理解和语义匹配。针对基于知识元的数字图书馆知识构建所具有的本体推理检索机制,文中给出了知识元本体推理检索模型,并解释了这种检索机制基于语义网实现的语义推理结构;基此,即可建立基于本体的知识检索框架,并通过数据模型检索、语义检索和基于规则的推理检索这叁种检索模型来实现一个多层次的知识检索目标。最后,经分析得出基于知识构建的数字图书馆具有知识发现、知识创新、知识导航、知识挖掘和知识评价等服务功能;并以实际应用中的CNKI网格资源共享平台为实例,在了解该平台结构的基础上,祥细地剖析了其知识构建程度,指出了基于CNKI平台的数字图书馆知识服务功能的优势与不足,以及改进的设想。通过本文的研究,也将为CNKI平台的知识构建及其数字图书馆知识服务功能最终实现带来了光明的前景。

秦昆[5]2004年在《基于形式概念分析的图像数据挖掘研究》文中提出随着图像数据获取设备和获取手段的迅速发展,我们获取了海量的图像数据,如何充分地利用这些图像数据,从图像数据中挖掘出隐含的、潜在的规律性的知识,是目前迫切需要解决的问题。本文对图像(遥感图像)数据挖掘与知识发现这一新的概念的内涵和外延进行了系统地深入地分析和研究,将这一概念解释为“利用空间数据挖掘的理论和方法(空间聚类分析、空间关联规则分析、空间序列分析等)从图像库(或多幅图像、一幅图像的多个分块)中提取出规律性的潜在的有用的信息、图像数据关系、空间模式等,自动抽取出具有语义意义的信息(知识),从而为图像的智能化处理服务的过程”,强调这个概念是一个动态的概念,是一个过程,其目的是为图像的智能化处理服务,可以对人量的图像数据库进行挖掘,也可以只对一幅图像进行挖掘,它是在其它相关技术的基础上发展起来的,由于还处于初期阶段,与这些相关技术之间的区别有时候可能还不是很明显。本文认为图像数据挖掘是一个具有自己的独特的研究内容的、具有自己的理论和技术框架的一门新的理论和技术。本文对这一概念与其它相关概念之间的关系进行了分析和对比,对图像数据挖掘的研究内容和研究体系进行了界定。 本文对形式概念分析(概念格)理论进行了系统地深入地分析,形式概念分析理论也称作概念格理论,是用数学的形式化的方法对人从数据中产生概念的过程进行分析的有力工具,这与数据挖掘是从大量数据中产生知识的过程是一致的,冈此,形式概念分析理论非常适合于进行数据挖掘的研究。本文对基于形式概念分析理论的数据挖掘的原理和算法进行了研究,将关联规则、分类规则、聚类规则统一成“A(?)B”的形式,从而建立了集关联规则挖掘、分类规则挖掘和聚类规则挖掘为一体的统一的数据挖掘的框架。本文重点对关联规则挖掘的算法进行了深入的研究,并研究出两种集概念格的构建和Hasse图的绘制为一体的关联规则挖掘的快速算法。其中,第二种算法建立了辞典序索引树,并根据概念格节点的内涵基数实现分层存放,经过实验验证,证明这两种算法都优于经典的关联规则挖掘算法Apriori算法,并且第二种算法比第一种算法更加快速有效。 我们对现实世界的认识是在不同的层次、不同的粒度世界里进行的,对于图像数据挖掘来说也是如此,这就涉及到一个图像数据挖掘的粒度问题。本文通过对商空间理论的分析与研究,利用商空间理论提供的形式化语言来描述图像数据挖掘的不同的粒度世界,将商空间理论与形式概念分析理论相结合,对图像数据挖掘与知识发现的机理进行了研究,从理论上提出了一个概念驱动的图像数据挖掘与知识发现的理论框架,即通过商空间理论建立图像数据挖掘的形式化分析体系,在该形式化分析体系的指导下,利用基于形式概念分析理论的数据挖掘算法,从不同粒度的图像世界中提取出不同层次的概念,分析概念之间的包含与被包含关系,从而挖掘出图像数据中隐含的潜在有用的规律性的知识。 图像数据挖掘与知识发现是一个非常复杂的过程,当我们面对一堆纷繁复杂的图像数据时,可以利用商空间的分层递阶的处理方法,首先将这个复杂的问题进行分解,根据区域、层次、图像内容等将图像数据挖掘划分成各个子问题,从不同的粒度分别进行图像数据挖掘,然后再将这些不同粒度的图像数据挖掘的结果进行集成。根据图像数据的位置,可以将图像数据划分为不同的区域,对这些不同的区域的图像数据分别进行挖掘;根据图像数据的层次,将图像数据挖掘划分为像素层次的微观粒度的挖掘、像素集团层次的中观粒度的挖掘、对象层次的宏观粒度的挖掘以及基于对像及其相关的领域信息的宏观粒度的挖掘。根据图像的内容,可以分别进行光谱(颜色)特征知识挖掘、纹理特征知识挖掘、形状特征知识挖掘、空间关系特征知识挖掘等。在进行图像数据挖掘的过程中,以提取各个层次的概念以及概念之间的关系为主要目的,从而挖掘出相关的关联知识。这样,将商空间理论与形式概念分析理论相结合,建立概念驱动的基于商空间理论和概念格理论的统一的图像数据挖掘的框架。本文重点对光谱(颜色)特征知识挖掘、纹理特征知识挖掘、空间关系特征知识挖掘等进行了实验研究,从图像数据中挖掘出了大量的光谱特征知识、纹理特征知识以及空间分布规律知识等。本文选取了大量的航空纹理样本图像,进行了基于纹理特征知识的纹理图像分类的实验,并且与基于灰度共生矩阵、基于马尔柯夫随机场的纹理分类方法进行了对比实验,实验结果证明本文所研究的集于图像数据挖掘的纹理分类方法的分类精度比另外两种纹理分类方法的分类精度更高。 利用图像数据挖掘的方法可以从图像数据中挖掘出大量的图像知识,本文对图像知识的存储与管理以及基于知识的应用等问题进行了研究。本文提出了利用关系数据库以及文本文件的方式实现图像知识的统一存储和管理的方法,建立了一个图像知识库系统,实现了图像知识的有效存储和添加、删除、查询等功能。图像数据挖掘的主要目的之一就是为图像的智能化处理服务,针对图像的智能化处理的目的,本文对图像数据挖掘的应用:基于知识的图像分类?

佚名[6]2010年在《自动化技术、计算机技术》文中指出TP12010031967Flash媒体服务器的优化部署/唐力,槐寅,陈震(清华大学自动化系)//清华大学学报(自然科学版).―2010,50(1).―5~8.越来越多的新型万维网(Web)应用开始提供在线音视频交流功能,而有效的Flash媒体服务器部署方案是提高服务质量的基础。该文给出了媒体服务器优化部署问题的数学模型,并证明即使用户需求和网络性能信息

孟现飞[7]2014年在《基于本体的煤矿事故预警知识库模型及其应用》文中认为尽管我国煤矿死亡人数逐年下降,但形势依然严峻。通过物联网技术和多智能体理论将煤矿井下的物封装成含有煤矿事故预警知识库的智能体,可以有效降低煤矿事故的发生率。但目前尚缺乏基于事故致因机理的煤矿事故预警知识库模型方面的研究。又近些年,本体在知识表示、人工智能方面获得了长足发展。因此,论文研究基于本体的煤矿事故预警知识库模型构成要素及相互关系,并实践应用。论文首先对危险源和隐患的概念进行了重新界定,分析了二者的关系。然后,在此基础上,结合时空逻辑,提出了抽象的、作为事故预警知识库模型理论基石的时空视角下的基于根源危险源的事故致因机理。接着,设计了适合描述具体事故发生机理的时空事故树分析法。然后,根据根源危险源智能体事故预警流程及本体论,构建了基于本体的煤矿事故预警知识库模型。模型主要包括:基于根源危险源的事故致因机理、时空逻辑、煤矿危险源库、具体事故致因机理表示法、具体事故致因机理描述和推理机。事故预警知识库的时空逻辑设计是在现有的时空逻辑研究的基础上,研究时空实体的概念层次及其相互关系,为描述事故致因机理及预警规则提供了时空支持,时间逻辑采用了点段结合的时间表示,将时间实体分为时间点和时间段,时间实体间的关系分为13个大类。空间逻辑采用OGC空间数据模型的子集(点、线、面)构建根源危险源的空间表示,空间实体间的关系包括拓扑关系、方向关系、度量关系。为了使智能体能够理解事故预警知识库模型并进行推理,构建了相应的本体和推理算法。煤矿事故预警知识库本体包括:用于描述基于根源危险源的事故致因机理和煤矿领域概念及关系的煤矿风险本体、描述时间实体及其关系的时间本体、描述空间实体及其关系的空间本体、用以构建具体的事故致因机理的时空事故树表示本体。事故智能预警推理算法设计研究基于本体的描述逻辑推理算法、时间推理算法、空间推理算法及时空事故树推理预警算法,为事故的智能预警提供算法支持。描述逻辑推理基于Tableau算法实现,基于时间约束网络进行时间的定性定量推理,基于组合表进行空间拓扑、方位、度量关系的推理,在现有的事故树定性定量算法的基础上,结合时空约束描述,实现了时空事故树的定性定量推理计算。最后,设计实现了四层架构的王楼煤矿事故智能预警平台,对构建的基于本体的煤矿事故预警知识库模型进行了实践应用。应用表明:论文所建立的基于本体的煤矿事故预警知识库模型理论合理、实践有效,可以为煤矿事故预警知识库的构建提供有益的参考。

崔广风[8]2014年在《数据挖掘中的统计方法及其应用研究》文中进行了进一步梳理由于在数据挖掘的各种方法和技术中,最基础和最重要的方法是统计方法,而且统计理论也催生了许多新的数据挖掘方法,所以研究数据挖掘中的统计方法及其应用不仅可以给数据挖掘的实际工作者提供使用建议和指导,而且可利用统计方法分析数据挖掘中的数据特征,为研究者和实践者推进科技发展和创造社会财富奠定理论基础。本文在研究现有主要数据挖掘方法和软件及其应用基础上,着重分析研究了数据挖掘中涉及的统计方法、模型及它们在数据挖掘中的应用;剖析了数据挖掘中的机器学习和统计学习机理;在研究了覆盖分类学习方法和基于概率的覆盖算法对海量数据处理能力的局限性后,提出了基于贝叶斯理论的改进覆盖算法,即以贝叶斯公式获得的后验概率替代通过投票方式确定覆盖边界中的样本类别,该算法提高了分类的可信度和稳定性。主要有以下四个方面:1.比较分析研究了现有主要数据挖掘方法和软件及其应用,可为使用者使用这些方法和软件提供选用帮助和建议;2.按照数据挖掘的过程和任务,逐一分析研究了其中使用的统计方法、模型等统计学中的理论,可为挖掘具有统计特征的数据信息的知识提供参考;3.重点从产生数据挖掘的新方法的学习机理分析入手,研究了一些基于机器学习和统计学习的数据挖掘方法的机理,为构造挖掘具有统计特征的数据知识新方法提供方向建议;4.针对支持向量机方法在处理大型数据库中使用数据分类的困难,分析研究了覆盖分类学习方法和基于概率的覆盖算法对一些样本不能正确分类的问题后,提出使用贝叶斯的理论融合覆盖分类学习方法和基于概率的覆盖算法解决测试样本中边界样本的分类问题的新学习机。该学习机包括二层结构:基于覆盖学习的分类模型的结构和基于贝叶斯理论的覆盖分类学习模型结构--覆盖分类学习机,实现了对海量数据进行高效地分类。本文的创新和特色体现在第4个方面。

夏月[9]2007年在《基于SECI模型的入职培训策略研究》文中指出本课题属于解决问题为主的应用性研究。其目的为在企业入职培训策略汇总、分析的基础上,运用知识交叉分类模型(隐性——显性、个人——组织、专门——综合),对入职培训的培训内容进行全新分析,在内容分析的基础上,依据SECI知识之间螺旋转化模型,有针对性的提出一整套入职培训全新策略,并将这些策略运用于实际,期望提高培训效果。论文首先详细论述了不同领域的知识观以及知识的不同分类法,显性知识、隐性知识、个人知识、组织知识、专门知识、综合知识各自的特点及相互交叉结合后知识类别的特点。接着对SECI知识之间螺旋转化模型进行系统描述,阐述其创始和发展过程,结合案例描述SECI模型的运用,并且对教学系统设计相关理论进行梳理;第二部分以入职培训效果和策略调查为切入点,运用问卷调查和深度访谈等方法,对若干有代表性的企业新员工入职培训过程和结果进行调查,分析目前企业入职培训效果不佳的主要原因,并将入职培训策略进行汇总,另一方面,收集若干外部培训公司的年度培训计划,整理、汇总、分析,发现缺少关于“入职培训”这一专门项目;第叁部分描述入职培训的地位和作用,分析所需的培训内容,采用知识分类法将入职培训内容进行全新剖析,并且运用SECI知识之间螺旋转化模型进行有针对性的培训策略设计;最后以S公司为蓝本,分析S公司入职培训的内外资源,所需培训内容,设计培训改进策略,并将改进策略整合成全新的一整套培训计划,并提出培训效果的若干评价方法。本文在调查研究的基础上,将经济学领域知识的分类以及根据SECI模型设计出的企业培训策略融入入职培训系统设计中,根据企业的实际情况设计与安排一整套全新入职培训方案,不仅为目前企业入职培训效果不佳提供有效的改进措施,同时也为外部培训公司增添入职培训项目注入可行性的新思维。

梁燕[10]2008年在《SVM分类器的扩展及其应用研究》文中提出支持向量机是数据挖掘中的一项新技术,是一个理论完备、适应性强、全局优化、泛化性能好的分类器。在若干挑战性的应用中,获得了目前为止最好的性能。本文的主要内容是在研究经典SVM算法的基础上,以解决实际问题,拓广SVM的适用范围为出发点,研究SVM分类方法及其分类应用。从支持向量依附的理论背景出发,学习目前SVM训练算法的研究成果,分析它在数据挖掘中(尤其是分类算法上)的应用,并总结了支持向量机在数据挖掘领域中实现的方向。针对其在应用中的一些局限性,揭示SVM的分类机理,提出了两种提高SVM分类性能的方法,并结合垃圾邮件过滤的应用,证实了这两种方法对分类器的性能有不同程度的提高。1.利用未标记数据提高分类器性能的研究。提出了一个解决训练样本不足的方法,该方法自动从未标记数据中挑选样本进行标记,加入SVM训练集,并通过设置阈值在一定程度上保证所选样本的高分辨性。2.基于集成学习思想提高分类器性能的研究。提出一种基于集成学习的KSU分类方法,对于支持向量机不能很好判定的样本,采用最近邻方法判断,该最近邻算法采用支持向量集作为最近邻居集,可以提高分类准确率。将设计的分类模型引入垃圾邮件的过滤应用,分析了垃圾邮件产生的过程,对垃圾邮件过滤的常用方法进行了总结,详细阐述了基于内容的垃圾邮件过滤技术过程。实验表明,与直接用分类面决策的经典SVM相比,该模型在适用的样本规模上表现出了一定的优越性;可以在提高分类准确率的同时,降低SVM对核函数及其参数选择的依赖。模型虽然增加了一定的时间复杂度,但可以保证与SVM空间复杂度的一致性,因而是有效的、实用的模型。

参考文献:

[1]. 基于分类模型的知识发现机理和方法研究[D]. 蒙祖强. 中南大学. 2004

[2]. 基于粗糙集的过程建模、控制与故障诊断[D]. 谭天乐. 浙江大学. 2003

[3]. 基于知识网络的科学研究机会发现的机理和应用[J]. 任海英, 赵育慧, 于立婷. 情报理论与实践. 2018

[4]. 基于知识构建的数字图书馆知识服务研究[D]. 姜永常. 黑龙江大学. 2007

[5]. 基于形式概念分析的图像数据挖掘研究[D]. 秦昆. 武汉大学. 2004

[6]. 自动化技术、计算机技术[J]. 佚名. 中国无线电电子学文摘. 2010

[7]. 基于本体的煤矿事故预警知识库模型及其应用[D]. 孟现飞. 中国矿业大学. 2014

[8]. 数据挖掘中的统计方法及其应用研究[D]. 崔广风. 西南石油大学. 2014

[9]. 基于SECI模型的入职培训策略研究[D]. 夏月. 上海外国语大学. 2007

[10]. SVM分类器的扩展及其应用研究[D]. 梁燕. 湖南大学. 2008

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

基于分类模型的知识发现机理和方法研究
下载Doc文档

猜你喜欢