摘要:随着我国经济水平的发展,科技的进步,水利工程发展十分迅猛。在水利工程管理中,通过数据挖掘技术,能够在大量数据中搜寻到有价值的信息,通过对信息的合理利用,使得水利工程管理更加高效、更加科学。本文对数据挖掘技术在水利工程管理中应用进行深入探究,对其中的管理要点进行充分分析,意在为同行业者起到借鉴作用。
关键词:数据挖掘技术;水利工程;应用实践
改革开放以来,我国科技水平快速发展,经济水平也在不断提高,水利工程基础设施也在进一步完善当中。在水利工程中,数据挖掘技术应用广泛,能够在大量信息中快速建立数据模型,进而提升水利工程管理效率,让水利工程管理更加趋于高效化、科学化。
一、数据挖掘技术的定义与应用
(一)数据挖掘技术的定义
科技的快速发展和数据的存储技术的快速进步,使得各种行业或组织的数据得以海量积累。但是,从海量的数据当中,提取有用的信息成为了一个难题。在海量数据面前,传统的数据分析工具和方法很无力。由此,数据挖掘技术就登上了历史的舞台。数据挖掘是一种技术,将传统的数据分析方法与处理大量数据的复杂算法相结合,从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用信息和知识的过程。
(二)数据挖掘技术的应用
数据挖掘技术应用广泛,如:在交通领域,帮助铁路票价制定、交通流量预测等;在生物学当中,挖掘基因与疾病之间的关系、蛋白质结构预测、代谢途径预测等;在金融行业当中,股票指数追踪、税务稽查等方面有重要运用;在电子商务领域,对顾客行为分析、定向营销、定向广告投放、谁是最有价值的用户、什么产品搭配销售等。可以说,有数据的方法,就有数据挖掘的用武之地。
在水利工程管理中,对技术人员有较高的技术要求,必须能够灵活运用数据挖掘技术,才能在大量信息中及时发现有价值的数据。水利工程管理中的数据挖掘技术可分为以下几种类别:
其一,在大量数据中抽样选取部分数据,对此部分数据进行检测,将检测结果与参考数据进行比对,找出之间的差异,通过差异深度挖掘所有数据,进而找出其中具有价值的信息。
其二,对数据进行预测性挖掘。数据会通过事物发展不断产生变化,因此,在使用数据挖掘技术,应该先要寻找到数据变化的规律,通过变化规律对所有数据进行检测,将检测结果在所有数据中进行筛选,找出与检测结果最为相近的数据,进而达到挖掘目的。
其三,要准确把握数据间存在的内在联系。在面对不计其数的数据时,通过数据间的内在联系能够准确定位特殊数据,通过这种联系对数据进行分析处理,能够有效提升挖掘数据的精准性。
其四,在进行数据挖掘过程中,除了以上三点提到的挖掘方法,还可将大量数据进行归纳合并。根据数据固有特征,将特征相同或变化规律相同的数据分为一类,将特征不同或变化规律有别于其他数据的分为一类。将所有数据归纳合并之后,进行组别间的数据挖掘,能够避免数据重复挖掘,提高数据挖掘效率。
二、数据挖掘具体实施方法
(一)收集信息
收集信息不能盲目,要在充分了解水利工程管理目标的情况下进行。通过对收集的数据信息进行分析,明确信息数据的目标,选择与实际数据相符合的收集方式,将信息储存到数据库中。
(二)信息集成
信息集成也成为共享信息,是把不同格式、来源、特点性质的数据在逻辑上或物理上有机地集中,从而为水利工程管理提供全面的数据共享。
(三)数据归约
数据归约是在保持数据原貌的前提下,最大限度地精简数据量。其目的就是提升数据挖掘效率,对信息来源进行有效处理。如果不对数据来源进行归约,即使只是少量的数据,也需要进行复杂的数据分析扣挖掘时间。这时就需要对数据源头进行归约,归约后的数据虽然小,但仍能完整保留原始数据样貌,这样,数据挖掘效率将大幅上升将更有效,并产生相同的分析结果。
期刊文章分类查询,尽在期刊图书馆
(四)整理数据
在数据库中存储的信息,容易造成数据属性和表述方式不一致的现象,需要对此类数据进行整理。应选则合适的整理方式对丢失的信息进行弥补,对数据中的噪音数据进行进行处理,确保数据库中数据的完整性与统一性。
(五)交换数据
数据交换通过合理的方式,对所有参与分析的数据进行分析,并将分析结果转换成与挖掘技术相符的数据模型。
(六)挖掘数据
数据挖掘需要出现海量数据、计算机技术大数据量的处理能力、计算机存储于计算能力、交叉学科的发展等条件。在数据分析过程中,选择适合的分析工具,通过统计方法、机器学习方法、神经网络方法和数据库方法等数据技术处理方法,对数据库中的所有数据进行技术处理,准确获得其中有价值的信息。
(七)评估模式
为了得到准确的数据信息,要通过合理的评估方式对所挖掘的数据进行反复对比,进而确保数据信息的准确性。
(八)成果表示
成果表示是利用专业化的方式对数据信息进行实时共享。
三、水利工程管理数据挖掘模型的建立方式
对于水利工程来说,其管理复杂,数据挖掘需要相关人员具备大量技术储备,从多学科入手,利用技术人员的专业知识准确分析挖掘数据的准确性,进而从大量信息中快速找到可利用的信息。所以,在水利工程管理数据挖掘中,要建立起半自动层次系统对数据进行深度挖掘。该模型的建立有以下几点:
(一)建立完整的用户界面。利用显示装置将数据反映出来,对挖掘数据能够快速查询,将查询结果通过用户界面显示出来。
(二)建立OLAP/OLAM。其功能就是能够将数据库中是所有数据进行集中存储,在OLAP/OLAM中进行数据分析,是整个水利工程管理数据挖掘模型建立的核心。
(三)信息存储是构建水利工程管理数据挖掘模型的基础,不仅能将所有挖掘数据进行有效存储,还能进场信息集成操作,对过滤机进行及时清理。
(四)将所挖掘的数据通过数据库进行存储之后,数据库能够对数据的源头进行准确分析。
四、将水利工程管理数据挖掘模型与GIS系统进行结合
将水利工程管理数据挖掘模型与GIS系统进行结合的方式主要有三种,分别是嵌入式、松散和紧密耦合式。
(一)在对数据进行空间层面的挖掘中,GIS系统具备对数据进行强大处理的功能。GIS系统与数据挖掘技术有机结合,能够形成一个较为完整的控制系统。通过嵌入式的应用,在进行数据空间层面挖掘时,即使是对完整度不高的数据也能进行有效的处理。其优点就是能够减少数据挖掘工作量,降低数据挖掘难度。缺点同样明显,嵌入式必须在指定的系统中才能正常运行,不能进行系统间的转移,会给不同客户间的需求造成影响,限制系统的开发。
(二)挖掘数据系统和GIS系统是两个互相独立的系统。挖掘数据系统通过变换的方式对数据库中的数据进行挖掘;而松散耦合式能够不借助GIS系统,自主完成数据挖掘工作。但进行数据空间层面的挖掘时,难度明显提高。
(三)将嵌入式与松散耦合式结合就形成了紧密耦合式。其综合了嵌入式与松散耦合式的优势,不仅能对数据进行空间层面的挖掘,降低难度,而且不受不同客户间的需求造成影响,灵活性较高。但过度依赖GIS系统,容易受到其他系统的影响。所以要在明确水利工程管理目标的基础上,结合自身实际状况,合理选择紧密耦合式系统,提升数据挖掘效率。
结束语
综上所述,利用数据挖掘技术能够提升水利工程管理水平,发挥水利工程最大作用,提升人民生活水平,保障国家快速发展。
参考文献:
[1]戴元将,祁智,陈爱鑫.数据挖掘技术在水利工程管理中的应用研究[J].经营管理者,2017(13):76-79.
[2]王东坡.基于数据挖掘技术的水利工程管理[J].吉林水利,2017(06):38-40.
[3]刘德峰,许腾飞.探究水利工程管理数据挖掘模型[J].价值工程,2017(20):38-40.
论文作者:李就
论文发表刊物:《基层建设》2018年第20期
论文发表时间:2018/9/17
标签:数据论文; 数据挖掘论文; 工程管理论文; 水利论文; 信息论文; 技术论文; 系统论文; 《基层建设》2018年第20期论文;