试论大数据时代下数据挖掘技术在电力企业中的应用论文_谢锡铭

试论大数据时代下数据挖掘技术在电力企业中的应用论文_谢锡铭

广东电网有限责任公司中山供电局 528400

摘要:数据挖掘技术在当前的大数据时代背景下,已经被电力企业广泛熟知,同时也将其应用到具体工作中,极大的推动了电力企业的发展。本文主要探究了电力企业在大数据时代下面临的挑战及数据挖掘技术的应用,以供参考。

关键词:大数据时代;数据挖掘技术;电力企业;应用

引言

数据挖掘技术的潜力是无限的,随着电网改制的深入推进,大数据真正落实到电力企业内部各个环节,数据挖掘技术将更加熟练地运用到电力企业中,数据挖掘技术的优势和潜力将显露无疑。

一、电力大数据概述

电力大数据主要来源于电力生产与电能使用的发电、输电、变电、配电、用电以及调度等环节,具体包括以下三大类:第一,电力企业营销数据,包括交易电价、售电量、用电客户等数据;第二,电网运行与设备检测或监测数据;第三,电力企业管理数据。对电力大数据来说,其特征如下:首先,数据体量庞大,通常为PB级,常规调度自动化系统的采集点通常不低于数十万个,配用电和数据中心为千万级;其次,数据类型繁多,例如历史数据、实时数据、多媒体数据、文本数据、时间序列数据等各类非结构数据及半结构化数据、结构化数据;再次,价值密度低。采集到的数据大多为正常数据,异常数据占比低,其中异常数据为状态检修的重要依据;最后,处理数据较快,能够在零点几秒内完成大量数据分析,为决策制定提供有力支持。

二、电力企业在大数据时代下面临的挑战

1、收集数据

在当前电力大数据时代,电力企业数据来源可以是企业内部的历史年度数据总结,还可以来自信息机构和互联网的各种数据。收集这些信息必须要附上对应的时空标志,同时要删除无效的数据。并且,还应该尽可能收集不同数据,做到与企业内部的历史数据相对照,从而方便验证信息的真实性和可靠性。数据收集对于电力企业而言,将是个不小的挑战。

2、半结构化和结构化数据

当前互联网应用呈现出非结构化和半结构化数据大幅度增长的特征。据不完全统计,非结构化和半结构化数据占有比例已超过整个数据量的75%。与此同时,基于数据网络化的存在,使得这类数据的复杂关系更加多样化。另外,由于这类数据是以数据流的形式存在,数据价值化与时效性呈现明显的相关性,价值稍纵即逝。尽管计算机智能化有了明显的进步,但是只能对结构或类结构的数据进行分析,深层次的数据挖掘更加遥不可及。

3、数据网络背后的数据关系

大量观测数据虽然可以映射出各种复杂的网络系统,但是由于这些数据往往是孤立的数据点,映射出的数据网络存在片面性,如何做好数据集成,使之成为一个完整的数据网络是值得思考的问题。例如:发电企业单单考虑发电量数据,得到的只是发电厂发电量单一方面的数据。但是,发电数据是与电压数据、线损数据、用户用电数据等相互联系的,怎样利用模糊分析方法,考虑这些数据的参数关系,分析复杂网络之间的联系,对发电企业来说是一个巨大的挑战。此外,由于各个发电企业、供电企业没有统一对其专业化的信息系统进行建设,导致电力生产、销售各专业数据彼此独立,形成信息孤岛。为破除信息孤岛的数据壁垒,需要融合发电、输电、变电、配电以及用电等多方面数据。

三、电力大数据时代下数据挖掘技术

1、数据挖掘技术

数据挖掘技术是利用特定的数理模型对企业的大量模糊的数据进行分析,从这些数据中挖掘出富有价值的潜在信息的技术。对于电力企业来说,复杂的电力系统产生的数据规模庞大,传统数据处理手段已不适用,而数据挖掘技术可以更有效的解决这一问题。

期刊文章分类查询,尽在期刊图书馆

2、电力大数据时代数据挖掘技术的思考

在当前大数据时代,IDC(国际数据公司)提出,阻碍企业实现发展的重要因素是新数据类型以及相应分析技术的缺失。然而,我们需要特别关注的是,数据挖掘技术能够发挥其应用价值的必要前提是使用数据是高质量的和有效的。因此,为了解决好数据质量问题,电力企业应该设立首席数据官,从而进行数据管理工作,保障数据的质量,确保数据挖掘技术可以挖掘出有实用价值的信息,服务于电力企业决策。

四、大数据时代下电力企业中数据挖掘技术的应用

1、数据收集

数据收集得益于移动设备、互联网、无线射频识别技术、自动记录系统等技术设备,数据来源层的作用主要是存放电力企业内部大量的事务型数据,及对电力企业决策产生影响的外部性数据。并且,为了让所获得的数据更加具有代表性,电力企业需要尽量收集各种不同的数据源产生的数据,从而为数据挖掘的后续工作做好铺垫。

2、数据整理

在数据整理过程中,由于数据源数据内容往往交叉,所以需要按照互动性对观测数据进行分类。同时,由于原始数据中有冗余数据、噪声数据及缺失数据等问题,为提高待挖掘数据的质量,需要对数据进行解析、清洗、重构,并填补缺失数据。经过分类后数据被大致分为两大类:非结构化与半结构化数据、结构化数据。对于非结构化和半结构化数据,需要按照特定的标准处理成机器语言或索引;对于结构化数据,需要进行数据过滤,除去无效数据以提高分析效率。例如,对电力用户评论、电力系统运行日志资料等数据,就需要转换成模糊逻辑或是加权逻辑,并将不同的词语映射到标准值上,形成企业统一的语言。

3、数据管理

通过数据管理方式,能够将数据保存在电力数据仓库,不同电力数据库,其存储标准也是有明显差别。因此,必须遵循转化再保存至数据仓库的操作步骤,同时,重新进行数据仓库的设计必不可少。电力仓库的设计需要从概念设计、逻辑设计和物理模型设计等多个方面出发,综合分析考虑。数据仓库重新设计的最终标准是可以结合具体的主体设计出针对性的数据集,剔除数据中存在的冗余数据,从而实现数据的精简。与此同时,按照一定的规则算法匹配新的数据样本,从而得出综合性评价。

4、数据分析

通过数据管理层中联机分析处理技术的分析处理后,数据可以发挥辅助决策信息的功能。电力企业对数据实时性有着极为严格要求,在具体的数据分析过程中,可以把数据划分为非实时性数据和实时性数据两大类别,从而给予对应处理方法。而在非实时性数据处理方面,不仅可以使用分布式文件系统等方式处理,而且也可以使用云计算平台进行数据的处理;在实时性数据方面,可以通过内存计算技术等,使用内存运行计算,明显提升计算的运行速度。

5、数据展示

通过数据可视化设计等方式,将数据中复杂信息通过图形表达方式展示,为企业未来的发展和规划提供重要支撑。对深度挖掘的数据进行可视化处理,能够帮助企业员工清楚认识企业未来的发展方向,明确整个决策制定的科学性和有效性。

五、结束语

大数据时代对电力企业的发展提出了更高的要求,也带来新的发展机遇。电力企业运用数据挖掘技术从海量的信息中挖掘出潜在的、对企业有价值的数据信息,为电力企业提高经济效益、降低运营成本、完善决策提供有力帮助和依据。

参考文献:

[1]辛玲玲,丁筱筠.电力大数据的挖掘与应用探索[J].中小企业管理与科技,2015.

[2]何瑞娟.大数据时代下数据挖掘技术在企业中的应用[J].网络安全技术与应用.2016(12)

论文作者:谢锡铭

论文发表刊物:《基层建设》2020年第2期

论文发表时间:2020/4/30

试论大数据时代下数据挖掘技术在电力企业中的应用论文_谢锡铭
下载Doc文档

猜你喜欢