智能电表故障大数据分析探究论文_陈晨

智能电表故障大数据分析探究论文_陈晨

陈晨

国网陕西省电力公司西安供电公司 陕西西安 710000

摘要:随着社会的发展,我国的用电量不断增加。电力行业的智能电表的应用越来越多,故障类型多样。随着运行时间的延长,故障发生的概率增加。本文是针对智能电表故障类型、发生概率等数据的分析和总结,探究智能电表数据仓库模型建立,对进一步做好智能表质量评估和运行电能表故障预测提出解决方法。

关键词:智能电表;故障;数据;分析

引言

随着智能电能表大量推广和使用,其电网地位日趋重要。准确计量是智能表的基本要求,而且智能电能表的应用过程中,计量故障类型繁多,危害极大。包括电量倒走、电量飞走、电量走快、电量停走等,因此有必要对计量异常产生原因总结分析。从历年计量异常的故障中归纳出四大故障原因,并从最可能的故障点排查故障,找出故障产生的直接原因。这利于进一步推进智能表的生产与运维,促进其设计、生产、检测、安装上的完善。

1故障数据整理及数据仓库的构建

1.1故障数据整理

通过已有的SG186系统、MDS系统、拆回表分拣系统,对智能电表故障数据进行汇总。通过整理发现,智能电表故障数据维度高,信息条目数多。通过对各维度离散化标称数据的数目,并将他们进行编号,最后以编号的形式存入数据仓库中。对于日期型的数据,统一成天、月、年三种纬度来进行储存。电表的使用寿命长度以天为单位计算,电表的读数统一为小数点后两位。

1.2建立数据仓库

故障数据仓库各表字段包括条形码编号、表故障编号、安装时间、拆除时间、地区编号、电池使用时间、电池电压、开盖次数、电表读数、芯片型号编号、芯片型号、通讯接口编号、通讯接口型号、地区名称、建档日期、故障类型、故障编号。各表中的数据,根据对于旧表数据的统计,共有7个芯片型号、8种通讯接口、5种电流型号、30个电表厂家和28种电表故障。

2故障分布与相关性分析

2.1各个厂商电表的故障分布分析

各电表厂商的特有故障列表(厂商的特有故障为相对于其他电表生产厂商,该厂商更易出现的故障,采用tf/idf法分析)。从分析结果发现,多数厂商和地区的故障分布均具有一定特殊性,可以通过深入分析找到某厂商或地区区别于其他地区的特有故障类型。

2.2故障之间的相关性分析

对各故障之间的相关程度进行分析(采用经过t检验的斯皮尔曼等级相关系数,保留相关度>0.9的高度相关故障,共20对)。从分析结果中我们可以看到,部分故障类型之间存在极高的相关性。

3故障预测

在因果分析中,我们验证了和电表故障与寿命相关的影响因素,现在我们用这些影响因素来训练基础的分类器。我们的分类工作主要是针对这3大类进行分类。

第一类,也可以称作管理问题,主要包括外观有污迹和无载波模块两类。

第二类是等待报废的问题,主要包括表壳损坏、按键失灵、铭牌损坏、铅封损坏、接线端子损坏等。目标有两个:一是在电表入库时就预先判断该电表的可能故障。二是对已使用电表可能发生故障的预测。

4.1朴素贝叶斯模型

4.1.1朴素贝叶斯原理

朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。朴素贝叶斯分类器基于一个简单的假定:给定目标值时属性之间相互条件独立。

4.1.2朴素贝叶斯的实现

首先我们从数据仓库中把我们所需要纬度的数据提取出来,并按照我们需要的格式编排完毕。然后分别统计我们需要的各种先验知识并训练模型。

4.1.3朴素贝叶斯模型的结果

①入库电表故障预测经检验我们的朴素贝叶斯模型的分类准确度是65.2216%。

期刊文章分类查询,尽在期刊图书馆

②已用电表故障预测

经检验我们的朴素贝叶斯模型的分类准确度是65.288%。(如表2)从表格中可以看出我们的朴素贝叶斯分类器对于第三类故障的分类准确度最高,对于第一类的分类准确度次之,对于第二类的分类准确度最差。以下是分类器工作的示意范例,我们将规范化的芯片型号、地区、生产厂商、通讯接口型号、电流型号、电表使用时间、电表读数构建成一个向量。例如我们选择一块芯片型号是东软4.0、地区是城南、生产厂家是浙江万胜电力仪表有限公司、通讯接口型号是东软载波,电流型号是5(60)A、已使用寿命400~800天、已读1000~10000字的电表,将各维信息转化为(2,7,25,3,5,2,2)的向量输入我们的模型中,经过模型计算输出结果是3,表示模型预测这块表如果将会发生故障那么发生第三类故障的可能性最高。

4.2决策树模型

4.2.1决策树原理简介

决策树是在已知各种情况发生概率的基础上,通过构成决策树来评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。

4.2.2决策树实现

首先通过统计工作以及数据变换,我们需要构造出输出数据。然后按照计算信息熵,以信息熵衰减程度从大到小的顺序构建树结构。最后在叶子节点中,通过投票多数通过的方式决定分类结果

4.2.3决策树模型结果分析

①入库电表故障预测

经检验我们的决策树模型分类准确率为68.0%。其中对第三类故障的分类准确度较高,第一类次之,对第二类的分类效果较差。

②已用电表故障预测

经检验我们的决策树模型分类准确率为69.1%。其中对第三类故障的分类准确度较高,第一类次之,对第二类的分类效果较差。

4.3softmax神经网络

4.3.1softmax神经网络简介

神经网络是一种应用类似于大脑神经突触连接的结构进行信息处理的数学模型。我们所采用的多层感知器是一种前馈神经网络模型,可以将输入的多个数据集映射到单一的输出的数据集上。

4.3.2softmax神经网络实现

首先进行数据变换,将数据变换成我们需要的格式,然后初始化我们的多层感知机并应用调整的共轭梯度下降算法反复迭代更新神经网络中每个节点的权值,输出结果使用softmax回归函数进行激活。等参数收敛后,我们就得到了一个softmax神经网络模型。

4.3.3softmax神经网络结果分析

①入库电表故障预测

我们选择芯片型号、地区、生产厂商、通讯接口型号、电流型号作为纬度,将各个可取的属性值改为0-1表示的布尔值,这样我们就构建了有60个节点的输入层,有两个节点数分别为12和9的隐藏层以及有3个输出节点的输出层的softmax多层感知机。

②已用电表故障预测

我们选择芯片型号、地区、生产厂商、通讯接口型号、电流型号、电表使用时间、电表读数作为纬度,将各个可取的属性值改为0-1表示的布尔值,这样我们就构建了有70个节点的输入层,有两个节点数分别为13和10的隐藏层以及有3个输出节点的输出层的softmax多层感知机。

5结论

两种方案唯一的区别在于RS485总线、低压电力线载波混合抄表系统增加了一层物理设备,即采集终端,使得系统由主站、集中器、采集终端和RS485总线电能表四层物理设备构成。

①综合性能(性价比),方案1占优;

②在通信性能、远程断送电控制、抗扰能力方面,方案1优势明显;

③在功能扩展、设备成本方面,方案2占优;

④方案2最大缺点是安装、调试和维护工作量大,且RS485总线抗干扰能力相对较弱;

⑤方案1最大缺点是一体化载波电能表成本相对较高。

参考文献:

[1]多功能电能表通讯协议[M].中国电力出版社,2008.

[2] 卢虹宇.智能电能表的检测常见故障分析[J].中国电力教育,2013,(26):226-227.

[3] 王文静.智能电能表的现场运行管理策略研究[J].电测与仪表,2014,51(11):23-27.

论文作者:陈晨

论文发表刊物:《防护工程》2018年第8期

论文发表时间:2018/8/24

标签:;  ;  ;  ;  ;  ;  ;  ;  

智能电表故障大数据分析探究论文_陈晨
下载Doc文档

猜你喜欢