基于时间序列数据挖掘的地铁车门亚健康状态识别方法论文_张峰

深圳地铁集团有限公司 广东深圳 518040

摘要:本文提出了基于时间序列数据挖掘(同一统计指标的数值依据其发生的时间先后顺序,进行排列形成的数列内的数据挖掘)的地铁车门亚健康状态鉴识手段,在地铁门电机数据特征提取的基础上,分别建立了符号化时间序列及符号化改进时间序列。同时依据多尺度滑动窗口(对图像进行不同尺度的缩放,随后依据固定大小的滑动窗口,以等距步长在整幅图像上滑动时遇到的多个窗口)特征提取信息,构建了基于时间序列数据挖掘的地铁车门分层亚健康状态鉴识模型。最后对基于时间序列数据挖掘的地铁车门亚健康状态鉴识模型运行精确度进行了进一步探究。

关键词:Time Series;数据挖掘;地铁车门;亚健康状态

前言:

地铁车门是乘客从候车室进入地铁车辆内的关键模块,其是保证乘客安全、平稳进入或者出地铁的关键。而由于地铁车门位于地下,缺乏良好的自然通风环境,相较于外部环境而言,其内部环境主要依靠暖通(具有通风、采暖、空气调节功能的空调器)空调系统。再加上地铁内人流量较大,客流量的急剧变化需要频繁开闭车门,在一定程度上增加了地铁车门运行负担,极易促使地铁车门处于亚健康状态。这种情况下,在时间序列数据挖掘的基础上,对地铁车门亚健康状态进行适当分析就非常必要。

一、时间序列数据挖掘概述

时间序列又可称之为Time Series,其主要是指同一统计指标数值,依据发生时间先后顺序排列,呈现的均匀时间间隔上观测值序列。Time Series数据挖掘主要是依据已有历史数据,对未来趋势进行分析或者通过序列分解,预测序列季节变动或者不规则变动、循环变动情况[1]。

二、基于时间序列数据挖掘的地铁车门亚健康状态鉴识模型构建

1、基于Time Series数据挖掘的地铁门电机数据特征提取

首先,利用Symbolic aggregate approximation算法(时间序列相似性度量),设置长度一定的字符串,表示对应长度的时间序列。

其次,考虑到Symbolic aggregate approximation算法应用阶段对实践序列中极值点的忽视,在获得离散化字符串DCBCDE(C语言程序)之后。可利用拓展符号聚集近似算法(用扩展符号聚集近似对序列符号化表示,再对字符串进行距离进行度量),引入地铁门时间序列极值。同时利用滑动窗口重叠分割的方式,将时间序列离散成若干等宽的短序列[2]。

最后,基于空气阻力、密封条反弹力、机械阻力、密封条摩擦力等对地铁车门影响,可以根据车门开关时刻惦记转速、转矩信号变化趋势,将地铁门开启、闭合过程划分为电机启动时刻、电机匀速运动段、电机速度骤减段三个段落(认为以上为重点拓展,需较大篇幅重点论述)。在上述三个段落确定之后,利用一种多尺度滑动窗口,深入挖掘地铁车门开启、闭合阶段电机转速、电流信号、转矩变化。其中在电机启动段主要采用小滑动窗口进行离散;而在电机匀速运动阶段主要采用大滑动窗口进行离散;在电机速度骤减阶段主要采用小滑动窗口进行离散。

2、基于Time Series数据挖掘的地铁门亚健康鉴识模型构建

由于实际地铁车门亚健康状态鉴识阶段,其亚健康类别、亚健康状态并不存在绝对对应联系,电机组松动、下挡销干涉等II类亚健康案例,对地铁车门电机运动过程并不会造成较大的阻力干扰,也不会产生较为明显的过程变化趋势。因此,在地铁车门特征数据离散提取的基础上,可以利用一种由粗放至精细分层、分类的算法,对地铁车门I类亚健康、II类亚健康进行逐层区分。

图1 基于Time Series数据挖掘的地铁门亚健康状态鉴识模型

如图1所示,基于Time Series数据挖掘的地铁门亚健康状态鉴识主要针对正常数据、亚健康数据,包括两个层面识别过程。第一层主要采用字符化处理的方式,对地铁门时间序列数据进行挖掘,可获取距离表述特征时间子集。随后利用主成分分析的方式,逐层降低维度,去除冗余信息[3]。并挑选贡献率较高的地铁车门特征数据(如图1所示),在首层进行I类亚健康分类鉴识;而在第二层地铁门亚健康识别过程中,主要通过数据基础特征融合的方式。结合距离表述特征集。在鉴识能力较好的SVM分类器内(在特征空间上间隔最大的支持向量机的分类器),设定合理的惩罚系数,对II类亚健康数据、正常数据进行区分鉴识。

图1 贡献率与特征变化趋势

三、基于Time Series数据挖掘的地铁门电机亚健康状态鉴识模型分析

1、基于Time Series数据挖掘的地铁门电机亚健康状态识别数据来源

现阶段我国所采用的地铁门结构多维塞拉门结构台架,在这一背景下,可利用地铁门内置数据采集设备,实时采集地铁门开启、闭合过程中电机各项数据。并经无线传输枢纽,将相关信息传输至电子门控器。主要亚健康类型为下挡销横向干涉、上滑道外移、V型异常、对中尺寸变化大、下挡销纵向干涉、压轮过压等。在具体数据选择过程中,可以选取涵盖上述数据亚健康状态的电机数据。每一种类型亚健康状态分别包含地铁门开启、地铁门闭合的80组数据。其与亚健康数据曲线相似程度较高,且在转角、转速段基本重合。

2、基于Time Series数据挖掘的地铁门电机亚健康状态鉴识模型应用参数设置

在上述数据收集完毕之后,可以利用多尺度滑动窗口特征提取算法((对图像进行不同尺度的缩放,随后依据固定大小的滑动窗口,以等距步长在整幅图像上滑动时遇到的多个窗口)),对上述不同类型亚健康状态、正常状态数据进行挖掘分析,获得了580个地铁门开启、闭合关闭特征。整体数据在1100个左右,最终获得了特征维数较高,且各特征间相关性较大的模型参数(如图2)。同时考虑到地铁门开关阶段存在一定信息,可在分类器内对上述数据进行鉴识处理之前,利用协方差矩阵求解(矩阵的每个元素是各个向量元素之间的协方差)的方式,将主成分编号、贡献率(有效或有用成果数量与资源消耗及占用量之比)进行对应分析。根据亚健康状态特征分布情况,可得出区分度较高的亚健康状态为对中尺寸变化大、正常状态、压轮过压等;而电机组松动、下挡销横向干涉区分度较低[4]。其余指标区分度一般。因此,可将区分度较低的电机组松动、下挡销横向干涉设为II类亚健康;其余均为I类亚健康。

图2 主成分在各亚健康状态下分布态势

3、基于Time Series数据挖掘的地铁门电机亚健康状态鉴识结果论述

为确定基于Time Series数据挖掘的地铁门电机亚健康状态鉴识模型应用有效性,可以选择前面收集的正常状态数据、亚健康状态数据。结合地铁车门开门特征、关门特征、整体特征,进行逐一鉴识。其中ANN主要选择节点输出函数为Sigmoid函数的多层感知器拓扑结构;而首层SVM分类器主要选择惩罚系数C为10的高斯核,第二次分类器主要采用惩罚系数为1的高斯核。在确定各分类器开关门特征及整体特征之后,对地铁门正常状态、I类亚健康状态、II类亚健康状态进行识别判断。最终得出:总训练集合数据320个,测试集数据318个,依据车门开门数据、关门特征数据进行识别分析,首层I类亚健康整体特征识别结果正确率在99.9%以上;二层II类亚健康及正常状态识别率在99.0%左右,整体准确度较高(如图2所示)。

总结:

综上所述,利用基于Time Series数据挖掘的地铁门电机亚健康状态识别模型,可以有效识别地铁门亚健康状态(全品论文无任何数据支撑,怎么体现有效识别车门亚健康状态,没有论证依据)。在实际应用过程中,可以根据地铁门结构特征及运行环境数据,综合利用多尺度滑动窗口、ESAX字符化算法,将地铁门数据转化为字符形式。在获得Time Series数据挖掘后均值点、极值点之后,从两个层次挖掘地铁车门开启闭合时刻多阶段信息,以提高地铁门亚健康状态鉴识准确度。

参考文献:

[1]兰贞,李得伟. 基于事故数据挖掘的地铁应急维修人员分配策略研究[J]. 铁路计算机应用,2016,25(9):58-62.

论文作者:张峰

论文发表刊物:《基层建设》2019年第32期

论文发表时间:2020/4/7

标签:;  ;  ;  ;  ;  ;  ;  ;  

基于时间序列数据挖掘的地铁车门亚健康状态识别方法论文_张峰
下载Doc文档

猜你喜欢