CN105184084B - 一种电力计量自动化终端故障类型预测方法和系统 - Google Patents

一种电力计量自动化终端故障类型预测方法和系统 Download PDF

Info

Publication number
CN105184084B
CN105184084B CN201510583028.7A CN201510583028A CN105184084B CN 105184084 B CN105184084 B CN 105184084B CN 201510583028 A CN201510583028 A CN 201510583028A CN 105184084 B CN105184084 B CN 105184084B
Authority
CN
China
Prior art keywords
sample
feature
characteristic
prediction
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510583028.7A
Other languages
English (en)
Other versions
CN105184084A (zh
Inventor
王少锋
刘涛
伍少成
刘洋
李鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Power Supply Co ltd
Original Assignee
Shenzhen Power Supply Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Power Supply Co ltd filed Critical Shenzhen Power Supply Co ltd
Priority to CN201510583028.7A priority Critical patent/CN105184084B/zh
Publication of CN105184084A publication Critical patent/CN105184084A/zh
Application granted granted Critical
Publication of CN105184084B publication Critical patent/CN105184084B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供一种电力计量自动化终端故障类型预测方法,该方法为首先在终端中选取特征样本及其对应的历史通信数据,且通过初始特征向量得到由各特征样本特征向量值形成的特征样本库,并进行K‑means聚类运算,在初始特征向量中筛选出新特征向量;其次,将已确定故障类型的终端作为训练样本,根据新特征向量,构建训练样本库;最后,将未确定故障类型的终端作为预测样本,根据新特征向量,得到各预测样本的特征向量值,且与训练样本库中进行欧氏距离计算,得到各预测样本在训练样本库中满足条件下训练样本故障类型及数量,并将各预测样本故障类型数量最大的作为其预测的故障类型。实施本发明,能提高终端故障预测的准确性,还能准确定位终端故障类型。

Description

一种电力计量自动化终端故障类型预测方法和系统
技术领域
本发明涉及电力计量自动化终端技术领域,尤其涉及一种电力计量自动化终端故障类型预测方法和系统。
背景技术
随着电力系统规模的不断扩大和结构的日益复杂化,越来越多的自动装置应用到电力系统。一旦电网发生故障,由于各级自动装置产生的大量报警信息将会快速地涌入电力系统调度中心,使得调度员无法在短时间内迅速判断出故障原因,从而会给电网正常运行带来严重的安全隐患和巨大的经济损失,因此及时排除故障对于电网安全经济运行来说具有重大的意义。
现有技术中,电力计量自动化终端通过公网与服务中心连接,但其采集到的用电情况等数据的传输受到通信故障、停电等问题的影响,因此故障预测及其对应的类型分析具有重要意义。目前,应用较为广泛的故障诊断方法包括:专家系统、人工神经网络、贝叶斯网络、优化技术、支持向量机、Petri网络、模糊集理论、粗糙集理论和多代理技术等,但是在实际的应用中,由于上述方法应用困难和准确性不足等原因,造成人工发现故障再实地排查解决的情况还很普遍。
发明内容
本发明实施例所要解决的技术问题在于,提供一种电力计量自动化终端故障类型预测方法和系统,不仅能够提高终端故障预测的准确性,还能够准确定位终端故障的类型。
为了解决上述技术问题,本发明实施例提供了一种电力计量自动化终端故障类型预测方法,所述方法包括:
S1、从故障终端和正常终端中,分别选择一定数量作为特征样本,并获取各特征样本的历史通信数据;
S2、设置初始特征向量的维度及其对应的变量,且根据所述设置的变量,在所述获取到的各特征样本的历史通信数据中,得到各特征样本的特征向量值及其形成的特征样本库,并对所述形成的特征样本库进行K-means聚类运算,进一步筛选出聚类运算后满足第一预设条件的数据及其对应的变量,得到由所述筛选出的变量形成的新特征向量;
S3、将已确定故障类型的终端作为训练样本,且获取各训练样本的历史通信数据,并根据所述得到的新特征向量,在所述获取到的各训练样本的历史通信数据中,得到各训练样本的特征向量值,以及由所述得到的各训练样本的特征向量值形成的训练样本库;
S4、将未确定故障类型的终端作为预测样本,且获取各预测样本的历史通信数据,并根据所述得到的新特征向量,在所述获取到的各预测样本的历史通信数据中,得到各预测样本的特征向量值;
S5、将所述得到的各预测样本的特征向量值依次分别与所述训练样本库中所有特征向量值进行欧氏距离计算,得到各预测样本所计算出的欧氏距离值满足第二预设条件下其分别对应在所述训练样本库中获取到的训练样本及训练样本的故障类型,且对各预测样本分别统计出其所获取到的训练样本对应每一故障类型的数量,并将各预测样本各自统计的数量最大值对应的故障类型作为其预测的故障类型;
其中,所述步骤S2的具体步骤包括:
确定所述初始特征向量为15维特征向量,并设置每一维度对应的变量;其中,所述变量包括发送字节的均值、接收字节的均值、重连次数的均值、数据流量的均值、报警流量的均值、心跳流量的均值、在线时间的均值、发送字节超过阈值的次数、接收字节超过阈值的次数、重连次数超过阈值的次数、数据流量超过阈值的次数、报警流量超过阈值的次数、心跳流量超过阈值的次数、在线时间超过阈值的次数和接收字节的方差;
在所述获取到的各特征样本历史通信数据中,选取一定时间范围,且根据所述设置的各个变量,在所选的一定时间范围内对各特征样本的特征向量赋值,得到各特征样本的特征向量值,并进一步将所述得到的各特征样本的特征向量值组合成特征样本库;
对所述形成的特征样本库分为K个类别进行K-means聚类运算,得到由K个特征样本的特征向量值作为质心形成的质心向量集,并根据所述得到的质心向量集,计算出所述特征向量每一维度对应的方差;K为大于1的自然数;
将所述计算出的每一维度对应的方差按照从大到小进行排序,筛选出前N个方差对应的维度,且确定所述筛选出的各维度对应的变量,并将所述确定的各维度对应的变量形成维度为N的新特征向量;其中,1<N<15,且为整数;
其中,在所述获取到的各特征样本历史通信数据中,选取一定时间范围,且根据所述设置的各个变量,在所选的一定时间范围内对各特征样本的特征向量赋值,得到各特征样本的特征向量值,并进一步将所述得到的各特征样本的特征向量值组合成特征样本库的具体步骤包括:
当获取到当前特征样本为正常终端时,从所述获取到的各特征样本历史通信数据中,得到当前特征样本在所选一定时间范围内的数据,并在所述得到的数据中随机选取多天完整数据,且根据所述设置的各个变量,得到当前特征样本为正常终端时的特征向量值;
当获取到当前特征样本为故障终端时,确定当前特征样本在所选一定时间范围内的最后在线时间,并以所述确定的最后在线时间为起点,按时间反序方式在所选一定时间范围的数据中选取多天完整数据,且根据所述设置的各个变量,得到当前特征样本为故障终端时的特征向量值;
将所述当前特征样本为正常终端及所述当前特征样本为故障终端时的特征向量值组合,形成所述特征样本库。
其中,所述K为6,N为10。
其中,所述步骤S5的具体步骤包括:
将所述得到的各预测样本的特征向量值依次分别与所述训练样本库中所有特征向量值进行欧氏距离计算,得到各预测样本对应于所述训练样本库分别形成的欧氏距离值集;
针对每一预测样本,均统计出其对应得到的欧氏距离值集中最小的M个欧氏距离值以及所述得到的M个欧氏距离值在所述特征样本库中对应的训练样本,且进一步均统计出其对应得到的M个训练样本中每一故障类型的数量;其中,M为正奇数;
检测出每一预测样本各自对应M个样本中故障类型数量的最大值,并将各预测样本各自检测出的最大值对应的故障类型作为其预测的故障类型。
其中,所述M=2J+1;其中,J为所述训练样本库中故障类型的种类数。
其中,所述方法进一步包括:
根据各预测样本各自统计出其所获取到的训练样本对应每一故障类型的数量,在每一预测样本中,均按照故障类型数量从大到小的方式进行排序,并作为各预测样本故障类型预测的优先顺序。
本发明实施例还提供了一种电力计量自动化终端故障类型预测系统,所述系统包括:
历史数据获取单元,用于从故障终端和正常终端中,分别选择一定数量作为特征样本,并获取各特征样本的历史通信数据;
特征向量维度提取单元,用于设置特征向量的维度及其对应的变量,且根据所述设置的变量,在所述获取到的各特征样本的历史通信数据中,得到各特征样本的特征向量值及其形成的特征样本库,并对所述形成的特征样本库进行K-means聚类运算,进一步筛选出聚类运算后满足第一预设条件的数据及其对应的变量,得到由所述筛选出的变量形成的新特征向量;
训练样本构建单元,用于将已确定故障类型的终端作为训练样本,且获取各训练样本的历史通信数据,并根据所述得到的新特征向量,在所述获取到的各训练样本的历史通信数据中,得到各训练样本的特征向量值,以及由所述得到的各训练样本的特征向量值形成的训练样本库;
预测样本构建单元,用于将未确定故障类型的终端作为预测样本,且获取各预测样本的历史通信数据,并根据所述得到的新特征向量,在所述获取到的各预测样本的历史通信数据中,得到各预测样本的特征向量值;
预测样本故障类型预测单元,用于将所述得到的各预测样本的特征向量值依次分别与所述训练样本库中所有特征向量值进行欧氏距离计算,得到各预测样本所计算出的欧氏距离值满足第二预设条件下其分别对应在所述训练样本库中获取到的训练样本及训练样本的故障类型,且对各预测样本分别统计出其所获取到的训练样本对应每一故障类型的数量,并将各预测样本各自统计的数量最大值对应的故障类型作为其预测的故障类型;
其中,所述特征向量维度提取单元包括:
特征变量设置模块,用于确定所述初始特征向量为15维特征向量,并设置每一维度对应的变量;其中,所述变量包括发送字节的均值、接收字节的均值、重连次数的均值、数据流量的均值、报警流量的均值、心跳流量的均值、在线时间的均值、发送字节超过阈值的次数、接收字节超过阈值的次数、重连次数超过阈值的次数、数据流量超过阈值的次数、报警流量超过阈值的次数、心跳流量超过阈值的次数、在线时间超过阈值的次数和接收字节的方差;
特征样本库形成模块,用于在所述获取到的各特征样本历史通信数据中,选取一定时间范围,且根据所述设置的各个变量,在所选的一定时间范围内对各特征样本的特征向量赋值,得到各特征样本的特征向量值,并进一步将所述得到的各特征样本的特征向量值组合成特征样本库;
方差计算模块,用于对所述形成的特征样本库分为K个类别进行K-means聚类运算,得到由K个特征样本的特征向量值作为质心形成的质心向量集,并根据所述得到的质心向量集,计算出所述特征向量每一维度对应的方差;K为大于1的自然数;
新特征向量形成模块,用于将所述计算出的每一维度对应的方差按照从大到小进行排序,筛选出前N个方差对应的维度,且确定所述筛选出的各维度对应的变量,并将所述确定的各维度对应的变量形成维度为N的新特征向量;其中,1<N<15,且为整数;
其中,特征样本库形成模块包括:
第一获取特征样本子模块,用于当获取到当前特征样本为正常终端时,从所述获取到的各特征样本历史通信数据中,得到当前特征样本在所选一定时间范围内的数据,并在所述得到的数据中随机选取多天完整数据,且根据所述设置的各个变量,得到当前特征样本为正常终端时的特征向量值;
第二获取特征样本子模块,用于当获取到当前特征样本为故障终端时,确定当前特征样本在所选一定时间范围内的最后在线时间,并以所述确定的最后在线时间为起点,按时间反序方式在所选一定时间范围的数据中选取多天完整数据,且根据所述设置的各个变量,得到当前特征样本为故障终端时的特征向量值;
特征样本组合子模块,用于将所述当前特征样本为正常终端及所述当前特征样本为故障终端时的特征向量值组合,形成所述特征样本库。
实施本发明实施例,具有如下有益效果:
在本发明实施例中,由于通过分析终端通信流量特征,构建出特征样本库,并基于K-means聚类算法从初始特征向量中筛选出特征差异,形成新特征向量,且根据新特征向量,基于K最近邻算法预测故障终端(即预测样本)的故障类型,从故障数据中分类出故障的原因,为故障终端的维修提供指引,因此不仅能够提高终端故障预测的准确性,还能够准确定位终端故障的类型。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,根据这些附图获得其他的附图仍属于本发明的范畴。
图1为本发明实施例提供的一种电力计量自动化终端故障类型预测方法的流程图;
图2为本发明实施例提供的一种电力计量自动化终端故障类型预测系统的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
如图1所示,为本发明实施例提供的一种电力计量自动化终端故障类型预测方法,所述方法包括:
步骤S1、从故障终端和正常终端中,分别选择一定数量作为特征样本,并获取各特征样本的历史通信数据;
步骤S2、设置初始特征向量的维度及其对应的变量,且根据所述设置的变量,在所述获取到的各特征样本的历史通信数据中,得到各特征样本的特征向量值及其形成的特征样本库,并对所述形成的特征样本库进行K-means聚类运算,进一步筛选出聚类运算后满足第一预设条件的数据及其对应的变量,得到由所述筛选出的变量形成的新特征向量;
具体过程为,步骤S21、确定初始特征向量为15维特征向量,并设置每一维度对应的变量;其中,变量包括发送字节的均值、接收字节的均值、重连次数的均值、数据流量的均值、报警流量的均值、心跳流量的均值、在线时间的均值、发送字节超过阈值的次数、接收字节超过阈值的次数、重连次数超过阈值的次数、数据流量超过阈值的次数、报警流量超过阈值的次数、心跳流量超过阈值的次数、在线时间超过阈值的次数和接收字节的方差;
步骤S22、在获取到的各特征样本历史通信数据中,选取一定时间范围,且根据设置的各个变量,在所选的一定时间范围内对各特征样本的特征向量赋值,得到各特征样本的特征向量值,并进一步将得到的各特征样本的特征向量值组合成特征样本库;
在本发明实施例中,步骤S22进一步包括:
当获取到当前特征样本为正常终端时,从获取到的各特征样本历史通信数据中,得到当前特征样本在所选一定时间范围内的数据,并在得到的数据中随机选取多天完整数据,且根据设置的各个变量,得到当前特征样本为正常终端时的特征向量值;
当获取到当前特征样本为故障终端时,确定当前特征样本在所选一定时间范围内的最后在线时间,并以确定的最后在线时间为起点,按时间反序方式在所选一定时间范围的数据中选取多天完整数据,且根据设置的各个变量,得到当前特征样本为故障终端时的特征向量值;
将当前特征样本为正常终端及当前特征样本为故障终端时的特征向量值组合,形成特征样本库。
步骤S23、对形成的特征样本库分为K个类别进行K-means聚类运算,得到由K个特征样本的特征向量值作为质心形成的质心向量集,并根据得到的质心向量集,计算出特征向量每一维度对应的方差;K为大于1的自然数;
步骤S24、将计算出的每一维度对应的方差按照从大到小进行排序,筛选出前N个方差对应的维度,且确定筛选出的各维度对应的变量,并将确定的各维度对应的变量形成维度为N的新特征向量;其中,1<N<15,且为整数。
在一个实施例中,K为6,N为10。
步骤S3、将已确定故障类型的终端作为训练样本,且获取各训练样本的历史通信数据,并根据所述得到的新特征向量,在所述获取到的各训练样本的历史通信数据中,得到各训练样本的特征向量值,以及由所述得到的各训练样本的特征向量值形成的训练样本库;
步骤S4、将未确定故障类型的终端作为预测样本,且获取各预测样本的历史通信数据,并根据所述得到的新特征向量,在所述获取到的各预测样本的历史通信数据中,得到各预测样本的特征向量值;
步骤S5、将所述得到的各预测样本的特征向量值依次分别与所述训练样本库中所有特征向量值进行欧氏距离计算,得到各预测样本所计算出的欧氏距离值满足第二预设条件下其分别对应在所述训练样本库中获取到的训练样本及训练样本的故障类型,且对各预测样本分别统计出其所获取到的训练样本对应每一故障类型的数量,并将各预测样本各自统计的数量最大值对应的故障类型作为其预测的故障类型。
具体过程为,步骤S51、将得到的各预测样本的特征向量值依次分别与所述训练样本库中所有特征向量值进行欧氏距离计算,得到各预测样本对应于所述训练样本库分别形成的欧氏距离值集;
在本发明实施例中,依次计算出各预测样本的特征向量值与训练样本库中所有特征向量值的欧氏距离值,距离的计算方法如公式(1)所示,距离D表示预测样本的特征向量值X和训练样本库中一特征向量值S的欧氏距离值,其中X和S维度相同为N:
式(1)中,x1、x2、...xN为预测样本的特征向量值X的N维度值;s1、s2、...sN为训练样本库中一特征向量值S的N维度值。
步骤S52、针对每一预测样本,均统计出其对应得到的欧氏距离值集中最小的M个欧氏距离值以及得到的M个欧氏距离值在特征样本库中对应的训练样本,且进一步均统计出其对应得到的M个训练样本中每一故障类型的数量;其中,M为正奇数;
在本发明实施例中,针对每一预测样本,均取训练样本库中距离当前预测样本的特征向量值X最近的M个特征向量值,并根据这M个特征向量值对应的故障类型(如记为标签1、2、3、4等),统计不同故障类型的数量,即标签1、2、3、4等在M个中分别对应的数量。当然为了尽量避免不同故障类型的数量均同,因此M取正奇数。
在一个实施例中,M=2J+1;其中,J为训练样本库中故障类型的种类数。
步骤S53、检测出每一预测样本各自对应M个样本中故障类型数量的最大值,并将各预测样本各自检测出的最大值对应的故障类型作为其预测的故障类型。
在本发明实施例中,在各预测样本中确定不同故障类型的数量中数量最多的故障类型,即确定标签1至J中数量最大值,并将该数量最大对应的故障类型作为各预测样本各自对应预测的故障类型。
在一个实施例中,第i个预测样本中得到标签1的数量为a1、标签2的数量为a2、…标签J的数量为aJ;其中,J为标签种类数(即故障类型种类数);假设在标签1至J中标签K的数量ak为最大值,则标签K对应的故障类型为第i个预测样本预测的故障类型。
为了给故障排查人员实地检查提供指导作用,对于预测样本的故障类型,因尽可能的提供多种判断评估,因此所述方法进一步包括:
根据各预测样本各自统计出其所获取到的训练样本对应每一故障类型的数量,在每一预测样本中,均按照故障类型数量从大到小的方式进行排序,并作为各预测样本故障类型预测的优先顺序。
在一个实施例中,第i个预测样本中得到标签1的数量为a1、标签2的数量为a2、…标签J的数量为aJ;其中,J为标签种类数(即故障类型种类数);将标签1至J中各标签的数量按照从大到小排序,如A={ak、ak-1、ak+1、aJ…a1},并将排序后的A作为第i个预测样本故障类型预测的优先顺序。
对本发明实施例提供的一种电力计量自动化终端故障类型预测方法的应用场景进行说明,具体实现步骤如下:
(1)首先,确定特征样本以及特征样本的历史通信数据:特征样本的历史通信数据由终端通信工况表和现场运维情况表形成,该现场运维情况表主要用来记录故障终端的维修状态。
a、通信工况表是用来反应每个终端每天的通信状态相关数据,所包含的具体内容如表1所示:
表1
应当说明的是,每个终端每天都有一条对应的数据,反应当天的通信情况,如果出现故障,可能导致某一天的数据没有传到数据中心,使得数据库中没有相应记录;在线时间是每分钟统计1次,每天统计1440次,如果数值为1440表示24小时均在线。
b、现场运维情况表是运维人员对故障终端的一个维修、检查的结果,包括终端信息和故障信息两大部分的内容,每条记录所包含的具体内容如表2所示:
表2
应当说明的是,每次运维就会产生一条记录,本发明实施例只使用上表2中的部分数据,包括终端地址、终端最后在线时间、故障类型三个。
c、对于上述特征样本的历史数据,需要确定特征样本的数据是否完整,如现场运维情况表中,特征样本地址、特征样本最后在线时间、故障类型这三个中任意一个有缺失,则为不完整数据;如终端通信工况表中,某一天的样本数据均为0,则为不完整数据。
d、对于特征样本为正常终端时,需要找到数据没有缺失,同时不出现在现场运维记录中的点,日期可以随机选取,但是要尽量均匀分布,不可以都选择同一天,如从测试时间起,该终端的过去15天范围内的历史通信数据。
e、对于特征样本为故障终端时,以该特征样本最后在线时间为起点,按时间反序方式在所选一定时间范围的数据中选取多天完整数据,如终端地址为02140139,终端最后在先时间为2012年11月30日,则从全部的通信工况数据中,获取该终端2012年11月16日到2012年11月30日共15天的数据。
(2)其次,设置初始特征向量的维度及其对应的变量,构建特征样本库:
a、对于所有特征样本来说,获取15天的历史通信数据,该数据特征包括均值、方差和波动次数(即超过阈值的次数)。
通过对表1中,发送字节、接收字节、重连次数、数据流量、报警流量、心跳流量和在线时间7个内容,分别获得其均值和波动次数,以及接收字节的方差,最终组成一个15维的特征向量,即包括发送字节的均值、接收字节的均值、重连次数的均值、数据流量的均值、报警流量的均值、心跳流量的均值、在线时间的均值、发送字节超过阈值的次数、接收字节超过阈值的次数、重连次数超过阈值的次数、数据流量超过阈值的次数、报警流量超过阈值的次数、心跳流量超过阈值的次数、在线时间超过阈值的次数和接收字节的方差。
应当说明的是,计算方差时,由于发送字节数值较大,需要将15天的每个数值除以10000再进行计算,得到数值比较合理的方差;波动次数的计算方法,以发送字节的波动次数为例:先由表1中15天的数据计算出发送字节的均值FA,设定阈值上限为FA*1.1,下限为FA*0.9,波动次数就是发送字节15天的数据中,超过上述范围的次数。
b、对各特征样本的特征向量值均进行归一化和加权,即对各特征样本的特征向量值的15维分别除以一个数值,使其结果在1附近。先从特征样本对应的数据中得到发送字节、接收字节、重连次数、数据流量、报警流量、心跳流量和在线时间这七个数据的均值,然后对该特征样本中的前7维均值数据,分别除以相应的均值,对于最后7维波动次数,均除以10;再对归一化后的特征向量值进行加权,对15数据分别对应乘上一个系数进行加权。本发明实施例使用的系数分别是0.5,0.4,0.6,0.2,0.8,1.0,2.5,1.0,0.5,0.9,0.5,0.5,0.5,0.8,1.2。
c、将各特征样本的15维特征向量值组合成特征样本库,具体如下表3所示:
表3
(3)接着,对上表3形成的特征样本库分为K=6个类别进行K-means聚类运算,得到由K=6个特征样本的特征向量值作为质心形成的质心向量集,如下表4所示:
表4
(4)对上表4的质心向量集,计算出每一维度对应的方差(如下表5所示),该方差按照从大到小进行排序(如下表6所示),筛选出前10个方差对应的维度及其对应的变量,形成维度为N=10的新特征向量(如下表7所示),:
表5
表6
表7
(5)再次,选择已确定故障类型的故障终端,其中,故障终端的故障类型,如下表8所示。
对于已确定故障类型的故障终端,采用与步骤(1)相同的方式获取训练样本的历史通信数据,并采用上表7形成的N=10维的新特征向量及与步骤(2)相同的方式,得到训练样本的特征向量值以及得到由训练样本的特征向量值形成的训练样本库,上述过程在此不再一一赘述。其中,训练样本库如下表9所示,该训练样本的标签与故障类型相对应。
表8
故障类型 错误原因
1 SIM卡或天线问题
2 销户、装置拆除、报停
3 自行恢复
4 终端硬软件故障
5 停电
6 485错误
表9
(6)然后,选择已未确定故障类型的故障终端,采用与上述步骤(5)相同的方式,得到预测样本的特征向量值,在此不再一一赘述。
(7)最后,依次计算出各预测样本的特征向量值与训练样本库中所有特征向量值的欧氏距离值,距离的计算方法如公式(1)所示,距离D表示预测样本的特征向量值X和训练样本库中一特征向量值S的欧氏距离值,其中X和S维度相同为N=10,即
针对每一预测样本,均取训练样本库中距离当前预测样本的特征向量值X最近的M=13个特征向量值,并根据这13个特征向量值对应的故障类型(如记为标签1至标签6),统计不同故障类型的数量,即标签1至标签6在这13个中分别对应的数量;
在各预测样本中确定不同故障类型的数量中数量最多的故障类型,即确定标签1至6中数量最大值,并将该数量最大对应的故障类型作为各预测样本各自对应预测的故障类型。
例如,在第7个预测样本中得到的标签总数为13,标签1至标签6的数量依次分别为2、1、1、3、5和1,则确定标签5的数量最大,使得标签5对应的故障类型作为第7个预测样本预测的故障类型,即通过查上表8可知,第7个预测样本预测的故障类型为---停电。
为了给故障排查人员实地检查提供指导作用,对于预测样本的故障类型,因尽可能的提供多种判断评估,根据各预测样本各自统计出其所获取到的训练样本对应每一故障类型的数量,在每一预测样本中,均按照故障类型数量从大到小的方式进行排序,并作为各预测样本故障类型预测的优先顺序。
例如,将第7个预测样本中得到的标签进行从大到小排序,为5、3、2、1、1和1,可将该排序后的标签对应的故障类型作为第7个预测样本预测的优先顺序,即停电>终端硬软件故障>SIM卡或天线问题>销户、装置拆除、报停>自行恢复>485错误,故障排查人员可根据上述故障类型排序进行排查。
如图2所示,为本发明实施例中,提供的一种电力计量自动化终端故障类型预测系统,所述系统包括:
历史数据获取单元210,用于从故障终端和正常终端中,分别选择一定数量作为特征样本,并获取各特征样本的历史通信数据;
特征向量维度提取单元220,用于设置特征向量的维度及其对应的变量,且根据所述设置的变量,在所述获取到的各特征样本的历史通信数据中,得到各特征样本的特征向量值及其形成的特征样本库,并对所述形成的特征样本库进行K-means聚类运算,进一步筛选出聚类运算后满足第一预设条件的数据及其对应的变量,得到由所述筛选出的变量形成的新特征向量;
训练样本构建单元230,用于将已确定故障类型的终端作为训练样本,且获取各训练样本的历史通信数据,并根据所述得到的新特征向量,在所述获取到的各训练样本的历史通信数据中,得到各训练样本的特征向量值,以及由所述得到的各训练样本的特征向量值形成的训练样本库;
预测样本构建单元240,用于将未确定故障类型的终端作为预测样本,且获取各预测样本的历史通信数据,并根据所述得到的新特征向量,在所述获取到的各预测样本的历史通信数据中,得到各预测样本的特征向量值;
预测样本故障类型预测单元250,用于将所述得到的各预测样本的特征向量值依次分别与所述训练样本库中所有特征向量值进行欧氏距离计算,得到各预测样本所计算出的欧氏距离值满足第二预设条件下其分别对应在所述训练样本库中获取到的训练样本及训练样本的故障类型,且对各预测样本分别统计出其所获取到的训练样本对应每一故障类型的数量,并将各预测样本各自统计的数量最大值对应的故障类型作为其预测的故障类型。
实施本发明实施例,具有如下有益效果:
在本发明实施例中,由于通过分析终端通信流量特征,构建出特征样本库,并基于K-means聚类算法从初始特征向量中筛选出特征差异,形成新特征向量,且根据新特征向量,基于K最近邻算法预测故障终端(即预测样本)的故障类型,从故障数据中分类出故障的原因,为故障终端的维修提供指引,因此不仅能够提高终端故障预测的准确性,还能够准确定位终端故障的类型。
值得注意的是,上述系统实施例中,所包括的各个系统单元只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如ROM/RAM、磁盘、光盘等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (6)

1.一种电力计量自动化终端故障类型预测方法,其特征在于,所述方法包括:
S1、从故障终端和正常终端中,分别选择一定数量作为特征样本,并获取各特征样本的历史通信数据;
S2、设置初始特征向量的维度及其对应的变量,且根据所述设置的变量,在所述获取到的各特征样本的历史通信数据中,得到各特征样本的特征向量值及其形成的特征样本库,并对所述形成的特征样本库进行K-means聚类运算,进一步筛选出聚类运算后满足第一预设条件的数据及其对应的变量,得到由所述筛选出的变量形成的新特征向量;
S3、将已确定故障类型的终端作为训练样本,且获取各训练样本的历史通信数据,并根据所述得到的新特征向量,在所述获取到的各训练样本的历史通信数据中,得到各训练样本的特征向量值,以及由所述得到的各训练样本的特征向量值形成的训练样本库;
S4、将未确定故障类型的终端作为预测样本,且获取各预测样本的历史通信数据,并根据所述得到的新特征向量,在所述获取到的各预测样本的历史通信数据中,得到各预测样本的特征向量值;
S5、将所述得到的各预测样本的特征向量值依次分别与所述训练样本库中所有特征向量值进行欧氏距离计算,得到各预测样本所计算出的欧氏距离值满足第二预设条件下其分别对应在所述训练样本库中获取到的训练样本及训练样本的故障类型,且对各预测样本分别统计出其所获取到的训练样本对应每一故障类型的数量,并将各预测样本各自统计的数量最大值对应的故障类型作为其预测的故障类型;
其中,所述步骤S2的具体步骤包括:
确定所述初始特征向量为15维特征向量,并设置每一维度对应的变量;其中,所述变量包括发送字节的均值、接收字节的均值、重连次数的均值、数据流量的均值、报警流量的均值、心跳流量的均值、在线时间的均值、发送字节超过阈值的次数、接收字节超过阈值的次数、重连次数超过阈值的次数、数据流量超过阈值的次数、报警流量超过阈值的次数、心跳流量超过阈值的次数、在线时间超过阈值的次数和接收字节的方差;
在所述获取到的各特征样本历史通信数据中,选取一定时间范围,且根据所述设置的各个变量,在所选的一定时间范围内对各特征样本的特征向量赋值,得到各特征样本的特征向量值,并进一步将所述得到的各特征样本的特征向量值组合成特征样本库;
对所述形成的特征样本库分为K个类别进行K-means聚类运算,得到由K个特征样本的特征向量值作为质心形成的质心向量集,并根据所述得到的质心向量集,计算出所述特征向量每一维度对应的方差;K为大于1的自然数;
将所述计算出的每一维度对应的方差按照从大到小进行排序,筛选出前N个方差对应的维度,且确定所述筛选出的各维度对应的变量,并将所述确定的各维度对应的变量形成维度为N的新特征向量;其中,1<N<15,且为整数;
其中,在所述获取到的各特征样本历史通信数据中,选取一定时间范围,且根据所述设置的各个变量,在所选的一定时间范围内对各特征样本的特征向量赋值,得到各特征样本的特征向量值,并进一步将所述得到的各特征样本的特征向量值组合成特征样本库的具体步骤包括:
当获取到当前特征样本为正常终端时,从所述获取到的各特征样本历史通信数据中,得到当前特征样本在所选一定时间范围内的数据,并在所述得到的数据中随机选取多天完整数据,且根据所述设置的各个变量,得到当前特征样本为正常终端时的特征向量值;
当获取到当前特征样本为故障终端时,确定当前特征样本在所选一定时间范围内的最后在线时间,并以所述确定的最后在线时间为起点,按时间反序方式在所选一定时间范围的数据中选取多天完整数据,且根据所述设置的各个变量,得到当前特征样本为故障终端时的特征向量值;
将所述当前特征样本为正常终端及所述当前特征样本为故障终端时的特征向量值组合,形成所述特征样本库。
2.如权利要求1所述的方法,其特征在于,所述K为6,N为10。
3.如权利要求1所述的方法,其特征在于,所述步骤S5的具体步骤包括:
将所述得到的各预测样本的特征向量值依次分别与所述训练样本库中所有特征向量值进行欧氏距离计算,得到各预测样本对应于所述训练样本库分别形成的欧氏距离值集;
针对每一预测样本,均统计出其对应得到的欧氏距离值集中最小的M个欧氏距离值以及所述得到的M个欧氏距离值在所述特征样本库中对应的训练样本,且进一步均统计出其对应得到的M个训练样本中每一故障类型的数量;其中,M为正奇数;
检测出每一预测样本各自对应M个样本中故障类型数量的最大值,并将各预测样本各自检测出的最大值对应的故障类型作为其预测的故障类型。
4.如权利要求3所述的方法,其特征在于,所述M=2J+1;其中,J为所述训练样本库中故障类型的种类数。
5.如权利要求1所述的方法,其特征在于,所述方法进一步包括:
根据各预测样本各自统计出其所获取到的训练样本对应每一故障类型的数量,在每一预测样本中,均按照故障类型数量从大到小的方式进行排序,并作为各预测样本故障类型预测的优先顺序。
6.一种电力计量自动化终端故障类型预测系统,其特征在于,所述系统包括:
历史数据获取单元,用于从故障终端和正常终端中,分别选择一定数量作为特征样本,并获取各特征样本的历史通信数据;
特征向量维度提取单元,用于设置初始特征向量的维度及其对应的变量,且根据所述设置的变量,在所述获取到的各特征样本的历史通信数据中,得到各特征样本的特征向量值及其形成的特征样本库,并对所述形成的特征样本库进行K-means聚类运算,进一步筛选出聚类运算后满足第一预设条件的数据及其对应的变量,得到由所述筛选出的变量形成的新特征向量;
训练样本构建单元,用于将已确定故障类型的终端作为训练样本,且获取各训练样本的历史通信数据,并根据所述得到的新特征向量,在所述获取到的各训练样本的历史通信数据中,得到各训练样本的特征向量值,以及由所述得到的各训练样本的特征向量值形成的训练样本库;
预测样本构建单元,用于将未确定故障类型的终端作为预测样本,且获取各预测样本的历史通信数据,并根据所述得到的新特征向量,在所述获取到的各预测样本的历史通信数据中,得到各预测样本的特征向量值;
预测样本故障类型预测单元,用于将所述得到的各预测样本的特征向量值依次分别与所述训练样本库中所有特征向量值进行欧氏距离计算,得到各预测样本所计算出的欧氏距离值满足第二预设条件下其分别对应在所述训练样本库中获取到的训练样本及训练样本的故障类型,且对各预测样本分别统计出其所获取到的训练样本对应每一故障类型的数量,并将各预测样本各自统计的数量最大值对应的故障类型作为其预测的故障类型;
其中,所述特征向量维度提取单元包括:
特征变量设置模块,用于确定所述初始特征向量为15维特征向量,并设置每一维度对应的变量;其中,所述变量包括发送字节的均值、接收字节的均值、重连次数的均值、数据流量的均值、报警流量的均值、心跳流量的均值、在线时间的均值、发送字节超过阈值的次数、接收字节超过阈值的次数、重连次数超过阈值的次数、数据流量超过阈值的次数、报警流量超过阈值的次数、心跳流量超过阈值的次数、在线时间超过阈值的次数和接收字节的方差;
特征样本库形成模块,用于在所述获取到的各特征样本历史通信数据中,选取一定时间范围,且根据所述设置的各个变量,在所选的一定时间范围内对各特征样本的特征向量赋值,得到各特征样本的特征向量值,并进一步将所述得到的各特征样本的特征向量值组合成特征样本库;
方差计算模块,用于对所述形成的特征样本库分为K个类别进行K-means聚类运算,得到由K个特征样本的特征向量值作为质心形成的质心向量集,并根据所述得到的质心向量集,计算出所述特征向量每一维度对应的方差;K为大于1的自然数;
新特征向量形成模块,用于将所述计算出的每一维度对应的方差按照从大到小进行排序,筛选出前N个方差对应的维度,且确定所述筛选出的各维度对应的变量,并将所述确定的各维度对应的变量形成维度为N的新特征向量;其中,1<N<15,且为整数;
其中,特征样本库形成模块包括:
第一获取特征样本子模块,用于当获取到当前特征样本为正常终端时,从所述获取到的各特征样本历史通信数据中,得到当前特征样本在所选一定时间范围内的数据,并在所述得到的数据中随机选取多天完整数据,且根据所述设置的各个变量,得到当前特征样本为正常终端时的特征向量值;
第二获取特征样本子模块,用于当获取到当前特征样本为故障终端时,确定当前特征样本在所选一定时间范围内的最后在线时间,并以所述确定的最后在线时间为起点,按时间反序方式在所选一定时间范围的数据中选取多天完整数据,且根据所述设置的各个变量,得到当前特征样本为故障终端时的特征向量值;
特征样本组合子模块,用于将所述当前特征样本为正常终端及所述当前特征样本为故障终端时的特征向量值组合,形成所述特征样本库。
CN201510583028.7A 2015-09-14 2015-09-14 一种电力计量自动化终端故障类型预测方法和系统 Active CN105184084B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510583028.7A CN105184084B (zh) 2015-09-14 2015-09-14 一种电力计量自动化终端故障类型预测方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510583028.7A CN105184084B (zh) 2015-09-14 2015-09-14 一种电力计量自动化终端故障类型预测方法和系统

Publications (2)

Publication Number Publication Date
CN105184084A CN105184084A (zh) 2015-12-23
CN105184084B true CN105184084B (zh) 2018-05-01

Family

ID=54906162

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510583028.7A Active CN105184084B (zh) 2015-09-14 2015-09-14 一种电力计量自动化终端故障类型预测方法和系统

Country Status (1)

Country Link
CN (1) CN105184084B (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106599138A (zh) * 2016-12-05 2017-04-26 南京信息工程大学 一种用电器种类识别方法
CN107228913B (zh) * 2017-06-09 2023-08-08 广西电网有限责任公司电力科学研究院 一种变压器故障类型的状态诊断系统
CN107197473B (zh) * 2017-06-15 2020-05-15 三星电子(中国)研发中心 一种终端异常状态确定方法和装置
CN107817404B (zh) * 2017-11-18 2023-06-20 广西电网有限责任公司电力科学研究院 一种便携式计量自动化终端故障诊断装置及其诊断方法
CN109214527B (zh) * 2018-08-09 2020-10-30 南瑞集团有限公司 一种变压器故障早期诊断预警方法和系统
CN109086834B (zh) * 2018-08-23 2021-03-02 北京三快在线科技有限公司 字符识别方法、装置、电子设备及存储介质
CN109767264A (zh) * 2018-12-20 2019-05-17 深圳壹账通智能科技有限公司 产品数据推送方法、装置、计算机设备和存储介质
CN109711450A (zh) * 2018-12-20 2019-05-03 北京科东电力控制系统有限责任公司 一种电网预想故障集预测方法、装置、电子设备及存储介质
CN110175701A (zh) * 2019-04-29 2019-08-27 北京六捷科技有限公司 一种铁路业务呼叫故障预测方法和装置
CN110348517B (zh) * 2019-07-11 2022-08-19 四川长虹电器股份有限公司 一种基于大数据的清洁能源供暖系统报警分类预测方法
CN110441629B (zh) * 2019-07-29 2022-02-15 交控科技股份有限公司 基于道岔转辙机动作电流曲线的故障诊断方法及装置
CN110879372B (zh) * 2019-12-03 2021-04-23 中南大学 基于特征相关的牵引系统主回路接地故障诊断方法及系统
CN112906790B (zh) * 2021-02-20 2023-08-18 国网江苏省电力有限公司营销服务中心 一种基于用电数据的独居老人识别方法和系统
CN113222371B (zh) * 2021-04-28 2023-05-02 曾伟 一种多媒体投影仪的远程侦测方法、设备及存储介质
CN114444616A (zh) * 2022-02-23 2022-05-06 上海华兴数字科技有限公司 样本库构建方法、故障诊断方法和装置
CN115086138B (zh) * 2022-07-27 2022-11-08 广州优刻谷科技有限公司 一种物联网终端节点故障预测方法、系统及存储介质
CN116821736A (zh) * 2023-06-07 2023-09-29 国网湖南综合能源服务有限公司 一种用于冷水机组的数据驱动模型建模方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104751374A (zh) * 2015-03-27 2015-07-01 深圳供电局有限公司 一种计量自动化系统无线通信故障预测方法
CN104899327A (zh) * 2015-06-24 2015-09-09 哈尔滨工业大学 一种无类别标签的时间序列异常检测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104751374A (zh) * 2015-03-27 2015-07-01 深圳供电局有限公司 一种计量自动化系统无线通信故障预测方法
CN104899327A (zh) * 2015-06-24 2015-09-09 哈尔滨工业大学 一种无类别标签的时间序列异常检测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
"Predication of wireless communication failure in grid metering automation system;Tao LIU等;《2014 China International Conference》;20140926;第894-897页 *
"基于k均值聚类与K近邻的故障检测方法研究";徐涛等;《通化师范学院学报(自然科学)》;20130630;第34卷(第3期);第38-40页 *
"基于K-均值聚类的小样本集KNN分类算法";刘应东等;《计算机应用与软件》;20110531;第28卷(第5期);第112-113、125页 *
"基于改进K-means聚类的kNN故障检测研究";陈海彬等;《沈阳化工大学学报》;20130331;第27卷(第1期);第69-73页 *

Also Published As

Publication number Publication date
CN105184084A (zh) 2015-12-23

Similar Documents

Publication Publication Date Title
CN105184084B (zh) 一种电力计量自动化终端故障类型预测方法和系统
CN114201374B (zh) 基于混合机器学习的运维时序数据异常检测方法及系统
CN109409444B (zh) 一种基于先验概率的多元电网故障类型的判别方法
CN116739829B (zh) 一种基于大数据的电力数据分析方法、系统及介质
CN111984442A (zh) 计算机集群系统的异常检测方法及装置、存储介质
CN113125903A (zh) 线损异常检测方法、装置、设备及计算机可读存储介质
CN112257784A (zh) 一种基于梯度提升决策树的窃电检测方法
KR102315580B1 (ko) 건물의 화재 예측 분석 장치 및 방법
CN110766100B (zh) 轴承故障诊断模型构建方法、诊断方法及电子设备
CN105096217B (zh) 一种电力计量自动化终端通信状态预测方法和系统
CN117434440B (zh) 一种量测开关的自动检测方法及系统
CN117557415A (zh) 一种基于智慧物业的社区资源管理方法及系统
CN113010394A (zh) 一种用于数据中心的机房故障检测方法
CN115879915B (zh) 一种用于发电厂的跨平台标准化检修方法
CN116884159A (zh) 一种基于ai识别的消防智能预警方法及系统
CN111614504A (zh) 基于时间序列和故障树分析的电网调控数据中心业务特性故障定位方法及系统
CN114237098B (zh) 一种电气产品的智能化数字管理系统
CN114167837B (zh) 一种铁路信号系统的智能故障诊断方法及系统
CN107087284A (zh) 一种网络小区的质量监控方法及监控系统、服务器
CN116126807A (zh) 一种日志分析方法及相关装置
CN115358336A (zh) 用电异常检测方法、装置及电子设备
CN114662589A (zh) 一种电表故障研判方法、装置、设备和可读存储介质
CN109492913B (zh) 一种配电终端的模块化风险预测方法、装置及可存储介质
CN114331175A (zh) 一种城市安全绩效数据集中统计评估方法及系统
CN112949951A (zh) 数据预测方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant