CN110335168A - 基于gru优化用电信息采集终端故障预测模型的方法及系统 - Google Patents
基于gru优化用电信息采集终端故障预测模型的方法及系统 Download PDFInfo
- Publication number
- CN110335168A CN110335168A CN201910323301.0A CN201910323301A CN110335168A CN 110335168 A CN110335168 A CN 110335168A CN 201910323301 A CN201910323301 A CN 201910323301A CN 110335168 A CN110335168 A CN 110335168A
- Authority
- CN
- China
- Prior art keywords
- terminal
- data
- gru
- stable state
- optimization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000005457 optimization Methods 0.000 title claims abstract description 33
- 230000007246 mechanism Effects 0.000 claims abstract description 19
- 238000012549 training Methods 0.000 claims abstract description 15
- 239000000284 extract Substances 0.000 claims abstract description 6
- 238000003860 storage Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 5
- 238000005303 weighing Methods 0.000 claims description 5
- 230000005540 biological transmission Effects 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 3
- 230000006641 stabilisation Effects 0.000 claims description 3
- 238000011105 stabilization Methods 0.000 claims description 3
- 230000015572 biosynthetic process Effects 0.000 claims 1
- 238000012217 deletion Methods 0.000 claims 1
- 230000037430 deletion Effects 0.000 claims 1
- 238000000605 extraction Methods 0.000 claims 1
- 238000005201 scrubbing Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 230000005611 electricity Effects 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 235000015170 shellfish Nutrition 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 241001269238 Data Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 235000013290 Sagittaria latifolia Nutrition 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 235000015246 common arrowhead Nutrition 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005684 electric field Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Water Supply & Treatment (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Public Health (AREA)
- Computational Linguistics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Supply And Distribution Of Alternating Current (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种基于GRU优化的用电信息采集终端故障预测方法及系统,所述方法包括:接收终端故障的样本数据,提取与终端故障相关的属性特征;根据属性特征中与终端采集数据稳定状态、传输网络数据稳定状态相关的属性特征,利用GRU门控机制进行稳定状态预测;基于所述属性特征和稳定状态预测结果,采用评分搜索的方法构建并迭代优化贝叶斯网络拓扑结构;基于贝叶斯网络拓扑结构,对贝叶斯网络结构进行参数学习,训练终端故障预测模型;基于所述故障预测模型对在运终端进行故障预测。
Description
技术领域
本发明涉及智能用电领域,特别涉及一种基于GRU优化用电信息采集终端故障预测模型的方法及系统。
背景技术
用电信息采集终端是智能用电的重要组成部分,是实现电能表数据采集、数据管理、数据双向传输以及转发或执行控制命令的基础设备。随着用电采集服务的全覆盖建设和用电采集终端的广泛应用,通讯延时、设备损坏等各方面原因常会造成终端不能正常工作现象,同时由于终端设备的生产厂家众多,终端设备型号、参数、使用寿命等均存在差异,以及终端故障时间上的不确定性,导致在运终端设备维护工作量大且繁杂,而终端数据采集质量低,直接影响电力企业基础业务及高级应用业务的开展。,因此,基于终端设备采集的海量数据,通过对数据指标的异常分析和故障预测,提高终端故障的识别和判断的准确性,提高终端变更的工作效率,从而节省电力企业的投资和运维成本。
当前用电采集终端的维护工作,通常依赖于人工监察处理,即通过对终端在线率、采集成功率等指标的监测,发现数据异常后派单处理,相关业务人员必须快速到现场排查,不仅耗费大量的人力和物力且效率低下,为电力工作的正常开展带来阻碍。
发明内容
为克服上述现有技术的不足,本发明提供了一种基于GRU优化的用电信息采集终端故障预测方法及系统,基于终端日常采集数据终端档案和外部环境等信息,利用有效的数据挖掘技术建立终端故障预测模型,并结合业务知识对预测的故障终端进行及时处理,实现对在运终端的有效监控。
为实现上述目的,本发明的一个或多个实施例提供了如下技术方案:
一种基于GRU优化的用电信息采集终端故障预测方法,包括以下步骤:
接收终端故障的样本数据,提取与终端故障相关的属性特征;
根据属性特征中与终端采集数据稳定状态、传输网络数据稳定状态相关的属性特征,利用GRU门控机制进行稳定状态预测;
基于所述属性特征和稳定状态预测结果,采用评分搜索的方法构建并迭代优化贝叶斯网络拓扑结构;
基于贝叶斯网络拓扑结构,对贝叶斯网络结构进行参数学习,训练终端故障预测模型;
基于所述故障预测模型对在运终端进行故障预测。
一个或多个实施例提供了一种基于GRU优化的用电信息采集终端故障预测系统,包括:
数据获取模块,接收终端故障的样本数据,提取与终端故障相关的属性特征;
数据稳定状态预测模块,根据属性特征中与终端采集数据稳定状态、传输网络数据稳定状态相关的属性特征,利用GRU门控机制进行稳定状态预测;
预测模型构建模块,基于所述属性特征和稳定状态预测结果,采用评分搜索的方法构建并迭代优化贝叶斯网络拓扑结构;基于贝叶斯网络拓扑结构,对贝叶斯网络结构进行参数学习,训练终端故障预测模型;
故障预测模块,基于所述故障预测模型对在运终端进行故障预测。
一个或多个实施例提供了一种计算装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的基于GRU优化的用电信息采集终端故障预测方法。
一个或多个实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述的基于GRU优化的用电信息采集终端故障预测方法。
以上一个或多个技术方案存在以下有益效果:
本发明采用结合GRU门控机制的贝叶斯网络模型方法,主要包括两部分,一是利用GRU门控机制对终端采集数据稳定状态和传输网络数据稳定状态进行预测,二是在此基础上结合终端的其他属性建立贝叶斯网络模型对终端进行故障预测,解决了预测问题中存在的不确定性、关联性问题,充分利用先验信息和样本信息,使推理结果更为准确可信,实现快速故障诊断预测,采用故障事前排除的方式,指导安排巡检和轮换计划,降低终端故障的影响,节省现场维护的成本。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明一个或多个实施例中基于GRU优化贝叶斯网络的终端故障预测方法整体流程图;
图2为本发明一个或多个实施例中数据预处理方法流程图;
图3为本发明一个或多个实施例中基于GRU优化贝叶斯网络故障预测方法的整体原理图;
图4为本发明一个或多个实施例中基于GRU机制的时间步单元;
图5为本发明一个或多个实施例中基于GRU机制预测采集成功率和在线率的方法步骤流程图;
图6为本发明一个或多个实施例中基于评分搜索的构建贝叶斯网络拓扑的步骤流程图
图7为本发明一个或多个实施例中贝叶斯网络拓扑有向无环图;
图8为本发明一个或多个实施例中贝叶斯网络终端故障预测方法步骤流程图;
图9为本发明一个或多个实施例中基于GRU优化贝叶斯网络用电采集终端故障预测方法计算流程图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例一
本实施例提供了一种基于GRU优化用电信息采集终端故障预测模型的方法,用以解决建设智能电网过程中终端故障发生时的负面损失问题,通过利用大数据分析技术,实现一种准确有效的终端故障预测方法,对在运终端的状态和故障可能性进行定时定量分析预警,提前作出相应的处理措施,满足正常的业务需求,避免了终端发生故障时,外勤人员须快速奔波于各个故障终端所在地进行维护,耗费大量的人力和物力。本实施例基于贝叶斯网络模型,利用时序性历史信息和相关特征,实时完成对所有在运终端故障预测服务。如图1和9所示,具体包括以下步骤:
步骤1:收集终端故障的样本,并建立终端故障样本库,提取出与终端故障相关联的特征,包括终端属性、外部环境和终端运行数据;
本实施例中,从电力现场获取某地区下的2143个终端的运行状态数据以及档案等有关终端的所有数据,根据已查明的故障终端数据库中提取数据特征,从中收集的与终端相关联的属性集合为:采集成功率、在线率、使用时间、终端类型、生产厂家、生产批次、通信流量、通信规约、信道类型、上送重要事项次数、时钟超差次数、终端地址。
步骤2:数据预处理,包括数据的清洗、特征因素的分析与选择,通过对终端历史数据样本的学习,筛选与终端故障发生紧密相关的特征因素;如图2所示,所述步骤2具体包括:
步骤2.1:数据清洗,对原始采集数据删除重复错误数据、补全缺失数据、剔除噪音点,保证终端采集数据的质量;
步骤2.2:基于数据清洗后获取的样本数据,采用reliefF特征选择的方法,分析相关属性对终端故障的影响,去除冗余的不相关因素和较弱相关因素,为贝叶斯网络优化模型提供高关联特征,从而提高模型的泛化能力,具体实现步骤如下:
(1)基于终端故障样本库的样本采集数据,设定样本个数为n,对标称属性进行统计量化处理,同时为避免各特征的数值差距对筛选结果的影响,对数据进行归一化处理,取每个属性输入的最小值Xmin和最大值Xmax,X'为归一化后的数据:
(2)从归一化之后的样本集{(x1,y1),(x2,y2),...,(xn,yn)}中随机选择一个元组xi,先在其同类样本中寻找其k个近邻xi,nh,再从异类样本中寻找其k个近邻xi,nm,随机抽样m次(m<n);
(3)计算样本R1和样本R2在特征A上的差diff(A,R1,R2),即
对于每一个待分析特征,分别计算该元组与同类样本在待分析特征上的差值,以及该元组与异类样本在待分析特征上的差值。
(4)根据所述差值计算所述待分析特征的影响权重。对于属性特征A,其权重计算公式为:
(5)再次对计算结果归一化处理并进行排序,可得到各属性对终端故障的影响权重的大小,其分量值越大,则对应属性的分类能力越强。
步骤2.3:设定筛选阈值,基于属性影响权重排序筛选出高关联属性的特征集合;
步骤2.4:输出与终端故障高关联特征数据,为建立贝叶斯网络优化模型提供更高质量的数据来源。
本实施例提取出与终端故障相关的因素包括采集成功率、在线率、使用时间、终端类型、生产厂家、生产批次、通信流量、上送重要事项次数、时钟超差次数、终端地址、天气情况、气温、通信规约、信道类型。对清洗之后的数据特征进行归一化处理并采用reliefF算法,筛选得到与终端故障具有高相关的特征包括采集成功率、在线率、使用时间、终端类型、生产厂家、生产批次、通信流量、终端地址、天气情况、最高气温、最低气温。
步骤3:利用GRU门控机制对终端采集数据稳定状态和传输网络数据稳定状态加以预测,通过充分利用终端的历史记忆数据,达到更准确的预测判断;如图4所示,所述步骤3包括以下步骤:
步骤3.1:基于数据预处理后的历史样本,同样采用步骤B中获取的终端采集数据稳定状态和传输网络数据稳定状态相关特征,并基于采集时间形成时间序列数据;
步骤3.2:设定时间序列数据输入X,设定t作为xt的时间步,在第t个时间步中,模型用ht表示xt的学习,此过程中门控循环单元使用xt以及在前一步骤中生成的表示ht-1来更新ht,如图5所示。
步骤3.3:在每一个时间步内,重置门和更新门需要经过一个线性变换再投入到激活函数中,参与计算,更新门和重置门选择sigmoid函数作为激活函数,候选隐藏状态选择双曲正切激活函数。ht是最终门控循环单元输出的内容,表示当前时间步的最终记忆。
步骤3.4:模型通过迭代的方式训练,利用梯度下降算法求解参数,最终输出预测参数值。
所述步骤3.2中,将步骤3.1中选择的数据按照时间序列分为t个相同的时间步,一个时间步内的计算看作一个GRU单元,表示对时间步xt的学习,如图2表示,它使用两个门控制不同阶段的数据输入和输出,分别是重置门(rt)和更新门(zt),重置门决定了如何将新输入的信息与前面的记忆结合,其值越小说明忽略的越多;更新门定义了前面记忆保存到当前时间步的量,其值越大说明前一时刻的状态信息带入越多。此过程中门控循环单元使用xt以及在前一步骤中的输出ht-1来更新,即
zt=σ(Wz·[ht-1,xt]) (4)
rt=σ(Wr·[ht-1,xt]) (5)
其中Wz,Wr是基于门控循环单元中的参数。
所述步骤3.3中,对于每一时间步的单元内,步骤3.2中的重置门和更新门计算之后都要经过一个线性变换再投入到激活函数中,更新门和重置门选择sigmoid函数作为激活函数,候选隐藏状态选择双曲正切激活函数。ht是最终门控循环单元输出的内容,表示当前时间步的最终记忆。计算公式如下:
其中W是基于GRU单元的模型参数。
所述步骤3.4中,使用梯度下降算法求目标函数最小化进行参数θ求解,这里的参数θ={Wz,Wr,W},首先建立损失函数作为目标函数:
然后初始化参数θ和学习率α,计算梯度用梯度乘以学习率α,并确定是否所有θ的梯度下降的距离都小于设定的临界值ε,如果小于ε则终止,当前所有的θ即为最终结果,否则按公式更新参数,直到满足上述条件迭代终止,输出参数值。
步骤4:基于终端采集历史数据、终端采集数据稳定状态、传输网络数据稳定状态的预测结果,采用评分搜索的方法构建并迭代优化贝叶斯网络拓扑结构;如图6所示,包括以下步骤:
步骤4.1:基于步骤B中筛选的特征集合、终端采集数据稳定状态和传输网络数据稳定状态的预测结果,建立一个包含所有节点的无向图
其中,贝叶斯网络的有向无环图中的节点表示特征变量,边表示特征变量间具有的因果关联;步骤4.2:定义网络结构评价函数
ScoreBDe(N|D)=lnP(N)P(D|N)=lnP(N)+lnP(D|N) (11)
其中,N为模型网络结构,D为训练数据;
步骤4.3:输入所述无向图的节点变量X={V1,V2...Vn},无向图中最大父节点数目μ、节点次序ρ和数据集D,初始化父节点集;
若两个节点间以一个单箭头连接在一起,则无箭头端表示该节点是父节点,有箭头端表示子节点,两节点关联产生一个条件概率值;
步骤4.4:按照顺序逐个考察变量X中的节点Vj(i=1,2,…,n),计算加入Vi的父节点集后贝叶斯网络的评分;
步骤4.5:将新的评分与旧的评分比较,如果新的评分大于旧的,且未达到最大父节点数,则将Vi添加为父节点,并添加相应的边,否则不添加,如此继续,直到轮训完所有节点得到网络拓扑结构,并结合领域专家知识稍作调整,得到贝叶斯网络拓扑有向无环图,如图7所示。
步骤5:基于贝叶斯网络拓扑结构,对贝叶斯网络结构进行参数学习,训练出终端故障预测模型;即学习无向图中各个边的关联度,或称条件概率。如图8所示,包括以下步骤:
步骤5.1:基于GRU门控机制的预测结果、前期经过数据预处理获取的历史样本筛选特征数据、学习到的贝叶斯网络拓扑结构;
步骤5.2:设定D=(x1,…,xn)是E1中获取的关于终端的数据元组集合;
步骤5.3:确定类别集合Y={0,1}。设Y=0表示终端故障未发生,Y=1表示终端故障发生;
步骤5.4:确定其联合概率分布为
其中,P(x1,…,xn)是X的值的特征组合的概率,Yi=0表示终端运行正常,Yi=1表示终端发生故障,而的值对应于Yi的条件概率(CPT)的表目,终端故障预测过程中返回概率分布,给出每个类别的概率;
步骤5.5:采用最大似然估计学习得到贝叶斯网络条件概率表;
步骤5.6:训练出用电信息采集终端故障预测模型,计算测试样本集的预测准确率和召回率,输出较为合理的终端故障预测模型。
本实施例使用新一批收集的2589个终端数据进行模型验证,利用上述所选择的因素和模型,根据终端故障预测结果数据派遣外勤人员对该2589例终端进行检查与轮换,实验结果如下表所示:
表3基于GRU优化贝叶斯网络采集终端故障预测计算方法的实验结果
实际故障的 | 实际无故障的 | 总数 | |
预测故障的 | 134 | 48 | 182 |
预测正常的 | 14 | 2393 | 2407 |
总数 | 148 | 2441 | 2589 |
根据实验结果得基于GRU优化贝叶斯网络采集终端故障预测计算方法的正确率和召回率,如下所示:
步骤6:利用训练出的故障预测模型对在运终端进行故障预测,将结果反馈给业务人员进行故障查实,并安排巡检和轮换计划,将查实的终端故障数据反馈回A,丰富终端故障样本库,不断优化训练终端故障影响因素,提高终端故障预测准确度。
实施例二
本实施例的目的是基于实施例一所述方法,提供一种基于时变权重动态组合的电力用户信用评价系统,包括:
数据获取模块,接收终端故障的样本数据,提取与终端故障相关的属性特征;
数据稳定状态预测模块,根据属性特征中与终端采集数据稳定状态、传输网络数据稳定状态相关的属性特征,利用GRU门控机制进行稳定状态预测;
预测模型构建模块,基于所述属性特征和稳定状态预测结果,采用评分搜索的方法构建并迭代优化贝叶斯网络拓扑结构;基于贝叶斯网络拓扑结构,对贝叶斯网络结构进行参数学习,训练终端故障预测模型;
故障预测模块,基于所述故障预测模型对在运终端进行故障预测。
实施例三
本实施例的目的是基于实施例一所述方法,提供一种计算装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现:
接收终端故障的样本数据,提取与终端故障相关的属性特征;
根据属性特征中与终端采集数据稳定状态、传输网络数据稳定状态相关的属性特征,利用GRU门控机制进行稳定状态预测;
基于所述属性特征和稳定状态预测结果,采用评分搜索的方法构建并迭代优化贝叶斯网络拓扑结构;
基于贝叶斯网络拓扑结构,对贝叶斯网络结构进行参数学习,训练终端故障预测模型;
基于所述故障预测模型对在运终端进行故障预测。
实施例三
本实施例的目的是提供一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有计算机程序,用于指纹图谱相似度计算,该程序被处理器执行时实现:
接收终端故障的样本数据,提取与终端故障相关的属性特征;
根据属性特征中与终端采集数据稳定状态、传输网络数据稳定状态相关的属性特征,利用GRU门控机制进行稳定状态预测;
基于所述属性特征和稳定状态预测结果,采用评分搜索的方法构建并迭代优化贝叶斯网络拓扑结构;
基于贝叶斯网络拓扑结构,对贝叶斯网络结构进行参数学习,训练终端故障预测模型;
基于所述故障预测模型对在运终端进行故障预测。
以上实施例二、三和四的中涉及的各步骤与方法实施例一相对应,具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发明中的任一方法。
以上一个或多个实施例具有以下技术效果:
1、由于终端发生故障的原因复杂多样,影响因素繁多,故基于有效合理的历史数据筛选特征因素对整个模型的建立至关重要。分析因素不足会造成终端质量分析的结果不准确,而如果过多的输入影响因素,又会导致网络模型收敛时间的过长,甚至模型的泛化能力不强,出现过拟合的情况。本专利在数据预处理过程中针对数据清洗后获取的样本数据,采用reliefF算法实现高关联特征的筛选,提高了模型的泛化能力。
2、基于GRU门控机制并结合历史样本中时序性信息对终端采集数据稳定状态和传输网络数据稳定状态进行预测,能够保留更加完整的终端历史信息,此种方式能尽可能多的利用采集终端的时序性运行数据,且在后期贝叶斯网络拓扑构建阶段,终端采集数据稳定状态和传输网络数据稳定状态不会由于存在相关性,而导致底层相关特征数据被剔除,提高模型总体的预测准确率。
3、针对故障类型筛选高关联度的特征集合,采用基于评分搜索的方式训练贝叶斯网络拓扑结构,利用用电采集终端的所有相关属性建立无向图,并搜索计算每种可能结构的后验概率,不断学习优化找到评分最高拟合度最好的网络结构,一方面实现样本特征的降维处理,提高特征与单一故障类型的关联度,另一方面避免贝叶斯网络过大导致模糊推导的问题,并可基于不同的故障预测概率,实现故障可能性的排序。
4、本发明采用结合GRU门控机制的贝叶斯网络模型方法,其模型框架如图5所示。主要包括两部分,一是利用GRU门控机制对终端采集数据稳定状态和传输网络数据稳定状态进行预测,二是在此基础上结合终端的其他属性建立贝叶斯网络模型对终端进行故障预测,本专利所提方法可解决预测问题中存在的不确定性、关联性问题,充分利用先验信息和样本信息,使推理结果更为准确可信,实现快速故障诊断预测,采用故障事前排除的方式,指导安排巡检和轮换计划,降低终端故障的影响,节省现场维护的成本。
本领域技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (10)
1.一种基于GRU优化的用电信息采集终端故障预测方法,其特征在于,包括以下步骤:
接收终端故障的样本数据,提取与终端故障相关的属性特征;
根据属性特征中与终端采集数据稳定状态、传输网络数据稳定状态相关的属性特征,利用GRU门控机制进行稳定状态预测;
基于所述属性特征和稳定状态预测结果,采用评分搜索的方法构建并迭代优化贝叶斯网络拓扑结构;
基于贝叶斯网络拓扑结构,对贝叶斯网络结构进行参数学习,训练终端故障预测模型;
基于所述故障预测模型对在运终端进行故障预测。
2.如权利要求1所述的一种基于GRU优化的用电信息采集终端故障预测方法,其特征在于,接收终端故障的样本数据后,还进行数据清洗删除重复数据、补全缺失数据和删除错误数据。
3.如权利要求1所述的一种基于GRU优化的用电信息采集终端故障预测方法,其特征在于,提取与终端故障相关的特征,包括:
对样本数据进行数据清理,并进行归一化处理;
分析各属性特征对终端故障的影响权重;
筛选影响权重大于设定阈值的特征,作为与终端故障相关的特征。
4.如权利要求3所述的一种基于GRU优化的用电信息采集终端故障预测方法,其特征在于,分析各属性特征对终端故障的影响权重方法为:
从归一化之后的样本数据中随机选择一个元组,先在其同类样本中寻找k个近邻,再从异类样本中寻找k个近邻;
对于每一个待分析特征,分别计算该元组与同类样本在待分析特征上的差值,以及该元组与异类样本在待分析特征上的差值;根据所述差值计算所述待分析特征的影响权重。
5.如权利要求1所述的一种基于GRU优化的用电信息采集终端故障预测方法,其特征在于,利用GRU门控机制进行稳定状态预测包括:
将属性特征中与终端采集数据稳定状态、传输网络稳定状态相关的属性特征,根据采集时间形成时间序列数据;
利用GRU门控机制进行稳定状态预测。
6.如权利要求1所述的一种基于GRU优化的用电信息采集终端故障预测方法,其特征在于,构建并迭代优化贝叶斯网络拓扑结构包括:
根据属性特征和稳定状态预测结果,并作为节点输入无向图,初始化无向图的最大父节点数目和节点次序,初始化父节点集;
按照顺序逐个考察无向图中的节点,计算加入其父节点集后网络的评分;采用评分搜索的方法迭代优化贝叶斯网络拓扑结构。
7.如权利要求1所述的一种基于GRU优化的用电信息采集终端故障预测方法,其特征在于,训练终端故障预测模型包括:
接收关于终端的数据元组集合,并确定类别,即故障发生或未发生;
采用最大似然估计学习得到贝叶斯网络条件概率表;
训练终端故障预测模型。
8.一种基于GRU优化的用电信息采集终端故障预测系统,其特征在于,包括:
数据获取模块,接收终端故障的样本数据,提取与终端故障相关的属性特征;
数据稳定状态预测模块,根据属性特征中与终端采集数据稳定状态、传输网络数据稳定状态相关的属性特征,利用GRU门控机制进行稳定状态预测;
预测模型构建模块,基于所述属性特征和稳定状态预测结果,采用评分搜索的方法构建并迭代优化贝叶斯网络拓扑结构;基于贝叶斯网络拓扑结构,对贝叶斯网络结构进行参数学习,训练终端故障预测模型;
故障预测模块,基于所述故障预测模型对在运终端进行故障预测。
9.一种计算装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7任一项所述的基于GRU优化的用电信息采集终端故障预测方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7任一项所述的基于GRU优化的用电信息采集终端故障预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910323301.0A CN110335168B (zh) | 2019-04-22 | 2019-04-22 | 基于gru优化用电信息采集终端故障预测模型的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910323301.0A CN110335168B (zh) | 2019-04-22 | 2019-04-22 | 基于gru优化用电信息采集终端故障预测模型的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110335168A true CN110335168A (zh) | 2019-10-15 |
CN110335168B CN110335168B (zh) | 2020-06-05 |
Family
ID=68139731
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910323301.0A Active CN110335168B (zh) | 2019-04-22 | 2019-04-22 | 基于gru优化用电信息采集终端故障预测模型的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110335168B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110907885A (zh) * | 2019-12-06 | 2020-03-24 | 国网湖北省电力有限公司计量中心 | 一种数字化电能计量系统现场运行状态评估方法及系统 |
CN111383128A (zh) * | 2020-03-09 | 2020-07-07 | 中国电力科学研究院有限公司 | 一种用于监测电网嵌入式终端设备运行状态的方法及系统 |
CN111526070A (zh) * | 2020-04-29 | 2020-08-11 | 重庆邮电大学 | 一种基于预测的服务功能链故障检测方法 |
CN111693931A (zh) * | 2020-06-23 | 2020-09-22 | 广东电网有限责任公司计量中心 | 智能电能表误差远程计算方法、装置和计算机设备 |
CN112422351A (zh) * | 2021-01-21 | 2021-02-26 | 南京群顶科技有限公司 | 一种基于深度学习的网络告警预测模型建立方法及装置 |
CN112763967A (zh) * | 2020-12-11 | 2021-05-07 | 国网辽宁省电力有限公司鞍山供电公司 | 一种基于BiGRU的智能电表计量模块故障预测与诊断方法 |
CN113743670A (zh) * | 2021-09-08 | 2021-12-03 | 电子科技大学 | 一种基于gru模型的电路故障实时预测方法及验证电路 |
CN114169763A (zh) * | 2021-12-08 | 2022-03-11 | 国网重庆市电力公司营销服务中心 | 一种计量器具需求预测方法、系统、计算装置及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7296018B2 (en) * | 2004-01-02 | 2007-11-13 | International Business Machines Corporation | Resource-light method and apparatus for outlier detection |
CN106057212A (zh) * | 2016-05-19 | 2016-10-26 | 华东交通大学 | 基于语音个性特征和模型自适应的驾驶疲劳检测方法 |
CN108320040A (zh) * | 2017-01-17 | 2018-07-24 | 国网重庆市电力公司 | 基于贝叶斯网络优化算法的采集终端故障预测方法及系统 |
CN108829816A (zh) * | 2018-06-12 | 2018-11-16 | 郑州云海信息技术有限公司 | 一种大数据的二次特征选择方法及装置 |
CN109255389A (zh) * | 2018-09-28 | 2019-01-22 | 中国科学院长春光学精密机械与物理研究所 | 一种装备评价方法、装置、设备及可读存储介质 |
CN109656236A (zh) * | 2019-01-28 | 2019-04-19 | 中国石油大学(华东) | 一种基于周期性预测神经网络的工业数据故障预测方法 |
-
2019
- 2019-04-22 CN CN201910323301.0A patent/CN110335168B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7296018B2 (en) * | 2004-01-02 | 2007-11-13 | International Business Machines Corporation | Resource-light method and apparatus for outlier detection |
CN106057212A (zh) * | 2016-05-19 | 2016-10-26 | 华东交通大学 | 基于语音个性特征和模型自适应的驾驶疲劳检测方法 |
CN108320040A (zh) * | 2017-01-17 | 2018-07-24 | 国网重庆市电力公司 | 基于贝叶斯网络优化算法的采集终端故障预测方法及系统 |
CN108829816A (zh) * | 2018-06-12 | 2018-11-16 | 郑州云海信息技术有限公司 | 一种大数据的二次特征选择方法及装置 |
CN109255389A (zh) * | 2018-09-28 | 2019-01-22 | 中国科学院长春光学精密机械与物理研究所 | 一种装备评价方法、装置、设备及可读存储介质 |
CN109656236A (zh) * | 2019-01-28 | 2019-04-19 | 中国石油大学(华东) | 一种基于周期性预测神经网络的工业数据故障预测方法 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110907885A (zh) * | 2019-12-06 | 2020-03-24 | 国网湖北省电力有限公司计量中心 | 一种数字化电能计量系统现场运行状态评估方法及系统 |
CN110907885B (zh) * | 2019-12-06 | 2021-10-01 | 国网湖北省电力有限公司计量中心 | 一种数字化电能计量系统现场运行状态评估方法及系统 |
CN111383128A (zh) * | 2020-03-09 | 2020-07-07 | 中国电力科学研究院有限公司 | 一种用于监测电网嵌入式终端设备运行状态的方法及系统 |
CN111526070A (zh) * | 2020-04-29 | 2020-08-11 | 重庆邮电大学 | 一种基于预测的服务功能链故障检测方法 |
CN111526070B (zh) * | 2020-04-29 | 2022-06-03 | 重庆邮电大学 | 一种基于预测的服务功能链故障检测方法 |
CN111693931A (zh) * | 2020-06-23 | 2020-09-22 | 广东电网有限责任公司计量中心 | 智能电能表误差远程计算方法、装置和计算机设备 |
CN112763967A (zh) * | 2020-12-11 | 2021-05-07 | 国网辽宁省电力有限公司鞍山供电公司 | 一种基于BiGRU的智能电表计量模块故障预测与诊断方法 |
CN112422351A (zh) * | 2021-01-21 | 2021-02-26 | 南京群顶科技有限公司 | 一种基于深度学习的网络告警预测模型建立方法及装置 |
CN113743670A (zh) * | 2021-09-08 | 2021-12-03 | 电子科技大学 | 一种基于gru模型的电路故障实时预测方法及验证电路 |
CN113743670B (zh) * | 2021-09-08 | 2023-05-09 | 电子科技大学 | 一种基于gru模型的电路故障实时预测方法及验证电路 |
CN114169763A (zh) * | 2021-12-08 | 2022-03-11 | 国网重庆市电力公司营销服务中心 | 一种计量器具需求预测方法、系统、计算装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110335168B (zh) | 2020-06-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110335168A (zh) | 基于gru优化用电信息采集终端故障预测模型的方法及系统 | |
CN103257921B (zh) | 一种基于改进随机森林算法的软件故障预测系统及其方法 | |
LaTorre et al. | A comprehensive comparison of large scale global optimizers | |
CN107092582A (zh) | 一种基于残差后验的异常值在线检测及置信度评估方法 | |
CN106291445B (zh) | 一种电力采集系统异常的智能化诊断方法 | |
CN106874655B (zh) | 基于多标记学习和贝叶斯网络的中医症型分类预测方法 | |
Cao et al. | An improved twin support vector machine based on multi-objective cuckoo search for software defect prediction | |
CN105069080B (zh) | 一种文献检索方法及系统 | |
CN112508053A (zh) | 基于集成学习框架的智能诊断方法、装置、设备及介质 | |
CN114373101A (zh) | 基于进化策略的神经网络架构搜索的图像分类方法 | |
CN109711707B (zh) | 一种船舶动力装置综合状态评估方法 | |
CN110097216A (zh) | 用于企业发展的预测方法以及装置、服务器 | |
Rabbi et al. | An Approximation For Monitoring The Efficiency Of Cooperative Across Diverse Network Aspects | |
CN114897085A (zh) | 一种基于封闭子图链路预测的聚类方法及计算机设备 | |
CN114548494A (zh) | 一种可视化造价数据预测智能分析系统 | |
Guerrero-Pena et al. | Dynamic multi-objective evolutionary algorithm with objective space prediction strategy | |
Gao et al. | Fault diagnosis for cooling dehumidifier based on fuzzy classifier optimized by adaptive genetic algorithm | |
CN112365082A (zh) | 一种基于机器学习的公共能源消耗预测方法 | |
Pérez et al. | A statistical approach for algorithm selection | |
Xiao | Optimal allocation model of enterprise human resources based on particle swarm optimization | |
CN115964504B (zh) | 一种食品安全风险预测方法及系统 | |
CN113837481B (zh) | 一种基于区块链的金融大数据管理系统 | |
CN115953215A (zh) | 一种基于时间和图结构的搜索式推荐方法 | |
CN113255223B (zh) | 一种空调负荷短期预测方法及系统 | |
Bisht et al. | Review study on software defect prediction models premised upon various data mining approaches |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |