CN116663414A - 一种用于电力变压器的故障诊断方法及系统 - Google Patents
一种用于电力变压器的故障诊断方法及系统 Download PDFInfo
- Publication number
- CN116663414A CN116663414A CN202310641912.6A CN202310641912A CN116663414A CN 116663414 A CN116663414 A CN 116663414A CN 202310641912 A CN202310641912 A CN 202310641912A CN 116663414 A CN116663414 A CN 116663414A
- Authority
- CN
- China
- Prior art keywords
- sparrow
- algorithm
- value
- fault diagnosis
- improved
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 76
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 133
- 241000287127 Passeridae Species 0.000 claims abstract description 121
- 238000005457 optimization Methods 0.000 claims abstract description 40
- 230000008569 process Effects 0.000 claims description 33
- 239000011159 matrix material Substances 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 15
- 210000002569 neuron Anatomy 0.000 claims description 14
- 239000013598 vector Substances 0.000 claims description 14
- 238000010845 search algorithm Methods 0.000 claims description 12
- 230000003044 adaptive effect Effects 0.000 claims description 10
- 230000008901 benefit Effects 0.000 claims description 8
- 230000001965 increasing effect Effects 0.000 claims description 8
- 230000008859 change Effects 0.000 claims description 7
- 238000011161 development Methods 0.000 claims description 7
- 230000006872 improvement Effects 0.000 claims description 6
- 230000006978 adaptation Effects 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 3
- 230000004044 response Effects 0.000 claims description 3
- 238000013461 design Methods 0.000 abstract description 2
- 239000010410 layer Substances 0.000 description 33
- 230000000694 effects Effects 0.000 description 22
- 238000012549 training Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 13
- 238000013528 artificial neural network Methods 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 7
- 230000010354 integration Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000005284 excitation Effects 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000007635 classification algorithm Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 244000062645 predators Species 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 241000282461 Canis lupus Species 0.000 description 1
- 241000283153 Cetacea Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241001334134 Rugopharynx epsilon Species 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002431 foraging effect Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0499—Feedforward networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/08—Probabilistic or stochastic CAD
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明公开了一种用于电力变压器的故障诊断方法及系统,涉及信号发生器电路设计技术领域,包括:采集电力变压器的故障样本;以极限学习机ELM作为基分类器,使用基于正弦优化的改进麻雀搜索算法进行优化,通过优化后的基分类器,对故障样本进行分类处理;基于AdaBoost.M2算法综合分类结果,对电力变压器进行故障诊断;本发明所提出的AdaBoost.M2‑ISSA‑ELM变压器故障诊断策略,可以有效提升故障识别准确率以及模型稳定性,适用于变压器故障诊断的应用场景。
Description
技术领域
本发明涉及信号发生器电路设计技术领域,具体而言,涉及一种用于电力变压器的故障诊断方法及系统。
背景技术
作为电力系统中的重要设备,电力变压器在电能传输、电压变换、降压安全和隔离保护等工作中扮演着至关重要的角色,参与发电、输电、配电三个环节,掌握其运行状态对保障电网的稳定运行有着重要意义。当前,电网中运行的变压器大多是油浸式变压器,油浸式变压器在发生故障时,会产生少量溶解在绝缘油中的气体,这些气体的浓度关系可以反映出变压器的运行状态,这也使得DGA在变压器故障诊断领域被广泛应用。
对于油中溶解气体的传统分析方法,如IEC三比值法、改进的IEC三比值法等,因判据过于绝对、编码可能缺损等原因,使得变压器诊断结果不够可靠。近年来,随着各种人工智能算法的提出,如BP神经网络、概率神经网络、卷积神经网络、支持向量机等,其在电力行业内的应用愈加广泛,利用人工智能算法对变压器进行故障诊断的技术发展迅速,推动了变压器状态检修工作的良性发展。
但受限于样本规模以及样本质量,传统智能算法对变压器故障样本的特征提取能力有限,故障诊断效果一般,且模型的稳定性和泛化性较差。因此广大学者对传统智能算法进行改进优化,以提高故障诊断模型的性能。在各种改进优化方法中,对动物种群的行为规律进行模拟抽象的群体智能优化算法,如灰狼算法、鲸鱼算法、蜂群算法等,具有良好的并行性和自主探索性,被广泛应用于特征参数的选择上。而麻雀搜索算法凭借其出色的寻优效率和收敛精度,适用于多数参数寻优和算法优化场景。改进优化后的智能算法在稳定性和整体诊断精度上都有了较大提升,但由于训练过程的独立性,每次训练结果不为后续训练提供参考支撑,每次训练得到的诊断模型具有一定局限性,即无法同时保证模型对各类样本的高诊断精度。
而集成学习算法是将传统智能算法作为基分类器,在训练过程中,每次训练均以前一训练结果为考量,修正本次训练相关参数,得到多个相互关联的基分类器,并综合所有基分类器的分类结果,使诊断模型的准确性和稳定性得到了进一步提升。常见的集成学习算法有Bagging算法、XGBoost算法、AdaBoost算法等。其中,AdaBoost算法凭借其对多个学习器的综合性以及权重变化的自适应性,被广泛应用于分类问题中。
传统AdaBoost算法是二分类算法,在变压器故障诊断的多分类问题中应用时需要使用相应策略,因此模型训练时间和多分类效果都会受到影响,且现有技术选择的常用基学习算法如支持向量机、决策树等,分类效果一般,因此集成模型的性能会受限于基学习器的性能,虽然得到的诊断结果比较稳定,但准确度依然有待提高;并且,种群智能优化算法虽然可以提升模型分类精度,但是也会带来训练时间大幅增加的问题。
发明内容
为了解决上述问题,本发明的目的是提供一种基于改进的AdaBoost算法的用于电力变压器的故障诊断技术,以克服传统AdaBoost算法中存在的问题。
为了实现上述技术目的,本申请提供了一种用于电力变压器的故障诊断方法,包括以下步骤:
采集电力变压器的故障样本;
以极限学习机ELM作为基分类器,使用基于正弦优化的改进麻雀搜索算法进行优化,通过优化后的基分类器,对故障样本进行分类处理;
基于AdaBoost.M2算法综合分类结果,对电力变压器进行故障诊断。
优选地,在对ELM进行优化的过程中,将ELM模型分类结果的误差率作为优化算法中调整种群位置信息的适应度,适应度表示为:
其中,noutput=target表示模型分类正确的样本个数,nall表示样本总个数。
优选地,在获取改进麻雀搜索算法的过程中,通过正弦优化算法,构造了一个自适应权重因子w,用以调节麻雀个体的移动范围,改进麻雀个体的位置更新策略,其中,自适应权重因子w表示:
其中,wmax和wmin分别表示权重变化范围的最大值以及最小值;fi k表示第k次迭代中第i只麻雀的适应度值,分别表示第k次迭代的最优、最劣适应度值。
优选地,在通过正弦优化算法对麻雀算法进行改进的过程中,当某一麻雀个体需要移动时,首先判断其当前所处位置,若相对本次迭代的最优适应度位置较近,则将w赋较小值,使得该个体在原来的位置附近继续搜索;而对于距离最劣位置较近的麻雀个体,则通过增大w值使其更快远离当前位置,前往其他区域探索;改进后麻雀算法兼顾了麻雀种群的全局搜索和局部开发能力的同时,显著提升了算法的收敛速度。
优选地,响应于改进的麻雀算法的构建,改进后的麻雀算法的发现者位置更新策略为:
式中,表示第k次迭代中,第i只麻雀在维度j上所处的位置,itermax表示最大迭代次数,α为(0,1]上的一个随机数,Q为服从正态分布的随机数,L为一个1×d的全1矩阵,R∈[0,1]为预警值,表示麻雀对于周围环境的警惕程度,ST∈[0.5,1]为安全值,作为麻雀是否需要躲避危险的判断条件;
改进后的麻雀算法的加入者位置更新过程为:
式中,表示第k次迭代中全局适应度最差的位置,/>表示当前发现者中适应度最优的位置,A表示一个d维的行向量,由1或-1的随机数构成,且A+=AT(AAT)-1;
改进后的麻雀算法的发现者位置更新策略为:
式中,表示第k次迭代中全局适应度值最优的位置,β为服从均值为0、方差为1的正态分布的随机数,B为[-1,1]上的随机数,正负表示麻雀移动方向,大小表示步长控制参数,ε为一个较小的常数,以避免分母为零,fi表示麻雀个体i的适应度值,fg和fw分别表示当前全局中最优和最差的适应度值。
优选地,响应于优化后的基分类器,通过改进的麻雀搜索算法分别对ELM算的隐含层神经元与输入层间的权值向量,以及隐含层神经元的偏置进行优化,用于避免ELM模型陷入局部最优。
本发明公开了一种用于电力变压器的故障诊断系统,包括:
数据采集模块,用于采集电力变压器的故障样本;
数据处理模块,用于以极限学习机ELM作为基分类器,使用基于正弦优化的改进麻雀搜索算法进行优化,通过优化后的基分类器,对故障样本进行分类处理;
故障诊断模块,用于基于AdaBoost.M2算法综合分类结果,对电力变压器进行故障诊断。
优选地,数据处理模块,通过正弦优化算法,构造了一个自适应权重因子w,用以调节麻雀个体的移动范围,改进麻雀个体的位置更新策略,当某一麻雀个体需要移动时,首先判断其当前所处位置,若相对本次迭代的最优适应度位置较近,则将w赋较小值,使得该个体在原来的位置附近继续搜索;而对于距离最劣位置较近的麻雀个体,则通过增大w值使其更快远离当前位置,前往其他区域探索;改进后麻雀算法兼顾了麻雀种群的全局搜索和局部开发能力的同时,显著提升了算法的收敛速度,其中,自适应权重因子w表示:
其中,wmax和wmin分别表示权重变化范围的最大值以及最小值;fi k表示第k次迭代中第i只麻雀的适应度值,分别表示第k次迭代的最优、最劣适应度值。
优选地,数据处理模块的改进后的麻雀算法的发现者位置更新策略为:
式中,表示第k次迭代中,第i只麻雀在维度j上所处的位置,itermax表示最大迭代次数,α为(0,1]上的一个随机数,Q为服从正态分布的随机数,L为一个1×d的全1矩阵,R∈[0,1]为预警值,表示麻雀对于周围环境的警惕程度,ST∈[0.5,1]为安全值,作为麻雀是否需要躲避危险的判断条件;
数据处理模块的改进后的麻雀算法的加入者位置更新过程为:
式中,表示第k次迭代中全局适应度最差的位置,/>表示当前发现者中适应度最优的位置,A表示一个d维的行向量,由1或-1的随机数构成,且A+=AT(AAT)-1;
数据处理模块的改进后的麻雀算法的发现者位置更新策略为:
式中,表示第k次迭代中全局适应度值最优的位置,β为服从均值为0、方差为1的正态分布的随机数,B为[-1,1]上的随机数,正负表示麻雀移动方向,大小表示步长控制参数,ε为一个较小的常数,以避免分母为零,fi表示麻雀个体i的适应度值,fg和fw分别表示当前全局中最优和最差的适应度值。
优选地,数据处理模块,通过改进的麻雀搜索算法分别对ELM算的隐含层神经元与输入层间的权值向量,以及隐含层神经元的偏置进行优化,用于避免ELM模型陷入局部最优。
本发明公开了以下技术效果:
本发明所提出的AdaBoost.M2-ISSA-ELM变压器故障诊断模型,可以有效提升故障识别准确率以及模型稳定性,适用于变压器故障诊断的应用场景;
本发明以改进的AdaBoost.M2算法作为集成学习框架,在集成效果和集成后模型的稳定性上较传统AdaBoost算法均有更好的效果;
本发明在集成学习中基分类器的选择上,使用ELM构建基分类器,保障了故障诊断模型的初始分类精度;
本发明引入基于正弦优化的麻雀搜索算法进行参数寻优,有效解决了ELM算法容易陷入局部最优的问题,同时提高了模型的故障诊断效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明所述的AdaBoost.M2-ISSA-ELM算法流程图;
图2是本发明所述的改进前后收敛次数对比曲线;
图3是本发明所述的优化前后ELM算法分类结果对比;
图4是本发明所述的集成前后模型准确度对比;
图5是本发明所述的不同算法集成前后性能对比;
图6是本发明所述的混淆矩阵;
图7是本发明所述的AdaBoost.M2-ISSA-ELM模型的ROC曲线;
图8是本发明所述的不同模型的故障诊断雷达图;
图9是本发明所述的ELM模型结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
如图1-9所示,传统AdaBoost算法作为一种二分类算法,在多分类问题中应用时,需构建一组二分类器,综合所有二分类器的输出,投票产生最终分类结果。但多个分类器间的相互干扰会导致集成模型的分类准确率较低,且AdaBoost算法集成的模型体量庞大,使得模型计算量和训练时间都大幅增加。为避免上述问题,本发明在原有算法框架的基础上采用改进的AdaBoost.M2算法。首先,扩展基分类器的输出形式,由单一离散值扩展为1×m的向量,向量中每个元素都介于0和1之间,表示该样本属于某一类别的置信度,以增强基分类器的表达能力。其次,针对传统算法中因加权误差到达迭代停止条件过快,而导致的算法迭代次数过少,集成效果差的问题,本发明引入伪损失函数以替代加权误差,用伪损失函数衡量基分类器的分类效果,在更多关注错分样本的同时,将错分样本的分类结果作为分类器权重以及样本权重的更新条件,以提高集成分类器的性能。
本发明提出基于AdaBoost.M2-ISSA-ELM算法的电力变压器故障诊断模型。首先,以极限学习机作为基分类器,使用基于正弦优化的改进麻雀搜索算法分别对输入层—隐含层权重和隐藏层偏置进行优化,以加快模型训练速度,提高模型的诊断准确率;其次,使用AdaBoost.M2算法综合多个基分类器的分类结果,加强各分类器间的交流,进一步提高模型诊断精度;最后,通过实验对比不同模型的诊断结果,验证本发明所提方法的有效性。方案详细内容如下:
1、基学习算法的选择:
本发明选择有着训练速度快、训练过程简单、模型鲁棒性强以及泛化能力好等优点的极限学习机作为基学习算法,以保证模型有较好的初始分类精度。其核心思想是随机初始化网络的参数(即输入层和隐含层之间的权重和偏置),在训练过程中只需要给定激励函数和隐含层节点个数,就可以直接求解输出层的权重。
2、基于正弦优化SSA算法的ELM参数优化:
麻雀搜索算法(Sparrow Search Algorithm,SSA)是一种新型群体智能优化算法。该算法收敛速度快,具有较强的全局搜索能力。
在该算法中,假设麻雀种群规模为N,则整个种群的位置信息X如下式所示:
其中:xi,j为第i只麻雀在j维上的位置,i=1,2,…,N,j=1,2,…,u;u为待优化问题的维度,本发明ELM参数优化过程中,u为输入层权重个数与隐含层偏置个数的加和。
麻雀个体所处位置的优劣,可用适应度值矩阵表示为:
其中,f为特定优化问题所选择的适应度函数。
本发明将ELM模型分类结果的误差率作为优化算法中调整种群位置信息的适应度,适应度函数公式如下:
其中,noutput=target表示模型分类正确的样本个数,nall表示样本总个数。
麻雀搜索算法即是不同身份的麻雀个体根据各自的适应度值及位置更新策略不断迭代、更新自身位置的过程。但传统的位置更新过程没有趋向性,均以随机移动的方式前往其他区域,没有根据不同麻雀个体各自的位置情况对其进行针对性调整,算法存在收敛速度较慢的问题。因此本发明基于正弦优化算法,构造了一个自适应权重因子w,用以调节麻雀个体的移动范围,改进麻雀个体的位置更新策略。构造引入的自适应权重因子w如下所示:
其中,wmax和wmin分别表示权重变化范围的最大值以及最小值;fi k表示第k次迭代中第i只麻雀的适应度值,分别表示第k次迭代的最优、最劣适应度值。
当某一麻雀个体需要移动时,首先判断其当前所处位置,若相对本次迭代的最优适应度位置较近,则将w赋较小值,使得该个体在原来的位置附近继续搜索;而对于距离最劣位置较近的麻雀个体,则通过增大w值使其更快远离当前位置,前往其他区域探索。这一改进兼顾了麻雀种群的全局搜索和局部开发能力,显著提升了麻雀搜索算法的收敛速度。
改进后的发现者位置更新策略如式(5)所示:
式中,表示第k次迭代中,第i只麻雀在维度j上所处的位置,itermax表示最大迭代次数,α为(0,1]上的一个随机数,Q为服从正态分布的随机数,L为一个1×d的全1矩阵,R∈[0,1]为预警值,表示麻雀对于周围环境的警惕程度,ST∈[0.5,1]为安全值,作为麻雀是否需要躲避危险的判断条件。当预警值小于安全值时,意味着此处区域没有捕食者,发现者可以扩大范围搜索食物;当预警值小于安全值时,说明一些发现者意识到了危险,会带领其他麻雀离开该区域,寻找安全区域。
改进后的加入者位置更新过程如式(6)所示:
式中,表示第k次迭代中全局适应度最差的位置,/>表示当前发现者中适应度最优的位置,A表示一个d维的行向量,由1或-1的随机数构成,且A+=AT(AAT)-1。当某一加入者为前一半的较优加入者时,它会在发现者Xp附近觅食;反之说明该加入者无法在这一区域与发现者争夺获得食物,需要前往其他地方寻找食物。
改进后的预警者位置更新过程如式(7)所示:
式中,表示第k次迭代中全局适应度值最优的位置,β为服从均值为0、方差为1的正态分布的随机数,B为[-1,1]上的随机数,正负表示麻雀移动方向,大小表示步长控制参数,ε为一个较小的常数,以避免分母为零,fi表示麻雀个体i的适应度值,fg和fw分别表示当前全局中最优和最差的适应度值。当fi>fg时,说明该个体处于种群边缘,容易受到捕食者的攻击;当fi=fg时,说明此时的预警者为种群中心的麻雀,它会向其他麻雀不断靠近,以此来远离危险区域。
3、集成学习框架的选择:
传统AdaBoost算法作为一种二分类算法,在多分类问题中应用时,需构建一组二分类器,综合所有二分类器的输出,投票产生最终分类结果。但多个分类器间的相互干扰会导致集成模型的分类准确率较低,且AdaBoost算法集成的模型体量庞大,使得模型计算量和训练时间都大幅增加。为避免上述问题,本发明在原有算法框架的基础上采用改进的AdaBoost.M2算法。首先,扩展基分类器的输出形式,由单一离散值扩展为1×m的向量,向量中每个元素都介于0和1之间,表示该样本属于某一类别的置信度,以增强基分类器的表达能力。其次,针对传统算法中因加权误差到达迭代停止条件过快,而导致的算法迭代次数过少,集成效果差的问题,本发明引入伪损失函数以替代加权误差,用伪损失函数衡量基分类器的分类效果,在更多关注错分样本的同时,将错分样本的分类结果作为分类器权重以及样本权重的更新条件,以提高集成分类器的性能。
5、基于正弦优化的ISSA算法性能评估:
设麻雀种群样本规模为50,最大迭代次数为100,预警值为0.6,以7:3的比例将种群划分为发现者和加入者,每次迭代随机选择的预警者比例为0.2,分别使用传统SSA算法和本发明所提基于正弦优化的ISSA算法优化模型相关参数。分别经10次仿真得到两种算法收敛次数对比曲线,如图2所示。
由图2可知,传统SSA算法收敛次数均值为64,标准差为26.1;本发明所提改进算法收敛次数均值为21,标准差为11.3。传统SSA算法经正弦优化后,其收敛次数显著减少,收敛速度和稳定性均得到了大幅提升。
为进一步验证参数优化算法对模型诊断准确度的提升效果,本发明将同一数据集分别输入原始ELM模型和ISSA-ELM模型中,其分类结果如图3所示。
由图3可知,优化后ELM模型的错分样本数目明显减少,分类准确率得到了较大提升。优化前ELM模型的诊断准确率为79.1209%,使用ISSA优化后,ELM模型的诊断准确率提升到90.1099%,验证了基于正弦优化的ISSA算法对变压器故障诊断模型分类能力提升的有效性。
6、AdaBoost.M2算法自适应集成效果:
设置最大迭代次数为50,εk<0.5为迭代停止条件,输入给定样本权重的数据集,基于所提ISSA-ELM算法训练得到多个基分类器,根据各基分类器的分类结果,自适应调整每轮迭代的样本权重以及错误标签权重,并使用AdaBoost.M2算法构建集成分类器。图4分别绘制了迭代过程中单一基分类器和集成分类器的准确率变化曲线。
由图4可知,AdaBoost.M2算法所构建的分类模型综合了所有基分类器的诊断结果,弥补了各基分类器间因相互独立无法交流,导致某些易混淆样本难以识别的不足,模型诊断准确率得到了进一步提升。
为验证AdaBoost.M2算法较传统AdaBoost算法在集成效果上的优势,本发明在两种算法框架下,分别以BP神经网络和ELM网络作为基分类器构建分类模型。在最大迭代次数均为10的情况下,对比分析两种算法的性能,如图5所示。传统AdaBoost算法的“一对多”策略会人为造成数据集不均衡,故本发明AdaBoost算法采用“一对一”策略。
由图5可知,在已选定基分类器的前提下,基于AdaBoost.M2算法构建的自适应集成模型在诊断效果和训练时间上明显优于传统AdaBoost算法;同时,不同的基分类算法会对集成模型的性能产生不同影响,在两种集成框架下,将ELM网络作为基分类器构建的故障诊断模型,其准确率和训练时间均优于BP神经网络。
7、AdaBoost.M2-ISSA-ELM模型性能评估:
图6给出了所提AdaBoost.M2-ISSA-ELM模型的混淆矩阵。在混淆矩阵基础上,可得到模型的多个评价指标:包括准确率、查准率、查全率、kappa系数、海明距离和ROC曲线。本发明基于上述指标构建综合评估体系,对所提出的故障诊断模型进行全面评估。表1给出了AdaBoost.M2-ISSA-ELM模型的综合评估结果。图7给出了AdaBoost.M2-ISSA-ELM模型的ROC曲线。
表1
由混淆矩阵和表1可知,该模型能够准确诊断出正常、高能放电、中低温过热和局部放电四种故障类型,分类精度均达到100%,对于高温过热故障也有很好的识别效果,分类精度为97.6%,模型的综合诊断准确率高达95.6%。
图7为AdaBoost.M2-ISSA-ELM模型的ROC曲线,由图7可知,六种故障类型的曲线下面积(AUC)分别为1、0.9445、0.9864、1、0.9998、1,其中,正常、中低温过热和局部放电三种类型的ROC曲线均过点(0,1),其余各曲线也接近该点,表明本发明所提模型能兼顾敏感性和特异性,对所有故障类型均有较高的诊断准确率。
可见,本发明所提AdaBoost.M2-ISSA-ELM模型对于各种评价指标均展现出优良的性能,在电力变压器故障诊断中具有高准确性和稳定性。
8、不同故障诊断模型的性能对比分析:
为验证本发明所提模型的分类效果,表2分别给出了8种不同故障诊断模型,在同一数据集下的准确率、F1值、kappa系数和海明距离。
表2
由表2可知,各种传统智能算法(算法1-4)中,基于ELM构建的故障诊断模型诊断效果较好,但基于上述单一型传统智能算法的模型,由于样本规模较小、质量较低,训练过程中对样本特征提取不够深入全面,影响样本数据与故障类型之间的映射关系,导致诊断准确率普遍较低。算法5采用正弦优化的麻雀搜索算法对ELM模型加以改进,得到ISSA-ELM算法,防止故障诊断模型陷入局部最优的同时增强了样本特征提取的能力,提升了故障诊断效果。算法6-8是基于不同基分类器的集成型故障诊断模型,由模型评价指标可知,与单一模型相比,集成后模型的性能指标均有明显提升。而本发明所提的AdaBoost.M2-ISSA-ELM模型诊断准确率高达95.6%,宏F1值为95.5%、微F1值为97.8%,kappa系数高达94.6%,海明距离4.4%最小,性能指标均优于其他集成模型。
图8给出了不同模型的故障诊断雷达图,由图8可知,不同的诊断模型对各种故障类型的识别能力不同,CNN善于识别中低温过热,SVM善于识别正常及高能放电,而ELM对于低能放电、局部放电及高温过热均有较好的诊断效果;集成模型较单一模型在诊断效果上有所提升;与其他故障诊断模型相比,本发明所提AdaBoost.M2-ISSA-ELM模型对六种类型的识别准确率均最高,变压器正常、高能放电、中低温过热和局部放电四种类型的诊断精度达到了100%,对于高温过热故障也有很好的识别效果,在变压器故障诊断的应用中具有突出优势
9、对于本发明提出的算法原理的解释:
(1)ELM原理:
极限学习机(Extreme Learning Machine,简称ELM)是一种基于单层前馈神经网络的机器学习方法,其网络模型结构如图9所示,图中,xi=[xi1,xi2,…,xid]T为第i个样本的输入量,d为输入层神经元个数yi=[yi1,yi2,…,yim]T为模型关于xi的输出量,m为输出层神经元个数。样本xi对应第j个隐含层神经元的输出hj(xi)为:
hj(xi)=G(ωj·xi+bj)
其中:ωj=[ωj1,ωj2,…,ωjd]T为第j个隐含层神经元与输入层间的权值向量,bj为第j个隐含层神经元的偏置,G为激励函数,j=1,2,…,l,l为隐含层节点个数。
样本xi对应输出层的输出yi为:
其中,βj为第j个隐含层神经元与输出层间的权重。
则n个样本的输出矩阵为:
Y=Hβ
其中,Y=[y1,y2,…,yn]T,β=[β1,β2,…,βl]T,
设n维样本集的真实标签为T=[t1,t2,…,tn]T,则根据式(11)可求解隐含层与输出层间的权重β:
β=H*T
其中H*为隐含层输出矩阵的Moore-Penrose广义逆。
(2)AdaBoost.M2算法原理:
选定样本训练集S={xi,zi},i=1,2,…,n,其中n为样本个数,xi为第i个样本的输入量,zi∈C为样本的真实标签量,C={1,2,…,m}为全标签集合,m为分类问题的类别个数。
设置最大迭代次数K,初始化样本权重D1(i)和错误标签权重
其中,z为第i个样本的错误标签集合。
计算第k次迭代中样本i的错误标签权重和Wi k,错误标签加权函数值qk(i,z)以及样本权重Dk(i)。
计算第k次迭代的弱假设hk:
hk=I(S,Dk)
其中,I表示该轮迭代所选择的弱学习算法,本发明中为所提ISSA-ELM算法,其输出为n×m的置信度矩阵hk(x,z)。
使用伪损失εk替换传统AdaBoost算法中的加权误差,若εk<0.5,则计算基分类器的权重βk。
其中,Dk(i)为第k次迭代的样本权重,hk(xi,z)为基分类器hk将xi分类为z的置信度。
在置信度矩阵hk(x,z)和权重βk的基础上更新样本的错误标签权重。
将得到的k个置信度矩阵hk(x,z)按各自权重βk进行叠加,得到集成分类器的最终置信度矩阵,并根据该矩阵输出最终分类结果H(x)。
10、对于技术方案中出现的专业术语解释:
(1)置信度:在统计学中,一个概率样本的置信区间是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数测量值的可信程度范围,即前面所要求的“一定概率”。这个概率被称为置信度。
(2)激励函数:神经网络中的每个节点接受输入值,并将输入值传递给下一层,输入节点会将输入属性值直接传递给下一层(隐含层或输出层)。在神经网络中,隐含层和输出层节点的输入和输出之间具有函数关系,这个函数称为激励函数。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
在本发明的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种用于电力变压器的故障诊断方法,其特征在于,包括以下步骤:
采集电力变压器的故障样本;
以极限学习机ELM作为基分类器,使用基于正弦优化的改进麻雀搜索算法进行优化,通过优化后的基分类器,对所述故障样本进行分类处理;
基于AdaBoost.M2算法综合分类结果,对所述电力变压器进行故障诊断。
2.根据权利要求1所述一种用于电力变压器的故障诊断方法,其特征在于:
在对ELM进行优化的过程中,将ELM模型分类结果的误差率作为优化算法中调整种群位置信息的适应度,所述适应度表示为:
其中,noutput=target表示模型分类正确的样本个数,nall表示样本总个数。
3.根据权利要求2所述一种用于电力变压器的故障诊断方法,其特征在于:
在获取改进麻雀搜索算法的过程中,通过所述正弦优化算法,构造了一个自适应权重因子w,用以调节麻雀个体的移动范围,改进麻雀个体的位置更新策略,其中,自适应权重因子w表示:
其中,wmax和wmin分别表示权重变化范围的最大值以及最小值;fi k表示第k次迭代中第i只麻雀的适应度值,分别表示第k次迭代的最优、最劣适应度值。
4.根据权利要求3所述一种用于电力变压器的故障诊断方法,其特征在于:
在通过正弦优化算法对麻雀算法进行改进的过程中,当某一麻雀个体需要移动时,首先判断其当前所处位置,若相对本次迭代的最优适应度位置较近,则将w赋较小值,使得该个体在原来的位置附近继续搜索;而对于距离最劣位置较近的麻雀个体,则通过增大w值使其更快远离当前位置,前往其他区域探索;改进后麻雀算法兼顾了麻雀种群的全局搜索和局部开发能力的同时,显著提升了算法的收敛速度。
5.根据权利要求4所述一种用于电力变压器的故障诊断方法,其特征在于:
响应于改进的麻雀算法的构建,改进后的麻雀算法的发现者位置更新策略为:
式中,表示第k次迭代中,第i只麻雀在维度j上所处的位置,itermax表示最大迭代次数,α为(0,1]上的一个随机数,Q为服从正态分布的随机数,L为一个1×d的全1矩阵,R∈[0,1]为预警值,表示麻雀对于周围环境的警惕程度,ST∈[0.5,1]为安全值,作为麻雀是否需要躲避危险的判断条件;
改进后的麻雀算法的加入者位置更新过程为:
式中,表示第k次迭代中全局适应度最差的位置,/>表示当前发现者中适应度最优的位置,A表示一个d维的行向量,由1或-1的随机数构成,且A+=AT(AAT)-1;
改进后的麻雀算法的发现者位置更新策略为:
式中,表示第k次迭代中全局适应度值最优的位置,β为服从均值为0、方差为1的正态分布的随机数,B为[-1,1]上的随机数,正负表示麻雀移动方向,大小表示步长控制参数,ε为一个较小的常数,以避免分母为零,fi表示麻雀个体i的适应度值,fg和fw分别表示当前全局中最优和最差的适应度值。
6.根据权利要求5所述一种用于电力变压器的故障诊断方法,其特征在于:
响应于优化后的基分类器,通过改进的麻雀搜索算法分别对ELM算的隐含层神经元与输入层间的权值向量,以及隐含层神经元的偏置进行优化,用于避免ELM模型陷入局部最优。
7.一种用于电力变压器的故障诊断系统,其特征在于,包括:
数据采集模块,用于采集电力变压器的故障样本;
数据处理模块,用于以极限学习机ELM作为基分类器,使用基于正弦优化的改进麻雀搜索算法进行优化,通过优化后的基分类器,对所述故障样本进行分类处理;
故障诊断模块,用于基于AdaBoost.M2算法综合分类结果,对所述电力变压器进行故障诊断。
8.根据权利要求7所述一种用于电力变压器的故障诊断系统,其特征在于:
所述数据处理模块,通过所述正弦优化算法,构造了一个自适应权重因子w,用以调节麻雀个体的移动范围,改进麻雀个体的位置更新策略,当某一麻雀个体需要移动时,首先判断其当前所处位置,若相对本次迭代的最优适应度位置较近,则将w赋较小值,使得该个体在原来的位置附近继续搜索;而对于距离最劣位置较近的麻雀个体,则通过增大w值使其更快远离当前位置,前往其他区域探索;改进后麻雀算法兼顾了麻雀种群的全局搜索和局部开发能力的同时,显著提升了算法的收敛速度,其中,自适应权重因子w表示:
其中,wmax和wmin分别表示权重变化范围的最大值以及最小值;fi k表示第k次迭代中第i只麻雀的适应度值,分别表示第k次迭代的最优、最劣适应度值。
9.根据权利要求8所述一种用于电力变压器的故障诊断系统,其特征在于:
所述数据处理模块的改进后的麻雀算法的发现者位置更新策略为:
式中,表示第k次迭代中,第i只麻雀在维度j上所处的位置,itermax表示最大迭代次数,α为(0,1]上的一个随机数,Q为服从正态分布的随机数,L为一个1×d的全1矩阵,R∈[0,1]为预警值,表示麻雀对于周围环境的警惕程度,ST∈[0.5,1]为安全值,作为麻雀是否需要躲避危险的判断条件;
所述数据处理模块的改进后的麻雀算法的加入者位置更新过程为:
式中,表示第k次迭代中全局适应度最差的位置,/>表示当前发现者中适应度最优的位置,A表示一个d维的行向量,由1或-1的随机数构成,且A+=AT(AAT)-1;
所述数据处理模块的改进后的麻雀算法的发现者位置更新策略为:
式中,表示第k次迭代中全局适应度值最优的位置,β为服从均值为0、方差为1的正态分布的随机数,B为[-1,1]上的随机数,正负表示麻雀移动方向,大小表示步长控制参数,ε为一个较小的常数,以避免分母为零,fi表示麻雀个体i的适应度值,fg和fw分别表示当前全局中最优和最差的适应度值。
10.根据权利要求9所述一种用于电力变压器的故障诊断系统,其特征在于:
所述数据处理模块,通过改进的麻雀搜索算法分别对ELM算的隐含层神经元与输入层间的权值向量,以及隐含层神经元的偏置进行优化,用于避免ELM模型陷入局部最优。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310641912.6A CN116663414A (zh) | 2023-06-01 | 2023-06-01 | 一种用于电力变压器的故障诊断方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310641912.6A CN116663414A (zh) | 2023-06-01 | 2023-06-01 | 一种用于电力变压器的故障诊断方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116663414A true CN116663414A (zh) | 2023-08-29 |
Family
ID=87720225
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310641912.6A Pending CN116663414A (zh) | 2023-06-01 | 2023-06-01 | 一种用于电力变压器的故障诊断方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116663414A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117336195A (zh) * | 2023-12-01 | 2024-01-02 | 中国西安卫星测控中心 | 一种基于雷达图法的入侵检测模型综合性能评估方法 |
-
2023
- 2023-06-01 CN CN202310641912.6A patent/CN116663414A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117336195A (zh) * | 2023-12-01 | 2024-01-02 | 中国西安卫星测控中心 | 一种基于雷达图法的入侵检测模型综合性能评估方法 |
CN117336195B (zh) * | 2023-12-01 | 2024-02-06 | 中国西安卫星测控中心 | 一种基于雷达图法的入侵检测模型综合性能评估方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liao et al. | Fault diagnosis of power transformers using graph convolutional network | |
CN105488528B (zh) | 基于改进自适应遗传算法的神经网络图像分类方法 | |
CN110929847A (zh) | 一种基于深度卷积神经网络的换流变压器故障诊断方法 | |
CN112116058B (zh) | 一种基于粒子群算法优化多粒度级联森林模型的变压器故障诊断方法 | |
CN113095442B (zh) | 基于半监督学习在多维度雷达数据下的冰雹识别方法 | |
CN108881196A (zh) | 基于深度生成模型的半监督入侵检测方法 | |
Pal | Soft computing for feature analysis | |
CN110070141A (zh) | 一种网络入侵检测方法 | |
Addeh et al. | Statistical process control using optimized neural networks: A case study | |
CN110213244A (zh) | 一种基于时空特征融合的网络入侵检测方法 | |
CN115018021A (zh) | 基于图结构与异常注意力机制的机房异常检测方法及装置 | |
CN112149883A (zh) | 基于fwa-bp神经网络的光伏功率预测方法 | |
CN116663414A (zh) | 一种用于电力变压器的故障诊断方法及系统 | |
CN114925612A (zh) | 基于麻雀搜索算法优化混合核极限学习机的变压器故障诊断方法 | |
CN115618261A (zh) | 一种基于nca与ssa-kelm的光伏接入配电网漏电识别方法 | |
Razavi-Far et al. | Optimal detection of new classes of faults by an invasive weed optimization method | |
CN109901064B (zh) | 基于ica-lvq的高压断路器故障诊断方法 | |
Gupta et al. | Lightweight computational intelligence for IoT health monitoring of off-road vehicles: Enhanced selection log-scaled mutation GA structured ANN | |
CN111695611A (zh) | 一种蜂群优化核极限学习和稀疏表示机械故障识别方法 | |
Wu et al. | Hybrid intelligent deep kernel incremental extreme learning machine based on differential evolution and multiple population grey wolf optimization methods | |
Skorpil et al. | Back-propagation and k-means algorithms comparison | |
CN111563348B (zh) | 基于深度支持向量机的变压器故障诊断方法 | |
CN115659258B (zh) | 一种基于多尺度图卷积孪生网络的配电网故障检测方法 | |
CN113255223B (zh) | 一种空调负荷短期预测方法及系统 | |
CN108898157B (zh) | 基于卷积神经网络的数值型数据的雷达图表示的分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |