CN106067066A - 基于遗传算法优化装袋算法的电力变压器故障诊断方法 - Google Patents
基于遗传算法优化装袋算法的电力变压器故障诊断方法 Download PDFInfo
- Publication number
- CN106067066A CN106067066A CN201610378057.4A CN201610378057A CN106067066A CN 106067066 A CN106067066 A CN 106067066A CN 201610378057 A CN201610378057 A CN 201610378057A CN 106067066 A CN106067066 A CN 106067066A
- Authority
- CN
- China
- Prior art keywords
- sample
- classification
- fault
- algorithm
- base grader
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Genetics & Genomics (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于遗传算法优化装袋算法的电力变压器故障诊断方法,具体按照以下步骤实施:步骤1,对利用DGA技术获得的五种变压器油中溶解气体进行数据预处理,并构建输入样本集,步骤2,利用训练样本集D’对Bagging‑CART算法进行训练,得到一系列CART基分类器,同时对待分类样本进行分类,步骤3,采用遗传算法对得到的全部E个CART基分类器进行选择,由于全部CART基分类器中存在相似甚至相同,以及分类性能不好的基分类器,采用遗传算法选择出部分性能优越,差异性大的基分类器,步骤4,得到待分类样本的最终分类结果,即变压器故障类别。本发明的方法能以此来对变压器故障状态进行更为精确有效的判定。
Description
技术领域
本发明属于变压器在线监测与故障诊断技术领域,具体涉及一种基于遗传算法优化装袋算法的电力变压器故障诊断方法。
背景技术
电力系统是一个复杂且联系紧密的系统,各个环节相互依存,互相影响。油浸式大型变压器是目前电力系统应用最为广泛的变压器,是重要的枢纽设备,在变电和配电环节扮演着重要角色,承担着转换电压等级、变换交流电能的作用。但由于变压器内部构造十分复杂,在运行过程中,内部故障、外部因素以及老化等都会造成绝缘油裂解乃至材质劣化,造成变压器瘫痪,给电网运行造成严重后果。油浸式变压器在运行时,绝缘油纸会裂解产生各种气体,这些气体和变压器状态有着相当紧密的联系。油中溶解气体分析(DissolvedGas Analysis,简称DGA)技术因其科学合理性成为充油设备最常用的监测方法,该技术可为变压器故障诊断提供了数据基础。在该技术的基础上,衍生出一系列故障诊断方法。目前,传统变压器故障诊断方法存在编码不全,编码区间划分过于硬性,应用时需要丰富的工作经验等缺陷。而单一智能故障诊断方法存在初始参数设定困难,泛化能力较差等问题,制约了故障诊断准确率的提升。因此,对电力变压器进行深入的故障诊断研究,对指导变压器的运行维护和状态检修具有重要的理论和实际意义。
发明内容
本发明的目的是提供一种基于遗传算法优化装袋算法的电力变压器故障诊断方法,以此来对变压器故障状态进行更为精确有效的判定。
本发明所采用的技术方案是,
基于遗传算法优化装袋算法的电力变压器故障诊断方法,具体按照以下步骤实施:
步骤1,对利用DGA技术获得的五种变压器油中溶解气体进行数据预处理,并构建输入样本集,
步骤2,利用训练样本集D’对Bagging-CART算法进行训练,得到一系列CART基分类器,同时对待分类样本进行分类,
步骤3,采用遗传算法对步骤2中的到的全部E个CART基分类器进行选择,由于全部CART基分类器中存在相似甚至相同,以及分类性能不好的基分类器,采用遗传算法选择出部分性能优越,差异性大的基分类器,
步骤4,得到待分类样本的最终分类结果,即变压器故障类别。
本发明的特征还在于:
步骤1具体按照以下步骤实施:
步骤1.1,将氢气、甲烷、乙烷、乙烯、乙炔这五种典型特征气体的原始含量作为属性数据,分别记为A1、A2、A3、A4、A5,A1~A5都是由多个属性值组成的向量,假设采集了k次数据,则A1={a11,a21,…,ai1,…,ak1},A2={a12,a22,…,ai2,…,ak2},A3={a13,a23,…,ai3,…,ak3},A4={a14,a24,…,ai4,…,ak4},A5={a15,a25,…,ai5,…,ak5},
设xi={ai1,ai2,ai3,ai4,ai5}为其中第i个样本中的属性集,
则相对应的变压器故障类型记为yi,yi∈Y={Y1,Y2,…,Yn},
那么原始样本集为D={(x1,y1),(x2,y2),…,(xi,yi),…,(xk,yk)},其中(xi,yi)代表一个样本;
步骤1.2,对原始属性数据xi按式(1)进行最小最大规范化处理,将原始属性值映射到[0,1]区间,
dnew=(dor-dmin)/(dmax-dmin) (1)
其中,dor是原始数据,dmin是原始数据中的最小值,dmax是原始数据中的最大值,dnew为归一化后的数据,经归一化后的属性集为Bi={bi1,bi2,bi3,bi4,bi5};
步骤1.3,对归一化后的属性数据xi’进行维规约处理,使ci1=bi2/bi1,ci2=bi4/bi3,ci3=bi5/bi4使原始数据由5维降至3维,Ci={ci1,ci2,ci3}为经步骤1.1和步骤1.2两步数据预处理后的属性集。
则算法的新样本集为D’={(C1,y1),(C2,y2),…,(Ci,yi),…,(Ck,yk)};
步骤1.4,将新的样本集D’作为算法的训练样本集,X={a1,a2,a3,a4,a5}为经过步骤1.2和步骤1.3处理后的待分类样本。
步骤2具体按照以下步骤实施:
步骤2.1,Bagging算法参数初始化,Bagging算法只有一个参数需要事先设定,即迭代次数。设迭代次数为E(E为正整数),初始化迭代次数t=1;
步骤2.2,由D’经重采样技术得到第t次迭代所需的训练样本集dt;t表示第t次迭代;
步骤2.3,采用dt构建一个CART基分类器h(t),具体步骤如下:
步骤2.4,判断迭代次数t是否小于E,
若t<E,则t=t+1,重复步骤2.2和步骤2.3;
若t≥E,则停止迭代,得到E个CART基分类器{I1,I2,…,It,…,IE}。
步骤2.5,采用E个CART基分类器对待分类样本X={a1,a2,a3,a4,a5}进行分类。
步骤2.3具体按照以下步骤实施,
步骤2.3.1,设训练样本集dt包含m个类别,即m个变压器的状态类型,则Gini指数的计算式为:
其中,pj表示节点N处属于类别j(j∈m)的样本数占总样本数的比重;
步骤2.3.2,Gini指数需要考虑A1~A5每个属性的二元划分,假定某个属性A的二元划分将dt划分成dtL和dtR,则此次在节点N处以某属性A划分样本集dt的Gini指数改变量为:
其中,N是分裂节点;|dtL|/dt表示节点N中左分支样本数占总数的比例,|dtR|/dt表示节点N中右分支样本数占总数的比例;G(NL)和G(NR)分别表示分裂后左右分支节点的Gini指数。
步骤2.3.3,对A1~A5每个属性,考虑所有可能的二元划分,均按式(2)和式(3)计算Gini指数改变量,选择Gini指数改变量最小的属性Af(f=1,2,3,4,5)作为节点N的分裂属性,产生最小Gini指数改变量的子集作为分裂子集。按照此规则,以训练样本集dt作为根节点,由上至下不断分裂,在满足下述条件之一时停止建树:①所有叶节点中的样本数为1;②所有叶节点中的样本属于同一类。至此,整棵分类回归树生长完成,得到一个CART基分类器。
步骤2.5具体按照以下步骤实施:
步骤2.5.1,在待分类样本X中的五个属性a1~a5中寻找和分类回归树的根节点属性相同的属性;
步骤2.5.2,按照已经生成的分类回归树中的规则,寻找该属性处同根节点相同的属性值,判断待分类样本属于左右哪一分支子集,寻找到下一子节点,进而继续进行属性匹配;
步骤2.5.3,通过CART分类回归树自顶向下,逐层查找,得出最终的变压器故障诊断结果即得出故障类别;
步骤2.5.4,重复进行步骤2.5.1至步骤2.5.3,得到对应于待分类样本的E个故障类别,设这E个故障类别表示为F={f1,f2,…,fE}。
步骤3具体按照以下步骤实施,
步骤3.1,设置遗传算法编码长度为固定值E,设定群体规模Gpop_size,交叉概率Gcross_rate,变异概率Gmutate_rate,终止代数S;
步骤3.2,使用二进制编码方式全部基分类器进行编码,每个基分类器相当于等位基因,对应编码值0或者1,基因值为1表示该基分类器被选中,基因值为0表示基分类器未被选中,不同的二进制基因编码串表示不同的个体,共有r=2E个体组成群体Q={q1,q2,…,qi,…,qr}
步骤3.3,对个体qi进行适应度评价。由于需要选择出一种基分类器组合使最终的强分类器泛化性能最优,因此,可以将最终的强分类器的十折交叉验证准确度作为适应度评价函数,
步骤3.4,对群体Q进行选择操作。采用轮盘赌算子进行选择运算,使适应性强的个体以一个较高的概率为下一代贡献1个或多个后代。但是由于这种选择具有随机性,在选择的过程中可能会丢失比较好的个体,所以同时使用精英机制,将前代最优个体直接选到下一代中;
步骤3.5,对群体Q进行交叉操作。采用交叉算子产生新个体。本文采用单点交叉算子将上述通过选择运算得到的个体以随机方式配对,然后随机选择交叉位置,已配对的染色体互相交换交叉位置以后二进制基因串(包括交叉位置)。交叉运算是产生新个体的主要方法;
步骤3.6,对群体Q进行变异操作。利用变异算子产生新个体。本文采用单点变异算子,随机选择变异个体,再随机选择变异位置,对该位置的二进制数字进行变异,也就是1变成0,0变成1。变异运算是产生新个体的辅助方法;
步骤3.7,循环进行步骤3.3至步骤3.6,直到达到预设的终止迭代数S;
步骤3.8,对群体Q中所有个体的适应度值进行排序,选择适应度值最大的个体作为最优个体qbest,即就是最佳基分类器组合。
步骤3.3具体实施步骤如下:
步骤3.3.1,将训练集D’平均分成10份,每一份都包含所有变压器故障类别,这10份样本集分别为D’1,D’2,…,D’10;
步骤3.3.2,把D’1,D’2,…,D’9作为适应度评价阶段的训练样本集Dtr={D’1,D’2,…,D’9},剩下的一份D’10作为适应度评价阶段的验证样本集Dval=D’10;
步骤3.3.3,以Dtr代替步骤2中的D’执行步骤2中的(1)~(4),得到适应度评价阶段EGA=E个CART基分类器{J1,J2,…,Jt,…,JE};
步骤3.3.4,在EGA个基分类器中选择出编码为1的CART基分类器对验证样本集Dval进行分类,并对分类结果进行多数投票集成,最终的变压器故障诊断结果为:
其中I(·)是一个指标函数,当括号内为真,则I为1,反之为0;h(t)为第t个基分类器的分类结果;
步骤3.3.5,再把D’9作为适应度评价阶段的验证样本集Dval=D’9,剩下的九份作为适应度评价阶段的训练样本集Dval=D’10,再次执行步骤3.3.3至步骤3.3.4,循环10次,每份样本集轮流作为验证集。其实就是把D’1到D’9轮流执行一次步骤3.3.3和3.3.4;
步骤3.3.6,对当前个体qi进行适应度评价,以最终的强分类器的十折交叉验证准确度作为适应度评价函数,定义如下:
其中,e为交叉验证时每份数据集所包含的样本数,Hij和yij分别为第j份样本集中第i个验证样本的集成预测故障类别和实际变压器故障类别。f表示个体qi的值。
步骤4具体为:
根据最优个体qbest的编码,选出和编码值1相对应的部分CART基分类器进行集成,得到最终的强分类器并对待分类样本进行故障类别判断。根据选出的最优个体qbest的二进制编码串,选择出编码为1的CART基分类器,对应步骤2中的2.5.4的待分类样本分类结果F={f1,f2,…,fE},将选择出的基分类器的对应分类结果G={G(1),G(2),…,G(z-1),G(z)}∈F进行最终的集成,集成方式仍采用式(3)所示的多数投票方式,得到待分类样本的最终分类结果,即变压器故障类别。
本发明的有益效果是:本发明的方法考虑到变压器故障诊断的实质是多分类问题,以油中溶解气体分析(Dissolved Gas Analysis,简称DGA)技术为基础,由于单一分类回归树(Classification and Regression Trees,简称CART)算法的故障诊断准确度不高,将CART算法作为基分类器,采用装袋(Bagging)算法对CART算法进行集成,从而提高单一CART算法的准确度。但是考虑到在集成过程中会产生相似甚至相同的基分类器,降低了基分类器之间的差异性,影响最终强分类器的泛化能力,故进一步采用遗传算法(GeneticAlgorithm,简称GA)作为一种全局寻优算法,从全部基分类器中选择出最优的部分基分类器进行集成,即选择性集成,以此提高变压器的故障诊断准确度。
附图说明
图1是本发明基于遗传算法优化装袋算法的电力变压器故障诊断方法的整体流程图;
图2是本发明的基于遗传算法优化装袋算法的电力变压器故障诊断方法中Bagging-CART算法流程图;
图3是本发明的基于遗传算法优化装袋算法的电力变压器故障诊断方法中使用的CART基分类器模型示意图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
本发明基于遗传算法优化装袋算法的电力变压器故障诊断方法,以油中溶解气体分析(Dissolved Gas Analysis,简称DGA)技术获得的五种油中溶解气体:氢气(H2)、甲烷(CH4)、乙烷(C2H6)、乙烯(C2H4)、乙炔(C2H2)作为方法的输入属性,将分类回归树(Classification and Regression Trees,简称CART)算法作为基分类器,采用装袋(Bagging)算法对CART算法进行集成,得到装袋分类回归树组合(Bagging-CART)算法,再采用遗传算法(Genetic Algorithm,简称GA)对Bagging-CART算法进行优化,GA优化Bagging-CART算法变压器故障诊断模型如附图1,具体按照以下步骤实施:
步骤1,对利用DGA技术获得的五种变压器油中溶解气体进行数据预处理,并构建输入样本集,具体步骤如下:
步骤1.1,将氢气(H2)、甲烷(CH4)、乙烷(C2H6)、乙烯(C2H4)、乙炔(C2H2)这五种典型特征气体的原始含量作为属性数据,分别记为A1、A2、A3、A4、A5,A1~A5都是由多个属性值组成的向量,假设采集了k次数据,则A1={a11,a21,…,ai1,…,ak1},A2={a12,a22,…,ai2,…,ak2},A3={a13,a23,…,ai3,…,ak3},A4={a14,a24,…,ai4,…,ak4},A5={a15,a25,…,ai5,…,ak5},
设xi={ai1,ai2,ai3,ai4,ai5}为其中第i个样本中的属性集,
则相对应的变压器故障类型记为yi,yi∈Y={Y1,Y2,…,Yn},
那么原始样本集为D={(x1,y1),(x2,y2),…,(xi,yi),…,(xk,yk)},其中(xi,yi)代表一个样本;
步骤1.2,对原始属性数据xi按式(1)进行最小最大规范化处理,将原始属性值映射到[0,1]区间,
dnew=(dor-dmin)/(dmax-dmin) (1)
其中,dor是原始数据,dmin是原始数据中的最小值,dmax是原始数据中的最大值,dnew为归一化后的数据,经归一化后的属性集为Bi={bi1,bi2,bi3,bi4,bi5};
步骤1.3,对归一化后的属性数据xi’进行维规约处理,使ci1=bi2/bi1,ci2=bi4/bi3,ci3=bi5/bi4使原始数据由5维降至3维,Ci={ci1,ci2,ci3}为经步骤1.1和步骤1.2两步数据预处理后的属性集。
则算法的新样本集为D’={(C1,y1),(C2,y2),…,(Ci,yi),…,(Ck,yk)};
步骤1.4,将新的样本集D’作为算法的训练样本集,X={a1,a2,a3,a4,a5}为经过步骤1.2和步骤1.3处理后的待分类样本。
步骤2,利用训练样本集D’对Bagging-CART算法进行训练,得到一系列CART基分类器,同时对待分类样本进行分类,方法的流程图如附图2所示,具体实施步骤如下:
步骤2.1,Bagging算法参数初始化,Bagging算法只有一个参数需要事先设定,即迭代次数。设迭代次数为E(E为正整数),初始化迭代次数t=1;
步骤2.2,由D’经重采样技术得到第t次迭代所需的训练样本集dt;t表示第t次迭代;
步骤2.3,采用dt构建一个CART基分类器h(t),具体步骤如下:
步骤2.3.1,设训练样本集dt包含m个类别,即m个变压器的状态类型,则Gini指数的计算式为:
其中,pj表示节点N处属于类别j(j∈m)的样本数占总样本数的比重;
步骤2.3.2,Gini指数需要考虑A1~A5每个属性的二元划分,假定某个属性A的二元划分将dt划分成dtL和dtR,则此次在节点N处以某属性A划分样本集dt的Gini指数改变量为:
其中,N是分裂节点;|dtL|/dt表示节点N中左分支样本数占总数的比例,|dtR|/dt表示节点N中右分支样本数占总数的比例;G(NL)和G(NR)分别表示分裂后左右分支节点的Gini指数。
步骤2.3.3,对A1~A5每个属性,考虑所有可能的二元划分,均按式(2)和式(3)计算Gini指数改变量,选择Gini指数改变量最小的属性Af(f=1,2,3,4,5)作为节点N的分裂属性,产生最小Gini指数改变量的子集作为分裂子集。按照此规则,以训练样本集dt作为根节点,由上至下不断分裂,在满足下述条件之一时停止建树:①所有叶节点中的样本数为1;②所有叶节点中的样本属于同一类。至此,整棵分类回归树生长完成,得到一个CART基分类器,CART基分类器模型如附图3所示;
步骤2.4,判断迭代次数t是否小于E,
若t<E,则t=t+1,重复步骤2.2和步骤2.3;
若t≥E,则停止迭代,得到E个CART基分类器{I1,I2,…,It,…,IE}。
步骤2.5,采用E个CART基分类器对待分类样本X={a1,a2,a3,a4,a5}进行分类,具体按照以下步骤实施:
步骤2.5.1,在待分类样本X中的五个属性a1~a5中寻找和分类回归树的根节点属性相同的属性;
步骤2.5.2,按照已经生成的分类回归树中的规则,寻找该属性处同根节点相同的属性值,判断待分类样本属于左右哪一分支子集,寻找到下一子节点,进而继续进行属性匹配;
步骤2.5.3,通过CART分类回归树自顶向下,逐层查找,得出最终的变压器故障诊断结果即得出故障类别;
步骤2.5.4,重复进行步骤2.5.1至步骤2.5.3,得到对应于待分类样本的E个故障类别,设这E个故障类别表示为F={f1,f2,…,fE};
步骤3,采用遗传算法对步骤2.4中的到的全部E个CART基分类器进行选择,由于全部CART基分类器中存在相似甚至相同,以及分类性能不好的基分类器,采用遗传算法选择出部分性能优越,差异性大的基分类器,具体步骤如下:
步骤3.1,设置遗传算法编码长度为固定值E,设定群体规模Gpop_size,交叉概率Gcross_rate,变异概率Gmutate_rate,终止代数S;
步骤3.2,使用二进制编码方式全部基分类器进行编码,每个基分类器相当于等位基因,对应编码值0或者1,基因值为1表示该基分类器被选中,基因值为0表示基分类器未被选中,不同的二进制基因编码串表示不同的个体,共有r=2E个体组成群体Q={q1,q2,…,qi,…,qr}
步骤3.3,对个体qi进行适应度评价。由于需要选择出一种基分类器组合使最终的强分类器泛化性能最优,因此,可以将最终的强分类器的十折交叉验证准确度作为适应度评价函数,具体实施步骤如下:
步骤3.3.1,将训练集D’平均分成10份,每一份都包含所有变压器故障类别,这10份样本集分别为D’1,D’2,…,D’10;
步骤3.3.2,把D’1,D’2,…,D’9作为适应度评价阶段的训练样本集Dtr={D’1,D’2,…,D’9},剩下的一份D’10作为适应度评价阶段的验证样本集Dval=D’10;
步骤3.3.3,以Dtr代替步骤2中的D’执行步骤2中的(1)~(4),得到适应度评价阶段EGA=E个CART基分类器{J1,J2,…,Jt,…,JE};
步骤3.3.4,在EGA个基分类器中选择出编码为1的CART基分类器对验证样本集Dval进行分类,并对分类结果进行多数投票集成,最终的变压器故障诊断结果为:
其中I(·)是一个指标函数,当括号内为真,则I为1,反之为0;h(t)为第t个基分类器的分类结果。
步骤3.3.5,再把D’9作为适应度评价阶段的验证样本集Dval=D’9,剩下的九份作为适应度评价阶段的训练样本集Dval=D’10,再次执行步骤3.3.3至步骤3.3.4,
循环10次,每份样本集轮流作为验证集。其实就是把D’1到D’9轮流执行一次步骤3.3.3和3.3.4
步骤3.3.6,对当前个体qi进行适应度评价,以最终的强分类器的十折交叉验证准确度作为适应度评价函数,定义如下:
其中,e为交叉验证时每份数据集所包含的样本数,Hij和yij分别为第j份样本集中第i个验证样本的集成预测故障类别和实际变压器故障类别。f表示个体qi的值。
步骤3.4,对群体Q进行选择操作。采用轮盘赌算子进行选择运算,使适应性强的个体以一个较高的概率为下一代贡献1个或多个后代。但是由于这种选择具有随机性,在选择的过程中可能会丢失比较好的个体,所以同时使用精英机制,将前代最优个体直接选到下一代中。
步骤3.5,对群体Q进行交叉操作。采用交叉算子产生新个体。本文采用单点交叉算子将上述通过选择运算得到的个体以随机方式配对,然后随机选择交叉位置,已配对的染色体互相交换交叉位置以后二进制基因串(包括交叉位置)。交叉运算是产生新个体的主要方法。
步骤3.6,对群体Q进行变异操作。利用变异算子产生新个体。本文采用单点变异算子,随机选择变异个体,再随机选择变异位置,对该位置的二进制数字进行变异,也就是1变成0,0变成1。变异运算是产生新个体的辅助方法。
步骤3.7,循环进行步骤3.3至步骤3.6,直到达到预设的终止迭代数S。
步骤3.8,对群体Q中所有个体的适应度值进行排序,选择适应度值最大的个体作为最优个体qbest,即就是最佳基分类器组合,
步骤4,根据最优个体qbest的编码,选出和编码值1相对应的部分CART基分类器进行集成,得到最终的强分类器并对待分类样本进行故障类别判断。根据选出的最优个体qbest的二进制编码串,选择出编码为1的CART基分类器,对应步骤2.5.4中的待分类样本分类结果F={f1,f2,…,fE},将选择出的基分类器的对应分类结果G={G(1),G(2),…,G(z-1),G(z)}∈F进行最终的集成,集成方式仍采用式(3)所示的多数投票方式,得到待分类样本的最终分类结果,即变压器故障类别。
本发明的有益效果是:
针对油浸式电力变压器故障样本数据为连续性数值数据的特点,采用CART算法作为基分类器,无需对原始数据进行离散化,可很好地处理连续属性数据。
利用Bagging算法可以构造出高精度的强分类器,其对基分类器的要求低,只需基分类器的分类准确率略大于50%,通过集成分类准确率低的单一算法,解决了强分类算法难以获得的问题,实现应用都相对简单,为工程变压器故障诊断提供了一种新的思路。
对于Bagging-CART算法中存在的不足,进一步采用遗传算法对Bagging-CART全集成算法作选择性集成优化,建立变压器故障诊断模型。该方法直接对编码进行操作,无需解码过程,所制定的适应度函数易于理解,可以更好的完成变压器故障诊断任务。
Claims (8)
1.基于遗传算法优化装袋算法的电力变压器故障诊断方法,其特征在于,具体按照以下步骤实施:
步骤1,对利用DGA技术获得的五种变压器油中溶解气体进行数据预处理,并构建输入样本集,
步骤2,利用训练样本集D’对Bagging-CART算法进行训练,得到一系列CART基分类器,同时对待分类样本进行分类,
步骤3,采用遗传算法对步骤2中的到的全部E个CART基分类器进行选择,由于全部CART基分类器中存在相似甚至相同,以及分类性能不好的基分类器,采用遗传算法选择出部分性能优越,差异性大的基分类器,
步骤4,得到待分类样本的最终分类结果,即变压器故障类别。
2.根据权利要求1所述的基于遗传算法优化装袋算法的电力变压器故障诊断方法,其特征在于,所述的步骤1具体按照以下步骤实施:
步骤1.1,将氢气、甲烷、乙烷、乙烯、乙炔这五种典型特征气体的原始含量作为属性数据,分别记为A1、A2、A3、A4、A5,A1~A5都是由多个属性值组成的向量,假设采集了k次数据,则A1={a11,a21,…,ai1,…,ak1},A2={a12,a22,…,ai2,…,ak2},A3={a13,a23,…,ai3,…,ak3},A4={a14,a24,…,ai4,…,ak4},A5={a15,a25,…,ai5,…,ak5},
设xi={ai1,ai2,ai3,ai4,ai5}为其中第i个样本中的属性集,
则相对应的变压器故障类型记为yi,yi∈Y={Y1,Y2,···,Yn},
那么原始样本集为D={(x1,y1),(x2,y2),…,(xi,yi),…,(xk,yk)},其中(xi,yi)代表一个样本;
步骤1.2,对原始属性数据xi按式(1)进行最小最大规范化处理,将原始属性值映射到[0,1]区间,
dnew=(dor-dmin)/(dmax-dmin) (1)
其中,dor是原始数据,dmin是原始数据中的最小值,dmax是原始数据中的最大值,dnew为归一化后的数据,经归一化后的属性集为Bi={bi1,bi2,bi3,bi4,bi5};
步骤1.3,对归一化后的属性数据xi’进行维规约处理,使ci1=bi2/bi1,ci2=bi4/bi3,ci3=bi5/bi4使原始数据由5维降至3维,Ci={ci1,ci2,ci3}为经步骤1.1和步骤1.2两步数据预处理后的属性集;
则算法的新样本集为D’={(C1,y1),(C2,y2),…,(Ci,yi),…,(Ck,yk)};
步骤1.4,将新的样本集D’作为算法的训练样本集,X={a1,a2,a3,a4,a5}为经过步骤1.2和步骤1.3处理后的待分类样本。
3.根据权利要求1所述的基于遗传算法优化装袋算法的电力变压器故障诊断方法,其特征在于,所述的步骤2具体按照以下步骤实施:
步骤2.1,Bagging算法参数初始化,Bagging算法只有一个参数需要事先设定,即迭代次数,设迭代次数为E(E为正整数),初始化迭代次数t=1;
步骤2.2,由D’经重采样技术得到第t次迭代所需的训练样本集dt;t表示第t次迭代;
步骤2.3,采用dt构建一个CART基分类器h(t),具体步骤如下:
步骤2.4,判断迭代次数t是否小于E,
若t<E,则t=t+1,重复步骤2.2和步骤2.3;
若t≥E,则停止迭代,得到E个CART基分类器{I1,I2,…,It,…,IE};
步骤2.5,采用E个CART基分类器对待分类样本X={a1,a2,a3,a4,a5}进行分类。
4.根据权利要求3所述的基于遗传算法优化装袋算法的电力变压器故障诊断方法,其特征在于,所述的步骤2.3具体按照以下步骤实施,
步骤2.3.1,设训练样本集dt包含m个类别,即m个变压器的状态类型,则Gini指数的计算式为:
其中,pj表示节点N处属于类别j(j∈m)的样本数占总样本数的比重;
步骤2.3.2,Gini指数需要考虑A1~A5每个属性的二元划分,假定某个属性A的二元划分将dt划分成dtL和dtR,则此次在节点N处以某属性A划分样本集dt的Gini指数改变量为:
其中,N是分裂节点;|dtL|/dt表示节点N中左分支样本数占总数的比例,|dtR|/dt表示节点N中右分支样本数占总数的比例;G(NL)和G(NR)分别表示分裂后左右分支节点的Gini指数;
步骤2.3.3,对A1~A5每个属性,考虑所有可能的二元划分,均按式(2)和式(3)计算Gini指数改变量,选择Gini指数改变量最小的属性Af(f=1,2,3,4,5)作为节点N的分裂属性,产生最小Gini指数改变量的子集作为分裂子集,按照此规则,以训练样本集dt作为根节点,由上至下不断分裂,在满足下述条件之一时停止建树:①所有叶节点中的样本数为1;②所有叶节点中的样本属于同一类,至此,整棵分类回归树生长完成,得到一个CART基分类器。
5.根据权利要求3所述的基于遗传算法优化装袋算法的电力变压器故障诊断方法,其特征在于,所述的步骤2.5具体按照以下步骤实施:
步骤2.5.1,在待分类样本X中的五个属性a1~a5中寻找和分类回归树的根节点属性相同的属性;
步骤2.5.2,按照已经生成的分类回归树中的规则,寻找该属性处同根节点相同的属性值,判断待分类样本属于左右哪一分支子集,寻找到下一子节点,进而继续进行属性匹配;
步骤2.5.3,通过CART分类回归树自顶向下,逐层查找,得出最终的变压器故障诊断结果即得出故障类别;
步骤2.5.4,重复进行步骤2.5.1至步骤2.5.3,得到对应于待分类样本的E个故障类别,设这E个故障类别表示为F={f1,f2,…,fE}。
6.根据权利要求1所述的基于遗传算法优化装袋算法的电力变压器故障诊断方法,其特征在于,所述的步骤3具体按照以下步骤实施,
步骤3.1,设置遗传算法编码长度为固定值E,设定群体规模Gpop_size,交叉概率Gcross_rate,变异概率Gmutate_rate,终止代数S;
步骤3.2,使用二进制编码方式全部基分类器进行编码,每个基分类器相当于等位基因,对应编码值0或者1,基因值为1表示该基分类器被选中,基因值为0表示基分类器未被选中,不同的二进制基因编码串表示不同的个体,共有r=2E个体组成群体Q={q1,q2,…,qi,…,qr};
步骤3.3,对个体qi进行适应度评价,由于需要选择出一种基分类器组合使最终的强分类器泛化性能最优,因此,可以将最终的强分类器的十折交叉验证准确度作为适应度评价函数;
步骤3.4,对群体Q进行选择操作,采用轮盘赌算子进行选择运算,使适应性强的个体以一个较高的概率为下一代贡献1个或多个后代,但是由于这种选择具有随机性,在选择的过程中可能会丢失比较好的个体,所以同时使用精英机制,将前代最优个体直接选到下一代中;
步骤3.5,对群体Q进行交叉操作,采用交叉算子产生新个体,本文采用单点交叉算子将上述通过选择运算得到的个体以随机方式配对,然后随机选择交叉位置,已配对的染色体互相交换交叉位置以后二进制基因串(包括交叉位置),交叉运算是产生新个体的主要方法;
步骤3.6,对群体Q进行变异操作,利用变异算子产生新个体,本文采用单点变异算子,随机选择变异个体,再随机选择变异位置,对该位置的二进制数字进行变异,也就是1变成0,0变成1,变异运算是产生新个体的辅助方法;
步骤3.7,循环进行步骤3.3至步骤3.6,直到达到预设的终止迭代数S;
步骤3.8,对群体Q中所有个体的适应度值进行排序,选择适应度值最大的个体作为最优个体qbest,即就是最佳基分类器组合。
7.根据权利要求6所述的基于遗传算法优化装袋算法的电力变压器故障诊断方法,其特征在于,所述的步骤3.3具体实施步骤如下:
步骤3.3.1,将训练集D’平均分成10份,每一份都包含所有变压器故障类别,这10份样本集分别为D’1,D’2,…,D’10;
步骤3.3.2,把D’1,D’2,…,D’9作为适应度评价阶段的训练样本集Dtr={D’1,D’2,…,D’9},剩下的一份D’10作为适应度评价阶段的验证样本集Dval=D’10;
步骤3.3.3,以Dtr代替步骤2中的D’执行步骤2中的(1)~(4),得到适应度评价阶段EGA=E个CART基分类器{J1,J2,…,Jt,…,JE};
步骤3.3.4,在EGA个基分类器中选择出编码为1的CART基分类器对验证样本集Dval进行分类,并对分类结果进行多数投票集成,最终的变压器故障诊断结果为:
其中I(·)是一个指标函数,当括号内为真,则I为1,反之为0;h(t)为第t个基分类器的分类结果;
步骤3.3.5,再把D’9作为适应度评价阶段的验证样本集Dval=D’9,剩下的九份作为适应度评价阶段的训练样本集Dval=D’10,再次执行步骤3.3.3至步骤3.3.4,循环10次,每份样本集轮流作为验证集,其实就是把D’1到D’9轮流执行一次步骤3.3.3和3.3.4;
步骤3.3.6,对当前个体qi进行适应度评价,以最终的强分类器的十折交叉验证准确度作为适应度评价函数,定义如下:
其中,e为交叉验证时每份数据集所包含的样本数,Hij和yij分别为第j份样本集中第i个验证样本的集成预测故障类别和实际变压器故障类别,f表示个体qi的值。
8.根据权利要求1所述的基于遗传算法优化装袋算法的电力变压器故障诊断方法,其特征在于,所述的步骤4具体为:
根据最优个体qbest的编码,选出和编码值1相对应的部分CART基分类器进行集成,得到最终的强分类器并对待分类样本进行故障类别判断,根据选出的最优个体qbest的二进制编码串,选择出编码为1的CART基分类器,对应步骤2中的2.5.4的待分类样本分类结果F={f1,f2,…,fE},将选择出的基分类器的对应分类结果G={G(1),G(2),…,G(z-1),G(z)}∈F进行最终的集成,集成方式仍采用式(3)所示的多数投票方式,得到待分类样本的最终分类结果,即变压器故障类别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610378057.4A CN106067066A (zh) | 2016-05-31 | 2016-05-31 | 基于遗传算法优化装袋算法的电力变压器故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610378057.4A CN106067066A (zh) | 2016-05-31 | 2016-05-31 | 基于遗传算法优化装袋算法的电力变压器故障诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106067066A true CN106067066A (zh) | 2016-11-02 |
Family
ID=57420947
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610378057.4A Pending CN106067066A (zh) | 2016-05-31 | 2016-05-31 | 基于遗传算法优化装袋算法的电力变压器故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106067066A (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106844842A (zh) * | 2016-12-15 | 2017-06-13 | 国网浙江省电力公司电力科学研究院 | 一种应用油色谱监测数据的电力变压器缺陷援例诊断方法 |
CN107016377A (zh) * | 2017-04-16 | 2017-08-04 | 北京工业大学 | 基于sgasen算法的人脸识别优化方法 |
CN107644127A (zh) * | 2017-09-08 | 2018-01-30 | 西安工程大学 | 基于imabc优化支持向量机的变压器故障诊断方法 |
CN107992880A (zh) * | 2017-11-13 | 2018-05-04 | 山东斯博科特电气技术有限公司 | 一种电力变压器最优集总分类故障诊断方法 |
CN108304567A (zh) * | 2018-02-09 | 2018-07-20 | 杭州安脉盛智能技术有限公司 | 高压变压器工况模式识别与数据分类方法及系统 |
CN108847679A (zh) * | 2018-08-06 | 2018-11-20 | 内蒙古电力(集团)有限责任公司内蒙古电力科学研究院分公司 | 风力发电机组及用于其的次同步振荡识别方法、装置及系统 |
CN109657795A (zh) * | 2018-12-12 | 2019-04-19 | 华中科技大学 | 一种基于属性选择的硬盘故障预测方法 |
CN109709938A (zh) * | 2018-12-29 | 2019-05-03 | 云南电网有限责任公司电力科学研究院 | 一种变压器状态的评估方法 |
CN109840541A (zh) * | 2018-12-05 | 2019-06-04 | 国网辽宁省电力有限公司信息通信分公司 | 一种基于XGBoost的电网变压器故障分类方法 |
CN110162014A (zh) * | 2019-05-29 | 2019-08-23 | 上海理工大学 | 一种集成多种智能算法的制冷系统故障诊断方法 |
CN110162013A (zh) * | 2019-05-29 | 2019-08-23 | 上海理工大学 | 一种制冷系统故障诊断方法 |
CN112507790A (zh) * | 2020-11-03 | 2021-03-16 | 北方工业大学 | 基于差异演化的互补分类回归树的故障诊断方法及系统 |
CN113283479A (zh) * | 2021-05-11 | 2021-08-20 | 西安交通大学 | 一种适用于电力变压器故障的特征提取与诊断方法 |
CN113762345A (zh) * | 2021-08-06 | 2021-12-07 | 国网冀北电力有限公司经济技术研究院 | 一种油浸式变压器故障诊断方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103235973A (zh) * | 2013-04-16 | 2013-08-07 | 郑州航空工业管理学院 | 一种基于径向基神经网络的变压器故障诊断方法 |
-
2016
- 2016-05-31 CN CN201610378057.4A patent/CN106067066A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103235973A (zh) * | 2013-04-16 | 2013-08-07 | 郑州航空工业管理学院 | 一种基于径向基神经网络的变压器故障诊断方法 |
Non-Patent Citations (3)
Title |
---|
张立彬等: "基于分类回归树_CART_方法的统计解析模型的应用与研究", 《浙江工业大学学报》 * |
谷凯凯等: "紧致融合模糊集和故障树的变压器故障诊断", 《高电压技术》 * |
黄新波等: "基于遗传算法优化Bagging_CART变压器故障诊断", 《高电压技术》 * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106844842B (zh) * | 2016-12-15 | 2020-03-03 | 国网浙江省电力公司电力科学研究院 | 一种应用油色谱监测数据的电力变压器缺陷援例诊断方法 |
CN106844842A (zh) * | 2016-12-15 | 2017-06-13 | 国网浙江省电力公司电力科学研究院 | 一种应用油色谱监测数据的电力变压器缺陷援例诊断方法 |
CN107016377A (zh) * | 2017-04-16 | 2017-08-04 | 北京工业大学 | 基于sgasen算法的人脸识别优化方法 |
CN107644127A (zh) * | 2017-09-08 | 2018-01-30 | 西安工程大学 | 基于imabc优化支持向量机的变压器故障诊断方法 |
CN107992880A (zh) * | 2017-11-13 | 2018-05-04 | 山东斯博科特电气技术有限公司 | 一种电力变压器最优集总分类故障诊断方法 |
CN108304567A (zh) * | 2018-02-09 | 2018-07-20 | 杭州安脉盛智能技术有限公司 | 高压变压器工况模式识别与数据分类方法及系统 |
CN108304567B (zh) * | 2018-02-09 | 2020-02-21 | 杭州安脉盛智能技术有限公司 | 高压变压器工况模式识别与数据分类方法及系统 |
CN108847679B (zh) * | 2018-08-06 | 2022-04-26 | 内蒙古电力(集团)有限责任公司内蒙古电力科学研究院分公司 | 风力发电机组及用于其的次同步振荡识别方法、装置及系统 |
CN108847679A (zh) * | 2018-08-06 | 2018-11-20 | 内蒙古电力(集团)有限责任公司内蒙古电力科学研究院分公司 | 风力发电机组及用于其的次同步振荡识别方法、装置及系统 |
CN109840541A (zh) * | 2018-12-05 | 2019-06-04 | 国网辽宁省电力有限公司信息通信分公司 | 一种基于XGBoost的电网变压器故障分类方法 |
CN109657795A (zh) * | 2018-12-12 | 2019-04-19 | 华中科技大学 | 一种基于属性选择的硬盘故障预测方法 |
CN109657795B (zh) * | 2018-12-12 | 2022-06-21 | 华中科技大学 | 一种基于属性选择的硬盘故障预测方法 |
CN109709938A (zh) * | 2018-12-29 | 2019-05-03 | 云南电网有限责任公司电力科学研究院 | 一种变压器状态的评估方法 |
CN110162014A (zh) * | 2019-05-29 | 2019-08-23 | 上海理工大学 | 一种集成多种智能算法的制冷系统故障诊断方法 |
CN110162013A (zh) * | 2019-05-29 | 2019-08-23 | 上海理工大学 | 一种制冷系统故障诊断方法 |
CN112507790A (zh) * | 2020-11-03 | 2021-03-16 | 北方工业大学 | 基于差异演化的互补分类回归树的故障诊断方法及系统 |
CN112507790B (zh) * | 2020-11-03 | 2023-09-29 | 北方工业大学 | 基于差异演化的互补分类回归树的故障诊断方法及系统 |
CN113283479A (zh) * | 2021-05-11 | 2021-08-20 | 西安交通大学 | 一种适用于电力变压器故障的特征提取与诊断方法 |
CN113762345A (zh) * | 2021-08-06 | 2021-12-07 | 国网冀北电力有限公司经济技术研究院 | 一种油浸式变压器故障诊断方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106067066A (zh) | 基于遗传算法优化装袋算法的电力变压器故障诊断方法 | |
CN105930901B (zh) | 一种基于rbpnn的变压器故障诊断方法 | |
CN110596492B (zh) | 一种基于粒子群算法优化随机森林模型的变压器故障诊断方法 | |
CN112116058B (zh) | 一种基于粒子群算法优化多粒度级联森林模型的变压器故障诊断方法 | |
CN111722046B (zh) | 一种基于深度森林模型的变压器故障诊断方法 | |
CN105335752A (zh) | 一种基于主成分分析多变量决策树的接线方式识别方法 | |
CN109932903A (zh) | 多父代优化网络和遗传算法的风机控制多目标优化方法 | |
CN106874963B (zh) | 一种基于大数据技术的配电网故障诊断方法及系统 | |
CN109461025A (zh) | 一种基于机器学习的电能替代潜在客户预测方法 | |
CN106597154B (zh) | 基于dag-svm的变压器故障诊断提升方法 | |
CN107679583A (zh) | 基于大数据获取故障解决方案的方法 | |
CN105574589B (zh) | 基于小生境遗传算法的变压器油色谱故障诊断方法 | |
CN103699812B (zh) | 基于遗传算法的植物品种真实性鉴定位点筛选方法 | |
CN107656152A (zh) | 一种基于ga‑svm‑bp变压器故障诊断方法 | |
CN107516104A (zh) | 一种基于二分法的优化cart决策树生成方法及其装置 | |
CN109214503A (zh) | 基于kpca-la-rbm的输变电工程造价预测方法 | |
CN104268629A (zh) | 一种基于先验信息和网络固有信息的复杂网络社区检测方法 | |
CN114358116A (zh) | 油浸式变压器故障诊断方法、系统及可读存储介质 | |
CN106372724A (zh) | 一种人工神经网络算法 | |
Smȩtek et al. | Selection of heterogeneous fuzzy model ensembles using self-adaptive genetic algorithms | |
CN105956252B (zh) | 基于生成型深信度网络的超短期风速多尺度预报建模方法 | |
CN116562114A (zh) | 一种基于图卷积神经网络的电力变压器故障诊断方法 | |
CN111737907A (zh) | 一种基于深度学习和dga的变压器故障诊断方法及装置 | |
CN116842337A (zh) | 基于LightGBM优选特征与COA-CNN模型的变压器故障诊断方法 | |
CN117473424A (zh) | 基于随机森林的变压器故障诊断方法、系统、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20161102 |
|
RJ01 | Rejection of invention patent application after publication |