CN106067066A

CN106067066A - 基于遗传算法优化装袋算法的电力变压器故障诊断方法

Info

Publication number: CN106067066A
Application number: CN201610378057.4A
Authority: CN
Inventors: 黄新波; 李文君子; 魏雪倩; 徐冠华; 王玉鑫; 吴孟魁
Original assignee: Xian Polytechnic University
Current assignee: Xian Polytechnic University
Priority date: 2016-05-31
Filing date: 2016-05-31
Publication date: 2016-11-02

Abstract

本发明公开了一种基于遗传算法优化装袋算法的电力变压器故障诊断方法，具体按照以下步骤实施：步骤1，对利用DGA技术获得的五种变压器油中溶解气体进行数据预处理，并构建输入样本集，步骤2，利用训练样本集D’对Bagging‑CART算法进行训练，得到一系列CART基分类器，同时对待分类样本进行分类，步骤3，采用遗传算法对得到的全部E个CART基分类器进行选择，由于全部CART基分类器中存在相似甚至相同，以及分类性能不好的基分类器，采用遗传算法选择出部分性能优越，差异性大的基分类器，步骤4，得到待分类样本的最终分类结果，即变压器故障类别。本发明的方法能以此来对变压器故障状态进行更为精确有效的判定。

Description

基于遗传算法优化装袋算法的电力变压器故障诊断方法

技术领域

本发明属于变压器在线监测与故障诊断技术领域，具体涉及一种基于遗传算法优化装袋算法的电力变压器故障诊断方法。

背景技术

电力系统是一个复杂且联系紧密的系统，各个环节相互依存，互相影响。油浸式大型变压器是目前电力系统应用最为广泛的变压器，是重要的枢纽设备，在变电和配电环节扮演着重要角色，承担着转换电压等级、变换交流电能的作用。但由于变压器内部构造十分复杂，在运行过程中，内部故障、外部因素以及老化等都会造成绝缘油裂解乃至材质劣化，造成变压器瘫痪，给电网运行造成严重后果。油浸式变压器在运行时，绝缘油纸会裂解产生各种气体，这些气体和变压器状态有着相当紧密的联系。油中溶解气体分析(DissolvedGas Analysis，简称DGA)技术因其科学合理性成为充油设备最常用的监测方法，该技术可为变压器故障诊断提供了数据基础。在该技术的基础上，衍生出一系列故障诊断方法。目前，传统变压器故障诊断方法存在编码不全，编码区间划分过于硬性，应用时需要丰富的工作经验等缺陷。而单一智能故障诊断方法存在初始参数设定困难，泛化能力较差等问题，制约了故障诊断准确率的提升。因此，对电力变压器进行深入的故障诊断研究，对指导变压器的运行维护和状态检修具有重要的理论和实际意义。

发明内容

本发明的目的是提供一种基于遗传算法优化装袋算法的电力变压器故障诊断方法，以此来对变压器故障状态进行更为精确有效的判定。

本发明所采用的技术方案是，

基于遗传算法优化装袋算法的电力变压器故障诊断方法，具体按照以下步骤实施：

步骤1，对利用DGA技术获得的五种变压器油中溶解气体进行数据预处理，并构建输入样本集，

步骤2，利用训练样本集D’对Bagging-CART算法进行训练，得到一系列CART基分类器，同时对待分类样本进行分类，

步骤3，采用遗传算法对步骤2中的到的全部E个CART基分类器进行选择，由于全部CART基分类器中存在相似甚至相同，以及分类性能不好的基分类器，采用遗传算法选择出部分性能优越，差异性大的基分类器，

步骤4，得到待分类样本的最终分类结果，即变压器故障类别。

本发明的特征还在于：

步骤1具体按照以下步骤实施：

步骤1.1，将氢气、甲烷、乙烷、乙烯、乙炔这五种典型特征气体的原始含量作为属性数据，分别记为A₁、A₂、A₃、A₄、A₅，A₁～A₅都是由多个属性值组成的向量，假设采集了k次数据，则A₁＝{a₁₁,a₂₁,…,a_i1,…,a_k1}，A₂＝{a₁₂,a₂₂,…,a_i2,…,a_k2}，A₃＝{a₁₃,a₂₃,…,a_i3,…,a_k3}，A₄＝{a₁₄,a₂₄,…,a_i4,…,a_k4}，A₅＝{a₁₅,a₂₅,…,a_i5,…,a_k5}，

设x_i＝{a_i1,a_i2,a_i3,a_i4,a_i5}为其中第i个样本中的属性集，

则相对应的变压器故障类型记为y_i，y_i∈Y＝{Y₁,Y₂,…,Y_n}，

那么原始样本集为D＝{(x₁,y1),(x₂,y2),…,(x_i,y_i),…,(x_k,y_k)}，其中(x_i,y_i)代表一个样本；

步骤1.2，对原始属性数据x_i按式(1)进行最小最大规范化处理，将原始属性值映射到[0,1]区间，

d_new＝(d_or-d_min)/(d_max-d_min) (1)

其中，d_or是原始数据，d_min是原始数据中的最小值，d_max是原始数据中的最大值，d_new为归一化后的数据，经归一化后的属性集为B_i＝{b_i1,b_i2,b_i3,b_i4,b_i5}；

步骤1.3，对归一化后的属性数据x_i’进行维规约处理，使c_i1＝b_i2/b_i1，c_i2＝b_i4/b_i3，c_i3＝b_i5/b_i4使原始数据由5维降至3维，C_i＝{c_i1,c_i2,c_i3}为经步骤1.1和步骤1.2两步数据预处理后的属性集。

则算法的新样本集为D’＝{(C₁,y₁),(C₂,y₂),…,(C_i,y_i),…,(C_k,y_k)}；

步骤1.4，将新的样本集D’作为算法的训练样本集，X＝{a₁,a₂,a₃,a₄,a₅}为经过步骤1.2和步骤1.3处理后的待分类样本。

步骤2具体按照以下步骤实施：

步骤2.1，Bagging算法参数初始化，Bagging算法只有一个参数需要事先设定，即迭代次数。设迭代次数为E(E为正整数)，初始化迭代次数t＝1；

步骤2.2，由D’经重采样技术得到第t次迭代所需的训练样本集d_t；t表示第t次迭代；

步骤2.3，采用d_t构建一个CART基分类器h(t)，具体步骤如下：

步骤2.4，判断迭代次数t是否小于E，

若t<E，则t＝t+1，重复步骤2.2和步骤2.3；

若t≥E，则停止迭代，得到E个CART基分类器{I₁,I₂,…,I_t,…,I_E}。

步骤2.5，采用E个CART基分类器对待分类样本X＝{a₁,a₂,a₃,a₄,a₅}进行分类。

步骤2.3具体按照以下步骤实施，

步骤2.3.1，设训练样本集d_t包含m个类别，即m个变压器的状态类型，则Gini指数的计算式为：

G (N) = 1 - Σ_{j = 1}^{m} p_{j}^{2} - - - (2)

其中，p_j表示节点N处属于类别j(j∈m)的样本数占总样本数的比重；

步骤2.3.2，Gini指数需要考虑A₁～A₅每个属性的二元划分，假定某个属性A的二元划分将d_t划分成d_tL和d_tR，则此次在节点N处以某属性A划分样本集d_t的Gini指数改变量为：

G_{A} (N) = \frac{| d_{t L} |}{d_{t}} G (N_{L}) + \frac{| d_{t R} |}{d_{t}} G (N_{R}) - - - (3)

其中，N是分裂节点；|d_tL|/d_t表示节点N中左分支样本数占总数的比例，|d_tR|/d_t表示节点N中右分支样本数占总数的比例；G(N_L)和G(N_R)分别表示分裂后左右分支节点的Gini指数。

步骤2.3.3，对A₁～A₅每个属性，考虑所有可能的二元划分，均按式(2)和式(3)计算Gini指数改变量，选择Gini指数改变量最小的属性A_f(f＝1,2,3,4,5)作为节点N的分裂属性，产生最小Gini指数改变量的子集作为分裂子集。按照此规则，以训练样本集d_t作为根节点，由上至下不断分裂，在满足下述条件之一时停止建树：①所有叶节点中的样本数为1；②所有叶节点中的样本属于同一类。至此，整棵分类回归树生长完成，得到一个CART基分类器。

步骤2.5具体按照以下步骤实施：

步骤2.5.1，在待分类样本X中的五个属性a₁～a₅中寻找和分类回归树的根节点属性相同的属性；

步骤2.5.2，按照已经生成的分类回归树中的规则，寻找该属性处同根节点相同的属性值，判断待分类样本属于左右哪一分支子集，寻找到下一子节点，进而继续进行属性匹配；

步骤2.5.3，通过CART分类回归树自顶向下，逐层查找，得出最终的变压器故障诊断结果即得出故障类别；

步骤2.5.4，重复进行步骤2.5.1至步骤2.5.3，得到对应于待分类样本的E个故障类别，设这E个故障类别表示为F＝{f₁,f₂,…,f_E}。

步骤3具体按照以下步骤实施，

步骤3.1，设置遗传算法编码长度为固定值E，设定群体规模G_{pop_size}，交叉概率G_{cross_rate}，变异概率G_{mutate_rate}，终止代数S；

步骤3.2，使用二进制编码方式全部基分类器进行编码，每个基分类器相当于等位基因，对应编码值0或者1，基因值为1表示该基分类器被选中，基因值为0表示基分类器未被选中，不同的二进制基因编码串表示不同的个体，共有r＝2^E个体组成群体Q＝{q₁,q₂,…,q_i,…,q_r}

步骤3.3，对个体q_i进行适应度评价。由于需要选择出一种基分类器组合使最终的强分类器泛化性能最优，因此，可以将最终的强分类器的十折交叉验证准确度作为适应度评价函数，

步骤3.4，对群体Q进行选择操作。采用轮盘赌算子进行选择运算，使适应性强的个体以一个较高的概率为下一代贡献1个或多个后代。但是由于这种选择具有随机性，在选择的过程中可能会丢失比较好的个体，所以同时使用精英机制，将前代最优个体直接选到下一代中；

步骤3.5，对群体Q进行交叉操作。采用交叉算子产生新个体。本文采用单点交叉算子将上述通过选择运算得到的个体以随机方式配对，然后随机选择交叉位置，已配对的染色体互相交换交叉位置以后二进制基因串(包括交叉位置)。交叉运算是产生新个体的主要方法；

步骤3.6，对群体Q进行变异操作。利用变异算子产生新个体。本文采用单点变异算子，随机选择变异个体，再随机选择变异位置，对该位置的二进制数字进行变异，也就是1变成0，0变成1。变异运算是产生新个体的辅助方法；

步骤3.7，循环进行步骤3.3至步骤3.6，直到达到预设的终止迭代数S；

步骤3.8，对群体Q中所有个体的适应度值进行排序，选择适应度值最大的个体作为最优个体q_best，即就是最佳基分类器组合。

步骤3.3具体实施步骤如下：

步骤3.3.1，将训练集D’平均分成10份，每一份都包含所有变压器故障类别，这10份样本集分别为D’₁，D’₂，…，D’₁₀；

步骤3.3.2，把D’₁，D’₂，…，D’₉作为适应度评价阶段的训练样本集D_tr＝{D’₁，D’₂，…，D’₉}，剩下的一份D’₁₀作为适应度评价阶段的验证样本集D_val＝D’₁₀；

步骤3.3.3，以D_tr代替步骤2中的D’执行步骤2中的(1)～(4)，得到适应度评价阶段E_GA＝E个CART基分类器{J₁,J₂,…,J_t,…,J_E}；

步骤3.3.4，在E_GA个基分类器中选择出编码为1的CART基分类器对验证样本集D_val进行分类，并对分类结果进行多数投票集成，最终的变压器故障诊断结果为：

H = \arg \underset{y &Element; Y}{m a x} Σ_{t = 1}^{E} I (h (t) = y) - - - (4)

其中I(·)是一个指标函数，当括号内为真，则I为1，反之为0；h(t)为第t个基分类器的分类结果；

步骤3.3.5，再把D’₉作为适应度评价阶段的验证样本集D_val＝D’₉，剩下的九份作为适应度评价阶段的训练样本集D_val＝D’₁₀，再次执行步骤3.3.3至步骤3.3.4，循环10次，每份样本集轮流作为验证集。其实就是把D’₁到D’₉轮流执行一次步骤3.3.3和3.3.4；

步骤3.3.6，对当前个体qi进行适应度评价，以最终的强分类器的十折交叉验证准确度作为适应度评价函数，定义如下：

其中，e为交叉验证时每份数据集所包含的样本数，H_ij和y_ij分别为第j份样本集中第i个验证样本的集成预测故障类别和实际变压器故障类别。f表示个体q_i的值。

步骤4具体为：

根据最优个体q_best的编码，选出和编码值1相对应的部分CART基分类器进行集成，得到最终的强分类器并对待分类样本进行故障类别判断。根据选出的最优个体q_best的二进制编码串，选择出编码为1的CART基分类器，对应步骤2中的2.5.4的待分类样本分类结果F＝{f₁,f₂,…,f_E}，将选择出的基分类器的对应分类结果G＝{G(1),G(2),…,G(z-1),G(z)}∈F进行最终的集成，集成方式仍采用式(3)所示的多数投票方式，得到待分类样本的最终分类结果，即变压器故障类别。

本发明的有益效果是：本发明的方法考虑到变压器故障诊断的实质是多分类问题，以油中溶解气体分析(Dissolved Gas Analysis，简称DGA)技术为基础，由于单一分类回归树(Classification and Regression Trees，简称CART)算法的故障诊断准确度不高，将CART算法作为基分类器，采用装袋(Bagging)算法对CART算法进行集成，从而提高单一CART算法的准确度。但是考虑到在集成过程中会产生相似甚至相同的基分类器，降低了基分类器之间的差异性，影响最终强分类器的泛化能力，故进一步采用遗传算法(GeneticAlgorithm，简称GA)作为一种全局寻优算法，从全部基分类器中选择出最优的部分基分类器进行集成，即选择性集成，以此提高变压器的故障诊断准确度。

附图说明

图1是本发明基于遗传算法优化装袋算法的电力变压器故障诊断方法的整体流程图；

图2是本发明的基于遗传算法优化装袋算法的电力变压器故障诊断方法中Bagging-CART算法流程图；

图3是本发明的基于遗传算法优化装袋算法的电力变压器故障诊断方法中使用的CART基分类器模型示意图。

具体实施方式

下面结合附图和具体实施方式对本发明进行详细说明。

本发明基于遗传算法优化装袋算法的电力变压器故障诊断方法，以油中溶解气体分析(Dissolved Gas Analysis，简称DGA)技术获得的五种油中溶解气体：氢气(H₂)、甲烷(CH₄)、乙烷(C₂H₆)、乙烯(C₂H₄)、乙炔(C₂H₂)作为方法的输入属性，将分类回归树(Classification and Regression Trees，简称CART)算法作为基分类器，采用装袋(Bagging)算法对CART算法进行集成，得到装袋分类回归树组合(Bagging-CART)算法，再采用遗传算法(Genetic Algorithm，简称GA)对Bagging-CART算法进行优化，GA优化Bagging-CART算法变压器故障诊断模型如附图1，具体按照以下步骤实施：

步骤1，对利用DGA技术获得的五种变压器油中溶解气体进行数据预处理，并构建输入样本集，具体步骤如下：

步骤1.1，将氢气(H₂)、甲烷(CH₄)、乙烷(C₂H₆)、乙烯(C₂H₄)、乙炔(C₂H₂)这五种典型特征气体的原始含量作为属性数据，分别记为A₁、A₂、A₃、A₄、A₅，A₁～A₅都是由多个属性值组成的向量，假设采集了k次数据，则A₁＝{a₁₁,a₂₁,…,a_i1,…,a_k1}，A₂＝{a₁₂,a₂₂,…,a_i2,…,a_k2}，A₃＝{a₁₃,a₂₃,…,a_i3,…,a_k3}，A₄＝{a₁₄,a₂₄,…,a_i4,…,a_k4}，A₅＝{a₁₅,a₂₅,…,a_i5,…,a_k5}，

设x_i＝{a_i1,a_i2,a_i3,a_i4,a_i5}为其中第i个样本中的属性集，

那么原始样本集为D＝{(x₁,y₁),(x₂,y₂),…,(x_i,y_i),…,(x_k,y_k)}，其中(x_i,y_i)代表一个样本；

d_new＝(d_or-d_min)/(d_max-d_min) (1)

步骤2，利用训练样本集D’对Bagging-CART算法进行训练，得到一系列CART基分类器，同时对待分类样本进行分类，方法的流程图如附图2所示，具体实施步骤如下：

步骤2.3，采用d_t构建一个CART基分类器h(t)，具体步骤如下：

G (N) = 1 - Σ_{j = 1}^{m} p_{j}^{2} - - - (2)

G_{A} (N) = \frac{| d_{t L} |}{d_{t}} G (N_{L}) + \frac{| d_{t R} |}{d_{t}} G (N_{R}) - - - (3)

步骤2.3.3，对A₁～A₅每个属性，考虑所有可能的二元划分，均按式(2)和式(3)计算Gini指数改变量，选择Gini指数改变量最小的属性A_f(f＝1,2,3,4,5)作为节点N的分裂属性，产生最小Gini指数改变量的子集作为分裂子集。按照此规则，以训练样本集d_t作为根节点，由上至下不断分裂，在满足下述条件之一时停止建树：①所有叶节点中的样本数为1；②所有叶节点中的样本属于同一类。至此，整棵分类回归树生长完成，得到一个CART基分类器，CART基分类器模型如附图3所示；

步骤2.4，判断迭代次数t是否小于E，

若t<E，则t＝t+1，重复步骤2.2和步骤2.3；

步骤2.5，采用E个CART基分类器对待分类样本X＝{a₁,a₂,a₃,a₄,a₅}进行分类，具体按照以下步骤实施：

步骤2.5.4，重复进行步骤2.5.1至步骤2.5.3，得到对应于待分类样本的E个故障类别，设这E个故障类别表示为F＝{f₁,f₂,…,f_E}；

步骤3，采用遗传算法对步骤2.4中的到的全部E个CART基分类器进行选择，由于全部CART基分类器中存在相似甚至相同，以及分类性能不好的基分类器，采用遗传算法选择出部分性能优越，差异性大的基分类器，具体步骤如下：

步骤3.3，对个体q_i进行适应度评价。由于需要选择出一种基分类器组合使最终的强分类器泛化性能最优，因此，可以将最终的强分类器的十折交叉验证准确度作为适应度评价函数，具体实施步骤如下：

H = \arg \underset{y &Element; Y}{m a x} Σ_{t = 1}^{E} I (h (t) = y) - - - (4)

其中I(·)是一个指标函数，当括号内为真，则I为1，反之为0；h(t)为第t个基分类器的分类结果。

步骤3.3.5，再把D’₉作为适应度评价阶段的验证样本集D_val＝D’₉，剩下的九份作为适应度评价阶段的训练样本集D_val＝D’₁₀，再次执行步骤3.3.3至步骤3.3.4，

循环10次，每份样本集轮流作为验证集。其实就是把D’₁到D’₉轮流执行一次步骤3.3.3和3.3.4

步骤3.3.6，对当前个体q_i进行适应度评价，以最终的强分类器的十折交叉验证准确度作为适应度评价函数，定义如下：

步骤3.4，对群体Q进行选择操作。采用轮盘赌算子进行选择运算，使适应性强的个体以一个较高的概率为下一代贡献1个或多个后代。但是由于这种选择具有随机性，在选择的过程中可能会丢失比较好的个体，所以同时使用精英机制，将前代最优个体直接选到下一代中。

步骤3.5，对群体Q进行交叉操作。采用交叉算子产生新个体。本文采用单点交叉算子将上述通过选择运算得到的个体以随机方式配对，然后随机选择交叉位置，已配对的染色体互相交换交叉位置以后二进制基因串(包括交叉位置)。交叉运算是产生新个体的主要方法。

步骤3.6，对群体Q进行变异操作。利用变异算子产生新个体。本文采用单点变异算子，随机选择变异个体，再随机选择变异位置，对该位置的二进制数字进行变异，也就是1变成0，0变成1。变异运算是产生新个体的辅助方法。

步骤3.7，循环进行步骤3.3至步骤3.6，直到达到预设的终止迭代数S。

步骤3.8，对群体Q中所有个体的适应度值进行排序，选择适应度值最大的个体作为最优个体q_best，即就是最佳基分类器组合，

步骤4，根据最优个体q_best的编码，选出和编码值1相对应的部分CART基分类器进行集成，得到最终的强分类器并对待分类样本进行故障类别判断。根据选出的最优个体q_best的二进制编码串，选择出编码为1的CART基分类器，对应步骤2.5.4中的待分类样本分类结果F＝{f₁,f₂,…,f_E}，将选择出的基分类器的对应分类结果G＝{G(1),G(2),…,G(z-1),G(z)}∈F进行最终的集成，集成方式仍采用式(3)所示的多数投票方式，得到待分类样本的最终分类结果，即变压器故障类别。

本发明的有益效果是：

针对油浸式电力变压器故障样本数据为连续性数值数据的特点，采用CART算法作为基分类器，无需对原始数据进行离散化，可很好地处理连续属性数据。

利用Bagging算法可以构造出高精度的强分类器，其对基分类器的要求低，只需基分类器的分类准确率略大于50％，通过集成分类准确率低的单一算法，解决了强分类算法难以获得的问题，实现应用都相对简单，为工程变压器故障诊断提供了一种新的思路。

对于Bagging-CART算法中存在的不足，进一步采用遗传算法对Bagging-CART全集成算法作选择性集成优化，建立变压器故障诊断模型。该方法直接对编码进行操作，无需解码过程，所制定的适应度函数易于理解，可以更好的完成变压器故障诊断任务。

Claims

1.基于遗传算法优化装袋算法的电力变压器故障诊断方法，其特征在于，具体按照以下步骤实施：

2.根据权利要求1所述的基于遗传算法优化装袋算法的电力变压器故障诊断方法，其特征在于，所述的步骤1具体按照以下步骤实施：

设x_i＝{a_i1,a_i2,a_i3,a_i4,a_i5}为其中第i个样本中的属性集，

则相对应的变压器故障类型记为y_i，y_i∈Y＝{Y₁,Y₂,···,Y_n}，

d_new＝(d_or-d_min)/(d_max-d_min) (1)

步骤1.3，对归一化后的属性数据x_i’进行维规约处理，使c_i1＝b_i2/b_i1，c_i2＝b_i4/b_i3，c_i3＝b_i5/b_i4使原始数据由5维降至3维，C_i＝{c_i1,c_i2,c_i3}为经步骤1.1和步骤1.2两步数据预处理后的属性集；

3.根据权利要求1所述的基于遗传算法优化装袋算法的电力变压器故障诊断方法，其特征在于，所述的步骤2具体按照以下步骤实施：

步骤2.1，Bagging算法参数初始化，Bagging算法只有一个参数需要事先设定，即迭代次数，设迭代次数为E(E为正整数)，初始化迭代次数t＝1；

步骤2.3，采用d_t构建一个CART基分类器h(t)，具体步骤如下：

步骤2.4，判断迭代次数t是否小于E，

若t<E，则t＝t+1，重复步骤2.2和步骤2.3；

若t≥E，则停止迭代，得到E个CART基分类器{I₁,I₂,…,I_t,…,I_E}；

4.根据权利要求3所述的基于遗传算法优化装袋算法的电力变压器故障诊断方法，其特征在于，所述的步骤2.3具体按照以下步骤实施，

G (N) = 1 - Σ_{j = 1}^{m} p_{j}^{2} - - - (2)

G_{A} (N) = \frac{| d_{t L} |}{d_{t}} G (N_{L}) + \frac{| d_{t R} |}{d_{t}} G (N_{R}) - - - (3)

其中，N是分裂节点；|d_tL|/d_t表示节点N中左分支样本数占总数的比例，|d_tR|/d_t表示节点N中右分支样本数占总数的比例；G(N_L)和G(N_R)分别表示分裂后左右分支节点的Gini指数；

步骤2.3.3，对A₁～A₅每个属性，考虑所有可能的二元划分，均按式(2)和式(3)计算Gini指数改变量，选择Gini指数改变量最小的属性A_f(f＝1,2,3,4,5)作为节点N的分裂属性，产生最小Gini指数改变量的子集作为分裂子集，按照此规则，以训练样本集d_t作为根节点，由上至下不断分裂，在满足下述条件之一时停止建树：①所有叶节点中的样本数为1；②所有叶节点中的样本属于同一类，至此，整棵分类回归树生长完成，得到一个CART基分类器。

5.根据权利要求3所述的基于遗传算法优化装袋算法的电力变压器故障诊断方法，其特征在于，所述的步骤2.5具体按照以下步骤实施：

6.根据权利要求1所述的基于遗传算法优化装袋算法的电力变压器故障诊断方法，其特征在于，所述的步骤3具体按照以下步骤实施，

步骤3.2，使用二进制编码方式全部基分类器进行编码，每个基分类器相当于等位基因，对应编码值0或者1，基因值为1表示该基分类器被选中，基因值为0表示基分类器未被选中，不同的二进制基因编码串表示不同的个体，共有r＝2^E个体组成群体Q＝{q₁,q₂,…,q_i,…,q_r}；

步骤3.3，对个体q_i进行适应度评价，由于需要选择出一种基分类器组合使最终的强分类器泛化性能最优，因此，可以将最终的强分类器的十折交叉验证准确度作为适应度评价函数；

步骤3.4，对群体Q进行选择操作，采用轮盘赌算子进行选择运算，使适应性强的个体以一个较高的概率为下一代贡献1个或多个后代，但是由于这种选择具有随机性，在选择的过程中可能会丢失比较好的个体，所以同时使用精英机制，将前代最优个体直接选到下一代中；

步骤3.5，对群体Q进行交叉操作，采用交叉算子产生新个体，本文采用单点交叉算子将上述通过选择运算得到的个体以随机方式配对，然后随机选择交叉位置，已配对的染色体互相交换交叉位置以后二进制基因串(包括交叉位置)，交叉运算是产生新个体的主要方法；

步骤3.6，对群体Q进行变异操作，利用变异算子产生新个体，本文采用单点变异算子，随机选择变异个体，再随机选择变异位置，对该位置的二进制数字进行变异，也就是1变成0，0变成1，变异运算是产生新个体的辅助方法；

7.根据权利要求6所述的基于遗传算法优化装袋算法的电力变压器故障诊断方法，其特征在于，所述的步骤3.3具体实施步骤如下：

H = \arg \underset{y &Element; Y}{m a x} Σ_{t = 1}^{E} I (h (t) = y) - - - (4)

步骤3.3.5，再把D’₉作为适应度评价阶段的验证样本集D_val＝D’₉，剩下的九份作为适应度评价阶段的训练样本集D_val＝D’₁₀，再次执行步骤3.3.3至步骤3.3.4，循环10次，每份样本集轮流作为验证集，其实就是把D’₁到D’₉轮流执行一次步骤3.3.3和3.3.4；

其中，e为交叉验证时每份数据集所包含的样本数，H_ij和y_ij分别为第j份样本集中第i个验证样本的集成预测故障类别和实际变压器故障类别，f表示个体q_i的值。

8.根据权利要求1所述的基于遗传算法优化装袋算法的电力变压器故障诊断方法，其特征在于，所述的步骤4具体为：

根据最优个体q_best的编码，选出和编码值1相对应的部分CART基分类器进行集成，得到最终的强分类器并对待分类样本进行故障类别判断，根据选出的最优个体q_best的二进制编码串，选择出编码为1的CART基分类器，对应步骤2中的2.5.4的待分类样本分类结果F＝{f₁,f₂,…,f_E}，将选择出的基分类器的对应分类结果G＝{G(1),G(2),…,G(z-1),G(z)}∈F进行最终的集成，集成方式仍采用式(3)所示的多数投票方式，得到待分类样本的最终分类结果，即变压器故障类别。