CN115146702A

CN115146702A - 一种变压器故障诊断方法、介质及系统

Info

Publication number: CN115146702A
Application number: CN202210581263.0A
Authority: CN
Inventors: 栗磊; 赫嘉楠; 梁亚波; 牛健; 刘海涛; 尹亮; 陈小乾; 祁升龙; 王放; 芦翔
Original assignee: Electric Power Research Institute of State Grid Ningxia Electric Power Co Ltd
Current assignee: Electric Power Research Institute of State Grid Ningxia Electric Power Co Ltd
Priority date: 2022-05-26
Filing date: 2022-05-26
Publication date: 2022-10-04

Abstract

本发明公开一种变压器故障诊断方法、介质及系统，包括：按照故障种类进行分类，构造第一多标签分类结构诊断模型；将第一训练样本集中的样本按照第一多标签分类结构诊断模型中每一节点的支持向量机对应的两种故障种类进行分类得到第二训练样本集；判断输入支持向量机的第二训练样本集中的两种故障种类的样本的数量是否相同；若不相同，将第二训练样本集进行过采样处理，生成第三训练样本集，通过第三训练样本集训练支持向量机，得到训练后的第二多标签分类结构诊断模型；若相同，通过第二训练样本集训练支持向量机，得到训练后的第二多标签分类结构诊断模型；将待诊断样本集输入第二多标签分类结构诊断模型，得到故障种类。本发明提高诊断准确率。

Description

一种变压器故障诊断方法、介质及系统

技术领域

本发明涉及变压器故障诊断技术领域，尤其涉及一种变压器故障诊断方法、介质及系统。

背景技术

电力变压器作为连接不同电压等级的关键设备，在电力系统的输、变、配电过程中起到不可替代的作用。因此，准确掌握变压器的健康状态，尤其是当变压器出现异常或故障后的及时诊断，对于保障电力系统的安全稳定运行具有重要意义。

电力变压器按绝缘介质可分为油浸式变压器、干式变压器和SF₆气体绝缘变压器，其中以油浸式变压器居多。针对油浸式变压器的故障，传统方法主要通过分析变压器油中溶解气体含量的比值特征来诊断，其代表为IEC三比值法、立体图示法、大卫三角形法等。此类方法简便实用，但存在准确率较低、判据过于绝对等问题。近年来，基于人工智能算法的变压器故障诊断技术逐步发展起来。此类方法通常以变压器油中溶解气体含量等作为指标，通过大量历史故障样本来训练神经网络、极限学习机、相关向量机、支持向量机(support vector machine，SVM)等人工智能模型，使其具有识别变压器故障类型的能力。与传统方法相比，人工智能方法在诊断准确率方面有较大提升。然而，变压器故障样本通常具有类间样本数量不平衡的问题，当采用人工智能方法对不平衡故障样本进行分类时，分类结果容易偏向多数类样本，产生样本不平衡影响故障诊断准确的问题。

发明内容

本发明实施例提供一种变压器故障诊断方法、介质及系统，以解决现有技术变压器故障诊断不准确的问题。

第一方面，提供一种变压器故障诊断方法，包括：

按照变压器的不同故障种类进行分类，构造第一多标签分类结构诊断模型，其中，所述第一多标签分类结构诊断模型包括基于层次式有向无环图的支持向量机；

将第一训练样本集中的样本按照所述第一多标签分类结构诊断模型中每一节点的支持向量机对应的两种故障种类进行分类，得到每一节点的包含该节点的支持向量机对应的两种故障种类的样本的第二训练样本集；

对于所述第一多标签分类结构诊断模型，判断输入每层的每一节点的支持向量机的第二训练样本集中的两种故障种类的样本的数量是否相同；

对于每一节点，若该节点的判断结果为不相同，则将所述第二训练样本集进行过采样处理，生成第三训练样本集，并通过所述第三训练样本集训练该节点的所述支持向量机，得到训练后的第二多标签分类结构诊断模型；

对于每一节点，若该节点的判断结果为相同，则通过所述第二训练样本集训练该节点的所述支持向量机，得到训练后的第二多标签分类结构诊断模型；

将待诊断样本集输入所述第二多标签分类结构诊断模型，得到所述待诊断样本集中的每一样本对应的故障种类。

第二方面，提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序指令；所述计算机程序指令被处理器执行时实现如上述第一方面实施例所述的变压器故障诊断方法。

第三方面，提供一种变压器故障诊断系统，包括：如上述第二方面实施例所述的计算机可读存储介质。

这样，本发明实施例，能够通过过采样提高诊断的准确率，并且通过对过采样倍率及SVM参数的优化获得泛化能力更强的诊断模型。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例的变压器故障诊断方法的流程图；

图2是本发明实施例的基于层次式有向无环图的多类支持向量机的结构图；

图3是本发明应用例的步骤B的下层适应度平均值变化曲线示意图；

图4是本发明应用例的步骤B的最优过采样倍率下各次过采样的指标分布曲线示意图；

图5是本发明应用例的步骤C的算例CE1～CE3的混淆矩阵示意图；

图6是本发明应用例的步骤C的算例CE1、CE4、CE5的混淆矩阵示意图；

图7是本发明应用例的步骤C的算例CE1、CE6、CE7的混淆矩阵示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获取的所有其他实施例，都属于本发明保护的范围。

本发明实施例公开了一种变压器故障诊断方法。如图1所示，该方法包括如下的步骤：

步骤S1：按照变压器的不同故障种类进行分类，构造第一多标签分类结构诊断模型。

其中，本发明实施例所述的故障种类根据标准《变压器油中溶解气体分析和判断导则DL/T 722-2014》获得。该标准中油浸式变压器的故障类型主要有低温过热、中温过热、高温过热、局部放电、低能放电、高能放电6种，故障代码依次为T1、T2、T3、PD、D1、D2，其中，低温过热、中温过热、高温过热为过热故障，代码为T，局部放电、低能放电、高能放电为放电故障，代码为D。

由于变压器属于高可靠性设备，其故障样本数量较少，因此变压器故障诊断问题属于多标签小样本分类问题，适合选用支持向量机(SVM)作为基准分类器。由于SVM是一种二分类模型，处理多标签分类问题时需要采取一定的SVM组合策略。因此，本发明实施例的第一多标签分类结构诊断模型包括基于层次式有向无环图的支持向量机(hierarchicaldirected acyclic graph SVM，HDAG-SVM)，即该诊断模型中除最底层节点外，其它层的每个节点设置有一个SVM。

如图2所示，为一具体实施例的基于层次式有向无环图的多类支持向量机的结构图。应当理解的是，每个节点的支持向量机对应的两种故障种类不会重复。图2中该模型划分了SVM1～SVM7共七个SVM分类群组，其中 SVM1将T1、T2、T3样本作为一类(代码为T)，将PD、D1、D2样本作为一类(代码为D)，采用T、D两类样本进行训练。

此外，该标准中用于判断是否故障的特征量主要有H₂、CH₄、C₂H₆、C₂H₄、 C₂H₂这5种气体的含量，即下述的训练样本集和待诊断样本集中的样本由上述特征量组成。

在诊断阶段，对于任意样本，HDAG-SVM仅需调用3个分类群组即可给出诊断结果，且不存在分类重叠、不可分类等问题。

步骤S2：将第一训练样本集中的样本按照第一多标签分类结构诊断模型中每一节点的支持向量机对应的两种故障种类进行分类，得到每一节点的包含该节点的支持向量机对应的两种故障种类的样本的第二训练样本集。

每一节点的支持向量机可对两种故障种类进行分类。如前所述，为了更准确地判断故障类型，该模型中的根节点的支持向量机对应的两类故障为过热故障和放电故障，过热故障支路下的各个支持向量机和放电故障支路下的各个支持向量机，从而针对每一节点的支持向量机对应的两种故障种类可将第一训练样本集中的样本分为对应各节点两种故障种类的多个第二训练样本集。

第一训练样本集中的样本一般是经过归一化处理后的样本。归一化处理的算式如下：

其中，x_i,j表示样本i第j个特征量的实际值，

表示样本i第j个特征量的归一化值，i＝1，2，……，M，j＝1，2，……， 5，M为样本总量。

步骤S3：对于第一多标签分类结构诊断模型，判断输入每层的每一节点的支持向量机的第二训练样本集中的两种故障种类的样本的数量是否相同。

例如，对于图2根节点，判断过热故障和放电故障的两种故障种类的样本的数量是否相同。根据判断结果的不同分别通过步骤S4和步骤S5进行不同的处理。

步骤S4：对于每一节点，若该节点的判断结果为不相同，则将第二训练样本集进行过采样处理，生成第三训练样本集，并通过第三训练样本集训练该节点的支持向量机，得到训练后的第二多标签分类结构诊断模型。

若该节点的判断结果为不同，表明第二训练样本集中的两种故障种类的样本的数量不均衡。因此，需要通过对少数类样本过采样使两种故障种类的样本的数量均衡。过采样倍率β决定了过采样新增样本的数量，如果β过小则难以突出少数类样本的数据特征，如果β过大则容易引入噪声，因此过采样的过程还需要对β进行寻优。基于此，本发明实施例在生成第三训练样本集的步骤提出了基于近邻分布特性的改进合成少数过采样方法(SMOTEbased on nearest neighbor distribution，SMOTE-NND)的变压器故障样本均衡化过采样方法以及基于层次搜索算法(hierarchical search，HS)的过采样倍率寻优方法。

此外，除了过采样倍率β对诊断模型的分类性能有重要影响，SVM误差惩罚参数C和高斯核宽度σ也对诊断模型的分类性能有重要影响，因此需要对其进行优化。对于第二训练样本集中的两种故障种类的样本的数量不均衡的情况，过采样的随机性使得同一β下每次生成的样本不完全相同，而不同训练样本集下的SVM参数寻优值通常也不同，β与SVM参数难以同时寻优，因此，本发明实施例采用双层优化方法求取参数最优解，上层采用前述的HS对β寻优，下层采用改进哈里斯鹰算法(modified harris hawks opti-mization，MHHO)对SVM参数C和σ寻优。

在生成第三训练样本集的过程中采用HS算法对β寻优。HS是对传统遍历搜索的改进，遵循“从整体到局部”的原则，首先采用大步距在全局范围内初步搜索，确定适应度最高的点，进而在以该点为中心的区间内小步距精细化搜索，最终求得全局最优解。

具体的，生成第三训练样本集包括如下的过程：

步骤一：按照步距，在过采样倍率区间内遍历，获取多个过采样倍率。

一般的，过采样倍率区间的初始范围为[0,1]。步距可根据经验设置。步距的初始值用Δβ_w表示。设Δβ_w＝1/T_w，T_w∈N⁺，N⁺表示正整数集，则T_w表示正整数。因此，获取的β的初始数量为T_w+1个，则初始获得的每一个β用

表示，

应当理解的是，t＝0时，

即相当于不会进行过采样，此时，在后续步骤中进行训练的第四训练样本集即为第二训练样本集。

步骤二：对于每一节点，将第二训练样本集在每一过采样倍率下进行第一预设数量次数的过采样处理，生成该过采样倍率下的第一预设数量的第四训练样本集。

由于变压器故障样本存在类间不平衡问题，需要对少数类样本进行过采样，其中最常用的方法为合成少数过采样技术(synthetic minority oversampling technique，SMOTE)，该方法通过线性插值的方式在两个少数类样本间生成新样本。鉴于现有技术的SMOTE方法存在模糊类边界、易产生噪声、少数类内部不均匀等问题，本发明实施例提出SMOTE-NND方法。该方法综合考虑少数类样本近邻内各类样本的数量及欧氏距离，并据此分配每个少数类样本生成过采样样本的数量。

第一预设数量用N表示，可根据实际情况确定。由于过采样存在随机性，因此，在进行过采样处理时，对同一过采样倍率进行N次过采样，即每次过采样生成的样本不完全相同。

具体的，该步骤包括如下的过程：

(1)对于每一节点，按照该节点的支持向量机对应的两种故障种类统计该节点对应的第二训练样本集中的每种故障种类的样本的数量，划分为少数类样本和多数类样本。

(2)计算每一少数类样本与该第二训练样本集中的其它所有样本之间的欧式距离，筛选得到每一少数类样本的第二预设数量近邻样本。

欧式距离的计算为现有技术，在此不再赘述。第二预设数量用L表示。该少数类样本的第二预设数量近邻样本指的是L个近邻的样本与该少数类样本之间的欧氏距离小于其它样本与该少数类样本之间的距离。应当理解的是，L个近邻样本与该少数类样本之间的欧氏距离可以相同，也可以不同。

(3)统计每一少数类样本的近邻样本中的多数类样本的第一数量。

少数类样本用i表示，则样本i对应的第一数量用m_i表示。样本i的L 个近邻样本中可能包括少数类样本，也可能包括多数类样本，本步骤只统计其中的多数类样本的第一数量。

(4)若该少数类样本对应的第二预设数量和第一数量不相等，则将该少数类样本筛选到非噪声少数类样本集中。

用S表示非噪声少数类样本集，若L≠m_i，即两种故障种类的数量不均衡，则将样本i归入S中。

(5)采用第一算式将非噪声少数类样本集中的每一样本的第一数量进行归一化处理，得到每一样本的类别指标。

具体的，第一算式为：

其中，R_i表示样本i的类别指标，i∈S。

(6)计算非噪声少数类样本集中的每一样本与非噪声少数类样本集中的其它样本之间的欧式距离，筛选得到每一样本的第三预设数量近邻样本。

第三预设数量用K表示。样本i与第三预设数量的每一近邻样本的欧式距离用D_i,k表示，k＝1，2，……，K。

(7)采用第二算式将非噪声少数类样本集中的每一样本与第三预设数量近邻样本之间的欧式距离的平均值归一化处理，得到每一样本的距离指标。

具体的，第二算式为：

其中，Q_i表示样本i的距离指标，

表示样本i与第三预设数量近邻样本之间的欧式距离的平均值，

(8)根据少数类样本的数量、多数类样本的数量和过采样倍率，采用第三算式计算少数类样本的新增样本数量。

具体的，第三算式为：

其中，

表示少数类样本的新增样本数量，β表示过采样倍率，β∈[0,1]，M^-表示少数类样本的数量，M⁺表示多数类样本的数量。

(9)对非噪声少数类样本集中的每一样本，根据每一样本的类别指标、距离指标和少数类样本的新增样本数量，采用第四算式计算每一样本生成的过采样样本的第二数量。

具体的，第四算式为：

其中，

表示样本i生成的过采样样本的第二数量。

(10)对非噪声少数类样本集中的每一样本，在每一样本对应的第三预设数量近邻样本中随机选择第三数量的样本作为辅助样本。

应当理解的是，当样本被选为辅助样本后，并不将该样本剔除，因此，该样本还有可能再次被选为辅助样本。第三预设数量近邻样本被选为辅助样本的概率为：

其中，P_i,k表示第三预设数量近邻样本被选为辅助样本的概率。

(11)对非噪声少数类样本集中的每一样本，根据每一样本及对应的每一辅助样本，采用第五算式计算得到每一样本生成的第三数量的过采样样本。

由于上一步一共选择了第三数量的辅助样本，因此，通过本步骤可以得到第三数量的过采样样本。

具体的，第五算式为：x_os＝x_root+r(x_aux-x_root)。

其中，x_os表示样本i生成的一个过采样样本，x_root表示样本i，x_aux表示样本i对应的一个辅助样本，r为[0,1]范围内的随机数。

(12)将每一样本生成的第三数量的过采样样本与第二训练样本集合并，得到该节点的一个第四训练样本集。

(13)重复上述的过程第一预设数量的次数，得到第一预设数量的第四训练样本集。

通过上述的步骤，将L近邻内均为多数类样本的少数类样本认定为噪声，不对其进行过采样，可尽量避免引入新的噪声；此外，将L近邻内多数类样本较多的非噪声少数类样本生成更多的过采样样本，从而避免类边界少数类样本被淹没，起到强化类边界的作用；再者，将K近邻内欧氏距离平均值较大的非噪声少数类样本生成更多的过采样样本，并且使K近邻内距离根样本更远的样本被选为辅助样本的概率更大，从而降低少数类样本内部分布的不均匀程度，提高分类器对少数类样本稀疏区的识别率。

步骤三：对于每一过采样倍率，采用第一预设数量的第四训练样本集分别训练该节点的支持向量机，得到该节点的第一预设数量的训练后的支持向量机对应的适应度。

该步骤采用前述的MHHO算法进行训练，具体过程将在后文中描述。

步骤四：对于每一过采样倍率，计算该节点的第一预设数量的训练后的支持向量机对应的适应度的平均值和适应度的标准差。

具体的，适应度的平均值的算式如下：

具体的，适应度的标准差的算式如下：

其中，f_t ^w,ave表示第t个过采样倍率下适应度的平均值。f_t ^w,std表示第t 个过采样倍率下适应度的标准差。

表示第t个过采样倍率下第n个训练后的支持向量机对应的适应度。

步骤五：根据适应度的平均值、适应度的标准差和过采样倍率，确定最优的过采样倍率。

具体的，该步骤包括如下的过程：

(1)确定最大适应度的平均值的数量。

根据数量的区别，分别进行下述的(2)和(3)不同的步骤。

(2)若最大适应度的平均值的数量为一个，则将最大适应度的平均值对应的过采样倍率作为备选过采样倍率。

(3)若最大适应度的平均值的数量为至少两个，则确定至少两个最大适应度的平均值对应的最小适应度的标准差的数量。

根据数量的区别，分别进行下述的(4)和(5)不同的步骤。

(4)若最小适应度的标准差的数量为一个，则将最小适应度的标准差对应的过采样倍率作为备选过采样倍率。

(5)若最小适应度的标准差的数量为至少两个，则将最小适应度的标准差对应的最小过采样倍率作为备选过采样倍率。

(6)判断备选过采样倍率是否为过采样倍率区间的初始范围的上限或下限。

根据判断结果的不同，分别进行下述的(7)、(8)和(9)不同的步骤。

(7)若不为过采样倍率区间的初始范围的上限或下限，则将备选过采样倍率作为最优的过采样倍率。

(8)若为过采样倍率区间的初始范围的上限，则将过采样倍率区间的初始范围的上限与步距的初始值的差作为最优的过采样倍率。

(9)若为过采样倍率区间的初始范围的下限，则将步距的初始值作为最优的过采样倍率。

对于(8)和(9)，以

表示最优的过采样倍率，Δβ_w表示步距的初始值，则有：

步骤六：将最优的过采样倍率作为过采样倍率区间的中点并缩小过采样倍率区间和步距后，返回获取多个过采样倍率的步骤，并重复上述所有的步骤，直到再次得到最优的过采样倍率。

缩小的过采样倍率区间的下限为最优的过采样倍率的初始值与步距的初始值的差，缩小的过采样倍率区间的上限为最优的过采样倍率的初始值与步距的初始值的和，即缩小的过采样倍率区间为

缩小的步距为预设倍数与步距的初始值的积，在本发明一具体实施例中，预设倍数为

T_p表示正整数，可根据经验预设，T_p∈N⁺。Δβ_p为缩小的步距，则缩小的步距为Δβ_p＝2Δβ_w/T_p，则缩小的过采样倍率区间中用于计算的第t个过采样倍率用

表示，

一共得到T_p+1个新的过采样倍率。

将再次得到的过采样倍率

返回到前述的步骤一，并重复进行后续的步骤，再次得到最优过采样倍率。

应当理解的是，再次得到最优的过采样倍率的过程中，由于缩小的过采样区间的上限和下限不再是过采样倍率区间的初始范围的上限和下限，因此，相当于步骤五的第(6)步之后不会进行步骤(8)和(9)，只进行步骤(7)，即备选的过采样倍率作为最优的过采样倍率。

步骤七：将再次得到的最优的过采样倍率下生成的第四训练样本集作为第三训练样本集。

步骤S5：对于每一节点，若该节点的判断结果为相同，则通过第二训练样本集训练该节点的支持向量机，得到训练后的第二多标签分类结构诊断模型。

训练该节点的支持向量机的方法同前述的方法相同，为MHHO算法。 MHHO算法基于现有技术的哈里斯鹰算法(harris hawks optimization，HHO)，并在现有技术的哈里斯鹰算法的基础上进行改进。哈里斯鹰算法是一种群体智能算法，该算法模拟哈里斯鹰的群体捕猎行为，并结合levy飞行实现对高维、非连续、不可微等复杂问题的求解。HHO的迭代求解过程包括全局探索阶段和局部开发阶段，阶段的切换由猎物逃逸能量E决定，具体的，现有技术的哈里斯鹰算法如下：

1、全局探索阶段

设哈里斯鹰种群数量为H，第g代哈里斯鹰个体位置记为p_h,g，h＝1， 2，……，H，其维度为待寻优变量数量，对于SVM参数优化问题其维度为 2。

当|E|≥1时，认为猎物体力充沛，哈里斯鹰将随机栖息在寻优空间中，根据是否发现猎物执行不同的位置更新策略，如下式所示：

(1)

(2)

其中，r₀～r₅均表示[0,1]范围内的随机数。

表示种群中随机个体第g 代的位置。ceil(*)表示向上取整函数。f_h,g表示个体h第g代的适应度。

表示猎物第g代的适应度，即种群最优的适应度。

表示猎物第g代的位置，即种群中最优的适应度的个体的位置。

表示第g代种群内所有个体位置的平均值。p_max、p_min分别表示个体位置上限和下限，即待寻优变量的范围。

2、局部开发阶段

当|E|<1时，认为猎物体力不支，哈里斯鹰将采取包围突袭的方式发起狩猎，根据猎物的剩余体力和突围情况执行不同的位置更新策略，具体如下：

(1)0.5≤|E|<1且r₀≥0.5

此时猎物仍有足够体力逃脱，但未能成功突围(r₀≥0.5)，猎物仍在哈里斯鹰包围圈内，哈里斯鹰将采取软包围策略更新位置，如下式所示：

其中，J为猎物跳跃强度，取[0,2]范围内的随机数。

(2)|E|<0.5且r₀≥0.5

此时猎物体力不足以继续逃脱，且未能成功突围，猎物仍在哈里斯鹰包围圈内，哈里斯鹰将采取硬包围策略更新位置，如下式所示：

(3)0.5≤|E|<1且r₀<0.5

此时猎物仍有足够体力逃脱，且成功突破鹰群包围(r₀<0.5)，并执行具有迷惑性的逃脱行为(采用levy飞行进行模拟)。该情况下，哈里斯鹰在执行软包围策略的同时将采取渐进俯冲攻击，如下式所示：

其中，

其中，y表示哈里斯鹰采取软包围后的位置。f_y表示软包围位置的适应度。Z表示哈里斯鹰采取渐进俯冲攻击后的位置。f_z表示渐进俯冲攻击位置的适应度。r表示[0,1]范围内的随机数向量。λ_levy表示levy飞行路径的模拟值。u、v表示(0,1)范围内随机数。δ表示常量，通常取1.5。Γ(*)表示Gamma 函数。

(4)|E|<0.5且r₀<0.5

此时猎物体力不足以继续逃脱，但仍成功突破鹰群包围，并执行具有迷惑性的逃脱行为。该情况下，哈里斯鹰在执行硬包围策略的同时将采取渐进俯冲攻击，如下式所示：

其中，

现有技术的HHO搜索范围较大，搜索效率较高，且在多极值问题中表现出较好的收敛性能，但仍存在一定的缺陷与不足，主要体现在两方面：一是参数设置过于简单，猎物逃逸能量E设置为简单的线性衰减，在迭代后期只进行局部开发，易陷入局部最优；猎物跳跃强度J设置为随机数，忽略了与E之间的关系。二是位置更新时仅依赖种群个体信息，当种群陷入局部最优后无法产生新位置，使得迭代停滞，算法收敛早熟。针对上述问题，本发明实施例对现有技术的哈里斯鹰算法进行了改进，采用MHHO优化SVM参数的关键点在于个体维度及适应度函数的设置，其中哈里斯鹰个体设置为二维向量，包括支持向量机的误差惩罚参数C和高斯核宽度σ。

具体的，本发明实施例的训练该节点的支持向量机的方法包括如下的步骤：

(1)对于每代的第一个体位置，采用哈里斯鹰算法进行更新，得到每代的第二个体位置。

哈里斯鹰算法如上所述，不同的是，本发明实施例的哈里斯鹰算法的个体初始位置通过logistic混沌映射算法生成。混沌映射具有良好的拟随机性、非周期性、遍历性，常用于启发式算法种群初始位置的生成，以使种群尽量均匀分布，从而扩大搜索范围，提高全局收敛性能。logistic混沌映射算法计算的初始位置如下式所示：

其中，

其中，运算符号

表示矩阵的Hadamard乘积。c_h表示个体h的logistic 映射值。μ表示logistic映射控制参数，取值范围(0,4]，当μ＝4时，logistic 映射趋于满映射，分布最为均匀。c_h范围变为[0,1]，因此本发明实施例取μ为4。p_h,0为个体h的初始位置。

此外，现有技术的哈里斯鹰算法的猎物逃逸能量的算式为：

E＝2(2r-1)(1-g/G)。其中，g表示当前迭代次数，G表示迭代次数上限。

针对前述E和J的缺陷，本发明实施例对E和J进行了改进，具体如下：

哈里斯鹰算法的猎物逃逸能量的算式为：E＝2(2r-1)[1-(g/G)^1/e]^1/e。其中， E表示猎物逃逸能量，g表示当前迭代次数，G表示迭代次数上限，e表示自然底数。改进后E的最值在迭代中后期变化较为平缓，在进行局部开发的同时保留了进行全局探索的可能性，降低陷入局部最优的风险。

哈里斯鹰算法的猎物跳跃强度的算式为：J＝r(1+|E|)。其中，J表示猎物跳跃强度。改进后J的最值由当前的E值决定，一方面有助于扩大局部开发阶段前期的搜索范围，另一方面有助于提高局部开发阶段后期的搜索精度。

(2)对于每代的第二个体位置，采用个体随机变异机制进行更新，得到每代的第三个体位置。

具体的，个体随机变异机制的算式如下：

其中，

其中，p_var表示个体h的变异位置。f_var表示变异位置的适应度。由上述两式可知，个体h是否变异取决于随机数r的值，且迭代后期的变异概率更大，从而提高HHO在局部开发阶段跳出局部最优的能力。通过引入个体随机变异机制，降低HHO陷入局部最优的风险。

(3)将每代的第二个体位置和第三个体位置中适应度较优的个体位置作为每代的第四个体位置。

(4)对于每代的第四个体位置，将第一个体位置和第四个体位置中适应度较优的个体位置作为每代的第五个体位置。

现有技术的HHO迭代过程中没有将当前代的种群最优的适应度与上一代进行比较，难以保证每代的种群最优的适应度单调不减。针对此问题，本发明实施例引入精英保留策略，在每一代位置更新后增加一个判断环节，若当前代种群最优个体位置更新后适应度变差，则不更新该个体位置，从而保证种群最优适应度向理论最优值不断逼近。

(5)将第五个体位置返回到采用哈里斯鹰算法进行更新的步骤，并重复上述所有的步骤，直到获得最优的适应度。

具体的，本发明实施例采用的适应度的函数为：

f＝α_AccF_Acc+α_SenF_Sen+α_SpeF_Spe。

其中，

因此，F_Acc表示准确率，是正确分类的样本数占总样本数的比例。

因此，F_Sen表示灵敏度，是少数类样本被正确分类的比例。

因此，F_Spe表示特效性，是多数类样本被正确分类的比例。α_Acc表示F_Acc的权重，α_Sen表示F_Sen的权重，α_Spe表示F_Spe的权重。M⁺表示第二训练样本集的两种故障种类中多数类样本的数量，M^-表示第二训练样本集的两种故障种类中少数类样本的数量，

表示被正确分类的两种故障种类中多数类样本的数量，

表示被正确分类的两种故障种类中少数类样本的数量。

通过上述的留一法计算准确率、灵敏度、特效性三种指标。设多数类原始样本集、少数类原始样本集、少数类过采样样本集分别为X^-、X⁺、

不重复地从X-∪X⁺中取一个样本作为验证样本，

的所有样本(验证样本除外)作为训练样本，训练SVM并给出验证样本的分类结果。重复此步骤M^-+M⁺次，遍历X^-∪X⁺内的所有样本，最后按适应度函数公式计算准确率、灵敏度和特效性。

因此，通过步骤S4和S5，SVM1～SVM7中，对于第二训练样本集中不均衡的分类群组，需要对其样本进行过采样，最终该群组内包含有N个参数优化后的SVM分类器；对于第二训练样本集已均衡的分类群组，无需过采样，该群组内只有一个参数优化后的SVM分类器。

步骤S6：将待诊断样本集输入第二多标签分类结构诊断模型，得到待诊断样本集中的每一样本对应的故障种类。

通过该步骤，对于任意样本，HDAG-SVM仅需调用3个分类群组即可得出诊断结果，且不存在分类重叠、不可分类等问题。

本发明实施例还公开了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序指令；所述计算机程序指令被处理器执行时实现如上述实施例所述的变压器故障诊断方法。

本发明实施例还公开了一种变压器故障诊断系统，包括：如上述实施例所述的计算机可读存储介质。

下面以一具体应用例对本发明实施例的技术方案做进一步说明。

步骤A，设置该应用例的样本及参数，具体如下：

变压器故障样本主要来自于国家电网公司及论文，共搜集到721条样本数据，将所有样本划分为训练样本和测试样本，样本数量如表1所示。

表1变压器故障样本数量

故障类型	T1	T2	T3	PD	D1	D2	总计
								训练样本数量	50	100	150	50	100	150	600
测试样本数量	14	18	28	16	21	24	121

该应用例的SMOTE-NND算法中，表征近邻的第二预设数量L和第三预设数量K均取5。HS算法中，过采样倍率β区间的初始范围取[0,1]，用于整体搜索的步距的初始值Δβ_w取0.1，局部搜索步距Δβ_p取0.01，每个过采样倍率下进行过采样的第一预设数量N取35。MHHO算法中，SVM误差惩罚参数C优化范围取(0,100]，SVM高斯核宽度σ优化范围取(0,10]，迭代次数上限G取100，种群数量H取40；对于第二训练样本集中两种故障种类样本数量不相同的分类群组，3种适应度指标权值α_Acc、α_Sen、α_Spe分别取3、 2、1；对于第二训练样本集中两种故障种类样本数量相同的分类群组，不区分多数类和少数类，α_Acc、α_Sen、α_Spe分别取1、0、0。

步骤B，分析诊断模型训练结果，具体如下：

由表1可知，分类群组SVM1的训练样本的两种故障种类样本数量相同，无需进行过采样，通过MHHO优化SVM参数后，该群组内仅有一个SVM。分类群组SVM2～SVM7的训练样本两种故障种类样本数量不相同，需采用 SMOTE-NND进行过采样，并通过HS-MHHO优化过采样倍率及SVM参数，最终每个分类群组内包含N个即35个SVM。诊断模型训练结果如表2所示。

表2诊断模型训练结果

由表2可知，SVM2～SVM7的最优的过采样倍率均介于0.85～1之间，可以在充分强化少数类样本数据特征的同时，尽量避免引入噪声样本。训练阶段留一法验证的准确率基本都在90％以上，说明本发明实施例的双层优化方法效果较好。下面以分类群组SVM2为例，进一步展示过采样及参数优化效果。其中，下层适应度平均值变化曲线如图3所示，最优的过采样倍率下各次过采样的指标分布情况如图4所示。

由图3可知，随着过采样倍率的增大，下层适应度平均值逐渐增大，于 0.88处达到峰值，之后略有减小。这说明过采样倍率的增大使得少数类样本的数据特征不断增强，当过采样倍率达到一定值后少数类样本数据特征的可强化空间趋于饱和，此后继续增加倍率并不会使得下层适应度平均值有明显增大，反而可能引入噪声样本导致分类性能下降。

由图4可知，在最优的过采样倍率0.88下进行的35次过采样及SVM 参数优化，其下层优化结果中准确率范围为90％～96％，灵敏度范围为 90％～100％，特效性范围为88％～98％。这说明经过参数优化后，在最优过采样倍率0.88下，分类群组SVM2内的各个SVM对总体样本、少数类样本、多数类样本的诊断分类具有较好的泛化能力。

步骤C，分析诊断模型测试结果，具体如下：

(1)不同过采样倍率的诊断测试对比分析

为验证不同过采样倍率对诊断模型分类性能的影响，设计3组算例CE1～CE3。CE1过采样倍率为步骤B优化结果，CE2不进行过采样，CE3 中各分类群组的过采样倍率均取1，其余参数设置与步骤A相同。分别采用 CE1～CE3训练所得的诊断模型对121个测试样本进行分类，得到混淆矩阵如图5所示，具体诊断结果如表3所示。

由图5可知，CE1～CE3准确率分别为95.04％、83.47％、92.56％，其中， CE1对T2、T3、D1、D2类型故障样本的区分能力高于CE2，对PD、D1、 D2类型故障样本的区分能力高于CE3。这说明与不进行过采样和完全平衡过采样相比，对过采样倍率进行优化后的诊断模型具有更强的分类性能，各类故障样本的错分数量基本保持在1个及以下。

(2)不同过采样方法的诊断测试对比分析

为验证不同过采样方法对诊断模型分类性能的影响，另设计2组算例 CE4、CE5与CE1进行对比。相较于CE1，CE4的过采样方法采用SMOTE， CE5的过采样方法采用自适应综合过采样算法(Adaptive synthetic sampling, ADASYN，该算法是SMOTE的一种改进算法)，两种过采样方法中的近邻数均取5。分别采用CE1、CE4、CE5训练所得的诊断模型对121个测试样本进行分类，得到混淆矩阵如图6所示，具体诊断结果如表3所示。

由图6可知，CE4、CE5准确率分别为88.43％、84.3％，均低于CE1的 95.04％，其中，CE1对T2、T3、PD、D1类型故障样本的区分能力高于CE4，对除D2类型以外故障样本的区分能力高于CE5。这说明SMOTE-NND通过降低合成噪声风险、强化类边界、强化少数类样本内部稀疏区等措施，使得生成的过采样样本质量高于SMOTE、ADASYN生成的样本，从而训练得到分类性能更强的诊断模型。

(3)不同参数优化方法的诊断测试对比分析

为验证不同参数优化方法对诊断模型分类性能的影响，另设计2组算例CE6、CE7与CE1进行对比。相较于CE1，CE6的下层SVM参数优化方法采用标准HHO算法，CE7则采用粒子群算法(PSO)。HHO算法参数与步骤A相同，PSO算法中，种群数量取40，迭代次数上限取100，自我学习因子、群体学习因子均取2。分别采用CE1、CE6、CE7训练所得的诊断模型对121个测试样本进行分类，得到混淆矩阵如图7所示，具体诊断结果如表3所示。

由图7可知，CE6、CE7准确率分别为85.95％、85.12％，均低于CE1 的95.04％，其中，CE1对所有类型故障样本的区分能力均高于CE6、CE7。这说明与HHO及PSO相比，MHHO的搜索能力与收敛性能更强，不易陷入局部最优，从而能够搜索到使诊断模型泛化能力更强的SVM参数。

(4)算例CE1～CE7的具体诊断结果如表3所示，其中粗体字为诊断错误分类。

表3测试样本诊断结果

通过应用例可知，本发明实施例的考虑过采样器与分类器参数优化的变压器故障诊断方法针对变压器故障样本不均衡导致的故障诊断准确率低、诊断效果偏向多数类样本的问题，能够通过过采样提高诊断的准确率，并且通过对过采样倍率及SVM参数的优化获得泛化能力更强的诊断模型。

综上，本发明实施例，与不进行过采样及完全平衡过采样相比，最优的过采样倍率能够充分强化少数类样本的数据特征，且降低引入噪声的风险，可有效提高过采样合成少数类样本的质量；通过SMOTE-NND过采样方法，能够尽量避免合成噪声，降低少数类与多数类样本的边界模糊度，降低少数类样本内部分布的不均匀程度，从而合成高质量的少数类样本；通过基于 MHHO的下层SVM参数优化方法，收敛性能良好，不易陷入局部最优，使得优化后SVM的泛化能力更强。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种变压器故障诊断方法，其特征在于，包括：

2.根据权利要求1所述的变压器故障诊断方法，其特征在于，所述训练该节点的所述支持向量机的方法包括：

对于每代的第一个体位置，采用哈里斯鹰算法进行更新，得到每代的第二个体位置；

对于每代的所述第二个体位置，采用个体随机变异机制进行更新，得到每代的第三个体位置；

将每代的所述第二个体位置和所述第三个体位置中适应度较优的个体位置作为每代的第四个体位置；

对于每代的所述第四个体位置，将所述第一个体位置和所述第四个体位置中适应度较优的个体位置作为每代的第五个体位置；

将所述第五个体位置返回到采用哈里斯鹰算法进行更新的步骤，并重复上述所有的步骤，直到获得最优的适应度；

其中，所述哈里斯鹰算法的个体为包括所述支持向量机的误差惩罚参数和高斯核宽度的二维向量，所述哈里斯鹰算法的个体初始位置通过logistic混沌映射算法生成。

3.根据权利要求2所述的变压器故障诊断方法，其特征在于，所述适应度的函数为：

f＝α_AccF_Acc+α_SenF_Sen+α_SpeF_Spe；

其中，

α_Acc表示F_Acc的权重，α_Sen表示F_Sen的权重，α_Spe表示F_Spe的权重，M⁺表示所述第二训练样本集的两种故障种类中多数类样本的数量，M^-表示所述第二训练样本集的两种故障种类中少数类样本的数量，

表示被所述支持向量机正确分类的两种故障种类中多数类样本的数量，

表示被所述支持向量机正确分类的两种故障种类中少数类样本的数量。

4.根据权利要求2所述的变压器故障诊断方法，其特征在于，

所述哈里斯鹰算法的猎物逃逸能量的算式为：

E＝2(2r-1)[1-(g/G)^1/e]^1/e，其中，E表示猎物逃逸能量，g表示当前迭代次数，G表示迭代次数上限，e表示自然底数；

所述哈里斯鹰算法的猎物跳跃强度的算式为：

J＝r(1+|E|)，其中，J表示猎物跳跃强度。

5.根据权利要求1所述的变压器故障诊断方法，其特征在于，所述生成第三训练样本集的步骤包括：

按照步距，在过采样倍率区间内遍历，获取多个过采样倍率；

对于每一节点，将所述第二训练样本集在每一所述过采样倍率下进行第一预设数量次数的过采样处理，生成该过采样倍率下的第一预设数量的第四训练样本集；

对于每一所述过采样倍率，采用第一预设数量的所述第四训练样本集分别训练该节点的所述支持向量机，得到该节点的第一预设数量的训练后的支持向量机对应的适应度；

对于每一所述过采样倍率，计算该节点的第一预设数量的训练后的支持向量机对应的适应度的平均值和适应度的标准差；

根据所述适应度的平均值、所述适应度的标准差和所述过采样倍率，确定最优的过采样倍率；

将最优的过采样倍率作为过采样倍率区间的中点并缩小过采样倍率区间和步距后，返回所述获取多个过采样倍率的步骤，并重复上述所有的步骤，直到再次得到最优的过采样倍率；

将所述再次得到的最优的过采样倍率下生成的第四训练样本集作为所述第三训练样本集。

6.根据权利要求4所述的变压器故障诊断方法，其特征在于，所述生成该过采样倍率下的第一预设数量的第四训练样本集的步骤，包括：

对于每一节点，按照该节点的支持向量机对应的两种故障种类统计该节点对应的第二训练样本集中的每种故障种类的样本的数量，划分为少数类样本和多数类样本；

计算每一所述少数类样本与该第二训练样本集中的其它所有样本之间的欧式距离，筛选得到每一所述少数类样本的第二预设数量近邻样本；

统计每一所述少数类样本的近邻样本中的多数类样本的第一数量；

若该少数类样本对应的所述第二预设数量和所述第一数量不相等，则将该少数类样本筛选到非噪声少数类样本集中；

采用第一算式将所述非噪声少数类样本集中的每一样本的所述第一数量进行归一化处理，得到每一样本的类别指标；

计算所述非噪声少数类样本集中的每一样本与所述非噪声少数类样本集中的其它样本之间的欧式距离，筛选得到每一样本的第三预设数量近邻样本；

采用第二算式将所述非噪声少数类样本集中的每一样本与第三预设数量近邻样本之间的欧式距离的平均值归一化处理，得到每一样本的距离指标；

根据所述少数类样本的数量、所述多数类样本的数量和所述过采样倍率，采用第三算式计算所述少数类样本的新增样本数量；

对所述非噪声少数类样本集中的每一样本，根据每一样本的所述类别指标、所述距离指标和所述少数类样本的新增样本数量，采用第四算式计算每一样本生成的过采样样本的第二数量；

对所述非噪声少数类样本集中的每一样本，在每一样本对应的第三预设数量近邻样本中随机选择第三数量的样本作为辅助样本；

对所述非噪声少数类样本集中的每一样本，根据每一样本及对应的每一辅助样本，采用第五算式计算得到每一样本生成的第三数量的过采样样本；

将每一样本生成的所述第三数量的过采样样本与所述第二训练样本集合并，得到该节点的一个所述第四训练样本集；

重复上述的过程第一预设数量次数，得到第一预设数量的所述第四训练样本集；

所述第一算式为：

其中，R_i表示样本i的类别指标，m_i表示样本i的第一数量，i∈S，S表示非噪声少数类样本集；

所述第二算式为：

其中，Q_i表示样本i的距离指标，

表示样本i与第三预设数量近邻样本之间的欧式距离的平均值；

所述第三算式为：

其中，

表示少数类样本的新增样本数量，β表示过采样倍率，M^-表示少数类样本的数量，M⁺表示多数类样本的数量；

所述第四算式为：

其中，

表示样本i生成的过采样样本的第二数量；

所述第五算式为：

x_os＝x_root+r(x_aux-x_root)，其中，x_os表示样本i生成的一个过采样样本，x_root表示样本i，x_aux表示样本i对应的一个辅助样本，r为[0,1]范围内的随机数。

7.根据权利要求4所述的变压器故障诊断方法，其特征在于，所述确定最优的过采样倍率的步骤，包括：

确定最大所述适应度的平均值的数量；

若最大所述适应度的平均值的数量为一个，则将最大所述适应度的平均值对应的所述过采样倍率作为备选过采样倍率；

若最大所述适应度的平均值的数量为至少两个，则确定至少两个最大所述适应度的平均值对应的最小所述适应度的标准差的数量；

若最小所述适应度的标准差的数量为一个，则将最小所述适应度的标准差对应的所述过采样倍率作为备选过采样倍率；

若最小所述适应度的标准差的数量为至少两个，则将最小所述适应度的标准差对应的最小所述过采样倍率作为备选过采样倍率；

判断所述备选过采样倍率是否为所述过采样倍率区间的初始范围的上限或下限；

若不为所述过采样倍率区间的初始范围的上限或下限，则将所述备选过采样倍率作为最优的过采样倍率；

若为所述过采样倍率区间的初始范围的上限，则将所述过采样倍率区间的初始范围的上限与所述步距的初始值的差作为最优的过采样倍率；

若为所述过采样倍率区间的初始范围的下限，则将所述步距的初始值作为最优的过采样倍率。

8.根据权利要求4所述的变压器故障诊断方法，其特征在于，所述缩小的过采样倍率区间的下限为所述最优的过采样倍率的初始值与所述步距的初始值的差，所述缩小的过采样倍率区间的上限为所述最优的过采样倍率的初始值与所述步距的初始值的和，所述缩小的步距为预设倍数与步距的初始值的积。

9.一种计算机可读存储介质，其特征在于：所述计算机可读存储介质上存储有计算机程序指令；所述计算机程序指令被处理器执行时实现如权利要求1～8中任一项所述的变压器故障诊断方法。

10.一种变压器故障诊断系统，其特征在于，包括：如权利要求9所述的计算机可读存储介质。