CN117520809A

CN117520809A - 一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法

Info

Publication number: CN117520809A
Application number: CN202311263510.3A
Authority: CN
Inventors: 潘鹏程; 董一凡; 徐恒山; 魏业文
Original assignee: China Three Gorges University CTGU
Current assignee: China Three Gorges University CTGU
Priority date: 2023-09-27
Filing date: 2023-09-27
Publication date: 2024-02-06

Abstract

一种基于EEMD‑KPCA‑CNN‑BiLSTM的变压器故障诊断方法，包括以下步骤：步骤S1：采集变压器的油中溶解气体数据、温度数据、环境风速数据和对应的故障率，利用皮尔逊相关系数分析法，分析各状态变量与故障率的关系；步骤S2：利用集成经验模态分解对上述变量序列进行分解，将原始变量信号中的不同尺度波动逐级分级出来，产生不同尺度的数据序列，去除噪音信号；步骤S3：利用核主元分析筛选出影响故障率的关键因子，降低模型输入参数的维度；步骤S4：利用CNN在高维空间提取特征集与故障率间的特征向量。本发明提出了一种基于EEMD‑KPCA‑CNN‑BiLSTM的变压器故障预测方法，能够挖掘变压器运行状态参量和外部环境对变压器运行状态的影响，提高电网的可靠性和可用性。

Description

一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法

技术领域

本发明涉及电气设备检修技术领域，特别是一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法

背景技术

变压器是电力系统中的重要设备，负责将电能进行传输和分配。然而，由于运行环境、负载变化和设备老化等原因，变压器可能会发生故障，导致电网的不稳定和电力供应的中断。因此，及时预测故障发生，确保变压器安全可靠运行十分重要。

传统的变压器故障检测方法主要基于周期性维护和人工巡检，这种方法存在以下不足：1.主观性：人工巡检容易受到人员经验和主观判断的影响，存在误判和漏判的风险。2.高成本：周期性维护和人工巡检需要大量的人力和物力资源，成本较高。

为了提高变压器故障预测的准确性和效率，研究者们开始应用机器学习和深度学习技术，如神经网络、支持向量机和随机森林等，来构建自动化的故障预测模型。这些模型可以利用变压器的历史运行数据和监测数据，通过学习数据中的模式和特征，来预测变压器未来可能发生的故障。

近年来，随着深度学习技术的快速发展，基于深度学习的变压器故障预测方法得到了广泛关注。深度学习模型如卷积神经网络(CNN)、循环神经网络(RNN)和长短期记忆网络(LSTM)等，可以从变压器的大量数据中学习和提取特征，实现更准确的故障预测。因此，基于机器学习和深度学习的变压器故障预测模型正在逐渐取代传统的人工巡检方法，为电力系统的稳定运行提供了可靠的支持。这些模型的研究和应用有助于提前发现和预防变压器故障，减少停电事故的发生，提高电网的可靠性和可用性。

发明内容

本发明提出了一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障预测方法，能够挖掘变压器运行状态参量和外部环境对变压器运行状态的影响，提高电网的可靠性和可用性。

为解决上述技术问题，本发明所采用的技术方案是：一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法，包括以下步骤：

步骤S1：采集变压器的油中溶解气体数据、温度数据、环境风速数据和对应的故障率，利用皮尔逊相关系数分析法，分析各状态变量与故障率的关系；

步骤S2：利用集成经验模态分解对上述变量序列进行分解，将原始变量信号中的不同尺度波动逐级分级出来，产生不同尺度的数据序列，去除噪音信号；

步骤S3：利用核主元分析筛选出影响故障率的关键因子，降低模型输入参数的维度；

步骤S4：利用CNN在高维空间提取特征集与故障率间的特征向量；

步骤S5：将特征集分为训练集和测试集，训练集输入到双向长短期记忆神经网络中进行模型训练，同时通过鱼鹰优化算法对双向长短期记忆神经网络预测模型中批处理、学习率、隐藏层层数和层神经元数4个重要参数进行自动寻优，得到最优参数组合；

步骤S6：用测试集对模型进行评估。

优选的，所述步骤S1包括以下步骤：

步骤S11：按照变压器实际运行的特点，完成相关传感器，采集模块和传输方式的选择；

步骤S12：将温度传感器、风速传感器放在变压器合适位置，同步采集温度和风速信号，从电力系统在线监测系统导出同时刻的油中溶解气体数据；

步骤S13：将传感器采集的模拟信号通过AD转换模块进行数据转变，转换成数字信号后由通讯模块按照数据包发送至计算机端；

步骤S14：计算机上的上位机通过数据解码将原始的温度和风速信号显示在人机界面当中，并能实现实时保存；

步骤S15：根据式(1)，利用皮尔逊相关系数可分析得到各环境因素数据与功率数据之间的相关关系，有利于更清晰的认识影响故障率变化的关键环境因素；

式中：∣r∣≤1为各个因素之间的相关系数；x_i和y_i为第i个数据点的2个因素的值；和/>为2个因素的均值；n为数据点的个数；

步骤S16：根据上式的计算结果，选择相关系数比较大的变量因素作为模型的初始输入。

优选的，所述步骤S2包括以下步骤：

步骤S21：给定最后的总平均次数M；

步骤S22：对一个输入变量x(t)加入一个具有标准正态分布的白噪音序列n_i(t)，产生一个新的信号x_i(t)＝x(t)+n_i(t)，式中n_i(t)表示第i次加入白噪声序列，x_i(t)表示第i次实验的附加噪声信号，i＝1,2,…,M；

步骤S23：对所含噪声的信号x_i(t)分别进行EMD分解，得到各自IMF和的形式：

式中，c_i,j(t)为第i次加入白噪声后分解得到的第j个IMF，r_i,j(t)是残余函数，代表信号的平均趋势，j是IMF的数量；

步骤S24：具体EMD分解过程如下：

对于一个加入噪音的信号序列，找到它所有的极大值点确定为上包络线，所有极小值点确定为下包络线，m(t)表示上包络线和下包络线的均值，第1个分量h₁(t)＝x(t)-m(t)；

在第2个筛选过程中，h₁(t)被视作原始数据，m₁(t)是h₁(t)的上下包络线的均值，如步骤S21所示确定第2个分量h₂(t)；

筛选过程重复n次，直到是h_n(t)是一个本征模态函数或剩余分量r_n(t)为一个单调函数，终止分解过程得的相应的IMF分量；

步骤S25：重复步骤S22和步骤S24进行M次，每次分解加入不同幅值的白噪声信号得到IMF的集合为：c_1,j(t)，c_2,j(t)，...，c_M,j(t)，j＝1,2,...J；

步骤S26：利用不相关序列的统计平均值为0的原理，将上述对应的IMF进行集合平均运算，得到EEMD分解后最终的IMF，即：

式中，c_j(t)是EEMD分解的第j个IMF，i＝1,2,...M,j＝1,2,...J。

优选的，所述步骤S3包括以下步骤：

步骤S31：首先选择一个核函数，然后计算样本之间的核相似度；可以使用以下公式计算RBF核矩阵：

其中，是核函数的参数，‖x-z‖表示样本x和y之间的欧氏距离；

步骤S32：将核矩阵进行中心化，使得其均值为零；

步骤S33：为计算核矩阵的特征向量和特征值，对中心化的核矩阵进行特征值分解，得到特征向量和特征值；

步骤S34：选择降维后的维数k，对前k个最大的特征值对应的特征向量：将特征值从大到小排序，选择前k个最大的特征值对应的特征向量，构成新的数据空间；

步骤S35：将进行EEMD分解后的数据集X与所选择的k个特征向量相乘，得到降维后的数据矩阵Z。

优选的，所述步骤S4包括以下步骤：

步骤S41：构建CNN网络，通过给定卷积层和池化层的个数，用于提取输入序列的空间特征；给定卷积核的数目、卷积步长、卷积方式的参数设置，选择tanh函数为激活函数，用于提取更加复杂的特征；

步骤S42：将降维后的数据矩阵输入到CNN模型中，通过卷积层和池化层进行特征提取，将其转化为更高级的特征表示；

步骤S43：特征集的生成，从CNN模型的输出层获取特征向量，表示数据在高维空间中的特征集；

步骤S44：将生成的特征集进行序列化操作，将序列化后的数据集划分为训练集和测试集。

优选的，所述步骤S5包括以下步骤：

步骤S51：设置BiLSTM训练参数批处理batsize和学习率alpha取值范围，设置结构参数隐藏层层数和层神经元数num的取值范围，记参数组η＝{batsize,alpha,[num₁,…,num_n]}，利用OOA对上述参数进行寻优；

步骤S52：根据鱼鹰成员在搜索空间中的位置确定问题变量的值，使用公式(5)对搜索空间使用矩阵进行建模；

随机初始化寻优空间里初始种群的位置：

x_i,j＝lb_j+r·(ub_j-lb_j) (6)

其中X_i,j为个体，lb_j为寻优下边界，ub_j为寻优上边界,r为[0,1]之间的随机数；

批处理batsize、学习率alpha、隐藏层层数和层神经元数num的评估值使用根据公式(7)的向量表示；

步骤S53：定位和捕鱼

每个鱼鹰的鱼组是用公式(8)指定的，

FP_i＝{X_k∣k∈{1,2,…,N}∧F_k<F_i}∪{X_best} (8)

其中FP_i是第i只鱼鹰的鱼集合，X_best是最佳鱼鹰的位置；

鱼鹰随机检测到其中一条鱼的位置并攻击它，在模拟鱼鹰向鱼移动的基础上，使用公式(9-a)、(9-b)计算相应鱼鹰的新位置；如果该新位置更优，则根据公式(10)替换鱼鹰的先前位置；

其中SF为鱼鹰选中的鱼，r为[0,1]之间的随机数，I的值为{1,2}中的一个；

步骤S54：把鱼带到合适的位置；

在OOA的设计中，为了模拟鱼鹰的这种自然行为，首先，对于种群中的每个成员，使用公式(11-a)、(11-b)计算一个新的随机位置作为“适合吃鱼的位置”；然后，如果目标函数的值在这个新位置上得到改善，则它根据公式(12)替换相应鱼鹰的先前位置；

其中t为迭代次数，T为最大迭代次数；

步骤S55：得到最有超参组合。

优选的，所述步骤S6包括以下步骤：

步骤S61：选取误差最大百分比y_E-max、平均绝对百分比误差y_MAPE、预测精度平均值y_MAPE作为模型评估指标，其数学表达式如下：

步骤S62：将测试集输入模型进行状态评估。

本发明提供一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法，首先采集变压器的运行状态变量和外部环境因素，结合皮尔逊相关系数分析各环境和运行变量与故障率之间的相关系数，找出其中关联度更大的几个因素作为主要的输入；然后采用集成经验模态分解对上述变量序列进行逐级分解，产生不同尺度的数据序列，去除其中的噪音信号；再利用核主元分析筛选出影响故障率的关键因子进行降维，减少输入变量的维度，然后利用CNN在高维空间提取多维特征向量，将结果输入到到双向长短期记忆神经网络中进行模型训练，同时通过鱼鹰优化算法对双向长短期记忆神经网络预测模型进行超参寻优，最后使用测试集对模型进行评估，该模型能够反应变压器的状态，在工程实验中具有很高的价值。

本方法不仅考虑了变压器内部状态监测数据(溶解气体、温度),还加入了外部环境监测数据(风速),实现了异构数据的有效融合,构建更全面的诊断模型。

去噪预处理，使用EEMD算法可以移除原始监测数据中的噪声成分,有利于后续特征提取和模型训练。相比直接使用原始数据,可获得更准确的诊断结果。

降维提取关键特征，应用KPCA方法可以从高维监测数据中提取最重要的低维特征,既降低了输入维数,又保留了最关键的信息,提升了模型效果。

深度特征学习，CNN可以学习数据的深层非线性特征表示,而传统方法无法实现。这可以捕捉数据中的潜在规律,使诊断更准确。

时间相关性建模，BiLSTM结构考虑了时间序列数据的长期依赖性,相比只看当前时刻的方法,可以实现动态变化趋势的建模。

超参数自动优化，OOA算法实现了模型超参数的自动优化,无需人工经验调节,使得模型性能得到最大化。

附图说明

下面结合附图和实施例对本发明作进一步说明：

图1为本发明的结构示意图；

图2为本发明的EEMD分解流程图；

图3为本发明的CNN卷积层的多池化操作流程示意图；

图4为本发明的OOA算法流程图；

图5为本发明的BiLSTM网络层的结构示意图。

具体实施方式

如图1所示，一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法，包括以下步骤：

步骤S1：采集变压器的油中溶解气体数据、温度数据、环境风速数据和对应的故障率，利用皮尔逊相关系数分析法，分析各状态变量与故障率的关系；主要包括CH₄、C₂H₄、CO₂、H₂、C₂H₆、CO。

步骤S6：用测试集对模型进行评估。

优选的，所述步骤S1包括以下步骤：

步骤S12：将温度传感器、风速传感器放在变压器合适位置，同步采集温度和风速信号，从电力系统在线监测系统导出同时刻的油中溶解气体数据，采集时间间隔设置为每4分钟采集一次；

优选的，所述步骤S2包括以下步骤，对于EEMD的分解流程如图2：

步骤S21：给定最后的总平均次数M；

步骤S24：具体EMD分解过程如下：

在第2个筛选过程中，h_i(t)被视作原始数据，m₁(t)是h₁(t)的上下包络线的均值，如步骤S21所示确定第2个分量h₂(t)；

式中，c_j(t)是EEMD分解的第j个IMF，i＝1,2,...M,j＝1,2,...J。

优选的，所述步骤S3包括以下步骤：

步骤S31：首先选择一个核函数(如径向基函数RBF核、多项式核等)，然后计算样本之间的核相似度；可以使用以下公式计算RBF核矩阵：

步骤S32：将核矩阵进行中心化，使得其均值为零，这一步是为了确保在高维空间中进行PCA时，得到的主成分是在原始数据中中心化后的结果；

优选的，所述步骤S4包括以下步骤，如图3所示：

步骤S41：构建CNN网络，通过给定卷积层和池化层的个数，用于提取输入序列的空间特征；给定卷积核的数目、卷积步长、卷积方式的参数设置，选择tanh函数为激活函数，用于提取更加复杂的特征；构建CNN网络，设置卷积层为2层，池化层为1层的结构，设置卷积核数目为16和32、卷积步长为2，选择same卷积方式，tanh函数为激活函数；

步骤S42：将降维后的数据矩阵输入到CNN模型中，通过卷积层和池化层进行特征提取，将其转化为更高级的特征表示；通过2次卷积层和Valid池化层进行特征提取，将其转化为一维特征向量；

步骤S43：特征集的生成，从CNN模型的输出层获取特征向量，表示数据在高维空间中的特征集；这些特征向量具有更高层次的抽象表示，能够捕捉到数据中的重要特征信息；

步骤S44：将生成的特征集进行序列化操作，将序列化后的数据集划分为训练集和测试集。通常采用随机划分的方式，确保训练集和测试集之间的数据是相互独立且具有代表性的。

优选的，所述步骤S5包括以下步骤，如图4和图5所示：

随机初始化寻优空间里初始种群的位置：

x_i,j＝lb_j+r·(ub_j-lb_j) (6)

因为每个鱼鹰都是问题的候选解决方案，对应于每个鱼鹰，所以可以评估目标函数。批处理batsize、学习率alpha、隐藏层层数和层神经元数num的评估值使用根据公式(7)的向量表示；

步骤S53：定位和捕鱼

OOA中种群更新的第一阶段是基于对鱼鹰这种自然行为的模拟而建模的。对鱼鹰攻击鱼类的建模会导致鱼鹰在搜索空间中的位置发生显著变化，这增加了OOA在识别最佳区域和逃离局部最优方面的探索能力。

在OOA设计中，对于每只鱼鹰，搜索空间中具有更好目标函数值的其他鱼鹰的位置被视为水下鱼类。每个鱼鹰的鱼组是用公式(8)指定的，

FP_i＝{X_k∣k∈{1,2,…,N}∧F_k<F_i}∪{X_best} (8)

其中FP_i是第i只鱼鹰的鱼集合，X_best是最佳鱼鹰的位置；

步骤S54：把鱼带到合适的位置；

鱼鹰在猎杀一条鱼后，会把它带到一个合适的(对他来说安全的)位置，在那里吃。OOA中种群更新的第二阶段是基于对鱼鹰这种自然行为的模拟进行建模的。将鱼带到合适位置的建模导致鱼鹰在搜索空间中的位置发生微小变化，这导致OOA在局部搜索中的利用能力增加，并在发现的解决方案附近收敛到更好的解决方案；

其中t为迭代次数，T为最大迭代次数；

步骤S55：得到最有超参组合。

优选的，所述步骤S6包括以下步骤：

步骤S62：将测试集输入模型进行状态评估。

本发明首先采集变压器的运行状态变量和外部环境因素，结合皮尔逊相关系数分析各环境和运行变量与故障率之间的相关系数，找出其中关联度更大的几个因素作为主要的输入；然后采用集成经验模态分解对上述变量序列进行逐级分解，产生不同尺度的数据序列，去除其中的噪音信号；再利用核主元分析筛选出影响故障率的关键因子进行降维，减少输入变量的维度，然后，利用卷积神经网络在高维空间提取特征集与故障率间的特征向量，将结果输入到双向长短期记忆神经网络进行训练，从而预测变压器故障率的发展趋势。

上述的实施例仅为本发明的优选技术方案，而不应视为对于本发明的限制，本发明的保护范围应以权利要求记载的技术方案，包括权利要求记载的技术方案中技术特征的等同替换方案为保护范围。即在此范围内的等同替换改进，也在本发明的保护范围之内。

Claims

1.一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法，其特征在于，包括以下步骤：

步骤S6：用测试集对模型进行评估。

2.根据权利要求1所述一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法，其特征在于，所述步骤S1包括以下步骤：

3.根据权利要求1所述一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法，其特征在于，所述步骤S2包括以下步骤：

步骤S21：给定最后的总平均次数M；

步骤S24：具体EMD分解过程如下：

式中，c_j(t)是EEMD分解的第j个IMF，i＝1,2,...M,j＝1,2,...J。

4.根据权利要求1所述一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法，其特征在于，所述步骤S3包括以下步骤：

其中，是核函数的参数，||x-z||表示样本x和y之间的欧氏距离；

步骤S32：将核矩阵进行中心化，使得其均值为零；

5.根据权利要求1所述一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法，其特征在于，所述步骤S4包括以下步骤：

6.根据权利要求1所述一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法，其特征在于，所述步骤S5包括以下步骤：

随机初始化寻优空间里初始种群的位置：

x_i,j＝lb_j+r·(ub_j-lb_j) (6)

步骤S53：定位和捕鱼

每个鱼鹰的鱼组是用公式(8)指定的，

FP_i＝{X_k∣k∈{1,2,…,N}∧F_k<F_i}∪{X_best} (8)

其中FP_i是第i只鱼鹰的鱼集合，X_best是最佳鱼鹰的位置；

步骤S54：把鱼带到合适的位置；

其中t为迭代次数，T为最大迭代次数；

步骤S55：得到最有超参组合。

7.根据权利要求1所述一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法，其特征在于，所述步骤S6包括以下步骤：

步骤S62：将测试集输入模型进行状态评估。