CN117520809A - 一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法 - Google Patents

一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法 Download PDF

Info

Publication number
CN117520809A
CN117520809A CN202311263510.3A CN202311263510A CN117520809A CN 117520809 A CN117520809 A CN 117520809A CN 202311263510 A CN202311263510 A CN 202311263510A CN 117520809 A CN117520809 A CN 117520809A
Authority
CN
China
Prior art keywords
data
cnn
transformer
eemd
hawk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311263510.3A
Other languages
English (en)
Inventor
潘鹏程
董一凡
徐恒山
魏业文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Three Gorges University CTGU
Original Assignee
China Three Gorges University CTGU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Three Gorges University CTGU filed Critical China Three Gorges University CTGU
Priority to CN202311263510.3A priority Critical patent/CN117520809A/zh
Publication of CN117520809A publication Critical patent/CN117520809A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/0985Hyperparameter optimisation; Meta-learning; Learning-to-learn
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • G06F2218/04Denoising
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Abstract

一种基于EEMD‑KPCA‑CNN‑BiLSTM的变压器故障诊断方法,包括以下步骤:步骤S1:采集变压器的油中溶解气体数据、温度数据、环境风速数据和对应的故障率,利用皮尔逊相关系数分析法,分析各状态变量与故障率的关系;步骤S2:利用集成经验模态分解对上述变量序列进行分解,将原始变量信号中的不同尺度波动逐级分级出来,产生不同尺度的数据序列,去除噪音信号;步骤S3:利用核主元分析筛选出影响故障率的关键因子,降低模型输入参数的维度;步骤S4:利用CNN在高维空间提取特征集与故障率间的特征向量。本发明提出了一种基于EEMD‑KPCA‑CNN‑BiLSTM的变压器故障预测方法,能够挖掘变压器运行状态参量和外部环境对变压器运行状态的影响,提高电网的可靠性和可用性。

Description

一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法
技术领域
本发明涉及电气设备检修技术领域,特别是一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法
背景技术
变压器是电力系统中的重要设备,负责将电能进行传输和分配。然而,由于运行环境、负载变化和设备老化等原因,变压器可能会发生故障,导致电网的不稳定和电力供应的中断。因此,及时预测故障发生,确保变压器安全可靠运行十分重要。
传统的变压器故障检测方法主要基于周期性维护和人工巡检,这种方法存在以下不足:1.主观性:人工巡检容易受到人员经验和主观判断的影响,存在误判和漏判的风险。2.高成本:周期性维护和人工巡检需要大量的人力和物力资源,成本较高。
为了提高变压器故障预测的准确性和效率,研究者们开始应用机器学习和深度学习技术,如神经网络、支持向量机和随机森林等,来构建自动化的故障预测模型。这些模型可以利用变压器的历史运行数据和监测数据,通过学习数据中的模式和特征,来预测变压器未来可能发生的故障。
近年来,随着深度学习技术的快速发展,基于深度学习的变压器故障预测方法得到了广泛关注。深度学习模型如卷积神经网络(CNN)、循环神经网络(RNN)和长短期记忆网络(LSTM)等,可以从变压器的大量数据中学习和提取特征,实现更准确的故障预测。因此,基于机器学习和深度学习的变压器故障预测模型正在逐渐取代传统的人工巡检方法,为电力系统的稳定运行提供了可靠的支持。这些模型的研究和应用有助于提前发现和预防变压器故障,减少停电事故的发生,提高电网的可靠性和可用性。
发明内容
本发明提出了一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障预测方法,能够挖掘变压器运行状态参量和外部环境对变压器运行状态的影响,提高电网的可靠性和可用性。
为解决上述技术问题,本发明所采用的技术方案是:一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法,包括以下步骤:
步骤S1:采集变压器的油中溶解气体数据、温度数据、环境风速数据和对应的故障率,利用皮尔逊相关系数分析法,分析各状态变量与故障率的关系;
步骤S2:利用集成经验模态分解对上述变量序列进行分解,将原始变量信号中的不同尺度波动逐级分级出来,产生不同尺度的数据序列,去除噪音信号;
步骤S3:利用核主元分析筛选出影响故障率的关键因子,降低模型输入参数的维度;
步骤S4:利用CNN在高维空间提取特征集与故障率间的特征向量;
步骤S5:将特征集分为训练集和测试集,训练集输入到双向长短期记忆神经网络中进行模型训练,同时通过鱼鹰优化算法对双向长短期记忆神经网络预测模型中批处理、学习率、隐藏层层数和层神经元数4个重要参数进行自动寻优,得到最优参数组合;
步骤S6:用测试集对模型进行评估。
优选的,所述步骤S1包括以下步骤:
步骤S11:按照变压器实际运行的特点,完成相关传感器,采集模块和传输方式的选择;
步骤S12:将温度传感器、风速传感器放在变压器合适位置,同步采集温度和风速信号,从电力系统在线监测系统导出同时刻的油中溶解气体数据;
步骤S13:将传感器采集的模拟信号通过AD转换模块进行数据转变,转换成数字信号后由通讯模块按照数据包发送至计算机端;
步骤S14:计算机上的上位机通过数据解码将原始的温度和风速信号显示在人机界面当中,并能实现实时保存;
步骤S15:根据式(1),利用皮尔逊相关系数可分析得到各环境因素数据与功率数据之间的相关关系,有利于更清晰的认识影响故障率变化的关键环境因素;
式中:∣r∣≤1为各个因素之间的相关系数;xi和yi为第i个数据点的2个因素的值;和/>为2个因素的均值;n为数据点的个数;
步骤S16:根据上式的计算结果,选择相关系数比较大的变量因素作为模型的初始输入。
优选的,所述步骤S2包括以下步骤:
步骤S21:给定最后的总平均次数M;
步骤S22:对一个输入变量x(t)加入一个具有标准正态分布的白噪音序列ni(t),产生一个新的信号xi(t)=x(t)+ni(t),式中ni(t)表示第i次加入白噪声序列,xi(t)表示第i次实验的附加噪声信号,i=1,2,…,M;
步骤S23:对所含噪声的信号xi(t)分别进行EMD分解,得到各自IMF和的形式:
式中,ci,j(t)为第i次加入白噪声后分解得到的第j个IMF,ri,j(t)是残余函数,代表信号的平均趋势,j是IMF的数量;
步骤S24:具体EMD分解过程如下:
对于一个加入噪音的信号序列,找到它所有的极大值点确定为上包络线,所有极小值点确定为下包络线,m(t)表示上包络线和下包络线的均值,第1个分量h1(t)=x(t)-m(t);
在第2个筛选过程中,h1(t)被视作原始数据,m1(t)是h1(t)的上下包络线的均值,如步骤S21所示确定第2个分量h2(t);
筛选过程重复n次,直到是hn(t)是一个本征模态函数或剩余分量rn(t)为一个单调函数,终止分解过程得的相应的IMF分量;
步骤S25:重复步骤S22和步骤S24进行M次,每次分解加入不同幅值的白噪声信号得到IMF的集合为:c1,j(t),c2,j(t),...,cM,j(t),j=1,2,...J;
步骤S26:利用不相关序列的统计平均值为0的原理,将上述对应的IMF进行集合平均运算,得到EEMD分解后最终的IMF,即:
式中,cj(t)是EEMD分解的第j个IMF,i=1,2,...M,j=1,2,...J。
优选的,所述步骤S3包括以下步骤:
步骤S31:首先选择一个核函数,然后计算样本之间的核相似度;可以使用以下公式计算RBF核矩阵:
其中,是核函数的参数,‖x-z‖表示样本x和y之间的欧氏距离;
步骤S32:将核矩阵进行中心化,使得其均值为零;
步骤S33:为计算核矩阵的特征向量和特征值,对中心化的核矩阵进行特征值分解,得到特征向量和特征值;
步骤S34:选择降维后的维数k,对前k个最大的特征值对应的特征向量:将特征值从大到小排序,选择前k个最大的特征值对应的特征向量,构成新的数据空间;
步骤S35:将进行EEMD分解后的数据集X与所选择的k个特征向量相乘,得到降维后的数据矩阵Z。
优选的,所述步骤S4包括以下步骤:
步骤S41:构建CNN网络,通过给定卷积层和池化层的个数,用于提取输入序列的空间特征;给定卷积核的数目、卷积步长、卷积方式的参数设置,选择tanh函数为激活函数,用于提取更加复杂的特征;
步骤S42:将降维后的数据矩阵输入到CNN模型中,通过卷积层和池化层进行特征提取,将其转化为更高级的特征表示;
步骤S43:特征集的生成,从CNN模型的输出层获取特征向量,表示数据在高维空间中的特征集;
步骤S44:将生成的特征集进行序列化操作,将序列化后的数据集划分为训练集和测试集。
优选的,所述步骤S5包括以下步骤:
步骤S51:设置BiLSTM训练参数批处理batsize和学习率alpha取值范围,设置结构参数隐藏层层数和层神经元数num的取值范围,记参数组η={batsize,alpha,[num1,…,numn]},利用OOA对上述参数进行寻优;
步骤S52:根据鱼鹰成员在搜索空间中的位置确定问题变量的值,使用公式(5)对搜索空间使用矩阵进行建模;
随机初始化寻优空间里初始种群的位置:
xi,j=lbj+r·(ubj-lbj) (6)
其中Xi,j为个体,lbj为寻优下边界,ubj为寻优上边界,r为[0,1]之间的随机数;
批处理batsize、学习率alpha、隐藏层层数和层神经元数num的评估值使用根据公式(7)的向量表示;
步骤S53:定位和捕鱼
每个鱼鹰的鱼组是用公式(8)指定的,
FPi={Xk∣k∈{1,2,…,N}∧Fk<Fi}∪{Xbest} (8)
其中FPi是第i只鱼鹰的鱼集合,Xbest是最佳鱼鹰的位置;
鱼鹰随机检测到其中一条鱼的位置并攻击它,在模拟鱼鹰向鱼移动的基础上,使用公式(9-a)、(9-b)计算相应鱼鹰的新位置;如果该新位置更优,则根据公式(10)替换鱼鹰的先前位置;
其中SF为鱼鹰选中的鱼,r为[0,1]之间的随机数,I的值为{1,2}中的一个;
步骤S54:把鱼带到合适的位置;
在OOA的设计中,为了模拟鱼鹰的这种自然行为,首先,对于种群中的每个成员,使用公式(11-a)、(11-b)计算一个新的随机位置作为“适合吃鱼的位置”;然后,如果目标函数的值在这个新位置上得到改善,则它根据公式(12)替换相应鱼鹰的先前位置;
其中t为迭代次数,T为最大迭代次数;
步骤S55:得到最有超参组合。
优选的,所述步骤S6包括以下步骤:
步骤S61:选取误差最大百分比yE-max、平均绝对百分比误差yMAPE、预测精度平均值yMAPE作为模型评估指标,其数学表达式如下:
步骤S62:将测试集输入模型进行状态评估。
本发明提供一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法,首先采集变压器的运行状态变量和外部环境因素,结合皮尔逊相关系数分析各环境和运行变量与故障率之间的相关系数,找出其中关联度更大的几个因素作为主要的输入;然后采用集成经验模态分解对上述变量序列进行逐级分解,产生不同尺度的数据序列,去除其中的噪音信号;再利用核主元分析筛选出影响故障率的关键因子进行降维,减少输入变量的维度,然后利用CNN在高维空间提取多维特征向量,将结果输入到到双向长短期记忆神经网络中进行模型训练,同时通过鱼鹰优化算法对双向长短期记忆神经网络预测模型进行超参寻优,最后使用测试集对模型进行评估,该模型能够反应变压器的状态,在工程实验中具有很高的价值。
本方法不仅考虑了变压器内部状态监测数据(溶解气体、温度),还加入了外部环境监测数据(风速),实现了异构数据的有效融合,构建更全面的诊断模型。
去噪预处理,使用EEMD算法可以移除原始监测数据中的噪声成分,有利于后续特征提取和模型训练。相比直接使用原始数据,可获得更准确的诊断结果。
降维提取关键特征,应用KPCA方法可以从高维监测数据中提取最重要的低维特征,既降低了输入维数,又保留了最关键的信息,提升了模型效果。
深度特征学习,CNN可以学习数据的深层非线性特征表示,而传统方法无法实现。这可以捕捉数据中的潜在规律,使诊断更准确。
时间相关性建模,BiLSTM结构考虑了时间序列数据的长期依赖性,相比只看当前时刻的方法,可以实现动态变化趋势的建模。
超参数自动优化,OOA算法实现了模型超参数的自动优化,无需人工经验调节,使得模型性能得到最大化。
附图说明
下面结合附图和实施例对本发明作进一步说明:
图1为本发明的结构示意图;
图2为本发明的EEMD分解流程图;
图3为本发明的CNN卷积层的多池化操作流程示意图;
图4为本发明的OOA算法流程图;
图5为本发明的BiLSTM网络层的结构示意图。
具体实施方式
如图1所示,一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法,包括以下步骤:
步骤S1:采集变压器的油中溶解气体数据、温度数据、环境风速数据和对应的故障率,利用皮尔逊相关系数分析法,分析各状态变量与故障率的关系;主要包括CH4、C2H4、CO2、H2、C2H6、CO。
步骤S2:利用集成经验模态分解对上述变量序列进行分解,将原始变量信号中的不同尺度波动逐级分级出来,产生不同尺度的数据序列,去除噪音信号;
步骤S3:利用核主元分析筛选出影响故障率的关键因子,降低模型输入参数的维度;
步骤S4:利用CNN在高维空间提取特征集与故障率间的特征向量;
步骤S5:将特征集分为训练集和测试集,训练集输入到双向长短期记忆神经网络中进行模型训练,同时通过鱼鹰优化算法对双向长短期记忆神经网络预测模型中批处理、学习率、隐藏层层数和层神经元数4个重要参数进行自动寻优,得到最优参数组合;
步骤S6:用测试集对模型进行评估。
优选的,所述步骤S1包括以下步骤:
步骤S11:按照变压器实际运行的特点,完成相关传感器,采集模块和传输方式的选择;
步骤S12:将温度传感器、风速传感器放在变压器合适位置,同步采集温度和风速信号,从电力系统在线监测系统导出同时刻的油中溶解气体数据,采集时间间隔设置为每4分钟采集一次;
步骤S13:将传感器采集的模拟信号通过AD转换模块进行数据转变,转换成数字信号后由通讯模块按照数据包发送至计算机端;
步骤S14:计算机上的上位机通过数据解码将原始的温度和风速信号显示在人机界面当中,并能实现实时保存;
步骤S15:根据式(1),利用皮尔逊相关系数可分析得到各环境因素数据与功率数据之间的相关关系,有利于更清晰的认识影响故障率变化的关键环境因素;
式中:∣r∣≤1为各个因素之间的相关系数;xi和yi为第i个数据点的2个因素的值;和/>为2个因素的均值;n为数据点的个数;
步骤S16:根据上式的计算结果,选择相关系数比较大的变量因素作为模型的初始输入。
优选的,所述步骤S2包括以下步骤,对于EEMD的分解流程如图2:
步骤S21:给定最后的总平均次数M;
步骤S22:对一个输入变量x(t)加入一个具有标准正态分布的白噪音序列ni(t),产生一个新的信号xi(t)=x(t)+ni(t),式中ni(t)表示第i次加入白噪声序列,xi(t)表示第i次实验的附加噪声信号,i=1,2,…,M;
步骤S23:对所含噪声的信号xi(t)分别进行EMD分解,得到各自IMF和的形式:
式中,ci,j(t)为第i次加入白噪声后分解得到的第j个IMF,ri,j(t)是残余函数,代表信号的平均趋势,j是IMF的数量;
步骤S24:具体EMD分解过程如下:
对于一个加入噪音的信号序列,找到它所有的极大值点确定为上包络线,所有极小值点确定为下包络线,m(t)表示上包络线和下包络线的均值,第1个分量h1(t)=x(t)-m(t);
在第2个筛选过程中,hi(t)被视作原始数据,m1(t)是h1(t)的上下包络线的均值,如步骤S21所示确定第2个分量h2(t);
筛选过程重复n次,直到是hn(t)是一个本征模态函数或剩余分量rn(t)为一个单调函数,终止分解过程得的相应的IMF分量;
步骤S25:重复步骤S22和步骤S24进行M次,每次分解加入不同幅值的白噪声信号得到IMF的集合为:c1,j(t),c2,j(t),...,cM,j(t),j=1,2,...J;
步骤S26:利用不相关序列的统计平均值为0的原理,将上述对应的IMF进行集合平均运算,得到EEMD分解后最终的IMF,即:
式中,cj(t)是EEMD分解的第j个IMF,i=1,2,...M,j=1,2,...J。
优选的,所述步骤S3包括以下步骤:
步骤S31:首先选择一个核函数(如径向基函数RBF核、多项式核等),然后计算样本之间的核相似度;可以使用以下公式计算RBF核矩阵:
其中,是核函数的参数,‖x-z‖表示样本x和y之间的欧氏距离;
步骤S32:将核矩阵进行中心化,使得其均值为零,这一步是为了确保在高维空间中进行PCA时,得到的主成分是在原始数据中中心化后的结果;
步骤S33:为计算核矩阵的特征向量和特征值,对中心化的核矩阵进行特征值分解,得到特征向量和特征值;
步骤S34:选择降维后的维数k,对前k个最大的特征值对应的特征向量:将特征值从大到小排序,选择前k个最大的特征值对应的特征向量,构成新的数据空间;
步骤S35:将进行EEMD分解后的数据集X与所选择的k个特征向量相乘,得到降维后的数据矩阵Z。
优选的,所述步骤S4包括以下步骤,如图3所示:
步骤S41:构建CNN网络,通过给定卷积层和池化层的个数,用于提取输入序列的空间特征;给定卷积核的数目、卷积步长、卷积方式的参数设置,选择tanh函数为激活函数,用于提取更加复杂的特征;构建CNN网络,设置卷积层为2层,池化层为1层的结构,设置卷积核数目为16和32、卷积步长为2,选择same卷积方式,tanh函数为激活函数;
步骤S42:将降维后的数据矩阵输入到CNN模型中,通过卷积层和池化层进行特征提取,将其转化为更高级的特征表示;通过2次卷积层和Valid池化层进行特征提取,将其转化为一维特征向量;
步骤S43:特征集的生成,从CNN模型的输出层获取特征向量,表示数据在高维空间中的特征集;这些特征向量具有更高层次的抽象表示,能够捕捉到数据中的重要特征信息;
步骤S44:将生成的特征集进行序列化操作,将序列化后的数据集划分为训练集和测试集。通常采用随机划分的方式,确保训练集和测试集之间的数据是相互独立且具有代表性的。
优选的,所述步骤S5包括以下步骤,如图4和图5所示:
步骤S51:设置BiLSTM训练参数批处理batsize和学习率alpha取值范围,设置结构参数隐藏层层数和层神经元数num的取值范围,记参数组η={batsize,alpha,[num1,…,numn]},利用OOA对上述参数进行寻优;
步骤S52:根据鱼鹰成员在搜索空间中的位置确定问题变量的值,使用公式(5)对搜索空间使用矩阵进行建模;
随机初始化寻优空间里初始种群的位置:
xi,j=lbj+r·(ubj-lbj) (6)
其中Xi,j为个体,lbj为寻优下边界,ubj为寻优上边界,r为[0,1]之间的随机数;
因为每个鱼鹰都是问题的候选解决方案,对应于每个鱼鹰,所以可以评估目标函数。批处理batsize、学习率alpha、隐藏层层数和层神经元数num的评估值使用根据公式(7)的向量表示;
步骤S53:定位和捕鱼
OOA中种群更新的第一阶段是基于对鱼鹰这种自然行为的模拟而建模的。对鱼鹰攻击鱼类的建模会导致鱼鹰在搜索空间中的位置发生显著变化,这增加了OOA在识别最佳区域和逃离局部最优方面的探索能力。
在OOA设计中,对于每只鱼鹰,搜索空间中具有更好目标函数值的其他鱼鹰的位置被视为水下鱼类。每个鱼鹰的鱼组是用公式(8)指定的,
FPi={Xk∣k∈{1,2,…,N}∧Fk<Fi}∪{Xbest} (8)
其中FPi是第i只鱼鹰的鱼集合,Xbest是最佳鱼鹰的位置;
鱼鹰随机检测到其中一条鱼的位置并攻击它,在模拟鱼鹰向鱼移动的基础上,使用公式(9-a)、(9-b)计算相应鱼鹰的新位置;如果该新位置更优,则根据公式(10)替换鱼鹰的先前位置;
其中SF为鱼鹰选中的鱼,r为[0,1]之间的随机数,I的值为{1,2}中的一个;
步骤S54:把鱼带到合适的位置;
鱼鹰在猎杀一条鱼后,会把它带到一个合适的(对他来说安全的)位置,在那里吃。OOA中种群更新的第二阶段是基于对鱼鹰这种自然行为的模拟进行建模的。将鱼带到合适位置的建模导致鱼鹰在搜索空间中的位置发生微小变化,这导致OOA在局部搜索中的利用能力增加,并在发现的解决方案附近收敛到更好的解决方案;
在OOA的设计中,为了模拟鱼鹰的这种自然行为,首先,对于种群中的每个成员,使用公式(11-a)、(11-b)计算一个新的随机位置作为“适合吃鱼的位置”;然后,如果目标函数的值在这个新位置上得到改善,则它根据公式(12)替换相应鱼鹰的先前位置;
其中t为迭代次数,T为最大迭代次数;
步骤S55:得到最有超参组合。
优选的,所述步骤S6包括以下步骤:
步骤S61:选取误差最大百分比yE-max、平均绝对百分比误差yMAPE、预测精度平均值yMAPE作为模型评估指标,其数学表达式如下:
步骤S62:将测试集输入模型进行状态评估。
本发明首先采集变压器的运行状态变量和外部环境因素,结合皮尔逊相关系数分析各环境和运行变量与故障率之间的相关系数,找出其中关联度更大的几个因素作为主要的输入;然后采用集成经验模态分解对上述变量序列进行逐级分解,产生不同尺度的数据序列,去除其中的噪音信号;再利用核主元分析筛选出影响故障率的关键因子进行降维,减少输入变量的维度,然后,利用卷积神经网络在高维空间提取特征集与故障率间的特征向量,将结果输入到双向长短期记忆神经网络进行训练,从而预测变压器故障率的发展趋势。
上述的实施例仅为本发明的优选技术方案,而不应视为对于本发明的限制,本发明的保护范围应以权利要求记载的技术方案,包括权利要求记载的技术方案中技术特征的等同替换方案为保护范围。即在此范围内的等同替换改进,也在本发明的保护范围之内。

Claims (7)

1.一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法,其特征在于,包括以下步骤:
步骤S1:采集变压器的油中溶解气体数据、温度数据、环境风速数据和对应的故障率,利用皮尔逊相关系数分析法,分析各状态变量与故障率的关系;
步骤S2:利用集成经验模态分解对上述变量序列进行分解,将原始变量信号中的不同尺度波动逐级分级出来,产生不同尺度的数据序列,去除噪音信号;
步骤S3:利用核主元分析筛选出影响故障率的关键因子,降低模型输入参数的维度;
步骤S4:利用CNN在高维空间提取特征集与故障率间的特征向量;
步骤S5:将特征集分为训练集和测试集,训练集输入到双向长短期记忆神经网络中进行模型训练,同时通过鱼鹰优化算法对双向长短期记忆神经网络预测模型中批处理、学习率、隐藏层层数和层神经元数4个重要参数进行自动寻优,得到最优参数组合;
步骤S6:用测试集对模型进行评估。
2.根据权利要求1所述一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法,其特征在于,所述步骤S1包括以下步骤:
步骤S11:按照变压器实际运行的特点,完成相关传感器,采集模块和传输方式的选择;
步骤S12:将温度传感器、风速传感器放在变压器合适位置,同步采集温度和风速信号,从电力系统在线监测系统导出同时刻的油中溶解气体数据;
步骤S13:将传感器采集的模拟信号通过AD转换模块进行数据转变,转换成数字信号后由通讯模块按照数据包发送至计算机端;
步骤S14:计算机上的上位机通过数据解码将原始的温度和风速信号显示在人机界面当中,并能实现实时保存;
步骤S15:根据式(1),利用皮尔逊相关系数可分析得到各环境因素数据与功率数据之间的相关关系,有利于更清晰的认识影响故障率变化的关键环境因素;
式中:∣r∣≤1为各个因素之间的相关系数;xi和yi为第i个数据点的2个因素的值;和/>为2个因素的均值;n为数据点的个数;
步骤S16:根据上式的计算结果,选择相关系数比较大的变量因素作为模型的初始输入。
3.根据权利要求1所述一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法,其特征在于,所述步骤S2包括以下步骤:
步骤S21:给定最后的总平均次数M;
步骤S22:对一个输入变量x(t)加入一个具有标准正态分布的白噪音序列ni(t),产生一个新的信号xi(t)=x(t)+ni(t),式中ni(t)表示第i次加入白噪声序列,xi(t)表示第i次实验的附加噪声信号,i=1,2,…,M;
步骤S23:对所含噪声的信号xi(t)分别进行EMD分解,得到各自IMF和的形式:
式中,ci,j(t)为第i次加入白噪声后分解得到的第j个IMF,ri,j(t)是残余函数,代表信号的平均趋势,j是IMF的数量;
步骤S24:具体EMD分解过程如下:
对于一个加入噪音的信号序列,找到它所有的极大值点确定为上包络线,所有极小值点确定为下包络线,m(t)表示上包络线和下包络线的均值,第1个分量h1(t)=x(t)-m(t);
在第2个筛选过程中,h1(t)被视作原始数据,m1(t)是h1(t)的上下包络线的均值,如步骤S21所示确定第2个分量h2(t);
筛选过程重复n次,直到是hn(t)是一个本征模态函数或剩余分量rn(t)为一个单调函数,终止分解过程得的相应的IMF分量;
步骤S25:重复步骤S22和步骤S24进行M次,每次分解加入不同幅值的白噪声信号得到IMF的集合为:c1,j(t),c2,j(t),...,cM,j(t),j=1,2,...J;
步骤S26:利用不相关序列的统计平均值为0的原理,将上述对应的IMF进行集合平均运算,得到EEMD分解后最终的IMF,即:
式中,cj(t)是EEMD分解的第j个IMF,i=1,2,...M,j=1,2,...J。
4.根据权利要求1所述一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法,其特征在于,所述步骤S3包括以下步骤:
步骤S31:首先选择一个核函数,然后计算样本之间的核相似度;可以使用以下公式计算RBF核矩阵:
其中,是核函数的参数,||x-z||表示样本x和y之间的欧氏距离;
步骤S32:将核矩阵进行中心化,使得其均值为零;
步骤S33:为计算核矩阵的特征向量和特征值,对中心化的核矩阵进行特征值分解,得到特征向量和特征值;
步骤S34:选择降维后的维数k,对前k个最大的特征值对应的特征向量:将特征值从大到小排序,选择前k个最大的特征值对应的特征向量,构成新的数据空间;
步骤S35:将进行EEMD分解后的数据集X与所选择的k个特征向量相乘,得到降维后的数据矩阵Z。
5.根据权利要求1所述一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法,其特征在于,所述步骤S4包括以下步骤:
步骤S41:构建CNN网络,通过给定卷积层和池化层的个数,用于提取输入序列的空间特征;给定卷积核的数目、卷积步长、卷积方式的参数设置,选择tanh函数为激活函数,用于提取更加复杂的特征;
步骤S42:将降维后的数据矩阵输入到CNN模型中,通过卷积层和池化层进行特征提取,将其转化为更高级的特征表示;
步骤S43:特征集的生成,从CNN模型的输出层获取特征向量,表示数据在高维空间中的特征集;
步骤S44:将生成的特征集进行序列化操作,将序列化后的数据集划分为训练集和测试集。
6.根据权利要求1所述一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法,其特征在于,所述步骤S5包括以下步骤:
步骤S51:设置BiLSTM训练参数批处理batsize和学习率alpha取值范围,设置结构参数隐藏层层数和层神经元数num的取值范围,记参数组η={batsize,alpha,[num1,…,numn]},利用OOA对上述参数进行寻优;
步骤S52:根据鱼鹰成员在搜索空间中的位置确定问题变量的值,使用公式(5)对搜索空间使用矩阵进行建模;
随机初始化寻优空间里初始种群的位置:
xi,j=lbj+r·(ubj-lbj) (6)
其中Xi,j为个体,lbj为寻优下边界,ubj为寻优上边界,r为[0,1]之间的随机数;
批处理batsize、学习率alpha、隐藏层层数和层神经元数num的评估值使用根据公式(7)的向量表示;
步骤S53:定位和捕鱼
每个鱼鹰的鱼组是用公式(8)指定的,
FPi={Xk∣k∈{1,2,…,N}∧Fk<Fi}∪{Xbest} (8)
其中FPi是第i只鱼鹰的鱼集合,Xbest是最佳鱼鹰的位置;
鱼鹰随机检测到其中一条鱼的位置并攻击它,在模拟鱼鹰向鱼移动的基础上,使用公式(9-a)、(9-b)计算相应鱼鹰的新位置;如果该新位置更优,则根据公式(10)替换鱼鹰的先前位置;
其中SF为鱼鹰选中的鱼,r为[0,1]之间的随机数,I的值为{1,2}中的一个;
步骤S54:把鱼带到合适的位置;
在OOA的设计中,为了模拟鱼鹰的这种自然行为,首先,对于种群中的每个成员,使用公式(11-a)、(11-b)计算一个新的随机位置作为“适合吃鱼的位置”;然后,如果目标函数的值在这个新位置上得到改善,则它根据公式(12)替换相应鱼鹰的先前位置;
其中t为迭代次数,T为最大迭代次数;
步骤S55:得到最有超参组合。
7.根据权利要求1所述一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法,其特征在于,所述步骤S6包括以下步骤:
步骤S61:选取误差最大百分比yE-max、平均绝对百分比误差yMAPE、预测精度平均值yMAPE作为模型评估指标,其数学表达式如下:
步骤S62:将测试集输入模型进行状态评估。
CN202311263510.3A 2023-09-27 2023-09-27 一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法 Pending CN117520809A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311263510.3A CN117520809A (zh) 2023-09-27 2023-09-27 一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311263510.3A CN117520809A (zh) 2023-09-27 2023-09-27 一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法

Publications (1)

Publication Number Publication Date
CN117520809A true CN117520809A (zh) 2024-02-06

Family

ID=89744587

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311263510.3A Pending CN117520809A (zh) 2023-09-27 2023-09-27 一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法

Country Status (1)

Country Link
CN (1) CN117520809A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117910550A (zh) * 2024-03-19 2024-04-19 江苏海拓宾未来工业科技集团有限公司 一种基于深度学习的无油超高速离心压缩机自动优化系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117910550A (zh) * 2024-03-19 2024-04-19 江苏海拓宾未来工业科技集团有限公司 一种基于深度学习的无油超高速离心压缩机自动优化系统

Similar Documents

Publication Publication Date Title
Bommidi et al. Hybrid wind speed forecasting using ICEEMDAN and transformer model with novel loss function
CN114970952B (zh) 一种考虑环境因素的光伏出力短期预测方法及系统
CN111784061B (zh) 一种电网工程造价预测模型的训练方法、装置和设备
CN110070102B (zh) 用于电能质量扰动类型识别的序列对序列模型建立方法
CN112507479B (zh) 一种基于流形学习和softmax的石油钻机健康状态评估方法
CN113688869B (zh) 一种基于生成对抗网络的光伏数据缺失重构方法
CN117520809A (zh) 一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法
CN116128141B (zh) 风暴潮预测方法、装置、存储介质及电子设备
CN110991737A (zh) 一种基于深度置信网络的超短期风电功率预测方法
CN111222689A (zh) 基于多尺度时间特征的lstm负荷预测方法、介质及电子装置
CN116960978A (zh) 基于风速-功率组合分解重构的海上风电功率预测方法
CN114676814A (zh) 一种基于satcn-lstm的风功率超短期预测方法
CN116842337A (zh) 基于LightGBM优选特征与COA-CNN模型的变压器故障诊断方法
CN115409369A (zh) 基于机理和数据混合驱动的综合能源系统可靠性评估方法
CN116050621A (zh) 一种集成提升模式的多头自注意力海上风电超短时功率预测方法
CN117371207A (zh) 一种特高压换流阀状态评价方法、介质及系统
CN110110784B (zh) 一种基于变压器相关运行数据的变压器故障辨识方法
CN117151770A (zh) 一种基于注意力机制的lstm碳价预测方法和系统
CN116561569A (zh) 一种基于EO特征选择结合AdaBoost算法的工业电力负荷辨识方法
CN114580472B (zh) 工业互联网中因果与注意力并重的大型设备故障预测方法
CN116384048A (zh) 一种风力发电机组轴承寿命预测的方法
CN114298413A (zh) 一种水电机组振摆趋势预测方法
CN114897204A (zh) 一种海上风电场短期风速预测方法和装置
CN113935413A (zh) 一种基于卷积神经网的配网录波文件波形识别方法
CN113887571A (zh) 改进svr算法的电子设备故障预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination