CN117520809A - 一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法 - Google Patents
一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法 Download PDFInfo
- Publication number
- CN117520809A CN117520809A CN202311263510.3A CN202311263510A CN117520809A CN 117520809 A CN117520809 A CN 117520809A CN 202311263510 A CN202311263510 A CN 202311263510A CN 117520809 A CN117520809 A CN 117520809A
- Authority
- CN
- China
- Prior art keywords
- data
- cnn
- transformer
- eemd
- hawk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000003745 diagnosis Methods 0.000 title claims abstract description 17
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 27
- 239000013598 vector Substances 0.000 claims abstract description 23
- 238000012216 screening Methods 0.000 claims abstract description 10
- 238000000513 principal component analysis Methods 0.000 claims abstract description 6
- 238000004458 analytical method Methods 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 29
- 241000251468 Actinopterygii Species 0.000 claims description 28
- 239000011159 matrix material Substances 0.000 claims description 23
- 238000013527 convolutional neural network Methods 0.000 claims description 19
- 238000012549 training Methods 0.000 claims description 19
- 238000012360 testing method Methods 0.000 claims description 14
- 238000013528 artificial neural network Methods 0.000 claims description 11
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 9
- 238000011156 evaluation Methods 0.000 claims description 9
- 210000002569 neuron Anatomy 0.000 claims description 9
- 238000011176 pooling Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 9
- 230000015654 memory Effects 0.000 claims description 8
- 238000012544 monitoring process Methods 0.000 claims description 8
- 230000009467 reduction Effects 0.000 claims description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 7
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 claims description 6
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 230000007613 environmental effect Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 230000006399 behavior Effects 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 4
- 238000013461 design Methods 0.000 claims description 4
- 238000002474 experimental method Methods 0.000 claims description 4
- 241000208340 Araliaceae Species 0.000 claims description 3
- 241000272475 Haliaeetus Species 0.000 claims description 3
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims description 3
- 235000003140 Panax quinquefolius Nutrition 0.000 claims description 3
- 241000566150 Pandion haliaetus Species 0.000 claims description 3
- 239000000654 additive Substances 0.000 claims description 3
- 230000000996 additive effect Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 claims description 3
- 235000008434 ginseng Nutrition 0.000 claims description 3
- 238000013135 deep learning Methods 0.000 description 4
- 238000007689 inspection Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 241000272184 Falconiformes Species 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0985—Hyperparameter optimisation; Meta-learning; Learning-to-learn
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
- G06F2218/04—Denoising
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Abstract
一种基于EEMD‑KPCA‑CNN‑BiLSTM的变压器故障诊断方法,包括以下步骤:步骤S1:采集变压器的油中溶解气体数据、温度数据、环境风速数据和对应的故障率,利用皮尔逊相关系数分析法,分析各状态变量与故障率的关系;步骤S2:利用集成经验模态分解对上述变量序列进行分解,将原始变量信号中的不同尺度波动逐级分级出来,产生不同尺度的数据序列,去除噪音信号;步骤S3:利用核主元分析筛选出影响故障率的关键因子,降低模型输入参数的维度;步骤S4:利用CNN在高维空间提取特征集与故障率间的特征向量。本发明提出了一种基于EEMD‑KPCA‑CNN‑BiLSTM的变压器故障预测方法,能够挖掘变压器运行状态参量和外部环境对变压器运行状态的影响,提高电网的可靠性和可用性。
Description
技术领域
本发明涉及电气设备检修技术领域,特别是一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法
背景技术
变压器是电力系统中的重要设备,负责将电能进行传输和分配。然而,由于运行环境、负载变化和设备老化等原因,变压器可能会发生故障,导致电网的不稳定和电力供应的中断。因此,及时预测故障发生,确保变压器安全可靠运行十分重要。
传统的变压器故障检测方法主要基于周期性维护和人工巡检,这种方法存在以下不足:1.主观性:人工巡检容易受到人员经验和主观判断的影响,存在误判和漏判的风险。2.高成本:周期性维护和人工巡检需要大量的人力和物力资源,成本较高。
为了提高变压器故障预测的准确性和效率,研究者们开始应用机器学习和深度学习技术,如神经网络、支持向量机和随机森林等,来构建自动化的故障预测模型。这些模型可以利用变压器的历史运行数据和监测数据,通过学习数据中的模式和特征,来预测变压器未来可能发生的故障。
近年来,随着深度学习技术的快速发展,基于深度学习的变压器故障预测方法得到了广泛关注。深度学习模型如卷积神经网络(CNN)、循环神经网络(RNN)和长短期记忆网络(LSTM)等,可以从变压器的大量数据中学习和提取特征,实现更准确的故障预测。因此,基于机器学习和深度学习的变压器故障预测模型正在逐渐取代传统的人工巡检方法,为电力系统的稳定运行提供了可靠的支持。这些模型的研究和应用有助于提前发现和预防变压器故障,减少停电事故的发生,提高电网的可靠性和可用性。
发明内容
本发明提出了一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障预测方法,能够挖掘变压器运行状态参量和外部环境对变压器运行状态的影响,提高电网的可靠性和可用性。
为解决上述技术问题,本发明所采用的技术方案是:一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法,包括以下步骤:
步骤S1:采集变压器的油中溶解气体数据、温度数据、环境风速数据和对应的故障率,利用皮尔逊相关系数分析法,分析各状态变量与故障率的关系;
步骤S2:利用集成经验模态分解对上述变量序列进行分解,将原始变量信号中的不同尺度波动逐级分级出来,产生不同尺度的数据序列,去除噪音信号;
步骤S3:利用核主元分析筛选出影响故障率的关键因子,降低模型输入参数的维度;
步骤S4:利用CNN在高维空间提取特征集与故障率间的特征向量;
步骤S5:将特征集分为训练集和测试集,训练集输入到双向长短期记忆神经网络中进行模型训练,同时通过鱼鹰优化算法对双向长短期记忆神经网络预测模型中批处理、学习率、隐藏层层数和层神经元数4个重要参数进行自动寻优,得到最优参数组合;
步骤S6:用测试集对模型进行评估。
优选的,所述步骤S1包括以下步骤:
步骤S11:按照变压器实际运行的特点,完成相关传感器,采集模块和传输方式的选择;
步骤S12:将温度传感器、风速传感器放在变压器合适位置,同步采集温度和风速信号,从电力系统在线监测系统导出同时刻的油中溶解气体数据;
步骤S13:将传感器采集的模拟信号通过AD转换模块进行数据转变,转换成数字信号后由通讯模块按照数据包发送至计算机端;
步骤S14:计算机上的上位机通过数据解码将原始的温度和风速信号显示在人机界面当中,并能实现实时保存;
步骤S15:根据式(1),利用皮尔逊相关系数可分析得到各环境因素数据与功率数据之间的相关关系,有利于更清晰的认识影响故障率变化的关键环境因素;
式中:∣r∣≤1为各个因素之间的相关系数;xi和yi为第i个数据点的2个因素的值;和/>为2个因素的均值;n为数据点的个数;
步骤S16:根据上式的计算结果,选择相关系数比较大的变量因素作为模型的初始输入。
优选的,所述步骤S2包括以下步骤:
步骤S21:给定最后的总平均次数M;
步骤S22:对一个输入变量x(t)加入一个具有标准正态分布的白噪音序列ni(t),产生一个新的信号xi(t)=x(t)+ni(t),式中ni(t)表示第i次加入白噪声序列,xi(t)表示第i次实验的附加噪声信号,i=1,2,…,M;
步骤S23:对所含噪声的信号xi(t)分别进行EMD分解,得到各自IMF和的形式:
式中,ci,j(t)为第i次加入白噪声后分解得到的第j个IMF,ri,j(t)是残余函数,代表信号的平均趋势,j是IMF的数量;
步骤S24:具体EMD分解过程如下:
对于一个加入噪音的信号序列,找到它所有的极大值点确定为上包络线,所有极小值点确定为下包络线,m(t)表示上包络线和下包络线的均值,第1个分量h1(t)=x(t)-m(t);
在第2个筛选过程中,h1(t)被视作原始数据,m1(t)是h1(t)的上下包络线的均值,如步骤S21所示确定第2个分量h2(t);
筛选过程重复n次,直到是hn(t)是一个本征模态函数或剩余分量rn(t)为一个单调函数,终止分解过程得的相应的IMF分量;
步骤S25:重复步骤S22和步骤S24进行M次,每次分解加入不同幅值的白噪声信号得到IMF的集合为:c1,j(t),c2,j(t),...,cM,j(t),j=1,2,...J;
步骤S26:利用不相关序列的统计平均值为0的原理,将上述对应的IMF进行集合平均运算,得到EEMD分解后最终的IMF,即:
式中,cj(t)是EEMD分解的第j个IMF,i=1,2,...M,j=1,2,...J。
优选的,所述步骤S3包括以下步骤:
步骤S31:首先选择一个核函数,然后计算样本之间的核相似度;可以使用以下公式计算RBF核矩阵:
其中,是核函数的参数,‖x-z‖表示样本x和y之间的欧氏距离;
步骤S32:将核矩阵进行中心化,使得其均值为零;
步骤S33:为计算核矩阵的特征向量和特征值,对中心化的核矩阵进行特征值分解,得到特征向量和特征值;
步骤S34:选择降维后的维数k,对前k个最大的特征值对应的特征向量:将特征值从大到小排序,选择前k个最大的特征值对应的特征向量,构成新的数据空间;
步骤S35:将进行EEMD分解后的数据集X与所选择的k个特征向量相乘,得到降维后的数据矩阵Z。
优选的,所述步骤S4包括以下步骤:
步骤S41:构建CNN网络,通过给定卷积层和池化层的个数,用于提取输入序列的空间特征;给定卷积核的数目、卷积步长、卷积方式的参数设置,选择tanh函数为激活函数,用于提取更加复杂的特征;
步骤S42:将降维后的数据矩阵输入到CNN模型中,通过卷积层和池化层进行特征提取,将其转化为更高级的特征表示;
步骤S43:特征集的生成,从CNN模型的输出层获取特征向量,表示数据在高维空间中的特征集;
步骤S44:将生成的特征集进行序列化操作,将序列化后的数据集划分为训练集和测试集。
优选的,所述步骤S5包括以下步骤:
步骤S51:设置BiLSTM训练参数批处理batsize和学习率alpha取值范围,设置结构参数隐藏层层数和层神经元数num的取值范围,记参数组η={batsize,alpha,[num1,…,numn]},利用OOA对上述参数进行寻优;
步骤S52:根据鱼鹰成员在搜索空间中的位置确定问题变量的值,使用公式(5)对搜索空间使用矩阵进行建模;
随机初始化寻优空间里初始种群的位置:
xi,j=lbj+r·(ubj-lbj) (6)
其中Xi,j为个体,lbj为寻优下边界,ubj为寻优上边界,r为[0,1]之间的随机数;
批处理batsize、学习率alpha、隐藏层层数和层神经元数num的评估值使用根据公式(7)的向量表示;
步骤S53:定位和捕鱼
每个鱼鹰的鱼组是用公式(8)指定的,
FPi={Xk∣k∈{1,2,…,N}∧Fk<Fi}∪{Xbest} (8)
其中FPi是第i只鱼鹰的鱼集合,Xbest是最佳鱼鹰的位置;
鱼鹰随机检测到其中一条鱼的位置并攻击它,在模拟鱼鹰向鱼移动的基础上,使用公式(9-a)、(9-b)计算相应鱼鹰的新位置;如果该新位置更优,则根据公式(10)替换鱼鹰的先前位置;
其中SF为鱼鹰选中的鱼,r为[0,1]之间的随机数,I的值为{1,2}中的一个;
步骤S54:把鱼带到合适的位置;
在OOA的设计中,为了模拟鱼鹰的这种自然行为,首先,对于种群中的每个成员,使用公式(11-a)、(11-b)计算一个新的随机位置作为“适合吃鱼的位置”;然后,如果目标函数的值在这个新位置上得到改善,则它根据公式(12)替换相应鱼鹰的先前位置;
其中t为迭代次数,T为最大迭代次数;
步骤S55:得到最有超参组合。
优选的,所述步骤S6包括以下步骤:
步骤S61:选取误差最大百分比yE-max、平均绝对百分比误差yMAPE、预测精度平均值yMAPE作为模型评估指标,其数学表达式如下:
步骤S62:将测试集输入模型进行状态评估。
本发明提供一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法,首先采集变压器的运行状态变量和外部环境因素,结合皮尔逊相关系数分析各环境和运行变量与故障率之间的相关系数,找出其中关联度更大的几个因素作为主要的输入;然后采用集成经验模态分解对上述变量序列进行逐级分解,产生不同尺度的数据序列,去除其中的噪音信号;再利用核主元分析筛选出影响故障率的关键因子进行降维,减少输入变量的维度,然后利用CNN在高维空间提取多维特征向量,将结果输入到到双向长短期记忆神经网络中进行模型训练,同时通过鱼鹰优化算法对双向长短期记忆神经网络预测模型进行超参寻优,最后使用测试集对模型进行评估,该模型能够反应变压器的状态,在工程实验中具有很高的价值。
本方法不仅考虑了变压器内部状态监测数据(溶解气体、温度),还加入了外部环境监测数据(风速),实现了异构数据的有效融合,构建更全面的诊断模型。
去噪预处理,使用EEMD算法可以移除原始监测数据中的噪声成分,有利于后续特征提取和模型训练。相比直接使用原始数据,可获得更准确的诊断结果。
降维提取关键特征,应用KPCA方法可以从高维监测数据中提取最重要的低维特征,既降低了输入维数,又保留了最关键的信息,提升了模型效果。
深度特征学习,CNN可以学习数据的深层非线性特征表示,而传统方法无法实现。这可以捕捉数据中的潜在规律,使诊断更准确。
时间相关性建模,BiLSTM结构考虑了时间序列数据的长期依赖性,相比只看当前时刻的方法,可以实现动态变化趋势的建模。
超参数自动优化,OOA算法实现了模型超参数的自动优化,无需人工经验调节,使得模型性能得到最大化。
附图说明
下面结合附图和实施例对本发明作进一步说明:
图1为本发明的结构示意图;
图2为本发明的EEMD分解流程图;
图3为本发明的CNN卷积层的多池化操作流程示意图;
图4为本发明的OOA算法流程图;
图5为本发明的BiLSTM网络层的结构示意图。
具体实施方式
如图1所示,一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法,包括以下步骤:
步骤S1:采集变压器的油中溶解气体数据、温度数据、环境风速数据和对应的故障率,利用皮尔逊相关系数分析法,分析各状态变量与故障率的关系;主要包括CH4、C2H4、CO2、H2、C2H6、CO。
步骤S2:利用集成经验模态分解对上述变量序列进行分解,将原始变量信号中的不同尺度波动逐级分级出来,产生不同尺度的数据序列,去除噪音信号;
步骤S3:利用核主元分析筛选出影响故障率的关键因子,降低模型输入参数的维度;
步骤S4:利用CNN在高维空间提取特征集与故障率间的特征向量;
步骤S5:将特征集分为训练集和测试集,训练集输入到双向长短期记忆神经网络中进行模型训练,同时通过鱼鹰优化算法对双向长短期记忆神经网络预测模型中批处理、学习率、隐藏层层数和层神经元数4个重要参数进行自动寻优,得到最优参数组合;
步骤S6:用测试集对模型进行评估。
优选的,所述步骤S1包括以下步骤:
步骤S11:按照变压器实际运行的特点,完成相关传感器,采集模块和传输方式的选择;
步骤S12:将温度传感器、风速传感器放在变压器合适位置,同步采集温度和风速信号,从电力系统在线监测系统导出同时刻的油中溶解气体数据,采集时间间隔设置为每4分钟采集一次;
步骤S13:将传感器采集的模拟信号通过AD转换模块进行数据转变,转换成数字信号后由通讯模块按照数据包发送至计算机端;
步骤S14:计算机上的上位机通过数据解码将原始的温度和风速信号显示在人机界面当中,并能实现实时保存;
步骤S15:根据式(1),利用皮尔逊相关系数可分析得到各环境因素数据与功率数据之间的相关关系,有利于更清晰的认识影响故障率变化的关键环境因素;
式中:∣r∣≤1为各个因素之间的相关系数;xi和yi为第i个数据点的2个因素的值;和/>为2个因素的均值;n为数据点的个数;
步骤S16:根据上式的计算结果,选择相关系数比较大的变量因素作为模型的初始输入。
优选的,所述步骤S2包括以下步骤,对于EEMD的分解流程如图2:
步骤S21:给定最后的总平均次数M;
步骤S22:对一个输入变量x(t)加入一个具有标准正态分布的白噪音序列ni(t),产生一个新的信号xi(t)=x(t)+ni(t),式中ni(t)表示第i次加入白噪声序列,xi(t)表示第i次实验的附加噪声信号,i=1,2,…,M;
步骤S23:对所含噪声的信号xi(t)分别进行EMD分解,得到各自IMF和的形式:
式中,ci,j(t)为第i次加入白噪声后分解得到的第j个IMF,ri,j(t)是残余函数,代表信号的平均趋势,j是IMF的数量;
步骤S24:具体EMD分解过程如下:
对于一个加入噪音的信号序列,找到它所有的极大值点确定为上包络线,所有极小值点确定为下包络线,m(t)表示上包络线和下包络线的均值,第1个分量h1(t)=x(t)-m(t);
在第2个筛选过程中,hi(t)被视作原始数据,m1(t)是h1(t)的上下包络线的均值,如步骤S21所示确定第2个分量h2(t);
筛选过程重复n次,直到是hn(t)是一个本征模态函数或剩余分量rn(t)为一个单调函数,终止分解过程得的相应的IMF分量;
步骤S25:重复步骤S22和步骤S24进行M次,每次分解加入不同幅值的白噪声信号得到IMF的集合为:c1,j(t),c2,j(t),...,cM,j(t),j=1,2,...J;
步骤S26:利用不相关序列的统计平均值为0的原理,将上述对应的IMF进行集合平均运算,得到EEMD分解后最终的IMF,即:
式中,cj(t)是EEMD分解的第j个IMF,i=1,2,...M,j=1,2,...J。
优选的,所述步骤S3包括以下步骤:
步骤S31:首先选择一个核函数(如径向基函数RBF核、多项式核等),然后计算样本之间的核相似度;可以使用以下公式计算RBF核矩阵:
其中,是核函数的参数,‖x-z‖表示样本x和y之间的欧氏距离;
步骤S32:将核矩阵进行中心化,使得其均值为零,这一步是为了确保在高维空间中进行PCA时,得到的主成分是在原始数据中中心化后的结果;
步骤S33:为计算核矩阵的特征向量和特征值,对中心化的核矩阵进行特征值分解,得到特征向量和特征值;
步骤S34:选择降维后的维数k,对前k个最大的特征值对应的特征向量:将特征值从大到小排序,选择前k个最大的特征值对应的特征向量,构成新的数据空间;
步骤S35:将进行EEMD分解后的数据集X与所选择的k个特征向量相乘,得到降维后的数据矩阵Z。
优选的,所述步骤S4包括以下步骤,如图3所示:
步骤S41:构建CNN网络,通过给定卷积层和池化层的个数,用于提取输入序列的空间特征;给定卷积核的数目、卷积步长、卷积方式的参数设置,选择tanh函数为激活函数,用于提取更加复杂的特征;构建CNN网络,设置卷积层为2层,池化层为1层的结构,设置卷积核数目为16和32、卷积步长为2,选择same卷积方式,tanh函数为激活函数;
步骤S42:将降维后的数据矩阵输入到CNN模型中,通过卷积层和池化层进行特征提取,将其转化为更高级的特征表示;通过2次卷积层和Valid池化层进行特征提取,将其转化为一维特征向量;
步骤S43:特征集的生成,从CNN模型的输出层获取特征向量,表示数据在高维空间中的特征集;这些特征向量具有更高层次的抽象表示,能够捕捉到数据中的重要特征信息;
步骤S44:将生成的特征集进行序列化操作,将序列化后的数据集划分为训练集和测试集。通常采用随机划分的方式,确保训练集和测试集之间的数据是相互独立且具有代表性的。
优选的,所述步骤S5包括以下步骤,如图4和图5所示:
步骤S51:设置BiLSTM训练参数批处理batsize和学习率alpha取值范围,设置结构参数隐藏层层数和层神经元数num的取值范围,记参数组η={batsize,alpha,[num1,…,numn]},利用OOA对上述参数进行寻优;
步骤S52:根据鱼鹰成员在搜索空间中的位置确定问题变量的值,使用公式(5)对搜索空间使用矩阵进行建模;
随机初始化寻优空间里初始种群的位置:
xi,j=lbj+r·(ubj-lbj) (6)
其中Xi,j为个体,lbj为寻优下边界,ubj为寻优上边界,r为[0,1]之间的随机数;
因为每个鱼鹰都是问题的候选解决方案,对应于每个鱼鹰,所以可以评估目标函数。批处理batsize、学习率alpha、隐藏层层数和层神经元数num的评估值使用根据公式(7)的向量表示;
步骤S53:定位和捕鱼
OOA中种群更新的第一阶段是基于对鱼鹰这种自然行为的模拟而建模的。对鱼鹰攻击鱼类的建模会导致鱼鹰在搜索空间中的位置发生显著变化,这增加了OOA在识别最佳区域和逃离局部最优方面的探索能力。
在OOA设计中,对于每只鱼鹰,搜索空间中具有更好目标函数值的其他鱼鹰的位置被视为水下鱼类。每个鱼鹰的鱼组是用公式(8)指定的,
FPi={Xk∣k∈{1,2,…,N}∧Fk<Fi}∪{Xbest} (8)
其中FPi是第i只鱼鹰的鱼集合,Xbest是最佳鱼鹰的位置;
鱼鹰随机检测到其中一条鱼的位置并攻击它,在模拟鱼鹰向鱼移动的基础上,使用公式(9-a)、(9-b)计算相应鱼鹰的新位置;如果该新位置更优,则根据公式(10)替换鱼鹰的先前位置;
其中SF为鱼鹰选中的鱼,r为[0,1]之间的随机数,I的值为{1,2}中的一个;
步骤S54:把鱼带到合适的位置;
鱼鹰在猎杀一条鱼后,会把它带到一个合适的(对他来说安全的)位置,在那里吃。OOA中种群更新的第二阶段是基于对鱼鹰这种自然行为的模拟进行建模的。将鱼带到合适位置的建模导致鱼鹰在搜索空间中的位置发生微小变化,这导致OOA在局部搜索中的利用能力增加,并在发现的解决方案附近收敛到更好的解决方案;
在OOA的设计中,为了模拟鱼鹰的这种自然行为,首先,对于种群中的每个成员,使用公式(11-a)、(11-b)计算一个新的随机位置作为“适合吃鱼的位置”;然后,如果目标函数的值在这个新位置上得到改善,则它根据公式(12)替换相应鱼鹰的先前位置;
其中t为迭代次数,T为最大迭代次数;
步骤S55:得到最有超参组合。
优选的,所述步骤S6包括以下步骤:
步骤S61:选取误差最大百分比yE-max、平均绝对百分比误差yMAPE、预测精度平均值yMAPE作为模型评估指标,其数学表达式如下:
步骤S62:将测试集输入模型进行状态评估。
本发明首先采集变压器的运行状态变量和外部环境因素,结合皮尔逊相关系数分析各环境和运行变量与故障率之间的相关系数,找出其中关联度更大的几个因素作为主要的输入;然后采用集成经验模态分解对上述变量序列进行逐级分解,产生不同尺度的数据序列,去除其中的噪音信号;再利用核主元分析筛选出影响故障率的关键因子进行降维,减少输入变量的维度,然后,利用卷积神经网络在高维空间提取特征集与故障率间的特征向量,将结果输入到双向长短期记忆神经网络进行训练,从而预测变压器故障率的发展趋势。
上述的实施例仅为本发明的优选技术方案,而不应视为对于本发明的限制,本发明的保护范围应以权利要求记载的技术方案,包括权利要求记载的技术方案中技术特征的等同替换方案为保护范围。即在此范围内的等同替换改进,也在本发明的保护范围之内。
Claims (7)
1.一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法,其特征在于,包括以下步骤:
步骤S1:采集变压器的油中溶解气体数据、温度数据、环境风速数据和对应的故障率,利用皮尔逊相关系数分析法,分析各状态变量与故障率的关系;
步骤S2:利用集成经验模态分解对上述变量序列进行分解,将原始变量信号中的不同尺度波动逐级分级出来,产生不同尺度的数据序列,去除噪音信号;
步骤S3:利用核主元分析筛选出影响故障率的关键因子,降低模型输入参数的维度;
步骤S4:利用CNN在高维空间提取特征集与故障率间的特征向量;
步骤S5:将特征集分为训练集和测试集,训练集输入到双向长短期记忆神经网络中进行模型训练,同时通过鱼鹰优化算法对双向长短期记忆神经网络预测模型中批处理、学习率、隐藏层层数和层神经元数4个重要参数进行自动寻优,得到最优参数组合;
步骤S6:用测试集对模型进行评估。
2.根据权利要求1所述一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法,其特征在于,所述步骤S1包括以下步骤:
步骤S11:按照变压器实际运行的特点,完成相关传感器,采集模块和传输方式的选择;
步骤S12:将温度传感器、风速传感器放在变压器合适位置,同步采集温度和风速信号,从电力系统在线监测系统导出同时刻的油中溶解气体数据;
步骤S13:将传感器采集的模拟信号通过AD转换模块进行数据转变,转换成数字信号后由通讯模块按照数据包发送至计算机端;
步骤S14:计算机上的上位机通过数据解码将原始的温度和风速信号显示在人机界面当中,并能实现实时保存;
步骤S15:根据式(1),利用皮尔逊相关系数可分析得到各环境因素数据与功率数据之间的相关关系,有利于更清晰的认识影响故障率变化的关键环境因素;
式中:∣r∣≤1为各个因素之间的相关系数;xi和yi为第i个数据点的2个因素的值;和/>为2个因素的均值;n为数据点的个数;
步骤S16:根据上式的计算结果,选择相关系数比较大的变量因素作为模型的初始输入。
3.根据权利要求1所述一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法,其特征在于,所述步骤S2包括以下步骤:
步骤S21:给定最后的总平均次数M;
步骤S22:对一个输入变量x(t)加入一个具有标准正态分布的白噪音序列ni(t),产生一个新的信号xi(t)=x(t)+ni(t),式中ni(t)表示第i次加入白噪声序列,xi(t)表示第i次实验的附加噪声信号,i=1,2,…,M;
步骤S23:对所含噪声的信号xi(t)分别进行EMD分解,得到各自IMF和的形式:
式中,ci,j(t)为第i次加入白噪声后分解得到的第j个IMF,ri,j(t)是残余函数,代表信号的平均趋势,j是IMF的数量;
步骤S24:具体EMD分解过程如下:
对于一个加入噪音的信号序列,找到它所有的极大值点确定为上包络线,所有极小值点确定为下包络线,m(t)表示上包络线和下包络线的均值,第1个分量h1(t)=x(t)-m(t);
在第2个筛选过程中,h1(t)被视作原始数据,m1(t)是h1(t)的上下包络线的均值,如步骤S21所示确定第2个分量h2(t);
筛选过程重复n次,直到是hn(t)是一个本征模态函数或剩余分量rn(t)为一个单调函数,终止分解过程得的相应的IMF分量;
步骤S25:重复步骤S22和步骤S24进行M次,每次分解加入不同幅值的白噪声信号得到IMF的集合为:c1,j(t),c2,j(t),...,cM,j(t),j=1,2,...J;
步骤S26:利用不相关序列的统计平均值为0的原理,将上述对应的IMF进行集合平均运算,得到EEMD分解后最终的IMF,即:
式中,cj(t)是EEMD分解的第j个IMF,i=1,2,...M,j=1,2,...J。
4.根据权利要求1所述一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法,其特征在于,所述步骤S3包括以下步骤:
步骤S31:首先选择一个核函数,然后计算样本之间的核相似度;可以使用以下公式计算RBF核矩阵:
其中,是核函数的参数,||x-z||表示样本x和y之间的欧氏距离;
步骤S32:将核矩阵进行中心化,使得其均值为零;
步骤S33:为计算核矩阵的特征向量和特征值,对中心化的核矩阵进行特征值分解,得到特征向量和特征值;
步骤S34:选择降维后的维数k,对前k个最大的特征值对应的特征向量:将特征值从大到小排序,选择前k个最大的特征值对应的特征向量,构成新的数据空间;
步骤S35:将进行EEMD分解后的数据集X与所选择的k个特征向量相乘,得到降维后的数据矩阵Z。
5.根据权利要求1所述一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法,其特征在于,所述步骤S4包括以下步骤:
步骤S41:构建CNN网络,通过给定卷积层和池化层的个数,用于提取输入序列的空间特征;给定卷积核的数目、卷积步长、卷积方式的参数设置,选择tanh函数为激活函数,用于提取更加复杂的特征;
步骤S42:将降维后的数据矩阵输入到CNN模型中,通过卷积层和池化层进行特征提取,将其转化为更高级的特征表示;
步骤S43:特征集的生成,从CNN模型的输出层获取特征向量,表示数据在高维空间中的特征集;
步骤S44:将生成的特征集进行序列化操作,将序列化后的数据集划分为训练集和测试集。
6.根据权利要求1所述一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法,其特征在于,所述步骤S5包括以下步骤:
步骤S51:设置BiLSTM训练参数批处理batsize和学习率alpha取值范围,设置结构参数隐藏层层数和层神经元数num的取值范围,记参数组η={batsize,alpha,[num1,…,numn]},利用OOA对上述参数进行寻优;
步骤S52:根据鱼鹰成员在搜索空间中的位置确定问题变量的值,使用公式(5)对搜索空间使用矩阵进行建模;
随机初始化寻优空间里初始种群的位置:
xi,j=lbj+r·(ubj-lbj) (6)
其中Xi,j为个体,lbj为寻优下边界,ubj为寻优上边界,r为[0,1]之间的随机数;
批处理batsize、学习率alpha、隐藏层层数和层神经元数num的评估值使用根据公式(7)的向量表示;
步骤S53:定位和捕鱼
每个鱼鹰的鱼组是用公式(8)指定的,
FPi={Xk∣k∈{1,2,…,N}∧Fk<Fi}∪{Xbest} (8)
其中FPi是第i只鱼鹰的鱼集合,Xbest是最佳鱼鹰的位置;
鱼鹰随机检测到其中一条鱼的位置并攻击它,在模拟鱼鹰向鱼移动的基础上,使用公式(9-a)、(9-b)计算相应鱼鹰的新位置;如果该新位置更优,则根据公式(10)替换鱼鹰的先前位置;
其中SF为鱼鹰选中的鱼,r为[0,1]之间的随机数,I的值为{1,2}中的一个;
步骤S54:把鱼带到合适的位置;
在OOA的设计中,为了模拟鱼鹰的这种自然行为,首先,对于种群中的每个成员,使用公式(11-a)、(11-b)计算一个新的随机位置作为“适合吃鱼的位置”;然后,如果目标函数的值在这个新位置上得到改善,则它根据公式(12)替换相应鱼鹰的先前位置;
其中t为迭代次数,T为最大迭代次数;
步骤S55:得到最有超参组合。
7.根据权利要求1所述一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法,其特征在于,所述步骤S6包括以下步骤:
步骤S61:选取误差最大百分比yE-max、平均绝对百分比误差yMAPE、预测精度平均值yMAPE作为模型评估指标,其数学表达式如下:
步骤S62:将测试集输入模型进行状态评估。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311263510.3A CN117520809A (zh) | 2023-09-27 | 2023-09-27 | 一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311263510.3A CN117520809A (zh) | 2023-09-27 | 2023-09-27 | 一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117520809A true CN117520809A (zh) | 2024-02-06 |
Family
ID=89744587
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311263510.3A Pending CN117520809A (zh) | 2023-09-27 | 2023-09-27 | 一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117520809A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117910550A (zh) * | 2024-03-19 | 2024-04-19 | 江苏海拓宾未来工业科技集团有限公司 | 一种基于深度学习的无油超高速离心压缩机自动优化系统 |
-
2023
- 2023-09-27 CN CN202311263510.3A patent/CN117520809A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117910550A (zh) * | 2024-03-19 | 2024-04-19 | 江苏海拓宾未来工业科技集团有限公司 | 一种基于深度学习的无油超高速离心压缩机自动优化系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bommidi et al. | Hybrid wind speed forecasting using ICEEMDAN and transformer model with novel loss function | |
CN114970952B (zh) | 一种考虑环境因素的光伏出力短期预测方法及系统 | |
CN111784061B (zh) | 一种电网工程造价预测模型的训练方法、装置和设备 | |
CN110070102B (zh) | 用于电能质量扰动类型识别的序列对序列模型建立方法 | |
CN112507479B (zh) | 一种基于流形学习和softmax的石油钻机健康状态评估方法 | |
CN113688869B (zh) | 一种基于生成对抗网络的光伏数据缺失重构方法 | |
CN117520809A (zh) | 一种基于EEMD-KPCA-CNN-BiLSTM的变压器故障诊断方法 | |
CN116128141B (zh) | 风暴潮预测方法、装置、存储介质及电子设备 | |
CN110991737A (zh) | 一种基于深度置信网络的超短期风电功率预测方法 | |
CN111222689A (zh) | 基于多尺度时间特征的lstm负荷预测方法、介质及电子装置 | |
CN116960978A (zh) | 基于风速-功率组合分解重构的海上风电功率预测方法 | |
CN114676814A (zh) | 一种基于satcn-lstm的风功率超短期预测方法 | |
CN116842337A (zh) | 基于LightGBM优选特征与COA-CNN模型的变压器故障诊断方法 | |
CN115409369A (zh) | 基于机理和数据混合驱动的综合能源系统可靠性评估方法 | |
CN116050621A (zh) | 一种集成提升模式的多头自注意力海上风电超短时功率预测方法 | |
CN117371207A (zh) | 一种特高压换流阀状态评价方法、介质及系统 | |
CN110110784B (zh) | 一种基于变压器相关运行数据的变压器故障辨识方法 | |
CN117151770A (zh) | 一种基于注意力机制的lstm碳价预测方法和系统 | |
CN116561569A (zh) | 一种基于EO特征选择结合AdaBoost算法的工业电力负荷辨识方法 | |
CN114580472B (zh) | 工业互联网中因果与注意力并重的大型设备故障预测方法 | |
CN116384048A (zh) | 一种风力发电机组轴承寿命预测的方法 | |
CN114298413A (zh) | 一种水电机组振摆趋势预测方法 | |
CN114897204A (zh) | 一种海上风电场短期风速预测方法和装置 | |
CN113935413A (zh) | 一种基于卷积神经网的配网录波文件波形识别方法 | |
CN113887571A (zh) | 改进svr算法的电子设备故障预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |