CN114819054B - 一种基于物理信息神经网络的电力电子系统状态监测方法 - Google Patents
一种基于物理信息神经网络的电力电子系统状态监测方法 Download PDFInfo
- Publication number
- CN114819054B CN114819054B CN202210239653.XA CN202210239653A CN114819054B CN 114819054 B CN114819054 B CN 114819054B CN 202210239653 A CN202210239653 A CN 202210239653A CN 114819054 B CN114819054 B CN 114819054B
- Authority
- CN
- China
- Prior art keywords
- data
- model
- output
- pes
- lstm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 21
- 238000012544 monitoring process Methods 0.000 title claims abstract description 16
- 238000005293 physical law Methods 0.000 claims abstract description 7
- 238000012549 training Methods 0.000 claims description 50
- 230000006870 function Effects 0.000 claims description 29
- 238000006731 degradation reaction Methods 0.000 claims description 28
- 230000015556 catabolic process Effects 0.000 claims description 27
- 238000012360 testing method Methods 0.000 claims description 27
- 238000012795 verification Methods 0.000 claims description 21
- 230000008569 process Effects 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 9
- 230000000694 effects Effects 0.000 claims description 8
- 230000007423 decrease Effects 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 5
- 238000011160 research Methods 0.000 claims description 5
- 238000013461 design Methods 0.000 claims description 4
- 230000015654 memory Effects 0.000 claims description 4
- 239000000523 sample Substances 0.000 claims description 4
- 230000004069 differentiation Effects 0.000 claims description 3
- 238000003062 neural network model Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000000638 solvent extraction Methods 0.000 claims description 3
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 claims description 2
- 230000004913 activation Effects 0.000 claims description 2
- 230000001419 dependent effect Effects 0.000 claims description 2
- 230000007613 environmental effect Effects 0.000 claims description 2
- 230000009467 reduction Effects 0.000 claims description 2
- 230000002123 temporal effect Effects 0.000 claims description 2
- 206010027175 memory impairment Diseases 0.000 claims 1
- 238000013135 deep learning Methods 0.000 abstract description 3
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 230000004927 fusion Effects 0.000 abstract description 2
- 238000005259 measurement Methods 0.000 abstract description 2
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 14
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 14
- 238000005070 sampling Methods 0.000 description 11
- 238000002474 experimental method Methods 0.000 description 6
- 238000004088 simulation Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000006403 short-term memory Effects 0.000 description 3
- 239000003990 capacitor Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012821 model calculation Methods 0.000 description 2
- 230000003071 parasitic effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于物理信息神经网络的电力电子系统状态监测方法,属于系统状态监测领域。该方法通过传感器采集实际PES的信号或者通过仿真软件模拟电路在不同参数条件下的运行数据,根据开关建模的理论推导出PES的状态空间方程。采用LSTM深度学习作为模型的数据驱动部分,加入状态空间方程作为先验信息对数据驱动模型的解空间进行约束,将数据驱动的部分和物理定律拟合的部分视为多任务学习联合问题,通过不确定度衡量二者的加权系数,实现了数据和先验知识的自适应融合。PINN‑DT方法可以在数据量有限的情况下提高估计精度,增强模型的泛化能力,有利于实现复杂PES的状态监测,对提高各种装备的可靠性有重要意义。
Description
技术领域
本发明涉及系统状态监测领域,更具体的涉及电力电子设备的退化参数监测领域。
现有技术
随着现代工业的不断发展,工业设备的结构愈发复杂,各类机械结构和电子系统相互关联、彼此耦合。因此,对系统的可靠性提出了极高的要求。相比于机械类设备,电子设备没有明显的磨损现象和振动信号等直观的外在特征来表征其退化过程,导致电子设备的PHM技术发展缓慢,难以突破。以电力电子系统(Power Electronic Systems, PES)为例,开关电源由于设计复杂,脆弱器件多,器件之间关联程度高,运行状态受到各级功能电路、电路板和元器件的综合制约,使得电力电子系统的PHM技术具有很大的随机性和复杂性,因此,对其开展更进一步的健康管理研究,提升电力电子系统的可靠性和稳定性十分重要。
通过对目前的文献检索发现,现有的PES状态监测技术大多数基于物理模型、数据驱动或优化方法这三者之一。目前一种研究趋势是结合机理建模与数据驱动建模的混合建模方法。其中机理模型为基于数据驱动的模型提供先验知识,而基于数据模型又能补偿简化机理模型的未建模特性,从而使两种方法有效结合起来,互为补充,实现较好的建模效果,然而,目前的研究还缺乏统一且通用的方法将模型与数据进行有效的融合。本发明针对PES,采用物理信息神经网络的思想将电路模型信息与数据融合,有效提高模型的泛化性。本文的研究内容对于实际的工程应用具有较高的参考价值。
发明的目的
针对纯数据驱动的状态监测方法没有可解释性,在数据量有限的情况下泛化能力差,而纯模型驱动的方法又往往难以精确推导复杂PES动态方程的问题,提出了一种基于物理信息神经网络的数字孪生模型。通过传感器采集实际PES的信号或者通过仿真软件模拟电路在不同参数条件下的运行数据,根据开关建模的理论推导出PES的状态空间方程。采用LSTM深度学习作为模型的数据驱动部分,加入状态空间方程作为先验信息对数据驱动模型的解空间进行约束,将数据驱动的部分和物理定律拟合的部分视为多任务学习联合问题,通过不确定度衡量二者的加权系数,实现了数据和先验知识的自适应融合。本发明结合Buck电路的仿真数据进行案例验证,与纯数据驱动的方法进行对比,所提出的方法可靠性更高,在数据量有限的情况下有更好的估计能力和泛化能力。
发明的内容
本发明的实现框架如图1所示,主要分为模型中的数据驱动部分和物理信息部分。本发明提出了一种物理信息神经网络(Physics Informed Deep Learning,PINN)的方法来模拟PES的运行过程以及其关键参数的退化,由于电路的状态信号(输出电压,电感电流)可以看作随时间变化的序列,因此本发明提出的算法采用长短期记忆神经网络 (Longshort-term memory,LSTM)作为PINN的数据驱动模块。
步骤1:数据采集和处理
(1)数据采集
根据具体的应用场景,通过电压/电流探头采集电路的输出信号,或者通过电力电子仿真软件实时模拟PES得到原始数据。原始数据数据量大、具有一定噪音,需要进一步的处理后才能用于退化参数估计。
(2)数据的预处理
得到原始数据后,根据原始数据的不同特征对数据做相应的处理。如果原始数据来自实际电路采集的输出电压和电感电流,由于外界环境干扰和本身仪器的影响,信号一般具有较大的环境噪音,在分析过程中首先对信号进行降噪处理;如果原始数据由仿真软件生成,为了使其更符合真实采集数据的特征,也可以对其添加高斯白噪音。随后,针对原始数据数据量大的问题,对数据进行降采样处理。针对原始信号量纲不同的问题,对数据进行归一化处理。
(3)数据集划分
实验过程中,数据集会被分为训练集、验证集和测试集三部分。通常随机选择80%组电路状态数据作为训练数据集,从剩余电路状态数据中随机选取50%组状态数据作为验证数据集,将最后剩余的50%电路状态数据作为测试数据集。
步骤2:模型中数据驱动部分的建立
采集到原始数据集并对数据进行预处理后,搭建相应的物理信息神经网络模型用于训练。模型由数据驱动和物理知识两部分组成,首先搭建数据驱动模型,由于电路的状态信号是一个时变序列,因此本发明采用LSTM作为数据驱动模型。图2显示了在第t个时间点在第一层神经网络中LSTM单元的结构,图中的箭头代表信息流,方块代表LSTM中的三个门:输入门、遗忘门、输出门。这三个门通过sigmoid函数计算,使用当前输入信息xt和上一步的输出值ht-1。
第一步是计算当前时刻t的遗忘门和输入门。遗忘门控制保留多少先前的信息,输入门决定记住多少当前的输入信息。
ft=sigmoid(Wf×[ht-1,xt]+bf) (1)
it=sigmoid(Wi×[ht-1,xt]+bi) (2)
其中ft和it即遗忘门和输入门的计算值。Wf和Wi是输入权重,bf和bi是偏置,xt是当前时刻单元的输入信息,ht-1是上一时刻单元的输出值。sigmoid函数是
第二步,基于输入值xt和上一时刻的输出值ht-1来计算单元状态
其中WC是权重矩阵,bC是偏置。tanh函数是
然后将上一步的状态Ct-1乘以ft,这一步用于放弃决定遗忘的信息。之后添加其中包括新的信息,用以更新存储单元Ct。
最后一步是计算输出门ot和当前时刻的输出ht。输出门根据当前单元存储器的状态确定输出。
ot=sigmoid(Wo×[ht-1,xt]+bo) (5)
其中是Wo权重,bo是偏置。
然后根据输出门的值计算当前时刻的输出。
ht=ot×σ(Ct) (6)
其中σ是激活函数,一般而言是tanh函数。
步骤3:模型中物理信息部分的建立
PES是一个典型的动力系统,包含复杂的非线性过程,PES的性能会在运行过程中受到多种有源和无源参数的影响,由于电容、电感以及各类开关器件的存在,PES 的运行状态同样可以用一组微分方程来描述。在LSTM模型搭建完毕后,将其物理公式作为先验知识加入LSTM模型,利用神经网络的自动微分对其求解,从而估计PES 的退化参数。
(1)建立PES微分方程
假设系统存在一个如下形式的参数化非线性偏微分方程:
其中是偏微分方程的边界条件,x和t是微分方程的空间和时间输入,/>是方程的初始条件。空间域Ω∈Rd,/>代表非线性偏微分算子,u(x,t)是该方程想要求解的未知解。
(2)建立代理网络模型
建立一个代理网络模型f来逼近潜在的解
θW,b∈Rk是一组神经网络的参数,包括网络的权重W和偏差b。神经网络应用链式法则在反向传播过程中对函数微分进行自动求导,使用f(x,t,θW,b)逼近方程的未知解u(x,t)。
将期望的解和网络预测的解f之间的误差作为损失函数,然后让神经网络通过最小化损失函数来学习,一般认为损失函数的最小化是一个非凸优化问题,该过程由如下方程表示:
(3)设计损失函数
损失函数由两部分组成,一部分满足数据给定的边界条件和初始条件,一部分满足偏微分方程给定的物理定律,即:
MSEu和MSEf别是数据驱动部分和物理信息部分,可以表示为:
N表示训练样本的数量。给定特定的神经网络结构,PINN可以被视为输入数据和参数θW,b的函数。它将时间t、空间坐标x和变量映射到可以测量和观察的物理量,例如速度场u、压力场p、以及本发明的研究对象电压场v和电流场i,从而获得不需要网格划分或数值迭代的无数据PDE求解器。
步骤4:基于不确定度衡量权重
在步骤3的同时执行本步骤,即基于不确定度的方法衡量权重。本发明提出了基于多任务联合学习的PINN学习方法。对各任务的损失确定加权系数可以有多种方式,把这些系数作为超参数进行调试的代价很大,因此提出了基于任务的不确定性确定系数。在多任务联合学习中,任务依赖不确定性能够表示不同任务间的相对难度。下面证明了在多任务学习中可以通过任务依赖不确定性对不同的损失进行加权。
通过最大化同方差不确定性的最大高斯似然来推导多任务损失函数。
假设输入为X,参数矩阵为W,输出为fW(x)。
对于回归任务,定义其概率为以输出为均值的高斯似然,即:
p(y∣fW(x))=N(fW(x),σ2) (12)
多任务模型的似然为:
p(y1,…,yk∣fW(x))=p(y1∣fW(x))…p(yK∣fW(x)) (13)
对于回归任务,其对数似然为:
对于高斯似然,σ为模型的观测噪声参数,表示输出数据中的噪声量。然后基于参数矩阵W和标准差σ最大化对数似然。假设多任务模型进行两个回归任务,两个任务都符合高斯分布,输出分别是y1和y2,那么总对数似然为:
取对数,优化目标变成了最大化对数似然,也是最小化负对数似然,即:
想最小化负对数似然,就需要调整σ1和σ2的值。σ1增大,L1(w)相应减小。反之亦然,最后一项可以看作正则化项。多任务联合学习的最终目标可以看成是学习每一个子任务输出的相对权重,因此,模型的损失函数可以由公式(17)表示:
ωu和ωf分别是数据驱动部分和物理信息部分的权重系数。
步骤5:得到参数估计的结果
将训练集输入到搭建好的PINN模型中,对模型进行训练,在训练过程中用验证集观察训练效果。最后将测试集数据传递给训练好的模型,模型通过计算得到相应的退化参数估计结果。
1、发明的效果
本发明提出了一种新的基于数字孪生的状态监测方法——物理信息数字孪生(Digital twins based on Physics-informedNeural Networks,PINN-DT)模型,又称为物理信息长短期记忆数字孪生(Digital twins based on Physics-informed Long short-term memory, PI-LSTM-DT)。虽然实际的PES具有复杂的拓扑结构和动态变化的运行环境,但运行过程不会违背基本的电路原理,考虑DC-DC转换器模块中的充电及放电过程,利用状态空间平均法推导出物理公式,然后将物理公式作为先验知识加入LSTM深度学习模型,利用不确定度的方法为模型中的数据拟合任务和物理信息拟合任务确定加权系数,从而估计DC-DC转换器的退化参数。PINN-DT方法可以在数据量有限的情况下提高估计精度,增强模型的泛化能力,有利于实现复杂PES的状态监测,对提高新能源汽车等众多装备的可靠性有重要意义。
附图说明
图1是本发明的实现框架图。
图2是LSTM单元结构图
图3是用于实验验证的Buck电路仿真图
图4是退化参数的MAPE收敛图。其中4(a)是测试集上的参数MAPE收敛图,4(b) 是验证集上的MAPE收敛图。
图5是在测试集所占比例不同时数据驱动方法和物理信息方法结果对比。其中5(a) 是各等效电阻的结果,5(b)是电容、电感和参数均值的结果。
图6是测试集所占比例80%时数据驱动方法和物理信息方法的散点图结果对比。
3、案例验证
本发明的效果通过一个降压转换器状态监测的案例进行展示与验证。
1.数据采集和处理
(1)数据采集
在Simulink中搭建了一个同步降压转换器作为实验验证的案例,该转换器以12V电压作为输入,5V电压作为输出,该电路如图3所示。
按照表1对转换器关键退化参数赋值,以模拟器件在各类工作条件下的状态,采集对应的输出电压和电感电流。一共采集3125组样本。
表1退化参数数据采集
(2)数据的预处理
为了使仿真验证数据更符合真实采集数据。对数据做了添加高斯白噪声的处理。信噪比为有用信号功率(Power ofSignal)与噪声功率(Power ofNoise)的比,即
信噪比的单位一般使用分贝(dB),其值为十倍对数信号与噪声功率比。
以x(n)表示干净信号,n(n)表示噪声信号,N代表信号长度,则信噪比可用公式来表示:
高斯白噪声是均值为0方差为1的噪声信号,本发明给原始信号x(n)加入40dB 的高斯白噪声。已知信噪比的情况下,噪声功率的计算公式为:
噪声信号的计算公式为:
为了减小LSTM网络的大小,提升计算效率,考虑对得到的电感电流和输出电压数据进行降采样处理。降采样的原则遵循奈奎斯特-香农采样定理,即采样频率不得低于奈奎斯特频率(Nyquist frequency)。即
fs≥2fH (23)
fs为采样频率,fH为信号频率。
采样定理指出,只要离散系统的奈奎斯特频率高于被采样信号的最高频率或带宽,就可以真实的还原被测信号。设降采样因子为M,对过滤高频后的信号降采样M倍,相当于保留原讯号中间隔为M的取样点,每隔M-1点抽取一点,即
xDN(n)=x(nM) (24)
降采样序列和原始序列的频谱关系为:
本发明中Buck电路的实际信号频率为200kHZ,Simulink中的采样频率与求解器步长相同,为50*200kHZ,选择降采样因子M=5,则降采样后的采样频率为10*200kHZ,符合奈奎斯特-香农采样定理。
由于在本发明所提算法中,实验数据不仅要用于数据拟合,还要应用于物理定律拟合,因此将收集到的电路状态信号在增加高斯白噪声和降采样后直接用于PINN-DT 算法的输入。由于信号的量纲不同,采用最小值-最大值归一化对数据进行处理。
该方法是一种线性变换,下面的表达式可将数值变换到(0,1)范围。
max是信号中的最大值,min是信号中的最小值。
若要变换到新的范围是变换到新的范围(new_min,new_max),则可以用下面的表达式完成。
将电路状态信号归一化至(-1,1)范围。
(3)数据集划分
实验过程中,数据集会被分为训练集、验证集和测试集三部分,具体划分如下所示。
实验数据集:总共3125组Buck电路状态数据,每组数据中的电感电流信号和输出电压信号对应一组不同的电路参数,参数包括电容C,电容寄生电阻RC,电感L,电感寄生电阻RL和开关器件导通电阻Ron.
训练集:随机选择80%组电路状态数据,取这80%电路状态数据作为训练数据集,利用PINN-DT算法训练状态监测模型。
验证集:从剩余电路状态数据中随机选取50%组状态数据作为验证数据集,主要用于防止数据过拟合。
测试集:将最后剩余的50%电路状态数据作为测试数据集来测试电路状态监测的性能。
2.模型中数据驱动部分的建立
网络使用以下参数作为输入:
①输出电压采样值vo:输出电压经过降采样,添加高斯白噪音和归一化处理后的输出电压纹波采样值,输出电压代表了电路的运行状态,其纹波大小与电路中的输出电容、电容等效电阻的值和开关导通电阻有较大关系;
②电感电流采样值iL:电感电流经过降采样,添加高斯白噪音和归一化处理后的电感电流采样值,电感电流可以视为输入电流,也在一定程度上代表了电路的运行状态,其纹波大小与电路中的滤波电感、电感等效电阻和开关导通电阻有较大关系;
模型的任务是找出以下输出参数与随时间变化的输出电压和电感电流之间的对应关系:
电容值C,电容等效电阻RC,电感值L、电感等效电阻RL和三极管导通电阻Ron。
定义和/>为近似真实电容值C和真实电容等效电阻RC的神经网络输出,类似地,定义/>和/>分别为L、RL和Ron的神经网络输出近似值。
3.模型中物理信息部分的建立
(1)建立PES微分方程
本发明的研究目标为Buck转换器,为了建立Buck电路的PI-LSTM-DT模型,需要将Buck电路的物理原理加入LSTM网络,让LSTM的输出可以拟合电路的动态模型。根据非理想Buck电路的物理模型,将其整理成输出电压、电感电流与待监测退化参数之间的关系式,具体过程如下所示:
当Buck电路开关处于导通状态,即D=1时:
当Buck电路开关处于截止状态,即D=0时:
整合两个阶段的运行动态方程,可以得到Buck电路有关输出电压和电感电流的全周期状态空间方程:
(2)建立代理网络模型
设u=(vo,iL),将神经网络的近似输出代入电力电子系统的状态空间方程,得到函数和/>
(3)设计损失函数
因此,可以定义PINN的损失函数为:
式中,前五项是标准均方误差,使用样本数为N的数据集{u1,...,uN}训练纯数据驱动的 LSTM模型,其中C、RC、L、RL和Ron的真实值是已知的,称其为监督数据。后两项是违背电力电子状态空间方程的正则化项,在正则化项中不需要知道退化参数的真实值。
4.基于不确定度衡量权重
基于不确定度的方法为损失函数各项确定加权系数,可以定义PINN的损失函数为:
ω是基于不确定度为数据拟合子任务和物理信息拟合子任务确定的加权系数。其中ωu是各数据项的加权系数,ωf电压和电流拟合项的加权系数。是正则项。
本发明的实验中,需要监测的真实值不存在等于0的情况,为了更直观地表示退化参数的估计值与真实值之间的偏差,采用平均绝对百分比误差(Mean Absolute PercentageError,MAPE)作为评价模型好坏的指标。
5.Buck电路关键退化参数估计
为了验证所提出的PINN-DT状态监测方法的有效性,基于Simulink仿真生成的运行状态数据集进行了实验验证。
实验过程中发现,添加了物理约束的PINN-DT模型在小数据集情况下优势更为明显,因此,本发明对比了不同训练集大小下PINN-DT的效果。PINN-DT相比纯数据驱动的模型多了一层物理约束,在没有特别说明的情况下,二者的优化过程与参数选择都相同,每一次对比实验的数据集都采用相同的随机种子划分训练集、验证集和测试集,通过在相同场景下对比PINN-DT方法和NN-DT方法的性能,以验证物理约束的意义。
(1)PINN-DT的有效性分析
为了验证PI-LSTM-DT模型的有效性,在3125组样本中随即划分80%作为训练集数据,再在剩余的数据中随机取50%为验证集数据,剩余50%为测试集数据,划分的随机数种子取1,验证集在每一次训练迭代后验证模型的性能,用于观察模型收敛情况以及防止过拟合,防止模型过拟合的措施采取Early-stopping方法,通过分析模型的长期收敛趋势,选择合适的停止策略和参数,如果在测试中发现模型在长时间训练后没有出现明显的过拟合情况,可以不采用Early-stopping策略,或者根据验证集损失在数个周期内不再下降为标准执行提前停止。测试集在模型训练完毕后测试最终性能。
图4(a)和(b)分别展示了训练集和验证集上五种退化参数MAPE在训练过程中的收敛趋势以及防止过拟合的PQ终止迭代策略,其中横轴代表模型计算次数,右纵轴表示退化参数的MAPE损失,左纵轴表示Early-stopping策略计算的PQ值。表2展示了一次实验后PI-LSTM-DT在训练集和测试集上的预测结果
表2 PINN-DT的训练结果
从图4和表2中可以得出以下结论:
(1)PI-LSTM-DT可以有效估计Buck电路的退化参数。从图4中可以看出,随着模型计算次数增多,各参数的MAPE损失都逐渐下降并趋于稳定,其中电容和电感的参数损失在100次迭代以内下降到较低的水平,并在后续有平缓的下降趋势;
(2)在训练数据较大的情况下,提出的模型的过拟合程度很低。对比观察图4(a)和图5(b),可以看到在验证集数据上各参数的MAPE误差逐渐减小的同时,测试集上的MAPE会在小范围内有一定的振动,但在整体趋势上没有明显的上升或波动,计算的PQ值也在迭代过程中一直处于较低的水平,没有超过设定的阈值,模型可以成功学习到数据和物理信息的规律;
(3)不同类别的退化参数有不同的估计误差。从图4和表2中可以看出基于 PINN-DT的参数估计方法可以同时估计五组退化参数的状态。其中无源器件自身参数估计精度较高,电容值和电感值的MAPE损失在1%以内,其等效电阻的拟合程度稍差,损失程度在10%以内,有源器件的参数估计难度最大,开关等效电阻的训练集拟合误差在10%左右,验证集误差能保证在20%以内。
(2)PINN-DT的稳定性分析
在上一部分的有效性分析中,只对两类模型在相同数据下训练一次后的结果进行了分析。但是LSTM模型在每次训练中其网络输入层和隐藏层节点的权重和偏置的赋值具有随机性,所以单次的估计结果不能说明模型的稳定性。
因此,本发明的仿真实验分析了多次训练的结果,将划分数据集的随机种子随机取十次,对PI-LSTM-DT进行训练。表3中显示了十次训练后在训练集和测试集上的 MAPE求平均后的值。
表3 PINN-DT平均运行十次后的参数估计结果
从表3中可以看出,PI-LSTM-DT方法具有一定的稳定性。在十次估计的情况下,PI-LSTM-DT参数估计没有出现偏差过大的结果,在训练集和测试集上各退化参数的误差依然控制在合理范围内。
(3)PINN-DT在小数据下的性能对比
在实际工业应用中,由于PES运行环境和操作成本的限制,难以提供大量有效数据用于模型的训练。针对这种情况,本节探讨了训练数据集的大小对PINN-DT方法的影响,随机抽取不同大小的训练集,分别使用PI-LSTM-DT和LSTM-DT在相同随机种子下各自运行十次后不同退化参数估计的平均值对比,以此来分析在小数据量的情况下PINN方法的性能。同时,为了更直观地展示两类方法的估计效果,将参数的MAPE 值平均作为新的指标,整体进行观察和分析。表4和图5分别展示了在四种训练集大小情况下六个参数估计的结果。
表4四种训练集大小下参数估计结果
为了便于观察,表4中将估计结果在测试集上较小的MAPE值加粗表示。图5是表4的可视化展示,图中横轴代表测试集在数据中所占比例,纵轴表示相应的MAPE 值,(a)和(b)中以不同的颜色代表不同的估计参数,其中实线实心圆点代表LSTM模型的估计结果,虚线五角星代表PI-LSTM模型的估计结果。
观察表4和图5,可以得出以下结论:
(1)可以看出,在训练集为80%的时候,纯数据驱动的模型在部分参数上比添加了物理约束的模型有稍好的收敛性。究其原因,可能因为数据中添加的噪声的对物理知识的识别有一定程度的干扰,而在数据量充足的情况下,纯数据驱动的模型仍然可以从数据中拟合Buck电路参数整体的退化趋势。但是仍在一些参数上,例如电感值,尤其是在较难估计的开关导通电阻的辨识上,PI-LSTM-DT仍然有一定的提升;
(2)当减小训练集的大小逐步减小之后,可以看到数据驱动和物理信息模型预测精度都有所下降,但物理信息模型由于添加了电路原理作为约束,下降趋势明显比纯数据LSTM模型更加缓慢。从表6中可以看到两类方法在训练集和测试集上计算的平均估计精度,可以看到训练数据量较大的情况下,PI-LSTM-DT相比LSTM-DT的准确度有适度但不显著的提升,但并不是所有退化参数的准确度都有提升,例如60%训练集实验中的电感值L,其PI-LSTM-DT的估计精度低于LSTM;
(3)当训练集大小减小到40%和20%的时候,此时可以看到PI-LSTM-DT模型相比较LSTM-DT模型在各参数都有更为明显的改善,总体的误差比纯数据驱动模型降低20%,观察表6可以看到在开关导通电阻Ron上的提升最为明显。
为了更直观表明PI-LSTM-DT和LSMT-DT的对比效果,图6展示了在20%训练集情况下,测试集数据分别在PI-LSTM-DT和LSTM-DT两种模型下的估计结果。观察图6可以得到以下结果:
(1)从图6中可以看到,加入物理约束的网络在小数据量的情况下相比纯数据驱动有一定提升,尤其对于估计难度较大的参数Ron,PI-LSTM-DT有明显提升;
(2)与传统基于纯数据驱动的LSTM方法相比,添加了物理约束的PI-LSTM预测结果更加稳定。从图6中可以看到,在大部分退化参数的估计中,LSTM-DT的整体波动较大,而且在RL与Ron的估计中,有部分离散的深色点与真实值偏差较大,说明纯数据驱动的神经网络模型在测试集整体上的稳定性较差,而提出的方法在测试集退化参数的估计值上较为集中,呈现较为稳定的估计情况。这种现象的原因是,传统的数据驱动方法仅仅从数据中学习规律,没有相应的物理知识支撑,而PI-LSTM-DT在添加物理约束后可以使较为离散的估计值收敛。
Claims (1)
1.一种基于物理信息神经网络的电力电子系统状态监测方法,其特征在于,包括如下步骤:
步骤1:数据采集和处理
(1)数据采集
根据具体的应用场景,通过电压/电流探头采集电路的输出信号,或者通过电力电子仿真软件实时模拟PES得到原始数据;原始数据数据量大、具有一定噪音,需要进一步的处理后才能用于退化参数估计;
(2)数据的预处理
得到原始数据后,根据原始数据的不同特征对数据做相应的处理;如果原始数据来自实际电路采集的输出电压和电感电流,由于外界环境干扰和本身仪器的影响,信号一般具有较大的环境噪音,在分析过程中首先对信号进行降噪处理;如果原始数据由仿真软件生成,为了使其更符合真实采集数据的特征,也可以对其添加高斯白噪音;随后,针对原始数据数据量大的问题,对数据进行降采样处理;针对原始信号量纲不同的问题,对数据进行归一化处理;
(3)数据集划分
实验过程中,数据集会被分为训练集、验证集和测试集三部分;通常随机选择80%组电路状态数据作为训练数据集,从剩余电路状态数据中随机选取50%组状态数据作为验证数据集,将最后剩余的50%电路状态数据作为测试数据集;
步骤2:模型中数据驱动部分的建立
采集到原始数据集并对数据进行预处理后,搭建相应的物理信息神经网络模型用于训练;模型由数据驱动和物理知识两部分组成,首先搭建数据驱动模型,由于电路的状态信号是一个时变序列,因此本发明采用LSTM作为数据驱动模型;图2显示了在第t个时间点在第一层神经网络中LSTM单元的结构,图中的箭头代表信息流,方块代表LSTM中的三个门:输入门、遗忘门、输出门;这三个门通过sigmoid函数计算,使用当前输入信息xt和上一步的输出值ht-1;
第一步是计算当前时刻t的遗忘门和输入门;遗忘门控制保留多少先前的信息,输入门决定记住多少当前的输入信息;
ft=sigmoid(Wf×[ht-1,xt]+bf) (1)
it=sigmoid(Wi×[ht-1,xt]+bi) (2)
其中ft和it即遗忘门和输入门的计算值;Wf和Wi是输入权重,bf和bi是偏置,xt是当前时刻单元的输入信息,ht-1是上一时刻单元的输出值;sigmoid函数是
第二步,基于输入值xt和上一时刻的输出值ht-1来计算单元状态
其中WC是权重矩阵,bC是偏置;tanh函数是
然后将上一步的状态Ct-1乘以ft,这一步用于放弃决定遗忘的信息;之后添加其中包括新的信息,用以更新存储单元Ct;
最后一步是计算输出门ot和当前时刻的输出ht;输出门根据当前单元存储器的状态确定输出;
ot=sigmoid(Wo×[ht-1,xt]+bo) (5)
其中是Wo权重,bo是偏置;
然后根据输出门的值计算当前时刻的输出;
ht=ot×σ(Ct) (6)
其中σ是激活函数,一般而言是tanh函数;
步骤3:模型中物理信息部分的建立
PES是一个典型的动力系统,包含复杂的非线性过程,PES的性能会在运行过程中受到多种有源和无源参数的影响,由于电容、电感以及各类开关器件的存在,PES的运行状态同样可以用一组微分方程来描述;在LSTM模型搭建完毕后,将其物理公式作为先验知识加入LSTM模型,利用神经网络的自动微分对其求解,从而估计PES的退化参数;
(1)建立PES微分方程
假设系统存在一个如下形式的参数化非线性偏微分方程:
其中是偏微分方程的边界条件,x和t是微分方程的空间和时间输入,/>是方程的初始条件;空间域Ω∈Rd,/>代表非线性偏微分算子,u(x,t)是该方程想要求解的未知解;
(2)建立代理网络模型
建立一个代理网络模型f来逼近潜在的解
θW,b∈Rk是一组神经网络的参数,包括网络的权重W和偏差b;神经网络应用链式法则在反向传播过程中对函数微分进行自动求导,使用f(x,t,θW,b)逼近方程的未知解u(x,t);
将期望的解和网络预测的解f之间的误差作为损失函数,然后让神经网络通过最小化损失函数来学习,一般认为损失函数的最小化是一个非凸优化问题,该过程由如下方程表示:
(3)设计损失函数
损失函数由两部分组成,一部分满足数据给定的边界条件和初始条件,一部分满足偏微分方程给定的物理定律,即:
MSEu和MSEf别是数据驱动部分和物理信息部分,可以表示为:
N表示训练样本的数量;给定特定的神经网络结构,PINN可以被视为输入数据和参数θW,b的函数;它将时间t、空间坐标x和变量映射到可以测量和观察的物理量,例如速度场u、压力场p、以及本发明的研究对象电压场v和电流场i,从而获得不需要网格划分或数值迭代的无数据PDE求解器;
步骤4:基于不确定度衡量权重
在步骤3的同时执行本步骤,即基于不确定度的方法衡量权重;本发明提出了基于多任务联合学习的PINN学习方法;对各任务的损失确定加权系数可以有多种方式,把这些系数作为超参数进行调试的代价很大,因此提出了基于任务的不确定性确定系数;在多任务联合学习中,任务依赖不确定性能够表示不同任务间的相对难度;下面证明了在多任务学习中可以通过任务依赖不确定性对不同的损失进行加权;
通过最大化同方差不确定性的最大高斯似然来推导多任务损失函数;
假设输入为X,参数矩阵为W,输出为fW(x);
对于回归任务,定义其概率为以输出为均值的高斯似然,即:
p(y∣fW(x))=N(fW(x),σ2) (12)
多任务模型的似然为:
p(y1,…,yk∣fW(x))=p(y1∣fW(x))…p(yK∣fW(x)) (13)
对于回归任务,其对数似然为:
对于高斯似然,σ为模型的观测噪声参数,表示输出数据中的噪声量;然后基于参数矩阵W和标准差σ最大化对数似然;假设多任务模型进行两个回归任务,两个任务都符合高斯分布,输出分别是y1和y2,那么总对数似然为:
取对数,优化目标变成了最大化对数似然,也是最小化负对数似然,即:
想最小化负对数似然,就需要调整σ1和σ2的值;σ1增大,L1(w)相应减小;反之亦然,最后一项可以看作正则化项;多任务联合学习的最终目标可以看成是学习每一个子任务输出的相对权重,因此,模型的损失函数可以由公式(17)表示:
ωu和ωf分别是数据驱动部分和物理信息部分的权重系数;
步骤5:得到参数估计的结果
将训练集输入到搭建好的PINN模型中,对模型进行训练,在训练过程中用验证集观察训练效果;最后将测试集数据传递给训练好的模型,模型通过计算得到相应的退化参数估计结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210239653.XA CN114819054B (zh) | 2022-03-11 | 2022-03-11 | 一种基于物理信息神经网络的电力电子系统状态监测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210239653.XA CN114819054B (zh) | 2022-03-11 | 2022-03-11 | 一种基于物理信息神经网络的电力电子系统状态监测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114819054A CN114819054A (zh) | 2022-07-29 |
CN114819054B true CN114819054B (zh) | 2024-02-27 |
Family
ID=82528300
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210239653.XA Active CN114819054B (zh) | 2022-03-11 | 2022-03-11 | 一种基于物理信息神经网络的电力电子系统状态监测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114819054B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115201615B (zh) * | 2022-09-15 | 2022-12-20 | 之江实验室 | 基于物理约束神经网络的非侵入式负荷监测方法及装置 |
CN116449135B (zh) * | 2023-04-19 | 2024-01-30 | 北京航空航天大学 | 一种机电系统部件健康状态确定方法、系统及电子设备 |
CN116761179B (zh) * | 2023-07-14 | 2024-04-30 | 青岛科技大学 | 基于轻量化MS-Net的移动发射天线选择和能量收集TAS-EH系统安全通信性能智能预测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109685252A (zh) * | 2018-11-30 | 2019-04-26 | 西安工程大学 | 基于循环神经网络和多任务学习模型的建筑能耗预测方法 |
CN111563706A (zh) * | 2020-03-05 | 2020-08-21 | 河海大学 | 一种基于lstm网络的多变量物流货运量预测方法 |
CN112491094A (zh) * | 2020-11-19 | 2021-03-12 | 南方电网数字电网研究院有限公司 | 一种混合驱动的微电网能量管理方法、系统及装置 |
WO2021232655A1 (zh) * | 2020-05-20 | 2021-11-25 | 国网河北省电力有限公司电力科学研究院 | 一种基于振动特征的高压并联电抗器机械状态评估方法 |
-
2022
- 2022-03-11 CN CN202210239653.XA patent/CN114819054B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109685252A (zh) * | 2018-11-30 | 2019-04-26 | 西安工程大学 | 基于循环神经网络和多任务学习模型的建筑能耗预测方法 |
CN111563706A (zh) * | 2020-03-05 | 2020-08-21 | 河海大学 | 一种基于lstm网络的多变量物流货运量预测方法 |
WO2021232655A1 (zh) * | 2020-05-20 | 2021-11-25 | 国网河北省电力有限公司电力科学研究院 | 一种基于振动特征的高压并联电抗器机械状态评估方法 |
CN112491094A (zh) * | 2020-11-19 | 2021-03-12 | 南方电网数字电网研究院有限公司 | 一种混合驱动的微电网能量管理方法、系统及装置 |
Non-Patent Citations (1)
Title |
---|
路昊 ; 石敏 ; 李昊 ; 朱登明 ; .基于深度学习的动态场景相机姿态估计方法.高技术通讯.2020,(01),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN114819054A (zh) | 2022-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114819054B (zh) | 一种基于物理信息神经网络的电力电子系统状态监测方法 | |
Zhou et al. | State of health monitoring and remaining useful life prediction of lithium-ion batteries based on temporal convolutional network | |
CN111999657B (zh) | 一种电动汽车的锂离子电池剩余寿命的行驶里程评估方法 | |
CN109145516B (zh) | 一种基于改进型极限学习机的模拟电路故障识别方法 | |
CN109597401B (zh) | 一种基于数据驱动的设备故障诊断方法 | |
Fan et al. | A novel machine learning method based approach for Li-ion battery prognostic and health management | |
CN112418277A (zh) | 旋转机械零部件剩余寿命预测方法、系统、介质、设备 | |
Chang et al. | Remaining useful life prediction for rolling bearings using multi-layer grid search and LSTM | |
CN112115419A (zh) | 系统状态估计方法、系统状态估计装置 | |
CN112116198A (zh) | 数据驱动的流程工业状态感知网络关键节点筛选方法 | |
CN111709350B (zh) | 基于fcm聚类的低频振荡模态参数识别方法及系统 | |
CN112488171A (zh) | 一种变分模式分解的sru故障预测方法 | |
CN117609836A (zh) | 一种综合模块的电磁敏感预测与健康管理方法 | |
CN116665483A (zh) | 一种新的预测剩余停车位的方法 | |
CN114648060A (zh) | 基于机器学习的故障信号规范化处理及分类方法 | |
CN114563671A (zh) | 一种基于CNN-LSTM-Attention神经网络的高压电缆局部放电诊断方法 | |
CN112001115B (zh) | 一种半监督动态软测量网络的软测量建模方法 | |
CN113887717A (zh) | 一种基于深度学习预测神经网络训练时长的方法 | |
CN113837432A (zh) | 一种物理-数据联合驱动的电力系统频率预测方法 | |
Wang et al. | Continual deep residual reservoir computing for remaining useful life prediction | |
Chen et al. | Circuit parameter identification of degrading DC-DC converters based on physics-informed neural network | |
CN114021465A (zh) | 基于深度学习的电力系统鲁棒状态估计方法及系统 | |
Chen et al. | Gearbox fault diagnosis classification with empirical mode decomposition based on improved long short-term memory | |
Xuntao et al. | A Method for Remaining Useful Life Prediction of Transformer Based on the CNN-LSTM Networks | |
CN114841000B (zh) | 一种基于模态共有特征分离的软测量建模方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |