CN116382071A - 深度学习网络修正补偿的气动参数智能辨识方法 - Google Patents

深度学习网络修正补偿的气动参数智能辨识方法 Download PDF

Info

Publication number
CN116382071A
CN116382071A CN202310081892.1A CN202310081892A CN116382071A CN 116382071 A CN116382071 A CN 116382071A CN 202310081892 A CN202310081892 A CN 202310081892A CN 116382071 A CN116382071 A CN 116382071A
Authority
CN
China
Prior art keywords
output
deep learning
layer
input
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310081892.1A
Other languages
English (en)
Other versions
CN116382071B (zh
Inventor
刘凯
臧剑文
杨大鹏
王小也
段俊屹
安帅斌
闫明
金泽宇
刘浩
赵亦卓
王健权
梁玉峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University of Technology
Original Assignee
Dalian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University of Technology filed Critical Dalian University of Technology
Priority to CN202310081892.1A priority Critical patent/CN116382071B/zh
Publication of CN116382071A publication Critical patent/CN116382071A/zh
Application granted granted Critical
Publication of CN116382071B publication Critical patent/CN116382071B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Automation & Control Theory (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明属于飞行器控制技术领域,涉及一种深度学习网络修正补偿的气动参数智能辨识方法。本发明首先考虑神经网络的智能参数辨识方法,根据地面试验数据离线训练深度学习网络。其次根据离线训练好的网络映射力/力矩系数并与系数的观测值作差,进行递推最小二乘增量辨识补偿。再根据真实飞行状态采集的数据离线修正深度学习网络,进而使得修正后的神经网络映射力/力矩系数更贴近真实值。在保证参数估计精度的同时,保障参数估计的快速性。最后,通过某型飞机模型开展了智能参数辨识及对比分析工作,结果表明离线训练/在线补偿/离线修正的辨识吻合较好,且与传统辨识方法相比计算效率高,具有广阔的应用前景。

Description

深度学习网络修正补偿的气动参数智能辨识方法
技术领域
本发明属于飞行器气动参数智能辨识领域,涉及一种深度学习网络修正补偿的气动参数智能辨识方法。
背景技术
随着航空航天飞行器的发展,飞行器在各类任务方面的需求也与日俱增,对其控制的稳定性、收敛速度、精确性以及抗干扰性能等要求越来越重视。由于各类飞行器飞行环境复杂,飞行高度和飞行速度跨度大,特别是高超声速飞行器会面临气动热特性的变化,因此描述飞行器在飞行过程中的气动力/力矩模型也复杂多样,特别是强非线性、强耦合等原因,获得精确的表达模型非常困难。因此,如果能实时辨识出飞行器在飞行过程中的气动参数,就能有效地提升控制稳定性和精确性,增强系统的适应性和鲁棒性。
一般来说,飞行器气动参数辨识通常是基于模型的参数辨识:首先根据飞行器特性和力学基本规律,采用推理方法,建立系统动力学方程组—状态方程组。然后利用系统试验或系统运行中测得的输入和输出数据,辨识出动力学方程组中的气动因素,包括建立气动力数学模型,并辨识出气动力数学模型的待定参数。此类基于模型的常规辨识方法适用于离线气动参数辨识问题,包括基于气动数据插值表的气动系数、气动导数及配平舵偏角参数化模型的离线辨识技术,以及基于历史飞行试验数据的气动系数、气动导数、配平舵偏角模型的修正技术。所涉及的算法包括极大似然法、最小二乘方法和如粒子群优化、混合遗传算法等智能优化算法。通常来说,不依靠系统模型的参数辨识相对基于系统模型的参数辨识来说,在算法效率、辨识精度上都处于劣势,随着人工智能特别是深度学习网络的发展,通过机器学习的方式得到逼近真实系统模型的训练模型的辨识方法,获得了新一轮关注,在诸如气动参数辨识等方面成为了新的研究方向。刘晓东等人运用基于BP神经网络的模型参考自适应控制方法设计姿态控制器,通过BP神经网络对PID控制参数进行自主调节,实现控制器的输出逼近参考模型的输出,完成自适应控制设计。但是,其飞行性能需要依赖参考模型的选取,且没有给出不同参考模型下飞行性能的差异。朱海洋等人提出基于径向基神经网络(RBF)的容错控制方法,利用RBF神经网络,在线辨识并补偿火箭动力学模型中控制量以外的变化值,有效解决发动机推力下降故障下姿态稳定的问题。但是,RBF神经网络相比于BP神经网络结构复杂,计算效率较低。
飞行器系统辨识可定义为根据输入和输出的测量结果确定飞行器气动参数的模型结构,例如飞行器的气动力和气动力矩,以及估计包含在这些模型结构中的未知参数。在许多实际应用中,假设气动力和力矩的模型结构已知,系统辨识问题简化为参数估计。最常见的情况是气动力和力矩对状态和输入的当前值具有线性依赖性,产生线性定常数学模型。飞行器系统辨识主要是为了建立气动力和力矩相对测变量(如操纵面偏度、飞行器角速度、空速或马赫数,以及飞行器相对于风的方向)的数学模型。当数学模型是参数模型时,气动参数定量描述气动力和力矩对测量的依赖关系。目前针对飞行器气动参数的深度学习网络辨识方法鲜有提及。
发明内容
为解决上述问题,辨识得到飞行器的气动参数,本发明将飞行器气动参数辨识与深度学习网络结合,提供一种深度学习网络修正补偿的气动参数智能辨识方法,基于地面试验数据离线训练深度学习网络,旨在建立飞行状态数据与飞行器气动参数的映射关系,网络训练数据对由飞行状态数据和力/力矩系数构成;根据离线训练好的网络映射气动参数并与系数的观测值作差,进行递推最小二乘增量辨识补偿;根据真实飞行状态采集的数据离线修正深度学习网络,采用修正输出层至隐含层、隐含层至输入层各权重的方法,进而使得修正后的深度学习网络映射气动参数更贴近真实值。本发明将深度学习网络与飞行器气动参数辨识相结合,利用深度学习网络可以逼近任意函数的特点,可以有效解决气动参数辨识问题,提高计算效率。
本发明的技术方案:
一种深度学习网络修正补偿的气动参数智能辨识方法,具体步骤如下:
(1)基于地面试验数据训练离线深度学习网络
(1.1)确定气动参数辨识深度学习网络的输入量和期望输出量
给定训练集,设x=[x1,x2,…,xn]T为深度学习网络的输入值,设z=[z1,z2,…,zn]T为深度学习网络的输出值。输入值和输出值均为CFD或风洞试验得到的地面试验数据对,包括:飞行状态数据为深度学习网络的输入量x=[α,β,δzfz,V,H]T,各气动参数为深度学习网络的期望输出量z=[mz,my,mx,CL,CD]T。其中,α为迎角,β为侧滑角,δz为舵偏角,δf为襟翼偏角,ωz为俯仰角速率,V为飞行器飞行速度,H为飞行器飞行高度,mz为俯仰力矩系数,my为偏航力矩系数,mx为滚转力矩系数,CL为升力系数,CD为阻力系数;其中,对俯仰力矩系数mz和升力系数CL进行气动参数辨识。
另外,输入输出数据要遵循归一化原则,其目的是消除各维数据间的数量级差别,将输入与输出分别归一化,使得输入参数同等重要,避免数量级差别较大而造成网络预测误差较大,并且能够缩短训练时间。输入层的输入量x的归一化方法为:
Figure BDA0004067690020000031
式中,
Figure BDA0004067690020000041
与/>
Figure BDA0004067690020000042
分别代表归一化范围的最大值与最小值,归一化范围为[-1,1];xmax与xmin分别为各维数据的最大值和最小值。同理,对输出层的期望输出量z进行同样的处理。
(1.2)深度学习网络权重矩阵W的修正方法
对于输出层z,其表达式为:
z=g(WTy+B0)
式中,g为激活函数;y为隐藏层神经元,y=[y1,y2,…,ym]T;W为隐藏层到输出层的权值矩阵;wjk表示隐藏层第j个神经元对输出层第k个神经元之间的连接权值,则W可以被写为:
Figure BDA0004067690020000043
隐藏层到输出层的阈值B0表达式为:B0=[bw1 bw2…bwl]T
对于隐藏层的输出可以写为:y=f(VTx+B1)
式中f为激活函数;x为输入层神经元,x=[x1,x2,…,xn]T;V为输入层到隐藏层的权值矩阵,vij表示输入层第i个神经元对隐藏层第j个神经元之间的连接权值,可写为:
Figure BDA0004067690020000044
输入层到隐藏层的阈值B1表达式为:B1=[bv1 bv2…bvm]T
含有输入层-隐藏层-输出层3层的气动参数辨识深度学习网络,其表达式为:
z=g(WTf(VTx+B1)+B0)
(1.3)根据输入输出数据训练深度学习网络
深度学习网络可以看成一个非线性函数,其输入值与预测值可看作该函数的自变量与因变量。当输入节点数为n,输出节点数为l时,深度学习网络就相当于从n个自变量到l个因变量的函数映射关系。
训练深度学习网络的过程,是不断修正网络输出
Figure BDA0004067690020000051
与期望输出z=[mz,my,mx,CL,CD]T的过程,将误差信号/>
Figure BDA0004067690020000052
从输出端反向传播,并在传播过程中不断修正权重矩阵W,直到输出端输出/>
Figure BDA0004067690020000053
与期望值z=[mz,my,mx,CL,CD]T逼近到一定程度为止,衡量逼近程度的参数是goal,是根据仿真意愿自主设置的,一般为10-7数量级。对数据样本完成网络权系数W调整后,再送入另一组数据样本xi=[αiizifizi,Vi,Hi]T进行类似学习,直到完成所有数据样本的训练学习为止,最终得到动力学深度学习网络模型。
其中,深度学习网络目标函数采用均方误差和的指标衡量。对某一次训练例(xk,zk),其均方误差Ek为:
Figure BDA0004067690020000054
则所有训练例的总误差MSE为:
Figure BDA0004067690020000055
式中p为训练样本数。
深度学习网络采用L-M(Levenberg-Marquardt)算法进行训练,其形式如下:
△x=-H-1(x)g(x)
式中△x为迭代值的变化量,H(x)为函数的Hessian矩阵,g(x)为梯度。此时,梯度与函数的Hessian矩阵可以表示为:
Figure BDA0004067690020000056
其中,x=(v11,v12…vij,bv1…bvj,w11…wjk,bw1…bwk)T,e(x)为关于x的实函数e1(x1,…,xn),…,em(x1,…,xn),,
Figure BDA0004067690020000061
J(x)为函数的雅可比矩阵:
Figure BDA0004067690020000062
L-M算法通过对Hessian矩阵的近似逼近,计算每一步的△x以更新x,其中△x为:△x=[JT(x)J(x)+μI]-1JT(x)e(x)
应用L-M方法对所有数据重复进行反向误差传播算法,调节各层的权值和阈值,完成对深度学习网络的训练。
(2)气动参数模型误差增量辨识补偿
由于离线训练深度学习网络的数据对是根据CFD或者风洞试验得到的,因此与真实的数据存在较大的误差,且深度学习网络映射的气动参数也存在相应的误差。为提高气动参数在线辨识的精度,将飞行过程中的观测值与离线深度学习网络的映射值作差,进行气动模型的误差增量辨识补偿,将误差增量补偿到离线深度学习网络的映射值上,得到更加精准的气动参数值。
为得到气动参数的增量,使用最小二乘模型Z=Hθ+v来解决在气动参数辨识问题。其中,Z表示N阶矢量,θ表示n+1阶未知参数矢量,H表示N×(n+1)阶由单位矢量和回归量组成的测量矩阵,v表示N阶测量误差矢量。
假设离线深度学习网络映射得到的俯仰力矩系数为mz,在线实时辨识过程中,根据实时飞行状态数据拟合得到气动参数
Figure BDA0004067690020000063
即俯仰力矩系数的标称值为/>
Figure BDA0004067690020000064
Figure BDA0004067690020000071
其中,Jyy、Jxx、Jzz、Jxz为飞行器绕某轴的转动惯量,S为机翼参考面积,b为翼展,
Figure BDA0004067690020000072
为动压,ωx、ωy、ωz为旋转角速度,/>
Figure BDA0004067690020000073
为俯仰旋转角加速度。
俯仰力矩系数的增量为
Figure BDA0004067690020000074
将增量补偿作为递推最小二乘的输入进行补偿项辨识。根据递推最小二乘模型,对给定的Z=△mz
Figure BDA0004067690020000075
的“最佳”估计值是通过使测量输出和模型输出之间误差平方的加权和最小而得出:
Figure BDA0004067690020000076
其中,△X为变量X的变化量,α为迎角,δz为舵偏角,δf为襟翼偏角,mz为俯仰力矩系数,
Figure BDA0004067690020000077
为静稳定系数,/>
Figure BDA0004067690020000078
为阻尼系数,/>
Figure BDA0004067690020000079
为舵面效率。
矩阵θ的解法是让最小二乘方差最小,即让J(θ)关于θ的导数为0即可。
因此:
Figure BDA00040676900200000710
可得,θ=(HTH)-1HTZ。所以确定
Figure BDA00040676900200000711
其中q为动压,/>
Figure BDA00040676900200000712
为平均气动弦长。
使用递推最小二乘,首先要利用已知观测量和输出量算出一个递推所需要的初值。在已知k时刻之前所有的观测和输出时,记B(k)=HT(k)×H(k),则前k时刻所估计的参数为:
θ(k)=B(-1)(k)×HT(k)×Y(k)
若测量噪声的方差为Rv∈Rm×m,则估计值的协方差阵为:
Figure BDA00040676900200000713
记,信息矩阵为P(k)=B(-1)(k)
在实际使用的过程中,随着信息的增加,信息矩阵的正定性不断减小,对新的信息改进作用逐步等于零,这一现象称为数据饱和现象。为解决这一问题,提出了引入遗忘因子ρ的递推算法:
K(k)=P(k)×HT(k+1)×[ρ2×I+H(k+1)×P(k)×HT(k+1)]-1
Figure BDA0004067690020000081
Figure BDA0004067690020000082
式中,
Figure BDA0004067690020000083
是待估计参数的估计值组成的矩阵,K(k)是关于信息矩阵和测量矩阵的递推函数。经递推最小二乘辨识后,若补偿项的俯仰力矩系数辨识收敛值为/>
Figure BDA0004067690020000084
则基于在线增量补偿动力学辨识方法的俯仰力矩系数的辨识值为
Figure BDA0004067690020000085
同理,在辨识升力系数的过程中,升力系数的标称值为
Figure BDA0004067690020000086
m为飞行器质量,ay为y轴方向上的加速度,/>
Figure BDA0004067690020000087
为动压,S为机翼参考面积。经递推最小二乘辨识后,若补偿项的升力系数辨识收敛值为/>
Figure BDA0004067690020000088
则基于在线增量补偿动力学辨识方法的升力系数的辨识值为/>
Figure BDA0004067690020000089
(3)离线深度学习网络权重的修正方法
在建立离线深度学习网络的基础上,通过离线网络输出值与在线计算标称值作差得到气动参数增量,再经过递推最小二乘辨识算法计算得到各系数的增量值,最终将离线网络系数输出值与增量补偿值求和,得到气动参数智能补偿辨识算法的输出结果。
为进一步提高离线网络的映射精度,使其更贴合实际飞行状态,利用历史真实飞行数据对步骤(1)中离线训练的深度学习网络进行修正更新,一方面飞行过程中可避免深度学习网络在线训练计算量大耗时长的问题,利用高效时域辨识算法修正动力学参数,另一方面飞行试验数据可以用于地面神经网络迭代学习,持续进行训练与优化。
(3.1)建立损失函数
深度学习网络权重矩阵的更新要以损失函数J达到最小为导向,使深度学习网络离线映射的俯仰力矩系数或升力系数与标称俯仰力矩系数或升力系数之间的误差最小。
Figure BDA0004067690020000091
其中,r离线为离线深度学习网络的映射值,y标称为在线观测模型计算得到的标称值。
(3.2)深度学习网络隐含层至输出层权重矩阵WOH更新算法
权重矩阵的BP更新算法为反向的,因此首先需要更新隐含层至输出层的权重矩阵WOH
Figure BDA0004067690020000092
式中:采取负梯度方向,即
Figure BDA0004067690020000093
来寻求损失函数J的最小值;η为学习速率;这里增加了最后一项动量项,α为惯性系数;△WOH(k)为第k步的权重矩阵修正量。
第k+1步的权重矩阵修正量为:
Figure BDA0004067690020000094
上式中
Figure BDA0004067690020000095
是未知的,下面采用链式法则推导/>
Figure BDA0004067690020000096
的表达式:
Figure BDA0004067690020000097
其中,k为任意采样时刻对应的仿真步长,这里描述成离散的形式,以方便后续编写程序,y(k+1)为输入层的输入量,u(k)为修正控制量,上述方程中的xIo(k)是第k步输入层的输出向量,xIi(k)是第k步输入层的输入向量。
网络输入层的输出向量经过权重矩阵之后即网络隐含层的输入量,该输入量经过隐含层的激活函数便可以得到隐含层的输出量,描述为数学形式如下:
Figure BDA0004067690020000098
式中:xHo(k)是第k步隐含层的输出,xHi(k)是第k步隐含层的输入;WHI(k)为输入层输出转为隐含层输入的权重矩阵;l(·)为隐含层的激活函数,规定为双曲正切S型函数Tanh,其表达式为:
Figure BDA0004067690020000101
网络隐含层的输出向量经过权重矩阵之后即网络输出层的输入量,该输入量经过输出层的激活函数便可以得到输出层的输出量,即神经网络的最终输出量。描述为数学形式如下:
Figure BDA0004067690020000102
式中:xOo(k)是第k步输出层的输出,xOi(k)是第k步输出层的输入;WOH(k)为隐含层输出转为输出层输入的权重矩阵;
Figure BDA0004067690020000103
为输出层的激活函数,规定为Sigmoid函数,表达式为:
Figure BDA0004067690020000104
链式法则推导过程中,
Figure BDA0004067690020000105
e(k+1)=y标称(k+1)-r离线(k+1)
Figure BDA0004067690020000106
化简为符号函数表示,即:
Figure BDA0004067690020000107
由符号函数代替
Figure BDA0004067690020000108
产生的偏差由学习速率η和惯性系数α进行补偿。对于正常布局的飞行器来说,如果控制量u(k)是舵偏,则/>
Figure BDA0004067690020000109
恒成立;因为控制量u(k)是力矩,则/>
Figure BDA00040676900200001010
且/>
Figure BDA00040676900200001011
恒成立。
根据输出层激活函数,
Figure BDA00040676900200001012
根据
Figure BDA0004067690020000111
经过近似和替换,可化简为:
Figure BDA0004067690020000112
上式,xHo(k)是第k步隐含层的输出。
最终得到的
Figure BDA0004067690020000113
是一个3×nh维的矩阵,nh为隐含层的神经元个数。
那么,权重矩阵修正量△WOH就可以改写为:
△WOH(k+1)=ηδO[xHo(k)]T+α△WOH(k)
(3.3)深度学习网络输入层至隐含层权重矩阵WHI(k)更新算法
Figure BDA0004067690020000114
对比式△WOH(k+1)=ηδO[xHo(k)]T+α△WOH(k)发现,存在以下关系式:
Figure BDA0004067690020000115
所以,第k+1步的输入层至隐含层的权重矩阵修正量△WHI可以写为:
△WHI(k+1)=-ηξH[xIo(k)]T+α△WHI(k)=ηδH[xIo(k)]T+α△WHI(k)
其中,
Figure BDA0004067690020000116
本发明的有益效果:
本发明可避免在飞行过程中深度学习网络在线训练计算量大耗时长的问题,可以利用高效时域辨识算法修正动力学参数,另外历史飞行试验数据可以用于地面深度学习网络迭代学习,持续进行训练与优化。
相比于传统的最小二乘辨识方法,面向深度学习网络修正补偿的气动参数智能辨识方法,相对误差更小,辨识的精度和效率更高,比传统递推最小二乘辨识方法有更好的控制性能,具有广阔的应用前景。
附图说明
图1是深度学习网络修正补偿的气动参数智能辨识方法流程图;
图2是基于地面试验数据的地面训练网络结构;
图3中(a)~(e)分别是迎角、襟翼偏角、舵偏角、高度和速度的变化曲线;
图4中(a)~(d)分别是训练集、验证集、测试集、总集合的拟合度示意图;
图5是离线深度学习网络测试集均方差;
图6中(a)和(b)分别是俯仰力矩系数增量以及增量补偿俯仰力矩系数辨识值和真实值;
图7中(a)和(b)分别是升力系数增量以及增量补偿升力系数辨识值和真实值;
图8是在线补偿与直接辨识俯仰力矩系数结果对比;
图9是在线补偿与直接辨识升力系数结果对比;
图10中(a)和(b)分别是修正网络与原始网络俯仰力矩系数对比以及俯仰力矩系数映射误差对比;
图11中(a)和(b)分别是修正网络与原始网络升力系数对比以及升力系数映射误差对比;
图12中(a)和(b)分别是修正网络与传统方法俯仰力矩系数对比以及俯仰力矩系数映射误差对比;
图13中(a)和(b)分别是修正网络与传统方法升力系数对比以及升力系数映射误差对比。
具体实施方式
以下结合附图和技术方案,进一步说明本发明的具体实施方式。
为验证本发明中所提出方法的有效性,以某飞行器为例,选取其在高度500m、速度80m/s飞行状态下的数据分别从离线深度学习网络的搭建,气动参数的增量补偿,离线网络修正辨识,进行仿真对比分析。飞行器数据如下:
表1仿真参数
Figure BDA0004067690020000131
1.构建深度学习网络仿真结果及分析
基于飞行状态数据搭建离线深度学习网络,并训练迎角、舵偏角等飞行状态数据对俯仰力矩系数的映射关系深度学习网络。考虑到真实飞行过程中传感器采集数据存在误差,因此在仿真过程中加入20%的随机干扰模拟传感器采集误差,添加随机干扰后的飞行状态数据如图3所示。
通过拟合度R2、均方误差MSE来衡量离线深度学习网络的拟合效果,且拟合度R2越靠近1拟合效果越好,均方误差MSE越小拟合效果越好。根据地面飞行状态数据搭建离线深度学习网络,拟合度R2为0.99587,训练数据的均方差为10-7,说明离线建立的深度学习网络对待估参数的拟合映射效果好,网络训练仿真结果如图4和图5所示。
2.气动参数增量补偿仿真结果及分析
在离线建立深度学习网络的基础上,在线对飞行器气动参数增量进行补偿辨识。通过在线补偿后的力/力矩系数辨识精度明显提升,基本与真实值吻合,表明该方法可应用于在线辨识过程。在线补偿的结果如表2所示,直接辨识的结果如表3所示,仿真结果如图6、图7所示,在线补偿与直接辨识仿真结果如图8、图9所示。
表2在线补偿结果
Figure BDA0004067690020000141
表3直接辨识结果
Figure BDA0004067690020000142
3.离线网络修正辨识与传统辨识仿真及分析
由于离线风洞试验数据或CFD仿真数据不能反映真实飞行情况,因此需要根据试飞数据对深度学习网络模型进行修正。俯仰力矩系数的相对误差结果如表4所示,仿真结果如图10所示。升力系数的相对误差结果如表5所示,仿真结果如图11所示。
表4俯仰力矩系数相对误差
Figure BDA0004067690020000143
表5升力系数相对误差
Figure BDA0004067690020000144
由于原始深度学习网络的训练数据是通过地面试验获得,且与真实飞行数据存在较大的差异。因此,根据原始深度学习网络映射得到的俯仰力矩系数与真实值的相对误差为22.65%;通过高精度的飞行数据修正原始深度学习网络后,很大程度上提高了映射力/力矩系数的精度。离线网络修正与递推最小二乘力矩系数辨识结果如表6所示,仿真结果如图12、图13所示。
表6离线网络修正与递推最小二乘力矩系数辨识结果
Figure BDA0004067690020000151
离线网络修正和递推最小二乘的辨识方法都有较高的精度,但离线网络修正的智能辨识方法随着数据样本的增多,辨识结果更接近真实值。
本发明是一种深度学习网络修正补偿的气动参数智能辨识方法,实施例中是对某飞行器着陆过程的俯仰力矩系数和升力系数进行辨识。采用CFD/风洞试验数据离线训练深度学习网络,网络训练数据对由飞行状态数据和气动参数构成。其次,基于递归正交时域算法,根据离线训练好的网络映射气动参数与系数的观测值,进行递推最小二乘增量辨识补偿;最后采用建立损失函数的方法,修正输出层至隐含层、隐含层至输入层各权重,根据真实飞行状态采集的数据离线修正深度学习网络,进而使得修正后的深度学习网络映射气动参数更贴近真实值。
通过深度学习网络与修正网络仿真结果可知,根据CFD/风洞飞行状态数据搭建离线深度学习网络,拟合度R2为0.99587,训练数据的均方差为10-7。且通过高精度的飞行数据修正原始深度学习网络后,很大程度上提高了映射力/力矩系数的精度,且随着飞行数据样本数量的增多,网络映射力/力矩系数越来越接近真实值。
通过气动参数增量补偿仿真结果可知,俯仰力矩系数和升力系数的增量收敛值稳定,通过在线补偿后的气动参数辨识精度明显提升,基本与真实值吻合,表明该方法可应用于在线辨识过程。
通过离线网络修正与传统辨识仿真,离线网络修正和递推最小二乘的辨识方法都有较高的精度,离线网络修正的相对误差为0.61%,递推最小二乘法的相对误差为1.36%。但离线网络修正的智能辨识方法随着数据样本的增多,辨识结果更接近真实值。

Claims (1)

1.一种深度学习网络修正补偿的气动参数智能辨识方法,其特征在于,具体步骤如下:
(1)基于地面试验数据训练离线深度学习网络
(1.1)确定气动参数辨识深度学习网络的输入量和期望输出量
给定训练集,设x=[x1,x2,…,xn]T为深度学习网络的输入值,设z=[z1,z2,…,zn]T为深度学习网络的输出值;输入值和输出值均为CFD或风洞试验得到的地面试验数据对,包括:飞行状态数据为深度学习网络的输入量x=[α,β,δzfz,V,H]T,各气动参数为深度学习网络的期望输出量z=[mz,my,mx,CL,CD]T;其中,α为迎角,β为侧滑角,δz为舵偏角,δf为襟翼偏角,ωz为俯仰角速率,V为飞行器飞行速度,H为飞行器飞行高度,mz为俯仰力矩系数,my为偏航力矩系数,mx为滚转力矩系数,CL为升力系数,CD为阻力系数;其中,对俯仰力矩系数mz和升力系数CL进行气动参数辨识;
将输入与输出分别归一化;输入层的输入量x的归一化方法为:
Figure FDA0004067689960000011
式中,
Figure FDA0004067689960000012
与/>
Figure FDA0004067689960000013
分别代表归一化范围的最大值与最小值,归一化范围为[-1,1];xmax与xmin分别为各维数据的最大值和最小值;同理,对输出层的期望输出量z进行同样的处理;
(1.2)深度学习网络权重矩阵W的修正方法
对于输出层z,其表达式为:
z=g(WTy+B0)
式中,g为激活函数;y为隐藏层神经元,y=[y1,y2,…,ym]T;W为隐藏层到输出层的权值矩阵;wjk表示隐藏层第j个神经元对输出层第k个神经元之间的连接权值,则W被写为:
Figure FDA0004067689960000021
隐藏层到输出层的阈值B0表达式为:B0=[bw1 bw2…bwl]T
对于隐藏层的输出写为:y=f(VTx+B1)
式中f为激活函数;x为输入层神经元,x=[x1,x2,…,xn]T;V为输入层到隐藏层的权值矩阵,vij表示输入层第i个神经元对隐藏层第j个神经元之间的连接权值,写为:
Figure FDA0004067689960000022
输入层到隐藏层的阈值B1表达式为:B1=[bv1 bv2…bvm]T
含有输入层-隐藏层-输出层3层的气动参数辨识深度学习网络,其表达式为:
z=g(WTf(VTx+B1)+B0)
(1.3)根据输入输出数据训练深度学习网络
训练深度学习网络的过程,是不断修正网络输出
Figure FDA0004067689960000024
与期望输出z=[mz,my,mx,CL,CD]T的过程,将误差信号/>
Figure FDA0004067689960000025
从输出端反向传播,并在传播过程中不断修正权重矩阵W,直到输出端输出/>
Figure FDA0004067689960000026
与期望值z=[mz,my,mx,CL,CD]T逼近到一定程度为止,衡量逼近程度的参数是goal;对数据样本完成网络权系数W调整后,再送入另一组数据样本xi=[αiizifizi,Vi,Hi]T进行学习,直到完成所有数据样本的训练学习为止,最终得到动力学深度学习网络模型;
其中,深度学习网络目标函数采用均方误差和的指标衡量;对某一次训练例(xk,zk),其均方误差Ek为:
Figure FDA0004067689960000023
则所有训练例的总误差MSE为:
Figure FDA0004067689960000031
式中p为训练样本数;
应用L-M方法对所有数据重复进行反向误差传播算法,调节各层的权值和阈值,完成对深度学习网络的训练;
(2)气动参数模型误差增量辨识补偿
为提高气动参数在线辨识的精度,将飞行过程中的观测值与离线深度学习网络的映射值作差,进行气动模型的误差增量辨识补偿,将误差增量补偿到离线深度学习网络的映射值上,得到更加精准的气动参数值;
为得到气动参数的增量,使用最小二乘模型Z=Hθ+v来解决在气动参数辨识问题;其中,Z表示N阶矢量,θ表示n+1阶未知参数矢量,H表示N×(n+1)阶由单位矢量和回归量组成的测量矩阵,v表示N阶测量误差矢量;
假设离线深度学习网络映射得到的俯仰力矩系数为mz,在线实时辨识过程中,根据实时飞行状态数据拟合得到气动参数
Figure FDA0004067689960000032
即俯仰力矩系数的标称值为/>
Figure FDA0004067689960000033
Figure FDA0004067689960000034
其中,Jyy、Jxx、Jzz、Jxz为飞行器绕某轴的转动惯量,S为机翼参考面积,b为翼展,
Figure FDA0004067689960000035
为动压,ωx、ωy、ωz为旋转角速度,/>
Figure FDA0004067689960000036
为俯仰旋转角加速度;
俯仰力矩系数的增量为
Figure FDA0004067689960000037
将增量补偿作为递推最小二乘的输入进行补偿项辨识;根据递推最小二乘模型,对给定的Z=△mz
Figure FDA0004067689960000038
的“最佳”估计值是通过使测量输出和模型输出之间误差平方的加权和最小而得出:
Figure FDA0004067689960000041
其中,△X为变量X的变化量,α为迎角,δz为舵偏角,δf为襟翼偏角,mz为俯仰力矩系数,
Figure FDA0004067689960000042
为静稳定系数,/>
Figure FDA0004067689960000043
为阻尼系数,/>
Figure FDA0004067689960000044
为舵面效率;
矩阵θ的解法是让最小二乘方差最小,即让J(θ)关于θ的导数为0即可;
因此:
Figure FDA0004067689960000045
可得,θ=(HTH)-1HTZ;所以确定
Figure FDA0004067689960000046
其中q为动压,/>
Figure FDA0004067689960000047
为平均气动弦长;
使用递推最小二乘,首先要利用已知观测量和输出量算出一个递推所需要的初值;在已知k时刻之前所有的观测和输出时,记B(k)=HT(k)×H(k),则前k时刻所估计的参数为:
θ(k)=B(-1)(k)×HT(k)×Y(k)
若测量噪声的方差为Rv∈Rm×m,则估计值的协方差阵为:
Figure FDA0004067689960000048
记,信息矩阵为P(k)=B(-1)(k)
为解决数据饱和现象问题,提出引入遗忘因子ρ的递推算法:
K(k)=P(k)×HT(k+1)×[ρ2×I+H(k+1)×P(k)×HT(k+1)]-1
Figure FDA0004067689960000049
Figure FDA00040676899600000410
式中,
Figure FDA00040676899600000411
是待估计参数的估计值组成的矩阵,K(k)是关于信息矩阵和测量矩阵的递推函数;经递推最小二乘辨识后,若补偿项的俯仰力矩系数辨识收敛值为/>
Figure FDA00040676899600000412
则基于在线增量补偿动力学辨识方法的俯仰力矩系数的辨识值为/>
Figure FDA00040676899600000413
同理,在辨识升力系数的过程中,升力系数的标称值为
Figure FDA00040676899600000414
m为飞行器质量,ay为y轴方向上的加速度,/>
Figure FDA0004067689960000051
为动压,S为机翼参考面积;经递推最小二乘辨识后,若补偿项的升力系数辨识收敛值为/>
Figure FDA0004067689960000052
则基于在线增量补偿动力学辨识方法的升力系数的辨识值为
Figure FDA0004067689960000053
(3)离线深度学习网络权重的修正方法
为进一步提高离线网络的映射精度,使其更贴合实际飞行状态,利用历史真实飞行数据对步骤(1)中离线训练的深度学习网络进行修正更新,具体如下:
(3.1)建立损失函数
深度学习网络权重矩阵的更新以损失函数J达到最小为导向,使深度学习网络离线映射的俯仰力矩系数或升力系数与标称俯仰力矩系数或升力系数之间的误差最小;
Figure FDA0004067689960000054
其中,r离线为离线深度学习网络的映射值,y标称为在线观测模型计算得到的标称值;
(3.2)深度学习网络隐含层至输出层权重矩阵WOH更新算法
权重矩阵的BP更新算法为反向的,因此首先需要更新隐含层至输出层的权重矩阵WOH
Figure FDA0004067689960000055
式中:采取负梯度方向,即
Figure FDA0004067689960000056
来寻求损失函数J的最小值;η为学习速率;α为惯性系数;△WOH(k)为第k步的权重矩阵修正量;
第k+1步的权重矩阵修正量为:
Figure FDA0004067689960000057
式中
Figure FDA0004067689960000058
是未知的,采用链式法则推导/>
Figure FDA0004067689960000059
的表达式:
Figure FDA00040676899600000510
其中,k为任意采样时刻对应的仿真步长,这里描述成离散的形式,以方便后续编写程序,y(k+1)为输入层的输入量,u(k)为修正控制量,xIo(k)是第k步输入层的输出向量,xIi(k)是第k步输入层的输入向量;
网络输入层的输出向量经过权重矩阵之后即网络隐含层的输入量,该输入量经过隐含层的激活函数得到隐含层的输出量,描述为数学形式如下:
Figure FDA0004067689960000061
式中:xHo(k)是第k步隐含层的输出,xHi(k)是第k步隐含层的输入;WHI(k)为输入层输出转为隐含层输入的权重矩阵;
Figure FDA0004067689960000068
为隐含层的激活函数,规定为双曲正切S型函数Tanh,其表达式为:
Figure FDA0004067689960000062
网络隐含层的输出向量经过权重矩阵之后即网络输出层的输入量,该输入量经过输出层的激活函数得到输出层的输出量,即神经网络的最终输出量;描述为数学形式如下:
Figure FDA0004067689960000063
式中:xOo(k)是第k步输出层的输出,xOi(k)是第k步输出层的输入;WOH(k)为隐含层输出转为输出层输入的权重矩阵;
Figure FDA0004067689960000064
为输出层的激活函数,规定为Sigmoid函数,表达式为:
Figure FDA0004067689960000065
链式法则推导过程中,
Figure FDA0004067689960000066
e(k+1)=y标称(k+1)-r离线(k+1)
Figure FDA0004067689960000067
化简为符号函数表示,即:
Figure FDA0004067689960000071
由符号函数代替
Figure FDA0004067689960000072
产生的偏差由学习速率η和惯性系数α进行补偿;对于飞行器来说,如果控制量u(k)是舵偏,则/>
Figure FDA0004067689960000073
恒成立;因为控制量u(k)是力矩,则/>
Figure FDA0004067689960000074
且/>
Figure FDA0004067689960000075
恒成立;
根据输出层激活函数,
Figure FDA0004067689960000076
根据
Figure FDA0004067689960000077
经过近似和替换,化简为:
Figure FDA0004067689960000078
上式,xHo(k)是第k步隐含层的输出;
最终得到的
Figure FDA0004067689960000079
是一个3×nh维的矩阵,nh为隐含层的神经元个数;
那么,权重矩阵修正量△WOH改写为:
△WOH(k+1)=ηδO[xHo(k)]T+α△WOH(k)
(3.3)深度学习网络输入层至隐含层权重矩阵WHI(k)更新算法
Figure FDA00040676899600000710
对比式△WOH(k+1)=ηδO[xHo(k)]T+α△WOH(k),存在以下关系式:
Figure FDA00040676899600000711
所以,第k+1步的输入层至隐含层的权重矩阵修正量△WHI写为:
△WHI(k+1)=-ηξH[xIo(k)]T+α△WHI(k)=ηδH[xIo(k)]T+α△WHI(k)
其中,
Figure FDA00040676899600000712
CN202310081892.1A 2023-02-08 2023-02-08 深度学习网络修正补偿的气动参数智能辨识方法 Active CN116382071B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310081892.1A CN116382071B (zh) 2023-02-08 2023-02-08 深度学习网络修正补偿的气动参数智能辨识方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310081892.1A CN116382071B (zh) 2023-02-08 2023-02-08 深度学习网络修正补偿的气动参数智能辨识方法

Publications (2)

Publication Number Publication Date
CN116382071A true CN116382071A (zh) 2023-07-04
CN116382071B CN116382071B (zh) 2023-12-22

Family

ID=86977631

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310081892.1A Active CN116382071B (zh) 2023-02-08 2023-02-08 深度学习网络修正补偿的气动参数智能辨识方法

Country Status (1)

Country Link
CN (1) CN116382071B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117312779A (zh) * 2023-11-28 2023-12-29 中国船舶集团有限公司第七〇七研究所 一种基于深度学习的重力敏感器快速稳定测量方法
CN117908385A (zh) * 2024-03-19 2024-04-19 西北工业大学 基于参数辨识的飞行器滑模控制方法
CN117992761A (zh) * 2024-04-07 2024-05-07 西北工业大学 一种风力机叶片动态失速气动力智能预测方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170158347A1 (en) * 2015-12-08 2017-06-08 Rosemount Aerospace Inc. Synthetic air data output generation
CN109409431A (zh) * 2018-10-29 2019-03-01 吉林大学 基于神经网络的多传感器姿态数据融合方法及系统
CN110276144A (zh) * 2019-06-26 2019-09-24 哈尔滨工业大学 一种垂直起降运载器气动参数在线辨识方法
AU2020102874A4 (en) * 2020-10-19 2020-12-17 Alam, Mohammad Shabbir MR A recommendation model for aero dynamic design of structures using deep recurrent neural network
CN114004023A (zh) * 2021-10-26 2022-02-01 南京航空航天大学 一种基于循环神经网络的飞行器气动参数辨识的方法
CN114462149A (zh) * 2022-01-29 2022-05-10 哈尔滨逐宇航天科技有限责任公司 一种基于预训练与增量学习的飞行器气动参数辨识方法
CN115688288A (zh) * 2023-01-05 2023-02-03 西北工业大学 飞行器气动参数辨识方法、装置、计算机设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170158347A1 (en) * 2015-12-08 2017-06-08 Rosemount Aerospace Inc. Synthetic air data output generation
CN109409431A (zh) * 2018-10-29 2019-03-01 吉林大学 基于神经网络的多传感器姿态数据融合方法及系统
CN110276144A (zh) * 2019-06-26 2019-09-24 哈尔滨工业大学 一种垂直起降运载器气动参数在线辨识方法
AU2020102874A4 (en) * 2020-10-19 2020-12-17 Alam, Mohammad Shabbir MR A recommendation model for aero dynamic design of structures using deep recurrent neural network
CN114004023A (zh) * 2021-10-26 2022-02-01 南京航空航天大学 一种基于循环神经网络的飞行器气动参数辨识的方法
CN114462149A (zh) * 2022-01-29 2022-05-10 哈尔滨逐宇航天科技有限责任公司 一种基于预训练与增量学习的飞行器气动参数辨识方法
CN115688288A (zh) * 2023-01-05 2023-02-03 西北工业大学 飞行器气动参数辨识方法、装置、计算机设备及存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117312779A (zh) * 2023-11-28 2023-12-29 中国船舶集团有限公司第七〇七研究所 一种基于深度学习的重力敏感器快速稳定测量方法
CN117312779B (zh) * 2023-11-28 2024-02-06 中国船舶集团有限公司第七〇七研究所 一种基于深度学习的重力敏感器快速稳定测量方法
CN117908385A (zh) * 2024-03-19 2024-04-19 西北工业大学 基于参数辨识的飞行器滑模控制方法
CN117908385B (zh) * 2024-03-19 2024-05-24 西北工业大学 基于参数辨识的飞行器滑模控制方法
CN117992761A (zh) * 2024-04-07 2024-05-07 西北工业大学 一种风力机叶片动态失速气动力智能预测方法
CN117992761B (zh) * 2024-04-07 2024-06-11 西北工业大学 一种风力机叶片动态失速气动力智能预测方法

Also Published As

Publication number Publication date
CN116382071B (zh) 2023-12-22

Similar Documents

Publication Publication Date Title
CN116382071B (zh) 深度学习网络修正补偿的气动参数智能辨识方法
CN109946975B (zh) 一种未知伺服系统的强化学习最优跟踪控制方法
CN110806759B (zh) 一种基于深度强化学习的飞行器航线跟踪方法
CN109885883B (zh) 一种基于gk聚类算法模型预测的无人车横向运动的控制方法
CN108710303B (zh) 含有多源扰动及执行器饱和的航天器相对姿态控制方法
CN110908281A (zh) 无人直升机姿态运动有限时间收敛强化学习控制方法
CN114281092B (zh) 一种基于滑模干扰观测器的高超声速飞行器协调姿态控制方法
CN111650830A (zh) 一种基于迭代学习的四旋翼飞行器鲁棒跟踪控制方法
CN109884887B (zh) 一种基于自校正小波神经网络的连续回转马达控制方法
CN113377121B (zh) 一种基于深度强化学习的飞行器智能抗扰动控制方法
Das et al. Neural partial differential method for extracting aerodynamic derivatives from flight data
CN116460860B (zh) 一种基于模型的机器人离线强化学习控制方法
CN116560223A (zh) 一种基于物理信息神经网络的智能车辆动力学模型、ilqr控制算法及轨迹跟踪控制器
CN115220467A (zh) 一种基于神经网络增量动态逆的飞翼飞行器姿态控制方法
CN116661307A (zh) 非线性系统执行器故障ppb-siadp容错控制方法
Bao et al. Data-driven based model-free adaptive optimal control method for hypersonic morphing vehicle
CN116755337A (zh) 基于长短时记忆神经网络线性自抗扰控制的高超声速飞行器容错控制方法
CN114462149B (zh) 一种基于预训练与增量学习的飞行器气动参数辨识方法
CN115048724A (zh) 一种基于b型样条的变体空天飞行器气动系数在线辨识方法
CN116360255A (zh) 一种非线性参数化高超声速飞行器的自适应调节控制方法
Kwad et al. Development of system identification from traditional concepts to real-time soft computing based
CN116774576A (zh) 基于神经网络间接估计的水下航行器动力学黑盒建模方法
Yuqi et al. Time-varying parameters estimation with adaptive neural network EKF for missile-dual control system
CN114186477A (zh) 一种基于Elman神经网络的轨道预测算法
Ghosh Roy et al. Longitudinal aircraft parameter estimation using neuro-fuzzy and genetic algorithm based method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant