CN116755337A - 基于长短时记忆神经网络线性自抗扰控制的高超声速飞行器容错控制方法 - Google Patents
基于长短时记忆神经网络线性自抗扰控制的高超声速飞行器容错控制方法 Download PDFInfo
- Publication number
- CN116755337A CN116755337A CN202310722053.3A CN202310722053A CN116755337A CN 116755337 A CN116755337 A CN 116755337A CN 202310722053 A CN202310722053 A CN 202310722053A CN 116755337 A CN116755337 A CN 116755337A
- Authority
- CN
- China
- Prior art keywords
- hypersonic aircraft
- angle
- attack
- observer
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 61
- 230000015654 memory Effects 0.000 title claims abstract description 50
- 238000000034 method Methods 0.000 title claims abstract description 44
- 230000001133 acceleration Effects 0.000 claims description 10
- 238000013016 damping Methods 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 6
- 230000003044 adaptive effect Effects 0.000 claims description 4
- 238000000354 decomposition reaction Methods 0.000 claims description 4
- 230000005484 gravity Effects 0.000 claims description 3
- 125000004122 cyclic group Chemical group 0.000 claims description 2
- 238000005259 measurement Methods 0.000 claims description 2
- 238000005096 rolling process Methods 0.000 claims description 2
- 238000011217 control strategy Methods 0.000 abstract description 5
- 230000008569 process Effects 0.000 abstract description 5
- 230000002159 abnormal effect Effects 0.000 abstract description 4
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000013178 mathematical model Methods 0.000 abstract description 2
- 238000012937 correction Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 206010033799 Paralysis Diseases 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001808 coupling effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 229920001971 elastomer Polymers 0.000 description 1
- 239000000806 elastomer Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种基于长短时记忆神经网络线性自抗扰控制的高超声速飞行器容错控制方法,包括建立高超声速飞行器的数学模型以及执行器故障的模型,包括其动力学模型和运动学模型;采用线性自抗扰控制技术设计控制器,针对高超声速飞行器可能出现的执行器故障和异常情况设计相应的容错控制策略,将线性自抗扰控制器和容错控制策略集成到高超声速飞行器的控制系统中;在飞行过程中,线性扩张状态观测器会不断评估当前飞行状态以及总扰动情况,根据实时控制需求和故障情况,利用长短时记忆神经网络自动调整观测器和控制器参数,确保高超声速飞行器的安全运行。
Description
技术领域
本发明涉及高超声速飞行器控制系统、容错控制领域,具体涉及一种基于长短时记忆神经网络线性自抗扰控制的高超声速飞行器容错控制方法。
背景技术
随着科技的快速发展,高超声速飞行器在军事、航空、空间探测等领域具有广泛的应用前景。高超声速飞行器在飞行过程中需要面对复杂的气动环境和高度不确定性,这使得高超声速飞行器的控制系统设计具有很高的挑战性。传统的控制方法往往无法满足高超声速飞行器在复杂环境下的控制要求,因此研究一种新型的容错控制方法具有重要意义。
高超声速飞行器飞行时存在多种因素的影响,例如不确定性、未建模动态、耦合影响、参数摄动以及干扰故障等。线性自抗扰控制可将这些影响视为“总和干扰”,并通过扩张状态观测器进行观测补偿来应对。与普通低速飞行器不同,高超声速飞行器中各气动参数项均与攻角和马赫数有关,并且包含了由气动参数摄动引起的不确定性,从而增强了通道间的耦合。通过选择适当的线性自抗扰控制器参数,可以获得良好的品质和跟踪性能,并且能够克服“总和干扰”以及大范围的气动参数摄动影响,具备较强的鲁棒性。
尽管线性自抗扰控制可以实现对高超声速飞行器飞行状态以及故障信息的观测,但效果的优劣取决于参数的整定。较好的参数设计可以带来预期的控制效果,但当参数设计较差时,对于环境的适应能力会大幅降低,进而导致整个控制系统的瘫痪。在高超声速飞行器容错控制中,需要在线调整控制器的参数,以实现提高控制器环境适应性目的,基于长短时记忆神经网络线性自抗扰控制的高超声速飞行器容错控制方法需兼具精度、可靠性以及时效性。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提出了一种基于长短时记忆神经网络线性自抗扰控制的高超声速飞行器容错控制。
实现本发明的技术解决方案为:一种基于长短时记忆神经网络线性自抗扰控制的高超声速飞行器容错控制方法,包括以下步骤:
步骤S1:将飞行器的气动参数输入离线训练好的神经网络得到高超声速飞行器的建模参数;
步骤S2:根据气动参数建立高超声速飞行器质心运动的动力学模型和绕质心转动的动力学模型;
步骤S3:采用线性自抗扰控制器作为高超声速飞行器的控制器,并进行误差更新;
步骤S4:通过长短时记忆神经网络进行观测器参数以及控制器参数的在线自适应更新。
优选地,所述飞行器的气动参数包括:高超声速飞行器速度V,推力P,攻角α,空气阻力X,质量m,重力加速度g,θ弹道倾斜角,高超声速飞行器的升力Y,地球半径R,飞行高度y,ωx是俯仰角速度,M是俯仰力矩,lx是俯仰转动惯量,是俯仰角。
优选地,所述气动参数包括力系数、力矩系数相对飞行状态量的导数,所述飞行状态量包括攻角、马赫数、舵偏角。
优选地,所述高超声速飞行器质心运动的动力学模型和绕质心转动的动力学模型具体为:
高超声速飞行器质心运动的动力学方程:
式中:q、S分别为动压、高超声速飞行器的特征面积,m为高超声速飞行器质量,重力加速度g,高超声速飞行器发动机推力P,飞行速度V,飞行加速度攻角α,侧滑角β,俯仰角/>倾侧角γv,cx、/>分别为阻力系数、升力系数对攻角的倒数、升力系数对俯仰角的倒数,δz,δy分别为俯仰舵舵偏角、偏航舵舵偏角,/>分别为侧向力系数对侧滑角的导数、侧向力系数对偏航舵的导数,ωVz为速度坐标系相对于地面坐标系z轴分解后的转动角速度,ωVy为速度坐标系相对于地面坐标系y轴分解后的转动角速度;
高超声速飞行器绕质心转动的动力学方程:
式中:q、S分别为动压、高超声速飞行器的特征面积,L为高超声速飞行器的参考长度,飞行速度V,攻角α,侧滑角β,侧滑角速度ωx ωy ωz分别为高超声速飞行器绕质心xy z轴转动的角速度,/>分别为高超声速飞行器绕质心x y z轴转动的角加速度,分别为副翼、偏航舵、俯仰舵的操纵力矩系数,/>分别为无因次滚转、偏航、俯仰阻尼力矩系数,/>分别为偏航力矩系数对侧滑角的导数、无因次偏航下阻尼力矩系数/>分别为俯仰力矩系数对攻角的导数、无因次俯仰下阻尼力矩系数。
优选地,采用线性自抗扰控制器作为高超声速飞行器的控制器,并进行误差更新和测量更新的具体步骤为:
步骤S31:设定线性自抗扰控制器中线性扩张状态观测器的带宽初始值,状态误差反馈的控制参数初始值;
步骤S32:根据线性扩张状态观测器的带宽确定线性扩张状态观测器对于攻角角度的观测估计值,对于攻角角速度的观测估计值,以及对于故障信息以及内外扰动的总估计值;
步骤S33:将扩张状态观测器的输出分别与输入信号攻角角度以及输入信号的微分攻角角速度作差值,得到相应误差;根据状态误差反馈的控制参数确定作用到高超声速飞行器上面的舵面角度控制量。
优选地,根据线性扩张状态观测器的带宽确定线性扩张状态观测器对于攻角角度的观测估计值,对于攻角角速度的观测估计值,以及对于故障信息以及内外扰动的总估计值具体公式为:
其中:
x1为期望攻角角度,z1为观测器对于攻角角度的观测估计值,为观测器对于攻角角速度的观测估计值,z2为观测器对于攻角角速度的观测估计值,/>为观测器对于攻角角加速度的观测估计值,z3为观测器对于故障信息以及内外扰动的总估计值,/>为观测器对于故障信息以及内外扰动的总估计值的导数,b0为观测器增益,δα为输入到高超声速飞行器模型的舵面控制量,ωo为观测器带宽。
优选地,根据状态误差反馈的控制参数确定作用到高超声速飞行器上面的舵面角度控制量,具体公式为:
式中,x1为输入信号即期望攻角角度,x2为输入信号即攻角角速度,b为控制器增益,δα为状态误差反馈的输出值即输入到高超声速飞行器模型的舵面控制量,z3为观测器对于故障信息以及内外扰动的总估计值,kp,kd为状态误差反馈的控制参数。
优选地,所述长短时记忆神经网络采用自适应矩估计优化算法进行优化,具体优化方法为:
计算梯度的一阶矩估计和二阶矩估计:
mt=β1mt-1+(1-β1)gt
其中,gt是当前时刻t的梯度,mt是梯度的一阶矩估计,vt是梯度的二阶矩估计,β1和β2是衰减率;
对一阶矩估计和二阶矩估计进行偏置校正:
根据偏置校正后的值更新参数:
其中,θt是参数向量,η是学习率,∈是取值为10-8。
优选地,通过长短时记忆神经网络进行观测器参数以及控制器参数的在线自适应更新的具体方法为:
根据当前时刻的期望输出与实际输出之间的误差值,确定性能指标,具体公式为:
式中,Ceq为性能指标,x1为输入信号即期望攻角角度,x2为输入信号即攻角角速度,z1为观测器对于攻角角度的观测估计值,z2为观测器对于攻角角速度的观测估计值,y为高超声速飞行器模型真实攻角值,为x1与z1差值的均方误差,/>为x2与z2差值的均方误差,/>为x1与y差值的均方误差,k表示当前时刻;
将性能指标与设定阈值作比较,如果性能指标小于设定阈值,则无需进行参数调整,将当前的线性扩张观测器的带宽参数以及状态误差反馈的控制参数作为飞行器线性自抗扰容错控制器的参数进行容错控制;否则,采用长短时记忆神经网络进行观测器参数以及控制器参数的更新,具体方法为:
将步骤3得到的误差以及神经网络偏差项1以及真实输出攻角角度作为长短时记忆神经网络的输入,长短时记忆神经网络通过输出门输出自适应更新后的参数值,输出门公式如下:
o(t)=σ(Uox(t)+Woh(t-1))
h(t)=tanh(s(t))o(t)
其中:o表示输出门输出,σ表示sigmod函数,Uo是输入权重,x是当前时刻网络的输入信息即当前时刻的输入攻角角度,Wo是循环权重,h是神经网络输出即自适应调整好的参数值,右上标加t是表示当前时刻,右上标加t-1表示上一时刻。
优选地,所述长短时记忆神经网络的损失函数采用根据当前时刻的期望输出与实际输出之间的误差值,确定的性能指标。
本发明与现有技术相比,其显著优点为:
1、本发明针对高超声速飞行器在面临故障情况下稳定性和可靠性差等问题,将机器学习方法与线性自抗扰控制进行结合,有效提高系统的适应性和鲁棒性,能够适应不同的控制需求和环境变化。
2、本发明针对线性自抗扰控制器参数难设计问题,采用长短时记忆神经网络为基础参数整定算法,设计了基于机器学习在线整定控制器参数的方法,提高了控制系统的有效性和鲁棒性。
3、与常规的线性自抗扰控制相比,控制系统的可靠性与实时性得以保证;与常规扩张状态观测器相比,控制系统的准确性得以提高。
附图说明
图1为容错控制方法的控制框图。
图2为参数自适应调整流程图。
图3为长短时记忆神经网络训练图。
图4为参数在线调整的曲线图。
图5为无故障下基于长短时记忆神经网络线性自抗扰控制器的控制误差曲线图。
图6为故障下基于长短时记忆神经网络线性自抗扰控制器的控制误差曲线图。
图7为容错控制系统的工作流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚、明白,下面结合附图和技术方案对本发明作进一步详细的说明。
现有的传统的线性自抗扰控制方法通常应用于参数固定的飞行器,对于高超声速飞行器而言,飞行时存在多种因素的影响,例如不确定性、未建模动态、耦合影响、参数摄动以及干扰故障等,这对参数固定的控制器来说,控制变得十分困难,同时缺乏鲁棒性和适应性。所以本发明提出一种基于长短时记忆神经网络线性自抗扰控制的高超声速飞行器容错控制方法,包括以下内容:
步骤S1:将飞行器的建模参数输入离线训练好的神经网络得到高超声速飞行器的气动参数,具体包含以下步骤:
步骤S11:在飞行器飞行过程中,为实现飞行能力在线估计,需要较为准确的气动力参数提供支撑。另外,在控制系统工作过程中,为提高控制精度,并对控制系统进行进一步补偿,须获得俯仰力矩系数项相关气动参数,其中俯仰力矩系数关于攻角的导数和舵偏角的导数最为重要,由于本发明的研究对象为高超声速飞行器,考虑零攻角俯仰力矩项以及零攻角升力项。
飞行器的建模参数包括:高超声速飞行器速度V,推力P,攻角α,空气阻力X,质量m,重力加速度g,θ弹道倾斜角,高超声速飞行器的升力Y,地球半径R,飞行高度y,ωx是俯仰角速度,M是俯仰力矩,lx是俯仰转动惯量,是俯仰角等等。
在飞行器飞行过程中,为实现飞行能力在线估计,需要较为准确的(阻力系数对攻角的导数)、/>(升力系数对攻角的导数)等气动力参数提供支撑。此外,在高超声速飞行器控制系统工作过程中,气动不确定性可能导致控制失稳,须获得/>以及俯仰力矩项相关气动导数,例如俯仰力矩系数关于攻角的导数/>和舵偏角的导数/>以实现对控制系统的补偿,增强姿态控制稳定性。本发明中的气动参数特指力系数、力矩系数相对飞行状态量(攻角、马赫数、舵偏角等)的导数。
由于高超声速飞行器模型的控制输入为舵偏角,针对于舵偏角和气动力矩,可以通过以下公式进行转换:
Mxg=Q×Sref×Lref×Cmxg
Myg=Q×Sref×Lref×Cmyg
Mzg=Q×Sref×Lref×Cmzg
其中,Sref为高超声速飞行器的特征面积,Lref为高超声速飞行器的特征长度,Q为动压。参数Cmxg、Cmyg、Cmzg的求解公式如下:
式中Δx、Δy、Δz分别代表在质心坐标系下,真实质心位置相对于参考质心位置(坐标系原点)沿X、Y、Z三个轴的偏差分量,单位为米。当真实质心比参考质心更靠近定点时,Δx为正。Δy、Δz定义按照质心坐标的正负方向定义。
在本发明中,弹体坐标系、速度坐标系、飞行器坐标系原点均定义在质心位置,故偏差量为0,即Δx=Δy=Δz=0。
上式中的遵从如下公式:
Cmx=Cmx(BASIC)+ΔCmx(摩阻修正)+ΔCmx(D1)+ΔCmx(D2)+ΔCmx(D3)
Cmy=Cmy(BASIC)+ΔCmy(摩阻修正)+ΔCmy(D1)+ΔCmy(D2)+ΔCmy(D3)
Cmz=Cmz(BASIC)+ΔCmz(摩阻修正)+ΔCmz(D1)+ΔCmz(D2)+ΔCmz(D3)
其中ΔCmx(摩阻修正)=0,ΔCmx(Di)、ΔCmy(Di)、ΔCmz(Di)均可通过查表插值获得。
则待辨识气动参数包括:ΔCmx(Di)、ΔCmy(Di)、ΔCmz(Di)。
飞行器气动参数的可辨识性和辨识精度一方面取决于所采用的数学模型和辨识方法,另一方面取决于飞行数据中所含待辨识参数的信息量,不同输入会激发出飞行器系统的不同运动模态。当飞行器飞行过程中受到干扰时,扰动恰好在一定程度上激发了飞行器的运动模态,为气动参数在线辨识奠定了基础。
使用简单的BP神经网络,在不同的激励函数下,记录并训练气动参数。可以得到比传统的插值法得到的更精确,更快速的建模参数值。
步骤S2、建立高超声速飞行器的运动学模型和动力学模型,具体包含以下步骤。
步骤S21:在步骤S1得到的气动参数的基础上可以进而建立高超声速飞行器的动力学方程。
由变质量动力学基本定理可得,惯性坐标系下飞行器的质心动力学方程为:
对于高超声速飞行器来说,速度坐标系是动坐标系,而建立在动坐标系下的动力学方程与惯性坐标系,即地面坐标系之间的关系可以用下式表示
式中:为地面坐标系中速度V的绝对导数,/>为速度坐标系中速度V的相对倒数,ωV为速度坐标系相对于地面坐标系的转动角速度。
高超声速飞行器气动力向量R的公式为
式中:-X、Y、Z气动阻力、气动升力和侧向力,q、S分别为动压、高超声速飞行器的特征面积,cx、分别为阻力系数、升力系数对攻角的倒数、升力系数对俯仰角的倒数,δz、δy分别为俯仰舵舵偏角、偏航舵舵偏角,/>分别为侧向力系数对侧滑角的导数、侧向力系数对偏航舵的导数。
重力G在地面坐标系中是沿着Ay轴负向,使用地面坐标系与速度坐标系之间的转换公式,可以得G到在速度坐标系中的表达式为
发动机推力矢量P在弹体坐标系中沿着ox1轴正向,其在速度坐标系中的表达式为
因为高超声速飞行器速度V在速度坐标系下与ox1轴同向,所以可以把速度矢量表示为
ωV的向量形式为
将上述所有式子联立,可以得到高超声速飞行器质心运动的动力学方程为
步骤S22:建立高超声速飞行器的运动学方程。
高超声速飞行器绕质心转动的动力学方程的矢量表示式为
式中:H为惯性坐标系下高超声速飞行器对质心的动量矩;Mp气动力对质心的力矩;MR发动机推力对质心的力矩,因为假设发动机推力通过质心,MR=0
同样的,根据速度坐标系和地面坐标系之间的绝对倒数、相对倒数之间的关系,可以得到
式中:在地面坐标系上动量矩H的绝对导数
在弹体坐标系上动量矩H的相对导数
动量矩H的表达式为
H=J·ω
式中:J为惯性张量
动量矩在弹体坐标系中可以表示为
式中:为高超声速飞行器相对弹体坐标系X轴,Y轴及Z轴的转动惯量为高超声速飞行器相对弹体坐标系系X轴,Y轴及Z轴的惯量积
因为假设中高超声速飞行器的惯性主轴与弹体坐标系坐标轴重合,则惯量积为零。
可以将上述表达式简化为
气动力矩MR在弹体坐标系下可以表示为
式中:分别为副翼、偏航舵、俯仰舵的操纵力矩系数/>分别为无因次滚转、偏航、俯仰阻尼力矩系数/>分别为偏航力矩系数对侧滑角的导数、无因次偏航下阻尼力矩系数/>分别为俯仰力矩系数对攻角的导数、无因次俯仰下阻尼力矩系数L为高超声速飞行器的参考长度。
将上述所有式子联立,得到高超声速飞行器绕质心转动的动力学方程
步骤S3、采用线性自抗扰控制器作为高超声速飞行器的控制器。以单通道(俯仰通道)姿态控制为例,控制器的输入为高超声速飞行器的气动姿态角:攻角,输出为高超声速飞行器的执行器机构即舵面角度。基于长短时记忆神经网络自抗扰控制的高超声速飞行器容错控制方法的控制框图如图1所示,具体包含以下步骤。
步骤S31:选定线性自抗扰控制器中线性扩张状态观测器的带宽ω0初始值,状态误差反馈的控制参数kp、kd初始值。
步骤S32:根据线性扩张状态观测器的带宽确定线性扩张状态观测器对于攻角角度的观测估计值,对于攻角角速度的观测估计值,以及对于故障信息以及内外扰动的总估计值:
其中:
线性扩张状态观测器中的参数主要为观测器带宽ωo。式中x1为期望攻角角度,z1为观测器对于攻角角度的观测估计值,为观测器对于攻角角速度的观测估计值,z2为观测器对于攻角角速度的观测估计值,/>为观测器对于攻角角加速度的观测估计值,z3为观测器对于故障信息以及内外扰动的总估计值,/>为观测器对于故障信息以及内外扰动的总估计值的导数,b0为观测器增益,δα为输入到高超声速飞行器模型的舵面控制量。
步骤S33:误差更新
将扩张状态观测器的输出即步骤S31中的z1,z2,z3分别与输入信号即期望攻角角度以及输入信号的导数即攻角角速度作差值,得到误差e1,e2,其中e1表示输入信号攻角角度x1与扩张状态观测器的输出z1之差,e2表示输入信号攻角角速度x2与扩张状态观测器的输出z2之差
将扩张状态观测器观测到的故障信息和扰动信息之和z3反馈给状态误差反馈,根据状态误差反馈的控制参数确定作用到高超声速飞行器上面的舵面角度控制量:
控制器参数主要为kp、kd。式中,x1为期望攻角角度,x2为期望攻角角速度,z1为观测器对于攻角角度的观测估计值,z3为观测器对于故障信息以及内外扰动的总估计值,b为控制器增益,δα为作用到高超声速飞行器上面的舵面角度控制量。
步骤S4、通过长短时记忆神经网络进行观测器参数以及控制器参数的在线自适应更新,流程图如图2所示,具体包含以下步骤。
步骤S41:将步骤S33观测器得到的估计值与真实攻角输出作差,以及步骤S32得到的误差值作均方误差;
x1为输入信号即期望攻角角度,x2为输入信号即攻角角速度,z1为观测器对于攻角角度的观测估计值,z2为观测器对于攻角角速度的观测估计值,y为高超声速飞行器模型真实攻角值,为x1与z1差值的均方误差,/>为x2与z2差值的均方误差,/>为x1与y差值的均方误差,在公式后加k是为了描述此为当前时刻下。
则性能指标为
步骤S42:预测值修正
将步骤S41得到的性能指标作为长短时记忆神经网络的损失函数,利用自适应矩估计优化算法对为长短时记忆神经网络进行优化,用以计算下一时刻的观测器及控制器参数;
自适应矩估计优化算法如下:
首先,计算梯度的一阶矩估计(均值)和二阶矩估计(方差):
mt=β1mt-1+(1-β1)gt
其中,gt是当前时刻t的梯度,mt是梯度的一阶矩估计,vt是梯度的二阶矩估计,β1和β2是衰减率(一般取值为0.9和0.999)。由于mt和vt一开始都为0,需要进行偏置校正:
然后,根据上述估计值更新参数:
其中,θt是参数向量,η是学习率,∈是为了数值稳定性而添加的小常数(一般取值为10-8)。
步骤S43:对步骤S41得到的性能指标Ceq进行在线评估,如果性能指标Ceq小于设定阈值σU,则无需进行参数调整。将当前的线性扩张观测器的带宽参数以及状态误差反馈的控制参数作为飞行器线性自抗扰容错控制器的参数进行容错控制。否则进行步骤S44。迭代停止指标:目的是将性能指标降为0,即期望输入攻角与观测器观测估计的攻角值相等,期望输入攻角角速度与观测器观测估计的攻角角速度相等,期望输入攻角角速度与真实攻角角度相等。但是实际情况中会很难降为0,所以如果性能指标小于设定值σU=0.05;其中以作为迭代是否停止的条件,即当真实输出攻角角度与期望输入攻角角度的差值在2°以内时,停止后续参数在线调整工作。
当步骤S3、步骤S4执行结束后,会得到当前时刻的期望输出与实际输出之间的误差值。为了使得误差尽可能的降低,对观测器及控制器的参数进行在线更新。
同时根据步骤S32得到的误差,神经网络偏差项1以及高超声速飞行器真实输出攻角角度y作为长短时记忆神经网络的输入,如图3所示;短时记忆神经网络通过输出门输出自适应更新后的参数值。输出门公式如下:
o(t)=σ(Uox(t)+Woh(t-1))
h(t)=tanh(s(t))o(t)
其中:o表示输出门输出,σ表示sigmod函数,Uo是输入权重,x是当前时刻网络的输入信息即当前时刻的输入攻角角度,Wo是循环权重,h是神经网络输出即自适应调整好的参数值,右上标加t是表示当前时刻,右上标加t-1表示上一时刻。
如图4所示,表示参数在线调整的曲线。
步骤S45:基于简单易用原则,直接将在线更新后的参数替换掉步骤S31设置的初始值,将输出真实攻角角度y以及步骤S32中得到的误差e1,e2作为线性扩张状态观测器的输入,返回步骤S32,重新进行计算。
在该策略下,本发明提出的线性自抗扰控制器利用长短时记忆神经网络,根据状态误差和系统输出信息,在线实时动态优化观测器带宽和控制器参数,在保证闭环系统BIBO稳定的前提下,提高了控制器对总扰动的观测补偿精度,进而增强整个闭环系统的容错能力.该方法赋予了传统控制线性自抗扰控制器基于数据驱动的自适应能力,算法简单有效,具有工程应用前景。
通过本发明提出的基于长短时记忆神经网络线性自抗扰控制的高超声速飞行器容错控制方法,可以有效地应对执行器故障下地姿态控制。如图5所示,表示无故障下基于长短时记忆神经网络线性自抗扰控制器的控制误差,如图6所示,表示故障下基于长短时记忆神经网络线性自抗扰控制器的控制误差,其中红色曲线代表使用该发明的方法得到的控制误差,黑色曲线代表传统PID控制器的控制误差,两者对比,本发明提出的方法有效的有无故障发生时都有效地减小了控制误差。更重要的是,该方法采用了在线更新参数的情况,提高了系统的鲁棒性。
本发明针对高超声速飞行器执行器故障时姿态的容错控制问题,提出了一种基于长短时记忆神经网络线性自抗扰控制的高超声速飞行器容错控制策略。针对高超声速飞行器可能出现的执行器故障和异常情况设计相应的容错控制策略,将线性自抗扰控制器和容错控制策略集成到高超声速飞行器的控制系统中;在飞行过程中,线性扩张状态观测器会不断评估当前飞行状态以及总扰动情况,根据实时控制需求和故障情况,利用长短时记忆神经网络自动调整观测器和控制器参数,确保高超声速飞行器的安全运行。本发明通过引入长短时记忆神经网络进行参数的自适应调整,将线性自抗扰控制与容错控制进行有机结合,能够有效应对高超声速飞行器可能出现的各种故障和异常情况,确保其安全运行。同时,本发明具有较高的适应性和鲁棒性,能够适应不同的控制需求和环境变化。
本发明通过引入长短时记忆神经网络进行参数的自适应调整,将线性自抗扰控制与容错控制进行有机结合,能够有效应对高超声速飞行器可能出现的各种故障和异常情况,确保其安全运行。同时,本发明具有较高的适应性和鲁棒性,能够适应不同的控制需求和环境变化。
以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种基于长短时记忆神经网络线性自抗扰控制的高超声速飞行器容错控制方法,其特征在于,包括以下步骤:
步骤S1:将飞行器的气动参数输入离线训练好的神经网络得到高超声速飞行器的建模参数;
步骤S2:根据气动参数建立高超声速飞行器质心运动的动力学模型和绕质心转动的动力学模型;
步骤S3:采用线性自抗扰控制器作为高超声速飞行器的控制器,并进行误差更新;
步骤S4:通过长短时记忆神经网络进行观测器参数以及控制器参数的在线自适应更新。
2.根据权利要求1所述的基于长短时记忆神经网络线性自抗扰控制的高超声速飞行器容错控制方法,其特征在于,所述飞行器的气动参数包括:高超声速飞行器速度V,推力P,攻角α,空气阻力X,质量m,重力加速度g,θ弹道倾斜角,高超声速飞行器的升力Y,地球半径R,飞行高度y,ωx是俯仰角速度,M是俯仰力矩,lx是俯仰转动惯量,θ是俯仰角。
3.根据权利要求2所述的基于长短时记忆神经网络线性自抗扰控制的高超声速飞行器容错控制方法,其特征在于,所述气动参数包括力系数、力矩系数相对飞行状态量的导数,所述飞行状态量包括攻角、马赫数、舵偏角。
4.根据权利要求1所述的基于长短时记忆神经网络线性自抗扰控制的高超声速飞行器容错控制方法,其特征在于,所述高超声速飞行器质心运动的动力学模型和绕质心转动的动力学模型具体为:
高超声速飞行器质心运动的动力学方程:
式中:q、S分别为动压、高超声速飞行器的特征面积,m为高超声速飞行器质量,重力加速度g,高超声速飞行器发动机推力P,飞行速度V,飞行加速度攻角α,侧滑角β,俯仰角/>倾侧角γv,cx、/>分别为阻力系数、升力系数对攻角的倒数、升力系数对俯仰角的倒数,δz,δy分别为俯仰舵舵偏角、偏航舵舵偏角,/>分别为侧向力系数对侧滑角的导数、侧向力系数对偏航舵的导数,ωVz为速度坐标系相对于地面坐标系z轴分解后的转动角速度,ωVy为速度坐标系相对于地面坐标系y轴分解后的转动角速度;
高超声速飞行器绕质心转动的动力学方程:
式中:q、S分别为动压、高超声速飞行器的特征面积,L为高超声速飞行器的参考长度,飞行速度V,攻角α,侧滑角β,侧滑角速度ωx ωy ωz分别为高超声速飞行器绕质心x yz轴转动的角速度,/>分别为高超声速飞行器绕质心x y z轴转动的角加速度,分别为副翼、偏航舵、俯仰舵的操纵力矩系数,/>分别为无因次滚转、偏航、俯仰阻尼力矩系数,/>分别为偏航力矩系数对侧滑角的导数、无因次偏航下阻尼力矩系数/>分别为俯仰力矩系数对攻角的导数、无因次俯仰下阻尼力矩系数。
5.根据权利要求1所述的基于长短时记忆神经网络线性自抗扰控制的高超声速飞行器容错控制方法,其特征在于,采用线性自抗扰控制器作为高超声速飞行器的控制器,并进行误差更新和测量更新的具体步骤为:
步骤S31:设定线性自抗扰控制器中线性扩张状态观测器的带宽初始值,状态误差反馈的控制参数初始值;
步骤S32:根据线性扩张状态观测器的带宽确定线性扩张状态观测器对于攻角角度的观测估计值,对于攻角角速度的观测估计值,以及对于故障信息以及内外扰动的总估计值;
步骤S33:将扩张状态观测器的输出分别与输入信号攻角角度以及输入信号的微分攻角角速度作差值,得到相应误差;根据状态误差反馈的控制参数确定作用到高超声速飞行器上面的舵面角度控制量。
6.根据权利要求5所述的基于长短时记忆神经网络线性自抗扰控制的高超声速飞行器容错控制方法,其特征在于,根据线性扩张状态观测器的带宽确定线性扩张状态观测器对于攻角角度的观测估计值,对于攻角角速度的观测估计值,以及对于故障信息以及内外扰动的总估计值具体公式为:
其中:
x1为期望攻角角度,z1为观测器对于攻角角度的观测估计值,为观测器对于攻角角速度的观测估计值,z2为观测器对于攻角角速度的观测估计值,/>为观测器对于攻角角加速度的观测估计值,z3为观测器对于故障信息以及内外扰动的总估计值,/>为观测器对于故障信息以及内外扰动的总估计值的导数,b0为观测器增益,δα为输入到高超声速飞行器模型的舵面控制量,ωo为观测器带宽。
7.根据权利要求5所述的基于长短时记忆神经网络线性自抗扰控制的高超声速飞行器容错控制方法,其特征在于,根据状态误差反馈的控制参数确定作用到高超声速飞行器上面的舵面角度控制量,具体公式为:
式中,x1为输入信号即期望攻角角度,x2为输入信号即攻角角速度,b为控制器增益,δα为状态误差反馈的输出值即输入到高超声速飞行器模型的舵面控制量,z3为观测器对于故障信息以及内外扰动的总估计值,kp,kd为状态误差反馈的控制参数。
8.根据权利要求1所述的基于长短时记忆神经网络线性自抗扰控制的高超声速飞行器容错控制方法,其特征在于,所述长短时记忆神经网络采用自适应矩估计优化算法进行优化,具体优化方法为:
计算梯度的一阶矩估计和二阶矩估计:
mt=β1mt-1+(1-β1)gt
其中,gt是当前时刻t的梯度,mt是梯度的一阶矩估计,vt是梯度的二阶矩估计,β1和β2是衰减率;
对一阶矩估计和二阶矩估计进行偏置校正:
根据偏置校正后的值更新参数:
其中,θt是参数向量,η是学习率,∈是取值为10-8。
9.根据权利要求1所述的基于长短时记忆神经网络线性自抗扰控制的高超声速飞行器容错控制方法,其特征在于,通过长短时记忆神经网络进行观测器参数以及控制器参数的在线自适应更新的具体方法为:
根据当前时刻的期望输出与实际输出之间的误差值,确定性能指标,具体公式为:
式中,Ceq为性能指标,x1为输入信号即期望攻角角度,x2为输入信号即攻角角速度,z1为观测器对于攻角角度的观测估计值,z2为观测器对于攻角角速度的观测估计值,y为高超声速飞行器模型真实攻角值,为x1与z1差值的均方误差,/>为x2与z2差值的均方误差,/>为x1与y差值的均方误差,k表示当前时刻;
将性能指标与设定阈值作比较,如果性能指标小于设定阈值,则无需进行参数调整,将当前的线性扩张观测器的带宽参数以及状态误差反馈的控制参数作为飞行器线性自抗扰容错控制器的参数进行容错控制;否则,采用长短时记忆神经网络进行观测器参数以及控制器参数的更新,具体方法为:
将步骤3得到的误差以及神经网络偏差项1以及真实输出攻角角度作为长短时记忆神经网络的输入,长短时记忆神经网络通过输出门输出自适应更新后的参数值,输出门公式如下:
o(t)=σ(Uox(t)+Woh(t-1))
h(t)=tanh(s(t))o(t)
其中:o表示输出门输出,σ表示sigmod函数,Uo是输入权重,x是当前时刻网络的输入信息即当前时刻的输入攻角角度,Wo是循环权重,h是神经网络输出即自适应调整好的参数值,右上标加t是表示当前时刻,右上标加t-1表示上一时刻。
10.根据权利要求1所述的基于长短时记忆神经网络线性自抗扰控制的高超声速飞行器容错控制方法,其特征在于,所述长短时记忆神经网络的损失函数采用根据当前时刻的期望输出与实际输出之间的误差值,确定的性能指标。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310722053.3A CN116755337A (zh) | 2023-06-19 | 2023-06-19 | 基于长短时记忆神经网络线性自抗扰控制的高超声速飞行器容错控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310722053.3A CN116755337A (zh) | 2023-06-19 | 2023-06-19 | 基于长短时记忆神经网络线性自抗扰控制的高超声速飞行器容错控制方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116755337A true CN116755337A (zh) | 2023-09-15 |
Family
ID=87958429
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310722053.3A Pending CN116755337A (zh) | 2023-06-19 | 2023-06-19 | 基于长短时记忆神经网络线性自抗扰控制的高超声速飞行器容错控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116755337A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117687308A (zh) * | 2024-02-02 | 2024-03-12 | 北京理工大学 | 基于固定时间神经网络观测器的变体飞行器容错控制方法 |
-
2023
- 2023-06-19 CN CN202310722053.3A patent/CN116755337A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117687308A (zh) * | 2024-02-02 | 2024-03-12 | 北京理工大学 | 基于固定时间神经网络观测器的变体飞行器容错控制方法 |
CN117687308B (zh) * | 2024-02-02 | 2024-04-19 | 北京理工大学 | 基于固定时间神经网络观测器的变体飞行器容错控制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106773713B (zh) | 针对欠驱动海洋航行器的高精度非线性路径跟踪控制方法 | |
CN112346465B (zh) | 基于ialos导引律的欠驱无人船自适应模糊控制方法 | |
CN105807789B (zh) | 基于t-s模糊观测器补偿的uuv控制方法 | |
CN105629734B (zh) | 一种近空间飞行器的轨迹跟踪控制方法 | |
CN116382071B (zh) | 深度学习网络修正补偿的气动参数智能辨识方法 | |
CN105182990B (zh) | 具有输出受限的三自由度模型直升机的鲁棒控制方法 | |
Zhang et al. | Nonlinear disturbance observer based adaptive super-twisting sliding mode control for generic hypersonic vehicles with coupled multisource disturbances | |
CN114721266B (zh) | 飞机舵面结构性缺失故障情况下的自适应重构控制方法 | |
CN116755337A (zh) | 基于长短时记忆神经网络线性自抗扰控制的高超声速飞行器容错控制方法 | |
Li et al. | Anti-disturbance control for attitude and altitude systems of the helicopter under random disturbances | |
Zhang et al. | A varying-parameter adaptive multi-layer neural dynamic method for designing controllers and application to unmanned aerial vehicles | |
CN114906349A (zh) | 高机动飞机升降舵效率损失故障的自适应容错控制方法 | |
CN113128035A (zh) | 民用飞机飞控传感器信号重构容错控制方法 | |
CN115220467A (zh) | 一种基于神经网络增量动态逆的飞翼飞行器姿态控制方法 | |
CN113759718B (zh) | 一种飞机机翼损伤自适应控制方法 | |
Yu et al. | Nonsingular fixed‐time fault‐tolerant attitude control for tailless flying wing aircraft with time‐varying flight envelope constraints | |
Zhang et al. | Vision‐based tracking control of quadrotor for a moving target with nonlinear angular velocity observer | |
CN117471952A (zh) | 一种飞行器反步超螺旋滑模制导控制一体化方法 | |
CN115755590B (zh) | 一种高超声速飞行器抗扰制导控制系统及方法 | |
CN112596389A (zh) | 基于闭环交叉耦合迭代学习的水晶研磨控制方法与系统 | |
CN116360258A (zh) | 基于固定时间收敛的高超声速变形飞行器抗干扰控制方法 | |
Li et al. | Adaptive neural network backstepping control method for aerial manipulator based on coupling disturbance compensation | |
CN116610136A (zh) | 基于数据驱动技术的高超声速飞行器姿态容错控制方法 | |
Li et al. | Trajectory tracking control for quadrotor unmanned aerial vehicle with input delay and disturbances | |
CN116203840A (zh) | 可重复使用运载器自适应增益调度控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |