CN114815625A - 复合控制飞行器元学习智能控制方法 - Google Patents

复合控制飞行器元学习智能控制方法 Download PDF

Info

Publication number
CN114815625A
CN114815625A CN202210606552.1A CN202210606552A CN114815625A CN 114815625 A CN114815625 A CN 114815625A CN 202210606552 A CN202210606552 A CN 202210606552A CN 114815625 A CN114815625 A CN 114815625A
Authority
CN
China
Prior art keywords
neural network
interference
aircraft
deep neural
meta
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210606552.1A
Other languages
English (en)
Inventor
熊佳富
李君龙
张锐
冉茂鹏
楼朝飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Beijing Institute of Electronic System Engineering
Original Assignee
Beihang University
Beijing Institute of Electronic System Engineering
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University, Beijing Institute of Electronic System Engineering filed Critical Beihang University
Priority to CN202210606552.1A priority Critical patent/CN114815625A/zh
Publication of CN114815625A publication Critical patent/CN114815625A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明提供一种复合控制飞行器自动驾驶仪元学习智能控制方法,所述方法包括步骤一:建立未知干扰环境下的复合控制飞行器纵向平面动力学模型;步骤二:基于元学习框架对真实系统下采集的数据进行元训练以深度神经网络获得未知干扰的泛化参数;步骤三:在建立步骤一所述模型的基础上为避免采用反步造成微分爆炸现象首先对模型进行变量代换,并构造有界函数和终端滑模面,结合步骤二中获得的深度神经网络对系统受到的未知干扰进行准确估计,通过设计终端滑模控制律使得气流角在有效时间内收敛至期望值。本发明考虑了干扰对飞行过程中控制系统的影响,设计控制律使得飞行器自动驾驶仪能够快速准确跟踪参考信号。

Description

复合控制飞行器元学习智能控制方法
技术领域
本发明属于飞行控制系统领域,具体涉及到一种复合控制飞行器自动驾驶仪系统元学习智能控制方法。
背景技术
防空导弹作为各国防空利器,成为许多国家重点。其担负着对国家领空的防御任务,一旦任务失败,将会给国家安全和人民利益带来巨大的损失。与传统飞行器只使用气动力不同,复合控制飞行器利用姿控发动机能够产生连续高速气体的特点帮助飞行器更快建立稳定的法向过载,因此复合控制飞行器总是能够实现极小的脱靶量,甚至是直接命中目标。但是在拦截过程中由于受到系统参数不确定性和外部扰动的复合干扰影响,设计对干扰具有良好鲁棒性的飞行控制系统是必不可少的。
传统飞行控制方法采用增益调度和比例积分微分控制器,而复合控制飞行器气动环境复杂,干扰和不确定性大,并且其是过驱动系统,因此采用传统飞行控制方法对其飞行过程进行高精度控制存在一定的难度。为解决上述问题,许多学者提出了先进控制理论,如滑模控制、自适应神经网络控制、自抗扰控制和反步控制等方法。其中滑模控制和反步控制被常用来结合设计控制器,滑模控制具有对参数不确定性、外部干扰不敏感和容错能力强等优点,但是其中引入的切换项对系统的过渡过程和实际控制律产生抖振影响;反步法将控制系统形式要求进行拓宽,因此具有很强的泛化适应能力,但是反步法将高阶系统拆分为多个一阶子系统并通过引入虚拟变量的形式将他们级联起来的方式易造成“微分爆炸”。
基于此,本发明在上述终端滑模控制律基础上,提出了基于元学习深度神经网络的抗干扰控制器,主要优势为:(1)无需得知系统准确模型,对系统建模精确性要求较低。(2)通过构造有界函数和反馈线性化形式有效避免了反步法的“微分爆炸”。(3)通过合理的控制分配策略有效避免了气动舵饱和偏转的现象。(4)利用元学习框架特点使得深度神经网络能够有效估计当前系统受到的未知干扰并提高系统的控制精度。
发明内容
本发明的目的是为了解决复合控制飞行器自动驾驶仪受到外部干扰、系统模型参数摄动的情况下的高精度控制问题。
本发明采用的技术方案为:
本发明提供一种基于元学习深度神经网络的复合控制飞行器自动驾驶仪抗干扰控制方法,所述方法包括:
步骤一:建立复合控制飞行器自动驾驶仪纵向通道动力学模型;
步骤二:利用反馈线性化将步骤一中的系统模型转化为合适的形式,便于后续设计终端滑模面;
步骤三:利用反步法和扩张状态观测器对步骤一中建立的系统模型在不同的未知干扰环境中控制运行并获得干扰的实际值和估计值;
步骤四:基于元学习框架利用步骤三中获得的数据对深度神经网络进行训练,并训练多个能够准确估计干扰的神经网络模型作为对未知干扰具有泛化估计的元参数;
步骤五:基于步骤四中训练好的深度神经网络在线估计未知干扰,并在设计终端滑模控制律的过程中考虑干扰的估计对干扰进行补偿,从而使得系统气流角在有限时间内跟踪期望值。
本发明的优点在于:
(1)设计有界函数和反馈线性化有效避免引入虚拟控制量分步设计的过程,直接针对复合控制飞行器非线性自动驾驶仪系统模型进行控制律设计。
(2)在控制律设计中考虑对上下界未知的干扰进行补偿。
(3)通过引入元学习框架来提高深度神经网络对从未训练过的环境中系统受到的未知干扰的估计精度,增强深度神经网络的泛化能力。
附图说明
图1为复合控制飞行器的直接力分布示意图
图2为智能元学习深度神经网络控制器结构图
图3为深度神经网络在测试过程中对测试数据1中的干扰估计情况
图4为深度神经网络在测试过程中对测试数据2中的干扰估计情况
图5为实施例中智能元学习深度神经网络控制方法的攻角曲线
图6为实施例中智能元学习深度神经网络控制方法的攻角跟踪误差曲线
图7为实施例中智能元学习深度神经网络控制方法的未知干扰估计曲线
图8为实施例中智能元学习深度神经网络控制方法的气动舵偏转曲线
图9为实施例中智能元学习深度神经网络控制方法的直接力响应曲线
具体实施方式
下面将结合附图及实施例对本发明作进一步的详细说明。
考虑末制导阶段飞行器推力发动机已停止工作,因此建立纵向平面内直复合控制飞行器自动驾驶仪非线性系统模型如下:
Figure BDA0003676425430000031
式中:m为飞行器质量;V为飞行器速度;α为迎角;β为侧滑角;Q为动压;S为特征面积;L为特征长度;Jz为飞行器转动惯量;
Figure BDA0003676425430000032
为气动导数;δz为升降舵偏角;LT为姿控发动机到飞行器质心的平均距离;FT为姿控发动机推力大小。
为便于设计,对上式进行简化,假设β≈0,并且为下文公式表达更简洁,令
Figure BDA0003676425430000033
Figure BDA0003676425430000034
并且定义x1=α,x2=ωz,M=a4δz+a5FT,则可以得到直接力/气动力复合控制飞行器的纵向通道简化模型:
Figure BDA0003676425430000035
式中,dα,
Figure BDA0003676425430000036
为考虑模型简化过程中系统存在的复合未知有界干扰。
通过引入中间状态量进而化简上式,令x3=x2-a1x1,则上式可以写成:
Figure BDA0003676425430000037
将x2=x3+a1x1带入上式得:
Figure BDA0003676425430000038
设参考指令信号为x1d,令e1=x1-x1d,则
Figure BDA0003676425430000039
再令x2=x3,则上式可以改写为:
Figure BDA00036764254300000310
在获得上述模型之后,利用反步法和扩张状态观测器对上述系统模型在T个不同任务环境中进行有效控制,每个任务环境代表一种期望轨迹和干扰形式,并且设置每个任务的运行时长都是10秒,且数据采集间隔为1毫秒,则每个任务的数据量都是10000,收集的离线数据集合为
Figure BDA00036764254300000311
其中X,Xr分别为系统状态和参考状态,
Figure BDA00036764254300000312
为扩张状态观测器对两个回路中的干扰的准确估计值。元训练的目标是找到具有强泛化能力的元参数ω*,并利用其来表达被训练神经网络内核以达到对这些训练后的神经网络内核进行线性组合进而表达系统在实际运行过程中所受到的未知扰动:
Figure BDA00036764254300000313
式中,
Figure BDA0003676425430000041
为神经网络输出层与最后一层隐藏层之间的权重,它是与表示环境变化的参数c有关;
Figure BDA0003676425430000042
为输出层之前的第j个隐藏层的状态。因此元训练的目标是最小化真实扰动与线性表达干扰之间的误差,即:
Figure BDA0003676425430000043
式中,
Figure BDA0003676425430000044
为元参数;
Figure BDA0003676425430000045
为神经网络最后一层隐藏层的状态。
接下来是寻找最适合表达上述数据中两回路的干扰的参数化神经网络,因此可以将这个问题转化为一个凸优化问题:
Figure BDA0003676425430000046
其中
Figure BDA0003676425430000047
在元训练中通常采用双层优化的思想将上式写成内外两层的形式:
Figure BDA0003676425430000048
对于上式,首先可以任意初始化元参数ω,并利用其设计神经网络隐层状态
Figure BDA0003676425430000049
然后就可以对内层进行设计,内层思路则是利用
Figure BDA00036764254300000410
进行线性组合,而hk就是线性组合中各部分的权重值,即可以利用线性最小二乘思想获得在Dk数据中的hk形式。由于在每一个完整集合Dk中需要获得ω和hk,因此再将数据Dk继续划按照8:2的比例分为两部分:
Figure BDA00036764254300000411
Figure BDA00036764254300000412
其中
Figure BDA00036764254300000413
用于训练hk
Figure BDA00036764254300000414
用于解决外层优化元参数ω。我们首先对于固定的元参数ω,获得hk的线性最小二乘形式:
Figure BDA00036764254300000415
Figure BDA00036764254300000416
因此上式的最小二乘解为:
Figure BDA00036764254300000417
在获得了
Figure BDA00036764254300000418
上的hk之后,则可以对外层进行优化获得元参数ω,我们可以使用ω上的随机梯度下降来解决外层优化问题。并给出下表中的迭代算法来求解ω。注意,如果不将Dk进行划分,而是直接在Dk基础上直接计算内外层是可以保证渐近收敛的,因为在每次迭代中解决最小二乘问题是单调递减的,对于提前设置的最够小的学习率β,批量更新律是单调递减的,并且是2范数,因此代价是下界为0。
在获得最优元参数之后,认为在线估计阶段中元参数固定不变,进而可将训练好的神经网络内核
Figure BDA00036764254300000511
同样视作固定的,则在真实拦截过程中只需要在线更新内核中各神经元线性组合的权值即可实现系统在全新未知干扰下经过设计的控制律作用能够实现状态轨迹渐近收敛至期望状态轨迹。
在控制系统的设计过程中,首先给出几个关键且符合实际物理系统的假设:
假设1:系统参考状态轨迹Xd及其一阶导数和二阶导数存在且有界,即:
Figure BDA0003676425430000051
假设2:认为系统状态轨迹和所受未知干扰是紧集Ξ的一个子集,因此对于系统状态轨迹和当前所受未知干扰的由最小线性二乘给出的最优参数可表示为:
Figure BDA0003676425430000052
可以认为该误差在元训练过程中的最大误差值ε范围内,即ed≤ε。
首先对简化的系统设计如下滑模面:
Figure BDA0003676425430000053
式中,λ和μ为正数。给出所设计的输入控制力矩M为:
Figure BDA0003676425430000054
式中,k1>0,k2>0,
Figure BDA0003676425430000055
其中,λ>0,μ>0。unn1和unn2为深度神经网络对攻角环和俯仰角速度环中的未知干扰的估计值。在线使用更新过程中,设置权重h的更新律为:
Figure BDA0003676425430000056
式中,γ=diag(γ12),其中,γ12>0。将未知干扰
Figure BDA0003676425430000057
写成由训练后的神经网络内核线性组合形式为:
Figure BDA0003676425430000058
式中,h*为能够将神经网络内核组合进而拟合干扰的最优权重。则实际在线控制中,拟合误差为:
Figure BDA0003676425430000059
式中,
Figure BDA00036764254300000510
给出以下结论定理:
定理1:对于|e1|≥0,当|e1|>1时有ρ(|e1|)>0;当0≤|e1|≤1时有|ρ(|e1|)|≤2λ(1+μ)。
定理2:在假设1和假设2的基础上,对于复合控制飞行器自动驾驶仪,在所设计控制律和更新律的作用下,系统状态轨迹能够快速准确收敛至期望状态轨迹。
证明过程为:首先考虑ρ(|e1|)的有界性,首先定理1中的第一个条件明显成立;这里直接证明第二个条件,当0≤|e1|≤1时,ρ(|e1|)可以写成如下形式:
Figure BDA0003676425430000061
很明显
Figure BDA0003676425430000062
因此定义:
Figure BDA0003676425430000063
将上式对|e1|求导得:
Figure BDA0003676425430000064
存在|e10|使得上式为零,则易知ψ在(0,|e10|)上递减,在(|e10|,1)上递增,因此|ψ(|e1|)|≤max{1+μ,|ψ(|e10|)|},最后,由于0≤|e10|≤1,得|ψ(|e10|)|≤2λ(1+μ),证毕。
然后证明定理2成立,选取Lyapunov函数形式如下:
Figure BDA0003676425430000065
式中,h1=[h11...h1m],h2=[h21...h2m]。对上式求导得:
Figure BDA0003676425430000066
式中,
Figure BDA0003676425430000067
先化简上式中的第一项
Figure BDA0003676425430000068
Figure BDA0003676425430000069
将设计的输入控制力矩和更新律代入上式:
Figure BDA00036764254300000610
由定理1可知ρ(X)∈(-2λ(1+μ),2λ(1+μ)),即|ρ(X)|≤2λ(1+μ),因此上式可化简为:
Figure BDA0003676425430000071
式中,只需设置γ>1,k1,k2>0,就可以保证所设计的李雅普诺夫函数满足:
Figure BDA0003676425430000072
证毕。
由于本文研究的飞行器为过驱动系统,即期望输入力矩可以由升降舵的偏转产生和姿控发动机向外喷气产生,因此需要对控制输入力矩进行合理分配,从而达到升降舵与姿控发动机之间地相互配合使得系统更加快速准确地跟踪参考指令信号。
首先通过上一步得到了期望输入力矩:
M=a4δz+aTFT
根据气动力与直接力产生特性,在攻角与期望角度之间偏差较大时采用直接力,偏差较小时采用气动力,即根据期望偏差动态加权调整两者之间的输入关系以保证产生的总输入力矩与期望的输入力矩相同,定义加权函数g(e)并对期望力矩进行指令分配:
Figure BDA0003676425430000073
式中,k3为调节参数。
本发明基于智能元学习深度神经网络控制器结构图如图2所示。
以下将结合实施例对本发明的技术效果进行表述,以充分理解本发明的效果和证明本发明的有效性。显然,所描述的实施例只是本发明的一部分实施例,而不是全部实施例,基于本发明的实施例,本领域的技术人员在不付出创造性劳动的前提下所获得的其他实施例,均属于本发明的保护范围。
对于步骤一,实施例中,设置复合控制飞行器末制导拦截飞行时间为10s,初始攻角为α0=0.0011°,初始俯仰角速度为ωz0=0.001°/s。期望攻角指令信号为αc=15°,并采用滤波器
Figure BDA0003676425430000081
来平滑期望攻角指令信号。
对于步骤三,实施例中利用步骤一中的系统基于反步法和扩张状态观测对状态和干扰数据进行收集,其中扩张状态观测器的增益参数为ρ1=ρ2=4。系统参考攻角信号在0°~15°之间随机产生,未知干扰采用正弦波与常值的和形式,其中正弦波的角频率为0~3π/4之间随机产生。
对于步骤四,实施例中采用的深度神经网络有5层,其中三层隐藏层。
对于步骤五,实施例中控制器参数设置为:k1=3,k2=2,λ=1,μ=5,γ=2。
由图3和图4可以看出针对不同频率且存在常值偏移的未知干扰,深度神经网络仅需要当前时刻的前200个相对真实数据即可对当前时刻的干扰进行估计。
由图5和图6可以看出攻角信号在跟踪初期与期望信号差距较大,但是其在0.5s左右就达到了收敛稳态。
图7为深度神经网络对实际拦截过程中系统受到的干扰进行估计,同样是基于已知干扰的前200个数据,然后进行递推估计,可以看出深度神经网络对未训练过的场景也能够作出较为准确的估计。
图8和图9对比可以看出,在响应初期系统攻角与期望攻角相差较大时,主要采用直接力为主,气动力为辅的形式来满足控制需要,当误差逐渐降低时气动力的比重加大,最终使得气动舵无饱和偏转现象并且过渡平缓,满足工程实际需求。
实施例中对比结果说明,采用智能元学习深度神经网络能够较为准确地估计系统中的未知干扰并在控制律设计中加以补偿。同时有界函数地构造和终端滑模的设计增强了系统对估计存在些许偏差的鲁棒性,有效提高了系统快速准确跟踪的能力,控制分配策略极大缓解了气动舵执行机构的饱和偏转现象。

Claims (6)

1.一种复合控制飞行器元学习智能控制方法,其特征在于,所述方法包括:
步骤一:建立复合控制飞行器自动驾驶仪纵向通道动力学模型;
步骤二:利用反馈线性化将步骤一中的系统模型转化为合适的形式,便于后续设计终端滑模面;
步骤三:利用反步法和扩张状态观测器对步骤一中建立的系统模型在不同的未知干扰环境中控制运行并获得干扰的实际值和估计值;
步骤四:基于元学习框架利用步骤三中获得的数据对深度神经网络进行训练,并训练多个能够准确估计干扰的神经网络模型作为对未知干扰具有泛化估计的元参数;
步骤五:基于步骤四中训练好的深度神经网络在线估计未知干扰,并在设计终端滑模控制律的过程中考虑干扰的估计对干扰进行补偿,从而使得系统气流角在有限时间内跟踪期望值。
2.根据权利要求1所述方法,其特征在于,步骤一所述复合控制飞行器自动驾驶仪纵向通道动力学模型的建立过程为:
考虑末制导阶段导弹推力发动机已停止工作,因此建立纵向平面内直复合控制飞行器自动驾驶仪非线性系统模型如下:
Figure FDA0003676425420000011
式中:m为飞行器质量;V为飞行器速度;α为迎角;β为侧滑角;Q为动压;S为特征面积;L为特征长度;Jz为飞行器转动惯量;
Figure FDA0003676425420000012
为气动导数;δz为升降舵偏角;LT为姿控发动机到飞行器质心的平均距离;FT为姿控发动机推力大小。
3.根据权利要求1所述方法,其特征在于,步骤二所述对系统进行反馈线性化的过程为:
为便于设计,对上式进行简化,假设β≈0,并且为下文公式表达更简洁,令
Figure FDA0003676425420000013
Figure FDA0003676425420000014
并且定义x1=α,x2=ωz,M=a4δz+a5FT,则可以得到直接力/气动力复合控制飞行器的纵向通道简化模型:
Figure FDA0003676425420000015
式中,dα,
Figure FDA0003676425420000016
为考虑模型简化过程中系统存在的复合未知有界干扰。
通过引入中间状态量进而化简上式,令x3=x2-a1x1,则上式可以写成:
Figure FDA0003676425420000021
将x2=x3+a1x1带入上式得:
Figure FDA0003676425420000022
设参考指令信号为x1d,令e1=x1-x1d,则
Figure FDA0003676425420000023
再令x2=x3,则上式可以改写为:
Figure FDA0003676425420000024
4.根据权利要求1所述方法,其特征在于,步骤三所述利用基于扩张状态观测器的反步法进行元学习数据收集过程为:
STEP1:首先设定系统初始状态,期望系统状态,干扰形式等初始仿真条件。
STEP2:在每一次仿真中将期望系统状态与干扰进行随机组合。
STEP3:设置数据采样时间间隔为1ms,并采集至仿真结束。
5.根据权利要求1所述方法,其特征在于,步骤四所述进行智能元学习深度神经网络训练过程为:
STEP1:将步骤三中收集的数据按照8:2的比例随机划分为元训练数据集和元测试数据集;
STEP2:输入元训练集训练深度神经网络,以此得到深度神经网络预测模型;
STEP3:用元测试集对深度神经网络预测模型进行测试,综合训练集的准确率和测试集的准确率调节相关参数,得到最优的预测模型。
6.根据权利要求1所述方法,其特征在于,步骤五所述进行基于智能元学习深度神经网络控制器设计过程为:
STEP1:将扩张状态观测器用于系统初步状态数据收集,便于深度神经网络模型输入使用;
STEP2:输入STEP1中获得的前期数据至深度神经网络进行预测并基于设计的滑模面状态动态调整深度神经网络输出权重组合;
STEP3:基于滑模面状态构造有界函数,并在STEP2的基础上设计控制律以增强系统对未知干扰的鲁棒性;
STEP4:基于系统状态误差设计控制分配策略;
STEP5:将STEP3得到的期望控制律输入到STEP4设计的控制分配策略中以获得气动舵偏转和直接力响应。
CN202210606552.1A 2022-06-03 2022-06-03 复合控制飞行器元学习智能控制方法 Pending CN114815625A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210606552.1A CN114815625A (zh) 2022-06-03 2022-06-03 复合控制飞行器元学习智能控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210606552.1A CN114815625A (zh) 2022-06-03 2022-06-03 复合控制飞行器元学习智能控制方法

Publications (1)

Publication Number Publication Date
CN114815625A true CN114815625A (zh) 2022-07-29

Family

ID=82519979

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210606552.1A Pending CN114815625A (zh) 2022-06-03 2022-06-03 复合控制飞行器元学习智能控制方法

Country Status (1)

Country Link
CN (1) CN114815625A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116880162A (zh) * 2023-09-06 2023-10-13 中国科学院工程热物理研究所 一种考虑油泵动态特性的航空发动机抗扰控制系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200183339A1 (en) * 2018-12-10 2020-06-11 California Institute Of Technology Systems and Methods for Robust Learning-Based Control During Forward and Landing Flight Under Uncertain Conditions
CN112180726A (zh) * 2020-09-29 2021-01-05 北京航空航天大学 一种基于元学习的航天器相对运动轨迹规划方法
US20210123741A1 (en) * 2019-10-29 2021-04-29 Loon Llc Systems and Methods for Navigating Aerial Vehicles Using Deep Reinforcement Learning
CN114491790A (zh) * 2021-12-28 2022-05-13 中国航天空气动力技术研究院 一种基于maml的气动建模方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200183339A1 (en) * 2018-12-10 2020-06-11 California Institute Of Technology Systems and Methods for Robust Learning-Based Control During Forward and Landing Flight Under Uncertain Conditions
US20210123741A1 (en) * 2019-10-29 2021-04-29 Loon Llc Systems and Methods for Navigating Aerial Vehicles Using Deep Reinforcement Learning
CN112180726A (zh) * 2020-09-29 2021-01-05 北京航空航天大学 一种基于元学习的航天器相对运动轨迹规划方法
CN114491790A (zh) * 2021-12-28 2022-05-13 中国航天空气动力技术研究院 一种基于maml的气动建模方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
BO LI 等: "UAV Maneuvering Target Tracking in Uncertain Environments Based on Deep Reinforcement Learning and Meta-Learning", REMOTE SENSING, 18 November 2020 (2020-11-18) *
YIXIN YANG 等: "Robust Compare Network for Few-Shot Learning", IEEE ACCESS, 29 July 2020 (2020-07-29) *
张秀云 等: "复杂环境影响下空天飞行器智能决策与控制方法发展分析", 空天技术, 6 March 2022 (2022-03-06) *
曾子林 等: "基于元学习思想的算法选择问题综述", 控制与决策, 9 May 2014 (2014-05-09) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116880162A (zh) * 2023-09-06 2023-10-13 中国科学院工程热物理研究所 一种考虑油泵动态特性的航空发动机抗扰控制系统及方法
CN116880162B (zh) * 2023-09-06 2023-11-14 中国科学院工程热物理研究所 一种考虑油泵动态特性的航空发动机抗扰控制系统及方法

Similar Documents

Publication Publication Date Title
CN106997208B (zh) 一种面向不确定条件下的高超声速飞行器的控制方法
CN101937233B (zh) 近空间高超声速飞行器非线性自适应控制方法
Lyu et al. Multiple missiles cooperative guidance with simultaneous attack requirement under directed topologies
CN105607473B (zh) 小型无人直升机的姿态误差快速收敛自适应控制方法
CN105629734B (zh) 一种近空间飞行器的轨迹跟踪控制方法
CN110579962B (zh) 基于神经网络的涡扇发动机推力预测方法及控制器
CN112286047B (zh) 基于神经网络的narma-l2多变量控制方法
Durmaz et al. Sliding mode control for non-linear systems with adaptive sliding surfaces
CN113377121B (zh) 一种基于深度强化学习的飞行器智能抗扰动控制方法
CN111367182A (zh) 考虑输入受限的高超声速飞行器抗干扰反步控制方法
Liang et al. Kalman-filter-based robust control for hypersonic flight vehicle with measurement noises
Pashilkar et al. Adaptive back-stepping neural controller for reconfigurable flight control systems
CN115220467A (zh) 一种基于神经网络增量动态逆的飞翼飞行器姿态控制方法
CN114815625A (zh) 复合控制飞行器元学习智能控制方法
Li et al. Control system design of flying-wing UAV based on nonlinear methodology
Zhou et al. Dynamic surface control based on neural network for an air‐breathing hypersonic vehicle
CN116360258A (zh) 基于固定时间收敛的高超声速变形飞行器抗干扰控制方法
CN116482971A (zh) 一种高机动飞行器的控制方法
US20210131767A1 (en) System Optimizing Control Coefficients Of Flight Object Under Complex Environmental Effects Using Hybrid Fuzzy Logic And Pid Variant Controller
Pashilkar et al. Adaptive nonlinear neural controller for aircraft under actuator failures
CN110095987A (zh) 基于鲁棒伺服控制与模型自适应控制的控制方法及控制器
CN103853049B (zh) 纵向飞行模型簇复合频率鲁棒控制器设计方法
CN103809453B (zh) 纵向飞行模型簇人机闭环复合根轨迹补偿鲁棒控制器设计方法
Wang et al. Gain scheduling controller of the aero-engine based on LPV model
CN103823367B (zh) 纵向飞行模型簇颤振抑制复合频率鲁棒控制器设计方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination