CN115793453A - 融合ai深度学习的旋翼飞行器轨迹跟踪自适应控制方法 - Google Patents
融合ai深度学习的旋翼飞行器轨迹跟踪自适应控制方法 Download PDFInfo
- Publication number
- CN115793453A CN115793453A CN202211469247.9A CN202211469247A CN115793453A CN 115793453 A CN115793453 A CN 115793453A CN 202211469247 A CN202211469247 A CN 202211469247A CN 115793453 A CN115793453 A CN 115793453A
- Authority
- CN
- China
- Prior art keywords
- wind
- adaptive
- aerodynamic
- aircraft
- term
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000013135 deep learning Methods 0.000 title claims abstract description 23
- 230000006870 function Effects 0.000 claims abstract description 64
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 36
- 230000003044 adaptive effect Effects 0.000 claims description 69
- 238000013528 artificial neural network Methods 0.000 claims description 53
- 238000012549 training Methods 0.000 claims description 43
- 239000013598 vector Substances 0.000 claims description 27
- 239000011159 matrix material Substances 0.000 claims description 24
- 238000002474 experimental method Methods 0.000 claims description 21
- 238000004088 simulation Methods 0.000 claims description 19
- 230000001133 acceleration Effects 0.000 claims description 15
- 238000013508 migration Methods 0.000 claims description 14
- 238000012360 testing method Methods 0.000 claims description 12
- 238000012512 characterization method Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 238000013459 approach Methods 0.000 claims description 4
- 238000003860 storage Methods 0.000 claims description 4
- 238000013526 transfer learning Methods 0.000 claims description 4
- 238000007664 blowing Methods 0.000 claims description 3
- 238000013145 classification model Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 230000005484 gravity Effects 0.000 claims description 3
- 230000005012 migration Effects 0.000 claims description 3
- 238000005096 rolling process Methods 0.000 claims description 3
- 238000009795 derivation Methods 0.000 claims 1
- 238000010606 normalization Methods 0.000 abstract description 3
- 238000013473 artificial intelligence Methods 0.000 description 16
- 238000013461 design Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000011161 development Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 230000004927 fusion Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000010587 phase diagram Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Feedback Control In General (AREA)
Abstract
本发明公开了融合AI深度学习的旋翼飞行器轨迹跟踪自适应控制方法,利用AI深度学习与自适应控制相结合的算法,获得风干扰环境下的未准确建模的风干扰空气动力项,对在不同风速干扰环境下的旋翼飞行器进行轨迹跟踪自适应控制;结合所述基函数和所述自适应参数,获得风干扰环境下的未准确建模的风干扰空气动力项;结合反馈控制,在预先设计的飞行器需要跟踪的参考轨迹的飞行参考轨迹跟踪控制器中,实时补偿在线自适应识别到的未准确建模的风干扰空气动力学项。本发明引入了基于归一化的线性系数自适应估计策略,在证明了旋翼飞行器系统在风干扰影响下的未建模动力项与自适应项之间的误差稳定收敛性的同时,提高了系统的抗干扰鲁棒性。
Description
技术领域
本发明属于飞行器导航、定位与控制的技术领域,具体涉及一种融合AI深度学习的旋翼飞行器轨迹跟踪自适应控制方法。
背景技术
旋翼型飞行器具有结构原理简单、造价低、可垂直起降、定点悬停和维护方便等优势,能够完成很多有人飞行器无法完成的任务,尤其近年来结合人工智能等新兴技术,在军事和民用领域得到了广泛的应用。
随着科技发展和军事格局的不断变化,对旋翼飞行器的性能也提出更高要求,尤其是在高空或海上大风干扰环境下的精准飞行轨迹跟踪控制性能的好坏,是决定其未来能否具备实用拓展能力的关键指标之一,而目前这一问题并未得到有效解决。因此,研究并解决旋翼型飞行器的风干扰环境下的精准飞行轨迹跟踪控制问题具有重大的应用前景。
在外界风干扰环境下,旋翼型飞行器的精确动力学模型难以建立,外界风环境给飞行器模型带来了严重非线性、强耦合干扰的未建模动力学影响,能否在控制器的设计过程中有效补偿风干扰,是其能否精准跟踪飞行轨迹的关键。同时,不同风场的风速不同,造成的风干扰力不同,要提升旋翼飞行器控制系统在未知风场环境中的适应性和鲁棒性,使得设计适应不同风速的环境的飞行轨迹跟踪控制方法的难点问题亟待解决。
发明内容
本发明的目的在于解决上述难点问题,针对旋翼型飞行器在不同风速干扰环境下的理论飞行轨迹跟踪控制的任务应用,而提供一种融合AI深度学习的旋翼飞行器轨迹跟踪自适应控制方法。
为了实现上述目的,本发明提供如下方法:
融合AI深度学习的旋翼飞行器轨迹跟踪自适应控制方法,利用AI深度学习与自适应控制相结合的算法,获得风干扰环境下的未准确建模的风干扰空气动力项,对在不同风速干扰环境下的旋翼飞行器进行轨迹跟踪自适应控制,包括如下步骤:
通过收集的飞行数据对深度神经网络进行离线学习,训练近似拟合得到风干扰环境下的未准确建模的风干扰空气动力项的基函数;
利用自适应控制中参考模型预测误差项信息对自适应参数进行更新;
结合所述基函数和所述自适应参数,获得风干扰环境下的未准确建模的风干扰空气动力项;
结合反馈控制,在预先设计的飞行器需要跟踪的参考轨迹的飞行参考轨迹跟踪控制器中,实时补偿在线自适应识别到的未准确建模的风干扰空气动力学项。
进一步地,利用AI深度学习与自适应控制相结合的算法获得风干扰环境下的未准确建模的风干扰空气动力项
包括
未准确建模的风干扰空气动力项的动力学方程为:
其中,各个状态含义如下:
大地水平坐标系下的位置状态向量:Pfs=[X,Y,Z]T,上标T表示矩阵转置,X表示北向坐标,Y表示东向坐标,Z表示地向坐标,原点设为起飞点;
飞行器质量:m;
重力加速度:g;
飞行器控制指令项:U=[U1 U2 U3 U4]T,U1为旋翼拉力控制量,U2为旋翼滚转力矩控制量,U3为旋翼俯仰力矩控制量,U4为旋翼偏航力矩控制量;
外界不同风况条件引起的未建模的风干扰空气动力项f(x,μ):f(x,μ)=[fX fYfZ]T为风干扰空气动力项在大地水平坐标系北向X轴,东向Y轴,地向Z轴三个方向上的分量,该未建模的空气动力项与飞行器的状态向量x和风场向量μ相关,其中状态向量选择为飞行器三维速度(三维)、以欧拉角表示的飞行器姿态俯仰角、滚转角和偏航角(三维)和以脉冲宽度调制信号(PWM)表示的旋翼四个电机转速控制指令四维组合,其中四维是旋翼飞行器四个电机的转速控制信号;假设n种不同类别风速的风场分别表示为μ1,μ2,...,μn,其中某一具体的第k类风速设为μk;
通过融合AI深度学习与自适应控制算法拟合未准确建模的风干扰空气动力学项f(x,μ),使其具有以下表达式:
其中,是通过深度神经网络学习的所有不同风况共享的表征基函数,即用来学习捕捉未建模的动力学对无人机状态共同的依赖项,这个量与风速的大小无关,λ(μ)是一组的线性系数,简记为λ,在不同风况下有不同的取值,通过自适应控制算法进行在线辨识,与λ(μ)相乘近似拟合未准确建模的风干扰空气动力学项f(x,μ);
当旋翼无人飞行器在线控制时,将近似拟合的未准确建模的风干扰空气动力学项f(x,μ)加入到控制力中,予以实时补偿,消除未准确建模的动态影响,使飞行器对参考轨迹进行精确跟踪。
包括
引入深度神经网络学习算法中的对抗迁移学习深度网络,在少样本数据条件下,进行有效的学习与风场无关的空气动力学的深度神经网络表征,通过深度神经网络拟合任意函数的特性,深度神经网络的输出被视为代表风干扰空气动力学效应的一组基函数即不同风况下的共享空气动力模型基函数并引入对抗训练步骤,用分类网络消除不同风况变化带来的影响,具体为
所述对抗迁移学习深度网络采用全连接形式,共训练两个网络和ξ,二者为两个不同的DNN;网络的输出是不同风况共享的空气动力表示函数,即与风况无关;自适应参数λ(μ)是与风况有关的线性系数,不同的风况都有一个特定的参数λ(μ),第k类风况有一个特定的参数λ(μk);训练一个深度神经网络使其和λ(μ)的乘积能够近似的表示不同风况下的不确定风干扰空气动力项f(x,μ);由于训练集是飞行器在不同风况下的速度、姿态、电机转速等飞行状态量x的数据,在实际飞行中,飞行器自身的状态量x会因为风况风速的变化发生改变,直接简单的用一个最小平方误差损失函数去训练得出的神经网络大概率会学习到跟风况有关的空气动力模型,所以为了消除风况风速变化带来的影响,真正让网络学到与风况无关的共享空气动力模型;引入分类网络ξ,网络ξ的作用是输入不同风况下的能够输出对应的风况风速类别k,并且引入对抗训练,将分类网络ξ作为鉴别器,同时训练和ξ两个DNN网络,对抗训练是指在每轮迭代中,首先使分类网络ξ固定网络参数更新网络之后使网络固定网络参数更新网络ξ,二者达到纳什均衡即完成训练。
进一步地,所述对抗迁移学习深度网络采用的对抗训练算法具体包括
采用最小二乘和随机梯度下降法训练深度神经网络即对抗迁移学习深度网络,神经网络的输入状态量是飞行器三维速度(三维)、以欧拉角表示的飞行器姿态俯仰角、滚转角和偏航角(三维)和以脉冲宽度调制信号(PWM)表示的旋翼四个电机转速控制指令(四维);神经网络的输出状态为不同风况共享的表示基函数(五维行向量);结合自适应控制算法在线更新的线性系数λ(μ)=[λX(μ) λY(μ) λZ(μ)]T(十五维,每个轴的自适应参数向量λX(μ)、λY(μ)和λZ(μ)分别为五维列向量),神经网络的五维输出和自适应控制更新的十五维线性系数的前五维λX(μ),中五维λY(μ)和后五维λZ(μ),分别相乘,正好得到三个数,用这三个数来近似风场在大地坐标系下三个轴即北向X轴,东向Y轴,地向Z轴的三个分量,表示飞行器在大地坐标系下的三轴未建模空气动力项f(x,μ)=[fX fY fZ]T(三维)为:
对抗迁移学习深度网络的损失函数如下:
其中k代表n次不同风况实验下收集的单次数据,NK代表在第k次风况实验下收集的样本点的总数,i代表在第k次风况实验下收集的样本点的总数中的一个样本点,代表在第k次风况风速实验下收集的飞行器状态变量,代表在第k次风况风速实验下收集的飞行器名义参考模型预测的飞行器加速度与实际仿真或飞行试验测量到的飞行器加速度的残差力误差项,即未建模的风干扰空气动力项;是典型的最小平方误差损失函数,是K分类网络的损失函数,通常为交叉熵损失函数;所述损失函数引入了分类误差,在训练的同时使分类模型能准确区分当前风况类别k,保证了训练的能学到与风况风速无关的共享空气动力模型。
进一步地,所述利用自适应控制中参考模型预测误差项信息对自适应参数进行更新
包括
在线自适应控制阶段,更新一组的线性系数λ(μ),线性系数λ(μ)代表不同风干扰时,与不同风场向量μ而不同的一组常数向量,通过自适应控制算法在线辩识即识别;
所述线性系数λ(μ)利用基于归一化最小二乘法的自适应估计方法得到,所述自适应估计方法包含参考轨迹前馈项、基本的PID控制反馈项、自适应参数更新率和基于归一化最小二乘法的时变矩阵协方差更新率,
具体如下:
其中,uF是旋翼飞行器控制率,λ是在线更新的自适应线性参数,R是时变协方差矩阵,e是参考轨迹跟踪误差项,PID(e)是根据参考轨迹跟踪误差项e设计的PID控制器,上标T是转置符号,r是预先设置的飞行器需要跟踪的大地坐标系下的位置参考轨迹指令,kr是根据跟踪参考轨迹设计的参考轨迹前馈控制系数,kr取值范围在0到1之间,根据实际参考轨迹跟踪情况调整,y是飞行器名义参考模型预测的飞行器加速度与实际仿真或实验测量到的飞行器加速度相减得到的残差力误差项。
进一步地,所述收集的飞行数据,包括用理论仿真法和实验法两种方法收集,理论仿真法是在计算机上通过仿真收集不同风场下的飞行器在常规PID控制器下跟踪预设轨迹时的仿真飞行状态数据集;实验法包括风洞试验、多档位工业风扇吹风试验或人在回路试验方式收集旋翼飞行器在常规PID控制器下跟踪预设轨迹时的实际飞行状态数据集。
进一步地,还包括通过李雅普诺夫稳定性定理来证明系统在风干扰影响下的未建模动力项与自适应项之间的误差稳定收敛性,具体包括
根据神经网络已被证明具有以任意精度拟合任意函数的能力,假设通过训练,深度神经网络已经准确学习到共享空气动力特征表示基函数同时设自适应参数参数λ的理想值为λ*,则残差力误差项y表示为设为自适应参数的估计误差,设风干扰影响下的未建模动力项与预测的残差力误差项的估计误差为ε,并且则自适应参数更新率表示为选择李雅普诺夫函数如下:
根据矩阵R与其逆矩阵R-1的乘积为单位矩阵I,即RR-1=I,则两边同时求导可知:
系统轨迹沿李雅普诺夫函数的导数为:
其中,||ε||表示估计误差ε的范数且其值大于等于零;根据李雅普诺夫稳定性定理,具有有限的极限且系统稳定;同时,根据常用于非线性自适应控制系统稳定性证明中的Barbalat引理,当李雅普诺夫函数的二阶导数是有界值时,李雅普诺夫函数的一阶导数是一致连续的,当时间趋于无穷大即t→∞时,李雅普诺夫函数导数趋于零即即估计误差ε收敛到零,满足旋翼飞行器系统在风干扰影响下的未建模动力项与自适应项之间的误差ε稳定收敛的要求。
本发明还提供一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至7任一项中所述的方法。
本发明还提供一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至7任一项中所述的方法。
本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
首先,通过预先收集的飞行数据对深度神经网络进行离线学习,训练近似拟合得到风干扰环境中产生的未建模空气动力项的基函数;然后,在自适应控制中利用参考模型预测误差项等信息对自适应参数进行更新;最后,结合反馈控制的思想,在设计的参考飞行轨迹跟踪控制器中,实时补偿在线自适应识别到的未能事先准确建模即未准确建模的风干扰空气动力项。
本发明设计的方法引入深度学习算法中对抗迁移学习的思想,在少样本数据条件下,进行一种有效的学习与风场无关的空气动力学的深度神经网络表征,通过深度神经网络可以拟合任意函数的特性,得出不同风况下的共享空气动力模型基函数,并引入对抗训练步骤,用分类网络消除不同风况变化带来的影响,提高了系统对不同风场的适应性。同时,本发明的技术方案改变飞行器的传统研制流程,突破对精确空气动力学模型的依赖,降低昂贵的风洞试验成本,缩短研制周期。
本发明设计的自适应控制方法中,引入了基于归一化的线性系数自适应估计策略,在证明了旋翼飞行器系统在风干扰影响下的未建模动力项与自适应项之间的误差稳定收敛性的同时,提高了系统的抗干扰鲁棒性。
附图说明
图1为本发明融合AI深度学习方法的飞行自适应控制算法框图;
图2为本发明深度神经网络离线学习阶段框图;
图3为本发明在线自适应控制与深度神经网络学习训练结果结合阶段框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,均属于本发明保护的范围。
下面结合附图和具体实施方案对本发明作进一步详细说明。以下实施例仅是说明性的,并不构成对本发明的限制。
本发明为解决旋翼型飞行器在不同风速干扰环境下的精准飞行轨迹跟踪控制问题,在控制系统中识别未建模风干扰空气动力项并在实时控制中对该项干扰进行补偿。基于上述目标,本发明通过建立旋翼飞行器的理论动力学模型,如图1所示,设计对抗迁移学习深度神经网络与自适应控制相结合的算法,通过在计算机上仿真或实际试飞收集不同风速干扰条件下飞行器在常规PID控制器下跟踪预设轨迹时的飞行状态数据集,利用数据集对提出的对抗迁移学习深度神经网络进行离线训练,最后采用自适应控制算法进行在线风干扰识别并补偿。具体实施分为如下四个步骤:
(1)设计融合AI深度学习与自适应控制相结合的算法框架
由于旋翼飞行器在面对外界环境干扰时,如不同风速剖面中会产生不同的未准确建模的风干扰空气动力项,这部分对飞行器在风影响下的精确轨迹跟踪造成重要影响,并且随着飞行动态环境的不同,该未建模空气动力项事先无法精准建模测量。考虑未准确建模的风干扰空气动力项的旋翼飞行器的动力学方程如下:
其中,各个状态含义如下:
大地水平坐标系下的位置状态向量:Pfs=[X,Y,Z]T,上标T表示矩阵转置,X表示北向坐标,Y表示东向坐标,Z表示地向坐标,原点设为起飞点;
飞行器质量:m;
重力加速度:g;
飞行器控制指令项:U=[U1 U2 U3 U4]T,U1为旋翼拉力控制量,U2为旋翼滚转力矩控制量,U3为旋翼俯仰力矩控制量,U4为旋翼偏航力矩控制量;
外界不同风况条件引起的未建模的风干扰空气动力项f(x,μ):f(x,μ)=[fX fYfZ]T为风干扰空气动力项在大地水平坐标系北向X轴,东向Y轴,地向Z轴三个方向上的分量,该未建模的空气动力项与飞行器的状态向量x和风场向量μ相关,其中状态向量选择为飞行器三维速度(三维)、以欧拉角表示的飞行器姿态俯仰角、滚转角和偏航角(三维)和以脉冲宽度调制信号(PWM)表示的旋翼四个电机转速控制指令(四维)的组合,其中四维是旋翼飞行器四个电机的转速控制信号,1号电机转速信号PWM1,2号电机转速信号PWM2,3号电机转速信号PWM3,4号电机转速信号PWM4;假设n种不同类别风速的风场分别表示为μ1,μ2,...,μn,其中某一具体的第k类风速设为μk;
神经网络已被证明具有以任意精度拟合任意函数的能力,特别是近年来,以深度神经网络(DNN)为基础发展的深度学习人工智能AI算法在各行业应用中都取得了惊人的成就。随着人工智能技术的发展,基于机器学习的智能设计技术已被证实可作为高性能控制系统设计的有效技术途径。为此,本发明设计融合AI深度学习与自适应控制相结合的算法,其算法框如图1所示;
融合AI深度学习与自适应控制相结合的算法包括离线学习阶段和用作实时在线学习的在线自适应控制阶段。对于离线学习阶段,采用对抗迁移学习算法,在少样本数据条件下,进行一种有效的学习与风场无关的空气动力学的深度神经网络(DNN)表征。深度神经网络的输出被视为代表风干扰空气动力学效应的一组基函数在线自适应控制阶段,更新一组的线性系数λ(μ),线性系数λ(μ)代表不同风干扰时,与不同风场向量μ而不同的一组常数向量,可以通过自适应控制算法在线识别。算法的目的在于可以通过融合AI深度学习与自适应控制算法拟合未准确建模的风干扰空气动力项f(x,μ),使其具有以下表达式:
其中,是通过深度神经网络学习的所有不同风况共享的表征基函数,用来学习捕捉未建模的动力学对无人机状态共同的依赖项,这个量与风速的大小无关,λ(μ)是一组的线性系数,就是通过自适应算法公式(2)在线辨识或识别,简记为λ,在不同风况下有不同的取值,通过自适应控制算法进行在线辨识,与λ(μ)相乘别可以近似拟合未准确建模的风干扰空气动力项f(x,μ)。当旋翼无人飞行器在线控制时,将估计的f(x,μ)加入到控制力中,实时补偿的未建模动态的影响,可使飞行器对参考轨迹进行精确跟踪;
(2)设计基于深度神经网络的对抗迁移学习算法
由于实际飞行时,无人飞行器随着风况的不同,时刻处于不同的动态环境中,深度神经网络学习到的模型需要具有处理不同任务的能力,目前动态环境中最流行的学习方案是元学习,即“学习到学习”,其目的是在从不同的任务或环境收集的数据中学习一个有效的模型。学习到的模型,通常表示为一个DNN,当给定的训练数据集有限时,其在理想情况下应该能够快速适应一个新的任务或一个未见过的环境;
本发明采用的对抗迁移学习深度网络采用全连接形式,共训练两个网络和ξ,二者为两个不同的DNN。网络的输出是不同风况共享的空气动力表示函数,即与风况无关;自适应参数λ(μ)是与风况有关的线性系数,不同的风况都有一个特定的参数λ(μ),如第k类风况有一个特定的参数λ(μk);目的是训练一个深度神经网络使其和λ(μ)的乘积能够近似的表示不同风况下的不确定空气动力项f(x,μ)。由于训练集是飞行器在不同风况下的速度、姿态、电机转速等飞行状态量x的数据,在实际飞行中,飞行器自身的状态量x会因为风况风速的变化发生改变,直接简单的用一个最小平方误差损失函数去训练得出的神经网络大概率会学习到跟风况有关的空气动力模型。所以为了消除风况风速变化带来的影响,真正让网络学到与风况无关的共享空气动力模型,引入分类网络ξ,网络ξ的作用是输入不同风况下的能够输出对应的风况风速类别k,并且引入对抗训练的思想,将分类网络ξ作为鉴别器,同时训练和ξ两个DNN网络,对抗训练是指在每轮迭代中,首先使分类网络ξ固定网络参数更新网络之后使网络固定网络参数更新网络ξ,二者达到纳什均衡即完成训练;
采用最小二乘和随机梯度下降法训练深度学习神经网络,神经网络的输入状态量是飞行器三维速度(三维)、以欧拉角表示的飞行器姿态俯仰角、滚转角和偏航角(三维)和以脉冲宽度调制信号(PWM)表示的旋翼四个电机转速控制指令(四维);神经网络的输出状态为不同风况共享的表示基函数(五维行向量)。结合自适应控制算法在线更新的线性系数λ(μ)=[λX(μ) λY(μ) λZ(μ)]T(十五维,每个轴的自适应参数向量λX(μ)、λY(μ)和λZ(μ)分别为五维列向量),神经网络的五维输出和自适应控制更新的十五维线性系数的前五维λX(μ),中五维λY(μ)和后五维λZ(μ),分别相乘,正好得到三个数,用这三个数来近似风场在大地坐标系下三个轴即北向X轴,东向Y轴,地向Z轴的三个分量,表示飞行器在大地坐标系下的三轴未建模空气动力项f(x,μ)=[fX fY fZ]T(三维)为:
对抗迁移学习深度网络的损失函数如下:
其中k代表n次不同风况实验下收集的单次数据,NK代表在第k次风况实验下收集的样本点的总数,i代表在第k次风况实验下收集的样本点的总数中的一个样本点,代表在第k次风况风速实验下收集的飞行器状态变量,代表在第k次风况风速实验下收集的飞行器名义参考模型预测的飞行器加速度与实际仿真或飞行试验测量到的飞行器加速度的残差力误差项,即未建模的空气动力项。是典型的最小平方误差损失函数,是K分类网络的损失函数,通常为交叉熵损失函数。上述损失函数引入了分类误差,在训练的同时使分类模型能准确区分当前风况类别k,保证了训练的能学到与风况风速无关的共享空气动力模型;
对抗迁移学习深度网络训练过程如下表1所示
表1训练过程
(3)数据增强的离线/在线机器训练
数据集收集策略分为理论仿真法和实验法两种。理论仿真法是在计算机上通过仿真收集不同风场下的飞行器在常规PID控制器下跟踪预设轨迹时的仿真飞行状态数据集;实验法通过设计室内与室外的静态、动态测试实验环境,通过风洞试验、多档位工业风扇吹风试验或人在回路试验得方式收集旋翼飞行器在常规PID控制器下跟踪预设轨迹时的实际飞行状态数据集;
对于在线自适应控制阶段,目标是适应离线学习的模型,给定来自训练环境及训练任务、新环境或新任务的有限的在线数据,例如微调特定风况下的空气动力特征,在线自适应控制与深度神经网络学习训练结果结合阶段框图,具体如图3所示:
(4)设计基于归一化最小二乘法的自适应控制算法
通过深度神经网络训练,可以找到共享空气动力特征表示基函数使每批次数据预测的误差最小。对于在线控制阶段,为使旋翼飞行器对期望轨迹的跟踪误差最小化,关键在于实时识别准确的风干扰并进行补偿;同时由于深度神经网络训练得到的共享空气动力特征表示基函数的幅值可能比较大,实际系统不可避免测量噪声会引入自适应更新过程中,这会使得按照传统设计方法得到的自适应参数更新过快,最终导致自适应项发散,系统的鲁棒性变差。
基于上述目的,本发明提出了基于归一化最小二乘法的线性系数自适应估计方法,利用归一化技术使得自适应项的幅值减小进而来提升系统的鲁棒性,并将其与传统PID控制技术相结合。这种方法可以在线自动调整增益,能够快速估计与风况风速相关的具有较大不确定性的参数λ(μ)。本发明提出的在线自适应控制算法包含参考轨迹前馈项、基本的PID控制反馈项、自适应参数更新率和基于基于归一化最小二乘法的时变矩阵协方差更新率,并用控制系统稳定性证明常用的李雅普诺夫稳定定理证明了旋翼飞行器系统在风干扰影响下的未建模动力项与自适应项之间的误差稳定收敛性,控制框图如图1所示,具体如下:
其中,uF是旋翼飞行器控制率,λ是在线更新的自适应线性参数,R是时变协方差矩阵,e是参考轨迹跟踪误差项,PID(e)是根据参考轨迹跟踪误差项e设计的PID控制器,上标T是转置符号,r是预先设置的飞行器需要跟踪的大地坐标系下的位置参考轨迹指令,kr是根据跟踪参考轨迹设计的参考轨迹前馈控制系数,kr取值范围在0到1之间,作为实例取0或0.5或1,本实施例中取0.5,根据实际参考轨迹跟踪情况调整,y是飞行器名义参考模型预测的飞行器加速度与实际仿真或实验测量到的飞行器加速度相减得到的残差力误差项;参考轨迹是需要跟踪的轨迹,是预先设计的飞行器拟飞行的位置信息的参考轨迹;飞行器名义参考模型即是公式(1)描述的模型。
通过李雅普诺夫稳定性定理来证明系统在风干扰影响下的未建模动力项与自适应项之间的误差稳定收敛性。根据神经网络已被证明具有以任意精度拟合任意函数的能力,假设通过训练,深度神经网络已经准确学习到共享空气动力特征表示基函数同时设自适应参数参数λ的理想值为λ*,则残差力误差项y可以表示为设为自适应参数的估计误差,设风干扰影响下的未建模动力项与预测的残差力误差项的估计误差为ε,并且则自适应参数更新率可表示为选择李雅普诺夫函数如下:
根据矩阵R与其逆矩阵R-1的乘积为单位矩阵I,即RR-1=I,则两边同时求导可知:
系统轨迹沿李雅普诺夫函数的导数为:
其中,||ε||表示估计误差ε的范数且其值大于等于零。根据李雅普诺夫稳定性定理,具有有限的极限且系统稳定。同时,根据常用于非线性自适应控制系统稳定性证明中的Barbalat引理,当李雅普诺夫函数的二阶导数是有界值时,李雅普诺夫函数的一阶导数是一致连续的,当时间趋于无穷大即t→∞时,李雅普诺夫函数导数趋于零即即估计误差ε收敛到零,满足旋翼飞行器系统在风干扰影响下的未建模动力项与自适应项之间的误差ε稳定收敛的要求。
本发明还提供一种计算机可读的存储介质,计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行前述的方法。
本发明还提供一种电子装置,包括存储器和处理器,存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行程序运行时执行前述的方法。
综上所述,本发明一种设计融合AI深度学习的旋翼飞行器轨迹跟踪自适应控制方法。
Claims (9)
1.融合AI深度学习的旋翼飞行器轨迹跟踪自适应控制方法,其特征在于利用AI深度学习与自适应控制相结合的算法,获得风干扰环境下的未准确建模的风干扰空气动力项,对在不同风速干扰环境下的旋翼飞行器进行轨迹跟踪自适应控制,包括如下步骤:
通过收集的飞行数据对深度神经网络进行离线学习,训练近似拟合得到风干扰环境下的未准确建模的风干扰空气动力项的基函数;
利用自适应控制中参考模型预测误差项信息对自适应参数进行更新;
结合所述基函数和所述自适应参数,获得风干扰环境下的未准确建模的风干扰空气动力项;
结合反馈控制,在设计的飞行轨迹跟踪控制器中,实时补偿在线自适应识别到的未准确建模的风干扰空气动力学项。
2.根据权利要求1所述的旋翼飞行器轨迹跟踪自适应控制方法,其特征在于利用AI深度学习与自适应控制相结合的算法获得风干扰环境下的未准确建模的风干扰空气动力项
包括
未准确建模的风干扰空气动力项的动力学方程为:
其中,各个状态含义如下:
大地水平坐标系下的位置状态向量:Pfs=[X,Y,Z]T,上标T表示矩阵转置,X表示北向坐标,Y表示东向坐标,Z表示地向坐标,原点设为起飞点;
飞行器质量:m;
重力加速度:g;
飞行器控制指令项:U=[U1 U2 U3 U4]T,U1为旋翼拉力控制量,U2为旋翼滚转力矩控制量,U3为旋翼俯仰力矩控制量,U4为旋翼偏航力矩控制量;
外界不同风况条件引起的未建模的风干扰空气动力项f(x,μ):f(x,μ)=[fX fY fZ]T为风干扰空气动力项在大地水平坐标系北向X轴,东向Y轴,地向Z轴三个方向上的分量,该未建模的空气动力项与飞行器的状态向量x和风场向量μ相关,其中状态向量选择为飞行器三维速度(3维)、以欧拉角表示的飞行器姿态俯仰角、滚转角和偏航角(3维)和以脉冲宽度调制信号(PWM)表示的旋翼四个电机转速控制指令四维组合,其中四维是旋翼飞行器四个电机的转速控制信号;假设n种不同类别风速的风场分别表示为μ1,μ2,...,μn,其中某一具体的第k类风速设为μk;
通过融合AI深度学习与自适应控制算法拟合未准确建模的风干扰空气动力学项f(x,μ),使其具有以下表达式:
其中,是通过深度神经网络学习的所有不同风况共享的表征基函数,即用来学习捕捉未建模的动力学对无人机状态共同的依赖项,这个量与风速的大小无关,λ(μ)是一组的线性系数,简记为λ,λ(μ)在不同风况下有不同的取值,通过自适应控制算法进行在线辨识,与λ(μ)相乘近似拟合未准确建模的风干扰空气动力学项f(x,μ);
当旋翼无人飞行器在线控制时,将近似拟合的未准确建模的风干扰空气动力学项f(x,μ)加入到控制力中,予以实时补偿,消除未准确建模的动态影响,使飞行器对参考轨迹进行精确跟踪。
3.根据权利要求2所述的旋翼飞行器轨迹跟踪自适应控制方法,其特征在于所述通过预先收集的飞行数据对深度神经网络进行离线学习,训练近似拟合得到风干扰环境下的未准确建模的风干扰空气动力项中所有不同风况共享的表征基函数
包括
引入深度神经网络学习算法中的对抗迁移学习深度网络,在少样本数据条件下,进行有效的学习与风场无关的空气动力学的深度神经网络表征,通过深度神经网络拟合任意函数的特性,深度神经网络的输出被视为代表风干扰空气动力学效应的一组基函数即不同风况下的共享空气动力模型基函数并引入对抗训练步骤,用分类网络消除不同风况变化带来的影响,具体为
所述对抗迁移学习深度网络采用全连接形式,共训练两个网络和ξ,二者为两个不同的DNN;网络的输出是不同风况共享的空气动力表示函数,即与风况无关;自适应参数λ(μ)是与风况有关的线性系数,不同的风况都有一个特定的参数λ(μ),第k类风况有一个特定的参数λ(μk);训练一个深度神经网络使其和λ(μ)的乘积能够近似的表示不同风况下的不确定风干扰空气动力项f(x,μ);引入分类网络ξ,网络ξ的作用是输入不同风况下的能够输出对应的风况风速类别k,并且引入对抗训练,将分类网络ξ作为鉴别器,同时训练和ξ两个DNN网络,对抗训练是指在每轮迭代中,首先使分类网络ξ固定网络参数更新网络之后使网络固定网络参数更新网络ξ,二者达到纳什均衡即完成训练。
4.根据权利要求3所述的旋翼飞行器轨迹跟踪自适应控制方法,其特征在于所述对抗迁移学习深度网络采用的对抗训练算法具体包括
采用最小二乘和随机梯度下降法训练深度神经网络即对抗迁移学习深度网络,神经网络的输入状态量是飞行器三维速度(3维)、以欧拉角表示的飞行器姿态俯仰角、滚转角和偏航角(3维)和以脉冲宽度调制信号(PWM)表示的旋翼四个电机转速控制指令(4维);神经网络的输出状态为不同风况共享的表示基函数(5维行向量);结合自适应控制算法在线更新的线性系数λ(μ)=[λX(μ) λY(μ) λZ(μ)]T(15维,每个轴的自适应参数向量λX(μ)、λY(μ)和λZ(μ)分别为5维列向量),神经网络的5维输出和自适应控制更新的15维线性系数的前5维λX(μ),中5维λY(μ)和后5维λZ(μ),分别相乘,正好得到三个数,用这三个数来近似风场在大地坐标系下三个轴即北向X轴,东向Y轴,地向Z轴的三个分量,表示飞行器在大地坐标系下的三轴未建模空气动力项f(x,μ)=[fX fY fZ]T(3维)为:
对抗迁移学习深度网络的损失函数如下:
5.根据权利要求1-4中任一项所述的旋翼飞行器轨迹跟踪自适应控制方法,其特征在于所述利用自适应控制中参考模型预测误差项信息对自适应参数进行更新
包括
在线自适应控制阶段,更新一组的线性系数λ(μ),线性系数λ(μ)代表不同风干扰时,与不同风场向量μ而不同的一组常数向量,通过自适应控制算法在线辩识即识别;
所述线性系数λ(μ)利用基于归一化最小二乘法的自适应估计方法得到,所述自适应估计方法包含参考轨迹前馈项、基本的PID控制反馈项、自适应参数更新率和基于归一化最小二乘法的时变矩阵协方差更新率,
具体如下:
其中,uF是旋翼飞行器控制率,λ是在线更新的自适应线性参数,R是时变协方差矩阵,e是参考轨迹跟踪误差项,PID(e)是根据参考轨迹跟踪误差项e设计的PID控制器,上标T是转置符号,r是预先设置的飞行器需要跟踪的大地坐标系下的位置参考轨迹指令,kr是根据跟踪参考曲线设计的参考轨迹前馈控制系数,kr取值范围在0到1之间,根据实际参考轨迹跟踪情况调整,y是飞行器名义参考模型预测的机体加速度与实际仿真或实验测量到的机体加速度相减得到的残差力误差项。
6.根据权利要求1所述的旋翼飞行器轨迹跟踪自适应控制方法,其特征在于所述收集的飞行数据,包括用理论仿真法和实验法两种方法收集,理论仿真法是在计算机上通过仿真收集不同风场下的飞行器在常规PID控制器下跟踪预设轨迹时的仿真飞行状态数据集;实验法包括风洞试验、多档位工业风扇吹风试验或人在回路试验方式收集旋翼飞行器在常规PID控制器下跟踪预设轨迹时的实际飞行状态数据集。
7.根据权利要求1-6中任一项所述的旋翼飞行器轨迹跟踪自适应控制方法,其特征在于还包括通过李雅普诺夫稳定性定理来证明系统在风干扰影响下的未建模动力项与自适应项之间的误差稳定收敛性,具体包括
根据神经网络已被证明具有以任意精度拟合任意函数的能力,假设通过训练,深度神经网络已经准确学习到共享空气动力特征表示基函数同时设自适应参数参数λ的理想值为λ*,则残差力误差项y表示为设为自适应参数的估计误差,设风干扰影响下的未建模动力项与预测的残差力误差项的估计误差为ε,并且则自适应参数更新率表示为选择李雅普诺夫函数如下:
根据矩阵R与其逆矩阵R-1的乘积为单位矩阵I,即RR-1=I,则两边同时求导可知:
系统轨迹沿李雅普诺夫函数的导数为:
8.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至7任一项中所述的方法。
9.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至7任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211469247.9A CN115793453A (zh) | 2022-11-22 | 2022-11-22 | 融合ai深度学习的旋翼飞行器轨迹跟踪自适应控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211469247.9A CN115793453A (zh) | 2022-11-22 | 2022-11-22 | 融合ai深度学习的旋翼飞行器轨迹跟踪自适应控制方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115793453A true CN115793453A (zh) | 2023-03-14 |
Family
ID=85440238
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211469247.9A Pending CN115793453A (zh) | 2022-11-22 | 2022-11-22 | 融合ai深度学习的旋翼飞行器轨迹跟踪自适应控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115793453A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116993832A (zh) * | 2023-09-27 | 2023-11-03 | 中国电子科技集团公司第十五研究所 | 一种基于cnn的飞行目标的位置预测方法及装置 |
CN117421984A (zh) * | 2023-11-02 | 2024-01-19 | 中国人民解放军海军航空大学 | 基于多模态学习的短期航迹预测方法 |
CN117666332A (zh) * | 2024-02-02 | 2024-03-08 | 北京航空航天大学 | 一种动态扰动环境下多旋翼飞行器自学习抗干扰控制方法 |
CN117806364A (zh) * | 2023-12-22 | 2024-04-02 | 华中科技大学 | 航行器路径跟踪控制器的对抗学习架构、控制方法和装置 |
CN117875090A (zh) * | 2024-03-12 | 2024-04-12 | 中国空气动力研究与发展中心空天技术研究所 | 一种考虑风干扰的固定翼无人机增量元飞行气动建模方法 |
CN117891238A (zh) * | 2024-03-13 | 2024-04-16 | 青岛科技大学 | 一种阻拦着舰装备中定长冲跑阀故障诊断方法 |
CN117970942A (zh) * | 2024-01-30 | 2024-05-03 | 深圳市海科技术有限公司 | 一种视觉同步的无人机飞行控制系统及控制方法 |
-
2022
- 2022-11-22 CN CN202211469247.9A patent/CN115793453A/zh active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116993832A (zh) * | 2023-09-27 | 2023-11-03 | 中国电子科技集团公司第十五研究所 | 一种基于cnn的飞行目标的位置预测方法及装置 |
CN116993832B (zh) * | 2023-09-27 | 2023-12-08 | 中国电子科技集团公司第十五研究所 | 一种基于cnn的飞行目标的位置预测方法及装置 |
CN117421984A (zh) * | 2023-11-02 | 2024-01-19 | 中国人民解放军海军航空大学 | 基于多模态学习的短期航迹预测方法 |
CN117806364A (zh) * | 2023-12-22 | 2024-04-02 | 华中科技大学 | 航行器路径跟踪控制器的对抗学习架构、控制方法和装置 |
CN117806364B (zh) * | 2023-12-22 | 2024-05-28 | 华中科技大学 | 航行器路径跟踪控制器的对抗学习架构、控制方法和装置 |
CN117970942A (zh) * | 2024-01-30 | 2024-05-03 | 深圳市海科技术有限公司 | 一种视觉同步的无人机飞行控制系统及控制方法 |
CN117666332A (zh) * | 2024-02-02 | 2024-03-08 | 北京航空航天大学 | 一种动态扰动环境下多旋翼飞行器自学习抗干扰控制方法 |
CN117666332B (zh) * | 2024-02-02 | 2024-04-05 | 北京航空航天大学 | 一种动态扰动环境下多旋翼飞行器自学习抗干扰控制方法 |
CN117875090A (zh) * | 2024-03-12 | 2024-04-12 | 中国空气动力研究与发展中心空天技术研究所 | 一种考虑风干扰的固定翼无人机增量元飞行气动建模方法 |
CN117891238A (zh) * | 2024-03-13 | 2024-04-16 | 青岛科技大学 | 一种阻拦着舰装备中定长冲跑阀故障诊断方法 |
CN117891238B (zh) * | 2024-03-13 | 2024-05-28 | 青岛科技大学 | 一种阻拦着舰装备中定长冲跑阀故障诊断方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115793453A (zh) | 融合ai深度学习的旋翼飞行器轨迹跟踪自适应控制方法 | |
CN108445766B (zh) | 基于rpd-smc和rise的无模型四旋翼无人机轨迹跟踪控制器及方法 | |
CN106444799B (zh) | 基于模糊扩张状态观测器和自适应滑模的四旋翼无人机控制方法 | |
Madani et al. | Adaptive control via backstepping technique and neural networks of a quadrotor helicopter | |
CN109991991B (zh) | 一种无人直升机鲁棒容错跟踪方法 | |
Lai et al. | Adaptive position/attitude tracking control of aerial robot with unknown inertial matrix based on a new robust neural identifier | |
CN108803317A (zh) | 自适应多变量四旋翼无人机有限时间容错控制方法 | |
CN111185907A (zh) | 一种作业型飞行机器人抓取后的位姿稳定控制方法 | |
CN111781942B (zh) | 一种基于自构造模糊神经网络的容错飞行控制方法 | |
CN113867374B (zh) | 基于滑模控制的四旋翼无人机参数预测和扰动的自适应轨迹跟踪控制器及其设计方法 | |
CN114815861A (zh) | 一种基于时空径向基函数神经网络的容错飞行控制方法 | |
CN112578805A (zh) | 一种旋翼飞行器的姿态控制方法 | |
CN107817818B (zh) | 一种模型不确定飞艇航迹跟踪有限时间控制方法 | |
CN113568423A (zh) | 一种考虑电机故障的四旋翼无人机智能容错控制方法 | |
Ou et al. | Adaptive backstepping tracking control for quadrotor aerial robots subject to uncertain dynamics | |
CN115373275A (zh) | 四旋翼无人机的指定时间预定性能容错控制方法 | |
dos Santos et al. | An experimental validation of reinforcement learning applied to the position control of UAVs | |
CN113391555B (zh) | 基于非线性扰动观测器的四旋翼无人机降落控制方法 | |
CN117055593A (zh) | 一种旋翼无人机避障滑模容错控制方法 | |
Abdelmaksoud et al. | Disturbance rejection for a quadrotor using robust active force control with genetic algorithm | |
Khebbache | Robust control algorithm considering the actuator faults for attitude tracking of an uav quadrotor aircraft | |
CN110376883A (zh) | 四旋翼无人机终端滑模控制方法、系统、介质及设备 | |
CN116203840A (zh) | 可重复使用运载器自适应增益调度控制方法 | |
CN115685760A (zh) | 一种面向执行器故障的四旋翼混合容错控制方法及系统 | |
Housny et al. | Robust sliding mode control for quadrotor UAV |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |