CN115793453A

CN115793453A - 融合ai深度学习的旋翼飞行器轨迹跟踪自适应控制方法

Info

Publication number: CN115793453A
Application number: CN202211469247.9A
Authority: CN
Inventors: 张达; 兰子柠; 潘静; 陈文鑫; 潘芷纯; 李康伟; 张华君; 刘青
Original assignee: Hubei Institute Of Aerospacecraft
Current assignee: Hubei Institute Of Aerospacecraft
Priority date: 2022-11-22
Filing date: 2022-11-22
Publication date: 2023-03-14

Abstract

本发明公开了融合AI深度学习的旋翼飞行器轨迹跟踪自适应控制方法，利用AI深度学习与自适应控制相结合的算法，获得风干扰环境下的未准确建模的风干扰空气动力项，对在不同风速干扰环境下的旋翼飞行器进行轨迹跟踪自适应控制；结合所述基函数和所述自适应参数，获得风干扰环境下的未准确建模的风干扰空气动力项；结合反馈控制，在预先设计的飞行器需要跟踪的参考轨迹的飞行参考轨迹跟踪控制器中，实时补偿在线自适应识别到的未准确建模的风干扰空气动力学项。本发明引入了基于归一化的线性系数自适应估计策略，在证明了旋翼飞行器系统在风干扰影响下的未建模动力项与自适应项之间的误差稳定收敛性的同时，提高了系统的抗干扰鲁棒性。

Description

融合AI深度学习的旋翼飞行器轨迹跟踪自适应控制方法

技术领域

本发明属于飞行器导航、定位与控制的技术领域，具体涉及一种融合AI深度学习的旋翼飞行器轨迹跟踪自适应控制方法。

背景技术

旋翼型飞行器具有结构原理简单、造价低、可垂直起降、定点悬停和维护方便等优势，能够完成很多有人飞行器无法完成的任务，尤其近年来结合人工智能等新兴技术，在军事和民用领域得到了广泛的应用。

随着科技发展和军事格局的不断变化，对旋翼飞行器的性能也提出更高要求，尤其是在高空或海上大风干扰环境下的精准飞行轨迹跟踪控制性能的好坏，是决定其未来能否具备实用拓展能力的关键指标之一，而目前这一问题并未得到有效解决。因此，研究并解决旋翼型飞行器的风干扰环境下的精准飞行轨迹跟踪控制问题具有重大的应用前景。

在外界风干扰环境下，旋翼型飞行器的精确动力学模型难以建立，外界风环境给飞行器模型带来了严重非线性、强耦合干扰的未建模动力学影响，能否在控制器的设计过程中有效补偿风干扰，是其能否精准跟踪飞行轨迹的关键。同时，不同风场的风速不同，造成的风干扰力不同，要提升旋翼飞行器控制系统在未知风场环境中的适应性和鲁棒性，使得设计适应不同风速的环境的飞行轨迹跟踪控制方法的难点问题亟待解决。

发明内容

本发明的目的在于解决上述难点问题，针对旋翼型飞行器在不同风速干扰环境下的理论飞行轨迹跟踪控制的任务应用，而提供一种融合AI深度学习的旋翼飞行器轨迹跟踪自适应控制方法。

为了实现上述目的，本发明提供如下方法：

融合AI深度学习的旋翼飞行器轨迹跟踪自适应控制方法，利用AI深度学习与自适应控制相结合的算法，获得风干扰环境下的未准确建模的风干扰空气动力项，对在不同风速干扰环境下的旋翼飞行器进行轨迹跟踪自适应控制，包括如下步骤：

通过收集的飞行数据对深度神经网络进行离线学习，训练近似拟合得到风干扰环境下的未准确建模的风干扰空气动力项的基函数；

利用自适应控制中参考模型预测误差项信息对自适应参数进行更新；

结合所述基函数和所述自适应参数，获得风干扰环境下的未准确建模的风干扰空气动力项；

结合反馈控制，在预先设计的飞行器需要跟踪的参考轨迹的飞行参考轨迹跟踪控制器中，实时补偿在线自适应识别到的未准确建模的风干扰空气动力学项。

进一步地，利用AI深度学习与自适应控制相结合的算法获得风干扰环境下的未准确建模的风干扰空气动力项

包括

未准确建模的风干扰空气动力项的动力学方程为：

其中，各个状态含义如下：

大地水平坐标系下的位置状态向量：P_fs＝[X,Y,Z]^T，上标T表示矩阵转置，X表示北向坐标，Y表示东向坐标，Z表示地向坐标，原点设为起飞点；

姿态欧拉角状态：Θ_fs＝[φ,θ,ψ]，滚转角φ，偏航角ψ，俯仰角θ，滚转角速度

偏航角速度

俯仰角速度

转动惯量：滚转轴转动惯量

偏航轴转动惯量

俯仰轴转动惯量

飞行器质量：m；

重力加速度：g；

飞行器控制指令项：U＝[U₁ U₂ U₃ U₄]^T，U₁为旋翼拉力控制量，U₂为旋翼滚转力矩控制量，U₃为旋翼俯仰力矩控制量，U₄为旋翼偏航力矩控制量；

外界不同风况条件引起的未建模的风干扰空气动力项f(x,μ)：f(x,μ)＝[f_X f_Yf_Z]^T为风干扰空气动力项在大地水平坐标系北向X轴，东向Y轴，地向Z轴三个方向上的分量，该未建模的空气动力项与飞行器的状态向量x和风场向量μ相关，其中状态向量选择为飞行器三维速度(三维)、以欧拉角表示的飞行器姿态俯仰角、滚转角和偏航角(三维)和以脉冲宽度调制信号(PWM)表示的旋翼四个电机转速控制指令四维组合，其中四维是旋翼飞行器四个电机的转速控制信号；假设n种不同类别风速的风场分别表示为μ₁,μ₂,...,μ_n，其中某一具体的第k类风速设为μ_k；

通过融合AI深度学习与自适应控制算法拟合未准确建模的风干扰空气动力学项f(x,μ)，使其具有以下表达式：

其中，

是通过深度神经网络学习的所有不同风况共享的表征基函数，即用来学习捕捉未建模的动力学对无人机状态共同的依赖项，这个量与风速的大小无关，λ(μ)是一组的线性系数，简记为λ，在不同风况下有不同的取值，通过自适应控制算法进行在线辨识，

与λ(μ)相乘近似拟合未准确建模的风干扰空气动力学项f(x,μ)；

当旋翼无人飞行器在线控制时，将近似拟合的未准确建模的风干扰空气动力学项f(x,μ)加入到控制力中，予以实时补偿，消除未准确建模的动态影响，使飞行器对参考轨迹进行精确跟踪。

进一步地，所述通过预先收集的飞行数据对深度神经网络进行离线学习，训练近似拟合得到风干扰环境下的未准确建模的风干扰空气动力项中所有不同风况共享的表征基函数

包括

引入深度神经网络学习算法中的对抗迁移学习深度网络，在少样本数据条件下，进行有效的学习与风场无关的空气动力学的深度神经网络表征，通过深度神经网络拟合任意函数的特性，深度神经网络的输出被视为代表风干扰空气动力学效应的一组基函数即不同风况下的共享空气动力模型基函数

并引入对抗训练步骤，用分类网络消除不同风况变化带来的影响，具体为

所述对抗迁移学习深度网络采用全连接形式，共训练两个网络

和ξ，二者为两个不同的DNN；网络

的输出

是不同风况共享的空气动力表示函数，即

与风况无关；自适应参数λ(μ)是与风况有关的线性系数，不同的风况都有一个特定的参数λ(μ)，第k类风况有一个特定的参数λ(μ_k)；训练一个深度神经网络

使其和λ(μ)的乘积能够近似的表示不同风况下的不确定风干扰空气动力项f(x,μ)；由于训练集是飞行器在不同风况下的速度、姿态、电机转速等飞行状态量x的数据，在实际飞行中，飞行器自身的状态量x会因为风况风速的变化发生改变，直接简单的用一个最小平方误差损失函数去训练得出的

神经网络大概率会学习到跟风况有关的空气动力模型，所以为了消除风况风速变化带来的影响，真正让网络

学到与风况无关的共享空气动力模型；引入分类网络ξ，网络ξ的作用是输入不同风况下的

能够输出对应的风况风速类别k，并且引入对抗训练，将分类网络ξ作为鉴别器，同时训练

和ξ两个DNN网络，对抗训练是指在每轮迭代中，首先使分类网络ξ固定网络参数更新网络

之后使网络

固定网络参数更新网络ξ，二者达到纳什均衡即完成训练。

进一步地，所述对抗迁移学习深度网络采用的对抗训练算法具体包括

采用最小二乘和随机梯度下降法训练深度神经网络即对抗迁移学习深度网络，神经网络的输入状态量是飞行器三维速度(三维)、以欧拉角表示的飞行器姿态俯仰角、滚转角和偏航角(三维)和以脉冲宽度调制信号(PWM)表示的旋翼四个电机转速控制指令(四维)；神经网络的输出状态为不同风况共享的表示基函数

(五维行向量)；结合自适应控制算法在线更新的线性系数λ(μ)＝[λ_X(μ) λ_Y(μ) λ_Z(μ)]^T(十五维，每个轴的自适应参数向量λ_X(μ)、λ_Y(μ)和λ_Z(μ)分别为五维列向量)，神经网络的五维输出

和自适应控制更新的十五维线性系数的前五维λ_X(μ)，中五维λ_Y(μ)和后五维λ_Z(μ)，分别相乘，正好得到三个数，用这三个数来近似风场在大地坐标系下三个轴即北向X轴，东向Y轴，地向Z轴的三个分量，表示飞行器在大地坐标系下的三轴未建模空气动力项f(x,μ)＝[f_X f_Y f_Z]^T(三维)为：

对抗迁移学习深度网络的损失函数如下：

其中k代表n次不同风况实验下收集的单次数据，N_K代表在第k次风况实验下收集的样本点的总数，i代表在第k次风况实验下收集的样本点的总数中的一个样本点，

代表在第k次风况风速实验下收集的飞行器状态变量，

代表在第k次风况风速实验下收集的飞行器名义参考模型预测的飞行器加速度与实际仿真或飞行试验测量到的飞行器加速度的残差力误差项，即未建模的风干扰空气动力项；

是典型的最小平方误差损失函数，

是K分类网络的损失函数，通常为交叉熵损失函数；所述损失函数引入了分类误差，在训练

的同时使分类模型能准确区分当前风况类别k，保证了训练的

能学到与风况风速无关的共享空气动力模型。

进一步地，所述利用自适应控制中参考模型预测误差项信息对自适应参数进行更新

包括

在线自适应控制阶段，更新一组的线性系数λ(μ)，线性系数λ(μ)代表不同风干扰时，与不同风场向量μ而不同的一组常数向量，通过自适应控制算法在线辩识即识别；

所述线性系数λ(μ)利用基于归一化最小二乘法的自适应估计方法得到，所述自适应估计方法包含参考轨迹前馈项、基本的PID控制反馈项、自适应参数更新率和基于归一化最小二乘法的时变矩阵协方差更新率，

具体如下：

其中，u_F是旋翼飞行器控制率，λ是在线更新的自适应线性参数，R是时变协方差矩阵，e是参考轨迹跟踪误差项，PID(e)是根据参考轨迹跟踪误差项e设计的PID控制器，上标T是转置符号，r是预先设置的飞行器需要跟踪的大地坐标系下的位置参考轨迹指令，k_r是根据跟踪参考轨迹设计的参考轨迹前馈控制系数，k_r取值范围在0到1之间，根据实际参考轨迹跟踪情况调整，y是飞行器名义参考模型预测的飞行器加速度与实际仿真或实验测量到的飞行器加速度相减得到的残差力误差项。

进一步地，所述收集的飞行数据，包括用理论仿真法和实验法两种方法收集，理论仿真法是在计算机上通过仿真收集不同风场下的飞行器在常规PID控制器下跟踪预设轨迹时的仿真飞行状态数据集；实验法包括风洞试验、多档位工业风扇吹风试验或人在回路试验方式收集旋翼飞行器在常规PID控制器下跟踪预设轨迹时的实际飞行状态数据集。

进一步地，还包括通过李雅普诺夫稳定性定理来证明系统在风干扰影响下的未建模动力项与自适应项之间的误差稳定收敛性，具体包括

根据神经网络已被证明具有以任意精度拟合任意函数的能力，假设通过训练，深度神经网络已经准确学习到共享空气动力特征表示基函数

同时设自适应参数参数λ的理想值为λ^*，则残差力误差项y表示为

设

为自适应参数的估计误差，设风干扰影响下的未建模动力项与预测的残差力误差项的估计误差为ε，并且

则自适应参数更新率表示为

选择李雅普诺夫函数如下：

其中，R^-1中为矩阵R的逆，

为矩阵

的迹；

根据矩阵R与其逆矩阵R^-1的乘积为单位矩阵I，即RR^-1＝I，则两边同时求导可知：

系统轨迹沿李雅普诺夫函数的导数为：

其中，||ε||表示估计误差ε的范数且其值大于等于零；根据李雅普诺夫稳定性定理，

具有有限的极限且系统稳定；同时，根据常用于非线性自适应控制系统稳定性证明中的Barbalat引理，当李雅普诺夫函数的二阶导数

是有界值时，李雅普诺夫函数的一阶导数

是一致连续的，当时间趋于无穷大即t→∞时，李雅普诺夫函数导数趋于零即

即估计误差ε收敛到零，满足旋翼飞行器系统在风干扰影响下的未建模动力项与自适应项之间的误差ε稳定收敛的要求。

本发明还提供一种计算机可读的存储介质，其特征在于，所述计算机可读的存储介质包括存储的程序，其中，所述程序运行时执行上述权利要求1至7任一项中所述的方法。

本发明还提供一种电子装置，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为通过所述计算机程序执行所述权利要求1至7任一项中所述的方法。

本发明所构思的以上技术方案与现有技术相比，能够取得下列有益效果：

首先，通过预先收集的飞行数据对深度神经网络进行离线学习，训练近似拟合得到风干扰环境中产生的未建模空气动力项的基函数；然后，在自适应控制中利用参考模型预测误差项等信息对自适应参数进行更新；最后，结合反馈控制的思想，在设计的参考飞行轨迹跟踪控制器中，实时补偿在线自适应识别到的未能事先准确建模即未准确建模的风干扰空气动力项。

本发明设计的方法引入深度学习算法中对抗迁移学习的思想，在少样本数据条件下，进行一种有效的学习与风场无关的空气动力学的深度神经网络表征，通过深度神经网络可以拟合任意函数的特性，得出不同风况下的共享空气动力模型基函数，并引入对抗训练步骤，用分类网络消除不同风况变化带来的影响，提高了系统对不同风场的适应性。同时，本发明的技术方案改变飞行器的传统研制流程，突破对精确空气动力学模型的依赖，降低昂贵的风洞试验成本，缩短研制周期。

本发明设计的自适应控制方法中，引入了基于归一化的线性系数自适应估计策略，在证明了旋翼飞行器系统在风干扰影响下的未建模动力项与自适应项之间的误差稳定收敛性的同时，提高了系统的抗干扰鲁棒性。

附图说明

图1为本发明融合AI深度学习方法的飞行自适应控制算法框图；

图2为本发明深度神经网络离线学习阶段框图；

图3为本发明在线自适应控制与深度神经网络学习训练结果结合阶段框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，均属于本发明保护的范围。

下面结合附图和具体实施方案对本发明作进一步详细说明。以下实施例仅是说明性的，并不构成对本发明的限制。

本发明为解决旋翼型飞行器在不同风速干扰环境下的精准飞行轨迹跟踪控制问题，在控制系统中识别未建模风干扰空气动力项并在实时控制中对该项干扰进行补偿。基于上述目标，本发明通过建立旋翼飞行器的理论动力学模型，如图1所示，设计对抗迁移学习深度神经网络与自适应控制相结合的算法，通过在计算机上仿真或实际试飞收集不同风速干扰条件下飞行器在常规PID控制器下跟踪预设轨迹时的飞行状态数据集，利用数据集对提出的对抗迁移学习深度神经网络进行离线训练，最后采用自适应控制算法进行在线风干扰识别并补偿。具体实施分为如下四个步骤：

(1)设计融合AI深度学习与自适应控制相结合的算法框架

由于旋翼飞行器在面对外界环境干扰时，如不同风速剖面中会产生不同的未准确建模的风干扰空气动力项，这部分对飞行器在风影响下的精确轨迹跟踪造成重要影响，并且随着飞行动态环境的不同，该未建模空气动力项事先无法精准建模测量。考虑未准确建模的风干扰空气动力项的旋翼飞行器的动力学方程如下：

其中，各个状态含义如下：

偏航角速度

俯仰角速度

转动惯量：滚转轴转动惯量

偏航轴转动惯量

俯仰轴转动惯量

飞行器质量：m；

重力加速度：g；

外界不同风况条件引起的未建模的风干扰空气动力项f(x,μ)：f(x,μ)＝[f_X f_Yf_Z]^T为风干扰空气动力项在大地水平坐标系北向X轴，东向Y轴，地向Z轴三个方向上的分量，该未建模的空气动力项与飞行器的状态向量x和风场向量μ相关，其中状态向量选择为飞行器三维速度(三维)、以欧拉角表示的飞行器姿态俯仰角、滚转角和偏航角(三维)和以脉冲宽度调制信号(PWM)表示的旋翼四个电机转速控制指令(四维)的组合，其中四维是旋翼飞行器四个电机的转速控制信号，1号电机转速信号PWM1，2号电机转速信号PWM2，3号电机转速信号PWM3，4号电机转速信号PWM4；假设n种不同类别风速的风场分别表示为μ₁,μ₂,...,μ_n，其中某一具体的第k类风速设为μ_k；

神经网络已被证明具有以任意精度拟合任意函数的能力，特别是近年来，以深度神经网络(DNN)为基础发展的深度学习人工智能AI算法在各行业应用中都取得了惊人的成就。随着人工智能技术的发展，基于机器学习的智能设计技术已被证实可作为高性能控制系统设计的有效技术途径。为此，本发明设计融合AI深度学习与自适应控制相结合的算法，其算法框如图1所示；

融合AI深度学习与自适应控制相结合的算法包括离线学习阶段和用作实时在线学习的在线自适应控制阶段。对于离线学习阶段，采用对抗迁移学习算法，在少样本数据条件下，进行一种有效的学习与风场无关的空气动力学的深度神经网络(DNN)表征。深度神经网络的输出被视为代表风干扰空气动力学效应的一组基函数

在线自适应控制阶段，更新一组的线性系数λ(μ)，线性系数λ(μ)代表不同风干扰时，与不同风场向量μ而不同的一组常数向量，可以通过自适应控制算法在线识别。算法的目的在于可以通过融合AI深度学习与自适应控制算法拟合未准确建模的风干扰空气动力项f(x,μ)，使其具有以下表达式：

其中，

是通过深度神经网络学习的所有不同风况共享的表征基函数，用来学习捕捉未建模的动力学对无人机状态共同的依赖项，这个量与风速的大小无关，λ(μ)是一组的线性系数，就是通过自适应算法公式(2)在线辨识或识别，简记为λ，在不同风况下有不同的取值，通过自适应控制算法进行在线辨识，

与λ(μ)相乘别可以近似拟合未准确建模的风干扰空气动力项f(x,μ)。当旋翼无人飞行器在线控制时，将估计的f(x,μ)加入到控制力中，实时补偿的未建模动态的影响，可使飞行器对参考轨迹进行精确跟踪；

(2)设计基于深度神经网络的对抗迁移学习算法

由于实际飞行时，无人飞行器随着风况的不同，时刻处于不同的动态环境中，深度神经网络学习到的模型需要具有处理不同任务的能力，目前动态环境中最流行的学习方案是元学习，即“学习到学习”，其目的是在从不同的任务或环境收集的数据中学习一个有效的模型。学习到的模型，通常表示为一个DNN，当给定的训练数据集有限时，其在理想情况下应该能够快速适应一个新的任务或一个未见过的环境；

本发明采用的对抗迁移学习深度网络采用全连接形式，共训练两个网络

和ξ，二者为两个不同的DNN。网络

的输出

是不同风况共享的空气动力表示函数，即

与风况无关；自适应参数λ(μ)是与风况有关的线性系数，不同的风况都有一个特定的参数λ(μ)，如第k类风况有一个特定的参数λ(μ_k)；目的是训练一个深度神经网络

使其和λ(μ)的乘积能够近似的表示不同风况下的不确定空气动力项f(x,μ)。由于训练集是飞行器在不同风况下的速度、姿态、电机转速等飞行状态量x的数据，在实际飞行中，飞行器自身的状态量x会因为风况风速的变化发生改变，直接简单的用一个最小平方误差损失函数去训练得出的

神经网络大概率会学习到跟风况有关的空气动力模型。所以为了消除风况风速变化带来的影响，真正让网络

学到与风况无关的共享空气动力模型，引入分类网络ξ，网络ξ的作用是输入不同风况下的

能够输出对应的风况风速类别k，并且引入对抗训练的思想，将分类网络ξ作为鉴别器，同时训练

之后使网络

固定网络参数更新网络ξ，二者达到纳什均衡即完成训练；

采用最小二乘和随机梯度下降法训练深度学习神经网络，神经网络的输入状态量是飞行器三维速度(三维)、以欧拉角表示的飞行器姿态俯仰角、滚转角和偏航角(三维)和以脉冲宽度调制信号(PWM)表示的旋翼四个电机转速控制指令(四维)；神经网络的输出状态为不同风况共享的表示基函数

(五维行向量)。结合自适应控制算法在线更新的线性系数λ(μ)＝[λ_X(μ) λ_Y(μ) λ_Z(μ)]^T(十五维，每个轴的自适应参数向量λ_X(μ)、λ_Y(μ)和λ_Z(μ)分别为五维列向量)，神经网络的五维输出

对抗迁移学习深度网络的损失函数如下：

代表在第k次风况风速实验下收集的飞行器状态变量，

代表在第k次风况风速实验下收集的飞行器名义参考模型预测的飞行器加速度与实际仿真或飞行试验测量到的飞行器加速度的残差力误差项，即未建模的空气动力项。

是典型的最小平方误差损失函数，

是K分类网络的损失函数，通常为交叉熵损失函数。上述损失函数引入了分类误差，在训练

的同时使分类模型能准确区分当前风况类别k，保证了训练的

能学到与风况风速无关的共享空气动力模型；

对抗迁移学习深度网络训练过程如下表1所示

表1训练过程

(3)数据增强的离线/在线机器训练

数据集收集策略分为理论仿真法和实验法两种。理论仿真法是在计算机上通过仿真收集不同风场下的飞行器在常规PID控制器下跟踪预设轨迹时的仿真飞行状态数据集；实验法通过设计室内与室外的静态、动态测试实验环境，通过风洞试验、多档位工业风扇吹风试验或人在回路试验得方式收集旋翼飞行器在常规PID控制器下跟踪预设轨迹时的实际飞行状态数据集；

在离线学习阶段，目标是从不同环境中收集的数据中学习一个模型，这样的模型包含所有环境中的共享知识或特征，学习所有风况中共享的空气动力学特征基函数

离线学习阶段框图具体如图2所示；

对于在线自适应控制阶段，目标是适应离线学习的模型，给定来自训练环境及训练任务、新环境或新任务的有限的在线数据，例如微调特定风况下的空气动力特征，在线自适应控制与深度神经网络学习训练结果结合阶段框图，具体如图3所示：

(4)设计基于归一化最小二乘法的自适应控制算法

通过深度神经网络训练，可以找到共享空气动力特征表示基函数

使每批次数据预测的误差最小。对于在线控制阶段，为使旋翼飞行器对期望轨迹的跟踪误差最小化，关键在于实时识别准确的风干扰并进行补偿；同时由于深度神经网络训练得到的共享空气动力特征表示基函数

的幅值可能比较大，实际系统不可避免测量噪声会引入自适应更新过程中，这会使得按照传统设计方法得到的自适应参数更新过快，最终导致自适应项发散，系统的鲁棒性变差。

基于上述目的，本发明提出了基于归一化最小二乘法的线性系数自适应估计方法，利用归一化技术使得自适应项

的幅值减小进而来提升系统的鲁棒性，并将其与传统PID控制技术相结合。这种方法可以在线自动调整增益，能够快速估计与风况风速相关的具有较大不确定性的参数λ(μ)。本发明提出的在线自适应控制算法包含参考轨迹前馈项、基本的PID控制反馈项、自适应参数更新率和基于基于归一化最小二乘法的时变矩阵协方差更新率，并用控制系统稳定性证明常用的李雅普诺夫稳定定理证明了旋翼飞行器系统在风干扰影响下的未建模动力项与自适应项之间的误差稳定收敛性，控制框图如图1所示，具体如下：

其中，u_F是旋翼飞行器控制率，λ是在线更新的自适应线性参数，R是时变协方差矩阵，e是参考轨迹跟踪误差项，PID(e)是根据参考轨迹跟踪误差项e设计的PID控制器，上标T是转置符号，r是预先设置的飞行器需要跟踪的大地坐标系下的位置参考轨迹指令，k_r是根据跟踪参考轨迹设计的参考轨迹前馈控制系数，k_r取值范围在0到1之间，作为实例取0或0.5或1，本实施例中取0.5，根据实际参考轨迹跟踪情况调整，y是飞行器名义参考模型预测的飞行器加速度与实际仿真或实验测量到的飞行器加速度相减得到的残差力误差项；参考轨迹是需要跟踪的轨迹，是预先设计的飞行器拟飞行的位置信息的参考轨迹；飞行器名义参考模型即是公式(1)描述的模型。

通过李雅普诺夫稳定性定理来证明系统在风干扰影响下的未建模动力项与自适应项之间的误差稳定收敛性。根据神经网络已被证明具有以任意精度拟合任意函数的能力，假设通过训练，深度神经网络已经准确学习到共享空气动力特征表示基函数

同时设自适应参数参数λ的理想值为λ^*，则残差力误差项y可以表示为

设

则自适应参数更新率可表示为

选择李雅普诺夫函数如下：

其中，R^-1中为矩阵R的逆，

为矩阵

的迹。

系统轨迹沿李雅普诺夫函数的导数为：

其中，||ε||表示估计误差ε的范数且其值大于等于零。根据李雅普诺夫稳定性定理，

具有有限的极限且系统稳定。同时，根据常用于非线性自适应控制系统稳定性证明中的Barbalat引理，当李雅普诺夫函数的二阶导数

是有界值时，李雅普诺夫函数的一阶导数

本发明还提供一种计算机可读的存储介质，计算机可读的存储介质包括存储的程序，其中，所述程序运行时执行前述的方法。

本发明还提供一种电子装置，包括存储器和处理器，存储器中存储有计算机程序，所述处理器被设置为通过所述计算机程序执行程序运行时执行前述的方法。

综上所述，本发明一种设计融合AI深度学习的旋翼飞行器轨迹跟踪自适应控制方法。

Claims

1.融合AI深度学习的旋翼飞行器轨迹跟踪自适应控制方法，其特征在于利用AI深度学习与自适应控制相结合的算法，获得风干扰环境下的未准确建模的风干扰空气动力项，对在不同风速干扰环境下的旋翼飞行器进行轨迹跟踪自适应控制，包括如下步骤：

结合反馈控制，在设计的飞行轨迹跟踪控制器中，实时补偿在线自适应识别到的未准确建模的风干扰空气动力学项。

2.根据权利要求1所述的旋翼飞行器轨迹跟踪自适应控制方法，其特征在于利用AI深度学习与自适应控制相结合的算法获得风干扰环境下的未准确建模的风干扰空气动力项

包括

未准确建模的风干扰空气动力项的动力学方程为：

其中，各个状态含义如下：

偏航角速度

俯仰角速度

转动惯量：滚转轴转动惯量

偏航轴转动惯量

俯仰轴转动惯量

飞行器质量：m；

重力加速度：g；

外界不同风况条件引起的未建模的风干扰空气动力项f(x,μ)：f(x,μ)＝[f_X f_Y f_Z]^T为风干扰空气动力项在大地水平坐标系北向X轴，东向Y轴，地向Z轴三个方向上的分量，该未建模的空气动力项与飞行器的状态向量x和风场向量μ相关，其中状态向量选择为飞行器三维速度(3维)、以欧拉角表示的飞行器姿态俯仰角、滚转角和偏航角(3维)和以脉冲宽度调制信号(PWM)表示的旋翼四个电机转速控制指令四维组合，其中四维是旋翼飞行器四个电机的转速控制信号；假设n种不同类别风速的风场分别表示为μ₁,μ₂,...,μ_n，其中某一具体的第k类风速设为μ_k；

其中，

是通过深度神经网络学习的所有不同风况共享的表征基函数，即用来学习捕捉未建模的动力学对无人机状态共同的依赖项，这个量与风速的大小无关，λ(μ)是一组的线性系数，简记为λ，λ(μ)在不同风况下有不同的取值，通过自适应控制算法进行在线辨识，

3.根据权利要求2所述的旋翼飞行器轨迹跟踪自适应控制方法，其特征在于所述通过预先收集的飞行数据对深度神经网络进行离线学习，训练近似拟合得到风干扰环境下的未准确建模的风干扰空气动力项中所有不同风况共享的表征基函数

包括

和ξ，二者为两个不同的DNN；网络

的输出

是不同风况共享的空气动力表示函数，即

使其和λ(μ)的乘积能够近似的表示不同风况下的不确定风干扰空气动力项f(x,μ)；引入分类网络ξ，网络ξ的作用是输入不同风况下的

之后使网络

固定网络参数更新网络ξ，二者达到纳什均衡即完成训练。

4.根据权利要求3所述的旋翼飞行器轨迹跟踪自适应控制方法，其特征在于所述对抗迁移学习深度网络采用的对抗训练算法具体包括

采用最小二乘和随机梯度下降法训练深度神经网络即对抗迁移学习深度网络，神经网络的输入状态量是飞行器三维速度(3维)、以欧拉角表示的飞行器姿态俯仰角、滚转角和偏航角(3维)和以脉冲宽度调制信号(PWM)表示的旋翼四个电机转速控制指令(4维)；神经网络的输出状态为不同风况共享的表示基函数

(5维行向量)；结合自适应控制算法在线更新的线性系数λ(μ)＝[λ_X(μ) λ_Y(μ) λ_Z(μ)]^T(15维，每个轴的自适应参数向量λ_X(μ)、λ_Y(μ)和λ_Z(μ)分别为5维列向量)，神经网络的5维输出

和自适应控制更新的15维线性系数的前5维λ_X(μ)，中5维λ_Y(μ)和后5维λ_Z(μ)，分别相乘，正好得到三个数，用这三个数来近似风场在大地坐标系下三个轴即北向X轴，东向Y轴，地向Z轴的三个分量，表示飞行器在大地坐标系下的三轴未建模空气动力项f(x,μ)＝[f_X f_Y f_Z]^T(3维)为：

对抗迁移学习深度网络的损失函数如下：

代表在第k次风况风速实验下收集的飞行器状态变量，

代表在第k次风况风速实验下收集的飞行器名义参考模型预测的机体加速度与实际仿真或飞行试验测量到的机体加速度的残差力误差项，即未建模的风干扰空气动力项；

是典型的最小平方误差损失函数，

的同时使分类模型能准确区分当前风况类别k，保证了训练的

能学到与风况风速无关的共享空气动力模型。

5.根据权利要求1-4中任一项所述的旋翼飞行器轨迹跟踪自适应控制方法，其特征在于所述利用自适应控制中参考模型预测误差项信息对自适应参数进行更新

包括

具体如下：

其中，u_F是旋翼飞行器控制率，λ是在线更新的自适应线性参数，R是时变协方差矩阵，e是参考轨迹跟踪误差项，PID(e)是根据参考轨迹跟踪误差项e设计的PID控制器，上标T是转置符号，r是预先设置的飞行器需要跟踪的大地坐标系下的位置参考轨迹指令，k_r是根据跟踪参考曲线设计的参考轨迹前馈控制系数，k_r取值范围在0到1之间，根据实际参考轨迹跟踪情况调整，y是飞行器名义参考模型预测的机体加速度与实际仿真或实验测量到的机体加速度相减得到的残差力误差项。

6.根据权利要求1所述的旋翼飞行器轨迹跟踪自适应控制方法，其特征在于所述收集的飞行数据，包括用理论仿真法和实验法两种方法收集，理论仿真法是在计算机上通过仿真收集不同风场下的飞行器在常规PID控制器下跟踪预设轨迹时的仿真飞行状态数据集；实验法包括风洞试验、多档位工业风扇吹风试验或人在回路试验方式收集旋翼飞行器在常规PID控制器下跟踪预设轨迹时的实际飞行状态数据集。

7.根据权利要求1-6中任一项所述的旋翼飞行器轨迹跟踪自适应控制方法，其特征在于还包括通过李雅普诺夫稳定性定理来证明系统在风干扰影响下的未建模动力项与自适应项之间的误差稳定收敛性，具体包括