CN113885548A

CN113885548A - 一种多四旋翼无人机输出约束状态一致博弈控制器

Info

Publication number: CN113885548A
Application number: CN202111261119.0A
Authority: CN
Inventors: 杨杨; 范昕; 耿硕聪; 舒周; 岳东; 张腾飞
Original assignee: Nanjing University of Posts and Telecommunications
Current assignee: Nanjing University of Posts and Telecommunications
Priority date: 2021-10-28
Filing date: 2021-10-28
Publication date: 2022-01-04
Anticipated expiration: 2041-10-28
Also published as: CN113885548B

Abstract

本发明公开了一种多四旋翼无人机输出约束状态一致博弈控制器，将N个含输出约束的四旋翼无人机视为跟随者，其与领导者通过单向拓扑图连接成的网络化系统作为被控对象，利用系统转换技术和ADP技术设计具有输出约束的状态一致博弈控制器，使得含扰动的跟随四旋翼无人机跟踪领导者的状态轨迹。本发明考虑到四旋翼无人机飞行姿态中角度的限制，通过系统转换技术，将含输出约束的多四旋翼无人机姿态控制系统转化为无约束系统；借助ADP技术和博弈方法，设计的输出约束状态一致博弈控制器不仅使四旋翼无人机姿态控制系统稳定，且满足输出约束的要求，同时使得转换后系统的性能指标达到近似最优。

Description

一种多四旋翼无人机输出约束状态一致博弈控制器

技术领域

本发明涉及工业过程控制技术领域，具体而言涉及一种多四旋翼无人机输出约束状态一致博弈控制器。

背景技术

20世纪以来，随着自动化技术的成熟和发展，多四旋翼无人机系统作为一种更为复杂和先进的机电系统出现在生产与科研等多个方面，众多科研工作者对多四旋翼无人机系统的控制问题展开了深入的研究。与单个的四旋翼无人机系统相比，多四旋翼无人机能够完成更复杂的任务，且具有更大的负荷能力。然而，多四旋翼无人机系统这些优点的获得是需要付出代价的，包括更为复杂的控制问题。将在该协调系统中的某一四旋翼无人机指定为“领导者”，其余的跟踪领导者的预定队形的移动机器人称为“跟随者”群体。在2019年，杜海波等人在有向通信拓扑下，针对一类多四旋翼飞行器的领导-跟随者结构分布式编队控制问题，提出了一种基于反步法的一致性编队控制算法，其在仿真案例中四旋翼飞行器的姿态角和位置作为输出量，让所有四旋翼飞行器在三维空间中收敛到期望的编队形态。但是在很多的实际应用中，四旋翼飞行器在运行中无法避免外部扰动的影响，四旋翼飞行器的姿态角需要限定在特定的范围，且系统的最优性能也是值得考虑的。

ADP方法是求解最优控制问题的有效工具，它起源于1957年，Bellman提出的DP方法，该方法核心是贝尔曼最优原理。这个原理可以归结为一个基本的递推公式，求解HJB方程。但是DP方法存在着“维数灾”问题。为了克服这些弱点，Werbos首先提出了ADP方法的框架，其主要思想是利用一个函数近似结构来估计代价函数，然后求解HJB方程进而获得近似最优控制策略。近年来，ADP方法获得了广泛的关注。基于神经网络技术和ADP方法，Ferrari设计状态反馈ADP控制器。黄玉柱提出了基于状态反馈的有界鲁棒ADP控制器，用于控制具有输入约束的不确定仿射非线性连续时间系统。用自适应动态规划算法，赵博研究一类仿射非线性系统的容错控制。在自适应动态规划的基础上，屈秋霞研究了一种基于输入饱和的不确定非线性系统的复合滑模控制器。针对一类具有输入饱和的非线性连续时间系统，在系统状态不完全可测的情况下，朱元恒利用ADP方法设计出事件触发近似最优控制器。利用模糊逻辑系统逼近系统的不确定性，张化光设计出一类仿射型非线性多智能体系统的近似最优一致控制方案。针对具有未知动态的仿射型非线性多智能体系统，张吉烈设计分布式最优一致控制器。Mazouchi提出了一种在线最优分布式学习算法来解决非线性多智能体微分图形博弈的领导同步问题。通过自适应动态规划方法，完全未知动态的连续时间非线性多智能体系统的分布式最优协调控制问题被研究。一方面，输出问题受限问题在实际工业应用中也是亟需处理的。针对带有输出约束的非线性系统的控制问题，范泉涌和杨光红中提出了一种具有松弛函数的系统变换技术。通过提出一个具有新状态变量的增强系统，以将原始约束问题转换为无约束问题。还有，杨秦敏通过引入一个映射函数来处理输出约束。通过对原系统进行转换，使得转换后的系统等效于原输出约束系统。另一方面，针对含扰动的非线性零和微分博弈，宋睿卓提出基于单神经网络和最小二乘的鲁棒最优控制。穆朝絮等人将基于博弈的最优控制方法应用到在电力系统上。2016年，魏庆来等人针对具有扰动的零和博弈问题，根据非线性系统的输入输出数据，引入了有效的递归神经网络来重构非线性系统的动力学，并提出了一种连续时间未知非线性系统的数据驱动零和神经最优控制方法。2018年，孙景亮针对一类具有输出和输入约束的严格反馈非线性系统的零和微分博弈问题，提出了拦截操纵目标的问题。将反步法引入零和微分博弈中，拓宽微分博弈的应用范围，并且将零和微分博弈方法应用到导弹-目标拦截系统中。

在实际的应用中，对多四旋翼无人机的姿态一致协同控制时，由于每个四旋翼无人机姿态控制系统中存在着外部扰动，无法实现对扰动的精准建模，以及系统的输出姿态需要限定在特定的范围，还有使得系统稳定的同时，系统的最优性也是需要考虑的，所以针对遭受外部扰动的多四旋翼无人机输出约束状态一致博弈控制研究具有重要的理论意义和现实意义。因此，迫切需要一种利用系统转换技术、ADP技术和博弈方法的输出约束状态一致博弈控制器，使得对遭受外部扰动的多四旋翼无人机的输出约束状态一致协同的研究具有最直接的现实意义。

发明内容

本发明针对现有技术中的不足，提供一种多四旋翼无人机输出约束状态一致博弈控制器，针对四旋翼无人机系统中对输出姿态角的约束问题，通过系统转换技术，将含约束的多四旋翼无人机姿态控制系统转化为无约束的控制系统。考虑到多四旋翼无人机姿态控制系统的未知外部扰动，利用博弈的方法，设计出输出约束状态一致博弈控制器，使得系统达到稳定，并且达到状态一致的控制效果。

为实现上述目的，本发明采用以下技术方案：

第一方面，本发明实施例提出了一种多四旋翼无人机输出约束状态一致博弈控制器，所述博弈控制器用于控制网络化系统中的各个跟随者；该网络化系统由一个领导者与N个跟随者通过单向拓扑图连接构成，所述跟随者为网络化系统中除领导者外的、含有输出约束的四旋翼无人机；领导者与至少一个跟随者之间存在通信连接，N个跟随者之间存在通信连接，跟随者之间的信息通信采用有向图

表示，其中v为节点的非空有限集合，且v＝{v₁,…,v_N}，ε为边的集合，且ε＝{(v_j,v_i)∈v×v}，v_i为第i个移动机器人，v_j为第j个移动机器人；(v_j,v_i)∈v×v表示第i个移动机器人能够直接获得第j个移动机器人的信息；其中，i、j为所述跟随者的编号，且1≤i≤N,1≤j≤N；

所述博弈控制器包括滚转角子控制器、俯仰角子控制器和偏航角子控制器；所述滚转角子控制器、俯仰角子控制器和偏航角子控制器的输入端均与有向图

的输出端相连，输出端均与跟随者的输入端连接；

所述滚转角子控制器包括滚转角姿态系统转换单元、滚转角姿态一致误差运算单元、ADP滚转角姿态逼近器单元、ADP滚转角姿态运算单元、ADP滚转角姿态第i,1,1子控制单元和设计ADP滚转角姿态第i,1,2子控制单元；

所述滚转角姿态系统转换单元的输入端为第i个跟随者的状态x_i,1,1和x_i,1,2，和第i个跟随者的输出y_i,1；

所述滚转角姿态一致误差运算单元的输入端分别为有向图

中第j个跟随者转换后的状态s_j,1,1和s_j,1,2、跟随者的邻接通信a_ij、领导者的邻接通信b_i、滚转角姿态系统转换单元的输出s_i,1,1和s_i,1,2和领导者中滚转角姿态系统转换后的状态s_0,1,1和s_0,1,2；

所述ADP滚转角姿态逼近器单元的输入端分别为滚转角姿态一致误差运算单元的输出e_i,1,1和e_i,1,2、第i,1,1ADP子控制单元的输出u_i,1和第i,1,2ADP子控制单元的输出d_i,1；

所述ADP滚转角姿态运算单元的输入端是ADP滚转角姿态逼近器单元的输出

所述ADP滚转角姿态第i,1,1子控制单元的输入端分别是ADP滚转角姿态运算单元的输出

和

有向图

中的拉普拉斯矩阵中的参数l_ii和领导者的邻接通信b_i；

所述ADP滚转角姿态第i,1,2子控制单元的输入端分别是ADP滚转角姿态运算单元的输出

和

有向图

中的拉普拉斯矩阵中的参数l_ii和领导者的邻接通信b_i；

所述俯仰角子控制器包括俯仰角姿态系统转换单元、俯仰角姿态一致误差运算单元、ADP俯仰角姿态逼近器单元、ADP俯仰角姿态运算单元、ADP俯仰角姿态第i,2,1子控制单元和设计ADP俯仰角姿态第i,2,2子控制单元；

所述俯仰角姿态系统转换单元的输入端为第i个跟随者的状态x_i,2,1和x_i,2,2，和第i个跟随者的输出y_i,2；

所述俯仰角姿态一致误差运算单元的输入端分别为有向图

中第j个跟随者转换后的状态s_j,2,1和s_j,2,2、跟随者的邻接通信a_ij、领导者的邻接通信b_i、俯仰角姿态系统转换单元的输出s_i,2,1和s_i,2,2和领导者中俯仰角姿态系统转换后的状态s_0,2,1和s_0,2,2；

所述ADP俯仰角姿态逼近器单元的输入端分别为俯仰角姿态一致误差运算单元的输出e_i,2,1和e_i,2,2、第i,2,1ADP子控制单元的输出u_i,2和第i,2,2ADP子控制单元的输出d_i,2；

所述ADP俯仰角姿态运算单元的输入端是ADP俯仰角姿态逼近器单元的输出

所述ADP俯仰角姿态第i,2,1子控制单元的输入端分别是ADP俯仰角姿态运算单元的输出

和

有向图

中的拉普拉斯矩阵中的参数l_ii和领导者的邻接通信b_i；

所述ADP俯仰角姿态第i,2,2子控制单元的输入端分别是ADP俯仰角姿态运算单元的输出

和

有向图

中的拉普拉斯矩阵中的参数l_ii和领导者的邻接通信b_i；

所述偏航角子控制器包括偏航角姿态系统转换单元、偏航角姿态一致误差运算单元、ADP偏航角姿态逼近器单元、ADP偏航角姿态运算单元、ADP偏航角姿态第i,3,1子控制单元和设计ADP偏航角姿态第i,3,2子控制单元；

所述偏航角姿态系统转换单元的输入端为第i个跟随者的状态x_i,3,1和x_i,3,2，和第i个跟随者的输出y_i,3；

所述偏航角姿态一致误差运算单元的输入端分别为有向图

中第j个跟随者转换后的状态s_j,3,1和s_j,3,2、跟随者的邻接通信a_ij、领导者的邻接通信b_i、偏航角姿态系统转换单元的输出s_i,3,1和s_i,3,2和领导者中偏航角姿态系统转换后的状态s_0,3,1和s_0,3,2；

所述ADP偏航角姿态逼近器单元的输入端分别为偏航角姿态一致误差运算单元的输出e_i,3,1和e_i,3,2、第i,3,1ADP子控制单元的输出u_i,3和第i,3,2ADP子控制单元的输出d_i,3；

所述ADP偏航角姿态运算单元的输入端是ADP偏航角姿态逼近器单元的输出

ADP偏航角姿态第i,3,1子控制单元的输入端分别是ADP偏航角姿态运算单元的输出

和

有向图

中的拉普拉斯矩阵中的参数l_ii和领导者的邻接通信b_i；

所述ADP偏航角姿态第i,3,2子控制单元的输入端分别是ADP偏航角姿态运算单元的输出

和

有向图

中的拉普拉斯矩阵中的参数l_ii和领导者的邻接通信b_i；

跟随者中第i个四旋翼无人机的系统模型为：

其中，φ_i为第i四旋翼无人机的滚转角、θ_i为第i个四旋翼无人机的俯仰角、ψ_i为第i四旋翼无人机的偏航角、ξ_φ,i、ξ_θ,i和ξ_ψ,i表示第i个四旋翼无人机的空气动力阻尼系数、I_x,i、I_y,i和I_z,i表示第i个四旋翼无人机的转动惯量、u_i,1、u_i,2和u_i,3表示第i个四旋翼无人机的控制输入和d_i,1、d_i,2和d_i,3表示第i个四旋翼无人机的外部未知扰动；

将第i个四旋翼无人机的系统模型转换成状态模型，令x_i,1,1＝φ_i，

y_i,1＝x_i,1,1，x_i,2,1＝θ_i，

y_i,2＝x_i,2,1，x_i,3,1＝ψ_i，

y_i,3＝x_i,3,1，则转换后第i个四旋翼无人机的状态模型为：

其中，y_i,1为转换后第i个四旋翼无人机的输出滚转角，y_i,2为转换后第i个四旋翼无人机的输出俯仰角，y_i,3为转换后第i个四旋翼无人机的输出偏航角，x_i,1,1、x_i,1,2、x_i,2,1、x_i,2,2、x_i,3,1和x_i,3,2为第i个跟随者的状态，u_i,1、u_i,2和u_i,3分别为第i个四旋翼无人机的滚转角控制输入、俯仰角控制输入和偏航角控制输入，d_i,1、d_i,2和d_i,3分别为第i个四旋翼无人机的滚转角扰动、俯仰角扰动和偏航角扰动。

进一步地，将跟随者的邻接矩阵记为A，那么A＝[a_i,j]_N×N，该邻接矩阵A＝[a_i,j]_N×N的定义如下：

其中，a_ij为第i、j个跟随者的邻接通信；

将有向图

的拉普拉斯矩阵记为L，那么L＝D-A，其中，D为有向图

的度矩阵，且D＝diag{d₁,…,d_N}，d_i为跟随者的邻接矩阵的行和，且

进一步地，将节点i的邻接集合定义为N_i＝{j|(v_j,v_i)∈ε}；有向图

的拉普拉斯矩阵记为L，L＝[l_i,j]_N×N，有向图

的拉普拉斯矩阵L＝[l_i,j]_N×N的定义为：

其中，l_ij为有向图

的拉普拉斯矩阵中的元素。

进一步地，将领导者的邻接矩阵记为B，B＝diag{b₁,…,b_N}，其中b_i为领导者的邻接通信，当第i个跟随者能够得到领导者的信号时，b_i＝1；当第i个跟随者不能得到领导者的信号时，b_i＝0。

第二方面，本发明实施例提出了一种基于前述多四旋翼无人机输出约束状态一致博弈控制器的设计方法，所述设计方法包括以下步骤：

A、第i个跟随者的输出约束状态一致博弈控制器结构包括滚转角子控制器、俯仰角子控制器和偏航角子控制器，在第i个跟随者的输出约束状态一致博弈控制器中，设计滚转角子控制器；包括以下步骤：

A1、设计滚转角姿态系统转换单元：滚转角姿态系统转换单元的输入端为第i个跟随者的状态x_i,1,1和x_i,1,2，和第i个跟随者的输出y_i,1，根据滚转角输出约束的要求，引入一个非线性滚转角映射函数：

其中，H_i,1(·)是一个平滑、可逆和严格单调递增的函数，且满足以下条件：

为滚转角输出约束的下界，和

为滚转角输出约束的上界；

根据非线性滚转角映射函数，转换后的滚转角姿态系统为：

根据转换后的滚转角姿态系统，得到滚转角姿态系统转换单元的输出为转换后的滚转角姿态系统的状态s_i,1,1、s_i,1,2和转换后的滚转角姿态系统的输出

A2、设计滚转角姿态一致误差运算单元：滚转角姿态一致误差运算单元的输入端分别为有向图

中第j个跟随者转换后的状态s_j,1,1和s_j,1,2、跟随者的邻接通信a_ij、领导者的邻接通信b_i、滚转角姿态系统转换单元的输出s_i,1,1和s_i,1,2和领导者中滚转角姿态系统转换后的状态s_0,1,1和s_0,1,2，根据以下公式计算滚转角姿态一致误差：

A3、设计ADP滚转角姿态逼近器单元：ADP滚转角姿态逼近器单元的输入端分别为滚转角姿态一致误差运算单元的输出e_i,1,1和e_i,1,2、第i,1,1ADP子控制单元的输出u_i,1和第i,1,2ADP子控制单元的输出d_i,1，经过以下的计算：

得到ADP滚转角姿态逼近器单元的输出

其中

为ADP滚转角姿态逼近器单元中神经网络隐藏层到输出层的估计权值矩阵，是k₁行1列矩阵，k₁为ADP滚转角姿态逼近器单元中神经网络隐藏层神经元的个数，是大于零的常数；

c_i,1为神经网络的学习率，是大于零的常数；

e_i,1＝[e_i,1,1,e_i,1,2]^T，

q_i,1,1、q_i,1,2、R_i,1、γ_i,1和Γ_i,1分别是大于零的常数；

为激活函数，是k₁行1列矩阵，

是激活函数

对e_i,1的偏导矩阵，e_i,1＝[e_i,1,1,e_i,1,2]^T；

A4、设计ADP滚转角姿态运算单元：ADP滚转角姿态运算单元的输入端是ADP滚转角姿态逼近器单元的输出

经过以下计算：

得到ADP滚转角姿态运算单元的输出

和

A5、设计ADP滚转角姿态第i,1,1子控制单元：ADP滚转角姿态第i,1,1子控制单元的输入端分别是ADP滚转角姿态运算单元的输出

和

有向图

中的拉普拉斯矩阵中的参数l_ii和领导者的邻接通信b_i，经过以下计算：

得到ADP滚转角姿态第i,1,1子控制单元的输出u_i,1

A6、设计ADP滚转角姿态第i,1,2子控制单元-ADP滚转角姿态第i,1,2子控制单元的输入端分别是ADP滚转角姿态运算单元的输出

和

有向图

得到ADP滚转角姿态第i,1,2子控制单元的输出d_i,1；

B、在第i个跟随者的输出约束状态一致博弈控制器中，设计俯仰角子控制器；

B1、设计俯仰角姿态系统转换单元：俯仰角姿态系统转换单元的输入端为第i个跟随者的状态x_i,2,1和x_i,2,2，和第i个跟随者的输出y_i,2，根据俯仰角输出约束的要求，引入一个非线性俯仰角映射函数，为

其中，H_i,2(·)是一个平滑、可逆和严格单调递增的函数，且满足以下条件：

为俯仰角输出约束的下界，和

为俯仰角输出约束的上界；

根据非线性俯仰角映射函数，转换后的俯仰角姿态系统为：

根据转换后的俯仰角姿态系统，得到俯仰角姿态系统转换单元的输出为转换后的俯仰角姿态系统的状态s_i,2,1、s_i,2,2和转换后的滚转角姿态系统的输出

B2、设计俯仰角姿态一致误差运算单元：俯仰角姿态一致误差运算单元的输入端分别为有向图

中第j个跟随者转换后的状态s_j,2,1和s_j,2,2、跟随者的邻接通信a_ij、领导者的邻接通信b_i、俯仰角姿态系统转换单元的输出s_i,2,1和s_i,2,2和领导者中俯仰角姿态系统转换后的状态s_0,2,1和s_0,2,2，根据以下公式计算俯仰角姿态一致误差：

B3、设计ADP俯仰角姿态逼近器单元：ADP俯仰角姿态逼近器单元的输入端分别为俯仰角姿态一致误差运算单元的输出e_i,2,1和e_i,2,2、第i,2,1ADP子控制单元的输出u_i,2和第i,2,2ADP子控制单元的输出d_i,2，经过以下的计算：

得到ADP俯仰角姿态逼近器单元的输出

其中

为ADP俯仰角姿态逼近器单元中神经网络隐藏层到输出层的估计权值矩阵，是k₂行1列矩阵，k₂为ADP俯仰角姿态逼近器单元中神经网络隐藏层神经元的个数，是大于零的常数；

c_i,2为神经网络的学习率，是大于零的常数；

e_i,2＝[e_i,2,1,e_i,2,2]^T，

q_i,2,1、q_i,2,2、R_i,2、γ_i,2和Γ_i,2分别是大于零的常数；

为激活函数，是k₂行1列矩阵，

是激活函数

对e_i,2的偏导矩阵，e_i,2＝[e_i,2,1,e_i,2,2]^T；

B4、设计ADP俯仰角姿态运算单元：ADP俯仰角姿态运算单元的输入端是ADP俯仰角姿态逼近器单元的输出

经过以下计算：

得到ADP俯仰角姿态运算单元的输出

和

B5、设计ADP俯仰角姿态第i,2,1子控制单元：ADP俯仰角姿态第i,2,1子控制单元的输入端分别是ADP俯仰角姿态运算单元的输出

和

有向图

得到ADP俯仰角姿态第i,2,1子控制单元的输出u_i,2；

B6、设计ADP俯仰角姿态第i,2,2子控制单元：ADP俯仰角姿态第i,2,2子控制单元的输入端分别是ADP俯仰角姿态运算单元的输出

和

有向图

得到ADP俯仰角姿态第i,2,2子控制单元的输出d_i,2；

C、在第i个跟随者的输出约束状态一致博弈控制器中，设计偏航角子控制器；

C1、设计偏航角姿态系统转换单元-偏航角姿态系统转换单元的输入端为第i个跟随者的状态x_i,3,1和x_i,3,2，和第i个跟随者的输出y_i,3，根据偏航角输出约束的要求，引入一个非线性偏航角映射函数：

其中，H_i,3(·)是一个平滑、可逆和严格单调递增的函数，且满足以下条件：

为偏航角输出约束的下界，和

为偏航角输出约束的上界；

根据非线性偏航角映射函数，转换后的偏航角姿态系统为：

根据转换后的偏航角姿态系统，得到偏航角姿态系统转换单元的输出为转换后的偏航角姿态系统的状态s_i,3,1、s_i,3,2和转换后的偏航角姿态系统的输出

C2、设计偏航角姿态一致误差运算单元：偏航角姿态一致误差运算单元的输入端分别为有向图

中第j个跟随者转换后的状态s_j,3,1和s_j,3,2、跟随者的邻接通信a_ij、领导者的邻接通信b_i、偏航角姿态系统转换单元的输出s_i,3,1和s_i,3,2和领导者中偏航角姿态系统转换后的状态s_0,3,1和s_0,3,2，根据以下公式计算偏航角姿态一致误差：

C3、设计ADP偏航角姿态逼近器单元：ADP偏航角姿态逼近器单元的输入端分别为偏航角姿态一致误差运算单元的输出e_i,3,1和e_i,3,2、第i,3,1ADP子控制单元的输出u_i,3和第i,3,2ADP子控制单元的输出d_i,3，经过以下的计算：

得到ADP偏航角姿态逼近器单元的输出

其中

为ADP偏航角姿态逼近器单元中神经网络隐藏层到输出层的估计权值矩阵，是k₃行1列矩阵，k₃为ADP偏航角姿态逼近器单元中神经网络隐藏层神经元的个数，是大于零的常数；

c_i,3为神经网络的学习率，是大于零的常数；

e_i,3＝[e_i,3,1,e_i,3,2]^T，

q_i,3,1、q_i,3,2、R_i,3、γ_i,3和Γ_i,3分别是大于零的常数；

为激活函数，是k₃行1列矩阵，

是激活函数

对e_i,3的偏导矩阵，e_i,3＝[e_i,3,1,e_i,3,2]^T；

C4、设计ADP偏航角姿态运算单元：ADP偏航角姿态运算单元的输入端是ADP偏航角姿态逼近器单元的输出

经过以下计算：

得到ADP偏航角姿态运算单元的输出

和

C5、设计ADP偏航角姿态第i,3,1子控制单元：ADP偏航角姿态第i,3,1子控制单元的输入端分别是ADP偏航角姿态运算单元的输出

和

有向图

得到ADP偏航角姿态第i,3,1子控制单元的输出u_i,3；

C6、设计ADP偏航角姿态第i,3,2子控制单元-ADP偏航角姿态第i,3,2子控制单元的输入端分别是ADP偏航角姿态运算单元的输出

和

有向图

得到ADP偏航角姿态第i,3,2子控制单元的输出d_i,3。

本发明基于系统转换技术和博弈方法对多四旋翼无人机在有向通讯网络下实现遭受外部扰动的输出约束状态一致协同控制。考虑到四旋翼无人机飞行姿态中角度的限制，通过系统转换技术，将含输出约束的多四旋翼无人机姿态控制系统转化为无约束系统；借助ADP技术和博弈方法，设计的输出约束状态一致博弈控制器不仅使四旋翼无人机姿态控制系统稳定，且满足输出约束的要求，同时使得转换后系统的性能指标达到近似最优。

本发明的有益效果是：

(1)本发明提供一种多四旋翼无人机输出约束状态一致博弈控制器，针对多四旋翼无人机系统中的输出限制的要求，借助系统转换技术，使得含输出约束的多四旋翼无人机系统转换为无约束的多四旋翼无人机系统。

(2)本发明提供一种多四旋翼无人机输出约束状态一致博弈控制器，针对多四旋翼无人机系统中遭受外部扰动的影响，利用博弈的思想将扰动视为一种扰动输入，设计出对应的控制策略，使多四旋翼无人机系统在扰动下仍能达到状态一致的控制效果。

(3)本发明提供一种多四旋翼无人机输出约束状态一致博弈控制器，针对多四旋翼无人机系统中性能达到最优的控制问题，采用自适应动态规划技术，使得多四旋翼无人机系统的的性能指标近似最优。

附图说明

图1为本发明实施例的多四旋翼无人机输出约束状态一致博弈控制器的结构示意图。

图2为本发明实施例的跟随者移动机器人与领导者之间的单向拓扑图。

图3为本发明实施例的四个跟随者和领导者中滚转角姿态一致效果。

图4为本发明实施例的四个跟随者和领导者中滚转角速度一致效果。

图5为本发明实施例的四个跟随者滚转角姿态控制律。

图6为本发明实施例的四个跟随者滚转角姿态扰动律。

图7为本发明实施例的四个跟随者和领导者中俯仰角姿态一致效果。

图8为本发明实施例的四个跟随者和领导者中俯仰角速度一致效果。

图9为本发明实施例的四个跟随者俯仰角姿态控制律。

图10为本发明实施例的四个跟随者俯仰角姿态扰动律。

图11为本发明实施例的四个跟随者和领导者中偏航角姿态一致效果。

图12为本发明实施例的四个跟随者和领导者中偏航角速度一致效果。

图13为本发明实施例的四个跟随者俯仰角姿态控制律。

图14为本发明实施例的四个跟随者俯仰角姿态扰动律。

具体实施方式

现在结合附图对本发明作进一步详细的说明。

需要注意的是，发明中所引用的如“上”、“下”、“左”、“右”、“前”、“后”等的用语，亦仅为便于叙述的明了，而非用以限定本发明可实施的范围，其相对关系的改变或调整，在无实质变更技术内容下，当亦视为本发明可实施的范畴。

图1为本发明实施例的多四旋翼无人机输出约束状态一致博弈控制器的结构示意图。本实施例涉及一种多四旋翼无人机输出约束状态一致博弈控制器结构，包括滚转角子控制器、俯仰角子控制器和偏航角子控制器，滚转角子控制器、俯仰角子控制器和偏航角子控制器的输入端均与有向图

的输出端相连，输出端均与跟随者的输入端连接，跟随者为网络化系统中除领导者外的、含有输出约束的四旋翼无人机，网络化系统由一个领导者与N个跟随者通过单向拓扑图连接构成，领导者为网络化系统中一四旋翼无人机，跟随者均包括约束状态一致博弈控制器，该控制器利用系统转换和ADP技术设计，使得跟随者跟踪领导者的状态轨迹，同时将系统的输出限定在预设的范围内。

本实施例选用的跟随者中第i个四旋翼无人机姿态系统的状态方程为：

其中，φ_i为第i四旋翼无人机的滚转角、θ_i为第i个四旋翼无人机的俯仰角、ψ_i为第i四旋翼无人机的偏航角、ξ_φ,i、ξ_θ,i和ξ_ψ,i表示第i个四旋翼无人机的空气动力阻尼系数、I_x,i、I_y,i和I_z,i表示第i个四旋翼无人机的转动惯量、u_i,1、u_i,2和u_i,3表示第i个四旋翼无人机的控制输入和d_i,1、d_i,2和d_i,3表示第i个四旋翼无人机的外部未知扰动；将第i个四旋翼无人机的系统模型转换成状态模型，令x_i,1,1＝φ_i，

y_i,1＝x_i,1,1，x_i,2,1＝θ_i，

y_i,2＝x_i,2,1，x_i,3,1＝ψ_i，

y_i,3＝x_i,3,1，则转换后第i个四旋翼无人机的状态模型为：

I_x,i是滚转角系统中惯性矩，取1.25N·s²/rad，I_y,i是俯仰角系统中惯性矩，取1.25N·s²/rad，I_z,i是滚转角系统中惯性矩，取1.25N·s²/rad，ξ_φ,i是滚转角系统中空气动力阻尼系数，取1.2N·s²/rad，ξ_θ,i是俯仰角系统中空气动力阻尼系数，取1.2N·s²/rad，ξ_ψ,i是偏航角系统中空气动力阻尼系数，取1.2N·s²/rad。

四个跟随者系统状态的初始值分别为：x_1,1,1(0)＝0.3，x_1,1,2(0)＝0.6，x_1,2,1(0)＝0.3，x_1,2,2(0)＝0.6，x_1,3,1(0)＝0.3，x_1,3,2(0)＝0.6，x_2,1,1(0)＝0.2，x_2,1,2(0)＝0.8，x_2,2,1(0)＝0.2，x_2,2,2(0)＝0.8，x_2,3,1(0)＝0.2，x_2,3,2(0)＝0.8，x_3,1,1(0)＝0.1，x_3,1,2(0)＝1.1，x_3,2,1(0)＝0.1，x_2,2,2(0)＝1.1，x_1,3,1(0)＝0.1，x_3,3,2(0)＝1.1，x_4,1,1(0)＝0.35，x_4,1,2(0)＝0.5，x_4,2,1(0)＝0.35，x_4,2,2(0)＝0.5，x_4,3,1(0)＝0.35，x_0,3,2(0)＝0.5。

领导者状态状态方程为：

其中，y_0,1为领导者的输出滚转角，y_0,2为领导者的输出俯仰角，y_0,3为领导者的输出偏航角，x_0,1,1、x_0,1,2、x_0,2,1、x_0,2,2、x_0,3,1和x_0,3,2为领导者的状态。

领导者系统初始值为x_0,1,1(0)＝0.4，x_0,1,2(0)＝0.35，x_0,2,1(0)＝0.4，x_0,2,2(0)＝0.35，x_0,3,1(0)＝0.4，x_0,3,2(0)＝0.35。考虑由4个跟随者和1个领导者组成的多智能体网络，且至少有一个跟随者与领导者之间有通信，其通信拓扑图如图2所示，其中0为领导者的编号，1、2、3、4为四个跟随者的编号。进一步可以得到拉普拉斯矩阵，拉普拉斯矩阵如下：

在此例中，系统控制的目的是在单向拓扑图下，对四个跟随者的输出位置进行控制，使得跟随者状态能够跟踪上领导者状态，并使得系统的输出限定在特定的范围。

仿真结果如图3至14所示。从图3-图4可看出，四个跟随者的滚转角姿态能够很快的跟踪上领导者的滚转角姿态，且跟随者的滚转角速度也能很快的跟踪上领导者的滚转角速度。从图5-图6，在系统转换技术、ADP技术和博弈方法下，跟随者滚转角姿态控制律和扰动律给出。从图7-图8可看出，四个跟随者的俯仰角姿态能够很快的跟踪上领导者的俯仰角姿态，且跟随者的俯仰角速度也能很快的跟踪上领导者的俯仰角速度。从图9-图10，在系统转换技术、ADP技术和博弈方法下，跟随者俯仰角姿态控制律和扰动律给出。从图11-图12可看出，四个跟随者的偏航角姿态能够很快的跟踪上领导者的偏航角姿态，且跟随者的偏航角速度也能很快的跟踪上领导者的偏航角速度。从图13-图14，在系统转换技术、ADP技术和博弈方法下，跟随者偏航角姿态控制律和扰动律给出。

本发明的优点是考虑到四旋翼无人机飞行姿态中角度的限制，通过系统转换技术，将含输出约束的多四旋翼无人机姿态控制系统转化为无约束系统；借助ADP技术和博弈方法，设计的输出约束状态一致博弈控制器不仅使四旋翼无人机姿态控制系统稳定，且满足输出约束的要求，同时使得转换后系统的性能指标达到近似最优。

以上仅是本发明的优选实施方式，本发明的保护范围并不仅局限于上述实施例，凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理前提下的若干改进和润饰，应视为本发明的保护范围。

Claims

1.一种多四旋翼无人机输出约束状态一致博弈控制器，其特征在于，所述博弈控制器用于控制网络化系统中的各个跟随者；该网络化系统由一个领导者与N个跟随者通过单向拓扑图连接构成，所述跟随者为网络化系统中除领导者外的、含有输出约束的四旋翼无人机；领导者与至少一个跟随者之间存在通信连接，N个跟随者之间存在通信连接，跟随者之间的信息通信采用有向图