CN113885548A - 一种多四旋翼无人机输出约束状态一致博弈控制器 - Google Patents

一种多四旋翼无人机输出约束状态一致博弈控制器 Download PDF

Info

Publication number
CN113885548A
CN113885548A CN202111261119.0A CN202111261119A CN113885548A CN 113885548 A CN113885548 A CN 113885548A CN 202111261119 A CN202111261119 A CN 202111261119A CN 113885548 A CN113885548 A CN 113885548A
Authority
CN
China
Prior art keywords
adp
output
attitude
sub
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111261119.0A
Other languages
English (en)
Other versions
CN113885548B (zh
Inventor
杨杨
范昕
耿硕聪
舒周
岳东
张腾飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN202111261119.0A priority Critical patent/CN113885548B/zh
Publication of CN113885548A publication Critical patent/CN113885548A/zh
Application granted granted Critical
Publication of CN113885548B publication Critical patent/CN113885548B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/08Control of attitude, i.e. control of roll, pitch, or yaw
    • G05D1/0808Control of attitude, i.e. control of roll, pitch, or yaw specially adapted for aircraft
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft
    • G05D1/106Change initiated in response to external conditions, e.g. avoidance of elevated terrain or of no-fly zones

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种多四旋翼无人机输出约束状态一致博弈控制器,将N个含输出约束的四旋翼无人机视为跟随者,其与领导者通过单向拓扑图连接成的网络化系统作为被控对象,利用系统转换技术和ADP技术设计具有输出约束的状态一致博弈控制器,使得含扰动的跟随四旋翼无人机跟踪领导者的状态轨迹。本发明考虑到四旋翼无人机飞行姿态中角度的限制,通过系统转换技术,将含输出约束的多四旋翼无人机姿态控制系统转化为无约束系统;借助ADP技术和博弈方法,设计的输出约束状态一致博弈控制器不仅使四旋翼无人机姿态控制系统稳定,且满足输出约束的要求,同时使得转换后系统的性能指标达到近似最优。

Description

一种多四旋翼无人机输出约束状态一致博弈控制器
技术领域
本发明涉及工业过程控制技术领域,具体而言涉及一种多四旋翼无人机输出约束状态一致博弈控制器。
背景技术
20世纪以来,随着自动化技术的成熟和发展,多四旋翼无人机系统作为一种更为复杂和先进的机电系统出现在生产与科研等多个方面,众多科研工作者对多四旋翼无人机系统的控制问题展开了深入的研究。与单个的四旋翼无人机系统相比,多四旋翼无人机能够完成更复杂的任务,且具有更大的负荷能力。然而,多四旋翼无人机系统这些优点的获得是需要付出代价的,包括更为复杂的控制问题。将在该协调系统中的某一四旋翼无人机指定为“领导者”,其余的跟踪领导者的预定队形的移动机器人称为“跟随者”群体。在2019年,杜海波等人在有向通信拓扑下,针对一类多四旋翼飞行器的领导-跟随者结构分布式编队控制问题,提出了一种基于反步法的一致性编队控制算法,其在仿真案例中四旋翼飞行器的姿态角和位置作为输出量,让所有四旋翼飞行器在三维空间中收敛到期望的编队形态。但是在很多的实际应用中,四旋翼飞行器在运行中无法避免外部扰动的影响,四旋翼飞行器的姿态角需要限定在特定的范围,且系统的最优性能也是值得考虑的。
ADP方法是求解最优控制问题的有效工具,它起源于1957年,Bellman提出的DP方法,该方法核心是贝尔曼最优原理。这个原理可以归结为一个基本的递推公式,求解HJB方程。但是DP方法存在着“维数灾”问题。为了克服这些弱点,Werbos首先提出了ADP方法的框架,其主要思想是利用一个函数近似结构来估计代价函数,然后求解HJB方程进而获得近似最优控制策略。近年来,ADP方法获得了广泛的关注。基于神经网络技术和ADP方法,Ferrari设计状态反馈ADP控制器。黄玉柱提出了基于状态反馈的有界鲁棒ADP控制器,用于控制具有输入约束的不确定仿射非线性连续时间系统。用自适应动态规划算法,赵博研究一类仿射非线性系统的容错控制。在自适应动态规划的基础上,屈秋霞研究了一种基于输入饱和的不确定非线性系统的复合滑模控制器。针对一类具有输入饱和的非线性连续时间系统,在系统状态不完全可测的情况下,朱元恒利用ADP方法设计出事件触发近似最优控制器。利用模糊逻辑系统逼近系统的不确定性,张化光设计出一类仿射型非线性多智能体系统的近似最优一致控制方案。针对具有未知动态的仿射型非线性多智能体系统,张吉烈设计分布式最优一致控制器。Mazouchi提出了一种在线最优分布式学习算法来解决非线性多智能体微分图形博弈的领导同步问题。通过自适应动态规划方法,完全未知动态的连续时间非线性多智能体系统的分布式最优协调控制问题被研究。一方面,输出问题受限问题在实际工业应用中也是亟需处理的。针对带有输出约束的非线性系统的控制问题,范泉涌和杨光红中提出了一种具有松弛函数的系统变换技术。通过提出一个具有新状态变量的增强系统,以将原始约束问题转换为无约束问题。还有,杨秦敏通过引入一个映射函数来处理输出约束。通过对原系统进行转换,使得转换后的系统等效于原输出约束系统。另一方面,针对含扰动的非线性零和微分博弈,宋睿卓提出基于单神经网络和最小二乘的鲁棒最优控制。穆朝絮等人将基于博弈的最优控制方法应用到在电力系统上。2016年,魏庆来等人针对具有扰动的零和博弈问题,根据非线性系统的输入输出数据,引入了有效的递归神经网络来重构非线性系统的动力学,并提出了一种连续时间未知非线性系统的数据驱动零和神经最优控制方法。2018年,孙景亮针对一类具有输出和输入约束的严格反馈非线性系统的零和微分博弈问题,提出了拦截操纵目标的问题。将反步法引入零和微分博弈中,拓宽微分博弈的应用范围,并且将零和微分博弈方法应用到导弹-目标拦截系统中。
在实际的应用中,对多四旋翼无人机的姿态一致协同控制时,由于每个四旋翼无人机姿态控制系统中存在着外部扰动,无法实现对扰动的精准建模,以及系统的输出姿态需要限定在特定的范围,还有使得系统稳定的同时,系统的最优性也是需要考虑的,所以针对遭受外部扰动的多四旋翼无人机输出约束状态一致博弈控制研究具有重要的理论意义和现实意义。因此,迫切需要一种利用系统转换技术、ADP技术和博弈方法的输出约束状态一致博弈控制器,使得对遭受外部扰动的多四旋翼无人机的输出约束状态一致协同的研究具有最直接的现实意义。
发明内容
本发明针对现有技术中的不足,提供一种多四旋翼无人机输出约束状态一致博弈控制器,针对四旋翼无人机系统中对输出姿态角的约束问题,通过系统转换技术,将含约束的多四旋翼无人机姿态控制系统转化为无约束的控制系统。考虑到多四旋翼无人机姿态控制系统的未知外部扰动,利用博弈的方法,设计出输出约束状态一致博弈控制器,使得系统达到稳定,并且达到状态一致的控制效果。
为实现上述目的,本发明采用以下技术方案:
第一方面,本发明实施例提出了一种多四旋翼无人机输出约束状态一致博弈控制器,所述博弈控制器用于控制网络化系统中的各个跟随者;该网络化系统由一个领导者与N个跟随者通过单向拓扑图连接构成,所述跟随者为网络化系统中除领导者外的、含有输出约束的四旋翼无人机;领导者与至少一个跟随者之间存在通信连接,N个跟随者之间存在通信连接,跟随者之间的信息通信采用有向图
Figure BDA0003325770650000021
表示,其中v为节点的非空有限集合,且v={v1,…,vN},ε为边的集合,且ε={(vj,vi)∈v×v},vi为第i个移动机器人,vj为第j个移动机器人;(vj,vi)∈v×v表示第i个移动机器人能够直接获得第j个移动机器人的信息;其中,i、j为所述跟随者的编号,且1≤i≤N,1≤j≤N;
所述博弈控制器包括滚转角子控制器、俯仰角子控制器和偏航角子控制器;所述滚转角子控制器、俯仰角子控制器和偏航角子控制器的输入端均与有向图
Figure BDA0003325770650000022
的输出端相连,输出端均与跟随者的输入端连接;
所述滚转角子控制器包括滚转角姿态系统转换单元、滚转角姿态一致误差运算单元、ADP滚转角姿态逼近器单元、ADP滚转角姿态运算单元、ADP滚转角姿态第i,1,1子控制单元和设计ADP滚转角姿态第i,1,2子控制单元;
所述滚转角姿态系统转换单元的输入端为第i个跟随者的状态xi,1,1和xi,1,2,和第i个跟随者的输出yi,1
所述滚转角姿态一致误差运算单元的输入端分别为有向图
Figure BDA0003325770650000031
中第j个跟随者转换后的状态sj,1,1和sj,1,2、跟随者的邻接通信aij、领导者的邻接通信bi、滚转角姿态系统转换单元的输出si,1,1和si,1,2和领导者中滚转角姿态系统转换后的状态s0,1,1和s0,1,2
所述ADP滚转角姿态逼近器单元的输入端分别为滚转角姿态一致误差运算单元的输出ei,1,1和ei,1,2、第i,1,1ADP子控制单元的输出ui,1和第i,1,2ADP子控制单元的输出di,1
所述ADP滚转角姿态运算单元的输入端是ADP滚转角姿态逼近器单元的输出
Figure BDA0003325770650000032
所述ADP滚转角姿态第i,1,1子控制单元的输入端分别是ADP滚转角姿态运算单元的输出
Figure BDA0003325770650000033
Figure BDA0003325770650000034
有向图
Figure BDA0003325770650000035
中的拉普拉斯矩阵中的参数lii和领导者的邻接通信bi
所述ADP滚转角姿态第i,1,2子控制单元的输入端分别是ADP滚转角姿态运算单元的输出
Figure BDA0003325770650000036
Figure BDA0003325770650000037
有向图
Figure BDA0003325770650000038
中的拉普拉斯矩阵中的参数lii和领导者的邻接通信bi
所述俯仰角子控制器包括俯仰角姿态系统转换单元、俯仰角姿态一致误差运算单元、ADP俯仰角姿态逼近器单元、ADP俯仰角姿态运算单元、ADP俯仰角姿态第i,2,1子控制单元和设计ADP俯仰角姿态第i,2,2子控制单元;
所述俯仰角姿态系统转换单元的输入端为第i个跟随者的状态xi,2,1和xi,2,2,和第i个跟随者的输出yi,2
所述俯仰角姿态一致误差运算单元的输入端分别为有向图
Figure BDA0003325770650000041
中第j个跟随者转换后的状态sj,2,1和sj,2,2、跟随者的邻接通信aij、领导者的邻接通信bi、俯仰角姿态系统转换单元的输出si,2,1和si,2,2和领导者中俯仰角姿态系统转换后的状态s0,2,1和s0,2,2
所述ADP俯仰角姿态逼近器单元的输入端分别为俯仰角姿态一致误差运算单元的输出ei,2,1和ei,2,2、第i,2,1ADP子控制单元的输出ui,2和第i,2,2ADP子控制单元的输出di,2
所述ADP俯仰角姿态运算单元的输入端是ADP俯仰角姿态逼近器单元的输出
Figure BDA0003325770650000042
所述ADP俯仰角姿态第i,2,1子控制单元的输入端分别是ADP俯仰角姿态运算单元的输出
Figure BDA0003325770650000043
Figure BDA0003325770650000044
有向图
Figure BDA0003325770650000045
中的拉普拉斯矩阵中的参数lii和领导者的邻接通信bi
所述ADP俯仰角姿态第i,2,2子控制单元的输入端分别是ADP俯仰角姿态运算单元的输出
Figure BDA0003325770650000046
Figure BDA0003325770650000047
有向图
Figure BDA0003325770650000048
中的拉普拉斯矩阵中的参数lii和领导者的邻接通信bi
所述偏航角子控制器包括偏航角姿态系统转换单元、偏航角姿态一致误差运算单元、ADP偏航角姿态逼近器单元、ADP偏航角姿态运算单元、ADP偏航角姿态第i,3,1子控制单元和设计ADP偏航角姿态第i,3,2子控制单元;
所述偏航角姿态系统转换单元的输入端为第i个跟随者的状态xi,3,1和xi,3,2,和第i个跟随者的输出yi,3
所述偏航角姿态一致误差运算单元的输入端分别为有向图
Figure BDA0003325770650000049
中第j个跟随者转换后的状态sj,3,1和sj,3,2、跟随者的邻接通信aij、领导者的邻接通信bi、偏航角姿态系统转换单元的输出si,3,1和si,3,2和领导者中偏航角姿态系统转换后的状态s0,3,1和s0,3,2
所述ADP偏航角姿态逼近器单元的输入端分别为偏航角姿态一致误差运算单元的输出ei,3,1和ei,3,2、第i,3,1ADP子控制单元的输出ui,3和第i,3,2ADP子控制单元的输出di,3
所述ADP偏航角姿态运算单元的输入端是ADP偏航角姿态逼近器单元的输出
Figure BDA00033257706500000410
ADP偏航角姿态第i,3,1子控制单元的输入端分别是ADP偏航角姿态运算单元的输出
Figure BDA0003325770650000051
Figure BDA0003325770650000052
有向图
Figure BDA0003325770650000053
中的拉普拉斯矩阵中的参数lii和领导者的邻接通信bi
所述ADP偏航角姿态第i,3,2子控制单元的输入端分别是ADP偏航角姿态运算单元的输出
Figure BDA0003325770650000054
Figure BDA0003325770650000055
有向图
Figure BDA0003325770650000056
中的拉普拉斯矩阵中的参数lii和领导者的邻接通信bi
跟随者中第i个四旋翼无人机的系统模型为:
Figure BDA0003325770650000057
其中,φi为第i四旋翼无人机的滚转角、θi为第i个四旋翼无人机的俯仰角、ψi为第i四旋翼无人机的偏航角、ξφ,i、ξθ,i和ξψ,i表示第i个四旋翼无人机的空气动力阻尼系数、Ix,i、Iy,i和Iz,i表示第i个四旋翼无人机的转动惯量、ui,1、ui,2和ui,3表示第i个四旋翼无人机的控制输入和di,1、di,2和di,3表示第i个四旋翼无人机的外部未知扰动;
将第i个四旋翼无人机的系统模型转换成状态模型,令xi,1,1=φi
Figure BDA0003325770650000058
yi,1=xi,1,1,xi,2,1=θi
Figure BDA0003325770650000059
yi,2=xi,2,1,xi,3,1=ψi
Figure BDA00033257706500000510
yi,3=xi,3,1,则转换后第i个四旋翼无人机的状态模型为:
Figure BDA00033257706500000511
其中,yi,1为转换后第i个四旋翼无人机的输出滚转角,yi,2为转换后第i个四旋翼无人机的输出俯仰角,yi,3为转换后第i个四旋翼无人机的输出偏航角,xi,1,1、xi,1,2、xi,2,1、xi,2,2、xi,3,1和xi,3,2为第i个跟随者的状态,ui,1、ui,2和ui,3分别为第i个四旋翼无人机的滚转角控制输入、俯仰角控制输入和偏航角控制输入,di,1、di,2和di,3分别为第i个四旋翼无人机的滚转角扰动、俯仰角扰动和偏航角扰动。
进一步地,将跟随者的邻接矩阵记为A,那么A=[ai,j]N×N,该邻接矩阵A=[ai,j]N×N的定义如下:
Figure BDA0003325770650000061
其中,aij为第i、j个跟随者的邻接通信;
将有向图
Figure BDA0003325770650000062
的拉普拉斯矩阵记为L,那么L=D-A,其中,D为有向图
Figure BDA0003325770650000063
的度矩阵,且D=diag{d1,…,dN},di为跟随者的邻接矩阵的行和,且
Figure BDA0003325770650000064
进一步地,将节点i的邻接集合定义为Ni={j|(vj,vi)∈ε};有向图
Figure BDA0003325770650000065
的拉普拉斯矩阵记为L,L=[li,j]N×N,有向图
Figure BDA0003325770650000066
的拉普拉斯矩阵L=[li,j]N×N的定义为:
Figure BDA0003325770650000067
其中,lij为有向图
Figure BDA0003325770650000068
的拉普拉斯矩阵中的元素。
进一步地,将领导者的邻接矩阵记为B,B=diag{b1,…,bN},其中bi为领导者的邻接通信,当第i个跟随者能够得到领导者的信号时,bi=1;当第i个跟随者不能得到领导者的信号时,bi=0。
第二方面,本发明实施例提出了一种基于前述多四旋翼无人机输出约束状态一致博弈控制器的设计方法,所述设计方法包括以下步骤:
A、第i个跟随者的输出约束状态一致博弈控制器结构包括滚转角子控制器、俯仰角子控制器和偏航角子控制器,在第i个跟随者的输出约束状态一致博弈控制器中,设计滚转角子控制器;包括以下步骤:
A1、设计滚转角姿态系统转换单元:滚转角姿态系统转换单元的输入端为第i个跟随者的状态xi,1,1和xi,1,2,和第i个跟随者的输出yi,1,根据滚转角输出约束的要求,引入一个非线性滚转角映射函数:
Figure BDA0003325770650000071
其中,Hi,1(·)是一个平滑、可逆和严格单调递增的函数,且满足以下条件:
Figure BDA0003325770650000072
为滚转角输出约束的下界,和
Figure BDA0003325770650000073
为滚转角输出约束的上界;
根据非线性滚转角映射函数,转换后的滚转角姿态系统为:
Figure BDA0003325770650000074
根据转换后的滚转角姿态系统,得到滚转角姿态系统转换单元的输出为转换后的滚转角姿态系统的状态si,1,1、si,1,2和转换后的滚转角姿态系统的输出
Figure BDA0003325770650000075
A2、设计滚转角姿态一致误差运算单元:滚转角姿态一致误差运算单元的输入端分别为有向图
Figure BDA0003325770650000076
中第j个跟随者转换后的状态sj,1,1和sj,1,2、跟随者的邻接通信aij、领导者的邻接通信bi、滚转角姿态系统转换单元的输出si,1,1和si,1,2和领导者中滚转角姿态系统转换后的状态s0,1,1和s0,1,2,根据以下公式计算滚转角姿态一致误差:
Figure BDA0003325770650000077
A3、设计ADP滚转角姿态逼近器单元:ADP滚转角姿态逼近器单元的输入端分别为滚转角姿态一致误差运算单元的输出ei,1,1和ei,1,2、第i,1,1ADP子控制单元的输出ui,1和第i,1,2ADP子控制单元的输出di,1,经过以下的计算:
Figure BDA0003325770650000078
得到ADP滚转角姿态逼近器单元的输出
Figure BDA0003325770650000079
其中
Figure BDA00033257706500000710
为ADP滚转角姿态逼近器单元中神经网络隐藏层到输出层的估计权值矩阵,是k1行1列矩阵,k1为ADP滚转角姿态逼近器单元中神经网络隐藏层神经元的个数,是大于零的常数;
Figure BDA00033257706500000711
ci,1为神经网络的学习率,是大于零的常数;
Figure BDA00033257706500000712
ei,1=[ei,1,1,ei,1,2]T
Figure BDA0003325770650000081
qi,1,1、qi,1,2、Ri,1、γi,1和Γi,1分别是大于零的常数;
Figure BDA0003325770650000082
为激活函数,是k1行1列矩阵,
Figure BDA0003325770650000083
是激活函数
Figure BDA0003325770650000084
对ei,1的偏导矩阵,ei,1=[ei,1,1,ei,1,2]T
A4、设计ADP滚转角姿态运算单元:ADP滚转角姿态运算单元的输入端是ADP滚转角姿态逼近器单元的输出
Figure BDA0003325770650000085
经过以下计算:
Figure BDA0003325770650000086
得到ADP滚转角姿态运算单元的输出
Figure BDA0003325770650000087
Figure BDA0003325770650000088
A5、设计ADP滚转角姿态第i,1,1子控制单元:ADP滚转角姿态第i,1,1子控制单元的输入端分别是ADP滚转角姿态运算单元的输出
Figure BDA0003325770650000089
Figure BDA00033257706500000810
有向图
Figure BDA00033257706500000811
中的拉普拉斯矩阵中的参数lii和领导者的邻接通信bi,经过以下计算:
Figure BDA00033257706500000812
得到ADP滚转角姿态第i,1,1子控制单元的输出ui,1
A6、设计ADP滚转角姿态第i,1,2子控制单元-ADP滚转角姿态第i,1,2子控制单元的输入端分别是ADP滚转角姿态运算单元的输出
Figure BDA00033257706500000813
Figure BDA00033257706500000814
有向图
Figure BDA00033257706500000815
中的拉普拉斯矩阵中的参数lii和领导者的邻接通信bi,经过以下计算:
Figure BDA00033257706500000816
得到ADP滚转角姿态第i,1,2子控制单元的输出di,1
B、在第i个跟随者的输出约束状态一致博弈控制器中,设计俯仰角子控制器;
B1、设计俯仰角姿态系统转换单元:俯仰角姿态系统转换单元的输入端为第i个跟随者的状态xi,2,1和xi,2,2,和第i个跟随者的输出yi,2,根据俯仰角输出约束的要求,引入一个非线性俯仰角映射函数,为
Figure BDA0003325770650000091
其中,Hi,2(·)是一个平滑、可逆和严格单调递增的函数,且满足以下条件:
Figure BDA0003325770650000092
为俯仰角输出约束的下界,和
Figure BDA0003325770650000093
为俯仰角输出约束的上界;
根据非线性俯仰角映射函数,转换后的俯仰角姿态系统为:
Figure BDA0003325770650000094
根据转换后的俯仰角姿态系统,得到俯仰角姿态系统转换单元的输出为转换后的俯仰角姿态系统的状态si,2,1、si,2,2和转换后的滚转角姿态系统的输出
Figure BDA0003325770650000095
B2、设计俯仰角姿态一致误差运算单元:俯仰角姿态一致误差运算单元的输入端分别为有向图
Figure BDA0003325770650000096
中第j个跟随者转换后的状态sj,2,1和sj,2,2、跟随者的邻接通信aij、领导者的邻接通信bi、俯仰角姿态系统转换单元的输出si,2,1和si,2,2和领导者中俯仰角姿态系统转换后的状态s0,2,1和s0,2,2,根据以下公式计算俯仰角姿态一致误差:
Figure BDA0003325770650000097
B3、设计ADP俯仰角姿态逼近器单元:ADP俯仰角姿态逼近器单元的输入端分别为俯仰角姿态一致误差运算单元的输出ei,2,1和ei,2,2、第i,2,1ADP子控制单元的输出ui,2和第i,2,2ADP子控制单元的输出di,2,经过以下的计算:
Figure BDA0003325770650000098
得到ADP俯仰角姿态逼近器单元的输出
Figure BDA0003325770650000099
其中
Figure BDA00033257706500000910
为ADP俯仰角姿态逼近器单元中神经网络隐藏层到输出层的估计权值矩阵,是k2行1列矩阵,k2为ADP俯仰角姿态逼近器单元中神经网络隐藏层神经元的个数,是大于零的常数;
Figure BDA0003325770650000101
ci,2为神经网络的学习率,是大于零的常数;
Figure BDA0003325770650000102
ei,2=[ei,2,1,ei,2,2]T
Figure BDA0003325770650000103
qi,2,1、qi,2,2、Ri,2、γi,2和Γi,2分别是大于零的常数;
Figure BDA0003325770650000104
为激活函数,是k2行1列矩阵,
Figure BDA0003325770650000105
是激活函数
Figure BDA0003325770650000106
对ei,2的偏导矩阵,ei,2=[ei,2,1,ei,2,2]T
B4、设计ADP俯仰角姿态运算单元:ADP俯仰角姿态运算单元的输入端是ADP俯仰角姿态逼近器单元的输出
Figure BDA0003325770650000107
经过以下计算:
Figure BDA0003325770650000108
得到ADP俯仰角姿态运算单元的输出
Figure BDA0003325770650000109
Figure BDA00033257706500001010
B5、设计ADP俯仰角姿态第i,2,1子控制单元:ADP俯仰角姿态第i,2,1子控制单元的输入端分别是ADP俯仰角姿态运算单元的输出
Figure BDA00033257706500001011
Figure BDA00033257706500001012
有向图
Figure BDA00033257706500001013
中的拉普拉斯矩阵中的参数lii和领导者的邻接通信bi,经过以下计算:
Figure BDA00033257706500001014
得到ADP俯仰角姿态第i,2,1子控制单元的输出ui,2
B6、设计ADP俯仰角姿态第i,2,2子控制单元:ADP俯仰角姿态第i,2,2子控制单元的输入端分别是ADP俯仰角姿态运算单元的输出
Figure BDA00033257706500001015
Figure BDA00033257706500001016
有向图
Figure BDA00033257706500001017
中的拉普拉斯矩阵中的参数lii和领导者的邻接通信bi,经过以下计算:
Figure BDA00033257706500001018
得到ADP俯仰角姿态第i,2,2子控制单元的输出di,2
C、在第i个跟随者的输出约束状态一致博弈控制器中,设计偏航角子控制器;
C1、设计偏航角姿态系统转换单元-偏航角姿态系统转换单元的输入端为第i个跟随者的状态xi,3,1和xi,3,2,和第i个跟随者的输出yi,3,根据偏航角输出约束的要求,引入一个非线性偏航角映射函数:
Figure BDA0003325770650000111
其中,Hi,3(·)是一个平滑、可逆和严格单调递增的函数,且满足以下条件:
Figure BDA0003325770650000112
为偏航角输出约束的下界,和
Figure BDA0003325770650000113
为偏航角输出约束的上界;
根据非线性偏航角映射函数,转换后的偏航角姿态系统为:
Figure BDA0003325770650000114
根据转换后的偏航角姿态系统,得到偏航角姿态系统转换单元的输出为转换后的偏航角姿态系统的状态si,3,1、si,3,2和转换后的偏航角姿态系统的输出
Figure BDA0003325770650000115
C2、设计偏航角姿态一致误差运算单元:偏航角姿态一致误差运算单元的输入端分别为有向图
Figure BDA0003325770650000116
中第j个跟随者转换后的状态sj,3,1和sj,3,2、跟随者的邻接通信aij、领导者的邻接通信bi、偏航角姿态系统转换单元的输出si,3,1和si,3,2和领导者中偏航角姿态系统转换后的状态s0,3,1和s0,3,2,根据以下公式计算偏航角姿态一致误差:
Figure BDA0003325770650000117
C3、设计ADP偏航角姿态逼近器单元:ADP偏航角姿态逼近器单元的输入端分别为偏航角姿态一致误差运算单元的输出ei,3,1和ei,3,2、第i,3,1ADP子控制单元的输出ui,3和第i,3,2ADP子控制单元的输出di,3,经过以下的计算:
Figure BDA0003325770650000121
得到ADP偏航角姿态逼近器单元的输出
Figure BDA0003325770650000122
其中
Figure BDA0003325770650000123
为ADP偏航角姿态逼近器单元中神经网络隐藏层到输出层的估计权值矩阵,是k3行1列矩阵,k3为ADP偏航角姿态逼近器单元中神经网络隐藏层神经元的个数,是大于零的常数;
Figure BDA0003325770650000124
ci,3为神经网络的学习率,是大于零的常数;
Figure BDA0003325770650000125
ei,3=[ei,3,1,ei,3,2]T
Figure BDA0003325770650000126
qi,3,1、qi,3,2、Ri,3、γi,3和Γi,3分别是大于零的常数;
Figure BDA0003325770650000127
为激活函数,是k3行1列矩阵,
Figure BDA0003325770650000128
是激活函数
Figure BDA0003325770650000129
对ei,3的偏导矩阵,ei,3=[ei,3,1,ei,3,2]T
C4、设计ADP偏航角姿态运算单元:ADP偏航角姿态运算单元的输入端是ADP偏航角姿态逼近器单元的输出
Figure BDA00033257706500001210
经过以下计算:
Figure BDA00033257706500001211
得到ADP偏航角姿态运算单元的输出
Figure BDA00033257706500001212
Figure BDA00033257706500001213
C5、设计ADP偏航角姿态第i,3,1子控制单元:ADP偏航角姿态第i,3,1子控制单元的输入端分别是ADP偏航角姿态运算单元的输出
Figure BDA00033257706500001214
Figure BDA00033257706500001215
有向图
Figure BDA00033257706500001216
中的拉普拉斯矩阵中的参数lii和领导者的邻接通信bi,经过以下计算:
Figure BDA00033257706500001217
得到ADP偏航角姿态第i,3,1子控制单元的输出ui,3
C6、设计ADP偏航角姿态第i,3,2子控制单元-ADP偏航角姿态第i,3,2子控制单元的输入端分别是ADP偏航角姿态运算单元的输出
Figure BDA0003325770650000131
Figure BDA0003325770650000132
有向图
Figure BDA0003325770650000133
中的拉普拉斯矩阵中的参数lii和领导者的邻接通信bi,经过以下计算:
Figure BDA0003325770650000134
得到ADP偏航角姿态第i,3,2子控制单元的输出di,3
本发明基于系统转换技术和博弈方法对多四旋翼无人机在有向通讯网络下实现遭受外部扰动的输出约束状态一致协同控制。考虑到四旋翼无人机飞行姿态中角度的限制,通过系统转换技术,将含输出约束的多四旋翼无人机姿态控制系统转化为无约束系统;借助ADP技术和博弈方法,设计的输出约束状态一致博弈控制器不仅使四旋翼无人机姿态控制系统稳定,且满足输出约束的要求,同时使得转换后系统的性能指标达到近似最优。
本发明的有益效果是:
(1)本发明提供一种多四旋翼无人机输出约束状态一致博弈控制器,针对多四旋翼无人机系统中的输出限制的要求,借助系统转换技术,使得含输出约束的多四旋翼无人机系统转换为无约束的多四旋翼无人机系统。
(2)本发明提供一种多四旋翼无人机输出约束状态一致博弈控制器,针对多四旋翼无人机系统中遭受外部扰动的影响,利用博弈的思想将扰动视为一种扰动输入,设计出对应的控制策略,使多四旋翼无人机系统在扰动下仍能达到状态一致的控制效果。
(3)本发明提供一种多四旋翼无人机输出约束状态一致博弈控制器,针对多四旋翼无人机系统中性能达到最优的控制问题,采用自适应动态规划技术,使得多四旋翼无人机系统的的性能指标近似最优。
附图说明
图1为本发明实施例的多四旋翼无人机输出约束状态一致博弈控制器的结构示意图。
图2为本发明实施例的跟随者移动机器人与领导者之间的单向拓扑图。
图3为本发明实施例的四个跟随者和领导者中滚转角姿态一致效果。
图4为本发明实施例的四个跟随者和领导者中滚转角速度一致效果。
图5为本发明实施例的四个跟随者滚转角姿态控制律。
图6为本发明实施例的四个跟随者滚转角姿态扰动律。
图7为本发明实施例的四个跟随者和领导者中俯仰角姿态一致效果。
图8为本发明实施例的四个跟随者和领导者中俯仰角速度一致效果。
图9为本发明实施例的四个跟随者俯仰角姿态控制律。
图10为本发明实施例的四个跟随者俯仰角姿态扰动律。
图11为本发明实施例的四个跟随者和领导者中偏航角姿态一致效果。
图12为本发明实施例的四个跟随者和领导者中偏航角速度一致效果。
图13为本发明实施例的四个跟随者俯仰角姿态控制律。
图14为本发明实施例的四个跟随者俯仰角姿态扰动律。
具体实施方式
现在结合附图对本发明作进一步详细的说明。
需要注意的是,发明中所引用的如“上”、“下”、“左”、“右”、“前”、“后”等的用语,亦仅为便于叙述的明了,而非用以限定本发明可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当亦视为本发明可实施的范畴。
图1为本发明实施例的多四旋翼无人机输出约束状态一致博弈控制器的结构示意图。本实施例涉及一种多四旋翼无人机输出约束状态一致博弈控制器结构,包括滚转角子控制器、俯仰角子控制器和偏航角子控制器,滚转角子控制器、俯仰角子控制器和偏航角子控制器的输入端均与有向图
Figure BDA0003325770650000145
的输出端相连,输出端均与跟随者的输入端连接,跟随者为网络化系统中除领导者外的、含有输出约束的四旋翼无人机,网络化系统由一个领导者与N个跟随者通过单向拓扑图连接构成,领导者为网络化系统中一四旋翼无人机,跟随者均包括约束状态一致博弈控制器,该控制器利用系统转换和ADP技术设计,使得跟随者跟踪领导者的状态轨迹,同时将系统的输出限定在预设的范围内。
本实施例选用的跟随者中第i个四旋翼无人机姿态系统的状态方程为:
Figure BDA0003325770650000141
其中,φi为第i四旋翼无人机的滚转角、θi为第i个四旋翼无人机的俯仰角、ψi为第i四旋翼无人机的偏航角、ξφ,i、ξθ,i和ξψ,i表示第i个四旋翼无人机的空气动力阻尼系数、Ix,i、Iy,i和Iz,i表示第i个四旋翼无人机的转动惯量、ui,1、ui,2和ui,3表示第i个四旋翼无人机的控制输入和di,1、di,2和di,3表示第i个四旋翼无人机的外部未知扰动;将第i个四旋翼无人机的系统模型转换成状态模型,令xi,1,1=φi
Figure BDA0003325770650000142
yi,1=xi,1,1,xi,2,1=θi
Figure BDA0003325770650000143
yi,2=xi,2,1,xi,3,1=ψi
Figure BDA0003325770650000144
yi,3=xi,3,1,则转换后第i个四旋翼无人机的状态模型为:
Figure BDA0003325770650000151
其中,yi,1为转换后第i个四旋翼无人机的输出滚转角,yi,2为转换后第i个四旋翼无人机的输出俯仰角,yi,3为转换后第i个四旋翼无人机的输出偏航角,xi,1,1、xi,1,2、xi,2,1、xi,2,2、xi,3,1和xi,3,2为第i个跟随者的状态,ui,1、ui,2和ui,3分别为第i个四旋翼无人机的滚转角控制输入、俯仰角控制输入和偏航角控制输入,di,1、di,2和di,3分别为第i个四旋翼无人机的滚转角扰动、俯仰角扰动和偏航角扰动。
Ix,i是滚转角系统中惯性矩,取1.25N·s2/rad,Iy,i是俯仰角系统中惯性矩,取1.25N·s2/rad,Iz,i是滚转角系统中惯性矩,取1.25N·s2/rad,ξφ,i是滚转角系统中空气动力阻尼系数,取1.2N·s2/rad,ξθ,i是俯仰角系统中空气动力阻尼系数,取1.2N·s2/rad,ξψ,i是偏航角系统中空气动力阻尼系数,取1.2N·s2/rad。
四个跟随者系统状态的初始值分别为:x1,1,1(0)=0.3,x1,1,2(0)=0.6,x1,2,1(0)=0.3,x1,2,2(0)=0.6,x1,3,1(0)=0.3,x1,3,2(0)=0.6,x2,1,1(0)=0.2,x2,1,2(0)=0.8,x2,2,1(0)=0.2,x2,2,2(0)=0.8,x2,3,1(0)=0.2,x2,3,2(0)=0.8,x3,1,1(0)=0.1,x3,1,2(0)=1.1,x3,2,1(0)=0.1,x2,2,2(0)=1.1,x1,3,1(0)=0.1,x3,3,2(0)=1.1,x4,1,1(0)=0.35,x4,1,2(0)=0.5,x4,2,1(0)=0.35,x4,2,2(0)=0.5,x4,3,1(0)=0.35,x0,3,2(0)=0.5。
领导者状态状态方程为:
Figure BDA0003325770650000161
其中,y0,1为领导者的输出滚转角,y0,2为领导者的输出俯仰角,y0,3为领导者的输出偏航角,x0,1,1、x0,1,2、x0,2,1、x0,2,2、x0,3,1和x0,3,2为领导者的状态。
领导者系统初始值为x0,1,1(0)=0.4,x0,1,2(0)=0.35,x0,2,1(0)=0.4,x0,2,2(0)=0.35,x0,3,1(0)=0.4,x0,3,2(0)=0.35。考虑由4个跟随者和1个领导者组成的多智能体网络,且至少有一个跟随者与领导者之间有通信,其通信拓扑图如图2所示,其中0为领导者的编号,1、2、3、4为四个跟随者的编号。进一步可以得到拉普拉斯矩阵,拉普拉斯矩阵如下:
Figure BDA0003325770650000162
在此例中,系统控制的目的是在单向拓扑图下,对四个跟随者的输出位置进行控制,使得跟随者状态能够跟踪上领导者状态,并使得系统的输出限定在特定的范围。
仿真结果如图3至14所示。从图3-图4可看出,四个跟随者的滚转角姿态能够很快的跟踪上领导者的滚转角姿态,且跟随者的滚转角速度也能很快的跟踪上领导者的滚转角速度。从图5-图6,在系统转换技术、ADP技术和博弈方法下,跟随者滚转角姿态控制律和扰动律给出。从图7-图8可看出,四个跟随者的俯仰角姿态能够很快的跟踪上领导者的俯仰角姿态,且跟随者的俯仰角速度也能很快的跟踪上领导者的俯仰角速度。从图9-图10,在系统转换技术、ADP技术和博弈方法下,跟随者俯仰角姿态控制律和扰动律给出。从图11-图12可看出,四个跟随者的偏航角姿态能够很快的跟踪上领导者的偏航角姿态,且跟随者的偏航角速度也能很快的跟踪上领导者的偏航角速度。从图13-图14,在系统转换技术、ADP技术和博弈方法下,跟随者偏航角姿态控制律和扰动律给出。
本发明的优点是考虑到四旋翼无人机飞行姿态中角度的限制,通过系统转换技术,将含输出约束的多四旋翼无人机姿态控制系统转化为无约束系统;借助ADP技术和博弈方法,设计的输出约束状态一致博弈控制器不仅使四旋翼无人机姿态控制系统稳定,且满足输出约束的要求,同时使得转换后系统的性能指标达到近似最优。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。

Claims (5)

1.一种多四旋翼无人机输出约束状态一致博弈控制器,其特征在于,所述博弈控制器用于控制网络化系统中的各个跟随者;该网络化系统由一个领导者与N个跟随者通过单向拓扑图连接构成,所述跟随者为网络化系统中除领导者外的、含有输出约束的四旋翼无人机;领导者与至少一个跟随者之间存在通信连接,N个跟随者之间存在通信连接,跟随者之间的信息通信采用有向图
Figure FDA0003325770640000017
表示,其中v为节点的非空有限集合,且v={v1,…,vN},ε为边的集合,且ε={(vj,vi)∈v×v},vi为第i个移动机器人,vj为第j个移动机器人;(vj,vi)∈v×v表示第i个移动机器人能够直接获得第j个移动机器人的信息;其中,i、j为所述跟随者的编号,且1≤i≤N,1≤j≤N;
所述博弈控制器包括滚转角子控制器、俯仰角子控制器和偏航角子控制器;所述滚转角子控制器、俯仰角子控制器和偏航角子控制器的输入端均与有向图
Figure FDA0003325770640000011
的输出端相连,输出端均与跟随者的输入端连接;
所述滚转角子控制器包括滚转角姿态系统转换单元、滚转角姿态一致误差运算单元、ADP滚转角姿态逼近器单元、ADP滚转角姿态运算单元、ADP滚转角姿态第i,1,1子控制单元和设计ADP滚转角姿态第i,1,2子控制单元;
所述滚转角姿态系统转换单元的输入端为第i个跟随者的状态xi,1,1和xi,1,2,和第i个跟随者的输出yi,1
所述滚转角姿态一致误差运算单元的输入端分别为有向图
Figure FDA0003325770640000012
中第j个跟随者转换后的状态sj,1,1和sj,1,2、跟随者的邻接通信aij、领导者的邻接通信bi、滚转角姿态系统转换单元的输出si,1,1和si,1,2和领导者中滚转角姿态系统转换后的状态s0,1,1和s0,1,2
所述ADP滚转角姿态逼近器单元的输入端分别为滚转角姿态一致误差运算单元的输出ei,1,1和ei,1,2、第i,1,1ADP子控制单元的输出ui,1和第i,1,2ADP子控制单元的输出di,1
所述ADP滚转角姿态运算单元的输入端是ADP滚转角姿态逼近器单元的输出
Figure FDA0003325770640000013
所述ADP滚转角姿态第i,1,1子控制单元的输入端分别是ADP滚转角姿态运算单元的输出
Figure FDA0003325770640000014
Figure FDA0003325770640000015
有向图
Figure FDA0003325770640000016
中的拉普拉斯矩阵中的参数lii和领导者的邻接通信bi
所述ADP滚转角姿态第i,1,2子控制单元的输入端分别是ADP滚转角姿态运算单元的输出
Figure FDA0003325770640000021
Figure FDA0003325770640000022
有向图
Figure FDA0003325770640000023
中的拉普拉斯矩阵中的参数lii和领导者的邻接通信bi
所述俯仰角子控制器包括俯仰角姿态系统转换单元、俯仰角姿态一致误差运算单元、ADP俯仰角姿态逼近器单元、ADP俯仰角姿态运算单元、ADP俯仰角姿态第i,2,1子控制单元和设计ADP俯仰角姿态第i,2,2子控制单元;
所述俯仰角姿态系统转换单元的输入端为第i个跟随者的状态xi,2,1和xi,2,2,和第i个跟随者的输出yi,2
所述俯仰角姿态一致误差运算单元的输入端分别为有向图
Figure FDA0003325770640000024
中第j个跟随者转换后的状态sj,2,1和sj,2,2、跟随者的邻接通信aij、领导者的邻接通信bi、俯仰角姿态系统转换单元的输出si,2,1和si,2,2和领导者中俯仰角姿态系统转换后的状态s0,2,1和s0,2,2
所述ADP俯仰角姿态逼近器单元的输入端分别为俯仰角姿态一致误差运算单元的输出ei,2,1和ei,2,2、第i,2,1ADP子控制单元的输出ui,2和第i,2,2ADP子控制单元的输出di,2
所述ADP俯仰角姿态运算单元的输入端是ADP俯仰角姿态逼近器单元的输出
Figure FDA0003325770640000025
所述ADP俯仰角姿态第i,2,1子控制单元的输入端分别是ADP俯仰角姿态运算单元的输出
Figure FDA0003325770640000026
Figure FDA0003325770640000027
有向图
Figure FDA0003325770640000028
中的拉普拉斯矩阵中的参数lii和领导者的邻接通信bi
所述ADP俯仰角姿态第i,2,2子控制单元的输入端分别是ADP俯仰角姿态运算单元的输出
Figure FDA0003325770640000029
Figure FDA00033257706400000210
有向图
Figure FDA00033257706400000211
中的拉普拉斯矩阵中的参数lii和领导者的邻接通信bi
所述偏航角子控制器包括偏航角姿态系统转换单元、偏航角姿态一致误差运算单元、ADP偏航角姿态逼近器单元、ADP偏航角姿态运算单元、ADP偏航角姿态第i,3,1子控制单元和设计ADP偏航角姿态第i,3,2子控制单元;
所述偏航角姿态系统转换单元的输入端为第i个跟随者的状态xi,3,1和xi,3,2,和第i个跟随者的输出yi,3
所述偏航角姿态一致误差运算单元的输入端分别为有向图
Figure FDA0003325770640000031
中第j个跟随者转换后的状态sj,3,1和sj,3,2、跟随者的邻接通信aij、领导者的邻接通信bi、偏航角姿态系统转换单元的输出si,3,1和si,3,2和领导者中偏航角姿态系统转换后的状态s0,3,1和s0,3,2
所述ADP偏航角姿态逼近器单元的输入端分别为偏航角姿态一致误差运算单元的输出ei,3,1和ei,3,2、第i,3,1ADP子控制单元的输出ui,3和第i,3,2ADP子控制单元的输出di,3
所述ADP偏航角姿态运算单元的输入端是ADP偏航角姿态逼近器单元的输出
Figure FDA0003325770640000032
ADP偏航角姿态第i,3,1子控制单元的输入端分别是ADP偏航角姿态运算单元的输出
Figure FDA0003325770640000033
Figure FDA0003325770640000034
有向图
Figure FDA0003325770640000035
中的拉普拉斯矩阵中的参数lii和领导者的邻接通信bi
所述ADP偏航角姿态第i,3,2子控制单元的输入端分别是ADP偏航角姿态运算单元的输出
Figure FDA0003325770640000036
Figure FDA0003325770640000037
有向图
Figure FDA0003325770640000038
中的拉普拉斯矩阵中的参数lii和领导者的邻接通信bi
跟随者中第i个四旋翼无人机的系统模型为:
Figure FDA0003325770640000039
其中,φi为第i四旋翼无人机的滚转角、θi为第i个四旋翼无人机的俯仰角、ψi为第i四旋翼无人机的偏航角、ξφ,i、ξθ,i和ξψ,i表示第i个四旋翼无人机的空气动力阻尼系数、Ix,i、Iy,i和Iz,i表示第i个四旋翼无人机的转动惯量、ui,1、ui,2和ui,3表示第i个四旋翼无人机的控制输入和di,1、di,2和di,3表示第i个四旋翼无人机的外部未知扰动;
将第i个四旋翼无人机的系统模型转换成状态模型,令xi,1,1=φi
Figure FDA00033257706400000310
yi,1=xi,1,1,xi,2,1=θi
Figure FDA00033257706400000311
yi,2=xi,2,1,xi,3,1=ψi
Figure FDA00033257706400000312
yi,3=xi,3,1,则转换后第i个四旋翼无人机的状态模型为:
Figure FDA0003325770640000041
其中,yi,1为转换后第i个四旋翼无人机的输出滚转角,yi,2为转换后第i个四旋翼无人机的输出俯仰角,yi,3为转换后第i个四旋翼无人机的输出偏航角,xi,1,1、xi,1,2、xi,2,1、xi,2,2、xi,3,1和xi,3,2为第i个跟随者的状态,ui,1、ui,2和ui,3分别为第i个四旋翼无人机的滚转角控制输入、俯仰角控制输入和偏航角控制输入,di,1、di,2和di,3分别为第i个四旋翼无人机的滚转角扰动、俯仰角扰动和偏航角扰动。
2.根据权利要求1所述的多四旋翼无人机输出约束状态一致博弈控制器,其特征在于,将跟随者的邻接矩阵记为A,那么A=[ai,j]N×N,该邻接矩阵A=[ai,j]N×N的定义如下:
Figure FDA0003325770640000042
其中,aij为第i、j个跟随者的邻接通信;
将有向图
Figure FDA0003325770640000043
的拉普拉斯矩阵记为L,那么L=D-A,其中,D为有向图
Figure FDA0003325770640000044
的度矩阵,且D=diag{d1,…,dN},di为跟随者的邻接矩阵的行和,且
Figure FDA0003325770640000045
3.根据权利要求1所述的多四旋翼无人机输出约束状态一致博弈控制器,其特征在于,将节点i的邻接集合定义为Ni={j|(vj,vi)∈ε};有向图
Figure FDA0003325770640000046
的拉普拉斯矩阵记为L,L=[li,j]N×N,有向图
Figure FDA0003325770640000047
的拉普拉斯矩阵L=[li,j]N×N的定义为:
Figure FDA0003325770640000048
其中,lij为有向图
Figure FDA0003325770640000051
的拉普拉斯矩阵中的元素。
4.根据权利要求1所述的多四旋翼无人机输出约束状态一致博弈控制器,其特征在于,将领导者的邻接矩阵记为B,B=diag{b1,…,bN},其中bi为领导者的邻接通信,当第i个跟随者能够得到领导者的信号时,bi=1;当第i个跟随者不能得到领导者的信号时,bi=0。
5.一种基于权利要求1-4任一项所述多四旋翼无人机输出约束状态一致博弈控制器的设计方法,其特征在于,所述设计方法包括以下步骤:
A、第i个跟随者的输出约束状态一致博弈控制器结构包括滚转角子控制器、俯仰角子控制器和偏航角子控制器,在第i个跟随者的输出约束状态一致博弈控制器中,设计滚转角子控制器;包括以下步骤:
A1、设计滚转角姿态系统转换单元:滚转角姿态系统转换单元的输入端为第i个跟随者的状态xi,1,1和xi,1,2,和第i个跟随者的输出yi,1,根据滚转角输出约束的要求,引入一个非线性滚转角映射函数:
Figure FDA0003325770640000052
其中,Hi,1(·)是一个平滑、可逆和严格单调递增的函数,且满足以下条件:
Figure FDA0003325770640000053
χ i,1<0为滚转角输出约束的下界,和
Figure FDA0003325770640000054
为滚转角输出约束的上界;
根据非线性滚转角映射函数,转换后的滚转角姿态系统为:
Figure FDA0003325770640000055
根据转换后的滚转角姿态系统,得到滚转角姿态系统转换单元的输出为转换后的滚转角姿态系统的状态si,1,1、si,1,2和转换后的滚转角姿态系统的输出
Figure FDA0003325770640000056
A2、设计滚转角姿态一致误差运算单元:滚转角姿态一致误差运算单元的输入端分别为有向图
Figure FDA0003325770640000057
中第j个跟随者转换后的状态sj,1,1和sj,1,2、跟随者的邻接通信aij、领导者的邻接通信bi、滚转角姿态系统转换单元的输出si,1,1和si,1,2和领导者中滚转角姿态系统转换后的状态s0,1,1和s0,1,2,根据以下公式计算滚转角姿态一致误差:
Figure FDA0003325770640000061
A3、设计ADP滚转角姿态逼近器单元:ADP滚转角姿态逼近器单元的输入端分别为滚转角姿态一致误差运算单元的输出ei,1,1和ei,1,2、第i,1,1ADP子控制单元的输出ui,1和第i,1,2ADP子控制单元的输出di,1,经过以下的计算:
Figure FDA0003325770640000062
得到ADP滚转角姿态逼近器单元的输出
Figure FDA0003325770640000063
其中
Figure FDA0003325770640000064
为ADP滚转角姿态逼近器单元中神经网络隐藏层到输出层的估计权值矩阵,是k1行1列矩阵,k1为ADP滚转角姿态逼近器单元中神经网络隐藏层神经元的个数,是大于零的常数;
Figure FDA0003325770640000065
ci,1为神经网络的学习率,是大于零的常数;
Figure FDA0003325770640000066
ei,1=[ei,1,1,ei,1,2]T
Figure FDA0003325770640000067
qi,1,1、qi,1,2、Ri,1、γi,1和Γi,1分别是大于零的常数;
Figure FDA0003325770640000068
为激活函数,是k1行1列矩阵,
Figure FDA0003325770640000069
是激活函数
Figure FDA00033257706400000610
对ei,1的偏导矩阵,ei,1=[ei,1,1,ei,1,2]T
A4、设计ADP滚转角姿态运算单元:ADP滚转角姿态运算单元的输入端是ADP滚转角姿态逼近器单元的输出
Figure FDA00033257706400000611
经过以下计算:
Figure FDA00033257706400000612
得到ADP滚转角姿态运算单元的输出
Figure FDA00033257706400000613
Figure FDA00033257706400000614
A5、设计ADP滚转角姿态第i,1,1子控制单元:ADP滚转角姿态第i,1,1子控制单元的输入端分别是ADP滚转角姿态运算单元的输出
Figure FDA00033257706400000615
Figure FDA00033257706400000616
有向图
Figure FDA00033257706400000617
中的拉普拉斯矩阵中的参数lii和领导者的邻接通信bi,经过以下计算:
Figure FDA00033257706400000618
得到ADP滚转角姿态第i,1,1子控制单元的输出ui,1
A6、设计ADP滚转角姿态第i,1,2子控制单元-ADP滚转角姿态第i,1,2子控制单元的输入端分别是ADP滚转角姿态运算单元的输出
Figure FDA0003325770640000071
Figure FDA0003325770640000072
有向图
Figure FDA0003325770640000073
中的拉普拉斯矩阵中的参数lii和领导者的邻接通信bi,经过以下计算:
Figure FDA0003325770640000074
得到ADP滚转角姿态第i,1,2子控制单元的输出di,1
B、在第i个跟随者的输出约束状态一致博弈控制器中,设计俯仰角子控制器;
B1、设计俯仰角姿态系统转换单元:俯仰角姿态系统转换单元的输入端为第i个跟随者的状态xi,2,1和xi,2,2,和第i个跟随者的输出yi,2,根据俯仰角输出约束的要求,引入一个非线性俯仰角映射函数,为
Figure FDA0003325770640000075
其中,Hi,2(·)是一个平滑、可逆和严格单调递增的函数,且满足以下条件:
Figure FDA0003325770640000076
χ i2<0为俯仰角输出约束的下界,和
Figure FDA0003325770640000077
为俯仰角输出约束的上界;
根据非线性俯仰角映射函数,转换后的俯仰角姿态系统为:
Figure FDA0003325770640000078
根据转换后的俯仰角姿态系统,得到俯仰角姿态系统转换单元的输出为转换后的俯仰角姿态系统的状态si,2,1、si,2,2和转换后的滚转角姿态系统的输出
Figure FDA0003325770640000079
B2、设计俯仰角姿态一致误差运算单元:俯仰角姿态一致误差运算单元的输入端分别为有向图
Figure FDA00033257706400000710
中第j个跟随者转换后的状态sj,2,1和sj,2,2、跟随者的邻接通信aij、领导者的邻接通信bi、俯仰角姿态系统转换单元的输出si,2,1和si,2,2和领导者中俯仰角姿态系统转换后的状态s0,2,1和s0,2,2,根据以下公式计算俯仰角姿态一致误差:
Figure FDA0003325770640000081
B3、设计ADP俯仰角姿态逼近器单元:ADP俯仰角姿态逼近器单元的输入端分别为俯仰角姿态一致误差运算单元的输出ei,2,1和ei,2,2、第i,2,1ADP子控制单元的输出ui,2和第i,2,2ADP子控制单元的输出di,2,经过以下的计算:
Figure FDA0003325770640000082
得到ADP俯仰角姿态逼近器单元的输出
Figure FDA0003325770640000083
其中
Figure FDA0003325770640000084
为ADP俯仰角姿态逼近器单元中神经网络隐藏层到输出层的估计权值矩阵,是k2行1列矩阵,k2为ADP俯仰角姿态逼近器单元中神经网络隐藏层神经元的个数,是大于零的常数;
Figure FDA0003325770640000085
ci,2为神经网络的学习率,是大于零的常数;
Figure FDA0003325770640000086
ei,2=[ei,2,1,ei,2,2]T
Figure FDA0003325770640000087
qi,2,1、qi,2,2、Ri,2、γi,2和Γi,2分别是大于零的常数;
Figure FDA0003325770640000088
为激活函数,是k2行1列矩阵,
Figure FDA0003325770640000089
是激活函数
Figure FDA00033257706400000810
对ei,2的偏导矩阵,ei,2=[ei,2,1,ei,2,2]T
B4、设计ADP俯仰角姿态运算单元:ADP俯仰角姿态运算单元的输入端是ADP俯仰角姿态逼近器单元的输出
Figure FDA00033257706400000811
经过以下计算:
Figure FDA00033257706400000812
得到ADP俯仰角姿态运算单元的输出
Figure FDA00033257706400000813
Figure FDA00033257706400000814
B5、设计ADP俯仰角姿态第i,2,1子控制单元:ADP俯仰角姿态第i,2,1子控制单元的输入端分别是ADP俯仰角姿态运算单元的输出
Figure FDA00033257706400000815
Figure FDA00033257706400000816
有向图
Figure FDA00033257706400000817
中的拉普拉斯矩阵中的参数lii和领导者的邻接通信bi,经过以下计算:
Figure FDA0003325770640000091
得到ADP俯仰角姿态第i,2,1子控制单元的输出ui,2
B6、设计ADP俯仰角姿态第i,2,2子控制单元:ADP俯仰角姿态第i,2,2子控制单元的输入端分别是ADP俯仰角姿态运算单元的输出
Figure FDA0003325770640000092
Figure FDA0003325770640000093
有向图
Figure FDA0003325770640000094
中的拉普拉斯矩阵中的参数lii和领导者的邻接通信bi,经过以下计算:
Figure FDA0003325770640000095
得到ADP俯仰角姿态第i,2,2子控制单元的输出di,2
C、在第i个跟随者的输出约束状态一致博弈控制器中,设计偏航角子控制器;
C1、设计偏航角姿态系统转换单元-偏航角姿态系统转换单元的输入端为第i个跟随者的状态xi,3,1和xi,3,2,和第i个跟随者的输出yi,3,根据偏航角输出约束的要求,引入一个非线性偏航角映射函数:
Figure FDA0003325770640000096
其中,Hi,3(·)是一个平滑、可逆和严格单调递增的函数,且满足以下条件:
Figure FDA0003325770640000097
χ i,3<0为偏航角输出约束的下界,和
Figure FDA0003325770640000098
为偏航角输出约束的上界;
根据非线性偏航角映射函数,转换后的偏航角姿态系统为:
Figure FDA0003325770640000099
根据转换后的偏航角姿态系统,得到偏航角姿态系统转换单元的输出为转换后的偏航角姿态系统的状态si,3,1、si,3,2和转换后的偏航角姿态系统的输出
Figure FDA00033257706400000910
C2、设计偏航角姿态一致误差运算单元:偏航角姿态一致误差运算单元的输入端分别为有向图
Figure FDA0003325770640000101
中第j个跟随者转换后的状态sj,3,1和sj,3,2、跟随者的邻接通信aij、领导者的邻接通信bi、偏航角姿态系统转换单元的输出si,3,1和si,3,2和领导者中偏航角姿态系统转换后的状态s0,3,1和s0,3,2,根据以下公式计算偏航角姿态一致误差:
Figure FDA0003325770640000102
C3、设计ADP偏航角姿态逼近器单元:ADP偏航角姿态逼近器单元的输入端分别为偏航角姿态一致误差运算单元的输出ei,3,1和ei,3,2、第i,3,1ADP子控制单元的输出ui,3和第i,3,2ADP子控制单元的输出di,3,经过以下的计算:
Figure FDA0003325770640000103
得到ADP偏航角姿态逼近器单元的输出
Figure FDA0003325770640000104
其中
Figure FDA0003325770640000105
为ADP偏航角姿态逼近器单元中神经网络隐藏层到输出层的估计权值矩阵,是k3行1列矩阵,k3为ADP偏航角姿态逼近器单元中神经网络隐藏层神经元的个数,是大于零的常数;
Figure FDA0003325770640000106
ci,3为神经网络的学习率,是大于零的常数;
Figure FDA0003325770640000107
ei,3=[ei,3,1,ei,3,2]T
Figure FDA0003325770640000108
qi,3,1、qi,3,2、Ri,3、γi,3和Γi,3分别是大于零的常数;
Figure FDA0003325770640000109
为激活函数,是k3行1列矩阵,
Figure FDA00033257706400001010
是激活函数
Figure FDA00033257706400001011
对ei,3的偏导矩阵,ei,3=[ei,3,1,ei,3,2]T
C4、设计ADP偏航角姿态运算单元:ADP偏航角姿态运算单元的输入端是ADP偏航角姿态逼近器单元的输出
Figure FDA00033257706400001012
经过以下计算:
Figure FDA00033257706400001013
得到ADP偏航角姿态运算单元的输出
Figure FDA00033257706400001014
Figure FDA00033257706400001015
C5、设计ADP偏航角姿态第i,3,1子控制单元:ADP偏航角姿态第i,3,1子控制单元的输入端分别是ADP偏航角姿态运算单元的输出
Figure FDA0003325770640000111
Figure FDA0003325770640000112
有向图
Figure FDA0003325770640000113
中的拉普拉斯矩阵中的参数lii和领导者的邻接通信bi,经过以下计算:
Figure FDA0003325770640000114
得到ADP偏航角姿态第i,3,1子控制单元的输出ui,3
C6、设计ADP偏航角姿态第i,3,2子控制单元-ADP偏航角姿态第i,3,2子控制单元的输入端分别是ADP偏航角姿态运算单元的输出
Figure FDA0003325770640000115
Figure FDA0003325770640000116
有向图
Figure FDA0003325770640000117
中的拉普拉斯矩阵中的参数lii和领导者的邻接通信bi,经过以下计算:
Figure FDA0003325770640000118
得到ADP偏航角姿态第i,3,2子控制单元的输出di,3
CN202111261119.0A 2021-10-28 2021-10-28 一种多四旋翼无人机输出约束状态一致博弈控制器 Active CN113885548B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111261119.0A CN113885548B (zh) 2021-10-28 2021-10-28 一种多四旋翼无人机输出约束状态一致博弈控制器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111261119.0A CN113885548B (zh) 2021-10-28 2021-10-28 一种多四旋翼无人机输出约束状态一致博弈控制器

Publications (2)

Publication Number Publication Date
CN113885548A true CN113885548A (zh) 2022-01-04
CN113885548B CN113885548B (zh) 2023-10-31

Family

ID=79014936

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111261119.0A Active CN113885548B (zh) 2021-10-28 2021-10-28 一种多四旋翼无人机输出约束状态一致博弈控制器

Country Status (1)

Country Link
CN (1) CN113885548B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115617039A (zh) * 2022-09-15 2023-01-17 哈尔滨工程大学 一种基于事件触发的分布式仿射无人艇编队控制器构建方法和无人艇编队控制方法
CN116009594A (zh) * 2023-03-27 2023-04-25 合肥工业大学 一种基于零和博弈的高超声速飞行器状态约束容错控制方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4752884A (en) * 1985-07-18 1988-06-21 Hughes Aircraft Company Precision platform pointing controller for a dual-spin spacecraft
WO2013120031A1 (en) * 2012-02-10 2013-08-15 Merlin Technology, Inc. Autopilot control arrangement and methods
CN107422741A (zh) * 2017-04-28 2017-12-01 西北工业大学 基于学习的保预设性能集群飞行分布式姿态追踪控制方法
CN111650830A (zh) * 2020-05-20 2020-09-11 天津大学 一种基于迭代学习的四旋翼飞行器鲁棒跟踪控制方法
CN112230670A (zh) * 2020-10-29 2021-01-15 南京邮电大学 一种含预估器的多四旋翼飞行器的编队控制方法
CN112859913A (zh) * 2021-01-13 2021-05-28 广东工业大学 考虑输出约束的多四旋翼无人机姿态一致最优控制方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4752884A (en) * 1985-07-18 1988-06-21 Hughes Aircraft Company Precision platform pointing controller for a dual-spin spacecraft
WO2013120031A1 (en) * 2012-02-10 2013-08-15 Merlin Technology, Inc. Autopilot control arrangement and methods
CN107422741A (zh) * 2017-04-28 2017-12-01 西北工业大学 基于学习的保预设性能集群飞行分布式姿态追踪控制方法
CN111650830A (zh) * 2020-05-20 2020-09-11 天津大学 一种基于迭代学习的四旋翼飞行器鲁棒跟踪控制方法
CN112230670A (zh) * 2020-10-29 2021-01-15 南京邮电大学 一种含预估器的多四旋翼飞行器的编队控制方法
CN112859913A (zh) * 2021-01-13 2021-05-28 广东工业大学 考虑输出约束的多四旋翼无人机姿态一致最优控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
马鸣宇;董朝阳;马思迁;王青;: "基于SO(3)的多四旋翼无人机编队协同控制", 控制理论与应用, no. 09 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115617039A (zh) * 2022-09-15 2023-01-17 哈尔滨工程大学 一种基于事件触发的分布式仿射无人艇编队控制器构建方法和无人艇编队控制方法
CN115617039B (zh) * 2022-09-15 2023-06-13 哈尔滨工程大学 一种基于事件触发的分布式仿射无人艇编队控制器构建方法和无人艇编队控制方法
CN116009594A (zh) * 2023-03-27 2023-04-25 合肥工业大学 一种基于零和博弈的高超声速飞行器状态约束容错控制方法
CN116009594B (zh) * 2023-03-27 2023-06-02 合肥工业大学 一种基于零和博弈的高超声速飞行器状态约束容错控制方法

Also Published As

Publication number Publication date
CN113885548B (zh) 2023-10-31

Similar Documents

Publication Publication Date Title
CN107422741B (zh) 基于学习的保预设性能集群飞行分布式姿态追踪控制方法
Zhang et al. RNN for perturbed manipulability optimization of manipulators based on a distributed scheme: A game-theoretic perspective
CN109445447A (zh) 一种多智能体编队跟踪控制方法及系统
CN113885548A (zh) 一种多四旋翼无人机输出约束状态一致博弈控制器
CN108897340B (zh) 一种通信和计算约束下航天器编队飞行相对位置控制方法
CN112947557B (zh) 一种切换拓扑下的多智能体容错跟踪控制方法
CN114138010B (zh) 一种基于加权偏差的多智能体高阶滑模编队控制方法
Cong et al. Formation control for multiquadrotor aircraft: Connectivity preserving and collision avoidance
CN112947086B (zh) 一种无人机和无人车组成的异构多智能体系统编队控制中执行器故障的自适应补偿方法
Yu et al. Enhanced recurrent fuzzy neural fault-tolerant synchronization tracking control of multiple unmanned airships via fractional calculus and fixed-time prescribed performance function
CN114237041A (zh) 一种基于预设性能的空-地协同固定时间容错控制方法
CN112859913B (zh) 考虑输出约束的多四旋翼无人机姿态一致最优控制方法
CN109901603A (zh) 一种输入时延下多空间飞行器姿态协同控制方法
CN111781942A (zh) 一种基于自构造模糊神经网络的容错飞行控制方法
Xu et al. Distributed fixed-time time-varying formation-containment control for networked underactuated quadrotor UAVs with unknown disturbances
CN118244799B (zh) 一种无人机编队协调控制方法
CN117055605A (zh) 多无人机姿态控制方法及系统
CN116483124A (zh) 一种无线速度测量抗干扰的四旋翼无人机编队控制方法
Li et al. Learning-observer-based adaptive tracking control of multiagent systems using compensation mechanism
Yang et al. Cooperative group formation control for multiple quadrotors system with finite-and fixed-time convergence
CN114415734B (zh) 基于adp和避障机制的四旋翼无人机编队重构控制系统
CN115356929A (zh) 执行器攻击奇异多智能体系统比例容许跟踪控制方法
CN114879742A (zh) 基于多智能体深度强化学习的无人机集群动态覆盖方法
CN113741192A (zh) 基于可切换拓扑的时滞多智能体系统约束容错控制方法
CN114265315A (zh) 异构线性集群系统时变输出编队跟踪控制方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant