CN115857525A - 一种无人直升机时变增益自抗扰优化控制方法 - Google Patents

一种无人直升机时变增益自抗扰优化控制方法 Download PDF

Info

Publication number
CN115857525A
CN115857525A CN202211510054.3A CN202211510054A CN115857525A CN 115857525 A CN115857525 A CN 115857525A CN 202211510054 A CN202211510054 A CN 202211510054A CN 115857525 A CN115857525 A CN 115857525A
Authority
CN
China
Prior art keywords
unmanned helicopter
designed
time
optimal
varying gain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211510054.3A
Other languages
English (en)
Other versions
CN115857525B (zh
Inventor
阎坤
陈超波
高嵩
马天力
赵素平
赵金泽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Technological University
Original Assignee
Xian Technological University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Technological University filed Critical Xian Technological University
Priority to CN202211510054.3A priority Critical patent/CN115857525B/zh
Publication of CN115857525A publication Critical patent/CN115857525A/zh
Application granted granted Critical
Publication of CN115857525B publication Critical patent/CN115857525B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Feedback Control In General (AREA)

Abstract

本发明属于飞行器鲁棒优化控制技术领域,公开了一种无人直升机时变增益自抗扰优化控制方法。该方法包括以下步骤:1.针对无人直升机高度姿态复合系统中存在的干扰,设计时变增益扩张状态观测器对未知干扰进行估计;2.将无人直升机跟踪优化控制问题等效转换为优化镇定问题;3.结合自适应动态规划方法和神经网络技术设计最优飞行控制器,以保证无人直升机的性能满足预设的能量指标函数。本发明所提出的方法,不仅对传统固定增益扩张状态观测器性能进行了显著改进,而且能够保证无人直升机在能耗最小的情况下顺利完成飞行任务。

Description

一种无人直升机时变增益自抗扰优化控制方法
技术领域
本发明属于飞行器鲁棒优化控制技术领域,具体是一种无人直升机时变增益自抗扰优化控制方法。
背景技术
无人直升机具有隐蔽性好、慢速飞行、垂直上升下降等明显优势,因此被广泛应用于救灾搜寻、侦察监视、探查航拍等领域,在军事和民用方面都有着非常重要的实用价值。在军事方面,无人直升机可以进行对地攻击、中继通信、火力支援、敌情监测等;在民用商用中,无人直升机可以代替人力进行高难度危险的电力巡航,对受损或老化的设备进行替换;还可以清理高压电线上的漂浮物质、对海洋中的溺水者和船舶进行搜索并投入救生器材、新闻和影视航拍、快件运输等。因此对无人直升机进行研究具有深远的学术价值和现实意义。
无人直升机在飞行过程中不可避免地会受到外部干扰的影响。目前,已有相当量的文献对无人直升机展开了抗扰控制研究,其中最为常见的自抗扰控制技术。但是,传统的自抗扰技术是基于固定增益扩张状态观测器设计的,这导致观测器参数无法随着干扰的变化而变化。此外,固定增益扩张状态观测器还存在初始时刻增益过大导致系统计算量爆炸的问题。随着航天航天、自动化和人工智能等技术的飞速发展,现今人们已不满足于无人直升机单纯的完成任务,而是期望它能以某种最优的性能指标实现要求,如油耗最小、时间最短、速度最快等。因此,对传统固定增益自抗扰技术进行改进并设计无人直升机的最优控制器是现实的迫切需求。
发明内容
本发明的目的是提供一种无人直升机时变增益自抗扰优化控制方法,保证无人直升机在具有良好鲁棒性能的同时,能够以能耗最小的方式完成跟踪任务。
为实现上述目的,本发明的技术方案具体分为以下步骤:
1)首先,针对无人直升机高度姿态复合系统中存在的干扰,设计时变增益扩张状态观测器来对未知干扰进行实时估计;
2)其次,通过等效变换将无人直升机跟踪优化控制问题转换为优化镇定问题处理:
3)最后,基于自适应动态规划方法和单评价神经网络技术设计最优飞行控制器,所述最优飞行控制器包括最优虚拟反馈控制器和最优反馈控制器。
进一步的,上述步骤(1)所述的无人直升机高度姿态复合动力学模型为:
Figure BDA0003970401860000021
Figure BDA0003970401860000022
Figure BDA0003970401860000023
/>
其中,Po=[ρ,σT]T表示高度和姿态混合向量,ρ和σ=[φ,θ,ψ]T分别表示无人直升机的垂直高度和姿态角向量,Σ=diag{1,Γ(σ)}和Γ(σ)∈R3×3是姿态运动学矩阵,Qo=[h,ΩT]T表示速度和角速度混合向量,h和Ω=[p,q,r]T分别是垂直速度和姿态角速度向量,
Figure BDA0003970401860000024
g是重力加速度,J0=diag{J0x,J0y,J0z}为惯性矩阵,
Figure BDA0003970401860000025
m表示总质量,/>
Figure BDA0003970401860000026
是待设计的控制输入,Fu和Tu∈R3分别是作用在无人直升机上的力和力矩,D∈R4是未知干扰,y0是系统输出。
进一步的,上述步骤(1)中,时变增益扩张状态观测器设计如下:
Figure BDA0003970401860000027
其中
Figure BDA0003970401860000028
和/>
Figure BDA0003970401860000029
分别表示P0,Q0和RD的估计值,/>
Figure BDA00039704018600000210
表示P0的估计误差,k1=diag{k11,k12,k13,k14},k2=diag{k21,k22,k23,k24},k3=diag{k31,k32,k33,k34},kij(i=1,2,3,j=1,2,3,4)是设计的正常数,μ(t)是时变增益,其形式为:
Figure BDA00039704018600000211
其中μ0和a为正常数。
进一步的,上述步骤(2)中,等效变换方法的具体步骤如下:选择候选Lyapunov函数如下所示
Figure BDA00039704018600000212
对Vo进行求导可得
Figure BDA0003970401860000031
其中*表示零矩阵,Eλ=λmax(E1),
Figure BDA0003970401860000032
Figure BDA0003970401860000033
从上式可以看出,如果设计的最优反馈控制器Uo能够使如下动态系统稳定
Figure BDA0003970401860000034
则可以确保(38)右侧第一项的稳定性;同时如果(NNM-Eλ)>0成立,整个闭环系统最终一致有界。
进一步的,上述步骤(3)中,提出虚拟控制律为:
Figure BDA0003970401860000035
其中Qdfo是设计的前馈虚拟控制器,Qdbo是设计的最优虚拟反馈控制器;
前馈虚拟控制器Qdfo设计为
Figure BDA0003970401860000036
实际控制律uu设计为
Figure BDA0003970401860000037
其中uun是设计的前馈控制器,uuo是设计的最优反馈控制器;
前馈控制器uun设计为
Figure BDA0003970401860000038
其中
Figure BDA0003970401860000039
f*=f-f(Qdo);
代价函数选取为:
Figure BDA0003970401860000041
其中
Figure BDA0003970401860000042
和/>
Figure BDA0003970401860000043
是选定的具有适当维数的正定矩阵;
针对代价函数(40)定义HJB方程为
Figure BDA0003970401860000044
其中
Figure BDA0003970401860000045
最优代价函数J*(ξ)的估计为
Figure BDA0003970401860000046
其中
Figure BDA0003970401860000047
和/>
Figure BDA0003970401860000048
分别是J*(ξ)以及Sa的估计;
最优控制器和HJB方程设计为
Figure BDA0003970401860000049
Figure BDA00039704018600000410
其中γe是残余误差。
进一步的,上述步骤(3)中,神经网络权值矩阵
Figure BDA00039704018600000411
的自适应更新律设计为:
Figure BDA00039704018600000412
其中Γs>0是设计的正常数,χ1和χ2是设计的具有适当维数的参数矩阵,
Figure BDA00039704018600000413
υs=μss
与现有技术相比,本发明带来的有益效果是:
(1)本发明所提出的时变增益自抗扰技术,解决了传统固定增益自抗扰技术存在的初始时刻计算量爆炸和观测器增益无法随时间变化的问题,提高了系统的瞬态性能;为了处理无人直升机高度姿态复合模型中的时变干扰,本发明采用时变参数设计了新型扩张状态观测器,并全面证明了任意时刻下系统均稳定,时变参数扩张状态观测器的性能优于固定不变参数的扩张状态观测器;
(2)本发明利用自适应动态规划技术和神经网络技术所设计的最优控制器,包含了最优虚拟反馈控制器和最优反馈控制器,解决了传统飞行控制设计中单纯完成跟踪任务的问题,而是能够保证无人直升机以能耗最小的代价完成飞行任务,大大提高了飞行性能;
(3)本发明所提出的设计方案,能同时兼顾无人直升机的抗扰能力和性能最优指标,更加符合实际任务背景。
附图说明
图1为本发明的系统控制流程图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图和实施例对本发明作进一步地详细描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明公开了一种无人直升机时变增益自抗扰优化控制方法。设计了新型时变增益自抗扰观测器,保证了无人直升机的瞬态性能;并将系统的最优跟踪控制问题等效转换为优化镇定问题,借助于自适应动态规划技术和神经网络技术,设计了最优控制器以实现能耗最小。
参见图1,在建立无人直升机高度姿态复合模型后,首先传感器会将采集到的系统输出信号送到时变增益扩张状态观测器和神经网络中;而后,采用自适应动态规划技术和神经网络的输出,设计虚拟最优反馈控制器;信号经处理后,与虚拟前馈控制器的输出联合设计虚拟控制律;同样地,采用自适应动态规划技术和神经网络的输出,设计最优反馈控制器;信号经处理后,与虚拟控制律、前馈控制器的输出联合设计实际控制律;最终,将该控制律用于解决无人直升机的最优跟踪控制问题。
实施例,一种无人直升机时变增益自抗扰优化控制方法,包括以下的具体步骤:
步骤(1):针对无人直升机高度姿态复合系统中存在的干扰,设计时变增益扩张状态观测器来对未知外部干扰进行实时估计
步骤1.1建立受扰的无人直升机姿态高度混合模型
考虑到垂直起降的典型运动模态,受到干扰影响的无人直升机高度姿态组合非线性动力学模型可以表示为:
Figure BDA0003970401860000051
/>
Figure BDA0003970401860000052
Figure BDA0003970401860000053
其中Po=[ρ,σT]T表示高度和姿态混合向量,ρ和σ=[φ,θ,ψ]T分别表示无人直升机的垂直高度和姿态角向量,Σ=diag{1,Γ(σ)}和Γ(σ)∈R3×3是姿态运动学矩阵,Qo=[h,ΩT]T表示速度和角速度混合向量,h和Ω=[p,q,r]T分别是垂直速度和姿态角速度向量,
Figure BDA0003970401860000061
J0=diag{J0x,J0y,J0z}为惯性矩阵,g是重力加速度,m表示无人直升机的总质量,/>
Figure BDA0003970401860000062
表示待设计的控制输入向量,Fu和Tu∈R3分别是作用在无人直升机系统上的力和力矩,D∈R4是总的未知干扰,y0是系统输出。
本发明的控制目标是设计自适应最优控制器,使得系统输出yo围绕在期望信号Pdo的附近,同时保证飞行过程能耗最小。为此下面列出一些必要的假设和引理:
假设1:假设未知扰动D及其一阶导数
Figure BDA00039704018600000617
是有界的。也就是说,存在正常数/>
Figure BDA0003970401860000063
和/>
Figure BDA0003970401860000064
使得/>
Figure BDA0003970401860000065
和/>
Figure BDA0003970401860000066
假设2:由于无人直升机的特殊旋翼结构,假设其姿态角在合理范围内变化。此外参考轨迹Pdo及其导数是有界的。
引理1:采用神经网络逼近任何未知的光滑函数M(ε),其形式为:
Figure BDA0003970401860000067
其中ε∈Rl是神经网络输入向量,
Figure BDA0003970401860000068
是M(ε)的估计;/>
Figure BDA0003970401860000069
表示最优权重矩阵且满足/>
Figure BDA00039704018600000610
Figure BDA00039704018600000616
是选定合适的基函数向量且满足KT(ε)K(ε)≤Km;/>
Figure BDA00039704018600000611
和Km为正常数。因此,未知的光滑函数M(ε)可以进一步描述为:
Figure BDA00039704018600000612
其中
Figure BDA00039704018600000613
是逼近误差且满足/>
Figure BDA00039704018600000614
Figure BDA00039704018600000615
是正常数。
步骤1.2设计时变增益扩张状态观测器
首先将外部干扰D扩展为一个新的状态RD,则受干扰无人直升机的非线性动力学(1)可以进一步描述为
Figure BDA0003970401860000071
其中D=RD。根据假设1,可以得出λ有界且
Figure BDA00039704018600000715
基于上述描述,新型时变增益扩张状态观测器构造如下:
Figure BDA0003970401860000072
其中
Figure BDA0003970401860000073
和/>
Figure BDA0003970401860000074
分别是P0,Q0和RD的估计值,/>
Figure BDA0003970401860000075
是P0的估计误差。k1=diag{k11,k12,k13,k14},k2=diag{k21,k22,k23,k24},k3=diag{k31,k32,k33,k34},kij(i=1,2,3,j=1,2,3,4)是设计的正常数,μ(t)是时变增益,其形式为:
Figure BDA0003970401860000076
其中μ0和a为正常数。
定义估计误差为
Figure BDA0003970401860000077
和/>
Figure BDA0003970401860000078
然后引用(4)和(5)得到:
Figure BDA0003970401860000079
Figure BDA00039704018600000710
Figure BDA00039704018600000711
为了便于分析,引入新的辅助变量βi(i=1,2,3),由下式给出
Figure BDA00039704018600000712
因为时变增益μ(t)是分段函数,所以讨论分为两种情况。首先,当
Figure BDA00039704018600000713
成立,已知μ(t)=μ0。辅助变量βi(i=1,2,3)可以重写为
Figure BDA00039704018600000714
结合(7)-(10)并取βi(i=1,2,3)对时间求导可得
Figure BDA0003970401860000081
Figure BDA0003970401860000082
Figure BDA0003970401860000083
通过定义
Figure BDA0003970401860000084
可以得出
Figure BDA0003970401860000085
其中*表示零矩阵,R4×4,I4×4表示单位矩阵,Bk=μ0(∑-I4×4),
Figure BDA0003970401860000086
选择适当的参数kij以确保Ac是Hurwitz矩阵。也即存在正定矩阵Mc,使得
Figure BDA0003970401860000087
其中Nc是正定矩阵。
选择Lyapunov函数为
Figure BDA0003970401860000088
代入(15)并求Vβ的导数得
Figure BDA0003970401860000089
其中||McB1||≤C1,||McB2||≤C2,C1和C2为正常数,NN1=λmin0Nc-2C1II-II),II∈R12×12是单位矩阵。
另一种情况是
Figure BDA00039704018600000810
成立,我们有μ(t)=(1+a)at。在这种情况下,考虑(7)-(10)并取βi(i=1,2,3)的时间导数
Figure BDA0003970401860000091
Figure BDA0003970401860000092
Figure BDA0003970401860000093
类似地,结合β的定义,可以给出
Figure BDA0003970401860000094
其中Bh=μ(t)(Σ-I4×4),
Figure BDA0003970401860000095
现在,我们选择相同的候选Lyapunov函数(17),它的时间导数变为
Figure BDA0003970401860000096
其中||McB3||≤C3,C3>0。
这里注意到μ(t)=(1+a)at
Figure BDA0003970401860000097
的指数函数。由于1+a>1始终成立,因此得出μ(t)是单调递增函数的结论。显然μ(t)的变化范围为μ(t)∈(1,μm),其中/>
Figure BDA0003970401860000098
我们由此可以得到:
Figure BDA0003970401860000099
将(24)代入(23)可得
Figure BDA00039704018600000910
其中NN2=λmin(Nc-2C3II-II)。
综合结论(18)和(25),得
Figure BDA00039704018600000911
其中NNM=max{NN1,NN2}。
步骤(2).通过等效变换方法将无人直升机跟踪优化控制问题转换为优化镇定问题
考虑到(1),我们将跟踪误差定义为
Figure BDA0003970401860000101
Figure BDA0003970401860000102
其中Pdo是期望的轨迹信号,Qdo是设计的虚拟控制器。
对e1的时间求导
Figure BDA0003970401860000103
与传统的反步法相比,本发明提出的虚拟控制律如下
Figure BDA0003970401860000104
其中Qdfo是设计的前馈虚拟控制律,Qdbo是待设计最优虚拟反馈控制器。显然,如果我们让Qdbo=0,方程(30)将退化为标准的反步法控制结构。
首先,将前馈虚拟控制器Qdfo设计为
Figure BDA0003970401860000105
将(30)和(31)代入(29)得到
Figure BDA0003970401860000106
对e2的时间求导
Figure BDA0003970401860000107
然后,实际控制输入uu表示为
Figure BDA0003970401860000108
其中uun是设计的前馈控制器,uuo是设计的最优反馈控制器。
前馈控制器uun设计为
Figure BDA0003970401860000109
其中
Figure BDA00039704018600001010
f*=f-f(Qdo)。
利用(34)和(35),方程(33)可以改写为
Figure BDA00039704018600001011
选择候选Lyapunov函数,如下所示:
Figure BDA0003970401860000111
考虑(26)、(32)和(36)并对Vo进行微分
Figure BDA0003970401860000112
其中Eλ=λmax(E1),
Figure BDA0003970401860000113
Figure BDA0003970401860000114
从(38)可以看出,如果设计的最优反馈控制器Uo可以使以下的动态系统稳定
Figure BDA0003970401860000115
则可以确保(38)右侧第一项的稳定性。同时如果(NNM-Eλ)>0成立,我们可以得出整个闭环系统最终一致有界的结论。这样原始的最优跟踪控制问题被转化为系统(39)的最优稳定问题。也即,通过这种等效变换方法将无人直升机的最优跟踪控制问题转换为系统镇定问题来处理。
步骤(3).基于自适应动态规划方法和单评价神经网络技术设计的最优飞行控制器,包括虚拟前馈控制器和最优反馈控制器的设计,以保证无人直升机的性能满足预设的能量指标函数。
结合动态系统(39),选取代价函数:
Figure BDA0003970401860000116
其中
Figure BDA0003970401860000117
和/>
Figure BDA0003970401860000118
是选定的具有适当维数的正定矩阵。
定义1:考虑具有代价函数(40)的非线性误差系统(39)。如果控制律Uo能够同时保证误差系统(39)稳定和代价函数(40)的有界性,则Uo被称为(39)中的容许控制输入。同时所有的可容许的控制输入构成了一个可容许的集合
Figure BDA0003970401860000121
描述为/>
Figure BDA0003970401860000122
针对代价函数(40),定义哈密尔顿方程为
Figure BDA0003970401860000123
其中
Figure BDA0003970401860000124
/>
根据最优解的存在条件
Figure BDA0003970401860000125
最优控制输入/>
Figure BDA0003970401860000126
使代价函数(40)最小
Figure BDA0003970401860000127
其中
Figure BDA0003970401860000128
J*(ξ)是当J*(0)=0时的最小代价函数。
通过设
Figure BDA0003970401860000129
并代入(42),我们得到以下HJB方程
Figure BDA00039704018600001210
其中
Figure BDA00039704018600001211
由于HJB方程(43)是一个复杂的非线性偏微分方程,很难获得解析解。因此将神经网络技术与ADP方法相结合来克服这一困难。此外,给出如下假设:
假设3:对于误差系统(39)和相应的最优控制器
Figure BDA00039704018600001212
存在一个有界正定矩阵/>
Figure BDA00039704018600001213
以及正函数/>
Figure BDA00039704018600001214
使得
Figure BDA00039704018600001215
Figure BDA00039704018600001216
其中
Figure BDA00039704018600001217
和l(ξ)是选择的Lyapunov函数。
基于引理1,采用NN技术来近似最优代价函数J*(ξ),可以描述为
Figure BDA00039704018600001218
其中Sa∈Rl是理想权值向量,ha(ξ)∈Rl表示NN的激励函数,
Figure BDA00039704018600001219
是近似误差。
对(46)求关于ξ的偏导数
Figure BDA0003970401860000131
其中
Figure BDA0003970401860000132
假设4:假设理想权值向量Sa,激励函数ha(ξ)和近似误差
Figure BDA0003970401860000133
在紧集Λj上是范数有界的。同时假设ha(ξ)和/>
Figure BDA0003970401860000134
的偏导数是范数有界的。也即存在正常数Sam1,ham1,/>
Figure BDA0003970401860000135
ham2和/>
Figure BDA0003970401860000136
使得||Sa||≤Sam1,||ha(ξ)||≤ham1,/>
Figure BDA0003970401860000137
Figure BDA0003970401860000138
成立。
调用(47),最优控制器(42)和相应的HJB方程(43)可以进一步改写为
Figure BDA0003970401860000139
Figure BDA00039704018600001310
其中
Figure BDA00039704018600001311
考虑到以下实际情况:
Figure BDA00039704018600001312
其中
Figure BDA00039704018600001313
根据假设3,注意到cΛ是有界的。换句话说存在正的常数cm,使得||cΛ||≤cm
进而HJB方程(49)变为
Figure BDA00039704018600001314
其中
Figure BDA00039704018600001315
由于理想权值矩阵Sa未知,因此采用NN的方法来估计最优代价函数J*(ξ):
Figure BDA0003970401860000141
其中
Figure BDA0003970401860000142
和/>
Figure BDA0003970401860000143
分别是J*(ξ)和Sa的估计值。
考虑(52),最优控制器(48)和HJB方程(51)的近似值可以表示为
Figure BDA0003970401860000144
Figure BDA0003970401860000145
其中γe是残余误差。
显然,如果神经网络的权值矩阵
Figure BDA0003970401860000146
能够被充分训练并以令人满意的方式近似于理想权值矩阵Sa,则可以得到最小化目标函数:
Figure BDA0003970401860000147
结合上述分析,设计
Figure BDA0003970401860000148
的自适应更新定律为:
Figure BDA0003970401860000149
/>
其中Γs>0是设计的正常数,χ1和χ2是设计的具有适当维度的参数,
Figure BDA00039704018600001410
υs=μss
定义
Figure BDA00039704018600001411
作为估计误差。引用(56)得
Figure BDA00039704018600001412
考虑(51)和(54),我们得到
Figure BDA00039704018600001413
将(58)代入(57)得
Figure BDA0003970401860000151
通过定义
Figure BDA0003970401860000152
方程(59)可以进一步表示为
Figure BDA0003970401860000153
其中
Figure BDA0003970401860000154
这里可以选择合适的参数χ1和χ2,使得Ma是正定矩阵。同时基于上述分析,可以得出Ma和Na的范数都是有界的。然后我们得到
Figure BDA0003970401860000155
其中ω1=λmin(Ma),
Figure BDA0003970401860000156
/>
下面对上述实施例的稳定性进行验证
上述控制器设计过程可以归纳为如下定理1的形式:
定理1:考虑包含扰动的无人直升机非线性动力学(1)满足假设1-3,设计时变增益扩张状态观测器为(5),神经网络的权重更新律设计为(56)。采用包含前馈控制器(35)和最优反馈控制器(53)的控制输入(34),闭环系统的所有误差信号最终都是一致有界的,并且代价函数(40)最小。
证明:选取Lyapunov函数为
Figure BDA0003970401860000157
其中l(ξ)的定义已在假设3中给出。本发明中,选择为
Figure BDA0003970401860000158
调用(38)和(61),并取Vγ的时间导数,我们得到
Figure BDA0003970401860000161
结合(48)和(53)得到
Figure BDA0003970401860000162
考虑假设3-4并将(64)代入(63),得到
Figure BDA0003970401860000163
其中
Figure BDA0003970401860000167
和/>
Figure BDA0003970401860000168
在此如果可以选择相应的参数,使得NNM-Eλ>0,
Figure BDA0003970401860000164
Figure BDA0003970401860000165
则可以得到
Figure BDA0003970401860000166
表示闭环系统的所有误差信号都是有界的。证明完成。
以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。任何熟悉该技术的人在本发明所揭露的技术范围内的局部修改或替换,都应涵盖在本发明的包含范围之内。

Claims (6)

1.一种无人直升机时变增益自抗扰优化控制方法,其特征在于:
(1)针对无人直升机高度姿态复合系统中存在的干扰,设计时变增益扩张状态观测器来对未知外部干扰进行实时估计;
(2)通过等效变换方法将无人直升机跟踪优化控制问题转换为优化镇定问题处理:
(3)基于自适应动态规划方法和单评价神经网络技术设计最优飞行控制器,所述最优飞行控制器包括最优虚拟反馈控制器和最优反馈控制器。
2.根据权利要求1所述的一种时变增益自抗扰优化控制方法,其特征在于,步骤(1)所述的无人直升机高度姿态复合动力学模型为:
Figure FDA0003970401850000011
其中,Po=[ρ,σT]T表示高度和姿态混合向量,ρ和σ=[φ,θ,ψ]T分别表示无人直升机的垂直高度和姿态角向量,Σ=diag{1,Γ(σ)}和Γ(σ)∈R3×3是姿态运动学矩阵,Qo=[h,ΩT]T表示速度和角速度混合向量,h和Ω=[p,q,r]T分别是垂直速度和姿态角速度向量,
Figure FDA0003970401850000012
g是重力加速度,J0=diag{J0x,J0y,J0z}为惯性矩阵,
Figure FDA0003970401850000013
m表示总质量,/>
Figure FDA0003970401850000014
是待设计的控制输入,Fu和Tu∈R3分别是作用在无人直升机上的力和力矩,D∈R4是未知干扰,y0是系统输出。
3.根据权利要求2所述的一种无人直升机时变增益自抗扰优化控制方法,其特征在于,步骤(1)中时变增益扩张状态观测器设计如下:
Figure FDA0003970401850000015
其中
Figure FDA0003970401850000016
和/>
Figure FDA0003970401850000017
分别表示P0,Q0和RD的估计值,/>
Figure FDA0003970401850000018
表示P0的估计误差,k1=diag{k11,k12,k13,k14},k2=diag{k21,k22,k23,k24},k3=diag{k31,k32,k33,k34},kij(i=1,2,3,j=1,2,3,4)是设计的正常数,μ(t)是时变增益,其形式为:
Figure FDA0003970401850000021
其中μ0和a为正常数。
4.根据权利要求1-3所述的一种无人直升机时变增益自抗扰优化控制方法,其特征在于,所述步骤(2)中,等效变换方法的具体步骤如下:
选择候选Lyapunov函数如下所示:
Figure FDA0003970401850000022
/>
对Vo进行求导可得
Figure FDA0003970401850000023
其中*表示零矩阵,Eλ=λmax(E1),
Figure FDA0003970401850000024
Figure FDA0003970401850000025
从上式可以看出,如果设计的最优反馈控制器Uo能够使如下动态系统稳定
Figure FDA0003970401850000026
则可以确保(38)右侧第一项的稳定性;同时如果(NNM-Eλ)>0成立,我们可以得出整个闭环系统最终一致有界的结论。
5.根据权利要求4所述的一种无人直升机时变增益自抗扰优化控制方法,其特征在于,所述步骤(3)中,提出虚拟控制律为:
Qdo=Qdfo+Qdbo (30)
其中Qdfo是设计的前馈虚拟控制器,Qdbo是设计的最优虚拟反馈控制器;
前馈虚拟控制器Qdfo设计为:
Figure FDA0003970401850000031
实际控制律uu设计为:
uu=uun+uuo (34)
其中uun是设计的前馈控制器,uuo是设计的最优反馈控制器;
前馈控制器uun设计为:
Figure FDA0003970401850000032
其中
Figure FDA0003970401850000033
f*=f-f(Qdo);
代价函数选取为:
Figure FDA0003970401850000034
其中
Figure FDA0003970401850000035
和/>
Figure FDA0003970401850000036
是选定的具有适当维数的正定矩阵;
针对代价函数(40)定义HJB方程为:
Figure FDA0003970401850000037
/>
其中
Figure FDA0003970401850000038
最优代价函数J*(ξ)的估计为:
Figure FDA0003970401850000039
其中
Figure FDA00039704018500000310
和/>
Figure FDA00039704018500000311
分别是J*(ξ)以及Sa的估计;
最优控制器和HJB方程设计为
Figure FDA00039704018500000312
Figure FDA00039704018500000313
其中γe是残余误差。
6.根据权利要求5所述的一种无人直升机时变增益自抗扰优化控制方法,其特征在于,所述步骤(3)中,神经网络权值矩阵
Figure FDA00039704018500000314
的自适应更新律设计为:
Figure FDA0003970401850000041
其中Γs>0是设计的正常数,χ1和χ2是设计的具有适当维数的参数矩阵,
Figure FDA0003970401850000042
υs=μss。/>
CN202211510054.3A 2022-11-29 2022-11-29 一种无人直升机时变增益自抗扰优化控制方法 Active CN115857525B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211510054.3A CN115857525B (zh) 2022-11-29 2022-11-29 一种无人直升机时变增益自抗扰优化控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211510054.3A CN115857525B (zh) 2022-11-29 2022-11-29 一种无人直升机时变增益自抗扰优化控制方法

Publications (2)

Publication Number Publication Date
CN115857525A true CN115857525A (zh) 2023-03-28
CN115857525B CN115857525B (zh) 2023-09-29

Family

ID=85667649

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211510054.3A Active CN115857525B (zh) 2022-11-29 2022-11-29 一种无人直升机时变增益自抗扰优化控制方法

Country Status (1)

Country Link
CN (1) CN115857525B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106020222A (zh) * 2016-06-24 2016-10-12 天津理工大学 一种三自由度直升机姿态的自抗扰控制方法
CN113156995A (zh) * 2021-04-25 2021-07-23 西安工业大学 一种执行器故障下的无人直升机姿态控制方法
CN113268072A (zh) * 2021-05-26 2021-08-17 北京理工大学 一种基于特征模型的四旋翼无人机抗扰控制方法
CN114879713A (zh) * 2022-05-26 2022-08-09 南京航空航天大学 基于干扰观测器的小型无人直升机离散时间轨迹跟踪控制方法
CN115185185A (zh) * 2022-07-27 2022-10-14 湖北工业大学 四旋翼飞行器自适应滑模控制系统的建立方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106020222A (zh) * 2016-06-24 2016-10-12 天津理工大学 一种三自由度直升机姿态的自抗扰控制方法
CN113156995A (zh) * 2021-04-25 2021-07-23 西安工业大学 一种执行器故障下的无人直升机姿态控制方法
CN113268072A (zh) * 2021-05-26 2021-08-17 北京理工大学 一种基于特征模型的四旋翼无人机抗扰控制方法
CN114879713A (zh) * 2022-05-26 2022-08-09 南京航空航天大学 基于干扰观测器的小型无人直升机离散时间轨迹跟踪控制方法
CN115185185A (zh) * 2022-07-27 2022-10-14 湖北工业大学 四旋翼飞行器自适应滑模控制系统的建立方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KUN YAN等: "Fault identification and fault-tolerant control for unmanned autonomous helicopter with global neural finite-time convergence", 《ES》, pages 165 - 175 *
侯捷等: "基于径向基函数神经网络与扩张状态观测器的无人直升机控制", 《控制理论与应用》, vol. 38, no. 9, pages 1361 - 1371 *

Also Published As

Publication number Publication date
CN115857525B (zh) 2023-09-29

Similar Documents

Publication Publication Date Title
Zhou et al. A fuzzy adaptive backstepping control based on mass observer for trajectory tracking of a quadrotor UAV
WO2022012155A1 (zh) 一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法
CN109976361B (zh) 面向事件触发的四旋翼无人机姿态控制方法
CN111625019B (zh) 基于强化学习的四旋翼无人机悬挂空运系统轨迹规划方法
Eliker et al. Practical finite time adaptive robust flight control system for quad-copter UAVs
CN109856972B (zh) 一种无人直升机鲁棒容错跟踪控制方法
CN110794857A (zh) 考虑外部风干扰的固定翼无人机鲁棒离散分数阶控制方法
Tan et al. Anti-saturation adaptive fault-tolerant control with fixed-time prescribed performance for UAV under AOA asymmetric constraint
CN115185185A (zh) 四旋翼飞行器自适应滑模控制系统的建立方法
CN107817818B (zh) 一种模型不确定飞艇航迹跟踪有限时间控制方法
CN113687597B (zh) 一种基于二阶波浪漂移力的无人船路径跟踪方法
CN115129072A (zh) 固定翼无人机位置跟踪偏差约束下终端滑模控制方法
CN113759722A (zh) 一种无人机自抗扰控制器参数优化方法
CN117452975A (zh) 一种四旋翼无人机集群的保性能协同编队控制设计方法
Chen et al. Robust trajectory tracking control of underactuated underwater vehicle subject to uncertainties
CN114003052B (zh) 一种基于动态补偿系统的固定翼无人机纵向运动鲁棒自适应控制方法
CN115857525A (zh) 一种无人直升机时变增益自抗扰优化控制方法
CN115981149A (zh) 基于安全强化学习的高超声速飞行器最优控制方法
Roy et al. Robust control for longitudinal and lateral dynamics of small scale helicopter
Ye et al. Event-based adaptive fuzzy asymptotic tracking control of quadrotor unmanned aerial vehicle with obstacle avoidance
Shen et al. Nonlinear observer-based adaptive output feedback tracking control of underactuated ships with input saturation
CN114779797A (zh) 一种无人直升机故障估计方法和跟踪容错方法
CN114840980A (zh) 一种多无人直升机协作搬运绳索拉力估计方法
CN114859704A (zh) 一种针对四旋翼无人机姿态的强化学习优化控制方法
CN113934143B (zh) 多旋翼飞行器有限时间自适应事件触发容错跟踪控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant