CN115857525A - 一种无人直升机时变增益自抗扰优化控制方法 - Google Patents
一种无人直升机时变增益自抗扰优化控制方法 Download PDFInfo
- Publication number
- CN115857525A CN115857525A CN202211510054.3A CN202211510054A CN115857525A CN 115857525 A CN115857525 A CN 115857525A CN 202211510054 A CN202211510054 A CN 202211510054A CN 115857525 A CN115857525 A CN 115857525A
- Authority
- CN
- China
- Prior art keywords
- unmanned helicopter
- designed
- time
- optimal
- varying gain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Feedback Control In General (AREA)
Abstract
本发明属于飞行器鲁棒优化控制技术领域,公开了一种无人直升机时变增益自抗扰优化控制方法。该方法包括以下步骤:1.针对无人直升机高度姿态复合系统中存在的干扰,设计时变增益扩张状态观测器对未知干扰进行估计;2.将无人直升机跟踪优化控制问题等效转换为优化镇定问题;3.结合自适应动态规划方法和神经网络技术设计最优飞行控制器,以保证无人直升机的性能满足预设的能量指标函数。本发明所提出的方法,不仅对传统固定增益扩张状态观测器性能进行了显著改进,而且能够保证无人直升机在能耗最小的情况下顺利完成飞行任务。
Description
技术领域
本发明属于飞行器鲁棒优化控制技术领域,具体是一种无人直升机时变增益自抗扰优化控制方法。
背景技术
无人直升机具有隐蔽性好、慢速飞行、垂直上升下降等明显优势,因此被广泛应用于救灾搜寻、侦察监视、探查航拍等领域,在军事和民用方面都有着非常重要的实用价值。在军事方面,无人直升机可以进行对地攻击、中继通信、火力支援、敌情监测等;在民用商用中,无人直升机可以代替人力进行高难度危险的电力巡航,对受损或老化的设备进行替换;还可以清理高压电线上的漂浮物质、对海洋中的溺水者和船舶进行搜索并投入救生器材、新闻和影视航拍、快件运输等。因此对无人直升机进行研究具有深远的学术价值和现实意义。
无人直升机在飞行过程中不可避免地会受到外部干扰的影响。目前,已有相当量的文献对无人直升机展开了抗扰控制研究,其中最为常见的自抗扰控制技术。但是,传统的自抗扰技术是基于固定增益扩张状态观测器设计的,这导致观测器参数无法随着干扰的变化而变化。此外,固定增益扩张状态观测器还存在初始时刻增益过大导致系统计算量爆炸的问题。随着航天航天、自动化和人工智能等技术的飞速发展,现今人们已不满足于无人直升机单纯的完成任务,而是期望它能以某种最优的性能指标实现要求,如油耗最小、时间最短、速度最快等。因此,对传统固定增益自抗扰技术进行改进并设计无人直升机的最优控制器是现实的迫切需求。
发明内容
本发明的目的是提供一种无人直升机时变增益自抗扰优化控制方法,保证无人直升机在具有良好鲁棒性能的同时,能够以能耗最小的方式完成跟踪任务。
为实现上述目的,本发明的技术方案具体分为以下步骤:
1)首先,针对无人直升机高度姿态复合系统中存在的干扰,设计时变增益扩张状态观测器来对未知干扰进行实时估计;
2)其次,通过等效变换将无人直升机跟踪优化控制问题转换为优化镇定问题处理:
3)最后,基于自适应动态规划方法和单评价神经网络技术设计最优飞行控制器,所述最优飞行控制器包括最优虚拟反馈控制器和最优反馈控制器。
进一步的,上述步骤(1)所述的无人直升机高度姿态复合动力学模型为:
其中,Po=[ρ,σT]T表示高度和姿态混合向量,ρ和σ=[φ,θ,ψ]T分别表示无人直升机的垂直高度和姿态角向量,Σ=diag{1,Γ(σ)}和Γ(σ)∈R3×3是姿态运动学矩阵,Qo=[h,ΩT]T表示速度和角速度混合向量,h和Ω=[p,q,r]T分别是垂直速度和姿态角速度向量,g是重力加速度,J0=diag{J0x,J0y,J0z}为惯性矩阵,m表示总质量,/>是待设计的控制输入,Fu和Tu∈R3分别是作用在无人直升机上的力和力矩,D∈R4是未知干扰,y0是系统输出。
进一步的,上述步骤(1)中,时变增益扩张状态观测器设计如下:
其中和/>分别表示P0,Q0和RD的估计值,/>表示P0的估计误差,k1=diag{k11,k12,k13,k14},k2=diag{k21,k22,k23,k24},k3=diag{k31,k32,k33,k34},kij(i=1,2,3,j=1,2,3,4)是设计的正常数,μ(t)是时变增益,其形式为:
其中μ0和a为正常数。
进一步的,上述步骤(2)中,等效变换方法的具体步骤如下:选择候选Lyapunov函数如下所示
对Vo进行求导可得
从上式可以看出,如果设计的最优反馈控制器Uo能够使如下动态系统稳定
则可以确保(38)右侧第一项的稳定性;同时如果(NNM-Eλ)>0成立,整个闭环系统最终一致有界。
进一步的,上述步骤(3)中,提出虚拟控制律为:
其中Qdfo是设计的前馈虚拟控制器,Qdbo是设计的最优虚拟反馈控制器;
前馈虚拟控制器Qdfo设计为
实际控制律uu设计为
其中uun是设计的前馈控制器,uuo是设计的最优反馈控制器;
前馈控制器uun设计为
代价函数选取为:
针对代价函数(40)定义HJB方程为
最优代价函数J*(ξ)的估计为
最优控制器和HJB方程设计为
其中γe是残余误差。
与现有技术相比,本发明带来的有益效果是:
(1)本发明所提出的时变增益自抗扰技术,解决了传统固定增益自抗扰技术存在的初始时刻计算量爆炸和观测器增益无法随时间变化的问题,提高了系统的瞬态性能;为了处理无人直升机高度姿态复合模型中的时变干扰,本发明采用时变参数设计了新型扩张状态观测器,并全面证明了任意时刻下系统均稳定,时变参数扩张状态观测器的性能优于固定不变参数的扩张状态观测器;
(2)本发明利用自适应动态规划技术和神经网络技术所设计的最优控制器,包含了最优虚拟反馈控制器和最优反馈控制器,解决了传统飞行控制设计中单纯完成跟踪任务的问题,而是能够保证无人直升机以能耗最小的代价完成飞行任务,大大提高了飞行性能;
(3)本发明所提出的设计方案,能同时兼顾无人直升机的抗扰能力和性能最优指标,更加符合实际任务背景。
附图说明
图1为本发明的系统控制流程图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图和实施例对本发明作进一步地详细描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明公开了一种无人直升机时变增益自抗扰优化控制方法。设计了新型时变增益自抗扰观测器,保证了无人直升机的瞬态性能;并将系统的最优跟踪控制问题等效转换为优化镇定问题,借助于自适应动态规划技术和神经网络技术,设计了最优控制器以实现能耗最小。
参见图1,在建立无人直升机高度姿态复合模型后,首先传感器会将采集到的系统输出信号送到时变增益扩张状态观测器和神经网络中;而后,采用自适应动态规划技术和神经网络的输出,设计虚拟最优反馈控制器;信号经处理后,与虚拟前馈控制器的输出联合设计虚拟控制律;同样地,采用自适应动态规划技术和神经网络的输出,设计最优反馈控制器;信号经处理后,与虚拟控制律、前馈控制器的输出联合设计实际控制律;最终,将该控制律用于解决无人直升机的最优跟踪控制问题。
实施例,一种无人直升机时变增益自抗扰优化控制方法,包括以下的具体步骤:
步骤(1):针对无人直升机高度姿态复合系统中存在的干扰,设计时变增益扩张状态观测器来对未知外部干扰进行实时估计
步骤1.1建立受扰的无人直升机姿态高度混合模型
考虑到垂直起降的典型运动模态,受到干扰影响的无人直升机高度姿态组合非线性动力学模型可以表示为:
其中Po=[ρ,σT]T表示高度和姿态混合向量,ρ和σ=[φ,θ,ψ]T分别表示无人直升机的垂直高度和姿态角向量,Σ=diag{1,Γ(σ)}和Γ(σ)∈R3×3是姿态运动学矩阵,Qo=[h,ΩT]T表示速度和角速度混合向量,h和Ω=[p,q,r]T分别是垂直速度和姿态角速度向量,J0=diag{J0x,J0y,J0z}为惯性矩阵,g是重力加速度,m表示无人直升机的总质量,/>表示待设计的控制输入向量,Fu和Tu∈R3分别是作用在无人直升机系统上的力和力矩,D∈R4是总的未知干扰,y0是系统输出。
本发明的控制目标是设计自适应最优控制器,使得系统输出yo围绕在期望信号Pdo的附近,同时保证飞行过程能耗最小。为此下面列出一些必要的假设和引理:
假设2:由于无人直升机的特殊旋翼结构,假设其姿态角在合理范围内变化。此外参考轨迹Pdo及其导数是有界的。
引理1:采用神经网络逼近任何未知的光滑函数M(ε),其形式为:
其中ε∈Rl是神经网络输入向量,是M(ε)的估计;/>表示最优权重矩阵且满足/> 是选定合适的基函数向量且满足KT(ε)K(ε)≤Km;/>和Km为正常数。因此,未知的光滑函数M(ε)可以进一步描述为:
步骤1.2设计时变增益扩张状态观测器
首先将外部干扰D扩展为一个新的状态RD,则受干扰无人直升机的非线性动力学(1)可以进一步描述为
基于上述描述,新型时变增益扩张状态观测器构造如下:
其中和/>分别是P0,Q0和RD的估计值,/>是P0的估计误差。k1=diag{k11,k12,k13,k14},k2=diag{k21,k22,k23,k24},k3=diag{k31,k32,k33,k34},kij(i=1,2,3,j=1,2,3,4)是设计的正常数,μ(t)是时变增益,其形式为:
其中μ0和a为正常数。
为了便于分析,引入新的辅助变量βi(i=1,2,3),由下式给出
结合(7)-(10)并取βi(i=1,2,3)对时间求导可得
其中*表示零矩阵,R4×4,I4×4表示单位矩阵,Bk=μ0(∑-I4×4),
选择适当的参数kij以确保Ac是Hurwitz矩阵。也即存在正定矩阵Mc,使得
其中Nc是正定矩阵。
选择Lyapunov函数为
代入(15)并求Vβ的导数得
其中||McB1||≤C1,||McB2||≤C2,C1和C2为正常数,NN1=λmin(μ0Nc-2C1II-II),II∈R12×12是单位矩阵。
类似地,结合β的定义,可以给出
现在,我们选择相同的候选Lyapunov函数(17),它的时间导数变为
其中||McB3||≤C3,C3>0。
将(24)代入(23)可得
其中NN2=λmin(Nc-2C3II-II)。
综合结论(18)和(25),得
其中NNM=max{NN1,NN2}。
步骤(2).通过等效变换方法将无人直升机跟踪优化控制问题转换为优化镇定问题
考虑到(1),我们将跟踪误差定义为
其中Pdo是期望的轨迹信号,Qdo是设计的虚拟控制器。
对e1的时间求导
与传统的反步法相比,本发明提出的虚拟控制律如下
其中Qdfo是设计的前馈虚拟控制律,Qdbo是待设计最优虚拟反馈控制器。显然,如果我们让Qdbo=0,方程(30)将退化为标准的反步法控制结构。
首先,将前馈虚拟控制器Qdfo设计为
将(30)和(31)代入(29)得到
对e2的时间求导
然后,实际控制输入uu表示为
其中uun是设计的前馈控制器,uuo是设计的最优反馈控制器。
前馈控制器uun设计为
利用(34)和(35),方程(33)可以改写为
选择候选Lyapunov函数,如下所示:
考虑(26)、(32)和(36)并对Vo进行微分
从(38)可以看出,如果设计的最优反馈控制器Uo可以使以下的动态系统稳定
则可以确保(38)右侧第一项的稳定性。同时如果(NNM-Eλ)>0成立,我们可以得出整个闭环系统最终一致有界的结论。这样原始的最优跟踪控制问题被转化为系统(39)的最优稳定问题。也即,通过这种等效变换方法将无人直升机的最优跟踪控制问题转换为系统镇定问题来处理。
步骤(3).基于自适应动态规划方法和单评价神经网络技术设计的最优飞行控制器,包括虚拟前馈控制器和最优反馈控制器的设计,以保证无人直升机的性能满足预设的能量指标函数。
结合动态系统(39),选取代价函数:
定义1:考虑具有代价函数(40)的非线性误差系统(39)。如果控制律Uo能够同时保证误差系统(39)稳定和代价函数(40)的有界性,则Uo被称为(39)中的容许控制输入。同时所有的可容许的控制输入构成了一个可容许的集合描述为/>
针对代价函数(40),定义哈密尔顿方程为
由于HJB方程(43)是一个复杂的非线性偏微分方程,很难获得解析解。因此将神经网络技术与ADP方法相结合来克服这一困难。此外,给出如下假设:
基于引理1,采用NN技术来近似最优代价函数J*(ξ),可以描述为
对(46)求关于ξ的偏导数
假设4:假设理想权值向量Sa,激励函数ha(ξ)和近似误差在紧集Λj上是范数有界的。同时假设ha(ξ)和/>的偏导数是范数有界的。也即存在正常数Sam1,ham1,/>ham2和/>使得||Sa||≤Sam1,||ha(ξ)||≤ham1,/>和成立。
调用(47),最优控制器(42)和相应的HJB方程(43)可以进一步改写为
考虑到以下实际情况:
进而HJB方程(49)变为
由于理想权值矩阵Sa未知,因此采用NN的方法来估计最优代价函数J*(ξ):
考虑(52),最优控制器(48)和HJB方程(51)的近似值可以表示为
其中γe是残余误差。
考虑(51)和(54),我们得到
将(58)代入(57)得
这里可以选择合适的参数χ1和χ2,使得Ma是正定矩阵。同时基于上述分析,可以得出Ma和Na的范数都是有界的。然后我们得到
下面对上述实施例的稳定性进行验证
上述控制器设计过程可以归纳为如下定理1的形式:
定理1:考虑包含扰动的无人直升机非线性动力学(1)满足假设1-3,设计时变增益扩张状态观测器为(5),神经网络的权重更新律设计为(56)。采用包含前馈控制器(35)和最优反馈控制器(53)的控制输入(34),闭环系统的所有误差信号最终都是一致有界的,并且代价函数(40)最小。
证明:选取Lyapunov函数为
调用(38)和(61),并取Vγ的时间导数,我们得到
结合(48)和(53)得到
考虑假设3-4并将(64)代入(63),得到
以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。任何熟悉该技术的人在本发明所揭露的技术范围内的局部修改或替换,都应涵盖在本发明的包含范围之内。
Claims (6)
1.一种无人直升机时变增益自抗扰优化控制方法,其特征在于:
(1)针对无人直升机高度姿态复合系统中存在的干扰,设计时变增益扩张状态观测器来对未知外部干扰进行实时估计;
(2)通过等效变换方法将无人直升机跟踪优化控制问题转换为优化镇定问题处理:
(3)基于自适应动态规划方法和单评价神经网络技术设计最优飞行控制器,所述最优飞行控制器包括最优虚拟反馈控制器和最优反馈控制器。
2.根据权利要求1所述的一种时变增益自抗扰优化控制方法,其特征在于,步骤(1)所述的无人直升机高度姿态复合动力学模型为:
5.根据权利要求4所述的一种无人直升机时变增益自抗扰优化控制方法,其特征在于,所述步骤(3)中,提出虚拟控制律为:
Qdo=Qdfo+Qdbo (30)
其中Qdfo是设计的前馈虚拟控制器,Qdbo是设计的最优虚拟反馈控制器;
前馈虚拟控制器Qdfo设计为:
实际控制律uu设计为:
uu=uun+uuo (34)
其中uun是设计的前馈控制器,uuo是设计的最优反馈控制器;
前馈控制器uun设计为:
代价函数选取为:
针对代价函数(40)定义HJB方程为:
最优代价函数J*(ξ)的估计为:
最优控制器和HJB方程设计为
其中γe是残余误差。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211510054.3A CN115857525B (zh) | 2022-11-29 | 2022-11-29 | 一种无人直升机时变增益自抗扰优化控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211510054.3A CN115857525B (zh) | 2022-11-29 | 2022-11-29 | 一种无人直升机时变增益自抗扰优化控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115857525A true CN115857525A (zh) | 2023-03-28 |
CN115857525B CN115857525B (zh) | 2023-09-29 |
Family
ID=85667649
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211510054.3A Active CN115857525B (zh) | 2022-11-29 | 2022-11-29 | 一种无人直升机时变增益自抗扰优化控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115857525B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106020222A (zh) * | 2016-06-24 | 2016-10-12 | 天津理工大学 | 一种三自由度直升机姿态的自抗扰控制方法 |
CN113156995A (zh) * | 2021-04-25 | 2021-07-23 | 西安工业大学 | 一种执行器故障下的无人直升机姿态控制方法 |
CN113268072A (zh) * | 2021-05-26 | 2021-08-17 | 北京理工大学 | 一种基于特征模型的四旋翼无人机抗扰控制方法 |
CN114879713A (zh) * | 2022-05-26 | 2022-08-09 | 南京航空航天大学 | 基于干扰观测器的小型无人直升机离散时间轨迹跟踪控制方法 |
CN115185185A (zh) * | 2022-07-27 | 2022-10-14 | 湖北工业大学 | 四旋翼飞行器自适应滑模控制系统的建立方法 |
-
2022
- 2022-11-29 CN CN202211510054.3A patent/CN115857525B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106020222A (zh) * | 2016-06-24 | 2016-10-12 | 天津理工大学 | 一种三自由度直升机姿态的自抗扰控制方法 |
CN113156995A (zh) * | 2021-04-25 | 2021-07-23 | 西安工业大学 | 一种执行器故障下的无人直升机姿态控制方法 |
CN113268072A (zh) * | 2021-05-26 | 2021-08-17 | 北京理工大学 | 一种基于特征模型的四旋翼无人机抗扰控制方法 |
CN114879713A (zh) * | 2022-05-26 | 2022-08-09 | 南京航空航天大学 | 基于干扰观测器的小型无人直升机离散时间轨迹跟踪控制方法 |
CN115185185A (zh) * | 2022-07-27 | 2022-10-14 | 湖北工业大学 | 四旋翼飞行器自适应滑模控制系统的建立方法 |
Non-Patent Citations (2)
Title |
---|
KUN YAN等: "Fault identification and fault-tolerant control for unmanned autonomous helicopter with global neural finite-time convergence", 《ES》, pages 165 - 175 * |
侯捷等: "基于径向基函数神经网络与扩张状态观测器的无人直升机控制", 《控制理论与应用》, vol. 38, no. 9, pages 1361 - 1371 * |
Also Published As
Publication number | Publication date |
---|---|
CN115857525B (zh) | 2023-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhou et al. | A fuzzy adaptive backstepping control based on mass observer for trajectory tracking of a quadrotor UAV | |
WO2022012155A1 (zh) | 一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法 | |
CN109976361B (zh) | 面向事件触发的四旋翼无人机姿态控制方法 | |
CN111625019B (zh) | 基于强化学习的四旋翼无人机悬挂空运系统轨迹规划方法 | |
Eliker et al. | Practical finite time adaptive robust flight control system for quad-copter UAVs | |
CN109856972B (zh) | 一种无人直升机鲁棒容错跟踪控制方法 | |
CN110794857A (zh) | 考虑外部风干扰的固定翼无人机鲁棒离散分数阶控制方法 | |
Tan et al. | Anti-saturation adaptive fault-tolerant control with fixed-time prescribed performance for UAV under AOA asymmetric constraint | |
CN115185185A (zh) | 四旋翼飞行器自适应滑模控制系统的建立方法 | |
CN107817818B (zh) | 一种模型不确定飞艇航迹跟踪有限时间控制方法 | |
CN113687597B (zh) | 一种基于二阶波浪漂移力的无人船路径跟踪方法 | |
CN115129072A (zh) | 固定翼无人机位置跟踪偏差约束下终端滑模控制方法 | |
CN113759722A (zh) | 一种无人机自抗扰控制器参数优化方法 | |
CN117452975A (zh) | 一种四旋翼无人机集群的保性能协同编队控制设计方法 | |
Chen et al. | Robust trajectory tracking control of underactuated underwater vehicle subject to uncertainties | |
CN114003052B (zh) | 一种基于动态补偿系统的固定翼无人机纵向运动鲁棒自适应控制方法 | |
CN115857525A (zh) | 一种无人直升机时变增益自抗扰优化控制方法 | |
CN115981149A (zh) | 基于安全强化学习的高超声速飞行器最优控制方法 | |
Roy et al. | Robust control for longitudinal and lateral dynamics of small scale helicopter | |
Ye et al. | Event-based adaptive fuzzy asymptotic tracking control of quadrotor unmanned aerial vehicle with obstacle avoidance | |
Shen et al. | Nonlinear observer-based adaptive output feedback tracking control of underactuated ships with input saturation | |
CN114779797A (zh) | 一种无人直升机故障估计方法和跟踪容错方法 | |
CN114840980A (zh) | 一种多无人直升机协作搬运绳索拉力估计方法 | |
CN114859704A (zh) | 一种针对四旋翼无人机姿态的强化学习优化控制方法 | |
CN113934143B (zh) | 多旋翼飞行器有限时间自适应事件触发容错跟踪控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |