CN109696830A - 小型无人直升机的强化学习自适应控制方法 - Google Patents
小型无人直升机的强化学习自适应控制方法 Download PDFInfo
- Publication number
- CN109696830A CN109696830A CN201910098125.5A CN201910098125A CN109696830A CN 109696830 A CN109696830 A CN 109696830A CN 201910098125 A CN201910098125 A CN 201910098125A CN 109696830 A CN109696830 A CN 109696830A
- Authority
- CN
- China
- Prior art keywords
- control
- coordinate system
- attitude
- small
- unmanned helicopter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 230000002787 reinforcement Effects 0.000 title claims abstract description 16
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 11
- 238000013461 design Methods 0.000 claims abstract description 17
- 239000013598 vector Substances 0.000 claims description 28
- 230000006870 function Effects 0.000 claims description 27
- 239000011159 matrix material Substances 0.000 claims description 24
- 238000011156 evaluation Methods 0.000 claims description 11
- 125000004122 cyclic group Chemical group 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 8
- 230000009466 transformation Effects 0.000 claims description 7
- 230000009471 action Effects 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 claims description 4
- 238000003491 array Methods 0.000 claims description 4
- 230000005484 gravity Effects 0.000 claims description 4
- 238000002474 experimental method Methods 0.000 description 10
- 238000011160 research Methods 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
Abstract
本发明涉及小型无人直升机的非线性控制,为提出一种基于强化学习的自适应控制方法,实现在小型直升机具有系统参数不确定性和外界扰动的情况下,仍能保持飞行姿态稳定。为此,本发明采用的技术方案是,小型无人直升机的强化学习自适应控制方法,以强化学习自适应控制算法为基础,结合评价网执行网体系结构,用于小型无直升人机的姿态系统控制中,包括以下步骤:步骤1)确定小型无人直升机的坐标系定义;步骤2)确定小型无人直升机姿态动力学模型;步骤3)定义姿态角跟踪误差并整理动力学误差模型;步骤4)控制律设计。本发明主要应用于小型无人直升机的非线性控制场合。
Description
技术领域
本发明涉及一种小型无人直升机的非线性控制方法,特别是涉及一种基于强化学习的小型无人直升机自适应控制方法。具体讲,涉及小型无人直升机的强化学习自适应控制方法。
背景技术
无人机(Unmanned Aerial Vehicle,简称UAV),是装配了必要的数据处理单元、传感器、自动控制器以及通信设备的飞行器系统,能够在远距离遥控下或者自主控制下执行预先设定的飞行任务。无人直升机能够做到:1)可垂直起降、可定点悬停、可在空中原地转弯;2)能够近地机动飞行;3)起飞和降落无需专用的跑道;4)若直升机在空中发生故障,可以利用自身旋翼特性自转下滑,最终安全降落。其在民用领域和军事上均发挥着重要的价值,受到各国的普遍重视(图书:国防工业出版社;著者:贺天鹏,张俊,曾国奇,等;出版年月:2016;文章题目:无人直升机系统设计;页码:1-21)。然而,由于无人直升机是欠驱动且具有显著动态耦合的高度非线性系统,在控制器设计和实施过程中需要对这些动态耦合加以考虑和解决,因此其控制器的设计非常具有挑战性。
目前,针对小型无人直升机系统的控制方法主要包括线性控制、非线性控制和智能控制等多种设计方法。线性控制方法是目前常用的无人机控制方法,刘昊等人基于简化的无人直升机线性模型设计了LQR(linear quadratic regulator,线性二次调节器)控制器。该方法通过数值仿真验证了控制器的有效性,但这种线性控制方法是基于在无人直升机工作点附近的近似线性化进行分析设计的,只能在平衡点附近使系统实现稳定,因而不可避免地限制了控制器的应用范围(期刊:IEEE Transactions on IndustrialElectronics;著者:Liu H,Lu G,Zhong Y;出版年月:2013;文章题目:Robust LQRAttitude Control of a 3-DOF Laboratory Helicopter for Aggressive Maneuvers;页码:4627-4636)。
为克服线性控制方法的上述不足,许多学者采用非线性控制方法实现无人直升机的大范围控制。Raptis I A等人将无人机动态模型划分为两个子系统,内环为姿态控制系统,外环为位置控制系统,采用反步法设计了跟踪控制器,通过数值仿真验证了无人机的镇定、跟踪和高难度飞行实验(期刊:IEEE Transactions on Control Systems Technology;著者:Raptis I A,Valavanis K P,Moreno W A;出版年月:2011;文章题目:A NovelNonlinear Backstepping Controller Design for Helicopters Using the RotationMatrix;页码:465-473)。针对系统存在参数不确定性,蒙志君等人设计了一种基于扩张状态观测器的自抗扰反步控制器,通过引入扩张状态观测器来实时观测由模型不确定性和外界扰动组成的全部未知扰动,同时与反步法相结合,使无人直升机在存在外界扰动下均能对控制指令实现快速和准确的反应(期刊:控制理论与应用;著者:陈旭智,蒙志君,赵文龙,等;出版年月:2015;文章标题:适应扰动的无人直升机姿态跟踪控制;页码:1534-1539)。
近年来智能控制方法也在无人直升机控制上得到了较多的应用,Nodland D等人利用自适应神经网络对无人机模型不确定部分进行估计,只需要较少的模型信息,就能够实现无人机的轨迹跟踪控制(期刊:IEEE Transactions on Neural Networks andLearing Systems;著者:Nodland D,Zargarzadeh H;出版年月:2013;文章题目:NeuralNetwork-based Optimal Adaptive Output Feedback Control of a Helicopter UAV;页码:1061-1073)。Abbeel P等人使用强化学习方法对无人机进行控制,利用强化学习算法对直升机飞行的实验数据进行学习训练,最终实现无人直升机的自主飞行和特技飞行(期刊:The International Journal of Robotics Research;著者:Abbeel P,Coates A,Ng A Y;出版年月:2010;文章题目:Autonomous Helicopter Aerobatics throughApprenticeship Learning;页码:1608-1639)。
发明内容
为克服现有技术的不足,本发明旨在提出一种基于强化学习的自适应控制方法,实现在小型直升机具有系统参数不确定性和外界扰动的情况下,仍能保持飞行姿态稳定。为此,本发明采用的技术方案是,小型无人直升机的强化学习自适应控制方法,以强化学习自适应控制算法为基础,结合评价网执行网体系结构,用于小型无直升人机的姿态系统控制中,包括以下步骤:
步骤1)确定小型无人直升机的坐标系定义;
小型无人直升机坐标系定义主要涉及两个坐标系,惯性坐标系{I}={OI,xI,yI,zI}和机体坐标系{B}={OB,xB,yB,zB},其中Oi(i=I,B)表示坐标系原点,xi,yi,zi(i=I,B)分别对应坐标系三个主轴方向的单位矢量,各坐标系的定义均遵循右手定则,同时定义直升机姿态角在坐标系{I}下表示为η=[φ,θ,ψ]T,φ,θ,ψ分别对应滚转角、俯仰角和偏航角,目标轨迹姿态角在坐标系{I}下表示为ηd=[φd,θd,ψd]T,φd,θd,ψd分别对应目标旋转角、目标俯仰角和目标偏航角;
步骤2)确定小型无人直升机姿态动力学模型;
通过分析小型无人直升机作用原理,用拉格朗日方程来描述其姿态动力学模型为:
其中M(η)代表惯性矩阵,C(η,η)代表科氏力矩阵,G(η)为重力力矩向量,d代表未知扰动向量,S代表角速度变换矩阵,A,B代表旋翼动力学相关矩阵,D代表旋翼挥舞角动力学相关矩阵,δ(t)=[δlat(t)δlon(t)δped(t)]T代表控制输入,δlat(t)代表横向周期变距,δlon(t)代表纵向周期变距,δped(t)代表尾桨总距,角速度变换矩阵S表示为:
步骤3)定义姿态角跟踪误差并整理动力学误差模型;
定义系统姿态跟踪误差e1及其滤波误差e2为:
其中λ=[λ1,λ2,λ3]T为正常数阵,引入辅助矩阵Ω=S-TAD,输入转矩量τI=Ωδ(t),定义性能指标函数为:
其中,Q,R为正定矩阵,需要保证系统的性能指标函数最优,定义哈密尔顿函数为如下形式:
引入评价网来近似性能指标函数J(e1):
其中,为权重向量,为径向基函数,设计权重更新律为:
其中,a1为评价网络的自适应增益,为辅助变量。
对e2求一阶时间导数,并将式(1)代入整理,得到滤波误差的开环动态方程为:
其中,辅助函数定义为:
步骤4)控制律设计;
引入执行网络来逼近系统不确定函数N(x),表示为:
其中,为权重向量,为径向基函数,设计权重更新律为:
其中,a2为执行网络的自适应增益;
根据以上分析,设计设计控制输入δ(t)为:
其中kr,Γ,kv,β均为正常数阵,sgn(·)为标准符号函数;
以上述控制律进行小型无人直升机的姿态控制。
本发明的特点及有益效果是:
1.本发明采用基于强化学习的系统不确定性补偿方法,减少了无人直升机未建模动态和模型不确定参数对系统控制性能的影响;
2.本发明易于实现,可满足大部分飞行情况的需求。
3.本发明使用了滑模鲁棒项,缩短了算法学习时间,同时提高了控制律对外界扰动的鲁棒性。
附图说明:
图1是本发明控制系统结构图;
图2是本发明所采用的实验平台;
图3是姿态跟踪实验时无人直升机的姿态角曲线图;
图4是姿态跟踪实验时无人直升机的控制输入曲线图;
图5是姿态跟踪实验时无人直升机的偏航角及跟踪误差曲线图;
图6是姿态跟踪实验时无人直升机的评价网权值范数曲线图;
图7是姿态跟踪实验时无人直升机的执行网权值范数曲线图。
具体实施方式
本发明采用的技术方案是,以强化学习自适应控制算法为基础,结合评价网执行网体系结构,用于小型无直升人机的姿态系统控制中,包括以下步骤:
步骤1)确定小型无人直升机的坐标系定义;
小型无人直升机坐标系定义主要涉及两个坐标系,惯性坐标系{I}={OI,xI,yI,zI}和机体坐标系{B}={OB,xB,yB,zB},其中Oi(i=I,B)表示坐标系原点,xi,yi,zi(i=I,B)分别对应坐标系三个主轴方向的单位矢量,各坐标系的定义均遵循右手定则,同时定义直升机姿态角在坐标系{I}下表示为η=[φ,θ,ψ]T,φ,θ,ψ分别对应滚转角、俯仰角和偏航角,目标轨迹姿态角在坐标系{I}下表示为ηd=[φd,θd,ψd]T,φd,θd,ψd分别对应目标旋转角、目标俯仰角和目标偏航角;
步骤2)确定小型无人直升机姿态动力学模型;
通过分析小型无人直升机作用原理,用拉格朗日方程来描述其姿态动力学模型为:
其中M(η)代表惯性矩阵,代表科氏力矩阵,G(η)为重力力矩向量,d代表未知扰动向量,S代表角速度变换矩阵,A,B代表旋翼动力学相关矩阵,D代表旋翼挥舞角动力学相关矩阵,δ(t)=[δlat(t)δlon(t)δped(t)]T代表控制输入,δlat(t)代表横向周期变距,δlon(t)代表纵向周期变距,δped(t)代表尾桨总距,角速度变换矩阵S表示为:
步骤3)定义姿态角跟踪误差并整理动力学误差模型;
定义系统姿态跟踪误差e1及其滤波误差e2为:
其中λ=[λ1,λ2,λ3]T为正常数阵,引入辅助矩阵Ω=S-TAD,输入转矩量τI=Ωδ(t),定义性能指标函数为:
其中,Q,R为正定矩阵,需要保证系统的性能指标函数最优,定义哈密尔顿函数为如下形式:
引入评价网来近似性能指标函数J(e1):
其中,为权重向量,为径向基函数,设计权重更新律为:
其中,a1为评价网络的自适应增益,为辅助变量。
对e2求一阶时间导数,并将式(1)代入整理,得到滤波误差的开环动态方程为:
其中,辅助函数定义为:
步骤4)控制律设计;
引入执行网络来逼近系统不确定函数N(x),表示为:
其中,为权重向量,为径向基函数,设计权重更新律为:
其中,a2为执行网络的自适应增益。
根据以上分析,设计设计控制输入δ(t)为:
其中kr,Γ,kv,β均为正常数阵,sgn(·)为标准符号函数;
以上述控制律进行小型无人直升机的姿态控制。
下面结合实施例和附图对本发明做出详细说明。
本发明旨在提供一种基于强化学习的自适应控制方法,实现在小型直升机具有系统参数不确定性和外界扰动的情况下,仍能保持飞行姿态稳定。
本发明的小型无人直升机强化学习自适应控制采用的技术方案是,以强化学习自适应控制算法为基础,结合评价网执行网体系结构,用于小型无直升人机的姿态系统控制中,包括以下步骤:
步骤1)确定小型无人直升机的坐标系定义;
小型无人直升机坐标系定义主要涉及两个坐标系,惯性坐标系{I}={OI,xI,yI,zI}和机体坐标系{B}={OB,xB,yB,zB},其中Oi(i=I,B)表示坐标系原点,xi,yi,zi(i=I,B)分别对应坐标系三个主轴方向的单位矢量,各坐标系的定义均遵循右手定则,同时定义直升机姿态角在坐标系{I}下表示为η=[φ,θ,ψ]T,φ,θ,ψ分别对应滚转角、俯仰角和偏航角,目标轨迹姿态角在坐标系{I}下表示为ηd=[φd,θd,ψd]T,φd,θd,ψd分别对应目标旋转角、目标俯仰角和目标偏航角;
步骤2)确定小型无人直升机姿态动力学模型;
通过分析小型无人直升机作用原理,用拉格朗日方程来描述其姿态动力学模型为:
其中M(η)代表惯性矩阵,代表科氏力矩阵,G(η)为重力力矩向量,d代表未知扰动向量,S代表角速度变换矩阵,A,B代表旋翼动力学相关矩阵,D代表旋翼挥舞角动力学相关矩阵,δ(t)=[δlat(t)δlon(t)δped(t)]T代表控制输入,δlat(t)代表横向周期变距,δlon(t)代表纵向周期变距,δped(t)代表尾桨总距,角速度变换矩阵S表示为:
步骤3)定义姿态角跟踪误差并整理动力学误差模型;
定义系统姿态跟踪误差e1及其滤波误差e2为:
其中λ=[λ1,λ2,λ3]T为正常数阵,引入辅助矩阵Ω=S-TAD,输入转矩量τI=Ωδ(t),定义性能指标函数为:
其中,Q,R为正定矩阵,需要保证系统的性能指标函数最优,定义哈密尔顿函数为如下形式:
引入评价网来近似性能指标函数J(e1):
其中,为权重向量,为径向基函数,设计权重更新律为:
其中,a1为评价网络的自适应增益,为辅助变量。
对e2求一阶时间导数,并将式(1)代入整理,得到滤波误差的开环动态方程为:
其中,辅助函数定义为:
步骤4)控制律设计;
引入执行网络来逼近系统不确定函数N(x),表示为:
其中,为权重向量,为径向基函数,设计权重更新律为:
其中,a2为执行网络的自适应增益。
根据以上分析,设计设计控制输入δ(t)为:
其中kr,Γ,kv,β均为正常数阵,sgn(·)为标准符号函数;
以上述控制律进行小型无人直升机的姿态控制。
控制结构框图如图1所示。
下面给出具体的实例:
一、半实物仿真平台介绍
为验证本文设计控制律的有效性,使用本研究组设计开发的无人直升机飞行实验平台,进行了实时镇定飞行实验。实验平台如图2所示,该实验平台以基于MATLAB-RTW工具箱的xPC作为实时仿真环境,采用自主设计的以ARM Cortex-M3为内核的惯性导航单元作为传感器,该机载传感器最高更新频率为500Hz,可提供三轴角速度及三轴姿态角信息,其中滚转角和俯仰角测量精度为±0.2°,偏航角的测量精度为±0.5°。
二、姿态跟踪飞行实验
为了验证本发明中控制器的有效性及实用性,利用本研究组自主设计开发的无人直升机姿态飞行实验平台,进行了实时的偏航跟踪飞行实验。设置参考轨迹为:
控制律中各参数确定为:kr=diag{[1.5,1.5,1.2]T},λ=diag{[0.57,0.56,0.54]T},Γ=diag{[0.02,0.002,0.003]T},kv=diag{[2.4,2.2,0.5]T},β=diag{[2.4,2.2,0.5]T}。评价网和执行网参数确定为a1=diag{[0.03,0.04,0.04]T},a2=diag{[0.03,0.04,0.01]T},kl=diag{[0.54,0.56,0.9]T}。
姿态跟踪控制实验情况如图3到图7所示,强化学习自适应控制取得了较好的控制效果。通过图3可知,在偏航跟踪实验中,滚转和俯仰角的控制误差保持在±2°以内,偏航角控制误差保持在±2.2°以内。图4是正则化后的控制输入变化曲线,图6和图7分别为评价网和执行网权重范数收敛曲线,均保持在合理的范围内,验证了本文所设计控制器的合理性。
Claims (1)
1.一种小型无人直升机的强化学习自适应控制方法,其特征是,以强化学习自适应控制算法为基础,结合评价网执行网体系结构,用于小型无直升人机的姿态系统控制中,包括以下步骤:
步骤1)确定小型无人直升机的坐标系定义;
小型无人直升机坐标系定义主要涉及两个坐标系,惯性坐标系{I}={OI,xI,yI,zI}和机体坐标系{B}={OB,xB,yB,zB},其中Oi(i=I,B)表示坐标系原点,xi,yi,zi(i=I,B)分别对应坐标系三个主轴方向的单位矢量,各坐标系的定义均遵循右手定则,同时定义直升机姿态角在坐标系{I}下表示为η=[φ,θ,ψ]T,φ,θ,ψ分别对应滚转角、俯仰角和偏航角,目标轨迹姿态角在坐标系{I}下表示为ηd=[φd,θd,ψd]T,φd,θd,ψd分别对应目标旋转角、目标俯仰角和目标偏航角;
步骤2)确定小型无人直升机姿态动力学模型;
通过分析小型无人直升机作用原理,用拉格朗日方程来描述其姿态动力学模型为:
其中M(η)代表惯性矩阵,代表科氏力矩阵,G(η)为重力力矩向量,d代表未知扰动向量,S代表角速度变换矩阵,A,B代表旋翼动力学相关矩阵,D代表旋翼挥舞角动力学相关矩阵,δ(t)=[δlat(t) δlon(t) δped(t)]T代表控制输入,δlat(t)代表横向周期变距,δlon(t)代表纵向周期变距,δped(t)代表尾桨总距,角速度变换矩阵S表示为:
步骤3)定义姿态角跟踪误差并整理动力学误差模型;
定义系统姿态跟踪误差e1及其滤波误差e2为:
e1=η-ηd
其中λ=[λ1,λ2,λ3]T为正常数阵,引入辅助矩阵Ω=S-TAD,输入转矩量τI=Ωδ(t),定义性能指标函数为:
其中,Q,R为正定矩阵,需要保证系统的性能指标函数最优,定义哈密尔顿函数为如下形式:
引入评价网来近似性能指标函数J(e1):
其中,为权重向量,为径向基函数,设计权重更新律为:
其中,a1为评价网络的自适应增益,为辅助变量。
对e2求一阶时间导数,并将式(1)代入整理,得到滤波误差的开环动态方程为:
其中,辅助函数定义为:
步骤4)控制律设计;
引入执行网络来逼近系统不确定函数N(x),表示为:
其中,为权重向量,为径向基函数,设计权重更新律为:
其中,a2为执行网络的自适应增益;
根据以上分析,设计设计控制输入δ(t)为:
其中kr,Γ,kv,β均为正常数阵,sgn(·)为标准符号函数;
以上述控制律进行小型无人直升机的姿态控制。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910098125.5A CN109696830B (zh) | 2019-01-31 | 2019-01-31 | 小型无人直升机的强化学习自适应控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910098125.5A CN109696830B (zh) | 2019-01-31 | 2019-01-31 | 小型无人直升机的强化学习自适应控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109696830A true CN109696830A (zh) | 2019-04-30 |
CN109696830B CN109696830B (zh) | 2021-12-03 |
Family
ID=66234695
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910098125.5A Expired - Fee Related CN109696830B (zh) | 2019-01-31 | 2019-01-31 | 小型无人直升机的强化学习自适应控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109696830B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110083168A (zh) * | 2019-05-05 | 2019-08-02 | 天津大学 | 基于增强学习的小型无人直升机定高控制方法 |
CN110806756A (zh) * | 2019-09-10 | 2020-02-18 | 西北工业大学 | 基于ddpg的无人机自主引导控制方法 |
CN110908281A (zh) * | 2019-11-29 | 2020-03-24 | 天津大学 | 无人直升机姿态运动有限时间收敛强化学习控制方法 |
CN112363519A (zh) * | 2020-10-20 | 2021-02-12 | 天津大学 | 四旋翼无人机强化学习非线性姿态控制方法 |
CN112650058A (zh) * | 2020-12-23 | 2021-04-13 | 西北工业大学 | 一种基于强化学习的四旋翼无人机轨迹控制方法 |
CN113126502A (zh) * | 2021-04-28 | 2021-07-16 | 天津理工大学 | 一种欠驱动吊车系统的控制方法及控制系统 |
CN113359473A (zh) * | 2021-07-06 | 2021-09-07 | 天津大学 | 基于迭代学习的微小型无人直升机非线性控制方法 |
CN113377121A (zh) * | 2020-07-02 | 2021-09-10 | 北京航空航天大学 | 一种基于深度强化学习的飞行器智能抗扰动控制方法 |
CN113721655A (zh) * | 2021-08-26 | 2021-11-30 | 南京大学 | 一种控制周期自适应的强化学习无人机稳定飞行控制方法 |
CN114084375A (zh) * | 2021-11-19 | 2022-02-25 | 中国直升机设计研究所 | 一种旋翼系统装试验台耦合固有频率计算方法 |
CN114326438A (zh) * | 2021-12-30 | 2022-04-12 | 北京理工大学 | 基于控制障碍函数的安全强化学习四旋翼控制系统及方法 |
CN114859952A (zh) * | 2022-05-07 | 2022-08-05 | 南京航空航天大学 | 一种直升机非线性增量自适应动态优化控制方法 |
Citations (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130185437A1 (en) * | 2011-08-31 | 2013-07-18 | Enernoc, Inc. | Noc-oriented control of a demand coordination network |
US20130325774A1 (en) * | 2012-06-04 | 2013-12-05 | Brain Corporation | Learning stochastic apparatus and methods |
CN103645736A (zh) * | 2013-12-05 | 2014-03-19 | 哈尔滨工程大学 | 基于非线性h∞逆优化输出反馈控制器的船舶航向运动控制方法 |
WO2014047142A1 (en) * | 2012-09-20 | 2014-03-27 | Brain Corporation | Spiking neuron network adaptive control apparatus and methods |
CN104763694A (zh) * | 2015-03-18 | 2015-07-08 | 上海交通大学 | 一种掘进机液压推进系统分区压力设定值优化方法 |
US9082079B1 (en) * | 2012-10-22 | 2015-07-14 | Brain Corporation | Proportional-integral-derivative controller effecting expansion kernels comprising a plurality of spiking neurons associated with a plurality of receptive fields |
CN104932267A (zh) * | 2015-06-04 | 2015-09-23 | 曲阜师范大学 | 一种采用资格迹的神经网络学习控制方法 |
CN104932514A (zh) * | 2015-06-25 | 2015-09-23 | 天津大学 | 小型无人直升机的姿态非线性自适应控制方法 |
CN106227043A (zh) * | 2016-09-09 | 2016-12-14 | 中国科学院自动化研究所 | 自适应最优控制方法 |
CN106595671A (zh) * | 2017-02-22 | 2017-04-26 | 南方科技大学 | 一种基于强化学习的无人机路径规划方法和装置 |
WO2017136613A1 (en) * | 2016-02-04 | 2017-08-10 | Siemens Aktiengesellschaft | Strategic improvisation design for adaptive resilience |
DE202017106132U1 (de) * | 2016-10-10 | 2017-11-13 | Google Llc | Neuronale Netze zum Auswählen von durch einen Roboteragenten auszuführenden Aktionen |
CN107357166A (zh) * | 2017-04-29 | 2017-11-17 | 天津大学 | 小型无人直升机的无模型自适应鲁棒控制方法 |
CN107765553A (zh) * | 2017-11-02 | 2018-03-06 | 天津大学 | 针对旋翼无人机吊挂运输系统的非线性控制方法 |
WO2018057828A2 (en) * | 2016-09-23 | 2018-03-29 | Sharp Laboratories Of America, Inc. | Unmanned aircraft and operation thereof |
CN107885086A (zh) * | 2017-11-17 | 2018-04-06 | 合肥工业大学 | 基于mcmc优化q学习的自主航行器控制参数在线调节方法 |
CN108008627A (zh) * | 2017-12-13 | 2018-05-08 | 中国石油大学(华东) | 一种并行优化的强化学习自适应pid控制方法 |
CN108803321A (zh) * | 2018-05-30 | 2018-11-13 | 清华大学 | 基于深度强化学习的自主水下航行器轨迹跟踪控制方法 |
CN108803349A (zh) * | 2018-08-13 | 2018-11-13 | 中国地质大学(武汉) | 非线性多智能体系统的最优一致性控制方法及系统 |
CN108919640A (zh) * | 2018-04-20 | 2018-11-30 | 西北工业大学 | 无人机自适应多目标跟踪的实现方法 |
CN109143855A (zh) * | 2018-07-31 | 2019-01-04 | 西北工业大学 | 一种基于模糊sarsa学习的旋翼无人机视觉伺服控制方法 |
CN109164821A (zh) * | 2018-09-26 | 2019-01-08 | 中科物栖(北京)科技有限责任公司 | 一种无人机姿态训练方法及装置 |
-
2019
- 2019-01-31 CN CN201910098125.5A patent/CN109696830B/zh not_active Expired - Fee Related
Patent Citations (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130185437A1 (en) * | 2011-08-31 | 2013-07-18 | Enernoc, Inc. | Noc-oriented control of a demand coordination network |
US20130325774A1 (en) * | 2012-06-04 | 2013-12-05 | Brain Corporation | Learning stochastic apparatus and methods |
WO2014047142A1 (en) * | 2012-09-20 | 2014-03-27 | Brain Corporation | Spiking neuron network adaptive control apparatus and methods |
US9082079B1 (en) * | 2012-10-22 | 2015-07-14 | Brain Corporation | Proportional-integral-derivative controller effecting expansion kernels comprising a plurality of spiking neurons associated with a plurality of receptive fields |
CN103645736A (zh) * | 2013-12-05 | 2014-03-19 | 哈尔滨工程大学 | 基于非线性h∞逆优化输出反馈控制器的船舶航向运动控制方法 |
CN104763694A (zh) * | 2015-03-18 | 2015-07-08 | 上海交通大学 | 一种掘进机液压推进系统分区压力设定值优化方法 |
CN104932267A (zh) * | 2015-06-04 | 2015-09-23 | 曲阜师范大学 | 一种采用资格迹的神经网络学习控制方法 |
CN104932514A (zh) * | 2015-06-25 | 2015-09-23 | 天津大学 | 小型无人直升机的姿态非线性自适应控制方法 |
WO2017136613A1 (en) * | 2016-02-04 | 2017-08-10 | Siemens Aktiengesellschaft | Strategic improvisation design for adaptive resilience |
CN106227043A (zh) * | 2016-09-09 | 2016-12-14 | 中国科学院自动化研究所 | 自适应最优控制方法 |
WO2018057828A2 (en) * | 2016-09-23 | 2018-03-29 | Sharp Laboratories Of America, Inc. | Unmanned aircraft and operation thereof |
DE202017106132U1 (de) * | 2016-10-10 | 2017-11-13 | Google Llc | Neuronale Netze zum Auswählen von durch einen Roboteragenten auszuführenden Aktionen |
CN106595671A (zh) * | 2017-02-22 | 2017-04-26 | 南方科技大学 | 一种基于强化学习的无人机路径规划方法和装置 |
CN107357166A (zh) * | 2017-04-29 | 2017-11-17 | 天津大学 | 小型无人直升机的无模型自适应鲁棒控制方法 |
CN107765553A (zh) * | 2017-11-02 | 2018-03-06 | 天津大学 | 针对旋翼无人机吊挂运输系统的非线性控制方法 |
CN107885086A (zh) * | 2017-11-17 | 2018-04-06 | 合肥工业大学 | 基于mcmc优化q学习的自主航行器控制参数在线调节方法 |
CN108008627A (zh) * | 2017-12-13 | 2018-05-08 | 中国石油大学(华东) | 一种并行优化的强化学习自适应pid控制方法 |
CN108919640A (zh) * | 2018-04-20 | 2018-11-30 | 西北工业大学 | 无人机自适应多目标跟踪的实现方法 |
CN108803321A (zh) * | 2018-05-30 | 2018-11-13 | 清华大学 | 基于深度强化学习的自主水下航行器轨迹跟踪控制方法 |
CN109143855A (zh) * | 2018-07-31 | 2019-01-04 | 西北工业大学 | 一种基于模糊sarsa学习的旋翼无人机视觉伺服控制方法 |
CN108803349A (zh) * | 2018-08-13 | 2018-11-13 | 中国地质大学(武汉) | 非线性多智能体系统的最优一致性控制方法及系统 |
CN109164821A (zh) * | 2018-09-26 | 2019-01-08 | 中科物栖(北京)科技有限责任公司 | 一种无人机姿态训练方法及装置 |
Non-Patent Citations (7)
Title |
---|
FENZA, GIUSEPPE等: "Building Adaptive Tutoring Model using Artificial Neural Networks and Reinforcement Learning", 《17TH IEEE INTERNATIONAL CONFERENCE ON ADVANCED LEARNING TECHNOLOGIES》 * |
IMANBERDIYEV, N.等: "Autonomous navigation of UAV by using real-time model-based reinforcement learning", 《2016 14TH INTERNATIONAL CONFERENCE ON CONTROL, AUTOMATION, ROBOTICS AND VISION》 * |
孙景亮等: "基于自适应动态规划的导弹制导律研究综述", 《自动化学报》 * |
屈秋霞等: "针对时变轨迹的非线性仿射系统的鲁棒近似最优跟踪控制", 《控制理论与应用》 * |
赵丹丹: "基于模型参考滑模控制的四旋翼无人机控制器设计", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 * |
鲜斌等: "基于神经网络前馈的无人直升机非线性鲁棒控制设计", 《传感器与微系统》 * |
鲜斌等: "小型无人直升机姿态非线性鲁棒控制设计", 《控制理论与应用》 * |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110083168A (zh) * | 2019-05-05 | 2019-08-02 | 天津大学 | 基于增强学习的小型无人直升机定高控制方法 |
CN110806756A (zh) * | 2019-09-10 | 2020-02-18 | 西北工业大学 | 基于ddpg的无人机自主引导控制方法 |
CN110806756B (zh) * | 2019-09-10 | 2022-08-02 | 西北工业大学 | 基于ddpg的无人机自主引导控制方法 |
CN110908281A (zh) * | 2019-11-29 | 2020-03-24 | 天津大学 | 无人直升机姿态运动有限时间收敛强化学习控制方法 |
CN113377121B (zh) * | 2020-07-02 | 2022-06-07 | 北京航空航天大学 | 一种基于深度强化学习的飞行器智能抗扰动控制方法 |
CN113377121A (zh) * | 2020-07-02 | 2021-09-10 | 北京航空航天大学 | 一种基于深度强化学习的飞行器智能抗扰动控制方法 |
CN112363519A (zh) * | 2020-10-20 | 2021-02-12 | 天津大学 | 四旋翼无人机强化学习非线性姿态控制方法 |
CN112363519B (zh) * | 2020-10-20 | 2021-12-07 | 天津大学 | 四旋翼无人机强化学习非线性姿态控制方法 |
CN112650058A (zh) * | 2020-12-23 | 2021-04-13 | 西北工业大学 | 一种基于强化学习的四旋翼无人机轨迹控制方法 |
CN113126502A (zh) * | 2021-04-28 | 2021-07-16 | 天津理工大学 | 一种欠驱动吊车系统的控制方法及控制系统 |
CN113359473A (zh) * | 2021-07-06 | 2021-09-07 | 天津大学 | 基于迭代学习的微小型无人直升机非线性控制方法 |
CN113359473B (zh) * | 2021-07-06 | 2022-03-11 | 天津大学 | 基于迭代学习的微小型无人直升机非线性控制方法 |
CN113721655A (zh) * | 2021-08-26 | 2021-11-30 | 南京大学 | 一种控制周期自适应的强化学习无人机稳定飞行控制方法 |
CN114084375A (zh) * | 2021-11-19 | 2022-02-25 | 中国直升机设计研究所 | 一种旋翼系统装试验台耦合固有频率计算方法 |
CN114084375B (zh) * | 2021-11-19 | 2023-04-28 | 中国直升机设计研究所 | 一种旋翼系统装试验台耦合固有频率计算方法 |
CN114326438A (zh) * | 2021-12-30 | 2022-04-12 | 北京理工大学 | 基于控制障碍函数的安全强化学习四旋翼控制系统及方法 |
CN114326438B (zh) * | 2021-12-30 | 2023-12-19 | 北京理工大学 | 基于控制障碍函数的安全强化学习四旋翼控制系统及方法 |
CN114859952A (zh) * | 2022-05-07 | 2022-08-05 | 南京航空航天大学 | 一种直升机非线性增量自适应动态优化控制方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109696830B (zh) | 2021-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109696830B (zh) | 小型无人直升机的强化学习自适应控制方法 | |
Islam et al. | Robust control of four-rotor unmanned aerial vehicle with disturbance uncertainty | |
Liu et al. | Tracking control of small-scale helicopters using explicit nonlinear MPC augmented with disturbance observers | |
CN103760906B (zh) | 神经网络与非线性连续无人直升机姿态控制方法 | |
Doukhi et al. | Neural network-based robust adaptive certainty equivalent controller for quadrotor UAV with unknown disturbances | |
CN107357166B (zh) | 小型无人直升机的无模型自适应鲁棒控制方法 | |
CN105607473B (zh) | 小型无人直升机的姿态误差快速收敛自适应控制方法 | |
Muniraj et al. | Path-following control of small fixed-wing unmanned aircraft systems with H∞ type performance | |
Hanafi et al. | Simple GUI wireless controller of quadcopter | |
Nie et al. | Three‐Dimensional Path‐Following Control of a Robotic Airship with Reinforcement Learning | |
CN103885450A (zh) | 无人直升机姿态非线性控制方法及验证平台 | |
Wenfu et al. | Flight control of a large-scale flapping-wing flying robotic bird: System development and flight experiment | |
Islam et al. | Adaptive sliding mode control design for quadrotor unmanned aerial vehicle | |
Lai et al. | Adaptive learning-based observer with dynamic inversion for the autonomous flight of an unmanned helicopter | |
Han et al. | A review of control algorithms for quadrotor | |
Suprijono et al. | Direct inverse control based on neural network for unmanned small helicopter attitude and altitude control | |
CN115556111A (zh) | 基于变惯性参数建模的飞行机械臂耦合扰动控制方法 | |
Brahim et al. | Finite Time Adaptive SMC for UAV Trajectory Tracking Under Unknown Disturbances and Actuators Constraints | |
Paulino et al. | Affine parameter-dependent preview control for rotorcraft terrain following flight | |
Saderla et al. | Parameter estimation of UAV from flight data using neural network | |
Ashari et al. | Flight trajectory control system on fixed wing UAV using linear quadratic regulator | |
Valencia et al. | Trajectory tracking control for multiple quadrotors based on a neurobiological-inspired system | |
Hamissi et al. | A new nonlinear control design strategy for fixed wing aircrafts piloting | |
Li et al. | Design, modeling and validation of a t-tail unmanned aerial vehicle | |
Zou et al. | Model-free Control based Trajectory Tracking Control of a Tail-sitter UAV in Hovering Mode |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20211203 |
|
CF01 | Termination of patent right due to non-payment of annual fee |