CN107563044B - 基于在线安全学习的四旋翼无人机路径跟踪控制方法 - Google Patents

基于在线安全学习的四旋翼无人机路径跟踪控制方法 Download PDF

Info

Publication number
CN107563044B
CN107563044B CN201710758952.3A CN201710758952A CN107563044B CN 107563044 B CN107563044 B CN 107563044B CN 201710758952 A CN201710758952 A CN 201710758952A CN 107563044 B CN107563044 B CN 107563044B
Authority
CN
China
Prior art keywords
quad
aerial vehicle
unmanned aerial
rotor unmanned
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710758952.3A
Other languages
English (en)
Other versions
CN107563044A (zh
Inventor
杨艳华
程欢
柴利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University of Science and Engineering WUSE
Original Assignee
Wuhan University of Science and Engineering WUSE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University of Science and Engineering WUSE filed Critical Wuhan University of Science and Engineering WUSE
Priority to CN201710758952.3A priority Critical patent/CN107563044B/zh
Publication of CN107563044A publication Critical patent/CN107563044A/zh
Application granted granted Critical
Publication of CN107563044B publication Critical patent/CN107563044B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明涉及一种基于在线安全学习的四旋翼无人机路径跟踪控制方法。其技术方案是,首先建立四旋翼无人机名义模型
Figure DDA0001392807040000011
根据残差g(X,U)的数据得到学习模型
Figure DDA0001392807040000012
再采用四旋翼无人机在线实时避障的概率约束条件实现在线避障,然后将控制系统状态安全域

Description

基于在线安全学习的四旋翼无人机路径跟踪控制方法
技术领域
本发明属于旋翼无人机路径跟踪控制技术领域。具体涉及一种基于在线安全学习的四旋翼无人机路径跟踪控制方法。
背景技术
随着机器人和航天航空技术的不断发展,无人机的研究得到了越来越多的关注。四旋翼无人机作为一种典型的无人飞行器,拥有四个驱动电机,可以通过控制四个电机的转速来调整飞行器的飞行姿态和位置。正由于其结构小巧、成本低廉、使用起来安全灵活,因此在环境监测、抗灾救援、军事侦察等领域具有十分广阔的应用前景。
由于四旋翼无人机具有六个自由度,多于控制量的个数,是一个典型的欠驱动控制系统。此外,四旋翼无人机模型还具有非线性、强耦合、不精确等特点。以上特点均给四旋翼无人机的控制带来了巨大的困难。
为了使这种无人机能够灵活地飞行并完成期望的飞行任务,研究者们对四旋翼无人机的控制问题提出了多种方法,包括PID、模型预测控制、反演控制、滑模控制、反馈线性化等。以上控制方法通常需要联合其它鲁棒控制方法,以自适应或优化的方式调整模型参数或控制器参数,才能在一定程度上应对系统存在的不确定性问题。引入的参数调节方法存在过程繁琐、效率低下、缺少最优性、易陷入局部极小、控制误差较大等各种各样的问题。采用学习的方法可以在线获得参数,但是单纯的学习方法又无法保证系统的稳定性。虽然模型预测控制方法固有的滚动优化策略和处理约束的能力在四旋翼无人机控制上具有一定的优势,但是该方法必须依赖一个比较可靠的动力学模型。而现有的鲁棒控制方法在解决不确定性问题时,通常在给定不确定界的前提下设计控制器,不可避免地带来了保守性,甚至造成方法不实用,也不能保证四旋翼无人机对安全性能严格的要求。
发明内容
本发明旨在克服现有技术缺陷,目的在于提供一种基于在线安全学习的四旋翼无人机路径跟踪控制方法,该方法鲁棒性好、响应性强、稳定性高、跟踪性能优异和安全性优良。
为实现上述目的,本发明采用的技术方案是:
步骤1、四旋翼无人机名义模型
Figure GDA0002562722520000011
的建立
构建四旋翼无人机机体坐标系,所述机体坐标系是:以北为坐标系x轴的正方向,以东为坐标系y轴的正方向,以地为坐标系z轴的正方向。
建立四旋翼无人机的名义模型
Figure GDA0002562722520000021
Figure GDA0002562722520000022
式(1)中:φ表示四旋翼无人机的滚转角,rad;
Figure GDA0002562722520000023
表示四旋翼无人机的滚转角角速度,rad/s;
θ表示四旋翼无人机的俯仰角,rad;
Figure GDA0002562722520000024
表示四旋翼无人机的俯仰角角速度,rad/s;
ψ表示四旋翼无人机的偏航角,rad;
Figure GDA0002562722520000025
表示四旋翼无人机的偏航角角速度,rad/s;
z表示四旋翼无人机在z轴的位置,m;
Figure GDA0002562722520000026
表示四旋翼无人机z轴方向的线速度,m/s;
x表示四旋翼无人机在x轴的位置,m;
Figure GDA0002562722520000027
表示四旋翼无人机x轴方向的线速度,m/s;
y表示四旋翼无人机在y轴的位置,m;
Figure GDA0002562722520000028
表示四旋翼无人机y轴方向的线速度,m/s;
X表示四旋翼无人机12维的状态向量;
Figure GDA0002562722520000029
U表示虚拟控制量,U=[U1 U2 U3 U4];
U1表示通道z的控制量;
U2表示通道φ的控制量;
U3表示通道θ的控制量;
U4表示通道ψ的控制量;
m表示四旋翼无人机的质量,kg;
g表示重力加速度常量,9.8m/s2
步骤2、四旋翼无人机的学习模型
Figure GDA0002562722520000031
假设在k时刻,传感器测得的四旋翼无人机实际状态
Figure GDA0002562722520000032
根据k-1时刻的状态
Figure GDA0002562722520000033
和k时刻的状态
Figure GDA0002562722520000034
得到状态微分
Figure GDA0002562722520000035
再将状态微分
Figure GDA0002562722520000036
与k时刻名义模型的值
Figure GDA0002562722520000037
相减,得到k时刻残差g(X(k),U(k))
Figure GDA0002562722520000038
式(2)中:
Figure GDA0002562722520000039
表示k时刻的状态微分;
Figure GDA00025627225200000310
表示k时刻的名义模型。
随着时间k的增加,得到N个残差g(X,U)的数据。
然后,利用所述N个残差g(X,U)的数据,得到学习模型
Figure GDA00025627225200000311
对四旋翼无人机的12个状态分别建立相应的高斯过程学习模型
Figure GDA00025627225200000312
Xl表示状态向量X的第l个变量,l=1,2,…,12,学习模型
Figure GDA00025627225200000313
定义状态向量X的第l个学习样本结构sl=[Xl,U],l=1,2,…,12,取M个时刻(200~1000)个样本,则i时刻状态向量X的第l个样本为gl(sli),i=1,2,…,M,l=1,2,…,12,j时刻状态向量X的第l个样本为gl(slj),j=1,2,…,M,l=1,2,…,12;假设样本的数据均值为0,i时刻状态向量X的第l个样本gl(sli)和j时刻状态向量X的第l个样本gl(slj)的协方差为:
Figure GDA00025627225200000314
式(3)中:σ表示测量噪声标准差;
σ2 表示测量噪声方差;
σ表示过程噪声标准差;
σ2 表示过程噪声方差;
Ml表示对角矩阵,l=1,2,…,12;
sli表示i时刻状态向量X的第l个样本,i=1,2,…,M,l=1,2,…,12;
slj表示j时刻状态向量X的第l个样本,j=1,2,…,M,l=1,2,…,12;
δlij表示测量噪声方差系数,l=1,2,…,12;
Figure GDA0002562722520000041
采用梯度法求取最大似然,获得测量噪声标准差σ、过程噪声标准差σ和对角矩证Ml;对于下一时刻的样本s*,学习模型
Figure GDA00025627225200000410
的预测参数为。
Figure GDA0002562722520000042
式(4)中:K表示N行N列矩阵;
k(si,sj)表示i时刻样本和j时刻样本的协方差,i=1,2,…,M,j=1,2,…,M;K(i,j)表示矩阵第i行第j列的值,K(i,j)=k(si,sj),i=1,2,…,M,j=1,2,…,M,k(s*,s*)表示下一时刻的样本s*的方差;
k(s*)表示下一时刻的样本s*与之前M个时刻样本分别的协方差,k(s*)=[k(s*,s1),...,k(s*,sM)];
μ(s*)表示学习模型
Figure GDA00025627225200000411
的预测值;
σ2(s*)表示学习模型
Figure GDA00025627225200000412
更新的协方差值。
步骤3、学习模型在线更新
在所述第l个学习模型
Figure GDA0002562722520000043
的基础上,l=1,2,…,12,依据置信度3σ(sl)建立第l个学习模型
Figure GDA0002562722520000044
的估计的扰动集合
Figure GDA0002562722520000045
Figure GDA0002562722520000046
式(5)中:
Figure GDA0002562722520000047
表示第l个学习模型
Figure GDA0002562722520000048
的估计的扰动集合,
Figure GDA0002562722520000049
Rm表示m维空间;
Figure GDA0002562722520000051
表示第l个学习模型
Figure GDA0002562722520000052
期望值,l=1,2,…,12;
3σ(sl)表示置信度,l=1,2,…,12。
然后,采用下述判别函数λ(sl),判断第l个学习模型
Figure GDA0002562722520000053
的准确性
Figure GDA0002562722520000054
式(6)中:
Figure GDA0002562722520000055
表示第l个学习模型
Figure GDA0002562722520000056
的估计的扰动集合,
Figure GDA0002562722520000057
Rm表示m维空间;
Figure GDA0002562722520000058
表示第l个估计的扰动集
Figure GDA0002562722520000059
的补集,
Figure GDA00025627225200000510
g(sl)表示第l个残差,l=1,2,…,12;
δ表示估计扰动集
Figure GDA00025627225200000511
里任一点;
dist表示有符号距离函数,定义为:对于给定的Rn上的范数||.||,x∈Rn
Figure GDA00025627225200000512
的符号距离为
Figure GDA00025627225200000513
式(7)中:Rn表示n维空间;
A表示第l个估计的扰动集
Figure GDA00025627225200000514
的补集
Figure GDA00025627225200000515
x表示第l个残差g(sl)中的一点,l=1,2,…,12;
y表示A内的任一点;
x-y表示第l个残差g(sl)中的一点x与A内任一点y的差。
当判别函数λ(sl)∈[0,1]时,实际的第l个残差gl(sl)在估计的扰动集
Figure GDA00025627225200000516
内,l=1,2,…,12,设定经验阈值λL∈(0,1),当判别函数λ(sl)>λL时,不用更新学习模型
Figure GDA00025627225200000517
否则重复步骤2和步骤3更新学习模型
Figure GDA00025627225200000518
步骤4、在线学习的四旋翼无人机跟踪控制方法
步骤4.1、四旋翼无人机在线实时避障的概率约束条件
对于预测时域N,假设四旋翼无人机实际状态服从正态分布:
Figure GDA0002562722520000061
式(8)中:
Figure GDA0002562722520000062
表示期望为
Figure GDA0002562722520000063
和方差为P(k+j)的正态分布;
Figure GDA0002562722520000064
表示k+j时刻四旋翼无人机的预测状态,j=0,1,2,…,N;
P(k+j)表示k+j时刻四旋翼无人机状态不确定性的方差,j=0,1,2,…,N。
设障碍物位置估计的不确定性w~N(0,Z),则障碍物集合:
Figure GDA0002562722520000065
式(9)中:Oi表示环境中的障碍物;
R3表示3维空间;
Z表示四旋翼无人机位置估计不确定性的方差;
N(0,Z)表示期望为0和方差为Z的正态分布。
若四旋翼无人机的位置为p(k),定义四旋翼无人机占据的空间为
Figure GDA00025627225200000613
采用高斯分布描述四旋翼无人机位置的不确定性,则四旋翼无人机和障碍物的碰撞概率小于给定值Ph的约束条件为
Figure GDA0002562722520000066
式(10)中:
Figure GDA0002562722520000067
表示期望为
Figure GDA0002562722520000068
和方差为Pc(k+j)+Z的正态分布;
R(p(k+j))表示k+j时刻四旋翼无人机占据的空间,j=0,1,2,…,N;
O表示障碍物集合;
Figure GDA0002562722520000069
表示k+j时刻四旋翼无人机估计的位置;
Pc(k+j)表示k+j时刻四旋翼无人机估计位置不确定性的方差;
Z表示障碍物位置估计不确定性的方差。
步骤4.2、四旋翼无人机状态安全域约束方法
假设四旋翼无人机状态约束集为Φ、控制输入约束为Γ和一个较为保守的域Ω,使得残差g(X,U)∈Ω;根据估计的扰动集合
Figure GDA00025627225200000610
得到四旋翼无人机的安全域可达条件V(m)>0和四旋翼无人机的安全域
Figure GDA00025627225200000611
Figure GDA00025627225200000612
式(11)中:Rn表示n维空间;
m表示四旋翼无人机的状态;
Figure GDA0002562722520000071
表示第l个学习模型
Figure GDA00025627225200000711
的估计的扰动集合,l=1,2,…,12。
当四旋翼无人机状态满足安全域可达条件V(m)>0且判别函数λ(sl)>λL时,安全域采用
Figure GDA0002562722520000072
并且以完整动力学模型的预测状态作为状态约束;当四旋翼无人机状态不满足安全域可达条件V(m)>0或判别函数λ(sl)≤λL时,安全域
Figure GDA0002562722520000073
依赖名义模型
Figure GDA0002562722520000074
构建,根据名义模型
Figure GDA0002562722520000075
得到预测状态
Figure GDA0002562722520000076
Figure GDA0002562722520000077
作为状态约束。
步骤4.3、非线性模型预测控制器的设计
首先采用扩展卡尔曼滤波方法估计四旋翼无人机的状态,然后将所述四旋翼无人机名义模型
Figure GDA00025627225200000712
分为四旋翼无人机位置动力学模型和四旋翼无人机姿态动力学模型,分别采用反馈线性化方法获得线性模型,最后针对线性模型在相应的约束条件下设计模型预测控制器。
考虑四旋翼无人机的位置,在满足姿态约束、在线避障约束和安全域约束的条件下,将四旋翼无人机巡检的自主控制转化为二次优化
Figure GDA0002562722520000078
式(12)中:N表示预测时域;
i表示四旋翼无人机位置动力子系统、四旋翼无人机姿态子系统中任一个;
Q表示yi(k+j)-yir(k+j)的误差权矩阵;
R表示vi(k+j-1)的控制权矩阵;
S表示yi(k+N)-yir(k+N)的误差权矩阵;
yi(k+j)表示四旋翼无人机在k+j时刻的预测值;
yir(k+j)表示四旋翼无人机在k+j时刻的参考值;
yi(k+N)表示四旋翼无人机在k+j时刻的预测值;
yir(k+N)表示四旋翼无人机在k+j时刻的参考值;
yi(k+j)-yir(k+j)表示四旋翼无人机在k+j时刻预测值与参考值的差;
yi(k+N)-yir(k+N)表示四旋翼无人机在k+N时刻预测值与参考值的差;
vi(k+j-1)表示四旋翼无人机在k+j-1时刻的控制量。
当安全域
Figure GDA0002562722520000079
满足安全域可达条件V(m)>0且学习模型
Figure GDA00025627225200000710
满足步骤2和步骤3时,采用学习模型
Figure GDA0002562722520000081
和最大安全域作为状态的约束条件,当安全域可达条件V(m)>0不成立或学习模型
Figure GDA0002562722520000082
不满足步骤2和步骤3时,则采用预先设定的较为保守的安全域
Figure GDA0002562722520000083
和名义模型
Figure GDA0002562722520000084
的状态作为约束条件。
由于采用上述技术方案,本发明具有如下积极效果:
本发明通过采用高斯过程回归,建立四旋翼无人机的在线学习模型,以改善现有方法解决不确定性问题能力的不足,而四旋翼无人机的名义模型则直接采用非线性模型,构建非线性模型预测控制器,采用二次优化方法保证四旋翼无人机的稳定性。根据学习所得的模型,采用滚动优化策略设计非线性模型预测控制器,同时采用概率约束方法实现在线避障,并且将四旋翼无人机安全性融入学习过程,在线计算安全域保证四旋翼无人机安全性,提高跟踪性能。本发明能够在线获得环境参数,自主适应巡检环境的变化,能显著提高控制系统的鲁棒性和响应性能,
因此,本发明具有鲁棒性好、响应性强、稳定性高、跟踪性能优异和安全性优良的特点。
具体实施方式
为了进一步说明本发明,现结合具体实施方式对本发明作进一步的描述。
实施例
一种基于在线安全学习的四旋翼无人机路径跟踪控制方法。本实施例采用的技术方案是:
步骤1、四旋翼无人机名义模型
Figure GDA0002562722520000086
的建立
构建四旋翼无人机机体坐标系,所述机体坐标系是:以北为坐标系x轴的正方向,以东为坐标系y轴的正方向,以地为坐标系z轴的正方向。
建立四旋翼无人机的名义模型
Figure GDA0002562722520000085
Figure GDA0002562722520000091
式(1)中:φ表示四旋翼无人机的滚转角,rad;
Figure GDA0002562722520000092
表示四旋翼无人机的滚转角角速度,rad/s;
θ表示四旋翼无人机的俯仰角,rad;
Figure GDA0002562722520000093
表示四旋翼无人机的俯仰角角速度,rad/s;
ψ表示四旋翼无人机的偏航角,rad;
Figure GDA0002562722520000094
表示四旋翼无人机的偏航角角速度,rad/s;
z表示四旋翼无人机在z轴的位置,m;
Figure GDA0002562722520000095
表示四旋翼无人机z轴方向的线速度,m/s;
x表示四旋翼无人机在x轴的位置,m;
Figure GDA0002562722520000096
表示四旋翼无人机x轴方向的线速度,m/s;
y表示四旋翼无人机在y轴的位置,m;
Figure GDA0002562722520000097
表示四旋翼无人机y轴方向的线速度,m/s;
X表示四旋翼无人机12维的状态向量;
Figure GDA0002562722520000098
U表示虚拟控制量,U=[U1 U2 U3 U4];
U1表示通道z的控制量;
U2表示通道φ的控制量;
U3表示通道θ的控制量;
U4表示通道ψ的控制量;
m表示四旋翼无人机的质量,kg;
g表示重力加速度常量,9.8m/s2
步骤2、四旋翼无人机的学习模型
Figure GDA0002562722520000101
假设在k时刻,传感器测得的四旋翼无人机实际状态
Figure GDA0002562722520000102
根据k-1时刻的状态
Figure GDA00025627225200001016
和k时刻的状态
Figure GDA00025627225200001015
得到状态微分
Figure GDA0002562722520000105
再将状态微分
Figure GDA0002562722520000106
与k时刻名义模型的值
Figure GDA0002562722520000107
相减,得到k时刻残差g(X(k),U(k))
Figure GDA0002562722520000108
式(2)中:
Figure GDA0002562722520000109
表示k时刻的状态微分;
Figure GDA00025627225200001010
表示k时刻的名义模型。
随着时间k的增加,得到N个残差g(X,U)的数据。
然后,利用所述N个残差g(X,U)的数据,得到学习模型
Figure GDA00025627225200001011
对四旋翼无人机的12个状态分别建立相应的高斯过程学习模型
Figure GDA00025627225200001012
Xl表示状态向量X的第l个变量,l=1,2,…,12,学习模型
Figure GDA00025627225200001013
定义状态向量X的第l个学习样本结构sl=[Xl,U],l=1,2,…,12,取M个时刻(200~1000)个样本,则i时刻状态向量X的第l个样本为gl(sli),i=1,2,…,M,l=1,2,…,12,j时刻状态向量X的第l个样本为gl(slj),j=1,2,…,M,l=1,2,…,12;假设样本的数据均值为0,i时刻状态向量X的第l个样本gl(sli)和j时刻状态向量X的第l个样本gl(slj)的协方差为:
Figure GDA00025627225200001014
式(3)中:σ表示测量噪声标准差;
σ2 表示测量噪声方差;
σ表示过程噪声标准差;
σ2 表示过程噪声方差;
Ml表示对角矩阵,l=1,2,…,12;
sli表示i时刻状态向量X的第l个样本,i=1,2,…,M,l=1,2,…,12;
slj表示j时刻状态向量X的第l个样本,j=1,2,…,M,l=1,2,…,12;
δlij表示测量噪声方差系数,l=1,2,…,12;
Figure GDA0002562722520000111
采用梯度法求取最大似然,获得测量噪声标准差σ、过程噪声标准差σ和对角矩证Ml;对于下一时刻的样本s*,学习模型
Figure GDA00025627225200001110
的预测参数为。
Figure GDA0002562722520000112
式(4)中:K表示N行N列矩阵;
k(si,sj)表示i时刻样本和j时刻样本的协方差,i=1,2,…,M,j=1,2,…,M;
K(i,j)表示矩阵第i行第j列的值,K(i,j)=k(si,sj),i=1,2,…,M,j=1,2,…,M,k(s*,s*)表示下一时刻的样本s*的方差;
k(s*)表示下一时刻的样本s*与之前M个时刻样本分别的协方差,k(s*)=[k(s*,s1),...,k(s*,sM)];
μ(s*)表示学习模型
Figure GDA00025627225200001111
的预测值;
σ2(s*)表示学习模型
Figure GDA00025627225200001112
更新的协方差值。
步骤3、学习模型在线更新
在所述第l个学习模型
Figure GDA0002562722520000113
的基础上,l=1,2,…,12,依据置信度3σ(sl)建立第l个学习模型
Figure GDA0002562722520000114
的估计的扰动集合
Figure GDA0002562722520000115
Figure GDA0002562722520000116
式(5)中:
Figure GDA0002562722520000117
表示第l个学习模型
Figure GDA0002562722520000118
的估计的扰动集合,
Figure GDA0002562722520000119
Rm表示m维空间;
Figure GDA0002562722520000121
表示第l个学习模型
Figure GDA0002562722520000122
期望值,l=1,2,…,12;
3σ(sl)表示置信度,l=1,2,…,12。
然后,采用下述判别函数λ(sl),判断第l个学习模型
Figure GDA0002562722520000123
的准确性
Figure GDA0002562722520000124
式(6)中:
Figure GDA0002562722520000125
表示第l个学习模型
Figure GDA0002562722520000126
的估计的扰动集合,
Figure GDA0002562722520000127
Rm表示m维空间;
Figure GDA0002562722520000128
表示第l个估计的扰动集
Figure GDA0002562722520000129
的补集,
Figure GDA00025627225200001210
g(sl)表示第l个残差,l=1,2,…,12;
δ表示估计扰动集
Figure GDA00025627225200001211
里任一点;
dist表示有符号距离函数,定义为:对于给定的Rn上的范数||.||,x∈Rn
Figure GDA00025627225200001212
的符号距离为
Figure GDA00025627225200001213
式(7)中:Rn表示n维空间;
A表示第l个估计的扰动集
Figure GDA00025627225200001214
的补集
Figure GDA00025627225200001215
x表示第l个残差g(sl)中的一点,l=1,2,…,12;
y表示A内的任一点;
x-y表示第l个残差g(sl)中的一点x与A内任一点y的差。
当判别函数λ(sl)∈[0,1]时,实际的第l个残差gl(sl)在估计的扰动集
Figure GDA00025627225200001216
内,l=1,2,…,12,设定经验阈值λL∈(0,1),当判别函数λ(sl)>λL时,不用更新学习模型
Figure GDA00025627225200001217
否则重复步骤2和步骤3更新学习模型
Figure GDA00025627225200001218
步骤4、在线学习的四旋翼无人机跟踪控制方法
步骤4.1、四旋翼无人机在线实时避障的概率约束条件
对于预测时域N,假设四旋翼无人机实际状态服从正态分布:
Figure GDA00025627225200001219
式(8)中:
Figure GDA0002562722520000131
表示期望为
Figure GDA0002562722520000132
和方差为P(k+j)的正态分布;
Figure GDA0002562722520000133
表示k+j时刻四旋翼无人机的预测状态,j=0,1,2,…,N;
P(k+j)表示k+j时刻四旋翼无人机状态不确定性的方差,j=0,1,2,…,N。
设障碍物位置估计的不确定性w~N(0,Z),则障碍物集合:
Figure GDA0002562722520000134
式(9)中:Oi表示环境中的障碍物;
R3表示3维空间;
Z表示四旋翼无人机位置估计不确定性的方差;
N(0,Z)表示期望为0和方差为Z的正态分布。
若四旋翼无人机的位置为p(k),定义四旋翼无人机占据的空间为
Figure GDA0002562722520000135
采用高斯分布描述四旋翼无人机位置的不确定性,则四旋翼无人机和障碍物的碰撞概率小于给定值Ph的约束条件为
Figure GDA0002562722520000136
式(10)中:
Figure GDA0002562722520000137
表示期望为
Figure GDA0002562722520000138
和方差为Pc(k+j)+Z的正态分布;
R(p(k+j))表示k+j时刻四旋翼无人机占据的空间,j=0,1,2,…,N;
O表示障碍物集合;
Figure GDA0002562722520000139
表示k+j时刻四旋翼无人机估计的位置;
Pc(k+j)表示k+j时刻四旋翼无人机估计位置不确定性的方差;
Z表示障碍物位置估计不确定性的方差。
步骤4.2、四旋翼无人机状态安全域约束方法
假设四旋翼无人机状态约束集为Φ、控制输入约束为Γ和一个较为保守的域Ω,使得残差g(X,U)∈Ω;根据估计的扰动集合
Figure GDA00025627225200001310
得到四旋翼无人机的安全域可达条件V(m)>0和四旋翼无人机的安全域
Figure GDA00025627225200001311
Figure GDA00025627225200001312
式(11)中:Rn表示n维空间;
m表示四旋翼无人机的状态;
Figure GDA00025627225200001313
表示第l个学习模型
Figure GDA00025627225200001314
的估计的扰动集合,l=1,2,…,12。
当四旋翼无人机状态满足安全域可达条件V(m)>0且判别函数λ(sl)>λL时,安全域采用
Figure GDA0002562722520000141
并且以完整动力学模型的预测状态作为状态约束;当四旋翼无人机状态不满足安全域可达条件V(m)>0或判别函数λ(sl)≤λL时,安全域
Figure GDA0002562722520000142
依赖名义模型
Figure GDA0002562722520000143
构建,根据名义模型
Figure GDA0002562722520000144
得到预测状态
Figure GDA0002562722520000145
Figure GDA0002562722520000146
作为状态约束。
步骤4.3、非线性模型预测控制器的设计
首先采用扩展卡尔曼滤波方法估计四旋翼无人机的状态,然后将所述四旋翼无人机名义模型
Figure GDA0002562722520000147
分为四旋翼无人机位置动力学模型和四旋翼无人机姿态动力学模型,分别采用反馈线性化方法获得线性模型,最后针对线性模型在相应的约束条件下设计模型预测控制器。
考虑四旋翼无人机的位置,在满足姿态约束、在线避障约束和安全域约束的条件下,将四旋翼无人机巡检的自主控制转化为二次优化
Figure GDA0002562722520000148
式(12)中:N表示预测时域;
i表示四旋翼无人机位置动力子系统、四旋翼无人机姿态子系统中任一个;
Q表示yi(k+j)-yir(k+j)的误差权矩阵;
R表示vi(k+j-1)的控制权矩阵;
S表示yi(k+N)-yir(k+N)的误差权矩阵;
yi(k+j)表示四旋翼无人机在k+j时刻的预测值;
yir(k+j)表示四旋翼无人机在k+j时刻的参考值;
yi(k+N)表示四旋翼无人机在k+j时刻的预测值;
yir(k+N)表示四旋翼无人机在k+j时刻的参考值;
yi(k+j)-yir(k+j)表示四旋翼无人机在k+j时刻预测值与参考值的差;
yi(k+N)-yir(k+N)表示四旋翼无人机在k+N时刻预测值与参考值的差;
vi(k+j-1)表示四旋翼无人机在k+j-1时刻的控制量。
当安全域
Figure GDA0002562722520000149
满足安全域可达条件V(m)>0且学习模型
Figure GDA00025627225200001410
满足步骤2和步骤3时,采用学习模型
Figure GDA00025627225200001411
和最大安全域作为状态的约束条件,当安全域可达条件V(m)>0不成立或学习模型
Figure GDA0002562722520000151
不满足步骤2和步骤3时,则采用预先设定的较为保守的安全域
Figure GDA0002562722520000152
和名义模型
Figure GDA0002562722520000153
的状态作为约束条件。
本具体实施方式具有如下积极效果:
本具体实施方式通过采用高斯过程回归,建立四旋翼无人机的在线学习模型,以改善现有方法解决不确定性问题能力的不足,而四旋翼无人机的名义模型则直接采用非线性模型,构建非线性模型预测控制器,采用二次优化方法保证四旋翼无人机的稳定性。根据学习所得的模型,采用滚动优化策略设计非线性模型预测控制器,同时采用概率约束方法实现在线避障,并且将四旋翼无人机安全性融入学习过程,在线计算安全域保证四旋翼无人机安全性,提高跟踪性能。本具体实施方式能够在线获得环境参数,自主适应巡检环境的变化,能显著提高控制系统的鲁棒性和响应性能,
因此,本具体实施方式具有鲁棒性好、响应性强、稳定性高、跟踪性能优异和安全性优良的特点。

Claims (1)

1.一种基于在线安全学习的四旋翼无人机路径跟踪控制方法,其特征在于所述控制方法包含如下步骤:
步骤1、四旋翼无人机名义模型
Figure FDA0002573080690000011
的建立
构建四旋翼无人机机体坐标系,所述机体坐标系是:以北为坐标系xe轴的正方向,以东为坐标系ye轴的正方向,以地为坐标系ze轴的正方向;
建立四旋翼无人机的名义模型
Figure FDA0002573080690000012
Figure FDA0002573080690000013
式(1)中:φ表示四旋翼无人机的滚转角,rad,
Figure FDA0002573080690000019
表示四旋翼无人机的滚转角角速度,rad/s,
θ表示四旋翼无人机的俯仰角,rad,
Figure FDA0002573080690000015
表示四旋翼无人机的俯仰角角速度,rad/s,
ψ表示四旋翼无人机的偏航角,rad,
Figure FDA0002573080690000016
表示四旋翼无人机的偏航角角速度,rad/s,
z表示四旋翼无人机在ze轴的位置,m,
Figure FDA00025730806900000110
表示四旋翼无人机ze轴方向的线速度,m/s,
x表示四旋翼无人机在xe轴的位置,m,
Figure FDA0002573080690000018
表示四旋翼无人机xe轴方向的线速度,m/s,
y表示四旋翼无人机在ye轴的位置,m,
Figure FDA0002573080690000021
表示四旋翼无人机ye轴方向的线速度,m/s,
X表示四旋翼无人机12维的状态向量,
Figure FDA0002573080690000022
U表示虚拟控制量,U=[U1 U2 U3 U4],
U1表示通道z的控制量,
U2表示通道φ的控制量,
U3表示通道θ的控制量,
U4表示通道ψ的控制量,
m表示四旋翼无人机的质量,kg,
g表示重力加速度常量,9.8m/s2
步骤2、四旋翼无人机的学习模型
Figure FDA0002573080690000023
假设在k时刻,传感器测得的四旋翼无人机实际状态
Figure FDA0002573080690000024
根据k-1时刻的状态
Figure FDA0002573080690000025
和k时刻的状态
Figure FDA0002573080690000026
得到状态微分
Figure FDA0002573080690000027
再将状态微分
Figure FDA0002573080690000028
与k时刻名义模型的值
Figure FDA0002573080690000029
相减,得到k时刻残差g(X(k),U(k))
Figure FDA00025730806900000210
式(2)中:
Figure FDA00025730806900000211
表示k时刻的状态微分,
Figure FDA00025730806900000212
表示k时刻的名义模型;
随着时间k的增加,得到M个残差g(X,U)的数据;
然后,利用所述M个残差g(X,U)的数据,得到学习模型
Figure FDA00025730806900000213
对四旋翼无人机的12个状态分别建立相应的高斯过程学习模型
Figure FDA00025730806900000214
Xl表示状态向量X的第l个变量,l=1,2,…,12,学习模型
Figure FDA00025730806900000215
定义状态向量X的第l个学习样本结构sl=[Xl,U],l=1,2,…,12,取M个时刻(200~1000)个样本,则i时刻状态向量X的第l个样本为gl(sli),i=1,2,…,M,l=1,2,…,12,j时刻状态向量X的第l个样本为gl(slj),j=1,2,…,M,l=1,2,…,12;假设样本的数据均值为0,i时刻状态向量X的第l个样本gl(sli)和j时刻状态向量X的第l个样本gl(slj)的协方差为:
Figure FDA0002573080690000031
式(3)中:σ表示测量噪声标准差,
σ2 表示测量噪声方差,
σ表示过程噪声标准差,
σ2 表示过程噪声方差,
Ml表示对角矩阵,l=1,2,…,12,
sli表示i时刻状态向量X的第l个样本,i=1,2,…,M,l=1,2,…,12,
slj表示j时刻状态向量X的第l个样本,j=1,2,…,M,l=1,2,…,12,
δlij表示测量噪声方差系数,l=1,2,…,12,
Figure FDA0002573080690000032
采用梯度法求取最大似然,获得测量噪声标准差σ、过程噪声标准差σ和对角矩阵Ml;对于下一时刻的样本s*,学习模型
Figure FDA0002573080690000033
的预测参数为:
Figure FDA0002573080690000034
式(4)中:K表示M行M列矩阵,
k(s*,s*)表示下一时刻的样本s*的方差,
k(s*)表示下一时刻的样本s*与之前M个时刻样本分别的协方差,
k(s*)=[k(s*,s1),...,k(s*,sM)],
μ(s*)表示学习模型
Figure FDA0002573080690000035
的预测值,
σ2(s*)表示学习模型
Figure FDA0002573080690000036
更新的协方差值;
步骤3、学习模型在线更新
在所述第l个学习模型
Figure FDA0002573080690000037
的基础上,l=1,2,…,12,依据置信度3σ(sl)建立第l个学习模型
Figure FDA0002573080690000041
的估计的扰动集合
Figure FDA0002573080690000042
Figure FDA0002573080690000043
式(5)中:
Figure FDA0002573080690000044
表示第l个学习模型
Figure FDA0002573080690000045
的估计的扰动集合,
Figure FDA0002573080690000046
Rm表示m维空间,
Figure FDA0002573080690000047
表示第l个学习模型
Figure FDA0002573080690000048
期望值,l=1,2,…,12,
3σ(sl)表示置信度,l=1,2,…,12;
然后,采用下述判别函数λ(sl),判断第l个学习模型
Figure FDA0002573080690000049
的准确性
Figure FDA00025730806900000410
式(6)中:
Figure FDA00025730806900000411
表示第l个学习模型
Figure FDA00025730806900000412
的估计的扰动集合,
Figure FDA00025730806900000413
Rm表示m维空间,
Figure FDA00025730806900000414
表示第l个估计的扰动集
Figure FDA00025730806900000415
的补集,
Figure FDA00025730806900000416
g(sl)表示第l个残差,l=1,2,…,12,
δ表示估计的扰动集
Figure FDA00025730806900000417
里任一点,
dist表示有符号距离函数,定义为:对于给定的Rn上的范数||.||,x∈Rn
Figure FDA00025730806900000418
的符号距离为
Figure FDA00025730806900000419
式(7)中:Rn表示n维空间,
A表示第l个估计的扰动集
Figure FDA00025730806900000420
的补集
Figure FDA00025730806900000421
x表示第l个残差g(sl)中的一点,l=1,2,…,12,
y表示A内的任一点,
x-y表示第l个残差g(sl)中的一点x与A内任一点y的差;
当判别函数λ(sl)∈[0,1]时,实际的第l个残差gl(sl)在估计的扰动集
Figure FDA00025730806900000422
内,l=1,2,…,12,设定经验阈值λL∈(0,1),当判别函数λ(sl)>λL时,不用更新学习模型
Figure FDA00025730806900000423
否则重复步骤2和步骤3更新学习模型
Figure FDA00025730806900000512
步骤4、在线学习的四旋翼无人机跟踪控制方法
步骤4.1、四旋翼无人机在线实时避障的概率约束条件
对于预测时域N,假设四旋翼无人机实际状态服从正态分布:
Figure FDA0002573080690000051
式(8)中:
Figure FDA0002573080690000052
表示期望为
Figure FDA0002573080690000053
和方差为P(k+j)的正态分布,
Figure FDA0002573080690000054
表示k+j时刻四旋翼无人机的预测状态,j=0,1,2,…,Np
P(k+j)表示k+j时刻四旋翼无人机状态不确定性的方差,j=0,1,2,…,Np
设障碍物位置估计的不确定性w~N(0,Z),则障碍物集合:
Figure FDA0002573080690000055
式(9)中:Οi表示环境中的障碍物,
R3表示3维空间,
Z表示障碍物位置估计不确定性的方差,
N(0,Z)表示期望为0和方差为Z的正态分布;
若四旋翼无人机的位置为p(k),定义四旋翼无人机占据的空间为
Figure FDA0002573080690000056
采用高斯分布描述四旋翼无人机位置的不确定性,则四旋翼无人机和障碍物的碰撞概率小于等于给定值Ph的约束条件为
Figure FDA0002573080690000057
式(10)中:
Figure FDA0002573080690000058
表示期望为
Figure FDA0002573080690000059
和方差为Pc(k+j)+Z的正态分布,
R(p(k+j))表示k+j时刻四旋翼无人机占据的空间,j=0,1,2,…,N,
Ο表示障碍物集合,
Figure FDA00025730806900000510
表示k+j时刻四旋翼无人机估计的位置,
Pc(k+j)表示k+j时刻四旋翼无人机估计位置不确定性的方差,
Z表示障碍物位置估计不确定性的方差;
步骤4.2、四旋翼无人机状态安全域约束方法
假设四旋翼无人机状态约束集为Φ、控制输入约束为Γ和一个较为保守的域Ω,使得残差g(X,U)∈Ω;根据估计的扰动集合
Figure FDA00025730806900000511
得到四旋翼无人机的安全域可达条件V(X)>0和四旋翼无人机的安全域
Figure FDA0002573080690000061
Figure FDA0002573080690000062
式(11)中:Rn表示n维空间,
X表示四旋翼无人机的状态向量,
Figure FDA0002573080690000063
表示第l个学习模型
Figure FDA00025730806900000617
的估计的扰动集合,l=1,2,…,12;
当四旋翼无人机状态满足安全域可达条件V(X)>0且判别函数λ(sl)>λL时,安全域采用
Figure FDA0002573080690000064
并且以完整动力学模型的预测状态作为状态约束;当四旋翼无人机状态不满足安全域可达条件V(X)>0或判别函数λ(sl)≤λL时,安全域
Figure FDA0002573080690000065
依赖名义模型
Figure FDA0002573080690000066
构建,根据名义模型
Figure FDA0002573080690000067
得到预测状态
Figure FDA0002573080690000068
Figure FDA0002573080690000069
作为状态约束;
步骤4.3、非线性模型预测控制器的设计
首先采用扩展卡尔曼滤波方法估计四旋翼无人机的状态,然后将所述四旋翼无人机名义模型
Figure FDA00025730806900000618
分为四旋翼无人机位置动力学模型和四旋翼无人机姿态动力学模型,分别采用反馈线性化方法获得线性模型,最后针对线性模型在相应的约束条件下设计模型预测控制器;
考虑四旋翼无人机的位置,在满足姿态约束、在线避障约束和安全域约束的条件下,将四旋翼无人机巡检的自主控制转化为二次优化:
Figure FDA00025730806900000610
式(12)中:Np表示预测时域,
Figure FDA00025730806900000611
表示四旋翼无人机在k+ε时刻的预测状态向量,
Figure FDA00025730806900000612
表示四旋翼无人机在k+ε时刻的参考状态向量,
Figure FDA00025730806900000613
表示四旋翼无人机在k+Np时刻的预测状态向量,
Figure FDA00025730806900000614
表示四旋翼无人机在k+Np时刻的参考状态向量,
Figure FDA00025730806900000615
表示四旋翼无人机在k+ε时刻预测状态向量与参考状态向量的差,
Figure FDA00025730806900000616
表示四旋翼无人机在k+Np时刻预测状态向量与参考状态向量的差,
Figure FDA0002573080690000071
表示四旋翼无人机在k+ε-1时刻的控制向量,
Figure FDA0002573080690000072
表示
Figure FDA0002573080690000073
在k+ε时刻的误差权矩阵,
Figure FDA0002573080690000074
表示
Figure FDA0002573080690000075
的控制权矩阵,
Figure FDA0002573080690000076
表示
Figure FDA0002573080690000077
在k+Np时刻的误差权矩阵;
当安全域
Figure FDA0002573080690000078
满足安全域可达条件V(X)>0且学习模型
Figure FDA0002573080690000079
满足步骤2和步骤3时,采用学习模型
Figure FDA00025730806900000710
和最大安全域作为状态的约束条件,当安全域可达条件V(X)>0不成立或学习模型
Figure FDA00025730806900000711
不满足步骤2和步骤3时,则采用预先设定的较为保守的域Ω和名义模型
Figure FDA00025730806900000712
的状态作为约束条件。
CN201710758952.3A 2017-08-29 2017-08-29 基于在线安全学习的四旋翼无人机路径跟踪控制方法 Active CN107563044B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710758952.3A CN107563044B (zh) 2017-08-29 2017-08-29 基于在线安全学习的四旋翼无人机路径跟踪控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710758952.3A CN107563044B (zh) 2017-08-29 2017-08-29 基于在线安全学习的四旋翼无人机路径跟踪控制方法

Publications (2)

Publication Number Publication Date
CN107563044A CN107563044A (zh) 2018-01-09
CN107563044B true CN107563044B (zh) 2020-08-25

Family

ID=60977492

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710758952.3A Active CN107563044B (zh) 2017-08-29 2017-08-29 基于在线安全学习的四旋翼无人机路径跟踪控制方法

Country Status (1)

Country Link
CN (1) CN107563044B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109782806B (zh) * 2019-02-19 2020-10-23 北京邮电大学 一种无人机室内路径跟踪方法及装置
CN109947126B (zh) * 2019-03-07 2020-04-14 中国科学院深圳先进技术研究院 四旋翼无人机的控制方法、装置、设备及可读介质
CN110208842A (zh) * 2019-05-28 2019-09-06 长安大学 一种车联网环境下车辆高精度定位方法
CN110362100B (zh) * 2019-07-03 2022-02-01 武汉科技大学 一种基于四旋翼无人机的大型储罐自主巡检方法
CN111897215B (zh) * 2020-07-01 2022-05-03 杭州电子科技大学 基于数据驱动学习的滚动优化控制方法
CN112416021B (zh) * 2020-11-17 2021-12-21 中山大学 一种基于学习的旋翼无人机路径跟踪预测控制方法
CN112711271B (zh) * 2020-12-16 2022-05-17 中山大学 基于深度强化学习的自主导航无人机功率优化方法
CN114115358B (zh) * 2021-10-19 2024-03-29 杭州电子科技大学 一种基于高斯强化学习的信号源遍历方法
CN114721412B (zh) * 2022-03-16 2023-06-16 北京理工大学 一种基于模型预测控制的无人机轨迹跟踪避障方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016069168A1 (en) * 2014-10-29 2016-05-06 Qualcomm Incorporated Unmanned aerial vehicle
CN105911866A (zh) * 2016-06-15 2016-08-31 浙江工业大学 四旋翼无人飞行器的有限时间全阶滑模控制方法
CN105912009A (zh) * 2016-06-16 2016-08-31 浙江工业大学 基于极点配置和模糊自抗扰控制技术的四旋翼飞行器控制方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016069168A1 (en) * 2014-10-29 2016-05-06 Qualcomm Incorporated Unmanned aerial vehicle
CN105911866A (zh) * 2016-06-15 2016-08-31 浙江工业大学 四旋翼无人飞行器的有限时间全阶滑模控制方法
CN105912009A (zh) * 2016-06-16 2016-08-31 浙江工业大学 基于极点配置和模糊自抗扰控制技术的四旋翼飞行器控制方法

Also Published As

Publication number Publication date
CN107563044A (zh) 2018-01-09

Similar Documents

Publication Publication Date Title
CN107563044B (zh) 基于在线安全学习的四旋翼无人机路径跟踪控制方法
CN107608367B (zh) 多变量干扰补偿四旋翼无人机轨迹与姿态协同控制方法
Lai et al. Adaptive position/attitude tracking control of aerial robot with unknown inertial matrix based on a new robust neural identifier
CN105607473B (zh) 小型无人直升机的姿态误差快速收敛自适应控制方法
CN107357166B (zh) 小型无人直升机的无模型自适应鲁棒控制方法
Jasim et al. A robust controller for multi rotor UAVs
WO2020177267A1 (zh) 四旋翼无人机的控制方法、装置、设备及可读介质
Nie et al. Three-dimensional path-following control of a robotic airship with reinforcement learning
Lee et al. Obstacle avoidance using image-based visual servoing integrated with nonlinear model predictive control
CN112947572B (zh) 一种基于地形跟随的四旋翼飞行器自适应运动规划方法
Garcia et al. Robust and adaptive nonlinear model predictive controller for unsteady and highly nonlinear unmanned aircraft
Kokunko et al. Synthesis of a tracking system with restrictions on UAV state variables
Duan et al. Automatic landing for carrier-based aircraft under the conditions of deck motion and carrier airwake disturbances
CN109991992A (zh) 基于浸入不变集的小型无人直升机无模型自适应控制方法
CN107957686B (zh) 基于预见控制的无人直升机自动着舰控制系统
Timchenko et al. Optimization of processes of robust control of quadcopter for monitoring of sea waters
Velagić et al. Design of LQR controller for 3D trajectory tracking of octocopter unmanned aerial vehicle
CN114510067A (zh) 一种可重复使用飞行器近似最优制导方法
Hervas et al. Sliding mode control of fixed-wing uavs in windy environments
CN115248553A (zh) 欠驱动船舶的事件触发自适应pid航迹跟踪容错控制方法
CN108279562A (zh) 一种基于滑模pid控制的飞行机械臂
Guillén-Bonilla et al. Vision-based nonlinear control of quadrotors using the photogrammetric technique
Safwat et al. Generic UAV autopilot prototype based on adaptive modified incremental backstepping
CN112161626B (zh) 一种基于航路跟踪映射网络的高可飞性航路规划方法
Azimov et al. Real-time guidance, navigation and control framework for fixed-wing aircraft maneuvers in a vertical plane

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant