发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提出了一种在高速飞行状态下,飞行器轨迹的实时反馈控制方法。该方法使用模型预测控制作为主控算法,同时融合高斯过程对下一时刻的过程进行预测,并将融合高斯过程的模型预测控制与四旋翼飞行器运动速度轨迹相结合,具有一定的高效性、精确性和实时性,通过本发明所提出的方法,飞行器轨迹跟踪误差能够有效减少。
(二)技术方案
为实现上述目的,本发明提供如下技术方案:一种融合高斯过程的飞行器轨迹控制方法,包括三维数据收集、高斯过程建模和模型预测控制;具体包括如下步骤:
步骤1:所提出的高斯过程的模型预测控制须设计为最大化性能,同时将计算成本最小化;首先用小写v表示向量,定义了具有正交基的飞行器三维模型B,即xB、yB、zB,接着调整训练数据集,使得学习问题设置是识别从飞行器速度Bv到飞行器加速度扰动Bae的映射,所以:
Bae=μ(Bv) (1)
公式(1)、(2)、(3)中,Bae是飞行器加速度扰动,Bv是飞行器速度,k是任意某一时刻,μvx(Bvxk)、μvy(Bvyk)、μvz(Bvzk)分别是飞行器B在k时刻沿着x、y、z三个方向上的映射速度, 分别是在k时刻x、y、z三个方向的方差,μ指飞行器速度与飞行器加速度之间的映射关系;
用动力学模型收集真实的飞行数据,对于tk时刻的每个样本,记录下一个采样点Bvk+1的速度和下一个采样点的预测速度,以及时间步长δtk;然后计算出时间归一化的速度误差,对应于加速度误差:
步骤2:高斯过程建模;利用高斯过程预测下一过程并在每个时间序列进行闭环校正;由于高斯过程的复杂性与训练集的数量成线性关系,如果使用全部的数据集会增加模型预测控制的优化难度,所以对数据集进行采样处理并且仅使用少量诱导点;假设给定训练集x1-xn,所对应的函数值为y1-yn,假设函数f(x)是四旋翼飞行器在真实环境下的动力学函数,N为高斯噪声,即:
y=f(x)+N (5)
公式(5)中,f(x)是四旋翼飞行器在真实环境下的动力学函数,N为高斯噪声;
其中N~(0,σ2 n),协方差函数选择径向基函数核即:
公式(6)中,(x-x')2为平方欧几里得距离,l是一个自由参数;根据以上写出加入噪声后的k(x,x')为:
公式(7)中,其中σf,σn分别表示数据和先验噪声方差;
至此,基本模型已经完成建模,需要对新的输入x*求出它所对应的y*;
K*=[k(x*,x1) k(x*,x2) … k(x*,xn)]K**=k(x*,x*) (8)
公式(8)中,x*为新的输入,y*为对应的新的输出,K*为不断迭代新的输入而产生的过渡矩阵;
接下来根据联合分布求出预测数据y*的条件分布p(y*|y),经过推导得到其条件分布也是高斯分布,如下:
公式(9)中,y*是新的输出值,y*取值服从
对y*的估计,用分布的均值来作为其估计值,即:
公式(10)中,是输出y*的估计值,K*K-1y是高斯分布所求均值;
给定高斯分布的均值和协方差,在修正后的模型预测控制中使用;
步骤3:模型预测控制,基于模型的闭环优化控制策略,在每一个采样时刻,根据获得的当前测量信息,在线求解一个有限时间闭环优化问题,并将得到的控制序列的第一个元素作用于被控对象;在下一个采样时刻,重复上述过程:用新的测量值作为当前时刻预测系统未来动态的初始条件,刷新优化问题并重新求解。
优选的,所述步骤3中模型预测控制算法包括:预测模型、滚动优化和反馈控制三部分;
预测模型采用高斯过程根据系统当前的和历史的输入输出信息预测未来的输出值;
反馈校正的作用是校正预测输出值yp与实际输出值y之间的误差e,使误差e尽可能小,提高模型准确性;
e(k)=y(k)-yp(k) (11)
公式(11)中,e(k)是预测输出与实际输出的误差,y是实际输出值,yp是预测输出值,k是在任意某一时刻状态;
滚动优化的作用是根据预测输出值yp与参考轨迹yr的差值计算最优控制量u(k);
公式(12)中,yr(k+i)是任意k+i时刻参考轨迹,yp(k+i)是在任意k+i时刻预测输出值,minJ是二次性能函数,用来获取模型最优控制解;
u(k)=yp(k)-yr(k) (13)
公式(13)中,yr(k)是任意k时刻参考轨迹,yp(k)是在任意k时刻预测输出值,u(k)为最优控制信号;
在该控制算法中,模块1是预测模型,2是参考轨迹,3是滚动优化,4是预测输出,5是四旋翼飞行器,c表示系统的设定输出,yr表示参考轨迹,u为输入,y为实际输出值,ym为模型输出,yp为预测输出,e为误差;假设期望输入值为c,为获取k时刻下的控制输入u(k),该闭环控制法主要流程为:首先经过模块2求取k时刻的参考轨迹yr,然后通过模块1预测模型来求取模型输出ym,通过闭环反馈校正4求取预测输出yp,根据公式(11)计算预测误差,最终根据公式(12)通过模块3求出二次型性能函数minJ获得最优控制解,计算出此时的最优控制u(k)作为第一个控制信号,作为受控对象的输入,然后重新计算当前时刻参考轨迹,从而不断调整控制信号。
(三)有益效果
本发明提供了一种融合高斯过程的飞行器轨迹控制方法。具备以下有益效果:
(1)本发明的飞行器轨迹模型预测控制方法将高斯过程与三维飞行器动力学模型结合起来,在真实环境中收集真实数据具有一定的高效性和可靠性;
(2)本发明的飞行器轨迹模型预测控制方法通过对训练样本中数据集进行采样来降低模型预测控制过程中的优化难度,提高模型预测控制的稳定性;
(3)本发明的飞行器轨迹模型预测控制方法在传统已有的控制方法上,通过融合高斯过程作为控制系统的预测方法进行了创新与突破。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的一种融合高斯过程的飞行器轨迹控制方法主要包括以下三部分:三维数据收集、高斯过程建模和模型预测控制。
本发明中所提出的融合高斯过程的模型预测控制须设计为最大化性能,同时将计算成本最小化。首先用小写v表示向量,我们定义了具有正交基的飞行器三维模型B,即{xB、yB、zB},如图1所示为四旋翼飞行器三维模型示意图。接着调整训练数据集,使得学习问题设置是识别从飞行器速度Bv到飞行器加速度扰动Bae的映射,所以:
Bae=μ(Bv) (1)
用动力学模型收集真实的飞行数据,对于tk时刻的每个样本,记录下一个采样点Bvk+1的速度和下一个采样点Bvk+1的预测速度,以及时间步长δtk。然后可以计算出时间归一化的速度误差,对应于加速度误差:
第二步是高斯过程建模。此时利用高斯过程预测下一过程并在每个时间序列进行闭环校正。由于高斯过程的复杂性与训练集的数量成线性关系,如果使用全部的数据集会增加模型预测控制的优化难度,所以对数据集进行采样处理并且仅使用少量诱导点。假设给定训练集x1-xn,所对应的函数值为y1-yn,假设函数f(x)是四旋翼飞行器在真实环境下的动力学函数,N为高斯噪声,即:
y=f(x)+N
其中N~(0,σ2 n),协方差函数选择squared exponential形式,即:
其中σf,σn分别表示数据和先验噪声方差。
根据以上可写出加入噪声后的k(x,x')为:
至此,基本模型已经完成建模,需要对新的输入x*求出它所对应的y*。
K*=[k(x*,x1) k(x*,x2) … k(x*,xn)]K**=k(x*,x*)
接下来可以根据联合分布求出预测数据y*的条件分布p(y*|y),经过推导可得到其条件分布也是高斯分布,如下:
对y*的估计,用分布的均值来作为其估计值,即:
给定高斯分布的均值和协方差,也可以在修正后的模型预测控制中使用。
第三步是模型预测控制,基于模型的闭环优化控制策略,在每一个采样时刻,根据获得的当前测量信息,在线求解一个有限时间闭环优化问题,并将得到的控制序列的第一个元素作用于被控对象。在下一个采样时刻,重复上述过程:用新的测量值作为当前时刻预测系统未来动态的初始条件,刷新优化问题并重新求解。如图2所示是模型预测控制算法流程图,该算法主要包括:预测模型、反馈校正和滚动优化三部分。
预测模型采用高斯过程根据系统当前的和历史的输入输出信息预测未来的输出值;
反馈校正的作用是校正预测输出值yp与实际输出值y之间的误差e,使误差e尽可能小,提高模型准确性;
e(k)=y(k)-yp(k)
滚动优化的作用是根据预测输出值yp与参考轨迹yr的差值计算最优控制量u(k)。
u(k)=yp(k)-yr(k)
如图3所示是模型预测控制法的原理框图,在该控制系统中,模块1是预测模型,2是参考轨迹,3是滚动优化,4是预测输出,5是控制对象(四旋翼飞行器),c表示系统的设定输出,yr表示参考轨迹,u为输入,y为实际输出值,ym为模型输出,yp为预测输出,e为误差。
假设期望输入值为c,为获取k时刻下的控制输入u(k),该闭环控制法主要流程为:首先经过模块2求取k时刻的参考轨迹yr,通过模块1预测模型来求取模型输出ym,通过闭环反馈校正4求取预测输出yp,根据公式(11)计算预测误差,最终根据公式(12)通过模块3求出二次型性能函数minJ获得最优控制解,计算出此时的最优控制u(k)作为第一个控制信号,作为受控对象的输入,然后重新计算当前时刻参考轨迹,从而不断调整控制信号。
该控制方法具有如下优势:一是将高斯过程的预测紧密地融合到模型预测控制中,在控制方法上进行了创新与突破,二是优化训练样本,对数据集进行采样降低模型预测控制过程中的优化难度;三是该控制方法结构简单、灵活便捷,考虑到真实飞行器的速度多变,本发明所收集的训练样本适用性较强;四是该控制方法通过新的测量值作为下一时刻的输入值,实时反馈控制较强,同时相对于其他解决方案大大降低了误差,并提升了可靠性。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。