接近并跟踪空间非合作目标的有限时间容错控制方法
技术领域
本发明涉及一种接近并跟踪空间非合作目标的有限时间容错控制方法。
背景技术
随着航天事业的快速发展,空间技术逐渐从最初的空间利用提升为空间控制,空间打击、跟踪监视、交会对接等问题的研究越来越受到航天大国的关注和重视,其中对空间非合作目标的接近和近距离跟踪监视问题已经成为当今航天领域的一个非常重要的研究热点,空间非合作目标泛指一些无法提供有效合作信息的空间物体,包括空间碎片、失效的飞行器以及敌方飞行器等。随着航天器机动性的增强,跟踪监视的精度、范围等要求也越来越高,干扰和打击的难度更是进一步加大,因此,研究航天器控制具有非常重要的意义。
航天器控制分为航天器轨道控制和航天器姿态控制。航天器轨道控制指对航天器的质心施加外力,以改变其运动轨迹的技术,如轨道转移、轨道调整或保持等。航天器姿态控制是获取并保持航天器在太空定向(即航天器相对于某个参考坐标系的姿态)的技术,包括姿态稳定和姿态机动两个方面。前者为保持已有姿态的过程,后者是把航天器从一种姿态转变为另一种姿态的再定向过程。
常用的跟踪监视形式有悬停(追踪航天器与目标保持相对位置不变)、伴随飞行(追踪航天器围绕目标附近某点进行封闭轨迹飞行)和绕飞(伴随飞行的一种特殊情况,封闭轨迹的中心是目标质心)等,但对于本文所研究的问题,由于目标存在姿态翻滚,并要求追踪航天器要始终位于特征点方向来跟踪监视,所以这三种形式不适用。
现有控制方法经典的相对运动动力学模型中,无论是只适用于近圆轨道的C-W方程还是考虑了轨道偏心率非零情况的Lawden方程,当针对非合作目标时,由于对目标的一些运动参数难以精确测量而无法有效使用,从接近非合作目标时的实际测量情况出发,例如一种在以追踪航天器质心为原点的视线坐标系下建立的相对运动模型,具有不限制目标航天器轨道偏心率、解算方程对目标未知参数不作要求、可在任意初始位置进行逼近和视线跟踪这三大优点,本发明专利在视线坐标系的基础上,还综合考虑体坐标系下由姿态角及角速度描述的相对姿态方程,从而建立了六自由度的动力学模型。
除了普遍存在模型的不确定性和外部干扰外,对于追踪航天器来说,非合作目标的一些运动信息也是无法精确已知的,现有追踪航天器对未知信息的确定能力差。
控制算法方面
相对轨道与姿态的控制耦合问题主要有两方面原因,一种是由期望控制指令引起的,另一种则是因为推力与姿态有关而导致的,对于姿态轨道耦合控制,许多学者都有所研究,例如从HJB方程中导出了鲁棒性较好且能方便使用的状态依赖黎卡提方程法(SDRE),可以用来解决一些含有不确定性的鲁棒问题,但在线求解黎卡提方程使计算负担增大了,在进行姿轨耦合控制时,以能量消耗和误差最小为指标,引入中间变量θ和D,将SDRE方程转化为迭代代数方程,从而减轻了计算负担,但这种θ-D控制方法在非合作目标同时存在轨道和姿态机动时,控制误差较大。
发明内容
本发明的目的是为了解决现有追踪航天器的对非合作目标进行视线跟踪时存在追踪控制误差大导致的跟踪监视精度低的问题,而提出一种接近并跟踪空间非合作目标的有限时间容错控制方法。
对于实际的航天器控制,一定存在控制输入饱和、死区等非线性特性,因此本发明在进行姿态轨道控制律设计时考虑了非线性特性对控制效果的影响。
一种接近并跟踪空间非合作目标的有限时间容错控制方法,所述方法通过以下步骤实现:
步骤一、在视线坐标系下分别建立分量形式的相对轨道动力学模型: 和追踪航天器本体坐标系下的相对姿态动力学模型:
并定义追踪航天器绕本体x、y、z轴的转角分别=为θ、ψ,按照欧拉角转序,得到姿态角速度与姿态角之间的导数关系:
式中,ρ表示追踪航天器与目标航天器之间的相对距离,qε表示视线倾角,qβ表示视线偏角,△gx、△gy、△gz表示目标航天器和追踪航天器之间的引力差项分量,且在近距离接近和跟踪段,引力差项可以忽略不计,fx、fy、fz表示目标航天器的加速度分量,对于非合作目标来说是未知的;ucx、ucy、ucz表示追踪航天的控制力加速度分量;下标b表示体坐标系,c表示追踪航天器,上标×表示向量的反对称矩阵,Jc=[Jc1Jc2Jc3]T表示追踪航天器的转动惯量矩阵,ωbc=[ωxωyωz]T表示追踪航天器相对惯性坐标系的姿态角速度,Tc表示追踪航天器控制力矩;
步骤二、联立方程组: 求得视线倾角和视线偏角的期望值qεf和qβf及其导数和其中,ρi为追踪航天器的期望方向在惯性系下的投影矢量,xi,yi,zi为ρi的分量,nb为目标航天器特征点在其体坐标系下的单位矢量指向,为目标体坐标系到惯性系下的转换矩阵,ρf为追踪航天器相距目标的期望距离,为视线坐标系到惯性坐标系的转换矩阵,ωbt,i为目标体坐标系相对于惯性坐标系的转动角速度在惯性坐标系下的投影,ωbt为目标航天器相对于惯性坐标系的姿态角速度;
联立方程组: 求得姿态角的期望值θf、ψf,求导后结合式(3)可求得姿态角速度的期望值ωxf、ωyf、ωzf;其中,xbcf,ybcf,zbcf为追踪航天器本体轴方向的期望单位矢量,为太阳光线在惯性系下的矢量方向,为惯性系到追踪航天器本体系下的转换矩阵,I3为三阶单位阵;
在接近并跟踪空间非合作目标过程中,初始时刻由于非合作目标航天器的轨道机动未知,需要通过调整追踪航天器的相对轨道并进行保持以达到跟踪监视非合作目标航天器的要求,而初始时刻目标航天器的姿态信息是能够获取的,因此追踪航天器的姿态接近期望姿态,则下式近似成立:
选取误差量为状态变量,记 由式(6)结合式(1)、式(2)和式(3)得到系统的状态空间表达式:
其中,令A表示系统的状态空间表达式(7)中矩阵的简记;
步骤三、设计辅助控制器:ν(x1)=-A-1(x1)K1sig(x1)α;并定义误差变量:z=x2-ν(x1);
采用反步法设计控制器: 使追踪航天器在有限时间内收敛到期望的姿态和轨道,并保持在允许的误差范围内;式中,表示辅助控制器的导数;K1=diag(k11...k16),且K1>0,0<α<1,K2=diag(k21...k26)>0,K3>0;和是网络加权矩阵的估计值,φ(x)和φ△(y)均为高斯RBF函数向量,高斯RBF函数向量的表达式:φ(ζ)=[φ1(ζ),...,φ6(ζ)]T,
步骤四、设计RBF神经网络的自适应律为:和利用RBF神经网络的自适应地分别对不确定项w(x)和控制偏差项g(x)△u进行自适应估计,补偿系统的不确定性、非合作目标运动参数部分未知、控制输入饱和、死区;其中,Γ和Γ△是正定的斜对角矩阵。
本发明的有益效果为:
在空间非合作目标航天器进行姿态翻滚并存在未知的轨道机动时,除了普遍存在模型的不确定性和外部干扰外,对于追踪航天器来说,非合作目标的运动信息也无法精确已知,本发明使用RBF神经网络自适应地逼近这些未知信息,从而对不确定性及外部干扰进行补偿,且相比于非有限时间收敛的控制方法,本发明所采用的有限时间控制方法不仅收敛更快,还具有更好的鲁棒性。在空间非合作目标航天器进行姿态翻滚并存在未知的轨道机动时,实现航天器轨道控制和姿态控制,使追踪航天器接近非合作目标航天器,并进行视线跟踪,提高了跟踪监视的精度。
附图说明
图1为本发明方法的流程图;
图2为本发明涉及的地心惯性坐标系Oixiyizi与视线坐标系Olxlylzl及其关系示意图;
图3为追踪航天器在接近和跟踪非合作目标航天器过程中,轨道相关参数随时间变化的曲线;
图4为追踪航天器在接近和跟踪非合作目标航天器过程中,姿态角随时间变化的曲线;
图5为追踪航天器三轴控制加速度随时间变化曲线;
图6为追踪航天器三轴控制力矩随时间变化曲线;
图7为追踪航天器轨道姿态参数与相应的期望参数之间的偏差随时间变化曲线;
具体实施方式
具体实施方式一:
本实施方式的接近并跟踪空间非合作目标的有限时间容错控制方法,如图1所示的流程图,所述方法通过以下步骤实现:
步骤一、在视线坐标系下分别建立分量形式的相对轨道动力学模型: 和追踪航天器本体坐标系下的相对姿态动力学模型:
并定义追踪航天器绕本体x、y、z轴的转角分别=为θ、ψ,按照欧拉角转序,得到姿态角速度与姿态角之间的导数关系:
式中,ρ表示追踪航天器与目标航天器之间的相对距离,qε表示视线倾角,qβ表示视线偏角,△gx、△gy、△gz表示目标航天器和追踪航天器之间的引力差项分量,且在近距离接近和跟踪段,引力差项可以忽略不计,fx、fy、fz表示目标航天器的加速度分量,对于非合作目标来说是未知的;ucx、ucy、ucz表示追踪航天的控制力加速度分量;下标b表示体坐标系,c表示追踪航天器,上标×表示向量的反对称矩阵,Jc=[Jc1Jc2Jc3]T表示追踪航天器的转动惯量矩阵,ωbc=[ωxωyωz]T表示追踪航天器相对惯性坐标系的姿态角速度,Tc表示追踪航天器控制力矩;
步骤二、联立方程组: 求得视线倾角和视线偏角的期望值qεf和qβf及其导数和其中,ρi为追踪航天器的期望方向在惯性系下的投影矢量,xi,yi,zi为ρi的分量,nb为目标航天器特征点在其体坐标系下的单位矢量指向,为目标体坐标系到惯性系下的转换矩阵,ρf为追踪航天器相距目标的期望距离,为视线坐标系到惯性坐标系的转换矩阵,ωbt,i为目标体坐标系相对于惯性坐标系的转动角速度在惯性坐标系下的投影,ωbt为目标航天器相对于惯性坐标系的姿态角速度;
联立方程组:
求得姿态角的期望值θf、ψf,求导后结合式(3)可求得姿态角速度的期望值ωxf、ωyf、ωzf;其中,xbcf,ybcf,zbcf为追踪航天器本体轴方向的期望单位矢量,为太阳光线在惯性系下的矢量方向,为惯性系到追踪航天器本体系下的转换矩阵,I3为三阶单位阵;
针对本发明所研究的问题,考虑到对于追踪航天器而言,非合作目标航天器的轨道机动为未知,任务初始时刻追踪航天器的相对轨道是偏离期望轨道的,需通过调整追踪航天器的相对轨道并进行保持以达到跟踪监视非合作目标航天器的要求,而初始时刻目标航天器的姿态信息是能够获取的,因此追踪航天器的姿态接近期望姿态,则下式近似成立:
选取误差量为状态变量,记 由式(6)结合式(1)、式(2)和式(3)得到系统的状态空间表达式:
其中,令A表示系统的状态空间表达式(7)中矩阵的简记;;
步骤三、设计辅助控制器:ν(x1)=-A-1(x1)K1sig(x1)α;并定义误差变量:z=x2-ν(x1);
采用反步法设计控制器: 使追踪航天器在有限时间内收敛到期望的姿态和轨道,并保持在允许的误差范围内;式中,表示辅助控制器的导数;K1=diag(k11...k16),且K1>0,0<α<1,K2=diag(k21...k26)>0,K3>0;和是网络加权矩阵的估计值,φ(x)和φ△(y)均为高斯RBF函数向量,高斯RBF函数向量的表达式:φ(ζ)=[φ1(ζ),...,φ6(ζ)]T,
步骤四、设计RBF神经网络的自适应律为:和利用RBF神经网络的自适应地分别对不确定项w(x)和控制偏差项g(x)△u进行自适应估计,补偿系统的不确定性、非合作目标运动参数部分未知、控制输入饱和、死区;其中,Γ和Γ△是正定的斜对角矩阵。
具体实施方式二:
与具体实施方式一不同的是,本实施方式的接近并跟踪空间非合作目标的有限时间容错控制方法,步骤一所述建立分量形式的相对轨道动力学模型的过程为,设地心惯性坐标系Oixiyizi和视线坐标系Olxlylzl及其关系,如图1所示的地球、目标航天器和追踪航天器的相对位置向量,Ol是视线坐标系的原点,位于追踪航天器质心,xl轴与视线重合,即由追踪航天器指向目标航天器,yl轴位于由xl轴和yi轴共同组成的纵向平面内,与xl轴垂直,zl轴由右手法则确定;qε为视线倾角,qβ为视线偏角,ρ为目标航天器相对于追踪航天器的位置矢量;则地心惯性坐标系Oixiyizi下的动力学方程在视线坐标系Olxlylzl下的投影为: (10);其中,上标×表示向量的反对称矩阵;△g=[△gx△gy△gz]T表示目标航天器和追踪航天器之间的引力差项,在近距离接近和跟踪段,引力差项可以忽略不计;f=[fxfyfz]T表示目标航天器的加速度矢量,对于非合作目标来说是未知的;uc=[ucxucyucz]T表示追踪航天的控制力加速度矢量;将地心惯性坐标系Oixiyizi下的动力学方程在视线坐标系Olxlylzl下的投影写成分量的形式,得:
具体实施方式三:
与具体实施方式一或二不同的是,本实施方式的接近并跟踪空间非合作目标的有限时间容错控制方法,其特征在于:步骤一所述得到姿态角速度与姿态角之间的导数关系的过程为,定义追踪航天器绕本体x、y、z轴的转角分别为θ、ψ,则欧拉角描述的姿态矩阵为:
追踪航天器的姿态角速度:
为表示简单,定义矩阵:
则有姿态角:
具体实施方式四:
与步骤三所述采用反步法设计控制器的过程为,针对接近并跟踪非合作机动目标事件,由式(7)和式(8)所组成的系统可以概括为一类二阶不确定非线性动态系统:
其中,
满足0≤||w(x)||≤d,
且A(x1)与g(x)非奇异;
D(u)=[ucx,ucy,ucz,Tcx,Tcy,Tcz]T为实际控制输入,因此其与理想控制输入u、控制偏差△u之间满足如下关系式:D(u)=u-△u;
设辅助控制器ν(x1)=-A-1(x1)K1sig(x1)α,其中:K1=diag(k11...k16)>0,0<α<1,
定义误差变量:z=x2-ν(x1),
则控制器为:
具体实施方式五:
与具体实施方式一、二或四不同的是,本实施方式的接近并跟踪空间非合作目标的有限时间容错控制方法,步骤三所述RBF神经网络对不确定项w(x)和控制偏差项g(x)△u进行自适应估计的过程为,将步骤三得到的控制器: 代入非线性系统后得到: 用两个三层的RBF神经网络分别自适应地估计不确定项w(x)和控制偏差项g(x)△u,对非线性系统进行补偿,w(x)的估计值以及g(x)△u的估计值分别表示为:
其中:x和y表示网络输入向量,y=[xT,uT]T,和表示网络加权矩阵的估计值,φ(x)和φ△(y)均为高斯RBF函数向量φ(ζ)=[φ1(ζ),...,φ6(ζ)]T,ci∈Rn表示第i个基函数的中心,σi>0表示第i个基函数的宽度。
根据RBF神经网络的普遍近似原理,给出如下假设:
假设1:对于任意给定的小的正数εN和ε△N,总能找到最优加权矩阵θ*和使近似误差满足:||ε(x)||∞=||θ*Tφ(x)-w||∞<εN,
假设2:最优加权矩阵θ*和是有界的,存在正常数λ和λ△满足||θ*||∞≤λ和
因此,不确定项w(x)和控制偏差项g(x)△u可以分别表示成
w(x)=θ*Tφ(x)+ε,
Barbalat引理:设x:[0,∞)→R一阶连续可导,且当t→∞时有极限,则存在且有界,则
李雅普诺夫渐近稳定判据:设系统的状态方程为如果存在标量函数V(x)满足
(1)V(x)对所有x具有一阶连续偏导数
(2)V(x)是正定的
(3)若是负定的,或者为半负定,对任意初始状态x(t0)≠0,除去x=0外,有不恒为0,则平衡状态xe=0是渐近稳定的,当||x||→∞,有V(x)→∞,则在原点处的平衡状态是全局渐近稳定的。
所谓有限时间控制问题就是能够在有限时间内使系统收敛到平衡点。
引理1:对于下列非线性系统:
假设存在定义在Rn原点邻域内的连续函数V(x),且实数c>0,0<α<1,满足:
(1)V(x)在中正定
(2)
则系统的原点是局部有限时间稳定,所谓有限时间控制问题就是能够在有限时间内使系统收敛到平衡点。稳定时间取决于初始状态x(0)=x0,满足:
对于原点一些开邻域中的所有x0成立。若且V(x)径向无界(V(x)→+∞时,||×||→+∞),则系统的原点是全局有限时间稳定。
引理2:对于任意实数li,i=1,...,n,若0<γ<1且0<λ<2,则以下不等式成立:
(|l1|+…+|ln|)γ≤|l1|γ+…+|ln|γ
(|l1|2+…+|ln|2)λ≤(|l1|λ+…+|ln|λ)2
定理:对于不确定非线性动态系统,控制器设计为
RBF神经网络自适应律分别为:
其中,K2=diag(k21...k26)>0,K3>0,Γ和Γ△是正定的斜对角矩阵,假设1和假设2均成立,则闭环系统是全局有限时间稳定的。
证明:将控制律代入式(16)表示的系统可得
第一步,证全局渐近稳定:
设 则 选取李雅普诺夫函数:
令K3>εN+ε△N>||ε||∞+||ε△||∞,由式(17)表示的系统可得
从上式可得x1和z有界,由ν(x1)和z的定义可知x2也有界,对于绝大多数系统,是有界的,因此由Barbalat引理可知,当t→∞时,x1→0,z→0,x2→0,式(16)表示的闭环系统是全局渐近稳定的。
第二步,证全局有限时间稳定:
由高斯RBF函数的定义可知高斯函数0<φi(ζ)≤1,则||φ(x)||∞和||φ△(y)||∞有界,再由相容性
可得和也有界,选取李雅普诺夫函数:
令 由式(17)表示的系统可得:
其中,μ=(1+α)/2,1/2<μ<1,k1min=min{k1i},k2min=min{k2i},
因此,根据引理1,对于给定的初始状态x(0)=x0,x1和z将在有限时间T之内收敛到0,T为稳定时间。由ν(x1)和z的定义可知,当x1=0,z=0时,x2=0,式(16)表示的闭环系统是全局有限时间稳定的。
由于sig(x1)α在x1i=0且时的微分为无穷大,为了避免这种奇异问题,设置一个阈值λ来判断奇异,因此定义如下
其中λ和△i都是小的正常数,x1i是向量x1的第i个元素,ηi(x1i)是向量η(x1)中的第i个元素。
本发明方法仿真实验:
设追踪航天器相对目标的初始距离为260m,首先接近到距目标100m处,然后再进行视线跟踪,允许的误差范围为|eρ|≤0.01m,
目标航天器初始位置在地心惯性坐标系中为[2000,0,0]m,初始本体坐标系与地心惯性坐标系对齐,运行过程中角速度在本体坐标系中为[-0.00250.002-0.002]rad/s,特征点在本体坐标系中的单位方向矢量为轨道机动在惯性系中的表示为[0.2cos(0.15t)0.1sin(0.1t)0.15cos(0.2t)]m/s2。
追踪航天器初始视线倾角为0.9rad,初始视线偏角为-1.8rad,初始姿态角为[0.05,-0.6,2.4]rad,设太阳光照方向为转动惯量Jc=[30,25,20],每轴所能提供的最大控制加速度为5m/s2,最大控制力矩为1Nm,死区特性满足式(18)和式(19);K1=diag(0.28,0.05,0.1,1,1,4),K2=diag(6.5,2,2.6,0.8,0.36,0.4),K3=1×10-7,α=0.8,λ=0.01,△i=0.01,仿真时间1000s,定步长0.1s。
(18) (19)。
仿真结果及分析
图3为追踪航天器在接近和跟踪非合作目标航天器过程中,轨道相关参数随时间变化的曲线,包括相对距离、视线倾角和视线偏角,从局部放大图中可以看出,经过20s左右,追踪航天器从相距目标260m接近到100m,并保持跟踪上了期望轨道。
图4为追踪航天器在接近和跟踪非合作目标航天器过程中,姿态角随时间变化的曲线,可以看出,经过20s左右,姿态角快速趋向于期望值,并长时间保持在期望值附近,实现对非合作目标航天器特定方向的指向。
通过表格1可以更加清晰地看到各个状态进入到允许误差范围内的时间td,并且,在第23秒后,各状态都跟踪上了期望信号,可以把前23秒看作调整接近非合作目标航天器的过程,23秒之后为保持跟踪的过程。
图5和图6分别是追踪航天器三轴控制加速度和控制力矩随时间变化曲线,可以看出,前几十秒所需的控制加速度和控制力矩较大,因为初始阶段,轨道和姿态与期望值之间相差较大,由于非合作目标航天器存在未知的加速度,所以图5中的控制加速度也时刻变化以使追踪航天器时刻跟踪上期望轨道,由于非合作目标保持缓慢的转动,所以当实际姿态跟踪上期望姿态以后,追踪航天器所需的控制力矩就非常小了。
图7为追踪航天器轨道姿态参数与相应的期望参数之间的偏差随时间变化曲线,可以看出,当跟踪上期望信号之后,能够保持实际的轨道姿态参数偏离期望值非常小。
表格1各状态进入允许误差范围的时间d