CN110110342B

CN110110342B - 一种基于邻近算法的组合体航天器数据驱动控制方法

Info

Publication number: CN110110342B
Application number: CN201811508943.XA
Authority: CN
Inventors: 张宪亮; 吕跃勇; 高寒; 贺亮; 宋婷; 袁建平; 刘昱晗
Original assignee: Shanghai Aerospace Control Technology Institute
Current assignee: Shanghai Aerospace Control Technology Institute
Priority date: 2018-12-11
Filing date: 2018-12-11
Publication date: 2023-08-25
Anticipated expiration: 2038-12-11
Also published as: CN110110342A

Abstract

一种基于邻近算法的组合体航天器数据驱动控制方法，包括如下步骤：建立组合体航天器运动模型；基于邻近算法的数据驱动姿态控制器设计；初始化控制器参数并建立数据库；利用公式计算系统的预测值利用公式计算系统的预测输出；计算控制器；更新数据库中的数据；对k进行赋值k＝k+1，并进行迭代，有效地调整控制器的输出。

Description

一种基于邻近算法的组合体航天器数据驱动控制方法

技术领域

本发明涉及一种基于邻近算法的组合体航天器数据驱动控制方法。

背景技术

随着空间技术的发展，全球每年卫星发射数量在逐步增加，但卫星在轨失效的数目也在逐步增加。当航天器达到寿命末期时，大部分情况下其有效载荷仍然能够继续工作，但由于推进系统携带的燃料耗尽或执行机构失效，从而使其丧失了三轴姿态控制能力和轨道位置保持能力，若能够恢复其姿态与轨道控制能力，则可使其继续在轨工作。采用接管控制技术来延长航天器在轨寿命为合理处置这些失效卫星提供了一种新思路。目标航天器接管控制主要是指服务航天器通过空间机械手、对接机构或者其它设备与目标航天器固连形成组合体后，接管其姿态控制功能，通过自身的执行机构来实现对目标航天器姿态的精确控制。当服务航天器完成对目标的抓捕后，与目标航天器形成一新的航天器，我们称之为组合体航天器。此外由于非合作目标航天器无交会对接相关辅助设备，与其进行对接比较困难，在采用空间机器人对其进行抓捕的过程中存在无法捉牢的情况，导致在组合体航天器的姿态调整过程中，目标航天器与服务航天器之间存在相对运动，相对运动可能包括相对滑动以及相对转动，我们称之为非完全约束组合体航天器。

由于目标航天器的质量特性参数未知，这种参数的不确定性和未知性给目标航天器的精确姿态接管控制带来了很大的挑战。此外，空间机器人抓捕目标后形成的非完全约束组合体属于变参数变构型的非线性强耦合时变系统，具有参数变化大、构型突变、动力学强耦合等新特性。为了完成非完全约束组合体航天器的精确姿态控制，需要根据被控对象的自身特点采用合适的控制方案对其进行控制。而目前国内外关于非完全约束组合体航天器的姿态控制问题研究的较少，在理论研究和验证实验方面都比较欠缺，且存在很多未解决的关键技术问题。根据国内外文献的调研情况来看，对于组合体航天器姿态控制方案主要有两类：

1、当服务航天器的抓捕目标质量特性以及运动特性已知，或目标航天器对组合体航天器带来的附加扰动对组合体航天器的动力学特性影响较小时，可以将组合体航天器等效为一个动力学方程已知同时附加一部分未知干扰的模型进行控制。而针对此类组合体航天器从古典控制理论到现代控制理论都得到了应用。采用的方法包括最初的PID控制方法、鲁棒控制方法、滑模变结构控制方法、自适应控制方法等。中外学者尝试着从新的控制理论和控制方法中寻找到一些合适的方法，并将他们应用于组合体航天器的控制回路中以解决这些问题，实现高品质的控制。

2、当组合体航天器中，由于对目标的非完全约束抓捕而给整个系统带来的影响使得系统的动力发生剧烈变化时，基于标称模型+不确定性的处理方法可能已不再适用，针对这一类模型完全未知的系统，有专家学者提出一种基于数据的控制方案。Zhang[1]等人针对一类未知的非线性系统，基于近似动态规划的思想，提出了一类近似最优控制器。Luo[2]等人针对旋转/平移执行系统，提出了一种基于数据驱动近似策略迭代，设计了一类最优控制器。Ji[3]等人将数据驱动无模型自适应控制与最优控制的思想相结合，提出了无模型自适应最优控制，并将其应用于气动弹性系统控制中。Wang[4]等人针对多自由机器人外骨骼的控制问题，提出了一种数据驱动无模型自适应滑模控制器。王东巍[5]以及Song[6]针对刚体航天器的姿态控制问题，研究了基于无模型自适应的数据驱动控制，在无需航天器结构及参数信息的情况下，达到了预期的姿态控制目标([1]金国光,刘又午,王树新,等.带有空间伸展机构的复杂航天器柔性多体动力学分析[J].中国机械工程,2000,11(6):650-653.[2]白圣建,黄新生.快速机动大型挠性航天器的动力学建模[J].航空学报,2009,30(10):1985-1992.[3]刘云平.航天器多体系统姿态动力学与控制的研究[D].南京航空航天大学,2009.[4]陈志煌,陈力.闭链双臂空间机器人动力学建模及变结构控制[J].力学季刊,2012,33(4):565-570.[5]胡庆雷,王永智,石忠.自由漂浮空间机器人力矩最优轨迹规划算法[J].哈尔滨工业大学学报,2011,43(11):20-24.[6]Agrawal S K,Pathak K,FranchJ,et al.Design of a differentially flat open-chain space robot witharbitrarily oriented joints and two momentum wheels at the base[C]//Roboticsand Automation,2006.ICRA 2006.Proceedings 2006 IEEE International Conferenceon.IEEE,2006:3867-3872.)。

由于被控对象特性较为复杂，难以建立准确的数学模型对其进行精确描述，因此对非完全约束组合体航天器进行姿态控制时，适合采用基于数据驱动的控制方法。

组合体航天器主要是指服务航天器通过空间机械手、对接机构或者其它设备与目标航天器固连形成多体航天器系统。形成组合体航天器后，服务航天器接管其姿态与轨道控制功能，并通过自身的执行机构来实现对目标航天器姿态与轨道的精确控制。由于目标航天器无交会对接相关辅助设备，与其进行交会对接比较困难，故采用空间机器人对其进行抓捕更具有普遍性，比如美国的SUMO/FREND项目就是采用三臂空间机器人抓捕目标航天器的星箭对接环或者分离螺栓等部件后形成组合体，接管目标航天器的姿态和轨道控制系统，为其提供位置保持、姿态控制、轨道修正、拖曳离轨等服务。

获得并保持卫星在空间定向的技术叫做卫星的姿态控制，这种指向一般是指相对于某参考系的姿态。对于在轨的卫星，要求其姿态以给定的要求或规律变化。

对于卫星的姿态控制可以分成两类，即被动和主动控制。两种类型相结合又可以衍生出其他的控制类型。其中被动控制主要是指利用各种环境条件，如重力梯度、气动、太阳辐射以及地磁等产生力矩控制卫星姿态。这种控制的特点在于不消耗星上能源，其缺点主要在于属于开环控制，且受环境影响较大，一般需要较长控制时间。主动控制则是指利用卫星自身的姿态确定环节、姿态控制器环节、执行机构等环节的联合作用，形成闭环反馈的控制方式。按稳定方式主要分为自旋稳定和三轴稳定。

卫星姿态控制系统包括控制算法和执行机构的设计。姿态控制主要有姿态调节、跟踪和机动等方面。其中姿态调节是指星体在轨期间，抵御内外各种干扰力矩的影响，保持一定的姿态，并达到要求的姿态角稳定精度和角速度稳定度。姿态机动则是指星体从一个姿态转动到另一个姿态的重新定向并调节过程。姿态跟踪是使星体的姿态按给定轨迹变化，实现对目标定向的任务。本论文主要对姿态跟踪控制部分进行深入研究。

针对完全未知的被控对象，有专家学者提出一种基于数据的控制方案。数据驱动控制的定义是：“控制器设计不包含受控过程数学模型信息，仅利用受控系统的在线和离线I/O数据以及经过数据处理而得到的知识来设计控制器，并在一定的假设下，有收敛性、稳定性保障和鲁棒性结论的控制理论与方法。”简单的讲，就是直接从数据到控制器设计的控制理论和方法。纵观控制理论发展的历史，大概可以分为三个阶段：基于传递函数模型的经典控制论阶段(20世纪50年代末期以前)、基于状态空间模型的现代控制论阶段(50年代末期至70年代初期)、弱化被控系统模型影响且具有自学习能力的智能控制理论阶段(70年代初期至现在)。可以看到，探索一种能够不依赖于被控系统参数数学模型的控制理论与技术符合控制理论的螺旋式发展趋势，数据驱动控制即是在这种情况下逐渐被重视起来。

邻近算法也称为k-邻近算法(K-Near Neighbour，K-NN)，是一种分类算法，属于机器学习算法的一种。1968年由Cover和Hart提出，应用场景有字符识别、文本分类、图像识别等领域。该算法以待分类的元素为中心，沿各个方向搜索，直到搜索到k个用户指定的训练元素为止。然后，就将待分类元素划分到所搜索的大多数像元所属的类别中[61]。K-NN是基于统计的分类方法，K-NN首先搜索未知样本的K个近邻已知类别的训练样本，将未知样本归于这K个近邻中多数样本所属的那一类。其具体实现过程由图1所示，红色(深)、绿色(浅)，假如我们要确定上图中的蓝色的点真正的颜色是什么，我们就划定一个范围，找到与它最近的9个邻居，在这9个邻居中有5个是绿色的4个是红色的，那么我们就可以说K＝9时，X更接近于绿色。与它最近的27个点中14个是红色13个是绿色，X更接近于红色。

发明内容

为解决组合体航天器模型信息完全未知时的姿态控制问题，本发明提出一种基于邻近算法的组合体航天器数据驱动姿态控制算法。由于组合体航天器动力学特性复杂，在没有组合体航天器动力学模型的条件下，无法依靠鲁棒性方法或者参数辨识方法对其进行处理。该数据驱动控制器的设计步骤如下：

S1)、建立组合体航天器运动模型；

S2)、基于邻近算法的数据驱动姿态控制器设计：

S21)初始化控制器参数并建立数据库；

S22)利用公式计算系统的预测值；

S23)利用公式计算系统的预测输出；

S24)计算控制器；

S25)更新数据库中的数据；

S26)对k进行赋值k＝k+1，并进行迭代，有效地调整控制器的输出。

本发明所设计的控制器无需任何动力学模型以及模型参数，仅依靠输入输出数据设计控制器，同时通过邻近算法挖掘历史过程中运行数据所包含的有用信息并用于控制器的设计，相比于基于模型的控制方法，具有更高的实际应用价值。

附图说明

图1是本发明背景技术中邻近算法示意图；

图2是本发明非完全约束组合体示意图；

图3是本发明系统控制框图；

图4是本发明组合体航天器姿态变化曲线；

图5是本发明组合体航天器姿态角速度曲线；

图6是本发明组合体航天器控制力矩曲线；

图7是本发明伪偏导数φ₁变化曲线；

图8是本发明伪偏导数φ₂变化曲线。

具体实施方式

为解决组合体航天器模型信息完全未知时的姿态控制问题，本发明提出一种基于邻近算法的组合体航天器数据驱动姿态控制算法，结合图2～图8所示，该数据驱动控制器的设计步骤如下：

2.1.1组合体航天器运动模型建立

(1)动力学建模

非完全约束组合体航天器示意图如图2所示，由服务航天器、目标航天器以及抓捕机械臂三部分构成。此时目标航天器相对于服务航天器存在相对转动，我们需要对其相对转动进行建模描述。在建模过程中，作出以下假设：

1.机械臂在抓捕后关节锁死，

2.机械臂为轻质不考虑其质量。

图2中坐标系及矢量定义如下：c，s，和t分别为组合体航天器体坐标系、服务航天器体坐标系以及目标航天器体坐标系的质心。ρ_s为s到服务航天器内任意质量微元的位置矢量，ρ_t为t到目标航天器内任意质量微元的位置矢量，r_t为O到目标航天器内任意质量微元的位置矢量，r_s为O到服务航天器内任意质量微元的位置矢量，R_c为O到c的位置矢量，R_s为O到s的位置矢量，R_sc为s到c的位置矢量，R_st为s到t的位置矢量。

首先写出组合体航天器的相对其质心的角动量H方程如公式(1)所示

H＝H_s+H_t+H_m (1)

其中H_s表示服务航天器相对于系统质心的角动量，H_t表示目标航天器相对于系统质心的角动量，H_m表示机械臂相对于系统质心的角动量，由于不考虑机械臂的质量，因此H_m＝0。

按照图2的具体坐标定义，可以得到H_s以及H_t的具体表达式，其推导过程如公式(2)

其中表示服务航天器的转动惯量，/>表示服务航天器相对与惯性系的旋转角速度，/>表示目标航天器的转动惯量，/>表示目标航天器相对于服务航天器的转动角速度。

依据动量矩守恒定理，有公式(3)成立

其中M表示组合体航天器所受的总的力矩。

依据图2中的各个变量的具体定义，公式(3)可以写成公式(4)

公式(4)中，以及/>存在二阶导数，需进一步展开成公式(5)及公式(6)所示形式

将公式(4)，公式(5)以及公式(6)代入到公式(3)中，并通过整理化简可以得到最终的非完全约束组合体航天器的动力学模型如公式(7)

其中J_e＝m_t(r_st·r_stI₃-r_str_st)表示由于抓捕非合作目标而对服务航天器转动惯量带来的影响，表示服务航天器所造成组合体航天器质心偏执造成的附加转动惯量，/>表示目标航天器所造成组合体航天器质心偏执造成的附加转动惯量。/>表示目标航天器等效到服务航天器坐标系下的转动惯量。表示目标航天器等效到服务航天器坐标系下的转动惯量，L_rel＝-m_t(r_st×r_st″)表示附加相对力矩，L_c＝-m_t(r_st×(2ω_s×r_st′))表示附加柯氏力矩，f_rel＝-m_tr_st″表示附加相对力，f_c＝-m_t2ω_s×r_st′表示附加柯氏力。

对公式(7)进行分析可以发现，当服务航天器对目标航天器进行非可靠抓捕时，形成非完全约束组合体，目标相对与服务航天器存在相对运动，目标航天器对服务航天器动力学的影响较为复杂，主要体现以下四点：

(1)由造成的服务航天器转动惯量产生改变，

(2)由造成的，目标航天器相对于服务航天器动力学的直接影响，

(3)由造成的，目标航天器运动与服务航天器运动对服务航天器动力学交叉耦合影响，

(4)由造成的，质心偏移带来的附加干扰力矩的影响。

通过上述分析，相比于完全约束组合体航天器，非完全约束组合体航天由于其内部复杂的运动，导致其动力学特性发生加大的改变，不同于传统的单刚体航天器。

(2)运动学建模

本专利采用姿态四元数的方式建立非完全约束组合体的运动学模型，其模型如公式所示

其中，q_sv＝[q₁,q₂,q₃]^T为单位四元数并且满足||q_s||＝1,表示服务航天器体坐标系相对于惯性系的方向,ω_s＝[ω₁,ω₂,ω₃]^T表示服务航天器相对于惯性系的转动角速度,E(q_s)定义为/>I₃为3×3的单位矩阵,/>为反对称矩阵由公式(9)所定义。

2.1.2基于邻近算法的数据驱动姿态控制器设计

首先需要定义系统的输入输出变量，定义非完全约束组合体航天器的输入为服务航天器的三轴控制力矩而将非完全约束组合体航天器的输出定义为其中q_sv为服务航天器姿态四元数矢量部分，ω_s为服务航天器相对于惯性系的旋转角速度。其具体组成可以表示成公式(10)所示。

其中因为T为采样间隔,则其第k时刻的输出可以由公式(11)得到

为保证输入输出维数相同，做一步维数变换，可得到公式(12)所示的系统输出

结合公式(11)及公式(12)可以得到组合体航天器的一般形式的输入输出映射关系

再对公式(13)做进一步的假设，

假设1：非完全约束组合体航天器(13)满足广义Lipschitz条件，满足公式(14)，其中k₁＞0，k₂＞0，k₁≠k₂。a为未知正常数

其中

L_u为正常数。

依据假设1以及公式(13)，可以得到k时刻的非完全约束组合体输入输出映射关系如公式(16)所示

其中Δy(k+1)＝y(k+1)-y(k)，为系统的伪偏导数。

设计如公式(17)所示的准则函数

其中，N_p为系统输出预测范围，N_u为系统输入预测范围，y_r(k+i)i＝1,2,3,...,N_p为未来时刻的期望输出。

利用线性化公式(16)，可以给出公式(17)中y(k+i)i＝1,2,3,...,N_p的具体形式

通过整理，公式(18)可以进一步的整理成如下形式

Y_p(k+1)＝C(k)y(k)+A₁(k)ΔU(k-1)+A₂(k)ΔU_p(k) (19)

其中

将公式(18)代入公式(17)中，我们可以得到

E＝(Y^*-Y_p(k+1))^T·(Y^*-Y_p(k+1))+ΔU_p(k)^T·ΔU_p(k) (20)

求取公式(20)的最小值，是一个关于ΔU_p(k)二次型最优问题。令有下式成立

我们可以得到u(k)如下式所示

u(k)＝u(k-1)+g^TΔU_p(k) (22)

其中

在控制器(22)，是未知的需要用估计值或者预测值来替代。因此，我们为了完成控制器的设计，必须首先对控制器中未知的/>进行估计。这里我们采用改进的投影映射定理对其进行估计。定义用于预测的指标函数如下式所示

其中，μ＞0为权重因子。利用我们可以求取使得/>取最小值时的/>

其中η∈(0,2]为一给定的正常数。

为了完成控制器(22)的设计，我们还需要对进行预估。由于历史过程中的运行数据中包含了大量的系统信息，因此如何利用此部分信息进行系统伪偏导数的设计是本专利的关键问题。在本小节中，我们采用邻近算法对系统的伪偏导数进行预估，该方法是一种局部学习的方法，在机器学习领域被广泛的应用。

系统的伪偏导在每一时刻都是有界并且慢变的信号，因此可以表示成如下式所示的统计非线性自回归方程

其中n_p为所用到的过去数据的个数，i∈[1,L_u+L_y]，w_i(k)表示估计误差。

根据公式(25)的定义，我们首先设计邻近算法中我们所需的数据库中数据的格式，定义数据库为数据库中的元素我们定义为其中

数据库中的Q(k+1)即为我们所要求取的系统伪偏导数的预测值。采用邻近算法对系统伪偏导数预测时，主要分为以下四大部分：a)局部邻居选择，b)局部建模，c)局部模型校验，d)预测输出。

a)局部邻居选择

在进行局部邻居选择之前，首先需要计算当前时刻η_i(k)与η_i(j),j∈[1,N_tr]的相似度函数。相似度函数的具体形式如下所示

s_i(η_i(k),η_i(j))＝||η_i(k)-η_i(j)||₂ (26)

然后，从中选出相似度最大的h个邻居{η_i(k_r),Q_i(k_r+1)}_r＝1,...h，其中h∈[h_min,h_max]。

b)局部建模

在上一步选出的h个邻居的基础上，我们将利用Nadaraya–Watson递归方法建立一个局部模型。首先，定义[r]为第r个离η_i(k)最近的邻居，v∈[1,N_p-1]为当前预测的步数，并定义v步前向预测为

公式(27)中第m个元素采用Nadaraya–Watson方法进行计算

其中表示Q_i(k_r+1)中的第m个元素。

由于h∈[h_min,h_max]，所以的模型会有(h_max-h_min+1)种表达方式。因此，如何从候选模型中选取一个使得泛化误差最小的模型是下一步需要解决的一个关键问题。

c)局部模型校验

为了评估公式(28)中每个局部模型的性能，我们将采用多输出误差平方和统计方法进行计算评估。假设当前用于计算的邻居个数为h，则相对应的多步留一法误差为

其中e_i,v,m为采用h个邻居数据计算局部模型中第m步预测值时的留一法误差。/>

通过以上计算我们就可以得到使得的留一法误差最优邻居个数/>如下式所示

d)预测输出

根据v＝1,...,N_p-1的不同取值，我们可以得到一系列关于系统伪偏导数的预测值。我们还需对这一些列的预测输出做最后一部的处理，以得到最终的预测输出，这里我们采用简单的取平均值的方法进行计算，得到最后的预测输出如下式所示

定义系统第i个伪偏导的估计值为

则系统的整体的伪偏导数的估计为

将公式(24)中伪偏导数的估计值以及公式(35)中伪偏导数的预测值代入控制器(22)中，我们便完成了基于懒惰学习数据驱动控制器的所有设计流程，系统控制框图如图3所示。

具体的实施流程如下所示：

1)初始化控制器参数并建立数据库。

2)利用公式(24)计算系统的

3)利用公式(33)计算系统的

4)计算控制器(22)。

5)更新数据库中的数据。

6)对k进行赋值k＝k+1，并返回步骤2。

3.理论

3.1控制器收敛性证明

定理1：对于动态线性化后的非完全约束组合体航天器系统，在未来时刻系统输出相对于当前时刻输出以及当前时刻控制输入的偏微分是连续的，整个非线性系统满足广义Lipschitz条件下，当系统给定值为常值时，采用如下所示的控制方案时，则存在一个合适的矩阵对于/>闭环系统的的跟踪误差是最终一致有界稳定的lim_k→∞||e(k)||≤||b||/(1-||a‖)。/>

证明：定义系统的跟踪误差为

e(k+1)＝y^*(k+1)-y(k+1) (36)

其中y^*(k+1)为k+1时刻的系统期望输出

根据公式(36)，可以写出跟踪误差增量的形式

Δe(k+1)＝e(k+1)-e(k)＝(y^*(k+1)-y(k+1))-(y^*(k)-y(k)) (37)

由于y^*(k+1)＝y^*(k)，将公式(16)带入公式(37)可以进一步写成下式的形式

将控制器(22)带入公式(38)

加入伪偏导数估计后的控制器

由于本专利中，仅考虑姿态镇定问题，所以有以下公式成立

将公式(41)代入公式(40)，将其重新改写为下式所示形式

将公式(42)中的定义为M，同时有M^-1＝M^*/det(M)成立。M^*为M的伴随矩阵。此时公式(42)可以写为

其中为M^*的第一行，/>

将公式(43)再代入误差公式(37)

将公式(44)进行化简，可得

公式(45)进行进一步整理，可以写成下式所示的简略形式

e(k+1)＝ae(k)+b (46)

其中，参数a，b定义如下

根据矩阵不等式的相关性质，有下式成立

‖e(k+1)‖≤‖ae(k)‖+‖b‖≤‖a‖‖e(k)||+||b|| (49)

通过选取合适的参数使得||a||≤1，则可以得到结论lim_k→∞||e(k)||≤||b||/(1-||a||)，即系统的跟踪误差是收敛的。

4.现有方法缺点的文字描述

4.1简述现有技术方案及其缺点

方案具体内容如下：

(1)控制器的设计

其中因为T为采样间隔,则其第k时刻的输出可以由公式(11)得到/>

再对公式(13)做进一步的假设，

假设2：非完全约束组合体航天器(13)满足广义Lipschitz条件，满足公式(14)，其中k₁＞0，k₂＞0，k₁≠k₂。a为未知正常数

其中

L_y，L_u为正常数。

其中为系统的伪偏导数。

依据非完全约束组合体航天器输入输出映射关系(16)设计控制器，定义与控制输入以及系统输出有关的准则函数如公式(57)所示

J_c(u(k))＝||y_r(k+1)-y(k+1)||²+λ||u(k)-u(k-1)||² (57)

其中y_r(k+1)表示系统的期望输出，λ＞0表示权值。公式(57)由两部分组成，其中||y_r(k+1)-y(k+1)||²表示最终稳态误差对准则函数的影响，λ||u(k)-u(k-1)||²表控制输入增量对准则函数的影响。

将公式(16)代入公(57)中，并对u(k)求导数令其等于0，

可以得到非完全约束组合体航天器数据驱动姿态控制器

其中ρ∈(0，1]为步长因子，使公式(59)根据一般性。

通过观察公式(59)可以发现，此时的数据驱动控制器虽然不包含任何与模型有关的信息，仅与系统的输入输出变量有关。但其中还有待进一步设计。

对于公式(59)的未知部分，我们采用改进的投影定理对其进行估计，设计如下的伪偏导数准则函数

准则函数对求导数，并令其等于0

可以得到最终的伪偏导数估计的表达式，将其带入到公式(59)可以得到最终的数据驱动控制器

公式(59)所示的控制中不包含任何与系统模型有关的信息，可以在无法得到系统精确模型的前提下，完成预期的控制任务。

方案缺点描述如下：

在该方案中控制器中不显含模型的参数信息，并且闭环系统已被证明是稳定的，因此对于非完全约束组合体航天器的姿态控制任务是适用的。但是，在该方案中，控制器的参数设计过程只用到了当前的输入输出数据，控制器参数属于在线调节，而历史过程中系统的运行数据并没有很好的并利用，当系统运行环境或者系统参数发生改变，控制器没有先验经验，无法及时做出实时调整，控制效果往往不尽如人意。因此此方案具有一定的局限性。

5.效果图

5.1仿真参数设置

为了说明所提算法的有效性，我们通过数值仿真的方式对其进行验证，服务航天器以及目标航天器的初始质量参数与之前的仿真相一致，初始参数设置为q_sv(0)＝[0.034,0.153,0.091]^T，ω_s(0)＝[0.01,0.01,0.01]^T，q_tv(0)＝[0,0,0]^T以及ω_t(0)＝[0,0,0]^T。目标状态设置为q_sd＝[0,0,0]^T和ω_sd＝[0,0,0]^T。

控制器参数如下ρ＝0.5，λ＝0.5，η＝0.1，μ＝1，L_y＝1，L_u＝1，C₁＝25×I₃，C₂＝80×I₃，N_p＝3，N_u＝1，h_min＝4，h_max＝6n_p＝4。

5.2仿真分析

图4给出了组合体航天器姿态变化曲线，图5给出了组合体航天器的姿态角速度变化曲线，图6给出了组合体航天器的控制力矩曲线，图7及图8则分别给出了系统伪偏导数的变化曲线。仿真过程中在140s时，系统由非完全约束状态转移到完全约束状态。

从仿真曲线可以看出，本节所提的基于邻近算法的数据驱动控制器在完全约束及非完全约束发生切换时，仍可以完成预期的姿态稳定控制任务。控制器利用数据库中存储的数据在系统状态发生变化时，及时有效地调整了控制器的输出，使得控制器具有学习能力，充分利用了离线数据以及在线数据。

Claims

1.一种基于邻近算法的组合体航天器数据驱动控制方法，其特征在于，包括如下步骤：

S1)、建立组合体航天器运动模型；

S2)、基于邻近算法的数据驱动姿态控制器设计：

S21)初始化控制器参数并建立数据库；

S22)利用公式计算系统的预测值；

S23)利用公式计算系统的预测输出；

S24)计算控制器；

S25)更新数据库中的数据；

S26)对k进行赋值k＝k+1，并进行迭代，有效地调整控制器的输出，

步骤S2)中，首先需要定义系统的输入输出变量，定义非完全约束组合体航天器的输入为服务航天器的三轴控制力矩而将非完全约束组合体航天器的输出定义为其中q_sv为服务航天器姿态四元数矢量部分，ω_s为服务航天器相对于惯性系的旋转角速度，其具体组成表示成公式(10)所示：

其中因为/>T为采样间隔，则其第k时刻的输出由公式(11)得到

结合公式(11)及公式(12)得到组合体航天器的一般形式的输入输出映射关系

再对公式(13)做进一步的设定，

设定A：非完全约束组合体航天器(13)满足广义Lipschitz条件，满足公式(14)，其中k₁＞0，k₂＞0，k₁≠k₂，a为未知正常数

其中

L_u为正常数；

依据设定A以及公式(13)，得到k时刻的非完全约束组合体输入输出映射关系如公式(16)所示

其中Δy(k+1)＝y(k+1)-y(k)，为系统的伪偏导数；

设计如公式(17)所示的准则函数

其中，N_p为系统输出预测范围，N_u为系统输入预测范围，y_r(k+i)i＝1,2,3,...,N_p为未来时刻的期望输出；

利用线性化公式(16)，给出公式(17)中y(k+i)i＝1,2,3,...,N_p的具体形式

通过整理，公式(18)进一步的整理成如下形式

Y_p(k+1)＝C(k)y(k)+A₁(k)ΔU(k-1)+A₂(k)ΔU_p(k) (19)

其中

将公式(18)代入公式(17)中，得到

E＝(Y^*-Y_p(k+1))^T·(Y^*-Y_p(k+1))+ΔU_p(k)^T·ΔU_p(k) (20)

求取公式(20)的最小值，是一个关于ΔU_p(k)二次型最优问题，令有下式成立

得到u(k)如下式所示

u(k)＝u(k-1)+g^TΔU_p(k) (22)

其中

2.如权利要求1所述的一种基于邻近算法的组合体航天器数据驱动控制方法，其特征在于，在控制器(22)，i＝0,1,...,N_p-1是未知的需要用估计值或者预测值i＝0,1,...,N_p-1来替代；

为了完成控制器的设计，首先对控制器中未知的进行估计；采用改进的投影映射定理对其进行估计；定义用于/>预测的指标函数如下式所示

其中，μ＞0为权重因子，利用求取使得/>取最小值时的/>

其中η∈(0,2]为一给定的正常数。

3.如权利要求2所述的一种基于邻近算法的组合体航天器数据驱动控制方法，其特征在于，系统的伪偏导在每一时刻都是有界并且慢变的信号，因此表示成如下式所示的统计非线性自回归方程：

其中n_p为所用到的过去数据的个数，w_i(k)表示估计误差；

根据公式(25)的定义，首先设计邻近算法中所需的数据库中数据的格式，定义数据库为数据库中的元素定义为其中

数据库中的Q(k+1)即为所要求取的系统伪偏导数的预测值。

4.如权利要求3所述的一种基于邻近算法的组合体航天器数据驱动控制方法，其特征在于，采用邻近算法对系统伪偏导数预测时，主要分为以下四大部分：a)局部邻居选择，b)局部建模，c)局部模型校验，d)预测输出；

a)局部邻居选择

在进行局部邻居选择之前，首先需要计算当前时刻η_i(k)与η_i(j),j∈[1,N_tr]的相似度函数，相似度函数的具体形式如下所示

s_i(η_i(k),η_i(j))＝||η_i(k)-η_i(j)||₂ (26)

然后，从中选出相似度最大的h个邻居{η_i(k_r),Q_i(k_r+1)}_r＝1,...h，其中h∈[h_min,h_max]；

b)局部建模

在上一步选出的h个邻居的基础上，利用Nadaraya–Watson递归方法建立一个局部模型；首先，定义[r]为第r个离η_i(k)最近的邻居，v∈[1,N_p-1]为当前预测的步数，并定义v步前向预测为

公式(27)中第m个元素采用Nadaraya–Watson方法进行计算

其中表示Q_i(k_r+1)中的第m个元素；

由于h∈[h_min,h_max]，所以的模型会有(h_max-h_min+1)种表达方式；因此，如何从候选模型中选取一个使得泛化误差最小的模型是下一步需要解决的一个关键问题；

c)局部模型校验

为了评估公式(28)中每个局部模型的性能，采用多输出误差平方和统计方法进行计算评估；设定当前用于计算的邻居个数为h，则相对应的多步留一法误差为

其中e_i,v,m为采用h个邻居数据计算局部模型中第m步预测值时的留一法误差；

通过以上计算得到使得的留一法误差最优邻居个数/>如下式所示

d)预测输出

根据v＝1,...,N_p-1的不同取值，得到一系列关于系统伪偏导数的预测值；对这一些列的预测输出做最后一步的处理，以得到最终的预测输出，采用简单的取平均值的方法进行计算，得到最后的预测输出如下式所示

定义系统第i个伪偏导的估计值为

则系统的整体的伪偏导数的估计为

将公式(24)中伪偏导数的估计值以及公式(35)中伪偏导数的预测值代入控制器(22)中。