CN107422741A

CN107422741A - 基于学习的保预设性能集群飞行分布式姿态追踪控制方法

Info

Publication number: CN107422741A
Application number: CN201710562483.8A
Authority: CN
Inventors: 罗建军; 魏才盛; 徐晨; 袁建平; 王明明; 朱战霞; 马卫华
Original assignee: Northwestern Polytechnical University
Current assignee: Northwestern Polytechnical University
Priority date: 2017-04-28
Filing date: 2017-07-11
Publication date: 2017-12-01
Anticipated expiration: 2037-07-11
Also published as: CN107422741B

Abstract

本发明公开了一种基于学习的保预设性能集群飞行分布式姿态追踪控制方法，针对集群飞行中的姿态追踪分布式控制问题，在不需要航天器惯性参数信息(即惯性矩阵参数信息)的情况下，设计基于航天器状态的反馈控制器，使得航天器姿态追踪误差系统的瞬态与稳态信息能够得到先验设计。同时基于自适应动态规划，借助航天器的输入输出数据，实现鲁棒补偿控制器的设计，从而提升集群中航天器的控制系统的鲁棒性与自适应性。本发明在不需要对系统未知动力学惯性参数在线辨识以及未知外界干扰观测条件下，就可以实现对集群飞行姿态的追踪控制；基于ADP的在线无模型学习特点，大大提升受控系统对于未知不确定性的鲁棒性。

Description

基于学习的保预设性能集群飞行分布式姿态追踪控制方法

【技术领域】

本发明涉及航天器编队集群鲁棒分布式控制技术，尤其是一种基于学习的保预设性能集群飞行分布式姿态追踪控制方法。

【背景技术】

近几十年，由多个小型、低成本的航天器构成的编队集群技术迅猛发展。相比于单个大型航天器，编队集群飞行具有较高的鲁棒性、安全可靠性以及成本低的优点。是进行多种空间任务，如空间科学研究、对地观测、空间碎片监测等的有效可行方法,。

针对编队飞行的姿态追踪控制，现有的控制方法基于状态Riccati方程的分布式最优控制、基于终端滑模控制的有限时间姿态协同控制、基于反步法的分布式姿态控制，以及基于分布式预测控制的姿态控制方法等，但是现有控制方法主要存在以下缺点，即受控的飞行器的姿态误差系统稳定性在所设计的控制器虽然能够得到，但是追踪误差的瞬态与稳态误差难以实现先验设计。除此之外，现有的分布式姿态控制方法多依赖于航天器的动力学系统信息(即航天器的惯性矩阵参数)。但是，由于航天器自身燃料消耗，以及空间环境的未知不确定性，使得航天器的惯性矩阵参数往往难以精确地估计/测量。虽然借助神经网络或者模糊逻辑系统可以实现对航天器的未知非线性系统模型进行辨识，但是基于神经网络的分布式姿态控制器设计复杂度较高，使得在实际应用中受限。

针对现有针对集群飞行中分布式姿态追踪控制方法存在的缺点，需要一种新的控制策略，在不需要对组合体未知动力学模型辨识基础上，对集群飞行中的航天器分布式姿态控制器设计，降低分布式姿态追踪控制器设计的复杂度，同时，能够先验设计集群飞行中航天器追踪误差系统的瞬态与稳态性能，从而为实现高精度的分布式集群姿态控制提供应用上的可能。

【发明内容】

针对集群飞行中的姿态追踪分布式控制问题，在不需要航天器惯性参数信息(即惯性矩阵参数信息)的情况下，设计基于航天器状态的反馈控制器，使得航天器姿态追踪误差系统的瞬态与稳态信息能够得到先验设计。同时基于自适应动态规划，借助航天器的输入输出数据，实现鲁棒补偿控制器的设计，从而提升集群中航天器的控制系统的鲁棒性与自适应性。

本发明针对集群飞行中的姿态追踪分布式控制问题，提出一种基于学习的保预设性能集群飞行分布式姿态追踪控制方法，在不需要系统动力学信息情况下的，实现在先验设计航天器瞬态与稳态性能前提下，对姿态追踪系统的自适应鲁棒稳定控制。

为达到上述目的，本发明采用以下技术方案予以实现：

基于学习的保预设性能集群飞行分布式姿态追踪控制方法，包括以下步骤：

步骤一：建立集群飞行中航天器动力学与运动学方程

航天器姿态动力学模型为：

其中：q_i＝[q_i1,q_i2,q_i3]^T∈R³,Ω_i＝[Ω_i1,Ω_i2,Ω_i3]^T∈R³分别为第i个航天器在MRPs表示下的姿态角和角速度，i＝1,...,n，n为集群飞行中从航天器总个数，T是向量转置，R³为三维欧几里得空间，J_i∈R^3×3为航天器惯性坐标系下的转动惯量；u_i,d_i∈R³分别为控制输入力矩以及未知干扰力矩；

I₃是3维单位矩阵；是反对称矩阵，具体形式为

步骤二：设计集群飞行预设性能分布式控制器

针对集群飞行中每个从航天器，其只能接受邻接节点的状态信息，因此定义对应的姿态追踪误差为：

其中：a_ij,b_i,N_i分别为集群飞行拓扑网络下节点i的邻接矩阵参数和其相邻的节点个数；q_d,是主航天器的姿态及其一阶微分；定义以下滤波误差：

s_i＝e_2,i+λ_ie_1,i (4)

其中：s_i＝[s_i1,s_i2,s_i3]^T∈R³,λ_i∈R^3×3分别为滤波误差和待设计正定对角矩阵；为了实现对姿态角以及角速度的预设性能控制，定义如下预设性能：

其中：是单调递减函数；

κ_r,i＝diag{κ_r,i1,κ_r,i2,κ_r,i3}∈R^3×3,κ_r,im∈[0,1](r＝1,2,m＝1,2,3)是非负对角矩阵；在式(5)预设性能下，设计的预设性能分布式控制器为：

其中：u_p,i为第i个航天器的预设性能控制器，h_ii为集群飞行网络拓扑下增广矩阵的对角元素，K_e,i,K_s,i为待设计的正定对角控制增益矩阵；ε_ι,i＝[ε_ι,i1,ε_ι,i2,ε_ι,i3]^T∈R³(ι＝e,s)，其中各项参数定义为为转化误差，且其囊括的参数定义为 ξ_ι,i＝[ξ_ι,i1,ξ_ι,i2,ξ_ι,i3]^T∈R³为正的伴随参量，其各项参数为

步骤三：设计基于学习的分布式补偿控制器

基于自适应动态规划设计分布式补偿控制器；对增强性能信号以及控制序列进行近似最优求解；首先针对评价网络，定义增强性能信号为：

其中：φ_i(·)为嵌入在第i个航天器上评价网络的增强性能信号；u_a,i∈R³分别是评价网络的输入以及第i个航天器的补偿控制项；Q_i,分别为正定矩阵；对于评价网络，待优化的长时间性能为：

其中：α_i∈(0,1),Δt分别为复合状态、折扣因子、以及采用步长；则最优的分布式补偿控制输入在优化式(8)得到，即：

对于式(9)的贝尔曼最优性问题，采用3层神经网络进行近似，即：

其中：ω_c1,ik＝[ω_c1,ik1,...,ω_c1,ik9]^T,分别为输入层与隐藏层以及隐藏层与输出层之间的权重参数，为神经网络激活函数，N_c,i为隐藏层节点个数；

对于执行层，相应的分布式补偿控制用3层神经网络近似为：

其中：u_a,im(m＝1,2,3)为u_a,i的第m维控制输入，其他参数含义类同式(10)；通过迭代求解式(10)与(11)，最终实现稳定的在线学习补偿控制器的计算；

步骤四：设计基于学习的保预设性能分布式姿态追踪控制器

基于式(6)与式(11)的计算，得到基于学习的保预设性能分布式姿态追踪控制器u_i为：

u_i＝u_p,i+u_a,i (12)。

本发明进一步的改进在于：

步骤三中，神经网络激活函数采用线性激活函数或S型函数。

步骤三种，对于输入层与隐藏层以及隐藏层与输出层之间的权重参数利用梯度下降法实现更新。

与现有技术相比，本发明具有以下有益效果：

本发明在不需要对系统未知动力学惯性参数在线辨识以及未知外界干扰观测条件下，就可以实现对集群飞行姿态的追踪控制，且姿态追踪误差系统的瞬态与稳态性能能够得到很好地先验设计，从而避开常规控制方法中依赖重复性调参后验得到控制系统性能的缺点；基于ADP的在线无模型学习特点，对设计的静态预设性能分布式控制器进行鲁棒性与自适应性补偿，大大提升受控系统对于未知不确定性的鲁棒性。

【附图说明】

图1为从航天1姿态追踪图；

图2为从航天2姿态追踪图；

图3为从航天3姿态追踪图；

图4为从航天4姿态追踪图；

图5为从航天器1控制力矩输入图；

图6为从航天器2控制力矩输入图；

图7为从航天器3控制力矩输入图；

图8为从航天器4控制力矩输入图。

【具体实施方式】

下面结合附图对本发明做进一步详细描述：

参见图1-7，本发明基于学习的保预设性能集群飞行分布式姿态追踪控制方法，包括以下步骤：

步骤一：集群飞行中航天器动力学与运动学方程

本发明针对集群飞行中的航天器姿态动力学模型(修正罗格里格斯参数下—MRPs)为：

其中：q_i＝[q_i1,q_i2,q_i3]^T∈R³,Ω_i＝[Ω_i1,Ω_i2,Ω_i3]^T∈R³分别为第i个航天器在MRPs表示下的姿态角和角速度(i＝1,...,n，n为集群飞行中从航天器总个数，T是向量转置，R³为三维欧几里得空间)。其他参数分别为：J_i∈R^3×3为航天器惯性坐标系下的转动惯量；u_i,d_i∈R³分别为控制输入力矩以及未知干扰力矩。(I₃是3维单位矩阵)。是反对称矩阵，具体形式为

步骤二：集群飞行预设性能分布式控制器设计

其中：a_ij,b_i,N_i分别为集群飞行拓扑网络下节点i的邻接矩阵参数和其相邻的节点个数。q_d,是主航天器的姿态及其一阶微分。为了方便设计控制器，定义以下滤波误差：

s_i＝e_2,i+λ_ie_1,i (4)

其中：s_i＝[s_i1,s_i2,s_i3]^T∈R³,λ_i∈R^3×3分别为滤波误差和待设计正定对角矩阵。为了实现对姿态角以及角速度的预设性能控制，定义如下预设性能：

其中：是单调递减函数。κ_r,i＝diag{κ_r,i1,κ_r,i2,κ_r,i3}∈R^3×3,κ_r,im∈[0,1](r＝1,2,m＝1,2,3)是非负对角矩阵。在式(5)预设性能下，设计的预设性能分布式控制器为：

其中：u_p,i为第i个航天器的预设性能控制器，h_ii为集群飞行网络拓扑下增广矩阵的对角元素，K_e,i,K_s,i为待设计的正定对角控制增益矩阵。ε_ι,i＝[ε_ι,i1,ε_ι,i2,ε_ι,i3]^T∈R³(ι＝e,s)，其中各项参数定义为为转化误差，且其囊括的参数定义为 ξ_ι,i＝[ξ_ι,i1,ξ_ι,i2,ξ_ι,i3]^T∈R³为正的伴随参量，其各项参数为

步骤三：基于学习的分布式补偿控制器设计

为了增强步骤二设计的预设性能控制器对未知不确定干扰、未建模不确定性(包括执行器故障等)的鲁棒性与自适应性，基于自适应动态规划(Adaptive DynamicProgramming-ADP)，设计分布式补偿控制器。在ADP中，通常基于神经网络设计评价-执行动作网络，分别对增强性能信号以及控制序列进行近似最优求解。首先针对评价网络，定义增强性能信号为

其中：φ_i(·)为嵌入在第i个航天器上评价网络的增强性能信号。u_a,i∈R³分别是评价网络的输入以及第i个航天器的补偿控制项。Q_i,分别为正定矩阵。对于评价网络，待优化的长时间性能为

其中：α_i∈(0,1),Δt分别为复合状态、折扣因子、以及采用步长。则最优的分布式补偿控制输入在优化式(8)得到，即：

对于式(9)的贝尔曼最优性问题，难以得到解析的解，因此采用3层神经网络进行近似，即：

其中：ω_c1,ik＝[ω_c1,ik1,...,ω_c1,ik9]^T,分别为输入层与隐藏层以及隐藏层与输出层之间的权重参数，为神经网络激活函数(可以用线性激活函数、S型函数等)，N_c,i为隐藏层节点个数。对于输入层与隐藏层以及隐藏层与输出层之间的权重参数可以利用梯度下降法实现更新。

对于执行层，相应的分布式补偿控制用3层神经网络近似为：

其中：u_a,im(m＝1,2,3)为u_a,i的第m维控制输入，其他参数含义类同式(10)。通过迭代求解式(10)与(11)，最终实现稳定的在线学习补偿控制器的计算。

步骤四：基于学习的保预设性能分布式姿态追踪控制器设计。

基于式(6)与式(11)的计算，可以得到基于学习的保预设性能分布式姿态追踪控制器u_i为：

u_i＝u_p,i+u_a,i (12)

实施例：

所有预设性能的参数κ_1,i,κ_2,i,ρ_1,i∞,ρ_2,i∞,l_1,i,l_2,i(i＝1,...,4)分别取为：

1,1,0.001,0.001,0.018,0.018

四个从航天器的惯性矩阵参数为

控制器增益为：K_e,i＝diag{10,10,10,10},K_s,i＝diag{30,30,30,30}，λ_i取为单位矩阵。评价-执行层的隐藏层节点个数都为10，且输入层与隐藏层，以及隐藏层与输出层的权重参数初始值在[-0.5,0.5],[-0.3,0.3]区间上任意取。折扣参数因子为0.95，评价-执行网络训练的容许误差为10^-7，单次训练的周期为200步。控制输入的边界是小于等于2N.m，在仿真过程中加入的外界干扰力矩为：

[0.12sin(0.1t),0.06sin(0.15t),0.08sin(0.1t)]^T

另外外加10-20％的惯性矩阵随机不确定性。

以上内容仅为说明本发明的技术思想，不能以此限定本发明的保护范围，凡是按照本发明提出的技术思想，在技术方案基础上所做的任何改动，均落入本发明权利要求书的保护范围之内。

Claims

1.基于学习的保预设性能集群飞行分布式姿态追踪控制方法，其特征在于，包括以下步骤：

步骤一：建立集群飞行中航天器动力学与运动学方程

航天器姿态动力学模型为：

<mrow> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>J</mi> <mi>i</mi> </msub> <msub> <mover> <mi>&Omega;</mi> <mo>&CenterDot;</mo> </mover> <mi>i</mi> </msub> <mo>=</mo> <mo>-</mo> <msubsup> <mi>&Omega;</mi> <mi>i</mi> <mo>&times;</mo> </msubsup> <msub> <mi>J</mi> <mi>i</mi> </msub> <msub> <mi>&Omega;</mi> <mi>i</mi> </msub> <mo>+</mo> <msub> <mi>u</mi> <mi>i</mi> </msub> <mo>+</mo> <msub> <mi>d</mi> <mi>i</mi> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mover> <mi>q</mi> <mo>&CenterDot;</mo> </mover> <mi>i</mi> </msub> <mo>=</mo> <msub> <mi>&Gamma;</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <msub> <mi>&Omega;</mi> <mi>i</mi> </msub> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>

I₃是3维单位矩阵；是反对称矩阵，具体形式为

<mrow> <msubsup> <mi>q</mi> <mi>i</mi> <mo>&times;</mo> </msubsup> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mo>-</mo> <msub> <mi>q</mi> <mrow> <mi>i</mi> <mn>3</mn> </mrow> </msub> </mrow> </mtd> <mtd> <msub> <mi>q</mi> <mrow> <mi>i</mi> <mn>2</mn> </mrow> </msub> </mtd> </mtr> <mtr> <mtd> <msub> <mi>q</mi> <mrow> <mi>i</mi> <mn>3</mn> </mrow> </msub> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mo>-</mo> <msub> <mi>q</mi> <mrow> <mi>i</mi> <mn>1</mn> </mrow> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>-</mo> <msub> <mi>q</mi> <mrow> <mi>i</mi> <mn>2</mn> </mrow> </msub> </mrow> </mtd> <mtd> <msub> <mi>q</mi> <mrow> <mi>i</mi> <mn>1</mn> </mrow> </msub> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>

步骤二：设计集群飞行预设性能分布式控制器

<mrow> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>e</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>=</mo> <munder> <mi>&Sigma;</mi> <mrow> <mi>j</mi> <mo>&Element;</mo> <msub> <mi>N</mi> <mi>i</mi> </msub> </mrow> </munder> <msub> <mi>a</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>q</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>b</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>q</mi> <mi>d</mi> </msub> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>e</mi> <mrow> <mn>2</mn> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>=</mo> <munder> <mi>&Sigma;</mi> <mrow> <mi>j</mi> <mo>&Element;</mo> <msub> <mi>N</mi> <mi>i</mi> </msub> </mrow> </munder> <msub> <mi>a</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mover> <mi>q</mi> <mo>&CenterDot;</mo> </mover> <mi>i</mi> </msub> <mo>-</mo> <msub> <mover> <mi>q</mi> <mo>&CenterDot;</mo> </mover> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>b</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mover> <mi>q</mi> <mo>&CenterDot;</mo> </mover> <mi>i</mi> </msub> <mo>-</mo> <msub> <mover> <mi>q</mi> <mo>&CenterDot;</mo> </mover> <mi>d</mi> </msub> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>

s_i＝e_2,i+λ_ie_1,i (4)

<mrow> <mtable> <mtr> <mtd> <mrow> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mo>-</mo> <msub> <mi>&kappa;</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>i</mi> <mi>m</mi> </mrow> </msub> <msub> <mi>&rho;</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo><</mo> <msub> <mi>e</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>i</mi> <mi>m</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo><</mo> <msub> <mi>&rho;</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <msub> <mi>e</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>i</mi> <mi>m</mi> </mrow> </msub> <mrow> <mo>(</mo> <mn>0</mn> <mo>)</mo> </mrow> <mo>&GreaterEqual;</mo> <mn>0</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>-</mo> <msub> <mi>&rho;</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo><</mo> <msub> <mi>e</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>i</mi> <mi>m</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo><</mo> <msub> <mi>&kappa;</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>i</mi> <mi>m</mi> </mrow> </msub> <msub> <mi>&rho;</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <msub> <mi>e</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>i</mi> <mi>m</mi> </mrow> </msub> <mrow> <mo>(</mo> <mn>0</mn> <mo>)</mo> </mrow> <mo><</mo> <mn>0</mn> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mo>-</mo> <msub> <mi>&kappa;</mi> <mrow> <mn>2</mn> <mo>,</mo> <mi>i</mi> <mi>m</mi> </mrow> </msub> <msub> <mi>&rho;</mi> <mrow> <mn>2</mn> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo><</mo> <msub> <mi>s</mi> <mrow> <mi>i</mi> <mi>m</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo><</mo> <msub> <mi>&rho;</mi> <mrow> <mn>2</mn> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <msub> <mi>s</mi> <mrow> <mi>i</mi> <mi>m</mi> </mrow> </msub> <mrow> <mo>(</mo> <mn>0</mn> <mo>)</mo> </mrow> <mo>&GreaterEqual;</mo> <mn>0</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>-</mo> <msub> <mi>&rho;</mi> <mrow> <mn>2</mn> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo><</mo> <msub> <mi>s</mi> <mrow> <mi>i</mi> <mi>m</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo><</mo> <msub> <mi>&kappa;</mi> <mrow> <mn>2</mn> <mo>,</mo> <mi>i</mi> <mi>m</mi> </mrow> </msub> <msub> <mi>&rho;</mi> <mrow> <mn>2</mn> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <msub> <mi>s</mi> <mrow> <mi>i</mi> <mi>m</mi> </mrow> </msub> <mrow> <mo>(</mo> <mn>0</mn> <mo>)</mo> </mrow> <mo><</mo> <mn>0</mn> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> </mrow> </mtd> </mtr> </mtable> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>5</mn> <mo>)</mo> </mrow> </mrow>

其中：ρ_r,i0＞ρ_r,i∞＞0(r＝1,2)是单调递减函数；

<mrow> <msub> <mi>u</mi> <mrow> <mi>p</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>=</mo> <mo>-</mo> <mfrac> <mn>1</mn> <msub> <mi>h</mi> <mrow> <mi>i</mi> <mi>i</mi> </mrow> </msub> </mfrac> <msub> <mi>&Gamma;</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mrow> <mo>(</mo> <msub> <mi>K</mi> <mrow> <mi>e</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <msub> <mi>&zeta;</mi> <mrow> <mi>e</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <msub> <mi>&epsiv;</mi> <mrow> <mi>e</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>+</mo> <msub> <mi>K</mi> <mrow> <mi>s</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <msub> <mi>&zeta;</mi> <mrow> <mi>s</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <msub> <mi>&epsiv;</mi> <mrow> <mi>s</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>,</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>6</mn> <mo>)</mo> </mrow> </mrow> 1

步骤三：设计基于学习的分布式补偿控制器

对于执行层，相应的分布式补偿控制用3层神经网络近似为：

步骤四：设计基于学习的保预设性能分布式姿态追踪控制器

u_i＝u_p,i+u_a,i (12)。

2.根据权利要求1所述的基于学习的保预设性能集群飞行分布式姿态追踪控制方法，其特征在于，步骤三中，神经网络激活函数采用线性激活函数或S型函数。

3.根据权利要求1所述的基于学习的保预设性能集群飞行分布式姿态追踪控制方法，其特征在于，步骤三种，对于输入层与隐藏层以及隐藏层与输出层之间的权重参数利用梯度下降法实现更新。