CN107422741A - 基于学习的保预设性能集群飞行分布式姿态追踪控制方法 - Google Patents

基于学习的保预设性能集群飞行分布式姿态追踪控制方法 Download PDF

Info

Publication number
CN107422741A
CN107422741A CN201710562483.8A CN201710562483A CN107422741A CN 107422741 A CN107422741 A CN 107422741A CN 201710562483 A CN201710562483 A CN 201710562483A CN 107422741 A CN107422741 A CN 107422741A
Authority
CN
China
Prior art keywords
mrow
msub
mtd
mtr
spacecraft
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710562483.8A
Other languages
English (en)
Other versions
CN107422741B (zh
Inventor
罗建军
魏才盛
徐晨
袁建平
王明明
朱战霞
马卫华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Publication of CN107422741A publication Critical patent/CN107422741A/zh
Application granted granted Critical
Publication of CN107422741B publication Critical patent/CN107422741B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/08Control of attitude, i.e. control of roll, pitch, or yaw
    • G05D1/0808Control of attitude, i.e. control of roll, pitch, or yaw specially adapted for aircraft
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft

Abstract

本发明公开了一种基于学习的保预设性能集群飞行分布式姿态追踪控制方法,针对集群飞行中的姿态追踪分布式控制问题,在不需要航天器惯性参数信息(即惯性矩阵参数信息)的情况下,设计基于航天器状态的反馈控制器,使得航天器姿态追踪误差系统的瞬态与稳态信息能够得到先验设计。同时基于自适应动态规划,借助航天器的输入输出数据,实现鲁棒补偿控制器的设计,从而提升集群中航天器的控制系统的鲁棒性与自适应性。本发明在不需要对系统未知动力学惯性参数在线辨识以及未知外界干扰观测条件下,就可以实现对集群飞行姿态的追踪控制;基于ADP的在线无模型学习特点,大大提升受控系统对于未知不确定性的鲁棒性。

Description

基于学习的保预设性能集群飞行分布式姿态追踪控制方法
【技术领域】
本发明涉及航天器编队集群鲁棒分布式控制技术,尤其是一种基于学习的保预设性能集群飞行分布式姿态追踪控制方法。
【背景技术】
近几十年,由多个小型、低成本的航天器构成的编队集群技术迅猛发展。相比于单个大型航天器,编队集群飞行具有较高的鲁棒性、安全可靠性以及成本低的优点。是进行多种空间任务,如空间科学研究、对地观测、空间碎片监测等的有效可行方法,。
针对编队飞行的姿态追踪控制,现有的控制方法基于状态Riccati方程的分布式最优控制、基于终端滑模控制的有限时间姿态协同控制、基于反步法的分布式姿态控制,以及基于分布式预测控制的姿态控制方法等,但是现有控制方法主要存在以下缺点,即受控的飞行器的姿态误差系统稳定性在所设计的控制器虽然能够得到,但是追踪误差的瞬态与稳态误差难以实现先验设计。除此之外,现有的分布式姿态控制方法多依赖于航天器的动力学系统信息(即航天器的惯性矩阵参数)。但是,由于航天器自身燃料消耗,以及空间环境的未知不确定性,使得航天器的惯性矩阵参数往往难以精确地估计/测量。虽然借助神经网络或者模糊逻辑系统可以实现对航天器的未知非线性系统模型进行辨识,但是基于神经网络的分布式姿态控制器设计复杂度较高,使得在实际应用中受限。
针对现有针对集群飞行中分布式姿态追踪控制方法存在的缺点,需要一种新的控制策略,在不需要对组合体未知动力学模型辨识基础上,对集群飞行中的航天器分布式姿态控制器设计,降低分布式姿态追踪控制器设计的复杂度,同时,能够先验设计集群飞行中航天器追踪误差系统的瞬态与稳态性能,从而为实现高精度的分布式集群姿态控制提供应用上的可能。
【发明内容】
针对集群飞行中的姿态追踪分布式控制问题,在不需要航天器惯性参数信息(即惯性矩阵参数信息)的情况下,设计基于航天器状态的反馈控制器,使得航天器姿态追踪误差系统的瞬态与稳态信息能够得到先验设计。同时基于自适应动态规划,借助航天器的输入输出数据,实现鲁棒补偿控制器的设计,从而提升集群中航天器的控制系统的鲁棒性与自适应性。
本发明针对集群飞行中的姿态追踪分布式控制问题,提出一种基于学习的保预设性能集群飞行分布式姿态追踪控制方法,在不需要系统动力学信息情况下的,实现在先验设计航天器瞬态与稳态性能前提下,对姿态追踪系统的自适应鲁棒稳定控制。
为达到上述目的,本发明采用以下技术方案予以实现:
基于学习的保预设性能集群飞行分布式姿态追踪控制方法,包括以下步骤:
步骤一:建立集群飞行中航天器动力学与运动学方程
航天器姿态动力学模型为:
其中:qi=[qi1,qi2,qi3]T∈R3i=[Ωi1i2i3]T∈R3分别为第i个航天器在MRPs表示下的姿态角和角速度,i=1,...,n,n为集群飞行中从航天器总个数,T是向量转置,R3为三维欧几里得空间,Ji∈R3×3为航天器惯性坐标系下的转动惯量;ui,di∈R3分别为控制输入力矩以及未知干扰力矩;
I3是3维单位矩阵;是反对称矩阵,具体形式为
步骤二:设计集群飞行预设性能分布式控制器
针对集群飞行中每个从航天器,其只能接受邻接节点的状态信息,因此定义对应的姿态追踪误差为:
其中:aij,bi,Ni分别为集群飞行拓扑网络下节点i的邻接矩阵参数和其相邻的节点个数;qd,是主航天器的姿态及其一阶微分;定义以下滤波误差:
si=e2,iie1,i (4)
其中:si=[si1,si2,si3]T∈R3i∈R3×3分别为滤波误差和待设计正定对角矩阵;为了实现对姿态角以及角速度的预设性能控制,定义如下预设性能:
其中:是单调递减函数;
κr,i=diag{κr,i1r,i2r,i3}∈R3×3r,im∈[0,1](r=1,2,m=1,2,3)是非负对角矩阵;在式(5)预设性能下,设计的预设性能分布式控制器为:
其中:up,i为第i个航天器的预设性能控制器,hii为集群飞行网络拓扑下增广矩阵的对角元素,Ke,i,Ks,i为待设计的正定对角控制增益矩阵;ει,i=[ει,i1ι,i2ι,i3]T∈R3(ι=e,s),其中各项参数定义为为转化误差,且其囊括的参数定义为 ξι,i=[ξι,i1ι,i2ι,i3]T∈R3为正的伴随参量,其各项参数为
步骤三:设计基于学习的分布式补偿控制器
基于自适应动态规划设计分布式补偿控制器;对增强性能信号以及控制序列进行近似最优求解;首先针对评价网络,定义增强性能信号为:
其中:φi(·)为嵌入在第i个航天器上评价网络的增强性能信号;ua,i∈R3分别是评价网络的输入以及第i个航天器的补偿控制项;Qi,分别为正定矩阵;对于评价网络,待优化的长时间性能为:
其中:αi∈(0,1),Δt分别为复合状态、折扣因子、以及采用步长;则最优的分布式补偿控制输入在优化式(8)得到,即:
对于式(9)的贝尔曼最优性问题,采用3层神经网络进行近似,即:
其中:ωc1,ik=[ωc1,ik1,...,ωc1,ik9]T,分别为输入层与隐藏层以及隐藏层与输出层之间的权重参数,为神经网络激活函数,Nc,i为隐藏层节点个数;
对于执行层,相应的分布式补偿控制用3层神经网络近似为:
其中:ua,im(m=1,2,3)为ua,i的第m维控制输入,其他参数含义类同式(10);通过迭代求解式(10)与(11),最终实现稳定的在线学习补偿控制器的计算;
步骤四:设计基于学习的保预设性能分布式姿态追踪控制器
基于式(6)与式(11)的计算,得到基于学习的保预设性能分布式姿态追踪控制器ui为:
ui=up,i+ua,i (12)。
本发明进一步的改进在于:
步骤三中,神经网络激活函数采用线性激活函数或S型函数。
步骤三种,对于输入层与隐藏层以及隐藏层与输出层之间的权重参数利用梯度下降法实现更新。
与现有技术相比,本发明具有以下有益效果:
本发明在不需要对系统未知动力学惯性参数在线辨识以及未知外界干扰观测条件下,就可以实现对集群飞行姿态的追踪控制,且姿态追踪误差系统的瞬态与稳态性能能够得到很好地先验设计,从而避开常规控制方法中依赖重复性调参后验得到控制系统性能的缺点;基于ADP的在线无模型学习特点,对设计的静态预设性能分布式控制器进行鲁棒性与自适应性补偿,大大提升受控系统对于未知不确定性的鲁棒性。
【附图说明】
图1为从航天1姿态追踪图;
图2为从航天2姿态追踪图;
图3为从航天3姿态追踪图;
图4为从航天4姿态追踪图;
图5为从航天器1控制力矩输入图;
图6为从航天器2控制力矩输入图;
图7为从航天器3控制力矩输入图;
图8为从航天器4控制力矩输入图。
【具体实施方式】
下面结合附图对本发明做进一步详细描述:
参见图1-7,本发明基于学习的保预设性能集群飞行分布式姿态追踪控制方法,包括以下步骤:
步骤一:集群飞行中航天器动力学与运动学方程
本发明针对集群飞行中的航天器姿态动力学模型(修正罗格里格斯参数下—MRPs)为:
其中:qi=[qi1,qi2,qi3]T∈R3i=[Ωi1i2i3]T∈R3分别为第i个航天器在MRPs表示下的姿态角和角速度(i=1,...,n,n为集群飞行中从航天器总个数,T是向量转置,R3为三维欧几里得空间)。其他参数分别为:Ji∈R3×3为航天器惯性坐标系下的转动惯量;ui,di∈R3分别为控制输入力矩以及未知干扰力矩。(I3是3维单位矩阵)。是反对称矩阵,具体形式为
步骤二:集群飞行预设性能分布式控制器设计
针对集群飞行中每个从航天器,其只能接受邻接节点的状态信息,因此定义对应的姿态追踪误差为:
其中:aij,bi,Ni分别为集群飞行拓扑网络下节点i的邻接矩阵参数和其相邻的节点个数。qd,是主航天器的姿态及其一阶微分。为了方便设计控制器,定义以下滤波误差:
si=e2,iie1,i (4)
其中:si=[si1,si2,si3]T∈R3i∈R3×3分别为滤波误差和待设计正定对角矩阵。为了实现对姿态角以及角速度的预设性能控制,定义如下预设性能:
其中:是单调递减函数。κr,i=diag{κr,i1r,i2r,i3}∈R3×3r,im∈[0,1](r=1,2,m=1,2,3)是非负对角矩阵。在式(5)预设性能下,设计的预设性能分布式控制器为:
其中:up,i为第i个航天器的预设性能控制器,hii为集群飞行网络拓扑下增广矩阵的对角元素,Ke,i,Ks,i为待设计的正定对角控制增益矩阵。ει,i=[ει,i1ι,i2ι,i3]T∈R3(ι=e,s),其中各项参数定义为为转化误差,且其囊括的参数定义为 ξι,i=[ξι,i1ι,i2ι,i3]T∈R3为正的伴随参量,其各项参数为
步骤三:基于学习的分布式补偿控制器设计
为了增强步骤二设计的预设性能控制器对未知不确定干扰、未建模不确定性(包括执行器故障等)的鲁棒性与自适应性,基于自适应动态规划(Adaptive DynamicProgramming-ADP),设计分布式补偿控制器。在ADP中,通常基于神经网络设计评价-执行动作网络,分别对增强性能信号以及控制序列进行近似最优求解。首先针对评价网络,定义增强性能信号为
其中:φi(·)为嵌入在第i个航天器上评价网络的增强性能信号。ua,i∈R3分别是评价网络的输入以及第i个航天器的补偿控制项。Qi,分别为正定矩阵。对于评价网络,待优化的长时间性能为
其中:αi∈(0,1),Δt分别为复合状态、折扣因子、以及采用步长。则最优的分布式补偿控制输入在优化式(8)得到,即:
对于式(9)的贝尔曼最优性问题,难以得到解析的解,因此采用3层神经网络进行近似,即:
其中:ωc1,ik=[ωc1,ik1,...,ωc1,ik9]T,分别为输入层与隐藏层以及隐藏层与输出层之间的权重参数,为神经网络激活函数(可以用线性激活函数、S型函数等),Nc,i为隐藏层节点个数。对于输入层与隐藏层以及隐藏层与输出层之间的权重参数可以利用梯度下降法实现更新。
对于执行层,相应的分布式补偿控制用3层神经网络近似为:
其中:ua,im(m=1,2,3)为ua,i的第m维控制输入,其他参数含义类同式(10)。通过迭代求解式(10)与(11),最终实现稳定的在线学习补偿控制器的计算。
步骤四:基于学习的保预设性能分布式姿态追踪控制器设计。
基于式(6)与式(11)的计算,可以得到基于学习的保预设性能分布式姿态追踪控制器ui为:
ui=up,i+ua,i (12)
实施例:
所有预设性能的参数κ1,i2,i1,i∞2,i∞,l1,i,l2,i(i=1,...,4)分别取为:
1,1,0.001,0.001,0.018,0.018
四个从航天器的惯性矩阵参数为
控制器增益为:Ke,i=diag{10,10,10,10},Ks,i=diag{30,30,30,30},λi取为单位矩阵。评价-执行层的隐藏层节点个数都为10,且输入层与隐藏层,以及隐藏层与输出层的权重参数初始值在[-0.5,0.5],[-0.3,0.3]区间上任意取。折扣参数因子为0.95,评价-执行网络训练的容许误差为10-7,单次训练的周期为200步。控制输入的边界是小于等于2N.m,在仿真过程中加入的外界干扰力矩为:
[0.12sin(0.1t),0.06sin(0.15t),0.08sin(0.1t)]T
另外外加10-20%的惯性矩阵随机不确定性。
以上内容仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明权利要求书的保护范围之内。

Claims (3)

1.基于学习的保预设性能集群飞行分布式姿态追踪控制方法,其特征在于,包括以下步骤:
步骤一:建立集群飞行中航天器动力学与运动学方程
航天器姿态动力学模型为:
<mrow> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>J</mi> <mi>i</mi> </msub> <msub> <mover> <mi>&amp;Omega;</mi> <mo>&amp;CenterDot;</mo> </mover> <mi>i</mi> </msub> <mo>=</mo> <mo>-</mo> <msubsup> <mi>&amp;Omega;</mi> <mi>i</mi> <mo>&amp;times;</mo> </msubsup> <msub> <mi>J</mi> <mi>i</mi> </msub> <msub> <mi>&amp;Omega;</mi> <mi>i</mi> </msub> <mo>+</mo> <msub> <mi>u</mi> <mi>i</mi> </msub> <mo>+</mo> <msub> <mi>d</mi> <mi>i</mi> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mover> <mi>q</mi> <mo>&amp;CenterDot;</mo> </mover> <mi>i</mi> </msub> <mo>=</mo> <msub> <mi>&amp;Gamma;</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <msub> <mi>&amp;Omega;</mi> <mi>i</mi> </msub> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>
其中:qi=[qi1,qi2,qi3]T∈R3i=[Ωi1i2i3]T∈R3分别为第i个航天器在MRPs表示下的姿态角和角速度,i=1,...,n,n为集群飞行中从航天器总个数,T是向量转置,R3为三维欧几里得空间,Ji∈R3×3为航天器惯性坐标系下的转动惯量;ui,di∈R3分别为控制输入力矩以及未知干扰力矩;
I3是3维单位矩阵;是反对称矩阵,具体形式为
<mrow> <msubsup> <mi>q</mi> <mi>i</mi> <mo>&amp;times;</mo> </msubsup> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mo>-</mo> <msub> <mi>q</mi> <mrow> <mi>i</mi> <mn>3</mn> </mrow> </msub> </mrow> </mtd> <mtd> <msub> <mi>q</mi> <mrow> <mi>i</mi> <mn>2</mn> </mrow> </msub> </mtd> </mtr> <mtr> <mtd> <msub> <mi>q</mi> <mrow> <mi>i</mi> <mn>3</mn> </mrow> </msub> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mo>-</mo> <msub> <mi>q</mi> <mrow> <mi>i</mi> <mn>1</mn> </mrow> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>-</mo> <msub> <mi>q</mi> <mrow> <mi>i</mi> <mn>2</mn> </mrow> </msub> </mrow> </mtd> <mtd> <msub> <mi>q</mi> <mrow> <mi>i</mi> <mn>1</mn> </mrow> </msub> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>
步骤二:设计集群飞行预设性能分布式控制器
针对集群飞行中每个从航天器,其只能接受邻接节点的状态信息,因此定义对应的姿态追踪误差为:
<mrow> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>e</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>=</mo> <munder> <mi>&amp;Sigma;</mi> <mrow> <mi>j</mi> <mo>&amp;Element;</mo> <msub> <mi>N</mi> <mi>i</mi> </msub> </mrow> </munder> <msub> <mi>a</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>q</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>b</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>q</mi> <mi>d</mi> </msub> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>e</mi> <mrow> <mn>2</mn> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>=</mo> <munder> <mi>&amp;Sigma;</mi> <mrow> <mi>j</mi> <mo>&amp;Element;</mo> <msub> <mi>N</mi> <mi>i</mi> </msub> </mrow> </munder> <msub> <mi>a</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mover> <mi>q</mi> <mo>&amp;CenterDot;</mo> </mover> <mi>i</mi> </msub> <mo>-</mo> <msub> <mover> <mi>q</mi> <mo>&amp;CenterDot;</mo> </mover> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>b</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mover> <mi>q</mi> <mo>&amp;CenterDot;</mo> </mover> <mi>i</mi> </msub> <mo>-</mo> <msub> <mover> <mi>q</mi> <mo>&amp;CenterDot;</mo> </mover> <mi>d</mi> </msub> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>
其中:aij,bi,Ni分别为集群飞行拓扑网络下节点i的邻接矩阵参数和其相邻的节点个数;qd,是主航天器的姿态及其一阶微分;定义以下滤波误差:
si=e2,iie1,i (4)
其中:si=[si1,si2,si3]T∈R3i∈R3×3分别为滤波误差和待设计正定对角矩阵;为了实现对姿态角以及角速度的预设性能控制,定义如下预设性能:
<mrow> <mtable> <mtr> <mtd> <mrow> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mo>-</mo> <msub> <mi>&amp;kappa;</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>i</mi> <mi>m</mi> </mrow> </msub> <msub> <mi>&amp;rho;</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>&lt;</mo> <msub> <mi>e</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>i</mi> <mi>m</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>&lt;</mo> <msub> <mi>&amp;rho;</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <msub> <mi>e</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>i</mi> <mi>m</mi> </mrow> </msub> <mrow> <mo>(</mo> <mn>0</mn> <mo>)</mo> </mrow> <mo>&amp;GreaterEqual;</mo> <mn>0</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>-</mo> <msub> <mi>&amp;rho;</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>&lt;</mo> <msub> <mi>e</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>i</mi> <mi>m</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>&lt;</mo> <msub> <mi>&amp;kappa;</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>i</mi> <mi>m</mi> </mrow> </msub> <msub> <mi>&amp;rho;</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <msub> <mi>e</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>i</mi> <mi>m</mi> </mrow> </msub> <mrow> <mo>(</mo> <mn>0</mn> <mo>)</mo> </mrow> <mo>&lt;</mo> <mn>0</mn> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mo>-</mo> <msub> <mi>&amp;kappa;</mi> <mrow> <mn>2</mn> <mo>,</mo> <mi>i</mi> <mi>m</mi> </mrow> </msub> <msub> <mi>&amp;rho;</mi> <mrow> <mn>2</mn> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>&lt;</mo> <msub> <mi>s</mi> <mrow> <mi>i</mi> <mi>m</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>&lt;</mo> <msub> <mi>&amp;rho;</mi> <mrow> <mn>2</mn> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <msub> <mi>s</mi> <mrow> <mi>i</mi> <mi>m</mi> </mrow> </msub> <mrow> <mo>(</mo> <mn>0</mn> <mo>)</mo> </mrow> <mo>&amp;GreaterEqual;</mo> <mn>0</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>-</mo> <msub> <mi>&amp;rho;</mi> <mrow> <mn>2</mn> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>&lt;</mo> <msub> <mi>s</mi> <mrow> <mi>i</mi> <mi>m</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>&lt;</mo> <msub> <mi>&amp;kappa;</mi> <mrow> <mn>2</mn> <mo>,</mo> <mi>i</mi> <mi>m</mi> </mrow> </msub> <msub> <mi>&amp;rho;</mi> <mrow> <mn>2</mn> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <msub> <mi>s</mi> <mrow> <mi>i</mi> <mi>m</mi> </mrow> </msub> <mrow> <mo>(</mo> <mn>0</mn> <mo>)</mo> </mrow> <mo>&lt;</mo> <mn>0</mn> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> </mrow> </mtd> </mtr> </mtable> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>5</mn> <mo>)</mo> </mrow> </mrow>
其中:ρr,i0>ρr,i∞>0(r=1,2)是单调递减函数;
κr,i=diag{κr,i1r,i2r,i3}∈R3×3r,im∈[0,1](r=1,2,m=1,2,3)是非负对角矩阵;在式(5)预设性能下,设计的预设性能分布式控制器为:
<mrow> <msub> <mi>u</mi> <mrow> <mi>p</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>=</mo> <mo>-</mo> <mfrac> <mn>1</mn> <msub> <mi>h</mi> <mrow> <mi>i</mi> <mi>i</mi> </mrow> </msub> </mfrac> <msub> <mi>&amp;Gamma;</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mrow> <mo>(</mo> <msub> <mi>K</mi> <mrow> <mi>e</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <msub> <mi>&amp;zeta;</mi> <mrow> <mi>e</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <msub> <mi>&amp;epsiv;</mi> <mrow> <mi>e</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>+</mo> <msub> <mi>K</mi> <mrow> <mi>s</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <msub> <mi>&amp;zeta;</mi> <mrow> <mi>s</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <msub> <mi>&amp;epsiv;</mi> <mrow> <mi>s</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>,</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>6</mn> <mo>)</mo> </mrow> </mrow> 1
其中:up,i为第i个航天器的预设性能控制器,hii为集群飞行网络拓扑下增广矩阵的对角元素,Ke,i,Ks,i为待设计的正定对角控制增益矩阵;ει,i=[ει,i1ι,i2ι,i3]T∈R3(ι=e,s),其中各项参数定义为为转化误差,且其囊括的参数定义为 ξι,i=[ξι,i1ι,i2ι,i3]T∈R3为正的伴随参量,其各项参数为
步骤三:设计基于学习的分布式补偿控制器
基于自适应动态规划设计分布式补偿控制器;对增强性能信号以及控制序列进行近似最优求解;首先针对评价网络,定义增强性能信号为:
其中:φi(·)为嵌入在第i个航天器上评价网络的增强性能信号;ua,i∈R3分别是评价网络的输入以及第i个航天器的补偿控制项;Qi,分别为正定矩阵;对于评价网络,待优化的长时间性能为:
其中:αi∈(0,1),Δt分别为复合状态、折扣因子、以及采用步长;则最优的分布式补偿控制输入在优化式(8)得到,即:
对于式(9)的贝尔曼最优性问题,采用3层神经网络进行近似,即:
其中:ωc1,ik=[ωc1,ik1,...,ωc1,ik9]T,分别为输入层与隐藏层以及隐藏层与输出层之间的权重参数,为神经网络激活函数,Nc,i为隐藏层节点个数;
对于执行层,相应的分布式补偿控制用3层神经网络近似为:
其中:ua,im(m=1,2,3)为ua,i的第m维控制输入,其他参数含义类同式(10);通过迭代求解式(10)与(11),最终实现稳定的在线学习补偿控制器的计算;
步骤四:设计基于学习的保预设性能分布式姿态追踪控制器
基于式(6)与式(11)的计算,得到基于学习的保预设性能分布式姿态追踪控制器ui为:
ui=up,i+ua,i (12)。
2.根据权利要求1所述的基于学习的保预设性能集群飞行分布式姿态追踪控制方法,其特征在于,步骤三中,神经网络激活函数采用线性激活函数或S型函数。
3.根据权利要求1所述的基于学习的保预设性能集群飞行分布式姿态追踪控制方法,其特征在于,步骤三种,对于输入层与隐藏层以及隐藏层与输出层之间的权重参数利用梯度下降法实现更新。
CN201710562483.8A 2017-04-28 2017-07-11 基于学习的保预设性能集群飞行分布式姿态追踪控制方法 Active CN107422741B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201710297371 2017-04-28
CN2017102973714 2017-04-28

Publications (2)

Publication Number Publication Date
CN107422741A true CN107422741A (zh) 2017-12-01
CN107422741B CN107422741B (zh) 2019-12-27

Family

ID=60427934

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710562483.8A Active CN107422741B (zh) 2017-04-28 2017-07-11 基于学习的保预设性能集群飞行分布式姿态追踪控制方法

Country Status (1)

Country Link
CN (1) CN107422741B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108762282A (zh) * 2018-05-02 2018-11-06 中国人民解放军战略支援部队航天工程大学 一种基于电磁力的多集群航天器构形重构控制方法
CN110262247A (zh) * 2019-07-05 2019-09-20 青岛大学 多机器人系统的分布式命令滤波模糊控制方法
CN110347181A (zh) * 2019-06-21 2019-10-18 东北大学秦皇岛分校 基于能耗的无人机分布式编队控制方法
CN111026154A (zh) * 2019-12-10 2020-04-17 上海航天控制技术研究所 一种航天器编队防避撞六自由度协同控制方法
CN111338368A (zh) * 2020-03-06 2020-06-26 上海航天控制技术研究所 一种航天器快速机动姿态跟踪自适应鲁棒控制方法
CN111506996A (zh) * 2020-04-15 2020-08-07 郑州轻工业大学 一种基于辨识误差受限的转台伺服系统自适应辨识方法
CN111590561A (zh) * 2020-04-27 2020-08-28 江苏建筑职业技术学院 一种分布式机械臂系统鲁棒预设性能控制方法
CN111608868A (zh) * 2020-05-27 2020-09-01 上海海事大学 风力发电系统最大功率跟踪自适应鲁棒控制系统及方法
CN113885548A (zh) * 2021-10-28 2022-01-04 南京邮电大学 一种多四旋翼无人机输出约束状态一致博弈控制器
CN114671050A (zh) * 2022-03-30 2022-06-28 哈尔滨工业大学 基于一体化线性算子和抗饱和技术的航天器跟踪控制方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5169090A (en) * 1991-08-28 1992-12-08 United Technologies Corporation Attitude synchronization for model following control systems
CN101381004A (zh) * 2008-08-20 2009-03-11 南京航空航天大学 基于大气阻力的微小卫星编队飞行控制方法及控制装置
CN102419597A (zh) * 2011-12-05 2012-04-18 哈尔滨工业大学 一种限定相对姿态的大规模编队航天器姿态一致控制方法
CN106094854A (zh) * 2016-07-15 2016-11-09 中国人民解放军装备学院 电磁编队卫星姿态和轨道相对控制方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5169090A (en) * 1991-08-28 1992-12-08 United Technologies Corporation Attitude synchronization for model following control systems
CN101381004A (zh) * 2008-08-20 2009-03-11 南京航空航天大学 基于大气阻力的微小卫星编队飞行控制方法及控制装置
CN102419597A (zh) * 2011-12-05 2012-04-18 哈尔滨工业大学 一种限定相对姿态的大规模编队航天器姿态一致控制方法
CN106094854A (zh) * 2016-07-15 2016-11-09 中国人民解放军装备学院 电磁编队卫星姿态和轨道相对控制方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LINZHAO,等: "Neural network-based distributed adaptive attitude synchronization control of spacecraft formation under modified fast terminal", 《NEUROCOMPUTING》 *
罗建军,等: "航天器编队的六自由度循环追踪协同控制", 《宇航学报》 *
陈学坤: "四旋翼无人机编队巡航飞行控制方法研究", 《中国优秀硕士学位论文全文数据库工程科技II辑》 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108762282A (zh) * 2018-05-02 2018-11-06 中国人民解放军战略支援部队航天工程大学 一种基于电磁力的多集群航天器构形重构控制方法
CN108762282B (zh) * 2018-05-02 2023-07-04 中国人民解放军战略支援部队航天工程大学 一种基于电磁力的多集群航天器构形重构控制方法
CN110347181A (zh) * 2019-06-21 2019-10-18 东北大学秦皇岛分校 基于能耗的无人机分布式编队控制方法
CN110347181B (zh) * 2019-06-21 2022-07-12 东北大学秦皇岛分校 基于能耗的无人机分布式编队控制方法
CN110262247B (zh) * 2019-07-05 2022-06-17 青岛大学 多机器人系统的分布式命令滤波模糊控制方法
CN110262247A (zh) * 2019-07-05 2019-09-20 青岛大学 多机器人系统的分布式命令滤波模糊控制方法
CN111026154A (zh) * 2019-12-10 2020-04-17 上海航天控制技术研究所 一种航天器编队防避撞六自由度协同控制方法
CN111338368A (zh) * 2020-03-06 2020-06-26 上海航天控制技术研究所 一种航天器快速机动姿态跟踪自适应鲁棒控制方法
CN111338368B (zh) * 2020-03-06 2023-10-20 上海航天控制技术研究所 一种航天器快速机动姿态跟踪自适应鲁棒控制方法
CN111506996A (zh) * 2020-04-15 2020-08-07 郑州轻工业大学 一种基于辨识误差受限的转台伺服系统自适应辨识方法
CN111506996B (zh) * 2020-04-15 2024-05-03 郑州轻工业大学 一种基于辨识误差受限的转台伺服系统自适应辨识方法
CN111590561B (zh) * 2020-04-27 2021-11-16 江苏建筑职业技术学院 一种分布式机械臂系统鲁棒预设性能控制方法
CN111590561A (zh) * 2020-04-27 2020-08-28 江苏建筑职业技术学院 一种分布式机械臂系统鲁棒预设性能控制方法
CN111608868A (zh) * 2020-05-27 2020-09-01 上海海事大学 风力发电系统最大功率跟踪自适应鲁棒控制系统及方法
CN113885548A (zh) * 2021-10-28 2022-01-04 南京邮电大学 一种多四旋翼无人机输出约束状态一致博弈控制器
CN113885548B (zh) * 2021-10-28 2023-10-31 南京邮电大学 一种多四旋翼无人机输出约束状态一致博弈控制器
CN114671050A (zh) * 2022-03-30 2022-06-28 哈尔滨工业大学 基于一体化线性算子和抗饱和技术的航天器跟踪控制方法
CN114671050B (zh) * 2022-03-30 2023-01-24 哈尔滨工业大学 基于一体化线性算子和抗饱和技术的航天器跟踪控制方法

Also Published As

Publication number Publication date
CN107422741B (zh) 2019-12-27

Similar Documents

Publication Publication Date Title
CN107422741A (zh) 基于学习的保预设性能集群飞行分布式姿态追踪控制方法
CN105242544B (zh) 考虑随机扰动的非线性多无人机系统容错编队控制方法
CN105138010B (zh) 一种编队卫星分布式有限时间跟踪控制方法
CN107797454B (zh) 基于有限时间控制的多智能体系统协同容错控制方法
Jiang et al. Adaptive neural observer‐based backstepping fault tolerant control for near space vehicle under control effector damage
Kurnaz et al. Adaptive neuro-fuzzy inference system based autonomous flight control of unmanned air vehicles
Peng et al. Distributed model reference adaptive control for cooperative tracking of uncertain dynamical multi‐agent systems
Hao et al. Adaptive dynamic surface control for cooperative path following of underactuated marine surface vehicles via fast learning
Hernandez-Gonzalez et al. Decentralized discrete-time neural control for a Quanser 2-DOF helicopter
CN107490966A (zh) 一种基于改进幂次趋近律的飞行器有限时间自适应姿态控制方法
Tripathi et al. Finite‐time super twisting sliding mode controller based on higher‐order sliding mode observer for real‐time trajectory tracking of a quadrotor
Nguyen et al. A new fuzzy sliding mode controller for vibration control systems using integrated-structure smart dampers
CN106647584A (zh) 一种基于最优滑模的四旋翼飞行器的容错控制方法
CN105912009A (zh) 基于极点配置和模糊自抗扰控制技术的四旋翼飞行器控制方法
CN110161847A (zh) 一种基于分布式奇异观测器的无人机编队系统传感器故障估计方法
CN107193210A (zh) 一种非线性系统的自适应学习预设性能控制方法
CN105182990A (zh) 具有输出受限的三自由度模型直升机的鲁棒控制方法
Su et al. A combined backstepping and dynamic surface control to adaptive fuzzy state‐feedback control
CN106338918A (zh) 一种微陀螺自适应动态面双神经网络控制方法
Yu et al. Finite-time resilient attitude coordination control for multiple rigid spacecraft with communication link faults
Omidi et al. Consensus positive position feedback control for vibration attenuation of smart structures
Rezaei et al. Stationary average consensus for high‐order multi‐agent systems
Ma et al. Distributed finite‐time attitude dynamic tracking control for multiple rigid spacecraft
Hua et al. Dynamic surface based tracking control of uncertain quadrotor unmanned aerial vehicles with multiple state variable constraints
Li et al. Robust passive adaptive fault tolerant control for stochastic wing flutter via delay control

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant