CN115145296A - 多航天器系统及其抗干扰控制方法、装置和存储介质 - Google Patents

多航天器系统及其抗干扰控制方法、装置和存储介质 Download PDF

Info

Publication number
CN115145296A
CN115145296A CN202210852518.2A CN202210852518A CN115145296A CN 115145296 A CN115145296 A CN 115145296A CN 202210852518 A CN202210852518 A CN 202210852518A CN 115145296 A CN115145296 A CN 115145296A
Authority
CN
China
Prior art keywords
spacecraft
spacecraft system
interference
game
ith
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210852518.2A
Other languages
English (en)
Inventor
袁建平
苏平
马川
全李彬
何勇
朱小凤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Sanyuan Aerospace Technology Co ltd
Original Assignee
Suzhou Sanyuan Aerospace Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Sanyuan Aerospace Technology Co ltd filed Critical Suzhou Sanyuan Aerospace Technology Co ltd
Priority to CN202210852518.2A priority Critical patent/CN115145296A/zh
Publication of CN115145296A publication Critical patent/CN115145296A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/08Control of attitude, i.e. control of roll, pitch, or yaw
    • G05D1/0808Control of attitude, i.e. control of roll, pitch, or yaw specially adapted for aircraft
    • G05D1/0816Control of attitude, i.e. control of roll, pitch, or yaw specially adapted for aircraft to ensure stability
    • G05D1/0833Control of attitude, i.e. control of roll, pitch, or yaw specially adapted for aircraft to ensure stability using limited authority control

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明涉及航天技术领域,提供一种多航天器系统的抗干扰控制方法、装置、多航天器系统和存储介质,该方法包括:建立所述多航天器系统中每个航天器的模型;在该模型的基础上,基于滑膜控制逻辑设计所述多航天器系统的干扰观测器,并设计所述多航天器系统的梯度博弈策略;基于所述多航天器系统的干扰观测器与所述多航天器系统的梯度博弈策略,设计所述多航天器系统的抗干扰控制器;基于所述多航天器系统的抗干扰控制器,确定所述多航天器系统的抗干扰控制器中参数需要满足的约束。本方案能够使多航天器博弈系统在存在未知扰动的情况下仍能达到唯一的纳什均衡状态,从而提升抗干扰能力和控制可靠性。

Description

多航天器系统及其抗干扰控制方法、装置和存储介质
技术领域
本发明涉及航天技术领域,具体是涉及一种多航天器系统的抗干扰控制方法、装置、多航天器系统和存储介质,特别是涉及一种离散时间下的多航天器博弈抗干扰控制方法、装置、多航天器系统和存储介质。
背景技术
经过几十年的研究,博弈论已经在众多领域中得到了广泛的研究和应用,例如社会学与经济学、航空航天、通信工程、控制工程等。同样的博弈论也为多航天器工程问题提供了有效的解决工具。在多航天器博弈系统中,每个航天器都是一个自私的决策者,他们会尽力优化自己的成本函数,而每个航天器的成本函数之间又存在着耦合关系。已有的应用包括城市交通协调控制、无线通信、智能电网、多智能体的控制问题等。在这类问题中,通常目的都是设计有效的博弈控制策略使多航天器博弈系统能够达到纳什均衡状态,在这种状态下,多航天器博弈系统中的任何智能体都没有单方面改变状态的动机。大多数的研究都是在个体不具备动力学或者没有干扰的情况下。
而在实际工程问题中,几乎所有的多航天器博弈系统都会受到由模型不确定性、传输波动、环境噪声或其他原因引起的某种干扰。然而,对于在未知扰动存在时的多智能体博弈纳什均衡寻求问题的研究相对较少。显然直接忽略扰动带来的影响是不合理的,因为存在于博弈动力学的扰动会对博弈的结果造成影响。
因此,亟需开发一种多航天器系统的抗干扰控制方法、装置、多航天器系统和存储介质,以解决对多航天器博弈系统而言存在于博弈动力学的扰动会对博弈的结果造成影响的问题,从而能够使多航天器博弈系统在存在未知扰动的情况下仍能达到唯一的纳什均衡状态,从而提升多航天器博弈系统的抗干扰能力和控制可靠性。
发明内容
本发明的目的是提供一种多航天器系统的抗干扰控制方法、装置、多航天器系统和存储介质,以解决对多航天器博弈系统而言存在于博弈动力学的扰动会对博弈的结果造成影响的问题,从而能够使多航天器博弈系统在存在未知扰动的情况下仍能达到唯一的纳什均衡状态,从而提升多航天器博弈系统的抗干扰能力和控制可靠性。
为解决上述技术问题,作为本发明的一个方面,提供了一种多航天器系统的抗干扰控制方法,包括如下步骤:
建立所述多航天器系统中每个航天器的模型;所述多航天器系统中,具有n个航天器,n为正整数;
在已建立的所述多航天器系统中所有航天器的模型的基础上,基于滑膜控制逻辑,设计所述多航天器系统的干扰观测器;
以及,在已建立的所述多航天器系统中所有航天器的模型的基础上,设计所述多航天器系统中多航天器在博弈时的策略,记为所述多航天器系统的梯度博弈策略;
基于设计得到的所述多航天器系统的干扰观测器、以及设计得到的所述多航天器系统的梯度博弈策略,设计所述多航天器系统的抗干扰控制器;
基于设计得到的所述多航天器系统的抗干扰控制器,确定所述多航天器系统的抗干扰控制器中参数需要满足的约束。
根据本发明一示例实施方式,所述建立所述多航天器系统中每个航天器的模型,包括:
将所述多航天器系统中n个航天器中的任一单个航天器,记为第i个航天器;针对第i个航天器,建立第i个航天器的模型,得到第i个航天器的模型如下:
xi,k+1=xi,k+μ(ui,k+di,k);
其中,xi,k+1表示多航天器博弈系统中第i个航天器在第k+1步的状态;xi,k表示多航天器博弈系统中第i个航天器在第k步的状态;ui,k是第i个航天器在第k步的控制输入;di,k表示第i个航天器在第k步受到的扰动;μ表示步长;i为介于1至n之间的一个正整数。
根据本发明一示例实施方式,所述在已建立的所述多航天器系统中所有航天器的模型的基础上,基于滑膜控制逻辑,设计所述多航天器系统的干扰观测器,包括:
基于滑膜控制逻辑,确定所述多航天器系统中相邻两步扰动的扰动差与每步的步长之间的对应关系;相邻两步为第k+1步和第k步,k表示步数;
基于已建立的所述多航天器系统中所有航天器的模型、已经已定义的所述多航天器系统中相邻两步扰动的扰动差与每步的步长之间的对应关系,将第k步扰动扩张为新的状态,得到扩张后的所述多航天器系统的状态方程;
基于扩张后的所述多航天器系统的状态方程,建立干扰观测器,作为所述多航天器系统的干扰观测器:
Figure BDA0003753972400000031
其中,z1,i,k+1、z2,i,k+1分别是在第k+1步时干扰观测器对航天器状态xi,k+1和航天器扰动di,k+1的估计量,同理z1,i,k、z2,i,k是第k步的对xi,k和di,k的估计量;μ表示步长;α1、α2、α3、α4是干扰观测器的参数;e1,i,k是干扰观测器对航天器状态xi,k+1的观测误差,定义为e1,i,k=z1,i,k-x1,i,k
根据本发明一示例实施方式,所述在已建立的所述多航天器系统中所有航天器的模型的基础上,设计所述多航天器系统中多航天器在博弈时的策略,记为所述多航天器系统的梯度博弈策略,包括:
基于已建立的所述多航天器系统中所有航天器的模型,定义所述多航天器系统中第i个航天器的成本函数为Ji(xk);
确定第i个航天器的成本函数J i(xk)对自身状态的偏导数即
Figure BDA0003753972400000032
采用梯度博弈策略,定义所述多航天器系统的梯度博弈策略为:
Figure BDA0003753972400000033
其中,ug代表控制器中的博弈策略项。
根据本发明一示例实施方式,所述第i个航天器的成本函数是凸函数;
和/或,
在所述多航天器系统的梯度博弈策略中:
Figure BDA0003753972400000041
其中,
Figure BDA0003753972400000042
F(x)是强单调且Lipschitz连续的。
根据本发明一示例实施方式,所述基于设计得到的所述多航天器系统的干扰观测器、以及设计得到的所述多航天器系统的梯度博弈策略,设计所述多航天器系统的抗干扰控制器,包括:
基于设计得到的所述多航天器系统的干扰观测器、以及设计得到的所述多航天器系统的梯度博弈策略,设计所述多航天器系统中第i个航天器的控制律为:
Figure BDA0003753972400000043
其中,ui,k表示所述多航天器系统中第i个航天器的控制律,
Figure BDA0003753972400000044
表示所述多航天器系统中第i个航天器的成本函数对自身状态的偏导数,z2,i,k表示所述多航天器系统的干扰观测器对扰动di,k+1的估计量。
根据本发明一示例实施方式,所述基于设计得到的所述多航天器系统的抗干扰控制器,确定所述多航天器系统的抗干扰控制器中参数需要满足的约束,包括:
基于设计得到的所述多航天器系统的抗干扰控制器、以及所述多航天器系统中第i个航天器的控制律,建立所述多航天器系统在闭环下的状态方程;
基于所述多航天器系统在闭环下的状态方程,利用李雅普诺夫定理对所述多航天器系统的收敛性进行分析,得到所述多航天器系统的抗干扰控制器中参数需要满足的约束。
作为本发明的第二个方面,本发明提供一种多航天器系统的抗干扰控制装置,包括:
建模单元,被配置为建立所述多航天器系统中每个航天器的模型;所述多航天器系统中,具有n个航天器,n为正整数;
设计单元,被配置为在已建立的所述多航天器系统中所有航天器的模型的基础上,基于滑膜控制逻辑,设计所述多航天器系统的干扰观测器;
以及,所述设计单元,还被配置为在已建立的所述多航天器系统中所有航天器的模型的基础上,设计所述多航天器系统中多航天器在博弈时的策略,记为所述多航天器系统的梯度博弈策略;
所述设计单元,还被配置为基于设计得到的所述多航天器系统的干扰观测器、以及设计得到的所述多航天器系统的梯度博弈策略,设计所述多航天器系统的抗干扰控制器;
确定单元,被配置为基于设计得到的所述多航天器系统的抗干扰控制器,确定所述多航天器系统的抗干扰控制器中参数需要满足的约束。
作为本发明的第三个方面,本发明提供一种多航天器系统,包括:以上所述的多航天器系统的抗干扰控制装置。
作为本发明的第四个方面,本发明提供一种多航天器系统,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行以上所述的多航天器系统的抗干扰控制方法。
本发明的有益效果是:
本发明的方案,针对受到未知扰动的离散多航天器博弈系统,充分考虑可能出现的匹配扰动,基于干扰观测器设计抗干扰博弈控制策略,实现多航天器的纳什均衡寻求,从而使多航天器博弈系统在存在未知扰动的情况下仍能达到唯一的纳什均衡状态,从而提升多航天器博弈系统的抗干扰能力和控制可靠性。
附图说明
图1为示意性示出了的一种多航天器系统的抗干扰控制方法的一实施例的流程示意图;
图2为示意性示出了的方法中基于滑膜控制逻辑设计干扰观测器的一实施例的流程示意图;
图3为示意性示出了的方法中设计多航天器在博弈时的策略的一实施例的流程示意图;
图4为示意性示出了的方法中确定抗干扰控制器中参数需要满足的约束的一实施例的流程示意图;
图5为示意性示出了的一种多航天器系统的抗干扰控制装置的一实施例的结构示意图;
图6示意性示出了一种在碎片清理时离散时间下的多航天器抗干扰的纳什均衡寻求控制方法的流程图。
其中,102—建模单元,104—设计单元,106—确定单元。
具体实施方式
以下对本发明的实施例进行详细说明,但是本发明可以由权利要求限定和覆盖的多种不同方式实施。
在各种抗干扰的方法中,干扰观测器可以实现未知扰动的准确估计并提供一个前馈补偿项对扰动进行抵消,同时也有着很好的动态响应。而滑模控制能够克服多航天器博弈系统的不确定性,对干扰和未建模动态具有很强的鲁棒性,对非线性系统也有良好的控制效果。基于滑膜控制设计的观测器也已经展示出显著的特性,尤其是超扭曲算法。但是关于超扭曲算法的研究绝大多数都是在连续时间条件下,在离散时间系统中的研究很少。本发明的方案,提出了一种多航天器系统的抗干扰控制方案,特别是一种离散时间下的多航天器博弈抗干扰控制方案,尤其是一种在碎片清理时离散时间下的多航天器抗干扰的纳什均衡寻求控制方案。该在碎片清理时离散时间下的多航天器抗干扰的纳什均衡寻求控制方案,考虑了对于离散时间的多航天器博弈问题,设计了基于扰动观测器的博弈控制策略。该基于扰动观测器的博弈控制策略可以让多航天器博弈系统在存在未知扰动的情况下仍能达到唯一的纳什均衡状态。下面结合附图对本发明的方案的具体实现过程进行示例性说明。
作为本发明的第一个实施方式,提供一种多航天器系统的抗干扰控制方法,其特征在于,包括如下步骤:步骤S110至步骤S150。
在步骤S110处,建立多航天器系统中每个航天器的模型;多航天器系统中,具有n个航天器,n为正整数。
在步骤S110中,建立多航天器系统中每个航天器的模型,包括:将多航天器系统中n个航天器中的单个航天器,记为第i个航天器;针对第i个航天器,建立第i个航天器的模型,得到第i个航天器的模型如下:
xi,k+1=xi,k+μ(ui,k+di,k)。
其中,xi,k+1表示多航天器博弈系统中第i个航天器在第k+1步的状态;xi,k表示多航天器博弈系统中第i个航天器在第k步的状态;ui,k是第i个航天器在第k步的控制输入;di,k表示第i个航天器在第k步受到的扰动;μ表示步长;i为介于1至n之间的一个正整数。
具体地,图6示意性示出了一种在碎片清理时离散时间下的多航天器抗干扰的纳什均衡寻求控制方法的流程图。如图6所示,本发明的方案提出的一种在碎片清理时离散时间下的多航天器抗干扰的纳什均衡寻求控制方法,实现步骤包括:
步骤1、建立多航天器博弈系统的航天器模型,具体是建立多航天器博弈系统中单个航天器的模型,该单个航天器的模型如下:
xi,k+1=xi,k+μ(ui,k+di,k) (1)。
该模型中,xi,k+1表示第i个航天器在第k+1步的状态;xi,k表示第i个航天器在第k步的状态;ui,k是第i个航天器在第k步的控制输入;di,k表示第i个航天器在第k步受到的扰动;μ表示步长,在本发明的方案中步长是定值;i为正整数。
在多航天器博弈系统中,每个航天器都会有与多航天器博弈系统的状态相关的成本函数。第i个航天器的成本函数,定义为Ji(xk)。
其中,
Figure BDA0003753972400000071
这里,xk是包含N个航天器状态的向量,N为正整数,表示一个定义式。
另外,
Figure BDA0003753972400000072
代表第i个航天器的成本函数J i(xk)对自身状态的偏导数。基于此,定义
Figure BDA0003753972400000073
在步骤S120处,在已建立的多航天器系统中所有航天器的模型的基础上,基于滑膜控制逻辑,设计多航天器系统的干扰观测器。
在步骤S120中,在已建立的多航天器系统中所有航天器的模型的基础上,基于滑膜控制逻辑,设计多航天器系统的干扰观测器的具体过程,参见以下示例性说明。
下面结合图2所示本发明的方法中基于滑膜控制逻辑设计干扰观测器的一实施例流程示意图,进一步说明步骤S120中基于滑膜控制逻辑设计干扰观测器的具体过程,包括:步骤S210至步骤S230。
步骤S210,基于滑膜控制逻辑,确定多航天器系统中相邻两步扰动的扰动差与每步的步长之间的对应关系;相邻两步为第k+1步和第k步,k表示步数。具体地,确定多航天器系统中第k+1步扰动与第k步扰动的扰动差,并基于滑膜控制逻辑,定义该扰动差与每步的步长之间的对应关系,如定义
Figure BDA0003753972400000081
k表示步数。
步骤S220,基于已建立的多航天器系统中所有航天器的模型、已经已定义的多航天器系统中相邻两步扰动的扰动差与每步的步长之间的对应关系,将第k步扰动扩张为新的状态,得到扩张后的多航天器系统的状态方程。
步骤S230,基于扩张后的多航天器系统的状态方程,建立干扰观测器,作为多航天器系统的干扰观测器:
Figure BDA0003753972400000082
其中,z1,i,k+1、z2,i,k+1分别是在第k+1步时干扰观测器对航天器状态xi,k+1和航天器扰动di,k+1的估计量,同理z1,i,k、z2,i,k是第k步的对xi,k和di,k的估计量;μ表示步长;α1、α2、α3、α4是干扰观测器的参数;e1,i,k是干扰观测器对航天器状态xi,k+1的观测误差,定义为e1,i,k=z1,i,k-x1,i,k
具体地,如图6所示,本发明的方案提出的一种在碎片清理时离散时间下的多航天器抗干扰的纳什均衡寻求控制方法,实现步骤还包括:
步骤2、基于步骤1建立的航天器模型,设计干扰观测器。
在各种抗干扰的方法中,干扰观测器可以实现未知扰动的准确估计并提供一个前馈补偿项对扰动进行抵消,同时也有着很好的动态响应。而滑模控制能够克服系统的不确定性,对干扰和未建模动态具有很强的鲁棒性,对非线性系统也有良好的控制效果。因此,本发明的方案,基于滑膜控制设计扰动观测器,以克服多航天器博弈系统的不确定性,对干扰和未建模动态具有很强的鲁棒性,实现更好的控制效果。
为了基于滑膜控制设计扰动观测器,首先需要建立多航天器博弈系统的扩张状态方程。为了建立多航天器博弈系统的扩张状态方程,需要进行如下定义:
Figure BDA0003753972400000091
其中,di,k+1表示第i个航天器在第k+1步所受到的扰动,fi,k代表在第i步时扰动的变化率。
然后,基于已建立的单个航天器的模型xi,k+1=xi,k+μ(ui,k+di,k)、以及已定义的
Figure BDA0003753972400000092
通过将扰动di,k扩张为新的状态,得到扩张后多航天器博弈系统的状态方程:
Figure BDA0003753972400000093
对扩张后多航天器博弈系统的状态方程,建立干扰观测器:
Figure BDA0003753972400000094
其中,z1,i,k+1、z2,i,k+1分别是在第k+1步时干扰观测器对航天器状态xi,k+1和航天器扰动di,k+1的估计量,同理z1,i,k、z2,i,k是第k步的对xi,k和di,k的估计量;α1、α2、α3、α4是干扰观测器的参数;e1,i,k是干扰观测器对航天器状态xi,k+1的观测误差,定义为e1,i,k=z1,i,k-xi,k
另外,定义干扰观测器对扰动di,k的观测误差为e2,i,k,然后建立干扰观测器的观测误差系统:
Figure BDA0003753972400000095
其中,e1,i,k+1是干扰观测器对航天器状态xi,k+1的观测误差,e2,i,k+1是干扰观测器对航天器扰动di,k+2的观测误差。这里,建立干扰观测器误差系统,以方便从理论上分析干扰观测器的误差收敛性。
进一步地,通过以下定义,得到式(4)的简化形式即式(5),以在后续确认相关参数时,方便将参数正定到一个矩阵中:
Figure BDA0003753972400000101
ei,k+1=Φei,k+Ψsign(e1,i,k)
其中,Φ、Ψ均表示参数矩阵。
在步骤S130处,在已建立的多航天器系统中所有航天器的模型的基础上,设计多航天器系统中多航天器在博弈时的策略,记为多航天器系统的梯度博弈策略。
在步骤S130中,在已建立的多航天器系统中所有航天器的模型的基础上,设计多航天器系统中多航天器在博弈时的策略,记为多航天器系统的梯度博弈策略的具体过程,参见以下示例性说明。
下面结合图3所示本发明的方法中设计多航天器在博弈时的策略的一实施例流程示意图,进一步说明步骤S130中设计多航天器在博弈时的策略的具体过程,包括:步骤S310至步骤S330。
步骤S310,基于已建立的多航天器系统中所有航天器的模型,定义多航天器系统中第i个航天器的成本函数为J i(xk)。
步骤S320,确定第i个航天器的成本函数J i(xk)对自身状态的偏导数即
Figure BDA0003753972400000102
步骤S330,采用梯度博弈策略,定义多航天器系统的梯度博弈策略为:
Figure BDA0003753972400000103
其中,ug代表控制器中的博弈策略项。
具体地,如图6所示,本发明的方案提出的一种在碎片清理时离散时间下的多航天器抗干扰的纳什均衡寻求控制方法,实现步骤还包括:
步骤3、基于步骤1建立的航天器模型,设计博弈策略。
在多航天器博弈系统中,每个航天器都是一个自私的决策者,他们会尽力优化自己的成本函数,而每个航天器的成本函数之间又存在着耦合关系。因此需要设计博弈策略对航天器自身的成本函数进行优化使多航天器博弈系统达到纳什均衡。
其中,纳什均衡是指:如果航天器状态x*能使多航天器博弈系统中每一个航天器的成本函数都满足J i(x*)≤J i(xk),则称航天器状态x*是多航天器博弈系统的一个纳什均衡点。
本发明的方案,采用梯度博弈策略
Figure BDA0003753972400000111
其中ug代表控制器中的博弈策略项,
Figure BDA0003753972400000112
代表第i个航天器的成本函数对自身状态的偏导数,定义为:
Figure BDA0003753972400000113
基于本发明的方案中对于多航天器博弈系统的假设,该多航天器博弈系统有且只有唯一的纳什均衡点。采用梯度博弈可以使多航天器博弈系统达到纳什均衡。
优选地,第i个航天器的成本函数是凸函数。本发明的方案,对于多航天器博弈系统做出几点假设。其中,该几点假设,包括:第1点假设:第i个航天器的成本函数J i(xk)也称为第i个航天器的代价函数J i(xk)。假设多航天器博弈系统中航天器的代价函数J i(xk)对于自身的状态xi,如多航天器博弈系统中第i个航天器的代价函数J i(xk)多对于自身在第k步的状态xi,k,是严格的凸函数。
优选地,在多航天器系统的梯度博弈策略中:
Figure BDA0003753972400000114
其中,
Figure BDA0003753972400000115
F(x)是强单调且Lipschitz连续的。
具体地,结合图6所示的例子,另外,定义
Figure BDA0003753972400000116
Figure BDA0003753972400000117
本发明的方案,对于多航天器博弈系统做出几点假设。其中,该几点假设,还包括:第2点假设:假设F(x)是强单调且Lipschitz连续(即利普希茨连续)的。这里,定义F(x),是为了方便表达整个多航天器系统。
在步骤S140处,基于设计得到的多航天器系统的干扰观测器、以及设计得到的多航天器系统的梯度博弈策略,设计多航天器系统的抗干扰控制器。
在步骤S140中,基于设计得到的多航天器系统的干扰观测器、以及设计得到的多航天器系统的梯度博弈策略,设计多航天器系统的抗干扰控制器,包括:基于设计得到的多航天器系统的干扰观测器、以及设计得到的多航天器系统的梯度博弈策略,设计多航天器系统中第i个航天器的控制律为:
Figure BDA0003753972400000121
其中,ui,k表示多航天器系统中第i个航天器的控制律,
Figure BDA0003753972400000122
表示多航天器系统中第i个航天器的成本函数对自身状态的偏导数,z2,i,k表示多航天器系统的干扰观测器对扰动di,k+1的估计量。
具体地,本发明的方案,基于扰动观测器和博弈论,针对离散多航天器系统设计抗扰动博弈控制策略。如图6所示,本发明的方案提出的一种在碎片清理时离散时间下的多航天器抗干扰的纳什均衡寻求控制方法,实现步骤还包括:
步骤4、基于步骤2设计的干扰观测器、以及步骤3设计的梯度博弈策略,设计多航天器博弈系统的抗干扰控制器。
多航天器博弈系统的抗干扰控制器的设计,主要考虑实现两个功能:第一是优化每个航天器自身的成本函数Ji(xk),这是因为在多航天器博弈中,每个航天器都具有自私性,也就是首先要优化自身的性能;第二是对于存在的未知匹配扰动进行估计并消除扰动。
基于前边设计的干扰观测器和梯度博弈策略,第i个航天器的控制律设计如下:
Figure BDA0003753972400000123
其中,第一项即
Figure BDA0003753972400000124
是按照每个航天器成本函数的梯度方向对对应航天器的性能进行优化,第二项即-z2,i,k是将干扰观测器对扰动di,k+1的估计量z2,i,k引入控制中对扰动进行抑制消除。
在步骤S150处,基于设计得到的多航天器系统的抗干扰控制器,确定多航天器系统的抗干扰控制器中参数需要满足的约束。
本发明的方案,针对受到未知扰动的离散多航天器博弈系统,提供的一种在碎片清理时离散时间下的多航天器抗干扰的纳什均衡寻求控制方法,通过设计扰动观测器对未知扰动进行观测估计,再结合梯度博弈策略设计抗干扰的博弈控制策略,实现了基于扰动观测器的博弈控制策略的设计,该基于扰动观测器的博弈控制策略可以让多航天器博弈系统在存在未知扰动的情况下仍能达到唯一的纳什均衡状态,从而使受到干扰的多航天器博弈系统最终达到纳什均衡。
从而,克服多航天器博弈系统存在于博弈动力学的扰动会对博弈的结果造成影响的不足,充分考虑可能出现的匹配扰动,基于干扰观测器设计抗干扰博弈控制策略,实现多航天器的纳什均衡寻求,使多航天器博弈系统达到唯一的纳什均衡状态。其中,可能产生匹配扰动的原因包括但不限于控制通道中的信号噪声、执行器故障、多航天器的成本函数不准确、多航天器博弈系统模型误差等。
在步骤S150中,基于设计得到的多航天器系统的抗干扰控制器,确定多航天器系统的抗干扰控制器中参数需要满足的约束的具体过程,参见以下示例性说明。
下面结合图4所示本发明的方法中确定抗干扰控制器中参数需要满足的约束的一实施例流程示意图,进一步说明步骤S150中确定抗干扰控制器中参数需要满足的约束的具体过程,包括:步骤S410至步骤S420。
步骤S410,基于设计得到的多航天器系统的抗干扰控制器、以及多航天器系统中第i个航天器的控制律,建立多航天器系统在闭环下的状态方程。
步骤S420,基于多航天器系统在闭环下的状态方程,利用李雅普诺夫定理对多航天器系统的收敛性进行分析,得到多航天器系统的抗干扰控制器中参数需要满足的约束。
具体地,如图6所示,本发明的方案提出的一种在碎片清理时离散时间下的多航天器抗干扰的纳什均衡寻求控制方法,实现步骤还包括:
步骤5、确定步骤4设计的抗干扰控制器中参数的约束。
结合步骤2设计的扰动观测器具体参见公式(3)、以及步骤4设计的第i个航天器的控制律具体参见公式(6),建立闭环系统的状态方程:
Figure BDA0003753972400000131
进而,将闭环系统的状态方程即公式(7)转化为紧凑形式即公式(8):
Figure BDA0003753972400000141
其中:
Figure BDA0003753972400000142
Figure BDA0003753972400000143
Figure BDA0003753972400000144
Figure BDA0003753972400000145
Figure BDA0003753972400000146
Figure BDA0003753972400000147
Figure BDA0003753972400000148
然后,利用李雅普诺夫定理对多航天器博弈系统的收敛性进行分析,可以得到抗干扰控制器中参数需要满足的约束。这里所说的约束,即约束条件。
要保证多航天器博弈系统收敛时,多航天器博弈系统的参数需要满足两个条件。在本发明的方案中,对于参数矩阵
Figure BDA0003753972400000149
需要满足以下两个约束:
第1个约束:对于步长μ,要满足
Figure BDA00037539724000001410
其中σ和δ时两个正常数;
第2个约束:对于给定的矩阵Γ=ΓT>0,参数矩阵Φ使得线性矩阵不等式(LMI)即公式(9)有正定的解H=HT>0。
Figure BDA00037539724000001411
其中,参数矩阵
Figure BDA00037539724000001412
σ和δ是两个正的常数,I是单位矩阵,γ为常数且满足0<γ<1。
本发明的方案,与相关方案相比,至少具有以下优点:
一方面,本发明的方案,可以对扰动进行很好的估计和消除,在多航天器博弈问题中,扰动的存在是不能忽略的,因为未知扰动会对博弈的结果造成影响。本发明的方案所设计的抗干扰控制器可以实现对智能体自身的成本函数进行优化的同时,对扰动进行估计和抵消,使多航天器博弈系统达到唯一的纳什均衡状态。
另一方面,与实际工程问题相贴合,采用离散的系统模型进行分析设计,而且设计的抗干扰控制器对扰动的约束和信息要求很少,不需要知道扰动的具体形式,不约束扰动有界,便于工程实现。
根据本发明的第二个实施方式,提供一种多航天器系统的抗干扰控制装置。参见图5所示本发明的装置的一实施例的结构示意图。该多航天器系统的抗干扰控制装置可以包括:包括:建模单元102、设计单元104和确定单元106。
其中,建模单元102,被配置为建立多航天器系统中每个航天器的模型;多航天器系统中,具有n个航天器,n为正整数;该建模单元的具体功能及处理参见步骤S110及其相关说明,在此不再赘述。
设计单元104,被配置为在已建立的多航天器系统中所有航天器的模型的基础上,基于滑膜控制逻辑,设计多航天器系统的干扰观测器;该设计单元的具体功能及处理参见步骤S120及其相关说明,在此不再赘述。
以及,设计单元104,还被配置为在已建立的多航天器系统中所有航天器的模型的基础上,设计多航天器系统中多航天器在博弈时的策略,记为多航天器系统的梯度博弈策略;该设计单元的具体功能及处理还参见步骤S130及其相关说明,在此不再赘述。
设计单元104,还被配置为基于设计得到的多航天器系统的干扰观测器、以及设计得到的多航天器系统的梯度博弈策略,设计多航天器系统的抗干扰控制器;该设计单元的具体功能及处理还参见步骤S140及其相关说明,在此不再赘述。
确定单元106,被配置为基于设计得到的多航天器系统的抗干扰控制器,确定多航天器系统的抗干扰控制器中参数需要满足的约束。该确定单元的具体功能及处理还参见步骤S150及其相关说明,在此不再赘述。
另外,由于本实施例的装置所实现的处理及功能基本相应于前述方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
本发明的方案,针对受到未知扰动的离散多航天器博弈系统,提供的一种在碎片清理时离散时间下的多航天器抗干扰的纳什均衡寻求控制装置,通过设计扰动观测器对未知扰动进行观测估计,再结合梯度博弈策略设计抗干扰的博弈控制策略,实现了基于扰动观测器的博弈控制策略的设计,该基于扰动观测器的博弈控制策略可以让多航天器博弈系统在存在未知扰动的情况下仍能达到唯一的纳什均衡状态,从而使受到干扰的多航天器博弈系统最终达到纳什均衡。
从而,克服多航天器博弈系统存在于博弈动力学的扰动会对博弈的结果造成影响的不足,充分考虑可能出现的匹配扰动,基于干扰观测器设计抗干扰博弈控制策略,实现多航天器的纳什均衡寻求,使多航天器博弈系统达到唯一的纳什均衡状态。其中,可能产生匹配扰动的原因包括但不限于控制通道中的信号噪声、执行器故障、多航天器的成本函数不准确、多航天器博弈系统模型误差等。
根据本发明的第三个实施方式,提供一种多航天器系统,其特征在于,包括:以上的多航天器系统的抗干扰控制装置。
由于本实施例的多航天器系统所实现的处理及功能基本相应于前述装置的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
根据本发明的第四个实施方式,提供一种多航天器系统,其特征在于,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行以上的多航天器系统的抗干扰控制方法。
由于本实施例的存储介质所实现的处理及功能基本相应于前述方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种多航天器系统的抗干扰控制方法,其特征在于,包括如下步骤:
建立所述多航天器系统中每个航天器的模型;所述多航天器系统中,具有n个航天器,n为正整数;
在已建立的所述多航天器系统中所有航天器的模型的基础上,基于滑膜控制逻辑,设计所述多航天器系统的干扰观测器;
以及,在已建立的所述多航天器系统中所有航天器的模型的基础上,设计所述多航天器系统中多航天器在博弈时的策略,记为所述多航天器系统的梯度博弈策略;
基于设计得到的所述多航天器系统的干扰观测器、以及设计得到的所述多航天器系统的梯度博弈策略,设计所述多航天器系统的抗干扰控制器;
基于设计得到的所述多航天器系统的抗干扰控制器,确定所述多航天器系统的抗干扰控制器中参数需要满足的约束。
2.根据权利要求1所述的多航天器系统的抗干扰控制方法,其特征在于,所述建立所述多航天器系统中每个航天器的模型,包括:
将所述多航天器系统中n个航天器中的任一单个航天器,记为第i个航天器;针对第i个航天器,建立第i个航天器的模型,得到第i个航天器的模型如下:
xi,k+1=xi,k+μ(ui,k+di,k);
其中,xi,k+1表示多航天器博弈系统中第i个航天器在第k+1步的状态;xi,k表示多航天器博弈系统中第i个航天器在第k步的状态;ui,k是第i个航天器在第k步的控制输入;di,k表示第i个航天器在第k步受到的扰动;μ表示步长;i为介于1至n之间的一个正整数。
3.根据权利要求1或2所述的多航天器系统的抗干扰控制方法,其特征在于,所述在已建立的所述多航天器系统中所有航天器的模型的基础上,基于滑膜控制逻辑,设计所述多航天器系统的干扰观测器,包括:
基于滑膜控制逻辑,确定所述多航天器系统中相邻两步扰动的扰动差与每步的步长之间的对应关系;相邻两步为第k+1步和第k步,k表示步数;
基于已建立的所述多航天器系统中所有航天器的模型、已经已定义的所述多航天器系统中相邻两步扰动的扰动差与每步的步长之间的对应关系,将第k步扰动扩张为新的状态,得到扩张后的所述多航天器系统的状态方程;
基于扩张后的所述多航天器系统的状态方程,建立干扰观测器,作为所述多航天器系统的干扰观测器:
Figure FDA0003753972390000021
其中,z1,i,k+1、z2,i,k+1分别是在第k+1步时干扰观测器对航天器状态xi,k+1和航天器扰动di,k+1的估计量,同理z1,i,k、z2,i,k是第k步的对xi,k和di,k的估计量;μ表示步长;α1、α2、α3、α4是干扰观测器的参数;e1,i,k是干扰观测器对航天器状态xi,k+1的观测误差,定义为e1,i,k=z1,i,k-x1,i,k
4.根据权利要求1或2所述的多航天器系统的抗干扰控制方法,其特征在于,所述在已建立的所述多航天器系统中所有航天器的模型的基础上,设计所述多航天器系统中多航天器在博弈时的策略,记为所述多航天器系统的梯度博弈策略,包括:
基于已建立的所述多航天器系统中所有航天器的模型,定义所述多航天器系统中第i个航天器的成本函数为Ji(xk);
确定第i个航天器的成本函数Ji(xk)对自身状态的偏导数即
Figure FDA0003753972390000022
采用梯度博弈策略,定义所述多航天器系统的梯度博弈策略为:
Figure FDA0003753972390000023
其中,ug代表控制器中的博弈策略项。
5.根据权利要求4所述的多航天器系统的抗干扰控制方法,其特征在于,所述第i个航天器的成本函数是凸函数;
和/或,
在所述多航天器系统的梯度博弈策略中:
Figure FDA0003753972390000024
其中,
Figure FDA0003753972390000025
Figure FDA0003753972390000026
F(x)是强单调且Lipschitz连续的。
6.根据权利要求4所述的多航天器系统的抗干扰控制方法,其特征在于,所述基于设计得到的所述多航天器系统的干扰观测器、以及设计得到的所述多航天器系统的梯度博弈策略,设计所述多航天器系统的抗干扰控制器,包括:
基于设计得到的所述多航天器系统的干扰观测器、以及设计得到的所述多航天器系统的梯度博弈策略,设计所述多航天器系统中第i个航天器的控制律为:
Figure FDA0003753972390000031
其中,ui,k表示所述多航天器系统中第i个航天器的控制律,
Figure FDA0003753972390000032
表示所述多航天器系统中第i个航天器的成本函数对自身状态的偏导数,z2,i,k表示所述多航天器系统的干扰观测器对扰动di,k+1的估计量。
7.根据权利要求6所述的多航天器系统的抗干扰控制方法,其特征在于,所述基于设计得到的所述多航天器系统的抗干扰控制器,确定所述多航天器系统的抗干扰控制器中参数需要满足的约束,包括:
基于设计得到的所述多航天器系统的抗干扰控制器、以及所述多航天器系统中第i个航天器的控制律,建立所述多航天器系统在闭环下的状态方程;
基于所述多航天器系统在闭环下的状态方程,利用李雅普诺夫定理对所述多航天器系统的收敛性进行分析,得到所述多航天器系统的抗干扰控制器中参数需要满足的约束。
8.一种多航天器系统的抗干扰控制装置,其特征在于,包括:
建模单元,被配置为建立所述多航天器系统中每个航天器的模型;所述多航天器系统中,具有n个航天器,n为正整数;
设计单元,被配置为在已建立的所述多航天器系统中所有航天器的模型的基础上,基于滑膜控制逻辑,设计所述多航天器系统的干扰观测器;
以及,所述设计单元,还被配置为在已建立的所述多航天器系统中所有航天器的模型的基础上,设计所述多航天器系统中多航天器在博弈时的策略,记为所述多航天器系统的梯度博弈策略;
所述设计单元,还被配置为基于设计得到的所述多航天器系统的干扰观测器、以及设计得到的所述多航天器系统的梯度博弈策略,设计所述多航天器系统的抗干扰控制器;
确定单元,被配置为基于设计得到的所述多航天器系统的抗干扰控制器,确定所述多航天器系统的抗干扰控制器中参数需要满足的约束。
9.一种多航天器系统,其特征在于,包括:如权利要求8所述的多航天器系统的抗干扰控制装置。
10.一种多航天器系统,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至7中任一项所述的多航天器系统的抗干扰控制方法。
CN202210852518.2A 2022-07-20 2022-07-20 多航天器系统及其抗干扰控制方法、装置和存储介质 Pending CN115145296A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210852518.2A CN115145296A (zh) 2022-07-20 2022-07-20 多航天器系统及其抗干扰控制方法、装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210852518.2A CN115145296A (zh) 2022-07-20 2022-07-20 多航天器系统及其抗干扰控制方法、装置和存储介质

Publications (1)

Publication Number Publication Date
CN115145296A true CN115145296A (zh) 2022-10-04

Family

ID=83412674

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210852518.2A Pending CN115145296A (zh) 2022-07-20 2022-07-20 多航天器系统及其抗干扰控制方法、装置和存储介质

Country Status (1)

Country Link
CN (1) CN115145296A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160194095A1 (en) * 2015-01-07 2016-07-07 Mitsubishi Electric Research Laboratories, Inc. Model Predictive Control of Spacecraft
CN112230552A (zh) * 2020-10-30 2021-01-15 西北工业大学深圳研究院 针对离散时间多智能体博弈的抗干扰控制方法
CN112291800A (zh) * 2020-10-29 2021-01-29 西北工业大学深圳研究院 一种针对多卫星通讯网络的抗网络攻击图博弈控制方法
CN112731813A (zh) * 2020-12-29 2021-04-30 西北工业大学 基于复合扰动观测器的航天器多源干扰随机模型预测控制方法
CN113859588A (zh) * 2021-09-30 2021-12-31 西北工业大学 一种航天器姿态/故障/干扰协同观测与容错抗干扰控制方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160194095A1 (en) * 2015-01-07 2016-07-07 Mitsubishi Electric Research Laboratories, Inc. Model Predictive Control of Spacecraft
CN112291800A (zh) * 2020-10-29 2021-01-29 西北工业大学深圳研究院 一种针对多卫星通讯网络的抗网络攻击图博弈控制方法
CN112230552A (zh) * 2020-10-30 2021-01-15 西北工业大学深圳研究院 针对离散时间多智能体博弈的抗干扰控制方法
CN112731813A (zh) * 2020-12-29 2021-04-30 西北工业大学 基于复合扰动观测器的航天器多源干扰随机模型预测控制方法
CN113859588A (zh) * 2021-09-30 2021-12-31 西北工业大学 一种航天器姿态/故障/干扰协同观测与容错抗干扰控制方法

Similar Documents

Publication Publication Date Title
CN110658724B (zh) 一类非线性系统自适应模糊容错控制方法
CN109507885B (zh) 基于自抗扰的无模型自适应auv控制方法
Wang et al. Adaptive T–S fuzzy-neural modeling and control for general MIMO unknown nonaffine nonlinear systems using projection update laws
CN116165885B (zh) 一种高速列车的无模型自适应鲁棒控制方法及系统
Fu et al. Adaptive finite-time event-triggered control of marine surface vehicles with prescribed performance and output constraints
CN115390459A (zh) 模型预测控制方法及装置
Parsa et al. Command-filtered backstepping robust adaptive emotional control of strict-feedback nonlinear systems with mismatched uncertainties
Zhang et al. Fuzzy sampled-data H∞ sliding-mode control for active hysteretic suspension of commercial vehicles with unknown actuator-disturbance
Yu A unified SO (3) approach to the attitude control design for quadrotors
CN115145296A (zh) 多航天器系统及其抗干扰控制方法、装置和存储介质
Hu et al. Fault-tolerant control based on adaptive dynamic programming for reentry vehicles subjected to state-dependent actuator fault
CN112230552B (zh) 针对离散时间多智能体博弈的抗干扰控制方法
CN112068446B (zh) 一种基于离散时间模糊模型的直流电机系统抗干扰控制方法
CN110737197B (zh) 一种基于无模型的柴油机转速自适应自抗扰控制方法
Lu et al. Stability and fuel economy of nonlinear vehicle platoons: A distributed economic MPC approach
CN113872477B (zh) 一种永磁同步电机滑模控制方法及其应用
CN113359415B (zh) 一种新型扰动观测补偿控制器及其实现方法
CN112034712B (zh) 一种基于事件触发的滑模容错控制方法
Zolotas et al. Recent results in tilt control design and assessment of high-speed railway vehicles
CN112147892A (zh) 一种针对多质量块弹簧阻尼器一致性控制的算法
CN110957952A (zh) 一种基于事件触发机制的直流电机系统抗干扰控制方法
Gorzelic et al. SI–HCCI Mode Transitions Without Open-Loop Sequence Scheduling: Online Parameter Adaptation
CN113934143B (zh) 多旋翼飞行器有限时间自适应事件触发容错跟踪控制方法
Peng et al. Model Reference Adaptive Control during Mode Transition of a Parallel Hybrid Electric Vehicle
Zamzuri et al. LQG WITH FUZZY CORRECTION MECHANISM IN TILTING RAILWAY VEHICLE CONTROL DESIGN.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination