CN116449714B - 一种多航天器追捕博弈轨道控制方法 - Google Patents
一种多航天器追捕博弈轨道控制方法 Download PDFInfo
- Publication number
- CN116449714B CN116449714B CN202310430248.0A CN202310430248A CN116449714B CN 116449714 B CN116449714 B CN 116449714B CN 202310430248 A CN202310430248 A CN 202310430248A CN 116449714 B CN116449714 B CN 116449714B
- Authority
- CN
- China
- Prior art keywords
- spacecraft
- pursuit
- escape
- game
- chase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 239000013598 vector Substances 0.000 claims abstract description 40
- 239000011159 matrix material Substances 0.000 claims abstract description 39
- 230000001133 acceleration Effects 0.000 claims abstract description 37
- 230000006870 function Effects 0.000 claims abstract description 20
- 230000009471 action Effects 0.000 claims abstract description 15
- 238000012423 maintenance Methods 0.000 claims abstract description 11
- 230000015572 biosynthetic process Effects 0.000 claims description 16
- 206010048669 Terminal state Diseases 0.000 claims description 2
- 230000004069 differentiation Effects 0.000 claims description 2
- 230000010354 integration Effects 0.000 claims description 2
- 238000013135 deep learning Methods 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 5
- 230000006399 behavior Effects 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012804 iterative process Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000008485 antagonism Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 230000037406 food intake Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
Abstract
本发明公开了一种多航天器追捕博弈轨道控制方法,其包括以下步骤:建立多航天器系统的追逃微分对策模型和代价函数;进行目标控制点预分配;求解追逃微分对策模型,得到追逃博弈对应的矩阵黎卡提微分方程;获取航天器轨道机动的推力加速度矢量;获取追逃博弈最优轨迹和完成追捕后的状态参数;将多航天器的围捕构型保持问题转化为单个航天器的轨道保持问题;将单个航天器轨道控制的初状态作为DQN网络的输入;将追逃博弈最优轨迹作为对应航天器的目标轨迹,将DQN网络输出的动作作为对应航天器的轨道控制动作。本方法通过博弈论及微分对策和深度学习算法解决多航天器追捕博弈及其围捕后构型维持的问题,可以高效实现多航天器追捕博弈轨道控制。
Description
技术领域
本发明涉及航天器轨道控制领域,具体涉及一种多航天器追捕博弈轨道控制方法。
背景技术
多航天追捕博弈轨道控制是指在针对非合作、智能的目标航天器时,通过博弈任务分配,多航天器协同追逃,实现对目标的围捕,并保持围捕轨道构型一段时间的相对稳定。能够弥补在单个航天器性能处于相对落后的条件下,在轨博弈能力不足的缺点,为空间攻防问题提供有效方案。
现有关于多航天器建模与控制的研究大多面向编队/集群飞行任务展开,不涉及具有非合作特性的空间目标。空间非合作目标具有信息层面不沟通、机动行为不配合的特点,其动力学行为呈现出的不确定性及对抗性,增加了对其进行协同追捕的挑战性。博弈围捕队形轨道保持方面,由于受到各类摄动力的影响,包括日月摄动力、光压摄动力、潮汐摄动力、大气阻力、地球非球形引力摄动力等,其中以地球扁率引起的J2项摄动为主。摄动力会引起航天器持续偏离预定轨道,导致围捕编队队形遭到破坏。较为传统的LQR算法需要对编队动力学模型精确建模,然而精确模型具有非线性、复杂、时变等特点,一旦编队中航天器数量增多,动力学建模难度将会激增,控制器设计也会变得更加困难。而复杂的太空环境及多航天器追捕博弈所面临的问题多是非线性且时变的,传统的构型保持方法将很难适用。
专利《一种基于动态博弈理论的多航天器追逃控制方法》(专利号:CN201911003658.7)中,建立在同一时间历程下的多航天器博弈模型,提供一种基于动态博弈理论的多航天器追逃控制方法。但是该发明忽略了一切摄动力对围捕轨道控制的影响,在实际近地轨道中编队构型会受到以地球偏心率引起的J2摄动项的破坏,无法持续实现追捕目标。
专利《一种解析构造航天器追逃界栅和判断捕获逃逸区域的方法》(专利号:CN201810109434.3)中,所述的方法基于微分对策的Hamilton函数,可以求解出航天器追逃博弈界栅解析表达式,其结果可为博弈路径规划提供有效的参考。但是,该发明仅面向航天器一对一追逃博弈进行设计,无法完成多航天器追逃博弈任务。
专利《低轨卫星星座构型保持方法》(专利号CN 202011527273.3)中,针对低轨卫星系统特点,提出了一种在考虑大气阻力摄动的情况下的基于轨道参数偏置的低轨卫星星座构型保持方法,但是此方法不适合应用在多星博弈的场景中,由于面对的是具有复杂动力学行为的空间非合作目标,难以及时获取各类飞行参数且会大大增加求解难度。
综上,面对复杂的太空环境及日益增长的战略需要,如何解决多航天器协同追捕对抗非合作目标及围捕后的编队构型相对保持成为实现多航天追捕博弈及轨道控制任务的关键。
发明内容
针对现有技术中的上述不足,本发明提供的一种多航天器追捕博弈轨道控制方法解决了现有技术难以同时进行多航天器轨道控制的问题。
为了达到上述发明目的,本发明采用的技术方案为:
提供一种多航天器追捕博弈轨道控制方法,其包括以下步骤:
S1、基于航天器的运动状态矢量建立多航天器系统的追逃微分对策模型,以及对应的代价函数;多航天器系统包括追捕航天器和逃逸航天器;
S2、利用匈牙利算法以距离最近原则进行追捕航天器目标控制点预分配,开始一对一追逃博弈;
S3、设置追逃微分对策模型中权值矩阵的初始值,以追捕航天器最小化其代价函数、逃逸航天器最大化其代价函数为目标,通过哈密顿函数求解追逃微分对策模型,得到追逃博弈对应的矩阵黎卡提微分方程;
S4、通过求解矩阵黎卡提微分方程的逆矩阵,获取追捕航天器和逃逸航天器轨道机动的推力加速度矢量;
S5、基于追捕航天器和逃逸航天器轨道机动的推力加速度矢量,通过运动学方程得到追逃博弈最优轨迹和完成追捕后的状态参数;
S6、以完成追捕后的状态参数作为轨道控制的初状态,搭建航天器飞行编队相对动力学模型,将多航天器的构型保持问题转化为单个航天器的轨道保持问题;
S7、将单个航天器轨道控制的初状态作为DQN网络的输入,获取DQN网络输出的动作;
S8、将追逃博弈最优轨迹作为对应航天器的目标轨迹,将DQN网络输出的动作作为对应航天器的轨道控制动作。
本发明的有益效果为:本发明同时考虑多航天器追捕博弈与围捕后多航天器飞行编队构型维持两个过程任务,将两个过程有机融合,通过博弈论及微分对策和深度学习算法解决多航天器追捕博弈及其围捕后构型维持的问题,可以高效实现多航天器追捕博弈轨道控制。
附图说明
图1为本方法的流程示意图;
图2为目标采取博弈策略下追逃二维平面轨迹示意图;
图3为目标采取不机动下追逃二维平面轨迹示意图;
图4为目标采取余弦机动下追逃二维平面轨迹示意图;
图5为训练50000轮航天器误差对比图;
图6为追捕航天器绝对运动轨道对比图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
如图1所示,该多航天器追捕博弈轨道控制方法包括以下步骤:
S1、基于航天器的运动状态矢量建立多航天器系统的追逃微分对策模型,以及对应的代价函数;多航天器系统包括追捕航天器和逃逸航天器;
S2、利用匈牙利算法以距离最近原则进行追捕航天器目标控制点预分配,开始一对一追逃博弈;
S3、设置追逃微分对策模型中权值矩阵的初始值,以追捕航天器最小化其代价函数、逃逸航天器最大化其代价函数为目标,通过哈密顿函数求解追逃微分对策模型,得到追逃博弈对应的矩阵黎卡提微分方程;
S4、通过求解矩阵黎卡提微分方程的逆矩阵,获取追捕航天器和逃逸航天器轨道机动的推力加速度矢量;
S5、基于追捕航天器和逃逸航天器轨道机动的推力加速度矢量,通过运动学方程得到追逃博弈最优轨迹和完成追捕后的状态参数;状态参数包括位置和加速度的矢量;
S6、以完成追捕后的状态参数作为轨道控制的初状态,搭建航天器飞行编队相对动力学模型,将多航天器的构型保持问题转化为单个航天器的轨道保持问题;
S7、将单个航天器轨道控制的初状态作为DQN网络(Deep Q-learning网络)的输入,获取DQN网络输出的动作;
S8、将追逃博弈最优轨迹作为对应航天器的目标轨迹,将DQN网络输出的动作作为对应航天器的轨道控制动作。
步骤S1中追逃微分对策模型的表达式为:
其中为逃逸航天器与追捕航天器的相对运动空间状态矢量的一阶微分;X为逃逸航天器与追捕航天器的相对运动状态矢量;ue为逃逸航天器推力加速度矢量,ue=[aex,aey,aez]T,aex、aey、aez分别为逃逸航天器在x轴、y轴、z轴方向上的推力加速度;up为追捕航天器推力加速度矢量,up=[apx,apy,apz]T,apx、apy、apz分别为追捕航天器在x轴、y轴、z轴方向上的推力加速度;Je和Jp分别为追捕航天器与逃逸航天器的代价函数;tf表示固定时域微分对策的终端时间;X(tf)表示终端时刻逃逸航天器与追捕航天器的相对运动状态矢量;(·)T表示矩阵的转置;S表示终端状态性能指标加权矩阵;Q(t)表示当前状态性能指标加权矩阵;Rp表示追捕航天器的控制性能指标的加权矩阵;up(t)表示t时刻追捕航天器推力加速度矢量;Re表示逃逸航天器的控制性能指标的加权矩阵;ue(t)表示t时刻逃逸航天器推力加速度矢量;/>ω为参考轨道平均角速度;
步骤S3中哈密顿函数的表达式为:
其中H表示哈密顿函数;λ(t)T为t时刻协态变量λ(t)的转置矩阵,λ(t)=P()(),x()为t时刻的协态变量状态解;协态变量指不受实验设计控制的独立变量;协态变量状态解包括位置和加速度的矢量。
步骤S3中追逃博弈对应的矩阵黎卡提微分方程表达式为:
其中P()为t时刻关于协态变量状态解的对称矩阵,为P()的微分矢量;Qp和Qe分别表示追捕航天器和逃逸航天器的对策矩阵;追逃博弈对应的矩阵黎卡提微分方程的终端条件为/>即P(Tf)=;/> P(Tf)表示终端时刻关于协态变量状态解的对称矩阵。
步骤S4的具体方法包括以下子步骤:
S4-1、在追逃博弈对应的矩阵黎卡提微分方程的基础上,采用四阶龙格-库塔方法倒向积分求得随时间变化的P(),并根据公式:
获取追捕航天器在t时刻的反馈增益矩阵Kp()和逃逸航天器在t时刻的反馈增益矩阵Ke();
S4-2、根据公式:
得到追捕航天器在t时刻轨道机动的推力加速度矢量up()和逃逸航天器在t时刻轨道机动的推力加速度矢量ue()。
步骤S6的具体方法包括以下子步骤:
S6-1、根据公式:
在构建参考航天器轨道坐标系下的相对运动学方程;其中为逃逸航天器与追捕航天器间的相对加速度;ω为参考轨道的平均角速度;/>为逃逸航天器与追捕航天器间的相对速度;r为逃逸航天器与追捕航天器间的距离;μ为地球引力常数,取值为3.986×1014m3/s2;re为逃逸航天器到坐标系原点的距离;x为逃逸航天器与追捕航天器的相对位置矢量在x轴方向上的投影;rp为追捕航天器到坐标系原点的距离;Δf为逃逸航天器与追捕航天器的相对摄动加速度大小;
S6-2、在参考航天器轨道坐标系下的相对运动学方程基础上将J2项摄动线性化,得到修正后的航天器飞行编队相对动力学模型,其表达式为:
其中为逃逸航天器与追捕航天器的相对加速度在x轴方向上的投影;/>为逃逸航天器与追捕航天器的相对加速度在y轴方向上的投影;/>为逃逸航天器与追捕航天器的相对加速度在z轴方向上的投影;/>为逃逸航天器与追捕航天器的相对速度在x轴方向上的投影;/>为逃逸航天器与追捕航天器的相对速度在y轴方向上的投影;J2表示特性化后的摄动力;RE为地球半径;re为航天器到地球的距离;i表示轨道倾角;u表示推力加速度;x为逃逸航天器与追捕航天器的相对位置矢量在x轴方向上的投影;y为逃逸航天器与追捕航天器的相对位置矢量在y轴方向上的投影;z为逃逸航天器与追捕航天器的相对位置矢量在z轴方向上的投影;ω为参考轨道平均角速度。
在具体实施过程中,DQN网络对数据的处理涉及到迭代。当多航天编队在某个环境当中时,航天器的每个状态是其对当前环境的感知;航天器执行动作使当前状态按照某一概率转到另一个状态的过程。与此同时,航天器在这一转移过程中会根据某一潜在的奖励函数得到由环境反馈回的一个奖励。在该过程中,设置折扣奖励函数:
其中Gt为折扣奖励函数;为每一步的折扣因子,表示未来奖励的重要程度,γ越大,则未来奖励越重要;Rt+k为t时刻的航天器在第K步迭代的奖励。在迭代过程中,航天器目标是学习最佳队形维持策略,使其自身累积的折扣奖励Gt最大化。
DQN网络的值函数迭代过程为:
其中表示更新后的收益期望,具体表示t时刻的航天器在状态st下采取动作at获得的收益;α为DQN网络的学习率;maxπQ(st+1,at)表示航天器在状态st+1时执行策略π所获得的累计折扣奖励在执行节点动作at时所能达到的收益期望最大值;Rt为t时刻的航天器的奖励。
开始迭代之后执行动作并积累经验,获得下一状态信息,将该状态转移过程储存到经验池中,采用经验回放机制,在强化学习时利用经验池储存的经验来更新Q值,持续迭代,将t时刻的航天器在状态st下对应的收益期望最大值中的动作at作为DQN网络的输出。
在本发明的一个实施例中,如图2、图3和图4所示,可以看出采用博弈控制算法在目标不同机动能力时,最终均能到达指定地点,由此证明本方法的优越性。
从图5可以看出,在航天器飞行三个周期20000s的时间内,航天器的位置误差及速度误差均保持在了一个较为稳定的范围内。对于x方向,位置误差最大不超过0.03km,速度误差呈一定的波动状态,保持在-0.01~0.01m/s左右;对于y方向,位置误差随着时间慢慢增加,但增幅量很小,在飞行三个周期内误差量能保持在0.2m之内,速度误差呈波动状保持在0.02m/s范围内;对于z方向,速度误差和伴随误差均呈波动状,最终波动均不超过预设范围。由此可见,本方法使得最终效果收敛,同时也证明了本方法将DQN算法用于多航天器编队构型维持上的合理性。
从图6中可以看出,受控后的绝对运动轨道相对于有摄动情况下明显有了很大的改善,受控制后追捕航天器绝对运动轨道基本上紧挨着无摄动力影响时的轨道,J2项摄动力对轨道的影响基本上被消除,验证了DQN网络在本方法中的可行性。
Claims (5)
1.一种多航天器追捕博弈轨道控制方法,其特征在于,包括以下步骤:
S1、基于航天器的运动状态矢量建立多航天器系统的追逃微分对策模型,以及对应的代价函数;多航天器系统包括追捕航天器和逃逸航天器;
S2、利用匈牙利算法以距离最近原则进行追捕航天器目标控制点预分配,开始一对一追逃博弈;
S3、设置追逃微分对策模型中权值矩阵的初始值,以追捕航天器最小化其代价函数、逃逸航天器最大化其代价函数为目标,通过哈密顿函数求解追逃微分对策模型,得到追逃博弈对应的矩阵黎卡提微分方程;
S4、通过求解矩阵黎卡提微分方程的逆矩阵,获取追捕航天器和逃逸航天器轨道机动的推力加速度矢量;
S5、基于追捕航天器和逃逸航天器轨道机动的推力加速度矢量,通过运动学方程得到追逃博弈最优轨迹和完成追捕后的状态参数;
S6、以完成追捕后的状态参数作为轨道控制的初状态,搭建航天器飞行编队相对动力学模型,将多航天器的构型保持问题转化为单个航天器的轨道保持问题;
S7、将单个航天器轨道控制的初状态作为DQN网络的输入,获取DQN网络输出的动作;
S8、将追逃博弈最优轨迹作为对应航天器的目标轨迹,将DQN网络输出的动作作为对应航天器的轨道控制动作;
步骤S6的具体方法包括以下子步骤:
S6-1、根据公式:
构建参考航天器轨道坐标系下的相对运动学方程;其中为逃逸航天器与追捕航天器间的相对加速度;ω为参考轨道的平均角速度;/>为逃逸航天器与追捕航天器间的相对速度;r为逃逸航天器与追捕航天器间的距离;μ为地球引力常数;re为逃逸航天器到坐标系原点的距离;x为逃逸航天器与追捕航天器的相对位置矢量在x轴方向上的投影;rp为追捕航天器到坐标系原点的距离;Δf为逃逸航天器与追捕航天器的相对摄动加速度大小;
S6-2、在参考航天器轨道坐标系下的相对运动学方程基础上将J2项摄动线性化,得到修正后的航天器飞行编队相对动力学模型,其表达式为:
其中为逃逸航天器与追捕航天器的相对加速度在x轴方向上的投影;/>为逃逸航天器与追捕航天器的相对加速度在y轴方向上的投影;/>为逃逸航天器与追捕航天器的相对加速度在z轴方向上的投影;/>为逃逸航天器与追捕航天器的相对速度在x轴方向上的投影;为逃逸航天器与追捕航天器的相对速度在y轴方向上的投影;J2表示特性化后的摄动力;RE为地球半径;re为航天器到地球的距离;i表示轨道倾角;u表示推力加速度;x为逃逸航天器与追捕航天器的相对位置矢量在x轴方向上的投影;y为逃逸航天器与追捕航天器的相对位置矢量在y轴方向上的投影;z为逃逸航天器与追捕航天器的相对位置矢量在z轴方向上的投影;ω为参考轨道平均角速度。
2.根据权利要求1所述的多航天器追捕博弈轨道控制方法,其特征在于,步骤S1中追逃微分对策模型的表达式为:
Je=-Jp
其中为逃逸航天器与追捕航天器的相对运动空间状态矢量的一阶微分;X为逃逸航天器与追捕航天器的相对运动状态矢量;ue为逃逸航天器推力加速度矢量,ue=[aex,aey,aez]T,aex、aey、aez分别为逃逸航天器在x轴、y轴、z轴方向上的推力加速度;up为追捕航天器推力加速度矢量,up=[apx,apy,apz]T,apx、apy、apz分别为追捕航天器在x轴、y轴、z轴方向上的推力加速度;Je和Jp分别为追捕航天器与逃逸航天器的代价函数;tf表示固定时域微分对策的终端时间;X(tf)表示终端时刻逃逸航天器与追捕航天器的相对运动状态矢量;(·)T表示矩阵的转置;S表示终端状态性能指标加权矩阵;Q(t)表示当前状态性能指标加权矩阵;Rp表示追捕航天器的控制性能指标的加权矩阵;up(t)表示t时刻追捕航天器推力加速度矢量;Re表示逃逸航天器的控制性能指标的加权矩阵;ue(t)表示t时刻逃逸航天器推力加速度矢量;ω为参考轨道平均角速度;/>
3.根据权利要求2所述的多航天器追捕博弈轨道控制方法,其特征在于,步骤S3中哈密顿函数的表达式为:
其中H表示哈密顿函数;λ(t)T为t时刻协态变量λ(t)的转置矩阵,λ(t)=P(t)x(t),P(t)为t时刻关于协态变量状态解的对称矩阵,x(t)为t时刻的协态变量状态解。
4.根据权利要求3所述的多航天器追捕博弈轨道控制方法,其特征在于,步骤S3中追逃博弈对应的矩阵黎卡提微分方程表达式为:
其中为P(t)的微分矢量;Qp和Qe分别表示追捕航天器和逃逸航天器的对策矩阵;追逃博弈对应的矩阵黎卡提微分方程的终端条件为/> 即P(Tf)=S;/>P(Tf)表示终端时刻关于协态变量状态解的对称矩阵。
5.根据权利要求4所述的多航天器追捕博弈轨道控制方法,其特征在于,步骤S4的具体方法包括以下子步骤:
S4-1、在追逃博弈对应的矩阵黎卡提微分方程的基础上,采用四阶龙格-库塔方法倒向积分求得随时间变化的P(t),并根据公式:
获取追捕航天器在t时刻的反馈增益矩阵Kp(t)和逃逸航天器在t时刻的反馈增益矩阵Ke(t);
S4-2、根据公式:
得到追捕航天器在t时刻轨道机动的推力加速度矢量up(t)和逃逸航天器在t时刻轨道机动的推力加速度矢量ue(t)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310430248.0A CN116449714B (zh) | 2023-04-20 | 2023-04-20 | 一种多航天器追捕博弈轨道控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310430248.0A CN116449714B (zh) | 2023-04-20 | 2023-04-20 | 一种多航天器追捕博弈轨道控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116449714A CN116449714A (zh) | 2023-07-18 |
CN116449714B true CN116449714B (zh) | 2024-01-23 |
Family
ID=87131757
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310430248.0A Active CN116449714B (zh) | 2023-04-20 | 2023-04-20 | 一种多航天器追捕博弈轨道控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116449714B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117332684B (zh) * | 2023-09-25 | 2024-04-26 | 同济大学 | 一种基于强化学习的多航天器追逃博弈下的最优捕获方法 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012078022A1 (en) * | 2010-12-09 | 2012-06-14 | Universiti Sains Malaysia | System of autonomous surface vehicles with swarming algorithm |
CN104850009A (zh) * | 2015-03-17 | 2015-08-19 | 北京航空航天大学 | 一种基于捕食逃逸鸽群优化的多无人飞行器编队协调控制方法 |
WO2017005052A1 (zh) * | 2015-07-09 | 2017-01-12 | 北京航空航天大学 | 航天器脉冲交会轨迹的梯度分割区间优化设计方法 |
CN108519958A (zh) * | 2018-02-05 | 2018-09-11 | 中国人民解放军国防科技大学 | 一种解析构造航天器追逃界栅和判断捕获逃逸区域的方法 |
GB201910670D0 (en) * | 2018-07-25 | 2019-09-11 | Univ Northwestern Polytechnical | Neural network-based method for pursuit-evasion game of spacecrafts |
CN110673486A (zh) * | 2019-10-22 | 2020-01-10 | 北京航空航天大学 | 一种基于动态博弈理论的多航天器追逃控制方法 |
CN113296535A (zh) * | 2021-05-24 | 2021-08-24 | 四川大学 | 一种基于随机模型预测控制的卫星编队重构算法 |
WO2021237618A1 (zh) * | 2020-05-28 | 2021-12-02 | 深圳市大疆创新科技有限公司 | 抓捕辅助方法、地面指挥平台、无人机、系统及存储介质 |
CN114415730A (zh) * | 2022-03-21 | 2022-04-29 | 南京航空航天大学 | 航天器逃逸轨迹智能规划方法 |
CN114911167A (zh) * | 2022-05-25 | 2022-08-16 | 中国人民解放军国防科技大学 | 一种航天器有限时间追逃博弈控制的解析求解方法与系统 |
CN115729112A (zh) * | 2023-01-10 | 2023-03-03 | 中国人民解放军国防科技大学 | 一种航天器追踪-逃逸-防御三方博弈的制导方法及系统 |
CN115857340A (zh) * | 2022-11-25 | 2023-03-28 | 中国空间技术研究院 | 基于递进打靶法的双航天器博弈路径规划方法 |
CN115892519A (zh) * | 2023-02-23 | 2023-04-04 | 哈尔滨工业大学 | 一种用于近距离航天器轨道脉冲博弈的航天器控制方法 |
-
2023
- 2023-04-20 CN CN202310430248.0A patent/CN116449714B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012078022A1 (en) * | 2010-12-09 | 2012-06-14 | Universiti Sains Malaysia | System of autonomous surface vehicles with swarming algorithm |
CN104850009A (zh) * | 2015-03-17 | 2015-08-19 | 北京航空航天大学 | 一种基于捕食逃逸鸽群优化的多无人飞行器编队协调控制方法 |
WO2017005052A1 (zh) * | 2015-07-09 | 2017-01-12 | 北京航空航天大学 | 航天器脉冲交会轨迹的梯度分割区间优化设计方法 |
CN108519958A (zh) * | 2018-02-05 | 2018-09-11 | 中国人民解放军国防科技大学 | 一种解析构造航天器追逃界栅和判断捕获逃逸区域的方法 |
GB201910670D0 (en) * | 2018-07-25 | 2019-09-11 | Univ Northwestern Polytechnical | Neural network-based method for pursuit-evasion game of spacecrafts |
CN110673486A (zh) * | 2019-10-22 | 2020-01-10 | 北京航空航天大学 | 一种基于动态博弈理论的多航天器追逃控制方法 |
WO2021237618A1 (zh) * | 2020-05-28 | 2021-12-02 | 深圳市大疆创新科技有限公司 | 抓捕辅助方法、地面指挥平台、无人机、系统及存储介质 |
CN113296535A (zh) * | 2021-05-24 | 2021-08-24 | 四川大学 | 一种基于随机模型预测控制的卫星编队重构算法 |
CN114415730A (zh) * | 2022-03-21 | 2022-04-29 | 南京航空航天大学 | 航天器逃逸轨迹智能规划方法 |
CN114911167A (zh) * | 2022-05-25 | 2022-08-16 | 中国人民解放军国防科技大学 | 一种航天器有限时间追逃博弈控制的解析求解方法与系统 |
CN115857340A (zh) * | 2022-11-25 | 2023-03-28 | 中国空间技术研究院 | 基于递进打靶法的双航天器博弈路径规划方法 |
CN115729112A (zh) * | 2023-01-10 | 2023-03-03 | 中国人民解放军国防科技大学 | 一种航天器追踪-逃逸-防御三方博弈的制导方法及系统 |
CN115892519A (zh) * | 2023-02-23 | 2023-04-04 | 哈尔滨工业大学 | 一种用于近距离航天器轨道脉冲博弈的航天器控制方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116449714A (zh) | 2023-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
An et al. | Sliding mode disturbance observer-enhanced adaptive control for the air-breathing hypersonic flight vehicle | |
CN110442020B (zh) | 一种新型的基于鲸鱼优化算法的容错控制方法 | |
CN111240345B (zh) | 基于双bp网络增强学习框架的水下机器人轨迹跟踪方法 | |
US20230381956A1 (en) | Multi-arm Spacecraft Model Predictive Control Method Based on Mixture of Gaussian Processes, Equipment, and Medium | |
CN116449714B (zh) | 一种多航天器追捕博弈轨道控制方法 | |
CN111580544A (zh) | 一种基于强化学习ppo算法的无人机目标跟踪控制方法 | |
CN114815872B (zh) | 一种针对碰撞规避的星座智能自主轨道控制方法 | |
CN113377121B (zh) | 一种基于深度强化学习的飞行器智能抗扰动控制方法 | |
CN112001120B (zh) | 一种基于强化学习的航天器对多拦截器自主规避机动方法 | |
CN116142490A (zh) | 复杂约束下基于势函数的航天器姿态重定向控制方法 | |
Zhang et al. | Fuzzy event-triggered sliding mode depth control of unmanned underwater vehicles | |
Wang et al. | Intelligent control of air-breathing hypersonic vehicles subject to path and angle-of-attack constraints | |
CN116697829A (zh) | 一种基于深度强化学习的火箭着陆制导方法及系统 | |
CN116125811A (zh) | 基于近端策略优化的航天器多空间碎片避撞自主决策方法 | |
CN115256401A (zh) | 一种基于强化学习的空间机械臂轴孔装配变阻抗控制方法 | |
CN116203835A (zh) | 一种基于脉冲推力的航天器轨道追逃博弈方法 | |
Kim et al. | Adaptive output feedback for high-bandwidth flight control | |
Srivastava et al. | Deep Reinforcement Learning Based Control of Rotation Floating Space Robots for Proximity Operations in PyBullet | |
Lee et al. | Stochastic robust team formation tracking design of multi-VTOL-UAV networked control system in smart city under time-varying delay and random fluctuation | |
CN115524969A (zh) | 一种提高空间交会对接模型预测控制运算速度的方法 | |
CN111552317B (zh) | 一种多航天器四维协同轨迹确定方法 | |
Raj et al. | Robust higher-order sliding mode control systems for roll-coupled maneuvers of aircraft using output feedback | |
Roelke et al. | Multi-event drag modulation aerocapture guidance under uncertainty | |
Zhao et al. | Reinforcement learning based spacecraft autonomous evasive maneuvers method against multi-interceptors | |
Ramezani et al. | PPO-Based Dynamic Control of Uncertain Floating Platforms in Zero-G Environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |