CN114003050A - 一种基于微分博弈的三体对抗策略的主动防御制导方法 - Google Patents

一种基于微分博弈的三体对抗策略的主动防御制导方法 Download PDF

Info

Publication number
CN114003050A
CN114003050A CN202111160542.1A CN202111160542A CN114003050A CN 114003050 A CN114003050 A CN 114003050A CN 202111160542 A CN202111160542 A CN 202111160542A CN 114003050 A CN114003050 A CN 114003050A
Authority
CN
China
Prior art keywords
missile
guidance
attacking
derivative
active defense
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111160542.1A
Other languages
English (en)
Other versions
CN114003050B (zh
Inventor
陈必露
刘春生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN202111160542.1A priority Critical patent/CN114003050B/zh
Publication of CN114003050A publication Critical patent/CN114003050A/zh
Application granted granted Critical
Publication of CN114003050B publication Critical patent/CN114003050B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/08Control of attitude, i.e. control of roll, pitch, or yaw
    • G05D1/0808Control of attitude, i.e. control of roll, pitch, or yaw specially adapted for aircraft
    • G05D1/0816Control of attitude, i.e. control of roll, pitch, or yaw specially adapted for aircraft to ensure stability
    • G05D1/0833Control of attitude, i.e. control of roll, pitch, or yaw specially adapted for aircraft to ensure stability using limited authority control

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明公开了基于微分博弈的三体对抗策略的主动防御制导方法,该方法具体包括如下步骤:建立三体对抗微分博弈制导运动学方程,基于建立的三体对抗微分博弈制导运动学方程建立主动防御场景下具有反馈形式的主动防御制导系统,该主动防御制导系统的输入包括前馈控制和反馈最优控制;该主动防御制导系统控制目标导弹不被进攻导弹击中,以及控制防卫导弹对进攻导弹的有效拦截。本发明采取了非线性的导弹模型进行研究,充分考虑了导弹高耦合,复杂非线性等特征。所设计的微分博弈制导律更加贴合实际应用的需求。

Description

一种基于微分博弈的三体对抗策略的主动防御制导方法
技术领域
本发明属于飞行器制导方法研究领域。
背景技术
随着航空航天技术的发展。目前各种强机动,智能化,高速化的导弹(如高速巡航导弹,弹道导弹等)不断涌现,这类集先进技术于一体的现代拦截进攻导弹对执行任务中的高价值空中目标(导弹或飞行器等)形成了巨大威胁。这类场景中,由于拦截进攻导弹采取更快的飞行速度和高机动性的特点,执行任务中的目标往往被拦截导弹拦截从而导致任务失败。因此,为了使目标飞行器成功突防,可以采用目标携带防卫导弹的三体对抗主动防御场景。用防卫导弹拦截进攻导弹,同时目标在对抗过程中可选择与防卫导弹进行共同防御或者让防卫导弹单独完成拦截自身做逃逸机动。
导弹的制导律是实现精准打击或拦截的火控系统的关键技术之一,其选择至关重要。在上述的三体对抗主动防御场景中,存在进攻导弹和防卫导弹以及进攻导弹和目标之间的对抗问题,其本质是由多个智能体共同参与的双方追逃博弈过程,在此过程中多个决策主体依据各自的最优目标进行博弈并选择相应的制导律。微分博弈理论作为研究双方或多方最优控制的理论,不仅能有效解决冲突对抗和竞争问题,还强调在对抗过程中能动态地考虑对方的策略来最大化自己的利益,是一个动态博弈的过程。因此,近年来利用微分博弈理论研究“智能”制导技术成为了一门热点。
然而,现有的三体对抗主动防御场景下的导弹制导律设计大部分对导弹的运动模型进行了线性化处理,不符合导弹系统具有的复杂非线性、多约束、强耦合等特征。因此,结合微分博弈理论设计一种非线性导弹模型下的主动防御制导律尤其重要。
发明内容
发明目的:为了解决上述现有技术存在的问题,本发明提供了一种基于微分博弈的三体对抗策略的主动防御制导方法。
技术方案:本发明提供了一种基于微分博弈的三体对抗策略的主动防御制导方法,具体包括如下步骤:
步骤1:建立三体对抗微分博弈制导运动学方程,所述三体包括:防卫导弹,进攻导弹和目标导弹;
步骤2:基于步骤1建立的三体对抗微分博弈制导运动学方程建立主动防御场景下具有反馈形式的主动防御制导系统,该主动防御制导系统的输入包括前馈控制ua和反馈最优控制u’;
步骤3:将步骤2的主动防御制导系统的跟踪控制问题转换为误差系统的最优调节问题,从而计算主动防御制导系统的前馈控制ua
步骤4:采用神经网络计算反馈最优控制u’;
步骤5:将步骤3和步骤4计算得到的ua和u’输入步骤2中的主动防御制导系统中,使得该主动防御制导系统控制目标导弹不被进攻导弹击中,以及控制防卫导弹对进攻导弹的有效拦截。
进一步的,所述步骤1中的三体对抗微分博弈制导运动学方程包括:进攻导弹-目标导弹的相对运动方程和进攻导弹-防卫导弹的相对运动方程;
所述进攻导弹-目标导弹的相对运动方程为:
Figure BDA0003290022660000021
σ1=(VTsin(β-θ1)-VMsin(α-θ1))/r1
Figure BDA0003290022660000022
Figure BDA0003290022660000023
其中,r1表示进攻导弹和目标导弹之间的相对距离,
Figure BDA0003290022660000024
为r1的一阶导数,VT表示目标导弹的速度,β表示目标导弹的航向角,
Figure BDA0003290022660000025
为β的一阶导数,θ1表示进攻导弹和目标导弹之间的视线角,VM表示进攻导弹的速度,
Figure BDA0003290022660000026
为α的一阶导数,α表示进攻导弹的航向角,σ1表示进攻导弹和目标导弹之间的视线角速率;
Figure BDA0003290022660000027
为α的一阶导数,ω为进攻导弹垂直于速度向量的加速度控制量,
Figure BDA0003290022660000028
N为比例导引系数,
Figure BDA0003290022660000029
为θ1的一阶导数,u为目标导弹垂直于速度向量的加速度控制量;
所述进攻导弹-防卫导弹的相对运动方程:
Figure BDA00032900226600000210
σ2=(VDsin(γ-θ2)-VMsin(α-θ2))/r2
Figure BDA00032900226600000211
Figure BDA00032900226600000212
其中,r2为进攻导弹和防卫导弹的相对距离,
Figure BDA00032900226600000213
为r2的一阶导数,VD为防卫导弹的速度,γ为防卫导弹的航向角,
Figure BDA0003290022660000031
为γ的一阶导数,θ2为进攻导弹和防卫导弹的视线角,σ2为进攻导弹和防卫导弹的视线角速率;v表示防卫导弹垂直于速度向量的加速度控制量。
进一步的,所述步骤2中的主动防御制导系统为:
Figure BDA0003290022660000032
Figure BDA0003290022660000033
y=x1
其中,x1=r1-r2-rc
Figure BDA0003290022660000034
Figure BDA0003290022660000035
为x1的一阶导数,
Figure BDA0003290022660000036
为x2的一阶导数,rc为预设的进攻导弹的爆炸杀伤力半径,
Figure BDA0003290022660000037
v1表示作用在x1上的控制分量,
Figure BDA0003290022660000038
Figure BDA0003290022660000039
为θ2的一阶导数,
Figure BDA00032900226600000310
y为输出变量,u=ua+u’。
进一步的,所述步骤3中基于Backstepping控制理论和Lyapunov函数计算主动防御制导系统的前馈控制;具体为:
基于Backstepping控制理论,建立误差动态面为:
z1=y-yd
z2=x2-x2d
其中,yd为预设的的参考信号,
Figure BDA00032900226600000311
Figure BDA00032900226600000312
表示虚拟的前馈控制部分,
Figure BDA00032900226600000313
表示虚拟的反馈最优控制部分,z1和z2为均误差动态面的变量;
计算状态变量z1的一阶导数,并取z1的障碍Lyapunov函数;计算状态变量z2的一阶导数,并取z2的障碍Lyapunov函数,最终得到实际的前馈控制ua为:
Figure BDA00032900226600000314
其中,
Figure BDA00032900226600000315
x1d=yd,λ2为参数,λ2>0;
Figure BDA00032900226600000316
为x2d的一阶导数。
进一步的,所述步骤4中的计算反馈最优控制u’为:
基于反馈最优控制u’建立如下等效仿射非线性系统:
Figure BDA0003290022660000041
其中,
Figure BDA0003290022660000042
Figure BDA0003290022660000043
为s的一阶导数,
Figure BDA0003290022660000044
T为转置,
Figure BDA0003290022660000045
Figure BDA0003290022660000046
为上述等效仿射非线性系统建立性能评价函数:
Figure BDA0003290022660000047
Q(s)表示半正定函数,Q(s)≥0,R1和R2均为预设的正定对称矩阵;
根据最优控制原理,设置Hamilton函数为:
Figure BDA0003290022660000048
其中,
Figure BDA0003290022660000049
根据微分博弈原理和Hamilton函数得到合作型微分博弈制导律为:
Figure BDA00032900226600000410
其中,-1表示求逆运算,*表示最优解;
根据Hamilton函数和合作型微分博弈制导律得到HJI方程为:
Figure BDA00032900226600000411
其中,
Figure BDA00032900226600000412
采用神经网络对HJI方程进行求解得到评价函数的最优值J*(s),从而得到U*
Figure BDA00032900226600000413
最终根据U*
Figure BDA00032900226600000414
得到u’;
所述神经网络的输出函数为:
Figure BDA00032900226600000415
其中,
Figure BDA00032900226600000416
表示权值向量,
Figure BDA00032900226600000417
为J*(s)的估计值,φJ(s)为激励函数向量;
基于梯度下降法对神经网络的权值进行更新,权值更新的表达式为:
Figure BDA0003290022660000051
其中,
Figure BDA0003290022660000052
Figure BDA0003290022660000053
的一阶导数,αJ表示神经网络的学习率,αJ>0,
Figure BDA0003290022660000054
Figure BDA0003290022660000055
表示激励函数对s的偏导数;
Figure BDA0003290022660000056
Figure BDA0003290022660000057
为U*的估计值,
Figure BDA0003290022660000058
Figure BDA0003290022660000059
的估计值,ec为神经网络近似HJI方程时产生的误差量,Js(s)为预设的Lyapunov函数,Js(s)的一阶导数,
Figure BDA00032900226600000510
Figure BDA00032900226600000511
Y1和Y2均为预设的设计参数,
Figure BDA00032900226600000512
的表达式为:
Figure BDA00032900226600000513
有益效果:
1、本发明在进攻导弹-目标-防卫导弹的三体对抗制导研究中,采取了非线性的导弹模型进行研究,充分考虑了导弹高耦合,复杂非线性等特征。所设计的微分博弈制导律更加贴合实际应用的需求。
2、本发明在微分博弈制导律的研究中结合了Backstepping控制方法,将严格反馈形式的三体对抗系统从跟踪控制问题转化为最优调节问题,设计的微分博弈制导律不仅完成了制导目标,同时满足提出的最优性能指标。
3、本发明在求解非线性偏微分方程中引入了自适应动态规划算法,通过设计的神经网络求取近似最优解,实现了微分博弈制导律的有效求解。
附图说明
图1为本发明方法的制导控制流程图;
图2为本发明的进攻导弹-目标-防卫导弹(M-T-D)二维平面相对运动示意图。
具体实施方式
构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
如图1所示本实施例提供了一种基于微分博弈的三体对抗策略的主动防御制导方法,具体为:
步骤1,建立二维平面的进攻导弹-目标-防卫导弹相对运动方程:
如图2所示,考虑进攻导弹、目标和防卫导弹都采取一阶自动驾驶仪系统,定义M、T和D分别表示进攻导弹,目标和防卫导弹。VM、VT和VD分别表示进攻导弹、目标和防卫导弹的速度,且其速度大小恒定;α、β和γ分别表示进攻导弹、目标和防卫导弹三者的航向角;(xi,yi),i=M,T,D分别表示进攻导弹、目标和防卫导弹在二维平面的坐标位置;αM、αT和αD分别表示进攻导弹、目标和防卫导弹的侧向加速度;ω、u和v分别表示进攻导弹、目标和防卫导弹各自垂直于速度向量的加速度控制量;τ为三者的自动驾驶仪时间常数。三者的自动驾驶仪如公式(1),(2)和(3)所示:
进攻导弹自动驾驶仪:
Figure BDA0003290022660000061
目标自动驾驶仪:
Figure BDA0003290022660000062
防卫导弹自动驾驶仪:
Figure BDA0003290022660000063
在本实施例中设定为τ=0.1s。
考虑三者在二维平面中的相对运动关系,建立进攻导弹、目标和防卫导弹相对运动方程:
进攻导弹-目标的相对运动方程:
Figure BDA0003290022660000071
进攻导弹-防卫导弹的相对运动方程:
Figure BDA0003290022660000072
其中,r1和r2分别表示进攻导弹和目标,进攻导弹和防卫导弹的相对距离,
Figure BDA0003290022660000073
Figure BDA0003290022660000074
则表示相对速度;θ1和θ2分别表示进攻导弹和目标,进攻导弹和防卫导弹的视线角,σ1和σ2各表示对应的视线角速率;
步骤2,基于步骤1建立的三体对抗微分博弈制导运动学方程(公式4和公式5),为保证防卫导弹能成功拦截进攻导弹并使目标完成逃逸,选取大于零的常数rc表示进攻导弹的爆炸杀伤半径,通过控制各枚导弹与对应“目标”之间的剩余距离实现上述主动防御过程。选取状态变量
Figure BDA0003290022660000075
也既x1=r1-r2-rc
Figure BDA0003290022660000076
根据式4和5得到主动防御制导系统如下:
Figure BDA0003290022660000077
Figure BDA0003290022660000078
表示建模的冗余项。此外,ω是进攻导弹的加速度控制量,不失一般性采取比例导引制导律ω为:
Figure BDA0003290022660000079
其中,N为比例导引系数。
整理可得到具有严格反馈形式的主动防御制导系统为:
Figure BDA00032900226600000710
其中,v1表示作用在x1上的控制分量;
各函数满足如下关系式:
Figure BDA0003290022660000081
Figure BDA0003290022660000082
表示
Figure BDA0003290022660000083
为由x1构成的状态向量;v1表示作用在x1上的控制分量;
Figure BDA0003290022660000084
Figure BDA0003290022660000085
针对严格反馈形式的系统8,设计控制器u(t),v(t)的目的是使输出信号y能以最优方式跟踪给定的参考信号,使得y=x1=r1-r2-rc>0,r2→0。从而保证在三体对抗中防卫导弹能成功拦截进攻导弹,同时目标完成逃逸。,
步骤3,首先基于Backstepping控制理论设计前馈控制输入,处理输出约束,将系统8的跟踪控制问题转换为误差系统的最优调节问题后,再设计反馈最优调节控制器。下面首先对前馈控制器进行设计:
基于Backstepping控制理论,定义误差动态面为:
Figure BDA0003290022660000086
其中,yd表示给定的参考信号;
Figure BDA0003290022660000087
Figure BDA0003290022660000088
表示前馈虚拟控制部分,
Figure BDA0003290022660000089
表示虚拟反馈最优控制输入部分。
前馈控制部分的设计过程如下:
第一步:对z1求导得到:
Figure BDA00032900226600000810
对状态z1取障碍Lyapunov函数为:
Figure BDA00032900226600000811
求dV1/dt得到:
Figure BDA00032900226600000812
此时设计虚拟前馈控制输入
Figure BDA00032900226600000813
为:
Figure BDA00032900226600000814
其中,λ1>0为设计参数。将式13代入12中得到:
Figure BDA00032900226600000815
第二步:对z2求导得到:
Figure BDA0003290022660000091
其中:
Figure BDA0003290022660000092
x1d=yd
Figure BDA0003290022660000093
对状态z2取障碍Lyapunov函数为:
Figure BDA0003290022660000094
求dV2/dt得到:
Figure BDA0003290022660000095
此时设计实际前馈控制部分ua为:
Figure BDA0003290022660000096
其中:λ2>0为设计参数。将式18代入式17中得到:
Figure BDA0003290022660000097
其中:λ=min{λ12};此外,控制器分为前馈控制和反馈最优控制两部分,即复合控制方案
Figure BDA0003290022660000098
u=ua+u’。前面已经完成了前馈控制器
Figure BDA0003290022660000099
ua的设计,而根据式19可以发现:在上述的复合控制方案中,若仅设计前馈控制器,根据Lyapunov稳定性理论可知,
Figure BDA00032900226600000910
不成立的情况下不能保证闭环系统的稳定性。因此我们需要设计反馈最优调节控制器
Figure BDA00032900226600000911
u’保证下列等效仿射非线性系统的稳定性,从而保证在复合控制方案下原系统的闭环稳定性
Figure BDA00032900226600000912
其中,
Figure BDA0003290022660000101
Figure BDA0003290022660000102
设计复合控制器的目的在于保证系统在设计的微分博弈制导律控制下,通过控制防卫导弹和进攻导弹以及进攻导弹和目标之间的距离实现防卫导弹的成功拦截和目标的成功逃逸。同时,还保证了系统满足一定的性能指标,实现最优控制。
步骤4,等效系统20中的反馈最优控制器设计:
定义性能评价函数为:
Figure BDA0003290022660000103
其中,Q(s)≥0表示半正定函数,R1,R2均为设计的正定对称矩阵。
根据最优控制原理,定义Hamilton函数为:
Figure BDA0003290022660000104
其中,
Figure BDA0003290022660000105
结合微分博弈原理,由Hamilton函数22推导合作型微分博弈制导律为:
Figure BDA0003290022660000106
其中,上标*表示变量的最优值。
将式23代入Hamilton函数22中,得到相应的HJI方程为:
Figure BDA0003290022660000107
其中,
Figure BDA0003290022660000108
因此,通过求解HJI方程24得到最优代价函数的偏导数
Figure BDA0003290022660000109
利用该解析解可以求得微分博弈制导律23。但是,考虑到HJI方程属于非线性偏微分方程,难以直接求得其解析解。因此,本发明结合自适应动态规划算法设计评价神经网络,利用神经网络的在线输出逼近最优评价函数J*(x)。
步骤5,求解微分博弈制导律。
为求解HJI方程24,本发明结合自适应动态规划算法设计评价神经网络,利用神经网络全局逼近原理近似代价函数为J*(x):
Figure BDA0003290022660000111
其中,WJ为评价网络的理想权值,φJ(s)为设计的激励函数,ε(x)为近似误差。
但是实际情况中理想权值是未知的,所以本发明利用评价网络的在线输出逼近最优评价函数J*(x)。在线评价网络(也就神经网络的输出)设计为:
Figure BDA0003290022660000112
其中,
Figure BDA0003290022660000113
表示对理想最优性能指标函数J*(x)的估计;
Figure BDA0003290022660000114
表示评价网络的在线输出权值向量,φJ(s)为评价网络的激励函数向量。
根据式26,可以得到近似的微分博弈制导律为:
Figure BDA0003290022660000115
Figure BDA0003290022660000116
为U*的估计值,
Figure BDA0003290022660000117
Figure BDA0003290022660000118
的估计值,
Figure BDA0003290022660000119
表示激励函数对等效误差系统状态变量的偏导数。
结合式24,25,26,27,当采取近似的微分博弈控制律27时,评价网络产生的逼近误差ec如下:
Figure BDA00032900226600001110
Figure BDA00032900226600001111
因此,权值更新律的实际目标应该是最小化误差ec,使得评价网络的在线输出权值
Figure BDA00032900226600001112
逼近理想权值WJ
此外,为了保证闭环系统中各信号有界。选取一个Lyapunov函数Js(s),使得在理想微分博弈制导律23控制下:
Figure BDA00032900226600001113
即表明系统是稳定的。
因此,基于梯度下降法并考虑闭环系统的稳定性,设计权值更新律如下:
Figure BDA0003290022660000121
其中,
Figure BDA0003290022660000122
ec为评价网络近似HJI方程产生的误差量;αJ>0表示评价网络的学习率;Y1和Y2为具有合适维数的待设计参数;
Figure BDA0003290022660000123
定义为:
Figure BDA0003290022660000124
通过设计评价神经网络,采取权值更新律进行在线迭代并执行微分博弈制导律,完成防卫导弹对进攻导弹的拦截和目标的逃逸。
以上所述,仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进,这些改进应视为本发明的保护范围。

Claims (5)

1.一种基于微分博弈的三体对抗策略的主动防御制导方法,其特征在于:具体包括如下步骤:
步骤1:建立三体对抗微分博弈制导运动学方程,所述三体包括:防卫导弹,进攻导弹和目标导弹;
步骤2:基于步骤1建立的三体对抗微分博弈制导运动学方程建立主动防御场景下具有反馈形式的主动防御制导系统,该主动防御制导系统的输入包括前馈控制ua和反馈最优控制u’;
步骤3:将步骤2的主动防御制导系统的跟踪控制问题转换为误差系统的最优调节问题,从而计算主动防御制导系统的前馈控制ua
步骤4:采用神经网络计算反馈最优控制u’;
步骤5:将步骤3和步骤4计算得到的ua和u’输入步骤2中的主动防御制导系统中,使得该主动防御制导系统控制目标导弹不被进攻导弹击中,以及控制防卫导弹对进攻导弹的有效拦截。
2.根据权利要求1所述的一种基于微分博弈的三体对抗策略的主动防御制导方法,其特征在于:所述步骤1中的三体对抗微分博弈制导运动学方程包括:进攻导弹-目标导弹的相对运动方程和进攻导弹-防卫导弹的相对运动方程;
所述进攻导弹-目标导弹的相对运动方程为:
Figure FDA0003290022650000011
σ1=(VTsin(β-θ1)-VMsin(α-θ1))/r1
Figure FDA0003290022650000012
Figure FDA0003290022650000013
其中,r1表示进攻导弹和目标导弹之间的相对距离,
Figure FDA0003290022650000014
为r1的一阶导数,VT表示目标导弹的速度,β表示目标导弹的航向角,
Figure FDA0003290022650000015
为β的一阶导数,θ1表示进攻导弹和目标导弹之间的视线角,VM表示进攻导弹的速度,
Figure FDA0003290022650000016
为α的一阶导数,α表示进攻导弹的航向角,σ1表示进攻导弹和目标导弹之间的视线角速率;
Figure FDA0003290022650000017
为α的一阶导数,ω为进攻导弹垂直于速度向量的加速度控制量,
Figure FDA0003290022650000018
N为比例导引系数,
Figure FDA0003290022650000019
为θ1的一阶导数,u为目标导弹垂直于速度向量的加速度控制量;
所述进攻导弹-防卫导弹的相对运动方程:
Figure FDA0003290022650000021
σ2=(VDsin(γ-θ2)-VMsin(α-θ2))/r2
Figure FDA0003290022650000022
Figure FDA0003290022650000023
其中,r2为进攻导弹和防卫导弹的相对距离,
Figure FDA0003290022650000024
为r2的一阶导数,VD为防卫导弹的速度,γ为防卫导弹的航向角,
Figure FDA0003290022650000025
为γ的一阶导数,θ2为进攻导弹和防卫导弹的视线角,σ2为进攻导弹和防卫导弹的视线角速率;v表示防卫导弹垂直于速度向量的加速度控制量。
3.根据权利要求2所述的一种基于微分博弈的三体对抗策略的主动防御制导方法,其特征在于:所述步骤2中的主动防御制导系统为:
Figure FDA0003290022650000026
Figure FDA0003290022650000027
y=x1
其中,x1=r1-r2-rc
Figure FDA0003290022650000028
Figure FDA0003290022650000029
为x1的一阶导数,
Figure FDA00032900226500000210
为x2的一阶导数,rc为预设的进攻导弹的爆炸杀伤力半径,
Figure FDA00032900226500000211
表示
Figure FDA00032900226500000212
为由x1构成的状态向量,
Figure FDA00032900226500000213
v1表示作用在x1上的控制分量,
Figure FDA00032900226500000214
Figure FDA00032900226500000215
为θ2的一阶导数,
Figure FDA00032900226500000216
y为输出变量,u=ua+u’。
4.根据权利要求3所述的一种基于微分博弈的三体对抗策略的主动防御制导方法,其特征在于:所述步骤3中基于Backstepping控制理论和Lyapunov函数计算主动防御制导系统的前馈控制;具体为:
基于Backstepping控制理论,建立误差动态面为:
z1=y-yd
z2=x2-x2d
其中,yd为预设的的参考信号,
Figure FDA0003290022650000031
Figure FDA0003290022650000032
表示虚拟的前馈控制部分,
Figure FDA0003290022650000033
表示虚拟的反馈最优控制部分,z1和z2为均误差动态面的变量;
计算状态变量z1的一阶导数,并取z1的障碍Lyapunov函数;计算状态变量z2的一阶导数,并取z2的障碍Lyapunov函数,最终得到实际的前馈控制ua为:
Figure FDA0003290022650000034
其中,
Figure FDA0003290022650000035
x1d=yd,λ2为参数,λ2>0;
Figure FDA0003290022650000036
为x2d的一阶导数。
5.根据权利要求4所述的一种基于微分博弈的三体对抗策略的主动防御制导方法,其特征在于:所述步骤4中的计算反馈最优控制u’为:
基于反馈最优控制u’建立如下等效仿射非线性系统:
Figure FDA0003290022650000037
其中,
Figure FDA0003290022650000038
Figure FDA0003290022650000039
为s的一阶导数,
Figure FDA00032900226500000310
T为转置,
Figure FDA00032900226500000311
Figure FDA00032900226500000312
为上述等效仿射非线性系统建立性能评价函数:
Figure FDA00032900226500000313
Q(s)表示半正定函数,Q(s)≥0,R1和R2均为预设的正定对称矩阵;
根据最优控制原理,设置Hamilton函数为:
Figure FDA00032900226500000314
其中,
Figure FDA00032900226500000315
根据微分博弈原理和Hamilton函数得到合作型微分博弈制导律为:
Figure FDA0003290022650000041
其中,-1表示求逆运算,*表示最优解;
根据Hamilton函数和合作型微分博弈制导律得到HJI方程为:
Figure FDA0003290022650000042
其中,
Figure FDA0003290022650000043
采用神经网络对HJI方程进行求解得到评价函数的最优值J*(s),从而得到U*
Figure FDA0003290022650000044
最终根据U*
Figure FDA0003290022650000045
得到u’;
所述神经网络的输出函数为:
Figure FDA0003290022650000046
其中,
Figure FDA0003290022650000047
表示权值向量,
Figure FDA0003290022650000048
为J*(s)的估计值,φJ(s)为激励函数向量;
基于梯度下降法对神经网络的权值进行更新,权值更新的表达式为:
Figure FDA0003290022650000049
其中,
Figure FDA00032900226500000410
Figure FDA00032900226500000411
的一阶导数,αJ表示神经网络的学习率,αJ>0,
Figure FDA00032900226500000412
Figure FDA00032900226500000413
表示激励函数对s的偏导数;
Figure FDA00032900226500000414
Figure FDA00032900226500000415
为U*的估计值,
Figure FDA00032900226500000416
Figure FDA00032900226500000417
的估计值,ec为神经网络近似HJI方程时产生的误差量,Js(s)为预设的Lyapunov函数,Js(s)的一阶导数,
Figure FDA00032900226500000418
Figure FDA00032900226500000419
Y1和Y2均为预设的设计参数,
Figure FDA00032900226500000420
的表达式为:
Figure FDA00032900226500000421
CN202111160542.1A 2021-09-30 2021-09-30 一种基于微分博弈的三体对抗策略的主动防御制导方法 Active CN114003050B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111160542.1A CN114003050B (zh) 2021-09-30 2021-09-30 一种基于微分博弈的三体对抗策略的主动防御制导方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111160542.1A CN114003050B (zh) 2021-09-30 2021-09-30 一种基于微分博弈的三体对抗策略的主动防御制导方法

Publications (2)

Publication Number Publication Date
CN114003050A true CN114003050A (zh) 2022-02-01
CN114003050B CN114003050B (zh) 2023-10-31

Family

ID=79922201

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111160542.1A Active CN114003050B (zh) 2021-09-30 2021-09-30 一种基于微分博弈的三体对抗策略的主动防御制导方法

Country Status (1)

Country Link
CN (1) CN114003050B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114625172A (zh) * 2022-03-28 2022-06-14 西北工业大学 基于实用拜占庭容错估计的飞行器攻防对抗制导系统及其方法
CN115129083A (zh) * 2022-07-20 2022-09-30 北京航空航天大学 一种针对携带多枚防御导弹目标的协同制导方法及系统
CN116520875A (zh) * 2023-03-28 2023-08-01 南京理工大学 一种巡飞弹群防碰撞预设性能控制器设计方法
CN117806171A (zh) * 2024-02-23 2024-04-02 西北工业大学 一种携带防御器的超高速飞行器智能协同博弈机动方法
CN117950322A (zh) * 2024-03-26 2024-04-30 北京航空航天大学 一种分布式协同作战场景下博弈制导策略的确定方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7394047B1 (en) * 2006-05-09 2008-07-01 Lockheed Martin Corporation Interceptor guidance for boost-phase missile defense
CN106647287A (zh) * 2017-02-20 2017-05-10 南京航空航天大学 一种基于自适应动态规划的输入受限微分对策制导方法
CN111624882A (zh) * 2020-06-01 2020-09-04 北京信息科技大学 基于反推设计方法的供应链系统用零和微分博弈处理方法
CN113325866A (zh) * 2021-05-20 2021-08-31 南京航空航天大学 一种基于事件触发的微分对策协同制导方法
CN113341727A (zh) * 2021-06-22 2021-09-03 北京理工大学 一种事件触发分布式自学习协同博弈拦截制导方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7394047B1 (en) * 2006-05-09 2008-07-01 Lockheed Martin Corporation Interceptor guidance for boost-phase missile defense
CN106647287A (zh) * 2017-02-20 2017-05-10 南京航空航天大学 一种基于自适应动态规划的输入受限微分对策制导方法
CN111624882A (zh) * 2020-06-01 2020-09-04 北京信息科技大学 基于反推设计方法的供应链系统用零和微分博弈处理方法
CN113325866A (zh) * 2021-05-20 2021-08-31 南京航空航天大学 一种基于事件触发的微分对策协同制导方法
CN113341727A (zh) * 2021-06-22 2021-09-03 北京理工大学 一种事件触发分布式自学习协同博弈拦截制导方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114625172A (zh) * 2022-03-28 2022-06-14 西北工业大学 基于实用拜占庭容错估计的飞行器攻防对抗制导系统及其方法
CN115129083A (zh) * 2022-07-20 2022-09-30 北京航空航天大学 一种针对携带多枚防御导弹目标的协同制导方法及系统
CN116520875A (zh) * 2023-03-28 2023-08-01 南京理工大学 一种巡飞弹群防碰撞预设性能控制器设计方法
CN117806171A (zh) * 2024-02-23 2024-04-02 西北工业大学 一种携带防御器的超高速飞行器智能协同博弈机动方法
CN117806171B (zh) * 2024-02-23 2024-05-24 西北工业大学 一种携带防御器的超高速飞行器智能协同博弈机动方法
CN117950322A (zh) * 2024-03-26 2024-04-30 北京航空航天大学 一种分布式协同作战场景下博弈制导策略的确定方法

Also Published As

Publication number Publication date
CN114003050B (zh) 2023-10-31

Similar Documents

Publication Publication Date Title
CN114003050A (zh) 一种基于微分博弈的三体对抗策略的主动防御制导方法
Shaferman et al. Cooperative multiple-model adaptive guidance for an aircraft defending missile
Kim et al. Look-angle-shaping guidance law for impact angle and time control with field-of-view constraint
CN106647287B (zh) 一种基于自适应动态规划的输入受限微分对策制导方法
Harl et al. Impact time and angle guidance with sliding mode control
CN111551080B (zh) 一种攻击时间控制的制导方法
Yang et al. Evasive maneuver strategy for UCAV in beyond-visual-range air combat based on hierarchical multi-objective evolutionary algorithm
Li et al. A Multi-UCAV cooperative occupation method based on weapon engagement zones for beyond-visual-range air combat
CN109084641B (zh) 导弹制导方法及装置
CN107621198B (zh) 一种绕多禁飞区的多步决策弹道规划方法
CN111898201B (zh) 一种空战模拟环境中的战斗机高精度自主攻击引导方法
CN113325866A (zh) 一种基于事件触发的微分对策协同制导方法
Yu et al. Guidance law with circular no-fly zone constraint
Alkaher et al. Dynamic-escape-zone to avoid energy-bleeding coasting missile
CN116227343A (zh) 拦截机动目标满足视场角约束的末角攻击制导律设计方法
Jieqing et al. Cooperative game penetration guidance for multiple hypersonic vehicles under safety critical framework
Chen et al. Decentralized h PID team formation tracking control of large-scale quadrotor UAVs under external disturbance and vortex coupling
CN116974208B (zh) 基于捷联导引头的旋翼无人机目标打击控制方法及系统
Vathsal et al. Current trends in tactical missile guidance
Chen et al. Adaptive Cooperative Game Penetration Guidance for Multiple Hypersonic Vehicles with Performance Constraints
Altaher et al. Intercepting a superior missile: Trajectory optimization approach to a pursuit-evasion game
Zhu et al. Research on Multi-aircraft Cooperative Combat Based on Deep Reinforcement Learning
CN117192982B (zh) 基于控制参数化的近距空战机动决策优化方法
CN118092151B (zh) 一种基于分布式模型预测控制的多导弹协同制导方法
CN117348392B (zh) 一种多机近距空战机动决策分布式优化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant