CN116360500A - 一种摆脱距离可控的导弹突防方法 - Google Patents

一种摆脱距离可控的导弹突防方法 Download PDF

Info

Publication number
CN116360500A
CN116360500A CN202310445998.5A CN202310445998A CN116360500A CN 116360500 A CN116360500 A CN 116360500A CN 202310445998 A CN202310445998 A CN 202310445998A CN 116360500 A CN116360500 A CN 116360500A
Authority
CN
China
Prior art keywords
attack
distance
bullet
burst
guidance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310445998.5A
Other languages
English (en)
Inventor
王晓芳
余昕宇
林海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN202310445998.5A priority Critical patent/CN116360500A/zh
Publication of CN116360500A publication Critical patent/CN116360500A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/107Simultaneous control of position or course in three dimensions specially adapted for missiles
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明公开了一种摆脱距离可控的导弹突防方法,针对攻击弹在三维空间的突防问题,同时考虑突防和节约能量的要求,基于最优控制理论设计了攻击弹摆脱距离可控的突防制导律;本发明构建了BP神经网络代理模型,基于此给出不同突防初始态势和摆脱距离要求下的制导律关键参数;采用本发明的方法,可在控制能量尽量节省的前提下实现三维空间内对攻击弹突防过程中摆脱距离的控制。

Description

一种摆脱距离可控的导弹突防方法
技术领域
本发明属于制导技术领域,具体涉及一种摆脱距离可控的导弹突防方法。
背景技术
通常反舰导弹的突防手段有电子干扰、隐身技术、诱饵技术和机动突防等,其中,机动突防是其重要的一种突防方式。传统的机动突防方式主要是程序式机动突防,如方波机动、蛇形机动和螺旋机动,但是程序式机动是根据事先设定好的策略进行机动,而无法根据当前战场环境进行实时调整,智能性不够。攻击弹对敌方防御弹进行主动探测,在此基础上基于最优控制理论或微分博弈理论设计突防制导律进行主动机动成为突防技术发展的必然趋势,此方向上目前有一些研究成果。在先技术[1](参见IMADO F,KURODAT.Engagement tactics for two missiles against an optimally maneuveringaircraft.Journal of Guidance,Control and Dynamics,2011,34(2):574-582.)假设通过辨识等手段获知防御弹采用比例导引律拦截攻击弹,以最大化防御弹的零控脱靶量为目的,基于最优控制理论研究了二维平面内攻击弹的最优躲避策略,通过最速下降法求解出三种最优机动模式。在先技术[2](参见LIANG H Z,WANG J Y,WANG Y H,et al.Optimalguidance against active defense ballistic missiles via differential gamestrategies.Chinese Journal of Aeronautics,2020,33(03):978-989.)同样针对攻击弹突防反击采用比例导引律拦截的防御弹的问题,以最大化脱靶量得到的最优突防制导律为基础产生样本,引入神经网络和模糊控制方法训练实时次优制导律,得到具有实时性和强鲁棒性的突防制导律。在先技术[3](参见VITALY S,SHIMA Tal.Cooperativedifferential games guidance laws for imposing a relative interceptangle.Journal of Guidance,Control,and Dynamics,2017,40(10):2465-2480.)同时考虑攻击弹和防御弹的零控脱靶量最大、燃油成本和控制饱和问题,基于切换控制和线性二次微分对策策略,设计了同时实现突防和打击的突防制导律。在先技术[4](参见LIU F,DONG X W,LI Q D,et al.Cooperative differential games guidance laws formultiple attackers against an active defense target.Chinese Journal ofAeronautics,2022,35(5):374-389.)采用微分博弈理论研究多对一的主动突防问题,考虑多弹脱靶量、相对拦截角误差和能量成本设计了单一博弈性能指标,使得两个攻击弹从不同的方向追击目标同时躲避防御弹。
基于最优控制或微分博弈的突防方法的思路是令防御弹的脱靶量越大越好以实现攻击弹的突防。对于导弹突防来讲,防御弹的脱靶量大是有利的,但是,由于攻击弹突防后还要攻击目标,因此,并非令防御弹的脱靶量越大越好。防御弹脱靶量大即攻击弹距离防御弹的最短距离(摆脱距离)大,攻击弹可能绕飞很远,造成突防后攻击目标时受可用过载约束无法命中目标,同时也造成能量的过多损耗。如果攻击弹能够以略大于防御弹毁伤半径的距离躲过防御弹的拦截,则既能够突防成功又不至于绕飞太远而影响攻击目标,但此时就需要对攻击弹的摆脱距离进行定量控制。目前在此方面的研究还比较少。在先技术[6](参见孙启龙,齐乃明,赵钧,等.攻击主动防御飞行器的微分对策制导律.国防科技大学学报,2018,40(03):7-14.)和[7](SUN Q L,ZHANG C F,NING L W.et al.Guidance laws forattacking defended target.Chinese Journal of Aeronautics,2019,32(10):2337-2353.)控脱靶量初值符号大小不同的条件下推导了二维平面内的攻击弹躲避拦截的改进微分对策制导律,设计了考虑防御弹杀伤距离的性能指标,实现了摆脱距离大于防御弹的杀伤距离,但是,此制导律只适用于平面对抗情形,而且并未考虑攻击弹的控制能量成本问题。当攻击弹和防御弹的攻防对抗发生在三维空间时,纵侧向运动交连,运动模型也不同于二维平面的模型,此时,上述突防制导律不再适用。
发明内容
有鉴于此,本发明的目的是提供一种摆脱距离可控的导弹突防方法,可在控制能量尽量节省的前提下实现三维空间内对攻击弹突防过程中摆脱距离的控制。
一种摆脱距离可控的导弹突防方法,包括:
Step1:攻击弹末制导段打击目标过程中探测到防御弹,当rMD<rsafe时攻击弹转入突防状态,rsafe为给定的开始突防的弹间距离;
Step2:调用已训练好的摆脱距离代理模型f(X,r*),根据摆脱距离
Figure BDA0004195692070000021
和当前状态量X,求解制导律参数r*
其中,摆脱距离代理模型f(X,r*)训练过程如下:
构建一个由状态向量X=[r,qyyMzMyDzD]和制导律参数r*构成的向量作为输入、输出为期望的摆脱距离rmin的BP代理模型f(X,r*);r表示攻击弹和防御弹的相对距离,qy表示视线方位角,
Figure BDA0004195692070000031
表示攻击弹的速度矢量前置角,/>
Figure BDA0004195692070000032
表示防御弹的速度矢量前置角;
在典型攻防对抗场景中进行仿真,获得多个训练数据X′=[X,r*,rmin]用于代理模型的训练;
Step3:采用式(26)的突防制导律开始突防:
Figure BDA0004195692070000033
其中,所述突防制导律建立过程包括:
步骤2.1、式(3)中攻击弹和防御弹的加速度在视线坐标系x轴的投影ur和vr与法向加速度
Figure BDA0004195692070000034
之间的关系为:
Figure BDA0004195692070000035
Figure BDA0004195692070000036
其中:L(qy,qz)地面坐标系到视线坐标系之间的转移矩阵;L(θ,ψV)为地面坐标系到弹道坐标系之间的转移矩阵,有:
Figure BDA0004195692070000037
Figure BDA0004195692070000038
假设防御弹采用经典的比例导引律拦截攻击弹,则有:
Figure BDA0004195692070000039
式中,KD为比例导引系数;
设状态变量
Figure BDA00041956920700000310
控制变量/>
Figure BDA00041956920700000311
则式(3)写作状态空间形式为:
Figure BDA0004195692070000041
其中,
Figure BDA0004195692070000042
其中:
Figure BDA0004195692070000043
引入零控脱靶量z(t)将系统简化降阶,令
z(t)=[1 0]Ω(tf,t)x(t) (12)
式中:t0和tf为制导的初始和终止时刻;Ω(tf,t)为状态转移矩阵,通过求解齐次方程
Figure BDA0004195692070000044
得到,其表达式为:
Figure BDA0004195692070000045
式中:
Figure BDA0004195692070000046
tgo=tf-t为剩余飞行时间;根据状态转移矩阵:
Figure BDA0004195692070000047
对零控脱靶量z(t)求导,用ur和vr表达得:
Figure BDA0004195692070000048
二次型性能指标函数设为:
Figure BDA0004195692070000049
其中:a>0,b>0为权重系数;tf是防御弹和攻击弹弹间距离最小的时刻,令其为制导的终止时刻;
Figure BDA00041956920700000410
为tf时刻的零控脱靶量z(t);r*为正常数,即突防后/>
Figure BDA00041956920700000411
的期望值;
步骤2.2、最优突防制导指令求解
本步骤采用极大值原理求解步骤2.1建立的攻击弹突防最优制导问题;由式(17)建立哈密顿函数为:
Figure BDA0004195692070000051
式中:λ是协态量,其正则方程为:
Figure BDA0004195692070000052
λ在末端时刻tf满足的横截条件为:
Figure BDA0004195692070000053
则由式(18)和式(19)解得协态量λ为:
Figure BDA0004195692070000054
需要满足的最优化条件为:
Figure BDA0004195692070000055
联立式(17)和式(21)解得:
Figure BDA0004195692070000056
式中,
Figure BDA0004195692070000057
代表攻击弹控制量的开环解,得到制导指令还需要/>
Figure BDA0004195692070000058
的值,将式(22)代入式(15),得:
Figure BDA0004195692070000059
将式(23)从t到tf积分得:
Figure BDA00041956920700000510
Figure BDA00041956920700000511
式中:
Figure BDA0004195692070000061
则求解出攻击导弹的突防制导律指令为:
Figure BDA0004195692070000062
Step4:
Figure BDA0004195692070000063
突防结束,攻击弹转入打击目标。
较佳的,Step2中求解制导律参数r*的方法包括:
步骤3.1的代理模型训练好后,当攻击弹探测到防御弹并决定开始突防时调用代理模型f(X,r*),基于f(X,r*)和期望摆脱距离
Figure BDA0004195692070000064
反解所需的制导律关键参数r*;参数设计问题转化为求解方程:
Figure BDA0004195692070000065
用弦截法求解方程(30)的流程如下:
1)给定
Figure BDA0004195692070000066
和状态量X,g(r*),最大允许迭代次数N,收敛指标ε;
2)设置初始猜测解
Figure BDA0004195692070000067
3)计算g0=g(c0),g1=g(c1),n=1;
4)计算
Figure BDA0004195692070000068
Figure BDA0004195692070000069
5)若|g(c)|<ε,输出r*=c,停止迭代;否则转6;
6)若n<N,置
Figure BDA00041956920700000610
转4;否则输出r*=c,停止迭代。
较佳的,所述代理模型f(X,r*)采用BP神经网络实现。
较佳的,所述BP神经网络结构包括一个输入层,一个或多个隐藏层以及一个输出层。
本发明具有如下有益效果:
本发明针对攻击弹在三维空间的突防问题,同时考虑突防和节约能量的要求,基于最优控制理论设计了攻击弹摆脱距离可控的突防制导律;
本发明构建了BP神经网络代理模型,基于此给出不同突防初始态势和摆脱距离要求下的制导律关键参数。
采用本发明的方法,可在控制能量尽量节省的前提下实现三维空间内对攻击弹突防过程中摆脱距离的控制。
附图说明
图1为攻击弹-目标-防御弹相对运动关系图;
图2为BP神经网络代理模型结构图;
图3为本发明的突防过程流程图;
图4为攻击弹和防御弹弹道图;
图5(a)为攻击弹纵向加速度图;
图5(b)为攻击弹侧向加速度图。
具体实施方式
下面结合附图并举实施例,对本发明进行详细描述。
步骤一、飞行器攻防双方数学建模
假设一枚攻击弹攻击某固定高价值目标,目标发射防御弹拦截攻击弹,三者之间的相对运动关系如图1所示。图中,OXIYIZI为以目标T为原点的地面坐标系,M、D分别为攻击弹和防御弹。rMT和rMD分别为攻击弹与目标、攻击弹与防御弹之间的距离,qθ、qψ分别为攻击弹的俯仰、偏航方向视线角,qy、qz分别为防御弹的俯仰、偏航方向视线角,图中qψ和qy方向为正,qq和qz方向为负。
Figure BDA0004195692070000071
和/>
Figure BDA0004195692070000072
分别为攻击弹和防御弹的速度、弹道倾角和弹道偏角,图中θD和/>
Figure BDA0004195692070000073
方向为正,θM和/>
Figure BDA0004195692070000074
方向为负。由图1可得防御弹与攻击弹的相对运动方程组为:
Figure BDA0004195692070000075
类似可得攻击弹和目标的相对运动方程组为:
Figure BDA0004195692070000081
由于要设计攻击弹相对于防御弹的突防制导律,因此,对式(1)中的
Figure BDA0004195692070000082
求导得:
Figure BDA0004195692070000083
其中:ur、vr分别为防御弹和攻击弹加速度在视线坐标系x轴的投影。
攻击弹和防御弹的运动模型为:
Figure BDA0004195692070000084
式中:(xi,yi,zi)为飞行器位置;
Figure BDA0004195692070000085
和/>
Figure BDA0004195692070000086
分别是垂直于飞行器速度矢量的铅垂方向和水平方向的法向加速度;下标i=M、D时分别表示攻击弹和防御弹。
步骤二、脱摆距离可控的三维最优突防制导律设计,具体包括:
步骤2.1、突防问题最优控制模型建立
式(3)中攻击弹和防御弹的加速度在视线坐标系x轴的投影ur和vr与法向加速度
Figure BDA0004195692070000087
之间的关系为:
Figure BDA0004195692070000088
Figure BDA0004195692070000089
其中:L(qy,qz)地面坐标系到视线坐标系之间的转移矩阵;L(θ,ψV)为地面坐标系到弹道坐标系之间的转移矩阵,有:
Figure BDA0004195692070000091
Figure BDA0004195692070000092
假设防御弹采用经典的比例导引律拦截攻击弹,则有:
Figure BDA0004195692070000093
式中,KD为比例导引系数。
设状态变量
Figure BDA0004195692070000094
控制变量/>
Figure BDA0004195692070000095
则式(3)可写作状态空间形式为:
Figure BDA0004195692070000096
其中,
Figure BDA0004195692070000097
其中:
Figure BDA0004195692070000098
由于飞行过程中
Figure BDA0004195692070000099
等量都是变化的,所以式(10)是一个线性非定常系统。但是,在每个时刻,A、B、C都是确定的,为了便于研究,可在某个时刻,将式(10)看作是确定的即将其看作线性定常系统来进行突防制导律设计。
引入零控脱靶量z(t)将系统简化降阶,令
z(t)=[1 0]Ω(tf,t)x(t) (12)
式中:t0和tf为制导的初始和终止时刻;Ω(tf,t)为状态转移矩阵,可通过求解齐次方程
Figure BDA00041956920700000910
得到,其表达式为:
Figure BDA0004195692070000101
式中:
Figure BDA0004195692070000102
tgo=tf-t为剩余飞行时间。根据状态转移矩阵的性质可知:
Figure BDA0004195692070000103
对零控脱靶量z(t)求导,为了表达简洁,用ur和vr表达得:
Figure BDA0004195692070000104
考虑到攻击弹突防时,其与防御弹之间的最小距离(摆脱距离)要大于防御弹的杀伤半径,但是也并非越大越好,摆脱距离越大,可能绕行越远,以至于不能命中目标。因此,可设定理想的摆脱距离r*略大于防御弹的杀伤半径。如果攻击弹采用的突防制导律能够使得攻击弹突防后的摆脱距离接近r*,则既可实现突防,又不至于绕飞太远从而影响攻击目标。同时考虑在突防过程中付出尽量少的能量,因此,二次型性能指标函数设为:
Figure BDA0004195692070000105
其中:a>0,b>0为权重系数;tf是防御弹和攻击弹弹间距离最小的时刻,令其为制导的终止时刻;
Figure BDA0004195692070000106
为tf时刻的零控脱靶量z(t);r*为正常数,即突防后/>
Figure BDA0004195692070000107
的期望值。
步骤2.2、最优突防制导指令求解
本步骤采用极大值原理求解步骤2.1建立的攻击弹突防最优制导问题。由式(17)建立哈密顿函数为:
Figure BDA0004195692070000108
式中:λ是协态量,其正则方程为:
Figure BDA0004195692070000109
λ在末端时刻tf满足的横截条件为:
Figure BDA0004195692070000111
则由式(18)和式(19)可解得协态量λ为:
Figure BDA0004195692070000112
需要满足的最优化条件为:
Figure BDA0004195692070000113
联立式(17)和式(21)可解得:
Figure BDA0004195692070000114
式中,
Figure BDA0004195692070000115
代表攻击弹控制量的开环解,得到制导指令还需要/>
Figure BDA0004195692070000116
的值,将式(22)代入式(15),可得:
Figure BDA0004195692070000117
将式(23)从t到tf积分可得:
Figure BDA0004195692070000118
Figure BDA0004195692070000119
式中:
Figure BDA00041956920700001110
将式(25)代入式(22),求解出攻击导弹的突防制导律指令为:
Figure BDA00041956920700001111
式中,z(t)由式(12)计算。至此,求解得到攻击弹最优突防的制导指令。
步骤三、基于BP神经网络的制导律关键参数设计
在制导律指令式(26)中,需设定的制导律参数有a、b、tf和r*。如果对突防精度要求高,则需将a设的很大,如果考虑尽量节省突防过程中的控制能量,则需将b设的很大。对于突防结束的终端时刻tf,采用如下的典型方式进行预估:
Figure BDA0004195692070000121
式中:t为当前时刻;tgo为预估的剩余飞行时间。
r*的设定很重要,如式(16)所示的突防问题性能指标函数的设计是使得零控脱靶量在tf时刻的值即z(tf)应等于r*。直接表征攻击弹能否突防成功的是攻击弹与防御弹在tf时刻的距离,即摆脱距离rmin,而摆脱距离与零控脱靶量
Figure BDA0004195692070000122
并不相等。另外,当tf固定时,式(26)所示的制导律能够使得攻击弹的/>
Figure BDA0004195692070000123
等于设定的值r*,但是,对于突防问题来讲,式(27)中预估的剩余飞行时间是在不断变化的,因此tf也是不断变化的,此时在tf时刻得到的/>
Figure BDA0004195692070000124
也不严格等于r*,两者之间的差距与tgo的估计精度、攻击弹和防御弹的运动情况都有关系。综上,制导律参数r*与摆脱距离rmin的关系是非常复杂的,无法用解析表达式表示。因此,要研究使得摆脱距离为rmin的制导律参数r*的设定方法。
考虑攻击弹和防御弹的典型作战场景,仿真获得r*和rmin数据,再采用BP神经网络对这些数据进行学习以获得r*和rmin间的关系,之后在实际作战中,基于当前作战环境和训练好的神经网络给出制导律参数r*
步骤3.1、基于BP神经网络的摆脱距离代理模型建立
假设典型作战场景中,目标固定,目标发射的防御弹的初始位置和采用的制导律确定,攻击弹和防御弹的速度大小确定,则此时影响攻击弹突防效果的因素有开始突防时攻防双方的相对位置和速度相对视线的方向以及攻击弹采用的突防制导律。令防御弹的纵向速度前置角
Figure BDA0004195692070000125
和侧向速度前置角/>
Figure BDA0004195692070000126
为:
Figure BDA0004195692070000127
类似地,攻击弹相对于M和D连线rMD的视线方位角
Figure BDA0004195692070000128
定义攻击弹相对于rMD的纵向和侧向速度前置角:
Figure BDA0004195692070000131
由上分析可知,突防开始时,攻击弹和防御弹的相对距离r、视线方位角qy、攻击弹的速度矢量前置角
Figure BDA0004195692070000132
防御弹的速度矢量前置角/>
Figure BDA0004195692070000133
以及制导律参数r*共同决定了rmin。因此,构建一个由初始状态/>
Figure BDA0004195692070000134
和制导律参数r*构成的向量作为输入、输出为rmin的BP神经网络代理模型f(X,r*)。
在典型攻防对抗场景中进行大量仿真,获得训练数据X′=[Xi,ri *,rmin,i],i=1~n,归一化处理后用于BP神经网络代理模型的训练。基于训练好的代理模型能快速给出在初始状态X已知,采取不同r*时rmin的值,可以根据期望的摆脱距离
Figure BDA0004195692070000135
来选择制导律参数r*
采样时,样本应尽量覆盖典型对抗场景,这样训练出的网络的适用性更强,即攻击弹飞行时的数据在样本数据范围内,此时网络的输出精度才有保证,使得制导律的参数设计更精确。
BP神经网络结构如图2所示。BP神经网络结构由一个输入层,一个或多个隐藏层以及一个输出层组成。由输入量[X,r*]确定输入层的节点数m=7,输出量rmin确定输出层的节点数k=1,隐藏层的层数和神经元数L待定。相邻层间的神经元全连接,同层神经元无连接。
步骤3.2、基于代理模型的突防制导律参数求解
步骤3.1的代理模型训练好后,当攻击弹探测到防御弹并决定开始突防时调用代理模型f(X,r*),基于f(X,r*)和期望摆脱距离
Figure BDA0004195692070000136
反解所需的制导律关键参数r*。参数设计问题转化为求解方程:
Figure BDA0004195692070000137
显然,式(30)是一个非线性方,用弦截法求解方程(30)的流程如下。
1)给定
Figure BDA0004195692070000138
和状态量X,g(r*),最大允许迭代次数N,收敛指标ε;/>
2)设置初始猜测解
Figure BDA0004195692070000139
3)计算g0=g(c0),g1=g(c1),n=1;
4)计算
Figure BDA00041956920700001310
Figure BDA0004195692070000141
5)若|g(c)|<ε,输出r*=c,停止迭代;否则转6;
6)若n<N,置
Figure BDA0004195692070000142
转4;否则输出r*=c,停止迭代。
求解出制导律参数后,突防制导律即确定。
假设攻击弹采用本发明制导律突防,突防前后均采用比例导引律攻击目标。
综上,攻击弹采用基于神经网络代理模型的摆脱距离可控最优突防制导律进行突防的过程总结为:
Step1:攻击弹末制导段打击目标过程中探测到防御弹,当rMD<rsafe时攻击弹转入突防状态,rsafe为给定的开始突防的弹间距离;
Step2:调用f(X,r*),根据
Figure BDA0004195692070000143
和当前状态量X用弦截法求解r*
Step3:采用式(26)的制导律开始突防;
Step4:
Figure BDA0004195692070000144
突防结束,攻击弹转入打击目标。
表示上述突防过程的流程图如图3所示。
以下对基于神经网络代理模型和最优控制原理的摆脱距离可控的突防方法的验证。
以一枚攻击弹采用比例系数为KM=3的比例导引律攻击高价值固定目标,目标发射一枚防御弹对攻击弹进行拦截为例,防御弹采用KD=4的如式(9)所示的比例导引律拦截攻击弹。攻击弹在攻击目标过程中,假设在距防御弹8km时探测到防御弹,然后采用本发明的最优突防制导律进行突防,突防制导律参数a=104,b=1.44,
Figure BDA0004195692070000145
攻击弹突防成功/>
Figure BDA0004195692070000146
后继续按照比例导引律攻击目标。考虑到导弹的过载限制,切向过载和法向过载均不超过8。在突防开始的时刻,有X=[8,31.84,8.1,-2.11,8.09,1.90],将其代入训练好的神经网络代理模型f(X,r*),用弦截法迭代2次解得制导律参数r*=32.36m,攻击弹采用此制导律后得到摆脱距离rmin=50.37m,与设定的期望值/>
Figure BDA0004195692070000147
相差不大,实现了摆脱距离的高精度控制。弹道以及攻击弹加速度和防御弹加速度如图4-5所示。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种摆脱距离可控的导弹突防方法,其特征在于,包括:
Step1:攻击弹末制导段打击目标过程中探测到防御弹,当rMD<rsafe时攻击弹转入突防状态,rsafe为给定的开始突防的弹间距离;
Step2:调用已训练好的摆脱距离代理模型f(X,r*),根据摆脱距离
Figure FDA0004195692050000011
和当前状态量X,求解制导律参数r*
其中,摆脱距离代理模型f(X,r*)训练过程如下:
构建一个由状态向量
Figure FDA0004195692050000012
和制导律参数r*构成的向量作为输入、输出为期望的摆脱距离rmin的BP代理模型f(X,r*);r表示攻击弹和防御弹的相对距离,qy表示视线方位角,/>
Figure FDA0004195692050000018
表示攻击弹的速度矢量前置角,/>
Figure FDA0004195692050000013
表示防御弹的速度矢量前置角;
在典型攻防对抗场景中进行仿真,获得多个训练数据X′=[X,r*,rmin]用于代理模型的训练;
Step3:采用式(26)的突防制导律开始突防:
Figure FDA0004195692050000014
其中,所述突防制导律建立过程包括:
步骤2.1、式(3)中攻击弹和防御弹的加速度在视线坐标系x轴的投影ur和vr与法向加速度
Figure FDA0004195692050000015
之间的关系为:
Figure FDA0004195692050000016
Figure FDA0004195692050000017
其中:L(qy,qz)地面坐标系到视线坐标系之间的转移矩阵;L(θ,ψV)为地面坐标系到弹道坐标系之间的转移矩阵,有:
Figure FDA0004195692050000021
Figure FDA0004195692050000022
假设防御弹采用经典的比例导引律拦截攻击弹,则有:
Figure FDA0004195692050000023
式中,KD为比例导引系数;
设状态变量
Figure FDA0004195692050000024
控制变量/>
Figure FDA0004195692050000025
则式(3)写作状态空间形式为:
Figure FDA0004195692050000026
其中,
Figure FDA0004195692050000027
其中:
Figure FDA0004195692050000028
引入零控脱靶量z(t)将系统简化降阶,令
z(t)=[10]Ω(tf,t)x(t) (12)
式中:t0和tf为制导的初始和终止时刻;Ω(tf,t)为状态转移矩阵,通过求解齐次方程
Figure FDA0004195692050000029
得到,其表达式为:
Figure FDA00041956920500000210
式中:
Figure FDA00041956920500000211
tgo=tf-t为剩余飞行时间;根据状态转移矩阵:
Figure FDA00041956920500000212
对零控脱靶量z(t)求导,用ur和vr表达得:
Figure FDA0004195692050000031
二次型性能指标函数设为:
Figure FDA0004195692050000032
其中:a>0,b>0为权重系数;tf是防御弹和攻击弹弹间距离最小的时刻,令其为制导的终止时刻;
Figure FDA0004195692050000033
为tf时刻的零控脱靶量z(t);r*为正常数,即突防后/>
Figure FDA0004195692050000034
的期望值;
步骤2.2、最优突防制导指令求解
本步骤采用极大值原理求解步骤2.1建立的攻击弹突防最优制导问题;由式(17)建立哈密顿函数为:
Figure FDA0004195692050000035
式中:λ是协态量,其正则方程为:
Figure FDA0004195692050000036
λ在末端时刻tf满足的横截条件为:
Figure FDA0004195692050000037
则由式(18)和式(19)解得协态量λ为:
Figure FDA0004195692050000038
需要满足的最优化条件为:
Figure FDA0004195692050000039
联立式(17)和式(21)解得:
Figure FDA00041956920500000310
式中,
Figure FDA00041956920500000311
代表攻击弹控制量的开环解,得到制导指令还需要/>
Figure FDA00041956920500000312
的值,将式(22)代入式(15),得:
Figure FDA0004195692050000041
将式(23)从t到tf积分得:
Figure FDA0004195692050000042
Figure FDA0004195692050000043
式中:
Figure FDA0004195692050000044
则求解出攻击导弹的突防制导律指令为:
Figure FDA0004195692050000045
Step4:
Figure FDA0004195692050000046
突防结束,攻击弹转入打击目标。
2.如权利要求1所述的摆脱距离可控的导弹突防方法,其特征在于,Step2中求解制导律参数r*的方法包括:
步骤3.1的代理模型训练好后,当攻击弹探测到防御弹并决定开始突防时调用代理模型f(X,r*),基于f(X,r*)和期望摆脱距离
Figure FDA0004195692050000047
反解所需的制导律关键参数r*;参数设计问题转化为求解方程:
Figure FDA0004195692050000048
用弦截法求解方程(30)的流程如下:
1)给定
Figure FDA0004195692050000049
和状态量X,g(r*),最大允许迭代次数N,收敛指标ε;
2)设置初始猜测解
Figure FDA00041956920500000410
3)计算g0=g(c0),g1=g(c1),n=1;
4)计算
Figure FDA00041956920500000411
Figure FDA0004195692050000051
5)若|g(c)|<ε,输出r*=c,停止迭代;否则转6;
6)若n<N,置
Figure FDA0004195692050000052
转4;否则输出r*=c,停止迭代。
3.如权利要求1所述的摆脱距离可控的导弹突防方法,其特征在于,所述代理模型f(X,r*)采用BP神经网络实现。
4.如权利要求1所述的摆脱距离可控的导弹突防方法,其特征在于,所述BP神经网络结构包括一个输入层,一个或多个隐藏层以及一个输出层。
CN202310445998.5A 2023-04-23 2023-04-23 一种摆脱距离可控的导弹突防方法 Pending CN116360500A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310445998.5A CN116360500A (zh) 2023-04-23 2023-04-23 一种摆脱距离可控的导弹突防方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310445998.5A CN116360500A (zh) 2023-04-23 2023-04-23 一种摆脱距离可控的导弹突防方法

Publications (1)

Publication Number Publication Date
CN116360500A true CN116360500A (zh) 2023-06-30

Family

ID=86939116

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310445998.5A Pending CN116360500A (zh) 2023-04-23 2023-04-23 一种摆脱距离可控的导弹突防方法

Country Status (1)

Country Link
CN (1) CN116360500A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116562052A (zh) * 2023-07-05 2023-08-08 西安现代控制技术研究所 一种考虑可用过载约束下的侧向绕飞方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116562052A (zh) * 2023-07-05 2023-08-08 西安现代控制技术研究所 一种考虑可用过载约束下的侧向绕飞方法
CN116562052B (zh) * 2023-07-05 2023-10-03 西安现代控制技术研究所 一种考虑可用过载约束下的侧向绕飞方法

Similar Documents

Publication Publication Date Title
CN109241591B (zh) 反舰导弹作战效能评估及辅助决策方法
Garcia et al. Cooperative missile guidance for active defense of air vehicles
Yang et al. Evasive maneuver strategy for UCAV in beyond-visual-range air combat based on hierarchical multi-objective evolutionary algorithm
Rusnak et al. Guidance laws in target—Missile—Defender scenario with an aggressive defender
Burgin et al. Rule-based air combat simulation
CN113893539B (zh) 智能体的协同对战方法及装置
CN116360500A (zh) 一种摆脱距离可控的导弹突防方法
CN114492805A (zh) 一种基于模糊推理的空战机动决策设计方法
CN114638339A (zh) 基于深度强化学习的智能体任务分配方法
Garcia et al. A two-team linear quadratic differential game of defending a target
Duan et al. Autonomous maneuver decision for unmanned aerial vehicle via improved pigeon-inspired optimization
Qilong et al. An optimal one-way cooperative strategy for two defenders against an attacking missile
Wang et al. Threat potential field based Pursuit–Evasion Games for underactuated Unmanned Surface Vehicles
CN114003050A (zh) 一种基于微分博弈的三体对抗策略的主动防御制导方法
Garcia et al. A differential game approach for beyond visual range tactics
Yang et al. Ballistic missile maneuver penetration based on reinforcement learning
CN116432030A (zh) 一种基于深度强化学习的空战多意图策略自主生成方法
Lin et al. Control strategies for target-attacker-defender games of USVs
CN114371737A (zh) 一种角度约束的智能弹药最优对策协同制导方法
CN113639586A (zh) 一种抗雷达关机的制导方法、系统及介质
Chen et al. The Pursuit-Evasion Game Strategy of High-Speed Aircraft Based on Monte-Carlo Deep Reinforcement Learning
CN117806171B (zh) 一种携带防御器的超高速飞行器智能协同博弈机动方法
CN117192982B (zh) 基于控制参数化的近距空战机动决策优化方法
Zhang et al. Intelligent Close Air Combat Design based on MA-POCA Algorithm
Meng et al. UAV Attack and Defense Optimization Guidance Method Based on Target Trajectory Prediction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination