CN112859918B - 一种多智能体多模自适应协同制导律确定方法及系统 - Google Patents
一种多智能体多模自适应协同制导律确定方法及系统 Download PDFInfo
- Publication number
- CN112859918B CN112859918B CN202110065617.1A CN202110065617A CN112859918B CN 112859918 B CN112859918 B CN 112859918B CN 202110065617 A CN202110065617 A CN 202110065617A CN 112859918 B CN112859918 B CN 112859918B
- Authority
- CN
- China
- Prior art keywords
- target
- defender
- determining
- control input
- interceptor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 230000007123 defense Effects 0.000 claims abstract description 48
- 230000003044 adaptive effect Effects 0.000 claims abstract description 18
- 239000011159 matrix material Substances 0.000 claims description 39
- 230000001133 acceleration Effects 0.000 claims description 21
- 101100001674 Emericella variicolor andI gene Proteins 0.000 claims description 20
- 238000004088 simulation Methods 0.000 claims description 13
- 239000003795 chemical substances by application Substances 0.000 description 19
- IEDXPSOJFSVCKU-HOKPPMCLSA-N [4-[[(2S)-5-(carbamoylamino)-2-[[(2S)-2-[6-(2,5-dioxopyrrolidin-1-yl)hexanoylamino]-3-methylbutanoyl]amino]pentanoyl]amino]phenyl]methyl N-[(2S)-1-[[(2S)-1-[[(3R,4S,5S)-1-[(2S)-2-[(1R,2R)-3-[[(1S,2R)-1-hydroxy-1-phenylpropan-2-yl]amino]-1-methoxy-2-methyl-3-oxopropyl]pyrrolidin-1-yl]-3-methoxy-5-methyl-1-oxoheptan-4-yl]-methylamino]-3-methyl-1-oxobutan-2-yl]amino]-3-methyl-1-oxobutan-2-yl]-N-methylcarbamate Chemical compound CC[C@H](C)[C@@H]([C@@H](CC(=O)N1CCC[C@H]1[C@H](OC)[C@@H](C)C(=O)N[C@H](C)[C@@H](O)c1ccccc1)OC)N(C)C(=O)[C@@H](NC(=O)[C@H](C(C)C)N(C)C(=O)OCc1ccc(NC(=O)[C@H](CCCNC(N)=O)NC(=O)[C@@H](NC(=O)CCCCCN2C(=O)CCC2=O)C(C)C)cc1)C(C)C IEDXPSOJFSVCKU-HOKPPMCLSA-N 0.000 description 16
- 238000005259 measurement Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 8
- 230000001186 cumulative effect Effects 0.000 description 7
- 238000005315 distribution function Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 238000006073 displacement reaction Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000002457 bidirectional effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 101100379079 Emericella variicolor andA gene Proteins 0.000 description 1
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 229940004975 interceptor Drugs 0.000 description 1
- 231100000225 lethality Toxicity 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/10—Simultaneous control of position or course in three dimensions
- G05D1/107—Simultaneous control of position or course in three dimensions specially adapted for missiles
Landscapes
- Engineering & Computer Science (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
- Radar Systems Or Details Thereof (AREA)
Abstract
本发明涉及一种多智能体多模自适应协同制导律确定方法及系统。该方法包括:获取防御器、拦截器以及目标的状态参数;根据多模型自适应估计的方法确定所述拦截器的制导律;根据所述拦截器的制导律确定所述目标及防御器的制导律;根据所述防御器、拦截器以及目标的状态参数以及所述防御器的制导律确定飞行器间的相对运动模型;以最小消耗下的最小脱靶量为约束条件,根据所述相对运动模型确定所述目标的控制器和所述防御器的控制器;根据所述目标的控制器控制所述目标;根据所述防御器的控制器控制所述防御器。本发明提高了目标与防御器的协同程度和对拦截器的制导表现。
Description
技术领域
本发明涉及制导技术领域,特别是涉及一种多智能体多模自适应协同制导律确定方法及系统。
背景技术
随着未来战场环境的愈加复杂和反导武器系统智能化程度的提高,单枚目标对拦截器的有效突防变得越来越困难,且技术实现上变得越来越复杂。究者们开始意识到可以采用带防御器的目标协同制导技术实现目标(目标)的反拦截制导,这种技术在提高高价值目标生存概率的同时,还可以扩大对拦截器的拦截范围。
而现有技术中,目标与防御器的协同程度不高,造成不能准确的阻拦敌方的拦截器(导弹)。
发明内容
本发明的目的是提供一种多智能体多模自适应协同制导律确定方法及系统,提高目标与防御器的协同程度和对拦截器的制导表现。
为实现上述目的,本发明提供了如下方案:
一种多智能体多模自适应协同制导律确定方法,包括:
获取防御器、拦截器以及目标的状态参数;所述状态参数包括:速度、法向加速度、视线角以及航向角;
根据多模型自适应估计的方法确定所述拦截器的制导律;
根据所述拦截器的制导律确定所述目标及防御器的制导律;
根据所述防御器、拦截器以及目标的状态参数以及所述防御器的制导律确定飞行器间的相对运动模型;
以最小消耗下的最小脱靶量为约束条件,根据所述相对运动模型确定所述目标的控制器和所述防御器的控制器;
根据所述目标的控制器控制所述目标;
根据所述防御器的控制器控制所述防御器。
可选的,所述根据所述防御器、拦截器以及目标的状态参数以及所述防御器的制导律确定飞行器间的相对运动模型,具体包括:
利用公式确定飞行器间的相对运动模型;
其中,AMT为系数矩阵,tgo为拦截器到目标的剩余时间,Δt为仿真步长,x为飞行器之间的状态参数,为目标的控制输入矩阵,uT为目标的控制输入,为第一个防御器的控制输入矩阵,uD1为第一个防御器的控制输入,为第二个防御器的控制输入矩阵,uD2为第二个防御器的控制输入。
可选的,所述以最小消耗下的最小脱靶量为约束条件,根据所述相对运动模型确定所述目标的控制器和所述防御器的控制器,具体包括:
利用公式确定性能指标;
采用终端投影法对所述性能指标进行求解,确定目标的控制输入和防御器的控制输入;
其中,J为性能指标,S为防御器的总数量,为拦截器与防御器间侧向距离的平方,为防御器到拦截器之间的拦截时间,uDi为第i个防御器的控制输入,αi,βi和η为权重系数。
可选的,所述采用终端投影法对所述性能指标进行求解,确定目标的控制输入和防御器的控制输入,具体包括:
利用公式确定目标的控制输入;
利用公式确定第一个防御器的控制输入;
利用公式确定第二个防御器的控制输入;
其中,和是目标的导航增益参数,和是第一个防御器的导航增益参数,和是第二个防御器的导航增益参数,ZM1D1(t)为第一个拦截器与第一个防御器的状态变量,ZM2D2(t)为第二个拦截器与第二个防御器的状态变量,为防御器到拦截器的剩余时间。
一种多智能体多模自适应协同制导律确定系统,包括:
状态参数获取模块,用于获取防御器、拦截器以及目标的状态参数;所述状态参数包括:速度、法向加速度、视线角以及航向角;
拦截器的制导律确定模块,用于根据多模型自适应估计的方法确定所述拦截器的制导律;
防御器的制导律确定模块,用于根据所述拦截器的制导律确定所述目标及防御器的制导律;
相对运动模型确定模块,用于根据所述防御器、拦截器以及目标的状态参数以及所述防御器的制导律确定飞行器间的相对运动模型;
控制器确定模块,用于以最小消耗下的最小脱靶量为约束条件,根据所述相对运动模型确定所述目标的控制器和所述防御器的控制器;
目标控制模块,用于根据所述目标的控制器控制所述目标;
防御器控制模块,用于根据所述防御器的控制器控制所述防御器。
可选的,所述相对运动模型确定模块具体包括:
相对运动模型确定单元,用于利用公式确定飞行器间的相对运动模型;
其中,AMT为系数矩阵,tgo为拦截器到目标的剩余时间,Δt为仿真步长,x为飞行器之间的状态参数,为目标的控制输入矩阵,uT为目标的控制输入,为第一个防御器的控制输入矩阵,uD1为第一个防御器的控制输入,为第二个防御器的控制输入矩阵,uD2为第二个防御器的控制输入。
可选的,所述控制器确定模块具体包括:
性能指标确定单元,用于利用公式确定性能指标;
目标的控制输入和防御器的控制输入确定单元,用于采用终端投影法对所述性能指标进行求解,确定目标的控制输入和防御器的控制输入;
其中,J为性能指标,S为防御器的总数量,为拦截器与防御器间侧向距离的平方,为防御器到拦截器之间的拦截时间,uDi为第i个防御器的控制输入,αi,βi和η为权重系数。
可选的,所述目标的控制输入和防御器的控制输入确定单元具体包括:
目标的控制输入确定子单元,用于利用公式确定目标的控制输入;
防御器的控制输入第一确定子单元,用于利用公式确定第一个防御器的控制输入;
防御器的控制输入第二确定子单元,用于利用公式确定第二个防御器的控制输入;
其中,和是目标的导航增益参数,和是第一个防御器的导航增益参数,和是第二个防御器的导航增益参数,ZM1D1(t)为第一个拦截器与第一个防御器的状态变量,ZM2D2(t)为第二个拦截器与第二个防御器的状态变量,为防御器到拦截器的剩余时间。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明所提供的一种多智能体多模自适应协同制导律确定方法及系统,为了成功拦截敌方导弹,引入多模型自适应估计(Multiple Model Adaptive Estimation,MMAE)来识别导弹所采用的制导律并估计其状态,并且为了提高目标与防御器的协同程度和对拦截器的制导表现,以最小消耗下的最小脱靶量为约束条件,根据所述相对运动模型确定所述目标的控制器和所述防御器的控制器,即在最小化防御器能量消耗的情况下拦截拦截器。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所提供的一种多智能体多模自适应协同制导律确定方法流程示意图;
图2为防御器、拦截器以及目标平面交战几何示意图;
图3为多智能体协同拦截交战弹道轨迹图;
图4为多智能体加速度变化图;
图5为拦截器和防御器的控制努力变化图;
图6为目标的导航增益示意图;
图7为在不同权值下的防御器脱靶量变化曲线示意图;
图8为元素滤波器的后验概率示意图;
图9为第一个防御器元素滤波器的后验概率示意图;
图10为第二个防御器元素滤波器的后验概率示意图;
图11为第一个防御器位置、速度和加速度的估计误差示意图;
图12为第二个防御器位置、速度和加速度的估计误差示意图;
图13为第一个防御器针对导弹采取不同制导律的脱靶量累积分布函数示意图;
图14为第二个防御器针对导弹采取不同制导律的脱靶量累积分布函数示意图;
图15为不同最大目标加速度限制下第一个防御器的脱靶量累积分布函数示意图;
图16为不同最大目标加速度限制下第二个防御器的脱靶量累积分布函数示意图;
图17为本发明所提供的一种多智能体多模自适应协同制导律确定系统结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种多智能体多模自适应协同制导律确定方法及系统,提高目标与防御器的协同程度和对拦截器的制导表现。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明所提供的一种多智能体多模自适应协同制导律确定方法流程示意图,如图1所示,本发明所提供的一种多智能体多模自适应协同制导律确定方法,包括:
S101,获取防御器、拦截器以及目标的状态参数;所述状态参数包括:速度、法向加速度、视线角以及航向角。
如图2所示,忽略重力的影响,可用极坐标(r,λ)的形式表示拦截器与目标之间的交战过程,即:
相似的,防御器与拦截器之间的交战运动学方程可表示为:
式中,分别是拦截器与目标之间的相对速度和视线角转率, 分别是拦截器与防御器之间的相对速度和视线角转率。
假设目标的加速度a是垂直于速度方向的法向加速度,在整个制导过程中,目标、防御器和拦截器的速度保持不变。每个目标的法向加速度和飞行路径角可表示为:
其中,v是目标的速度,a为目标的法向加速度,为目标航向角也叫做路径角。
当两目标的飞行过程能被近似为一个标称三角形时,则可将上述过程进行线性化处理。在图1描述的交战情形中,存在两个碰撞三角形,它们分别是目标与拦截器之间和拦截器与防御器之间的。
线性化处理后,可以选取状态向量为:
式中,yMT,yMD是目标与拦截器、拦截器与防御器之间的侧向位移。 是它们之间的侧向相对速度。
因此,可得到飞行器间相对运动的状态方程为:
式(8)还可以表示成状态空间描述的形式,即:
式中,
控制输入ui,i={T,M,D}满足条件w是制导过程中的噪声。
在“三体”协同制导模型的基础上,本节考虑我方高价值目标面对敌方两枚导弹的拦截时发射两枚防御器以反拦截的双向协同制导情形。其协同制导拦截图可参照图2。
所述碰撞三角形,对飞行器制导情形线性化处理后,可以选取状态向量为:
x=[xM1T xM2T xM1D1 xM2D2 xM1 xM2 xD1 xD2 xT]T (10)
式中,yMiT,yMiDi是目标与拦截器、拦截器与防御器之间的侧向位移。是它们之间的侧向相对速度。
因此,可得到飞行器间相对运动的状态方程为:
式(11)还可以表示成状态空间描述的形式,即:
式中,
假定目标与拦截器之间的初始距离为相似的,拦截器与防御器间的为在标称三角形的假设下,飞行路径角和视线角的偏差极小。因此,拦截器到目标的拦截时间和防御器到拦截器的拦截时间是固定的,可表示为:
定义Δti=tfMiT-tfMiDi为拦截器到目标和目标到防御器之间的拦截时间偏差。为了完成作战任务,防御器应该尽可能快地拦截拦截器,所以时间偏差应当满足Δti>0。拦截器到目标的剩余时间和防御器到拦截器的剩余时间可定义为
假设目标和防御器都能使用传感器量测视线角信息λMiDi和λMiDi,此外,每个传感器受到相互独立的高斯白噪声vi,i={M1T,M2T,M1D1,M2D2}的干扰。因此,可以假设每个智能体视线角量测噪声遵循以下分布:
利用小角度近似,可得到侧向分离的线性化量测为:
因为目标-防御器组采取双向协同策略,所以线性化的量测噪声σi,y和量测矩阵H可表示为:
量测方程可表示为:
假设目标不能与防御器协同,那么防御器不能得到来自于目标的量测信息,此时量测矩阵H和量测方程可表示为:
S102,根据多模型自适应估计的方法确定所述拦截器的制导律。
作为一种静态多模型估计器,MMAE被设计用来估计动态模型和识别不确定性参数。MMAE首先由Magill提出,后被广泛应用到各种领域中。它主要使用具有不同参数的有限集模型匹配并行滤波器和用于计算库中每个滤波器的加权总和估计值的融合准则。通过对不同的参数值建模,MMAE构造了相应的元素滤波器(Elemental Filters,EF),以实现对系统未知参数的估计。每个滤波器的权重代表基于测量值的相应模型正确的概率。
1、MMAE算法
本文的MMAE算法主要用于识别拦截器向目标制导时可能采取的制导律,其中包括PN制导律、修正比例导引(Augmented Proportional Navigation,APN)制导律和最优制导律(Optimal Guidance Law,OGL)。设代表与N个不同制导参数假设值相对应的离散参数空间,所以需要构建N个对应于不同制导参数值θj的滤波器。假设当前时间为tk,则卡尔曼滤波的新息可表示为:
式中,zk、H和分别代表量测向量、量测矩阵和第j个滤波器的先验状态估计。
根据当前的滤波新息,第j个假设值的后验概率可表示为:
式中,代表新息的概率密度函数(Probability Density Function,PDF),基于高斯假设,可将其写为:
式中,是新息方差矩阵,可将其写为:
式中,和Rk分别是在tk时刻先验估计误差的方差阵和量测噪声方差阵,m是量测数。基于当前时刻的后验概率,可估计系统的状态并依据最小均方误差(MinimumMeanSquare Error,MMSE)准则和最大后验(Maximum a Posteriori,MAP)准则对其融合。MMSE准则要求最终的估计结果采用所有EF相关状态的后验概率估计的加权平均值,MAP准则要求最终的估计结果采用后验概率最大的EF的相关状态估计。本节主要采用MMSE准则,因此可给出最终状态估计的融合形式:
状态误差方差阵可表示为:
2、预测和量测更新
步骤一:初始化模型集基状态和模概率
1、模型集:θj=αj,j=1,...,N;αj代表不同的制导律和参数。
2、基状态:
3、模概率:分配初始概率给不同的模型。
步骤二:基于模型集滤波。
1、一步状态预测
2、估计误差方差阵一步预测
3、计算量测残差和它的方差阵
4、计算增益,更新状态均值和方差矩阵
步骤三:更新模概率
式中,是模型θj的似然函数,可写为:
Ck是归一化后的常数,满足
步骤四:输出总的状态均值和方差矩阵
S103,根据所述拦截器的制导律确定所述目标及防御器的制导律。
S104,根据所述防御器、拦截器以及目标的状态参数以及所述防御器的制导律确定飞行器间的相对运动模型。
MMAE中的制导律模式集
在终端制导领域中拦截固定和机动目标有几种较为常用的制导律,它们分别是PN制导律、APN制导律和OGL制导律。在完美信息和线性运动学的假设下,可将这些制导律写成
式中,是导弹的导航增益值,它的范围一般在3到5之间变化。是零效脱靶量,它表示在目标遵循假定的机动模型且拦截器从当前时间到交战结束之前没有执行任何进一步加速度命令的情况下的错失距离。
PN制导律、APN制导律和OGL制导律的导航增益和零效脱靶量可表示为:
式中,τMi是拦截器的动力学时间常数,且ψ(ξ)=exp(-ξ)+ξ-1。
式中,是归一化的剩余时间,ai表示消耗函数中脱靶量和控制输入的权重比,消耗函数可表示为:
上述制导律可表达为状态变量和控制输入的线性函数:
式中,
将式(46)代入到式(12)中,可得:
式中,
S104具体包括:
利用公式确定飞行器间的相对运动模型。
其中,AMT为系数矩阵,tgo为拦截器到目标的剩余时间,Δt为仿真步长,x为飞行器之间的状态参数,为目标的控制输入矩阵,uT为目标的控制输入,为第一个防御器的控制输入矩阵,uD1为第一个防御器的控制输入,为第二个防御器的控制输入矩阵,uD2为第二个防御器的控制输入。
S105,以最小消耗下的最小脱靶量为约束条件,根据所述相对运动模型确定所述目标的控制器和所述防御器的控制器。
S105具体包括:
利用公式确定性能指标。
上述步骤的具体过程为:
为了使防御器在拦截器到达目标之前拦截拦截器,性能指标中必须要考虑防御器和拦截器之间的脱靶量。此外,目标-防御器组的控制代价应当处于一个合理的范围,因此,双向协同最优控制问题的性能指标可表示为:
式中,S=2;αi,βi和η为权重系数。
防御器拦截任务是否完成取决于拦截时间最长的那个,因此,式(48)可写成
式中,
相较于权重βi和η,对应于脱靶量的权重系数ai→∞,可得到最小化防御器和拦截器之间脱靶量的完美制导律;相似的,对应于防御器控制代价的权重系数βi→∞,可得到防御器不发生机动的制导律;此外,对应于目标控制代价的权重系数η→∞,可得到目标不发生机动的制导律。
采用终端投影法对所述性能指标进行求解,确定目标的控制输入和防御器的控制输入。
其中,J为性能指标,S为防御器的总数量,为拦截器与防御器间侧向距离的平方,为目标到防御器之间的拦截时间,uDi为第i个防御器的控制输入,αi,βi和η为权重系数。
所述采用终端投影法对所述性能指标进行求解,确定目标的控制输入和防御器的控制输入,具体包括:
利用公式确定目标的控制输入。
利用公式确定第一个防御器的控制输入。
利用公式确定第二个防御器的控制输入。
其中,和是目标的导航增益参数,和是第一个防御器的导航增益参数,和是第二个防御器的导航增益参数,ZM1D1(t)为第一个拦截器与第一个防御器的状态变量,ZM2D2(t)为第二个拦截器与第二个防御器的状态变量,为防御器到拦截器的剩余时间。
为了降低求解优化问题的阶数且得到控制输入的解析解,引入终端投影法对性能指标进行处理。根据终端投影法,引入新的状态变量Z(t),其定义为:
式中,是与式(12)相关的状态转移矩阵,D是用来分离状态变量x(t)中元素的常数向量。
当D=D1=[0 0 0 0 1 0 0 0 0 0 0 0 0]时,可以从状态变量x中分离第一个防御器和第一个拦截器的侧向位移yM1D1。
相似的,当D=D2=[0 0 0 0 0 0 1 0 0 0 0 0 0]时,可以从状态变量x中分离第二个防御器和第二个拦截器的侧向位移yM2D2。
对于具有动力学矩阵A的线性系统,其相关状态转移矩阵的基本属性有:
将D1和D2代入到式(50)中可得:
此外,式(52)和(53)还可写为:
结合式(51)和新的状态变量ZMiDi(t)对时间的导数,可以得到:
式中,
式(56)和(57)表明,是状态独立的且只与设计的控制器有关。利用终端投影法降阶后,可将式(49)表示为:
性能指标(58)的哈密尔顿函数为:
新的状态变量对时间的导数是状态独立的,可大大简化伴随方程相关的计算
伴随方程的解可表示为:
由控制方程可得:
将式(64)、(65)和(66)代入到式(56)和(57)中,可得:
式中,
将式(67)和(68)从t到tf积分可得:
计算可得和的解,表示为:
将式(71)和(72)代入到(64)、(65)和(66)中,可得:
式中,
和是目标的导航增益参数。
式中,
和是第一个防御器的导航增益参数。
式中,
和是第二个防御器的导航增益参数。
S106,根据所述目标的控制器控制所述目标。
S107,根据所述防御器的控制器控制所述防御器。
用数值仿真法来分析本章所提出的结合MMAE的协同制导律。首先,设置了仿真参数且分析了多智能体的交战情况。在彼此知道对方完美信息的条件下,通过目标、防御器和拦截器的动力学模型评估了双向协同最优制导律的性能。其次,利用蒙特卡洛(MonteCarlo,MC)方法评估了协同制导律的估计性能和制导精度,它们主要受两种因素的影响:一是MMAE对拦截器采用制导律的检测和反应;另一个是目标与防御器之间的协同程度。
1、拦截器参数和交战情形
对于确定的制导律,其仿真参数设置如下:目标与两拦截器之间的初始距离为初始侧向距离分别为yM1T1=50m和yM2T2=-50m。在交战之初防御器就从目标处发射,所以防御器与拦截器的初始侧向距离和目标与导弹之间的相等,分别为yM1D1=50m和yM2D2=-50m。目标、防御器和拦截器的速度分别为vT=800m/s,vDi=1200m/s和vMi=1200m/s。忽略重力的影响,目标、防御器和拦截器的最大过载限制分别为和过载时间常数分别为τT=0.2,τDi=0.2和τMi=0.2。仿真时间间隔设置为Δ=0.001s,视线角量测噪声的标准差为σi,λ=1mrad。拦截器在完全知晓目标完美信息的条件下,采取PN、APN和OGL其中某一制导律拦截目标。
假设两导弹利用导航增益为N=3的PN和APN制导律拦截目标。为了实现MC仿真,滤波的初始条件服从一个高斯分布,为:
式中:是式(11)定义的滤波初始状态,P0是滤波初始方差矩阵。
在本节中利用100次MC仿真来评估结合MMAE的所提双向最优协同制导律的性能。
图3为多智能体协同拦截交战轨迹图,图4为多智能体加速度变化图。从图3中可以看出防御器会在拦截器到达目标之前成功拦截目标,且在制导末端它们的拦截脱靶量低于0.01m。这说明在知晓对方完美信息的条件下,所设计的双向协同最优制导律具有较高的拦截精度。从图4中可以看出,当目标与防御器充分协同时,防御器所需的最大过载比拦截器小。防御器拦截导弹所需的控制消耗要比拦截器拦截目标所需的远小得多,这是因为目标对导弹执行引诱机动能使得防御器更容易拦截拦截器。
图5为在不同权重值η下的目标导航增益变化曲线。从图6中可以看出,导航增益和随着权重值的减小而增大,这是因为减小目标的权重值η会导致控制需求的增加,最终在拦截时刻达到0。这对于防御器的导航增益也是一样的。从图7中可以看出,增大防御器的权重值能够减少其脱靶量。当权重值αi从0到10变化时,防御器脱靶量变化得非常剧烈;当它趋向于无穷时,防御器得脱靶量会趋向于0。此外,权重值η对于脱靶量的影响比较小。
2、估计性能评估和脱靶量评估
图8给出了拦截器所采用的制导律后验概率的变化图。从8中可以看出,识别出两拦截器所采用制导律所花费的时间大约为2.5s。在拦截器制导律都被识别的条件下,目标-防御器组所采取的双向协同最优制导律是有效的。MMAE对拦截器制导律的识别速度能影响防御器对拦截器的制导精度。图9和图10分别为第一个防御器识别第一个拦截器所采取的制导律和第二个防御器识别拦截器2所采取的制导律的后验概率变化图。比较图8、图9和图10可知,识别导弹制导律所花费的时间取决于最晚被识别出的那个。
图11和图12分别提出了对拦截器和第二个拦截器的位置、速度和加速度的估计误差变化图。从图11和图12中可以看出,利用MMAE识别拦截器采取的制导律和导航增益参数能够输出很小的估计误差。所有状态估计误差的快速收敛,特别是加速度估计误差,对终端脱靶量具有很重要的影响。正如图11和图12所示,加速度的估计误差很快收敛到0并保持不变直到制导结束,这表明结合MMAE的双向协同最优制导律具有良好的制导性能。
通过500次MC仿真,分析结合了MMAE的双向协同最优制导律的闭环拦截性能。
图13和图14分别提出了第一个防御器和第二个防御器针对不同导弹制导律的脱靶量累积分布函数,它是由防御器的最小脱靶量定义的。通常在脱靶量累积分布函数中设置一个阈值来评估目标的终端拦截性能,即,确保95%杀伤概率所需的战斗部杀伤范围(Warhead Lethality Ranges,WLR)。从图13和图14中可以看出,第一个防御器和第二个防御器确保95%杀伤概率所需的WLR都小于1m,这表明结合MMAE的双向协同最优制导律具有很好的估计能力和制导性能。此外,针对拦截器采取的不同制导律,第一个防御器和第二个防御器确保95%杀伤概率的所需的WLR都比较接近,这表明了MMAE针对拦截器采取的不同制导律具有相同的估计和识别能力。
图15和图16分别为第一个防御器和第二个防御器在不同目标最大加速度限制下的脱靶量累积分布函数。从图15和图16中可以看出防御器确保95%杀伤概率所需的WLR会随着目标最大过载限制值的减小而增加,导致了较差的制导性能。这表明目标协同防御器做协同机动能提高防御器对导弹的制导性能,并降低制导过程中所需的控制代价。
图17为本发明所提供的一种多智能体多模自适应协同制导律确定系统结构示意图,如图17所示,本发明所提供的一种多智能体多模自适应协同制导律确定系统,包括:
状态参数获取模块1701,用于获取防御器、拦截器以及目标的状态参数;所述状态参数包括:速度、法向加速度、视线角以及航向角。
拦截器的制导律确定模块1702,用于根据多模型自适应估计的方法确定所述拦截器的制导律。
防御器的制导律确定模块1703,用于根据所述拦截器的制导律确定所述目标及防御器的制导律。
相对运动模型确定模块1704,用于根据所述防御器、拦截器以及的状态参数以及所述防御器的制导律确定飞行器间的相对运动模型。
控制器确定模块1705,用于以最小消耗下的最小脱靶量为约束条件,根据所述相对运动模型确定所述目标的控制器和所述防御器的控制器。
目标控制模块1706,用于根据所述目标的控制器控制所述目标。
防御器控制模块1707,用于根据所述防御器的控制器控制所述防御器。
所述相对运动模型确定模块1704具体包括:
相对运动模型确定单元,用于利用公式确定飞行器间的相对运动模型;
其中,AMT为系数矩阵,tgo为拦截器到目标的剩余时间,Δt为仿真步长,x为飞行器之间的状态参数,为目标的控制输入矩阵,uT为目标的控制输入,为第一个防御器的控制输入矩阵,uD1为第一个防御器的控制输入,为第二个防御器的控制输入矩阵,uD2为第二个防御器的控制输入。
所述控制器确定模块1705具体包括:
性能指标确定单元,用于利用公式确定性能指标。
目标的控制输入和防御器的控制输入确定单元,用于采用终端投影法对所述性能指标进行求解,确定目标的控制输入和防御器的控制输入。
其中,J为性能指标,S为防御器的总数量,为拦截器与防御器间侧向距离的平方,为目标到防御器之间的拦截时间,uDi为第i个防御器的控制输入,αi,βi和η为权重系数。
所述目标的控制输入和防御器的控制输入确定单元具体包括:
目标的控制输入确定子单元,用于利用公式确定目标的控制输入。
防御器的控制输入第一确定子单元,用于利用公式确定第一个防御器的控制输入。
防御器的控制输入第二确定子单元,用于利用公式确定第二个防御器的控制输入。
其中,和是目标的导航增益参数,和是第一个防御器的导航增益参数,和是第二个防御器的导航增益参数,ZM1D1(t)为第一个拦截器与第一个防御器的状态变量,ZM2D2(t)为第二个拦截器与第二个防御器的状态变量,为防御器到拦截器的剩余时间。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (6)
1.一种多智能体多模自适应协同制导律确定方法,其特征在于,包括:
获取防御器、拦截器以及目标的状态参数;所述状态参数包括:速度、法向加速度、视线角以及航向角;
根据多模型自适应估计的方法确定所述拦截器的制导律;
根据所述拦截器的制导律确定所述目标及防御器的制导律;
根据所述防御器、拦截器以及目标的状态参数以及所述防御器的制导律确定飞行器间的相对运动模型;
以最小消耗下的最小脱靶量为约束条件,根据所述相对运动模型确定所述目标的控制器和所述防御器的控制器;
根据所述目标的控制器控制所述目标;
根据所述防御器的控制器控制所述防御器;
所述根据所述防御器、拦截器以及目标的状态参数以及所述防御器的制导律确定飞行器间的相对运动模型,具体包括:
利用公式确定飞行器间的相对运动模型;
其中,AMT为系数矩阵,tgo为拦截器到目标的剩余时间,Δt为仿真步长,x为飞行器之间的状态参数,为目标的控制输入矩阵,uT为目标的控制输入,为第一个防御器的控制输入矩阵,uD1为第一个防御器的控制输入,为第二个防御器的控制输入矩阵,uD2为第二个防御器的控制输入。
2.根据权利要求1所述的一种多智能体多模自适应协同制导律确定方法,其特征在于,所述以最小消耗下的最小脱靶量为约束条件,根据所述相对运动模型确定所述目标的控制器和所述防御器的控制器,具体包括:
利用公式确定性能指标;
采用终端投影法对所述性能指标进行求解,确定目标的控制输入和防御器的控制输入;
其中,J为性能指标,S为防御器的总数量,为拦截器与防御器间侧向距离的平方,为目标到防御器之间的拦截时间,uDi为第i个防御器的控制输入,αi,βi和η为权重系数。
3.根据权利要求2所述的一种多智能体多模自适应协同制导律确定方法,其特征在于,所述采用终端投影法对所述性能指标进行求解,确定目标的控制输入和防御器的控制输入,具体包括:
利用公式确定目标的控制输入;
利用公式确定第一个防御器的控制输入;
利用公式确定第二个防御器的控制输入;
其中,和是目标的导航增益参数,和是第一个防御器的导航增益参数,和是第二个防御器的导航增益参数,ZM1D1(t)为第一个拦截器与第一个防御器的状态变量,ZM2D2(t)为第二个拦截器与第二个防御器的状态变量,为防御器到拦截器的剩余时间。
4.一种多智能体多模自适应协同制导律确定系统,其特征在于,包括:
状态参数获取模块,用于获取防御器、拦截器以及目标的状态参数;所述状态参数包括:速度、法向加速度、视线角以及航向角;
拦截器的制导律确定模块,用于根据多模型自适应估计的方法确定所述拦截器的制导律;
防御器的制导律确定模块,用于根据所述拦截器的制导律确定所述目标及防御器的制导律;
相对运动模型确定模块,用于根据所述防御器、拦截器以及目标的状态参数以及所述防御器的制导律确定飞行器间的相对运动模型;
控制器确定模块,用于以最小消耗下的最小脱靶量为约束条件,根据所述相对运动模型确定所述目标的控制器和所述防御器的控制器;
目标控制模块,用于根据所述目标的控制器控制所述目标;
防御器控制模块,用于根据所述防御器的控制器控制所述防御器;
所述相对运动模型确定模块具体包括:
相对运动模型确定单元,用于利用公式确定飞行器间的相对运动模型;
其中,AMT为系数矩阵,tgo为拦截器到目标的剩余时间,Δt为仿真步长,x为飞行器之间的状态参数,为目标的控制输入矩阵,uT为目标的控制输入,为第一个防御器的控制输入矩阵,uD1为第一个防御器的控制输入,为第二个防御器的控制输入矩阵,uD2为第二个防御器的控制输入。
5.根据权利要求4所述的一种多智能体多模自适应协同制导律确定系统,其特征在于,所述控制器确定模块具体包括:
性能指标确定单元,用于利用公式确定性能指标;
目标的控制输入和防御器的控制输入确定单元,用于采用终端投影法对所述性能指标进行求解,确定目标的控制输入和防御器的控制输入;
其中,J为性能指标,S为防御器的总数量,为拦截器与防御器间侧向距离的平方,为目标到防御器之间的拦截时间,uDi为第i个防御器的控制输入,αi,βi和η为权重系数。
6.根据权利要求5所述的一种多智能体多模自适应协同制导律确定系统,其特征在于,所述目标的控制输入和防御器的控制输入确定单元具体包括:
目标的控制输入确定子单元,用于利用公式确定目标的控制输入;
防御器的控制输入第一确定子单元,用于利用公式确定第一个防御器的控制输入;
防御器的控制输入第二确定子单元,用于利用公式确定第二个防御器的控制输入;
其中,和是目标的导航增益参数,和是第一个防御器的导航增益参数,和是第二个防御器的导航增益参数,ZM1D1(t)为第一个拦截器与第一个防御器的状态变量,ZM2D2(t)为第二个拦截器与第二个防御器的状态变量,为防御器到拦截器的剩余时间。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110065617.1A CN112859918B (zh) | 2021-01-18 | 2021-01-18 | 一种多智能体多模自适应协同制导律确定方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110065617.1A CN112859918B (zh) | 2021-01-18 | 2021-01-18 | 一种多智能体多模自适应协同制导律确定方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112859918A CN112859918A (zh) | 2021-05-28 |
CN112859918B true CN112859918B (zh) | 2023-10-27 |
Family
ID=76006833
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110065617.1A Active CN112859918B (zh) | 2021-01-18 | 2021-01-18 | 一种多智能体多模自适应协同制导律确定方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112859918B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114415723B (zh) * | 2022-01-11 | 2023-09-12 | 北京科技大学 | 一种多飞行器协同捕获空间划分方法和装置、电子设备 |
CN115129083B (zh) * | 2022-07-20 | 2024-06-14 | 北京航空航天大学 | 一种针对携带多枚防御导弹目标的协同制导方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7394047B1 (en) * | 2006-05-09 | 2008-07-01 | Lockheed Martin Corporation | Interceptor guidance for boost-phase missile defense |
CN108362174A (zh) * | 2018-02-09 | 2018-08-03 | 中国人民解放军火箭军工程大学 | 多个拦截器协同探测与制导一体化的拦截方法及系统 |
CN111832121A (zh) * | 2020-07-17 | 2020-10-27 | 中国人民解放军火箭军工程大学 | 一种多飞行器协同探测制导一体化方法及系统 |
CN112033235A (zh) * | 2020-09-04 | 2020-12-04 | 清华大学 | 一种采用黄金分割搜索的空战三体对抗最优预测制导方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015189485A1 (fr) * | 2014-06-13 | 2015-12-17 | Mbda France | Procédé et système pour le guidage, en phase terminale, d'un missile intercepteur vers une cible aérienne mobile |
-
2021
- 2021-01-18 CN CN202110065617.1A patent/CN112859918B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7394047B1 (en) * | 2006-05-09 | 2008-07-01 | Lockheed Martin Corporation | Interceptor guidance for boost-phase missile defense |
CN108362174A (zh) * | 2018-02-09 | 2018-08-03 | 中国人民解放军火箭军工程大学 | 多个拦截器协同探测与制导一体化的拦截方法及系统 |
CN111832121A (zh) * | 2020-07-17 | 2020-10-27 | 中国人民解放军火箭军工程大学 | 一种多飞行器协同探测制导一体化方法及系统 |
CN112033235A (zh) * | 2020-09-04 | 2020-12-04 | 清华大学 | 一种采用黄金分割搜索的空战三体对抗最优预测制导方法 |
Non-Patent Citations (6)
Title |
---|
Cooperative Guidance Considering Detection Configuration Against Target With a Decoy;王少博;《IEEE Access》;全文 * |
Three player pursuit and evasion conflict;RUBINSKY S;《Journal of Guidance》;全文 * |
Three-Dimensional Intercept Angle Guidance for Active Aircraft Protection;Atul Saurav;《IEEE Access》;全文 * |
三体对抗中的自适应协同突防策略;方峰;《西安交通大学学报》;全文 * |
主动防御的自适应最优协同制导律;胡翌玮;《信息与控制》;全文 * |
带有引诱角色的多飞行器协同最优制导方法;王少博;《航空学报》;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112859918A (zh) | 2021-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112859918B (zh) | 一种多智能体多模自适应协同制导律确定方法及系统 | |
Lee et al. | Polynomial guidance laws considering terminal impact angle and acceleration constraints | |
Palumbo et al. | Modern homing missile guidance theory and techniques | |
Harl et al. | Impact time and angle guidance with sliding mode control | |
Ryoo et al. | Time-to-go weighted optimal guidance with impact angle constraints | |
CN102568004A (zh) | 一种高机动目标跟踪算法 | |
CN107943079B (zh) | 一种剩余飞行时间在线估计方法 | |
CN107633256A (zh) | 一种多源测距下联合目标定位与传感器配准方法 | |
CN111460636A (zh) | 不完全量测数据驱动下的机动扩展目标混合交互式强跟踪滤波方法 | |
CN111832121A (zh) | 一种多飞行器协同探测制导一体化方法及系统 | |
CN102706345A (zh) | 一种基于衰减记忆序贯检测器的机动目标跟踪方法 | |
CN111897223B (zh) | 一种考虑自动驾驶仪动态特性的速度追踪制导方法 | |
CN116679743A (zh) | 拦截机动目标的非线性最优飞行时间控制制导方法 | |
CN109827478A (zh) | 一种带落角约束与过载约束的制导方法 | |
Chen et al. | Time and FOV constraint guidance applicable to maneuvering target via sliding mode control | |
CN111174643A (zh) | 一种诱饵干扰情况下的飞行器拦截方法及系统 | |
Wu et al. | Terminal guidance law for UAV based on receding horizon control strategy | |
Tian et al. | Integrated strapdown missile guidance and control with field-of-view constraint and actuator saturation | |
Gutman et al. | Proportional navigation against multiple targets | |
Tian et al. | Time-varying asymmetric barrier Lyapunov function-based impact angle control guidance law with field-of-view constraint | |
Yueh et al. | Guidance performance analysis with in-flight radome error calibration | |
Sigalov et al. | State estimation in hybrid systems with a bounded number of mode transitions | |
Glizer et al. | A linear differential game with bounded controls and two information delays | |
Lee et al. | An Improved Interacting Multiple Model Algorithm With Adaptive Transition Probability Matrix Based on the Situation | |
Hexner et al. | Stochastic approach to optimal guidance with uncertain intercept time |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |