CN117192982A - 基于控制参数化的近距空战机动决策优化方法 - Google Patents
基于控制参数化的近距空战机动决策优化方法 Download PDFInfo
- Publication number
- CN117192982A CN117192982A CN202311095262.6A CN202311095262A CN117192982A CN 117192982 A CN117192982 A CN 117192982A CN 202311095262 A CN202311095262 A CN 202311095262A CN 117192982 A CN117192982 A CN 117192982A
- Authority
- CN
- China
- Prior art keywords
- aircraft
- air combat
- distance
- decision
- range
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000005457 optimization Methods 0.000 title claims abstract description 29
- 238000012545 processing Methods 0.000 claims abstract description 17
- 230000003044 adaptive effect Effects 0.000 claims abstract description 11
- 230000006870 function Effects 0.000 claims description 64
- 230000008901 benefit Effects 0.000 claims description 31
- 238000004422 calculation algorithm Methods 0.000 claims description 22
- 239000002245 particle Substances 0.000 claims description 18
- 230000008859 change Effects 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 10
- 230000002195 synergetic effect Effects 0.000 claims description 4
- 230000006978 adaptation Effects 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 230000000630 rising effect Effects 0.000 claims description 3
- 238000013518 transcription Methods 0.000 claims description 3
- 230000035897 transcription Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000009194 climbing Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000002787 reinforcement Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000009189 diving Effects 0.000 description 1
- 238000010304 firing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Landscapes
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
Abstract
本发明公开了一种基于控制参数化的近距空战机动决策优化方法,涉及飞行器机动决策技术领域,包括:定义近距空战核心因素优势函数;根据能自适应变化权重系数和近距空战核心因素优势函数构建近距自适应空战优势函数;建立自适应飞行器空战机动决策最优控制问题;将自适应飞行器空战机动决策最优控制问题处理为有限维可在线求解的非线性规划问题;将机动决策最优控制问题近似为在线可解且梯度可求的非线性规划问题;对在线可解且梯度可求的非线性规划问题进行求解,得到基于控制参数化的近距空战机动决策。本发明能够满足实时性要求且适用于更复杂的空战环境,能够较方便地移植到其他型号飞行器空战问题中。
Description
技术领域
本发明涉及飞行器机动决策技术领域,具体而言,涉及一种基于控制参数化的近距空战机动决策优化方法。
背景技术
随着制空权在现代战争中愈发重要的地位,飞行器在制空权上的争夺能力成为现代化空战中最关键的能力。为了实现制空优势,飞行员如何最大程度上利用自身飞行器的机动性能和机载武器攻击能力实现及保持空战优势位是关键之处。空战对抗是为了在作战时避免陷入敌方飞行器的机载武器有效攻击范围的同时抢占有利态势位置,以达到能够实现提前对敌打击的目的。然而,由于复杂且时变的空战态势,飞行员如何作出对应的飞行器最优机动决策变得错综复杂。因此,如何根据当前空战态势迅速作出符合当前飞行器机动能力的较优机动决策是空战作战能力研究的重要方向。
根据是否考虑敌方飞行器的空战机动策略,目对近距空战机动决策算法的研究主要集中在两类:一类是不考虑敌方机动策略,以自身视角出发作出机动决策的机动决策点算法,如专家系统和强化学习算法。另一类则是考虑了敌方机动策略而作出的博弈对抗策略,主要为微分对策等博弈决策方法。然而,这些方法存在一定的局限性:(1)微分对策一类方法在复杂空战环境下无法准确建模且计算量较大;(2)专家系统方法的移植性和适应性较差,只能作为辅助机动决策算法;(3)基于强化学习的机动决策方法训练阶段漫长且训练成功后无法直接应用到其他空战环境或其他型号飞行器中,并且难以保证机动决策的安全性。以上方法不仅具有各自的缺点,并且都无法具备机动决策的安全性和当前飞行器机动性能下的较优性。
发明内容
本发明在于提供一种基于控制参数化的近距空战机动决策优化方法,其能够缓解上述问题。
为了缓解上述的问题,本发明采取的技术方案如下:
一种基于控制参数化的近距空战机动决策优化方法,包括以下步骤:
S1、定义近距空战核心因素优势函数,包括距离优势函数Td,角度优势函数Ta,速度优势函数Tv,以及高度优势函数Th;
S2、为各近距空战核心因素优势函数分别分配能随自适应规则变化的权重系数α=[αa αd αh αv],根据权重系数α=[αa αd αh αv]和近距空战核心因素优势函数构建近距自适应空战优势函数;
S3、根据近距自适应空战优势函数、飞行器质点动力学模型和飞行器实际机动性能安全约束,建立自适应飞行器空战机动决策最优控制问题;
S4、采用离散控制参数化方法对自适应飞行器空战机动决策最优控制问题进行离散近似处理,包括控制量离散化近似处理、动力学离散化近似处理和性能约束离散化近似处理,将自适应飞行器空战机动决策最优控制问题处理为有限维可在线求解的非线性规划问题;
S5、采用约束转录法对步骤S4得到的非线性规划问题中的非线性状态约束进行降维处理,将机动决策最优控制问题近似为在线可解且梯度可求的非线性规划问题;
S6、对步骤S5得到的在线可解且梯度可求的非线性规划问题进行求解,得到基于控制参数化的近距空战机动决策。
具体地,步骤S1中,
角度优势函数Ta为:
其中,φ为目标方位角,q为目标进入角;
距离优势函数Td为:
其中,d为我方飞行器与敌方飞行器的当前距离,d为我方飞行器的位置矢量与敌方飞行器位置矢量的差,σ1,σ2为两个控制距离优势值上升坡度的参数,[dmin,dmax]为双方飞行器的近距空空导弹的攻击范围;
速度优势函数Tv为:
其中,|vr|,|vb|分别为我方和敌方飞行器的飞行速度,|vr|∈[vrmin,vrmax],为我方飞行器的飞行速度阈值;
高度优势函数Th为:
其中,σ3,σ4为两个控制高度优势值上升坡度的参数,Δh0为我方飞行器与敌方飞行器在当前时刻的相对高度,Δh为两机相对高度,[Δhmin,Δhmax]为我方飞行器与敌方飞行器间的最佳高度差。
更具体地,步骤S2中,αa,αd,αh,αv均大于等于0,且αa+αd+αh+αv=1,自适应规则如下:
当我方飞行器和敌方飞行器未进入攻击范围[dmin,dmax]且距离d>1.5dmax时,α=[0 1 0 0];
当我方飞行器和敌方飞行器未进入攻击范围[dmin,dmax]且距离d≤1.5dmax时,α=[0.8 0.2 0 0];
当我方飞行器和敌方飞行器未进入攻击范围[dmin,dmax]且距离d<dmin,Ta>0.25时,α=[0.7 0.3 0 0];
当我方飞行器和敌方飞行器未进入攻击范围[dmin,dmax]且距离d<dmin,Ta≤0.25时,α=[1 0 0 0];
当我方飞行器和敌方飞行器进入攻击范围[dmin,dmax],但双方飞行器的目标方位角都小于最大攻击角度φm时,α=[1 0 0 0];
其余情况设置α=[0.5 0.2 0.1 0.2]。
更具体地,步骤S2中,近距自适应空战优势函数为:
R=αaTa+αdTd+αvTv+αhTh。
更具体地,步骤S3中,自适应飞行器空战机动决策最优控制问题为:
x(0)=x0
u(t)=[nx(t),n(t),μ(t)]T
其中,nx、n和μ是控制量输入,分别为纵向过载、法向过载和速度滚转角;V、χ和γ分别为飞行器的速度、偏航角和爬升角;x(t)=[V,χ,γ,x,y,z]T,u(t)=[nx,nz,μ]T。
更具体地,步骤S4中得到的有限维可在线求解的非线性规划问题为:
s.t. x(k+1)=x(k)+f(x(k),u(k))Δt
u(k)=[nxk,nk,μk]T
k=1,2,...,M,M=tf/Δt
x(0)=x0
其中,M为时间段等分离散数量,Δt为离散步长,tf为未来的一段时间。
更具体地,步骤S5中得到的在线可解且梯度可求的非线性规划问题为:
s.t. x(k+1)=x(k)+f(x(k),u(k))Δt
u(k)=[nxk,nk,μk]T
k=1,2,...,M,M=tf/Δt
x(0)=x0
其中,Gi,gi,Υ分别为处理后的状态一维约束、原始的时变状态约束和松弛系数。
更具体地,步骤S6具体包括以下步骤:
S61、根据非线性规划算法当前迭代过程中的决策变量(若当前迭代为第一次优化,则决策变量由初始猜测值决定,其余迭代过程中的决策变量由非线性规划算法根据梯度决定),从飞行器当前初始状态出发,通过公式
x(k+1)=x(k)+f(x(k),u(k))Δt
=F(k,x(k),u(k))
k=0,1,...,M-1
得到状态变量u(k),k=0,1,2,...,M,f(x(k),u(k))为飞行器质点动力学方程;
S62、根据公式
计算当前得到的目标函数值;
S63、根据协态方程
反向求解得到协态变量λ(k),H(x(k),u(k),λ(k+1),k)=-R(x(k))+λT(k+1)F(x(k),u(k),k)为哈密顿函数;
S64、将状态变量、协态变量以及控制变量带入方程
计算得到目标函数J相对决策变量的梯度;
S66、由当前目标函数值及梯度,通过非线性规划算法得到下一次迭代的决策变量,若已满足优化停止条件,则算法结束,输出基于控制参数化的近距空战机动决策u*(0)T,u*(1)T,...,u*(M-1)T,否则跳转至步骤S61。
与现有技术相比,本发明的有益效果是:
本发明采用的基于离散控制参数化的机动决策优化算法,能够满足实时性要求且适用于更复杂的空战环境;
本发明机动决策算法具有较好的算法可解释性且具备决策安全性,能够严格保证飞行器的机动性能约束,并且能够较方便地移植到其他型号飞行器空战问题中,不需要重新训练;
本发明的机动决策算法具有较好的通用性、扩展性和考虑飞行机动性能下的较优性。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举本发明实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为红、蓝双方飞行器的近距空战飞行轨迹图;
图2为红机攻击角度和距离变化图;
图3为红机飞行速度和爬升角变化图;
图4为优势函数角度和距离权重系数变化图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。
本实施方式考虑的基础空战场景为1v1近距格斗空战,两方飞行器分别为我方飞行器(即红方飞行器)和敌方飞行器(即蓝方飞行器),在近距格斗场景下假设战场态势感知等级为全局透明态势,即空战双方均可以获取对手高精度、高刷新率的态势信息。两方飞行器在进行近距空战时,当一方为如下情况时即占据了空战有利态势:
1)成功发射己方近距红外空空导弹或者航炮并创造敌机难以攻击的条件;
2)占据战术有利位置,并保持继续攻击的可能性。
本发明所述基于控制参数化的近距空战机动决策优化方法,具体如下:
为了实现以上的有利态势,考虑如下近距空战态势中的核心因素:
1)距离优势:使得敌方进入我方飞行器机载武器的打击范围;
2)方位角优势:使得敌方进入我方飞行器机载武器的最佳发射角度;
3)速度和高度优势:使得我方战机拥有更好的可机动性能和能量优势。
以上态势核心因素需要建立双方飞行器的相对态势,因此考虑本机和敌机的状态向量Cr、Cb分别定义为:
其中,Pr为红方飞行器在地面坐标系的位置矢量,vr为红方飞行器的飞行速度矢量,Pb为蓝方飞行器在地面坐标系的位置矢量,vb为蓝方飞行器的飞行速度矢量。
根据两机的相对几何态势得空战态势状态向量:
S=(d,Δh,φ,q,Δv) (2)
其中,d=Pr-Pb,为两机的相对位置矢量,Δh为两机高度差,Δv=|vr|-|vb|为目标(即敌方飞行器)相对本机的速度,φ为目标方位角,q为目标进入角,由下式计算得到:
假设双方飞行器的近距空空导弹的攻击范围为[dmin,dmax],且当目标方位角φ大于等于最大攻击角度φm时可发射,即得到攻击条件,并假设当目标方位角φ越大时,导弹的击中概率越大。
在给出飞行器的近距格斗核心因素和攻击条件后,本着近距空战“先敌发射”的作战优势原则,本发明方法每隔一定的决策步长时间,给出当前空战态势下的机动对策。
1、定义相对态势变量构成本机优势情况的子优势函数:距离优势函数Td;角度优势函数Ta;速度优势函数Tv;高度优势函数Th。
1)对于红方飞行器来说,其角度奖励主要考虑格斗时的目标进入角和目标方位角对空战优势带来的影响,近距格斗中的两机攻击角度很大程度上决定了空战的结果。当目标方位角φ接近于π时,表示敌人正处在红方飞行器机头的正方向,红方飞行器处于占据攻击优势的区域,对蓝方飞行器的攻击威胁最大,最有利于对蓝方飞行器展开攻击。当目标方位角φ从π逐渐减小到0时,红方的攻击角度不断增大,越来越不利于红方展开进攻。当目标进入角q接近于π时,表示我方飞行器处于敌机飞行方向的正后方,敌机的攻击角度最差,而当目标进入角q逐渐减小到0时,敌方的攻击角度逐渐变优,可能产生攻击威胁。
因此在飞行器近距空战格斗机动决策问题中,从红方飞行器的角度出发,设置如下角度优势函数Ta∈[0,1],以达到在敌机角度不占优势的基础上使目标方位角较小的目的:
2)对于红方飞行器,设其武器攻击范围为dm,若两机当前距离为d,则对于红方飞行器追击蓝方飞行器,若蓝方飞行器当前在武器攻击范围外,则下个时刻红方飞行器应缩短两机距离,使蓝方飞行器进入我方的打击距离[dmin,dmax];若蓝方飞行器当前已在红方攻击范围内,则主要考虑其他的空战优势,如角度优势和速度优势等。设置距离优势函数为:
式中,σ1,σ2为两个控制距离优势值上升坡度的参数。
3)在定义速度优势函数Tv前先需要定义我方飞行器的最佳攻击速度v*,当敌方飞行器已经处于导弹的攻击范围时,最佳攻击速度应接近敌方飞行器的飞行速度|vb|,当敌方飞行器在导弹的攻击范围之外时,我方飞行器应提高速度或降低速度,使敌机进入我方武器攻击范围,另外还应考虑到我方飞行器的飞行速度阈值|vr|∈[vrmin,vrmax]。综上,最佳攻击速度v*计算如下:
速度优势函数Tv表示为:
4)为了占据发射导弹时的高度优势,提高我方飞行器未来的可机动性,设定与敌机间的最佳高度差为Δh∈[Δhmin,Δhmax],当两机高度差满足该区间时,高度优势值最大。设当前我机与敌机的相对高度为Δh0,优势函数Th计算如下:
式中σ3,σ4为两个控制高度优势值上升坡度的参数。
2、在给出近距空战优势各核心因素对应的优势函数后,拟建立我方飞行器的近距自适应空战优势函数为:
R=αaTa+αdTd+αvTv+αhTh (9)
其中,权重系数αa,d,h,v>0且满足αa+αd+αh+αv=1。若各权重固定,上述所建立的优势函数无法全面地描述当前飞行器的战场优势,飞行器间的空战态势变化迅速,采用固定的优化函数权重系数会导致飞行器的最优机动决策过于单一,因此,本发明建立优势函数中各权重系数的自适应规则,目的是建立一个随空战态势而变的动态优势函数,从而更好地指导我方飞行器做出机动决策。
权重系数α=[αa αd αh αv]的自适应规则如下:
1)当前时刻双机未进入攻击范围且距离d>1.5dmax,即双机距离相比攻击范围还较远时,使红方飞行器全力加速追向蓝方飞行器,即设置α=[0 1 0 0];
2)当前时刻双机未进入攻击范围且距离d≤1.5dmax,即双机距离攻击范围外围较近时,使红机在扩大角度优势的同时缩短两机距离,即设置α=[0.8 0.2 0 0];
3)当前时刻双机未进入攻击范围且距离d<dmin,即双机距离攻击范围内围较近时,若此时红方具备角度优势(Ta>0.25),则使红方在保证角度优势的同时扩大两机距离,设置α=[0.7 0.3 0 0];当前时刻双机未进入攻击范围且距离d<dmin,即双机距离攻击范围内围较近时,若红方不具备角度优势,则使红方全力扩大角度优势,设置α=[1 0 0 0];
4)当前时刻双机进入攻击范围但双方飞行器的目标方位角都小于最大攻击角度φm时,全力扩大角度优势,设置α=[1 0 0 0]。
5)其余情况设置α=[0.5 0.2 0.1 0.2]。
3、在给出自适应空战优势函数后,基于飞行器质点动力学方程与飞行器实际机动性能安全约束,建立自适应飞行器空战机动决策最优控制问题。
在侧重于机动轨迹的空战机动决策研究中,一般选用将飞行器视作质点的质点动力学模型即可以满足精度要求。此外,从研究内容和实用的角度来讲,也更倾向于选用航迹坐标轴下的质点动力学方程,避免直接使用6自由度运动方程而难以满足机动决策实时性和可行性的情况。
不同型号的飞行器虽然具有相同形式的质点动力学模型,但其状态量和控制量约束不同,代表不同的机动能力等飞行性能。三自由度质点动力学模型将无人机视为一个质点,控制量输入为纵向过载nx、法向过载n和速度滚转角μ。选取纵向过载nx、法向过载n和速度滚转角μ为控制变量的飞行器质点动力学模型为:
由式(10)知,只要给出纵向过载nx、法向过载n以及滚转角μ随时间变化的值,在给定飞行器初始状态的情况下,就可以通过是数值积分求解出速度V、偏航角χ和爬升角γ随时间的变化情况,进而可求解得到飞行器在航迹坐标系下的坐标,即飞行器的运动轨迹。
对于上述飞行器质点动力学模型,取状态量为:
x(t)=[V,χ,γ,x,y,z]T (11)
系统控制输入取为:
u(t)=[nx,nz,μ]T (12)
上述飞行器质点动力学模型可表示为:
式中,x0为飞行器初始状态。
我们基于上述飞行器质点动力学模型将飞行器近距空战最优机动决策问题处理为优化问题,进行最优机动决策的求解。
由于我方飞行器仅知敌机当前信息(位置和速度矢量信息),故可根据当前时刻与敌机的相对态势来规划飞行器下一步的行动,为未来占据近距空战优势位置提供条件。近距空战最优决策问题的目标为使敌机尽快被我方雷达锁定且进入我方飞行器的空空导弹最佳打击范围内,实现“先敌发射”。在优化步长上,每隔tf时间对飞行器运动进行机动决策优化,目标函数取对所建立的近距空战优势函数的积分值:
在计算目标函数时,由于其中的待积分项的输入为所建立的优势函数,因此计算式(14)需要双方飞行器的未来状态,而未来tf时间内的敌方飞行状态未知。考虑近距空战中飞行器所作机动较小和较短的优化步长tf,可根据敌方的历史飞行状态,判断其当前机动属于经典的机动动作中的哪一种(如加速直飞、左转弯和俯冲等),若当前属于非平飞的机动动作,则假设敌方在未来tf时间内将保持当前的机动动作进行飞行,从而假设敌方未来的控制量(经典机动库中每一种动作代表着一组控制量),再根据已知的敌方当前状态,计算其未来tf时间内的飞行状态。若敌方当前为直飞状态,则假设敌方未来tf时间内将选择使当前时刻我方优势函数最小的机动动作进行飞行。
考虑到飞行器的性能约束和安全约束,飞行器过载等控制量和状态量取值范围应该满足飞行器实际机动性能安全约束
近距空战机动决策最优控制即:在满足系统质点动力学方程以及性能不等式约束式(15)的情况下,极小化上述目标函数式(14)。对于不同的飞行器,式(15)中的阈值和约束形式不同。因此,自适应飞行器空战机动决策最优控制问题为:
对于如上自适应飞行器空战机动决策最优控制问题,属于飞行器轨迹优化问题,即通过优化设计飞行过程中控制变量的变化规律,在完成飞行任务的前提下,保证飞行过程中的某个或某些性能指标达到最优。
4、考虑决策实时性与最优性,本专利采取离散控制参数化对属于飞行器轨迹规划问题的自适应飞行器空战机动决策最优控制问题进行求解。
在应用在实际应用场合中,大量的积分操作或者解微分方程的操作,将会在短周期优化时间内占据大部分时间,甚至有可能出现积分失败的情况,因此,考虑在线求解应用的场合,可以在短周期步长内将飞行器运动学模型近似为离散系统模型进行优化处理,这样就可以在损失很小的最优性的前提下,避免大量的积分以及解微分方程的操作,优化求解飞行器的机动策略。
对于在线机动策略的选取,我们可以将上述连续时间飞行器质点模型在短步长内视作离散系统,用离散差分系统近似连续系统,将时间段等分离散为M段,即离散步长为:
Δt=(t0-tf)/M (17)
t0为当前时刻。将连续时间的机动决策控制量(12)进行参数离散化近似,即
u(t)=[u(0)T,u(1)T,...,u(M-1)T]T (18)
其中,u(0),u(1),...u(M-1)即为待优化的参数集合。
自适应飞行器空战机动决策最优控制问题中的目标函数可以近似为:
飞行器质点动力学模型近似为如下离散差分方程:
飞行器实际机动性能安全约束近似为在每个离散点上的相应约束:
通过上述操作,原始的自适应飞行器空战机动决策最优控制问题就通过控制量离散化、动力学离散化和性能约束离散化近似,转化为如下有限维的非线性规划问题。
5、上述飞行器非线性规划问题中的速度等状态约束(优化问题中的非线性约束)的个数由离散个数M决定,如果按照直接形式进行问题求解,底层非线性规划问题中的非线性约束个数将会较多,导致底层问题求解速度较慢。因此,为了提升在线求解计算速度,将以上非线性状态不等式约束通过约束转录法进行处理,将其处理为单维的梯度可推导的状态不等式约束。以速度约束Vk≤Vmax,k=0,1,...,M为例,将其表示为g1=Vmin-Vk≤0,k=0,1,...,M,将其转化为如下形式:
式中,χ>0,γ>0为两个松弛变量,
经过约束维度降维后,原始的非线性规划问题可转化为以下维度较低的非线性规划问题。
6、对于非线性规划问题,可采用成熟的算法求解其进行求解,如一些基于梯度的算法(如BFGS)等,一般类似的求解器可以通过数值求解自动计算其问题相关梯度,但精度较低且耗时较长,故下面求解转化后的上述非线性规划问题中的梯度,提高求解精度以及优化效率。
上述优化的非线性规划问题的哈密顿函数为
H(x(k),u(k),λ(k+1),k)=-R(x(k))+λT(k+1)F(x(k),u(k),k) (26)
由最优控制理论中泛函极值存在的必要条件,上式中的协态变量λ为
通过上式协态方程,可反向求解协态变量,最终可得到目标函数对控制变量的梯度:
由于本专利所建立的底层待求解非线性规划问题中的约束形式与目标函数相同,各约束相对于控制变量的梯度同理可求。
通过以上处理,近距空战机动决策最优控制问题就转化为了相应的梯度可推导的非线性规划问题,算法流程如下:
初始化:输入控制变量的猜测值u(0)T,u(1)T,...,u(M-1)T。
Step1:由非线性规划算法进行中某一个迭代过程中确定性的决策变量,从飞行器当前初始状态出发,通过式(20)差分方程依次得到状态变量u(k),k=0,1,2,...,M,即对于任意离散时间,状态变量已知。
Step2:由式(19)计算当前得到的目标函数值。
Step3:由协态方程式(27),依次由k=M,M-1,...,1,反向求解得到协态变量λ(k)。
Step4:带入控制变量、状态变量以及协态变量,由式(28)计算得到当前梯度(约束相对于控制变量的梯度同理可的)。
Step5:由当前目标函数值及梯度,通过非线性规划算法得到下一次迭代的决策变量,若已满足优化停止条件,则算法结束,输出基于控制参数化的近距空战机动决策u*(0)T,u*(1)T,...,u*(M-1)T,否则跳转至Step1。
下面对上述基于控制参数化的近距空战机动决策优化方法进行仿真:
假设红、蓝双方飞行器为同样型号,即各种飞行参数都相同,各性能参数和优化问题参数具体数值见表1。仿真环境为Matlab2019a,采用Fmincon对优化问题进行求解。
表1机动性能、机载武器和优化问题参数
参数取值 | 意义 |
|nx|≤1,n≤3,|μ|≤60° | 过载及滚转角约束 |
100m/s≤V≤300m/s | 速度约束 |
|γ|≤60° | 爬升角约束 |
φm=170° | 机载武器攻击角度 |
dmin=1km,dmax=2km | 机载武器攻击范围 |
tf=2s | 决策步长 |
M=10 | 控制量离散个数 |
σ1=100,σ2,3,4=1000 | 优势函数子函数坡度系数 |
考虑红蓝飞行器进行近距空战,一方优先具备攻击角度和攻击范围条件即胜利。考虑蓝方采用追击策略,即蓝方的机动目的为极小化与红机的距离,红方采用基于离散控制参数化的近距空战机动决策算法。设定敌方蓝机初始攻击角度占优势,蓝机和红机的初始状态为:
Cr=[Vr,χr,γr,xr,yr,zr]T=[250,π/2,0,1000,1000,8000]T
Cb=[Vb,χb,γb,xb,yb,zb]T=[250,π,0,11000,1000,8000]T
由飞行器空战轨迹图1和攻击条件变化图2可以看到,我方红机虽然初始角度态势较差,但由于两机距离较远,选择极小化与敌机的距离,而距离较近时则选择拉近距离的同时优势我机攻击角度,在不扩大敌机攻击角度优势的情况下,使我机攻击角度逐渐变优,最终提前满足了攻击条件,实现了空战胜利。图3为我方红机飞行速度和爬升角的变化,可见飞行速度和爬升角始终满足所设置的机动性能范围,我方飞行器充分发挥了机动能力,较优且安全地对机动决策进行优化求解输出。图4为我机优势函数角度和距离权重系数的变化,随着两机距离和角度的优劣势变化,我机实时选择不同的机动决策优化侧重点,在时变的空战态势下选择合适的距离优势或角度优势进行机动决策优化。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于控制参数化的近距空战机动决策优化方法,其特征在于,包括以下步骤:
S1、定义近距空战核心因素优势函数,包括距离优势函数Td,角度优势函数Ta,速度优势函数Tv,以及高度优势函数Th;
S2、为各近距空战核心因素优势函数分别分配能随自适应规则变化的权重系数α=[αaαd αh αv],根据权重系数α=[αa αd αh αv]和近距空战核心因素优势函数构建近距自适应空战优势函数;
S3、根据近距自适应空战优势函数、飞行器质点动力学模型和飞行器实际机动性能安全约束,建立自适应飞行器空战机动决策最优控制问题;
S4、采用离散控制参数化方法对自适应飞行器空战机动决策最优控制问题进行离散近似处理,包括控制量离散化近似处理、动力学离散化近似处理和性能约束离散化近似处理,将自适应飞行器空战机动决策最优控制问题处理为有限维可在线求解的非线性规划问题;
S5、采用约束转录法对步骤S4得到的非线性规划问题中的非线性状态约束进行降维处理,将机动决策最优控制问题近似为在线可解且梯度可求的非线性规划问题;
S6、对步骤S5得到的在线可解且梯度可求的非线性规划问题进行求解,得到基于控制参数化的近距空战机动决策。
2.根据权利要求1所述基于控制参数化的近距空战机动决策优化方法,其特征在于,步骤S1中,
角度优势函数Ta为:
其中,φ为目标方位角,q为目标进入角;
距离优势函数Td为:
其中,d为我方飞行器与敌方飞行器的当前距离,d为我方飞行器的位置矢量与敌方飞行器位置矢量的差,σ1,σ2为两个控制距离优势值上升坡度的参数,[dmin,dmax]为双方飞行器的近距空空导弹的攻击范围;
速度优势函数Tv为:
其中,|vr|,|vb|分别为我方和敌方飞行器的飞行速度,|vr|∈[vrmin,vrmax],为我方飞行器的飞行速度阈值;
高度优势函数Th为:
其中,σ3,σ4为两个控制高度优势值上升坡度的参数,Δh0为我方飞行器与敌方飞行器在当前时刻的相对高度,Δh为两机相对高度,[Δhmin,Δhmax]为我方飞行器与敌方飞行器间的最佳高度差。
3.根据权利要求2所述基于控制参数化的近距空战机动决策优化方法,其特征在于,步骤S2中,αa,αd,αh,αv均大于等于0,且αa+αd+αh+αv=1,自适应规则如下:
当我方飞行器和敌方飞行器未进入攻击范围[dmin,dmax]且距离d>1.5dmax时,α=[0 10 0];
当我方飞行器和敌方飞行器未进入攻击范围[dmin,dmax]且距离d≤1.5dmax时,α=[0.80.2 0 0];
当我方飞行器和敌方飞行器未进入攻击范围[dmin,dmax]且距离d<dmin,Ta>0.25时,α=[0.7 0.3 0 0];
当我方飞行器和敌方飞行器未进入攻击范围[dmin,dmax]且距离d<dmin,Ta≤0.25时,α=[1 0 0 0];
当我方飞行器和敌方飞行器进入攻击范围[dmin,dmax],但双方飞行器的目标方位角都小于最大攻击角度φm时,α=[1 0 0 0];
其余情况设置α=[0.5 0.2 0.1 0.2]。
4.根据权利要求3所述基于控制参数化的近距空战机动决策优化方法,其特征在于,步骤S2中,近距自适应空战优势函数为:
R=αaTa+αdTd+αvTv+αhTh。
5.根据权利要求4所述基于控制参数化的近距空战机动决策优化方法,其特征在于,步骤S3中,自适应飞行器空战机动决策最优控制问题为:
x(0)=x0
u(t)=[nx(t),n(t),μ(t)]T
其中,nx、n和μ是控制量输入,分别为纵向过载、法向过载和速度滚转角;V、χ和γ分别为飞行器的速度、偏航角和爬升角;x(t)=[V,χ,γ,x,y,z]T,u(t)=[nx,nz,μ]T。
6.根据权利要求5所述基于控制参数化的近距空战机动决策优化方法,其特征在于,步骤S4中得到的有限维可在线求解的非线性规划问题为:
s.t.x(k+1)=x(k)+f(x(k),u(k))Δt
u(k)=[nxk,nk,μk]T
k=1,2,...,M,M=tf/Δt
x(0)=x0
其中,M为时间段等分离散数量,Δt为离散步长,tf为未来的一段时间。
7.根据权利要求6所述基于控制参数化的近距空战机动决策优化方法,其特征在于,步骤S5中得到的在线可解且梯度可求的非线性规划问题为:
s.t.x(k+1)=x(k)+f(x(k),u(k))Δt
u(k)=[nxk,nk,μk]T
k=1,2,...,M,M=tf/Δt
x(0)=x0
其中,Gi,gi,Υ分别为处理后的状态一维约束、原始的时变状态约束和松弛系数。
8.根据权利要求7所述基于控制参数化的近距空战机动决策优化方法,其特征在于,步骤S6具体包括以下步骤:
S61、根据非线性规划算法当前迭代过程中的决策变量,从飞行器当前初始状态出发,通过公式
x(k+1)=x(k)+f(x(k),u(k))Δt
=F(k,x(k),u(k))
k=0,1,...,M-1
得到状态变量x(k),k=0,1,2,...,M,f(x(k),u(k))为飞行器质点动力学方程;
S62、根据公式
计算当前得到的目标函数值;
S63、根据协态方程
反向求解得到协态变量λ(k),H(x(k),u(k),λ(k+1),k)=-R(x(k))+λT(k+1)F(x(k),u(k),k)为哈密顿函数;
S64、将状态变量、协态变量以及控制变量带入方程
计算得到目标函数J相对决策变量的梯度;
S66、由当前目标函数值及梯度,通过非线性规划算法得到下一次迭代的决策变量,若已满足优化停止条件,则算法结束,输出基于控制参数化的近距空战机动决策u*(0)T,u*(1)T,...,u*(M-1)T,否则跳转至步骤S61。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311095262.6A CN117192982B (zh) | 2023-08-28 | 2023-08-28 | 基于控制参数化的近距空战机动决策优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311095262.6A CN117192982B (zh) | 2023-08-28 | 2023-08-28 | 基于控制参数化的近距空战机动决策优化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117192982A true CN117192982A (zh) | 2023-12-08 |
CN117192982B CN117192982B (zh) | 2024-05-14 |
Family
ID=88993423
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311095262.6A Active CN117192982B (zh) | 2023-08-28 | 2023-08-28 | 基于控制参数化的近距空战机动决策优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117192982B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107390706A (zh) * | 2017-07-26 | 2017-11-24 | 北京航空航天大学 | 一种基于预演机动规则系统的无人机近距格斗决策方法 |
CN110007688A (zh) * | 2019-04-25 | 2019-07-12 | 西安电子科技大学 | 一种基于强化学习的无人机集群分布式编队方法 |
CN112906233A (zh) * | 2021-03-08 | 2021-06-04 | 中国人民解放军国防科技大学 | 基于认知行为知识的分布式近端策略优化方法及其应用 |
CN113159266A (zh) * | 2021-05-21 | 2021-07-23 | 大连大学 | 基于麻雀搜索神经网络的空战机动决策方法 |
CN114167756A (zh) * | 2021-12-08 | 2022-03-11 | 北京航空航天大学 | 多无人机协同空战决策自主学习及半实物仿真验证方法 |
CN114967718A (zh) * | 2022-05-06 | 2022-08-30 | 四川大学 | 一种控制受限下的四旋翼轨迹跟踪最优控制方法 |
CN115688268A (zh) * | 2022-10-14 | 2023-02-03 | 中国空气动力研究与发展中心空天技术研究所 | 一种飞行器近距空战态势评估自适应权重设计方法 |
CN115951709A (zh) * | 2023-01-09 | 2023-04-11 | 中国人民解放军国防科技大学 | 基于td3的多无人机空战策略生成方法 |
-
2023
- 2023-08-28 CN CN202311095262.6A patent/CN117192982B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107390706A (zh) * | 2017-07-26 | 2017-11-24 | 北京航空航天大学 | 一种基于预演机动规则系统的无人机近距格斗决策方法 |
CN110007688A (zh) * | 2019-04-25 | 2019-07-12 | 西安电子科技大学 | 一种基于强化学习的无人机集群分布式编队方法 |
CN112906233A (zh) * | 2021-03-08 | 2021-06-04 | 中国人民解放军国防科技大学 | 基于认知行为知识的分布式近端策略优化方法及其应用 |
CN113159266A (zh) * | 2021-05-21 | 2021-07-23 | 大连大学 | 基于麻雀搜索神经网络的空战机动决策方法 |
CN114167756A (zh) * | 2021-12-08 | 2022-03-11 | 北京航空航天大学 | 多无人机协同空战决策自主学习及半实物仿真验证方法 |
CN114967718A (zh) * | 2022-05-06 | 2022-08-30 | 四川大学 | 一种控制受限下的四旋翼轨迹跟踪最优控制方法 |
CN115688268A (zh) * | 2022-10-14 | 2023-02-03 | 中国空气动力研究与发展中心空天技术研究所 | 一种飞行器近距空战态势评估自适应权重设计方法 |
CN115951709A (zh) * | 2023-01-09 | 2023-04-11 | 中国人民解放军国防科技大学 | 基于td3的多无人机空战策略生成方法 |
Non-Patent Citations (2)
Title |
---|
章胜 等: "基于深度强化学习的空战机动决策试验", 《航空学报》, 25 May 2023 (2023-05-25) * |
韩润海: "面向无人机空战机动决策的深度强化学习技术研究", 《CNKI》, 31 December 2022 (2022-12-31) * |
Also Published As
Publication number | Publication date |
---|---|
CN117192982B (zh) | 2024-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Changqiang et al. | Autonomous air combat maneuver decision using Bayesian inference and moving horizon optimization | |
Park et al. | Differential game based air combat maneuver generation using scoring function matrix | |
CN111666631A (zh) | 犹豫模糊和动态深度强化学习相结合的无人机机动决策方法 | |
CN111898201B (zh) | 一种空战模拟环境中的战斗机高精度自主攻击引导方法 | |
Ramírez López et al. | Effectiveness of autonomous decision making for unmanned combat aerial vehicles in dogfight engagements | |
CN113282061A (zh) | 一种基于课程学习的无人机空中博弈对抗的解决方法 | |
CN114063644B (zh) | 基于鸽群反向对抗学习的无人作战飞机空战自主决策方法 | |
CN114492805A (zh) | 一种基于模糊推理的空战机动决策设计方法 | |
Li et al. | Autonomous maneuver decision-making for a UCAV in short-range aerial combat based on an MS-DDQN algorithm | |
Ruan et al. | Autonomous maneuver decisions via transfer learning pigeon-inspired optimization for UCAVs in dogfight engagements | |
CN112906233A (zh) | 基于认知行为知识的分布式近端策略优化方法及其应用 | |
CN114756959A (zh) | 一种飞行器近距空战机动智能决策机模型设计方法 | |
Chai et al. | A hierarchical deep reinforcement learning framework for 6-DOF UCAV air-to-air combat | |
CN114003050A (zh) | 一种基于微分博弈的三体对抗策略的主动防御制导方法 | |
Gong et al. | UAV cooperative air combat maneuvering confrontation based on multi-agent reinforcement learning | |
Duan et al. | Autonomous maneuver decision for unmanned aerial vehicle via improved pigeon-inspired optimization | |
CN114519292A (zh) | 基于深度强化学习的空空导弹越肩发射制导律设计方法 | |
CN111773722B (zh) | 一种模拟环境中的战斗机规避机动策略集生成方法 | |
CN113741186A (zh) | 一种基于近端策略优化的双机空战决策方法 | |
CN115268496B (zh) | 一种无人机空中对抗机动控制器及其设计方法 | |
CN116432030A (zh) | 一种基于深度强化学习的空战多意图策略自主生成方法 | |
Baspinar et al. | Aerial combat simulation environment for one-on-one engagement | |
CN117192982B (zh) | 基于控制参数化的近距空战机动决策优化方法 | |
CN116360500A (zh) | 一种摆脱距离可控的导弹突防方法 | |
Li et al. | Generation method of autonomous evasive maneuver strategy in air combat |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |