CN115186378A

CN115186378A - 一种空战模拟环境中的战术控制距离实时解算方法

Info

Publication number: CN115186378A
Application number: CN202210725151.8A
Authority: CN
Inventors: 杨振; 高伟男; 朴海音; 詹光; 周德云
Original assignee: Northwestern Polytechnical University
Current assignee: Northwestern Polytechnical University
Priority date: 2022-06-24
Filing date: 2022-06-24
Publication date: 2022-10-14

Abstract

本发明公开了一种空战模拟环境中的战术控制距离实时解算方法，通过生成并训练实时解算模型得到，该模型训练过程包括：构建超视距空战中载机和空空导弹的三维运动模型及其约束模型并设置仿真限制条件得到离线解算模型；利用其与每组样本运动数据、战术控制距离边界的最大初始搜索范围通过敌方导弹与载机运动仿真得到对应的战术控制距离值继而构建样本数据库；基于稀疏自编码网络构建初始实时解算模型并利用样本数据库进行网络训练得到目标实时解算模型。将各组待测运动数据输入目标实时解算模型得到对应的战术控制距离值继而能得到战术控制距离边界。本发明首次提出战术控制距离概念并通过量化模型为空战决策提供理论指导，解算精度高，实时性强。

Description

一种空战模拟环境中的战术控制距离实时解算方法

技术领域

本发明属于计算机仿真和人工智能技术领域，具体涉及一种空战模拟环境中的战术控制距离实时解算方法。

背景技术

空战对抗游戏和空战模拟系统都是借助于计算机仿真手段对战斗机的整个作战过程进行细致、逼真的模拟。为了有效提高用户体验的真实性以及对抗游戏和模拟系统的易操控性，需要从实际空战角度仿真设计对抗游戏和模拟系统，更为重要的是战术模拟及其便捷性交互设计，从而在还原空战真实度的同时，提高用户在对抗游戏和模拟系统中的操控水平。

在空战对抗游戏和空战模拟系统中，战斗机所处的空战环境一般分为两种：超视距空战与近距空战。相比于近距空战，超视距空战从迎头态势开始且距离较远，其攻击占位的角度条件相对容易满足，更加注重距离层面的博弈与对抗。

因此，如何分析空战对抗模拟中对抗双方的距离位置数据，为空战对抗模拟系统设计战术决策的参考量化信息一直是空战仿真领域的重点研究问题之一，目前相关的理论模型主要有空空导弹攻击区与动态逃逸区。

空空导弹攻击区从进攻的层面进行分析，研究成果主要有协同攻击区、三维攻击区以及全向攻击区等。此类方法基于空空导弹的动力学方程与制导律的数学模型，结合载机三自由度或六自由度模型，对攻击区的边界进行快速搜索。攻击区计算方法主要有实时模拟法、查表插值法、多项式拟合法与神经网络拟合法等。

动态逃逸区从防御的角度分析空战典型事件触发时敌我距离的量化指标是飞行员进行逃逸机动决策的重要支持信息。该类方法基于微分对策理论与简化几何模型，设计了规避机动时机的快速求解方法，并以此作为划分激进冒险战术与理性保守战术的依据，从而为超视距空战战术控制与智能决策提供理论依据。

超视距空战是进攻与防御高度协同、耦合的过程，而现有的研究工作中，攻击区与逃逸区仅从进攻或者防御的单一角度分析空战的战术距离，难以全面反映作战双方的态势变化，也无法准确给出超视距空战进攻与防御之间的转换时机，严重影响了空战对抗模拟系统的演练质量。同时，现有攻击区计算方法还存在诸多问题，比如实时模拟法虽然解算精度较高，但是其低时效性难以满足高动态空战环境的需求；查表插值法虽然仿真时效性有所改善，但是解算结果误差较大，无法满足空战精度要求；多项式拟合法需要人工设计关系式，当输入维度增加时，输入与输出之间的依赖关系很难通过直观观察设计出来，使此类方法的应用场景和拟合性能受到了极大的限制；神经网络拟合法虽然在计算准确度上有所提高，但需要大量的有标签数据样本进行训练，而且容易出现“过拟合”与“梯度弥散”现象，极大限制了在高保真空战模拟环境中的应用。

发明内容

本发明实施例的目的在于提供一种空战模拟环境中的战术控制距离实时解算方法，以实现针对高保真空战模拟环境中的超视距空战模拟，提高战术控制距离解算的精度和实时性的目的。具体技术方案如下：

第一方面，本发明实施例提供了一种空战模拟环境中的战术控制距离解算模型训练方法，所述方法包括：

通过构建超视距空战中载机和空空导弹的三维运动模型及其约束模型，以及设置仿真限制条件，得到战术控制距离的离线解算模型；

针对获取到的每组样本运动数据，利用该组样本运动数据、预设的战术控制距离边界的最大初始搜索范围以及所述离线解算模型，通过进行敌方导弹与载机的运动仿真，得到该组样本运动数据对应的战术控制距离值；其中，各组样本运动数据表征载机和敌机的运动状态，包括载机的速度、载机的高度、敌机的速度、敌机的高度、目标进入角、目标方位角和载机机动过载；

将每组样本运动数据与对应的战术控制距离值合并作为一个样本数据组，基于所有样本数据组得到样本数据库；

基于稀疏自编码网络构建战术控制距离的初始实时解算模型，并利用所述样本数据库对所述初始实时解算模型进行网络训练，得到训练完成的目标实时解算模型，以用于对输入的任一组待测运动数据，输出对应的战术控制距离值。

在本发明的一个实施例中，所述三维运动模型及其约束模型，包括：

载机的三自由度运动模型、导弹的三自由度运动模型、导弹-载机的相对运动模型与导引律模型。

在本发明的一个实施例中，所述仿真限制条件，包括：

当弹目距离小于导弹最大毁伤半径且不触发时间限制条件和速度限制条件时，判定导弹成功命中目标，否则判定导弹攻击失败；

所述时间限制条件为：当导弹飞行时间大于导弹可控飞行时间时，导弹能源耗尽无法命中目标；

所述速度限制条件为：当导弹速度小于导弹最小飞行速度时，导弹机动性能下降无法命中目标。

在本发明的一个实施例中，所述利用该组样本运动数据、预设的战术控制距离边界的最大初始搜索范围以及所述离线解算模型，通过进行敌方导弹与载机的运动仿真，得到该组样本运动数据对应的战术控制距离值，包括：

针对当前次迭代使用的战术控制距离边界的搜索范围，计算其二分法分割点；其中，首次迭代使用的战术控制距离边界的搜索范围为所述战术控制距离边界的最大初始搜索范围；

将所述当前次迭代对应的二分法分割点和该组样本运动数据输入所述离线解算模型，输出一个脱靶量数值；

判断该脱靶量数值是否表明载机未被导弹击中，并基于该脱靶量数值是否表明载机未被导弹击中的不同判断结果，对所述当前次迭代使用的战术控制距离边界的搜索范围进行相应缩小；

判断缩小后的战术控制距离边界的搜索范围是否满足预设的误差要求；

如果否，将所述缩小后的战术控制距离边界的搜索范围作为下一次迭代使用的战术控制距离边界的搜索范围，并返回所述针对当前次迭代使用的战术控制距离边界的搜索范围，计算其二分法分割点的步骤；

如果是，计算所述缩小后的战术控制距离边界的搜索范围的二分法分割点，并作为该组样本运动数据对应的战术控制距离值。

在本发明的一个实施例中，所述基于该脱靶量数值是否表明载机未被导弹击中的不同判断结果，对所述当前次迭代使用的战术控制距离边界的搜索范围进行相应缩小，包括：

如果该脱靶量数值表明载机被导弹击中，将所述当前次迭代使用的战术控制距离边界的搜索范围中的下限值替换为所述当前次迭代对应的二分法分割点；

如果该脱靶量数值表明载机未被导弹击中，判断是否满足所述时间限制条件和所述速度限制条件中的至少一个；

如果不满足，返回所述将所述当前次迭代对应的二分法分割点和该组样本运动数据输入所述离线解算模型的步骤以原输入数据重新仿真；

如果满足，将所述当前次迭代使用的战术控制距离边界的搜索范围中的上限值替换为所述当前次迭代对应的二分法分割点。

在本发明的一个实施例中，所述判断缩小后的战术控制距离边界的搜索范围是否满足预设的误差要求，包括：

判断所述缩小后的战术控制距离边界的搜索范围是否满足其上下限差值的绝对值小于预设的边界精度常值。

在本发明的一个实施例中，所述初始实时解算模型的结构包括：

一个输入层、四个稀疏自编码网络和一个输出层；其中，每个稀疏自编码网络仅含有一个隐含层；

其中，所述输入层的节点数为7；所述四个稀疏自编码网络的隐含层的节点数分别为14、16、10和8；所述输出层的节点数为1；所述四个稀疏自编码网络的隐含层的节点数是通过网络性能影响评价寻优后确定的。

在本发明的一个实施例中，所述利用所述样本数据库对所述初始实时解算模型进行网络训练，得到训练完成的目标实时解算模型，包括：

对所述初始实时解算模型中每个稀疏自编码网络单独进行预训练，得到对应预训练后的网络权值；其中，第一个稀疏自编码网络利用所述样本数据库进行预训练；从第二个稀疏自编码网络开始，预训练时的输入为前一稀疏自编码网络在预训练后隐含层各神经元的激励；

叠加预训练完成的所有稀疏自编码网络，并加入所述输入层和所述输出层后，对整体网络结构利用所述样本数据库进行网络权值的全局调优，得到训练完成的目标实时解算模型。

第二方面，本发明实施例提供了一种空战模拟环境中的战术控制距离实时解算方法，所述方法包括：

针对已获取的空战模拟环境中的任一组待测运动数据，将该组待测运动数据输入预先训练完成的目标实时解算模型，得到该组待测运动数据对应的战术控制距离值；其中，任一组待测运动数据表征载机和敌机的运动状态，包括载机的速度、载机的高度、敌机的速度、敌机的高度、目标进入角、目标方位角和载机机动过载；所述目标实时解算模型根据第一方面所述的空战模拟环境中的战术控制距离解算模型训练方法训练得到。

在本发明的一个实施例中，针对任一组待测运动数据，得到对应的战术控制距离值之后，所述方法还包括：

将同一空战模拟环境下且态势连续的各组待测运动数据所得到的战术控制距离值依次连接，得到战术控制距离边界；其中，所述同一空战模拟环境下且态势连续的各组待测运动数据中仅目标进入角不同，且各目标进入角以预设步长变化。

本发明的有益效果：

1)本发明实施例针对超视距空战模拟对抗环境中决策信息支撑问题提出了战术控制距离(TCR)概念，并提出了一种战术控制距离量化表征方法，所提供的空战模拟环境中的战术控制距离解算模型训练方法中，首先建立了战术控制距离的离线解算模型，离线解算模型由于充分结合了超视距空战中载机和空空导弹的三维运动模型及其约束模型，并加以仿真限制条件，因而能够提供准确度较高的敌方导弹与载机的运动仿真环境，为各组样本运动数据仿真出较为准确的TCR数值；接下来在离线解算模型基础上构建了样本数据库，为实时解算模型提供准确性较高且空战模拟环境的真实匹配度较高的训练样本。然后针对样本数据库中数据的特点，设计了一种基于稀疏自编码网络的初始实时解算模型，其在传统自编码网络的基础上加入了稀疏性限制，能够有效提升网络特征学习能力，提高训练效果；并采用“预训练+全局微调”的策略对初始实时解算模型进行网络训练，使得训练完成的目标实时解算模型的仿真结果能够满足计算精度与时效性要求，在用于对TCR进行拟合解算时的准确度和实时性较高。

2)本发明实施例所提供的空战模拟环境中的战术控制距离实时解算方法基于稀疏自编码网络构建的目标实时解算模型对TCR实时解算实现，目标实时解算模型采用了本发明实施例提出的空战模拟环境中的战术控制距离解算模型训练方法得到，因此仿真结果能够满足计算精度与时效性要求。因此，在进行战术控制距离的实时解算时，将已获取的空战模拟环境中的任一组待测运动数据输入预先训练完成的该目标实时解算模型后，由于该目标实时解算模型引入了稀疏自编码网络对TCR进行拟合解算，通过稀疏自编码网络提取样本初级特征，获取表征样本库非线性规律的高维特征量，建立深度网络模型对高维特征量进行拟合，能够快速得到对应态势下TCR的准确值。本发明实施例充分考虑了战斗机在超视距空战模拟环境中兼顾自身安全性和任务完成度的决策需求，基于空战过程分析建立了战术控制距离(TCR)理论模型。设计了基于稀疏自编码网络的TCR实时解算方法。该方法充分挖掘了数据样本的潜在规律，克服了深度神经网络的梯度弥散问题，有效提高了拟合求解精度与解算时效性。现有研究工作仅单一从进攻或者防御的角度去分析空战战术，难以全面反映作战双方的态势变化。而本发明实施例基于空战模拟中常用的机动控制模型，建立了战术控制距离的理论模型，并设计了相应的量化表征方法，首次通过量化模型为空战决策提供理论指导，提供了一种空战模拟环境中基于稀疏自编码网络的战术控制距离实时解算方法，本发明实施例的空战模拟环境中的战术控制距离实时解算方法，充分考虑了高动态、强实时以及不确定的空战模拟系统特点，以及进攻与防御，综合平衡冒险抵近与保守转出这对决策冲突，能够有效弥补超视距空战模拟对抗中态势信息感知的漏洞，更好地指导用户(飞行员)进行实时决策选择，从而能够提高战斗机在空战对抗模拟系统中的作战效能，具有较强的工程实用性与有效性。

附图说明

图1为发明实施例中战术控制距离的理解示意图；

图2为本发明实施例所提供的一种空战模拟环境中的战术控制距离解算模型训练方法的流程示意图；

图3为本发明实施例中针对一组样本运动数据的战术控制距离的搜索流程示意图；

图4为本发明实施例中的稀疏自编码网络的抽象表示图；

图5为本发明实施例中稀疏自编码网络的初步结构图；

图6为本发明实施例中稀疏自编码网络训练过程的示意图；

图7为本发明实施例所提供的空战模拟环境中的战术控制距离解算模型训练方法的算法结构示意图；

图8为本发明实施例所提供的一种空战模拟环境中的战术控制距离实时解算方法的流程理解示意图；

图9为本发明实施例所提供的另一种空战模拟环境中的战术控制距离实时解算方法的流程理解示意图；

图10为本发明实施例中战术控制距离实时解算仿真结果图；

图11为本发明实施例中战术控制距离实时解算与离线解算仿真结果对比图；

图12为本发明实施例中战术控制距离实时解算与离线解算时效性对比图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为了便于理解本发明实施例与现有技术的区别以及相应的贡献，以下对本发明实施例提出的战术控制距离进行简介，并在此基础上对发明构思予以简述。具体的：

鉴于现有技术中，空战对抗模拟系统对战术决策的参考量化信息的设计缺陷，本发明实施例首次提出战术控制距离(Tactical Control Distance,TCR)作为一种参考量化信息。战术控制距离围绕空战距离展开，多个战术控制距离值依次连接构成战术控制距离边界，代表一个空间区域的边界。

为了便于理解本发明实施例中的战术控制距离，以下结合图1对其进行简单说明。图1为发明实施例中战术控制距离的理解示意图。如图1所示，战术控制距离边界是一个空间区域的边界，其由各个战术控制距离值拟合为曲线得到。图1中深色飞机代表我方飞机(我机)，浅色飞机代表敌方飞机(敌机)。如果我机保持在该战术控制距离边界之外，也就是图1中该曲线的右侧，则可认为我机相对安全，即使敌机此时发射导弹，我机也可以通过一定的机动方式规避敌方导弹；如果我机在该战术控制距离边界之内，也就是图1中该曲线的左侧，敌机发射的导弹将以较大的几率命中我机。因此，解算出各个战术控制距离值，进而拟合出战术控制距离边界，对准确判断空战态势，及时调整攻防战术策略具有重大指导意义。

可见，本发明实施例提出的战术控制距离，可以作为空战模拟对抗中重要的机动准则之一，利用该战术控制距离，用户可以根据其指示信息准确判断空战态势，及时调整攻防战术策略，指导战斗机选择恰当的方式与时机进行攻防转换，是指导战术行为的核心信息。因此，战术控制距离的解算精度对辅助用户准确把握空战进程起着决定性的作用，会直接影响空战仿真环境中超视距空战的作战效能。可见，如何设计高精度、高时效性的战术控制距离计算方法，对于提高空战对抗模拟系统的逼真度、可信度以及用户操控水平具有重要意义。而本发明实施例的主要发明目的正在于此。

需要说明的是，在公开的研究模型中，本发明实施例是首次提出战术控制距离这一概念的，也是第一个通过量化模型为空战决策提供理论指导的方法。现有的研究工作仅单一从进攻或者防御的角度去分析空战战术，难以全面反映作战双方的态势变化。本发明实施例提出战术控制距离并进行量化模型表示，能够充分考虑进攻与防御，综合平衡冒险抵近与保守转出这对决策冲突，因而能够更好地指导用户(飞行员)进行实时决策选择。

综上，为了实现针对高保真空战模拟环境中的超视距空战模拟，提高战术控制距离解算的精度和实时性的目的，本发明实施例提供了一种空战模拟环境中的战术控制距离解算模型训练方法和一种空战模拟环境中的战术控制距离实时解算方法。第一方面，本发明实施例提供了一种空战模拟环境中的战术控制距离解算模型训练方法，如图2所示，可以包括如下步骤：

S1，通过构建超视距空战中载机和空空导弹的三维运动模型及其约束模型，以及设置仿真限制条件，得到战术控制距离的离线解算模型。

本发明实施例的离线解算模型，是利用三维运动模型及其约束模型以及设置完成的仿真限制条件，搭建的一个仿真环境，用于计算战术控制距离。

其中，三维运动模型及其约束模型，包括：

具体的：

1)载机的三自由度运动模型如下：

其中，t表示飞行时间，也表示仿真时间；(x,y,z)分别表示载机的三个坐标分量；

分别表示载机速度、航迹倾角和航迹偏角；(n_x,n_y,n_z)分别表示载机的三个过载分量；g表示重力加速度，数值为9.8m/s²。

在战术控制距离的解算过程中，假设载机首先在水平面内采取置尾机动转弯至背离敌机的方向，之后保持速度不变快速脱离战场。置尾机动的过载控制模型为：n_x＝0,n_y＝1,n_z＝N_zmax，其中N_zmax为载机最大横向过载，其正负符号取决于转弯角度较小的方向。

2)导弹的三自由度运动模型如下：

其中，t表示飞行时间，也表示仿真时间；(x_m,y_m,z_m)分别表示导弹的三个坐标分量；

分别表示导弹速度、弹道倾角和弹道偏角；T_m、D_m表分别示导弹所受的推力与阻力，t≥t_push时T_m＝T_mmax，t<t_push时T_m＝0；t_push表示导弹推力作用时间,T_mmax表示导弹最大推力；m_m表示导弹质量；(n_my,n_mz)分别表示导弹的两个法向过载分量。

3)导弹-载机的相对运动模型与导引律模型

式3)中，前两个公式表示导弹-载机的相对运动模型，或者称之为导弹-载机的过载约束模型，最后一个公式表示导引律模型；其中r表示弹目距离；q表示目标视线角；σ表示导弹弹道角；

和

分别表示对r、q和σ求导；v表示载机速度；v_m表示导弹速度；η和η_m分别表示目标和导弹速度矢量前置角；k为比例导引系数。

本发明实施例中，仿真限制条件，包括：

①当弹目距离r小于导弹最大毁伤半径r_max且不触发时间限制条件和速度限制条件时，判定导弹成功命中目标，否则判定导弹攻击失败；

②时间限制条件为：当导弹飞行时间t大于导弹可控飞行时间t_max时，导弹能源耗尽无法命中目标；

③速度限制条件为：当导弹速度v_m小于导弹最小飞行速度v_min时，导弹机动性能下降无法命中目标。

本发明实施例中，根据载机和导弹的三自由度模型、导弹-载机的相对运动模型与导引律模型，以及仿真限制条件可以搭建出离线解算模型，本领域技术人员可以理解的是，离线解算模型作为一个战术控制距离的离线解算的仿真环境，仿真需要用到载机、导弹以及空战模拟环境的参数，因此在离线解算模型使用之前需要进行仿真参数设定，具体可以包括：载机最大横向过载N_zmax、导弹可控飞行时间t_max、导弹推力作用时间t_push、导弹最小飞行速度v_min、导弹最大毁伤半径r_max、导弹质量m_m、导弹最大推力T_mmax和比例导引系数k等。仿真参数设定具体请见表1所示。

表1仿真参数设定表

本发明实施例搭建离线解算模型目的是给出战术控制距离的数值计算方法，以在后续以此为基础构建作为实时解算模型训练样本的样本数据库。

S2，针对获取到的每组样本运动数据，利用该组样本运动数据、预设的战术控制距离边界的最大初始搜索范围以及离线解算模型，通过进行敌方导弹与载机的运动仿真，得到该组样本运动数据对应的战术控制距离值。

其中，各组样本运动数据表征载机和敌机的运动状态，包括载机的速度、载机的高度、敌机的速度、敌机的高度、目标进入角、目标方位角和载机机动过载。一组样本运动数据中的各个参数可以分别以v,h,v_t,h_t,q_m,q_f,n_f表示。

本发明实施例可以预先获取多组样本运动数据，其过程可以是：

A，针对载机的速度、载机的高度、敌机的速度、敌机的高度、目标进入角、目标方位角和载机机动过载中的每个参数，预先设置对应的参数搜索范围以及搜索步长。

其中，针对上述七个参数，载机的速度和敌机的速度对应的参数搜索范围可以相同，比如可以为150～450m/s，或者100～500m/s等。载机的高度和敌机的高度对应的参数搜索范围可以相同，比如可以为2000～20000米，或者1500～15000米等。目标进入角对应的参数搜索范围可以为-90°～90°等。目标方位角对应的参数搜索范围可以为-45°～45°等。载机机动过载对应的参数搜索范围可以为0～9g等，其单位以重力加速度表示。

载机的速度和敌机的速度对应的搜索步长可以相同，比如可以为50m/s，或者100m/s等。载机的高度和敌机的高度对应的搜索步长可以相同，比如可以为500米，或者1000米等。目标进入角对应的搜索步长可以为5°、10°等。目标方位角对应的搜索步长也可以为5°、10°等。载机机动过载对应的搜索步长可以为1g等。

可以理解的是，上述7个参数对应的参数搜索范围是根据实测数据得到的经验值，搜索步长可以根据仿真精度以及样本运动数据的组数量等要求进行合理设计。

B，针对每个参数，在该参数对应的参数搜索范围以自身的搜索步长进行多次搜索，得到各次搜索下该参数的搜索值。

比如，若目标进入角的搜索步长为10°，以该搜索步长在目标进入角对应的搜索范围[-90°，+90°]内进行各次搜索得到的搜索值依次为-90°、-80°、-70°，…，0°，10°，…，70°，80°，90°。

C，利用所有次搜索得到的各参数的搜索值，组合成多组样本运动数据。

这些样本运动数据可以表征载机、敌机的运动状态。其中，每组样本运动数据含有七个参数的搜索值。

具体的，可以将各次搜索下得到的所有参数的搜索值随机组合，得到多组样本运动数据。其中，各次搜索下得到的一参数的搜索值可以在多组样本运动数据中重复使用。

或者，也可以依据一定的顺序将各次搜索下得到的所有参数的搜索值进行组合，得到多组样本运动数据。比如将同一搜索次序中各参数的搜索值构成一组样本运动数据等，这都是合理的。

并且，本发明实施例针对战术控制距离边界，预设有一个最大初始搜索范围，后续将在该范围内进行迭代搜索，得到每组样本运动数据对应的战术控制距离。具体的，战术控制距离边界的最大初始搜索范围可以为[0km，200km]等。

以下，以多组样本运动数据中任一组样本运动数据为例，说明如何利用该组样本运动数据、预设的战术控制距离边界的最大初始搜索范围以及离线解算模型，得到该组样本运动数据对应的战术控制距离值。

可选的一种实施方式中，利用该组样本运动数据、预设的战术控制距离边界的最大初始搜索范围以及离线解算模型，通过进行敌方导弹与载机的运动仿真，得到该组样本运动数据对应的战术控制距离值，包括以下步骤：

a1，针对当前次迭代使用的战术控制距离边界的搜索范围，计算其二分法分割点。

本发明实施例中，每次迭代利用对应的战术控制距离边界的搜索范围实现，当战术控制距离边界的搜索范围发生变化，迭代序号也随之变化。

为了便于理解，以i表示迭代序号，其中i为大于0的自然数。针对当前次迭代为第i次迭代，当前次迭代使用的战术控制距离边界的搜索范围可以表示为[R_n,i,R_f,i]。

其中，首次迭代使用的战术控制距离边界的搜索范围为战术控制距离边界的最大初始搜索范围；也就是说，针对i＝1，[R_n,1,R_f,1]中R_n,1＝0km；R_f,1＝200km。

当前次迭代使用的战术控制距离边界的搜索范围计算得到的二分法分割点可以用R_g,i表示，为了简化，将其称为当前次迭代对应的二分法分割点，其中，R_g,i的计算公式如下：

a2，将当前次迭代对应的二分法分割点和该组样本运动数据输入离线解算模型，输出一个脱靶量数值。

具体的，将R_g,i和该组样本运动数据(v,h,v_t,h_t,q_m,q_f,n_f)输入离线解算模型，进行敌方导弹与载机的运动仿真，其中，离线解算模型之前已经完成仿真参数设定，且仿真过程中受仿真限制条件的约束。仿真过程结束后，会输出一个脱靶量数值。

a3，判断该脱靶量数值是否表明载机未被导弹击中，并基于该脱靶量数值是否表明载机未被导弹击中的不同判断结果，对当前次迭代使用的战术控制距离边界的搜索范围进行相应缩小。

其中，判断脱靶量数值是否表明载机未被导弹击中的方式可以是：

脱靶量数值为第一预设值，表明载机未被导弹击中；脱靶量数值为第二预设值，表明载机被导弹击中；

比如第一预设值和第二预设值可以分别为0和1等，当然也可以用其余数字来区分表示载机是否未被导弹击中。

本发明实施例中，载机被导弹击中或者载机未被导弹击中最终均会对当前次迭代使用的战术控制距离边界的搜索范围进行缩小，但两者的缩小方式并不相同，可以理解的是，本发明实施例正是通过在仿真迭代中不断缩小战术控制距离边界的搜索范围来搜索到该组样本运动数据对应的战术控制距离值的。

具体的，基于该脱靶量数值是否表明载机未被导弹击中的不同判断结果，对当前次迭代使用的战术控制距离边界的搜索范围进行相应缩小，包括：

b1，如果该脱靶量数值表明载机被导弹击中，将当前次迭代使用的战术控制距离边界的搜索范围中的下限值替换为当前次迭代对应的二分法分割点。

针对第i次迭代，如果仿真过程结束后，离线解算模型输出的脱靶量数值表明载机被导弹击中，则可以直接对当前次迭代使用的战术控制距离边界的搜索范围进行相应方式的缩小，该方式下所得到的缩小后的战术控制距离边界的搜索范围为[R_g,i,R_f,i]。

b2，如果该脱靶量数值表明载机未被导弹击中，判断是否满足时间限制条件和速度限制条件中的至少一个。

针对第i次迭代，如果仿真过程结束后离线解算模型输出的脱靶量数值表明载机未被导弹击中，需要进一步确定载机未被导弹击中的原因以确定是否能够直接对当前次迭代使用的战术控制距离边界的搜索范围进行相应方式的缩小。

此时，需要判断是否满足时间限制条件和速度限制条件中的至少一个，时间限制条件和速度限制条件为仿真限制条件中的内容，请结合前文理解，在此不做详细说明。

b3，如果不满足，返回将当前次迭代对应的二分法分割点和该组样本运动数据输入离线解算模型的步骤以原输入数据重新仿真。

如果不满足时间限制条件，也不满足速度限制条件，也就是说载机未被导弹击中的原因并非是由于导弹能源耗尽或者动性能下降这些导弹性能因素。那么此时有可能是由于一些数据延迟等原因导致，因此，需要利用原来的仿真输入数据重新仿真，再次输出脱靶量数值，判断再次输出脱靶量数值是否能够表明载机未被导弹击中，如果再次判断载机被导弹击中，则执行b1步骤；如果再次判断载机未被导弹击中，则执行b2步骤。

b4，如果满足，将当前次迭代使用的战术控制距离边界的搜索范围中的上限值替换为当前次迭代对应的二分法分割点。

如果满足时间限制条件，或者满足速度限制条件，也就是说载机未被导弹击中的原因是由于导弹能源耗尽或者动性能下降这些导弹性能因素，那么，此时无需再次仿真，可以直接对当前次迭代使用的战术控制距离边界的搜索范围进行相应方式的缩小，该方式下所得到的缩小后的战术控制距离边界的搜索范围为[R_n,i,R_g,i]。

通过上述步骤，从离线解算模型针对输入的当前次迭代对应的二分法分割点和该组样本运动数据，输出一个脱靶量数值后，无论该脱靶量数值对于载机未被导弹击中的判断结果是如何的，亦或者是否经过重新仿真，最后一定会得到一个缩小后的战术控制距离边界的搜索范围，为[R_g,i,R_f,i]或者[R_n,i,R_g,i]。

同时，还需要强调的是，在上述过程中，即使发生再次仿真，但由于使用了相同的战术控制距离边界的搜索范围作为仿真输入数据，则仍属于同一次迭代。

a4，判断缩小后的战术控制距离边界的搜索范围是否满足预设的误差要求。

无论缩小后的战术控制距离边界的搜索范围是[R_g,i,R_f,i]还是[R_n,i,R_g,i]，均需要进一步判断其是否满足预设的误差要求。

可选的一种实施方式中，判断缩小后的战术控制距离边界的搜索范围是否满足预设的误差要求，包括：

判断缩小后的战术控制距离边界的搜索范围是否满足其上下限差值的绝对值小于预设的边界精度常值。

也就是说，针对[R_g,i,R_f,i]，判断是否存在|R_g,i-R_f,i|<ε；针对[R_n,i,R_g,i]，判断是否存在|R_n,i-R_g,i|<ε。其中，ε表示预设的边界精度常值，其数值根据经验值确定，比如可以为500米、1000米等。

如果否，执行a5，将缩小后的战术控制距离边界的搜索范围作为下一次迭代使用的战术控制距离边界的搜索范围，并返回针对当前次迭代使用的战术控制距离边界的搜索范围，计算其二分法分割点的步骤。

如果缩小后的战术控制距离边界的搜索范围不满足预设的误差要求，则无法停止迭代，将缩小后的战术控制距离边界的搜索范围作为下一次迭代使用的战术控制距离边界的搜索范围，返回a1步骤继续迭代。

即，若是缩小后的战术控制距离边界的搜索范围为[R_g,i,R_f,i]，确定[R_n,i+1,R_f,i+1]＝[R_g,i,R_f,i]并返回a1步骤。

若是缩小后的战术控制距离边界的搜索范围为[R_n,i,R_g,i]，确定[R_n,i+1,R_f,i+1]＝[R_n,i,R_g,i]并返回a1步骤。

如果是，执行a6，计算缩小后的战术控制距离边界的搜索范围的二分法分割点，并作为该组样本运动数据对应的战术控制距离值。

如果缩小后的战术控制距离边界的搜索范围满足预设的误差要求，则停止迭代，按照公式(4)计算缩小后的战术控制距离边界的搜索范围的二分法分割点，并将计算得到的该二分法分割点确定为该组样本运动数据对应的战术控制距离值。其中，战术控制距离值可以用D_TCR表示。

针对一组样本运动数据，得到对应的战术控制距离值的过程可以参见图3理解。图3为本发明实施例中针对一组样本运动数据的战术控制距离的搜索流程示意图。请结合前文描述进行理解，其中需要说明的是，针对当前次迭代，如果离线解算模型输出的脱靶量数值表明载机未被导弹击中，并判断时间限制条件和速度限制条件均不满足后，t＝t+dt表示增加一个仿真周期，利用原输入数据进行当前次迭代的再次仿真表示将当前次迭代对应的二分法分割点和该组样本运动数据再次输入离线解算模型进行仿真，但该再次仿真时迭代序号不变。

可以理解的是，通过S2步骤的TCR边界搜索，每组样本运动数据均可以得到对应的战术控制距离值。

S3，将每组样本运动数据与对应的战术控制距离值合并作为一个样本数据组，基于所有样本数据组得到样本数据库。

该步骤可以理解为数据整理和归一化过程。具体的，样本数据库可以为一个表格形式，其中每一行为一个样本数据组，由一组样本运动数据与对应的战术控制距离值组成。且样本数据库中各数据经过了归一化处理，以消除量纲对数据的影响。具体的归一化方法可以为最大最小归一化方法等，因此，可以理解的是，样本数据库中的数值范围均被映射到了[0,1]之间。

该样本数据库体现了样本运动数据与战术控制距离值的映射关系，具体的，战术控制距离可以表示为如下非线性函数关系：

D_TCR＝D(v,h,v_t,h_t,q_m,q_f,n_f) (5)

其中，v、h为载机的速度和高度；v_t、h_t为敌机的速度和高度；q_m为目标进入角；q_f为目标方位角；n_f为载机机动过载，D_TCR为战术控制距离的拟合值，D为输入参数(v,h,v_t,h_t,q_m,q_f,n_f)到输出的战术控制距离的映射关系。

并且，还可以依据一定的比例进一步将样本数据库划分为训练集和测试集以在后续使用，比如，从样本数据库中随机选取30％个样本数据组组成测试集，其余作为训练集，等等。

S4，基于稀疏自编码网络构建战术控制距离的初始实时解算模型，并利用样本数据库对初始实时解算模型进行网络训练，得到训练完成的目标实时解算模型，以用于对输入的任一组待测运动数据，输出对应的战术控制距离值。

本发明实施例的初始实时解算模型利用稀疏自编码网络(Sparse Auto Encoder，SAE)构建，实现了一种基于SAE的TCR拟合网络。其中稀疏自编码网络的抽象表示如图4所示。

可选的一种实施方式中，初始实时解算模型的结构包括：

其中，输入层的节点数为7；四个稀疏自编码网络的隐含层的节点数分别为14、16、10和8；输出层的节点数为1；四个稀疏自编码网络的隐含层的节点数是通过网络性能影响评价寻优后确定的。

具体的，本发明实施例在搭建一个输入层、四个SAE和一个输出层的网络结构后，可以对四个SAE的隐含层设置不同节点数，从而搭配输入层和输出层后得到多种结构的网络，然后对得到的各网络的性能进行评估，评估指标可以包括均方根误差RMSE、平均绝对百分比误差MAPE和平均绝对误差MAE等，然后选取性能最优的一个网络，将其结构确定为初始实时解算模型的结构。网络性能影响评价过程在此不做详细说明。

本领域技术人员已知的是，自编码网络(Auto Encoder，AE)是一种无监督学习的深度神经网络，可用于提取样本数据的高维特征。自编码网络的核心目的并非利用输出重构输入，而在于根据输入层到隐含层的映射关系，实现对原始数据内在特征的学习。由于本发明实施例的初始实时解算模型的输入层神经元个数为7个，数量较少，而所确定的SAE隐含层的节点数多于输入层节点数，利用传统自编码网络难以学习到样本的深层特征。因此针对这一问题，本发明实施例建立了稀疏自编码网络的模型。稀疏自编码网络在传统自编码网络的基础上加入了稀疏性限制，能够有效提升网络特征学习的范化能力，因此网络特征学习能力相比传统自编码网络更强，具体的，是在传统自编码网络的损失函数中加入了控制稀疏性的惩罚因子。

其中，传统自编码网络的损失函数表示为：

稀疏自编码网络的损失函数表示为：

其中，m表示输入层维度；h_w,b(x⁽ⁱ⁾)表示输入为x⁽ⁱ⁾时对应的网络输出；β表示控制稀疏性的权重因子；n表示隐含层神经元个数；

表示KL距离，用于表征两个函数之间的差异程度；ρ表示平均激活度的期望值；

表示第j个神经元的平均激活度。

可选的一种实施方式中，利用样本数据库对初始实时解算模型进行网络训练，得到训练完成的目标实时解算模型，包括以下步骤：

c1，对初始实时解算模型中每个稀疏自编码网络单独进行预训练，得到对应预训练后的网络权值。

具体的，该步骤为网络预训练过程，需要对每一个SAE单独进行训练，得到对应最优的网络参数。其中，第n个SAE的隐含层表示为L_n。SAE预训练的过程是无监督的，对于TCR样本数据来讲，仅需要利用输入矩阵进行训练。为了便于描述，将第n个SAE的输入矩阵记为X⁽ⁿ⁾，输出矩阵记为Y⁽ⁿ⁾。

具体的，给定第一个SAE的输入矩阵X⁽¹⁾和输出矩阵Y⁽¹⁾＝X⁽¹⁾，随机初始化网络参数值，对第一个SAE进行训练，通过加入了KL距离的损失函数J_SAE(W,b)通过误差的反向传导算法更新网络的权值，直至输出Y满足收敛误差或训练达到最大仿真步长，记录下输入层到隐含层L₁的权值W₁，完成第一个SAE的训练。其中，第一个稀疏自编码网络利用样本数据库进行预训练；具体的，第一个SAE预训练的输入矩阵X⁽¹⁾由样本数据库中所有组样本运动数据合并构成。

从第二个稀疏自编码网络开始，预训练时的输入为前一稀疏自编码网络在预训练后隐含层各神经元的激励。具体的，以隐含层L₁的各神经元的激励作为第二个SAE的输入矩阵，即X⁽²⁾＝(h(x₁),h(x₂),...,h(x_L1))^T，输出矩阵Y⁽²⁾＝X⁽²⁾＝(h(x₁),h(x₂),...,h(x_L1))^T。同第一个SAE的训练过程类似，第二个SAE将第一个SAE的隐含层L₁的激励作为输入进行训练，在输出层重构出该激励，直至满足收敛误差或达到最大仿真步长，然后记录输入层到隐含层L₂的权值W₂，完成第二个SAE的训练。

然后以第二个SAE的隐含层L₂的各神经元的激励作为第三个SAE的输入矩阵，依据上述方式继续完成第三个SAE的训练…，直至完成所有隐含层L₁,L₂,...,L_n的预训练过程，得到预训练后的网络权值W₁,W₂,...,W_n，即完成初始实时解算模型的预训练工作。

c2，叠加预训练完成的所有稀疏自编码网络，并加入输入层和输出层后，对整体网络结构利用样本数据库进行网络权值的全局调优，得到训练完成的目标实时解算模型。

c1步骤的预训练只是将每个隐含层的参数进行单独优化，所得到的隐含层的网络参数只是局部最优。将预训练后的网络权重作为神经网络参数的初始值，由于经过了预训练，网络整体的初始权值W会处在一个相对较优的位置，接下来在c2步骤中，需要加入输入层和输出层，利用有标签数据从全局微调整个网络，因此c2步骤可以理解为网络全局调优过程。

其中，叠加预训练完成的所有隐含层，最终堆叠得到的深度网络模型的初步结构如图5所示。图5为本发明实施例中稀疏自编码网络的初步结构图，可以理解的是，该图中仅含有叠加预训练完成的所有隐含层，并不含有输入层和输出层。

具体的，网络全局调优是一个有监督学习过程，输入矩阵由样本数据库中所有组样本运动数据合并构成，输出矩阵由样本数据库中所有战术控制距离值合并构成，通过损失函数J_SAE(W,b)代入到误差反向传播算法中对整个深度网络的权值进行全局调优，直至满足误差收敛条件或达到最大仿真步长，记录下所有训练好的网络参数，即完成稀疏自编码网络的整体训练。稀疏自编码网络的训练过程如图6所示。其中，SAE单元表示各稀疏自编码网络；decoder表示解码器；encoder表示编码器。

可以理解的是，对初始实时解算模型进行网络训练结束后，可以得到训练完成的目标实时解算模型。

在实际使用过程中，将任一组待测运动数据(v,h,v_t,h_t,q_m,q_f,n_f)输入目标实时解算模型，能够输出对应的战术控制距离值D_TCR。

更进一步的，可以利用满足要求的多组待测运动数据，得到多个战术控制距离值从而得到战术控制距离边界，该战术控制距离边界为各战术控制距离值连接的曲线。该具体过程在后文中予以说明。

关于本发明实施例所提供的空战模拟环境中的战术控制距离解算模型训练方法的处理过程，请结合前文和图7理解，图7为本发明实施例所提供的空战模拟环境中的战术控制距离解算模型训练方法的算法结构示意图。本发明实施例的空战模拟环境中的战术控制距离解算模型训练方法的处理过程主要分为以下两个部分：①TCR离线解算数学模型(离线解算模型)；②基于稀疏自编码网络的TCR精确拟合网络(实时解算模型)。其中，“初始化仿真参数及条件”对应S1步骤中在使用离线解算模型这个仿真环境之前，需要进行的仿真参数设定；“搭建仿真环境”对应S1步骤中根据载机和导弹的三自由度模型、导弹-载机的相对运动模型与导引律模型，以及仿真限制条件搭建离线解算模型；“TCR边界搜索”对应S2步骤；“数据预处理”对应S3步骤；“TCR样本数据库”即为S3步骤得到的样本数据库；“实时解算模型”表示初始实时解算模型到得到训练完成的目标实时解算模型的过程；其中“构建网络模型”对应S4步骤中基于稀疏自编码网络构建战术控制距离的初始实时解算模型；“网络深度设定”是指对初始实时解算模型中SAE各隐含层不同节点数对网络性能影响评价后确定各隐含层最佳节点数的过程；“稀疏性限制”是SAE中的损失函数中加入了控制稀疏性的惩罚因子；“网络参数训练”表示对初始实时解算模型进行网络训练，“预训练”和“全局调优”分别对应c1步骤和c2步骤。具体内容请见前文相关描述，在此不做重复说明。

本发明实施例针对超视距空战模拟对抗环境中决策信息支撑问题提出了战术控制距离(TCR)概念，并提出了一种战术控制距离(TCR)量化表征方法，所提供的空战模拟环境中的战术控制距离解算模型训练方法中，首先建立了战术控制距离的离线解算模型，离线解算模型由于充分结合了超视距空战中载机和空空导弹的三维运动模型及其约束模型，并加以仿真限制条件，因而能够提供准确度较高的敌方导弹与载机的运动仿真环境，为各组样本运动数据仿真出较为准确的TCR数值；接下来在离线解算模型基础上构建了样本数据库，为实时解算模型提供准确性较高且空战模拟环境的真实匹配度较高的训练样本。然后针对样本数据库中数据的特点，设计了一种基于稀疏自编码网络的初始实时解算模型，其在传统自编码网络的基础上加入了稀疏性限制，能够有效提升网络特征学习能力，提高训练效果；并采用“预训练+全局微调”的策略对初始实时解算模型进行网络训练，使得训练完成的目标实时解算模型的仿真结果能够满足计算精度与时效性要求，在用于对TCR进行拟合解算时的准确度和实时性较高。

第二方面，在第一方面提供的空战模拟环境中的战术控制距离解算模型训练方法的基础上，本发明实施例还提供了一种空战模拟环境中的战术控制距离实时解算方法，参见图8理解，该方法包括：

针对已获取的空战模拟环境中的任一组待测运动数据，将该组待测运动数据输入预先训练完成的目标实时解算模型，得到该组待测运动数据对应的战术控制距离值。

其中，任一组待测运动数据表征载机和敌机的运动状态，包括载机的速度、载机的高度、敌机的速度、敌机的高度、目标进入角、目标方位角和载机机动过载；目标实时解算模型根据第一方面的空战模拟环境中的战术控制距离解算模型训练方法训练得到。

具体的，任一组待测运动数据表示可以为X＝(v,h,v_t,h_t,q_m,q,n_f)，将其输入根据第一方面提供的空战模拟环境中的战术控制距离解算模型训练方法训练得到的目标实时解算模型，可以输出该态势下超视距空战模拟仿真环境中的战术控制距离D_TCR。其中，一组待测运动数据对应一个态势，不同态势主要由目标进入角体现。其中，得到目标实时解算模型的过程请参见第一方面的内容，在此不做赘述。

可选的，针对任一组待测运动数据，得到对应的战术控制距离值之后，方法还包括：

将同一空战模拟环境下且态势连续的各组待测运动数据所得到的战术控制距离值依次连接，得到战术控制距离边界。具体流程请参见图9理解。

其中，同一空战模拟环境下且态势连续的各组待测运动数据中仅目标进入角不同，且各目标进入角以预设步长变化。

具体的，各组待测运动数据(v,h,v_t,h_t,q_m,q,n_f)中仅目标进入角q_m不同，且从第一组待测运动数据到最后一组待测运动数据，目标进入角以预设步长变化。预设步长比如可以为5°、10°或者20°度等，可以根据需要进行选择。

例如目标进入角的范围通常为[-90°，90°]，目标进入角以预设步长变化，那么其中离散出的每一个目标进入角则对应一个态势。将目标实时解算模型解算出的从-90°到+90°态势下的战术控制距离值D_TCR依次连接，即可得到战术控制距离边界。

本领域技术人员可以理解的是，针对空战模拟来说，得到单一一组待测运动数据对应的战术控制距离值仅仅是完成了一项基本需求，而获得战术控制距离边界更具实际意义，利用战术控制距离边界能够准确判断空战态势，及时调整攻防战术策略等。

战术控制距离是超视距空战对抗演练中关键的动态节点信息，是操纵用户在空战模拟对抗环境中执行相应战术的重要参考标准。本发明实施例所提供的空战模拟环境中的战术控制距离实时解算方法基于稀疏自编码网络构建的目标实时解算模型对TCR实时解算实现，目标实时解算模型采用了本发明实施例提出的空战模拟环境中的战术控制距离解算模型训练方法得到，该训练方法中离线解算模型由于充分结合了超视距空战中载机和空空导弹的三维运动模型及其约束模型，并加以仿真限制条件，因而能够提供准确度较高的敌方导弹与载机的运动仿真环境，为各组样本运动数据仿真出较为准确的TCR数值；接下来在离线解算模型基础上构建了样本数据库，为实时解算模型提供准确性较高且空战模拟环境的真实匹配度较高的训练样本。然后针对样本数据库中数据的特点，设计了一种基于稀疏自编码网络的初始实时解算模型，其在传统自编码网络的基础上加入了稀疏性限制，能够有效提升网络特征学习能力，提高训练效果；并采用“预训练+全局微调”的策略对初始实时解算模型进行网络训练，使得训练完成的目标实时解算模型的仿真结果能够满足计算精度与时效性要求，在用于对TCR进行拟合解算时的准确度和实时性较高。

因此，在进行战术控制距离的实时解算时，将已获取的空战模拟环境中的任一组待测运动数据输入预先训练完成的该目标实时解算模型后，由于该目标实时解算模型引入了稀疏自编码网络对TCR进行拟合解算，通过稀疏自编码网络提取样本初级特征，获取表征样本库非线性规律的高维特征量，建立深度网络模型对高维特征量进行拟合，能够快速得到对应态势下TCR的准确值。

本发明实施例充分考虑了战斗机在超视距空战模拟环境中兼顾自身安全性和任务完成度的决策需求，基于空战过程分析建立了战术控制距离(TCR)理论模型。设计了基于稀疏自编码网络的TCR实时解算方法。该方法充分挖掘了数据样本的潜在规律，克服了深度神经网络的梯度弥散问题，有效提高了拟合求解精度与解算时效性。

现有研究工作仅单一从进攻或者防御的角度去分析空战战术，难以全面反映作战双方的态势变化。而本发明实施例基于空战模拟中常用的机动控制模型，建立了战术控制距离的理论模型，并设计了相应的量化表征方法，首次通过量化模型为空战决策提供理论指导，提供了一种空战模拟环境中基于稀疏自编码网络的战术控制距离实时解算方法，本发明实施例的空战模拟环境中的战术控制距离实时解算方法，该方法充分考虑了高动态、强实时以及不确定的空战模拟系统特点，以及进攻与防御，综合平衡冒险抵近与保守转出这对决策冲突，能够有效弥补了超视距空战模拟对抗中态势信息感知的漏洞，更好地指导用户(飞行员)进行实时决策选择，从而能够提高战斗机在空战对抗模拟系统中的作战效能，具有较强的工程实用性与有效性。

为了验证本发明实施例所提出的空战模拟环境中的战术控制距离解算模型训练方法以及空战模拟环境中的战术控制距离实时解算方法的有效性，以下结合实验数据进行说明。

(一)生成样本数据库

根据表1的仿真参数设定，选取敌机、我机初始高度为7000m，仿真步长为0.01s，目标进入角的步长为10°，目标进入角从-90°搜索到+90°。利用离线解算模型的战术控制距离边界的仿真结果如附图10所示，图10为本发明实施例中战术控制距离实时解算仿真结果图。从图10可以看出，目标进入角为0°的迎头态势下的战术控制距离相对更大，我机在抵近敌机同时需要承担较大威胁；侧向接敌时战术控制距离有所缩短，目标进入角为90°时的侧向接敌与迎头接敌相比边界缩小了约23％。

基于上述离线解算模型的TCR离线求解方法，在如下条件下进行离线仿真：我机与敌方的高度范围为2000～20000m，我机与目标的速度范围为150～450m/s，目标方位角范围为-45°～45°，目标进入角范围为-90°～90°，载机机动过载范围为0～9g，其他仿真参数如表1所示。经仿真获得T＝1000条样本数据，随机抽取部分样本如表2所示。其中每一行为一个样本数据组，所有样本数据组进行归一化处理整合后可以构成样本数据库。

表2仿真样本数据表

(二)确定网络结构以及网络训练过程

为评估拟合效果，选取网络性能指标为平均相对误差MAPE、平均绝对误差MAE、平方根均方误差RMSE，其定义如下：

其中，TCR_k′，TCR_k分别为战术控制距离值的网络输出值与理论值，T为样本个数。

初始实时解算模型作为TCR拟合网络，输入层节点个数为7，输出层节点个数为1，网络的激活函数选用常用的sigmoid函数，稀疏性参数取0.05，学习率为0.01，最大训练次数为10000次，综合考虑网络性能与系统负担，本发明实施例采用四个SAE网络，SAE不同隐含层节点个数下整个网络训练的各项性能指标结果如表3所示。

表3不同网络结构对SAE网络性能的影响

其中，表3参数一列中6个数值分别表示输入层节点数、四个SAE网络的隐含层节点数以及输出层节点数。可见，输入层节点个数为7，输出层节点个数为1不变，是对中间四个SAE的隐含层节点数进行变化评估。

整体来看，网络结构为7-14-16-10-8-1时，方法收敛效率与求解精度明显提高，整体评价指标更加优越，最终选定网络结构为7-14-16-10-8-1。将分层训练好的网络作为一个整体进行全局调优，完成基于SAE的深度拟合网络的全部训练过程。为了更好地展现模型拟合性能，在测试集上对全局调优后的网络进行拟合性能测试，并统计网络各项性能指标，结果如表4所示。

表4基于SAE的实时解算模型性能指标统计

从表4可以看出，与仅预训练相比，全局调优后的网络误差大幅度下降，网络拟合性能显著提升，说明全局调优后的网络能更好地拟合TCR边界。

(三)离线仿真与实时解算性能对比

进一步考察SAE解算模型的拟合效果，以表1所示态势下TCR的解算为例，将目标实时解算模型对应的深度网络的拟合结果与离线解算模型的离线仿真结果进行对比，结果如图11所示，图11为本发明实施例中战术控制距离实时解算与离线解算仿真结果对比图。为了更加明显地突出仿真对比效果，离线仿真结果与拟合结果分别用实线与星号加以区分。图11中，实线与星号分别对应离线解算模型的TCR离线仿真结果与目标实时解算模型的TCR实时拟合仿真结果。从图11中可以看出，在目标进入角为0°的区域存在拟合结果不一致的情况，其原因是自变量取0°与360°时的拟合值并不完全相等。总体来说，基于SAE的深度拟合网络解算结果与离线仿真结果吻合度高，而且拟合TCR能够紧贴离线仿真值的变化趋势，较好地体现出TCR的边界特性，网络整体拟合效果优良。

为了分析模型解算的时效性，从测试集中随机选取100个样本进行测试，统计离线仿真与实时仿真时长如附图12所示。所有解算过程均在Windows 10系统、主频3.6GHz，内存3.96GB的计算机上进行。从图12中可以看出，实时解算一个数据样本的平均时间控制在12ms以内。由此可见，本发明实施例提出的战术控制距离实时解算方法求解速度快，能够满足时效性需求。综合图11与图12，基于SAE的TCR实时解算模型相较于离线仿真模型，在实现相近解算精度的基础上大幅提高了解算时效性，整体性能评价指标更优。

综上，本发明实施例将战术控制距离(TCR)用于空战模拟系统决策信息支撑，所提出的空战模拟环境中的战术控制距离解算模型训练方法以及空战模拟环境中的战术控制距离实时解算方法具有优良的态势表现形式，能够满足高动态、强实时仿真环境下对决策信息支持的需求，有效弥补了空战节点信息的缺失，对于提高战斗机在空战对抗游戏和空战模拟系统中的超视距空战效能具有重要的意义。

在本说明书的描述中，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种空战模拟环境中的战术控制距离解算模型训练方法，其特征在于，包括：

2.根据权利要求1所述的空战模拟环境中的战术控制距离解算模型训练方法，其特征在于，所述三维运动模型及其约束模型，包括：

3.根据权利要求1所述的空战模拟环境中的战术控制距离解算模型训练方法，其特征在于，所述仿真限制条件，包括：

4.根据权利要求3所述的空战模拟环境中的战术控制距离解算模型训练方法，其特征在于，所述利用该组样本运动数据、预设的战术控制距离边界的最大初始搜索范围以及所述离线解算模型，通过进行敌方导弹与载机的运动仿真，得到该组样本运动数据对应的战术控制距离值，包括：

5.根据权利要求4所述的空战模拟环境中的战术控制距离解算模型训练方法，其特征在于，所述基于该脱靶量数值是否表明载机未被导弹击中的不同判断结果，对所述当前次迭代使用的战术控制距离边界的搜索范围进行相应缩小，包括：

6.根据权利要求4或5所述的空战模拟环境中的战术控制距离解算模型训练方法，其特征在于，所述判断缩小后的战术控制距离边界的搜索范围是否满足预设的误差要求，包括：

7.根据权利要求1所述的空战模拟环境中的战术控制距离解算模型训练方法，其特征在于，所述初始实时解算模型的结构包括：

8.根据权利要求7所述的空战模拟环境中的战术控制距离解算模型训练方法，其特征在于，所述利用所述样本数据库对所述初始实时解算模型进行网络训练，得到训练完成的目标实时解算模型，包括：

9.一种空战模拟环境中的战术控制距离实时解算方法，其特征在于，包括：

针对已获取的空战模拟环境中的任一组待测运动数据，将该组待测运动数据输入预先训练完成的目标实时解算模型，得到该组待测运动数据对应的战术控制距离值；其中，任一组待测运动数据表征载机和敌机的运动状态，包括载机的速度、载机的高度、敌机的速度、敌机的高度、目标进入角、目标方位角和载机机动过载；所述目标实时解算模型根据权利要求1至8任一项所述的空战模拟环境中的战术控制距离解算模型训练方法训练得到。

10.根据权利要求9所述的空战模拟环境中的战术控制距离实时解算方法，其特征在于，针对任一组待测运动数据，得到对应的战术控制距离值之后，所述方法还包括：