CN108319132B

CN108319132B - 用于无人机空中对抗的决策系统及方法

Info

Publication number: CN108319132B
Application number: CN201810025736.2A
Authority: CN
Inventors: 胡笑旋; 郭君; 马华伟; 夏维; 罗贺; 张任驰
Original assignee: Hefei University of Technology
Current assignee: Hefei University of Technology
Priority date: 2018-01-11
Filing date: 2018-01-11
Publication date: 2021-01-26
Anticipated expiration: 2038-01-11
Also published as: CN108319132A

Abstract

本发明提供一种用于无人机空中对抗的决策系统及方法，属于无人机领域。决策方法包括：步骤S10：获取在预定时间段内蓝方无人机的第一状态和红方无人机的第二状态；步骤S20：采用LSTM网络根据第一状态预测蓝方无人机在未来预定时刻的第一预测状态；步骤S30：从与红方无人机相关联的机动动作库中选取机动动作；步骤S40：根据红方无人机的当前状态和选取的机动动作计算红方无人机在执行机动动作后的未来预定时刻的第二预测状态；步骤S50：根据第二预测状态与第一预测状态计算在未来预定时刻蓝方无人机对红方无人机的威胁系数；步骤S60：重复步骤S30至步骤S50直到计算出所述威胁系数；步骤S70：选取最小威胁系数；步骤S80：输出与最小威胁系数对应的机动动作。

Description

用于无人机空中对抗的决策系统及方法

技术领域

本发明涉及无人机领域，具体地涉及一种用于无人机空中对抗的决策系统及方法。

背景技术

对于空中对抗领域的无人机决策方法主要包括两种：一是基于当前态势进行决策的方法。在此类中，分为两种情形。一种是在完全信息下，依据当前态势进行决策的空战决策方法，例如完全信息静态博弈，微分对策，影响图等。一种是不完全信息下，例如使用模糊理论，区间灰数，区间数层次分析法等方法将对不完全信息下的威胁或者攻击效能进行评估继而做出决策的空战决策方法。二是基于未来态势或态势变化趋势的决策方法。依据当前态势对未来态势进行预测，可以更好的掌握战场态势的发展，该类方法通过对当前态势和未来态势的评估来进行决策。基于态势预测和推理进行决策现也有许多的方法，例如：①滚动时域，②动态贝叶斯网络，③模糊动态博弈，④证据网络等。

但是，这两种方法均存在缺陷。第一类方法中，建立在完全信息条件下的决策方法无法解决信息不完全下的机动决策问题。第一类方法中，无论是完全信息条件下还是不完全信息条件下，都是依据当前态势进行机动决策，在决策中也不考虑敌方机动，不能把握战场变化趋势和未来威胁态势变化，具有局限性。第二类方法中，虽然在决策过程中考虑战场变化趋势，试图对未来态势进行推断，但是依然具有局限性：①滚动时域控制中，选择合适的值函数非常关键。对于简单的最优控制问题，可从相对应的HJB偏微分方程求得，但此问题的HJB方程实际上难以求解，使用近似值函数。近似值函数中，需要构建战术优势值。在构建战术优势值的过程中，需要构建敌方运动状态方程，并且已知敌方加速度，不能适用敌方机动完全未知的条件。②贝叶斯网络是概率论与图论的有机结合，所以贝叶斯网络在解决不确定性问题方面有着天然的优势。近年来贝叶斯网络已经成为不确定性研究领域的一大热门，因此有方法采用贝叶斯模型，或者动态贝叶斯网络模型对战场不确定性信息进行预测与评估。但是贝叶斯模型需要一定的先验知识，制定先验概率和条件概率。③模糊动态博弈方法需要已知敌我双方的策略集。④证据网络方法需要结合知识库及专家的先验知识构建评价函数。由此可见，第二类方法也都无法解决在敌方机动策略完全未知的情况下基于战场态势预测和推理的决策问题，即在敌方机动完全未知，没有先验规则的情况上，以上的方法都无法适用。

发明内容

本发明的目的是提供一种用于无人机空中对抗的决策系统及方法，该决策系统及方法在无人机模拟对抗时能够根据蓝方无人机的状态判断并输出红方无人机的机动动作。

为了实现上述目的，本发明实施方式提供一种用于无人机空中对抗的决策方法，该决策方法可以包括：

步骤S10：获取在预定时间段内蓝方无人机的第一状态和红方无人机的第二状态；

步骤S20：采用长短期记忆(Long Short-Term Memory，LSTM)网络根据第一状态预测蓝方无人机在未来预定时刻的第一预测状态；

步骤S30：从与红方无人机相关联的机动动作库中选取未被使用的机动动作；

步骤S40：根据红方无人机的当前状态和选取的机动动作计算红方无人机在执行机动动作后的未来预定时刻的第二预测状态；

步骤S50：根据第二预测状态与第一预测状态计算在未来预定时刻蓝方无人机对红方无人机的威胁系数；

步骤S60：重复步骤S30至步骤S50直到计算出所述机动动作库中的所有机动动作对应的威胁系数；

步骤S70：从所有威胁系数中选取最小威胁系数；

步骤S80：输出与所述最小威胁系数对应的机动动作。

可选地，所述红方的第一状态和蓝方的第二状态可以包括：位置信息、速度、俯仰角和偏航角，所述预定时间段包括从过去的预定时刻至当前时刻的时间区间。

可选地，所述位置信息包括第一坐标值、第二坐标值和第三坐标值，所述采用LSTM网络根据所述第一状态预测所述蓝方无人机在未来预定时刻的第一预测状态包括：

采用六个独立且结构相同的所述LSTM网络分别对所述第一状态的第一坐标值、所述第一状态的第二坐标值和所述第一状态的第三坐标值、所述第一状态的速度、所述第一状态的俯仰角和所述第一状态的偏航角进行预测，以生成预测的第一状态的第一坐标值、预测的第一状态的第二坐标值、预测的第一状态的第三坐标值、预测的第一状态的第一预测速度、预测的第一状态的第一预测俯仰角和预测的第一状态的第一预测偏航角；

关联所述预测的第一状态的第一坐标值、预测的第一状态的第二坐标值、预测的第一状态的第三坐标值、预测的第一状态的第一预测速度、预测的第一状态的第一预测俯仰角和预测的第一状态的第一预测偏航角以生成所述第一预测状态。

可选地，LSTM网络的输入数据可以为一维时间序列数据，方向可以为单向，层数可以为2层；所述LSTM网络可以采用衰减的学习速率，所述学习速率的初始值可以为1.0，所述学习速率的衰减值可以为0.5，LSTM网络的细胞单元的数量可以为100个，激活函数可以为双曲正切函数，所述LSTM网络还可以包括：用于防止过度拟合的退出层，所述退出层的保留节点数为0.8，所述LSTM网络采用均方误差的计算方式计算误差，确定权重参数的迭代更新方式采用RMSprop算法。

本发明的另一方面还提供一种用于无人机空中对抗的决策系统，该决策系统可以包括：

雷达，设置在红方无人机上；

处理器，被配置成用于执行下列步骤：

步骤S10：通过所述雷达获取蓝方无人机在预定时间段内的第一状态，通过所述红方无人机接收所述红方无人机在预定时间段内的第二状态；

步骤S20：采用长短期记忆LSTM网络根据所述第一状态预测所述蓝方无人机在未来预定时刻的第一预测状态；

步骤S30：从与所述红方无人机相关联的机动动作库中选取未被使用的机动动作；

步骤S40：根据所述红方无人机的当前状态和选取的机动动作计算所述红方无人机在执行所述机动动作后的所述未来预定时刻的第二预测状态；

步骤S50：根据所述第二预测状态与所述第一预测状态计算在所述未来预定时刻所述蓝方无人机对所述红方无人机的威胁系数；

步骤S70：从所有威胁系数中选取最小威胁系数；

步骤S80：输出与所述最小威胁系数对应的机动动作。

可选地，所述位置信息包括第一坐标值、第二坐标值和第三坐标值，所述处理器进一步被配置成：

可选地，所述LSTM网络的输入数据可以为一维时间序列数据，方向可以为单向，层数可以为2层；所述LSTM网络可以采用衰减的学习速率，所述学习速率的初始值可以为1.0，所述学习速率的衰减值可以为0.5，所述LSTM网络的细胞单元的数量可以为100个，激活函数可以为双曲正切函数，所述LSTM网络还可以包括：用于防止过度拟合的退出层，所述退出层的保留节点数可以为0.8，所述LSTM网络可以采用均方误差的计算方式计算误差，确定权重参数的迭代更新方式可以采用RMSprop算法。

通过上述技术方案，本发明提供的用于无人机空中对抗的决策系统及方法能够通过LSTM网络根据蓝方无人机在过去一段时间的飞行状态预测蓝方无人机在未来时间的飞行状态，继而实现在无人机模拟对抗时判断并控制红方无人机的机动动作。

本发明实施方式的其它特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

附图是用来提供对本发明实施方式的进一步理解，并且构成说明书的一部分，与下面的具体实施方式一起用于解释本发明实施方式，但并不构成对本发明实施方式的限制。在附图中：

图1是根据本发明的一实施方式的用于无人机空中对抗的决策方法的流程图；

图2是根据本发明的一实施方式的用于无人机空中对抗的决策系统的结构框图。

具体实施方式

以下结合附图对本发明实施方式的具体实施方式进行详细说明。应当理解的是，此处所描述的具体实施方式仅用于说明和解释本发明实施方式，并不用于限制本发明实施方式。

如图1所示是根据本发明的一实施方式的用于无人机空中对抗的决策方法的流程图。在图1中，该决策方法可以包括以下步骤：

在步骤S10中，获取在预定时间段内蓝方无人机的第一状态和红方无人机的第二状态。在该实施方式中，该预定时间段可以包括从过去的一个预定时刻至当前时刻的时间区间，例如从两分钟前至当前时刻之间的时间区间。该第一状态可以包括位置信息、速度、俯仰角和偏航角。在本发明的一个示例中，该俯仰角可以是无人机对于水平面的上下偏角，该偏航角可以是无人机的速度方向相对于飞行方向的左右偏角。可选地，该位置信息可以包括：第一坐标值、第二坐标值和第三坐标值。所以，该第一状态可以包括第一状态的第一坐标值、第一状态的第二坐标值、第一状态的第三坐标值、第一状态的第一速度、第一状态的第一仰角和第一状态的第一偏航角。结合上述预定时间段，可以理解为该六个要素均可以为由预定时间段内每个时刻对应的各个要素单独组成的数据序列。例如对于第一状态的第一坐标值x，该数据序列可以为在过去的两分钟内每一秒对应的第一坐标值x₁、x₂…做成的集合。相应的第二状态可以包括第二状态的第一坐标值、第二状态的第二坐标值、第二状态的第三坐标值、第二状态的第二速度、第二状态的第二仰角和第二状态的第二偏航角。在本发明的一个是示例中，该第一坐标值、第二坐标值和第三坐标值为预先设定的坐标系中的x、y、z方向上的坐标值。

在步骤S20中，采用六个独立且相同结构的LSTM网络根据第一状态预测蓝方无人机在未来预定时刻的第一预测状态。在该实施方式中，可以将蓝方无人机的从1到当前时刻t的第一状态a₁、a₂…a_t(其中，i为1至t之间的任意整数)的内容拆分开，以形成分别由第一坐标值x、第二坐标值y、第三坐标值z、速度矢量v、俯仰角θ和偏航角

构成六组数据集合。采用六个独立且相同结构的LSTM网络分别对该六组数据集合进行计算，以预测出在未来预定时刻蓝方无人机的第一预测的第一坐标值x_t+1、第一预测的第二坐标值y_t+1、第一预测的第三坐标值z_t+1、第一预测速度v_t+1、第一预测俯仰角θ_t+1和第一预测偏航角

的值。最后，将该蓝方无人机在未来预定时刻的第一预测的第一坐标值x_t+1、第一预测的第二坐标值y_t+1、第一预测的第三坐标值z_t+1、第一预测速度v_t+1、第一预测俯仰角θ_t+1和第一预测偏航角

的值的关联起来，生成该蓝方无人机在未来预定时刻的第一预测状态a_t+1。在本发明的一个示例中，该LSTM网络的输入数据可以为一维序列数据(用于处理不同数据的LSTM网络结构相同，但是输入的一维系列数据可以不同)；以第一坐标值x为例，该一维序列数据可以是由过去一段时间(预定时间段)内该蓝方无人机的第一坐标值x₁、x₂、x₃…x_t组成。该LSTM网络的计算方向可以是单向，也即由输入至输出，其层数可以是2层。该LSTM网络可以是采用衰减的学习速率，该学习速率的初始值可以为1.0，该学习速率的衰减值可以为0.5。该LSTM网络的细胞单元(cell单元)可以为100个，该LSTM网络的激活函数可以为双曲正切函数(tanh函数)。在采用该LSTM网络计算该第一坐标值时，为了防止过度拟合，造成预测数据的误差，可以在该LSTM网络中添加退出层(dropout层)，该dropout层的保留节点数可以是0.8。对于该预测结果的误差的计算方式，在该实施方式中，可以采用均方误差(meansquared error)的方法计算该误差，对于确定权重参数的迭代更新方式可以采用RMSprop算法。其他例如对第二坐标值y、第三坐标值z、速度矢量v、俯仰角θ和偏航角

的预测和上述采用LSTM网络对第一坐标值x的预测的计算方式相似，此处不再赘述。

在步骤S30中，从与红方无人机相关联的机动动作库中选取未被使用的机动动作。机动动作库中的机动动作可以指该控制红方无人机的加速度、俯仰角θ和偏航角

的信息。

在步骤S40中，根据红方无人机的当前状态和选取的机动动作计算红方无人机在执行机动动作后的未来预定时刻的第二预测状态。在该实施方式中，可以将先将该未来预定时刻与当前时间之间的时间区间离散为多个较短的预定时间周期(每个时间周期均相等)。在单个时间周期内，根据上个周期末红方无人机的加速度、本周期开始时从与红方无人机关联的机动动作库中选择的加速度改变量计算本周期开始时的红方无人机加速度。还可以根据红方无人机上个周期末的偏航角、俯仰角以及本周期开始时的选择的偏航角和俯仰角的改变量计算本周期开始时的红方无人机的偏航角和俯仰角，根据本周期开始时红方无人机的位置信息(x、y和z的值)、红方无人机速度、红方无人机的加速度、红方无人机的偏航角和俯仰角计算红方无人机在本周期的行进轨迹，确定该红方无人机在该时间周期结束时的位置信息。在每个时间周期内重复上述步骤，直到计算出该红方无人机在未来预定时刻的第二预测状态。

在步骤S50中，根据第二预测状态与第一预测状态计算在未来预定时刻蓝方无人机对红方无人机的威胁系数。在该实施方式中，该步骤中的计算方法可以是：

第一步，根据蓝方无人机的第一预测状态和红方无人机的第二预测状态计算目标距离。在本发明的一个示例中，该目标距离可以是蓝方无人机与红方无人机的距离，例如根据第一预测状态中的位置信息和第二预测状态中的位置信息计算该目标距离。

第二步，根据公式(1)计算距离威胁系数T₁。

其中，r_i为目标距离，rm为预设的红方无人机的导弹射程，rr为红方无人机的雷达的最大跟踪距离，rmt_i为预设的蓝方无人机的导弹的攻击距离，max(rm，rmt_i)为rm和rmt_i中的最大值。

第三步，根据公式(2)计算速度威胁系数T₂，

其中，v_i为红方无人机在预测时刻的速度矢量，v_z为蓝方无人机在预测时刻的速度矢量；

根据公式(3)计算威胁系数T，

T＝a₁*T₁*T₂+a₂*T₂ (3)

其中，T₁为距离威胁系数，T₂为速度威胁系数，a₁和a₂为加权系数。在本发明的一个示例中，该a₁和a₂的值可以相等。上述威胁系数的计算公式是根据理论分析和模拟实战经验得出，并不限于对本发明的具体保护范围造成限制，本领域技术人员也可以理解为其他的计算公式也是适用的。

在步骤S60中，重复上述步骤S30至S50，直到计算出所有与红方无人机相关联的机动动作库中的未被使用的机动动作的威胁系数。

在步骤S70中，对比所有威胁系数，从该所有威胁系数中选取最小威胁系数。

在步骤S80中，输出与最小威胁系数对应的机动动作。在该实施方式中，该机动动作与该最小威胁系数相对应，因此，红方无人机在执行该机动动作时，相对于蓝方无人机处于最佳的飞行状态(威胁系数最小)，这使得红方无人机在模拟对抗的过程中处于优势地位。

图2是根据本发明的一实施方式的用于无人机空中对抗的决策系统的结构框图。在图2中该决策系统可以包括：

雷达1，设置在红方无人机上，用于检测蓝方无人机的第一状态并通过红方无人机接收红方无人机的第二状态。在该实施方式中，该第一状态和第二状态可以包括：位置信息、速度、俯仰角和偏航角。在本发明的一个示例中，该俯仰角可以是无人机对于水平面的上下偏角，该偏航角可以是无人机的速度方向相对于飞行方向的左右偏角。可选地，该位置信息可以包括：第一坐标值、第二坐标值和第三坐标值。在本发明的一个是示例中，该第一坐标值、第二坐标值和第三坐标值为预先设定的坐标系中的x、y、z方向上的坐标值。

处理器2，与雷达1连接，被配置成用于执行以下步骤：

在步骤S10中，通过雷达1获取在预定时间段内蓝方无人机的第一状态和红方无人机的第二状态；在该实施方式中，该预定时间段可以包括从过去的一个预定时刻至当前时刻的时间区间，例如从两分钟前至当前时刻之间的时间区间。该第一状态可以包括位置信息、速度、俯仰角和偏航角。在本发明的一个示例中，该俯仰角可以是无人机对于水平面的上下偏角，该偏航角可以是无人机的速度方向相对于飞行方向的左右偏角。可选地，该位置信息可以包括：第一坐标值、第二坐标值和第三坐标值。所以，该第一状态可以包括第一状态的第一坐标值、第一状态的第二坐标值、第一状态的第三坐标值、第一状态的第一速度、第一状态的第一仰角和第一状态的第一偏航角。结合上述预定时间段，可以理解为该六个要素均可以为由预定时间段内每个时刻对应的各个要素单独组成的数据序列。例如对于第一状态的第一坐标值x，该数据序列可以为在过去的两分钟内每一秒对应的第一坐标值x₁、x₂…做成的集合。相应的第二状态可以包括第二状态的第一坐标值、第二状态的第二坐标值、第二状态的第三坐标值、第二状态的第二速度、第二状态的第二仰角和第二状态的第二偏航角。在本发明的一个是示例中，该第一坐标值、第二坐标值和第三坐标值为预先设定的坐标系中的x、y、z方向上的坐标值。

在步骤S20中，采用六个独立且结构相同的LSTM网络根据蓝方无人机的第一状态预测该蓝方无人机在未来预定时刻的第一预测状态。在该实施方式中，处理器2可以将蓝方无人机的从1到当前时刻t的第一状态a₁、a₂…a_t(其中，i为1至t之间的任意整数)的内容拆分开，以形成分别由第一坐标值x、第二坐标值y、第三坐标值z、速度矢量v、俯仰角θ和偏航角

构成六组数据集合。采用LSTM网络分别对该六组数据集合进行计算，以预测出在未来预定时刻蓝方无人机的第一预测的第一坐标值x_t+1、第一预测的第二坐标值y_t+1、第一预测的第三坐标值z_t+1、第一预测速度v_t+1、第一预测俯仰角θ_t+1和第一预测偏航角

的值的关联起来，生成该蓝方无人机在未来预定时刻的第一预测状态a_t+1。在本发明的一个示例中，该LSTM网络的输入数据可以为一维序列数据(用于处理不同数据的LSTM网络结构相同，但是输入的一维系列数据可以不同)；以第一坐标值x为例，该一维序列数据可以是由雷达1检测过去一段时间(预定时间段)内该蓝方无人机的第一坐标值x₁、x₂、x₃…x_t组成。该LSTM网络的计算方向可以是单向，也即由输入至输出，其层数可以是2层。在本发明的另一个实例中，该LSTM网络可以是采用衰减的学习速率，该学习速率的初始值可以为1.0，该学习速率的衰减值可以为0.5。在本发明的再一个示例中，该LSTM网络的细胞单元(cell单元)可以为100个，该LSTM网络的激活函数可以为双曲正切函数(tanh函数)。在采用该LSTM网络计算该第一坐标值时，为了防止过度拟合，造成预测数据的误差，可以在该LSTM网络中添加退出层(dropout层)，该dropout层的保留节点数可以是0.8。对于该预测结果的误差的计算方式，在该实施方式中，可以采用均方误差(mean squared error)的方法计算该误差，对于确定权重参数的迭代更新方式可以采用RMSprop算法。其他例如对第二坐标值y、第三坐标值z、速度矢量v、俯仰角θ和偏航角

在步骤S30中，从与红方无人机相关联的机动动作库中选取未被使用的机动动作；该机动动作库中的机动动作可以指该控制红方无人机的加速度、俯仰角θ和偏航角

的信息。

在步骤40中，根据红方无人机的当前状态和选取的机动动作计算红方无人机在执行机动动作后的未来预定时刻的第二预测状态。在该实施方式中，可以将先将该未来预定时刻与当前时间之间的时间区间离散为多个较短的预定的时间周期(每个时间周期均相等)。在单个时间周期内，处理器2根据上个周期末红方无人机的加速度、本周期开始时从与红方无人机关联的机动动作库中选择的加速度改变量计算本周期开始时的红方无人机加速度。还可以根据红方无人机上个周期末的偏航角、俯仰角以及本周期开始时的选择的偏航角和俯仰角的改变量计算本周期开始时的红方无人机的偏航角和俯仰角，根据本周期开始时红方无人机的位置信息(x、y和z的值)、红方无人机速度、红方无人机的加速度、红方无人机的偏航角和俯仰角计算红方无人机在本周期的行进轨迹，确定该红方无人机在该时间周期结束时的位置信息。在每个时间周期内重复上述步骤，直到计算出该红方无人机在未来预定时刻的第二预测状态。

第二步，根据公式(1)计算距离威胁系数T₁，

第三步，根据公式(2)计算速度威胁系数T₂，

根据公式(3)计算威胁系数T，

T＝a₁*T₁*T₂+a₂*T₂ (3)

其中，T₁为距离威胁系数，T₂为速度威胁系数，a₁和a₂为加权系数。在本发明的一个示例中，该a₁和a₂的值可以相等。

在步骤S60中，处理器2重复上述步骤S30至S50，直到计算出所有与红方无人机相关联的机动动作库中的未被使用的机动动作的威胁系数。

在步骤S70中，对比所有计算出的威胁系数，从该所有威胁系数中选取最小威胁系数。

在步骤S80中，向红方无人机输出与该最小威胁系数对应的机动动作以控制该红方无人机。在该实施方式中，该机动动作与该最小威胁系数相对应，因此，红方无人机在执行该机动动作时，相对于蓝方无人机处于最佳的飞行状态(威胁系数最小)，这使得红方无人机在模拟对抗的过程中处于相对优势地位。

该处理器2可以是通用处理器、专用处理器、常规处理器、数字信号处理器(DSP)、多个微处理器、与DSP核心相关联的一个或多个微处理器、控制器、微控制器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)电路、任何其它类型的集成电路(IC)、状态机等。

在本申请的一种实施方式中，上述的用于无人机的决策方法可以应用于无人机或有人机上，换句话说，上述的用于无人机的决策系统可以安装在无人机或有人机上。

在本申请的另一种可替换实施方式中，上述的用于无人机的决策方法可以由模拟器(例如飞行或空战模拟器)来实现，模拟器可以通过软件的方式来实施。换句话说，上述的用于无人机的决策系统可以是通过软件的方式实施的模拟器。

通过上述技术方案，本发明提供的用于无人机的决策系统及方法能够使得红方无人机在无法得知蓝方无人机的机动策略时通过LSTM网络的计算预测出蓝方无人机的飞行轨迹，遍历红方无人机存储的机动动作，选取最小威胁系数所对应的机动动作，使得红方无人机在与蓝方无人机作模拟对抗时处于相对优势地位。

以上结合附图详细描述了本发明例的可选实施方式，但是，本发明实施方式并不限于上述实施方式中的具体细节，在本发明实施方式的技术构思范围内，可以对本发明实施方式的技术方案进行多种简单变型，这些简单变型均属于本发明实施方式的保护范围。

另外需要说明的是，在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合。为了避免不必要的重复，本发明实施方式对各种可能的组合方式不再另行说明。

本领域技术人员可以理解实现上述实施方式方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序存储在一个存储介质中，包括若干指令用以使得一个(可以是单片机，芯片等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

此外，本发明实施方式的各种不同的实施方式之间也可以进行任意组合，只要其不违背本发明实施方式的思想，其同样应当视为本发明实施方式所公开的内容。

Claims

1.一种用于无人机空中对抗的决策方法，其特征在于，包括：

步骤S20：采用长短期记忆LSTM网络根据所述第一状态预测所述蓝方无人机在未来预定时刻的第一预测状态，具体包括：将所述第一状态拆分为由第一坐标值x、第二坐标值y、第三坐标值z、速度矢量v、俯仰角θ和偏航角

构成六组数据集合，分别采用六个独立且相同结构的LSTM网络进行计算以得到在未来预定时刻所述蓝方无人机的第一预测的第一坐标值x_t+1、第一预测的第二坐标值y_t+1、第一预测的第三坐标值z_t+1、第一预测速度v_t+1、第一预测俯仰角θ_t+1和第一预测偏航角

的值；

步骤S70：从所有威胁系数中选取最小威胁系数；

步骤S80：输出与所述最小威胁系数对应的机动动作。

2.根据权利要求1所述的决策方法，其特征在于，所述红方的第一状态和蓝方的第二状态包括：位置信息、速度、俯仰角和偏航角，所述预定时间段包括从过去的预定时刻至当前时刻的时间区间。

3.根据权利要求2所述的决策方法，其特征在于，所述位置信息包括第一坐标值、第二坐标值和第三坐标值，所述采用长短期记忆LSTM网络根据所述第一状态预测所述蓝方无人机在未来预定时刻的第一预测状态包括：

4.根据权利要求3所述的决策方法，其特征在于，所述LSTM网络的输入数据为一维时间序列数据，方向为单向，层数为2层；所述LSTM网络采用衰减的学习速率，所述学习速率的初始值为1.0，所述学习速率的衰减值为0.5，所述LSTM网络的细胞单元的数量为100个，激活函数为双曲正切函数，所述LSTM网络还包括：用于防止过度拟合的退出层，所述退出层的保留节点数为0.8，所述LSTM网络采用均方误差的计算方式计算误差，确定权重参数的迭代更新方式采用RMSprop算法。

5.一种用于无人机空中对抗的决策系统，其特征在于，所述决策系统包括：

雷达，设置在红方无人机上；

处理器，被配置成执行下列步骤：

的值；

步骤S70：从所有威胁系数中选取最小威胁系数；

步骤S80：输出与所述最小威胁系数对应的机动动作。

6.根据权利要求5所述的决策系统，其特征在于，所述红方的第一状态和蓝方的第二状态包括：位置信息、速度、俯仰角和偏航角，所述预定时间段包括从过去的一个预定时刻至当前时刻的时间区间。

7.根据权利要求6所述的决策系统，其特征在于，所述位置信息包括第一坐标值、第二坐标值和第三坐标值，所述处理器进一步被配置成：

8.根据权利要求7所述的决策系统，其特征在于，所述LSTM网络的输入数据为一维时间序列数据，方向为单向，层数为2层；所述LSTM网络采用衰减的学习速率，所述学习速率的初始值为1.0，所述学习速率的衰减值为0.5，所述LSTM网络的细胞单元的数量为100个，激活函数为双曲正切函数，所述LSTM网络还包括：用于防止过度拟合的退出层，所述退出层的保留节点数为0.8，所述LSTM网络采用均方误差的计算方式计算误差，确定权重参数的迭代更新方式采用RMSprop算法。