CN115222271A - 基于神经网络的武器目标分配方法 - Google Patents
基于神经网络的武器目标分配方法 Download PDFInfo
- Publication number
- CN115222271A CN115222271A CN202210899699.4A CN202210899699A CN115222271A CN 115222271 A CN115222271 A CN 115222271A CN 202210899699 A CN202210899699 A CN 202210899699A CN 115222271 A CN115222271 A CN 115222271A
- Authority
- CN
- China
- Prior art keywords
- target
- weapon
- unmanned aerial
- distance
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06312—Adjustment or analysis of established resource schedule, e.g. resource or task levelling, or dynamic rescheduling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Abstract
本发明提出了一种基于神经网络的武器目标分配方法,主要解决现有技术无法适用于无人机群打击地面目标这种对时效性要求极高的连续作战场景。其方案是:对已发现目标进行威胁评估并对威胁度排序,依次逐个地对目标分配武器;通过毁伤概率估计得到各个武器对当前待分配目标的打击适宜度,指挥官根据实战经验调整部分适宜度,形成训练数据集和测试数据集;通过训练集对全连接网络模型进行训练,并通过测试数据集选择最佳的全连接网络模型,使用所选的最佳全连接网络模型对每个目标依次进行武器目标分配。本发明不仅能效利用历史作战信息和指挥官的作战经验,而且能减少分配时间,可用于无人机群打击地面目标这种对时效性要求极高的连续作战场景。
Description
技术领域
本发明属于计算机仿真技术领域,特别涉及一种武器目标分配方法,可用于无人机群对地面的目标打击。
背景技术
武器目标分配问题的关键在于解决将杀伤能力不同的武器,通过分配具有不同威胁的目标可达到作战效能最大的作战效果,其属于一类多资源约束的优化调度问题。
对于大规模作战的场景,武器目标分配问题的复杂度会随着武器和目标数量增加急剧提升,确定最佳解决方案的问题固有的复杂性包括有限的武器资源、必须应对威胁的时间窗口、武器系统之间的负载平衡,以及各种任务和资源的复杂相互依赖性。武器目标分配问题被证明是NP完全问题,对于大规模的分配问题,传统的方法无法在多项式时间内对这种问题进行有效求解。当前多用的遗传算法进行求解时,对快速的动态连续作战场景很难适配,时效性也很难满足实际要求。
另外,当前实际中存在利用历史作战信息的需求,即希望通过从历史作战信息中获得经验,进而更好地指导未来的作战。传统的目标分配方法,无法利用历史作战信息。如基于遗传算法的武器目标分配方法,每次分配都是通过优化固定不变的目标函数来获得分配结果,无法利用之前作战产生的分配信息。
无人机群目标分配可以看作一种指派问题,解决该问题的现有方法主要有矩阵法、启发式遗传模拟退火算法、匈牙利算法。这些方法都是将武器目标分配问题看成静态的,即在某一个固定的时间窗口下进行优化求解,由于在优化求解的过程中无人机的位置和目标的位置都在发生变化,求解的时间越长,位置变化就越明显,分配的效能就降低越多,因此这些复杂度高的方法很难适用在无人机群打击地面目标这样对时效性要求极高的连续作战场景;另外,这些方法都基于确定的规则,很难随着作战的进行和指挥官策略的改动进行动态调整,即无法利用历史作战信息和指挥官作战经验,不能满足实际作战中对智能化决策的要求。
发明内容
本发明的目的在于针对上述现有技术的不足,提出一种基于神经网络的武器目标分配方法,以利用历史作战信息和指挥官作战经验,提高武器目标分配的时效性和应变能力,满足实际作战中对智能化决策的要求。
为实现上述目的,本发明的技术方案包括如下:
(1)根据已获取的敌方目标类型及状态信息,采用层次分析法对敌方目标的进行威胁程度评估,Tj∈[0,1]表示目标j的威胁程度;
(2)根据对敌方目标的威胁程度估计结果,确定当前发现目标的打击优先度大小,并从大到小排序得到打击顺序表,威胁度越大打击优先度越高;
(3)根据打击顺序表依次选择目标进行打击:
3a)对于选择的目标j,根据我方的武器信息和环境信息,并综合敌方目标信息,对武器打击目标的毁伤概率进行估计,计算出各个武器对该目标的毁伤概率Pij;
其中,α∈[0,1]为毁伤效果权重,vj为目标j的价值,ci为武器i的造价;
3c)选择适宜度最大的可用的武器作为打击该目标的分配结果,最后指挥官根据作战经验和实际情况判断该分配结果是否需要调整,如果需要调整,指挥官人工调整相应的打击适宜度;
(4)重复武器目标分配核心步骤(1)-(3)得到A和B两种训练数据,即A为基于规则的作战数据,B为指挥官根据作战经验和实际情况调整过的数据,将A和B数据按照9:1的比例组成训练集和测试集,其中训练集中数据A有90000条,数据B有10000条,测试集中数据A有900条,数据B有100条;
(5)设每架无人机携带两种类型的武器,获取第i架无人机的空间坐标[xwi,ywi,zwi]和当前选择目标的空间坐标[xj,yj,zj],得到在M架无人机下的维度为3*M+7的网络模型输入向量X:
X=[xw1,yw1,zw1,...,xwi,ywi,zwi,...,xwM,ywM,zwM,N,E,xj,yj,zj,Belongj,Typej]
其中,N为自然环境影响因子,E为电磁环境影响因子,Belongj为目标所属连队,Typej为目标的类型;
附图说明
图1为本发明的实现总流程图;
图2为本发明中威胁评估子流程图;
图3为威胁评估多层因素集;
图4为使用基于神经网络的目标分配方法进行目标分配的子流程图;
图5为仿真环境示意图;
图6为练集和测试集上的正确率随训练代数的变化。
具体实施方式
本发明是针对无人机群对地面目标动态连续打击的场景,该场景下所有的地面目标不是同时出现的,且假设:
敌方目标兵种为陆军,以连队为单位在地面行军,敌方目标种类为12种,6个连队根据实际需求配备着不同类型的目标若干。敌方目标以连队为单位,按照一定路线移动。
我方发现敌方动向后,M架无人机起飞,前往目标上空巡航,伺机对目标进行打击。无人机可携带的导弹类型数量为4种,每架无人机可携带两种导弹若干。我方无人机从给的起点到终点进行巡航,根据情报系统随机地、间隔地发现目标,无人机在巡航途中进行武器目标分配。
无人机在巡航的过程中选择当前被发现的地面目标进行打击,使得打击效能最大化。如何和在这种场景下进行目标分配,是本发明需要解决的问题。
以下结合附图对本发明的实施例和效果做进一步详细说明。
参照图1,本实例的实现步骤如下:
步骤1:目标威胁评估。
参照图2,目标威胁评估的具体实现步骤如下:
1.1)建立威胁评估因素集,如图3:
根据在无人机群进攻作战的场景中,敌方地面部队常见的目标有坦克、装甲车、运兵车、侦察车,选取其目标能力、目标意图、距离这三个因素作为目标威胁评估的一级因素;
将目标能力对威胁程度的影响细分为机动能力、干扰能力和防空能力三个二级因素,将距离因素分为目标距无人机的距离和目标距要地的距离两个二级因素;
1.2)对各因素指标进行量化和规范化:
1.2.1)将目标的机动能力、干扰能力、防空能力设为定性指标,分别记为A1,A2,A3,并将三种能力划分为强、中、弱和无四个等级,各个等级对应的量化值分别为0.9、0.6、0.3、0;
1.2.2)将目标意图I分为三大类,分别为进攻、侦察和支援,各个意图对应的量化值分别为0.9、0.7、0.4;
1.2.3)将距离因素设为定量指标,其分为距无人机的距离d1、距要地的距离d2,计算方式为:其中,d'k为目标和第k个无人机或要地的距离,n为无人机或要地的数量,i=1表示距无人机的距离d1,i=2表示距要地的距离d2;
1.2.4)将距离d1,d2规范化为[0-1]之间的值D1,D2,具体计算方式为:
μ=1.0为距离指标最大值,当距离小于10km时,威胁很大,当距离大于100km时,威胁很小,μ的最小值为0.1,当距离大于10km小于100km时,威胁度随距离的增大而减小,指标μ随距离增大线性减小;
1.3)采用AHP法根据确定各个因素的重要程度给出各因素的权重:
1.3.1)确定判断矩阵:
根据判断矩阵A=(aij)n×n为对称矩阵的性质,通过步骤1.1)中的威胁评估因素集,设置三个关于指标重要程度的判断矩阵A、B1、B2,其中A为目标能力、目标意图、距离三个一级因素的判断矩阵,B1为目标能力的三个二级因素的判断矩阵,B2为距离的两个二级因素判断矩阵,A和B1为3阶方阵,B2为2阶方阵;
1.3.2)判断矩阵标度定义表,如表1所示:
表1.判断矩阵标度定义
因素i和因素j相比 | 标度值 |
同等重要 | 1 |
稍微重要 | 3 |
较强重要 | 5 |
强烈重要 | 7 |
极端重要 | 9 |
两相邻判断的中间值 | 2,4,6,8 |
1.3.3)专家根据判断矩阵标度定义表和实际情况和判断矩阵标度定义表确定三个判断矩阵A、B1、B2的标度值,即专家根据经验比较两两因素的重要程度,给出各个判断矩阵的标度值:
例如对于目标能力的判断矩阵A按照如下情况给出标度值:
如果专家认为目标能力和目标意图相比目标能力更重要,且重要程度介于同等重要和稍微重要之间,则根据表1,该矩阵第一行第二列的值A12=2;
如果专家认为距离和目标能力相比距离更重要,且重要程度介于稍微重要和较强重要之间,则根据表1,该矩阵第三行第一列的值A31=4;
如果专家认为距离和目标意图相比距离更重要,且重要程度介于较强重要和强烈重要之间,则根据表1,该矩阵第三行第二列的值A32=6;
按照与判断矩阵A同样地方法,由专家确定判断矩阵B1、B2为:
1.3.4)对所述三个判断矩阵A、B1、B2进行一致性检验:
分别对步骤1.3.3)中给出的判断矩阵A、B1、B2实例进行一致性检验,即对应各个判断矩阵,根据一致性指标和表2中平均随机一致性指标RI标准值,计算一致性检验比例其中λmax为要检验矩阵的最大特征值,n为要检验矩阵的维度;
若CR<0.10,则认为该判断矩阵通过一致性检验;
否则,修改判断矩阵,直到通过一致性检验。
表2.平均随机一致性指标RI标准值
矩阵阶数n | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
RI | 0 | 0 | 0.58 | 0.90 | 1.12 | 1.24 | 1.32 | 1.41 | 1.45 | 1.49 |
本实例判断矩阵A的最大特征值λmax=3.013,一致性检验比例CR=0.011<0.10,通过一致性检验;判断矩阵B1的最大特征值λmax=3.004,一致性检验比例CR=0.004<0.10,通过一致性检验。B2维度为2,一定满足一致性;
1.3.5)使用算数平均法近似计算各个判断矩阵最大特征值λmax对应的特征向量W:
本实例分别对步骤1.3.3)中给出的判断矩阵A、B1、B2计算其特征向量,通过计算,得到:
判断矩阵A的最大特征值λmax=3.013,对应的特征向量WA=[0.204,0.105,0.691];
1.3.6)对各个因素加权求得目标j的威胁度Tj:
其中,A1,A2,A3分别为目标机动能力、干扰能力、防空能力的量化值,I为目标意图的量化值,D1、D2分别为距无人机的距离和距要地的距离的量化值,WA[1]表示目标能力判断矩阵A最大特征值对应的特征向量的第一个值即0.204。
步骤2:根据对敌方目标的威胁程度估计结果,确定当前发现目标的打击优先度大小,并从大到小排序得到打击顺序表Attack_List,威胁度越大打击优先度越高。
步骤3:根据打击顺序表Attack_List依次选择目标进行打击。
3.1)毁伤概率估计:
对于选择的目标j,根据我方的武器信息和环境信息,并综合敌方目标信息,对武器打击目标的毁伤概率进行估计,计算出各个武器对该目标的毁伤概率Pij,毁伤概率由多个要素共同影响,使用用各个要素量化数值的乘积表示毁伤概率:
Pij=N×E×Wij×Hj×Mij
其中,Pij表示武器i对敌方目标j的毁伤概率,N表示自然环境影响因子,E表示电磁对抗影响因子,Wij表示武器i打击敌方目标j时的能力影响因子,Hj表示敌方目标j防御能力影响因子,Mij表示武器i和敌方目标j匹配度影响因子,各要素量化方法如下:
3.1.1)在不考虑自然环境和电磁对抗的影响时,N=1,E=1;
3.1.2)根据武器的基础命中精度,战斗部重量和打击距离这三个影响因素,计算我方武器的能力影响因子Wij:
Wij=Pbase×Pw×Pd
其中,Pbase为武器i的基础命中概率,即在环境良好、无电磁干扰、打击距离合适,导弹系统无故障的情况下导弹的命中概率;
Pd为距离影响因子距离对打击精度的影响,取值如下:
r为武器的射程,d为武器和目标的距离,在射程范围[0,r]内,距离对精度的影响忽略,距离影响因子Pd=1;在射程和1.5倍射程内[r,1.5r],距离对精度的影响逐渐变大,距离大于1.5r时,距离影响因子Pd=0,武器无法命中;
3.1.3)根据目标装甲程度、防空能力计算敌方目标j防御能力影响因子Hj:
3.1.4)计算武器和目标匹配度对毁伤概率的影响因子:
由于同一武器对不同目标的毁伤概率不同,不同武器对同一目标的毁伤概率不同的情况,说明武器作战是有针对性的,例如穿甲弹对坦克这种重装甲的毁伤概率就大于分散步兵,因此,穿甲弹对坦克目标的毁伤概率相应就较大,将该特性定义为武器与目标的匹配度
3.2)确定目标函数:
在无人机进攻作战场景下,武器目标分配的基本原则是使目标分配结果在满足各个约束的条件下,尽可能的提高作战效能,降低作战代价。
3.2.1)计算毁伤效果
为了尽可能的提高作战效能,需要尽可能地以毁伤概率大的武器打击威胁度高目标,即最大化毁伤效果c,计算如下:
c=Pij×Tj,
其中,Tj为目标j的威胁程度,Pij为武器i对目标j的毁伤概率;
3.2.2)定义效费比:
为了实现目标分配效能的最大化,不能仅仅考虑如何最大程度的摧毁目标,还要考虑单位武器弹药产生的作战效能。例如,大型导弹和小型导弹造价相差10倍,两者打击同一个小型目标时,大型导弹的毁伤概率可能略微高于小型导弹,此时如果只考虑更好的摧毁目标,不考虑代价,将选择大型导弹进行打击。另外,在导弹对某个目标的毁伤概率很低的情况下,仅仅追求毁伤不考虑代价,这样的分配情况会造成很大的浪费,影响后续作战效能的发挥。
为了避免浪费情况,使得武器能够更加合理的使用,由此引出效费比e的定义:
其中vj为目标j的摧毁价值即目标装备的造价;cj为武器i的发射代价,即指武器的造价,Pij为武器i对目标j的毁伤概率;
3.2.3)根据毁伤效果和效费比构造目标函数:
对于作战进程中m个武器,n个目标的一个分配任务,目标分配的一个分配方案X为m×n的矩阵,该矩阵第i行第j列的值Xij为:
在目标分配场景中,如果不将敌方目标摧毁,我方将受到攻击而产生损失,因此通常会分配多个武器打击目标,尽可能地将其摧毁。由于无人机打击地面场景下的目标分配任务与一般的目标分配有所差异,对目标打击的“紧急程度”不高,即使没有将目标摧毁,也不会立即产生损失。因此需要设定在一次分配任务中需要满足的约束条件,即每个目标最多分配一个武器,每个武器最多发射一次。
综合考虑毁伤程度、效费比,在设定的约束条件下,通过加权求和得到目标函数F:
3.2.3)将目标函数F简化为单目标分配的目标函数Fi:
为了降低上述目标函数的求解的复杂度,将多目标分配简化为单目标的分配,即根据打击顺序表Attack_List,依次选择选择单个目标进行打击,计算出各个武器对该目标的毁伤概率,然后综合考虑毁伤效果和效费比选择最适宜进行打击的武器,得到简化后的目标函数为:
其中,α∈[0,1]为毁伤效果权重,vj为目标j的价值,ci为武器i的造价,Fi为武器i对当前选择目标的打击适宜度;
3.3)选择适宜度最大的可用的武器作为打击该目标的分配结果,并由指挥官根据作战经验和实际情况判断该分配结果是否需要调整:
如果需要调整,指挥官人工调整相应的打击适宜度Fi为Fi′;
如果不需要调整,,使用已计算的打击适宜度Fi进行分配打击。
步骤4:构造训练数据集和测试数据集。
重复武器目标分配核心步骤1—步骤3,将得到A和B两种数据,即A为基于规则的作战数据Fi,B为指挥官根据作战经验和实际情况在A的基础上调整过的数据Fi';
4.1)数据集的形式:
数据A中,每个数据样本的形式为(X,YA),数据B中,每个数据样本的形式为(X,YB),其中,X为一个目标和所有武器对应的特征,YA、YB为各个武器对该目标的打击适宜度向量,其构成如下:
设每架无人机携带两种类型的武器,获取第i架无人机的空间坐标[xwi,ywi,zwi]和当前选择目标的空间坐标[xj,yj,zj],得到在M架无人机下的维度为3*M+7的特征向量X:
X=[xw1,yw1,zw1,...,xwi,ywi,zwi,...,xwM,ywM,zwM,N,E,xj,yj,zj,Belongj,Typej]
其中,N为自然环境影响因子,E为电磁环境影响因子,Belongj为目标所属连队,Typej为目标的类型;
对M架无人机,每架无人机有两种武器,YA、YB的维度为2*M,表示各个武器对当前选择目标的打击适宜度;
YA=[F1,F2,···,Fi,···,Fn],
YB=[F1,F2,···,Fi',···,Fn],
其中,A数据的YA为各个武器对当前选择目标的打击适宜度向量;
B数据的YB表示指挥官调整第i个武器的打击适宜度后,对当前选择目标的打击适宜度向量;
4.2)构造训练数据集和测试数据集:
在特征向量X的各个特征的可行域中,按照均匀分布随机生成不同的特征向量X,然后计算各个武器的打击适宜度Fi组成YA,进而构成数据A;
在数据A中,指挥官需选择要调整的数据,将Fi调整为Fi'组成YB,构成数据B;
将A和B数据按照9:1的比例构造训练集和测试集,其中训练集中数据A有90000条,数据B有10000条,共100000条数据;
测试集中数据A有900条,数据B有100条,共1000条数据;如果经指挥官调整的数据B在训练集中数量不够10000条或在测试集中不够100条,则通过重复复制的方式进行构造,使得训练集里的数据B达到10000条,测试集里的数据B达到100条。
构建由多层全连接组成的神经网络模型其中隐藏层的层数为k,每层的节点数为L=[l1,l2,···,lk],激活函数使用的ReLU函数,输出向量为:维度为2*M,表示各个武器对当前选择目标的打击适宜度,网络模型的结构如下:
输入层→第1隐藏层→第2隐藏层→…→第k隐藏层→输出层。
6.1.1)将最新的数据B加入到训练集和测试集,设置初始学习率α=0.1,小批次样本数量mini_batch=200;
6.1.2)对输入特征向量X=[x1,x2,···,xi,···,xn]的每一维xi进行归一化,得到归一化后的特征向量:X'=[x′1,x'2,···,x′i,···,x'n],其中:
6.1.4)设置衰减系数k=0.01,λ=epoch=100,对学习率α和模型参数θ的每个θj进行更新,即:
考虑到神经网络正向传播的速度很快,使用神经网络模型输入一个目标的信息,输出各个武器对该目标的打击适宜度,本实例对各个时间窗口发现的目标按顺序分别进行快速地武器分配,以满足动态的无人机作战场景下的目标分配任务对决策时间的严苛要求,其具体实现是:
参照图4,本步骤的具体实现如下:
8.1)初始化作战场景:
将一次作战分成多个时间窗口,一个时间窗口作为一次分配任务,可分配若干个目标;
设置敌方各类型目标的数量、初始位置、移动路线、移动速度等信息;设置我方无人机数量,各个无人机携带武器类型及数量、初始位置、移动路线、移动速度等信息,初始化时间窗口T=1;
8.2)对当前已发现且未被摧毁的目标进行威胁评估,并按威胁度从大到小排序得到打击顺序表Attack_List;
8.3)确定当前时间窗口下打击目标数量na,满足条件0≤na≤min(Nu,Nattack_List),即每个时间窗口下打击目标数量na不能大于可用的武器数量Nu,且不超过当前打击顺序表Attack_List的目标数量Nattack_List。
8.4)在Attack_List中选择前na个目标进行分配打击;
8.5)对当前的战场状态进行更新:
A:根据目标分配结果并按照毁伤概率判断被打击目标是否被摧毁,进行敌方目标状态更新;
B:更新每架无人机的余单弹量;
C:根据敌方防空武器的毁伤概率和距离,判断我方各个无人机是否被摧毁,对我方无人机状态进行更新;
D:根据目标移动路线和速度,更新各个未被摧毁的目标位置;
E:根据无人机的飞行路线和速度,更新无人机的位置。
8.6)作战终止条件判断:
指挥官根据具体情况可设置终止条件为:携带弹药用尽、无人机全被摧毁、连续5个时间窗口没有目标被发现、弹药使用量达到总携带量的80%或特定关键目标被摧毁。
8.7)令T=T+1,进入下个时间窗口,判断作战终止条件是否触发:
若触发作战终止条件,则停止作战;
若没有触发作战终止条件,则返回步骤8.2)。
本发明效果可通过以下仿真实验进一步说明。
一、仿真条件
仿真实验将无人机平台携带各种类型的武器对地面敌方目标实施打击的作战场景作为主要的模拟仿真实验场景,进行敌我双方对抗场景设定,场景描述如下:
设我方武器库有不同类型的武器若干,导弹类型及参数如表3,一共四种导弹类型。
表3.我方导弹及参数汇总表
武器(导弹)型号 | 基础精度 | 威力(战斗部重量/kg) | 射程/km | 造价/万元 |
w<sub>1</sub> | 0.90 | 10 | 10 | 40 |
w<sub>2</sub> | 0.85 | 5 | 8 | 15 |
w<sub>3</sub> | 1.00 | 20 | 18 | 100 |
w<sub>4</sub> | 0.95 | 20 | 40 | 250 |
作战平台为某型号无人机,可携带各种不同类型的空地导弹,限制每架无人机可携带两种类型的导弹。分别设定两种配置方案如表4,
表4.无人机携带导弹配置方案
无人机配置方案 | w<sub>1</sub> | w<sub>2</sub> | w<sub>3</sub> | w<sub>4</sub> |
配置一 | 0 | 13 | 0 | 3 |
配置二 | 10 | 0 | 6 | 0 |
配置一为无人机携带w2型导弹13枚,携带w4型导弹3枚;
配置二为无人机携带w1型导弹10枚,携带w3型导弹6枚。
设敌方目标由若干地面装甲连队构成,拥有多种不同装甲战车、坦克、防空武器等装备,目标类型及参数如表5,一共有12种目标类型。
表5.目标类型及参数汇总表
4种武器和12种目标的匹配程度,如表6。
表6.武器——目标匹配度Mij
敌方的基本作战单位为连队,不同的连队作战功能不同,配备不同类型的装备若干,连队配置表如表7:
表7.不同作战连队配置
仿真环境中一共设置6个敌方作战连队,连队二和连队三以及连队五连队六配置相同,说明两个连队发挥的作战功能相同,属于同一种类型的连队。
无人机群打击地面目标的作战的仿真场景参照图5,敌方单位为作战连队,我方单位为携带不同类型和数量导弹的无人机,在坐标系中对敌我双方各个单位的位置进行描述,仿真环境建立在三维坐标中,战场空间大小设置为40km*40km*4km,地面上分布着敌方六个作战连队,如图5中的蓝色点的六个群落,群落里中不同形状的点代表不同类型的目标,一共12种类型。敌方连队以一定的路线和速度进行移动。红色圆点代表我方的无人机,两种配置方案各5架,共10架。分布在2km~4km的空中,以一定的路线在空中飞行。绿色方块为我方的一处防卫要地,要在一定程度上对该要地进行保护,无人机和目标的连线表示该时间窗口下的分配结果,地面敌方目标由蓝变红代表该目标被摧毁。
我方的侦察系统对地面展开侦查,每个一段时间会将侦察发现的目标信息发送给无人机,无人机根据收到的敌方目标信息进行目标分配,并实施打击。由于侦察系统不能同时发现所有敌方目标,仿真环境中使用随机选取一定数量目标的方式来模拟这种场景。
仿真模拟环境中作战约束条件设置如下:
其一,由于气象和电磁等不稳定因素的影响,侦察探测系统无法同时发现所有的地面目标,在某个特定的时间窗口内,仅能发现有限的目标。
其二,每架无人机上的每种类型导弹在一个时间窗口下最多只能发射一次。
其三,如果适宜度最优武器对应的弹药量为0,或者携带该武器的无人机被摧毁,或者在当前时间窗口下该武器已被占用,那么顺延至适宜度次优的武器。
二、仿真实验内容
仿真1,确定网络结构。
构造10万个样本的训练集和1000样本的测试集。在隐藏层层数为1,节点数为50的网络上进行训练,仿真训练集和测试集上的正确率随训练代数的变化,结果如图6所示。从图6可以看出这样的神经网络模型能够拟合这样的数据集,准确率K1高于90%,说明基于神经网络的目标分配算法具有可行性。
为了确定全连接网络模型最合适的隐藏层层数和每层节点数,设置不同的隐藏层层数k和隐藏层节点数L进行分别进行训练,分别训练1000代,其结果如表8所示。
表8.不同网络结构的正确率
从表8可以看出,在隐藏层为1、节点数为500的网络训练集上的正确率达到了1.0,这是由于网络节点过多造成了过拟合现象。在隐藏层为1,节点数为200的网络测试集正确率最高,因此可选择该网络结构进行武器目标分配。
仿真2,在静态和动态这两种不同的作战场景下,分别用本发明的和现有基于遗传算法的目标分配方法进行目标分配实验。
所述静态场景设置为:所有目标一次性被发现,10架无人机的20个导弹在同一个时间窗口下实施打击任务。在该时间窗口下,所有的目标和武器平台的位置都是不发生变化的,即静态的。
所述动态场景设置为:所有目标间隔地被发现,10架无人机的20个导弹在多个时间窗口下实施打击任务。在每个时间窗口下,有5个目标被发现,且所有的目标和武器平台的位置都是变化的,这种的动态场景是更接近于真实战场环境的场景。
实验一:在静态场景下对比两种方法在一个时间窗口下的分配效能,效能评价指标使用目标函数F。实验分别α=[0.4,0.5,0.6,0.7,0.8]的目标函数下进行10次重复实验,得到两种方法分配结果的运行所需时间T(s)和目标函数值F,实验结果如表9和表10。
表9.不同权重参数α下的分配所需时间T(s)
表10.静态场景下不同权重参数α下的目标函数值F
实验结果表9可以看出:本发明分配的时间效率相较于基于遗传算法的武器目标分配方法高出三个数量级,具有高时效性,能够适用于无人机打击地面目标这样的快速连续作战场景。
实验结果表10可以看出:因为本发明对目标函数F进行了简化,分配效能要略差于基于遗传算法的武器目标分配方法,但这种效能差距在对时效性要求极高的无人机群打击地面目标的作战场景下是可以接受的,且较小效能的减小带来时间效率的极大提升。
实验二:在动态场景下由于每个时间窗口发现5个目标,该实验每四个时间窗口凑够20个目标,利用基于遗传算法的目标分配方法每四个窗口分配一次,利用本发明在每个时间窗口下进行分配,因此每种导弹可使用多次,使得导弹的使用更加灵活。
对比两种方法在四个时间窗口下的分配效能,效能评价指标使用目标函数F。实验分别α=[0.4,0.5,0.6,0.7,0.8]的目标函数下进行10次重复实验,得到两种方法分配结果的目标函数值F,实验结果如表11。
表11.动态场景下不同权重参数α下的目标函数值F
实验结果表11可以看出:在不同权重参数α下的目标函数下,本发明的评价指标F均高于基于遗传算法的目标分配方法。表明本发明在动态场景下的分配效能优于现有的基于遗传算法。本发明的高时效性能够带来分配效能的提升,而现有的时效性较差的算法无法应用于动态快速变化的战场环境。
Claims (6)
1.一种基于神经网络的武器目标分配方法,其特征在于,包括如下步骤:
(1)根据已获取的敌方目标类型及状态信息,采用层次分析法对敌方目标的进行威胁程度评估,Tj∈[0,1]表示目标j的威胁程度;
(2)根据对敌方目标的威胁程度估计结果,确定当前发现目标的打击优先度大小,并从大到小排序得到打击顺序表,威胁度越大打击优先度越高;
(3)根据打击顺序表依次选择目标进行打击:
3a)对于选择的目标j,根据我方的武器信息和环境信息,并综合敌方目标信息,对武器打击目标的毁伤概率进行估计,计算出各个武器对该目标的毁伤概率Pij;
其中,α∈[0,1]为毁伤效果权重,vj为目标j的价值,ci为武器i的造价;
3c)选择适宜度最大的可用的武器作为打击该目标的分配结果,最后指挥官根据作战经验和实际情况判断该分配结果是否需要调整,如果需要调整,指挥官人工调整相应的打击适宜度;
(4)重复武器目标分配核心步骤(1)-(3)得到A和B两种训练数据,即A为基于规则的作战数据,B为指挥官根据作战经验和实际情况调整过的数据,将A和B数据按照9:1的比例组成训练集和测试集,其中训练集中数据A有90000条,数据B有10000条,测试集中数据A有900条,数据B有100条;
(5)设每架无人机携带两种类型的武器,获取第i架无人机的空间坐标[xwi,ywi,zwi]和当前选择目标的空间坐标[xj,yj,zj],得到在M架无人机下的维度为3*M+7的网络模型输入向量X:
X=[xw1,yw1,zw1,...,xwi,ywi,zwi,...,xwM,ywM,zwM,N,E,xj,yj,zj,Belongj,Typej]
其中,N为自然环境影响因子,E为电磁环境影响因子,Belongj为目标所属连队,Typej为目标的类型;
2.根据权利要求书1所述的方法,其特征在于,所述步骤(1)中采用层次分析法对敌方目标的进行威胁程度评估,实现如下:
(1a)建立评估因素集:
在无人机群进攻作战的场景中,根据敌方地面部队常见的目标有坦克、装甲车、运兵车、侦察车,选取其目标能力、目标意图、距离这三个因素作为目标威胁评估的一级因素;
将目标能力对威胁程度的影响细分为机动能力、干扰能力和防空能力三个二级因素;
将距离因素分为目标距无人机的距离和目标距要地的距离两个二级因素;
(1b)对各因素指标进行量化和规范化:
将目标的机动能力、干扰能力、防空能力设为定性指标,分别记为A1,A2,A3,并将三种能力划分为强、中、弱和无四个等级,各个等级对应的量化值分别为0.9、0.6、0.3、0;
将目标意图I分为三大类,分别为进攻、侦察和支援,各个意图对应的量化值分别为0.9、0.7、0.4;
将距离d1,d2规范化为[0-1]之间的值D1,D2,具体计算方式为:
(1c)采用AHP法根据确定各个因素的重要程度给出各因素的权重;
(1c1)通过专家经验得到关于指标重要程度的判断矩阵A、B1、B2,其中A为目标能力、目标意图、距离三个一级因素的判断矩阵,B1为目标能力的三个二级因素的判断矩阵,B2为距离的两个二级因素判断矩阵,A和B1的为3阶方阵,B2为2阶方阵;
(1c2)根据判断矩阵标度定义表,专家根据经验比较两两因素的重要程度,给出各个判断矩阵的标度值;
(1c3)对所述三个判断矩阵A、B1、B2进行一致性检验:
若CR<0.10,则认为该判断矩阵通过一致性检验;
否则,修改判断矩阵,直到通过一致性检验。
(1c4)使用算数平均法近似计算各个判断矩阵最大特征值λmax对应的特征向量:
得到三个判断矩阵的权重向量WA,WB1,WB2;
(1c5)加权求得目标j的威胁度Tj:
3.根据权利要求书1所述的方法,其特征在于,所述步骤(3)中对武器打击目标的毁伤概率进行估计,是先将影响毁伤概率的各要素量化,再用各个要素量化数值的乘积表示毁伤概率:
Pij=N×E×Wij×Hj×Mij
其中,Pij表示武器i对目标j的毁伤概率,N表示自然环境影响因子,E表示电磁对抗影响因子,Wij表示我方武器i能力影响因子,Hj表示敌方目标j防御能力影响因子,Mij表示武器i和目标j匹配度影响因子。
(7a)将最新的数据B加入到训练集和测试集,设置初始学习率α=0.1,小批次样本数量mini_batch=200;
(7b)对输入特征向量X=[x1,x2,···,xn]的每一维xi进行归一化:
(7d)模型参数更新:设置衰减系数k=0.01,λ=epoch=100,对学习率α和模型参数θ的每个θj进行更新,即:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210899699.4A CN115222271A (zh) | 2022-07-28 | 2022-07-28 | 基于神经网络的武器目标分配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210899699.4A CN115222271A (zh) | 2022-07-28 | 2022-07-28 | 基于神经网络的武器目标分配方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115222271A true CN115222271A (zh) | 2022-10-21 |
Family
ID=83614269
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210899699.4A Pending CN115222271A (zh) | 2022-07-28 | 2022-07-28 | 基于神经网络的武器目标分配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115222271A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115660444A (zh) * | 2022-12-02 | 2023-01-31 | 中国兵器科学研究院 | 一种防御控制方法、装置、电子设备及存储介质 |
CN116702633A (zh) * | 2023-08-08 | 2023-09-05 | 北京理工大学 | 一种基于多目标动态优化的异构弹群任务可靠性规划方法 |
CN116993129A (zh) * | 2023-09-26 | 2023-11-03 | 北京中兵天工防务技术有限公司 | 一种基于复杂约束条件的任务可行性分析方法及系统 |
-
2022
- 2022-07-28 CN CN202210899699.4A patent/CN115222271A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115660444A (zh) * | 2022-12-02 | 2023-01-31 | 中国兵器科学研究院 | 一种防御控制方法、装置、电子设备及存储介质 |
CN115660444B (zh) * | 2022-12-02 | 2023-08-15 | 中国兵器科学研究院 | 一种防御控制方法、装置、电子设备及存储介质 |
CN116702633A (zh) * | 2023-08-08 | 2023-09-05 | 北京理工大学 | 一种基于多目标动态优化的异构弹群任务可靠性规划方法 |
CN116702633B (zh) * | 2023-08-08 | 2023-11-03 | 北京理工大学 | 一种基于多目标动态优化的异构弹群任务可靠性规划方法 |
CN116993129A (zh) * | 2023-09-26 | 2023-11-03 | 北京中兵天工防务技术有限公司 | 一种基于复杂约束条件的任务可行性分析方法及系统 |
CN116993129B (zh) * | 2023-09-26 | 2024-04-02 | 北京中兵天工防务技术有限公司 | 一种基于复杂约束条件的任务可行性分析方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115222271A (zh) | 基于神经网络的武器目标分配方法 | |
CN108549402B (zh) | 基于量子乌鸦群搜索机制的无人机群任务分配方法 | |
CN111240353B (zh) | 基于遗传模糊树的无人机协同空战决策方法 | |
CN110083971B (zh) | 一种基于作战推演的自爆式无人机集群作战兵力分配方法 | |
CN113009934A (zh) | 一种基于改进粒子群算法的多无人机任务动态分配方法 | |
CN110941283B (zh) | 一种基于任务需求的异构无人机集群协同最优配置方法 | |
CN112861257B (zh) | 一种基于神经网络的飞机火控系统精度敏感性分析方法 | |
CN112417710B (zh) | 基于作战环的武器装备体系贡献度评估方法 | |
CN112307613A (zh) | 基于自适应权重的无人机集群空-地对抗博弈仿真方法 | |
CN112099522A (zh) | 多无人机协同对地攻击任务规划方法及终端设备 | |
CN114841055B (zh) | 一种基于生成对抗网络的无人机集群任务预分配方法 | |
CN112364972A (zh) | 基于深度强化学习的无人战车分队火力分配方法 | |
CN109408877B (zh) | 一种反坦克导弹分队的智能射击决策方法 | |
CN115759754A (zh) | 基于动态博弈变权的超视距空战模拟目标威胁评估方法 | |
CN115903896A (zh) | 一种基于代理模型优化的多无人机路径规划方法 | |
CN111797966B (zh) | 一种基于改进羊群算法的多机协同全局目标分配方法 | |
CN116050515B (zh) | 一种基于XGBoost的平行推演多分支态势预测方法 | |
CN116090356B (zh) | 基于任务可靠性约束的异构弹群多目标任务规划方法 | |
CN116739428A (zh) | 一种主客观赋权的变权topsis炮兵火力打击目标价值分析方法 | |
CN113608546B (zh) | 量子海狮机制的无人机群任务分配方法 | |
CN115186378A (zh) | 一种空战模拟环境中的战术控制距离实时解算方法 | |
CN110782062A (zh) | 一种用于防空系统的多对多分组拦截目标分配方法及系统 | |
CN110930054A (zh) | 一种基于数据驱动的作战体系关键参数快速优化方法 | |
CN114202185A (zh) | 一种高功率微波武器协同防空的体系贡献率评估方法 | |
CN111382896B (zh) | 一种自适应混沌并行克隆选择算法的wta目标优化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |