CN113485456A

CN113485456A - 一种无人机群分布式在线自适应任务规划方法

Info

Publication number: CN113485456A
Application number: CN202110968411.XA
Authority: CN
Inventors: 刘鸿福; 陈璟; 苏炯铭; 谷学强; 项凤涛; 陈少飞; 付雅晶; 邓莎
Original assignee: National University of Defense Technology
Current assignee: National University of Defense Technology
Priority date: 2021-08-23
Filing date: 2021-08-23
Publication date: 2021-10-08
Anticipated expiration: 2041-08-23
Also published as: CN113485456B

Abstract

本发明涉及无人机群任务规划领域，其公开了一种无人机群分布式在线自适应任务规划方法，为获得全局最优的任务规划效果，提高整个无人机集群搜索和打击任务执行的效率，其通过对状态转移规则进行优化设计，设计了无人机的侦察搜索和攻击两种任务模式，无人机根据任务模式自适应地选择状态转移规则，能够使得无人机快速接近和打击目标，降低目标的存在时间。在进行目标打击任务分配时，预先考虑局部范围内无人机对目标的消耗打击情况，只召集部分无人机对目标进行打击，其余无人机仍然可以执行搜索任务，从而提高整个无人机集群的执行任务效率。

Description

一种无人机群分布式在线自适应任务规划方法

技术领域

本发明涉及无人机群任务规划领域，具体涉及一种无人机群分布式在线自适应任务规划方法。

背景技术

无人机起源于军事领域，与有人飞机相比，具有可重复使用、可回收、无人员伤亡、持续工作能力强、全寿命周期成本低等优势。由于作战环境的日益复杂，以及单架无人机的执行任务能力有限，多无人机集群协同作战将成为未来无人机作战的重要发展趋势，以实现无人机之间的能力互补，从而提升整个系统的效能。而高效、合理的任务规划方法，是发挥多无人机集群协同作战优势、实现资源有效利用的前提。

“多无人机自主任务规划方法研究(郜晨等，中国知网，硕士学位论文，2016-03-01)”中对多无人机协同搜索和协同察打的自主任务规划问题进行了研究，引用模型预测控制的思想，通过分析任务环境、任务目标建立了协同搜索任务规划的整体优化模型，在分布式模型预测控制的框架下分解成每个子系统的局部优化模型，引用粒子群算法进行求解，并与集中式以及其他分布式的搜索方法进行仿真对比分析，验证了该方法在时间消耗以及目标搜索上的优势。

在该论文中，其进行任务区域建模时提出两个优化指标：任务区域覆盖率和目标存在时间。在后续的算法实施过程中，通过更新无人机周围的信息素，以实现引导无人机朝着优化指标的方向移动。然而，其提出的状态转移公式中只考虑了任务覆盖率这一项优化指标，并没有提及目标存在时间这一优化指标，因此，该方案不能兼顾两个优化指标达到最佳的效果。

此外，该论文在发现食物源进行召集信息素更新的算法处理中，并没有预先考虑无人机对目标的打击消耗情况，对全局的无人机集群都采用相同的召集信息素更新算法，会导致全局的无人机都朝向某一个目标聚集，从而会降低无人机集群的搜索效率。

专利公布号为CN112684808A，名称为“一种不确定环境下的无人机集群智能协同察打方法”的专利申请中公开了：首先，将任务区域离散化，采用栅格法网格划分任务环境；其次，在启发式蚁群算法的基础上引入人工势场，初始化本地人工势场和信息素结构信息；当无人机对任务区域进行搜索时，根据无人机所在网格的势场力大小，选择状态转移规则，得到下一时刻的航路点，当无人机搜索到目标时，基于目标引力选择下一时刻航路点，直至目标在攻击半径之内时攻击目标；最后，无人机转移到下一栅格，根据环境探测结果更新本地人工势场，根据自身及邻居无人机状态更新本地信息素结构，直到循环结束。该发明专利将人工势场引入蚁群算法的状态转移规则，从而使得无人机快速接近目标或避障。

在上述专利文献中，当发现目标时，无人机根据势场力选择下一个节点。然而，其在人工势场所含目标引力场的目标引力公式中仅仅考虑了无人机与目标的位置，并没有考虑无人机的载弹量以及对目标的毁伤能力情况。因此，并不能达到全局最优的任务规划效果。

发明内容

本发明所要解决的技术问题是：提出一种无人机群分布式在线自适应任务规划方法，其能获得全局最优的任务规划效果，提高整个无人机集群搜索和打击任务执行的效率。

本发明解决上述技术问题采用的技术方案是：

一种无人机群分布式在线自适应任务规划方法，包括以下步骤：

A、初始化：

将任务区域进行离散量化，并进行任务区域环境建模；将集群中无人机的任务模式状态标识均初始化为侦察搜索模式；

B、完成初始化后，无人机集群在任务区域执行察打任务，集群中的各无人机自主执行以下步骤：

B1.集群中的各无人机，分别根据其当前任务模式状态标识，按照预设的自适应状态转移规则计算状态转移，并移动到新的位置；

B2.当无人机到达新的位置后，根据其当前任务模式状态标识进行任务执行：

处于侦察搜索模式的无人机：

对新的位置的周围环境进行侦察，判断是否存在目标，若发现目标，则由发现目标的无人机，根据目标弹药毁伤量、其自身载弹量及在其通信范围内无人机的任务模式状态标识和载弹量，进行无人机打击目标任务分配，并记录分配了打击任务的无人机编号；

处于攻击模式的无人机：

进行打击目标决策，判断目标是否在其攻击范围内，若在攻击范围内，则对目标进行打击，并在完成打击后将其任务模式状态标识更新为侦察搜索模式，否则，不进行打击，并且保持任务模式状态标识为攻击模式；

信息素更新策略：

发现目标的无人机，在发现目标后，根据目标信息对其信息素进行发现目标信息素更新；若集群中存在针对该目标的其他被分配打击目标任务的无人机，则经通信确认目标信息后进行发现目标信息素更新；

完成目标摧毁的无人机，在摧毁目标后，根据目标信息对其信息素进行目标消失信息素更新；若集群中存在针对该目标的其他被分配打击目标任务的无人机，则其在完成打击任务后或经通信确认目标摧毁信息后对其信息素进行目标消失信息素更新；

集群中的各无人机，根据相邻无人机的信息对其信息素进行局部环境信息素更新，并经通信对相邻无人机的信息进行更新；

所述通信，即根据预设的通信周期，当到达通信周期时，集群中的各无人机，分别与在其通信范围内的相邻无人机进行通信；所述与相邻无人机进行通信的内容，包括：当前时刻、自身位置、运动方向、新发现目标位置、目标消失信息以及分配了打击目标的无人机编号；

B3.判断当前任务区域是否已完成搜索以及打击任务，若是，则结束流程，否则，返回步骤B1继续执行。

具体的，所述将任务区域进行离散量化，并进行任务区域环境建模，具体包括：

将任务区域横向和纵向分别进行L等分和W等分，采用栅格法将任务区域离散量化为L×W个栅格，并将无人机机动性能对应于离散空间的搜索中，将无人机的运动体现为在离散栅格点中的运动；

将任务区域环境以及无人机之间的移动影响建模为蚁群的信息素，即，每个任务区域量化栅格具有相应的信息素，通过判断信息素浓度的大小决定无人机的移动，任务规划中的环境信息素结构为：

其中，

表示第i架无人机在k时刻存储的栅格(x，y)处的信息素浓度值。

具体的，所述预设的自适应状态转移规则具体包括：

对于侦察搜索模式，启发函数为：

其中，node_x，y＝0表示栅格(x，y)未被搜索过，node_x，y＝1表示栅格(x，y)已被搜索过；

对于攻击模式，启发函数为：

其中，(x_i，y_i)是无人机i当前位置的栅格坐标，(x_t，y_t)是目标当前位置的栅格坐标；d((x_i,y_i),(x_t,y_t))是坐标(x_i，y_i)和坐标(x_t，y_t)之间的距离；

状态转移公式为：

其中，α是状态转移中信息素浓度重要程度因子，β是状态转移中启发函数重要程度因子，(GRID(k+1))是指k+1时刻无人机机动范围内可以到达的备选栅格集合；τ(GRID(k+1))是备选栅格集合中栅格对应的信息素浓度值，η(GRID(k+1))是备选栅格集合中栅格对应的启发信息值；grid^*(k+1)是备选栅格中使得上述状态转移公式取得最大值对应的栅格；当存在多个栅格取得相同的最大值时，取与当前k时刻无人机所在栅格偏转角最小的栅格作为唯一解。

进一步的，所述进行无人机打击目标任务分配，采用自适应目标分配决策算法，包括：

设置环境搜索覆盖率阈值门限，根据当前搜索覆盖率与阈值门限的比较结果自适应地选择对应分配算法：若搜索覆盖率指标小于阈值门限时，根据消耗无人机最少的策略分配无人机参与打击目标任务；当搜索覆盖率大于或等于阈值门限时，根据距离优先策略分配无人机参与打击目标任务。

进一步的，所述进行无人机打击目标任务分配，采用策略包括消耗无人机最少策略，步骤如下：

设无人机i发现目标V_j，目标的弹药毁伤量为A，无人机i的载弹量为A₀，按公式A_r＝A-A₀计算目标的剩余弹药毁伤量A_r，当A_r<0或A_r＝0时，由当前无人机i独立执行打击任务，并跳出算法；

否则，由无人机i建立备选无人机集合列表{U₁,U₂,...U_N}，所述备选无人机集合列表中的无人机应满足：在无人机i的通信范围内、任务模式状态标识为侦察搜索模式且载弹量大于0，N是满足上述条件的无人机数量，并执行以下步骤：

(1)比较目标的剩余弹药毁伤量A_r与备选无人机集合列表的弹药累加量

的大小，若

则备选无人机集合列表中的所有无人机均参与打击任务，跳出算法；否则，执行步骤(2)；

(2)对备选无人机集合列表中的无人机按照载弹量由小到大进行依次排序，排序后的结果为{a₁,a₂,...a_N}，且a₁≤a₂...≤a_N；

(3)将目标的剩余弹药毁伤量A_r依次与{a₁,a₂,...a_N}集合中的值进行比较，若A_r≤a_N，则采用二分法找到{a₁,a₂,...a_N}中第一个大于或等于A_r的值，其对应的无人机即为需要参与目标打击的无人机，跳出算法；否则，执行步骤(4)；

(4)将备选无人机集合列表中m架无人机进行任意组合，所述m的初始值为2；计算组合载弹量，并进行由小到大依次排序，形成组合载弹量集合；

(5)将目标的剩余弹药毁伤量A_r与最大组合载弹量进行比较，若A_r小于或等于最大组合载弹量，则采用二分法找到组合载弹量集合中第一个大于或等于A_r的值，构成该值对应组合的m架无人机即为需要参与目标打击的无人机，跳出算法；否则执行步骤(6)；

(6)令m＝m+1,并返回步骤(4)，直至找到组合载弹量大于或等于A_r的无人机组合。

进一步的，所述进行无人机打击目标任务分配，采用策略包括距离优先策略，步骤如下：

的大小，若

(2)将备选无人机集合列表中的无人机按照与目标的距离由小到大进行排序，排序后的结果为{d₁,d₂,...d_N}，且d₁≤d₂...≤d_N，其对应的无人机载弹量为{a₁,a₂,...a_N}；

(3)将目标剩余弹药毁伤量A_r依次与排序后的无人机的载弹量进行累减，所述累减计算过程为：

根据与无人机i距离最短的无人机的载弹量计算剩余毁伤弹量A′＝A_r-a₁；若A′≤0，则跳出算法，否则，继续根据与距离排序的下一无人机载弹量计算剩余毁伤弹量A′＝A′-a₂，当A′≤0时，跳出算法，否则继续，直到A′≤0；

根据累减计算结果，确定备选无人机集合列表中的所有参与过累减计算的无人机为需要参与目标打击的无人机。

具体的，所述发现目标信息素更新，具体包括：

将其当前任务模式状态标识更新为攻击模式，并根据目标信息对其信息素进行加强，信息素更新公式为：

所述目标消失信息素更新，具体包括：

对其信息素通过下式更新：

其中，i表示无人机i，(x,y)表示任务区域的栅格坐标，且x＝1,...,W,y＝1,...,L；V_gain是目标的价值，

是目标信息素增强因子，δ是目标带来的信息素增强的影响范围因子，(x_t,y_t)是目标所在的位置的栅格坐标，d((x,y),(x_t,y_t))是坐标(x,y)和坐标(x_t,y_t)之间的距离。

具体的，所述局部环境信息素，具体包括：

(1)相邻无人机的位置预测：

假设当前时刻k，无人机i已有的无人机j的信息为：

其中，

是无人机j在k_j时刻的位置坐标，

是无人机j在k_j时刻的运动信息；

则无人机i预测无人机j在k时刻的信息为：

其中，

是无人机i预测无人机j在k时刻的位置坐标，

是无人机i预测无人机j在k时刻的运动信息；

(2)局部环境信息素更新：

无人机i的局部信息素更新公式为

其中，i表示无人机i，j表示无人机j，(x,y)表示任务区域的栅格坐标，且x＝1,...,W,y＝1,...,L；

是无人机j对无人机i造成的信息素衰减量，

为局部信息素衰减常量，

为两栅格坐标(x,y)与

之间的距离，

表示能与无人机i进行通信的无人机集合。

进一步的，在所述步骤B2中：

处于侦察搜索模式的无人机和处于攻击模式的无人机，均判断其周围环境中是否存在威胁，若发现威胁，则由发现威胁的无人机，记录威胁的位置及威胁的半径；

信息素更新策略：

发现威胁的无人机，在发现威胁后，根据威胁信息对其信息素进行发现威胁信息素更新；集群中除发现威胁无人机以外的无人机，经通信确认威胁信息后进行发现威胁信息素更新；

所述与相邻无人机进行通信的内容，包括新发现威胁位置和杀伤半径。

具体的，所述发现威胁信息素更新，具体包括：

当无人机发现新的威胁或者收到其它相邻无人机发现的威胁信息时，根据发现威胁信息对其信息素进行更新，信息素更新公式为：

其中，i表示无人机i，(x,y)表示任务区域的栅格坐标，且x＝1,...,W,y＝1,...,L；r是威胁的杀伤范围，

是威胁信息素更新常量，(x_s,y_s)是威胁所在的位置的栅格坐标，d((x，y),(x_s,y_s))是坐标(x，y)和坐标(x_s,y_s)之间的距离。

进一步的，在所述步骤B2中，其信息素更新策略包括全局信息素更新，也即：

集群中的各无人机，按照预设的全局更新周期，当到达全局更新周期时，对其信息素进行全局更新；所述全局信息素更新，采用下式更新全局信息素：

其中，i表示无人机i，(x,y)表示任务区域的栅格坐标，且x＝1,...,W,y＝1,...,L；F∈(0，1)为环境不确定因子，

是全局信息素更新常量。

本发明的有益效果是：本发明将无人机标识为侦察搜索模式和攻击模式两种任务模式，通过建立自适应状态转移规则，无人机根据任务模式自适应地选择状态转移规则，能够使得无人机快速接近和打击目标，降低目标的存在时间。根据目标弹药毁伤量、其自身载弹量及在其通信范围内无人机的任务模式状态标识和载弹量，进行无人机打击目标任务分配，选择适合的无人机分配攻击任务，考虑局部范围内无人机对目标的消耗打击情况，只召集部分无人机对目标进行打击，其余无人机仍然可以执行搜索任务，从而提高整个无人机集群的执行任务效率。因此，能够降低打击任务和侦察搜索任务之间的干扰，通过侦察搜索模式无人机，确保侦察搜索任务能够尽快完成，同时，通过攻击模式无人机快速接近和打击目标，降低目标的存在时间，进而确保获得全局最优的任务规划效果，提高整个无人机集群搜索和打击任务执行的效率。

在进一步的改进中，本发明提出的自适应目标分配算法设置了环境搜索覆盖率阈值门限参数，根据当前搜索覆盖率与阈值门限值的比较结果进行目标分配算法的自适应选择，在当前搜索覆盖率小于阈值门限值时，优先选择消耗无人机最少的目标分配算法，以提高搜索覆盖率。当搜索覆盖率大于等于阈值门限值时，优先分配距离目标较近的无人机，提高无人机移动和打击目标的效率。因此，其相对于单一的距离优先策略和消耗无人机最少策略，更能适应多样的任务场景，能够实现目标存在时间、搜索覆盖率多个指标的综合优化。

在进一步的改进中，本发明将敌方装备进一步区分为目标和威胁，其中，目标是指地面的不具备侦察能力的装备，而威胁是指具有雷达等侦察能力以及具有拦截能力的装备，将威胁对无人机的影响建模，并提出发现威胁信息素更新的更新策略，从而在对已有的信息素更新机制采用少量升级的情况下，达到无人机规避威胁的目的。

附图说明

图1是任务区域的离散量化原理示意图；

图2是本发明实施例中无人机群分布式在线自适应任务规划方法流程图；

图3是三组仿真场景下的目标存在时间对比结果图；

图4(a)和(b)分别为场景一下的利用本发明中的自适应状态转移规则和不采用自适应状态转移规则的无人机集群协同察打轨迹图；

图5(a)和(b)分别为场景二下的利用本发明中的自适应状态转移规则和不采用自适应状态转移规则的无人机集群协同察打轨迹图；

图6(a)和(b)分别为场景三下的利用本发明中的自适应状态转移规则和不采用自适应状态转移规则的无人机集群协同察打轨迹图；

图7为三组仿真场景不同打击分配策略的综合指标对比结果图；

图8为三组仿真场景不同打击分配策略的威胁区域暴露时间对比结果图；

图9(a)、(b)和(c)分别为场景一下分别采用距离优先策略、自适应目标分配策略和消耗无人机最少策略的无人机集群协同察打轨迹图；

图10(a)、(b)和(c)分别为场景二下分别采用距离优先策略、自适应目标分配策略和消耗无人机最少策略的无人机集群协同察打轨迹图；

图11(a)、(b)和(c)分别为场景三下分别采用距离优先策略、自适应目标分配策略和消耗无人机最少策略的无人机集群协同察打轨迹图。

具体实施方式

本发明旨在提出一种无人机群分布式在线自适应任务规划方法，针对由数十架无人机组成一个无人机集群对某一重点作战区域进行协同侦察和打击自主任务规划问题。将每架无人机作为一个独立的个体，分配一个独立的处理器，构建自身的问题解决方案，决策每一步的运动，无人机之间进行位置和对目标掌握情况的信息交流，实现每架无人机对系统整体状态的把握，通过自适应地选择状态转移规则、基于局部范围内无人机对目标打击情况进行的目标分配决策，获得全局最优的任务规划效果，提高整个无人机集群搜索和打击任务执行的效率，包括以下步骤：

A、初始化：

处于侦察搜索模式的无人机：

处于攻击模式的无人机：

信息素更新策略：

在初始化完成后，各无人机自主的循环执行上述步骤B，每一轮执行步骤B即执行一轮决策，为方便表述，在后续描述中，简称其为决策周期，单位为轮。所述通信周期和后述的全局更新周期均为决策周期的整数倍，也即一轮到多轮。

在本发明中，通过对状态转移规则进行优化设计，设计了无人机的搜索和攻击两种任务模式，无人机根据任务模式自适应地选择状态转移规则，能够使得无人机快速接近和打击目标，降低目标的存在时间。而在进行目标打击任务分配时，预先考虑局部范围内无人机对目标的消耗打击情况，只召集部分无人机对目标进行打击，其余无人机仍然可以执行搜索任务，从而提高整个无人机集群的执行任务效率。

所述考虑局部范围内无人机对目标的消耗打击情况，即根据目标弹药毁伤量、其自身载弹量及在其通信范围内无人机的任务模式状态标识和载弹量，进行无人机打击目标任务分配，可以是单一的消耗无人机最少的策略、距离优先策略等策略，也可以是综合各单一策略的自适应策略，如：如图所示实例中的基于消耗无人机最少的策略和距离优先策略的自适应目标分配决策，其包括：设置环境搜索覆盖率阈值门限，根据当前搜索覆盖率与阈值门限的比较结果自适应地选择对应分配算法：若搜索覆盖率指标小于阈值门限时，根据消耗无人机最少的策略分配无人机参与打击目标任务，以提高搜索覆盖率；当搜索覆盖率大于或等于阈值门限时，根据距离优先策略分配无人机参与打击目标任务，提高无人机移动和打击目标的效率。因此，其相对于单一的距离优先策略和消耗无人机最少策略，更能适应多样的任务场景，能够实现目标存在时间、搜索覆盖率多个指标的综合优化。

进一步的，在所述步骤B2中：处于侦察搜索模式的无人机和处于攻击模式的无人机，均判断其周围环境中是否存在威胁，若发现威胁，则由发现威胁的无人机，记录威胁的位置及威胁的半径；信息素更新策略：发现威胁的无人机，在发现威胁后，根据威胁信息对其信息素进行发现威胁信息素更新；集群中除发现威胁无人机以外的无人机，经通信确认威胁信息后进行发现威胁信息素更新；所述与相邻无人机进行通信的内容，包括新发现威胁位置和杀伤半径。通过将敌方装备进一步区分为目标和威胁，其中，目标是指地面的不具备侦察能力的装备，而威胁是指具有雷达等侦察能力以及具有拦截能力的装备，在发现威胁时，通过将威胁对无人机的影响建模为环境信息素的衰减，来减少计算量，从而有利于及时规避威胁。

本发明中，每架无人机在每一轮的决策中，其算法的执行，通过任务模式状态标识、目标发现、威胁发现触发相应的侦察搜索、打击决策和威胁发现的处理流程，在执行顺序上侦察搜索、打击决策和威胁发现并不是固定的，可以是顺序的也可以是并行的，比如同时执行侦察搜索和威胁发现。

在如图所示的实例中，其流程图如2所示，其采用顺序处理，其中，执行侦察搜索任务的无人机，到达位置后进行搜索目标和威胁，首先判断是否发现目标，发现目标则转入目标发现流程，发现目标的无人机立即由执行侦察搜索任务变更为攻击任务，完成发现目标信息素更新，并进行打击目标决策；未发现目标则跳过目标发现流程，并通过任务模式状态标识跳过打击目标决策流程，进入后续发现威胁流程。

除发现目标的无人机外，其他无人机照常执行侦察搜索任务，包括被分配打击任务的无人机。被分配打击任务的无人机，其首先是执行侦察搜索任务的无人机，直到到达通信周期，被分配打击任务的无人机，经通信确认目标信息后进行发现目标信息素更新，由执行侦察搜索任务变更为攻击任务，并在下一轮开始执行对目标的打击目标决策，在执行打击任务时，其通过任务模式状态标识跳过搜索目标流程，直接由打击目标决策开始执行。

针对执行两类任务的无人机，在完成各自的侦察搜索或打击决策处理后，则进入统一的流程，首先判断是否发现威胁，发现威胁则转入威胁发现流程，然后进行信息素的各种更新，最后判断任务是否执行完成，若未完成则进入下一轮。

需要说明的是，本发明中完成搜索是指当前区域的栅格均被搜索到，完成打击任务是指搜索到的目标均被摧毁、或者所有无人机携带的弹药已全部用完。

该处理顺序的优势在于，首先，能将两类无人机的多种流程统一到一个处理循环中；其次，发现目标的无人机能在本轮立即转入攻击模式，极端情况下，若目标在发现其的无人机攻击范围内，且其弹药毁伤量小于发现其的无人机载弹量，则发现该目标的无人机能在本轮立即完成对其的摧毁，实现高效打击且完全避免对其他无人机所执行任务的干扰；其三，发现威胁的无人机能在本轮立即更新其信息素，实现对威胁的规避。

本发明的信息素更新策略中，发现目标信息素更新、目标消失信息素更新和发现威胁信息素更新是触发类更新，也即只有在满足条件时进行更新；局部环境信息素更新和全局信息素更新则是定期更新，其中，局部环境信息素更新为每轮更新，全局信息素更新为按照其设定周期进行定期更新。因此，各项信息素更新的顺序也并非一成不变的。

上述的“发现目标的无人机，在发现目标后”，可理解为从发现目标到本轮决策周期执行完成这一时间区间，并在这一时间区间内完成发现目标信息素更新。因此，其可以是如实例中所示的，发现目标的无人机，在发现目标时，立即进行发现目标信息素更新；也可以是，在整体流程，也即在侦察搜索、打击决策和威胁发现这一执行顺序不变的前提下，将发现目标信息素更新，统一到执行完毕侦察搜索、打击决策和威胁发现等任务后，通过统一的信息素更新流程进行处理，由于信息处理速度极快，其更新的滞后性影响极小。为方便描述，后述将统一的信息素更新流程简称为局部信息素更新。但将发现目标信息素更新统一到局部信息素更新，其最大劣势在于，对于发现目标的无人机，由于其发现目标信息素更新将在本轮打击目标决策之后，因此，其将错过本轮的打击目标决策，而只能在下一轮对目标进行打击目标决策，有可能延长了目标的存在时间。

上述的“完成目标摧毁的无人机，在摧毁目标后”，同理，但其并不存在发现目标后错过本轮打击的问题，因此，针对目标消失信息素更新，就将其纳入统一的局部信息素更新流程中，以简化流程。

而上述的“发现威胁的无人机，在发现威胁后”，也同理，但考虑到任务执行过程中，无人机的动态属性，也即虽然处理过程看似存在停顿，但实际上，在极短的时间间隔内，无人机也并非固定在一个位置等待决策完成，通常情况下，更新的滞后性影响极小，但为了更好的规避威胁，避免任何滞后可能导致影响的不可控，如实例所示，其最优的，同发现目标的处理方式，采用在发现威胁时，立即进行发现威胁信息素更新的方式，而非纳入统一的局部信息素更新流程中。

局部环境信息素，是基于相邻无人机之间任务完成情况的相互影响，对信息素进行的衰减。考虑到无人机的动态属性，为了尽可能的保证本轮决策中，局部环境信息素更新能尽可能的贴近各无人机在本轮的最终位置，局部环境信息素更新，设置于通信周期之后，并在通过通信触发的触发类更新完成后，且纳入统一的局部信息素更新流程中。

全局信息素更新的设置，主要是为了应对可能存在的环境不确定性。也即，某一局部区域虽然被搜索过，但是随着时间的推移仍然有目标出现的可能。因此，需要固定一段时间对信息素通过全局更新进行增强。全局信息素更新周期同样是决策周期的整数倍，其值越大，规划算法适应快速变化的环境不确定性越差，其值越小，规划算法更容易适应快速变化的环境。全局信息素更新为按照其设定周期进行定期更新，为了避免其对上述流程的干扰，最好的，如图2所示，其设置在局部信息素更新之后进行。

本发明中，由于通信周期是决策周期的整数倍，通信周期越大，无人机之间的通信资源开销越小，但是无人机之间的信息交互时延越大，会导致信息获取不及时，影响无人机的规划决策；通信周期越小，无人机之间的信息交互时延越小，能够及时获取信息有利于进行规划决策，但是通信资源开销越大。最优的，是在无人机允许的通信开销范围内，越小越好。

具体的，在如图2所示的实例中，包括以下执行步骤：

一、初始化

在无人机集群执行规划任务之前，首先要将任务区域进行离散量化，并进行任务区域环境建模；将集群中无人机的任务模式状态标识均初始化为侦察搜索模式，具体包括：

假设无人机是在二维平面内运动，将任务区域离散量化为L×W个栅格，并将无人机机动性能对应于离散空间的搜索中，将无人机的运动体现为在离散栅格点中的运动。设无人机的探测范围在任务区域平面上的投影半径为R，假设目标出现在无人机的探测范围内便可以被无人机发现，无人机最大转角为

无人机的速度为v，在单位时间内的位移为d，则无人机的探测范围如图1所示，在半径为R的圆以内的栅格可以被探测到，图中灰色栅格表示无人机在机动约束下的下一时刻的可能位置。

在每个决策时刻，无人机在机动约束和环境影响下决策下一时刻的位置。将任务区域环境以及无人机之间的移动影响建模为蚁群的信息素。即，每个任务区域量化栅格具有相应的信息素，通过判断信息素浓度的大小决定无人机的移动。协同侦察/打击任务规划中的信息素结构为：

其中，

表示第i架无人机在k时刻存储的栅格(x，y)处的信息素浓度值。在本实例的仿真实验中，每架无人机的L×W个栅格的信息素浓度初始值均相等，并按通常的信息素浓度取值方式随机生成。

同时，无人机集群需要完成侦察搜索和攻击两种作战任务，因此针对这两类任务设计了无人机的侦察和打击两种状态。在初始化时，将集群中无人机的任务模式状态标识均初始化为侦察搜索模式。

二、完成初始化后，无人机集群在任务区域执行察打任务，集群中的各无人机自主执行以下步骤：

S1.集群中的各无人机，分别根据其当前任务模式状态标识，按照预设的自适应状态转移规则计算状态转移，并移动到新的位置。

为了提高搜索覆盖率以及尽快消灭目标的优化指标，本发明设计了一种根据无人机的不同状态进行自适应地转换启发信息的算法：

针对没有分配打击任务的无人机，它们都属于侦察搜索模式。增加启发信息的目的是提高其对环境的搜索覆盖率。启发函数定义为当前k时刻的环境覆盖率：

式中，node_x,y＝0表示栅格(x,y)未被搜索过，node_x，y＝1表示栅格(x,y)已被搜索过。

针对分配了打击任务处于攻击模式的无人机，为了缩短目标生存时间，提高无人机打击效率，考虑引入无人机与目标的距离作为启发信息改进无人机状态转移规则。启发函数定义为：

其中，(x_i,y_i)是无人机i当前位置的栅格坐标，(x_t,y_t)是目标t当前位置的栅格坐标；d((x_i,y_i),(x_t,y_t))是坐标(x_i,y_i)和坐标(x_t,y_t)之间的距离。

状态转移公式为：

其中，α是状态转移中信息素浓度重要程度因子，其反映了无人机在运动过程中所积累的信息素浓度，在指导无人机群搜索中的相对重要程度，其值越大，无人机选择信息素浓度高的路径越大，搜索的随机性减弱，而当其取值过小时，则易使无人机的搜索过早陷入局部最优。β是状态转移中启发函数重要程度因子，其反映了启发信息，在指导无人机搜索过程中的相对重要程度，其值越大，则无人机在某个局部点上选择局部最短路径的可能性越大，虽然这时算法的收敛速度得以加快，但无人机群搜索最优路径的随机性减弱，易陷入局部最优。α和β对算法性能的影响及在实际应用中的选择，可通过仿真实验加以分析和确定，其最佳参数取值配置通常为：α＝1,β＝5。

(GRID(k+1))是指k+1时刻无人机机动范围内可以到达的备选栅格集合；τ(GRID(k+1))是备选栅格集合中栅格对应的信息素浓度值，η(GRID(k+1))是备选栅格集合中栅格对应的启发信息值；grid^*(k+1)是备选栅格中使得上述状态转移公式取得最大值对应的栅格；当存在多个栅格取得相同的最大值时，取与当前k时刻无人机所在栅格偏转角最小的栅格作为唯一解。其中的信息素浓度是取自无人机的信息素结构。

S2.当无人机到达新的位置后，根据其当前任务模式状态标识进行任务执行，其中，侦察搜索模式的无人机，对新位置的周围环境进行侦察监视，判断是否发现目标，若是，则执行步骤S3，否则，执行步骤S5；攻击模式的无人机跳转执行步骤S5。

S3.由发现目标的无人机，根据自适应目标分配决策算法进行无人机打击目标任务分配，并记录分配了打击任务的无人机编号。

本步骤中，自适应目标分配的模型可以描述为：无人机i发现目标V_j，目标的弹药毁伤量为A，无人机i的载弹量为A₀，无人机i若能独立完成打击任务则独立完成，若因弹药量有限无法独自摧毁目标，则召集其它相邻无人机对目标进行协同打击，由无人机i建立备选无人机集合列表{U₁,U₂,…U_N}，所述备选无人机集合列表中的无人机应满足：在无人机i的通信范围内、任务模式状态标识为侦察搜索模式且载弹量大于0，N是满足上述条件的无人机数量。在本发明中，所述相邻无人机均表示为在该无人机通信范围内的其他无人机。

具体的，在自适应目标分配算法中，设置环境搜索覆盖率阈值门限，根据当前搜索覆盖率与阈值门限的比较结果自适应地选择对应分配算法。即，若搜索覆盖率指标小于阈值门限时，根据消耗无人机最少的策略分配无人机参与打击目标任务，以提高覆盖率；当搜索覆盖率大于或等于阈值门限时，根据距离优先策略分配无人机参与打击目标任务，以提高攻击效率。通过对算法进行仿真，可得到覆盖率随时间的变化曲线，覆盖率取值40％-50％时，曲线斜率趋于平缓，即随着时间的增长，曲线斜率降低，因此，优选的，覆盖率阈值门限P_s取值为40％-50％。

1)消耗无人机最少策略包括：

Step1:设无人机i发现目标V_j，目标的弹药毁伤量为A，无人机i的载弹量为A₀，按公式A_r＝A-A₀计算目标的剩余弹药毁伤量A_r，当A_r<0或A_r＝0时，由当前无人机i独立执行打击任务，并跳出算法；否则，由无人机i建立备选无人机集合列表{U₁，U₂,…U_N}，并执行步骤Step2；

Step2：比较目标的剩余弹药毁伤量A_r与备选无人机集合列表的弹药累加量

的大小，若

则备选无人机集合列表中的所有无人机均参与打击任务，跳出算法；否则，执行步骤Step3；

Step3：对备选无人机集合列表中的无人机按照载弹量由小到大进行依次排序，排序后的结果为{a₁，a₂，...a_N}，且a₁≤a₂...≤a_N；

Step4：将目标的剩余弹药毁伤量A_r依次与{a₁，a₂，...a_N}集合中的值进行比较，若A_r≤a_N，则采用二分法找到{a₁，a₂，...a_N}中第一个大于或等于A_r的值，其对应的无人机即为需要参与目标打击的无人机，跳出算法；否则，执行步骤Step5；

Step5：将备选无人机集合列表中m架无人机进行任意组合，所述m的初始值为2；计算组合载弹量，并进行由小到大依次排序，形成组合载弹量集合；

Step6：将目标的剩余弹药毁伤量A_r与最大组合载弹量进行比较，若A_r小于或等于最大组合载弹量，则采用二分法找到组合载弹量集合中第一个大于或等于A_r的值，构成该值对应组合的m架无人机即为需要参与目标打击的无人机，跳出算法；否则执行步骤Step7；

Step7：令m＝m+1，并返回步骤Step5，直至找到组合载弹量大于或等于A_r的无人机组合。

2)距离优先策略包括：

Step1：设无人机i发现目标V_j，目标的弹药毁伤量为A，无人机i的载弹量为A₀，按公式A_r＝A-A₀计算目标的剩余弹药毁伤量A_r，当A_r<0或A_r＝0时，由当前无人机i独立执行打击任务，并跳出算法；否则，由无人机i建立备选无人机集合列表{U₁,U₂,...U_N}，并执行步骤Step2；

的大小，若

Step3：将备选无人机集合列表中的无人机按照与目标的距离由小到大进行排序，排序后的结果为{d₁,d₂，...d_N}，且d₁≤d₂...≤d_N，其对应的无人机载弹量为{a₁,a₂,...a_N}；

Step4：将目标剩余弹药毁伤量A_r依次与排序后的无人机的载弹量进行累减。所述累减计算过程为：根据与无人机i距离最短的无人机的载弹量计算剩余毁伤弹量A′＝A_r-a₁；若A′≤0，则跳出算法，否则，继续根据与距离排序的下一无人机载弹量计算剩余毁伤弹量A′＝A′-a₂，当A′≤0时，跳出算法，否则继续，直到A′≤0。根据累减计算结果，确定备选无人机集合列表中的所有参与过累减计算的无人机为需要参与目标打击的无人机。

如上所述，目标的弹药毁伤量与无人机的载弹量共同作用，主要影响自适应目标分配与决策，在后述的仿真实验场景中，目标的弹药毁伤量随机取值为3或4，无人机的载弹量随机取值是1或2。

S4.进行发现目标信息素更新；

本步骤中，仅针对发现目标的无人机的信息素，通过发现目标信息素更新进行加强，以引导其对目标进行打击。而针对其他被分配了打击任务的无人机，则由发现目标的无人机经步骤S3记录分配打击任务的无人机编号，并在到达通信周期时，将新发现目标位置等目标信息发送给其他被分配了打击任务的无人机，其他被分配了打击任务的无人机在收到目标信息后，进行发现目标信息素更新，以引导其对目标进行打击。也即，发现目标的无人机，在发现目标后，立即转变为攻击模式；而其他被分配了打击任务的无人机，则在通信周期后，转变为攻击模式。

本步骤，具体包括：

将发现目标无人机的当前任务模式状态标识更新为攻击模式，并根据目标信息对其信息素进行加强，信息素更新公式为：

其中，i表示无人机i，(x，y)表示任务区域的栅格坐标，且x＝1，...，W，y＝1，...，L；V_gain是目标的价值，

是目标信息素增强因子，δ是目标带来的信息素增强的影响范围因子，(x_t，y_t)是目标所在的位置的栅格坐标，d((x，y)，(x_t，y_t))是坐标(x，y)和坐标(x_t，y_t)之间的距离。目标价值与实验的设定有关，在后述的仿真实验场景中，目标价值取值为1。

目标信息素增强因子

表示目标对信息素的加强值，其值越大，则目标对信息素加强的最大值越高，对无人机的吸引作用更大；反之，则吸引作用越小。目标信息素增强因子的取值，受信息素浓度值的标定影响，通常为与信息素浓度初始值近似，并通过仿真实验进行修订。在实施例中，目标信息素增强因子

与全局信息素更新常量

相同。在后述的仿真实验场景中，

和

取值均为100。

δ是目标带来的信息素增强的影响范围因子，表征目标对信息素加强的影响范围，其值越大，则目标信息素加强的范围越大，对无人机群的吸引范围越广；反之，加强范围越小，对无人机群的吸引范围越小。具体的取值可以参照通常信息素浓度计算的标定范围，并通过仿真实验进行修订，在后述的仿真实验场景中，δ取值90。

S5.根据其当前任务模式状态标识进行任务执行，其中，侦察搜索模式的无人机跳转执行步骤S6；攻击模式的无人机，则进行打击目标决策，判断目标是否其在攻击范围内，若在攻击范围内，则对目标进行打击，并在完成打击后将其任务模式状态标识更新为侦察搜索模式，否则，不进行打击，并且保持任务模式状态标识为攻击模式。

S6.无论是攻击模式的无人机，还是侦察搜索模式的无人机，均执行本步骤，判断其周围环境中是否存在威胁，若发现威胁，则由发现威胁的无人机，记录威胁的位置及威胁的半径，然后进入步骤S7，否则，直接进入步骤S8；

S7.发现威胁的无人机，在发现威胁时，根据威胁信息对其信息素进行发现威胁信息素更新，具体包括：

当无人机发现新的威胁时，根据发现威胁信息对其信息素进行更新，信息素更新公式为：

其中，i表示无人机i，(x，y)表示任务区域的栅格坐标，且x＝1，...，W，y＝1，...,L；r是威胁的杀伤范围，

是威胁信息素更新常量，(x_s，y_s)是威胁所在的位置的栅格坐标，d((x，y)，(x_s，y_s))是坐标(x，y)和坐标(x_s，y_s)之间的距离。

上述

表征威胁对信息素减弱的数值，其值越大，则威胁对信息素减弱的最大值越高，对无人机的排斥作用更大；反之，则排斥作用越小。但发现目标时，将对栅格信息素进行加强，因此，为了能够达到比较理想的威胁规避效果，其发现威胁的信息素更新需减弱几倍于发现目标的信息素浓度增加量，因此，威胁信息素更新常量

取值通常是目标信息素增强因子的数倍，并可通过实验进行迭代优化。在后述的仿真实验场景中，

取值300。

针对集群中的其他无人机，则在到达通信周期时，由发现威胁的无人机将其发现威胁位置和杀伤半径等威胁信息发送给其他无人机，其他无人机在收到威胁信息后，进行发现威胁信息素更新，以引导其对威胁进行规避。也即，发现威胁的无人机，在发现威胁后，立即进行处理，并在之后的移动中进行规避；集群中其他的无人机，经通信确认威胁信息后进行发现威胁信息素更新，在通信周期下一轮的移动中进行规避。

根据上述公式，无人机在任务区域中移动时，当其位置超过威胁的杀伤范围r时，不会受到威胁，因此，超过威胁的杀伤范围r的格栅不进行信息素的衰减；当其位置在杀伤范围内时，格栅位置与威胁位置的距离d越大受到的威胁越小，信息素衰减越小，反之，受到的威胁越大，信息素衰减越大。

S8.当通信周期到来时，与相邻无人机进行通信。

本步骤中，所述通信，即根据预设的通信周期，当到达通信周期时，集群中的各无人机，分别与在其通信范围内的相邻无人机进行通信；所述与相邻无人机进行通信的内容，包括：当前时刻、自身位置、运动方向、新发现目标位置、目标消失信息以、分配了打击目标的无人机编号、新发现威胁位置和杀伤半径。其也会收到相邻无人机发送来的位置信息以及掌握的相关信息。

S9.局部信息素更新，具体包括：

1)集群中其他被分配打击目标任务的无人机，经通信确认目标信息后进行发现目标信息素更新，更新公式同步骤S4。

2)完成目标摧毁的无人机，根据目标信息对其信息素进行目标消失信息素更新；若集群中存在针对该目标的其他被分配打击目标任务的无人机，则其在经通信确认目标摧毁信息后对其信息素进行目标消失信息素更新，更新公式如下：

3)集群中除发现威胁无人机以外的无人机，经通信确认威胁信息后进行发现威胁信息素更新，更新公式同步骤S7。

4)在完成上述的信息素更新后，集群中的各无人机，根据相邻无人机的信息对其信息素进行局部环境信息素更新，并经通信对相邻无人机的信息进行更新。

也即，当无人机完成一次状态转移后，需要根据自身和其他无人机的空间分布情况进行信息素更新，降低已经搜索过的区域的信息素浓度，避免过多地对某块区域进行重复搜索。具体的，所述局部环境信息素，具体包括：

(1)相邻无人机的位置预测：

假设当前时刻k，无人机i已有的无人机j的信息为：

其中，

是无人机j在k_j时刻的位置，

是无人机j在k_j时刻的运动信息；则无人机i预测无人机j在k时刻的信息为：

其中，

是无人机i预测无人机j在k时刻的位置，

是无人机i预测无人机j在k时刻的运动信息；

(2)局部环境信息素更新：

无人机i的局部信息素更新公式为

是无人机j对无人机i造成的信息素衰减量，

为局部信息素衰减常量，

为两栅格坐标(x，y)与

之间的距离，

表示能与无人机i进行通信的无人机集合。

上述

表征无人机互相之间信息素减弱的数值，其值越大，则无人机之间信息素减弱的最大值越高，对无人机之间的排斥作用越大；反之，则排斥作用越小。考虑到上述无人机信息素减弱量，受到其所有相邻无人机的影响，会产生叠加效果，也即当相邻无人机数量较多时，叠加影响将倍增，因此，局部信息素衰减常量

通常选择比较小的取值，并通过仿真实验进行修订。在后述的仿真实验场景中，

取值1。

在后述的仿真实验中，由于每进行一轮决策均进行通信，因此，无人机i并不对无人机j的位置和运动信息进行预测，而直接采用经通信获得的位置和运动信息，也即，

是无人机i经通信获取的无人机j在k时刻的位置，

是无人机i经通信获取的无人机j在k时刻的运动信息。当然，在每进行一轮决策均进行通信的前提下，也可以采用先预测后同步的方式进行。

S10.全局信息素更新，具体包括：

集群中的各无人机，按照预设的全局更新周期，当到达全局更新周期时，对其进行全局信息素更新。

由于环境的不确定性，某一局部区域虽然被搜索过，但是随着时间的推移仍然有目标出现的可能。因此需要固定一段时间周期对信息素进行全局增强，更新公式为

其中，i表示无人机i，(x,y)表示任务区域的栅格坐标，且x＝1,...,W，y＝1,...,L；F∈(0,1)为环境不确定因子，

是全局信息素更新常量。

S11.判断当前区域是否已完成搜索以及打击任务，若是，则结束流程，否则，返回步骤S1继续执行。

实验验证：

本实验是对本发明中的自适应任务规划方案的有效性验证实验，基于MicrosoftVisual Studio 2010进行。

实验场景设定：

无人机任务区域为50km×50km，离散化为100×100的栅格网络；在任务区域内共分布了5个未知目标和7个未知威胁；假设有12架无人机，初始位置和速度方向随机生成，无人机的速度为100m/s，即每5秒移动1个栅格距离，无人机探测半径R＝3km，攻击半径为R_a＝1km，最大偏转角60°。

因无人机的速度为100m/s，为了让无人机每一轮的移动距离为整数个栅格，实验中设定每一轮决策周期是5s。通信周期也是5s，即每进行一轮决策均进行通信。全局信息素更新周期取值是250s，即间隔50轮决策周期进行一次全局信息素更新。

其他参数的设定如表1所示。

表1系统参数说明及取值

1、验证自适应状态转移规则：

基于上述设定，随机生成三组无人机与目标的位置场景，三组场景的差别主要体现在于：无人机位置不同，目标位置不同。具体可参见附图4、5、6所示，图中灰色圆形区域表示威胁区域，三角形表示目标，圆点表示各无人机的初始位置。

采用不同的状态转移规则、相同的目标分配策略，进行自适应状态转移规则的有效性验证。其中，目标分配策略均为自适应目标分配决策算法，设置的环境搜索覆盖率阈值门限均取值为50％；状态转移规则，则分为根据搜索和攻击两种任务模式进行自适应地选择状态转移规则与不采用自适应状态转移规则两种。所述不采用自适应状态转移规则，是指不区分无人机的任务模式，固定使用搜索模式的启发函数参与状态转移公式的计算。

本部分实验，自适应地选择状态转移规则方案和不采用自适应状态转移规则的方案的目标存在总时间对比结果如图3所示。从仿真对比结果可知，采用自适应地选择状态转移规则可以达到降低目标的存在时间的效果。

两种方案的无人机集群协同察打轨迹图，如图4、5、6所示，各图中，图(a)均为采用自适应地选择状态转移，图(b)均为不采用自适应状态转移规则。可以看出，相对于不采用自适应状态转移规则的对比方案，本发明能够采用更少的路径完成搜索和打击，从而更加高效。

2、验证自适应目标分配策略：

基于上述设定，随机生成三组无人机与目标的位置场景，基于自适应状态转移规则，对自适应目标分配策略与单一的距离优先策略以及消耗无人机最少策略进行对比，用于验证自适应目标分配策略。

三组场景的差别主要体现在于：无人机位置不同，目标位置不同。具体可参见附图9、10、11所示，图中灰色圆形区域表示威胁区域，三角形表示目标，圆点表示各无人机的初始位置。其次，自适应目标分配决策算法中设置的环境搜索覆盖率阈值门限，场景一取50％，场景二和三取40％。

根据实验结果分别统计自适应目标分配策略、单一的距离优先策略以及消耗无人机最少策略的归一化目标存在总时间和搜索覆盖率的加权综合指标，结果如图7所示；并统计三组仿真场景不同策略的威胁区域暴露时间，结果如图8所示。

上述归一化目标存在总时间和搜索覆盖率的加权综合指标I的计算过程为：由归一化目标存在时间T_normal和剩余未搜索覆盖率1-P的加权综合指标I＝T_normal+(1-P)。

从上述仿真对比结果可知，本发明提出的自适应目标分配策略明显优于单一的距离优先策略和消耗无人机最少策略，并且规避威胁效果也最优。

三组仿真场景下，各方案的无人机集群协同察打轨迹图如图9、10、11所示，各图中，图(a)均为距离优先策略、图(b)均为自适应目标分配策略、图(c)均为消耗无人机最少策略。

综上，通过对无人机和目标的不同位置以及不同的威胁数量进行仿真实验。根据两部分验证的仿真实验结果可得：

(1)、本发明方案中的无人机群分布式在线自适应选择状态转移规则，能够显著降低目标存在时间。

(2)、在归一化目标存在总时间和搜索覆盖率的加权综合指标上，自适应目标分配策略明显优于单一的距离优先策略和消耗无人机最少策略。

(3)、在实现大规模无人机集群协同察打的同时，也能够完成了无人机在线避障以及打击目标，有效地执行了不确定环境下的协同侦察打击任务。

Claims

1.一种无人机群分布式在线自适应任务规划方法，包括以下步骤：

A、初始化：

处于侦察搜索模式的无人机：

处于攻击模式的无人机：

信息素更新策略：

2.如权利要求1所述的一种无人机群分布式在线自适应任务规划方法，其特征在于，

所述将任务区域进行离散量化，并进行任务区域环境建模，具体包括：

其中，

表示第i架无人机在k时刻存储的栅格(x,y)处的信息素浓度值。

3.如权利要求1所述的一种无人机群分布式在线自适应任务规划方法，其特征在于，

所述预设的自适应状态转移规则具体包括：

对于侦察搜索模式，启发函数为：

其中，node_x,y＝0表示栅格(x,y)未被搜索过，node_x,y＝1表示栅格(x,y)已被搜索过；

对于攻击模式，启发函数为：

其中，(x_i,y_i)是无人机i当前位置的栅格坐标，(x_t,y_t)是目标当前位置的栅格坐标；d((x_i,y_i),(x_t,y_t))是坐标(x_i,y_i)和坐标(x_t,y_t)之间的距离；

状态转移公式为：

4.如权利要求1所述的一种无人机群分布式在线自适应任务规划方法，其特征在于，

所述进行无人机打击目标任务分配，采用自适应目标分配决策算法，包括：

5.如权利要求1或4所述的一种无人机群分布式在线自适应任务规划方法，其特征在于，

所述进行无人机打击目标任务分配，采用策略包括消耗无人机最少策略，步骤如下：

的大小，若

6.如权利要求1或4所述的一种无人机群分布式在线自适应任务规划方法，其特征在于，

所述进行无人机打击目标任务分配，采用策略包括距离优先策略，步骤如下：

的大小，若

7.如权利要求1所述的一种无人机群分布式在线自适应任务规划方法，其特征在于，

所述发现目标信息素更新，具体包括：

所述目标消失信息素更新，具体包括：

对其信息素通过下式更新：

8.如权利要求1所述的一种无人机群分布式在线自适应任务规划方法，其特征在于，

所述局部环境信息素，具体包括：

(1)相邻无人机的位置预测：

假设当前时刻k，无人机i已有的无人机j的信息为：

其中，

是无人机j在k_j时刻的位置坐标，

是无人机j在k_j时刻的运动信息；

则无人机i预测无人机j在k时刻的信息为：

其中，

是无人机i预测无人机j在k时刻的位置坐标，

是无人机i预测无人机j在k时刻的运动信息；

(2)局部环境信息素更新：

无人机i的局部信息素更新公式为

是无人机j对无人机i造成的信息素衰减量，

为局部信息素衰减常量，

为两栅格坐标(x,y)与

之间的距离，

表示能与无人机i进行通信的无人机集合。

9.如权利要求1所述的一种无人机群分布式在线自适应任务规划方法，其特征在于，

在所述步骤B2中：

信息素更新策略：

10.如权利要求9所述的一种无人机群分布式在线自适应任务规划方法，其特征在于，

所述发现威胁信息素更新，具体包括：

d⁴((x,y),(x_s,y_s))≤r⁴

是威胁信息素更新常量，(x_s,y_s)是威胁所在的位置的栅格坐标，d((x,y),(x_s,y_s))是坐标(x,y)和坐标(x_s,y_s)之间的距离。

11.如权利要求1所述的一种无人机群分布式在线自适应任务规划方法，其特征在于，

在所述步骤B2中，其信息素更新策略包括全局信息素更新，也即：

其中，i表示无人机i，(x,y)表示任务区域的栅格坐标，且x＝1,...,W,y＝1,...,L；F∈(0,1)为环境不确定因子，

是全局信息素更新常量。