CN115237151A

CN115237151A - 一种基于信息素启发的群无人机多运动目标搜索方法

Info

Publication number: CN115237151A
Application number: CN202210522719.6A
Authority: CN
Inventors: 张红强; 王茂; 吴亮红; 周少武; 王汐; 边晓荟; 刘朝华; 陈磊
Original assignee: Hunan University of Science and Technology
Current assignee: Hunan University of Science and Technology
Priority date: 2022-05-13
Filing date: 2022-05-13
Publication date: 2022-10-25

Abstract

本发明公开了一种基于信息素启发的群无人机多运动目标搜索方法，包括以下步骤：建立群无人机多动态目标搜索模型；基于距离的动态任务分工，得到无人机对动态目标的搜索状态；判断无人机搜索状态，若无人机处于漫游状态，则进行基于置信区域信息素的漫游搜索，若处于协同搜索状态，则进行基于概率限制粒子群算法的协同搜索。本发明以动态目标置信区域为基础，引入置信信息素，使得无人机更快地覆盖更多区域，以此提高漫游状态无人机目标探测速率；针对动态目标，引入全局最优与个体历史最优的概率值，并改善个体历史最优的计算方式，将目标信号模型与无人机个体之间的距离综合考虑，设置PSO的适应度函数，提高了搜索效率。

Description

一种基于信息素启发的群无人机多运动目标搜索方法

技术领域

本发明涉及一种无人机搜索方法，特别涉及一种基于信息素启发的群无人机多运动目标搜索方法。

背景技术

无人机在现代的民用、军用领域均发挥着重要作用，被广泛用于灾后搜救、野外火灾监测、敌情侦察等。无人机在众多的应用领域中，都包含目标搜索的过程，如在灾害现场对生还者的搜寻、在野外对火源的排查、战场中对敌方位置的侦察。目标搜索往往要求高效率以减少损失或获得最大收益，而群无人机在搜索效率、灵活性、可扩展性及鲁棒性等方面体现出优越的性能。群无人机是一种群机器人系统，对其研究已成为自动化技术领域发展的重要方向。

群无人机启发于自然界社会型生物的群体行为，该无人系统无控制中心，是一种分布式系统。相比于有控制中心的系统，分布式系统体现出计算量小、可靠性高等优点。在现有文献中，目标搜索问题的模型主要有：概率函数模型、目标信号模型。概率函数模型主要用于搜索丢失的目标，传感器通常被建模为具有两种状态的二元变量：“检测到”或“未检测到”，对应目标搜索状态即为“搜索到目标”或“未搜索到目标”，但在某些目标搜索情景中可能无法确定目标最终丢失位置，且在搜索过程中可能传感器检测到目标信号但无法确定目标具体位置，需要进一步搜索。在目标信号模型的目标搜索中，主要研究静态目标搜索，且目标信号模型是假设搜索主体可直接根据目标信号区分目标为前提，这进一步限制了其适用范围。

发明内容

为了解决上述技术问题，本发明提供一种算法简单、搜索效率高的基于信息素启发的群无人机多运动目标搜索方法。

本发明解决上述问题的技术方案是：一种基于信息素启发的群无人机多运动目标搜索方法，包括以下步骤：

步骤一：建立群无人机多动态目标搜索模型；

步骤二：对无人机进行基于距离的动态任务分工，得到无人机对动态目标的搜索状态；

步骤三：判断无人机对动态目标的搜索状态，若无人机处于漫游状态，则进入步骤四，若处于协同搜索状态，则进入步骤五；

步骤四：进行基于置信区域信息素的漫游搜索；

步骤五：进行基于概率限制粒子群算法的协同搜索。

本发明的有益效果在于：

1、本发明改善目标信号模型，假设无人机无法区分不同目标的信号，以适应现阶段传感器发展，并以此为基础改进无人机的协作分组方法，从而更广泛地适应于现有传感器的功能，使得实际应用中的目标信号探测过程更容易实现。

2、本发明以动态目标置信区域为基础，引入置信信息素，使得无人机更快地覆盖更多区域，以此提高漫游状态无人机目标探测速率。

3、本发明针对动态目标，在PSO的基础上引入全局最优与个体历史最优的概率值，并改善个体历史最优的计算方式，将目标信号模型与无人机个体之间的距离综合考虑，设置PSO 的适应度函数，能够防止搜索过程中无人机陷入局部最优，进而提高无人机搜索目标的效率。

4、本发明借鉴以往工作中提出的边界扫描避障策略，将其离散化，使其适应于栅格地图，从而保持避障的高效率及搜索广度。

附图说明

图1为本发明的流程图。

图2为本发明建立的群无人机多动态目标搜索模型示意图。

图3为无人机状态迁移的示意图。

图4为置信区域的示意图，其中(a)表示单一位置对应置信区域，(b)表示运动轨迹对应的置信区域。

图5为最大置信区域示意图，其中(a)表示单个无人机最大置信区域，(b)表示多个无人机最大置信区域。

图6为最远可达栅格与最近不可探测栅格的对应关系图。

图7为实施例中搜索环境与搜索对象初始化的示意图。

图8为实施例中群无人机视角中的置信区域信息素示意图。

图9为实施例中某个无人机首次探测到目标信号的示意图。

图10为实施例中群无人机首次感知到障碍物的示意图。

图11为实施例中5个无人机构成的子联盟搜索到一个目标的示意图。

图12为实施例中5个无人机构成子联盟，无人机进入协同搜索状态的示意图。

图13为实施例中第6个无人机加入该子联盟并进入协同搜索状态的示意图。

图14为实施例中，搜索完该局部区域的目标后，无人机解散子联盟分散运动离开该区域的示意图。

图15为实施例中，群无人机搜索任务完成的示意图。

图16为实施例中目标搜索过程中所有目标及所有无人机的运动轨迹示意图。

图17为搜索性能对比图。

具体实施方式

下面结合附图和实施例对本发明作进一步的说明。

如图1所示，一种基于信息素启发的群无人机多运动目标搜索方法，包括以下步骤：

步骤一：建立群无人机多动态目标搜索模型。

建立的群无人机多动态目标搜索模型包括：

任务环境：现实中无人机处于三维空间中，这使得无人机规划问题变得复杂，认为无人机的运动可以分别在二维平面和垂直方向上解耦成两个运动，因此，为了便于讨论任务区域考虑为无人机高度不变的二维区域；在长×宽为Lv×Lh的栅格区域内，单个栅格用G_(lo，la)表示，其中1≤lo≤Lv，1≤la≤Lh，栅格边长为ΔL₀，用栅格中心(lo，la)表示栅格的位置，记为G_(lo，la)。

任务对象：对象表示为全集A＝UAV∪T∪B；其中集合UAV＝{uav_i|i＝1，2，...，n_V；10≤ n_V≤100}表示无人机，n_V表示无人机的总数量；集合T＝{tar_j|j＝1，2，...，n_T；n_T≥1}表示目标，n_T表示目标的总数量；集合B＝{obs_m|m＝1，2，...，n_B；n_B≥1}表示障碍物，n_B表示障碍物的总数量；t时刻，无人机uav_i、目标tar_j、障碍物obs_m的位置分别为uav_i|t、tar_j|t、obs_m|t；无人机uav_i1与无人机uav_i2之间的欧式距离表示为Dv_i1，i2|t＝||uav_i1|t-uav_i2|t||，i1＝ 1，2，...，n_V，i2＝1，2，...，n_V，且i1≠i2；无人机uav_i与目标tar_j之间的欧式距离表示为Dvt_i，j|t＝||uav_i|t-tar_j|t||；无人机uav_i与障碍物obs_m之间的欧式距离为Dvb_i，m|t＝||uav_i|t-obs_m|t||；目标tar_j与障碍物obs_m之间的欧式距离表示为Dtb_j，m|t＝||tar_j|t- obs_m|t||。

任务：在搜索范围内，无人机通过相互协作搜索目标；在避免碰撞的前提下，依靠探测到的目标信号、信息交互、自身的运动，无人机搜索目标位置；当所有待搜索的目标附近d₀范围内均有无人机到达，即为完成目标搜索任务。

无人机：无人机uav_i在时刻t的速度表示为Vv_i|t，其大小满足0≤||Vv_i|t||≤V_vm，V_vm表示无人机速度的最大值，为标量；且无人机所在位置均为栅格中心；考虑最大通信半径r_com，最大障碍物感知半径r_obs，最大目标探测半径r_tar，无人机可实现功能为：Dv_i1，i2|t≤r_com时，无人机之间通信；Dvt_i，j|t≤r_tar时，探测目标信号；Dvb_i，m|t≤r_obs时，获取障碍物方位。

目标：目标tar_j在时刻t的速度表示为Vt_j|t，其大小满足0＜||Vt_j|t||≤V_tm，V_tm表示目标速度的最大值，为标量；且目标所在位置任意；在群无人机搜索目标时，无人机通过传感器探测周围的目标信号，目标信号与距离满足一个受到环境干扰的函数，描述为目标信号探测函数，且用式(1)表示：

其中I_i，|t表示t时刻无人机uav_i探测到的目标信号；η为环境干扰；G(Dvt_i，j|t)表示在无干扰的环境中目标信号与距离的关系；Dvt_ij|t客观存在但无人机无法得知，当无人机目标探测范围内有多个目标时，较弱目标信号将被较强目标信号覆盖，且无人机无法区分不同目标的信号。

假设1：各参数大小关系满足：V_tm＜V_vm＜＜r_tar≈r_obs＜＜r_com，且均已知；

本发明中的速度与粒子群算法中的速度相类似，表示每次迭代中无人机位置的变化量，亦可理解为单位时间内运动的距离，速度最大值V_tm和V_vm的单位与距离的单位相同。

假设2：所有参与目标搜索的无人机是同构的，被搜索的所有目标为同类型目标。

图2所示为部分搜索区域的示意图，图中与uav_i距离小于V_vm的栅格，无人机可到达；由于目标可在任意位置，因此仅当栅格G_(lo，la)内所有点与uav_i距离小于r_tar时，方记为可被探测。

步骤二：对无人机进行基于距离的动态任务分工，得到无人机对动态目标的搜索状态。

群无人机在搜索目标时，任务是搜索到任务区域内所有目标，而搜索某局部区域内的目标作为子任务，子任务数至多为n_T，完成相同子任务的无人机组成子联盟，t时刻子联盟记为 TU_J|t，其中0≤J≤n_T，序号J按照子联盟中探测到的最强目标信号从大到小排列，组成子联盟的无人机所处状态称为协同搜索状态，无人机按照以下方式组成子联盟：

无人机通过两种途径获取目标信号，由此将可获取目标信号的无人机分为两类：由自身传感器探测到目标信号的I类无人机和由无人机之间的通信获取目标信号的II类无人机，I 类无人机记为type_I，II类无人机记为type_II；首先，I类无人机分组，甄选出局部区域内目标信号最强的无人机uav_i0，当附近其他I类无人机uav_i与uav_i0满足式(2)，则与uav_i0组成子联盟TU_1|t；剩余不满足式(2)的I类无人机则继续甄选出目标信号最强的无人机

再在附近剩余的无人机中寻找与

关系符合式(2)的无人机组成子联盟，以此往复直至所有I类无人机均组成子联盟；然后，II类无人机加入最近的可通信I类无人机所在子联盟；

在子任务分配后，为了避免相同子联盟中无人机过多造成无人机资源浪费，进一步引入闭环调节，评估各个子联盟的资源分配：当某个子联盟的无人机数N_J＞N_max，该子联盟择优选取N_max个无人机作为该子联盟个体，其中N_max为子联盟无人机最大允许个数；择优原则为：优先选择I类无人机，I类无人机中优先选择目标信号强者，II类无人机中优先选择距离通信无人机近者。

任务分工实例见表1。取N_max＝6，n_T＝10，首先目标信号最大的uav₁₉与满足式(2)的uav₁₇结成子联盟，uav₁₆成立子联盟，随后与I类无人机通信的II类无人机加入对应的子联盟。uav₁₉、uav₁₇与uav₆、uav₁₃、uav₁₈；uav₁₆与uav₁、uav₂、uav₇、uav₉、uav₁0、uav₁₂组成子联盟，但部分子联盟总数N_J＞N_max，按照择优原则uav₁₀退出子联盟。最后得到子联盟 TU_1|t＝{uav₁₉，uav₁₇，uav₁₃，uav₆，uav₁₈}和TU_2|t＝{uav₁₆，uav₁，uav₂，uav₇，uav₉，uav₁₂}，使得最终N_J≤N_max并得到

表1

群无人机搜索多目标时，需要快速覆盖任务区域，同时在探测到目标信号后尽快地靠近目标，当某个无人机搜索到某个目标后该无人机将发起搜索到该目标的声明，直到所有目标均被搜索到，完成搜索任务。由此将无人机对动态目标的搜索分为三种状态：快速覆盖搜索区域的漫游状态(Roaming status，RS)，组成子联盟的协同状态(Collaborativestatus，CS)，搜索任务完成状态(Task completion status，TS)；这三种状态可表示为图3所示的有限状态机(Finite State Machine)。

步骤三：判断无人机对动态目标的搜索状态，若无人机处于漫游状态，则进入步骤四，若处于协同搜索状态，则进入步骤五；若无人机处于搜索任务完成状态，则搜索任务已完成，结束所有操作。

步骤四：进行基于置信区域信息素的漫游搜索。

步骤四具体过程为：

(4-1)漫游搜索的主要目的为使得无人机快速探测到搜索区域内的每个角落，而无人机探测到一片区域后，在一定时间内，无需再次探测。为此该部分借鉴的置信区域，提出一种与置信区域相关的置信信息素。

为便于后续内容讨论，假设函数δ(D)函数表达式如下：

其中n_r为矩阵D的列数，n_l为矩阵D的行数，b_ζ，ξ为D中第ζ行第ξ列的数值；

函数

的表达式如下：

其中：

(4-2)定义动态目标搜索的置信区域及其信息素：

定义1：确定不存在目标的区域称为置信区域，记为C_z，非置信区域用

表示；

如图4的(a)所示，无人机uav_i在时刻t₀到达栅格区域内的P₁位置，未探测到目标信号，无人机探测范围内为置信区域，在时刻t₀+Δt无人机离开P₁，Δt为时间增加量；由于目标速度有限，因此P₁周围仍旧保持一定圆形区域的置信区域，置信区域边缘向P₁移动的距离ΔU满足下式：

如图4的(b)所示，uav_i在时刻(t₁+Δt)到达P′₁，若Δt足够小，此时P₁与P′₁对应的置信区域将形成连续的置信区域；在连续的运动轨迹上，单个无人机将形成如图5中(a)所示的置信区域。

推论1：将无人机探测目标分为三种情况：Case1：无人机附近距离小于等于r_tar的范围内存在障碍物或任务环境的边界；Case2：无人机附近距离小于等于2r_tar的范围内存在其他无人机；Case3：无人机附近距离小于等于r_tar的范围内不存在障碍物或任务环境的边界，且距离小于等于2r_tar的范围内无其他无人机；Case1和Case2相加的最大置信区域大于Case3的最大置信区域，Case3无人机探测得到的置信区域记为C_z，1，Case1和Case2相加比Case3多的置信区域记为C_z，2；如图5的(a)所示，在推论1的Case3单个无人机探测得到的置信区域记为C_z，1；如图5的(b)所示，在推论1的Case2中两个无人机协作而比各自探测多出的置信区域记为C_z，2。

在任务环境内，置信区域用信息素表示；无人机存储不同位置的信息素强度，

表示uav_i在t时刻存储的位置P₀信息素，置信区域内信息素取值范围为[0，τ_m]，τ_m为置信区域内信息素的最大值，即置信区域C_z，2的信息素取值；置信区域信息素在无人机所在栅格取最小值

置信区域C_z，2信息素取最大值

而非置信区域的信息素强度记为

图4的(a)中，t₀时刻无人机uav_i到达P₁，该点信息素

以P₁为圆心，r_tar为半径的圆内为C_z，1；搜索区域内任意一点P₀与P₁的距离为d_p≥0，P₀的信息素为：

由式(7)和式(8)可知在满足置信区域性质与信息素取值范围的前提下，C_z，1边缘运动的距离与时间Δt、P₀点信息素强度与距离d_p均呈线性相关，因此当无人机远离P₁，信息素变化量与时间Δt亦满足线性关系：

式中，ρ为信息素增强参数；当经过时间

P₁变为置信区域C_z，2，该点信息素变为最大值

由此可得信息素增强参数ρ＝τ_mV_tm/r_tar；当置信区域C_z，1的栅格信息素增加到τ_m时，变为置信区域C_z，2。

对于图4的(a)中的P₀的信息素变化满足下式：

在搜索区域内，为节约无人机存储空间，无人机仅存储每个栅格内一个点的信息素；用 PH_i|t表示uav_i在时刻t存储的所有栅格的信息素强度，PH_i|t表示为式(11)：

式中矩阵的任意元素

表示uav_i存储的在时刻t栅格G_(lo，la)的信息素。

目标可在搜索区域内的任意位置，因此仅当整个栅格在无人机探测区域内且无人机未探测到目标信号时方可判断该栅格无目标，属于置信区域。

在此对可探测的栅格下定义：

定义2：当某个栅格G_(lo，la)最远点与无人机uav_i距离||(G_(lo，la)+0.5ΔL·δ(G_(lo，la)- uav_i))-uav_i||≤r_tar，该栅格称为可探测栅格，记为DG，uav_i的所有可探测栅格所成集合记为DG_i；与之相反，||(G_(lo，la)+0.5ΔL·δ(G_(lo，la)-uav_i))-uav_i||＞r_tar，G_(lo，la)则被称为不可探测栅格，记为UG；若目标不可探测栅格存在相接的可探测栅格，则称之为最近不可探测栅格，记为NUG。

对于uav_i，任意可探测栅格

的信息素满足下式：

ΔE为中间变量；在时间上采取了离散的迭代方式，由式(10)可知任意栅格G_(lo，la)信息素的迭代关系满足下式：

对于区域C_z，2，当存在栅格

使得G_(lo，la)符合下式时，G_(lo，la)将变为非置信区域：

ΔH为中间变量；

当栅格

对于任意无人机uav_i所存储的栅格信息素每次迭代更新5次，每次迭代中信息素的更新流程如下：

Step1：依式(13)计算并更新所有栅格信息素；

Step2：依式(12)计算并更新所有可探测栅格的信息素；

Step3：CUAV_i＝{uav_I1，uav_I2，...，uav_In}表示可与uav_i通信的无人机所成集合；uav_i获取 CUAV_i中所有无人机存储的信息素，并将其存储的所有栅格信息素依下式更新：

Step4：若uav_i处于协同搜索状态，为子联盟

中任意无人机， TU_J中type_I无人机为

ype_II无人机为

集合

中所有栅格变为非置信区域，信息素依下式更新：

Step5：搜索范围内所有栅格的信息素依下式更新：

(4-3)设定漫游搜索速度：

定义3：当某个栅格G_(lo，la)与无人机uav_i距离||G_(lo，la)-uav_i||≤V_vm，该栅格称为可达栅格，记为RG，uav_i的所有可达栅格所成集合记为RG_i；在以uav_i为中心连续的[-π，π)角度方向上，若某个可达栅格在某段角度方向上为距离无人机最远的可达栅格，则称该可达栅格为最远可达栅格。如图6，若V_vm＝3ΔL，编号a～p的栅格为当前最远可达栅格(Furthestreachable grid，FRG)。

最远可达栅格与最近不可探测栅格存在着对应关系，假设某个最远可达栅格为角度区间 (θ₁，θ₂)方向上的最远可到达栅格，若无人机指向某个最近不可探测栅格最远点所成向量的角度在区间(θ₁，θ₂)范围内，则该最近不可探测栅格与该最远可达栅格对应；例如图6中的a与a₁， b与b₁、b₂、b₃等。

漫游状态下，为快速探测到更多区域，无人机在根据信息素得到速度方向后，以该方向最大速度运动，选择速度方向上最远可达栅格作为下一步所在位置；在更新完信息素之后，漫游状态下任意无人机uav_i周围目标可探测栅格内的信息素将满足式(12)，与uav_i距离相同的栅格信息素相等；而不可探测栅格的信息素即使与无人机距离相同也将出现差异，uav_i依据最近不可探测栅格的信息素强度决定下一步飞行方向。

uav_i的最远可达栅格记为FG_i，k，其中1≤k≤k_i，re，k表示从x正半轴开始顺时针第k个最远可达栅格，k_i，re为最远可达栅格数量；FG_i，k对应的最近不可探测栅格的信息素记为Fph_i，k，n，其中0≤n≤n_i，gr，n表示顺时针第n个最近不可探测栅格，n_i，gr为FG_i，k对应的最近不可探测栅格的数量，uav_i第k个最远可达栅格对应的最大信息素

uav_i获取FG_i，k和Fph_i，k，max后，按照轮盘赌法更新速度，轮盘赌法用式(18)表示；随机数 r_a～U(0，1)，当Q(K-1)＜r_a＜Q(K)时，uav_i选择FG_i，K作为下一步期望位置，而下一步期望速度Vve_i|(t+1)满足式(19)，式中FG_i，K表示FG_i，K位置，α表示运动学的惯性系数：

Vve_i|(t+1)＝αVv_i|t+(1-α)(FG_i，K-uav_i|t) (19)

q_k表示无人机选择最远可达栅格FG_i，k作为下一步位置所在栅格的概率。

步骤五：进行基于概率限制粒子群算法的协同搜索。

将协同状态下的全局最优为子联盟中的最优的，称为半全局最优，记作sgb_J|t；而个体历史最优则为无人机个体加入子联盟后的历史最优，记为pb_i|t；

经典的PSO算法多用于静态目标搜索，不同时间同一位置上适应度函数值不变，因此个体历史最优和全局最优将一直保持其可信度。但在动态目标搜索中，随时间的变化同一位置的适应度函数值是变化的，个体历史最优和全局最优对系统寻优的可靠性随着迭代而逐渐降低，因此，半全局最优和个体历史最优的更新分别引入概率值，以概率值限制粒子群优化PSO 中最优的继承，同时改进个体历史最优的计算方式，提出概率限制的粒子群优化PFPSO。

假设时刻t无人机uav_i所在位置的适应度函数表示为f(uav_i|t)，PFPSO的全局最优与个体历史最优的更新方式如下：

半全局最优引入全局最优概率值σ_j，其初始值为σ₀，其中0＜σ₀＜1；对于任意子联盟 TU_J|t，其中目标信号最强的I类无人机为uav_J，TU_J|t对应的半全局最优更新过程如下：

Step1：判断时刻(t-1)是否存在一个子联盟

其中目标信号最强的I类无人机

若存在，则赋值[0，1]之间均匀分布随机数r_σ，并执行Step2；否则sgb_J|t＝uav_J|t，σ_J＝σ₀，更新结束；

Step2：若条件

成立，f()为公式(21) 表示的适应度函数，sgb_J|t＝uav_J|t，σ_J＝σ₀，更新结束；否则执行Step3；

Step3：

结束更新；其中

为

的半全局最优。

个体历史最优引入个体历史最优概率值μ_i，其初始值为μ₀，其中0＜μ₀＜1；对于任意一个在协同搜索状态下的无人机uav_i，其个体历史最优pb_i|t更新流程如下：

Step11：判断无人机何时加入子联盟，若在时刻t加入子联盟，按照式(20)更新pb_i|t，并赋值μ_i＝μ₀，更新结束；否则赋值[0，1]之间均匀分布随机数r_μ，并执行Step12；

Step12：若条件(f(uav_i|t)≥f(pb_i|(t-1)))||(f(uav_i|t)＜f(pb_i|(t-1))&r_μ≥μ_i)成立，按照式(20)更新pb_i|t，并赋值μ_i＝μ₀，更新结束；否则执行Step13；

Step13：pb_i|t＝pb_i|(t-1)，μ_i＝μ_i·μ₀，更新结束。

在协同搜索状态的无人机分为两类：type_I和type_II；对于某子联盟中任意I类无人机，个体历史最优仍选择该个体历史上的最优位置；而对于某子联盟中任意II类无人机uav_i，若 uav_i的目标信息是通过通信从无人机

取，无人机个体历史最优为二者中点；无人机uav_i的个体历史最优按照式(20)更新：

不同类型的协同搜索状态下的无人机，适应度函数计算方式不同；在任意子联盟中，若无人机uav_i为type_I，适应度函数值即为传感器探测到的目标信号；若无人机uav_i为type_II，

为其最近type_I通信无人机，适应度函数值取uavi与

距离的相反数，即：

综上所述概率限制的PSO期望速度计算由式(22)所示：

其中c₁、c₂分别为认知系数、社会系数，r₁、r₂是服从U(0，1)的随机数，ω为惯性权重，α是考虑运动学的惯性环节，pb_i|t为无人机uav_i在时刻t的个体历史最优，sgb_J|t为无人机uav_i所属子联盟TU_J|t的半全局最优；Vvp_i|(t+1)为中间变量。

无论无人机是处于协同状态还是漫游状态，都在计算出期望速度Vve_i|(t+1)后考虑避障；以边界扫描避障策略为基础，将其改进为适应于栅格环境中的改进的边界扫描避障IBSOA，无人机避障时，将感知到的障碍物分为连续障碍物与不连续障碍物两种情形，避障方向分为逆时针避障与顺时针避障，无人机综合考虑感知到的障碍物情形与历史避障方向计算下一步速度。

由于地图的栅格化，将存在障碍物栅格称为障碍栅格；IBSOA忽略障碍物情形，综合考虑避障方向与障碍栅格进行避障；若无人机在漫游状态，且在其附近距离小于min(r_tar，r_obs)的范围内存在障碍物，开始考虑避障；若无人机在协同状态，且在其附近距离小于Vv_m的范围内存在障碍物，开始考虑避障；IBSOA的避障过程表示为下述两点：

当λ_i＝0，表示上一步未避障，从栅格集合FOG_i|t中选取与Vve_i|(t+1)角度差最小的栅格 Gn_i作为无人机uav_i下一步将到达的栅格；

当λ_i＝1，从栅格集合FOG_i|t中选取在逆时针方向上与Vve_i|(t+1)角度差栅格Gn_i作为无人机uav_i下一步将到达的栅格；

当λ_i＝-1，从栅格集合FOG_i|t中选取在顺时针方向上与Vve_i|(t+1)角度差最小的栅格Gn_i作为无人机uav_i下一步将到达的栅格；

再根据栅格Gn_i及式(23)，求解下一步速度Vv_i|(t+1)，式中Gn_i为Gn_i位置；得到速度后依据式(24)更新λ_i，计算避障速度结束：

λ_i＝sgn(F(<Vv_i|(t+1)>-<Vve_i|(t+1)>)) (24)

当λ_i＝0，表示上一步未避障，从栅格集合OG_i|t中选取与(uav_i|t+Vve_i|(t+1))位置距离最近的无障碍物的可达栅格grdn_i作为无人机uav_i下一步将到达的栅格；

当λ_i＝1，从栅格集合OG_i|t中选取在逆时针方向上与(uav_i|t+Vve_i|(t+1))位置距离最近的无障碍物的可达栅格grdn_i作为无人机uav_i下一步将到达的栅格；

当λ_i＝-1，从栅格集合OG_i|t中选取在顺时针方向上与(uav_i|t+Vve_i|(t+1))位置距离最近的无障碍物的可达栅格grdn_i作为无人机uav_i下一步将到达的栅格；

再根据栅格grdn_i及式(25)，求解下一步速度Vv_i|(t+1)，式中grdn_i为grdn_i位置，得到速度后依据式(26)更新λ_i，计算避障速度结束；

λ_i＝sgn(F(<Vv_i|(t+1)>-<Vve_i|(t+1)>)) (26)

在根据式(23)或(25)计算得到下一步速度Vv_i|(t+1)后，依式(27)更新无人机位置，并判断是否搜索到目标：

uav_i|(t+1)＝uav_i|t+Vv_i|(t+1)(27)。

仿真验证

为验证分析文章所提算法性能，在MATLAB 2021a的仿真环境下，进行若干组对比实验，分别比较不同搜索模式之间的搜索效率和搜索能耗。

本发明考虑动态目标运动的随机性与惯性，设计目标的运动模型如下式所示，

参照对于目标信号的描述，将式(1)中详细设置为如下式

式中m是环境的衰减系数(0＜m＜1)；Q是目标的恒定信号功率；η代表高斯白噪声，满足标准正态分布。

群无人机在仿真搜索过程中包含搜索主体——无人机，搜索对象——目标，搜索环境等不同参数的设置。

表2

图7至图16所示为群无人机根据PFPSO、CAP、IBSOA和DBDTA构成搜索算法模式PCDI，搜索多个运动目标的过程，图中所示的目标搜索中N_v＝20，N_t＝10，圆点表示无人机，五角星表示目标。图7呈现了目标搜索开始时的无人机、目标的位置及障碍物的分布；图16为整个搜索过程中所有目标和无人机的运动轨迹，可以明显看出，无人机在避开障碍物的前提下成功搜索到所有目标。图8～15为无人机视角下的置信区域信息素、无人机、障碍物及被搜索到的目标。运动的目标被搜索到后，目标将静止于被搜索时所在位置。

图7中，搜索环境与搜索对象初始化，其中无人机有规则地排列在左下角的区域内，目标和障碍物随机地分布在右上角的区域内。而图中表示的障碍物是静止的，其中每个目标的运动均满足式(4.23)表示的具有运动惯性的随机运动过程。

图8表示时刻，群无人机视角中的置信区域信息素；由图可知群无人机暂时无法得知目标及障碍物位置。

图9中，全体群无人机在经历一段时间的基于置信区域信息素的漫游搜索过程后；某个无人机首次探测到目标信号，然后根据基于距离的动态任务分工与附近几个无人机构建子联盟；由于探测到目标信号，说明探测区域内存在目标，部分置信区域变为非置信区域。

图10中，群无人机首次感知到障碍物，由于感知到障碍物的无人机所处状态为漫游搜索状态，该无人机立即以改进的边界扫描避障策略开始避障。

图11中，5个无人机构成的子联盟以概率限制的粒子群算法为基础，不断接近目标，最终完成对该局部区域的目标搜索。在搜索完成该局部区域内的目标后，子联盟将解散，其中的无人机重新变换到漫游搜索状态。

图12中，5个无人机构成子联盟，无人机进入协同搜索状态。构成的子联盟协同搜索该局部区域内的目标；而在图13中时刻，第6个无人机加入该子联盟，此刻加入子联盟的无人机进入协同搜索状态，并参与到该局部区域内的目标搜索中。

图14中，搜索完该局部区域的目标后，无人机解散子联盟并进入漫游搜索状态。无人机各自以置信区域信息素为启发，分散运动离开该区域，进而搜索其他非置信区域内的目标。

图15中，群无人机以PCDI模式为基础，完成对最后一个运动目标的搜索，同时所有目标被搜索到，搜索任务完成。

图16所示为目标搜索过程中所有目标及所有无人机的运动轨迹，五角星连接而成的轨迹为目标运动轨迹，黑色物体表示障碍物，点线构成的轨迹表示群无人机搜索目标时的轨迹。由图中轨迹可知，群无人机在搜索多运动目标时，不论处于协同搜索状态还是漫游搜索状态，以改进的边界扫描避障策略为指导，无人机均顺利地避开了障碍物。

为验证文中所提方法的有效性，以图1所示搜索框架为基础，设计搜索算法模式。保持避障均采用IBSOA，用DBDTA判断无人机是否需要加入子联盟；协同搜索和漫游搜索采用不同算法，构成如表3所示PCDI、PSDI、KCDI和KSDI四种搜索算法模式。其中KCPSO 为运动学约束的粒子群算法(Kinematic Constraints Particle Swarm Optimization)，SVF为简化虚拟受力模型(Simplified Virtual Force model)。

表3

在无人机数量为N_v＝20，30，40，50，60，70，80，90，100的情况下，分别用四种搜索模式，搜索图7所示环境中的目标。独立搜索进行搜索100次，统计不同无人机数量及不同搜索模式下搜索10个运动目标所需的总迭代步数——搜索目标需要的的迭代步数，总能耗——全体无人机的总运动距离，所得结果如表4所示。

表4

PCDI与KCDI、PSDI与KSDI两组模式对比可分析PFPSO的优劣，PFPSO相比于KCPSO搜索效率平均提高4.05％，总能耗平均减少3.08％，搜索稳定性平均提高30.45％。可以看出在无人机较少时，PFPSO的优势更为明显，但在无人机数接近100时，PFPSO比KCPSO仅有略微优势。在PCDI算法模式中的PFPSO更具优势；不论在何种模式中PFPSO体现出更高的稳定性。PCDI与PSDI、KCDI与KSDI两组模式对比可分析CAP。CAP相比于SVF，搜索效率平均提高22.55％，总能耗平均减少24.65％，搜索稳定性平均提高74.55％。在不同无人机总数的情况下，CAP相比于SVF的搜索性能都较为稳定的大幅提升，在搜索效率上，不同无人机总数的情况下均提高20％左右；在总能耗的减少上，大体上随着无人机总数的增加，性能提升得越高；在算法搜索稳定性上，不同无人机总数的情况下均有着大幅提升。

PCDI、PSDI、KCDI、KSDI四种搜索算法模式中，均有着相同的任务分工部分。在未知障碍物环境下搜索多个运动目标时，群无人机运用四种搜索算法模式均有效地完成了对多个目标的搜索。进而验证了基于距离的动态任务分工在搜索算法中的有效性。将表4数据中的平均值可视化，得到图17；图中所示曲线体现不论无人机总数，搜索算法模式的算法性能从优至劣的排序基本为PCDI、KCDI、PSDI、KSDI。

本发明将目标信号模型改进，使得模型更广泛地适应现有传感器功能；在改进的搜索模型基础上，提出适应于改进的目标信号模型下的基于距离的动态任务分工方法。将未知障碍物环境栅格化，并以置信区域为基础提出置信区域的置信区域信息素。并分析粒子群算法个体极值与全局极值的可靠性，为保证极值的可靠性而提出概率限制的粒子群算法。

经仿真验证，基于距离的动态任务分工适用于群无人机的任务分工部分。经过不同搜索算法模式的比较，置信区域信息素大大提高多运动目标搜索的性能，在搜索效率、能耗节约、搜索稳定性上均有着大幅度的提高；概率限制的粒子群算法虽然在搜索效率、能耗节约上仅有略微提升，甚至在某些情况下总能耗高于传统方法，但在搜索稳定性上有着显著提高。

Claims

1.一种基于信息素启发的群无人机多运动目标搜索方法，其特征在于，包括以下步骤：

步骤一：建立群无人机多动态目标搜索模型；

步骤三：判断无人机对动态目标的搜索状态，若无人机处于漫游状态，则进入步骤四，若处于协同搜索状态，则进入步骤五；若无人机处于搜索任务完成状态，则搜索任务已完成，结束所有操作；

步骤四：进行基于置信区域信息素的漫游搜索；

步骤五：进行基于概率限制粒子群算法的协同搜索。

2.根据权利要求1所述的基于信息素启发的群无人机多运动目标搜索方法，其特征在于，所述步骤一中，建立的群无人机多动态目标搜索模型包括：

任务环境：任务区域考虑为无人机高度不变的二维区域；在长×宽为Lv×Lh的栅格区域内，单个栅格用G_(lo，la)表示，其中1≤lo≤Lv，1≤la≤Lh，栅格边长为ΔL₀，用栅格中心(lo，la)表示栅格的位置，记为G_(lo，la)；

任务对象：对象表示为全集A＝UAV∪T∪B；其中集合UAV＝{uav_i|i＝1，2，...，n_V；10≤n_V≤100}表示无人机，n_V表示无人机的总数量；集合T＝{tar_j|j＝1，2，...，n_T；n_T≥1}表示目标，n_T表示目标的总数量；集合B＝{obs_m|m＝1，2，...，n_B；n_B≥1}表示障碍物，n_B表示障碍物的总数量；t时刻，无人机uav_i、目标tar_j、障碍物obs_m的位置分别为uav_i|t、tar_j|t、obs_m|t；无人机uav_i1与无人机uav_i2之间的欧式距离表示为Dv_i1，i2|t＝||uav_i1|t-uav_i2|t||，i1＝1，2，...，n_V，i2＝1，2，...，n_V，且i1≠i2；无人机uav_i与目标tar_j之间的欧式距离表示为Dvt_i，j|t＝||uav_i|t-tar_j|t||；无人机uav_i与障碍物obs_m之间的欧式距离为Dvb_i，m|t＝||uav_i|t-obs_m|t||；目标tar_j与障碍物obs_m之间的欧式距离表示为Dtb_j，m|t＝||tar_j|t-obs_m|t||；

任务：在搜索范围内，无人机通过相互协作搜索目标；在避免碰撞的前提下，依靠探测到的目标信号、信息交互、自身的运动，无人机搜索目标位置；当所有待搜索的目标附近d₀范围内均有无人机到达，即为完成目标搜索任务；

无人机：无人机uav_i在时刻t的速度表示为Vv_i|t，其大小满足0≤||Vv_i|t||≤V_vm，V_vm表示无人机速度的最大值，为标量；且无人机所在位置均为栅格中心；考虑最大通信半径r_com，最大障碍物感知半径r_obs，最大目标探测半径r_tar，无人机可实现功能为：Dv_i1，i2|t≤r_com时，无人机之间通信；Dvt_i，j|t≤r_tar时，探测目标信号；Dvb_i，m|t≤r_obs时，获取障碍物方位；

其中I_i，|t表示t时刻无人机uav_i探测到的目标信号；η为环境干扰；G(Dvt_i，j|t)表示在无干扰的环境中目标信号与距离的关系；Dvt_i，j|t客观存在但无人机无法得知，当无人机目标探测范围内有多个目标时，较弱目标信号将被较强目标信号覆盖，且无人机无法区分不同目标的信号；

3.根据权利要求2所述的基于信息素启发的群无人机多运动目标搜索方法，其特征在于，所述步骤二中，群无人机在搜索目标时，任务是搜索到任务区域内所有目标，而搜索某局部区域内的目标作为子任务，子任务数至多为n_T，完成相同子任务的无人机组成子联盟，t时刻子联盟记为TU_J|t，其中0≤J≤n_T，序号J按照子联盟中探测到的最强目标信号从大到小排列，组成子联盟的无人机所处状态称为协同搜索状态，无人机按照以下方式组成子联盟：

无人机通过两种途径获取目标信号，由此将可获取目标信号的无人机分为两类：由自身传感器探测到目标信号的I类无人机和由无人机之间的通信获取目标信号的II类无人机，I类无人机记为type_I，II类无人机记为type_II；首先，I类无人机分组，甄选出局部区域内目标信号最强的无人机uav_i0，当附近其他I类无人机uav_i与uav_i0满足式(2)，则与uav_i0组成子联盟TU_1|t；剩余不满足式(2)的I类无人机则继续甄选出目标信号最强的无人机

再在附近剩余的无人机中寻找与

4.根据权利要求3所述的基于信息素启发的群无人机多运动目标搜索方法，其特征在于，所述步骤二中，在子任务分配后，为了避免相同子联盟中无人机过多造成无人机资源浪费，进一步引入闭环调节，评估各个子联盟的资源分配：当某个子联盟的无人机数N_J＞N_max，该子联盟择优选取N_max个无人机作为该子联盟个体，其中N_max为子联盟无人机最大允许个数；择优原则为：优先选择I类无人机，I类无人机中优先选择目标信号强者，II类无人机中优先选择距离通信无人机近者；

将无人机对动态目标的搜索分为三种状态：快速覆盖搜索区域的漫游状态、组成子联盟的协同状态和搜索任务完成状态。

5.根据权利要求3所述的基于信息素启发的群无人机多运动目标搜索方法，其特征在于，所述步骤四具体过程为：

(4-1)假设函数δ(D)函数表达式如下：

函数

的表达式如下：

其中：

(4-2)定义动态目标搜索的置信区域及其信息素：

表示；

无人机uav_i在时刻t₀到达栅格区域内的P₁位置，未探测到目标信号，无人机探测范围内为置信区域，在时刻t₀+Δt无人机离开P₁，Δt为时间增加量；由于目标速度有限，因此P₁周围仍旧保持一定圆形区域的置信区域，置信区域边缘向P₁移动的距离ΔU满足下式：

uav_i在时刻(t₀+Δt)到达P′₁，若Δt足够小，此时P₁与P′₁对应的置信区域将形成连续的置信区域；

推论1：将无人机探测目标分为三种情况：Case1：无人机附近距离小于等于r_tar的范围内存在障碍物或任务环境的边界；Case2：无人机附近距离小于等于2r_tar的范围内存在其他无人机；Case3：无人机附近距离小于等于r_tar的范围内不存在障碍物或任务环境的边界，且距离小于等于2r_tar的范围内无其他无人机；Case1和Case2相加的最大置信区域大于Case3的最大置信区域，Case3无人机探测得到的置信区域记为C_z，1，Case1和Case2相加比Case3多的置信区域记为C_z，2；

置信区域C_z，2信息素取最大值

而非置信区域的信息素强度记为

t₀时刻无人机uav_i到达P₁，该点信息素

式中，ρ为信息素增强参数；当经过时间

P₁变为置信区域C_z，2，该点信息素变为最大值

由此可得信息素增强参数ρ＝τ_mV_tm/r_tar；当置信区域C_z，1的栅格信息素增加到τ_m时，变为置信区域C_z，2；

P₀的信息素变化满足下式：

在搜索区域内，为节约无人机存储空间，无人机仅存储每个栅格内一个点的信息素；用PH_i|t表示uav_i在时刻t存储的所有栅格的信息素强度，PH_i|t表示为式(11)：

式中矩阵的任意元素

表示uav_i存储的在时刻t栅格G_(lo，la)的信息素；

目标可在搜索区域内的任意位置，因此仅当整个栅格在无人机探测区域内且无人机未探测到目标信号时方可判断该栅格无目标，属于置信区域；在此对可探测的栅格下定义：

定义2：当某个栅格G_(lo，la)最远点与无人机uav_i距离||(G_(lo，la)+0.5ΔL·δ(G_(lo，la)-uav_i))-uav_i||≤r_tar，该栅格称为可探测栅格，记为DG，uav_i的所有可探测栅格所成集合记为DG_i；与之相反，||(G_(lo，la)+0.5ΔL·δ(G_(lo，la)-uav_i))-uav_i||＞r_tar，G_(lo，la)则被称为不可探测栅格，记为UG；若目标不可探测栅格存在相接的可探测栅格，则称之为最近不可探测栅格，记为NUG；

对于uav_i，任意可探测栅格

的信息素满足下式：

对于区域C_z，2，当存在栅格

使得G_(lo，la)符合下式时，G_(lo，la)将变为非置信区域：

ΔH为中间变量；

当栅格

Step1：依式(13)计算并更新所有栅格信息素；

Step2：依式(12)计算并更新所有可探测栅格的信息素；

Step3：CUAV_i＝{uav_I1，uav_I2，...，uav_In}表示可与uav_i通信的无人机所成集合；uav_i获取CUAV_i中所有无人机存储的信息素，并将其存储的所有栅格信息素依下式更新：

Step4：若uav_i处于协同搜索状态，为子联盟

中任意无人机，TU_J中type_I无人机为

type_II无人机为

集合

中所有栅格变为非置信区域，信息素依下式更新：

Step5：搜索范围内所有栅格的信息素依下式更新：

(4-3)设定漫游搜索速度：

定义3：当某个栅格G_(lo，la)与无人机uav_i距离||G_(lo，la)-uav_i||≤V_vm，该栅格称为可达栅格，记为RG，uav_i的所有可达栅格所成集合记为RG_i；在以uav_i为中心连续的[-π，π)角度方向上，若某个可达栅格在某段角度方向上为距离无人机最远的可达栅格，则称该可达栅格为最远可达栅格；

最远可达栅格与最近不可探测栅格存在着对应关系，假设某个最远可达栅格为角度区间(θ₁，θ₂)方向上的最远可到达栅格，若无人机指向某个最近不可探测栅格最远点所成向量的角度在区间(θ₁，θ₂)范围内，则该最近不可探测栅格与该最远可达栅格对应；

漫游状态下，为快速探测到更多区域，无人机在根据信息素得到速度方向后，以该方向最大速度运动，选择速度方向上最远可达栅格作为下一步所在位置；在更新完信息素之后，漫游状态下任意无人机uav_i周围目标可探测栅格内的信息素将满足式(12)，与uav_i距离相同的栅格信息素相等；而不可探测栅格的信息素即使与无人机距离相同也将出现差异，uav_i依据最近不可探测栅格的信息素强度决定下一步飞行方向；

uav_i获取FG_i，k和Fph_i，k，max后，按照轮盘赌法更新速度，轮盘赌法用式(18)表示；随机数r_a～U(0，1)，当Q(K-1)＜r_a＜Q(K)时，uav_i选择FG_i，K作为下一步期望位置，而下一步期望速度Vve_i|(t+1)满足式(19)，式中FG_i，K表示FG_i，K位置，α表示运动学的惯性系数：

Vve_i|(t+1)＝aVv_i|t+(1-α)(FG_i，K-uav_i|t) (19)

6.根据权利要求5所述的基于信息素启发的群无人机多运动目标搜索方法，其特征在于，所述步骤五中：

在动态目标搜索中，随时间的变化同一位置的适应度函数值是变化的，个体历史最优和全局最优对系统寻优的可靠性随着迭代而逐渐降低，因此，半全局最优和个体历史最优的更新分别引入概率值，以概率值限制粒子群优化PSO中最优的继承，同时改进个体历史最优的计算方式，提出概率限制的粒子群优化PFPSO；

半全局最优引入全局最优概率值σ_j，其初始值为σ₀，其中0＜σ₀＜1；对于任意子联盟TU_J|t，其中目标信号最强的I类无人机为uav_J，TU_J|t对应的半全局最优更新过程如下：

Step1：判断时刻(t-1)是否存在一个子联盟

其中目标信号最强的I类无人机

Step2：若条件

成立，f()为公式(21)表示的适应度函数，sgb_J|t＝uav_J|t，σ_J＝σ₀，更新结束；否则执行Step3；

Step3：

结束更新；其中

为

的半全局最优；

Step13：pb_i|t＝pb_i|(t-1)，μ_i＝μ_i·μ₀，更新结束；

在协同搜索状态的无人机分为两类：type_I和type_II；对于某子联盟中任意I类无人机，个体历史最优仍选择该个体历史上的最优位置；而对于某子联盟中任意II类无人机uav_i，若uav_i的目标信息是通过通信从无人机

为其最近type_I通信无人机，适应度函数值取uav_i与

距离的相反数，即：

综上所述概率限制的PSO期望速度计算由式(22)所示：

7.根据权利要求6所述的基于信息素启发的群无人机多运动目标搜索方法，其特征在于，步骤四或步骤五中，无论无人机是处于协同状态还是漫游状态，都在计算出期望速度Vve_i|(t+1)后考虑避障；以边界扫描避障策略为基础，将其改进为适应于栅格环境中的改进的边界扫描避障IBSOA，无人机避障时，将感知到的障碍物分为连续障碍物与不连续障碍物两种情形，避障方向分为逆时针避障与顺时针避障，无人机综合考虑感知到的障碍物情形与历史避障方向计算下一步速度；

当λ_i＝0，表示上一步未避障，从栅格集合FOG_i|t中选取与Vve_i|(t+1)角度差最小的栅格Gn_i作为无人机uav_i下一步将到达的栅格；

λ_i＝sgn(F(<Vv_i|(t+1)>-<Vve_i|(t+1)>)) (24)

λ_i＝sgn(F(<Vv_i|(t+1)>-<Vve_i|(t+1)>)) (26)

uav_i|(t+1)＝uav_i|t+Vv_i|(t+1) (27)。