CN115237151A - 一种基于信息素启发的群无人机多运动目标搜索方法 - Google Patents

一种基于信息素启发的群无人机多运动目标搜索方法 Download PDF

Info

Publication number
CN115237151A
CN115237151A CN202210522719.6A CN202210522719A CN115237151A CN 115237151 A CN115237151 A CN 115237151A CN 202210522719 A CN202210522719 A CN 202210522719A CN 115237151 A CN115237151 A CN 115237151A
Authority
CN
China
Prior art keywords
unmanned aerial
uav
grid
aerial vehicle
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210522719.6A
Other languages
English (en)
Inventor
张红强
王茂
吴亮红
周少武
王汐
边晓荟
刘朝华
陈磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University of Science and Technology
Original Assignee
Hunan University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University of Science and Technology filed Critical Hunan University of Science and Technology
Priority to CN202210522719.6A priority Critical patent/CN115237151A/zh
Publication of CN115237151A publication Critical patent/CN115237151A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明公开了一种基于信息素启发的群无人机多运动目标搜索方法,包括以下步骤:建立群无人机多动态目标搜索模型;基于距离的动态任务分工,得到无人机对动态目标的搜索状态;判断无人机搜索状态,若无人机处于漫游状态,则进行基于置信区域信息素的漫游搜索,若处于协同搜索状态,则进行基于概率限制粒子群算法的协同搜索。本发明以动态目标置信区域为基础,引入置信信息素,使得无人机更快地覆盖更多区域,以此提高漫游状态无人机目标探测速率;针对动态目标,引入全局最优与个体历史最优的概率值,并改善个体历史最优的计算方式,将目标信号模型与无人机个体之间的距离综合考虑,设置PSO的适应度函数,提高了搜索效率。

Description

一种基于信息素启发的群无人机多运动目标搜索方法
技术领域
本发明涉及一种无人机搜索方法,特别涉及一种基于信息素启发的群无人机多运动目标搜索方法。
背景技术
无人机在现代的民用、军用领域均发挥着重要作用,被广泛用于灾后搜救、野外火灾监测、敌情侦察等。无人机在众多的应用领域中,都包含目标搜索的过程,如在灾害现场对生还者的搜寻、在野外对火源的排查、战场中对敌方位置的侦察。目标搜索往往要求高效率以减少损失或获得最大收益,而群无人机在搜索效率、灵活性、可扩展性及鲁棒性等方面体现出优越的性能。群无人机是一种群机器人系统,对其研究已成为自动化技术领域发展的重要方向。
群无人机启发于自然界社会型生物的群体行为,该无人系统无控制中心,是一种分布式系统。相比于有控制中心的系统,分布式系统体现出计算量小、可靠性高等优点。在现有文献中,目标搜索问题的模型主要有:概率函数模型、目标信号模型。概率函数模型主要用于搜索丢失的目标,传感器通常被建模为具有两种状态的二元变量:“检测到”或“未检测到”,对应目标搜索状态即为“搜索到目标”或“未搜索到目标”,但在某些目标搜索情景中可能无法确定目标最终丢失位置,且在搜索过程中可能传感器检测到目标信号但无法确定目标具体位置,需要进一步搜索。在目标信号模型的目标搜索中,主要研究静态目标搜索,且目标信号模型是假设搜索主体可直接根据目标信号区分目标为前提,这进一步限制了其适用范围。
发明内容
为了解决上述技术问题,本发明提供一种算法简单、搜索效率高的基于信息素启发的群无人机多运动目标搜索方法。
本发明解决上述问题的技术方案是:一种基于信息素启发的群无人机多运动目标搜索方法,包括以下步骤:
步骤一:建立群无人机多动态目标搜索模型;
步骤二:对无人机进行基于距离的动态任务分工,得到无人机对动态目标的搜索状态;
步骤三:判断无人机对动态目标的搜索状态,若无人机处于漫游状态,则进入步骤四,若处于协同搜索状态,则进入步骤五;
步骤四:进行基于置信区域信息素的漫游搜索;
步骤五:进行基于概率限制粒子群算法的协同搜索。
本发明的有益效果在于:
1、本发明改善目标信号模型,假设无人机无法区分不同目标的信号,以适应现阶段传感器发展,并以此为基础改进无人机的协作分组方法,从而更广泛地适应于现有传感器的功能,使得实际应用中的目标信号探测过程更容易实现。
2、本发明以动态目标置信区域为基础,引入置信信息素,使得无人机更快地覆盖更多区域,以此提高漫游状态无人机目标探测速率。
3、本发明针对动态目标,在PSO的基础上引入全局最优与个体历史最优的概率值,并改善个体历史最优的计算方式,将目标信号模型与无人机个体之间的距离综合考虑,设置PSO 的适应度函数,能够防止搜索过程中无人机陷入局部最优,进而提高无人机搜索目标的效率。
4、本发明借鉴以往工作中提出的边界扫描避障策略,将其离散化,使其适应于栅格地图,从而保持避障的高效率及搜索广度。
附图说明
图1为本发明的流程图。
图2为本发明建立的群无人机多动态目标搜索模型示意图。
图3为无人机状态迁移的示意图。
图4为置信区域的示意图,其中(a)表示单一位置对应置信区域,(b)表示运动轨迹对应的置信区域。
图5为最大置信区域示意图,其中(a)表示单个无人机最大置信区域,(b)表示多个无人机最大置信区域。
图6为最远可达栅格与最近不可探测栅格的对应关系图。
图7为实施例中搜索环境与搜索对象初始化的示意图。
图8为实施例中群无人机视角中的置信区域信息素示意图。
图9为实施例中某个无人机首次探测到目标信号的示意图。
图10为实施例中群无人机首次感知到障碍物的示意图。
图11为实施例中5个无人机构成的子联盟搜索到一个目标的示意图。
图12为实施例中5个无人机构成子联盟,无人机进入协同搜索状态的示意图。
图13为实施例中第6个无人机加入该子联盟并进入协同搜索状态的示意图。
图14为实施例中,搜索完该局部区域的目标后,无人机解散子联盟分散运动离开该区域的示意图。
图15为实施例中,群无人机搜索任务完成的示意图。
图16为实施例中目标搜索过程中所有目标及所有无人机的运动轨迹示意图。
图17为搜索性能对比图。
具体实施方式
下面结合附图和实施例对本发明作进一步的说明。
如图1所示,一种基于信息素启发的群无人机多运动目标搜索方法,包括以下步骤:
步骤一:建立群无人机多动态目标搜索模型。
建立的群无人机多动态目标搜索模型包括:
任务环境:现实中无人机处于三维空间中,这使得无人机规划问题变得复杂,认为无人机的运动可以分别在二维平面和垂直方向上解耦成两个运动,因此,为了便于讨论任务区域考虑为无人机高度不变的二维区域;在长×宽为Lv×Lh的栅格区域内,单个栅格用G(lo,la)表示,其中1≤lo≤Lv,1≤la≤Lh,栅格边长为ΔL0,用栅格中心(lo,la)表示栅格的位置,记为G(lo,la)
任务对象:对象表示为全集A=UAV∪T∪B;其中集合UAV={uavi|i=1,2,...,nV;10≤ nV≤100}表示无人机,nV表示无人机的总数量;集合T={tarj|j=1,2,...,nT;nT≥1}表示目标,nT表示目标的总数量;集合B={obsm|m=1,2,...,nB;nB≥1}表示障碍物,nB表示障碍物的总数量;t时刻,无人机uavi、目标tarj、障碍物obsm的位置分别为uavi|t、tarj|t、obsm|t;无人机uavi1与无人机uavi2之间的欧式距离表示为Dvi1,i2|t=||uavi1|t-uavi2|t||,i1= 1,2,...,nV,i2=1,2,...,nV,且i1≠i2;无人机uavi与目标tarj之间的欧式距离表示为Dvti,j|t=||uavi|t-tarj|t||;无人机uavi与障碍物obsm之间的欧式距离为Dvbi,m|t=||uavi|t-obsm|t||;目标tarj与障碍物obsm之间的欧式距离表示为Dtbj,m|t=||tarj|t- obsm|t||。
任务:在搜索范围内,无人机通过相互协作搜索目标;在避免碰撞的前提下,依靠探测到的目标信号、信息交互、自身的运动,无人机搜索目标位置;当所有待搜索的目标附近d0范围内均有无人机到达,即为完成目标搜索任务。
无人机:无人机uavi在时刻t的速度表示为Vvi|t,其大小满足0≤||Vvi|t||≤Vvm,Vvm表示无人机速度的最大值,为标量;且无人机所在位置均为栅格中心;考虑最大通信半径rcom,最大障碍物感知半径robs,最大目标探测半径rtar,无人机可实现功能为:Dvi1,i2|t≤rcom时,无人机之间通信;Dvti,j|t≤rtar时,探测目标信号;Dvbi,m|t≤robs时,获取障碍物方位。
目标:目标tarj在时刻t的速度表示为Vtj|t,其大小满足0<||Vtj|t||≤Vtm,Vtm表示目标速度的最大值,为标量;且目标所在位置任意;在群无人机搜索目标时,无人机通过传感器探测周围的目标信号,目标信号与距离满足一个受到环境干扰的函数,描述为目标信号探测函数,且用式(1)表示:
Figure BDA0003642391420000041
其中Ii,|t表示t时刻无人机uavi探测到的目标信号;η为环境干扰;G(Dvti,j|t)表示在无干扰的环境中目标信号与距离的关系;Dvtij|t客观存在但无人机无法得知,当无人机目标探测范围内有多个目标时,较弱目标信号将被较强目标信号覆盖,且无人机无法区分不同目标的信号。
假设1:各参数大小关系满足:Vtm<Vvm<<rtar≈robs<<rcom,且均已知;
本发明中的速度与粒子群算法中的速度相类似,表示每次迭代中无人机位置的变化量,亦可理解为单位时间内运动的距离,速度最大值Vtm和Vvm的单位与距离的单位相同。
假设2:所有参与目标搜索的无人机是同构的,被搜索的所有目标为同类型目标。
图2所示为部分搜索区域的示意图,图中与uavi距离小于Vvm的栅格,无人机可到达;由于目标可在任意位置,因此仅当栅格G(lo,la)内所有点与uavi距离小于rtar时,方记为可被探测。
步骤二:对无人机进行基于距离的动态任务分工,得到无人机对动态目标的搜索状态。
群无人机在搜索目标时,任务是搜索到任务区域内所有目标,而搜索某局部区域内的目标作为子任务,子任务数至多为nT,完成相同子任务的无人机组成子联盟,t时刻子联盟记为 TUJ|t,其中0≤J≤nT,序号J按照子联盟中探测到的最强目标信号从大到小排列,组成子联盟的无人机所处状态称为协同搜索状态,无人机按照以下方式组成子联盟:
无人机通过两种途径获取目标信号,由此将可获取目标信号的无人机分为两类:由自身传感器探测到目标信号的I类无人机和由无人机之间的通信获取目标信号的II类无人机,I 类无人机记为type_I,II类无人机记为type_II;首先,I类无人机分组,甄选出局部区域内目标信号最强的无人机uavi0,当附近其他I类无人机uavi与uavi0满足式(2),则与uavi0组成子联盟TU1|t;剩余不满足式(2)的I类无人机则继续甄选出目标信号最强的无人机
Figure BDA0003642391420000051
再在附近剩余的无人机中寻找与
Figure BDA0003642391420000052
关系符合式(2)的无人机组成子联盟,以此往复直至所有I类无人机均组成子联盟;然后,II类无人机加入最近的可通信I类无人机所在子联盟;
Figure BDA0003642391420000053
在子任务分配后,为了避免相同子联盟中无人机过多造成无人机资源浪费,进一步引入闭环调节,评估各个子联盟的资源分配:当某个子联盟的无人机数NJ>Nmax,该子联盟择优选取Nmax个无人机作为该子联盟个体,其中Nmax为子联盟无人机最大允许个数;择优原则为:优先选择I类无人机,I类无人机中优先选择目标信号强者,II类无人机中优先选择距离通信无人机近者。
任务分工实例见表1。取Nmax=6,nT=10,首先目标信号最大的uav19与满足式(2)的uav17结成子联盟,uav16成立子联盟,随后与I类无人机通信的II类无人机加入对应的子联盟。uav19、uav17与uav6、uav13、uav18;uav16与uav1、uav2、uav7、uav9、uav10、uav12组成子联盟,但部分子联盟总数NJ>Nmax,按照择优原则uav10退出子联盟。最后得到子联盟 TU1|t={uav19,uav17,uav13,uav6,uav18}和TU2|t={uav16,uav1,uav2,uav7,uav9,uav12},使得最终NJ≤Nmax并得到
Figure BDA0003642391420000054
Figure BDA0003642391420000055
表1
Figure BDA0003642391420000056
群无人机搜索多目标时,需要快速覆盖任务区域,同时在探测到目标信号后尽快地靠近目标,当某个无人机搜索到某个目标后该无人机将发起搜索到该目标的声明,直到所有目标均被搜索到,完成搜索任务。由此将无人机对动态目标的搜索分为三种状态:快速覆盖搜索区域的漫游状态(Roaming status,RS),组成子联盟的协同状态(Collaborativestatus,CS),搜索任务完成状态(Task completion status,TS);这三种状态可表示为图3所示的有限状态机(Finite State Machine)。
步骤三:判断无人机对动态目标的搜索状态,若无人机处于漫游状态,则进入步骤四,若处于协同搜索状态,则进入步骤五;若无人机处于搜索任务完成状态,则搜索任务已完成,结束所有操作。
步骤四:进行基于置信区域信息素的漫游搜索。
步骤四具体过程为:
(4-1)漫游搜索的主要目的为使得无人机快速探测到搜索区域内的每个角落,而无人机探测到一片区域后,在一定时间内,无需再次探测。为此该部分借鉴的置信区域,提出一种与置信区域相关的置信信息素。
为便于后续内容讨论,假设函数δ(D)函数表达式如下:
Figure BDA0003642391420000061
其中nr为矩阵D的列数,nl为矩阵D的行数,bζ,ξ为D中第ζ行第ξ列的数值;
函数
Figure BDA0003642391420000062
的表达式如下:
Figure BDA0003642391420000063
其中:
Figure BDA0003642391420000064
Figure BDA0003642391420000065
(4-2)定义动态目标搜索的置信区域及其信息素:
定义1:确定不存在目标的区域称为置信区域,记为Cz,非置信区域用
Figure BDA0003642391420000066
表示;
如图4的(a)所示,无人机uavi在时刻t0到达栅格区域内的P1位置,未探测到目标信号,无人机探测范围内为置信区域,在时刻t0+Δt无人机离开P1,Δt为时间增加量;由于目标速度有限,因此P1周围仍旧保持一定圆形区域的置信区域,置信区域边缘向P1移动的距离ΔU满足下式:
Figure BDA0003642391420000071
如图4的(b)所示,uavi在时刻(t1+Δt)到达P′1,若Δt足够小,此时P1与P′1对应的置信区域将形成连续的置信区域;在连续的运动轨迹上,单个无人机将形成如图5中(a)所示的置信区域。
推论1:将无人机探测目标分为三种情况:Case1:无人机附近距离小于等于rtar的范围内存在障碍物或任务环境的边界;Case2:无人机附近距离小于等于2rtar的范围内存在其他无人机;Case3:无人机附近距离小于等于rtar的范围内不存在障碍物或任务环境的边界,且距离小于等于2rtar的范围内无其他无人机;Case1和Case2相加的最大置信区域大于Case3的最大置信区域,Case3无人机探测得到的置信区域记为Cz,1,Case1和Case2相加比Case3多的置信区域记为Cz,2;如图5的(a)所示,在推论1的Case3单个无人机探测得到的置信区域记为Cz,1;如图5的(b)所示,在推论1的Case2中两个无人机协作而比各自探测多出的置信区域记为Cz,2
在任务环境内,置信区域用信息素表示;无人机存储不同位置的信息素强度,
Figure BDA0003642391420000072
表示uavi在t时刻存储的位置P0信息素,置信区域内信息素取值范围为[0,τm],τm为置信区域内信息素的最大值,即置信区域Cz,2的信息素取值;置信区域信息素在无人机所在栅格取最小值
Figure BDA0003642391420000073
置信区域Cz,2信息素取最大值
Figure BDA0003642391420000074
而非置信区域的信息素强度记为
Figure BDA0003642391420000075
图4的(a)中,t0时刻无人机uavi到达P1,该点信息素
Figure BDA0003642391420000078
以P1为圆心,rtar为半径的圆内为Cz,1;搜索区域内任意一点P0与P1的距离为dp≥0,P0的信息素为:
Figure BDA0003642391420000077
由式(7)和式(8)可知在满足置信区域性质与信息素取值范围的前提下,Cz,1边缘运动的距离与时间Δt、P0点信息素强度与距离dp均呈线性相关,因此当无人机远离P1,信息素变化量与时间Δt亦满足线性关系:
Figure BDA0003642391420000081
式中,ρ为信息素增强参数;当经过时间
Figure BDA0003642391420000082
P1变为置信区域Cz,2,该点信息素变为最大值
Figure BDA0003642391420000083
由此可得信息素增强参数ρ=τmVtm/rtar;当置信区域Cz,1的栅格信息素增加到τm时,变为置信区域Cz,2
对于图4的(a)中的P0的信息素变化满足下式:
Figure BDA0003642391420000084
在搜索区域内,为节约无人机存储空间,无人机仅存储每个栅格内一个点的信息素;用 PHi|t表示uavi在时刻t存储的所有栅格的信息素强度,PHi|t表示为式(11):
Figure BDA0003642391420000085
式中矩阵的任意元素
Figure BDA0003642391420000086
表示uavi存储的在时刻t栅格G(lo,la)的信息素。
目标可在搜索区域内的任意位置,因此仅当整个栅格在无人机探测区域内且无人机未探测到目标信号时方可判断该栅格无目标,属于置信区域。
在此对可探测的栅格下定义:
定义2:当某个栅格G(lo,la)最远点与无人机uavi距离||(G(lo,la)+0.5ΔL·δ(G(lo,la)- uavi))-uavi||≤rtar,该栅格称为可探测栅格,记为DG,uavi的所有可探测栅格所成集合记为DGi;与之相反,||(G(lo,la)+0.5ΔL·δ(G(lo,la)-uavi))-uavi||>rtar,G(lo,la)则被称为不可探测栅格,记为UG;若目标不可探测栅格存在相接的可探测栅格,则称之为最近不可探测栅格,记为NUG。
对于uavi,任意可探测栅格
Figure BDA0003642391420000091
的信息素满足下式:
Figure BDA0003642391420000092
ΔE为中间变量;在时间上采取了离散的迭代方式,由式(10)可知任意栅格G(lo,la)信息素的迭代关系满足下式:
Figure BDA0003642391420000093
对于区域Cz,2,当存在栅格
Figure BDA0003642391420000094
使得G(lo,la)符合下式时,G(lo,la)将变为非置信区域:
Figure BDA0003642391420000095
ΔH为中间变量;
当栅格
Figure BDA0003642391420000096
对于任意无人机uavi所存储的栅格信息素每次迭代更新5次,每次迭代中信息素的更新流程如下:
Step1:依式(13)计算并更新所有栅格信息素;
Step2:依式(12)计算并更新所有可探测栅格的信息素;
Step3:CUAVi={uavI1,uavI2,...,uavIn}表示可与uavi通信的无人机所成集合;uavi获取 CUAVi中所有无人机存储的信息素,并将其存储的所有栅格信息素依下式更新:
Figure BDA0003642391420000097
Step4:若uavi处于协同搜索状态,为子联盟
Figure BDA0003642391420000098
中任意无人机, TUJ中type_I无人机为
Figure BDA0003642391420000099
ype_II无人机为
Figure BDA00036423914200000910
集合
Figure BDA00036423914200000911
中所有栅格变为非置信区域,信息素依下式更新:
Figure BDA00036423914200000912
Step5:搜索范围内所有栅格的信息素依下式更新:
Figure BDA0003642391420000101
(4-3)设定漫游搜索速度:
定义3:当某个栅格G(lo,la)与无人机uavi距离||G(lo,la)-uavi||≤Vvm,该栅格称为可达栅格,记为RG,uavi的所有可达栅格所成集合记为RGi;在以uavi为中心连续的[-π,π)角度方向上,若某个可达栅格在某段角度方向上为距离无人机最远的可达栅格,则称该可达栅格为最远可达栅格。如图6,若Vvm=3ΔL,编号a~p的栅格为当前最远可达栅格(Furthestreachable grid,FRG)。
最远可达栅格与最近不可探测栅格存在着对应关系,假设某个最远可达栅格为角度区间 (θ1,θ2)方向上的最远可到达栅格,若无人机指向某个最近不可探测栅格最远点所成向量的角度在区间(θ1,θ2)范围内,则该最近不可探测栅格与该最远可达栅格对应;例如图6中的a与a1, b与b1、b2、b3等。
漫游状态下,为快速探测到更多区域,无人机在根据信息素得到速度方向后,以该方向最大速度运动,选择速度方向上最远可达栅格作为下一步所在位置;在更新完信息素之后,漫游状态下任意无人机uavi周围目标可探测栅格内的信息素将满足式(12),与uavi距离相同的栅格信息素相等;而不可探测栅格的信息素即使与无人机距离相同也将出现差异,uavi依据最近不可探测栅格的信息素强度决定下一步飞行方向。
uavi的最远可达栅格记为FGi,k,其中1≤k≤ki,re,k表示从x正半轴开始顺时针第k个最远可达栅格,ki,re为最远可达栅格数量;FGi,k对应的最近不可探测栅格的信息素记为Fphi,k,n,其中0≤n≤ni,gr,n表示顺时针第n个最近不可探测栅格,ni,gr为FGi,k对应的最近不可探测栅格的数量,uavi第k个最远可达栅格对应的最大信息素
Figure BDA0003642391420000102
uavi获取FGi,k和Fphi,k,max后,按照轮盘赌法更新速度,轮盘赌法用式(18)表示;随机数 ra~U(0,1),当Q(K-1)<ra<Q(K)时,uavi选择FGi,K作为下一步期望位置,而下一步期望速度Vvei|(t+1)满足式(19),式中FGi,K表示FGi,K位置,α表示运动学的惯性系数:
Figure BDA0003642391420000103
Vvei|(t+1)=αVvi|t+(1-α)(FGi,K-uavi|t) (19)
qk表示无人机选择最远可达栅格FGi,k作为下一步位置所在栅格的概率。
步骤五:进行基于概率限制粒子群算法的协同搜索。
将协同状态下的全局最优为子联盟中的最优的,称为半全局最优,记作sgbJ|t;而个体历史最优则为无人机个体加入子联盟后的历史最优,记为pbi|t
经典的PSO算法多用于静态目标搜索,不同时间同一位置上适应度函数值不变,因此个体历史最优和全局最优将一直保持其可信度。但在动态目标搜索中,随时间的变化同一位置的适应度函数值是变化的,个体历史最优和全局最优对系统寻优的可靠性随着迭代而逐渐降低,因此,半全局最优和个体历史最优的更新分别引入概率值,以概率值限制粒子群优化PSO 中最优的继承,同时改进个体历史最优的计算方式,提出概率限制的粒子群优化PFPSO。
假设时刻t无人机uavi所在位置的适应度函数表示为f(uavi|t),PFPSO的全局最优与个体历史最优的更新方式如下:
半全局最优引入全局最优概率值σj,其初始值为σ0,其中0<σ0<1;对于任意子联盟 TUJ|t,其中目标信号最强的I类无人机为uavJ,TUJ|t对应的半全局最优更新过程如下:
Step1:判断时刻(t-1)是否存在一个子联盟
Figure BDA0003642391420000111
其中目标信号最强的I类无人机
Figure BDA0003642391420000112
若存在,则赋值[0,1]之间均匀分布随机数rσ,并执行Step2;否则sgbJ|t=uavJ|t,σJ=σ0,更新结束;
Step2:若条件
Figure BDA0003642391420000113
成立,f()为公式(21) 表示的适应度函数,sgbJ|t=uavJ|t,σJ=σ0,更新结束;否则执行Step3;
Step3:
Figure BDA0003642391420000114
结束更新;其中
Figure BDA0003642391420000115
Figure BDA0003642391420000116
的半全局最优。
个体历史最优引入个体历史最优概率值μi,其初始值为μ0,其中0<μ0<1;对于任意一个在协同搜索状态下的无人机uavi,其个体历史最优pbi|t更新流程如下:
Step11:判断无人机何时加入子联盟,若在时刻t加入子联盟,按照式(20)更新pbi|t,并赋值μi=μ0,更新结束;否则赋值[0,1]之间均匀分布随机数rμ,并执行Step12;
Step12:若条件(f(uavi|t)≥f(pbi|(t-1)))||(f(uavi|t)<f(pbi|(t-1))&rμ≥μi)成立,按照式(20)更新pbi|t,并赋值μi=μ0,更新结束;否则执行Step13;
Step13:pbi|t=pbi|(t-1),μi=μi·μ0,更新结束。
在协同搜索状态的无人机分为两类:type_I和type_II;对于某子联盟中任意I类无人机,个体历史最优仍选择该个体历史上的最优位置;而对于某子联盟中任意II类无人机uavi,若 uavi的目标信息是通过通信从无人机
Figure BDA0003642391420000121
取,无人机个体历史最优为二者中点;无人机uavi的个体历史最优按照式(20)更新:
Figure BDA0003642391420000122
不同类型的协同搜索状态下的无人机,适应度函数计算方式不同;在任意子联盟中,若无人机uavi为type_I,适应度函数值即为传感器探测到的目标信号;若无人机uavi为type_II,
Figure BDA0003642391420000123
为其最近type_I通信无人机,适应度函数值取uavi与
Figure BDA0003642391420000124
距离的相反数,即:
Figure BDA0003642391420000125
综上所述概率限制的PSO期望速度计算由式(22)所示:
Figure BDA0003642391420000126
其中c1、c2分别为认知系数、社会系数,r1、r2是服从U(0,1)的随机数,ω为惯性权重,α是考虑运动学的惯性环节,pbi|t为无人机uavi在时刻t的个体历史最优,sgbJ|t为无人机uavi所属子联盟TUJ|t的半全局最优;Vvpi|(t+1)为中间变量。
无论无人机是处于协同状态还是漫游状态,都在计算出期望速度Vvei|(t+1)后考虑避障;以边界扫描避障策略为基础,将其改进为适应于栅格环境中的改进的边界扫描避障IBSOA,无人机避障时,将感知到的障碍物分为连续障碍物与不连续障碍物两种情形,避障方向分为逆时针避障与顺时针避障,无人机综合考虑感知到的障碍物情形与历史避障方向计算下一步速度。
由于地图的栅格化,将存在障碍物栅格称为障碍栅格;IBSOA忽略障碍物情形,综合考虑避障方向与障碍栅格进行避障;若无人机在漫游状态,且在其附近距离小于min(rtar,robs)的范围内存在障碍物,开始考虑避障;若无人机在协同状态,且在其附近距离小于Vvm的范围内存在障碍物,开始考虑避障;IBSOA的避障过程表示为下述两点:
1、无人机uavi在漫游状态,且在其附近距离小于min(rtar,robs)的范围内,<Vvei|(t+1)>方向上存在障碍栅格,uavi开始避障;uavi在时刻t的所有最远可达栅格所成集合记为FRGi|t,若存在栅格G(lo,la)∈FRGi|t,满足无人机位置uavi|t指向栅格位置G(lo,la)的射线在距离uavi|t小于min(rtar,robs)的范围内穿过障碍物栅格,则将栅格G(lo,la)从FRGi|t中剔除;当所有满足上述条件的栅格均已从FRGi|t剔除后,得到最后的栅格集合FOGi|t;uavi根据自身避障方向标志参数λi,决定考虑避障后的速度方向,λi初始值为0;
当λi=0,表示上一步未避障,从栅格集合FOGi|t中选取与Vvei|(t+1)角度差最小的栅格 Gni作为无人机uavi下一步将到达的栅格;
当λi=1,从栅格集合FOGi|t中选取在逆时针方向上与Vvei|(t+1)角度差栅格Gni作为无人机uavi下一步将到达的栅格;
当λi=-1,从栅格集合FOGi|t中选取在顺时针方向上与Vvei|(t+1)角度差最小的栅格Gni作为无人机uavi下一步将到达的栅格;
再根据栅格Gni及式(23),求解下一步速度Vvi|(t+1),式中Gni为Gni位置;得到速度后依据式(24)更新λi,计算避障速度结束:
Figure BDA0003642391420000131
λi=sgn(F(<Vvi|(t+1)>-<Vvei|(t+1)>)) (24)
2、无人机uavi在协同状态,且在其附近距离小于Vvm范围内,<Vvei|(t+1)>方向上存在障碍栅格,uavi开始避障;uavi在时刻t的所有可达栅格所成集合记为RGi|t;若G(lo,la)∈RGi|t满足,栅格位置G(lo,la)与无人机位置uavi|t之间连线经过障碍栅格,将该栅格从RGi|t剔除,当所有满足上述条件的栅格均已从RGi|t剔除后,得到最后的栅格集合OGi|t;根据避障方向标志参数λi,决定考虑避障后的速度方向,λi初始值为0;
当λi=0,表示上一步未避障,从栅格集合OGi|t中选取与(uavi|t+Vvei|(t+1))位置距离最近的无障碍物的可达栅格grdni作为无人机uavi下一步将到达的栅格;
当λi=1,从栅格集合OGi|t中选取在逆时针方向上与(uavi|t+Vvei|(t+1))位置距离最近的无障碍物的可达栅格grdni作为无人机uavi下一步将到达的栅格;
当λi=-1,从栅格集合OGi|t中选取在顺时针方向上与(uavi|t+Vvei|(t+1))位置距离最近的无障碍物的可达栅格grdni作为无人机uavi下一步将到达的栅格;
再根据栅格grdni及式(25),求解下一步速度Vvi|(t+1),式中grdni为grdni位置,得到速度后依据式(26)更新λi,计算避障速度结束;
Figure BDA0003642391420000141
λi=sgn(F(<Vvi|(t+1)>-<Vvei|(t+1)>)) (26)
在根据式(23)或(25)计算得到下一步速度Vvi|(t+1)后,依式(27)更新无人机位置,并判断是否搜索到目标:
uavi|(t+1)=uavi|t+Vvi|(t+1)(27)。
仿真验证
为验证分析文章所提算法性能,在MATLAB 2021a的仿真环境下,进行若干组对比实验,分别比较不同搜索模式之间的搜索效率和搜索能耗。
本发明考虑动态目标运动的随机性与惯性,设计目标的运动模型如下式所示,
Figure BDA0003642391420000142
此处r3和r4均服从均匀分布U(0,1),β为目标运动惯性常数。Vtri|(t+1)为随机速度;Vtei|(t+1)为目标下一步的随机期望速度。若Vtei|(t+1)方向Vtm范围内无障碍物,则 Vti|(t+1)=Vtei|(t+1),若有障碍物,则目标在Vtm范围内无障碍物的方向上生成一个大小为Vtm、方向随机的速度作为下一步速度Vti|(t+1)
参照对于目标信号的描述,将式(1)中详细设置为如下式
Figure BDA0003642391420000151
式中m是环境的衰减系数(0<m<1);Q是目标的恒定信号功率;η代表高斯白噪声,满足标准正态分布。
群无人机在仿真搜索过程中包含搜索主体——无人机,搜索对象——目标,搜索环境等不同参数的设置。
表2
Figure BDA0003642391420000152
图7至图16所示为群无人机根据PFPSO、CAP、IBSOA和DBDTA构成搜索算法模式PCDI,搜索多个运动目标的过程,图中所示的目标搜索中Nv=20,Nt=10,圆点表示无人机,五角星表示目标。图7呈现了目标搜索开始时的无人机、目标的位置及障碍物的分布;图16为整个搜索过程中所有目标和无人机的运动轨迹,可以明显看出,无人机在避开障碍物的前提下成功搜索到所有目标。图8~15为无人机视角下的置信区域信息素、无人机、障碍物及被搜索到的目标。运动的目标被搜索到后,目标将静止于被搜索时所在位置。
图7中,搜索环境与搜索对象初始化,其中无人机有规则地排列在左下角的区域内,目标和障碍物随机地分布在右上角的区域内。而图中表示的障碍物是静止的,其中每个目标的运动均满足式(4.23)表示的具有运动惯性的随机运动过程。
图8表示时刻,群无人机视角中的置信区域信息素;由图可知群无人机暂时无法得知目标及障碍物位置。
图9中,全体群无人机在经历一段时间的基于置信区域信息素的漫游搜索过程后;某个无人机首次探测到目标信号,然后根据基于距离的动态任务分工与附近几个无人机构建子联盟;由于探测到目标信号,说明探测区域内存在目标,部分置信区域变为非置信区域。
图10中,群无人机首次感知到障碍物,由于感知到障碍物的无人机所处状态为漫游搜索状态,该无人机立即以改进的边界扫描避障策略开始避障。
图11中,5个无人机构成的子联盟以概率限制的粒子群算法为基础,不断接近目标,最终完成对该局部区域的目标搜索。在搜索完成该局部区域内的目标后,子联盟将解散,其中的无人机重新变换到漫游搜索状态。
图12中,5个无人机构成子联盟,无人机进入协同搜索状态。构成的子联盟协同搜索该局部区域内的目标;而在图13中时刻,第6个无人机加入该子联盟,此刻加入子联盟的无人机进入协同搜索状态,并参与到该局部区域内的目标搜索中。
图14中,搜索完该局部区域的目标后,无人机解散子联盟并进入漫游搜索状态。无人机各自以置信区域信息素为启发,分散运动离开该区域,进而搜索其他非置信区域内的目标。
图15中,群无人机以PCDI模式为基础,完成对最后一个运动目标的搜索,同时所有目标被搜索到,搜索任务完成。
图16所示为目标搜索过程中所有目标及所有无人机的运动轨迹,五角星连接而成的轨迹为目标运动轨迹,黑色物体表示障碍物,点线构成的轨迹表示群无人机搜索目标时的轨迹。由图中轨迹可知,群无人机在搜索多运动目标时,不论处于协同搜索状态还是漫游搜索状态,以改进的边界扫描避障策略为指导,无人机均顺利地避开了障碍物。
为验证文中所提方法的有效性,以图1所示搜索框架为基础,设计搜索算法模式。保持避障均采用IBSOA,用DBDTA判断无人机是否需要加入子联盟;协同搜索和漫游搜索采用不同算法,构成如表3所示PCDI、PSDI、KCDI和KSDI四种搜索算法模式。其中KCPSO 为运动学约束的粒子群算法(Kinematic Constraints Particle Swarm Optimization),SVF为简化虚拟受力模型(Simplified Virtual Force model)。
表3
Figure BDA0003642391420000161
在无人机数量为Nv=20,30,40,50,60,70,80,90,100的情况下,分别用四种搜索模式,搜索图7所示环境中的目标。独立搜索进行搜索100次,统计不同无人机数量及不同搜索模式下搜索10个运动目标所需的总迭代步数——搜索目标需要的的迭代步数,总能耗——全体无人机的总运动距离,所得结果如表4所示。
表4
Figure BDA0003642391420000171
PCDI与KCDI、PSDI与KSDI两组模式对比可分析PFPSO的优劣,PFPSO相比于KCPSO搜索效率平均提高4.05%,总能耗平均减少3.08%,搜索稳定性平均提高30.45%。可以看出在无人机较少时,PFPSO的优势更为明显,但在无人机数接近100时,PFPSO比KCPSO仅有略微优势。在PCDI算法模式中的PFPSO更具优势;不论在何种模式中PFPSO体现出更高的稳定性。PCDI与PSDI、KCDI与KSDI两组模式对比可分析CAP。CAP相比于SVF,搜索效率平均提高22.55%,总能耗平均减少24.65%,搜索稳定性平均提高74.55%。在不同无人机总数的情况下,CAP相比于SVF的搜索性能都较为稳定的大幅提升,在搜索效率上,不同无人机总数的情况下均提高20%左右;在总能耗的减少上,大体上随着无人机总数的增加,性能提升得越高;在算法搜索稳定性上,不同无人机总数的情况下均有着大幅提升。
PCDI、PSDI、KCDI、KSDI四种搜索算法模式中,均有着相同的任务分工部分。在未知障碍物环境下搜索多个运动目标时,群无人机运用四种搜索算法模式均有效地完成了对多个目标的搜索。进而验证了基于距离的动态任务分工在搜索算法中的有效性。将表4数据中的平均值可视化,得到图17;图中所示曲线体现不论无人机总数,搜索算法模式的算法性能从优至劣的排序基本为PCDI、KCDI、PSDI、KSDI。
本发明将目标信号模型改进,使得模型更广泛地适应现有传感器功能;在改进的搜索模型基础上,提出适应于改进的目标信号模型下的基于距离的动态任务分工方法。将未知障碍物环境栅格化,并以置信区域为基础提出置信区域的置信区域信息素。并分析粒子群算法个体极值与全局极值的可靠性,为保证极值的可靠性而提出概率限制的粒子群算法。
经仿真验证,基于距离的动态任务分工适用于群无人机的任务分工部分。经过不同搜索算法模式的比较,置信区域信息素大大提高多运动目标搜索的性能,在搜索效率、能耗节约、搜索稳定性上均有着大幅度的提高;概率限制的粒子群算法虽然在搜索效率、能耗节约上仅有略微提升,甚至在某些情况下总能耗高于传统方法,但在搜索稳定性上有着显著提高。

Claims (7)

1.一种基于信息素启发的群无人机多运动目标搜索方法,其特征在于,包括以下步骤:
步骤一:建立群无人机多动态目标搜索模型;
步骤二:对无人机进行基于距离的动态任务分工,得到无人机对动态目标的搜索状态;
步骤三:判断无人机对动态目标的搜索状态,若无人机处于漫游状态,则进入步骤四,若处于协同搜索状态,则进入步骤五;若无人机处于搜索任务完成状态,则搜索任务已完成,结束所有操作;
步骤四:进行基于置信区域信息素的漫游搜索;
步骤五:进行基于概率限制粒子群算法的协同搜索。
2.根据权利要求1所述的基于信息素启发的群无人机多运动目标搜索方法,其特征在于,所述步骤一中,建立的群无人机多动态目标搜索模型包括:
任务环境:任务区域考虑为无人机高度不变的二维区域;在长×宽为Lv×Lh的栅格区域内,单个栅格用G(lo,la)表示,其中1≤lo≤Lv,1≤la≤Lh,栅格边长为ΔL0,用栅格中心(lo,la)表示栅格的位置,记为G(lo,la)
任务对象:对象表示为全集A=UAV∪T∪B;其中集合UAV={uavi|i=1,2,...,nV;10≤nV≤100}表示无人机,nV表示无人机的总数量;集合T={tarj|j=1,2,...,nT;nT≥1}表示目标,nT表示目标的总数量;集合B={obsm|m=1,2,...,nB;nB≥1}表示障碍物,nB表示障碍物的总数量;t时刻,无人机uavi、目标tarj、障碍物obsm的位置分别为uavi|t、tarj|t、obsm|t;无人机uavi1与无人机uavi2之间的欧式距离表示为Dvi1,i2|t=||uavi1|t-uavi2|t||,i1=1,2,...,nV,i2=1,2,...,nV,且i1≠i2;无人机uavi与目标tarj之间的欧式距离表示为Dvti,j|t=||uavi|t-tarj|t||;无人机uavi与障碍物obsm之间的欧式距离为Dvbi,m|t=||uavi|t-obsm|t||;目标tarj与障碍物obsm之间的欧式距离表示为Dtbj,m|t=||tarj|t-obsm|t||;
任务:在搜索范围内,无人机通过相互协作搜索目标;在避免碰撞的前提下,依靠探测到的目标信号、信息交互、自身的运动,无人机搜索目标位置;当所有待搜索的目标附近d0范围内均有无人机到达,即为完成目标搜索任务;
无人机:无人机uavi在时刻t的速度表示为Vvi|t,其大小满足0≤||Vvi|t||≤Vvm,Vvm表示无人机速度的最大值,为标量;且无人机所在位置均为栅格中心;考虑最大通信半径rcom,最大障碍物感知半径robs,最大目标探测半径rtar,无人机可实现功能为:Dvi1,i2|t≤rcom时,无人机之间通信;Dvti,j|t≤rtar时,探测目标信号;Dvbi,m|t≤robs时,获取障碍物方位;
目标:目标tarj在时刻t的速度表示为Vtj|t,其大小满足0<||Vtj|t||≤Vtm,Vtm表示目标速度的最大值,为标量;且目标所在位置任意;在群无人机搜索目标时,无人机通过传感器探测周围的目标信号,目标信号与距离满足一个受到环境干扰的函数,描述为目标信号探测函数,且用式(1)表示:
Figure FDA0003642391410000021
其中Ii,|t表示t时刻无人机uavi探测到的目标信号;η为环境干扰;G(Dvti,j|t)表示在无干扰的环境中目标信号与距离的关系;Dvti,j|t客观存在但无人机无法得知,当无人机目标探测范围内有多个目标时,较弱目标信号将被较强目标信号覆盖,且无人机无法区分不同目标的信号;
假设1:各参数大小关系满足:Vtm<Vvm<<rtar≈robs<<rcom,且均已知;
假设2:所有参与目标搜索的无人机是同构的,被搜索的所有目标为同类型目标。
3.根据权利要求2所述的基于信息素启发的群无人机多运动目标搜索方法,其特征在于,所述步骤二中,群无人机在搜索目标时,任务是搜索到任务区域内所有目标,而搜索某局部区域内的目标作为子任务,子任务数至多为nT,完成相同子任务的无人机组成子联盟,t时刻子联盟记为TUJ|t,其中0≤J≤nT,序号J按照子联盟中探测到的最强目标信号从大到小排列,组成子联盟的无人机所处状态称为协同搜索状态,无人机按照以下方式组成子联盟:
无人机通过两种途径获取目标信号,由此将可获取目标信号的无人机分为两类:由自身传感器探测到目标信号的I类无人机和由无人机之间的通信获取目标信号的II类无人机,I类无人机记为type_I,II类无人机记为type_II;首先,I类无人机分组,甄选出局部区域内目标信号最强的无人机uavi0,当附近其他I类无人机uavi与uavi0满足式(2),则与uavi0组成子联盟TU1|t;剩余不满足式(2)的I类无人机则继续甄选出目标信号最强的无人机
Figure FDA0003642391410000022
再在附近剩余的无人机中寻找与
Figure FDA0003642391410000023
关系符合式(2)的无人机组成子联盟,以此往复直至所有I类无人机均组成子联盟;然后,II类无人机加入最近的可通信I类无人机所在子联盟;
Figure FDA0003642391410000031
4.根据权利要求3所述的基于信息素启发的群无人机多运动目标搜索方法,其特征在于,所述步骤二中,在子任务分配后,为了避免相同子联盟中无人机过多造成无人机资源浪费,进一步引入闭环调节,评估各个子联盟的资源分配:当某个子联盟的无人机数NJ>Nmax,该子联盟择优选取Nmax个无人机作为该子联盟个体,其中Nmax为子联盟无人机最大允许个数;择优原则为:优先选择I类无人机,I类无人机中优先选择目标信号强者,II类无人机中优先选择距离通信无人机近者;
将无人机对动态目标的搜索分为三种状态:快速覆盖搜索区域的漫游状态、组成子联盟的协同状态和搜索任务完成状态。
5.根据权利要求3所述的基于信息素启发的群无人机多运动目标搜索方法,其特征在于,所述步骤四具体过程为:
(4-1)假设函数δ(D)函数表达式如下:
Figure FDA0003642391410000032
其中nr为矩阵D的列数,nl为矩阵D的行数,bζ,ξ为D中第ζ行第ξ列的数值;
函数
Figure FDA0003642391410000033
的表达式如下:
Figure FDA0003642391410000034
其中:
Figure FDA0003642391410000035
Figure FDA0003642391410000036
(4-2)定义动态目标搜索的置信区域及其信息素:
定义1:确定不存在目标的区域称为置信区域,记为Cz,非置信区域用
Figure FDA0003642391410000037
表示;
无人机uavi在时刻t0到达栅格区域内的P1位置,未探测到目标信号,无人机探测范围内为置信区域,在时刻t0+Δt无人机离开P1,Δt为时间增加量;由于目标速度有限,因此P1周围仍旧保持一定圆形区域的置信区域,置信区域边缘向P1移动的距离ΔU满足下式:
Figure FDA0003642391410000041
uavi在时刻(t0+Δt)到达P′1,若Δt足够小,此时P1与P′1对应的置信区域将形成连续的置信区域;
推论1:将无人机探测目标分为三种情况:Case1:无人机附近距离小于等于rtar的范围内存在障碍物或任务环境的边界;Case2:无人机附近距离小于等于2rtar的范围内存在其他无人机;Case3:无人机附近距离小于等于rtar的范围内不存在障碍物或任务环境的边界,且距离小于等于2rtar的范围内无其他无人机;Case1和Case2相加的最大置信区域大于Case3的最大置信区域,Case3无人机探测得到的置信区域记为Cz,1,Case1和Case2相加比Case3多的置信区域记为Cz,2
在任务环境内,置信区域用信息素表示;无人机存储不同位置的信息素强度,
Figure FDA0003642391410000042
表示uavi在t时刻存储的位置P0信息素,置信区域内信息素取值范围为[0,τm],τm为置信区域内信息素的最大值,即置信区域Cz,2的信息素取值;置信区域信息素在无人机所在栅格取最小值
Figure FDA0003642391410000043
置信区域Cz,2信息素取最大值
Figure FDA0003642391410000044
而非置信区域的信息素强度记为
Figure FDA0003642391410000045
t0时刻无人机uavi到达P1,该点信息素
Figure FDA0003642391410000046
以P1为圆心,rtar为半径的圆内为Cz,1;搜索区域内任意一点P0与P1的距离为dp≥0,P0的信息素为:
Figure FDA0003642391410000047
由式(7)和式(8)可知在满足置信区域性质与信息素取值范围的前提下,Cz,1边缘运动的距离与时间Δt、P0点信息素强度与距离dp均呈线性相关,因此当无人机远离P1,信息素变化量与时间Δt亦满足线性关系:
Figure FDA0003642391410000048
式中,ρ为信息素增强参数;当经过时间
Figure FDA0003642391410000049
P1变为置信区域Cz,2,该点信息素变为最大值
Figure FDA00036423914100000410
由此可得信息素增强参数ρ=τmVtm/rtar;当置信区域Cz,1的栅格信息素增加到τm时,变为置信区域Cz,2
P0的信息素变化满足下式:
Figure FDA0003642391410000051
在搜索区域内,为节约无人机存储空间,无人机仅存储每个栅格内一个点的信息素;用PHi|t表示uavi在时刻t存储的所有栅格的信息素强度,PHi|t表示为式(11):
Figure FDA0003642391410000052
式中矩阵的任意元素
Figure FDA0003642391410000053
表示uavi存储的在时刻t栅格G(lo,la)的信息素;
目标可在搜索区域内的任意位置,因此仅当整个栅格在无人机探测区域内且无人机未探测到目标信号时方可判断该栅格无目标,属于置信区域;在此对可探测的栅格下定义:
定义2:当某个栅格G(lo,la)最远点与无人机uavi距离||(G(lo,la)+0.5ΔL·δ(G(lo,la)-uavi))-uavi||≤rtar,该栅格称为可探测栅格,记为DG,uavi的所有可探测栅格所成集合记为DGi;与之相反,||(G(lo,la)+0.5ΔL·δ(G(lo,la)-uavi))-uavi||>rtar,G(lo,la)则被称为不可探测栅格,记为UG;若目标不可探测栅格存在相接的可探测栅格,则称之为最近不可探测栅格,记为NUG;
对于uavi,任意可探测栅格
Figure FDA0003642391410000055
的信息素满足下式:
Figure FDA0003642391410000054
ΔE为中间变量;在时间上采取了离散的迭代方式,由式(10)可知任意栅格G(lo,la)信息素的迭代关系满足下式:
Figure FDA0003642391410000061
对于区域Cz,2,当存在栅格
Figure FDA0003642391410000062
使得G(lo,la)符合下式时,G(lo,la)将变为非置信区域:
Figure FDA0003642391410000063
ΔH为中间变量;
当栅格
Figure FDA0003642391410000064
对于任意无人机uavi所存储的栅格信息素每次迭代更新5次,每次迭代中信息素的更新流程如下:
Step1:依式(13)计算并更新所有栅格信息素;
Step2:依式(12)计算并更新所有可探测栅格的信息素;
Step3:CUAVi={uavI1,uavI2,...,uavIn}表示可与uavi通信的无人机所成集合;uavi获取CUAVi中所有无人机存储的信息素,并将其存储的所有栅格信息素依下式更新:
Figure FDA0003642391410000065
Step4:若uavi处于协同搜索状态,为子联盟
Figure FDA0003642391410000066
中任意无人机,TUJ中type_I无人机为
Figure FDA0003642391410000067
type_II无人机为
Figure FDA0003642391410000068
集合
Figure FDA0003642391410000069
中所有栅格变为非置信区域,信息素依下式更新:
Figure FDA00036423914100000610
Step5:搜索范围内所有栅格的信息素依下式更新:
Figure FDA00036423914100000611
(4-3)设定漫游搜索速度:
定义3:当某个栅格G(lo,la)与无人机uavi距离||G(lo,la)-uavi||≤Vvm,该栅格称为可达栅格,记为RG,uavi的所有可达栅格所成集合记为RGi;在以uavi为中心连续的[-π,π)角度方向上,若某个可达栅格在某段角度方向上为距离无人机最远的可达栅格,则称该可达栅格为最远可达栅格;
最远可达栅格与最近不可探测栅格存在着对应关系,假设某个最远可达栅格为角度区间(θ1,θ2)方向上的最远可到达栅格,若无人机指向某个最近不可探测栅格最远点所成向量的角度在区间(θ1,θ2)范围内,则该最近不可探测栅格与该最远可达栅格对应;
漫游状态下,为快速探测到更多区域,无人机在根据信息素得到速度方向后,以该方向最大速度运动,选择速度方向上最远可达栅格作为下一步所在位置;在更新完信息素之后,漫游状态下任意无人机uavi周围目标可探测栅格内的信息素将满足式(12),与uavi距离相同的栅格信息素相等;而不可探测栅格的信息素即使与无人机距离相同也将出现差异,uavi依据最近不可探测栅格的信息素强度决定下一步飞行方向;
uavi的最远可达栅格记为FGi,k,其中1≤k≤ki,re,k表示从x正半轴开始顺时针第k个最远可达栅格,ki,re为最远可达栅格数量;FGi,k对应的最近不可探测栅格的信息素记为Fphi,k,n,其中0≤n≤ni,gr,n表示顺时针第n个最近不可探测栅格,ni,gr为FGi,k对应的最近不可探测栅格的数量,uavi第k个最远可达栅格对应的最大信息素
Figure FDA0003642391410000071
uavi获取FGi,k和Fphi,k,max后,按照轮盘赌法更新速度,轮盘赌法用式(18)表示;随机数ra~U(0,1),当Q(K-1)<ra<Q(K)时,uavi选择FGi,K作为下一步期望位置,而下一步期望速度Vvei|(t+1)满足式(19),式中FGi,K表示FGi,K位置,α表示运动学的惯性系数:
Figure FDA0003642391410000072
Vvei|(t+1)=aVvi|t+(1-α)(FGi,K-uavi|t) (19)
qk表示无人机选择最远可达栅格FGi,k作为下一步位置所在栅格的概率。
6.根据权利要求5所述的基于信息素启发的群无人机多运动目标搜索方法,其特征在于,所述步骤五中:
将协同状态下的全局最优为子联盟中的最优的,称为半全局最优,记作sgbJ|t;而个体历史最优则为无人机个体加入子联盟后的历史最优,记为pbi|t
在动态目标搜索中,随时间的变化同一位置的适应度函数值是变化的,个体历史最优和全局最优对系统寻优的可靠性随着迭代而逐渐降低,因此,半全局最优和个体历史最优的更新分别引入概率值,以概率值限制粒子群优化PSO中最优的继承,同时改进个体历史最优的计算方式,提出概率限制的粒子群优化PFPSO;
假设时刻t无人机uavi所在位置的适应度函数表示为f(uavi|t),PFPSO的全局最优与个体历史最优的更新方式如下:
半全局最优引入全局最优概率值σj,其初始值为σ0,其中0<σ0<1;对于任意子联盟TUJ|t,其中目标信号最强的I类无人机为uavJ,TUJ|t对应的半全局最优更新过程如下:
Step1:判断时刻(t-1)是否存在一个子联盟
Figure FDA0003642391410000081
其中目标信号最强的I类无人机
Figure FDA0003642391410000082
若存在,则赋值[0,1]之间均匀分布随机数rσ,并执行Step2;否则sgbJ|t=uavJ|t,σJ=σ0,更新结束;
Step2:若条件
Figure FDA0003642391410000083
成立,f()为公式(21)表示的适应度函数,sgbJ|t=uavJ|t,σJ=σ0,更新结束;否则执行Step3;
Step3:
Figure FDA0003642391410000084
Figure FDA0003642391410000085
结束更新;其中
Figure FDA0003642391410000086
Figure FDA0003642391410000087
的半全局最优;
个体历史最优引入个体历史最优概率值μi,其初始值为μ0,其中0<μ0<1;对于任意一个在协同搜索状态下的无人机uavi,其个体历史最优pbi|t更新流程如下:
Step11:判断无人机何时加入子联盟,若在时刻t加入子联盟,按照式(20)更新pbi|t,并赋值μi=μ0,更新结束;否则赋值[0,1]之间均匀分布随机数rμ,并执行Step12;
Step12:若条件(f(uavi|t)≥f(pbi|(t-1)))||(f(uavi|t)<f(pbi|(t-1))&rμ≥μi)成立,按照式(20)更新pbi|t,并赋值μi=μ0,更新结束;否则执行Step13;
Step13:pbi|t=pbi|(t-1),μi=μi·μ0,更新结束;
在协同搜索状态的无人机分为两类:type_I和type_II;对于某子联盟中任意I类无人机,个体历史最优仍选择该个体历史上的最优位置;而对于某子联盟中任意II类无人机uavi,若uavi的目标信息是通过通信从无人机
Figure FDA0003642391410000088
取,无人机个体历史最优为二者中点;无人机uavi的个体历史最优按照式(20)更新:
Figure FDA0003642391410000091
不同类型的协同搜索状态下的无人机,适应度函数计算方式不同;在任意子联盟中,若无人机uavi为type_I,适应度函数值即为传感器探测到的目标信号;若无人机uavi为type_II,
Figure FDA0003642391410000092
为其最近type_I通信无人机,适应度函数值取uavi
Figure FDA0003642391410000093
距离的相反数,即:
Figure FDA0003642391410000094
综上所述概率限制的PSO期望速度计算由式(22)所示:
Figure FDA0003642391410000095
其中c1、c2分别为认知系数、社会系数,r1、r2是服从U(0,1)的随机数,ω为惯性权重,α是考虑运动学的惯性环节,pbi|t为无人机uavi在时刻t的个体历史最优,sgbJ|t为无人机uavi所属子联盟TUJ|t的半全局最优;Vvpi|(t+1)为中间变量。
7.根据权利要求6所述的基于信息素启发的群无人机多运动目标搜索方法,其特征在于,步骤四或步骤五中,无论无人机是处于协同状态还是漫游状态,都在计算出期望速度Vvei|(t+1)后考虑避障;以边界扫描避障策略为基础,将其改进为适应于栅格环境中的改进的边界扫描避障IBSOA,无人机避障时,将感知到的障碍物分为连续障碍物与不连续障碍物两种情形,避障方向分为逆时针避障与顺时针避障,无人机综合考虑感知到的障碍物情形与历史避障方向计算下一步速度;
由于地图的栅格化,将存在障碍物栅格称为障碍栅格;IBSOA忽略障碍物情形,综合考虑避障方向与障碍栅格进行避障;若无人机在漫游状态,且在其附近距离小于min(rtar,robs)的范围内存在障碍物,开始考虑避障;若无人机在协同状态,且在其附近距离小于Vvm的范围内存在障碍物,开始考虑避障;IBSOA的避障过程表示为下述两点:
1、无人机uavi在漫游状态,且在其附近距离小于min(rtar,robs)的范围内,<Vvei|(t+1)>方向上存在障碍栅格,uavi开始避障;uavi在时刻t的所有最远可达栅格所成集合记为FRGi|t,若存在栅格G(lo,la)∈FRGi|t,满足无人机位置uavi|t指向栅格位置G(lo,la)的射线在距离uavi|t小于min(rtar,robs)的范围内穿过障碍物栅格,则将栅格G(lo,la)从FRGi|t中剔除;当所有满足上述条件的栅格均已从FRGi|t剔除后,得到最后的栅格集合FOGi|t;uavi根据自身避障方向标志参数λi,决定考虑避障后的速度方向,λi初始值为0;
当λi=0,表示上一步未避障,从栅格集合FOGi|t中选取与Vvei|(t+1)角度差最小的栅格Gni作为无人机uavi下一步将到达的栅格;
当λi=1,从栅格集合FOGi|t中选取在逆时针方向上与Vvei|(t+1)角度差栅格Gni作为无人机uavi下一步将到达的栅格;
当λi=-1,从栅格集合FOGi|t中选取在顺时针方向上与Vvei|(t+1)角度差最小的栅格Gni作为无人机uavi下一步将到达的栅格;
再根据栅格Gni及式(23),求解下一步速度Vvi|(t+1),式中Gni为Gni位置;得到速度后依据式(24)更新λi,计算避障速度结束:
Figure FDA0003642391410000101
λi=sgn(F(<Vvi|(t+1)>-<Vvei|(t+1)>)) (24)
2、无人机uavi在协同状态,且在其附近距离小于Vvm范围内,<Vvei|(t+1)>方向上存在障碍栅格,uavi开始避障;uavi在时刻t的所有可达栅格所成集合记为RGi|t;若G(lo,la)∈RGi|t满足,栅格位置G(lo,la)与无人机位置uavi|t之间连线经过障碍栅格,将该栅格从RGi|t剔除,当所有满足上述条件的栅格均已从RGi|t剔除后,得到最后的栅格集合OGi|t;根据避障方向标志参数λi,决定考虑避障后的速度方向,λi初始值为0;
当λi=0,表示上一步未避障,从栅格集合OGi|t中选取与(uavi|t+Vvei|(t+1))位置距离最近的无障碍物的可达栅格grdni作为无人机uavi下一步将到达的栅格;
当λi=1,从栅格集合OGi|t中选取在逆时针方向上与(uavi|t+Vvei|(t+1))位置距离最近的无障碍物的可达栅格grdni作为无人机uavi下一步将到达的栅格;
当λi=-1,从栅格集合OGi|t中选取在顺时针方向上与(uavi|t+Vvei|(t+1))位置距离最近的无障碍物的可达栅格grdni作为无人机uavi下一步将到达的栅格;
再根据栅格grdni及式(25),求解下一步速度Vvi|(t+1),式中grdni为grdni位置,得到速度后依据式(26)更新λi,计算避障速度结束;
Figure FDA0003642391410000111
λi=sgn(F(<Vvi|(t+1)>-<Vvei|(t+1)>)) (26)
在根据式(23)或(25)计算得到下一步速度Vvi|(t+1)后,依式(27)更新无人机位置,并判断是否搜索到目标:
uavi|(t+1)=uavi|t+Vvi|(t+1) (27)。
CN202210522719.6A 2022-05-13 2022-05-13 一种基于信息素启发的群无人机多运动目标搜索方法 Pending CN115237151A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210522719.6A CN115237151A (zh) 2022-05-13 2022-05-13 一种基于信息素启发的群无人机多运动目标搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210522719.6A CN115237151A (zh) 2022-05-13 2022-05-13 一种基于信息素启发的群无人机多运动目标搜索方法

Publications (1)

Publication Number Publication Date
CN115237151A true CN115237151A (zh) 2022-10-25

Family

ID=83668434

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210522719.6A Pending CN115237151A (zh) 2022-05-13 2022-05-13 一种基于信息素启发的群无人机多运动目标搜索方法

Country Status (1)

Country Link
CN (1) CN115237151A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117744909A (zh) * 2024-02-19 2024-03-22 华芯(嘉兴)智能装备有限公司 天车的漫游控制方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117744909A (zh) * 2024-02-19 2024-03-22 华芯(嘉兴)智能装备有限公司 天车的漫游控制方法及装置
CN117744909B (zh) * 2024-02-19 2024-05-14 华芯(嘉兴)智能装备有限公司 天车的漫游控制方法及装置

Similar Documents

Publication Publication Date Title
CN109254588B (zh) 一种基于交叉变异鸽群优化的无人机集群协同侦察方法
Khan et al. Cooperative robots to observe moving targets
Lin et al. A Novel Improved Bat Algorithm in UAV Path Planning.
Yao et al. Gaussian mixture model and receding horizon control for multiple UAV search in complex environment
Yu et al. Cooperative path planning for target tracking in urban environments using unmanned air and ground vehicles
Tang et al. Dynamic reallocation model of multiple unmanned aerial vehicle tasks in emergent adjustment scenarios
CN111487995B (zh) 基于三维简化虚拟模型的群无人机多目标搜索协作方法
de Moraes et al. Distributed control for groups of unmanned aerial vehicles performing surveillance missions and providing relay communication network services
Ren et al. Overview of recent research in distributed multi-agent coordination
CN112130587A (zh) 一种针对机动目标的多无人机协同跟踪方法
CN114020031B (zh) 基于改进鸽群优化的无人机集群协同动态目标搜索方法
Sujit et al. Self assessment-based decision making for multiagent cooperative search
CN112733251B (zh) 一种多无人飞行器协同航迹规划方法
CN111857161A (zh) 未知复杂凸环境下群机器人多目标搜索方法
CN114679729B (zh) 一种雷达通信一体化的无人机协同多目标探测方法
CN113805609A (zh) 一种混沌迷失鸽群优化机制的无人机群目标搜索方法
CN115237151A (zh) 一种基于信息素启发的群无人机多运动目标搜索方法
Xue et al. Multi-agent deep reinforcement learning for UAVs navigation in unknown complex environment
CN112405547B (zh) 未知环境下的群机器人多目标搜索方法
Peterson Dynamic grouping of cooperating vehicles using a receding horizon controller for ground target search and track missions
Chen et al. Cooperative distributed target tracking algorithm in mobile wireless sensor networks
Khosravi et al. Cooperative control for multi-target interception with sensing and communication limitations: A game-theoretic approach
Priandana et al. Persistent Monitoring for Indoor Farming using Static and Mobile Sensors
Zhang et al. The Application of Multiple Ant Colony Algorithm to Cooperative Task Allocation in UUVs Swarm
Zhang et al. A distributed persistent coverage algorithm of multiple unmanned aerial vehicles in complex mission areas

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination