CN110147099B - 一种基于改进鸽群优化的多无人机协同搜索方法 - Google Patents

一种基于改进鸽群优化的多无人机协同搜索方法 Download PDF

Info

Publication number
CN110147099B
CN110147099B CN201910361354.1A CN201910361354A CN110147099B CN 110147099 B CN110147099 B CN 110147099B CN 201910361354 A CN201910361354 A CN 201910361354A CN 110147099 B CN110147099 B CN 110147099B
Authority
CN
China
Prior art keywords
grid
pigeon
time
search
unmanned aerial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910361354.1A
Other languages
English (en)
Other versions
CN110147099A (zh
Inventor
陈志�
袁广进
岳文静
汪皓平
狄小娟
董阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN201910361354.1A priority Critical patent/CN110147099B/zh
Publication of CN110147099A publication Critical patent/CN110147099A/zh
Application granted granted Critical
Publication of CN110147099B publication Critical patent/CN110147099B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0221Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0223Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving speed control of the vehicle
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0276Control of position or course in two dimensions specially adapted to land vehicles using signals provided by a source external to the vehicle
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Automation & Control Theory (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明公开了一种基于改进鸽群优化的多无人机协同搜索方法,包括:首先建立搜索地图模型,并使用马尔科夫模型来建立目标信息图,然后建立无人机的运动模型和数字信息素图;应用鸽群优化算法进行多无人机的协同搜索,在初始化种群位置时使用混沌和反向策略来实现,确保初始位置的随机性;第一阶段进行地图和指南针算子的迭代时,使用柯西变异防止陷入局部最优,第二阶段进行地标算子的迭代时,使用模拟退火保留部分表现较差的个体以及高斯变异避免早熟陷入局部最优。本发明将使用混沌和反向策略初始化种群位置、为了避免陷入局部最优而引入的变异和模拟退火算法相结合,解决了搜索过程中的动态目标和重复搜索问题,同时有效的提高了搜索的效率。

Description

一种基于改进鸽群优化的多无人机协同搜索方法
技术领域
本发明涉及一种基于改进鸽群优化的多无人机协同搜索方法,属于协同搜索、群体智能优化领域。
背景技术
自上世纪90年代以来,通过模拟和揭示某些自然现象或者过程而得出的算法得到了发展,如:粒子群算法、蚁群算法以及本文提及的鸽群算法等。这些算法具有独特的优点和机制,并且为解决复杂问题提供了新的思路和手段,在很多领域应用广泛。这些算法因其构造的直观性和自然机理,所以被称为群智能优化算法。
群智能(Swarm Intelligence)中的群体是一组相互之间可以进行直接通信或者间接通信的主体(Agent),这些主体能够通过合作进行分布式问题的求解。而群智能则是指在没有集中控制且不提供全局模型的前提下,为寻找复杂的分布式问题求解方案提供了基础。
鸽群优化算法(Pigeon-inspired optimization algorithm)是受自然界鸽群自主归巢行为的启发而提出的。鸽群的远距离归巢行为是借助于地磁场和地貌景观的双重帮助,通过地磁场判断大致的方向,再根据地貌景观对实际方向进行修正,达到准确锁定位置的目的。受自然界中鸽子归巢行为的启发,Duan等于2014年首次提出了一种基于鸽子归巢行为的新型群体智能优化算法----鸽群优化(pigeon-inspired optimization,PIO)算法。虽然自提出至今时间不长,但是这个算法模型在无人机编队、多无人机路径规划与协同搜索、控制参数优化以及图像处理领域等多个领域进行了应用。鸽群优化算法的数学模型分为两个算子模型:地图和指南针算子(map and compass operator)和地标算子(landmarkoperator)。基本的鸽群优化算法(PIO)具有收敛速度快、搜索效率高的特点,但是极易陷入局部最优。本文使用混沌和反向策略使得初始种群位置足够随机,之后再使用柯西变异确保跳出局部最优,在搜索进入地标算子阶段时,使用高斯变异,这样使得在局部收敛中更快。
发明内容
发明目的:为了克服现有技术中多无人机协同搜索存在的重复搜索、搜索目标静态以及效率低的问题,本发明提供一种基于改进鸽群优化的多无人机协同搜索方法,将使用混沌和反向策略初始化种群位置、为了避免陷入局部最优而引入的变异和模拟退火算法相结合,有效提高多无人机对动态目标的搜索效率以及降低搜索重复区域。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种基于改进鸽群优化的多无人机协同搜索方法,包括以下步骤:
步骤1)建立多无人机搜索地图模型,所述地图模型包括搜索区域、目标信息图和环境信息图;
步骤1.1)步骤1)中的搜索区域L使用正六边形构造,并离散成Lx*Ly的网格,其中Lx是搜索区域L的长度,Ly是搜索区域L的宽度;
步骤1.2)步骤1)中的目标信息图表示特定网格存在目标的概率:
Figure BDA0002046904420000021
式中,所述p(x,y,t+1)表示t+1时刻在网格(x,y)的目标存在概率,δ(t)=1表示t时刻在网格(x,y)搜索到目标,δ(t)=0表示t时刻在网格(x,y)未搜索到目标,Pd表示传感器探测概率,Pf表示传感器虚警概率,且p(x,y,t+1)的初始值为:
Figure BDA0002046904420000022
式中,(x0,y0)表示目标初始位置的中心位置,f(x,y)表示目标位置的联合概率密度函数,且
Figure BDA0002046904420000023
所述f(x,y)中σ0 2表示二维正态分布的方差;
步骤1.3)步骤1)中的环境信息图表示无人机对环境不确定性的响应:
Figure BDA0002046904420000024
式中,所述ud(x,y,t)表示环境的不确定性,所述H[p(x,y,t)]表示p(x,y,t)的熵,H[p(x,y,t)]=-p(x,y,t)log2p(x,y,t)-(1-p(x,y,t))log2(1-p(x,y,t));
步骤2)建立无人机的运动模型:控制所有的无人机飞行在相同高度,在t时刻第i架无人机的状态信息UAVi=[posi(t),Oi(t)],式中,posi(t)表示UAVi的空间位置,posi(t)={xi(t),yi(t)},xi(t)∈{1,2,3,…,Lx},yi(t)∈{1,2,3,…,Ly},Oi(t)表示UAVi的飞行方向,Oi(t)∈{0,1,2,3,4,5,6,7},因最小转弯直径的限制,飞行过程中只能沿着当前飞行状态的正前、左和右三个方向;
步骤3)建立数字信息素图,确保多无人机动态协同行为:
s(x,y,t)=sA(x,y,t)-sR(x,y,t),
式中,所述s(x,y,t)表示在t时刻网格(x,y)的信息素浓度,sA(x,y,t)表示在t时刻网格(x,y)吸引信息素,sR(x,y,t)表示在t时刻网格(x,y)排斥信息素;
Figure BDA0002046904420000031
式中,eA表示吸引信息素的蒸发系数,λ表示监督因素,T(x,y)表示网格(x,y)上次访问与当前访问的时间间隔,rA(x,y,t)表示t时刻网格(x,y)释放的吸引信息素的数量,tA(x,y,t)表示t时刻网格(x,y)传输吸引信息素的数量,pA表示吸引信息素的传播系数,
Figure BDA0002046904420000032
其中t(x,y)表示最后一次访问网格(x,y)的时间,Tc表示信息素的更新周期,
Figure BDA0002046904420000033
其中Nei(x,y)表示网格(x,y)的相邻网格,N(x′,y′)表示Nei(x,y)的归一化形式;
sR(x,y,t)=(1-eR)[(sR(x,y,t-1)+λf(x,y)rR(x,y,t)+tR(x,y,t))(1-pR)],
式中,eR表示排斥信息素的蒸发系数,rR(x,y,t)表示t时刻网格(x,y)释放的排斥信息素的数量,tR(x,y,t)表示t时刻网格(x,y)传输排斥信息素的数量,pR表示排斥信息素的传播系数,
Figure BDA0002046904420000034
步骤4)使用混沌和反向策略初始化种群位置;
步骤4.1)使用帐篷映射(Tent Map)函数Yn作为混沌生成函数获得第i只鸽子的初始位置Xi(0)=[xi1,xi2],xi1=Lmin1+Yn*(Lmax1-Lmin1),xi2=Lmin2+Yn*(Lmax2-Lmin2),式中,xi1表示第i只鸽子在地图中的横坐标,xi2表示第i只鸽子在地图中的纵坐标,i=1,2,3,…,N,N为初始种群鸽子数量,Yn+1=weight*(1-2*|Yn-0.5|),n=0,1,2,3,4,5,……,其中weight=1,0<Y0<1,所述Lmin1表示Lx的最小值,Lmax1表示Lx的最大值,Lmin2表示Ly的最小值,Lmax2表示Ly的最大值;
步骤4.2)将步骤4.1)生成的初始位置反向初始化;
Figure BDA0002046904420000035
所述
Figure BDA0002046904420000036
表示Xi(0)的反向点,
Figure BDA0002046904420000041
所述
Figure BDA0002046904420000042
表示反向后第i只鸽子初始位置的横坐标,
Figure BDA0002046904420000043
表示反向后第i只鸽子初始位置的纵坐标;
步骤4.3)计算Xi(0)、
Figure BDA0002046904420000044
的适应度函数fitness(0):
fitness(t)=ω1fe(x,y,t)+ω2ft(x,y,t)+ω3fc(x,y,t),
式中,fitness(t)表示t时刻的环境不确定性收益fe(x,y,t)、目标发现收益ft(x,y,t)、合作收益fc(x,y,t)的加权和,作为评估每次搜索的评估函数,其中ω123=1,fe(x,y,t)=ud(x,y,t+1)-ud(x,y,t),ft(x,y,t)=p(x,y,t+1),fc(x,y,t)=s(x,y,t+1);如果
Figure BDA0002046904420000045
的适应度函数优于Xi(0)的适应度函数,则使用
Figure BDA0002046904420000046
替换Xi(0),否则保持原有的Xi(0)不变;
步骤5)使用鸽群优化算法进行搜索,进入地磁操作阶段;
步骤5.1)计算第t次迭代时第i只鸽子的位置Xi(t)、速度Vi(t):
Xi(t)=Xi(t-1)+Vi(t),Vi(t)=Vi(t-1)e-R*t+rand(Xgbest-Xi(t-1)),
式中,R表示地磁算子,Xgbest表示当前全局最优位置,rand表示在0到1之间的一个随机数;
步骤5.2)计算第t次迭代所有鸽子位置的适应度函数fitness(t)的值,将计算结果与历史位置的适应度函数值比较,记录最优适应度函数值对应的个体历史最优位置Xpbest与当前全局最优位置Xgbest
步骤5.3)判断当前迭代次数t是否达到指南针算子的最大迭代次数Nc1,如果达到最大迭代次数,转到步骤6)进入地标操作阶段,否则计算最近K1次迭代的全局最优适应度函数,如果全局最优适应度函数的绝对值小于阈值e1,那么
Figure BDA0002046904420000047
Figure BDA0002046904420000048
Xi(t)=Xi(t-1)+Vi(t),其中a表示柯西分布概率密度参数,转到步骤5.2),如果全局最优适应度函数的绝对值不小于阈值e1,转到步骤5.1);
步骤6)使用鸽群优化算法进行搜索,进入地标操作阶段;
步骤6.1)计算当前阶段每次迭代后鸽子数量Np(t)和鸽子种群中心位置Xc(t):
Figure BDA0002046904420000051
式中,fitness(Xi(t-1))表示在第t-1次迭代时第i只鸽子的适应度函数值;
步骤6.2)计算个体位置Xi(t)及其适应度函数fitness(t)的值:Xi(t)=Xi(t-1)+rand*(Xc(t-1)-Xi(t-1)),将当前个体适应度函数值的计算结果与历史位置相比较,记录最优适应度函数值对应的个体历史最优位置Xpbest与当前全局最优位置Xgbest
步骤6.3)判断当前迭代次数t是否达到地标算子的最大迭代次数Nc2,如果达到最大迭代次数Nc2,转到步骤7)完成多无人机对目标的搜索;否则计算最近K2次迭代的中心位置Xc(t)每个维度变化的绝对值,如果这个值小于阈值e2,那么
Figure BDA0002046904420000052
Figure BDA0002046904420000053
所述Xc′(t)表示对Xc(t)进行高斯变异后的中心位置,
Figure BDA0002046904420000054
表示变异的步长,其中k为常量,N(μ,σ)表示满足高斯分布的随机变量,μ表示高斯分布的数学期望,σ表示高斯分布的方差,如果Xc(t)与Xc′(t)是相邻的,那么计算个体Xi与进行高斯变异后的个体Xi′(t)之间的差异Δf,Pr=exp(Δf/T),其中Pr表示保留较差个体的概率,T表示模拟退火算法(SA)中的退火温度,比较随机数rand与Pr的大小:如果rand<Pr,保留较差个体,转到步骤6.2),否则转到步骤6.1);如果最近K2次迭代的中心位置Xc(t)每个维度变化的绝对值不小于阈值e2,同样转到步骤6.1);
步骤7)多无人机对目标的搜索终止。
进一步的,所述步骤5.1)中,地磁算子R优选取值0.3。
进一步的,所述步骤5.3)中,柯西分布概率密度参数a优选取值1。
进一步的,所述步骤6.3)中,退火温度T优选取值1000。
有益效果:本发明提供的一种基于改进鸽群优化的多无人机协同搜索方法,相对于现有技术,具有以下技术效果:
(1)本发明采用马尔科夫模型建立目标动态运动模型,更加贴合实际的搜索过程;
(2)本发明使用混沌加反向策略初始化种群位置,保证初始位置的分布随机性,避免单一化分布;
(3)本发明引入柯西、高斯变异以及模拟退火方法保留部分较差个体,避免陷入局部最优,有效提高了搜索的效率。
附图说明
图1为本发明一种基于改进鸽群优化的多无人机协同搜索方法的流程图;
图2为本发明实施例建立的搜索地图模型图;
图3为本发明中无人机飞行方向的示意图。
具体实施方式
下面结合附图及实施例对本发明作更进一步的说明。
如图1所示为一种基于改进鸽群优化的多无人机协同搜索方法,包括以下步骤:
步骤1)建立多无人机搜索地图模型,所述地图模型包括搜索区域、目标信息图和环境信息图;
步骤1.1)步骤1)中的搜索区域L使用正六边形构造,并离散成Lx*Ly的网格,其中Lx是搜索区域L的长度,Ly是搜索区域L的宽度;
步骤1.2)步骤1)中的目标信息图表示特定网格存在目标的概率:
Figure BDA0002046904420000061
式中,所述p(x,y,t+1)表示t+1时刻在网格(x,y)的目标存在概率,δ(t)=1表示t时刻在网格(x,y)搜索到目标,δ(t)=0表示t时刻在网格(x,y)未搜索到目标,Pd表示传感器探测概率,Pf表示传感器虚警概率,且p(x,y,t+1)的初始值为:
Figure BDA0002046904420000062
式中,(x0,y0)表示目标初始位置的中心位置,f(x,y)表示目标位置的联合概率密度函数,且
Figure BDA0002046904420000063
所述f(x,y)中σ0 2表示二维正态分布的方差;
步骤1.3)步骤1)中的环境信息图表示无人机对环境不确定性的响应:
Figure BDA0002046904420000071
式中,所述ud(x,y,t)表示环境的不确定性,所述H[p(x,y,t)]表示p(x,y,t)的熵,H[p(x,y,t)]=-p(x,y,t)log2p(x,y,t)-(1-p(x,y,t))log2(1-p(x,y,t));
步骤2)建立无人机的运动模型:控制所有的无人机飞行在相同高度,在t时刻第i架无人机的状态信息UAVi=[posi(t),Oi(t)],式中,posi(t)表示UAVi的空间位置,posi(t)={xi(t),yi(t)},xi(t)∈{1,2,3,…,Lx},yi(t)∈{1,2,3,…,Ly},Oi(t)表示UAVi的飞行方向,Oi(t)∈{0,1,2,3,4,5,6,7},如图3所示,因最小转弯直径的限制,飞行过程中只能沿着当前飞行状态的正前、左和右三个方向;
步骤3)建立数字信息素图,确保多无人机动态协同行为:
s(x,y,t)=sA(x,y,t)-sR(x,y,t),
式中,所述s(x,y,t)表示在t时刻网格(x,y)的信息素浓度,sA(x,y,t)表示在t时刻网格(x,y)吸引信息素,sR(x,y,t)表示在t时刻网格(x,y)排斥信息素;
Figure BDA0002046904420000072
式中,eA表示吸引信息素的蒸发系数,λ表示监督因素,T(x,y)表示网格(x,y)上次访问与当前访问的时间间隔,rA(x,y,t)表示t时刻网格(x,y)释放的吸引信息素的数量,tA(x,y,t)表示t时刻网格(x,y)传输吸引信息素的数量,pA表示吸引信息素的传播系数,
Figure BDA0002046904420000073
其中t(x,y)表示最后一次访问网格(x,y)的时间,Tc表示信息素的更新周期,
Figure BDA0002046904420000074
其中Nei(x,y)表示网格(x,y)的相邻网格,N(x′,y′)表示Nei(x,y)的归一化形式;
sR(x,y,t)=(1-eR)[(sR(x,y,t-1)+λf(x,y)rR(x,y,t)+tR(x,y,t))(1-pR)],
式中,eR表示排斥信息素的蒸发系数,rR(x,y,t)表示t时刻网格(x,y)释放的排斥信息素的数量,tR(x,y,t)表示t时刻网格(x,y)传输排斥信息素的数量,pR表示排斥信息素的传播系数,
Figure BDA0002046904420000075
步骤4)使用混沌和反向策略初始化种群位置;
步骤4.1)使用帐篷映射(Tent Map)函数Yn作为混沌生成函数获得第i只鸽子的初始位置Xi(0)=[xi1,xi2],xi1=Lmin1+Yn*(Lmax1-Lmin1),xi2=Lmin2+Yn*(Lmax2-Lmin2),式中,xi1表示第i只鸽子在地图中的横坐标,xi2表示第i只鸽子在地图中的纵坐标,i=1,2,3,…,N,N为初始种群鸽子数量,Yn+1=weight*(1-2*|Yn-0.5|),n=0,1,2,3,4,5,……,其中weight=1,0<Y0<1,所述Lmin1表示Lx的最小值,Lmax1表示Lx的最大值,Lmin2表示Ly的最小值,Lmax2表示Ly的最大值;
步骤4.2)将步骤4.1)生成的初始位置反向初始化;
Figure BDA0002046904420000081
所述
Figure BDA0002046904420000082
表示Xi(0)的反向点,
Figure BDA0002046904420000083
所述
Figure BDA0002046904420000084
表示反向后第i只鸽子初始位置的横坐标,
Figure BDA0002046904420000085
表示反向后第i只鸽子初始位置的纵坐标;
步骤4.3)计算Xi(0)、
Figure BDA0002046904420000086
的适应度函数fitness(0):
fitness(t)=ω1fe(x,y,t)+ω2ft(x,y,t)+ω3fc(x,y,t),
式中,fitness(t)表示t时刻的环境不确定性收益fe(x,y,t)、目标发现收益ft(x,y,t)、合作收益fc(x,y,t)的加权和,作为评估每次搜索的评估函数,其中ω123=1,fe(x,y,t)=ud(x,y,t+1)-ud(x,y,t),ft(x,y,t)=p(x,y,t+1),fc(x,y,t)=s(x,y,t+1);如果
Figure BDA0002046904420000087
的适应度函数优于Xi(0)的适应度函数,则使用
Figure BDA0002046904420000088
替换Xi(0),否则保持原有的Xi(0)不变;
步骤5)使用鸽群优化算法进行搜索,进入地磁操作阶段;
步骤5.1)计算第t次迭代时第i只鸽子的位置Xi(t)、速度Vi(t):
Xi(t)=Xi(t-1)+Vi(t),Vi(t)=Vi(t-1)e-R*t+rand(Xgbest-Xi(t-1)),
式中,R表示地磁算子,Xgbest表示当前全局最优位置,rand表示在0到1之间的一个随机数;
步骤5.2)计算第t次迭代所有鸽子位置的适应度函数fitness(t)的值,将计算结果与历史位置的适应度函数值比较,记录最优适应度函数值对应的个体历史最优位置Xpbest与当前全局最优位置Xgbest
步骤5.3)判断当前迭代次数t是否达到指南针算子的最大迭代次数Nc1,如果达到最大迭代次数,转到步骤6)进入地标操作阶段,否则计算最近K1次迭代的全局最优适应度函数,如果全局最优适应度函数的绝对值小于阈值e1,那么
Figure BDA0002046904420000091
Figure BDA0002046904420000092
Xi(t)=Xi(t-1)+Vi(t),其中a表示柯西分布概率密度参数,转到步骤5.2),如果全局最优适应度函数的绝对值不小于阈值e1,转到步骤5.1);
步骤6)使用鸽群优化算法进行搜索,进入地标操作阶段;
步骤6.1)计算当前阶段每次迭代后鸽子数量Np(t)和鸽子种群中心位置Xc(t):
Figure BDA0002046904420000093
式中,fitness(Xi(t-1))表示在第t-1次迭代时第i只鸽子的适应度函数值;
步骤6.2)计算个体位置Xi(t)及其适应度函数fitness(t)的值:Xi(t)=Xi(t-1)+rand*(Xc(t-1)-Xi(t-1)),将当前个体适应度函数值的计算结果与历史位置相比较,记录最优适应度函数值对应的个体历史最优位置Xpbest与当前全局最优位置Xgbest
步骤6.3)判断当前迭代次数t是否达到地标算子的最大迭代次数Nc2,如果达到最大迭代次数Nc2,转到步骤7)完成多无人机对目标的搜索;否则计算最近K2次迭代的中心位置Xc(t)每个维度变化的绝对值,如果这个值小于阈值e2,那么
Figure BDA0002046904420000094
Figure BDA0002046904420000095
所述Xc′(t)表示对Xc(t)进行高斯变异后的中心位置,
Figure BDA0002046904420000096
表示变异的步长,其中k为常量,N(μ,σ)表示满足高斯分布的随机变量,μ表示高斯分布的数学期望,σ表示高斯分布的方差,如果Xc(t)与Xc′(t)是相邻的,那么计算个体Xi与进行高斯变异后的个体Xi′(t)之间的差异Δf,Pr=exp(Δf/T),其中Pr表示保留较差个体的概率,T表示模拟退火算法(SA)中的退火温度,比较随机数rand与Pr的大小:如果rand<Pr,保留较差个体,转到步骤6.2),否则转到步骤6.1);如果最近K2次迭代的中心位置Xc(t)每个维度变化的绝对值不小于阈值e2,同样转到步骤6.1);
步骤7)多无人机对目标的搜索终止。
实施例
首先图2是对搜索环境的建模,搜索区域L被分为10*10个网格,图3为无人机的飞行模型,由于最小转弯直径的限制,只能达到飞行方向的前、左和右三个方向,利用马尔科夫模型建立动态目标。
然后开始多无人机的搜索,设置鸽子总数N为50,指南针算子迭代次数Nc1为15,地标算子迭代次数Nc2为5。在指南针算子迭代阶段,首先计算出初始个体位置和速度,并记录个体的历史最优位置和全局最优位置,如果近K1=3次迭代中的全局最优适应度函数的值小于阈值e1=0.1,那么进行柯西变异,其中柯西分布概率密度参数a=1,地磁算子R=0.3,计算出新的位置和速度,更新个体的历史最优位置和全局最优位置直至达到指南针算子的迭代次数。
指南针算子迭代完成后进入地标算子迭代阶段,将种群数目减半并计算剩余种群的中心位置,然后计算个体位置和相应的适应度函数值,记录个体的历史最优位置和全局最优位置。如果近K2=2次迭代中心位置Xc的每个维度的变化的绝对值小于阈值e2=0.01,则对中心位置进行高斯突变,其中高斯突变的数学期望μ=0,方差σ=1。为了确保不陷入局部最优,使用模拟退火来保留部分较差的个体,保留较差个体的概率为Pr=exp(Δf/T),其中退火温度T=1000。计算出新的位置和速度,更新个体的历史最优位置和全局最优位置直至达到地标算子的迭代次数。最终完成多无人机对动态目标的协同搜索。
本发明使用改进的鸽群优化算法进行多无人机的协同搜索,通过对环境的建模、依据马尔科夫链建立的目标运动模型,并在初始化种群时采用混沌加反向的策略,引入柯西、高斯变异避免陷入局部最优,来完成整个搜索过程。通过这些方法的应用能够提高多无人机对动态目标的搜索效率以及降低搜索重复区域。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (4)

1.一种基于改进鸽群优化的多无人机协同搜索方法,其特征在于,包括以下步骤:
步骤1)建立多无人机搜索地图模型,所述地图模型包括搜索区域、目标信息图和环境信息图;
步骤1.1)步骤1)中的搜索区域L使用正六边形构造,并离散成Lx*Ly的网格,其中Lx是搜索区域L的长度,Ly是搜索区域L的宽度;
步骤1.2)步骤1)中的目标信息图表示特定网格存在目标的概率:
Figure FDA0003475636340000011
式中,所述p(x,y,t+1)表示t+1时刻在网格(x,y)的目标存在概率,δ(t)=1表示t时刻在网格(x,y)搜索到目标,δ(t)=0表示t时刻在网格(x,y)未搜索到目标,Pd表示传感器探测概率,Pf表示传感器虚警概率,且p(x,y,t+1)的初始值为:
Figure FDA0003475636340000012
式中,(x0,y0)表示目标初始位置的中心位置,f(x,y)表示目标位置的联合概率密度函数,且
Figure FDA0003475636340000013
所述f(x,y)中σ0 2表示二维正态分布的方差;
步骤1.3)步骤1)中的环境信息图表示无人机对环境不确定性的响应:
Figure FDA0003475636340000014
式中,所述ud(x,y,t)表示环境的不确定性,所述H[p(x,y,t)]表示p(x,y,t)的熵,H[p(x,y,t)]=-p(x,y,t)log2p(x,y,t)-(1-p(x,y,t))log2(1-p(x,y,t));
步骤2)建立无人机的运动模型:控制所有的无人机飞行在相同高度,在t时刻第i架无人机的状态信息UAVi=[posi(t),Oi(t)],式中,posi(t)表示UAVi的空间位置,posi(t)={xi(t),yi(t)},xi(t)∈{1,2,3,...,Lx},yi(t)∈{1,2,3,...,Ly},Oi(t)表示UAVi的飞行方向,Oi(t)∈{0,1,2,3,4,5,6,7},因最小转弯直径的限制,飞行过程中只能沿着当前飞行状态的正前、左和右三个方向;
步骤3)建立数字信息素图,确保多无人机动态协同行为:
s(x,y,t)=sA(x,y,t)-sR(x,y,t),
式中,所述s(x,y,t)表示在t时刻网格(x,y)的信息素浓度,sA(x,y,t)表示在t时刻网格(x,y)吸引信息素,sR(x,y,t)表示在t时刻网格(x,y)排斥信息素;
Figure FDA0003475636340000021
式中,eA表示吸引信息素的蒸发系数,λ表示监督因素,T(x,y)表示网格(x,y)上次访问与当前访问的时间间隔,rA(x,y,t)表示t时刻网格(x,y)释放的吸引信息素的数量,tA(x,y,t)表示t时刻网格(x,y)传输吸引信息素的数量,pA表示吸引信息素的传播系数,
Figure FDA0003475636340000022
其中t(x,y)表示最后一次访问网格(x,y)的时间,Tc表示信息素的更新周期,
Figure FDA0003475636340000023
其中Nei(x,y)表示网格(x,y)的相邻网格,N(x′,y′)表示Nei(x,y)的归一化形式;
sR(x,y,t)=(1-eR)[(sR(x,y,t-1)+λf(x,y)rR(x,y,t)+tR(x,y,t))(1-pR)],
式中,eR表示排斥信息素的蒸发系数,rR(x,y,t)表示t时刻网格(x,y)释放的排斥信息素的数量,tR(x,y,t)表示t时刻网格(x,y)传输排斥信息素的数量,pR表示排斥信息素的传播系数,
Figure FDA0003475636340000024
步骤4)使用混沌和反向策略设置种群的初始位置;
步骤4.1)使用帐篷映射函数Yn作为混沌生成函数获得第i只鸽子的初始位置:Xi(0)=[xi1,xi2],xi1=Lmin1+Yn*(Lmax1-Lmin1),xi2=Lmin2+Yn*(Lmax2-Lmin2),式中,xi1表示第i只鸽子在地图中的横坐标,xi2表示第i只鸽子在地图中的纵坐标,i=1,2,3,...,N,N为初始种群鸽子数量,Yn+1=weight*(1-2*|Yn-0.5|),n=0,1,2,3,4,5,......,其中weight=1,0<Y0<1,所述Lmin1表示Lx的最小值,Lmax1表示Lx的最大值,Lmin2表示Ly的最小值,Lmax2表示Ly的最大值;
步骤4.2)将步骤4.1)生成的初始位置反向初始化;
Figure FDA0003475636340000025
所述
Figure FDA0003475636340000026
表示Xi(0)的反向点,
Figure FDA0003475636340000027
所述
Figure FDA0003475636340000028
表示反向后第i只鸽子初始位置的横坐标,
Figure FDA0003475636340000029
表示反向后第i只鸽子初始位置的纵坐标;
步骤4.3)计算Xi(0)、
Figure FDA00034756363400000210
的适应度函数fitness(0):
fitness(t)=ω1fe(x,y,t)+ω2ft(x,y,t)+ω3fc(x,y,t),
式中,fitness(t)表示t时刻的环境不确定性收益fe(x,y,t)、目标发现收益ft(x,y,t)、合作收益fc(x,y,t)的加权和,作为评估每次搜索的评估函数,其中ω123=1,fe(x,y,t)=ud(x,y,t+1)-ud(x,y,t),ft(x,y,t)=p(x,y,t+1),fc(x,y,t)=s(x,y,t+1);如果
Figure FDA0003475636340000031
的适应度函数优于Xi(0)的适应度函数,则使用
Figure FDA0003475636340000032
替换Xi(0),否则保持原有的Xi(0)不变;
步骤5)使用鸽群优化方法进行搜索,进入地磁操作阶段;
步骤5.1)计算第t次迭代时第i只鸽子的位置Xi(t)、速度Vi(t):
Xi(t)=Xi(t-1)+Vi(t),Vi(t)=Vi(t-1)e-R*t+rand(Xgbest-Xi(t-1)),
式中,R表示地磁算子,Xgbest表示当前全局最优位置,rand表示在0到1之间的一个随机数;
步骤5.2)计算第t次迭代所有鸽子位置的适应度函数fitness(t)的值,将计算结果与历史位置的适应度函数值比较,记录最优适应度函数值对应的个体历史最优位置Xpbest与当前全局最优位置Xgbest
步骤5.3)判断当前迭代次数t是否达到指南针算子的最大迭代次数Nc1,如果达到最大迭代次数,转到步骤6)进入地标操作阶段,否则计算最近K1次迭代的全局最优适应度函数,如果全局最优适应度函数的绝对值小于阈值e1,那么
Figure FDA0003475636340000033
Figure FDA0003475636340000034
其中a表示柯西分布概率密度参数,转到步骤5.2),如果全局最优适应度函数的绝对值不小于阈值e1,转到步骤5.1);
步骤6)使用鸽群优化方法进行搜索,进入地标操作阶段;
步骤6.1)计算当前阶段每次迭代后鸽子数量Np(t)和鸽子种群中心位置Xc(t):
Figure FDA0003475636340000035
式中,fitness(Xi(t-1))表示在第t-1次迭代时第i只鸽子的适应度函数值;
步骤6.2)计算个体位置Xi(t)及其适应度函数fitness(t)的值:Xi(t)=Xi(t-1)+rand*(Xc(t-1)-Xi(t-1)),将当前个体适应度函数值的计算结果与历史位置相比较,记录最优适应度函数值对应的个体历史最优位置Xpbest与当前全局最优位置Xgbest
步骤6.3)判断当前迭代次数t是否达到地标算子的最大迭代次数Nc2,如果达到最大迭代次数Nc2,转到步骤7)完成多无人机对目标的搜索;否则计算最近K2次迭代的中心位置Xc(t)每个维度变化的绝对值,如果这个值小于阈值e2,那么
Figure FDA0003475636340000041
Figure FDA0003475636340000042
所述X′c(t)表示对Xc(t)进行高斯变异后的中心位置,
Figure FDA0003475636340000043
表示变异的步长,其中k为常量,N(μ,σ)表示满足高斯分布的随机变量,μ表示高斯分布的数学期望,σ表示高斯分布的方差,如果Xc(t)与X′c(t)是相邻的,那么计算个体Xi与进行高斯变异后的个体X′i(t)之间的差异Δf,Pr=exp(Δf/T),其中Pr表示保留较差个体的概率,T表示模拟退火方法SA中的退火温度,比较随机数rand与Pr的大小:如果rand<Pr,保留较差个体,转到步骤6.2),否则转到步骤6.1);如果最近K2次迭代的中心位置Xc(t)每个维度变化的绝对值不小于阈值e2,同样转到步骤6.1);
步骤7)多无人机对目标的搜索终止。
2.根据权利要求1所述的一种基于改进鸽群优化的多无人机协同搜索方法,其特征在于,所述步骤5.1)中,地磁算子R取值0.3。
3.根据权利要求1所述的一种基于改进鸽群优化的多无人机协同搜索方法,其特征在于,所述步骤5.3)中,柯西分布概率密度参数a取值1。
4.根据权利要求1所述的一种基于改进鸽群优化的多无人机协同搜索方法,其特征在于,所述步骤6.3)中,退火温度T取值1000。
CN201910361354.1A 2019-04-30 2019-04-30 一种基于改进鸽群优化的多无人机协同搜索方法 Active CN110147099B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910361354.1A CN110147099B (zh) 2019-04-30 2019-04-30 一种基于改进鸽群优化的多无人机协同搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910361354.1A CN110147099B (zh) 2019-04-30 2019-04-30 一种基于改进鸽群优化的多无人机协同搜索方法

Publications (2)

Publication Number Publication Date
CN110147099A CN110147099A (zh) 2019-08-20
CN110147099B true CN110147099B (zh) 2022-03-01

Family

ID=67594064

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910361354.1A Active CN110147099B (zh) 2019-04-30 2019-04-30 一种基于改进鸽群优化的多无人机协同搜索方法

Country Status (1)

Country Link
CN (1) CN110147099B (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110672088B (zh) * 2019-09-09 2021-03-30 北京航空航天大学 一种仿信鸽地貌感知归巢机制的无人机自主导航方法
CN113095538B (zh) * 2020-06-08 2024-03-19 华北电力大学 面向灵活性运行的热电联产机组宽负荷运行动态特性建模方法
CN111913482B (zh) * 2020-07-14 2022-06-21 徐州工程学院 一种基于多Agent的鸽群机器人运动控制方法
CN113138609B (zh) * 2020-12-25 2022-07-19 北京理工大学 一种反低慢小目标的多无人机协同目标搜索方法
CN112783213B (zh) * 2021-01-13 2022-04-01 北京理工大学 一种基于混合机制的多无人机协同广域动目标搜索方法
CN112596507A (zh) * 2021-01-14 2021-04-02 南京航空航天大学 传感器故障下的多时滞非线性系统滑模预测容错控制方法
CN112905959B (zh) * 2021-02-09 2022-09-09 辽宁警察学院 一种基于正态分布概率图的警务多无人机目标搜索方法
CN113110605B (zh) * 2021-05-28 2023-02-10 中国人民解放军国防科技大学 城市环境下多无人机协同搜索方法及装置
CN113805609A (zh) * 2021-10-13 2021-12-17 河海大学 一种混沌迷失鸽群优化机制的无人机群目标搜索方法
CN114020031B (zh) * 2021-11-16 2023-09-22 南京航空航天大学 基于改进鸽群优化的无人机集群协同动态目标搜索方法
CN113867369B (zh) * 2021-12-03 2022-03-22 中国人民解放军陆军装甲兵学院 一种基于交流学习的海鸥算法的机器人路径规划方法
CN114819294A (zh) * 2022-04-07 2022-07-29 南京航空航天大学 一种基于离散鸽群算法的无人机任务分配方法
CN115225465B (zh) * 2022-07-18 2024-04-26 北京航空航天大学 一种基于改进鸽群算法的网络恢复方法
CN115542936B (zh) * 2022-10-28 2024-04-16 中国地质大学(武汉) 一种航磁无人机舵机布局智能优化方法、装置及电子设备
CN115474216B (zh) * 2022-11-02 2023-04-07 中国人民解放军国防科技大学 基于自适应蜂鸟算法的飞行自组网拓扑优化方法和装置
CN115542952B (zh) * 2022-11-30 2023-03-03 昆明理工大学 一种面向无人机集群智能协同系统的优化方法
CN117075596B (zh) * 2023-05-24 2024-04-26 陕西科技大学 一种环境和运动不确定下的机器人复杂任务路径规划方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108985549A (zh) * 2018-05-25 2018-12-11 哈尔滨工程大学 基于量子鸽群机制的无人机任务分配方法
CN109254588A (zh) * 2018-10-17 2019-01-22 北京航空航天大学 一种基于交叉变异鸽群优化的无人机集群协同侦察方法
CN109357678A (zh) * 2018-10-16 2019-02-19 北京航空航天大学 一种基于异质化鸽群优化算法的多无人机路径规划方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108985549A (zh) * 2018-05-25 2018-12-11 哈尔滨工程大学 基于量子鸽群机制的无人机任务分配方法
CN109357678A (zh) * 2018-10-16 2019-02-19 北京航空航天大学 一种基于异质化鸽群优化算法的多无人机路径规划方法
CN109254588A (zh) * 2018-10-17 2019-01-22 北京航空航天大学 一种基于交叉变异鸽群优化的无人机集群协同侦察方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Cooperative search approach for UAVs via Pigeon-inspired Optimization and Markov moving targets;Rui Wang等;《IEEE》;20190124;第2007-2012页 *
基于自适应权重鸽群算法的无人机航路规划;林娜 等;《计算机仿真》;20180131;第35卷(第1期);第38-42、125页 *

Also Published As

Publication number Publication date
CN110147099A (zh) 2019-08-20

Similar Documents

Publication Publication Date Title
CN110147099B (zh) 一种基于改进鸽群优化的多无人机协同搜索方法
CN109254588B (zh) 一种基于交叉变异鸽群优化的无人机集群协同侦察方法
CN105892480B (zh) 异构多无人机系统协同察打任务自组织方法
CN110196605B (zh) 一种强化学习的无人机群在未知海域内协同搜索多动态目标方法
CN111487995B (zh) 基于三维简化虚拟模型的群无人机多目标搜索协作方法
CN113589842A (zh) 一种基于多智能体强化学习的无人集群任务协同方法
CN109521794A (zh) 一种多无人机航路规划及动态避障方法
CN109144102A (zh) 一种基于改进蝙蝠算法的无人机航路规划方法
CN113095481A (zh) 一种基于并行自我博弈的空战机动方法
CN111381600B (zh) 一种基于粒子群算法的uuv路径规划方法
CN110926477A (zh) 一种无人机航路规划及避障方法
CN107992040B (zh) 基于地图栅格与qpso算法结合的机器人路径规划方法
CN111256681B (zh) 一种无人机群路径规划方法
Hahn et al. Emergent escape-based flocking behavior using multi-agent reinforcement learning
CN112684808A (zh) 一种不确定环境下的无人机集群智能协同察打方法
CN111260026B (zh) 一种基于元强化学习的导航迁移方法
CN110514567B (zh) 基于信息熵的气体源搜索方法
CN112666981A (zh) 基于原鸽群动态群组学习的无人机集群动态航路规划方法
CN112783213A (zh) 一种基于混合机制的多无人机协同广域动目标搜索方法
Han et al. Multi-uav automatic dynamic obstacle avoidance with experience-shared a2c
CN116698037B (zh) 一种无人机航迹规划方法
Shen Bionic communication network and binary pigeon-inspired optimization for multiagent cooperative task allocation
Gu et al. Robot path planning of improved adaptive Ant Colony System Algorithm based on Dijkstra
CN116400737B (zh) 一种基于蚁群算法的安全路径规划系统
CN114997306A (zh) 一种基于动态贝叶斯网络的目标意图识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant