CN114675660B - 一种基于pso-lshade-clm的多uuv协同搜索方法 - Google Patents

一种基于pso-lshade-clm的多uuv协同搜索方法 Download PDF

Info

Publication number
CN114675660B
CN114675660B CN202210198014.3A CN202210198014A CN114675660B CN 114675660 B CN114675660 B CN 114675660B CN 202210198014 A CN202210198014 A CN 202210198014A CN 114675660 B CN114675660 B CN 114675660B
Authority
CN
China
Prior art keywords
uuv
time
search
pso
decision input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210198014.3A
Other languages
English (en)
Other versions
CN114675660A (zh
Inventor
杨惠珍
李源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN202210198014.3A priority Critical patent/CN114675660B/zh
Publication of CN114675660A publication Critical patent/CN114675660A/zh
Application granted granted Critical
Publication of CN114675660B publication Critical patent/CN114675660B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/04Control of altitude or depth
    • G05D1/06Rate of change of altitude or depth
    • G05D1/0692Rate of change of altitude or depth specially adapted for under-water vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明一种基于PSO‑LSHADE‑CLM的多UUV协同搜索方法,属于无人水下航行器领域;首先采用栅格法对待搜索区域进行划分,概率图Pmn(t)初始化;然后根据UUV的初始位置和初始航向角得到t+1时刻的UUV状态,进而得到多UUV系统在状态X(k)下,采用决策输入U(k)后,整个系统在t+1时刻搜索效能;再通过预测总体搜索效能,得出t时刻求解多UUV系统最优决策输入的滚动优化模型;最后,根据解码粒子得到多UUV系统的一组航向角调整指令,带入多UUV系统最优决策输入的滚动优化模型中,即使搜索效能最大化,随着不断决策输入,直到搜索到目标。本发明解决了进化算法对于离散的优化问题处理不佳,容易陷入局部最优,以及进化算法初期过早收敛、对控制参数的敏感性高等缺点,从而提高协同搜索效率。

Description

一种基于PSO-LSHADE-CLM的多UUV协同搜索方法
技术领域
本发明属于无人水下航行器领域,具体涉及一种基于PSO-LSHADE-CLM的多UUV协同搜索方法。
背景技术
近年来,各国对海洋的开发和竞争日趋激烈,人们对于水下区域的搜索非常重视。由于无人水下航行器(UUV)具有良好的隐蔽性和机动性,可具备军事搜索、情报搜集等功能。与单个UUV有限的探测能力相比,多个UUV协同工作能够扩展获取环境的感知范围,增强系统的容错能力,通过各UUV之间的信息互通,完成更复杂的搜索任务。因此,多UUV协同搜索问题是现阶段水下机器人研究的重要方向。
传统的协同搜索主要有覆盖式编队搜索、群集搜索等方法,这些方法通常存在耗时长、搜索效益不高等问题。由于近年来进化算法迅速发展,其具有原理简单,易实现等优点并因此备受关注。
现在主流的进化算法中,一般使用PSO算法(Particles Swarm Optimization)和L-SHADE算法(Success-History based Adaptive Differential Evolution with LinearPopulation Reduction)来求解非线性问题。Cai等在2013年第86期InternationalJournal of Control期刊上发表的论文An improved PSO-based approach with dynamicparameter tuning for cooperative multi-robot target searching in complexunknown environments,其中第1720-1732页中提出基于路径规划与目标搜索的PSO算法,将机器人系统的协作规则应用到势场函数中,并作为PSO的适应度函数应用于机器人协作搜索的未知环境中,但PSO算法对于离散的优化问题处理不佳,容易陷入局部最优,L-SHADE算法也具有进化初期过早收敛、对控制参数的敏感性高等缺点。
发明内容
要解决的技术问题:
为了避免现有技术的不足之处,在PSO算法中引入LSHADE-CLM算法(LSHADE withcomprehensive learning mechanism)中的突变策略;同时,为了解决算法进化初期过早收敛、对控制参数敏感性高的问题,使用带有竞争性的奖励机制去自适应的调整突变策略中的突变因子F,从而设计了一种新的PSO-LSHADE-CLM算法(Particles Swarm OptimizationHybrid LSHADE-CLM)。
本发明的技术方案是:一种基于PSO-LSHADE-CLM的多UUV协同搜索方法,其特征在于具体步骤如下:
步骤1:采用栅格法对待搜索区域进行划分,概率图Pmn(t)初始化;
步骤2:根据UUV的初始位置和初始航向角得到t+1时刻的UUV状态;第i艘UUV的状态更新方程如下:
其中,xpi(t)=(m,n)表示UUV在t时刻在任务区域里的离散位置坐标,vi(t)表示UUV的速度,ψi(t)表示UUV在t时刻的航向角,Δψi(t)表示UUV的航向角增量;第i艘UUV的决策输入记为ui(t)=[vi(t),Δψi(t)]T;函数S为关于三角函数关系的函数,令ψi(t)+Δψi(t)=*,则S(*)=[cos(*)sin(*)]T
步骤3:多UUV系统在状态X(k)下,采用决策输入U(k)后,整个系统在t+1时刻搜索效能可表示为:
J(X(k),U(k))=ω1JF(k)+ω2JE(k)+ω3JL(k) (2)
其中,0≤ωi≤1,i=1,2,3是加权系数,JF(k)、JE(k)、JL(k)分别是目标发现收益、境搜索收益、声场信息收益;
步骤4:建立多UUV系统的n步预测滚动优化模型;
将系统在t时刻对t+q时刻的预测状态记作x(t+q|t)决策输入的预测记作u(t+q|t);第t个决策输入时刻后,n步预测状态的集合记为X(t),决策输入集合记为U(t);则在一段时间[t,t+n-1]内,得到整个多UUV系统的预测总体搜索效能如下:
步骤5:基于步骤4得到的预测总体搜索效能,得出t时刻求解多UUV系统最优决策输入的滚动优化模型为:
其中,n为滚动优化时间窗步长;U*(t)={u*(t|t),...,u*(t+n-1|t)}为求解得到的最优任务决策序列,取最优决策序列的首项当作系统当前时刻的搜索决策输入,即u(t)=u*(t|t),以此不断重复,即能保证系统持续执行搜索任务;将系统未来n个时刻的总体效能函数当成优化目标;通过滚动优化求解把一个无限时域的优化问题简化成了有限时域的优化问题,且随着不断决策输入,时间窗一直往前滚动;
步骤6:将粒子编码为一个2×1维矩阵[ψi(t)xi(t)]T,粒子航向角和位置信息更新公式如下:
ψi(t+1)=w×ψi(t)+c1×rand×(pi-xi(t))+c2×rand×(pg+Fw(xpb,g-pg)+
F(xpr1,g-xpr2,g)-xi(t)) (5)
xi(t+1)=xi(t)+vi(t)×Δt×S(ψi(t+1))
其中,ψi(t+1)是粒子的航向角更新,rand是[0,1]之间的随机数,xi(t)是粒子当前位置,xi(t+1)是粒子位置更新,学习因子c1,c2取值为2,惯性权重w取值为1,pi是个体极值,pg是群体极值,xpb,g是当前种群中适应度排名100p%的随机位置,xpr1,g、xpr2,g是从当前种群中随机选择的位置,F为突变策略中的突变因子;
步骤7:公式(6)中的Fw设置如下:
其中,nfes为进化数量,nfesmax为最大进化数量;
步骤8:根据公式(6)解码粒子得到多UUV系统的一组航向角调整指令,带入公式(5)中,即使搜索效能最大化,随着不断决策输入,直到搜索到目标。
本发明的进一步技术方案是:所述步骤1中,在UUV搜索过程中利用传感器探测模型更新地图。
本发明的进一步技术方案是:所述步骤2中,第i艘UUV的t时刻状态记为xi(t)=[xpi(t),ψi(t)]T,全部UUV的状态信息为x(t)=[x1(t),x2(t),...,xN(t)]T
本发明的进一步技术方案是:所述步骤2中,UUV在t+1时刻的位置坐标具体计算公式如下:
其中,算子In[·]是取整操作运算符;UUV的决策输入需要满足其航行性能约束,包括航向角增量限制Δψi(t)∈[-ηmaxmax]和速度限制vi(t)∈[vmin,vmax]。
本发明的进一步技术方案是:所述步骤3中,JF(k)、JE(k)、JL(k)分别定义如下:
其中,pmn(t)∈[0,1]是在t时刻网格对应的目标存在概率;qmn(t)是t时刻网格的环境确定度,omn(t)是UUV的占用概率,用来描述网格被UUV占用的情况;Wmn表示声场信息,用来描述该UUV通过声纳探测到的信息;
本发明的进一步技术方案是:所述omn(t)、pmn(t)的初始化表示如下:
有益效果
本发明的有益效果在于:本发明提供的一种基于PSO-LSHADE-CLM的多AUV协同搜索方法,由图4可知,在PSO算法下,在k=400和k=600时,出现了很明显的局部最优现象,显然UUV2和UUV3在k=400时,应该分开区域搜索不应该进行汇合,出现了交叉区域,从而降低搜索效率,在k=600时,UUV2和UUV4出现了同样的现象。通过分析可以看出,UUV2和UUV3在搜索完较小区域后,需要对新的区域进行搜索,又由于缺少目标信息,而与此同时,UUV2和UUV3认为在较短时间内,这一区域两者都有较高的目标函数值从而需要进行搜索,故很难在冲突解决阶段重新进行搜索,因而造成了局部最优现象。由图5可知,改进的PSO-LSHADE-CLM算法能有效地解决基于PSO算法所出现的局部最优问题。在k=400时,UUV1和UUV4实现了在各自区域的协同搜索,UUV4选择了向下搜索,UUV1选择了在区域内最有效的搜索方向,此外在k=600时间,已搜到了目标并在目标区域观察是否还有其他目标,使得目标搜索的结果更优。
本发明解决了进化算法对于离散的优化问题处理不佳,容易陷入局部最优,以及进化算法初期过早收敛、对控制参数的敏感性高等缺点,从而提高协同搜索效率。
附图说明
图1为本发明基于PSO-LSHADE-CLM算法的流程图;
图2为本发明声纳传感器探测图;
图3为本发明PSO-LSHADE-CLM算法与PSO算法在不同仿真步数下平均发现目标数的对比图;
图4为PSO算法的多UUV协同目标搜索方法优化过程;
图5为本发明PSO-LSHADE-CLM算法的多UUV协同目标搜索方法优化过程。
具体实施方式
下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
如图1所示,本发明一种基于PSO-SHADE-CLM的多UUV协同搜索方法,包括如下步骤:
步骤1:采用栅格法对待搜索区域进行划分,概率图Pmn(t)初始化;在UUV搜索过程中利用传感器探测模型更新地图;
步骤2:构造多UUV状态更新方程:根据任务区域模型,可对UUV搜索决策的离散状态空间建模。在该状态空间内,第i艘UUV的状态记为xi(t)=[xpi(t),ψi(t)]T,其中xpi(t)=(m,n)表示UUV在t时刻在任务区域里的离散位置坐标,ψi(t)表示UUV在t时刻的航向角。而第i艘UUV的决策输入记为ui(t)=[vi(t),Δψi(t)]T,其中vi(t)表示UUV的速度,Δψi(t)表示UUV的航向角增量。因此,可以得第i艘UUV的状态更新方程如下:
其中函数S为关于三角函数关系的函数,令ψi(t)+Δψi(t)=*,则S(*)=[cos(*)sin(*)]T;根据UUV的当前决策输入来计算未来一段时间内UUV的航行距离,且将其表示为概率图模型下的移动增量(Δm,Δn),则UUV在下一时刻的位置坐标具体计算公式如下:
其中,算子In[·]是取整操作运算符。需要注意的是,UUV的决策输入需要满足其航行性能约束,包括航向角增量限制Δψi(t)∈[-ηmaxmax]和速度限制vi(t)∈[vmin,vmax],由公式(2)可知,第i艘UUV在t+1时刻的位置坐标直接取决于其决策输入ui(t)。而经优化求解得到的搜索决策ui(t)将使UUV朝获得最大搜索效能的位置运动。
步骤3:要完成搜索决策的优化求解,需要制定多UUV协同目标搜索的优化目标函数。多UUV系统在状态X(k)下,采用决策输入U(k)后,整个系统在t+1时刻的搜索效能可表示为:
J(X(k),U(k))=ω1JF(k)+ω2JE(k)+ω3JL(k) (15)
其中0≤ωi≤1,i=1,2,3是加权系数,JF(k)、JE(k)、JL(k)分别是目标发现收益、境搜索收益、声场信息收益,具体定义如下:
其中pmn(t)∈[0,1]是在t时刻网格对应的目标存在概率;qmn(t)是t时刻网格的环境确定度,omn(t)是UUV的占用概率,用来描述网格被UUV占用的情况;Wmn表示声场信息,用来描述该UUV通过声纳探测到的信息。其中omn(t)、pmn(t)的初始化表示如下:
步骤4:此时全部UUV的状态信息为x(t)=[x1(t),x2(t),...,xN(t)]T,模型预测控制(Model Predictive Control,MPC)的思想在线得到各UUV的最佳决策输入u(t)=[u1(t),u2(t),...,uN(t)]T。然后建立多UUV系统的n步预测滚动优化模型。把系统在t时刻对t+q时刻的预测状态记作x(t+qt),决策输入的预测记作u(t+qt);第t个决策输入时刻后,n步预测状态的集合记为X(t),决策输入集合记为U(t);则在一段时间[t,t+n-1]内,整个多UUV系统的预测总体搜索效能如下:
步骤5:基于步骤4得到的预测总体搜索效能,由此可得t时刻求解多UUV系统最优决策输入的滚动优化模型为:
其中n为滚动优化时间窗步长。U*(t)={u*(t|t),...,u*(t+n-1|t)}为求解得到的最优任务决策序列,取最优决策序列的首项当作系统当前时刻的搜索决策输入,即u(t)=u*(t|t,以此不断重复,即能保证系统持续执行搜索任务。将系统未来n个时刻的总体效能函数当成优化目标。通过滚动优化求解把一个无限时域的优化问题简化成了有限时域的优化问题,且随着不断决策输入,时间窗一直往前滚动。
步骤6:将粒子编码为一个2×1维矩阵[ψi(t)xi(t)]T,粒子航向角和位置信息更新公式如下:
ψi(t+1)=w×ψi(t)+c1×rand×(pi-xi(t))+c2×rand×(pg+Fw(xpb,g-pg)+
F(xpr1,g-xpr2,g)-xi(t)) (23)
xi(t+1)=xi(t)+vi(t)×Δt×S(ψi(t+1))
式中ψi(t+1)是粒子的航向角更新,rand是[0,1]之间的随机数,xi(t)是粒子当前位置,xi(t+1)是粒子位置更新,学习因子c1,c2取值为2,惯性权重w取值为1,pi是个体极值,pg是群体极值,xpb,g是当前种群中适应度排名100p%的随机位置,xpr1,g、xpr2,g是从当前种群中随机选择的位置,F为突变策略中的突变因子,在经典DE算法及其变形中,突变因子F被设置为等于Fw,但在本文中搜索步骤由突变因子F和Fw分别控制。
步骤7:公式(6)中的Fw设置如下:
式中nfes为进化数量,nfesmax为最大进化数量。
步骤8:根据公式(6)解码粒子得到多UUV系统的一组航向角调整指令,带入公式(5)中,即使搜索效能最大化,随着不断决策输入,直到搜索到目标。
具体实施例:
如图2为本发明声纳传感器探测图,利用声纳探测模型作为发现目标的依据。
经过上述步骤,图3为4艘UUV,6个目标,仿真1000步的情况下,PSO-LSHADE-CLM算法和基本粒子群算法在不同仿真步长下平均发现目标数的对比图,图4为PSO算法下协同目标搜索过程,图5为PSO-LSHADE-CLM算法下协同目标搜索过程。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (6)

1.一种基于PSO-LSHADE-CLM的多UUV协同搜索方法,其特征在于具体步骤如下:
步骤1:采用栅格法对待搜索区域进行划分,概率图Pmn(t)初始化;
步骤2:根据UUV的初始位置和初始航向角得到t+1时刻的UUV状态;第i艘UUV的状态更新方程如下:
其中,xpi(t)=(m,n)表示UUV在t时刻在任务区域里的离散位置坐标,vi(t)表示UUV的速度,ψi(t)表示UUV在t时刻的航向角,Δψi(t)表示UUV的航向角增量;第i艘UUV的决策输入记为ui(t)=[vi(t),Δψi(t)]T;函数S为关于三角函数关系的函数,令ψi(t)+Δψi(t)=*,则S(*)=[cos(*)sin(*)]T
步骤3:多UUV系统在状态X(k)下,采用决策输入U(k)后,整个系统在t+1时刻搜索效能表示为:
J(X(k),U(k))=ω1JF(k)+ω2JE(k)+ω3JL(k) (2)
其中,0≤ωi≤1,i=1,2,3是加权系数,JF(k)、JE(k)、JL(k)分别是目标发现收益、境搜索收益、声场信息收益;
步骤4:建立多UUV系统的n步预测滚动优化模型;
将系统在t时刻对t+q时刻的预测状态记作x(t+q|t)决策输入的预测记作u(t+q|t);第t个决策输入时刻后,n步预测状态的集合记为X(t),决策输入集合记为U(t);则在一段时间[t,t+n-1]内,得到整个多UUV系统的预测总体搜索效能如下:
步骤5:基于步骤4得到的预测总体搜索效能,得出t时刻求解多UUV系统最优决策输入的滚动优化模型为:
其中,n为滚动优化时间窗步长;U*(t)={u*(t|t),...,u*(t+n-1|t)}为求解得到的最优任务决策序列,取最优决策序列的首项当作系统当前时刻的搜索决策输入,即u(t)=u*(t|t),以此不断重复,即能保证系统持续执行搜索任务;将系统未来n个时刻的总体效能函数当成优化目标;通过滚动优化求解把一个无限时域的优化问题简化成了有限时域的优化问题,且随着不断决策输入,时间窗一直往前滚动;
步骤6:将粒子编码为一个2×1维矩阵[ψi(t) xi(t)]T,粒子航向角和位置信息更新公式如下:
其中,ψi(t+1)是粒子的航向角更新,rand是[0,1]之间的随机数,xi(t)是粒子当前位置,xi(t+1)是粒子位置更新,学习因子c1,c2取值为2,惯性权重w取值为1,pi是个体极值,pg是群体极值,xpb,g是当前种群中适应度排名100p%的随机位置,xpr1,g、xpr2,g是从当前种群中随机选择的位置,F为突变策略中的突变因子;
步骤7:公式(6)中的Fw设置如下:
其中,nfes为进化数量,nfesmax为最大进化数量;
步骤8:根据公式(6)解码粒子得到多UUV系统的一组航向角调整指令,带入公式(5)中,即使搜索效能最大化,随着不断决策输入,直到搜索到目标。
2.根据权利要求1所述基于PSO-LSHADE-CLM的多UUV协同搜索方法,其特征在于:所述步骤1中,在UUV搜索过程中利用传感器探测模型更新地图。
3.根据权利要求1所述基于PSO-LSHADE-CLM的多UUV协同搜索方法,其特征在于:所述步骤2中,第i艘UUV的t时刻状态记为xi(t)=[xpi(t),ψi(t)]T,全部UUV的状态信息为x(t)=[x1(t),x2(t),...,xN(t)]T
4.根据权利要求1所述基于PSO-LSHADE-CLM的多UUV协同搜索方法,其特征在于:所述步骤2中,UUV在t+1时刻的位置坐标具体计算公式如下:
其中,算子In[·]是取整操作运算符;UUV的决策输入需要满足其航行性能约束,包括航向角增量限制Δψi(t)∈[-ηmaxmax]和速度限制vi(t)∈[vmin,vmax]。
5.根据权利要求1所述基于PSO-LSHADE-CLM的多UUV协同搜索方法,其特征在于:所述步骤3中,JF(k)、JE(k)、JL(k)分别定义如下:
其中,pmn(t)∈[0,1]是在t时刻网格对应的目标存在概率;qmn(t)是t时刻网格的环境确定度,omn(t)是UUV的占用概率,用来描述网格被UUV占用的情况;Wmn表示声场信息,用来描述该UUV通过声纳探测到的信息。
6.根据权利要求5所述基于PSO-LSHADE-CLM的多UUV协同搜索方法,其特征在于:所述omn(t)、pmn(t)的初始化表示如下:
CN202210198014.3A 2022-03-02 2022-03-02 一种基于pso-lshade-clm的多uuv协同搜索方法 Active CN114675660B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210198014.3A CN114675660B (zh) 2022-03-02 2022-03-02 一种基于pso-lshade-clm的多uuv协同搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210198014.3A CN114675660B (zh) 2022-03-02 2022-03-02 一种基于pso-lshade-clm的多uuv协同搜索方法

Publications (2)

Publication Number Publication Date
CN114675660A CN114675660A (zh) 2022-06-28
CN114675660B true CN114675660B (zh) 2024-05-07

Family

ID=82073064

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210198014.3A Active CN114675660B (zh) 2022-03-02 2022-03-02 一种基于pso-lshade-clm的多uuv协同搜索方法

Country Status (1)

Country Link
CN (1) CN114675660B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101299134B1 (ko) * 2012-03-19 2013-08-22 한국과학기술연구원 다수 로봇의 협력을 통한 동적 환경에서의 동적 목표물 탐색 시스템 및 방법
CN105425820A (zh) * 2016-01-05 2016-03-23 合肥工业大学 一种针对具有感知能力的运动目标的多无人机协同搜索方法
CN110389595A (zh) * 2019-06-17 2019-10-29 中国工程物理研究院电子工程研究所 双属性概率图优化的无人机集群协同目标搜索方法
CN111381600A (zh) * 2018-12-28 2020-07-07 陕西师范大学 一种基于粒子群算法的uuv路径规划方法
CN112305913A (zh) * 2020-10-24 2021-02-02 西北工业大学 基于直觉模糊博弈的多uuv协同动态机动决策方法
CN113848987A (zh) * 2021-11-04 2021-12-28 河海大学 无人机群协同目标搜索中的动态路径规划方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101299134B1 (ko) * 2012-03-19 2013-08-22 한국과학기술연구원 다수 로봇의 협력을 통한 동적 환경에서의 동적 목표물 탐색 시스템 및 방법
CN105425820A (zh) * 2016-01-05 2016-03-23 合肥工业大学 一种针对具有感知能力的运动目标的多无人机协同搜索方法
CN111381600A (zh) * 2018-12-28 2020-07-07 陕西师范大学 一种基于粒子群算法的uuv路径规划方法
CN110389595A (zh) * 2019-06-17 2019-10-29 中国工程物理研究院电子工程研究所 双属性概率图优化的无人机集群协同目标搜索方法
CN112305913A (zh) * 2020-10-24 2021-02-02 西北工业大学 基于直觉模糊博弈的多uuv协同动态机动决策方法
CN113848987A (zh) * 2021-11-04 2021-12-28 河海大学 无人机群协同目标搜索中的动态路径规划方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
UUV编队协同搜索静止目标的准最优方法;陈盼;胡剑光;尹志伟;;火力与指挥控制;20130415(第04期);全文 *
基于遗传算法的UUV线型多目标优化设计;朱灼;张宇文;王磊;;计算机测量与控制;20111225(第12期);全文 *

Also Published As

Publication number Publication date
CN114675660A (zh) 2022-06-28

Similar Documents

Publication Publication Date Title
CN110515303B (zh) 一种基于ddqn的自适应动态路径规划方法
Song et al. A new approach to smooth global path planning of mobile robots with kinematic constraints
Cao et al. Target search control of AUV in underwater environment with deep reinforcement learning
CN112362066B (zh) 一种基于改进的深度强化学习的路径规划方法
Sichkar Reinforcement learning algorithms in global path planning for mobile robot
Ge et al. Multi-agent transfer reinforcement learning with multi-view encoder for adaptive traffic signal control
Chen et al. Self-learning exploration and mapping for mobile robots via deep reinforcement learning
CN114281103B (zh) 一种零交互通信的飞行器集群协同搜索方法
Xiong et al. Multi-feature fusion and selection method for an improved particle swarm optimization
Wu et al. Learning and planning with a semantic model
Han et al. Multi-uav automatic dynamic obstacle avoidance with experience-shared a2c
Jia et al. An online adjusting RBF neural network for nonlinear system modeling
Sumiea et al. Enhanced deep deterministic policy gradient algorithm using grey wolf optimizer for continuous control tasks
CN114675660B (zh) 一种基于pso-lshade-clm的多uuv协同搜索方法
Shi et al. Efficient hierarchical policy network with fuzzy rules
Chen et al. A multirobot cooperative area coverage search algorithm based on bioinspired neural network in unknown environments
KR20230075497A (ko) 파레토 프론트 최적화를 사용한 제약된 강화 학습 신경망 시스템
Zhang et al. Clique-based cooperative multiagent reinforcement learning using factor graphs
CN118493381A (zh) 基于持续策略重振的离线到在线可泛化强化学习方法和装置
Xiang et al. UAV path planning based on enhanced pso-ga
CN111950690A (zh) 一种具有自适应能力的高效强化学习策略模型
CN117029823A (zh) 一种基于强化学习的csi指纹地图构建的路径规划方法
Lin et al. A novel robotic path planning method in grid map context based on D* lite algorithm and deep learning
Xiangrui et al. Ddpg-based improved seeker optimization algorithm for robot path planning
Zhao et al. Learning multi-agent communication with policy fingerprints for adaptive traffic signal control

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant