CN111487986A - 基于全局信息传递机制的水下机器人协同目标搜索方法 - Google Patents

基于全局信息传递机制的水下机器人协同目标搜索方法 Download PDF

Info

Publication number
CN111487986A
CN111487986A CN202010411946.2A CN202010411946A CN111487986A CN 111487986 A CN111487986 A CN 111487986A CN 202010411946 A CN202010411946 A CN 202010411946A CN 111487986 A CN111487986 A CN 111487986A
Authority
CN
China
Prior art keywords
grid
robot
value
target
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010411946.2A
Other languages
English (en)
Other versions
CN111487986B (zh
Inventor
姚鹏
邱立艳
魏欣
刘玉会
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ocean University of China
Original Assignee
Ocean University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ocean University of China filed Critical Ocean University of China
Priority to CN202010411946.2A priority Critical patent/CN111487986B/zh
Publication of CN111487986A publication Critical patent/CN111487986A/zh
Application granted granted Critical
Publication of CN111487986B publication Critical patent/CN111487986B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/04Control of altitude or depth
    • G05D1/06Rate of change of altitude or depth
    • G05D1/0692Rate of change of altitude or depth specially adapted for under-water vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Manipulator (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明涉及一种基于全局信息传递机制的水下机器人协同目标搜索方法,包括:根据目标先验概率分布以及障碍物分布,初步计算待搜索任务区域内各栅格的活性值,作为区域的先验搜索图信息;结合区域内的洋流场分布,计算各相邻栅格间的机器人航行时间,确定各相邻栅格间的连接权重;各相邻栅格之间以一定的权重互相传递活性值;采取高斯混合模型提取出高价值子区域,并将高价值子区域的预期收益传递给各栅格,实现区域搜索图信息的全局共享与更新;各机器人独立维护并迭代更新各自的区域搜索图并确定下一步行为,直至完成目标搜索任务。本发明方法简单可行,路径平滑、效率高,实现多机器人协同目标搜索。

Description

基于全局信息传递机制的水下机器人协同目标搜索方法
技术领域
本发明属于水下机器人导航制导与控制技术领域,尤其涉及一种基于全局信息传递机制的水下机器人协同目标搜索方法。
背景技术
相比于传统的人工搜索模式,利用水下机器人等高技术手段搜索目标具有使用灵活方便、安全度高等优点,因此正逐步应用于复杂海洋环境下的大范围、长时间搜索任务。通常来说,水下机器人按照既定航线航行,并通过搭载的高清摄像头或侧扫声呐等设备对任务区域进行探测,以期能够尽快发现目标、或尽可能降低环境不确定度、或尽可能多地搜集环境信息。此外,相比于单艘机器人,多艘机器人可通过信息共享、行为协同等措施有效提高搜索效率,正逐渐得到越来越多的关注。
水下机器人协同目标搜索问题的核心在于如何规划多机器人的路径,但需注意它与传统路径规划问题的不同:传统路径规划问题关注的是机器人从起点到终点航行过程中的自主避障基本任务;而目标搜索问题侧重于机器人对目标区域的高效覆盖搜索,此外还需考虑自主避障、避撞、通信保持等基本任务,因此其问题求解难度更大。现有的水下机器人协同目标搜索方法主要包括三种,即几何法、随机法、启发式方法。几何法通过规划平行线、螺旋线等标准路径以引导机器人全覆盖区域,而当多艘水下机器人执行任务时还需划分并分配任务区域,该类方法虽然原理简单、使用灵活,但因缺乏启发式引导策略使得搜索效率较低。随机法可引导水下机器人在任务区域内随机航行,如Levy飞行、布朗运动等,随着时间累积,水下机器人将逐渐覆盖区域并搜索到目标,虽然该方法不需要精确的定位与复杂的优化过程,但搜索效率仍然较低,不适应于大范围复杂海域内的长时间搜索任务。启发式方法基于区域的搜索图信息,采取各类启发式策略如模型预测控制、梯度法、神经网络等确定水下机器人的未来搜索行为,此类方法比较灵活且搜索效率较高,但由于搜索图信息分布复杂,机器人容易陷入局部最优区域而无法探测高价值的其他区域。
通过上述分析可知,当任务区域内的搜索图信息已知时,各类启发式方法更加有效,但它们往往存在局部最优问题,缺乏对远处区域未来信息的全局考虑。因此,本发明考虑提出一种基于搜索图信息的全局传递机制,以引导水下机器人更高效地搜索目标。
发明内容
本发明在基于传统启发式方法的水下机器人协同目标方法存在不足的基础上提供了一种基于全局信息传递机制的水下机器人协同目标搜索方法,使得任务区域内各位置的搜索图信息互相传递并加权更新,同时直接快速引入部分区域的高价值回报,以引导水下机器人更高效地搜索目标。
为了实现上述目的,本发明提供了一种基于全局信息传递机制的水下机器人协同目标搜索方法,包括以下步骤:
(S1)根据目标先验概率分布以及障碍物分布,初步计算待搜索任务区域内各栅格的活性值,作为区域的先验搜索图信息;
(S2)结合区域内的洋流场分布,计算各相邻栅格间的机器人航行时间,进而确定各相邻栅格间的连接权重;
(S3)各相邻栅格之间以一定的权重互相传递其活性值,从而逐步实现区域搜索图信息的全局共享;
(S4)采取高斯混合模型提取出高价值子区域,并将高价值子区域的预期收益直接传递给各栅格,以进一步实现区域搜索图信息的全局共享与更新;
(S5)各机器人根据步骤(S1)-(S4)独立维护并迭代更新各自的区域搜索图;考虑路径平滑度与搜索回报值指标,采取贪婪策略确定各机器人的下一步行为;
(S6)重复上述步骤,直至机器人完成目标搜索任务。
优选的,步骤(S1)根据目标先验概率分布以及障碍物分布,初步计算待搜索任务区域内各栅格的活性值,作为区域的先验搜索图信息的方法为:
将待搜索任务区域离散化为M个栅格,对于任意栅格m,m=1,...,M,待搜索目标存在于栅格m内的目标先验概率值p(m)∈[0,1],所有栅格的目标概率值满足
Figure BDA0002493586480000031
将机器人作为虚拟障碍物,且恰好占据一个栅格区域,则各栅格的回报值为:
Figure BDA0002493586480000041
其中,t表示当前迭代次数,gs表示机器人上搭载的传感器的探测概率,-E为惩罚项;标志位O(m)=1表示栅格被障碍物占据,O(m)=0表示栅格为自由空间;
将各栅格的初始回报值
Figure BDA0002493586480000042
作为其初始活性值
Figure BDA0002493586480000043
,(t=0),确定整个任务区域的先验搜索图信息。
优选的,步骤(S2)结合区域内的洋流场分布,计算各相邻栅格间的机器人航行时间,进而确定各相邻栅格间的连接权重的方法为:
计算各相邻栅格间的机器人航行时间Tmk:对于任意相邻栅格m和栅格k,机器人绝对速度Va方向与栅格连线保持一致,Va等于机器人相对速度Vr与洋流速度Vc的矢量和;
根据余弦定理可得:
|Va|2+|Vc|2-2|Va||Vc|cos<Vc,Va>=|Vr|2 (2)
其中,|Vc|、|Vr|保持恒定且已知;若上式(2)不存在正解,则水下机器人无法沿该路径段航行,航行时间Tmk取无穷大;否则,|Va|取最大解值,计算航行时间Tmk=|xm-xk|/|Va|,其中xm、xk分别表示栅格m和栅格k的中心位置;
则栅格m和栅格k的连接权重wmk表示为:
Figure BDA0002493586480000051
其中,e为指数衰减函数,γ>0为常系数。
优选的,步骤(S3)各相邻栅格之间以一定的权重互相传递其活性值,从而逐步实现区域搜索图信息的全局共享的方法为:
对于任意栅格m,对邻居栅格k以权重wmk传递活性值,并在其自身回报值
Figure BDA0002493586480000052
的基础上引入邻居栅格k的活性值
Figure BDA0002493586480000053
的加权和,作为它更新后的活性值
Figure BDA0002493586480000054
Figure BDA0002493586480000055
其中,N(m)表示栅格m的邻居栅格集合。
优选的,步骤(S4)采取高斯混合模型提取出高价值子区域,并将高价值子区域的预期收益直接传递给各栅格,实现区域搜索图信息的全局共享与更新的方法为:
构建任务区域目标先验概率分布的高斯混合模型,提取出若干个高价值子区域Sk:假设共有K个标准的二维高斯函数Gkk,Ck)组成高斯混合模型,其中μk、Ck表示均值和标准差矩阵,k=1,...,K,各模型所占比例αk满足
Figure BDA0002493586480000056
对参数αk、μk、Ck进行估计,使各高斯函数的加权和
Figure BDA0002493586480000057
近似等于目标先验概率分布,提取出高价值子区域Sk
如果机器人上一时刻位于栅格l,当前时刻位于栅格m,则预期收益表示为:
Figure BDA0002493586480000061
其中,Δβ表示向量μk-xm与xm-xl的夹角,Rk表示子区域Sk的回报且Rk=0.997αk,Ak表示覆盖盖时间,Lk表示转场时间,
Figure BDA0002493586480000062
表示机器人前期在子区域Sk内的累计回报;
将子区域预期收益
Figure BDA0002493586480000063
直接传递给栅格活性值,将任意栅格m更新后的活性值
Figure BDA0002493586480000064
修正为:
Figure BDA0002493586480000065
其中,
Figure BDA0002493586480000066
表示任意栅格m修正后的活性值,
Figure BDA0002493586480000067
表示任意栅格m的回报值,
Figure BDA0002493586480000068
表示邻居栅格k的活性值。
优选的,对参数αk、μk、Ck进行估计,使各高斯函数的加权和
Figure BDA0002493586480000069
近似等于目标先验概率分布,提取出高价值子区域的方法为:
定义训练样本,其中各训练个体的数量比例等于先验目标概率;
采用k-means聚类算法初步确定参数αk、μk、Ck的初值,进而采取极大似然法进行参数的迭代估计,直至满足收敛条件;
将各高斯函数两倍标准差范围对应的椭圆形区域作为提取出的高价值子区域,提取出高价值子区域Sk
优选的,当多艘水下机器人执行目标搜索任务时,各机器人将根据目标概率分布、障碍物分布、其他机器人位置信息,各自构建并迭代计算栅格活性值,以更新区域搜索图。
优选的,步骤(S5)中考虑路径平滑度与搜索回报值指标,采取贪婪策略确定各机器人的下一步行为的方法为:
采取贪婪策略选择机器人的下一时刻目标位置:
Figure BDA0002493586480000071
其中,k*表示选择出的邻居栅格号;
Figure BDA0002493586480000072
表示机器人器上一时刻位于栅格l、当前时刻位于栅格m、下一时刻位于栅格k时的平滑度,Δθ表示向量xk-xm与xm-xl的夹角;
Figure BDA0002493586480000073
表示任意栅格k修正后的活性值;
机器人运动到栅格k*后,根据贝叶斯规则将目标概率更新为p(k*)←(1-gs)·p(k*)。
与现有技术相比,本发明的优点和积极效果在于:
本发明基于现有的启发式方法,提出一种基于全局信息传递机制的水下机器人协同目标搜索方法,通过考虑洋流场分布,根据航行时间计算相邻栅格间的连接权重,此外考虑了避障、通信保持等约束,更加适应于复杂海洋环境下的目标搜索任务;同时,通过相邻栅格之间互相传递活性值,可逐步实现区域搜索图信息的全局共享,一定程度上缓解了传统方法的局部最优问题;并直接引入了高价值子区域的预期收益,可从根本上解决传统方法的局部最优问题,实现远处区域未来信息的全局考虑,以引导水下机器人更高效地搜索目标。该方法简单可行,路径平滑、效率高,实现多机器人协同目标搜索。
附图说明
图1为本发明基于全局信息传递机制的水下机器人协同目标搜索方法的流程图;
图2为相邻栅格示意图;
图3为实际目标概率分布与高斯混合模型近似结果;
其中:图3a表示实际目标概率分布,图3b表示高斯混合模型结果;
图4为水下机器人协同目标搜索结果;
其中:图4a表示初始目标概率分布,图4b表示机器人搜索路径,图4c表示更新后的目标概率分布。
具体实施方式
以下,结合附图对本发明的具体实施方式进行进一步的描述。
水下机器人协同目标搜索问题的核心在于如何规划多机器人的路径,侧重于机器人对目标区域的高效覆盖搜索,此外还需考虑自主避障、避撞、通信保持等基本任务,因此其问题求解难度更大。本发明基于现有的启发式方法,提出一种基于搜索图信息的全局传递机制的水下机器人协同目标搜索方法,使得任务区域内各位置的搜索图信息互相传递并加权更新,同时直接快速引入部分区域的高价值回报,以引导水下机器人更高效地搜索目标。具体方法为:
一种基于全局信息传递机制的水下机器人协同目标搜索方法,方法流程如图1所示,具体包括以下步骤:
(1)根据目标先验概率分布以及障碍物分布,初步计算待搜索任务区域内各栅格的活性值,作为区域的先验搜索图信息。具体为:
①将待搜索任务区域离散化为M个栅格,对于任意栅格m,m=1,...,M,待搜索目标存在于栅格m内的目标先验概率值p(m)∈[0,1],该值表示目标恰好存在于栅格m处的可能性,假设在任务区域内仅有一个待搜索目标,则所有栅格的目标概率值满足
Figure BDA0002493586480000091
②由于任务区域内往往存在一些障碍物,可用标志位O(m)来描述栅格被障碍物占据情况,O(m)=1表示栅格被障碍物占据,O(m)=0表示栅格为自由空间。此外,为实现机间避撞,要求两艘机器人不能同时在一个栅格内,因此将机器人作为虚拟障碍物,且恰好占据一个栅格区域。
各栅格自身的回报值主要考虑了两部分:一方面,当该栅格满足避障约束时,可引入机器人对栅格的单次探测收益p(m)·gs,其中gs表示机器人上搭载的传感器的探测概率;另一方面,当该栅格不满足避障约束时,直接引入惩罚项-E,其中E表示很大的正值。因此,将栅格的回报值表示为:
Figure BDA0002493586480000101
其中,t表示当前时刻迭代次数。
③将各栅格的初始回报值
Figure BDA0002493586480000102
作为其初始活性值
Figure BDA0002493586480000103
确定整个任务区域的先验搜索图信息。
(2)结合区域内的洋流场分布,计算各相邻栅格间的机器人航行时间,进而确定各相邻栅格间的连接权重。具体为:
如图2所示,每个栅格与周围的8个栅格连接,首先计算各相邻栅格间的机器人航行时间Tmk:对于任意相邻栅格m和栅格k,机器人相对于海底的绝对速度Va方向与栅格连线保持一致,Va等于机器人相对于洋流速度的相对速度Vr与洋流速度Vc的矢量和;
根据余弦定理可得:
|Va|2+|Vc|2-2|Va||Vc|cos<Vc,Va>=|Vr|2 (2)
其中,|Vc|、|Vr|保持恒定且已知;若上式(2)不存在正解,则水下机器人无法沿该路径段航行,航行时间Tmk取无穷大;否则,|Va|取最大解值,计算航行时间Tmk=|xm-xk|/|Va|,其中xm、xk分别表示栅格m和栅格k的中心位置;
引入指数衰减函数,则栅格m和栅格k的连接权重wmk表示为:
Figure BDA0002493586480000104
其中,e为指数衰减函数,γ>0为常系数,需提前人为给定。
(3)各相邻栅格之间以一定的权重互相传递其活性值,从而逐步实现区域搜索图信息的全局共享。具体为:
对于任意栅格m,对邻居栅格k以权重wmk传递活性值,并在其自身回报值
Figure BDA0002493586480000111
的基础上引入邻居栅格k的活性值
Figure BDA0002493586480000112
的加权和,作为它更新后的活性值
Figure BDA0002493586480000113
Figure BDA0002493586480000114
其中,N(m)表示栅格m的邻居栅格集合,转换函数f(·)用来归一化整个搜索图的活性值,此外要求各栅格之间不会传递回报值惩罚项,则上式(4)表示为:
Figure BDA0002493586480000115
其中,
Figure BDA0002493586480000116
表示任意栅格m更新后的活性值。
由于相邻栅格之间可传递活性值,因此即使距离较远的栅格的单次探测收益也会逐渐传递到整个搜索图,上述机制可逐步实现区域搜索图信息的全局共享。同时,本发明直接引入了避障约束的惩罚项-E,且该值仅能作为栅格的内部惩罚项而不会传递给其他栅格,可避免不必要的全局影响,提高准确度。
(4)采取高斯混合模型提取出高价值子区域,并将高价值子区域的预期收益直接传递给各栅格,以进一步实现区域搜索图信息的全局共享与更新。具体为:
由式(3)-(5)可知,栅格活性值传递到整个区域需要一段时间,且在传递过程中逐渐减小,因此仍存在局部最优问题。如图3所示,由于任务区域内的目标先验概率分布具有一定的高斯分布特性,因此可用高斯混合模型来近似描述,进而提取出若干个高价值子区域,并将子区域的预期收益直接传递给各栅格,以进一步实现区域搜索图信息的全局共享与更新。
①假设共有K个标准的二维高斯函数Gkk,Ck)组成任务区域目标先验概率分布高斯混合模型,其中μk、Ck表示均值和标准差矩阵,k=1,...,K,各模型所占比例αk满足
Figure BDA0002493586480000121
为了使得各高斯函数的加权和
Figure BDA0002493586480000122
近似等于目标先验概率分布,需对各参数αk、μk、Ck等进行估计:首先,定义训练样本,其中各训练个体(即所在栅格位置)的数量比例等于先验目标概率;然后,采用k-means聚类算法初步确定参数αk、μk、Ck的初值,进而采取极大似然法进行参数的迭代估计,直至满足收敛条件;最后,将各高斯函数两倍标准差范围对应的椭圆形区域作为提取出的高价值子区域,提取出高价值子区域Sk
②然后,计算各子区域Sk的三种量化指标,即子区域回报Rk=0.997αk、覆盖时间Ak、转场时间Lk,其中覆盖时间Ak以子区域内的栅格个数代替、转场时间Lk以子区域中心到当前栅格m的直线经过的栅格个数代替。如果机器人上一时刻位于栅格l,当前时刻位于栅格m,则预期收益表示为:
Figure BDA0002493586480000131
其中,Δβ表示向量μk-xm与xm-xl的夹角,
Figure BDA0002493586480000132
表示机器人前期在子区域Sk内的累计回报;
③将子区域预期收益
Figure BDA0002493586480000133
直接传递给栅格活性值,将任意栅格m更新后的活性值
Figure BDA0002493586480000134
修正为:
Figure BDA0002493586480000135
其中,
Figure BDA0002493586480000136
表示任意栅格m修正后的活性值,
Figure BDA0002493586480000137
表示任意栅格m的回报值,
Figure BDA0002493586480000138
表示邻居栅格k的活性值。
(5)各机器人根据上述步骤独立维护并迭代更新各自的区域搜索图;考虑路径平滑度与搜索回报值指标,采取贪婪策略确定各机器人的下一步行为。具体为:
当多艘水下机器人执行目标搜索任务时,各机器人将根据目标概率分布、障碍物分布、其他机器人位置等信息,各自构建并迭代解算栅格活性值,以更新区域搜索图。
①假设机器人上一时刻位于栅格l,当前时刻位于栅格m,如果下一时刻位于栅格k,则平滑度
Figure BDA0002493586480000141
定义为:
Figure BDA0002493586480000142
其中,Δθ表示向量xk-xm与xm-xl的夹角。同时,要求机器人运动到具有较大活性值的邻居栅格k*且路径尽可能平滑,此外还需满足通信保持约束,即:d≤dmax,d表示机器人间的距离,dmax表示最大通信距离。
②采取贪婪策略选择机器人的下一时刻目标位置:
Figure BDA0002493586480000143
其中,k*表示选择出的邻居栅格号;
Figure BDA0002493586480000144
表示任意栅格k修正后的活性值;本实施例中上式属于单步优化策略,此外也可采用多步优化策略,即优化选择未来N步的位置。
③机器人运动到栅格k*后,根据贝叶斯规则将目标概率更新为p(k*)←(1-gs)·p(k*)。
(6)重复上述步骤以更新搜索图信息以及机器人位置,直至机器人完成目标搜索任务。
参考图4所示,图4(a)表示任务区域内的目标先验概率分布,在右下角有个局部最优的高价值子区域,它远离其他区域以及各机器人起点(200,200)m、(500,200)m、(200,500)m;图4(b)表示采用本发明提出的全局信息传递机制后获得的路径规划结果,机器人将覆盖所有高价值区域,尤其是机器人1和2将覆盖探测较远的右下角区域,此外机器人可安全躲避障碍物并满足避撞、通信保持等空间协同约束;图4(c)表示任务结束后的目标概率分布,显然具有较高探测价值的区域均被机器人覆盖。
因此,综上可知,本发明基于现有的启发式方法,提出一种基于全局信息传递机制的水下机器人协同目标搜索方法,通过考虑洋流场分布,根据航行时间计算相邻栅格间的连接权重,此外考虑了避障、通信保持等约束,更加适应于复杂海洋环境下的目标搜索任务;同时,通过相邻栅格之间互相传递活性值,可逐步实现区域搜索图信息的全局共享,一定程度上缓解了传统方法的局部最优问题;并直接引入了高价值子区域的预期收益,可从根本上解决传统方法的局部最优问题,实现远处区域未来信息的全局考虑,以引导水下机器人更高效地搜索目标。该方法简单可行,路径平滑、效率高,实现多机器人协同目标搜索。
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作其它形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例应用于其它领域,但是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型,仍属于本发明技术方案的保护范围。

Claims (8)

1.一种基于全局信息传递机制的水下机器人协同目标搜索方法,其特征在于,包括以下步骤:
(S1)根据目标先验概率分布以及障碍物分布,初步计算待搜索任务区域内各栅格的活性值,作为区域的先验搜索图信息;
(S2)结合区域内的洋流场分布,计算各相邻栅格间的机器人航行时间,进而确定各相邻栅格间的连接权重;
(S3)各相邻栅格之间以一定的权重互相传递其活性值,从而逐步实现区域搜索图信息的全局共享;
(S4)采取高斯混合模型提取出高价值子区域,并将高价值子区域的预期收益直接传递给各栅格,以进一步实现区域搜索图信息的全局共享与更新;
(S5)各机器人根据步骤(S1)-(S4)独立维护并迭代更新各自的区域搜索图;考虑路径平滑度与搜索回报值指标,采取贪婪策略确定各机器人的下一步行为;
(S6)重复上述步骤,直至机器人完成目标搜索任务。
2.根据权利要求1所述的基于全局信息传递机制的水下机器人协同目标搜索方法,其特征在于,步骤(S1)根据目标先验概率分布以及障碍物分布,初步计算待搜索任务区域内各栅格的活性值,作为区域的先验搜索图信息的方法为:
将待搜索任务区域离散化为M个栅格,对于任意栅格m,m=1,...,M,待搜索目标存在于栅格m内的目标先验概率值p(m)∈[0,1],所有栅格的目标概率值满足
Figure FDA0002493586470000021
将机器人作为虚拟障碍物,且恰好占据一个栅格区域,则各栅格的回报值为:
Figure FDA0002493586470000022
其中,t表示当前迭代次数,gs表示机器人上搭载的传感器的探测概率,-E为惩罚项;标志位O(m)=1表示栅格被障碍物占据,O(m)=0表示栅格为自由空间;
将各栅格的初始回报值
Figure FDA0002493586470000023
作为其初始活性值
Figure FDA0002493586470000024
(t=0),确定整个任务区域的先验搜索图信息。
3.根据权利要求2所述的基于全局信息传递机制的水下机器人协同目标搜索方法,其特征在于,步骤(S2)结合区域内的洋流场分布,计算各相邻栅格间的机器人航行时间,进而确定各相邻栅格间的连接权重的方法为:
计算各相邻栅格间的机器人航行时间Tmk:对于任意相邻栅格m和栅格k,机器人绝对速度Va方向与栅格连线保持一致,Va等于机器人相对速度Vr与洋流速度Vc的矢量和;
根据余弦定理可得:
|Va|2+|Vc|2-2|Va||Vc|cos<Vc,Va>=|Vr|2 (2)
其中,|Vc|、|Vr|保持恒定且已知;若上式(2)不存在正解,则水下机器人无法沿该路径段航行,航行时间Tmk取无穷大;否则,|Va|取最大解值,计算航行时间Tmk=|xm-xk|/|Va|,其中xm、xk分别表示栅格m和栅格k的中心位置;
则栅格m和栅格k的连接权重wmk表示为:
Figure FDA0002493586470000031
其中,e为指数衰减函数,γ>0为常系数。
4.根据权利要求3所述的基于全局信息传递机制的水下机器人协同目标搜索方法,其特征在于,步骤(S3)各相邻栅格之间以一定的权重互相传递其活性值,从而逐步实现区域搜索图信息的全局共享的方法为:
对于任意栅格m,对邻居栅格k以权重wmk传递活性值,并在其自身回报值
Figure FDA0002493586470000032
的基础上引入邻居栅格k的活性值
Figure FDA0002493586470000033
的加权和,作为它更新后的活性值
Figure FDA0002493586470000034
Figure FDA0002493586470000035
其中,N(m)表示栅格m的邻居栅格集合。
5.根据权利要求4所述的基于全局信息传递机制的水下机器人协同目标搜索方法,其特征在于,步骤(S4)采取高斯混合模型提取出高价值子区域,并将高价值子区域的预期收益直接传递给各栅格,实现区域搜索图信息的全局共享与更新的方法为:
构建任务区域目标先验概率分布的高斯混合模型,提取出若干个高价值子区域Sk:假设共有K个标准的二维高斯函数Gkk,Ck)组成高斯混合模型,其中μk、Ck表示均值和标准差矩阵,k=1,...,K,各模型所占比例αk满足
Figure FDA0002493586470000041
对参数αk、μk、Ck进行估计,使各高斯函数的加权和
Figure FDA0002493586470000042
近似等于目标先验概率分布,提取出高价值子区域Sk
如果机器人上一时刻位于栅格l,当前时刻位于栅格m,则预期收益表示为:
Figure FDA0002493586470000043
其中,Δβ表示向量μk-xm与xm-xl的夹角,Rk表示子区域Sk的回报且Rk=0.997αk,Ak表示覆盖盖时间,Lk表示转场时间,
Figure FDA0002493586470000044
表示机器人前期在子区域Sk内的累计回报;
将子区域预期收益
Figure FDA0002493586470000045
直接传递给栅格活性值,将任意栅格m更新后的活性值
Figure FDA0002493586470000046
修正为:
Figure FDA0002493586470000047
其中,
Figure FDA0002493586470000051
表示任意栅格m修正后的活性值,
Figure FDA0002493586470000052
表示任意栅格m的回报值,
Figure FDA0002493586470000053
表示邻居栅格k的活性值。
6.根据权利要求5所述的基于全局信息传递机制的水下机器人协同目标搜索方法,其特征在于,对参数αk、μk、Ck进行估计,使各高斯函数的加权和
Figure FDA0002493586470000054
近似等于目标先验概率分布,提取出高价值子区域的方法为:
定义训练样本,其中各训练个体的数量比例等于先验目标概率;
采用k-means聚类算法初步确定参数αk、μk、Ck的初值,进而采取极大似然法进行参数的迭代估计,直至满足收敛条件;
将各高斯函数两倍标准差范围对应的椭圆形区域作为提取出的高价值子区域,提取出高价值子区域Sk
7.根据权利要求1所述的基于全局信息传递机制的水下机器人协同目标搜索方法,其特征在于,当多艘水下机器人执行目标搜索任务时,各机器人将根据目标概率分布、障碍物分布、其他机器人位置信息,各自构建并迭代计算栅格活性值,以更新区域搜索图。
8.根据权利要求5或6所述的基于全局信息传递机制的水下机器人协同目标搜索方法,其特征在于,步骤(S5)中考虑路径平滑度与搜索回报值指标,采取贪婪策略确定各机器人的下一步行为的方法为:
采取贪婪策略选择机器人的下一时刻目标位置:
Figure FDA0002493586470000061
其中,k*表示选择出的邻居栅格号;
Figure FDA0002493586470000062
表示机器人器上一时刻位于栅格l、当前时刻位于栅格m、下一时刻位于栅格k时的平滑度,Δθ表示向量xk-xm与xm-xl的夹角;
Figure FDA0002493586470000063
表示任意栅格k修正后的活性值;
机器人运动到栅格k*后,根据贝叶斯规则将目标概率更新为p(k*)←(1-gs)·p(k*)。
CN202010411946.2A 2020-05-15 2020-05-15 基于全局信息传递机制的水下机器人协同目标搜索方法 Active CN111487986B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010411946.2A CN111487986B (zh) 2020-05-15 2020-05-15 基于全局信息传递机制的水下机器人协同目标搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010411946.2A CN111487986B (zh) 2020-05-15 2020-05-15 基于全局信息传递机制的水下机器人协同目标搜索方法

Publications (2)

Publication Number Publication Date
CN111487986A true CN111487986A (zh) 2020-08-04
CN111487986B CN111487986B (zh) 2021-03-16

Family

ID=71792165

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010411946.2A Active CN111487986B (zh) 2020-05-15 2020-05-15 基于全局信息传递机制的水下机器人协同目标搜索方法

Country Status (1)

Country Link
CN (1) CN111487986B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112363539A (zh) * 2020-11-18 2021-02-12 中国海洋大学 多无人机协同目标搜索方法
CN112445244A (zh) * 2020-11-09 2021-03-05 中国科学院沈阳自动化研究所 一种多自主水下机器人的目标搜寻方法
CN112464997A (zh) * 2020-11-10 2021-03-09 长江水利委员会长江科学院 基于模糊-贪婪搜索决策的多传感器协同监测方法及系统
CN112465127A (zh) * 2020-11-29 2021-03-09 西北工业大学 一种基于改进的生物启发神经网络的多智能体协同目标搜索方法
CN112966609A (zh) * 2021-03-05 2021-06-15 北京百度网讯科技有限公司 目标检测方法及装置
CN113110517A (zh) * 2021-05-24 2021-07-13 郑州大学 未知环境下基于生物启发的多机器人协作搜索方法
CN114019983A (zh) * 2021-12-09 2022-02-08 中国海洋大学 面向多任务点的无人艇协同路径规划方法
CN114706427A (zh) * 2022-06-02 2022-07-05 武汉理工大学 一种海空立体协同搜寻系统及其控制方法
CN114779801A (zh) * 2021-01-22 2022-07-22 中国科学院沈阳自动化研究所 一种面向目标探测的自主遥控水下机器人路径规划方法
CN116520861A (zh) * 2023-05-04 2023-08-01 哈尔滨工程大学 基于改进Glasius仿生神经网络的静态目标搜索方法与装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102967857A (zh) * 2012-11-28 2013-03-13 西安电子科技大学 基于粒子群优化的传感器网络对机动目标的协同跟踪方法
CN105700555A (zh) * 2016-03-14 2016-06-22 北京航空航天大学 一种基于势博弈的多无人机协同搜索方法
CN107450563A (zh) * 2017-09-21 2017-12-08 景德镇陶瓷大学 一种基于多子群的自适应信息反馈粒子群机器人路径选择方法及系统
CN108037771A (zh) * 2017-12-07 2018-05-15 淮阴师范学院 一种多自治水下机器人搜索控制系统及其方法
CN108168558A (zh) * 2017-12-22 2018-06-15 中国海洋大学 应用于河流目标搜索任务的无人机航迹规划算法
CN108871364A (zh) * 2018-06-28 2018-11-23 南京信息工程大学 一种基于结点算法的水下机器人路径规划方法
CN109579860A (zh) * 2018-11-20 2019-04-05 清华大学 一种基于场在线估计的水下机器人场源搜索方法
CN109959377A (zh) * 2017-12-25 2019-07-02 北京东方兴华科技发展有限责任公司 一种机器人导航定位系统及方法
CN110196602A (zh) * 2019-05-08 2019-09-03 河海大学 目标导向集中优化的快速水下机器人三维路径规划方法
CN110262563A (zh) * 2018-05-23 2019-09-20 中国海洋大学 多无人机协同搜索水上目标的方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102967857A (zh) * 2012-11-28 2013-03-13 西安电子科技大学 基于粒子群优化的传感器网络对机动目标的协同跟踪方法
CN105700555A (zh) * 2016-03-14 2016-06-22 北京航空航天大学 一种基于势博弈的多无人机协同搜索方法
CN107450563A (zh) * 2017-09-21 2017-12-08 景德镇陶瓷大学 一种基于多子群的自适应信息反馈粒子群机器人路径选择方法及系统
CN108037771A (zh) * 2017-12-07 2018-05-15 淮阴师范学院 一种多自治水下机器人搜索控制系统及其方法
CN108168558A (zh) * 2017-12-22 2018-06-15 中国海洋大学 应用于河流目标搜索任务的无人机航迹规划算法
CN109959377A (zh) * 2017-12-25 2019-07-02 北京东方兴华科技发展有限责任公司 一种机器人导航定位系统及方法
CN110262563A (zh) * 2018-05-23 2019-09-20 中国海洋大学 多无人机协同搜索水上目标的方法
CN108871364A (zh) * 2018-06-28 2018-11-23 南京信息工程大学 一种基于结点算法的水下机器人路径规划方法
CN109579860A (zh) * 2018-11-20 2019-04-05 清华大学 一种基于场在线估计的水下机器人场源搜索方法
CN110196602A (zh) * 2019-05-08 2019-09-03 河海大学 目标导向集中优化的快速水下机器人三维路径规划方法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
DAQI ZHU等: "Biologically Inspired Self-Organizing Map Applied to Task Assignment and Path Planning of an AUV System", 《IEEE TRANSACTIONS ON COGNITIVE AND DEVELOPMENTAL SYSTEMS》 *
MYOUNG HWAN CHOI: "Optimal Underwater Coverage of a Cellular Region by Autonomous Underwater Vehicle Using Line Sweep Motion", 《J ELECTR ENG TECHNOL》 *
PENG YAO等: "Optimal UAV Route Planning for Coverage Search of Stationary Target in River", 《IEEE TRANSACTIONS ON CONTROL SYSTEMS TECHNOLOGY》 *
PENG YAO等: "Three-Dimensional Path Planning for AUV Based on Interfered Fluid Dynamical System Under Ocean Current", 《IEEE ACCESS》 *
姚鹏等: "基于最小一致性的自治式水下机器人路径规划", 《无人系统技术|水下无人系统专栏》 *
姚鹏等: "面向海上目标搜索任务的多无人机协同航路优化", 《MARINE SCIENCES》 *
姜大鹏: "多水下机器人协调控制技术研究", 《中国博士学位论文电子期刊网 信息科技辑》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112445244A (zh) * 2020-11-09 2021-03-05 中国科学院沈阳自动化研究所 一种多自主水下机器人的目标搜寻方法
CN112464997A (zh) * 2020-11-10 2021-03-09 长江水利委员会长江科学院 基于模糊-贪婪搜索决策的多传感器协同监测方法及系统
CN112464997B (zh) * 2020-11-10 2023-07-14 长江水利委员会长江科学院 基于模糊-贪婪搜索决策的多传感器协同监测方法及系统
CN112363539B (zh) * 2020-11-18 2021-09-21 中国海洋大学 多无人机协同目标搜索方法
CN112363539A (zh) * 2020-11-18 2021-02-12 中国海洋大学 多无人机协同目标搜索方法
CN112465127A (zh) * 2020-11-29 2021-03-09 西北工业大学 一种基于改进的生物启发神经网络的多智能体协同目标搜索方法
CN112465127B (zh) * 2020-11-29 2024-05-28 西北工业大学 一种基于改进的生物启发神经网络的多智能体协同目标搜索方法
CN114779801A (zh) * 2021-01-22 2022-07-22 中国科学院沈阳自动化研究所 一种面向目标探测的自主遥控水下机器人路径规划方法
CN114779801B (zh) * 2021-01-22 2024-05-31 中国科学院沈阳自动化研究所 一种面向目标探测的自主遥控水下机器人路径规划方法
CN112966609B (zh) * 2021-03-05 2023-08-11 北京百度网讯科技有限公司 目标检测方法及装置
CN112966609A (zh) * 2021-03-05 2021-06-15 北京百度网讯科技有限公司 目标检测方法及装置
CN113110517A (zh) * 2021-05-24 2021-07-13 郑州大学 未知环境下基于生物启发的多机器人协作搜索方法
CN114019983A (zh) * 2021-12-09 2022-02-08 中国海洋大学 面向多任务点的无人艇协同路径规划方法
CN114706427A (zh) * 2022-06-02 2022-07-05 武汉理工大学 一种海空立体协同搜寻系统及其控制方法
CN116520861A (zh) * 2023-05-04 2023-08-01 哈尔滨工程大学 基于改进Glasius仿生神经网络的静态目标搜索方法与装置
CN116520861B (zh) * 2023-05-04 2024-04-12 哈尔滨工程大学 基于改进Glasius仿生神经网络的静态目标搜索方法与装置

Also Published As

Publication number Publication date
CN111487986B (zh) 2021-03-16

Similar Documents

Publication Publication Date Title
CN111487986B (zh) 基于全局信息传递机制的水下机器人协同目标搜索方法
CN111695776B (zh) 无人机集群分布式在线协同区域侦察方法及装置
Kim et al. Perception-driven navigation: Active visual SLAM for robotic area coverage
CN111780777A (zh) 一种基于改进a*算法和深度强化学习的无人车路径规划方法
CN110703747A (zh) 一种基于简化广义Voronoi图的机器人自主探索方法
CN112363539B (zh) 多无人机协同目标搜索方法
CN113342008B (zh) 一种海空协同水下目标追踪的路径规划系统及方法
CN113238232B (zh) 面向海洋静态目标的自主水下航行器系统目标搜索方法
CN102914786B (zh) 水下自主航行器auv自主定位方法
CN114859932A (zh) 基于强化学习的探索方法、装置和智能设备
CN114596360B (zh) 一种基于图拓扑的双阶段主动即时定位与建图算法
CN113325856B (zh) 基于逆流逼近策略的uuv最优作业路径规划方法
CN112097774A (zh) 基于自适应卡尔曼滤波与平均跟踪的分布式地图融合方法
CN111812978A (zh) 一种多无人机协作slam方法与系统
CN111176281A (zh) 基于象限法的多水面无人艇覆盖式协同搜索方法及系统
Lee Machine learning vision and nonlinear control approach for autonomous ship landing of vertical flight aircraft
Bai et al. Multi-AUV dynamic trajectory optimization and collaborative search combined with task urgency and energy consumption scheduling in 3-D underwater environment with random ocean currents and uncertain obstacles
Jiang et al. Intelligent plant cultivation robot based on key marker algorithm using visual and laser sensors
CN113064422A (zh) 基于双神经网络强化学习的自主水下航行器路径规划方法
Niu et al. 3D real-time dynamic path planning for UAV based on improved interfered fluid dynamical system and artificial neural network
US20220371709A1 (en) Path planning system and method for sea-aerial cooperative underwater target tracking
Lopes et al. Autonomous exploration of unknown terrain for groups of mobile robots
CN113741416B (zh) 基于改进捕食者猎物模型和dmpc的多机器人全覆盖路径规划方法
Tasaki Perception and Decision Making for the Autonomous Driving System
CN117472083B (zh) 一种多无人机协同海上搜索路径规划方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant