CN111337930B - 一种auv目标搜索方法 - Google Patents

一种auv目标搜索方法 Download PDF

Info

Publication number
CN111337930B
CN111337930B CN202010195576.3A CN202010195576A CN111337930B CN 111337930 B CN111337930 B CN 111337930B CN 202010195576 A CN202010195576 A CN 202010195576A CN 111337930 B CN111337930 B CN 111337930B
Authority
CN
China
Prior art keywords
grid
auv
search
map
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010195576.3A
Other languages
English (en)
Other versions
CN111337930A (zh
Inventor
李娟�
张栩
陈兴华
徐健
王宏健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN202010195576.3A priority Critical patent/CN111337930B/zh
Publication of CN111337930A publication Critical patent/CN111337930A/zh
Application granted granted Critical
Publication of CN111337930B publication Critical patent/CN111337930B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S15/00Systems using the reflection or reradiation of acoustic waves, e.g. sonar systems
    • G01S15/88Sonar systems specially adapted for specific applications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Acoustics & Sound (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Neurology (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本发明提公开了一种AUV目标搜索方法,包括:声呐探测模型的建立、环境感知地图的建立和基于改进吸引源的目标搜索方法。本发明在无先验信息的未知水下环境中通过声呐传感器实时探测周围环境信息,创建并更新了各类环境感知地图,改进信息素的释放机制,使AUV在搜索区域覆盖率较大的情况下针对目标存在概率较低的区域进行回访,避免由于检测概率问题而遗漏目标,防止AUV在已搜索区域进行重复搜索,在搜索区域各个对角设置待激活吸引源,通过激活待激活吸引源更容易搜索到边角的目标,制定各个环境感知地图的更新公式以及搜索收益函数,使AUV做出最大收益的移动决策,在保证搜索的可靠性与稳定性的同时提高搜索效率。

Description

一种AUV目标搜索方法
技术领域
本发明涉及到水下目标搜索领域,涉及一种AUV目标搜索方法,特别是涉及到一种基于改进吸引源的目标搜索算法,可应用于未知水下环境中的AUV目标搜索过程。
背景技术
随着现代科技的快速发展,人类对海洋资源的依赖越来越高,然而由于海洋环境复杂多变、水下能见度低等特点,人类对海洋的探索变得极具挑战性。近年来,由于自主水下航行器(Autonomous Underwater Vehicles,AUV)具有良好的隐蔽性、水下移动的灵活性,经济的适用性等汇集高科技手段的技术特点,在各个领域,均已经受到了广泛关注。
针对未知环境下的目标搜索问题,国内外在海陆空都开展了较为广泛的研究。传统方法以搜索论为基础,从最大化目标发现概率的角度出发,预先设计任务区域的搜索路线。但由于实际任务的搜索环境是未知的,无法预先离线规划,因此实时的目标搜索算法被深入研究。刘重、高晓光等人为了提高无人机对目标的搜索捕获能力和对不确定度高的区域的回访能力,进而提高多无人机协同搜索效率,提出了一种带信息素回访机制的多无人机协同目标搜索方法,但其信息素的释放机制不能完全适用于AUV的目标搜索问题中。吴芳、杨日杰等人针对了马尔科夫水下运动目标的搜索,提出了一种基于马尔科夫过程的水下运动目标启发式搜索算法。但该算法无法解决目标位置和状态未知的搜索情况。
发明内容
针对上述现有技术,本发明要解决的技术问题是提供一种能够在较短时间内搜索到所有目标,并能够解决目标有可能作业区域边角的特殊情况,使AUV在搜索区域覆盖率较大的情况下针对目标存在概率较低的区域进行回访,从而避免由于声呐传感器的检测概率问题而遗漏目标的情况的AUV目标搜索方法。
为解决上述技术问题,本发明的一种AUV目标搜索方法,包括以下步骤:
步骤1:将AUV和目标简化为质点,将搜索区域栅格化,AUV搭载的声呐可以探测以自身为圆心,半径为R的圆内的目标点的情况,声呐具有已知的检测概率;
步骤2:初始化参数和AUV的初始位置,参数包括AUV搭载声呐的传感器检测概率和虚警概率、吸引源的激活半径和影响半径,初始化AUV在栅格图中的所在的栅格位置;
步骤3:搜索感知地图建立与初始化,在栅格图的基础上建立目标存在概率地图、不确定性地图、信息素地图、已搜索栅格地图、吸引源地图并初始化:目标存在概率地图表示目标在实际网格图中存在的概率情况,pa(0)表示任务开始之前网格a中的目标存在概率,初始化pa(0)=0.5,即在任务开始之前,AUV认为网格a中“目标存在的可能性”和“目标不存在的可能性相等;所有网格中对应的不确定度初始化为1,即AUV对所有网格内的状态都是不了解的,搜索状态为未搜索,吸引源和信息素地图未激活;
步骤4:AUV通过自身搭载的声呐对周围环境进行探测,探测范围内若出现疑似目标点,则AUV到达疑似目标点所在栅格,通过传感器确认是否为待搜索目标,若是待搜索目标点,则已搜索目标数加1,否则,已搜索目标数不变;
步骤5:判断已搜索目标数是否达到预期搜索目标总数,若已达到,则任务结束,否则进入步骤6;
步骤6:对AUV周边各个栅格的搜索收益进行评估,选择搜索收益最大的栅格为AUV下一步位置,从而运动到搜索收益最大的栅格,进而更新AUV的当前状态,即AUV的当前所在栅格位置;搜索收益由搜索性能收益函数确定,搜索性能收益函数由不确定度收益、信息素收益、吸引源收益、转向代价和探索收益确定,搜索性能收益函数具体为:
假设AUV在k-1时刻处于网格pre中,则AUV在k时刻可以向网格cur的相邻网格移动,假设AUV在k时刻从网格pre前往了网格a,网格a是AUV目前所在网格cur的相邻网格,则目标性能收益函数的满足:
Figure BDA0002417477120000021
其中,IA(a,k)表示AUV在时刻k前往网格a处能获得的环境搜索收益,即不确定度收益,IB(a,k)表示AUV在时刻k前往网格a处能获得的信息素收益,IC(a,k)表示AUV能获得的探索性能收益,即不重复搜索的收益,ID(a,k)表示AUV的转向代价,IE(a,k)表示吸引源收益,cov(k)表示在k时刻整个环境的搜索覆盖率,即已搜索网格占全部网格的比例INC(a,k)公式中的各收益权重取值根据不同任务的需求可以有±20%的变化;
步骤7:搜索感知地图更新,包括目标存在概率地图、不确定性地图、信息素地图、已搜索栅格地图、吸引源地图,更新完转到步骤4;
其中,目标存在概率地图更新具体为:栅格c在k时刻的目标存在概率与栅格c在k-1时刻的目标存在概率以及AUV所搭载的传感器的检测概率和虚警概率有关,更新目标存在概率地图公式为:
Figure BDA0002417477120000031
其中,pc,k表示栅格c在k时刻的目标存在概率,pd表示传感器的检测概率,即网格c中存在目标的情况下,AUV检测到网格c中存在目标这一事件的概率,pf表示传感器的虚警概率,即网格c中不存在目标,但是AUV的传感器却检测到网格c中存在目标这一事件的概率;φc,k表示AUV声呐探测靶面;Zc,k表示k时刻AUV对网格c的探测结果;Zc,k=1表示k时刻AUV的声呐探测到网格c中存在目标;Zc,k=0表示k时刻AUV的声呐未探测到网格c中存在目标,ξc表示网格c实际上存在目标的情况,网格c实际上存在目标则ξc=1,否则ξc=0;
更新目标存在概率地图公式通过非线性更新公式Qc,k=ln(1/Pc,k-1)变换后转换为线性公式:
Qc,k=Qc,k-1+vc,k
其中:
Figure BDA0002417477120000032
根据上述公式进行目标存在概率地图的更新;
不确定地图更新具体为:不确定度地图描述了在k时刻AUV对网格c的不确定度,更新公式为:
Figure BDA0002417477120000041
其中,常数Kη>0;
已搜索栅格地图更新具体为:是在AUV的每一步的动作执行后,将AUV当前所在栅格以及声呐已探测区域对应的栅格标为已搜索栅格,网格a的搜索状态可用Sa表示,其状态如下所示:
Figure BDA0002417477120000042
信息素地图更新具体为:信息素的具体更新公式为:
s(c,k)=(1-Es){(1-Gs)[s(c,k-1)+k(c,k)×ds]+g(c,k)}
其中,Gs、Es分别为信息素扩散系数和信息素挥发系数,取值范围为[0,1],ds为网格自主释放的信息量,是一个常数;s(c,k-1)表示k-1时刻网格c中的信息素量;k(c,k)∈{0,1}表示k时刻网格c的信息素释放开关系数,此系数由信息素释放机制决定;g(c,k)表示(k-1,k]时间内从领近网格扩散进来的信息素总和,满足:
Figure BDA0002417477120000043
其中,N(c)表示网格c的邻近网格集合,c'∈N(c)表示网格c的邻近网格c′,|N(c')|表示网格c'的邻近网格的个数,s(c',k-1)表示k-1时刻网格c'中的信息素量,k(c',k)表示k时刻网格c′的信息素释放开关系数;
信息素释放开关系数设置规则具体为:
设置一个重访时间Tv,若任意网格a在k时刻被重访,则在k时刻到k+Tv时刻内,网格a不会被重访,并且不释放信息素,则k(a,k)=0;
在k时刻网格a的目标存在概率pa,k满足下式才能释放信息素,则k(a,k)=1:
Figure BDA0002417477120000051
吸引源地图更新:吸引源地图是在搜索区域的八个对角设置距离搜索区域边界一定长度的八个待激活吸引源,其影响范围为以待激活吸引源为球心,半径为r的球,r为整个搜索区域长度的八分之一到三十二分之一,计算出待激活吸引源的影响范围内的已搜索覆盖率,再选择激活覆盖率最小的待激活吸引源。
本发明还包括:
步骤6中所述不确定度收益IA(a,k)满足是在k-1时刻,以网格a为中心,传感器探测范围为半径的探测范围内的所有网格的不确定度的和,即:
Figure BDA0002417477120000052
其中,φ(a)是指以网格a为中心,传感器探测范围为半径的探测范围内的所有网格;μ(b,k-1)是指在k-1时刻网格b的不确定度;
步骤6中所述信息素收益IB(a,k)是在k-1时刻,以网格a为中心,传感器探测范围为半径的探测范围内的所有网格的重访素收益的和,即:
Figure BDA0002417477120000053
其中,s(b,k-1)是指在k-1时刻网格b的信息素;
步骤6中所述探索性能收益IC(a,k)为在k-1时刻,网格a传感器范围内的未被搜索的网格与网格a传感器内所有网格之比,满足:
Figure BDA0002417477120000054
其中,Sb(k-1)是已搜索地图中网格b在k-1时刻时的网格搜索状态,
Figure BDA0002417477120000055
为网格a的传感器范围内未被搜索的网格个数之和,N(b)为网格a的传感器范围内网格的总个数;
步骤6所述转向代价ID(a,k)是取决于AUV下一步动作执行时的航向与前一步的航向是否相同,若相同ID(a,k)=0,则若不同,则ID(a,k)=1;
步骤6所述吸引源收益IE(a,k)是根据AUV下个预测动作执行后,距离已激活吸引源的距离而定,与吸引源距离最短的栅格能够得到正向收益,IE(a,k)=1,其余栅格的吸引源收益为IE(a,k)=0。
本发明的有益效果:本发明应用于未知环境下AUV目标搜索过程,能够防止AUV重复搜索,提高了搜索效率,使AUV在较短时间内搜索到所有目标,并且能够提高目标在搜索区域边角的特殊情况下的目标搜索效率高,计算量小。
本发明将改进吸引源算法应用于AUV的目标搜索,在无先验信息的水下未知环境中,AUV通过声呐传感器实时探测周围环境信息,创建并更新目标存在概率地图、不确定度地图、信息素地图、吸引源地图等环境感知地图。改进了信息素的释放机制,使AUV在搜索区域覆盖率较大的情况下针对目标存在概率较低的区域进行回访,从而避免了由于声呐传感器的检测概率问题而遗漏目标的情况,防止AUV在已搜索区域进行重复搜索。在搜索区域各个对角设置了待激活吸引源,通过激活待激活吸引源使AUV更容易搜索到边角的目标。同时制定了各个环境感知地图的更新公式以及AUV搜索收益函数,使AUV做出最大收益的移动决策,在保证搜索的可靠性与稳定性的同时提高了搜索效率。
本发明提出的基于改进吸引源的目标搜索算法,通过设置吸引源优化了搜索收益组成,应用于AUV利用声纳传感器实现目标搜索作业中,使AUV在较短时间内搜索到所有目标,并能解决目标有可能作业区域边角的特殊情况,改进了信息素的释放机制,使AUV在搜索区域覆盖率较大的情况下针对目标存在概率较低的区域进行回访,从而避免由于声呐传感器的检测概率问题而遗漏目标的情况,保证了搜索的可靠性与稳定性,提高了搜索效率。
附图说明
图1是传感器探测示意图;
图2是传感器的探测效率图;
图3是探测半径离散化处理后的传感器探测效率图;
图4是吸引源算法的算法流程图;
图5是基于基础概率图的搜索路径和基于吸引源的搜索路径对比图
具体实施方式
下面结合附图,对本发明具体实施方式做进一步说明。
本发明在未知的水下环境中,AUV搭载探测声呐,基于改进吸引源的目标搜索算法完成最短时间搜索任务。
本发明是这样实现的:
1.声呐探测模型的建立
由于搜索区域范围较大,本发明提出的算法将目标与AUV均看做质点。在无先验信息的水下未知环境中,AUV通过声呐传感器实时获取水下目标信息和周围环境信息,并根据声呐获取的信息创建并实时更新环境感知地图。
2.环境感知地图的建立
本发明根据目标发现概率收益、不确定度收益、信息素收益、吸引源收益、转向代价等多个方面来建立搜索收益函数,并根据搜索收益函数制定搜索策略,从而令AUV做出最大搜索收益的鞠策
3.基于改进吸引源的目标搜索算法
本发明提出的基于改进吸引源的算法首先建立了AUV的声呐探测模型和环境感知地图模型,然后通过接近声呐探测范围内出现的疑似目标点是否为待搜索目标,再通过本算法制定的搜索收益函数选择最大收益的位置作为下一步位置决策。在AUV执行运动决策后,由于AUV的位置发生了变化,声呐探测到的环境信息也发生了变化,因此更新感知地图和AUV的当前状态。循环执行以上步骤,直至已搜索到的目标数达到预期搜索的目标总数。
本发明的目的按以下步骤实现:
1.声呐探测模型的建立
本发明设定AUV搭载的声呐能扫描周围的全360度扇形区域,其最大扫描范围是200m。在理论的情况下,假设AUV的坐标为(x0,y0,z0),目标的坐标为(x1,y1,z1)。满足坐标如下条件的目标可被AUV声呐探测到。
(x1-x0)2+(y1-y0)2+(z1-z0)2≤r2 (1)
其中,r为声呐最大探测半径。即理论情况下,在AUV视域范围内的目标全部能被检测到。具体判断情况如图1所示。
但由于外力干扰,传感器本身的误差等多种因素影响,实际情况中传感器无法做到百分之百的探测概率,因此,本发明考虑了传感器自身的搜索效率。
用函数f表示声呐的搜索效率:
Figure BDA0002417477120000071
其中,r为待搜索区域到传感器的距离,当r=0时,f最大,当r趋近于无穷大时,f最小并且趋近于零。k和α为两个可调参数,可以为多种传感器建模。本发明使用的声呐对应的两个参数为k=0.95,α=0.00015。此时,传感器的探测效率如图2所示。本发明将声呐的探测半径进行离散化处理,假设在某个区域内的声呐的传感探测效率是相同的,在k=0.95,α=0.00015时,离散化声呐的探测效率如图3所示。由于一百米距离外的该声呐探测效率较低,本发明将其检测效率视为零。
2.环境感知地图模型
本发明根据目标发现概率收益、不确定度收益、信息素收益、吸引源收益、转向代价等多个方面来建立搜索收益函数,并根据搜索收益函数制定搜索策略。因此,环境感知地图模型需要包括目标发现概率地图、不确定度地图、信息素地图和吸引源地图等模型。
目标存在概率地图是用来表示目标在真实环境地图网格中存在的概率情况。网格c的目标存在概率为pc(k)∈[0,1],它描述了在k时刻网格c处存在目标的可能性,pc(k)=1表示AUV认为网格c处存在目标,pc(k)=0表示AUV认为网格c处不存在目标。pc(0)反映了AUV对网格c处目标存在情况的先验信息,可以根据预先掌握的情报信息对pc(0)进行初始化,由于AUV在执行搜索任务之前,对任务区域内的信息一无所知,因此pc(0)=0.5,意味着网格c处“存在目标的可能性”与“不存在目标的可能性”相等。AUV的目标存在概率地图可以定义为MTPM(k)={pc(k)|c∈Ω}。
不确定度地图表示AUV对网格c是否存在目标的不确定性。网格c的不确定度根据目标存在概率计算得到。
信息素地图的目的是为了吸引AUV对搜索地图中目标存在概率较低的网格进行回访,防止由于声呐的探测错误而遗漏掉已搜索网格中的未被探测到的目标。
吸引源地图是用来表示搜索区域边角的吸引源的激活情况。
目标存在概率、不确定度、信息素的计算、更新公式以及信息素地图、吸引源地图的具体激活规则在下文的基于吸引源的目标搜索算法中提出。
3.基于吸引源的目标搜索方法
基于吸引源的目标搜索方法的流程图如图4所示,其主要步骤如下:
步骤1、将AUV和目标简化为质点,将搜索区域栅格化。假设AUV搭载的声呐可以高效探测以自身为圆心,半径为100m的圆内的目标点的情况,但声呐具有一定的检测概率。
步骤2、初始化参数和AUV的初始位置。参数包括AUV搭载声呐的传感器检测概率和虚警概率、吸引源的激活半径和影响半径等。初始化AUV在栅格图中的所在的栅格位置。
步骤3、搜索感知地图的初始化。在栅格图的基础上建立目标存在概率地图、不确定性地图、信息素地图、已搜索栅格地图、吸引源地图等搜索感知地图,并对其初始化。目标存在概率地图表示目标在实际网格图中存在的概率情况。每个网格在不同的时刻都有其目标存在概率。由于AUV在水下未知环境中进行搜索,因此在搜索开始之前,AUV对整个任务区域内的目标位置、障碍物位置等信息一无所知。pa(0)表示了任务开始之前网格a中的目标存在概率,因此,pa(0)=0.5,即在任务开始之前,AUV认为网格a中“目标存在的可能性”和“目标不存在的可能性”完全相等。同理,任务开始之前,所有网格中对应的不确定度为1,即AUV对所有网格内的状态都是完全不了解的,搜索状态为未搜索,吸引源和信息素地图未激活。
步骤4、AUV通过自身搭载的声呐对周围环境进行探测,探测范围内若出现疑似目标点,则AUV到达疑似目标点所在栅格,通过光学摄像机等传感器近距离确认是否为待搜索目标。若是待搜索目标点,则已搜索目标数加1。否则,已搜索目标数不变。
步骤5、判断已搜索目标数是否达到预期搜索目标总数,若已达到,则任务结束,否则进入步骤6。
步骤6、对AUV周边各个栅格的搜索收益进行评估,选择搜索收益最大的栅格为AUV下一步位置,从而运动到搜索收益最大的栅格。进而更新AUV的当前状态,即AUV的当前所在栅格位置。因此本发明设计一个搜索性能收益函数,搜索性能收益函数考虑不确定度收益、信息素收益、吸引源收益、转向代价和探索收益五个方面。通过赋予每个收益不同的权值来计算AUV在当前位置上每个可能的下一步所获得的总收益,从而做出最优的搜索路径选择。其中每个权值反应的是各个考虑因素在搜索任务中的重要性占比情况,可在合理范围内有所波动。假设AUV在k-1时刻处于网格pre中,则AUV在k时刻可以向网格cur的相邻网格移动。假设AUV在k时刻从网格pre前往了网格a(网格a是AUV目前所在网格cur的相邻网格),则目标搜索函数的具体公式为:
Figure BDA0002417477120000091
其中,IA(a,k)表示AUV在时刻k前往网格a处能获得的环境搜索收益,即不确定度收益,IB(a,k)表示AUV在时刻k前往网格a处能获得的信息素收益,IC(a,k)表示AUV能获得的探索收益,即不重复搜索的收益,ID(a,k)表示AUV的转向代价,IE(a,k)表示吸引源收益,cov(k)表示在k时刻整个环境的搜索覆盖率,即已搜索网格占全部网格的比例。
以上的权重设置时,考虑了在搜索前期,AUV的主要目的是降低整个环境的不确定度,因此,环境搜索收益占比较高,后期,AUV需要多探测边角区域和可能因深感探测效率而遗漏真实存在目标的栅格,并且尽量少探测已探索的确定栅格,因此信息素和吸引素开始在搜索收益函数中具有一定比例,并且不重复搜索收益得到提高。在本发明提出的权重的基础上,可以根据不同任务的不同需求存在±20%的变化。
由于搜索收益函数是根据k-1时刻的实时环境地图来预测AUV在k时刻的最大收益,因此,环境搜索收益IA(a,k)是在k-1时刻,以网格a为中心,传感器探测范围为半径的探测范围内的所有网格的不确定度的和,即
Figure BDA0002417477120000101
其中,φ(a)是指以网格a为中心,传感器探测范围为半径的探测范围内的所有网格。μ(b,k-1)是指在k-1时刻网格b的不确定度。
同理,信息素收益IB(a,k)是在k-1时刻,以网格a为中心,传感器探测范围为半径的探测范围内的所有网格的重访素收益的和,即
Figure BDA0002417477120000102
其中,s(b,k-1)是指在k-1时刻网格b的信息素。
探索收益IC(a,k)为在k-1时刻,网格a传感器范围内的未被搜索的网格与网格a传感器内所有网格之比,如下式所示:
Figure BDA0002417477120000103
其中,Sb(k-1)是已搜索地图中网格b在k-1时刻时的网格搜索状态,
Figure BDA0002417477120000104
为网格a的传感器范围内未被搜索的网格个数之和,N(b)为网格a的传感器范围内网格的总个数。
转向代价ID(a,k)是取决于AUV下一步动作执行时的航向与前一步的航向是否相同。若相同ID(a,k)=0,则若不同,则ID(a,k)=1。
吸引源收益IE(a,k)是根据AUV下个预测动作执行后,距离已激活吸引源的距离而定。与吸引源距离最短的栅格能够得到正向收益,IE(a,k)=1,其余栅格的吸引源收益为IE(a,k)=0。
步骤7、搜索感知地图更新,更新完转到步骤4。搜索感知地图更新的具体原理如下:由于栅格c在k时刻的目标存在概率实际上与栅格c在k-1时刻的目标存在概率以及AUV所搭载的传感器的检测概率和虚警概率有关,因此可以根据以下公式更新目标概率地图:
Figure BDA0002417477120000111
其中,pc,k表示栅格c在k时刻的目标存在概率,pd表示传感器的检测概率,即“网格c中存在目标的情况下,AUV检测到网格c中存在目标”这一事件的概率。pf表示传感器的虚警概率,即“网格c中不存在目标,但是AUV的传感器却检测到网格c中存在目标”这一事件的概率。Φc,k表示AUV声呐探测靶面。Zc,k表示k时刻AUV对网格c的探测结果。Zc,k=1表示k时刻AUV的声呐探测到网格c中存在目标。Zc,k=0表示k时刻AUV的声呐未探测到网格c中存在目标。ξc表示网格c实际上存在目标的情况。网格c实际上存在目标则ξc=1,否则ξc=0。
公式(7)通过非线性更新公式Qc,k=ln(1/Pc,k-1)变换后转换为线性公式:
Qc,k=Qc,k-1+vc,k (8)
其中,
Figure BDA0002417477120000112
根据公式(9)可以进行目标存在概率地图的更新。不确定度地图描述了在k时刻AUC对网格c的不确定度,其更新公式为:
Figure BDA0002417477120000113
其中,常数Kη>0。
已搜索栅格地图更新则是在AUV的每一步的动作执行后,将AUV当前所在栅格以及声呐已探测区域对应的栅格标为已搜索栅格。从而在制定环境搜索决策时,可以尽量避免重复搜索。网格a的搜索状态可用Sa表示,其状态如下所示:
Figure BDA0002417477120000121
信息素是为了提高AUV对目标存在概率低的网格进行回访,防止由于AUV搭载的声呐的探测概率低而出现遗漏目标的情况。信息素的具体更新公式为:
s(c,k)=(1-Es){(1-Gs)[s(c,k-1)+k(c,k)×ds]+g(c,k)} (12)
其中,Gs、Es分别为信息素扩散系数和信息素挥发系数,取值范围为[0,1]。ds为网格自主释放的信息量,是一个常数;s(c,k-1)表示k-1时刻网格c中的信息素量;k(c,k)∈{0,1}表示k时刻网格c的信息素释放开关系数,此系数由信息素释放机制决定。g(c,k)表示(k-1,k]时间内从领近网格扩散进来的信息素总和,其计算公式如下:
Figure BDA0002417477120000122
其中,N(c)表示网格c的邻近网格集合,c'∈N(c)表示网格c的邻近网格c'。|N(c')|表示网格c′的邻近网格的个数。s(c',k-1)表示k-1时刻网格c'中的信息素量。k(c',k)表示k时刻网格c′的信息素释放开关系数。
信息素释放开关系数是整个信息素设置的关键。由于原算法的信息素释放条件是针对无人机的工作环境而设置,不适合水下AUV的目标搜索任务。本发明针对AUV的实际情况,设置网格释放信息素需要满足如下条件:
1、设置一个重访时间Tv。若网格a在k时刻被重访,则在k时刻到k+Tv时刻内,网格a不会被重访,并且不释放信息素。
2、在k时刻网格a的目标存在概率pa,k只有满足下式才能释放信息素:
Figure BDA0002417477120000123
由于被AUV探查的次数小于等于两次,并且每次结果为不存在目标的网格有较大概率会由于传感的探测效率问题而导致目标被遗漏。因此AUV需要对符合该条件的网格进行重访,从而更快的解决目标可能存在但未被探测到的情况,提高了搜索的效率。
若网格c满足以上条件,则信息素释放开关系数k(c,k)=1,反之,k(c,k)=0。
吸引源地图是在搜索区域的八个对角设置距离搜索区域边界一定长度的八个待激活吸引源,其影响范围为以待激活吸引源为球心,半径为r的球。r为整个搜索区域长度的八分之一到三十二分之一。计算出待激活吸引源的影响范围内的已搜索覆盖率,再选择激活覆盖率最小的待激活吸引源。在AUV的每一步的动作执行后进行再次判断,重新选择激活吸引源。
步骤6和步骤7中的吸引源和已搜索栅格地图的建立、更新和相关收益以及信息素的释放条件的设置是不可或缺的。
在对比试验中,图5仿真对比实验的路径对比图中,左侧图为基于概率图搜索路径,右侧图为基于改进吸引源的搜索路径,对比图实际搜索区域大小为1000m×1000m,按50:1的比例将搜索区域与AUV的传感范围进行等比缩放。因此,设定AUV搜索区域的大小为20×20,每个AUV的传感器的探测范围为2×2。如图5所示,AUV使用概率图搜索算法在搜索边角目标(20,10)时,在(7,12)以及(13,5)坐标点附近都陷入了重复搜索,从而消耗了大量时间,最终,其搜索路径总长度为209单位长度。在使用本发明提出的改进吸引源搜索算法的搜索过程中,AUV所用搜索路径总长度仅为129单位长度,使用较少的时间便搜索到了所有目标,并且不易陷入局部重复搜索。
对比基于概率图搜索算法和本发明提出的搜索算法,经分析最终搜索路径可知,本发明提出的算法,在搜索后期使目标存在概率较低的栅格释放较多的信息素,从而引导AUV回访因传感器探测效率问题而可能遗漏了目标的区域,避免了AUV陷入局部重复搜索的情况,提高了整体的搜索效率,通过在边角设置待激活吸引源,增加了AUV对搜索覆盖率小的边角区域的搜索概率。

Claims (2)

1.一种AUV目标搜索方法,其特征在于,包括以下步骤:
步骤1:将AUV和目标简化为质点,将搜索区域栅格化,AUV搭载的声呐可以探测以自身为圆心,半径为R的圆内的目标点的情况,声呐具有已知的检测概率;
步骤2:初始化参数和AUV的初始位置,参数包括AUV搭载声呐的传感器检测概率和虚警概率、吸引源的激活半径和影响半径,初始化AUV在栅格图中的所在的栅格位置;
步骤3:搜索感知地图建立与初始化,在栅格图的基础上建立目标存在概率地图、不确定性地图、信息素地图、已搜索栅格地图、吸引源地图并初始化:目标存在概率地图表示目标在实际网格图中存在的概率情况,pa(0)表示任务开始之前网格a中的目标存在概率,初始化pa(0)=0.5,即在任务开始之前,AUV认为网格a中“目标存在的可能性”和“目标不存在的可能性”相等;所有网格中对应的不确定度初始化为1,即AUV对所有网格内的状态都是不了解的,搜索状态为未搜索,吸引源和信息素地图未激活;
步骤4:AUV通过自身搭载的声呐对周围环境进行探测,探测范围内若出现疑似目标点,则AUV到达疑似目标点所在栅格,通过传感器确认是否为待搜索目标,若是待搜索目标,则已搜索目标数加1,否则,已搜索目标数不变;
步骤5:判断已搜索目标数是否达到预期搜索目标总数,若已达到,则任务结束,否则进入步骤6;
步骤6:对AUV周边各个栅格的搜索收益进行评估,选择搜索收益最大的栅格为AUV下一步位置,从而运动到搜索收益最大的栅格,进而更新AUV的当前状态,即AUV的当前所在栅格位置;搜索收益由搜索性能收益函数确定,搜索性能收益函数由不确定度收益、信息素收益、吸引源收益、转向代价和探索收益确定,搜索性能收益函数具体为:
假设AUV在k-1时刻处于网格pre中,则AUV在k时刻可以向网格cur的相邻网格移动,假设AUV在k时刻从网格pre前往了网格a,网格a是AUV目前所在网格cur的相邻网格,则搜索性能收益函数满足:
Figure FDA0003636235690000021
其中,IA(a,k)表示AUV在时刻k前往网格a处能获得的环境搜索收益,即不确定度收益,IB(a,k)表示AUV在时刻k前往网格a处能获得的信息素收益,IC(a,k)表示AUV能获得的探索收益,即不重复搜索的收益,ID(a,k)表示AUV的转向代价,IE(a,k)表示吸引源收益,cov(k)表示在k时刻整个环境的搜索覆盖率,即已搜索网格占全部网格的比例,INC(a,k)公式中的各收益权重取值根据不同任务的需求可以有±20%的变化;
步骤7:搜索感知地图更新,包括目标存在概率地图、不确定性地图、信息素地图、已搜索栅格地图、吸引源地图,更新完转到步骤4;
其中,目标存在概率地图更新具体为:栅格c在k时刻的目标存在概率与栅格c在k-1时刻的目标存在概率以及AUV所搭载的传感器的检测概率和虚警概率有关,更新目标存在概率地图公式为:
Figure FDA0003636235690000022
其中,pc,k表示栅格c在k时刻的目标存在概率,pd表示传感器的检测概率,即网格c中存在目标的情况下,AUV检测到网格c中存在目标这一事件的概率,pf表示传感器的虚警概率,即网格c中不存在目标,但是AUV的传感器却检测到网格c中存在目标这一事件的概率;φc,k表示AUV声呐探测靶面;Zc,k表示k时刻AUV对网格c的探测结果;Zc,k=1表示k时刻AUV的声呐探测到网格c中存在目标;Zc,k=0表示k时刻AUV的声呐未探测到网格c中存在目标,ξc表示网格c实际上存在目标的情况,网格c实际上存在目标则ξc=1,否则ξc=0;
更新目标存在概率地图公式通过非线性更新公式Qc,k=ln(1/Pc,k-1)变换后转换为线性公式:
Qc,k=Qc,k-1+vc,k
其中:
Figure FDA0003636235690000031
根据上述公式进行目标存在概率地图的更新;
不确定地图更新具体为:不确定度地图描述了在k时刻AUV对网格c的不确定度,更新公式为:
Figure FDA0003636235690000032
其中,常数Kη>0;
已搜索栅格地图更新具体为:是在AUV的每一步的动作执行后,将AUV当前所在栅格以及声呐已探测区域对应的栅格标为已搜索栅格,网格a的搜索状态可用Sa表示,其状态如下所示:
Figure FDA0003636235690000033
信息素地图更新具体为:信息素的具体更新公式为:
s(c,k)=(1-Es){(1-Gs)[s(c,k-1)+k(c,k)×ds]+g(c,k)}
其中,Gs、Es分别为信息素扩散系数和信息素挥发系数,取值范围为[0,1],ds为网格自主释放的信息量,是一个常数;s(c,k-1)表示k-1时刻网格c中的信息素量;k(c,k)∈{0,1}表示k时刻网格c的信息素释放开关系数,此系数由信息素释放机制决定;g(c,k)表示(k-1,k]时间内从领近网格扩散进来的信息素总和,满足:
Figure FDA0003636235690000041
其中,N(c)表示网格c的邻近网格集合,c'∈N(c)表示网格c的邻近网格c′,|N(c')|表示网格c'的邻近网格的个数,s(c',k-1)表示k-1时刻网格c'中的信息素量,k(c',k)表示k时刻网格c′的信息素释放开关系数;
信息素释放开关系数设置规则具体为:
设置一个重访时间Tv,若任意网格a在k时刻被重访,则在k时刻到k+Tv时刻内,网格a不会被重访,并且不释放信息素,则k(a,k)=0;
在k时刻网格a的目标存在概率pa,k满足下式才能释放信息素,则k(a,k)=1:
Figure FDA0003636235690000042
吸引源地图更新:吸引源地图是在搜索区域的八个对角设置距离搜索区域边界一定长度的八个待激活吸引源,其影响范围为以待激活吸引源为球心,半径为r的球,r为整个搜索区域长度的八分之一到三十二分之一,计算出待激活吸引源的影响范围内的已搜索覆盖率,再选择激活覆盖率最小的待激活吸引源。
2.根据权利要求1所述的一种AUV目标搜索方法,其特征在于:步骤6中所述不确定度收益IA(a,k)满足是在k-1时刻,以网格a为中心,传感器探测范围为半径的探测范围内的所有网格的不确定度的和,即:
Figure FDA0003636235690000043
其中,φ(a)是指以网格a为中心,传感器探测范围为半径的探测范围内的所有网格;μ(b,k-1)是指在k-1时刻网格b的不确定度;
步骤6中所述信息素收益IB(a,k)是在k-1时刻,以网格a为中心,传感器探测范围为半径的探测范围内的所有网格的信息素的和,即:
Figure FDA0003636235690000044
其中,s(b,k-1)是指在k-1时刻网格b的信息素;
步骤6中所述探索收益IC(a,k)为在k-1时刻,网格a传感器范围内的未被搜索的网格与网格a传感器内所有网格之比,满足:
Figure FDA0003636235690000051
其中,Sb(k-1)是已搜索地图中网格b在k-1时刻时的网格搜索状态,
Figure FDA0003636235690000052
为网格a的传感器范围内未被搜索的网格个数之和,N(b)为网格a的传感器范围内网格的总个数;
步骤6所述转向代价ID(a,k)是取决于AUV下一步动作执行时的航向与前一步的航向是否相同,若相同ID(a,k)=0,则若不同,则ID(a,k)=1;
步骤6所述吸引源收益IE(a,k)是根据AUV下个预测动作执行后,距离已激活吸引源的距离而定,与吸引源距离最短的栅格能够得到正向收益,IE(a,k)=1,其余栅格的吸引源收益为IE(a,k)=0。
CN202010195576.3A 2020-03-19 2020-03-19 一种auv目标搜索方法 Active CN111337930B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010195576.3A CN111337930B (zh) 2020-03-19 2020-03-19 一种auv目标搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010195576.3A CN111337930B (zh) 2020-03-19 2020-03-19 一种auv目标搜索方法

Publications (2)

Publication Number Publication Date
CN111337930A CN111337930A (zh) 2020-06-26
CN111337930B true CN111337930B (zh) 2022-07-15

Family

ID=71182546

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010195576.3A Active CN111337930B (zh) 2020-03-19 2020-03-19 一种auv目标搜索方法

Country Status (1)

Country Link
CN (1) CN111337930B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112197762B (zh) * 2020-09-25 2023-05-23 中国直升机设计研究所 一种基于点钟方向的野外机动目标位置估计方法
CN112347135B (zh) * 2020-11-20 2022-12-02 中国人民解放军海军潜艇学院 一种直升机应召搜索方案的确定方法、存储介质及系统
CN112859807B (zh) * 2021-01-10 2022-03-22 西北工业大学 基于态势模拟和蒙特卡罗的水下航行器协同搜索效能评估方法
CN112925350B (zh) * 2021-01-15 2023-04-07 中国人民解放军战略支援部队航天工程大学 一种多无人机分布式协同目标搜索方法
CN114779801B (zh) * 2021-01-22 2024-05-31 中国科学院沈阳自动化研究所 一种面向目标探测的自主遥控水下机器人路径规划方法
CN112836777B (zh) * 2021-03-02 2022-09-27 同济大学 共识主动性机制在群体机器人目标搜索中的应用方法
CN113052940B (zh) * 2021-03-14 2024-03-15 西北工业大学 一种基于声呐的时空关联地图实时构建方法
CN113238232B (zh) * 2021-05-06 2022-03-25 中国海洋大学 面向海洋静态目标的自主水下航行器系统目标搜索方法
CN113592162B (zh) * 2021-07-22 2023-06-02 西北工业大学 一种基于多智能体强化学习的多水下无人航行器协同搜索方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105352496A (zh) * 2015-11-17 2016-02-24 中国海洋大学 基于声呐辅助自主导航的auv导航方法
CN106123850A (zh) * 2016-06-28 2016-11-16 哈尔滨工程大学 Auv配载多波束声呐水下地形测绘修正方法
CN109471446A (zh) * 2018-11-08 2019-03-15 淮阴师范学院 一种基于神经网络的全覆盖路径规划方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11435199B2 (en) * 2018-06-22 2022-09-06 Massachusetts Institute Of Technology Route determination in dynamic and uncertain environments

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105352496A (zh) * 2015-11-17 2016-02-24 中国海洋大学 基于声呐辅助自主导航的auv导航方法
CN106123850A (zh) * 2016-06-28 2016-11-16 哈尔滨工程大学 Auv配载多波束声呐水下地形测绘修正方法
CN109471446A (zh) * 2018-11-08 2019-03-15 淮阴师范学院 一种基于神经网络的全覆盖路径规划方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
An Improved Multi-AUV Patrol Path Planning Method;Zheping Yan;《international conference on mechatronics and automation》;20170809;第1930-1936页 *

Also Published As

Publication number Publication date
CN111337930A (zh) 2020-06-26

Similar Documents

Publication Publication Date Title
CN111337930B (zh) 一种auv目标搜索方法
CN106371445B (zh) 一种基于拓扑地图的无人车规划控制方法
Buniyamin et al. A simple local path planning algorithm for autonomous mobile robots
Thompson et al. A probabilistic model of human motion and navigation intent for mobile robot path planning
Cao et al. Target search control of AUV in underwater environment with deep reinforcement learning
CN104573812B (zh) 一种基于粒子萤火虫群优化算法的无人机航路路径确定方法
CN113467456B (zh) 一种未知环境下用于特定目标搜索的路径规划方法
CN108388250B (zh) 一种基于自适应布谷鸟搜索算法的水面无人艇路径规划方法
CN109839110A (zh) 一种基于快速随机搜索树的多目标点路径规划方法
CN106444835A (zh) 基于Lazy Theta星和粒子群混合算法的水下潜器三维路径规划方法
CN110109477A (zh) 基于鸽群智能反向学习的无人机集群多目标控制优化方法
CN108871364A (zh) 一种基于结点算法的水下机器人路径规划方法
CN112911705A (zh) 基于贝叶斯迭代改进的粒子群优化算法的室内定位方法
CN112000126B (zh) 一种基于鲸鱼算法的多无人机协同搜索多动态目标方法
Galceran et al. Uncertainty-driven survey path planning for bathymetric mapping
CN111596675A (zh) 面向非广域目标搜索任务的水下机器人优化决策方法
JP6788540B2 (ja) 巡回経路設定装置、巡回経路設定方法及び巡回経路設定プログラム
CN115129064A (zh) 基于改进萤火虫算法与动态窗口法融合的路径规划方法
Jeffril et al. The integration of fuzzy logic and artificial neural network methods for mobile robot obstacle avoidance in a static environment
Jiu et al. Odor plume source localization with a Pioneer 3 Mobile Robot in an indoor airflow environment
Wang et al. Research on autonomous planning method based on improved quantum Particle Swarm Optimization for Autonomous Underwater Vehicle
Airlangga et al. Online path planning framework for UAV in rural areas
CN109977455B (zh) 一种适用于带地形障碍三维空间的蚁群优化路径构建方法
CN114840016B (zh) 基于规则启发式的多蚁群搜索潜艇目标协同路径优化方法
CN108717302B (zh) 机器人跟随人物方法、装置及存储介质、机器人

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant