CN108459614B - 一种基于cw-rnn网络的uuv实时避碰规划方法 - Google Patents

一种基于cw-rnn网络的uuv实时避碰规划方法 Download PDF

Info

Publication number
CN108459614B
CN108459614B CN201810044019.4A CN201810044019A CN108459614B CN 108459614 B CN108459614 B CN 108459614B CN 201810044019 A CN201810044019 A CN 201810044019A CN 108459614 B CN108459614 B CN 108459614B
Authority
CN
China
Prior art keywords
uuv
real
network
rnn network
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810044019.4A
Other languages
English (en)
Other versions
CN108459614A (zh
Inventor
王宏健
林常见
袁建亚
练青坡
王成龙
付明玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN201810044019.4A priority Critical patent/CN108459614B/zh
Publication of CN108459614A publication Critical patent/CN108459614A/zh
Application granted granted Critical
Publication of CN108459614B publication Critical patent/CN108459614B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Automation & Control Theory (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本发明提供了一种基于CW‑RNN网络的UUV实时避碰规划方法,属于水下航行器导航领域。本发明提供的方法如下:步骤1:构建全局坐标系和局部坐标系,建立声纳仿真模型;步骤2:设计用于实时避碰规划的CW‑RNN网络;步骤3:构建数据集用于神经网络的训练阶段和测试阶段;步骤4:利用训练集中数据训练CW‑RNN网络,得到实时避碰规划器;步骤5:将声纳探测信息及目标点信息输入至基于CW‑RNN网络的避碰规划器,获得UUV下一时刻的转艏及速度的调整指令。本发明提供的方法得到的规划器不仅有强大的学习能力,同时还具有非常强的泛化能力,适用于各种复杂的环境;同时可满足实时性的要求,并且所规划的路径满足UUV运动特性的要求。

Description

一种基于CW-RNN网络的UUV实时避碰规划方法
技术领域
本发明涉及一种基于时钟装置循环神经网络(Clock Work Recurrent NeuralNetwork,CW-RNN)的无人水下航行器(UUV)的实时避碰规划方法,属于水下航行器导航领域。
背景技术
随着人类对海洋资源的不断开发与探索,水下机器人在各个领域都得到了越来越广泛的应用。作为新一代水下机器人具有隐蔽性强、机动性好、活动范围大、安全、智能等优点,是完成各种水下任务的重要工具。为完成各种任务,UUV必须具有在未知环境下工作的能力。这就需要UUV具备实时避碰规划的能力来保证UUV的安全航行。
实时避碰规划要求UUV在航行过程中根据传感器探测到的已知的环境信息找到一条从起点到终点的无碰撞安全路径。目前可用于避碰规划的方法主要有蚁群算法、遗传算法、人工免疫算法、人工势场法、粒子群优化算法、A*算法、Dijkstra算法等。对于实时避碰规划问题,除了考虑安全性和避碰运动平滑性等,系统的实时性也是重要的指标,然而基于上述传统算法的实时避碰规划系统,存在环境模型的精度以及路径的优化程度与规划的实时性相互矛盾的问题。深度学习是目前最具潜力的人工智能算法,其强大的非线性拟合能力可以为UUV提供一套简单、高效、易于实现的实时避碰规划系统。这使得UUV具有了一定的自主学习的能力,从而减少了其对感知设备的依赖,增强了其在避碰过程中的灵活度。实时避碰规划系统的规划能力随着UUV在运动的过程中的不断学习而逐步提高。即使训练集中只包含简单环境下的避碰规划样本,训练完成后的基于CW-RNN网络的UUV实时避碰规划器也可以灵活处理复杂多变环境下的避碰规划问题。
中国专利CN107368076A公开了一种智能环境下机器人运动路径深度学习控制规划方法,该方法使用深度学习DBN网络解决运载机器人全局路径规划问题。所提深度学习DBN网络包括一层输入层、三层隐藏层以及一层输出层,其中可视层与第一隐藏层构成第一层限制玻尔兹曼机RBM,第一隐藏层与第二隐藏层构成第二层限制玻尔兹曼机RBM,第二隐藏层与第三隐藏层构成BP网络层。该专利采用逐层训练的方法依次对两层限制玻尔兹曼机RBM和BP网络层进行训练。与全局路径规划不同,避碰规划器需要根据过去一段时间内的环境障碍信息实时输出规划结果。相较于限制玻尔兹曼机RBM,CW-RNN具有处理较长时间序列的能力,且更适用于复杂的规划问题。
发明内容
本发明将提供了一种基于CW-RNN网络的UUV实时避碰规划方法,目的在于利用CW-RNN强大的拟合长时间序列的能力,解决UUV实时避碰规划的问题,克服现有的实时避碰规划方法存在环境模型的精度与规划的实时性之间的矛盾,实现一个简单、高效、易于实现的端到端的实时避碰规划方法。
本发明的目的通过以下方式实现:
步骤1:构建全局坐标系和局部坐标系,建立声纳仿真模型;
步骤2:设计用于实时避碰规划的CW-RNN网络;
步骤3:构建数据集,包括训练集和测试集,分别用于神经网络的训练阶段和测试阶段;
步骤4:利用训练集中数据训练CW-RNN网络,得到基于CW-RNN网络的实时避碰规划器;
步骤5:将声纳探测信息及目标点信息输入至基于CW-RNN网络的避碰规划器,获得UUV下一时刻的转艏及速度的调整指令。
与现有技术相比,本发明提供的一种基于CW-RNN网络的UUV实时避碰规划方法优势在于:
1.本发明提供的方法用于UUV实时避碰规划的CW-RNN网络,具有强大的学习能力;2.本发明提供的方法具有非常强的泛化能力,这使得所实现的实时避碰规划器适用于各种复杂的环境;3.本发明提供的方法满足实时性的要求,并且所规划的路径满足UUV运动特性的要求。
附图说明
图1是本发明的仿真声纳示意图;
图2是本发明的CW-RNN网络结构图;
图3是本发明的角度示意图;
图4是本发明的仿真效果图。
具体实施方式
下面结合说明书附图对本发明提供的一种基于CW-RNN网络的UUV实时避碰规划方法进行说明:
一种基于CW-RNN网络的UUV实时避碰规划方法,包括以下步骤:
步骤1:构建全局坐标系和局部坐标系,建立声纳仿真模型:全局坐标系采用北东坐标系,地图左下角为原点,正北方向为X轴,正东方向为Y轴;局部坐标系原点选在UUV重心处,X’轴取在UUV纵向剖面内,指向UUV艏端,Y’轴与纵剖面垂直,指向右舷;二维多波束声纳仿真模型水平开角为120°,最大探测半径为120m,共80个波束,波束角为1.5°,每个波束上探测噪声为±1%;
步骤2:设计用于实时避碰规划的CW-RNN网络:所设计的CW-RNN网络为端对端模型,可以直接根据传感器探测信息得出规划结果,该网络模型包含四层,分别为输入层、隐藏层、中间层以及输出层;输入层由81个单元组成,其中前80个单元分别对应仿真声纳的80个波束中包含的距离信息,第81个单元对应UUV当前位置与目标点之间的夹角;隐藏层由CW-RNN组成,序列长度为10,上一时刻的隐藏层的输出为下一时刻隐藏层的输入;中间层由23个单元组成;输出层由2个单元组成,分别对应所规划的下一时刻UUV的转艏和速度;输入层与隐藏层、隐藏层与中间层、中间层与输出层间的连接方式为全连接;
步骤3:构建数据集;数据集包括训练集和测试集,分别用于神经网络的训练阶段和测试阶段;
构建训练集时,在全局坐标系中生成若干组随机地图及实时路径,并在每个路径节点采集声纳信息,所采集的信息为训练样本,将实时路径中UUV艏向调整的角度(转艏)及速度作为训练标签;
构建测试集时,在全局坐标系中生成若干组随机地图及实时路径,并在每个路径节点采集声纳信息,所采集的信息为测试样本,将实时路径中UUV转艏及速度作为测试标签;
步骤4:利用训练集中数据训练CW-RNN网络,得到基于CW-RNN网络的实时避碰规划器:将训练数据中的声纳信息作为输入数据,将训练集中相对应的标签作为输出数据,对CW-RNN网络进行训练,从而获得基于CW-RNN网络的实时避碰规划器;损失函数为均方差函数,在训练过程中,采用小批量梯度下降误差反向传播算法优化CW-RNN网络的权值;
步骤5:将声纳探测信息及目标点信息输入至基于CW-RNN网络的避碰规划器,获得UUV下一时刻的转艏及速度的调整指令。
CW-RNN结构的优势:
CW-RNN是为了解决循环神经网络(RNN)无法建立长时间依赖的问题提出的,相对于其他改进的网络,其结构更简单,参数更少,训练速度更快。
在t时刻,RNN的输出可以通过下式计算:
st=σ(Wxsxt+Wssst-1+bs)
ot=tanh(Wsost+bo)
其中,Wxs为输入层与隐藏层间的权重矩阵,Wss为隐藏层与隐藏层间的权重矩阵,Wso为隐藏层与输出层间的权重矩阵,xt、st和ot分别为t时刻网络的输入向量、隐藏层状态向量和输出向量,bs和bo分别为隐藏层和输出层的偏置项。
CW-RNN与RNN的区别为:
CW-RNN将隐藏层分为若干模块,并给每个模块分配一个时钟周期;同一模块隐藏层之间为全链接,不同模块之间的连接为从高时钟频率的模块指向低时钟频率的模块。
CW-RNN的具体实现:
本发明将隐藏层分为4个模块,每个模块包含45个单元,第i个模块对应的时钟周期Ti=2i-1
相对应的,Wxs和Wss也被分为4组,即
Figure BDA0001550311980000041
其中,Wss为上三角矩阵,即Wssi={0,…,0,Wssi,i,…,Wssi,4};
只有满足tMODTi=0时,模块i才被激活,被激活的模块参与运算,并更新自身状态,未被激活的模块不参与运算,并保持原状态,即
Figure BDA0001550311980000042
数据集中数据具体为:
仿真声纳探测到的距离信息为
Figure BDA0001550311980000043
其中
Figure BDA0001550311980000044
为当前时刻第i个波束探测到的距离信息,当第i个波束未探测到障碍时,
Figure BDA0001550311980000045
为了简化输入信息,将t时刻声纳探测到的距离信息做如下处理:
Figure BDA0001550311980000046
将t时刻UUV所在位置与目标点形成的角度表示为
Figure BDA0001550311980000047
则t时刻CW-RNN网络的输入向量
Figure BDA0001550311980000048
t时刻CW-RNN网络的标签lt=[Δθt,vt],其中Δθt和vt分别表示期望的UUV转艏和速度的调整指令。
在训练开始前对数据集中数据做如下预处理:
将数据集中数据分为n个批量;数据集的归一化方法为减去列最小值后除以列最大值和列最小值的差。
在训练过程中输入数据和标签对应关系为:
若时刻t<10,则[x1,…,xt]对应标签lt,若t≥10,则[xt-9,…,xt]对应标签lt
CW-RNN网络的训练过程可表述为:
1)初始化CW-RNN网络各层权重,令i=0;
2)令k=0;
3)取第k个批量的数据作为本次训练集,并令t=0;
4)将本次训练集中的输入数据[xt-9,…,xt]输入到网络,经过CW-RNN网络的前向传播过程得到对应输出yt
5)计算网络输出yt与对应标签lt的误差;
6)判断是否完成该批量计算,若是,执行7),否则t=t+1,并返回4);
7)利用小批量梯度下降误差反向传播算法更新CW-RNN网络权重;
8)判断是否所有批量数据均完成训练,若是,执行9),否则k=k+1,并返回3);
9)i=i+1,并判断iMOD500是否为零,若是,执行10),否则返回2);
10)在测试集中随机选取50个序列,使用当前网络进行测试,计算均方误差;
11)若测试集中均方误差连续10次没有减小,则停止训练,否则返回2)。
基于CW-RNN网络的UUV实时避碰规划其工作过程为:
1)将UUV布放在起始位置;
2)仿真声纳开始获取UUV当前位置的环境信息xt
3)将仿真声纳获取的环境信息[xt-9,…,xt]输入到CW-RNN网络,获得下一时刻UUV转艏及速度调整指令;
4)UUV执行运动指令,到达下一路径点;
5)判断UUV是否到达目标点,若是,避碰规划器停止工作,否则返回2)。

Claims (3)

1.一种基于CW-RNN网络的UUV实时避碰规划方法,其特征在于:所述方法步骤如下,步骤(1):构建全局坐标系和局部坐标系,建立声纳仿真模型;步骤(2):设计用于实时避碰规划的CW-RNN网络;步骤(3):构建数据集,包括训练集和测试集,分别用于神经网络的训练阶段和测试阶段;步骤(4):利用训练集中数据训练CW-RNN网络,得到基于CW-RNN网络的实时避碰规划器;步骤(5):将声纳探测信息及目标点信息输入至基于CW-RNN网络的避碰规划器,获得UUV下一时刻的转艏及速度的调整指令;
步骤(1)中所述的全局坐标系采用北东坐标系,地图左下角为原点,正北方向为X轴,正东方向为Y轴;局部坐标系原点选在UUV重心处,X’轴取在UUV纵向剖面内,指向UUV艏端,Y’轴与纵剖面垂直,指向右舷;二维多波束声纳仿真模型水平开角为120°,最大探测半径为120m,共80个波束,波束角为1.5°,每个波束上探测噪声为±1%;
步骤(2)中所述的CW-RNN网络为端对端模型,可以直接根据传感器探测信息得出规划结果,该网络模型包含四层,分别为输入层、隐藏层、中间层以及输出层;输入层由81个单元组成,其中前80个单元分别对应仿真声纳的80个波束中包含的距离信息,第81个单元对应UUV当前位置与目标点之间的夹角;隐藏层由CW-RNN组成,序列长度为10,上一时刻的隐藏层的输出为下一时刻隐藏层的输入;中间层由23个单元组成;输出层由2个单元组成,分别对应所规划的下一时刻UUV的转艏和速度;输入层与隐藏层、隐藏层与中间层、中间层与输出层间的连接方式为全连接;
步骤(3)中构建训练集时,在全局坐标系中生成若干组随机地图及实时路径,并在每个路径节点采集声纳信息,所采集的信息为训练样本,将实时路径中UUV艏向调整的角度及速度作为训练标签;构建测试集时,在全局坐标系中生成若干组随机地图及实时路径,并在每个路径节点采集声纳信息,所采集的信息为测试样本,将实时路径中UUV转艏及速度作为测试标签;
步骤(4)中所述的获得实时避碰规划器的过程如下,将训练数据中的声纳信息作为输入数据,将训练集中相对应的标签作为输出数据,对CW-RNN网络进行训练,从而获得基于CW-RNN网络的实时避碰规划器;损失函数为均方差函数,在训练过程中,采用小批量梯度下降误差反向传播算法优化CW-RNN网络的权值;
所述的CW-RNN网络实现方式如下,将隐藏层分为4个模块,每个模块包含45个单元,第i个模块对应的时钟周期Ti=2i-1
相对应的,Wxs和Wss也被分为4组,即
Figure FDA0002698639710000011
Wxs为输入层与隐藏层间的权重矩阵,Wss为隐藏层与隐藏层间的权重矩阵,
其中,Wss为上三角矩阵,即Wssi={0,…,0,Wssi,i,…,Wssi,4};
只有满足tMODTi=0时,模块i才被激活,被激活的模块参与运算,并更新自身状态,未被激活的模块不参与运算,并保持原状态,即
Figure FDA0002698639710000021
步骤(3)所述的数据集中数据具体如下,仿真声纳探测到的距离信息为
Figure FDA0002698639710000022
其中
Figure FDA0002698639710000023
为当前时刻第i个波束探测到的距离信息,当第i个波束未探测到障碍时,
Figure FDA0002698639710000024
为了简化输入信息,将t时刻声纳探测到的距离信息做如下处理:
Figure FDA0002698639710000025
将t时刻UUV所在位置与目标点形成的角度表示为
Figure FDA0002698639710000026
则t时刻CW-RNN网络的输入向量
Figure FDA0002698639710000027
t时刻CW-RNN网络的标签lt=[Δθt,vt],其中Δθt和vt分别表示期望的UUV转艏和速度的调整指令,在训练开始前对数据集中数据做如下预处理:将数据集中数据分为n个批量;数据集的归一化方法为减去列最小值后除以列最大值和列最小值的差,在训练过程中输入数据和标签对应关系为:若时刻t<10,则[x1,…,xt]对应标签lt,若t≥10,则[xt-9,…,xt]对应标签lt
2.根据权利要求1所述的一种基于CW-RNN网络的UUV实时避碰规划方法,其特征在于:步骤(4)中所述的CW-RNN网络的训练过程如下,
(1)初始化CW-RNN网络各层权重,令i=0;
(2)令k=0;
(3)取第k个批量的数据作为本次训练集,并令t=0;
(4)将本次训练集中的输入数据[xt-9,…,xt]输入到网络,经过CW-RNN网络的前向传播过程得到对应输出yt
(5)计算网络输出yt与对应标签lt的误差;
(6)判断是否完成该批量计算,若是,执行(7),否则t=t+1,并返回(4);
(7)利用小批量梯度下降误差反向传播算法更新CW-RNN网络权重;
(8)判断是否所有批量数据均完成训练,若是,执行(9),否则k=k+1,并返回(3);
(9)i=i+1,并判断iMOD500是否为零,若是,执行(10),否则返回(2);
(10)在测试集中随机选取50个序列,使用当前网络进行测试,计算均方误差;
(11)若测试集中均方误差连续10次没有减小,则停止训练,否则返回(2)。
3.根据权利要求1所述的一种基于CW-RNN网络的UUV实时避碰规划方法,其特征在于:步骤(5)所述的基于CW-RNN网络的UUV实时避碰规划其工作过程如下,
(1)将UUV布放在起始位置;
(2)仿真声纳开始获取UUV当前位置的输入向量xt
(3)将仿真声纳获取的输入数据[xt-9,…,xt]输入到CW-RNN网络,获得下一时刻UUV转艏及速度调整指令;
(4)UUV执行运动指令,到达下一路径点;
(5)判断UUV是否到达目标点,若是,避碰规划器停止工作,否则返回(2)。
CN201810044019.4A 2018-01-17 2018-01-17 一种基于cw-rnn网络的uuv实时避碰规划方法 Active CN108459614B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810044019.4A CN108459614B (zh) 2018-01-17 2018-01-17 一种基于cw-rnn网络的uuv实时避碰规划方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810044019.4A CN108459614B (zh) 2018-01-17 2018-01-17 一种基于cw-rnn网络的uuv实时避碰规划方法

Publications (2)

Publication Number Publication Date
CN108459614A CN108459614A (zh) 2018-08-28
CN108459614B true CN108459614B (zh) 2020-12-04

Family

ID=63220182

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810044019.4A Active CN108459614B (zh) 2018-01-17 2018-01-17 一种基于cw-rnn网络的uuv实时避碰规划方法

Country Status (1)

Country Link
CN (1) CN108459614B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109765929B (zh) * 2019-01-14 2022-04-05 哈尔滨工程大学 一种基于改进rnn的uuv实时避障规划方法
CN115242428B (zh) * 2022-06-08 2024-05-31 大连大学 一种基于优化cw-rnn的网络安全态势预测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102323584A (zh) * 2011-05-19 2012-01-18 哈尔滨工程大学 一种适用于水下auv/uuv平台的自主避碰装置
CN102999050A (zh) * 2012-12-13 2013-03-27 哈尔滨工程大学 一种智能水下机器人的自主避障方法
CN105137967A (zh) * 2015-07-16 2015-12-09 北京工业大学 一种深度自动编码器与q学习算法相结合的移动机器人路径规划方法
CN105716618A (zh) * 2016-02-05 2016-06-29 哈尔滨工程大学 一种用于uuv航路规划的几何环境模型膨化处理方法
CN106970615A (zh) * 2017-03-21 2017-07-21 西北工业大学 一种深度强化学习的实时在线路径规划方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002024795A (ja) * 2000-07-04 2002-01-25 Sony Corp 情報処理装置および方法、並びに記録媒体

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102323584A (zh) * 2011-05-19 2012-01-18 哈尔滨工程大学 一种适用于水下auv/uuv平台的自主避碰装置
CN102999050A (zh) * 2012-12-13 2013-03-27 哈尔滨工程大学 一种智能水下机器人的自主避障方法
CN105137967A (zh) * 2015-07-16 2015-12-09 北京工业大学 一种深度自动编码器与q学习算法相结合的移动机器人路径规划方法
CN105716618A (zh) * 2016-02-05 2016-06-29 哈尔滨工程大学 一种用于uuv航路规划的几何环境模型膨化处理方法
CN106970615A (zh) * 2017-03-21 2017-07-21 西北工业大学 一种深度强化学习的实时在线路径规划方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
UUV Dynamic Path Planning and Trap Escape Strategies in Unkonwn Environment;zhang xuelian等;《Proceedings of the 35th Chinese Control Conference》;20160731;第6988-6992页 *
基于前视声呐信息的AUV避碰规划研究;刘和祥等;《系统仿真学报》;20171231;第19卷(第24期);第5672-5674、5679页 *

Also Published As

Publication number Publication date
CN108459614A (zh) 2018-08-28

Similar Documents

Publication Publication Date Title
CN108319293B (zh) 一种基于lstm网络的uuv实时避碰规划方法
CN108334677B (zh) 一种基于gru网络的uuv实时避碰规划方法
Sun et al. Mapless motion planning system for an autonomous underwater vehicle using policy gradient-based deep reinforcement learning
CN110333739B (zh) 一种基于强化学习的auv行为规划及动作控制方法
Chen et al. Path planning and obstacle avoiding of the USV based on improved ACO-APF hybrid algorithm with adaptive early-warning
CN108803321B (zh) 基于深度强化学习的自主水下航行器轨迹跟踪控制方法
Cao et al. Target search control of AUV in underwater environment with deep reinforcement learning
CN109582027B (zh) 一种基于改进粒子群优化算法的usv集群避碰规划方法
CN108279692B (zh) 一种基于lstm-rnn的uuv动态规划方法
CN111650948B (zh) 一种可底栖式auv的水平面轨迹快速跟踪控制方法
CN109765929B (zh) 一种基于改进rnn的uuv实时避障规划方法
CN112241176A (zh) 一种水下自主航行器在大尺度连续性障碍物环境中路径规划避障控制方法
CN110362089A (zh) 一种基于深度强化学习和遗传算法的无人船自主导航的方法
CN108320051B (zh) 一种基于gru网络模型的移动机器人动态避碰规划方法
CN113848974B (zh) 一种基于深度强化学习的飞行器轨迹规划方法及系统
CN112462792B (zh) 一种基于Actor-Critic算法的水下机器人运动控制方法
CN112925319B (zh) 一种基于深度强化学习的水下自主航行器动态避障方法
CN113268074B (zh) 一种基于联合优化的无人机航迹规划方法
CN111240345A (zh) 一种基于双bp网络增强学习框架的水下机器人轨迹跟踪方法
CN112947505B (zh) 一种基于强化学习算法与未知干扰观测器的多auv编队分布式控制方法
Zhang et al. A bionic dynamic path planning algorithm of the micro UAV based on the fusion of deep neural network optimization/filtering and hawk-eye vision
CN115033022A (zh) 面向移动平台基于专家经验的ddpg无人机降落方法
He et al. Robust orientation-sensitive trajectory tracking of underactuated autonomous underwater vehicles
Ma et al. Multi-AUV collaborative operation based on time-varying navigation map and dynamic grid model
CN112857370A (zh) 一种基于时序信息建模的机器人无地图导航方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant