CN115906928B - 一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法 - Google Patents

一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法 Download PDF

Info

Publication number
CN115906928B
CN115906928B CN202211490758.9A CN202211490758A CN115906928B CN 115906928 B CN115906928 B CN 115906928B CN 202211490758 A CN202211490758 A CN 202211490758A CN 115906928 B CN115906928 B CN 115906928B
Authority
CN
China
Prior art keywords
uuv
layer
collision avoidance
attention
encoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211490758.9A
Other languages
English (en)
Other versions
CN115906928A (zh
Inventor
林常见
王雪松
程玉虎
王国庆
马磊
周淑燕
谢璐
周萌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Mining and Technology CUMT
Original Assignee
China University of Mining and Technology CUMT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Mining and Technology CUMT filed Critical China University of Mining and Technology CUMT
Priority to CN202211490758.9A priority Critical patent/CN115906928B/zh
Publication of CN115906928A publication Critical patent/CN115906928A/zh
Application granted granted Critical
Publication of CN115906928B publication Critical patent/CN115906928B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Indicating And Signalling Devices For Elevators (AREA)

Abstract

本发明公开了一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法,设计了双通道自注意力模型并行捕捉双模态多传感器的观测特征;构建了基于Transformer的网络模型执行端到端的UUV三维自主避碰决策;利用编码器‑解码器的结构实现基于历史观测和时序决策的UUV避碰规划。与现有方法相比,本发明可以基于双模态多传感器观测进行端到端的UUV自主避碰规划,能够大幅度提高UUV避碰规划的快速性,摆脱UUV避碰规划对传感器高精度稳定观测的依赖,解决观测失效或目标丢失情况下的UUV自主避碰规划问题。

Description

一种基于双通道自注意力的Transformer UUV三维自主避碰 规划方法
技术领域
本发明涉及一种基于双通道自注意力的Transformer无人水下潜航器(UUV)三维自主避碰规划方法。属于无人水下航行器自主避碰规划技术领域
背景技术
作为开发与保护海洋必不可少的智能装备,无人水下航行器(UnmannedUnderwater Vehicles,UUVs)通常作业在控制人员不可达及通讯受限的环境中,实现实时控制的难度极大,提高其自主能力是UUV发展的重要趋势。UUV自主避碰规划技术赋予UUV自动识别障碍物、预测障碍物运动状态、评估碰撞风险和避碰决策的能力,可以在时变海洋环境中,根据多传感器观测信息引导UUV自主避开障碍物,安全航行至目标位置,是保证UUV安全航行和作业的关键。
自UUV问世以来,其避碰技术一直是该领域的研究重点。随着研究的深入,UUV避碰规划技术已经取得了长足的进步,但仍存在下述待解决的问题。首先,现有避碰方法大多依赖于对高精度的环境观测,而声呐作为水下最常用的环境感知设备,其观测性能具有强不稳定性,导致UUV避碰的不稳定性。其次,现有避碰方法的环境适应性较弱,无法完成复杂多变海洋环境中的UUV避碰规划。最后,现有避碰规划方法大多需要结合目标识别、预测及风险评估模块,不仅占用大量的计算和通信资源,且容易导致UUV在紧急情况下无法及时响应避碰决策而发生碰撞。
发明内容
针对上述技术问题,本发明提出了一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法,目的在于增强UUV自主避碰规划对不稳定声呐观测及不确定海洋环境的适应性,解决声呐观测短暂失效或障碍物目标短暂丢失情况下的UUV自主避碰规划问题,实现从多传感器观测到UUV运动控制系统输入的端到端的三维避碰规划,提高UUV自主避碰规划的自主性和快速性。
本发明提出的一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法,包括如下步骤:
一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法,其特征在于,包括如下步骤:
步骤1,建立UUV避碰规划系统模型,获取前视声呐观测数据以及UUV位置、姿态、速度数据;
步骤2,构建UUV三维避碰规划动作集,对动作集中的动作进行编码;
步骤3,设计用于UUV三维自主避碰规划的双通道自注意力Transformer网络模型,包括两个编码器、一个特征融合层和一个解码器;第一编码器和第二编码器是参数不共享的两个并行的通道;
第一编码器接收[t-n,t]时刻声呐观测数据Dp(t-n,…,t),用于建立声呐观测中的注意,其中n表示历史观测时间步长;
第二编码器接收[t-n,t]时刻目标相对UUV的方位角和深度以及UUV的纵荡速度、纵倾角度,利用第二编码器建立目标相对UUV的位姿以及UUV本体运动状态中的注意;
编码器特征融合层将两个编码器捕获的特征进行整合后形成融合特征图U(t-n,…,t),与解码器的历史输出
Figure BDA0003963202970000021
共同构成了解码器输入,解码器输出UUV动作编码,其中,m为历史决策时间步长;
步骤4,构建UUV三维自主避碰规划数据集;
数据集由特征样本及标签样本组成,其中特征样本包括前视声呐观测、目标相对UUV的方位角、深度以及UUV本体的纵荡速度、纵倾角度,标签样本为期望的UUV动作编码;
步骤5,基于UUV三维自主避碰规划数据集,对双通道自注意力Transformer网络模型进行训练,优化模型参数。
步骤6,对UUV位置、姿态进行预处理,得到目标相对UUV的方位角及深度;
采用线性比例变换法将前视声呐观测、目标相对UUV的方位角、深度以及UUV本体的纵荡速度、纵倾角度进行归一化处理;
将归一化后数据输入到训练后的双通道自注意力Transformer网络模型中,得到UUV动作编码,UUV执行该编码对应的动作。
进一步的,步骤2中动作集包括UUV动作和填充标志位,编码方式为one-hot编码;
每个UUV动作是一组转艏角速度、纵倾角速度和纵荡加速度的组合;
动作集包括456个UUV动作和一个零填充标志位;
1个填充标志位为零填充标志位,在避碰初始阶段,无历史时刻的解码器输出,则对历史时刻的
Figure BDA0003963202970000022
进行零填充,以构成固定维度的
Figure BDA0003963202970000023
输入到解码器中;
465个UUV动作由31个转艏角速度、3个纵倾角速度和5个纵荡加速度组合构成;
对动作集中466个元素进行one-hot编码;
进一步的,第一编码器包括Flatten层、输入嵌入层、位置编码层、Dropout层和4个第一编码器模块;
首先,将声呐观测数据序列Dp(t-n,…,t)输入到Flatten层对其进行降维,再经过输入嵌入层、位置编码及Dropout层得到
Figure BDA0003963202970000031
经过4个依次连接的第一编码器模块处理后输出特征序列
Figure BDA0003963202970000032
进一步的,第二编码器包括concatenate层、输入嵌入层、位置编码层、Dropout层和2个第二编码器模块;
将[t-n,t]时刻目标相对UUV的方位角ψg(t-n,…,t)、深度zg(t-n,…,t)以及UUV本体的纵荡速度u(t-n,…,t)、纵倾角度θ(t-n,…,t)输入到concatenate层合并为Sp(t-n,…,t)作为网络输入,随后,输入嵌入层、位置编码层、dropout层和2个依次连接的第二编码器模块,用于提取传感器观测数据特征,最后一个第二编码器模块输出特征序列
Figure BDA0003963202970000033
进一步的,第一编码器模块包括多头自注意力和第一多层感知机模块两个子层,在每个子层前后分别进行Layer Normalizations和残差连接,第一多层感知机模块包含GELU非线性变换和线性变换两个子层,在每个子层后进行Dropout操作。
进一步的,第二编码器模块包括多头自注意力和第二多层感知机模块两个子层,在每个子层前后分别进行Layer Normalizations和残差连接,第二多层感知机模块包含tanh非线性变换和线性变换两个子层,在每个子层后进行Dropout操作。
进一步的,特征融合层通过张量融合网络将两个编码器输出的特征图融合,再利用Flatten层将融合特征图展平为二维特征图,最后采用包含64个隐藏单元的线性编码形成新的特征图,为解码器特征提取过程做准备。
进一步的,解码器包括输入嵌入层、位置编码层、dropout层、4个解码器模块、以及一个全连接前馈网络层;
输入嵌入层对解码器历史输出
Figure BDA0003963202970000034
进行线性编码,为接下来的特征提取过程做准备。随后,输入位置编码层、dropout层得到
Figure BDA0003963202970000035
4个依次连接的解码器模块从特征融合层输出及
Figure BDA0003963202970000036
中注意与UUV避碰决策相关的关键信息输出到全连接前馈网络层,全连接前馈网络层负责整体特征信息的拟合,并输出UUV动作编码。
进一步的,所述解码器模块包括多头自注意力、掩码多头互注意力及tanh非线性变换多层感知机模块三个子层,每个子层前后分别为Layer Normalizations和残差连接,并在多头自注意力子层的残差连接后进行切片操作。
与现有技术相比,本发明提供的一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法的优势主要体现在三个方面:首先,该方法集障碍物识别、障碍物运动预测、碰撞风险评估和避碰决策一体化,是一种端到端可训练的方法,能够大大提高避碰效率;其次,该方法具有较强的学习和泛化能力,能够提高UUV自主避碰对不稳定观测和不确定海洋环境的适应能力;最后,该方法通过多步解码器预测可以实现目标短暂丢失或观测短暂失效情况下的UUV避碰规划。
附图说明
图1是UUV三维避碰规划坐标系统图。
图2是前视声呐观测模型示意图。
图3是双通道自注意力的Transformer网络模型示意图。
图4是两个编码器模块结构示意图。
图5是解码器模块结构示意图。
具体实施方式
下面结合说明书附图进一步说明本发明提供的一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法:
本发明的一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法,包括以下步骤:
步骤1,建立UUV避碰规划系统模型,包括:固定坐标系、UUV本体坐标系、前视声呐坐标系、UUV运动模型以及前视声呐观测模型;获取前视声呐观测数据以及UUV位置、姿态、速度数据;
1)建立如下固定坐标系:
为准确描述UUV和运动目标在水下的位姿,在任务空间中任取一位置点为原点,建立如图1所示的北东坐标系(NOE)作为固定坐标系,ON轴指向地球北,OE轴指向地球东,OD轴指向下,x表示北向位移,y表示东向位移,z表示垂向位移,
Figure BDA0003963202970000041
表示横倾角,θ为纵倾角,ψ表示艏向角;
2)建立如下UUV局部坐标系:
建立如图1中o-xbybzb所示UUV局部坐标系来描述UUV的速度和角速度,以UUV重心为原点,oxb轴取在UUV纵向剖面内,指向UUV艏端,oyb轴与纵剖面垂直,指向UUV右舷,ozb轴在UUV的纵剖面内,与xboyb平面垂直,指向UUV底端,u表示纵荡速度,v表示横荡速度,w表示升沉速度,p表示横倾角速度,q表示纵倾角速度,r表示转艏角速度;
3)建立如下前视声呐坐标系:
以声呐测量中心为原点,建立前视声呐坐标系o-xSySzS描述声呐对障碍物的观测,坐标轴oxs、oys和ozs分别与UUV本体坐标系坐标轴oxb、oyb和ozb同向。
4)上述坐标系间的转换关系可表述为:
声呐观测得到的位于o-xsyszs下Ps处的障碍物,其在NED中的位置Pn=[x,y,z]T可表述为:
Figure BDA0003963202970000051
Figure BDA0003963202970000052
其中,
Figure BDA0003963202970000053
为传感器坐标系原点在UUV本体坐标系下的位置,
Figure BDA0003963202970000054
为o-xbybzb原点在固定坐标系下的位置.
5)建立如下UUV运动学模型:
建立欠驱动UUV运动模型,其执行机构只提供纵向推力τu、纵倾力矩τq及转艏力矩τr,其控制输入由纵荡加速度
Figure BDA0003963202970000058
、转艏角速度r、以及纵倾角速度q组成,且其纵倾角度、纵倾角速度、纵荡速度、纵荡加速度和转艏角速度均受限。
其位姿及运动控制输入可描述为η=[x,y,z,0,θ,ψ]T、V=[u,0,0,0,q,r]T。假设UUV的质量是均匀分布的,且关于xbozb平面对称。则其运动模型可表述为:
Figure BDA0003963202970000055
其中,
Figure BDA0003963202970000056
Figure BDA0003963202970000057
Figure BDA0003963202970000061
假设UUV带有稳定的底层控制系统以实现位姿保持及速度和角速度跟踪.此外,该欠驱动UUV运动还受如下约束:
Figure BDA0003963202970000062
6)建立如下前视声呐观测模型,获取前视声呐观测数据:
如图2所示,该前视声呐可以观测水平开角为180°、垂直开角为17°的区域,最大探测范围为120m,共包含240个波束,分为三层,每层包含80个波束,水平波束角为0.5°。
步骤2,构建UUV三维避碰规划动作集,对动作集中的动作进行编码;
UUV三维避碰规划动作集由465个UUV动作和1个填充标志位组成;
由31个转艏角速度、3个纵倾角速度和5个纵荡加速度组合构成465个UUV动作;
31个转艏角速度包括:-5°/s、-4°/s、-3.6°/s、-3.3°/s、-2.8°/s、-2.4°/s、-2°/s、-1.7°/s、-1.4°/s、-1.1°/s、-0.8°/s、-0.6°/s、-0.4°/s、-0.2°/s、-0.1°/s、0°/s、0.1°/s、0.2°/s、0.4°/s、0.6°/s、0.8°/s、1.1°/s、1.4°/s、1.7°/s、2°/s、2.4°/s、2.8°/s、3.2°/s、3.6°/s、4°/s、5°/s,分别表示UUV转艏角速度的值;
3个纵倾角速度包括:-2°/s、0°/s、2°/s,分别表示UUV的纵倾角速度的值,特别地,纵倾角速度由-2°/s变为0°/s表示UUV由上浮状态转为定深航行状态,纵倾角速度由2°/s变为0°/s表示UUV由下沉状态转为定深航行状态;
5个纵荡加速度包括:-0.4节/秒、-0.1节/秒、0节/秒、0.1节/秒、0.2节/秒,表示UUV纵荡加速度的值;
1个填充标志位为零填充标志位,在避碰初始阶段,无历史时刻的解码器输出,则对历史时刻的
Figure BDA0003963202970000063
进行零填充,以构成固定维度的
Figure BDA0003963202970000064
输入到解码器中;
466个动作经one-hot编码后构成466个动作标签;
步骤3,设计用于UUV三维自主避碰规划的双通道自注意力Transformer网络模型;
如图3所示,该双通道自注意力Transformer网络模型由两个编码器、一个特征融合层和一个解码器构成;
采用两个编码器并行的双通道结构提取不同模态传感器输入的特征,避免信息干扰。其中,第一编码器接收大小为(n+1)×40×3的声呐观测数据,建立声呐观测中的注意,将序列声呐观测序列Dp(t-n,…,t)映射到序列
Figure BDA0003963202970000071
第二编码器接收大小均为(n+1)×1的目标相对UUV方位角、深度以及UUV纵荡速度、纵倾角度数据,建立目标相对UUV的位姿以及UUV本体运动状态中的注意,得到特征序列
Figure BDA0003963202970000072
编码器特征融合层将两个基于多头自注意力机制的编码器捕获的特征进行整合。上述两个编码器和一个编码器特征融合层共同构建了一种用于得到包含不同传感器重要观测信息的新特征图的非线性映射关系。
融合特征图U(t-n,…,t)和解码器历史输出
Figure BDA0003963202970000073
共同构成了解码器输入。解码器通过自注意力和互注意力组合实现对传感器观测和历史决策的注意,采用全连接前馈网络输出UUV动作编码。该解码器可以根据[t-n,t]时刻的传感器观测,对[t,t+n]时刻的避碰行为进行决策。基于编码器-解码器的结构,该双通道自注意力Transformer网络模型不仅可以实现实时避碰规划,还能够实现观测短暂丢失情况下的避碰规划。
如图3所示,该双通道自注意力Transformer网络模型包含两个结构相似参数不共享的编码器。第一编码器通过Flatten层将三维的声呐观测数据展平为二维向量输入到网络。第二编码器应用concatenate层将同模态多传感器信息合并为网络输入。随后,输入嵌入层、位置编码层、dropout层和多个编码器模块被用于提取传感器观测数据特征。输入嵌入层通过线性编码将传感器观测数据映射成为固定维度的向量,为接下来的特征提取过程做准备。位置编码层采用不同频率的正弦和余弦函数提供输入特征的时间步及位置信息,增强模型的时序表达。
定义Dp(t-n,…,t)为[t-n,t]时刻声呐观测数据,第一编码器的Flatten层首先对Dp(t-n,…,t)进行降维,得到特征图
Figure BDA0003963202970000074
再经过输入嵌入层的线性编码、位置编码及Dropout得到第一编码器模块的输入
Figure BDA0003963202970000075
第二编码器首先通过concatenate层将目标方位角ψg(t-n,…,t)、目标相对UUV深度zg(t-n,…,t)、UUV纵荡速度u(t-n,…,t)以及UUV纵倾角度θ(t-n,…,t)合并为Sp(t-n,…,t)输入到网络,再经过输入嵌入层的线性编码、位置编码及Dropout得到第二编码器模块的输入
Figure BDA0003963202970000076
编码器模块的结构如图4所示,由多头自注意力和多层感知机模块两个子层组成,在每个子层前后分别进行Layer Normalizations和残差连接;多层感知机模块包含非线性变换和线性变换两个子层,第一编码器模块在其多层感知机模块实施GELU非线性变换,而第二编码器模块在其多层感知机模块实施tanh非线性变换;
特征融合层通过张量融合网络将两个编码器输出的特征图融合,再利用Flatten层将融合特征图展平为二维特征图,最后采用包含64个隐藏单元的线性编码形成新的特征图,为解码器特征提取过程做准备;
解码器的结构如图3所示,由输入嵌入层、位置编码层、dropout层和多个解码器模块和一个全连接前馈网络层组成。输入嵌入层对解码器历史输出
Figure BDA0003963202970000081
进行线性编码,为接下来的特征提取过程做准备。本实施例中,n=29,m=10;位置编码层对编码后的特征图中元素进行位置标记。解码器模块从特征融合层输出及解码器历史输出中注意与UUV避碰决策相关的关键信息。全连接前馈网络层负责整体特征信息的拟合,并输出UUV动作编码。
解码器模块的结构图5所示,主要包括多头自注意力、掩码多头互注意力及tanh非线性变换多层感知机模块三个子层,每个子层前后分别为Layer Normalizations和残差连接,并在多头自注意力子层的残差连接后进行切片操作。掩码多头互注意力模块对特征融合层和掩码多头自注意层输出特征中的重要信息进行关注,利用基于tanh非线性变换多层感知机模块进一步提取不同传感器的观测特征和UUV之前不同时间步长的动作特征。
步骤4,构建UUV三维自主避碰规划数据集;
数据集由特征样本及标签样本组成,其中特征样本包括前视声呐观测、目标相对UUV的方位角、深度以及UUV本体的纵荡速度、纵倾角度,标签样本为期望的UUV动作编码;
基于多种经典UUV避碰规划方法构建UUV避碰规划专家系统,将专家系统的优秀避碰行采集的数据作为样本,UUV三维自主避碰规划数据集;
步骤5,基于UUV三维自主避碰规划数据集对双通道自注意力Transformer网络模型进行训练,优化模型参数;
利用Adam优化器通过小批量梯度下降反向传播算法优化网络参数,将批量大小、学习率和学习衰减率分别设为512、2-3和1-6,损失函数为交叉熵函数;
步骤6,基于声呐观测及传感器测量得到的UUV位置、姿态及速度输入到训练后的双通道自注意力Transformer网络模型中,进行避碰规划;具体如下:
将传感器测量得到的UUV位姿进行预处理,得到目标相对UUV的方位角及深度;
采用线性比例变换法将前视声呐观测、目标相对UUV的方位角、深度以及UUV本体的纵荡速度、纵倾角度进行归一化处理;
将归一化后数据输入到训练后的双通道自注意力Transformer网络模型中,得到UUV动作编码,UUV执行该编码对应的动作;
对前视声呐观测数据进行预处理,具体为:将声呐每层80个波束从UUV左舷到右舷方向分别编号为0,…,j,…,79,将t时刻声呐第k层各波束观测信息储存在矩阵
Figure BDA0003963202970000091
中,为了减少冗余信息,提高避碰规划效率,本文将声呐观测进行如下整合:
Figure BDA0003963202970000092
对目标在UUV本体坐标系下的深度
Figure BDA0003963202970000093
进行如下预处理:
Figure BDA0003963202970000094
采用线性比例变换法将前视声呐观测、目标相对UUV的方位角、深度以及UUV本体的纵荡速度、纵倾角度进行归一化处理,对于样本中的每一特征
Figure BDA0003963202970000095
数据归一化为:
Figure BDA0003963202970000096

Claims (10)

1.一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法,其特征在于,包括如下步骤:
步骤1,建立UUV避碰规划系统模型,获取前视声呐观测数据以及UUV位置、姿态、速度数据;
步骤2,构建UUV三维避碰规划动作集,对动作集中的动作进行编码;
步骤3,设计用于UUV三维自主避碰规划的双通道自注意力Transformer网络模型,包括两个编码器、一个特征融合层和一个解码器;
第一编码器接收[t-n,t]时刻声呐观测数据Dp(t-n,…,t),用于建立声呐观测中的注意,其中n表示历史观测时间步长;
第二编码器接收[t-n,t]时刻目标相对UUV的方位角和深度以及UUV的纵荡速度、纵倾角度,利用第二编码器建立目标相对UUV的位姿以及UUV本体运动状态中的注意;
编码器特征融合层将两个编码器捕获的特征进行整合后形成融合特征图U(t-n,…,t),与解码器的历史输出
Figure FDA0003963202960000011
共同构成了解码器输入,解码器输出UUV动作编码,其中,m为历史决策时间步长;
步骤4,构建UUV三维自主避碰规划数据集;
数据集由特征样本及标签样本组成,其中特征样本包括前视声呐观测、目标相对UUV的方位角、深度以及UUV本体的纵荡速度、纵倾角度,标签样本为期望的UUV动作编码;
步骤5,基于UUV三维自主避碰规划数据集,对双通道自注意力Transformer网络模型进行训练,优化模型参数;
步骤6,对获取的UUV位置、姿态进行预处理,得到目标相对UUV的方位角及深度;
采用线性比例变换法将前视声呐观测、目标相对UUV的方位角、深度以及UUV本体的纵荡速度、纵倾角度进行归一化处理;
将归一化后数据输入到训练后的双通道自注意力Transformer网络模型中,得到UUV动作编码,UUV执行该编码对应的动作。
2.根据权利要求1所述一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法,其特征在于,步骤2中动作集包括UUV动作和填充标志位;
每个UUV动作是一组转艏角速度、纵倾角速度和纵荡加速度的组合;
动作集包括456个UUV动作和一个零填充标志位;
465个UUV动作由31个转艏角速度、3个纵倾角速度和5个纵荡加速度组合构成;
对动作集中466个元素进行one-hot编码。
3.根据权利要求1所述一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法,其特征在于,第一编码器包括Flatten层、输入嵌入层、位置编码层、Dropout层和4个第一编码器模块;
首先,将声呐观测数据序列Dp(t-n,…,t)输入到Flatten层对其进行降维,再经过输入嵌入层、位置编码及Dropout层得到
Figure FDA0003963202960000021
Figure FDA0003963202960000022
经过4个依次连接的第一编码器模块处理后输出特征序列
Figure FDA0003963202960000023
4.根据权利要求1所述一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法,其特征在于,第二编码器包括concatenate层、输入嵌入层、位置编码层、Dropout层和2个第二编码器模块;
将[t-n,t]时刻目标相对UUV的方位角ψg(t-n,…,t)、深度zg(t-n,…,t)以及UUV本体的纵荡速度u(t-n,…,t)、纵倾角度θ(t-n,…,t)输入到concatenate层合并为Sp(t-n,…,t)作为网络输入,随后,输入嵌入层、位置编码层、dropout层和2个依次连接的第二编码器模块,用于提取传感器观测数据特征,最后一个第二编码器模块输出特征序列
Figure FDA0003963202960000024
5.根据权利要求3所述一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法,其特征在于:第一编码器模块包括多头自注意力和第一多层感知机模块两个子层,在每个子层前后分别进行Layer Normalizations和残差连接,第一多层感知机模块包含GELU非线性变换和线性变换两个子层,在每个子层后进行Dropout操作。
6.根据权利要求5所述一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法,其特征在于:第二编码器模块包括多头自注意力和第二多层感知机模块两个子层,在每个子层前后分别进行Layer Normalizations和残差连接,第二多层感知机模块包含tanh非线性变换和线性变换两个子层,在每个子层后进行Dropout操作。
7.根据权利要求1所述一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法,其特征在于:特征融合层通过张量融合网络将两个编码器输出的特征图融合,再利用Flatten层将融合特征图展平为二维特征图,最后采用包含64个隐藏单元的线性编码形成新的特征图,为解码器特征提取过程做准备。
8.根据权利要求1所述一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法,其特征在于:解码器包括输入嵌入层、位置编码层、dropout层、4个解码器模块、以及一个全连接前馈网络层;
输入嵌入层对解码器历史输出
Figure FDA0003963202960000025
进行线性编码,为接下来的特征提取过程做准备,随后,输入位置编码层、dropout层得到
Figure FDA0003963202960000026
4个依次连接的解码器模块从特征融合层输出及
Figure FDA0003963202960000027
中注意与UUV避碰决策相关的关键信息输出到全连接前馈网络层,全连接前馈网络层负责整体特征信息的拟合,并输出UUV动作编码。
9.根据权利要求8所述一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法,其特征在于:所述解码器模块包括多头自注意力、掩码多头互注意力及tanh非线性变换多层感知机模块三个子层,每个子层前后分别为Layer Normalizations和残差连接,并在多头自注意力子层的残差连接后进行切片操作。
10.根据权利要求1所述一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法,其特征在于:在归一化处理之前,对目标在UUV本体坐标系下的深度
Figure FDA0003963202960000031
进行如下预处理:
Figure FDA0003963202960000032
CN202211490758.9A 2022-11-25 2022-11-25 一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法 Active CN115906928B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211490758.9A CN115906928B (zh) 2022-11-25 2022-11-25 一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211490758.9A CN115906928B (zh) 2022-11-25 2022-11-25 一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法

Publications (2)

Publication Number Publication Date
CN115906928A CN115906928A (zh) 2023-04-04
CN115906928B true CN115906928B (zh) 2023-05-16

Family

ID=85753173

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211490758.9A Active CN115906928B (zh) 2022-11-25 2022-11-25 一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法

Country Status (1)

Country Link
CN (1) CN115906928B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108319293A (zh) * 2018-01-17 2018-07-24 哈尔滨工程大学 一种基于lstm网络的uuv实时避碰规划方法
CN108334677A (zh) * 2018-01-17 2018-07-27 哈尔滨工程大学 一种基于gru网络的uuv实时避碰规划方法
US10908250B1 (en) * 2019-03-19 2021-02-02 United States Of America As Represented By The Secretary Of The Navy Self surveying navigation system
CN113159414A (zh) * 2021-04-19 2021-07-23 华南理工大学 一种基于时序图神经网络的交通速度预测方法
CN113281823A (zh) * 2021-05-10 2021-08-20 南京方之舆科技有限公司 水下自主平台的磁力仪探测装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108319293A (zh) * 2018-01-17 2018-07-24 哈尔滨工程大学 一种基于lstm网络的uuv实时避碰规划方法
CN108334677A (zh) * 2018-01-17 2018-07-27 哈尔滨工程大学 一种基于gru网络的uuv实时避碰规划方法
US10908250B1 (en) * 2019-03-19 2021-02-02 United States Of America As Represented By The Secretary Of The Navy Self surveying navigation system
CN113159414A (zh) * 2021-04-19 2021-07-23 华南理工大学 一种基于时序图神经网络的交通速度预测方法
CN113281823A (zh) * 2021-05-10 2021-08-20 南京方之舆科技有限公司 水下自主平台的磁力仪探测装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于深度学习的UUV自主避障规划方法研究;林常见等;《中国博士学位论文全文数据库》;全文 *

Also Published As

Publication number Publication date
CN115906928A (zh) 2023-04-04

Similar Documents

Publication Publication Date Title
Sahoo et al. Advancements in the field of autonomous underwater vehicle
CN109765929B (zh) 一种基于改进rnn的uuv实时避障规划方法
Yuh Modeling and control of underwater robotic vehicles
Wang et al. Roboat II: A novel autonomous surface vessel for urban environments
CN108319293B (zh) 一种基于lstm网络的uuv实时避碰规划方法
CN101825903B (zh) 一种遥控水下机器人水面控制方法
Kim et al. Pose-graph visual SLAM with geometric model selection for autonomous underwater ship hull inspection
Zhang et al. NavNet: AUV navigation through deep sequential learning
Sans-Muntadas et al. Learning an AUV docking maneuver with a convolutional neural network
Antonelli et al. Modeling and control of underwater robots
Karapetyan et al. Human diver-inspired visual navigation: Towards coverage path planning of shipwrecks
Zhang et al. Adaptive neural network control for visual docking of an autonomous underwater vehicle using command filtered backstepping
Lin et al. Transformer-based dual-channel self-attention for uuv autonomous collision avoidance
Hadi et al. Adaptive formation motion planning and control of autonomous underwater vehicles using deep reinforcement learning
Lexau et al. Automated Docking for Marine Surface Vessels-A Survey
CN115906928B (zh) 一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法
Kim et al. Parent-child underwater robot-based manipulation system for underwater structure maintenance
Batlle et al. Uris: Underwater robotic intelligent system
CN117109580A (zh) 基于Transformer模型的AUV导航方法
CN113031632B (zh) 一种适用于潜航器水面回收的控制系统及其控制方法
Rasheed et al. Underwater Robotics: Principles, Components, Modeling, and‎ Control
CN113989327A (zh) 一种基于卷积神经网络粒子滤波算法的单uuv目标状态估计方法
Simonlexau et al. Automated Docking for Marine Surface Vessels—A Survey
Cadena A modular hardware-software architecture of an autonomous underwater vehicle for deep sea exploration
Singh et al. Control of autonomous underwater vehicles

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant