CN114463362A

CN114463362A - 一种基于深度学习的三维避碰声呐障碍物检测方法及系统

Info

Publication number: CN114463362A
Application number: CN202111649696.7A
Authority: CN
Inventors: 徐从营; 杨邦清; 曾盎
Original assignee: Yichang Testing Technique Research Institute
Current assignee: Yichang Testing Technique Research Institute
Priority date: 2021-12-29
Filing date: 2021-12-29
Publication date: 2022-05-10

Abstract

本发明涉及无人航行器技术领域，公开一种基于深度学习的三维避碰声呐障碍物检测方法及系统，包括：三维避碰声呐探测障碍物，并采集障碍物的三维点云数据；对所述三维点云数据进行处理，生成二维扇形图像，并进行障碍物标注，得到训练图像样本；通过深度学习模型对训练图像样本进行训练，并对障碍物进行图像检测识别，获取障碍物的位置信息，得到障碍物小图像；基于自适应的双阈值检测算法进行图像分割，获取障碍物轮廓信息，并得到障碍物成像的平均灰度值；进行三维点云数据栅格化处理生成三维栅格图像，获取障碍物的三维边界数据；根据三维边界数据对障碍物进行避碰控制。本发明能够获取准确的障碍物三维边界信息，整体简单、可靠也易于实现。

Description

一种基于深度学习的三维避碰声呐障碍物检测方法及系统

技术领域

本发明涉及无人航行器控制技术领域，更具体的说，特别涉及一种基于深度学习的三维避碰声呐障碍物检测方法及系统。

背景技术

对于声呐图像的检测与识别大多采用传统统计机器学习方法进行研究。然而，通过大量的研究实验结果表明，水下声呐目标图像由于波束众多，信噪比低，使用传统图像处理方式或者声信号处理方式不能提取到声呐目标深层次特征，也就导致了在复杂水下环境中目标检测效果不佳。

此外，由于水下目标检测一般都是应用于国家国防安全领域，不仅要对水下目标进行精确的检测，而且还需要对检测结果进行实时现场反馈。因此针对这些问题，如何能有效的结合水声学知识、统计机器学习理论及深度学习方法，以尽快突破水下目标检测瓶颈，做到高效的对水下目标进行智能检测，仍然是一项具有挑战性的研究。

发明内容

本发明的目的在于针对现有技术存在的技术问题，提供一种基于深度学习的三维避碰声呐障碍物检测方法及系统，可用于各类三维避碰声呐数据的处理，获取准确的障碍物三维边界信息，整体简单、可靠也易于实现。

为了解决以上提出的问题，本发明采用的技术方案为：

本发明提供一种基于深度学习的三维避碰声呐障碍物检测方法，该检测方法的具体步骤包括如下：

三维避碰声呐探测障碍物，并采集障碍物的三维点云数据；

对所述三维点云数据进行处理，生成二维扇形图像，并在二维扇形图像中进行障碍物标注，得到训练图像样本；

通过深度学习模型对所述训练图像样本进行训练，并对障碍物进行图像检测识别，获取障碍物的位置信息，得到所述位置信息对应的障碍物小图像；

对所述障碍物小图像，基于自适应的双阈值检测算法进行图像分割，获取障碍物轮廓信息，并得到障碍物成像的平均灰度值；

根据识别出的障碍物轮廓信息和成像的平均灰度值，进行三维点云数据栅格化处理生成三维栅格图像，获取障碍物的三维边界数据；

将所述三维边界数据发送给AUV控制单元，实现对障碍物进行避碰控制。

进一步的，所述对三维点云数据进行处理，生成二维扇形图像，并在二维扇形图像中进行障碍物标注，具体包括如下：

对所述三维点云数据进行降维处理，得到二维数组；

将所述二维数组进行扇形展开，生成二维扇形图像，并得到障碍物的图像数据样本；

根据所述图像数据样本中所有的二维扇形图像，按照设定像素尺寸大小进行裁剪，得到二维裁剪图像；

在二维裁剪图像中进行障碍物标注得到障碍物区域，并对标注后的图像数据样本按比例分类，得到训练图像样本。

进一步的，采用最大值法对三维点云数据进行降维处理，在垂直方向取数列的最大值，将三维点云数据对应的三维数组降低为二维数组。

进一步的，所述通过深度学习模型对所述训练图像样本进行训练，具体包括如下：

设置模型的训练参数，并采用YOLOV3深度学习模型对训练图像样本进行数据训练，得到模型权值文件；

根据所述模型权值文件，在已标注障碍物区域的训练图像样本中，进行障碍物在线检测识别，进一步得到障碍物在所述障碍物区域中的位置信息；

将所述位置信息对应的障碍物图像进行裁剪，生成障碍物小图像。

进一步的，所述深度学习模型的训练参数设置如下：批量大小设置为32，训练图像宽度和高度为512像素，分类数为1，filters参数为18，训练次数不小于20000次，损失函数值不能大于0.2。

进一步的，所述自适应双阈值图像分割算法，具体包括如下：

采用最大类间方差法对障碍物小图像进行直方图统计，得到障碍物小图像的自适应分割阈值d_th；

根据所述自适应分割阈值d_th，确定高低分割阈值并进行图像二值化，得到二值化分割图像；

将二值化分割图像进行形态学闭运算处理，去除孤立噪声点；

根据处理后的分割图像，通过二值连通成分标记的序贯算法，分别对分割出的障碍物目标区域及背景区域进行连通性分析，对障碍物的目标区域内部的孔洞进行填充，得到完整的障碍物轮廓信息；

根据所述障碍物完整的轮廓信息后，统计轮廓信息内的原始图像灰度值，计算得到障碍物成像的像素灰度值。

进一步的，所述得到二值化分割图像，具体过程包括：

设置高低阈值分别为d_th1、d_th2，其中d_th1>d_th2，并取d_th1＝1.2d_th，d_th2＝0.2d_th；

根据所述高低分割阈值进行障碍物小图像的二值化，即设d[i,j]为图像坐标[i,j]处的像素值，若d[i,j]>d_th1，则将图像坐标对应的像素点认定为目标点；

采用递归边界跟踪方法，将所述目标点的八邻域区域内的像素值>d_th2的像素点也判定为目标点；

根据判定的所有目标点，得到二值化分割图像。

进一步的，所述三维点云数据栅格化处理，具体过程包括如下：

创建三维避碰声呐避碰通道的显示空间；

根据需要的避碰通道分辨率，将所述显示空间按照高、宽、深三个方向划分三维栅格；

将三维点云数据按位置信息映射至三维栅格的区域内，得到映射数据，并根据障碍物成像的像素灰度值对映射数据进行处理，保留像素大于像素灰度值的数据；

根据所有的三维栅格内包含的全部数据灰度值，计算灰度值总和并进行伪彩赋值，得到障碍物的三维栅格图像；

从三维栅格图像中提取三维栅格化结果，得到障碍物的三维边界数据。

进一步的，所述显示空间采用高H×宽W×深L的立方体空间，并划分为高h×宽w×深l个三维栅格。

本发明还提供一种基于深度学习的三维避碰声呐障碍物检测系统，其该检测系统包括：

探测采集模块：用于三维避碰声呐探测障碍物，并采集障碍物的三维点云数据；

处理标注模块：用于对所述三维点云数据进行处理，生成二维扇形图像，并在二维扇形图像中进行障碍物标注，得到训练图像样本；

样本训练模块：用于通过深度学习模型对所述训练图像样本进行训练，并对障碍物进行图像检测识别，获取障碍物的位置信息，得到所述位置信息对应的障碍物小图像；

图像分割模块：用于对所述障碍物小图像，基于自适应的双阈值检测算法进行图像分割，获取障碍物轮廓信息，并得到障碍物成像的平均灰度值；

边界数据获取模块：用于根据识别出的障碍物轮廓信息和成像的平均灰度值，进行三维点云数据栅格化处理生成三维栅格图像，获取障碍物的三维边界数据；

避碰控制模块：用于将所述三维边界数据发送给AUV控制单元，实现对障碍物进行避碰控制。

与现有技术相比，本发明的有益效果在于：

本发明能够准确、快速地实现对障碍物进行检测识别，精确获取障碍物的三维轮廓信息，便于AUV进行精准的三维避碰控制，适用于各种三维避碰声呐数据获取三维障碍物边界信息，整个检测方法和系统简单、可靠也易于实现。

附图说明

为了更清楚地说明本发明中的方案，下面将对实施例描述中所需要使用的附图作一个简单介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。其中：

图1为本发明基于深度学习的三维避碰声呐障碍物检测方法的流程图。

图2为本发明对三维点云数据进行处理的流程图。

图3为本发明扇形展开的二维扇形图像示意图。

图4为本发明图像数据样本中进行障碍物标注的示意图。

图5为本发明深度学习模型对训练图像样本进行训练的流程图。

图6为本发明自适应双阈值图像分割算法的流程图。

图7为本发明采用自适应双阈值图像分割算法分割障碍物的效果图。

图8为本发明三维点云数据栅格化处理的流程图。

图9为本发明障碍物检测结果及三维栅格化处理的示意图。

图10为本发明基于深度学习的三维避碰声呐障碍物检测系统的原理图。

具体实施方式

除非另有定义，本文所使用的所有技术和科学术语与属于本发明技术领域的技术人员通常理解的含义相同；本文在说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本发明，例如，术语“长度”、“宽度”、“上”、“下”、“左”、“右”、“前”、“后”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置为基于附图所示的方位或位置，仅是便于描述，不能理解为对本技术方案的限制。

本发明的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含；本发明的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。本发明的说明书和权利要求书及上述附图说明中，当元件被称为“固定于”或“安装于”或“设置于”或“连接于”另一个元件上，它可以是直接或间接位于该另一个元件上。例如，当一个元件被称为“连接于”另一个元件上，它可以是直接或间接连接到该另一个元件上。

此外，在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

参阅图1所示，本发明提供一种基于深度学习的三维避碰声呐障碍物检测方法，该检测方法的具体步骤包括如下：

步骤S1：三维避碰声呐探测障碍物，并采集障碍物的三维点云数据。

步骤S2：对采集得到的三维点云数据进行处理，生成二维扇形图像，并在二维扇形图像中进行障碍物标注，得到训练图像样本。

本步骤S2中，参阅图2所示，所述对三维点云数据进行处理，具体过程包括如下：

步骤S21：对所述三维点云数据进行降维处理，得到二维数组；

进一步的，为保证处理后的数据还保留有障碍物的细节信息，因此使用最大值法对三维点云数据进行降维处理，并在垂直方向取数列的最大值，将三维点云数据对应的三维数组降低为二维数组。

具体的，假设三维点云数据中存在一组48×32×609的三维数组，需降低为48×609的二维数组，可在垂直方向上取所有值的最大值方法，生成三维避碰声呐数据的二维数组。

步骤S22：将得到的二维数组进行扇形展开，生成如图3所示的二维扇形图像，并得到初始的障碍物的图像数据样本。

具体的，在对二维数组进行扇形展开时，可根据角度和距离信息计算扇形图像中每个像素所对应的二维数组数据值。例如将48×609的二维数组展开成角度为90°，像素宽度为1000，高度为609的扇形图像，则可以坐标为[500,609]的像素为中心建立图像坐标系，计算每个像素所对应的角度和距离，其中角度值[-50°～+50°]对应二维数组的1～48列，距离值1～609对应二维数组1～609行，以此得到二维扇形图像，即得到障碍物的图像数据样本。

步骤S23：获取一定数量的障碍物图像数据样本后，将其中所有的二维扇形图像按照设定像素尺寸大小进行裁剪，得到二维裁剪图像。

具体的，将二维扇形图像统一裁剪为800×500像素尺寸大小，去除二维扇形图像两侧黑边无效区域，最大限度利用声呐扇形探测区域进行障碍物标注。

步骤S24：在二维裁剪图像中进行障碍物标注，得到二维裁剪图像中的障碍物区域，并对标注后的图像数据样本按比例分类，得到训练图像样本。

具体的，使用YOV3自带的YOLO-MARK标注软件在二维裁剪图像中进行障碍物标注，图像数据样本中的全部二维裁剪图像均标注完成后，如附图4中a～f得到的标注后的图像数据样本，其中矩形框对应的区域为障碍物区域，将标注后的图像数据样本按3:1比例，分成训练数据集和测试数据集。

本步骤S2中，通过对三维避碰声呐采集的数据，进行降维处理并进行扇形展开，获取了三维避碰声呐反应障碍物数据直观的二维扇形图像，通过积累足够的训练图像样本得到训练数据集和测试数据集，使其具备了使用深度学习算法进行障碍物检测的条件，处理过程简单、方便也易于实现。

步骤S3：通过深度学习模型对所述训练图像样本进行训练，并对障碍物进行图像检测识别，获取障碍物的位置信息，得到所述位置信息对应的障碍物小图像；

本步骤S3中，通过深度学习模型对所述训练图像样本进行训练，参阅图5所示，具体过程包括如下：

步骤S31：采用YOLOV3深度学习模型对训练图像样本进行数据训练，获取在该深度学习模型下的障碍物识别的模型权值文件。

具体的，深度学习模型的训练参数设置如下：批量大小设置为32，训练图像宽度和高度为512像素，分类数为1，filters参数为18，训练次数不小于20000次，损失函数值不能大于0.2，能够保证模型训练的可靠性和准确性。

本实施例中，使用训练图像样本的训练数据集在深度学习模型中进行训练，然后使用测试数据集进行训练效果的测试，通过反复训练和测试，获得该深度学习模型对障碍物识别的模型权值文件，其中要保证检测概率高，一般要求障碍物检测概率不低于90％。

步骤S32：根据所述模型权值文件，进行障碍物的在线实时检测，检测实际使用过程中，每帧二维裁剪图像中障碍物区域内障碍物所在的位置信息即矩形区域信息。

本实施例中，通过测试数据集测试障碍物检测概率满足要求后，即得到了YOLOV3深度学习模型的模型权值文件，便于将其应用于三维避碰声呐数据实时采集处理软件中，进行障碍物的在线实时检测，能够可靠地获取障碍物的位置信息。

步骤S33：根据障碍物在每帧二维裁剪图像中的位置信息，对所述位置信息对应的障碍物图像进一步进行裁剪，生成障碍物小图像等待进行进一步处理。

本步骤S3中，通过对YOLOV3深度学习模型对训练图像样本进行训练和测试，得到了可实际部署的模型权值文件，可用来对三维避碰声呐采集的每帧二维裁剪图像进行在线实时的障碍物位置检测，确定每帧图像中障碍物所在的位置信息，进一步通过裁剪获取每个障碍物小图像，便于后续精确识别出障碍物轮廓信息，简单、可靠也易于实现。

步骤S4：对识别出的障碍物小图像，使用基于自适应的双阈值检测算法进行图像分割，获取精确地障碍物轮廓信息，并得到障碍物成像的平均灰度值。

本步骤S4中，所述自适应双阈值图像分割算法，参阅图6所示，具体包括如下：

步骤S41：使用Otsu(最大类间方差法)算法对障碍物小图像进行直方图统计，得到障碍物小图像的自适应分割阈值d_th；

步骤S42：根据所述自适应分割阈值d_th，确定高低分割阈值并进行图像二值化，得到二值化分割图像；

进一步的，所述得到二值化分割图像，具体过程包括：

根据所述高低分割阈值进行障碍物小图像的二值化，即假设d[i,j]为图像坐标[i,j]处的像素值，如果d[i,j]>d_th1，则将图像坐标对应的像素点认定为目标点；

采用递归边界跟踪方法，将所述目标点八邻域区域(即8个相邻的像素)内的像素值>d_th2的像素点也判定为目标点，此方法可最大程度的分割出目标区域。

根据判定的所有目标点，得到二值化分割图像。

步骤S43：将二值化分割图像进行形态学闭运算处理，去除孤立噪声点；

步骤S44：根据处理后的分割图像，使用二值连通成分标记的序贯算法，分别对分割出的障碍物目标区域及背景区域进行连通性分析，对障碍物的目标区域内部的孔洞进行填充，最终得到完整的障碍物轮廓信息。

步骤S45：根据所述障碍物完整的轮廓信息后，统计轮廓信息内的原始图像灰度值，计算得到障碍物成像的像素灰度值。

具体的，当一张图像中含有多个障碍物时，可首先对单个障碍物图像进行处理，最后取全部障碍物成像均值的最小值为最终检测值，以保证所有障碍物检测的完整性。图7中所示，针对二维扇形图像a1和b1，采用上述自适应双阈值图像分割算法进行障碍物分割后，分别得到的障碍物轮廓信息为图7中a2和b2，即可以清晰地得到障碍物轮廓信息，并可以保证其检测的完整性。

本步骤S4中，通过自适应双阈值图像分割算法，可以精确地分割出每个障碍物小图像中障碍物的轮廓信息，这样就可得到精确的障碍物成像的像素灰度值，为障碍物的三维点云数据划分确定了分割阈值。

步骤S5：根据障碍物成像的像素灰度值，进行三维点云数据栅格化处理并生成三维栅格图像，获取障碍物的三维边界数据。

本步骤S5中，所述三维点云数据栅格化处理，参阅图8所示，具体过程包括如下：

步骤S51：使用OPenGL创建三维避碰声呐避碰通道的显示空间；

具体的，避碰通道的尺寸可根据安全航行阈值条件设置，其中避碰通道指AUV正前方为保证安全航行需要设置的高H×宽W×深L的立方体空间，该立方体空间可保证AUV安全航行，只需检测该立方体空间内是否存在障碍物即可判断AUV是否需要进行避碰。

步骤S52：根据需要的避碰通道分辨率，将所述显示空间按照高、宽、深三个方向划分三维栅格，即划分为h×w×l个三维栅格，其中h、w、l分别对应高、宽、深三个方向。

具体的，在立方体空间的高H、宽W和深L三个方向，分别划分h个、w个和l个，形成三维栅格。

步骤S53：将三维点云数据按位置信息映射至三维栅格的区域内，得到映射数据，并根据障碍物成像的像素灰度值对映射数据进行处理，三维栅格内只保留像素大于像素灰度值的数据。

步骤S54：根据所有的三维栅格内包含的全部数据灰度值，计算灰度值总和并进行伪彩赋值，即栅格内全部数据的灰度值总和越大，伪彩亮度越高，得到障碍物的三维栅格图像。

步骤S55：从三维栅格图像中提取三维栅格化结果，得到障碍物的三维边界数据，包括障碍物的最大高度、左边界和右边界数据。

本步骤S5中，图9中a～f所示分别为障碍物检测结果与对应在三维栅格内，得到的三维栅格图像，通过三维栅格图像可以可靠地得到障碍物的三维边界数据。通过设置AUV三维避碰通道，并将三维避碰声呐三维点云数据进行栅格化处理，采用立方体的显示空间进行显示，可方便获取到避碰通道内障碍物的三维边界信息，为AUV提供了精简准确的障碍物三维信息，方便进行避碰控制。

步骤S6：将所述三维边界数据发送给AUV(水下航行器)控制单元，实现对障碍物进行避碰控制。

本实施例中，通过在三维格栅中得到障碍物的三维边界数据，方便水下航行器控制单元实现对障碍物进行避碰控制，整个检测方法简单、可靠也易于实现，并基于深度学习模型能保证检测方法的准确性。

参阅图10所示，本发明还提供一种基于深度学习的三维避碰声呐障碍物检测系统，该检测系统包括：

具体地，本发明实施例提供的系统具体用于执行上述方法实施例，本发明实施例对此不再进行赘述。

本发明提供的基于深度学习的三维避碰声呐障碍物检测方法及系统，通过三维避碰声呐采集障碍物的三维点云数据，先对数据进行处理生成二维扇形图像，并进行障碍物标注得到训练图像样本；再通过深度学习模型对所述训练图像样本进行训练，获取障碍物的位置信息和障碍物小图像；基于自适应的双阈值检测算法进行图像分割，获取障碍物轮廓信息，并得到障碍物成像的平均灰度值；最后进行三维栅格化处理，获取障碍物的三维边界数据，实现对障碍物进行避碰控制；本发明能够准确、快速地实现对障碍物进行检测，精确获取障碍物的三维轮廓信息，整个检测方法和系统简单、可靠也易于实现。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种基于深度学习的三维避碰声呐障碍物检测方法，其特征在于：该检测方法的具体步骤包括如下：

三维避碰声呐探测障碍物，并采集障碍物的三维点云数据；

2.根据权利要求1所述的基于深度学习的三维避碰声呐障碍物检测方法，其特征在于：所述对三维点云数据进行处理，生成二维扇形图像，并在二维扇形图像中进行障碍物标注，具体包括如下：

对所述三维点云数据进行降维处理，得到二维数组；

3.根据权利要求2所述的基于深度学习的三维避碰声呐障碍物检测方法，其特征在于：采用最大值法对三维点云数据进行降维处理，在垂直方向取数列的最大值，将三维点云数据对应的三维数组降低为二维数组。

4.根据权利要求1所述的基于深度学习的三维避碰声呐障碍物检测方法，其特征在于：所述通过深度学习模型对所述训练图像样本进行训练，具体包括如下：

5.根据权利要求4所述的基于深度学习的三维避碰声呐障碍物检测方法，其特征在于：所述深度学习模型的训练参数设置如下：批量大小设置为32，训练图像宽度和高度为512像素，分类数为1，filters参数为18，训练次数不小于20000次，损失函数值不能大于0.2。

6.根据权利要求1所述的基于深度学习的三维避碰声呐障碍物检测方法，其特征在于：所述自适应双阈值图像分割算法，具体包括如下：

7.根据权利要求6所述的基于深度学习的三维避碰声呐障碍物检测方法，其特征在于：所述得到二值化分割图像，具体过程包括：

根据判定的所有目标点，得到二值化分割图像。

8.根据权利要求1所述的基于深度学习的三维避碰声呐障碍物检测方法，其特征在于：所述三维点云数据栅格化处理，具体过程包括如下：

创建三维避碰声呐避碰通道的显示空间；

9.根据权利要求8所述的基于深度学习的三维避碰声呐障碍物检测方法，其特征在于：所述显示空间采用高H×宽W×深L的立方体空间，并划分为高h×宽w×深l个三维栅格。

10.一种基于权利要求1-9任一项所述基于深度学习的三维避碰声呐障碍物检测方法的检测系统，其特征在于：该检测系统包括：