CN110610650A

CN110610650A - 一种基于深度学习和深度相机的点云语义地图的构建方法

Info

Publication number: CN110610650A
Application number: CN201910796731.4A
Authority: CN
Inventors: 颜成钢; 任浩帆; 孙垚棋; 张继勇; 张勇东; 沈韬
Original assignee: Hangzhou Dianzi University
Current assignee: Hangzhou Dianzi University
Priority date: 2019-08-27
Filing date: 2019-08-27
Publication date: 2019-12-24

Abstract

本发明公开了一种基于深度学习和深度相机的点云语义地图的构建方法。本发明步骤：1、构建神经网络的必须模块；2、搭建神经网络；3、训练神经网络模型；采用semantic3D为训练集，使用反向传播和随机梯度下降，训练神经网络，最小化损失函数，从而不断优化网络权重连接；4、进行相机标定，得到相机的内参，首先利用深度相机采集点云数据，通过相机的内参矩阵将采集到的深度图转换成点云；5、将点云输入到训练好的神经网络当中，使用含有语义信息的点云进行语义地图的构建，从而可以得到语义标签的点云语义地图。本发明能够更加实用的为机器人室内导航和定位提供语义这样的高级特征，便于精准的确定机器人的位置，以及更为精准的回环检测。

Description

一种基于深度学习和深度相机的点云语义地图的构建方法

技术领域

本发明属于计算机视觉，特别地，本发明涉及一种基于深度学习和深度相机的点云语义地图的构建方法。

背景技术

随着几年来深度学习的火速发展，使得能够直接对点云进行三维语义的点云构建成为可能。其对于自动驾驶车辆，无人飞行器等自主性的机器人在室内和室外的的运动感知和场景理解都具有非常重要的意义。三维的场景理解可以用使得机器人能够很好的与周围的环境进行交互。

已有的一些方法可以采集点云地图，主要分为激光雷达和深度相机两大类的传感器，但是由于激光雷达价格高，而且测距的距离有限，并且采集过程当中丢失了纹理信息，地图先天就缺乏语义信息，不利于对语义分割做直接的处理。

此外，相比于其他的三维地方的表达方式，相比于其他三维表达方式，直接处理点云构造语义地图更接近传感器所采集到的原声数据，无需进行数据的转换，可以提高分割的速度。

发明内容

本发明的目的是真针对现有技术的不足，提出一种基于深度学习和深度相机的点云语义地图的构建方法。本发明采用能直接对点云做处理的卷积算子并且结合PointSIFT模块做预处理，实现准确的点云地图的场景感知。

本发明仅仅使用深度相机生成三维的点云地图，只需要经过简单的相机标定，就可以实现，而且传感器的家个相对比较便宜。此外本发明利用了图片点云色彩的纹理信息，相比于激光雷达构建的地图能够为分割提供更多有用信息。并且不需要人工进行干预，可以实现端到端的学习，整个流程一步到位，快捷高效

一种基于深度学习和深度相机的点云语义地图的构建方法，该方法具体包括以下步骤：

步骤1、构建神经网络的必须模块；

首先对点云做法向量估计，增加点云的特征。我们采用巨鹿节火的算法。对于点云中的每一个点p，获取m个邻域点，然后利用最小二乘计算一个局部平面P，表述如下：

其中n是平面P的法向量，d为平面P到坐标原点的垂直距离。M是邻域点，i表示邻域的索引，h_i表示第i个邻域点。

构建逐点卷积算子：

p_i是点i的坐标以及估计出的法向量，|·|一个点领域内所有点的数目，Ω_i(k)是点i的第k个邻域，ω_k是第k个邻域的权重，x_i和x_j是第i个点和第j个点，索引l和l-1分别是输入和输出的层。

步骤2、搭建神经网络；

包括5个逐点卷积层，两个全连接层，一个合并层以及4个PointSIFT层。网络结构参看说明书附图中图1和图2，具体的操作如下：

首先利用公式(1)对输入的点云做法向量估计，增加点云的特征；之后利用公式(2)的逐点卷积算子，对点云进行卷积，每次卷积之后跟随一个如说明书附图中图2，图3所示的PointSIFT层。最后将最后一层卷积输出的结果与前两层卷积输出的结果拼接，最后经过两个分支，经过全连接层，得到分割和分类的结果，即获得点云的语义标签。

步骤3、训练神经网络模型；采用semantic3D为训练集，使用反向传播和随机梯度下降，训练神经网络，最小化损失函数，使得我们不断优化网络权重连接。

步骤4、进行相机标定，得到相机的内参，首先利用深度相机采集点云数据，通过相机的内参矩阵将采集到的深度图转换成点云。

步骤5、将点云输入到训练好的神经网络当中，使用含有语义信息的点云进行语义地图的构建，从而可以得到语义标签的点云语义地图。

本发明的特点及有益效果：

本发明实现了一种基于深度学习和深度相机的点云语义地图的构建方法，对机器人室内定位与导航有较大意义。本发明中利用深度相机经过标定后投影得到点云地图，之后估计出点云的表面法线信息，然后利用逐点卷积的算子对点云卷积，通过提出的算子和网络结构实现了点云的语义地图的构建，能够更加实用的为机器人室内导航和定位提供语义这样的高级特征，便于精准的确定机器人的位置，以及更为精准的回环检测。

附图说明

图1为本发明方法神经网络结构。

图2是PointSIFT模块。

图3是PointSIFT中采用的方向编码。

具体实施方式

步骤1、构建神经网络的必须模块；

构建逐点卷积算子：

步骤2、搭建神经网络；

Claims

1.一种基于深度学习和深度相机的点云语义地图的构建方法，其特征在于包括以下步骤：

步骤1、构建神经网络的必须模块；

步骤2、搭建神经网络；

步骤3、训练神经网络模型；采用semantic3D为训练集，使用反向传播和随机梯度下降，训练神经网络，最小化损失函数，从而不断优化网络权重连接；

步骤4、进行相机标定，得到相机的内参，首先利用深度相机采集点云数据，通过相机的内参矩阵将采集到的深度图转换成点云；

2.根据权利要求1所述的一种基于深度学习和深度相机的点云语义地图的构建方法，其特征在于步骤1具体实现如下：

首先对点云做法向量估计，增加点云的特征；采用巨鹿节火的算法；对于点云中的每一个点p，获取m个邻域点，然后利用最小二乘计算一个局部平面P，表述如下：

其中n是平面P的法向量，d为平面P到坐标原点的垂直距离；M是邻域点，i表示邻域的索引，h_i表示第i个邻域点；

构建逐点卷积算子：

3.根据权利要求2所述的一种基于深度学习和深度相机的点云语义地图的构建方法，其特征在于步骤2具体实现如下：

神经网络包括5个逐点卷积层，两个全连接层，一个合并层以及4个PointSIFT层，具体的操作如下：

首先利用公式(1)对输入的点云做法向量估计，增加点云的特征；之后利用公式(2)的逐点卷积算子，对点云进行卷积，每次卷积之后跟随一个PointSIFT层；最后将最后一层卷积输出的结果与前两层卷积输出的结果拼接，最后经过两个分支，经过全连接层，得到分割和分类的结果，即获得点云的语义标签。