CN115171096A

CN115171096A - 一种基于rgb图像与激光点云融合的3d目标检测方法

Info

Publication number: CN115171096A
Application number: CN202210888275.8A
Authority: CN
Inventors: 郭栋; 马向华; 王浩
Original assignee: Shanghai Institute of Technology
Current assignee: Shanghai Institute of Technology
Priority date: 2022-07-27
Filing date: 2022-07-27
Publication date: 2022-10-11

Abstract

本发明提供了一种基于RGB图像与激光点云融合的3D目标检测方法，其中主要包括两个模块：RGB图像的2D目标检测分割模块和点云的3D目标检测模块。将待检测RGB图像输入2D检测模块进行特征提取，按照提取的特征结果对图像进行实例分割，获得待检测目标的分割掩膜；将激光点云从三维的雷达坐标投影到二维的图像坐标，其中包括从激光雷达测量到相机框架的SE(3)变换和从相机框架到图像坐标的投影，根据点云投影到目标分割掩膜的点，在掩膜范围内随机生成固定数量的虚拟点；将生成的虚拟点重新投影到原始点云；将融合后的点云进入3D目标检测模块进行目标检测，能极大提高检测的准确率。

Description

一种基于RGB图像与激光点云融合的3D目标检测方法

技术领域

本发明属于目标检测技术领域，具体地说，尤其涉及一种基于RGB图像与激光点云融合的3D目标检测方法。

背景技术

目标检测一直是机器视觉领域中的研究热点。在2D目标检测已经非常成熟的今天，3D目标检测获得了研究者的广泛关注。3D目标检测对自动驾驶等相关领域起着至关重要的作用。在3D目标检测的算法研究中，RGB图像包含丰富的语义信息，在对象的分类任务中具有优势，但是缺少深度信息。RGB-D图像虽然包含深度信息，但仍以2D形式表现，相比点云数据，其损失了很多有用的空间信息，在对空间位置的判断上有所欠缺。另外，对于远处的目标，点云信息过于稀疏，无法有效的检测，而对RGB图像的检测算法非常成熟，能有效的检测，因此提出了利用RGB图像进行2D目标检测，利用检测结果形成虚拟点去增强点云，提升对3D目标检测的效果。

发明内容

本发明要解决的技术问题是克服现有技术的不足，提供了一种基于RGB图像与激光点云融合的3D目标检测方法，其利用RGB图像进行2D目标检测，利用检测结果形成虚拟点去增强点云，提升对3D目标检测的效果。

为了实现上述目的，本发明是采用以下技术方案实现的：

一种基于RGB图像与激光点云融合的3D目标检测方法，包括以下步骤：

步骤(1)将待检测RGB图像输入2D检测模块进行特征提取；

步骤(2)按照提取的特征结果对图像进行实例分割，获得待检测目标的分割掩膜；

步骤(3)将激光点云从三维的雷达坐标投影到二维的图像坐标，其中包括从激光雷达坐标到相机框架的坐标变换和从相机框架到图像投影的坐标变换；

步骤(4)根据点云投影到目标分割掩膜的点，在掩膜范围内随机生成一定数量的虚拟点；

步骤(5)将生成的虚拟点重新投影到原始点云；

步骤(6)将融合后的点云进入3D目标检测模块进行目标检测。

优选地，步骤(1)具体为：对于给定的待检测图像输入到2D检测框架detectron2，通过RPN(区域生成网络)模块生成建议区域，在建议区域内通过13个卷积层、13个relu层、4个池化层进行特征提取，采用PFN(特征金字塔)对每一种尺度的图像进行特征提取，能够产生多尺度的特征表示，从而进行特征增强，基于ROI尺寸选择特征映射的具体公式为：

优选地，步骤(2)具体为：通过FPN(特征金字塔)获得的增强特征，对建议区域进行特征匹配，通过全连接层进行像素到像素的影射，对图像中的目标实现像素级的实例分割。

优选地，步骤(3)具体为：

1)将点云从雷达坐标到相机框架的坐标变换

R＝R_z·R_y·R_x (1.4)

其中Rx、Ry和Rz分别表示绕X、Y、Z轴的旋转变换矩阵，θ_x、θ_y和θ_z与X、Y、Z轴的夹角，R为雷达坐标到相机框架的坐标旋转变换矩阵，

为图像坐标系中的点，s为齐次坐标系中的缩放因子。

2)从相机框架到图像投影的坐标变换，针孔摄像头模型的投影方程，

其中

为图像坐标系中的点

激光点云从三维的雷达坐标投影到二维的图像坐标公式为

其中t为点云坐标系中平移向量。

优选地，步骤(4)具体为：在点云投影到图像坐标后，与实例分割后的图像融合，得到含点云L＝{(x,y,z,r)_i}和分割掩膜的图像，在目标掩膜范围内随机生成一定数量的虚拟点v_i＝(x,y,z,e)，(x,y,z)为点的空间位置，e为生成虚拟点的深度，由掩膜内投影点云的深度信息估计获得。

优选地，步骤(5)具体为：依据虚拟点的深度信息，参考步骤(3)空间点云投影到图像的方法，将图像中的点反向映射回到点云空间。

优选地，步骤(6)具体为：将融合后点云输入到基于点云的3D目标检测框架VoxelR-CNN，对点云体素化，根据输入的点云数据，分别计算出XYZ三个方向点云数据坐标的最大值与最小值的差，然后根据三个差值来确定初始体素的长宽高，计算完成后，自动建立出初始体素，所建立的初始体素中已包含所有的点云数据将点云划分为规则的体素；

将初始体素建立好之后，即可对初始体素进行划分(划分的越细，体格越小，分辨率越高)并建立三维模型，具体执行方法为将初始体素分解为N个体积较小的体素(通常像256*256*256这样的方式去划分)，用bresenham算法剔除初始体素中的无效体素，剩余的体素即可构成点云数据的三维模型；

将体素化的点云送到3D骨干网络中进行特征提取，将3D特征转换为BEV表示，获得2D表示的点云图像，在此基础上应用2D主干和RPN生成区域方案。将RPN获得的ROI映射到体素化的点云空间，获得体素ROI的区域，体素ROI池化直接从体素ROI的区域提取特征，进行后续的分割和分类。

与现有技术相比，本发明的有益效果是：

将待检测RGB图像输入2D检测模块进行特征提取，按照提取的特征结果对图像进行实例分割，获得待检测目标的分割掩膜；将激光点云从三维的雷达坐标投影到二维的图像坐标，其中包括从激光雷达测量到相机框架的SE(3)变换和从相机框架到图像坐标的投影，根据点云投影到目标分割掩膜的点，在掩膜范围内随机生成固定数量的虚拟点；将生成的虚拟点重新投影到原始点云；将融合后的点云进入3D目标检测模块进行目标检测，能极大提高检测的准确率。

附图说明

图1为本发明的流程框图。

具体实施方式

下面通过具体实施例并结合附图对本发明作进一步说明。

实施例1：

如图1所示，一种基于RGB图像与激光点云融合的3D目标检测方法，包括以下步骤：

步骤(1)将待检测RGB图像输入2D检测模块进行特征提取；

步骤(5)将生成的虚拟点重新投影到原始点云；

步骤(6)将融合后的点云进入3D目标检测模块进行目标检测。

步骤(1)具体为：对于给定的待检测图像输入到2D检测框架detectron2，通过RPN(区域生成网络)模块生成建议区域，在建议区域内通过13个卷积层、13个relu层、4个池化层进行特征提取，采用PFN(特征金字塔)对每一种尺度的图像进行特征提取，能够产生多尺度的特征表示，从而进行特征增强，基于ROI尺寸选择特征映射的具体公式为：

步骤(2)具体为：通过FPN(特征金字塔)获得的增强特征，对建议区域进行特征匹配，通过全连接层进行像素到像素的影射，对图像中的目标实现像素级的实例分割。

步骤(3)具体为：

1)将点云从雷达坐标到相机框架的坐标变换

R＝R_z·R_y·R_x (1.4)

为图像坐标系中的点，s为齐次坐标系中的缩放因子。

其中

为图像坐标系中的点

激光点云从三维的雷达坐标投影到二维的图像坐标公式为

其中t为点云坐标系中平移向量。

步骤(4)具体为：在点云投影到图像坐标后，与实例分割后的图像融合，得到含点云L＝{(x,y,z,r)_i}和分割掩膜的图像，在目标掩膜范围内随机生成一定数量的虚拟点v_i＝(x,y,z,e)，(x,y,z)为点的空间位置，e为生成虚拟点的深度，由掩膜内投影点云的深度信息估计获得。

步骤(5)具体为：依据虚拟点的深度信息，参考步骤(3)空间点云投影到图像的方法，将图像中的点反向映射回到点云空间。

步骤(6)具体为：将融合后点云输入到基于点云的3D目标检测框架Voxel R-CNN，对点云体素化，根据输入的点云数据，分别计算出XYZ三个方向点云数据坐标的最大值与最小值的差，然后根据三个差值来确定初始体素的长宽高，计算完成后，自动建立出初始体素，所建立的初始体素中已包含所有的点云数据将点云划分为规则的体素；

Claims

1.一种基于RGB图像与激光点云融合的3D目标检测方法，其特征在于：包括以下步骤：

步骤(1)将待检测RGB图像输入2D检测模块进行特征提取；

步骤(5)将生成的虚拟点重新投影到原始点云；

步骤(6)将融合后的点云进入3D目标检测模块进行目标检测。

2.根据权利要求1所述的基于RGB图像与激光点云融合的3D目标检测方法，其特征在于：步骤(1)具体为：对于给定的待检测图像输入到2D检测框架detectron2，通过RPN(区域生成网络)模块生成建议区域，在建议区域内通过13个卷积层、13个relu层、4个池化层进行特征提取，采用PFN(特征金字塔)对每一种尺度的图像进行特征提取，能够产生多尺度的特征表示，从而进行特征增强，基于ROI尺寸选择特征映射的具体公式为：

。

3.根据权利要求2所述的基于RGB图像与激光点云融合的3D目标检测方法，其特征在于：步骤(2)具体为：通过FPN(特征金字塔)获得的增强特征，对建议区域进行特征匹配，通过全连接层进行像素到像素的影射，对图像中的目标实现像素级的实例分割。

4.根据权利要求3所述的基于RGB图像与激光点云融合的3D目标检测方法，其特征在于：步骤(3)具体为：

1)将点云从雷达坐标到相机框架的坐标变换

R＝R_z·R_y·R_x (1.4)

为图像坐标系中的点，s为齐次坐标系中的缩放因子。

其中

为图像坐标系中的点

激光点云从三维的雷达坐标投影到二维的图像坐标公式为

其中t为点云坐标系中平移向量。

5.根据权利要求4所述的基于RGB图像与激光点云融合的3D目标检测方法，其特征在于：步骤(4)具体为：在点云投影到图像坐标后，与实例分割后的图像融合，得到含点云L＝{(x,y,z,r)_i}和分割掩膜的图像，在目标掩膜范围内随机生成一定数量的虚拟点v_i＝(x,y,z,e)，(x,y,z)为点的空间位置，e为生成虚拟点的深度，由掩膜内投影点云的深度信息估计获得。

6.根据权利要求5所述的基于RGB图像与激光点云融合的3D目标检测方法，其特征在于：步骤(5)具体为：依据虚拟点的深度信息，参考步骤(3)空间点云投影到图像的方法，将图像中的点反向映射回到点云空间。

7.根据权利要求6所述的基于RGB图像与激光点云融合的3D目标检测方法，其特征在于：步骤(6)具体为：将融合后点云输入到基于点云的3D目标检测框架Voxel R-CNN，对点云体素化，根据输入的点云数据，分别计算出XYZ三个方向点云数据坐标的最大值与最小值的差，然后根据三个差值来确定初始体素的长宽高，计算完成后，自动建立出初始体素，所建立的初始体素中已包含所有的点云数据将点云划分为规则的体素；