CN109784333B

CN109784333B - 基于点云带权通道特征的三维目标检测方法及系统

Info

Publication number: CN109784333B
Application number: CN201910059002.0A
Authority: CN
Inventors: 赵鑫; 黄凯奇; 刘哲
Original assignee: Institute of Automation of Chinese Academy of Science
Current assignee: Institute of Automation of Chinese Academy of Science
Priority date: 2019-01-22
Filing date: 2019-01-22
Publication date: 2021-09-28
Anticipated expiration: 2039-01-22
Also published as: US20210042929A1; US11488308B2; WO2020151109A1; CN109784333A

Abstract

本发明涉及一种基于点云带权通道特征的三维目标检测方法及系统，所述检测方法包括：通过预训练的深度卷积神经网络对二维图像中的目标进行提取，得到多个目标物；基于各目标物，在对应的三维点云空间中确定点云视锥；基于点云的分割网络，对视锥中的点云进行分割，获得感兴趣的点云；基于带权通道特征的网络，对感兴趣的点云进行3D Box的参数估计，得到3D Box的参数，进行三维目标检测。本发明通过深度卷积神经网络能够更准确的学习到图像的特征；基于带权通道特征的网络，对感兴趣的点云进行3D Box的参数估计，可降低不重要点的特征降的权重，增加关键点的权重，从而可抑制干扰点，并增强关键点，从而可提高3D Box参数的精度。

Description

基于点云带权通道特征的三维目标检测方法及系统

技术领域

本发明涉及计算机视觉，图像处理技术领域，特别涉及一种基于点云带权通道特征的三维目标检测方法及系统。

背景技术

基于点云的三维目标检测在无人驾驶中属于一个非常重要的任务。要求输入点云数据，有时可能还需要输入对应的RGB的图像数据，然后输出3D Box的参数。

一般来说，首先需要对三维点云进行栅格化，然后在每个栅格中使用三维卷积操作提取点云的特征，但是三维卷积操作在大场景中是非常消耗计算量的，这样会导致很难应用到真实场景中。通过观察，发现真实场景中的点云是十分稀疏的。

一般来说，在无人驾驶传感器输出的3D数据通常都是以点云的形式存储的。三维点云分割是真实场景中对三维目标检测中的关键，好的分割效果会提高的三维目标检测的性能。

3D Box的估计是三维目标检测的最后一步，也是十分重要的一步。由于分割效果不可能完全准确无误，在这些点云中或多或少的存在一些干扰点，这会对最后的3D Box产生负面的影响。

发明内容

为了解决现有技术中的上述问题，即为了降低点云中的干扰，本发明提供一种基于点云带权通道特征的三维目标检测方法及系统。

为解决上述技术问题，本发明提供了如下方案：

一种基于点云带权通道特征的三维目标检测方法，所述检测方法包括：

通过预训练的深度卷积神经网络对二维图像中的目标进行提取，得到多个目标物；

基于各目标物，在对应的三维点云空间中确定点云视锥；

基于点云的分割网络，对视锥中的点云进行分割，获得感兴趣的点云；

基于带权通道特征的网络，对感兴趣的点云进行3D Box的参数估计，得到3D Box的参数，进行三维目标检测。

可选的，通过以下公式，得到多个目标物：

x,y,w,h＝Net(I)；

其中，I表示的是二维图像，Net表示的是深度卷积神经网络；每个目标物的位置可以用一个2D Box的中心点坐标(x,y)，长h，宽w表示。

可选的，所述基于各目标物，在对应的三维点云空间中确定点云视锥，具体包括：

将在Lidar传感器坐标系上的点x_vel转换为摄像机的坐标系上的点x_cam：

其中，

是坐标系的变换矩阵；

将摄像机的坐标系上的点x_cam投影到二维图像上的像素点x_img：

x_img＝Px_cam；

其中，P表示相机坐标系到二维图像坐标系的投影矩阵；

根据各目标物，确定所有投影到目标物上点云，所有投影到目标物上点云为所述点云视锥。

可选的，所述基于点云的分割网络，对视锥中的点云进行分割，获得感兴趣的点云，具体包括：

基于点云的分割网络，计算视锥中的点云属于感兴趣点的概率：

p_i＝f(x_i,θ)；

其中，x_i表示视锥中的第i个点云，θ表示的是网络训练的参数，p_i表示第i个点云x_i属于感兴趣点的概率，f表示基于点云分割的网络；

根据各点云属于感兴趣点的概率与设定的概率阈值，确定获得感兴趣的点云。

可选的，所述根据各点云属于感兴趣点的概率与设定的概率阈值，确定获得感兴趣的点云，具体包括：

如果点云属于感兴趣点的概率大于0.5，则判断为该点云感兴趣的点云，否则为非感兴趣点：

其中，Mask_i表示的是第i个点云的掩码，其取值为1或者0。

可选的，所述对视锥中的点云进行分割的过程中，产生分割损失：

交叉熵损失函数：

其中，y,y^*分别代表的是真实类别以及预测的结果；

分割损失：

L_seg＝Entropy_Loss(y,y^*)。

可选的，所述3D Box的参数包括中心、尺寸、角度及角点，

所述基于带权通道特征的网络，对感兴趣的点云进行3D Box的参数估计，具体包括：

基于带权通道特征的网络，计算3D Box的中心损失、尺寸分类损失、残差尺寸回归损失、角度的分类损失、残差角度的回归损失及角点损失；

根据所述分割损失、3D Box的中心损失、尺寸分类损失、残差尺寸回归损失、角度的分类损失、残差角度的回归损失及角点损失，计算总的损失函数；

根据所述总的损失函数对感兴趣的点云进行3D Box的参数估计，得到3D Box的参数。

可选的，分别根据以下公式，分别计算3D Box的中心损失、尺寸分类损失、残差尺寸回归损失、角度的分类损失、残差角度的回归损失及角点损失：

Hingle损失函数：

(1)中心损失：

L_center＝Hingle_δ＝2.0(x)；

(2)3D Box的尺寸分类损失：

L_size-cls＝Entropy_Loss(y,y^*)；

(3)3D Box的残差尺寸回归损失：

L_size-reg＝Hingle_δ＝1.0(x)；

(4)3D Box的角度的分类损失：

L_angle-cls＝Entropy_Loss(y,y^*)；

(5)3D Box的残差角度的回归损失：

其中，S表示的是3D Box尺寸模板的数目，m＝1,2,…S，H表示的是3D Box方向角模板的数目，n＝1,2,…,H；

(6)3D Box的8个角点的角点损失：

其中，

表示的是第k个角点中的第i个尺寸模板第j个方向角模板的真实坐标，

是预测出的第k个角点坐标，

是对3D Box绕着竖直方向旋转了180度后的角点坐标；δ_ij表示的是第i个尺寸第j个方向模板的真实标签。

可选的，根据以下公式，计算总的损失函数L：

L＝L_seg+λ(L_center+L_size-reg+L_size-cls+L_angle-reg+L_angle-cls)+γL_corner；

其中，λ表示3D Box的中心，角度以及尺寸损失权重，γ表示的是角点损失的权重。

为解决上述技术问题，本发明还提供了如下方案：

一种基于点云带权通道特征的三维目标检测系统，所述检测系统包括：

提取单元，用于通过预训练的深度卷积神经网络对二维图像中的目标进行提取，得到多个目标物；

确定单元，用于基于各目标物，在对应的三维点云空间中确定点云视锥；

分割单元，用于基于点云的分割网络，对视锥中的点云进行分割，获得感兴趣的点云；

估计单元，用于基于带权通道特征的网络，对感兴趣的点云进行3D Box的参数估计，得到3D Box的参数，进行三维目标检测。

根据本发明的实施例，本发明公开了以下技术效果：

本发明通过预训练的深度卷积神经网络对二维图像中的目标进行提取，能够更准确的学习到图像的特征；基于点云的分割网络，对视锥中的点云进行分割，并基于带权通道特征的网络，对感兴趣的点云进行3D Box的参数估计，可降低不重要点的特征降的权重，增加关键点的权重，从而可抑制干扰点，并增强关键点，从而可提高3D Box参数的精度。

附图说明

图1是本发明基于点云带权通道特征的三维目标检测方法的流程图；

图2是本发明基于点云带权通道特征的三维目标检测系统的模块结构示意图。

符号说明：

提取单元—1，确定单元—2，分割单元—3，估计单元—4。

具体实施方式

下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是，这些实施方式仅仅用于解释本发明的技术原理，并非旨在限制本发明的保护范围。

本发明的目的是提供一种基于点云带权通道特征的三维目标检测方法，通过预训练的深度卷积神经网络对二维图像中的目标进行提取，能够更准确的学习到图像的特征；基于点云的分割网络，对视锥中的点云进行分割，并基于带权通道特征的网络，对感兴趣的点云进行3D Box的参数估计，可降低不重要点的特征降的权重，增加关键点的权重，从而可抑制干扰点，并增强关键点，从而可提高3D Box参数的精度。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

如图1所示，本发明基于点云带权通道特征的三维目标检测方法包括：

步骤100：通过预训练的深度卷积神经网络对二维图像中的目标进行提取，得到多个目标物。

步骤200：基于各目标物，在对应的三维点云空间中确定点云视锥。

步骤300：基于点云的分割网络，对视锥中的点云进行分割，获得感兴趣的点云。

步骤400：基于带权通道特征的网络，对感兴趣的点云进行3D Box的参数估计，得到3D Box的参数，进行三维目标检测。

在步骤100中，根据以下公式计算得到多个目标物：

x,y,w,h＝Net(I)；

在步骤200中，所述基于各目标物，在对应的三维点云空间中确定点云视锥，具体包括：

步骤201：将在Lidar传感器坐标系上的点x_vel转换为摄像机的坐标系上的点x_cam：

其中，

是坐标系的变换矩阵。

步骤202：将摄像机的坐标系上的点x_cam投影到二维图像上的像素点x_img：

x_img＝Px_cam；

其中，P表示相机坐标系到二维图像坐标系的投影矩阵。

步骤203：根据各目标物，确定所有投影到目标物上点云，所有投影到目标物上点云为所述点云视锥。

通过步骤201-步骤203，建立Lidar传感器中的点云与二维图像中目标物之间的联系。那么便可以找出所有投影到目标物上点云，即为所需要的点云视锥。

在步骤300中，所述基于点云的分割网络，对视锥中的点云进行分割，获得感兴趣的点云，具体包括：

步骤301：基于点云的分割网络，计算视锥中的点云属于感兴趣点的概率：

p_i＝f(x_i,θ)；

其中，x_i表示视锥中的第i个点云，θ表示的是网络训练的参数，p_i表示第i个点云x_i属于感兴趣点的概率，f表示基于点云分割的网络。

其中，所述分割网络(Segmentation-Network)采用是一种Conv-Deconv的对称网络结构，可准确的学习到图像的特征。

步骤302：根据各点云属于感兴趣点的概率与设定的概率阈值，确定获得感兴趣的点云。

具体地，如果点云属于感兴趣点的概率大于0.5，则判断为该点云感兴趣的点云，否则为非感兴趣点：

其中，Mask_i表示的是第i个点云的掩码，其取值为1或者0。

此外，所述对视锥中的点云进行分割的过程中，产生分割损失：

交叉熵损失函数：

其中，y,y^*分别代表的是真实类别以及预测的结果；

分割损失：

L_seg＝Entropy_Loss(y,y^*)。

在步骤400中，所述3D Box的参数包括中心、尺寸、角度及角点。

步骤401：基于带权通道特征的网络，计算3D Box的中心损失、尺寸分类损失、残差尺寸回归损失、角度的分类损失、残差角度的回归损失及角点损失。

Hingle损失函数：

(1)中心损失：

L_center＝Hingle_δ＝2.0(x)；

(2)3D Box的尺寸分类损失：

L_size-cls＝Entropy_Loss(y,y^*)；

(3)3D Box的残差尺寸回归损失：

L_size-reg＝Hingle_δ＝1.0(x)；

(4)3D Box的角度的分类损失：

L_angle-cls＝Entropy_Loss(y,y^*)；

(5)3D Box的残差角度的回归损失：

(6)3D Box的8个角点的角点损失：

其中，

是预测出的第k个角点坐标，

步骤402：根据所述分割损失、3D Box的中心损失、尺寸分类损失、残差尺寸回归损失、角度的分类损失、残差角度的回归损失及角点损失，计算总的损失函数。

根据以下公式，计算总的损失函数L：

相对于现有技术，本发明具有如下几个显著优点：1)由于本方法使用了Lidar和Image，且二者之间的特征可以达到很好的互补效果，因此在一些小物体上检测的效果较好；2)该算法可以直接对所有类别的物体进行检测，并不需要针对不同的类别训练出不同的模型，因此本方法具有通用性；3)该算法考虑到了不同通道特征之间权重，抑制不重要的特征，并增强关键的特征，从而能够更有效的提取点云的特征。

本发明还提供一种基于点云带权通道特征的三维目标检测系统，可降低点云中的干扰。

如图2所示，本发明基于点云带权通道特征的三维目标检测包括提取单元1、确定单元2、分割单元3及估计单元4。

所述提取单元1用于通过预训练的深度卷积神经网络对二维图像中的目标进行提取，得到多个目标物。

所述确定单元2用于基于各目标物，在对应的三维点云空间中确定点云视锥。

所述分割单元3用于基于点云的分割网络，对视锥中的点云进行分割，获得感兴趣的点云。

所述估计单元4用于基于带权通道特征的网络，对感兴趣的点云进行3D Box的参数估计，得到3D Box的参数，进行三维目标检测。

相对于现有技术，本发明基于点云带权通道特征的三维目标检测系统与上述基于点云带权通道特征的三维目标检测方法的有益效果相同，在此不再赘述。

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征作出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims

1.一种基于点云带权通道特征的三维目标检测方法，其特征在于，所述检测方法包括：

基于各目标物，在对应的三维点云空间中确定点云视锥；

基于带权通道特征的网络，对感兴趣的点云进行3D Box的参数估计，得到3D Box的参数，进行三维目标检测；所述3D Box的参数包括中心、尺寸、角度及角点；

“基于带权通道特征的网络，对感兴趣的点云进行3D Box的参数估计，得到3D Box的参数”具体包括：

根据视锥中点云分割产生的分割损失、3D Box的中心损失、尺寸分类损失、残差尺寸回归损失、角度的分类损失、残差角度的回归损失及角点损失，计算总的损失函数；

根据所述总的损失函数对感兴趣的点云进行3D Box的参数估计，得到3D Box的参数；

所述总的损失函数为：

L＝L_seg+λ(L_center+L_size-reg+L_size-cls+L_angle-reg+L_angle-cls)+γL_corner

L_center＝Hingle_δ＝2.0(x)

L_size-reg＝Hingle_δ＝1.0(x)

其中，L表示总的损失函数，L_seg表示分割损失，L_center、L_size-cls、L_size-reg、L_angle-cls、L_angle-reg分别表示3D Box的中心损失、尺寸分类损失、残差尺寸回归损失、角度的分类损失、残差角度的回归损失，L_corner表示3D Box的角点损失，λ表示3D Box的中心，角度以及尺寸损失权重，γ表示的是角点损失的权重，Hingle表示Hingle损失函数。

2.根据权利要求1所述的基于点云带权通道特征的三维目标检测方法，其特征在于，通过以下公式，得到多个目标物：

x,y,w,h＝Net(I)；

3.根据权利要求1所述的基于点云带权通道特征的三维目标检测方法，其特征在于，所述基于各目标物，在对应的三维点云空间中确定点云视锥，具体包括：