CN112989997A

CN112989997A - 一种基于多信息融合的3d目标检测方法及系统

Info

Publication number: CN112989997A
Application number: CN202110263162.4A
Authority: CN
Inventors: 陈宗海; 戴德云; 王纪凯; 包鹏; 赵皓; 林士琪; 徐萌
Original assignee: University of Science and Technology of China USTC
Current assignee: University of Science and Technology of China USTC
Priority date: 2021-03-11
Filing date: 2021-03-11
Publication date: 2021-06-18

Abstract

本发明涉及一种基于多信息融合的3D目标检测方法及系统，其方法包括：步骤S1：分别采集行车图像和点云信息，并进行预处理；步骤S2：基于行车图像，利用2D目标检测器，得到2D目标框及其得分；步骤S3：基于点云信息，利用3D目标检测器，得到候选3D目标框；步骤S4：利用2D目标框和候选3D目标框的对应关系，以及2D目标框得分，对候选3D目标框进行筛选，得到3D目标框。通过引入视觉信息，弥补了稀疏点云的不足。通过2D检测结果对3D目标框进行约束，提高了3D目标框的召回率，减小了误检、漏检的概率。通过将图像和点云进行后融合，当其中一种数据受干扰时，可通过另一种数据检测出目标，提高了目标检测的鲁棒性。

Description

一种基于多信息融合的3D目标检测方法及系统

技术领域

本发明涉及智能驾驶领域，具体涉及一种基于多信息融合的3D目标检测方法及系统。

背景技术

随着科技的发展，智能化车辆在人们生活中的应用越来越广泛。环境感知作为智能车技术中至关重要的分支，是车辆导航与控制的基础。为保证车辆驾驶过程中的安全，避免与周围车辆、行人发生碰撞，车辆感知系统必须能够精确感知周围环境及交通参与者。同时，该系统需要具备对较远距离物体的检测能力，以保证车辆在较高速度下的行驶安全。3D目标检测作为智能车环境感知中的关键技术之一，能够提供目标的3D位置、大小、方向和类别等信息，从而进行3D建模、路径规划等。近年来，基于激光的3D目标检测技术取得了一定的成效，然而，由于单一的激光点云数据缺乏视觉语义信息，导致3D目标检测结果存在瓶颈。同时，目前已有的方法大多专注于基于单帧观测信息的目标检测，往往忽略历史信息对当前感知结果的启发作用。由于点云和图像信息的模态不同，目前的3D目标检测方法存在的问题如下：

(1)由于环境中存在遮挡、动态等情况，导致激光感知信息具有不完备、不确定特性。目前的方法在对点云进行处理时未能充分利用点云包含的信息，而以原始点云为输入的模型在底层特征学习时，由于搜索半径过大，背景点会干扰特征，导致检测出的目标存在误检、漏检问题，不够鲁棒；

(2)现有方法预测的3D边框和真实框的IoU值与其分类得分不一致，即IoU值较大框的分类得分较低。

发明内容

为了解决上述技术问题，本发明提供一种基于多信息融合的3D目标检测方法及系统。

本发明技术解决方案为：一种基于多信息融合的3D目标检测方法，包括：

步骤S1：分别采集行车图像和点云信息，并进行预处理；

步骤S2：基于所述行车图像，利用2D目标检测器，得到2D目标框及其得分；

步骤S3：基于所述点云信息，利用3D目标检测器，得到候选3D目标框；

步骤S4：利用所述2D目标框和所述候选3D目标框的对应关系，以及所述2D目标框得分，对所述候选3D目标框进行筛选，得到3D目标框。

本发明与现有技术相比，具有以下优点：

1、通过引入视觉信息，弥补了稀疏点云的不足。通过2D检测结果对3D目标框进行约束，提高了3D目标框的召回率，减小了误检、漏检的概率。

2、通过将图像和点云进行后融合，当其中一种数据受干扰时，可通过另一种数据检测出目标，提高了目标检测的鲁棒性。

3、方案中2D检测器和3D检测器可换为更准确高效的检测器，整个方案适用范围广、可移植性强。

附图说明

图1为本发明实施例中一种基于多信息融合的3D目标检测方法的流程图；

图2为本发明实施例中一种基于多信息融合的3D目标检测方法中步骤S1：分别采集行车图像和点云信息，并进行预处理的流程图；

图3A为行车图像和点云信息示意图；

图3B为点云投影变换示意图；

图4本发明实施例中一种基于多信息融合的3D目标检测方法中步骤S2：基于行车图像，利用2D目标检测器，得到2D目标框及其得分的流程图；

图5本发明实施例中一种基于多信息融合的3D目标检测方法中步骤S3：基于点云信息，利用3D目标检测器，得到候选3D目标框的流程图；

图6本发明实施例中3D目标检测模型中点的不同邻域搜索半径对比；

图7本发明实施例中3D目标检测模型的结构示意图；

图8本发明实施例中一种基于多信息融合的3D目标检测方法中步骤S4：利用2D目标框和候选3D目标框的对应关系，以及2D目标框得分，对候选3D目标框进行筛选，得到3D目标框的流程图；

图9本发明实施例中另一种基于多信息融合的3D目标检测方法的流程图；

图10本发明实施例中一种基于多信息融合的3D目标检测方法中步骤S5：将所述3D目标框进行优化，得到优化后的3D目标框的流程图；

图11本发明实施例中一种智能排序候选框的目标跟踪系统的结构框图；

图12本发明实施例中另一种智能排序候选框的目标跟踪系统的结构框图。

具体实施方式

本发明提供了一种基于多信息融合的3D目标检测方法，解决了现有3D检测器的目标存在误检、漏检问题，不够鲁棒，以及3D边框和真实框的IoU值与其分类得分不一致的问题。

为了使本发明的目的、技术方案及优点更加清楚，以下通过具体实施，并结合附图，对本发明进一步详细说明。

实施例一

如图1所示，本发明实施例提供的一种基于多信息融合的3D目标检测方法，包括下述步骤：

步骤S1：分别采集行车图像和点云信息，并进行预处理；

步骤S2：基于行车图像，利用2D目标检测器，得到2D目标框及其得分；

步骤S3：基于点云信息，利用3D目标检测器，得到候选3D目标框；

步骤S4：利用2D目标框和候选3D目标框的对应关系，以及2D目标框得分，对候选3D目标框进行筛选，得到3D目标框。

如图2所示，在一个实施例中，上述步骤S1：分别采集行车图像和点云信息，并进行预处理，具体包括：

S11：分别利用相机和激光扫描仪，采集行车图像和点云信息；

如图3A和图3B所示，利用安装在车顶端的相机和激光扫描仪分别采集行车图像和点云信息，并根据相机和激光扫描仪的安装位置，通过旋转矩阵R和平移向量T，获取二者的变换关系。此外，通过对相机的标定，获取相机内部参数。

S12：将采集到的行车图像和点云信息，根据其时间戳信息，进行同步关联，得到同步后的行车图像和点云信息。

由于相机和激光扫描仪是异源传感器，时间频率不同，采集到的行车图像和点云信息时间不同步。因此使用激光扫描仪的时间戳作为参考，并对时间戳通过插值方式进行同步关联，以获得同步后的行车图像和点云信息。

如图4所示，上述步骤S2：基于行车图像，利用2D目标检测器，得到2D目标框及其得分，具体包括：

步骤S21：利用2D目标检测器，检测出所述行车图像中的目标框，得到2D目标框及其得分，表示如下述公式(1)；

其中，n为2D目标框个数，2D目标框由其左下顶点和右上顶点组成，表示为

为第i个2D目标框的得分；

本发明实施例对2D目标检测器不做限制，可选择传统的2D目标检测模型，也可选择基于深度网络模型的2D目标检测网络，比如M2Det，利用该2D目标检测器，可以识别出行车图像中的目标框，并对其分类和评分。

步骤S22：根据相机和激光扫描仪的位置关系以及相机的参数，将点云信息中的点p＝(x_w,y_w,z_w)^T根据下述公式(2)变换到行车图像坐标系下，得到变换后的点

其中，K为变换系数，dx,dy,γ,u₀,v₀,f为相机的参数，相机和激光扫描仪的位置关系为R和T；

步骤S23：计算变换后的点

所对应的2D目标框的得分，记为

其中N为所述点

的个数，得分

表示如下述公式(3)：

其中，δ为常数。

如图5所示，在一个实施例中，上述步骤S3：基于点云信息，利用3D目标检测器，得到候选3D目标框，具体包括：

步骤S31：利用3D目标检测器，对点云信息进行特征提取；

本发明实施例使用3D目标检测模型为改进的PointNet++模型，即CylinderPointNet++模型进行点云目标特征提取，如图6所示，即利用圆柱域代替球域进行邻域搜索，该模型不需要对点云进行投影变换或体素化，直接以点的3D位置和强度作为输入。并可减少在底层特征提取时的背景点干扰。

步骤S32：对3D目标框的位置、类别以及IoU值进行预测，预测得到候选3D目标框的集合记为

得分集合记为

IoU值集合记为

如图7所示，本发明实施例在3D目标框的位置和类别的预测之外，增加IoU预测分支，利用预测的IoU值，可以增加3D目标框的预测置信度。将预测所得到的3D框位置集合记为

得分集合记为

IoU值集合记为

如图8所示，在一个实施例中，上述步骤S4：利用2D目标框和候选3D目标框的对应关系，以及2D目标框得分，对候选3D目标框进行筛选，得到3D目标框，具体包括：

步骤S41：选择落在2D目标框中的点

所对应的候选3D目标框，并根据其所述预测的IoU值，计算权值W，计算公式如下述公式(4)：

其中，I_N为预测的IoU值，ρ为常数；

为了增加3D目标框的准确率，本发明实施例结合2D目标框和3D目标框的检测结果，只有当3D目标框全部或部分落在2D目标框中时，将该3D目标框作为候选目标框，并计算其对应的权值。

步骤S42：通过下述公式(5)，计算加权后的候选3D目标框的得分；

利用上述步骤得到的2D目标框的得分

和3D目标框的得分

以及权值，计算得到候选3D目标框的得分S′。

步骤S43：根据候选3D目标框的得分S′，对其进行非极大值抑制操作，得到最终的3D目标框P。

本发明提供的一种基于多信息融合的3D目标检测方法，通过引入行车图像的视觉信息，弥补了稀疏点云的不足。通过2D目标检测结果对3D目标检测框进行约束，提高了3D目标检测框的召回率，减小了误检、漏检的概率。通过将行车图像和点云进行后融合，当其中一种数据受干扰时，可通过另一种数据检测出目标，提高了目标检测的鲁棒性。而且，本发明实施例中2D目标检测器和3D目标检测器不做限制，因此，整个方案适用范围广、可移植性强。

如图9所示，在一个实施例中，在上述步骤S4之后，还包括：步骤S5：将所述3D目标框进行优化，得到优化后的3D目标框。

步骤S5：将3D目标框进行优化，得到优化后的3D目标框，具体包括：

步骤S51：根据上一时刻检测出的3D目标框位置P_old和其类别C_old，计算其与当前时刻检测出的相同类别的3D目标框的距离；

根据时间的连续性，利用上一时刻检测出的3D目标框，对预测的3D框进行优化。根据上一时刻检测出的3D目标框位置P_old和其类别C_old，计算其与当前时刻检测出的相同类别的3D目标框的距离。

步骤S52：若距离的最小值和其均值之间的差，小于预设的阈值，则忽略该3D目标框，若大于阈值，作为优化后最终的3D目标框。

对于超出阈值的3D目标框，其对应的目标可能是由于遮挡等导致的漏检，因此将其保留。经过本步骤的优化处理，进一步对3D目标框进行筛选，得到准确率更高的3D目标框。

实施例二

如图11所示，本发明实施例提供了一种基于多信息融合的3D目标检测系统，包括下述模块：

数据采集模块61，用于分别采集行车图像和点云信息，并进行预处理；

2D目标检测模块62，用于基于行车图像，利用2D目标检测器，得到2D目标框及其得分；

3D目标检测模块63，用于基于点云信息，利用3D目标检测器，得到候选3D目标框；

3D目标框筛选模块64，用于利用2D目标框和候选3D目标框的对应关系，以及2D目标框得分，对候选3D目标框进行筛选，得到3D目标框。

如图12所示，在一个实施例中，上述基于多信息融合的3D目标检测系统，还包括下述模块：

3D目标框优化模块65，用于将3D目标框筛选模块筛选后的3D目标框进行优化，得到优化后的3D目标框。

提供以上实施例仅仅是为了描述本发明的目的，而并非要限制本发明的范围。本发明的范围由所附权利要求限定。不脱离本发明的精神和原理而做出的各种等同替换和修改，均应涵盖在本发明的范围之内。

Claims

1.一种基于多信息融合的3D目标检测方法，其特征在于，包括：

步骤S1：分别采集行车图像和点云信息，并进行预处理；

2.根据权利要求1所述的基于多信息融合的3D目标检测方法，其特征在于，所述步骤S1：分别采集行车图像和点云信息，并进行预处理，具体包括：

S11：分别利用相机和激光扫描仪，采集所述行车图像和所述点云信息；

S12：将采集到的所述行车图像和所述点云信息，根据其时间戳信息，进行同步关联，得到同步后的行车图像和点云信息。

3.根据权利要求1所述的基于多信息融合的3D目标检测方法，其特征在于，所述步骤S2：基于所述行车图像，利用2D目标检测器，得到2D目标框及其得分，具体包括：

步骤S22：根据所述相机和所述激光扫描仪的位置关系以及所述相机的参数，将所述点云信息中的点p＝(x_w,y_w,z_w)^T根据下述公式(2)变换到所述行车图像坐标系下，得到变换后的点

其中，K为变换系数，dx,dy,γ,u₀,v₀,f为所述相机的参数，所述相机和激光扫描仪的位置关系为R和T；

步骤S23：计算所述变换后的点

所对应的所述2D目标框的得分，记为

其中N为所述点

的个数，得分

表示如下述公式(3)：

其中，δ为常数。

4.根据权利要求1所述的基于多信息融合的3D目标检测方法，其特征在于，所述步骤S3：基于所述点云信息，利用3D目标检测器，得到候选3D目标框，具体包括：

步骤S31：利用所述3D目标检测器，对所述点云信息进行特征提取；

步骤S32：对所述3D目标框的位置、类别以及IoU值进行预测，预测得到所述候选3D目标框的集合记为

得分集合记为

IoU值集合记为

5.根据权利要求1所述的基于多信息融合的3D目标检测方法，其特征在于，所述步骤S4：利用所述2D目标框和所述候选3D目标框的对应关系，以及所述2D目标框得分，对所述候选3D目标框进行筛选，得到3D目标框，具体包括：

步骤S41：选择落在所述2D目标框中的点

所对应的所述候选3D目标框，并根据其所述预测的IoU值，计算权值，计算公式如下述公式(4)：

其中，I_N为预测的IoU值，ρ为常数；

步骤S42：通过下述公式(5)，计算加权后的所述候选3D目标框的得分；

步骤S43：根据所述候选3D目标框的得分S′，对其进行非极大值抑制操作，得到最终的3D目标框P。

6.根据权利要求1所述的基于多信息融合的3D目标检测方法，其特征在于，在步骤S4之后，还包括：

步骤S5：将所述3D目标框进行优化，得到优化后的3D目标框。

7.根据权利要求6所述的基于多信息融合的3D目标检测方法，其特征在于，所述步骤S5：将所述3D目标框进行优化，得到优化后的3D目标框，具体包括：

步骤S52：若所述距离的最小值和其均值之间的差，小于预设的阈值，则忽略该3D目标框，若大于所述阈值，作为优化后最终的3D目标框。

8.一种基于多信息融合的3D目标检测系统，其特征在于，包括下述模块：

数据采集模块，用于分别采集行车图像和点云信息，并进行预处理；

2D目标检测模块，用于基于所述行车图像，利用2D目标检测器，得到2D目标框及其得分；

3D目标检测模块，用于基于所述点云信息，利用3D目标检测器，得到候选3D目标框；

3D目标框筛选模块，用于利用所述2D目标框和所述候选3D目标框的对应关系，以及所述2D目标框得分，对所述候选3D目标框进行筛选，得到3D目标框。

9.根据权利要求8所述基于多信息融合的3D目标检测系统，其特征在于，还包括下述模块：

3D目标框优化模块，用于将3D目标框筛选模块筛选后的所述3D目标框进行优化，得到优化后的3D目标框。