CN112183330A

CN112183330A - 基于点云的目标检测方法

Info

Publication number: CN112183330A
Application number: CN202011036882.9A
Authority: CN
Inventors: 刘博�; 王瑜; 周付根
Original assignee: Beihang University
Current assignee: Beihang University
Priority date: 2020-09-28
Filing date: 2020-09-28
Publication date: 2021-01-05
Anticipated expiration: 2040-09-28
Also published as: CN112183330B

Abstract

本发明公开了一种基于点云的目标检测方法，方法包括：采用最远点取样FPS对点云采样得到点的集合A；采用第一PointSIFT网络提取集合A的特征集合B；根据特征集合B，将集合A中的点分为前景点和背景点；对每一个前景点回归一个三维候选框，组成第一候选框集合C₁；采用NMS算法抑制噪声，合并置信度高的候选框，组成第二候选框集合C₂；将集合C₂中所有候选框内的点池化并转换到规范坐标，得到集合D；将集合D与集合B作为第二PointSIFT网络的输入，提取集合D中置信度高于第三阈值的候选框作为目标。相比于现有技术，本发明方案采用PointSIFT进行特征提取，以捕捉不同方向的局部特征，引入NMS算法来减少噪声点和离群点的影响，减少了目标检测的计算量，也提高了准确度。

Description

基于点云的目标检测方法

技术领域

本发明涉及三维点云处理领域，特别是涉及一种基于点云的目标检测方法。

背景技术

基于三维点云的目标检测广泛应用于自动驾驶领域，是感知道路场景中车辆及其他障碍物的关键技术之一。目前，自动驾驶领域场景感知的硬件系统主要有摄像头，毫米波雷达，激光雷达，超声波探测器。激光雷达通过发射激光束，然后接受来自目标的返回激光束，根据时间差测量障碍物目标与传感器器之间的距离，获得的点云数据能较好的还原目标的结构信息，且具有测量精度高、测距范围广、受光照、天气影响小等优点，被广泛配备在无人驾驶汽车上，使基于激光的三维点云数据的目标检测算法受到了广泛关注。

近年来，深度学习开始广范应用于图像的目标检测领域，其通过学习深度非线性网络结构来表征输入数据并实现复杂的函数逼近。在道路环境车辆无人驾驶等应用场景下，不仅需要获得车辆等目标的位置及三维尺寸信息，还需要获得目标物体在三维空间中的旋转角等数据。激光点云数据具有稀疏性、无序性，如何将不规则的点云数据，与深度学习结合是现有技术中研究的热点。

2017年Charles R.Qi等人提出的PointNet首先将深度学习应用于三维点云数据，直接使用点云数据作为神经网络的输入，提取点云数据的特征，可以较好地完成分类、部件分割以及大场景语义分割等应用任务。针对三维点云无序性的特点，PointNet通过MaxPooling对称函数提取三维点云中每个点的特征，可以较好的获得全局特征。为了保证点云数据的旋转和平移不变性，PointNet训练了小型神经网络STN，通过点云的位置信息学习到一个最有利于网络进行分类或分割的旋转矩阵，对激光点云数据的调整，从而实现数据对齐。但PointNet网络在提取特征时只考虑了逐点特征以及全局特征，没有局部结构信息，此外实际场景中的点云是疏密不同的，而PointNet对点云进行了均匀采样，因此在实际应用时准确率较低。在现有工程实践中，一系列新的网络模型大多延续了PointNet，因此难以缓解其技术上的不足，使得检测结果不佳。

鉴于此，本发明提出一种基于点云的目标检测方法，使用PointSIFT代替PointNet作为特征提取网络，引入NMS算法以抑制噪声目标，提高目标检测的准确率。

发明内容

本发明的目的在于提供一种基于点云的目标检测方法，包括：采用最远点取样FPS对点云采样得到点的集合A；采用第一PointSIFT网络提取集合A的特征集合B；根据特征集合B，将集合A中的点分为前景点和背景点；对每一个前景点回归一个三维候选框，组成第一候选框集合C₁；采用NMS算法剔除集合C₁中置信度分数低于第一阈值的候选框，合并集合C₁中置信度高于第二阈值的候选框，组成第二候选框集合C₂；将集合C₂中所有候选框内的点池化并转换到规范坐标，得到集合D；将集合D与集合B作为第二PointSIFT网络的输入，提取集合D中置信度高于第三阈值的候选框作为目标。

进一步地，采用第一PointSIFT网络提取集合A的特征集合B的步骤，包括：将集合A中的点P₀的邻域划分为8个分区；在8个分区半径为r的区域内寻找P₀的最近邻点集合，最近邻点集合构成特征向量V，对特征向量V沿X、Y、Z轴上进行三阶段卷积，得到特征点f₀，f₀为特征集合B₁中的元素；遍历计算集合A中点的特征点，构成特征集合B₁；改变半径r若干次，计算得到若干特征集合B₁；若干特征集合B₁卷积后得到特征集合B。

进一步地，对每一个前景点回归一个三维候选框的步骤，包括：预测三维候选框的中心点位置、尺寸和方向这7维数据；在二维平面划分若干固定大小的区间，判断中心点位置属于哪个区间，采用交叉熵损失函数来计算损失；三维候选框的尺寸和方向采用L1损失函数来进行回归。

进一步地，还包括：根据三维候选框与传感器距离，调整三维候选框置信度，以保留距传感器较近的三维候选框。

进一步地，还包括：根据三维候选框与传感器距离，采用不同参数的NMS算法。

进一步地，还包括：在集合D中的点加入与传感器的距离信息，以补偿点云深度信息。

本发明的有益效果如下：

本发明提供的技术方案可以包括以下有益效果：采用PointSIFT进行特征提取，以捕捉不同方向的局部特征信息。在距离传感器不同位置设置不同数量的三维候选框，引入了NMS算法来减少噪声点和离群点的影响，减少了目标检测的计算量，也提高了检测准确度。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一种实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例一种基于点云的目标检测方法流程示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明的技术方案进行清楚、完整地描述，所描述的实施例是本发明一部分实施例，而不是全部的实施例。

图1是本发明实施例一种基于点云的目标检测方法流程示意图，如图1所示，该方法包括如下7个步骤。

步骤S101：采用最远点取样对点云采样。具体地，采用最远点取样FPS对点云采样得到点的集合A。

需要进行说明的是，最远点取样FPS将场景中的点进行采样，使得获取场景中点的个数为固定值。FPS不断迭代地选择距离已有采样点集合的最远点，使得采样点尽可能覆盖空间中的所有点。

步骤S102：采用第一PointSIFT网络提取特征。具体地，将集合A中的点P₀的邻域划分为8个分区；在8个分区半径为r的区域内寻找P₀的最近邻点集合，最近邻点集合构成特征向量V，对特征向量V沿X、Y、Z轴上进行三阶段卷积，得到特征点f₀，f₀为特征集合B₁中的元素；遍历计算集合A中点的特征点，构成特征集合B₁；改变半径r若干次，计算得到若干特征集合B₁；若干特征集合B₁卷积后得到特征集合B。

在一个具体的实施例中，集合A中每个点的维度均为d维，则特征向量V的维度为2×2×2×d，则沿X、Y、Z轴上进行三阶段卷积的计算公式如下：

V_x＝g(Conv(W_x,V))∈R_1×2×2×d

V_xy＝g(Conv(W_y,V_x))∈R_1×1×2×d

V_xyz＝g(Conv(W_z,V_xy))∈R_1×1×1×d

其中，令g(·)＝ReLU(·)，即激活函数层，W_x、W_y、W_z分别为三个轴方向的卷积核，其中V_xyz即为特征点f₀。

步骤S103：划分前景点和背景点。具体地，根据特征集合B，将集合A中的点分为前景点和背景点。

在一个可选的实施例中，使用Focal Loss损失函数来判定其为前前景还是背景点。使用该损失函数是为了减少容易分类的样本的权重，将权重尽量集中于难分类样本上。

步骤S104：将前景点回归三维候选框。具体地，对每一个前景点回归一个三维候选框的步骤，包括：预测三维候选框的中心点位置、尺寸和方向这7维数据；在二维平面划分若干固定大小的区间，判断中心点位置属于哪个区间，采用交叉熵损失函数来计算损失；三维候选框的尺寸和方向采用L1损失函数来进行回归。需要进行说明的是，三维候选框的中心点位置和尺寸均为3维数据，方向仅考虑水平方向的偏航角，因此三维候选框的数据维度为7维。

步骤S105：采用NMS算法优选候选框。具体地，对每一个前景点回归一个三维候选框，组成第一候选框集合C₁；采用NMS算法剔除集合C₁中置信度分数低于第一阈值的候选框，合并集合C₁中置信度高于第二阈值的候选框，组成第二候选框集合C₂。

在一个可选的实施例中，根据三维候选框与传感器距离，调整三维候选框置信度，以保留距传感器较近的三维候选框。

在另一个可选的实施例中，根据三维候选框与传感器距离，采用不同参数的NMS算法。需要进行说明的是，NMS算法可以抑制局部的非极大值噪声。

步骤S106：转换到规范坐标。具体地，将集合C₂中所有候选框内的点池化并转换到规范坐标，得到集合D。需要进行说明的是，池化是深度学习领域的公知常识，表示降采样。

步骤S107：提取目标。具体地，将集合D与集合B作为第二PointSIFT网络的输入，提取集合D中置信度高于第三阈值的候选框作为目标。

在一个可选的实施例中，在集合D中的点加入与传感器的距离信息，以补偿点云深度信息。

最后应说明的是：以上所述实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种基于点云的目标检测方法，其特征在于，包括：

采用最远点取样FPS对点云采样得到点的集合A；

采用第一PointSIFT网络提取集合A的特征集合B；

根据所述特征集合B，将所述集合A中的点分为前景点和背景点；

对每一个所述前景点回归一个三维候选框，组成第一候选框集合C₁；

采用NMS算法剔除所述集合C₁中置信度分数低于第一阈值的候选框，合并所述集合C₁中置信度高于第二阈值的候选框，组成第二候选框集合C₂；

将所述集合C₂中所有候选框内的点池化并转换到规范坐标，得到集合D；

将所述集合D与集合B作为第二PointSIFT网络的输入，提取所述集合D中置信度高于第三阈值的候选框作为目标。

2.根据权利要求1所述的方法，其特征在于，所述采用第一PointSIFT网络提取集合A的特征集合B的步骤，包括：

将所述集合A中的点P₀的邻域划分为8个分区；

在所述8个分区半径为r的区域内寻找P₀的最近邻点集合，所述最近邻点集合构成特征向量V，对所述特征向量V沿X、Y、Z轴上进行三阶段卷积，得到特征点f₀，所述f₀为特征集合B₁中的元素；

遍历计算所述集合A中点的特征点，构成所述特征集合B₁；

改变所述半径r若干次，计算得到若干所述特征集合B₁；

所述若干所述特征集合B₁卷积后得到特征集合B。

3.根据权利要求1所述的方法，其特征在于，所述对每一个前景点回归一个三维候选框的步骤，包括：

预测所述三维候选框的中心点位置、尺寸和方向这7维数据；

在二维平面划分若干固定大小的区间，判断所述中心点位置属于哪个区间，采用交叉熵损失函数来计算损失；

所述三维候选框的尺寸和方向采用L1损失函数来进行回归。

4.根据权利要求1所述的方法，其特征在于，还包括：

根据所述三维候选框与传感器距离，调整所述三维候选框置信度，以保留距传感器较近的三维候选框。

5.根据权利要求4所述的方法，其特征在于，还包括：

根据所述三维候选框与传感器距离，采用不同参数的NMS算法。

6.根据权利要求1所述的方法，其特征在于，还包括：

在所述集合D中的点加入与传感器的距离信息，以补偿所述点云深度信息。