CN117475410A

CN117475410A - 基于前景点筛选的三维目标检测方法、系统、设备、介质

Info

Publication number: CN117475410A
Application number: CN202311809931.1A
Authority: CN
Inventors: 张有磊; 潘晓东; 王一帆; 于晰廷; 初明超
Original assignee: Shandong Hairun Shuju Technology Co ltd
Current assignee: Shandong Hairun Shuju Technology Co ltd
Priority date: 2023-12-27
Filing date: 2023-12-27
Publication date: 2024-01-30
Anticipated expiration: 2043-12-27
Also published as: CN117475410B

Abstract

本发明涉及三维图像数据处理技术领域，具体为基于前景点筛选的三维目标检测方法、系统、设备、介质；该检测方法，通过将目标的初始点云数据进行特征提取和分类后，得到初始点云分类结果；接着，将初始点云分类结果与初始点云的坐标信息、像素信息结合，在保留点云原始数据的基础上，进一步增加了点云数据的特征丰富性；然后，将特征丰富的复合点云数据进行体素化、信息聚合和特征卷积，得到空间特征表达能力较高的二维特征图；最后，利用初始点云分类结果中的前景点信息，引导体素进行特征表达，增强与目标的相关特征，将得到的待检特征图进行语义分割处理，实现高效准确的目标检测。

Description

基于前景点筛选的三维目标检测方法、系统、设备、介质

技术领域

本发明涉及三维图像数据处理技术领域，具体为基于前景点筛选的三维目标检测方法、系统、设备、介质。

背景技术

3D目标检测是智能交通领域中的一个关键问题，也是一个具有挑战性的任务。近年来，随着自动驾驶、智能交通等新兴领域需求的增加以及深度学习的广泛应用，3D目标检测技术迎来了新的发展高潮。3D目标检测技术利用图像或点云信息来检测和定位目标，在交通领域一般指利用路侧或车载的相机、激光雷达等设备采集的数据作为输入，通过对这些数据进行深度分析和学习，实现对车辆、行人等交通目标的预测和定位。这种技术在智能交通系统中起着至关重要的作用，为自动驾驶、交通安全等方面提供了有力支持。

现有的3D目标检测方法，常使用基于体素的方法将点云离散化为有序的体素表示，通过将点云映射到3D体素网格中，形成类似2D图像的伪图像，最后使用2D卷积神经网络进行目标检测，该方法虽然计算速度较快，但是处理过程中易丢失点云信息，目标检测结果的准确度较低。

发明内容

本发明的目的是提供基于前景点筛选的三维目标检测方法、系统、设备、介质。

本发明技术方案如下：

一种基于前景点筛选的三维目标检测方法，包括如下操作：

S1、获取目标的初始点云数据，所述初始点云数据经特征提取处理，得到特征点云数据；

S2、将所述特征点云数据中，每个特征点云进行特征分类处理，得到的所有特征点云，以及每个特征点云对应的像素分类类别，形成了特征点云分类集；基于所述特征点云分类集，对所述初始点云数据进行分类特征补充，得到复合点云数据；

S3、对所述复合点云数据进行体素划分处理，得到同一体素内多个复合点云的多体素数据；所述多体素数据经特征信息聚合处理，得到聚合多体素数据；所述聚合多体素数据经特征卷积处理，得到二维特征图；

S4、基于所述特征点云分类集中的前景点信息，对二维特征图进行类别感知高斯掩码分配处理，得到特征权重分布图；所述特征权重分布图与二维特征图相乘，得到待检特征图；

S5、所述待检特征图经语义分割处理，得到分类检测结果。

所述S1中特征提取处理的操作具体为：将所述初始点云数据进行空间距离划分处理，得到的所有点云区域形成了点云区域集；将所述点云区域集中，每个点云区域内的所有初始点云，转化为一个点云特征向量，得到的所有点云特征向量形成了点云特征向量集；将所述点云特征向量集中，每个点云特征向量与对应初始点云进行信息聚合处理，得到的所有信息聚合点云形成了所述特征点云数据。

所述S2中特征分类处理的操作具体为：所述特征点云数据，依次经归一化处理、第一线性处理、第一非线性处理、参数丢失处理、第二线性处理、第二非线性处理，得到第一特征点云数据；获取所述第一特征点云数据中，每个第一特征点云的像素值与标准分类像素数据中标准分类像素的近似值，若所述近似值超过阈值，将对应标准分类像素的分类结果，作为对应第一特征点云的像素分类类别；所有第一特征点云，以及每个第一特征点云对应的像素分类类别，形成了特征点云分类集。

所述S3中特征信息聚合处理的操作具体为：将所述多体素数据中，每个体素内，坐标值最接近体素几何中心的复合点云，作为复合点云中心；将每个体素内的复合点云中心，与预设邻域范围内，同一体素内的其他复合点云，进行信息聚合，得到聚合体素数据；所有的聚合体素数据，形成了所述聚合多体素数据。

所述S4中类别感知高斯掩码分配处理的操作具体为：所述二维特征图中，分别以每个前景点为中心，每个前景点对应掩码半径为搜索半径，对搜索范围内的点进行权重值分配，得到的所有初始权重值分布图，形成了初始权重值分布图集；将初始权重值分布图集中，同一个点在不同初始权重值分布图上的多个权重值的乘积，作为对应点的特征权重，得到所述特征权重分布图。

所述S5中语义分割处理的操作具体为：所述待检特征图经边界框回归处理和分类概率处理，得到分类检测框区域集；获取所述分类检测框区域集中，同一检测区域内，不同检测框与真实框的交并比，将交并比最大值对应的检测框，作为目标检测框；将所述目标检测框中，分类概率最大值对应的分类结果，作为所述分类检测结果。

所述S3的体素划分处理的操作之前，还包括删除所述复合点云数据中，属性为背景点的部分复合点云，得到的简化复合点云数据，用于执行所述体素划分处理的操作。

一种基于前景点筛选的三维目标检测系统，包括：

特征点云数据生成模块，用于获取目标的初始点云数据，所述初始点云数据经特征提取处理，得到特征点云数据；

复合点云数据生成模块，用于将所述特征点云数据中，每个特征点云进行特征分类处理，得到的所有特征点云，以及每个特征点云对应的像素分类类别，形成了特征点云分类集；基于所述特征点云分类集，对所述初始点云数据进行分类特征补充，得到复合点云数据；

二维特征图生成模块，用于对所述复合点云数据进行体素划分处理，得到同一体素内多个复合点云的多体素数据；所述多体素数据经特征信息聚合处理，得到聚合多体素数据；所述聚合多体素数据经特征卷积处理，得到二维特征图；

待检特征图生成模块，用于基于所述特征点云分类集中的前景点信息，对二维特征图进行类别感知高斯掩码分配处理，得到特征权重分布图；所述特征权重分布图与二维特征图相乘，得到待检特征图；

分类检测结果生成模块，用于所述待检特征图经语义分割处理，得到分类检测结果。

一种基于前景点筛选的三维目标检测设备，包括处理器和存储器，其中，所述处理器执行所述存储器中保存的计算机程序时实现上述的基于前景点筛选的三维目标检测方法。

一种计算机可读存储介质，用于存储计算机程序，其中，所述计算机程序被处理器执行时实现上述的基于前景点筛选的三维目标检测方法。

本发明的有益效果在于：

本发明提供的一种基于前景点筛选的三维目标检测方法，通过将目标的初始点云数据进行特征提取和分类后，得到初始点云分类结果；接着，将初始点云分类结果与初始点云的坐标信息、像素信息结合，在保留点云原始数据的基础上，进一步增加了点云数据的特征丰富性；然后，将特征丰富的复合点云数据进行体素化、信息聚合和特征卷积，得到空间特征表达能力较高的二维特征图；最后，利用初始点云分类结果中的前景点信息，引导体素进行特征表达，增强与目标的相关特征，将得到的待检特征图进行语义分割处理，实现高效准确的目标检测。

具体实施方式

本实施例提供了一种基于前景点筛选的三维目标检测方法，包括如下操作：

S5、所述待检特征图经语义分割处理，得到分类检测结果。

S1、获取目标的初始点云数据，初始点云数据经特征提取处理，得到特征点云数据。

使用激光雷达等设备，获取待检测目标范围内的点云，形成了目标的初始点云数据。点云中含有三维坐标信息、像素信息和反射强度信息。

为减小计算量，提高计算效率，特征提取处理之前，包括对初始点云数据进行数据增强处理。数据增强的操作包括但不仅限于：过滤、随机翻转、旋转、缩放和数据库采样，以将点云数据的数量减少到16384个点。

接着，为得到目标的初始点云数据的全局特征，提高初始点云数据的信息表达能力，对初始点云数据进行特征提取处理。

特征提取处理的操作可以为：对初始点云数据进行滤波处理，得到特征点云数据。

特征提取处理的操作还可以为：将初始点云数据进行空间距离划分处理，得到的所有点云区域形成了点云区域集；将点云区域集中，每个点云区域内的所有初始点云，转化为一个点云特征向量，得到的所有点云特征向量，形成了点云特征向量集；将点云特征向量集中，每个点云特征向量与对应初始点云进行信息聚合处理，得到的所有信息聚合点云，形成了特征点云数据。

具体为，根据预设的空间距离度量，将初始点云数据进行区域划分，这些区域可以是重叠的，由此得到了由很多个点云区域组成的点云区域集；接着将点云区域集中，每个点云区域内的所有离散的初始点云，看作为一个特征向量，因此可以得到一个由很多个点云特征向量形成的点云特征向量集；最后将每个初始点云，与它对应的点云特征向量中所有的点云，进行信息聚合，得到特征点云；每个初始点云都执行完上述的信息聚合处理后，可得到很多个信息聚合点云，形成了特征点云数据。

S2、将特征点云数据中，每个特征点云进行特征分类处理，得到的所有特征点云，以及每个特征点云对应的像素分类类别，形成了特征点云分类集；基于特征点云分类集，对初始点云数据进行分类特征补充，得到复合点云数据。

为区分特征点云数据中的前景点（车辆、行人、自行车等）和背景点，根据特征点云的像素信息和坐标信息，将特征点云数据进行特征分类处理。

特征分类处理的操作可以为：将大量的前景点（车辆、行人、自行车等）和背景点的像素值，以及对应的分类标签，组成标签数据集；使用标签数据集训练分类神经网络（可优选DeepLab深度卷积网络），得到训练神经网络；利用训练神经网络处理特征点云数据，得到每个特征点云的像素分类类别，得到特征点云分类集。

特征分类处理的操作还可以为：特征点云数据，依次经归一化处理、第一线性处理（可通过神经网络中的线性层实现）、第一非线性处理（可通过神经网络中的ReLU激活层实现）、参数丢失处理（可通过神经网络中的Dropout层实现）、第二线性处理（可通过神经网络中的线性层实现）、第二非线性处理（可通过神经网络中的ReLU激活层实现）后，得到第一特征点云数据；获取第一特征点云数据中，每个第一特征点云的像素值与标准分类像素数据中标准分类像素的近似值，若近似值超过阈值，将对应标准分类像素的分类结果，作为对应第一特征点云的像素分类类别；所有第一特征点云，以及每个第一特征点云对应的像素分类类别，形成了特征点云分类集。

具体为，将特征点云数据进行归一化处理、若干线性处理、参数丢失处理和若干非线性处理后，得到能够增强特征表达能力的第一特征点云数据；接着根据标准分类像素数据中的像素分类表，将第一特征点云数据中的每个第一特征点云的像素，与像素分类表上的标准分类像素进行对比匹配，获得相似度值作为近似值；如果近似值超过了预设的阈值了，证明该第一特征点云的像素与对应标准分类像素特征相似，此时将对应标准分类像素的分类结果，作为对应第一特征点云的像素分类类别；所有第一特征点云执行完上述的像素值对比匹配，得到各自的像素分类类别；最后，所有的第一特征点云，以及每个第一特征点云对应的像素分类类别，形成了特征点云分类集。

若超过了阈值的近似值不止一个，则将与目标第一特征点云坐标位置最接近的邻居第一特征点云的像素分类类别，作为目标第一特征点云的像素分类类别。

特征分类处理的损失函数为：

，

其中，N为特征点云总数，C为类别数，p _i,c表示第i个特征点云的预测分类概率，预测正确则y _i,c为1，否则为0。

为提高检测的准确度，将基于所述特征点云分类集，对初始点云数据进行分类特征补充，由此可以在保留初始点云数据的原始信息的基础上加上点云的分类信息，提升目标的点云数据信息丰富度。具体为，将特征点云分类集中，每个特征点云的像素分类类别，沿通道维度，作为额外特征与对应初始点云的的坐标信息、像素信息组合后，形成了对应初始点云的复合信息，对应初始点云转化为了复合点云；所有复合点云，形成了复合点云数据。

S3、对复合点云数据进行体素划分处理，得到同一体素内多个复合点云的多体素数据；多体素数据经特征信息聚合处理，得到聚合多体素数据；聚合多体素数据经特征卷积处理，得到二维特征图。

为提高复合点云数据的区域局部特征，将复合点云数据进行体素划分处理后，在进行特征信息聚合处理，最后经特征卷积处理，将三维的复合点云数据转化为便于识别和跟踪检测的二维特征图。

体素划分处理的操作之前，还包括随机删除复合点云数据中，属性为背景点的部分复合点云，使点云数量缩减为12384个，得到的简化复合点云数据，用于执行体素划分处理的操作，以此提高计算效率。

基于预设的单位体素体积，对复合点云数据或简化复合点云数据进行体素划分，每个体素内含有多个复合点云，所有的体素形成了多体素数据。

为提高复合点云数据的空间区域局部特征，将多体素数据中的复合点云进行特征信息聚合处理。

特征信息聚合处理的操作可以为：将多体素数据中，每个体素内，坐标值最接近体素几何中心的复合点云，作为复合点云中心；将每个体素内的复合点云中心，与预设邻域范围内，同一体素内的其他复合点云，进行信息聚合，得到高维特征映射的聚合体素数据；所有的聚合体素数据，形成了聚合多体素数据。同一体素内，不同复合点云数据的信息聚合，可以增强单个体素的内部空间表达能力。

特征信息聚合处理的操作还可以为：将多体素数据中，每个体素内，坐标值最接近体素几何中心的复合点云，作为复合点云中心；将每个体素内的复合点云中心，与预设邻域范围内的，其他体素内的复合点云，进行信息聚合，得到高维特征映射的聚合体素数据；所有的聚合体素数据，形成了聚合多体素数据。不同同，不同复合点云数据的信息聚合，可以增强整个体素的整体空间表达能力。

最后，将聚合多体素数据进行特征卷积处理，得到便于处理的二维特征图。

特征卷积处理的操作可通过稀疏卷积实现，可优选正则稀疏卷积，正则稀疏卷积为现有技术，为节省篇幅，因此不在此过度叙述。

特征卷积处理的操作还可以通过多次普通卷积和下采样组合处理实现，将三维的聚合多体素数据映射成为二维特征图。

S4、基于特征点云分类集中的前景点信息，对二维特征图进行类别感知高斯掩码分配处理，得到特征权重分布图；特征权重分布图与二维特征图相乘，得到待检特征图。

基于前景点，对二维特征图进行类别感知高斯掩码分配处理，得到能够反映目标特征重要性的二维特征图的权重分布图；权重分布图与二维特征图进行相乘，得到便于语义特征提取的待检特征图。

类别感知高斯掩码分配处理的操作为：二维特征图中，分别以每个前景点为中心，每个前景点对应掩码半径为搜索半径，对搜索范围内的点进行权重值分配，得到的所有初始权重值分布图，形成了初始权重值分布图集；将初始权重值分布图集中，同一个点在不同初始权重值分布图上的多个权重值的乘积或平均值，作为对应点的特征权重，得到特征权重分布图。

具体为，以二维特征图中每个前景点为中心，设置类别感知高斯掩码，并分配相应权重，可得到以不同前景点为中心的不同初始权重分布图，形成了初始权重值分布图集；接着，将不同初始权重分布图中，同一个点的多个初始权重，进行相乘或求平均值，得到的新的权重值，作为该点的特征权重，由此得到一个特征权重分布图。初始权重分配时，以前景点中心，权重从中心至搜索范围边缘，呈梯度式递减，中心处的权重为1。

其中，对于被分类为“车辆”的前景点，掩码半径为20像素；对于被分类为“自行车”的前景点，掩码半径为10像素；对于被分类为“行人”的前景点，掩码半径为5像素。

最后，将特征权重分布图中的权重，与二维特征图中对应位置处的点的像素进行相乘，得到待检特征图。

S5、待检特征图经语义分割处理，得到分类检测结果。

语义分割处理的操作可以为：待检特征图经边界框回归处理和分类概率处理，得到分类检测框区域集；获取分类检测框区域集中，同一检测区域内，不同检测框与真实框的交并比，将交并比最大值对应的检测框，作为目标检测框；将目标检测框中，分类概率最大值对应的分类结果，作为分类检测结果。边界框回归处理为现有技术，为节省篇幅，因此不在此过多叙述。

语义分割处理的操作可以为：待检特征图经边缘检测处理，得到多地物待测图；获取多地物待测图中，每个待检地物的置信度（待检地物与真实地物的相似程度），将置信度最大值对应的分类结果，作为对应待检地物的分类检测结果，得到的多地物待测图的分类结果，作为上述的分类检测结果。边缘检测处理为现有技术，为节省篇幅，因此不在此过多叙述。

语义分割的操作还可以为：将设计好的锚框映射至待检特征图上，并依据待检特征图的尺寸比例进行锚框的缩放，以适应待检特征图空间尺寸大小。对于每个位置存在的多个锚框，使用非极大值抑制去除重叠的目标框，最终保留的唯一锚框与真实目标框相比较，进行标签分配操作，最终输出表示目标位置的锚框向量以及表示目标类别的标签向量，作为分类检测结果。其中，待检特征图中，车辆的锚框尺寸（长、宽、高）为[3.9, 1.6,1.56]，自行车的锚框尺寸为[1.76, 0.6, 1.73]，行人的锚框尺寸为[0.8, 0.6, 1.73]。

本实施例还提供了一种基于前景点筛选的三维目标检测系统，包括：

特征点云数据生成模块，用于获取目标的初始点云数据，初始点云数据经特征提取处理，得到特征点云数据；

复合点云数据生成模块，用于将特征点云数据中，每个特征点云进行特征分类处理，得到的所有特征点云，以及每个特征点云对应的像素分类类别，形成了特征点云分类集；基于特征点云分类集，对初始点云数据进行分类特征补充，得到复合点云数据；

二维特征图生成模块，用于对复合点云数据进行体素划分处理，得到同一体素内多个复合点云的多体素数据；多体素数据经特征信息聚合处理，得到聚合多体素数据；聚合多体素数据经特征卷积处理，得到二维特征图；

待检特征图生成模块，用于基于特征点云分类集中的前景点信息，对二维特征图进行类别感知高斯掩码分配处理，得到特征权重分布图；特征权重分布图与二维特征图相乘，得到待检特征图；

分类检测结果生成模块，用于待检特征图经语义分割处理，得到分类检测结果。

本实施例还提供了一种基于前景点筛选的三维目标检测设备，包括处理器和存储器，其中，处理器执行存储器中保存的计算机程序时实现上述的基于前景点筛选的三维目标检测方法。

本实施例还提供了一种计算机可读存储介质，用于存储计算机程序，其中，计算机程序被处理器执行时实现上述的基于前景点筛选的三维目标检测方法。

本实施例提供的一种基于前景点筛选的三维目标检测方法，通过将目标的初始点云数据进行特征提取和分类后，得到初始点云分类结果；接着，将初始点云分类结果与初始点云的坐标信息、像素信息结合，在保留点云原始数据的基础上，进一步增加了点云数据的特征丰富性；然后，将特征丰富的复合点云数据进行体素化、信息聚合和特征卷积，得到空间特征表达能力较高的二维特征图；最后，利用初始点云分类结果中的前景点信息，引导体素进行特征表达，增强与目标的相关特征，将得到的待检特征图进行语义分割处理，实现高效准确的目标检测。

Claims

1.一种基于前景点筛选的三维目标检测方法，其特征在于，包括如下操作：

S5、所述待检特征图经语义分割处理，得到分类检测结果。

2.根据权利要求1所述的基于前景点筛选的三维目标检测方法，其特征在于，所述S1中特征提取处理的操作具体为：

将所述初始点云数据进行空间距离划分处理，得到的所有点云区域形成了点云区域集；

将所述点云区域集中，每个点云区域内的所有初始点云，转化为一个点云特征向量，得到的所有点云特征向量形成了点云特征向量集；

将所述点云特征向量集中，每个点云特征向量与对应初始点云进行信息聚合处理，得到的所有信息聚合点云形成了所述特征点云数据。

3.根据权利要求1所述的基于前景点筛选的三维目标检测方法，其特征在于，所述S2中特征分类处理的操作具体为：

所述特征点云数据，依次经归一化处理、第一线性处理、第一非线性处理、参数丢失处理、第二线性处理、第二非线性处理，得到第一特征点云数据；

获取所述第一特征点云数据中，每个第一特征点云的像素值与标准分类像素数据中标准分类像素的近似值，若所述近似值超过阈值，将对应标准分类像素的分类结果，作为对应第一特征点云的像素分类类别；

所有第一特征点云，以及每个第一特征点云对应的像素分类类别，形成了特征点云分类集。

4.根据权利要求1所述的基于前景点筛选的三维目标检测方法，其特征在于，所述S3中特征信息聚合处理的操作具体为：

将所述多体素数据中，每个体素内，坐标值最接近体素几何中心的复合点云，作为复合点云中心；

将每个体素内的复合点云中心，与预设邻域范围内，同一体素内的其他复合点云，进行信息聚合，得到聚合体素数据；

所有的聚合体素数据，形成了所述聚合多体素数据。

5.根据权利要求1所述的基于前景点筛选的三维目标检测方法，其特征在于，所述S4中类别感知高斯掩码分配处理的操作具体为：

所述二维特征图中，分别以每个前景点为中心，每个前景点对应掩码半径为搜索半径，对搜索范围内的点进行权重值分配，得到的所有初始权重值分布图，形成了初始权重值分布图集；

将初始权重值分布图集中，同一个点在不同初始权重值分布图上的多个权重值的乘积，作为对应点的特征权重，得到所述特征权重分布图。

6.根据权利要求1所述的基于前景点筛选的三维目标检测方法，其特征在于，所述S5中语义分割处理的操作具体为：

所述待检特征图经边界框回归处理和分类概率处理，得到分类检测框区域集；

获取所述分类检测框区域集中，同一检测区域内，不同检测框与真实框的交并比，将交并比最大值对应的检测框，作为目标检测框；

将所述目标检测框中，分类概率最大值对应的分类结果，作为所述分类检测结果。

7.根据权利要求1所述的基于前景点筛选的三维目标检测方法，其特征在于，所述S3的体素划分处理的操作之前，还包括删除所述复合点云数据中，属性为背景点的部分复合点云，得到的简化复合点云数据，用于执行所述体素划分处理的操作。

8.一种基于前景点筛选的三维目标检测系统，其特征在于，包括：

9.一种基于前景点筛选的三维目标检测设备，其特征在于，包括处理器和存储器，其中，所述处理器执行所述存储器中保存的计算机程序时实现如权利要求1-7任一项所述的基于前景点筛选的三维目标检测方法。

10.一种计算机可读存储介质，其特征在于，用于存储计算机程序，其中，所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的基于前景点筛选的三维目标检测方法。