CN111444811B

CN111444811B - 一种三维点云目标检测的方法

Info

Publication number: CN111444811B
Application number: CN202010207425.5A
Authority: CN
Inventors: 冯建峰; 杜量
Original assignee: Fudan University
Current assignee: Fudan University
Priority date: 2020-03-23
Filing date: 2020-03-23
Publication date: 2023-04-28
Anticipated expiration: 2040-03-23
Also published as: CN111444811A

Abstract

本发明公开了一种三维点云目标检测的方法，包括以下步骤：通过深度传感器和图像传感器获取三维场景的点云信息作为神经网络的训练数据集,利用计算机渲染的目标点云模型补全场景中目标由于视角遮挡和远距离缺失的点云，作为虚拟训练数据集，搭建两个三维目标检测网络，一个用于输入真实数据，一个用于输入虚拟数据,将真实的三维场景点云数据和虚拟的三维场景点云数据分别输入各自的点云特征编码网络进行特征提取；本发明模拟了这种联想感知的过程，并将其运用到了深度神经网络中，通过迁移学习技术将真实场景中不完整的点云信息编码特征域迁移到虚拟的完整点云信息编码特征域中，使神经网络能够主动将不完整的点云关联到完整的点云。

Description

一种三维点云目标检测的方法

技术领域

本发明涉及计算机视觉技术领域，具体为一种三维点云目标检测的方法。

背景技术

现如今，三维目标检测在自主驾驶和机器人场景感知方面应用的最为广泛且十分重要。

但是，现有技术中存在以下缺点：

1、通过激光雷达、深度相机和双目相机获取三维场景的点云数据用于目标检测，但随着目标到深度传感器距离的增加，点云的密度会急剧下降，导致了巨大的密度变化，此外由于遮挡，目标的某些部分可能是不可见的，导致了同一类别的目标点云有巨大的分布差距，综上，由于点云的表征形式差异过大，三维目标检测结果很容易出错；

2、目前的目标检测算法通常基于深度神经网络，随着人工智能的不断发展，深度神经网络以其精度高，鲁棒性强的优势，被广泛运用于自动驾驶领域的大多数任务中，深度神经网络在二维目标检测领域的性能远超其他类型的算法，这是由于二维图像不存在三维点云稀疏性和不规则性的问题，但是正是因为这些三维点云的表征问题，导致了三维目标检测算法对远距离和被遮挡的点云检测性能不佳。

发明内容

针对现有技术的不足，本发明提供了一种三维点云目标检测的方法，解决了背景技术中提到的问题。

为实现以上目的，本发明通过以下技术方案予以实现：一种三维点云目标检测的方法，包括以下步骤：

S1、通过深度传感器和图像传感器获取三维场景的点云信息作为神经网络的训练数据集；

S2、利用计算机渲染的目标点云模型补全场景中目标由于视角遮挡和远距离缺失的点云，作为虚拟训练数据集，搭建两个三维目标检测网络，一个用于输入真实数据，一个用于输入虚拟数据；

S3、将步骤S1中真实的三维场景点云数据和步骤S2、中虚拟的三维场景点云数据分别输入各自的点云特征编码网络进行特征提取；

S4、将步骤S3中提取到的真实和虚拟场景的点云特征进行误差函数计算；

S5、将步骤S3中真实和虚拟的特征进行解码输出三维目标检测的预测结果，与真值结果进行误差函数计算；

S6、回传步骤S5和S6中的误差损失，更新权重训练网络，直至网络收敛完成训练。

进一步地，所述深度传感器为激光雷达，RGB-D深度相机，双面相机其中的一个，以获取场景三维坐标和颜色信息。

进一步地，所述计算机渲染的点云模型为CAD的点云模型或者从训练数据集中挑选出更为完整的点云模型，且从训练数据集中挑选出更为完整的点云模型作为虚拟模型，以补全或替换原有的不完整的点云模型。

进一步地，所述点云特征编码网络为利用神经网络对输入的数据或特征进行编码，以得到数据和特征更为高级抽象的编码；

对于离散稀疏的点云数据，一是首先体素化整个场景，再用稀疏卷积对这些体素进行编码得到高维特征，二是用神经网络直接对点进行编码得到高维特征。

进一步地，所述特征误差函数为两特征间的二范数。

本发明与现有技术相比具备以下有益效果：本发明模拟了这种联想感知的过程，并将其运用到了深度神经网络中，通过迁移学习技术将真实场景中不完整的点云信息编码特征域迁移到虚拟的完整点云信息编码特征域中，使神经网络能够主动将不完整的点云关联到完整的点云，生成补全缺失的特征信息。

附图说明

图1为本发明的方法流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1，本发明提供一种技术方案：一种三维点云目标检测的方法，包括以下步骤：

S1、通过深度传感器(深度传感器为激光雷达，RGB-D深度相机，双面相机其中的一个，以获取场景三维坐标和颜色信息)和图像传感器获取三维场景的点云信息(包括三维坐标和颜色信息)作为神经网络的训练数据集；

S2、利用计算机渲染的目标点云模型(车辆，行人等)补全场景中目标由于视角遮挡和远距离缺失的点云(计算机渲染的点云模型为CAD的点云模型或者从训练数据集中挑选出更为完整的点云模型，且从训练数据集中挑选出更为完整的点云模型作为虚拟模型，以补全或替换原有的不完整的点云模型)，作为虚拟训练数据集，搭建两个三维目标检测网络，一个用于输入真实数据(真实网络)，一个用于输入虚拟数据(虚拟网络)；

S3、将步骤S1中真实的三维场景点云数据和步骤S2、中虚拟的三维场景点云数据分别输入各自的点云特征编码网络(点云特征编码网络为利用神经网络对输入的数据或特征进行编码，以得到数据和特征更为高级抽象的编码)进行特征提取，对于离散稀疏的点云数据，一是首先体素化整个场景，再用稀疏卷积对这些体素进行编码得到高维特征，二是用神经网络直接对点进行编码得到高维特征；

S6、回传步骤S5和S6中的误差损失(特征误差函数为两特征间的二范数)，更新权重训练网络，直至网络收敛完成训练。

工作时，通过深度传感器和图像传感器获取三维场景的点云信息(包括三维坐标和颜色信息)作为神经网络的训练数据集，利用计算机渲染的目标点云模型(车辆，行人等)补全场景中目标由于视角遮挡和远距离缺失的点云，作为虚拟训练数据集，搭建两个三维目标检测网络，一个用于输入真实数据(真实网络)，一个用于输入虚拟数据(虚拟网络)，将真实的三维场景点云数据和步骤S2中虚拟的三维场景点云数据分别输入各自的点云特征编码网络进行特征提取，将提取到的真实和虚拟场景的点云特征进行误差函数计算，将真实和虚拟的特征进行解码输出三维目标检测的预测结果，与真值结果进行误差函数计算，回传误差损失，更新权重训练网络，直至网络收敛完成训练。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种三维点云目标检测的方法，其特征在于：包括以下步骤：

S6、回传步骤S4中的误差损失，更新权重训练网络，直至网络收敛完成训练；

所述计算机渲染的点云模型为CAD的点云模型或者从训练数据集中挑选出更为完整的点云模型，且从训练数据集中挑选出更为完整的点云模型作为虚拟模型，以补全或替换原有的不完整的点云模型；

所述点云特征编码网络为利用神经网络对输入的数据或特征进行编码，以得到数据和特征更为高级抽象的编码；

2.根据权利要求1所述的一种三维点云目标检测的方法，其特征在于：所述深度传感器为激光雷达，RGB-D深度相机，双面相机其中的一个，以获取场景三维坐标和颜色信息。

3.根据权利要求1所述的一种三维点云目标检测的方法，其特征在于：所述步骤S4中误差函数为两特征间的二范数。