WO2022252274A1

WO2022252274A1 - 基于PointNet网络点云分割及虚拟环境生成方法和装置

Info

Publication number: WO2022252274A1
Application number: PCT/CN2021/099276
Authority: WO
Inventors: 姚寿文; 兰泽令; 王瑀; 栗丽辉; 孔若思
Original assignee: 北京理工大学
Priority date: 2021-05-31
Filing date: 2021-06-10
Publication date: 2022-12-08
Also published as: CN113256640B; CN113256640A

Abstract

本发明公开一种基于PointNet网络点云分割及虚拟环境生成方法和装置，包括：获取虚拟环境中待处理数据集中的点云；采用改进的PointNet网络对所述点云进行点云语义分割；根据语义分割后的点云，在虚拟环境中将物体替换为具有物理属性的虚拟模型，生成包含所有物理属性的虚拟对象。采用本发明的技术方案，以解决由于点云数量庞大，使得实时数据传输及环境重建变得比较困难，且在点云环境中，操作者对环境中的物体辨别困难的问题。

Description

基于PointNet网络点云分割及虚拟环境生成方法和装置

技术领域

本发明属于虚拟呈现技术领域，尤其涉及一种基于PointNet网络点云分割及虚拟环境生成方法和装置。

背景技术

随着传感器技术的发展，基于激光雷达、深度相机等传感器被广泛应用于自动驾驶、远程操作及虚拟现实等领域。由于三维深度信息能够捕获环境的深度信息，因此基于三维点云数据的环境呈现对于操作者理解周围环境(譬如，车辆周围环境)有很大的帮助。通过点云进行三维环境重构可以提高操作者对环境的感知能力，但由于点云数量庞大，使得实时数据传输及环境重建变得比较困难，且在点云环境中，操作者对环境中的物体可能会出现辨别困难的情况。

发明内容

本发明针对以上技术问题是，提供一种基于PointNet网络点云分割及虚拟环境生成方法和装置。

为实现上述目的，本发明采用如下的技术方案：

一种基于PointNet网络点云分割及虚拟环境生成方法，包括：

步骤S1、获取虚拟环境中待处理数据集中的点云；

步骤S2、采用改进的PointNet网络对所述点云进行点云语义分割；

步骤S3、根据语义分割后的点云，在虚拟环境中将物体替换为具有物理属性的虚拟模型，生成包含所有物理属性的虚拟对象。

作为优选，所述数据集为三栋建筑物中的六个室内场景，共有十一种房间类型，分别为会议室、休息室、礼堂、厕所、复印室、休息室、存储室、走廊、储藏室、办公室、大堂以及开放空间；数据集的语义类别分别为天花板、椅子、门、地板、桌子、墙、梁、柱、窗、沙发、书架、木板、杂物；数据集中的点云包含坐标位置信息XYZ和颜色信息RGB。

作为优选，所述PointNet网络的结构如图2所示，包括：第一 T-Net层、第二T-Net层、多个感知机MLP以及特征融合层。

作为优选，改进的PointNet网络结构分为特征提取和点云语义分割两个部分，其中，

所述特征提取过程为：通过对点云局部特征的提取实现全局特征提取，具体为：获取n个点云的d维特征，其包含空间坐标值、色彩信息以及点的法线信息；通过不断地对点云的局部特征进行分类和学习，最终经过最大池化处理获得全局特征的提取；

所述点云语义分割过程为：将所述局部特征与所述全局特征进行拼接，并通过多层的MLP进行降维处理，最终对点云的类别做出预测，从而实现点云的分割。

作为优选，通过改进的PointNet网络结构实现点云语义分割包括以下步骤：

步骤21、通过第一T-Net层对待处理数据集中点云进行位置对齐；

步骤22、通过MLP将点云局部特征的维度从3维升到64维；

步骤23、通过第二T-Net层对点云进行特征对齐；

步骤24、通过MLP将点云局部特征的维度从64维升至128维，再升为1024维；

步骤25、通过最大值对称函数对点云进行池化处理，获得点云全局特征；

步骤26、通过特征融合层将点云全局特征与点云局部特征进行拼接；

步骤27、通过MLP对拼接后的点云特征进行降维处理，实现点云的语义分割。

作为优选，提取点云局部特征的过程为：获取点云的空间位置信息及点云个数n、维度d后；对点云进行最远点采样，对得到的多个中心点云进行索引，获得其位置信息及点云个数；通过球查询方法以所述中心点云为圆心，对所有点云进行分组，并提取点云局部特征。

作为优选，对点云进行最远点采样具体为：随机初始化一个点作为最远点，在取得其空间位置坐标后，比较剩余所有点与当前点的欧式距离，取得距离最远的点的坐标及距离，并将距离值存储至距离distance矩阵中，之后将取得的点作为查询点，计算每个剩余点到当前点的距离，并取得最大值，重复此步骤后，直到采样到i个最远点。

作为优选，所述球查询的方法对点云进行分组具体为：计算经过采样之后确定的S个中心点与所有点之间的欧氏距离L，并设定距离阈值R，选取与中心点距离为R的球形区域中的点云，若L＜R ²,则保留对应的点M，若M的值小于所需的点云数NS，则取最大距离时的点，补充NS-M个点，满足所需的点云个数，之后进行特征提取。

本发明提供一种基于PointNet网络点云分割及虚拟环境生成装置，包括：

获取模块，用于获取虚拟环境中待处理数据集的点云；

分割模块，用于采用PointNet网络对所述点云进行点云语义分割；

生成模块，用于根据分割后的点云，在虚拟环境中将物体替换为具有物理属性的虚拟模型，生成包含所有物理属性的虚拟对象。

本发明以PointNet神经网络模型为基础，设计点云分割处理算法，考虑局部点云特征的提取，以实现对点云的语义分割处理。对点云数据集进行扩展，将设计的神经网络模型在扩展后的数据集上进行训练，针对分割结果进行分析，同时将点云分割结果传输至虚拟环境中，实现点云对应目标物体在虚拟环境中的模型生成。以解决由于点云数量庞大，使得实时数据传输及环境重建变得比较困难，且在点云环境中，操作者对环境中的物体可能会辨别困难的问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为基于PointNet网络点云分割及虚拟环境生成方法流程图；

图2为PointNet网络的结构示意图；

图3为T-Net变换流程的示意图；

图4为PointNet网络的结构框架示意图；

图5为局部点云特征提取的流程示意图；

图6为最远点采样流程示意图；

图7为球查询流程示意图；

图8为局部点云特征提取示意图；

图9为虚拟环境中目标物体(室内场景)模型生成示意图。

具体实施方式

以下实施例会结合附图对本发明进行详述，在附图或说明中，相似或相同的部分使用相同的标号，并且在实际应用中，各部件的形状、厚度或高度可扩大或缩小。本发明所列举的各实施例仅用以说明本发明，并非用以限制本发明的范围。对本发明所作的任何显而易知的修饰或变更都不脱离本发明的精神与范围。

如图1所示，本发明提供一种基于PointNet网络点云分割及虚拟环境生成方法，包括：

步骤S1、获取虚拟环境中待处理数据集中的点云；

进一步，所述数据集为三栋建筑物中的六个不同的大型室内场景，共有十一种房间类型，分别为会议室、休息室、礼堂、厕所、复印室、休息室、存储室、走廊、储藏室、办公室、大堂以及开放空间。数据集的语义类别共有十三种，分别为天花板、椅子、门、地板、桌子、墙、梁、柱、窗、沙发、书架、木板、杂物。数据集中的点云包含坐标位置信息XYZ和颜色信息RGB。

进一步，步骤S2中，所述PointNet网络的结构如图2所示，包括：第一T-Net层、第二T-Net层、多个感知机(Multilayer Perception，MLP)以及特征融合层。

通过PointNet网络实现点云语义分割包括以下步骤：

步骤22、通过MLP将点云局部特征的维度从3维升到64维；

步骤23、通过第二T-Net层对点云进行特征对齐；

在PointNet网络结构中，共有两个T-Net层，即第一T-Net层和第二T-Net层，第一T-Net层位于点云输入之后，对输入的点云进行位置对齐，使点云具有刚体不变性。第二T-Net层位于第一个MLP之后，是对经过MLP之后的点云进行特征对齐。首先通过T-Net层获得一个变换矩阵(Transformation matrix)，并与输入的点云矩阵集进行矩阵相乘，从而获得变换后的对齐数据，如图3所示，其中，d为点云数据的维度。对于第一T-Net层而言，输入数据为点云空间矩阵，输出为对齐后的点云空间矩阵，当输入的点云只包含空间位置信息时，d为3；若包含彩色信息时，d为6，第一T-Net层的矩阵为3*3或6*6矩阵。对于第二T-Net网络，输入数据为经过MLP的高维点云特征矩阵，输出为对齐后的点云特征矩阵，由于经过多层感知机MLP结构，因此点云的维度从3变为64，第一T-Net层的矩阵为64*64矩阵。T-Net实际上就是小型的PointNet网络结构，其内部网络结构与PointNet的结构一样，只是最终的输出结果为变换矩阵，便于后续的操作过程。

PointNet中MLP作用是对点云数据进行升维处理，以尽最大可能在之后的点云处理及分割中保证最大数量的点云特征。与传统的MLP层结构不同，在PointNet网络中MLP层中所有神经元的权重为同一值。由于点云具有无序性，对于一个具有n个点的点云，点云的输入方式共有n种排列，因此需要求模型对于n种排列方式输出的结果相同。PointNet网络通过最大值对称函数实现此功能，输出结果为点云的特征，如下式所示，

f({x ₁,…x _n})≈g(h(x ₁),…h(x _n))

其中，f表示提取特征的函数，h表示每层MLP的特征提取层，g为最大值对称函数。

在经过特征提取后，PointNet网络得到一个具有1024维的全局特征，为了获得更高的点云分割精度，特征融合层将全局特征与指定的64维点特征进行拼接融合，从而得到一个基于局部与全局特征的新特征，之后通过多层MLP网络获得对点云类别的预测。

如图4所示，PointNet网络结构分为特征提取和点云语义分割。特征提取为通过对点云局部特征的提取实现全局特征提取的过程，输入为n个点云的d维特征，其中，d维为点云的原始特征，包括空间坐标值、色彩信息以及点的法线信息；通过不断地对点云的局部特征进行分类和学习，最终经过最大池化处理获得全局特征的提取。点云语义分割将特征提取中的中间特征(局部特征)与最后得到的全局特征进行拼接，并通过多层的MLP进行降维处理，最终对点云的类别做出预测，从而实现点云的分割。

如图5所示，在获得输入点云的空间位置信息xyz及原始信息如点云个数n、维度d后，首先对点云进行最远点采样，对得到的多个中心点云进行索引，获得其位置信息new_xyz及点云个数new_n，之后通过球查询的方法以得到的中心点云为圆心，对所有输入点云进行分组，并进行局部点云特征的提取，获得nSample个特征信息，当出现新的特征维度时，对特征进行拼接，以尽最大可能保留点云的特征。

首先对输入的点云进行分组，即采样，与随机采样相比，最远点采样对整个点集的覆盖性较好。因此本文通过最远点(farthest point sampling，FPS)采样的方式选取点云中心点，最终取得的中心点个数即为分组个数，使得点云中的点建立一定的相互联系。具体做法为首先从整个点集中先随机选取一个中心i作为最远点并获得该点的坐标值，之后比较所有点到该中心点的欧氏距离，取得距离最大值的点，并将所得的点存入distance矩阵，比较所有点云与矩阵中存储的点的距离，若某一点的距离小于矩阵中已存储的点的距离，则对矩阵中的点进行更新，以确保矩阵中存储的点是每个点到采样点的距离最近值，之后再次选取距离最大的点，再次进行迭代，直到采集完目标点为止，如图6所示。

在输入的点云中，随机初始化一个点作为最远点，在取得其空间位置坐标后，比较剩余所有点与当前点的欧式距离，取得距离最远的点的坐标及距离，并将距离值存储至距离distance矩阵中，之后将取得的点作为查询点，计算每个剩余点到当前点的距离，并取得最大值，重复此步骤后，直到采样到i个最远点。

当完成对中心点个数的选取后，需要完成每组内的点云分组选取过程，以确定每组点云所包含的点云数，主要有K近邻搜索及球查询两种方法。K近邻搜索是一种机器学习方法，根据此方法能够找到K个数量的相邻点以完成点云分组，球查询是在设置查询点数上限的前提下，根据设定的半径范围，在查询点周围对点进行查找。与K近邻搜索方法相比，球查询的局部邻域确保了固定范围的区域尺寸，使局部区域的特征在整个空间中更具有通用性，因此本发明采用球查询的方式对点云进行分组，如图7所示。对于输入的点云，首先计算经过采样之后确定的S个中心点与所有点之间的欧氏距离L，并设定距离阈值R，选取与中心点距离为R的球形区域中的点云，若L＜R ²,则保留对应的点M，若M的值小于所需的点云数NS，则取最大距离时的点，补充NS-M个点，满足所需的点云个数，之后进行特征提取。

对输入的点云数据进行全局特征提取是进行点云分割时的一个重要步骤，在上一节中通过最远点采样和球查询完成对点云的分组之后，需要计算局部点云的全局特征，并通过对分组之后得到的点进行再分组，再学习，继而实现对所有输入点云的全局特征提取。

在此过程中，对分组之后的局部点云数据进行特征提取是关键步骤。网络中的输入为经过分组之后每一组的全部点云信息，即将每一个分组后的点云都看为一个整体，对每一组点云进行全局特征的提取，此步骤与PointNet结构中对整体点云进行特征提取的步骤一样，因此本发明中对局部点云的特征提取思路借鉴PointNet网络结构中的思路，具体为：

令

f为对于任意的χ→R上的点云特征距离连续函数，对于

任意一个连续函数h和一个对称函数g(x ₁,x ₂,x ₃,…,x _n)，使得对

有，

|f(S)-γ(MAX{h(x _i)})|＜ε

其中，x ₁,x ₂,x ₃,…,x _n是S中的全部元素，γ为连续函数，MAX表示进行max pooling操作，即输入n个向量，输出一个每个元素最大的新向量。

在PointNet网络结构中，连续函数h通过多层感知机MLP进行拟合，γ函数则为激活函数，如图8所示。输入的数字为点云的三维坐标信息(x,y,z)，之后通过MLP将输入的点云从三维转为高维，然后经过最大值对称函数g与γ激活函数的处理，从而提取局部的点云特征。

语义分割是指将每个点云对应的物体类别分割出来，以对点云环境中的物体进行辨别。在语义分割中；首先，对得到的点云全局特征使用多层感知机MLP进行降维处理；然后，通过softmax函数对点云进行分类，获得每个点在每个类别的概率分数；最后，进行标签分类，实现点云的语义分割处理。

进一步，步骤S3中，由于点云庞大的数据量会增加数据传输和处理的负担，因此，在采用改进的PointNet网络对点云进行分割识别之后，根据点云数据，在虚拟环境中将物体替换为具有物理属性的虚拟模型，以更好的对周围环境进行表示，如图9所示。

本发明还提供一种基于PointNet网络点云分割及虚拟环境生成装置，实现上述基于PointNet网络点云分割及虚拟环境生成方法，包括：

获取模块，用于获取虚拟环境中待处理数据集的点云；

进一步，所述数据集为三栋建筑物中的六个室内场景，共有十一种房间类型，分别为会议室、休息室、礼堂、厕所、复印室、休息室、存储室、走廊、储藏室、办公室、大堂以及开放空间；数据集的语义类别分别为天花板、椅子、门、地板、桌子、墙、梁、柱、窗、沙发、书架、木板、杂物；数据集中的点云包含坐标位置信息XYZ和颜色信息RGB。

本发明具有以下有益效果：

(1)、本发明解决由于点云数量庞大，使得实时数据传输及环境重建变得比较困难，且在点云环境中，操作者对环境中的物体辨别困难的问题。

(2)、针对点云处理的难点与挑战，基于PointNet网络结构模型，设计深度学习的点云分割网络模型，实现对采集的点云数据直接进行分割处理，而不需在处理之前对点云数据进行转换。首先对点云进行分组采样处理，之后得到点云的局部特征，再对点云进行全局特征提取，最终实现点云的语义分割处理，通过对网络模型进行训练，提升了深度学习点云分割的处理精度。

(3)、为了包含更多的物体类别，本发明对数据集进行了扩展，丰富了物体类别。同时研究了虚拟环境下基于点云分割结果的物体模型呈现方法，将分割后的物体类型及对应空间坐标传输至虚拟环境中，通过调用虚拟环境中的已建立的模型库，将点云对应的物体模型呈现至虚拟环境中，实现了虚拟环境中物体模型的显示方式。

应当理解，虽然本说明书按照实施方式加以描述，但并非每个实施方式仅包含一个独立的技术方案，说明书的这种叙述方式仅仅是为清楚起见，本领域技术人员应当将说明书作为一个整体，各实施例中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。

Claims

一种基于PointNet网络点云分割及虚拟环境生成方法，其特征在于，包括：

步骤S1、获取虚拟环境中待处理数据集中的点云；

步骤S2、采用改进的PointNet网络对所述点云进行点云语义分割；

步骤S3、根据语义分割后的点云，在虚拟环境中将物体替换为具有物理属性的虚拟模型，生成包含所有物理属性的虚拟对象。
如权利要求1所述的基于PointNet网络点云分割及虚拟环境生成方法，所述数据集为三栋建筑物中的六个室内场景，共有十一种房间类型，分别为会议室、休息室、礼堂、厕所、复印室、休息室、存储室、走廊、储藏室、办公室、大堂以及开放空间；数据集的语义类别分别为天花板、椅子、门、地板、桌子、墙、梁、柱、窗、沙发、书架、木板、杂物；数据集中的点云包含坐标位置信息XYZ和颜色信息RGB。
如权利要求1素所述的基于PointNet网络点云分割及虚拟环境生成方法，其特征在于，所述PointNet网络包括：第一T-Net层、第二T-Net层、多个感知机MLP以及特征融合层。
如权利要求1素所述的基于PointNet网络点云分割及虚拟环境生成方法，其特征在于，PointNet网络结构分为特征提取和点云语义分割两个部分，其中，

所述特征提取过程为：通过对点云局部特征的提取实现全局特征提取，具体为：获取n个点云的d维特征，其包含空间坐标值、色彩信息以及点的法线信息；通过不断地对点云的局部特征进行分类和学习，经过最大池化处理获得全局特征的提取；

所述点云语义分割过程为：将所述局部特征与所述全局特征进行拼接，并通过多层的MLP进行降维处理，最终对点云的类别做出预测，从而实现点云的分割。
如权利要求3素所述的基于PointNet网络点云分割及虚拟环境生成方法，其特征在于，通过改进的PointNet网络结构实现点云语义分割包括以下步骤：

步骤21、通过第一T-Net层对待处理数据集中点云进行位置对齐；

步骤22、通过MLP将点云局部特征的维度从3维升到64维；

步骤23、通过第二T-Net层对点云空间进行特征对齐；

步骤24、通过MLP将点云局部特征的维度从64维升至128维，再升为1024维；

步骤25、通过最大值对称函数对点云进行池化处理，获得点云全局特征；

步骤26、通过特征融合层将点云全局特征与点云局部特征进行拼接；

步骤27、通过MLP对拼接后的点云特征进行降维处理，实现点云的语义分割。
如权利要求4所述的基于改进的PointNet网络点云分割及虚拟环境生成方法，其特征在于，提取点云局部特征的过程为：获取点云的空间位置信息及点云个数n、维度d后；对点云进行最远点采样，对得到的多个中心点云进行索引，获得其位置信息及点云个数；通过球查询方法以所述中心点云为圆心，对所有点云进行分组，并提取点云局部特征。
如权利要求6所述的基于改进的PointNet网络点云分割及虚拟环境生成方法，其特征在于，对点云进行最远点采样具体为：随机初始化一个点作为最远点，在取得其空间位置坐标后，比较剩余所有点与当前点的欧式距离，取得距离最远的点的坐标及距离，并将距离值存储至距离distance矩阵中，之后将取得的点作为查询点，计算每个剩余点到当前点的距离，并取得最大值，重复此步骤后，直到采样到i个最远点。
如权利要求7所述的基于改进的PointNet网络点云分割及虚拟环境生成方法，其特征在于，所述球查询的方法对点云进行分组具体为：计算经过采样之后确定的S个中心点与所有点之间的欧氏距离 L，并设定距离阈值R，选取与中心点距离为R的球形区域中的点云，若L＜R ²,则保留对应的点M，若M的值小于所需的点云数NS，则取最大距离时的点，补充NS-M个点，满足所需的点云个数，之后进行特征提取。
一种基于PointNet网络点云分割及虚拟环境生成装置，其特征在于，包括：

获取模块，用于获取虚拟环境中待处理数据集的点云；

分割模块，用于采用改进的PointNet网络对所述点云进行点云语义分割；

生成模块，用于根据分割后的点云，在虚拟环境中将物体替换为具有物理属性的虚拟模型，生成包含所有物理属性的虚拟对象。
如权利要求9所述的基于PointNet网络点云分割及虚拟环境生成装置，其特征在于，所述数据集为三栋建筑物中的六个室内场景，共有十一种房间类型，分别为会议室、休息室、礼堂、厕所、复印室、休息室、存储室、走廊、储藏室、办公室、大堂以及开放空间；数据集的语义类别分别为天花板、椅子、门、地板、桌子、墙、梁、柱、窗、沙发、书架、木板、杂物；数据集中的点云包含坐标位置信息XYZ和颜色信息RGB。