CN112633330A

CN112633330A - 点云分割方法、系统、介质、计算机设备、终端及应用

Info

Publication number: CN112633330A
Application number: CN202011410671.7A
Authority: CN
Inventors: 张建龙; 方光祖; 王颖; 余鑫城; 刘池帅; 崔梦莹; 李桥; 何建辉; 郭鑫宇; 时国强
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2020-12-06
Filing date: 2020-12-06
Publication date: 2021-04-09
Anticipated expiration: 2040-12-06
Also published as: CN112633330B

Abstract

本发明属于计算机视觉技术领域，公开了一种点云分割方法、系统、介质、计算机设备、终端及应用，构建基于分层图Transformer的特征提取模块，包括基于图Transformer的特征下采样网络和特征上采样网络；搭建基于分层图Transformer的点云分割网络，使用带有权重的交叉熵损失函数，使用训练集对分层图Transformer点云分割网络进行有监督的训练，每轮训练根据损失值，调整网络参数，得到网络模型；使用训练好的网络模型对测试集中的点云进行预测，得到点云中每个点的分割结果。本发明丰富了点云的初始特征；图Transformer能够有效地提取点云邻域之间的关系；提高了点云分割的精度。

Description

点云分割方法、系统、介质、计算机设备、终端及应用

技术领域

本发明属于计算机视觉技术领域，尤其涉及一种点云分割方法、系统、介质、计算机设备、终端及应用。

背景技术

近年来，摄像机矩阵、激光雷达等采集设备的出现降低了3D点云数据的获取难度。而如何从大量的3D点云数据中获取有用的信息，解决场景理解中的问题，是目前计算机视觉研究的重要内容。基于3D点云数据的目标检测、分类、识别是当前解决场景理解的主要技术，而3D点云分割是这些技术的基础。

传统的点云分割技术主要基于非深度学习的方法，此类方法主要是对点云进行了简单的分割，每个物体并不含有特定的语义信息，需要后续人工进行语义标注，效率低下。为了简化分割结果需要人工标注的步骤，一种可以直接输出具有语义信息的分割点云的深度学习方法，变得极其重要。基于深度学习的方法主要有基于视图的方法，利用视图技术将3D点云转换为2D视图，从而应用图像中的卷积操作进行特征提取。基于体素化的方法，将点云数据转换到三维网格中，应用卷积神经网络提取特征，而体素分辨率的增大，会造成计算上的极大浪费。以上方法都需要利用手工提取点云特征，不能直接处理点云的原始数据。而Charles在2017年CVPR上提出PointNet模型，第一个直接对原始点云数据进行分割的端到端的深度神经网络模型。该方法利用对称函数解决点云的无序性，得到每个点的全局特征，但并没有考虑点的局部特征。后续他们又提出了一种改进的PointNet体系结构PointNet++，通过最远点采样得到局部区域的中心点，然后利用中心点构建局部区域，采用PointNet提取局部点集中的几何特征，并对它们进行分层聚合以进行推理，该方法较PointNet分割精度有所提升。

上述PointNet系列方法，可以直接处理原始点云数据，提高了点云分割的精度。但是PointNet++仍然独立地处理局部点集中的单个点，并没有考虑点对之间的关系，不能构建相对丰富的特征，导致分割精度不高。另外PointNet系列方法只能处理小规模数量的点云数据，对于一个大规模场景，需要将场景划分为多个均匀的区域，使得应用场景受到限制。

通过上述分析，现有技术存在的问题及缺陷为：

(1)现有PointNet系列方法没有考虑点对之间的关系，不能构建相对丰富的特征，导致分割精度不高。

(2)现有PointNet系列方法只能处理小规模数量的点云数据，对于一个大规模场景，需要将场景划分为多个均匀的区域，使得应用场景受到限制。

解决以上问题及缺陷的难度为：如何提升网络提取局部特征并考虑点对之间关系的能力以及如何处理更大规模的点云场景。

解决以上问题及缺陷的意义为：能够提升点云分割的精度，使得点云分割能够应用于实际的大规模3D场景，加快自动驾驶、机器人感知和增强现实等领域的发展。

发明内容

针对现有技术存在的问题，本发明提供了一种点云分割方法、系统、介质、计算机设备、终端及应用。

本发明是这样实现的，一种点云分割方法，所述点云分割方法构建基于分层图Transformer的特征提取模块，包括基于图Transformer的特征下采样网络和特征上采样网络，分层用于减少网络处理的数据，图Transformer提取点云邻域之间的关系；搭建基于分层图Transformer的点云分割网络，使用带有权重的交叉熵损失函数，用于解决不同类型点云数量的不平衡问题，使用训练集对分层图Transformer点云分割网络进行有监督的训练，每轮训练根据损失值，调整网络参数，得到网络模型；使用训练好的网络模型对测试集中的点云进行预测，得到点云中每个点的分割结果。

进一步，构建基于分层图Transformer的特征提取模块具体包括：

步骤一，构建基于图Transformer的特征下采样网络，该特征下采样网络包括n个级联的下采样模块，每个下采样模块包括依次级联的特征编码层、图Transformer特征提取层和采样分层层；

步骤二，构建特征上采样网络，该特征上采样网络包括依次级联的n个上采样模块，每个上采样模块包括依次级联的特征插值层和特征融合层。

进一步，所述构建基于图Transformer的特征下采样网络，该特征下采样网络包括n个级联的下采样模块，每个下采样模块包括依次级联的特征编码层、图Transformer特征提取层和采样分层层具体包括：

(1)构造特征编码层方式，采用K最近邻法将点云数据构造图的形式，点云中的每个点对应图中的一个顶点，每个顶点有K个邻居，特征编码方式如下：

其中p_i表示图中顶点i的空间信息，

表示顶点i邻居k的空间信息；f_i表示图中顶点i的特征信息，f_i ^k表示顶点i邻居k的特征信息，MLP为多层感知器；Concat表示连接操作，

为顶点i的编码了邻居k的特征；

(2)搭建图Transformer特征提取层，对编码特征

进行特征提取，提取方式如下：

其中FFN(.)是一个两层前馈神经网络，LayerNorm表示为层归一化，层之间具有非线性变换；Mhatt(.)是多头图注意力层，其表达式如下：

其中||表示N个注意力头的级联，σ是激活函数，W是权重，其中α是每个头注意力参数，表达式如下：

其中

Δf_i ^k＝f_i-f_i ^k；

通过图Transformer提取到特征F_i，其融合了K个邻居的特征信息；

(3)将图Transformer提取到的点特征图F∈R^N×D进行随机下采样，N为顶点个数，D为特征维度，得到点数减少的点特征图F′∈R^(N/l)×D，l为采样率；

(4)将依次级联的特征编码层、图Transformer特征提取层和采样分层层组合成基于图Transformer的下采样模块，依次叠加n个下采样模块，得到不同层次的点特征图{F_d0∈R^N×D,F_d1∈R^(N/l)×D,...,F_dn∈R^(N/nl)×D}。

进一步，构建特征上采样网络，该特征上采样网络包括依次级联的n个上采样模块，每个上采样模块包括依次级联的特征插值层和特征融合层具体包括：

(1)构造上采样模块，将得到的不同层次特征中的点特征图F_dn通过上采样插值到与F_dn-1尺度一样的点特征图F_un-1∈R^N/(nl-l)×D，将F_dn-1和F_un-1进行特征融合，融合方式如下：

F_un-1＝MLP(concat(F_dn-1,F_un-1))；

(2)依次叠加n个上采样模块，进行特征插值和融合，则上采样的多层次特征信息为{F_un-1∈R^N/(nl-l)×D,...,F_u1∈R^(N/l)×D,F_u0∈R^N×D}，最终得到融合了多层次局部特征的特征图F_u0∈R^N×D。

进一步，搭建基于分层图Transformer的点云分割网络并进行训练具体包括：

(1)搭建分层图Transformer特征提取模块，采用级联了4个基于图Transformer的下采样模块的下采样网络进行特征提取和分层，采样率l为4，维度D为32，则不同层次的特征图为{F_d0∈R^N×32,F_d1∈R^(N/4)×32,F_d2∈R^(N/16)×32,F_d3∈R^(N/64)×32,F_d4∈R^(N/256)×32}，通过上采样网络进行特征插值和融合，得到融合了多层次局部特征的特征图F_u0∈R^N×32；

(2)搭建特征融合和预测输出模块，将特征提取模块得到的特征F_u进行特征融合操作，通过MLP进行特征升维，得到特征图F_u∈R^N×128，进行最大池化操作，只保留特征F_u每个维度中特征最大的点，即为点的全局特征F_g∈R^1×128，将全局特征F_g与多层次的局部特征F_u进行融合得到局部-全局特征F_ug∈R^N×160，将局部-全局特征F_ug通过MLP{160,64,c}进行降维，c样本标签的种类数，最后通过softmax层得到大小N×c为最后的输出结果；

(3)首先将训练集的原始点云进行网格下采样，得到点数相同的N×3的点云，作为网络输入；搭建基于分层图Transformer的点云分割网络，使用带有权重的交叉熵损失函数，使用训练集对分层图Transformer点云分割网络进行有监督的训练，每轮训练根据损失值，调整网络参数，得到网络模型。其损失函数为带权重的交叉损失函数，公式如下：

loss_i为点i损失值，c为样本标签的种类数；

w_j为类型j的权重，N_j代表所属类型总的点数：

每个点的loss与权重相乘，最后将每个点的损失值求和取平均得到最终的损失值；

在获得训练模型之后，输入测试集的点云到训练好的模型进行测试，得到点云分割结果。

本发明的另一目的在于提供一种计算机设备，所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如下步骤：构建基于分层图Transformer的特征提取模块，包括基于图Transformer的特征下采样网络和特征上采样网络；搭建基于分层图Transformer的点云分割网络，使用带有权重的交叉熵损失函数，使用训练集对分层图Transformer点云分割网络进行有监督的训练，每轮训练根据损失值，调整网络参数，得到网络模型；使用训练好的网络模型对测试集中的点云进行预测，得到点云中每个点的分割结果。

本发明的另一目的在于提供一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如下步骤：构建基于分层图Transformer的特征提取模块，包括基于图Transformer的特征下采样网络和特征上采样网络；搭建基于分层图Transformer的点云分割网络，使用带有权重的交叉熵损失函数，使用训练集对分层图Transformer点云分割网络进行有监督的训练，每轮训练根据损失值，调整网络参数，得到网络模型；使用训练好的网络模型对测试集中的点云进行预测，得到点云中每个点的分割结果。

本发明的另一目的在于提供一种信息数据处理终端，所述信息数据处理终端用于实现所述的点云分割方法。

本发明的另一目的在于提供一种实施所述点云分割方法的点云分割系统，所述点云分割系统包括：

特征提取构建模块，用于构建基于分层图Transformer的特征提取模块，主要包括基于图Transformer的特征下采样网络和特征上采样网络；

网络模型获取模块，用于搭建基于分层图Transformer的点云分割网络，使用带有权重的交叉熵损失函数，使用训练集对分层图Transformer点云分割网络进行有监督的训练，每轮训练根据损失值，调整网络参数，得到网络模型；

分割结果输出模块，用于使用训练好的网络模型对测试集中的点云进行预测，得到点云中每个点的分割结果。

本发明的另一目的在于提供一种采集设备，所述采集设备用于实现所述的点云分割方法；所述采集设备包括：摄像机矩阵、激光雷达。

结合上述的所有技术方案，本发明所具备的优点及积极效果为：本发明提供了一种基于分层图Transformer的点云分割方法，其将点云数据构造成图的形式，并对图中每个顶点进行特征编码，丰富了点云的初始特征；使用分层图Transformer，分层使得网络能够处理大规模数量的点云数据，图Transformer能够有效地提取点云邻域之间的关系；而分层图Transformer能够得到丰富的不同层次的语义特征，从而提高点云分割的精度。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例中所需要使用的附图做简单的介绍，显而易见地，下面所描述的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的点云分割方法流程图。

图2是本发明实施例提供的点云分割系统的结构示意图；

图2中：1、特征提取构建模块；2、网络模型获取模块；3、分割结果输出模块。

图3是本发明实施例提供的基于分层图Transformer的特征提取模块的网络结构图。

图4是本发明实施例提供的基于分层图Transformer的分割网络结构图。

图5是本发明实施例提供的点云分割网络分割结果图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

针对现有技术存在的问题，本发明提供了一种点云分割方法、系统、介质、计算机设备、终端及应用，下面结合附图对本发明作详细的描述。

如图1所示点云分割方法包括以下步骤：

S101：构建基于分层图Transformer的特征提取模块，主要包括基于图Transformer的特征下采样网络和特征上采样网络；

S102：搭建基于分层图Transformer的点云分割网络，使用带有权重的交叉熵损失函数，使用训练集对分层图Transformer点云分割网络进行有监督的训练，每轮训练根据损失值，调整网络参数，得到网络模型；

S103：使用训练好的网络模型对测试集中的点云进行预测，得到点云中每个点的分割结果。

本发明提供的点云分割方法业内的普通技术人员还可以采用其他的步骤实施，图1的本发明提供的点云分割方法仅仅是一个具体实施例而已。

如图2所示，本发明提供的点云分割系统包括：

特征提取构建模块1，用于构建基于分层图Transformer的特征提取模块，主要包括基于图Transformer的特征下采样网络和特征上采样网络；

网络模型获取模块2，用于搭建基于分层图Transformer的点云分割网络，使用带有权重的交叉熵损失函数，使用训练集对分层图Transformer点云分割网络进行有监督的训练，每轮训练根据损失值，调整网络参数，得到网络模型；

分割结果输出模块3，用于使用训练好的网络模型对测试集中的点云进行预测，得到点云中每个点的分割结果。

下面结合附图对本发明的技术方案作进一步的描述。

如图2所示，本发明实施例提供的基于分层图Transformer的特征提取模块的构造方法步骤如下：

步骤一，构建基于图Transformer的特征下采样网络，该特征下采样网络包括n个级联的下采样模块，每个下采样模块包括依次级联的特征编码层、图Transformer特征提取层和采样分层层；具体步骤如下：

(1)构造特征编码层方式，具体操作如下：

采用K最近邻法将点云数据构造图的形式，点云中的每个点对应图中的一个顶点，每个顶点有K个邻居，K为16。特征编码方式如下：

其中p_i表示图中顶点i的空间信息，

表示顶点i邻居k的空间信息；f_i表示图中顶点i的特征信息，f_i ^k表示顶点i邻居k的特征信息。MLP为多层感知器；Concat表示连接操作，

为顶点i的编码了邻居k的特征。

(2)搭建图Transformer特征提取层，对编码特征

进行特征提取，提取方式如下：

其中

Δf_i ^k＝f_i-f_i ^k；

通过图Transformer提取到特征F_i，其融合了K个邻居的特征信息。

(3)将图Transformer提取到的点特征图F∈R^N×D(N为顶点个数，D为特征维度)进行随机下采样，得到点数减少的点特征图F′∈R^(N/l)×D(l为采样率)。

步骤二，构建特征上采样网络，该特征上采样网络包括依次级联的n个上采样模块，每个上采样模块包括依次级联的特征插值层和特征融合层。具体步骤如下：

(1)构造上采样模块，将步骤一得到的不同层次特征中的点特征图F_dn通过上采样插值到与F_dn-1尺度一样的点特征图F_un-1∈R^N/(nl-l)×D，然后将F_dn-1和F_un-1进行特征融合，融合方式如下：

F_un-1＝MLP(concat(F_dn-1,F_un-1)) (6)

如图4所示，本发明实施例提供的搭建基于分层图Transformer的点云分割网络并进行训练的具体方法如下：

(1)搭建分层图Transformer特征提取模块，采用级联了4个基于图Transformer的下采样模块的下采样网络进行特征提取和分层，采样率l为4，维度D为32，则不同层次的特征图为{F_d0∈R^N×32,F_d1∈R^(N/4)×32,F_d2∈R^(N/16)×32,F_d3∈R^(N/64)×32,F_d4∈R^(N/256)×32}。通过上采样网络进行特征插值和融合，得到融合了多层次局部特征的特征图F_u0∈R^N×32。

(2)搭建特征融合和预测输出模块，将特征提取模块得到的特征F_u进行特征融合操作，通过MLP进行特征升维，得到特征图F_u∈R^N×128，然后进行最大池化操作，只保留特征F_u每个维度中特征最大的点，即为点的全局特征F_g∈R^1×128。将全局特征F_g与多层次的局部特征F_u进行融合得到局部-全局特征F_ug∈R^N×160。将局部-全局特征F_ug通过MLP{160,64,c}进行降维，c样本标签的种类数(c为13)，最后通过softmax层得到大小N×c为最后的输出结果。

(3)首先将训练集的原始点云进行网格下采样，得到点数相同的N×3的点云，作为网络输入；然后搭建基于分层图Transformer的点云分割网络，使用带有权重的交叉熵损失函数，使用训练集对分层图Transformer点云分割网络进行有监督的训练，每轮训练根据损失值，调整网络参数，得到网络模型。其损失函数为带权重的交叉损失函数，公式如下：

loss_i为点i损失值，c为13样本标签的种类数：

w_j为类型j的权重，N_j代表所属类型总的点数：

每个点的loss与权重相乘，最后将每个点的损失值求和取平均得到最终的损失值。

使用训练好的网络模型对测试集中的点云进行预测，得到点云中每个点的分割结果。

下面结合仿真对本发明的技术效果作详细的描述。

1、仿真条件

本发明是在CPU为Intel(R)Core(TM)i7-7700、CPU3.60GHz、RAM 32.00GB、Ubuntu18.04操作系统、显卡GeForce RTX2080Ti、Pytorch深度学习框架、S3DIS数据集运用Pycharm软件完成本发明仿真实验。

S3DIS数据集是Stanford Large-Scale 3D Indoor Spaces数据集，S3DIS数据集将每个小房间作为一个场景，总共272房间。将区域5作为测试集，其它5个区域作为训练集。训练集共204个，测试集共68个，包含的类别数13类，每个样本点云数量为40960。

2、仿真实验内容及分析

根据本发明划分训练集和测试集，构建分层图Transformer点云分割网络，使用训练集对分层图Transformer点云分割网络进行训练，使用训练好的网络模型对测试集中的点云进行预测，得到每个点云的分割结果。比较发明与现有的PointNet和PointNet++方法分割效果进行对比，采用分割精度作为评价指标，结果如表1所示：

表1 S3DIS数据集分割精度对比表

评价指标	PointNet	PointNet++	本发明
				分割精度	78.60％	81.00％	83.28％

从表1中可以看出，本发明在S3DIS数据集上比现有技术PointNet和PointNet++分割效果更佳。

将点分割结果进行可视化，如图5所示，可以看出本发明所设计的网络模型能很好的分割室内场景中的桌子、椅子、书柜和墙壁等物体。综上可以说明本发明的分层图Transformer点云分割网络能够有效的捕获点云局部邻域间的信息，有效的提高点云的分割精度。

应当注意，本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现；软件部分可以存储在存储器中，由适当的指令执行系统，例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现，例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现，也可以用由各种类型的处理器执行的软件实现，也可以由上述硬件电路和软件的结合例如固件来实现。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，都应涵盖在本发明的保护范围之内。

Claims

1.一种点云分割方法，其特征在于，所述点云分割方法构建基于分层图Transformer的特征提取模块，包括基于图Transformer的特征下采样网络和特征上采样网络；搭建基于分层图Transformer的点云分割网络，使用带有权重的交叉熵损失函数，使用训练集对分层图Transformer点云分割网络进行有监督的训练，每轮训练根据损失值，调整网络参数，得到网络模型；使用训练好的网络模型对测试集中的点云进行预测，得到点云中每个点的分割结果。

2.如权利要求1所述的点云分割方法，其特征在于，构建基于分层图Transformer的特征提取模块具体包括：

3.如权利要求2所述的点云分割方法，其特征在于，所述构建基于图Transformer的特征下采样网络，该特征下采样网络包括n个级联的下采样模块，每个下采样模块包括依次级联的特征编码层、图Transformer特征提取层和采样分层层具体包括：

其中p_i表示图中顶点i的空间信息，

为顶点i编码了邻居k的特征；

(2)搭建图Transformer特征提取层，对编码特征

进行特征提取，提取方式如下：

F_i＝LayerNorm(FFN(F_i)+LayerNorm(F_i+Mhatt(F_i ^K)))；

其中

Δf_i ^k＝f_i-f_i ^k；

(4)将依次级联的特征编码层、图Transformer特征提取层和采样分层层组合成基于图Transformer的下采样模块，依次叠加n个下采样模块，得到不同层次的点特征图{F_d0∈R^N ^×D,F_d1∈R^(N/l)×D,...,F_dn∈R^(N/nl)×D}。

4.如权利要求2所述的点云分割方法，其特征在于，构建特征上采样网络，该特征上采样网络包括依次级联的n个上采样模块，每个上采样模块包括依次级联的特征插值层和特征融合层具体包括：

F_un-1＝MLP(concat(F_dn-1,F_un-1))；

5.如权利要求1所述的点云分割方法，其特征在于，搭建基于分层图Transformer的点云分割网络并进行训练具体包括：

(3)首先将训练集的原始点云进行网格下采样，得到点数相同的N×3的点云，作为网络输入；搭建基于分层图Transformer的点云分割网络，使用带有权重的交叉熵损失函数，使用训练集对分层图Transformer点云分割网络进行有监督的训练，每轮训练根据损失值，调整网络参数，得到网络模型，其损失函数为带权重的交叉损失函数，公式如下：

loss_i为点i损失值，c为样本标签的种类数；

w_j为类型j的权重，N_j代表所属类型总的点数：

6.一种计算机设备，其特征在于，所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如下步骤：构建基于分层图Transformer的特征提取模块，包括基于图Transformer的特征下采样网络和特征上采样网络；搭建基于分层图Transformer的点云分割网络，使用带有权重的交叉熵损失函数，使用训练集对分层图Transformer点云分割网络进行有监督的训练，每轮训练根据损失值，调整网络参数，得到网络模型；使用训练好的网络模型对测试集中的点云进行预测，得到点云中每个点的分割结果。

7.一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如下步骤：构建基于分层图Transformer的特征提取模块，包括基于图Transformer的特征下采样网络和特征上采样网络；搭建基于分层图Transformer的点云分割网络，使用带有权重的交叉熵损失函数，使用训练集对分层图Transformer点云分割网络进行有监督的训练，每轮训练根据损失值，调整网络参数，得到网络模型；使用训练好的网络模型对测试集中的点云进行预测，得到点云中每个点的分割结果。

8.一种信息数据处理终端，其特征在于，所述信息数据处理终端用于实现权利要求1～5任意一项所述的点云分割方法。

9.一种实施权利要求1～5任意一项所述点云分割方法的点云分割系统，其特征在于，所述点云分割系统包括：

10.一种采集设备，其特征在于，所述采集设备用于实现权利要求1～6任意一项所述的点云分割方法；所述采集设备包括：摄像机矩阵、激光雷达。