CN112446385B

CN112446385B - 一种场景语义分割方法、装置、电子设备

Info

Publication number: CN112446385B
Application number: CN202110125033.9A
Authority: CN
Inventors: 方璐; 季梦奇; 毛适; 王生进
Original assignee: Tsinghua University
Current assignee: Tsinghua University
Priority date: 2021-01-29
Filing date: 2021-01-29
Publication date: 2021-04-30
Anticipated expiration: 2041-01-29
Also published as: CN112446385A

Abstract

本发明公开了一种场景语义分割方法、装置、电子设备，该方法包括：如果场景原始点云对应体素块的粒度大于粒度阈值，则根据所述体素块特征和原始点云特征，得到下一分割点云；如果所述有效体素块细分后下一体素块粒度小于等于所述粒度阈值，则根据所述下一分割点云添加语义标签作为场景语义分割结果；如果所述有效体素块细分后下一体素块粒度大于所述粒度阈值，则根据所述下一体素块特征和下一分割点云特征，得到新下一分割点云；直至所述有效体素块细分后的新下一体素块的粒度小于等于所述粒度阈值，则将所述新下一分割点云添加语义标签作为场景语义分割结果。本发明实施例在场景不同粒度下有足够上下文信息进行整合，减少计算复杂度。

Description

一种场景语义分割方法、装置、电子设备

技术领域

本发明实施例涉及计算机技术，尤其涉及种场景语义分割方法、装置、电子设备。

背景技术

随着自动驾驶、机器人、虚拟现实等技术领域的发展，对三维数据的处理与理解的要求逐渐提高。与已经取得很大成功的二维图像处理与理解不同，三维数据由于本身不具有二维图像有效的正则化的格点表达形式，给卷积神经网络的直接应用带来了很大的不便。

现有的技术手段主要有基于点的多层感知机或卷积网络的方法、基于图的方法以及基于体素的方法等。而处于室外大场景的三维数据的语义理解对这个问题提出了新的挑战，百万乃至上亿级别的点云数量要求处理方法需要拥有良好的计算复杂度，可以层级化的理解场景中不同尺度大小的对象。基于点的多层感知机方法起源于PointNet，可以有效的对目标点云形成特征表达。

但其全局池化操作不利于有效利用上下文信息，改进的多种点卷积方法存在K近邻查找和连续值卷积核计算的复杂度高等问题，且降采样时容易导致小目标物体难以被识别。基于图的方法将场景预分割为点集并构建超点图，利用图网络等方式进行处理，在超点图构建上复杂度高。基于体素的方法将场景离散化为体素表征，但是随着分辨率的提高，体素数量呈三次增长，巨量的存储和计算量使其不利于直接应用在大场景的大量级点云处理中。

发明内容

本发明提供一种图像处理方法、装置、电子设备，以实现精细结构不同的采样粒度的下拥有足够的上下文信息进行信息整合，减少计算的复杂度。

第一方面，本发明实施例提供了一种场景语义分割方法，该包括：

如果场景原始点云对应体素块的粒度大于粒度阈值，则根据所述体素块特征和原始点云特征，得到下一分割点云；

如果所述体素块中有效体素块细分后的下一体素块的粒度小于等于所述粒度阈值，则将所述下一分割点云添加语义标签作为场景语义分割结果；

如果所述体素块中有效体素块细分后的下一体素块的粒度大于所述粒度阈值，则根据所述下一体素块特征和下一分割点云特征，得到新下一分割点云；直至所述下一体素块中有效体素块细分后的新下一体素块的粒度小于等于所述粒度阈值，则将所述新下一分割点云添加语义标签作为场景语义分割结果。

进一步的，所述如果场景原始点云对应体素块的粒度大于粒度阈值，则根据所述体素块特征和原始点云特征，得到下一分割点云，包括：

如果场景原始点云对应体素块的粒度大于粒度阈值，则所述体素块体素化后进行稀疏卷积得到所述体素特征叠加在所述原始点云经多层感知机得到所述原始点云特征上，得到下一分割点云。

进一步的，所述如果所述体素块中有效体素块细分后的下一体素块的粒度小于等于所述粒度阈值，则将所述下一分割点云添加语义标签作为场景语义分割结果之前，包括：

将所述下一体素块对应点云输入语义复杂度预测网络，得到所述下一体素块的复杂度；

如果所述下一体素块的复杂度小于预设复杂度阈值，则将所述下一体素块添加无效标签；

如果所述下一体素块的复杂度大于预设复杂度阈值，则将所述下一体素块添加有效标签。

进一步的，所述如果所述体素块中有效体素块细分后的下一体素块的粒度小于等于所述粒度阈值，则将所述下一分割点云添加语义标签作为场景语义分割结果，包括：

如果所述下一体素块的粒度小于等于所述粒度阈值，则根据所述下一分割点云确定所述下一分割点云对应的特征向量；

将所述特征向量输入语义标签模型，添加所述下一分割点的语义标签并将所述下一分割点云添加语义标签作为所述场景语义分割结果。

进一步的，所述语义标签模型，包括：

将历史场景点云特征及所述历史场景点云的语义类别数量输入所述多层感知机，得到所述历史场景点云对应的特征向量；

根据所述历史场景点云对应的特征向量及历史场景点云真实语义标签输入深度学习语义标签网络进行训练，直至所述深度学习语义标签网络收敛，得到语义标签模型。

进一步的，所述如果所述体素块中有效体素块细分后的下一体素块的粒度大于所述粒度阈值，则根据所述下一体素块特征和下一分割点云特征，得到新下一分割点云；直至所述下一体素块中有效体素块细分后的新下一体素块的粒度小于等于所述粒度阈值，则将所述新下一分割点云添加语义标签作为场景语义分割结果，包括：

如果所述体素块中有效体素块细分后的所述下一体素块的粒度大于所述粒度阈值，则所述下一体素块体素化后进行稀疏卷积得到所述体素特征叠加在所述下一分割点云经所述多层感知机得到所述下一分割点云特征上，得到新下一分割点云；

如果所述下一体素块中有效体素块细分的新下一体素块的粒度小于等于所述粒度阈值，则将所述新下一分割点云添加语义标签作为场景语义分割结果；

如果所述下一体素块中有效体素块细分的新下一体素块的粒度大于所述粒度阈值，则将所述新下一体素特征和新下一分割点云特征，得到新新下一分割点云；直至所述新下一体素块中有效体素块细分后的新新下一体素块的粒度小于等于所述粒度阈值，则将所述新新下一分割点云语义添加语义标签作为场景语义分割结果。

进一步的，所述体素块体素化后进行稀疏卷积得到所述体素特征叠加在所述原始点云经多层感知机得到所述原始点云特征上，得到下一分割点云，包括：

将所述体素特征与所述原始点云特征经去体素化叠加，得到所述下一分割点云。

第二方面，本发明实施例还提供了一种场景语义分割装置，该装置包括：

点云确定模块，用于如果场景原始点云对应体素块的粒度大于粒度阈值，则根据所述体素块特征和原始点云特征，得到下一分割点云；

标签添加模块，用于如果所述体素块中有效体素块细分后的下一体素块的粒度小于等于所述粒度阈值，则将所述下一分割点云添加语义标签作为场景语义分割结果；

结果输出模块，用于如果所述体素块中有效体素块细分后的下一体素块的粒度大于所述粒度阈值，则根据所述下一体素块特征和下一分割点云特征，得到新下一分割点云；直至所述下一体素块中有效体素块细分后的新下一体素块的粒度小于等于所述粒度阈值，则将所述新下一分割点云添加语义标签作为场景语义分割结果。

第三方面，本发明实施例还提供了一种电子设备，所述电子设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现所述的场景语义分割方法。

第四方面，一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现所述的场景语义分割方法。

本发明通过如果场景原始点云对应体素块的粒度大于粒度阈值，则根据所述体素块特征和原始点云特征，得到下一分割点云；如果所述有效体素块细分后下一体素块粒度小于等于所述粒度阈值，则根据所述下一分割点云添加语义标签作为场景语义分割结果；如果所述有效体素块细分后下一体素块粒度大于所述粒度阈值，则根据所述下一体素块特征和下一分割点云特征，得到新下一分割点云；直至所述有效体素块细分后的新下一体素块的粒度小于等于所述粒度阈值，则将所述新下一分割点云添加语义标签作为场景语义分割结果。解决室外大场景在三维语义理解的过程中全局池化操作不利于有效利用上下文信息，而多种点卷积方法和连续值卷积核计算的复杂度高，在降采样时容易导致小目标物体难以辨识，大场景对应的大计算量降低了处理效率的问题，实现精细结构不同的采样粒度的下拥有足够的上下文信息进行信息整合，减少计算的复杂度效果。

附图说明

图1是本发明实施例一中的一种场景语义分割方法的流程图；

图1A是本发明实施例一中的一种场景语义分割方法的示例图；

图1B是本发明实施例一中的一种场景语义分割方法的流程图；

图2是本发明实施例二中的一种场景语义分割方法的流程图；

图3是本发明实施例三中的一种场景语义分割装置的结构示意图；

图4是本发明实施例四中的一种电子设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1为本发明实施例一提供的一种场景语义分割方法的流程图，本实施例可适用于室外大场景的三维数据的语义分割的情况，该方法可以由场景语义分割装置来执行，该装置可以通过软件和/硬件的方式来实现，并具体可继承于具备存储和计算能力来进行场景语义分割的电子设备中。

如图1所示，提供一种场景语义分割方法的，具体包括如下步骤：

S110，如果场景原始点云对应体素块的粒度大于粒度阈值，则根据所述体素块特征和原始点云特征，得到下一分割点云；

本发明实施例中，场景原始云点云可以理解为需要语义分割的场景使用采集设备或三维重建的方式获取到的场景对应的原始点云。所述原始点云对应体素块可以理解为将原始点云离散化得到比较粗糙的体素空间。例如：将场景对应的原始点云离散化为比较粗糙的如

体素空间，同时将场景对应的原始点云和体素空间之间建立对应的哈希表，以便于对应查找。体素块的粒度可以理解为体素块对应的体素空间的实际大小。粒度阈值可以理解为场景对应的体素空间包含的最小对象对应的体素块体积，例如：场景对应的体素空间中包含的最小对应的体素块积为

，则场景对应的预设最细粒度为

。体素块特征可以理解为体素块对应的体素空间中各点云特征的均值所对应的特征，即体素块所对应的特征。原始点云特征可以理解为场景对应的原始点云所对应的特征，即将原始点云输入多层感知机得到的对应的特征。下一分割点云可以理解为将体素块特征叠加在原始点云特征上得到的点云。

本发明实施例中，将场景对应的原始点云和体素空间建立对应的哈希表，以便于根据点云或者体素空间哈希表进行对应的查找。示例性的，假设原始点云总数目为N，离散化后原始点云所占据的空间为

，所有原始点云坐标点构成的集合为 P，则基于如下公式计算原始点云对应的体素块第d层级的第n个点坐标信息：

公式（1）

其中，

表示一个实数域上的3维向量；

为第d层体素块中原始点云特征；

为第d层级点云特征对应的计算函数；

为第d层体素块中原始点对应的坐标。

本发明实施例中，假设每个有效体素块所对应的空间由

表，其中，

，

为有效体素块的索引值；

为第d层有效体素块的数量，则基于如下公式计算原始点云与体素空间的对应关系

：

公式（2）

本发明实施例中，如果场景原始点云对应体素块的粒度大于粒度阈值，说明场景原始点云对应的体素块粒度没有细分到场景原始点云中最小对象对应的体素块体积大小，需要对场景原始点云对应体素块继续进行细分，在细分之前需要根据原始点云对应体素块与原始点云特征叠加得到叠加特征对应的下一分割点云。

S120，如果所述体素块中有效体素块细分后的下一体素块的粒度小于等于所述粒度阈值，则将所述下一分割点云添加语义标签作为场景语义分割结果；

本发明实施例中，体素块中有效体素块可以理解为符合预设复杂度阈值的体素块。下一体素块可以理解为原始点云对应体素块中有效体素块八叉细分后得到的体素块。语义标签可以理解为可以理解为场景中或图像中识别出物体的名称位置等信息。场景语义分割结果可以理解为根据场景对应的点云特征确定场景对应位置上对象的预测标签。

本发明实施例中，如果体素块中有效体素块八叉细分之后得到下一体素块的粒度小于等于粒度阈值，则说明下一体素块粒度细分到场景中最小对象对应的体素块空间体积大小，可以根据下一分割点云特征确定语义标签作为场景语义分割的结果。

S130，如果所述体素块中有效体素块细分后的下一体素块的粒度大于所述粒度阈值，则根据所述下一体素块特征和下一分割点云特征，得到新下一分割点云；直至所述下一体素块中有效体素块细分后的新下一体素块的粒度小于等于所述粒度阈值，则将所述新下一分割点云添加语义标签作为场景语义分割结果。

本发明实施例中，下一体素块特征可以理解为下一体素块对应的体素空间中各点云特征的均值所对应的特征，即下一体素块对应的特征。下一分割点云特征可以理解为体素块特征叠加在原始点云特特征上得到的点云对应的特征。新下一分割点云可以理解为将下一体素块特征叠加在下一分割点云特征上得到的点云。

本发明实施例中，如果体素块中有效体素块细分后的下一体素块的粒度大于粒度阈值，说明体素块中有效体素块没有细分到场景原始点云中最小对象对应的体素块体积大小，需要对下一体素块继续进行细分，在细分之前需要根据下一体素块特征与下一分割点云特征叠加得到叠加特征对应的新下一分割点云。如果新下一分割点云粒度小于粒度阈值，则根据新下一分割点云添加语义标签作为场景语义分割结果。

本发明实施例中，体素化可以理解为将每个体素块对应的体素空间中的点云特征值进行平均得到均值所对应的特征作为每个体素块特征，用于得到每个体素块所对应的特征。稀疏卷积可以理解为一种有效的稀疏矩阵的计算方法，在保证准确定性的前提条件下具备仅在有效体素周围进行卷积运算的操作特点，用于整合上下文中的语义信息。多层感知机可以理解为一种前馈人工神经网络模型，其将输入的多个数据映射到单一的输出的数据集上。

本发明实施例中，如果场景原始点云对应体素块的粒度大于粒度阈值，说明场景原始点云对应的体素块粒度没有细分到场景原始点云中最小对象对应的体素块体积大小，需要将原始点云对应的体素块对应层级特征叠加到原始点云特征上对原始点云，强化原始点云上原始点云对应体素块特征，得到下一分割点云。其中，将强化原始点云上原始点云对应体素块特征，即是将原始点云对应的体素块特征与原始点云的特征进行融合，以保证场景中精细信息和上下文信息的融合。其中，下一分割点云包含原始点云对应的体素块特征叠加在原始点云特征上的叠加特征。

本发明实施例中，将体素块中每个体素块对应的空间中原始点云特征做平均，得到每个体素块对应的特征。基于如下公式计算原始点云对应体素块中每个体素块的特征

：

公式（3）

基于如下公式融合体素块特征与原始点云的特征

：

公式（4）

其中，

为原始点云多层感知机经特征变化后的特征向量；

为体素块的特征经稀疏卷积后的特征向量；

为概率为1的示性函数，表示当

时为1，否则为0。

示例性的，图1A为本发明实施例一中一种场景语义分割方法的示例图，如图1A所示，将场景对应的原始点云进行离散化后得到对应的体素块，对体素块进行体素化后，再做稀疏卷积整合上下文信息，得到体素块的特征并通过去体素化将该特征赋予对应的点云，同时场景对应的点云经层感知机得到原始点云特征，将体素块特征与原始点云特征进行叠加，得到新的融合特征。

本发明实施例中，语义复杂度预测网络可以理解为根据输入下一体素块的空间中对应点云的精细结构和语义结构确定下一体素块的空间中对应点云的复杂度的神经网络。其中，语义复杂度预测网络包括多个多层感知机、最大值池化及主成份分析等，语义复杂度预测网络可以是PointNet架构。体素块的复杂度可以理解为体素块空间中对应点云的精细结构和语义结构共同确定语义结构的复杂度。预设复杂度阈值可以理解为根据实际需求设置发复杂阈值。有效标签可以理解为体素块的复杂度在大于预设复杂度阈值被标注的唯一标记。无效标签可以理解为体素块的复杂度小于预设复杂度阈值被标注的唯一标记。

本发明实施例中，将下一体素块对应点云输入语义复杂度预测网络，计算出下一体素块的复杂度。需要根据下一体素块复杂度及预设复杂度阈值给下一体素块中每个体素块标记对应的有效性标签。当下一体素块的复杂度小于预设复杂度阈值的体素块添加无效标签；当下一体素块的复杂度大于预设复杂度阈值的体素块添加有效标签。当设置预设复杂度阈值较大时，对体素块的空间中对应点云的精细结构和语义结构对应的容限交较小，对应更多的体素块被标记为无效并在较浅层停止循环进行结果输出；当设置预设复杂度阈值较小时，对体素块的空间中对应点云的精细结构和语义结构对应的容限较大，对应较少的体素块被标记为无效并在较深层循环后进行结果输出。

本发明实施例中，语义复杂度预测网络中的PointNet架构，对每个有效体素块对应的点，都输入相同的多层感知机得到变换的特征向量，通过最大值池化得到体素所对应的特征向量，再通过一个多层感知机得到对语义复杂度的预测，利用最大池化算法在每个维度上提取特征向量，以任意顺序输入的点云都能得到确定复杂性预测结果。基于如下公式计算点云对应的体素块复杂度网络输出结果

：

公式（5）

本发明实施例中，精细结构和语义结构两部分，在精细结构实际上是点云对应的体素块在几何方面，可以用平面拟合的残差值和主成分分析的第三维特征值等作为表征特征进行约束。其中，主成分分析的特征方向表示对应的最大方差为点云对应的体素块在三维空间上第三维度的特征值

对应了二位平面拟合点云后的误差方差，作为几何维度网络参数。在语义结构实际上是点云的经主成份分析预测的点云对应的语义标签数量

作为语义维度网络参数。其中，语义复杂度预测网络及其训练目标函数包括：

基于如下公式计算点云对应的体素块的复杂度参考值

：

公式（6）

其中，

为点云对应的语义标签数量；

点云对应的体素块在三维空间上第三维度的特征值；

为几何维度网络权重参数；

为语义维度网络权重参数。

本发明实施例中，在语义复杂度预测网络中

和

的设置应用工程的需求确定。在

和

总和一定条件下，当几何维度网络权重参数比语义维度网络权重参数的比值越大代表几何维度对复杂度预测的结果影响越大；当语义维度网路权重参数比几何维度网络权重参数的比值越大代表语义维度对复杂度预测的结果影响越大。其中，点云对应的体素块的复杂度参考值

作为预测网络的训练目标。

本发明实施例中，语义复杂度预测网络在训练过程中基于如下公式计算语义复杂度预测网络的目标损失函数

：

公式（7）

其中，

是点云对应体素块预测语义复杂度网络输出结果；

是点云对应体素块的复杂度参考值；

是第

层场景点云对应空间的体素块；

是第

层场景点云对应体素块复杂度的输出。

是第

层场景点云对应空间的体素块体积。

本发明实施例中，特征向量可以理解为下一分割点云特征及下一分割点云语义种类对应的特征向量。语义标签模型可以理解为预先训练好的识别点云特征向量并添加对应的语义标签的模型。

本发明实施例中，如果下一体素块的粒度小于等于粒度阈值，则说明下一体素块粒度细分场景中最小对象对应的体素块空间体积大小，可以根据下一分割点云经多层感知机计算出下一分割点云特征，在根据下一分割点云特征及预设语义标签数量经多层感知机

计算出下一分割点云特征对应的特征向量。将下一分割点云特征对应的特征向量输入语义标签模型，得到下一分割点云对应的语义标签，并将下一分割点添加语义标签作为场景语义分割结果。

基于如下公式点云特征对应的特征向量

：

公式（8）

其中，

是第

层点云对应体素块复杂度的输出对应的语义标签数量；

是第

层点云对应体素块复杂度的输出对应的语义特征。

进一步的，所述语义标签模型，包括：

本发明实施例中，历史场景点云特征可以理解为根据历史场景点云获取或提取的历史场景点云对应的特征。历史场景点云的语义类别数量可以理解为根据语义复杂度预测网络中主成份分析预测历史场景点云对应的语义类别的数量。深度学习语义标签网络可以理解为根据历史场景点云对应的特征向量和历史场景点云真实语义标签之间的内在规律和特征的标签网络。

本发明实施例中，将历史场景点云特征及历史场景点云的语义类别数量输入多层感知机，得到历史场景点云对应的特征向量；将历史场景点云对应的特征向量及场景点云真实语义标签输入深度学习语义标签网络进行训练，直至深度学习语义标签网络收敛，得到语义标签模型。

示例性的，对场景语义分割的实现方式有很多种，具体的：

图1B为本发明实施例一中一种场景语义分割方法的流程图，如图1B所示，利用激光雷达或三维重建方法得到场景对应的原始点云，将场景对应的原始点云离散化得到原始点云对应的体素块。S1，判断原始点云对应的体素块粒度是否大于粒度阈值，若原始点云对应的体素块的粒度小于等于粒度阈值，则将原始点输入多层感知机得到原始点云特征，再将原始点云特征及原始点云语义类别数量输入多层感知机得到原始点云对应的特征向量，将原始点云对应的特征向量输入语义标签模型，得到场景对应的语义标签；若原始点云对应的体素块的粒度大于粒度阈值，则将原始点云对应的体素块依次进行体素化和稀疏卷积，得到原始点云对应的体素块的特征与原始点云经多层感知机特征变化后的原始点云特征利用去体素化的方式进行叠加，得到叠加后的下一分割点云，同时将原始点云对应的体素块对应体素空间经PointNet架构，预测每个体素块的复杂度，将原始点云对应体素块中复杂度大于预设复杂度阈值的标记为有效，将原始点云对应体素块中复杂度小于等于预设复杂度阈值的标记为无效。S2，将标记为有效体素块进行八叉细分后得到下一体素块，判断下一体素块粒度是否大于粒度阈值，若下一体素块的粒度小于等于粒度阈值，则将下一分割点云输入多层感知机得到下一分割点云特征，再将下一分割点云特征及下一分割点云语义类别数量输入多层感知机得到下一分割点云对应的特征向量，将下一分割点云对应的特征向量输入语义标签模型，得到场景对应的语义标签；若下一体素块的粒度大于粒度阈值，重复步骤S1的操作，直至下一体素块中有效体素块细分后的新下一体素块的粒度小于等于粒度阈值，则将新下一分割点云添加语义标签作为场景语义分割结果。

实施例二

图2是本发明实施例二中的一种场景语义分割方法的流程图，本发明实施例的技术方案在上述技术方案的基础上进一步细化，具体主要包括如下步骤：

S210，如果所述体素块中有效体素块细分后的所述下一体素块的粒度大于所述粒度阈值，则所述下一体素块体素化后进行稀疏卷积得到所述下一体素块特征叠加在所述下一分割点云经所述多层感知机得到所述下一分割点云特征上，得到新下一分割点云；

S220，如果所述下一体素块中有效体素块细分的新下一体素块的粒度小于等于所述粒度阈值，则将所述新下一分割点云添加语义标签作为场景语义分割结果；

本发明实施例中，如果下一体素块中有效体素块八叉细分之后得到新下一体素块的粒度小于等于粒度阈值，则说明新下一体素块粒度细分到场景中最小对象对应的体素块空间体积大小，可以根据新下一分割点云特征确定语义标签作为场景语义分割的结果。

S230，如果所述下一体素块中有效体素块细分的新下一体素块的粒度大于所述粒度阈值，则将所述新下一体素特征和新下一分割点云特征，得到新新下一分割点云；直至所述新下一体素块中有效体素块细分后的新新下一体素块的粒度小于等于所述粒度阈值，则将所述新新下一分割点云语义添加语义标签作为场景语义分割结果。

本发明实施例中，新下一体素块特征可以理解为新下一体素块对应的体素空间中各点云特征的均值所对应的特征，即新下一体素块对应的特征。新下一分割点云特征可以理解为下一体素块特征叠加在下一点云特征上得到的点云对应的特征。新新下一分割点云可以理解为将新下一体素块特征叠加在新下一分割点云特征上得到的点云。

本发明实施例中，如果下一体素块中有效体素块细分后的新下一体素块的粒度大于粒度阈值，说明新下一体素块中有效体素块没有细分到场景原始点云中最小对象对应的体素块体积大小，需要对新下一体素块继续进行细分，再细分之前需要根据新下一体素块特征与新下一分割点云特征叠加得到叠加特征对应的新新下一分割点云。如果新新下一体素块的粒度小于粒度阈值，则根据新新下一分割点云添加语义标签作为场景语义分割结果。

将所述体素块特征与所述原始点云特征经去体素化叠加，得到所述下一分割点云。

本发明实施例中，去体素化可以理解为将体素块特征与原始点云特征叠加融合的。

实施例三

图3是本发明实施例三中的一种场景语义分割装置的结构示意图。该装置包括：点云确定模块310，标签添加模块320和结果输出模块330；

点云确定模块310，用于如果场景原始点云对应体素块的粒度大于粒度阈值，则根据所述体素块特征和原始点云特征，得到下一分割点云；

标签添加模块320，用于如果所述体素块中有效体素块细分后的下一体素块的粒度小于等于所述粒度阈值，则将所述下一分割点云添加语义标签作为场景语义分割结果；

结果输出模块330，用于如果所述体素块中有效体素块细分后的下一体素块的粒度大于所述粒度阈值，则根据所述下一体素块特征和下一分割点云特征，得到新下一分割点云；直至所述下一体素块中有效体素块细分后的新下一体素块的粒度小于等于所述粒度阈值，则将所述新下一分割点云添加语义标签作为场景语义分割结果。

进一步的，点云确定模块310具体用于：

进一步的，标签添加模块320具体还用于：

进一步的，标签添加模块320具体用于：

进一步的，标签添加模块320具体还用于，所述语义标签模型，包括：

进一步的，结果输出模块330具体用于：

进一步的，点云确定模块310具体用于：

本发明实施例所提供的场景语义分割装置可执行本发明任意实施例所提供的场景语义分割方法，具备执行方法相应的功能模块和有益效果。

实施例四

图4为本发明实施例四提供的一种电子设备的结构示意图。图4示出了适于用来实现本发明实施方式的示例性电子设备12的框图。图4显示的电子设备12仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图4所示，电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于：一个或者多个处理器或者处理单元16，系统存储器28，连接不同系统组件（包括系统存储器28和处理单元16）的总线18。

总线18表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构（ISA）总线，微通道体系结构（MAC）总线，增强型ISA总线、视频电子标准协会（VESA）局域总线以及外围组件互连（PCI）总线。

电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

系统存储器28可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器（RAM）30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统34可以用于读写不可移动的、非易失性磁介质（图4未显示，通常称为“硬盘驱动器”）。尽管图4中未示出，可以提供用于对可移动非易失性磁盘（例如“软盘”）读写的磁盘驱动器，以及对可移动非易失性光盘（例如CD-ROM, DVD-ROM或者其它光介质）读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品，该程序产品具有一组（例如至少一个）程序模块，这些程序模块被配置以执行本发明各实施例的功能。

具有一组（至少一个）程序模块42的程序/实用工具40，可以存储在例如存储器28中，这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。

电子设备12也可以与一个或多个外部设备14（例如键盘、指向设备、显示器24等）通信，还可与一个或者多个使得用户能与该电子设备12交互的设备通信，和/或与使得该电子设备12能与一个或多个其它计算设备进行通信的任何设备（例如网卡，调制解调器等等）通信。这种通信可以通过输入/输出（I/O）接口22进行。并且，电子设备12还可以通过网络适配器20与一个或者多个网络（例如局域网（LAN），广域网（WAN）和/或公共网络，例如因特网）通信。如图所示，网络适配器20通过总线18与电子设备12的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备12使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

处理单元16通过运行存储在系统存储器28中的程序，从而执行各种功能应用以及数据处理，例如实现本发明实施例所提供的场景语义分割方法，该方法包括：

实施例五

本发明实施例五还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时所述的场景语义分割方法，该方法包括：

本发明实施例的计算机存储介质，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子（非穷举的列表）包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器（RAM）、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络包括局域网(LAN)或广域网(WAN)连接到用户计算机，或者，可以连接到外部计算机（例如利用因特网服务提供商来通过因特网连接）。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种场景语义分割方法，其特征在于，包括：

如果所述体素块中有效体素块细分后的下一体素块的粒度大于所述粒度阈值，则叠加所述下一体素块特征和下一分割点云特征，得到新下一分割点云；直至所述下一体素块中有效体素块细分后的新下一体素块的粒度小于等于所述粒度阈值，则将所述新下一分割点云添加语义标签作为场景语义分割结果。

2.根据权利要求1所述的方法，其特征在于，所述如果场景原始点云对应体素块的粒度大于粒度阈值，则根据所述体素块特征和原始点云特征，得到下一分割点云，包括：

3.根据权利要求1所述的方法，其特征在于，所述如果所述体素块中有效体素块细分后的下一体素块的粒度小于等于所述粒度阈值，则将所述下一分割点云添加语义标签作为场景语义分割结果之前，包括：

4.根据权利要求1所述的方法，其特征在于，所述如果所述体素块中有效体素块细分后的下一体素块的粒度小于等于所述粒度阈值，则将所述下一分割点云添加语义标签作为场景语义分割结果，包括：

5.根据权利要求4所述的方法，其特征在于，所述语义标签模型，包括：

6.根据权利要求1所述的方法，其特征在于，所述如果所述体素块中有效体素块细分后的下一体素块的粒度大于所述粒度阈值，则根据所述下一体素块特征和下一分割点云特征，得到新下一分割点云；直至所述下一体素块中有效体素块细分后的新下一体素块的粒度小于等于所述粒度阈值，则将所述新下一分割点云添加语义标签作为场景语义分割结果，包括：

7.根据权利要求1所述的方法，其特征在于，所述体素块体素化后进行稀疏卷积得到所述体素特征叠加在所述原始点云经多层感知机得到所述原始点云特征上，得到下一分割点云，包括：

8.一种场景语义分割装置，其特征在于，包括：

结果输出模块，用于如果所述体素块中有效体素块细分后的下一体素块的粒度大于所述粒度阈值，则叠加所述下一体素块特征和下一分割点云特征，得到新下一分割点云；直至所述下一体素块中有效体素块细分后的新下一体素块的粒度小于等于所述粒度阈值，则将所述新下一分割点云添加语义标签作为场景语义分割结果。

9.一种电子设备，其特征在于，所述电子设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-7中任一所述的场景语义分割方法。