CN112446385B - 一种场景语义分割方法、装置、电子设备 - Google Patents

一种场景语义分割方法、装置、电子设备 Download PDF

Info

Publication number
CN112446385B
CN112446385B CN202110125033.9A CN202110125033A CN112446385B CN 112446385 B CN112446385 B CN 112446385B CN 202110125033 A CN202110125033 A CN 202110125033A CN 112446385 B CN112446385 B CN 112446385B
Authority
CN
China
Prior art keywords
point cloud
voxel
granularity
block
semantic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110125033.9A
Other languages
English (en)
Other versions
CN112446385A (zh
Inventor
方璐
季梦奇
毛适
王生进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202110125033.9A priority Critical patent/CN112446385B/zh
Publication of CN112446385A publication Critical patent/CN112446385A/zh
Application granted granted Critical
Publication of CN112446385B publication Critical patent/CN112446385B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Generation (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种场景语义分割方法、装置、电子设备,该方法包括:如果场景原始点云对应体素块的粒度大于粒度阈值,则根据所述体素块特征和原始点云特征,得到下一分割点云;如果所述有效体素块细分后下一体素块粒度小于等于所述粒度阈值,则根据所述下一分割点云添加语义标签作为场景语义分割结果;如果所述有效体素块细分后下一体素块粒度大于所述粒度阈值,则根据所述下一体素块特征和下一分割点云特征,得到新下一分割点云;直至所述有效体素块细分后的新下一体素块的粒度小于等于所述粒度阈值,则将所述新下一分割点云添加语义标签作为场景语义分割结果。本发明实施例在场景不同粒度下有足够上下文信息进行整合,减少计算复杂度。

Description

一种场景语义分割方法、装置、电子设备
技术领域
本发明实施例涉及计算机技术,尤其涉及种场景语义分割方法、装置、电子设备。
背景技术
随着自动驾驶、机器人、虚拟现实等技术领域的发展,对三维数据的处理与理解的要求逐渐提高。与已经取得很大成功的二维图像处理与理解不同,三维数据由于本身不具有二维图像有效的正则化的格点表达形式,给卷积神经网络的直接应用带来了很大的不便。
现有的技术手段主要有基于点的多层感知机或卷积网络的方法、基于图的方法以及基于体素的方法等。而处于室外大场景的三维数据的语义理解对这个问题提出了新的挑战,百万乃至上亿级别的点云数量要求处理方法需要拥有良好的计算复杂度,可以层级化的理解场景中不同尺度大小的对象。基于点的多层感知机方法起源于PointNet,可以有效的对目标点云形成特征表达。
但其全局池化操作不利于有效利用上下文信息,改进的多种点卷积方法存在K近邻查找和连续值卷积核计算的复杂度高等问题,且降采样时容易导致小目标物体难以被识别。基于图的方法将场景预分割为点集并构建超点图,利用图网络等方式进行处理,在超点图构建上复杂度高。基于体素的方法将场景离散化为体素表征,但是随着分辨率的提高,体素数量呈三次增长,巨量的存储和计算量使其不利于直接应用在大场景的大量级点云处理中。
发明内容
本发明提供一种图像处理方法、装置、电子设备,以实现精细结构不同的采样粒度的下拥有足够的上下文信息进行信息整合,减少计算的复杂度。
第一方面,本发明实施例提供了一种场景语义分割方法,该包括:
如果场景原始点云对应体素块的粒度大于粒度阈值,则根据所述体素块特征和原始点云特征,得到下一分割点云;
如果所述体素块中有效体素块细分后的下一体素块的粒度小于等于所述粒度阈值,则将所述下一分割点云添加语义标签作为场景语义分割结果;
如果所述体素块中有效体素块细分后的下一体素块的粒度大于所述粒度阈值,则根据所述下一体素块特征和下一分割点云特征,得到新下一分割点云;直至所述下一体素块中有效体素块细分后的新下一体素块的粒度小于等于所述粒度阈值,则将所述新下一分割点云添加语义标签作为场景语义分割结果。
进一步的,所述如果场景原始点云对应体素块的粒度大于粒度阈值,则根据所述体素块特征和原始点云特征,得到下一分割点云,包括:
如果场景原始点云对应体素块的粒度大于粒度阈值,则所述体素块体素化后进行稀疏卷积得到所述体素特征叠加在所述原始点云经多层感知机得到所述原始点云特征上,得到下一分割点云。
进一步的,所述如果所述体素块中有效体素块细分后的下一体素块的粒度小于等于所述粒度阈值,则将所述下一分割点云添加语义标签作为场景语义分割结果之前,包括:
将所述下一体素块对应点云输入语义复杂度预测网络,得到所述下一体素块的复杂度;
如果所述下一体素块的复杂度小于预设复杂度阈值,则将所述下一体素块添加无效标签;
如果所述下一体素块的复杂度大于预设复杂度阈值,则将所述下一体素块添加有效标签。
进一步的,所述如果所述体素块中有效体素块细分后的下一体素块的粒度小于等于所述粒度阈值,则将所述下一分割点云添加语义标签作为场景语义分割结果,包括:
如果所述下一体素块的粒度小于等于所述粒度阈值,则根据所述下一分割点云确定所述下一分割点云对应的特征向量;
将所述特征向量输入语义标签模型,添加所述下一分割点的语义标签并将所述下一分割点云添加语义标签作为所述场景语义分割结果。
进一步的,所述语义标签模型,包括:
将历史场景点云特征及所述历史场景点云的语义类别数量输入所述多层感知机,得到所述历史场景点云对应的特征向量;
根据所述历史场景点云对应的特征向量及历史场景点云真实语义标签输入深度学习语义标签网络进行训练,直至所述深度学习语义标签网络收敛,得到语义标签模型。
进一步的,所述如果所述体素块中有效体素块细分后的下一体素块的粒度大于所述粒度阈值,则根据所述下一体素块特征和下一分割点云特征,得到新下一分割点云;直至所述下一体素块中有效体素块细分后的新下一体素块的粒度小于等于所述粒度阈值,则将所述新下一分割点云添加语义标签作为场景语义分割结果,包括:
如果所述体素块中有效体素块细分后的所述下一体素块的粒度大于所述粒度阈值,则所述下一体素块体素化后进行稀疏卷积得到所述体素特征叠加在所述下一分割点云经所述多层感知机得到所述下一分割点云特征上,得到新下一分割点云;
如果所述下一体素块中有效体素块细分的新下一体素块的粒度小于等于所述粒度阈值,则将所述新下一分割点云添加语义标签作为场景语义分割结果;
如果所述下一体素块中有效体素块细分的新下一体素块的粒度大于所述粒度阈值,则将所述新下一体素特征和新下一分割点云特征,得到新新下一分割点云;直至所述新下一体素块中有效体素块细分后的新新下一体素块的粒度小于等于所述粒度阈值,则将所述新新下一分割点云语义添加语义标签作为场景语义分割结果。
进一步的,所述体素块体素化后进行稀疏卷积得到所述体素特征叠加在所述原始点云经多层感知机得到所述原始点云特征上,得到下一分割点云,包括:
将所述体素特征与所述原始点云特征经去体素化叠加,得到所述下一分割点云。
第二方面,本发明实施例还提供了一种场景语义分割装置,该装置包括:
点云确定模块,用于如果场景原始点云对应体素块的粒度大于粒度阈值,则根据所述体素块特征和原始点云特征,得到下一分割点云;
标签添加模块,用于如果所述体素块中有效体素块细分后的下一体素块的粒度小于等于所述粒度阈值,则将所述下一分割点云添加语义标签作为场景语义分割结果;
结果输出模块,用于如果所述体素块中有效体素块细分后的下一体素块的粒度大于所述粒度阈值,则根据所述下一体素块特征和下一分割点云特征,得到新下一分割点云;直至所述下一体素块中有效体素块细分后的新下一体素块的粒度小于等于所述粒度阈值,则将所述新下一分割点云添加语义标签作为场景语义分割结果。
第三方面,本发明实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现所述的场景语义分割方法。
第四方面,一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现所述的场景语义分割方法。
本发明通过如果场景原始点云对应体素块的粒度大于粒度阈值,则根据所述体素块特征和原始点云特征,得到下一分割点云;如果所述有效体素块细分后下一体素块粒度小于等于所述粒度阈值,则根据所述下一分割点云添加语义标签作为场景语义分割结果;如果所述有效体素块细分后下一体素块粒度大于所述粒度阈值,则根据所述下一体素块特征和下一分割点云特征,得到新下一分割点云;直至所述有效体素块细分后的新下一体素块的粒度小于等于所述粒度阈值,则将所述新下一分割点云添加语义标签作为场景语义分割结果。解决室外大场景在三维语义理解的过程中全局池化操作不利于有效利用上下文信息,而多种点卷积方法和连续值卷积核计算的复杂度高,在降采样时容易导致小目标物体难以辨识,大场景对应的大计算量降低了处理效率的问题,实现精细结构不同的采样粒度的下拥有足够的上下文信息进行信息整合,减少计算的复杂度效果。
附图说明
图1是本发明实施例一中的一种场景语义分割方法的流程图;
图1A是本发明实施例一中的一种场景语义分割方法的示例图;
图1B是本发明实施例一中的一种场景语义分割方法的流程图;
图2是本发明实施例二中的一种场景语义分割方法的流程图;
图3是本发明实施例三中的一种场景语义分割装置的结构示意图;
图4是本发明实施例四中的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种场景语义分割方法的流程图,本实施例可适用于室外大场景的三维数据的语义分割的情况,该方法可以由场景语义分割装置来执行,该装置可以通过软件和/硬件的方式来实现,并具体可继承于具备存储和计算能力来进行场景语义分割的电子设备中。
如图1所示,提供一种场景语义分割方法的,具体包括如下步骤:
S110,如果场景原始点云对应体素块的粒度大于粒度阈值,则根据所述体素块特征和原始点云特征,得到下一分割点云;
本发明实施例中,场景原始云点云可以理解为需要语义分割的场景使用采集设备 或三维重建的方式获取到的场景对应的原始点云。所述原始点云对应体素块可以理解为将 原始点云离散化得到比较粗糙的体素空间。例如:将场景对应的原始点云离散化为比较粗 糙的如
Figure 134686DEST_PATH_IMAGE001
体素空间,同时将场景对应的原始点云和体素空间之间建立 对应的哈希表,以便于对应查找。体素块的粒度可以理解为体素块对应的体素空间的实际 大小。粒度阈值可以理解为场景对应的体素空间包含的最小对象对应的体素块体积,例如: 场景对应的体素空间中包含的最小对应的体素块积为
Figure 130455DEST_PATH_IMAGE002
,则场景对应的预设最细粒 度为
Figure 706930DEST_PATH_IMAGE002
。体素块特征可以理解为体素块对应的体素空间中各点云特征的均值所对应 的特征,即体素块所对应的特征。原始点云特征可以理解为场景对应的原始点云所对应的 特征,即将原始点云输入多层感知机得到的对应的特征。下一分割点云可以理解为将体素 块特征叠加在原始点云特征上得到的点云。
本发明实施例中,将场景对应的原始点云和体素空间建立对应的哈希表,以便于 根据点云或者体素空间哈希表进行对应的查找。示例性的,假设原始点云总数目为N,离散 化后原始点云所占据的空间为
Figure 476040DEST_PATH_IMAGE003
,所有原始点云坐标点构成的集合为 P,则基于如下公式计算原始点云对应的体素块第d层级的第n个点坐标信息:
Figure 900199DEST_PATH_IMAGE004
公式(1)
其中,
Figure 519400DEST_PATH_IMAGE005
表示一个实数域上的3维向量;
Figure 98017DEST_PATH_IMAGE006
为第d层体素块中原始点云 特征;
Figure 906704DEST_PATH_IMAGE007
为第d层级点云特征对应的计算函数;
Figure 903479DEST_PATH_IMAGE008
为第d层体素块中原始点对应的坐 标。
本发明实施例中,假设每个有效体素块所对应的空间由
Figure 5165DEST_PATH_IMAGE009
表,其中,
Figure 306965DEST_PATH_IMAGE010
Figure DEST_PATH_IMAGE012A
为有效体素块的索引值;
Figure 287385DEST_PATH_IMAGE013
为第d层有效体素块的数量,则 基于如下公式计算原始点云与体素空间的对应关系
Figure 669825DEST_PATH_IMAGE014
Figure 411253DEST_PATH_IMAGE015
公式(2)
本发明实施例中,如果场景原始点云对应体素块的粒度大于粒度阈值,说明场景原始点云对应的体素块粒度没有细分到场景原始点云中最小对象对应的体素块体积大小,需要对场景原始点云对应体素块继续进行细分,在细分之前需要根据原始点云对应体素块与原始点云特征叠加得到叠加特征对应的下一分割点云。
S120,如果所述体素块中有效体素块细分后的下一体素块的粒度小于等于所述粒度阈值,则将所述下一分割点云添加语义标签作为场景语义分割结果;
本发明实施例中,体素块中有效体素块可以理解为符合预设复杂度阈值的体素块。下一体素块可以理解为原始点云对应体素块中有效体素块八叉细分后得到的体素块。语义标签可以理解为可以理解为场景中或图像中识别出物体的名称位置等信息。场景语义分割结果可以理解为根据场景对应的点云特征确定场景对应位置上对象的预测标签。
本发明实施例中,如果体素块中有效体素块八叉细分之后得到下一体素块的粒度小于等于粒度阈值,则说明下一体素块粒度细分到场景中最小对象对应的体素块空间体积大小,可以根据下一分割点云特征确定语义标签作为场景语义分割的结果。
S130,如果所述体素块中有效体素块细分后的下一体素块的粒度大于所述粒度阈值,则根据所述下一体素块特征和下一分割点云特征,得到新下一分割点云;直至所述下一体素块中有效体素块细分后的新下一体素块的粒度小于等于所述粒度阈值,则将所述新下一分割点云添加语义标签作为场景语义分割结果。
本发明实施例中,下一体素块特征可以理解为下一体素块对应的体素空间中各点云特征的均值所对应的特征,即下一体素块对应的特征。下一分割点云特征可以理解为体素块特征叠加在原始点云特特征上得到的点云对应的特征。新下一分割点云可以理解为将下一体素块特征叠加在下一分割点云特征上得到的点云。
本发明实施例中,如果体素块中有效体素块细分后的下一体素块的粒度大于粒度阈值,说明体素块中有效体素块没有细分到场景原始点云中最小对象对应的体素块体积大小,需要对下一体素块继续进行细分,在细分之前需要根据下一体素块特征与下一分割点云特征叠加得到叠加特征对应的新下一分割点云。如果新下一分割点云粒度小于粒度阈值,则根据新下一分割点云添加语义标签作为场景语义分割结果。
进一步的,所述如果场景原始点云对应体素块的粒度大于粒度阈值,则根据所述体素块特征和原始点云特征,得到下一分割点云,包括:
如果场景原始点云对应体素块的粒度大于粒度阈值,则所述体素块体素化后进行稀疏卷积得到所述体素特征叠加在所述原始点云经多层感知机得到所述原始点云特征上,得到下一分割点云。
本发明实施例中,体素化可以理解为将每个体素块对应的体素空间中的点云特征值进行平均得到均值所对应的特征作为每个体素块特征,用于得到每个体素块所对应的特征。稀疏卷积可以理解为一种有效的稀疏矩阵的计算方法,在保证准确定性的前提条件下具备仅在有效体素周围进行卷积运算的操作特点,用于整合上下文中的语义信息。多层感知机可以理解为一种前馈人工神经网络模型,其将输入的多个数据映射到单一的输出的数据集上。
本发明实施例中,如果场景原始点云对应体素块的粒度大于粒度阈值,说明场景原始点云对应的体素块粒度没有细分到场景原始点云中最小对象对应的体素块体积大小,需要将原始点云对应的体素块对应层级特征叠加到原始点云特征上对原始点云,强化原始点云上原始点云对应体素块特征,得到下一分割点云。其中,将强化原始点云上原始点云对应体素块特征,即是将原始点云对应的体素块特征与原始点云的特征进行融合,以保证场景中精细信息和上下文信息的融合。其中,下一分割点云包含原始点云对应的体素块特征叠加在原始点云特征上的叠加特征。
本发明实施例中,将体素块中每个体素块对应的空间中原始点云特征做平均,得 到每个体素块对应的特征。基于如下公式计算原始点云对应体素块中每个体素块的特征
Figure 449616DEST_PATH_IMAGE016
Figure 537789DEST_PATH_IMAGE017
公式(3)
基于如下公式融合体素块特征与原始点云的特征
Figure 243577DEST_PATH_IMAGE018
Figure 155907DEST_PATH_IMAGE019
公式(4)
其中,
Figure 947146DEST_PATH_IMAGE020
为原始点云多层感知机经特征变化后的特征向量;
Figure 42272DEST_PATH_IMAGE021
为体素块的特征经稀疏卷积后的特征向量;
Figure 602566DEST_PATH_IMAGE022
为概率为1的示性函数,表示 当
Figure 951377DEST_PATH_IMAGE023
时为1,否则为0。
示例性的,图1A为本发明实施例一中一种场景语义分割方法的示例图,如图1A所示,将场景对应的原始点云进行离散化后得到对应的体素块,对体素块进行体素化后,再做稀疏卷积整合上下文信息,得到体素块的特征并通过去体素化将该特征赋予对应的点云,同时场景对应的点云经层感知机得到原始点云特征,将体素块特征与原始点云特征进行叠加,得到新的融合特征。
进一步的,所述如果所述体素块中有效体素块细分后的下一体素块的粒度小于等于所述粒度阈值,则将所述下一分割点云添加语义标签作为场景语义分割结果之前,包括:
将所述下一体素块对应点云输入语义复杂度预测网络,得到所述下一体素块的复杂度;
如果所述下一体素块的复杂度小于预设复杂度阈值,则将所述下一体素块添加无效标签;
如果所述下一体素块的复杂度大于预设复杂度阈值,则将所述下一体素块添加有效标签。
本发明实施例中,语义复杂度预测网络可以理解为根据输入下一体素块的空间中对应点云的精细结构和语义结构确定下一体素块的空间中对应点云的复杂度的神经网络。其中,语义复杂度预测网络包括多个多层感知机、最大值池化及主成份分析等,语义复杂度预测网络可以是PointNet架构。体素块的复杂度可以理解为体素块空间中对应点云的精细结构和语义结构共同确定语义结构的复杂度。预设复杂度阈值可以理解为根据实际需求设置发复杂阈值。有效标签可以理解为体素块的复杂度在大于预设复杂度阈值被标注的唯一标记。无效标签可以理解为体素块的复杂度小于预设复杂度阈值被标注的唯一标记。
本发明实施例中,将下一体素块对应点云输入语义复杂度预测网络,计算出下一体素块的复杂度。需要根据下一体素块复杂度及预设复杂度阈值给下一体素块中每个体素块标记对应的有效性标签。当下一体素块的复杂度小于预设复杂度阈值的体素块添加无效标签;当下一体素块的复杂度大于预设复杂度阈值的体素块添加有效标签。当设置预设复杂度阈值较大时,对体素块的空间中对应点云的精细结构和语义结构对应的容限交较小,对应更多的体素块被标记为无效并在较浅层停止循环进行结果输出;当设置预设复杂度阈值较小时,对体素块的空间中对应点云的精细结构和语义结构对应的容限较大,对应较少的体素块被标记为无效并在较深层循环后进行结果输出。
本发明实施例中,语义复杂度预测网络中的PointNet架构,对每个有效体素块对 应的点,都输入相同的多层感知机得到变换的特征向量,通过最大值池化得到体素所对应 的特征向量,再通过一个多层感知机得到对语义复杂度的预测,利用最大池化算法在每个 维度上提取特征向量,以任意顺序输入的点云都能得到确定复杂性预测结果。基于如下公 式计算点云对应的体素块复杂度网络输出结果
Figure 167594DEST_PATH_IMAGE024
Figure 112417DEST_PATH_IMAGE025
公式(5)
本发明实施例中,精细结构和语义结构两部分,在精细结构实际上是点云对应的 体素块在几何方面,可以用平面拟合的残差值和主成分分析的第三维特征值等作为表征特 征进行约束。其中,主成分分析的特征方向表示对应的最大方差为点云对应的体素块在三 维空间上第三维度的特征值
Figure 277950DEST_PATH_IMAGE026
对应了二位平面拟合点云后的误差方差,作为几何维度网 络参数。在语义结构实际上是点云的经主成份分析预测的点云对应的语义标签数量
Figure 548394DEST_PATH_IMAGE027
作 为语义维度网络参数。其中,语义复杂度预测网络及其训练目标函数包括:
基于如下公式计算点云对应的体素块的复杂度参考值
Figure 303773DEST_PATH_IMAGE028
Figure 989969DEST_PATH_IMAGE029
公式(6)
其中,
Figure 541167DEST_PATH_IMAGE030
为点云对应的语义标签数量;
Figure 716934DEST_PATH_IMAGE031
点云对应的体素块在三维空间上第 三维度的特征值;
Figure 907744DEST_PATH_IMAGE032
为几何维度网络权重参数;
Figure 443636DEST_PATH_IMAGE033
为语义维度网络权重参数。
本发明实施例中,在语义复杂度预测网络中
Figure 567450DEST_PATH_IMAGE032
Figure 664850DEST_PATH_IMAGE033
的设置应用工程的需求确 定。在
Figure 405273DEST_PATH_IMAGE032
Figure 744856DEST_PATH_IMAGE033
总和一定条件下,当几何维度网络权重参数比语义维度网络权重参数的比 值越大代表几何维度对复杂度预测的结果影响越大;当语义维度网路权重参数比几何维度 网络权重参数的比值越大代表语义维度对复杂度预测的结果影响越大。其中,点云对应的 体素块的复杂度参考值
Figure 192018DEST_PATH_IMAGE028
作为预测网络的训练目标。
本发明实施例中,语义复杂度预测网络在训练过程中基于如下公式计算语义复杂 度预测网络的目标损失函数
Figure 460319DEST_PATH_IMAGE034
Figure 422459DEST_PATH_IMAGE035
公式(7)
其中,
Figure 254149DEST_PATH_IMAGE024
是点云对应体素块预测语义复杂度网络输出结果;
Figure 867402DEST_PATH_IMAGE028
是点云对应体素 块的复杂度参考值;
Figure 555872DEST_PATH_IMAGE036
是第
Figure 756040DEST_PATH_IMAGE036
层场景点云对应空间的体素块;
Figure 391421DEST_PATH_IMAGE037
是第
Figure 611179DEST_PATH_IMAGE036
层场景点云 对应体素块复杂度的输出。
Figure 736130DEST_PATH_IMAGE038
是第
Figure 158015DEST_PATH_IMAGE036
层场景点云对应空间的体素块体积。
进一步的,所述如果所述体素块中有效体素块细分后的下一体素块的粒度小于等于所述粒度阈值,则将所述下一分割点云添加语义标签作为场景语义分割结果,包括:
如果所述下一体素块的粒度小于等于所述粒度阈值,则根据所述下一分割点云确定所述下一分割点云对应的特征向量;
将所述特征向量输入语义标签模型,添加所述下一分割点的语义标签并将所述下一分割点云添加语义标签作为所述场景语义分割结果。
本发明实施例中,特征向量可以理解为下一分割点云特征及下一分割点云语义种类对应的特征向量。语义标签模型可以理解为预先训练好的识别点云特征向量并添加对应的语义标签的模型。
本发明实施例中,如果下一体素块的粒度小于等于粒度阈值,则说明下一体素块 粒度细分场景中最小对象对应的体素块空间体积大小,可以根据下一分割点云经多层感知 机计算出下一分割点云特征,在根据下一分割点云特征及预设语义标签数量经多层感知机
Figure 597087DEST_PATH_IMAGE039
计算出下一分割点云特征对应的特征向量。将下一分割点云特征对应的特征向 量输入语义标签模型,得到下一分割点云对应的语义标签,并将下一分割点添加语义标签 作为场景语义分割结果。
基于如下公式点云特征对应的特征向量
Figure 670085DEST_PATH_IMAGE040
Figure 215205DEST_PATH_IMAGE041
公式(8)
其中,
Figure 576916DEST_PATH_IMAGE042
是第
Figure 367149DEST_PATH_IMAGE043
层点云对应体素块复杂度的输出对应的语义标签数量;
Figure 294653DEST_PATH_IMAGE044
是第
Figure 745095DEST_PATH_IMAGE043
层点云对应体素块复杂度的输出对应的语义特征。
进一步的,所述语义标签模型,包括:
将历史场景点云特征及所述历史场景点云的语义类别数量输入所述多层感知机,得到所述历史场景点云对应的特征向量;
根据所述历史场景点云对应的特征向量及历史场景点云真实语义标签输入深度学习语义标签网络进行训练,直至所述深度学习语义标签网络收敛,得到语义标签模型。
本发明实施例中,历史场景点云特征可以理解为根据历史场景点云获取或提取的历史场景点云对应的特征。历史场景点云的语义类别数量可以理解为根据语义复杂度预测网络中主成份分析预测历史场景点云对应的语义类别的数量。深度学习语义标签网络可以理解为根据历史场景点云对应的特征向量和历史场景点云真实语义标签之间的内在规律和特征的标签网络。
本发明实施例中,将历史场景点云特征及历史场景点云的语义类别数量输入多层感知机,得到历史场景点云对应的特征向量;将历史场景点云对应的特征向量及场景点云真实语义标签输入深度学习语义标签网络进行训练,直至深度学习语义标签网络收敛,得到语义标签模型。
示例性的,对场景语义分割的实现方式有很多种,具体的:
图1B为本发明实施例一中一种场景语义分割方法的流程图,如图1B所示,利用激光雷达或三维重建方法得到场景对应的原始点云,将场景对应的原始点云离散化得到原始点云对应的体素块。S1,判断原始点云对应的体素块粒度是否大于粒度阈值,若原始点云对应的体素块的粒度小于等于粒度阈值,则将原始点输入多层感知机得到原始点云特征,再将原始点云特征及原始点云语义类别数量输入多层感知机得到原始点云对应的特征向量,将原始点云对应的特征向量输入语义标签模型,得到场景对应的语义标签;若原始点云对应的体素块的粒度大于粒度阈值,则将原始点云对应的体素块依次进行体素化和稀疏卷积,得到原始点云对应的体素块的特征与原始点云经多层感知机特征变化后的原始点云特征利用去体素化的方式进行叠加,得到叠加后的下一分割点云,同时将原始点云对应的体素块对应体素空间经PointNet架构,预测每个体素块的复杂度,将原始点云对应体素块中复杂度大于预设复杂度阈值的标记为有效,将原始点云对应体素块中复杂度小于等于预设复杂度阈值的标记为无效。S2,将标记为有效体素块进行八叉细分后得到下一体素块,判断下一体素块粒度是否大于粒度阈值,若下一体素块的粒度小于等于粒度阈值,则将下一分割点云输入多层感知机得到下一分割点云特征,再将下一分割点云特征及下一分割点云语义类别数量输入多层感知机得到下一分割点云对应的特征向量,将下一分割点云对应的特征向量输入语义标签模型,得到场景对应的语义标签;若下一体素块的粒度大于粒度阈值,重复步骤S1的操作,直至下一体素块中有效体素块细分后的新下一体素块的粒度小于等于粒度阈值,则将新下一分割点云添加语义标签作为场景语义分割结果。
本发明通过如果场景原始点云对应体素块的粒度大于粒度阈值,则根据所述体素块特征和原始点云特征,得到下一分割点云;如果所述有效体素块细分后下一体素块粒度小于等于所述粒度阈值,则根据所述下一分割点云添加语义标签作为场景语义分割结果;如果所述有效体素块细分后下一体素块粒度大于所述粒度阈值,则根据所述下一体素块特征和下一分割点云特征,得到新下一分割点云;直至所述有效体素块细分后的新下一体素块的粒度小于等于所述粒度阈值,则将所述新下一分割点云添加语义标签作为场景语义分割结果。解决室外大场景在三维语义理解的过程中全局池化操作不利于有效利用上下文信息,而多种点卷积方法和连续值卷积核计算的复杂度高,在降采样时容易导致小目标物体难以辨识,大场景对应的大计算量降低了处理效率的问题,实现精细结构不同的采样粒度的下拥有足够的上下文信息进行信息整合,减少计算的复杂度效果。
实施例二
图2是本发明实施例二中的一种场景语义分割方法的流程图,本发明实施例的技术方案在上述技术方案的基础上进一步细化,具体主要包括如下步骤:
S210,如果所述体素块中有效体素块细分后的所述下一体素块的粒度大于所述粒度阈值,则所述下一体素块体素化后进行稀疏卷积得到所述下一体素块特征叠加在所述下一分割点云经所述多层感知机得到所述下一分割点云特征上,得到新下一分割点云;
S220,如果所述下一体素块中有效体素块细分的新下一体素块的粒度小于等于所述粒度阈值,则将所述新下一分割点云添加语义标签作为场景语义分割结果;
本发明实施例中,如果下一体素块中有效体素块八叉细分之后得到新下一体素块的粒度小于等于粒度阈值,则说明新下一体素块粒度细分到场景中最小对象对应的体素块空间体积大小,可以根据新下一分割点云特征确定语义标签作为场景语义分割的结果。
S230,如果所述下一体素块中有效体素块细分的新下一体素块的粒度大于所述粒度阈值,则将所述新下一体素特征和新下一分割点云特征,得到新新下一分割点云;直至所述新下一体素块中有效体素块细分后的新新下一体素块的粒度小于等于所述粒度阈值,则将所述新新下一分割点云语义添加语义标签作为场景语义分割结果。
本发明实施例中,新下一体素块特征可以理解为新下一体素块对应的体素空间中各点云特征的均值所对应的特征,即新下一体素块对应的特征。新下一分割点云特征可以理解为下一体素块特征叠加在下一点云特征上得到的点云对应的特征。新新下一分割点云可以理解为将新下一体素块特征叠加在新下一分割点云特征上得到的点云。
本发明实施例中,如果下一体素块中有效体素块细分后的新下一体素块的粒度大于粒度阈值,说明新下一体素块中有效体素块没有细分到场景原始点云中最小对象对应的体素块体积大小,需要对新下一体素块继续进行细分,再细分之前需要根据新下一体素块特征与新下一分割点云特征叠加得到叠加特征对应的新新下一分割点云。如果新新下一体素块的粒度小于粒度阈值,则根据新新下一分割点云添加语义标签作为场景语义分割结果。
进一步的,所述体素块体素化后进行稀疏卷积得到所述体素特征叠加在所述原始点云经多层感知机得到所述原始点云特征上,得到下一分割点云,包括:
将所述体素块特征与所述原始点云特征经去体素化叠加,得到所述下一分割点云。
本发明实施例中,去体素化可以理解为将体素块特征与原始点云特征叠加融合的。
本发明通过如果场景原始点云对应体素块的粒度大于粒度阈值,则根据所述体素块特征和原始点云特征,得到下一分割点云;如果所述有效体素块细分后下一体素块粒度小于等于所述粒度阈值,则根据所述下一分割点云添加语义标签作为场景语义分割结果;如果所述有效体素块细分后下一体素块粒度大于所述粒度阈值,则根据所述下一体素块特征和下一分割点云特征,得到新下一分割点云;直至所述有效体素块细分后的新下一体素块的粒度小于等于所述粒度阈值,则将所述新下一分割点云添加语义标签作为场景语义分割结果。解决室外大场景在三维语义理解的过程中全局池化操作不利于有效利用上下文信息,而多种点卷积方法和连续值卷积核计算的复杂度高,在降采样时容易导致小目标物体难以辨识,大场景对应的大计算量降低了处理效率的问题,实现精细结构不同的采样粒度的下拥有足够的上下文信息进行信息整合,减少计算的复杂度效果。
实施例三
图3是本发明实施例三中的一种场景语义分割装置的结构示意图。该装置包括:点云确定模块310,标签添加模块320和结果输出模块330;
点云确定模块310,用于如果场景原始点云对应体素块的粒度大于粒度阈值,则根据所述体素块特征和原始点云特征,得到下一分割点云;
标签添加模块320,用于如果所述体素块中有效体素块细分后的下一体素块的粒度小于等于所述粒度阈值,则将所述下一分割点云添加语义标签作为场景语义分割结果;
结果输出模块330,用于如果所述体素块中有效体素块细分后的下一体素块的粒度大于所述粒度阈值,则根据所述下一体素块特征和下一分割点云特征,得到新下一分割点云;直至所述下一体素块中有效体素块细分后的新下一体素块的粒度小于等于所述粒度阈值,则将所述新下一分割点云添加语义标签作为场景语义分割结果。
进一步的,点云确定模块310具体用于:
如果场景原始点云对应体素块的粒度大于粒度阈值,则所述体素块体素化后进行稀疏卷积得到所述体素特征叠加在所述原始点云经多层感知机得到所述原始点云特征上,得到下一分割点云。
进一步的,标签添加模块320具体还用于:
将所述下一体素块对应点云输入语义复杂度预测网络,得到所述下一体素块的复杂度;
如果所述下一体素块的复杂度小于预设复杂度阈值,则将所述下一体素块添加无效标签;
如果所述下一体素块的复杂度大于预设复杂度阈值,则将所述下一体素块添加有效标签。
进一步的,标签添加模块320具体用于:
如果所述下一体素块的粒度小于等于所述粒度阈值,则根据所述下一分割点云确定所述下一分割点云对应的特征向量;
将所述特征向量输入语义标签模型,添加所述下一分割点的语义标签并将所述下一分割点云添加语义标签作为所述场景语义分割结果。
进一步的,标签添加模块320具体还用于,所述语义标签模型,包括:
将历史场景点云特征及所述历史场景点云的语义类别数量输入所述多层感知机,得到所述历史场景点云对应的特征向量;
根据所述历史场景点云对应的特征向量及历史场景点云真实语义标签输入深度学习语义标签网络进行训练,直至所述深度学习语义标签网络收敛,得到语义标签模型。
进一步的,结果输出模块330具体用于:
如果所述体素块中有效体素块细分后的所述下一体素块的粒度大于所述粒度阈值,则所述下一体素块体素化后进行稀疏卷积得到所述体素特征叠加在所述下一分割点云经所述多层感知机得到所述下一分割点云特征上,得到新下一分割点云;
如果所述下一体素块中有效体素块细分的新下一体素块的粒度小于等于所述粒度阈值,则将所述新下一分割点云添加语义标签作为场景语义分割结果;
如果所述下一体素块中有效体素块细分的新下一体素块的粒度大于所述粒度阈值,则将所述新下一体素特征和新下一分割点云特征,得到新新下一分割点云;直至所述新下一体素块中有效体素块细分后的新新下一体素块的粒度小于等于所述粒度阈值,则将所述新新下一分割点云语义添加语义标签作为场景语义分割结果。
进一步的,点云确定模块310具体用于:
将所述体素特征与所述原始点云特征经去体素化叠加,得到所述下一分割点云。
本发明实施例所提供的场景语义分割装置可执行本发明任意实施例所提供的场景语义分割方法,具备执行方法相应的功能模块和有益效果。
实施例四
图4为本发明实施例四提供的一种电子设备的结构示意图。图4示出了适于用来实现本发明实施方式的示例性电子设备12的框图。图4显示的电子设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM, DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该电子设备12交互的设备通信,和/或与使得该电子设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与电子设备12的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的场景语义分割方法,该方法包括:
如果场景原始点云对应体素块的粒度大于粒度阈值,则根据所述体素块特征和原始点云特征,得到下一分割点云;
如果所述体素块中有效体素块细分后的下一体素块的粒度小于等于所述粒度阈值,则将所述下一分割点云添加语义标签作为场景语义分割结果;
如果所述体素块中有效体素块细分后的下一体素块的粒度大于所述粒度阈值,则根据所述下一体素块特征和下一分割点云特征,得到新下一分割点云;直至所述下一体素块中有效体素块细分后的新下一体素块的粒度小于等于所述粒度阈值,则将所述新下一分割点云添加语义标签作为场景语义分割结果。
实施例五
本发明实施例五还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时所述的场景语义分割方法,该方法包括:
如果场景原始点云对应体素块的粒度大于粒度阈值,则根据所述体素块特征和原始点云特征,得到下一分割点云;
如果所述体素块中有效体素块细分后的下一体素块的粒度小于等于所述粒度阈值,则将所述下一分割点云添加语义标签作为场景语义分割结果;
如果所述体素块中有效体素块细分后的下一体素块的粒度大于所述粒度阈值,则根据所述下一体素块特征和下一分割点云特征,得到新下一分割点云;直至所述下一体素块中有效体素块细分后的新下一体素块的粒度小于等于所述粒度阈值,则将所述新下一分割点云添加语义标签作为场景语义分割结果。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络包括局域网(LAN)或广域网(WAN)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (9)

1.一种场景语义分割方法,其特征在于,包括:
如果场景原始点云对应体素块的粒度大于粒度阈值,则根据所述体素块特征和原始点云特征,得到下一分割点云;
如果所述体素块中有效体素块细分后的下一体素块的粒度小于等于所述粒度阈值,则将所述下一分割点云添加语义标签作为场景语义分割结果;
如果所述体素块中有效体素块细分后的下一体素块的粒度大于所述粒度阈值,则叠加所述下一体素块特征和下一分割点云特征,得到新下一分割点云;直至所述下一体素块中有效体素块细分后的新下一体素块的粒度小于等于所述粒度阈值,则将所述新下一分割点云添加语义标签作为场景语义分割结果。
2.根据权利要求1所述的方法,其特征在于,所述如果场景原始点云对应体素块的粒度大于粒度阈值,则根据所述体素块特征和原始点云特征,得到下一分割点云,包括:
如果场景原始点云对应体素块的粒度大于粒度阈值,则所述体素块体素化后进行稀疏卷积得到所述体素特征叠加在所述原始点云经多层感知机得到所述原始点云特征上,得到下一分割点云。
3.根据权利要求1所述的方法,其特征在于,所述如果所述体素块中有效体素块细分后的下一体素块的粒度小于等于所述粒度阈值,则将所述下一分割点云添加语义标签作为场景语义分割结果之前,包括:
将所述下一体素块对应点云输入语义复杂度预测网络,得到所述下一体素块的复杂度;
如果所述下一体素块的复杂度小于预设复杂度阈值,则将所述下一体素块添加无效标签;
如果所述下一体素块的复杂度大于预设复杂度阈值,则将所述下一体素块添加有效标签。
4.根据权利要求1所述的方法,其特征在于,所述如果所述体素块中有效体素块细分后的下一体素块的粒度小于等于所述粒度阈值,则将所述下一分割点云添加语义标签作为场景语义分割结果,包括:
如果所述下一体素块的粒度小于等于所述粒度阈值,则根据所述下一分割点云确定所述下一分割点云对应的特征向量;
将所述特征向量输入语义标签模型,添加所述下一分割点的语义标签并将所述下一分割点云添加语义标签作为所述场景语义分割结果。
5.根据权利要求4所述的方法,其特征在于,所述语义标签模型,包括:
将历史场景点云特征及所述历史场景点云的语义类别数量输入所述多层感知机,得到所述历史场景点云对应的特征向量;
根据所述历史场景点云对应的特征向量及历史场景点云真实语义标签输入深度学习语义标签网络进行训练,直至所述深度学习语义标签网络收敛,得到语义标签模型。
6.根据权利要求1所述的方法,其特征在于,所述如果所述体素块中有效体素块细分后的下一体素块的粒度大于所述粒度阈值,则根据所述下一体素块特征和下一分割点云特征,得到新下一分割点云;直至所述下一体素块中有效体素块细分后的新下一体素块的粒度小于等于所述粒度阈值,则将所述新下一分割点云添加语义标签作为场景语义分割结果,包括:
如果所述体素块中有效体素块细分后的所述下一体素块的粒度大于所述粒度阈值,则所述下一体素块体素化后进行稀疏卷积得到所述体素特征叠加在所述下一分割点云经所述多层感知机得到所述下一分割点云特征上,得到新下一分割点云;
如果所述下一体素块中有效体素块细分的新下一体素块的粒度小于等于所述粒度阈值,则将所述新下一分割点云添加语义标签作为场景语义分割结果;
如果所述下一体素块中有效体素块细分的新下一体素块的粒度大于所述粒度阈值,则将所述新下一体素特征和新下一分割点云特征,得到新新下一分割点云;直至所述新下一体素块中有效体素块细分后的新新下一体素块的粒度小于等于所述粒度阈值,则将所述新新下一分割点云语义添加语义标签作为场景语义分割结果。
7.根据权利要求1所述的方法,其特征在于,所述体素块体素化后进行稀疏卷积得到所述体素特征叠加在所述原始点云经多层感知机得到所述原始点云特征上,得到下一分割点云,包括:
将所述体素特征与所述原始点云特征经去体素化叠加,得到所述下一分割点云。
8.一种场景语义分割装置,其特征在于,包括:
点云确定模块,用于如果场景原始点云对应体素块的粒度大于粒度阈值,则根据所述体素块特征和原始点云特征,得到下一分割点云;
标签添加模块,用于如果所述体素块中有效体素块细分后的下一体素块的粒度小于等于所述粒度阈值,则将所述下一分割点云添加语义标签作为场景语义分割结果;
结果输出模块,用于如果所述体素块中有效体素块细分后的下一体素块的粒度大于所述粒度阈值,则叠加所述下一体素块特征和下一分割点云特征,得到新下一分割点云;直至所述下一体素块中有效体素块细分后的新下一体素块的粒度小于等于所述粒度阈值,则将所述新下一分割点云添加语义标签作为场景语义分割结果。
9.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的场景语义分割方法。
CN202110125033.9A 2021-01-29 2021-01-29 一种场景语义分割方法、装置、电子设备 Active CN112446385B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110125033.9A CN112446385B (zh) 2021-01-29 2021-01-29 一种场景语义分割方法、装置、电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110125033.9A CN112446385B (zh) 2021-01-29 2021-01-29 一种场景语义分割方法、装置、电子设备

Publications (2)

Publication Number Publication Date
CN112446385A CN112446385A (zh) 2021-03-05
CN112446385B true CN112446385B (zh) 2021-04-30

Family

ID=74740163

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110125033.9A Active CN112446385B (zh) 2021-01-29 2021-01-29 一种场景语义分割方法、装置、电子设备

Country Status (1)

Country Link
CN (1) CN112446385B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113052131B (zh) * 2021-04-20 2024-07-16 深圳市商汤科技有限公司 点云数据处理、自动驾驶车辆控制方法及装置
CN114387577A (zh) * 2021-06-09 2022-04-22 深圳市速腾聚创科技有限公司 数据处理方法、装置及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110674829A (zh) * 2019-09-26 2020-01-10 哈尔滨工程大学 一种基于图卷积注意网络的三维目标检测方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109410307B (zh) * 2018-10-16 2022-09-20 大连理工大学 一种场景点云语义分割方法
CN112257597B (zh) * 2020-10-22 2024-03-15 中国人民解放军战略支援部队信息工程大学 一种点云数据的语义分割方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110674829A (zh) * 2019-09-26 2020-01-10 哈尔滨工程大学 一种基于图卷积注意网络的三维目标检测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"A Fast Ground Segmentation Method for 3D Point Cloud";Phuong Chu 等;《 https://doi.org/10.3745/JIPS.02.0061》;20170630;全文 *
"CSPC-Dataset: New LiDAR Point Cloud Dataset and Benchmark for Large-Scale Scene Semantic Segmentation";GUOFENG TONG 等;《IEEE Acess》;20200506;全文 *
"基于上下文注意力CNN 的三维点云语义分割";杨军;《通信学报》;20200731;第41卷(第7期);全文 *

Also Published As

Publication number Publication date
CN112446385A (zh) 2021-03-05

Similar Documents

Publication Publication Date Title
JP6745328B2 (ja) 点群データを復旧するための方法及び装置
JP7128022B2 (ja) 完全教師あり学習用のデータセットの形成
CN111782838B (zh) 图像问答方法、装置、计算机设备和介质
JP7376233B2 (ja) ピクセルワイズ分類器による2dフロアプランのセマンティックセグメンテーション
CN108734210B (zh) 一种基于跨模态多尺度特征融合的对象检测方法
CN112446385B (zh) 一种场景语义分割方法、装置、电子设备
Liu et al. 3D Point cloud analysis
CN111052128B (zh) 用于检测和定位视频中的对象的描述符学习方法
JP2022078310A (ja) 画像分類モデル生成方法、装置、電子機器、記憶媒体、コンピュータプログラム、路側装置およびクラウド制御プラットフォーム
US20220270341A1 (en) Method and device of inputting annotation of object boundary information
CN115457492A (zh) 目标检测方法、装置、计算机设备及存储介质
EP4162443A1 (en) Three-dimensional map inconsistency detection using neural network
US20230237342A1 (en) Adaptive lookahead for planning and learning
CN114463603B (zh) 图像检测模型的训练方法、装置、电子设备及存储介质
CN116152334A (zh) 图像处理方法及相关设备
Lai et al. 3D semantic map construction system based on visual SLAM and CNNs
CN117037102A (zh) 对象跟随方法、装置、计算机设备和存储介质
CN115620082A (zh) 模型训练方法、头部姿态估计方法、电子设备及存储介质
Chen et al. Lightweight head pose estimation without keypoints based on multi-scale lightweight neural network
Tao et al. 3d semantic vslam of indoor environment based on mask scoring rcnn
CN115115699A (zh) 姿态估计方法、装置、相关设备和计算机产品
CN111765892B (zh) 一种定位方法、装置、电子设备及计算机可读存储介质
Chen et al. Underwater target detection and embedded deployment based on lightweight YOLO_GN
CN114022630A (zh) 三维场景的重建方法、装置、设备和计算机可读存储介质
Yu et al. Redundant same sequence point cloud registration

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant