WO2022088676A1

WO2022088676A1 - 三维点云语义分割方法、装置、设备及介质

Info

Publication number: WO2022088676A1
Application number: PCT/CN2021/097548
Authority: WO
Inventors: 李泽远; 王健宗; 肖京
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-10-29
Filing date: 2021-05-31
Publication date: 2022-05-05
Also published as: CN112287939A; CN112287939B

Abstract

本申请涉及人工智能技术领域，揭示了一种三维点云语义分割方法、装置、设备及介质，其中方法包括：采用预设空间单元格对待预测三维点云数据进行点云划分及量化判别得到目标点云数据；将目标点云数据输入点云语义类别预测模型中进行语义类别的概率预测得到目标点云数据的点云语义类别概率预测值，点云语义类别预测模型是基于PointSIFT神经网络模块和PointNet++神经网络训练得到的模型；根据点云语义类别概率预测值确定目标点云数据中每个点的目标语义类别。实现了针对复杂大尺度目标物体的点云进行快速且精确的逻辑划分，提高了点云分割的识别精度，而且可以较好的处理复杂目标物体的精细特征，提高了语义类别预测的准确度。

Description

三维点云语义分割方法、装置、设备及介质

本申请要求于2020年10月29日提交中国专利局、申请号为2020111821784，发明名称为“三维点云语义分割方法、装置、设备及介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及到人工智能技术领域，特别是涉及到一种三维点云语义分割方法、装置、设备及介质。

背景技术

近些年，随着自动驾驶、医疗诊断、增强和混合现实等依托点云的智能应用日益兴起，关于三维点云语义分割技术在深度学习方面的研究与应用显得尤为迫切与重要。现有三维点云语义分割技术包括：采用体素方法的深度学习分割技术、采用多视图方法的深度学习分割技术、采用点云方法的深度学习分割技术。

发明人意识到采用体素方法的深度学习分割技术，因为体素数据在表征物体时，为保证目标信息完整，往往具有较大的分辨率，当空间复杂度高时将导致对计算资源的开销过大；而为了保证计算效率，往往需要降低分辨率，而降低分辨率又会导致精度损失，使神经网络预测结构较为密集的目标物体往往性能不佳，导致该分割技术很难应用于复杂目标物体的点云语义分割中。

采用多视图方法的深度学习分割技术，网络对于多视角图片的输入有限，固定数量的多视图可能无法将三维模型完全表示出来，造成目标结构的信息丢失，比如，物体的自遮挡等，再加上二维图片本身也会有损失精度，从而无法在复杂、精细结构上进行点云的语义分割应用。

采用点云方法的深度学习分割技术，是研究直接输入点云数据进行处理的深度学习方法，对待预测三维点云数据的稀疏性问题做出改善，但仍未脱离从二维图像提取特征的方式，导致难以应用于复杂目标物体点云语义分割中。

技术问题

旨在解决现有技术的三维点云语义分割技术难以应用在复杂目标物体的点云语义分割的技术问题。

技术解决方案

本申请的主要目的为提供一种三维点云语义分割方法、装置、设备及介质，旨在解决现有技术的三维点云语义分割技术难以应用在复杂目标物体的点云语义分割的技术问题。

为了实现上述发明目的，本申请提出一种三维点云语义分割方法，所述方法包括：获取待预测三维点云数据；采用预设空间单元格对所述待预测三维点云数据进行点云划分及量化判别，得到目标点云数据；将所述目标点云数据输入点云语义类别预测模型中进行语义类别的概率预测，得到所述目标点云数据的点云语义类别概率预测值，所述点云语义类别预测模型是基于PointSIFT神经网络模块和PointNet++神经网络训练得到的模型；根据所述目标点云数据的点云语义类别概率预测值，确定所述目标点云数据中每个点的目标语义类别。

本申请还提出了一种三维点云语义分割装置，所述装置包括：点云获取模块，用于获取待预测三维点云数据；点云分割处理模块，用于采用预设空间单元格对所述待预测三维点云数据进行点云划分及量化判别，得到目标点云数据；概率预测模块，用于将所述目标点云数据输入点云语义类别预测模型中进行语义类别的概率预测，得到所述目标点云数据的点云语义类别概率预测值，所述点云语义类别预测模型是基于PointSIFT神经网络模块和PointNet++神经网络训练得到的模型；语义类别确定模块，用于根据所述目标点云数据的点云语义类别概率预测值，确定所述目标点云数据中每个点的目标语义类别。

本申请还提出了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现如下方法步骤：获取待预测三维点云数据；采用预设空间单元格对所述待预测三维点云数据进行点云划分及量化判别，得到目标点云数据；将所述目标点云数据输入点云语义类别预测模型中进行语义类别的概率预测，得到所述目标点云数据的点云语义类别概率预测值，所述点云语义类别预测模型是基于PointSIFT神经网络模块和PointNet++神经网络训练得到的模型；根据所述目标点云数据的点云语义类别概率预测值，确定所述目标点云数据中每个点的目标语义类别。

本申请还提出了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如下方法步骤：获取待预测三维点云数据；采用预设空间单元格对所述待预测三维点云数据进行点云划分及量化判别，得到目标点云数据；将所述目标点云数据输入点云语义类别预测模型中进行语义类别的概率预测，得到所述目标点云数据的点云语义类别概率预测值，所述点云语义类别预测模型是基于PointSIFT神经网络模块和PointNet++神经网络训练得到的模型；根据所述目标点云数据的点云语义类别概率预测值，确定所述目标点云数据中每个点的目标语义类别。

有益效果

本申请的三维点云语义分割方法、装置、设备及介质，通过采用预设空间单元格对待预测三维点云数据进行点云划分及量化判别得到目标点云数据，从而实现了针对复杂大尺度目标物体的点云进行快速且精确的逻辑划分，确保对目标物体具有良好的表征，从而提高了点云语义分割的识别精度；将目标点云数据输入点云语义类别预测模型中进行语义类别的概率预测，点云语义类别预测模型是基于PointSIFT神经网络模块和PointNet++神经网络训练得到的模型，因为PointNet++神经网络基于对PointNet特征提取块进行了延伸，加入了分层结构用于处理局部特征，取得了较好的分割结果，从而使点云语义类别预测模型可以较好的处理复杂目标物体的精细特征；又因为PointSIFT神经网络模块的尺度感知可以选择最具代表性的形状尺度，而PointSIFT神经网络模块的方向编码可以全面地感知不同方向的点云信息，从而提高了点云语义类别预测模型进行语义类别预测的准确度。

附图说明

图1为本申请一实施例的三维点云语义分割方法的流程示意图；

图2为本申请一实施例的三维点云语义分割装置的结构示意框图；

图3为本申请一实施例的计算机设备的结构示意框图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

本发明的实施方式

本申请使用的专业术语解释如下：

本申请的语义分割，是在像素级别上的分类，属于同一类的像素都要被归为一类，因此语义分割是从像素级别来理解图像的。比如说如下的照片，属于人的像素都要分成一类，属于摩托车的像素也要分成一类，除此之外还有背景像素也被分为一类。注意语义分割不同于实例分割，举例来说，如果一张照片中有多个人，对于语义分割来说，只要将所由人的像素都归为一类，但是实例分割还要将不同人的像素归为不同的类。也就是说实例分割比语义分割更进一步。

本申请的PointNet，其本质就是一种网络结构，按一定的规则输入点云数据，经过一层层地计算，得出分类结果或者分割结果。其中比较特殊的地方在于两个转换矩阵(inputtransform&featuretransform)的存在，根据文中所说，这两个转换矩阵可以在深度学习过程中保持点云数据的空间不变性。

本申请的PointNet++，是在PointNet上做出了改进，考虑了点云局部特征提取，从而更好地进行点云分类和分割。

本申请的RGB色彩模式，是工业界的一种颜色标准，是通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的，RGB即是代表红、绿、蓝三个通道的颜色，这个标准几乎包括了人类视力所能感知的所有颜色，是运用最广的颜色系统之一。

本申请的点云，是在逆向工程中通过测量仪器得到的产品外观表面的点数据集合，通常使用三维坐标测量机所得到的点数量比较少，点与点的间距也比较大，叫稀疏点云；而使用三维激光扫描仪或照相式扫描仪得到的点云，点数量比较大并且比较密集，叫密集点云。

为了解决现有技术的三维点云语义分割技术难以应用在复杂目标物体的点云语义分割的技术问题，本申请提出了三维点云语义分割方法，所述方法应用于人工智能技术领域，所述方法进一步应用于人工智能的神经网络技术领域。所述方法通过先采用空间单元格对待预测三维点云数据进行点云划分及量化判别，确保对目标物体进行良好的表征，再进行采用基于PointSIFT神经网络模块和PointNet++神经网络训练得到的模型进行语义类别的概率预测，以提升点云分割的识别精度。

参照图1，所述三维点云语义分割方法包括：

S1：获取待预测三维点云数据；

S2：采用预设空间单元格对所述待预测三维点云数据进行点云划分及量化判别，得到目标点云数据；

S3：将所述目标点云数据输入点云语义类别预测模型中进行语义类别的概率预测，得到所述目标点云数据的点云语义类别概率预测值，所述点云语义类别预测模型是基于PointSIFT神经网络模块和PointNet++神经网络训练得到的模型；

S4：根据所述目标点云数据的点云语义类别概率预测值，确定所述目标点云数据中每个点的目标语义类别。

本实施例通过采用预设空间单元格对待预测三维点云数据进行点云划分及量化判别得到目标点云数据，从而实现了针对复杂大尺度目标物体的点云进行快速且精确的逻辑划分，确保对目标物体具有良好的表征，从而提高了点云语义分割的识别精度；将目标点云数据输入点云语义类别预测模型中进行语义类别的概率预测，点云语义类别预测模型是基于PointSIFT神经网络模块和PointNet++神经网络训练得到的模型，因为PointNet++神经网络基于对PointNet特征提取块进行了延伸，加入了分层结构用于处理局部特征，取得了较好的分割结果，从而使点云语义类别预测模型可以较好的处理复杂目标物体的精细特征；又因为PointSIFT神经网络模块的尺度感知可以选择最具代表性的形状尺度，而PointSIFT神经网络模块的方向编码可以全面地感知不同方向的点云信息，从而提高了点云语义类别预测模型进行语义类别预测的准确度。

对于S1，可以从数据库中获取待预测三维点云数据。所述待预测三维点云数据，是指从目标物体外观表面获取的点数据集合。从目标物体外观表面提取点数据集合的方法包括但不限于：三维相机拍摄、雷达扫描。所述待预测三维点云数据包括：多个点的点描述数据。点描述数据包括：点的三维坐标。点的三维坐标是点在三维坐标系下的坐标数据，表述为(x，y，z)。

优选的，点描述数据还包括：点的颜色值。点的颜色值可以采用RGB色彩模式表述。

优选的，所述获取待预测三维点云数据的步骤，包括：S11：获取目标物体的所有三维点云数据；S12：从所述目标物体的所有三维点云数据中随机选择一个点作为选取点；S13：从所述目标物体的所有三维点云数据中，提取出以所述选取点为中心的预设范围内的所述三维点云数据，将提取出的所述三维点云数据作为所述待预测三维点云数据。

对于S11，从数据库中获取目标物体的所有点云数据。对于S12，从所述目标物体的所有三维点云数据对应的点云中随机选择一个点作为选取点。对于S13，将所述目标物体的所有三维点云数据对应的点云中的选取点及选取点周围预设范围内的点作为目标点云，将目标点云对应的点描述数据作为所述待预测三维点云数据。

优选的，将所述目标物体的所有三维点云数据对应的点云体积的1％对应的数值作为预设范围。

点云体积，是指可以容纳所有点云的最小直平行六面体的体积。直平行六面体包括：长方体、立方体。

对于S2，采用预设空间单元格对所述待预测三维点云数据进行点云划分，也就是将所述待预测三维点云数据对应的点云中的点划分到预设空间单元格中，每个点只属于一个预设空间单元格；然后对预设空间单元格中的点进行量化判别，当量化判别符合要求时将该预设空间单元格作为有效空间单元格；最后从有效空间单元格中进行点的选取，将选取的点对应的点描述数据作为一个有效空间单元格的目标点云数据，也就是说，每个有效空间单元格对应一个目标点云数据。

所述目标点云数据包括多个点的点描述数据(也就是点的三维坐标)。

优选的，所述目标点云数据的点描述数据包括：点的三维坐标、点的颜色值，从而有利于提高对所述目标点云数据进行语义类别的概率预测的准确性。

对于S3，将所述目标点云数据对应的点云中所有的点描述数据输入点云语义类别预测模型中进行语义类别的概率预测，得到所述目标点云数据对应的点云中每个点的语义类别概率预测值，将所述目标点云数据对应的点云中所有点的语义类别概率预测值作为所述目标点云数据的点云语义类别概率预测值。

可以理解的是，所述目标点云数据对应的点云中每个点包括多个语义类别概率预测值。所述多个语义类别概率预测值的具体数量和语义类别数量相同。

语义类别，是根据目标物体的作用和/或应用场景确定的点的分类。比如，当目标物体是船舶时，语义类别包括但不限于：底部分段结构、船舷分段结构、甲板分段结构、舱壁结构，在此举例不做具体限定。

其中，根据PointSIFT神经网络模块和PointNet++神经网络得到待训练模型，采用训练样本对待训练模型进行训练，将训练后的待训练模型作为点云语义类别预测模型。

对于S4，根据所述目标点云数据对应的点云中每个点的所述点云语义类别概率预测值，确定该点的目标语义类别。

在一个实施例中，上述采用预设空间单元格对所述待预测三维点云数据进行点云划分及量化判别，得到目标点云数据的步骤，包括：

S21：采用所述预设空间单元格对所述待预测三维点云数据进行离散划分，得到多个待处理空间单元格；

S22：对所述多个待处理空间单元格进行总体积计算，得到空间单元格总体积；

S23：对所述待处理空间单元格中的点云进行体积计算，得到所述待处理空间单元格的点云体积；

S24：分别将每一个所述待处理空间单元格的点云体积除以所述空间单元格总体积，得到多个所述待处理空间单元格的点云体积比例；

S25：判断每一个所述待处理空间单元格的点云体积比例是否大于预设比例阈值；

S26：当存在所述待处理空间单元格的点云体积比例大于所述预设比例阈值时，将所述待处理空间单元格的点云体积比例对应的所述待处理空间单元格作为有效空间单元格；

S27：从所述有效空间单元格中进行点的选取，得到所述目标点云数据。

对于S21，找出可以容纳所述待预测三维点云数据对应的点云的最小直平行六面体，采用预设空间单元格的尺寸将该直平行六面体依次划分为多个待处理空间单元格，从而实现将所述待预测三维点云数据对应的点云中的点划分到所述多个待处理空间单元格中。其中，多个待处理空间单元格中相邻的待处理空间单元格不重叠，所述待预测三维点云数据对应的点云中每个点只划分到一个待处理空间单元格中。预设空间单元格的尺寸包括：长度、宽度、高度。

对于S22，计算每个待处理空间单元格的体积，将所有待处理空间单元格的体积进行相加，得到空间单元格总体积。

对于S23，对多个待处理空间单元格中每个待处理空间单元格中的点云进行体积计算。其中，找出可以容纳所述待处理空间单元格中所有点的最小直平行六面体，计算找出的直平行六面体的体积，将计算得到的体积作为所述待处理空间单元格的点云体积。

对于S24，依次将每一个所述待处理空间单元格的点云体积除以所述空间单元格总体积，得到多个所述待处理空间单元格的点云体积比例，也就是说，每一个所述待处理空间单元格对应一个点云体积比例。

对于S25，预设比例阈值是一个比例值。

对于S26，通过在所述待处理空间单元格的点云体积比例大于所述预设比例阈值时，将待处理空间单元格作为有效空间单元格，有利于确保对目标物体具有良好的表征。

优选的，当所述待处理空间单元格的点云体积比例小于或等于所述预设比例阈值时，将所述待处理空间单元格的点云体积比例对应的所述待处理空间单元格丢弃。

对于S27，从所述有效空间单元格的点云中选取预设数量的点，将选取的点对应的点描述数据(也就是点的三维坐标)作为所述目标点云数据。

优选的，所述预设数量为8192。

优选的，所述预设数量为16384，从而实现了点云增量。

在一个实施例中，上述从所述有效空间单元格中进行点的选取，得到所述目标点云数据的步骤，包括：

S271：对所述有效空间单元格中的点云按预设数量进行点的随机选取，得到待处理点云数据；

S272：对所述待处理点云数据进行中心点计算，得到中心点坐标数据；

S273：将所述待处理点云数据中的每个点的坐标数据减去所述中心点坐标数据，得到所述待处理点云数据中的每个点的坐标差值；

S274：根据所述待处理点云数据的所有点的坐标数据和所述中心点坐标数据进行标准差计算，得到所述待处理点云数据的点云标准差；

S275：将所述待处理点云数据中的每个点的坐标差值除以所述点云标准差，得到所述目标点云数据。

本实施例实现了对待处理点云数据进行归一化操作，有利于提高语义识别的准确性。

对于S271，从所述有效空间单元格中的点云中随机选取出预设数量的点，将选取出的点对应的点描述数据(也就是点的三维坐标)作为待处理点云数据。也就是说，待处理点云数据中点描述数据的数量与预设数量相同。

对于S272，根据所述待处理点云数据中所有点描述数据的三维坐标进行中心点计算，得到中心点坐标数据，也就是说，中心点坐标数据是三维坐标系下的坐标数据。

对于S273，将所述待处理点云数据中的每个点的坐标数据中x轴坐标减去所述中心点坐标数据的x轴坐标，得到x差值；将所述待处理点云数据中的每个点的坐标数据中y轴坐标减去所述中心点坐标数据的y轴坐标，得到y差值；将所述待处理点云数据中的每个点的坐标数据中z轴坐标减去所述中心点坐标数据的z轴坐标，得到z差值；将x差值、y差值、z差值作为坐标差值。也就是说，每个坐标差值中同时包括一个x差值、一个y差值、一个z差值。坐标差值的数量可以为一个或多个。

对于S274，根据所述待处理点云数据的所有点的坐标数据的x轴坐标和所述中心点坐标数据的x轴坐标进行标准差计算，得到x标准差；根据所述待处理点云数据的所有点的坐标数据的y轴坐标和所述中心点坐标数据的y轴坐标进行标准差计算，得到y标准差；根据所述待处理点云数据的所有点的坐标数据的z轴坐标和所述中心点坐标数据的z轴坐标进行标准差计算，得到z标准差；将x标准差、y标准差、z标准差作为点云标准差。也就是说，点云标准差中同时包括一个x标准差、一个y标准差、一个z标准差。

对于S275，将所述待处理点云数据中的每个点的坐标差值中的x差值除以所述点云标准差中的x标准差，得到每个点的目标x值；将所述待处理点云数据中的每个点的坐标差值中的y差值除以所述点云标准差中的y标准差，得到每个点的目标y值；将所述待处理点云数据中的每个点的坐标差值中的z差值除以所述点云标准差中的z标准差，得到每个点的目标z值；将同一个点的目标x值、目标y值、目标z值作为该点的点描述数据的所述点的三维坐标，也就是说，所述目标点云数据包括多个点的点描述数据，每个点的点描述数据的三维坐标同时包括一个目标x值、一个目标y值、一个目标z值。

在一个实施例中，上述将所述目标点云数据输入点云语义类别预测模型中进行语义类别的概率预测，得到所述目标点云数据的点云语义类别概率预测值的步骤之前，还包括：

S031：获取多个训练样本，所述训练样本包括：点云样本数据、点云语义类别标定数据；

S032：将所述训练样本的所述点云样本数据输入待训练模型中进行语义类别的概率预测，得到所述训练样本的样本语义类别概率预测数据，其中，所述待训练模型是根据所述PointSIFT神经网络模块和所述PointNet++神经网络训练确定的模型；

S033：根据所述样本语义类别概率预测数据和所述点云语义类别标定数据对所述待训练模型进行训练，将训练结束的待训练模型作为所述点云语义类别预测模型。

本实施例实现了根据所述PointSIFT神经网络模块和所述PointNet++神经网络训练确定待训练模型，在对待训练模型进行训练得到点云语义类别预测模型，因为PointNet++神经网络基于对PointNet特征提取块进行了延伸，加入了分层结构用于处理局部特征，取得了较好的分割结果，从而使点云语义类别预测模型可以较好的处理复杂目标物体的精细特征；又因为PointSIFT神经网络模块的尺度感知可以选择最具代表性的形状尺度，而PointSIFT神经网络模块通过尺度感知和方向编码的关键属性，实现对三维点云在不同方向上进行尺度不变的信息编码，完成点云分割，从而提高了点云语义类别预测模型进行语义类别预测的准确度。

对于S031，可以从数据库中获取多个训练样本。每个训练样本包括一个点云样本数据、一个点云语义类别标定数据。点云样本数据中包括多个点的点描述数据(也就是点的三维坐标)，点云语义类别标定数据包括多个点的语义类别标定值。可以理解的是，点云样本数据中的每个点对应点云语义类别标定数据中的一个语义类别标定值。

优选的，语义类别标定值可以表述为向量，比如，语义类别共有5个，语义类别标定值向量对应的点云样本数据的点A，点A对应的语义类别标定值为[01000]，[01000]表示是第2个语义类别是专业人员对该点的语义类别的标定结果。

语义类别标定值是专业人员对点云样本数据的点根据该点的点描述数据进行的语义类别的标定结果。

对于S032，将所有所述训练样本的所述点云样本数据依次输入待训练模型中进行语义类别的概率预测，得到多个所述训练样本的样本语义类别概率预测数据。也就是说，每个训练样本对应一个样本语义类别概率预测数据。

根据所述PointSIFT神经网络模块和所述PointNet++神经网络的点集抽象模块及特征传播模块，确定待训练模型。PointSIFT神经网络模块用于进行方向编码及尺度感知。点集抽象模块用于进行下采样，特征传播模块用于进行上采样，下采样和上采样的过程采用对齐的方式。PointSIFT神经网络模块穿插在相邻的点集抽象模块和特征传播模块之间。待训练模型在上采样后通过一个全连接层得到样本语义类别概率预测数据。

对于点集抽象模块，又称为SA模块，SA是指Set Abstraction，具体方式可以从现有技术中选择，在此不做赘述。

对于特征传播模块，又称为FP模块，FP是指feature propagation，具体方式可以从现有技术中选择，在此不做赘述。

对于S033，根据所述样本语义类别概率预测数据和所述点云语义类别标定数据进行损失值计算及更新待训练模型的参数，满足训练结束条件时将完成参数更新的待训练模型作为所述点云语义类别预测模型。

在一个实施例中，所述待训练模型依次包括：多层感知器、第一深度学习模块、第一下采样层、第二深度学习模块、第二下采样层、第三深度学习模块、第三下采样层、第四深度学习模块、第一上采样层、第五深度学习模块、第二上采样层、第六深度学习模块、第三上采样层、第七深度学习模块、丢弃层、全连接层，所述第一深度学习模块、所述第二深度学习模块、所述第三深度学习模块、所述第四深度学习模块、所述第五深度学习模块、所述第六深度学习模块及所述第七深度学习模块采用所述PointSIFT神经网络模块，所述第一下采样层、所述第二下采样层及所述第三下采样层采用所述PointNet++神经网络的点集抽象模块，所述第一上采样层、所述第二上采样层及所述第三上采样层采用所述PointNet++神经网络的特征传播模块；以及，

所述将所述训练样本的所述点云样本数据输入待训练模型中进行语义类别的概率预测，得到所述训练样本的样本语义类别概率预测数据的步骤，包括：

S03201：将所述训练样本的所述点云样本数据输入所述多层感知器进行特征提取，得到第一特征向量；

S03202：将所述第一特征向量输入所述第一深度学习模块进行方向编码及尺度感知，得到第二特征向量；

S03203：将所述第二特征向量输入所述第一下采样层进行下采样，得到第三特征向量；

S03204：将所述第三特征向量输入所述第二深度学习模块进行方向编码及尺度感知，得到第四特征向量；

S03205：将所述第四特征向量输入所述第二下采样层进行下采样，得到第五特征向量；

S03206：将所述第五特征向量输入所述第三深度学习模块进行方向编码及尺度感知，得到第六特征向量；

S03207：将所述第六特征向量输入所述第三下采样层进行下采样，得到第七特征向量；

S03208：将所述第七特征向量输入所述第四深度学习模块进行方向编码及尺度感知，得到第八特征向量；

S03209：将所述第八特征向量输入所述第一上采样层进行上采样，得到第九特征向量；

S03210：将所述第九特征向量输入所述第五深度学习模块进行方向编码及尺度感知，得到第十特征向量；

S03211：将所述第十特征向量输入所述第二上采样层进行上采样，得到第十一特征向量；

S03212：将所述第十一特征向量输入所述第六深度学习模块进行方向编码及尺度感知，得到第十二特征向量；

S03213：将所述第十二特征向量输入所述第三上采样层进行上采样，得到第十三特征向量；

S03214：将所述第十三特征向量输入所述第七深度学习模块进行方向编码及尺度感知，得到第十四特征向量；

S03215：将所述第十四特征向量输入所述丢弃层进行随机丢弃，得到第十五特征向量；

S03216：将所述第十五特征向量输入所述全连接层进行连接，得到所述训练样本的样本语义类别概率预测数据。

本实施例通过点集抽象模块进行下采样，通过三个特征传播模块进行上采样，加入了分层结构用于处理局部特征，取得了较好的分割结果，从而使点云语义类别预测模型可以较好的处理复杂目标物体的精细特征；又因为七个PointSIFT神经网络模块的尺度感知可以选择最具代表性的形状尺度，而PointSIFT神经网络模块穿插在相邻的点集抽象模块和特征传播模块方向编码可以全面地感知不同方向的点云信息，从而提高了进行语义类别预测的准确度。

所述输入层将输入的数据转换为三通道的特征向量。比如，将输入的16384点的点描述数据(也就是点的三维坐标)转换为16384×3的特征向量，其中，16384×3中的(16384是特征向量的行数，也是点的数量，3是特征向量的列数，也是特征维度，3个特征维度描述点的x轴、y轴、z轴坐标数据)，在此举例不做具体限定。比如，将所述训练样本的所述点云样本数据(16384×3，16384是特征向量的行数，也是点的数量，3是特征向量的列数，也是特征维度)、第一特征向量(尺寸为16384×64，16384是特征向量的行数，也是点的数量，64是特征向量的列数，也是特征维度)、第三特征向量(尺寸为2048×128，2048是特征向量的行数，也是点的数量，128是特征向量的列数，也是特征维度)、第五特征向量(尺寸为256×256，256是特征向量的行数，也是点的数量，256是特征向量的列数，也是特征维度)、第七特征向量(尺寸为64×512，64是特征向量的行数，也是点的数量，512是特征向量的列数，也是特征维度)、第九特征向量(尺寸为256×512，256是特征向量的行数，也是点的数量，512是特征向量的列数，也是特征维度)、第十一特征向量(尺寸为2048×256，2048是特征向量的行数，也是点的数量，256是特征向量的列数，也是特征维度)、第十三特征向量(尺寸为16384×128，16384是特征向量的行数，也是点的数量，128是特征向量的列数，也是特征维度)，训练样本的样本语义类别概率预测数据(尺寸为16384×c，16384是特征向量的行数，也是点的数量，c是特征向量的列数，也是语义类别的数量)，在此举例不做具体限定。

对于多层感知器，通过多层感知机函数MLP和最大池化对称函数，输入的低维点云的点描述数据，映射成逐点的高维特征向量，并保持对称不变性。首先假设所述点云样本数据为x，x＝(N,D)存在于一个离散度量空间R ⁿ,并且有

代表点云数量的集合，D代表度量每个点的特征维度，且离散度量空间中N的密度是非均匀的。为了从无序点云中获取不丢失的几何信息，需构建一个对称函数g(也就是最大池化对称函数)，并把每个带有点描述数据的点映射到冗余的高维空间中。这里将所述点云样本数据x及其所包含的特征信息作为输入，由变换函数f实现对点云数量的集合N中每个点逐一标签并分割。在上述假设基础上，可以定义为存在一系列的无序点云数据集{x ₁，x ₂，……，x _n}(也就是所述点云样本数据)，且x _i∈R ^D,式为：f(x ₁，x ₂，……，x _n)≈g(h(x ₁)，h(x ₂)，……，h(x _n))

其中，对称函数g由最大池化实现，即D维特征的每一维都会选取N个点中对应的特征值总和或最大特征值。整体上，该式是将多层感知机MLP作为h函数用以特征提取，在高维空间下将该一系列单值函数的集合输入最大池化函数(也就是对称函数g)，并由γ网络进一步消化点云信息，从而获取到点云集合的属性，式为：

其中，γ()与h()函数属于多层感知器MLP的网络结构。

对于PointSIFT神经网络模块，SIFT这一特征描述子考虑了形态表达的两个基本特征：一是方向编码，它会在获取到匹配的特征点位置后，为各点分配方向；二是尺度感知，它能根据输入PointSIFT神经网络模块的数据选取最适合进行特征提取的尺寸大小。区别于人工设计的SIFT，PointSIFT是一个神经网络模块，它可以根据前置训练过程实现自我优化。PointSIFT的基本模块是方向编码单元，即Orientation-encoding unit，简称OE单元，它可在8个方向上进行卷积并提取特征。

为了更好地获取点云的特征信息，基于PointSIFT从不同的方向进行信息堆叠。首先，以P _n点为中心将三维空间划分为八个子空间，各子空间包含有八个不同的方向信息。对于P _n中心点和对应的n×d维特征向量Q _n，通过寻找距离P _n的最近邻点K _n，即可获得表征该子空间的近邻点特征，可以理解的是P _n的近邻点K _n的数量为8个，也就是每个子空间对应一个最近邻点K _n。若在某个子空间范围内，搜索半径内不存在目标点，则可用特征向量Q _n表示。同时，为了使卷积能够感知到方向信息，分别沿x轴、y轴、z轴进行三阶定向卷积，并把搜索到近邻点K _n的特征编码计入张量

其中，R ^a×b×c这三个维度对应x轴、y轴、z轴，三阶定向卷积公式如下：

N ₁＝g[Conv _x(A _x,N)]∈R ^2×2×1×d

N ₂＝g[Conv _y(A _y,N)]∈R ^2×1×1×d

N ₃＝g[Conv _z(A _z,N)]∈R ^1×1×1×d

其中，A _x，A _y，A _z是待预测模型的待更新的参数。

在三次卷积堆叠后，每个点P _n将转化成一个d维向量，该向量会包含着P _n附近邻域内的形状信息。可以看到，通过卷积堆叠多个方向编码单元，不同卷积层的方向编码单元即可感知到各方向的尺度信息，再通过shortcuts方式(捷径或直连方式)将前面各层的方向编码单元连接起来，提取到最终的尺度不变的特征信息，从而解决点云无序性和不变性问题。shortcuts方式包括：add(相加)或concat(向量串联)。

在一个实施例中，上述根据所述样本语义类别概率预测数据和所述点云语义类别标定数据对所述待训练模型进行训练，将训练结束的待训练模型作为所述点云语义类别预测模型的步骤，包括：

S0331：将所述样本语义类别概率预测数据和所述点云语义类别标定数据输入损失函数进行计算，得到所述待训练模型的损失值，根据所述损失值更新所述待训练模型的参数，更新后的所述待训练模型被用于下一次计算所述样本语义类别概率预测数据；

S0332：重复执行上述方法步骤直至所述损失值达到第一收敛条件或迭代次数达到第二收敛条件，将所述损失值达到第一收敛条件或迭代次数达到第二收敛条件的所述待训练模型，确定为所述点云语义类别预测模型；

其中，所述损失函数采用交叉熵函数。

本实施例实现了对待训练模型的训练。

所述第一收敛条件是指相邻两次计算的损失值的大小满足lipschitz条件(利普希茨连续条件)。所述迭代次数是指所述待训练模型被用于计算所述样本语义类别概率预测数据的次数，也就是说，计算一次，迭代次数增加1。第二收敛条件，是预设次数值。其中，交叉熵函数loss为：

y _i表示点云语义类别标定数据转化为独热向量后的第i个分量；

其中，训练样本的样本语义类别概率预测数据表述为

在一个实施例中，上述根据所述目标点云数据的点云语义类别概率预测值，确定所述目标点云数据中每个点的目标语义类别的步骤，包括：

S41：从所述点云语义类别概率预测值中进行同一点的语义类别概率预测值提取，得到目标语义类别概率预测值；

S42：从所述目标语义类别概率预测值中找出最大值，将找出的最大值对应的语义类别作为所述目标语义类别概率预测值对应的点的所述目标语义类别。

本实施例实现了根据点云语义类别概率预测值确定每个点的目标语义类别。

对于S41，从所述点云语义类别概率预测值中，提取出同一点对应的所有语义类别概率预测值，将提取得的语义类别概率预测值作为目标语义类别概率预测值。

对于S42，从同一点对应的所有目标语义类别概率预测值中找出最大值，将找到的最大值对应的语义类别作为该点的目标语义类别。

参照图2，本申请还提出了一种三维点云语义分割装置，所述装置包括：

点云获取模块100，用于获取待预测三维点云数据；

点云分割处理模块200，用于采用预设空间单元格对所述待预测三维点云数据进行点云划分及量化判别，得到目标点云数据；

概率预测模块300，用于将所述目标点云数据输入点云语义类别预测模型中进行语义类别的概率预测，得到所述目标点云数据的点云语义类别概率预测值，所述点云语义类别预测模型是基于PointSIFT神经网络模块和PointNet++神经网络训练得到的模型；

语义类别确定模块400，用于根据所述目标点云数据的点云语义类别概率预测值，确定所述目标点云数据中每个点的目标语义类别。

在一个实施例中，所述点云分割处理模块200包括：点云划分子模块、量化判别子模块、点选取子模块；所述点云划分子模块，用于采用所述预设空间单元格对所述待预测三维点云数据进行离散划分，得到多个待处理空间单元格；所述量化判别子模块，用于对所述多个待处理空间单元格进行总体积计算，得到空间单元格总体积，对所述待处理空间单元格中的点云进行体积计算，得到所述待处理空间单元格的点云体积，分别将每一个所述待处理空间单元格的点云体积除以所述空间单元格总体积，得到多个所述待处理空间单元格的点云体积比例，判断每一个所述待处理空间单元格的点云体积比例是否大于预设比例阈值，当存在所述待处理空间单元格的点云体积比例大于所述预设比例阈值时，将所述待处理空间单元格的点云体积比例对应的所述待处理空间单元格作为有效空间单元格；所述点选取子模块，用于从所述有效空间单元格中进行点的选取，得到所述目标点云数据。

在一个实施例中，所述点选取子模块包括：待处理点云确定单元、归一化处理单元；所述待处理点云确定单元，用于对所述有效空间单元格中的点云按预设数量进行点的随机选取，得到待处理点云数据；所述归一化处理单元，用于对所述待处理点云数据进行中心点计算，得到中心点坐标数据，将所述待处理点云数据中的每个点的坐标数据减去所述中心点坐标数据，得到所述待处理点云数据中的每个点的坐标差值，根据所述待处理点云数据的所有点的坐标数据和所述中心点坐标数据进行标准差计算，得到所述待处理点云数据的点云标准差，将所述待处理点云数据中的每个点的坐标差值除以所述点云标准差，得到所述目标点云数据。

在一个实施例中，所述装置还包括：模型训练模块；所述模型训练模块包括：样本获取子模块、训练子模块；所述样本获取子模块，用于获取多个训练样本，所述训练样本包括：点云样本数据、点云语义类别标定数据；所述训练子模块，用于将所述训练样本的所述点云样本数据输入待训练模型中进行语义类别的概率预测，得到所述训练样本的样本语义类别概率预测数据，其中，所述待训练模型是根据所述PointSIFT神经网络模块和所述PointNet++神经网络训练确定的模型，根据所述样本语义类别概率预测数据和所述点云语义类别标定数据对所述待训练模型进行训练，将训练结束的待训练模型作为所述点云语义类别预测模型。

所述训练子模块包括：样本预测单元；所述样本预测单元，用于将所述训练样本的所述点云样本数据输入所述多层感知器进行特征提取，得到第一特征向量，将所述第一特征向量输入所述第一深度学习模块进行方向编码及尺度感知，得到第二特征向量，将所述第二特征向量输入所述第一下采样层进行下采样，得到第三特征向量，将所述第三特征向量输入所述第二深度学习模块进行方向编码及尺度感知，得到第四特征向量，将所述第四特征向量输入所述第二下采样层进行下采样，得到第五特征向量，将所述第五特征向量输入所述第三深度学习模块进行方向编码及尺度感知，得到第六特征向量，将所述第六特征向量输入所述第三下采样层进行下采样，得到第七特征向量，将所述第七特征向量输入所述第四深度学习模块进行方向编码及尺度感知，得到第八特征向量，将所述第八特征向量输入所述第一上采样层进行上采样，得到第九特征向量，将所述第九特征向量输入所述第五深度学习模块进行方向编码及尺度感知，得到第十特征向量，将所述第十特征向量输入所述第二上采样层进行上采样，得到第十一特征向量，将所述第十一特征向量输入所述第六深度学习模块进行方向编码及尺度感知，得到第十二特征向量，将所述第十二特征向量输入所述第三上采样层进行上采样，得到第十三特征向量，将所述第十三特征向量输入所述第七深度学习模块进行方向编码及尺度感知，得到第十四特征向量，将所述第十四特征向量输入所述丢弃层进行随机丢弃，得到第十五特征向量，将所述第十五特征向量输入所述全连接层进行连接，得到所述训练样本的样本语义类别概率预测数据。

在一个实施例中，所述训练子模块包括包括：训练单元；所述训练单元，用于将所述样本语义类别概率预测数据和所述点云语义类别标定数据输入损失函数进行计算，得到所述待训练模型的损失值，根据所述损失值更新所述待训练模型的参数，更新后的所述待训练模型被用于下一次计算所述样本语义类别概率预测数据，重复执行上述方法步骤直至所述损失值达到第一收敛条件或迭代次数达到第二收敛条件，将所述损失值达到第一收敛条件或迭代次数达到第二收敛条件的所述待训练模型，确定为所述点云语义类别预测模型，其中，所述损失函数采用交叉熵函数。

在一个实施例中，语义类别确定模块400包括：目标目标语义类别概率预测值提取子模块、目标语义类别确定子模块；所述目标目标语义类别概率预测值提取子模块，用于从所述点云语义类别概率预测值中进行同一点的语义类别概率预测值提取，得到目标语义类别概率预测值；所述目标语义类别确定子模块，用于从所述目标语义类别概率预测值中找出最大值，将找出的最大值对应的语义类别作为所述目标语义类别概率预测值对应的点的所述目标语义类别。

参照图3，本申请实施例中还提供一种计算机设备，该计算机设备可以是服务器，其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于储存三维点云语义分割方法等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种三维点云语义分割方法。所述三维点云语义分割方法，包括：获取待预测三维点云数据；采用预设空间单元格对所述待预测三维点云数据进行点云划分及量化判别，得到目标点云数据；将所述目标点云数据输入点云语义类别预测模型中进行语义类别的概率预测，得到所述目标点云数据的点云语义类别概率预测值，所述点云语义类别预测模型是基于PointSIFT神经网络模块和PointNet++神经网络训练得到的模型；根据所述目标点云数据的点云语义类别概率预测值，确定所述目标点云数据中每个点的目标语义类别。本实施例通过采用预设空间单元格对待预测三维点云数据进行点云划分及量化判别得到目标点云数据，从而实现了针对复杂大尺度目标物体的点云进行快速且精确的逻辑划分，确保对目标物体具有良好的表征，从而提高了点云语义分割的识别精度；将目标点云数据输入点云语义类别预测模型中进行语义类别的概率预测，点云语义类别预测模型是基于PointSIFT神经网络模块和PointNet++神经网络训练得到的模型，因为PointNet++神经网络基于对PointNet特征提取块进行了延伸，加入了分层结构用于处理局部特征，取得了较好的分割结果，从而使点云语义类别预测模型可以较好的处理复杂目标物体的精细特征；又因为 PointSIFT神经网络模块的尺度感知可以选择最具代表性的形状尺度，而PointSIFT神经网络模块的方向编码可以全面地感知不同方向的点云信息，从而提高了点云语义类别预测模型进行语义类别预测的准确度。

本申请一实施例还提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现一种三维点云语义分割方法，包括步骤：获取待预测三维点云数据；采用预设空间单元格对所述待预测三维点云数据进行点云划分及量化判别，得到目标点云数据；将所述目标点云数据输入点云语义类别预测模型中进行语义类别的概率预测，得到所述目标点云数据的点云语义类别概率预测值，所述点云语义类别预测模型是基于PointSIFT神经网络模块和PointNet++神经网络训练得到的模型；根据所述目标点云数据的点云语义类别概率预测值，确定所述目标点云数据中每个点的目标语义类别。上述执行的三维点云语义分割方法，通过采用预设空间单元格对待预测三维点云数据进行点云划分及量化判别得到目标点云数据，从而实现了针对复杂大尺度目标物体的点云进行快速且精确的逻辑划分，确保对目标物体具有良好的表征，从而提高了点云语义分割的识别精度；将目标点云数据输入点云语义类别预测模型中进行语义类别的概率预测，点云语义类别预测模型是基于PointSIFT神经网络模块和PointNet++神经网络训练得到的模型，因为PointNet++神经网络基于对PointNet特征提取块进行了延伸，加入了分层结构用于处理局部特征，取得了较好的分割结果，从而使点云语义类别预测模型可以较好的处理复杂目标物体的精细特征；又因为PointSIFT神经网络模块的尺度感知可以选择最具代表性的形状尺度，而PointSIFT神经网络模块的方向编码可以全面地感知不同方向的点云信息，从而提高了点云语义类别预测模型进行语义类别预测的准确度。

所述计算机可读存储介质可以是非易失性，也可以是易失性。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上所述仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种三维点云语义分割方法，其中，所述方法包括：

获取待预测三维点云数据；

采用预设空间单元格对所述待预测三维点云数据进行点云划分及量化判别，得到目标点云数据；

将所述目标点云数据输入点云语义类别预测模型中进行语义类别的概率预测，得到所述目标点云数据的点云语义类别概率预测值，所述点云语义类别预测模型是基于PointSIFT神经网络模块和PointNet++神经网络训练得到的模型；

根据所述目标点云数据的点云语义类别概率预测值，确定所述目标点云数据中每个点的目标语义类别。
根据权利要求1所述的三维点云语义分割方法，其中，所述采用预设空间单元格对所述待预测三维点云数据进行点云划分及量化判别，得到目标点云数据的步骤，包括：

采用所述预设空间单元格对所述待预测三维点云数据进行离散划分，得到多个待处理空间单元格；

对所述多个待处理空间单元格进行总体积计算，得到空间单元格总体积；

对所述待处理空间单元格中的点云进行体积计算，得到所述待处理空间单元格的点云体积；

分别将每一个所述待处理空间单元格的点云体积除以所述空间单元格总体积，得到多个所述待处理空间单元格的点云体积比例；

判断每一个所述待处理空间单元格的点云体积比例是否大于预设比例阈值；

当存在所述待处理空间单元格的点云体积比例大于所述预设比例阈值时，将所述待处理空间单元格的点云体积比例对应的所述待处理空间单元格作为有效空间单元格；

从所述有效空间单元格中进行点的选取，得到所述目标点云数据。
根据权利要求2所述的三维点云语义分割方法，其中，所述从所述有效空间单元格中进行点的选取，得到所述目标点云数据的步骤，包括：

对所述有效空间单元格中的点云按预设数量进行点的随机选取，得到待处理点云数据；

对所述待处理点云数据进行中心点计算，得到中心点坐标数据；

将所述待处理点云数据中的每个点的坐标数据减去所述中心点坐标数据，得到所述待处理点云数据中的每个点的坐标差值；

根据所述待处理点云数据的所有点的坐标数据和所述中心点坐标数据进行标准差计算，得到所述待处理点云数据的点云标准差；

将所述待处理点云数据中的每个点的坐标差值除以所述点云标准差，得到所述目标点云数据。
根据权利要求1所述的三维点云语义分割方法，其中，所述将所述目标点云数据输入点云语义类别预测模型中进行语义类别的概率预测，得到所述目标点云数据的点云语义类别概率预测值的步骤之前，还包括：

获取多个训练样本，所述训练样本包括：点云样本数据、点云语义类别标定数据；

将所述训练样本的所述点云样本数据输入待训练模型中进行语义类别的概率预测，得到所述训练样本的样本语义类别概率预测数据，其中，所述待训练模型是根据所述PointSIFT神经网络模块和所述PointNet++神经网络训练确定的模型；

根据所述样本语义类别概率预测数据和所述点云语义类别标定数据对所述待训练模型进行训练，将训练结束的待训练模型作为所述点云语义类别预测模型。
根据权利要求4所述的三维点云语义分割方法，其中，所述待训练模型依次包括：多层感知器、第一深度学习模块、第一下采样层、第二深度学习模块、第二下采样层、第三深度学习模块、第三下采样层、第四深度学习模块、第一上采样层、第五深度学习模块、第二上采样层、第六深度学习模块、第三上采样层、第七深度学习模块、丢弃层、全连接层，所述第一深度学习模块、所述第二深度学习模块、所述第三深度学习模块、所述第四深度学习模块、所述第五深度学习模块、所述第六深度学习模块及所述第七深度学习模块采用所述PointSIFT神经网络模块，所述第一下采样层、所述第二下采样层及所述第三下采样层采用所述PointNet++神经网络的点集抽象模块，所述第一上采样层、所述第二上采样层及所述第三上采样层采用所述PointNet++神经网络的特征传播模块；以及，

所述将所述训练样本的所述点云样本数据输入待训练模型中进行语义类别的概率预测，得到所述训练样本的样本语义类别概率预测数据的步骤，包括：

将所述训练样本的所述点云样本数据输入所述多层感知器进行特征提取，得到第一特征向量；

将所述第一特征向量输入所述第一深度学习模块进行方向编码及尺度感知，得到第二特征向量；

将所述第二特征向量输入所述第一下采样层进行下采样，得到第三特征向量；

将所述第三特征向量输入所述第二深度学习模块进行方向编码及尺度感知，得到第四特征向量；

将所述第四特征向量输入所述第二下采样层进行下采样，得到第五特征向量；

将所述第五特征向量输入所述第三深度学习模块进行方向编码及尺度感知，得到第六特征向量；

将所述第六特征向量输入所述第三下采样层进行下采样，得到第七特征向量；

将所述第七特征向量输入所述第四深度学习模块进行方向编码及尺度感知，得到第八特征向量；

将所述第八特征向量输入所述第一上采样层进行上采样，得到第九特征向量；

将所述第九特征向量输入所述第五深度学习模块进行方向编码及尺度感知，得到第十特征向量；

将所述第十特征向量输入所述第二上采样层进行上采样，得到第十一特征向量；

将所述第十一特征向量输入所述第六深度学习模块进行方向编码及尺度感知，得到第十二特征向量；

将所述第十二特征向量输入所述第三上采样层进行上采样，得到第十三特征向量；

将所述第十三特征向量输入所述第七深度学习模块进行方向编码及尺度感知，得到第十四特征向量；

将所述第十四特征向量输入所述丢弃层进行随机丢弃，得到第十五特征向量；

将所述第十五特征向量输入所述全连接层进行连接，得到所述训练样本的样本语义类别概率预测数据。
根据权利要求4所述的三维点云语义分割方法，其中，所述根据所述样本语义类别概率预测数据和所述点云语义类别标定数据对所述待训练模型进行训练，将训练结束的待训练模型作为所述点云语义类别预测模型的步骤，包括：

将所述样本语义类别概率预测数据和所述点云语义类别标定数据输入损失函数进行计算，得到所述待训练模型的损失值，根据所述损失值更新所述待训练模型的参数，更新后的所述待训练模型被用于下一次计算所述样本语义类别概率预测数据；

重复执行上述方法步骤直至所述损失值达到第一收敛条件或迭代次数达到第二收敛条件，将所述损失值达到第一收敛条件或迭代次数达到第二收敛条件的所述待训练模型，确定为所述点云语义类别预测模型；

其中，所述损失函数采用交叉熵函数。
根据权利要求1所述的三维点云语义分割方法，其中，所述根据所述目标点云数据的点云语义类别概率预测值，确定所述目标点云数据中每个点的目标语义类别的步骤，包括：

从所述点云语义类别概率预测值中进行同一点的语义类别概率预测值提取，得到目标语义类别概率预测值；

从所述目标语义类别概率预测值中找出最大值，将找出的最大值对应的语义类别作为所述目标语义类别概率预测值对应的点的所述目标语义类别。
一种三维点云语义分割装置，其中，所述装置包括：

点云获取模块，用于获取待预测三维点云数据；

点云分割处理模块，用于采用预设空间单元格对所述待预测三维点云数据进行点云划分及量化判别，得到目标点云数据；

概率预测模块，用于将所述目标点云数据输入点云语义类别预测模型中进行语义类别的概率预测，得到所述目标点云数据的点云语义类别概率预测值，所述点云语义类别预测模型是基于PointSIFT神经网络模块和PointNet++神经网络训练得到的模型；

语义类别确定模块，用于根据所述目标点云数据的点云语义类别概率预测值，确定所述目标点云数据中每个点的目标语义类别。
一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其中，所述处理器执行所述计算机程序时实现如下方法步骤：

获取待预测三维点云数据；

采用预设空间单元格对所述待预测三维点云数据进行点云划分及量化判别，得到目标点云数据；

将所述目标点云数据输入点云语义类别预测模型中进行语义类别的概率预测，得到所述目标点云数据的点云语义类别概率预测值，所述点云语义类别预测模型是基于PointSIFT神经网络模块和PointNet++神经网络训练得到的模型；

根据所述目标点云数据的点云语义类别概率预测值，确定所述目标点云数据中每个点的目标语义类别。
根据权利要求9所述的计算机设备，其中，所述采用预设空间单元格对所述待预测三维点云数据进行点云划分及量化判别，得到目标点云数据的步骤，包括：

采用所述预设空间单元格对所述待预测三维点云数据进行离散划分，得到多个待处理空间单元格；

对所述多个待处理空间单元格进行总体积计算，得到空间单元格总体积；

对所述待处理空间单元格中的点云进行体积计算，得到所述待处理空间单元格的点云体积；

分别将每一个所述待处理空间单元格的点云体积除以所述空间单元格总体积，得到多个所述待处理空间单元格的点云体积比例；

判断每一个所述待处理空间单元格的点云体积比例是否大于预设比例阈值；

当存在所述待处理空间单元格的点云体积比例大于所述预设比例阈值时，将所述待处理空间单元格的点云体积比例对应的所述待处理空间单元格作为有效空间单元格；

从所述有效空间单元格中进行点的选取，得到所述目标点云数据。
根据权利要求10所述的计算机设备，其中，所述从所述有效空间单元格中进行点的选取，得到所述目标点云数据的步骤，包括：

对所述有效空间单元格中的点云按预设数量进行点的随机选取，得到待处理点云数据；

对所述待处理点云数据进行中心点计算，得到中心点坐标数据；

将所述待处理点云数据中的每个点的坐标数据减去所述中心点坐标数据，得到所述待处理点云数据中的每个点的坐标差值；

根据所述待处理点云数据的所有点的坐标数据和所述中心点坐标数据进行标准差计算，得到所述待处理点云数据的点云标准差；

将所述待处理点云数据中的每个点的坐标差值除以所述点云标准差，得到所述目标点云数据。
根据权利要求9所述的计算机设备，其中，所述将所述目标点云数据输入点云语义类别预测模型中进行语义类别的概率预测，得到所述目标点云数据的点云语义类别概率预测值的步骤之前，还包括：

获取多个训练样本，所述训练样本包括：点云样本数据、点云语义类别标定数据；

将所述训练样本的所述点云样本数据输入待训练模型中进行语义类别的概率预测，得到所述训练样本的样本语义类别概率预测数据，其中，所述待训练模型是根据所述PointSIFT神经网络模块和所述PointNet++神经网络训练确定的模型；

根据所述样本语义类别概率预测数据和所述点云语义类别标定数据对所述待训练模型进行训练，将训练结束的待训练模型作为所述点云语义类别预测模型。
根据权利要求12所述的计算机设备，其中，所述待训练模型依次包括：多层感知器、第一深度学习模块、第一下采样层、第二深度学习模块、第二下采样层、第三深度学习模块、第三下采样层、第四深度学习模块、第一上采样层、第五深度学习模块、第二上采样层、第六深度学习模块、第三上采样层、第七深度学习模块、丢弃层、全连接层，所述第一深度学习模块、所述第二深度学习模块、所述第三深度学习模块、所述第四深度学习模块、所述第五深度学习模块、所述第六深度学习模块及所述第七深度学习模块采用所述PointSIFT神经网络模块，所述第一下采样层、所述第二下采样层及所述第三下采样层采用所述PointNet++神经网络的点集抽象模块，所述第一上采样层、所述第二上采样层及所述第三上采样层采用所述PointNet++神经网络的特征传播模块；以及，

所述将所述训练样本的所述点云样本数据输入待训练模型中进行语义类别的概率预测，得到所述训练样本的样本语义类别概率预测数据的步骤，包括：

将所述训练样本的所述点云样本数据输入所述多层感知器进行特征提取，得到第一特征向量；

将所述第一特征向量输入所述第一深度学习模块进行方向编码及尺度感知，得到第二特征向量；

将所述第二特征向量输入所述第一下采样层进行下采样，得到第三特征向量；

将所述第三特征向量输入所述第二深度学习模块进行方向编码及尺度感知，得到第四特征向量；

将所述第四特征向量输入所述第二下采样层进行下采样，得到第五特征向量；

将所述第五特征向量输入所述第三深度学习模块进行方向编码及尺度感知，得到第六特征向量；

将所述第六特征向量输入所述第三下采样层进行下采样，得到第七特征向量；

将所述第七特征向量输入所述第四深度学习模块进行方向编码及尺度感知，得到第八特征向量；

将所述第八特征向量输入所述第一上采样层进行上采样，得到第九特征向量；

将所述第九特征向量输入所述第五深度学习模块进行方向编码及尺度感知，得到第十特征向量；

将所述第十特征向量输入所述第二上采样层进行上采样，得到第十一特征向量；

将所述第十一特征向量输入所述第六深度学习模块进行方向编码及尺度感知，得到第十二特征向量；

将所述第十二特征向量输入所述第三上采样层进行上采样，得到第十三特征向量；

将所述第十三特征向量输入所述第七深度学习模块进行方向编码及尺度感知，得到第十四特征向量；

将所述第十四特征向量输入所述丢弃层进行随机丢弃，得到第十五特征向量；

将所述第十五特征向量输入所述全连接层进行连接，得到所述训练样本的样本语义类别概率预测数据。
根据权利要求12所述的计算机设备，其中，所述根据所述样本语义类别概率预测数据和所述点云语义类别标定数据对所述待训练模型进行训练，将训练结束的待训练模型作为所述点云语义类别预测模型的步骤，包括：

将所述样本语义类别概率预测数据和所述点云语义类别标定数据输入损失函数进行计算，得到所述待训练模型的损失值，根据所述损失值更新所述待训练模型的参数，更新后的所述待训练模型被用于下一次计算所述样本语义类别概率预测数据；

重复执行上述方法步骤直至所述损失值达到第一收敛条件或迭代次数达到第二收敛条件，将所述损失值达到第一收敛条件或迭代次数达到第二收敛条件的所述待训练模型，确定为所述点云语义类别预测模型；

其中，所述损失函数采用交叉熵函数。
一种计算机可读存储介质，其上存储有计算机程序，其中，所述计算机程序被处理器执行时实现如下方法步骤：

获取待预测三维点云数据；

采用预设空间单元格对所述待预测三维点云数据进行点云划分及量化判别，得到目标点云数据；

将所述目标点云数据输入点云语义类别预测模型中进行语义类别的概率预测，得到所述目标点云数据的点云语义类别概率预测值，所述点云语义类别预测模型是基于PointSIFT神经网络模块和PointNet++神经网络训练得到的模型；

根据所述目标点云数据的点云语义类别概率预测值，确定所述目标点云数据中每个点的目标语义类别。
根据权利要求15所述的计算机可读存储介质，其中，所述采用预设空间单元格对所述待预测三维点云数据进行点云划分及量化判别，得到目标点云数据的步骤，包括：

采用所述预设空间单元格对所述待预测三维点云数据进行离散划分，得到多个待处理空间单元格；

对所述多个待处理空间单元格进行总体积计算，得到空间单元格总体积；

对所述待处理空间单元格中的点云进行体积计算，得到所述待处理空间单元格的点云体积；

分别将每一个所述待处理空间单元格的点云体积除以所述空间单元格总体积，得到多个所述待处理空间单元格的点云体积比例；

判断每一个所述待处理空间单元格的点云体积比例是否大于预设比例阈值；

当存在所述待处理空间单元格的点云体积比例大于所述预设比例阈值时，将所述待处理空间单元格的点云体积比例对应的所述待处理空间单元格作为有效空间单元格；

从所述有效空间单元格中进行点的选取，得到所述目标点云数据。
根据权利要求16所述的计算机可读存储介质，其中，所述从所述有效空间单元格中进行点的选取，得到所述目标点云数据的步骤，包括：

对所述有效空间单元格中的点云按预设数量进行点的随机选取，得到待处理点云数据；

对所述待处理点云数据进行中心点计算，得到中心点坐标数据；

将所述待处理点云数据中的每个点的坐标数据减去所述中心点坐标数据，得到所述待处理点云数据中的每个点的坐标差值；

根据所述待处理点云数据的所有点的坐标数据和所述中心点坐标数据进行标准差计算，得到所述待处理点云数据的点云标准差；

将所述待处理点云数据中的每个点的坐标差值除以所述点云标准差，得到所述目标点云数据。
根据权利要求15所述的计算机可读存储介质，其中，所述将所述目标点云数据输入点云语义类别预测模型中进行语义类别的概率预测，得到所述目标点云数据的点云语义类别概率预测值的步骤之前，还包括：

获取多个训练样本，所述训练样本包括：点云样本数据、点云语义类别标定数据；

将所述训练样本的所述点云样本数据输入待训练模型中进行语义类别的概率预测，得到所述训练样本的样本语义类别概率预测数据，其中，所述待训练模型是根据所述PointSIFT神经网络模块和所述PointNet++神经网络训练确定的模型；

根据所述样本语义类别概率预测数据和所述点云语义类别标定数据对所述待训练模型进行训练，将训练结束的待训练模型作为所述点云语义类别预测模型。
根据权利要求18所述的计算机可读存储介质，其中，所述待训练模型依次包括：多层感知器、第一深度学习模块、第一下采样层、第二深度学习模块、第二下采样层、第三深度学习模块、第三下采样层、第四深度学习模块、第一上采样层、第五深度学习模块、第二上采样层、第六深度学习模块、第三上采样层、第七深度学习模块、丢弃层、全连接层，所述第一深度学习模块、所述第二深度学习模块、所述第三深度学习模块、所述第四深度学习模块、所述第五深度学习模块、所述第六深度学习模块及所述第七深度学习模块采用所述PointSIFT神经网络模块，所述第一下采样层、所述第二下采样层及所述第三下采样层采用所述PointNet++神经网络的点集抽象模块，所述第一上采样层、所述第二上采样层及所述第三上采样层采用所述PointNet++神经网络的特征传播模块；以及，

所述将所述训练样本的所述点云样本数据输入待训练模型中进行语义类别的概率预测，得到所述训练样本的样本语义类别概率预测数据的步骤，包括：

将所述训练样本的所述点云样本数据输入所述多层感知器进行特征提取，得到第一特征向量；

将所述第一特征向量输入所述第一深度学习模块进行方向编码及尺度感知，得到第二特征向量；

将所述第二特征向量输入所述第一下采样层进行下采样，得到第三特征向量；

将所述第三特征向量输入所述第二深度学习模块进行方向编码及尺度感知，得到第四特征向量；

将所述第四特征向量输入所述第二下采样层进行下采样，得到第五特征向量；

将所述第五特征向量输入所述第三深度学习模块进行方向编码及尺度感知，得到第六特征向量；

将所述第六特征向量输入所述第三下采样层进行下采样，得到第七特征向量；

将所述第七特征向量输入所述第四深度学习模块进行方向编码及尺度感知，得到第八特征向量；

将所述第八特征向量输入所述第一上采样层进行上采样，得到第九特征向量；

将所述第九特征向量输入所述第五深度学习模块进行方向编码及尺度感知，得到第十特征向量；

将所述第十特征向量输入所述第二上采样层进行上采样，得到第十一特征向量；

将所述第十一特征向量输入所述第六深度学习模块进行方向编码及尺度感知，得到第十二特征向量；

将所述第十二特征向量输入所述第三上采样层进行上采样，得到第十三特征向量；

将所述第十三特征向量输入所述第七深度学习模块进行方向编码及尺度感知，得到第十四特征向量；

将所述第十四特征向量输入所述丢弃层进行随机丢弃，得到第十五特征向量；

将所述第十五特征向量输入所述全连接层进行连接，得到所述训练样本的样本语义类别概率预测数据。
根据权利要求18所述的计算机可读存储介质，其中，所述根据所述样本语义类别概率预测数据和所述点云语义类别标定数据对所述待训练模型进行训练，将训练结束的待训练模型作为所述点云语义类别预测模型的步骤，包括：

将所述样本语义类别概率预测数据和所述点云语义类别标定数据输入损失函数进行计算，得到所述待训练模型的损失值，根据所述损失值更新所述待训练模型的参数，更新后的所述待训练模型被用于下一次计算所述样本语义类别概率预测数据；

重复执行上述方法步骤直至所述损失值达到第一收敛条件或迭代次数达到第二收敛条件，将所述损失值达到第一收敛条件或迭代次数达到第二收敛条件的所述待训练模型，确定为所述点云语义类别预测模型；

其中，所述损失函数采用交叉熵函数。