WO2022166400A1

WO2022166400A1 - 一种处理三维点云的方法、装置、设备以及存储介质

Info

Publication number: WO2022166400A1
Application number: PCT/CN2021/137305
Authority: WO
Inventors: 乔宇; 徐名业; 张钧皓; 周志鹏
Original assignee: 中国科学院深圳先进技术研究院
Priority date: 2021-02-05
Filing date: 2021-12-12
Publication date: 2022-08-11
Also published as: CN112966696B; CN112966696A

Abstract

一种处理三维点云的方法、装置、设备及存储介质，涉及计算机技术领域，该方法包括：获取包括多个点的点云数据（S101）；将所述点云数据输入到已训练的卷积神经网络中处理，得到每个点对应的目标特征，所述卷积神经网络包括几何注意力融合模块和聚焦模块（S102）；基于每个点对应的目标特征，确定每个点对应的预测类别（S103）。基于该方法提取到的每个点的目标特征，包含了每个点对应的几何信息，使提取到的每个点的目标特征更加准确、有效，进而根据每个点的目标特征进行预测类别时，得到的预测结果非常准确。

Description

一种处理三维点云的方法、装置、设备以及存储介质

技术领域

本申请属于计算机技术领域，尤其涉及一种处理三维点云的方法、处理三维点云的装置、一种处理三维点云的设备以及存储介质。

背景技术

点云(英文全称为Point Cloud)是在逆向工程中通过测量仪器得到的产品外观表面的点数据集合，点云数据除了具有几何位置以外，有的还有颜色信息。颜色信息通常是通过相机获取彩色影像，然后将对应位置的像素的颜色信息(RGB)赋予点云中对应的点。强度信息的获取是激光扫描仪接收装置采集到的回波强度，此强度信息与目标的表面材质、粗糙度、入射角方向，以及仪器的发射能量，激光波长有关。

但是，对点云数据进行处理时，由于三维点云数据与图像不同，三维点云数据是非规格化的，多视角投影技术将非规格化的三维点云投影为二维图像，再对二维图像进行处理，目前对点云数据进行处理需要先将点云数据转换为其它的数据格式，比如将三维点云投影到二维图像，作为卷积神经网络的输入；但是这个过程存在以下缺点：(1)由于遮挡原因，投影的过程本身会造成部分数据缺失。(2)数据转化的过程计算量比较大。因此，直接构造卷积神经网络处理三维点云数据非常有必要。

然而，现有的可直接对三维点云数据进行处理的卷积神经网络，不能准确地提取到每个点的特征信息，导致对这些点进行类别预测时，预测结果不准确。

发明内容

有鉴于此，本申请实施例提供了一种处理三维点云的方法、处理三维点云的装置、一种处理三维点云的设备以及存储介质，以解决现有的可直接对三维点云数据进行处理的卷积神经网络，不能准确地提取到每个点的特征信息，导致对这些点进行类别预测时，预测结果不准确的问题。

本申请实施例的第一方面提供了一种处理三维点云的方法，包括：

获取包括多个点的点云数据；

将所述点云数据输入到已训练的卷积神经网络中处理，得到每个点对应的目标特征，所述卷积神经网络包括几何注意力融合模块和聚焦模块，所述几何注意力融合模块用于提取每个所述点的局部增强特征，所述聚焦模块用于基于每个所述点的局部增强特征，提取每个所述点的目标特征；

基于每个点对应的目标特征，确定每个点对应的预测类别。

本申请实施例的第二方面提供了一种处理三维点云的装置，包括：

获取单元，用于获取包括多个点的点云数据；

处理单元，用于将所述点云数据输入到已训练的卷积神经网络中处理，得到每个点对应的目标特征，所述卷积神经网络包括几何注意力融合模块和聚焦模块，所述几何注意力融合模块用于提取每个所述点的局部增强特征，所述聚焦模块用于基于每个所述点的局部增强特征，提取每个所述点的目标特征；

确定单元，用于基于每个点对应的目标特征，确定每个点对应的预测类别。

本申请实施例的第三方面提供了一种一种处理三维点云的设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如上述第一方面所述的处理三维点云的方法的步骤。

本申请实施例的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如上述第一方面所述的处理三维点云的方法的步骤。

本申请实施例的第五方面提供了一种计算机程序产品，当计算机程序产品在一种处理三维点云的设备上运行时，使得一种处理三维点云的设备执行上述第一方面所述的处理三维点云的方法的步骤。

本申请实施例提供的一种处理三维点云的方法、处理三维点云的装置、一种处理三维点云的设备以及存储介质具有以下有益效果：

本申请实施例，一种处理三维点云的设备通过已训练的卷积神经网络对点云数据进行处理，得到每个点对应的目标特征，基于每个点对应的目标特征，确定每个点对应的预测类别。由于在提取每个点对应的目标特征时，先基于卷积神经网络包括的几何注意力融合模块，提取了每个点的局部增强特征，再基于卷积神经网络包括的聚焦模块以及每个点的局部增强特征，提取得到了每个点的目标特征。基于该方法提取到的每个点的目标特征，包含了每个点对应的重要的几何信息，使提取到的每个点的目标特征更加准确、有效，进而根据每个点的目标特征进行预测类别时，得到的预测结果非常准确。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请提供的一种复杂点云场景难分区域示意图；

图2是本申请实施例提供的一种处理三维点云的方法的示意流程图；

图3为本申请另一实施例提供的一种处理三维点云的方法的示意流程图；

图4为本申请提供的一种几何注意力融合模块示意图；

图5为本申请又一实施例提供的一种处理三维点云的方法的示意流程图；

图6为本申请再一实施例提供的一种处理三维点云的方法的示意流程图；

图7为本申请提供的一种聚焦模块示意图；

图8为本申请提供的针对不可分区域的新的评价标准的评价过程；

图9为本申请提供的一种面向大型复杂场景点云的语义分割网络；

图10为本申请提供的训练过程中不可分辨点的自适应变化过程；

图11为本申请提供应用场景图；

图12是本申请一实施例提供的一种处理三维点云的装置的示意图；

图13是本申请另一实施例提供的一种处理三维点云的设备的示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

现有技术中，点云(英文全称为Point Cloud)是在逆向工程中通过测量仪器得到的产品外观表面的点数据集合，点云数据除了具有几何位置以外，有的还有颜色信息。颜色信息通常是通过相机获取彩色影像，然后将对应位置的像素的颜色信息(RGB)赋予点云中对应的点。强度信息的获取是激光扫描仪接收装置采集到的回波强度，此强度信息与目标的表面材质、粗糙度、入射角方向，以及仪器的发射能量，激光波长有关。

但是，对点云数据进行处理时，由于三维点云数据与图像不同，三维点云数据是非规格化的，多视角投影技术将非规格化的三维点云投影为二维图像，再对二维图像进行处理，目前对点云数据进行处理需要先将点云数据转换为其它的数据格式，比如将三维点云投影到二维图像，作为卷积神经网络的输入；但是这个过程存在以下缺点：(1)由于遮挡原因，投影的过程本身会造成部分数据缺失。(2)数据转化的过程计算量比较大，会导致大量内存消耗，占用大量计算机资源，且在转换过程中容易丢失空间几何信息。

也有采用体素变换方法将非标准化点云数据转换为空间体素数据，此过程虽然可以减轻数据丢失的问题，但是，变换后的体素数据具有大量数据，存在高度冗余的问题。

另外，一维卷积神经网络可以直接操作并处理非标准化点云数据，其基本思想是学习每个点的空间编码，然后将所有单个点特征聚合为一个整体表示。但是这种设计不能完全捕捉点之间的关系。

点云卷积的增强版本可以根据基础空间的距离测量将点云划分为重叠的局部区域，并使用二维卷积来提取捕获精细几何图形的局部特征邻域结构。但是，它仅考虑每个点的局部区域，而不能将点云上的相似局部特征相关联。

因此，直接构造卷积神经网络处理三维点云数据非常有必要。

然而，现有的可直接对三维点云数据进行处理的卷积神经网络，不能准确地提取到每个点的特征信息，导致对这些点进行类别预测时，预测结果不准确。且现有的三维场景点云的处理方法对难分区域的分割效果特别差，问题主要集中在物体的分割边缘、容易混淆的物体内部和一些离散的有迷惑性的小区域。

请参见图1，图1为本申请提供的一种复杂点云场景难分区域示意图。如图1所示，第一种类型为复杂边界区域，属于边界点(对象边界和预测边界)。在大多数情况下，很难准确地确定不同对象之间的边界。由于每个点的特征都是由局部区域的信息来表征的，因此在欧氏空间中接近的不同类别的物体之间，边界点的预测会过于平滑，导致无法对这些点的类别进行准确预测。

第二种类型为混淆的内部区域，它包含来自具有相似纹理和几何结构的不同类别对象的内部点。例如，门和墙有相似的外观，几乎是平的，有相似的颜色。在这种情况下，即使对人类来说，也很难准确地识别出某些点属于门还是属于墙。

第三种类型为孤立小区域，这些区域分散且难以预测。此外，由于遮挡，场景中的对象不会被设备完全捕获。因此，对于孤立小区域中的点，也无法准确地对它们所属的类别进行预测。

有鉴于此，本申请提供了一种处理三维点云的方法，该方法中，本申请实施例，一种处理三维点云的设备通过已训练的卷积神经网络对点云数据进行处理，得到每个点对应的目标特征，基于每个点对应的目标特征，确定每个点对应的预测类别。由于在提取每个点对应的目标特征时，先基于卷积神经网络包括的几何注意力融合模块，提取了每个点的局部增强特征，再基于卷积神经网络包括的聚焦模块以及每个点的局部增强特征，提取得到了每个点的目标特征。基于该方法提取到的每个点的目标特征，包含了每个点对应的重要的几何信息，使提取到的每个点的目标特征更加准确、有效，进而根据每个点的目标特征进行预测类别时，得到的预测结果非常准确。

本申请提供的处理三维点云的方法可应用于各种需要分析三维点云的领域，例如自动驾驶(如障碍物检测和自动驾驶设备的路径自动规划等)、机器人(家庭服务机器人的物体检测、路线识别等)等人机交互领域，该方法可以为用户提供实时、准确的行为识别和检测功能，提高准确性和趣味性，还保证了为人机交互活动的安全性。此处仅为示例性说明，对此不做限定。

请参见图2，图2是本申请实施例提供的一种处理三维点云的方法的示意流程图。本实施例中处理三维点云的方法的执行主体为处理三维点云的设备，该设备包括但不限于智能手机、平板电脑、计算机、个人数字助理(Personal Digital Assistant，PDA)、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer，UMPC)、上网本、独立的服务器、分布式服务器、服务器集群或云服务器等，还可以包括台式电脑等终端。如图2所示的处理三维点云的方法可包括S101～S103，各个步骤的具体实现原理如下。

S101：获取包括多个点的点云数据。

可通过处理三维点云的设备采集包括多个点的点云数据。具体地，若处理三维点云的设备中有包括激光设备、立体摄像机或者越渡时间相机等，则可以通过激光设备、立体摄像机或者越渡时间相机进行采集。具体地，可以通过采用基于点云自动拼接的数据采集方法对三维物体进行点云数据的采集，在采集过程中，可以使用多个测站扫描并将各测站数据拼接到一起得到点云数据，通过迭代优化坐标变换参数的方法实现不同角度点云的精确配准。

还可以是通过其他设备采集点云数据，将采集好的点云数据传输至本申请处理三维点云的设备中。此处仅为示例性说明，对此不做限定。

S102：将所述点云数据输入到已训练的卷积神经网络中处理，得到每个点对应的目标特征，所述卷积神经网络包括几何注意力融合模块和聚焦模块，所述几何注意力融合模块用于提取每个所述点的局部增强特征，所述聚焦模块用于基于每个所述点的局部增强特征，提取每个所述点的目标特征。

S103：基于每个点对应的目标特征，确定每个点对应的预测类别。

在本实施例中，处理三维点云的设备中预先存储有预先训练好的卷积神经网络。该卷积神经网络是使用机器学习算法，基于训练集和测试集对初始卷积神经网络进行训练得到。其中，卷积神经网络包括几何注意力融合模块和聚焦模块，该几何注意力融合模块用于提取每个点的局部增强特征，聚焦模块用于基于每个点的局部增强特征，提取每个点的目标特征。训练集包括多个样本点的样本点云数据，测试集包括每个样本点对应的样本特征以及样本类别。

可以理解的是，卷积神经网络可以由处理三维点云的设备预先训练好，也可以由其他设备预先训练好后将卷积神经网络对应的文件移植至处理三维点云的设备中。也就是说，训练该卷积神经网络的执行主体与使用该卷积神经网络的执行主体可以是相同的，也可以是不同的。例如，当采用其他设备训练初始卷积神经网络时，其他设备对初始卷积神经网络结束训练后，固定初始卷积神经网络的网络参数，得到卷积神经网络对应的文件。然后将该文件移植到处理三维点云的设备中。

处理三维点云的设备在获取到多个点的点云数据后，利用卷积神经网络包括的几何注意力融合模块，提取每个点的局部增强特征；再基于每个点的局部增强特征，利用卷积神经网络包括的聚焦模块，提取每个点的目标特征。

再基于每个点对应的目标特征，确定每个点对应的各个类别所对应的预测概率值；基于各个类别所对应的预测概率值，确定每个点对应的预测类别。

本实施例中，由于在提取每个点对应的目标特征时，先基于卷积神经网络包括的几何注意力融合模块，提取了每个点的局部增强特征，再基于卷积神经网络包括的聚焦模块以及每个点的局部增强特征，提取得到了每个点的目标特征。基于该方法提取到的每个点的目标特征，包含了每个点对应的重要的几何信息，使提取到的每个点的目标特征更加准确、有效，进而根据每个点的目标特征进行预测类别时，得到的预测结果非常准确。

示例性的，图3为本申请另一实施例提供的一种处理三维点云的方法的示意流程图，主要涉及基于几何注意力融合模块提取每个点的局部增强特征的一种可能的实施方式。参见图3，该方法包括：

S201：针对点云数据中的每个点，基于所述几何注意力融合模块获取所述点在欧式空间的近邻点，且基于所述点在欧式空间的近邻点确定所述点在特征值空间的近邻点。

针对点云数据中的每个点，用K近邻查询算法获取该点在欧式空间的近邻点，基于该点在欧式空间的近邻点确定特征值图结构；基于该特征值图结构确定三维结构张量；对该三维结构张量进行分解得到特征值矩阵；基于该特征值矩阵确定该点在特征值空间中的近邻点。或者，基于每个点的原始坐标计算得到特征值元组，表示为

并作为该点的输入特征

S202：融合所述点在欧式空间的近邻点以及所述点在特征值空间的近邻点，得到所述点对应的局部特征。

可通过下述公式(1)融合该点在欧式空间的近邻点以及该点在特征值空间的近邻点，得到该点对应的局部特征，公式(1)如下：

上述(1)式中，

表示每个点对应的局部特征，

是具有一组可学习的非线性函数，在实施例中的几何注意力融合模块中，

是一个两层二维卷积，

表示级联操作，前一个

用于表示在欧式空间的特征，后一个

用于表示在特征值空间的特征。

S203：聚合所述点对应的局部特征，得到所述点对应的局部增强特征。

对于每个点，对S202中计算得到每个点对应的的局部特征进行聚合，聚合为

即得到该点对应的局部增强特征。

可选地，在一种可能的实现方式中，可基于注意力池化方式聚合该点对应的局部特征，得到该点对应的局部增强特征。

具体地，可通过下述公式(2)聚合该点对应的局部特征，得到该点对应的局部增强特征，公式(2)如下：

上述(2)式中，

表示每个点对应的局部增强特征，

是具有一组可学习的非线性函数。

为了便于理解几何注意力融合模块提取每个点的局部增强特征的过程，请参见图4，图4为本申请提供的一种几何注意力融合模块示意图。如图4所示，几何注意力融合模块也可称为基于几何的注意力融合模块，在几何注意力融合模块中输入每个点的点坐标、点特征以及特征根，基于特征根进行特征根空间K近邻，基于每个点的点坐标、点特征进行欧式空间K近邻，得到该点在欧式空间的近邻点以及该点在特征值空间的近邻点。融合该点在欧式空间的近邻点以及该点在特征值空间的近邻点，得到该点对应的局部特征。对该点对应的局部特征通过多层感知机进行点积和求和处理，得到该点对应的局部增强特征。即在基于几何的注意力融合模块中，输入是逐点坐标、点特征和特征根。在该模块中，我们在特征值空间和欧氏空间中聚集特征，然后使用注意池生成每个点的输出特征。

本实施方式中，为了更好地描述每一个点，我们在每个点上用特征值增强局部特征，即基于几何注意力融合模块，提取每个点的局部增强特征，有效地保留了每个点在空间的几何信息。通过该几何注意力融合模块有效捕捉到各个点最重要的几何信息，且有效地融合了各个点的几何信息，有利于后续基于每个点的局部增强特征，准确地提取每个点的目标特征。

示例性的，图5为本申请又一实施例提供的一种处理三维点云的方法的示意流程图，主要涉及基于每个点的局部增强特征，提取每个点的目标特征的一种可能的实施方式。参见图5，该方法包括：

S301：基于每个所述点的局部增强特征对每个点进行局部差分，得到每个点对应的局部差异。

S302：根据每个点对应的局部差异，在所述多个点中确定所述不可分辨点。

S303：采用多层感知器提取每个不可分辨点对应的目标特征。

获取的多个点中包括不可分辨点，该不可分辨点为多个点中不易确定预测类别的点，即图1所示的复杂点云场景难分区域示意图中的难分区域的点。即复杂边界区域、混淆的内部区域以及孤立小区域中的点。

示例性地，聚焦模块也可称为不可区分区域聚焦(IAF)模块，该模块可以自适应地选择不可区分的点并增强每个点的特征。

IAF模块是一种新的基于层次语义特征的不可区分区域模型，该模型能够自适应地选择不可区分点。为了增强不可分辨点的特征，IAF模型首先获取不可分辨点的细粒度特征和高级语义特征，然后通过不可分辨点与相应的整体点集之间的非局部运算来增强特征。

为了在训练过程中自适应地发现不可分辨点，可以利用低层次的几何信息和高层次的语义信息来挖掘不可分辨点。

局部差异是指每个点与其相邻点之间的差异。局部差异在一定程度上反映了每一点的差异性，这种差异性依赖于低层次的几何特征、潜在空间和高层次的语义特征。所以我们用局部差分作为挖掘不可分辨点的判据。对于每个点p _i，我们得到欧氏空间中的K近邻，然后我们得到每个层中每个点的以下局部差分，然后我们将这些局部差异累积在一起，我们调整根据局部差异累积结果的降序排列，然后选择局部差异较大的一部分点作为不可区分的点。对应我们之前提到了三种区域的点，这些不可区分的点随着网络的迭代更新而动态变化。需要注意的是，在训练开始时，不可分辨点分布在原始属性(坐标和颜色)快速变化的区域。随着训练过程的进行，不可区分点位于引言中提到的不可区分区域。我们聚集中间特征和不可区分点的标签预测，然后使用多层感知器分别提取不可区分点的特征，为了增强点的特征，特别是不可分辨点的特征，本申请利用非局部机制，通过下列方程更新所有点的特征，从而隐式地增强不可分辨点的特征。除此之外，我们还会计算当前层的预测输出。

示例性地，基于每个点的局部增强特征对每个点进行局部差分，得到每个点对应的局部差异，可通过下述公式(3)实现，公式(3)如下：

然后我们通过下述公式(4)将这些局部差异累积在一起：

我们根据LD ^l按降序排列，然后选择最上面的

点作为不可区分的点。

示例性的，图6为本申请再一实施例提供的一种处理三维点云的方法的示意流程图，主要涉及采用多层感知器提取每个不可分辨点对应的目标特征一种可能的实施方式。参见图6，该方法包括：

S401：获取每个不可分辨点对应的预测标签，以及获取每个不可分辨点对应的中间特征。

可通过下述公式(5)获取每个不可分辨点对应的预测标签。

S402：针对每个不可分辨点，聚集所述不可分辨点对应的预测标签和中间特征，得到所述不可分辨点对应的聚集结果。

S403：基于每个不可分辨点对应的聚集结果，采用多层感知器提取每个不可分辨点对应的目标特征。

针对每个不可分辨点，可通过下述公式(6)，聚集所述不可分辨点对应的预测标签和中间特征，得到不可分辨点对应的聚集结果。

我们聚集中间特征和不可区分点的标签预测，然后使用多层感知器分别提取不可区分点的特征。

j∈M _l-1表示这些点属于不可区分点集。

为了增强点的特征，特别是不可分辨点的特征，本文利用非局部机制，通过下式(7)更新所有点的特征，从而隐式地增强不可分辨点的特征。

为了便于理解聚焦模块的处理过程，请参见图7，图7为本申请提供的一种聚焦模块示意图。如图7所示，聚焦模块也可称为不可分区域聚焦处理模块。对于输入特征、编码层对应特征以及上一层的预测值进行上采样、多层感知器学习等处理，最终提取出不可分辨点，以及不可分辨点对应的目标特征，同时还计算了当前层的预测输出。

本实施例中，提出了一种新的不可区分区域聚焦网络(IAF-Net)，该网络利用层次语义特征自适应地选择不可区分的点，并增强点的细粒度特征，特别是那些不可区分的点。我们还引入了多阶段损失，以渐进的方式改进特征表示；在网络设计方面，采用级联结构，递进式地学习点云数据的几何特征。

可选地，在一种可能的实现方式中，本申请还提供了一种针对不可分区域的新的评价标准。可基于预设度量方法，评价每个不可分辨点对应的预测类别是否准确；当检测到预测类别准确的不可分辨点的数量不满足预设阈值时，继续训练卷积神经网络。

具体地，为了更好地区分不同方法在三维语义分割中的效果，我们提出了一种新的基于不可区分点度量的评价方法。此评估指标侧重于不可区分区域的分割方法的有效性。对于整个点云P＝{p ₁,p ₂,....,p _N}，我们有预测数据Pred＝{Z _i,1≤i≤N}和数据真实值Label＝{Z _i,gt,1≤i≤N}。

对于所有满足条件Z _i≠Z _i,gt的p _i点欧式空间的K近邻点预测为{Z _i,1≤j≤K}，然后我们统计满足条件Z _i≠Z _i,gt的点数m _i，再把

用0，ζ ₁，ζ ₂,1划分为三部分S1、S2、S3，最后使用

作为新的评价标准，其对应三种不可分区域上的分割性能。

为了便于理解，请参见图8，图8为本申请提供的针对不可分区域的新的评价标准的评价过程。

可选地，在一种可能的实现方式中，基于每个点对应的目标特征，确定每个点对应的预测类别，包括：基于每个不可分辨点对应的目标特征，确定每个不可分辨点对应的各个类别所对应的预测概率值。基于各个类别所对应的预测概率值，确定每个不可分辨点对应的预测类别。

示例性地，请参见图9，图9为本申请提供的一种面向大型复杂场景点云的语义分割网络。该语义分割网络包括特征提取单元和分割单元。

在特征提取单元中，我们使用层次结构来学习各个层次的特征。所述网络以N个点为输入，利用第一方面第二方面提到的几何注意力模块和不可分区域聚焦处理模块提取点云的特征。

对于分割，网络将每个层次连接起来，然后计算得到点云中每个点所对应的类别预测概率。示例性地，通过该分割单元，确定每个不可分辨点对应的各个类别所对应的预测概率值。基于各个类别所对应的预测概率值，确定每个不可分辨点对应的预测类别。例如，某个不可分辨点对应为桌子这一类别的预测概率值为0.6，对应为书这一类别的预测概率值为0.9，则该不可分辨点对应的预测类别为书。此处仅为示例性说明，对比不做限定。

上述实施方式中，不可分辨点包括位于复杂边界上的点、局部纹理相似但类别不同的点以及孤立的小硬区域中的点，这些点在很大程度上影响了三维语义分割的性能。

为了解决这一问题，我们提出了一种新的不可区分区域聚焦网络(IAF-Net)，该网络利用层次语义特征自适应地选择不可区分的点，并增强点的细粒度特征，特别是那些不可区分的点。我们还引入了多阶段损失，以渐进的方式改进特征表示。此外，为了分析不可区分区域的分割性能，提出了一种新的基于不可区分点的度量方法(IPBM)。我们的IAF-Net在一些流行的3D点云数据集(如S3DIS和ScanNet)上取得了与最新性能相当的结果，并且明显优于IPBM上的其他方法。

本申请实施例通过设定局部几何信息共享的点云卷积神经网络直接处理点云数据，不需要将点云数据转换为其它复杂的数据格式，有利于减少内存占用和计算机资源的消耗，能够更为快速的提取丰富的特征数据。和几何变化注意力的方法更加有利于探索点云边缘轮廓整体结构几何特征，从而提高分类和分割任务的精度。

可选地，在将点云数据输入到已训练的卷积神经网络中处理，得到每个点对应的目标特征之前，本申请提供的一种处理三维点云的方法还包括：获取训练集和测试集，该训练集包括多个样本点的样本点云数据，该测试集包括每个样本点对应的样本特征以及样本类别；通过该训练集对初始卷积神经网络进行训练，得到训练中的卷积神经网络；基于该样本集对该训练中的卷积神经网络进行验证；当验证结果不满足预设条件时，调整该训练中的卷积神经网络的网络参数，并继续基于该训练集对该训练中的卷积神经网络进行训练；当验证结果满足预设条件时，停止训练该训练中的卷积神经网络，并将训练后的卷积神经网络作为该已训练的卷积神经网络。

获取训练集和测试集时，可以是本设备采集多个样本点的样本点云数据，也可以是其他设备采集后传输至本设备中。可选地，无论是本设备采集的点云数据，还是其他设备采集后传输至本设备中的点云数据，均可通过旋转点云数据中的点，和/或使点源数据中点的点坐标在该点周围的预定范围内扰动，以对该点云数据进行增强；和/或，对该点云数据中的点进行随机删除。示例性地，根据预先设定的最大随机概率，随机生成随机概率，根据生成的随机概率对点云数据中的点进行删除。基于实验，发现基于上述数据增强方法，可以增强卷积神经网络学习的泛化能力，进而提高测试集(训练时没有用到的点云数据)上的测试的准确率。

当输入卷积神经网络的参数时，还可以进一步进行：根据类别对采集到的三维点云数据进行人工分类和筛选，完成初步的数据准备工作。可以使用分类后类别的第一部分点云数据的训练卷积神经网络的卷积核，以获得训练后的卷积神经网络；分类类别中的第二部分点云数据可以用作验证数据，以评估该卷积神经网络。例如，根据数据整理过程，选择三维点云每个类别的数据的90％作为网络训练的训练数据，其余10％的数据保留为实验验证数据，用于后期对模型识别准确性和泛化能力的评估。

示例性地，请参见图10，图10为本申请提供的训练过程中不可分辨点的自适应变化过程。在训练开始时，不可分辨点分布在原始属性(坐标和颜色)快速变化的区域。随着训练过程的进行，不可区分点位于引言中提到的不可区分区域。

可选地，本申请还可以对提取了点云数据的特征后，进一步进行处理：在对几何特征信息进行几个反卷积模块处理之后，可以使用最大K池化操作提取点云的几何特征，以进行后续的分类，分割或配准。假设多层卷积模块得到的特征是NxM维向量，N是点数，M是每个点特征的维度，最大k池化操作是指在N个点第i维特征中，取最大的K个值，由此最后得到KxM维点云的全局特征向量。可以将每层卷积模块的输出特征合并，以进行最大池化操作，最后通过全连接层。另外，可以将交叉熵函数用作损失函数，并将反向传播算法用于训练和优化模型。对于分割任务，在得到全局特征的基础上，将点云的全局特征和对象类别信息作为点云的局部特征，并在点云后形成较高维的局部云特征，并在之前已提取的点云的局部特征之后，通过由多层感知器和归一化指数函数获得的物体分割部位的预测概率来进行分割预测。

本申请通过设计了一种用于三维点云分类和分割的卷积神经网络结构，调整神经网络的网络参数，包括但不限于(学习率、批量大小)，采用不同的学习策略来促进卷积神经网络收敛到最佳的网络模型优化方向；最后，使用训练好的网络模型对验证数据进行测试，实现点云的分类和分割。此外，本发明设计的几何信息解缠卷积是神经网络中的一个模块，可以直接从分布在点云上的信号中提取几何变化大和小的特征，因此可以与神经网络中的其他模块结合使用。网络。可以更改输入和输出通道的数量以及输出通道的组合，以在不同任务中实现最佳效果。通过使用几何特征信息共享模块可以设计出不同的神经网络结构。

另外，通过实验验证，本申请中描述的面向点云的特征提取方法可以测试大规模点云数据(S3DIS，ScanNet)的场景分割任务。与目前国际上先进的方法相比，Area-5的m-IOU为64.6％，6-flod的结果为70.3％，在性能上具有领先优势。

示例性地，本申请可应用于无人驾驶和机器人视觉领域的场景分割任务和三维场景重建任务。请参见图11，图11为本申请提供应用场景图。图11主要示出了本发明应用于无人驾驶车辆和机器人视觉的场景分割任务。通过分析和处理从扫描获得的三维点云，可以获得对象的类别和位置，这是该领域其他任务的基础。

示例性地，本申请提供的一种处理三维点云的方法，可用于无人智能机器人的场景分割任务。首先，用深度相机采集场景的点云数据，并标记场景点云数据中的物体类别。通过基于几何共享的卷积神经网络提取点云的局部特征，并将该局部特征用于像素级分类，这是对场景分割的训练。在实际使用中，深度相机用于收集实际场景的点云数据，然后使用训练好的神经网络提取点云的局部特征，然后对场景进行分割。将分割结果(即场景中的不同物体)返回到无人驾驶车辆(或智能机器人)以进行数据存储和进一步分析。

可选地，在实际应用中，根据任务的不同可以更改输入的特征，例如，用点与近邻点之间的距离、点的颜色信息、特征向量的组合、点的局部形状上下文信息对输入的特征进行替代或组合。

可选地，网络中的不可分区域聚焦模块是可移植的点云特征学习模块，可以作为一个特征提取器应用在其他的与点云相关的任务上，比如三维点云补全、三维点云检测等任务。

请参见图12，图12是本申请一实施例提供的一种处理三维点云的装置的示意图。该装置包括的各单元用于执行图2、图3、图5、图6对应的实施例中的各步骤。具体请参阅图2、图3、图5、图6各自对应的实施例中的相关描述。为了便于说明，仅示出了与本实施例相关的部分。参见图11，包括：

获取单元510，用于获取包括多个点的点云数据；

处理单元520，用于将所述点云数据输入到已训练的卷积神经网络中处理，得到每个点对应的目标特征，所述卷积神经网络包括几何注意力融合模块和聚焦模块，所述几何注意力融合模块用于提取每个所述点的局部增强特征，所述聚焦模块用于基于每个所述点的局部增强特征，提取每个所述点的目标特征；

确定单元530，用于基于每个点对应的目标特征，确定每个点对应的预测类别。

可选地，所述处理单元520具体用于：

针对点云数据中的每个点，基于所述几何注意力融合模块获取所述点在欧式空间的近邻点，且基于所述点在欧式空间的近邻点确定所述点在特征值空间的近邻点；

融合所述点在欧式空间的近邻点以及所述点在特征值空间的近邻点，得到所述点对应的局部特征；

聚合所述点对应的局部特征，得到所述点对应的局部增强特征。

可选地，所述处理单元520还用于：

基于注意力池化方式聚合所述点对应的局部特征，得到所述点对应的局部增强特征。

可选地，所述多个点包括不可分辨点，所述不可分辨点为所述多个点中不易确定预测类别的点，所述处理单元520还用于：

基于每个所述点的局部增强特征对每个点进行局部差分，得到每个点对应的局部差异；

根据每个点对应的局部差异，在所述多个点中确定所述不可分辨点；

采用多层感知器提取每个不可分辨点对应的目标特征。

可选地，所述处理单元520还用于：

获取每个不可分辨点对应的预测标签，以及获取每个不可分辨点对应的中间特征；

针对每个不可分辨点，聚集所述不可分辨点对应的预测标签和中间特征，得到所述不可分辨点对应的聚集结果；

基于每个不可分辨点对应的聚集结果，采用多层感知器提取每个不可分辨点对应的目标特征。

可选地，所述确定单元530具体用于：

基于每个不可分辨点对应的目标特征，确定每个不可分辨点对应的各个类别所对应的预测概率值；

基于各个类别所对应的预测概率值，确定每个不可分辨点对应的预测类别。

可选地，所述装置还包括：

样本获取单元，用于获取训练集和测试集，所述训练集包括多个样本点的样本点云数据，所述测试集包括每个样本点对应的样本特征以及样本类别；

第一训练单元，用于通过所述训练集对初始卷积神经网络进行训练，得到训练中的卷积神经网络；

验证单元，用于基于所述样本集对所述训练中的卷积神经网络进行验证；

调整单元，用于当验证结果不满足预设条件时，调整所述训练中的卷积神经网络的网络参数，并继续基于所述训练集对所述训练中的卷积神经网络进行训练；

第二训练单元，用于当验证结果满足预设条件时，停止训练所述训练中的卷积神经网络，并将训练后的卷积神经网络作为所述已训练的卷积神经网络。

可选地，所述装置还包括：

评价单元，用于基于预设度量方法，评价每个不可分辨点对应的预测类别是否准确；

第三训练单元，用于当检测到预测类别准确的不可分辨点的数量不满足预设阈值时，继续训练所述卷积神经网络。

请参见图13，图13是本申请另一实施例提供的一种处理三维点云的设备的示意图。如图13所示，该实施例的处理三维点云的设备6包括：处理器60、存储器61以及存储在所述存储器61中并可在所述处理器60上运行的计算机指令62。所述处理器60执行所述计算机指令62时实现上述各个处理三维点云的方法实施例中的步骤，例如图2所示的S101至S103。或者，所述处理器60执行所述计算机指令62时实现上述各实施例中各单元的功能，例如图12所示单元510至530功能。

示例性地，所述计算机指令62可以被分割成一个或多个单元，所述一个或者多个单元被存储在所述存储器61中，并由所述处理器60执行，以完成本申请。所述一个或多个单元可以是能够完成特定功能的一系列计算机指令段，该指令段用于描述所述计算机指令62在所述处理三维点云的设备6中的执行过程。例如，所述计算机指令62可以被分割为获取单元、处理单元以及确定单元，各单元具体功能如上所述。

所述处理三维点云的设备可包括，但不仅限于，处理器60、存储器61。本领域技术人员可以理解，图6仅仅是处理三维点云的设备6的示例，并不构成对处理三维点云的设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如所述处理三维点云的设备还可以包括输入输出终端、网络接入终端、总线等。

所称处理器60可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器61可以是所述处理三维点云的设备的内部存储单元，例如处理三维点云的设备的硬盘或内存。所述存储器61也可以是所述处理三维点云的设备的外部存储终端，例如所述处理三维点云的设备上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。进一步地，所述存储器61还可以既包括所述处理三维点云的设备的内部存储单元也包括外部存储终端。所述存储器61用于存储所述计算机指令以及所述终端所需的其他程序和数据。所述存储器61还可以用于暂时地存储已经输出或者将要输出的数据。

本申请实施例还提供了一种计算机存储介质，计算机存储介质可以是非易失性，也可以是易失性，该计算机存储介质存储有计算机程序，该计算机程序被处理器执行时实现上述各个产品知识图谱的构建方法实施例中的步骤。

以上所述实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神范围，均应包含在本申请的保护范围之内。

Claims

一种处理三维点云的方法，其特征在于，包括：

获取包括多个点的点云数据；

将所述点云数据输入到已训练的卷积神经网络中处理，得到每个点对应的目标特征，所述卷积神经网络包括几何注意力融合模块和聚焦模块，所述几何注意力融合模块用于提取每个所述点的局部增强特征，所述聚焦模块用于基于每个所述点的局部增强特征，提取每个所述点的目标特征；

基于每个点对应的目标特征，确定每个点对应的预测类别。
如权利要求1所述的方法，其特征在于，所述提取每个所述点的局部增强特征，包括：

针对点云数据中的每个点，基于所述几何注意力融合模块获取所述点在欧式空间的近邻点，且基于所述点在欧式空间的近邻点确定所述点在特征值空间的近邻点；

融合所述点在欧式空间的近邻点以及所述点在特征值空间的近邻点，得到所述点对应的局部特征；

聚合所述点对应的局部特征，得到所述点对应的局部增强特征。
如权利要求2所述的方法，其特征在于，所述聚合所述点对应的局部特征，得到所述点对应的局部增强特征，包括：

基于注意力池化方式聚合所述点对应的局部特征，得到所述点对应的局部增强特征。
如权利要求1所述的方法，其特征在于，所述多个点包括不可分辨点，所述不可分辨点为所述多个点中不易确定预测类别的点，所述基于每个所述点的局部增强特征，提取每个所述点的目标特征，包括：

基于每个所述点的局部增强特征对每个点进行局部差分，得到每个点对应的局部差异；

根据每个点对应的局部差异，在所述多个点中确定所述不可分辨点；

采用多层感知器提取每个不可分辨点对应的目标特征。
如权利要求4所述的方法，其特征在于，所述采用多层感知器提取每个不可分辨点对应的目标特征，包括：

获取每个不可分辨点对应的预测标签，以及获取每个不可分辨点对应的中间特征；

针对每个不可分辨点，聚集所述不可分辨点对应的预测标签和中间特征，得到所述不可分辨点对应的聚集结果；

基于每个不可分辨点对应的聚集结果，采用多层感知器提取每个不可分辨点对应的目标特征。
如权利要求4所述的方法，其特征在于，所述基于每个点对应的目标特征，确定每个点对应的预测类别，包括：

基于每个不可分辨点对应的目标特征，确定每个不可分辨点对应的各个类别所对应的预测概率值；

基于各个类别所对应的预测概率值，确定每个不可分辨点对应的预测类别。
如权利要求1至6任一项所述的方法，其特征在于，所述将所述点云数据输入到已训练的卷积神经网络中处理，得到每个点对应的目标特征之前，所述方法还包括：

获取训练集和测试集，所述训练集包括多个样本点的样本点云数据，所述测试集包括每个样本点对应的样本特征以及样本类别；

通过所述训练集对初始卷积神经网络进行训练，得到训练中的卷积神经网络；

基于所述样本集对所述训练中的卷积神经网络进行验证；

当验证结果不满足预设条件时，调整所述训练中的卷积神经网络的网络参数，并继续基于所述训练集对所述训练中的卷积神经网络进行训练；

当验证结果满足预设条件时，停止训练所述训练中的卷积神经网络，并将训练后的卷积神经网络作为所述已训练的卷积神经网络。
如权利要求4所述的方法，其特征在于，所述方法还包括：

基于预设度量方法，评价每个不可分辨点对应的预测类别是否准确；

当检测到预测类别准确的不可分辨点的数量不满足预设阈值时，继续训练所述卷积神经网络。
一种处理三维点云的装置，其特征在于，包括：

获取单元，用于获取包括多个点的点云数据；

处理单元，用于将所述点云数据输入到已训练的卷积神经网络中处理，得到每个点对应的目标特征，所述卷积神经网络包括几何注意力融合模块和聚焦模块，所述几何注意力融合模块用于提取每个所述点的局部增强特征，所述聚焦模块用于基于每个所述点的局部增强特征，提取每个所述点的目标特征；

确定单元，用于基于每个点对应的目标特征，确定每个点对应的预测类别。
一种处理三维点云的设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至8任一项所述的方法。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至8任一项所述的方法。