WO2023185494A1

WO2023185494A1 - 一种点云数据识别方法、装置、电子设备及存储介质

Info

Publication number: WO2023185494A1
Application number: PCT/CN2023/081972
Authority: WO
Inventors: 詹景麟; 刘铁军; 张晶威; 刘丹
Original assignee: 苏州浪潮智能科技有限公司
Priority date: 2022-03-28
Filing date: 2023-03-16
Publication date: 2023-10-05
Also published as: CN114419570A; CN114419570B

Abstract

本申请提供一种点云数据识别方法、装置、电子设备及存储介质，方法包括：获取单帧点云数据，并将单帧点云数据分割为预设数量的局部数据；将局部数据并行输入至预设数量的PointNet++网络中，以使PointNet++网络提取局部数据对应的局部特征；将所有局部数据输入至ViT网络中，以使ViT网络提取单帧点云数据的全局特征；融合局部特征和全局特征得到融合特征，并利用融合特征对单帧点云数据进行类型识别；结合PointNet++网络和ViT网络进行点云数据的识别任务，能够有效提取点云数据的全局特征，并能够很好地综合点云数据的全局特征及局部特征，进而可有效提升点云数据的感知及识别效果。

Description

一种点云数据识别方法、装置、电子设备及存储介质

相关申请的交叉引用

本申请要求于2022年03月28日提交中国专利局，申请号为202210308663.4，申请名称为“一种点云数据识别方法、装置、电子设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及模式识别领域，特别涉及一种点云数据识别方法、一种点云数据识别装置、相应的一种电子设备，以及相应的一种计算机非易失性可读存储介质。

背景技术

相比于传统摄像头所提供的二维图像数据，激光雷达所提供的点云数据可包含三维深度信息，且可排除光线条件的干扰，能够有效提升无人驾驶系统的感知性能，因此在无人驾驶领域中，常使用点云数据执行目标识别任务。然而，点云数据识别算法在全局特征的提取方面存在不足，且无法有效综合点云数据中的全局特征及局部特征，进而难以取得较好的感知效果。

发明内容

本申请的目的是提供一种点云数据识别方法、装置、电子设备及计算机非易失性可读存储介质，可结合PointNet++网络(表现为编码器-解码器Encoder-Decoder模型框架的网络结构)和ViT(Vision Transformer，视觉转换器)网络进行点云数据的识别任务，能够有效提取点云数据的全局特征，并能够很好地综合点云数据的全局特征及局部特征，进而可有效提升点云数据的感知及识别效果。

为解决上述技术问题，本申请提供一种点云数据识别方法，包括：

获取单帧点云数据，并将单帧点云数据分割为预设数量的局部数据；

将局部数据并行输入至预设数量的PointNet++网络中，以使PointNet++网络提取局部数据对应的局部特征；

将所有局部数据输入至ViT网络中，以使ViT网络提取单帧点云数据的全局特征；

融合局部特征和全局特征得到融合特征，并利用融合特征对单帧点云数据进行类型识别。

在本申请的一些实施例中，将单帧点云数据分割为预设数量的局部数据，包括：

利用K均值算法将单帧点云数据中的数据点划分至预设数量的数据簇中，得到局部数据；

对每一局部数据包含的数据点数量进行统计；

若数据点数量大于预设数据点数量，则对数据点数量对应的目标局部数据中的数据点进行随机移除，直至移除后的数据点数量等于预设数据点数量；

若数据点数量小于预设数据点数量，则在目标局部数据中增加新数据点，直至增加后的数据点数量等于预设数据点数量。

在本申请的一些实施例中，在目标局部数据中增加新数据点，包括：

利用插值法及目标局部数据中的数据点生成新数据点，并将新数据点添加至目标局部数据中。

在本申请的一些实施例中，融合局部特征和全局特征得到融合特征，包括：

将局部特征对应的局部特征向量与全局特征对应的全局特征向量进行拼接，得到融合特征。

在本申请的一些实施例中，PointNet++网络提取局部数据对应的局部特征，包括：

PointNet++网络利用预训练的转换矩阵对接收到的局部数据进行对齐，并提取对齐后的局部数据的局部特征。

在本申请的一些实施例中，在获取单帧点云数据之前，还包括：

获取点云训练集，并随机初始化PointNet++网络、ViT网络及类型识别过程中所需使用的模型权重；点云训练集中的单帧点云训练数据标注有对应的实际分类；

将点云训练集中的每一单帧点云训练数据分割为预设数量的局部训练数据；

将单帧点云训练数据对应的局部训练数据输入至PointNet++网络和ViT网络，并对PointNet++网络和ViT网络的输出结果进行融合，得到单帧点云训练数据的融合特征；

利用单帧点云训练数据的融合特征对单帧点云训练数据进行类型识别，并利用得到的预测分类及单帧点云训练数据的实际分类计算损失值；

利用梯度下降法及损失值对模型权重进行迭代更新，并进入将单帧点云训练数据对应的局部训练数据输入至PointNet++网络和ViT网络的步骤，直至迭代次数到达预设上限或损失值小于预设阈值。

本申请还提供一种点云数据识别装置，包括：

获取及分割模块，用于获取单帧点云数据，并将单帧点云数据分割为预设数量的局部数据；

第一输入模块，用于将局部数据并行输入至预设数量的PointNet++网络中，以使PointNet++网络提取局部数据对应的局部特征；

第二输入模块，用于将所有局部数据输入至ViT网络中，以使ViT网络提取单帧点云数据的全局特征；

融合及识别模块，用于融合局部特征和全局特征得到融合特征，并利用融合特征对单帧点云数据进行类型识别。

在本申请的一些实施例中，获取及分割模块，包括：

划分子模块，用于利用K均值算法将单帧点云数据中的数据点划分至预设数量的数据簇中，得到局部数据；

统计子模块，用于对每一局部数据包含的数据点数量进行统计；

移除子模块，用于若数据点数量大于预设数据点数量，则对数据点数量对应的目标局部数据中的数据点进行随机移除，直至移除后的数据点数量等于预设数据点数量；

增加子模块，用于若数据点数量小于预设数据点数量，则在目标局部数据中增加新数据点，直至增加后的数据点数量等于预设数据点数量。

本申请还提供一种电子设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行计算机程序时实现如上述点云数据识别方法。

本申请还提供一种计算机非易失性可读存储介质，计算机非易失性可读存储介质中存储有计算机可执行指令，计算机可执行指令被处理器加载并执行时，实现如上述点云数据识别方法。

本申请提供一种点云数据识别方法，包括：获取单帧点云数据，并将单帧点云数据分割为预设数量的局部数据；将局部数据并行输入至预设数量的PointNet++网络中，以使PointNet++网络提取局部数据对应的局部特征；将所有局部数据输入至ViT网络中，以使ViT网络提取单帧点云数据的全局特征；融合局部特征和全局特征得到融合特征，并利用融合特征对单帧点云数据进行类型识别。

可见，本申请实施例会综合PointNet++网络和ViT网络进行点云数据的识别任务，在得到单帧点云数据时，会首先将该数据划分为预设数量的局部数据，并且并行输入至对应的PointNet++网络中进行局部特征提取，这是由于该网络在局部感知效果上具有性能优势，且可有效提升显卡内存利用率；此外，本申请实施例还会将所有局部数据输入至ViT网络中，以提取单帧点云数据的全局特征，这是由于ViT网络具有自注意力机制，在提取点云数据全局特征方面具有性能优势；进一步，本申请实施例会将得到的局部特征和全局特征进行融合，并利用融合后的融合特征对单帧点云数据进行类型识别，不仅能够弥补现有方式难以有效提取点云数据全局特征的缺陷，同时还很好地综合了点云数据的全局特征及局部特征，进而能够有效提升点云数据的感知及识别效果。本申请实施例还提供一种点云数据识别装置、电子设备及计算机非易失性可读存储介质，具有上述有益效果。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请实施例所提供的一种点云数据识别方法的流程图；

图2为本申请实施例所提供的一种神经网络整体框架图；

图3为本申请实施例所提供的一种点云数据识别装置的结构框图；

图4为本申请实施例所提供的一种电子设备的结构示意图；

图5为本申请实施例所提供的一种计算机非易失性可读存储介质的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

点云数据识别算法在全局特征的提取方面存在不足，且无法有效综合点云数据中的全局特征及局部特征，进而难以取得较好的感知效果。本申请实施例提供一种点云数据识别方法，可结合PointNet++网络和ViT网络进行点云数据的识别任务，能够有效提取点云数据的全局特征，并能够很好地综合点云数据的全局特征及局部特征，进而可有效提升点云数据的感知及识别效果。请参考图1，图1为本申请实施例所提供的一种点云数据识别方法的流程图，该方法可以包括：

S101、获取单帧点云数据，并将单帧点云数据分割为预设数量的局部数据。

需要说明的是，本申请实施例并不限定单帧点云数据的具体采集设备，例如可采用机械旋转式激光雷达、混合式激光雷达或固态激光雷达进行采集；本申请实施例也不限定单帧点云数据中包含的数据点数量及其他采集参数，可根据实际应用需求进行设定。

在本申请的一些实施例中，为了对单帧点云数据中的局部特征进行有效提取，需要首先将单帧点云数据进行分割，得到预设数量的局部数据，其中预设数量可根据实际应用需求进行设定。需要说明的是，本申请实施例并不限定分割单帧点云数据的具体方式，例如可预先在单帧点云数据中划分出预设数量的预设区域，并依照该预设区域对单帧点云数据进行分割；当然也可以采用聚类的方式，将单帧点云数据中的数据点划分至预设数量的数据簇中，进而将这些数据簇设置为局部数据。在本申请的一些实施例中，为避免特殊分割方式对识别的影响，同时为避免预设区域对神经网络局部特征捕捉能力的限制，可采用上述聚类的方式对单帧点云数据进行分割，以采用自适应的方式进行局部数据提取。需要说明的是，本申请实施例并不限定具体的聚类方式，例如可采用K均值(K-Means)、均值偏移聚类算法等，可依照实际应用需求进行设定。考虑到K均值是较为常用的聚类算法，在本申请的一些实施例中可以将采用K均值对单帧点云数据进行分割。

需要说明的是，神经网络通常只能输入结构规范的数据，换而言之，可被神经网络接收的局部数据应当包含固定数量的数据点。然而，在采用聚类算法对单帧点云数据进行分割之后，得到的局部数据所包含的数据点数量并不固定，因此在完成分割之后，还需要对局部数据中的数据点进行移除或增加，以确保单帧点云数据对应的局部数据均可被神经网络处理。

在本申请的一些实施例中，将单帧点云数据分割为预设数量的局部数据，可以包括：

步骤11：利用K均值算法将单帧点云数据中的数据点划分至预设数量的数据簇中，得到局部数据；

步骤12：对每一局部数据包含的数据点数量进行统计；

步骤13：若数据点数量大于预设数据点数量，则对数据点数量对应的目标局部数据中的数据点进行随机移除，直至移除后的数据点数量等于预设数据点数量；

步骤14：若数据点数量小于预设数据点数量，则在目标局部数据中增加新数据点，直至增加后的数据点数量等于预设数据点数量。

需要说明的是，本申请实施例并不限定K均值算法的具体步骤，例如可包含聚类中心初始化、距离计算、点集确定及聚类中心迭代更新等步骤，可参考K均值的相关技术；本申请实施例也不限定预设数据点数量的具体数值，可根据实际应用需求进行设定。

其中，当数据点数量大于预设数据点数量时，本申请实施例将会对局部数据中的数据点进行随机移除，能够有效减少因数据点移除而对局部特征造成的损失。

需要说明的是，本申请实施例并不限定当数据点数量小于预设数据点数量时，向局部数据中增加新数据点的方式，例如可不断向局部数据中填充零值(即无效数据)；当然也可以采用插值法，对局部数据中原有的数据点进行插值得到新数据点，并将新数据点添加至局部数据中。在本申请的一些实施例中，为避免新增数据对局部数据原有特征的影响，可采用插值法对局部数据进行扩充。

在本申请的一些实施例中，在目标局部数据中增加新数据点，可以包括：

步骤21：利用插值法及目标局部数据中的数据点生成新数据点，并将新数据点添加至目标局部数据中。

S102、将局部数据并行输入至预设数量的PointNet++网络中，以使PointNet++网络提取局部数据对应的局部特征。

在本申请的一些实施例中，局部数据首先被并行输入至预设数量的PointNet++网络中进行特征提取，其中PointNet++网络是一种用于提取三维点云特征的神经网络，具有较强的局部特征提取性能。为便于理解，请参考图2，图2为本申请实施例所提供的一种神经网络整体框架图。从图中可知，局部数据与PointNet++网络之间的对应关系为一对一，即N’组局部数据再被并行输入至PointNet++模块之后，将被N’组PointNet++网络处理得到N’组局部特征。需要说明的是，本申请实施例并不限定PointNet++网络的具体结构，例如可包含MLP层(Multilayer Perceptron，多层感知机)、池化层(Pooling)等，也不限定该网络各层的具体功能，可参考PointNet++网络的相关技术。

在进行局部特征提取之前，PointNet++网络可对局部数据进行数据对齐操作。具体的，可预先构建一个小型子网络，并训练得到一个转换矩阵，通过该转换矩阵确保点云数据在3D(3Dimensions，三维)空间内的仿射变换不变性，即数据经过平移、旋转等操作不影响该神经网络对于环境的感知能力。

在本申请的一些实施例中，PointNet++网络提取局部数据对应的局部特征，可以包括：

步骤31：PointNet++网络利用预训练的转换矩阵对接收到的局部数据进行对齐，并提取对齐后的局部数据的局部特征。

在完成数据对齐后，PointNet++网络便可将局部数据传输至MLP层，通过数据的多级线性和非线性变换对点云数据进行特征提取，将原始数据的表达从几何空间转换为语义空间，通过再一次的数据对齐和MLP操作，进一步抽象底层特征，最终经过数据的池化处理，获得该局部点云数据的高级特征表达形式，即得到局部特征。

S103、将所有局部数据输入至ViT网络中，以使ViT网络提取单帧点云数据的全局特征。

本申请实施例进一步会将单帧点云数据对应的所有局部数据输入至ViT网络中，以提取单帧点云数据的全局特征，其中ViT是一种基于自注意力体系的图像识别神经网络，其结构可参考图2，例如可包含归一化层、多头自注意力层及MLP层。该网络在处理局部数据的过程中，依据自注意力分数加权引入其他局部区域数据的影响，从而有利于该网络结构的全局特征捕获。需要说明的是，本申请实施例并不限定ViT网络各层的具体功能，可参考ViT网络的相关技术。应当指出的是，与局部特征不同，ViT网络仅会为单帧点云数据生成一份全局特征。

S104、融合局部特征和全局特征得到融合特征，并利用融合特征对单帧点云数据进行类型识别。

在得到局部特征及全局特征后，本申请实施例将对这两个特征进行融合得到融合特征，并利用融合特征进行类型识别。由于本申请实施例可利用更多特征信息对点云数据进行类型识别，因此能够有效提升点云数据的识别准确率。需要说明的是，本申请实施例并不限定如何对局部特征和全局特征进行融合，考虑到特征通常采用向量的形式进行表示，因此在本申请实施例中，可将局部特征对应的局部特征向量与全局特征对应的全局特征向量进行拼接，以得到融合特征。

在本申请的一些实施例中，融合局部特征和全局特征得到融合特征，可以包括：

步骤41：将局部特征对应的局部特征向量与全局特征对应的全局特征向量进行拼接，得到融合特征。

需要说明的是，本申请实施例并不限定具体的类型识别过程，也不限定单帧点云数据具体对应的预设类型，可根据实际应用需求进行设定。

基于上述实施例，本申请实施例会综合PointNet++网络和ViT网络进行点云数据的识别任务，在得到单帧点云数据时，会首先将该数据划分为预设数量的局部数据，并且并行输入至对应的PointNet++网络中进行局部特征提取，这是由于该网络在局部感知效果上具有性能优势，且可有效提升显卡内存利用率；此外，本申请实施例还会将所有局部数据输入至ViT网络中，以提取单帧点云数据的全局特征，这是由于ViT网络具有自注意力机制，在提取点云数据全局特征方面具有性能优势；进一步，本申请实施例会将得到的局部特征和全局特征进行融合，并利用融合后的融合特征对单帧点云数据进行类型识别，不仅能够弥补现有方式难以有效提取点云数据全局特征的缺陷，同时还很好地综合了点云数据的全局特征及局部特征，进而能够有效提升点云数据的感知及识别效果。

基于上述实施例，下面将对上述网络的训练方式进行介绍。在本申请的一些实施例中，在获取单帧点云数据之前，还可以包括：

S201、获取点云训练集，并随机初始化PointNet++网络、ViT网络及类型识别过程中所需使用的模型权重；点云训练集中的单帧点云训练数据标注有对应的实际分类。

需要说明的是，本申请实施例并不限定点云训练集可包含的单帧点云训练数据的数量，也不限定这些单帧点云训练数据的采集时间、场景、反射率数值等，可根据实际应用需求进行设定。本申请实施例也不限定具体的实际分类，同样可根据实际应用需求进行设定。为方便训练集生成，在实际应用中，点云训练集还可按照预设比例从点云数据集中划分出来，例如将经过标注的点云数据拆分为训练集和测试集。以最简单的留出法为例，通过随机不放回采样的方式将4/5的数据用于训练，剩余1/5的数据用于测试。当然，具体的预设比例可依照实际应用需求进行设定。

本申请实施例并不限定PointNet++网络、ViT网络及类型识别过程中所需使用的模型权重，可参考相关技术。为启动训练过程，本申请实施例预先对这些模型权重进行了随机初始化，以随机设置这些模型权重的数值。

S202、将点云训练集中的每一单帧点云训练数据分割为预设数量的局部训练数据。

S203、将单帧点云训练数据对应的局部训练数据输入至PointNet++网络和ViT网络，并对PointNet++网络和ViT网络的输出结果进行融合，得到单帧点云训练数据的融合特征。

需要说明的是，对步骤S202、S203的描述与对步骤S101至S103的描述一致，可参考上述实施例，此处不再赘述。

S204、利用单帧点云训练数据的融合特征对单帧点云训练数据进行类型识别，并利用得到的预测分类及单帧点云训练数据的实际分类计算损失值。

为便于说明，下面将以特定分类数量进行介绍。在本申请的一些实施例中，假定预设的实际分类数量为4个，将神经网络的输出结果中第m帧点云数据第i个点在第k个类别的得分表示为y_mik，通过softmax函数将该分数映射到一个0～1区间的数值，将神经网络的输出结果转化为第m帧点云数据第i个点在第k个类别的概率

其中exp(·)表示指数函数。点云训练集包含的点云数据样本数为M_train，第m帧点云数据中包含的数据点个数为N_m个，则定义损失函数L为：

其中，为一个符号函数，若第m帧点云数据第i个点在第k个类别与其真实的类别(即实际类别y_{mi_actual})相同时，则该符号函数的函数值为1，否则为0。利用上述损失函数L及单帧点云训练数据的预测分类和实际分类，便可计算出本轮训练中网络的损失值。

S205、利用梯度下降法及损失值对模型权重进行迭代更新，并进入将单帧点云训练数据对应的局部训练数据输入至PointNet++网络和ViT网络的步骤，直至迭代次数到达预设上限或损失值小于预设阈值。

具体的，可采用梯度下降优化算法(GradientDescent)对神经网络进行迭代训练，并按照如下公式对参数进行迭代优化，其中θ_t表示第t轮的模型权重，η表示超参数，表示损失函数L的梯度值。

迭代训练应当设置退出条件。在本申请的一些实施例中，上述迭代训练可在迭代次数到达预设上限或是损失值小于预设阈值时退出。本申请实施例并不限定具体的预设上限和预设阈值，可根据实际应用需求进行设定。

在完成训练之后，还可利用测试数据集对神经网络的识别效果进行验证。具体的，设测试集中包含的点云数据样本数为M_test，其中第m帧点云数据第i个点在第k个类别的概率取最大值对应的k为第m帧点云数据第i个点的预测类别对应的人工标注真实类别为y_{mi_actual}，则定义预测准确率accuracy为：

其中，为一个符号函数，当时函数值为1，否则为0。

下面对本申请实施例提供的点云数据识别装置、电子设备及计算机非易失性可读存储介质进行介绍，下文描述的点云数据识别装置、电子设备及计算机非易失性可读存储介质与上文描述的点云数据识别方法可相互对应参照。

请参考图3，图3为本申请实施例所提供的一种点云数据识别装置的结构框图，该装置可以包括：

获取及分割模块301，用于获取单帧点云数据，并将单帧点云数据分割为预设数量的局部数据；

第一输入模块302，用于将局部数据并行输入至预设数量的PointNet++网络中，以使 PointNet++网络提取局部数据对应的局部特征；

第二输入模块303，用于将所有局部数据输入至ViT网络中，以使ViT网络提取单帧点云数据的全局特征；

融合及识别模块304，用于融合局部特征和全局特征得到融合特征，并利用融合特征对单帧点云数据进行类型识别。

在本申请的一些实施例中，获取及分割模块301，可以包括：

在本申请的一些实施例中，增加子模块，可以包括：

插值单元，用于利用插值法及目标局部数据中的数据点生成新数据点，并将新数据点添加至目标局部数据中。

在本申请的一些实施例中，融合及识别模块304，可以包括：

融合子模块，用于将局部特征对应的局部特征向量与全局特征对应的全局特征向量进行拼接，得到融合特征。

在本申请的一些实施例中，第一输入模块302，可以包括：

PointNet++训练模块，用于PointNet++网络利用预训练的转换矩阵对接收到的局部数据进行对齐，并提取对齐后的局部数据的局部特征。

在本申请的一些实施例中，该装置还可以包括：

训练初始化模块，用于获取点云训练集，并随机初始化PointNet++网络、ViT网络及类型识别过程中所需使用的模型权重；点云训练集中的单帧点云训练数据标注有对应的实际分类；

训练数据分割模块，用于将点云训练集中的每一单帧点云训练数据分割为预设数量的局部训练数据；

训练数据输入模块，用于将单帧点云训练数据对应的局部训练数据输入至PointNet++网络和ViT网络，并对PointNet++网络和ViT网络的输出结果进行融合，得到单帧点云训练数据的融合特征；

识别及损失值计算模块，用于利用单帧点云训练数据的融合特征对单帧点云训练数据进行类型识别，并利用得到的预测分类及单帧点云训练数据的实际分类计算损失值；

更新模块，用于利用梯度下降法及损失值对模型权重进行迭代更新，并进入将单帧点云训练数据对应的局部训练数据输入至PointNet++网络和ViT网络的步骤，直至迭代次数到达预设上限或损失值小于预设阈值。

本申请实施例还提供一种电子设备，包括：

如图4所示的存储器402，用于存储计算机程序；

处理器401，用于执行计算机程序时实现如上述的点云数据识别方法的步骤。

由于电子设备部分的实施例与点云数据识别方法部分的实施例相互对应，因此电子设备部分的实施例请参见点云数据识别方法部分的实施例的描述，这里不再赘述。

本申请实施例还提供一种计算机非易失性可读存储介质，如图5所示，计算机非易失性可读存储介质5上存储有计算机程序51，计算机程序51被处理器执行时实现上述任意实施例的点云数据识别方法的步骤。

由于计算机非易失性可读存储介质部分的实施例与点云数据识别方法部分的实施例相互对应，因此存储介质部分的实施例请参见点云数据识别方法部分的实施例的描述，这里不再赘述。

说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

以上对本申请所提供的一种点云数据识别方法、装置、电子设备及计算机非易失性可读存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以对本申请进行若干改进和修饰，这些改进和修饰也落入本申请权利要求的保护范围内。

Claims

一种点云数据识别方法，其特征在于，包括：

获取单帧点云数据，并将所述单帧点云数据分割为预设数量的局部数据；

将所述局部数据并行输入至所述预设数量的PointNet++网络中，以使所述PointNet++网络提取所述局部数据对应的局部特征；

将所有所述局部数据输入至ViT网络中，以使所述ViT网络提取所述单帧点云数据的全局特征；

融合所述局部特征和所述全局特征得到融合特征，并利用所述融合特征对所述单帧点云数据进行类型识别。
根据权利要求1所述的点云数据识别方法，其特征在于，所述将所述单帧点云数据分割为预设数量的局部数据，包括：

利用聚类算法将所述单帧点云数据中的数据点划分至所述预设数量的数据簇中，得到所述局部数据；

对每一所述局部数据包含的数据点数量进行统计；

若所述数据点数量大于预设数据点数量，则对所述数据点数量对应的目标局部数据中的数据点进行随机移除，直至移除后的数据点数量等于所述预设数据点数量；

若所述数据点数量小于所述预设数据点数量，则在所述目标局部数据中增加新数据点，直至增加后的数据点数量等于所述预设数据点数量。
根据权利要求2所述的点云数据识别方法，其特征在于，所述聚类算法包括K均值算法、均值偏移聚类算法。
根据权利要求2所述的点云数据识别方法，其特征在于，所述在所述目标局部数据中增加新数据点，包括：

利用插值法及所述目标局部数据中的数据点生成所述新数据点，并将所述新数据点添加至所述目标局部数据中。
根据权利要求2所述的点云数据识别方法，其特征在于，所述新数据包括无效数据；所述在所述目标局部数据中增加新数据点，包括：

向所述目标局部数据中填充无效数据；所述无效数据包括零值。
根据权利要求1所述的点云数据识别方法，其特征在于，所述融合所述局部特征和所述全局特征得到融合特征，包括：

将所述局部特征对应的局部特征向量与所述全局特征对应的全局特征向量进行拼接，得到所述融合特征。
根据权利要求1所述的点云数据识别方法，其特征在于，所述PointNet++网络提取所述局部数据对应的局部特征，包括：

所述PointNet++网络利用预训练的转换矩阵对接收到的局部数据进行对齐，并提取对齐后的局部数据的局部特征。
根据权利要求7所述的点云数据识别方法，其特征在于，所述提取对齐后的局部数据的局部特征，包括：

对所述对齐后的局部数据进行特征提取，得到抽象后的底层特征；

对所述底层特征进行池化处理，得到局部特征。
根据权利要求8所述的点云数据识别方法，其特征在于，所述PointNet++网络包含MLP层；所述对所述对齐后的局部数据进行特征提取，得到抽象后的底层特征，包括：

将所述对齐后的局部数据输入至所述MLP层，通过所述MLP层对所述局部数据进行多级线性和非线性变换操作，将所述局部数据的表达从几何空间转换为语义空间；

将进行表达转换的局部数据再次进行数据对齐操作以及MLP层操作，得到抽象后的底层特征。
根据权利要求8所述的点云数据识别方式，其特征在于，所述PointNet++网络包含池化层；所述对所述底层特征进行池化处理，得到局部特征；所述局部特征为所述局部数据的高级特征表达形式，包括：

通过所述池化层对底层特征进行池化处理，得到局部特征；所述局部特征为所述局部数据的高级特征表达形式。
根据权利要求7所述的点云数据识别方法，其特征在于，所述局部数据包括多组局部数据，其中，所述局部数据与PointNet++网络之间的对应关系为一对一；

所述PointNet++网络提取所述局部数据对应的局部特征，包括：

获取与所述多组局部数据一一对应的多组PointNet++网络，所述多组PointNet++网络对所述多组局部数据处理得到多组局部特征。
根据权利要求1所述的点云数据识别方法，其特征在于，所述ViT网络提取所述单帧点云数据的全局特征，包括：

所述ViT网络依据自注意力分数加权引入其他局部区域数据的影响，进行对所述单帧点云数据的全局特征的捕获。
根据权利要求1所述的点云数据识别方法，其特征在于，所述获取单帧点云数据包括：

获取采集设备和采集参数；所述采集设备包括机械旋转式激光雷达、混合式激光雷达或固态激光雷达；

采用所述采集设备，基于所述采集参数对单帧点云数据进行采集。
根据权利要求1至7任一项所述的点云数据识别方法，其特征在于，在获取单帧点云数据之前，还包括：

获取点云训练集，并随机初始化所述PointNet++网络、所述ViT网络及所述类型识别过程中所需使用的模型权重；所述点云训练集中的单帧点云训练数据标注有对应的实际分类；

将所述点云训练集中的每一所述单帧点云训练数据分割为所述预设数量的局部训练数据；

将所述单帧点云训练数据对应的局部训练数据输入至所述PointNet++网络和所述ViT网络，并对所述PointNet++网络和所述ViT网络的输出结果进行融合，得到所述单帧点云训练数据的融合特征；

利用所述单帧点云训练数据的融合特征对所述单帧点云训练数据进行类型识别，并利用得到的预测分类及所述单帧点云训练数据的实际分类计算损失值；

利用梯度下降法及所述损失值对所述模型权重进行迭代更新，并进入将所述单帧点云训练数据对应的局部训练数据输入至所述PointNet++网络和所述ViT网络的步骤，直至迭代次数到达预设上限或所述损失值小于预设阈值。
根据权利要求14所述的方法，其特征在于，所述获取点云训练集，包括：

按照预设比例从点云数据集中将标注的点云数据划分得到点云训练集。
根据权利要求1至7任一项所述的点云数据识别方法，其特征在于，所述点云数据识别方法应用于执行无人驾驶领域的目标识别任务。
一种点云数据识别装置，其特征在于，包括：

获取及分割模块，用于获取单帧点云数据，并将所述单帧点云数据分割为预设数量的局部数据；

第一输入模块，用于将所述局部数据并行输入至所述预设数量的PointNet++网络中，以使所述PointNet++网络提取所述局部数据对应的局部特征；

第二输入模块，用于将所有所述局部数据输入至ViT网络中，以使所述ViT网络提取所述单帧点云数据的全局特征；

融合及识别模块，用于融合所述局部特征和所述全局特征得到融合特征，并利用所述融合特征对所述单帧点云数据进行类型识别。
根据权利要求17所述的点云数据识别装置，其特征在于，所述获取及分割模块，包括：

划分子模块，用于利用聚类算法将所述单帧点云数据中的数据点划分至所述预设数量的数据簇中，得到所述局部数据；其中，所述聚类算法包括K均值算法、均值偏移聚类算法；

统计子模块，用于对每一所述局部数据包含的数据点数量进行统计；

移除子模块，用于若所述数据点数量大于预设数据点数量，则对所述数据点数量对应的目标局部数据中的数据点进行随机移除，直至移除后的数据点数量等于所述预设数据点数量；

增加子模块，用于若所述数据点数量小于所述预设数据点数量，则在所述目标局部数据中增加新数据点，直至增加后的数据点数量等于所述预设数据点数量。
一种电子设备，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求1至16任一项所述点云数据识别方法。
一种计算机非易失性可读存储介质，其特征在于，所述计算机非易失性可读存储介质中存储有计算机可执行指令，所述计算机可执行指令被处理器加载并执行时，实现如权利要求1至16任一项所述点云数据识别方法。