CN115375910B

CN115375910B - 一种基于注意力机制的点云特征提取方法及装置

Info

Publication number: CN115375910B
Application number: CN202211116427.9A
Authority: CN
Inventors: 张新钰; 王力; 张皓明; 谢涛; 李骏; 吴新刚; 李金伦
Original assignee: Tsinghua University
Current assignee: Tsinghua University
Priority date: 2022-09-14
Filing date: 2022-09-14
Publication date: 2023-04-14
Anticipated expiration: 2042-09-14
Also published as: CN115375910A

Abstract

本申请提供了一种基于注意力机制的点云特征提取方法及装置，涉及智能驾驶技术领域，该方法包括：利用预先训练完成的编码器对点云数据进行逐层下采样及升维处理，得到第一特征金字塔；利用预先训练完成的解码器对第二特征金字塔的第T层点云特征数据分别进行两次上采样处理，得到上采样数据及第二特征金字塔的初始第T‑1层点云特征数据；向下逐层进行处理，直至得到第二特征金字塔的初始第零层点云特征数据；对第一特征金字塔的第零层点云特征数据、第二特征金字塔的初始第零层点云特征数据和上采样数据进行交叉注意力机制处理，得到最终的点云特征数据。本申请能够降低点云特征上采样时的语义信息损失，提高主干网络的点云特征提取性能。

Description

一种基于注意力机制的点云特征提取方法及装置

技术领域

本申请涉及自动驾驶技术领域，尤其是涉及一种基于注意力机制的点云特征提取方法及装置。

背景技术

在对点云数据进行特征提取时，需要利用主干网络提取点云的空间位置信息和语义信息。主干网络有2个部分组成：编码器和解码器。

目前，绝大多数解码器的上采样层在融合来自与它分辨率相同的编码器中提取到的语义信息时，会将两部分点云特征在通道维度上进行拼接，这样的拼接操作会使得点云特征维度增加，占用额外的存储空间，并且直接拼接也会导致语义信息模糊。因此，需要进一步使用多层感知机进行处理。解码器的多层感知机往往会压缩通道维度，减少数据量，使得融合后的语义信息更加明确。但是，点云的通道维度大量的压缩可能会导致一些重要的语义信息的丢失的问题。

发明内容

有鉴于此，本申请提供了一种基于注意力机制的点云特征提取方法及装置，以解决现有技术存在的上述技术问题。

第一方面，本申请实施例提供了一种基于注意力机制的点云特征提取方法，所述方法包括：

对原始点云数据进行采样处理，得到包含预设点云数量的点云数据；

利用预先训练完成的编码器对点云数据进行逐层下采样及升维处理，得到第一特征金字塔，所述第一特征金字塔包括T+1层点云特征数据；

利用预先训练完成的解码器对第二特征金字塔的第T层点云特征数据分别进行两次上采样处理，得到上采样数据及第二特征金字塔的初始第T-1层点云特征数据，其中第二特征金字塔的第T层点云特征数据和第一特征金字塔的第T层点云特征数据相同；将第一特征金字塔的第T-1层点云特征数据和第二特征金字塔的初始第T-1层点云特征数据进行拼接后，再进行降维处理，得到第二特征金字塔的第T-1层点云特征数据，对第二特征金字塔的第T-1层点云特征数据进行上采样得到第二特征金字塔的初始第T-2层点云特征数据；向下逐层进行处理，直至得到第二特征金字塔的初始第零层点云特征数据；对第一特征金字塔的第零层点云特征数据、第二特征金字塔的初始第零层点云特征数据和上采样数据进行交叉注意力机制处理，得到原始点云数据的点云特征数据。

进一步，所述编码器包括T个依次连接的局部融合层；利用预先训练完成的编码器对点云数据进行逐层下采样及升维处理，得到第一特征金字塔；包括：

获取点云数据

其点云个数为

维度为

则第一特征金字塔的第零层点云特征数据为

利用第t个局部融合层对第一特征金字塔的第t-1层点云特征数据

进行处理，得到第t层点云特征数据

其第i个点云的特征

为：

其中，1≤t≤T；第t-1层数据

的点云个数为

维度为

为

的第j个点云的特征，

N(i)为第i个点云的邻居点云的集合；Δp_ij为第i个点云与第j个点云的相对坐标,Δp_ij＝p_i-p_j,p_i为第i个点云的空间位置坐标，p_j为第j个点云的空间位置坐标；G(·,·)为编码函数；R(·)为归约函数；S(·)表示降采样函数；

则第一特征金字塔包括：第零层点云特征数据

第一层点云特征数据

…、第T-1层点云特征数据

和第T层点云特征数据

进一步，利用预先训练完成的解码器对第二特征金字塔的第T层点云特征数据分别进行两次上采样处理，得到上采样数据及第二特征金字塔的初始第T-1层点云特征数据；包括:

将第一特征金字塔的第T层点云特征数据

作为第二层特征金字塔的第T层点云特征数据

对第二特征金字塔的第T层点云特征数据

进行上采样处理，得到上采样数据

点云个数为

维度为

对第二特征金字塔的第T层点云特征数据

进行上采样处理，得到第二特征金字塔的初始第T-1层点云特征数据

点云个数为

维度为

进一步，将第一特征金字塔的第T-1层点云特征数据和第二特征金字塔的初始第T-1层点云特征数据进行点数拼接后，再进行降维处理，得到第二特征金字塔的第T-1层点云特征数据，对第二特征金字塔的第T-1层数据进行上采样得到第二特征金字塔的初始第T-2层点云特征数据；包括：

将第一特征金字塔的第T-1层点云特征数据

和第二特征金字塔的初始第T-1层点云特征数据

进行维度拼接，得到拼接后的点云特征数据，点云个数为

维度为

利用多层感知机对拼接后的点云特征数据进行降维处理，得到第二特征金字塔的第T-1层点云特征数据

点云个数及维度与第一特征金字塔的第T-1层点云特征数据

相同；

对第二特征金字塔的第T-1层点云特征数据

进行上采样，得到点数减半且维度不变的第二特征金字塔的初始第T-2层点云特征数据

进一步，其特征在于，对第一特征金字塔的第零层数据、第二特征金字塔的初始第零层数据和上采样数据进行交叉注意力机制处理，得到原始点云数据的点云特征数据；包括：

将上采样数据

按照维度分解为：

维度均为

将第二特征金字塔的初始第零层点云特征数据

分解为：

和

维度均为

分别对：

和

的维度取最大值，得到

和

利用线性投影矩阵W_Q、W_K和W_V进行如下变换，得到矩阵Q、矩阵K和矩阵V：

其中，stack(·)表示点数拼接；

计算交叉注意力矩阵atten：

其中，atten为1×7的矩阵；

计算注意力机制输出结果f_atten：

其中，norm(·)表示正规化函数；

利用前馈网络对f_atten进行处理，得到前馈网络输出结果FFN：

FFN＝max(0,f_attenW₁+b₁)W₂+b₂

其中，W₁为

的矩阵，W₂为

的矩阵，b₁为

的矩阵；b₂为

的矩阵；

则第二特征金字塔的第零层点云特征数据

为：

其中，

的点云个数和维度与第一特征金字塔的第零层点云特征数据

的点云个数和维度相同。

则原始点云数据的点云特征数据为

进一步，所述编码器待训练的参数包括：T个局部融合层的参数；所述解码器待训练的参数包括：T-2个多层感知机的参数，线性投影矩阵W_Q、W_K和W_V和前馈网络的参数。

第二方面，本申请实施例提供了一种基于注意力机制的点云特征提取装置，所述装置包括：

预处理单元，用于对原始点云数据进行采样处理，得到包含预设点云数量的点云数据；

编码处理单元，用于利用预先训练完成的编码器对点云特征数据进行逐层下采样及升维处理，得到第一特征金字塔，所述第一特征金字塔包括T+1层的点云特征数据；

解码处理单元，用于利用预先训练完成的解码器对第二特征金字塔的第T层点云特征数据分别进行两次上采样处理，得到上采样数据及第二特征金字塔的初始第T-1层点云特征数据，其中第二特征金字塔的第T层点云特征数据和第一特征金字塔的第T层点云特征数据相同；将第一特征金字塔的第T-1层点云特征数据和第二特征金字塔的初始第T-1层点云特征数据进行拼接后，再进行降维处理，得到第二特征金字塔的第T-1层点云特征数据，对第二特征金字塔的第T-1层点云特征数据进行上采样得到第二特征金字塔的初始第T-2层点云特征数据；向下逐层进行处理，直至得到第二特征金字塔的初始第零层点云特征数据；对第一特征金字塔的第零层点云特征数据、第二特征金字塔的初始第零层点云特征数据和上采样数据进行交叉注意力机制处理，得到原始点云数据的点云特征数据。

第三方面，本申请实施例提供了一种电子设备，包括：存储器、处理器和存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现本申请实施例的基于注意力机制的点云特征提取方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述计算机指令被处理器执行时实现本申请实施例的基于注意力机制的点云特征提取方法。

本申请能够降低点云特征上采样时的语义信息损失，提高主干网络的点云特征提取性能。

附图说明

为了更清楚地说明本申请具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的基于注意力机制的点云特征提取方法的流程图；

图2为本申请实施例提供的基于注意力机制的点云特征提取装置的功能结构图；

图3为本申请实施例提供的电子设备的功能结构图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。

因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

首先对本申请实施例提供的技术方案进行说明。

在对点云进行特征提取时，往往需要利用主干网络提取点云的空间位置信息和语义信息。主干网络有2个部分组成：编码器和解码器。

编码器往往由若干不同点分辨率的特征提取层组成，经过每个特征提取层后，点云的分辨率降低，点数变少但是通道维度变高，语义信息更加丰富。解码器由若干不同点分辨率的上采样层组成，每一个上采样层都融合了来自与它分辨率相同的编码器中提取到的的语义信息，保证了细粒度的语义信息的有效传递。这样的结构被称为特征金字塔，可以有效地提取点云的语义信息，并能将在低分辨率下收集到的高维语义信息赋予到原始高分辨率的点云中，为接下来的下游任务如三维目标检测、三维目标追踪等做基础。

为解决上述技术问题，本申请实施例提供了一种基于注意力机制的点云特征提取方法，通过注意力机制降低点云特征上采样时的语义信息损失，提高主干网络上采样时的特征提取性能。

在人类处理从自然界中收集到的信息(如图像信号、声音信号)时，往往会选择性地处理信号。通常人们只关注那些对决策、行为有用的信号，这样的机制的称为“注意力机制”。

在深度学习中，注意力机制最先被应用在自然语言处理领域，因为自然语言处理需要讨论单词与单词之间的关系，分析在整句话中，对句子意思产生最大影响的词汇。基于注意力机制的网络Transformer的出现，为自然语言处理在研究打开了一个新的方向。实验证明，基于注意力机制的Transformer网络模型具有非常好长序列信息建模能力，在算法的性能上优于传统的循环神经网络、长短期记忆网络。Transformer在自然语言处理领域掀起的研究热潮影响到了计算机视觉领域，有专家学者将Transformer模型引用到了二维图像处理中，通过构建Transformer模型，分析图像局部区域之间的关系，为下游任务(如图像分类、检测、分割任务)提供信息。

如图1所示，本申请实施例提供了一种基于注意力机制的点云特征提取方法，包含如下步骤：

步骤101：对原始点云数据进行采样处理，得到包含预设点云数量的点云数据；

其中，原始点云数据中的点云个数非常庞大，首先进行采样处理，使点云数据中包含固定个数的点云，例如512个。

步骤102：利用预先训练完成的编码器对点云数据进行逐层下采样及升维处理，得到第一特征金字塔，所述第一特征金字塔包括T+1层点云特征数据；

构建编码器部分的特征金字塔的方式很多，如基于多层感知机的方法、基于图神经网络的方法、基于伪网络卷积的方法。

本实施例中，该步骤包括：

获取点云数据

其点云个数为

维度为

则第一特征金字塔的第零层点云特征数据为

进行处理，得到第t层点云特征数据

其第i个点云的特征

为：

其中，1≤t≤T；第t-1层数据

的点云个数为

维度为

为

的第j个点云的特征，

则第一特征金字塔包括：第零层点云特征数据

第一层点云特征数据

…、第T-1层点云特征数据

和第T层点云特征数据

以三层特征金字塔为例，第零层点云特征数据

的点云个数和维度为512和256，第1层点云特征数据

的点云个数和维度为256和512，第二层点云特征数据

的点云个数和维度为128和1024。

步骤103：利用预先训练完成的解码器对第二特征金字塔的第T层点云特征数据分别进行两次上采样处理，得到上采样数据及第二特征金字塔的初始第T-1层点云特征数据，其中第二特征金字塔的第T层点云特征数据和第一特征金字塔的第T层点云特征数据相同；将第一特征金字塔的第T-1层点云特征数据和第二特征金字塔的初始第T-1层点云特征数据进行拼接后，再进行降维处理，得到第二特征金字塔的第T-1层点云特征数据，对第二特征金字塔的第T-1层点云特征数据进行上采样得到第二特征金字塔的初始第T-2层点云特征数据；向下逐层进行处理，直至得到第二特征金字塔的初始第零层点云特征数据；对第一特征金字塔的第零层点云特征数据、第二特征金字塔的初始第零层点云特征数据和上采样数据进行交叉注意力机制处理，得到原始点云数据的点云特征数据。

在本实施例中，解码器完成编码器的逆运算，从编码器得到的第一特征金字塔的第T层点云特征数据开始，逐层进行上采样和降维处理，其中，对第一特征金字塔的第T层点云特征数据分别进行两次上采样；对于第T-1层到第一层，利用多层感知机对第一特征金字塔的当前层点云特征数据和第二特征金字塔的初始当前层点云特征数据(第二特征金字塔的上一层点云特征数据上采样得到)进行处理，得到第二特征金字塔的当前层点云特征数据；对于第零层，对第一特征金字塔的第零层点云特征数据、第二特征金字塔的初始第零层点云特征数据和上采样数据进行交叉注意力机制处理，得到原始点云数据的点云特征数据。

其中，第T层的处理过程为：

将第一特征金字塔的第T层点云特征数据

作为第二层特征金字塔的第T层点云特征数据

对第二特征金字塔的第T层点云特征数据

进行上采样处理，得到上采样数据

点云个数为

维度为

对第二特征金字塔的第T层点云特征数据

点云个数为

维度为

第T-1层的处理过程为：

将第一特征金字塔的第T-1层点云特征数据

和第二特征金字塔的初始第T-1层点云特征数据

进行维度拼接，得到拼接后的点云特征数据，点云个数为

维度为

点云个数及维度与第一特征金字塔的第T-1层点云特征数据

相同；

对第二特征金字塔的第T-1层点云特征数据

第零层的处理过程为：

将上采样数据

按照维度分解为：

维度均为

将第二特征金字塔的初始第零层点云特征数据

分解为：

和

维度均为

分别对：

和

的维度取最大值，得到

和

其中，stack(·)表示点数拼接；

计算交叉注意力矩阵atten：

其中，atten为1×7的矩阵；

计算注意力机制输出结果f_atten：

其中，norm(·)表示正规化函数；

利用前馈网络对f_atten进行处理，得到前馈网络输出结果FFN：

FFN＝max(0,f_attenW₁+b₁)W₂+b₂

其中，W₁为

的矩阵，W₂为

的矩阵，b₁为

的矩阵；b₂为

的矩阵；

则第二特征金字塔的第零层点云特征数据

为：

其中，

的点云个数和维度与第一特征金字塔的第零层点云特征数据

的点云个数和维度相同。

则原始点云数据的点云特征数据为

以三层特征金字塔为例，第二层点云特征数据

的点云个数和维度为128和1024。第一层点云特征数据

的点云个数和维度为256和512，第零层点云特征数据

的点云个数和维度为512和256。

在本实施例中，编码器和解码器都需要提前进行训练，所述编码器待训练的参数包括：T个局部融合层的参数；所述解码器待训练的参数包括：T-2个多层感知机的参数，线性投影矩阵W_Q、W_K和W_V和前馈网络的参数。

基于上述实施例，本申请实施例提供了一种基于注意力机制的点云特征提取装置，参阅图2所示，本申请实施例提供的基于注意力机制的点云特征提取装置200至少包括：

预处理单元201，用于对原始点云数据进行采样处理，得到包含预设点云数量的点云数据；

编码处理单元202，用于利用预先训练完成的编码器对点云特征数据进行逐层下采样及升维处理，得到第一特征金字塔，所述第一特征金字塔包括T+1层的点云特征数据；

解码处理单元203，用于利用预先训练完成的解码器对第二特征金字塔的第T层点云特征数据分别进行两次上采样处理，得到上采样数据及第二特征金字塔的初始第T-1层点云特征数据，其中第二特征金字塔的第T层点云特征数据和第一特征金字塔的第T层点云特征数据相同；将第一特征金字塔的第T-1层点云特征数据和第二特征金字塔的初始第T-1层点云特征数据进行拼接后，再进行降维处理，得到第二特征金字塔的第T-1层点云特征数据，对第二特征金字塔的第T-1层点云特征数据进行上采样得到第二特征金字塔的初始第T-2层点云特征数据；向下逐层进行处理，直至得到第二特征金字塔的初始第零层点云特征数据；对第一特征金字塔的第零层点云特征数据、第二特征金字塔的初始第零层点云特征数据和上采样数据进行交叉注意力机制处理，得到原始点云数据的点云特征数据。

需要说明的是，本申请实施例提供的基于注意力机制的点云特征提取装置200解决技术问题的原理与本申请实施例提供的基于注意力机制的点云特征提取方法相似，因此，本申请实施例提供的基于注意力机制的点云特征提取装置200的实施可以参见本申请实施例提供的基于注意力机制的点云特征提取方法的实施，重复之处不再赘述。

基于上述实施例，本申请实施例还提供了一种电子设备，参阅图3所示，本申请实施例提供的电子设备300至少包括：处理器301、存储器302和存储在存储器302上并可在处理器301上运行的计算机程序，处理器301执行计算机程序时实现本申请实施例提供的基于注意力机制的点云特征提取方法。

本申请实施例提供的电子设备300还可以包括连接不同组件(包括处理器301和存储器302)的总线303。其中，总线303表示几类总线结构中的一种或多种，包括存储器总线、外围总线、局域总线等。

存储器302可以包括易失性存储器形式的可读介质，例如随机存储器(RandomAccess Memory，RAM)3021和/或高速缓存存储器3022，还可以进一步包括只读存储器(ReadOnly Memory，ROM)3023。

存储器302还可以包括具有一组(至少一个)程序模块3024的程序工具3025，程序模块3024包括但不限于：操作子系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

电子设备300也可以与一个或多个外部设备304(例如键盘、遥控器等)通信，还可以与一个或者多个使得用户能与电子设备300交互的设备通信(例如手机、电脑等)，和/或，与使得电子设备300与一个或多个其它电子设备300进行通信的任何设备(例如路由器、调制解调器等)通信。这种通信可以通过输入/输出(Input/Output，I/O)接口305进行。并且，电子设备300还可以通过网络适配器306与一个或者多个网络(例如局域网(Local AreaNetwork，LAN)，广域网(Wide Area Network，WAN)和/或公共网络，例如因特网)通信。如图3所示，网络适配器306通过总线303与电子设备300的其它模块通信。应当理解，尽管图3中未示出，可以结合电子设备300使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of IndependentDisks，RAID)子系统、磁带驱动器以及数据备份存储子系统等。

需要说明的是，图3所示的电子设备300仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机指令，该计算机指令被处理器执行时实现本申请实施例提供的基于注意力机制的点云特征提取方法。具体地，该可执行程序可以内置或者安装在电子设备300中，这样，电子设备300就可以通过执行内置或者安装的可执行程序实现本申请实施例提供的基于注意力机制的点云特征提取方法。

本申请实施例提供的基于注意力机制的点云特征提取方法还可以实现为一种程序产品，该程序产品包括程序代码，当该程序产品可以在电子设备300上运行时，该程序代码用于使电子设备300执行本申请实施例提供的基于注意力机制的点云特征提取方法。

本申请实施例提供的程序产品可以采用一个或多个可读介质的任意组合，其中，可读介质可以是可读信号介质或者可读存储介质，而可读存储介质可以是但不限于是电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合，具体地，可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、RAM、ROM、可擦式可编程只读存储器(Erasable Programmable Read Only Memory，EPROM)、光纤、便携式紧凑盘只读存储器(Compact Disc Read-Only Memory，CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

本申请实施例提供的程序产品可以采用CD-ROM并包括程序代码，还可以在计算设备上运行。然而，本申请实施例提供的程序产品不限于此，在本申请实施例中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

应当注意，尽管在上文详细描述中提及了装置的若干单元或子单元，但是这种划分仅仅是示例性的并非强制性的。实际上，根据本申请的实施方式，上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之，上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。

此外，尽管在附图中以特定顺序描述了本申请方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

最后所应说明的是，以上实施例仅用以说明本申请的技术方案而非限制。尽管参照实施例对本申请进行了详细说明，本领域的普通技术人员应当理解，对本申请的技术方案进行修改或者等同替换，都不脱离本申请技术方案的精神和范围，其均应涵盖在本申请的权利要求范围当中。

Claims

1.一种基于注意力机制的点云特征提取方法，其特征在于，所述方法包括：

利用预先训练完成的解码器对第二特征金字塔的第T层点云特征数据分别进行两次上采样处理，得到上采样数据及第二特征金字塔的初始第T-1层点云特征数据，其中第二特征金字塔的第T层点云特征数据和第一特征金字塔的第T层点云特征数据相同；将第一特征金字塔的第T-1层点云特征数据和第二特征金字塔的初始第T-1层点云特征数据进行拼接后，再进行降维处理，得到第二特征金字塔的第T-1层点云特征数据，对第二特征金字塔的第T-1层点云特征数据进行上采样得到第二特征金字塔的初始第T-2层点云特征数据；向下逐层进行处理，直至得到第二特征金字塔的初始第零层点云特征数据；对第一特征金字塔的第零层点云特征数据、第二特征金字塔的初始第零层点云特征数据和上采样数据进行交叉注意力机制处理，得到原始点云数据的点云特征数据；

所述编码器包括T个依次连接的局部融合层；利用预先训练完成的编码器对点云数据进行逐层下采样及升维处理，得到第一特征金字塔；包括：

获取点云数据

其点云个数为

维度为

则第一特征金字塔的第零层点云特征数据为

进行处理，得到第t层点云特征数据

其第i个点云的特征

为：

其中，1≤t≤T；第t-1层数据

的点云个数为

维度为

为

的第j个点云的特征，

则第一特征金字塔包括：第零层点云特征数据

第一层点云特征数据

第T-1层点云特征数据

和第T层点云特征数据

2.根据权利要求1所述的基于注意力机制的点云特征提取方法，其特征在于，利用预先训练完成的解码器对第二特征金字塔的第T层点云特征数据分别进行两次上采样处理，得到上采样数据及第二特征金字塔的初始第T-1层点云特征数据；包括:

将第一特征金字塔的第T层点云特征数据

作为第二层特征金字塔的第T层点云特征数据

对第二特征金字塔的第T层点云特征数据

进行上采样处理，得到上采样数据

点云个数为

维度为

对第二特征金字塔的第T层点云特征数据

点云个数为

维度为

3.根据权利要求1所述的基于注意力机制的点云特征提取方法，其特征在于，将第一特征金字塔的第T-1层点云特征数据和第二特征金字塔的初始第T-1层点云特征数据进行点数拼接后，再进行降维处理，得到第二特征金字塔的第T-1层点云特征数据，对第二特征金字塔的第T-1层数据进行上采样得到第二特征金字塔的初始第T-2层点云特征数据；包括：

将第一特征金字塔的第T-1层点云特征数据

和第二特征金字塔的初始第T-1层点云特征数据

进行维度拼接，得到拼接后的点云特征数据，点云个数为

维度为

点云个数及维度与第一特征金字塔的第T-1层点云特征数据

相同；

对第二特征金字塔的第T-1层点云特征数据

4.根据权利要求3所述的基于注意力机制的点云特征提取方法，其特征在于，对第一特征金字塔的第零层数据、第二特征金字塔的初始第零层数据和上采样数据进行交叉注意力机制处理，得到原始点云数据的点云特征数据；包括：

将上采样数据

按照维度分解为：

维度均为

将第二特征金字塔的初始第零层点云特征数据

分解为：

和

维度均为

分别对：

和

的维度取最大值，得到

和

其中，stack(·)表示点数拼接；

计算交叉注意力矩阵atten：

其中，atten为1×7的矩阵；

计算注意力机制输出结果f_atten：

其中，norm(·)表示正规化函数；

利用前馈网络对f_atten进行处理，得到前馈网络输出结果FFN：

FFN＝max(0,f_attenW₁+b₁)W₂+b₂

其中，W₁为

的矩阵，W₂为

的矩阵，b₁为

的矩阵；b₂为

的矩阵；

则第二特征金字塔的第零层点云特征数据

为：

其中，

的点云个数和维度与第一特征金字塔的第零层点云特征数据

的点云个数和维度相同；

则原始点云数据的点云特征数据为

5.根据权利要求4所述的基于注意力机制的点云特征提取方法，其特征在于，所述编码器待训练的参数包括：T个局部融合层的参数；所述解码器待训练的参数包括：T-2个多层感知机的参数，线性投影矩阵W_Q、W_K和W_V和前馈网络的参数。

6.一种基于注意力机制的点云特征提取装置，其特征在于，所述装置包括：

解码处理单元，用于利用预先训练完成的解码器对第二特征金字塔的第T层点云特征数据分别进行两次上采样处理，得到上采样数据及第二特征金字塔的初始第T-1层点云特征数据，其中第二特征金字塔的第T层点云特征数据和第一特征金字塔的第T层点云特征数据相同；将第一特征金字塔的第T-1层点云特征数据和第二特征金字塔的初始第T-1层点云特征数据进行拼接后，再进行降维处理，得到第二特征金字塔的第T-1层点云特征数据，对第二特征金字塔的第T-1层点云特征数据进行上采样得到第二特征金字塔的初始第T-2层点云特征数据；向下逐层进行处理，直至得到第二特征金字塔的初始第零层点云特征数据；对第一特征金字塔的第零层点云特征数据、第二特征金字塔的初始第零层点云特征数据和上采样数据进行交叉注意力机制处理，得到原始点云数据的点云特征数据；

获取点云数据