CN111814874A

CN111814874A - 一种用于点云深度学习的多尺度特征提取增强方法及模块

Info

Publication number: CN111814874A
Application number: CN202010650114.6A
Authority: CN
Inventors: 李大威; 时国良
Original assignee: Donghua University
Current assignee: Donghua University
Priority date: 2020-07-08
Filing date: 2020-07-08
Publication date: 2020-10-23
Anticipated expiration: 2040-07-08
Also published as: CN111814874B

Abstract

本发明公开了一种用于点云深度学习的多尺度特征提取增强方法及模块，本发明首先在世界坐标系上寻找每个点在三个不同尺度上的邻近点。再分别通过多层感知机和最大池化提取该尺度下的最大特征，并将不同尺度下的最大特征拼接在一起作为该点的多尺度特征。然后将多尺度信息融合到多尺度局部特征空间并在该空间中再次寻找每个点的邻近点，将每个点的局部和全局信息进行融合。为了进一步约束和加强特征学习，引入了一个损失函数，让不同类别的点相互远离，相同类别的点相互聚集。本发明能够有效地增强多种深度学习网络对三维点云的特征特征提取性能及学习能力，从根本上提升网络的性能和分割分类精度。

Description

一种用于点云深度学习的多尺度特征提取增强方法及模块

技术领域

本发明涉及一种用于点云深度学习的多尺度特征提取增强方法及模块，尤其是一种应用于点云深度学习网络的基于多尺度邻近点信息的多尺度特征提取增强模块及增强方法。

背景技术

当前通过激光雷达、Kinect与Matterport scanner等三维传感器获得的三维场景越来越快速化和精确。三维空间相较于二维空间包含更加丰富的语义信息。因此基于深度学习的三维环境感知，已经引起了极大关注，被广泛的应用于无人驾驶汽车和机器人技术。虽然近年来基于卷积神经元网络(Convolutional Neural Networks，简称CNNs)的图像深度学习方法在二维图像分类、分割等方面都取得了较大成就，但是对于非结构化的数据(例如三维点云和三维网格)的分类、语义分割和实例分割依然是十分艰巨的挑战。

早先的研究主要基于多视角卷积神经元网络(Multi-view ConvolutionalNeural Networks，简称Multi-view CNNs)，希望通过加强二维和三维空间之间的联系，从而用图像的分割方法实现对三维数据的理解。这种方法存在的主要问题是如何选择从三维投影到二维的角度和数量以及如何将二维分割结果映射回三维点云。此外，为了将非结构化数据变换成类似于二维图像的规则结构，提出了基于体素化的卷积神经元网络(Voxel-Based 3D Convolutional Neural Networks，简称Voxel-Based 3D CNNs)方法。通过将点云划分为若干个体素然后利用三维卷积实现对点云的分割。同一个体素中的点都被赋予了相同的语义，所以为了提高分割精度必须减小体素的尺寸，会直接导致计算量显著提升。另一方面，由于存在较多数量的体素为空，导致该方法的分割效率较低。近年来，业界提出了直接对点进行操作的网络，实现了端对端的在点尺度上的点云分类和分割，比如PointNet与PointNet++。由于点云数据具有无序性、密度不均和数据量大等特点。如何有效地提取点的特征，是此类方法成功的关键所在。目前在点云的深度学习网络特征提取方法上还有较大的提升空间。

发明内容

本发明要解决的技术问题是：进一步提升点云深度学习分割网络的性能。

为了解决上述问题，本发明的技术方案是提供了一种用于点云深度学习的多尺度特征提取增强方法，其特征在于，包括如下步骤：

步骤1、输入B×N×F维度大小的点云数据，其中B为训练批量大小，N为输入的每个点云中点的数量，F为每个点所包含的特征维度；

步骤2、寻找输入点云数据中的每个点在三个不同空间半径尺度上的k₁个邻近点，再分别通过多层感知机和最大池化操作提取每个尺度下的最大特征，并将不同尺度下的最大特征拼接在一起作为该点的多尺度特征，得到多尺度特征图F₁；

步骤3、对步骤2输出的特征图F₁进行最大池化操作，得到全局特征向量v_g；

步骤4、将多尺度特征图F₁进行降维，通过两层大小分别为C₅和M的多层感知机，将F₁融合到张量为B×N×M的多尺度局部特征空间F₂；

步骤5、对多尺度局部特征空间F₂，用L_feature损失函数进一步约束点在该空间中的分布，使得不同类别的点相互远离，相同类别的点相互聚集；

步骤6、在多尺度局部特征空间F₂中为每个点寻找k₂个邻近点，经过特征融合与最大池化操作，并与全局特征向量v_g进行融合，最终得到每个点的特征向量所组成的特征空间F₃。

优选地，所述步骤2中得到多尺度特征的具体步骤包括：

步骤2.1、对输入点云中的每个点，寻找以该点为圆心，分别以r₁，r₂和r₃为半径的球体范围内的所有邻近点集合，分别用P₁，P₂和P₃表示，其中r₁＜r₂＜r₃；

步骤2.2、将邻近点数量固定为k₁，对于点集P₁，P₂和P₃，其中包含的点数n存在三种可能的情况：n＝k₁，n＞k₁和n＜k₁；对于n＝k₁，直接将所有点作为最终邻近点；对于n＞k₁，随机从n个点中选择k₁个点作为最终邻近点；对于n＜k₁，先从n个点中随机选择k₁-n个点，再与原始的n个点组成k₁个点，作为最终的邻近点，不同尺度下的固定点数的邻近点集合分别为P′₁，P′₂和P′₃，张量为k₁×F；

步骤2.3、将多尺度邻近点集合P′₁，P′₂和P′₃分别通过两层大小为C₁和C₂的多层感知机进行特征提取，得到张量为k₁×C₂的特征图；再通过最大池化操作，得到该点1×C₂的最大特征向量，其中，三个尺度卷积核的参数共享；

步骤2.4、将每个点的原始特征与三个尺度上得到的最大特征向量进行拼接，得到大小为1×(F+3×C₂)的特征向量v₁；

步骤2.5、将特征向量v₁依次通过两层大小为C₃和C₄的多层感知机，进行特征融合，得到张量大小为1×C₄的多尺度特征向量v₂；

所述步骤2为输入点云中的一个点的操作流程，输入点云中其余N-1个点的操作流程同上，参数共享，最终得到张量大小为B×N×C₄的特征图F1。

优选地，所述步骤5中，损失函数L_feature的具体形式如下：

L_feature＝α·L_same+β·L_diff+γ·L_reg

其中，L_same是为了将属于同一类别的点拉向聚类中心定义的类内损失；L_diff让不同类别的点相互远离，即为了增加不同聚类中心点之间距离的类间损失；L_reg为正则化项，是为了让所有聚类中心尽可能靠近点云中心原点；α，β和γ是三种类型损失函数的权重，三种损失函数的表达式如下：

其中T是点云中实例的个数，N_t是第t个实例包含的点的个数；μ_t是第t个实例的聚类中心位置；||·||₁是L1距离；e_i是第i个点的坐标位置；δ_v是允许同一个实例中的点聚集的范围；2δ_d是允许不同实例中心点之间最近的距离；[x]₊＝max(0，x)。

优选地，所述步骤6中，得到特征空间F₃的具体步骤为：

步骤6.1、对多尺度局部特征空间F₂中的每个点x＝(x₁，x₂，...，x_M)在多尺度局部特征空间F₂中寻找k₂个邻近点，其中，每个点有M个维度，x_i为该点在第i个维度上的值，通过计算该点到点云中其余点的距离，寻找最近的k₂个点组成点集φ₁，距离定义如下：

其中，p_i为p(p₁，p₂，...，p_M)在第i个维度上的值，l为点p到x的L1距离；

步骤6.2、所述步骤6.1得到每个点的邻近点点集φ₁的张量为k₂×M，将步骤3中得到的全局特征向量v_g复制k₂次并拼接到φ₁后，得到全局与局部信息融合特征图φ₂，其张量大小为k₂×(M+C₄)；

步骤6.3、对特征图φ₂经过两层大小分别为C₆和S的MLP，进一步进行特征融合提取，得到大小为k₂×S的特征图，并经过最大池化操作，得到大小为1×S的特征向量；

所述步骤6为输入点云中的一个点的操作流程，输入点云中其余N-1个点的操作流程同上，并参数共享，最终模块输出大小为B×N×S的特征图F₃。

本发明的另外一个技术方案是提供了一种用于点云深度学习的多尺度特征提取增强模块，其特征在于，应用上述的一种用于点云深度学习的多尺度特征提取增强方法，包括：

多尺度特征提取子模块，用于对每个输入点在原始世界空间中搜索多尺度邻近点，形成多尺度特征向量；

特征空间局部相似度聚合子模块，将所有输入点的多尺度特征融合到多尺度局部特征空间中，并引入损失函数来约束局部特征空间中点的分布，将局部特征空间中的每个点及其邻近点集合起来，再与多尺度特征提取子模块的全局特征向量进行连接，形成新的特征空间，对每个点进行特征融合，进一步提取新的特征向量。

本发明首先在世界坐标系上寻找每个点在三个不同尺度上的邻近点。空间上的邻近能够代表该点所在局部区域的基本语义特征。再分别通过多层感知机(MultilayerPerceptron，简称MLP)和最大池化(Max pooling)提取该尺度下的最大特征，并将不同尺度下的最大特征拼接在一起作为该点的多尺度特征。然后将多尺度信息融合到多尺度局部特征空间(Multi-scale Locality Feature Space，简称MLFS)并在该空间中再次寻找每个点的邻近点。点在局部特征空间上的分布特性代表了不同类别的类间和类内的中尺度语义信息。此外，将每个点的局部和全局信息进行融合。为了进一步约束和加强特征学习，方法中引入了一个损失函数，让不同类别的点相互远离，相同类别的点相互聚集。

与现有技术相比，本发明的有益效果是：

1)提出了一种基于多尺度邻近点信息的特征提取增强模块(Multi-scaleNeighborhood Feature Extraction and Aggregation Model，简称MNFEAM)及增强方法，该模块通过识别原始输入特征空间和多尺度局部特征空间上邻近点的邻近信息来提取有效特征，大大提高了网络对特征学习的能力和准确性。

2)在MNFEAM的两个主要部分：多尺度特征提取子模块(Multi-scale FeatureExtraction Module，简称MFEM)和特征空间局部相似度聚合子模块(Locality FeatureAggregation Module，简称LFAM)之间引入损失函数约束多尺度局部特征空间，既避免了过拟合，又有利于局部特征空间的特征提取。

3)本发明可以作为当前众多端到端点云深度学习网络的特征提取前处理模块或预处理步骤，使用本发明后，众多网络在语义分割和实例分割两方面都有较明显的性能提升。

4)本发明能够有效地增强多种深度学习网络对三维点云的特征特征提取性能及学习能力，从根本上提升网络的性能和分割分类精度。本发明增强模块可作为当前直接在点尺度上进行分割的深度学习网络的前特征处理模块，广泛适用于人工智能、机器视觉及机器人环境感知、无人驾驶等技术领域。

附图说明

图1为本发明一种用于点云深度学习网络的多尺度特征提取增强模块示意图；

图2为本发明一种用于点云深度学习网络的多尺度特征提取增强方法融合到PointNet网络中的结构图。结构中前半部分为特征增强模块，后半部分为PointNet的部分结构；

图3为本发明对PointNet网络进行改进后在斯坦福大型室内数据集(StanfordLarge-Scale 3D Indoor Spaces，简称S3DIS)上的定性对比结果图；

图4为本发明对PointNet网络进行改进后在vKITTI数据集上的定性分析对比结果。

具体实施方式

为使本发明更明显易懂，兹以优选实施例，并配合附图作详细说明如下。

如图1所示，本实施例公开了一种用于点云深度学习网络的多尺度特征提取增强方法及模块，该模块主要由两部分组成，分别为多尺度特征提取子模块(MFEM)和特征空间局部相似度聚合子模块(LFAM)。首先，对于每个输入点，使用MFEM在原始世界空间中搜索多尺度邻近点，形成多尺度特征向量。其次，将所有点的多尺度特征融合到多尺度局部特征空间中，并引入损失函数来约束局部特征空间中点的分布。然后将局部特征空间中的每个点及其邻近点集合起来，再与MFEM的全局特征向量进行连接，形成新的特征空间。所有N个点特征在LFAM中形成特征群。最后，LFAM对每个点进行特征融合，进一步提取新的特征向量。在MNFEAM的6个步骤中，其中步骤1到步骤3为MFEM，步骤4到步骤6为LFAM。该模块能够替换或增强现有网络的特征提取部分，从根本上提升网络的分类分割性能。

本实施例将本发明模块融合到基本的PointNet网络前部，并在斯坦福大型室内数据集(Stanford Large-Scale 3D Indoor Spaces，简称S3DIS)和虚拟户外道路点云数据集(Virtual KITTI，简称vKITTI)上进行对比测试实验。其步骤为：

数据的预处理与实验设计。斯坦福大型室内数据集包含有6个大型室内区域共有271个房间(如：会议室，办公室和走廊等)。数据集被标注为13个语义类别(如：地板，桌子，窗户等)。数据预处理阶段，将每个房间切分为1m×1m×h大小的区域块，其中h为房间的高度。通过随机向下采样每个区域块，将输入点的数量固定到4096，以减少计算复杂度和标准化所有的训练数据。对于点数小于4096的区域块，随机复制块中已有的点，使点数固定到4096。数据集中的每个点都拥有9维特征，包括XYZ坐标、RGB和法向量。在定量分析中，采用两种不同的测试方式的结果。首先，只将区域5(A5)作为测试集，其余区域为训练集。其次，我们进行6次交叉验证，计算在S3DIS数据集上的平均指标。

虚拟户外道路点云数据集vKITTI是一个大型的室外道路场景的点云数据集，被广泛用来评价无人驾驶算法性能。该数据集相较于S3DIS数据集更稀疏，包含有13个语义类别(如：汽车，道路和树木等)。本实施例中将vKITTI数据集中的90个场景分成了6个区域，每个区域包含有15个场景。对于每个场景，被分割成为3m×3m×h的区域块，其中h为场景的高度。对于每个区域块，随机向下采样到256个点，操作方法与S3DIS数据集相同。数据集中每个点有6维度特征，包括XYZ坐标和RGB颜色信息。在定量分析中，采用两种不同的测试方式的结果。两种方式都采用6次交叉验证，计算在vKITTI数据集上的平均指标。方式一不使用颜色信息，只有XYZ三维特征，方式二使用包含颜色信息在内的6维特征。

如图2所示，将本发明所提特征增强模块融入到点云深度学习网络PointNet中的结构图。其步骤为：

步骤1、训练过程中每批次输入B×N×F维度大小的点云数据；对于斯坦福大型室内数据集S3DIS为8×4096×9，对于虚拟户外道路点云数据集vKITTI为16×256×3(无颜色信息)和16×256×6(有颜色信息)。其中B为训练批量大小(Batch Size)；N为输入的每个点云中点的数量；F为每个点所包含的特征维度(例如，如果只含有坐标信息XYZ则F＝3；如果含有坐标和颜色信息XYZRGB则F＝6)。

步骤2、寻找输入点云中的每个点在三个不同空间半径尺度上的k₁＝32个邻近点。再分别通过多层感知机(Multilayer Perceptron，简称MLP)和最大池化(Max pooling)操作提取每个尺度下的最大特征，并将不同尺度下的最大特征拼接在一起作为该点的多尺度特征。

步骤2中得到多尺度特征的具体步骤为：

步骤2.1、对输入点云中的每个点，寻找以该点为圆心，分别以r₁＝0.2m，r₂＝0.4m和r₃＝0.6m为半径的球体范围内的所有邻近点集合，分别用P₁，P₂和P₃表示，其中r₁＜r₂＜r₃。

步骤2.2、将邻近点固定为数量k₁＝32。对于点集P₁，P₂和P₃，其中包含的点数n存在三种可能的情况：n＝k₁，n＞k₁和n＜k₁。对于n＝k₁，直接将所有点作为最终邻近点；对于n＞k₁，随机从n个点中选择k₁个点作为最终邻近点；对于n＜k₁，先从n个点中随机选择k₁-n个点，再与原始的n个点组成k₁个点，作为最终的邻近点。不同尺度下的固定点数的邻近点集合分别为P′₁，P′₂和P′₃，张量为k₁×F，即32×9(S3DIS)，32×6(vKITTI有颜色)和32×3(vKITTI无颜色)。在不加说明的情况下，本实施例中涉及到的字符F，依据其在不同数据集及情况下的大小分别为9(S3DIS)，6(vKITTI有颜色)和3(vKITTI无颜色)，后续不再赘述和细分，并只用F代表上述的三种情况。

步骤2.3、将多尺度邻近点集合分别通过两层大小为C₁＝32和C₂＝64的MLP，进行特征提取，得到张量为k₁×C₂，即32×32的特征图。再通过最大池化操作，得到该点1×C₂，即1×32的最大特征向量。其中，三个尺度卷积核的参数共享。

步骤2.4、将每个点的原始特征与在三个尺度上得到的最大特征向量进行拼接，得到大小为1×(F+3×C₂)，即1×(F+3×32)的特征向量v₁。

步骤2.5、将特征向量v₁依次通过两层大小为C₃＝128和C₄＝128的MLP，进行特征融合，得到张量大小为1×C₄，即1×128的多尺度特征向量v₂。

上述步骤2中所述为输入点云中的一个点的操作流程，输入点云中其余N-1个点的操作流程同上，参数共享。最终得到张量大小为B×N×C₄，即8×4096×128(S3DIS)，16×256×128(vKITTI)的特征图F₁。

步骤3：对特征图F₁进行最大池化操作，得到张量为B×1×C₄，即8×1×128(S3DIS)，16×1×128(vKITTI)的全局特征向量(Global Feature)v_g。

步骤4：将多尺度特征图F₁进行降维。通过两层大小分别为C₅＝64和M＝6的MLP，将F₂融合到张量为B×N×M，即8×4096×6(S3DIS)，16×256×6(vKITTI)的多尺度局部特征空间F₂(Multi-scale Locality Feature Space，简称MLFS)。

步骤5中，对多尺度局部特征空间F₂，用L_feature损失函数进一步约束点在该空间中的分布，使得不同类别的点相互远离，相同类别的点相互聚集。损失函数L_feature的定义如下：

L_feature＝α·L_same+β·L_diff+γ·L_reg

其中，L_same是为了将属于同一类别的点拉向聚类中心定义的类内损失。L_diff让不同类别的点相互远离，即为了增加不同聚类中心点之间距离的类间损失。L_reg为正则化项，是为了让所有聚类中心尽可能靠近点云中心原点，为特征空间限定有效的边界范围，防止网络注意力偏离。α＝1，β＝1和γ＝0.001是三种类型损失函数的权重。三种损失函数的表达式如下：

其中T是点云中实例的个数，N_t是第t个实例中包含点的个数；μ_t是第t个实例的聚类中心位置；||·||₁是L1距离；e_i是第i个点的坐标位置；δ_v是允许同一个实例中的点聚集的范围；2δ_d是允许不同实例中心点之间最近的距离；[x]₊＝max(0，x)。

步骤6、在多尺度局部特征空间F₂中为每个点寻找k₂＝32个邻近点。经过特征融合与最大池化操作，并与全局特征进行融合，最终得到每个点的特征向量所组成的特征空间F₃。

步骤6中得到特征空间F₃的具体步骤为：

步骤6.1、对多尺度局部特征空间F₂中的每个点x＝(x₁，x₂，...，x₆)在多尺度局部特征空间F₂中寻找k₂＝32个邻近点。其中，每个点有M＝6个维度，x_i为该点在第i个维度上的值。通过计算该点到点云中其余点的距离，寻找最近的k₂个点组成点集φ₁。距离定义如下：

其中，p_i为点p(p₁，p₂，...，p_M)在第i个维度上的值，l为点p到x的L1距离。

步骤6.2、上述步骤得到每个点的邻近点点集φ₁的张量为k₂×M，即32×6，将步骤3中得到的全局特征向量v_g复制k₂＝32次并拼接到φ₁后，得到全局与局部信息融合特征图φ₂，其张量大小为k₂×(M+C₄)，即32×(6+128)。

步骤6.3：对特征图φ₂经过两层大小分别为C₆＝128和S＝128的MLP，进一步进行特征融合提取，得到大小为k₂×S，即32×128的特征图。并经过最大池化操作，得到大小为1×S，即1×128的特征向量。

步骤6中所述为输入点云中的一个点的操作流程，输入点云中其余N-1个点的操作流程同上，并参数共享。最终模块输出大小为B×N×S，即8×4096×128(S3DIS)，16×256×128(vKITTI)的特征图F₃。

上述过程即为本发明所提出的一种用于点云深度学习的多尺度特征提取增强方法实施过程。本发明作为一种点云深度学习网络特征提取增强方法，需要进一步的融入到现有的点云深度学习网络中，从而提升点云的分类分割任务。为了增强本方法的可实施性，接下来以融合PointNet为例，进一步说明其实施细节。

步骤7：将特征图F₃通过三层大小分别为C₇＝256，C₈＝512和C₉＝1024的MLP，进一步进行特征融合提取，得到大小为B×N×C₈，即8×4096×1024(S3DIS)，16×256×1024(vKITTI)的特征图F₄。

步骤8：对特征图F₄进行最大池化操作，得到张量为B×1×C₈，即8×1×1024(S3DIS)，16×1×1024(vKITTI)的全局特征向量(Global Feature)v′_g。并将v′_g复制N次，与步骤6中得到的特征图F₃进行拼接，得到大小为B×N×(S+C₈)的特征图F₅，即两种数据集上8×4096×(128+1024)(S3DIS)，16×256×(128+1024)(vKITTI)。

步骤9：对特征图F₅分别通过大小为512,256,128和C＝13的MLP，得到最终的语义特征图F₆，大小为B×N×C即8×4096×13(S3DIS)，16×256×13(vKITTI)。其中C为该数据集语义类别数。

步骤10：对语义特征图F₆计算交叉熵得到每个点的最终分类预测标签。分类损失函数为L_pred。网络总的损失函数为：

L＝L_pred+L_feature

上述过程即为将本发明模块融合到PointNet网络中的实施细节。融入到其他点云分割网络的过程与此类似，但需要注意两个方面：第一，本发明需要加载到网络的最前端即输入接口之后；其次，对于原网络中前部基础的特征提取部分要进行适当的删除，可减少网络的冗余性，也防止网络过深带来过拟合问题。

表1为S3DIS数据集上的定量比较结果。前两行以Area5为测试集，后两行为6次交叉验证的平均结果。

表1

表2为vKITTI数据集上的定量比较结果。前两行是仅使用XYZ坐标特征的分割结果。最后两行是同时使用了XYZ和颜色特征RGB的分割结果。

表2

从定量结果看，本发明对PointNet网络在斯坦福大型室内数据集和虚拟室外道路点云数据集上的分割效果都有了明显提升，其中oAcc为总体准确率，mAcc为是平均准确率，mIoU是平均分割交并比，三个指标都是越高越好。如表1和表2所示，其中表1为在S3DIS数据集上的定量比较结果。表1的前两行以Area5为测试集，后两行为6次交叉验证的平均结果。表2为在vKITTI数据集上的定量比较结果。前两行是仅使用XYZ坐标特征的分割结果。最后两行是使用了XYZ和颜色特性的分割结果。

图3和图4分别是在两个数据集上的定性对比展示。在测试集中选取了5个房间进行展示，图3中每列代表不同的房间。第一行为输入的原始点云；第二行为每个房间的真实标签值；第三行为PointNet原始网络的分割结果图；第四行为提升网络的分割结果图。

在测试集中选取了四个场景，图4中每一行代表一个场景。其中，第一列为输入的原始点云；第二列为真实标签值；第三列为改进网络在输入特征包含颜色信息下的分割结果；第四列为原始网络在输入特征包含颜色信息下的分割结果。

以上所述仅为本发明的较佳实施例，并非对本发明任何形式上和实质上的限制，应当指出，对于本技术领域的普通技术人员，在不脱离本发明方法的前提下，还将可以做出若干改进和补充，这些改进和补充也应视为本发明的保护范围。凡熟悉本专业的技术人员，在不脱离本发明的精神和范围的情况下，当可利用以上所揭示的技术内容而做出的些许更动、修饰与演变的等同变化，均为本发明的等效实施例；同时，凡依据本发明的实质技术对上述实施例所作的任何等同变化的更动、修饰与演变，均仍属于本发明的技术方案的范围内。

Claims

1.一种用于点云深度学习的多尺度特征提取增强方法，其特征在于，包括如下步骤：

2.如权利要求1所述的一种用于点云深度学习的多尺度特征提取增强方法，其特征在于，所述步骤2中得到多尺度特征的具体步骤包括：

所述步骤2为输入点云中的一个点的操作流程，输入点云中其余N-1个点的操作流程同上，参数共享，最终得到张量大小为B×N×C₄的特征图F₁。

3.如权利要求1所述的一种用于点云深度学习的多尺度特征提取增强方法，其特征在于，所述步骤5中，损失函数L_feature的具体形式如下：

L_feature＝α·L_same+β·L_diff+γ·L_reg

4.如权利要求1所述的一种用于点云深度学习的多尺度特征提取增强方法，其特征在于，所述步骤6中，得到特征空间F₃的具体步骤为：

5.一种用于点云深度学习的多尺度特征提取增强模块，其特征在于，应用如权利要求1至4任意一项所述的一种用于点云深度学习的多尺度特征提取增强方法，包括：