WO2024060395A1

WO2024060395A1 - 一种基于深度学习的高精度点云补全方法及装置

Info

Publication number: WO2024060395A1
Application number: PCT/CN2022/133946
Authority: WO
Inventors: 张登银; 冯莹莹; 黄丽; 严伟丹
Original assignee: 南京邮电大学
Priority date: 2022-09-19
Filing date: 2022-11-24
Publication date: 2024-03-28
Also published as: CN115439694A

Abstract

本发明公开了一种基于深度学习的高精度点云补全方法及装置，包括：在特征提取模块引入动态核卷积PAConv，可以根据每个点与其邻域点的位置关系学习权重系数，并组合权重矩阵自适应地构建卷积内核。在特征融合模块添加了空间注意力机制，有助于解码器更好学到多种特征之间的相互关系，从而更好的表示这些特征信息。鉴别器模块包含全局和局部注意力鉴别器模块，利用多层全连接进行分类，分别从整体和局部来判断生成结果是否符合真实点云分布，进而优化生成结果。从而提高点云补全的精度，得到完整准确的点云补全结果，这也为点云分割、分类、物体识别以及点云重建等诸多下游任务的顺利进行提供了保障。

Description

一种基于深度学习的高精度点云补全方法及装置

技术领域

本发明涉及计算机三维点云补全和深度学习技术领域，具体涉及一种基于深度学习的高精度点云补全方法及装置。

背景技术：

在3D计算机视觉应用中，由于遮挡和有限的传感器分辨率，3D扫描仪和深度相机捕获的原始点云通常是稀疏且不完整的。点云模型形状上的缺损，极大地限制了视觉和AI的感知能力。点云补全就是将一个残缺的点云，通过算法模型补全完整，它是3D视觉领域的一项基础技术。同时，它也是获取3D对象完整点云模型的必要步骤，是后续相关工作的基础。

现有的基于深度学习的点云补全方法可以推测出相对完整且合理的点云模型，但是往往在补全局部细节特征方面存在缺陷。

为此，弥补基于深度学习的点云补全方法在局部特征提取上的欠缺，将有益于表征点云空间复杂的变化关系以提高点云补全的精度。

发明内容

为了解决现有技术中存在的不足，解决当前点云补全方法存在局部特征提取不足的问题，本发明提供了一种基于深度学习的高精度点云补全方法，在特征提取模块引入动态核卷积PAConv，可以根据每个点与其邻域点的位置关系学习权重系数，并组合权重矩阵自适应地构建卷积内核。在特征融合模块添加了空间注意力机制，有助于解码器更好学到多种特征之间的相互关系，从而更好的表示这些特征信息。鉴别器模块包含全局和局部注意力鉴别器模块，利用多层全连接进行分类，分别从整体和局部来判断生成结果是否符合真实点云分布，进而优化生成结果。从而提高点云补全的精度，得到完整准确的点云补全结果，这也为点云分割、分类、物体识别以及点云重建等诸多下游任务的顺利进行提供了保障。

技术方案：为解决上述技术问题，本发明采用的技术方案为：

第一方面，提供一种基于深度学习的高精度点云补全方法，包括：

获取待处理的点云数据；

对所述点云数据进行预处理，得到预处理后的点云数据；

将预处理后的点云数据输入训练好的点云补全模型，其中所述点云补全模型包括多分辨率编码器模块、金字塔解码器模块和注意力鉴别器模块；

所述多分辨率编码器模块，被配置为：对输入的点云数据进行特征提取、融合，得到特征向量；

所述金字塔解码器模块，被配置为：对所述特征向量进行处理得到三个尺度的点云补全结果；

所述注意力鉴别器模块，被配置为：使用生成对抗网络的思想，通过生成模型和判别模型相互博弈学习来产生全局和局部特征一致性的结果；

根据所述点云补全模型的输出，确定高精度点云补全结果。

在一些实施例中，所述多分辨率编码器模块包括特征提取模块和特征融合模块，

特征提取模块中在共享权重的多层感知机MLP嵌入动态卷积层PAConv，根据每个点与其邻域点的位置关系学习权重系数，并组合权重矩阵自适应地构建卷积内核，提高局部细节特征提取能力；

在特征融合模块添加空间注意力机制，实现空间维度上的特征聚焦；

将最远点采样生成三个不同尺度的缺失点云输入多分辨率编码器模块；

使用嵌入动态核卷积PAConv的多层感知机的特征提取模块对三个不同尺度的缺失点云进行特征提取，生成多维特征向量V ₁，V ₂，V ₃；输出的多维特征向量V ₁，V ₂，V ₃输入由空间注意力机制构成的特征融合模块，空间注意力机制学习综合局部特征和全局信息的1024维抽象特征，输出加权后每个位置的特征；再以拼接数组将3个1024维度的抽象特征拼接，最后使用MLP将潜在特征映射整合到最终的特征向量V，维度为1024。

进一步地，所述动态核卷积PAConv的构建方法包括：

初始化一个由K个大小为C _in×C _out的权重矩阵组成的权重库W＝{W _k|k＝1，2，...，K}，其中C _in表示网络在当前层的输入维度，C _out表示网络在当前层的输出维度；

计算输入点云中每一个点p _i与邻域点p _j的相对位置关系，学习不同位置的权重系数

表示为：

E _ij＝Softmax(θ(p _i，p _j))

其中θ是核大小为1×1的卷积实现的非线性函数；使用Softmax函数进行规范化操作确保输出分数在范围(0，1)之间；较高的分数意味着对应的位置具有更重要的局部信息；

PAConv的内核是通过组合权重矩阵W _k和从点位置学习到的权重系数

构成的，

至此，动态核卷积PAConv完成自适应地构建卷积内核的工作，用于捕获输入特征局部区域的信息，输出具有局部关联性的特征。

优选地，K取值为16。

在一些实施例中，对所述特征向量进行处理得到三个尺度的点云补全结果，包括：特征向量V经过全连接层得到三个不同分辨率的子特征向量U ₁，U ₂，U ₃，每个子特征向量负责补全不同分辨率的点云；利用U ₃预测初级点云P ₃，用U ₂预测次级点云P ₂距离P ₃中心点的相对坐标，使用重组和全连接操作根据P ₃生成次级点云P ₂；利用U ₁和P ₂预测最终点云P ₁距离P ₂中心点的相对坐标，以此补充最终点云P ₁。

在一些实施例中，所述注意力鉴别器模块包括全局注意力鉴别器和全局注意力鉴别器；全局鉴别器用于查看整个点云补全结果来评估其整体一致性，局部鉴别器模块查看以已完成区域为中心的小区域，以确保生成点云的局部一致性。

在一些实施例中，所述注意力鉴别器模块的处理过程包括：将整体或局部生成点云和真实点云送入注意力鉴别器，通过其中的自编码器获得维度为512 的特征向量，再通过连续的全连接层降低维度[512-256-128-16-1],输出最终fake或real的二值结果。

在一些实施例中，所述点云补全模型的训练方法，包括：

损失函数包括两个部分：生成损失和对抗损失；

利用倒角距离CD计算生成点云和地面真实点云之间平均最短点距离，计算公式为：

其中，x、y表示生成点云或真实点云中的某个点；P*P表示距离；CD计算了生成点云S ₁和真实点云S ₂之间的平均最近平方距离，最终的生成结果是三个不同尺度的生成点云P ₁、P ₂、P ₃，生成损失也由三部分构成，

分别对应三个不同尺度生成点云的CD值，其中α表示生成损失中的求和权重；

生成损失L _com表达式为：

其中，P _1gt、P _2gt、P _3gt分别为三个不同尺度的生成点云所对应的真实点云；

对抗损失借鉴对抗性网络GAN，对抗损失L _adv为：

L _adv＝∑ _1≤i≤Slog ₁₀(G(y _i))+∑ _1≤j≤Slog ₁₀(1-G(E(D(x _i))))

其中，y _i和x _i分别属于原始残缺点云和真实点云，S表示数据集尺寸；E、D、G 分别表示多分辨率编码器、金字塔解码器和注意力鉴别器；

总损失函数L由生成损失和对抗损失共同构成：

L＝βL _com+λL _adv

β和λ分别是生成损失L _com和对抗损失L _adv的权重，满足以下条件：β+λ＝1；倒角距离CD也作为测试补全性能的评估指标。

第二方面，本发明提供了一种基于深度学习的高精度点云补全装置，包括处理器及存储介质；

所述存储介质用于存储指令；

所述处理器用于根据所述指令进行操作以执行根据第一方面所述方法的步骤。

第三方面，本发明提供了一种存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现第一方面所述方法的步骤。

本发明的优点在于：本发明提供的方法，与现技术相比，具有以下技术效果：(1)本发明在特征提取模块引入卷积层PAConv，可以根据每个点与其邻域点的位置关系学习权重系数，并组合权重矩阵自适应地构建卷积内核，所以可以灵活地捕获局部区域的信息。

(2)本发明在特征融合模块添加了空间注意力机制，使解码器更好学习各种特征之间的相互关系，提高点云补全的精度。

(3)本发明在鉴别器模块包含全局和局部鉴别器模块，利用多层全连接进行分类，分别从整体和局部来判断生成结果是否符合真实点云分布，进而优化生成结果。

本发明的优点是弥补了基于深度学习的点云补全方法在局部特征提取上的欠缺，通过引入PAConv卷积层和空间注意力机制，可以提高点云补全的精度，得到更为完整准确的点云补全结果；引入全局和局部注意力鉴别器模块，来保证生成点云与真实点云之间的整体和局部一致性。同时，点云补全也为点云分割、分类、物体识别以及点云重建等诸多下游任务的顺利进行提供了保障。

附图说明

图1为本发明实施例中整体网络框架示意图。

图2为本发明实施例中空间注意力机制示意图。

图3为本发明实施例中PAConv结构示意图。

图4为本发明实施例中缺失点云补全过程示意图。

具体实施方式

为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解，下面结合具体实施方式进一步阐述本发明。

在本发明的描述中，若干的含义是一个以上，多个的含义是两个以上，大于、小于、超过等理解为不包括本数，以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。

本发明的描述中，参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

实施例1

一种基于深度学习的高精度点云补全方法，包括：

获取待处理的点云数据；

对所述点云数据进行预处理，得到预处理后的点云数据；

根据所述点云补全模型的输出，确定高精度点云补全结果。

在一些实施例中，一种基于深度学习的高精度点云补全方法，如图1所示，点云补全方法整体框架包括多分辨率编码器、金字塔解码器和注意力鉴别器三个部分。多分辨率编码器对输入点云的特征进行提取；金字塔解码器将融合后的特征向量进行处理得到三个尺度的点云补全结果；注意力鉴别器计算出对抗损失，通过相互博弈学习来产生好的输出，保证生成点云与真实点云之间的整体和局部一致性。以下详细叙述各模块实现方法及功能：

首先通过最远点采样，不断迭代地选择距离已有采样点集合的最远点，用于获取一组骨架点。这可以更均匀的表示点集的分布，并且不会破坏点云模型的结构。将最远点采样生成三个不同尺度的缺失点云输入多分辨率编码器进行特征提取，使用嵌入动态核卷积PAConv的多层感知机，生成多维特征向量V ₁，V ₂，V ₃。输出的多维特征向量V ₁，V ₂，V ₃输入由空间注意力机制构成的特征融合模块，结构如图2所示，空间注意力机制学习综合局部特征和全局信息的1024维抽象特征，实现空间维度上的特征聚焦，输出加权后每个位置的特征。再以拼接数组将3个1024维度的抽象特征拼接，最后使用MLP将潜在特征映射整合到最终的特征向量V，维度为1024。

其中，PAConv部分首先初始化了一个由K个大小为C _in×C _out的权重矩阵组成的权重库W＝{W _k|k＝1，2，...，K}，其中C _in表示网络在当前层的输入维度，C _out表示网络在当前层的输出维度。较大的K可以使得保证卷积内核的多样性，但也会增加模型的负担。因此，在我们的网络模型中，我们将K取值为16。接下来计算输入点云中每一个点p _i与其邻域点p _j的相对位置关系，学习不同位置的权重系数

这个过程可以表示为

E _ij＝Softmax(θ(p _i，p _j))# (1)

其中θ是核大小为1×1的卷积实现的非线性函数。使用Softmax对其进行规范化操作可以确保输出分数在范围(0，1)之间。较高的分数意味着对应的位置具有更重要的局部信息。PAConv的内核是通过组合权重矩阵W _k和从点位置学习到的权重系数

构成的，

至此，PAConv完成了自适应地构建卷积内核的工作。它可以灵活地捕获输入特征局部区域的信息，输出具有局部关联性的特征。

金字塔解码器模由全连接层和重组层构成，采用特征金字塔网络思想，由粗到细逐步补全缺失点云，输入是多分辨率编码器的输出特征向量V，通过全连接层得到三个不同分辨率的子特征向量U ₁，U ₂，U ₃，维度为1024，512，256，每个子特征向量负责补全不同分辨率的点云。首先利用U ₃预测初级点云P ₃，然后用U ₂预测次级点云P ₂距离P ₃中心点的相对坐标，然后使用重组和全连接操作，根据P ₃生成次级点云P ₂。同理，利用U ₁和P ₂可以预测最终点云P ₁距离P ₂中心点的相对坐标，以此可以补充最终点云P ₁。

注意力鉴别器模块使用生成对抗网络的思想，由框架中的生成模型和判别模型相互博弈学习来产生好的输出。模块由全局注意力鉴别器和全局注意力鉴别器两部分组成，全局鉴别器查看整个点云补全结果来评估其整体一致性，局部鉴别器模块仅查看以已完成区域为中心的小区域，以确保生成点云的局部一致性。具体做法为：将整体或局部生成点云和真实点云送入鉴别器，通过其中的自编码器获得维度为512的特征向量，再通过连续的全连接层降低维度[512-256-128-16-1],输出最终fake或real的二值结果。

本发明算法的损失函数包括两个部分：生成损失和对抗损失。

式(3)中，CD计算了生成点云S ₁和真实点云S ₂之间的平均最近平方距离，由于我们最终的生成结果是三个不同尺度的生成点云P ₁、P ₂、P ₃，所以总损失也由三部分构成，

分别对应三个不同尺度生成点云的CD值，其中α表示生成损失中的求和权重。总损失表达式为：

式(4)中，P _1gt、P _2gt、P _3gt分别为三个不同尺度的生成点云所对应的真实点云。

本文中的对抗损失借鉴对抗性网络GAN，计算公式如下：

L _adv＝∑ _1≤i≤Slog ₁₀(G(y _i))+∑ _1≤j≤Slog ₁₀(1-G(E(D(x _i))))#(5)

式(5)中,y _i和x _i分别属于原始残缺点云和真实点云。E、D、G分别表示多分辨率编码器、金字塔解码器和注意力鉴别器。总损失是由生成损失和对抗损失共同构成，计算公式如式(6)所示：

L＝βL _com+λL _adv #(6)

本发明所提出的系统，其优点在于：

(1)为弥补了基于深度学习的点云补全方法在局部特征提取上的欠缺提出了可行方案。

(2)可以得到补全精度较高的点云模型，这为点云分割、分类、物体识别以及点云重建等诸多下游任务的顺利进行提供了保障。

本发明公开的一种基于深度学习的点云补全方法，可以对点云全局和局部特征进行提取并综合关键点的局部关联性和全局信息，弥补了基于深度学习的点云补全方法在局部特征提取方面的不足，提升了点云补全的准确度，同时也为点云分割、分类、物体识别以及点云重建等诸多下游任务的顺利进行提供了保障。

实施例2

第二方面，本实施例提供了一种基于深度学习的高精度点云补全装置，包括处理器及存储介质；

所述存储介质用于存储指令；

所述处理器用于根据所述指令进行操作以执行根据实施例1所述方法的步骤。

实施例3

第三方面，本实施例提供了一种存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现实施例1所述方法的步骤。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

由技术常识可知，本发明可以通过其它的不脱离其精神实质或必要特征的实施方案来实现。因此，上述公开的实施方案，就各方面而言，都只是举例说明，并不是仅有的。所有在本发明范围内或在等同于本发明的范围内的改变均被本发明包含。

Claims

一种基于深度学习的高精度点云补全方法，其特征在于，包括：

获取待处理的点云数据；

对所述点云数据进行预处理，得到预处理后的点云数据；

将预处理后的点云数据输入训练好的点云补全模型，其中所述点云补全模型包括多分辨率编码器模块、金字塔解码器模块和注意力鉴别器模块；

所述多分辨率编码器模块，被配置为：对输入的点云数据进行特征提取、融合，得到特征向量；

所述金字塔解码器模块，被配置为：对所述特征向量进行处理得到三个尺度的点云补全结果；

所述注意力鉴别器模块，被配置为：使用生成对抗网络的思想，通过生成模型和判别模型相互博弈学习来产生全局和局部特征一致性的结果；

根据所述点云补全模型的输出，确定高精度点云补全结果。
根据权利要求1所述的基于深度学习的高精度点云补全方法，其特征在于，所述多分辨率编码器模块包括特征提取模块和特征融合模块，

特征提取模块中在共享权重的多层感知机MLP嵌入动态卷积层PAConv，根据每个点与其邻域点的位置关系学习权重系数，并组合权重矩阵自适应地构建卷积内核，提高局部细节特征提取能力；

在特征融合模块添加空间注意力机制，实现空间维度上的特征聚焦；

将最远点采样生成三个不同尺度的缺失点云输入多分辨率编码器模块；

使用嵌入动态核卷积PAConv的多层感知机的特征提取模块对三个不同尺度的缺失点云进行特征提取，生成多维特征向量V ₁，V ₂，V ₃；输出的多维特征向量V ₁，V ₂，V ₃输入由空间注意力机制构成的特征融合模块，空间注意力机制学习综合局部特征和全局信息的1024维抽象特征，输出加权后每个位置的特征；再以拼接数组将3个1024维度的抽象特征拼接，最后使用MLP将潜在特征映射整合到最终的特征向量V，维度为1024。
根据权利要求2所述的基于深度学习的高精度点云补全方法，其特征在于，所述动态核卷积PAConv的构建方法包括：

初始化一个由K个大小为C _in×C _out的权重矩阵组成的权重库W＝{W _k|k＝1，2，...，K}，其中C _in表示网络在当前层的输入维度，C _out表示网络在当前层的输出维度；

计算输入点云中每一个点p _i与邻域点p _j的相对位置关系，学习不同位置的权重系数
表示为：

E _ij＝Softmax(θ(p _i，p _j))

其中θ是核大小为1×1的卷积实现的非线性函数；使用Softmax函数进行规范化操作确保输出分数在范围(0，1)之间；较高的分数意味着对应的位置具有更重要的局部信息；

PAConv的内核是通过组合权重矩阵W _k和从点位置学习到的权重系数
构成的，

至此，动态核卷积PAConv完成自适应地构建卷积内核的工作，用于捕获输入特征局部区域的信息，输出具有局部关联性的特征。
根据权利要求3所述的基于深度学习的高精度点云补全方法，其特征在于，K取值为16。
根据权利要求1所述的基于深度学习的高精度点云补全方法，其特征在于，对所述特征向量进行处理得到三个尺度的点云补全结果，包括：特征向量V经过全连接层得到三个不同分辨率的子特征向量U ₁，U ₂，U ₃，每个子特征向量负责补全不同分辨率的点云；利用U ₃预测初级点云P ₃，用U ₂预测次级点云P ₂距离P ₃中心点的相对坐标，使用重组和全连接操作根据P ₃生成次级点云P ₂；利用U ₁和P ₂预测最终点云P ₁距离P ₂中心点的相对坐标，以此补充最终点云P ₁。
根据权利要求1所述的基于深度学习的高精度点云补全方法，其特征在于，所述注意力鉴别器模块包括全局注意力鉴别器和全局注意力鉴别器；全局鉴别器用于查看整个点云补全结果来评估其整体一致性，局部鉴别器模块查看以已完成区域为中心的小区域，以确保生成点云的局部一致性。
根据权利要求6所述的基于深度学习的高精度点云补全方法，其特征在于，所述注意力鉴别器模块的处理过程包括：将整体或局部生成点云和真实点云送入注意力鉴别器，通过其中的自编码器获得维度为512的特征向量，再通过连续的全连接层降低维度[512-256-128-16-1],输出最终fake或real的二值结果。
根据权利要求1所述的基于深度学习的高精度点云补全方法，其特征在于，所述点云补全模型的训练方法，包括：

损失函数包括两个部分：生成损失和对抗损失；

利用倒角距离CD计算生成点云和地面真实点云之间平均最短点距离，计算公式为：

其中，x、y表示生成点云或真实点云中的某个点；P*P表示距离；CD计算了生成点云S ₁和真实点云S ₂之间的平均最近平方距离，最终的生成结果是三个不同尺度的生成点云P ₁、P ₂、P ₃，生成损失也由三部分构成，
d _CD3分别对应三个不同尺度生成点云的CD值，其中α表示生成损失中的求和权重；

生成损失L _com表达式为：

其中，P _1gt、P _2gt、P _3gt分别为三个不同尺度的生成点云所对应的真实点云；

对抗损失借鉴对抗性网络GAN，对抗损失L _adv为：

其中，y _i和x _i分别属于原始残缺点云和真实点云，S表示数据集尺寸；E、D、G分别表示多分辨率编码器、金字塔解码器和注意力鉴别器；

总损失函数L由生成损失和对抗损失共同构成：

L＝βL _com+λL _adv

β和λ分别是生成损失L _com和对抗损失L _adv的权重，满足以下条件：β+λ＝1；倒角距离CD也作为测试补全性能的评估指标。
一种基于深度学习的高精度点云补全装置，其特征在于，包括处理器及存储介质；

所述存储介质用于存储指令；

所述处理器用于根据所述指令进行操作以执行根据权利要求1至8任一项所述方法的步骤。
一种存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至8任一项所述方法的步骤。