CN116363177A

CN116363177A - 一种基于几何Transformer和高斯混合模型的三维点云配准方法

Info

Publication number: CN116363177A
Application number: CN202310158547.3A
Authority: CN
Inventors: 张海波; 海琳琦; 王旭; 王喜芝; 张顺利; 耿国华; 周明全
Original assignee: NORTHWEST UNIVERSITY
Current assignee: NORTHWEST UNIVERSITY
Priority date: 2023-02-23
Filing date: 2023-02-23
Publication date: 2023-06-30

Abstract

本发明公开了一种基于几何Transformer和高斯混合模型的三维点云配准方法，包括：步骤1，通过三维扫描仪获取多个视角的三维点云；步骤2，首先利用PointNet网络提取两片点云的局部特征，后将单个点云的局部特征与两点云的全局特征进行特征融合；步骤3，再利用带有几何关系编码的Transformer网络来识别两片点云间的重叠区域；步骤4，使用高斯混合模型来表示输入的点云，利用点云特征、重叠分数、概率矩阵计算得到匹配参数；步骤5，从匹配的高斯混合模型(GMM)参数中计算匹配矩阵，完成三维点云的配准。本发明提供的三维点云配准方法在两片点云包含大量噪声和异常点情况下仍能快速并精确地完成三维点云配准任务。

Description

一种基于几何Transformer和高斯混合模型的三维点云配准方法

技术领域

本发明涉及三维点云模型配准技术，具体涉及一种基于几何Transformer和高斯混合模型的三维点云配准方法。

背景技术

点云配准是机器人、计算机视觉、文物修复等领域中的一个基本问题，其目的在于寻找对齐两个点云的最佳转换(旋转、平移和缩放)。

当点云之间的真实对应关系已知，且点受到零均值高斯噪声的影响时，配准问题很容易解决。然而，在实践中，对应关系要么是未知的，要么包含许多异常值，导致点云配准的求解器产生较差的配准结果。对于未知或不确定对应关系的配准，常用的方法要么依赖于对未知变换初始猜测的可用性(例如，迭代最近点方法ICP)，要么假设存在一个小的异常值集(例如，RANSAC方法)。这些算法可能会在点云存在大量异常值和噪声情况下配准效果不佳。

发明内容

针对现有技术存在的不足，本发明的目的在于提供一种在面对点云中存在大量噪声和异常值的情况下仍精确处理的基于几何Transformer和高斯混合模型的三维点云配准方法。

为了实现上述目的，本发明采用以下技术方案予以实现：

一种基于几何Transformer和高斯混合模型的三维点云配准方法，包括如下步骤：

步骤1，通过三维扫描仪获取多个视角的三维点云；

步骤2，首先利用PointNet网络提取两片点云的局部特征，然后将单个点云的局部特征与两点云的全局特征进行特征融合；

步骤3，再利用带有几何关系编码的Transformer网络来识别两片点云间的重叠区域；

步骤4，使用高斯混合模型(Gaussian Mixture Models,GMM)来表示输入的点云，利用点云特征、重叠分数、概率矩阵计算得到匹配参数；

步骤5，从匹配的高斯混合模型(GMM)参数中计算匹配矩阵，完成三维点云的配准。

本发明还具有以下技术特征：

优选的，所述步骤2中的PointNet网络通过多层感知机和最大池化提取点云的全局特征，后将1024维的全局特征和64维的局部特征通过concat操作连接起来，并通过全连接层输出每个点的特征。

进一步的，所述的PointNet网络每层输出特征的维度分别为64、64、64、128、1024；

所述的全连接层每层输出特征的维度分别为1024、1024、512。

优选的，所述步骤3中的几何关系由三个手工特征通过concate操作组成；

所述的三个手工制作的特征分别为点云点对之间距离、三元角和局部三角形周长之间差异值。

进一步的，所述的点云点对之间的距离ρ_i,j可以定义为：ρ_i,j＝||p_i-p_j||₂，其中p_i和p_j为三维空间中的两个点；

对于点p_i，其最近邻域的两个点可以表示为

和/>

这三个点形成一个三元组，定义/>

则所述的三元角可以表示为

对于点p_i，其最近邻域的两个点可以表示为

和/>

这三个点形成一个三角形，则所述的三角形周长的差η_i,j可以表示为：

所以最终的几何关系g_i,j可以表示为：g_i,j＝concate[ρ_i,j,α_i,j,η_i,j]，其中concate表示连接操作。

优选的，所述步骤3中的Transformer网络由几个堆叠的自注意力和交叉注意力层组成；

所述的自注意力用于学习每个点云在特征空间和几何空间中的全局上下文信息；

对于点P，特征表示为

d_t表示影藏的特征维度，输出的特征/>

是所有投影输入特征的加权和表示为：

其中a_i,j是权重系数，通过自注意力分数e_i,j计算；

g_i,j表示几何关系嵌入，而W^Q,W^K,

分别表示查询向量，键向量和值向量的权重；/>

为几何关系嵌入的投影权值，f_i表示点P的第i个特征，f_j表示点P的第j个特征；

所述的交叉注意力用于对两点云的特征进行交互；交叉注意力分数e_i,j可以表示为：

其中

表示点P的第i个特征，/>

表示点Q的第j个特征。

优选的，所述步骤4中高斯混合模型将三维空间上的多模态生成概率分布建立为L个高斯密度的加权和，其形式为：

每个密度N(x∣μ_j,Σ_j)被称为一个高斯混合模型的分量，并用均值μ_j和协方差Σ_j进行参数化，N(x∣μ_j,Σ_j)表示第j个子模型的高斯分布密度函数即概率，x表示点云数据。

进一步的，所述的点云特征的集合P的用高斯混合模型可以表示为：

其中

表示点云P构成第j个子模型的概率；/>

表示用输入点云数据构成的第j个子模型的高斯分布密度函数；

而高斯混合模型的参数可以表示为：

其中∈＝1e-4，s^p和s^q为概率矩阵，

表示概率矩阵的第i行第j列；o_p为重叠分数，/>

表示标量混合权重，/>

是一个3*1的平均向量，/>

是3*3协方差矩阵的第j个分量。

优选的，所述步骤5中计算匹配矩阵是将匹配的高斯混合模型GMM参数和特征的质心通过最优传输计算匹配矩阵，之后通过带有加权的SVD奇异值分解方法求解出两点云间的变换矩阵；

计算匹配矩阵_Γ过程可以表示为：

s.t.,Γ1_M＝π^p,Γ^·1_N＝π^q,Γ_ij∈[0,1]

其中

和/>

分别表示点云P的第i个点和点云Q中第j个点；

获得匹配矩阵后，通过以下公式计算最终的变换矩阵：

是属于点云P的一个3*1的平均向量，/>

是属于点云q的一个3*1的平均向量。Γ_ij表示匹配矩阵的第i行，第j列。

本发明与现有技术相比，具有如下技术效果：

本发明提出的三维点云配准网络模型由五个部分组成：点云特征提取、点云特征融合、嵌入几何关系的Transformer网络对特征进行聚合、GMM求解匹配参数和加权奇异值分解(SVD)；具体来说，利用PointNet网络提取点的全局特征，再将单个点云的64维局部特征和两点云的1024维全局特征进行concate操作，融合为2112维特征，再利用带有几何关系编码的Transformer网络来对点云的特征进行聚合，帮助网络识别点云间的重叠区域；此外，使用高斯混合模型(Gaussian Mixture Models,GMM)来表示输入的点云，利用点云特征、重叠分数、概率矩阵计算得到匹配参数；最后从匹配的高斯混合模型(GMM)参数中计算匹配矩阵，完成三维点云的配准；本模型为了加快点云配准模型的鲁棒性，在特征提取部分对点云的局部特征和全局特征进行融合；此外，使用Transformer网络对特征进行聚合，提高了特征的鲁棒性，最后借助GMM模型计算匹配矩阵；这使得本发明构建的点云配准网络在点云包含大量噪声、异常值的情况下仍能快速和准确地完成三维点云配准。

附图说明

图1为本发明的流程图；

图2为点云配准网络模型图；

图3为秦俑源点云效果图；

图4为秦俑目标点云效果图；

图5为秦俑点云配准后效果图。

具体实施方式

以下结合实施例对本发明的具体内容做进一步详细解释说明。

参照图1-2，本实施例提供一种基于特征交互和可靠对应关系估计的三维点云配准方法，包括如下步骤：

步骤1，通过三维扫描仪获取多个视角的三维点云；

步骤2，首先利用PointNet网络提取两片点云的局部特征，后将单个点云的局部特征与两点云的全局特征进行特征融合；其中PointNet由一个共享权重的MLP组成，输出的特征的维度分别为64、64、64、128、1024，后将1024维的特征进行最大池化为全局特征，再将单个点云的64位局部特征与两点云的1024维的全局特征进行融合为2112位特征，最后经过一个全连接层输出点云最终的特征，全连接层每层输出的特征维度为1024、1024、512。

步骤3，再利用带有几何关系编码的Transformer网络来识别两片点云间的重叠区域；其中几何关系由三个手工特征通过concate操作组成，三个手工制作的特征分别为点云点对之间距离、三元角和三角形周长差异值；

点云点对之间的距离ρ_i,j可以定义为：ρ_i,j＝||p_i-p_j||₂，其中p_i和p_j为三维空间中的两个点；

三元角可以定义为：对于点p_i，其最近邻域的两个点可以表示为

和/>

这三个点形成一个三元组；我们定义/>

则三元角可以表示为

三角形周长的差可以定义为：对于点p_i，其最近邻域的两个点可以表示为

和

这三个点形成一个三角形；则三角形周长的差η_i,j可以表示为：

所以最终的几何关系g_i,j可以表示为：g_i,j＝concate[ρ_i,j,α_i,j,η_i,j]；其中concate表示连接操作；

而几何Transformer是由多个自注意力和交叉注意力堆叠而成，其中自注意力目的是学习每个点云在特征空间和几何空间中的全局上下文信息；

对于点P，特征表示为

d_t表示影藏的特征维度，输出的特征/>

是所有投影输入特征的加权和，加权和Z_i表示为：

其中a_i,j是权重系数，通过自注意力分数e_i,j计算；

g_i,j表示几何关系嵌入，而W^Q,W^K,

分别表示查询向量，键向量和值向量的权重；/>

为几何关系嵌入的投影权值；f_i表示点P的第i个特征，f_j表示点P的第j个特征；

而交叉注意力目的对两点云的特征进行交互，帮助网络更好地识别两片点云的重叠区域；交叉注意力与自注意力在注意力分数求解上不同，而交叉注意力分数e_i,j可以表示为：

其中

表示点P的第i个特征，/>

表示点Q的第j个特征。

步骤4，使用高斯混合模型(Gaussian Mixture Models,GMM)来表示输入的点云，利用点云特征、重叠分数、概率矩阵计算得到匹配参数；其中高斯混合模型(GMM)将三维空间上的多模态生成概率分布建立为L个高斯密度的加权和，其形式为：

每个密度N(x∣μ_j,Σ_j)被称为一个GMM的分量，并用均值μ_j和协方差Σ_j进行参数化；N(x∣μ_j,Σ_j)表示第j个子模型的高斯分布密度函数即概率；x表示点云数据；点云特征的集合P的用GMM可以表示为：

而GMM的参数可以表示为：

其中∈＝1e-4，s^p和s^q为概率矩阵，

表示概率矩阵的第i行第j列；o_p为重叠分数，/>

表示标量混合权重，/>

是一个3*1的平均向量，/>

是3*3协方差矩阵的第j个分量。

步骤5，将匹配的高斯混合模型GMM参数和特征的质心通过最优传输计算匹配矩阵，之后通过带有加权的SVD奇异值分解方法求解出两点云间的变换矩阵，完成三维点云的配准；计算匹配矩阵_Γ过程可以表示为：

s.t.,Γ1_M＝π^p,Γ^·1_N＝π^q,Γ_ij∈[0,1]

其中

和/>

分别表示点云P的第i个点和点云Q中第j个点；

获得匹配矩阵后，通过以下公式计算最终的变换矩阵：

是属于点云P的一个3*1的平均向量，/>

是属于点云q的一个3*1的平均向量，Γ_ij表示匹配矩阵的第i行，第j列。

图5为通过本发明所述方法进行配准后的点云配准结果图，由图可知本发明所述方法针对点云间包含大量噪声和异常点时仍能鲁棒地处理。

Claims

1.一种基于几何Transformer和高斯混合模型的三维点云配准方法，其特征在于，包括如下步骤：

步骤1，通过三维扫描仪获取多个视角的三维点云；

2.如权利要求1所述的基于几何Transformer和高斯混合模型的三维点云配准方法，其特征在于，所述步骤2中的PointNet网络通过多层感知机和最大池化提取点云的全局特征，后将1024维的全局特征和64维的局部特征通过concat操作连接起来，并通过全连接层输出每个点的特征。

3.如权利要求2所述的基于几何Transformer和高斯混合模型的三维点云配准方法，其特征在于，所述的PointNet网络每层输出特征的维度分别为64、64、64、128、1024；

所述的全连接层每层输出特征的维度分别为1024、1024、512。

4.如权利要求1所述的基于几何Transformer和高斯混合模型的三维点云配准方法，其特征在于，所述步骤3中的几何关系由三个手工特征通过concate操作组成；

5.如权利要求4所述的基于几何Transformer和高斯混合模型的三维点云配准方法，其特征在于，所述的点云点对之间的距离ρ_i,j可以定义为：ρ_i,j＝||p_i-p_j||₂，其中p_i和p_j为三维空间中的两个点；

对于点p_i，其最近邻域的两个点可以表示为

和/>

这三个点形成一个三元组，定义

则所述的三元角可以表示为/>

对于点p_i，其最近邻域的两个点可以表示为

和/>

6.如权利要求1所述的基于几何Transformer和高斯混合模型的三维点云配准方法，其特征在于，所述步骤3中的Transformer网络由几个堆叠的自注意力和交叉注意力层组成；

对于点P，特征表示为

d_t表示隐藏的特征维度，输出的特征/>

是所有投影输入特征的加权和表示为：

其中a_i,j是权重系数，通过自注意力分数e_i,j计算；

g_i,j表示几何关系嵌入，而

分别表示查询向量，键向量和值向量的权重，/>

其中f_i ^P表示点P的第i个特征，

表示点Q的第j个特征。

7.如权利要求1所述的基于几何Transformer和高斯混合模型的三维点云配准方法，其特征在于，所述步骤4中高斯混合模型将三维空间上的多模态生成概率分布建立为L个高斯密度的加权和，其形式为：

每个密度N(x∣μ_j,Σ_j)被称为一个高斯混合模型的分量，并用均值μ_j和协方差Σ_j进行参数化；π_j表示输入数据构成等第j个子模型的概率；N(x∣μ_j,Σ_j)表示第j个子模型的高斯分布密度函数即概率；x表示点云数据。

8.如权利要求7所述的基于几何Transformer和高斯混合模型的三维点云配准方法，其特征在于，所述的点云特征的集合P的用高斯混合模型可以表示为：

其中

表示点云P构成第j个子模型的概率；/>

而高斯混合模型的参数可以表示为：

其中∈＝1e-4，s^p和s^q为概率矩阵，

表示概率矩阵的第i行第j列；o_p为重叠分数，/>

表示标量混合权重，/>

是一个3*1的平均向量，/>

是3*3协方差矩阵的第j个分量。

9.如权利要求1所述的基于几何Transformer和高斯混合模型的三维点云配准方法，其特征在于，所述步骤5中计算匹配矩阵是将匹配的高斯混合模型GMM参数和特征的质心通过最优传输计算匹配矩阵，之后通过带有加权的SVD奇异值分解方法求解出两点云间的变换矩阵；

计算匹配矩阵_Γ过程可以表示为：

s.t.,Γ1_M＝π^p,Γ^·1_N＝π^q,Γ_ij∈[0,1]

其中

和/>

分别表示点云P的第i个点和点云Q中第j个点；

获得匹配矩阵后，通过以下公式计算最终的变换矩阵：

是属于点云P的一个3*1的平均向量，/>