WO2022165876A1

WO2022165876A1 - 一种基于wgan的无监督多视角三维点云联合配准方法

Info

Publication number: WO2022165876A1
Application number: PCT/CN2021/077770
Authority: WO
Inventors: 王耀南; 彭伟星; 张辉; 毛建旭; 朱青; 刘敏; 赵佳文; 江一鸣; 吴昊天
Original assignee: 湖南大学
Priority date: 2021-02-06
Filing date: 2021-02-25
Publication date: 2022-08-11
Also published as: CN112837356A

Abstract

一种基于WGAN的无监督多视角三维点云联合配准方法包括如下步骤：步骤S1、获取不同视角的点云；步骤S1、对所有视角的点云进行下采样；步骤S3、从标准模型中采样；步骤S4、对多视角点云联合配准WGAN的生成器网络进行训练；步骤S5、对多视角点云联合配准WGAN的判别器网络进行训练；步骤S6、判断是否终止训练：设定生成器和判别器训练的次数均为M次，若达到M次则终止训练，若未达到M次则回到步骤S4。设计了一种多视角点云配准网络生成点云模型，相较于传统的配准方法，具有对初始化更强的鲁棒性，有利于在生产线上实时运行，既不存在视角偏置，也不存在累计误差。

Description

一种基于WGAN的无监督多视角三维点云联合配准方法

本申请要求于2021年02月06日提交中国专利局的中国专利申请的优先权，其中国专利申请为：申请号为202110165409.9，发明名称为“一种基于WGAN的无监督多视角三维点云联合配准方法”，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及机器视觉技术领域，特别涉及一种基于WGAN(Wasserstein Generative Adversarial Networks，一种生成式对抗网络深度学习模型)的无监督多视角三维点云联合配准方法。

背景技术

智能制造技术是实现制造业工业化与信息化融合的动力。如今，航空制造业也正面临着向智能化的转型。机器人作为智能制造技术的载体之一，在航空制造领域引起了广泛关注。航空发动机是飞机的“心脏”，其性能主要受到航空发动机叶片制造水平的限制。叶片三维尺寸测量技术对叶片加工和质量检测具有重要意义。为了满足叶片日益复杂的测量需求，亟需开发三维测量机器人并实现自动测量。随着光学测量技术的发展，一个可行的机器人测量方案是：利用装载在工业机器人末端的激光扫描仪获取点云并重建出三维模型，通过该模型测量叶片的三维尺寸数据。

在该测量方案中，准确和完整地重建叶片的三维模型是精密测量叶片的必要前提，而配准多个视角的三维点云是重建过程主要需要解决的问题。点云配准指将不同坐标系下的点云变换到统一的坐标系下，一般分为三类：粗配准、精细配准和全局配准。粗配准一般用于两个姿态相差较大的点云；精细配准用于提升粗配准点云的精度，较为成熟的方法包括ICP(Iterative Closest Point,迭代最近点)配准算法以及基于ICP的改进算法；重建过程中，逐帧配准点云数据往往存在严重的累计误差，影响重建模型的精度。全局配准算法则期望将累计误差分散到每一帧数据，从而减小整体的误差。无论是精配准还是全局配准，都需要一个较好的粗配准结果作为初始化参数。粗配准则对依赖于点云的重叠区域大小，重叠部分特征的显著性，以及模型本身的对称性等。

航空发动机叶片为了满足气动性能，被设计成光滑无纹理的双曲面薄壁异形结构。在获取三维点云时，这样的结构会导致相邻点云间重叠区域不足，且纹理特征微弱，难以取得较好的粗配准结果，因此使得全局配准的误差大，无法精密重建出叶片的三维模型。

发明内容

本发明提供了一种基于WGAN的无监督多视角三维点云联合配准方法，该方法在WGAN的框架上可训练并优化各个视角的姿态，使得优化后整体的点云概率分布与先验模型点云的概率分布差异最小化，即表示配准后的点云模型最大程度的接近理论模型。

为了达到上述目的，本发明提供的一种基于WGAN的无监督多视角三维点云联合配准方法，包括如下步骤：

步骤S1、获取不同视角的点云：从不同视角进行扫描，扫描后获得I个点云P＝{P ₁,...,P _i,...,P _I}，

表示第i个点云；N _i表示第i个点云所包含的点的个数，P _ij表示第i个点云中的第j个点，p _n＝R ³，R表示实数，R ³表示笛卡尔三维坐标系；

步骤S2、对所有视角的点云进行下采样：点云P _i为分别处理与前后相邻两个视角的关系，存在两个相邻的点云，处理不同相邻点云时，共进行两次点云下采样，即对于每个点云，分别对前后相邻视角点云下采样：

对于P _i-1，对P _i和P _i-1进行随机采样，采样数量N _iL为：

N _iL＝min{N _i-1/s,N _i/s} (1)

对于P _i+1，对P _i和P _i+1进行随机采样，采样数量N _iR为：

N _iR＝min{N _i/s,N _i+1/s} (2)

式中，N _i-1表示第i-1个点云所包含的点的个数，N _i表示第i个点云所包含的点的个数，N _i+1表示第i+1个点云所包含的点的个数，s为人为设定的采样参数；

步骤S3、从标准模型中采样；从标准模型点集P ^s中采样出m个样本，记为标准样本

步骤S4、对多视角点云联合配准WGAN的生成器网络进行训练：将各个视角点云逐一转换到统一的坐标系下，将所有转换后的点云融合成一个完整的点云模型P'，并对P'进行均匀采样，从P'采样m个点作为生成样本

具体包括如下步骤：

步骤S41、设计生成器；

步骤S42、生成器网络进行训练；

步骤S5、对多视角点云联合配准WGAN的判别器网络进行训练：对生成样本

与标准样本

进行判别；具体包括如下步骤：

步骤S51、设计判别器；

步骤S52、判别器网络进行训练；

步骤6：判断是否终止训练：设定生成器和判别器训练的次数均为M 次，若达到M次则终止训练，若未达到M次则回到步骤S4。

优选地，所述步骤S41具体包括如下步骤：

步骤S411、构建特征向量转换网络层，对点云

表示N _i×3矩阵，逐点生成高维特征向量F _i∈R ^N×D，D表示每个点提取的D维的特征向量，R ^N×D表示N×D矩阵；

步骤S412、构建匹配点计算网络层，逐点计算匹配点：提取相邻点云P _i-1与P _i+1对应的经过高维特征向量转换的特征矩阵F _(i-1)R和F _(i+1)L；分别计算P _i与P _i-1及P _i+1的匹配概率，分别得到匹配点对集合

步骤S413、滤除基于注意力机制的外点：计算上一次迭代得到的第i个姿态的转置与匹配点对C _ij之间的相关性度量sim _ij，j表示索引；

步骤S414、联合配准求姿态的闭式解T：根据当前匹配点对及其权重计算点云的相对姿态及约束条件，获得点云的相对姿态优化唯一最优解，即最优姿态；

步骤S415、生成点云模型并进行采样：根据最优姿态，将各个视角点云逐一转换到统一的坐标系下，融合成一个完整的点云模型P'，并对P'进行均匀采样。

优选地，所述步骤S411具体为：

网络由4个EdgeConv层和一个卷积层Conv构成，用每一个特征

作为顶点，对每个点计算K-最近邻KNN，连接其K近邻作为边，构建图结构，D _in表示输入特征向量的维数，

表示D _in维实数向量；

对于顶点

其与某个邻近点

所构成的边为

将每一条边作为多层感知机MLP的输入，经过ReLU激活函数后输出D _out维特征；

将所有边的特征通过最大池化层，得到对应于顶点

的特征

表示D _out维实数向量；

输入特征矩阵

表示N×D _in维实数矩阵，输出特征矩阵

表示N×D _out维实数矩阵；

其中，第一个EdgeConv层输出的特征维数为64，第二个EdgeConv层输出的特征维数为64，第三个EdgeConv层输出的特征维数为128，第四个EdgeConv层输出的特征维数为256；将四个EdgeConv层提取的特征拼接得到的N×512维特征作为Conv的输入，过ReLU激活函数后输出特征矩阵F _i∈R ^N×1024，R ^N×1024表示N×1024维实数矩阵。

优选地，所述步骤S412具体为：

P _i为分别处理与前后相邻两个视角的关系，进行了两次点云下采样，对应地经过高维特征层提取两个不同的特征矩阵，即

和

表示N _iL×1024维实数矩阵，

表示N _iR×1024维实数矩阵；

P _i与P _i+1的匹配点具体为：输入为

输出为

Φ _iR＝F _iR+φ(F _iR，F _(i+1)L)，

和

Φ _(i+1)L＝F _(i+1)L+φ(F _(i+1)L，F _iR)，

其中，φ(F _iR,F _(i+1)L)为Transformer将特征F _iR通过学习调整到一个“条件”F _(i+1)L的残差变化量，φ(F _(i+)L,F _iR)为Transformer将特征F _(i+1)L通过学习调整到一个“条件”F _iR的残差变化量；

对于点p _ij∈P _i，P _i+1的每一个点与p _ij成为匹配点的概率所构成矩阵为

Φ _iR(j)表示Φ _iR的第j行，即对应于点p _ij的特征向量,T表示矩阵转置，softmax是一种概率归一化处理函数；

根据上述匹配点概率，为p _ij∈P _i生成一个平均匹配点cp _ij：

点云P _i在P _i+1中得到的匹配点集合记为CP _i，匹配点对(p _ij,cp _ij)记作C _ij，匹配点对构成集合C _iR；

P _i与P _i-1的匹配点均可按照上述过程实现，得到匹配点对集合C _iL；C _iR与C _iL构成匹配点对构成集合C _i；每对相邻视角寻找匹配点的过程均可按照上述过程实现。

优选地，所述步骤S413具体为：

计算

与匹配点对C _ij之间的相关性度量sim _ij：

其中

表示上一次迭代得到的第i个姿态的转置，||.|| _F表示Frobenius范数，σ是一个正实数，防止sim _ij趋向于无穷大；

引入softmax函数对sim _ij进行归一化，使所有匹配点对权重之和为1：

式中，w _ij表示匹配点权重，

表示变量为sim _ij的指数函数。

优选地，所述步骤S414具体为：

根据当前匹配点对及其权重计算点云的相对姿态，所有匹配点对欧式距离之和d为：

其中，

为第i个视角姿态转换矩阵的转置，R _i∈SO(3)为旋转矩阵的转置，t _i∈R ^1×3为平移量的转置，R ^l×3表示L×3维实数矩阵；

构造矩阵

将式(7)表示成

令

T＝[T ₁,...,T _I] ^T，将式(8)转化成矩阵函数表达式:

所求得的姿态T＝[T ₁,...,T _I] ^T需要一个固定的初始坐标系，以保证优化问题仅存在唯一的最优解；

为式(9)添加约束条件T ₁＝T ⁰，T ⁰是任意的满足R ⁰∈SO(3)的姿态；为了简化网络结构，取T ⁰为标准3D模型的坐标系；由于T＝[T ₁,...,T _I] ^T，构造矩阵A＝[I ₄ 0 _4×4(I-1)]，I ₄表示 _4×4的单位矩阵，0 _4×4(I-1)表示4×4(I-1)的零矩阵；

约束条件1表示成：

T ₁＝AT＝T ⁰ (10)

同时，旋转矩阵

约束条件2表示成：

式中，I表示单位矩阵，det表示行列式；

令b＝[I ₃ 0 _3×1]，则

R _i＝bT _i (12)

令R＝[R ₁...R _i...R _I]，则

R＝BT (13)

其中，

令

将式(9)的等式约束最优问题表示成：

式中，s.t.表示约束条件；

采用拉格朗日乘子法处理等式约束问题，增广的拉格朗日函数为

式中，λ表示人为设定的参数，取0.001，μ作为该层神经网络的可调参数，

取上一次迭代的结果，Y表示拉格朗日乘子；

采用交替乘子法求解上述问题的最优解，得到如下迭代关系

关于

的子问题可以用下式求解：

SVD表示奇异值分解；

关于T的子问题是一个二次凸优化问题，令其导数为0求其最小值，即

则有

优选地，所述步骤S415具体为：

根据上个步骤求得的姿态T，将各个视角点云逐一转换到统一的坐标系下：

p' _ij＝p _ijT _i (21)

将所有转换后的点云融合成一个完整的点云模型P'；

对P'进行均匀采样：记采样点集为S ₂，S ₂初始化为空集；随机采样一个种子点seed，放入S ₂；在集合P'-S ₂里，找一个距离集合S ₂最远的点；最终从P'中采样m个点作为样本

所述步骤S3具体包括入下步骤：

步骤S31、记标准模型点集为P ^s，采样点集为S ₁，S ₁初始化为空集；

步骤S32、随机采样一个种子点seed，放入S ₁；

步骤S33、在集合P ^s-S ₁里，找一个距离集合S ₁最远的点，其中点到集合S ₁的距离为该点到S ₁最小的点距；

步骤S34、重复步骤S33，直到采样出m个样本，记为标准样本

优选地，所述步骤S42具体包括如下步骤：

步骤S421、逐一将下采样的点云

输入到共享权值的高维特征提取层，得到对应点云P _i的特征矩阵F _i∈R ^N×1024；

步骤S422、将相邻视角的特征矩阵F _iR和F _(i+1)L逐对输入到匹配点对生成网络，得到点云P _i的匹配点集CP _i；

步骤S423、将所有视角的点及其匹配点作为输入，利用联合配准求姿态的闭式解T；

步骤S424、将所有点云通过求得的T转换到统一坐标系下，融合成点云模型P'；

步骤S425、从P'采样m个点作为生成样本

步骤S426、调节生成器网络参数：

θ←θ-α·RMSProp(θ,g _θ) (23)

g _θ表示关于θ的梯度，θ表示生成器的网络参数，f _ω表示判别器，ω表示判别器的网络参数，v ⁽ⁱ⁾表示第i个生成样本，α表示步长，RMSProp表示一种基于动量的优化算法。

优选地，所述步骤S51具体为：

WGAN网络通过训练含参数ω、最后一层不是非线性激活层的判别器网络f _ω，在ω不超过某个范围的条件下，使得L尽可能最大，L表达式如下：

式中，L近似真实分布P _r和生成分布P _g之间的Wasserstein距离，即用Wasserstein距离定量的衡量两个分布的差异度，p表示样本，

表示真实分布P _r的期望，

表示生成分布P _g；

判别器采用全连接实现的多层感知机，结构为四层全连接，伴有3个ReLU激活函数；输入为点的坐标，即输入维度为3，输出维度为1。

优选地，所述步骤S52具体包括如下步骤：

步骤S521、逐一将从生成点云模型均匀采样的m个点的生成样本

输入到判别器网络f _ω中；

步骤S532、逐一将从标准模型均匀采样的m个点的标准样本

输入到判别器网络f _ω中；

步骤S533、调节判别器网络参数，对生成样本

与标准样本

进行判别；判别器网络参数具体为：

ω←ω+α·RMSProp(ω,g _ω) (26)

ω←clip(ω,-c,c) (27)

g _ω表示关于ω的梯度，u ⁽ⁱ⁾表示第i个标准样本，f _ω表示判别器，ω表示判别器的网络参数，RMSProp表示一种基于动量的优化算法，clip()表示参数ω的绝对值截断到不超过一个固定的常数c。

本发明能够取得下列有益效果：

(1)对视角姿态的初始化鲁棒；(2)相比于全监督神经网络，本发明所涉及的神经网络为无监督神经网络，只需要预先知道建模对象的理论模型即可，不需要大量的标注信息和大量样本，训练简单快速；(3)无需考虑网络的泛化能力，可实时运行；(4)相比于传统的多视角配准方法，所设计的网络直接求每一个视角相对于同一参考坐标系的转换关系，既不存在对某个视角的偏置，也不存在累计误差；(5)训练后的结果可作为精配准的初始值，配准精度高。

附图说明

图1为本发明的一种基于WGAN的无监督多视角三维点云联合配准方法的算法实现流程图；

图2为本发明的一种基于WGAN的无监督多视角三维点云联合配准方法中的一较佳实施例的联合配准的WGAN总体网络结构示意图；

图3为本发明的一种基于WGAN的无监督多视角三维点云联合配准方法的一较佳实施例中WGAN的生成器网络结构的示意图；

图4为本发明的一种基于WGAN的无监督多视角三维点云联合配准方法的一较佳实施例中生成器所涉及的高维特征提取层网络结构的示意图；

图5(a)为本发明的一种基于WGAN的无监督多视角三维点云联合配准方法的一较佳实施例中高维特征提取层所涉及的EdgeConv层的示意图；

图5(b)为图5(a)中通过K-邻近构造的图的示意图；

图6为本发明的一种基于WGAN的无监督多视角三维点云联合配准方法的一较佳实施例中生成器所涉及的匹配点生成层的transformer网络结构的示意图；

图7(a)为本发明的一种基于WGAN的无监督多视角三维点云联合配准方法的一较佳实施例中transformer网络所涉及的attention的示意图；

图7(b)为图7(a)的transformer网络所涉及的Multi-head attention子层的示意图。

具体实施方式

为使本发明要解决的技术问题、技术方案和优点更加清楚，下面将结合附图及具体实施例进行详细描述。

发动机叶片是以理论设计模型为参考加工的，所以加工成型的叶片应尽可能的符合设计模型，理论上配准后点云的整体概率分布也应该尽可能的接近理论模型点云的概率分布。

本发明针对现有的问题，提供了一种基于WGAN的无监督多视角三维点云联合配准方法，如图1及图2所示，本发明的一种基于WGAN的无监督多视角三维点云联合配准方法包括如下步骤：

对于P _i-1，对P _i和P _i-1进行随机采样，采样数量N _iL为：

N _iL＝min{N _i-1/s,N _i/s} (1)

对于P _i+1，对P _i和P _i+1进行随机采样，采样数量N _iR为：

N _iR＝min{N _i/s,N _i+1/s} (2)

具体包括如下步骤：

步骤S41、设计生成器；

步骤S42、生成器网络进行训练；

与标准样本

进行判别；具体包括如下步骤：

步骤S51、设计判别器；

步骤S52、判别器网络进行训练；

步骤6：判断是否终止训练：设定生成器和判别器训练的次数均为M次，若达到M次则终止训练，若未达到M次则回到步骤S4。

参考图3中WGAN的生成器网络结构的示意图，其中，所述步骤S41具体包括如下步骤：

步骤S411、构建特征向量转换网络层，对点云

参考图4、图5(a)及图5(b)，所述步骤S411具体为：

网络由4个EdgeConv(一种边卷积操作)层和一个卷积层Conv(向量卷积运算)构成，用每一个特征

表示D _in维实数向量；

对于顶点

其与某个邻近点

所构成的边为

将每一条边作为多层感知机MLP(MultilayerPerceptron)的输入，经过ReLU(线性整流函数，Rectified Linear Unit)激活函数后输出D _out维特征；

将所有边的特征通过最大池化层，得到对应于顶点

的特征

表示D _out维实数向量；

输入特征矩阵

表示N×D _in维实数矩阵，输出特征矩阵

表示N×D _out维实数矩阵；

其中，第一个EdgeConv层输出的特征维数为64，第二个EdgeConv层输出的特征维数为64，第三个EdgeConv层输出的特征维数为128，第四个EdgeConv层输出的特征维数为256；将四个EdgeConv层提取的特征拼接得到的N×512维特征作为Conv的输入，过ReLU激活函数后输出特征矩阵F _i∈R ^N×1024,R ^N×1024表示N×1024维实数矩阵。

所述步骤S412具体为：

和

表示N _iL×1024维实数矩阵，

表示N _iR×1024维实数矩阵；

P _i与P _i+1的匹配点具体为：输入为

输出为

Φ _iR＝F _iR+φ(F _iR，F _(i+1)L)，

和

Φ _(i+1)L＝F _(i+1)L+φ(F _(i+1)L，F _iR)，

参考图6、图7(a)及7(b)，Transformer为基于encoder-decoder(编码器-解码器)结构的模型：

Encoder(编码器)包括6个编码器，6个编码器依次叠加，每个编码器包含一个Multi-headattention(多头注意力)子层和一个feed-forward(前馈)子层，每个子层之间有残差连接；每个编码器输出矩阵作为下一个编码器的输入；第一个编码器的输入为F _iR，最后一个编码器的输出为

的编码矩阵；Multi-headattention子层，将8次self-attention(自注意力)计算得到的矩阵进行加权求和；

Decoder(解码器)包括6个解码器，6个解码器依次叠加，每个解码器包含两个Multi-headattention子层和一个feed-forward子层，每个子层之间有残差连接；每个解码器输出矩阵作为下一个解码器的输入；第一个解码器的输入为F _(i+1)L，最后一个编码器的输出为

的解码矩阵；第一个Multi-headattention将8次self-attention计算得到的矩阵进行加权求和，第二个Multi-headattention将8次encoder-decoder-attention(编码器-解码器注意力)计算得到的矩阵进行加权求和；encoder-decoder-attention用第一个子层的输出创建Queries矩阵(查询矩阵)，用encoder的输出创建Keys(关键字)和Values(值)矩阵；

Φ _iR(j)表示Φ _iR的第j行，即对应于点p _ij的特征向量；T表示矩阵转置，softmax是一种概率归一化处理函数；

所述步骤S413具体为：

计算

与匹配点对C _ij之间的相关性度量sim _ij：

其中

表示上一次迭代得到的第i个姿态的转置，||.|| _F表示Frobenius(一种矩阵范数)范数，σ是一个正实数，防止sim _ij趋向于无穷大；

式中，w _ij表示匹配点权重，

表示变量为sim _ij的指数函数。

所述步骤S414具体为：

其中，

构造矩阵

将式(7)表示成

令

T＝[T ₁,...,T _I] ^T，将式(8)转化成矩阵函数表达式:

为式(9)添加约束条件T ₁＝T ⁰，T ⁰是任意的满足R ⁰∈SO(3)的姿态；为了简化网络结构，取T ⁰为标准3D模型的坐标系；由于T＝[T ₁,...,T _I] ^T，构造矩阵A＝[I ₄ 0 _4×4(I-1)]，I ₄表示4×4的单位矩阵，0 _4×4(I-1)表示4×4(I-1)的零矩阵；

约束条件1表示成：

T ₁＝AT＝T ⁰ (10)

同时，旋转矩阵

约束条件2表示成：

式中，I表示单位矩阵，det表示行列式；

令b＝[I ₃ 0 _3×1]，则

R _i＝bT _i, (12)

令R＝[R ₁...R _i...R _I]，则

R＝BT, (13)

其中，

令

将式(9)的等式约束最优问题表示成：

式中，s.t.表示约束条件；

取上一次迭代的结果，Y表示拉格朗日乘子；

采用交替乘子法求解上述问题的最优解，得到如下迭代关系

关于

的子问题可以用下式求解：

SVD(SingularValue Decomposition，奇异值分解)表示奇异值分解；

则有

上式中λ是人为设定的参数(取0.001)，μ作为该层神经网络的可调参数，

取上一次迭代的结果。

所述步骤S415具体为：

p' _ij＝p _ijT _i (21)

将所有转换后的点云融合成一个完整的点云模型P'；

对P'进行均匀采样：记采样点集为S ₂，S ₂初始化为空集；随机采样一个种子点seed(种子点)，放入S ₂；在集合P'-S ₂里，找一个距离集合S ₂最远的点；最终从P'中采样m个点作为样本

所述步骤S416具体为：

逐一将下采样的点云

输入到共享权值的高维特征提取层，得到对应点云P _i的特征矩阵F _i∈R ^N×1024；将相邻视角的特征矩阵F _iR和F _(i+1)L逐对输入到匹配点对生成网络，得到点云P _i的匹配点集CP _i；将所有视角的点及其匹配点作为输入，利用联合配准求姿态的闭式解T。将所有点云通过求得的T转换到统一坐标系下，融合成点云模型P'；从P'采样m个点作为生成的样本

设p' _ij∈P'服从概率分布P _g。保持判别器f _ω的网络参数不变，构造生成器的loss为：

所述步骤S3具体包括入下步骤：

步骤S32、随机采样一个种子点seed，放入S ₁；

步骤S34、重复步骤S33，直到采样出m个样本，记为标准样本

优选地，所述步骤S42具体包括如下步骤：

步骤S421、逐一将下采样的点云

步骤S425、从P'采样m个点作为生成样本

步骤S426、调节生成器网络参数：

θ←θ-α·RMSProp(θ,g _θ) (24)

所述步骤S51具体为：

表示真实分布P _r的期望，

表示生成分布P _g；

所述步骤S52具体包括如下步骤：

输入到判别器网络f _ω中；

步骤S532、逐一将从标准模型均匀采样的m个点的标准样本

输入到判别器网络f _ω中；

步骤S533、调节判别器网络参数，对生成样本

与标准样本

进行判别；判别器网络参数具体为：

ω←ω+α·RMSProp(ω,g _ω) (26)

ω←clip(ω,-c,c) (27)

本发明能够取得下列有益效果：

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明所述原理的前提下，还可以作出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

一种基于WGAN的无监督多视角三维点云联合配准方法，其特征在于，包括如下步骤：

步骤S1、获取不同视角的点云：从不同视角进行扫描，扫描后获得I个点云P＝{P ₁,...,P _i,...,P _I}，
表示第i个点云；N _i表示第i个点云所包含的点的个数，P _ij表示第i个点云中的第j个点，p _n＝R ³，R表示实数，R ³表示笛卡尔三维坐标系；

步骤S2、对所有视角的点云进行下采样：点云P _i为分别处理与前后相邻两个视角的关系，存在两个相邻的点云，处理不同相邻点云时，共进行两次点云下采样，即对于每个点云，分别对前后相邻视角点云下采样：

对于P _i-1，对P _i和P _i-1进行随机采样，采样数量N _iL为：

N _iL＝min{N _i-1/s,N _i/s} (1)

对于P _i+1，对P _i和P _i+1进行随机采样，采样数量N _iR为：

N _iR＝min{N _i/s,N _i+1/s} (2)

式中，N _i-1表示第i-1个点云所包含的点的个数，N _i表示第i个点云所包含的点的个数，N _i+1表示第i+1个点云所包含的点的个数，s为人为设定的采样参数；

步骤S3、从标准模型中采样；从标准模型点集P ^s中采样出m个样本，记为标准样本

步骤S4、对多视角点云联合配准WGAN的生成器网络进行训练：将各个视角点云逐一转换到统一的坐标系下，将所有转换后的点云融合成一个完整的点云模型P'，并对P'进行均匀采样，从P'采样m个点作为生成样本
具体包括如下步骤：

步骤S41、设计生成器；

步骤S42、生成器网络进行训练；

步骤S5、对多视角点云联合配准WGAN的判别器网络进行训练：对生成样本
与标准样本
进行判别；具体包括如下步骤：

步骤S51、设计判别器；

步骤S52、判别器网络进行训练；

步骤6：判断是否终止训练：设定生成器和判别器训练的次数均为M次，若达到M次则终止训练，若未达到M次则回到步骤S4。
根据权利要求1所述的一种基于WGAN的无监督多视角三维点云联合配准方法，其特征在于，所述步骤S41具体包括如下步骤：

步骤S411、构建特征向量转换网络层，对点云
表示N _i×3矩阵，逐点生成高维特征向量F _i∈R ^N×D，D表示每个点提取的D维的特征向量，R ^N×D表示N×D矩阵；

步骤S412、构建匹配点计算网络层，逐点计算匹配点：提取相邻点云P _i-1与P _i+1对应的经过高维特征向量转换的特征矩阵F _(i-1)R和F _(i+1)L；分别计算P _i与P _i-1及P _i+1的匹配概率，分别得到匹配点对集合

步骤S413、滤除基于注意力机制的外点：计算上一次迭代得到的第i个姿态的转置与匹配点对C _ij之间的相关性度量sim _ij，j表示索引；

步骤S414、联合配准求姿态的闭式解T：根据当前匹配点对及其权重计算点云的相对姿态及约束条件，获得点云的相对姿态优化唯一最优解，即最优姿态；

步骤S415、生成点云模型并进行采样：根据最优姿态，将各个视角点云逐一转换到统一的坐标系下，融合成一个完整的点云模型P'，并对P'进行均匀采样。
根据权利要求2所述的一种基于WGAN的无监督多视角三维点云联合配准方法，其特征在于，所述步骤S411具体为：

网络由4个EdgeConv层和一个卷积层Conv构成，用每一个特征
作为顶点，对每个点计算K-最近邻KNN，连接其K近邻作为边，构建图结构，D _in表示输入特征向量的维数，
表示D _in维实数向量；

对于顶点
其与某个邻近点
所构成的边为

将每一条边作为多层感知机MLP的输入，经过ReLU激活函数后输出D _out维特征；

将所有边的特征通过最大池化层，得到对应于顶点
的特征
表示D _out维实数向量；

输入特征矩阵
表示N×D _in维实数矩阵，输出特征矩阵
表示N×D _out维实数矩阵；

其中，第一个EdgeConv层输出的特征维数为64，第二个EdgeConv层输出的特征维数为64，第三个EdgeConv层输出的特征维数为128，第四个EdgeConv层输出的特征维数为256；将四个EdgeConv层提取的特征拼接得到的N×512维特征作为Conv的输入，过ReLU激活函数后输出特征矩阵F _i∈RN×1024，R ^N×1024表示N×1024维实数矩阵。
根据权利要求3所述的一种基于WGAN的无监督多视角三维点云联合配准方法，其特征在于，所述步骤S412具体为：

P _i为分别处理与前后相邻两个视角的关系，进行了两次点云下采样，对应地经过高维特征层提取两个不同的特征矩阵，即
和
表示N _iL×1024维实数矩阵，
表示N _iR×1024维实数矩阵；

P _i与P _i+1的匹配点具体为：输入为
输出为

和

其中，φ(F _iR,F _(i+1)L)为Transformer将特征F _iR通过学习调整到一个“条件”F _(i+1)L的残差变化量，φ(F _(i+)L,F _iR)为Transformer将特征F _(i+1)L通过学习调整到一个“条件”F _iR的残差变化量；

对于点p _ij∈P _i，P _i+1的每一个点与p _ij成为匹配点的概率所构成矩阵为

Φ _iR(j)表示Φ _iR的第j行，即对应于点p _ij的特征向量,T表示矩阵转置，soft max是一种概率归一化处理函数；

根据上述匹配点概率，为p _ij∈P _i生成一个平均匹配点cp _ij：

点云P _i在P _i+1中得到的匹配点集合记为CP _i，匹配点对(p _ij,cp _ij)记作C _ij，匹配点对构成集合C _iR；

P _i与P _i-1的匹配点均可按照上述过程实现，得到匹配点对集合C _iL；C _iR与C _iL构成匹配点对构成集合C _i；每对相邻视角寻找匹配点的过程均可按照上述过程实现。
根据权利要求4所述的一种基于WGAN的无监督多视角三维点云联合配准方法，其特征在于，所述步骤S413具体为：

计算
与匹配点对C _ij之间的相关性度量sim _ij：

其中
表示上一次迭代得到的第i个姿态的转置，||.|| _F表示Frobenius范数，σ是一个正实数，防止sim _ij趋向于无穷大；

引入soft max函数对sim _ij进行归一化，使所有匹配点对权重之和为1：

式中，w _ij表示匹配点权重，
表示变量为sim _ij的指数函数。
根据权利要求2所述的一种基于WGAN的无监督多视角三维点云联合配准方法，其特征在于，所述步骤S414具体为：

根据当前匹配点对及其权重计算点云的相对姿态，所有匹配点对欧式距离之和d为：

其中，
为第i个视角姿态转换矩阵的转置，R _i∈SO(3)为旋转矩阵的转置，t _i∈R ^1×3为平移量的转置，R ^l×3表示L×3维实数矩阵；

构造矩阵
将式(7)表示成

令
T＝[T ₁,...,T _I] ^T，将式(8)转化成矩阵函数表达式:

所求得的姿态T＝[T ₁,...,T _I] ^T需要一个固定的初始坐标系，以保证优化问题仅存在唯一的最优解；

为式(9)添加约束条件T ₁＝T ⁰，T ⁰是任意的满足R ⁰∈SO(3)的姿态；为了简化网络结构，取T ⁰为标准3D模型的坐标系；由于T＝[T ₁,...,T _I] ^T，构造矩阵A＝[I ₄ 0 _4×4(I-1)]，I ₄表示4×4的单位矩阵，0 _4×4(I-1)表示4×4(I-1)的零矩阵；

约束条件1表示成：

T ₁＝AT＝T ⁰  (10)

同时，旋转矩阵
约束条件2表示成：

式中，I表示单位矩阵，det表示行列式；

令b＝[I ₃ 0 _3×1]，则

R _i＝bT _i  (12)

令R＝[R ₁...R _i...R _I]，则

R＝BT  (13)

其中，

令
将式(9)的等式约束最优问题表示成：

AT＝T ⁰.  (14)

式中，s.t.表示约束条件；

采用拉格朗日乘子法处理等式约束问题，增广的拉格朗日函数为

式中，λ表示人为设定的参数，取0.001，μ作为该层神经网络的可调参数，
取上一次迭代的结果，Y表示拉格朗日乘子；

采用交替乘子法求解上述问题的最优解，得到如下迭代关系

关于
的子问题可以用下式求解：

SVD表示奇异值分解；

关于T的子问题是一个二次凸优化问题，令其导数为0求其最小值，即

则有
根据权利要求6所述的一种基于WGAN的无监督多视角三维点云联合配准方法，其特征在于，所述步骤S415具体为：

根据上个步骤求得的姿态T，将各个视角点云逐一转换到统一的坐标系下：

p′ _ij＝p _ijT _i (21)

将所有转换后的点云融合成一个完整的点云模型P'；

对P'进行均匀采样：记采样点集为S ₂，S ₂初始化为空集；随机采样一个种子点seed，放入S ₂；在集合P'-S ₂里，找一个距离集合S ₂最远的点；最终从P'中采样m个点作为样本

所述步骤S3具体包括入下步骤：

步骤S31、记标准模型点集为P ^s，采样点集为S ₁，S ₁初始化为空集；

步骤S32、随机采样一个种子点seed，放入S ₁；

步骤S33、在集合P ^s-S ₁里，找一个距离集合S ₁最远的点，其中点到集合S ₁的距离为该点到S ₁最小的点距；

步骤S34、重复步骤S33，直到采样出m个样本，记为标准样本
根据权利要求7所述的一种基于WGAN的无监督多视角三维点云联合配准方法，其特征在于，所述步骤S42具体包括如下步骤：

步骤S421、逐一将下采样的点云
输入到共享权值的高维特征提取层，得到对应点云P _i的特征矩阵F _i∈R ^N×1024；

步骤S422、将相邻视角的特征矩阵F _iR和F _(i+1)L逐对输入到匹配点对生成网络，得到点云P _i的匹配点集CP _i；

步骤S423、将所有视角的点及其匹配点作为输入，利用联合配准求姿态的闭式解T；

步骤S424、将所有点云通过求得的T转换到统一坐标系下，融合成点云模型P'；

步骤S425、从P'采样m个点作为生成样本

步骤S426、调节生成器网络参数：

θ←θ-α·RMSProp(θ,g _θ) (23)

g _θ表示关于θ的梯度，θ表示生成器的网络参数，f _ω表示判别器，ω表示判别器的网络参数，v ⁽ⁱ⁾表示第i个生成样本，α表示步长，RMSProp表示一种基于动量的优化算法。
根据权利要求8所述的一种基于WGAN的无监督多视角三维点云联合配准方法，其特征在于，所述步骤S51具体为：

WGAN网络通过训练含参数ω、最后一层不是非线性激活层的判别器网络f _ω，在ω不超过某个范围的条件下，使得L尽可能最大，L表达式如下：

式中，L近似真实分布P _r和生成分布P _g之间的Wasserstein距离，即用Wasserstein距离定量的衡量两个分布的差异度，p表示样本，
表示真实分布P _r的期望，
表示生成分布P _g；

判别器采用全连接实现的多层感知机，结构为四层全连接，伴有3个ReLU激活函数；输入为点的坐标，即输入维度为3，输出维度为1。
根据权利要求9所述的一种基于WGAN的无监督多视角三维点云联合配准方法，其特征在于，所述步骤S52具体包括如下步骤：

步骤S521、逐一将从生成点云模型均匀采样的m个点的生成样本
输入到判别器网络f _ω中；

步骤S532、逐一将从标准模型均匀采样的m个点的标准样本
输入到判别器网络f _ω中；

步骤S533、调节判别器网络参数，对生成样本
与标准样本
进行判别；判别器网络参数具体为：

ω←ω+α·RMSProp(ω,g _ω) (26)

ω←clip(ω,-c,c) (27)

g _ω表示关于ω的梯度，u ⁽ⁱ⁾表示第i个标准样本，f _ω表示判别器，ω表示判别器的网络参数，RMSProp表示一种基于动量的优化算法，clip()表示参数ω的绝对值截断到不超过一个固定的常数c。