CN112634281A

CN112634281A - 一种基于图卷积网络的网格分割方法

Info

Publication number: CN112634281A
Application number: CN202011455359.XA
Authority: CN
Inventors: 倪天宇; 郑友怡
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2020-12-10
Filing date: 2020-12-10
Publication date: 2021-04-09
Also published as: WO2022121545A1

Abstract

本发明提供了一种基于图卷积网络的网格分割方法，本发明中使用的方法以网格的面为基本单元，并在基于面的邻接关系形成的对偶图中进行图卷积运算，以获得对于面的特征表示。在特征获取阶段，本发明同时利用了静态与动态的边卷积，在利用实际邻接关系的同时也获得了从面之间潜在联系学习信息的能力。除此之外，本发明还利用了实例分割中特征嵌入的思路对于特征进行了进一步的增强，最终利用增强后的特征对于网格的各部位进行分割。本发明在多个部位分割的数据集上都取得了较好的结果。

Description

一种基于图卷积网络的网格分割方法

技术领域

本发明属于计算机图形学以及计算机视觉领域，尤其涉及一种基于图卷积网络的网格部位分割方法。

背景技术

语义分割是计算机视觉中的关键问题之一，随着深度学习的发展，在二维图像领域利用神经网络进行语义分割得到了广泛的探索与研究。当这一问题扩展到三维网格时，由于它的不规则性，基于图像的操作往往不能直接适用。之前的方法往往将三维模型体素化或是用多视角的二维图像对于三维物体进行表示，然后对于二维图像中的方法进行应用。前者往往因为数据的稀疏性而增大了计算量，后者放弃了三维物体的原有结构，并且计算量仍较大。对于三维的网格数据，我们以面为节点将其转化到对偶空间之中，并基于该图利用图卷积神经网络进行特征的学习。

早期的图卷积神经网络往往需要静态的图结构，而最近的动态图卷积上的研究表明动态的边可以取得更好的效果。我们的方法同时利用了静态边卷积与动态边卷积对于特征进行学习，在利用原本的几何结构的同时也考虑了潜在的相似联系。

在实例分割领域，特征嵌入是一种较为常用的方法，其主要思路为获得一个同类别距离较近而不同类别距离较远的表示，然后利用这一表示获得最终的实例分割。我们的方法也参考了这一思路，并且利用了特征嵌入获得的表示进行最终的部位分割。

发明内容

本发明的提出了一种基于GCN网络的网格分割方法，将网格根据面的邻接关系形成图表示，从而通过图卷积以及特征嵌入实现有效的特征学习。同时在本发明中使用的图卷积同时使用了静态的边卷积与动态的边卷积，同时考虑了原本的几何结构与特征空间中的关系。并且本发明使用特征嵌入的方法，约束了特征在特征空间中的分布。

本发明是通过以下技术方案来实现的：

一种基于图卷积网络的网格分割方法，包括以下步骤：

步骤一：将网格模型变换到指定的面片数量，并进行标准化处理。

步骤二：将步骤一处理后的模型转换为图表示，并对每个面进行初步特征提取后输入到训练好的图卷积神经网络中，对网格中每个面属于的部位种类进行预测。其中，所述图卷积神经网络包括：

变换模块，用于使输入的初步特征的朝向相近。

图卷积模块，用于根据变换后的初步特征学习与实际空间中邻面以及特征空间中邻面有关的特征。

特征嵌入模块，用于根据图卷积模块获得的特征获取同类相近不同类距离较远的特征。

输出模块，用于根据图卷积层学到的特征以及特征嵌入的结果获得预测分割结果。

进一步地，所述步骤一通过以下子步骤来实现：

(1.1)对于输入模型，将其简化或细分到指定面片数量。

(1.2)对于变换后的模型，对其进行平移和缩放操作，使模型中所有顶点的均值为0，离原点的最大距离为1。

进一步地，所述变换模块由一层静态卷积层、一层最大池化层与若干全连接层组成，所述一层静态卷积层、一层最大池化层与若干全连接层用于预测一个旋转矩阵，并通过旋转矩阵对于输入的初步特征进行变换。

进一步地，所述图卷积模块包括静态卷积层、动态卷积层、全连接层和池化层，其中，静态卷积层、动态卷积层各层学到的特征连接并输入到全连接层进行总结并通过池化层得到总体特征。

进一步地，所述特征嵌入模块由全连接层组成。

进一步地，所述特征嵌入模块训练时利用三个损失函数对其约束，L_var约束同类特征相近，L_dist约束不同类别的特征较远，L_reg约束特征嵌入的范围。

进一步地，本发明中，静态卷积层、动态卷积层均采取边缘条件卷积(Edge-Conditioned Convolution)结构。

本发明的有益效果是：

本发明提出了一种基于图卷积神经网络的网格分割方法。与先前的基于多视角图像或基于体素的表示进行特征学习的基于学习的网格分割方法不同，本发明利用了三角网格本身的结构，然后在基于面的图表示中引入图卷积运算，并利用了特征嵌入的方法得到了进一步的表示。本发明利用了网格的自然结构进行表示，并且对于训练阶段和推断阶段都是轻量级的。在图卷积中，本发明同时使用了静态卷积与动态卷积，同时从原本我网格结构以及特征空间中的相似度学习信息。本发明在多个网格部位分割数据集上都取得了较好的效果。

附图说明

图1是本发明进行网格分割的过程示意图。

图2是本发明的网格分割效果图，其中相邻不同类别的分割用黑白区分。

具体实施方式

本发明的思路为：利用网格中面的邻接关系形成图，在这一图上利用图卷积神经网络以及特征嵌入学习特征，最终使用全连接层对于每个面获得属于各类别的得分，最终对于每个面属于的类别进行预测，具体包括如下步骤：

步骤一：将网格模型变换到指定的面片数量，并进行居中与缩放操作。

步骤二：将步骤一处理后的模型转换为图表示，并对于每个面进行初步的特征提取后输入到训练好的对应图卷积神经网络中，对于网格中每个面属于的部位种类进行预测。其中，所述图卷积神经网络由变换模块、图卷积模块、特征嵌入模块以及全连接层组成。

步骤一为预处理步骤，步骤二中的图卷积神经网络结构如图1所示。

对于一个输入的网格模型M＝{V,F}，其中V表示所有顶点，F表示所有面。对其进行特征提取后建立一个无向图G＝{Q,E,Φ}，对于每个f_i∈F，创建一个节点q_i∈Q，同时对于每对相邻面f_if_j创建一条无向边(q_i,q_j)∈E。Φ为每个节点的特征，对于f_i其对应的φ_i＝{c_i,n_i,v_i,a_i}，分别表示面f_i对应的质心坐标、法向、顶点坐标以及面积。

本发明使用的图卷积网络使用了多个卷积层，采用的是(Wang,Yue,et al."Dynamic graph cnn for learning on point clouds."Acm Transactions On Graphics(tog)38.5(2019):1-12.)中的基本结构。其中对于第l层的图G^l＝{Q^l,E^l,Φ^l}，节点特征按下式更新：

其中

为带有可学习参数θ的非线性函数。这一更新方式既考虑了全局特征φ_i，也考虑了反映相邻面之间关系的局部特征

在静态边卷积中边E^l为初始的面邻接关系，在动态边卷积中，考虑在特征空间中使用欧几里得距离作为度量，并将距离最近的k个面视为邻面。

变换模块组合了一次静态卷积、一次最大池化与若干全连接层，对于每个输入的特征图预测一个旋转矩阵，然后通过旋转矩阵对于初始的输入特征进行变换，以使后续进行处理的特征尽可能针对相近的朝向。

图卷积块由三层静态边卷积层与三层动态卷积层构成，其中动态卷积层选择特征空间中距离最近的10个面作为邻面，最终各层结果相连输入到池化层中得到一个总体的特征表示。

特征嵌入模块主要是基于图卷积学习到的特征，利用全连接层对于每个面预测其在特征空间中的表示s_i，以及与其对应类别在特征空间中所占大小有关的值σ_i。在训练过程中，对于特征嵌入模块的损失函数由下式给出：

L＝α*L_var+β*_dist+γ*L_reg

该损失函数由(De Brabandere,Bert,Davy Neven,and Luc Van Gool."SemanticInstance Segmentation with a Discriminative Loss Function."arXiv(2017):arXiv-1708.)提出。其中C为类别数量，N_c为c类中的面数量，R_c为c类中面的集合，u_c为c类中s_i的均值。δ_v和δ_d为阈值，分别设置为0.01和3，α,β,γ为上述各部分的权重，实际训练中设置为1、1、0.001。c_A、c_B是表示不同类别。在上述损失函数中L_var使当前嵌入与该类的均值接近，L_dist使不同类别的嵌入远离，而L_reg约束嵌入的范围。

在训练过程中，面i输出类别c的概率

其中

为该类别范围的均值。最终基于该概率以及真实类别计算一个交叉熵损失项。

在得到特征嵌入的结果后，最终的输出层以之前的图卷积层学到的特征以及特征嵌入的结果为输入，通过若干全连接层后得到最终的预测结果，并计算其交叉熵损失。其中除了最后一层均使用了leakyRELU作为激活函数以及批处理规范化。全连接层的主要作用在于对于之前获得的特征进行加权处理重新映射到类别空间中，即全连接层的输出为面片数×类别数的张量，所获得的最终输出进行softmax后即相当于各类别预测的概率。

其中，训练时使用的数据集可以通过如下方式获取：对于有标记模型简化到相近面片数(所有模型的面数与指定面数最接近)就可以得到可用于训练的数据集。

部分分割结果如图2所示，从图中可以看出，本发明在多种类别的模型上都有着很好的分割效果。

显然，上述实施例仅仅是为清楚地说明所作的举例，而并非对实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其他不同形式的变化或变动。这里无需也无法把所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明的保护范围。

Claims

1.一种基于图卷积网络的网格分割方法，其特征在于，包括以下步骤：

变换模块，用于使输入的初步特征的朝向相近。

2.根据权利要求1所述的一种基于图卷积网络的网格分割方法，其特征在于，所述步骤一通过以下子步骤来实现：

(1.1)对于输入模型，将其简化或细分到指定面片数量。

3.根据权利要求1所述的一种基于图卷积网络的网格分割方法，其特征在于，所述变换模块由一层静态卷积层、一层最大池化层与若干全连接层组成，所述一层静态卷积层、一层最大池化层与若干全连接层用于预测一个旋转矩阵，并通过旋转矩阵对于输入的初步特征进行变换。

4.根据权利要求1所述的一种基于图卷积网络的网格分割方法，其特征在于，所述图卷积模块包括静态卷积层、动态卷积层、全连接层和池化层，其中，静态卷积层、动态卷积层各层学到的特征连接并输入到全连接层进行总结并通过池化层得到总体特征。

5.根据权利要求1所述的一种基于图卷积网络的网格分割方法，其特征在于，所述特征嵌入模块由全连接层组成。

6.根据权利要求1所述的一种基于图卷积网络的网格分割方法，其特征在于，所述特征嵌入模块训练时利用三个损失函数对其约束，L_var约束同类特征相近，L_dist约束不同类别的特征较远，L_reg约束特征嵌入的范围。