CN114911967A

CN114911967A - 一种基于自适应域增强的三维模型草图检索方法

Info

Publication number: CN114911967A
Application number: CN202210574993.8A
Authority: CN
Inventors: 白静; 白少进
Original assignee: North Minzu University
Current assignee: North Minzu University
Priority date: 2022-05-25
Filing date: 2022-05-25
Publication date: 2022-08-16
Anticipated expiration: 2042-05-25
Also published as: CN114911967B

Abstract

本发明公开了一种基于自适应域增强的三维模型草图检索方法，可有效嵌入到现有的跨域检索框架中，在特征提取过程中捕获跨域互信息增强的全局特征，在域内通过双线性池化学习增强局部判别特征，并且通过对抗学习完成自适应的特征融合，使网络自适应地关注全局特征和局部特征中更具区分性的表示特征，进一步适应输入草图的多样性，提高检索性能。

Description

一种基于自适应域增强的三维模型草图检索方法

技术领域

本发明涉及计算机图形学、计算机视觉与智能识别的技术领域，尤其是指一种基于自适应域增强的三维模型草图检索方法。

背景技术

跨模态检索是计算机视觉中一个长期存在且具有挑战性的问题，应用范围非常广泛，例如文本图像检索、图像视频检索、文本视频检索等，其中由于近年来触屏设备的普及3D建模技术的成熟，草图三维模型逐渐成为了新的研究热点。目前，基于深度学习的三维模型方法性能普遍优于传统手工设计特征的方法，此类方法大多使用两个独立的网络分别提取草图域和三维模型域的特征表示，然后构建一个公共的嵌入空间实现跨域对齐。然而，在基于草图的三维模型检索任务中，三维模型精准且信息丰富的，而草图是粗略和抽象的，两者之间具有巨大的域间差异，仅在特征嵌入阶段使用损失函数忽略了域间互信息对彼此域特征的优化作用，约束能力有限。此外，由于输入草图的主观性和抽象性，其判别性表示可能在于整体轮廓或局部细节中，大部分方法只关注了全局特征的提取而忽略了局部判别特征的学习。

发明内容

本发明的目的在于克服现有技术缺点与不足，针对目前基于草图的三维模型检索任务，提出了一种基于自适应域增强的三维模型草图检索方法，在特征提取过程中捕获跨域互信息增强的全局特征，在域内通过双线性池化学习增强局部判别特征，并且通过对抗学习完成自适应的特征融合，使网络自适应地关注全局特征和局部特征中更具区分性的表示特征，进一步适应输入草图的多样性，提高检索性能。

为实现上述目的，本发明所提供的技术方案如下：一种基于自适应域增强的三维模型草图检索方法，包括以下步骤：

S1、基础网络从草图和三维模型多视图图像中分别提取出对应域的语义特征，产生初始特征向量x¹和x²，其中上标1和2分别表示来自于草图域和三维模型域；对特征向量x¹和x²进行拼接操作，获得混合特征向量x^b；

S2、对混合特征向量x^b同时进行三个卷积操作，构造出三个域间嵌入特征空间ψ(x^b)、ξ(x^b)、ζ(x^b)；然后对特征空间ψ(x^b)进行平均池化操作，对特征空间ξ(x^b)进行最大池化操作；将特征空间ψ(x^b)、ξ(x^b)经过池化操作后得到的显著特征进行矩阵计算，求出混合特征相关性矩阵B，B表示了域间特征的相关程度；

S3、将混合特征相关性矩阵B和跨域特征空间ζ(x^b)相乘得到的域间相关性特征与混合特征向量x^b相加，获得细化的混合特征向量o(x^b)，o(x^b)表示了跨域特征间的相关性；

S4、通过全局池化操作与一个非线性映射层φ(·)对细化的混合特征向量o(x^b)进行压缩，然后通过激活函数生成域间增强注意力权重a^c，a^c表示了跨域特征的域间增强注意力权重；

S5、将初始特征向量x¹和x²通过平均池化操作获得初始特征f^g,1和f^g,2；将域间增强注意力权重a^c与初始特征f^g,1和f^g,2进行点乘，并通过一层全连接层进行降维压缩，获得初始判别特征f^a,1和f^a,2；

S6、基础网络从草图和三维模型多视图图像中分别提取出对应域的语义特征，产生三个初始特征向量

其中m∈{1,2}表示特征来自于草图域和三维模型域；然后同时进行三个卷积操作，构造出三个域内嵌入特征空间

和

使用这三个不同的嵌入特征空间代替单一的特征空间，使网络更好地动态学习域内特征之间的相关性；

S7、通过元素乘法集成扩展特征以捕获域内局部特征的交互，之后通过平均池化操作高维特征压缩为紧凑特征Δ^1,m、Δ^2,m、Δ^3,m；并通过线性映射生成域内增强的局部判别性特征f^d,m，即f^d,1和f^d,2；

S8、通过构造多层线性映射将f^g,1、f^g,2、f^d,1和f^d,2进行对抗学习，使网络能够根据不同的输入，自适应地从全局特征和局部特征中学习输入图像的判别性表示；

S9、为了与初始判别特征f^a,1和f^a,2区别表示，定义经过对抗学习后网络获得的最终判别特征为

和

在此基础上构建联合损失函数，减小了跨域特征间的巨大差异性，提高了检索性能。

进一步，在步骤S1中，基础网络是由卷积神经网络构成，对输入到网络的草图图像和三维模型多视图图像进行特征提取，基础网络将输入图像提取特征为w×h×c的特征向量x¹和x²，其中w代表特征向量的宽度，h代表特征向量的高度，c代表特征向量的通道数；对特征向量x¹和x²进行Concat拼接操作，获得混合特征向量x^b，公式如下：

x^b＝f_concat(x¹,x²)∈R^w×h×2c

式中，R代表一个集合。

进一步，在步骤S2中，对特征向量x^b进行的三个卷积操作，均为1×1×2c的卷积，获得三个嵌入特征空间，其中，ψ(x^b)∈R^w×h×2c，ξ(x^b)∈R^w×h×2c和ζ(x^b)∈R^w×h×2c，式中，R代表一个集合，w代表特征向量的宽度，h代表特征向量的高度，c代表特征向量的通道数；对特征空间ψ(x^b)进行平均池化，对特征空间ξ(x^b)进行最大池化，由此得到两个大小为1×2c的全局特征矩阵A、M，公式如下：

平均池化：A＝f_avg-pooling(ψ(x^b))∈R^1×2c

最大池化：M＝f_max-pooling(ξ(x^b))∈R^1×2c

将特征空间ψ(x^b)平均池化得到的全局特征矩阵，与ξ(x^b)最大池化得到全局特征的转置矩阵做矩阵相乘运算，最终得到一个2c×2c大小的特征相关矩阵B，B表示了域间特征的相关程度，公式如下：

B＝AM^T,B∈R^2c×2c。

进一步，在步骤S3中，域间相关性特征由混合特征相关性矩阵B和跨域特征空间ζ(x^b)相乘得到，再与混合特征向量x^b相加，得到细化的混合特征向量o(x^b)，其中O(x^b)的公式如下：

O(x^b)＝θ(ζ(x^b)B)+x^b,o(x^b)∈R^n×2c,θ∈[0,1]

式中，R代表一个集合，c代表特征向量的通道数，n＝h×w表示特征图的尺寸，w代表特征向量的宽度，h代表特征向量的高度，θ是可训练的参数，θ的作用有两个，首先，当θ是初始化为0时，能够使用任何预训练好的模型且不破坏其最初的网络结构；其次，通过学习，使域间相关性特征和混合特征向量x^b的权重能够进行自动调整。

进一步，在步骤S4中，通过全局池化操作与一个非线性映射层φ(·)对细化的混合特征向量o(x^b)进行压缩，然后通过Sigmoid函数生成域间增强注意力权重a^c，其中φ(·)的维度为[2c,c]，c代表特征向量的通道数，a^c公式为下：

a^c＝f_sigmoid[φ(f_avg-pooling(o(x^b)))],a^c∈R^1×c

式中，R代表一个集合。

进一步，在步骤S5中，通过平均池化操作作用在初始特征向量x¹和x²上获得初始全局特征f^g,1和f^g,2，公式如下：

f^g,1＝f_avg-pooling(x¹)

f^g,2＝f_avg-pooling(x²)

将步骤S4中得到的域间增强注意力权重a^c与初始特征f^g,1和f^g,2进行点乘，并通过一层全连接层[2c,c]进行降维，c代表特征向量的通道数，获得初始判别特征f^a,1和f^a,2，公式如下：

f^a,1＝f_fc(f_{dot_product}(a^c,f^g,1))

f^a,2＝f_fc(f_{dot_product}(a^c,f^g,2))

式中，f_fc代表一个全连接层，f_{dot_product}代表点乘操作。

进一步，在步骤S6中，从基础网络中分别提取出草图域和三维模型域的整体语义特征，用

表示，其中m∈{1,2}表示特征来自于草图域和三维模型域；分别对草图域和三维模型域的整体语义特征进行三个卷积操作，均为1×1×c的卷积，c代表特征向量的通道数，获得对应的三个域内嵌入特征空间，分别用

和

表示，使用这三个不同的域内嵌入特征空间代替单一的特征空间，使网络更好地动态学习域内特征间的相关性。

进一步，在步骤S7中，采用矩阵乘法操作对域内嵌入特征空间进行相乘，获得不同层级间的细粒度特征空间，并使用全局平均池化进行压缩获得紧凑特征Δ^1,m、Δ^2,m、Δ^3,m，突出域内局部判别特征，定义如下：

式中，R代表一个集合，c代表特征向量的通道数；

再通过Concat操作将不同域间的3个紧凑特征拼接起来，以此获得完整的细粒度表示，然后通过1×1×c的卷积进行线性映射，生成域内增强的局部判别性特征f^d,m：

f^d,m＝f_1×1(f_concat(Δ^1,m,Δ^2,m,Δ^3,m))∈R^1×c

式中，f_1×1代表1×1×c的卷积操作。

进一步，在步骤S8中，构造3个线性映射层组成判别器，用于预测输入特征的来源，即特征来自于初始特征f^g,1、f^g,2或局部判别性特征f^d,1、f^d,2；引入了梯度反转层R_γ(·)，它在前向传播过程中应用恒等函数R_γ(f)＝f，而反向传播过程中将梯度乘以元参数-γ，从而反转流经CNN的梯度；为了使判别器从全局特征和局部判别性特征中提取共享的判别性表示特征，选择二值交叉熵作为损失函数，对于每一个特征损失l_t定义如下：

式中，f表示送入判别器中的特征，f_D表示构建的3个线性映射层组成判别器，

表示梯度反转操作，t表示0和1代表全局特征和局部判别特征，超参数γ_D从0到1；则一个批次内的对抗损失L_A定义如下：

式中，i表示每个批次N中的样本索引，f_i ^g,1表示来自草图域的初始全局特征，f_i ^g,2表示来自三维模型域的初始全局特征，f_i ^d,1表示来自草图域的局部判别性特征，f_i ^d,2表示来自三维模型域的局部判别性特征，l₀表示特征损失l_t中t＝0，l₁表示特征损失l_t中t＝1。

进一步，在步骤S9中，对于加入了对抗学习后的最终特征

和

分别加入交叉熵损失和三元组中心损失构建联合损失函数，提高检索性能；联合损失函数L定义为：

L＝L_A+L_C+L_T

式中，L_A代表一个批次内的对抗损失，L_C代表交叉熵损失，L_T代表三元组中心损失；

交叉熵损失L_C定义如下：

式中，i表示每个批次N中的样本索引，其中对于输入特征

和

表示每个批次中第i个样本分类正确的概率，

表示预测分类概率，y_j表示第i个样本的预测标签，y_i表示第i个样本的真实标签，p_i表示一个常数，如果y_j＝y_i则p_i＝1，否则p_i＝0；

三元组中心损失L_T定义如下：

式中，D(·)表示欧式距离，

表示类别y_i的中心，j表示样本i与对应的最近的负样本类别，δ_j表示类别y_j的中心，τ表示边界阈值，通过加入三元组中心损失，使得样本i与对应的类别中心

的距离和最近的负样本类别中心δ_j的距离间总保持一个阈值τ。

本发明与现有技术相比，具有如下优点与有益效果：

1、本发明可以适用于其它的跨域检索框架中，提高检索性能。

2、本发明可以捕捉域间同类别样本中的互信息，可以增强跨域特征间的相似性。

3、本发明可以关注局部细节区域，捕捉局部显著性信息，增强域内显著性特征。

4、本发明可以自适应地完成全局特征与局部显著性特征的融合，迫使网络学习到判别性特征，提高检索效果。

附图说明

图1为卷积神经网络中加入了本发明方法的架构图。

图2为域间特征增强架构图。

图3为域内特征增强架构图。

图4为本发明方法与其它方法在SHREC2013数据集上的精度比较图。

图5为本发明方法与其它方法在SHREC2013数据集上的P-R曲线图。

图6为本发明方法与其它方法在SHREC2014数据集上的精度比较图。

图7为本发明方法与其它方法在SHREC2014数据集上的P-R曲线图。

图8为本发明方法在SHREC2013数据集上一些检索结果图。

具体实施方式

下面结合具体实施例对本发明作进一步说明。

参见图1至图3所示，本实施例提供了一种基于自适应域增强的三维模型草图检索方法，可以适应于其它跨域检索任务中，提升检索效果，具体包括以下步骤：

1)基础网络从草图域和三维模型域的图像中提取特征，产生维度为w×h×c特征向量x¹和x²，其中上标1和2分别表示来自于草图域和三维模型域，w代表特征向量的宽度，h代表特征向量的高度，c代表特征向量的通道数，基础网络是由卷积神经网络构成，对输入到网络的草图图像和三维模型多视图图像进行特征提取；在图2中，对特征向量x¹和x²进行Concat拼接操作，获得混合特征向量x^b，公式如下：

x^b＝f_concat(x¹,x²)∈R^w×h×2c

式中，R代表一个集合。

2)对混合特征向量x^b进行三个卷积操作，均为1×1×2c的卷积，获得三个域间嵌入特征空间，ψ(x^b)∈R^w×h×2c，ξ(x^b)∈R^w×h×2c和ζ(x^b)∈R^w×h×2c，使用三个不同的域间嵌入特征空间代替单一的特征空间，使网络更好的动态学习域间特征之间的相关性。对特征空间ψ(x^b)进行平均池化，对特征空间ξ(x^b)进行最大池化，由此得到两个大小为1×2c的全局特征矩阵A、M，公式如下：

平均池化：A＝f_avg-pooling(ψ(x^b))∈R^1×2c

最大池化：M＝f_max-pooling(ζ(x^b))∈R^1×2c

然后将特征空间ψ(x^b)平均池化得到的全局特征矩阵，与ξ(x^b)最大池化得到全局特征的转置矩阵做矩阵相乘运算，最终得到一个2c×2c大小的特征相关矩阵B，B表示了域间特征的相关程度，公式如下：

B＝AM^T,B∈R^2c×2c

3)域间相关性特征由混合特征相关性矩阵B和跨域特征空间ζ(x^b)相乘得到，再与混合特征向量x^b相加，得到细化的混合特征向量o(x^b)，其中o(x^b)的公式如下：

o(x^b)＝θ(ζ(x^b)B)+x^b,o(x^b)∈R^n×2c,θ∈[0,1]

其中，n＝h×w表示特征图的尺寸，θ是可训练的参数，θ的作用有两个，首先，当θ是初始化为0时，可使用任何预训练好的模型且不破坏其最初的网络结构；其次，通过学习，使域间相关性特征和混合特征向量x^b的权重可以进行自动调整。

4)通过全局池化操作与一个非线性映射层φ(·)对细化的混合特征向量o(x^b)进行压缩，然后通过Sigmoid函数生成域间增强注意力权重a^c，a^c表示了跨域特征的域间增强注意力权重，其中φ(·)的维度为[2c,c]，a^c公式为下：

a^c＝f_sigmoid[φ(f_avg-pooling(o(x^b)))],a^c∈R^1×c

5)通过平均池化操作作用在初始特征向量x¹和x²上获得初始全局特征f^g,1和f^g,2，公式如下：

f^g,1＝f_avg-pooling(x¹)

f^g,2＝f_avg-pooling(x²)

将域间增强注意力权重a^c与初始全局特征f^g,1和f^g,2进行点乘，并通过一层全连接层[2c,c]进行降维，获得初始判别特征f^a,1和f^a,2，公式如下：

f^a,1＝f_fc(f_{dot_product}(a^c,f^g,1))

f^a,2＝f_fc(f_{dot_product}(a^c,f^g,2))

式中，f_fc代表一个全连接层，f_{dot_product}代表点乘操作。

6)从草图和三维模型多视图图像中分别提取出对应域的语义特征

其中m∈{1,2}表示特征来自于草图域和三维模型域。在图3中，分别对草图域和三维模型域的整体语义特征进行三个卷积操作，均为1×1×c的卷积，获得对应的三个域内嵌入特征空间，分别用

和

7)采用矩阵乘法操作对域内嵌入特征空间进行相乘，获得不同层级间的细粒度特征空间，并使用全局平均池化进行压缩获得紧凑特征(Δ^1,m,Δ^2,m,Δ^3,m)，突出域内局部判别特征，公式如下：

然后通过Concat操作将不同域间的3个紧凑特征拼接起来，以此获得完整的细粒度表示，然后通过1×1×c的卷积进行线性映射，生成局部判别性特征f^d,m(即f^d,1和f^d,2)：

f^d,m＝f_1×1(f_concat(Δ^1,m,Δ^2,m,Δ^3,m))∈R^1×c

式中，f_1×1代表1×1×c的卷积操作。

8)构造3个线性映射层将f^g,m和f^d,m进行对抗学习，用于预测输入特征的来源，即特征来自于初始特征f^g,1、f^g,2或局部判别性特征f^d,1、f^d,2，使网络可以根据不同的输入，自适应的从全局特征和局部特征中学习输入图像的判别性表示；因此，我们引入了梯度反转层R_γ(·)，它在前向传播过程中应用恒等函数R_γ(f)＝f，而反向传播过程中将梯度乘以元参数-γ，从而反转流经CNN的梯度。并且选择二值交叉熵作为损失函数，对于每一个特征损失l_t定义如下：

9)为了与初始判别特征f^a,1和f^a,2区别表示，定义经过对抗学习后网络获得的最终判别特征为

和

在此基础上构建联合损失函数，减小了跨域特征间的巨大差异性，提高了检索性能。对于加入了对抗学习后的最终特征

和

分别加入交叉熵损失和三元组中心损失构建联合损失函数，提高检索性能。联合损失函数L定义为：

L＝L_A+L_C+L_T

交叉熵损失L_C定义如下：

式中，i表示每个批次N中的样本索引，其中对于输入特征

和

表示每个批次中第i个样本分类正确的概率，

三元组中心损失L_T定义如下：

式中，D(·)表示欧式距离，y_i表示第i个样本的真实标签，

图4为本发明方法与其它方法在SHREC2013数据集上的精度比较图，由图4可知，本发明方法(称为HDA²L)在评价指标NN、FT、ST、E、DCG和综合指标mAP分别取得了84.7％、86.0％、91.4％、43.2％、91.2％、88.4％，5项最优1项次优，表明了本发明方法在SHREC2013数据集检索性能达到了目前最优。图5为本发明方法与其它方法在SHREC2013数据集上的P-R曲线图，由图5可知，本发明方法(称为HDA²L)的P-R曲线与横纵坐标轴围成的面积在所有方法中最大，表明检索效果最优。图6为本发明方法与其它方法在SHREC2014数据集上的精度比较图，由图6可知，本发明方法(称为HDA²L)在评价指标NN、FT、ST、E、DCG和综合指标mAP分别取得了81.0％、82.6％、86.4％、41.8％、89.0％、83.4％，5项次优，表明了本发明方法在SHREC2014数据集检索性能仅次于目前的最优方法SUL，在所有方法中取得了次优的检索效果。图7为本发明方法与其它方法在SHREC2014数据集上的P-R曲线图，由图7可知，本发明方法(称为HDA²L)的P-R曲线与横纵坐标轴围成的面积在所有方法中仅次于SUL，即检索效果仅次于目前最优方法SUL。图8为本发明方法在SHREC2013数据集上一些检索结果图，对于左侧每个查询草图，右侧第一行为不加入本发明方法的检索结果，第二行为本发明方法的检索结果，椭圆形虚线圈起来的为检索错误结果。由图8可知，本发明方法的检索结果明显优于不加入本发明方法的检索结果，错误结果更少，检索效果更好。

实验配置：本文实验的硬件环境为Intel Core i7 2600k+Tesla V100 32GB+16GBRAM,软件环境为Windows 10x64+CUDA10.0+CuDNN 7.1+Pytorch1.1.0+Python3.6+Matlab。

数据集：本文试验所用数据集为SHREC2013和SHREC2014数据集。这些数据集包含数个不同类别的草图图片和三维模型。表1给出了本文选用数据集的基本信息。

表1本文选用数据集的基本信息

表2给出了对应的评价指标。

表2评价指标

因此，综上所述，我们可以看到，与其它方法相比，本文所提出的基于自适应域增强的三维模型草图检索方法，在两个大型公开数据集中取得了先进的结果，也可适用于其它跨域检索任务中。

以上所述实施例只为本发明之较佳实施例，并非以此限制本发明的实施范围，故凡依本发明之形状、原理所作的变化，均应涵盖在本发明的保护范围内。

Claims

1.一种基于自适应域增强的三维模型草图检索方法，其特征在于，包括以下步骤：

和

和

2.根据权利要求1所述的一种基于自适应域增强的三维模型草图检索方法，其特征在于：在步骤S1中，基础网络是由卷积神经网络构成，对输入到网络的草图图像和三维模型多视图图像进行特征提取，基础网络将输入图像提取特征为w×h×c的特征向量x¹和x²，其中w代表特征向量的宽度，h代表特征向量的高度，c代表特征向量的通道数；对特征向量x¹和x²进行Concat拼接操作，获得混合特征向量x^b，公式如下：

x^b＝f_concat(x¹,x²)∈R^w×h×2c

式中，R代表一个集合。

3.根据权利要求1所述的一种基于自适应域增强的三维模型草图检索方法，其特征在于：在步骤S2中，对特征向量x^b进行的三个卷积操作，均为1×1×2c的卷积，获得三个嵌入特征空间，其中，ψ(x^b)∈R^w×h×2c，ξ(x^b)∈R^w×h×2c和ζ(x^b)∈R^w×h×2c，式中，R代表一个集合，w代表特征向量的宽度，h代表特征向量的高度，c代表特征向量的通道数；对特征空间ψ(x^b)进行平均池化，对特征空间ξ(x^b)进行最大池化，由此得到两个大小为1×2c的全局特征矩阵A、M，公式如下：

平均池化：A＝f_avg-pooling(ψ(x^b))∈R^1×2c

最大池化：M＝f_max-pooling(ξ(x^b))∈R^1×2c

B＝AM^T,B∈R^2c×2c。

4.根据权利要求1所述的一种基于自适应域增强的三维模型草图检索方法，其特征在于：在步骤S3中，域间相关性特征由混合特征相关性矩阵B和跨域特征空间ζ(x^b)相乘得到，再与混合特征向量x^b相加，得到细化的混合特征向量o(x^b)，其中o(x^b)的公式如下：

o(x^b)＝θ(ζ(x^b)B)+x^b,o(x^b)∈R^n×2c,θ∈[0,1]

5.根据权利要求1所述的一种基于自适应域增强的三维模型草图检索方法，其特征在于：在步骤S4中，通过全局池化操作与一个非线性映射层φ(·)对细化的混合特征向量o(x^b)进行压缩，然后通过Sigmoid函数生成域间增强注意力权重a^c，其中φ(·)的维度为[2c,c]，c代表特征向量的通道数，a^c公式为下：

a^c＝f_sigmoid[φ(f_avg-pooling(o(x^b)))],a^c∈R^1×c

式中，R代表一个集合。

6.根据权利要求1所述的一种基于自适应域增强的三维模型草图检索方法，其特征在于：在步骤S5中，通过平均池化操作作用在初始特征向量x¹和x²上获得初始全局特征f^g,1和f^g,2，公式如下：

f^g,1＝f_avg-pooling(x¹)

f^g,2＝f_avg-pooling(x²)

f^a,1＝f_fc(f_{dot_product}(a^c,f^g,1))

f^a,2＝f_fc(f_{dot_product}(a^c,f^g,2))

式中，f_fc代表一个全连接层，f_{dot_product}代表点乘操作。

7.根据权利要求1所述的一种基于自适应域增强的三维模型草图检索方法，其特征在于：在步骤S6中，从基础网络中分别提取出草图域和三维模型域的整体语义特征，用

和

8.根据权利要求1所述的一种基于自适应域增强的三维模型草图检索方法，其特征在于：在步骤S7中，采用矩阵乘法操作对域内嵌入特征空间进行相乘，获得不同层级间的细粒度特征空间，并使用全局平均池化进行压缩获得紧凑特征Δ^1,m、Δ^2,m、Δ^3,m，突出域内局部判别特征，定义如下：

式中，R代表一个集合，c代表特征向量的通道数；

f^d,m＝f_1×1(f_concat(Δ^1,m,Δ^2,m,Δ^3,m))∈R^1×c

式中，f_1×1代表1×1×c的卷积操作。

9.根据权利要求1所述的一种基于自适应域增强的三维模型草图检索方法，其特征在于：在步骤S8中，构造3个线性映射层组成判别器，用于预测输入特征的来源，即特征来自于初始特征f^g,1、f^g,2或局部判别性特征f^d,1、f^d,2；引入了梯度反转层R_γ(·)，它在前向传播过程中应用恒等函数R_γ(f)＝f，而反向传播过程中将梯度乘以元参数-γ，从而反转流经CNN的梯度；为了使判别器从全局特征和局部判别性特征中提取共享的判别性表示特征，选择二值交叉熵作为损失函数，对于每一个特征损失l_t定义如下：