CN113536003B

CN113536003B - 特征提取模型训练方法、图像检索方法、装置和设备

Info

Publication number: CN113536003B
Application number: CN202110638262.0A
Authority: CN
Inventors: 徐富荣; 王萌; 张伟; 程远; 褚崴
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2021-06-08
Filing date: 2021-06-08
Publication date: 2024-03-12
Anticipated expiration: 2041-06-08
Also published as: CN113536003A

Abstract

本说明书实施例公开了一种特征提取模型训练方法、图像检索方法、装置和设备，所述方法可以将包含多种类别的样本图像的批量样本图像输入目标特征提取模型，得到该批样本图像的原始特征；并对该批样本图像的原始特征进行选择性掩码，以掩去该批样本图像的原始特征中具有区分性的特征元素，得到该批样本图像的掩码特征；然后基于该批样本图像的掩码特征计算损失；最后基于该损失最小的策略优化所述目标特征提取模型的参数。

Description

特征提取模型训练方法、图像检索方法、装置和设备

技术领域

本文件涉及计算机技术领域，尤其涉及一种特征提取模型训练方法、图像检索方法、装置和设备。

背景技术

图像检索在计算机视觉识别领域中占有重要地位，例如，细粒度图像检索在人的身份识别和宠物的身份识别等领域被广泛应用。其中，细粒度图像检索是指同一类别下不同个体(或称对象)的图像检索，比如不同的人、猫、狗、花等的图像检索。

特征提取是图像检索中很重要的一环，特征提取结果的好坏直接影响检索的效果。当前的特征提取方案仅能捕获图像中明显的视觉线索，而忽略细微的视觉线索，这使得提取出的特征的检索效果不理想。

发明内容

本说明书实施例提供了一种特征提取模型训练方法、图像检索方法、装置和设备，以捕获图像中更多的细微的视觉线索，从而提升图像检索效果。

为解决上述技术问题，本说明书实施例是这样实现的：

第一方面，提出了一种特征提取模型训练方法，包括：

将批量样本图像输入目标特征提取模型，得到所述批量样本图像的原始特征，其中，所述批量样本图像中包含多种类别的样本图像；

对所述批量样本图像的原始特征进行选择性掩码，以掩去所述批量样本图像的原始特征中具有区分性的特征元素，得到所述批量样本图像的掩码特征；

基于所述批量样本图像的掩码特征计算损失；

基于所述损失最小的策略优化所述目标特征提取模型的参数，以得到优化后的所述目标特征提取模型。

第二方面，提出了一种图像检索方法，包括：

获取待检索图像；

将所述待检索图像输入目标特征提取模型，得到所述待检索图像的特征，其中，所述目标特征提取模型由第一方面所述的方法训练得到；

基于所述特征从预设图像库中检索与所述待检索图像相似的图像。

第三方面，提出了一种特征提取模型训练装置，包括：

原始特征提取模块，用于将批量样本图像输入目标特征提取模型，得到所述批量样本图像的原始特征，其中，所述批量样本图像中包含多种类别的样本图像；

特征选择掩码模块，对所述批量样本图像的原始特征进行选择性掩码，以掩去所述批量样本图像的原始特征中具有区分性的特征元素，得到所述批量样本图像的掩码特征；

损失计算模块，基于所述批量样本图像的掩码特征计算损失；

参数优化模块，基于所述损失最小的策略优化所述目标特征提取模型的参数，以得到优化后的所述目标特征提取模型。

第四方面，提出了一种图像检索装置，包括：

图像获取模块，获取待检索图像；

特征提取模块，将所述待检索图像输入目标特征提取模型，得到所述待检索图像的特征，其中，所述目标特征提取模型由第一方面所述的方法训练得到；

图像检索模块，基于所述特征从预设图像库中检索与所述待检索图像相似的图像。

第五方面，提出了一种电子设备，包括：

处理器；以及

被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器执行以下操作：

第六方面，提出了一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行以下操作：

第七方面，提出了一种电子设备，包括：

处理器；以及

获取待检索图像；

第八方面，提出了一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行以下操作：

获取待检索图像；

由以上本说明书实施例提供的至少一个技术方案，由于是基于掩去一批样本图像批量样本图像的原始特征中具有区分性的特征元素得到的掩码特征计算损失，并根据该损失最小的策略优化目标特征提取模型的参数，因此能够对区分性不好的特征元素不断进行迭代加强学习，最终增加利用目标特征提取模型提取的原始特征中区分性好的特征元素的数量，从而提高利用目标特征提取模型提取的特征的鲁棒性，所以能捕获图像中更多的细微的视觉线索，提升图像检索效果。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是本说明书一个实施例提供的一种特征提取模型训练方法的流程示意图。

图2是本说明书一个实施例提供的一种特征提取模型训练方法的原理示意图。

图3是本说明书一个实施例提供的对原始特征进行选择性掩码的原理示意图。

图4是本说明书一个实施例提供的一种特征提取模型训练方法的效果示意图。

图5是本说明书一个实施例提供的一种图像检索方法的流程示意图。

图6是本说明书一个实施例提供的一种电子设备的结构示意图。

图7是本说明书一个实施例提供的一种特征提取模型训练装置的结构示意图。

图8是本说明书另一实施例提供的一种图像检索装置的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本文件保护的范围。

本说明书实施例提供一种特征提取模型训练方法和装置，以及一种图像检索方法和装置。这些方法和装置可以由电子设备执行，或者由安装在电子设备中的软件或硬件设备执行。这里的电子设备包括但不限于终端设备或服务器，其中，终端设备包括但不限于：智能手机、个人电脑(personalcomputer，PC)、笔记本电脑、平板电脑、电子阅读器、网络电视、可穿戴设备等智能终端设备中的任一种；其中，服务器可以是保险公司的后台服务端设备，该服务器包括但不限于：单台服务器、服务器集群、云端服务器或云端服务器集群等。

在本说明书提供的实施例中，特征是原始数据的降维表示。例如，图像的特征是指图像数据的降维表示。

下面先对本说明书实施例提供的一种特征提取模型训练方法进行说明。

如图1所示，本说明书的一个实施例提供了一种特征提取模型训练方法，可以包括：

步骤102、将批量样本图像输入目标特征提取模型，得到所述批量样本图像的原始特征，其中，所述批量样本图像中包含多种类别的样本图像。

目标特征提取模型可以是任何能够进行图像特征提取的模型，例如，目标特征提取模型可以包括但不限于卷积神经网络(Convolutional Neural Networks,CNN)和变换器模型 (transformer)中的一种。

批量(abatch)样本图像可以是从训练集中获取的N张样本图像，N为正整数。该批样本图像中包含多种类别的样本图像，是指包含两种类别以上的样本图像，具体可以记为C 类，C为大于或等于2的整数，N＝C*K，其中，K为一种类别的样本图像的数量。在本说明书提供的实施例中，不同类别的样本图像，既可以是指同一大类别下的不同细分类别，比如“人”这一大类别下的不同个体，也可以是指不同的大类别，比如“人”与“动物”等。

样本图像的原始特征是指利用目标特征提取模型从样本图像中提取出的未经处理的特征，例如未经后续的选择性掩码的特征。

步骤104、对所述批量样本图像的原始特征进行选择性掩码，以掩去所述批量样本图像的原始特征中具有区分性的特征元素，得到所述批量样本图像的掩码特征。

一个样本图像的原始特征中的特征元素是否具有区分性，可以通过多种手段来判断，例如通过比对不同类别的样本图像的原始特征中该特征元素的差异程度是否满足预设要求 (差异是否达到预设标准)来判断，一般来说，如果差异程度满足预设要求，则说明具有区分性，反之，则没有区分性，下面举两个详细的例子来说明。

第一个例子，判断样本图像A的原始特征中某一特征元素是否具有区分性的方式可以包括：判断样本图像A的原始特征中该特征元素的值，与样本图像B的原始特征中该特征元素的值的差值是否满足预设要求(例如，差值是否超过预设门限值)，如果满足，则说明书样本图像A的原始特征中的该特征元素具有区分性，反之，则没有区分性，其中，样本图像A和样本图像B属于不同的类别。

第二个例子，判断样本图像A的原始特征中某一特征元素是否具有区分性的方式可以包括：判断样本图像A的原始特征中该特征元素的值，与另外多个样本图像的原始特征中该特征元素的值的差值的平均值是否满足预设要求(例如，平均值是否超过预设门限值)，如果满足，则说明书样本图像A的原始特征中的该特征元素具有区分性，反之，则没有区分性，其中，所述另外多个样本图像分别属于多种样本类别。

不难理解，掩去批量样本图像的原始特征中具有区分性的特征元素，意味着保留该批样本图像的原始特征中没有区分性的特征元素，这一方面可以使训练的好(学习的比较充分的)的特征元素停止训练，转而迭代加强训练不足的特征元素，从使训练的好的特征元素的数量增加，最终使从样本图像中提取的原始特征中尽可能多的元素具有好的区分性，进而提升原始特征的鲁棒性；另一方面，可以使该批样本图像中异类样本图像间的相似性增大，并使该批样本图像中同类样本图像间的相似性减小，从而使特征空间的学习变得更难，进而使模型参数的优化更彻底，最终提升原始特征的鲁棒性。

下文会通过详细的例子，说明对所述批量样本图像的原始特征进行选择性掩码，得到所述批量样本图像的掩码特征的具体过程，此处暂不赘述。

步骤106、基于所述批量样本图像的掩码特征计算损失。

步骤108、基于所述损失最小的策略优化所述目标特征提取模型的参数。

可以理解，步骤102至步骤108描述的过程代表一轮训练，在步骤108结束后继续返回执行步骤102以进行下一轮训练，如此反复迭代，直到目标特征提取模型收敛，即完成目标特征提取模型训练。判断目标特征提取模型是否收敛的手段为步骤106计算得到的损失是否达到预设的最小标准，若达到，则收敛，否则，未收敛，需要继续训练。

本说明书实施例提供的一种特征提取模型训练方法，由于是基于掩去批量样本图像的原始特征中具有区分性的特征元素得到的掩码特征计算损失，并根据该损失优化目标特征提取模型的参数，因此能够对区分性不好的特征元素不断进行迭代加强学习，最终增加利用目标特征提取模型提取的原始特征中区分性好的特征元素的数量，从而提高利用目标特征提取模型提取的特征的鲁棒性，所以能够捕获图像中更多的细微的视觉线索，提升图像检索效果。

可选地，在上述步骤104中，所述对所述批量样本图像的原始特征进行选择性掩码，得到所述批量样本图像的掩码特征，可以包括：先确定第一类样本图像的至少一个选择性特征掩码矩阵；然后将所述第一类样本图像的原始特征分别与所述至少一个选择性特征掩码矩阵进行点乘，得到对应数量的所述第一类样本图像的掩码特征。

其中，第一类样本图像为上多种(C种)类别的样本图像中的任一种；选择性特征掩码矩阵的维度与样本图像的原始特征的维度相同，且第一类样本图像的选择性特征掩码矩阵中目标位置元素的值，是根据第一类样本图像与第二类样本图像的原始特征中相应位置特征元素的值的差异程度确定的，所述差异程度越大，选择性特征掩码矩阵中目标位置元素的值越小，所述差异程度越小，选择性特征掩码矩阵中目标位置元素的值越大；第二类样本图像包括所述多种类别的样本图像中除所述第一类样本图像外的至少一种样本图像。

可以理解，由于第一类样本图像可以是上多种(C种)类别的样本图像中的任一种，因此，在对上述批量样本图像中各类别的样本图像分别执行一次上述确定掩码特征的步骤之后，即可得到上述批量样本图像的掩码特征。

还可以理解，由于第一类样本图像的选择性特征掩码矩阵中目标位置元素的值，是根据第一类样本图像与第二类样本图像的原始特征中相应位置特征元素的值的差异程度确定的，且所述差异程度与选择性特征掩码矩阵中目标位置元素的值负相关，即差异程度越大，选择性特征掩码矩阵中目标位置元素的值越小(如等于0)，差异程度越小，选择性特征掩码矩阵中目标位置元素的值越大(如等于1)，所以，将第一类样本图像的原始特征分别与所述至少一个选择性特征掩码矩阵进行点乘之后，便可以掩去第一类样本图像的原始特征中具有区分性的特征元素，同时保留第一类样本图像的原始特征中没有区分性的特征元素，从而得到第一类样本图像的掩码特征。

在上述基础上，进一步地，假设上述第二类型样本图像有多种，例如，假设上述批量样本图像中包含10种类别(C＝10)的样本图像，其中，第一类样本图像为这10种类别中的任一种，第二类样本图像是剩余9种类别中的至少两种，则上述确定第一类样本图像的至少一个选择性特征掩码矩阵，可以包括：

步骤1、分别基于第一类样本图像与所述至少两种第二类样本图像的原始特征中目标位置特征元素的值的差异程度，确定所述第一类样本图像的多个第一选择性特征掩码矩阵中相应位置元素的值，得到多个第一选择性特征掩码矩阵，其中，一种第二类样本图像对应确定出一个第一选择性特征掩码矩阵。

具体的，基于第一类样本图像与一种第二类样本图像的原始特征中目标位置特征元素的值的差异程度，确定所述第一类样本图像的一个第一选择性特征掩码矩阵中相应位置元素的值，可以包括：确定第一类样本图像与该第二类样本图像的原始特征中目标位置特征元素的值的差异程度，并将该差异程度与目标门限值进行比较；在该差异程度小于所述目标门限值时，确定所述第一类样本图像的该第一选择性特征掩码矩阵中相应位置元素的值为第一值；在该差异程度大于或等于所述目标门限值时，确定所述第一类样本图像的该第一选择性特征掩码矩阵中相应位置元素的值为第二值；其中，所述第二值远小于所述第一值。

举例来说，先将一张第一类样本图像x_i输入目标特征提取模型，得到x_i的原始特征f_i，将一张第二类样本图像x_j输入目标特征提取模型，得到x_j的原始特征f_j，第一类样本图像x_i的第一选择性特征掩码矩阵用T_i，j表示，T_i，j的维度与f_i和f_j的维度相同；然后，确定f_i与f_j中相应位置特征元素的差异程度，并在该差异程度小于目标门限值时，确定T_i，j中相应位置元素的值为第一值(如1)；在该差异程度大于或等于所述目标门限值时，确定T_i，j中相应位置元素的值为第二值(如0)。

其中，差异程度及目标门限值，可通过如下两种方式确定：

第一种，如果目标特征提取模型为CNN和变换器模型中的一种，则，可以用第一类样本图像与第二类样本图像的原始特征中目标位置特征元素值之差的绝对值，表征第一类样本图像与第二类样本图像的原始特征中目标位置特征元素的值的差异程度，并且，可以根据第一类样本图像与第二类样本图像的原始特征中全部或部分元素值之差的绝对值的平均值确定所述目标门限值。

例如：

其中，表示f_i与f_i中第k个元素的差异程度。

其中，D表示f_i、f_j和T_i，j的维度，λ为预先定义的系数，M表示目标门限值。

第二种，如果目标特征提取模型为CNN，则，可以用CNN的全连接层(FullyConnected， FC)中第一类样本图像与第二类样本图像的权重中相应位置元素值之差的绝对值，表征第一类样本图像与第二类样本图像的原始特征中目标位置特征元素的值的差异程度，并且，可以根据所述全连接层中第一类样本图像与第二类样本图像的权重中全部或部分元素值之差的绝对值的平均值确定所述目标门限值。

例如：

W_i，j＝|w_i-w_j|

其中，w_i表示第一类样本图像x_i在FC中的权重，w_j表示第二类样本图像x_j在FC中的权重，W_i，j表示第一类样本图像x_i与第二类样本图像x_j中的元素的差异程度。

步骤2、对所述多个第一选择性特征掩码矩阵进行求和，得到所述第一类样本图像的第二选择性特征掩码矩阵。

例如，当第二类样本图像包括上述批量样本图像中的多种类别样本图像中除上述第一类样本图像的剩余类别时，第一类样本图像的第二选择性特征掩码矩阵可表示为：

步骤3、对所述第二选择性特征掩码矩阵进行取反运算，得到所述第一类样本图像的第三选择性特征掩码矩阵。

例如，第一类样本图像的第三选择性特征掩码矩阵可表示为

在上述基础上，进一步地，上述将所述第一类样本图像的原始特征分别与所述至少一个选择性特征掩码矩阵进行点乘，得到对应数量的所述第一类样本图像的掩码特征，可包括：

步骤1、将所述第一类样本图像的原始特征分别与所述多个第一选择性特征掩码矩阵进行点乘，得到对应数量的所述第一类样本图像的多个第一掩码特征。

例如，第一类样本图像的一个第一掩码特征可表示为：

F_i，j＝f_i×T_i，j

步骤2、将所述第一类样本图像的原始特征与所述第二选择性特征掩码矩阵进行点乘，得到对应数量的所述第一类样本图像的第二掩码特征。

例如，第一类样本图像的第二掩码特征可表示为：

F_i，all＝f_i×T_i，all

步骤3、将所述第一类样本图像的原始特征与所述第三选择性特征掩码矩阵进行点乘，得到对应数量的所述第一类样本图像的第三掩码特征。

例如，第一类样本图像的第三掩码特征可表示为：

在上述基础上，进一步地，上述步骤108可以包括：基于三元组损失函数以及所述批量样本图像的第一掩码特征、第二掩码特征和第三掩码特征，计算损失。

具体的，三元组损失函数可以包括基于代理的损失函数(如交叉熵损失函数)和基于度量学习的损失函数。相应的，可以先利用基于代理的损失函数以及所述批量样本图像的第一掩码特征和第二掩码特征，计算第一损失，其中，目标类别的样本图像的代理为所述目标类别样本图像在所述全连接层中的权重，所述目标类别为所述多种类别(C种)中的任一类别，例如，w_i为x_i这一类别样本图像的代理，w_j为x_j这一类别样本图像的代理。基于所述基于度量学习的损失函数以及所述批量样本图像的第一掩码特征和第三掩码特征，计算第二损失；基于所述第一损失和所述第二损失，确定总损失。具体的损失函数将在下文中详细介绍，此处按下不表。

在上述基础上，进一步地，上述步骤110，可以包括：基于所述总损最小的策略失优化所述目标特征提取模型的参数，其中，所述参数包括所述全连接层的权重。

下面结合图2、图3和图4，对目标特征提取模型为CNN时的训练原理进行说明。

图2示出了本说明书一个实施例提供的一种特征提取训模型的训练方法的一种原理示意图。图3示出了图2中对原始特征进行选择性掩码的原理示意图。如图2所示，本说明书实施例提供的对样本图像的原始特征进行选择性掩码的机制可以称为判别性感知机制(AiscriminationAware Mechanism，DAM)。

如图2所示，本说明书一个实施例提供的一种特征提取训模型的训练方法，可包括：

首先，将批量样本图像21：x_a、x_p和x_n输入目标特征提取模型22之后，可以得到该批样本图像的原始特征23：f_a、f_p和f_n，其中，x_a代表锚点样本(anchorsample)，x_p代表x_a的同类样本，x_n代表x_a的异类样本。

其次，基于CNN中全连接层的权重26进行特征元素的区分性选择(Discriminationselection)，也即基于CNN的全连接层中的权重26确定样本图像的选择性特征掩码矩阵24：T_a，all、和T_a，n。

如上文所述，可以基于第一类样本图像与多种第二类样本图像的原始特征中目标位置特征元素的值的差异程度，确定所述第一类样本图像的多个第一选择性特征掩码矩阵中相应位置元素的值；对所述多个第一选择性特征掩码矩阵进行求和，得到所述第一类样本图像的第二选择性特征掩码矩阵；对所述第二选择性特征掩码矩阵进行取反运算，得到所述第一类样本图像的第三选择性特征掩码矩阵。其中，第一类样本图像与第二类样本图像的原始特征中目标位置特征元素的值的差异程度，可以用CNN的全连接层中第一类样本图像与第二类样本图像的权重中相应位置元素值之差的绝对值；目标门限值，可以根据CNN的全连接层中第一类样本图像与第二类样本图像的权重中全部或部分元素值之差的绝对值的平均值确定；然后将该差异程度与目标门限值进行比较；在该差异程度小于目标门限值时，确定第一类样本图像的第一选择性特征掩码矩阵中相应位置元素的值为第一值；在该差异程度大于或等于目标门限值时，确定第一类样本图像的第一选择性特征掩码矩阵中相应位置元素的值为第二值，其中，所述第二值远小于所述第一值，例如，可以将第一值设置为1，将第二值设置为0。

具体如图3所示，可以用w_i表示第一类样本图像x_i在FC中的权重，用w_j表示第二类样本图像x_j在FC中的权重，通常情况下，在训练集中的样本图像种类为C类，样本图像的原始特征的维度为D维时，全连接层的权重为D*C维，一种类别的样本图像的权重为D维；相应的，如果用W_i，j表示第一类样本图像x_i与第二类样本图像x_j中的元素的差异程度，用M 表示目标门限值，用T_i，j表示第一类样本图像x_i的第一选择性特征掩码矩阵，用表示T_i，j中第k个元素的值，那么：

W_i，j＝|w_i-w_j|

可以理解，在i＝a，j＝n时，即可利用上述公式计算得到T_a，all、和T_a，n。

再次，将原始特征23与选择性特征掩码矩阵24进行点乘，得到掩码特征25：F_a，all、和F_a，n。

例如，如图3所示：

F_i，j＝f_i×T_i，j

F_i，all＝f_i×T_i，all

同样可以理解，在i＝a，j＝n时，即可利用上述公式计算得到F_a，all、和F_a，n。

在图3中，被虚线框30圈起来的F_i，j以及F_j，i即为被掩去的特征元素。

然后，利用基于代理的损失函数(Proxy-basedloss)27、全连接层的权重26、F_a，all以及F_a，n，计算第一损失。

基于代理的损失函数可以表示为：

其中，y_i为样本图像x_i的标签，y_i是C维的独热向量，表示样本图像为l，/>

接下来，利用基于度量学习的损失函数(Pair-basedloss)28、以及F_a，n，计算第二损失。

基于度量学习的损失函数可以表示为：

其中，[·]⁺＝max(，0)，α为预先定义的值，d(·)表示欧氏距离。

最后，基于所述第一损失和所述第二损失，确定总损失。

总的损失函数可以表示为：

L_DAM＝μL_sCEDAM+vL_TriHardDAM

其中，μ和v是两个可调参数，分别表示L_SCEDAM和L_TriHardDAM的权重。

可以理解，在确定出总损失以后，可以根据总损失最小的策略对目标特征提取模型的参数进行优化，并进行下一轮训练，直到目标特征提取模型收敛。

图4示出了图2所示的特征提取模型训练方法的效果示意图。如图4所示，将三元组样本图像x_a、x_p和x_n(其中，x_a代表锚点样本(anchorsample)，x_p代表x_a的同类样本，x_n代表x_a的异类样本)输入目标特征提取模型——CNN进行特征嵌入(FeatureEmbedding)后，可以得到它们的原始特征f_a、f_p和f_n及全连接层权重w_a、w_n构成的原始特征空间(OriginalFeatureSpace)；在利用DAM机制对原始特征进行选择性掩码之后，可以得到掩码特征F_a、F_p和F_n及全连接层权重w_a、w_n掩码特征空间(DAMFeatureSpace)；最后利用掩码特征和三元组损失函数(基于代理的损失函数和基于度两学系的损失函数)计算损失可以优化目标特征提取模型——CNN的参数，然后转入下一轮训练。在图4所示的原始特征空间和掩码特征空间中，w_a代表同类样本x_a和x_p的类中心，w_n代表异类样本x_n的类中心，虚线圆圈所限定的范围表示相应类的样本的分布。

对图4中的原始特征空间和掩码特征空间进行对比，不难发现，利用DAM机制对原始特征空间中的原始特征进行选择性掩码之后，可以拉大同类样本间的欧式距离(F_a与F_p之间的距离大于f_a与f_p之间的距离)，缩小异类样本间的欧式距离(F_a与F_n之间的距离小于f_a与f_n之间的距离)。也就是说，利用DAM机制对原始特征空间中的原始特征进行选择性掩码之后，可以使批量样本图像中异类样本图像间的相似性增大，并使该批样本图像中同类样本图像间的相似性减小，从而使特征空间的学习变得更难，进而使模型参数的优化更彻底，取得更好的泛化性能，最终提升特征的鲁棒性。

在上述特征提取模型训练方法的基础上，本说明的另一实施例还提供了一种图像检索方法，下面进行说明。

图5示出了本说明书另一实施例提供的一种图像检索方法，该方法可以包括：

步骤502、获取待检索图像。

在实际应用中获取待检索图像的方式由图5所示的方法的应用场景来定。例如，在宠物身份识别这一场景下，待检索图像可以是用户上传的宠物照片。

步骤504、将所述待检索图像输入目标特征提取模型，得到所述待检索图像的特征。

其中，目标特征提取模型即上述任一实施例提供的特征提取模型训练方法训练得到的特征提取模型。

步骤506、基于所述特征从预设图像库中检索与所述待检索图像相似的图像。

以宠物医疗保险理赔场景中的宠物身份识别为例，用户在其投保的宠物发生就医事实后，会向理赔平台上传该宠物的照片以获取理赔。相应的，理赔平台在获取到要求理赔的宠物照片之后，将该照片输入上文训练出的目标特征提取模型，得到该宠物的照片的特征，然后利用该特征从宠物照片库中比对查询该照片是否来自同一宠物，从而确定是否给予赔付。

本说明书实施例提供的一种图像检索方法，由于能够利用目标特征提取模型从待检索图像中提取出鲁棒性好的特征，因此能够提升检索效果。

以上对本说明书提供的方法进行了说明，下面对本说明书提供的电子设备进行介绍。

图6是本说明书的一个实施例提供的电子设备的结构示意图。请参考图6，在硬件层面，该电子设备包括处理器，可选地还包括内部总线、网络接口、存储器。其中，存储器可能

处理器、网络接口和存储器可以通过内部总线相互连接，该内部总线可以是ISA(Industry Standard Architecture，工业标准体系结构)总线、PCI(PeripheralComponent Interconnect，外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture，扩展工业标准结构) 总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图6中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

存储器，存放程序。具体地，程序可以包括程序代码，所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器，并向处理器提供指令和数据。

处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成特征提取模型训练装置。处理器，执行存储器所存放的程序，并具体用于执行以下操作：

基于所述批量样本图像的掩码特征计算损失；

或者，处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成图像检索装置。处理器，执行存储器所存放的程序，并具体用于执行以下操作：

获取待检索图像；

将所述待检索图像输入目标特征提取模型，得到所述待检索图像的特征，其中，所述目标特征提取模型由上述特征提取模型训练方法训练得到；

上述如本说明书图1或图5所示实施例揭示的方法可以应用于处理器中，或者由处理器实现。处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field－ Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书一个或多个实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书一个或多个实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

该电子设备还可执行图1或图5所示的实施例提供的方法，本说明书在此不再赘述。

当然，除了软件实现方式之外，本说明书的电子设备并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

本说明书实施例还提出了一种计算机可读存储介质，该计算机可读存储介质存储一个或多个程序，该一个或多个程序包括指令，该指令当被包括多个应用程序的便携式电子设备执行时，能够使该便携式电子设备执行图1所示实施例的方法，并具体用于执行以下操作：

基于所述批量样本图像的掩码特征计算损失；

本说明书实施例还提出了一种计算机可读存储介质，该计算机可读存储介质存储一个或多个程序，该一个或多个程序包括指令，该指令当被包括多个应用程序的便携式电子设备执行时，能够使该便携式电子设备执行图5所示实施例的方法，并具体用于执行以下操作：

获取待检索图像；

下面对本说明书提供的装置进行说明。

如图7所示，本说明书的一个实施例提供了一种特征提取模型训练装置700，在一种软件实施方式中，装置700可包括：原始特征提取模块701、特征选择掩码模块702、损失计算模块703和参数优化模块704。

原始特征提取模块701，用于将批量样本图像输入目标特征提取模型，得到所述批量样本图像的原始特征，其中，所述批量样本图像中包含多种类别的样本图像。

特征选择掩码模块702，对所述批量样本图像的原始特征进行选择性掩码，以掩去所述批量样本图像的原始特征中具有区分性的特征元素，得到所述批量样本图像的掩码特征。

损失计算模块703，基于所述批量样本图像的掩码特征计算损失。

参数优化模块704，基于所述损失最小的策略优化所述目标特征提取模型的参数，以得到优化后的所述目标特征提取模型。

需要说明的是，特征提取模型训练装置700能够实现图1的方法，并能取得相同的技术效果，详细内容可参考图1所示的方法，不再赘述。

如图8所示，本说明书的一个实施例提供了一种图像检索装置800，在一种软件实施方式中，装置800可包括：图像获取模块801、特征提取模块802和图像检索模块803。

图像获取模块801，获取待检索图像。

特征提取模块802，将所述待检索图像输入目标特征提取模型，得到所述待检索图像的特征，其中，所述目标特征提取模型由上述特征提取模型训练方法训练得到。

图像检索模块803，基于所述特征从预设图像库中检索与所述待检索图像相似的图像。

需要说明的是，图像检索装置800能够实现图5的方法，并能取得相同的技术效果，详细内容可参考图5所示的方法，不再赘述。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

总之，以上所述仅为本说明书的较佳实施例而已，并非用于限定本说明书的保护范围。凡在本说明书一个或多个实施例的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本说明书一个或多个实施例的保护范围之内。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器 (CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制时，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

Claims

1.一种特征提取模型训练方法，包括：

基于所述批量样本图像的掩码特征计算损失；

基于损失最小的策略优化所述目标特征提取模型的参数，以得到优化后的所述目标特征提取模型；

其中，所述对所述批量样本图像的原始特征进行选择性掩码，以掩去所述批量样本图像的原始特征中具有区分性的特征元素，得到所述批量样本图像的掩码特征，包括：

确定第一类样本图像的至少一个选择性特征掩码矩阵，其中，所述第一类样本图像为所述多种类别的样本图像中的任一种，所述选择性特征掩码矩阵的维度与样本图像的原始特征的维度相同，且所述选择性特征掩码矩阵中目标位置元素的值是根据所述第一类样本图像与第二类样本图像的原始特征中相应位置特征元素的值的差异程度确定的，所述差异程度与所述目标位置元素的值负相关，所述第二类样本图像包括所述多种类别的样本图像中除所述第一类样本图像外的至少一种；

将所述第一类样本图像的原始特征分别与所述至少一个选择性特征掩码矩阵进行点乘，以掩去所述批量样本图像的原始特征中具有区分性的特征元素，得到对应数量的所述第一类样本图像的掩码特征。

2.根据权利要求1所述的方法，所述第二类样本图像包括所述多种类别的样本图像中的至少两种，其中，所述确定第一类样本图像的至少一个选择性特征掩码矩阵，包括：

分别基于第一类样本图像与所述至少两种第二类样本图像的原始特征中目标位置特征元素的值的差异程度，确定所述第一类样本图像的多个第一选择性特征掩码矩阵中相应位置元素的值，得到多个第一选择性特征掩码矩阵，其中，一种第二类样本图像对应确定出一个第一选择性特征掩码矩阵；

对所述多个第一选择性特征掩码矩阵进行求和，得到所述第一类样本图像的第二选择性特征掩码矩阵；

对所述第二选择性特征掩码矩阵进行取反运算，得到所述第一类样本图像的第三选择性特征掩码矩阵。

3.根据权利要求2所述的方法，其中，基于第一类样本图像与一种第二类样本图像的原始特征中目标位置特征元素的值的差异程度，确定所述第一类样本图像的一个第一选择性特征掩码矩阵中相应位置元素的值，包括：

确定第一类样本图像与该第二类样本图像的原始特征中目标位置特征元素的值的差异程度；

在该差异程度小于目标门限值时，确定所述第一类样本图像的该第一选择性特征掩码矩阵中相应位置元素的值为第一值；

在该差异程度大于或等于目标门限值时，确定所述第一类样本图像的该第一选择性特征掩码矩阵中相应位置元素的值为第二值；

其中，所述第二值远小于所述第一值。

4.根据权利要求1-3任一项所述的方法，

所述目标特征提取模型包括卷积神经网络和变换器模型中的一种。

5.根据权利要求3所述的方法，

第一类样本图像与第二类样本图像的原始特征中目标位置特征元素的值的差异程度，用第一类样本图像与第二类样本图像的原始特征中目标位置特征元素值之差的绝对值表征；

所述目标门限值是根据第一类样本图像与第二类样本图像的原始特征中全部或部分元素值之差的绝对值的平均值确定的。

6.根据权利要求3所述的方法，所述目标特征提取模型为卷积神经网络，所述卷积神经网络包含全连接层；

第一类样本图像与第二类样本图像的原始特征中目标位置特征元素的值的差异程度，用所述全连接层中第一类样本图像与第二类样本图像的权重中相应位置元素值之差的绝对值表征；

所述目标门限值是根据所述全连接层中第一类样本图像与第二类样本图像的权重中全部或部分元素值之差的绝对值的平均值确定的。

7.根据权利要求6所述的方法，其中，所述将所述第一类样本图像的原始特征分别与所述至少一个选择性特征掩码矩阵进行点乘，得到对应数量的所述第一类样本图像的掩码特征，包括：

将所述第一类样本图像的原始特征与所述多个第一选择性特征掩码矩阵进行点乘，得到对应数量的所述第一类样本图像的多个第一掩码特征；

将所述第一类样本图像的原始特征与所述第二选择性特征掩码矩阵进行点乘，得到对应数量的所述第一类样本图像的第二掩码特征；

将所述第一类样本图像的原始特征与所述第三选择性特征掩码矩阵进行点乘，得到对应数量的所述第一类样本图像的第三掩码特征。

8.根据权利要求7所述的方法，其中，所述基于所述批量样本图像的掩码特征计算损失，包括：

基于三元组损失函数以及所述批量样本图像的第一掩码特征、第二掩码特征和第三掩码特征，计算损失。

9.根据权利要求8所述的方法，所述三元组损失函数包括基于代理的损失函数和基于度量学习的损失函数，其中，所述基于三元组损失函数以及所述批量样本图像的第一掩码特征、第二掩码特征和第三掩码特征，计算损失，包括：

基于所述基于代理的损失函数以及所述批量样本图像的第一掩码特征和第二掩码特征，计算第一损失，其中，目标类别的样本图像的代理为所述目标类别样本图像在所述全连接层中的权重，所述目标类别为所述多种类别中的任一类别；

基于所述基于度量学习的损失函数以及所述批量样本图像的第一掩码特征和第三掩码特征，计算第二损失；

基于所述第一损失和所述第二损失，确定总损失。

10.根据权利要求9所述的方法，其中，所述基于损失最小的策略优化所述目标特征提取模型的参数，包括：

基于总损失最小的策略优化所述目标特征提取模型的参数，其中，所述参数包括所述全连接层的权重。

11.一种图像检索方法，包括：

获取待检索图像；

将所述待检索图像输入目标特征提取模型，得到所述待检索图像的特征，其中，所述目标特征提取模型由权利要求1-10中任一项所述的方法训练得到；

12.一种特征提取模型训练装置，包括：

参数优化模块，基于损失最小的策略优化所述目标特征提取模型的参数，以得到优化后的所述目标特征提取模型；

其中，所述特征选择掩码模块具体用于：

13.一种图像检索装置，包括：

图像获取模块，获取待检索图像；

特征提取模块，将所述待检索图像输入目标特征提取模型，得到所述待检索图像的特征，其中，所述目标特征提取模型由权利要求1-10中任一项所述的方法训练得到；

14.一种电子设备，包括：

处理器；以及

基于所述批量样本图像的掩码特征计算损失；

15.一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行以下操作：

基于所述批量样本图像的掩码特征计算损失；

16.一种电子设备，包括：

处理器；以及

获取待检索图像；

17.一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行以下操作：

获取待检索图像；