CN107423306B

CN107423306B - 一种图像检索方法及装置

Info

Publication number: CN107423306B
Application number: CN201610350337.4A
Authority: CN
Inventors: 姜育刚; 王曦; 顾子晨
Original assignee: Fudan University; Huawei Technologies Co Ltd
Current assignee: Fudan University; Huawei Technologies Co Ltd
Priority date: 2016-05-24
Filing date: 2016-05-24
Publication date: 2021-01-29
Anticipated expiration: 2036-05-24
Also published as: CN107423306A

Abstract

本发明实施例公开了一种图像检索方法，包括：通过深度神经网络模型获取训练图像对中的第一训练图像的第一深度特征和第二训练图像的第二深度特征；计算第一深度特征和第二深度特征的特征距离的平方值；计算鲁棒对比损失函数的输出控制参数平方值；若训练图像对是相同物品的两张不同拍摄场景图像，则从输出控制参数的平方值和特征距离的平方值中选取较小值，根据选取的较小值调整深度神经网络模型的网络参数；获取检索匹配图像，并通过修正后的深度神经网络模型从图像数据库中查找满足检索匹配图像对应的匹配规则的目标图像。本发明实施例还公开了一种图像检索装置。采用本发明实施例，具有可提高图像检索的效率，增强图像检索的性能的优点。

Description

一种图像检索方法及装置

技术领域

本发明涉及图像处理领域，尤其涉及一种图像检索方法及装置。

背景技术

物品图像检索是利用物品的视觉信息在物品数据库中检索与该物品语义上相似或者相同的物品，随着电子商务平台的日益发展普及，物品图像检索也随着日益发展重要。

现有技术一通过将从物品图像中提取的不同视觉特征组成新的视觉特征，通过分类器对新的视觉特征进行训练，生成训练好的相似度分类器。物品图像检索时，通过训练好的相似度分类器检索满足相似度需求的图像。现有技术一中假设了相同物品在不同图像上的视觉特征是高度相似的，进而通过视觉特征的相似性来确定物品图像的相似度。然而，由于拍摄场景、拍摄角度以及拍摄装置等条件的不同，这样的假设实现难度高，检索遗漏性高，适用性低。

现有技术二采用神经网络对物品图像检索进行建模，在神经网络分类器的训练过程中，使用物品类别作为标签对神经网络分类器进行训练，在物品图像检索中，通过训练得到的神经网络分类器检索目标。现有技术二只能对物品类别进行分类，无法准确反映两张物品图像中包含的物品是否为相同物品，检索准确率低。

发明内容

本申请提供了一种图像检索方法及装置，可过滤训练数据中的噪音，提高图像检索的效率，增强图像检索的性能。

第一方面，提供了一种图像检索方法，其可包括：

获取用于训练深度神经网络模型的训练图像对，通过深度神经网络模型获取所述训练图像对中的第一训练图像的第一深度特征和第二训练图像的第二深度特征；

计算所述第一深度特征和所述第二深度特征的特征距离的平方值；

获取鲁棒对比损失函数的输出控制参数，并计算所述输出控制参数的平方值；

判断所述第一训练图像和所述第二训练图像是否是相同物品的两张不同拍摄场景图像；

若所述第一训练图像和所述第二训练图像是相同物品的两张不同拍摄场景图像，则从所述输出控制参数的平方值和所述特征距离的平方值中选取较小值，并将选取的所述较小值确定为所述鲁棒对比损失函数的输出值；

根据所述鲁棒对比损失函数的输出值对应的调整规则调整所述深度神经网络模型的网络参数，以得到修正后的深度神经网络模型；

获取检索匹配图像，并通过所述修正后的深度神经网络模型从图像数据库中查找满足所述检索匹配图像对应的匹配规则的目标图像。

本申请可从获取的用于训练深度神经网络模型的训练图像对中选取相同物品的两张不同拍摄场景图像，通过深度神经网络模型分别获取两张图像中的第一图像的第一深度特征和第二图像的第二深度特征，进而可计算第一深度特征和第二深度特征的特征距离的平方值。本申请使用相同物品的两张不同图像来训练深度神经网络模型，可提高训练得到的深度神经网络模型分辨两张不同图像的类型的准确率，增强深度神经网络模型的图像检索性能。进一步的，可获取鲁棒对比损失函数的输出控制参数，计算输出控制参数的平方值，并从输出控制参数的平方值和深度特征的特征距离的平方值中选取较小值确定为鲁棒对比损失函数的输出值。本申请将鲁棒对比损失函数的输出控制参数的平方值加入到鲁棒对比损失函数的输出值的确定中，可通过输出控制参数来控制鲁棒对比损失函数的输出值的变化幅度，过滤训练图像中的噪音，降低过拟合的可能性，增强图像检索的性能。最后，可根据鲁棒对比损失函数的输出值对应的调整规则来调整深度神经网络模型的网络参数，并通过修正后的深度神经网络模型从图像数据库中查找模块图像，通过对深度神经网络模型的修正来提高深度神经网络模型的图像检索准确率，提高图像检索的效率。

结合第一方面，在第一种可能的实现方式中，所述方法还包括：

若所述第一训练图像和所述第二训练图像不是相同物品的两张不同拍摄场景图像，则判断所述第一训练图像和所述第二训练图像是否是不同物品的两张图像；

若所述第一训练图像和所述第二训练图像是不同物品的两张图像，则计算所述输出控制参数的平方值和所述特征距离的平方值的差值，从所述差值和零中选取较大值，并将选取的所述较大值确定为所述鲁棒对比损失函数的输出值。

本申请可从获取的用于训练深度神经网络模型的训练图像对中选取不同物品的两张图像，通过深度神经网络模型分别获取两张图像中的第一图像的第一深度特征和第二图像的第二深度特征，进而可计算第一深度特征和第二深度特征的特征距离的平方值。本申请使用相同物品的两张不同图像和不同物品的两张图像来训练深度神经网络模型，可进一步完善深度神经网络模型的训练图像数据库中的图像类型，进而可提高训练得到的深度神经网络模型分辨两张不同图像的类型的准确率，增强深度神经网络模型的图像检索性能。进一步的，当训练图像对为不同物品的两张图像时，可获取鲁棒对比损失函数的输出控制参数，计算输出控制参数的平方值，以及输出控制参数的平方值和深度特征的特征距离的平方值的差值，并从上述差值和零中选取较大值确定为鲁棒对比损失函数的输出值。本申请将鲁棒对比损失函数的输出控制参数的平方值和零加入到鲁棒对比损失函数的输出值的确定中，可通过输出控制参数和零来控制鲁棒对比损失函数的输出值的变化幅度，过滤训练图像中的噪音，降低过拟合的可能性，增强图像检索的性能。

结合第一方面或者第一方面第一种可能的实现方式，在第二种可能的实现方式中，所述通过所述修正后的深度神经网络模型从图像数据库中查找满足所述检索匹配图像对应的匹配规则的目标图像包括：

将所述检索匹配图像输入所述修正后的深度神经网络模型，通过所述修正后的深度神经网络模型获取所述检索匹配图像的深度特征；

将图像数据库中包含的至少一张待检索图像输入所述修正后的深度神经网络模型，通过所述修正后的深度神经网络模型获取每张所述待检索图像的深度特征；

从所有所述待检索图像的深度特征中选取与所述检索匹配图像的深度特征的特征距离满足预设距离阈值的目标深度特征，并将所述目标深度特征对应的待检索图像确定为目标图像。

本申请训练得到修正后的深度神经网络模型之后，可在获取到检索匹配图像时，通过修正后的深度神经网络模型获取检索匹配图像的深度特征。本申请还可通过修正后的深度神经网络模型获取图像数据库中存储的所有待检索图像的深度特征，并从所有待检索图像的深度特征中选取与检索匹配图像的深度特征的特征距离满足预设距离阈值的目标深度特征，通过目标深度特征查找得到目标特征。本申请通过深度特征的特征距离的匹配来查找目标图像，操作简单，图像检索效率高。

结合第一方面第二种可能的实现方式，在第三种可能的实现方式中，若所述目标图像多于一个，则所述将所述目标深度特征对应的待检索图像确定为目标图像之后，所述方法还包括：

根据每个所述目标图像的深度特征与所述检索匹配图像的深度特征的特征距离从小到大的顺序将多于一个的所述目标图像进行排序输出。

本申请查找得到目标图像之后，若目标图像有多个，则可根据目标图像的深度特征和检索匹配图像的深度特征的特征距离的大小关系将多个目标图像进行排序输出，可增强图像检索的结果的可视化效果，增强了图像检索的用户体验。

结合第一方面至第一方面第三种可能的实现方式中任一种，在第四种可能的实现方式中，所述深度特征的特征距离包括：所述深度特征的欧式距离，或者所述深度特征的余弦距离。

本申请可采用欧式距离或者余弦距离来确定深度特征的特征距离，计算简单，操作便捷，提高了图像检索的效率。

结合第一方面或者第一方面第一种可能的实现方式，在第五种可能的实现方式中，所述根据所述鲁棒对比损失函数的输出值对应的调整规则调整所述深度神经网络模型的网络参数，包括：

将所述鲁棒对比损失函数的输出值和预存的上一对训练图像对应的鲁棒对比损失函数的输出值进行比对，根据比对结果确定所述鲁棒对比损失函数的梯度；

根据所述鲁棒对比损失函数的梯度确定所述深度神经网络模型的网络参数的调整规则，并根据所述调整规则调整所述深度神经网络模型的网络参数。

本申请可根据当前训练图像对对应的鲁棒对比损失函数的输出值，结合预存的上一对训练图像对应的鲁棒对比损失函数的输出值来确定鲁棒对比损失函数的梯度，并根据鲁棒对比损失函数的梯度确定对深度神经网络模型的网络参数进行调整的调整规则，进而可根据上述调整规则对深度神经网络模型的网络参数进行调整以修正深度神经网络模型，降低深度神经网络模型的过拟合概率，提高深度神经网络模型的适用性。

第二方面，提供了一种图像检索装置，其可包括：

获取模块，用于获取用于训练深度神经网络模型的训练图像对，通过深度神经网络模型获取所述训练图像对中的第一训练图像的第一深度特征和第二训练图像的第二深度特征；

计算模块，用于计算所述获取模块获取的所述第一深度特征和所述第二深度特征的特征距离的平方值；

所述获取模块，还用于获取鲁棒对比损失函数的输出控制参数，并计算所述输出控制参数的平方值；

判断模块，用于判断所述获取模块获取的所述第一训练图像和所述第二训练图像是否是相同物品的两张不同拍摄场景图像；

选取模块，用于在所述判断模块判断得所述第一训练图像和所述第二训练图像是相同物品的两张不同拍摄场景图像时，从所述输出控制参数的平方值和所述计算模块计算的所述特征距离的平方值中选取较小值，并将选取的所述较小值确定为所述鲁棒对比损失函数的输出值；

修正模块，用于根据所述选取模块确定的所述鲁棒对比损失函数的输出值对应的调整规则调整所述深度神经网络模型的网络参数，以得到修正后的深度神经网络模型；

查找模块，用于获取检索匹配图像，并通过所述修正模块调整得到的所述修正后的深度神经网络模型从图像数据库中查找满足所述检索匹配图像对应的匹配规则的目标图像。

结合第二方面，在第一种可能的实现方式中，所述判断模块还用于：

判断所述获取模块获取的所述第一训练图像和所述第二训练图像是否是不同物品的两张图像；

所述选取模块，还用于在所述判断模块判断得所述第一训练图像和所述第二训练图像是不同物品的两张图像时，计算所述输出控制参数的平方值和所述特征距离的平方值的差值，从所述差值和零中选取较大值，并将选取的所述较大值确定为所述鲁棒对比损失函数的输出值。

结合第二方面或第二方面第一种可能的实现方式，在第二种可能的实现方式中，所述查找模块具体用于：

将获取的所述检索匹配图像输入所述修正模块调整得到的所述修正后的深度神经网络模型，通过所述修正后的深度神经网络模型获取所述检索匹配图像的深度特征；

将图像数据库中包含的至少一张待检索图像输入所述修正模块调整得到的所述修正后的深度神经网络模型，通过所述修正后的深度神经网络模型获取每张所述待检索图像的深度特征；

结合第二方面第二种可能的实现方式，在第三种可能的实现方式中，若所述目标图像多于一个，所述查找模块还用于：

结合第二方面至第二方面第三种可能的实现方式中任一种，在第四种可能的实现方式中，所述深度特征的特征距离包括：所述深度特征的欧式距离，或者所述深度特征的余弦距离。

结合第二方面或者第二方面第一种可能的实现方式，在第五种可能的实现方式中，所述修正模块具体用于：

第三方面，提供了一种终端，其可包括：存储器和处理器，所述存储器和所述处理器连接；

所述存储器用于存储一组程序代码；

所述处理器用于调用所述存储器中存储的程序代码执行如上述第一方面提供的任一种可能的实现方式。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的图像检索方法的流程示意图；

图2是本发明实施例提供的图像检索装置的结构示意图；

图3是本发明实施例提供的终端的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参见图1，图1是本发明实施例提供的图像检索方法的流程示意图。本发明实施例提供的方法，包括步骤：

S101，获取用于训练深度神经网络模型的训练图像对，通过深度神经网络模型获取所述训练图像对中的第一训练图像的第一深度特征和第二训练图像的第二深度特征。

具体实现中，本发明实施例提供的图像检索方法的执行主体可为智能手机、平板电脑(portable android device，PAD)、掌上电脑(Personal Digital Assistant，PDA)或者可穿戴设备等终端，在此不做限制。下面将以终端为执行主体对本发明实施例提供的图像检索方法及装置进行描述。

在一些可行的实施方式中，本发明实施例提供的图像检索方法的实现过程可包括图像检索模型的训练过程，和利用训练得到的图像检索模型检索图像的过程。具体实现中，上述图像检索模型可为深度神经网络模型，例如，卷积神经网络，或者感知机等。本发明实施例所描述的深度神经网络模型可以以卷积神经网络为例进行说明。

在一些可行的实施方式中，在上述图像检索模型的训练过程中，可预先建立一个深度神经网络模型的初始模型，再通过大量的图像对上述初始模型进行训练，在训练的过程中根据深度神经网络模型的输出结果调整深度神经网络模型的网络参数直至深度神经网络模型的输出趋向收敛，以此得到一个具有较高检索准确率的深度神经网络模型。具体实现中，在深度神经网络模型的训练过程中，可首先获取用于训练深度神经网络模型的训练图像对，并通过深度神经网络模型获取训练图像对中的第一图像的深度特征(即第一深度特征)和第二图像的深度特征(即第二深度特征)。其中，上述用于获取训练图像对的深度特征的深度神经网络模型可为预先建立的初始模型，也可为经过若干次训练之后还需进行再次训练并进行修正的模型，在此不做限制。

具体实现中，上述训练图像对可为用户实时输入的训练图像对，或者预先存储在终端的指定存储空间的训练图像对，具体可根据实际应用场景确定，在此不做限制。其中，上述训练图像对可包括相同物品的两张不同拍摄场景图像，或者不同物品的两张图像等。其中，上述指定存储空间可包括终端的内置存储空间、外扩存储空间(如SD卡等)或者云存储空间等，在此不做限制。上述相同物品的两张不同拍摄场景图像可为在不同的拍摄场景中拍摄得到的同一个样式的物品的两张图像。上述不同物品的两张图像可为在不同拍摄场景中拍摄得到的不同样式的物品的两张图像，或者在相同拍摄场景中拍摄得到的不同样式的物品的两张图像等。其中，上述不同拍摄场景可包括不同拍摄背景、不同拍摄角度、不同拍摄方式、不同拍摄设备以及不同拍摄模式等，在此不做限制。上述同一个样式的物品包括：相同类型的两个物品，或者相同类型的相同形状的两个物品等，在此不做限制。上述不同样式的物品可包括：不同类型的两个物品，或者相同类型的不同形状的物品等，在此不做限制。例如，上述相同物品的两张不同拍摄场景图像可为在室内或者室外拍摄同一款车(例如相同品牌并且相同型号等各项特征都相同的两部车)的两张图像，或者水平角度拍摄或者俯视角度拍摄同一款车的两张图像，或者横向拍摄或者竖向拍摄同一款车的两张图像，或者卡片机拍摄或者单反拍摄同一款车的两张图像，或者复古模式或者黑白模式拍摄同一款车的两张图像等，在此不做限制。

S102，计算所述第一深度特征和所述第二深度特征的特征距离的平方值。

在一些可行的实施方式中，终端通过深度神经网络模型获取到第一深度特征和第二深度特征之后，则可计算第一深度特征和第二深度特征的特征距离的平方值。其中，上述第一深度特征和第二深度特征的特征距离可包括：第一深度特征和第二深度特征的欧式距离，或者第一深度特征和第二深度特征的余弦距离。

S103，获取鲁棒对比损失函数的输出控制参数，并计算所述输出控制参数的平方值。

在一些可行的实施方式中，终端计算得到第一深度特征和第二深度特征的特征距离的平方值之后，可从指定存储空间中调用鲁棒对比损失函数。其中，上述鲁棒对比损失函数包括如下等式1和等式2：

其中，上述等式1为上述第一训练图像和第二训练图像为相同物品的两张不同拍摄场景图像时对应的鲁棒对比损失函数的输出值的计算等式，等式2为上述第一训练图像和第二训练图像为不同物品的两张图像时对应的鲁棒对比损失函数的输出值的计算等式。其中，

为训练图像I的深度特征，θ为深度神经网络模型的网络参数。上述m为鲁棒对比损失函数的输出控制参数，可通过m来控制鲁棒对比损失函数的输出边界值。

表示训练图像p的深度特征，

表示训练图像q的深度特征。在等式1中，训练图像p(假设为第一训练图像)和训练图像q(假设为第二训练图像)为相同物品的两张不同拍摄场景图像。在等式2中，训练图像p和训练图像q为不同物品的两张图像。训练图像p的深度特征为可设定为第一深度特征，训练图像q的深度特征可设定为第二深度特征。

为训练图像第一深度特征和第二深度特征的欧式距离。上述欧式距离为第一深度特征和第二深度特征的特征距离的表现形式之一，具体还可通过余弦距离等距离表现形式来表示第一深度特征和第二深度特征。

具体实现中，上述鲁棒对比损失函数用于控制深度神经网络模型的训练方向。即，终端可根据上述鲁棒对比损失函数的输出结果来确定深度神经网络模型的网络参数的调整规则，进而可通过深度神经网络模型的网络参数的调整来使鲁棒对比损失函数的损失最小，提高深度神经网络模型进行图像检索的准确性。

在一些可行的实施方式中，终端获取鲁棒对比损失函数时，可根据获取的鲁棒对比损失函数确定鲁棒对比损失函数的输出控制参数m，进而可计算m的平方值m²。

S104，判断所述第一训练图像和所述第二训练图像是否是相同物品的两张不同拍摄场景图像，若判断结果为是，则执行步骤S105。

在一些可行的实施方式中，终端通过深度神经网络模型获取得到第一训练图像的第一深度特征和第二训练图像的第二深度特征，并且计算得到第一深度特征和第二深度特征的特征距离的平方值，以及鲁棒对比损失函数的输出控制参数的平方值之和，则可根据第一训练图像和第二训练图像的类型来确定鲁棒对比损失函数的输出值。具体的，终端可获取用户输入的用于训练深度神经网络模型的训练图像对，通过上述图像训练对中携带的标识信息判断上述训练图像对中包括的第一训练图像和第二训练图像是否为相同物品的两张不同拍摄场景图像。在上述实现方式中，用户输入训练图像对时，可根据训练图像对的两张图像的类型为训练图像对添加标识信息，进而可将上述标识信息与训练图像对一并输入。例如，若用户输入的训练图像对中包含的两张图像为相同物品的两张不同拍摄场景图像，则可在上述训练图像对中添加标识信息为A。若用户输入的训练图像对中包含的两张图像为不同物品的两张图像，则可在上述训练图像对中添加标识信息为B。终端获取到上述训练图像对之后，则可根据上述训练图像对中携带的标识信息来确定上述训练图像对中的第一图像和第二图像是否为相同物品的两张不同拍摄场景图像。

S105，从所述输出控制参数的平方值和所述特征距离的平方值中选取较小值，并将选取的所述较小值确定为所述鲁棒对比损失函数的输出值。

在一些可行的实施方式中，终端判断得到第一训练图像和第二训练图像是相同物品的两张不同拍摄场景图像时，则可调用鲁棒对比损失函数中的等式1来计算鲁棒对比损失函数的输出值。如等式1，终端可从上述m²和第一深度特征和第二深度特征的特征距离的平方值中选取较小值，进而可将选取的较小值确定为鲁棒对比损失函数的输出值。在上述鲁棒比对损失函数的等式1中，m²决定了鲁棒对比损失函数的最大输出值，如此可在第一训练图像和第二训练图像的特征距离较大时，将其特征距离的平方值忽略。对于相同物品的两张不同拍摄场景图像，通过等式1来计算鲁棒对比损失函数的输出值，可降低训练得到的深度神经网络模型的过拟合风险，可更好地将相同类型的物品进行分类，提高了深度神经网络模型的图像检索的准确性。

进一步的，在本发明实施例中，当终端判断得第一训练图像和第二训练图像不是相同物品的两张不同拍摄场景图像，则可根据训练图像对携带的标识信息判断上述第一训练图像和第二训练图像是否为不同物品的两张图像。若终端判断得第一训练图像和第二训练图像是不同物品的两张图像，则可调用鲁棒对比损失函数中的等式2来计算鲁棒对比损失函数的输出值。如等式2，终端可计算输出控制参数的平方值和特征距离的平方值的差值，从计算得到的差值和零中选取较大值，并将选取的较大值确定为鲁棒对比损失函数的输出值。需要说明的是，若训练图像对既不是相同物品的两张不同拍摄场景图像，也不是不同物品的两张图像，则可将其确定为相同物品的相同拍摄场景图像。即，训练图像对为两张相同的图像，此时，则不计算鲁棒对比损失函数的输出值，并重新获取训练图像对进行深度神经网络模型的训练。

终端可对相同物品的两张不同拍摄场景图像以及不同物品的两张图像分别采用不同的等式计算鲁棒对比损失函数的输出值，可提高鲁棒对比损失函数的输出值的计算准确性，增强了根据鲁棒对比损失函数的输出值修正得到的深度神经网络模型的图像检索性能。

S106，根据所述鲁棒对比损失函数的输出值对应的调整规则调整所述深度神经网络模型的网络参数。

在一些可行的实施方式中，终端确定了鲁棒对比损失函数的输出值之后，可将上述鲁棒对比损失函数的输出值和预存的上一对训练图像对应的鲁棒对比损失函数的输出值进行比对，根据比对结果计算鲁棒对比损失函数的梯度。具体实现中，终端使用训练图像对训练深度神经网络模型时，每一对训练图像的鲁棒对比损失函数的输出值都可存储在终端的指定存储空间，用于与下一对训练图像的鲁棒对比损失函数的输出值进行比较，以确定深度神经网络模型的训练效果为正向效果还是反向效果，即深度神经网络模型的图像检索的准确性是往准确性高的方向发展还是准确性低的方向发展。终端计算得到上述鲁棒对比损失函数的梯度之后，则可根据上述鲁棒对比损失函数的梯度确定深度神经网络模型的网络参数的调整规则，并根据确定的调整规则调整深度神经网络模型的网络参数，以得到修正后的深度神经网络模型。

具体实现中，深度神经网络模型的网络参数往鲁棒对比损失函数的梯度负方向调整，即深度神经网络模型的网络参数的调整使调整后的网络参数对应的训练图像对对应的鲁棒对比损失函数的输出值小于调整前的网络参数对应的训练图像对对应的鲁棒对比损失函数的输出值。通过深度神经网络模型的网络参数的调整使训练图像对对应的鲁棒对比损失函数的输出值趋向最小，进而可提高深度神经网络模型的图像检索准确性。当鲁棒对比损失函数的梯度为0，即本次输入的训练图像对对应的鲁棒对比损失函数的输出值和上一对训练图像对应的鲁棒对比损失函数的输出值相同(如等式1输出值均为m²)时，第一深度特征和第二深度特征的特征距离的平方值大于m²。然而，若第一深度特征和第二深度特征的特征距离过大，则根据第一训练图像和第二训练图像对应的鲁棒对比损失函数的输出值来调整深度神经网络模型的网络参数将可能造成深度神经网络模型的过拟合。此时深度神经网络模型可将本次输入的训练图像对的输出结果忽略，不用做深度神经网络模型的网络参数的调整，从而避免过拟合。

S107，获取检索匹配图像，并通过所述修正后的深度神经网络模型从图像数据库中查找满足所述检索匹配图像对应的匹配规则的目标图像。

在一些可行的实施方式中，终端得到修正后的深度神经网络模型之后，当终端获取得到检索匹配图像时，则可通过上述修正后的深度神经网络模型从图像数据库中查找满足检索匹配图像对应的匹配规则的目标图像。其中，上述图像数据库中存储着多个待检索图像，其中，包含与检索匹配图像为相同物品的不同拍摄场景图像的待检索图像，以及与检索匹配图像为不同物品的不同拍摄场景图像的待检索图像。上述检索匹配图像对应的匹配规则包括查找与检索匹配图像为相同物品的不同拍摄场景图像的待检索图像，并且两张图像的相似度大于或者等于预设相似度阈值。其中，上述两张图像的相似度可通过两张图像的深度特征的特征距离表示，当两张图像的深度特征的特征距离小于或者等于预设距离阈值时，则可确定两张图像的相似度大于或者等于预设相似度阈值。具体的，上述特征距离的预设距离阈值或者相似度的预设相似度阈值可根据实际应用场景需求确定，在此不做限制。

具体实现中，终端可将获取的检索匹配图像输入修正后的深度神经网络模型，通过修正后的深度神经网络模型获取检索匹配图像的深度特征。终端还可将图像数据库中包含多种待检索图像分别输入修正后的深度神经网络模型，通过修正后的深度神经网络模型获取每张待检索图像的深度特征。其中，上述图像数据库中包含的待检索图像的深度特征的获取可在终端得到修正后的深度神经网络模型之后，并且在终端获取到检索匹配图像之前进行，进而可将获取到的待检索图像的深度特征存储在图像数据库中。终端通过修正后的深度神经网络模型获取到检索匹配图像之后，则可从图像数据库中调用待检索图像的深度特征，并从所有待检索图像的深度特征中选取与检索匹配图像的深度特征的特征距离满足预设距离阈值的目标深度特征。通过待检索图像的深度特征的预先获取可提高图像检索的效率，提高用户体验。终端可通过深度特征的比对，从待检索图像中查找得到深度特征与检索匹配图像的深度特征的特征距离小于或者预设距离阈值的目标深度特征，进而可将目标深度特征对应的待检索图像确定为目标图像。

进一步的，若查找得到的目标图像有多个，即目标图像多于一个，则可根据每个目标图像的深度特征与检索匹配图像的深度特征的特征距离从小到大的顺序将多于一个的目标图像进行排序输出。即，可将满足要求的图像按照与检索匹配图像的相似度从高到低的顺序进行排序，提高了检索结果的查阅便捷性，增强了图像检索的用户体验。

在本发明实施例中，终端可首先使用相同物品的两张不同拍摄场景图像对深度神经网络模型进行训练，可提高训练得到的深度神经网络模型分辨两张不同图像的类型的准确率，增强深度神经网络模型的图像检索性能。进一步的，终端可获取鲁棒对比损失函数的输出控制参数，计算输出控制参数的平方值，并从输出控制参数的平方值和深度特征的特征距离的平方值中选取较小值确定为鲁棒对比损失函数的输出值。终端将鲁棒对比损失函数的输出控制参数的平方值加入到鲁棒对比损失函数的输出值的确定中，可通过输出控制参数来控制鲁棒对比损失函数的输出值的变化幅度，过滤训练图像中的噪音，降低过拟合的可能性，增强图像检索的性能。终端还可根据鲁棒对比损失函数的输出值对应的调整规则来调整深度神经网络模型的网络参数，并通过修正后的深度神经网络模型从图像数据库中查找模块图像，通过对深度神经网络模型的修正来提高深度神经网络模型的图像检索准确率，提高图像检索的效率。

参见图2，图2是本发明实施例提供的图像检索装置的结构示意图。本发明实施例提供的图像检索装置，包括：

获取模块10，用于获取用于训练深度神经网络模型的训练图像对，通过深度神经网络模型获取所述训练图像对中的第一训练图像的第一深度特征和第二训练图像的第二深度特征。

计算模块20，用于计算所述获取模块10获取的所述第一深度特征和所述第二深度特征的特征距离的平方值。

所述获取模块10，还用于获取鲁棒对比损失函数的输出控制参数，并计算所述输出控制参数的平方值。

判断模块60，用于判断所述获取模块10获取的所述第一训练图像和所述第二训练图像是否是相同物品的两张不同拍摄场景图像。

选取模块30，用于在所述判断模块60判断得所述第一训练图像和所述第二训练图像是相同物品的两张不同拍摄场景图像时，从所剩获取模块10计算的所述输出控制参数的平方值和所述计算模块20计算的所述特征距离的平方值中选取较小值，并将选取的所述较小值确定为所述鲁棒对比损失函数的输出值。

修正模块40，用于根据所述选取模块30确定的所述鲁棒对比损失函数的输出值对应的调整规则调整所述深度神经网络模型的网络参数，以得到修正后的深度神经网络模型。

查找模块50，用于获取检索匹配图像，并通过所述修正模块40调整得到的所述修正后的深度神经网络模型从图像数据库中查找满足所述检索匹配图像对应的匹配规则的目标图像。

在一些可行的实施方式中，所述判断模块60还用于：

判断所述获取模块10获取的所述第一训练图像和所述第二训练图像是否是不同物品的两张图像；

所述选取模块30，还用于在所述判断模块60判断得所述第一训练图像和所述第二训练图像是不同物品的两张图像时，计算所述输出控制参数的平方值和所述特征距离的平方值的差值，从所述差值和零中选取较大值，并将选取的所述较大值确定为所述鲁棒对比损失函数的输出值。

在一些可行的实施方式中，所述查找模块50具体用于：

将获取的所述检索匹配图像输入所述修正模块40调整得到的所述修正后的深度神经网络模型，通过所述修正后的深度神经网络模型获取所述检索匹配图像的深度特征；

将图像数据库中包含的至少一张待检索图像输入所述修正模块40调整得到的所述修正后的深度神经网络模型，通过所述修正后的深度神经网络模型获取每张所述待检索图像的深度特征；

在一些可行的实施方式中，若所述目标图像多于一个，则所述查找模块50还用于：

在一些可行的实施方式中，所述深度特征的特征距离包括：所述深度特征的欧式距离，或者所述深度特征的余弦距离。

在一些可行的实施方式中，所述修正模块40具体用于：

具体实现中，本发明实施例提供的图像检索装置可为本发明实施例中描述的终端，终端可通过其内置的各个模块执行上述图像检索方法的实施例中各个步骤所描述的实现方式，具体可参见上述实施例，在此不再赘述。

参见图3，是本发明实施例提供的终端的结构示意图。本发明实施例提供的终端，包括：存储器1000和处理器2000。上述存储器1000和处理器2000连接。

上述存储器1000用于存储一组程序代码。

上述处理器2000用于调用上述存储器1000中存储的程序代码执行如上述本发明实施例提供的图像检索方法中各个步骤所描述的实现方式，在此不再赘述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random AccessMemory，RAM)等。

以上所揭露的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

1.一种图像检索方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述方法还包括：

3.如权利要求1所述的方法，其特征在于，所述通过所述修正后的深度神经网络模型从图像数据库中查找满足所述检索匹配图像对应的匹配规则的目标图像包括：

4.如权利要求1所述的方法，其特征在于，所述通过所述修正后的深度神经网络模型从图像数据库中查找满足所述检索匹配图像对应的匹配规则的目标图像包括：

5.如权利要求3所述的方法，其特征在于，若所述目标图像多于一个，则所述将所述目标深度特征对应的待检索图像确定为目标图像之后，所述方法还包括：

6.如权利要求4所述的方法，其特征在于，若所述目标图像多于一个，则所述将所述目标深度特征对应的待检索图像确定为目标图像之后，所述方法还包括：

7.如权利要求1-6任一项所述的方法，其特征在于，所述深度特征的特征距离包括：所述深度特征的欧式距离，或者所述深度特征的余弦距离。

8.一种图像检索装置，其特征在于，包括：

9.如权利要求8所述的图像检索装置，其特征在于，所述判断模块还用于：

10.如权利要求8所述的图像检索装置，其特征在于，所述查找模块具体用于：

11.如权利要求9所述的图像检索装置，其特征在于，所述查找模块具体用于：

12.如权利要求10所述的图像检索装置，其特征在于，若所述目标图像多于一个，所述查找模块还用于：

13.如权利要求11所述的图像检索装置，其特征在于，若所述目标图像多于一个，所述查找模块还用于：

14.如权利要求8-13任一项所述的图像检索装置，其特征在于，所述深度特征的特征距离包括：所述深度特征的欧式距离，或者所述深度特征的余弦距离。

15.一种终端，其特征在于，包括：存储器和处理器，所述存储器和所述处理器连接；

所述存储器用于存储一组程序代码；

所述处理器用于调用所述存储器中存储的程序代码执行如权利要求1-7任一项所述的方法。

16.一种计算机可读取存储介质，其特征在于，所述计算机可读取存储介质被硬件执行时能够实现权利要求1-7任一项所述的方法。