CN108205580B

CN108205580B - 一种图像检索方法、装置及计算机可读存储介质

Info

Publication number: CN108205580B
Application number: CN201710891875.9A
Authority: CN
Inventors: 旷章辉; 张伟
Original assignee: Shenzhen Sensetime Technology Co Ltd
Current assignee: Shenzhen Sensetime Technology Co Ltd
Priority date: 2017-09-27
Filing date: 2017-09-27
Publication date: 2021-08-31
Anticipated expiration: 2037-09-27
Also published as: CN108205580A; KR20200011988A; KR102363811B1; SG11202000081XA; JP6905603B2; JP2020525908A; US20200133974A1; WO2019062534A1; US11256737B2; CN113536019A

Abstract

本发明涉及计算机视觉领域，提供了一种图像检索方法、装置及计算机可读存储介质，以准确、高效地检索背景复杂和/或ROI较小的图像。所述方法包括：对待检索图像的各卷积层特征分别进行降维操作，得到各降维特征；基于各降维特征进行聚类，得到多个聚类特征；对多个聚类特征进行特征融合，得到全局特征；基于全局特征，从数据库中对待检索图像进行检索。本发明一方面，通过对待检索图像的各卷积层特征分别进行降维操作，使得感兴趣区域(Region Of Interest，ROI)可变成任意形状，降低了噪声对图像检索结果的影响；另一方面，通过基于各降维特征进行聚类操作，获取多个聚类区域特征，最大程度上降低了由于光照、角度、遮挡等因素对图像特征的影响。

Description

一种图像检索方法、装置及计算机可读存储介质

技术领域

本发明属于计算机视觉领域，尤其涉及一种图像检索方法、装置及计算机可读存储介质。

背景技术

图像检索指的是给定一张待检索图像，通过检索数据库，从中返回一张与该待检索图像最相近的图像的任务。图像检索是计算机视觉及图像分析的重要问题。图像检索在许多领域有些重要的应用，例如，商品推荐、安防监控和医学诊断等。

尽管业界投入了很多精力研究图像检索，但非常遗憾的是，图像检索仍然是一个复杂且困难的问题。图像检索的检索精度、效率等受到很多因素的影响，这是因为，一方面，复杂的图像背景往往对感兴趣区域存在着严重的干扰，影响检索的精确度；另一方面，在大规模的图像检索过程中，图像往往达到百万级甚至更大，而图像检索对实时性要求又是十分高的任务，因此要求图像检索的算法必须十分高效、快捷。然而，现有的许多图像检索算法对于具有复杂背景或者感兴趣区域(Region Of Interest，ROI)较小的图像往往不能准确、高效地提取出有效的检索方案，进而不能提取出好的特征进行检索。

上述技术问题亟待业界解决。

发明内容

本发明提供一种图像检索方法、装置及计算机可读存储介质，以准确、高效地检索背景复杂和/或ROI较小的图像。

本发明第一方面提供了一种图像检索方法，所述方法包括：

对待检索图像的各卷积层特征分别进行降维操作，得到各降维特征，所述降维特征的维度小于所述卷积层特征的维度；

基于所述各降维特征进行聚类，得到多个聚类特征；

对所述多个聚类特征进行特征融合，得到全局特征；

基于所述全局特征，从数据库中对所述待检索图像进行检索。

结合本发明的第一方面，在第一方面的第一种实施方式中，所述对待检索图像的各卷积层特征分别进行降维操作之前，所述方法还包括：

将所述待检索图像输入卷积神经网络，得到所述各卷积层特征。

结合本发明的第一方面的第一种实施方式，在第一方面的第二种实施方式中，每个所述卷积层特征分别用于表征所述图像中对应像素区域的特征。

结合本发明的第一方面，在第一方面的第三种实施方式中，所述基于所述各降维特征进行聚类，得到多个聚类特征，包括：

基于所述各降维特征之间的距离，将所述降维特征进行聚类，得到多个特征聚类中心；

针对所述多个特征聚类中心的每个特征聚类中心，分别对相应的卷积层特征进行最大值采样，作为各特征聚类中心的所述聚类特征。

结合本发明的第一方面，在第一方面的第四种实施方式中，所述对所述多个聚类特征进行特征融合，得到全局特征，包括：

分别对所述多个聚类特征中的每个聚类特征进行回归处理，得到各回归聚类特征；

将所述各回归聚类特征相加，得到所述全局特征。

结合本发明的第一方面的第四种实施方式，在第一方面的第五种实施方式中，所述分别对所述多个聚类特征中的每个聚类特征进行回归处理，得到各回归聚类特征，包括：

分别对所述多个聚类特征中的每个聚类特征依次进行均一化处理、白化处理、再均一化处理，得到所述各回归聚类特征。

结合本发明的第一方面，在第一方面的第六种实施方式中，所述基于所述全局特征，从数据库中对所述待检索图像进行检索，包括：

基于所述全局特征，从所述数据库中获取与所述待检索图像之间的相似度最高的K个图像，所述K为大于或者等于1的整数。

结合本发明的第一方面的第六种实施方式，在第一方面的第七种实施方式中，所述基于所述全局特征，从所述数据库中获取与所述待检索图像之间的相似度最高的K个图像，包括：

计算所述全局特征与所述数据库中各图像特征之间的距离；

基于所述全局特征与所述数据库中各图像特征之间的距离，从所述数据库中获取与所述全局特征之间的距离最小的K个图像，作为所述与待检索图像之间的相似度最高的K个图像。

结合本发明的第一方面的第六种或第七种实施方式，在第一方面的第八种实施方式中，所述方法还包括：

展示所述K个图像以及分别与所述待检索图像之间的相似度。

结合本发明的第一方面，在第一方面的第九种实施方式中，所述降维特征的维度为5。

结合本发明的第一方面，在第一方面的第十种实施方式中，所述聚类特征的个数为32个。

本发明第二方面提供了一种图像检索装置，所述装置包括：

降维模块，用于对待检索图像的各卷积层特征分别进行降维操作，得到各降维特征，所述降维特征的维度小于所述卷积层特征的维度；

聚类模块，用于基于所述各降维特征进行聚类，得到多个聚类特征；

融合模块，用于对所述多个聚类特征进行特征融合，得到全局特征；

检索模块，用于基于所述全局特征，从数据库中对所述待检索图像进行检索。

结合本发明的第二方面，在第二方面的第一种实施方式中，所述装置还包括：

输入模块，用于将所述待检索图像输入卷积神经网络，得到所述各卷积层特征。

结合本发明的第二方面的第一种实施方式，在第二方面的第二种实施方式中，每个所述卷积层特征分别用于表征所述图像中对应像素区域的特征。

结合本发明的第二方面，在第二方面的第三种实施方式中，所述聚类模块包括：

第一处理单元，用于基于所述各降维特征之间的距离，将所述降维特征进行聚类，得到多个特征聚类中心；

采样单元，用于针对所述多个特征聚类中心的每个特征聚类中心，分别对相应的卷积层特征进行最大值采样，作为各特征聚类中心的所述聚类特征。

结合本发明的第二方面，在第二方面的第四种实施方式中，所述融合模块包括：

回归处理单元，用于分别对所述多个聚类特征中的每个聚类特征进行回归处理，得到各回归聚类特征；

相加单元，用于将所述各回归聚类特征相加，得到所述全局特征。

结合本发明的第二方面的第四种实施方式，在第二方面的第五种实施方式中，所述回归处理单元包括：

第二处理单元，用于分别对所述多个聚类特征中的每个聚类特征依次进行均一化处理、白化处理、再均一化处理，得到所述各回归聚类特征。

结合本发明的第二方面，在第二方面的第六种实施方式中，所述检索模块包括：

第一获取单元，用于基于所述全局特征，从所述数据库中获取与所述待检索图像之间的相似度最高的K个图像，所述K为大于或者等于1的整数。

结合本发明的第二方面的第六种实施方式，在第二方面的第七种实施方式中，所述第一获取单元包括：

计算单元，用于计算所述全局特征与所述数据库中各图像特征之间的距离；

第二获取单元，用于基于所述全局特征与所述数据库中各图像特征之间的距离，从所述数据库中获取与所述全局特征之间的距离最小的K个图像，作为所述与待检索图像之间的相似度最高的K个图像。

结合本发明的第二方面的第六种或第七种实施方式，所述装置还包括：

展示模块，用于展示所述K个图像以及分别与所述待检索图像之间的相似度。

结合本发明的第二方面，在第二方面的第九种实施方式中，所述降维特征的维度为5。

结合本发明的第二方面，在第二方面的第十种实施方式中，所述聚类特征的个数为32个。

本发明第三方面提供了一种终端设备，包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序，处理器执行计算机程序时实现以下步骤：

基于所述各降维特征进行聚类，得到多个聚类特征；

对所述多个聚类特征进行特征融合，得到全局特征；

本发明实施例的第四方面提供了一种计算机可读存储介质，计算机可读存储介质存储有计算机程序，计算机程序被处理器执行时实现以下步骤：

基于所述各降维特征进行聚类，得到多个聚类特征；

对所述多个聚类特征进行特征融合，得到全局特征；

从上述本发明提供的技术方案可知，一方面，通过对待检索图像的各卷积层特征分别进行降维操作，使得感兴趣区域(Region Of Interest，ROI)可变成任意形状，降低了噪声对图像检索结果的影响；另一方面，通过基于各降维特征进行聚类操作，获取多个聚类区域特征，最大程度上降低了由于光照、角度、遮挡等因素对图像特征的影响。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动前提下，还可以根据这些附图获得其他的附图。

图1-a是本发明实施例提供的图像检索方法的实现流程示意图；

图1-b是本发明另一实施例提供的图像检索方法的实现流程示意图；

图1-c是本发明另一实施例提供的图像检索方法的实现流程示意图；

图2是本发明实施例提供的图像检索装置的结构示意图；

图3是本发明另一实施例提供的图像检索装置的结构示意图；

图4是本发明另一实施例提供的图像检索装置的结构示意图；

图5是本发明另一实施例提供的图像检索装置的结构示意图；

图6是本发明另一实施例提供的图像检索装置的结构示意图；

图7是本发明另一实施例提供的图像检索装置的结构示意图；

图8是本发明另一实施例提供的图像检索装置的结构示意图；

图9-a是本发明另一实施例提供的图像检索装置的结构示意图；

图9-b是本发明另一实施例提供的图像检索装置的结构示意图；

图10是本发明实施例提供的终端设备的结构示意图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本发明实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本发明的描述。

为了说明本发明的技术方案，下面通过具体实施例来进行说明。

附图1-a是本发明实施例提供的图像检索方法的实现流程示意图，主要包括以下步骤Sa101至Sa104，以下详细说明：

Sa101，对待检索图像的各卷积层特征分别进行降维操作，得到各降维特征，其中，降维特征的维度小于卷积层特征的维度。

对待检索图像的各卷积层特征分别进行降维操作，是基于这样一个事实，即：多重共线性-预测变量之间相互关联(例如，多重共线性会导致解空间的不稳定，从而可能导致结果的不连贯)；2.高维空间本身具有稀疏性(研究表明，一维正态分布有68％的值落于正负标准差之间，而在十维空间上只有0.02％)；3)过多的变量会妨碍查找规律的建立；4)仅在变量层面上分析可能会忽略变量之间的潜在联系(例如几个预测变量可能落入仅反映数据某一方面特征的一个组内)；5)最有价值的信息集中在高维向量的前面部分，而后面的部分往往是噪声；6)降维之后更利于快速高效地对特征进行聚类并降低受噪声的影响。因此，降维操作的目的包括减少预测变量的个数、确保这些变量是相互独立的以及提供一个框架来解释结果，等等。

Sa102，基于各降维特征进行聚类，得到多个聚类特征。

Sa103，对多个聚类特征进行特征融合，得到全局特征。

Sa104，基于全局特征，从数据库中对待检索图像进行检索。

从上述附图1-a示例的图像检索方法可知，一方面，通过对待检索图像的各卷积层特征分别进行降维操作，使得感兴趣区域(Region Of Interest，ROI)可变成任意形状，降低了噪声对图像检索结果的影响；另一方面，通过基于各降维特征进行聚类操作，获取多个聚类区域特征，最大程度上降低了由于光照、角度、遮挡等因素对图像特征的影响。

附图1-b是本发明实施例提供的图像检索方法的实现流程示意图，主要包括以下步骤Sb101至Sb105，以下详细说明。

Sb101，对待检索图像的各卷积层特征分别进行降维操作，得到各降维特征，其中，降维特征的维度小于卷积层特征的维度。

对待检索图像的各卷积层特征分别进行降维操作之前，还包括将待检索图像输入卷积神经网络，得到各卷积层特征。具体地，通过对神经网络的学习，获得卷积神经网络，即通过图像分类任务或距离学习任务，预先学习好神经网络权重，然后将该神经网络结构的全连接层丢弃，仅保留其卷积层的参数，包括卷积核的权重和偏移等，获得卷积神经网络；然后，将待检索图像输入卷积神经网络，使其输出待检索图像的各卷积层特征，其中，卷积神经网络包含卷积层和降采样层，此处的每个卷积层特征分别用于表征待检索图像中对应像素区域的特征。例如，若像素区域为8*8像素单位，则卷积层特征的个数为(待检索图像的高度包含的像素个数/8)*(待检索图像的宽度包含的像素个数/8)；再如，若像素区域为16*16像素单位，则卷积层特征的个数为(待检索图像的高度包含的像素个数/16)*(待检索图像的宽度包含的像素个数/16)，等等。

需要说明的是，上述实施例中各降维特征的维度可以根据检索的精度来定。一般而言，降维之前的各卷积层特征的维度会远远大于降维特征的维度，例如，降维之前的各卷积层特征的维度为256或512，而降维特征的维度可以为5。

从实施例可知，一方面，通过提取各卷积层特征，利用卷积神经网络的卷积层特征强大表达能力，让语义相近的图像在特征空间上也相近，降低了由于光照、角度、遮挡等因素对图像特征的影响，从而提高了图像检索的精准度或质量；另一方面，通过对待检索图像的卷积层特征进行降维操作，使得待检索图像的ROI可变成任意形状，降低噪声对图像检索结果的影响。

在本发明实施例中，待检索图像的各卷积层特征是待检索图像在图像空间H*W个位置的D维特征的集合，若对待检索图像的各卷积层特征分别进行降维操作，得到各降维特征可以是将待检索图像在图像空间H*W个位置的D维特征降为待检索图像在图像空间H*W个位置的C维特征，显然，此处的C小于D，H和W分别为待检索图像的高和宽。

Sb102，基于各降维特征之间的距离，将降维特征进行聚类，得到多个特征聚类中心。

具体地，将待检索图像的各个降维特征中特征之间的距离相当的降维特征聚成一个特征聚类中心，最终构成多个特征聚类中心。

Sb103，针对经步骤Sb102得到的多个特征聚类中心的每个特征聚类中心，分别对相应的卷积层特征上进行最大值采样，作为各特征聚类中心的聚类特征。

需要说明的是，上述步骤Sb103中，相应的卷积层特征是指每个特征聚类中心包含的各降维特征中，每个降维特征对应的卷积层特征，而聚类特征的个数可以为32个，其也可以根据检索的精度来取其他数值，此处仅仅是举例说明。

上述通过基于各降维特征进行聚类操作，获取多个聚类区域特征，最大程度上降低了由于光照、角度、遮挡等因素对图像特征的影响。

Sb104，对多个聚类特征进行特征融合，得到全局特征。

具体地，对多个聚类特征进行特征融合，得到全局特征可以是：分别对多个聚类特征中的每个聚类特征进行回归处理，得到各回归聚类特征，将各回归聚类特征相加，得到全局特征，其中，分别对多个聚类特征中的每个聚类特征进行回归处理，得到各回归聚类特征包括分别对多个聚类特征中的每个聚类特征依次进行均一化处理、白化处理、再均一化处理，从而得到各回归聚类特征。

Sb105，基于全局特征，从数据库中对待检索图像进行检索。

作为本发明一个实施例，基于全局特征，从数据库中对所述待检索图像进行检索可以是：基于全局特征，从数据库中获取与待检索图像之间的相似度最高的K个图像，其中，K为大于或者等于1的整数。具体地，

可以根据全局特征与数据库中图像的特征之间的距离，对数据库中图像与待检索图像的相似度排序，获取与待检索图像相似度最高的K个图像。

由于数据库中图像的特征与全局特征之间的距离越小，表明该图像与待检索图像越相似或相似度越高，上述实施例就是按照这个原则，对数据库中图像与待检索图像的相似度排序，获取与待检索图像相似度最高的K图像。

进一步地，基于全局特征，从数据库中获取与所述待检索图像之间的相似度最高的K个图像可以包括：计算全局特征与数据库中各图像特征之间的距离；基于全局特征与数据库中各图像特征之间的距离，从数据库中获取与全局特征之间的距离最小的K个图像，作为与待检索图像之间的相似度最高的K个图像。

从数据库中获取与待检索图像之间的相似度最高的K个图像后，所述方法还包括展示K个图像以及分别与待检索图像之间的相似度。

从上述附图1示例的图像检索方法可知，一方面，通过对待检索图像的各卷积层特征分别进行降维操作，使得感兴趣区域(Region Of Interest，ROI)可变成任意形状，降低了噪声对图像检索结果的影响；另一方面，通过基于各降维特征进行聚类操作，获取多个聚类区域特征，最大程度上降低了由于光照、角度、遮挡等因素对图像特征的影响。

附图1-c是本发明另一实施例提供的图像检索方法的实现流程示意图，主要包括以下步骤Sc101至Sc107，以下详细说明：

Sc101，将待检索图像输入卷积神经网络，得到各卷积层特征。

具体地，通过对神经网络的学习，获得卷积神经网络，即通过图像分类任务或距离学习任务，预先学习好神经网络权重，然后将该神经网络结构的全连接层丢弃，仅保留其卷积层的参数，包括卷积核的权重和偏移等，获得卷积神经网络；然后，将待检索图像输入卷积神经网络，使其输出待检索图像的各卷积层特征，其中，卷积神经网络包含卷积层和降采样层，此处的每个卷积层特征分别用于表征待检索图像中对应像素区域的特征。例如，若像素区域为8*8像素单位，则卷积层特征的个数为(待检索图像的高度包含的像素个数/8)*(待检索图像的宽度包含的像素个数/8)；再如，若像素区域为16*16像素单位，则卷积层特征的个数为(待检索图像的高度包含的像素个数/16)*(待检索图像的宽度包含的像素个数/16)，等等。

Sc102，对待检索图像的各卷积层特征分别进行降维操作，得到各降维特征，其中，降维特征的维度小于卷积层特征的维度。

作为本发明一个实施例，对待检索图像的各卷积层特征分别进行降维操作，得到各降维特征可以是采用主成分分析(Principal Component Analysis，PCA)方法进行降维。PCA方法具体是将降维前的n个特征用数目更少的m个特征取代，新特征是旧特征的线性组合，这些线性组合最大化样本方差，尽量使新的m个特征互不相关，而从旧特征到新特征的映射捕获数据中的固有变异性。

需要说明的是，本发明对待检索图像的各卷积层特征分别进行降维操作并不局限于上述PCA方法，还可以采用其他方法，例如，因子分析或用户自定义复合等，因此，上述PCA方法并不用于限制本发明。

Sc103，基于各降维特征之间的距离，将降维特征进行聚类，得到多个特征聚类中心。

Sc104，针对经步骤Sc103得到的多个特征聚类中心的每个特征聚类中心，分别对相应的卷积层特征上进行最大值采样，作为各特征聚类中心的聚类特征。

需要说明的是，上述步骤S c104中，相应的卷积层特征是指每个特征聚类中心包含的各降维特征中，每个降维特征对应的卷积层特征，而聚类特征的个数可以为32个，其也可以根据检索的精度来取其他数值，此处仅仅是举例说明。

Sc105，分别对多个聚类特征中的每个聚类特征进行回归处理，得到各回归聚类特征。

具体地，分别对多个聚类特征中的每个聚类特征进行回归处理，得到各回归聚类特征包括分别对多个聚类特征中的每个聚类特征依次进行均一化处理、白化处理、再均一化处理，从而得到各回归聚类特征。

Sc106，将各回归聚类特征相加，得到全局特征。

Sc107，基于全局特征，从数据库中对待检索图像进行检索。

图2是本发明实施例提供的图像检索装置的示意图，主要包括降维模块201、聚类模块202、融合模块203和检索模块204，详细说明如下：

降维模块201，用于对待检索图像的各卷积层特征分别进行降维操作，得到各降维特征，其中，降维特征的维度小于卷积层特征的维度，降维特征的维度可以为5；

聚类模块202，用于基于各降维特征进行聚类，得到多个聚类特征，聚类特征的个数可以为32；

融合模块203，用于对多个聚类特征进行特征融合，得到全局特征；

检索模块204，用于基于全局特征，从数据库中对待检索图像进行检索。

需要说明的是，本发明实施例提供的装置，由于与本发明方法实施例基于同一构思，其带来的技术效果与本发明方法实施例相同，具体内容可参见本发明方法实施例中的叙述，此处不再赘述。

附图2示例的图像检索装置还可以包括输入模块301，如附图3示例的图像检索装置。输入模块301用于将待检索图像输入卷积神经网络，得到各卷积层特征，其中，每个卷积层特征分别用于表征图像中对应像素区域的特征。

附图2示例的聚类模块201可以包括第一处理单元401和采样单元402，如附图4示例的图像检索装置，其中：

第一处理单元401，用于基于各降维特征之间的距离，将降维特征进行聚类，得到多个特征聚类中心；

采样单元402，用于针对多个特征聚类中心的每个特征聚类中心，分别对相应的卷积层特征进行最大值采样，作为各特征聚类中心的聚类特征。

附图2示例的融合模块203可以包括回归处理单元501和相加单元502，如附图5示例的图像检索装置，其中：

回归处理单元501，用于分别对多个聚类特征中的每个聚类特征进行回归处理，得到各回归聚类特征；

相加单元502，用于将各回归聚类特征相加，得到全局特征。

附图5示例的回归处理单元501可以包括第二处理单元601，如附图6示例的图像检索装置。第二处理单元601用于分别对多个聚类特征中的每个聚类特征依次进行均一化处理、白化处理、再均一化处理，得到各回归聚类特征。

附图2示例的检索模块204可以包括第一获取单元701，如附图7示例的图像检索装置第一获取单元701用于基于全局特征，从数据库中获取与待检索图像之间的相似度最高的K个图像，其中，K为大于或者等于1的整数。

附图7示例的第一获取单元701可以包括计算单元801和第二获取单元802，如附图8示例的图像检索装置，其中：

计算单元801，用于计算全局特征与数据库中各图像特征之间的距离；

第二获取单元802，用于基于全局特征与数据库中各图像特征之间的距离，从数据库中获取与全局特征之间的距离最小的K个图像，作为与待检索图像之间的相似度最高的K个图像。

附图7或附图8示例的图像检索装置还可以包括展示模块901，如附图9-a或附图9-b示例的图像检索装置。展示模块901用于展示与待检索图像之间的相似度最高的K个图像以及分别与待检索图像之间的相似度。

图10是本发明一实施例提供的终端设备的结构示意图。如图10所示，该实施例的终端设备10包括：处理器100、存储器101以及存储在存储器101中并可在处理器100上运行的计算机程序102，例如图像检索方法的程序。处理器100执行计算机程序102时实现上述图像检索方法实施例中的步骤，例如图1-a所示的步骤Sa101至Sa104。或者，处理器100执行计算机程序102时实现上述各装置实施例中各模块/单元的功能，例如图2所示降维模块201、聚类模块202、融合模块203和检索模块204的功能。

示例性的，图像检索方法的计算机程序102主要包括：对待检索图像的各卷积层特征分别进行降维操作，得到各降维特征，所述降维特征的维度小于所述卷积层特征的维度；基于所述各降维特征进行聚类，得到多个聚类特征；对所述多个聚类特征进行特征融合，得到全局特征；基于所述全局特征，从数据库中对所述待检索图像进行检索。计算机程序102可以被分割成一个或多个模块/单元，一个或者多个模块/单元被存储在存储器101中，并由处理器100执行，以完成本发明。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述计算机程序102在计算设备10中的执行过程。例如，计算机程序102可以被分割成降维模块201、聚类模块202、融合模块203和检索模块204的功能(虚拟装置中的模块)，各模块具体功能如下：降维模块201，用于对待检索图像的各卷积层特征分别进行降维操作，得到各降维特征，所述降维特征的维度小于所述卷积层特征的维度；聚类模块202，用于基于所述各降维特征进行聚类，得到多个聚类特征；融合模块203，用于对所述多个聚类特征进行特征融合，得到全局特征；检索模块204，用于基于所述全局特征，从数据库中对所述待检索图像进行检索。

终端设备10可包括但不仅限于处理器100、存储器101。本领域技术人员可以理解，图10仅仅是终端设备10的示例，并不构成对终端设备10的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如终端设备还可以包括输入输出设备、网络接入设备、总线等。

所称处理器100可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器101可以是终端设备10的内部存储单元，例如终端设备10的硬盘或内存。存储器101也可以是终端设备10的外部存储设备，例如终端设备10上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。进一步地，存储器101还可以既包括终端设备10的内部存储单元也包括外部存储设备。存储器101用于存储计算机程序以及终端设备所需的其他程序和数据。存储器101还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本发明所提供的实施例中，应该理解到，所揭露的装置/终端设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/终端设备实施例仅仅是示意性的，例如，模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，图像检索方法的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤，即，对待检索图像的各卷积层特征分别进行降维操作，得到各降维特征，所述降维特征的维度小于所述卷积层特征的维度；基于所述各降维特征进行聚类，得到多个聚类特征；对所述多个聚类特征进行特征融合，得到全局特征；基于所述全局特征，从数据库中对所述待检索图像进行检索。其中，计算机程序包括计算机程序代码，计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括：能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

1.一种图像检索方法，其特征在于，所述方法包括：

对待检索图像的各卷积层特征分别进行降维操作，得到各降维特征，所述降维特征的维度小于所述卷积层特征的维度；根据检索精度来确定所述降维特征的维度；

基于所述各降维特征进行聚类，得到多个聚类特征；

对所述多个聚类特征进行特征融合，得到全局特征；

基于所述全局特征，从数据库中对所述待检索图像进行检索；

所述对待检索图像的各卷积层特征分别进行降维操作之前，所述方法还包括：将所述待检索图像输入卷积神经网络，得到所述各卷积层特征。

2.如权利要求1所述图像检索方法，其特征在于，每个所述卷积层特征分别用于表征所述图像中对应像素区域的特征。

3.如权利要求1所述图像检索方法，其特征在于，所述基于所述各降维特征进行聚类，得到多个聚类特征，包括：

4.如权利要求1所述图像检索方法，其特征在于，所述对所述多个聚类特征进行特征融合，得到全局特征，包括：

将所述各回归聚类特征相加，得到所述全局特征。

5.如权利要求4所述图像检索方法，其特征在于，所述分别对所述多个聚类特征中的每个聚类特征进行回归处理，得到各回归聚类特征，包括：

6.如权利要求1所述图像检索方法，其特征在于，所述基于所述全局特征，从数据库中对所述待检索图像进行检索，包括：

7.如权利要求6所述图像检索方法，其特征在于，所述基于所述全局特征，从所述数据库中获取与所述待检索图像之间的相似度最高的K个图像，包括：

计算所述全局特征与所述数据库中各图像特征之间的距离；

基于所述全局特征与所述数据库中各图像特征之间的距离，从所述数据库中获取与所述全局特征之间的距离最小的K个图像，作为与所述待检索图像之间的相似度最高的K个图像。

8.如权利要求6或7所述图像检索方法，其特征在于，所述方法还包括：

展示所述K个图像以及分别与所述待检索图像之间的相似度。

9.如权利要求1所述图像检索方法，其特征在于，所述降维特征的维度为5。

10.如权利要求1所述图像检索方法，其特征在于，所述聚类特征的个数为32个。

11.一种图像检索装置，其特征在于，所述装置包括：

降维模块，用于对待检索图像的各卷积层特征分别进行降维操作，得到各降维特征，所述降维特征的维度小于所述卷积层特征的维度；根据检索精度来确定所述降维特征的维度；

检索模块，用于基于所述全局特征，从数据库中对所述待检索图像进行检索；

所述装置还包括：输入模块，用于将所述待检索图像输入卷积神经网络，得到所述各卷积层特征。

12.如权利要求11所述图像检索装置，其特征在于，每个所述卷积层特征分别用于表征所述图像中对应像素区域的特征。

13.如权利要求11所述图像检索装置，其特征在于，所述聚类模块包括：

14.如权利要求11所述图像检索装置，其特征在于，所述融合模块包括：

15.如权利要求14所述图像检索装置，其特征在于，所述回归处理单元包括：

16.如权利要求11所述图像检索装置，其特征在于，所述检索模块包括：

17.如权利要求16所述图像检索装置，其特征在于，所述第一获取单元包括：

第二获取单元，用于基于所述全局特征与所述数据库中各图像特征之间的距离，从所述数据库中获取与所述全局特征之间的距离最小的K个图像，作为与所述待检索图像之间的相似度最高的K个图像。

18.如权利要求16或17所述图像检索装置，其特征在于，所述装置还包括：

19.如权利要求11所述图像检索装置，其特征在于，所述降维特征的维度为5。

20.如权利要求11所述图像检索装置，其特征在于，所述聚类特征的个数为32个。

21.一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至10任意一项所述方法的步骤。

22.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至10任意一项所述方法的步骤。