CN111930985A

CN111930985A - 图像检索方法、装置、电子设备及可读存储介质

Info

Publication number: CN111930985A
Application number: CN202010653446.XA
Authority: CN
Inventors: 侯博严; 刘岩
Original assignee: Taikang Insurance Group Co Ltd
Current assignee: Taikang Insurance Group Co Ltd
Priority date: 2020-07-08
Filing date: 2020-07-08
Publication date: 2020-11-13

Abstract

本发明实施例提供一种图像检索方法、装置、电子设备及可读存储介质，该方法包括：针对图像集合中的每张图像，获取包括SIFT视觉词频特征、LBP特征和HOG特征的特征向量，SIFT视觉词频特征和LBP特征均对应于预设数目个SIFT特征点，HOG特征对应于轮廓特征；根据每张图像对应的特征向量，将图像集合中的图像进行局部敏感哈希检索以获取不同的分桶，每一分桶对应于一桶号；确定待检索图像对应的目标桶号；根据待检索图像对应的初始SIFT特征、LBP特征和HOG特征，在目标桶号对应的图像中进行线性精确检索，获取与待检索图像匹配的相似图像。本发明可以实现提取合适的特征表征图像信息，提升检索速度并保证检索精度。

Description

图像检索方法、装置、电子设备及可读存储介质

技术领域

本发明涉及图像检索技术领域，尤其涉及一种图像检索方法、装置、电子设备及可读存储介质。

背景技术

基于内容的图像检索系统现在广泛应用于图像查重、相似场景检索、以图搜图等多种应用场景。在计算机视觉中，图像内容通常用图像特征进行描述，通过一些相似度量函数计算图像特征之间的相似度来判断图像是否相似。

在特征提取方面，现有技术包括颜色特征、纹理特征、关键点特征以及基于深度学习网络的一些特征的提取。在相似度量方面，包括欧氏距离、汉明距离、直方图相似度、Jaccard距离等。

图像检索系统的性能不仅依赖于提取特征的有效性和所用的相似度量函数的准确性，在面对海量数据检索时，更依赖于检索的时效性。目前，提高检索速度的办法都是先采取各种方式对特征进行简化，包括去冗余、降维、编码等，核心就是使特征轻量化。然后采用一些高效的检索算法进行检索。但是对特征进行简化的过程中肯定会损失精度，往往检索效率提升但精度却下降。

而针对相似场景检索而言，由于场景比较复杂而且类别较多，在提取特征来表征图像信息时无法准确的获取合适的特征。其次在海量数据检索时存在在提升保证检索速度的同时无法保证精度的问题。

因此，现有技术中的相似场景检索方法，存在不易准确获取图像特征以及无法同时保证检索速度和精度的问题。

发明内容

本发明实施例提供了一种图像检索方法、装置、电子设备及可读存储介质，以解决现有技术中针对相似场景检索时，存在的不易准确获取特征以及无法同时保证检索速度和精度的问题。

为了解决上述技术问题，本发明实施例提供了以下技术方案：

第一方面，本发明实施例提供了一种图像检索方法，包括：

针对图像集合中的每张图像，获取包括SIFT视觉词频特征、LBP特征以及HOG特征的特征向量，所述SIFT视觉词频特征和所述LBP特征均对应于预设数目个SIFT特征点，所述HOG特征对应于轮廓特征；

根据每张图像对应的特征向量，将所述图像集合中的图像进行局部敏感哈希检索以获取不同的分桶，且每一分桶对应于一桶号；

确定待检索图像对应的目标桶号；

根据所述待检索图像对应的初始SIFT特征、所述LBP特征和所述HOG特征，在所述目标桶号对应的图像中进行线性检索，获取与所述待检索图像匹配的相似图像；

其中，所述初始SIFT特征经编码处理生成所述SIFT视觉词频特征。

第二方面，本发明实施例提供了一种图像检索装置，包括：

获取模块，用于针对图像集合中的每张图像，获取包括SIFT视觉词频特征、LBP特征以及HOG特征的特征向量，所述SIFT视觉词频特征和所述LBP特征均对应于预设数目个SIFT特征点，所述HOG特征对应于轮廓特征；

处理模块，用于根据每张图像对应的特征向量，将所述图像集合中的图像进行局部敏感哈希检索以获取不同的分桶，且每一分桶对应于一桶号；

确定模块，用于确定待检索图像对应的目标桶号；

检索模块，用于根据所述待检索图像对应的初始SIFT特征、所述LBP特征和所述HOG特征，在所述目标桶号对应的图像中进行线性检索，获取与所述待检索图像匹配的相似图像；

第三方面，本发明实施例提供了一种电子设备，所述电子设备包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上所述的图像检索方法中的步骤。

第四方面，本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上所述的图像检索方法中的步骤。

在本发明实施例中，通过获取包括不同特征的特征向量，根据特征向量将图像集合中的图像进行局部敏感哈希检索以获取不同的分桶，针对待检索图像确定对应的目标桶号并在目标桶号对应的图像中依据不同的特征进行线性检索，可以实现提取合适的特征来表征图像信息，缩小检索范围，提升检索速度并保证检索精度，提升了检索体验。

附图说明

图1为本发明实施例提供的图像检索方法的示意图；

图2为本发明实施例提供的对图像进行局部敏感哈希检索的示例图；

图3为本发明实施例提供的图像检索的一实施流程图；

图4为本发明实施例提供的图像检索装置的框图；

图5为本发明实施例提供的电子设备的框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应理解，说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此，在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外，这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。

依据本发明实施例的一个方面，提供了一种图像检索方法，如图1所示，包括：

步骤101、针对图像集合中的每张图像，获取包括SIFT视觉词频特征、LBP特征以及HOG特征的特征向量，所述SIFT视觉词频特征和所述LBP特征均对应于预设数目个SIFT特征点，所述HOG特征对应于轮廓特征。

本发明实施例提供的图像检索方法应用于图像检索系统，图像检索系统可以为服务器或者终端设备，图像检索系统中包括图像集合，针对图像集合中的每张图像，获取对应的特征向量，其中每张图像的特征向量中可以包括SIFT视觉词频特征、LBP特征和HOG特征，SIFT视觉词频特征和LBP特征均对应于图像的预设数目个SIFT特征点，HOG特征对应于图像的轮廓特征，SIFT视觉词频特征为初始SIFT特征经过编码处理后生成。通过根据HOG特征、SIFT视觉词频特征以及LBP特征生成特征向量，可以将多种特征进行融合，使得图像信息得到更完整的表述，避免单一特征对于表征图像的局限性。且由于SIFT视觉词频特征和LBP特征对应于SIFT特征点，HOG特征对应于轮廓特征，可以实现提取合适的特征来表征图像信息。

步骤102、根据每张图像对应的特征向量，将所述图像集合中的图像进行局部敏感哈希检索以获取不同的分桶，且每一分桶对应于一桶号。

在获取每张图像的特征向量之后，可以根据特征向量对图像集合中的图像进行局部敏感哈希检索，得到至少一个分桶，其中忽略空桶的情况，每一个分桶内包含至少一张图像。对图像集合中的图像进行局部敏感哈希检索之后，还可以针对每一分桶得到一桶号。

通过进行局部敏感哈希检索获取不同的分桶，然后确定一分桶，并在该分桶内进行图像检索，相较于针对图像集合进行检索的方式，可以缩小检索范围，提升检索速度。

步骤103、确定待检索图像对应的目标桶号。

在用户指定待检索图像之后，可以根据待检索图像的相关特征确定待检索图像对应的目标桶号，这里的目标桶号为任一分桶所对应的编号。在确定目标桶号之后，可以执行步骤104。

步骤104、根据所述待检索图像对应的初始SIFT特征、所述LBP特征和所述HOG特征，在所述目标桶号对应的图像中进行线性检索，获取与所述待检索图像匹配的相似图像，其中，所述初始SIFT特征经编码处理生成所述SIFT视觉词频特征。

在确定待检索图像对应的目标桶号之后，可以根据待检索图像对应的特征，在目标桶号对应的图像中进行检索，具体为：根据待检索图像对应的初始SIFT特征、LBP特征和HOG特征，将待检索图像与目标桶号对应的图像进行线性匹配，检索与待检索图像匹配的相似图像，以保证检索精度。其中，对初始SIFT特征进行编码处理后生成SIFT视觉词频特征。针对图像集合中的每张图像，均可存储初始SIFT特征、LBP特征以及HOG特征，便于与待检索图像进行线性匹配。在检索出相似图像之后，还可以由人工进行进一步审核，以确定相似图像的准确度。

其中，本发明实施例提供的图像检索方法，由于图像对应的特征向量中包括SIFT视觉词频特征、LBP特征以及HOG特征，实现了提取合适的特征来表征图像信息，因此可以适用于复杂且类别较多的场景。下面以一具体示例进行说明。

针对保险行业，稽核部门有时需要在大量的培训场景图像中挑选出相似的场景图像，从而可以判断是否有用户上传类似的培训图像，人工筛选的话费时费力，可以采用本发明的图像检索方法从大量数据中挑出场景相似的图片供人工审核，以提高工作效率。具体为：首先将全部图像数据上传到服务器，在服务器中形成“指纹”特征库。在指定待稽核图像后，通过与数据库图像“指纹”做对比给出相似度评分，并据此来判断是否有可能存在上传相似图片的作弊行为。例如，工作人员A将上个月参加培训时的图像进行简单修改或者未做修改，上传至本月的培训统计中，则可以识别出此类情况。

上述实施过程，通过针对每张图像获取包括不同特征的特征向量，可以实现提取合适的特征来表征图像信息，通过特征向量将图像集合中的图像进行局部敏感哈希检索以获取不同的分桶，针对待检索图像确定对应的目标桶号并在目标桶号对应的图像中依据不同的特征进行线性检索，可以缩小检索范围，提升检索速度，且通过利用不同的特征进行匹配，可以保证检索精度。

可选的，在本发明一实施例中，所述针对图像集合中的每张图像，获取包括SIFT视觉词频特征、LBP特征以及HOG特征的特征向量，包括：

针对每张图像，获取包括预设数目个SIFT特征点分别对应的SIFT特征描述子的所述初始SIFT特征，对所述初始SIFT特征进行编码处理，获取所述SIFT视觉词频特征；

针对每张图像，确定预设数目个SIFT特征点分别对应的LBP值，根据预设数目个所述LBP值生成所述LBP特征；

针对每张图像，采用HOG算法捕获轮廓特征获取所述HOG特征；

将所述SIFT视觉词频特征、所述LBP特征以及所述HOG特征进行特征融合，生成当前图像对应的特征向量。

在针对每张图像获取对应的特征向量时，可以分别获取SIFT视觉词频特征、LBP特征以及HOG特征，这里的SIFT视觉词频特征为对初始SIFT特征进行编码处理后生成，然后将所获取的特征进行融合生成特征向量。其中，在针对每张图像获取特征向量之前，可以对图像集合里的全部图像进行预处理，在预处理时可以去除掉干扰因素，生成掩膜，然后采用Gamma矫正对图像进行增强。例如，在针对相似场景进行检索时，人物是干扰隐私，因此可以调用语义分割接口将图像中的人物去掉。通过进行预处理，可以提高特征点的有效性。

针对图像集合中的每张图像，在获取SIFT视觉词频特征时，需要提取预设数目个SIFT(Scale-invariant feature transform，尺度不变特征变换)特征点，每个SIFT特征点包含128维的特征描述子(特征描述子为向量形式)，假设有N个特征点，则可形成N*128维的特征矩阵。在获取预设数目个SIFT特征点之后，需要对预设数目个SIFT特征点进行编码处理，以获取SIFT视觉词频特征，其中SIFT视觉词频特征可以为向量形式。

为避免光照强弱的影响，可以在SIFT特征点周围8邻域内计算LBP(Local BinaryPattern，局部二值模式)算子，LBP算子是一种用来描述图像局部纹理特征的算子，具有旋转不变性和灰度不变性等显著的优点，LBP算子对光照具有较强的鲁棒性。在计算LBP算子时，可以根据邻域点和中心像素点(SIFT特征点)之间的相对大小关系，将高于中心像素点的邻域点取为1，低于中心像素点的邻域点取为0，并将其全部连接成一个8位二进制数，此二进制数对应的十进制数就是该中心像素点的LBP值(共256种)，统计所有特征点的LBP值得到特征直方图(256维)，根据特征直方图可以确定对应的LBP向量，LBP特征可以为向量形式或者直方图形式。其中，8邻域LBP算子只是LBP算子中的其中一种，也可以采用其他形式的LBP算子。

最后来捕获轮廓特征，具体为通过HOG(Histogram of Oriented Gradient，方向梯度直方图)算法捕获轮廓特征，HOG特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子，通过计算和统计图像局部区域的梯度方向直方图来构成特征进而捕获轮廓信息，具体为将图像划分成多个最小计算单元cell(例如6*6像素对应一个cell)，统计每个cell的梯度直方图，即可形成每个cell的描述信息；将每几个cell组成一个区间block(例如3*3个cell对应于一个block)，一个block内所有cell的特征描述信息串联起来便得到该block的HOG特征描述信息；将图像内的所有block的HOG特征描述信息串联起来就可以得到该图像的HOG特征。HOG特征为向量形式。

在得到SIFT视觉词频特征、LBP特征以及HOG特征之后，可以进行特征融合，具体为将向量形式的SIFT视觉词频特征、LBP特征以及HOG特征进行拼接，生成当前图像对应的特征向量。

例如，针对每张培训场景图像，可以提取50个SIFT特征点进而获取初始SIFT特征，对初始SIFT特征进行编码处理，获取SIFT视觉词频特征，并针对50个SIFT特征点获取LBP特征，最后捕获轮廓特征获取HOG特征，将SIFT视觉词频特征、LBP特征以及HOG特征进行特征融合，生成当前培训场景图像对应的特征向量。

上述实施过程，可以将SIFT视觉词频特征、LBP特征以及HOG特征进行融合，获取特征向量，实现提取合适的特征来表征图像信息，使得图像信息得到更完整的表述。

可选的，在本发明一实施例中，所述对所述初始SIFT特征进行编码处理，获取所述SIFT视觉词频特征，包括：

将所述初始SIFT特征输入特征词袋模型，输出所述SIFT视觉词频特征；

其中，所述特征词袋模型针对预设数目个所述SIFT特征描述子分别确定对应的视觉单词，基于确定的所述视觉单词生成K维直方图以实现编码处理，并输出所述SIFT视觉词频特征，且所述特征词袋模型为通过图像集合中多个SIFT特征描述子训练形成，包括K个聚类中心，每个所述聚类中心可视为一个所述视觉单词。

在对预设数目个SIFT特征描述子进行编码处理之前，需要确定特征词袋模型，其中特征词袋模型为通过图像集合中多个SIFT特征描述子训练形成。具体为，针对图像集合中的每张图像获取SIFT特征点对应的SIFT特征描述子，然后将获取的所有的SIFT特征描述子放到一起进行K-means聚类，得到K个聚类中心，每一个聚类中心可视为一个视觉单词，借此建立特征词袋模型。

在得到特征词袋模型后，在对预设数目个SIFT特征描述子进行编码处理时，需要将预设数目个SIFT特征描述子输入特征词袋模型，由特征词袋模型针对预设数目个SIFT特征描述子分别确定对应的视觉单词，基于视觉单词生成K维直方图实现编码处理，并输出SIFT视觉词频特征。

其中，特征词袋模型针对预设数目个SIFT特征描述子分别确定对应的视觉单词时，可以针对每个SIFT特征描述子找到一个距离最近的视觉单词，针对该视觉单词确定相应的频数，进而可以形成一个K维的直方图。由于每一个聚类中心可视为一个视觉单词，且聚类中心可以为向量形式，因此可以实现针对每个SIFT特征描述子找到一个距离最近的视觉单词。

上述实施过程，通过对多个SIFT特征点对应的SIFT特征描述子进行编码处理，可以获取SIFT视觉词频特征，进而可以实现SIFT视觉词频特征与LBP特征和HOG特征的融合，生成图像的特征向量。

可选的，在本发明一实施例中，所述根据每张图像对应的特征向量，将所述图像集合中的图像进行局部敏感哈希检索以获取不同的分桶，包括：

利用局部敏感哈希函数将每张图像对应的特征向量映射为对应的哈希值，并将相同哈希值的图像汇聚在同一分桶内。

在获取每张图像对应的特征向量之后，可以对图像集合中的图像进行局部敏感哈希检索，以获取不同的分桶。在对图像集合中的图像进行局部敏感哈希检索时，可以利用局部敏感哈希函数将每张图像的特征向量映射为对应的哈希值，并将相同哈希值的图像汇聚在同一分桶内。即局部敏感哈希函数可以进行特征向量的映射以及基于映射后的哈希值进行图像汇聚。

在利用局部敏感哈希函数对图像集合中的图像进行处理时，可以使得相似度很高的图像以较高的概率映射成同一个哈希值，尽可能使相似特征的图像对应于一个分桶，其中针对每一个分桶，可以将对应的哈希值确定为桶号。通过对图像进行分桶处理，可以缩小检索范围，提升检索速度。

上述实施过程，通过对图像进行局部敏感哈希检索，可以将相同哈希值的图像汇聚在同一分桶内，保证相似特征的图像对应于一个分桶，进而可以在对应的分桶内进行检索，以缩小检索范围。

下面以一实施流程对图像分类进行阐述，如图2所示，包括：

步骤201、对图像集合中的图像分别进行预处理。

步骤202、针对预处理后的每张图像，获取SIFT视觉词频特征、LBP特征和HOG特征。

步骤203、针对每张图像，根据SIFT视觉词频特征、LBP特征和HOG特征进行特征融合，获取图像对应的特征向量。

步骤204、利用局部敏感哈希函数将特征向量映射为对应的哈希值，并将相同哈希值的图像汇聚在同一分桶内。

其中，针对每张图像，可以将其对应的哈希值(桶号)、初始SIFT特征、SIFT视觉词频特征、LBP特征和HOG特征进行保存。

可选的，在本发明一实施例中，在对图像集合中的图像进行局部敏感哈希检索且确定待检索图像后，可以在图像集合中检索与待检索图像匹配的相似图像，而为了缩小检索范围，可以首先确定待检索图像对应的目标桶号。其中，确定待检索图像对应的目标桶号，包括：获取所述待检索图像对应的特征向量；利用局部敏感哈希函数将所述待检索图像对应的特征向量映射为对应的哈希值，并基于所述待检索图像对应的哈希值确定所述目标桶号。

在确定待检索图像所对应的目标桶号时，可以首先获取待检索图像对应的特征向量，获取待检索图像对应的特征向量的方式为：获取SIFT视觉词频特征、LBP特征以及HOG特征，并进行特征融合生成待检索图像对应的特征向量。然后采用局部敏感哈希函数将待检索图像对应的特征向量映射为对应的哈希值，基于待检索图像对应的哈希值确定目标桶号。

其中，在基于待检索图像对应的哈希值确定目标桶号时，可以使待检索图像对应的哈希值与各个分桶的哈希值进行匹配确定目标桶号。

上述实施过程，可以在确定待检索图像之后，首先根据待检索图像的特征向量确定待检索图像所对应的目标桶号，进而可以实现在目标桶号对应的图像中检索与待检索图像匹配的相似图像，缩小了检索范围，提升了检索效率。

需要说明的是，在对图像集合中的图像进行局部敏感哈希检索时，可能会出现同一分桶中存在与其他图像不相似的图像，此时可以再进行精确匹配。下面针对精确匹配的过程进行阐述。在本发明一实施例中，所述根据所述待检索图像对应的初始SIFT特征、所述LBP特征和所述HOG特征，在所述目标桶号对应的图像中进行线性检索，获取与所述待检索图像匹配的相似图像，包括：

将所述待检索图像的所述初始SIFT特征与所述目标桶号对应的各图像的所述初始SIFT特征分别进行匹配，得到各图像分别对应的第一匹配分数；

将所述待检索图像的所述LBP特征与所述目标桶号对应的各图像的所述LBP特征分别进行匹配，得到各图像分别对应的第二匹配分数；

将所述待检索图像的所述HOG特征与所述目标桶号对应的各图像的所述HOG特征分别进行匹配，得到各图像分别对应的第三匹配分数；

针对所述目标桶号对应的各图像，根据所述第一匹配分数、所述第二匹配分数和所述第三匹配分数，确定目标匹配分数；

确定所述目标匹配分数大于预设分数阈值的图像为所述相似图像。

在进行精确匹配时，需要针对待检索图像，获取初始SIFT特征、LBP特征以及HOG特征。然后将初始SIFT特征与目标桶号对应的各图像的初始SIFT特征分别进行匹配，得到第一匹配分数，且第一匹配分数的数量与目标桶号对应的图像的数量相同；将LBP特征与目标桶号对应的各图像的LBP特征分别进行匹配，得到第二匹配分数，第二匹配分数的数量与目标桶号对应的图像的数量相同；将HOG特征与目标桶号对应的各图像的HOG特征分别进行匹配，得到第三匹配分数，第三匹配分数的数量与目标桶号对应的图像的数量相同。

其中，初始SIFT特征中可以包括多个SIFT特征点对应的SIFT特征描述子，在进行匹配时仍以N*128特征矩阵的形式进行匹配。针对图像集合中的每张图像，均可存储初始SIFT特征、LBP特征以及HOG特征，便于与待检索图像进行线性匹配。在将待检索图像的初始SIFT特征与目标桶号对应的各图像的初始SIFT特征进行匹配，得到第一匹配分数时，需要进行特征点匹配，匹配分数实际上是匹配的点对数。

在将待检索图像的LBP特征与目标桶号对应的各图像的LBP特征进行匹配，得到第二匹配分数时，可计算待检索图像的LBP特征与各图像的LBP特征之间的欧式距离，进而得到第二匹配分数。由于LBP特征对应于预设数目个SIFT特征点，可以针对待检索图像和任意一张图像，查找共同的SIFT特征点，或者划定相同的区域。由于SIFT特征点的数量可以有多个，可以针对每次匹配，将多个SIFT特征点所对应的欧氏距离的均值，作为待检索图像的LBP特征与图像集合中的某张图像的LBP特征之间的欧式距离。

在计算第三匹配分数时，可计算待检索图像的HOG特征与各图像的HOG特征之间的欧式距离，进而得到第三匹配分数。欧氏距离可以与匹配分数之间形成对应关系，根据欧氏距离的大小确定对应的第二匹配分数和第三匹配分数，也可以根据欧氏距离所归属的距离区间确定分数区间，然后进一步根据欧式距离在该区间内的分布情况，在分数区间内确定第二匹配分数和第三匹配分数。

在获取与目标桶号对应的图像数量相同的第一匹配分数、第二匹配分数以及第三匹配分数之后，可以针对目标桶号对应的每张图像，根据对应的第一匹配分数、第二匹配分数和第三匹配分数，确定目标匹配分数。针对每张图像，将目标匹配分数与预设分数阈值进行比较，将目标匹配分数大于预设分数阈值的图像确定为相似图像。

上述实施过程，通过利用初始SIFT特征、LBP特征以及HOG特征进行线性匹配，可以保证匹配精度，实现检索到相似图像。

其中，在根据所述第一匹配分数、所述第二匹配分数和所述第三匹配分数，确定目标匹配分数，包括：

计算所述第一匹配分数与第一权重值的乘积、所述第二匹配分数与第二权重值的乘积以及所述第三匹配分数与第三权重值的乘积；

累加所得各乘积之和获取所述目标匹配分数。

在本实施例中，初始SIFT特征、LBP特征以及HOG特征分别对应不同的权重值，且权重值可以由系统设定，用户可以根据需求进行调整。由于初始SIFT特征、LBP特征以及HOG特征分别对应不同的权重值，因此第一匹配分数、第二匹配分数和第三匹配分数也分别对应不同的权重值，且初始SIFT特征对应的第一权重值即为第一匹配分数对应的权重值，LBP特征对应的第二权重值即为第二匹配分数对应的权重值，HOG特征对应的第三权重值即为第三匹配分数对应的权重值。

在根据第一匹配分数、第二匹配分数和第三匹配分数，确定目标匹配分数时，可以计算第一匹配分数与第一权重值的乘积、第二匹配分数与第二权重值的乘积以及第三匹配分数与第三权重值的乘积，然后将所得到的三个乘积相加，得到目标匹配分数。

例如，第一匹配分数对应的第一权重值为0.6，第二匹配分数对应的第二权重值为0.3，第三匹配分数对应的第三权重值为0.1，则在计算目标匹配分数时，需要将第一匹配分数与0.6相乘得到第一乘积值，将第二匹配分数与0.3相乘得到第二乘积值，将第三匹配分数与0.1相乘得到第三乘积值，累加第一乘积值、第二乘积值和第三乘积值，得到目标匹配分数。

上述实施过程，可以根据初始SIFT特征、LBP特征以及HOG特征分别对应的权重值以及三个匹配分数，确定最终的目标匹配分数，可以实现根据不同特征所对应的比重情况确定匹配分数，进而确定出相似图像。

下面以一实施流程对图像检索进行阐述，如图3所示，包括：

步骤301、确定待检索图像。

步骤302、将待检索图像加入图像集合，并确定与待检索图像对应的目标桶号。

步骤303、针对目标桶号对应的每张图像，根据初始SIFT特征、LBP特征以及HOG特征，将待检索图像与每张图像进行匹配，获取三个匹配分数。

步骤304、针对每张图像，将三个匹配分数进行融合获取目标匹配分数。

步骤305、将每张图像对应的目标匹配分数与预设分数阈值进行比较。

步骤306、确定目标匹配分数大于预设分数阈值的图像为待检索图像的相似图像。

上述实施过程，可以在目标桶号对应的图像中进行检索，缩小了检索范围，提升了检索效率，通过线性检索保证了检索精度。

下面通过一具体实例对本发明的图像检索方法进行说明。如，保险销售员因工作原因上个月1号到15号到外地出差半个月，由于需要对住宿费以及餐费进行报销，因此需要针对消费情况开具发票，并应公司需求对住宿情况以及用餐情况拍照记录。在上个月进行报销时，保险销售员将相关图像发送至财务，对相关费用进行了报销，此时系统中记录了保险销售员传送的相关图像。若该保险销售员并没有删除相关图像，在本月报销时由于误操作将上个月已经报销过的住宿费的相关图像再次发送至财务时，则财务可以通过图像检索方法检索出重复报销的情况。可以实现在大量数据中筛选出相似图像，缩小人工稽核的范围，只需人工针对检索出的图像进行进一步审核即可。

以上为本发明实施例提供的图像检索方法的实施例，通过获取包括不同特征的特征向量，根据特征向量将图像集合中的图像进行局部敏感哈希检索以获取不同的分桶，针对待检索图像确定对应的目标桶号并在目标桶号对应的图像中依据不同的特征进行线性检索，可以实现提取合适的特征来表征图像信息，缩小检索范围，提升检索速度并保证检索精度，提升了检索体验。

进一步的，通过对SIFT特征进行编码处理，可以使得SIFT视觉词频特征与LBP特征和HOG特征进行融合，获取特征向量；通过预先训练特征词袋模型，可以快速获取SIFT视觉词频特征，进而提升检索速度。

以上介绍了本发明实施例提供的图像检索方法，下面将结合附图介绍本发明实施例提供的图像检索装置。

依据本发明实施例的另一个方面，提供了一种图像检索装置，能实现上述图像检索方法实施例中的所有细节，并能达到相同的效果，为了避免重复，此处便不再进行赘述。

如图4所示，所述图像检索装置包括：

获取模块401，用于针对图像集合中的每张图像，获取包括SIFT视觉词频特征、LBP特征以及HOG特征的特征向量，所述SIFT视觉词频特征和所述LBP特征均对应于预设数目个SIFT特征点，所述HOG特征对应于轮廓特征；

处理模块402，用于根据每张图像对应的特征向量，将所述图像集合中的图像进行局部敏感哈希检索以获取不同的分桶，且每一分桶对应于一桶号；

确定模块403，用于确定待检索图像对应的目标桶号；

检索模块404，用于根据所述待检索图像对应的初始SIFT特征、所述LBP特征和所述HOG特征，在所述目标桶号对应的图像中进行线性检索，获取与所述待检索图像匹配的相似图像；

可选的，所述获取模块包括：

第一获取子模块，用于针对每张图像，获取包括预设数目个SIFT特征点分别对应的SIFT特征描述子的所述初始SIFT特征，对所述初始SIFT特征进行编码处理，获取所述SIFT视觉词频特征；

第一生成子模块，用于针对每张图像，确定预设数目个SIFT特征点分别对应的LBP值，根据预设数目个所述LBP值生成所述LBP特征；

第二获取子模块，用于针对每张图像，采用HOG算法捕获轮廓特征获取所述HOG特征；

第二生成子模块，用于将所述SIFT视觉词频特征、所述LBP特征以及所述HOG特征进行特征融合，生成当前图像对应的特征向量。

可选的，所述第一获取子模块进一步用于：

可选的，所述处理模块进一步用于：

可选的，所述确定模块进一步用于：

获取所述待检索图像对应的特征向量；

利用局部敏感哈希函数将所述待检索图像对应的特征向量映射为对应的哈希值，并基于所述待检索图像对应的哈希值确定所述目标桶号。

可选的，所述检索模块包括：

第一匹配子模块，用于将所述待检索图像的所述初始SIFT特征与所述目标桶号对应的各图像的所述初始SIFT特征分别进行匹配，得到各图像分别对应的第一匹配分数；

第二匹配子模块，用于将所述待检索图像的所述LBP特征与所述目标桶号对应的各图像的所述LBP特征分别进行匹配，得到各图像分别对应的第二匹配分数；

第三匹配子模块，用于将所述待检索图像的所述HOG特征与所述目标桶号对应的各图像的所述HOG特征分别进行匹配，得到各图像分别对应的第三匹配分数；

第一确定子模块，针对所述目标桶号对应的各图像，根据所述第一匹配分数、所述第二匹配分数和所述第三匹配分数，确定目标匹配分数；

第二确定子模块，用于确定所述目标匹配分数大于预设分数阈值的图像为所述相似图像。

可选的，所述第一确定子模块进一步用于：

累加所得各乘积之和获取所述目标匹配分数。

本发明实施例提供的图像检索装置，通过获取包括不同特征的特征向量，根据特征向量将图像集合中的图像进行局部敏感哈希检索以获取不同的分桶，针对待检索图像确定对应的目标桶号并在目标桶号对应的图像中依据不同的特征进行线性检索，可以实现提取合适的特征来表征图像信息，缩小检索范围，提升检索速度并保证检索精度，提升了检索体验。

依据本发明实施例的又一方面，提供了一种电子设备，该电子设备包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述图像检索方法中的步骤。

举个例子如下，图5示出了一种电子设备的实体结构示意图。

如图5所示，该电子设备可以包括：处理器(processor)510、通信接口(Communications Interface)520、存储器(memory)530和通信总线540，其中，处理器510、通信接口520以及存储器530通过通信总线540完成相互间的通信。处理器510可以调用存储器530中的逻辑指令，以执行如下方法：针对图像集合中的每张图像，获取包括SIFT视觉词频特征、LBP特征以及HOG特征的特征向量，所述SIFT视觉词频特征和所述LBP特征均对应于预设数目个SIFT特征点，所述HOG特征对应于轮廓特征；根据每张图像对应的特征向量，将所述图像集合中的图像进行局部敏感哈希检索以获取不同的分桶，且每一分桶对应于一桶号；确定待检索图像对应的目标桶号；根据所述待检索图像对应的初始SIFT特征、所述LBP特征和所述HOG特征，在所述目标桶号对应的图像中进行线性检索，获取与所述待检索图像匹配的相似图像；其中，所述初始SIFT特征经编码处理生成所述SIFT视觉词频特征。

此外，上述的存储器530中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

依据本发明实施例的再一方面，提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述图像检索方法中的步骤，例如：针对图像集合中的每张图像，获取包括SIFT视觉词频特征、LBP特征以及HOG特征的特征向量，所述SIFT视觉词频特征和所述LBP特征均对应于预设数目个SIFT特征点，所述HOG特征对应于轮廓特征；根据每张图像对应的特征向量，将所述图像集合中的图像进行局部敏感哈希检索以获取不同的分桶，且每一分桶对应于一桶号；确定待检索图像对应的目标桶号；根据所述待检索图像对应的初始SIFT特征、所述LBP特征和所述HOG特征，在所述目标桶号对应的图像中进行线性检索，获取与所述待检索图像匹配的相似图像；其中，所述初始SIFT特征经编码处理生成所述SIFT视觉词频特征。计算机可读存储介质还可以实现本发明实施例中的其他过程，这里不再详细阐述。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种图像检索方法，其特征在于，包括：

确定待检索图像对应的目标桶号；

2.根据权利要求1所述的图像检索方法，其特征在于，所述针对图像集合中的每张图像，获取包括SIFT视觉词频特征、LBP特征以及HOG特征的特征向量，包括：

针对每张图像，采用HOG算法捕获轮廓特征获取所述HOG特征；

3.根据权利要求2所述的图像检索方法，其特征在于，所述对所述初始SIFT特征进行编码处理，获取所述SIFT视觉词频特征，包括：

4.根据权利要求1所述的图像检索方法，其特征在于，所述根据每张图像对应的特征向量，将所述图像集合中的图像进行局部敏感哈希检索以获取不同的分桶，包括：

5.根据权利要求4所述的图像检索方法，其特征在于，所述确定待检索图像对应的目标桶号，包括：

获取所述待检索图像对应的特征向量；

6.根据权利要求1所述的图像检索方法，其特征在于，所述根据所述待检索图像对应的初始SIFT特征、所述LBP特征和所述HOG特征，在所述目标桶号对应的图像中进行线性检索，获取与所述待检索图像匹配的相似图像，包括：

7.根据权利要求6所述的图像检索方法，其特征在于，根据所述第一匹配分数、所述第二匹配分数和所述第三匹配分数，确定目标匹配分数，包括：

累加所得各乘积之和获取所述目标匹配分数。

8.一种图像检索装置，其特征在于，包括：

确定模块，用于确定待检索图像对应的目标桶号；

9.一种电子设备，包括：处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的图像检索方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的图像检索方法的步骤。