WO2017143979A1

WO2017143979A1 - 图像的检索方法及装置

Info

Publication number: WO2017143979A1
Application number: PCT/CN2017/074356
Authority: WO
Inventors: 朱海涛
Original assignee: 中兴通讯股份有限公司
Priority date: 2016-02-22
Filing date: 2017-02-22
Publication date: 2017-08-31
Also published as: CN107103002A

Abstract

一种图像的检索方法及装置，其中，该方法包括：提取待检索图像上用于表征图像特征属性的多个特征描述子(110)；将提取到的特征描述子映射到预先生成的词汇表上，并统计所述待检索图像在词汇表上的直方图(120)；以及计算待检索图像的直方图与预存在图像库中每个图像的直方图的相似度，从图像库中检索出与所述待检索图像的直方图的相似度大于预设阈值的所有图像(130)。

Description

图像的检索方法及装置

技术领域

本公开涉及图像检索领域，例如，涉及一种图像的检索方法及装置。

背景技术

随着网络及照相设备的普及，例如带有照相功能的手机的普及，人们接触到的图像越来越多，因此如何在大量的图像中快速并准确的找到一幅图像的相似图像变得越来越重要。

相关技术中的图像检索技术有基于文本的图像检索技术和基于图像的图像检索技术。其中，基于文本的图像检索技术采用文本检索技术，人工给图像库中的每个图片添加标注，用于描述图像的信息，用户检索时也通过文字来检索一类图片，如百度图片可以支持这种图像检索方法。随着数字图像处理、模式识别以及机器学习等技术的发展，基于图像的图像检索技术应运而生。基于图像的图像检索技术大量应用数字图像处理、模式识别以及机器学习领域的原理和知识，通过特定的算法提取图像的特征，通过提取到的特征计算图像之间的相似度，并依据相似度返回图像库中相似的图片，完成整个图像检索流程。

基于文本的图像检索虽然搜索出来的图片的主题大都是符合用户输入的待检索图片的语义，但基于文本的图像检索方法的图像库中的每张图像都需要人工标注，耗费大量的人力，在互联网图片更新越来越快以及人工成本越来越高的背景下，该方法正变得越来越不实用。相关技术中的基于图像的图像检索系统大都通过计算图像在一个或几个特征上的相似度来检索相近的图片，上述特征包括颜色特征、直方图特征、梯度特征以及几何特征等，但这些特征大都不具有语义性，导致检索出的图片与输入的图片匹配度不高。

针对相关技术中的上述问题，尚未存在有效的解决方案。

发明内容

本公开提供了一种图像的检索方法及装置，避免了相关技术中图像的检索方式单一且匹配度不高的现象。

本公开提供了一种图像的检索方法，包括：提取待检索图像上用于表征图像特征属性的多个特征描述子；将提取到的特征描述子映射到预先生成的词汇表上，并统计在所述词汇表上的直方图；以及计算所述待检索图像的直方图与预存在图像库中每个图像的直方图的相似度，并从所述图像库中检索出与所述待检索图像的直方图的相似度大于预设阈值的所有图像。

可选地，在提取待检索图像上用于表征图像特征属性的多个特征描述子之前，所述方法还包括：采集多种类型的图像，并对所述多种类型的图像进行预处理得到归一化后的多种类型的图像；以及提取归一化后的所述多种类型的图像的特征描述子，并对所述多种类型的图像的特征描述子进行聚类处理生成用于映射多种不同图像特征属性的特征描述子的词汇表。

可选地，在对所述多种类型的图像的特征描述子进行聚类处理生成所述词汇表之后，所述方法还包括：提取归一化后的所述多种类型的图像的特征描述子；将所述多种类型的图像中每个图像上所有的特征描述子映射到词汇表上，并统计出所述每个图像在词汇表上每个词汇的直方图；以及将所述直方图归一化得到所述每张图像在所述词汇表上的归一化后的直方图。

可选地，所述计算所述待检索图像的直方图与预存在图像库中每个图像的直方图的相似度包括：统计所述待检索图像的直方图中每一项代表不同图像特征属性的特征描述子的数量占所述待检索图像的直方图中所有特征描述子总和的比例值；以及根据所述比例值，计算所述待检索图像的直方图与预存在图像库中每个图像的直方图的相似度。

可选地，每一所述直方图中所有不同图像特征属性的特征描述子的比例值的和为1。

本公开的还提供了一种图像的检索装置，包括：特征提取模块，设置为提取待检索图像上用于表征图像特征属性的多个特征描述子；第一映射模块，设置为将提取到的特征描述子映射到预先生成的词汇表上，并统计在所述词汇表上的直方图；以及相似度计算模块，设置为计算所述待检索图像的直方图与预存在图像库中每个图像的直方图的相似度，并从所述图像库中检索出与所述待检索图像的直方图的相似度大于预设阈值的所有图像。

可选地，所述装置还包括：第一处理模块，设置为在提取待检索图像上用于表征图像特征属性的多个特征描述子之前，采集多种类型的图像，并对所述多种类型的图像进行预处理得到归一化后的所述多种类型的图像；以及第二处理模块，设置为提取归一化后的多种类型的图像的特征描述子，并对所述多种类型的图像的特征描述子进行聚类处理生成用于映射多种不同图像特征属性的特征描述子的词汇表。

可选地，所述装置还包括：提取模块，设置为在对所述多种类型的图像的特征描述子进行聚类处理生成所述词汇表之后，提取归一化后的所述多种类型的图像库中所有图像的特征描述子；第二映射模块，设置为将所述多种类型的图像中的每个图像上所有的特征描述子映射到词汇表上，并统计出所述每个图像在词汇表上每个词汇的直方图；以及归一化模块，设置为将所述直方图归一化得到所述每张图像在所述词汇表上的归一化后的直方图。

可选地，所述相似度计算模块包括：统计单元，设置为统计所述待检索图像的直方图中每一项代表不同图像特征属性的特征描述子的数量占所述待检索图像的直方图中所有特征描述子总和的比例值；以及相似度计算单元，设置为根据所述比例值，计算所述待检索图像的直方图与预存在图像库中每个图像的直方图的相似度。

本公开还提供了一种非暂态计算机可读存储介质，存储有计算机可执行指令，所述计算机可执行指令设置为执行上述方法。

本公开还提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器执行上述的方法。

本公开中通过提取待检索图像上用于表征图像特征属性的多个特征描述子，将提取到的特征描述子映射到预先生成的词汇表上，并统计所述待检索图像在所述词汇表上的直方图，通过计算待检索图像的直方图与预存在图像库中每个图像的直方图的相似度，并从图像库中检索出与所述待检索图像的直方图的相似度大于预设阈值的所有图像，避免了相关技术中图像的检索方式单一且匹配度不高的现象。

附图说明

此处所说明的附图用来提供对本公开的理解，构成本申请的一部分，本公开的示意性实施例及实施例的说明用于解释本公开，并不构成对本公开的不当限定。

图1是本公开实施例的图像的检索方法的流程图；

图2是本公开可选实施例的图像的检索装置的结构框图；

图3是本公开可选实施例的图像的检索装置的可选结构框图一；

图4是本公开可选实施例的图像的检索装置的可选结构框图二；

图5是本公开可选实施例的词汇表训练方法的流程图；

图6是本公开可选实施例的图像库建立方法的流程图；

图7是本公开可选实施例的图像检索方法的流程图；以及

图8是本公开实施例提供的电子设备的硬件结构示意图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本公开。在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不限定特定的顺序或先后次序。

在本实施例中提供了一种图像的检索方法，图1是本公开实施例的图像的检索方法的流程图。

在步骤110中，提取待检索图像上用于表征图像特征属性的多个特征描述子。

在步骤120中，将提取到的特征描述子映射到预先生成的词汇表上，并统计所述待检索图像在所述词汇表上的直方图。

在步骤130中，计算待检索图像的直方图与预存在图像库中每个图像的直方图的相似度，并从图像库中检索出与所述待检索图像的直方图的相似度大于预设阈值的所有图像。

通过本实施例的上述步骤110至步骤130可知，获取待检索图像上用于表征图像特征属性的多个特征描述子，将提取到的特征描述子映射到预先生成的词汇表上，并统计所述待检索图像在所述词汇表上的直方图，通过计算待检索图像的直方图与预存在图像库中每个图像的直方图的相似度，并从图像库中检索出与所述待检索图像的直方图的相似度大于预设阈值的所有图像，即，通过将图像的特征描述子映射到词汇表中并通过直方图来表示不同类型的图像特征属性，通过比较待检索图像的直方图与预存的直方图，将与待检索图像的直方图的相似度高于预设阈值的图像检索出来，避免了相关技术中图像的检索方式单一且匹配度不高的现象。

在本实施例的可选实施方式中，在步骤110中的获取待检索图像上用于表征图像特征属性的特征描述子之前，本实施例的方法还可以包括：

采集多种类型的图像，并对多种类型的图像进行预处理得到归一化后的多种类型的图像；以及

提取归一化后的多种类型的图像的特征描述子，并对多种类型的图像的特征描述子进行聚类处理生成用于映射多种不同图像特征属性的特征描述子的词汇表。

例如，在以下场景中：搜集训练图像，该图像可以包括人物和景物两种类型的图像；对搜集到的图片进行预处理，使图像尺寸大小归一化，利用重要信息的稠密分布的特点提取每个训练图像上对应的特征点的特征描述子，对提取到的特征描述子进行聚类处理后生成用于表征图像特征属性的词汇表。特征点的特征描述子的重要信息可以表征该特征描述子的重要程度，当特征点的位置到图像中心的距离越小时，特征点的特征描述子越重要。

此外，在本实施例的一个可选实施方式中，在对所述多种类型的图像的特征描述子进行聚类处理生成所述词汇表之后，本实施例的方法还可以包括：

提取归一化后的所述多种类型的图像的特征描述子；

将所述多种类型的图像中的每个图像上所有的特征描述子映射到词汇表上，并统计出该每个图像在词汇表上每个词汇的直方图；以及

将所述直方图归一化得到每张图像在所述词汇表上的归一化后的直方图。

例如，对图像库中的图片进行预处理，使图像尺寸大小归一化；利用重要信息稠密分布的特点提取每个图像上对应点的特征描述子；将提取到的特征描述子映射到预先生成的词汇表上，并统计所述待检索图像在所述词汇表上的直方图；统计直方图中所有特征描述子出现次数的总和，将直方图中的每一项代表不同图像特征属性的特征描述子的出现次数都除以该总和，得到比例值，确保处理后的直方图每项代表不同特征属性的特征描述子的比例值之和为1，将处理后的直方图数据保存到文件或数据库中。

对于本实施例中的步骤130，计算待检索图像的直方图与预存在图像库中所有图像的直方图的相似度包括：

统计待检索图像的直方图中每一项代表不同图像特征属性的特征描述子的数量占所述待检索图像的直方图中所有特征描述子总和的比例值；

根据所述比例值，计算待检索图像的直方图与预存在图像库中每个图像的直方图的相似度。

其中，本实施例中的每一直方图中所有不同图像特征属性的特征描述子的比例值的和为1。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例的方法可借助软件加硬件平台的方式来实现，当然也可以通过硬件实现。本公开的技术方案本质上可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如只读存储器(Read-only Memory，ROM)、随机存储存储器(Random-Access Memory，RAM)、磁碟、光盘)中，包括一个或多个指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本公开实施例的方法。

在本实施例中还提供了一种图像的检索装置，该装置可实现上述实施例及可选实施方式。如以下所使用的，术语“模块”可以实现预定功能的软件和硬件中至少一种的组合。尽管以下实施例所描述的装置可以用软件来实现，但是也可以用硬件，或者软件和硬件的组合的方式实现。

图2是本公开可选实施例的图像的检索装置的结构框图，如图2所示，该装置包括：特征提取模块22、第一映射模块24和相似度计算模块26。

特征提取模块22设置为提取待检索图像上用于表征图像特征属性的多个特征描述子。第一映射模块24，与特征提取模块22耦合连接，设置为将提取到的特征描述子映射到预先生成的词汇表上，并统计所述待检索图像在所述词汇表上的直方图。相似度计算模块26，与第一映射模块24耦合连接，设置为计算待检索图像的直方图与预存在图像库中每个图像的直方图的相似度，并从图像库中检索出与所述待检索图像的直方图的相似度大于预设阈值的所有图像。

图3是本公开可选实施例的图像的检索装置的可选结构框图一，如图3所示，该装置还可以包括：第一处理模块32和第二处理模块34。第一处理模块32设置为在提取待检索图像上用于表征图像特征属性的多个特征描述子之前，采集多种类型的图像，并对多种类型的图像进行预处理得到归一化后的多种类型的图像。第二处理模块34，与第一处理模块32耦合连接，设置为提取归一化后的多种类型的图像的特征描述子，并对多种类型的图像的特征描述子进行聚类处理生成用于映射多种不同图像特征属性的特征描述子的词汇表。

图4是本公开可选实施例的图像的检索装置的可选结构框图二，如图4所示，该装置还可以包括：提取模块42、第二映射模块44和归一化模块46。提取模块42设置为在对所述多种类型的图像的特征描述子进行聚类处理生成所述词汇表之后，提取归一化后的所述多种类型的图像的特征描述子。第二映射模块44，与提取模块42耦合连接，设置为将所述多种类型的图像中的每个图像上所有的特征描述子映射到词汇表上，并统计出每个图像在词汇表上每个词汇的直方图。归一化模块46，与第二映射模块44耦合连接，设置为将所述直方图归一化得到每张图像在所述词汇表上的归一化后的直方图。

可选地，本实施例图2中的相似度计算模块26还可以包括：统计单元和相似度计算单元。统计单元设置为统计待检索图像的直方图中每一项代表不同图像特征属性的特征描述子的数量占所述待检索图像的直方图中所有特征描述子总和的比例值。相似度计算单元设置为根据所述比例值，计算待检索图像的直方图与预存在图像库中每个图像的直方图的相似度。

可选地，在本实施例中每一直方图中所有不同图像特征属性的特征描述子的比例值的和为1。

上述模块是可以通过软件或硬件来实现的，当采用硬件来实现时，上述模块均位于同一处理器中，或者，上述模块分别位于多个处理器中。

本公开提出了一种基于重要信息稠密分布特点的词袋模型图像检索方法，本可选实施例通过提取图像的稠密特征，通过聚类处理生成一定量的具有代表性的特征描述子，组成词汇表。在检索阶段，通过衡量待检索图片与图像库中的每个图片在词汇表上的直方图的相似度来完成图像检索。在本可选实施例中涉及到的词袋模型可以提取一定的语义信息，利用图像上重要信息的稠密分布特点可以提取到更多的重要信息，忽略掉一定的次要信息。

其中，所述稠密特征可以是指利用重要信息在图像上的稠密分布特点(即图像中心附近的重要信息较多，可以在图像中心附近多选择一些特征点)选取特征点，并提取选取的特征点的特征描述子。通过上述方法提取到的所有特征点及特征描述子叫做图像的稠密特征。

本可选实施例的检索方法可以包括训练词汇表、构建待检索图像库以及图像检索。

训练词汇表可以包括：

搜集训练图片，图像类别可以包括人物类型和景物类型等；

对搜集到的图片进行预处理，使图像尺寸大小归一化；

利用重要信息稠密分布的特点提取每个训练图像上对应点的特征描述子；以及

对提取到的特征描述子采用K-平均(K-Means)算法进行聚类，生成训练词汇表。

构建待检索图像库可以包括：

对图像库中的图片进行预处理，使图像尺寸大小归一化；

利用重要信息的稠密分布特点提取每个图像上对应点的特征描述子；

将提取到的特征映射到预先生成的词汇表上，并统计每个图像在所述词汇表上的直方图；

统计直方图中所有特征描述子出现次数的总和，将直方图中的每一项代表不同图像特征属性的特征描述子的数量都除以该总和，确保处理后的直方图每项代表不同图像特征属性的特征描述子的比例值之和为1；以及

将处理后的直方图数据保存到文件或数据库中。

图像检索的步骤可以包括：

对待检索图片进行预处理，使图像尺寸大小归一化；

利用重要信息稠密分布的特点提取待检索图像上对应点的特征描述子；

将提取到的特征映射到预先生成的词汇表上，并统计直方图；

统计直方图中项出现次数的总和，将直方图中的每一项词汇出现次数的都除以该总和，确保处理后的直方图每项属性的特征描述子的比例值之和为1；

计算待检索图像的直方图与图像库中每张图像预先计算好的直方图之间的相似度；

对相似度进行排序，并获取相似度高于一阈值的所有图像的信息；以及

按用户要求，返回最相似的k张图片。

由此可知，本可选实施例利用图像上重要信息稠密分布的特点以及词袋模型进行图像检索，所提取到的特征既具有一定的语义性，可以描述图像的内容，又突出了图像中的重点信息，减少了一部分次要信息，提高了检索的准确度。

图5是根据本公开可选实施例的词汇表训练方法的流程图。

在步骤510中，搜集训练图片。

其中，图像类别可以包括人物和景物等，图片数目不太少，可以大于一阈值，例如是200或者300。图片数目越多，处理效果越好，即阈值越大，图像处理效果一般越好。

在步骤520中，得到所有图片上所有特征点的特征描述子。

其中，该步骤520可以通过如下步骤来实现：

对图片进行预处理，使图像尺寸大小归一化；

计算图像上所有特征点的位置；以及

计算所有特征点的特征描述子。

上述步骤中，通过计算图像上所有特征点的位置来选取特征点，比如，在与图像中心距离较小位置多选取一些特征点，在图像的边缘地带选取少量的特征点。

其中，该计算每张图像上所有特征点的位置的可以方式为：指定一个初始特征点，该初始特征点具有二维坐标，根据前一特征点的坐标与图像中心坐标之间的距离计算步长，依据上述计算得到的步长计算当前特征点的位置坐标，记录当前特征点的位置坐标。步长可以根据前一特征点的坐标与图像中心坐标之间的距离确定，距离越小步长越小。前一个特征点的横坐标和纵坐标分别与计算出的步长相加，得到当前特征点的位置。

在步骤530中，对提取到的所有特征描述子通过K-Means算法进行聚类，生成词汇表。

图6是是本公开可选实施例的图像库建立方法的流程图，如图6所示，该方法可以处理图像库中的每张图片。

在步骤610中，对图像进行预处理，使图像尺寸大小归一化。

在步骤620中，计算图像上所有特征点的位置。

其中，可以设置一个初始特征点，根据前一特征点距图像中心的距离计算步长，依据上述中的步长计算当前特征点的位置，记录当前特征点的位置，循环上述的方式直到计算出所有特征点的位置。

在步骤630中，计算所有特征点的特征描述子。

在步骤640中，将计算的特征点的特征描述子映射到词汇表上，得到直方图。

在步骤650中，统计直方图中所有词汇出现的次数的总和。

在步骤660中，将直方图中每个词汇出现的次数除以步骤650中计算出的总和。其中，词汇表中的词汇是前面“训练词汇表”后生成的。

在步骤670中，将步骤660中计算的直方图及图像的相关信息存文件或数据库。

图7是本公开可选实施例的图像检索方法的流程图。

在步骤710中，对待检索图像进行预处理，使图像尺寸大小归一化。

在步骤720中，计算待检索图像上所有特征点的位置。

其中，计算所有特征点的位置可以包括设置一个初始特征点，根据前一特征点距图像中心的距离计算步长，依据上述中的步长计算当前特征点的位置，记录当前特征点的位置，循环上述过程直到计算出所有特征点的位置。

在步骤730中，计算所有特征点的特征描述子。

在步骤740中，将计算的特征点的特征描述子映射到词汇表上，得到直方图。

在步骤750中，统计待检索图像的直方图中所有词汇出现的次数的总和。

在步骤760中，将待检索图像的直方图中每个词汇出现的次数除以上述计算出的总和。

在步骤770中，计算待检索图像的直方图与图像库中的每个直方图的相似度。

在步骤780中，依据相似度，并用将于待检索图像的直方图的相似度不大于一个阈值的图片过滤掉。

在步骤790中，依据用户的要求，返回检索的结果。

本公开的实施例还提供了一种非暂态计算机可读存储介质。可选地，在本实施例中，上述存储介质可以被设置为存储用于执行以下步骤的程序代码：

提取待检索图像上用于表征图像特征属性的多个特征描述子；

将提取到的特征描述子映射到预先生成的词汇表上，并所述待检索图像统计在词汇表上的直方图；以及

计算待检索图像的直方图与预存在图像库中每个图像的直方图的相似度，并从图像库中检索出与所述待检索图像的直方图的相似度大于预设阈值的所有图像。

本公开实施例还提供了一种电子设备的硬件结构示意图。参见图8，该电子设备包括：

至少一个处理器(processor)80，图8中以一个处理器80为例；和存储器(memory)81，还可以包括通信接口(Communications Interface)82和总线83。其中，处理器80、通信接口82、存储器81可以通过总线83完成相互间的通信。通信接口82可以用于信息传输。处理器30可以调用存储器31中的逻辑指令，以执行上述实施例的方法。

此外，上述的存储器81中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。

存储器81作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序，如本公开实施例中的方法对应的程序指令或模块。处理器80通过运行存储在存储器81中的软件程序、指令或模块，从而执行功能应用以及数据处理，即实现上述方法实施例中的方法。

存储器81可包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端设备的使用所创建的数据等。此外，存储器81可以包括高速随机存取存储器，还可以包括非易失性存储器。上述的本公开的模块或步骤可以用计算装置来实现，本公开的模块或步骤可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上。可选地，本公开的模块或步骤可以用计算装置可执行的程序代码来实现，并存储在存储装置中由计算装置来执行。在一些情况下，可以以不同于此上述实施例中的顺序执行所示出或描述的步骤，或者将上述模块分别制作成多个集成电路模块，或者将步骤或模块中的多个模块或步骤制作成单个集成电路模块来实现。

工业实用性

本公开提供的图像的检索方法及装置，避免了相关技术中图像的检索方式单一且匹配度不高的现象。

Claims

一种图像的检索方法，包括：

提取待检索图像上用于表征图像特征属性的多个特征描述子；

将提取到的特征描述子映射到预先生成的词汇表上，并统计所述待检索图像在所述词汇表上的直方图；以及

计算所述待检索图像的直方图与预存在图像库中每个图像的直方图的相似度，并从所述图像库中检索出与所述待检索图像的直方图的相似度大于预设阈值的所有图像。
根据权利要求1所述的方法，在提取待检索图像上用于表征图像特征属性的多个特征描述子之前，所述方法还包括：

采集多种类型的图像，并对所述多种类型的图像进行预处理得到归一化后的多种类型的图像；以及

提取归一化后的多种类型的图像的特征描述子，并对所述多种类型的图像的特征描述子进行聚类处理生成用于映射多种不同图像特征属性的特征描述子的词汇表。
根据权利要求2所述的方法，在对所述多种类型的图像的特征描述子进行聚类处理生成所述词汇表之后，所述方法还包括：

提取归一化后的所述多种类型的图像的特征描述子；

将所述多种类型的图像中的每个图像上所有的特征描述子映射到词汇表上，并统计出所述每个图像在词汇表上每个词汇的直方图；以及

将所述直方图归一化得到所述每张图像在所述词汇表上的归一化后的直方图。
根据权利要求3所述的方法，其中，所述计算所述待检索图像的直方图与预存在图像库中每个图像的直方图的相似度包括：

统计所述待检索图像的直方图中每一项代表不同图像特征属性的特征描述子的数量占所述待检索图像的直方图中所有特征描述子总和的比例值；以及

根据所述比例值，计算所述待检索图像的直方图与预存在图像库中每个图像的直方图的相似度。
根据权利要求4所述的方法，其中，每一所述直方图中所有不同图像特征属性的特征描述子的比例值的和为1。
一种图像的检索装置，包括：

特征提取模块，设置为提取待检索图像上用于表征图像特征属性的多个特征描述子；

第一映射模块，设置为将提取到的特征描述子映射到预先生成的词汇表上，并统计在所述词汇表上的直方图；以及

相似度计算模块，设置为计算所述待检索图像的直方图与预存在图像库中每个图像的直方图的相似度，并从所述图像库中检索出与所述待检索图像的直方图的相似度大于预设阈值的所有图像。
根据权利要求6所述的装置，还包括：

第一处理模块，设置为在提取待检索图像上用于表征图像特征属性的多个特征描述子之前，采集多种类型的图像，并对所述多种类型的图像进行预处理得到归一化后的多种类型的图像；以及

第二处理模块，设置为提取归一化后的多种类型的图像的特征描述子，并对所述多种类型的图像的特征描述子进行聚类处理生成用于映射多种不同图像特征属性的特征描述子的词汇表。
根据权利要求7所述的装置，还包括：

提取模块，设置为在对所述多种类型的图像的特征描述子进行聚类处理生成所述词汇表之后，提取归一化后的所述多种类型的图像的特征描述子；

第二映射模块，设置为将所述多种类型的图像中的每个图像上所有的特征描述子映射到词汇表上，并统计出所述每个图像在词汇表上每个词汇的直方图；以及

归一化模块，设置为将所述直方图归一化得到所述每张图像在所述词汇表上的归一化后的直方图。
根据权利要求8所述的装置，其中，所述相似度计算模块包括：

统计单元，设置为统计所述待检索图像的直方图中每一项代表不同图像特征属性的特征描述子的数量占所述待检索图像的直方图中所有特征描述子总和的比例值；以及

相似度计算单元，设置为根据所述比例值，计算所述待检索图像的直方图与预存在图像库中每个图像的直方图的相似度。
根据权利要求9所述的装置，其中，每一所述直方图中所有不同图像特征属性的特征描述子的比例值的和为1。
一种非暂态计算机可读存储介质，存储有计算机可执行指令，所述计算机可执行指令设置为执行权利要求1-5中任一项的方法。