CN108629345B

CN108629345B - 高维图像特征匹配方法和装置

Info

Publication number: CN108629345B
Application number: CN201710158472.3A
Authority: CN
Inventors: 安山; 陈宇
Original assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Jingdong Shangke Information Technology Co Ltd
Current assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Jingdong Shangke Information Technology Co Ltd
Priority date: 2017-03-17
Filing date: 2017-03-17
Publication date: 2021-07-30
Anticipated expiration: 2037-03-17
Also published as: US20200026958A1; US11210555B2; CN108629345A; WO2018166273A1

Abstract

本发明公开了一种高维图像特征匹配方法和装置，涉及图像检索领域。其中的方法包括：提取待检索图像的高维图像特征；将待检索图像的高维图像特征划分为多个低维图像特征；将待检索图像的各低维图像特征与数据库中图像的低维图像特征的各层聚类中心进行比较；根据比较结果确定待检索图像与数据库中图像的低维图像特征相似度，从而在数据库中检索出与待检索图像的高维图像特征匹配的特征。本发明能够提高特征匹配的准确率，并且还能够提高高维图像特征匹配的效率。

Description

高维图像特征匹配方法和装置

技术领域

本发明涉及图像检索领域，尤其涉及一种高维图像特征匹配方法和装置。

背景技术

特征匹配问题通常定义为近似最近邻搜索问题(Approximate NearestNeighbor)，即在数据库特征中搜索与检索特征欧式距离最近的特征。高维特征指超过1000维的图像特征，由于维度灾难(Curse of dimensionality)的存在，高维特征的匹配很困难。

图像的描述方法包括局部特征和全局特征两类。图像的局部特征通常是数百个维数较低的特征，图像全局特征通常是维数较高的单个特征。目前，可以利用穷举搜索(exaustive search)实现全局特征的匹配，穷举搜索能够保证欧氏距离下最近邻的精确匹配，但是效率极其低下。还可以利用通过学习二值码(learning binary codes)来进行匹配，该方法通过使用双线性映射，将高维特征转换为维度低但保留相似性的二值码，但对高维特征进行了双线性映射，可能存在映射误差，导致匹配错误。

发明内容

本发明要解决的一个技术问题是提供一种高维图像特征匹配方法和装置能够提高特征匹配的准确率。

根据本发明的一个实施例，提出一种高维图像特征匹配方法，包括：提取待检索图像的高维图像特征；将待检索图像的高维图像特征划分为多个低维图像特征；将待检索图像的各低维图像特征与数据库中图像的低维图像特征的各层聚类中心进行比较；根据比较结果确定待检索图像与数据库中图像的低维图像特征相似度，从而在数据库中检索出与待检索图像的高维图像特征匹配的特征。

进一步地，数据库中图像的低维图像特征的各层聚类中心通过以下方法进行确定：提取数据库中图像的高维图像特征；将数据库中图像的高维图像特征划分为多个低维图像特征；对数据库中图像的低维图像特征进行分层聚类计算确定低维图像特征的各层聚类中心。

进一步地，数据库中图像的各低维图像特征的各层聚类中心与倒排文件关联。

进一步地，对数据库中图像的低维图像特征进行分层聚类计算确定低维图像特征的各层聚类中心包括：对数据库中图像的低维图像特征组成的集合进行无监督训练，其中，定义聚类的分叉因子为k；在初始训练集中随机选择一个低维图像特征数据点作为kmeans聚类算法的初始聚类中心；根据点到最近中心的概率比值确定k个初始聚类中心；利用kmeans聚类算法将数据库中图像的低维图像特征组成的集合划分为k个集合，作为kmeans树的第一层；利用kmeans聚类算法依次对kmeans树中当前层的每个集合进行迭代划分，直到达到kmeans树的叶子层；根据聚类均值计算数据库中图像的低维图像特征的每一层的每个集合的聚类中心。

进一步地，将待检索图像的各低维图像特征与数据库中图像的低维图像特征的各层聚类中心进行比较包括：将待检索图像的每个低维图像特征，从数据库中图像的低维图像特征的kmeans树的第一层开始，与每一层k个聚类中心比较，确定与待检索图像的每个低维图像特征距离最近的聚类中心；递归与距离最近的聚类中心的子聚类中心进行比较，直到达到kmeans树的叶子层。

进一步地，该方法还包括：利用TF-IDF词频-逆向文件频率算法对待检索图像与数据库中图像的低维图像特征相似度进行评分；利用快速选择算法结合插入排序法获取评分最高的N个图像，将评分最高的N个图像的高维图像特征作为与待检索图像的高维图像特征匹配的特征。

根据本发明的另一个实施例，还提出一种高维图像特征匹配装置，包括：第一高维图像特征提取单元，用于提取待检索图像的高维图像特征；第一低维图像特征划分单元，用于将待检索图像的高维图像特征划分为多个低维图像特征；特征比较单元，用于将待检索图像的各低维图像特征与数据库中图像的低维图像特征的各层聚类中心进行比较；特征匹配确定单元，用于根据比较结果确定待检索图像与数据库中图像的低维图像特征相似度，从而在数据库中检索出与待检索图像的高维图像特征匹配的特征。

进一步地，数据库中图像的低维图像特征的各层聚类中心通过以下单元进行确定：第二高维图像特征提取单元，用于提取数据库中图像的高维图像特征；第二低维图像特征划分单元，用于将数据库中图像的高维图像特征划分为多个低维图像特征；聚类中心确定单元，用于对数据库中图像的低维图像特征进行分层聚类计算确定低维图像特征的各层聚类中心。

进一步地，聚类中心确定单元用于对数据库中图像的低维图像特征组成的集合进行无监督训练，其中，定义聚类的分叉因子为k；在初始训练集中随机选择一个低维图像特征数据点作为kmeans聚类算法的初始聚类中心；根据点到最近中心的概率比值确定k个初始聚类中心；利用kmeans聚类算法将数据库中图像的低维图像特征组成的集合划分为k个集合，作为kmeans树的第一层；利用kmeans聚类算法依次对kmeans树中当前层的每个集合进行迭代划分，直到达到kmeans树的叶子层；根据聚类均值计算数据库中图像的低维图像特征的kmeans树的每一层的每个集合的聚类中心。

进一步地，特征匹配确定单元用于将待检索图像的每个低维图像特征，从数据库中图像的低维图像特征的kmeans树的第一层开始，与每一层k个聚类中心比较，确定与待检索图像的每个低维图像特征距离最近的聚类中心；递归与距离最近的聚类中心的子聚类中心进行比较，直到达到kmeans树的叶子层。

进一步地，特征匹配确定单元还用于利用TF-IDF词频-逆向文件频率算法对待检索图像与数据库中图像的低维图像特征相似度进行评分；利用快速选择算法结合插入排序法获取评分最高的N个图像，将评分最高的N个图像的高维图像特征作为与待检索图像的高维图像特征匹配的特征。

根据本发明的另一个实施例，还提出一种高维图像特征匹配装置，包括：存储器；以及耦接至存储器的处理器，处理器被配置为基于存储在存储器的指令执行上述的方法。

根据本发明的另一个实施例，还提出一种计算机可读存储介质，其上存储有计算机程序指令，该指令被处理器执行时实现上述的方法的步骤。

与现有技术相比，本发明实施例通过将待检索图像的高维图像特征划分为多个低维图像特征，然后将各低维图像特征与数据库中图像的低维图像特征的各层聚类中心进行比较，确定待检索图像与数据库中图像的低维图像特征相似度，从而在数据库中检索出与待检索图像的高维图像特征匹配的特征，能够提高特征匹配的准确率。

通过以下参照附图对本发明的示例性实施例的详细描述，本发明的其它特征及其优点将会变得清楚。

附图说明

构成说明书的一部分的附图描述了本发明的实施例，并且连同说明书一起用于解释本发明的原理。

参照附图，根据下面的详细描述，可以更加清楚地理解本发明，其中：

图1为本发明高维图像特征匹配方法的一个实施例的流程示意图。

图2为本发明高维图像特征匹配方法的离线训练过程的一个实施例的流程示意图。

图3为倒排文件示意图。

图4为本发明高维图像特征匹配方法的在线训练过程的一个实施例的流程示意图。

图5为本发明高维图像特征匹配方法的另一个实施例的流程示意图。

图6为本发明高维图像特征匹配装置的一个实施例的结构示意图。

图7为本发明高维图像特征匹配装置的另一个实施例的结构示意图。

图8为本发明高维图像特征匹配装置的再一个实施例的结构示意图。

图9为本发明高维图像特征匹配装置的又一个实施例的结构示意图。

具体实施方式

现在将参照附图来详细描述本发明的各种示例性实施例。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

同时，应当明白，为了便于描述，附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本发明及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为授权说明书的一部分。

在这里示出和讨论的所有示例中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它示例可以具有不同的值。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本发明进一步详细说明。

图1为本发明高维图像特征匹配方法的一个实施例的流程示意图。该方法包括以下步骤：

在步骤110，提取待检索图像的高维图像特征。其中，高维图像特征指超过1000维的图像特征，可以使用深度神经网络提取待检索图像的高维图像特征。深度神经网络每个输出层可获取的特征达到4096维，可以使用后两个输出层的特征线性组合为8192维特征来描述图像，即一幅图像可以由1个8192维特征表示。

在步骤120，将待检索图像的高维图像特征划分为多个低维图像特征。其中，将高维图像特征x划分为m个不同的低维图像特征u_j，1≤j≤m，低维图像特征u_j的维度为D^*＝D/m，其中D是m的倍数，划分公式如下：

x,…x_D*|…|x_D-D*+1,…x_D→u_1(x),…u_m(x) (1)

在步骤130，将待检索图像的各低维图像特征与数据库中图像的低维图像特征的各层聚类中心进行比较。其中，可以预先提取数据库中图像的高维图像特征，将数据库中图像的高维图像特征划分为多个低维图像特征，然后对数据库中图像的低维图像特征进行分层聚类计算确定低维图像特征的各层聚类中心，最后将待检索图像的每个低维图像特征与各层聚类中心进行比较。

在步骤140，根据比较结果确定待检索图像与数据库中图像的低维图像特征相似度，从而在数据库中检索出与待检索图像的高维图像特征匹配的特征。例如，先对图像特征的相似度进行评分，将评分最高的N个图像的高维图像特征作为与待检索图像的高维图像特征匹配的特征。

在该实施例中，将待检索图像的高维图像特征划分为多个低维图像特征，然后将各低维图像特征与数据库中图像的低维图像特征的各层聚类中心进行比较，确定待检索图像与数据库中图像的低维图像特征相似度，从而在数据库中检索出与待检索图像的高维图像特征匹配的特征，能够提高特征匹配的准确率。

本发明高维图像特征匹配方法包括离线训练过程和在线检索过程，其中，图2为本发明高维图像特征匹配方法的离线训练过程的一个实施例的流程示意图。

在步骤210，提取数据库中图像的高维图像特征。其中，可以使用深度神经网络提取数据库中图像的高维图像特征。

在步骤220，将数据库中图像的高维图像特征划分为多个低维图像特征。其中，数据库图像和待检索图像的高维图像特征划分方式可以相同。

在步骤230，对数据库中图像的低维图像特征进行分层聚类计算确定低维图像特征的各层聚类中心。其中，可以对数据库中图像的低维图像特征组成的集合进行无监督训练，定义聚类的分叉因子为k，k为自然数。在初始训练集中随机选择一个低维图像特征数据点作为kmeans聚类算法的初始聚类中心，根据点到最近中心的概率比值确定k个初始聚类中心。然后利用kmeans聚类算法将数据库中图像的低维图像特征组成的集合划分为k个集合，作为kmeans树的第一层，然后利用kmeans聚类算法依次对kmeans树中当前层的每个集合进行迭代划分，直到达到kmeans树的叶子层，根据聚类均值计算数据库中图像的低维图像特征的每一层的每个集合的聚类中心。

为了在在线检索时能够快速查找到低维图像特征的聚类中心，该离线训练过程还可以包括步骤240，即将数据库中图像的各低维图像特征的各层聚类中心关联倒排文件。其中，可以将每个聚类中心定义为一个视觉词(visual word)，将每个视觉词都关联一个倒排文件，其中，导频文件统计了视觉词汇在每篇文档中出现的频率，其中，倒排文件如图3所示，1、2…9表示视觉词。

在具体应用中，可以使用倒排文件频率(inverse document frequency)衡量每个视觉词w_j。倒排文件频率计算公式如下：

其中，idf(i)为倒排文件频率，N是训练图像的数量，n_j是视觉词w_j在训练图像中出现的次数。

为了将图像I_t转换为词袋(bag-of-words)矢量v_t∈R^W，在每一层选择L2距离最小的中间结点，将图像特征矢量从kmeans树的第一层向叶子层进行遍历。计算图像I_t中每个词汇的词频(term frequency)如下所示：

其中，tf(i,It)为图像I_t中每个词汇的词频；n_iIt表示词汇在图像中出现的次数，n_It表示图像中词汇的总数。

矢量v_t的第i项为：

在建立bag-of-words模型的同时维护一个倒排文件，为词汇库中的每个词汇w_j存储包含该词汇的图像I_t的列表，这样在检索数据库时只需比较与待检索图像有相同词汇的图像。

在线训练过程如图4所示，在步骤410，提取待检索图像的高维图像特征。

在步骤420，将待检索图像的高维图像特征划分为多个低维图像特征。

在步骤430，将各个低维图像特征与各层聚类中心进行比较实现特征量化。将待检索图像的每个低维图像特征，从数据库中图像的低维图像特征的kmeans树的第一层开始，与每一层k个聚类中心比较，确定与待检索图像的每个低维图像特征距离最近的聚类中心，递归与距离最近的聚类中心的子聚类中心进行比较，直到达到kmeans树的叶子层，该过程实现了每个低维图像特征的量化。

如果kmeans树包含L层，则对于一个低维图像特征而言，量化共需要的计算成本为kL次距离计算，当k不是很大时，量化过程非常迅速。

在步骤440，利用TF-IDF(Term Frequency Inverse Document Frequency，词频-逆向文件频率)对待检索图像与数据库中图像的低维图像特征相似度进行评分。

其中，可以给kmeans树的每一层设定一个权值，然后对经过同一层的低维图像特征加上相应的分数。由于不同层所含信息量不同，所以权值也有所不同。当两个低维图像特征接近叶子层时这两个特征更为相似，该层的权值也较大，当接近于第一层时权值较小。将层数i的权值根据信息熵设定为：

d_i＝m_i×w_i (6)

其中，N为数据库中图像数，N_i为数据库中至少有一个低维图像特征通过层数i的图像数。根据上述权值定义待检索矢量和数据库矢量：

q_i＝n_i×w_i (7)

其中m_i、n_i分别为待检索图像与数据库图像中通过层数i的低维图像特征个数。两幅图像特征间的相似性评分为：

其中，可以使用L₁范数进行计算：

在步骤450，利用快速选择算法结合插入排序法获取评分最高的N个图像，将评分最高的N个图像的高维图像特征作为与待检索图像的高维图像特征匹配的特征。

计算得到待检索图像与数据库图像的相似度评分之后，需要获取前N个评分对应的图像作为检索结果。常用方法是对评分进行排序，获得前N个的图像。这种方法在数据库图像较多时效率低下，即使使用快速排序方法，时间复杂度也过高，为O(nlogn)。如检索100万的图像数据库，排序所用时间超过35秒。

而在本该实施例中可以采用快速选择算法，寻找第N大的相似度评分，同时可获得未排序的前N大的相似度评分。通常N<10，因此使用插入排序法对这N个相似度评分进行排序，获得检索结果。快速选择算法复杂度为O(n)，插入排序消耗时间可忽略不计，由此可大幅度提高检索效率。

在该实施例中，通过离线训练和在线检索，分别将数据库中图像和待检索图像的高维图像特征划分为多个低维图像特征，然后将各低维图像特征与数据库中图像的低维图像特征的各层聚类中心进行比较，确定待检索图像与数据库中图像的低维图像特征相似度，从而在数据库中检索出与待检索图像的高维图像特征匹配的特征，能够提高特征匹配的准确率，另外，由于利用快速选择算法结合插入排序法获取评分最高的N个图像，将评分最高的N个图像的高维图像特征作为与待检索图像的高维图像特征匹配的特征，因此还提高了高维图像特征匹配的效率。

图5为本发明高维图像特征匹配方法的另一个实施例的流程示意图。其中，实验所用计算机配置为Intel Xeon E5-2630，主频2.30GHz，64G内存。该方法包括以下步骤：

在步骤510，提取数据库中图像的高维图像特征。例如，使用深度神经网络，对20万女装图像提取20万高维图像特征。

在步骤512，提取待检索图像的高维图像特征。

在步骤520，将数据库中图像的高维图像特征划分为多个低维图像特征。例如，深度神经网络每个输出层可获取的特征达到4096维，线性组合为8192维特征，将这8192维特征划分为128个64维子特征。

在步骤522，将待检索图像的高维图像特征划分为多个低维图像特征。即将待检索图像的每个8192维特征同样划分为128个64维子特征。

在步骤530，对数据库中图像的低维图像特征进行分层聚类计算确定低维图像特征的各层聚类中心。

其中，可以使用kmeans++方法选择kmeans聚类算法的初始聚类中心。kmeans++算法根据点到最近中心的概率比值选择初始中心，步骤如下：

(1)从数据点X中随机选择一个初始中心c1＝x。

(2)设置D(x)作为从一个数据点x到最近中心的最短欧氏距离。

(3)选择下一个中心ci，其中ci＝x'∈X，其概率值为D(x')2/ΣD(x)2。

(4)重复(2)和(3)直到选择所有的k个中心。

在一个实施例中，还可以选择固定栅格距离的点作为初始聚类中心，或随机初始化方法、遗传算法初始化方法等选择初始聚类中心。

kmeans聚类法是一种无监督聚类算法。该算法的步骤如下：

(1)从n个数据矢量中任意选择k个矢量作为初始聚类中心。

(2)对于其他矢量，根据它们到这些聚类中心的欧氏距离，分别将它们分配给与其最近的聚类。

(3)根据聚类均值计算新的聚类中心，聚类均值

为属于聚类i的矢量个数，p_x为属于聚类i的矢量。

(4)如此循环，直到目标函数值满足终止条件，最终将数据分为k类。其中，可以采用误差平方和准则函数作为目标函数：

其中，x_j为数据矢量，S_i为x_j所处的聚类，u_i为聚类S_i中点的平均值。

在步骤540，将数据库中图像的各低维图像特征的各层聚类中心关联倒排文件，以便在在线检索时能够快速查找到低维图像特征的聚类中心。

在步骤550，将各个低维图像特征与各层聚类中心进行比较实现特征量化。

在步骤560，利用TF-IDF对待检索图像与数据库中图像的低维图像特征相似度进行评分。

在步骤570，利用快速选择算法结合插入排序法获取评分最高的N个图像，将评分最高的N个图像的高维图像特征作为与待检索图像的高维图像特征匹配的特征。

在该实施例中，若检索返回的第一个结果为正确匹配，则记为结果准确，实验结果表面检索准确率高达99.9470％。检索时间小于0.015秒，其中步骤550的特征量化时间约为0.001秒，步骤560的评分时间约为0.010秒，步骤570的获取前8个评分图像时间约为0.003秒。

在另一个实施例中，使用深度神经网络，对100万女装图像提取100万8192维图像特征。将这8192维特征划分为128个64维子特征，使用上述实施例中的方法进行分层聚类。检索环节，使用所有的100万高维图像特征进行检索，每个8192维特征划分为128个64维子特征。检索准确率高达96.2927％。检索时间小于0.025秒，其中步骤550的特征量化时间约为0.002秒，步骤560的评分时间约为0.008秒，步骤570的获取前8个评分图像时间约为0.012秒。

通过上述各实施例中，将高维图像特征划分为多个低维图像特征，使之能够通过分层kmeans方法进行检索，由于使用kmeans++算法选择初始聚类中心，与随机选择初始聚类中心相比，提高了聚类效果和聚类效率，另外，使用快速选择算法结合插入排序法获取前N个评分对应图像，提高算法速度。

图6为本发明高维图像特征匹配装置的一个实施例的结构示意图。该装置包括第一高维图像特征提取单元610、第一低维图像特征划分单元620、特征比较单元630、特征匹配确定单元640。

第一高维图像特征提取单元610用于提取待检索图像的高维图像特征。其中，可以使用深度神经网络提取待检索图像的高维图像特征。

第一低维图像特征划分单元620用于将待检索图像的高维图像特征划分为多个低维图像特征。

特征比较单元630用于将待检索图像的各低维图像特征与数据库中图像的低维图像特征的各层聚类中心进行比较。其中，可以预先提取数据库中图像的高维图像特征，将数据库中图像的高维图像特征划分为多个低维图像特征，然后对数据库中图像的低维图像特征进行分层聚类计算确定低维图像特征的各层聚类中心，然后将待检索图像的每个低维图像特征与各层聚类中心进行比较。

特征匹配确定单元640用于根据比较结果确定待检索图像与数据库中图像的低维图像特征相似度，从而在数据库中检索出与待检索图像的高维图像特征匹配的特征。例如，先对图像特征的相似度进行评分，将评分最高的N个图像的高维图像特征作为与待检索图像的高维图像特征匹配的特征。

在该实施例中，将待检索图像的高维图像特征划分为多个低维图像特征，然后将各低维图像特征与数据库中图像的低维图像特征的各层聚类中心进行比较，确定待检索图像与数据库中图像的低维图像特征相似度，从而在数据库中检索出与待检索图像的高维图像特征匹配的特征，能够提高特征匹配的准确率，并且提高了高维图像特征匹配的效率。

图7为本发明高维图像特征匹配装置的另一个实施例的结构示意图。该装置包括第一高维图像特征提取单元740、第一低维图像特征划分单元750、特征比较单元760、特征匹配确定单元770。其中，数据库中图像的低维图像特征的各层聚类中心通过第二高维图像特征提取单元710、第二低维图像特征划分单元720和聚类中心确定单元730进行确定。

其中，第二高维图像特征提取单元710用于提取数据库中图像的高维图像特征。

第二低维图像特征划分单元720用于将数据库中图像的高维图像特征划分为多个低维图像特征。其中，数据库图像和待检索图像的高维图像特征划分方式可以相同。

聚类中心确定单元730用于对数据库中图像的低维图像特征进行分层聚类计算确定低维图像特征的各层聚类中心。其中，可以对数据库中图像的低维图像特征组成的集合进行无监督训练，定义聚类的分叉因子为k，k为自然数。在初始训练集中随机选择一个低维图像特征数据点作为kmeans聚类算法的初始聚类中心，根据点到最近中心的概率比值确定k个初始聚类中心。然后利用kmeans聚类算法将数据库中图像的低维图像特征组成的集合划分为k个集合，作为kmeans树的第一层，然后利用kmeans聚类算法依次对kmeans树中当前层的每个集合进行迭代划分，直到达到kmeans树的叶子层，根据聚类均值计算数据库中图像的低维图像特征的每一层的每个集合的聚类中心。

第一高维图像特征提取单元740用于提取待检索图像的高维图像特征。

第一低维图像特征划分单元750用于将待检索图像的高维图像特征划分为多个低维图像特征。

特征比较单元760用于将各个低维图像特征与各层聚类中心进行比较实现特征量化。将待检索图像的每个低维图像特征，从数据库中图像的低维图像特征的kmeans树的第一层开始，与每一层k个聚类中心比较，确定与待检索图像的每个低维图像特征距离最近的聚类中心，递归与距离最近的聚类中心的子聚类中心进行比较，直到达到kmeans树的叶子层，该过程实现了每个低维图像特征的量化。

特征匹配确定单元770用于将待检索图像的每个低维图像特征，从数据库中图像的低维图像特征的kmeans树的第一层开始，与每一层k个聚类中心比较，确定与待检索图像的每个低维图像特征距离最近的聚类中心；递归与距离最近的聚类中心的子聚类中心进行比较，直到达到kmeans树的叶子层。

特征匹配确定单元770还用于利用快速选择算法结合插入排序法获取评分最高的N个图像，将评分最高的N个图像的高维图像特征作为与待检索图像的高维图像特征匹配的特征。

其中，计算得到待检索图像与数据库图像的相似度评分之后，需要获取前N个评分对应的图像作为检索结果。常用方法是对评分进行排序，获得前N个的图像。这种方法在数据库图像较多时效率低下，即使使用快速排序方法，时间复杂度也过高，为O(nlogn)。如检索100万的图像数据库，排序所用时间超过35秒。

为了在在线检索时能够快速查找到低维图像特征的聚类中心，还可以将数据库中图像的各低维图像特征的各层聚类中心关联倒排文件。

图8为本发明高维图像特征匹配装置的再一个实施例的结构示意图。该装置包括存储器810和处理器820。其中：

存储器810可以是磁盘、闪存或其它任何非易失性存储介质。存储器用于存储图1-4所对应实施例中的指令。

处理器820耦接至存储器810，可以作为一个或多个集成电路来实施，例如微处理器或微控制器。该处理器820用于执行存储器中存储的指令，能够提高特征匹配的准确率，并且还提高了高维图像特征匹配的效率。

在一个实施例中，还可以如图9所示，高维图像特征匹配装置900包括存储器910和处理器920。处理器920通过BUS总线930耦合至存储器910。该APP后台系统900还可以通过存储接口940连接至外部存储装置950以便调用外部数据，还可以通过网络接口960连接至网络或者另外一台计算机系统(未标出)。此处不再进行详细介绍。

在该实施例中，通过存储器存储数据指令，再通过处理器处理上述指令，能够提高特征匹配的准确率，并且还提高了高维图像特征匹配的效率。

在另一个实施例中，一种计算机可读存储介质，其上存储有计算机程序指令，该指令被处理器执行时实现图1、2、4、5所对应实施例中的方法的步骤。本领域内的技术人员应明白，本发明的实施例可提供为方法、装置、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

至此，已经详细描述了本发明。为了避免遮蔽本发明的构思，没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述，完全可以明白如何实施这里公开的技术方案。

可能以许多方式来实现本发明的方法以及装置。例如，可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本发明的方法以及装置。用于所述方法的步骤的上述顺序仅是为了进行说明，本发明的方法的步骤不限于以上具体描述的顺序，除非以其它方式特别说明。此外，在一些实施例中，还可将本发明实施为记录在记录介质中的程序，这些程序包括用于实现根据本发明的方法的机器可读指令。因而，本发明还覆盖存储用于执行根据本发明的方法的程序的记录介质。

虽然已经通过示例对本发明的一些特定实施例进行了详细说明，但是本领域的技术人员应该理解，以上示例仅是为了进行说明，而不是为了限制本发明的范围。本领域的技术人员应该理解，可在不脱离本发明的范围和精神的情况下，对以上实施例进行修改。本发明的范围由所附权利要求来限定。

Claims

1.一种高维图像特征匹配方法，包括：

提取待检索图像的高维图像特征；

将所述待检索图像的高维图像特征划分为多个低维图像特征，多个低维图像特征的维数之和等于高维图像特征的维数；

将所述待检索图像的各低维图像特征与数据库中图像的低维图像特征的各层聚类中心进行比较；

根据比较结果确定所述待检索图像与所述数据库中图像的低维图像特征相似度，利用快速选择算法结合插入排序法获取评分最高的N个图像，将评分最高的N个图像的高维图像特征作为与所述待检索图像的高维图像特征匹配的特征，其中，采用快速选择算法寻找第N大的相似度评分对应的图像，同时获得未排序的前N大的相似度评分对应的图像，使用插入排序法对N个相似度评分对应的图像进行排序。

2.根据权利要求1所述的方法，其中，所述数据库中图像的低维图像特征的各层聚类中心通过以下方法进行确定：

提取所述数据库中图像的高维图像特征；

将所述数据库中图像的高维图像特征划分为多个低维图像特征；

对所述数据库中图像的低维图像特征进行分层聚类计算确定低维图像特征的各层聚类中心。

3.根据权利要求2所述的方法，其中，所述数据库中图像的各低维图像特征的各层聚类中心与倒排文件关联。

4.根据权利要求2所述的方法，其中，对所述数据库中图像的低维图像特征进行分层聚类计算确定低维图像特征的各层聚类中心包括：

对所述数据库中图像的低维图像特征组成的集合进行无监督训练，其中，定义聚类的分叉因子为k；

在初始训练集中随机选择一个低维图像特征数据点作为kmeans聚类算法的初始聚类中心；

根据点到最近中心的概率比值确定k个初始聚类中心；

利用kmeans聚类算法将所述数据库中图像的低维图像特征组成的集合划分为k个集合，作为kmeans树的第一层；

利用kmeans聚类算法依次对kmeans树中当前层的每个集合进行迭代划分，直到达到kmeans树的叶子层；

根据聚类均值计算所述数据库中图像的低维图像特征的每一层的每个集合的聚类中心。

5.根据权利要求4所述的方法，其中，将所述待检索图像的各低维图像特征与数据库中图像的低维图像特征的各层聚类中心进行比较包括：

将所述待检索图像的每个低维图像特征，从所述数据库中图像的低维图像特征的kmeans树的第一层开始，与每一层k个聚类中心比较，确定与所述待检索图像的每个低维图像特征距离最近的聚类中心；

递归与距离最近的聚类中心的子聚类中心进行比较，直到达到kmeans树的叶子层。

6.根据权利要求1-5任一所述的方法，还包括：

利用TF-IDF词频-逆向文件频率算法对所述待检索图像与所述数据库中图像的低维图像特征相似度进行评分。

7.一种高维图像特征匹配装置，包括：

第一高维图像特征提取单元，用于提取待检索图像的高维图像特征；

第一低维图像特征划分单元，用于将所述待检索图像的高维图像特征划分为多个低维图像特征，多个低维图像特征的维数之和等于高维图像特征的维数；

特征比较单元，用于将所述待检索图像的各低维图像特征与数据库中图像的低维图像特征的各层聚类中心进行比较；

特征匹配确定单元，用于根据比较结果确定所述待检索图像与所述数据库中图像的低维图像特征相似度，利用快速选择算法结合插入排序法获取评分最高的N个图像，将评分最高的N个图像的高维图像特征作为与所述待检索图像的高维图像特征匹配的特征，其中，采用快速选择算法寻找第N大的相似度评分对应的图像，同时获得未排序的前N大的相似度评分对应的图像，使用插入排序法对N个相似度评分对应的图像进行排序。

8.根据权利要求7所述的装置，其中，所述数据库中图像的低维图像特征的各层聚类中心通过以下单元进行确定：

第二高维图像特征提取单元，用于提取所述数据库中图像的高维图像特征；

第二低维图像特征划分单元，用于将所述数据库中图像的高维图像特征划分为多个低维图像特征；

聚类中心确定单元，用于对所述数据库中图像的低维图像特征进行分层聚类计算确定低维图像特征的各层聚类中心。

9.根据权利要求8所述的装置，其中，所述数据库中图像的各低维图像特征的各层聚类中心与倒排文件关联。

10.根据权利要求8所述的装置，其中，所述聚类中心确定单元用于对所述数据库中图像的低维图像特征组成的集合进行无监督训练，其中，定义聚类的分叉因子为k；在初始训练集中随机选择一个低维图像特征数据点作为kmeans聚类算法的初始聚类中心；根据点到最近中心的概率比值确定k个初始聚类中心；利用kmeans聚类算法将所述数据库中图像的低维图像特征组成的集合划分为k个集合，作为kmeans树的第一层；利用kmeans聚类算法依次对kmeans树中当前层的每个集合进行迭代划分，直到达到kmeans树的叶子层；根据聚类均值计算所述数据库中图像的低维图像特征的kmeans树的每一层的每个集合的聚类中心。

11.根据权利要求10的装置，其中，所述特征匹配确定单元用于将所述待检索图像的每个低维图像特征，从所述数据库中图像的低维图像特征的kmeans树的第一层开始，与每一层k个聚类中心比较，确定与所述待检索图像的每个低维图像特征距离最近的聚类中心；递归与距离最近的聚类中心的子聚类中心进行比较，直到达到kmeans树的叶子层。

12.根据权利要求7-11任一所述的装置，其中，所述特征匹配确定单元还用于利用TF-IDF词频-逆向文件频率算法对所述待检索图像与所述数据库中图像的低维图像特征相似度进行评分。

13.一种高维图像特征匹配装置，包括：

存储器；以及

耦接至所述存储器的处理器，所述处理器被配置为基于存储在所述存储器的指令执行如权利要求1至6任一项所述的方法。

14.一种计算机可读存储介质，其上存储有计算机程序指令，该指令被处理器执行时实现权利要求1至6任一项所述的方法的步骤。