WO2020199773A1

WO2020199773A1 - 图像检索方法及装置和计算机可读存储介质

Info

Publication number: WO2020199773A1
Application number: PCT/CN2020/075685
Authority: WO
Inventors: 马福强; 陈丽莉; 张�浩; 孙建康; 董泽华; 吕耀宇
Original assignee: 京东方科技集团股份有限公司; 北京京东方光电科技有限公司
Priority date: 2019-04-04
Filing date: 2020-02-18
Publication date: 2020-10-08
Also published as: CN111783805B; CN111783805A

Abstract

本公开涉及一种图像检索方法及装置。图像检索方法，包括：获取待识别图像的至少一个局部视觉特征；基于所述至少一个局部视觉特征确定所述待识别图像的表达向量，所述表达向量由所述至少一个局部视觉特征的残差向量构成；从候选图像库中检索出与所述表达向量相似度超过相似度阈值的候选图像列表。

Description

图像检索方法及装置和计算机可读存储介质

相关申请的交叉引用

本申请要求于2019年4月4日递交的中国专利申请CN201910273228.0的优先权，其全部公开内容通过引用合并于此。

技术领域

本公开涉及图像处理技术领域，尤其涉及一种图像检索方法及装置、电子设备、和计算机可读存储介质。

背景技术

在目前，图像检索通过输入待识别图像，检索出与该待识别图像相似的图像列表和相应的文字、视频或网页链接等内容，具有极为可观的应用前景。

现有相关的图像检索算法工作流程包括：提取待识别图像的视觉特征；构建特征索引或图像表达；依据图像特征或图像表达的距离(如欧式距离、余弦距离等)远近进行相似性判断；并给出相似性图像列表。

发明内容

根据本公开实施例的第一方面，提供了一种图像检索方法，包括：

获取待识别图像的至少一个局部视觉特征；

基于所述至少一个局部视觉特征确定所述待识别图像的表达向量，所述表达向量由所述至少一个局部视觉特征的残差向量构成；以及

从候选图像库中检索出与所述表达向量相似度超过相似度阈值的候选图像列表。

在实施例中，基于所述至少一个局部视觉特征确定所述待识别图像的表达向量，包括：

由图像分类量化器确定所述至少一个局部视觉特征中的每一个所属的聚类簇和子类，所述图像分类量化器包括K1个聚类簇和对应的K1个聚类中心，以及所述 K1个聚类簇中的每一个聚类簇切分出的K2个子类和每个子类的距离分界阈值；以及

获取属于同一个子类的所有局部视觉特征的残差向量并累加，从而得到K1*K2个残差向量的累加和向量，所述累加和向量即为所述待识别图像的表达向量，其中K1和K2为正整数。

在实施例中，确定所述至少一个局部视觉特征中的每一个所属的聚类簇和子类包括：

利用聚类分析算法获取该局部视觉特征与各聚类中心的距离和残差向量；

确定与所述局部视觉特征距离最近的聚类中心所在的聚类簇为所述局部视觉特征所属的聚类簇；以及

基于所述距离和所述聚类簇内各子类的距离分界阈值确定所述局部视觉特征所属的子类。

在实施例中，所述图像检索方法，还包括：

对所述累加和向量分别进行归一化处理，得到归一化后的累加和向量；

将归一化后的累加和向量首尾连接得到一个长向量；以及

利用降维算法对所述长向量进行降维处理，得到降维后的长向量，所述降维后的长向量即为所述待识别图像的表达向量。

在实施例中，所述图像分类量化器通过以下步骤训练，包括：

获取图像训练集中每一个图像的局部视觉特征；

利用聚类分析算法对所述局部视觉特征进行聚类分析，得到所述K1个聚类簇和各聚类簇的聚类中心；以及

针对K1个聚类簇中的每一个，获取该聚类簇内局部视觉特征与该聚类簇的聚类中心的距离以及最大距离值；基于所述最大距离值将该聚类簇切分为K2个子类，得到每个子类的距离分界阈值，

其中，得到的距离分界阈值的数量为K1*K2个，同一个聚类簇中的各子类互不重合。

在实施例中，基于所述最大距离值将该聚类簇切分为K2个子类，得到每个子类的距离分界阈值，包括：

将所述最大距离值划分为K2个分段，每个分段对应的局部视觉特征构成一个子类，得到K2个子类；并且，每个分段与所述聚类簇的聚类中心的最大距离为所述每个分段对应子类的距离分界阈值。

在实施例中，所述聚类分析算法包括K-means算法。

根据本公开实施例的第二方面，提供了一种图像检索装置，包括：

处理器；以及

存储器，与所述处理器耦连，并存储可执行指令，所述可执行指令在由所述处理器执行时使得所述处理器被配置为：

获取待识别图像的至少一个局部视觉特征；

在实施例中，所述处理器还被配置为：

由图像分类量化器确定所述至少一个局部视觉特征中的每一个所属的聚类簇和子类，所述图像分类量化器包括K1个聚类簇和对应的K1个聚类中心，以及所述K1个聚类簇中的每一个聚类簇切分出的K2个子类和每个子类的距离分界阈值；以及

获取属于同一个子类的所有局部视觉特征的残差向量，并累加，从而得到K1*K2个残差向量的累加和向量，所述累加和向量即为所述待识别图像的表达向量，其中K1和K2为正整数。

在实施例中，所述处理器还被配置为：

将归一化后的累加和向量首尾连接得到一个长向量；以及

获取图像训练集中每个图像的局部视觉特征；

针对K1个聚类簇中的每一个，获取该聚类簇内局部视觉特征与所述聚类簇的聚类中心的距离以及最大距离值；基于所述最大距离值将该聚类簇切分为K2个子类，得到各子类的距离分界阈值，

根据本公开实施例的第三方面，提供了一种计算机可读存储介质，其上存储有计算机可执行指令，其特征在于，该指令被处理器执行时实现权利要求1～7任一项所述方法的步骤。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1是本公开实施例示出的一种图像检索方法的框图；

图2是本公开实施例示出的获取表达向量的流程图；

图3是本公开实施例示出的获取距离分界阈值的流程图；

图4是本公开实施例示出的获取聚类簇子类的流程图；

图5是本公开实施例示出的划分的K1个聚类簇和K2个子类的效果示意图；

图6是本公开实施例示出的另一种获取表达向量的流程图；

图7～图10是本公开实施例示出的一种图像检测装置的框图；

图11是本公开实施例示出的一种电子设备的框图；以及

图12是公开实施例示出的一种计算机可读存储介质1200。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

目前，图像检索通过输入待识别图像，检索出与该待识别图像相似的图像列表和相应的文字、视频或网页链接等内容，具有极为可观的应用前景。

然而，相关技术仅利用了待识别图像中的部分视觉特征以及距离信息，并未充分利用待识别图像的视觉特征，不利于提升待识别图像检索的准确率和效率。

为解决上述问题，本公开实施例提供了一种图像检索方法，其公开构思在于，获取待识别图像的局部视觉特征，然后再确定出局部视觉特征的残差向量，利用残差向量形成待识别图像的表达向量，之后基于表达向量可以确定候选图像列表。本实施例中通过利用残差向量可以充分利用待识别图像的特征，有利于提升图像检索的准确率。

图1是本公开实施例示出的一种图像检索方法的框图，参见图1，一种图像检索方法，可以应用于电子设备，例如智能手机、平板电脑、个人计算机等，包括步骤101～步骤103，其中：

在步骤101中，获取待识别图像的至少一个局部视觉特征。

在本实施例中，电子设备可以获取用户输入的待识别图像，然后电子设备可以调用视觉特征获取算法提取待识别图像的局部视觉特征。

其中，视觉特征获取算法可以包括尺度不变特征变换(Scale-invariant feature transform，SIFT)算法，SURF(Speed Up Robust Features，SURF)算法，ORB(Oriented FAST and Rotated BRIE)算法等。

以SIFT算法为例，获取局部视觉特征包括：

1.尺度空间极值检测：搜索待识别图像上所有尺度上的图像位置，利用高斯微分函数来识别潜在的对于尺度和旋转不变的兴趣点。

2.关键点定位：在每个候选的兴趣点上，通过一个拟合模型来确定位置和尺度，将位置和尺度稳定程度较高的兴趣点作为关键点。

3.方向确定：基于待识别图像局部的梯度方向，分配给每个关键点位置一个或多个方向。后续过程中，基于关键点的方向、尺度和位置对待识别图像进行变换。

4.关键点描述：在每个关键点周围的邻域内，在选定的尺度上测量待识别图像的图像局部的梯度，其中梯度可以变换成表示向量，表示向量允许比较大的局部形状的变形和光照变化。换言之，上述表示向量即为待识别图像的局部视觉特征。

可理解的是，本实施例中仅描述了SIFT算法的获取视觉特征的方案，当然，技术人员可以根据具体场景选择合适的视觉特征获取算法，在能够获取到局部视觉特征的情况下，相应算法及算法方案落入本申请的保护范围。

在步骤102中，基于所述至少一个局部视觉特征确定所述待识别图像的表达向量。

在本实施例中，电子设备可以基于局部视觉特征确定出局部视觉特征的残差向量，然后由残差向量构成的待识别图像的表达向量。

参见图2，电子设备可以调用预先训练并存储的图像分类量化器。图像分类量化器是使用例如k-means算法对所有视觉特征进行聚类分析构建而成的量化模型。该图像分类量化器在获取到局部视觉特征后，可以确定出每个局部视觉特征所属的聚类簇和子类。图像分类量化器包括K1个聚类簇和对应的K1个聚类中心，以及 K1个聚类簇中由每个聚类簇切分出的K2个子类和各子类的距离分界阈值(对应步骤201)。其中，K1和K2为正整数。

其中，局部视觉特征采用向量表示来描述，各聚类簇中心也可以采用向量表示来描述，因此局部视觉特征与其所属聚类簇对应的聚类簇中心作差即可以得到局部视觉特征的残差向量。

在本实施例中，参见图3，电子设备确定每个局部视觉特征所属的聚类簇和子类，可以包括：电子设备可以利用聚类分析算法获取该局部视觉特征与各聚类中心的距离和残差向量(对应步骤301)。然后，电子设备可以确定与该局部视觉特征距离最近的聚类中心所在的聚类簇为该局部视觉特征所属的聚类簇(对应步骤302)。之后，电子设备可以基于距离和聚类簇内各子类的距离分界阈值确定所述局部视觉特征所属的子类(对应步骤303)。

可理解的是，上述图像分类量化器需要预先训练好，参见图4，图像分类量化器的训练步骤可以包括：电子设备可以获取图像训练集。然后电子设备可以获取图像训练集中的每一张图像的局部视觉特征(对应步骤401)。

然后，电子设备利用聚类分析算法对局部视觉特征进行聚类分析，得到K1个聚类簇和各聚类簇的聚类中心(对应步骤402)。其中，聚类分析算法可以包括K-means算法，当然还可以选择其他聚类算法，在此不作限定。

之后，针对每个聚类簇，电子设备获取该聚类簇内局部视觉特征与该聚类簇的聚类中心的距离以及最大距离值；基于最大距离值将该聚类簇切分为K2个子类，得到各子类的距离分界阈值。这里得到的距离分界阈值的数量为K1*K2个，同一个聚类簇中的各子类互不重合(对应步骤403)。

在一实施例中针对各聚类簇，根据最大距离将各个距离平均切分为K2个类，例如，以聚类簇的聚类中心为圆心，以最大距离的切分位置为半径形成K2个同心圆，位于各圆环区域内的局部视觉特征作为一个子类，而切分位置即是距离分界阈值。即本实施例中可以将最大距离值划分为K2个分段，每个分段形成的区域内的局部视觉特征作为一个子类。每个分段对应的区域与其他分段对应的区域之间的边界可以作为距离分界阈值。参见图5，图5中示出了K1等于4即待识别图像具有4个聚类簇以及4个聚类中心，其中4个聚类簇分别为K11、K12、K13和K14。聚类簇K11可以继续切分为K2个子类，当K2等于3时，即切分为3个子类，其中3个子类可以包括子类K21、K22和K23。各子类的距离分界阈值分别为L1、L2和L3。

继续参见图2，电子设备可以获取属于同一个子类的所有局部视觉特征的残差向量并累加，从而得到K1*K2个残差向量的累加和向量，所述累加和向量即为所述待识别图像的表达向量(对应步骤202)。这样，本实施例中通过对聚类簇继续切分，使得每个聚类簇得到K2个子类，可以得到待识别图像的更细节的局部视觉特征，即所得到的表达向量能够更准确的反映待识别图像的更细节的局部视觉特征，有利于提高检索准确率。

在一些实施例中，参见图6，电子设备可以对累积和向量分别进行归一化处理，从而得到归一化后的累加和向量(对应步骤601)。然后，电子设备将K1*K2个归一化后的累加和向量首尾连接得到一个长向量(对应步骤602)。之后，电子设备利用降维算法对长向量进行降维处理，得到降维后的长向量，降维后的长向量即为待识别图像的表达向量(对应步骤602)。这样，本实施例中通过对累加和向量进行处理，可以降低向量的维度，有利于降低数据处理量，提升检索效率。

在本实施例中，电子设备各局部视觉特征进行量化可以包括：利用k-means量，即计算每个局部视觉特征与K1个聚类中心中最近的一个，表示该局部视觉特征属于该聚类簇。并且，电子设备还计算局部视觉特征与聚类中心的残差向量和距离值。然后，根据距离值可以确定该局部视觉特征位于K2个区域内的哪一个区域，从而确定局部视觉特征所属于的子类。

在确定了所有局部视觉特征所属于的子类后，若两个局部视觉特征同属于同一个子类，则累加它们的残差向量，重复上述步骤多次，可以得到K1*K2个残差累加和向量。在一些场景中，上述残差累加和向量即为累加和向量。

在一些实施例中，电子设备还对每个残差累加和向量分别进行归一化处理，并将K1*K2个残差累加和向量首尾连接成一个长向量，该长向量的维度为D＝K1*K2*d(设置的特征维度)。然后，对长向量进行归一化处理可以得到归一化后的长向量。之后，利用降维算法对归一化后的长向量进行降维处理，得到降维后的长向量，该降维后的长向量即为最终的累加和向量。其中，降维算法可以包括主成分分析算法(Principal Components Analysis，PCA)，当然技术人员还可以选择其他降维算法，在此不作限定。

这样，电子设备对图像分类量化器的训练步骤已经完成。电子设备获取训练过程中得到的K1聚类中心、K2个距离分界阈值，以及PCA降维后的长向量。然后，电子设备获取每个测试图像的局部视觉特征，并获得其表达向量，利用PCA算法对表达向量进行降维。最后，电子设备计算测试图像和训练图像之间的相似性，计算方法如余弦距离，欧式距离等，并筛选出与测试图像相似性最高的训练图像，完成测试过程。

在步骤103中，从候选图像库中检索出与所述表达向量相似度超过相似度阈值的候选图像列表。

在本实施例中，电子设备分别计算待识别图像的表达向量和候选图像库中各候选图像的表达向量的相似度，将相似度与相似度阈值近比较，若相似度超过相似度阈值，则将候选图像加入候选图像列表，直至筛选完候选图像库或者达到预先设置的候选图像数量为止。

至此，本实施例中可以获取待识别图像的局部视觉特征，然后确定出由所述局部视觉特征的残差向量构成的所述待识别图像的表达向量，之后检索出与所述表达向量相似度超过相似度阈值的候选图像列表。这样，本实施例中利用了局部视觉特征的残差向量，有利于进一步表达出待识别图像的视觉特征，从而可以提高提高检索候选图像的准确度。

在本公开实施例提供的一种图像检索方法的基础上，本公开实施例还提供了一种图像检索装置，图7是本公开实施例示出的一种图像检测装置的框图。参见图7，一种图像检索装置700，包括：

视觉特征获取模块701，用于获取待识别图像的至少一个局部视觉特征；

表达向量确定模块702，用于基于所述至少一个局部视觉特征确定所述待识别图像的表达向量，所述表达向量由所述至少一个局部视觉特征的残差向量构成；

图像检索模块703，用于从候选图像库中检索出与所述表达向量相似度超过相似度阈值的候选图像列表。

在图7所示的一种图像检索装置的基础上，参见图8，所述表达向量确定模块702包括：

聚类簇确定单元801，用于调用图像分类量化器，由所述图像分类量化器确定所述至少一个局部视觉特征中的每一个所属的聚类簇和子类；所述图像分类量化器包括K1个聚类簇和对应的K1个聚类中心，以及所述K1个聚类簇中由每个聚类簇切分出的K2个子类和各子类的距离分界阈值；

和向量获取单元802，用于获取属于同一个子类的所有局部视觉特征的残差向量并累加，从而得到K1*K2个残差向量的累加和向量，所述累加和向量即为所述待识别图像的表达向量，其中K1和K2为正整数。

在图8所示的一种图像检索装置的基础上，参见图9，所述聚类簇确定单元801包括：

距离获取子单元901，用于利用聚类分析算法获取所述局部视觉特征与各聚类中心的距离和残差向量；

聚类簇获取子单元902，用于确定与所述局部视觉特征距离最近的聚类中心所在的聚类簇为所述局部视觉特征所属的聚类簇；

子类获取子单元903，用于基于所述距离和所述聚类簇内各子类的距离分界阈值确定所述局部视觉特征所属的子类。

在图8所示的一种图像检索装置的基础上，参见图10，所述和向量获取单元802还包括：

和向量获取子单元1001，用于对所述累加和向量分别进行归一化处理，得到归一化后的累加和向量；

长向量连接子单元1002，用于将归一化后的累加和向量首尾连接得到一个长向量；

表达向量获取子单元1003，用于利用降维算法对所述长向量进行降维处理，得到降维后的长向量，所述降维后的长向量即为所述待识别图像的表达向量。

在一实施例中，所述图像分类量化器通过以下步骤训练，包括：

获取图像训练集中每个图像的局部视觉特征；

利用聚类分析算法对所述局部视觉特征进行聚类分析，得到所述K1个聚类簇和各聚类簇的聚类中心；

针对K1个聚类簇中的每一个，获取该聚类簇内局部视觉特征与该聚类簇的聚类中心的距离以及最大距离值；基于所述最大距离值将该聚类簇切分为K2个子类，得到各子类的距离分界阈值。在实施例中，得到的距离分界阈值的数量为K1*K2个，同一个聚类簇中的各子类互不重合。

图11是本公开实施例示出的一种电子设备的框图，参见图11，一种电子设备1100，包括处理器1101和用于存储可执行指令的存储器1102；所述处理器1101通过通信总线1103与所述存储器1102连接，用于从所述存储器1102中读取可执行指令，以实现图1～图6所示的图像检索方法的步骤。

如图12所示，本公开实施例还提供了一种计算机可读存储介质1200，其上存储有计算机可执行指令，该指令被处理器执行时实现图1～图6所示的图像检索方法的步骤。

计算机可读介质包括永久性/非永久性、易失性/非易失性、可移动/非可移动媒体，可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

本领域技术人员在考虑说明书及实践这里公开的公开后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

一种图像检索方法，包括：

获取待识别图像的至少一个局部视觉特征；

基于所述至少一个局部视觉特征确定所述待识别图像的表达向量，所述表达向量由所述至少一个局部视觉特征的残差向量构成；以及

从候选图像库中检索出与所述表达向量相似度超过相似度阈值的候选图像列表。
根据权利要求1所述的图像检索方法，其中，基于所述至少一个局部视觉特征确定所述待识别图像的表达向量，包括：

由图像分类量化器确定所述至少一个局部视觉特征中的每一个所属的聚类簇和子类，所述图像分类量化器包括K1个聚类簇和对应的K1个聚类中心，以及所述K1个聚类簇中的每一个聚类簇切分出的K2个子类和每个子类的距离分界阈值；以及

获取属于同一个子类的所有局部视觉特征的残差向量并累加，从而得到K1*K2个残差向量的累加和向量，所述累加和向量即为所述待识别图像的表达向量，其中K1和K2为正整数。
根据权利要求2所述的图像检索方法，其中，确定所述至少一个局部视觉特征中的每一个所属的聚类簇和子类包括：

利用聚类分析算法获取该局部视觉特征与各聚类中心的距离和残差向量；

确定与所述局部视觉特征距离最近的聚类中心所在的聚类簇为所述局部视觉特征所属的聚类簇；以及

基于所述距离和所述聚类簇内各子类的距离分界阈值确定所述局部视觉特征所属的子类。
根据权利要求2所述的图像检索方法，还包括：

对所述累加和向量分别进行归一化处理，得到归一化后的累加和向量；

将归一化后的累加和向量首尾连接得到一个长向量；以及

利用降维算法对所述长向量进行降维处理，得到降维后的长向量，所述降维后的长向量即为所述待识别图像的表达向量。
根据权利要求2所述的图像检索方法，其中，所述图像分类量化器通过以下步骤训练，包括：

获取图像训练集中每一个图像的局部视觉特征；

利用聚类分析算法对所述局部视觉特征进行聚类分析，得到所述K1个聚类簇和各聚类簇的聚类中心；以及

针对K1个聚类簇中的每一个，获取该聚类簇内局部视觉特征与该聚类簇的聚类中心的距离以及最大距离值；基于所述最大距离值将该聚类簇切分为K2个子类，得到每个子类的距离分界阈值，

其中，得到的距离分界阈值的数量为K1*K2个，同一个聚类簇中的各子类互不重合。
根据权利要求5所述的图像检索方法，其中，基于所述最大距离值将该聚类簇切分为K2个子类，得到每个子类的距离分界阈值，包括：

将所述最大距离值划分为K2个分段，每个分段对应的局部视觉特征构成一个子类，得到K2个子类；并且，每个分段与所述聚类簇的聚类中心的最大距离为所述每个分段对应子类的距离分界阈值。
根据权利要求5所述的图像检索方法，其中，所述聚类分析算法包括K-means算法。
一种图像检索装置，包括：

处理器；以及

存储器，与所述处理器耦连，并存储可执行指令，所述可执行指令在由所述处理器执行时使得所述处理器被配置为：

获取待识别图像的至少一个局部视觉特征；

基于所述至少一个局部视觉特征确定所述待识别图像的表达向量，所述表达向量由所述至少一个局部视觉特征的残差向量构成；以及

从候选图像库中检索出与所述表达向量相似度超过相似度阈值的候选图像列表。
根据权利要求8所述的图像检索装置，其中，所述处理器还被配置为：

由图像分类量化器确定所述至少一个局部视觉特征中的每一个所属的聚类簇和子类，所述图像分类量化器包括K1个聚类簇和对应的K1个聚类中心，以及所述K1个聚类簇中的每一个聚类簇切分出的K2个子类和每个子类的距离分界阈值；以及

获取属于同一个子类的所有局部视觉特征的残差向量，并累加，从而得到K1*K2个残差向量的累加和向量，所述累加和向量即为所述待识别图像的表达向量，其中K1和K2为正整数。
根据权利要求9所述的图像检索装置，其中，所述处理器还被配置为：

利用聚类分析算法获取该局部视觉特征与各聚类中心的距离和残差向量；

确定与所述局部视觉特征距离最近的聚类中心所在的聚类簇为所述局部视觉特征所属的聚类簇；以及

基于所述距离和所述聚类簇内各子类的距离分界阈值确定所述局部视觉特征所属的子类。
根据权利要求9所述的图像检索装置，其中，所述处理器还被配置为：

对所述累加和向量分别进行归一化处理，得到归一化后的累加和向量；

将归一化后的累加和向量首尾连接得到一个长向量；以及

利用降维算法对所述长向量进行降维处理，得到降维后的长向量，所述降维后的长向量即为所述待识别图像的表达向量。
根据权利要求9所述的图像检索装置，其中，所述图像分类量化器通过以下步骤训练，包括：

获取图像训练集中每个图像的局部视觉特征；

利用聚类分析算法对所述局部视觉特征进行聚类分析，得到所述K1个聚类簇和各聚类簇的聚类中心；以及

针对K1个聚类簇中的每一个，获取该聚类簇内局部视觉特征与所述聚类簇的聚类中心的距离以及最大距离值；基于所述最大距离值将该聚类簇切分为K2个子类，得到各子类的距离分界阈值，

其中，得到的距离分界阈值的数量为K1*K2个，同一个聚类簇中的各子类互不重合。
一种计算机可读存储介质，其上存储有计算机可执行指令，其特征在于，该指令被处理器执行时实现权利要求1～7任一项所述方法的步骤。