CN110807120A

CN110807120A - 一种基于特征点聚类的图像检索方法

Info

Publication number: CN110807120A
Application number: CN201810871853.0A
Authority: CN
Inventors: 史凌波; 刘文龙
Original assignee: Guoke Yixin (beijing) Technology Co Ltd
Current assignee: Guoke Yixin (beijing) Technology Co Ltd
Priority date: 2018-08-02
Filing date: 2018-08-02
Publication date: 2020-02-18

Abstract

本发明公开了一种基于特征点聚类的图像检索方法，包括以下步骤：提取图像数据库中所有图像的局部特征点，对提取的所有局部特征点进行聚类；计算其局部特征聚合描述子；对于检索图像，提取其局部特征点，并使用聚类算法对局部特征点进行聚类；计算检索图像的所有类中心之间的最短距离d_min；设定阈值T，若d_min≤T，则将最短距离对应的两个类进行合并；重复执行上步，直到d_min>T为止；选取检索图像的数量最大类中的图像特征点，计算局部特征聚合描述子；计算上步中得到的局部特征聚合描述子与数据库中所有图像的局部特征聚合描述子的距离，最小距离对应的数据库图像即为检索结果。本发明能够有效减少周围背景图像内容的干扰，实现图像的成功检索。

Description

一种基于特征点聚类的图像检索方法

技术领域

本发明涉及一种图像检索方法，具体是一种基于特征点聚类的图像检索方法。

背景技术

随着计算机和互联网的快速发展，图像资源越来越丰富，如何在大规模的图像资源中准确检索到用户需要的图像成为了亟需解决的关键问题，因此，建立一种精确的图像检索方法成为了当下的研究热点。

在图像检索领域中，词袋模型（Bag of Word，BoW）是最常用的检索方法之一。该方法首先将图像数据库中图像的所有特征进行聚类，每一个类中心即为一个视觉词汇，所有类中心共同构成一个视觉码本；然后，将每幅图像的所有特征都映射到视觉码本中，得到一个与视觉码本相对应的词频矢量；最后，通过对词频矢量进行归一化处理，即可得到图像的编码矢量。这样，图像检索便转化为了图像编码矢量之间的距离计算，通过查找距离最小的图像编码矢量，即可实现图像的检索。

由于词袋模型需要构建较大的视觉码本，其在大规模图像检索中的实用性较差。为此，局部特征聚合描述子（Vector of Locally Aggregated Descriptor， VLAD）被提出，该方法是对词袋模型的改进，通过构建较小的视觉码本，即可进行图像编码。与词袋模型相比，局部特征聚合描述子具有更好的适用性，因此广泛应用于大规模图像检索中。

然而，不管是词袋模型还是局部特征聚合描述子，都要求检索图像与数据库中的目标图像具有一致的图像内容，一旦检索图像中存在较多的干扰内容，就会影响图像编码的准确性，从而导致检索失败。

发明内容

本发明的目的在于提供一种基于特征点聚类的图像检索方法，旨在克服上述现有技术的不足，其能有效解决图像中存在较多的干扰内容而导致检索失败的问题。

为实现上述目的，本发明提供如下技术方案：

一种基于特征点聚类的图像检索方法，包括以下步骤：

步骤1：提取图像数据库中所有图像的局部特征点；

步骤2：使用聚类算法对步骤1中提取的所有局部特征点进行聚类，得到K个聚类中心，其中，K的取值为K=1-1000；

步骤3：对于数据库中的每一幅图像，基于步骤1提取的该幅图像的局部特征点和步骤2得到的K个聚类中心，计算其局部特征聚合描述子；

步骤4：对于检索图像，提取其局部特征点，并使用聚类算法对局部特征点进行聚类，生成K’个类，得到K’个类中心，其中，K’的取值为K’=1-10；

步骤5：计算检索图像的所有类中心之间的最短距离；设定阈值T，若

，则将最短距离对应的两个类进行合并；

其中，

和

表示第i个和第j个类中心，

，

；

步骤6：重复执行步骤5，直到

为止，此时，检索图像的聚类个数为K’’，K’’<=K’；

步骤7：对于检索图像的K’’个类，选取特征点数量最大类中的图像特征点，基于步骤2得到的K个聚类中心，计算局部特征聚合描述子；

步骤8：计算步骤7中得到的局部特征聚合描述子与数据库中所有图像的局部特征聚合描述子的欧式距离，最小距离对应的数据库图像即为最终检索结果：

其中，V _r为检索图像的局部特征聚合描述子，V _j为图像数据库中第j幅图像的局部特征聚合描述子，retrievelIdx为计算得到的最小距离图像的编号。

作为本发明进一步的方案：所述步骤1中的局部特征点是SIFT特征点、SURF特征点、ORB特征点、HOG特征点、FAST特征点、BRISK特征点或LBP特征点。

作为本发明进一步的方案：所述步骤3具体方法如下：

步骤3-1：计算图像中每一个特征点所属的类编号；

步骤3-2：计算每个聚类的残差向量；

步骤3-3：将步骤3-2求得的k个残差向量合成一个一维向量；

步骤3-4：对一维向量V中的每一个分量进行幂律规一化处理：

其中，

表示一维向量V中第i个分量，

，N表示一维向量V的维度；

，代表归一化参数；

步骤3-5：对处理后的一维向量采用如下公式进行L2范数归一化，得到的一维向量V即为图像的局部特征聚合描述子：

。

作为本发明进一步的方案：所述步骤3-1：采用以下公式计算图像中每一个特征点所属的类编号：

其中，

表示图像第t个特征点，

，n表示图像特征点数量，

表示第j个聚类中心，

，i表示求得的

所属类编号。

作为本发明进一步的方案：所述步骤3-2：采用以下公式计算每个聚类的残差向量：

其中，

表示第i个聚类中心，

表示图像中属于第i个聚类的第k个特征点，m表示图像中属于第i个聚类的特征点总数；

表示第i个聚类的残差向量。

作为本发明进一步的方案：所述步骤3-3：采用以下公式将步骤3-2求得的k个残差向量合成一个一维向量：

。

与现有技术相比，本发明的有益效果是：

本发明方法通过对检索图像的局部特征点进行聚类，将图像局部特征聚合描述子的计算集中到了最大类中的图像特征点上，也就是集中到了图像内容最为丰富的区域，从而能够有效减少周围背景图像内容的干扰，实现图像的成功检索。

具体实施方式

下面结合具体实施方式对本专利的技术方案作进一步详细地说明。

实施例1

一种基于特征点聚类的图像检索方法，包括以下步骤：

步骤1：提取图像数据库中所有图像的局部特征点；

所述步骤1中的局部特征点可以是SIFT特征点，采用MATLAB中SIFT特征提取算子vl_sift，提取图像数据库中所有图像的SIFT特征点；

步骤2：使用K均值聚类算法对步骤1中提取的所有局部特征点进行聚类，得到K个聚类中心，其中，K的取值为K=1-1000；

步骤4：对于检索图像，提取其局部特征点，并使用K均值聚类算法对局部特征点进行聚类，生成K’个类，得到K’个类中心，其中，K’的取值为K’=1-10；

步骤5：计算检索图像的所有类中心之间的最短距离

；设定阈值T，若

，则将最短距离对应的两个类进行合并；

（公式6）

其中，

和

表示第i个和第j个类中心，

，

步骤6：重复执行步骤5，直到

为止，此时，检索图像的聚类个数为K’’，K’’<=K’；

步骤7：对于检索图像的K’’个类，选取特征点数量最大类中的图像特征点，基于步骤2得到的K个聚类中心，计算局部特征聚合描述子（采用与步骤3中计算其局部特征聚合描述子相同的方法，只是步骤3用了一副图像的所有特征点来计算局部特征聚合描述子，而这里只用了检索图像中特征点数量最大类中的图像特征点来计算局部特征聚合描述子）；

实施例2

与实施例1不同的是：所述步骤1中的局部特征点还可以是SURF特征点、ORB特征点、HOG特征点、FAST特征点、BRISK特征点或LBP特征点。

实施例3

在实施例1的基础上。步骤3的具体方法如下：

步骤3-1：计算图像中每一个特征点所属的类编号：

（公式1）

其中，

表示图像第t个特征点，

，n表示图像特征点数量，

表示第j个聚类中心，

，i表示求得的

所属类编号；

步骤3-2：计算每个聚类的残差向量：

（公式2）

其中，

表示第i个聚类中心，

表示第i个聚类的残差向量；

步骤3-3：将步骤3-2求得的k个残差向量采用如下公式合成一个一维向量：

（公式3）

步骤3-4：对一维向量V中的每一个分量进行幂律规一化处理：

（公式4）

其中，

表示一维向量V中第i个分量，，N表示一维向量V的维度；

，代表归一化参数；

步骤3-5：对处理后的一维向量采用如下公式进行L2范数归一化：

（公式5）

再次进行归一化后得到的一维向量V即为图像的局部特征聚合描述子。

上面对本专利的较佳实施方式作了详细说明，但是本专利并不限于上述实施方式，在本领域的普通技术人员所具备的知识范围内，还可以在不脱离本专利宗旨的前提下作出各种变化。