CN106778775B

CN106778775B - 一种基于sift特征软匹配的图像分类方法

Info

Publication number: CN106778775B
Application number: CN201611074826.8A
Authority: CN
Inventors: 吴晓富; 张婉
Original assignee: Nanjing University of Posts and Telecommunications
Current assignee: Nanjing University of Posts and Telecommunications
Priority date: 2016-11-29
Filing date: 2016-11-29
Publication date: 2020-08-18
Anticipated expiration: 2036-11-29
Also published as: CN106778775A

Abstract

本发明公开了一种基于SIFT特征软匹配的图像分类方法，该方法主要包括如下步骤：使用SIFT特征提取算法对每个待分类图像提取特征；将提取出来的SIFT特征在每两个图像之间进行软匹配；根据图像之间匹配后的结果定义一种相似度度量标准；将上述图像之间的相似度作为后续分类算法的输入，进行分类。该方法定义了一种基于SIFT特征的相似度度量标准，很好地保证了算法的可行性。该方法不需要训练大量的样本，能够直接对输入的图像进行分类，很好地提高了图像分类的准确度。

Description

一种基于SIFT特征软匹配的图像分类方法

技术领域

本发明涉及一种基于SIFT特征软匹配的图像分类方法，属于图像分类技术领域。

背景技术

随着社会科技的飞速发展，全球每天都会产生海量的图片，作为一种信息的载体，这些图像是一种巨大的数据资源，为了充分利用这些资源，必须要对这些图像进行分析处理，而对这些大量的图像进行分类则是后续分析处理的基础，也是必须要做的重要的一步。

很多领域都会涉及图像分类，例如数据挖掘，模式识别，图像检索，计算机视觉等等。而人工对这些大量的图像进行分类显然是不可行的，尤其是在人工智能火热发展的今天，这种繁重的工作自然是让机器代替人工来完成，以提高工作效率。这就需要人们设计出各种图像分类方法，让计算机更加准确高效的完成图像分类的工作。

关于图像分类的方法有很多，一类方法是用一些事先人工分好类的图像来训练算法(称为有监督的方法)，以达到分类更精确的目标。然而，这种方法需要大量的训练图像，实现起来非常困难。还有一类方法是不需要训练，直接对待分类图像进行分类的方法(称为无监督的方法)。这种方法一般先要对图像提取特征及一些预处理，然后送入到分类器中进行分类。这类方法中包含各种图像特征提取技术和多种分类器，不同的特征提取技术与不同的分类器相结合都可能成为一种图像分类方法，但是也不能随意结合，要考虑最终实现的可行性和分类的性能，相对第一类有监督的分类方法，该类方法较容易实现，但是分类准确率有待提高。

发明内容

本发明目的在于针对上述现有技术的不足，提出了一种基于SIFT特征软匹配的图像分类方法，该方法很好地提高了图像分类的准确度。

本发明解决其技术问题所采取的技术方案是：一种基于SIFT特征软匹配的图像分类方法，该方法包括以下步骤：

步骤1：对待分类的图像分别进行SIFT特征提取操作。

步骤2：将步骤1中提取出来的SIFT特征在每两个图像之间进行“软匹配”。

软匹配的含义是指：将图像i与图像j提取出来的特征逐个关键点进行比较计算，用欧氏距离来度量图像i中第k个关键点与图像j中所有关键点的距离，找出最近和第二近的两个距离，把这两个距离的比值记为

步骤3：根据步骤2中计算出的图像i，j之间的匹配程度

定义一种相似度度量标准。

步骤4：将步骤3中计算所得的相似度

作为AP聚类算法的输入，进行最终的分类。

有益效果：

1、本发明在SIFT特征提取算法与分类算法相结合实现图像分类的过程中，提出SIFT特征“软匹配”的方法，该方法定义了一种基于SIFT特征的相似度度量标准，很好地保证了算法的可行性。

2、本发明不需要训练大量的样本，能够直接对输入的图像进行分类，很好地提高了图像分类的准确度。

附图说明

图1是本发明图像分类的方法流程图。

图2是参数β取不同数值时对应的函数sigmoid(β，x)的曲线。

图3是本发明具体实施例的曲线示意图。

具体实施方式

下面结合说明书附图对本发明创造作进一步的详细说明。

如图1所示，本发明提供了一种基于SIFT特征软匹配的图像分类方法，该方法包括如下步骤：

步骤1：对待分类的图像分别进行SIFT特征提取操作。

下面结合说明书附图对本发明创造作进一步的详细说明。

SIFT(scale invariant feature transform)是一种常用的图像局部特征提取技术，该方法提取出来的特征具有尺度和旋转不变性，而且对光照和拍摄视角的变化也有一定的鲁棒性。

经过SIFT特征提取操作，每一个图像会提取出若干关键点和相应的特征描述子，实施例中每一个关键点对应一个128维的矢量(即特征描述子)。若一个图像提取出K个关键点，则该图像的特征描述为(K x 128)维向量。

匹配的含义是指：将图像i与图像j提取出来的特征逐个关键点进行比较计算，用欧氏距离来度量图像i中第k个关键点与图像j中所有关键点的距离，找出最近和第二近的两个距离，把这两个距离的比值记为

在传统的匹配步骤中，都是采用硬判决的方法，即给定一个阈值δ，当距离之比

的值比该阈值δ大时，说明匹配不成功，记为0；对应地，当比值小于阈值δ时，匹配成功，记为1。则图像i与图像j的匹配程度就是这些0，1的累加和，记为m(i,j)。这种方法本发明称为硬匹配。

上述硬匹配方法显然丢弃了很多有用信息，针对该问题，本发明提出了一种“软匹配”的方法。该“软匹配”即与硬匹配相对应，充分利用所有的比值信息。本发明保留全部的比值信息

并根据下式计算图像i中第k个关键点与图像j中关键点的匹配度

其中，

δ表示设定的阈值；

K_i表示图像i的关键点的总数；

β是一个调节参数，当β→∞时，该方法退化为硬匹配。图2显示了β取不同数值时函数sigmoid(β，x)的曲线。

那么图像i与图像j之间的匹配程度

按如下公式计算：

当β→∞时，

需要指出的是，m(i，j)≠m(j，i)，

且计算结果m(i，j)一定是个整数，而

不一定是整数。

步骤3：根据步骤2中计算出的图像i，j之间的匹配程度

定义一种相似度度量标准。

按照下式定义图像i与图像j之间的相似度

其中，

是对图像i与图像j的匹配程度

的归一化；

N表示待分类图像的总个数；

由于μ(i，j)＝μ(j，i)，所以

因此称之为对称相似度。

步骤4：将步骤3中计算所得的相似度

作为AP聚类算法的输入，进行最终的分类。

AP(Affinity Propagation)聚类算法是一种根据数据之间的相似度进行聚类的算法，其特点是快速高效，不必事先人为指定聚类数目且能够解决大规模稀疏矩阵计算问题，已经被用于人脸识别、基因发现、搜索最优航线以及实物图像识别等领域。

聚类算法把图像间的相似度作为输入，经过算法后生成几个类代表图像以及每个图像类的划分情况。假设图像i与图像j之间的相似度记为s(i，j)，i，j∈[1，N]，N表示待分类图像的个数。若i＝j，则记p_j＝s(i，j)，代表图像j被选为类代表的参考度。算法的输入也包括每一个数据的参考度p_j，拥有较大参考度的图像就有更大的机会被选为类代表。

聚类算法的主要过程是在数据之间来回传递两种信息，一个是“responsibility”r(i，k)，是图像i向可能的类代表图像k传递的信息，反应图像i选择图像k作为代表的可能性；另一个是“availability”a(i，k)，是从可能的类代表图像k传递给图像i的信息，表示图像k能够作为图像i的代表的可信度。AP聚类算法的大致流程可用如下步骤表示：

1)初始化：

r(i，k)＝0

2)更新responsibility：

3)更新availability：

4)筛选类代表：

c_i表示图像i对应的类代表图像。上述过程中很容易会出现振荡，一般会在更新过程中加入阻尼系数λ，一般λ∈[0.5，1]。

经过上述步骤的迭代进行，直至满足迭代停止的条件，算法结束，输出图像分类结果。

将上述整个过程在matlab中实现，该实施例所用图像库是Olivetti人脸数据库，实验用40个人的400张灰度图像(即每人10张不同表情的图像)，每个图像大小为64x64。图3显示了本发明对分类准确度的显著提高，图中“hard matching”对应硬匹配的分类结果；“soft matching”对应软匹配的分类结果；纵坐标“Accuracy”指分类准确度，是正确分类的图像占全部图像的比例；由本实施例的结果可以看出，本发明的分类精确度得到了很大的提升，充分证明了本发明的有效性。

本领域的技术人员应能理解，上述较佳实施方式仅用来说明本发明，并非用来限定本发明的保护范围，凡是利用本发明说明书及附图内容所做的等效变换，或直接或间接运用在其他相关的技术领域，任何在本发明的精神和原则范围之内，所做的任何修饰、等效替换、改进等，均应包含在本发明的权利保护范围之内。

Claims

1.一种基于SIFT特征软匹配的图像分类方法，其特征在于，所述方法包括如下步骤：

步骤1：对待分类的图像分别进行SIFT特征提取操作；

步骤2：将步骤1中提取出来的SIFT特征在每两个图像之间进行软匹配，软匹配的含义是指：将图像i与图像j提取出来的特征逐个关键点进行比较计算，用欧氏距离来度量图像i中第k个关键点与图像j中所有关键点的距离，找出最近和第二近的两个距离，把这两个距离的比值记为

软匹配是与硬匹配相对应，利用所有的比值信息，保留全部的比值信息

其中，

δ表示设定的阈值；

K_i表示图像i的关键点的总数；

β是一个调节参数，当β→∞时，退化为硬匹配，β取不同数值时函数sigmoid(β，x)的曲线，那么图像i与图像j之间的匹配程度

按如下公式计算：

当β→∞时，

需要指出的是，m(i，j)≠m(j，i)，

且计算结果m(i，j)一定是个整数，而

不一定是整数；

步骤3：根据步骤2中计算出的图像i，j之间的匹配程度

定义一种相似度度量标准，按照下式定义图像i与图像j之间的相似度

其中，

是对图像i与图像j的匹配程度

的归一化；

N表示待分类图像的总个数；

由于μ(i，j)＝μ(j，i)，所以

因此称之为对称相似度；

步骤4：将步骤3中计算所得的相似度

作为AP聚类算法的输入，进行最终的分类，聚类算法把图像间的相似度作为输入，经过算法后生成几个类代表图像以及每个图像类的划分情况，若图像i与图像j之间的相似度记为s(i，j)，i，j∈[1，N]，N表示待分类图像的个数，若i＝j，则记p_j＝s(i，j)，代表图像j被选为类代表的参考度，算法的输入也包括每一个数据的参考度p_j，拥有较大参考度的图像就有更大的机会被选为类代表；

聚类算法的过程是在数据之间来回传递两种信息，一个是“responsibility”r(i，k)，是图像i向可能的类代表图像k传递的信息，反应图像i选择图像k作为代表的可能性；另一个是“availability”a(i，k)，是从可能的类代表图像k传递给图像i的信息，表示图像k能够作为图像i的代表的可信度，AP聚类算法的大致流程能用如下步骤表示：

1)初始化：

r(i，k)＝0

2)更新responsibility：

3)更新availability：

4)筛选类代表：

c_i表示图像i对应的类代表图像，上述过程中很容易会出现振荡，会在更新过程中加入阻尼系数λ，λ∈[0.5，1]；