CN107451604A

CN107451604A - 一种基于K‑means的图像分类方法

Info

Publication number: CN107451604A
Application number: CN201710566294.8A
Authority: CN
Inventors: 陈霜霜; 刘惠义; 曾晓勤
Original assignee: Hohai University HHU
Current assignee: Hohai University HHU
Priority date: 2017-07-12
Filing date: 2017-07-12
Publication date: 2017-12-08

Abstract

本发明公开一种基于K‑means的图像分类方法，步骤是：采用显著性检测算法对图像块进行采集，计算图像数据集中无标签样本的显著图；通过显著图来采集图像中显著性的图像块；采用K‑means训练显著性的图像块，获取质心；分别对训练样本和测试样本进行卷积操作，获取卷积特征图；分别计算图像数据集中训练样本和测试样本的水平先验特征，与训练样本和测试样本的卷积特征图逐个进行融合操作；对融合水平先验特征的特征图进行二进制哈希与分块直方图编码操作，从而得到训练样本和测试样本特征向量集合；采用训练样本特征向量和与之对应的标签来训练支持向量机，将测试样本的特征值输入已训练好的分类器中，实现图像分类。此种方法可减少计算成本，提高分类精度。

Description

一种基于K-means的图像分类方法

技术领域

本发明属于机器学习、图像处理技术领域，特别涉及一种图像分类方法。

背景技术

随着多媒体技术的发展，图像分类已成为计算机视觉领域研究的重点，图像分类是依据图像具有的某种属性而将其划分到预先设定的不同类别中，如何将图像进行有效的表达是提高图像分类准确率的关键，特征的选择与提取问题是图像分类目前存在的难点问题。

随着移动互联网的迅速发展，人类社会已进入大数据时代。SIFT、HOG等这些传统的特征学习虽能提取图像的某些特征，在图像分类中也取得了较好的效果，但这种人工设计特征方法存在一定的缺陷。此外，设计一种有效的特征提取方法也是一项繁琐的工作。近年来，在深度学习领域，无监督特征学习能够从图像数据中学习出描述图像内容的特征，相比于手工设计特征，具有更好的普适性。深度学习模型中卷积神经网络(CNN)在特征提取中取得突破性进展，但是CNN需要调整大量的超参数且具有较高的复杂度与开销。目前计算成本已成为图像分类的一个核心问题。相比而言，K-means作为一种非监督特征学习算法，无需调整大量的超参数，还可以学习到图像数据集中深层次的特征表达。

发明内容

本发明的目的，在于提供一种基于K-means的图像分类方法，旨在解决图像特征提取问题，克服现有图像分类方法存在的缺陷，减少计算成本，提高分类精度。

为了达成上述目的，本发明的解决方案是：

一种基于K-means的图像分类方法，包括以下步骤：

步骤1，采用显著性检测算法对图像块进行采集，计算图像数据集中无标签样本的显著图；通过显著图来采集图像中显著性的图像块；

步骤2，采用K-means来训练显著性的图像块，获取质心；

步骤3，使用步骤2中的质心分别对图像数据集中训练样本和测试样本进行卷积操作，分别获取训练样本和测试样本的卷积特征图；

步骤4，分别计算图像数据集中训练样本和测试样本的水平先验特征，将该值与步骤3得到的训练样本和测试样本的卷积特征图逐个进行融合操作；

步骤5，对步骤4中融合水平先验特征的特征图进行二进制哈希与分块直方图编码操作，从而得到训练样本和测试样本特征向量集合；

步骤6，采用训练样本特征向量和与之对应的标签来训练支持向量机，将测试样本的特征值输入已训练好的分类器中，实现图像分类。

上步骤1的具体步骤是：

步骤11，采用基于图论的显著性检测算法，计算图像数据集中无标签样本的显著图；

步骤12，根据步骤11中的显著图，从每幅无标签样本中随机选取M个图像块，确保每个图像块的平均视觉显著性大于阈值r；

步骤13，对提取的图像块进行局部亮度、对比度归一化和白化预处理操作。

上述步骤2的具体步骤是：

步骤21，从正态分布中随机初始化T个质心，读取步骤1最终得到的图像块；

步骤22，计算分配到每个质心的数据，并统计每个类别的所有数据，重新计算新的质心；

步骤23，比较新的质心和当前质心的距离是否小于设定的阈值，若小于设定的阈值，则迭代结束，输出当前质心；否则更新质心，重新开始新一轮的迭代过程。

上述步骤4的具体步骤如下：

步骤41，根据水平线检测算子分别获取每个训练样本和测试样本的水平先验特征；

步骤42，将每个样本的水平先验特征转换为与该样本同样大小的水平先验特征图，将该水平先验特征图与步骤3中该样本对应的特征图分别进行点乘操作，从而得到融入水平先验特征的特征图。

上述步骤5的具体步骤如下：

步骤51，对步骤4中每个样本所得的T个特征图进行二进制哈希操作；

步骤52，将步骤51中所得的特征图τ分成L块，然后统计分块矩阵的直方图矩阵，直方图的范围是[0,2⁸-1]，直方图矩阵大小为2⁸行L列；

步骤53，将步骤52中的直方图矩阵向量化为行向量Bhist(τ)，该行向量代表样本I的特征向量。

上述步骤6中，采用支持向量机进行训练以及分类过程。

采用上述方案后，本发明带来的有益效果是：

(1)本发明直接采用K-means作为特征提取工具，该方法具有较少的超参数需要调整，有效地减少了计算成本、降低了计算复杂度；

(2)本发明取代传统方法从原始图像上随机选取图像块，采用显著性理论来指导图像块的采集，从而提高分类精度；

(3)本发明采用了图像的水平先验特征，与K-means提取的特征进行结合，从而达到理想的分类结果。

附图说明

图1是本发明的流程图。

具体实施方式

以下将结合附图，对本发明的技术方案及有益效果进行详细说明。

本实施例的测试实验软硬件环境如下：

硬件类型：

电脑类型：台式机；

CPU：Intel(R)Core(TM)i5-5200U CPU@2.20GHz

内存：8.00GB

系统类型：64位操作系统

软件环境：

开发语言：Matlab

本实施例以STL-10数据库为例，该数据库包含10类RGB图像，每幅图像的大小为96*96，其中用于有监督训练的训练样本数共为5000，将5000个训练样本划分为十折，每次用于监督训练的训练样本数为1000，测试样本数为8000。

本发明提供的一种基于K-means的图像分类方法，配合图1所示，包括如下步骤：

步骤1，采用显著性检测算法采集图像块：

(1a)采用基于图论的显著性检测算法，计算STL-10数据集中无标签样本的显著图，其中数据集中无标签样本的数目是10,0000；

(1b)根据步骤(1a)中显著图，从每幅无标签样本中随机选取40个图像块，每个图像块的平均视觉显著性大于阈值0.5；

(1c)对采集的图像块进行亮度和对比度归一化和白化预处理操作。

步骤2，采用K-means训练显著性的图像块，获取质心：

(2a)从正态分布中随机初始化T个质心，T取值为1200，输入步骤(1c)经预处理后的图像块进行训练；

(2b)计算分配到每个质心的数据，并统计每个类别的所有数据，重新计算新的质心；

(2c)比较新的质心和当前质心的距离是否小于设定的阈值，若小于设定的阈值，则迭代结束，输出当前质心；否则更新质心，重新开始新一轮的迭代过程。

步骤3，使用步骤2提取的质心分别对STL-10数据集中的训练样本和测试样本进行卷积操作，分别获取训练样本和测试样本的卷积特征图，其中训练样本的数目为1000，测试样本的数目为8000；

步骤4，计算图像数据集中训练样本和测试样本的中央先验值：

(4a)水平先验特征依据大部分物体都置于地球表面，根据水平线检测算子分别获取每个训练样本和测试样本的水平先验特征；

(4b)将每个样本的水平先验特征转换为与该样本同样大小的水平先验特征图，水平先验特征图的大小为96*96；将该水平先验特征图与卷积操作后该样本对应的1200个特征图分别进行点乘操作，从而可得1200个融入水平先验特征的特征图；

步骤5，对步骤4中融合水平先验特征的特征图进行二进制哈希与分块直方图编码操作，从而得到训练样本和测试样本特征向量集合：

(5a)对步骤4中每个样本所得的1200个特征图进行二进制哈希操作，公式如下：

其中，I_l表示步骤4中样本I的第l个特征图，H(-)函数表示矩阵转换函数，若矩阵中的元素大于0，则将其置为1，否则为0；

(5b)将步骤(5a)中所得的特征图τ分成200块，然后统计分块矩阵的直方图矩阵，直方图的范围是[0,2⁸-1]，直方图矩阵大小为2⁸行L列；

(5c)将步骤(5b)中的直方图矩阵向量化为行向量Bhist(τ)，该行向量代表样本I的特征向量。

步骤6，采用步骤5中生成的训练样本特征值和对应标签来训练支持向量机，采用十折交叉训练，寻取最优参数C；将测试样本的特征值输入已训练的支持向量机中实现图像分类。

综合上述，本发明一种基于K-means的图像分类方法，将显著性理论用于采集图像数据集中显著性的图像块，通过K-means训练显著性的图像块来获取高质量的图像特征。利用图像卷积操作获取训练数据集和测试数据集的特征图，将得到的特征图与水平先验特征进行融合。对融合水平先验特征的特征图进行二进制哈希与分块直方图编码操作；最后采用支持向量机对测试数据集进行分类。本发明能够精确地获取图像特征，提高了图像的分类准确率，可用于大规模图像分类与检索系统的构建。

以上实施例仅为说明本发明的技术思想，不能以此限定本发明的保护范围，凡是按照本发明提出的技术思想，在技术方案基础上所做的任何改动，均落入本发明保护范围之内。

Claims

1.一种基于K-means的图像分类方法，其特征在于包括以下步骤：

步骤2，采用K-means来训练显著性的图像块，获取质心；

2.如权利要求1所述的一种基于K-means的图像分类方法，其特征在于：所述步骤1的具体步骤是：

3.如权利要求1的所述一种基于K-means的图像分类方法，其特征在于：所述步骤2的具体步骤是：

4.根据权利要求1的所述一种基于K-means的图像分类方法，其特征在于：所述步骤4的具体步骤如下：

5.如权利要求1所述的一种基于K-means的图像分类方法，其特征在于：所述步骤5的具体步骤如下：

6.如权利要求1所述的一种基于K-means的图像分类方法，其特征在于：所述步骤6中，采用支持向量机进行训练以及分类过程。