CN107451604A - 一种基于K‑means的图像分类方法 - Google Patents

一种基于K‑means的图像分类方法 Download PDF

Info

Publication number
CN107451604A
CN107451604A CN201710566294.8A CN201710566294A CN107451604A CN 107451604 A CN107451604 A CN 107451604A CN 201710566294 A CN201710566294 A CN 201710566294A CN 107451604 A CN107451604 A CN 107451604A
Authority
CN
China
Prior art keywords
sample
image
test sample
barycenter
horizontal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710566294.8A
Other languages
English (en)
Inventor
陈霜霜
刘惠义
曾晓勤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hohai University HHU
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Priority to CN201710566294.8A priority Critical patent/CN107451604A/zh
Publication of CN107451604A publication Critical patent/CN107451604A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种基于K‑means的图像分类方法,步骤是:采用显著性检测算法对图像块进行采集,计算图像数据集中无标签样本的显著图;通过显著图来采集图像中显著性的图像块;采用K‑means训练显著性的图像块,获取质心;分别对训练样本和测试样本进行卷积操作,获取卷积特征图;分别计算图像数据集中训练样本和测试样本的水平先验特征,与训练样本和测试样本的卷积特征图逐个进行融合操作;对融合水平先验特征的特征图进行二进制哈希与分块直方图编码操作,从而得到训练样本和测试样本特征向量集合;采用训练样本特征向量和与之对应的标签来训练支持向量机,将测试样本的特征值输入已训练好的分类器中,实现图像分类。此种方法可减少计算成本,提高分类精度。

Description

一种基于K-means的图像分类方法
技术领域
本发明属于机器学习、图像处理技术领域,特别涉及一种图像分类方法。
背景技术
随着多媒体技术的发展,图像分类已成为计算机视觉领域研究的重点,图像分类是依据图像具有的某种属性而将其划分到预先设定的不同类别中,如何将图像进行有效的表达是提高图像分类准确率的关键,特征的选择与提取问题是图像分类目前存在的难点问题。
随着移动互联网的迅速发展,人类社会已进入大数据时代。SIFT、HOG等这些传统的特征学习虽能提取图像的某些特征,在图像分类中也取得了较好的效果,但这种人工设计特征方法存在一定的缺陷。此外,设计一种有效的特征提取方法也是一项繁琐的工作。近年来,在深度学习领域,无监督特征学习能够从图像数据中学习出描述图像内容的特征,相比于手工设计特征,具有更好的普适性。深度学习模型中卷积神经网络(CNN)在特征提取中取得突破性进展,但是CNN需要调整大量的超参数且具有较高的复杂度与开销。目前计算成本已成为图像分类的一个核心问题。相比而言,K-means作为一种非监督特征学习算法,无需调整大量的超参数,还可以学习到图像数据集中深层次的特征表达。
发明内容
本发明的目的,在于提供一种基于K-means的图像分类方法,旨在解决图像特征提取问题,克服现有图像分类方法存在的缺陷,减少计算成本,提高分类精度。
为了达成上述目的,本发明的解决方案是:
一种基于K-means的图像分类方法,包括以下步骤:
步骤1,采用显著性检测算法对图像块进行采集,计算图像数据集中无标签样本的显著图;通过显著图来采集图像中显著性的图像块;
步骤2,采用K-means来训练显著性的图像块,获取质心;
步骤3,使用步骤2中的质心分别对图像数据集中训练样本和测试样本进行卷积操作,分别获取训练样本和测试样本的卷积特征图;
步骤4,分别计算图像数据集中训练样本和测试样本的水平先验特征,将该值与步骤3得到的训练样本和测试样本的卷积特征图逐个进行融合操作;
步骤5,对步骤4中融合水平先验特征的特征图进行二进制哈希与分块直方图编码操作,从而得到训练样本和测试样本特征向量集合;
步骤6,采用训练样本特征向量和与之对应的标签来训练支持向量机,将测试样本的特征值输入已训练好的分类器中,实现图像分类。
上步骤1的具体步骤是:
步骤11,采用基于图论的显著性检测算法,计算图像数据集中无标签样本的显著图;
步骤12,根据步骤11中的显著图,从每幅无标签样本中随机选取M个图像块,确保每个图像块的平均视觉显著性大于阈值r;
步骤13,对提取的图像块进行局部亮度、对比度归一化和白化预处理操作。
上述步骤2的具体步骤是:
步骤21,从正态分布中随机初始化T个质心,读取步骤1最终得到的图像块;
步骤22,计算分配到每个质心的数据,并统计每个类别的所有数据,重新计算新的质心;
步骤23,比较新的质心和当前质心的距离是否小于设定的阈值,若小于设定的阈值,则迭代结束,输出当前质心;否则更新质心,重新开始新一轮的迭代过程。
上述步骤4的具体步骤如下:
步骤41,根据水平线检测算子分别获取每个训练样本和测试样本的水平先验特征;
步骤42,将每个样本的水平先验特征转换为与该样本同样大小的水平先验特征图,将该水平先验特征图与步骤3中该样本对应的特征图分别进行点乘操作,从而得到融入水平先验特征的特征图。
上述步骤5的具体步骤如下:
步骤51,对步骤4中每个样本所得的T个特征图进行二进制哈希操作;
步骤52,将步骤51中所得的特征图τ分成L块,然后统计分块矩阵的直方图矩阵,直方图的范围是[0,28-1],直方图矩阵大小为28行L列;
步骤53,将步骤52中的直方图矩阵向量化为行向量Bhist(τ),该行向量代表样本I的特征向量。
上述步骤6中,采用支持向量机进行训练以及分类过程。
采用上述方案后,本发明带来的有益效果是:
(1)本发明直接采用K-means作为特征提取工具,该方法具有较少的超参数需要调整,有效地减少了计算成本、降低了计算复杂度;
(2)本发明取代传统方法从原始图像上随机选取图像块,采用显著性理论来指导图像块的采集,从而提高分类精度;
(3)本发明采用了图像的水平先验特征,与K-means提取的特征进行结合,从而达到理想的分类结果。
附图说明
图1是本发明的流程图。
具体实施方式
以下将结合附图,对本发明的技术方案及有益效果进行详细说明。
本实施例的测试实验软硬件环境如下:
硬件类型:
电脑类型:台式机;
CPU:Intel(R)Core(TM)i5-5200U CPU@2.20GHz
内存:8.00GB
系统类型:64位操作系统
软件环境:
开发语言:Matlab
本实施例以STL-10数据库为例,该数据库包含10类RGB图像,每幅图像的大小为96*96,其中用于有监督训练的训练样本数共为5000,将5000个训练样本划分为十折,每次用于监督训练的训练样本数为1000,测试样本数为8000。
本发明提供的一种基于K-means的图像分类方法,配合图1所示,包括如下步骤:
步骤1,采用显著性检测算法采集图像块:
(1a)采用基于图论的显著性检测算法,计算STL-10数据集中无标签样本的显著图,其中数据集中无标签样本的数目是10,0000;
(1b)根据步骤(1a)中显著图,从每幅无标签样本中随机选取40个图像块,每个图像块的平均视觉显著性大于阈值0.5;
(1c)对采集的图像块进行亮度和对比度归一化和白化预处理操作。
步骤2,采用K-means训练显著性的图像块,获取质心:
(2a)从正态分布中随机初始化T个质心,T取值为1200,输入步骤(1c)经预处理后的图像块进行训练;
(2b)计算分配到每个质心的数据,并统计每个类别的所有数据,重新计算新的质心;
(2c)比较新的质心和当前质心的距离是否小于设定的阈值,若小于设定的阈值,则迭代结束,输出当前质心;否则更新质心,重新开始新一轮的迭代过程。
步骤3,使用步骤2提取的质心分别对STL-10数据集中的训练样本和测试样本进行卷积操作,分别获取训练样本和测试样本的卷积特征图,其中训练样本的数目为1000,测试样本的数目为8000;
步骤4,计算图像数据集中训练样本和测试样本的中央先验值:
(4a)水平先验特征依据大部分物体都置于地球表面,根据水平线检测算子分别获取每个训练样本和测试样本的水平先验特征;
(4b)将每个样本的水平先验特征转换为与该样本同样大小的水平先验特征图,水平先验特征图的大小为96*96;将该水平先验特征图与卷积操作后该样本对应的1200个特征图分别进行点乘操作,从而可得1200个融入水平先验特征的特征图;
步骤5,对步骤4中融合水平先验特征的特征图进行二进制哈希与分块直方图编码操作,从而得到训练样本和测试样本特征向量集合:
(5a)对步骤4中每个样本所得的1200个特征图进行二进制哈希操作,公式如下:
其中,Il表示步骤4中样本I的第l个特征图,H(-)函数表示矩阵转换函数,若矩阵中的元素大于0,则将其置为1,否则为0;
(5b)将步骤(5a)中所得的特征图τ分成200块,然后统计分块矩阵的直方图矩阵,直方图的范围是[0,28-1],直方图矩阵大小为28行L列;
(5c)将步骤(5b)中的直方图矩阵向量化为行向量Bhist(τ),该行向量代表样本I的特征向量。
步骤6,采用步骤5中生成的训练样本特征值和对应标签来训练支持向量机,采用十折交叉训练,寻取最优参数C;将测试样本的特征值输入已训练的支持向量机中实现图像分类。
综合上述,本发明一种基于K-means的图像分类方法,将显著性理论用于采集图像数据集中显著性的图像块,通过K-means训练显著性的图像块来获取高质量的图像特征。利用图像卷积操作获取训练数据集和测试数据集的特征图,将得到的特征图与水平先验特征进行融合。对融合水平先验特征的特征图进行二进制哈希与分块直方图编码操作;最后采用支持向量机对测试数据集进行分类。本发明能够精确地获取图像特征,提高了图像的分类准确率,可用于大规模图像分类与检索系统的构建。
以上实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。

Claims (6)

1.一种基于K-means的图像分类方法,其特征在于包括以下步骤:
步骤1,采用显著性检测算法对图像块进行采集,计算图像数据集中无标签样本的显著图;通过显著图来采集图像中显著性的图像块;
步骤2,采用K-means来训练显著性的图像块,获取质心;
步骤3,使用步骤2中的质心分别对图像数据集中训练样本和测试样本进行卷积操作,分别获取训练样本和测试样本的卷积特征图;
步骤4,分别计算图像数据集中训练样本和测试样本的水平先验特征,将该值与步骤3得到的训练样本和测试样本的卷积特征图逐个进行融合操作;
步骤5,对步骤4中融合水平先验特征的特征图进行二进制哈希与分块直方图编码操作,从而得到训练样本和测试样本特征向量集合;
步骤6,采用训练样本特征向量和与之对应的标签来训练支持向量机,将测试样本的特征值输入已训练好的分类器中,实现图像分类。
2.如权利要求1所述的一种基于K-means的图像分类方法,其特征在于:所述步骤1的具体步骤是:
步骤11,采用基于图论的显著性检测算法,计算图像数据集中无标签样本的显著图;
步骤12,根据步骤11中的显著图,从每幅无标签样本中随机选取M个图像块,确保每个图像块的平均视觉显著性大于阈值r;
步骤13,对提取的图像块进行局部亮度、对比度归一化和白化预处理操作。
3.如权利要求1的所述一种基于K-means的图像分类方法,其特征在于:所述步骤2的具体步骤是:
步骤21,从正态分布中随机初始化T个质心,读取步骤1最终得到的图像块;
步骤22,计算分配到每个质心的数据,并统计每个类别的所有数据,重新计算新的质心;
步骤23,比较新的质心和当前质心的距离是否小于设定的阈值,若小于设定的阈值,则迭代结束,输出当前质心;否则更新质心,重新开始新一轮的迭代过程。
4.根据权利要求1的所述一种基于K-means的图像分类方法,其特征在于:所述步骤4的具体步骤如下:
步骤41,根据水平线检测算子分别获取每个训练样本和测试样本的水平先验特征;
步骤42,将每个样本的水平先验特征转换为与该样本同样大小的水平先验特征图,将该水平先验特征图与步骤3中该样本对应的特征图分别进行点乘操作,从而得到融入水平先验特征的特征图。
5.如权利要求1所述的一种基于K-means的图像分类方法,其特征在于:所述步骤5的具体步骤如下:
步骤51,对步骤4中每个样本所得的T个特征图进行二进制哈希操作;
步骤52,将步骤51中所得的特征图τ分成L块,然后统计分块矩阵的直方图矩阵,直方图的范围是[0,28-1],直方图矩阵大小为28行L列;
步骤53,将步骤52中的直方图矩阵向量化为行向量Bhist(τ),该行向量代表样本I的特征向量。
6.如权利要求1所述的一种基于K-means的图像分类方法,其特征在于:所述步骤6中,采用支持向量机进行训练以及分类过程。
CN201710566294.8A 2017-07-12 2017-07-12 一种基于K‑means的图像分类方法 Pending CN107451604A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710566294.8A CN107451604A (zh) 2017-07-12 2017-07-12 一种基于K‑means的图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710566294.8A CN107451604A (zh) 2017-07-12 2017-07-12 一种基于K‑means的图像分类方法

Publications (1)

Publication Number Publication Date
CN107451604A true CN107451604A (zh) 2017-12-08

Family

ID=60487973

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710566294.8A Pending CN107451604A (zh) 2017-07-12 2017-07-12 一种基于K‑means的图像分类方法

Country Status (1)

Country Link
CN (1) CN107451604A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109239073A (zh) * 2018-07-28 2019-01-18 西安交通大学 一种用于汽车车身的表面缺陷检测方法
CN110636077A (zh) * 2019-10-12 2019-12-31 广元市公安局 一种基于统一平台的网络安全防护系统及方法
CN112200204A (zh) * 2020-12-07 2021-01-08 上海蜜度信息技术有限公司 图像特征表征方法及设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102496027A (zh) * 2011-11-10 2012-06-13 西安电子科技大学 基于约束自适应传递的半监督图像分类方法
CN102542295A (zh) * 2012-01-08 2012-07-04 西北工业大学 一种采用图像分类技术从遥感图像中进行滑坡检测的方法
CN103489004A (zh) * 2013-09-30 2014-01-01 华南理工大学 一种深度学习网络实现大类别图像识别的方法
CN103632166A (zh) * 2013-12-04 2014-03-12 西安电子科技大学 基于融合显著信息的潜在主题极光图像分类方法
CN103955707A (zh) * 2014-05-04 2014-07-30 电子科技大学 一种基于深度层次特征学习的海量图像分类系统
CN104239900A (zh) * 2014-09-11 2014-12-24 西安电子科技大学 基于k均值和深度svm的极化sar图像分类方法
CN104680180A (zh) * 2015-03-09 2015-06-03 西安电子科技大学 基于k均值和稀疏自编码的极化sar图像分类方法
CN104751175A (zh) * 2015-03-12 2015-07-01 西安电子科技大学 基于增量支持向量机的sar图像多类标场景分类方法
CN105426919A (zh) * 2015-11-23 2016-03-23 河海大学 基于显著性指导非监督特征学习的图像分类方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102496027A (zh) * 2011-11-10 2012-06-13 西安电子科技大学 基于约束自适应传递的半监督图像分类方法
CN102542295A (zh) * 2012-01-08 2012-07-04 西北工业大学 一种采用图像分类技术从遥感图像中进行滑坡检测的方法
CN103489004A (zh) * 2013-09-30 2014-01-01 华南理工大学 一种深度学习网络实现大类别图像识别的方法
CN103632166A (zh) * 2013-12-04 2014-03-12 西安电子科技大学 基于融合显著信息的潜在主题极光图像分类方法
CN103955707A (zh) * 2014-05-04 2014-07-30 电子科技大学 一种基于深度层次特征学习的海量图像分类系统
CN104239900A (zh) * 2014-09-11 2014-12-24 西安电子科技大学 基于k均值和深度svm的极化sar图像分类方法
CN104680180A (zh) * 2015-03-09 2015-06-03 西安电子科技大学 基于k均值和稀疏自编码的极化sar图像分类方法
CN104751175A (zh) * 2015-03-12 2015-07-01 西安电子科技大学 基于增量支持向量机的sar图像多类标场景分类方法
CN105426919A (zh) * 2015-11-23 2016-03-23 河海大学 基于显著性指导非监督特征学习的图像分类方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109239073A (zh) * 2018-07-28 2019-01-18 西安交通大学 一种用于汽车车身的表面缺陷检测方法
CN110636077A (zh) * 2019-10-12 2019-12-31 广元市公安局 一种基于统一平台的网络安全防护系统及方法
CN112200204A (zh) * 2020-12-07 2021-01-08 上海蜜度信息技术有限公司 图像特征表征方法及设备
CN112200204B (zh) * 2020-12-07 2021-04-20 上海蜜度信息技术有限公司 图像特征表征方法及设备

Similar Documents

Publication Publication Date Title
Wang et al. Tire defect detection using fully convolutional network
CN109614922B (zh) 一种动静态手势识别方法和系统
CN105426919B (zh) 基于显著性指导非监督特征学习的图像分类方法
Yi et al. CNN based page object detection in document images
CN104142918B (zh) 基于tf‑idf特征的短文本聚类以及热点主题提取方法
Yang et al. Graph-regularized saliency detection with convex-hull-based center prior
CN103984959B (zh) 一种基于数据与任务驱动的图像分类方法
CN107506761A (zh) 基于显著性学习卷积神经网络的脑部图像分割方法及系统
CN110276402B (zh) 一种基于深度学习语义边界增强的盐体识别方法
Lin et al. Fast color-spatial feature based image retrieval methods
CN108052523A (zh) 基于卷积神经网络的赌博网站识别方法和系统
CN103942571B (zh) 一种基于遗传规划算法的图形图像分类方法
CN105513066B (zh) 一种基于种子点选取与超像素融合的通用物体检测方法
CN104680193B (zh) 基于快速相似性网络融合算法的在线目标分类方法与系统
CN107451604A (zh) 一种基于K‑means的图像分类方法
CN108280051A (zh) 一种文本数据中错误字符的检测方法、装置和设备
CN107133854A (zh) 信息推荐方法和装置
Syam et al. An effective similarity measure via genetic algorithm for content based image retrieval with extensive features.
CN109325513A (zh) 一种基于海量单类单幅图像的图像分类网络训练方法
CN108898092A (zh) 基于全卷积神经网络的多光谱遥感影像路网提取方法
CN114445268A (zh) 一种基于深度学习的服装风格迁移方法及系统
Mishra et al. Medical image retrieval using self-organising map on texture features
CN109753581A (zh) 图像处理方法、装置、电子设备和存储介质
Chen et al. A classification method of oracle materials based on local convolutional neural network framework
CN106529601A (zh) 基于稀疏子空间多任务学习的图像分类预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171208