CN106570514A - 一种基于词袋模型和支持向量机的汽车轮毂分类方法 - Google Patents

一种基于词袋模型和支持向量机的汽车轮毂分类方法 Download PDF

Info

Publication number
CN106570514A
CN106570514A CN201610296542.7A CN201610296542A CN106570514A CN 106570514 A CN106570514 A CN 106570514A CN 201610296542 A CN201610296542 A CN 201610296542A CN 106570514 A CN106570514 A CN 106570514A
Authority
CN
China
Prior art keywords
wheel hub
automotive hub
automobile wheel
global
bag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610296542.7A
Other languages
English (en)
Inventor
胡凯
翁理国
夏旻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yangzhou Xi Qi Robotization Science And Technology Ltd
Original Assignee
Yangzhou Xi Qi Robotization Science And Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yangzhou Xi Qi Robotization Science And Technology Ltd filed Critical Yangzhou Xi Qi Robotization Science And Technology Ltd
Priority to CN201610296542.7A priority Critical patent/CN106570514A/zh
Publication of CN106570514A publication Critical patent/CN106570514A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于词袋模型和支持向量机的汽车轮毂分类方法。包括以下步骤:1)对于给定的汽车轮毂像进行预处理,使其成为标准数据库用于训练和测试;2)提取图像的全局纹理特征、全局颜色特征;3)采用SIFT描述子,提取图像的局部特征,并对其进行K‑Means聚类,形成基于词袋模型的特征描述。4)融合全局和局部特征,采用极限学习机学习得到汽车轮毂分类器。5)基于学习得到的汽车轮毂分类器,对待测试的样本进行测试,得到最终的分类结果。本发明利用全局特征和局部特征融合,通过极限学习机来学习汽车轮毂分类器,可获得比传统的基于KNN、SVM和BP神经网络的汽车轮毂分类方法更准确的分类性能,在大量的测试中精确度达到99.9%以上。

Description

一种基于词袋模型和支持向量机的汽车轮毂分类方法
技术领域
本发明涉及一种汽车轮毂的检测分类领域,具体来讲是关于是采用单目视觉对生产线上的不同汽车轮毂进行在线的检测后分类。
背景技术
在汽车工业中,人们需要对汽车轮毂的检测分类,从而为下一步的工序提供决策。目前这些工作主要有人工完成,费事费力。没有用视觉和人工智能的方法进行操作。本发明拟解决这一需求。
发明内容
本发明所解决的技术问题是提出一种基于词袋模型和极限学习机的汽车轮毂检测分类方法,充分利用全局纹理特征、全局颜色特征、全局形状特征以及基于词袋模型的局部特征来描述图像,采用极限学习机作为分类器,从而获得了更准确的分类性能。
根据本发明的方案,提出了一种基于词袋模型和极限学习机的汽车轮毂检测分类方法,包括以下步骤:
步骤一、对于给定的汽车轮毂图像进行预处理,使其成为标准图以用于训练和测试;
步骤二、基于颜色、形状和纹理特征,提取图像的全局特征;
步骤三、基于词袋模型,提取图像的局部特征;
步骤四、融合全局和局部特征,采用极限学习机学习得到汽车轮毂分类器;
步骤五、基于学习得到的分类器,对待测试图像的特征向量进行分类,得到最终的分类结果。
本发明提出的方法是将全局特征和局部特征融合在一起作为特征向量,有效考虑了图像的复杂性和不同类别的差异性,并采用极限学习机作为分类器,试验结果表明该方法分类准确率较高。
相比现有技术,本发明方法具有以下有益效果:
(1)建立“词袋”模型,采用K-means算法进行聚类,分析汽车轮毂检测分类的局部特征;
(2)以汽车轮毂检测分类的多维综合全局特征和汽车轮毂的局部特征为基础建立极限学习机分类的汽车轮毂检测分类算法;
在相同条件下,本发明方法可获得比传统的基于K近邻、BP神经网络和SVM的分类方法更准确的分类性能。
附图说明
图1是本发明一种基于词袋模型和极限学习机的汽车轮毂检测分类方法的流程图。
图2 是极限学习机网络示意图。
图3 几种轮毂的检测精度。
具体实施方式
下面结合附图对本发明作具体说明;所描述的实施范例仅是为了说明的目的,而不是对本发明范围的限制。
本发明提出一种基于词袋模型和极限学习机的汽车轮毂检测分类方法,目的在于通过充分利用汽车轮毂图的全局纹理特征、形状特征全局颜色特征以及基于词袋模型的局部特征,采用极限学习机分类器对任意一张汽车轮毂识别为某一种类型汽车轮毂。
图1是本发明的流程图。参照图1,本发明实现步骤如下:
步骤一、对给定的汽车轮毂图像进行预处理,采用人工标定的方式,使其成为标准图以用于训练和测试。
步骤二、提取全局特征
A.汽车轮毂图像的颜色特征分析
项目拟对汽车轮毂图像的红、绿、蓝通道分别进行分析,并研究各通道图像之间的差值、比值、归一化差值等运算,以提取汽车轮毂的最佳色彩特征。
B.汽车轮毂图像的纹理特征分析
考虑到汽车轮毂图像特性,本项目重点研究基于统计分析和基于模型分析的纹理方法,包括灰度共生矩阵纹理分析法、地统计学纹理分析法、Markov 随机场模型法和分形模型法等。研究并提取适合表征汽车轮毂图像的纹理特征。
C.汽车轮毂图像的形状特征分析
分析汽车轮毂图像形态特征,分别计算各自的面积、长宽比、长度、宽度、边界长度、形状指数、密度、主要方向和不对称性等形状特征,找出适合表征汽车轮毂的形状特征。
基于各类汽车轮毂图像的色彩特征、纹理特征和形状特征,建立每幅图的全局高维特征向量。
步骤三、提取局部特征
本项目中采用空间灰度相关矩阵,邻域灰度差分矩阵,方向梯度直方图形状特征,以及Gabor纹理特征来描述局部特征。在局部特征表述中,我们将采用一种叫做“词袋”的算法,用来表示图像的特征描述。“词袋”(Bag of words)模型原是自然语言处理领域用于文本信息检索和文本分类的技术。用它做图像表示模型(我们称之为视觉词袋模型),需要将图像信息映射成视觉关键词集合,这样既保存了图像的局部特征又有效地压缩了图像的描述。为了使用图像“词袋”模型,首先要在学习阶段建立视觉关键词的集合:在训练图像集中,将每张图分割成若干个局部图(Patch),提取出所有局部特征,然后对这些特征进行聚类,得到的结果是训练集中的普遍特征,即“词典”。本项目中采用k均值算法对局部特征进行给定聚类中心数目的聚类。对一张学习样本汽车轮毂图像,若将汽车轮毂图像划分为n个局部区域,则会产生一组观察值序列,每个观察值都为一个4维向量(代表4种特征),k均值聚类通过公式(1)将这n个值划分到k个类别中去。
(1)
其中的均值。通过把一个聚类中心当作一个视觉关键词,就能把每一个从图像中提取的特征映射到它最接近的视觉词典上,并且能把图像表示为一个视觉词典上的直方图特征。在汽车轮毂图像分类的时候将直方图的特征作为分类器的输入。
步骤四、极限学习机模型的建立
使用适当的分类器,建立分类器学习模型。常用的分类器有K近邻、SVM、贝叶斯以及BP神经网络等等,本发明采用极限学习机(ELM)分类器。
作为一类单隐层前向神经网络,与传统方法不同,它可以随机的选择网络中的隐层神经元的连接权值,输入权值和隐藏层偏差可以随机赋值,输出层权值通过解析算法计算得到,具有学习速度快、泛化能力好等优良特性。
假设有N个不同的训练样本为输入样本, 为输出样本,其中。网络具有个隐层节点,激活函数为的SLFN的统一模型为,其中,是第i个隐层节点与输入节点的连接权值,是第个隐层节点与输出节点的连接权值,是第个隐层节点的偏差。网络结构图如图3所示。
上述N个方程的矩阵形式可以写为:
H为网络隐层输出矩阵。如果激活函数g(x)无限可微,根据极限学习机的定理,
所以,单隐层前向神经网络的训练过程,等价于寻找线性系统的最小二乘解,即是矩阵H的Moore-Penrose广义矩阵。
至此,我们已学习到了极限学习机(ELM) 汽车轮毂图像分类器。
步骤五、基于极限学习机分类器的识别
将测试样本数据送入相应的极限学习机分类器模型中,得到4个分类值,选取最大值作为最终的分类结果。重复步骤四-五次,取分类次数最多的作为最终结果。

Claims (5)

1.一种基于词袋模型和支持向量机的汽车轮毂分类方法,其特征在于,包括以下几个步骤:
步骤一、对于给定的汽车轮毂图像进行预处理,使其成为标准图以用于训练和测试;
步骤二、基于颜色、形状和纹理特征,提取图像的全局特征;
步骤三、采用空间灰度相关矩阵,邻域灰度差分矩阵,方向梯度直方图形状特征,以及Gabor纹理特征来描述局部特征;
步骤四、融合全局和局部特征,采用极限学习机学习得到分类器;
步骤五、基于学习得到的分类器,对待测试图像的特征向量进行分类,得到最终的分类结果。
2.根据权利要求1所述一种基于词袋模型和支持向量机的汽车轮毂分类方法,其特征在于,所述步骤一中的图像预处理,具体为:对图像进行滤波等预处理,然后选择一系列已有的汽车轮毂图像作为训练样本。
3.根据权利要求1所述一种基于词袋模型和支持向量机的汽车轮毂分类方法,其特征在于,所述步骤二中的提取特征向量,具体为:分别提取汽车轮毂图的全局纹理特征、全局颜色特征以及全局形状特征,和基于词袋模型的局部特征。
4.根据权利要求1所述一种基于词袋模型和支持向量机的汽车轮毂分类方法,其特征在于,所述步骤四中的极限学习机分类器,具体为:随机选择网络中的隐层神经元的连接权值,输入权值和隐层偏差可以随机赋值,通过训练样本可计算出输出层权值,学习到了汽车轮毂的检测分类器。
5.根据权利要求1所述一种基于词袋模型和支持向量机的汽车轮毂分类方法,其特征在于,根据学习到的分类器,对待测试的样本进行测试 ,最终完成汽车轮毂的分类。
CN201610296542.7A 2016-05-08 2016-05-08 一种基于词袋模型和支持向量机的汽车轮毂分类方法 Pending CN106570514A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610296542.7A CN106570514A (zh) 2016-05-08 2016-05-08 一种基于词袋模型和支持向量机的汽车轮毂分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610296542.7A CN106570514A (zh) 2016-05-08 2016-05-08 一种基于词袋模型和支持向量机的汽车轮毂分类方法

Publications (1)

Publication Number Publication Date
CN106570514A true CN106570514A (zh) 2017-04-19

Family

ID=58532122

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610296542.7A Pending CN106570514A (zh) 2016-05-08 2016-05-08 一种基于词袋模型和支持向量机的汽车轮毂分类方法

Country Status (1)

Country Link
CN (1) CN106570514A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107368807A (zh) * 2017-07-20 2017-11-21 东南大学 一种基于视觉词袋模型的监控视频车型分类方法
CN108615230A (zh) * 2018-03-16 2018-10-02 北京邮电大学 一种轮毂表面异常检测方法和系统
CN108921205A (zh) * 2018-06-14 2018-11-30 浙江大学 一种基于多特征融合的皮肤病临床图像分类方法
CN111160373A (zh) * 2019-12-30 2020-05-15 重庆邮电大学 一种变速鼓零件缺陷图像特征提取以及检测分类方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6735583B1 (en) * 2000-11-01 2004-05-11 Getty Images, Inc. Method and system for classifying and locating media content
CN102622607A (zh) * 2012-02-24 2012-08-01 河海大学 一种基于多特征融合的遥感图像分类方法
CN103258210A (zh) * 2013-05-27 2013-08-21 中山大学 一种基于字典学习的高清图像分类方法
CN103514456A (zh) * 2013-06-30 2014-01-15 安科智慧城市技术(中国)有限公司 基于压缩感知多核学习的图像分类方法及其装置
CN103699902A (zh) * 2013-12-24 2014-04-02 南京信息工程大学 一种地基可见光云图的分类方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6735583B1 (en) * 2000-11-01 2004-05-11 Getty Images, Inc. Method and system for classifying and locating media content
CN102622607A (zh) * 2012-02-24 2012-08-01 河海大学 一种基于多特征融合的遥感图像分类方法
CN103258210A (zh) * 2013-05-27 2013-08-21 中山大学 一种基于字典学习的高清图像分类方法
CN103514456A (zh) * 2013-06-30 2014-01-15 安科智慧城市技术(中国)有限公司 基于压缩感知多核学习的图像分类方法及其装置
CN103699902A (zh) * 2013-12-24 2014-04-02 南京信息工程大学 一种地基可见光云图的分类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李林: ""基于地基云图的运量检测与云状识别"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
李继宏: ""基于极限学习机的图像标注研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107368807A (zh) * 2017-07-20 2017-11-21 东南大学 一种基于视觉词袋模型的监控视频车型分类方法
CN107368807B (zh) * 2017-07-20 2020-06-30 东南大学 一种基于视觉词袋模型的监控视频车型分类方法
CN108615230A (zh) * 2018-03-16 2018-10-02 北京邮电大学 一种轮毂表面异常检测方法和系统
CN108921205A (zh) * 2018-06-14 2018-11-30 浙江大学 一种基于多特征融合的皮肤病临床图像分类方法
CN111160373A (zh) * 2019-12-30 2020-05-15 重庆邮电大学 一种变速鼓零件缺陷图像特征提取以及检测分类方法

Similar Documents

Publication Publication Date Title
CN112308158B (zh) 一种基于部分特征对齐的多源领域自适应模型及方法
CN104966104B (zh) 一种基于三维卷积神经网络的视频分类方法
CN106815604B (zh) 基于多层信息融合的注视点检测方法
CN109800811B (zh) 一种基于深度学习的小样本图像识别方法
CN103514456B (zh) 基于压缩感知多核学习的图像分类方法及其装置
CN110321967B (zh) 基于卷积神经网络的图像分类改进方法
CN107766933B (zh) 一种解释卷积神经网络的可视化方法
CN103150580B (zh) 一种高光谱图像半监督分类方法及装置
CN109063649B (zh) 基于孪生行人对齐残差网络的行人重识别方法
CN106408030B (zh) 基于中层语义属性和卷积神经网络的sar图像分类方法
CN106919920A (zh) 基于卷积特征和空间视觉词袋模型的场景识别方法
CN108875076B (zh) 一种基于Attention机制和卷积神经网络的快速商标图像检索方法
CN103106265B (zh) 相似图像分类方法及系统
CN108460421A (zh) 不平衡数据的分类方法
CN111489370B (zh) 基于深度学习的遥感图像的分割方法
CN103632168A (zh) 一种机器学习中的分类器集成方法
CN109492750B (zh) 基于卷积神经网络和因素空间的零样本图像分类方法
CN108491864B (zh) 基于自动确定卷积核大小卷积神经网络的高光谱图像分类
CN103177265B (zh) 基于核函数与稀疏编码的高清图像分类方法
CN109886161A (zh) 一种基于可能性聚类和卷积神经网络的道路交通标识识别方法
CN108764302A (zh) 一种基于颜色特征和词袋特征的票据图像分类方法
CN106570514A (zh) 一种基于词袋模型和支持向量机的汽车轮毂分类方法
CN106022254A (zh) 图像识别技术
CN110807485B (zh) 基于高分遥感影像二分类语义分割图融合成多分类语义图的方法
CN110414587A (zh) 基于渐进学习的深度卷积神经网络训练方法与系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170419