CN109635845B - 基于主成分分析和支持向量机结合的物料分选方法及系统 - Google Patents

基于主成分分析和支持向量机结合的物料分选方法及系统 Download PDF

Info

Publication number
CN109635845B
CN109635845B CN201811355682.2A CN201811355682A CN109635845B CN 109635845 B CN109635845 B CN 109635845B CN 201811355682 A CN201811355682 A CN 201811355682A CN 109635845 B CN109635845 B CN 109635845B
Authority
CN
China
Prior art keywords
sample
matrix
principal component
component analysis
classifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811355682.2A
Other languages
English (en)
Other versions
CN109635845A (zh
Inventor
黄国智
钟龙
黄嘉震
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Jinshi Sorting Intelligent Technology Co ltd
Original Assignee
Hunan Jinshi Sorting Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Jinshi Sorting Intelligent Technology Co ltd filed Critical Hunan Jinshi Sorting Intelligent Technology Co ltd
Priority to CN201811355682.2A priority Critical patent/CN109635845B/zh
Publication of CN109635845A publication Critical patent/CN109635845A/zh
Application granted granted Critical
Publication of CN109635845B publication Critical patent/CN109635845B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于主成分分析和支持向量机结合的物料分选方法及系统,该方法包括:采集待分选的物料的彩色图像或灰度图像,并提取彩色图像或灰度图像中的物料的轮廓;指定不同的轮廓对应的感兴趣区域的样本标签;将感兴趣区域的样本标签分别输入分类器,根据分类器输出的分值判定物料的类别。本发明采用主成分分析降维,留下了影响因子最强的特征元,简化的特征值减少了后续的运算量,可以实现多特征分类。

Description

基于主成分分析和支持向量机结合的物料分选方法及系统
技术领域
本发明涉及物料分选以及图像分类领域,尤其涉及一种基于主成分分析和支持向量机结合的物料分选方法及系统。
背景技术
基于图像分类的物料分选是通过软件在线采集在传输皮带上的物料图片,图片内包含带状的,无堆叠有间隔的物料(在皮带机或者自由落体,物料不叠在一起,有间隔即可),根据图片的特征进行分类。物料是破碎后颗粒较为均匀的建筑材料、矿石或者生活垃圾。
由于设备是24小时不间断生产,图像得出结果的时间非常短,因此实际生产的实时性和高速性的要求很高,在实时性要求非常高的场合,一般选择一两种具有关键表述特征的算子来做分类,这样能保证快速的分类。但是其缺点有二:一是是特征量少,二是不能采用维度较高的算子,同时算子采用数量较多时无法表示不同特征之间的相关性和影响因子。
这些分类算法的分类效果差,分类后都包含邻类的物料。特征量少的分选算法分类超平面不准确,而高维度算子的分选算法计算速度慢,机器的生产效率低。
发明内容
本发明提供了一种基于主成分分析和支持向量机结合的物料分选方法及系统,用以解决在实时性要求高的场合,采用图像进行物料分选算法时只能采用少量的算子,且不能采用维度较高的算子进行分类的技术问题。
为解决上述技术问题,本发明提出的技术方案为:
一种基于主成分分析和支持向量机结合的物料分选方法,包括以下步骤:
采集待分选的物料的彩色图像或灰度图像,并提取彩色图像或灰度图像中的物料的轮廓;
指定不同的轮廓对应的感兴趣区域的样本标签;
将感兴趣区域的样本标签分别输入分类器,根据分类器输出的分值判定物料的类别。
优选地,分类器通过如下步骤训练得到:
采集待分选的物料的彩色图像或灰度图像,并提取彩色图像或灰度图像中的物料的轮廓;
指定不同的轮廓对应的感兴趣区域的样本标签;
将每一个样本标签作为一个样本,提取样本的模糊特征集,用主成分分析对模糊特征集降维;将降维特征集合成一个特征向量矩阵;
将特征向量矩阵作为样本集,用支持向量机训练得到分类器。
优选地,将降维特征集合成一个特征向量矩阵之后,取所述特征向量矩阵中的部分样本作为训练样本集,用支持向量机训练得到所述分类器;
使用所述特征向量矩阵中的除所述部分样本之外的其余样本作为验证样本集,对所述分类器进行验证。
优选地,模糊特征集包括不同颜色、不同空间或不同通道的颜色直方图和灰度共生矩阵。
优选地,提取彩色图像或灰度图像中的物料的轮廓采用双阈值二值化方法完成;提取样本的模糊特征集,用主成分分析对模糊特征集降维,包括以下步骤:
提取该区域内图像的特征算子后将其归一化到一行中成为一个特征向量,将每个样本的特征提取出来可以得到一个N*M的训练样本矩阵,和一个N*1的标签集;
通过主成分分析进行降维将N*M的训练样本矩阵降维成一个N*K的训练样本矩阵和一个M*K的特征向量矩阵,和一个N*1的标签集;其中,所述M>>K,N<M。
优选地,将降维特征集合成一个特征向量矩阵步骤之后,还包括将专家特征加入特征向量矩阵。
优选地,专家特征包括:样本颜色空间中心、灰度均值以及感兴趣区域的面积和凸集的面积的比值。
优选地,方法还包括,根据专家规则,得到一个N*P的一个专家规则样本集,与N*K的训练样本矩阵和一个M*K的特征向量矩阵和一个N*1的标签集整合,得到N*U的训练样本集和N*1的标签集,一个M*K的特征向量矩阵;其中,U=M+P。
本发明还提供一种计算机系统,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述任一方法的步骤。
本发明具有以下有益效果:
1、本发明的基于主成分分析和支持向量机结合的物料分选方法及系统,采用主成分分析(PCA,Principal Component Analysis)降维,留下了影响因子最强的特征元,简化的特征值减少了后续的运算量,可以实现多特征分类。
2、在优选方案中,本发明基于主成分分析和支持向量机结合的物料分选方法及系统,结合专家规则的方式可以人工纳入了某些不具有普遍性特征,但是较强判别二分性质的特征,提高分类效果。
除了上面所描述的目的、特征和优点之外,本发明还有其它的目的、特征和优点。下面将参照附图,对本发明作进一步详细的说明。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明优选实施例的基于主成分分析和支持向量机结合的物料分选方法的流程示意图;
图2是本发明优选实施例1的二值化后物料区域的示意图。
具体实施方式
以下结合附图对本发明的实施例进行详细说明,但是本发明可以由权利要求限定和覆盖的多种不同方式实施。
参见图1,本发明的基于主成分分析和支持向量机结合的物料分选方法,包括以下步骤:
S1:采集待分选的物料的彩色图像或灰度图像,并提取彩色图像或灰度图像中的物料的轮廓;
S2:指定不同的轮廓对应的感兴趣区域的样本标签;
S3:将感兴趣区域的样本标签分别输入分类器,根据分类器输出的分值判定物料的类别。
通过上述步骤,采用主成分分析(PCA)降维,留下了影响因子最强的特征元,简化的特征值减少了后续的运算量,可以实现多特征分类。
实际实施时,以上的方法还能进行以下的扩充或应用,以下实施例中的技术特征都能相互组合,实施例仅作为示例,不作为对技术特征的正常组合限制。
实施例1:
本实施例的基于主成分分析和支持向量机结合的物料分选方法,包括以下步骤:
S1:参见图2,通过软件在线式采集在传输皮带上的物料图片,图片内包含平铺的间隔的物料。物料图片为彩色图像或灰度图像,采用双阈值二值化方法提取彩色图像或灰度图像中的物料的轮廓,由于传输皮带颜色稳定且单一,灰度图像采用双阈值二值化方法即可,如下:
Figure BDA0001866031800000031
其中f(x,y)代表图像中的像素值,x,y代表行列,k1<k2代表两个阈值。彩色图像采用的是灰度化后再使用上述的双阈值二值化方法。彩色图像灰度化公式如下:
f(x,y)=0.299*R(x,y)+0.587*G(x,y)+0.144*B(x,y)。
S2:指定不同的轮廓对应的感兴趣区域的样本标签。参见图2,图像中有许多物料,不同区域(ROI图像感兴趣区域)人为指定区域内物料所代表的类别,例如在矿石分选中矿石的区域为样本标签1,废石区域为样本标签2。通过多张的图片处理,得到批量有限图像样本集N,每个样本有自己的标签属性,不纳入计算。
S3:将感兴趣区域的样本标签分别输入分类器,根据分类器输出的分值判定物料的类别。本实施例中,分类器通过如下步骤训练得到:
S301:采集待分选的物料的彩色图像或灰度图像,并提取彩色图像或灰度图像中的物料的轮廓;
S302:指定不同的轮廓对应的感兴趣区域的样本标签;
S303:将每一个样本标签作为一个样本,提取样本的模糊特征集(模糊特征集包括不同颜色、不同空间或不同通道的颜色直方图和灰度共生矩阵),用主成分分析对模糊特征集降维;将降维特征集合成一个特征向量矩阵,具体如下:
提取该区域内图像的特征算子后将其归一化到一行中成为一个特征向量,将每个样本的特征提取出来可以得到一个N*M的训练样本矩阵,和一个N*1的标签集。
通过主成分分析进行降维将N*M的训练样本矩阵降维成一个N*K的训练样本矩阵和一个M*K的特征向量矩阵,和一个N*1的标签集。其中,N代表样本数量;M代表训练前样本维度;K代表训练后样本维度;M>>K,N一般来说小于M。N*1标签集,是分类器算法内部迭代自己验证精度用。
S304:将特征向量矩阵作为样本集,用支持向量机训练得到分类器。
S305:将降维特征集合成一个特征向量矩阵之后,取特征向量矩阵中的部分样本作为训练样本集(例如取90%),用支持向量机训练得到分类器;使用特征向量矩阵中的除部分样本之外的其余样本作为验证样本集(例如取10%),对分类器进行验证。算法训练后,直接分类,就会有样本标签自动验证分类精度。实际软件运行时,物料分选完之后,每类里面都会有被错误分类的物料,这个比例越小越好,可以根据实际的分类效果判断分类器训练是否已达到使用要求或者基本达到要求。
本实施例使用的是一个二分类器,在实施时,可以通过多次分类来实现两种以上的物料分类,在得到分类器输出的类别标识后,通过机械(夹持或者吹气)的手段将需要选出的类别捡出。
实施例2:
本实施例是实施例1的扩展例,本实施例的步骤与实施例1基本相同,不同之处仅在于,将降维特征集合成一个特征向量矩阵步骤之后,还包括将专家特征(专家特征包括:样本颜色空间中心、灰度均值以及感兴趣区域的面积和凸集的面积的比值)加入特征向量矩阵,具体如下:根据专家规则,得到一个N*P的一个专家规则样本集,与N*K的训练样本矩阵和一个M*K的特征向量矩阵和一个N*1的标签集整合,得到N*U的训练样本集和N*1的标签集,一个M*K的特征向量矩阵;其中,U=M+P。
本实施例的主成分分析(PCA)操作步骤如下:
(1)数据标准化,采用零-均值化方法,消除量纲大小以及数据数量级的影响;
特征提取得到数据N*M的样本数据,N代表样本数量,M代表特征向量维度。
(2)计算协方差矩阵;
Figure BDA0001866031800000051
其中,X代表一列,Y代表另外一列。
(3)计算协方差矩阵的特征值和特征向量:协方差矩阵的大小是M*M,得到M个特征值和特征向量。
(4)将特征值降序排序,指定降维后的维数K,或者通过占比判断调整K值。这样得到一个M*K的特征矩阵。
(5)将数据转换到个特征向量构建的新空间中。N*M的矩阵和M*K的矩阵的乘积得到一个N*K的新矩阵,这个就是降维后的样本。
本实施例的SVM(Support Vector Machine,支持向量机)操作步骤如下:
(1)支持向量目标函数:
Figure BDA0001866031800000052
subject to yi[(wx)+b]≥1-ξi(i=1,2,,,,k)
其中,k代表样本数,i代表样本序号,yi代表当前样本标签{[-1,1]},C为惩罚因子,ξi>0为离群量,b为超平面常量。
(2)核函数选择高斯核函数:
Figure BDA0001866031800000053
其中,σ控制带宽,x,y代表x->y之间向量的映射。
训练步骤:
a.参数选择:人为设定σ和惩罚因子C;
b.训练样本归一化:按照最大最小值方法将训练样本归一化;
c.网格优化参数:通过网格优算法化得到最优σk和Ck
d.SVM训练:通过SVM函数求解,得到支持向量空间L。
实施例3:
本发明还提供一种计算机系统,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述任一实施例的步骤。
综上可知,通过采用主成分分析(PCA)降维,留下了影响因子最强的特征元,简化的特征值减少了后续的运算量,可以实现多特征分类。结合专家规则的方式可以人工纳入了某些不具有普遍性特征,但是较强判别二分性质的特征,提高分类效果。例如人脸识别中的普遍特征是眼睛、鼻子、脸、嘴的差异,但是像痣这种是一种可立马判别一个有痣一个无痣的人。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种基于主成分分析和支持向量机结合的物料分选方法,其特征在于,包括以下步骤:
采集待分选的物料的彩色图像或灰度图像,并提取彩色图像或灰度图像中的物料的轮廓;
指定不同的所述轮廓对应的感兴趣区域的样本标签;
将所述感兴趣区域的样本标签分别输入分类器,根据分类器输出的分值判定所述物料的类别;
所述分类器通过如下步骤训练得到:
采集待分选的物料的彩色图像或灰度图像,并提取彩色图像或灰度图像中的物料的轮廓;
指定不同的所述轮廓对应的感兴趣区域的样本标签;
将每一个样本标签作为一个样本,提取样本的模糊特征集,用主成分分析对所述模糊特征集降维;将降维特征集合成一个特征向量矩阵;所述模糊特征集包括不同颜色、不同空间或不同通道的颜色直方图和灰度共生矩阵;
所述将降维特征集合成一个特征向量矩阵步骤之后,还包括将专家特征加入所述特征向量矩阵;所述专家特征包括:样本颜色空间中心、灰度均值以及感兴趣区域的面积和凸集的面积的比值;
将所述特征向量矩阵作为样本集,用支持向量机训练得到所述分类器。
2.根据权利要求1所述的基于主成分分析和支持向量机结合的物料分选方法,其特征在于,将降维特征集合成一个特征向量矩阵之后,取特征向量矩阵中的部分样本作为训练样本集,用支持向量机训练得到分类器;
使用特征向量矩阵中的除部分样本之外的其余样本作为验证样本集,对分类器进行验证。
3.根据权利要求1至2中任一项所述的基于主成分分析和支持向量机结合的物料分选方法,其特征在于,所述提取彩色图像或灰度图像中的物料的轮廓采用双阈值二值化方法完成;所述提取样本的模糊特征集,用主成分分析对所述模糊特征集降维,包括以下步骤:
提取该区域内图像的特征算子后将其归一化到一行中成为一个特征向量,将每个样本的特征提取出来可以得到一个N*M的训练样本矩阵,和一个N*1的标签集;
通过主成分分析进行降维将N*M的训练样本矩阵降维成一个N*K的训练样本矩阵和一个M*K的特征向量矩阵,和一个N*1的标签集;其中,所述M>>K,N<M。
4.根据权利要求3所述的基于主成分分析和支持向量机结合的物料分选方法,其特征在于,所述方法还包括,根据专家规则,得到一个N*P的一个专家规则样本集,与所述N*K的训练样本矩阵和一个M*K的特征向量矩阵和一个N*1的标签集整合,得到N*U的训练样本集和N*1的标签集,一个M*K的特征向量矩阵;其中,U=M+P。
5.一种计算机系统,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至4中任一所述方法的步骤。
CN201811355682.2A 2018-11-14 2018-11-14 基于主成分分析和支持向量机结合的物料分选方法及系统 Active CN109635845B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811355682.2A CN109635845B (zh) 2018-11-14 2018-11-14 基于主成分分析和支持向量机结合的物料分选方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811355682.2A CN109635845B (zh) 2018-11-14 2018-11-14 基于主成分分析和支持向量机结合的物料分选方法及系统

Publications (2)

Publication Number Publication Date
CN109635845A CN109635845A (zh) 2019-04-16
CN109635845B true CN109635845B (zh) 2021-10-22

Family

ID=66067933

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811355682.2A Active CN109635845B (zh) 2018-11-14 2018-11-14 基于主成分分析和支持向量机结合的物料分选方法及系统

Country Status (1)

Country Link
CN (1) CN109635845B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101234381A (zh) * 2008-03-07 2008-08-06 天津市华核科技有限公司 基于视觉识别的颗粒物料分选分级方法
CN101894270A (zh) * 2010-07-26 2010-11-24 中国科学院遥感应用研究所 面向遥感影像分类的样本自动选取方法
CN103743486A (zh) * 2014-01-02 2014-04-23 上海大学 一种基于海量烟叶数据的自动定级系统和方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916376B (zh) * 2010-07-06 2012-08-29 浙江大学 基于局部样条嵌入的正交半监督子空间图像分类方法
CN102930286B (zh) * 2012-09-18 2015-06-24 重庆大学 老年痴呆症图像早期诊断系统
TWI497422B (zh) * 2012-12-25 2015-08-21 Univ Nat Chiao Tung 車牌影像辨識系統及方法
CN103077402B (zh) * 2012-12-28 2016-05-11 国家电网公司 基于奇异值分解算法的变压器局部放电模式识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101234381A (zh) * 2008-03-07 2008-08-06 天津市华核科技有限公司 基于视觉识别的颗粒物料分选分级方法
CN101894270A (zh) * 2010-07-26 2010-11-24 中国科学院遥感应用研究所 面向遥感影像分类的样本自动选取方法
CN103743486A (zh) * 2014-01-02 2014-04-23 上海大学 一种基于海量烟叶数据的自动定级系统和方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
主成分分析(PCA)原理详解;Microstrong0305;《blog.csdn.net/program_developer/article/details/80632779》;20180609;第一页第3.5节(2)基于SVD分解协方差矩阵实现PCA算法 *

Also Published As

Publication number Publication date
CN109635845A (zh) 2019-04-16

Similar Documents

Publication Publication Date Title
CN109952614B (zh) 生物粒子的分类系统和方法
Mallah et al. Plant leaf classification using probabilistic integration of shape, texture and margin features
CN107563312B (zh) 人脸表情识别方法
CN101996328B (zh) 一种木材识别方法
CN109002851A (zh) 一种基于图像多特征融合的水果分类方法及应用
JP6149710B2 (ja) 画像処理装置及びプログラム
CN106845528A (zh) 一种基于K‑means与深度学习的图像分类算法
CN110826408B (zh) 一种分区域特征提取人脸识别方法
CN110909618A (zh) 一种宠物身份的识别方法及装置
CN102254188A (zh) 掌纹识别方法及装置
CN103177266A (zh) 储藏物害虫智能识别系统
WO2015146113A1 (ja) 識別辞書学習システム、識別辞書学習方法および記録媒体
CN104268587B (zh) 一种基于指波变换和svm的假指纹检测方法
Panigrahi et al. Evaluations of fractal geometry and invariant moments for shape classification of corn germplasm
CN102332087A (zh) 一种基于稀疏表示的人脸识别方法
CN109635845B (zh) 基于主成分分析和支持向量机结合的物料分选方法及系统
Bandara et al. Detection and classification of rice plant diseases using image processing techniques
CN112257730A (zh) 植物害虫图像识别方法、装置、设备及存储介质
CN111931757A (zh) 基于mdlbp分块直方图和pca降维的指静脉快速排序方法及装置
Pereira et al. An image analysis framework for effective classification of seed damages
JP5286574B2 (ja) オブジェクト検出認識装置、オブジェクト検出認識方法、および、プログラム
Al Shuaeba et al. Marigold blooming maturity levels classification using machine learning algorithms
Thilagavathi et al. Application of Image Processing in Detection of Plant Diseases: A Review
E Irhebhude et al. Recognition of mangoes and oranges colour and texture features and locality preserving projection
CN110647838B (zh) 一种用于设备工作状态识别的基于几何形状的一维信号特征提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant