CN106975617A - 一种基于色选机的物料分类方法 - Google Patents

一种基于色选机的物料分类方法 Download PDF

Info

Publication number
CN106975617A
CN106975617A CN201710234932.6A CN201710234932A CN106975617A CN 106975617 A CN106975617 A CN 106975617A CN 201710234932 A CN201710234932 A CN 201710234932A CN 106975617 A CN106975617 A CN 106975617A
Authority
CN
China
Prior art keywords
sample
class
classification
decision
cost
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710234932.6A
Other languages
English (en)
Other versions
CN106975617B (zh
Inventor
李慧琦
张延军
佟志钰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN201710234932.6A priority Critical patent/CN106975617B/zh
Publication of CN106975617A publication Critical patent/CN106975617A/zh
Application granted granted Critical
Publication of CN106975617B publication Critical patent/CN106975617B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B07SEPARATING SOLIDS FROM SOLIDS; SORTING
    • B07CPOSTAL SORTING; SORTING INDIVIDUAL ARTICLES, OR BULK MATERIAL FIT TO BE SORTED PIECE-MEAL, e.g. BY PICKING
    • B07C5/00Sorting according to a characteristic or feature of the articles or material being sorted, e.g. by control effected by devices which detect or measure such characteristic or feature; Sorting by manually actuated devices, e.g. switches
    • B07C5/34Sorting according to other particular properties
    • B07C5/342Sorting according to other particular properties according to optical properties, e.g. colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于色选机的物料分类方法,首先,向色选机中分别投入有价值的一类物料样本和无价值的二类物料样本,利用阈值法和中值滤波的方法,对色选机采集的图像进行预处理,即消除背景和噪声,有利于提高后续分类筛选的正确率;利用C4.5决策树和代价敏感学习相结合的优化算法,构建决策树模型,能够高效、实时地实现物料的分类,并且能够在保证分类正确率不受到较大影响的前提下,尽可能的提高有价值的一类物料的纯度,即其精确度,也可以在人工模式下根据个人需求进行不同纯度品级的产品筛选。

Description

一种基于色选机的物料分类方法
技术领域
本发明属于图像处理技术领域,具体涉及一种基于色选机的物料分类方法。
背景技术
传统的塑料、矿石、小麦等分拣利用人工或操作半自动设备将异物或品质较差的物体分拣出来。但是由于人眼对物体的选择具有局限性,且卫生质量得不到保障,不能满足人们对产品质量和卫生的追求,所以色选技术应运产生。色选技术是指利用产品自身的光学特性,在光源的照射下,其反光特性或透光特性随农产品好坏的不同而不同,通过光学镜头后,产品的图像信息被CCD或光电二极管接收,利用控制芯片及微处理器进行信号进行放大处理、转换与传输等,并与标准信号进行对比,分析出该产品的品质优劣,再利用喷气阀将不合格、劣质产品进行分级剔除。
决策树是一种应用比较广泛的数据挖掘分类方法,因其具有分类精度高、速度快、生成的决策规则易于理解等优点而受到广泛关注。决策树的概念最早出现在概念学习系统(CLS,Concept learning system)中,后来许多决策树算法都是对CLS算法的改进,在决策树的发展中,ID3算法最有影响、作用最大,根据信息增益进行特征的选择。以ID3算法为基础,很多研究人员提出了对ID3的更新的算法。
在1993年Quinlan提出的C4.5算法是最有影响的一种决策树生成算法,其思想是先把整个数据集作为树的根节点,利用信息论中的信息增益率来寻找数据集中具有最大信息增益率的特征作为节点分裂的依据,而后根据特征的不同取值进行分裂,建立节点的分枝,并在每个子节点中重复该操作,直至生成一棵完整的决策树。
经典的分类问题是在假设为各种分类错误所要付出的代价相同的情况下,要求达到高的分类正确率。然而这种假设在实际应用中很难满足,如在矿石分类问题中,将有价值的一类矿石判断为无价值的二类矿石与将二类矿石判断为一类矿石,这两种错误的分类所要付出的代价一定是不相同的。
发明内容
本发明所要解决的关键问题是,针对不同误判代价的分类错误,在两分类问题中,保证分类正确率不受到较大影响的前提下,尽可能的减少误分类代价大的分类错误。为解决已有色选机系统的缺陷,本发明提出了一种基于色选机的物料分类方法,能够自动确定分类错误的最优误判代价,在保证分类正确率不受到较大影响的前提下,减少误分类代价较大的分类错误,也可以在人工模式下根据个人需求进行不同纯度品级的产品筛选。
本发明的一种基于色选机的物料分类方法,包括如下步骤:
步骤一:向色选机中分别投入有价值的一类物料和无价值的二类物料,采集物料样本图像,并对图像进行预处理,得到图像特征以及特征值,将形成的样本数据添加样本类别标签,构建训练集;
步骤二:选择工作模式,根据上一步处理得到物料训练集,利用C4.5决策树和代价敏感学习相结合的优化算法,构建决策树模型,具体步骤包括:
第1步、选择工作模式:当选择自动模式时,执行第2步至第12步;当选择人工模式时,手动输入代价值cost后,执行第13步到第14步;
第2步、假设将样本类别u2误判为样本类别u1是误判代价较大的错误,设定代价值C(i)表示将其他样本类别误判为样本类别ui的代价,i=1,2;设定样本类别u1的误判代价初始值为;C(1)=1;样本类别u2的误判代价初始值为C(2)=1;
第3步、将训练集中的样本数据作为决策树当前节点的数据集D;
第4步、计算第j个类别的类别权值w(j),j=1,2,公式如下:
其中,Ni为训练集中样本类别ui的个数;
第5步、计算数据集D的熵Info(D),公式如下:
Info(D)=-∑ip(j)log2(p(j))
其中,p(j)的计算公式如下:
第6步、假设样本数量为total,针对于样本对应的每个特征,将当前节点上的对应于该特征的数据样本的特征值,按从小到大进行排序,得到特征的取值序列{A1,A2,...,Atotal},分别以A1,A2,...,A(total-1)为分割点对数据集D进行分割,每一次分割均得到两个数据子集D1和D2,计算每个分割点的熵,则第k个分割点Ak的熵InfoAk(D)表示为:
其中,k=1,2,...,total-1,|D|为数据集D中的样本个数,|Dj|为样本子集Dj中的样本个数,j=1,2;
第7步、计算分割点Ak的信息增益率GainRatio(Ak),公式如下:
其中,
第8步、针对所有特征对应的所有分割点,找到信息增益率最大的分割点,作为当前层节点的分裂特征和分裂数值,将训练集按照该分裂特征并基于该分裂数值分为两个子集;
第9步、对第8步产生的所述两个子集分别进行判断:
当两个子集的样本个数过少或只有一类样本时,当前两个子集即作为决策树的最终分类结果,执行步骤10;
当其中一个子集的样本个数过少或只有一类样本,但另一个子集的样本个数较多,判定该另一个子集需要继续进行分裂,并将该另一个子集为新的训练集,形成决策树当前层节点的下一层节点,决策树当前节点的一个分支,重复第3步到第9步,直至所有分支均已得到分类结果,得到决策树模型,执行第10步;
当两个子集的样本个数均较多时,则两个子集均需要继续分裂,两个子集分别形成新训练集,并形成决策树当前层节点的下一层的两个节点,即当前节点的两个分支,该两个节点分别重复第3步到第9步,直至所有分支均已得到分类结果,得到决策树模型,执行第10步;
第10步、利用生成的决策树模型对训练集进行测试,计算分类正确率Accuracy和准确率Precision,综合考虑两个评估指标,并认为准确率Precision的重要性为正确率Accuracy的两倍,计算该模型得分Score:
第11步、令误判代价C(1)增大0.1,C(2)保持不变,使用步骤一得到的训练集,执行第3步到第10步,建立新的决策树模型并获得其得分Score;
第12步、重复第3步到第11步,直到得分Score较C(1)=1的得分Score有明显下降,取目前获得的所有得分Score中最大值对应的决策树模型为最终结果,执行步骤三;
第13步、假设样本数量为total,假设将样本类别u2误判为样本类别u1是误判代价较大的错误,设定代价值C(i)表示将其他样本类别误判为样本类别ui的代价,i=1,2;设定样本类别u1的误判代价值为C(1)=cost;样本类别u2的误判代价初始值为C(2)=1;
第14步、执行步骤3至步骤9,得到决策树模型,执行步骤三;
步骤三:根据上一步得到的决策树模型,对后续的混合物料进行分类,分类筛选出有价值的一类物料和无价值的二类物料。
较佳的,步骤一具体步骤包括:
第1步、取部分物料,进行人工分类筛选,分为有价值的一类物料样本和无价值的二类物料样本;
第2步、将两类物料样本分别投入色选机中,采集图像数据;
第3步、将图像的R、G、B三个通道的值作为特征,根据物料与背景色在R、G、B三个通道的较大差异,利用阈值法去除背景,并利用中值滤波去噪;
第4步、为得到的物料数据添加类别标签,构建训练集。
较佳的,步骤三中,得到分类结果后,将分类结果传输给喷气阀的控制电路,通过控制各个喷气阀的开闭完成对物料的分类。
本发明具有如下有益效果:
本发明是基于色选机的物料分类方法,首先,向色选机中分别投入有价值的一类物料样本和无价值的二类物料样本,利用阈值法和中值滤波的方法,对色选机采集的图像进行预处理,即消除背景和噪声,有利于提高后续分类筛选的正确率。利用C4.5决策树和代价敏感学习相结合的优化算法,构建决策树模型,能够高效、实时地实现物料的分类,并且能够在保证分类正确率不受到较大影响的前提下,尽可能的提高有价值的一类物料的纯度,即其精确度,也可以在人工模式下根据个人需求进行不同纯度品级的产品筛选。
本发明还具有较高的商业使用价值,实现了对有价值物料纯度的提高,从而提高产品的质量和价值,节省了大量人力资源和时间成本。
附图说明
图1为本发明实施例的分类方法流程示意图。
具体实施方式
下面结合附图并举实施例,对本发明进行详细描述。
本发明提供了一种基于色选机的物料分类方法,用于解决对物料的分类筛选问题,包含如下步骤:
步骤一:向色选机中分别投入有价值的一类物料和无价值的二类物料,采集集物料样本图像,利用阈值法和中值滤波的方法,对色选机的图像进行预处理,即消除背景和噪声,对两类物料数据添加类别标签,构建训练集,具体步骤包括:
第1步、取部分物料,进行人工分类筛选,分为有价值的一类物料样本和无价值的二类物料样本;
第2步、将两类物料样本分别投入色选机中,采集图像数据;
第3步、根据物料与背景色在R、G、B三个通道的较大差异,利用阈值法去除背景,并利用中值滤波去噪;
第4步、为得到的物料数据添加标签,构建训练集。
步骤二:选择工作模式,根据上一步处理得到物料训练集,利用C4.5决策树和代价敏感学习相结合的优化算法,构建决策树模型,具体步骤包括:
第1步、选择工作模式,共自动模式和人工模式两种。自动模式可以自动完成代价值确定和决策树模型构建;人工模式手动输入代价值,可根据需求更进一步地提高筛选纯度,输入代价值越高,获得纯度越高。例如,一千吨物料自动模式可筛选出一百吨有价值的一类物料,而在输入高代价值时,人工模式仅能筛选出十吨有价值的一类物料,但纯度更高,从而是筛选出的物料具有更高的价值。用户可根据需求自行选择。选择自动模式进行第2步到第12步,选择人工模式,手动输入代价值cost,进行第13步到第14步;
第2步、假设将样本类别u2误判为样本类别u1是误判代价较大的错误,即不希望出现的错误,设定代价值C(i)(i=1,2)表示将其他样本类别误判为样本类别ui的代价,设定初始值为C(1)=1,C(2)=1,即两种误判代价相同;
第3步、将训练集中的样本数据作为决策树的节点数据集D;
第4步、计算类别权值w(j),公式如下:
其中,Ni为训练集中样本类别ui的个数,j=1,2;
第5步、计算D的熵Info(D),公式如下:
Info(D)=-∑ip(j)log2(p(j))
其中,p(j)的计算公式如下:
第6步、假设样本数量为total,将该节点上的所有数据样本按照该特征的具体数值,按从小到大进行排序,得到该特征的取值序列{A1,A2,...,Atotal},分别以A1,A2,...,A(total-1)为分割点,将D分割为D1和D2,计算分割点Ai(i=1,2,...,total-1)的熵InfoAi(D),公式如下:
其中,|D|为D中的样本个数,|Dj|为Dj中的样本个数,j=1,2;
第7步、计算分割点Ai(i=1,2,...,total-1)的信息增益率GainRatio(Ai),公式如下:
其中,Gain(Ai)=Info(D)-InfoAi(D),
第8步、针对所有特征对应的所有分割点,找到信息增益率最大的分割点,作为当前层节点的分裂特征和分裂数值,将训练集按照该分裂特征并基于该分裂数值分为两个子集;如果最大分割点是特征R对应的,确定特征值以后,对训练集中R值大于或等于该特征值的数据分成一个子集,R值小于该特征值的数据分成另一个子集,分裂时并不考虑另外两个特征的特征值,即只按R特征进行分裂。
第9步、对第8步产生的所述两个子集分别进行判断:
当两个子集的样本个数过少或只有一类样本时,说明数据分裂到当前程度时,已经基本将两类物料区分开来,不再需要继续分裂了;则当前两个子集即作为决策树的最终分类结果,执行步骤10;
当其中一个子集的样本个数过少或只有一类样本,说明该子集不再需要继续分裂,但另一个子集的样本个数较多,说明该子集中不止包含一种物料,还将其它物料错误分裂到该子集中,因此,判定该另一个子集需要继续进行分裂,并将该另一个子集为新的训练集,形成决策树当前层节点的下一层节点,决策树当前节点的一个分支,重复第3步到第9步,直至所有分支均已得到分类结果,得到决策树模型,执行第10步;
当两个子集的样本个数均较多时,则两个子集均需要继续分裂,两个子集分别形成新训练集,并形成决策树当前层节点的下一层的两个节点,即当前节点的两个分支,该两个节点分别重复第3步到第9步,直至所有分支均已得到分类结果,得到决策树模型,执行第10步;
第10步、利用生成决策树模型对训练集进行测试,计算分类正确率Accuracy和准确率Precision,综合考虑两个评估指标,并认为准确率Precision的重要性为正确率Accuracy的两倍,计算该模型得分Score,公式如下:
第11步、令误判代价C(1)增大0.1,C(2)不变,使用步骤一得到的训练集,重复第4步到第10步,建立新的决策树模型并获得其得分Score;
第12步、重复第4步到第11步,直到得分Score较C(1)=1时有明显下降,取得分Score最高的代价值对应的决策树模型为最终结果。
第12步、重复第3步到第11步,直到得分Score较C(1)=1的得分Score有明显下降,取目前获得的所有得分Score中最大值对应的决策树模型为最终结果,执行步骤三;
第13步、假设样本数量为total,假设将样本类别u2误判为样本类别u1是误判代价较大的错误,设定代价值C(i)(i=1,2)表示将其他样本类别误判为样本类别ui的代价,设定样本类别u1的误判代价值为C(1)=cost;样本类别u2的误判代价初始值为C(2)=1;
第14步、执行步骤3至步骤9,得到决策树模型,执行步骤三;
步骤三:根据上一步得到的决策树模型,对后续的混合物料进行分类,分类筛选出有价值的一类物料和无价值的二类物料。
实施例:
步骤一:向色选机中分别投入有价值的一类矿石样本和无价值的二类矿石样本,利用阈值法和中值滤波的方法,对色选机采集的图像进行预处理,即消除背景和噪声。
第1步、取部分混合石料,进行人工分类筛选,分为有价值的一类矿石样本和无价值的二类矿石样本;
第2步、将两类矿石样本分别投入色选机料斗中,采集图像数据;
第3步、调节背景板,取背景色为黑色,设定阈值宽度为50,利用阈值法去除背景,即R、G、B三个通道数值与平均值差异均小于50的像素点判断为背景,否则为矿石,并利用中值滤波去噪;
第4步、为得到的矿石数据添加标签,以R、G、B三个通道数值为特征,构建训练集。
步骤二:选择自动模式,根据上一步处理得到矿石训练集,利用C4.5决策树和代价敏感学习相结合的优化算法,构建决策树模型。
第1步、二类矿石u2误判为一类矿石u1是误判代价较大的错误,即不希望出现的错误,令C(1)=1,C(2)=1,即两种误判代价相同,C(1)为将二类矿石u2误判为一类矿石u1的误判代价,C(2)为将一类矿石u1误判为二类矿石u2的误判代价;
第2步、将训练集中的样本数据作为决策树的节点数据集D;
第3步、计算类别权值w(j),公式如下:
其中,Ni为训练集中样本类别ui的个数;
第4步、计算D的熵Info(D),公式如下:
Info(D)=-∑ip(j)log2(p(j))
其中,p(j)的计算公式如下:
第5步、假设样本数量为total,将该节点上的所有数据样本按照该特征的具体数值,按从小到大进行排序,得到该特征的取值序列{A1,A2,...,Atotal},分别以A1,A2,...,A(total-1)为分割点,将D分割为D1和D2,计算分割点Ai(i=1,2,...,total-1)的熵InfoAi(D),公式如下:
其中,|D|为D中的样本个数,|Dj|为Dj中的样本个数,j=1,2;
第6步、计算分割点Ai(i=1,2,...,total-1)的信息增益率GainRatio(Ai),公式如下:
其中,Gain(Ai)=Info(D)-InfoAi(D),
第7步、取各特征各分割点中信息增益率最大的点为该节点的分裂特征和数值,将训练集分为两个子集;
第8步、对产生的子集进行判断,若其中样本个数过少或只有一类样本,则以个数较多的一类为该分支的分类结果,否则,以子集为新的训练集,形成新的叶节点,重复第2步到第7步。当所有分支均已得到分类结果,得到决策树模型,进行第9步;
第9步、利用生成决策树模型对训练集进行测试,计算分类正确率Accuracy和准确率Precision,综合考虑两个评估指标,并认为准确率Precision的重要性为正确率Accuracy的两倍,计算该模型得分Score,公式如下:
第10步、令误判代价C(1)增大0.1,C(2)不变,使用步骤一得到的训练集,重复第2步到第9步,建立新的决策树模型并获得其得分Score;
第11步、重复第3步到第10步,直到得分Score较C(1)=1时下降0.2,取得分Score最高的代价值对应的决策树模型为最终结果。
步骤三:根据上一步得到的决策树模型,对后续大量的混合石料进行分类,分类筛选出有价值的一类矿石和无价值的二类矿石,将分类结果传输给喷气阀的控制电路,通过控制各个喷气阀的开闭完成对石料的分类。
自此,就实现了色选机分类筛选矿石的全部过程。实验验证,本发明能够高效、实时地实现混合的分类筛选,并且能够在保证分类正确率不受到较大影响的前提下,尽可能的提高有价值的一类矿石的纯度,从而提高产品的质量和价值。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.一种基于色选机的物料分类方法,其特征在于,包括如下步骤:
步骤一:向色选机中分别投入有价值的一类物料和无价值的二类物料,采集物料样本图像,并对图像进行预处理,得到图像特征以及特征值,将形成的样本数据添加样本类别标签,构建训练集;
步骤二:选择工作模式,根据上一步处理得到物料训练集,利用C4.5决策树和代价敏感学习相结合的优化算法,构建决策树模型,具体步骤包括:
第1步、选择工作模式:当选择自动模式时,执行第2步至第12步;当选择人工模式时,手动输入代价值cost后,执行第13步到第14步;
第2步、假设将样本类别u2误判为样本类别u1是误判代价较大的错误,设定代价值C(i)表示将其他样本类别误判为样本类别ui的代价,i=1,2;设定样本类别u1的误判代价初始值为;C(1)=1;样本类别u2的误判代价初始值为C(2)=1;
第3步、将训练集中的样本数据作为决策树当前节点的数据集D;
第4步、计算第j个类别的类别权值w(j),j=1,2,公式如下:
w ( j ) = C ( j ) Σ i N i Σ i C ( i ) N i
其中,Ni为训练集中样本类别ui的个数;
第5步、计算数据集D的熵Info(D),公式如下:
Info(D)=-∑ip(j)log2(p(j))
其中,p(j)的计算公式如下:
p ( j ) = w ( j ) N j Σ i w ( i ) N i
第6步、假设样本数量为total,针对于样本对应的每个特征,将当前节点上的对应于该特征的数据样本的特征值,按从小到大进行排序,得到特征的取值序列{A1,A2,...,Atotal},分别以A1,A2,...,A(total-1)为分割点对数据集D进行分割,每一次分割均得到两个数据子集D1和D2,计算每个分割点的熵,则第k个分割点Ak的熵InfoAk(D)表示为:
Info A k ( D ) = Σ j ( | D j | | D | × I n f o ( D j ) )
其中,k=1,2,...,total-1,|D|为数据集D中的样本个数,|Dj|为样本子集Dj中的样本个数,j=1,2;
第7步、计算分割点Ak的信息增益率GainRatio(Ak),公式如下:
G a i n R a t i o ( A k ) = G a i n ( A k ) S p l i t I n f o ( A k )
其中,
Gain ( Ak ) = Info ( D ) - In fo Ak ( D ) , SplitInfo ( Ak ) = - Σ j ( | D j | | D | × log 2 ( | D j | | D | ) ) ; 第8步、针对所有特征对应的所有分割点,找到信息增益率最大的分割点,作为当前层节点的分裂特征和分裂数值,将训练集按照该分裂特征并基于该分裂数值分为两个子集;
第9步、对第8步产生的所述两个子集分别进行判断:
当两个子集的样本个数过少或只有一类样本时,当前两个子集即作为决策树的最终分类结果,执行步骤10;
当其中一个子集的样本个数过少或只有一类样本,但另一个子集的样本个数较多,判定该另一个子集需要继续进行分裂,并将该另一个子集为新的训练集,形成决策树当前层节点的下一层节点,决策树当前节点的一个分支,重复第3步到第9步,直至所有分支均已得到分类结果,得到决策树模型,执行第10步;
当两个子集的样本个数均较多时,则两个子集均需要继续分裂,两个子集分别形成新训练集,并形成决策树当前层节点的下一层的两个节点,即当前节点的两个分支,该两个节点分别重复第3步到第9步,直至所有分支均已得到分类结果,得到决策树模型,执行第10步;
第10步、利用生成的决策树模型对训练集进行测试,计算分类正确率Accuracy和准确率Precision,综合考虑两个评估指标,并认为准确率Precision的重要性为正确率Accuracy的两倍,计算该模型得分Score:
S c o r e = ( 1 + 0.5 2 ) Pr e c i s i o n × A c c u r a c y 0.5 2 × Pr e c i s i o n + A c c u r a c y
第11步、令误判代价C(1)增大0.1,C(2)保持不变,使用步骤一得到的训练集,执行第3步到第10步,建立新的决策树模型并获得其得分Score;
第12步、重复第3步到第11步,直到得分Score较C(1)=1的得分Score有明显下降,取目前获得的所有得分Score中最大值对应的决策树模型为最终结果,执行步骤三;
第13步、假设样本数量为total,假设将样本类别u2误判为样本类别u1是误判代价较大的错误,设定代价值C(i)表示将其他样本类别误判为样本类别ui的代价,i=1,2;设定样本类别u1的误判代价值为C(1)=cost;样本类别u2的误判代价初始值为C(2)=1;
第14步、执行步骤3至步骤9,得到决策树模型,执行步骤三;
步骤三:根据上一步得到的决策树模型,对后续的混合物料进行分类,分类筛选出有价值的一类物料和无价值的二类物料。
2.如权利要求1所述的一种基于色选机的物料分类方法,其特征在于,步骤一具体步骤包括:
第1步、取部分物料,进行人工分类筛选,分为有价值的一类物料样本和无价值的二类物料样本;
第2步、将两类物料样本分别投入色选机中,采集图像数据;
第3步、将图像的R、G、B三个通道的值作为特征,根据物料与背景色在R、G、B三个通道的较大差异,利用阈值法去除背景,并利用中值滤波去噪;
第4步、为得到的物料数据添加类别标签,构建训练集。
3.如权利要求1所述的一种基于色选机的物料分类方法,其特征在于,步骤三中,得到分类结果后,将分类结果传输给喷气阀的控制电路,通过控制各个喷气阀的开闭完成对物料的分类。
CN201710234932.6A 2017-04-12 2017-04-12 一种基于色选机的物料分类方法 Active CN106975617B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710234932.6A CN106975617B (zh) 2017-04-12 2017-04-12 一种基于色选机的物料分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710234932.6A CN106975617B (zh) 2017-04-12 2017-04-12 一种基于色选机的物料分类方法

Publications (2)

Publication Number Publication Date
CN106975617A true CN106975617A (zh) 2017-07-25
CN106975617B CN106975617B (zh) 2018-10-23

Family

ID=59345230

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710234932.6A Active CN106975617B (zh) 2017-04-12 2017-04-12 一种基于色选机的物料分类方法

Country Status (1)

Country Link
CN (1) CN106975617B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107737735A (zh) * 2017-09-30 2018-02-27 沈阳知行科技有限公司 报废汽车回收金属的融合感知在线分选系统及分选方法
CN108198168A (zh) * 2017-12-26 2018-06-22 合肥泰禾光电科技股份有限公司 物料分析方法及装置
CN108932482A (zh) * 2018-06-14 2018-12-04 内蒙古蒙草生态环境(集团)股份有限公司 一种用于调查草原沙化的遥感自动识别方法
CN113109240A (zh) * 2021-04-08 2021-07-13 国家粮食和物资储备局标准质量中心 一种计算机实施的粮食不完善粒测定方法和系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101414300A (zh) * 2008-11-28 2009-04-22 电子科技大学 一种互联网舆情信息的分类处理方法
CN101894270A (zh) * 2010-07-26 2010-11-24 中国科学院遥感应用研究所 面向遥感影像分类的样本自动选取方法
CN102523241A (zh) * 2012-01-09 2012-06-27 北京邮电大学 基于决策树高速并行处理的网络流量在线分类方法及装置
CN102542291A (zh) * 2011-12-23 2012-07-04 国网电力科学研究院 基于二叉决策树的高光谱遥感影像分类方法
CN103034868A (zh) * 2012-11-29 2013-04-10 中国地质大学(武汉) 一种针对小样本以及高维图像的分类方法
CN104850862A (zh) * 2015-05-27 2015-08-19 广西师范大学 一种基于单位代价收益敏感决策树的分类方法
CN106126972A (zh) * 2016-06-21 2016-11-16 哈尔滨工业大学 一种用于蛋白质功能预测的层级多标签分类方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101414300A (zh) * 2008-11-28 2009-04-22 电子科技大学 一种互联网舆情信息的分类处理方法
CN101894270A (zh) * 2010-07-26 2010-11-24 中国科学院遥感应用研究所 面向遥感影像分类的样本自动选取方法
CN102542291A (zh) * 2011-12-23 2012-07-04 国网电力科学研究院 基于二叉决策树的高光谱遥感影像分类方法
CN102523241A (zh) * 2012-01-09 2012-06-27 北京邮电大学 基于决策树高速并行处理的网络流量在线分类方法及装置
CN103034868A (zh) * 2012-11-29 2013-04-10 中国地质大学(武汉) 一种针对小样本以及高维图像的分类方法
CN104850862A (zh) * 2015-05-27 2015-08-19 广西师范大学 一种基于单位代价收益敏感决策树的分类方法
CN106126972A (zh) * 2016-06-21 2016-11-16 哈尔滨工业大学 一种用于蛋白质功能预测的层级多标签分类方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107737735A (zh) * 2017-09-30 2018-02-27 沈阳知行科技有限公司 报废汽车回收金属的融合感知在线分选系统及分选方法
CN108198168A (zh) * 2017-12-26 2018-06-22 合肥泰禾光电科技股份有限公司 物料分析方法及装置
CN108932482A (zh) * 2018-06-14 2018-12-04 内蒙古蒙草生态环境(集团)股份有限公司 一种用于调查草原沙化的遥感自动识别方法
CN108932482B (zh) * 2018-06-14 2022-03-18 内蒙古蒙草生态环境(集团)股份有限公司 一种用于调查草原沙化的遥感自动识别方法
CN113109240A (zh) * 2021-04-08 2021-07-13 国家粮食和物资储备局标准质量中心 一种计算机实施的粮食不完善粒测定方法和系统

Also Published As

Publication number Publication date
CN106975617B (zh) 2018-10-23

Similar Documents

Publication Publication Date Title
Ali et al. Symptom based automated detection of citrus diseases using color histogram and textural descriptors
CN106975617B (zh) 一种基于色选机的物料分类方法
CN106897738B (zh) 一种基于半监督学习的行人检测方法
CN107291822A (zh) 基于深度学习的问题分类模型训练方法、分类方法及装置
CN103106265B (zh) 相似图像分类方法及系统
CN106023220A (zh) 一种基于深度学习的车辆外观部件图像分割方法
Mustafa et al. Classification of fruits using Probabilistic Neural Networks-Improvement using color features
CN108520278A (zh) 一种基于随机森林的路面裂缝检测方法及其评价方法
CN106897371A (zh) 中文文本分类系统及方法
CN110442568A (zh) 字段标签的获取方法及装置、存储介质、电子装置
CN107665352A (zh) 一种基于多通道残差网络的珍珠分类方法
CN106960176A (zh) 一种基于超限学习机和颜色特征融合的行人性别识别方法
CN107682109A (zh) 一种适用于无人机通信系统的干扰信号分类识别方法
CN107679579A (zh) 基于深度学习的红枣品质分选方法
CN110059765A (zh) 一种矿物智能识别分类系统与方法
CN104850862B (zh) 一种基于单位代价收益敏感决策树的分类方法
Miah et al. An advanced method of identification fresh and rotten fruits using different convolutional neural networks
CN100464693C (zh) 基于像素的舌苔舌质颜色提取及分类方法
Dewi et al. Implementation of Adaptive Neuro-Fuzzy Inference System and Image Processing for Design Applications Paper Age Prediction
CN109523514A (zh) 对逆合成孔径雷达isar的批量成像质量评估方法
CN103839076B (zh) 一种基于光照特征的网络敏感图像识别方法
CN110288041A (zh) 基于深度学习的中草药分类建模方法及系统
CN111739636A (zh) 一种基于ppat的心理智能分析系统
Eustaquio et al. Artificial neural network for classification of immature and mature coffee beans using rgb values
CN115082762A (zh) 基于区域建议网络中心对齐的目标检测无监督域适应系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant