CN106845522B - 一种冶金成球过程中的分类判别系统 - Google Patents
一种冶金成球过程中的分类判别系统 Download PDFInfo
- Publication number
- CN106845522B CN106845522B CN201611218510.1A CN201611218510A CN106845522B CN 106845522 B CN106845522 B CN 106845522B CN 201611218510 A CN201611218510 A CN 201611218510A CN 106845522 B CN106845522 B CN 106845522B
- Authority
- CN
- China
- Prior art keywords
- classification
- discrimination
- unit
- svm
- results
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/285—Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/245—Classification techniques relating to the decision surface
- G06F18/2451—Classification techniques relating to the decision surface linear, e.g. hyperplane
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明是涉及一种冶金成球过程中的分类判别系统,该系统主要由聚类分类模块和判别优化模块构成,所述的聚类分类模块主要包含动态聚类单元和SVM分类单元:首先由动态聚类的方式得到一组初始标签,再以此初始标签为基础构建SVM分类模型,所述的判别优化模块主要包括判别单元和Fisher优化单元:判别单元对SVM分类与上一近邻分类两次得到的分类结果进行判别:若两次分类结果一致,则可以直接得到最优的分类方式;若两次分类结果不一致,则Fisher优化单元利用Fisher判别原理优化出基础类别,然后再以基础类别作为初始标签构建SVM分类模型,反复经过SVM分类和Fisher判别优化最终得到一种最优的分类方式,进而完成对球团样本的分类判别筛选工作。
Description
技术领域
本发明涉及一种冶金成球过程中的分类判别系统,具体是涉及一种基于SVM-Fisher的分类、判别原理,对冶金成球产生的球团样本进行最优分类,从中筛选出符合需求球团的系统。
背景技术
在冶金行业中球团生产是将细磨铁精矿制成能满足高炉炼铁需要的块状物料的一个加工过程。铁精矿按照一定比例添加粘结剂后并混合均匀,再由造球机经滚动制成一定比例的生球,然后经干燥、焙烧使球团固结。高炉生产以低燃耗和高产率为目的的趋势已日益增加,对高炉炉料的质量要求越来越高。因此,从众多样本中筛选出高质量的球团对高炉冶炼有着重要的价值,同时提高高质量球团的产出量对于增加高炉生产效率也起着至关重要的作用。
工业上,对成球性试验所得到的球团性能进行评价时,具有多个方面的评价指标,除专业划级的个别指标外,更多的是需要依据标准进行人为划分的指标。
人为依据标准的划分可以针对单一指标具有100%的信度,但是对成球性试验中球团的性能进行综合评价时,指标数量和样本维数都会扩大,通过人为方式对球团性能进行分类是难以实现。
本发明就是针对以上问题提出的,提供了一种基于SVM-Fisher的分类、判别原理,对冶金成球产生的球团样本进行最优分类,从中筛选出符合需求球团的系统。
发明内容
本发明是涉及一种冶金成球过程中的分类判别系统,该系统主要由聚类分类模块和判别优化模块构成。其中聚类分类模块主要包含动态聚类单元和SVM分类单元两部分:首先由动态聚类的方式得到一组初始标签,再以此初始标签为基础构建SVM分类模型。判别优化模块主要包括判别单元和Fisher优化单元:判别单元对SVM分类得到的分类结果与上一近邻分类结果进行判别:若两次分类结果一致,则可以直接得到最优的分类方式;若两次分类结果不一致,则Fisher优化单元利用Fisher判别原理优化出基础类别,然后再以基础类别作为初始标签构建SVM分类模型,反复经过SVM分类和Fisher判别优化最终得到一种最优的分类方式,进而完成对球团样本的分类判别筛选工作。
聚类分类模块中的SVM分类单元是基于SVM分类原理对样本进行分类,主要是通过一个映射,即核函数,将低维空间不能线性可分的问题通过核函数映射到高维空间,从而使它变为线性可分。具体而言,SVM分类模型是通过已知标签的数据,构造出训练集和测试集,应用训练集进行模型训练,这是计算机自学习的一个过程,与神经网络类似,只不过神经网络是在给定置信范围,力求将经验风险降到最低;而SVM分类则相反,即经验风险是一定的,力求让置信范围达到最小。在完成模型的训练之后,将已知标签的测试集进行模型测试,得到模型测试的准确率,从而完成一个完整的SVM分类模型的建立过程,当模型本身达到一个较高分类精度时,对新的数据集进行标签化,达到分类的效果。
实际上,SVM分类模型的建立需要初始指标,而球团样本判定所需要的多个属性是无法人为公度,结合多个属性的样本初始标签不能直接得到的,因此首先应当利用动态聚类单元采取动态聚类方式形成初始标签,并在此基础上建立SVM分类模型。值得注意的是在动态聚类的过程中采取球团的性能指标,而SVM分类时使用球团的理化指标,两次标签形成过程针对球团的不同属性,从而实现球团属性信息的互补。动态聚类本身是一个不断迭代调整的过程,在反复考虑组内与组间差距的过程中,不断进行样品的入类与出类,从而力求使得组与组之间的差异大到一定程度,而组内的差异足够小。
然而,动态聚类结果有可能给出的标签不能较好反映样本的类别状况,即这样给出的初始标签无法准确将样本特点的分布做出优质的划归分类,从而对SVM分类的训练测试过程产生“误导”,进而造成模型的分类能力很差,为了解决这一问题,本发明在接下来的设计中加入判别优化模块。
判别优化模块查看分类模型的准确率,一般情况下由于动态聚类所得初始标签的偏差会导致SVM准确率较低。判别单元的主要功能是针对SVM分类单元得到的分类结果与上一近邻分类结果进行判别:若两次分类结果一致,则可以直接得到最优的分类方式;若两次分类结果不一致,则Fisher优化单元利用Fisher判别原理优化出基础类别,然后再以基础类别作为初始标签构建SVM分类模型,反复经过SVM分类和Fisher判别优化最终得到一种最优的分类方式,进而完成对球团样本的分类判别筛选工作。
Fisher判别原理是通过构造一个判别函数,使得未知样品已尽量分明的状态进入各个类别,这自然要求作为判别分析的基础类别的特征应该尽量集中,从统计学的角度而言,应该在双向考虑组间离差和组内离差基础上,使得两者比例达到最大,即:
其中分子、分母分别表示组间离差和组内离差,ni为第i个总体的样本量,和表示判别函数在第i个总体的样本均值和总的均值,qi是人为给定的加权系数,表示判别函数在第i个总体的样本方差。通过费马定理和代数知识,将此问题转化成求解一个特定矩阵特征值和特征向量的问题,该特征向量就是判别函数的系数,而特征值反映的就是该系数下的判别函数的判别能力。
本发明具有以下优点:
1、对工业上成球性试验所得到的球团性能需要从多个属性上整体进行综合评价分类,本发明通过算法将多个变量纳入分类参数,对于从全方面考量球团的综合素质具有重要意义,从而可以解决人为划分无法针对球团多种属性综合评价分类的问题。
2、通过一定量的样本试验,使得试验样本在性能优劣上有一个较均匀地分布,利用本发明可以得到一个最优分类结果,这一结果作为后续投料的参照,对高成球性能范围内的投料比例进行分析,能够对该配比下的成球性能进行预先估计,对提高高性能球团的生产量具有一定程度的指导意义。
附图说明
图1为本发明的工作流程图
模块1:聚类分类模块
模块2:判别优化模块
单元11:动态聚类单元
单元12:SVM分类单元
单元21:判别单元
单元22:Fisher优化单元
具体实施方式
本发明是涉及一种冶金成球过程中的分类判别系统,该系统主要由聚类分类模块和判别优化模块构成。其中聚类分类模块主要包含动态聚类单元和SVM分类单元两部分:首先由动态聚类的方式得到一组初始标签,再以此初始标签为基础构建SVM分类模型。判别优化模块主要包括判别单元和Fisher优化单元:判别单元对SVM分类得到的分类结果与上一近邻分类结果进行判别:若两次分类结果一致,则可以直接得到最优的分类方式;若两次分类结果不一致,则Fisher优化单元利用Fisher判别原理优化出基础类别,然后再以基础类别作为初始标签构建SVM分类模型,反复经过SVM分类和Fisher判别优化最终得到一种最优的分类方式,进而完成对球团样本的分类判别筛选工作。具体实施过程如下:
第一步、聚类分类模块工作:动态聚类单元利用动态聚类方式针对成球试验产生的球团样本选择初始凝聚点和初始分类,计算初始分类的重心,然后检验每一个样品到类别的重心距离,根据距离远近进行划类别。一般情况下采用欧式距离,两个高维向量a(x11,x12,…x1n)和b(x21,x22,…x2n)为,距离为:
逐一验证所有样品,迭代修改,直到没有样品需要移动为止。
第二步、SVM单元在第一步得到的初始标签的基础之上建立SVM分类模型,动态聚类的过程中采取球团的性能指标,而SVM分类时使用球团的理化指标,两次标签形成过程针对球团的不同属性,从而实现球团属性信息的互补。第三步、判别优化模块工作:判别单元针对SVM分类模型所得分类方式与上一近邻分类所得分类方式,即动态聚类单元所得分类方式进行判别,判断两种分类方式的结果是否一致:若两次分类结果一致,则直接可以得到最优分类方式;若两次分类结果不一致,则执行第四步。
第四步、Fisher优化单元利用Fisher判别原理优化出基础类别,再以基础类别作为初始标签构建SVM分类模型,针对SVM分类模型所得分类方式与上一近邻分类所得分类方式,即Fisher判别原理优化所得分类方式进行判别,判断两种分类方式的结果是否一致:若两次分类结果一致,则得到最优分类方式;若两次分类结果不一致,则再次执行本步骤。
第五步、不断重复第四步,检验准确率,直到准确率良好产生一个最优的分类方式。
Claims (1)
1.一种冶金成球过程中的分类判别系统,其特征在于包括聚类分类模块和判别优化模块,聚类分类模块由动态聚类单元和SVM分类单元组成,判别优化模块由判别单元和Fisher优化单元组成;所述的动态聚类单元采取动态聚类方式得到初始标签,然后由所述的SVM分类单元以初始标签为基础建立SVM分类模型,所述的动态聚类单元采取球团的性能指标,SVM分类单元使用球团的理化指标;所述的判别单元首次判别是对所述的SVM分类单元与动态聚类单元所得两次分类结果的一致性进行判别;所述的判别单元非首次判别是对所述的SVM分类单元与Fisher优化单元所得两次分类结果的一致性进行判别;
所述冶金成球过程中的分类判别系统的控制方法包括如下步骤:
第一步、动态聚类单元利用动态聚类方式针对成球试验产生的球团样本选择初始凝聚点和初始分类,计算初始分类的重心,然后检验每一个样品到类别的重心距离,根据距离远近进行划类别,逐一验证所有样品,迭代修改,直到没有样品需要移动为止;
第二步、SVM分类单元在第一步得到的初始标签的基础之上建立SVM分类模型;
第三步、判别单元针对SVM分类模型所得分类方式与上一近邻分类所得分类方式,即动态聚类单元所得分类方式进行判别,判断两种分类方式的结果是否一致:若两次分类结果一致,则直接可以得到最优分类方式;若两次分类结果不一致,则执行第四步;
第四步、Fisher优化单元利用Fisher判别原理优化出基础类别,再以基础类别作为初始标签构建SVM分类模型,针对SVM分类模型所得分类方式与上一近邻分类所得分类方式,即Fisher判别原理优化所得分类方式进行判别,判断两种分类方式的结果是否一致:若两次分类结果一致,则得到最优分类方式;若两次分类结果不一致,则再次执行本步骤;
第五步、不断重复第四步,检验准确率,直到准确率良好产生一个最优的分类方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611218510.1A CN106845522B (zh) | 2016-12-26 | 2016-12-26 | 一种冶金成球过程中的分类判别系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611218510.1A CN106845522B (zh) | 2016-12-26 | 2016-12-26 | 一种冶金成球过程中的分类判别系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106845522A CN106845522A (zh) | 2017-06-13 |
CN106845522B true CN106845522B (zh) | 2020-01-31 |
Family
ID=59136484
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611218510.1A Active CN106845522B (zh) | 2016-12-26 | 2016-12-26 | 一种冶金成球过程中的分类判别系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106845522B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110020592B (zh) * | 2019-02-03 | 2024-04-09 | 平安科技(深圳)有限公司 | 物体检测模型训练方法、装置、计算机设备及存储介质 |
CN110097080B (zh) * | 2019-03-29 | 2021-04-13 | 广州思德医疗科技有限公司 | 一种分类标签的构建方法及装置 |
CN111080592B (zh) * | 2019-12-06 | 2021-06-01 | 广州柏视医疗科技有限公司 | 一种基于深度学习的肋骨提取方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105181907A (zh) * | 2015-10-13 | 2015-12-23 | 中国地质大学(武汉) | 一种定量判别软玉产地的方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101833768A (zh) * | 2009-03-12 | 2010-09-15 | 索尼株式会社 | 对视频中的运动矢量进行可靠性分类的方法和系统 |
CN101835037B (zh) * | 2009-03-12 | 2015-02-04 | 索尼株式会社 | 对视频中的运动矢量进行可靠性分类的方法和系统 |
CN102664771A (zh) * | 2012-04-25 | 2012-09-12 | 浙江工商大学 | 基于svm的网络代理行为检测系统及检测方法 |
CN104853434A (zh) * | 2015-01-13 | 2015-08-19 | 中山大学 | 一种基于svm和k均值聚类的室内定位方法 |
CN104915676B (zh) * | 2015-05-19 | 2018-06-15 | 西安电子科技大学 | 基于深层特征学习和分水岭的sar图像分类方法 |
-
2016
- 2016-12-26 CN CN201611218510.1A patent/CN106845522B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105181907A (zh) * | 2015-10-13 | 2015-12-23 | 中国地质大学(武汉) | 一种定量判别软玉产地的方法 |
Non-Patent Citations (1)
Title |
---|
"基于核方法的说话人辨认模型研究";郑建炜;《中国博士学位论文全文数据库 信息科技辑》;20110715(第 07 期);I136-31页 * |
Also Published As
Publication number | Publication date |
---|---|
CN106845522A (zh) | 2017-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106845522B (zh) | 一种冶金成球过程中的分类判别系统 | |
CN107846392B (zh) | 一种基于改进协同训练-adbn的入侵检测算法 | |
CN102208038B (zh) | 基于视觉词典的图像分类方法 | |
CN106022377A (zh) | 一种铁矿烧结料层透气性状态的在线预测方法 | |
CN109492673A (zh) | 一种基于谱聚类采样的不平衡数据预测方法 | |
CN102903007B (zh) | 一种采用遗传算法优化二分类模型参数的方法 | |
CN108363810A (zh) | 一种文本分类方法及装置 | |
CN103617429A (zh) | 一种主动学习分类方法和系统 | |
CN111208793B (zh) | 基于慢特征分析的非平稳工业过程的状态监测方法 | |
CN106326915B (zh) | 一种基于改进核Fisher的化工过程故障诊断方法 | |
CN106682454B (zh) | 一种宏基因组数据分类方法和装置 | |
CN105825078B (zh) | 基于基因大数据的小样本基因表达数据分类方法 | |
CN108460213A (zh) | 基于多聚类原型的t-s模型对炉腹煤气量的预测方法及程序 | |
CN111950620A (zh) | 基于DBSCAN和K-means算法的用户筛选方法 | |
CN112287980B (zh) | 基于典型特征向量的动力电池筛选方法 | |
CN102103691A (zh) | 一种基于主成分分析人脸的识别方法 | |
CN110738232A (zh) | 一种基于数据挖掘技术的电网电压越限成因诊断方法 | |
CN104537383A (zh) | 一种基于粒子群的海量组织机构数据分类方法及系统 | |
CN114611604A (zh) | 一种基于电驱总成载荷特征融合与聚类的用户筛选方法 | |
CN102332087A (zh) | 一种基于稀疏表示的人脸识别方法 | |
CN116975672A (zh) | 一种煤矿皮带输送电机温度监测方法及系统 | |
CN101921847A (zh) | 基于模糊k-nn算法的肿瘤基因表达谱分类方法 | |
Kumar et al. | Microarray data classification using fuzzy K-nearest neighbor | |
CN110348323B (zh) | 一种基于神经网络优化的穿戴式设备手势识别方法 | |
CN105912887B (zh) | 一种改进型基因表达式编程-模糊c均值作物数据分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |