CN103487411B - 一种随机森林算法结合激光诱导击穿光谱识别钢材牌号的方法 - Google Patents
一种随机森林算法结合激光诱导击穿光谱识别钢材牌号的方法 Download PDFInfo
- Publication number
- CN103487411B CN103487411B CN201310388288.XA CN201310388288A CN103487411B CN 103487411 B CN103487411 B CN 103487411B CN 201310388288 A CN201310388288 A CN 201310388288A CN 103487411 B CN103487411 B CN 103487411B
- Authority
- CN
- China
- Prior art keywords
- training set
- data
- mtry
- classification
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种随机森林结合激光诱导击穿光谱对钢材牌号快速识别的方法,其首先使用LIBS系统对不同牌号的钢材样品进行检测并获取数据矩阵,然后使用随进森林算法建立分类模型,在建模过程中,使用了多个弱分类器组合的强分类器-组合分类器,当待测样品数据输入模型后,通过多棵分类树组成随机森林,然后用随机森林对测试集进行判别与分类,通过分类器的最终投票确定待测数据类别。该方法通过组合分类器,提高了分类准确度,减少了无用类别信息对预测过程的影响,降低了计算成本。
Description
技术领域
本发明涉及一种随机森林结合激光诱导击穿光谱对钢材牌号的识别方法,具体来说是基于激光诱导击穿光谱通过随机森林对钢材牌号进行识别,属于光谱分析技术领域。
背景技术
钢铁工业是我国最重要的基础工业,是国家经济水平和综合国力的重要标志。钢材作为基础行业的重要原材料,有着极大的需求量。钢材的牌号和种类比较繁多,比如:合金钢、碳素钢和锰钢等。不同牌号和种类钢材的成分用途千差万别,但其外形和规格尺寸比较相似,难以识别,因此有必要建立一种便捷的钢材牌号识别方法,它是钢铁行业实现质量控制与监督的重要手段。通常通过人为的感官和经验对钢材牌号进行识别,但这种方法存在一定的主观性,很难实现不同牌号钢材的现场快速识别。在炼钢企业、钢材市场、钢材检测站等囤积大量钢材的地方,由于钢材种类繁多,人为识别工作量比较大,难免出现混淆,从而造成经济损失。此外,由于生产工艺和原材料的差异,相同牌号钢材其成分、性能也会存在差异。传统分析方法都需要复杂的样品处理而且耗时,无法实现钢材的快速、在线检测。此时就需要一种能够快速准确识别钢材种类和成分信息的现场检测技术。
激光诱导击穿光谱(laser-inducedbreakdownspectroscopy,LIBS)是一种新兴的原子发射光谱技术。该技术以激光作为激发源来诱导产生激光诱导等离子体。LIBS利用高功率激光脉冲聚焦到目标上,并在分析材料表面形成高强度激光光斑(等离子体),在等离子体激发过程中产生元素的特征谱线,通过分光系统和检测系统进行特征谱线分析,就可以对样品中的元素进行定性和定量分析。根据不同种类物质光谱之间的差异性,借助化学计量学方法则能够实现物质分类与识别。LIBS技术具有分析快捷、多元素同时分析以及无需样品预处理等优势,因而在钢铁行业的实时、在线、现场分析等方面具有很大的应用潜力。
随机森林(RandomForest,RF)是一种基于递归分类树的有监督学习方法。它是以决策树为基本分类器的一个集成学习模型,它包含多个有Bagging集成学习技术训练得到的决策树,当输入待分类的样本时,最终的分类结果由单个决策树的输出结果投票决定。它克服了决策树过拟合问题,对噪声和异常值有较好的容忍性,对高维数据分类问题具有良好的可扩展性和并行性。此外,随机森林是由数据驱动的一种非参数分类方法,只需通过对给定样本的学习训练分类规则,并不需要分类的先验知识。
发明内容
本发明的目的是提供一种随机森林算法结合激光诱导击穿光谱实现对多种钢材牌号的快速准确识别的方法,可以克服过拟合现象,具有快速、高分类精度的优点。
本发明实现过程如下:
一种随机森林算法结合激光诱导击穿光谱识别钢材牌号的方法,包括以下步骤:
(1)利用激光诱导击穿光谱系统对不同牌号的钢材样品分别在不同的测量位点进行光谱数据采集;
(2)从每种牌号样品的光谱数据中随机挑选占其数据总量2/3的光谱数据作为训练集,其余光谱数据作为测试集;
如图2所示,
(3)使用训练集数据通过bagging抽样结合OOB(Out-Of-Bag)估计的方法对决策树棵数ntree和随机抽取特征数mtry进行寻优;
(4)确定最优参数后利用训练集数据建立随机森林模型,在随机森林建模中,所构建的每一颗决策树都为二叉树;构建一棵树时在树的每个节点从每个样本总共M个特征中挑选mtry个特征,其中mtry<M,并根据不纯度最小原则从mtry个特征中选择一个进行分支生长;这棵树充分生长,并且使每个节点的不纯度达到最小,且不剪枝;最后得到的所有决策树组合在一起构成随机森林;
(5)样本的最终预测类别通过模型中所有决策树的分类结果投票得出。
上述步骤(3)中,在参数可能取值范围内利用bagging抽样从训练集中获取子训练集并建立模型,然后用未被抽样的袋外数据来估计模型的预测准确度,当预测准确度最高时对应的参数为最优参数。更具体地说,使用训练集数据对决策树棵数ntree和随机抽取特征数mtry进行寻优,通常ntree取值范围为100-800,mtry取值范围为-,其中M是样本特征总数,在ntree和mtry可能取值范围内利用bagging抽样从训练集中获取子训练集并建立模型,然后用未被抽样的袋外数据来估计模型的预测准确度,当预测准确度最高时对应的参数为最优参数。
上述步骤(5)中,模型的每一个决策树给出一个预测类别,对所有决策树的预测类别进行统计,得票数最高的类别为最终预测类别。
本发明的优点与积极效果:本发明将随机森林算法结合LIBS光谱识别钢材牌号,随机森林算法对异常值和噪声具有很好的容忍度,能够克服光谱数据中由于元素互干扰以及环境噪音等干扰因素,有效提高预测准确度,而且可以有效避免过拟合现象,并具有较强的泛化能力。
附图说明
图1是随机森林原理示意图;
图2是随机森林建模流程图;
图3是本发明中激光诱导击穿光谱系统结构图;
图4是一系列不同牌号圆钢的LIBS光谱图。
具体实施方式
本发明随机森林算法结合激光诱导击穿光谱识别钢材牌号的方法,包括以下步骤:
(1)利用激光诱导击穿光谱系统对不同牌号的钢材样品分别在不同的测量位点进行光谱数据采集;
(2)从每种牌号样品的光谱数据中随机挑选占其数据总量2/3的光谱数据作为训练集,其余光谱数据作为测试集;
(3)如图1所示,使用训练集数据对决策树棵数ntree和随机抽取特征数mtry进行寻优,通常ntree取值范围为100-800,mtry取值范围为-,其中M是样本特征总数,在ntree和mtry可能取值范围内利用bagging抽样从训练集中获取子训练集并建立模型,然后用未被抽样的袋外数据来估计模型的预测准确度,当预测准确度最高时对应的参数为最优参数;
(4)确定最优参数后利用训练集数据建立随机森林模型,如图2所示,在随机森林建模中,所构建的每一颗决策树都为二叉树;构建一棵树时在树的每个节点从每个样本总共M个特征中挑选mtry个特征,其中mtry<M,并根据不纯度最小原则从mtry个特征中选择一个进行分支生长;这棵树充分生长,并且使每个节点的不纯度达到最小,且不剪枝;最后得到的所有决策树组合在一起构成随机森林;
(5)样本的最终预测类别通过如下投票方法得出:模型的每一个决策树给出一个预测类别,对所有决策树的预测类别进行统计,得票数最高的类别为最终预测类别。
实施例1
以下以对九种不同牌号圆钢样品的建模分类为例,结合附图和实例来进一步说明本发明的操作流程,但本发明不限于此例。
如图3所示,本实例使用的LIBS系统包括双波长调Q单脉冲Nd:YAG激光器,光路系统,可移动样品台,中阶梯光谱仪(ARYELLE-UV-VIS,LTB150,German)和计算机。激光能量为61mJ,基频光波长1064nm,脉宽为10ns,延迟时间为1.5μs,重复频率为10Hz,光谱范围为220nm-800nm。
选择九种不同牌号的圆钢样品:20#(Φ20×900mm),20Cr(Φ20×900mm),20CrMnTi(Φ30×900mm),20CrMo(Φ20×900mm),20CrNiMo(Φ20×900mm),35#(Φ20×900mm),35CrMo(Φ20×900mm),40Cr(Φ20×900mm),42CrMo(Φ25×900mm)(西宁特殊钢股份有限公司)。
每一类样品被制成三个Φ20×6mm的圆柱,经打磨处理后放置在样品台上,利用激光诱导击穿光谱系统采集不同牌号圆钢样品的LIBS信号,如图4所示。
在每个钢柱的每个截面上随机挑选五十个测量点,在每个测量点经20次连续激光脉冲打击后得到一个测量光谱,每五个测量光谱经平均得到一个分析光谱,最终九类钢材共获得540个分析光谱(一类钢材三个样品,一个样品两个截面,一个截面10个分析光谱)。
考虑到钢材样品具有整体成分不均一,局部成分均匀的特点,如果将所有光谱随机分为训练集和测试集则容易出现过拟合导致预测准确率虚高。因此,每类样品中随机选择4个截面的光谱数据作为训练集,其余为测试集。
使用训练集数据对决策树棵数ntree在100-800范围内,随机抽取特征数mtry在-范围内寻优,其中M是样本特征总数,在ntree和mtry可能取值范围内利用bagging抽样从训练集中获取子训练集并建立模型,然后用未被抽样的袋外数据来估计模型的预测准确度,当预测准确度最高时对应的参数为最优参数。
确定最优参数ntree=500,mtry=172后,用训练集数据建立随机森林模型并对测试集数据进行预测。为了对比,将同样的数据采用偏最小二乘判别分析(PLS-DA)进行预测,对比两种算法的预测正确率和预测错误率。
表1显示PLS-DA的预测效果很不稳定,例如20Cr和20CrNiMo几乎全部被正确识别,但是35CrMo和40Cr的预测结果却又很差,而且对其他大部分种类的预测效果都不太好。
由于钢铁样品的成分不均一性也导致同类数据间的差异较大,使得PLS-DA对成分相似种类样品的预测效果很不理想。随机森林算法的分类效果比PLS-DA有显著提高,尤其对20CrMo和35CrMo的分类有很好的表现,这也表明,即使是成分相似,容易混淆类别的钢材,随机森林算法也能够成功的准确识别。
Claims (1)
1.一种随机森林算法结合激光诱导击穿光谱识别钢材牌号的方法,其特征在于包括以下步骤:
(1)利用激光诱导击穿光谱系统对不同牌号的钢材样品分别在不同的测量位点进行光谱数据采集;
(2)从每种牌号样品的光谱数据中随机挑选占其数据总量2/3的光谱数据作为训练集,其余光谱数据作为测试集;
(3)使用训练集数据通过bagging抽样结合OOB(Out-Of-Bag)估计的方法对决策树棵数ntree和随机抽取特征数mtry进行寻优,在参数可能取值范围内利用bagging抽样从训练集中获取子训练集并建立模型,然后用未被抽样的袋外数据来估计模型的预测准确度,当预测准确度最高时对应的参数为最优参数;
(4)确定最优参数后利用训练集数据建立随机森林模型,在随机森林建模中,所构建的每一颗决策树都为二叉树;构建一棵树时在树的每个节点从每个样本总共M个特征中挑选mtry个特征,其中mtry<M,并根据不纯度最小原则从mtry个特征中选择一个进行分支生长;这棵树充分生长,并且使每个节点的不纯度达到最小,且不剪枝;最后得到的所有决策树组合在一起构成随机森林,使用训练集数据对决策树棵数ntree和随机抽取特征数mtry进行寻优,通常ntree取值范围为100-800,mtry取值范围为,其中M是样本特征总数,在ntree和mtry可能取值范围内利用bagging抽样从训练集中获取子训练集并建立模型,然后用未被抽样的袋外数据来估计模型的预测准确度,当预测准确度最高时对应的参数为最优参数;
(5)样本的最终预测类别通过模型中所有决策树的分类结果投票得出,模型的每一个决策树给出一个预测类别,对所有决策树的预测类别进行统计,得票数最高的类别为最终预测类别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310388288.XA CN103487411B (zh) | 2013-09-01 | 2013-09-01 | 一种随机森林算法结合激光诱导击穿光谱识别钢材牌号的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310388288.XA CN103487411B (zh) | 2013-09-01 | 2013-09-01 | 一种随机森林算法结合激光诱导击穿光谱识别钢材牌号的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103487411A CN103487411A (zh) | 2014-01-01 |
CN103487411B true CN103487411B (zh) | 2016-04-13 |
Family
ID=49827803
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310388288.XA Expired - Fee Related CN103487411B (zh) | 2013-09-01 | 2013-09-01 | 一种随机森林算法结合激光诱导击穿光谱识别钢材牌号的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103487411B (zh) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104697966A (zh) * | 2015-03-10 | 2015-06-10 | 西北大学 | 一种基于最小二乘支持向量机算法结合激光诱导击穿光谱的钢铁中铬和锰定量分析方法 |
CN104697964A (zh) * | 2015-03-10 | 2015-06-10 | 西北大学 | 一种随机森林算法结合激光诱导击穿光谱定量分析钢铁中硫磷的方法 |
CN104794192B (zh) * | 2015-04-17 | 2018-06-08 | 南京大学 | 基于指数平滑、集成学习模型的多级异常检测方法 |
CN107607606B (zh) * | 2017-08-09 | 2019-07-02 | 东北石油大学 | 结构钢牌号分选电化学方法及装置 |
CN107679583A (zh) * | 2017-10-24 | 2018-02-09 | 四川长虹电器股份有限公司 | 基于大数据获取故障解决方案的方法 |
CN108090788B (zh) * | 2017-12-22 | 2021-04-20 | 苏州大学 | 基于时间信息集成模型的广告转化率预估方法 |
CN110793959A (zh) * | 2018-08-03 | 2020-02-14 | 中国科学院沈阳自动化研究所 | 基于激光诱导击穿光谱的金属牌号鉴定方法 |
CN110220863A (zh) * | 2019-06-25 | 2019-09-10 | 湖南中医药大学 | 一种基于atr-ftir的金银花和山银花中药制剂的鉴别方法 |
CN111735806B (zh) * | 2020-06-18 | 2021-12-17 | 中国海洋大学 | 一种基于激光诱导击穿光谱技术的鱼产品快速鉴别方法 |
CN112816458B (zh) * | 2021-02-01 | 2023-09-01 | 湖北工程学院 | 基于激光诱导击穿光谱技术的钢材分类方法及系统 |
CN113049530B (zh) * | 2021-03-17 | 2022-07-26 | 北京工商大学 | 一种基于近红外高光谱的单粒玉米种子水分含量检测方法 |
CN113921092B (zh) * | 2021-10-08 | 2023-09-15 | 上海应用技术大学 | 一种快速筛查生鲜乳中中和酸类物质的方法 |
CN114216896A (zh) * | 2021-11-18 | 2022-03-22 | 合肥正阳光电科技有限责任公司 | 一种在线快速识别钢材号牌的激光监测站及激光检测方法 |
CN114397244B (zh) * | 2022-01-14 | 2024-07-23 | 长春工业大学 | 一种金属增材制造制件缺陷的识别方法及相关设备 |
CN114594089A (zh) * | 2022-05-10 | 2022-06-07 | 合肥金星智控科技股份有限公司 | 钢铁牌号鉴定分析装置和控制方法 |
CN117949436B (zh) * | 2024-03-26 | 2024-06-25 | 宝鸡核力材料科技有限公司 | 应用于钛合金熔炼下的金属元素成分检测方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4232412A1 (de) * | 1992-09-28 | 1994-03-31 | Dietrich Gerhard Ellsaeser | Integriertes Holzaufnahmemeßsystem |
CN1764498A (zh) * | 2003-01-22 | 2006-04-26 | 瓦斯特能量系统有限公司 | 反应器 |
-
2013
- 2013-09-01 CN CN201310388288.XA patent/CN103487411B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4232412A1 (de) * | 1992-09-28 | 1994-03-31 | Dietrich Gerhard Ellsaeser | Integriertes Holzaufnahmemeßsystem |
CN1764498A (zh) * | 2003-01-22 | 2006-04-26 | 瓦斯特能量系统有限公司 | 反应器 |
Non-Patent Citations (1)
Title |
---|
激光诱导击穿光谱技术对冶金样品中钢及炉渣的同时分析;BENGTSON Arne等;《冶金分析》;20090215;第29卷(第02期);8-13 * |
Also Published As
Publication number | Publication date |
---|---|
CN103487411A (zh) | 2014-01-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103487411B (zh) | 一种随机森林算法结合激光诱导击穿光谱识别钢材牌号的方法 | |
CN103488874B (zh) | 一种结合激光诱导击穿光谱对钢铁材料的分类方法 | |
CN104697964A (zh) | 一种随机森林算法结合激光诱导击穿光谱定量分析钢铁中硫磷的方法 | |
Zhang et al. | A novel approach for the quantitative analysis of multiple elements in steel based on laser-induced breakdown spectroscopy (LIBS) and random forest regression (RFR) | |
Yueh et al. | Preliminary evaluation of laser-induced breakdown spectroscopy for tissue classification | |
EP2710353B1 (en) | SPECTROSCOPIC APPARATUS AND METHOD of DETERMINING COMPONENTS PRESENT IN A SAMPLE | |
CN113155809B (zh) | 一种矿石分类与实时定量分析的光谱检测新方法 | |
CN104697966A (zh) | 一种基于最小二乘支持向量机算法结合激光诱导击穿光谱的钢铁中铬和锰定量分析方法 | |
CN108844941B (zh) | 一种基于拉曼光谱和pca-hca的不同品位磷矿的鉴别和分类方法 | |
Dai et al. | Quantitative determination of Al–Cu–Mg–Fe–Ni aluminum alloy using laser-induced breakdown spectroscopy combined with LASSO–LSSVM regression | |
CN104483292B (zh) | 一种采用多谱线比值法提高激光探针分析精确度的方法 | |
CN105718749B (zh) | 一种基于大数据库辨识的煤质特性分析方法 | |
Wang et al. | Rapid quantitative analysis of the acidity of iron ore by the laser-induced breakdown spectroscopy (LIBS) technique coupled with variable importance measures-random forests (VIM-RF) | |
CN106680241A (zh) | 一种新型光谱多元分析分类与识别方法及其用途 | |
Pagnin et al. | Multivariate analysis and laser-induced breakdown spectroscopy (LIBS): a new approach for the spatially resolved classification of modern art materials | |
CN103487410B (zh) | 基于模型集群分析的激光诱导击穿光谱变量选择方法 | |
CN116030310A (zh) | 一种基于激光诱导击穿光谱技术的样品分类方法及系统 | |
CN104897709A (zh) | 一种基于x-射线荧光分析的农产品元素定量检测模型构建方法 | |
CN105717094B (zh) | 一种基于大数据库辨识的金属元素含量分析方法 | |
Chen et al. | The spectral fusion of laser-induced breakdown spectroscopy (LIBS) and mid-infrared spectroscopy (MIR) coupled with random forest (RF) for the quantitative analysis of soil pH | |
CN104316492A (zh) | 近红外光谱测定马铃薯块茎中蛋白质含量的方法 | |
CN106485049B (zh) | 一种基于蒙特卡洛交叉验证的nirs异常样本的检测方法 | |
CN105717093B (zh) | 一种基于大数据库辨识的水泥特性分析方法 | |
CN110793959A (zh) | 基于激光诱导击穿光谱的金属牌号鉴定方法 | |
CN113588597A (zh) | 一种提升炉渣分析精度的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160413 Termination date: 20170901 |
|
CF01 | Termination of patent right due to non-payment of annual fee |