CN104697964A - 一种随机森林算法结合激光诱导击穿光谱定量分析钢铁中硫磷的方法 - Google Patents
一种随机森林算法结合激光诱导击穿光谱定量分析钢铁中硫磷的方法 Download PDFInfo
- Publication number
- CN104697964A CN104697964A CN201510102028.0A CN201510102028A CN104697964A CN 104697964 A CN104697964 A CN 104697964A CN 201510102028 A CN201510102028 A CN 201510102028A CN 104697964 A CN104697964 A CN 104697964A
- Authority
- CN
- China
- Prior art keywords
- steel
- random forest
- iron
- mtry
- induced breakdown
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Investigating And Analyzing Materials By Characteristic Methods (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
Abstract
本发明公开了一种随机森林(Random Forest,RF)结合激光诱导击穿光谱(Laser induced breakdown spectroscopy,LIBS)对钢铁中硫、磷元素的定量分析方法。首先使用LIBS系统对14个钢铁样品进行检测并获取数据矩阵,然后使用随进森林算法建立回归模型,在建模过程中通过袋外评估方法对随机森林模型的两个参数(ntree and mtry)进行了优化。在最优的实验参数下构建了钢铁中硫磷的随机森林校正模型,并对测试集钢铁中硫磷含量进行了预测,随机森林校正模型有更好的预测能力,硫元素能够获得更小的相对误差,因此,随机森林模型结合激光诱导击穿光谱在冶金领域中定量检测非金属元素是一个有前景的方法。
Description
技术领域
本发明涉及一种随机森林算法结合激光诱导击穿光谱定量分析钢铁中硫磷元素的方法,属于光谱分析技术领域。
背景技术
钢材中各种元素成分对钢种质量都有重要影响。在冶炼过程中,为了确保钢材质量和性能合格,需要对不同型号钢材进行实时、在线和有效检测,因此在实际生产中分析检测技术至关重要。硫、磷元素是钢铁中常见的杂质元素,对钢铁的性能等方面具有很大影响。硫可以改善钢的切削性、加工性和磁性等,但也会引起钢的热脆性,降低钢的机械性能, 特别是使疲劳极限、塑性和耐磨性显著下降, 影响钢件的使用寿命。磷有强烈的固溶强化作用,可以增加钢的强度和硬度,但也会降低钢的塑性和韧性。因此,建立硫、磷元素的测定方法对于控制钢铁质量具有重要的意义。常规的检测方法有原子荧光光谱法和原子发射光谱法等,都需要复杂的样品前处理,并且耗时。在实际生产中,由于信息反馈滞后而导致质量和原料控制不及时,限制了钢铁工业高速化、连续化和大型化的发展。激光诱导击穿光谱(laser-induced breakdown spectroscopy, LIBS)技术具有制样简单的优势,可以对钢铁进行快速分析,因此在冶金分析领域具有广泛的应用前景。
LIBS是一种新兴的原子发射光谱技术。该技术以激光作为激发源来诱导产生激光诱导等离子体。LIBS 利用高功率激光脉冲聚焦到目标上,并在分析材料表面形成高强度激光光斑(等离子体),在等离子体激发过程中产生元素的特征谱线,通过分光系统和检测系统进行特征谱线分析,就可以对样品中的元素进行定性和定量分析。根据谱线强度与对应元素含量之间关系,借助化学计量学方法则能够实现定量分析。LIBS 技术具有分析快捷、多元素同时分析以及无需样品预处理等优势,因而在钢铁行业的实时、在线、现场分析等方面具有很大的应用潜力。
随机森林(Random Forest,RF)是一种基于递归回归树的有监督学习方法。它是以决策树为基础的集成学习模型,它包含多个有Bagging 集成学习技术校正得到的决策树,当输入待回归的样本时,最终的回归结果由单个决策树的输出结果投票的平均值决定。它克服了决策树过拟合问题,对噪声和异常值有较好的容忍性,对高维数据回归问题具有良好的可扩展性和并行性。此外,随机森林是由数据驱动的一种非参数回归方法,只需通过对给定样本的学习校正分类规则,并不需要分类的先验知识。
发明内容
本发明的目的是提供一种随机森林算法结合激光诱导击穿光谱实现对钢材中硫磷元素的快速定量分析方法,以克服过拟合现象,具有快速、高预测精度的优点。
本发明实现过程如下:
一种随机森林算法结合激光诱导击穿光谱定量分析钢铁中硫磷的方法,包括以下步骤:
(1)利用激光诱导击穿光谱系统对钢材样品分别在不同的测量位点进行光谱数据采集;
(2)从每个样品的光谱数据中随机挑选占其数据总量2/3 的光谱数据作为校正集,其余光谱数据作为测试集;
(3)使用校正集数据通过bagging 抽样结合袋外估计OOB(Out-Of-Bag)的方法对决策树棵数ntree 和随机抽取特征数mtry 进行寻优;
(4)确定最优参数后利用校正集数据建立随机森林模型,在随机森林建模中,所构建的每一颗决策树都为二叉树;构建一棵树时在树的每个节点从每个样本总共M 个特征中挑选mtry 个特征,其中mtry<M,并根据不纯度最小原则从mtry 个特征中选择一个进行分支生长;这棵树充分生长,并且使每个节点的不纯度达到最小,且不剪枝;最后得到的所有决策树组合在一起构成随机森林;
(5)样本的最终预测值通过模型中所有决策树回归结果投票的平均值得出。
上述步骤(3) 中,在参数可能取值范围内利用bagging 抽样从校正集中获取子校正集并建立模型,然后用未被抽样的袋外数据来估计模型的预测准确度,当预测准确度最高时对应的参数为最优参数。
使用校正集数据对决策树棵数ntree 和随机抽取特征数mtry 进行寻优,通常ntree 取值范围为100-600,mtry 取值范围为M/8 -M,其中M 是样本特征总数,在ntree 和mtry 可能取值范围内利用bagging 抽样从校正集中获取子校正集并建立模型,然后用未被抽样的袋外数据来估计模型的预测准确度,当预测准确度最高时对应的参数为最优参数。
上述步骤(5)中,模型的每一个决策树给出一个回归含量,对所有决策树的预测含量进行统计,得票数平均值为最终预测含量。
本发明的优点与积极效果:本发明将随机森林算法结合LIBS 光谱定量分析钢铁中硫磷,随机森林算法对异常值和噪声具有很好的容忍度,能够克服光谱数据中由于元素互干扰以及环境噪音等干扰因素,有效提高预测准确度,而且可以有效避免过拟合现象,并具有较强的泛化能力。
具体实施方式
以下以对14个钢铁样品的建模回归为例,结合实例进一步说明本发明的操作流程,但本发明不限于此例。
实施例1
本实例使用的LIBS 系统包括双波长调Q 单脉冲Nd:YAG 激光器,光路系统,可移动样品台,中阶梯光谱仪(ARYELLE-UV-VIS, LTB150, German) 和计算机。激光能量为61mJ, 基频光波长1064 nm,脉宽为10 ns,延迟时间为1.5 μs,重复频率为10 Hz,光谱范围为220nm-800 nm。
选择14个不同的钢铁样品(西宁特殊钢股份有限公司),原始尺寸均为Φ20×900mm。每一类样品被制成一个Φ20×6mm 的圆柱,经打磨处理后放置在样品台上,利用激光诱导击穿光谱系统采集不同钢铁样品的LIBS 信号。在每个钢柱的每个截面上随机挑选五十个测量点,在每个测量点经20 次连续激光脉冲打击后得到一个测量光谱,每五个测量光谱经平均得到一个分析光谱,最终14个钢铁样品共获得140个分析光谱。
考虑到钢材样品具有整体成分不均一,局部成分均匀的特点,如果将所有光谱随机分为校正集和测试集则容易出现过拟合导致预测准确率虚高。因此,14个样品中随机选择10个样品的光谱数据作为校正集,其余为测试集。
使用校正集数据对决策树棵数ntree 在100-600 范围内,随机抽取特征数mtry 在M/8-M范围内寻优,其中M 是样本特征总数,在ntree 和mtry 可能取值范围内利用bagging 抽样从校正集中获取子校正集并建立模型,然后用未被抽样的袋外数据来估计模型的预测准确度,当预测准确度最高时对应的参数为最优参数。
确定最优参数ntree=500, mtry=M/3 后,用校正集数据建立随机森林模型并对测试集数据进行预测,见表1。表1 显示随机森林的预测效果较好,硫元素能够获得更小的相对误差,可能的原因是钢铁中磷的含量较高,受基体效应等其他因素干扰较小。
Claims (4)
1. 一种随机森林算法结合激光诱导击穿光谱定量分析钢铁中硫磷的方法, 其特征在于包括以下步骤:
(1)利用激光诱导击穿光谱系统对钢材样品分别在不同的测量位点进行光谱数据采集;
(2)从每个样品的光谱数据中随机挑选占其数据总量2/3 的光谱数据作为校正集,其余光谱数据作为测试集;
(3)使用校正集数据通过bagging 抽样结合袋外估计OOB(Out-Of-Bag)的方法对决策树棵数ntree 和随机抽取特征数mtry 进行寻优;
(4)确定最优参数后利用校正集数据建立随机森林模型,在随机森林建模中,所构建的每一颗决策树都为二叉树;构建一棵树时在树的每个节点从每个样本总共M 个特征中挑选mtry 个特征,其中mtry<M,并根据不纯度最小原则从mtry 个特征中选择一个进行分支生长;这棵树充分生长,并且使每个节点的不纯度达到最小,且不剪枝;最后得到的所有决策树组合在一起构成随机森林;
(5)样本的最终预测值通过模型中所有决策树回归结果投票的平均值得出。
2. 根据权利要求1 所述的一种随机森林算法结合激光诱导击穿光谱定量分析钢铁中硫磷的方法, 其特征在于:步骤(3) 中,在参数可能取值范围内利用bagging 抽样从校正集中获取子校正集并建立模型,然后用未被抽样的袋外数据来估计模型的预测准确度,当预测准确度最高时对应的参数为最优参数。
3. 根据权利要求2 所述的一种随机森林算法结合激光诱导击穿光谱定量分析钢铁中硫磷的方法, 其特征在于:使用校正集数据对决策树棵数ntree 和随机抽取特征数mtry 进行寻优,通常ntree 取值范围为100-600,mtry 取值范围为M/8 -M,其中M 是样本特征总数,在ntree 和mtry 可能取值范围内利用bagging 抽样从校正集中获取子校正集并建立模型,然后用未被抽样的袋外数据来估计模型的预测准确度,当预测准确度最高时对应的参数为最优参数。
4. 根据权利要求1 所述的一种随机森林算法结合激光诱导击穿光谱定量分析钢铁中硫磷的方法, 其特征在于:步骤(5)中,模型的每一个决策树给出一个回归含量,对所有决策树的预测含量进行统计,得票数平均值为最终预测含量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510102028.0A CN104697964A (zh) | 2015-03-10 | 2015-03-10 | 一种随机森林算法结合激光诱导击穿光谱定量分析钢铁中硫磷的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510102028.0A CN104697964A (zh) | 2015-03-10 | 2015-03-10 | 一种随机森林算法结合激光诱导击穿光谱定量分析钢铁中硫磷的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104697964A true CN104697964A (zh) | 2015-06-10 |
Family
ID=53345315
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510102028.0A Pending CN104697964A (zh) | 2015-03-10 | 2015-03-10 | 一种随机森林算法结合激光诱导击穿光谱定量分析钢铁中硫磷的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104697964A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105044050A (zh) * | 2015-07-07 | 2015-11-11 | 中国农业大学 | 农作物秸秆中金属元素快速定量分析方法 |
CN107656905A (zh) * | 2017-09-05 | 2018-02-02 | 江苏卓易信息科技股份有限公司 | 一种利用误差传递的空气质量数据实时校准方法 |
CN108414500A (zh) * | 2017-11-30 | 2018-08-17 | 南京信息工程大学 | 一种钢铁中硫和磷定量分析方法 |
CN108414475A (zh) * | 2018-01-30 | 2018-08-17 | 中国科学院上海技术物理研究所 | 基于光学层析同时迭代重建的libs分析方法 |
CN108444981A (zh) * | 2018-01-30 | 2018-08-24 | 中国科学院上海技术物理研究所 | 基于mart乘性重建的libs定量求解方法 |
CN109270010A (zh) * | 2018-11-15 | 2019-01-25 | 广州地理研究所 | 一种基于随机森林算法的植物滞尘能力检测方法 |
CN109270009A (zh) * | 2018-11-15 | 2019-01-25 | 广州地理研究所 | 一种基于分类与回归树算法的植物滞尘能力检测方法 |
CN109490229A (zh) * | 2018-11-15 | 2019-03-19 | 广州地理研究所 | 一种反演波段筛选方法、装置、存储介质以及设备 |
CN109884033A (zh) * | 2019-04-08 | 2019-06-14 | 西安石油大学 | 随机森林算法结合激光诱导击穿光谱检测金属元素的方法 |
CN111735807A (zh) * | 2020-07-14 | 2020-10-02 | 征图新视(江苏)科技股份有限公司 | 基于libs对大叶农作物部位以及油份的在线检测方法 |
CN111832477A (zh) * | 2020-07-13 | 2020-10-27 | 华中科技大学 | 一种新型冠状病毒的检测方法及系统 |
CN113642629A (zh) * | 2021-08-09 | 2021-11-12 | 厦门大学 | 一种基于随机森林提高谱学分析可信度的可视化方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103487411A (zh) * | 2013-09-01 | 2014-01-01 | 西北大学 | 一种随机森林算法结合激光诱导击穿光谱识别钢材牌号的方法 |
-
2015
- 2015-03-10 CN CN201510102028.0A patent/CN104697964A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103487411A (zh) * | 2013-09-01 | 2014-01-01 | 西北大学 | 一种随机森林算法结合激光诱导击穿光谱识别钢材牌号的方法 |
Non-Patent Citations (2)
Title |
---|
SHAN WU ET AL: "Quantitative analysis of nonmetal elements in steel using laser-induced breakdown spectroscopy combined with random forest", 《ANALYTICAL METHODS》 * |
TIANLONG ZHANG ET AL: "A novel approach for the quantitative analysis of multiple elements in steel based on laser-induced breakdown spectroscopy (LIBS) and random forest regression (RFR)", 《JAAS》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105044050A (zh) * | 2015-07-07 | 2015-11-11 | 中国农业大学 | 农作物秸秆中金属元素快速定量分析方法 |
CN107656905B (zh) * | 2017-09-05 | 2022-02-08 | 江苏卓易信息科技股份有限公司 | 一种利用误差传递的空气质量数据实时校准方法 |
CN107656905A (zh) * | 2017-09-05 | 2018-02-02 | 江苏卓易信息科技股份有限公司 | 一种利用误差传递的空气质量数据实时校准方法 |
CN108414500A (zh) * | 2017-11-30 | 2018-08-17 | 南京信息工程大学 | 一种钢铁中硫和磷定量分析方法 |
CN108414475A (zh) * | 2018-01-30 | 2018-08-17 | 中国科学院上海技术物理研究所 | 基于光学层析同时迭代重建的libs分析方法 |
CN108444981A (zh) * | 2018-01-30 | 2018-08-24 | 中国科学院上海技术物理研究所 | 基于mart乘性重建的libs定量求解方法 |
CN108414475B (zh) * | 2018-01-30 | 2020-06-26 | 中国科学院上海技术物理研究所 | 基于光学层析同时迭代重建的libs分析方法 |
CN108444981B (zh) * | 2018-01-30 | 2020-06-26 | 中国科学院上海技术物理研究所 | 基于mart乘性重建的libs定量求解方法 |
CN109270010A (zh) * | 2018-11-15 | 2019-01-25 | 广州地理研究所 | 一种基于随机森林算法的植物滞尘能力检测方法 |
CN109270009A (zh) * | 2018-11-15 | 2019-01-25 | 广州地理研究所 | 一种基于分类与回归树算法的植物滞尘能力检测方法 |
CN109490229A (zh) * | 2018-11-15 | 2019-03-19 | 广州地理研究所 | 一种反演波段筛选方法、装置、存储介质以及设备 |
CN109884033A (zh) * | 2019-04-08 | 2019-06-14 | 西安石油大学 | 随机森林算法结合激光诱导击穿光谱检测金属元素的方法 |
CN111832477A (zh) * | 2020-07-13 | 2020-10-27 | 华中科技大学 | 一种新型冠状病毒的检测方法及系统 |
CN111735807A (zh) * | 2020-07-14 | 2020-10-02 | 征图新视(江苏)科技股份有限公司 | 基于libs对大叶农作物部位以及油份的在线检测方法 |
CN113642629A (zh) * | 2021-08-09 | 2021-11-12 | 厦门大学 | 一种基于随机森林提高谱学分析可信度的可视化方法及装置 |
CN113642629B (zh) * | 2021-08-09 | 2023-12-08 | 厦门大学 | 一种基于随机森林提高谱学分析可信度的可视化方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104697964A (zh) | 一种随机森林算法结合激光诱导击穿光谱定量分析钢铁中硫磷的方法 | |
CN103487411B (zh) | 一种随机森林算法结合激光诱导击穿光谱识别钢材牌号的方法 | |
Yan et al. | A novel hybrid feature selection strategy in quantitative analysis of laser-induced breakdown spectroscopy | |
CN103488874B (zh) | 一种结合激光诱导击穿光谱对钢铁材料的分类方法 | |
Zhang et al. | A novel approach for the quantitative analysis of multiple elements in steel based on laser-induced breakdown spectroscopy (LIBS) and random forest regression (RFR) | |
CN106770194B (zh) | 基于小波变换激光诱导击穿光谱的谷类作物产地鉴别方法 | |
Shi et al. | Quantitative analysis of sedimentary rocks using laser-induced breakdown spectroscopy: comparison of support vector regression and partial least squares regression chemometric methods | |
CN102262076B (zh) | 基于谱线组合的激光诱导击穿光谱元素浓度测量方法 | |
CN104374753B (zh) | 基于双脉冲激光诱导击穿光谱的作物重金属和微量元素检测方法 | |
CN102262075B (zh) | 基于分光法的激光诱导击穿光谱测量元素浓度的方法 | |
Sarkar et al. | Evaluation of the prediction precision capability of partial least squares regression approach for analysis of high alloy steel by laser induced breakdown spectroscopy | |
CN104483292B (zh) | 一种采用多谱线比值法提高激光探针分析精确度的方法 | |
CN104697966A (zh) | 一种基于最小二乘支持向量机算法结合激光诱导击穿光谱的钢铁中铬和锰定量分析方法 | |
CN113155809B (zh) | 一种矿石分类与实时定量分析的光谱检测新方法 | |
Lin et al. | Identification accuracy improvement for steel species using a least squares support vector machine and laser-induced breakdown spectroscopy | |
CN106814061A (zh) | 一种提高激光诱导击穿光谱重叠峰定量分析精度的方法 | |
Wang et al. | Rapid quantitative analysis of the acidity of iron ore by the laser-induced breakdown spectroscopy (LIBS) technique coupled with variable importance measures-random forests (VIM-RF) | |
Liu et al. | Quantitative analysis of cadmium in tobacco roots using laser-induced breakdown spectroscopy with variable index and chemometrics | |
CN102830096A (zh) | 基于人工神经网络的元素浓度测量误差修正方法 | |
Wu et al. | Quantitative analysis of nonmetal elements in steel using laser-induced breakdown spectroscopy combined with random forest | |
CN105718749A (zh) | 一种基于大数据库辨识的煤质特性分析方法 | |
Yu et al. | Response surface methodology for optimizing LIBS testing parameters: A case to conduct the elemental contents analysis in soil | |
Zhang et al. | Determination of vanadium, iron, and nickel in petroleum coke by laser-induced breakdown spectroscopy | |
Song et al. | A random-forest-assisted artificial-neural-network method for analysis of steel using laser-induced breakdown spectroscopy | |
Yan et al. | Classification accuracy improvement by data preprocessing in handheld laser-induced breakdown spectroscopy |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150610 |