CN108956583A - 用于激光诱导击穿光谱分析的特征谱线自动选择方法 - Google Patents
用于激光诱导击穿光谱分析的特征谱线自动选择方法 Download PDFInfo
- Publication number
- CN108956583A CN108956583A CN201810745641.8A CN201810745641A CN108956583A CN 108956583 A CN108956583 A CN 108956583A CN 201810745641 A CN201810745641 A CN 201810745641A CN 108956583 A CN108956583 A CN 108956583A
- Authority
- CN
- China
- Prior art keywords
- variable
- spectral line
- analysis
- correction
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/71—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light thermally excited
- G01N21/718—Laser microanalysis, i.e. with formation of sample plasma
Landscapes
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Plasma & Fusion (AREA)
- Optics & Photonics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
Abstract
本发明属于光谱分析领域,为实现在大量光谱数据中自动且快速的选出与特定元素含量相关的多个特征谱线,无需人工判断过程,大大提升选择效率,有效减少参与建模的特征谱线数量,简化计算过程,提升定量预测模型的稳健型和准确性;同时提供验证方法。本发明,用于激光诱导击穿光谱分析的特征谱线自动选择方法,步骤如下:第1步:对光谱原始数据X做第一次全谱校正;第2步:对第1步校正后的光谱数据Xˊ做第二次全谱校正;第3步:剔除不重要的谱线变量;第4步:迭代,对第3步选择后的剩余变量进行偏最小二乘分析;第5步:判断,循环剩余的谱线即为最终选择结果。本发明主要应用于光谱分析场合。
Description
技术领域
本发明属于光谱分析领域,特别是一种用于激光诱导击穿光谱分析的特征谱线自动选择方法。
背景技术
激光诱导击穿光谱(LIBS),或称激光诱导等离子体光谱(LIPS),是原子发生光谱技术中新兴且极具发展潜力的一项分析技术。LIBS技术采用高能量密度的脉冲激光作为激发光源,激光聚焦于样品表面在局部烧蚀区域形成等离子体,并向外界发出辐射,在一定时间的连续光谱后,产生与样品成分相关的原子发射离散光谱,此时可通过光纤收集装置采集光谱并利用光谱仪进行分析。与传统的原子发射光谱技术相比,LIBS技术无需对样品做复杂处理,可以实现原位测量和准无损测量,LIBS光谱具有如下特点:第一,光谱波段范围宽。由于待测物质元素构成常常比较复杂,包括众多金属和非金属元素,根据美国NIST公布的原子谱线数据库,大多元素的谱线可覆盖紫外、可见光波段,当需要多元素同时检测时,LIBS光谱采集的波段范围必须达到一定宽度;第二,谱线信息复杂。一种元素往往有多条发射谱线,不同元素的发射谱线可能非常接近,甚至位置重合形成叠加,对于复杂物质如土壤、合金、生物组织等分析时,LIBS光谱包含大量携带信息的谱线,待测特征谱线与干扰谱线须加以区分辨别。
基于LIBS技术的特点,以及LIBS系统采用同时具备宽波段和高分辨的中阶梯光栅光谱仪作为分析仪器,一次光谱采集将得到成千上万个波长点的强度数据。对于特定元素或成分定量分析,使用单一谱线往往不能建立稳健、准确的分析模型,越来越多的研究者选择采用多元分析法(如主成分分析法PCA、偏最小二乘法PLS等)解决这一问题。多元分析法即利用多条谱线强度,考虑谱线之间相互关系,按照相应的权重系数,建立多元数学模型,开展定量分析。对于LIBS光谱,应用多元分析法时,须在大量光谱数据中选择有用的特征谱线建立模型,然而,在特征谱线的波长和数量都未知的情况下,如何能够通过算法自动选择合适的特征谱线至关重要。常用的特征谱线自动选择方法有遗传算法(GA)和连续投影算法(SPA),但是这两种算法往往耗时较长,效率低下,选择时间甚至可达数个小时,在实时检测中无法得到应用。
发明内容
为克服现有技术的不足,本发明旨在实现在大量光谱数据中自动且快速的选出与特定元素含量相关的多个特征谱线,无需人工判断过程,大大提升选择效率,有效减少参与建模的特征谱线数量,简化计算过程,提升定量预测模型的稳健型和准确性;同时提供验证方法。为此,本发明采用的技术方案是,用于激光诱导击穿光谱分析的特征谱线自动选择方法,步骤如下:
第1步:对光谱原始数据X做第一次全谱校正,计算每一列谱线变量Xi与校正集元素含量Y的协方差Cov(Xi,Y),同时分别计算Xi与Y的标准差σXi和σY,根据公式(1),生成相应的谱线校正因子ρi,光谱原始数据X与变量R=[ρ1,ρ2,…,ρN]相乘得到数据Xˊ:
第2步:对第1步校正后的光谱数据Xˊ做第二次全谱校正,对全部变量Xˊ实施整体偏最小二乘PLS分析,得到每一列谱线变量的偏最小二乘权重bi,根据公式(2),进一步计算得到相应的谱线校正因子ki,光谱数据Xˊ与变量K=[k1,k2,…,kN]相乘得到数据Xˊˊ:
第3步:剔除不重要的谱线变量。对现有的全部变量Xˊˊ进行偏最小二乘分析,并利用现有每个谱线变量的标准偏差值σj以及偏最小二乘权重值bj,根据公式(3),计算得到每个变量的重要性zj,利用现有变量整体的标准偏差σ和现有变量个数n,根据公式(4),计算得到当前迭代循环的阈值Thr,将现有变量的重要性逐个与阈值比较,如果该变量的重要性zj低于当前循环的阈值Thr,则该谱线变量被剔除:
第4步:迭代,对第3步选择后的剩余变量进行偏最小二乘分析,采用留一法交叉验证,并计算交叉验证的均方根误差值RMSECV,判断当前的变量个数是否小于10,否则返回第3步,是则停止迭代;
第5步:判断,计算机记录每一个迭代循环的变量个数和RMSECV值,选择判断出最合适的迭代结果,判断依据为:迭代循环的变量个数小于100且具有最小的RMSECV值,此循环剩余的谱线即为最终选择结果。
本发明的特点及有益效果是:
(1)本发明能够自动且快速地选择分析元素的特征谱线,相比传统选择方法(如遗传算法、连续投影算法等)运行速度快,效率极大提高,计算过程简化,预测模型稳健且准确。
(2)本发明结合了全谱校正和迭代预测权重偏最小二乘法,创新地提出两种全谱校正因子,无需任何人工过程,即可完成自动且快速的特征谱线选择,在光谱实时检测中具有重大实用价值。该方法可推广适用于其他原子发射光谱分析过程,如电感耦合等离子体原子发射光谱(ICP-AES)等,对于各种金属、非金属元素进行定量分析。
附图说明:
图1示出本发明的特征谱线自动选择方法流程图。
图2示出应用不同谱线选择方法对土壤LIBS光谱中铜、钡、铬元素开展定量分析的校准和预测曲线图。其中,a为铜元素-全谱数据分析结果,b为铜元素-遗传算法分析结果,c为铜元素-连续投影算法分析结果,d为铜元素-本发明方法分析结果;e为钡元素-全谱数据分析结果,f为钡元素-遗传算法分析结果,g为钡元素-连续投影算法分析结果,h为钡元素-本发明方法分析结果;i为铬元素-全谱数据分析结果,j为铬元素-遗传算法分析结果,k为铬元素-连续投影算法分析结果,l为铬元素-本发明方法分析结果。
具体实施方式
本发明的目的是提供一种用于激光诱导击穿光谱分析的特征谱线自动选择方法,可在大量光谱数据中自动且快速的选出与特定元素含量相关的多个特征谱线,无需人工判断过程,大大提升选择效率,有效减少参与建模的特征谱线数量,简化计算过程,提升定量预测模型的稳健型和准确性;
本发明的另一目的是提供一种利用(1)中所述方法,对土壤样品中的金属元素铜(Cu)、钡(Ba)、铬(Cr)元素进行定量分析的典型案例,提供与遗传算法(GA)、连续投影算法(SPA)的对比结果,验证本发明所提方法的可行性、适用性、优越性。
本发明采用的技术方案是,一种用于激光诱导击穿光谱分析的特征谱线自动选择方法,由以下步骤组成:
第1步:对光谱原始数据X做第一次全谱校正,计算每一列谱线变量Xi与校正集元素含量Y的协方差Cov(Xi,Y),同时分别计算Xi与Y的标准差σXi和σY,根据公式(1),生成相应的谱线校正因子ρi,光谱原始数据X与变量R=[ρ1,ρ2,…,ρN]相乘得到数据Xˊ:
第2步:对第1步校正后的光谱数据Xˊ做第二次全谱校正,对全部变量Xˊ实施整体偏最小二乘PLS分析,得到每一列谱线变量的偏最小二乘权重bi,根据公式(2),进一步计算得到相应的谱线校正因子ki,光谱数据Xˊ与变量K=[k1,k2,…,kN]相乘得到数据Xˊˊ:
第3步:剔除不重要的谱线变量。对现有的全部变量Xˊˊ进行偏最小二乘分析,并利用现有每个谱线变量的标准偏差值σj以及偏最小二乘权重值bj,根据公式(3),计算得到每个变量的重要性zj,利用现有变量整体的标准偏差σ和现有变量个数n,根据公式(4),计算得到当前迭代循环的阈值Thr,将现有变量的重要性逐个与阈值比较,如果该变量的重要性zj低于当前循环的阈值Thr,则该谱线变量被剔除:
第4步:迭代,对第3步选择后的剩余变量进行偏最小二乘分析,采用留一法交叉验证,并计算交叉验证的均方根误差值RMSECV,判断当前的变量个数是否小于10,否则返回第3步,是则停止迭代;
第5步:判断,计算机记录每一个迭代循环的变量个数和RMSECV值,选择判断出最合适的迭代结果,判断依据为:迭代循环的变量个数小于100且具有最小的RMSECV值,此循环剩余的谱线即为最终选择结果。
下面结合附图和具体实例进一步详述本发明。
本发明采用的技术方案是,一种用于激光诱导击穿光谱分析的特征谱线自动选择方法,如图1所示,由以下步骤组成:
第1步:对光谱原始数据X做第一次全谱校正,计算每一列谱线变量Xi与校正集元素含量Y的协方差Cov(Xi,Y),同时分别计算Xi与Y的标准差σXi和σY,根据公式(1),生成相应的谱线校正因子ρi,光谱原始数据X与变量R=[ρ1,ρ2,…,ρN]相乘得到数据Xˊ:
第2步:对第1步校正后的光谱数据Xˊ做第二次全谱校正,对全部变量Xˊ实施整体偏最小二乘PLS分析,得到每一列谱线变量的偏最小二乘权重bi,根据公式(2),进一步计算得到相应的谱线校正因子ki,光谱数据Xˊ与变量K=[k1,k2,…,kN]相乘得到数据Xˊˊ:
第3步:剔除不重要的谱线变量。对现有的全部变量Xˊˊ进行偏最小二乘分析,并利用现有每个谱线变量的标准偏差值σj以及偏最小二乘权重值bj,根据公式(3),计算得到每个变量的重要性zj,利用现有变量整体的标准偏差σ和现有变量个数n,根据公式(4),计算得到当前迭代循环的阈值Thr,将现有变量的重要性逐个与阈值比较,如果该变量的重要性zj低于当前循环的阈值Thr,则该谱线变量被剔除:
第4步:迭代,对第3步选择后的剩余变量进行偏最小二乘分析,采用留一法交叉验证,并计算交叉验证的均方根误差值RMSECV,判断当前的变量个数是否小于10,否则返回第3步,是则停止迭代;
第5步:判断,计算机记录每一个迭代循环的变量个数和RMSECV值,选择判断出最合适的迭代结果,判断依据为:迭代循环的变量个数小于100且具有最小的RMSECV值,此循环剩余的谱线即为最终选择结果。
以土壤中铜、钡、铬元素的LIBS光谱分析为例,分别采用遗传算法、连续投影算法、本发明方法进行谱线选择和定量分析。不同算法对土壤中不同元素的谱线选择过程和结果如表1应用不同方法对土壤LIBS光谱中铜、钡、铬元素进行谱线选择的过程与结果对比所示。
表1
由表1可看到本发明方法选择谱线的数量略少于遗传算法和连续投影算法,三种方法的RMSECV值相近,但在计算时间方面,本发明方法明显优于遗传算法和连续投影算法。应用本发明方法选择的元素谱线结果如表2应用本发明方法对土壤LIBS光谱中铜、钡、铬元素进行谱线选择的最终结果所示:
表2
无论对何种元素来说,方法选择的谱线中均包含参考元素特征谱线,但谱线数量相对原始数量40000显著减少,可见方法对谱线的筛选作用是非常有效的。应用不同谱线选择方法对土壤LIBS光谱中铜、钡、铬元素开展定量分析的校准和预测曲线如图2所示,其中,a、e、i分别对应铜、钡、铬的全谱数据分析结果,可见其校准和预测的均方根误差值(RMSEC和RMSEP)较高,分析结果不理想,而其它图显示应用了谱线选择方法后结果显著改善,证明谱线选择是提高定量分析性能的有效途径;b、f、j分别对应铜、钡、铬的遗传算法分析结果,c、g、k分别对应铜、钡、铬的连续投影算法分析结果,d、h、l分别对应铜、钡、铬的本发明方法分析结果,可见本发明方法与遗传算法和连续投影算法相比,最终选择谱线所建立的模型具有相近的性能,均具有较低的均方根误差值(RMSEC和RMSEP),但选择过程的耗时却可以大幅度降低,对于实时检测应用前景广阔。
Claims (1)
1.一种用于激光诱导击穿光谱分析的特征谱线自动选择方法,其特征是,步骤如下:
第1步:对光谱原始数据X做第一次全谱校正,计算每一列谱线变量Xi与校正集元素含量Y的协方差Cov(Xi,Y),同时分别计算Xi与Y的标准差σXi和σY,根据公式(1),生成相应的谱线校正因子ρi,光谱原始数据X与变量R=[ρ1,ρ2,…,ρN]相乘得到数据Xˊ:
第2步:对第1步校正后的光谱数据Xˊ做第二次全谱校正,对全部变量Xˊ实施整体偏最小二乘PLS分析,得到每一列谱线变量的偏最小二乘权重bi,根据公式(2),进一步计算得到相应的谱线校正因子ki,光谱数据Xˊ与变量K=[k1,k2,…,kN]相乘得到数据Xˊˊ:
第3步:剔除不重要的谱线变量。对现有的全部变量Xˊˊ进行偏最小二乘分析,并利用现有每个谱线变量的标准偏差值σj以及偏最小二乘权重值bj,根据公式(3),计算得到每个变量的重要性zj,利用现有变量整体的标准偏差σ和现有变量个数n,根据公式(4),计算得到当前迭代循环的阈值Thr,将现有变量的重要性逐个与阈值比较,如果该变量的重要性zj低于当前循环的阈值Thr,则该谱线变量被剔除:
第4步:迭代,对第3步选择后的剩余变量进行偏最小二乘分析,采用留一法交叉验证,并计算交叉验证的均方根误差值RMSECV,判断当前的变量个数是否小于10,否则返回第3步,是则停止迭代;
第5步:判断,计算机记录每一个迭代循环的变量个数和RMSECV值,选择判断出最合适的迭代结果,判断依据为:迭代循环的变量个数小于100且具有最小的RMSECV值,此循环剩余的谱线即为最终选择结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810745641.8A CN108956583A (zh) | 2018-07-09 | 2018-07-09 | 用于激光诱导击穿光谱分析的特征谱线自动选择方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810745641.8A CN108956583A (zh) | 2018-07-09 | 2018-07-09 | 用于激光诱导击穿光谱分析的特征谱线自动选择方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108956583A true CN108956583A (zh) | 2018-12-07 |
Family
ID=64482439
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810745641.8A Pending CN108956583A (zh) | 2018-07-09 | 2018-07-09 | 用于激光诱导击穿光谱分析的特征谱线自动选择方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108956583A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109799195A (zh) * | 2019-01-22 | 2019-05-24 | 上海交通大学 | 一种激光诱导击穿光谱的高精度定量分析方法 |
CN111504981A (zh) * | 2020-04-26 | 2020-08-07 | 上海交通大学 | 测定粉末物质中化学组分和水分含量的方法 |
CN112595706A (zh) * | 2020-12-25 | 2021-04-02 | 西北大学 | 一种激光诱导击穿光谱变量选择方法及系统 |
CN113340874A (zh) * | 2020-03-02 | 2021-09-03 | 中国科学院沈阳自动化研究所 | 一种基于结合岭回归和递归特征消除的定量分析方法 |
CN114252430A (zh) * | 2020-09-21 | 2022-03-29 | 中国科学院沈阳自动化研究所 | 一种基于激光诱导击穿光谱技术的矿浆品位在线检测方法 |
WO2022127391A1 (en) * | 2020-12-17 | 2022-06-23 | Agilent Technologies, Inc. | Spectral data processing for chemical analysis |
CN117929357A (zh) * | 2024-03-21 | 2024-04-26 | 沈阳尖科智能测控技术合伙企业(有限合伙) | 一种基于l2连续投影算法的libs波长筛选方法 |
-
2018
- 2018-07-09 CN CN201810745641.8A patent/CN108956583A/zh active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109799195A (zh) * | 2019-01-22 | 2019-05-24 | 上海交通大学 | 一种激光诱导击穿光谱的高精度定量分析方法 |
CN109799195B (zh) * | 2019-01-22 | 2020-07-31 | 上海交通大学 | 一种激光诱导击穿光谱的高精度定量分析方法 |
CN113340874A (zh) * | 2020-03-02 | 2021-09-03 | 中国科学院沈阳自动化研究所 | 一种基于结合岭回归和递归特征消除的定量分析方法 |
CN113340874B (zh) * | 2020-03-02 | 2023-07-18 | 中国科学院沈阳自动化研究所 | 一种基于结合岭回归和递归特征消除的定量分析方法 |
CN111504981A (zh) * | 2020-04-26 | 2020-08-07 | 上海交通大学 | 测定粉末物质中化学组分和水分含量的方法 |
CN111504981B (zh) * | 2020-04-26 | 2021-10-22 | 上海交通大学 | 测定粉末物质中化学组分和水分含量的方法 |
CN114252430A (zh) * | 2020-09-21 | 2022-03-29 | 中国科学院沈阳自动化研究所 | 一种基于激光诱导击穿光谱技术的矿浆品位在线检测方法 |
CN114252430B (zh) * | 2020-09-21 | 2024-02-02 | 中国科学院沈阳自动化研究所 | 一种基于激光诱导击穿光谱技术的矿浆品位在线检测方法 |
WO2022127391A1 (en) * | 2020-12-17 | 2022-06-23 | Agilent Technologies, Inc. | Spectral data processing for chemical analysis |
CN112595706A (zh) * | 2020-12-25 | 2021-04-02 | 西北大学 | 一种激光诱导击穿光谱变量选择方法及系统 |
CN117929357A (zh) * | 2024-03-21 | 2024-04-26 | 沈阳尖科智能测控技术合伙企业(有限合伙) | 一种基于l2连续投影算法的libs波长筛选方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108956583A (zh) | 用于激光诱导击穿光谱分析的特征谱线自动选择方法 | |
EP2710353B1 (en) | SPECTROSCOPIC APPARATUS AND METHOD of DETERMINING COMPONENTS PRESENT IN A SAMPLE | |
Andrade et al. | Classical univariate calibration and partial least squares for quantitative analysis of brass samples by laser-induced breakdown spectroscopy | |
CN105300923B (zh) | 一种近红外光谱分析仪在线应用时无测点温度补偿模型修正方法 | |
CN103487411B (zh) | 一种随机森林算法结合激光诱导击穿光谱识别钢材牌号的方法 | |
CN104483292B (zh) | 一种采用多谱线比值法提高激光探针分析精确度的方法 | |
CN105486655B (zh) | 基于红外光谱智能鉴定模型的土壤有机质快速检测方法 | |
CN108169213A (zh) | 一种激光诱导击穿光谱谱峰元素自动识别方法 | |
CN109781711A (zh) | 一种基于单标样定标的激光诱导击穿光谱定量分析方法 | |
CN102830096A (zh) | 基于人工神经网络的元素浓度测量误差修正方法 | |
CN103488874A (zh) | 一种改进的支持向量机结合激光诱导击穿光谱对钢铁材料的分类方法 | |
CN109142251B (zh) | 随机森林辅助人工神经网络的libs定量分析方法 | |
CN104730042A (zh) | 一种遗传算法结合激光诱导击穿光谱提高自由定标分析精度的方法 | |
CN103217404A (zh) | 一种激光诱导击穿光谱元素谱线归属识别方法 | |
CN104990895A (zh) | 一种基于局部区域的近红外光谱信号标准正态校正方法 | |
CN108827909B (zh) | 基于可见近红外光谱与多目标融合的土壤快速分类方法 | |
CN106018331A (zh) | 多通道光谱系统的稳定性评价方法及预处理优化方法 | |
CN106290263A (zh) | 一种基于遗传算法的libs定标定量分析方法 | |
CN104897709A (zh) | 一种基于x-射线荧光分析的农产品元素定量检测模型构建方法 | |
CN106198433B (zh) | 基于lm-ga算法的红外光谱定性分析方法 | |
CN107356556A (zh) | 一种近红外光谱定量分析的双集成建模方法 | |
CN102103079B (zh) | 一种光谱分析方法 | |
CN106950193B (zh) | 基于自加权变量组合集群分析的近红外光谱变量选择方法 | |
CN110632024B (zh) | 一种基于红外光谱的定量分析方法、装置、设备以及存储介质 | |
CN111044504B (zh) | 一种考虑激光诱导击穿光谱不确定性的煤质分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181207 |
|
RJ01 | Rejection of invention patent application after publication |