CN107167454A - 用于原子发射光谱分析的特征谱线快速选择方法 - Google Patents

用于原子发射光谱分析的特征谱线快速选择方法 Download PDF

Info

Publication number
CN107167454A
CN107167454A CN201710458292.7A CN201710458292A CN107167454A CN 107167454 A CN107167454 A CN 107167454A CN 201710458292 A CN201710458292 A CN 201710458292A CN 107167454 A CN107167454 A CN 107167454A
Authority
CN
China
Prior art keywords
mrow
variable
msup
analysis
existing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710458292.7A
Other languages
English (en)
Inventor
段发阶
傅骁
蒋佳佳
黄婷婷
马凌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201710458292.7A priority Critical patent/CN107167454A/zh
Publication of CN107167454A publication Critical patent/CN107167454A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light

Landscapes

  • Health & Medical Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Abstract

本发明属于光谱分析领域,为实现在大量光谱数据中快速选出与特定元素含量相关的多个特征谱线,大大提升选择效率,有效减少参与建模的特征谱线数量,简化计算过程,提升定量预测模型的稳健型和准确性;本发明,用于原子发射光谱分析的特征谱线快速选择方法,步骤如下:第1步:对光谱原始数据X做光谱预处理;第2步:将全部光谱变量谱线X等间隔地分为若干组Xi;第3步:对第2步校正后的全部变量Xˊ实施整体偏最小二乘分析;第4步:对现有的全部变量Xˊˊ进行偏最小二乘分析;第5步:将现有变量的重要性逐个与阈值比较;第6步:如满足定量分析要求,则停止迭代过程,否则回到第4步。本发明主要应用于光谱分析场合。

Description

用于原子发射光谱分析的特征谱线快速选择方法
技术领域
本发明属于光谱分析领域,特别是一种用于原子发射光谱分析的特征谱线快速选择方法。
背景技术
原子发射光谱分析是光谱分析的重要应用技术,在工业、农业、医学等领域实现特定元素或成分的定性、定量分析。典型的原子发射光谱技术根据激发光源不同,如激光诱导击穿光谱技术(LIBS)、电感耦合等离子体发射光谱技术(ICP-AES)、火花放电发射光谱技术(Spark-AES)等,是现代分析化学极具前景、发展迅速的研究方向。发射光谱分析是根据自由原子或离子外层电子辐射跃迁得到的发射光谱来研究物质的组成和含量,其过程一般分为激发、分光、检测三步,由光谱谱线的波长进行定性分析,由光谱谱线的强度进行定量分析。
随着电子技术、材料科学、仪器科学的发展,用于原子光谱分析的各类光谱仪更新升级迅速,仪器性能不断提高,特别如中阶梯光谱仪,其分辨率可达pm量级。更高的光谱分辨率表现了更加精细的光谱细节,同时也带来更庞大的光谱数据。对于特定元素或成分定量分析,使用单一谱线往往不能建立稳健、准确的分析模型,越来越多的研究者选择采用多元分析法(如主成分分析法PCA、偏最小二乘法PLS等)解决这一问题。多元分析法即利用多条谱线强度,考虑谱线之间相互关系,按照相应的权重系数,建立多元数学模型,开展定量分析。对于原子发射光谱,应用多元分析法时,须在大量光谱数据中选择有用的特征谱线建立模型,传统的特征谱线选择方法如间隔偏最小二乘法、遗传算法、迭代预测权重法等,大多被用于红外光谱分析而很少用于原子光谱分析,原因是在密集的原子谱线中,谱线选择效果不理想(甚至出现选择错误),且耗时漫长,需大量借助人力,效率低下。
发明内容
为克服现有技术的不足,
(1)本发明的目的是提供一种用于原子发射光谱分析的特征谱线快速选择方法,可在大量光谱数据中快速选出与特定元素含量相关的多个特征谱线,大大提升选择效率,有效减少参与建模的特征谱线数量,简化计算过程,提升定量预测模型的稳健型和准确性;
(2)本发明的另一目的是提供一种利用(1)中所述方法,对土壤样品中的金属元素Cu、Ba、Cr、Mg、Ga进行定量分析的典型案例,实现各元素特征谱线的快速、准确选取,通过分析结果验证本发明所提方法的可行性、适用性、优越性。
本发明采用的技术方案是,用于原子发射光谱分析的特征谱线快速选择方法,步骤如下:
第1步:对光谱原始数据X做光谱预处理,包括光谱标准化和小波阈值去噪两部分,以提高光谱数据质量;
第2步:将全部光谱变量谱线X等间隔地分为若干组Xi,对每一间隔的变量谱线Xi实施间隔偏最小二乘分析,并利用每一间隔得到的偏最小二乘权重矩阵Bi计算得到间隔校正因子矩阵Ki,对相应每个间隔的变量进行校正;
第3步:对第2步校正后的全部变量Xˊ实施整体偏最小二乘分析,并利用整体得到的偏最小二乘权重矩阵计算得到整体校正因子矩阵Kˊ,对相应整体的变量进行校正;
第4步:对现有的全部变量X″进行偏最小二乘分析,并利用现有每个变量的标准偏差值S以及偏最小二乘权重值B″计算得到每个变量的重要性,构成变量的重要性矩阵Z;
第5步:利用现有变量整体的标准偏差s和现有变量个数n计算得到当前迭代循环的阈值Thr,将现有变量的重要性逐个与阈值比较,如果该变量的重要性zj低于当前循环的阈值Thr,则该变量被排除;
第6步:对第5步选择后的现有变量进行偏最小二乘分析,采用留一法交叉验证,并计算交叉验证的均方根误差值RMSECV,综合考虑当前的变量个数和RMSECV值,如满足定量分析要求,则停止迭代过程,否则回到第4步。
对光谱原始数据X做光谱预处理,光谱标准化具体是谱线强度除以光谱均值强度,小波阈值去噪具体采用symlet小波,分解层数为4层,采用软阈值。
一个实例中,第2步:
第3步:对第2步校正后的全部变量Xˊ实施整体偏最小二乘分析,并利用整体得到的偏最小二乘权重矩阵计算得到整体校正因子矩阵Kˊ,
第4步:对现有的全部变量X″进行偏最小二乘分析,并利用现有每个变量的标准偏差值S以及偏最小二乘权重值B″计算得到每个变量的重要性,构成变量的重要性矩阵Z
第5步:利用现有变量整体的标准偏差s和现有变量个数n计算得到当前迭代循环的阈值Thr,将现有变量的重要性逐个与阈值比较,如果该变量的重要性zj低于当前循环的阈值Thr,则该变量被排除:
本发明的特点及有益效果是:
(1)该方法能够快速选择分析元素的特征谱线,相比传统选择方法(如人工选择法、间隔偏最小二乘法、遗传算法等)效率极大提高,计算过程简化,预测模型稳健且准确。
(2)该方法结合了间隔偏最小二乘法和迭代预测权重法的优点,使得快速变量选择在原子光谱分析领域成为可能(已报道的多用于近红外光谱分析),可推广适用于各种原子发射光谱分析过程,如激光诱导击穿光谱(LIBS)分析、电感耦合等离子体原子发射光谱(ICP-AES)分析等,对于各种金属、非金属元素进行定量分析,有益于提高多元分析模型的性能。
附图说明:
图1示出本发明的特征谱线快速选择方法流程图。
图2示出应用本发明方法选择土壤原子光谱Cu元素特征谱线的效果图。
图3示出应用本发明方法与其他方法进行Cu元素定量分析的校准和预测结果对比图。
图4示出应用本发明方法定量分析土壤其他元素(Ba、Cr、Mg、Ga)的校准和预测结果图。
图3中,a为单一谱线分析的结果,b为全谱线分析的结果,c为间隔偏最小二乘分析的结果,d为本发明方法分析的结果。
图4中,a为钡(Ba)元素定量分析的结果,b为铬(Cr)元素定量分析的结果,c为镁(Mg)元素定量分析的结果,d为钙(Ga)元素定量分析的结果。
具体实施方式
本发明采用的技术方案是,一种用于原子发射光谱分析的特征谱线快速选择方法,如图1所示,由以下步骤组成:
第1步:对光谱原始数据X做光谱预处理,包括光谱标准化(谱线强度除以光谱均值强度)和小波阈值去噪(symlet小波,分解层数4,软阈值)两部分,以提高光谱数据质量。
第2步:将全部光谱变量X(谱线)等间隔地分为若干组Xi,对每一间隔的变量(谱线)Xi实施间隔偏最小二乘分析,并利用每一间隔得到的偏最小二乘权重矩阵Bi计算得到间隔校正因子矩阵Ki,对相应每个间隔的变量进行校正。
第3步:对第2步校正后的全部变量Xˊ实施整体偏最小二乘分析,并利用整体得到的偏最小二乘权重矩阵计算得到整体校正因子矩阵Kˊ,对相应整体的变量进行校正。
第4步:对现有的全部变量X″进行偏最小二乘分析,并利用现有每个变量的标准偏差值S以及偏最小二乘权重值B″计算得到每个变量的重要性,构成变量的重要性矩阵Z。
第5步:利用现有变量整体的标准偏差s和现有变量个数n计算得到当前迭代循环的阈值Thr,将现有变量的重要性逐个与阈值比较,如果该变量的重要性zj低于当前循环的阈值Thr,则该变量被排除。
第6步:对第5步选择后的现有变量进行偏最小二乘分析,采用留一法交叉验证,并计算交叉验证的均方根误差值(RMSECV),综合考虑当前的变量个数和RMSECV值,如满足定量分析要求,则停止迭代过程,否则回到第4步。
下面结合附图和具体实施方式,进一步详细说明本发明。
一种用于原子发射光谱分析的特征谱线快速选择方法,如图1所示,由以下步骤组成:
第1步:对光谱原始数据X做光谱预处理,包括光谱标准化(谱线强度除以光谱均值强度)和小波阈值去噪(symlet小波,分解层数4,软阈值)两部分,以提高光谱数据质量。
第2步:将全部光谱变量X(谱线)等间隔地分为若干组Xi,对每一间隔的变量(谱线)Xi实施间隔偏最小二乘分析,并利用每一间隔得到的偏最小二乘权重矩阵Bi计算得到间隔校正因子矩阵Ki,对相应每个间隔的变量进行校正。
第3步:对第2步校正后的全部变量Xˊ实施整体偏最小二乘分析,并利用整体得到的偏最小二乘权重矩阵计算得到整体校正因子矩阵Kˊ,对相应整体的变量进行校正。
第4步:对现有的全部变量X″进行偏最小二乘分析,并利用现有每个变量的标准偏差值S以及偏最小二乘权重值B″计算得到每个变量的重要性,构成变量的重要性矩阵Z。
第5步:利用现有变量整体的标准偏差s和现有变量个数n计算得到当前迭代循环的阈值Thr,将现有变量的重要性逐个与阈值比较,如果该变量的重要性zj低于当前循环的阈值Thr,则该变量被排除。
第6步:对第5步选择后的现有变量进行偏最小二乘分析,采用留一法交叉验证,并计算交叉验证的均方根误差值(RMSECV),综合考虑当前的变量个数和RMSECV值,如满足定量分析要求,则停止迭代过程,否则回到第4步。
以土壤中金属Cu元素定量分析为例,如图2所示,利用本发明所提方法选择特征谱线,每一次迭代循环之后,剩余谱线逐渐减少,在最后一次迭代循环后,只有6个特征谱线保留下来,分别为324.742nm,324.753nm,324.764nm,327.380nm,327.391nm,327.402nm,与数据库公布的Cu元素最强特征谱线(324.754nm,327.395nm)完全相符,证明了本方法的可行性。如图3所示,利用不同方法对Cu元素含量作定量分析,包括3(a)单一谱线法、3(b)全谱线法、3(c)间隔片最小二乘法和3(d)本发明所提快速选择法,结果显示,利用本发明提出的方法选择的特征谱线数量显著低于其他方法,且提高了多元分析模型的稳健性和准确性,无论在校准还是预测结果中都具有较低的均方根误差值(RMSEC和RMSEP)和较高的相关性系数(R2),证明了本方法的优越性。如图4所示,利用本发明提出的方法对土壤中其他元素进行特征谱线选择以及定量分析,包括4(a)钡(Ba)元素、4(b)铬(Cr)元素、4(c)镁(Mg)元素和4(d)钙(Ga)元素,结果显示,不同元素的校准和预测结果均具有较低的均方根误差值(RMSEC和RMSEP)和较高的相关性系数(R2),证明了本方法的适用性。

Claims (3)

1.一种用于原子发射光谱分析的特征谱线快速选择方法,其特征是,步骤如下:
第1步:对光谱原始数据X做光谱预处理,包括光谱标准化和小波阈值去噪两部分,以提高光谱数据质量;
第2步:将全部光谱变量谱线X等间隔地分为若干组Xi,对每一间隔的变量谱线Xi实施间隔偏最小二乘分析,并利用每一间隔得到的偏最小二乘权重矩阵Bi计算得到间隔校正因子矩阵Ki,对相应每个间隔的变量进行校正;
第3步:对第2步校正后的全部变量Xˊ实施整体偏最小二乘分析,并利用整体得到的偏最小二乘权重矩阵计算得到整体校正因子矩阵Kˊ,对相应整体的变量进行校正;
第4步:对现有的全部变量X″进行偏最小二乘分析,并利用现有每个变量的标准偏差值S以及偏最小二乘权重值B″计算得到每个变量的重要性,构成变量的重要性矩阵Z;
第5步:利用现有变量整体的标准偏差s和现有变量个数n计算得到当前迭代循环的阈值Thr,将现有变量的重要性逐个与阈值比较,如果该变量的重要性zj低于当前循环的阈值Thr,则该变量被排除;
第6步:对第5步选择后的现有变量进行偏最小二乘分析,采用留一法交叉验证,并计算交叉验证的均方根误差值RMSECV,综合考虑当前的变量个数和RMSECV值,如满足定量分析要求,则停止迭代过程,否则回到第4步。
2.如权利要求1所述的用于原子发射光谱分析的特征谱线快速选择方法,其特征是,对光谱原始数据X做光谱预处理,光谱标准化具体是谱线强度除以光谱均值强度,小波阈值去噪具体采用symlet小波,分解层数为4层,采用软阈值。
3.如权利要求1所述的用于原子发射光谱分析的特征谱线快速选择方法,其特征是,一个实例中,第2步:
<mrow> <msub> <mi>K</mi> <mi>i</mi> </msub> <mo>=</mo> <mfrac> <mrow> <msub> <mi>B</mi> <mi>i</mi> </msub> <mo>&amp;CenterDot;</mo> <msub> <mi>B</mi> <mi>i</mi> </msub> </mrow> <mrow> <msub> <mi>B</mi> <mi>i</mi> </msub> <mo>&amp;CenterDot;</mo> <msup> <msub> <mi>B</mi> <mi>i</mi> </msub> <mi>T</mi> </msup> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>
第3步:对第2步校正后的全部变量Xˊ实施整体偏最小二乘分析,并利用整体得到的偏最小二乘权重矩阵计算得到整体校正因子矩阵Kˊ,
<mrow> <msup> <mi>K</mi> <mo>&amp;prime;</mo> </msup> <mo>=</mo> <mfrac> <mrow> <msup> <mi>B</mi> <mo>&amp;prime;</mo> </msup> <mo>&amp;CenterDot;</mo> <msup> <mi>B</mi> <mo>&amp;prime;</mo> </msup> </mrow> <mrow> <msup> <mi>B</mi> <mo>&amp;prime;</mo> </msup> <mo>&amp;CenterDot;</mo> <msup> <mi>B</mi> <mrow> <mo>&amp;prime;</mo> <mi>T</mi> </mrow> </msup> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>
第4步:对现有的全部变量X″进行偏最小二乘分析,并利用现有每个变量的标准偏差值S以及偏最小二乘权重值B″计算得到每个变量的重要性,构成变量的重要性矩阵Z
<mrow> <mi>Z</mi> <mo>=</mo> <mfrac> <mrow> <msup> <mi>B</mi> <mrow> <mo>&amp;prime;</mo> <mo>&amp;prime;</mo> </mrow> </msup> <mo>&amp;CenterDot;</mo> <mi>S</mi> </mrow> <mrow> <msup> <mi>B</mi> <mrow> <mo>&amp;prime;</mo> <mo>&amp;prime;</mo> </mrow> </msup> <mo>&amp;CenterDot;</mo> <msup> <mi>S</mi> <mi>T</mi> </msup> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>
第5步:利用现有变量整体的标准偏差s和现有变量个数n计算得到当前迭代循环的阈值Thr,将现有变量的重要性逐个与阈值比较,如果该变量的重要性zj低于当前循环的阈值Thr,则该变量被排除:
<mrow> <mi>T</mi> <mi>h</mi> <mi>r</mi> <mo>=</mo> <mfrac> <mrow> <mi>s</mi> <msqrt> <mrow> <mn>2</mn> <msub> <mi>log</mi> <mn>2</mn> </msub> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> </mrow> </msqrt> </mrow> <msqrt> <mi>n</mi> </msqrt> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> <mo>.</mo> </mrow> 1
CN201710458292.7A 2017-06-16 2017-06-16 用于原子发射光谱分析的特征谱线快速选择方法 Pending CN107167454A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710458292.7A CN107167454A (zh) 2017-06-16 2017-06-16 用于原子发射光谱分析的特征谱线快速选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710458292.7A CN107167454A (zh) 2017-06-16 2017-06-16 用于原子发射光谱分析的特征谱线快速选择方法

Publications (1)

Publication Number Publication Date
CN107167454A true CN107167454A (zh) 2017-09-15

Family

ID=59818912

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710458292.7A Pending CN107167454A (zh) 2017-06-16 2017-06-16 用于原子发射光谱分析的特征谱线快速选择方法

Country Status (1)

Country Link
CN (1) CN107167454A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108444981A (zh) * 2018-01-30 2018-08-24 中国科学院上海技术物理研究所 基于mart乘性重建的libs定量求解方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
XIAO FU等: "A fast variable selection method for quantitative analysis of soils using laser-induced breakdown spectroscopy", 《J.ANAL.AT.SPECTROM》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108444981A (zh) * 2018-01-30 2018-08-24 中国科学院上海技术物理研究所 基于mart乘性重建的libs定量求解方法
CN108444981B (zh) * 2018-01-30 2020-06-26 中国科学院上海技术物理研究所 基于mart乘性重建的libs定量求解方法

Similar Documents

Publication Publication Date Title
Yan et al. A novel hybrid feature selection strategy in quantitative analysis of laser-induced breakdown spectroscopy
Anderson et al. Post-landing major element quantification using SuperCam laser induced breakdown spectroscopy
Andrade et al. Classical univariate calibration and partial least squares for quantitative analysis of brass samples by laser-induced breakdown spectroscopy
Ding et al. A hybrid random forest method fusing wavelet transform and variable importance for the quantitative analysis of K in potassic salt ore using laser-induced breakdown spectroscopy
Dong et al. A method for improving the accuracy of calibration-free laser-induced breakdown spectroscopy (CF-LIBS) using determined plasma temperature by genetic algorithm (GA)
WO2016000088A1 (zh) 一种基于最佳指数-相关系数法的高光谱波段提取方法
CN104483292B (zh) 一种采用多谱线比值法提高激光探针分析精确度的方法
Guezenoc et al. Variables selection: A critical issue for quantitative laser-induced breakdown spectroscopy
Fu et al. A fast variable selection method for quantitative analysis of soils using laser-induced breakdown spectroscopy
CN102830096A (zh) 基于人工神经网络的元素浓度测量误差修正方法
CN106596450B (zh) 基于红外光谱分析物质成分含量的增量式方法
CN112414997B (zh) 基于rbf神经网络的icp-aes重叠谱线分离方法
CN112051256B (zh) 基于cnn模型的待测元素含量libs测量方法、系统
CN105158200B (zh) 一种提高近红外光谱定性分析准确度的建模方法
CN109902411B (zh) 土壤重金属含量检测建模方法及装置、检测方法及装置
CN110503156B (zh) 一种基于最小相关系数的多变量校正特征波长选择方法
CN104730042A (zh) 一种遗传算法结合激光诱导击穿光谱提高自由定标分析精度的方法
Stipe et al. Laser-induced breakdown spectroscopy of steel: a comparison of univariate and multivariate calibration methods
CN106644978A (zh) 可判定精度的基于光谱特征波长分析土壤养分含量检测法
Khodasevich et al. Selection of Spectral Variables and Improvement of the Accuracy of Calibration of Temperature by Projection onto Latent Structures Using the Fluorescence Spectra of Yb 3+: CaF 2
Huang et al. A novel method to extract important features from laser induced breakdown spectroscopy data: application to determine heavy metals in mulberries
CN107167454A (zh) 用于原子发射光谱分析的特征谱线快速选择方法
CN106248652B (zh) 基于工艺参数修正的svr对激光金属沉积中元素浓度实时监测方法
CN111626224A (zh) 基于近红外光谱和ssa优化的elm的煤矸石快速识别方法
CN109142251B (zh) 随机森林辅助人工神经网络的libs定量分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170915

WD01 Invention patent application deemed withdrawn after publication