CN112595706A - 一种激光诱导击穿光谱变量选择方法及系统 - Google Patents
一种激光诱导击穿光谱变量选择方法及系统 Download PDFInfo
- Publication number
- CN112595706A CN112595706A CN202011558863.2A CN202011558863A CN112595706A CN 112595706 A CN112595706 A CN 112595706A CN 202011558863 A CN202011558863 A CN 202011558863A CN 112595706 A CN112595706 A CN 112595706A
- Authority
- CN
- China
- Prior art keywords
- variable
- spectral
- spectral characteristic
- preliminary
- adopting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/71—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light thermally excited
- G01N21/718—Laser microanalysis, i.e. with formation of sample plasma
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Optics & Photonics (AREA)
- Plasma & Fusion (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种激光诱导击穿光谱变量选择方法及系统,涉及光谱分析技术领域,包括获取不同样品分别在不同测量位处的光谱数据;采用KS算法对所述光谱数据进行筛选,得到训练集;对所述训练集中的光谱数据进行互信息处理以获取初步光谱特征变量;采用粒子群算法对所述初步光谱特征变量进行筛选以获取最终光谱特征变量。本发明能够实现LIBS光谱特征变量的精准筛选,进而提升预测模型的预测能力,节约计算成本。
Description
技术领域
本发明涉及光谱分析技术领域,特别是涉及一种激光诱导击穿光谱变量选择方法及系统。
背景技术
激光诱导击穿光谱(laser-induced breakdown spectroscopy,LIBS)是一种基于原子发射光谱的检测物质组分与含量的分析技术。LIBS技术仪器主要由激光器、光路系统、光谱仪以及检测器组成。在LIBS分析过程中,激光器发射激光聚焦在样品表面形成等离子体,在冷却过程中,处于激发态的原子和离子从高能态跃迁到低能态,并发射出具有特定波长的特征谱线。通过光谱仪进行解析,就可以得到样品的光谱信息。而通过谱线的识别和峰强度的测量便可给出有关样品成分的定性和定量信息。因其具有快速、多元素同时分析、无需复杂样品预处理、无损分析以及原位分析等特点,而被应用于多个领域。由于每个元素在LIBS光谱中都有其一系列发射线,因此可以通过元素在样品中的含量与其LIBS特征峰强度的关系完成元素的定量分析。对于特定元素的特征谱线,在实验条件一定的情况下,激光诱导等离子体中谱线强度与样品中元素含量成正比。然而,由于实验参数的不可控波动,样品表面的不均匀性以及物理化学基体效应的影响,传统的单变量方法不能够客观展现LIBS光谱强度与元素含量之间的关系。而化学计量学中多元校正方法可通过光谱强度与目标属性之间的关系建立预测模型用于未知样品检测,且在使用过程中能够有效降低基体效应和自吸收效应对预测结果的影响。
极限学习机(Extreme learning machine,ELM)作为一个相对较新的非线性多元分析方法,在分类和回归问题中都表现出优良的性能。与基于梯度迭代的人工神经网络算法不同,ELM随机初始输入层与隐含层之间的权重和偏置,同时隐含层与输出层之间的权重通过最小二乘方法进行选择。因此,ELM算法能够有效避免传统神经网络方法训练速度慢与过拟合的问题。然而,由于在ELM建模过程中需要随机生成输入层与隐含层之间的权重和偏置,导致其分析结果的不稳定性。即使在隐藏节点固定的情况下,ELM仍然会产生不同的预测结果。为解决此问题,Huang等提出了一种核极限学习机(Kernel extreme learningmachine,KELM)算法。在KELM算法中,ELM中的隐含层特征映射被核函数取代。在使用过程中只要核函数的参数被确定,便可以获得唯一的最优解。因此将核极限学习机和激光诱导击穿光谱技术相结合能够很好地对物质进行定量分析。
由于样品的复杂性,获得的每条LIBS光谱通常包含成千上万个变量,其中除了样品信息外还包括很多噪声和冗余信息。如果将所有光谱数据用于分析,则很容易产生“维度灾难”问题,不但会使模型复杂化,增加建模时间,还会严重影响模型的预测能力和计算效率。因此,在建模之前首先进行变量选择,提取特征信息,降低数据维度是非常重要的一环。
变量选择是从原始数据中选择一些最有效的变量以减小数据集维度的过程。它可以提高模型计算效率、简化模型使其更易于解释、避免维数诅咒、减少过拟合以及增强泛化能力等。通常,变量选择方法可大致分为两类:过滤法和封装法。考虑到特征集和学习模型之间的相互关系,故封装法比过滤法更有效,但计算量较大,特别是在处理高维数据时往往需要较长的时间。
发明内容
本发明的目的是提供一种激光诱导击穿光谱变量选择方法及系统,以实现LIBS光谱特征变量的精准筛选。
为实现上述目的,本发明提供了如下方案:
一种激光诱导击穿光谱变量选择方法,包括:
获取不同样品分别在不同测量位处的光谱数据;
采用KS算法对所述光谱数据进行筛选,得到训练集;
对所述训练集中的光谱数据进行互信息处理以获取初步光谱特征变量;
采用粒子群算法对所述初步光谱特征变量进行筛选以获取最终光谱特征变量。
可选的,在执行所述采用粒子群算法对所述初步光谱特征变量进行筛选以获取最终光谱特征变量步骤之后,还包括:
采用核极限学习机算法对所述最终光谱特征变量进行处理以构建预测模型;
根据所述预测模型计算相关系数和均方根误差,以对所述预测模型的预测性能进行评价。
可选的,所述获取不同样品分别在不同测量位处的光谱数据,具体包括:
利用激光诱导击穿光谱系统对不同样品分别在不同测量位点处进行数据采集以获得光谱数据。
可选的,所述对所述训练集中的光谱数据进行互信息处理以获取初步光谱特征变量,具体包括:
采用5-折交叉验证算法确定互信息的初始变量和预设阈值;
根据所述初始变量和所述预设阈值,对所述训练集中的光谱数据进行互信息处理以获取初步光谱特征变量。
可选的,所述采用粒子群算法对所述初步光谱特征变量进行筛选以获取最终光谱特征变量,具体包括:
采用10-折交叉验证算法确定粒子群算法的粒子数、加速系数以及最大迭代次数;
根据所述粒子数、所述加速系数以及所述最大迭代次数,采用粒子群算法对所述初步变量进行筛选以获取最终光谱特征变量。
一种激光诱导击穿光谱变量选择系统,包括:
光谱数据获取模块,用于获取不同样品分别在不同测量位处的光谱数据;
训练集确定模块,用于采用KS算法对所述光谱数据进行筛选,得到训练集;
初步光谱特征变量确定模块,用于对所述训练集中的光谱数据进行互信息处理以获取初步光谱特征变量;
最终光谱特征变量确定模块,用于采用粒子群算法对所述初步光谱特征变量进行筛选以获取最终光谱特征变量。
可选的,还包括:
预测模型构建模块,用于采用核极限学习机算法对所述最终光谱特征变量进行处理以构建预测模型;
性能评价模块,用于根据所述预测模型计算相关系数和均方根误差,以对所述预测模型的预测性能进行评价。
可选的,所述光谱数据获取模块,具体包括:
光谱数据获取单元,用于利用激光诱导击穿光谱系统对不同样品分别在不同测量位点处进行数据采集以获得光谱数据。
可选的,所述初步光谱特征变量确定模块,具体包括:
互信息参数确定单元,用于采用5-折交叉验证算法确定互信息的初始变量和预设阈值;
初步光谱特征变量确定单元,用于根据所述初始变量和所述预设阈值,对所述训练集中的光谱数据进行互信息处理以获取初步光谱特征变量。
可选的,所述最终光谱特征变量确定模块,具体包括:
粒子群算法参数确定单元,用于采用10-折交叉验证算法确定粒子群算法的粒子数、加速系数以及最大迭代次数;
最终光谱特征变量确定单元,用于根据所述粒子数、所述加速系数以及所述最大迭代次数,采用粒子群算法对所述初步光谱特征变量进行筛选以获取最终光谱特征变量。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明通过互信息算法消除光谱数据中的冗余变量,然后通过粒子群算法对保留变量进行进一步筛选,以找到一组具有较高预测精度的变量,以实现LIBS光谱特征变量的精准筛选,进而提升预测模型的预测能力,节约计算成本。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种激光诱导击穿光谱变量选择方法的流程图;
图2为本发明一种激光诱导击穿光谱变量选择系统的结构图
图3为本发明一种激光诱导击穿光谱变量选择方法的操作流程图;
图4为本发明煤样品(ZM102)的平均LIBS光谱和FTIR光谱图;图4(a)为本发明煤样品(ZM102)的平均LIBS光谱图;图4(b)为本发明煤样品(ZM102)的FTIR光谱图;
图5为本发明粒子群不同迭代次数对应的适应度收敛曲线图;
图6为本发明基于MI-PSO初级融合模型、基于LIBS模型和基于FTIR模型的结果对比图;图6(a)为本发明指标RCV 2结果图;图6(b)为本发明指标RMSECV结果图;图6(c)为本发明指标RP 2结果图;图6(d)为本发明指标RMSEP结果图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种激光诱导击穿光谱变量选择方法及系统,以实现LIBS光谱特征变量的精准筛选。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例一
如图1所示,本实施例提供的一种激光诱导击穿光谱变量选择方法,包括以下步骤。
步骤101:获取不同样品分别在不同测量位处的光谱数据;具体包括:利用激光诱导击穿光谱系统对不同样品分别在不同测量位点处进行数据采集以获得光谱数据。
步骤102:采用KS算法对所述光谱数据进行筛选,得到训练集。
步骤103:对所述训练集中的光谱数据进行互信息处理以获取初步光谱特征变量;具体包括:采用5-折交叉验证算法确定互信息的初始变量和预设阈值;根据所述初始变量和所述预设阈值,对所述训练集中的光谱数据进行互信息处理以获取初步光谱特征变量。
步骤104:采用粒子群算法对所述初步光谱特征变量进行筛选以获取最终光谱特征变量;具体包括:采用10-折交叉验证算法确定粒子群算法的粒子数、加速系数以及最大迭代次数;根据所述粒子数、所述加速系数以及所述最大迭代次数,采用粒子群算法对所述初步变量进行筛选以获取最终光谱特征变量。
作为一种优选的实施方式,本实施例在执行步骤104之后,还可以继续执行步骤105和步骤106.
步骤105:采用核极限学习机算法对所述最终光谱特征变量进行处理以构建预测模型。
步骤106:根据所述预测模型计算相关系数和均方根误差,以对所述预测模型的预测性能进行评价。
其中,步骤105和步骤106的目的是为了检验所筛选的变量是否合适。
实施例二
如图2所示,本实施例提供了一种激光诱导击穿光谱变量选择系统,包括:
光谱数据获取模块201,用于获取不同样品分别在不同测量位处的光谱数据。
训练集确定模块202,用于采用KS算法对所述光谱数据进行筛选,得到训练集。
初步光谱特征变量确定模块203,用于对所述训练集中的光谱数据进行互信息处理以获取初步光谱特征变量。
最终光谱特征变量确定模块204,用于采用粒子群算法对所述初步光谱特征变量进行筛选以获取最终光谱特征变量。
作为一种优选的实施方式,本实施例还包括:
预测模型构建模块205,用于采用核极限学习机算法对所述最终光谱特征变量进行处理以构建预测模型。
性能评价模块206,用于根据所述预测模型计算相关系数和均方根误差,以对所述预测模型的预测性能进行评价。
其中,所述光谱数据获取模块201,具体包括:
光谱数据获取单元,用于利用激光诱导击穿光谱系统对不同样品分别在不同测量位点处进行数据采集以获得光谱数据。
所述初步光谱特征变量确定模块203,具体包括:
互信息参数确定单元,用于采用5-折交叉验证算法确定互信息的初始变量和预设阈值。
初步光谱特征变量确定单元,用于根据所述初始变量和所述预设阈值,对所述训练集中的光谱数据进行互信息处理以获取初步光谱特征变量。
所述最终光谱特征变量确定模块204,具体包括:
粒子群算法参数确定单元,用于采用10-折交叉验证算法确定粒子群算法的粒子数、加速系数以及最大迭代次数。
最终光谱特征变量确定单元,用于根据所述粒子数、所述加速系数以及所述最大迭代次数,采用粒子群算法对所述初步光谱特征变量进行筛选以获取最终光谱特征变量。
实施例三
为了快速获得高精度输入变量,本实施例将两种变量选择方法组合使用以具有广阔的应用前景。因此为了克服封装式变量选择方法计算效率低的局限性,提出一种基于过滤法(互信息(Mutual information,MI))和封装法(粒子群算法(Particle swarmoptimization,PSO))的混合变量选择方法(互信息粒子群算法(MI-PSO))以实现LIBS光谱特征变量的精准筛选。
本实施例提供了一种基于模型集群分析的激光诱导击穿光谱变量选择方法,包括以下步骤:
步骤1:利用激光诱导击穿光谱系统对不同煤炭样品分别在不同测量位点进行光谱数据采集以获得全光谱数据矩阵。
步骤2:对全光谱数据矩阵中的光谱数据进行KS(Kennard-Stone)算法采样,得到训练集和预测集。具体为:
KS算法把所有的样本都看作训练集候选样本,依次从中挑选样本进入训练集。首先选择欧氏距离最远的两个样本进入训练集,其后通过计算剩下的每一个样本到训练集内每一个已选样本的欧式距离,找到距已选样本最远以及最近的两个样本,并将这两个样本选入训练集,重复上述步骤直到样本数量达到训练集的要求,剩余的样本进入预测集。
步骤3:对训练集中的光谱数据进行互信息(MI)初步变量筛选,得到初步光谱特征变量。具体为:
①选择初始变量xi和预设阈值,并计算初始变量xi和其它所有变量之间的MI值;
②删除MI值大于预设阈值的变量,逐步选取剩余变量中具有最大MI值的变量,并计算其与其它剩余变量的MI值,直到没有更多的变量可供选择为止。
步骤4:对初步光谱特征变量使用粒子群(PSO)算法进一步滤除变量,得到最终光谱特征变量,并将最终光谱特征变量添加至特征集中。具体为:
①初始化粒子群参数;
②对输入变量进行二进制编码,每个编码代表一个变量,“1”代表该变量被选择,“0”代表该变量未被选择;
③计算粒子适应度;
④根据粒子适应度,更新个体最优值及全局最优值;
⑤判断是否达到最大迭代次数,若达到则把群体最优位置转化为相应的特征集返回,否则返回步骤③继续迭代。
(5)特征集建模
用核极限学习机(KELM),将经互信息粒子群算法(MI-PSO)筛选的最终光谱特征变量来构建特征集预测模型以用于定量分析,然后用训练集预测特征集预测模型并计算相关系数(R2)和均方根误差(RMSE),以对特征集预测模型的预测性能进行评价。
上述步骤(3)中利用互信息进行变量筛选时需要确定两个参数,初始变量和预设阈值,二者的取值直接影响提取变量的质量。因此,基于5-折交叉验证算法分别对MI的这两个参数进行优化。通过对比交叉验证结果设置初始变量和预设阈值的值。两个随机变量之间的互信息越大意味着这两个变量相关性越好。如果互信息为零,则意味这两个随机变量之间是相互独立的。
上述步骤(4)中使用粒子群算法进一步滤除变量时需要确定三个参数,粒子数、加速系数(c1,c2)和最大迭代次数。通常情况下,c1和c2默认设置为2。对于粒子数,使用10-折交叉验证算法在20和100之间确定粒子数,通过对比不同粒子数所对应的适应度值来确定粒子数,随着粒子数的增加,执行时间显著增加,若适应度值无明显差异,应选择粒子数小的。最后对最大迭代次数进行了优化,当最大迭代次数太小时,算法收敛过快达不到最优解;最大迭代次数太大时,会增加算法运行的时间。同样通过对比不同迭代次数对应的适应度值来确定最大迭代次数。
上述步骤(5)中利用径向基核函数构造(KELM)模型,惩罚参数C和核参数γ对(KELM)模型的泛化性能有着重要影响。二者的值由10-折交叉验证算法和网格搜索方法基于2的指数(20,21,...,229,230)确定,RMSE值作为评价指标。
用核极限学习机(KELM)将经互信息粒子群算法(MI-PSO)筛选的变量来构建预测模型以用于定量分析,然后用训练集预测该模型并计算相关系数(R2)和均方根误差(RMSE),以对预测模型的预测性能进行评价。
本发明从煤基能源材料现场分析的实际需求出发,以煤炭为研究对象,开展了基于LIBS光谱的煤质定量分析方法研究,重点研究了基于变量选择的KELM模型,解决了复杂光谱解析问题,进而建立了用于煤质分析的快速检测方法,为煤基能源材料现场分析提供了理论基础与技术支撑;
混合变量选择是将过滤法和封装法进行组合的一种实现方式。它首先使用过滤法剔除大量的冗余或共线信息,然后将剩余变量连同浓度数据一起作为输入参数传递给封装法,以进一步优化选择的变量。混合变量选择方法通常同时具有封装法的高精度和过滤法的高效特性。
核极限学习机(KELM)具有学习速度快、调节参数少等优点。同时,结合互信息粒子群算法对其输入变量进行筛选,挑选出能够显著性提高模型预测能力的变量,可以使得模型的泛化性能和稳定性得到显著的改善。
实施例四
下面以对26个标准煤样品,19个实际煤样品的建模分类过程中的变量选择为例,结合附图和实例来进一步说明本发明的操作流程,但本发明不限于此例。
本实施例使用的LIBS系统主要由Q开关Nd:YAG激光器(Litron,Nano L120-20,UK),Echelle光谱仪(AryelleButterfly,LTB200,Germany),增强电荷耦合器件(Intensified chargecoupled device,ICCD)以及可移动样品台和计算机等组成。激光能量为12mJ,基频光波长1064nm,激光脉冲持续时间为1ns,重复频率为10Hz,分析过程中,最佳延迟时间设置为3μs,门宽设置为2ms。使用的FTIR光谱仪(VERTEX 70,Bruker,Germany)配备有干涉仪、KBr分束器和氘代硫酸三甘氨酸(DTGS)检测器,并在4000-400cm-1(分辨率,4cm-1;扫描速度,7.5kHz;背景,20次扫描;样品,20次扫描)范围内收集样品的红外光谱数据。
本实施例中的26个标准煤样品(粉末,购自济南中标科技有限公司),19个实际煤样品由西安热工研究院提供,其中,热值、灰分和挥发分由西安特种设备检验检测院测定。
在LIBS光谱采集过程中,将每个粉末样品在28MPa压力下持续5分钟压制成片状样品进行分析。测定过程中,光谱范围为220nm-800nm,每个片状样品上选取20个不同的位置进行LIBS光谱采集,每个测量光谱通过叠加10次激光脉冲获得。最终,45个煤样品共获得900个分析光谱(每个样品20个分析光谱)。在FTIR光谱采集过程中,将样品直接放置在单反射的锗晶体ATR上,每个样品测试了3次。最终,45个煤样品共获得135个分析光谱(每个样品3个分析光谱)。
考虑煤样品的复杂性,如果将所有光谱随机分为训练集和预测集则容易出现过拟合进而导致预测准确率虚高。因此,为了保证训练集中的样本按照空间距离分布均匀,采用Kennard-Stone算法选择15个煤样品作为训练集,30个煤样品为预测集。
为了避免过拟合,变量选择过程中只使用训练集,待确定真实有用变量后再用训练集数据检验效果。
为了减少单次测试引起的误差,计算过程中将三次测试FTIR的平均光谱作为分析光谱。
这样整个光谱共有997个变量,每个变量为包含30个波长点的光谱波段。
按图3所示流程进行KS采样,最终确定15个煤样品作为训练集,30个煤样品为预测集。表1显示了每种煤样品的灰分和挥发分,上标有a的表示为训练集。图4显示了一个代表性煤样品(ZM102)的平均LIBS光谱和FTIR光谱。关于LIBS光谱,如图4(a)所示,图中标出了根据NIST数据库识别出的煤样品中部分元素(C、Si、Ca、Mg、Al、Fe、Mn、Na、Ti)的特征谱线以及两条分子线(CN和C2)。图4(b)显示了400-4000cm-1范围内的煤样品的红外光谱。
表1煤样品的灰分和挥发分的参考值表
首先,分别建立基于平均LIBS光谱数据和FTIR光谱数据的KELM定量模型以用于煤灰分和挥发分的测定。通过5-折交叉验证和网格搜索方法基于步长20.5在20至230范围内对KELM定量模型的惩罚参数C和核参数γ进行优化。基于平均LIBS光谱数据和FTIR光谱数据建立的KELM定量模型对应的最佳参数和获得的定量结果如表2所示。
表2基于LIBS和FTIR光谱的KELM模型对应的定量结果表
从表2可以看出,对于三种煤质指标,基于平均LIBS光谱数据的KELM定量模型获得的结果均较差,特别是对于挥发分的测定,RCV 2和RP 2值均低于0.8,而RMSECV和RMSEP值均高于4%,而基于FTIR光谱数据的KELM定量模型,上述三种煤质指标的测定均获得良好的预测结果,其中,RCV 2和RP 2值均在0.95以上,RMSECV和RMSEP值均低于2.0。这表明基于FTIR光谱数据建立的KELM定量模型可用于煤灰分和挥发分的测定,也说明红外光谱法可作为一种简单直接的方法来有效地评估煤灰分和挥发分。
接着使用MI对融合光谱数据进行变量筛选。初始变量和预设阈值是MI方法的两个重要的参数,直接影响提取变量的质量。因此,基于5-折交叉验证分别对MI的这两个参数进行优化。通过交叉验证结果发现,不同初始变量获得的RMSECV和RCV 2值相差不大。因此,直接将初始变量设置为1。而对于灰分和挥发分,基于最小RMSECV和最大RCV 2值选出的阈值分别为0.96、0.95和0.95。基于最优的参数,使用MI对融合光谱数据进行变量筛选。最终,对于灰分和挥发分,变量个数由融合光谱的45267分别减少到37066、34061和34061。
然后将MI提取的变量传递到PSO方法进行进一步的筛选,通过10-折交叉验证对PSO参数进行优化。最终,对于三种煤质指标,粒子数均设置为20,学习率c1和c2均设置为2。此外,为了观察每次迭代过程中PSO的性能,500次迭代对应的适应度收敛曲线如图5所示。从图5可以看出,对于所有三种煤质指标,在第一次迭代后适应度值发生了显著变化;然后,随着迭代次数的增加,适应度值缓慢变化,并且在200次迭代之后逐渐趋于稳定。这意味着随着迭代次数的增加,模型性能没有进一步改善,反而会增加参数优化的时间消耗,因此最大迭代次数设置为200。经过PSO方法进一步筛选变量后,灰分和挥发分两种煤质指标获得的变量个数分别为6499和5093。
基于最终保留的变量分别构建用于灰分和挥发分测定的KELM模型。最优模型参数及定量结果如表3所示。
表3基于MI-PSO的数据融合模型对应的预测结果表
从表3中可以看出,三种煤质指标的交叉验证和训练集的R2都在0.95以上。对于挥发分,RMSE都在1.3左右;而对于灰分,训练集RMSE为0.9687,但交叉验证RMS0相对较高。
为了探究MI-PSO对模型预测性能的影响,将基于MI-PSO的初级融合的结果模型与基于LIBS和基于FTIR的结果进行了对比,如图6所示。对于三种煤质指标,基于MI-PSO的初级数据融合模型获得的结果优于两种光谱模型。其中,对于灰分,RCV 2由0.8647(LIBS)和0.9553(FTIR)提高到0.9684,RMSECV由2.9043%(LIBS)和1.8891%(FTIR)降低到1.6170%,RP 2由0.8723(LIBS)和0.9699(FTIR)提高到0.9821,RMSEP值由2.7728%(LIBS)和1.2239%(FTIR)降低到0.9687%;对于挥发分,RCV 2由0.6793(LIBS)和0.977(FTIR)提高到0.9868,RMSECV由6.7232%(LIBS)和1.4237%(FTIR)降低到1.2886%,RP 2由0.758(LIBS)和0.9766(FTIR)提高到0.9789,RMSEP值由4.4817%(LIBS)和1.5611%(FTIR)降低到1.3218%。结果表明,使用MI-PSO方法对融合光谱进行变量选择有助于减少融合光谱中冗余信息对预测结果的影响,从而提高模型预测性能。
本发明提供的方法或系统能够筛选真正能够代表物质成分特征并对定量分析有用的变量,避免噪音、环境信息、冗余数据等无用变量对分类的影响,有效提高计算效率的同时,可显著减少变量个数,提高模型预测性能。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种激光诱导击穿光谱变量选择方法,其特征在于,包括:
获取不同样品分别在不同测量位处的光谱数据;
采用KS算法对所述光谱数据进行筛选,得到训练集;
对所述训练集中的光谱数据进行互信息处理以获取初步光谱特征变量;
采用粒子群算法对所述初步光谱特征变量进行筛选以获取最终光谱特征变量。
2.根据权利要求1所述的一种激光诱导击穿光谱变量选择方法,其特征在于,在执行所述采用粒子群算法对所述初步光谱特征变量进行筛选以获取最终光谱特征变量步骤之后,还包括:
采用核极限学习机算法对所述最终光谱特征变量进行处理以构建预测模型;
根据所述预测模型计算相关系数和均方根误差,以对所述预测模型的预测性能进行评价。
3.根据权利要求1所述的一种激光诱导击穿光谱变量选择方法,其特征在于,所述获取不同样品分别在不同测量位处的光谱数据,具体包括:
利用激光诱导击穿光谱系统对不同样品分别在不同测量位点处进行数据采集以获得光谱数据。
4.根据权利要求1所述的一种激光诱导击穿光谱变量选择方法,其特征在于,所述对所述训练集中的光谱数据进行互信息处理以获取初步光谱特征变量,具体包括:
采用5-折交叉验证算法确定互信息的初始变量和预设阈值;
根据所述初始变量和所述预设阈值,对所述训练集中的光谱数据进行互信息处理以获取初步光谱特征变量。
5.根据权利要求1所述的一种激光诱导击穿光谱变量选择方法,其特征在于,所述采用粒子群算法对所述初步光谱特征变量进行筛选以获取最终光谱特征变量,具体包括:
采用10-折交叉验证算法确定粒子群算法的粒子数、加速系数以及最大迭代次数;
根据所述粒子数、所述加速系数以及所述最大迭代次数,采用粒子群算法对所述初步变量进行筛选以获取最终光谱特征变量。
6.一种激光诱导击穿光谱变量选择系统,其特征在于,包括:
光谱数据获取模块,用于获取不同样品分别在不同测量位处的光谱数据;
训练集确定模块,用于采用KS算法对所述光谱数据进行筛选,得到训练集;
初步光谱特征变量确定模块,用于对所述训练集中的光谱数据进行互信息处理以获取初步光谱特征变量;
最终光谱特征变量确定模块,用于采用粒子群算法对所述初步光谱特征变量进行筛选以获取最终光谱特征变量。
7.根据权利要求6所述的一种激光诱导击穿光谱变量选择系统,其特征在于,还包括:
预测模型构建模块,用于采用核极限学习机算法对所述最终光谱特征变量进行处理以构建预测模型;
性能评价模块,用于根据所述预测模型计算相关系数和均方根误差,以对所述预测模型的预测性能进行评价。
8.根据权利要求6所述的一种激光诱导击穿光谱变量选择系统,其特征在于,所述光谱数据获取模块,具体包括:
光谱数据获取单元,用于利用激光诱导击穿光谱系统对不同样品分别在不同测量位点处进行数据采集以获得光谱数据。
9.根据权利要求6所述的一种激光诱导击穿光谱变量选择系统,其特征在于,所述初步光谱特征变量确定模块,具体包括:
互信息参数确定单元,用于采用5-折交叉验证算法确定互信息的初始变量和预设阈值;
初步光谱特征变量确定单元,用于根据所述初始变量和所述预设阈值,对所述训练集中的光谱数据进行互信息处理以获取初步光谱特征变量。
10.根据权利要求6所述的一种激光诱导击穿光谱变量选择系统,其特征在于,所述最终光谱特征变量确定模块,具体包括:
粒子群算法参数确定单元,用于采用10-折交叉验证算法确定粒子群算法的粒子数、加速系数以及最大迭代次数;
最终光谱特征变量确定单元,用于根据所述粒子数、所述加速系数以及所述最大迭代次数,采用粒子群算法对所述初步光谱特征变量进行筛选以获取最终光谱特征变量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011558863.2A CN112595706A (zh) | 2020-12-25 | 2020-12-25 | 一种激光诱导击穿光谱变量选择方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011558863.2A CN112595706A (zh) | 2020-12-25 | 2020-12-25 | 一种激光诱导击穿光谱变量选择方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112595706A true CN112595706A (zh) | 2021-04-02 |
Family
ID=75202341
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011558863.2A Pending CN112595706A (zh) | 2020-12-25 | 2020-12-25 | 一种激光诱导击穿光谱变量选择方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112595706A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113406058A (zh) * | 2021-05-28 | 2021-09-17 | 中国科学院沈阳自动化研究所 | 基于互信息特征筛选pls的libs铁矿浆定量分析方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170358163A1 (en) * | 2014-12-16 | 2017-12-14 | Giesecke & Devrient Gmbh | Device and Method for Verifying Feature Substances |
CN108133272A (zh) * | 2018-01-15 | 2018-06-08 | 大连民族大学 | 一种复杂网络社区检测的方法 |
CN108956583A (zh) * | 2018-07-09 | 2018-12-07 | 天津大学 | 用于激光诱导击穿光谱分析的特征谱线自动选择方法 |
CN109583621A (zh) * | 2018-10-12 | 2019-04-05 | 中国农业大学 | 一种基于改进变分模态分解的pso-lssvm短期负荷预测方法 |
CN111343171A (zh) * | 2020-02-19 | 2020-06-26 | 重庆邮电大学 | 一种基于支持向量机的混合特征选择的入侵检测方法 |
CN111797903A (zh) * | 2020-06-12 | 2020-10-20 | 武汉大学 | 一种基于数据驱动粒子群算法的多模态遥感图像配准方法 |
-
2020
- 2020-12-25 CN CN202011558863.2A patent/CN112595706A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170358163A1 (en) * | 2014-12-16 | 2017-12-14 | Giesecke & Devrient Gmbh | Device and Method for Verifying Feature Substances |
CN108133272A (zh) * | 2018-01-15 | 2018-06-08 | 大连民族大学 | 一种复杂网络社区检测的方法 |
CN108956583A (zh) * | 2018-07-09 | 2018-12-07 | 天津大学 | 用于激光诱导击穿光谱分析的特征谱线自动选择方法 |
CN109583621A (zh) * | 2018-10-12 | 2019-04-05 | 中国农业大学 | 一种基于改进变分模态分解的pso-lssvm短期负荷预测方法 |
CN111343171A (zh) * | 2020-02-19 | 2020-06-26 | 重庆邮电大学 | 一种基于支持向量机的混合特征选择的入侵检测方法 |
CN111797903A (zh) * | 2020-06-12 | 2020-10-20 | 武汉大学 | 一种基于数据驱动粒子群算法的多模态遥感图像配准方法 |
Non-Patent Citations (4)
Title |
---|
ALPER UNLER.ET AL: ""mr 2 PSO: A maximum relevance minimum redundancy feature selection method based on swarm intelligence for support vector machine classification"", 《INFORMATION SCIENCES》 * |
CHUNHUA YAN.ET AL: ""A hybrid variable selection method based on wavelet transform and mean impact value for calorific value determination of coal using laser-induced breakdown spectroscopy and kernel extreme learning machine"", 《SPECTROCHIMICA ACTA PART B》 * |
宋小杉: "《基于支持向量机的地面目标自动识别技术》", 31 July 2018, 国防工业出版社 * |
李志刚: "《光谱数据处理与定量分析技术》", 30 June 2017, 北京邮电大学出版社 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113406058A (zh) * | 2021-05-28 | 2021-09-17 | 中国科学院沈阳自动化研究所 | 基于互信息特征筛选pls的libs铁矿浆定量分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Shi et al. | Quantitative analysis of sedimentary rocks using laser-induced breakdown spectroscopy: comparison of support vector regression and partial least squares regression chemometric methods | |
CN102053083B (zh) | 一种基于偏最小二乘法的煤质特性在线测量方法 | |
CN102262075B (zh) | 基于分光法的激光诱导击穿光谱测量元素浓度的方法 | |
CN113155809B (zh) | 一种矿石分类与实时定量分析的光谱检测新方法 | |
CN112051256B (zh) | 基于cnn模型的待测元素含量libs测量方法、系统 | |
CN108830253B (zh) | 筛选模型建立方法、光谱筛选装置及方法 | |
CN105718749B (zh) | 一种基于大数据库辨识的煤质特性分析方法 | |
CN113340874B (zh) | 一种基于结合岭回归和递归特征消除的定量分析方法 | |
CN105486655A (zh) | 基于红外光谱智能鉴定模型的土壤有机质快速检测方法 | |
CN114813709B (zh) | 土壤成分检测方法、设备及系统 | |
CN102830096A (zh) | 基于人工神经网络的元素浓度测量误差修正方法 | |
CN112834485B (zh) | 激光诱导击穿光谱元素定量分析的一种非定标方法 | |
Ruan et al. | A novel hybrid filter/wrapper method for feature selection in archaeological ceramics classification by laser-induced breakdown spectroscopy | |
GB2561879A (en) | Spectroscopic analysis | |
CN112505010A (zh) | 一种基于荧光光谱的变压器故障诊断装置及方法 | |
Ruan et al. | A modified backward elimination approach for the rapid classification of Chinese ceramics using laser-induced breakdown spectroscopy and chemometrics | |
CN107966499B (zh) | 一种由近红外光谱预测原油碳数分布的方法 | |
CN112595706A (zh) | 一种激光诱导击穿光谱变量选择方法及系统 | |
CN109142251B (zh) | 随机森林辅助人工神经网络的libs定量分析方法 | |
Cai et al. | Quantitative analysis of stibnite content in raw ore by Raman spectroscopy and chemometric tools | |
CN105277531A (zh) | 一种基于分档的煤质特性测量方法 | |
CN109521002B (zh) | 一种固体燃料颗粒流的燃料特性测量方法 | |
CN102103079B (zh) | 一种光谱分析方法 | |
CN107941758A (zh) | 一种基于光谱预处理的煤质热值测量方法 | |
CN111272735A (zh) | 一种激光诱导击穿光谱的检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210402 |