CN114813709A - 土壤成分检测方法、设备及系统 - Google Patents

土壤成分检测方法、设备及系统 Download PDF

Info

Publication number
CN114813709A
CN114813709A CN202210738002.5A CN202210738002A CN114813709A CN 114813709 A CN114813709 A CN 114813709A CN 202210738002 A CN202210738002 A CN 202210738002A CN 114813709 A CN114813709 A CN 114813709A
Authority
CN
China
Prior art keywords
model
spectrum
soil
detected
spectral data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210738002.5A
Other languages
English (en)
Other versions
CN114813709B (zh
Inventor
王锐
贺新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huapu Intelligent Technology Tianjin Co ltd
Original Assignee
Huapu Intelligent Technology Tianjin Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huapu Intelligent Technology Tianjin Co ltd filed Critical Huapu Intelligent Technology Tianjin Co ltd
Priority to CN202210738002.5A priority Critical patent/CN114813709B/zh
Publication of CN114813709A publication Critical patent/CN114813709A/zh
Application granted granted Critical
Publication of CN114813709B publication Critical patent/CN114813709B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/71Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light thermally excited
    • G01N21/718Laser microanalysis, i.e. with formation of sample plasma
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology

Abstract

本发明提供了一种土壤成分检测方法、设备及系统,该方法包括获取待测土壤样本的光谱数据;对光谱数据进行预处理,以去除光谱数据中的噪声;根据土壤样本待测元素,从预处理后的光谱数据中筛选待测土壤样本各待测元素的特征谱线组;根据筛选出的特征谱线组输入预先训练的混合模型中,得到待测土壤样本各元素的含量。通过混合模型将复杂的光谱数据分解为线性部分和非线性部分,通过多元线性回归模型计算其线性部分,通过神经网络模型预测其非线性部分,从而避免实际条件与理想条件的差异造成的误差,能够有效提高土壤成分含量检测的准确度。

Description

土壤成分检测方法、设备及系统
技术领域
本申请属于土壤检测技术领域,尤其涉及一种土壤成分检测方法、设备及系统。
背景技术
随着经济水平的进步,生活质量的提高,可持续发展越来越成为关注的重点,对土壤成分含量进行检测是可持续发展的重要部分。
目前的土壤元素含量检测手段可分为两大类:光谱分析法和电化学分析法。其中光谱分析法主要有两类,一类是通过对原子发射光谱生成过程进行理化分析后得出的物理模型,另外一类是近年来兴起的基于大数据的统计机器学习方法。但在使用物理模型进行分析时需要好的特征谱线和参考谱线,否则无法达到很高的准确性。而统计机器学习方法需要大量区分度高的数据集做支撑,否则会过拟合,导致检测的准确度低。
发明内容
有鉴于此,本发明提供了一种土壤成分检测方法、设备及系统,旨在解决采用现有技术对土壤成分检测的准确度低的问题。
本发明实施例的第一方面提供了一种土壤成分检测方法,包括:
获取待测土壤样本的光谱数据;
对所述光谱数据进行预处理,以去除所述光谱数据中的噪声;
根据土壤样本待测元素,从预处理后的光谱数据中筛选一组与该元素相关的特征谱线;
根据筛选出的特征谱线组输入预先训练的混合模型中,得到待测土壤样本中待测元素的含量;
其中,所述混合模型包括多个预先确定的拟合函数,每个拟合函数表示待测土壤样本的其中一种元素的含量和特定光谱强度组的对应关系;每个拟合函数表示与待测元素相关的特征谱线选择规则;每个拟合函数分为线性部分和非线性部分;所述线性部分通过多元线性回归模型拟合得到;所述非线性部分由神经网络模型拟合得到。
在一些可能的实现方式中,每个拟合函数为:
Figure DEST_PATH_IMAGE001
其中,
Figure 539619DEST_PATH_IMAGE002
为所述线性部分,
Figure DEST_PATH_IMAGE003
为所述非线性部分,C s 为该拟合函数对应的元素的含量,ω为所有发生能级跃迁的波长集合,w'为线性参数,由所述多元线性回归模型确定,I为所述特征谱线的谱线强度,λ为所述特征谱线的波长,k为常数,i为所述特征谱线的能级,ε(I)为误差函数,由所述神经网络模型确定。
在一些可能的实现方式中,所述混合模型通过以下步骤训练:
训练多元线性回归模型以确定所述线性参数;
固定所述线性参数并训练所述神经网络模型,以确定所述误差函数;
其中,所述多元线性回归模型和所述神经网络模型的训练过程均设置有防止过拟合的早停机制。
在一些可能的实现方式中,所述对所述光谱数据进行预处理,包括:
去除光谱数据中光谱仪的暗噪声后进行全谱积分归一化;
对全谱积分归一化后的光谱数据进行光谱叠加。
在一些可能的实现方式中,在对所述光谱数据进行预处理之后,所述方法还包括:
计算同一类物质激发出的光谱的类内相对标准偏差和不同类物质激发出的光谱之间的类间相对标准偏差;
若类内相对标准偏差小于第一预设值且类间相对标准偏差大于第二预设值,则将预处理效果评价为优;
若类内相对标准偏差不小于第一预设值或类间相对标准偏差不大于第二预设值,则将预处理效果评价为差并重新执行对所述光谱数据进行预处理的步骤。
在一些可能的实现方式中,所述从预处理后的光谱数据中筛选待测土壤样本各待测元素的特征谱线,包括:
采用特征谱线筛选算法对光谱叠加后的光谱数据进行筛选,以得到待测土壤样本各待测元素的特征谱线。
在一些可能的实现方式中,所述神经网络模型为DenseNet结构的神经网络模型。
本发明实施例的第二方面提供了一种土壤成分检测装置,包括:
获取模块,用于获取待测土壤样本的光谱数据;
预处理模块,用于对所述光谱数据进行预处理,以去除所述光谱数据中的噪声;
筛选模块,用于根据土壤样本待测元素,从预处理后的光谱数据中筛选一组与该元素相关的特征谱线;
计算模块,用于根据筛选出的特征谱线组输入预先训练的混合模型中,得到待测土壤样本中待测元素的含量;
其中,所述混合模型包括多个预先确定的拟合函数,每个拟合函数表示待测土壤样本的其中一种元素的含量和特定光谱强度组的对应关系;每个拟合函数表示与待测元素相关的特征谱线选择规则;每个拟合函数分为线性部分和非线性部分;所述线性部分通过多元线性回归模型拟合得到;所述非线性部分由神经网络模型拟合得到。
本发明实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上第一方面所述土壤成分检测方法的步骤。
本发明实施例的第四方面提供了一种土壤成分检测系统,包括:激光发射单元、样品控制台、接收单元以及如上第二方面所述的终端设备;
所述激光发射单元用于向所述样品控制台上的待测土壤样本投射探测光;
所述接收单元用于采集所述待测土壤样本的光谱数据并发送给所述终端设备。
在一些可能的实现方式中,所述激光发射单元包括LIBS激光器和光学聚焦系统;所述接收单元包括光谱仪和收集系统。
本发明实施例的第五方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上第一方面所述土壤成分检测方法的步骤。
本发明实施例提供的土壤成分检测方法、设备及系统,包括获取待测土壤样本的光谱数据;对光谱数据进行预处理,以去除光谱数据中的噪声;从预处理后的光谱数据中筛选待测土壤样本各待测元素的特征谱线;根据筛选出的特征谱线输入预先训练的混合模型中,得到待测土壤样本各元素的含量;其中,混合模型包括多个预先确定的拟合函数,每个拟合函数表示待测土壤样本的其中一种元素的含量和光谱强度的对应关系;每个拟合函数包括线性部分和非线性部分;线性部分通过多元线性回归模型拟合得到;非线性部分由神经网络模型拟合得到。通过将复杂的光谱数据分解为线性部分和非线性部分,通过多元线性回归模型计算其线性部分,通过神经网络模型预测其非线性部分,从而避免实际条件与理想条件的差异造成的误差,能够有效提高土壤成分含量检测的准确度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的土壤成分检测方法的流程示意图;
图2是本发明实施例提供的混合模型的结构示意图;
图3是本发明实施例提供的四种标准土样的光谱数据预处理前后评价指标的变化对比图;其中,图3(a)为RSDin的变化对比图;图3(b)为RSDdif的变化对比图;图3(c)为光谱数据特征数的变化对比图;
图4是本发明实施示例提供的内标法绘制的定标曲线与混合模型拟合得到的定标曲线对比图;其中,图4(a)为内标法绘制的铅的定标曲线;图4(b)为内标法绘制的铜的定标曲线;图4(c)为内标法绘制的锰的定标曲线;图4(d)为内标法绘制的铬的定标曲线;图4(e)为混合模型拟合得到的铅的定标曲线;图4(f)为混合模型拟合得到的铜的定标曲线;图4(g)为混合模型拟合得到的锰的定标曲线;图4(h)为混合模型拟合得到的铬的定标曲线;
图5是本发明实施示例提供的混合模型训练损失曲线图;
图6是本发明实施示例提供的混合模型和DenseNet神经网络模型相对均方误差对比图;图6(a)是锰元素对应的相对均方误差对比图。图6(b)是铅元素对应的相对均方误差对比图;图6(c)是铜元素对应的相对均方误差对比图;图6(d)是铬元素对应的相对均方误差对比图;
图7是本发明实施示例提供的Cr元素光谱图;图7(a)为Cr-1样本在267nm附近的强度曲线;图7(b)为Cr-11样本在267nm附近的强度曲线;
图8是本发明实施例提供的土壤成分检测系统的结构示意图;
图9是本发明另一实施例提供的土壤成分检测系统的结构示意图;
图10是本发明实施例提供的土壤成分检测装置的结构示意图;
图11是本发明实施例提供终端设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
激光诱导击穿光谱(LIBS,Laser-induced Breakdown Spectroscopy)技术是一种典型的基于等离子体的光发射光谱技术。激光与物质相互作用发生等离子体爆炸,等离子体爆炸产生的光通过光谱仪或探测器收集形成光谱,从形成的光谱中进一步分析得到不同物质的含量。以10ns脉冲宽度的激光激发固体样品为例,在1ns内激光烧蚀样品表面使其气化,5ns左右离子气团及其周围气体开始生成等离子体,此过程中原子能级跃迁产生了自发辐射,生成元素的特征谱,50ns之后等离子体开始减弱,原子特征谱出现。
当假定等离子温度不变时,对某一种元素的某一波长下的跃迁辐射能量和其粒子数密度的关系近似满足:
Figure 218862DEST_PATH_IMAGE004
其中I(λ)表示波长λ下的跃迁辐射能量,N为离子数密度。
由于粒子数密度和浓度是正相关的,因此理想条件下使用多元线性回归绘制关于样品浓度与光谱强度的定标曲线,即可得到有效的元素定量化分析模型。
但是实际和理想条件下存在差距,一方面,激发等离子体温度时为3K-5k之间,并不能保持不变,这带来的影响也是不可忽略的,另一方面,由于实验条件、物理建模不确定性等各种原因,还引入了很多额外的误差。
现有技术通常使用物理模型(即本发明的多元线性回归模型)例如内标法、免定标曲线法等或统计机器学习方法例如深度学习来缩小误差。但由于基体效应、自吸收效应、实验条件影响等原因,常规的物理模型仍然难以匹配到合适的特征谱线和参考谱线,准确度低,而统计机器学习方法又容易发生过拟合,检测准确度较低。
图1是本发明实施例提供的土壤成分检测方法的流程示意图。如图1所示,在一些实施例中,土壤成分检测方法,包括:
S101,获取待测土壤样本的光谱数据。
若某种样品中存在某种元素,那么在一定的跃迁几率下,这种元素就会激发出等离子体辐射,并在最终的光谱中有所呈现,因此本实施例中,通过获取样本的光谱数据,能够为土壤样本的成分分析提供数据基础。光谱数据可以从光谱仪中获取,也可以在检测人员实地采样检测并将检测数据上传至相应平台数据库后,从该数据库中获取,在此不作限定。
对样本中含量较高的物质,当其发生跃迁时在光谱上的表现更明显。根据对不同元素的原子结构推演及分析,可推测出每种元素可能发生跃迁激发等离子体光谱的波长。一般进行元素存在性判别时,需要对该元素的多个可能跃迁波长附近进行综合分析。最后选取的波长一般满足附近没有其他干扰元素且该元素在该波长下有很高的跃迁几率,此时如果该样品在该波长点处激发出比较明显的峰值,则大概率可以判定样本中存在该种元素。否则,就需要对该元素的多条高跃迁几率的谱线进行分析,如果在多条谱线附近均存在明显峰值,也能大概率确定样品中存在该种元素。
在一些实施例中,在S101之后还可以包括:将光谱数据输入到预先建立的分类模型中以确定土壤样本中的元素类型。
本实施例中,分类模型可以是支持向量机、反向传播神经网络、随机森林等在此不作限定。光谱数据可以为LIBS光谱数据集。
S102,对光谱数据进行预处理,以去除光谱数据中的噪声。
获取的原始光谱中一般含有大量噪声。除此之外,由于环境的变化和等离子体激发过程中的偶然性,给LIBS光谱带来了很大的波动性。本实施例中,为了使光谱尽可能的稳定有效,需要对获取的光谱数据进行预处理。
S103,根据土壤样本待测元素,从预处理后的光谱数据中筛选一组与该元素相关的特征谱线。
元素的特征谱线是指该波长下的谱线是由某种元素激发出来的,根据元素特征谱线可以对元素的存在性和含量进行推断。但在特征谱线的实际选取过程中,存在两个难点:1.由于光谱仪分辨率的限制,收集到的光谱是积分谱,因此很难收集到某一个波长点下的强度,一般是一小段波长范围内的累计值,很容易引入其他元素的干扰;2.实际激发过程中并不是所有可能的波长点下都能够激发出有效强度,大多数情况下由于激光器能量等原因,元素并不能在光谱中激发出有效的强度。
本实施例中,可以通过根据等离子体的激发过程的物理规律建立的物理模型和/或训练得到的机器学习模型实现元素的特征谱线的筛选。
S104,根据筛选出的特征谱线组输入预先训练的混合模型中,得到待测土壤样本中待测元素的含量。
图2是本发明实施例提供的混合模型的结构示意图。如图2所示,混合模型包括多个预先确定的拟合函数,每个拟合函数表示待测土壤样本的其中一种元素的含量和特定光谱强度组的对应关系;每个拟合函数表示与待测元素相关的特征谱线选择规则;每个拟合函数分为线性部分和非线性部分;线性部分通过多元线性回归模型拟合得到;非线性部分由神经网络模型拟合得到。
本实施例中,每类元素对应一个拟合函数,将该元素对应特征谱线的谱线强度输入到其对应的拟合函数中,即可得到该元素的含量。神经网络模型可以是反向传播神经网络、卷积神经网络模型、DenseNet结构的神经网络模型等,在此不作限定。多元线性回归模型可以是内标法归一模型、免定标曲线模型等,在此不作限定。
本实施例中,通过将复杂的光谱数据分解为线性部分和非线性部分,通过多元线性回归模型计算其线性部分,通过神经网络模型预测其非线性部分,从而避免实际条件与理想条件的差异造成的误差,能够有效提高土壤成分含量检测的准确度。
在一些实施例中,每个拟合函数为:
Figure 853237DEST_PATH_IMAGE005
其中,
Figure 61364DEST_PATH_IMAGE002
为所述线性部分,
Figure 764878DEST_PATH_IMAGE003
为非线性部分,C s 为该拟合函数对应的元素的含量,ω为所有发生能级跃迁的波长集合,w'为线性参数,由多元线性回归模型确定,I为特征谱线的谱线强度,λ为特征谱线的波长,k为常数,i为特征谱线的能级,ε(I)为误差函数,由神经网络模型确定。
本实施例中,拟合函数的原理如下:
等离子体辐射在发射或者吸收介质中的传播通常可以用一维模型进行表示,选取圆柱体状等离子体的单位截面,可以得出等离子体在柱体内传播的光强I(λ,x)的微分为:
Figure 716654DEST_PATH_IMAGE006
其中,ε(λ,x)为在波长λ处的自发辐射率,可表示为:
Figure 454802DEST_PATH_IMAGE007
其中,h为普朗克常数,c为光速,A ij 为能级i到能级j之间的转移概率,n j 为高能级整体分布,
Figure 99410DEST_PATH_IMAGE008
为发射谱的正态分布概况。在LIBS中,λ大多数情况下可以用洛伦兹或者Voigt函数(如果高斯展宽不可忽略)来进行估计。
其中,k(λ,x)为吸收系数,其既考虑了低能级的吸收又考虑了高能级的激发,并可表示为:
Figure 40953DEST_PATH_IMAGE009
其中g j g i 分别代表高低能级的简并性,n i 表示低能级的整体分布。在实际计算中,由于
Figure 530840DEST_PATH_IMAGE010
这一系数表示受激发射的贡献并且对于自发辐射来说影响不大,因此在计算过程中常常被忽略。
对公式(3)进行积分可以得到等离子体发射光谱强度计算公式为:
Figure 123495DEST_PATH_IMAGE011
在实际激发过程中,由于激发样本不同,实验条件不同,在计算过程中近似计算的方法也不一样。在各向同性的均匀等离子体内部,公式(6)中xx'中发射与吸收系数的独立性被去除了,因此等式可以写作:
Figure 673425DEST_PATH_IMAGE012
其中,B(λ)是黑体辐射中的光谱配分函数;乘积项k(λ)l被叫做光学深度,通常也被写作一项τ(λ)。给定波长下光学深度的大小决定了自吸收的程度。假设将固体样本看作光学薄的(也即
Figure 617111DEST_PATH_IMAGE013
),这时公式(7)可进一步近似为:
Figure 910689DEST_PATH_IMAGE014
在原子的能级粒子数符合玻尔兹曼分布时,由于原子系统满足局部热平衡(LTE,Local Thermodynamic Equilibrium),则公式(8)又可近似成如下形式:
Figure 374162DEST_PATH_IMAGE015
其中,N为发射粒子的总粒子数密度,T为等离子体温度,k B 为玻尔兹曼常数,E j 为转移到的高能级的能量,U(T)为配分函数。因此可以通过对光谱强度的分析得到样品中待测元素含量的分析结果。
然后引入一个关于光强的隐函数
Figure 829414DEST_PATH_IMAGE016
来对温度波动带来的误差进行补偿,将公式(9)表达为如下形式:
Figure 994816DEST_PATH_IMAGE017
其中,λ为波长;C s 为元素浓度,
Figure 92085DEST_PATH_IMAGE018
,其中,a表示
Figure 659333DEST_PATH_IMAGE019
泰勒展开的常数项,因此k为一个可求解的常数,由于后面的
Figure 301798DEST_PATH_IMAGE016
为高阶无穷小项,无法求解其具体表达式,但是可估计其值应远小于前项,也就是说公式(10)所示的模型可看作多元线性回归模型和一个无需显示求解补偿函数叠加而成。
实际中,每种物质的激发是多个波长下发生多种能级跃迁,因此公式(10)又可写作:
Figure 954496DEST_PATH_IMAGE020
其中,ω代表所有发生能级跃迁的波长集合,n表示集合中元素的个数。考虑到现实条件和理想条件下的差距,可以通过将这些误差通过光强隐式的表达出来,写成一个关于光强的误差函数ε,因此公式(11)可重新写作如下形式:
Figure 589877DEST_PATH_IMAGE021
即上述公式(2)所示的混合模型。
本实施例中,通过混合模型,将原本的模型分解为物理模型和统计模型,既能通过统计模型提高物理模型的准确率,又可以通过物理模型缓解统计模型的过拟合。
在一些实施例中,混合模型通过以下步骤训练:
训练多元线性回归模型以确定线性参数;
固定线性参数并训练神经网络模型,以确定误差函数;
其中,多元线性回归模型和神经网络模型的训练过程均设置有防止过拟合的早停机制。
本实施例中,为了防止神经网络模型对数据拟合能力过强导致线性部分失效,可以将训练过程分为两个步骤:
第一步:首先用数据训练多元线性回归模型,由于实际有效激发波长较少,因此在这一步中,对损失函数添加L1正则,同时使用验证集进行早停,防止过拟合。
第二步:固定在第一步训练好的线性模型参数,加入DenseNet进行进一步训练。模型实现基于深度学习框架Pytorch,损失函数选取为平均绝对误差(MAE),数据集划分选择留一法,对每一组数据结果进行验证分析,并且使用早停机制阻止模型过拟合,训练时长比一般的DenseNet模型稍短。
在一些实施例中,S102可以包括:
去除光谱数据中光谱仪的暗噪声后进行全谱积分归一化;
对全谱积分归一化后的光谱数据进行光谱叠加。
本实施例中,在LIBS光谱生成过程中,存在的主要噪声为光谱仪的暗噪声。光谱仪暗噪声可通过在激发光谱之前采集一定的光谱得到暗噪声,将原始光谱去掉暗噪声,可得到信噪比更高的光谱,有利于后续的数据分析。例如可以收集30张系统暗噪声取平均作为暗噪声的强度。在去除暗噪后,光谱的基线趋于零,说明去除掉了原本光谱中很大一部分噪声。
尽管由此去除了大部分噪声,光谱中仍然存在一定的热噪声,这些噪声强度很小,非常随机,去除比较困难。可以使用滤波,拟合等方式对这些噪声进行处理。但这些尝试往往会引入新的不可控噪声,甚至会对某些本身激发强度很低的元素产生很大的影响。因此,本发明没有对噪声进行进一步处理,而是在模型中通过神经网络拟合的方式进行修正(即公式(2)中的非线性部分的拟合)。
由于每次激发出的光强可能具有一定的波动性,因此激发光谱的总能量也随之具有一定的波动性。这种波动性会表现在整个光谱上,让光谱更加的不稳定。本实施例中,使用光谱总能量对光谱进行归一化,从而减少光谱的波动性。
光谱叠加是一种常用的提高光谱数据稳定性的办法,随着叠加光谱增多,光谱的相对波动性会逐渐变小。但考虑到神经网络模型对数据量的需求,过多的光谱叠加会导致数据集变小,模型过拟合更加严重。因此,本实施例中采用五张光谱叠加为一张光谱的方式,既能够提高光谱数据的稳定性,又能够满足神经网络模型对数据量的要求。
在一些实施例中,预处理过程还可以使用最大最小值归一化、内标归一化等归一化算法或标准差阈值筛选、主成分分析等降维算法进行预处理。
在一些实施例中,在对光谱数据进行预处理之后,方法还包括:
计算同一类物质激发出的光谱的类内相对标准偏差和不同类物质激发出的光谱之间的类间相对标准偏差;
若类内相对标准偏差小于第一预设值且类间相对标准偏差大于第二预设值,则将预处理效果评价为优;
若类内相对标准偏差不小于第一预设值或类间相对标准偏差不大于第二预设值,则将预处理效果评价为差并重新执行对光谱数据进行预处理的步骤。
本实施例中,提出同时使用类内RSD(RSDin)和类间RSD(RSDdif)来对预处理效果进行评价(RSD为相对标准偏差)。从理论出发,RSDin用来衡量同种物质光谱的稳定性,同种物质激发出的光谱越稳定越好,即RSDin越小越好。RSDdif用来衡量不同种物质光谱的差异性,不同种物质激发出的光谱差异性越大越好,这样说明保留的特征在不同物质之间存在显著差异,即RSDdif越大越好。这两种指标综合起来能够有效衡量光谱质量的好坏,通过设定这种预处理评价指标,对预处理效果进行评判。
不同的预处理步骤对类内RSD和类间RSD的影响不同。例如,其中全谱积分归一和光谱叠加用于降低光谱的RSDin,当挑选元素的特征谱线时,只需在光谱稳定的基础上对不同元素的特征谱线进行挑选即可。
对于定标曲线定量化模型,需要对选出的特征谱线进行内标归一化,在该过程中为单变量回归,因此相比于全谱多变量回归的RSDdif更高,RSDin更低。
在神经网络模型中,最大最小归一是不可或缺的一步。分类问题神经网络能够给出相对可靠的结果,因此可以不关注特征本身的物理含义,选用PCA降维能够让模型更快收敛,准确率更高。定量化问题由于神经网络很容易对数据集过拟合,需要保留特征的物理意义以便对模型结果进一步分析改进,因此采取标准差筛选的方法对特征进行降维后输入定量化模型进一步分析。
图3是本发明实施例提供的四种标准土样的光谱数据预处理前后评价指标的变化对比图。其中图3(a)为RSDin的变化对比图。横轴为标准土样的类型,纵轴为RSDin的变化百分比。图3(b)为RSDdif的变化对比图。横轴为标准土样的类型,纵轴为RSDdif的变化百分比。图3(c)为光谱数据特征数的变化对比图。横轴为标准土样的类型,纵轴为光谱数据特征数。如图3(a)-(c)所示,在预处理过程中,可以观察到随着每一步预处理的进行RSDin和RSDdif发生了明显的变化。以此为依据,可以选择每步预处理的参数,例如,光谱叠加选取叠加光谱数为5,标准差筛选保留标准差前300维特征。四种元素光谱的类内RSD显著降低,类间RSD明显增大,说明预处理给光谱质量带来了明显的提升。
在一些实施例中,S103可以包括:
采用特征谱线筛选算法对光谱叠加后的光谱数据进行筛选,以得到待测土壤样本各待测元素的特征谱线。
通过物理规律进行推算的方法虽然可靠准确,但是由于候选谱线数量多,人工挑选工作量大,耗时较长;使用算法筛选速度快,但是可靠性不高,挑选出的候选谱线未必是合理的元素特征谱线。因此,本实施例中,特征谱线筛选算法的流程可以为:首先对光谱数据预处理,然后判断数据是否有标签,对有标签的数据使用有监督特征筛选算法并对无标签的数据使用无监督特征筛选算法选出候选特征,然后再用物理规律推算出的可能特征谱线与候选谱线比对。另外,在算法执行完成后,还可以进行人工判断核验,以确定最合适的元素特征谱线。
在一些实施例中,神经网络模型为DenseNet结构的神经网络模型。
在一些实施例中,可以使用预测平均值和相对均方误差对混合模型的检测结果进行评价。
下面通过一个实施示例对本发明的效果进行说明,但并不作为限定。
在该实施示例中,分别使用定标曲线模型(即多元线性回归模型的一种),神经网络模型和本发明的混合模型对四种土壤样本(即在四份标准土样中分别加入铅、铜、锰、铬)进行定量分析,结果表明本发明的混合模型结合了两种模型的优点并获得了更好的定量化效果。
本实施示例所使用的物理模型(即定标曲线模型)需要通过内标法归一,对四种金属元素其特征谱线和参考谱线选取如下:铅元素特征谱线选取405.78nm,参考谱线选择406.36nm处的铁元素;铜元素特征谱线选取327.39nm,参考谱线选择329.32nm处的钛元素;锰元素特征谱线选取259.33nm,参考谱线选择258.18nm处的铁元素;铬元素特征谱线选取267.66nm,参考谱线选择266.01nm处的铁元素。其中,定标曲线模型的代码是基于matlab实现的。
本实施示例中,为了确保模型的表达能力,神经网络模型选用了深度神经网络模型,其结构参考了DenseNet的网络结构以防止网络层数过深带来的梯度消失问题。其具体结构如表1所示:
表1 DenseNet结构表
Figure 11631DEST_PATH_IMAGE022
神经网络模型包含2个DenseBlock和1个转换层,每个DenseBlock的增长率为8,最终的线性层加入失效率为0.1的dropout来防止过拟合。模型基于深度学习框架Pytorch实现,损失函数选取为平均绝对值误差(MAE),数据集划分选择留一法,对每一组数据结果进行验证分析,并且使用早停机制阻止模型过拟合,每组数据在一块GPU上训练时长不超过10分钟。
将上述四种土壤样本的光谱数据输入到上述结构的三种模型中,得到土壤成分的预测结果。本发明从准确性,可解释性和过拟合三方面,通过对比试验,对上述三种模型的结果进行分析。
1.准确性对比。
混合模型准确性使用预测平均值(MPV)和相对均方误差(RMSE)进行评价。44个样本输入到混合模型的结果如表2所示:
表2四种样本输入到混合模型后的结果
Figure 74265DEST_PATH_IMAGE023
从表中结果可以看出,较小数据及较大数据的结果会产生较大的偏差,除此之外,大多数预测结果与真实标签较为接近。
为了体现混合模型在准确性上的提升,将结果分别和物理模型以及DenseNet结果进行对比。物理模型结果的对比中通过绘制预测值-真实值曲线,将两者定标曲线的拟合优度(R2)与相对误差大小相比较得到结果。为了说明混合模型的有效性,其中预测值使用留一法分别对每一组数据建模得到,但这样存在的问题是每次结果都是由不同的模型产生的。为了保证模型的可靠性,对每组数据进行过多次重复实验,发现在参数不变的情况下每组数据最终生成的结果差别不大,为了增加实验结果的说服力选取第一次训练的模型作为最终录入结果而不是最好的模型。
图4是本发明实施示例提供的内标法(即使用物理模型)绘制的定标曲线与混合模型拟合得到的定标曲线对比图。
其中,图4(a)为内标法绘制的铅的定标曲线。图4(b)为内标法绘制的铜的定标曲线。图4(c)为内标法绘制的锰的定标曲线。图4(d)为内标法绘制的铬的定标曲线。横轴均为元素含量,单位为ppm,纵轴均为光强。
其中,图4(e)为混合模型拟合得到的铅的定标曲线。图4(f)为混合模型拟合得到的铜的定标曲线。图4(g)为混合模型拟合得到的锰的定标曲线。图4(h)为混合模型拟合得到的铬的定标曲线。横轴均为标签值,单位为ppm,纵轴均为预测值,单位为ppm。
如图4(a)-(h)所示,在四种不同元素样本中,混合模型拟合的定标曲线的拟合优度R2均高于内标法绘制的定标曲线,并且混合模型定标曲线的标准差远低于内标法绘制定标曲线的标准差。因此,本发明所使用的混合模型优于传统的物理模型。
本实施示例中,通过回归指标RMSE将DenseNet结构的神经网络模型与本发明的混合模型进行对比,对比结果如表3所示:
表3 44种样本的DenseNet和本发明的混合模型RMSE对比
Figure 214259DEST_PATH_IMAGE024
在上表中,将较好的结果进行了加粗表示,相较于一般的DenseNet,混合模型在大多数情况下效果更好,并且除了铬元素以外,低浓度模型下均有明显提升。且在少数效果弱于DenseNet的情况中,二者相差并不很大。因此本发明的混合模型优于一般的神经网络模型。
2.过拟合对比。
过拟合的本质是由于神经网络对训练集数据过度拟合导致模型相较真实模型过于复杂。具体表现为在验证集上的损失值高于训练集上的损失值。对于LIBS光谱数据集,在大多数情况下使用神经网络会带来过拟合甚至严重过拟合,但是由于神经网络模型的不可解释性,这种过拟合无法避免,只能想办法降低过拟合带来的影响。
图5是本发明实施示例提供的混合模型训练损失曲线图。如图5所示,横轴为训练次数,纵轴为损失值。虚曲线表示训练曲线,实曲线表示评价曲线,竖直虚线左侧为第一阶段多元线性回归模型的训练过程,右侧为第二阶段神经网络模型的训练过程。从图5中可以看出,第一阶段几乎没发生过拟合,并且这一阶段占最终结果的大部分;第二阶段使用DenseNet对线性部分的残差进行拟合,可以看出在这一阶段开始时,训练损失快速下降而验证损失下降较小,发生了较为严重的过拟合。这一阶段的过拟合难以彻底避免,但是由于残差部分占最终结果的比例相对较小,一定程度上缓解了过拟合。
图6是本发明实施示例提供的混合模型和DenseNet神经网络模型相对均方误差对比图。其中横轴为元素序号,纵轴为相对均方误差。图6(a)是锰元素对应的相对均方误差对比图。图6(b)是铅元素对应的相对均方误差对比图。图6(c)是铜元素对应的相对均方误差对比图。图6(d)是铬元素对应的相对均方误差对比图。如图6所示,相比于一般的DenseNet神经网络,混合模型在解决过拟合问题方面有着一定的效果。由于锰元素效果最为明显,在这里以锰元素为例,两种模型最终结果在训练集上都有很好的表现(损失值低于5),对低浓度样本作为测试数据时,神经网络模型更容易发生过拟合,而混合模型则有效的降低了这种严重的过拟合。除此之外,在大多数情况下更低的RMSE也说明了在足够好的训练集表现下混合模型相比于一般的DenseNet过拟合更少一点。除铬元素外,其他元素有和锰元素相类似的结论。
3.可解释性对比。
对于一般的神经网络DenseNet模型,模型失效时往往无法从模型本身寻找问题所在。由于也无法得知模型建模的依据,给实际使用过程中带来了很大的隐患。混合模型相较于一般的神经网络DenseNet,其线性部分具有明确的物理含义,即保证线性部分的波长应为元素激发光强的波长。
通过查看模型线性部分的权重发现,在铅、铜、锰、铬四种元素的样本的混合模型中,线性部分权重较大的波长点分别在405.83nm、327.43nm、259.33nm、267.66nm附近,这与理论推导得到的元素特征谱线相同,这使得混合模型获得了一定的解释性。
通过这种解释性,可以对Cr元素低浓度时结果差(表2所示)进行分析。通过线性部分的权重,发现其主要作用的波长点在267.66nm附近。
图7是本发明实施示例提供的Cr元素光谱图。横轴为波长,纵轴为光谱强度,且在267.66nm画有标定线。图7(a)为Cr-1样本在267nm附近的强度曲线,图7(b)为Cr-11样本在267nm附近的强度曲线。如图7所示,在铬元素浓度较低时,267nm处的光谱未被有效激发出来。
本实施示例中,为了进一步测试模型的能力,额外配置了8种不同基底的土壤用来测试模型对不同基底情况下多元素的定量化效果。其中8种土壤样本分别含有不同含量的铬、砷、铜、镍、锌五种元素,分别通过DenseNet和本发明的混合模型对样本进行留一法定量化分析得到结果,如表4所示:
表4-4 DenseNet和混合模型在多元素定量化分析中的表现结果
Figure 404063DEST_PATH_IMAGE025
其中,元素种类后标出该元素最大浓度含量作为参考。表中结果说明混合模型在多元素效果上相比于普通的DenseNet模型有着明显提高;但由于结果并不能满足对多元素定量化结果准确度的要求,说明尽管混合模型对于不同基体的多元素定量化分析方面有很大的潜力,仍需对基体效应进一步研究。
本发明基于物理模型对神经网络模型进行了改进,在提高模型准确性的同时,增强了模型的可解释性并一定程度上缓解了模型的过拟合问题。通过与定标曲线法还有普通DenseNet实验结果的对比分析,说明了改进模型的有效性。并以此模型为基础,设计并实现了土壤元素定量化分析系统。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图8是本发明实施例提供的土壤成分检测系统的结构示意图。如图8所示,在一些实施例中,土壤成分检测系统8,包括:激光发射单元81、样品控制台82、接收单元83以及终端设备84;其中终端设备84用于执行如上任一实施例所示的土壤成分检测方法。
终端设备84用于控制激光发射单元81向样品控制台82上的待测土壤样本投射探测光;
终端设备84用于控制接收单元83采集待测土壤样本的光谱数据并发送给终端设备。
本发明所使用的土壤样本需要进行四个制备流程:稀释,烘干,球磨,压片。其中,稀释是为了方便向土壤中引入不同浓度含量的元素,烘干是为了提高实验效率,球磨让土壤中的元素分布均匀,通过压片机对土壤进行压片得到最终能够多次重复激发的样本。
图9是本发明另一实施例提供的土壤成分检测系统的结构示意图。如图9所示,在一些实施例中,激光发射单元81包括LIBS激光器91和光学聚焦系统92;接收单元83包括光谱仪93和收集系统94。
本实施例中,LIBS激光器91可以为气体激光器,固体激光器和半导体激光器等,在此不作限定。光学聚焦系统92主要有两方面作用:1.改变激光光路,使LIBS检测设备结构更加美观合理,使用更加方便;2.将激光能量汇聚在样品表面。一般聚焦系统由扩束镜,反射镜,聚焦透镜三部分组成,扩束镜用来增大激光直径,反射镜用来改变激光光路,聚焦透镜用来将扩束后的激光汇聚在物体表面。在实际使用时为了方便调整样品对焦,常常在聚焦系统中增加校准激光。可以通过观察定位激光与准直激光的重合位置,保证样品完成对焦。
针对不同的情况,样品的激发光路有水平光路激发和竖直光路激发两种。其中,水平光路激发的样品优点是光路简单,无需反射,能量损失小;垂直光路的优点在于对于液态物质同样可以进行激发。
收集系统93包括由两片凸透镜组成的收集透镜,与光谱仪相连的光纤,组成。光谱仪83的波长范围在200nm-430nm之间,光谱分辨率为0.1nm,每张光谱有3865个波长点。
基于上述的土壤成分检测系统,对配置好的土壤标样进行数据采集。采集过程中,对含有铅、铜、锰、铬四种元素不同浓度的44个样本分别收集光谱,其中每种样本收集400张光谱。在收集光谱过程中,要先对系统的暗噪声进行测量,然后在收集到的光谱中去掉暗噪声干扰;随后分20个点激发光谱,每个点收集二十张光谱,在收集光谱过程中,每个位置要先打3-5张光谱,待谱线稳定后再开始收集,防止样品表面存在杂质影响光谱的质量。
图10是本发明实施例提供的土壤成分检测装置的结构示意图。如图10所示,在一些实施例中,土壤成分检测装置10,包括:
获取模块1010,用于获取待测土壤样本的光谱数据。
预处理模块1020,用于对光谱数据进行预处理,以去除光谱数据中的噪声。
筛选模块1030,用于根据土壤样本待测元素,从预处理后的光谱数据中筛选一组与该元素相关的特征谱线。
计算模块1040,用于根据筛选出的特征谱线组输入预先训练的混合模型中,得到待测土壤样本中待测元素的含量。
其中,混合模型包括多个预先确定的拟合函数,每个拟合函数表示待测土壤样本的其中一种元素的含量和特定光谱强度组的对应关系;每个拟合函数表示与待测元素相关的特征谱线选择规则;每个拟合函数分为线性部分和非线性部分;线性部分通过多元线性回归模型拟合得到;非线性部分由神经网络模型拟合得到。
可选的,每个拟合函数为:
Figure 680324DEST_PATH_IMAGE026
其中,
Figure 179438DEST_PATH_IMAGE002
为所述线性部分,
Figure 541149DEST_PATH_IMAGE003
为非线性部分,C s 为该拟合函数对应的元素的含量,ω为所有发生能级跃迁的波长集合,w'为线性参数,由多元线性回归模型确定,I为特征谱线的谱线强度,λ为特征谱线的波长,k为常数,i为特征谱线的能级,ε(I)为误差函数,由神经网络模型确定。
可选的,混合模型通过以下步骤训练:
训练多元线性回归模型以确定线性参数;
固定线性参数并训练神经网络模型,以确定误差函数;
其中,多元线性回归模型和神经网络模型的训练过程均设置有防止过拟合的早停机制。
可选的,预处理模块1020,具体用于:
去除光谱数据中光谱仪的暗噪声后进行全谱积分归一化;
对全谱积分归一化后的光谱数据进行光谱叠加。
可选的,土壤成分检测装置10还包括:评价模块1050。
评价模块1050,具体用于:
计算同一类物质激发出的光谱的类内相对标准偏差和不同类物质激发出的光谱之间的类间相对标准偏差;
若类内相对标准偏差小于第一预设值且类间相对标准偏差大于第二预设值,则将预处理效果评价为优;
若类内相对标准偏差不小于第一预设值或类间相对标准偏差不大于第二预设值,则将预处理效果评价为差并重新执行对光谱数据进行预处理的步骤。
可选的,筛选模块1030,具体用于:
采用特征谱线筛选算法对光谱叠加后的光谱数据进行筛选,以得到待测土壤样本各待测元素的特征谱线。
可选的,神经网络模型为DenseNet结构的神经网络模型。
本实施例提供的土壤成分检测装置,可用于执行上述方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
图11是本发明实施例提供的终端设备的示意图。如图11所示,本发明的一个实施例提供的终端设备11,该实施例的终端设备11包括:处理器110、存储器111以及存储在存储器111中并可在处理器110上运行的计算机程序112。处理器110执行计算机程序112时实现上述各个土壤成分检测方法实施例中的步骤,例如图2所示的步骤101至步骤104。或者,处理器110执行计算机程序112时实现上述各系统实施例中各模块/单元的功能,例如图10所示模块1010至1030的功能。
示例性的,计算机程序112可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器111中,并由处理器110执行,以完成本发明。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序112在终端设备11中的执行过程。
终端设备11可以是单片机、MCU、桌上型计算机、笔记本、掌上电脑及等计算设备。终端可包括,但不仅限于,处理器110、存储器111。本领域技术人员可以理解,图11仅仅是终端设备11的示例,并不构成对终端设备11的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如终端还可以包括输入输出设备、网络接入设备、总线等。
所称处理器110可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列 (Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器111可以是终端设备11的内部存储单元,例如终端设备11的硬盘或内存。存储器111也可以是终端设备11的外部存储设备,例如终端设备11上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器111还可以既包括终端设备11的内部存储单元也包括外部存储设备。存储器111用于存储计算机程序以及终端所需的其他程序和数据。存储器111还可以用于暂时地存储已经输出或者将要输出的数据。
本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述土壤成分检测系统实施例中的步骤。
计算机可读存储介质存储有计算机程序112,计算机程序112包括程序指令,程序指令被处理器110执行时实现上述实施例方法中的全部或部分流程,也可以通过计算机程序112来指令相关的硬件来完成,计算机程序112可存储于一计算机可读存储介质中,该计算机程序112在被处理器110执行时,可实现上述各个方法实施例的步骤。其中,计算机程序112包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
计算机可读存储介质可以是前述任一实施例的终端的内部存储单元,例如终端的硬盘或内存。计算机可读存储介质也可以是终端的外部存储设备,例如终端上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)等。进一步地,计算机可读存储介质还可以既包括终端的内部存储单元也包括外部存储设备。计算机可读存储介质用于存储计算机程序及终端所需的其他程序和数据。计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种土壤成分检测方法,其特征在于,包括:
获取待测土壤样本的光谱数据;
对所述光谱数据进行预处理,以去除所述光谱数据中的噪声;
根据土壤样本待测元素,从预处理后的光谱数据中筛选一组与该元素相关的特征谱线;
根据筛选出的特征谱线组输入预先训练的混合模型中,得到待测土壤样本中待测元素的含量;
其中,所述混合模型包括多个预先确定的拟合函数,每个拟合函数表示待测土壤样本的其中一种元素的含量和特定光谱强度组的对应关系;每个拟合函数表示与待测元素相关的特征谱线选择规则;每个拟合函数分为线性部分和非线性部分;所述线性部分通过多元线性回归模型拟合得到;所述非线性部分由神经网络模型拟合得到。
2.根据权利要求1所述的土壤成分检测方法,其特征在于,每个拟合函数为:
Figure 183280DEST_PATH_IMAGE001
其中,
Figure 64780DEST_PATH_IMAGE002
为所述线性部分,
Figure 469216DEST_PATH_IMAGE003
为所述非线性部分,C s 为该拟合函数对应的元素的含量,ω为所有发生能级跃迁的波长集合,w'为线性参数,由所述多元线性回归模型确定,I为所述特征谱线的谱线强度,λ为所述特征谱线的波长,k为常数,i为所述特征谱线的能级,ε(I)为误差函数,由所述神经网络模型确定。
3.根据权利要求2所述的土壤成分检测方法,其特征在于,所述混合模型通过以下步骤训练:
训练多元线性回归模型以确定所述线性参数;
固定所述线性参数并训练所述神经网络模型,以确定所述误差函数;
其中,所述多元线性回归模型和所述神经网络模型的训练过程均设置有防止过拟合的早停机制。
4.根据权利要求1所述的土壤成分检测方法,其特征在于,所述对所述光谱数据进行预处理,包括:
去除光谱数据中光谱仪的暗噪声后进行全谱积分归一化;
对全谱积分归一化后的光谱数据进行光谱叠加。
5.根据权利要求4所述的土壤成分检测方法,其特征在于,在对所述光谱数据进行预处理之后,所述方法还包括:
计算同一类物质激发出的光谱的类内相对标准偏差和不同类物质激发出的光谱之间的类间相对标准偏差;
若类内相对标准偏差小于第一预设值且类间相对标准偏差大于第二预设值,则将预处理效果评价为优;
若类内相对标准偏差不小于第一预设值或类间相对标准偏差不大于第二预设值,则将预处理效果评价为差并重新执行对所述光谱数据进行预处理的步骤。
6.根据权利要求4所述的土壤成分检测方法,其特征在于,所述从预处理后的光谱数据中筛选待测土壤样本各待测元素的特征谱线,包括:
采用特征谱线筛选算法对光谱叠加后的光谱数据进行筛选,以得到待测土壤样本各待测元素的特征谱线。
7.根据权利要求1-6任一项所述的土壤成分检测方法,其特征在于,所述神经网络模型为DenseNet结构的神经网络模型。
8.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上的权利要求1至7中任一项所述土壤成分检测方法的步骤。
9.一种土壤成分检测系统,其特征在于,包括:激光发射单元、样品控制台、接收单元以及如上的权利要求8所述的终端设备;
所述激光发射单元用于向所述样品控制台上的待测土壤样本投射探测光;
所述接收单元用于采集所述待测土壤样本的光谱数据并发送给所述终端设备。
10.根据权利要求9所述的土壤成分检测系统,其特征在于,所述激光发射单元包括LIBS激光器和光学聚焦系统;所述接收单元包括光谱仪和收集系统。
CN202210738002.5A 2022-06-28 2022-06-28 土壤成分检测方法、设备及系统 Active CN114813709B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210738002.5A CN114813709B (zh) 2022-06-28 2022-06-28 土壤成分检测方法、设备及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210738002.5A CN114813709B (zh) 2022-06-28 2022-06-28 土壤成分检测方法、设备及系统

Publications (2)

Publication Number Publication Date
CN114813709A true CN114813709A (zh) 2022-07-29
CN114813709B CN114813709B (zh) 2022-10-04

Family

ID=82522288

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210738002.5A Active CN114813709B (zh) 2022-06-28 2022-06-28 土壤成分检测方法、设备及系统

Country Status (1)

Country Link
CN (1) CN114813709B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115931828A (zh) * 2023-02-17 2023-04-07 华谱智能科技(天津)有限公司 适应复杂土壤基体的成分分析与预测方法、单元及系统
CN117491343A (zh) * 2023-12-25 2024-02-02 北京市农林科学院智能装备技术研究中心 土壤有机质检测方法、装置及其系统
CN117848985A (zh) * 2024-03-06 2024-04-09 杭州泽天春来科技股份有限公司 气体浓度分析方法及装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5946640A (en) * 1995-06-08 1999-08-31 University Of Wales Aberystwyth Composition analysis
US20030231306A1 (en) * 2002-04-11 2003-12-18 Gornushkin Igor B. Automatic correction for continuum background in laser induced breakdown and Raman spectroscopy
JP2006038511A (ja) * 2004-07-23 2006-02-09 Tokyo Univ Of Agriculture & Technology 土壌分析方法及び土壌分析装置
CN101887012A (zh) * 2010-06-28 2010-11-17 中国国土资源航空物探遥感中心 基于光谱反射峰分解的高光谱遥感矿物含量定量反演方法
CN102636452A (zh) * 2012-05-03 2012-08-15 中国科学院长春光学精密机械与物理研究所 一种近红外光谱无损鉴别山参真伪的方法
CN104655595A (zh) * 2015-02-11 2015-05-27 北京农业智能装备技术研究中心 激光诱导击穿光谱的分析系统及方法
CN104697965A (zh) * 2015-03-10 2015-06-10 西北大学 一种基于最小二乘支持向量机结合激光诱导击穿光谱识别炉渣种类的方法
US20160235375A1 (en) * 2015-02-13 2016-08-18 Samsung Electronics Co., Ltd. Method and device for measuring a biological signal
CN113804657A (zh) * 2021-09-03 2021-12-17 中国科学院沈阳自动化研究所 一种基于多元回归结合稀疏自编码器光谱特征降维方法
CN114660105A (zh) * 2022-04-08 2022-06-24 成都理工大学 土壤重金属Cd含量反演方法、系统、介质、计算机设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5946640A (en) * 1995-06-08 1999-08-31 University Of Wales Aberystwyth Composition analysis
US20030231306A1 (en) * 2002-04-11 2003-12-18 Gornushkin Igor B. Automatic correction for continuum background in laser induced breakdown and Raman spectroscopy
JP2006038511A (ja) * 2004-07-23 2006-02-09 Tokyo Univ Of Agriculture & Technology 土壌分析方法及び土壌分析装置
CN101887012A (zh) * 2010-06-28 2010-11-17 中国国土资源航空物探遥感中心 基于光谱反射峰分解的高光谱遥感矿物含量定量反演方法
CN102636452A (zh) * 2012-05-03 2012-08-15 中国科学院长春光学精密机械与物理研究所 一种近红外光谱无损鉴别山参真伪的方法
CN104655595A (zh) * 2015-02-11 2015-05-27 北京农业智能装备技术研究中心 激光诱导击穿光谱的分析系统及方法
US20160235375A1 (en) * 2015-02-13 2016-08-18 Samsung Electronics Co., Ltd. Method and device for measuring a biological signal
CN104697965A (zh) * 2015-03-10 2015-06-10 西北大学 一种基于最小二乘支持向量机结合激光诱导击穿光谱识别炉渣种类的方法
CN113804657A (zh) * 2021-09-03 2021-12-17 中国科学院沈阳自动化研究所 一种基于多元回归结合稀疏自编码器光谱特征降维方法
CN114660105A (zh) * 2022-04-08 2022-06-24 成都理工大学 土壤重金属Cd含量反演方法、系统、介质、计算机设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
何秀文 等: "激光诱导击穿光谱技术/多元二次非线性回归分析土壤中的铬元素", 《分析化学研究报告》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115931828A (zh) * 2023-02-17 2023-04-07 华谱智能科技(天津)有限公司 适应复杂土壤基体的成分分析与预测方法、单元及系统
CN115931828B (zh) * 2023-02-17 2023-06-16 华谱智能科技(天津)有限公司 适应复杂土壤基体的成分分析与预测方法、单元及系统
CN117491343A (zh) * 2023-12-25 2024-02-02 北京市农林科学院智能装备技术研究中心 土壤有机质检测方法、装置及其系统
CN117491343B (zh) * 2023-12-25 2024-04-16 北京市农林科学院智能装备技术研究中心 土壤有机质检测方法、装置及其系统
CN117848985A (zh) * 2024-03-06 2024-04-09 杭州泽天春来科技股份有限公司 气体浓度分析方法及装置

Also Published As

Publication number Publication date
CN114813709B (zh) 2022-10-04

Similar Documents

Publication Publication Date Title
CN114813709B (zh) 土壤成分检测方法、设备及系统
ZHANG et al. Progress of chemometrics in laser-induced breakdown spectroscopy analysis
EP2710353B1 (en) SPECTROSCOPIC APPARATUS AND METHOD of DETERMINING COMPONENTS PRESENT IN A SAMPLE
Zhang et al. LIBS analysis of the ash content, volatile matter, and calorific value in coal by partial least squares regression based on ash classification
Fu et al. A fast variable selection method for quantitative analysis of soils using laser-induced breakdown spectroscopy
Fontana et al. Raman spectroscopic sensors for inorganic salts
Xu et al. Simultaneous determination of traces amounts of cadmium, zinc, and cobalt based on UV–Vis spectrometry combined with wavelength selection and partial least squares regression
Yang et al. Laser-induced breakdown spectroscopy quantitative analysis method via adaptive analytical line selection and relevance vector machine regression model
CN108398416A (zh) 一种基于激光拉曼光谱的混合物成分测定方法
WO2018184262A1 (zh) 用于激光诱导击穿光谱采集的阶梯光谱仪动态校正方法
Klus et al. Effect of experimental parameters and resulting analytical signal statistics in laser-induced breakdown spectroscopy
El Rakwe et al. Analysis of time‐resolved laser‐induced breakdown spectra by mean field‐independent components analysis (MFICA) and multivariate curve resolution–alternating least squares (MCR‐ALS)
Rao et al. Comparison of machine learning techniques to optimize the analysis of plutonium surrogate material via a portable LIBS device
Liu et al. Continuous background correction using effective points selected in third-order minima segments in low-cost laser-induced breakdown spectroscopy without intensified CCD
Lin et al. Quantitative multiple-element simultaneous analysis of seaweed fertilizer by laser-induced breakdown spectroscopy
Song et al. A random-forest-assisted artificial-neural-network method for analysis of steel using laser-induced breakdown spectroscopy
Ma et al. Small-sample stacking model for qualitative analysis of aluminum alloys based on femtosecond laser-induced breakdown spectroscopy
Bertsimas et al. Novel mixed integer optimization sparse regression approach in chemometrics
CN110867221A (zh) 基于太赫兹光谱的土壤含铅量预测模型确定方法及装置
Xie et al. Quantitative analysis of steel samples by laser-induced-breakdown spectroscopy with wavelet-packet-based relevance vector machines
US20220252516A1 (en) Spectroscopic apparatus and methods for determining components present in a sample
Zhang et al. A method derived from genetic algorithm, principal component analysis and artificial neural networks to enhance classification capability of laser-induced breakdown spectroscopy
CN112595706A (zh) 一种激光诱导击穿光谱变量选择方法及系统
Awasthi et al. New Insights on Modern Age Coins by Calibration-Free Laser-Induced Breakdown Spectroscopy Method and Chemometric Approaches
Guedes et al. Evaluation of univariate and multivariate calibration strategies for the direct determination of total carbon in soils by laser-induced breakdown spectroscopy: tutorial

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant