CN113592020B - 一种光谱传递方法、系统、介质及电子设备 - Google Patents

一种光谱传递方法、系统、介质及电子设备 Download PDF

Info

Publication number
CN113592020B
CN113592020B CN202110913924.0A CN202110913924A CN113592020B CN 113592020 B CN113592020 B CN 113592020B CN 202110913924 A CN202110913924 A CN 202110913924A CN 113592020 B CN113592020 B CN 113592020B
Authority
CN
China
Prior art keywords
spectrum
learning machine
data
extreme learning
elm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110913924.0A
Other languages
English (en)
Other versions
CN113592020A (zh
Inventor
张立
周婷
凌宗成
武中臣
沈中本
夏道华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN202110913924.0A priority Critical patent/CN113592020B/zh
Publication of CN113592020A publication Critical patent/CN113592020A/zh
Application granted granted Critical
Publication of CN113592020B publication Critical patent/CN113592020B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本公开提供了一种光谱传递方法、系统、介质及电子设备,获取目标样品通过第一LIBS仪器获得的光谱数据;根据获得的光谱数据和预设极限学习机模型,得到目标样品通过第二LIBS仪器得到的光谱数据;其中,预设极限学习机模型的输出权值矩阵根据隐藏层输出和正则项得到;本公开采用预设的极限学习机模型,实现了各个不同的LIBS设备测试得到的光谱数据的转移,避免了火星环境下测试结果与火星实验室中测试结果的差异。

Description

一种光谱传递方法、系统、介质及电子设备
技术领域
本公开涉及光谱数据处理技术领域,特别涉及一种光谱传递方法、系统、介质及电子设备。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术,并不必然构成现有技术。
激光诱导光谱技术(Laser-induced breakdown spectroscopy,LIBS)通过超短脉冲激光聚焦样品表面形成等离子体,对其释放出的原子发射光谱进行分析以确定样品的物质成分及含量。由于LIBS技术具有快速性,无损性,准确性等特质,其也被广泛应用到了太空领域的探索上。2012年发射的好奇者号上的ChemCam和于2020年发射的勇气号上的SuperCam以及2020年发射的“天问一号”上搭载的MarsCoDe都使用了LIBS去鉴别目标物的成分组成。
在对火星目标打出的光谱进行定量分析前,需要在地球实验室用足够多的样品建立在类似火星环境下的光谱库。在理想情况下,考虑到地面上的火星实验室(MSL)与“好奇者号”上的LIBS实验参数和仪器参数的相似性,对火星上的岩石目标进行定量分析时,可以直接使用地面样品所构成的geochemical library建立的定量回归模型。
但是,同一样品在地面实验室和火星上打出来的光谱是有显著差异的。例如,Shergottite样品在火星上打出来的光谱和其复制品在地面实验室中收集到的光谱显示在图1中,可以看出他们是十分不同的,这些差异造成的原因有:(1)激光能量的差异;(2)仪器到样本的距离不够一致;(3)实际的火星环境与模拟环境之间存在差异。
为了解决上述问题,研究人员大多采用线性校正的方式进行。为了保证一致性,它在火星和实验室仪器在最大能量为14mj/pluse时采集光谱,得到6个火星光谱和6个实验室光谱在同一校准目标上的比值,通过平均这6个光谱的比值就得到了一个包含逐像素校正因子的单一矢量。但是,这个方法在研究人员感兴趣的波长范围上的校正结果较差。
在近红外光谱领域,有研究人员提出了一些模型传递方法来解决这个问题。一般来说,有两种方法可以用来解决这个问题。首先,对整个数据集的每个光谱(仪器)进行重新采样,建立新的定标模型,该方法的不足之处在于无法对每台仪器建立标定模型,且成本和时间较长。其次,通过一系列的线性或非线性修正工具、环境或实验差异,然后利用标定模型预测未知样品的目标成分。与第一种方法相比,这种方法具有避免重构标定模型的优点。它们在近红外光谱和化学计量学领域被称为“校准迁移”,在机器学习和数据挖掘领域被称为“迁移学习”。
目前,许多科学家对这一问题进行了研究,提出了许多标定传递方法。总的来说,所有这些方法可以分为三类。第一类方法通过经典的预处理方法,如去趋势、基线校正、一阶和二阶导数、乘法散射校正(MSC)、标准正态变量(SNV)变换、正交信号校正(OSC)和有限脉冲响应(FIR)滤波。第二类是通过变换矩阵将从谱仪的谱图映射到主谱仪。最常用的标准化方法包括直接标准化(DS)和分段直接标准化(PDS)。与第二类类似,校准转移方法属于第三类,也通过转换矩阵传递主从光谱仪的光谱。但是,转换矩阵是在一个新的特征子空间中非线性构建的,而不是线性转换的数据集,从而导致光谱传递的结果不准确。
发明内容
为了解决现有技术的不足,本公开提供了一种光谱传递方法、系统、介质及电子设备,采用预设的极限学习机模型,实现了各个不同的LIBS设备测试得到的光谱数据的转移,避免了火星环境下测试结果与火星实验室中测试结果的差异,实现了火星环境光谱测试结果与火星实验室光谱测试结果的更精准对应。
为了实现上述目的,本公开采用如下技术方案:
本公开第一方面提供了一种光谱传递方法。
一种光谱传递方法,包括以下过程:
获取目标样品通过第一LIBS仪器获得的光谱数据;
根据获得的光谱数据和预设极限学习机模型,得到目标样品通过第二LIBS仪器得到的光谱数据;
其中,预设极限学习机模型的输出权值矩阵根据隐藏层输出和正则项得到。
进一步的,所述第一LIBS仪器为火星实验室中的光谱测试设备,第二LIBS仪器为火星车上的光谱测试设备。
进一步的,所述预设限学习机模型为单层极限学习机模型。
进一步的,预设极限学习机模型的训练中,以第一LIBS仪器获得的光谱数据为输入,以第二LIBS仪器得到的光谱数据为输出。
进一步的,所述第一LIBS仪器和第二LIBS仪器均为火星实验室中的光谱测试设备,两者的测试间隔预设时间。
更进一步的,第一LIBS仪器和第二LIBS仪器为同一台设备或者同一火星实验室的不同设备。
更进一步的,预设极限学习机模型为与自动编码器相结合的深层极限学习机,使用偏最小二乘算法对深层极限学习机传递后的光谱进行主成分的定量回归,采用交叉验证的方式确定最优的潜在因素数量。
本公开第二方面提供了一种光谱传递系统。
一种光谱传递系统,包括:
数据获取模块,被配置为:获取目标样品通过第一LIBS仪器获得的光谱数据;
光谱传递模块,被配置为:根据获得的光谱数据和预设极限学习机模型,得到目标样品通过第二LIBS仪器得到的光谱数据;
其中,预设极限学习机模型的输出权值矩阵根据隐藏层输出和正则项得到。
本公开第三方面提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如本公开第一方面所述的光谱传递方法中的步骤。
本公开第四方面提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本公开第一方面所述的光谱传递方法中的步骤。
与现有技术相比,本公开的有益效果是:
1、本公开所述的光谱传递方法、系统、介质及电子设备,采用预设的极限学习机模型,实现了各个不同的LIBS设备测试得到的光谱数据的转移,避免了火星环境下测试结果与火星实验室中测试结果的差异,实现了火星环境光谱测试结果与火星实验室光谱测试结果的更精准对应。
2、本公开所述的光谱传递方法、系统、介质及电子设备,第一LIBS仪器和第二LIBS仪器均为火星实验室中的光谱测试设备时,预设极限学习机模型为与自动编码器相结合的深层极限学习机,使用偏最小二乘算法对深层极限学习机传递后的光谱进行主成分的定量回归,采用交叉验证的方式确定最优的潜在因素数量,在实现有效的光谱传递的基础上实现了大批量数据的快速处理。
本公开附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。
附图说明
构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。
图1为背景技术中提供的火星和地球数据集中Shergottite样品的LIBS光谱。
图2为本公开实施例1提供的好奇号火星车上的ChemCam仪器组上携带的CCCT样品板。
图3为本公开实施例1提供的极限学习机的网络结构示意图。
图4为本公开实施例1提供的引入自动编码器的深层极限学习机的网络结构示意图。
图5为本公开实施例1提供的转移前后实验室光谱和火星光谱的详细差异。
图6为本公开实施例1提供的对Shergottite样品的实验室光谱、采用ELM算法校正后的实验室光谱以及火星光谱的展示对比。
图7为本公开实施例1提供的实验室光谱以及校正后实验室光谱与火星光谱的强度差异图。
图8为本公开实施例1提供的对Shergottite样品的实验室光谱、采用线性校正算法校正后的实验室光谱以及火星光谱的展示对比。
图9为本公开实施例1提供的实验室光谱以及线性校正后实验室光谱与火星光谱的强度差异图。
图10为本公开实施例1提供的280nm和400nm处的校正示意图。
图11为本公开实施例1提供的将预测的总积分强度与所有样品在实际全光谱范围(240nm-900nm)的实际积分强度的比较。
图12为本公开实施例1提供的在包含Fe、Na、Si和Ti线的特定波长范围内,预测和实际积分光谱的相关性。
具体实施方式
下面结合附图与实施例对本公开作进一步说明。
应该指出,以下详细说明都是示例性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
实施例1:
本公开实施例1提供了一种光谱传递方法,包括以下过程:
获取目标样品通过第一LIBS仪器获得的光谱数据(即从光谱数据);
根据获得的光谱数据和预设极限学习机模型,得到目标样品通过第二LIBS仪器得到的光谱数据(即主光谱数据);
其中,预设极限学习机模型的输出权值矩阵根据隐藏层输出和正则项得到。
具体的,包括以下内容:
S1:构建数据集
应用于本研究的数据集共有两个部分。第一份数据集是CCCT数据集,它由好奇号上携带的定标板,如图2所示,图片上标注了每个圆盘上的样品名称,它的标准样品分别在地球上的火星实验室和在火星上的好奇者号上获得,分别称为做地球数据集和火星数据集。
考虑到火星表面的全球矿物学征,所以CCCT合成或天然目标的化学成分选择必须与预期的岩石和土壤成分一致,Macusani、Picritic、Shergottite、Norite这四种成分被选来模拟火星表面预期的岩石,为了校正的一致性,选取了7个样品的实验室和火星光谱。
样品的物理形态为粉末、玻璃和陶瓷,粉末被碾碎并压成球团,样品量约为3.5g。每个准备好的样品随后被放置在一个充满9.3兆巴压力的二氧化碳的真空室中,以模拟火星大气压力。采用1067nm、脉冲能量14mJ、重复频率3Hz的激光器。激光束通过直径为110mm的望远镜投射到1.56m的靶标上,并收集了返回的等离子体发射信号。然后在每个样品上烧蚀5个不同的点,每个点烧蚀50次,获得LIBS光谱。
每个样品总共产生250个光谱,光谱记录在240.1-342.2nm(紫外)、382.1-469.3nm(紫外)和474.0-906.5nm(可见光和近红外)三个波长范围内。由于样品数量较小,在选择训练集和测试集时,使用留一交叉法,依次选择每个CCCT样品作为测试集,剩下的六个样品作为训练集,共做7次实验。
由于定标板上的样品不可能太多,所以CCCT数据集较小,为了更好的验证本实施例方法的稳健性与适应性,又选择了另一份数据集包含55个样品在不同的LIBS光谱仪上测量的光谱。这份数据集同样来自某火星实验室,其中主仪器光谱是由2015年ChemCam团队测量414个标准样品得到的LIBS光谱,而从仪器光谱是由2010年ChemCam团队测量67个标准样品得到的LIBS光谱组成的。
在一致性的前提下,本实施例将两份数据集中相同的56个样品挑选出来组成传递样品集。岩石类型分类在岩石数据集中的比例如图4所示。用Kennard-S分割方法将样本集分成两组,一个是训练集,另一个是独立的测试集,然后训练集被分成两组,由Kennard-S分裂方法,一个是校准集,另一个是验证集。将56个样本分为3组:38个校准样本、7个验证样本和11个独立测试样本。之后,通过来自主仪器的414个样品的数据集建立PLS2定量回归模型,通过回归模型来检验本实施例传递工作的好坏。
S2:极限学习机(ELM)
ELM算法本质上是一种单隐层前馈网络(SLFNs),ELM算法具有通用高效的逼近能力,其结构图如图3所示。与反向传播或共轭梯度下降训练算法不同,ELM理论表明广义前馈网络的隐藏节点是重要的,但不需要调整,这些隐藏节点可以随机生成。所有隐藏的节点参数都独立于目标函数或训练数据集。将输入数据映射到l维ELM随机特征空间。给定一个包含N个不同数据样本(xk,yk)∈Rl×Rs的监督学习问题,其训练过程包含两个阶段:①根据隐藏层节点数,随机生成输入权值矩阵W和阈值b,计算出隐含层输出;②根据数据标签求解得到输出矩阵β,其模型为:
其中,g(·)为激活函数,常用的为sigmoid函数和tanh函数;H为隐藏层输出;β=[β1,β2,…,βl]为输出层权值,本实施例采用的是sigmoid函数,其表达式为ELM的输出权值矩阵β的求解模型可由H和Y=(y1,y2,…,yn)的摩尔彭罗斯广义逆计算:
β=H+Y (2)
为了提高泛化性能,使解更加鲁棒,本实施例添加正则化项:
其中:目标函数的括号内为正则项,C为惩罚因子。
S2:深层极限学习机(DELM)
DELM是一种将自编码的思想与ELM相结合,产生的深层网络结构,其结构如图4所示。DELM将ELM的学习效率与自编码器(AE)的深层结构相融合,以获得更好的预测性能。由于经典ELM算法是一种有监督学习算法,而在DELM的深层结构中,数据在降维过程中是没有标签矩阵的,因此将其与自编码器相结合,通过最小化重构误差来逼近原始输入矩阵。
DELM的结构分为两部分:①无监督特征学习;②监督特征回归。第1部分是采用ELM-AE的结构来逐层获取数据的压缩表示,首先通过式H=g(wx+b)将输入数据x映射到隐藏层H,其中:w为输入权重,通过随机生成产生b为偏置,隐藏层参数通过求解下式获得:
第2部分是采用经典的ELM监督学习算法进行回归,ELM算法能够充分利用样本的标签信息,从降维后的样本中提取出数据的隐藏信息,提高算法的分类性能。此处的自编码结构与传统的深度自编码网络并不相同,一旦提取了前1个隐藏层的特征,则该层的权重和参数都将固定,不需要如同深度自编码网络一样仍需通过反向传播进行微调。因此,DELM的训练速度比BPNN,DAE等反向传播算法更加快速。
相比于单层ELM,由于DELM自编码的逐层降维的训练方式,在面对复杂高维数据时,往往能取得更好的测试效果。DELM能够从原始数据中无监督逐层提取出其压缩表示,并在最后一层有监督分类时充分利用数据的标签信息,以此能够获得更好的效果。所以对样品数量更多更为复杂的第二个数据集使用DELM算法。
S3:用ELM和DELM进行光谱传递
本实施例中,主光谱和从光谱是从同一样品,但在不同的光谱仪(主仪器和从仪器)上产生的。在CCCT数据集数据集中,主光谱是好奇号火星车上携带的ChemCam仪器组中的LIBS仪器产生的,从光谱是地球上的火星实验室中的备份样机用激光击打备份样品得到的;在岩石数据集中,主光谱和从光谱是某研究团队在火星实验室(MSL)分别对同样的标准样品在2010年和2012年产生的光谱组成的光谱集。同一样品的主谱和从谱具有本质上相同的化学信息,它们的差异主要来自于仪器之间的系统差异。因此,使用ELM和DELM被用来寻找主从光谱之间的转移关系。
传递的整个过程可以分为3步:
步骤1:将样品的主谱数据集划分为训练集和测试集两大部分(Cm,Tm);对应样品的从光谱同样分为训练集和测试集(Cs,Cs)。而岩石数据集中,除了训练集和测试集,还分出了验证数据集Cv用来调整模型参数,主要包括隐藏层层数,节点数以及正则项参数。
步骤2:将从谱数据集Cs作为输入端,主谱数据集Cm作为输出端训练ELM以及DELM模型,训练模型。
步骤3:将从谱数据集的测试光谱输入到训练好的模型中,得到从从仪器到主仪器的转移光谱。
S4:结论分析
因为定标板需要搭载火星车飞入火星,这就决定了板上的样品不可能太多,为了保证运行速度和模型的大小,本实施例中,对该CCCT样品集使用单层的ELM算法,并可以实现预期的传递效果。为了实现LIBS领域通用的一般的光谱传递,使用一个更为复杂样品更多的岩石样品集来验证本实施例的方法的传递效果,对于该样品集,单隐层的ELM算法的特征提取能力传递能力不够,本实施例使用和自动编码器相结合的深层极限学习机来进行传递。之后使用偏最小二乘算法对传递后的光谱进行主成分的定量回归,采用10倍交叉验证的方法确定了最优的潜在因素数量。定量回归模型是由主仪器对样品打出来的光谱建立的,之后在独立测试集(RMSEP)上用均方根误差(RMSEP)评估预测性能。
S4.1:CCCT数据集
利用ELM算法将实验室获得的CCCT样品的光谱转移到火星光谱的数据分布中,得到的转移光谱与火星光谱明显接近。在图5中,本实施例选择了两个光谱段(440-490nm和520-650nm)来展示转移前后实验室光谱和火星光谱的详细差异,具体的图5中,左边显示了未校准的Shergottite样品在440-490nm和520-650nm处的实验室光谱与好奇号火星上获得的光谱比较结果,右边显示了ELM算法校准后的实验室光谱与火星上获得的光谱比较结果.
从图6、图7、图8和图9中可以看出,同一样品的实验室光谱与火星的光谱有很大的差异,包括强度、光谱峰形、峰移等,差异具有明显的非线性。经过ELM算法的校正,该差值得到了很好的校正,可以看出ELM算法校正后的数据和火星数据更加一致,在差异图中,也可以看出,校正后的数据差异是要远远小于未校正的数据差异,而使用线性校正的对比图,则没有达到比较好的效果。
通过观察差异图,注意到280nm和400nm附近有比较明显的未校正好的差异,将这两个波长范围附近的光谱放大,正如图10所示,在280纳米处的峰是Ti线,在395nm处的峰是Ga线。这两个元素谱线峰值因为在实验室条件和火星条件下的差距过大,因此在校正过后也存在一定的误差。
为了更好的对比校正的效果,引入了一个强度差的概念,将预测数据与实际数据在各个波长点的强度差的和比上实际光谱的强度和,在本实施例中,实际数据为CCCT数据在火星上的好奇者号上得到的LIBS光谱公式如下式所示:
表1分别显示了不同calibration transfer方法对7个CCCT样品传递后光谱和实际光谱的差异,包括线性校正和本实施例使用的ELM算法,以及在红外光谱calibrationtransfer领域比较经典且经常使用的PDS算法,进行了比较。
表1所列的结果清楚地表明,ELM的预测误差都远低于线性校正和PDS算法。由于样品不多,为了更清楚的显示出效果,将每一个样品做测试集,共做了7次实验,每个样品的结果如表1所示。表2展示了每个样品火星光谱与校正后的实验光谱的皮尔逊相关系数,其中ELM算法的传递效果表现得最好。
表1:
表2:
S4.2:岩石数据集
对于样品和种类增多的岩石数据集,单隐层的极限学习机网络结构难以再达到比较好的传递效果,使用引入了自编码器的深层极限学习机。表3表示了ELM和DELM在岩石数据集上的传递效果表现,其中为了评估子集样本数量对不同校准方法的影响,分别考虑了20、30和40个标准化样本。从结果可以推断,传递样本越多,传递效果越好。无论标准化样本是多少个,DELM都是优于ELM的表现的。
表3:
图10比较了预测的总积分强度与实际上的全光谱范围(240-900nm)所有样品的实际光谱的总积分强度之间的相关性。在一一对应线上的所有样本表明,实际值与预测值之间存在显著的高相关性。注意到,尽管由于样本的异质性和取样(即对这些样本的询问/消融点/位置的选择),一些样本的综合光谱存在显著差异,但还是获得了这一结果。
除了在总积分强度上作比较,还把感兴趣的一些特征元素的谱峰强度拿出来作比较,横坐标为预测的强度,纵坐标为其真实强度。共选取了Fe、Mg、Si、Na四种特征特征元素,将其谱峰强度对比图列在了图12中,可以看到其大体遵循1:1的比例趋势。
S4.3:定量分析
进行光谱传递的最终目的为了服务于定量分析,建立了一个PLS2模型,为了检验光谱传递的效果。对于CCCT数据集,将火星上测得的CCCT样品光谱向ChemCam408样品光谱的数据分布迁移;对于岩石dataset,使用ChemCam年发布的408个岩石样品的LIBS光谱数据作为定量分析模型的训练数据,将传递前后的CCCT样品光谱和ChemCam 2010年发布的56个样品的LIBS光谱数据作为测试集以检验其传递后的定量分析精度是否提升。在偏最小二乘的定量回归模型中,选择53个潜在因素数。
表4:
从表中可以看出,经过ELM对CCCT dataset的传递以及DELM-AE对standardsample dataset的传递,传递后的光谱在定量分析上的表现明显提升了,只有在CCCT的dataset数据集里的KGa-2-Med-S样品出现了相反的趋势,但是对于该样品的重新在火星上采集的光谱进行定量分析发现,该样品即使重新采集,在定量分析模型中的表现依然不好,对火星和实验室KGa-2-Med-S光谱的检测表明,出现了几条新的发射谱线,包括Mg(280,285nm)和Ca(315,317,393,396,422nm)。
火星数据中观测到的新线可能有两个原因。首先,KGaMed-S不像其他目标那样同质。有可能这两个KGaMed-S靶的探针表面确实在化学上不同。另一种可能是,无处不在的火星尘埃可能已经嵌入目标的表面,改变了平均成分,并导致新的发射线。对于岩石数据集要注意的是,这两份数据集分别于2010年和2013年某火星实验室(MSL)被得到,在实验仪器的设置上虽然相同,但是实验条件以及样品情况都有一些改变,它们的光谱相比CCCT数据集有很大的不同,所以这份数据集的传递是有困难的,本实施例选择增加网络复杂程度以及加入自动编码器(AE)用来提取更深层次更准确的特征,从而来提升效果。
在本实施例中,提出了ELM和DELM分别应用于小型和大型的LIBS光谱数据传递。用CCCT数据集和岩石数据集的校正结果在两个维度上表明,这两种方法是稳定的,可以成功地校正不同仪器获得的光谱之间的系统差异,一方面是对于光谱本身的校正有效果,另一方面是将校正后的光谱输入定量分析模型,得到了较好的效果。在大多数情况下,ELM和DELM也可以使用少量的校准集来建立传输关系,从而获得最佳的RMSEPs。这些优点保证了本研究提出的方法是准确和实用的方法,将从仪器的光谱转移到一个建立良好的和维护的校准模型,很少的转移样本,这消除了昂贵和耗时的重新校准。
实施例2:
本公开实施例2提供了一种光谱传递系统,包括:
数据获取模块,被配置为:获取目标样品通过第一LIBS仪器获得的光谱数据;
光谱传递模块,被配置为:根据获得的光谱数据和预设极限学习机模型,得到目标样品通过第二LIBS仪器得到的光谱数据;
其中,预设极限学习机模型的输出权值矩阵根据隐藏层输出和正则项得到。
所述系统的工作方法与实施例1提供的光谱传递方法相同,这里不再赘述。
实施例3:
本公开实施例3提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如本公开实施例1所述的光谱传递方法中的步骤。
实施例4:
本公开实施例4提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本公开实施例1所述的光谱传递方法中的步骤。
本领域内的技术人员应明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。

Claims (6)

1.一种光谱传递方法,其特征在于:包括以下过程:
获取目标样品通过第一LIBS仪器获得的光谱数据;
根据获得的光谱数据和预设极限学习机模型,得到目标样品通过第二LIBS仪器得到的光谱数据;
其中,预设极限学习机模型的输出权值矩阵根据隐藏层输出和正则项得到;
所述第一LIBS仪器为火星实验室中的光谱测试设备,第二LIBS仪器为火星车上的光谱测试设备;
所述预设极限学习机模型的训练中,以第一LIBS仪器获得的光谱数据为输入,以第二LIBS仪器得到的光谱数据为输出;
所述预设极限学习机模型为与自动编码器相结合的深层极限学习机,使用偏最小二乘算法对深层极限学习机传递后的光谱进行主成分的定量回归,采用交叉验证的方式确定最优的潜在因素数量;
所述深层极限学习机是一种将自编码的思想与ELM相结合,产生的深层网络结构;
所述深层极限学习机的结构包括:无监督特征学习、监督特征回归;
所述无监督特征学习是采用ELM-AE的结构来逐层获取数据的压缩表示,首先通过式H=g(wx+b)将输入数据x映射到隐藏层H,其中:w为输入权重,通过随机生成产生,b为偏置,隐藏层参数通过求解下式获得: 其中,H为隐藏层,X为输入数据;
所述监督特征回归是采用经典的ELM监督学习算法进行回归,ELM算法能够充分利用样本的标签信息,从降维后的样本中提取出数据的隐藏信息;
所述ELM-AE是所述深层极限学习机将所述ELM的学习效率与自编码器的深层结构的融合。
2.如权利要求1所述的光谱传递方法,其特征在于:
所述第一LIBS仪器和第二LIBS仪器均替换为火星实验室中的光谱测试设备,两者的测试间隔预设时间。
3.如权利要求2所述的光谱传递方法,其特征在于:
第一LIBS仪器和第二LIBS仪器为同一台设备或者同一火星实验室的不同设备。
4.一种光谱传递系统,其特征在于:包括:
数据获取模块,被配置为:获取目标样品通过第一LIBS仪器获得的光谱数据;
光谱传递模块,被配置为:根据获得的光谱数据和预设极限学习机模型,得到目标样品通过第二LIBS仪器得到的光谱数据;
其中,预设极限学习机模型的输出权值矩阵根据隐藏层输出和正则项得到;
所述第一LIBS仪器为火星实验室中的光谱测试设备,第二LIBS仪器为火星车上的光谱测试设备;
所述预设极限学习机模型的训练中,以第一LIBS仪器获得的光谱数据为输入,以第二LIBS仪器得到的光谱数据为输出;
所述预设极限学习机模型为与自动编码器相结合的深层极限学习机,使用偏最小二乘算法对深层极限学习机传递后的光谱进行主成分的定量回归,采用交叉验证的方式确定最优的潜在因素数量;
所述深层极限学习机是一种将自编码的思想与ELM相结合,产生的深层网络结构;
所述深层极限学习机的结构包括:无监督特征学习、监督特征回归;
所述无监督特征学习是采用ELM-AE的结构来逐层获取数据的压缩表示,首先通过式H=g(wx+b)将输入数据x映射到隐藏层H,其中:w为输入权重,通过随机生成产生,b为偏置,隐藏层参数通过求解下式获得: 其中,H为隐藏层,X为输入数据;
所述监督特征回归是采用经典的ELM监督学习算法进行回归,ELM算法能够充分利用样本的标签信息,从降维后的样本中提取出数据的隐藏信息;
所述ELM-AE是所述深层极限学习机将所述ELM的学习效率与自编码器的深层结构的融合。
5.一种计算机可读存储介质,其上存储有程序,其特征在于,该程序被处理器执行时实现如权利要求1-3任一项所述的光谱传递方法中的步骤。
6.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-3任一项所述的光谱传递方法中的步骤。
CN202110913924.0A 2021-08-10 2021-08-10 一种光谱传递方法、系统、介质及电子设备 Active CN113592020B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110913924.0A CN113592020B (zh) 2021-08-10 2021-08-10 一种光谱传递方法、系统、介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110913924.0A CN113592020B (zh) 2021-08-10 2021-08-10 一种光谱传递方法、系统、介质及电子设备

Publications (2)

Publication Number Publication Date
CN113592020A CN113592020A (zh) 2021-11-02
CN113592020B true CN113592020B (zh) 2023-08-22

Family

ID=78256849

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110913924.0A Active CN113592020B (zh) 2021-08-10 2021-08-10 一种光谱传递方法、系统、介质及电子设备

Country Status (1)

Country Link
CN (1) CN113592020B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108152239A (zh) * 2017-12-13 2018-06-12 东北大学秦皇岛分校 基于特征迁移的样品成分含量测定方法
CN108197650A (zh) * 2017-12-30 2018-06-22 南京理工大学 局部相似性保持的高光谱图像极限学习机聚类方法
CN110469561A (zh) * 2019-09-16 2019-11-19 深圳江行联加智能科技有限公司 一种液压系统状态监测的装置、方法与系统
CN110736707A (zh) * 2019-09-16 2020-01-31 浙江大学 一种主仪器向从仪器光谱模型传递的光谱检测优化方法
CN113111958A (zh) * 2021-04-23 2021-07-13 中南大学 一种基于cnn-svr模型和迁移学习的光谱模型传递方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110455722A (zh) * 2019-08-20 2019-11-15 中国热带农业科学院橡胶研究所 橡胶树叶片磷含量高光谱反演方法和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108152239A (zh) * 2017-12-13 2018-06-12 东北大学秦皇岛分校 基于特征迁移的样品成分含量测定方法
CN108197650A (zh) * 2017-12-30 2018-06-22 南京理工大学 局部相似性保持的高光谱图像极限学习机聚类方法
CN110469561A (zh) * 2019-09-16 2019-11-19 深圳江行联加智能科技有限公司 一种液压系统状态监测的装置、方法与系统
CN110736707A (zh) * 2019-09-16 2020-01-31 浙江大学 一种主仪器向从仪器光谱模型传递的光谱检测优化方法
CN113111958A (zh) * 2021-04-23 2021-07-13 中南大学 一种基于cnn-svr模型和迁移学习的光谱模型传递方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
A Mars Environment Chamber Coupled with Multiple In Situ Spectral Sensors for Mars Exploration;Zhongchen Wu等;《sensors》;第1-12页 *

Also Published As

Publication number Publication date
CN113592020A (zh) 2021-11-02

Similar Documents

Publication Publication Date Title
Yan et al. A novel hybrid feature selection strategy in quantitative analysis of laser-induced breakdown spectroscopy
Anderson et al. Post-landing major element quantification using SuperCam laser induced breakdown spectroscopy
Berta et al. Measures of galaxy dust and gas mass with Herschel photometry and prospects for ALMA
Rossel et al. Predicting soil properties from the Australian soil visible–near infrared spectroscopic database
Finlator et al. The physical and photometric properties of high-redshift galaxies in cosmological hydrodynamic simulations
Hobbs et al. Simulation-based uncertainty quantification for estimating atmospheric co _2 from satellite data
CN109521437B (zh) 面向植被生化参数探测的多光谱激光雷达波长选择方法
Dong et al. Combination of machine learning and VIRS for predicting soil organic matter
Scott et al. Error and uncertainty in radiocarbon measurements
Ewusi-Annan et al. Automatic preprocessing of laser-induced breakdown spectra using partial least squares regression and feed-forward artificial neural network: Applications to Earth and Mars data
Gambino et al. Neural network approach to B→ X u ℓ ν
Kühnel et al. I n‐situ prediction of soil organic carbon by vis–NIR spectroscopy: an efficient use of limited field data
Matarrese et al. Baryonic acoustic oscillations via the renormalization group
Xiao et al. Defining the scope for altering rice leaf anatomy to improve photosynthesis: a modelling approach
Zhang et al. Application of swarm intelligence algorithms to the characteristic wavelength selection of soil moisture content
Viskari et al. Calibrating the soil organic carbon model Yasso20 with multiple datasets
Chen et al. Probabilistic multivariable calibration for major elements analysis of MarSCoDe Martian laser-induced breakdown spectroscopy instrument on Zhurong rover
Beneke et al. Cosmological Correlators in massless ϕ4-theory and the Method of Regions
Lu et al. Incorporating eco-evolutionary information into species distribution models provides comprehensive predictions of species range shifts under climate change
CN113592020B (zh) 一种光谱传递方法、系统、介质及电子设备
Bai et al. Application of elastic net in quantitative analysis of major elements using Martian laser-induced breakdown spectroscopy datasets
Chien et al. Jet angularities in dijet production in proton-proton and heavy-ion collisions at RHIC
Zhang et al. Application of deep learning in laser-induced breakdown spectroscopy: a review
Reyes-Muñoz et al. Inferring global terrestrial carbon fluxes from the synergy of Sentinel 3 & 5P with Gaussian process hybrid models
Baisden et al. Using 50 years of soil radiocarbon data to identify optimal approaches for estimating soil carbon residence times

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant