CN113177919A - Libs与深度学习结合的岩性分类及主量元素含量检测方法 - Google Patents
Libs与深度学习结合的岩性分类及主量元素含量检测方法 Download PDFInfo
- Publication number
- CN113177919A CN113177919A CN202110466871.2A CN202110466871A CN113177919A CN 113177919 A CN113177919 A CN 113177919A CN 202110466871 A CN202110466871 A CN 202110466871A CN 113177919 A CN113177919 A CN 113177919A
- Authority
- CN
- China
- Prior art keywords
- layer
- libs
- lithology
- classification
- rock
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/71—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light thermally excited
- G01N21/718—Laser microanalysis, i.e. with formation of sample plasma
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/71—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light thermally excited
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Immunology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Plasma & Fusion (AREA)
- Optics & Photonics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Quality & Reliability (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明属于岩石检测技术领域,具体涉及一种LIBS与深度学习结合的岩性分类及主量元素含量检测方法。本发明的方法包括如下步骤:(1)输入岩石样本的LIBS光谱数据;(2)通过CNN模型得到岩性分类和主量元素含量的结果;其中,所述CNN模型的结构包括共享部分、岩性分类部分和元素定量部分;共享部分从LIBS光谱数据中识别和提取的特征;岩性分类部分根据特征预测所述岩性分类的结果;元素定量部分对特征进行进一步提取后预测所述岩石样本中主量元素含量的结果。本发明提供的LIBS与CNN相结合的方法能够同时进行岩性识别和岩石样品中7种主量元素定量分析。本发明的方法在复杂基质效应和相似化学成分的岩石岩性识别和定量分析方面均具有很好的预测性能。
Description
技术领域
本发明属于岩石检测技术领域,具体涉及一种LIBS与深度学习结合的岩性分类及主量元素含量检测方法。
背景技术
岩石的岩性识别和元素浓度分析在地质学和地球化学调查中具有重要意义。这是由于不同岩性中元素的浓度差异能够反映沉积条件的变化。在对岩石的岩性进行识别和对元素浓度进行分析的过程中,人们采用了各种分析技术对岩石进行分析,以提高提高地质学和地球化学勘查的效率和精度。然而,由于基质效应和岩石中相似的成分使这些目标仍具有挑战性。此外,现有的分析技术通常不能够同时满足高精度和高效率的需求。
为了解决上述问题,基于原子发射光谱(AES)技术的激光诱导击穿光谱(LIBS)也被用于进行了地质样本的分析。LIBS可以检测物质的多元素信息和分子信息,LIBS光谱中的特征谱线含有元素组分的指纹信息,可用于化学成分的定性和定量分析。LIBS具有实时在线、仅需要少量样品、分析速度快、样品损耗量低和成本相对低廉等优点,在矿石勘探、工业分析、食品分析、塑料分类、冶金分析和环境分析等多个领域得到了广泛的应用。
在地质样本分析领域中,最著名的LIBS仪器是ChemCAM,这是美国宇航局“好奇号”上的一个重要的科学仪器,它于2012年抵达火星。LIBS光谱所包含的数据非常丰富,受限于工作量的限制,以往人们对LIBS光谱进行分析时,仅仅是采用单变量的分析方法对其中一小部分信息进行分析。采用这样的分析方法,能够利用到的光谱数据很有限。比如对Si元素进行分析的时候只利用了Si元素的光谱信息,但是由于基质效应的影响,Si元素特征谱线的强度会受到别的元素的影响,因此其它元素的光谱信息对于Si元素的分析也是有用的。因此,有必要开发能够对LIBS光谱的所有信息进行分析的新的方法。
随着计算机科学的发展,LIBS技术结合化学计量学的分析方法能够对LIBS光谱中包含的所有信息进行评估。例如,朱等人(Spectrochimica Acta Part B:AtomicSpectroscopy,93(2014)8-13)采用偏最小二乘判别分析(PLS-DA)和支持向量机(SVM)对不同沉积岩样品进行判别。Sirven等人(Journal of Analytical Atomic Spectrometry,22(2007)1471-1480.)采用主成分分析(PCA)、类类比软独立建模(SIMCA)和PLS-DA方法对火星上不同岩石进行判别。Boucher等人(Spectrochimica Acta Part B:AtomicSpectroscopy,107(2015)1-10.B107(2015)1-10)比较了几种非线性回归方法,包括核主成分回归(K-PCR)、多项式核支持向量回归(SVR-Py)和k-最近邻回归(KNN)。石等人(Journalof Analytical Atomic Spectrometry,30(2015)2384-2393.)应用支持向量回归(SVR)和PLSR法测定了沉积岩样品中的五种主要元素。Sun等人(Scientific reports,9(2019)1-18.)开发了一种预测土壤中微量元素的BP神经网络(BPNN)。但是上述分析方法仍有提升的空间,特别是在同时实现多目标分析和提升多种元素的定量分析准确性等方面。
作为机器学习的一个新兴分支,卷积神经网络(CNN)是一种深度学习的分析方法,不同于以往的浅层机器学习方法,它强调从连续层学习来提取数据的重要特征。CNN在解决各种计算机视觉问题方面取得了很大的成功,特别是对于小训练数据集的任务。近年来在光谱学数据分析中也得到了广泛的应用。
在LIBS光谱分析领域,Lu等(Plasma Sci.Technol.,21,034014,in,2018)利用简单结构的二维CNN改进了土壤中钾的测定,其中核心层由单个卷积层和单个池层组成。但是,该方法仅能够实现对钾一种元素的含量进行测定。
中国发明专利申请“CN110705372A基于深度学习卷积神经网络的LIBS多成分定量反演方法”公开了一种新的CNN模型,其能够对SiO2、Al2O3、Fe2O3、CaO、MgO、K2O、Na2O、TiO2、SO3、P2O5、MnO、Cl、CO2、H2O+、FeO、H2O-、C(org)、F、Mn、S、P和Cr2O3等22种主要成分的含量进行预测。从而实现了多成分分析的目的。然而,对于地质工作者来说,岩性的类别是很重要的信息,上述方法只能实现元素定量分析,为了得到岩石的类别信息,还要根据代表元素的含量再进行一次分析判断。此外,LIBS作为一种发射光谱技术,其光谱数据只能体现元素的信息。上述方法中,在直接使用岩石粉末压片,而不进行其它的预处理所采集到LIBS光谱数据中,是不能体现同一元素不同化合价态的信息的。因此,对于该专利申请中提出区分Fe2O3和FeO(即二价铁和三价铁)在含量上的差异,从LIBS技术的原理上来看,是不合理的,存在过拟合风险的。
另一方面,Chen等(Spectrochimica Acta Part B:Atomic Spectroscopy,166(2020)105801.)开发了一个更多层的二维CNN模型来识别不同的岩石样本,包括白云石、花岗岩、石灰岩、泥岩和页岩。然而,该方法中的模型又只能够实现岩性的识别,无法对岩石样本中元素的含量进行定量分析。
综上所述,现有的CNN模型都只能够实现岩石分类或主要成分含量预测中的其中一种目的。如果能够在同一模型中同时进行岩性分类和主量元素含量分析的任务,将极大地提高地质分析工作的效率。然而,岩性分类属于分类任务,主量元素含量预测属于回归任务,分类和回归任务的难度是不一样的,所需要利用的特征数差异很大。如果特征数量太多,那分类任务会出现过拟合,而如果特征数量太少,那么回归任务会出现欠拟合。因而,利用现有技术中这些结构简单的CNN模型,并不能够实现同时进行岩性分类和主量元素含量预测的目的。
发明内容
针对现有技术的缺陷,本发明提供一种LIBS与深度学习结合的岩性分类及主量元素含量检测方法,其目的在于:建立一种CNN模型,能够对岩石样本的LIBS光谱进行分析,同时得到岩石分类和主量元素含量的结果。
一种LIBS与深度学习结合的岩性分类及主量元素含量检测方法,包括如下步骤:
(1)输入岩石样本的LIBS光谱数据;
(2)通过CNN模型得到岩性分类和主量元素含量的结果;
其中,所述CNN模型的结构包括共享部分、岩性分类部分和元素定量部分;
所述共享部分包括分批归一化层和至少一组卷积层与最大池化层的组合,所述共享部分从所述LIBS光谱数据中识别和提取的特征;
所述岩性分类部分包括展平层、至少一个Dropout层和至少一个全连接层,所述岩性分类部分根据所述特征预测所述岩性分类的结果;
所述元素定量部分包括至少一个卷积层、至少一个最大池化层、展平层、至少一个Dropout层和至少一个全连接层,所述元素定量部分对所述特征进行进一步提取后预测所述岩石样本中主量元素含量的结果。
优选的,所述主量元素选自Si、Al、Fe、Ca、Mg、K和Na中的至少一种;和/或,所述岩性分类的结果为1×6向量,向量中的值分别代表岩石样品属于白云石、火成岩、粘土岩、石膏岩、石灰石和砂岩的概率。
优选的,步骤(1)中,所述LIBS光谱数据的采谱范围为180~790nm;优选的,所述LIBS光谱数据采集自三个光谱通道,所述光谱通道分别覆盖180~350nm、350~580nm和580~790nm,每个光谱通道有2048个像素。
优选的,步骤(1)中,所述LIBS光谱数据通过如下公式进行总面积归一化的预处理:
其中,Inormalization是预处理后的光谱强度,Iorigin为原始光谱强度,Itotal为该光谱全部数据强度之和。
优选的,步骤(2)中,所述共享部分包括依次设置的分批归一化层、卷积层、最大池化层、卷积层和最大池化层;和/或,所述岩性分类部分包括依次设置的展平层、Dropout层、全连接层、Dropout层和两个全连接层;和/或,所述元素定量部分包括依次设置的卷积层、最大池化层、七个卷积层、卷积层、最大池化层、展平层、Dropout层、全连接层、Dropout层和全连接层。
优选的,步骤(2)中,所述CNN模型所用的激活函数为Tanh函数和/或relu函数。
优选的,步骤(2)中,用于训练所述CNN模型的全局损失Lossglobal定义如下:
Lossglobal=0.6×Lossclassification+0.25×Lossregression
其中,Lossclassification为所述岩性分类结果的分类交叉熵,Lossregression为所述主量元素含量结果的平均绝对误差。
本发明还提供一种计算机设备,用于岩石的岩性分类及主量元素含量检测,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法。
本发明还提供一种用于岩石的岩性分类及主量元素含量检测的系统,包括:LIBS光谱仪和上述计算机设备,所述LIBS光谱仪和所述计算机设备通过数据线连接。
本发明还提供一种计算机可读存储介质,其上存储有用于实现上述方法的计算机程序。
本发明搭建了一个二维CNN模型,它的多层结构经过针对性的设计,能够同时预测岩石样品的种类(岩性分类)和其中Si、Fe、Al、Ca、Mg、Na和K等7种主要化学元素含量(主量元素含量)。相比于现有的基于CNN模型的方法,本发明能够一次输入数据同时进行分类和分析多种元素的含量,具有更加高效、快捷的优点。
此外,与现有技术中Lu等人(Plasma Sci.Technol.,21,034014,in,2018)的方法相比,本发明还具有如下有益的效果:1)现有的方法需要包括时间维度信息在内的多维度数据信息,需采集时间分辨LIBS光谱,本发明的方法不需要采集时间分辨的光谱数据,实验更加简单。2)现有的方法需要对光谱进行各种预处,尤其是需要先用主成分分析方法对光谱数据降维,预处理造成的额外耗时较多,而本发明方法使用的是总面积归一化预处理,非常简单便捷。3)现有的方法使用的CNN网络核心结构单一,分析对象仅为单种成分(钾元素),如果使用这种结构单一的CNN模型对多种成分同时分析,那光谱预处理的复杂度还是训练难度都将明显增加,准确度也将无法保证;而本发明方法可以分析的元素种类更多,包括了最具代表性的成岩元素,对于地质工作者来说,通过这几种元素的变化趋势就能够很好的了解地层的沉积条件。4)现有的方法所用编程语言(MATLAB)的训练效率不够高,不适用于节点数较多的大型网络,不适用于结构多样化的复杂网络,无法满足高效深度学习的需求,而本发明方法能够使用更加简单,适用性更强的编程语言python。
与现有技术中的中国发明专利申请“CN110705372A基于深度学习卷积神经网络的LIBS多成分定量反演方法”相比,本发明还具有如下有益的效果:1)现有的方法虽然提供了22种成分(或元素)的含量预测结果,但是其中包含较多的次要成分,在缺少岩性分类信息的情况下,即使知晓了这些次要成分的信息,对地质人员分析岩石样本的工作帮助也不大;而在本发明的技术方案中,通过对模型结构的设计,实现了同时得到岩性分类结果和多种能够体现地质变化信息的主量元素的含量预测结果,通过这两个结果,就能够为地质分析人员提供较为全面的信息,对地质分析人员的分析工作更具有实际意义;2)由于LIBS从原理上来讲只能提供元素的信息,因此现有的方法中,将各元素的含量以具体成分的形式进行表示,甚至对Fe元素等进行不同价态的区分,这样的模型存在过拟合的风险;而本发明的方法只分析主量元素的含量,不会出现过拟合,准确性更好。
与现有技术中Chen等人(Spectrochimica Acta Part B:Atomic Spectroscopy,166(2020)105801.)的方法相比,本发明还具有如下有益的效果:1)现有技术中,把泥岩和页岩分成两类,但是泥岩和页岩在岩石的大类上同属于粘土岩,其主要成分都是粘土,代表性的成岩元素没有特别明显的区别,两者主要是结构的区别,而LIBS的光谱数据只能反映出样本在元素方面的差异,因而现有技术的模型存在过拟合风险的;而本发明的技术方案中不存在这样的风险,因而准确性更好;2)现有技术中,考虑的岩性种类比较有限,而本发明的模型从分类的角度来看更加合理,包含岩性种类更多。
显然,根据本发明的上述内容,按照本领域的普通技术知识和惯用手段,在不脱离本发明上述基本技术思想前提下,还可以做出其它多种形式的修改、替换或变更。
以下通过实施例形式的具体实施方式,对本发明的上述内容再作进一步的详细说明。但不应将此理解为本发明上述主题的范围仅限于以下的实例。凡基于本发明上述内容所实现的技术均属于本发明的范围。
附图说明
图1为实施例1所用的LIBS实验系统总图;
图2为不同类型岩石的样片照片和LIBS光谱,包括((A)白云石,((B)火成岩,((C)粘土岩,((D)石膏岩,((E)砂岩,((F)石灰石。在A区和B区有几条典型的Si、Al、Fe、Ca、Mg、K和Na的原子和离子发射线;
图3为实施例1的CNN结构示意图。主要有三个部分,包括共享部分(在蓝色虚线框内)、岩性分类部分(在绿色虚线框内)和元素定量部分(在黄色虚线框内);
图4为实施例1的模型优化过程中,CNN的训练和验证数据丢失;
图5为实验例2中CNN模型测试结果的混淆矩阵;
图6为实验例2中kNN、SVM和PLS-DA模型测试结果的混淆矩阵;
图7为实验例3中基于CNN、ANN、PLSR1和PLSR2的已知浓度与预测浓度的校正曲线;
图8为实验例3中27个测试样本的MAE值;
图9为实验例3中四种方法相对误差值分布的统计结果。
具体实施方式
需要特别说明的是,实施例中未具体说明的数据采集、传输、储存和处理等步骤的算法,以及未具体说明的硬件结构、电路连接等均可通过现有技术已公开的内容实现。
实施例1
1、LIBS系统、岩石样本和数据采集
图1显示了在本实施例中采用的LIBS实验系统的图表。该实验装置属于现有技术,它包括一束Nd:YAG激光束,每脉冲能量恒定,聚焦于目标样品的表面,置于X-Y-Z平移样品阶段的顶部。利用光纤探针将激光等离子体的光发射转移到光谱仪,光谱仪由三个光谱通道组成,分别覆盖180~350nm(通道1)、350~580nm(通道2)、580~790nm(通道3)。每个通道都有2048个像素,因此每张LIBS光谱数据可以转化为一个3×2048矩阵。LIBS实验装置相关参数见表1。
表1 LIBS系统的主要参数
本实施例中,用于构成训练集、验证集和测试集的数据采集自97个岩石样品,包括白云石(15个)、火成岩(20个)、粘土岩(14个)、石膏岩(15个)、石灰石(19个)和砂岩(14个),样品来自于中国标准物质中心、中国国家地质中心和成都艾立本科技有限公司。每个样本的岩性分类相关信息和元素浓度分布已知,可在其相应的标准参考物质证书中获得,或由供方提供。
每个样品粉末化,称重(约1g),使用压片机(压力:8MPa)压制成直径2cm的小圆片。每个样品在表面上的20个不同位置采集LIBS光谱,每个采样部位累计4次脉冲激光后,通过平均4张光谱获得1张光谱。因此,本实施例总共从97个样品中获得了1940张的有效LIBS光谱。图2给出了6种不同类型岩石的样品片和LIBS谱图。在标记为A和B的光谱区域中,突出了Si、Al、Fe、Ca、Mg、K和Na 7种元素的特征谱线。在A区,我们标记了5条线,波长(按波长增加的顺序):252.28nm(Fe I),279.55nm(Mg II),280.27nm(Mg II),288.16nm(Si I),309.27nm(Al I)。B区有6条标记线:643.91nm(Ca I),646.26nm(Ca I),588.99nm(Na I),589.59nm(Na I),766.49nm(KI),769.90nm(K I)。石灰石、白云石和石膏岩的光谱与火成岩、粘土岩和砂岩有显著差异。然而,石灰石、白云石和石膏的光谱有很高的相似性,火成岩和砂岩的光谱也有很高的相似性。
本实施例中,对于每一张光谱数据,采用总面积归一化的数据预处理方法,公式如下:
Inormalization是预处理后的光谱强度,Iorigin为原始光谱强度,Itotal为该张光谱数据全部强度之和。
2、CNN模型的构建
本实施例中的CNN模型是利用Keras(版本2.2.5)构造的。为了开发一个能够同时实现两个不同分析目标的模型,使用Keras中的函数API构造了一个具有不同层次的双通道模型,其结构如图3所示。该CNN模型由三个主要部分组成,包括共享部分、岩性分类部分和元素定量部分。主要层的相关参数见表2。
表2主要层与CNN相关参数。号。这个表中的层是与图3中的一比一对应的。
共享部分负责特征提取,包括1个分批归一化层、2个卷积层和2个最大池化层。分批归一化层规范了不同样品的强度分布。卷积层作为CNN的核心层,负责特征的识别和提取。每个输入(3×2048向量)与一个3×3卷积核矩阵进行卷积,并将其转化为具有较少值的特征矩阵。在这一部分中,每个卷积层后面是一个最大池化层,用于降低特征矩阵的维数。在特征映射中,将某一局部区域内的多个相邻值合并为其中的最大值,从而滤除特征矩阵中不必要的信息。该部分的提取出的特征由岩性分类部分和元素定量部分共享。
岩性分类部分解决的是岩性识别,是一个分类问题,与回归问题相比,分类问题容易得多,因此从共享部分提取的特征足以完成岩性识别的目标。其回归部分由1个展平层、2个Dropout层和3个全连接层组成。展平层将高维矩阵转换为一维矢量,为与全连接层的连接搭建桥梁。作为防止网络过度拟合的一种典型方法,Dropout层随机使50%的数据失效。最后1个全连接层预测出一个1×6向量,向量中的每个值代表光谱属于某种岩性的概率。根据极大值,可以很容易地确定该光谱属于哪种岩性。
元素定量部分解决的是元素定量,属于回归问题,其回归部分由10个卷积层、2个最大池化层、1个展平层、2个Dropout层和2个全连接层组成。为了取得更好的效果,本实施例采用了较多的卷积层来提取有用的特征。与岩性分类部分不同的是,最后1个全连接层预测出各元素的含量数据。各元素的含量数据为一个1×7的向量。例如:本实施例用于建模的97个样品中。把每个样品中这7种元素的浓度用1个1×7的向量e表示,该向量中的每个值代表某一元素的浓度e,如以下方程所示。
Ei=[ei1,ei2,…,eiL],i=1,2,…N
其中,i为样品号,N=97,L=7。该向量命名为元素浓度向量(ECV)。
如前所述,岩性识别是一项多分类任务,而元素定量是一项向量回归任务,因此需要不同的训练过程和不同的损失。对于多分类问题,通常用分类交叉熵来评估模型的损失,而对于回归问题,通常使用均方误差(MSE)或平均绝对误差(MAE)来评估模型的损失。本实施例的CNN模型分别采用分类交叉熵和平均绝对误差作为分类损失和回归损失,具体地,全局损失Lossglobal定义如下:
Lossglobal=0.6×Lossclassification+0.25×Lossregression
其中,Lossclassification为所述岩性分类结果的分类交叉熵,Lossregression为所述主量元素含量结果的平均绝对误差。
3、模型训练
本实施例用“留出法”来验证实验结果。所有的LIBS光谱被随机分为三个不同的数据集,包括训练集(40个样本)、验证集(30个样本)和测试集(27个样本)。每个数据集是独立的,由不同岩石样品的光谱组成。表3列出了光谱数在不同数据集中的分布情况。
表3光谱数在不同数据集中的分布。
训练过程是将训练集光谱数据和对应的岩性标签和元素浓度信息输入CNN模型,然后将预测值与已知值进行比较,以减少全局损失。验证集负责确定最佳CNN参数。激活函数为Tanh函数和relu函数。批次大小为64次,但每次进行随机分割,可导致每个训练阶段的随机性。为了消除训练过程中的随机性,将训练过程中的随机种子设置为0。每个训练过程在100次后终止,训练和验证损失在模型训练100次以后就收敛了,没有明显的变化。验证数据的模型性能如图4所示。
4、未知样品的检测
模型训练完成后,即可对未知样品进行岩性分类和主量元素含量检测,包括如下步骤:
1)按照1部分所述的方法检测未知样品的LIBS光谱数据;
2)输入未知样品的LIBS光谱数据;
3)通过训练得到的CNN模型得到未知样品的岩性分类和主量元素含量的结果。
以下通过对比实验进一步说明本发明的有益效果。
实验例1
本实验例将实施例1构建的CNN模型在岩性识别方面的预测能力与现有技术中的三种监督机器学习模型(KNN、SVM、PLS-DA)进行了比较。这三种模型属于现有技术,按照文献Spectrochimica Acta Part B:Atomic Spectroscopy,166(2020)105801公开的方法训练得到。
采用测试集来评价上述四种模型的泛化能力。表4显示了四种机器学习模型在测试集上的岩性识别预测精度,其中实施例1的CNN模型显示了最好的预测精度。
表4四种机器学习模型岩性识别预测精度比较
实验例2
本实验例给出了实施例1构建的CNN模型在岩性识别中预测测试集的混淆矩阵,结果如图5所示。从结果来看,仅有白云石的4个光谱被错误地划分为石灰岩,这是由于这两类岩石均为碳酸盐岩,光谱相似度很高。
作为对比,图6给出了按照实验例1所述的方法建立的KNN、SVM和PLS-DA三种模型的混淆矩阵。从图6的结果可以看出,其他三种模型进行岩性识别的错误率显著地高于实施例1的CNN模型。这说明实施例1的CNN模型具有极高的准确率。
实验例3
本实验例将实施例1构建的CNN模型在元素浓度方面的预测能力与现有技术中的三种监督机器学习模型(ANN、PLSR1和PLSR2)进行了比较。这三种模型属于现有技术。
在实施例1的CNN模型中,元素浓度的回归损失用MAE来评估,因此其他三种模型的最优关键参数也是根据它们在验证集上的MAE来确定的。其中ANN按照文献“Spectrochimica Acta Part B:Atomic Spectroscopy,166(2020)105801”的方法训练得到,ANN是一种多层前馈神经网络(MLP),采用人工方法从7个目标元素(单位为nm)中选取14条特征线:250.69(Si),288.16(Si),308.21(Al),309.27(Al),259.83(Fe),404.60(Fe),396.85(Ca),422.67(Ca),280.27(Mg),285.21(Mg),766.49(K),769.90(K),588.99(Na),589.59(Na)。当神经元的数量等于14时,ANN模型的MAE值达到最低。
此外本实验例还采用了两个偏最小二乘回归(PLSR),PLSR1和PLSR2按照文献“computational statistics,2(2010)97-106”的方法训练得到。这两种方法的不同之处在于,PLSR1一次只递减一个元素的浓度,而PLSR2一次只递减7个元素的浓度。PLSR中的关键参数是潜变量(LVs),它通常由预测残差平方和(PRESS)和潜变量比Q2值所决定。通过这种方法,将Q2设为0.0975。对于PLSR2,LVs=15;而对于PLSR1,LVs范围为5到22。
在测试集上使用元素的相关系数评价这四种方法的元素浓度预测能力,第l个元素的相关系数记为(Rl 2)。(因为有7个元素,Si元素就是第1个元素)
其中:N为测试集样本数量,N=27;L为目标元素数量,L=7(Si元素是第一个元素,所以l=1,R1 2就代表的是Si元素的预测值与真值之间的相关系数,R2 2代表Al元素的预测值与真值之间的相关系数,以此类推,有7个元素,就能计算出7个相关系数的值,从R1 2到R7 2);Ril代表的是第l个元素在第i个样品里的真实浓度;代表的是第l个元素在27个测试样品里真实浓度平均值;Pil代表的是第l个元素在第i个样品里的预测浓度(由于每个样品采集了20个点,每个点的对于第l个元素预测值都不一样,所以Pil是这20个点的预测值的平均值);Pl代表的是第l个元素在27个测试样品里的预测浓度平均值。
表5基于四种方法的测试样本中7个目标元素的r
从表5中数据可见,两种神经网络方法的预测性能均优于PLSR方法。对大多数元素而言,CNN测得的R2值最高,Si、Al、Ca和Mg的R2值超过0.99。图7给出了基于CNN、ANN、PLSR1和PLSR2的7个目标元素已知浓度与预测浓度的标定曲线。显然,CNN在这四种方法中对低浓度的预测性能要好得多。此外,与其他三种方法相比,对于大多数样本,CNN预测浓度的标准差要小得多。因此,在整体性能上,CNN模型在这些方法中表现出其优越性。
表6和图8给出了这四种模型的MAE值,包括每种方法的最大值、最小值、平均值和标准差。在总体性能上,两种神经网络均优于两种PLSR模型,且CNN模型优于其它三种方法。
表6四种方法的MAE值的统计结果
为了直观地评价这些方法的定量精度,本实验例还计算了每个样品各元素的预测相对误差(RE)的绝对值。表7显示了所有27个测试样本的每个元素的相对误差(绝对值),其中一个单元格有四个对应于四种方法结果的值,在上子行中,CNN结果在斜线的左边,ANN结果在斜线的右边;而在下面的子行,PLSR1的结果在斜杠的左边,PLSR2在斜杠的右边。在表中,“TL”一词的意思是“太大”,这表明相对误差大于500%。在某些情况下,四种方法的相对误差是非常接近的,例如测试样本编号TE1中Ca的相对误差。然而,在某些情况下,不同的方法差异非常大,如Fe在测试样品编号TE18的结果。
表7每个样品各元素的预测相对误差(RE)的绝对值
根据表7所示的756个相对误差值,对预测精度进行了简要的统计分析,如图9所示。设定了七个范围来表示不同的精确度。以%为单位,范围1表示相对误差值在区间(0,5],范围2表示相对误差值在区间(5,10),范围3表示相对误差值在区间(10,20),范围4表示相对误差值在区间(20,50),范围5表示相对误差值在区间(50,100),范围6表示相对误差值在区间(100,500),范围7表示相对误差值在区间(500,+∞),在图中分别表示为“R1”到“R7”。对于精度较高的范围1、2和3,两种神经网络的和计数均大于PLSR模型,CNN的和计数在这4种方法中最大,而对于精度较低的范围6和7,两种神经网络的和计数均小于PLSR模型,CNN的和计数在这4种方法中最小。这说明CNN的回归性能是这四种方法中最好的。
通过上述实施例和实验例可知,本发明提供的LIBS与CNN相结合的方法能够同时进行岩性识别和岩石样品中7种主量元素定量分析。相比于KNN、SVM、PLS-DA、ANN、PLSR1和PLSR2等模型,本发明的CNN模型在复杂基质效应和相似化学成分的岩石岩性识别和定量分析方面均具有优势。
Claims (10)
1.一种LIBS与深度学习结合的岩性分类及主量元素含量检测方法,其特征在于,包括如下步骤:
(1)输入岩石样本的LIBS光谱数据;
(2)通过CNN模型得到岩性分类和主量元素含量的结果;
其中,所述CNN模型的结构包括共享部分、岩性分类部分和元素定量部分;
所述共享部分包括分批归一化层和至少一组卷积层与最大池化层的组合,所述共享部分从所述LIBS光谱数据中识别和提取的特征;
所述岩性分类部分包括展平层、至少一个Dropout层和至少一个全连接层,所述岩性分类部分根据所述特征预测所述岩性分类的结果;
所述元素定量部分包括至少一个卷积层、至少一个最大池化层、展平层、至少一个Dropout层和至少一个全连接层,所述元素定量部分对所述特征进行进一步提取后预测所述岩石样本中主量元素含量的结果。
2.按照权利要求1所述的检测方法,其特征在于:所述主量元素选自Si、Al、Fe、Ca、Mg、K和Na中的至少一种;和/或,所述岩性分类的结果为1×6向量,向量中的值分别代表岩石样品属于白云石、火成岩、粘土岩、石膏岩、石灰石和砂岩的概率。
3.按照权利要求1所述的检测方法,其特征在于:步骤(1)中,所述LIBS光谱数据的采谱范围为180~790nm;优选的,所述LIBS光谱数据采集自三个光谱通道,所述光谱通道分别覆盖180~350nm、350~580nm和580~790nm,每个光谱通道有2048个像素。
5.按照权利要求1所述的检测方法,其特征在于:步骤(2)中,所述共享部分包括依次设置的分批归一化层、卷积层、最大池化层、卷积层和最大池化层;和/或,所述岩性分类部分包括依次设置的展平层、Dropout层、全连接层、Dropout层和两个全连接层;和/或,所述元素定量部分包括依次设置的卷积层、最大池化层、七个卷积层、卷积层、最大池化层、展平层、Dropout层、全连接层、Dropout层和全连接层。
6.按照权利要求1所述的检测方法,其特征在于:步骤(2)中,所述CNN模型所用的激活函数为Tanh函数和/或relu函数。
7.按照权利要求1所述的检测方法,其特征在于:步骤(2)中,用于训练所述CNN模型的全局损失Lossglobal定义如下:
Lossglobal=0.6×Lossclassification+0.25×Lossregression
其中,Lossclassification为所述岩性分类结果的分类交叉熵,Lossregression为所述主量元素含量结果的平均绝对误差。
8.一种计算机设备,用于岩石的岩性分类及主量元素含量检测,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于:所述处理器执行所述计算机程序时实现权利要求1-7任一项所述的方法。
9.一种用于岩石的岩性分类及主量元素含量检测的系统,其特征在于,包括:LIBS光谱仪和权利要求8所述的计算机设备,所述LIBS光谱仪和所述计算机设备通过数据线连接。
10.一种计算机可读存储介质,其上存储有用于实现权利要求1-7任一项所述的方法的计算机程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110466871.2A CN113177919B (zh) | 2021-04-28 | 2021-04-28 | Libs与深度学习结合的岩性分类及主量元素含量检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110466871.2A CN113177919B (zh) | 2021-04-28 | 2021-04-28 | Libs与深度学习结合的岩性分类及主量元素含量检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113177919A true CN113177919A (zh) | 2021-07-27 |
CN113177919B CN113177919B (zh) | 2022-08-05 |
Family
ID=76926736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110466871.2A Active CN113177919B (zh) | 2021-04-28 | 2021-04-28 | Libs与深度学习结合的岩性分类及主量元素含量检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113177919B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114034684A (zh) * | 2021-10-13 | 2022-02-11 | 中国科学院南京土壤研究所 | 一种基于一站式光谱模型的土壤属性快速测定方法 |
CN114295802A (zh) * | 2021-10-29 | 2022-04-08 | 吉林建筑大学 | 一种基于多元素指纹方法评估不同海拔土壤垂直分异规律的技术及应用 |
CN114636689A (zh) * | 2022-05-23 | 2022-06-17 | 武汉七斗光电科技有限公司 | 基于libs技术的藏药原矿成分定量检测方法和系统 |
CN115452928A (zh) * | 2022-08-30 | 2022-12-09 | 中国地质大学(北京) | 一种煤中锗元素分布可视化输出及定量分析方法 |
CN115937568A (zh) * | 2022-09-29 | 2023-04-07 | 中国地质大学(北京) | 一种玄武岩构造背景分类方法、系统、装置及存储介质 |
CN116519906B (zh) * | 2023-04-24 | 2023-10-31 | 中国地质大学(北京) | 一种岩性地球化学分支基因lg11及其构建方法和应用 |
CN117445520A (zh) * | 2023-12-26 | 2024-01-26 | 成都艾立本科技有限公司 | 用于libs分析的复合纳米结构及分析方法及用途 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104964950A (zh) * | 2015-06-10 | 2015-10-07 | 长江大学 | 基于多元素波峰的激光诱导击穿光谱岩屑类型识别方法 |
CN105938099A (zh) * | 2016-07-07 | 2016-09-14 | 四川大学 | 一种基于激光诱导击穿光谱的岩性判别方法及系统 |
US20180218197A1 (en) * | 2017-01-27 | 2018-08-02 | Signal Processing, Inc. | Method and System for Enhancing Predictive Accuracy of Planet Surface Characteristics from Orbit |
CN108596246A (zh) * | 2018-04-23 | 2018-09-28 | 浙江科技学院 | 基于深度神经网络的土壤重金属含量检测模型的建立方法 |
CN109931053A (zh) * | 2017-12-15 | 2019-06-25 | 中石化石油工程技术服务有限公司 | 砂泥岩-碳酸盐岩岩性的识别方法 |
CN109975273A (zh) * | 2019-03-07 | 2019-07-05 | 四川大学 | 一种基于激光诱导击穿光谱的岩石分类方法 |
CN110689088A (zh) * | 2019-10-09 | 2020-01-14 | 山东大学 | 基于cnn的libs矿石光谱数据分类方法及装置 |
CN110705372A (zh) * | 2019-09-10 | 2020-01-17 | 中国科学院上海技术物理研究所 | 基于深度学习卷积神经网络的libs多成分定量反演方法 |
EP3605062A1 (en) * | 2018-07-31 | 2020-02-05 | INESC TEC - Instituto de Engenharia de Sistemas e Computadores, Tecnologia e Ciência | A method and apparatus for characterisation of constituents in a physical sample from electromagnetic spectral information |
CN111783825A (zh) * | 2020-05-26 | 2020-10-16 | 中国石油天然气集团有限公司 | 一种基于卷积神经网络学习的测井岩性识别方法 |
CN112051256A (zh) * | 2020-07-22 | 2020-12-08 | 中国地质大学(武汉) | 基于cnn模型的待测元素含量libs测量方法、系统 |
CN112308892A (zh) * | 2020-11-16 | 2021-02-02 | 中国海洋大学 | 一种基于libs技术的贝壳纹理分析系统和方法 |
-
2021
- 2021-04-28 CN CN202110466871.2A patent/CN113177919B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104964950A (zh) * | 2015-06-10 | 2015-10-07 | 长江大学 | 基于多元素波峰的激光诱导击穿光谱岩屑类型识别方法 |
CN105938099A (zh) * | 2016-07-07 | 2016-09-14 | 四川大学 | 一种基于激光诱导击穿光谱的岩性判别方法及系统 |
US20180218197A1 (en) * | 2017-01-27 | 2018-08-02 | Signal Processing, Inc. | Method and System for Enhancing Predictive Accuracy of Planet Surface Characteristics from Orbit |
CN109931053A (zh) * | 2017-12-15 | 2019-06-25 | 中石化石油工程技术服务有限公司 | 砂泥岩-碳酸盐岩岩性的识别方法 |
CN108596246A (zh) * | 2018-04-23 | 2018-09-28 | 浙江科技学院 | 基于深度神经网络的土壤重金属含量检测模型的建立方法 |
EP3605062A1 (en) * | 2018-07-31 | 2020-02-05 | INESC TEC - Instituto de Engenharia de Sistemas e Computadores, Tecnologia e Ciência | A method and apparatus for characterisation of constituents in a physical sample from electromagnetic spectral information |
CN109975273A (zh) * | 2019-03-07 | 2019-07-05 | 四川大学 | 一种基于激光诱导击穿光谱的岩石分类方法 |
CN110705372A (zh) * | 2019-09-10 | 2020-01-17 | 中国科学院上海技术物理研究所 | 基于深度学习卷积神经网络的libs多成分定量反演方法 |
CN110689088A (zh) * | 2019-10-09 | 2020-01-14 | 山东大学 | 基于cnn的libs矿石光谱数据分类方法及装置 |
CN111783825A (zh) * | 2020-05-26 | 2020-10-16 | 中国石油天然气集团有限公司 | 一种基于卷积神经网络学习的测井岩性识别方法 |
CN112051256A (zh) * | 2020-07-22 | 2020-12-08 | 中国地质大学(武汉) | 基于cnn模型的待测元素含量libs测量方法、系统 |
CN112308892A (zh) * | 2020-11-16 | 2021-02-02 | 中国海洋大学 | 一种基于libs技术的贝壳纹理分析系统和方法 |
Non-Patent Citations (2)
Title |
---|
LEI REN等: "A Data-Driven Auto-CNN-LSTM Prediction Model for Lithium-Ion Battery Remaining Useful Life", 《IEEE TRANSACTIONS ON INDUSTRIAL INFORMATICS ( VOLUME: 17, ISSUE: 5, MAY 2021)》 * |
孙淼等: "基于LIBS技术和卷积神经网络的", 《浙江科技学院学报》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114034684A (zh) * | 2021-10-13 | 2022-02-11 | 中国科学院南京土壤研究所 | 一种基于一站式光谱模型的土壤属性快速测定方法 |
CN114295802A (zh) * | 2021-10-29 | 2022-04-08 | 吉林建筑大学 | 一种基于多元素指纹方法评估不同海拔土壤垂直分异规律的技术及应用 |
CN114636689A (zh) * | 2022-05-23 | 2022-06-17 | 武汉七斗光电科技有限公司 | 基于libs技术的藏药原矿成分定量检测方法和系统 |
CN114636689B (zh) * | 2022-05-23 | 2022-08-16 | 武汉七斗光电科技有限公司 | 基于libs技术的藏药原矿成分定量检测方法和系统 |
CN115452928A (zh) * | 2022-08-30 | 2022-12-09 | 中国地质大学(北京) | 一种煤中锗元素分布可视化输出及定量分析方法 |
CN115937568A (zh) * | 2022-09-29 | 2023-04-07 | 中国地质大学(北京) | 一种玄武岩构造背景分类方法、系统、装置及存储介质 |
CN115937568B (zh) * | 2022-09-29 | 2024-05-07 | 中国地质大学(北京) | 一种玄武岩构造背景分类方法、系统、装置及存储介质 |
CN116519906B (zh) * | 2023-04-24 | 2023-10-31 | 中国地质大学(北京) | 一种岩性地球化学分支基因lg11及其构建方法和应用 |
CN117445520A (zh) * | 2023-12-26 | 2024-01-26 | 成都艾立本科技有限公司 | 用于libs分析的复合纳米结构及分析方法及用途 |
CN117445520B (zh) * | 2023-12-26 | 2024-03-19 | 成都艾立本科技有限公司 | 用于libs分析的复合纳米结构及分析方法及用途 |
Also Published As
Publication number | Publication date |
---|---|
CN113177919B (zh) | 2022-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113177919B (zh) | Libs与深度学习结合的岩性分类及主量元素含量检测方法 | |
Pořízka et al. | On the utilization of principal component analysis in laser-induced breakdown spectroscopy data analysis, a review | |
Zhang et al. | Chemometrics in laser‐induced breakdown spectroscopy | |
Chen et al. | Convolutional neural network as a novel classification approach for laser-induced breakdown spectroscopy applications in lithological recognition | |
Moncayo et al. | Evaluation of supervised chemometric methods for sample classification by Laser Induced Breakdown Spectroscopy | |
El Haddad et al. | Good practices in LIBS analysis: Review and advices | |
Sirven et al. | Feasibility study of rock identification at the surface of Mars by remote laser-induced breakdown spectroscopy and three chemometric methods | |
Vrábel et al. | Classification of challenging Laser-Induced Breakdown Spectroscopy soil sample data-EMSLIBS contest | |
Xu et al. | Applying convolutional neural networks (CNN) for end-to-end soil analysis based on laser-induced breakdown spectroscopy (LIBS) with less spectral preprocessing | |
Wang et al. | Rapid quantitative analysis of the acidity of iron ore by the laser-induced breakdown spectroscopy (LIBS) technique coupled with variable importance measures-random forests (VIM-RF) | |
CN108596246A (zh) | 基于深度神经网络的土壤重金属含量检测模型的建立方法 | |
CN108596085A (zh) | 基于卷积神经网络的土壤重金属含量检测模型的建立方法 | |
CN112712108A (zh) | 一种拉曼光谱多元数据分析方法 | |
Cai et al. | Rapid identification of ore minerals using multi-scale dilated convolutional attention network associated with portable Raman spectroscopy | |
Chen et al. | Simultaneous determination of lithology and major elements in rocks using laser-induced breakdown spectroscopy (LIBS) coupled with a deep convolutional neural network | |
Wang et al. | Evaluation and improvement of model robustness for plastics samples classification by laser-induced breakdown spectroscopy | |
Senesi et al. | Identification and classification of meteorites using a handheld LIBS instrument coupled with a fuzzy logic-based method | |
Luarte et al. | Combining prior knowledge with input selection algorithms for quantitative analysis using neural networks in laser induced breakdown spectroscopy | |
Huang et al. | Progress toward machine learning methodologies for laser-induced breakdown spectroscopy with an emphasis on soil analysis | |
Yang et al. | Laser-induced breakdown spectroscopy combined with a convolutional neural network: A promising methodology for geochemical sample identification in Tianwen-1 Mars mission | |
Yelameli et al. | Classification and statistical analysis of hydrothermal seafloor rocks measured underwater using laser‐induced breakdown spectroscopy | |
Harefa et al. | Performing sequential forward selection and variational autoencoder techniques in soil classification based on laser-induced breakdown spectroscopy | |
Wang et al. | Mid-level data fusion of Raman spectroscopy and laser-induced breakdown spectroscopy: Improving ores identification accuracy | |
Bhardwaj et al. | Semi-supervised on-device neural network adaptation for remote and portable laser-induced breakdown spectroscopy | |
Ma et al. | Small-sample stacking model for qualitative analysis of aluminum alloys based on femtosecond laser-induced breakdown spectroscopy |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |