CN110705372A - 基于深度学习卷积神经网络的libs多成分定量反演方法 - Google Patents
基于深度学习卷积神经网络的libs多成分定量反演方法 Download PDFInfo
- Publication number
- CN110705372A CN110705372A CN201910850306.9A CN201910850306A CN110705372A CN 110705372 A CN110705372 A CN 110705372A CN 201910850306 A CN201910850306 A CN 201910850306A CN 110705372 A CN110705372 A CN 110705372A
- Authority
- CN
- China
- Prior art keywords
- layer
- sample
- neural network
- convolutional neural
- libs
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/71—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light thermally excited
- G01N21/718—Laser microanalysis, i.e. with formation of sample plasma
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Optics & Photonics (AREA)
- Plasma & Fusion (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种基于深度学习卷积神经网络的LIBS多成分定量反演方法,适用于激光光谱分析领域。本方法利用卷积神经网络算法在图像特征识别方面的独特优势,将其应用于LIBS光谱定量反演。由本发明所设计的卷积神经网络构建方案,能够对样品的LIBS谱线形态进行特征提取和深度学习,利用已知样品的LIBS光谱对卷积神经网络进行训练后,该网络可同时对未知样品的多种化学成分含量进行分析预测。本发明具有操作简捷、训练高效、准确度高、鲁棒性好的优点,适用于定量分析LIBS光谱,尤其适用于分析谱线形态复杂度较高、干扰噪声较大的LIBS光谱。
Description
技术领域
本发明涉及激光光谱分析技术领域,具体而言是一种基于深度学习卷积神经网络算法的激光诱导击穿光谱分析方法,该方法可以同时定量反演样品中多种物质化学成分含量。
背景技术
激光诱导击穿光谱(Laser-induced Breakdown Spectroscopy,LIBS)是一种原位、微损、高效的物质化学成分分析手段,广泛应用于环境监测、生物医疗、工业检测、深空探测等领域。LIBS在物质成分的定性分析上已相对较为成熟,但在成分含量的定量分析上仍存在着准确度不够高、误差较大,稳定性较低、可重复性不高等问题。这主要由基体效应、自吸收效应,以及实验参数效应所导致。
多年以来,研究者们致力于开发更优质的定量反演算法来解决上述问题。在基本的定标曲线法、内标法等方法的基础上,人们结合统计学模型以及机器学习技术,提出了更多回归拟合分析方法,其中既有线性方法,如多元线性回归法、主成分分析法、偏最小二乘法等,也有以人工神经网络为典型代表的非线性方法。在神经网络方法中,误差反向传播神经网络(Back Propagation Neural Network,BPNN)是最基本的算法之一,也是最常见的用于LIBS分析的方法。最近,有研究者提出了一种使用卷积神经网络(Convolutional NeuralNetwork,CNN)方法来进行LIBS光谱分析的方案[1]。CNN方法作为深度学习的代表性算法之一,应用最广泛的领域是图像识别与分类。近年来,它也开始被应用于拉曼光谱、近红外光谱等光谱学分析领域,而CNN方法应用于LIBS分析的,除了文献[1]外目前尚未见其他公开结果。
上述现有技术的缺点主要体现在以下三个方面:
一、对于传统线性分析方法:1)其定量反演方法完全依赖于等离子体辐射特征峰的波长位置和峰值强度,而要对特征峰位置和峰值进行准确识别和标定,就需要对光谱进行一系列常规的或特殊的预处理,预处理过程不仅增加额外耗时,而且没有统一标准方法,给结果对比和交叉验证造成障碍。2)由于激光诱导产生等离子体的诸多物理过程实际上都是高度非线性的,对最后形成的LIBS光谱形态和谱线强度也会产生错综复杂的影响,因此在对同一样品的多种化学成分进行同时定量分析时,即使经过一系列光谱预处理,传统的线性方法的准确度往往仍无法满足实际应用需求。
二、对于普通的BPNN方法:1)BPNN每一层都是全连接层,故对于节点较多的大型网络而言,需要训练的权值的数量异常庞大,训练难度和耗时难以承受。2)BPNN方法的鲁棒性较差,只有在LIBS光谱形态复杂度较低、干扰噪声较小较少的情况下才能保证较高的准确度。若LIBS光谱存在峰值波长漂移、峰值强度波动、峰的线形畸变等干扰,或者存在其它各种较大的背景噪声,则BPNN方法的准确度将无法保证。
三、对于文献[1]中所用的基于CNN的方法:1)需要包括时间维度信息在内的多维度数据信息,需采集时间分辨LIBS光谱,对实验条件要求较高。2)需要对光谱进行各种预处理,尤其是需要先用主成分分析方法对光谱数据降维,预处理造成的额外耗时较多。3)使用的CNN网络核心结构单一,该文中的分析对象仅为单种成分(钾元素),故这种简单结构尚能有较高准确度,若要同时分析多种成分,无论是光谱预处理的复杂度还是训练难度都将明显增加,准确度也将无法保证。4)计算所用编程语言(MATLAB)的训练效率不够高,不适用于节点数较多的大型网络,不适用于结构多样化的复杂网络,无法满足高效深度学习的需求。
参考文献
[1]Chengxu LU et al,Detection of K in soil using time-resolved laser-induced breakdown spectroscopy based on convolutional neural networks.PlasmaSci.Technol.21,034014,2019.
发明内容
针对现有技术的上述不足,本发明提供了一种基于深度学习卷积神经网络的LIBS多成分定量反演方法,适用于激光光谱分析领域。本方法利用卷积神经网络算法在图像特征识别方面的独特优势,将其应用于LIBS光谱定量反演。本发明的核心工作是设计了一套卷积神经网络结构构建方案,该网络能够对样品的LIBS谱线形态进行特征提取和深度学习。利用已知样品的LIBS光谱对卷积神经网络进行训练后,该网络可同时对未知样品的多种化学成分含量进行分析预测。
本发明的技术方案如下:
本技术方案的总体流程可分为五大步骤,如说明书附图1所示。具体阐述如下:
1.前期准备。1)准备样品,样品分为两类,一类是用于训练卷积神经网络的已知物质成分含量的标准样品,为训练集样品;另一类是用于测试卷积神经网络分析预测能力的样品,为测试集样品。2)制作样品的物质化学成分总表,即列出全部样品(包括训练集和测试集样品)可能包含的所有化学成分,所有的训练和测试的输出结果都不超出这个总表的范围。3)确定每个样品的成分系数向量,对于N个样品,物质成分总表中共有L种不同成分,则每个样品的成分系数向量C都是一个1×L的矩阵,样品i的成分系数向量Ci为
Ci=[ci1,ci2,…ciL],i=1,2,…N (1)
在公式(1)中,ci1表示物质成分总表中的第1种成分在样品i中的含量系数(即质量百分比,0≤ci1≤1);ci2等其它系数的含义可以此类推。
2.采集所有样品的LIBS光谱强度信息。注意:1)只需要常规的LIBS光谱,仅包含光谱强度信息即可,无需带有额外信息的LIBS光谱,如带有时间维度信息的时间分辨LIBS光谱等;2)无需对LIBS光谱进行常规光谱预处理,如基线去除、平滑降噪、不同光谱通道拼接等;也无需特殊预处理,如主成分分析等,只需原始光谱即可。
3.构建深度学习卷积神经网络。如前所述,本发明的核心工作就是设计深度学习CNN网络结构的构建方案。本方法基于Python编程语言的Keras深度学习库,因此神经网络的底层构建(如设置随机的初始权值和偏置值等)都无需手动操作,在此只阐述本发明所设计的CNN网络各操作层如何构建。
第1层为批量归一化层(Batch Normalization);
第2层为卷积层(Convolution),卷积层的激活函数为线性整流函数(ReLU),该函数可由公式(2)表达
第3层为池化层(Pooling),池化方法为最大池化(MaxPooling);
第4层为卷积层,激活函数为ReLU;
第5层为池化层,池化方法为最大池化;
第6~8层均为卷积层,激活函数均为ReLU;
第9层为扁平层(Flatten);
第10层为全连接层(Dense),该层的激活函数为ReLU;
第11层为随机失活层(Dropout);
第12层为全连接层,该层的激活函数为sigmoid函数,该函数可由公式(3)表达
按上述方法操作完,即可获得构建好的初始卷积神经网络。卷积神经网络结构框架如说明书附图2所示。
需要强调的是,本发明所设计的卷积神经网络结构并非固定死板的,根据LIBS光谱特性,可对网络结构进行调整优化。
4.训练卷积神经网络,评价训练与测试效果。初始卷积神经网络构建好之后,就可开始训练网络,整个网络的权值迭代优化器算法采用的是自适应矩估计算法,即Adam算法。本发明所设计的卷积神经网络的输入和输出信号如下:对于训练过程,输入是训练集样品的LIBS光谱强度信号矩阵以及每个光谱对应的物质成分系数向量(真实值),输出是训练集样品的物质成分系数向量(计算值),由此可显示对已知样品的训练拟合效果;对于测试过程,输入是测试集样品的LIBS光谱强度信号矩阵,输出是测试集样品的物质成分系数向量(计算值),由此可显示对未知样品的分析预测效果。此处的“未知样品”,应理解为不参与CNN网络训练过程而仅用于测试网络性能的样品,它们对于CNN网络是“未知”的样品,而对于实验者来说未必真的是完全不知物质成分的样品。上述CNN网络输入和输出信号形式(以测试过程为例)的简单示意如说明书附图2所示。需要注意:在实验中,LIBS光谱的采集往往来自若干个不同波段通道,且不同通道之间有一定的波段交叠,在将光谱信号设置为矩阵时,应将不同通道的信号并列排布,而非串连拼接。对于s个光谱通道,每个通道的光谱采样点有D个,则光谱强度信号矩阵应设置为D×s的形状,而非(D*s)×1的形状。
网络的训练和预测效果的评价指标是成分含量真实值与计算值之间的均方误差(MSE)。下面以对测试集样品的成分进行预测为例,介绍在本发明中如何计算MSE值。
物质成分总表中共包含L种不同成分,某一测试集样品的成分系数向量真实值为R,共对该样品采集了M条光谱,其中由第j条光谱输出的成分系数向量计算值为Pj,易知向量R和向量Pj中均有L个元素,其中第l个元素分别记为Rl和Pjl,则MSE值可表达为
显然,MSE值越小,表明卷积神经网络对未知样品成分含量的预测结果越接近真实值,效果越好。
5.调节优化网络参数,最终完成网络构建。根据卷积神经网络对训练集样品成分含量的拟合效果以及对测试集样品成分含量的预测效果,可对网络进行参数优化。优化可分为两个方面,一是上文提到的针对网络整体结构的,二是针对各操作层具体参数的。对于网络整体结构,可以调节优化的参数包括:批量归一化层的数目和位置、卷积层的数目、池化层的数目、各卷积层与池化层之间的相对位置、优化器算法的选择等。对于各操作层,可以调节优化的参数如下:对于批量归一化,主要有每个批次的样本量;对于卷积,主要有卷积核个数、卷积核尺寸、卷积核的移动步长、卷积激活函数;对于池化,主要有池化区域的尺寸、池化区域的移动步长;对于随机失活,主要有随机失活比率;对于全连接层,主要有全连接激活函数、全连接节点数;对于优化器算法,主要有学习率。要特别指出的是,整个卷积神经网络的核心结构是卷积层和池化层,因此,卷积层和池化层的数目及其相对位置对于网络性能起着至关重要的作用,这些参数的选定需要经过仔细考量,并根据LIBS光谱特性进行合理的调整优化。
经过反复测试和参数优化,确定在当前样品集和LIBS光谱特性条件下的理想参数,最终完成卷积神经网络的构建。此后,输入未知样品的LIBS光谱,即可定量分析预测该样品中多种物质化学成分的含量。
本发明的作用原理如下:
首先说明卷积神经网络核心结构——卷积层和池化层的作用原理。
对于卷积层,是用若干个卷积核矩阵分别与输入信号作用(即LIBS光谱强度信号矩阵)。对于每一个卷积核来说,卷积作用的数学实质是对输入信号做特定的加权求和,卷积核尺寸决定了每次操作涉及多少个输入信号矩阵的元素,卷积核矩阵决定了加权求和中的权值分布。卷积核从输入信号矩阵的首元素开始作用,然后按设定的步长参数进行移动,直至完成对整个输入信号矩阵的卷积作用。卷积层的作用是提取输入信号中的特征,对于一个卷积层来说,若将卷积核个数设为F,则将产生F个特征映射图(feature map)。卷积核的个数和卷积核尺寸可在程序中作为可调参数设定,而具体形式则无需人为设定,由构建的CNN网络自行学习。
对于池化层,是对卷积层提取出的各种特征映射图进行一种局部子抽样(subsampling)。池化操作首先要设定池的尺寸,即池化的作用区域大小。池化的方式有两种:一种是本发明所采用的最大池化,即对池化区域内的元素进行取最大值的操作,另一种是均值池化,即对池化区域内的元素进行取平均值的操作。和卷积操作类似,一次池化操作完成后,池化区域就按设定好的步长参数进行移动,直至完成对整个特征映射图的池化作用,若有多个特征映射图,则按相同方式操作,直至完成对所有特征映射图的池化作用。池化作用使卷积层输出的特征映射矩阵中的若干个元素合并为一个元素,这使得特征映射在一定程度上模糊化,从而使特征映射的输出对原始输入信号的平移(或其它形式的变形)的敏感度降低,由此提升卷积神经网络最终输出结果的鲁棒性。
下面说明卷积神经网络辅助结构——批量归一化层、扁平层、全连接层、随机失活层的作用原理。
对于批量归一化层,是对神经网络的输入数据进行归一化,每次归一化的样本个数是批次样本量(Batch size),该参数需要在程序中设定。批量归一化可以让不同样本的谱线强度的分布标准化,避免谱线强度的整体起伏引起神经网络权值分布失衡。
对于扁平层,是将卷积神经网络训练过程中生成的高阶矩阵进行扁平化变形,形成一个一维长向量。通常高阶矩阵是3阶,包含了3层信息,即若干个不同通道、每个通道的独立信号,以及每个独立信号所包含的各种特征。高阶矩阵变形为一维长向量后,更便于后续建立全连接层矩阵,因此,扁平层在神经网络核心训练层和全连接层之间起到一个过渡的作用。
对于全连接层,就是用于将一维向量收敛到最后分类的结果,神经网络的最后一层是全连接层。在本发明中,最后分类结果的输出就是计算得到的样品物质成分系数向量。如物质成分总表中共包含了L种不同化学成分,则本发明的卷积神经网络最后就收敛到L个类,即最后一层全连接层有L个节点,其对应的L个数值就构成了输出的成分系数向量。通常,全连接层设为2层,即在最后一层全连接层之前,还会设置一层全连接层,但两者不一定紧邻,并且非最后一层的全连接层的节点数也不一定设为L。另外,全连接层也可以设置激活函数,不同的全连接层可以选择不同的激活函数。
对于随机失活层,是对具有深度结构的神经网络进行正则化的一种方法。本发明所设计的卷积神经网络是一种深度学习结构。像这种具有多隐含层的深度结构,由于往往具有大量参数,因此过拟合(overfitting)是常见的问题。引入随机失活层后,在网络的学习过程中就会将隐含层的部分权值或输出值随机归零,每次具体将多少权值或输出值归零,由随机失活比率这一参数来控制,该参数在卷积神经网络中是可调的。随机失活层平衡了各节点的重要性,降低了节点间的相互依赖性,从而有效防止过拟合现象。
最后说明本发明所构建CNN网络的权值迭代优化器算法——Adam算法的作用原理。在传统的神经网络训练方法中,随机梯度下降法(SGD)是最常用的权值更新迭代算法,Adam算法是随机梯度下降法的优化,两者的主要区别在于:SGD算法在训练网络时,整个网络始终保持统一的学习率(亦称步长因子),而Adam算法则会通过梯度的一阶矩估计(即梯度的均值)和二阶矩估计(即梯度的未中心化的方差),为网络中不同的参数设计独立的学习率,并且学习率具有自适应性,随着迭代轮次的不同而自动更新。Adam算法的训练速度远远优于传统SGD算法,因此本发明所设计的深度学习卷积神经网络具有很高的训练效率。
有益效果
与现有技术相比,一种基于深度学习卷积神经网络算法的LIBS多成分定量反演方法具有以下优点:
一、与传统线性拟合分析方法相比,本方法处理复杂非线性问题的能力更强,尤其在多成分同时分析方面,由于复杂度更高,因此本方法的定量分析准确度更高。另外,本方法免除了各种LIBS光谱预处理过程,不仅节省分析时间,也可避免由于不同分析人员对光谱预处理的方式不同而导致的分析结果差异,便于进行结果对比和交叉验证。
二、与普通的BPNN方法相比,本方法利用CNN算法成果,通过卷积和池化作用深度提取LIBS光谱谱线的图形结构特征,并充分利用这些特征对神经网络进行训练,从而使得训练迭代更高效,定量分析预测的准确度更高,鲁棒性更好。
三、与现有的基于CNN的方法相比,本方法无需采集时间分辨LIBS光谱,只需常规LIBS光谱即可,实验操作更简易;本方法无需对光谱进行常规预处理,更无需先用主成分分析对数据进行降维,而是可以直接使用原始LIBS光谱数据,更节省时间;本方法所设计的卷积神经网络结构包含多个卷积层和池化层,具有更强的深度学习能力,能准确、高效地同时分析样品中的多种化学成分,并且卷积层和池化层的数目和相对位置灵活可调,在处理复杂问题方面有更强的可适应性;本方法基于Python语言的Keras深度学习库,能处理节点数多的大型网络、结构多样化的复杂网络,能满足高效深度学习的需求,并且网络的移植和扩展更简便。
综上,本方法基于深度学习卷积神经网络算法,可通过样品的LIBS光谱对其中多种化学成分含量同时进行分析和预测,并具有操作简捷、训练高效、准确度高、鲁棒性好的优点,适用于定量分析LIBS光谱,尤其适用于分析谱线形态复杂度较高、干扰噪声较大的LIBS光谱。
附图说明
图1为技术方案总体流程示意图。
图2为卷积神经网络结构以及网络的输入输出信号形式示意图。
具体实施方式
下面结合一个具体实验案例,阐明在发明内容部分所述方法的应用过程:
1.在本实验中,实验样品共有11个,即N=11,均为国家标准物质,分别标记为1号至11号。1号至11号标准样品物质分别为:1)粘土2)软质粘土3)碳酸盐岩石4)高岭土5)玄武岩6)伟晶岩7)白云石8)安山岩9)花岗片麻岩10)硅质砂岩11)页岩。在这11个样品中,所含的主要物质化学成分共有22种,即L=22,将这些成分编号为0~21,制作物质化学成分总表,各成分编号对应的化学成分如表1所示。
编号 | 成分 | 编号 | 成分 |
0 | SiO<sub>2</sub> | 11 | Cl |
1 | Al<sub>2</sub>O<sub>3</sub> | 12 | CO<sub>2</sub> |
2 | Fe<sub>2</sub>O<sub>3</sub> | 13 | H<sub>2</sub>O<sup>+</sup> |
3 | CaO | 14 | FeO |
4 | MgO | 15 | H<sub>2</sub>O<sup>-</sup> |
5 | K<sub>2</sub>O | 16 | C(org) |
6 | Na<sub>2</sub>O | 17 | F |
7 | TiO<sub>2</sub> | 18 | Mn |
8 | SO<sub>3</sub> | 19 | S |
9 | P<sub>2</sub>O<sub>5</sub> | 20 | P |
10 | MnO | 21 | Cr<sub>2</sub>O<sub>3</sub> |
表1
易知每个样品的物质成分系数向量都是一个1×22的矩阵。以1号样品为例,其成分系数向量C1可表示为(单位%)
C1代表的含义是,1号样品的主要物质成分为二氧化硅(SiO2)和氧化铝(Al2O3),含量在样品中分别达到49.98%和26.67%,其余化学成分的含量可以此类推。每个样品的成分含量均可由国家标准物质证书查阅。
2.采集所有样品的LIBS光谱,在本实验中,每个样品采集63条光谱。采集完毕后,无需对光谱进行各种常规或特殊预处理。在说明书附图2中,左上角子图表示作为CNN网络输入数据的LIBS光谱,虚线、实线、点线三种不同线型的谱线分别表示三个光谱通道采集的光谱,容易看出,输入CNN网络的是原始LIBS光谱图线,并未进行基线去除、平滑降噪,或是不同光谱通道拼接。在本实验中,光谱采集共有3个通道,每个通道有1800个采样点,因此光谱强度输入信号设置为1800×3的矩阵。
3.按发明内容中所述方法,构建卷积神经网络。本发明需要设置的主要参数包括:批量归一化中每个批次的样本个数;各个卷积层内的卷积核个数、卷积核尺寸、卷积核的移动步长、激活函数;各个池化层内的池化区域的尺寸、池化区域的移动步长、池化方式;随机失活比率;各全连接层的节点数、激活函数;优化器Adam算法的学习率。在本实验中,卷积核的宽度设为1,也即每一次卷积计算仅针对同一通道内的信号数据,不同通道的信号不进行卷积操作;相应地,池化区域的宽度同样设为1;最后一个全连接层的节点数是22。
4.用样品训练构建好的卷积神经网络。在本实验中,从11个样品中随机选取1个样品作为测试集,剩余10个样品作为训练集。假设随机选取了9号样品作为测试集,其余样品作为训练集。值得注意是,对于9号样品来说,虽然其成分是已知的(国家标准物质),但由于其不参与CNN网络的训练过程,因此对于CNN网络来说,它是未知样品。如前所述,在本实验中,每个样品采集63条光谱,也即测试集样本为63个,训练集样本为630个。将训练集样品光谱以及每个光谱对应的物质成分系数向量真实值作为CNN网络的输入,由此训练网络。在本实验的光谱数据条件下,大量测试表明,训练迭代200次就足以达到理想效果。训练完成后,将测试集样品(9号样品)的光谱输入网络,计算得到其成分系数向量的预测值。
5.评价预测效果。根据CNN网络输出的9号样品的成分系数向量预测值,并查阅9号样品的国家标准物质证书获得其成分系数向量真实值,即可评价CNN网络的预测效果。在说明书附图2中,右上角子图给出了9号样品成分系数向量预测值和真实值的直观图线对比。由MSE值可对CNN网络的预测效果进行定量评价,易知测试集样本共有63个,即M=63。按照公式(4),可知
6.调节优化参数,完善卷积神经网络。根据网络的预测效果,可以对主要参数进行优化,可调的参数在前文已有详述。在本实验中,经过参数优化后的CNN网络,9号样品的MSE值可低至0.001数量级。需要指出的是,选用不同样品作为测试集,MSE值也不同。经过反复测试和参数优化,可以确定在当前样品集和LIBS光谱特性条件下的理想CNN网络结构。CNN网络最终确定后,即可用于分析预测未知样品的物质化学成分含量。
备注:
1.当用本方法来分析预测真正的未知样品时,应尽可能事先了解未知样品的大致主要成分,并应使训练集样品中尽可能包含这些成分。若未知样品的主要成分从未在训练集样品中出现过,则分析预测结果的准确度无法保证。任何机器学习方法都有此限制。
以上具体实施方案体现了本发明的基本原理、主要特征和优点。相关技术人员应该了解,本发明不受上述具体实施案例的限制。在不脱离本发明精神和范围的前提下,本发明可能有各种变化和改进。这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。
Claims (1)
1.一种基于深度学习卷积神经网络的LIBS多成分定量反演方法,其特征在于包含以下步骤:
1)前期准备;
1-1准备样品,样品分为两类,一类是用于训练卷积神经网络的已知物质成分含量的标准样品,为训练集样品;另一类是用于测试卷积神经网络分析预测能力的样品,为测试集样品;
1-2制作样品的物质化学成分总表,即列出全部样品可能包含的所有化学成分,所有的训练和测试的输出结果都不超出这个总表的范围;
1-3确定每个样品的成分系数向量:对于N个样品,物质成分总表中共有L种不同成分,则每个样品的成分系数向量C都是一个1×L的矩阵,样品i的成分系数向量Ci为
Ci=[ci1,ci2,…ciL],i=1,2,…N
其中ci1表示物质成分总表中的第1种成分在样品i中的含量系数,即质量百分比,0≤ci1≤1;ci2等其它系数的含义可以此类推;
2)采集所有样品的LIBS光谱强度信息;
3)构建深度学习卷积神经网络;
3-1)卷积神经网络构架设计如下:
第1层为批量归一化层;
第2层为卷积层,卷积层的激活函数为线性整流函数(ReLU),该函数表达式为
第3层为池化层,池化方法为最大池化;
第4层为卷积层,激活函数为ReLU;
第5层为池化层,池化方法为最大池化;
第6~8层均为卷积层,激活函数均为ReLU;
第9层为扁平层;
第10层为全连接层,该层的激活函数为ReLU;
第11层为随机失活层;
第12层为全连接层,该层的激活函数为sigmoid函数,该函数表达式为:
sigmoid(x)=1/(1+e-x);
3-2)卷积神经网络结构并非固定死板的,根据LIBS光谱特性,可对网络结构进行调整优化;
4)训练卷积神经网络,评价训练与测试效果;
4-1)整个卷积神经网络的权值迭代优化器算法采用自适应矩估计算法,即Adam算法;
4-2)卷积神经网络的输入和输出信号:对于训练过程,输入是训练集样品的LIBS光谱强度信号矩阵以及每个光谱对应的物质成分系数向量的真实值,输出是训练集样品的物质成分系数向量的计算值;对于测试过程,输入是测试集样品的LIBS光谱强度信号矩阵,输出是测试集样品的物质成分系数向量的计算值;
4-3)在将LIBS光谱强度信号设置为矩阵时,将不同光谱通道的信号并列排布,而非串连拼接,对于s个光谱通道,每个通道的光谱采样点有D个,则光谱强度信号矩阵设置为D×s的形状,而非(D*s)×1的形状;
4-4)网络的训练和预测效果的评价指标是成分含量真实值与计算值之间的均方误差(MSE)。以对测试集样品的成分进行预测为例,计算MSE值方法为:物质成分总表中共包含L种不同成分,某一测试集样品的成分系数向量真实值为R,共对该样品采集了M条光谱,其中由第j条光谱输出的成分系数向量计算值为Pj,向量R和向量Pj中均有L个元素,其中第l个元素分别记为Rl和Pjl,则MSE值计算表达式为
MSE值越小,表明卷积神经网络对样品成分含量的预测效果越好;
5)调节优化网络参数,最终完成网络构建;
5-1)根据卷积神经网络对训练集样品成分含量的拟合效果以及对测试集样品成分含量的预测效果,对网络进行参数优化;
5-2)对于卷积神经网络整体结构,调节优化的参数包括:批量归一化层的数目和位置、卷积层的数目、池化层的数目、各卷积层与池化层之间的相对位置、优化器算法的选择;
5-3)对于各操作层,调节优化的参数如下:对于批量归一化,主要有每个批次的样本量;对于卷积,主要有卷积核个数、卷积核尺寸、卷积核的移动步长、卷积激活函数;对于池化,有池化区域的尺寸、池化区域的移动步长;对于随机失活,有随机失活比率;对于全连接层,有全连接激活函数、全连接节点数;对于优化器算法,有学习率;
5-4)经过反复测试和参数优化,确定在当前样品集和LIBS光谱特性条件下的理想参数,最终完成卷积神经网络的构建。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910850306.9A CN110705372B (zh) | 2019-09-10 | 2019-09-10 | 基于深度学习卷积神经网络的libs多成分定量反演方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910850306.9A CN110705372B (zh) | 2019-09-10 | 2019-09-10 | 基于深度学习卷积神经网络的libs多成分定量反演方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110705372A true CN110705372A (zh) | 2020-01-17 |
CN110705372B CN110705372B (zh) | 2023-05-05 |
Family
ID=69195040
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910850306.9A Active CN110705372B (zh) | 2019-09-10 | 2019-09-10 | 基于深度学习卷积神经网络的libs多成分定量反演方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110705372B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111340083A (zh) * | 2020-02-20 | 2020-06-26 | 京东方科技集团股份有限公司 | 医学图像的处理方法、装置、设备及存储介质 |
CN112051256A (zh) * | 2020-07-22 | 2020-12-08 | 中国地质大学(武汉) | 基于cnn模型的待测元素含量libs测量方法、系统 |
CN112183662A (zh) * | 2020-10-23 | 2021-01-05 | 福建农林大学 | 基于卷积神经网络和高光谱技术的柚子粒化分类方法 |
CN112529107A (zh) * | 2020-12-28 | 2021-03-19 | 华中科技大学 | 基于可见光图像识别的等离子体温度瞬态诊断方法和系统 |
CN112634121A (zh) * | 2020-11-26 | 2021-04-09 | 钢研纳克检测技术股份有限公司 | 超大尺寸金属原位分析仪中大数据快速处理方法 |
CN113177919A (zh) * | 2021-04-28 | 2021-07-27 | 成都艾立本科技有限公司 | Libs与深度学习结合的岩性分类及主量元素含量检测方法 |
CN113686804A (zh) * | 2021-08-18 | 2021-11-23 | 中山小池科技有限公司 | 一种基于深度回归网络的纺织纤维成分无损清洁分析方法 |
CN113820291A (zh) * | 2021-08-27 | 2021-12-21 | 中山小池科技有限公司 | 基于多阶段卷积神经网络的纺织品无损环保定性方法 |
CN114002167A (zh) * | 2021-11-02 | 2022-02-01 | 浙江大学 | 一种深度学习水果光谱分析模型更新方法 |
CN114062305A (zh) * | 2021-10-15 | 2022-02-18 | 中国科学院合肥物质科学研究院 | 基于近红外光谱和1D-In-Resnet网络的单籽粒品种鉴定方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101915753A (zh) * | 2010-07-30 | 2010-12-15 | 浙江师范大学 | 基于遗传神经网络的激光诱导击穿光谱定量分析方法 |
CN103411931A (zh) * | 2013-07-30 | 2013-11-27 | 中国科学院上海技术物理研究所 | 基于加权多谱线标定的远程libs元素定量分析方法 |
CN104034703A (zh) * | 2014-06-12 | 2014-09-10 | 中国科学院上海技术物理研究所 | 改进的高信噪比低检出限的libs物质成分探测系统及方法 |
US20180218197A1 (en) * | 2017-01-27 | 2018-08-02 | Signal Processing, Inc. | Method and System for Enhancing Predictive Accuracy of Planet Surface Characteristics from Orbit |
CN108596085A (zh) * | 2018-04-23 | 2018-09-28 | 浙江科技学院 | 基于卷积神经网络的土壤重金属含量检测模型的建立方法 |
CN109493287A (zh) * | 2018-10-10 | 2019-03-19 | 浙江大学 | 一种基于深度学习的定量光谱数据分析处理方法 |
-
2019
- 2019-09-10 CN CN201910850306.9A patent/CN110705372B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101915753A (zh) * | 2010-07-30 | 2010-12-15 | 浙江师范大学 | 基于遗传神经网络的激光诱导击穿光谱定量分析方法 |
CN103411931A (zh) * | 2013-07-30 | 2013-11-27 | 中国科学院上海技术物理研究所 | 基于加权多谱线标定的远程libs元素定量分析方法 |
CN104034703A (zh) * | 2014-06-12 | 2014-09-10 | 中国科学院上海技术物理研究所 | 改进的高信噪比低检出限的libs物质成分探测系统及方法 |
US20180218197A1 (en) * | 2017-01-27 | 2018-08-02 | Signal Processing, Inc. | Method and System for Enhancing Predictive Accuracy of Planet Surface Characteristics from Orbit |
CN108596085A (zh) * | 2018-04-23 | 2018-09-28 | 浙江科技学院 | 基于卷积神经网络的土壤重金属含量检测模型的建立方法 |
CN109493287A (zh) * | 2018-10-10 | 2019-03-19 | 浙江大学 | 一种基于深度学习的定量光谱数据分析处理方法 |
Non-Patent Citations (4)
Title |
---|
CHENGXU LV ET AL.: ""Detection of K in soil using time-resolved laser-induced breakdown spectroscopy based on convolutional neural networks"" * |
JIANDONG XIE ET AL.: ""Activity Pattern Aware Spectrum Sensing: A CNN-Based Deep Learning Approach"" * |
王璨;武新慧;李恋卿;王玉顺;李志伟;: "卷积神经网络用于近红外光谱预测土壤含水率" * |
章婷婷: "\"火星物质成分探测LIBS定标及反演研究\"" * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111340083A (zh) * | 2020-02-20 | 2020-06-26 | 京东方科技集团股份有限公司 | 医学图像的处理方法、装置、设备及存储介质 |
CN112051256A (zh) * | 2020-07-22 | 2020-12-08 | 中国地质大学(武汉) | 基于cnn模型的待测元素含量libs测量方法、系统 |
CN112183662A (zh) * | 2020-10-23 | 2021-01-05 | 福建农林大学 | 基于卷积神经网络和高光谱技术的柚子粒化分类方法 |
CN112634121A (zh) * | 2020-11-26 | 2021-04-09 | 钢研纳克检测技术股份有限公司 | 超大尺寸金属原位分析仪中大数据快速处理方法 |
CN112634121B (zh) * | 2020-11-26 | 2024-01-30 | 钢研纳克检测技术股份有限公司 | 超大尺寸金属原位分析仪中大数据快速处理方法 |
CN112529107A (zh) * | 2020-12-28 | 2021-03-19 | 华中科技大学 | 基于可见光图像识别的等离子体温度瞬态诊断方法和系统 |
CN113177919B (zh) * | 2021-04-28 | 2022-08-05 | 成都艾立本科技有限公司 | Libs与深度学习结合的岩性分类及主量元素含量检测方法 |
CN113177919A (zh) * | 2021-04-28 | 2021-07-27 | 成都艾立本科技有限公司 | Libs与深度学习结合的岩性分类及主量元素含量检测方法 |
CN113686804A (zh) * | 2021-08-18 | 2021-11-23 | 中山小池科技有限公司 | 一种基于深度回归网络的纺织纤维成分无损清洁分析方法 |
CN113820291A (zh) * | 2021-08-27 | 2021-12-21 | 中山小池科技有限公司 | 基于多阶段卷积神经网络的纺织品无损环保定性方法 |
CN114062305A (zh) * | 2021-10-15 | 2022-02-18 | 中国科学院合肥物质科学研究院 | 基于近红外光谱和1D-In-Resnet网络的单籽粒品种鉴定方法及系统 |
CN114062305B (zh) * | 2021-10-15 | 2024-01-26 | 中国科学院合肥物质科学研究院 | 基于近红外光谱和1D-In-Resnet网络的单籽粒品种鉴定方法及系统 |
CN114002167A (zh) * | 2021-11-02 | 2022-02-01 | 浙江大学 | 一种深度学习水果光谱分析模型更新方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110705372B (zh) | 2023-05-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110705372B (zh) | 基于深度学习卷积神经网络的libs多成分定量反演方法 | |
CN109632693A (zh) | 一种基于blstm-rnn的太赫兹光谱识别方法 | |
CN109493287A (zh) | 一种基于深度学习的定量光谱数据分析处理方法 | |
WO1995034050A1 (en) | Neural network for cell image analysis for identification of abnormal cells | |
CN106815643A (zh) | 基于随机森林迁移学习的红外光谱模型传递方法 | |
CN109543763A (zh) | 一种基于卷积神经网络的拉曼光谱分析方法 | |
CN112669915B (zh) | 一种基于神经网络与近红外光谱的梨无损检测方法 | |
CN107679569A (zh) | 基于自适应超图算法的拉曼光谱物质自动识别方法 | |
CN110309609A (zh) | 一种基于粗糙集和小波神经网络的建筑室内空气品质评价方法 | |
CN105158200A (zh) | 一种提高近红外光谱定性分析准确度的建模方法 | |
CN114399674A (zh) | 一种基于高光谱图像技术的贝类毒素无损快速检测方法及系统 | |
Ruan et al. | A novel hybrid filter/wrapper method for feature selection in archaeological ceramics classification by laser-induced breakdown spectroscopy | |
CN109060771A (zh) | 一种基于光谱不同特征集的共识模型构建方法 | |
CN108827909B (zh) | 基于可见近红外光谱与多目标融合的土壤快速分类方法 | |
CN114764682A (zh) | 一种基于多机器学习算法融合的大米安全风险评估方法 | |
Guan et al. | A recognition method of mushroom mycelium varieties based on near-infrared spectroscopy and deep learning model | |
Tan et al. | Mutual information-induced interval selection combined with kernel partial least squares for near-infrared spectral calibration | |
Omondiagbe et al. | Soil texture prediction with automated deep convolutional neural networks and population-based learning | |
CN113408616A (zh) | 基于pca-uve-elm的光谱分类方法 | |
CN117370766A (zh) | 一种基于深度学习的卫星任务规划方案评估方法 | |
CN112651428A (zh) | 一种用于远程拉曼矿物识别的深度学习模型多分类方法 | |
CN114004147B (zh) | 一种土壤湿润状态下同时预测多种土壤属性的方法 | |
CN116399848A (zh) | 一种基于深度学习的拉曼光谱大米检测方法 | |
CN116519661A (zh) | 一种基于卷积神经网络的大米识别检测方法 | |
Wang et al. | Estimation of soil organic matter by in situ Vis-NIR spectroscopy using an automatically optimized hybrid model of convolutional neural network and long short-term memory network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |