CN111222543B - 物质识别方法和设备及计算机可读存储介质 - Google Patents
物质识别方法和设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN111222543B CN111222543B CN201911321141.2A CN201911321141A CN111222543B CN 111222543 B CN111222543 B CN 111222543B CN 201911321141 A CN201911321141 A CN 201911321141A CN 111222543 B CN111222543 B CN 111222543B
- Authority
- CN
- China
- Prior art keywords
- dimensional
- data
- spectrum
- sample
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000000126 substance Substances 0.000 title claims abstract description 92
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000003860 storage Methods 0.000 title claims description 6
- 238000001228 spectrum Methods 0.000 claims abstract description 175
- 239000011159 matrix material Substances 0.000 claims abstract description 107
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 58
- 230000003595 spectral effect Effects 0.000 claims description 143
- 238000012549 training Methods 0.000 claims description 40
- 239000013598 vector Substances 0.000 claims description 27
- 238000011176 pooling Methods 0.000 claims description 21
- 238000001237 Raman spectrum Methods 0.000 claims description 16
- 238000002329 infrared spectrum Methods 0.000 claims description 16
- 238000001069 Raman spectroscopy Methods 0.000 claims description 10
- 238000007781 pre-processing Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 238000009499 grossing Methods 0.000 claims description 7
- 125000000524 functional group Chemical group 0.000 claims description 5
- 238000004876 x-ray fluorescence Methods 0.000 claims description 5
- 238000010521 absorption reaction Methods 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 238000000862 absorption spectrum Methods 0.000 claims description 2
- 238000002189 fluorescence spectrum Methods 0.000 claims description 2
- 238000002211 ultraviolet spectrum Methods 0.000 claims 1
- 238000001429 visible spectrum Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 16
- 238000001514 detection method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 230000004927 fusion Effects 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000005855 radiation Effects 0.000 description 6
- 230000002159 abnormal effect Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000013507 mapping Methods 0.000 description 5
- 238000004088 simulation Methods 0.000 description 5
- 238000013145 classification model Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005316 response function Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000000149 penetrating effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000002371 ultraviolet--visible spectrum Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/3103—Atomic absorption analysis
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/33—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using ultraviolet light
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/64—Fluorescence; Phosphorescence
- G01N21/6402—Atomic fluorescence; Laser induced fluorescence
- G01N21/6404—Atomic fluorescence
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/65—Raman scattering
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N23/00—Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00
- G01N23/22—Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by measuring secondary emission from the material
- G01N23/223—Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by measuring secondary emission from the material by irradiating the sample with X-rays or gamma-rays and by measuring X-ray fluorescence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2201/00—Features of devices classified in G01N21/00
- G01N2201/12—Circuits of general importance; Signal processing
- G01N2201/129—Using chemometrical methods
- G01N2201/1296—Using chemometrical methods using neural networks
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Pathology (AREA)
- Chemical & Material Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Optics & Photonics (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本申请公开了一种物质识别方法及物质识别设备。该物质识别方法包括:将待测样品的多组一维光谱数据融合成二维光谱矩阵;以及通过利用卷积神经网络对所述二维光谱矩阵进行分类来识别所述待测样品中的物质。本方法可以提高物质识别的准确率、减少过拟合风险,具有良好的系统稳健性。
Description
技术领域
本发明的实施例涉及光谱检测技术领域,特别涉及一种物质识别方法、一种物质识别设备及一种计算机可读存储介质。
背景技术
光谱分析技术包括紫外-可见光谱、红外光谱、拉曼光谱、原子吸收光谱、原子荧光光谱、X射线荧光光谱等。对于同一检测目标,多种光谱分析技术的融合可以弥补单一方法的不足,通过丰富的信息获得稳健的模型并拓展适用范围。例如红外光谱和拉曼光谱同样表征样品的分子组成和结构,但由于选率不同,红外光谱更多体现了极性官能团的信息,而拉曼光谱对非极性官能团更敏感。红外光谱和拉曼光谱的数据融合分析可以检测大多数有机物和无机物分子,得到更为准确可靠的定性或定量分析结果。
多谱融合识别技术的关键问题是如何将不同来源的信息融合起来,结合合适的分类器形成有效的分类算法。目前尚缺乏能够对于多种光谱数据进行有效整合的多光谱融合识别算法。
发明内容
本发明的实施例提供一种物质识别方法,包括:将待测样品的多组一维光谱数据融合成二维光谱矩阵;以及通过利用卷积神经网络对所述二维光谱矩阵进行分类来识别所述待测样品中的物质。
在一些实施例中,所述将待测样品的多组一维光谱数据融合成二维光谱矩阵包括:对所述多组一维光谱数据根据光谱关联性进行插值以将所述多组一维光谱数据基于同一坐标系对齐;将经过对齐的所述多组一维光谱数据进行标准化;以及将经过标准化的所述多组一维光谱数据叠加成二维光谱矩阵。
在一些实施例中,所述经过标准化的所述多组一维光谱数据包括N组一维光谱数据,且每组一维光谱数据的长度为M,所述二维光谱矩阵为N×M矩阵,所述二维光谱矩阵的N个行向量分别由所述N组一维光谱数据构成,其中,M和N均为大于1的正整数。
在一些实施例中,所述物质识别方法在通过利用卷积神经网络对所述二维光谱矩阵进行分类来识别所述待测样品中的物质之前还包括:生成模拟训练样本;以及基于该模拟训练样本对所述卷积神经网络进行训练。
在一些实施例中,所述生成模拟训练样本包括:以与将待测样品的多组一维光谱数据融合成二维光谱矩阵相同的方式将多组一维参考光谱数据融合成二维参考光谱矩阵;对于二维参考光谱矩阵中的光谱数据施加模拟的谱峰偏移、强度变化和基线变化中的至少一者以生成模拟训练样本。
在一些实施例中,所述物质识别方法在将待测样品的多组一维光谱数据融合成二维光谱矩阵之前还包括:对所述待测样品的所述多组一维光谱数据进行非对称最小二乘法、S-G卷积平滑、S-G卷积求导中的一种或多种预处理。
在一些实施例中,所述卷积神经网络包括:输入层,所述输入层用于将所述二维光谱矩阵输入所述卷积神经网络;输出层,所述输出层用于输出多个分类,所述多个分类分别对应于待测样品中的不同的预定物质;以及位于所述输入层和输出层之间的多个中间层,所述多个中间层配置成对从所述输入层输入的所述二维光谱矩阵进行处理并将经过处理的数据传送至输出层。
在一些实施例中,所述多个中间层依次包括:第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、全连接输入层以及全连接隐藏层。
在一些实施例中,所述多组一维光谱数据包括紫外光谱数据、可见光谱数据、红外光谱数据、拉曼光谱数据、原子吸收光谱数据、原子荧光光谱数据以及X射线荧光光谱数据中的一种或多种。
在一些实施例中,在将待测样品的多组一维光谱数据融合成二维光谱矩阵之前,所述物质识别方法还包括:通过多个光谱检测器分别采集待测样品的所述多组一维光谱数据。
本发明的实施例还提供了一种物质识别设备,包括:多个光谱检测器,用于分别采集待测样品的多组一维光谱数据;存储器,配置用于存储指令和数据;处理器,配置用于执行所述指令以:将待测样品的多组一维光谱数据融合成二维光谱矩阵;以及利用卷积神经网络对所述二维光谱矩阵进行分类以识别所述待测样品中的物质。
本发明的实施例提供了一种计算机可读存储介质,其中存储有计算机指令,当所述指令被处理器执行时实现上述任一实施例所述的方法。
在根据本发明的实施例的物质识别方法和设备中,将多组一维光谱数据融合成二维光谱矩阵并采用卷积神经网络对该二维光谱矩阵进行分类识别。这可以提高物质识别的准确率、系统稳健性和减少过拟合风险。
附图说明
为了更清楚地说明本公开文本的实施例的技术方案,下面将对实施例的附图进行简要说明,应当知道,以下描述的附图仅仅涉及本公开文本的一些实施例,而非对本公开文本的限制,其中:
图1示出根据本发明的实施例的一种物质识别方法的流程图;
图2示出图1中步骤S10的示例性的具体流程图;
图3示出根据本发明的实施例的物质识别方法中的卷积神经网络的示意图;
图4示出了根据本发明的实施例的物质识别方法中的利用反向传播优化卷积神经网络的示意图;
图5示出图1中步骤S31的示例性的具体流程图;
图6示出根据本发明的实施例的一种物质识别设备的示意性模块图;以及
图7示出根据本发明的实施例的另一种物质识别设备的示意性结构图;
具体实施方式
下面通过实施例,并结合附图,对本发明的技术方案作进一步具体的说明。在说明书中,相同或相似的附图标号表示相同或相似的部件。下述参照附图对本发明实施方式的说明旨在对本发明的总体发明构思进行解释,而不应当理解为对本发明的一种限制。
利用多种光谱数据的融合来识别样品中的物质是一个比较复杂的问题。通常,由光谱检测器(如光谱仪)所采集到的光谱(如拉曼光谱、红外光谱等等)是一维的光谱数据。如果简单地将不同的一维光谱数据直接首尾相连地输入到分类器中,可能导致模型参数众多且模型易于受实际采集的光谱数据中的噪声、偏移等误差的干扰,因而难以得到适应性好的识别效果。
为此,本发明的实施例提供了一种物质识别方法S100。在一些实施例中,该物质识别方法S100可以包括:
步骤S10:将待测样品的多组一维光谱数据融合成二维光谱矩阵;以及
步骤S20:通过利用卷积神经网络对所述二维光谱矩阵进行分类来识别所述待测样品中的物质。
如上所述,本申请的发明人已经意识到,直接将由不同的光谱检测方法分别采集到的待测样品的多组一维光谱数据首尾连接形成一维矩阵而由分类器进行分类,将会导致上述各种问题。因此,在本发明的实施例中,待测样品的多组一维光谱数据被融合成二维光谱矩阵,并基于二维光谱矩阵使用卷积神经网络(CNN)建立分类器,根据分类器的结果确定样品中是否包含预定的物质。本发明的实施例基于模式识别原理,以同类样品为基础获取一个具有该类特异性的模式,使用分类器作为机器学习或化学计量学的智能学习算法,从多种谱图数据的有机整体中学习出上述模式。本发明的实施例使用CNN对由多组一维光谱数据所融合成的二维光谱矩阵的整体特征进行识别,提高了分类性能。在图1所示的示例中,用实线框表示的是必须的基本步骤,用虚线框表示的是可选的步骤。
在一些实施例中,如图2所示,所述步骤S10可以包括:
子步骤S11:将所述多组一维光谱数据基于同一坐标系对齐;
子步骤S12:将经过对齐的所述多组一维光谱数据进行标准化;以及
子步骤S13:将经过标准化的所述多组一维光谱数据叠加成二维光谱矩阵。
待测样品的多组一维光谱数据往往是通过不同的光谱检测器所采集的,而不同的光谱检测器可能会拥有各自不同的坐标系统和不同的采集参数(比如采集点的间隔、采集频率等)。因此,实际采集到的多组一维光谱数据相互之间可能在坐标上是不一致的。在本发明的实施例中,采用的是将多组一维光谱数据融合成二维光谱矩阵再基于二维光谱矩阵进行分类的方式,在卷积神经网络进行分类的过程中,实际上是对不同组的光谱数据一起进行处理的,而不是仅仅基于一组光谱数据独立地进行分类。在此情况下,利用上述子步骤S11将不同组的光谱数据基于同一坐标系对齐对于提高分类性能是很有帮助的。例如,假定在二维光谱矩阵中相邻的两组一维光谱数据分别为红外光谱数据和拉曼光谱数据,红外光谱和拉曼光谱同为分子指纹光谱,红外光谱数据的波数坐标和拉曼光谱数据的拉曼位移坐标在相同数值处反映的是待测样品所包含的物质中同一官能团的信息,这样,利用本发明的实施例的方法,在将红外光谱数据和拉曼光谱数据基于同一坐标系对齐后它们对于各官能团的信息能够关联成二维指纹,因而,红外光谱数据和拉曼光谱数据的二维指纹特征的融合分析对于物质分子的识别就会更加有效。
在一些实施例中,上述子步骤S11可以通过对所述多组一维光谱数据根据光谱关联性进行插值等方法来实现。下面以拉曼光谱数据和红外光谱数据为例进行介绍。一组拉曼光谱数据和一组红外光谱数据均可以看成是对应于一组坐标的一组光谱幅度值。考虑光谱图之间的关联性,如拉曼光谱中拉曼位移坐标和红外光谱中波数坐标可以按相同范围(波数4000cm-1至400cm-1)对齐。为了对齐,可以定义若干个插值光谱坐标值(例如M个值),在每个插值光谱坐标值处,经过插值的光谱数据中的幅度值可以根据下式(1)计算:
其中,um,interp为插值光谱坐标值,m=1,2,...,M(M为大于1的正整数);u0、u1是原光谱(如未进行对齐之前的拉曼光谱数据或红外光谱数据)在um,interp处左右两点坐标值,x0、x1是在u0、u1两点处的光谱幅度值。
通过上述基于式(1)的计算,可以将一组原始的拉曼光谱数据和一组原始的红外光谱数据分别融合成一组经过插值的拉曼光谱数据和一组经过插值的红外光谱数据。而该组经过插值的拉曼光谱数据和该组经过插值的红外光谱数据均对应于同一坐标系(波数)下的同一组坐标值,或者说是基于同一坐标系对齐的。这可以通过同一坐标系(波数)下的同一组坐标值来建立两组不同的光谱数据之间的关联性。
在将不同组光谱数据基于同一坐标系对齐之后,还可以通过上述子步骤S12来将经过对齐的所述多组一维光谱数据进行标准化。该标准化主要是用于对于各组一维光谱数据的幅度值进行规范化,从而便于后续处理。在一些实施例中,上述子步骤S12可以根据下式(2)来进行。假定上述经过插值的光谱数据为xinterp(即[x1,interp,x2,interp,...,xM,interp],为一列向量或行向量),则定义标准化的光谱数据xstd为
其中,和sinterp分别为经过插值的光谱数据xinterp的均值和标准差。
在一些实施例中,经过对齐和标准化之后的多组一维光谱数据,可以在子步骤S13中被叠加为二维光谱矩阵。例如,所述经过标准化的所述多组一维光谱数据可包括N组一维光谱数据,且每组一维光谱数据的长度为M,所述二维光谱矩阵为N×M矩阵,所述二维光谱矩阵的N个行向量分别由所述N组一维光谱数据构成。其中,N和M均为大于1的正整数。假定第i组(i大于等于1且小于等于N)经过标准化的一维光谱数据为[xil,std,xi2,std,...,xiM,std],则形成的二维光谱矩阵可以为
该二维光谱矩阵Dstd可以称为一个标准样本数据体,可以作为卷积神经网络分类器的输入,从而利用卷积神经网络对所述二维光谱矩阵进行分类以确定所述待测样品中的物质。
下面对根据本发明的实施例的物质识别方法中所采用的卷积神经网络进行示例性的介绍。
图3给出了用作根据本发明的实施例的物质识别方法中的分类器的卷积神经网络的示例。该卷积神经网络可包括输入层10、输出层20以及位于所述输入层10和输出层20之间的多个中间层30。所述输入层10可以用于将所述二维光谱矩阵输入所述卷积神经网络。所述输出层用于输出多个分类{y1,...,yk},其中k为大于等于2的整数,所述多个分类分别对应于待测样品所可能包含的不同的预定物质。每个分类可以看成是与待测样品的一种可能的预定物质或预定物质的组合相对应。例如,待测样品的成分可能有十种,则分类的个数可以是10。卷积神经网络可以根据输入的多组光谱数据来判定待测样品中的物质与哪种分类(预定物质)的特征(如二维指纹)更接近,从而确定待测样品中的物质。具体如何来判定待测样品中的物质,则是由所述多个中间层30来实现的。多个中间层30配置成对从所述输入层10输入的所述二维光谱矩阵进行处理并将经过处理的数据传送至输出层20。
在图3所示的示例中,所述多个中间层30依次包括:第一卷积层31、第一池化层32、第二卷积层33、第二池化层34、第三卷积层35、第三池化层36、全连接输入层37以及全连接隐藏层38。假定从输入层输入的是N×M的二维光谱矩阵,则第一卷积层31可设有δ个卷积核311(在图3中仅仅示意性地表示了一个卷积核),卷积窗口的尺寸可设置成N×λ1。由于二维光谱矩阵作为样本数据体需要与每个卷积核进行卷积运算,因此,第一卷积层31所输出的是一个δ×M的二维矩阵。图3中为了形象地表示,绘出了二维矩阵的行向量所对应的示例性的光谱图。第一池化层32的作用是对δ×M的二维矩阵重新采样,具体地,第一池化层32可以将δ×M的二维矩阵中的每两列元素中对应的元素取最大值而将这两列元素合并为一列元素。于是,经过第一池化层32之后,δ×M的二维矩阵被重新采样为δ×(M/2)的二维矩阵。类似地,再经过第二卷积层33进行处理,可得到2δ×(M/2)的二维矩阵,其中第二卷积层33中具有2δ个卷积核331,卷积窗口的尺寸为N×λ2。之后再经过第二池化层34处理可得到2δ×(M/4)的二维矩阵,第二池化层34的作用与第一池化层32相同,用于将2δ×(M/4)的二维矩阵中的每两列元素中对应的元素取最大值而将这两列元素合并为一列元素。第三卷积层35具有4δ个卷积核351,卷积窗口的尺寸为N×λ3。经过第三卷积层35处理可以得到4δ×(M/4)的二维矩阵。之后,再经过第三池化层36处理可得到4δ×(M/8)的二维矩阵,第三池化层36的作用与第一池化层32和第二池化层34相同,用于将4δ×(M/4)的二维矩阵中的每两列元素中对应的元素取最大值而将这两列元素合并为一列元素。作为示例,δ可以是2的整数次方,例如可以为16。作为示例,λ1例如可以为11,λ2例如可以为5,λ3例如可以为3。
在经过上述一系列卷积层和池化层的处理之后得到的4δ×(M/8)的二维矩阵可以被进行一维展平之后输入到全连接输入层37中。该一维展平过程可以简单地采用将二维矩阵的各个列(或各个行)首尾相接的连在一起形成一维矩阵即可。全连接输入层37的神经元个数可以例如有4δ×(M/8)个。在全连接输入层37和输出层20之间还设置有全连接隐藏层38。全连接隐藏层38的神经元个数可以根据实际需要选定任意数值,例如可以为1024个。全连接输入层37、全连接隐藏层38和输出层20可以看成是一个单潜层全连接神经网络。
为了对于上述卷积神经网络的参数进行优化,可以使用已知标准样品的参考光谱数据对于该卷积神经网络进行训练。在一些实施例中,在步骤S20之前,根据本发明的实施例的物质识别方法还可以包括:
步骤S31:生成模拟训练样本;以及
步骤S32:基于该模拟训练样本对所述卷积神经网络进行训练。
可以利用标准的参考光谱数据来生成标准训练样本。然而,如果仅仅利用这种标准训练样本来对卷积神经网络进行训练,卷积神经网络抗干扰的能力可能会比较弱。为此,在本发明的一些实施例中,还可以通过模拟实际中的光谱数据中的各种扰动因素来生成模拟训练样本,从而提高卷积神经网络的抗干扰能力。例如,如图5所示,步骤S31还可以包括:
子步骤S311:以与将待测样品的多组一维光谱数据融合成二维光谱矩阵相同的方式将多组一维参考光谱数据融合成二维参考光谱矩阵;以及
子步骤S312:对于二维参考光谱矩阵中的光谱数据施加模拟的谱峰偏移、强度变化和基线变化中的至少一者以生成模拟训练样本。
上述“一维参考光谱数据”是指由已知的标准样品获得的比较理想的、没有误差或误差较小的一维光谱数据。而“二维参考光谱矩阵”是利用上述“一维参考光谱数据”以与待测样品的实际采集的多组一维光谱数据融合成二维光谱矩阵相同的方式获得的二维光谱矩阵。由于与二维参考光谱矩阵所对应的样品中所包含的物质是已知的,因此,其可以用于对卷积神经网络进行训练。而在子步骤S312中,在二维参考光谱矩阵的基础上还增加了实际采集的光谱数据中可能出现的谱峰偏移、强度变化和基线变化中的至少一种情况。下面逐一进行举例说明:
模拟谱峰偏移:通过将二维参考光谱矩阵中的各行参考光谱数据(每行参考光谱数据对应于一组一维光谱)(或称标准光谱数据)xstd沿着一维坐标平移d个单位(例如,对于拉曼光谱或红外光谱,每个单位可以是数个cm-1)来模拟谱峰偏移,从而得到谱峰偏移模拟光谱xshift(xshift表示的是xstd经过上述偏移之后得到的光谱),当二维参考光谱矩阵为N×M矩阵时,在模拟谱峰偏移时,第1~M点光谱坐标范围外的光谱数据不予考虑,如果需要可以空位补零。作为示例,d可以为服从[-5,5]之间的均匀分布的随机整数。对于二维参考光谱矩阵中的不同行的参考光谱数据,d可以不同。
模拟强度变化:强度变化模拟通过在二维参考光谱矩阵中的各行参考光谱数据加入随机噪声向量ε生成,其中随机噪声向量ε中的各元素服从正态分布(例如数学期望为0、方差为0.01的正态分布N(0,0.01))。
模拟基线变化:提取多种已知标准样品的光谱数据(原始谱图)的基线(例如可以用AsLS(非对称最小二乘法)算法来提取所述基线),建立标准基线库。由于标准基线库中的基线各不相同且根据实际的光谱数据所提取,因此,基线库中的数据可以反映基线的一般性的变化规律。从基线库中随机抽取数据并乘以[0,p]间均匀分布的随机值以形成模拟基线变化向量β,例如p可以为1至10之间的任意数,比如为2。
考虑上述对于各种干扰因素的模拟,最终得到的模拟样本数据体Dsim为
其中/>
其中,N为二维参考光谱矩阵的行数(即二维参考光谱矩阵中所包含的一维光谱数据的个数),xsim (n)为Dsim的第n行的行向量(1≤n≤N),xshift (n)为由未考虑上述干扰因素的参考光谱数据施加一定的偏移(例如偏移量为d)得到的光谱数据,ε(n)为随机噪声向量,β(n)为模拟基线变化向量。xshift (n)、ε(n)和β(n)也是行向量的形式以便于形成xsim (n)。对于不同行的行向量(即对于不同的n),ε(n)和β(n)可以相同,也可以不同。上述模拟样本数据体Dsim可以用作模拟训练样本来训练卷积神经网络以改进其分类模型。
在上述式(4)给出的示例中,考虑了模拟谱峰偏移、强度变化和基线变化的情况,然而本发明的实施例不限于此,例如,在形成模拟训练样本过程中,也可以只考虑谱峰偏移、强度变化和基线变化中的一者或两者,这只需要将式(4)中不需要考虑的干扰项设为零即可。
在一些实施例中,可以由一个已知标准样品的多组一维参考光谱数据生成很多个(比如上百个)模拟训练样本来训练卷积神经网络。也可以基于多个已知标准样品来生成模拟训练样本来训练卷积神经网络。
需要说明的是,在上述实施例中,通过子步骤S311所获得的二维参考光谱矩阵可以看成是不包含上述干扰因素的标准训练样本。在本发明的实施例中,并不限于仅仅采用上述模拟训练样本来训练卷积神经网络,也可以采用标准训练样本和模拟训练样本来共同训练卷积神经网络。
图4示出了利用模拟训练样本来训练卷积神经网络的原理性示意图。在图4中,对于图3中示出的卷积层和池化层进行了合并显示,不再显示其细节,以使得图4更为清晰简洁。训练卷积神经网络的目的是改进卷积神经网络的分类模型参数。在如图3和图4所示的卷积神经网络的示例中,其分类模型参数主要包括:各个卷积层的卷积核的响应函数f(x)(每个卷积核的响应函数可以不同)、全连接输入层37以及全连接隐藏层38的映射函数wx+b。其中,w称为权重向量,b为偏置值。为了进行区分,可以令全连接输入层37的映射函数为w1x+b1,并令全连接隐藏层38的映射函数为w2x+b2。权重向量w1和偏置值b1可以分别与权重向量w2和偏置值b2不同。
如图4所示,当模拟样本数据体Dsim输入卷积神经网络求得输出向量之后,将输出向量与正确的结果向量进行比较(用于比较实际输出向量和已知的正确的结果向量之间的差异的函数称为成本函数),并将比较的结果反馈给卷积神经网络来调整包括各个卷积层的卷积核的响应函数f(x)以及映射函数wx+b中的权重向量w和偏置值b等参数,以对卷积神经网络进行反复训练,使分类模型不断进行优化,直至满足要求为止。这一过程也称为反向传播优化神经网络参数的过程。本领域技术人员应当理解,上述映射函数还可以包括sigmod函数或ReLU等函数作为激活函数,但激活函数由于不包括除去上述权重向量w和偏置值b之外的其他随着上述训练而改变的参数,因此,在此不再赘述。成本函数例如可以通过计算输出向量与正确的结果向量之间的欧式距离等方式来构造,这些都是为本领域技术人员所熟知的内容,在此不再赘述。
需要说明的是,上述卷积神经网络仅仅是示例性的,本发明的实施例不限于此,也可以采用其它结构的卷积神经网络。
在对待测样品的光谱进行检测的过程中,仪器状态、测量环境、样品状态都会引起光谱数据的强度、峰位、基线等出现偏移,传统识别模型对这些偏移较敏感,而多组一维光谱数据综合在一起的偏移情况更加复杂,难以校正,造成模型的适用性差。而在本发明的实施例中,一方面采用了基于二维光谱矩阵的卷积神经网络,该卷积神经网络的卷积特性有利于提高分类器对谱峰的坐标偏移和强度变化的适应性;另一方面,通过模拟光谱中的各种干扰因素来构建模拟训练样本以使得对于卷积神经网络的训练更有针对性,从而提高了神经网络的分类器对谱峰的上述干扰因素的适应性。
在本发明的一些实施例中,如图1所示,在上述步骤S10之前,所述物质识别方法还可以包括:
步骤S40:对所述待测样品的所述多组一维光谱数据进行预处理。
对于所述多组一维光谱数据的预处理,可以实现降低噪声、去基线和增强光谱分辨率等效果。作为示例,结合具体的光谱特点可选用非对称最小二乘法、Savitzky-Golay(S-G)卷积平滑、Savitzky-Golay(S-G)卷积求导等方法。
S-G卷积平滑用于一般光谱的降低噪声处理,经过S-G卷积平滑后的一维光谱的第i个数值为:
其中,xi代表一维光谱x的第i个数值,i=0,1,...,M(M为一维光谱数据的长度);w是半窗口宽度,取值一般大于光谱峰的半峰宽的1.5倍;hk,smooth是S-G平滑系数,可以由多项式最小二乘拟合求取,也可根据实际经验选取。
S-G卷积求导用于消除基线干扰和提高光谱分辨率,经过S-G卷积求导后的一维光谱的第i个数值为:
其中,xi代表一维光谱x的第i个数值,i=0,1,...,M(M为一维光谱数据的长度);w是半窗口宽度,取值一般大于光谱峰的半峰宽的1.5倍;hk,derivative是S-G导数系数,可以由多项式最小二乘拟合求取,也可根据实际经验选取。
非对称最小二乘法(asymmetric least squares,AsLS)用于一维光谱数据的基线校正,对一维光谱x拟合出基线向量z如下式,然后扣除:
其中,μ是正则化参数,一般为104~106;p是非对称权重,可设定为0.001~0.01;Δ2zi表示z的二阶差分导数。
在一些实施例中,所述多组一维光谱数据可以包括紫外光谱数据、可见光谱数据、红外光谱数据、拉曼光谱数据、原子吸收光谱数据、原子荧光光谱数据以及X射线荧光光谱数据中的一种或多种。
如图1所示,在一些实施例中,在步骤S40之前,所述物质识别方法还可以包括:
步骤S50:通过多个光谱检测器分别采集待测样品的所述多组一维光谱数据。
所述多个光谱检测器可以包括用于采集不同种类的光谱数据的多个光谱检测装置(例如光谱仪等),也可以包括用于采集同种光谱数据的不同的光谱检测装置。
本发明的实施例还提供了一种物质识别设备100。如图6所示,该物质识别设备100包括:多个光谱检测器21、22、23、存储器30和处理器40。所述多个光谱检测器21、22、23用于分别采集待测样品的多组一维光谱数据。存储器30配置用于存储指令和数据,例如由光谱检测器21、22、23采集的一维光谱数据以及在处理器40运算过程中产生的数据等等。处理器40可以配置用于执行所述指令以:将待测样品的多组一维光谱数据融合成二维光谱矩阵;以及利用卷积神经网络对所述二维光谱矩阵进行分类以确定所述待测样品中的物质。处理器40还可以配置用于执行上述任一实施例所述的物质识别方法的各个步骤。
在本发明的一些实施例中,该物质识别设备100还可以包括输入装置(如鼠标、键盘、语音输入等)、用于交互显示的显示设备以及用于交换数据的接口和总线等。存储器30例如可以包括只读存储器(ROM)、随机存取存储器(RAM)等。
图7以功能模块形式示出了根据本发明的实施例的物质识别设备的示意性结构。该物质识别设备可以包括:检测器模块41、预处理模块42、光谱融合器模块43、训练样本生成器模块44以及分类器模块45。该检测器模块41用于采集待测样品的一维光谱数据。该预处理模块42可以用于对由检测器模块41采集到的多组一维光谱数据进行预处理,以实现降低噪声、去除基线、提高分辨率等效果。该光谱融合器模块43用于将多组一维光谱数据融合成二维光谱矩阵。分类器模块45可以包括卷积神经网络模型,用于对二维光谱矩阵中的光谱数据进行分类运算以确定待测样品中的物质。训练样本生成器模块44用于根据已知的标准样品的光谱数据和各种干扰因素来生成模拟训练样本,用于对上述卷积神经网络模型进行训练以优化模型参数,提高分类器模块45的性能。上述模块中检测器模块41、预处理模块42、和训练样本生成器模块44为根据本发明的实施例的物质识别设备的可选模块。
本发明的实施例还提供了一种物质识别设备。该物质识别设备包括:
将待测样品的多组一维光谱数据融合成二维光谱矩阵的装置;以及
通过利用卷积神经网络对所述二维光谱矩阵进行分类来识别所述待测样品中的物质的装置。
在一些实施例中,所述将待测样品的多组一维光谱数据融合成二维光谱矩阵的装置包括:
对所述多组一维光谱数据根据光谱关联性进行插值以将所述多组一维光谱数据基于同一坐标系对齐的装置;
将经过对齐的所述多组一维光谱数据进行标准化的装置;以及
将经过标准化的所述多组一维光谱数据叠加成二维光谱矩阵的装置。
在一些实施例中,所述物质识别设备还包括:
生成模拟训练样本的装置;以及
基于该模拟训练样本对所述卷积神经网络进行训练的装置。
在一些实施例中,所述生成模拟训练样本的装置包括:
以与将待测样品的多组一维光谱数据融合成二维光谱矩阵相同的方式将多组一维参考光谱数据融合成二维参考光谱矩阵的装置;
对于二维参考光谱矩阵中的光谱数据施加模拟的谱峰偏移、强度变化和基线变化中的至少一者以生成模拟训练样本的装置。
在一些实施例中,所述物质识别设备还包括:
对所述待测样品的所述多组一维光谱数据进行非对称最小二乘法、S-G卷积平滑、S-G卷积求导中的一种或多种预处理的装置。
根据本发明的实施例的物质识别方法和设备至少具有以下优势:
(1)提高物质识别的准确率。本发明的实施例利用模式识别原理,以同类样品为基础获取一个具有该类特异性的模式,使用分类器作为机器学习或化学计量学的智能学习算法,从多种谱图数据的有机整体中学习出上述模式。根据本发明的实施例的物质识别方法和设备使用卷积神经网络对构成为二维光谱矩阵的数据体的整体特征进行识别,可以改善分类性能以提高物质识别的准确率。
(2)方法更稳健。根据本发明的实施例的物质识别方法和设备利用卷积神经网络的卷积特性使得分类器对谱峰的坐标偏移和强度变化不敏感;并且通过衍生的大量模拟样本数据体模拟实际的测量环境中的各种因素产生的谱图干扰,基于这种模拟样本所训练的卷积神经网络模型更加稳健。
(3)降低过拟合风险。根据本发明的实施例的物质识别方法和设备关注二维光谱矩阵的整体特征,而不从细节上考虑所有光谱变量,这简化了算法,减小了卷积神经网络模型的过拟合风险。
本发明的实施例还提供了一种计算机可读存储介质,其中存储有计算机指令,当所述指令被处理器执行时实现上述任一实施例所述的方法。
以上的详细描述通过使用示意图、流程图和/或示例,已经阐述了上述物质识别方法和设备的众多实施例。在这种示意图、流程图和/或示例包含一个或多个功能和/或操作的情况下,本领域技术人员应理解,这种示意图、流程图或示例中的每一功能和/或操作可以通过各种结构、硬件、软件、固件或实质上它们的任意组合来单独和/或共同实现。在一个实施例中,本发明的实施例所述主题的若干部分可以通过专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)、或其他集成格式来实现。然而,本领域技术人员应认识到,这里所公开的实施例的一些方面在整体上或部分地可以等同地实现在集成电路中,实现为在一台或多台计算机上运行的一个或多个计算机程序(例如,实现为在一台或多台计算机系统上运行的一个或多个程序),实现为在一个或多个处理器上运行的一个或多个程序(例如,实现为在一个或多个微处理器上运行的一个或多个程序),实现为固件,或者实质上实现为上述方式的任意组合,并且本领域技术人员根据本公开,将具备设计电路和/或写入软件和/或固件代码的能力。此外,本领域技术人员将认识到,本公开所述主题的机制能够作为多种形式的程序产品进行分发,并且无论实际用来执行分发的信号承载介质的具体类型如何,本公开所述主题的示例性实施例均适用。信号承载介质的示例包括但不限于:可记录型介质,如软盘、硬盘驱动器、光盘(CD、DVD)、数字磁带、计算机存储器等;以及传输型介质,如数字和/或模拟通信介质(例如,光纤光缆、波导、有线通信链路、无线通信链路等)。
根据本发明的上述各种实施方式的物质识别方法和设备是以光谱检测为基础的。所述物质识别方法和设备可以独立使用,也可以与其他的物质识别方法和装置结合使用。例如,上述物质识别设备中的光谱检测器及相关的算法可以与辐射剂量检测装置和/或气味检测装置一起使用。具体的,在一些实施例中,除去上述实施例中所涉及的部件之外,所述物质识别设备还可以包括异常气味监测器,该异常气味监测器可以配置成在现场监测待测样品(物体)自身扩散或辐射出来的异常气味。在一些实施例中,所述物质识别设备还可以包括辐射剂量监测器,所述辐射剂量监测器可以用于监测待测样品的外部照射贯穿辐射剂量。在设有辐射剂量监测器的情况下,所述物质识别设备中的处理器还可以被配置成确定所述待测样品的外部照射贯穿辐射剂量是否超标。在设有异常气味监测器的情况下,所述物质识别设备中的处理器还可以被配置成确定所述待测样品散发的气味是否异常。
物质识别设备将多光谱融合检测技术与辐射剂量检测、异常气味检测等技术相结合,能更好地在现场进行物质识别。
除非存在技术障碍或矛盾,本发明的上述各种实施方式可以自由组合以形成另外的实施例,这些另外的实施例均在本发明的保护范围中。
虽然结合附图对本发明进行了说明,但是附图中公开的实施例旨在对本发明优选实施方式进行示例性说明,而不能理解为对本发明的一种限制。
虽然本发明总体构思的一些实施例已被显示和说明,本领域普通技术人员将理解,在不背离本总体发明构思的原则和精神的情况下,可对这些实施例做出改变,本发明的范围以权利要求和它们的等同物限定。
Claims (10)
1.一种物质识别方法,包括:
将待测样品的多组一维光谱数据融合成二维光谱矩阵;以及
通过利用卷积神经网络对所述二维光谱矩阵进行分类来识别所述待测样品中的物质,其中,所述多组一维光谱数据包括紫外光谱数据、可见光谱数据、红外光谱数据、拉曼光谱数据、原子吸收光谱数据、原子荧光光谱数据以及X射线荧光光谱数据中的多种,且所述将待测样品的多组一维光谱数据融合成二维光谱矩阵包括:
对所述多组一维光谱数据根据光谱关联性进行插值以将所述多组一维光谱数据基于同一坐标系对齐;
将经过对齐的所述多组一维光谱数据进行标准化;以及
将经过标准化的所述多组一维光谱数据叠加成二维光谱矩阵,
其中,所述多组一维光谱数据包括红外光谱数据和拉曼光谱数据,所述红外光谱数据和拉曼光谱数据基于同一坐标系对齐后,对于待测样品所包含的物质中各官能团的信息关联成二维指纹。
2.根据权利要求1所述的物质识别方法,其中,所述经过标准化的所述多组一维光谱数据包括N组一维光谱数据,且每组一维光谱数据的长度为M,所述二维光谱矩阵为N×M矩阵,所述二维光谱矩阵的N个行向量分别由所述N组一维光谱数据构成,其中,M和N均为大于1的正整数。
3.根据权利要求1或2所述的物质识别方法,在通过利用卷积神经网络对所述二维光谱矩阵进行分类来识别所述待测样品中的物质之前还包括:
生成模拟训练样本;以及
基于该模拟训练样本对所述卷积神经网络进行训练。
4.根据权利要求3所述的物质识别方法,其中,所述生成模拟训练样本包括:
以与将待测样品的多组一维光谱数据融合成二维光谱矩阵相同的方式将多组一维参考光谱数据融合成二维参考光谱矩阵;
对于二维参考光谱矩阵中的光谱数据施加模拟的谱峰偏移、强度变化和基线变化中的至少一者以生成模拟训练样本。
5.根据权利要求1或2所述的物质识别方法,在将待测样品的多组一维光谱数据融合成二维光谱矩阵之前还包括:
对所述待测样品的所述多组一维光谱数据进行非对称最小二乘法、S-G卷积平滑、S-G卷积求导中的一种或多种预处理。
6.根据权利要求1或2所述的物质识别方法,其中,所述卷积神经网络包括:
输入层,所述输入层用于将所述二维光谱矩阵输入所述卷积神经网络;
输出层,所述输出层用于输出多个分类,所述多个分类分别对应于待测样品中的不同的预定物质;以及
位于所述输入层和输出层之间的多个中间层,所述多个中间层配置成对从所述输入层输入的所述二维光谱矩阵进行处理并将经过处理的数据传送至输出层。
7.根据权利要求6所述的物质识别方法,其中,所述多个中间层依次包括:第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、全连接输入层以及全连接隐藏层。
8.根据权利要求1或2所述的物质识别方法,其中,在将待测样品的多组一维光谱数据融合成二维光谱矩阵之前,所述物质识别方法还包括:
通过多个光谱检测器分别采集待测样品的所述多组一维光谱数据。
9.一种物质识别设备,包括:
多个光谱检测器,用于分别采集待测样品的多组一维光谱数据;
存储器,配置用于存储指令和数据;
处理器,配置用于执行所述指令以:
将待测样品的多组一维光谱数据融合成二维光谱矩阵;以及
利用卷积神经网络对所述二维光谱矩阵进行分类以识别所述待测样品中的物质,
其中,所述多组一维光谱数据包括紫外光谱数据、可见光谱数据、红外光谱数据、拉曼光谱数据、原子吸收光谱数据、原子荧光光谱数据以及X射线荧光光谱数据中的多种,且
所述将待测样品的多组一维光谱数据融合成二维光谱矩阵包括:
对所述多组一维光谱数据根据光谱关联性进行插值以将所述多组一维光谱数据基于同一坐标系对齐;
将经过对齐的所述多组一维光谱数据进行标准化;以及
将经过标准化的所述多组一维光谱数据叠加成二维光谱矩阵,且
其中,所述多组一维光谱数据包括红外光谱数据和拉曼光谱数据,所述红外光谱数据和拉曼光谱数据基于同一坐标系对齐后,对于待测样品所包含的物质中各官能团的信息关联成二维指纹。
10.一种计算机可读存储介质,其中存储有计算机指令,当所述指令被处理器执行时实现根据权利要求1至7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911321141.2A CN111222543B (zh) | 2019-12-19 | 2019-12-19 | 物质识别方法和设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911321141.2A CN111222543B (zh) | 2019-12-19 | 2019-12-19 | 物质识别方法和设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111222543A CN111222543A (zh) | 2020-06-02 |
CN111222543B true CN111222543B (zh) | 2024-03-22 |
Family
ID=70827915
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911321141.2A Active CN111222543B (zh) | 2019-12-19 | 2019-12-19 | 物质识别方法和设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111222543B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111982855A (zh) * | 2020-08-12 | 2020-11-24 | 广东工业大学 | 一种通过光谱信号进行物质识别的方法及其应用 |
WO2024121773A1 (de) * | 2022-12-06 | 2024-06-13 | Helmut Fischer GmbH Institut für Elektronik und Messtechnik | Verfahren und vorrichtung zur durchführung einer spektralanalyse zur ermittlung eines spektrums von einer probe |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101949824A (zh) * | 2009-06-30 | 2011-01-19 | 武汉矽感科技有限公司 | 根据物质的光谱信息对商品进行检测的方法和系统装置 |
CN104807803A (zh) * | 2015-04-20 | 2015-07-29 | 武汉轻工大学 | 基于多源光谱数据融合的花生油掺伪定量检测方法 |
CN105806824A (zh) * | 2016-03-22 | 2016-07-27 | 武汉轻工大学 | 基于多源光谱特征融合的食用油种类快速鉴别方法 |
GB201611033D0 (en) * | 2016-06-24 | 2016-08-10 | Imp College Of Science Tech And Medicine | Detecting objects in video data |
CN106124449A (zh) * | 2016-06-07 | 2016-11-16 | 中国科学院合肥物质科学研究院 | 一种基于深度学习技术的土壤近红外光谱分析预测方法 |
CN107219188A (zh) * | 2017-06-02 | 2017-09-29 | 中国计量大学 | 一种基于改进dbn的近红外光谱分析纺织品棉含量的方法 |
CN108921100A (zh) * | 2018-07-04 | 2018-11-30 | 武汉高德智感科技有限公司 | 一种基于可见光图像与红外图像融合的人脸识别方法及系统 |
WO2019028004A1 (en) * | 2017-07-31 | 2019-02-07 | Smiths Detection Inc. | SYSTEM FOR DETERMINING THE PRESENCE OF A SUBSTANCE OF INTEREST IN A SAMPLE |
CN109520999A (zh) * | 2019-01-17 | 2019-03-26 | 云南中烟工业有限责任公司 | 一种基于二维相关光谱的香紫苏油稳定性评价方法 |
CN110068544A (zh) * | 2019-05-08 | 2019-07-30 | 广东工业大学 | 物质识别网络模型训练方法及太赫兹光谱物质识别方法 |
CN110503003A (zh) * | 2019-07-29 | 2019-11-26 | 杭州电子科技大学 | 基于led阵列与卷积神经网络的茶叶品种鉴定装置与方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7076463B2 (ja) * | 2017-10-16 | 2022-05-27 | 浜松ホトニクス株式会社 | スペクトル分析装置およびスペクトル分析方法 |
-
2019
- 2019-12-19 CN CN201911321141.2A patent/CN111222543B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101949824A (zh) * | 2009-06-30 | 2011-01-19 | 武汉矽感科技有限公司 | 根据物质的光谱信息对商品进行检测的方法和系统装置 |
CN104807803A (zh) * | 2015-04-20 | 2015-07-29 | 武汉轻工大学 | 基于多源光谱数据融合的花生油掺伪定量检测方法 |
CN105806824A (zh) * | 2016-03-22 | 2016-07-27 | 武汉轻工大学 | 基于多源光谱特征融合的食用油种类快速鉴别方法 |
CN106124449A (zh) * | 2016-06-07 | 2016-11-16 | 中国科学院合肥物质科学研究院 | 一种基于深度学习技术的土壤近红外光谱分析预测方法 |
GB201611033D0 (en) * | 2016-06-24 | 2016-08-10 | Imp College Of Science Tech And Medicine | Detecting objects in video data |
CN107219188A (zh) * | 2017-06-02 | 2017-09-29 | 中国计量大学 | 一种基于改进dbn的近红外光谱分析纺织品棉含量的方法 |
WO2019028004A1 (en) * | 2017-07-31 | 2019-02-07 | Smiths Detection Inc. | SYSTEM FOR DETERMINING THE PRESENCE OF A SUBSTANCE OF INTEREST IN A SAMPLE |
CN108921100A (zh) * | 2018-07-04 | 2018-11-30 | 武汉高德智感科技有限公司 | 一种基于可见光图像与红外图像融合的人脸识别方法及系统 |
CN109520999A (zh) * | 2019-01-17 | 2019-03-26 | 云南中烟工业有限责任公司 | 一种基于二维相关光谱的香紫苏油稳定性评价方法 |
CN110068544A (zh) * | 2019-05-08 | 2019-07-30 | 广东工业大学 | 物质识别网络模型训练方法及太赫兹光谱物质识别方法 |
CN110503003A (zh) * | 2019-07-29 | 2019-11-26 | 杭州电子科技大学 | 基于led阵列与卷积神经网络的茶叶品种鉴定装置与方法 |
Non-Patent Citations (2)
Title |
---|
Characterization of humic substances by advanced solid state NMR spectroscopy: Demonstration of a systematic approach;Mao, JD等;《ORGANIC GEOCHEMISTRY》;20110901;第42卷(第8期);891-902 * |
基于人工神经网络的X射线吸收光谱物质识别方法研究;王倩;《中国优秀硕士学位论文全文数据库基础科学辑》;20190715(第2019 年 第07期期);10-40 * |
Also Published As
Publication number | Publication date |
---|---|
CN111222543A (zh) | 2020-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wspanialy et al. | A detection and severity estimation system for generic diseases of tomato greenhouse plants | |
Gamboa et al. | Validation of the rapid detection approach for enhancing the electronic nose systems performance, using different deep learning models and support vector machines | |
Hopke | The evolution of chemometrics | |
Bai et al. | Accurate prediction of soluble solid content of apples from multiple geographical regions by combining deep learning with spectral fingerprint features | |
Xiaobo et al. | Variables selection methods in near-infrared spectroscopy | |
Lu et al. | Classification of Camellia (Theaceae) species using leaf architecture variations and pattern recognition techniques | |
Li et al. | Prediction of egg storage time and yolk index based on electronic nose combined with chemometric methods | |
JPH08500898A (ja) | 複合データを解釈して異常な器機または処理挙動を検出する改良法 | |
CN115828140B (zh) | 邻域互信息与随机森林相融合故障检测方法、系统及应用 | |
CN112294341B (zh) | 一种基于轻量卷积神经网络的睡眠脑电纺锤波识别方法及系统 | |
CN111222543B (zh) | 物质识别方法和设备及计算机可读存储介质 | |
Navarro et al. | Automatic spectral classification of stellar spectra with low signal-to-noise ratio using artificial neural networks | |
Garces et al. | Outliers detection in environmental monitoring databases | |
CN113049500B (zh) | 水质检测模型训练和水质检测方法、电子设备及存储介质 | |
CN112712108A (zh) | 一种拉曼光谱多元数据分析方法 | |
CN113030001B (zh) | 一种水果糖度检测方法及系统 | |
He et al. | Fast discrimination of apple varieties using Vis/NIR spectroscopy | |
Cen et al. | Combination and comparison of multivariate analysis for the identification of orange varieties using visible and near infrared reflectance spectroscopy | |
Oliveri et al. | Chemometrics for food authenticity applications | |
WO2020130947A1 (en) | Method and system for predicting quantitative measures of oil adulteration of an edible oil sample | |
CN113899702A (zh) | 一种基于量子傅里叶变换的疫苗多光谱快速检测方法 | |
Wen et al. | Rapid odor recognition based on reliefF algorithm using electronic nose and its application in fruit identification and classification | |
Coughlin et al. | Prospects for searches for long-duration gravitational-waves without time slides | |
Shen et al. | Single convolutional neural network model for multiple preprocessing of Raman spectra | |
Jinadasa et al. | Deep learning approach for Raman spectroscopy |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |