CN109543763A - 一种基于卷积神经网络的拉曼光谱分析方法 - Google Patents

一种基于卷积神经网络的拉曼光谱分析方法 Download PDF

Info

Publication number
CN109543763A
CN109543763A CN201811437661.5A CN201811437661A CN109543763A CN 109543763 A CN109543763 A CN 109543763A CN 201811437661 A CN201811437661 A CN 201811437661A CN 109543763 A CN109543763 A CN 109543763A
Authority
CN
China
Prior art keywords
layer
output
neural network
denoising
raman spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811437661.5A
Other languages
English (en)
Other versions
CN109543763B (zh
Inventor
洪明坚
沈东旭
董家林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN201811437661.5A priority Critical patent/CN109543763B/zh
Publication of CN109543763A publication Critical patent/CN109543763A/zh
Application granted granted Critical
Publication of CN109543763B publication Critical patent/CN109543763B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/65Raman scattering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2201/00Features of devices classified in G01N21/00
    • G01N2201/12Circuits of general importance; Signal processing
    • G01N2201/129Using chemometrical methods
    • G01N2201/1296Using chemometrical methods using neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Abstract

本发明涉及一种基于卷积神经网络的拉曼光谱分析方法,首先是建立分类模型,建立过程是对已经物质的拉曼光谱进行预处理,再将预处理后的拉曼光谱输入神经网络进行训练,确定每层网络中的权值,从而确定分类模型,将这一模型命名为RS‑CNN,其次将待预测物质的拉曼光谱进行预处理,然后将预处理的后的带预测物质的拉曼光谱输入分类模型中,分类模型的输出即是分类结果。将卷积神经网络去噪和基线校正以卷积的方式融入到卷积神经网络中,从而将预处理过程和鉴别问题转化在统一的模型框架中求解,实现了数据的自适应处理,弥补了传统方法的不足。

Description

一种基于卷积神经网络的拉曼光谱分析方法
技术领域
本发明涉及光谱分析方法领域,特别涉及一种基于卷积神经网络的拉曼光谱分析方法。
背景技术
通过仪器测量得到原始拉曼光谱通常都伴有严重的噪声和基线漂移,鉴别时限制了对光 谱数据中有用信息的提取,因此,拉曼光谱分析过程中通常有较为繁琐的去噪和基线校正的 过程。
现目前大多数的去噪和基线校正的方法均独立于模型,这增加了因预处理不当而造成的 模型预测能力下降的风险。同时受待测物质的物理特性(如颗粒度,装填密度和均匀性等)、 环境温度和探测器的非线性响应等影响,拉曼光谱与待测物质的性质和成分含量存在一定的 非线性关系,但是现阶段的大多数拉曼光谱定性或定量的校正方法都是线性模型,对于这种 非线性关系不能进行较好的表示。
现有技术在建立分类模型时,大都是根据经验预设模型参数,这种方法一方面限定了拉 曼光谱分析的准确性,另一方面根据待分类物质的特性不同,分类模型的参数也需要做调整, 因此根据经验值设定的预测模型参数后,只能用于对一些特定物质进行分类,每次在测定不 同物质时都需要对分类模型的参数进行重新设定,这不但导致分类模型的通用性差,更重要 的是分类模型分类的准确性也很难保证。
发明内容
针对现有技术存在的上述问题,本发明的目的是一种基于卷积神经网络的拉曼光谱分析 方法,该方法的目的是对物质分类,采用自适应的学习方法进行训练,得到分类模型的参数, 因此建立的分类模型的适用性更广,分类的准确性也更高。
为实现上述目的,本发明采用如下技术方案:一种基于卷积神经网络的拉曼光谱分析方 法,包括如下步骤:
S1:建立分类模型:
S1a:对训练数据集中每个训练样本的拉曼光谱进行预处理:
S1a1:对所有训练样本的拉曼光谱进行去噪:
将所有训练样本的拉曼光谱输入卷积去噪层层C1进行去噪,所述卷积去噪层层C1的输 出表示如下:
其中,x1表示卷积去噪层C1的输入,xc1表示卷积去噪层C1的输出,Wc1表示卷积去噪层C1的卷积核权重;Wc1,i是卷积去噪层C1层第i个权重,nc1是Wc1的权重总数;
S1a2:经过S1a1去噪后,再对训练样本的拉曼光谱进行基线校正:
将经过S1a1去噪后的训练样本的拉曼光谱输入基线校正层C2,所述基线校正层C2的输 出表示如下:
其中,xc2表示基线校正层C2的输出,Wc2表示基线校正层C2的卷积核,Wc2,i为基线校正层C2卷积核的第i个权值,nc2表示基线校正层C2卷积核的权值个数;
S1b:将S1a2矫正后的所有训练样本的拉曼光谱加上该训练样本的分类标签,输入神经 网络,设有n个训练样本,分类标签中有m个类,m和n均取自然数;
神经网络的输出为每个训练样本被分入某一类的概率值,对于每个训练样本会输出m个 概率,值最大的那个概率则为预测概率,该预测概率对应的类,则是该训练样本的预测分类;
统计预测准确率,当该预测准确率低于预设的准确率阈值时,通过损失函数调整神经网 络每层的权值,然后再将预处理后的所有训练样本的拉曼光谱加上每个训练样本对应的分类 标签,输入神神经网络进行迭代,直至统计的预测准确率大于等于准确率阈值时才结束迭代 过程,此时每层神经网络的权值已经确定,所述该神经网络即为分类模型;
S2:待测样本预测:
S2a:将所述待测样本的拉曼光谱采用S1a中所述的方法进行预处理;
S2b:将预处理后的待测样本的拉曼光谱输入S1b确定的分类模型中进行预测分类,得到 m个概率,值最大的那个概率则为预测概率,该预测概率对应的类,则是该待测样本的预测 分类。
作为改进,所述S1b中的神经网络为三层,分别记为F3层、F4层和F5层。
作为改进,所述神经网络中每一层输出都需要经过一个激活函数进行处理,具体地:
F3层输出需经过激活函数(10)的处理:
ReLU(xf3)=max(xf3,0)(10);
其中,xf3表示F3层的输出;;
F4层输出需经过激活函数(11)的处理:
ReLU(xf4)=max(xf4,0)11);
其中,xf4表示F4层的输出;
F5层输出需经过激活函数(12)的处理:
其中,xji表示第F5层输出的第j个样本属于第i类的概率,Sji表示经过激活函数处理 得到的第j个样本属于第i类的概率,m表示类别的个数,n表示训练样本的个数。
作为改进,所述S1b中的损失函数如下:
其中,表示第j个训练样本属于第i类的预测概率,yji表示第j个训练样 本属于第i类的概率,yji的值是根据标签获得。
相对于现有技术,本发明至少具有如下优点:(1)本发明方法中建立分类模型时,将 去噪和基线校正以卷积的方式融入中,从而将预处理过程和鉴别问题放在统一的模型框架中 求解,实现了光谱的自适应处理,弥补了传统方法的不足。
(2)本发明方法中建立分类模型时,去噪和基线校正过程中每一个卷积层中都只有一个 卷积核,相比于传统的网络解释性更强,而且更容易监控卷积层的输出,以查看是否达到预 期的效果。
(3)本发明的去噪和基线校正部分可以单独作为一个自适应光谱预处理器,将预处理后 得到的数据可以用于PLS-DA、SVM等其他分类器。
附图说明
图1为本发明基于卷积神经网络的拉曼光谱分析方法的流程图。
图2为卷积去噪层C1的原理图,2(a)为原始光谱图,2(b)为卷积核,图2(c)为 卷积后的光谱
图3为基线校正层C2的原理,图3(a)为原始光谱、卷积后的光谱、二者之差,图3(b)为卷积核。
图4为本发明方法中卷积神经网络RS-CNN的结构图。
图5为实施例1中卷积去噪层C1层的输入与输出的谱线比较。
图6为实施例1中卷积去噪层C1层卷积核系数。
图7为实施例1中基线校正层C2输入与输出比较。
图8为实施例1中的目标函数。
图9为实施例1中血液鉴别ROC曲线,图9(a)为PLS-DA方法,图9(b)为SVM,图9(c)为RS-CNN。
具体实施方式
下面对本发明作进一步详细说明。
本发明基于卷积神经网络的拉曼光谱分析方法的思路是:首先是建立分类模型,建立过 程是对已知物质的拉曼光谱进行预处理,再将预处理后的拉曼光谱输入神经网络进行训练, 确定每层网络中的权值,从而确定分类模型,这一分类模型即为卷积神经网络,用RS-CNN表 示,如图1所示,实现了在拉曼光谱分析时,根据定性目标自适应的数据预处理以及校正的过 程。其次将待预测物质的拉曼光谱进行预处理,然后将预处理的后的带预测物质的拉曼光谱 输入分类模型中,分类模型的输出即是分类结果。
本发明中的卷积神经网络首先是对池化层进行改动,池化层会导致光谱信息丢失,应该 删除池化层。然后是对卷积层进行改动,卷积层实现了对拉曼光谱的卷积和去噪,为了达到 更好的去噪效果,对卷积去噪层的卷积核的增加权重非负与和为1的约束;为了去掉光谱的 基线,卷积基线校正层采用较宽的卷积核去除基线。以上改进能对光谱数据进行较好的预处 理,将这些预处理后的数据通过全连接层建立校正模型。
本发明创造性的将神经网络与拉曼光谱分析进行结合,通过神经网络建立分类模型具有 自适应学习的功能,相比现有技术通过预设参数建立的分类模型,该模型的适应性更广,分 类的准确更高。
神经网络可以进行自适应深度学习,从伴有噪声和基线漂移的拉曼光谱中学习得到用于 物质鉴别、含量预测等实际应用问题的有效特征。深度学习的强大的非线性映射能力,更是 可以消除非线性关系对校正模型预测性能的影响,进一步提升鉴别性能。
一种基于卷积神经网络的拉曼光谱分析方法,包括如下步骤:
S1:建立分类模型,即RS-CNN:
S1a:对训练数据集中每个训练样本的拉曼光谱进行预处理:
在RS-CNN中分别采用两层不同的卷积层对拉曼光谱进行去噪和基线校正。如图2所示, 采用适当的卷积核能实现对噪声光谱的平滑去噪。然而,当平滑的卷积核加宽到一定程度后, 其结果如图3的虚线所示,这是采用的较宽卷积核时取得的结果,可以看出曲线只保留了整 体走势,不包含任何谱峰信息,近似于光谱的基线。
由图3(b)所示,单位卷积核记为I(n),加宽后的平滑卷积核记为h(n),此处的*为卷积 操作。图3(a)中的基线校正后的谱线s(n)可以近似的表示为:
s(n)≈x(n)-x(n)*h(n)=x(n)(I(n)-h(n)) (1)
所以基线校正的卷积核为:(I(n)-h(n))。
卷积不仅能对拉曼光谱进行去噪,还能进行基线校正,利用卷积的这一特性,我们构造 一个联合卷积(去噪和基线校正)与预测目标的卷积神经网络,从而根据预测目标自适应的 去学习卷积核的参数。构建了如图4所示的卷积神经网络,该网络大概分为三个部分:卷积 去噪、卷积基线校正和全连接校正模型。
将现有的卷积神经网络用于拉曼光谱的分析构建RS-CNN。首先,我们需要对池化层和卷 积层进行改进:
删除池化层,简化卷积层
对于任意一条光谱谱线而言,每一个波长点所对应的值都是非常重要的,正是通过对这 些波长点的值分析物质的成分、含量等。在对光谱做数据分析时,应尽量避免光谱数据的丢 失。在卷积神经网络中,池化层通常用于卷积层之后,对卷积层输出的特征向量进行降维, 然而这样的操作会导致光谱信息的大量的丢失,不利于进一步的分析,因此在进行光谱分析 的时候池化层应该被舍弃。我们需要的卷积神经网络中的卷积层的目的都是单一的:去噪或 基线校正。因此每一个卷积层只需要设置一个卷积核就可以了,即通道(Channel)数为1。
每一个卷积层只需要设置一个卷积核就可以了,即通道(Channel)数为1。
S1a1:对所有训练样本的拉曼光谱进行去噪:卷积去噪层增加卷积核权重的非负与和为 1的约束:
对于卷积去噪层C1而言,C1层的输出可以表示为:
其中,x1表示卷积去噪层C1的输入,xc1表示卷积去噪层C1的输出,Wc1表示卷积去噪层C1的卷积核权重;从式(1)可以看出,当x1*Wc1<0,通过激活函数ReLU激活可能会 引起光谱数据的丢失。因此,将用下面的公式替换掉ReLU函数:
xc1=x1*Wc1 (3);
为了让C1层的输出能达到较好的去噪效果,对C1层的卷积核Wc1有两个约束:Wc1中的 所有值为非负和所有制值相加为1。
将所有训练样本的拉曼光谱输入卷积去噪层层C1进行去噪,所述卷积去噪层层C1的输 出表示如下:
其中,x1表示卷积去噪层C1的输入,xc1表示卷积去噪层C1的输出,Wc1表示卷积去噪层C1的卷积核权重;Wc1,i是卷积去噪层C1层第i个权重,nc1是Wc1的权重总数;Wc1,i的 初始值是随机生成的,随后是通过网络自适应学习进行迭代替换。
S1a2:经过S1a1去噪后,再对训练样本的拉曼光谱进行基线校正:基线校正层C2增加 卷积核所有权值都小于1与和为0约束。
为了使基线校正层(C2)达到去基线的效果,如图3所示,应当选择基线较宽的卷积核 去移除基线。从式(1)可知:h(n)≥0且(I(n)-h(n))≤1且所以对C2层的卷积核的约束为:卷积核的所有权值都小于1且和为0,将经过S1a1去噪后的训练样本的拉曼光谱输入基线校正层C2,所述基线校正层C2的输出表示如下:
其中,xc2表示基线校正层C2的输出,Wc2表示基线校正层C2的卷积核,Wc2,i为基线校正层C2卷积核的第i个权值,nc2表示基线校正层C2卷积核的权值个数;Wc2,i的初始值 是随机生成的,随后是通过网络自适应学习进行迭代替换。
在基于上述3个改进后卷积层对光谱有了较好的预处理效果。同时由于光谱分析与图像 处理相比,通常任务比较单一,所以全连接校正层沿用LeNet-5,神经元的个数保持不变, 如图4所示,F3层为全连接层;F4层为全连接层,F5层为输出层。
S1b:将S1a2矫正后的所有训练样本的拉曼光谱加上该训练样本的分类标签,输入神经 网络,设有n个训练样本,分类标签中有m个类,m和n均取自然数,每个类取0或1,0表示该训练样本属于某一类的概率为0,1表示训练样本属于某一类的概率为1,例如实施例1中,b1代表人类血液,b2代表动物血液,那么分类标签(b1=0.b2=1)的含义:该训练样本的分类标签中两个类b1和b2,该训练样本属于b1类的概率为0,属于b2类的概率为1,即该 样本属于动物血液的概率为0,属于人类血液的概率为1。
神经网络的输出为每个训练样本被分入某一类的概率值,对于每个训练样本会输出m个 概率,值最大的那个概率则为预测概率,该预测概率对应的类,则是该训练样本的预测分类;
统计预测准确率,由于训练样本属于哪一类是已知的,因此将预测分类正确的样本数除 以总样本数m即可获得预测准确率,当该预测准确率低于预设的准确率阈值时,通过损失函 数采用反向传播方法(采用反向传播方法属于现有技术,为节约篇幅,此处不再详述)调整 神经网络每层的权值,然后再将预处理后的所有训练样本的拉曼光谱加上每个训练样本对应 的分类标签,输入神神经网络进行迭代,直至统计的预测准确率大于等于准确率阈值时才结 束迭代过程,此时每层神经网络的权值已经确定,所述该神经网络即为分类模型;
S2:待测样本预测:
S2a:将所述待测样本的拉曼光谱采用S1a中所述的方法进行预处理;
S2b:将预处理后的待测样本的拉曼光谱输入S1b确定的分类模型中进行预测分类,得到 m个概率,值最大的那个概率则为预测概率,该预测概率对应的类,则是该待测样本的预测 分类。
作为改进,所述S1b中的神经网络为三层,分别记为F3层、F4层和F5层。
所述神经网络中每一层输出都需要经过一个激活函数进行处理,具体地:
F3层输出需经过激活函数(10)的处理:
ReLU(xf3)=max(xf3,0) (10);
其中,xf3表示F3层的输出;
F4层输出需经过激活函数(11)的处理:
ReLU(xf4)=max(xf4,0) ((11);
其中,xf4表示F4层的输出;
F5层输出需经过激活函数(12)的处理:
其中,xji表示第F5层输出的第j个样本属于第i类的概率,Sji表示经过激活函数处理 得到的第j个样本属于第i类的概率,m表示类别的个数,n表示训练样本的个数。
所述S1b中的损失函数如下:
其中,表示第j个训练样本属于第i类的预测概率,yji表示第j个训练样 本属于第i类的概率,yji的值是根据标签获得。
实施例1:将本发明用于血液样品的分析。
实验用训练样本共326例,人血样本110例均采集于重庆市西南医院,动物血样216例 均采集于重庆市中医研究院。分类准确率相比传统方法PLS-DA和SVM分别提高了3.67%和 4.59%。
下面是对具体的RS-CNN进行介绍。
RS-CNN中卷积去噪层层C1的输出结果如图5所示(图示为归一化后的结果以便于比较), 其去噪效果明显。图6给出了卷积去噪层层C1卷积核系数。卷积去噪层层C1的卷积核不宜 过大,过大会导致谱峰信息丢失,影响分类结果。如表1所示,列出使用三种(1*51,1*31,1*15) 大小不同的卷积核的校正集与测试集的分类准确率,可以看出卷积核越大分类效果越差。应 该根据相应的噪声水平经验性的估计适宜的卷积核尺寸,本实验卷积去噪层层C1的卷积核大 小取为5。
表1卷积去噪层层C1不同卷积核大小分类结果比较
卷积核大小 1×51 1×31 1×15
校正集的分类准确率 66.63% 82.95% 100%
测试集的分类准确率 66.06% 80.73% 93.58%
RS-CNN中基线校正层C2的输出结果如图7所示。光谱通过基线校正层C2处理后,其基 线校正效果尤为明显,而且卷积后的结果不仅移除了基线,同时对某些特征峰有增强或抑制 的效果(图7中实线框中为抑制,虚线框中为增强)。基线校正层C2的卷积核不宜过小,过 小的卷积核难以达到基线校正的目的。如表2所示,列出了三种(1*5,1*15,1*25)不同大小 的卷积的校正集和测试集的分类结果。从表中可以看出不同的卷积核对分类没有什么大的影 响,尽管如此,基线校正层C2的卷积核也不宜过大,过多的卷积核系数增加了基线校正层输 出的不确定性,本实验将基线校正层的卷积核大小定为51。
表2基线校正层C2不同卷积核大小的分类结果比较
卷积核大小 1×5 1×15 1×25
校正集分类准确率 100% 100% 100%
测试集分类准确率 97.25% 97.25% 97.25%
RS-CNN中参数的设置尤为重要,本发明将最小化预测值与测量值的交叉熵作为目标函数 (损失函数):
N为样本数,yi为第i个样本的测量值,为第i个样本的预测值。采用随机优化方法 Adam(自适应矩阵),设置的初始学习率为0.001,每次训练和梯度更新块大小为32,每次悬 梁完成后计算一次损失值,经过1050次训练后,其损失值的变化情况如图8所示。本次实验 选用第588次训练结果,在获得最有解的同时,防止模型过拟合。
本发明的分析方法与现有的分析方法的比对:
数据集
本实验所采用的数据集血液数据集,该数据集包含110例人血液拉曼光谱、216例动物 血液拉曼光谱(116例犬血,100例兔血),通过duplex算法选取1/3的样本作为测试集用于 模型评价,即人血37例,动物血72例(39例犬血,33例兔血),余下的2/3作为校正集用于模型训练,即人血73,动物血144例(77例犬血,67例兔血)。
实验评价指标
为了评价RS-CNN的性能,采用了准确率、AUC值和ROC曲线评价RS-CNN分类的性能。准确率的计算公式如下:
其中M为样本数,N为分类准确的个数,acc为准确率,error为错误率。计算ROC 曲线与AUC值需要构造一个混淆矩阵,如表3所示:
表3分类结果的混淆矩阵
其中TP表示真正例,FP表示假正例,FN表示假反例,TN表示真反例。ROC曲线的纵轴是真正例率(True Positive Rate,TPR),横轴是假正例率(False Positive Rate,FPR),定义如下:
AUC(Area Under ROC Curve)为ROC曲线围成的面积,其计算公式如下:
n表示ROC曲线沿横坐标方向分成的份数,(FPRn,TPRn)为ROC曲线的最后一个点。
实验分析结果
本实验是将RS-CNN与PLS-DA、SVM的结果进行对比,在校正集的分类结果上,三种模型 均未错分,校正集分类精度100%(217/217)。而测试集的结果如表4所示,PLS-DA错分7例, 动物血液错分为人血液4例,包括3例犬血液,1例兔血液,分类进度93.58%;SVM错 分8例,动物血液错分为人血液3例,包括2例犬血液,1例兔血液,分类进度92.66%; RS-CNN错分3例,动物血液错分为人血液1例(兔),分类进度97.25%,较PLS-DA、SVM 盲测精度高,且人与动物血液错分比例均下降。这三种模型的ROC曲线如图9所示,根据计 算公式(8)求得PLS-DA、SVM、RS-CNN的AUC值分别为0.93656、0.9726、0.97335。通过 对比,本发明提出的RS-CNN更具有优势。
表4测试集分类结果对比
模型 PLS-DA SVM RS-CNN
人血样错分数量 3 5 2
动物血样分错数量 4 3 1
分类准确率 93.58% 92.66% 97.25%
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施 例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进 行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利 要求范围当中。

Claims (4)

1.一种基于卷积神经网络的拉曼光谱分析方法,其特征在于:包括如下步骤:
S1:建立分类模型:
S1a:对训练数据集中每个训练样本的拉曼光谱进行预处理:
S1a1:对所有训练样本的拉曼光谱进行去噪:
将所有训练样本的拉曼光谱输入卷积去噪层层C1进行去噪,所述卷积去噪层层C1的输出表示如下:
其中,x1表示卷积去噪层C1的输入,xc1表示卷积去噪层C1的输出,Wc1表示卷积去噪层C1的卷积核权重;Wc1,i是卷积去噪层C1层第i个权重,nc1是Wc1的权重总数;
S1a2:经过S1a1去噪后,再对训练样本的拉曼光谱进行基线校正:
将经过S1a1去噪后的训练样本的拉曼光谱输入基线校正层C2,所述基线校正层C2的输出表示如下:
其中,xc2表示基线校正层C2的输出,Wc2表示基线校正层C2的卷积核,Wc2,i为基线校正层C2卷积核的第i个权值,nc2表示基线校正层C2卷积核的权值个数;
S1b:将S1a2矫正后的所有训练样本的拉曼光谱加上该训练样本的分类标签,输入神经网络,设有n个训练样本,分类标签中有m个类,m和n均取自然数;
神经网络的输出为每个训练样本被分入某一类的概率值,对于每个训练样本会输出m个概率,值最大的那个概率则为预测概率,该预测概率对应的类,则是该训练样本的预测分类;
统计预测准确率,当该预测准确率低于预设的准确率阈值时,通过损失函数采用反向传播方法调整神经网络每层的权值,然后再将预处理后的所有训练样本的拉曼光谱加上每个训练样本对应的分类标签,输入神神经网络进行迭代,直至统计的预测准确率大于等于准确率阈值时才结束迭代过程,此时每层神经网络的权值已经确定,所述该神经网络即为分类模型;
S2:待测样本预测:
S2a:将所述待测样本的拉曼光谱采用S1a中所述的方法进行预处理;
S2b:将预处理后的待测样本的拉曼光谱输入S1b确定的分类模型中进行预测分类,得到m个概率,值最大的那个概率则为预测概率,该预测概率对应的类,则是该待测样本的预测分类。
2.如权利要求1所述的基于卷积神经网络的拉曼光谱分析方法,其特征在于:所述S1b中的神经网络为三层,分别记为F3层、F4层和F5层。
3.如权利要求2所述的基于卷积神经网络的拉曼光谱分析方法,其特征在于:所述神经网络中每一层输出都需要经过一个激活函数进行处理,具体地:
F3层输出需经过激活函数(10)的处理:
ReLU(xf3)=max(xf3,0) (10);
其中,xf3表示F3层的输出;
F4层输出需经过激活函数(11)的处理:
ReLU(xf4)=max(xf4,0) (11);
其中,xf4表示F4层的输出;
F5层输出需经过激活函数(12)的处理:
其中,xji表示第F5层输出的第j个样本属于第i类的概率,Sji表示经过激活函数处理得到的第j个样本属于第i类的概率,m表示类别的个数,n表示训练样本的个数。
4.如权利要求3所述的基于卷积神经网络的拉曼光谱分析方法,其特征在于:所述S1b中的损失函数如下:
其中,表示第j个训练样本属于第i类的预测概率,yji表示第j个训练样本属于第i类的概率,yji的值是根据标签获得。
CN201811437661.5A 2018-11-28 2018-11-28 一种基于卷积神经网络的拉曼光谱分析方法 Active CN109543763B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811437661.5A CN109543763B (zh) 2018-11-28 2018-11-28 一种基于卷积神经网络的拉曼光谱分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811437661.5A CN109543763B (zh) 2018-11-28 2018-11-28 一种基于卷积神经网络的拉曼光谱分析方法

Publications (2)

Publication Number Publication Date
CN109543763A true CN109543763A (zh) 2019-03-29
CN109543763B CN109543763B (zh) 2022-10-21

Family

ID=65850938

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811437661.5A Active CN109543763B (zh) 2018-11-28 2018-11-28 一种基于卷积神经网络的拉曼光谱分析方法

Country Status (1)

Country Link
CN (1) CN109543763B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112132256A (zh) * 2020-08-05 2020-12-25 芯华创(武汉)光电科技有限公司 一种基于神经网络的拉曼分布式温度传感方法和系统
CN112200770A (zh) * 2020-09-08 2021-01-08 浙江大学山东工业技术研究院 一种基于拉曼光谱和卷积神经网络的肿瘤检测方法
CN112634204A (zh) * 2020-12-03 2021-04-09 北京信息科技大学 一种基于卷积神经网络的癌症边界智能识别方法
CN112651428A (zh) * 2020-12-03 2021-04-13 北京信息科技大学 一种用于远程拉曼矿物识别的深度学习模型多分类方法
CN112651927A (zh) * 2020-12-03 2021-04-13 北京信息科技大学 一种基于卷积神经网络与支持向量机的拉曼光谱智能识别方法
CN112716447A (zh) * 2020-12-03 2021-04-30 北京信息科技大学 一种基于拉曼检测光谱数据深度学习的口腔癌分类系统
CN112782148A (zh) * 2021-02-19 2021-05-11 燕山大学 阿拉比卡和罗伯斯塔两种咖啡豆的快速鉴别方法
CN112986210A (zh) * 2021-02-10 2021-06-18 四川大学 一种尺度自适应的微生物拉曼光谱检测方法及系统
CN113035292A (zh) * 2021-04-21 2021-06-25 复旦大学 一种脑胶质瘤浸润区域pH值测定方法及系统
CN113030060A (zh) * 2019-12-25 2021-06-25 同方威视技术股份有限公司 基于卷积神经网络的毒品拉曼光谱识别方法
CN118155007A (zh) * 2024-05-13 2024-06-07 南京诺源医疗器械有限公司 基于拉曼光谱的癌症组织的识别方法及系统

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070195925A1 (en) * 2004-07-07 2007-08-23 Koninklijke Philips Electronics N.V. Streak artifact reduction in cardiac cone beam ct reconstruction
CN101329734A (zh) * 2008-07-31 2008-12-24 重庆大学 基于k-l变换和ls-svm的车牌字符识别方法
GB201010177D0 (en) * 2010-06-17 2010-07-21 Canon Kk Method and device for enhancing a digital image
CN105760859A (zh) * 2016-03-22 2016-07-13 中国科学院自动化研究所 基于多任务卷积神经网络的网纹人脸图像识别方法及装置
CN106529458A (zh) * 2016-10-31 2017-03-22 重庆大学 一种面向高光谱图像的深度神经网络空间谱分类方法
CN106845381A (zh) * 2017-01-16 2017-06-13 西北工业大学 基于双通道卷积神经网络的空谱联合的高光谱图像分类方法
CN107403419A (zh) * 2017-08-04 2017-11-28 深圳市唯特视科技有限公司 一种基于级联卷积神经网络的低剂量x射线图像去噪方法
CN107478598A (zh) * 2017-09-01 2017-12-15 广东省智能制造研究所 一种基于一维卷积神经网络的近红外光谱分析方法
WO2017215284A1 (zh) * 2016-06-14 2017-12-21 山东大学 基于卷积神经网络的胃肠道肿瘤显微高光谱图像处理方法
CN107495959A (zh) * 2017-07-27 2017-12-22 大连大学 一种基于一维卷积神经网络的心电信号分类方法
US20180018590A1 (en) * 2016-07-18 2018-01-18 NantOmics, Inc. Distributed Machine Learning Systems, Apparatus, and Methods
CN107833194A (zh) * 2017-11-21 2018-03-23 长沙全度影像科技有限公司 一种结合raw图像去噪的简单透镜图像复原方法
US20180158177A1 (en) * 2016-12-07 2018-06-07 Idemia Identity & Security France System for processing images
CN108334937A (zh) * 2018-02-06 2018-07-27 大连海事大学 一种基于卷积神经网络的水上油膜相对厚度提取方法及系统
CN108492269A (zh) * 2018-03-23 2018-09-04 西安电子科技大学 基于梯度正则卷积神经网络的低剂量ct图像去噪方法
CN108572166A (zh) * 2018-04-12 2018-09-25 上海理工大学 雨生红球藻类胡萝卜素及虾青素可视化分析方法
CN108596213A (zh) * 2018-04-03 2018-09-28 中国地质大学(武汉) 一种基于卷积神经网络的高光谱遥感图像分类方法及系统
CN108764358A (zh) * 2018-05-31 2018-11-06 广东工业大学 一种太赫兹图像识别方法、装置、设备及可读存储介质

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070195925A1 (en) * 2004-07-07 2007-08-23 Koninklijke Philips Electronics N.V. Streak artifact reduction in cardiac cone beam ct reconstruction
CN101329734A (zh) * 2008-07-31 2008-12-24 重庆大学 基于k-l变换和ls-svm的车牌字符识别方法
GB201010177D0 (en) * 2010-06-17 2010-07-21 Canon Kk Method and device for enhancing a digital image
CN105760859A (zh) * 2016-03-22 2016-07-13 中国科学院自动化研究所 基于多任务卷积神经网络的网纹人脸图像识别方法及装置
WO2017215284A1 (zh) * 2016-06-14 2017-12-21 山东大学 基于卷积神经网络的胃肠道肿瘤显微高光谱图像处理方法
US20180018590A1 (en) * 2016-07-18 2018-01-18 NantOmics, Inc. Distributed Machine Learning Systems, Apparatus, and Methods
CN106529458A (zh) * 2016-10-31 2017-03-22 重庆大学 一种面向高光谱图像的深度神经网络空间谱分类方法
US20180158177A1 (en) * 2016-12-07 2018-06-07 Idemia Identity & Security France System for processing images
CN106845381A (zh) * 2017-01-16 2017-06-13 西北工业大学 基于双通道卷积神经网络的空谱联合的高光谱图像分类方法
CN107495959A (zh) * 2017-07-27 2017-12-22 大连大学 一种基于一维卷积神经网络的心电信号分类方法
CN107403419A (zh) * 2017-08-04 2017-11-28 深圳市唯特视科技有限公司 一种基于级联卷积神经网络的低剂量x射线图像去噪方法
CN107478598A (zh) * 2017-09-01 2017-12-15 广东省智能制造研究所 一种基于一维卷积神经网络的近红外光谱分析方法
CN107833194A (zh) * 2017-11-21 2018-03-23 长沙全度影像科技有限公司 一种结合raw图像去噪的简单透镜图像复原方法
CN108334937A (zh) * 2018-02-06 2018-07-27 大连海事大学 一种基于卷积神经网络的水上油膜相对厚度提取方法及系统
CN108492269A (zh) * 2018-03-23 2018-09-04 西安电子科技大学 基于梯度正则卷积神经网络的低剂量ct图像去噪方法
CN108596213A (zh) * 2018-04-03 2018-09-28 中国地质大学(武汉) 一种基于卷积神经网络的高光谱遥感图像分类方法及系统
CN108572166A (zh) * 2018-04-12 2018-09-25 上海理工大学 雨生红球藻类胡萝卜素及虾青素可视化分析方法
CN108764358A (zh) * 2018-05-31 2018-11-06 广东工业大学 一种太赫兹图像识别方法、装置、设备及可读存储介质

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
EMRE ARDIÇ: "Classification of 1D signals using deep neural networks", 《2018 26TH SIGNAL PROCESSING AND COMMUNICATIONS APPLICATIONS CONFERENCE (SIU)》 *
YEYANG YU: "Compressed sensing MRI using Singular Value Decomposition based sparsity basis", 《2011 ANNUAL INTERNATIONAL CONFERENCE OF THE IEEE ENGINEERING IN MEDICINE AND BIOLOGY SOCIETY》 *
易盟: "基于改进全卷积神经网络的航拍图像语义分类方法", 《计算机工程》 *
李胜力: "基于深度自适应神经网络的高光谱图像分类方法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
杜剑: "基于卷积神经网络与光谱特征的夏威夷果品质鉴定研究", 《光谱学与光谱分析》 *
董家林: "基于Raman光谱的人、犬、兔血液鉴别", 《光谱学与光谱分析》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113030060A (zh) * 2019-12-25 2021-06-25 同方威视技术股份有限公司 基于卷积神经网络的毒品拉曼光谱识别方法
CN112132256B (zh) * 2020-08-05 2023-12-08 芯华创(武汉)光电科技有限公司 一种基于神经网络的拉曼分布式温度传感方法和系统
CN112132256A (zh) * 2020-08-05 2020-12-25 芯华创(武汉)光电科技有限公司 一种基于神经网络的拉曼分布式温度传感方法和系统
CN112200770A (zh) * 2020-09-08 2021-01-08 浙江大学山东工业技术研究院 一种基于拉曼光谱和卷积神经网络的肿瘤检测方法
CN112651428A (zh) * 2020-12-03 2021-04-13 北京信息科技大学 一种用于远程拉曼矿物识别的深度学习模型多分类方法
CN112716447A (zh) * 2020-12-03 2021-04-30 北京信息科技大学 一种基于拉曼检测光谱数据深度学习的口腔癌分类系统
CN112651927A (zh) * 2020-12-03 2021-04-13 北京信息科技大学 一种基于卷积神经网络与支持向量机的拉曼光谱智能识别方法
CN112634204A (zh) * 2020-12-03 2021-04-09 北京信息科技大学 一种基于卷积神经网络的癌症边界智能识别方法
CN112986210A (zh) * 2021-02-10 2021-06-18 四川大学 一种尺度自适应的微生物拉曼光谱检测方法及系统
CN112782148A (zh) * 2021-02-19 2021-05-11 燕山大学 阿拉比卡和罗伯斯塔两种咖啡豆的快速鉴别方法
CN113035292A (zh) * 2021-04-21 2021-06-25 复旦大学 一种脑胶质瘤浸润区域pH值测定方法及系统
CN113035292B (zh) * 2021-04-21 2022-11-04 复旦大学 一种脑胶质瘤浸润区域pH值测定方法及系统
CN118155007A (zh) * 2024-05-13 2024-06-07 南京诺源医疗器械有限公司 基于拉曼光谱的癌症组织的识别方法及系统

Also Published As

Publication number Publication date
CN109543763B (zh) 2022-10-21

Similar Documents

Publication Publication Date Title
CN109543763B (zh) 一种基于卷积神经网络的拉曼光谱分析方法
US11501192B2 (en) Systems and methods for Bayesian optimization using non-linear mapping of input
WO2021155706A1 (zh) 利用不平衡正负样本对业务预测模型训练的方法及装置
US20180349158A1 (en) Bayesian optimization techniques and applications
US20190228268A1 (en) Method and system for cell image segmentation using multi-stage convolutional neural networks
CN109271958B (zh) 人脸年龄识别方法及装置
CN110211126A (zh) 基于直觉模糊c均值聚类的图像分割方法
US20230048405A1 (en) Neural network optimization method and apparatus
CN116894985B (zh) 半监督图像分类方法及半监督图像分类系统
CN113011532B (zh) 分类模型训练方法、装置、计算设备及存储介质
CN117015796A (zh) 处理组织图像的方法和用于处理组织图像的系统
CN112819821A (zh) 一种细胞核图像检测方法
CN116740728B (zh) 一种用于晶圆读码器动态获取方法和系统
CN116738330A (zh) 一种半监督域自适应脑电信号的分类方法
CN115424093A (zh) 一种识别眼底图像中细胞的方法及装置
CN116912568A (zh) 基于自适应类别均衡的含噪声标签图像识别方法
CN111062411A (zh) 从质谱数据中识别多种化合物的方法、装置和设备
CN110675382A (zh) 基于CNN-LapsELM的铝电解过热度识别方法
CN109540292B (zh) 一种光谱的预处理方法
US11397868B2 (en) Fungal identification by pattern recognition
CN116740460A (zh) 一种基于卷积神经网络的pcb缺陷检测系统及检测方法
CN111066562A (zh) 一种葡萄霜霉病预测方法及系统
Kiruthika et al. Classification of metaphase chromosomes using deep learning neural network
CN113610121B (zh) 一种跨域任务深度学习识别方法
CN111598184B (zh) 一种基于DenseNet的图像噪声识别方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant