CN109543763B - 一种基于卷积神经网络的拉曼光谱分析方法 - Google Patents

一种基于卷积神经网络的拉曼光谱分析方法 Download PDF

Info

Publication number
CN109543763B
CN109543763B CN201811437661.5A CN201811437661A CN109543763B CN 109543763 B CN109543763 B CN 109543763B CN 201811437661 A CN201811437661 A CN 201811437661A CN 109543763 B CN109543763 B CN 109543763B
Authority
CN
China
Prior art keywords
layer
neural network
output
classification
convolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811437661.5A
Other languages
English (en)
Other versions
CN109543763A (zh
Inventor
洪明坚
沈东旭
董家林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN201811437661.5A priority Critical patent/CN109543763B/zh
Publication of CN109543763A publication Critical patent/CN109543763A/zh
Application granted granted Critical
Publication of CN109543763B publication Critical patent/CN109543763B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Abstract

本发明涉及一种基于卷积神经网络的拉曼光谱分析方法,首先是建立分类模型,建立过程是对已经物质的拉曼光谱进行预处理,再将预处理后的拉曼光谱输入神经网络进行训练,确定每层网络中的权值,从而确定分类模型,将这一模型命名为RS‑CNN,其次将待预测物质的拉曼光谱进行预处理,然后将预处理的后的带预测物质的拉曼光谱输入分类模型中,分类模型的输出即是分类结果。将卷积神经网络去噪和基线校正以卷积的方式融入到卷积神经网络中,从而将预处理过程和鉴别问题转化在统一的模型框架中求解,实现了数据的自适应处理,弥补了传统方法的不足。

Description

一种基于卷积神经网络的拉曼光谱分析方法
技术领域
本发明涉及光谱分析方法领域,特别涉及一种基于卷积神经网络的拉曼光谱分析方法。
背景技术
通过仪器测量得到原始拉曼光谱通常都伴有严重的噪声和基线漂移,鉴别时限制了对光谱数据中有用信息的提取,因此,拉曼光谱分析过程中通常有较为繁琐的去噪和基线校正的过程。
现目前大多数的去噪和基线校正的方法均独立于模型,这增加了因预处理不当而造成的模型预测能力下降的风险。同时受待测物质的物理特性(如颗粒度,装填密度和均匀性等)、环境温度和探测器的非线性响应等影响,拉曼光谱与待测物质的性质和成分含量存在一定的非线性关系,但是现阶段的大多数拉曼光谱定性或定量的校正方法都是线性模型,对于这种非线性关系不能进行较好的表示。
现有技术在建立分类模型时,大都是根据经验预设模型参数,这种方法一方面限定了拉曼光谱分析的准确性,另一方面根据待分类物质的特性不同,分类模型的参数也需要做调整,因此根据经验值设定的预测模型参数后,只能用于对一些特定物质进行分类,每次在测定不同物质时都需要对分类模型的参数进行重新设定,这不但导致分类模型的通用性差,更重要的是分类模型分类的准确性也很难保证。
发明内容
针对现有技术存在的上述问题,本发明的目的是一种基于卷积神经网络的拉曼光谱分析方法,该方法的目的是对物质分类,采用自适应的学习方法进行训练,得到分类模型的参数,因此建立的分类模型的适用性更广,分类的准确性也更高。
为实现上述目的,本发明采用如下技术方案:一种基于卷积神经网络的拉曼光谱分析方法,包括如下步骤:
S1:建立分类模型:
S1a:对训练数据集中每个训练样本的拉曼光谱进行预处理:
S1a1:对所有训练样本的拉曼光谱进行去噪:
将所有训练样本的拉曼光谱输入卷积去噪层C1进行去噪,所述卷积去噪层C1的输出表示如下:
Figure GDA0003837913000000021
其中,x1表示卷积去噪层C1的输入,xc1表示卷积去噪层C1的输出,Wc1表示卷积去噪层C1的卷积核权重;Wc1,t是卷积去噪层C1层第t个权重,nc1是Wc1的权重总数;
S1a2:经过S1a1去噪后,再对训练样本的拉曼光谱进行基线校正:
将经过S1a1去噪后的训练样本的拉曼光谱输入基线校正层C2,所述基线校正层C2的输出表示如下:
Figure GDA0003837913000000022
其中,xc2表示基线校正层C2的输出,Wc2表示基线校正层C2的卷积核,Wc2,i为基线校正层C2卷积核的第i个权值,nc2表示基线校正层C2卷积核的权值个数;
S1b:将S1a2校正后的所有训练样本的拉曼光谱加上该训练样本的分类标签,输入神经网络,设有n个训练样本,分类标签中有m个类,m和n均取自然数;
神经网络的输出为每个训练样本被分入某一类的概率值,对于每个训练样本会输出m个概率,值最大的那个概率则为预测概率,该预测概率对应的类,则是该训练样本的预测分类;
统计预测准确率,当该预测准确率低于预设的准确率阈值时,通过损失函数调整神经网络每层的权值,然后再将预处理后的所有训练样本的拉曼光谱加上每个训练样本对应的分类标签,输入神神经网络进行迭代,直至统计的预测准确率大于等于准确率阈值时才结束迭代过程,此时每层神经网络的权值已经确定,该神经网络即为分类模型;
S2:待测样本预测:
S2a:将所述待测样本的拉曼光谱采用S1a中所述的方法进行预处理;
S2b:将预处理后的待测样本的拉曼光谱输入S1b确定的分类模型中进行预测分类,得到m个概率,值最大的那个概率则为预测概率,该预测概率对应的类,则是该待测样本的预测分类。
作为改进,所述S1b中的神经网络为三层,分别记为F3层、F4层和F5层。
作为改进,所述神经网络中每一层输出都需要经过一个激活函数进行处理,具体地:
F3层输出需经过激活函数(10)的处理:
ReLU(xf3)=max(xf3,0) (10);
其中,xf3表示F3层的输出;;
F4层输出需经过激活函数(11)的处理:
ReLU(xf4)=max(xf4,0) 11);
其中,xf4表示F4层的输出;
F5层输出需经过激活函数(12)的处理:
Figure GDA0003837913000000031
其中,xji表示第F5层输出的第j个样本属于第i类的概率,Sji表示经过激活函数处理得到的第j个样本属于第i类的概率,m表示类别的个数,n表示训练样本的个数。
作为改进,所述S1b中的损失函数如下:
Figure GDA0003837913000000032
其中,
Figure GDA0003837913000000033
表示第j个训练样本属于第i类的预测概率,
Figure GDA0003837913000000034
yji表示第j个训练样本属于第i类的概率,yji的值是根据标签获得。
相对于现有技术,本发明至少具有如下优点:(1)本发明方法中建立分类模型时,将去噪和基线校正以卷积的方式融入中,从而将预处理过程和鉴别问题放在统一的模型框架中求解,实现了光谱的自适应处理,弥补了传统方法的不足。
(2)本发明方法中建立分类模型时,去噪和基线校正过程中每一个卷积层中都只有一个卷积核,相比于传统的网络解释性更强,而且更容易监控卷积层的输出,以查看是否达到预期的效果。
(3)本发明的去噪和基线校正部分可以单独作为一个自适应光谱预处理器,将预处理后得到的数据可以用于PLS-DA、SVM等其他分类器。
附图说明
图1为本发明基于卷积神经网络的拉曼光谱分析方法的流程图。
图2为卷积去噪层C1的原理图,2(a)为原始光谱图,2(b)为卷积核,图2(c)为卷积后的光谱
图3为基线校正层C2的原理,图3(a)为原始光谱、卷积后的光谱、二者之差,图3(b)为卷积核。
图4为本发明方法中卷积神经网络RS-CNN的结构图。
图5为实施例1中卷积去噪层C1层的输入与输出的谱线比较。
图6为实施例1中卷积去噪层C1层卷积核系数。
图7为实施例1中基线校正层C2输入与输出比较。
图8为实施例1中的目标函数。
图9为实施例1中血液鉴别ROC曲线,图9(a)为PLS-DA方法,图9(b)为SVM,图9(c)为RS-CNN。
具体实施方式
下面对本发明作进一步详细说明。
本发明基于卷积神经网络的拉曼光谱分析方法的思路是:首先是建立分类模型,建立过程是对已知物质的拉曼光谱进行预处理,再将预处理后的拉曼光谱输入神经网络进行训练,确定每层网络中的权值,从而确定分类模型,这一分类模型即为卷积神经网络,用RS-CNN表示,如图1所示,实现了在拉曼光谱分析时,根据定性目标自适应的数据预处理以及校正的过程。其次将待预测物质的拉曼光谱进行预处理,然后将预处理的后的带预测物质的拉曼光谱输入分类模型中,分类模型的输出即是分类结果。
本发明中的卷积神经网络首先是对池化层进行改动,池化层会导致光谱信息丢失,应该删除池化层。然后是对卷积层进行改动,卷积层实现了对拉曼光谱的卷积和去噪,为了达到更好的去噪效果,对卷积去噪层的卷积核的增加权重非负与和为1的约束;为了去掉光谱的基线,卷积基线校正层采用较宽的卷积核去除基线。以上改进能对光谱数据进行较好的预处理,将这些预处理后的数据通过全连接层建立校正模型。
本发明创造性的将神经网络与拉曼光谱分析进行结合,通过神经网络建立分类模型具有自适应学习的功能,相比现有技术通过预设参数建立的分类模型,该模型的适应性更广,分类的准确更高。
神经网络可以进行自适应深度学习,从伴有噪声和基线漂移的拉曼光谱中学习得到用于物质鉴别、含量预测等实际应用问题的有效特征。深度学习的强大的非线性映射能力,更是可以消除非线性关系对校正模型预测性能的影响,进一步提升鉴别性能。
一种基于卷积神经网络的拉曼光谱分析方法,包括如下步骤:
S1:建立分类模型,即RS-CNN:
S1a:对训练数据集中每个训练样本的拉曼光谱进行预处理:
在RS-CNN中分别采用两层不同的卷积层对拉曼光谱进行去噪和基线校正。如图2所示,采用适当的卷积核能实现对噪声光谱的平滑去噪。然而,当平滑的卷积核加宽到一定程度后,其结果如图3的虚线所示,这是采用的较宽卷积核时取得的结果,可以看出曲线只保留了整体走势,不包含任何谱峰信息,近似于光谱的基线。
由图3(b)所示,单位卷积核记为I(n),加宽后的平滑卷积核记为h(n),此处的*为卷积操作。图3(a)中的基线校正后的谱线s(n)可以近似的表示为:
s(n)≈x(n)-x(n)*h(n)=x(n)(I(n)-h(n)) (1)
所以基线校正的卷积核为:(I(n)-h(n))。
卷积不仅能对拉曼光谱进行去噪,还能进行基线校正,利用卷积的这一特性,我们构造一个联合卷积(去噪和基线校正)与预测目标的卷积神经网络,从而根据预测目标自适应的去学习卷积核的参数。构建了如图4所示的卷积神经网络,该网络大概分为三个部分:卷积去噪、卷积基线校正和全连接校正模型。
将现有的卷积神经网络用于拉曼光谱的分析构建RS-CNN。首先,我们需要对池化层和卷积层进行改进:
删除池化层,简化卷积层
对于任意一条光谱谱线而言,每一个波长点所对应的值都是非常重要的,正是通过对这些波长点的值分析物质的成分、含量等。在对光谱做数据分析时,应尽量避免光谱数据的丢失。在卷积神经网络中,池化层通常用于卷积层之后,对卷积层输出的特征向量进行降维,然而这样的操作会导致光谱信息的大量的丢失,不利于进一步的分析,因此在进行光谱分析的时候池化层应该被舍弃。我们需要的卷积神经网络中的卷积层的目的都是单一的:去噪或基线校正。因此每一个卷积层只需要设置一个卷积核就可以了,即通道(Channel)数为1。
每一个卷积层只需要设置一个卷积核就可以了,即通道(Channel)数为1。
S1a1:对所有训练样本的拉曼光谱进行去噪:卷积去噪层增加卷积核权重的非负与和为1的约束:
对于卷积去噪层C1而言,C1层的输出可以表示为:
Figure GDA0003837913000000061
其中,x1表示卷积去噪层C1的输入,xc1表示卷积去噪层C1的输出,Wc1表示卷积去噪层C1的卷积核权重;从式(1)可以看出,当x1*Wc1<0,通过激活函数ReLU激活可能会引起光谱数据的丢失。因此,将用下面的公式替换掉ReLU函数:
xc1=x1*Wc1 (3);
为了让C1层的输出能达到较好的去噪效果,对C1层的卷积核Wc1有两个约束:Wc1中的所有值为非负和所有制值相加为1。
将所有训练样本的拉曼光谱输入卷积去噪层C1进行去噪,所述卷积去噪层C1的输出表示如下:
Figure GDA0003837913000000062
其中,x1表示卷积去噪层C1的输入,xc1表示卷积去噪层C1的输出,Wc1表示卷积去噪层C1的卷积核权重;Wc1,t是卷积去噪层C1层第t个权重,nc1是Wc1的权重总数;Wc1,i的初始值是随机生成的,随后是通过网络自适应学习进行迭代替换。
S1a2:经过S1a1去噪后,再对训练样本的拉曼光谱进行基线校正:基线校正层C2增加卷积核所有权值都小于1与和为0约束。
为了使基线校正层(C2)达到去基线的效果,如图3所示,应当选择基线较宽的卷积核去移除基线。从式(1)可知:h(n)≥0且
Figure GDA0003837913000000063
(I(n)-h(n))≤1且
Figure GDA0003837913000000064
所以对C2层的卷积核的约束为:卷积核的所有权值都小于1且和为0,将经过S1a1去噪后的训练样本的拉曼光谱输入基线校正层C2,所述基线校正层C2的输出表示如下:
Figure GDA0003837913000000071
其中,xc2表示基线校正层C2的输出,Wc2表示基线校正层C2的卷积核,Wc2,i为基线校正层C2卷积核的第i个权值,nc2表示基线校正层C2卷积核的权值个数;Wc2,i的初始值是随机生成的,随后是通过网络自适应学习进行迭代替换。
在基于上述3个改进后卷积层对光谱有了较好的预处理效果。同时由于光谱分析与图像处理相比,通常任务比较单一,所以全连接校正层沿用LeNet-5,神经元的个数保持不变,如图4所示,F3层为全连接层;F4层为全连接层,F5层为输出层。
S1b:将S1a2校正后的所有训练样本的拉曼光谱加上该训练样本的分类标签,输入神经网络,设有n个训练样本,分类标签中有m个类,m和n均取自然数,每个类取0或1,0表示该训练样本属于某一类的概率为0,1表示训练样本属于某一类的概率为1,例如实施例1中,b1代表人类血液,b2代表动物血液,那么分类标签(b1=0.b2=1)的含义:该训练样本的分类标签中两个类b1和b2,该训练样本属于b1类的概率为0,属于b2类的概率为1,即该样本属于动物血液的概率为0,属于人类血液的概率为1。
神经网络的输出为每个训练样本被分入某一类的概率值,对于每个训练样本会输出m个概率,值最大的那个概率则为预测概率,该预测概率对应的类,则是该训练样本的预测分类;
统计预测准确率,由于训练样本属于哪一类是已知的,因此将预测分类正确的样本数除以总样本数m即可获得预测准确率,当该预测准确率低于预设的准确率阈值时,通过损失函数采用反向传播方法(采用反向传播方法属于现有技术,为节约篇幅,此处不再详述)调整神经网络每层的权值,然后再将预处理后的所有训练样本的拉曼光谱加上每个训练样本对应的分类标签,输入神神经网络进行迭代,直至统计的预测准确率大于等于准确率阈值时才结束迭代过程,此时每层神经网络的权值已经确定,该神经网络即为分类模型;
S2:待测样本预测:
S2a:将所述待测样本的拉曼光谱采用S1a中所述的方法进行预处理;
S2b:将预处理后的待测样本的拉曼光谱输入S1b确定的分类模型中进行预测分类,得到m个概率,值最大的那个概率则为预测概率,该预测概率对应的类,则是该待测样本的预测分类。
作为改进,所述S1b中的神经网络为三层,分别记为F3层、F4层和F5层。
所述神经网络中每一层输出都需要经过一个激活函数进行处理,具体地:
F3层输出需经过激活函数(10)的处理:
ReLU(xf3)=max(xf3,0) (10);
其中,xf3表示F3层的输出;
F4层输出需经过激活函数(11)的处理:
ReLU(xf4)=max(xf4,0) ((11);
其中,xf4表示F4层的输出;
F5层输出需经过激活函数(12)的处理:
Figure GDA0003837913000000081
其中,xji表示第F5层输出的第j个样本属于第i类的概率,Sji表示经过激活函数处理得到的第j个样本属于第i类的概率,m表示类别的个数,n表示训练样本的个数。
所述S1b中的损失函数如下:
Figure GDA0003837913000000082
其中,
Figure GDA0003837913000000083
表示第j个训练样本属于第i类的预测概率,
Figure GDA0003837913000000084
yji表示第j个训练样本属于第i类的概率,yji的值是根据标签获得。
实施例1:将本发明用于血液样品的分析。
实验用训练样本共326例,人血样本110例均采集于重庆市西南医院,动物血样216例均采集于重庆市中医研究院。分类准确率相比传统方法PLS-DA和SVM分别提高了3.67%和4.59%。
下面是对具体的RS-CNN进行介绍。
RS-CNN中卷积去噪层C1的输出结果如图5所示(图示为归一化后的结果以便于比较),其去噪效果明显。图6给出了卷积去噪层C1卷积核系数。卷积去噪层C1的卷积核不宜过大,过大会导致谱峰信息丢失,影响分类结果。如表1所示,列出使用三种(1*51,1*31,1*15)大小不同的卷积核的校正集与测试集的分类准确率,可以看出卷积核越大分类效果越差。应该根据相应的噪声水平经验性的估计适宜的卷积核尺寸,本实验卷积去噪层C1的卷积核大小取为5。
表1卷积去噪层C1不同卷积核大小分类结果比较
卷积核大小 1×51 1×31 1×15
校正集的分类准确率 66.63% 82.95% 100%
测试集的分类准确率 66.06% 80.73% 93.58%
RS-CNN中基线校正层C2的输出结果如图7所示。光谱通过基线校正层C2处理后,其基线校正效果尤为明显,而且卷积后的结果不仅移除了基线,同时对某些特征峰有增强或抑制的效果(图7中实线框中为抑制,虚线框中为增强)。基线校正层C2的卷积核不宜过小,过小的卷积核难以达到基线校正的目的。如表2所示,列出了三种(1*5,1*15,1*25)不同大小的卷积的校正集和测试集的分类结果。从表中可以看出不同的卷积核对分类没有什么大的影响,尽管如此,基线校正层C2的卷积核也不宜过大,过多的卷积核系数增加了基线校正层输出的不确定性,本实验将基线校正层的卷积核大小定为51。
表2基线校正层C2不同卷积核大小的分类结果比较
卷积核大小 1×5 1×15 1×25
校正集分类准确率 100% 100% 100%
测试集分类准确率 97.25% 97.25% 97.25%
RS-CNN中参数的设置尤为重要,本发明将最小化预测值与测量值的交叉熵作为目标函数(损失函数):
Figure GDA0003837913000000091
N为样本数,yi为第i个样本的测量值,
Figure GDA0003837913000000092
为第i个样本的预测值。采用随机优化方法Adam(自适应矩阵),设置的初始学习率为0.001,每次训练和梯度更新块大小为32,每次悬梁完成后计算一次损失值,经过1050次训练后,其损失值的变化情况如图8所示。本次实验选用第588次训练结果,在获得最有解的同时,防止模型过拟合。
本发明的分析方法与现有的分析方法的比对:
数据集
本实验所采用的数据集血液数据集,该数据集包含110例人血液拉曼光谱、216例动物血液拉曼光谱(116例犬血,100例兔血),通过duplex算法选取1/3的样本作为测试集用于模型评价,即人血37例,动物血72例(39例犬血,33例兔血),余下的2/3作为校正集用于模型训练,即人血73,动物血144例(77例犬血,67例兔血)。
实验评价指标
为了评价RS-CNN的性能,采用了准确率、AUC值和ROC曲线评价RS-CNN分类的性能。准确率的计算公式如下:
Figure GDA0003837913000000101
其中M为样本数,N为分类准确的个数,acc为准确率,error为错误率。计算ROC曲线与AUC值需要构造一个混淆矩阵,如表3所示:
表3分类结果的混淆矩阵
Figure GDA0003837913000000102
其中TP表示真正例,FP表示假正例,FN表示假反例,TN表示真反例。ROC曲线的纵轴是真正例率(True Positive Rate,TPR),横轴是假正例率(False Positive Rate,FPR),定义如下:
Figure GDA0003837913000000103
AUC(Area Under ROC Curve)为ROC曲线围成的面积,其计算公式如下:
Figure GDA0003837913000000104
n表示ROC曲线沿横坐标方向分成的份数,(FPRn,TPRn)为ROC曲线的最后一个点。
实验分析结果
本实验是将RS-CNN与PLS-DA、SVM的结果进行对比,在校正集的分类结果上,三种模型均未错分,校正集分类精度100%(217/217)。而测试集的结果如表4所示,PLS-DA错分7例,动物血液错分为人血液4例,包括3例犬血液,1例兔血液,分类进度93.58%;SVM错分8例,动物血液错分为人血液3例,包括2例犬血液,1例兔血液,分类进度92.66%;RS-CNN错分3例,动物血液错分为人血液1例(兔),分类进度97.25%,较PLS-DA、SVM盲测精度高,且人与动物血液错分比例均下降。这三种模型的ROC曲线如图9所示,根据计算公式(8)求得PLS-DA、SVM、RS-CNN的AUC值分别为0.93656、0.9726、0.97335。通过对比,本发明提出的RS-CNN更具有优势。
表4测试集分类结果对比
模型 PLS-DA SVM RS-CNN
人血样错分数量 3 5 2
动物血样分错数量 4 3 1
分类准确率 93.58% 92.66% 97.25%
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (4)

1.一种基于卷积神经网络的拉曼光谱分析方法,其特征在于:包括如下步骤:
S1:建立分类模型:
S1a:对训练数据集中每个训练样本的拉曼光谱进行预处理:
S1a1:对所有训练样本的拉曼光谱进行去噪:
将所有训练样本的拉曼光谱输入卷积去噪层C1进行去噪,所述卷积去噪层C1的输出表示如下:
Figure FDA0003837912990000011
其中,x1表示卷积去噪层C1的输入,xc1表示卷积去噪层C1的输出,Wc1表示卷积去噪层C1的卷积核权重;Wc1,t是卷积去噪层C1层第t个权重,nc1是Wc1的权重总数;
S1a2:经过S1a1去噪后,再对训练样本的拉曼光谱进行基线校正:
将经过S1a1去噪后的训练样本的拉曼光谱输入基线校正层C2,所述基线校正层C2的输出表示如下:
Figure FDA0003837912990000012
其中,xc2表示基线校正层C2的输出,Wc2表示基线校正层C2的卷积核,Wc2,i为基线校正层C2卷积核的第i个权值,nc2表示基线校正层C2卷积核的权值个数;
S1b:将S1a2校正后的所有训练样本的拉曼光谱加上该训练样本的分类标签,输入神经网络,设有n个训练样本,分类标签中有m个类,m和n均取自然数;
神经网络的输出为每个训练样本被分入某一类的概率值,对于每个训练样本会输出m个概率,值最大的那个概率则为预测概率,该预测概率对应的类,则是该训练样本的预测分类;
统计预测准确率,当该预测准确率低于预设的准确率阈值时,通过损失函数采用反向传播方法调整神经网络每层的权值,然后再将预处理后的所有训练样本的拉曼光谱加上每个训练样本对应的分类标签,输入神经网络进行迭代,直至统计的预测准确率大于等于准确率阈值时才结束迭代过程,此时每层神经网络的权值已经确定,该神经网络即为分类模型;
S2:待测样本预测:
S2a:将所述待测样本的拉曼光谱采用S1a中所述的方法进行预处理;
S2b:将预处理后的待测样本的拉曼光谱输入S1b确定的分类模型中进行预测分类,得到m个概率,值最大的那个概率则为预测概率,该预测概率对应的类,则是该待测样本的预测分类。
2.如权利要求1所述的基于卷积神经网络的拉曼光谱分析方法,其特征在于:所述S1b中的神经网络为三层,分别记为F3层、F4层和F5层,其中F3层为全连接层,F4层为全连接层,FS层为输出层。
3.如权利要求2所述的基于卷积神经网络的拉曼光谱分析方法,其特征在于:所述神经网络中每一层输出都需要经过一个激活函数进行处理,具体地:
F3层输出需经过激活函数(10)的处理:
ReLU(xf3)=max(xf3,0) (10);
其中,xf3表示F3层的输出;
F4层输出需经过激活函数(11)的处理:
ReLU(xf4)=max(xf4,0) (11);
其中,xf4表示F4层的输出;
F5层输出需经过激活函数(12)的处理:
softmax:
Figure FDA0003837912990000021
其中,xji表示第F5层输出的第j个样本属于第i类的概率,Sji表示经过激活函数处理得到的第j个样本属于第i类的概率,m表示类别的个数,n表示训练样本的个数。
4.如权利要求3所述的基于卷积神经网络的拉曼光谱分析方法,其特征在于:所述S1b中的损失函数如下:
Figure FDA0003837912990000022
其中,
Figure FDA0003837912990000023
表示第j个训练样本属于第i类的预测概率,
Figure FDA0003837912990000024
yji表示第j个训练样本属于第i类的概率,yji的值是根据标签获得。
CN201811437661.5A 2018-11-28 2018-11-28 一种基于卷积神经网络的拉曼光谱分析方法 Active CN109543763B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811437661.5A CN109543763B (zh) 2018-11-28 2018-11-28 一种基于卷积神经网络的拉曼光谱分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811437661.5A CN109543763B (zh) 2018-11-28 2018-11-28 一种基于卷积神经网络的拉曼光谱分析方法

Publications (2)

Publication Number Publication Date
CN109543763A CN109543763A (zh) 2019-03-29
CN109543763B true CN109543763B (zh) 2022-10-21

Family

ID=65850938

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811437661.5A Active CN109543763B (zh) 2018-11-28 2018-11-28 一种基于卷积神经网络的拉曼光谱分析方法

Country Status (1)

Country Link
CN (1) CN109543763B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113030060A (zh) * 2019-12-25 2021-06-25 同方威视技术股份有限公司 基于卷积神经网络的毒品拉曼光谱识别方法
CN112132256B (zh) * 2020-08-05 2023-12-08 芯华创(武汉)光电科技有限公司 一种基于神经网络的拉曼分布式温度传感方法和系统
CN112200770A (zh) * 2020-09-08 2021-01-08 浙江大学山东工业技术研究院 一种基于拉曼光谱和卷积神经网络的肿瘤检测方法
CN112634204A (zh) * 2020-12-03 2021-04-09 北京信息科技大学 一种基于卷积神经网络的癌症边界智能识别方法
CN112716447A (zh) * 2020-12-03 2021-04-30 北京信息科技大学 一种基于拉曼检测光谱数据深度学习的口腔癌分类系统
CN112651428A (zh) * 2020-12-03 2021-04-13 北京信息科技大学 一种用于远程拉曼矿物识别的深度学习模型多分类方法
CN112651927A (zh) * 2020-12-03 2021-04-13 北京信息科技大学 一种基于卷积神经网络与支持向量机的拉曼光谱智能识别方法
CN112986210B (zh) * 2021-02-10 2021-12-17 四川大学 一种尺度自适应的微生物拉曼光谱检测方法及系统
CN112782148B (zh) * 2021-02-19 2023-01-03 燕山大学 阿拉比卡和罗伯斯塔两种咖啡豆的快速鉴别方法
CN113035292B (zh) * 2021-04-21 2022-11-04 复旦大学 一种脑胶质瘤浸润区域pH值测定方法及系统

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101329734A (zh) * 2008-07-31 2008-12-24 重庆大学 基于k-l变换和ls-svm的车牌字符识别方法
GB201010177D0 (en) * 2010-06-17 2010-07-21 Canon Kk Method and device for enhancing a digital image
CN105760859A (zh) * 2016-03-22 2016-07-13 中国科学院自动化研究所 基于多任务卷积神经网络的网纹人脸图像识别方法及装置
CN106529458A (zh) * 2016-10-31 2017-03-22 重庆大学 一种面向高光谱图像的深度神经网络空间谱分类方法
CN106845381A (zh) * 2017-01-16 2017-06-13 西北工业大学 基于双通道卷积神经网络的空谱联合的高光谱图像分类方法
CN107478598A (zh) * 2017-09-01 2017-12-15 广东省智能制造研究所 一种基于一维卷积神经网络的近红外光谱分析方法
WO2017215284A1 (zh) * 2016-06-14 2017-12-21 山东大学 基于卷积神经网络的胃肠道肿瘤显微高光谱图像处理方法
CN107495959A (zh) * 2017-07-27 2017-12-22 大连大学 一种基于一维卷积神经网络的心电信号分类方法
CN107833194A (zh) * 2017-11-21 2018-03-23 长沙全度影像科技有限公司 一种结合raw图像去噪的简单透镜图像复原方法
CN108334937A (zh) * 2018-02-06 2018-07-27 大连海事大学 一种基于卷积神经网络的水上油膜相对厚度提取方法及系统
CN108492269A (zh) * 2018-03-23 2018-09-04 西安电子科技大学 基于梯度正则卷积神经网络的低剂量ct图像去噪方法
CN108764358A (zh) * 2018-05-31 2018-11-06 广东工业大学 一种太赫兹图像识别方法、装置、设备及可读存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008505676A (ja) * 2004-07-07 2008-02-28 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 心臓の円錐ビームct再生における筋状アーチファクト低減
CA3031067A1 (en) * 2016-07-18 2018-01-25 Nantomics, Llc Distributed machine learning systems, apparatus, and methods
FR3059804B1 (fr) * 2016-12-07 2019-08-02 Idemia Identity And Security Systeme de traitement d'images
CN107403419A (zh) * 2017-08-04 2017-11-28 深圳市唯特视科技有限公司 一种基于级联卷积神经网络的低剂量x射线图像去噪方法
CN108596213A (zh) * 2018-04-03 2018-09-28 中国地质大学(武汉) 一种基于卷积神经网络的高光谱遥感图像分类方法及系统
CN108572166A (zh) * 2018-04-12 2018-09-25 上海理工大学 雨生红球藻类胡萝卜素及虾青素可视化分析方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101329734A (zh) * 2008-07-31 2008-12-24 重庆大学 基于k-l变换和ls-svm的车牌字符识别方法
GB201010177D0 (en) * 2010-06-17 2010-07-21 Canon Kk Method and device for enhancing a digital image
CN105760859A (zh) * 2016-03-22 2016-07-13 中国科学院自动化研究所 基于多任务卷积神经网络的网纹人脸图像识别方法及装置
WO2017215284A1 (zh) * 2016-06-14 2017-12-21 山东大学 基于卷积神经网络的胃肠道肿瘤显微高光谱图像处理方法
CN106529458A (zh) * 2016-10-31 2017-03-22 重庆大学 一种面向高光谱图像的深度神经网络空间谱分类方法
CN106845381A (zh) * 2017-01-16 2017-06-13 西北工业大学 基于双通道卷积神经网络的空谱联合的高光谱图像分类方法
CN107495959A (zh) * 2017-07-27 2017-12-22 大连大学 一种基于一维卷积神经网络的心电信号分类方法
CN107478598A (zh) * 2017-09-01 2017-12-15 广东省智能制造研究所 一种基于一维卷积神经网络的近红外光谱分析方法
CN107833194A (zh) * 2017-11-21 2018-03-23 长沙全度影像科技有限公司 一种结合raw图像去噪的简单透镜图像复原方法
CN108334937A (zh) * 2018-02-06 2018-07-27 大连海事大学 一种基于卷积神经网络的水上油膜相对厚度提取方法及系统
CN108492269A (zh) * 2018-03-23 2018-09-04 西安电子科技大学 基于梯度正则卷积神经网络的低剂量ct图像去噪方法
CN108764358A (zh) * 2018-05-31 2018-11-06 广东工业大学 一种太赫兹图像识别方法、装置、设备及可读存储介质

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Compressed sensing MRI using Singular Value Decomposition based sparsity basis;Yeyang Yu;《2011 Annual International Conference of the IEEE Engineering in Medicine and Biology Society》;20111231;全文 *
Emre Ardiç.Classification of 1D signals using deep neural networks.《2018 26th Signal Processing and Communications Applications Conference (SIU)》.2018, *
基于Raman光谱的人、犬、兔血液鉴别;董家林;《光谱学与光谱分析》;20180228;全文 *
基于卷积神经网络与光谱特征的夏威夷果品质鉴定研究;杜剑;《光谱学与光谱分析》;20180531;全文 *
基于改进全卷积神经网络的航拍图像语义分类方法;易盟;《计算机工程》;20171031;全文 *
基于深度自适应神经网络的高光谱图像分类方法研究;李胜力;《中国优秀硕士学位论文全文数据库信息科技辑》;20180615;全文 *

Also Published As

Publication number Publication date
CN109543763A (zh) 2019-03-29

Similar Documents

Publication Publication Date Title
CN109543763B (zh) 一种基于卷积神经网络的拉曼光谱分析方法
US11501192B2 (en) Systems and methods for Bayesian optimization using non-linear mapping of input
US7899625B2 (en) Method and system for robust classification strategy for cancer detection from mass spectrometry data
US20180349158A1 (en) Bayesian optimization techniques and applications
CN116894985B (zh) 半监督图像分类方法及半监督图像分类系统
CN112819821B (zh) 一种细胞核图像检测方法
CN117015796A (zh) 处理组织图像的方法和用于处理组织图像的系统
CN111062411A (zh) 从质谱数据中识别多种化合物的方法、装置和设备
CN115049952A (zh) 一种基于多尺度级联感知深度学习网络的幼鱼肢体识别方法
CN114708301A (zh) 一种运动伪影识别方法、装置、存储介质及电子设备
CN109540292B (zh) 一种光谱的预处理方法
US11397868B2 (en) Fungal identification by pattern recognition
CN113011532A (zh) 分类模型训练方法、装置、计算设备及存储介质
CN117495640A (zh) 一种区域碳排放量预测方法及系统
CN110414562B (zh) X光片的分类方法、装置、终端及存储介质
Kale et al. Forecasting Indian stock market using artificial neural networks
CN114839210B (zh) 基于ssa-bp神经网络的xrf元素定量分析方法
CN107943916B (zh) 一种基于在线分类的网页异常检测方法
CN110837853A (zh) 一种快速分类模型构建方法
CN115511798A (zh) 一种基于人工智能技术的肺炎分类方法及装置
CN114781484A (zh) 基于卷积神经网络的癌症血清sers光谱分类方法
CN113177608A (zh) 一种针对不完整数据的近邻模型特征选择方法及装置
CN113610164A (zh) 一种基于注意力平衡的细粒度图像识别方法及其系统
CN113296947A (zh) 基于改进XGBoost模型的资源需求预测方法
CN113971984A (zh) 分类模型构建方法及装置、电子设备、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant