CN109543763A

CN109543763A - 一种基于卷积神经网络的拉曼光谱分析方法

Info

Publication number: CN109543763A
Application number: CN201811437661.5A
Authority: CN
Inventors: 洪明坚; 沈东旭; 董家林
Original assignee: Chongqing University
Current assignee: Chongqing University
Priority date: 2018-11-28
Filing date: 2018-11-28
Publication date: 2019-03-29
Anticipated expiration: 2038-11-28
Also published as: CN109543763B

Abstract

本发明涉及一种基于卷积神经网络的拉曼光谱分析方法，首先是建立分类模型，建立过程是对已经物质的拉曼光谱进行预处理，再将预处理后的拉曼光谱输入神经网络进行训练，确定每层网络中的权值，从而确定分类模型，将这一模型命名为RS‑CNN,其次将待预测物质的拉曼光谱进行预处理，然后将预处理的后的带预测物质的拉曼光谱输入分类模型中，分类模型的输出即是分类结果。将卷积神经网络去噪和基线校正以卷积的方式融入到卷积神经网络中，从而将预处理过程和鉴别问题转化在统一的模型框架中求解，实现了数据的自适应处理，弥补了传统方法的不足。

Description

一种基于卷积神经网络的拉曼光谱分析方法

技术领域

本发明涉及光谱分析方法领域，特别涉及一种基于卷积神经网络的拉曼光谱分析方法。

背景技术

通过仪器测量得到原始拉曼光谱通常都伴有严重的噪声和基线漂移，鉴别时限制了对光谱数据中有用信息的提取，因此，拉曼光谱分析过程中通常有较为繁琐的去噪和基线校正的过程。

现目前大多数的去噪和基线校正的方法均独立于模型，这增加了因预处理不当而造成的模型预测能力下降的风险。同时受待测物质的物理特性(如颗粒度，装填密度和均匀性等)、环境温度和探测器的非线性响应等影响，拉曼光谱与待测物质的性质和成分含量存在一定的非线性关系，但是现阶段的大多数拉曼光谱定性或定量的校正方法都是线性模型，对于这种非线性关系不能进行较好的表示。

现有技术在建立分类模型时，大都是根据经验预设模型参数，这种方法一方面限定了拉曼光谱分析的准确性，另一方面根据待分类物质的特性不同，分类模型的参数也需要做调整，因此根据经验值设定的预测模型参数后，只能用于对一些特定物质进行分类，每次在测定不同物质时都需要对分类模型的参数进行重新设定，这不但导致分类模型的通用性差，更重要的是分类模型分类的准确性也很难保证。

发明内容

针对现有技术存在的上述问题，本发明的目的是一种基于卷积神经网络的拉曼光谱分析方法，该方法的目的是对物质分类，采用自适应的学习方法进行训练，得到分类模型的参数，因此建立的分类模型的适用性更广，分类的准确性也更高。

为实现上述目的，本发明采用如下技术方案：一种基于卷积神经网络的拉曼光谱分析方法，包括如下步骤：

S1：建立分类模型：

S1a：对训练数据集中每个训练样本的拉曼光谱进行预处理：

S1a1：对所有训练样本的拉曼光谱进行去噪：

将所有训练样本的拉曼光谱输入卷积去噪层层C1进行去噪，所述卷积去噪层层C1的输出表示如下：

其中，x₁表示卷积去噪层C1的输入，x_c1表示卷积去噪层C1的输出，W_c1表示卷积去噪层C1的卷积核权重；W_c1,i是卷积去噪层C1层第i个权重，n_c1是W_c1的权重总数；

S1a2：经过S1a1去噪后，再对训练样本的拉曼光谱进行基线校正：

将经过S1a1去噪后的训练样本的拉曼光谱输入基线校正层C2，所述基线校正层C2的输出表示如下：

其中，x_c2表示基线校正层C2的输出，W_c2表示基线校正层C2的卷积核，W_c2,i为基线校正层C2卷积核的第i个权值，n_c2表示基线校正层C2卷积核的权值个数；

S1b：将S1a2矫正后的所有训练样本的拉曼光谱加上该训练样本的分类标签，输入神经网络，设有n个训练样本，分类标签中有m个类，m和n均取自然数；

神经网络的输出为每个训练样本被分入某一类的概率值，对于每个训练样本会输出m个概率，值最大的那个概率则为预测概率，该预测概率对应的类，则是该训练样本的预测分类；

统计预测准确率，当该预测准确率低于预设的准确率阈值时，通过损失函数调整神经网络每层的权值，然后再将预处理后的所有训练样本的拉曼光谱加上每个训练样本对应的分类标签，输入神神经网络进行迭代，直至统计的预测准确率大于等于准确率阈值时才结束迭代过程，此时每层神经网络的权值已经确定，所述该神经网络即为分类模型；

S2：待测样本预测：

S2a：将所述待测样本的拉曼光谱采用S1a中所述的方法进行预处理；

S2b：将预处理后的待测样本的拉曼光谱输入S1b确定的分类模型中进行预测分类，得到 m个概率，值最大的那个概率则为预测概率，该预测概率对应的类，则是该待测样本的预测分类。

作为改进，所述S1b中的神经网络为三层，分别记为F3层、F4层和F5层。

作为改进，所述神经网络中每一层输出都需要经过一个激活函数进行处理，具体地：

F3层输出需经过激活函数(10)的处理：

ReLU(x_f3)＝max(x_f3,0)(10)；

其中，x_f3表示F3层的输出；；

F4层输出需经过激活函数(11)的处理：

ReLU(x_f4)＝max(x_f4,0)11)；

其中，x_f4表示F4层的输出；

F5层输出需经过激活函数(12)的处理：

其中，x_ji表示第F5层输出的第j个样本属于第i类的概率，S_ji表示经过激活函数处理得到的第j个样本属于第i类的概率，m表示类别的个数，n表示训练样本的个数。

作为改进，所述S1b中的损失函数如下：

其中，表示第j个训练样本属于第i类的预测概率，y_ji表示第j个训练样本属于第i类的概率，y_ji的值是根据标签获得。

相对于现有技术，本发明至少具有如下优点：(1)本发明方法中建立分类模型时，将去噪和基线校正以卷积的方式融入中，从而将预处理过程和鉴别问题放在统一的模型框架中求解，实现了光谱的自适应处理，弥补了传统方法的不足。

(2)本发明方法中建立分类模型时，去噪和基线校正过程中每一个卷积层中都只有一个卷积核，相比于传统的网络解释性更强，而且更容易监控卷积层的输出，以查看是否达到预期的效果。

(3)本发明的去噪和基线校正部分可以单独作为一个自适应光谱预处理器，将预处理后得到的数据可以用于PLS-DA、SVM等其他分类器。

附图说明

图1为本发明基于卷积神经网络的拉曼光谱分析方法的流程图。

图2为卷积去噪层C1的原理图，2(a)为原始光谱图，2(b)为卷积核，图2(c)为卷积后的光谱

图3为基线校正层C2的原理，图3(a)为原始光谱、卷积后的光谱、二者之差，图3(b)为卷积核。

图4为本发明方法中卷积神经网络RS-CNN的结构图。

图5为实施例1中卷积去噪层C1层的输入与输出的谱线比较。

图6为实施例1中卷积去噪层C1层卷积核系数。

图7为实施例1中基线校正层C2输入与输出比较。

图8为实施例1中的目标函数。

图9为实施例1中血液鉴别ROC曲线，图9(a)为PLS-DA方法，图9(b)为SVM，图9(c)为RS-CNN。

具体实施方式

下面对本发明作进一步详细说明。

本发明基于卷积神经网络的拉曼光谱分析方法的思路是：首先是建立分类模型，建立过程是对已知物质的拉曼光谱进行预处理，再将预处理后的拉曼光谱输入神经网络进行训练，确定每层网络中的权值，从而确定分类模型，这一分类模型即为卷积神经网络，用RS-CNN表示,如图1所示，实现了在拉曼光谱分析时,根据定性目标自适应的数据预处理以及校正的过程。其次将待预测物质的拉曼光谱进行预处理，然后将预处理的后的带预测物质的拉曼光谱输入分类模型中，分类模型的输出即是分类结果。

本发明中的卷积神经网络首先是对池化层进行改动，池化层会导致光谱信息丢失，应该删除池化层。然后是对卷积层进行改动，卷积层实现了对拉曼光谱的卷积和去噪，为了达到更好的去噪效果，对卷积去噪层的卷积核的增加权重非负与和为1的约束；为了去掉光谱的基线，卷积基线校正层采用较宽的卷积核去除基线。以上改进能对光谱数据进行较好的预处理，将这些预处理后的数据通过全连接层建立校正模型。

本发明创造性的将神经网络与拉曼光谱分析进行结合，通过神经网络建立分类模型具有自适应学习的功能，相比现有技术通过预设参数建立的分类模型，该模型的适应性更广，分类的准确更高。

神经网络可以进行自适应深度学习，从伴有噪声和基线漂移的拉曼光谱中学习得到用于物质鉴别、含量预测等实际应用问题的有效特征。深度学习的强大的非线性映射能力，更是可以消除非线性关系对校正模型预测性能的影响，进一步提升鉴别性能。

一种基于卷积神经网络的拉曼光谱分析方法，包括如下步骤：

S1：建立分类模型，即RS-CNN：

S1a：对训练数据集中每个训练样本的拉曼光谱进行预处理：

在RS-CNN中分别采用两层不同的卷积层对拉曼光谱进行去噪和基线校正。如图2所示，采用适当的卷积核能实现对噪声光谱的平滑去噪。然而，当平滑的卷积核加宽到一定程度后，其结果如图3的虚线所示，这是采用的较宽卷积核时取得的结果，可以看出曲线只保留了整体走势，不包含任何谱峰信息，近似于光谱的基线。

由图3(b)所示，单位卷积核记为I(n)，加宽后的平滑卷积核记为h(n)，此处的*为卷积操作。图3(a)中的基线校正后的谱线s(n)可以近似的表示为：

s(n)≈x(n)-x(n)*h(n)＝x(n)(I(n)-h(n)) (1)

所以基线校正的卷积核为：(I(n)-h(n))。

卷积不仅能对拉曼光谱进行去噪，还能进行基线校正，利用卷积的这一特性，我们构造一个联合卷积(去噪和基线校正)与预测目标的卷积神经网络，从而根据预测目标自适应的去学习卷积核的参数。构建了如图4所示的卷积神经网络，该网络大概分为三个部分：卷积去噪、卷积基线校正和全连接校正模型。

将现有的卷积神经网络用于拉曼光谱的分析构建RS-CNN。首先，我们需要对池化层和卷积层进行改进：

删除池化层，简化卷积层

对于任意一条光谱谱线而言，每一个波长点所对应的值都是非常重要的，正是通过对这些波长点的值分析物质的成分、含量等。在对光谱做数据分析时，应尽量避免光谱数据的丢失。在卷积神经网络中，池化层通常用于卷积层之后，对卷积层输出的特征向量进行降维，然而这样的操作会导致光谱信息的大量的丢失，不利于进一步的分析，因此在进行光谱分析的时候池化层应该被舍弃。我们需要的卷积神经网络中的卷积层的目的都是单一的：去噪或基线校正。因此每一个卷积层只需要设置一个卷积核就可以了，即通道(Channel)数为1。

每一个卷积层只需要设置一个卷积核就可以了，即通道(Channel)数为1。

S1a1：对所有训练样本的拉曼光谱进行去噪：卷积去噪层增加卷积核权重的非负与和为 1的约束：

对于卷积去噪层C1而言，C1层的输出可以表示为：

其中，x₁表示卷积去噪层C1的输入，x_c1表示卷积去噪层C1的输出，W_c1表示卷积去噪层C1的卷积核权重；从式(1)可以看出，当x₁*W_c1＜0，通过激活函数ReLU激活可能会引起光谱数据的丢失。因此，将用下面的公式替换掉ReLU函数:

x_c1＝x₁*W_c1 (3)；

为了让C1层的输出能达到较好的去噪效果，对C1层的卷积核W_c1有两个约束：W_c1中的所有值为非负和所有制值相加为1。

其中，x₁表示卷积去噪层C1的输入，x_c1表示卷积去噪层C1的输出，W_c1表示卷积去噪层C1的卷积核权重；W_c1,i是卷积去噪层C1层第i个权重，n_c1是W_c1的权重总数；W_c1,i的初始值是随机生成的，随后是通过网络自适应学习进行迭代替换。

S1a2：经过S1a1去噪后，再对训练样本的拉曼光谱进行基线校正：基线校正层C2增加卷积核所有权值都小于1与和为0约束。

为了使基线校正层(C2)达到去基线的效果，如图3所示，应当选择基线较宽的卷积核去移除基线。从式(1)可知：h(n)≥0且(I(n)-h(n))≤1且所以对C2层的卷积核的约束为：卷积核的所有权值都小于1且和为0,将经过S1a1去噪后的训练样本的拉曼光谱输入基线校正层C2，所述基线校正层C2的输出表示如下：

其中，x_c2表示基线校正层C2的输出，W_c2表示基线校正层C2的卷积核，W_c2,i为基线校正层C2卷积核的第i个权值，n_c2表示基线校正层C2卷积核的权值个数；W_c2,i的初始值是随机生成的，随后是通过网络自适应学习进行迭代替换。

在基于上述3个改进后卷积层对光谱有了较好的预处理效果。同时由于光谱分析与图像处理相比，通常任务比较单一，所以全连接校正层沿用LeNet-5，神经元的个数保持不变，如图4所示，F3层为全连接层；F4层为全连接层，F5层为输出层。

S1b：将S1a2矫正后的所有训练样本的拉曼光谱加上该训练样本的分类标签，输入神经网络，设有n个训练样本，分类标签中有m个类，m和n均取自然数，每个类取0或1，0表示该训练样本属于某一类的概率为0,1表示训练样本属于某一类的概率为1，例如实施例1中，b1代表人类血液，b2代表动物血液，那么分类标签(b1＝0.b2＝1)的含义:该训练样本的分类标签中两个类b1和b2，该训练样本属于b1类的概率为0，属于b2类的概率为1，即该样本属于动物血液的概率为0，属于人类血液的概率为1。

统计预测准确率,由于训练样本属于哪一类是已知的，因此将预测分类正确的样本数除以总样本数m即可获得预测准确率，当该预测准确率低于预设的准确率阈值时，通过损失函数采用反向传播方法(采用反向传播方法属于现有技术，为节约篇幅，此处不再详述)调整神经网络每层的权值，然后再将预处理后的所有训练样本的拉曼光谱加上每个训练样本对应的分类标签，输入神神经网络进行迭代，直至统计的预测准确率大于等于准确率阈值时才结束迭代过程，此时每层神经网络的权值已经确定，所述该神经网络即为分类模型；

S2：待测样本预测：

所述神经网络中每一层输出都需要经过一个激活函数进行处理，具体地：

F3层输出需经过激活函数(10)的处理：

ReLU(x_f3)＝max(x_f3,0) (10)；

其中，x_f3表示F3层的输出；

F4层输出需经过激活函数(11)的处理：

ReLU(x_f4)＝max(x_f4,0) ((11)；

其中，x_f4表示F4层的输出；

F5层输出需经过激活函数(12)的处理：

所述S1b中的损失函数如下：

实施例1：将本发明用于血液样品的分析。

实验用训练样本共326例，人血样本110例均采集于重庆市西南医院，动物血样216例均采集于重庆市中医研究院。分类准确率相比传统方法PLS-DA和SVM分别提高了3.67％和 4.59％。

下面是对具体的RS-CNN进行介绍。

RS-CNN中卷积去噪层层C1的输出结果如图5所示(图示为归一化后的结果以便于比较)，其去噪效果明显。图6给出了卷积去噪层层C1卷积核系数。卷积去噪层层C1的卷积核不宜过大，过大会导致谱峰信息丢失，影响分类结果。如表1所示，列出使用三种(1*51,1*31,1*15) 大小不同的卷积核的校正集与测试集的分类准确率，可以看出卷积核越大分类效果越差。应该根据相应的噪声水平经验性的估计适宜的卷积核尺寸，本实验卷积去噪层层C1的卷积核大小取为5。

表1卷积去噪层层C1不同卷积核大小分类结果比较

卷积核大小	1×51	1×31	1×15
				校正集的分类准确率	66.63％	82.95％	100％
测试集的分类准确率	66.06％	80.73％	93.58％

RS-CNN中基线校正层C2的输出结果如图7所示。光谱通过基线校正层C2处理后，其基线校正效果尤为明显，而且卷积后的结果不仅移除了基线，同时对某些特征峰有增强或抑制的效果(图7中实线框中为抑制，虚线框中为增强)。基线校正层C2的卷积核不宜过小，过小的卷积核难以达到基线校正的目的。如表2所示，列出了三种(1*5,1*15,1*25)不同大小的卷积的校正集和测试集的分类结果。从表中可以看出不同的卷积核对分类没有什么大的影响，尽管如此，基线校正层C2的卷积核也不宜过大，过多的卷积核系数增加了基线校正层输出的不确定性，本实验将基线校正层的卷积核大小定为51。

表2基线校正层C2不同卷积核大小的分类结果比较

卷积核大小	1×5	1×15	1×25
				校正集分类准确率	100％	100％	100％
测试集分类准确率	97.25％	97.25％	97.25％

RS-CNN中参数的设置尤为重要，本发明将最小化预测值与测量值的交叉熵作为目标函数 (损失函数)：

N为样本数，y_i为第i个样本的测量值，为第i个样本的预测值。采用随机优化方法 Adam(自适应矩阵)，设置的初始学习率为0.001，每次训练和梯度更新块大小为32，每次悬梁完成后计算一次损失值，经过1050次训练后，其损失值的变化情况如图8所示。本次实验选用第588次训练结果，在获得最有解的同时，防止模型过拟合。

本发明的分析方法与现有的分析方法的比对：

数据集

本实验所采用的数据集血液数据集，该数据集包含110例人血液拉曼光谱、216例动物血液拉曼光谱(116例犬血，100例兔血)，通过duplex算法选取1/3的样本作为测试集用于模型评价，即人血37例，动物血72例(39例犬血，33例兔血)，余下的2/3作为校正集用于模型训练，即人血73，动物血144例(77例犬血，67例兔血)。

实验评价指标

为了评价RS-CNN的性能，采用了准确率、AUC值和ROC曲线评价RS-CNN分类的性能。准确率的计算公式如下：

其中M为样本数，N为分类准确的个数，acc为准确率，error为错误率。计算ROC 曲线与AUC值需要构造一个混淆矩阵，如表3所示：

表3分类结果的混淆矩阵

其中TP表示真正例，FP表示假正例，FN表示假反例，TN表示真反例。ROC曲线的纵轴是真正例率(True Positive Rate，TPR)，横轴是假正例率(False Positive Rate，FPR)，定义如下：

AUC(Area Under ROC Curve)为ROC曲线围成的面积，其计算公式如下：

n表示ROC曲线沿横坐标方向分成的份数，(FPR_n,TPR_n)为ROC曲线的最后一个点。

实验分析结果

本实验是将RS-CNN与PLS-DA、SVM的结果进行对比，在校正集的分类结果上，三种模型均未错分，校正集分类精度100％(217/217)。而测试集的结果如表4所示，PLS-DA错分7例，动物血液错分为人血液4例，包括3例犬血液，1例兔血液，分类进度93.58％；SVM错分8例，动物血液错分为人血液3例，包括2例犬血液，1例兔血液，分类进度92.66％； RS-CNN错分3例，动物血液错分为人血液1例(兔)，分类进度97.25％，较PLS-DA、SVM 盲测精度高，且人与动物血液错分比例均下降。这三种模型的ROC曲线如图9所示，根据计算公式(8)求得PLS-DA、SVM、RS-CNN的AUC值分别为0.93656、0.9726、0.97335。通过对比，本发明提出的RS-CNN更具有优势。

表4测试集分类结果对比

模型	PLS-DA	SVM	RS-CNN
				人血样错分数量	3	5	2
动物血样分错数量	4	3	1
				分类准确率	93.58％	92.66％	97.25％

最后说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的宗旨和范围，其均应涵盖在本发明的权利要求范围当中。

Claims

1.一种基于卷积神经网络的拉曼光谱分析方法，其特征在于：包括如下步骤：

S1：建立分类模型：

S1a：对训练数据集中每个训练样本的拉曼光谱进行预处理：

S1a1：对所有训练样本的拉曼光谱进行去噪：

统计预测准确率，当该预测准确率低于预设的准确率阈值时，通过损失函数采用反向传播方法调整神经网络每层的权值，然后再将预处理后的所有训练样本的拉曼光谱加上每个训练样本对应的分类标签，输入神神经网络进行迭代，直至统计的预测准确率大于等于准确率阈值时才结束迭代过程，此时每层神经网络的权值已经确定，所述该神经网络即为分类模型；

S2：待测样本预测：

S2b：将预处理后的待测样本的拉曼光谱输入S1b确定的分类模型中进行预测分类，得到m个概率，值最大的那个概率则为预测概率，该预测概率对应的类，则是该待测样本的预测分类。

2.如权利要求1所述的基于卷积神经网络的拉曼光谱分析方法，其特征在于：所述S1b中的神经网络为三层，分别记为F3层、F4层和F5层。

3.如权利要求2所述的基于卷积神经网络的拉曼光谱分析方法，其特征在于：所述神经网络中每一层输出都需要经过一个激活函数进行处理，具体地：

F3层输出需经过激活函数(10)的处理：

ReLU(x_f3)＝max(x_f3,0) (10)；

其中，x_f3表示F3层的输出；

F4层输出需经过激活函数(11)的处理：

ReLU(x_f4)＝max(x_f4,0) (11)；

其中，x_f4表示F4层的输出；

F5层输出需经过激活函数(12)的处理：

4.如权利要求3所述的基于卷积神经网络的拉曼光谱分析方法，其特征在于：所述S1b中的损失函数如下：