CN114692773A

CN114692773A - 基于drs-vgg的端到端深度学习拉曼光谱数据分类方法

Info

Publication number: CN114692773A
Application number: CN202210368912.9A
Authority: CN
Inventors: 周猛飞; 胡寅朝; 郭添; 余奇清; 孙小方; 蔡亦军
Original assignee: Zhejiang University of Technology ZJUT
Current assignee: Zhejiang University of Technology ZJUT
Priority date: 2022-04-08
Filing date: 2022-04-08
Publication date: 2022-07-01
Anticipated expiration: 2042-04-08

Abstract

本发明公开一种基于Deep Residual Shrinkage‑VGG的端到端深度学习的分类方法，包括：获取拉曼光谱数据，进行一阶样条插值处理且补零，随机打乱后划分成训练集、验证集和测试集；构建一个基于Deep ResidualShrinkage‑VGG的端到端深度学习的分类模型；使用训练集训练该分类模型，使用验证集对模型的超参数进行调整；使用测试集测试该性能。本发明提出的方法，无需光谱数据校正预处理，适用于高噪声、小样本、超多分类的拉曼光谱数据，提高了拉曼光谱数据分类问题的正确率与适用性，在一定程度上改善了深层深度学习网络模型的训练过慢的问题。

Description

基于DRS-VGG的端到端深度学习拉曼光谱数据分类方法

技术领域

本发明涉及拉曼光谱数据分类领域，具体涉及一种基于Deep ResidualShrinkage-VGG的端到端深度学习拉曼光谱数据分类方法。

背景技术

拉曼光谱是一种振动光谱，在分析科学领域中为我们提供了一种具有快速、灵敏、非接触性、非破坏性特点的检测方法，它通过材料对入射光源中产生的拉曼散射进行材料的结构分析。拉曼光谱适用于不同温度下气体、液体、固体的定性定量分析，因此，在医疗领域、食品科学领域、法医学领域、地质学领域实现了广泛应用。

拉曼光谱信号中包含的信息是分析的关键。由于拉曼信号容易受到荧光过程、材料密度、环境噪声、外部光源的影响，光谱会出现基线漂移的现象和受到噪声信号的干扰，噪声信号强度可比拉曼散射高出几个数量级，严重影响光谱的分析。由于这些限制因素的存在，传统的拉曼光谱分析过程通常需要通过去噪、平滑、基线消除、归一化等数据预处理。许多传统的机器学习方法已经被应用于对目标物的定性定量分析。支持向量机(SupportVector Machine，SVM)、K近邻(K-Nearest Neighbor，KNN)、随机森林(Random Forest，RF)、逻辑斯蒂回归(Logistic Regression，LR)算法是几种简单有效的分类器，然而这些算法容易在小样本、类不均衡、高噪声数据的场景上出现过拟合的问题，且无法构造无需预处理的端到端的数据分类模型。

近年来，深度学习算法也逐渐被应用到光谱数据的自动化分析方面，它的目的在于用抽象的方法不断从低级特征向量中提取重要特征。相比之下，深度学习算法是更为优异的选择方案，它在光谱识别的任务中拥有着如下两大优点：(1)不仅能识别相关特征，还能学习识别模式和知识。(2)相比于机器学习算法拥有更良好的分类结果。就总体而言，目前拉曼光谱识别研究过渡依赖于特征工程，注重采用数据增强手段实现识别正确率的提升，较少考虑模型性能与训练时间成本之间的权衡。我们认为构造一种能够自动处理数据、训练速度快、精度高的端到端分类模型是解析和理解光谱信息不可缺少的手段。

发明内容

本发明的目的在于，提出一种基于DRS(Deep Residual Shrinkage)-VGG的端到端深度学习拉曼光谱数据分类方法，利用深度学习方法取代了传统的通过预处理的方案，实现了富含干扰信息的多类别的拉曼光谱数据的识别，且达到了深度学习网络模型性能与训练时间成本之间的权衡。

本发明的技术方案为：

一种基于Deep Residual Shrinkage-VGG的端到端深度学习拉曼光谱数据分类方法，包括以下步骤：

步骤1，获取拉曼光谱数据，进行一阶样条插值处理，将超出原光谱波数范围的插值点补零，将处理后的拉曼光谱数据随机打乱后划分成训练集、验证集和测试集；

步骤2，构建一个基于Deep Residual Shrinkage-VGG的端到端深度学习的分类模型；

步骤3，使用训练集训练基于Deep Residual Shrinkage-VGG的端到端深度学习的分类模型，使用验证集对模型的超参数进行调整，初步评估模型的性能；

步骤4，使用测试集测试基于Deep Residual Shrinkage-VGG的端到端深度学习的分类模型性能。

步骤1中，获取拉曼光谱数据，进行一阶样条插值处理，具体包括：采用式(1)对拉曼光谱数据进行一阶样条插值处理，由于采样条件不同，各样本不处于同一波数范围，需要通过插值处理使得数据尺寸达到一致。由指定波数值求得对应光谱强度值，使得每个拉曼光谱在指定波数范围内均匀采样：

式中，x_i-1和x_i+1为插值前的某个分段区间左右端点拉曼光谱数据波数值；y_i-1和y_i+1为插值前的该分段区间左右端点拉曼光谱数据强度值；X_i为该区间插值后的拉曼光谱数据波数值；Y_i为该区间插值后的拉曼光谱数据强度值；

将超出原光谱波数范围的插值点补零，具体包括：若给定插值区间大于原拉曼光谱数据的波数范围，在原拉曼光谱数据的波数范围内进行一阶样条插值后，在超出在原拉曼光谱数据的波数范围用数值0补齐范围外插值数据的强度值；

将处理后的拉曼光谱数据随机打乱后划分成训练集、验证集和测试集，具体包括：将随机打乱后的拉曼光谱数据的30％划分为测试集，在划分过程中将数据按原数据集中各标签的比例传递，使得样本分布相同；采取同样的划分策略，将剩下数据的80％划分为训练集，将剩下数据的20％划分为验证集。

步骤2中，构建一个基于Deep Residual Shrinkage-VGG的端到端深度学习的分类模型，具体包括：

构建的基于Deep Residual Shrinkage-VGG的端到端深度学习的分类模型依次由两个卷积模块、三个DRS模块、两个全连接模块和Softmax输出层构成；

卷积模块依次由卷积层、ReLU激活函数、卷积层、ReLU激活函数、最大池化层连接构成；

DRS模块由卷积层、ReLU激活函数、全局平均池化层、全连接层、批标准化层、Sigmoid激活函数、最大池化层相组合构成；模块的主体是四个依次连接的卷积层，在主体的不同阶段加入了两个分支；在一分支中加入了恒等映射，在参数反向传播的过程中使得梯度可以更加有效地流回上层以减轻卷积神经网络的训练难度；在另一分支中借助了注意力机制来自动实现了特征的软阈值化，它的主要功能是将绝对值小于某个阈值的特征消除为0，同时其它的特征也向着0进行调整，表示为：

式中，

代表了软阈值化后的第i个通道的第j个强度值；z_ij代表未经处理前第i个通道的第j个强度值；λ_i代表经过全局平均池化层后第i个强度值；w_i代表经过Sigmoid激活函数后的第i个强度值，它代表了的λ_i权重，λ_i与w_i的相乘代表了每一层通道所对应的阈值；

将DRS模块的输出展开作为全连接层的输入；全连接模块依次由全连接层、批标准化层、ReLU激活函数、丢弃率为0.5的Dropout层连接构成；

将全连接模块的输出作为Softmax输出层的输入，通过Sotfmax输出层获得概率分布形式的分类预测结果。

DRS-VGG中DRS的含义为深度残差收缩(Deep Residual Shrinkage)，这意味着整个模型具有较深的结构，收缩并不意味着像金字塔般的网络结构，而是意味着主体模块可以不断提炼并保留信号中包含的重要信息。

步骤3中，使用训练集训练基于Deep Residual Shrinkage-VGG的端到端深度学习的分类模型，使用验证集对模型的超参数进行调整，初步评估模型的性能，具体包括：

1)按照一维数据尺寸设置输入层的输入大小，使得数据依次经过分类模型的各层；

2)使用he_uniform按照均匀分布赋值卷积层的权重，权重的初始化情况如下所示：

式中，W_i,j代表某个卷积层第i个卷积核的第j个权重；U代表均匀分布；n_in代表权值张量中的输入单位的数量；W_i,j从

中的均匀分布中抽取数值；

3)使用Adam优化器对步骤2中构建的基于Deep Residual Shrinkage-VGG的端到端深度学习的分类模型进行训练，使用交叉熵损失函数，交叉熵损失函数表达式为：

式中，L为模型输入数据与输出数据的损失误差值总和；L_i为样本i的损失误差值；N为输入数据拉曼光谱总数；M为输入数据类别总数；y_ic为取值为0或1的符号函数，若样本i的真实类别等于c则取1，否则取0；p_ic为观测样本i属于类别c的预测概率；

4)将训练集中的样本作为输入，并划分为合适的多个批次batch_size，设置合适的学习率训练基于Deep Residual Shrinkage-VGG的端到端深度学习的分类模型，使得损失函数收敛；

5)使用验证集评估训练的基于Deep Residual Shrinkage-VGG的端到端深度学习的分类模型的误差和分类准确率，从而进行模型调参，保存最优的基于Deep ResidualShrinkage-VGG的端到端深度学习的分类模型。

步骤4中，使用测试集测试基于Deep Residual Shrinkage-VGG的端到端深度学习的分类模型性能，具体包括：

使用测试集对步骤3中保存的基于Deep Residual Shrinkage-VGG的端到端深度学习的分类模型的性能进行测试，采用正确率、准确率、召回率、F1分数、GFLOPs、早停时间、可训练参数作为基于Deep Residual Shrinkage-VGG的端到端深度学习的分类模型的评价指标。

与现有技术相比，本发明具有如下优点：

本发明提出的一种基于Deep Residual Shrinkage-VGG的端到端深度学习的分类方法与现有的机器学习与深度学习方法相比，完成了拉曼光谱数据端到端的识别，在无需预处理的情况下，提高了拉曼光谱数据超多分类问题的准确率，且实现了模型性能与训练时间成本之间的权衡。本发明基于Deep Residual Shrinkage-VGG的端到端深度学习的分类模型在较深的网络结构中通过恒等映射和DRS模块的加入无视了特征之间的差异性，通过特征复用加快了模型的学习速度，解决了复杂深度学习模型计算复杂度大，训练时间长，容易在训练过程中出现梯度异常的问题。

本发明提出的一种基于Deep Residual Shrinkage-VGG的端到端深度学习拉曼光谱数据分类方法，无需光谱数据校正预处理，适用于高噪声、小样本、超多分类的拉曼光谱数据，提高了拉曼光谱数据分类问题的正确率与适用性，在一定程度上改善了深层深度学习网络模型的训练过慢的问题。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例共同用于解释本发明，并不构成对本发明的限制。在附图中：

图1是本发明实施例中基于Deep Residual Shrinkage-VGG的端到端深度学习的分类方法的流程图。

图2是DRS模块结构图。

图3是卷积模块结构图。

图4是全连接模块结构图。

具体实施方式

以下将结合附图及实施例来详细说明本发明的实施方式，借此对本发明如何应用技术手段来解决技术问题，并达成技术效果的实现过程能充分理解并据此实施。

如图1～4所示，一种基于Deep Residual Shrinkage-VGG的端到端深度学习的拉曼光谱数据分类方法，包括以下步骤：

步骤1，获取拉曼光谱数据，进行一阶样条插值处理，将超出原光谱波数范围的插值点补零，将处理后的拉曼光谱数据随机打乱后划分成训练集、验证集和测试集。

由于采样条件不同，各样本不处于同一波数范围，需要通过插值处理使得数据尺寸达到一致。采用式(1)对拉曼光谱数据进行一阶样条插值处理，从50cm^-1到1650cm^-1波数范围内以1cm^-1为间隔均匀插值，得到1601个与波数对应的强度值，一阶样条插值方法如下所示：

式中，x_i-1和x_i+1为插值前的某个分段区间左右端点拉曼光谱数据波数值；y_i-1和y_i+1为插值前的该分段区间左右端点拉曼光谱数据强度值；X_i为该区间插值后的拉曼光谱数据波数值；Y_i为该区间插值后的拉曼光谱数据强度值。

将超出在原拉曼光谱数据的波数范围的强度值用数值0补齐。

步骤2，构建一个基于Deep Residual Shrinkage-VGG的端到端深度学习的分类模型。

构建的基于Deep Residual Shrinkage-VGG的端到端深度学习的分类模型依次由两个卷积模块、三个DRS模块、两个全连接模块和Softmax输出层构成。

卷积模块依次由卷积层、ReLU激活函数、卷积层、ReLU激活函数、最大池化层连接构成。

第一个卷积模块内卷积层的通道数为64，卷积核尺寸为3，步长为1。第二个卷积模块内卷积层的通道数为128，卷积核尺寸为3，步长为1。卷积模块内最大池化层的核大小为2，步长为2。

DRS模块由卷积层、ReLU激活函数、全局平均池化层、全连接层、批标准化层、Sigmoid激活函数、最大池化层相组合构成。模块的主体是四个依次连接的通道数为128、核尺寸为3、步长为1的一维卷积层，每个卷积层后面都连接了ReLU激活函数。卷积层的在主体的不同阶段加入了两个分支。在一分支中加入了恒等映射；在另一分支中借助了注意力机制来自动实现了特征的软阈值化。它的主要功能是将绝对值小于某个阈值的特征消除为0，同时其它的特征也向着0进行调整，表示为：

式中，

代表了软阈值化后的第i个通道的第j个强度值；z_ij代表未经处理前第i个通道的第j个强度值；λ_i代表经过全局平均池化层后第i个强度值；w_i代表经过Sigmoid激活函数后的第i个强度值，它代表了的λ_i权重，λ_i与w_i的相乘代表了每一层通道所对应的阈值。

λ是经过取绝对值处理的全局平均池化层的一个输出。w是Sigmoid激活函数后的输出，它可以看做是每一层通道的重要性系数。z是第四个卷积层的输出。τ_i为第i个通道的阈值，用于消除冗余信息，它是λ和w的点乘结果的第i个值。

将软阈值化后的输出

与DRS模块的输入相加并经过核大小为2、步长为2的最大池化层得到DRS模块的输出。

将DRS模块的输出展开作为全连接层的输入，全连接模块依次由全连接层、批标准化层、ReLU激活函数、丢弃率为0.5的Dropout层连接构成。

步骤3，使用训练集训练基于Deep Residual Shrinkage-VGG的端到端深度学习的分类模型，使用验证集对模型的超参数进行调整，初步评估模型的性能。

1)按照一维数据尺寸设置输入层的输入大小为(1601,1)，使得数据依次经过分类模型的各层。

式中，W_i,j代表某个卷积层第i个卷积核的第j个权重；n_in代表权值张量中的输入单位的数量；W_i,j从

中的均匀分布中抽取数值。

式中，L为模型输入数据与输出数据的损失误差值总和；L_i为样本i的损失误差值；N为输入数据拉曼光谱总数；M为输入数据类别总数；y_ic为取值为0或1的符号函数，若样本i的真实类别等于c则取1，否则取0；p_ic为观测样本i属于类别c的预测概率。

4)将训练集中的样本作为输入，划分的batch_size为64，设置学习率为0.0001，训练基于Deep Residual Shrinkage-VGG的端到端深度学习的分类模型，使得损失函数收敛。

使用测试集对步骤3中保存的基于Deep Residual Shrinkage-VGG的端到端深度学习的分类模型的性能进行测试。

选择RRUFF数据库的Unrated_oriented和Unrated_unoriented子集中样本数从6到50的光谱样本，共计包含了343类矿物的5618个拉曼光谱样本。就数据集整体而言，类别数多，样本分布不均衡且大量标签样本数过少。就数据集样本个体而言，特征维度大，且数据未经预处理，富含噪声，强度范围广，基线漂移现象明显。

通过对选择的数据集的性能测试探究基于Deep Residual Shrinkage-VGG的端到端深度学习的分类模型在高噪声不标准、超多分类、小样本问题的突破之处。

本发明方法与应用于拉曼光谱数据分类的传统机器学习方法和在该领域所采用的深度学习模型进行了性能对比。

采用正确率、准确率、召回率、F1分数作为机器学习方法的评价指标。采用正确率、准确率、召回率、F1分数、早停时间、GFLOPs、可训练参数作为深度学习模型的评价指标。

采取的传统机器学习方法包括：支持向量机(SVM)、K近邻(KNN)、随机森林(RF)、逻辑斯蒂回归(LR)算法。

其中支持向量机算法选用线性核函数，惩罚系数C＝250。K近邻算法的k取1。在支持向量机和随机森林预测之前先将数据进行N＝100的主成分分析的降维。

选取应用于拉曼光谱识别的领域的LeNet-5、VGG-19、DeepSpectra、ResidualSpectra模型作为深度学习模型的对比代表。

为减少随机性对结果公平性的影响，将每组实验重复100次。

本发明方法与其他机器学习方法分类性能的评价结果如表1所示。

表1本发明方法与其它机器学习方法分类性能的评价结果

本方法与其他机器学习相比显现出了卓越的分类性能，各项评价指标都远优异于传统的机器学习方法。就平均正确率而言分别比各机器学习模型高35.52％，35.02％，21.18％，54.46％。巨大的性能差异说明传统的机器学习方法不适用于高噪声、不标准的拉曼光谱数据。传统的机器学习方法只能拟合经过去噪、基线校正、标准化等预处理手段处理后的拉曼光谱数据。

本发明方法与其它深度学习方法分类性能的评价结果如表2所示。早停时间代表了模型完成收敛所需要的训练时间，单位为秒。Floating point operations(FLOPs)为浮点运算数，可理解为计算量，1GFLOPs代表10亿次浮点运算。可训练参数的单位为百万。

表2本发明方法与其它深度学习方法分类性能的评价结果

深度学习模型为数据饥饿模型，训练集中单标签样本数目与样本总数影响着分类的结果，且模型结构与分类结果密切相关。本发明方法与其它深度学习方法分类性能的评价结果表明本方法对正样本的预测精确率较高，误分类现象不突出，可靠性高。

由表2可得，在本数据集的分类情景下，计算复杂度小的深度学习模型分类正确率低，由于模型深度较浅而无法从过多干扰中提取有效特征，对关键特征峰的识别模糊，导致召回率较低，意味着分类性能较差。

此外，本方法与VGG-19都表现出了在不标准数据集上提取良好特征的能力，两者都可以从复杂的光谱中分离干扰信息。但是由GFLOPs、可训练参数、早停时间的对比可得，VGG-19模型计算复杂度更大，所需训练时间更长。

通过模型结构对比和性能评价结果分析可证明Deep Residual Shrinkage-VGG的端到端深度学习的分类模型具有如下特点：

1)较深的网络结构能够无视特征之间的差异性，无需特征变量处于相同比较尺度，因此可以适用于未经数值标准化的数据。

2)在Deep Residual Shrinkage-VGG的DRS模块中，恒等映射可以无损地传播梯度，避免了由堆叠深层结构而引起的梯度异常的问题，特征复用加快了模型的学习速度。

3)自动生成参数的软阈值层嵌入于DRS模块中，弱化了不重要的特征，消除冗余信息而无需专业知识，使得部分特征的梯度为0，从而提取出具有更强的判断能力的深层特征，使得分类任务不受去噪等预处理的限制。

4)与现有技术相比，Deep Residual Shrinkage-VGG在拉曼光谱多分类任务上同时拥有了良好的精度与速度，计算并行度高，鲁棒性强。

本方法将拉曼光谱数据特点与深度学习网络结构相结合匹配，利用深度学习方法取代了传统的通过预处理的方案，实现了富含干扰信息的拉曼光谱数据的识别。

Claims

1.一种基于Deep Residual Shrinkage-VGG的端到端深度学习拉曼光谱数据分类方法，包括以下步骤：

2.根据权利要求1所述的基于Deep Residual Shrinkage-VGG的端到端深度学习的拉曼光谱数据分类方法，其特征在于，步骤1中，进行一阶样条插值处理，具体包括：

采用式(1)对拉曼光谱数据进行一阶样条插值处理，由指定波数值求得对应光谱强度值，使得每个拉曼光谱在指定波数范围内均匀采样：

3.根据权利要求1所述的基于Deep Residual Shrinkage-VGG的端到端深度学习的拉曼光谱数据分类方法，其特征在于，步骤1中，将超出原光谱波数范围的插值点补零，具体包括：

若给定插值区间大于原拉曼光谱数据的波数范围，在原拉曼光谱数据的波数范围内进行一阶样条插值后，在超出在原拉曼光谱数据的波数范围用数值0补齐范围外插值数据的强度值。

4.根据权利要求1所述的基于Deep Residual Shrinkage-VGG的端到端深度学习的拉曼光谱数据分类方法，其特征在于，步骤1中，将处理后的拉曼光谱数据随机打乱后划分成训练集、验证集和测试集，具体包括：

将随机打乱后的拉曼光谱数据的30％划分为测试集，在划分过程中将数据按原数据集中各标签的比例传递，使得样本分布相同；采取同样的划分策略，将剩下数据的80％划分为训练集，将剩下数据的20％划分为验证集。

5.根据权利要求1所述的基于Deep Residual Shrinkage-VGG的端到端深度学习的拉曼光谱数据分类方法，其特征在于，步骤2中，构建一个基于Deep Residual Shrinkage-VGG的端到端深度学习的分类模型，具体包括：

DRS模块由卷积层、ReLU激活函数、全局平均池化层、全连接层、批标准化层、Sigmoid激活函数、最大池化层相组合构成；DRS模块的主体是四个依次连接的卷积层，在主体的不同阶段加入了两个分支，在一分支中加入了恒等映射，在参数反向传播的过程中使得梯度可以更加有效地流回上层以减轻卷积神经网络的训练难度，在另一分支中借助了注意力机制来自动实现了特征的软阈值化，它的主要功能是将绝对值小于某个阈值的特征消除为0，同时其它的特征也向着0进行调整，表示为：

式中，

将DRS模块的输出展开作为全连接层的输入，全连接模块依次由全连接层、批标准化层、ReLU激活函数、丢弃率为0.5的Dropout层连接构成；

6.根据权利要求1所述的基于Deep Residual Shrinkage-VGG的端到端深度学习的拉曼光谱数据分类方法，其特征在于，步骤3中，使用训练集训练基于Deep ResidualShrinkage-VGG的端到端深度学习的分类模型，使用验证集对模型的超参数进行调整，初步评估模型的性能，具体包括：

3.1)按照一维数据尺寸设置输入层的输入大小，使得数据依次经过分类模型的各层；

3.2)使用he_uniform按照均匀分布赋值卷积层的权重，权重的初始化情况如下所示：

中的均匀分布中抽取数值；

3.3)使用Adam优化器对步骤2中构建的基于Deep Residual Shrinkage-VGG的端到端深度学习的分类模型进行训练，使用交叉熵损失函数，交叉熵损失函数表达式为：

3.4)将训练集中的样本作为输入，并划分为合适的多个批次batch_size，设置合适的学习率训练基于Deep Residual Shrinkage-VGG的端到端深度学习的分类模型，使得损失函数收敛；

3.5)使用验证集评估训练的基于Deep Residual Shrinkage-VGG的端到端深度学习的分类模型的误差和分类准确率，从而进行模型调参，保存最优的基于Deep ResidualShrinkage-VGG的端到端深度学习的分类模型。

7.根据权利要求1所述的基于Deep Residual Shrinkage-VGG的端到端深度学习的分类模型，其特征在于，步骤4中，使用测试集测试基于Deep Residual Shrinkage-VGG的端到端深度学习的分类模型性能，具体包括：