CN117909836A

CN117909836A - 一种适用于复杂体系中拉曼光谱识别的方法及系统

Info

Publication number: CN117909836A
Application number: CN202410167115.3A
Authority: CN
Inventors: 王昕�; 刘梓权; 范贤光
Original assignee: Xiamen University
Current assignee: Xiamen University
Priority date: 2024-02-06
Filing date: 2024-02-06
Publication date: 2024-04-19

Abstract

本发明公开了一种适用于复杂体系中拉曼光谱识别的方法及系统。所述方法包括：获取拉曼光谱数据集并对其进行预处理；将预处理后的拉曼光谱数据集输入基于改进卷积神经网络的识别模型中进行训练；将待识别拉曼光谱数据输入训练好的识别模型中进行识别；其中基于改进卷积神经网络的识别模型包括多流向特征提取与融合层，多流向特征提取与融合层包括四个模块，在每个模块中引入残差结构，每三个卷积层组成一个残差块；在模块输入端到输出端之间搭建一个跨越所有残差块的结构；在模块输入端与输出端特征融合方式上采用通道维数上的叠加。本发明可实现高准确率的拉曼光谱分类与组分鉴定，对提高拉曼光谱分析的效率以及准确率具有重大意义。

Description

一种适用于复杂体系中拉曼光谱识别的方法及系统

技术领域

本发明涉及机器学习技术领域，具体涉及一种适用于复杂体系中拉曼光谱识别的方法及系统。

背景技术

拉曼光谱是一种用拉曼散射原理来研究物质分子振动、旋转以及其它低频模式的光谱学方法，由于其无损、无标记的特点，拉曼光谱常被应用于识别样本中的化学组成成分和类别信息。

尽管拉曼光谱技术本身具有很大的优势，但常用于处理和分析拉曼光谱的方法却存在一些不可忽视的局限性和短板。一般而言，常规的处理和分析的方法对采集的每一条光谱都会经过去噪、背景扣除、特征峰选取以及强度测量或是峰面积计算等步骤。该类方法会存在一些比较明显的问题：首先就是步骤繁琐，每条光谱都需要进行上述步骤，若是光谱数据量较大，逐条处理与分析过于耗时，效率低下；其次就是预处理中去噪、背景扣除会不可避免地引入额外误差，这是因为不论是去噪还是背景扣除，其本质上都包括了数据拟合，而且对于去噪以及背景扣除的程度，一直都没有准确的定量方法，大都基于经验或是主观上的感受，无形中引入了额外的误差；此外，拉曼光谱的分析重点往往聚焦于特征峰，根据特征峰的峰强或是峰面积来判断光谱的属性，换句话说，该类分析方法仅考虑了特征峰信息，忽略了光谱的其他部分，虽然在某些情况下可取，但被忽略的部分可能也包含光谱的重要信息，尤其是物质含量低导致光谱特征峰不明显的时候，难以从特征峰判断光谱属性。

发明内容

鉴于以上问题，本发明提出一种适用于复杂体系中拉曼光谱识别的方法及系统，以力图解决或缓解上述一个或多个问题。

根据本发明的一方面，提出一种适用于复杂体系中拉曼光谱识别的方法，该方法包括以下步骤：

获取拉曼光谱数据集并对其进行预处理；

将预处理后的拉曼光谱数据集输入基于改进卷积神经网络的识别模型中进行训练，获取训练好的识别模型；

将待识别拉曼光谱数据输入训练好的识别模型中进行识别，获取光谱识别结果。

进一步地，所述基于改进卷积神经网络的识别模型包括卷积层、最大池化层、多流向特征提取与融合层、平均池化层和全连接层，其中，多流向特征提取与融合层包括四个模块，在每个模块中，引入残差结构，每三个卷积层组成一个残差块；在模块的输入端到输出端之间搭建一个跨越所有残差块的结构，即存在从输入端到输出端的直接相连；在模块的输入端与输出端特征融合的方式上，不采用残差架构中相同位置上特征数值相加的方式，而是进行通道维数上的叠加。

进一步地，所述多流向特征提取与融合层所包含的四个模块中，前三个模块的卷积层数和每层的通道数逐层递增，第四个模块保持通道数的增加，减少卷积层的数量。

进一步地，将预处理后的拉曼光谱数据集输入基于改进卷积神经网络的识别模型中进行训练的过程包括：预处理后的拉曼光谱数据经过一个卷积层、最大池化层，然后经过多流向特征提取与融合层，随后经过一个平均池化层，并通过全连接层输出；若光谱识别结果为光谱组分识别，则将每一个输出进行Sigmoid操作，将值缩放至0到1之间，如果值大于等于0.5，则判定对应位置上的组分存在，如果小于0.5，则判定为不存在；若光谱识别结果为光谱分类识别，则将输出的个数设定为光谱类别总数，将输出最大值对应位置的类别判定为光谱的类别。

进一步地，所述预处理后的拉曼光谱数据集中的数据为归一化后的光谱强度。

根据本发明的另一方面，提出一种适用于复杂体系中拉曼光谱识别的系统，该系统包括：

数据获取模块，其配置成获取拉曼光谱数据集并对其进行预处理；

模型训练模块，其配置成将预处理后的拉曼光谱数据集输入基于改进卷积神经网络的识别模型中进行训练，获取训练好的识别模型；

光谱识别模块，其配置成将待识别拉曼光谱数据输入训练好的识别模型中进行识别，获取光谱识别结果。

进一步地，所述模型训练模块中所述基于改进卷积神经网络的识别模型包括卷积层、最大池化层、多流向特征提取与融合层、平均池化层和全连接层，其中，多流向特征提取与融合层包括四个模块，在每个模块中，引入残差结构，每三个卷积层组成一个残差块；在模块的输入端到输出端之间搭建一个跨越所有残差块的结构，即存在从输入端到输出端的直接相连；在模块的输入端与输出端特征融合的方式上，不采用残差架构中相同位置上特征数值相加的方式，而是进行通道维数上的叠加。

进一步地，所述模型训练模块中所述多流向特征提取与融合层所包含的四个模块中，前三个模块的卷积层数和每层的通道数逐层递增，第四个模块保持通道数的增加，减少卷积层的数量。

进一步地，所述模型训练模块中将预处理后的拉曼光谱数据集输入基于改进卷积神经网络的识别模型中进行训练的过程包括：预处理后的拉曼光谱数据经过一个卷积层、最大池化层，然后经过多流向特征提取与融合层，随后经过一个平均池化层，并通过全连接层输出；若光谱识别结果为光谱组分识别，则将每一个输出进行Sigmoid操作，将值缩放至0到1之间，如果值大于等于0.5，则判定对应位置上的组分存在，如果小于0.5，则判定为不存在；若光谱识别结果为光谱分类识别，则将输出的个数设定为光谱类别总数，将输出最大值对应位置的类别判定为光谱的类别。

进一步地，所述数据获取模块中预处理后的拉曼光谱数据为归一化后的光谱强度。

本发明的有益技术效果是：

本发明提出一种适用于复杂体系中拉曼光谱识别的方法及系统，首先，获取拉曼光谱数据集并对其进行预处理；然后，将预处理后的拉曼光谱数据集输入基于改进卷积神经网络的识别模型中进行训练，获取训练好的识别模型；最后，将待识别拉曼光谱数据输入训练好的识别模型中进行识别，获取光谱识别结果。其中，基于改进卷积神经网络的识别模型包括多流向特征提取与融合层，多流向特征提取与融合层包括四个模块，在每个模块中，引入残差结构，每三个卷积层组成一个残差块；在模块的输入端到输出端之间搭建一个跨越所有残差块的结构，即存在从输入端到输出端的直接相连；在模块的输入端与输出端特征融合的方式上，不采用残差架构中相同位置上特征数值相加的方式，而是进行通道维数上的叠加。

本发明可实现高准确率的拉曼光谱分类与组分鉴定，以卷积神经网络为基础，结合残差结构设计了多流向特征提取与融合模块，无需显示地特征提取，深层网络通过训练与迭代能自动更新参数以此学习到数据的特征。这对提高拉曼光谱分析的效率以及准确率具有重大的意义。

本发明使得对于拉曼光谱识别，既不需要去噪和基线校正，也不需要进行特征峰选取和强度测量亦或是峰面积计算，仅需将采集到的光谱强度缩放至0到1的区间，随后将数据输入到本发明提出的识别模型中，即可输出光谱的类别或是组分信息。不仅避免了引入误差，也消除了繁琐的步骤。

附图说明

本发明可以通过参考下文中结合附图所给出的描述而得到更好的理解，所述附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分，而且用来进一步举例说明本发明的优选实施例和解释本发明的原理和优点。

图1为本发明实施例所述的一种适用于复杂体系中拉曼光谱识别的方法的流程图。

图2为本发明实施例中拉曼仪器采集到的光谱数据示例。

图3为本发明实施例中拉曼光谱数据进入改进的识别模型的处理流程图。

图4为本发明实施例中改进的识别模型M.1模块至M.4模块的具体结构图。

图5为本发明实施例中改进的识别模型中M.1模块与常规卷积的结构示意图。

图6为本发明实施例中残差模块与常规卷积的结构示意图。

图7为本发明实施例中对比实验四种网络基本结构示意图。

图8为本发明实施例中对比实验四种网络准确率变化曲线图。

图9为本发明实施例中对比实验四种网络模型的混淆矩阵。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，在下文中将结合附图对本发明的示范性实施方式或实施例进行描述。显然，所描述的实施方式或实施例仅仅是本发明一部分的实施方式或实施例，而不是全部的。基于本发明中的实施方式或实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式或实施例，都应当属于本发明保护的范围。

本发明的目的在于设计一种不需要去噪和基线校正，也不需要进行特征峰选取和强度测量亦或是峰面积计算的拉曼光谱识别方法，仅需将采集到的光谱强度缩放至0到1的区间，随后将数据输入到本发明提出的模型中，即可输出光谱的类别或是组分信息。这样既避免了引入误差，也消除了繁琐的步骤。

本发明实施例提出一种适用于复杂体系中拉曼光谱识别的方法，如图1所示，该方法包括以下步骤：

步骤一、获取拉曼光谱数据集并对其进行预处理；

步骤二、将预处理后的拉曼光谱数据集输入基于改进卷积神经网络的识别模型中进行训练，获取训练好的识别模型；

步骤三、将待识别拉曼光谱数据输入训练好的识别模型中进行识别，获取光谱识别结果。

方法始于步骤一。首先，在步骤一中，获取拉曼光谱数据集并对其进行预处理。

根据本发明实施例，拉曼仪器采集到的光谱数据为csv或者.txt类型数据，第一列为拉曼位移，第二列为强度，如图2所示。将强度数据进行归一化处理，获取归一化后的强度值，即将值缩放至0～1之间后的第二列数据。

然后，在步骤二中，将预处理后的拉曼光谱数据集输入基于改进卷积神经网络的识别模型中进行训练，获取训练好的识别模型。

根据本发明实施例，本发明中识别模型是以卷积神经网络为基础的结合深度残差结构的一维多流向特征提取与融合的识别模型。图3是拉曼光谱数据进入本发明提出的识别模型的的处理流程图。输入是归一化的光谱强度，随后经过一个卷积层，最大池化层，在经过M.1至M.4模块，随后经过一个平均池化层，最后经过全连接层输出。若用来进行组分识别，则将输出的个数设定为组分总数，再将每一个输出进行Sigmoid操作，将值缩放至0到1之间，如果值大于等于0.5，则判定对应位置上的组分存在，如果小于0.5，则判定为不存在。若用来进行光谱分类，则将输出的个数设定为光谱类别总数，将输出最大值对应位置的类别判定为光谱的类别。图中的Conv代表卷积层，MP代表最大池化层，AP代表平均池化层，FC代表全连接层，图中每一模块下的数字代表数据经过该模块后的输出尺寸，以64@512@1为例，64代表输出的卷积层为64，512代表输出长度为512，1代表1维。

本实施例中，重点设计了多流向特征提取与融合层，其包括四个模块，即M.1到M.4模块，具体结构见图4。随着网络层数的加深，每一层的卷积核数也在增加，同时特征尺寸减小。这四个模块的整体结构类似，从M.1到M.3模块的卷积层数和每层的通道数逐级递增，以更全面地提取输入数据的深层特征信息。图3中提供了详细的结构细节。M.1模块至M.3模块的卷积层逐渐增加，这旨在从输入数据中更全面地提取深层特征信息。而在模块M.4中减少了卷积层的数量，同时仍然保持每层通道数的增加，这种对偶性有助于进一步提取深层特征，同时降低模型的复杂性。此外，这些模块的输出长度从512减半到64，符合特征提取模式，并减少了参数量。

本实施例中，对于M.1至M.4模块的结构，本发明基于常规的卷积神经网络结构做出了多处改进。以M.1为例，图5给出了常规卷积神经网络(CNN)与M.1的区别。

首先，借鉴残差网络引入了残差结构，传统网络与残差网络的示意图见附图6，附图6中的A代表传统的卷积神经网络架构，其中输入x经过weight layer(卷积层)和激活层以产生H(x)。残差网络引入了结构调整。传统的神经网络可以理解为需要学习从x到F(x)的映射，B代表残差网络架构，B在输入和输出之间添加了恒等映射。因此，如果将最终激活层之前A的输出表示为H(x)并假设H(x)＝F(x)+x，则由于x是恒等映射，因此残差网络需要训练的部分变为H(x)-x。这意味着网络不是近似从输入到输出的映射，而是近似输出和输入之间的差异。通过采用这种跳跃连接的方法，残差网络避免了深度神经网络带来的一系列问题。在本实施例所提出的模型中，每三个卷积层组成一个残差块，也就是附图5中标1处，(其中卷积层的作用是为了匹配输入输出的尺寸和通道数，)网络不需要拟合从输入到输出的映射，而是拟合输出与输入之间的差值，改善了模型层数高时梯度消失或梯度爆炸的问题，从而优化模型。

其次，在模块的输入端到输出端之间搭建了一个跨越所有残差块的结构，也就是存在从输入端到输出端的直接相连，即附图5图中标2处。通过跨越多层残差块，起始端特征能够与末端特征进行融合，并且使得低层重要的特征信息尽可能多地保留到末端，而不被中间多层的卷积逐级削减，这种方法使网络能够从低层的特征图中获得更有意义、更精细的信息。与残差结构共同实现了多流向的特征提取与融合。

最后，在模块的输入端与输出端特征融合的方式上不采用残差架构中相同位置上特征数值相加的方式，而是进行通道维数上的叠加，即附图5中标3处。通过对通道数维度上的叠加，使得网络学习到的特征能够更加完整地被保留。

基于以上多处改进构建了深度多流向特征提取与融合模块，并将其作为网络的主干部分，从而形成了基于改进卷积神经网络的识别模型。

将预处理后的拉曼光谱数据集即归一化后的光谱强度输入基于改进卷积神经网络的识别模型中进行训练，获取训练好的识别模型。

最后，在步骤三中，将待识别拉曼光谱数据输入训练好的识别模型中进行识别，获取光谱识别结果。

进一步通过对比实验验证本发明的技术效果。

本发明方法是基于深度卷积神经网络改进而来，在此基础上增加了残差结构和多流向特征提取与融合结构，因此搭建了这三个依次改进的模型：分别是深度卷积神经网络CNN，深度残差卷积神经网络Res-CNN，特征融合方式为相加的多流向深度残差卷积神经网络FA-Res-CNN，其基本结构上的区别如图7，其中图7(a)是CNN，图7(b)是Res-CNN，图7(c)是FA-Res-CNN，图7(d)是DR-MFEF Net。将其应用到翡翠的拉曼光谱分类种，实验收集了三种翡翠的拉曼光谱：冰种翡翠、玻璃种翡翠和高冰种翡翠，每种翡翠包含1000个数据点。获取三类弧菌SERS光谱数据后，对每条光谱进行标准化处理，也就是将强度值缩放至0到1之间。随后按照4：1的比例将数据划分为训练集和测试集，具体来说，将每类翡翠数据随机打乱顺序，从中抽取750个作为训练集，剩下的250个作为测试集。共三类，即训练集一共有2250个数据，测试集一共有750个数据。这样划分保证了训练集和测试集内部的三种数据分布保持平衡，不会出现某类数据特别多而其它类数据特别少的情况。四个模型均训练了120轮。

这四个模型按照与DR-MFEF Net同样的条件都训练了120轮并记录结果。图8是各模型在测试集上准确率随训练轮数变化的曲线。同时保存了各模型在训练过程中最好的结果并绘制了测试集上的混淆矩阵，如图9所示。

四种方法的准确率分别是86.00％，91.60％，93.47％和96.27％，网络性能随着每一次改进都取得了一定程度上的提升。因此本发明方法中采取的多处改进能够提升模型的性能。

本发明另一实施例提出一种适用于复杂体系中拉曼光谱识别的系统，该系统包括：

本实施例中，优选地，所述模型训练模块中所述基于改进卷积神经网络的识别模型包括卷积层、最大池化层、多流向特征提取与融合层、平均池化层和全连接层，其中，多流向特征提取与融合层包括四个模块，在每个模块中，引入残差结构，每三个卷积层组成一个残差块；在模块的输入端到输出端之间搭建一个跨越所有残差块的结构，即存在从输入端到输出端的直接相连；在模块的输入端与输出端特征融合的方式上，不采用残差架构中相同位置上特征数值相加的方式，而是进行通道维数上的叠加。

本实施例中，优选地，所述模型训练模块中所述多流向特征提取与融合层所包含的四个模块中，前三个模块的卷积层数和每层的通道数逐层递增，第四个模块保持通道数的增加，减少卷积层的数量。

本实施例中，优选地，所述模型训练模块中将预处理后的拉曼光谱数据集输入基于改进卷积神经网络的识别模型中进行训练的过程包括：预处理后的拉曼光谱数据经过一个卷积层、最大池化层，然后经过多流向特征提取与融合层，随后经过一个平均池化层，并通过全连接层输出；若光谱识别结果为光谱组分识别，则将每一个输出进行Sigmoid操作，将值缩放至0到1之间，如果值大于等于0.5，则判定对应位置上的组分存在，如果小于0.5，则判定为不存在；若光谱识别结果为光谱分类识别，则将输出的个数设定为光谱类别总数，将输出最大值对应位置的类别判定为光谱的类别。

本实施例中，优选地，所述数据获取模块中预处理后的拉曼光谱数据为归一化后的光谱强度。

本发明实施例一种适用于复杂体系中拉曼光谱识别的系统的功能可以由前述一种适用于复杂体系中拉曼光谱识别的方法说明，因此系统实施例未详述部分，可参见以上方法实施例，在此不再赘述。

尽管根据有限数量的实施例描述了本发明，但是受益于上面的描述，本技术领域内的技术人员明白，在由此描述的本发明的范围内，可以设想其它实施例。对于本发明的范围，对本发明所做的公开是说明性的，而非限制性的，本发明的范围由所附权利要求书限定。

Claims

1.一种适用于复杂体系中拉曼光谱识别的方法，其特征在于，包括以下步骤：

获取拉曼光谱数据集并对其进行预处理；

2.根据权利要求1所述的一种适用于复杂体系中拉曼光谱识别的方法，其特征在于，所述基于改进卷积神经网络的识别模型包括卷积层、最大池化层、多流向特征提取与融合层、平均池化层和全连接层，其中，多流向特征提取与融合层包括四个模块，在每个模块中，引入残差结构，每三个卷积层组成一个残差块；在模块的输入端到输出端之间搭建一个跨越所有残差块的结构，即存在从输入端到输出端的直接相连；在模块的输入端与输出端特征融合的方式上，不采用残差架构中相同位置上特征数值相加的方式，而是进行通道维数上的叠加。

3.根据权利要求2所述的一种适用于复杂体系中拉曼光谱识别的方法，其特征在于，所述多流向特征提取与融合层所包含的四个模块中，前三个模块的卷积层数和每层的通道数逐层递增，第四个模块保持通道数的增加，减少卷积层的数量。

4.根据权利要求3所述的一种适用于复杂体系中拉曼光谱识别的方法，其特征在于，将预处理后的拉曼光谱数据集输入基于改进卷积神经网络的识别模型中进行训练的过程包括：预处理后的拉曼光谱数据经过一个卷积层、最大池化层，然后经过多流向特征提取与融合层，随后经过一个平均池化层，并通过全连接层输出；若光谱识别结果为光谱组分识别，则将每一个输出进行Sigmoid操作，将值缩放至0到1之间，如果值大于等于0.5，则判定对应位置上的组分存在，如果小于0.5，则判定为不存在；若光谱识别结果为光谱分类识别，则将输出的个数设定为光谱类别总数，将输出最大值对应位置的类别判定为光谱的类别。

5.根据权利要求1所述的一种适用于复杂体系中拉曼光谱识别的方法，其特征在于，所述预处理后的拉曼光谱数据集中的数据为归一化后的光谱强度。

6.一种适用于复杂体系中拉曼光谱识别的系统，其特征在于，包括：

7.根据权利要求6所述的一种适用于复杂体系中拉曼光谱识别的系统，其特征在于，所述模型训练模块中所述基于改进卷积神经网络的识别模型包括卷积层、最大池化层、多流向特征提取与融合层、平均池化层和全连接层，其中，多流向特征提取与融合层包括四个模块，在每个模块中，引入残差结构，每三个卷积层组成一个残差块；在模块的输入端到输出端之间搭建一个跨越所有残差块的结构，即存在从输入端到输出端的直接相连；在模块的输入端与输出端特征融合的方式上，不采用残差架构中相同位置上特征数值相加的方式，而是进行通道维数上的叠加。

8.根据权利要求7所述的一种适用于复杂体系中拉曼光谱识别的系统，其特征在于，所述模型训练模块中所述多流向特征提取与融合层所包含的四个模块中，前三个模块的卷积层数和每层的通道数逐层递增，第四个模块保持通道数的增加，减少卷积层的数量。

9.根据权利要求8所述的一种适用于复杂体系中拉曼光谱识别的系统，其特征在于，所述模型训练模块中将预处理后的拉曼光谱数据集输入基于改进卷积神经网络的识别模型中进行训练的过程包括：预处理后的拉曼光谱数据经过一个卷积层、最大池化层，然后经过多流向特征提取与融合层，随后经过一个平均池化层，并通过全连接层输出；若光谱识别结果为光谱组分识别，则将每一个输出进行Sigmoid操作，将值缩放至0到1之间，如果值大于等于0.5，则判定对应位置上的组分存在，如果小于0.5，则判定为不存在；若光谱识别结果为光谱分类识别，则将输出的个数设定为光谱类别总数，将输出最大值对应位置的类别判定为光谱的类别。

10.根据权利要求6所述的一种适用于复杂体系中拉曼光谱识别的系统，其特征在于，所述数据获取模块中预处理后的拉曼光谱数据为归一化后的光谱强度。