CN110245713A

CN110245713A - 一种食源性致病菌分类方法

Info

Publication number: CN110245713A
Application number: CN201910534517.1A
Authority: CN
Inventors: 吴承炜; 夏钒曾; 曾万聃; 夏志平; 史如晋; 曲晗; 李乾学
Original assignee: Shanghai Institute of Technology
Current assignee: Shanghai Institute of Technology
Priority date: 2019-06-19
Filing date: 2019-06-19
Publication date: 2019-09-17

Abstract

本发明公开了一种食源性致病菌分类方法，包括：卷积神经网络的搭建以及用于模型评估的k折交叉验证。本发明使用基于卷积神经网络的方法，通过对卷积神经网络的结构配置及优化提高了食源性致病菌光谱分类的准确率。本发明主要解决的技术问题是通过对卷积神经网络建模实现食源性致病菌光谱数据分类的自动化，给食品安全从业者提供参考，提高食品安全检测的效率。

Description

一种食源性致病菌分类方法

技术领域

本发明涉及拉曼光谱、食源性致病菌、卷积神经网络和机器学习等领域。

背景技术

到目前为止，我国食品中致病菌检测最常用的方法还是按照生物化学、微生物学理论上所建立的微生物传统检测法。最主要的有生化鉴定、肉眼形态观察、微生物分离培养以及血清学分型等鉴定方式。

这些方法操作繁琐，周期长，不能有效地起到监测、预防作用。如多重PCR检测体系，基于FTA滤膜的基因芯片检测等技术，分类的准确率并不高，识别的种类数也较少。而且相对于传统的机器学习算法，人工提取特征成本较高，往往还会存在一定的局限性。

发明内容

本发明提供一种食源性致病菌分类方法，能够解决现有的方法操作繁琐，周期长，不能有效地起到监测、预防作用、成本高的问题。

本发明提供一种食源性致病菌分类方法，所述方法包括：

S1：在Origin软件中使用Savitzky-Golay滤波器和非对称最小二乘对原始大肠杆菌O₁₅₇：H₇、布鲁氏菌S2株致病菌光谱预处理去除荧光背景，得到致病菌的光谱；

S2：在Origin软件中将去除荧光背景的光谱截断为偏移600至2000的区间内，以绘制光谱图片；

S3：构建多层卷积神经网络，所述多层卷积神经网络包括卷积层、池化层和Iception卷积模块；对所述光谱图片进行卷积后再进行BatchNormalizaton，再通过非线性激活函数，将局部的不变特性传递给深层网络；

S4：取k＝5进行交叉验证，重复5次将原始数据随机打乱后按7∶3划分训练集、测试集，分别将5组训练集用S3中的多层卷积神经网络训练得到5组不同的测试结果，最后取其平均值，获得总体性能指标。

进一步的，上述方法中，所述多层卷积神经网络为具有42个卷积层的GoogLeNet的网络结构。

进一步的，上述方法中，所述Iception卷积模块使用非对称的卷积核。

进一步的，上述方法中，对所述光谱图片进行卷积，包括：

在进行第二层卷积时，对输入的特征图进行ZeroPadding。

进一步的，上述方法中，所述池化层为最大值池化，通过选取最大值对输入的特征图进行压缩，使特征图变小，只保留大于预设阈值的最显著的特征。

本发明包括：卷积神经网络的搭建以及用于模型评估的k折交叉验证。本发明使用基于卷积神经网络的方法，通过对卷积神经网络的结构配置及优化提高了食源性致病菌光谱分类的准确率。本发明主要解决的技术问题是通过对卷积神经网络建模实现食源性致病菌光谱数据分类的自动化，给食品安全从业者提供参考，提高食品安全检测的效率。

本发明针对食源性致病菌检测周期长，分类准确率低等现象，提出了一种基于卷积神经网络的食源性致病菌分类方法，能缓解目前人工识峰出现的误判问题；比起传统的神经网络，卷积神经网络具有参数共享，稀疏链接的优势，能用更少的参数训练出更高的准确率。其中GoogLeNet网络比起先前的LeNet，AlexNet及VGG网络，具有更深的网络结构，并用全局平均池化层取代了最后的全连接层，拥有更少的网络参数，并具有更强的抽取特征的能力。

说明书附图

图1为本发明一实施例的的工作流程示意图；

图2为本发明一实施例的预处理前的致病菌拉曼光谱图；

图3为本发明一实施例的预处理后的致病菌拉曼光谱图；

图4、图5、图6为本发明一实施例的InceptionV3的3种卷积模块图；

图7为本发明一实施例的代价函数图；

图8为本发明一实施例的学习曲线图。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明，但不以任何形式限制本发明。应当指出的是，对本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变化和改进。这些都属于本发明的保护范围。

图1为本发明采用的卷积神经网络分类方法，如图1所示，本实施例中的方法包括：

S1、光谱预处理：在Origin软件中使用Savitzky-Golay滤波器和非对称最小二乘对原始大肠杆菌O₁₅₇：H₇、布鲁氏菌S2株致病菌光谱预处理去除荧光背景，得到致病菌的光谱；

S2、生成光谱图片：在Oringin软件中将所述致病菌的光谱截断为偏移600至2000之间的区间内，以绘制光谱图片；

S3、模型搭建：构建多层卷积神经网络，这里可以按照表1构造选用具有42个卷积层的GoogLeNet的网络结构，包括卷积层、池化层和Iception卷积模块；所述光谱图片在经过卷积后紧接着进行Batch Normalization，调整经过卷积后的数据分布，缓解梯度弥散和梯度消失，使梯度能有效的反向传导。再通过非线性激活函数，将局部的不变特性传递给深层网络。

在进行第二层卷积时，对输入的特征图进行ZeroPadding，使输出的尺寸与输入的尺寸一致。

池化层为最大值池化，通过选取最大值对输入的特征图进行压缩，使特征图变小，只保留大于预设阈值的最显著的特征，简化网络。

Iception卷积模块使用了尺寸更小的非对称的卷积核，其中两个3x3卷积核的感受野跟一个5x5卷积核的感受野相当，而三个3x3卷积核的感受野则与一个7x7卷积核的感受野相当，通过减小卷积核大小而增加层数能减少整个模型的参数量，1x1卷积核这个操作实现的是多个特征映射的线性组合，可以实现特征映射在通道个数上的变化，还有一个重要的功能，就是可以在保持特征映射尺寸不变，不损失分辨率的前提下大幅增加非线性特性，可以把网络做得很深。

对于Iception卷积模块中最后的拼接层，须要保证进行拼接的每个输入具有同样的尺寸，再各个分支中采取适当的ZeroPadding即可。早先的LeNet，AlexNet，VGG网络在最后用的是的全连接层，而这两层全连接层却占了网络近一半的参数，GoogLeNet最后的全局平均池化层将输入的矩阵数组结构展开成线性结构，再进行最后的决策分类。

每一层激活函数均为ReLU(整流线性单元)：

ReLU：y＝max(x，0)

其中x为输入张量，y为输出张量。

优化算法为SGD(随机梯度下降)：

其中n为迭代轮数，w为权重，b为偏置，α为学习率。

优化目标为交叉熵：

L(x)＝--y*log(y′)-(1-y)*log(1-y′)

其中y为真实类别，y′为预测类别，如图7所示，当预测值与真实值不相匹配时代价为+∞

S4、模型评估：取k＝5进行交叉验证，重复5次将原始数据随机打乱后按7∶3划分训练集、测试集，分别将5组训练集用S3中模型训练得到5组不同的测试结果，最后取其平均值，获得总体性能指标。

图1为本发明一实施例的工作流程示意图；图2为一实施例的预处理前的致病菌拉曼光谱图；图3为一实施例的预处理后的致病菌拉曼光谱图；图4、图5、图6为一实施例的InceptionV3的3种卷积模块图；图7为一实施例的代价函数图；图8为一实施例的学习曲线图。

表1为GoogLeNet的网络结构：

网络层类型	卷积核尺寸/步长(备注)	输入尺寸
			Conv	3x3/2	384x384x1
Conv	3x3/1	191x191x32
			Conv padded	3x3/1	189x189x64
MaxPooling	3x3/2	189x189x64
			Conv	3x3/1	94x94x64
Conv	3x3/2	92x92x128
			Conv	3x3/1	45x45x128
3xInception	图4	45x45x256
			5xInception	图5	23x23x512
2xInception	图6	11x11x1024
			MaxAvgPooling	11x11/1	11x11x2048
Linear	Logits	1x1x2048
			Sigmoid	分类器	1x1x1

综上所述，本发明包括：卷积神经网络的搭建以及用于模型评估的k折交叉验证。本发明使用基于卷积神经网络的方法，通过对卷积神经网络的结构配置及优化提高了食源性致病菌光谱分类的准确率。本发明主要解决的技术问题是通过对卷积神经网络建模实现食源性致病菌光谱数据分类的自动化，给食品安全从业者提供参考，提高食品安全检测的效率。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

显然，本领域的技术人员可以对发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包括这些改动和变型在内。

Claims

1.一种食源性致病菌分类方法，其特征在于，包括以下步骤：

S1：在Origin软件中使用Savitzky-Golay滤波器和非对称最小二乘对原始大肠杆菌O₁₅₇∶H₇、布鲁氏菌S2株致病菌光谱预处理去除荧光背景，得到致病菌的光谱；

2.如权利要求1所述的食源性致病菌分类方法，其特征在于，所述多层卷积神经网络为具有42个卷积层的GoogLeNet的网络结构。

3.如权利要求1所述的食源性致病菌分类方法，其特征在于，所述Iception卷积模块使用非对称的卷积核。

4.如权利要求1所述的食源性致病菌分类方法，其特征在于，对所述光谱图片进行卷积中，

在进行第二层卷积时，对输入的特征图进行ZeroPadding。

5.如权利要求1所述的食源性致病菌分类方法，其特征在于，所述池化层为最大值池化，通过选取最大值对输入的特征图进行压缩，使特征图变小，只保留大于预设阈值的最显著的特征。