CN110245713A - 一种食源性致病菌分类方法 - Google Patents

一种食源性致病菌分类方法 Download PDF

Info

Publication number
CN110245713A
CN110245713A CN201910534517.1A CN201910534517A CN110245713A CN 110245713 A CN110245713 A CN 110245713A CN 201910534517 A CN201910534517 A CN 201910534517A CN 110245713 A CN110245713 A CN 110245713A
Authority
CN
China
Prior art keywords
food
neural networks
convolutional neural
borne pathogens
classification method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910534517.1A
Other languages
English (en)
Inventor
吴承炜
夏钒曾
曾万聃
夏志平
史如晋
曲晗
李乾学
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Institute of Technology
Original Assignee
Shanghai Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Institute of Technology filed Critical Shanghai Institute of Technology
Priority to CN201910534517.1A priority Critical patent/CN110245713A/zh
Publication of CN110245713A publication Critical patent/CN110245713A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/695Preprocessing, e.g. image segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/698Matching; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Abstract

本发明公开了一种食源性致病菌分类方法,包括:卷积神经网络的搭建以及用于模型评估的k折交叉验证。本发明使用基于卷积神经网络的方法,通过对卷积神经网络的结构配置及优化提高了食源性致病菌光谱分类的准确率。本发明主要解决的技术问题是通过对卷积神经网络建模实现食源性致病菌光谱数据分类的自动化,给食品安全从业者提供参考,提高食品安全检测的效率。

Description

一种食源性致病菌分类方法
技术领域
本发明涉及拉曼光谱、食源性致病菌、卷积神经网络和机器学习等领域。
背景技术
到目前为止,我国食品中致病菌检测最常用的方法还是按照生物化学、微生物学理论上所建立的微生物传统检测法。最主要的有生化鉴定、肉眼形态观察、微生物分离培养以及血清学分型等鉴定方式。
这些方法操作繁琐,周期长,不能有效地起到监测、预防作用。如多重PCR检测体系,基于FTA滤膜的基因芯片检测等技术,分类的准确率并不高,识别的种类数也较少。而且相对于传统的机器学习算法,人工提取特征成本较高,往往还会存在一定的局限性。
发明内容
本发明提供一种食源性致病菌分类方法,能够解决现有的方法操作繁琐,周期长,不能有效地起到监测、预防作用、成本高的问题。
本发明提供一种食源性致病菌分类方法,所述方法包括:
S1:在Origin软件中使用Savitzky-Golay滤波器和非对称最小二乘对原始大肠杆菌O157:H7、布鲁氏菌S2株致病菌光谱预处理去除荧光背景,得到致病菌的光谱;
S2:在Origin软件中将去除荧光背景的光谱截断为偏移600至2000的区间内,以绘制光谱图片;
S3:构建多层卷积神经网络,所述多层卷积神经网络包括卷积层、池化层和Iception卷积模块;对所述光谱图片进行卷积后再进行BatchNormalizaton,再通过非线性激活函数,将局部的不变特性传递给深层网络;
S4:取k=5进行交叉验证,重复5次将原始数据随机打乱后按7∶3划分训练集、测试集,分别将5组训练集用S3中的多层卷积神经网络训练得到5组不同的测试结果,最后取其平均值,获得总体性能指标。
进一步的,上述方法中,所述多层卷积神经网络为具有42个卷积层的GoogLeNet的网络结构。
进一步的,上述方法中,所述Iception卷积模块使用非对称的卷积核。
进一步的,上述方法中,对所述光谱图片进行卷积,包括:
在进行第二层卷积时,对输入的特征图进行ZeroPadding。
进一步的,上述方法中,所述池化层为最大值池化,通过选取最大值对输入的特征图进行压缩,使特征图变小,只保留大于预设阈值的最显著的特征。
本发明包括:卷积神经网络的搭建以及用于模型评估的k折交叉验证。本发明使用基于卷积神经网络的方法,通过对卷积神经网络的结构配置及优化提高了食源性致病菌光谱分类的准确率。本发明主要解决的技术问题是通过对卷积神经网络建模实现食源性致病菌光谱数据分类的自动化,给食品安全从业者提供参考,提高食品安全检测的效率。
本发明针对食源性致病菌检测周期长,分类准确率低等现象,提出了一种基于卷积神经网络的食源性致病菌分类方法,能缓解目前人工识峰出现的误判问题;比起传统的神经网络,卷积神经网络具有参数共享,稀疏链接的优势,能用更少的参数训练出更高的准确率。其中GoogLeNet网络比起先前的LeNet,AlexNet及VGG网络,具有更深的网络结构,并用全局平均池化层取代了最后的全连接层,拥有更少的网络参数,并具有更强的抽取特征的能力。
说明书附图
图1为本发明一实施例的的工作流程示意图;
图2为本发明一实施例的预处理前的致病菌拉曼光谱图;
图3为本发明一实施例的预处理后的致病菌拉曼光谱图;
图4、图5、图6为本发明一实施例的InceptionV3的3种卷积模块图;
图7为本发明一实施例的代价函数图;
图8为本发明一实施例的学习曲线图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
图1为本发明采用的卷积神经网络分类方法,如图1所示,本实施例中的方法包括:
S1、光谱预处理:在Origin软件中使用Savitzky-Golay滤波器和非对称最小二乘对原始大肠杆菌O157:H7、布鲁氏菌S2株致病菌光谱预处理去除荧光背景,得到致病菌的光谱;
S2、生成光谱图片:在Oringin软件中将所述致病菌的光谱截断为偏移600至2000之间的区间内,以绘制光谱图片;
S3、模型搭建:构建多层卷积神经网络,这里可以按照表1构造选用具有42个卷积层的GoogLeNet的网络结构,包括卷积层、池化层和Iception卷积模块;所述光谱图片在经过卷积后紧接着进行Batch Normalization,调整经过卷积后的数据分布,缓解梯度弥散和梯度消失,使梯度能有效的反向传导。再通过非线性激活函数,将局部的不变特性传递给深层网络。
在进行第二层卷积时,对输入的特征图进行ZeroPadding,使输出的尺寸与输入的尺寸一致。
池化层为最大值池化,通过选取最大值对输入的特征图进行压缩,使特征图变小,只保留大于预设阈值的最显著的特征,简化网络。
Iception卷积模块使用了尺寸更小的非对称的卷积核,其中两个3x3卷积核的感受野跟一个5x5卷积核的感受野相当,而三个3x3卷积核的感受野则与一个7x7卷积核的感受野相当,通过减小卷积核大小而增加层数能减少整个模型的参数量,1x1卷积核这个操作实现的是多个特征映射的线性组合,可以实现特征映射在通道个数上的变化,还有一个重要的功能,就是可以在保持特征映射尺寸不变,不损失分辨率的前提下大幅增加非线性特性,可以把网络做得很深。
对于Iception卷积模块中最后的拼接层,须要保证进行拼接的每个输入具有同样的尺寸,再各个分支中采取适当的ZeroPadding即可。早先的LeNet,AlexNet,VGG网络在最后用的是的全连接层,而这两层全连接层却占了网络近一半的参数,GoogLeNet最后的全局平均池化层将输入的矩阵数组结构展开成线性结构,再进行最后的决策分类。
每一层激活函数均为ReLU(整流线性单元):
ReLU:y=max(x,0)
其中x为输入张量,y为输出张量。
优化算法为SGD(随机梯度下降):
其中n为迭代轮数,w为权重,b为偏置,α为学习率。
优化目标为交叉熵:
L(x)=--y*log(y′)-(1-y)*log(1-y′)
其中y为真实类别,y′为预测类别,如图7所示,当预测值与真实值不相匹配时代价为+∞
S4、模型评估:取k=5进行交叉验证,重复5次将原始数据随机打乱后按7∶3划分训练集、测试集,分别将5组训练集用S3中模型训练得到5组不同的测试结果,最后取其平均值,获得总体性能指标。
图1为本发明一实施例的工作流程示意图;图2为一实施例的预处理前的致病菌拉曼光谱图;图3为一实施例的预处理后的致病菌拉曼光谱图;图4、图5、图6为一实施例的InceptionV3的3种卷积模块图;图7为一实施例的代价函数图;图8为一实施例的学习曲线图。
表1为GoogLeNet的网络结构:
网络层类型 卷积核尺寸/步长(备注) 输入尺寸
Conv 3x3/2 384x384x1
Conv 3x3/1 191x191x32
Conv padded 3x3/1 189x189x64
MaxPooling 3x3/2 189x189x64
Conv 3x3/1 94x94x64
Conv 3x3/2 92x92x128
Conv 3x3/1 45x45x128
3xInception 图4 45x45x256
5xInception 图5 23x23x512
2xInception 图6 11x11x1024
MaxAvgPooling 11x11/1 11x11x2048
Linear Logits 1x1x2048
Sigmoid 分类器 1x1x1
综上所述,本发明包括:卷积神经网络的搭建以及用于模型评估的k折交叉验证。本发明使用基于卷积神经网络的方法,通过对卷积神经网络的结构配置及优化提高了食源性致病菌光谱分类的准确率。本发明主要解决的技术问题是通过对卷积神经网络建模实现食源性致病菌光谱数据分类的自动化,给食品安全从业者提供参考,提高食品安全检测的效率。
本发明针对食源性致病菌检测周期长,分类准确率低等现象,提出了一种基于卷积神经网络的食源性致病菌分类方法,能缓解目前人工识峰出现的误判问题;比起传统的神经网络,卷积神经网络具有参数共享,稀疏链接的优势,能用更少的参数训练出更高的准确率。其中GoogLeNet网络比起先前的LeNet,AlexNet及VGG网络,具有更深的网络结构,并用全局平均池化层取代了最后的全连接层,拥有更少的网络参数,并具有更强的抽取特征的能力。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
显然,本领域的技术人员可以对发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。

Claims (5)

1.一种食源性致病菌分类方法,其特征在于,包括以下步骤:
S1:在Origin软件中使用Savitzky-Golay滤波器和非对称最小二乘对原始大肠杆菌O157∶H7、布鲁氏菌S2株致病菌光谱预处理去除荧光背景,得到致病菌的光谱;
S2:在Origin软件中将去除荧光背景的光谱截断为偏移600至2000的区间内,以绘制光谱图片;
S3:构建多层卷积神经网络,所述多层卷积神经网络包括卷积层、池化层和Iception卷积模块;对所述光谱图片进行卷积后再进行BatchNormalizaton,再通过非线性激活函数,将局部的不变特性传递给深层网络;
S4:取k=5进行交叉验证,重复5次将原始数据随机打乱后按7∶3划分训练集、测试集,分别将5组训练集用S3中的多层卷积神经网络训练得到5组不同的测试结果,最后取其平均值,获得总体性能指标。
2.如权利要求1所述的食源性致病菌分类方法,其特征在于,所述多层卷积神经网络为具有42个卷积层的GoogLeNet的网络结构。
3.如权利要求1所述的食源性致病菌分类方法,其特征在于,所述Iception卷积模块使用非对称的卷积核。
4.如权利要求1所述的食源性致病菌分类方法,其特征在于,对所述光谱图片进行卷积中,
在进行第二层卷积时,对输入的特征图进行ZeroPadding。
5.如权利要求1所述的食源性致病菌分类方法,其特征在于,所述池化层为最大值池化,通过选取最大值对输入的特征图进行压缩,使特征图变小,只保留大于预设阈值的最显著的特征。
CN201910534517.1A 2019-06-19 2019-06-19 一种食源性致病菌分类方法 Pending CN110245713A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910534517.1A CN110245713A (zh) 2019-06-19 2019-06-19 一种食源性致病菌分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910534517.1A CN110245713A (zh) 2019-06-19 2019-06-19 一种食源性致病菌分类方法

Publications (1)

Publication Number Publication Date
CN110245713A true CN110245713A (zh) 2019-09-17

Family

ID=67888367

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910534517.1A Pending CN110245713A (zh) 2019-06-19 2019-06-19 一种食源性致病菌分类方法

Country Status (1)

Country Link
CN (1) CN110245713A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111274874A (zh) * 2020-01-08 2020-06-12 上海应用技术大学 基于adaboost的食源性致病菌拉曼光谱分类模型训练方法
CN114638291A (zh) * 2022-03-08 2022-06-17 上海应用技术大学 一种基于多层前馈神经网络算法的食源性致病菌分类方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107341518A (zh) * 2017-07-07 2017-11-10 东华理工大学 一种基于卷积神经网络的图像分类方法
CN108520206A (zh) * 2018-03-22 2018-09-11 南京大学 一种基于全卷积神经网络的真菌显微图像识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107341518A (zh) * 2017-07-07 2017-11-10 东华理工大学 一种基于卷积神经网络的图像分类方法
CN108520206A (zh) * 2018-03-22 2018-09-11 南京大学 一种基于全卷积神经网络的真菌显微图像识别方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
吴子娴: "基于高光谱成像技术的大豆花叶病早期检测与分级方法研究", 《中国优秀硕士学位论文全文数据库农业科技辑》 *
李志刚: "光谱数据处理与定量分析技术", 《光谱数据处理与定量分析技术 *
温煌璐: "基于卷积神经网络的图像分类算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
黄双萍等: "基于深度卷积神经网络的水稻穗瘟病检测方法", 《农业工程学报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111274874A (zh) * 2020-01-08 2020-06-12 上海应用技术大学 基于adaboost的食源性致病菌拉曼光谱分类模型训练方法
CN114638291A (zh) * 2022-03-08 2022-06-17 上海应用技术大学 一种基于多层前馈神经网络算法的食源性致病菌分类方法

Similar Documents

Publication Publication Date Title
CN110210555A (zh) 基于深度学习的钢轨鱼鳞伤损检测方法
CN110245713A (zh) 一种食源性致病菌分类方法
CN110414670A (zh) 一种基于全卷积神经网络的图像拼接篡改定位方法
CN107330446A (zh) 一种面向图像分类的深度卷积神经网络的优化方法
CN100585617C (zh) 基于分类器集成的人脸识别系统及其方法
Khasoggi et al. Efficient mobilenet architecture as image recognition on mobile and embedded devices
EP1873687A3 (en) Parameter learning method, parameter learning apparatus, pattern classification method, and pattern classification apparatus
CN112084891B (zh) 基于多模态特征与对抗学习的跨域人体动作识别方法
CN112000771B (zh) 一种面向司法公开服务的句子对智能语义匹配方法和装置
CN109781706A (zh) 基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法
CN108805833A (zh) 基于条件对抗网络的字帖二值化背景噪声杂点去除方法
Ye et al. Detecting USM image sharpening by using CNN
CN109766942A (zh) 一种基于注意力神经网络的小样本学习图像识别方法
CN107705268A (zh) 一种基于改进的Retinex与Welsh近红外图像增强与彩色化算法
CN113627543A (zh) 一种对抗攻击检测方法
CN109617864B (zh) 一种网站识别方法及网站识别系统
CN103559486B (zh) 一种视频检测地板正反面的方法
Jian et al. Research on inspection and classification of leather surface defects based on neural network and decision tree
CN102254166A (zh) 一种人脸识别方法
Abu-Faraj et al. A Novel Approach to Extract Color Image Features Using Image Thinning
Su et al. Cleaning adversarial perturbations via residual generative network for face verification
CN110490149A (zh) 一种基于svm分类的人脸识别方法及装置
CN109816585A (zh) 一种基于深度学习的数字图像隐写分析方法
CN112986210B (zh) 一种尺度自适应的微生物拉曼光谱检测方法及系统
Zhao et al. Iterative activation-based structured pruning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190917