CN110245713A - 一种食源性致病菌分类方法 - Google Patents
一种食源性致病菌分类方法 Download PDFInfo
- Publication number
- CN110245713A CN110245713A CN201910534517.1A CN201910534517A CN110245713A CN 110245713 A CN110245713 A CN 110245713A CN 201910534517 A CN201910534517 A CN 201910534517A CN 110245713 A CN110245713 A CN 110245713A
- Authority
- CN
- China
- Prior art keywords
- food
- neural networks
- convolutional neural
- borne pathogens
- classification method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 244000078673 foodborn pathogen Species 0.000 title claims abstract description 19
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 25
- 238000002790 cross-validation Methods 0.000 claims abstract description 6
- 238000001228 spectrum Methods 0.000 claims description 18
- 244000052616 bacterial pathogen Species 0.000 claims description 13
- 238000012549 training Methods 0.000 claims description 10
- 238000012360 testing method Methods 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 4
- 241000589562 Brucella Species 0.000 claims description 3
- 241000588724 Escherichia coli Species 0.000 claims description 2
- 238000001514 detection method Methods 0.000 abstract description 7
- 230000003595 spectral effect Effects 0.000 abstract description 5
- 238000011156 evaluation Methods 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000001069 Raman spectroscopy Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 1
- 238000001237 Raman spectrum Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 210000002429 large intestine Anatomy 0.000 description 1
- 238000007403 mPCR Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000405 serological effect Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/69—Microscopic objects, e.g. biological cells or cellular parts
- G06V20/695—Preprocessing, e.g. image segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/69—Microscopic objects, e.g. biological cells or cellular parts
- G06V20/698—Matching; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Multimedia (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
Abstract
本发明公开了一种食源性致病菌分类方法,包括:卷积神经网络的搭建以及用于模型评估的k折交叉验证。本发明使用基于卷积神经网络的方法,通过对卷积神经网络的结构配置及优化提高了食源性致病菌光谱分类的准确率。本发明主要解决的技术问题是通过对卷积神经网络建模实现食源性致病菌光谱数据分类的自动化,给食品安全从业者提供参考,提高食品安全检测的效率。
Description
技术领域
本发明涉及拉曼光谱、食源性致病菌、卷积神经网络和机器学习等领域。
背景技术
到目前为止,我国食品中致病菌检测最常用的方法还是按照生物化学、微生物学理论上所建立的微生物传统检测法。最主要的有生化鉴定、肉眼形态观察、微生物分离培养以及血清学分型等鉴定方式。
这些方法操作繁琐,周期长,不能有效地起到监测、预防作用。如多重PCR检测体系,基于FTA滤膜的基因芯片检测等技术,分类的准确率并不高,识别的种类数也较少。而且相对于传统的机器学习算法,人工提取特征成本较高,往往还会存在一定的局限性。
发明内容
本发明提供一种食源性致病菌分类方法,能够解决现有的方法操作繁琐,周期长,不能有效地起到监测、预防作用、成本高的问题。
本发明提供一种食源性致病菌分类方法,所述方法包括:
S1:在Origin软件中使用Savitzky-Golay滤波器和非对称最小二乘对原始大肠杆菌O157:H7、布鲁氏菌S2株致病菌光谱预处理去除荧光背景,得到致病菌的光谱;
S2:在Origin软件中将去除荧光背景的光谱截断为偏移600至2000的区间内,以绘制光谱图片;
S3:构建多层卷积神经网络,所述多层卷积神经网络包括卷积层、池化层和Iception卷积模块;对所述光谱图片进行卷积后再进行BatchNormalizaton,再通过非线性激活函数,将局部的不变特性传递给深层网络;
S4:取k=5进行交叉验证,重复5次将原始数据随机打乱后按7∶3划分训练集、测试集,分别将5组训练集用S3中的多层卷积神经网络训练得到5组不同的测试结果,最后取其平均值,获得总体性能指标。
进一步的,上述方法中,所述多层卷积神经网络为具有42个卷积层的GoogLeNet的网络结构。
进一步的,上述方法中,所述Iception卷积模块使用非对称的卷积核。
进一步的,上述方法中,对所述光谱图片进行卷积,包括:
在进行第二层卷积时,对输入的特征图进行ZeroPadding。
进一步的,上述方法中,所述池化层为最大值池化,通过选取最大值对输入的特征图进行压缩,使特征图变小,只保留大于预设阈值的最显著的特征。
本发明包括:卷积神经网络的搭建以及用于模型评估的k折交叉验证。本发明使用基于卷积神经网络的方法,通过对卷积神经网络的结构配置及优化提高了食源性致病菌光谱分类的准确率。本发明主要解决的技术问题是通过对卷积神经网络建模实现食源性致病菌光谱数据分类的自动化,给食品安全从业者提供参考,提高食品安全检测的效率。
本发明针对食源性致病菌检测周期长,分类准确率低等现象,提出了一种基于卷积神经网络的食源性致病菌分类方法,能缓解目前人工识峰出现的误判问题;比起传统的神经网络,卷积神经网络具有参数共享,稀疏链接的优势,能用更少的参数训练出更高的准确率。其中GoogLeNet网络比起先前的LeNet,AlexNet及VGG网络,具有更深的网络结构,并用全局平均池化层取代了最后的全连接层,拥有更少的网络参数,并具有更强的抽取特征的能力。
说明书附图
图1为本发明一实施例的的工作流程示意图;
图2为本发明一实施例的预处理前的致病菌拉曼光谱图;
图3为本发明一实施例的预处理后的致病菌拉曼光谱图;
图4、图5、图6为本发明一实施例的InceptionV3的3种卷积模块图;
图7为本发明一实施例的代价函数图;
图8为本发明一实施例的学习曲线图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
图1为本发明采用的卷积神经网络分类方法,如图1所示,本实施例中的方法包括:
S1、光谱预处理:在Origin软件中使用Savitzky-Golay滤波器和非对称最小二乘对原始大肠杆菌O157:H7、布鲁氏菌S2株致病菌光谱预处理去除荧光背景,得到致病菌的光谱;
S2、生成光谱图片:在Oringin软件中将所述致病菌的光谱截断为偏移600至2000之间的区间内,以绘制光谱图片;
S3、模型搭建:构建多层卷积神经网络,这里可以按照表1构造选用具有42个卷积层的GoogLeNet的网络结构,包括卷积层、池化层和Iception卷积模块;所述光谱图片在经过卷积后紧接着进行Batch Normalization,调整经过卷积后的数据分布,缓解梯度弥散和梯度消失,使梯度能有效的反向传导。再通过非线性激活函数,将局部的不变特性传递给深层网络。
在进行第二层卷积时,对输入的特征图进行ZeroPadding,使输出的尺寸与输入的尺寸一致。
池化层为最大值池化,通过选取最大值对输入的特征图进行压缩,使特征图变小,只保留大于预设阈值的最显著的特征,简化网络。
Iception卷积模块使用了尺寸更小的非对称的卷积核,其中两个3x3卷积核的感受野跟一个5x5卷积核的感受野相当,而三个3x3卷积核的感受野则与一个7x7卷积核的感受野相当,通过减小卷积核大小而增加层数能减少整个模型的参数量,1x1卷积核这个操作实现的是多个特征映射的线性组合,可以实现特征映射在通道个数上的变化,还有一个重要的功能,就是可以在保持特征映射尺寸不变,不损失分辨率的前提下大幅增加非线性特性,可以把网络做得很深。
对于Iception卷积模块中最后的拼接层,须要保证进行拼接的每个输入具有同样的尺寸,再各个分支中采取适当的ZeroPadding即可。早先的LeNet,AlexNet,VGG网络在最后用的是的全连接层,而这两层全连接层却占了网络近一半的参数,GoogLeNet最后的全局平均池化层将输入的矩阵数组结构展开成线性结构,再进行最后的决策分类。
每一层激活函数均为ReLU(整流线性单元):
ReLU:y=max(x,0)
其中x为输入张量,y为输出张量。
优化算法为SGD(随机梯度下降):
其中n为迭代轮数,w为权重,b为偏置,α为学习率。
优化目标为交叉熵:
L(x)=--y*log(y′)-(1-y)*log(1-y′)
其中y为真实类别,y′为预测类别,如图7所示,当预测值与真实值不相匹配时代价为+∞
S4、模型评估:取k=5进行交叉验证,重复5次将原始数据随机打乱后按7∶3划分训练集、测试集,分别将5组训练集用S3中模型训练得到5组不同的测试结果,最后取其平均值,获得总体性能指标。
图1为本发明一实施例的工作流程示意图;图2为一实施例的预处理前的致病菌拉曼光谱图;图3为一实施例的预处理后的致病菌拉曼光谱图;图4、图5、图6为一实施例的InceptionV3的3种卷积模块图;图7为一实施例的代价函数图;图8为一实施例的学习曲线图。
表1为GoogLeNet的网络结构:
网络层类型 | 卷积核尺寸/步长(备注) | 输入尺寸 |
Conv | 3x3/2 | 384x384x1 |
Conv | 3x3/1 | 191x191x32 |
Conv padded | 3x3/1 | 189x189x64 |
MaxPooling | 3x3/2 | 189x189x64 |
Conv | 3x3/1 | 94x94x64 |
Conv | 3x3/2 | 92x92x128 |
Conv | 3x3/1 | 45x45x128 |
3xInception | 图4 | 45x45x256 |
5xInception | 图5 | 23x23x512 |
2xInception | 图6 | 11x11x1024 |
MaxAvgPooling | 11x11/1 | 11x11x2048 |
Linear | Logits | 1x1x2048 |
Sigmoid | 分类器 | 1x1x1 |
综上所述,本发明包括:卷积神经网络的搭建以及用于模型评估的k折交叉验证。本发明使用基于卷积神经网络的方法,通过对卷积神经网络的结构配置及优化提高了食源性致病菌光谱分类的准确率。本发明主要解决的技术问题是通过对卷积神经网络建模实现食源性致病菌光谱数据分类的自动化,给食品安全从业者提供参考,提高食品安全检测的效率。
本发明针对食源性致病菌检测周期长,分类准确率低等现象,提出了一种基于卷积神经网络的食源性致病菌分类方法,能缓解目前人工识峰出现的误判问题;比起传统的神经网络,卷积神经网络具有参数共享,稀疏链接的优势,能用更少的参数训练出更高的准确率。其中GoogLeNet网络比起先前的LeNet,AlexNet及VGG网络,具有更深的网络结构,并用全局平均池化层取代了最后的全连接层,拥有更少的网络参数,并具有更强的抽取特征的能力。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
显然,本领域的技术人员可以对发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。
Claims (5)
1.一种食源性致病菌分类方法,其特征在于,包括以下步骤:
S1:在Origin软件中使用Savitzky-Golay滤波器和非对称最小二乘对原始大肠杆菌O157∶H7、布鲁氏菌S2株致病菌光谱预处理去除荧光背景,得到致病菌的光谱;
S2:在Origin软件中将去除荧光背景的光谱截断为偏移600至2000的区间内,以绘制光谱图片;
S3:构建多层卷积神经网络,所述多层卷积神经网络包括卷积层、池化层和Iception卷积模块;对所述光谱图片进行卷积后再进行BatchNormalizaton,再通过非线性激活函数,将局部的不变特性传递给深层网络;
S4:取k=5进行交叉验证,重复5次将原始数据随机打乱后按7∶3划分训练集、测试集,分别将5组训练集用S3中的多层卷积神经网络训练得到5组不同的测试结果,最后取其平均值,获得总体性能指标。
2.如权利要求1所述的食源性致病菌分类方法,其特征在于,所述多层卷积神经网络为具有42个卷积层的GoogLeNet的网络结构。
3.如权利要求1所述的食源性致病菌分类方法,其特征在于,所述Iception卷积模块使用非对称的卷积核。
4.如权利要求1所述的食源性致病菌分类方法,其特征在于,对所述光谱图片进行卷积中,
在进行第二层卷积时,对输入的特征图进行ZeroPadding。
5.如权利要求1所述的食源性致病菌分类方法,其特征在于,所述池化层为最大值池化,通过选取最大值对输入的特征图进行压缩,使特征图变小,只保留大于预设阈值的最显著的特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910534517.1A CN110245713A (zh) | 2019-06-19 | 2019-06-19 | 一种食源性致病菌分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910534517.1A CN110245713A (zh) | 2019-06-19 | 2019-06-19 | 一种食源性致病菌分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110245713A true CN110245713A (zh) | 2019-09-17 |
Family
ID=67888367
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910534517.1A Pending CN110245713A (zh) | 2019-06-19 | 2019-06-19 | 一种食源性致病菌分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110245713A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111274874A (zh) * | 2020-01-08 | 2020-06-12 | 上海应用技术大学 | 基于adaboost的食源性致病菌拉曼光谱分类模型训练方法 |
CN114638291A (zh) * | 2022-03-08 | 2022-06-17 | 上海应用技术大学 | 一种基于多层前馈神经网络算法的食源性致病菌分类方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107341518A (zh) * | 2017-07-07 | 2017-11-10 | 东华理工大学 | 一种基于卷积神经网络的图像分类方法 |
CN108520206A (zh) * | 2018-03-22 | 2018-09-11 | 南京大学 | 一种基于全卷积神经网络的真菌显微图像识别方法 |
-
2019
- 2019-06-19 CN CN201910534517.1A patent/CN110245713A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107341518A (zh) * | 2017-07-07 | 2017-11-10 | 东华理工大学 | 一种基于卷积神经网络的图像分类方法 |
CN108520206A (zh) * | 2018-03-22 | 2018-09-11 | 南京大学 | 一种基于全卷积神经网络的真菌显微图像识别方法 |
Non-Patent Citations (4)
Title |
---|
吴子娴: "基于高光谱成像技术的大豆花叶病早期检测与分级方法研究", 《中国优秀硕士学位论文全文数据库农业科技辑》 * |
李志刚: "光谱数据处理与定量分析技术", 《光谱数据处理与定量分析技术》 * |
温煌璐: "基于卷积神经网络的图像分类算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
黄双萍等: "基于深度卷积神经网络的水稻穗瘟病检测方法", 《农业工程学报》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111274874A (zh) * | 2020-01-08 | 2020-06-12 | 上海应用技术大学 | 基于adaboost的食源性致病菌拉曼光谱分类模型训练方法 |
CN114638291A (zh) * | 2022-03-08 | 2022-06-17 | 上海应用技术大学 | 一种基于多层前馈神经网络算法的食源性致病菌分类方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110210555A (zh) | 基于深度学习的钢轨鱼鳞伤损检测方法 | |
CN110245713A (zh) | 一种食源性致病菌分类方法 | |
CN110414670A (zh) | 一种基于全卷积神经网络的图像拼接篡改定位方法 | |
CN107330446A (zh) | 一种面向图像分类的深度卷积神经网络的优化方法 | |
CN100585617C (zh) | 基于分类器集成的人脸识别系统及其方法 | |
Khasoggi et al. | Efficient mobilenet architecture as image recognition on mobile and embedded devices | |
EP1873687A3 (en) | Parameter learning method, parameter learning apparatus, pattern classification method, and pattern classification apparatus | |
CN112084891B (zh) | 基于多模态特征与对抗学习的跨域人体动作识别方法 | |
CN112000771B (zh) | 一种面向司法公开服务的句子对智能语义匹配方法和装置 | |
CN109781706A (zh) | 基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法 | |
CN108805833A (zh) | 基于条件对抗网络的字帖二值化背景噪声杂点去除方法 | |
Ye et al. | Detecting USM image sharpening by using CNN | |
CN109766942A (zh) | 一种基于注意力神经网络的小样本学习图像识别方法 | |
CN107705268A (zh) | 一种基于改进的Retinex与Welsh近红外图像增强与彩色化算法 | |
CN113627543A (zh) | 一种对抗攻击检测方法 | |
CN109617864B (zh) | 一种网站识别方法及网站识别系统 | |
CN103559486B (zh) | 一种视频检测地板正反面的方法 | |
Jian et al. | Research on inspection and classification of leather surface defects based on neural network and decision tree | |
CN102254166A (zh) | 一种人脸识别方法 | |
Abu-Faraj et al. | A Novel Approach to Extract Color Image Features Using Image Thinning | |
Su et al. | Cleaning adversarial perturbations via residual generative network for face verification | |
CN110490149A (zh) | 一种基于svm分类的人脸识别方法及装置 | |
CN109816585A (zh) | 一种基于深度学习的数字图像隐写分析方法 | |
CN112986210B (zh) | 一种尺度自适应的微生物拉曼光谱检测方法及系统 | |
Zhao et al. | Iterative activation-based structured pruning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190917 |