CN108491765B - 一种蔬菜图像的分类识别方法及系统 - Google Patents

一种蔬菜图像的分类识别方法及系统 Download PDF

Info

Publication number
CN108491765B
CN108491765B CN201810179084.8A CN201810179084A CN108491765B CN 108491765 B CN108491765 B CN 108491765B CN 201810179084 A CN201810179084 A CN 201810179084A CN 108491765 B CN108491765 B CN 108491765B
Authority
CN
China
Prior art keywords
network model
neural network
convolutional neural
layer
vegetable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810179084.8A
Other languages
English (en)
Other versions
CN108491765A (zh
Inventor
李振波
朱玲
吴静
李晨
李光耀
钮冰姗
彭芳
岳峻
李道亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Agricultural University
Original Assignee
China Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Agricultural University filed Critical China Agricultural University
Priority to CN201810179084.8A priority Critical patent/CN108491765B/zh
Publication of CN108491765A publication Critical patent/CN108491765A/zh
Application granted granted Critical
Publication of CN108491765B publication Critical patent/CN108491765B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/68Food, e.g. fruit or vegetables

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种蔬菜图像的分类识别方法及系统。方法包括:将待识别蔬菜图像输入至训练好的目标卷积神经网络模型,获取所述待识别蔬菜图像的分类识别结果;其中,所述训练好的目标卷积神经网络模型通过以下步骤获取:在卷积神经网络模型中添加全连接层,搭建所述目标卷积神经网络模型;通过蔬菜图像训练集,对所述目标卷积神经网络模型进行训练,获取所述训练好的目标卷积神经网络模型。本发明提供的方法及系统,通过在卷积神经网络模型中添加全连接层,搭建所述目标卷积神经网络模型并进行训练,基于训练好的目标卷积神经网络模型,对图像进行分类识别,提高了图像分类识别的准确率。

Description

一种蔬菜图像的分类识别方法及系统
技术领域
本发明实施例涉及分类识别技术领域,尤其涉及一种蔬菜图像的分类识别方法及系统。
背景技术
近年来,我国农业的发展模式正由传统农业向现代化的智慧农业转变,农产品中蔬菜的生产量也在不断增加。但是,目前大部分蔬菜采摘、分拣和销售任务仍依靠人工完成,需要消耗大量的劳动力,影响蔬菜产品商业化的发展速度。蔬菜的自动分类识别的研究为解决上述问题提供了重要的技术支持。
深度学习概念源于人工神经网络。深度学习通过组合低层特征形成更加抽象的高层特征,以发现数据的分布式特征表示。深度学习方法不需要人工提取就可以自动学习具有代表性的特征,所提取的数据特征能更好地刻画海量数据的内在信息。目前,深度学习网络主要有栈式自动编码器、受限玻尔兹曼机、深度置信网络和卷积神经网络等。其中,卷积神经网络在图像识别任务中的效果最为显著。但通过现有的卷积神经网络对蔬菜图像分类识别的准确率不高,因此,急需找到一种新的方法以进一步提高蔬菜图像分类识别的准确率。
发明内容
本发明实施例提供一种蔬菜图像的分类识别方法及系统,用以解决现有的卷积神经网络对蔬菜图像的分类识别的准确率低的问题。
根据本发明的一个方面,提供一种蔬菜图像的分类识别方法,包括:
将待识别蔬菜图像输入至训练好的目标卷积神经网络模型,获取所述待识别蔬菜图像的分类识别结果;
其中,所述训练好的目标卷积神经网络模型通过以下步骤获取:
在卷积神经网络模型中添加全连接层,搭建所述目标卷积神经网络模型;
通过蔬菜图像训练集,对所述目标卷积神经网络模型进行训练,获取所述训练好的目标卷积神经网络模型。
根据本发明的另一个方面,提供一种蔬菜图像的分类识别系统,包括:
分类识别结果获取模块,用于将待识别蔬菜图像输入至训练好的目标卷积神经网络模型,获取所述待识别蔬菜图像的分类识别结果;
其中,所述训练好的目标卷积神经网络模型通过以下子模块获取:
模型搭建子模块,用于在卷积神经网络模型中添加全连接层,搭建所述目标卷积神经网络模型;
模型训练获取子模块,用于通过蔬菜图像训练集,对所述目标卷积神经网络模型进行训练,获取所述训练好的目标卷积神经网络模型。
根据本发明的再一个方面,提供一种计算机设备,包括存储器和处理器,所述处理器和所述存储器通过总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行上述的方法。
根据本发明的又一个方面,提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述的方法。
本发明提供的一种蔬菜图像的分类识别方法及系统,通过在卷积神经网络模型中添加全连接层,搭建所述目标卷积神经网络模型并进行训练,基于训练好的目标卷积神经网络模型,对待识别蔬菜图像进行分类识别,提高了蔬菜图像分类识别的准确率。
附图说明
图1为根据本发明实施例提供的一种获取训练好的目标卷积神经网络模型的方法流程图;
图2为根据本发明实施例提供的一种服务器的实体结构示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
本实施例提供一种蔬菜图像的分类识别方法,该方法包括:
将待识别蔬菜图像输入至训练好的目标卷积神经网络模型,获取所述待识别蔬菜图像的分类识别结果。
图1为根据本发明实施例提供的一种获取训练好的目标卷积神经网络模型的方法流程图,如图1所示,训练好的目标卷积神经网络模型通过以下步骤获取:
在卷积神经网络模型中添加全连接层,搭建所述目标卷积神经网络模型;
通过蔬菜图像训练集,对所述目标卷积神经网络模型进行训练,获取所述训练好的目标卷积神经网络模型。
具体地,为了提高蔬菜图像的分类识别准确率,在卷积神经网络模型中添加全连接层,搭建目标卷积神经网络模型。并对该目标卷积神经网络模型进行训练,获取训练好的目标卷积神经网络模型。
将待识别的蔬菜图像输入至训练好的目标卷积神经网络模型,可获取该待识别的蔬菜图像的分类识别结果。
需要说明的是,本实施例中的卷积神经网络模型包括AlexNet、ZFnet、GoogleNet、VGG和ResNet等多种,本实施例对此不作限定。
本实施例提供的一种蔬菜图像的分类识别方法,通过在卷积神经网络模型中添加全连接层,搭建所述目标卷积神经网络模型并进行训练,基于训练好的目标卷积神经网络模型,对待识别蔬菜图像进行分类识别,提高了待识别蔬菜图像的分类识别的准确率。
基于上述实施例,本实施例作为一个优选实施例对模型训练方法作出简要说明。可基于小批量梯度下降算法,并通过蔬菜图像训练集,对所述目标卷积神经网络模型进行训练,获取所述训练好的目标卷积神经网络模型。
具体地,对于M个蔬菜图像样本,采用m个蔬菜图像样本来迭代,其中,1<m<M。小批量梯度下降算法原理如公式(1)所示。
Figure BDA0001588223040000041
J(θ)为损失函数,θ是参数,也即是要迭代求解的值。其中m代表每一次进行训练的蔬菜图像样本数量,hθ(xi)为已知的假设函数,i为蔬菜图像样本中第i组训练数据。
基于上述实施例,所述搭建所述卷积神经网络模型之前还包括:
添加多个训练好的批量归一化层。
具体地,由于在卷积神经网络模型的训练过程中,存在中间层数据分布发生改变的问题,为了防止梯度消失或爆炸、加快网络收敛速度,可在添加了目标全连接层之后的卷积神经网络模型中还添加多个训练好的批量归一化层。
添加多个训练好的批量归一化层的好处还在于:卷积神经网络模型在训练时,学习率、参数初始化、权重衰减系数、Dropout比例等参数需要人为选择设定。这些参数的选择对训练结果至关重要,因此在未添加多个训练好的批量归一化层之前,卷积神经网络模型会浪费大量时间在参数调整上,添加多个训练好的批量归一化层之后就不需要刻意的调整参数。
本实施例提供的一种蔬菜图像的分类识别方法,在添加了全连接层的卷积神经网络模型中添加多个训练好的批量归一化层,防止添加了全连接层的卷积神经网络模型在训练过程中产生梯度消失或爆炸、并加快了该网络模型收敛速度。并且,不需要刻意的调整学习率、参数初始化、权重衰减系数和Dropout比例等参数,节省了训练时间。
基于上述实施例,所述卷积神经网络模型为VGG-16网络模型;所述卷积神经网络模型为VGG-16网络模型;所述VGG-16网络模型包括13个卷积层、第一全连接层、第二全连接层和第三全连接层;所述第一全连接层、所述第二全连接层和所述第三全连接层依次串行连接;
其中,每一卷积层的输出、第一全连接层的输出和第二全连接层的输出均连接有修正线性单元。
具体地,VGG-16网络模型为一种卷积神经网络模型,该网络模型有16个隐层,其中,16个隐层具体包括13个卷积层和3个全连接层。
按照VGG-16网络模型的工作方向,将3个全连接层称为第一全连接层、第二全连接层和第三全连接层,这3个全连接层依次串行连接。
其中,每一卷积层的输出、第一全连接层的输出和第二全连接层的输出均连接有修正线性单元。
具体地,修正线性单元为ReLU激活函数,ReLU激活函数属于不饱和非线性函数。对于ReLU激活函数而言,如果输入大于0,则输出与输入相等,否则输出为0。而且使用ReLU激活函数时输出不会随着输入的逐渐增加而趋于饱和,可以解决梯度消失的问题。而且当训练时,ReLU激活函数使梯度下降的速度要比Sigmoid和Tanh这样的饱和非线性激活函数快,可以加快网络的训练速度。
基于上述实施例,作为一个优选实施例,对VGG-16网络模型作进一步说明。卷积层主要是提取特征,该VGG-16网络模型有13个卷积层,VGG-16网络模型整体使用的卷积核为3x3。使用多个较小卷积核的卷积层代替一个卷积核较大的卷积层,一方面可以减少参数,另一方面相当于进行了更多的非线性映射,可以增加网络的表达能力。
VGG-16网络模型的池化层采用最大池化(Max pooling)操作。该操作在每一个区域中寻找最大值,无论这个最大值在该区域的哪个位置,Max pooling操作之后得到的值是相同的,因此,该操作可以实现平移、旋转和尺度不变等特性,为模型提供了很强的鲁棒性。池化层的输入来源于上一个卷积层,通过Max pooling操作,在保留主要特征的同时减少了VGG-16网络模型结构参数数量,防止过拟合问题的发生,同时也提高了VGG-16网络模型模型的泛化能力。
基于上述实施例,所述在卷积神经网络模型中添加全连接层,进一步包括:
在所述第二全连接层之后添加所述全连接层;
其中,所述全连接层的输入为所述第一全连接层的输出特征和所述第二全连接层的输出特征进行融合之后的特征。
基于上述实施例,所述训练好的批量归一化层,通过以下步骤获取:
构建所述批量归一化层;其中,构建所述批量归一化层y(k)的公式为:
Figure BDA0001588223040000064
其中,γ(k)为第一调节参数,β(k)为第二调节参数,
Figure BDA0001588223040000065
为隐层内任一神经元的激活值的归一化值,
其中,获取所述归一化值
Figure BDA0001588223040000061
的公式为:
Figure BDA0001588223040000062
其中,x(k)表示所述任一神经元的激活值,E[x(k)]为任一批训练数据神经元的平均值,Var[x(k)]为所述任一批训练数据神经元x(k)的方差;
通过对所述第一调节参数和所述第二调节参数进行训练,获取所述训练好的批量归一化层。
具体地,批量归一化层用于执行中批量归一化操作。其中,批量归一化操作就是对于隐层内每个神经元的激活值来说,进行归一化操作。
Figure BDA0001588223040000063
公式(2)中,x(k)表示某个神经元的激活值,E[x(k)]指的是每一批训练数据神经元x(k)的平均值,Var[x(k)]指的是每一批训练数据神经元x(k)的方差。经过这个变换后数据形成了均值为0,方差为1的正态分布,目的是为了增大导数值,增强反向传播信息流动性,加快训练收敛速度。但是这样会导致网络表达能力下降,为了防止这一点,每个神经元增加两个调节参数γ(k)和β(k),如公式(3)所示。
Figure BDA0001588223040000071
其中,γ(k)的计算如公式(4)所示。
Figure BDA0001588223040000072
β(k)的计算如公式(5)所示。
β(k)=E[x(k)] (5)
通过训练学习重构参数γ(k)、β(k),可以恢复原始网络所要学到的特征分布,保持模型的表达能力。在卷积层上添加多个训练好的批量归一化层,使用了类似权值共享的策略,把一整张特征图当做一个神经元进行处理,以减少参数的数量。
基于上述实施例,所述通过蔬菜图像训练集,对所述目标卷积神经网络模型进行训练,获取所述训练好的目标卷积神经网络模型,之前还包括:
获取蔬菜图像原始训练集,基于数据扩展算法,将所述蔬菜图像原始训练集中的一张图像或多张图像进行多角度旋转;
将所述蔬菜图像原始训练集和进行多角度旋转之后得到的所有图像,作为所述蔬菜图像训练集。
具体地,可采用数据扩展算法将蔬菜图像原始训练集中的每一原始图像按90°、180°、270°旋转,通过该方法使得蔬菜图像原始训练集的数据量扩大了4倍,数据扩展算法适用于训练图像和测试图像。在训练阶段,数据增加可以产生额外的训练样本,从而减少过拟合带来的影响。在测试阶段,数据增加有助于提高分类精度。需要说明的是,在进行训练之前,可以将蔬菜图像处理成相同大小的尺寸。
基于上述实施例,所述训练好的卷积神经网络模型的输出层的网络参数采用高斯分布进行随机初始化。
具体地,训练好的卷积神经网络模型的输出层是SoftMax层,输出层的网络参数用高斯分布进行随机初始化。经过SoftMax层后,最终实现蔬菜图像的分类识别。
基于上述实施例,本实施例作为一个优选实施例,通过具体的表格对本发明进行进一步说明。表1为三种网络模型的结构对比表,如表1所示,三种网络模型分别为VGG-16网络模型、VGG-M网络模型和VGG-M-BN网络模型。其中,VGG-M网络模型为在VGG-16网络模型中添加了全连接层的改进的模型、VGG-M-BN网络模型为在VGG-M模型中添加了5个训练好的批量归一化层的进一步改进的模型。
表1三种网络模型的结构对比表
Figure BDA0001588223040000081
Figure BDA0001588223040000091
如表1所示,VGG-M网络模型一共有17层(除输入层),比传统的VGG-16网络模型多了一个全连接层。VGG-M-BN网络一共有23层(除输入层),其中有13个卷积层、5个新增的BN(Batch Normalization,批量归一化)层、4个全连接层(其中,Fc6,7层为新增)和Softmax层(输出层)。VGG-M-BN网络主要由卷积层、激活函数、池化层、BN层、全连接层以及Softmax层组成。
基于上述实施例,本实施例提供一种蔬菜图像的分类识别系统,包括:
分类识别结果获取模块,用于将待识别蔬菜图像输入至训练好的目标卷积神经网络模型,获取所述待识别蔬菜图像的分类识别结果;
其中,所述训练好的目标卷积神经网络模型通过以下子模块获取:
模型搭建子模块,用于在卷积神经网络模型中添加全连接层,搭建所述目标卷积神经网络模型;
模型训练获取子模块,用于通过蔬菜图像训练集,对所述目标卷积神经网络模型进行训练,获取所述训练好的目标卷积神经网络模型。
需要说明的是,上述的分类识别结果获取模块、模型搭建子模块和模型训练获取子模块用于执行上述实施例中的分类识别方法,其功能参照上述的方法实施例,此处不再赘述。
本实施例提供一种计算机设备,包括:至少一个处理器;以及与所述处理器通信连接的至少一个存储器,其中:所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令以执行上述各方法实施例所提供的方法,例如包括:将待识别蔬菜图像输入至训练好的目标卷积神经网络模型,获取所述待识别蔬菜图像的分类识别结果;其中,所述训练好的目标卷积神经网络模型通过以下步骤获取:在卷积神经网络模型中添加全连接层,搭建所述目标卷积神经网络模型;通过蔬菜图像训练集,对所述目标卷积神经网络模型进行训练,获取所述训练好的目标卷积神经网络模型。
本实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:将待识别蔬菜图像输入至训练好的目标卷积神经网络模型,获取所述待识别蔬菜图像的分类识别结果;其中,所述训练好的目标卷积神经网络模型通过以下步骤获取:在卷积神经网络模型中添加全连接层,搭建所述目标卷积神经网络模型;通过蔬菜图像训练集,对所述目标卷积神经网络模型进行训练,获取所述训练好的目标卷积神经网络模型。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
图2为根据本发明实施例提供的一种服务器的实体结构示意图,如图2所示,该服务器可以包括:处理器(processor)210、通信接口(Communications Interface)220、存储器(memory)230和总线240,其中,处理器210,通信接口220,存储器230通过总线240完成相互间的通信。通信接口240可以用于服务器与智能电视之间的信息传输。处理器210可以调用存储器230中的逻辑指令,以执行如下方法:将待识别蔬菜图像输入至训练好的目标卷积神经网络模型,获取所述待识别蔬菜图像的分类识别结果;其中,所述训练好的目标卷积神经网络模型通过以下步骤获取:在卷积神经网络模型中添加全连接层,搭建所述目标卷积神经网络模型;通过蔬菜图像训练集,对所述目标卷积神经网络模型进行训练,获取所述训练好的目标卷积神经网络模型。
此外,上述的存储器230中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
综上,本发明提供的一种蔬菜图像的分类识别方法及系统,通过在卷积神经网络模型中添加全连接层,搭建所述目标卷积神经网络模型并进行训练,基于训练好的目标卷积神经网络模型,对待识别蔬菜图像进行分类识别,提高了蔬菜图像分类识别的准确率。并在添加了全连接层的卷积神经网络模型中添加多个训练好的批量归一化层,防止添加了全连接层的卷积神经网络模型在训练过程中产生梯度消失或爆炸、并加快了该网络模型收敛速度。并且,不需要刻意的调整学习率、参数初始化、权重衰减系数、Dropout比例等参数,节省了训练时间。
最后,本发明的方案仅为较佳的实施方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种蔬菜图像的分类识别方法,其特征在于,包括:
将待识别蔬菜图像输入至训练好的目标卷积神经网络模型,获取所述待识别蔬菜图像的分类识别结果;
其中,所述训练好的目标卷积神经网络模型通过以下步骤获取:
在卷积神经网络模型中添加全连接层,搭建所述目标卷积神经网络模型;
通过蔬菜图像训练集,对所述目标卷积神经网络模型进行训练,获取所述训练好的目标卷积神经网络模型;
所述通过蔬菜图像训练集,对所述目标卷积神经网络模型进行训练,获取所述训练好的目标卷积神经网络模型,之前还包括:
获取蔬菜图像原始训练集,基于数据扩展算法,将所述蔬菜图像原始训练集中的一张图像或多张图像进行多角度旋转;
将所述蔬菜图像原始训练集和进行多角度旋转之后得到的所有图像,作为所述蔬菜图像训练集;
所述将待识别蔬菜图像输入至训练好的目标卷积神经网络模型,获取所述待识别蔬菜图像的分类识别结果,之前还包括:
基于数据扩展算法,将所述待识别蔬菜图像进行多角度旋转;
所述卷积神经网络模型为VGG-16网络模型;所述VGG-16网络模型包括13个卷积层、第一全连接层、第二全连接层和第三全连接层;所述训练好的目标卷积神经网络模型的输出层是SoftMax层;
所述在卷积神经网络模型中添加全连接层,进一步包括:
在所述第二全连接层之后添加所述全连接层;
其中,所述全连接层的输入为所述第一全连接层的输出特征和所述第二全连接层的输出特征进行融合之后的特征。
2.根据权利要求1所述的方法,其特征在于,所述搭建所述卷积神经网络模型之前还包括:
添加多个训练好的批量归一化层。
3.根据权利要求1所述的方法,其特征在于,所述第一全连接层、所述第二全连接层和所述第三全连接层依次串行连接;
其中,每一卷积层的输出、第一全连接层的输出和第二全连接层的输出均连接有修正线性单元。
4.根据权利要求2所述的方法,其特征在于,所述训练好的批量归一化层,通过以下步骤获取:
构建所述批量归一化层;其中,构建所述批量归一化层y(k)的公式为:
Figure FDA0002591405460000021
其中,γ(k)为第一调节参数,β(k)为第二调节参数,
Figure FDA0002591405460000022
为隐层内任一神经元的激活值的归一化值,
其中,获取所述归一化值
Figure FDA0002591405460000023
的公式为:
Figure FDA0002591405460000024
其中,x(k)表示所述任一神经元的激活值,E[x(k)]为任一批训练数据神经元的平均值,Var[x(k)]为所述任一批训练数据神经元x(k)的方差;
通过对所述第一调节参数和所述第二调节参数进行训练,获取所述训练好的批量归一化层。
5.根据权利要求1所述的方法,其特征在于,所述训练好的目标卷积神经网络模型的输出层的网络参数采用高斯分布进行随机初始化。
6.一种蔬菜图像的分类识别系统,其特征在于,包括:
分类识别结果获取模块,用于将待识别蔬菜图像输入至训练好的目标卷积神经网络模型,获取所述待识别蔬菜图像的分类识别结果;
其中,所述训练好的目标卷积神经网络模型通过以下子模块获取:
模型搭建子模块,用于在卷积神经网络模型中添加全连接层,搭建所述目标卷积神经网络模型;
模型训练获取子模块,用于通过蔬菜图像训练集,对所述目标卷积神经网络模型进行训练,获取所述训练好的目标卷积神经网络模型;
所述通过蔬菜图像训练集,对所述目标卷积神经网络模型进行训练,获取所述训练好的目标卷积神经网络模型,之前还包括:
获取蔬菜图像原始训练集,基于数据扩展算法,将所述蔬菜图像原始训练集中的一张图像或多张图像进行多角度旋转;
将所述蔬菜图像原始训练集和进行多角度旋转之后得到的所有图像,作为所述蔬菜图像训练集;
所述将待识别蔬菜图像输入至训练好的目标卷积神经网络模型,获取所述待识别蔬菜图像的分类识别结果,之前还包括:
基于数据扩展算法,将所述待识别蔬菜图像进行多角度旋转;
所述卷积神经网络模型为VGG-16网络模型;所述VGG-16网络模型包括13个卷积层、第一全连接层、第二全连接层和第三全连接层;所述训练好的目标卷积神经网络模型的输出层是SoftMax层;
所述在卷积神经网络模型中添加全连接层,进一步包括:
在所述第二全连接层之后添加所述全连接层;
其中,所述全连接层的输入为所述第一全连接层的输出特征和所述第二全连接层的输出特征进行融合之后的特征。
7.一种计算机设备,其特征在于,包括存储器和处理器,所述处理器和所述存储器通过总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至5任一所述的方法。
8.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至5任一所述的方法。
CN201810179084.8A 2018-03-05 2018-03-05 一种蔬菜图像的分类识别方法及系统 Active CN108491765B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810179084.8A CN108491765B (zh) 2018-03-05 2018-03-05 一种蔬菜图像的分类识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810179084.8A CN108491765B (zh) 2018-03-05 2018-03-05 一种蔬菜图像的分类识别方法及系统

Publications (2)

Publication Number Publication Date
CN108491765A CN108491765A (zh) 2018-09-04
CN108491765B true CN108491765B (zh) 2020-12-15

Family

ID=63341529

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810179084.8A Active CN108491765B (zh) 2018-03-05 2018-03-05 一种蔬菜图像的分类识别方法及系统

Country Status (1)

Country Link
CN (1) CN108491765B (zh)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109376757B (zh) * 2018-09-06 2020-09-08 苏州飞搜科技有限公司 一种多标签分类方法及系统
CN109242092B (zh) * 2018-09-29 2021-02-12 深圳市商汤科技有限公司 图像处理方法和装置、电子设备、存储介质
CN109522797A (zh) * 2018-10-16 2019-03-26 华南农业大学 基于卷积神经网络的水稻秧苗及苗期杂草识别方法和系统
US10896320B2 (en) * 2018-11-14 2021-01-19 Baidu Usa Llc Child face distance alert system
CN109800795A (zh) * 2018-12-29 2019-05-24 广州市贺氏办公设备有限公司 一种果蔬识别方法及系统
CN111435426A (zh) * 2019-01-14 2020-07-21 珠海格力电器股份有限公司 基于米粒识别结果确定烹饪模式的方法、装置和烹饪器具
CN111597862A (zh) * 2019-02-21 2020-08-28 杭州海康威视数字技术股份有限公司 一种菜品类别识别方法、装置及电子设备
CN110059551A (zh) * 2019-03-12 2019-07-26 五邑大学 一种基于图像识别的饭菜自动结账系统
CN110287991B (zh) * 2019-05-22 2023-12-19 平安科技(深圳)有限公司 植物类生药真伪验证方法、装置、计算机设备及存储介质
CN110298388A (zh) * 2019-06-10 2019-10-01 天津大学 基于改进vgg19网络的玉米5种旱情识别方法
CN110458106A (zh) * 2019-08-13 2019-11-15 深圳市睿海智电子科技有限公司 一种番茄生长状态的智能分析方法及智能分析装置
CN111241908B (zh) * 2019-11-26 2023-04-14 暨南大学 幼禽生物特征识别装置及方法
CN111160428A (zh) * 2019-12-17 2020-05-15 金陵科技学院 基于cnn-svm算法蔬菜自动识别方法
CN111291694B (zh) * 2020-02-18 2023-12-01 苏州大学 菜肴图像识别方法及装置
CN111523483B (zh) * 2020-04-24 2023-10-03 北京邮电大学 中餐菜品图像识别方法及装置
CN113469208A (zh) * 2020-05-15 2021-10-01 中国农业大学 玉米种子品种真实性鉴定方法及设备
CN111598870B (zh) * 2020-05-15 2023-09-15 北京小白世纪网络科技有限公司 基于卷积神经网络端对端推理计算冠状动脉钙化比的方法
CN111832639B (zh) * 2020-06-30 2022-05-31 山西大学 一种基于迁移学习的绘画情感预测方法
CN111814873A (zh) * 2020-07-07 2020-10-23 广州市运通水务有限公司 用于分辨排水管道缺陷类型及自动鉴别缺陷等级的方法
CN111832466A (zh) * 2020-07-08 2020-10-27 上海东普信息科技有限公司 基于vgg网络的暴力分拣识别方法、装置、设备及存储介质
CN111931817A (zh) * 2020-07-10 2020-11-13 首钢集团有限公司 一种球团矿矿相识别方法和装置
CN112052883B (zh) * 2020-08-14 2023-10-17 五邑大学 一种衣物检测方法、装置及存储介质
CN112132024B (zh) * 2020-09-22 2024-02-27 中国农业大学 水下目标识别网络优化方法及装置
CN112308145A (zh) * 2020-10-30 2021-02-02 北京百度网讯科技有限公司 一种分类网络训练方法、分类方法、装置以及电子设备
CN112508072B (zh) * 2020-11-30 2024-04-26 云南省烟草质量监督检测站 基于残差卷积神经网络的卷烟真假识别方法、装置和设备
CN112734911A (zh) * 2021-01-07 2021-04-30 北京联合大学 基于卷积神经网络的单幅图像三维人脸重建方法及系统
CN115439691B (zh) * 2022-09-05 2023-04-21 哈尔滨市科佳通用机电股份有限公司 Tvds故障自动识别系统
CN115713763A (zh) * 2022-11-25 2023-02-24 青海卓旺智慧信息科技有限公司 一种基于深度学习的土豆图像识别系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10074041B2 (en) * 2015-04-17 2018-09-11 Nec Corporation Fine-grained image classification by exploring bipartite-graph labels
CN106780466A (zh) * 2016-12-21 2017-05-31 广西师范大学 一种基于卷积神经网络的宫颈细胞图像识别方法
CN107203585B (zh) * 2017-04-11 2020-04-21 中国农业大学 一种基于深度学习的茄类图像检索方法和设备
CN107516312B (zh) * 2017-08-14 2019-11-15 北京工业大学 一种应用浅层神经网络的中医面色自动分类方法
CN107657239A (zh) * 2017-09-30 2018-02-02 清华大学深圳研究生院 掌纹图像性别分类方法及装置、计算机装置及可读存储介质

Also Published As

Publication number Publication date
CN108491765A (zh) 2018-09-04

Similar Documents

Publication Publication Date Title
CN108491765B (zh) 一种蔬菜图像的分类识别方法及系统
CN110223292B (zh) 图像评估方法、装置及计算机可读存储介质
US11107250B2 (en) Computer architecture for artificial image generation using auto-encoder
US11585918B2 (en) Generative adversarial network-based target identification
Lee et al. Plant Identification System based on a Convolutional Neural Network for the LifeClef 2016 Plant Classification Task.
CN109063719B (zh) 一种联合结构相似性和类信息的图像分类方法
CN108665005A (zh) 一种利用dcgan提高基于cnn图像识别性能的方法
CN109002755B (zh) 基于人脸图像的年龄估计模型构建方法及估计方法
CN108647723A (zh) 一种基于深度学习网络的图像分类方法
CN113987236B (zh) 基于图卷积网络的视觉检索模型的无监督训练方法和装置
Priyangka et al. Classification of rice plant diseases using the convolutional neural network method
CN110414626A (zh) 一种猪只品种识别方法、装置和计算机可读存储介质
Jasitha et al. Venation based plant leaves classification using GoogLeNet and VGG
Zhuang et al. A handwritten Chinese character recognition based on convolutional neural network and median filtering
Al-Akkam et al. Plants leaf diseases detection using deep learning
CN113343801B (zh) 基于轻量化卷积神经网络的无线信号自动调制识别方法
CN117422942A (zh) 模型训练方法、图像分类方法、图像分类装置及存储介质
CN115063374A (zh) 模型训练、人脸图像质量评分方法、电子设备及存储介质
Hu et al. Tree species identification based on the fusion of multiple deep learning models transfer learning
Tan et al. Chinese Traditional Visual Cultural Symbols Recognition Based on Convolutional Neural Network
CN114463574A (zh) 一种遥感图像的场景分类方法及装置
Kanabarkar et al. Performance Analysis of Convolutional Neural Network for Image Classification
WO2020151108A1 (zh) 基于情境信号类前额叶网络的信息处理方法、系统、装置
Barakala et al. Rice Plant Leaf Disease Classification Using Deep Residual Learning
Aldandan et al. Image-based deep learning automated grading of date fruit (Alhasa case study Saudi Arabia)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant