CN113051983A - 训练大田作物病害识别模型及大田作物病害识别的方法 - Google Patents

训练大田作物病害识别模型及大田作物病害识别的方法 Download PDF

Info

Publication number
CN113051983A
CN113051983A CN201911384204.9A CN201911384204A CN113051983A CN 113051983 A CN113051983 A CN 113051983A CN 201911384204 A CN201911384204 A CN 201911384204A CN 113051983 A CN113051983 A CN 113051983A
Authority
CN
China
Prior art keywords
field crop
crop disease
training
model
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911384204.9A
Other languages
English (en)
Other versions
CN113051983B (zh
Inventor
陈庆勇
桑建
魏远伦
马飞泉
寇荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Chengdu ICT Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Chengdu ICT Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Chengdu ICT Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201911384204.9A priority Critical patent/CN113051983B/zh
Publication of CN113051983A publication Critical patent/CN113051983A/zh
Application granted granted Critical
Publication of CN113051983B publication Critical patent/CN113051983B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/68Food, e.g. fruit or vegetables

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例公开了一种训练大田作物病害识别模型及大田作物病害识别的方法。该训练大田作物病害识别模型的方法,包括:获取原始大田作物病害图像;基于原始大田作物病害图像、加权dropout算法及预设的Resnet网络进行模型训练,得到大田作物病害识别模型。根据本发明实施例,能够训练出泛化能力强的大田作物病害识别模型,进而更加准确地识别大田作物病害。

Description

训练大田作物病害识别模型及大田作物病害识别的方法
技术领域
本发明属于图像处理与深度学习技术领域,尤其涉及一种训练大田作物病害识别模型的方法及装置、基于大田作物病害识别模型的大田作物病害识别方法及装置、电子设备及计算机存储介质。
背景技术
目前,常见的大田作物病害识别方法主要有以下三种:(1)人工识别:农业专家和种植户使用肉眼和经验判断是否发生某种病害。(2)检测剂:取病原菌孢子粉制作玻片,再使用检测剂放到显微镜下观察。(3)人工智能(Artificial Intelligence,AI)检测:基于图片信息和AI技术,使用大规模训练样本进行训练、识别。
针对AI检测来说,AI检测技术只能应用于场景、害虫种类以及相应检测方法都相对特定化环境。农业领域中不可知因素太多,如地理位置、气候水土、生物多样性等,某个因素的改变很可能就将在特性环境中已经测试成功的算法变成无效算法,进而影响检测效率,并且对隐蔽性较强的农业害虫或病害的监测能力有限。而且,目前可使用的农作物病虫害识别研究标准数据集较为缺少。
因此,如何训练出泛化能力强的大田作物病害识别模型,进而更加准确地识别大田作物病害是本领域技术人员亟需解决的技术问题。
发明内容
本发明实施例提供一种训练大田作物病害识别模型的方法及装置、基于大田作物病害识别模型的大田作物病害识别方法及装置、电子设备及计算机存储介质,能够训练出泛化能力强的大田作物病害识别模型,进而更加准确地识别大田作物病害。
第一方面,提供了一种训练大田作物病害识别模型的方法,包括:
获取原始大田作物病害图像;
基于原始大田作物病害图像、加权dropout算法及预设的Resnet网络进行模型训练,得到大田作物病害识别模型。
可选地,基于原始大田作物病害图像、加权dropout算法及预设的Resnet网络进行模型训练,得到大田作物病害识别模型,包括:
利用生成对抗网络对原始大田作物病害图像进行数据增强,得到样本图像数据集;
基于样本图像数据集、加权dropout算法及Resnet网络进行模型训练,得到大田作物病害识别模型。
可选地,基于样本图像数据集、加权dropout算法及Resnet网络进行模型训练,得到大田作物病害识别模型,包括:
对样本图像数据集进行标签双线性插值和图像融合,得到样本图像训练集和样本图像测试集;
基于样本图像训练集、样本图像测试集、加权dropout算法及Resnet网络进行模型训练,得到大田作物病害识别模型。
可选地,基于样本图像训练集、样本图像测试集、加权dropout算法及Resnet网络进行模型训练,得到大田作物病害识别模型,包括:
利用样本图像训练集及加权dropout算法训练Resnet网络,得到初始大田作物病害识别模型;
利用样本图像测试集确定初始大田作物病害识别模型的错误率和/或损失值;
当错误率小于错误率阈值和/或损失值小于损失值阈值时,确定初始大田作物病害识别模型为大田作物病害识别模型。
可选地,基于原始大田作物病害图像、加权dropout算法及预设的Resnet网络进行模型训练,得到大田作物病害识别模型,包括:
对Resnet网络进行双维度扩展,得到改进后的Resnet网络;
基于原始大田作物病害图像、加权dropout算法及改进后的Resnet网络进行模型训练,得到大田作物病害识别模型。
第二方面,提供了一种基于大田作物病害识别模型的大田作物病害识别方法,大田作物病害识别模型为使用第一方面的训练大田作物病害识别模型的方法得到的模型,包括:
获取待识别图像;
将待识别图像输入大田作物病害识别模型,输出识别结果;其中,识别结果为待识别图像记录的场景中有或无大田作物病害。
第三方面,提供了一种训练大田作物病害识别模型的装置,包括:
图像获取模块,用于获取原始大田作物病害图像;
模型训练模块,用于基于原始大田作物病害图像、加权dropout算法及预设的Resnet网络进行模型训练,得到大田作物病害识别模型。
可选地,模型训练模块,用于利用生成对抗网络对原始大田作物病害图像进行数据增强,得到样本图像数据集;基于样本图像数据集、加权dropout算法及Resnet网络进行模型训练,得到大田作物病害识别模型。
可选地,模型训练模块,用于对样本图像数据集进行标签双线性插值和图像融合,得到样本图像训练集和样本图像测试集;基于样本图像训练集、样本图像测试集、加权dropout算法及Resnet网络进行模型训练,得到大田作物病害识别模型。
可选地,模型训练模块,用于利用样本图像训练集及加权dropout算法训练Resnet网络,得到初始大田作物病害识别模型;利用样本图像测试集确定初始大田作物病害识别模型的错误率和/或损失值;当错误率小于错误率阈值和/或损失值小于损失值阈值时,确定初始大田作物病害识别模型为大田作物病害识别模型。
可选地,模型训练模块,用于对Resnet网络进行双维度扩展,得到改进后的Resnet网络;基于原始大田作物病害图像、加权dropout算法及改进后的Resnet网络进行模型训练,得到大田作物病害识别模型。
第四方面,提供了一种基于大田作物病害识别模型的大田作物病害识别装置,大田作物病害识别模型为使用第一方面的训练大田作物病害识别模型的方法得到的模型,包括:
获取模块,用于获取待识别图像;
输出模块,用于将待识别图像输入大田作物病害识别模型,输出识别结果;其中,识别结果为待识别图像记录的场景中有或无大田作物病害。
第五方面,提供了一种电子设备,电子设备包括:处理器以及存储有计算机程序指令的存储器;
处理器执行计算机程序指令时实现第一方面或第一方面任一可选的实现方式中的训练大田作物病害识别模型的方法;或第二方面的基于大田作物病害识别模型的大田作物病害识别方法。
第六方面,提供了一种计算机存储介质,计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现第一方面或第一方面任一可选的实现方式中的训练大田作物病害识别模型的方法;或第二方面的基于大田作物病害识别模型的大田作物病害识别方法。
本发明实施例的训练大田作物病害识别模型的方法及装置、基于大田作物病害识别模型的大田作物病害识别方法及装置、电子设备及计算机存储介质,能够训练出泛化能力强的大田作物病害识别模型,进而更加准确地识别大田作物病害。该训练大田作物病害识别模型的方法在获取原始大田作物病害图像后,基于原始大田作物病害图像、加权dropout算法及预设的Resnet网络进行模型训练,加权dropout算法能够缓解训练过程中出现的过拟合现象,故能够训练出泛化能力强的大田作物病害识别模型,进而更加准确地识别大田作物病害。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种训练大田作物病害识别模型的方法的流程示意图;
图2是本发明实施例提供的一种基于大田作物病害识别模型的大田作物病害识别方法的流程示意图;
图3是本发明实施例提供的一种训练大田作物病害识别模型的装置的结构示意图;
图4是本发明实施例提供的一种基于大田作物病害识别模型的大田作物病害识别装置的结构示意图;
图5是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
目前,针对AI检测来说,AI检测技术只能应用于场景、害虫种类以及相应检测方法都相对特定化环境。农业领域中不可知因素太多,如地理位置、气候水土、生物多样性等,某个因素的改变很可能就将在特性环境中已经测试成功的算法变成无效算法,进而影响检测效率,并且对隐蔽性较强的农业害虫或病害的监测能力有限。而且,目前可使用的农作物病虫害识别研究标准数据集较为缺少。
为了解决现有技术问题,本发明实施例提供了一种训练大田作物病害识别模型的方法及装置、基于大田作物病害识别模型的大田作物病害识别方法及装置、电子设备及计算机存储介质。下面首先对本发明实施例所提供的训练大田作物病害识别模型的方法进行介绍。
图1是本发明实施例提供的一种训练大田作物病害识别模型的方法的流程示意图。如图1所示,该训练大田作物病害识别模型的方法,可以包括以下步骤:
S101、获取原始大田作物病害图像。
S102、基于原始大田作物病害图像、加权dropout算法(即Weight-mean dropout机制)及预设的Resnet网络进行模型训练,得到大田作物病害识别模型。
为了扩增数据集,在一个实施例中,基于原始大田作物病害图像、加权dropout算法及预设的Resnet网络进行模型训练,得到大田作物病害识别模型,通常可以包括:利用生成对抗网络(GAN)对原始大田作物病害图像进行数据增强,得到样本图像数据集;基于样本图像数据集、加权dropout算法及Resnet网络进行模型训练,得到大田作物病害识别模型。
由于农作物病害发生是一个复杂的过程,同时病害在不同品种、不同部位上的表现症状也不完全相同,目前缺少可使用的农作物病虫害识别研究标准数据集,相较于imagenet(其是一个大型可视化数据库)动辄上百万张训练图像的训练集相比,在训练Resnet网络的过程中需要面向于小样本的训练的方法。在本发明实施例中,我们使用了生成对抗网络进行数据集的扩增。对于农作物病害检测,此任务的训练集中有精确标签的数据非常少,但是包含了大量的没有标注的数据,如果直接用监督学习的方法去做的话,效果不一定好。有标注的训练数据太少容易导致算法模型不优,而且大量的无标注的数据都没有充分的利用,因此使用半监督学习。
生成对抗网络(GAN)定义了一个判别器(D)和生成器(G)。因为无标签样本没有类别信息,无法训练分类器。在引入GAN后,其中生成器(G)可以随机从随机信号生成伪样本,相比之下原有的无标签样本拥有了人造标签。在训练集中包含标签样本和无标签样本,生成器从随机噪声生成伪样本,分类器接受样本,对于K类分类问题,输出K+1维估计,再经过softmax函数得到概率。此处的判别器(D)不是一个简单的真假分类(二分)器,假设输入数据有K类,判别器就是K+1的分类器,多出的那一类是判别输入是否是生成器生成的图像。通过判别器和生成器之间的相互博弈,使得生成的对抗,同时从真实数据集和生成器生成的图片样本中取样,使得训练数据中有一半都是来自生成器生成的数据,达到数据增强的效果。
为了进行数据增广,在一个实施例中,基于样本图像数据集、加权dropout算法及Resnet网络进行模型训练,得到大田作物病害识别模型,通常可以包括:对样本图像数据集进行标签双线性插值和图像融合(Fuse),得到样本图像训练集和样本图像测试集;基于样本图像训练集、样本图像测试集、加权dropout算法及Resnet网络进行模型训练,得到大田作物病害识别模型。
大规模深度神经网络具有强大的性能,不过其损耗巨大的内存,并且对对抗样本的敏感性不尽如人意。Fuse是一种简单且数据无关的数据增强方式,它构建了虚拟的训练样本。Fuse通过结合先验知识,即特征向量的双线性插值应导致相关标签的双线性插值来扩展训练分布。Fuse通过成对样本及其标签的凸组合训练神经网络,增强了训练样本之间的线性表达,因此消减了训练样本之外预测的不良震荡。由于线性是一种最简单的可能性表示,从奥卡姆剃刀的观点来看线性是一种良好的归偏置。通过Fuse可以减少错误标签的开销,增强对抗样本的鲁棒性,稳定了生成对抗网络的训练。
Fuse构建了虚拟的训练样本,由于农作物病害大部分表现在根、茎、叶区域,病害表现形式也较为相似,因此需要更加关注细粒度分类问题。以往的数据增强方法大部分通过旋转、随机裁剪、改变图像纵横比等,但这种方式产生的数据不来自数据本身分布,但领域内样本都是同一类,且没有对不同类不同样本之间的邻域关系进行建模。通过标签(Label)双线性插值,在无标签的数据上预测标签然后进行混合,使得训练集在高纬空间中分布的一堆散点通过Fuse制造出大量位于训练集散点之间的新点,使得散点更密集,不容易产生过拟合。
为了训练出错误率和/或损失值更小的大田作物病害识别模型,在一个实施例中,基于样本图像训练集、样本图像测试集、加权dropout算法及Resnet网络进行模型训练,得到大田作物病害识别模型,通常可以包括:利用样本图像训练集及加权dropout算法训练Resnet网络,得到初始大田作物病害识别模型;利用样本图像测试集确定初始大田作物病害识别模型的错误率和/或损失值;当错误率小于错误率阈值和/或损失值小于损失值阈值时,确定初始大田作物病害识别模型为大田作物病害识别模型。
为了训练出更高准确率的大田作物病害识别模型,在一个实施例中,基于原始大田作物病害图像、加权dropout算法及预设的Resnet网络进行模型训练,得到大田作物病害识别模型,通常可以包括:对Resnet网络进行双维
度扩展,得到改进后的Resnet网络;基于原始大田作物病害图像、加权dropout算法及改进后的Resnet网络进行模型训练,得到大田作物病害识别模型。
在一个实施例中,Resnet的整体网络结构如表1所示:
表1
Figure BDA0002343111090000081
从Resnet的整体网络结构可知,网络的输入为224×224。网络分为5部分conv1,conv2_x,conv3_x,conv4_x,conv5_x,首先经过7×7×64的卷积,然后经过3+4+6+3=16个模块(building block),每个building block为3层,共有16×3=48层,最后一个全连接(full-connect,fc)层,用于农作物病变检测分类,因此总共1+48+1=50层。
Resnet网络是参考了VGG19网络,在其基础上进行了修改,并通过短路机制加入了残差单元,变化主要体现在Resnet网络直接使用步长为2(stride=2)的卷积做下采样,并且用全局平均池化(global average pool)层替换了全连接层。在残差块中,输入可通过跨层的数据线路更快地向前传播。残差块里首先有3个相同输出通道的3×3卷积层,每个卷积层后接一个批量归一化和relu激活函数。Resnet网络的一个重要设计原则是:当特征图(feature map)大小降低一半时,feature map的数量增加一倍,这保持了网络层的复杂度。Resnet网络相比普通网络每两层间增加了短路机制,这就形成了残差学习。Resnet-50,其进行的是三层间的残差学习,三层卷积核分别是1x1,3x3和1x1。通过1x1的卷积核来跨越通道组织信息,实现降维操作,并且也增加了非线性,使用3x3的卷积核提取特征。Resnet网络使用了平均池化(average-pooling)方法避免全连接层产生大量的网络参数,最后一层使用softmax函数得到各个类别的类后验概率,并加入dropout正则化防止过拟合。
由于农作物病害识别需要良好的泛化能力,dropout是提高深度神经网络泛化能力的主要正则化技术之一。Resnet网络中经过平均池化后通过dropout会在每轮训练中随机忽略部分的神经元,以避免拟合的发生。本发明实施例的创新是使用一种dropout技术的变形—加权dropout算法(即Weight-mean dropout机制)。传统dropout技术在每轮训练时会从输入中随机选择一组样本(称之为dropout样本),而Weight-mean dropout会创建多个dropout样本,然后加权所有样本的损失,从而得到最终的损失。这种方法只要在dropout层后复制部分训练网络,并在这些复制的全连接层之间共享权重,无需新运算符。通过随机加权M个dropout样本的损失来更新网络参数,使得最终损失比任何一个dropout样本的损失都低。
这样做的效果类似于对一个mini batch中的每个输入重复训练M次。因此,它大大减少了训练迭代次数,从而加快训练速度。因为大部分运算发生在dropout层之前的卷积层中,Weight-mean dropout并不会重复这些计算,所以对每次迭代的计算成本影响不大,因此Weight-mean dropout还可以降低训练集和验证集的错误率和损失。通过使用复合扩展的Resnet网络,每个dropout样本都复制了原网络中dropout层和dropout后的几层,在该网络中复制了dropout和softmax层。在dropout层中,每个dropout样本使用不同的掩码来使其神经元子集不同,但复制的全连接层之间会共享参数(即连接权重),然后利用相同的损失函数计算每个dropout样本的损失,并对所有dropout样本的损失值进行加权平均,就可以得到最终的损失值。该方法以最后的损失值作为优化训练的目标函数,以最后一个全连接层输出中的最大值的类标签作为预测标签,并输出分类类别。
Resnet网络由5个子模块组成,也称为五个阶段。在第一个阶段进行了降采样,其他四个阶段的所有层的卷积操作都是一样的。当一个输入的张量流经过整个卷积网络,它的维度通常会缩减,并伴随着通道位数的增加。对于一个神经网络,模型扩展问题的难点在于深度、宽度、分辨率之间彼此依赖,传统方法主要集中独立的解决其中一个维度的扩展问题。随着深度、宽度、分辨率的提高,网络会获得更好的准确率。但是单维度的扩展具有一定的局限性,我们给神经网络单维增加相同量的算力的时候,这种单维的提升所能带来的增益会越来越少,最后微乎其微,甚者会发生过拟合。Resnet系列可以通过增加层数从Resnet-18扩展到Resnet-200。但随着网络层数的增加,网络会发生退化的现象,训练集损失(loss)逐渐下降然后趋于饱和,如果再增加网络的层数,训练集loss反而会增大,而这并不是过拟合问题。现有的工作都是针对神经网络三个维度—深度、宽度和图像大小中的一个因素进行调整。双维度扩展的Resnet网络,在不同的扩展维度之间并不是各自独立的。对于更高分辨率的图像,理应使用更深的网络来获得更大的感受野对图像进行采样与特征提取,但高分辨率可能带来的只是小目标和边框精度的提升,因此在这里忽略这个维度,在一个可行的分辨率下面专注于其他超参数的调整;宽度,指每一层的输入输出的通道数,网络的宽度增加可以通过高分辨图像中更多的像素点来捕获更加细粒度的模式;深度,就是加减层,增加深度可以在计算量和运行时间上达标。本发明实施例通过使用一种固定比例的放缩操作实现对宽度、深度这两个维度的平衡,这个规范化的神经网络扩展方法可以同时提高网路的准确率和效率。其中,对原网络宽度增加W倍、深度增加D倍,W、D是一组恒定系数,它们的值可通过在原始的标准模型中使用小范围的网格搜索得到。由于网络结构具有不同计算访存比的特点,导致硬件算力和网络每秒所执行的浮点运算次数(floating-point operations per second,FLOPS)之间无法形成线性对比关系。该方法使用一个复合系数Q通过一种规范化的方式统一对网络的两个维度进行扩展,因为FLOPS需求与宽度的平方、深度成正比,因此可以使用D×W^2≈N,因此总FLOPS增加N^Q。对于更大的输入图像,网络需要更多层来增加感受野,同时需要更多的通道数来获取细粒度的信息,因此该扩展是有一定理论支撑的。该扩展可以有效的提升现有的网络结构在大规模计算资源上的训练效果。
本发明实施例有如下改进:
1、提出一种Fuse方式进行数据增广。由于主流深度神经网络对对抗样本的敏感性不尽如人意。本策略利用了一种简单且数据无关的数据增强方式,构建了虚拟的训练样本,通过成对样本及其标签的凸组合上训练神经网络,增强了训练样本之间的线性表达,因此消减了训练样本之外预测的不良震荡。通过Fuse可以减少错误标签的开销,增强对抗样本的鲁棒性,稳定了生成对抗网络的训练,提高了训练模型的鲁棒性。
2、使用了一种增加网络泛化能力的机制Weight-mean dropout。Weight-meandropout会复制多个dropout样本,每个dropout样本使用不同的掩码来使其神经元子集不同,然后加权平均所有样本的损失,从而得到最终的损失。它大大减少了训练迭代次数,从而加快训练速度,并且Weight-mean dropout还可以降低训练集和验证集的错误率和损失,使得训练模型具有良好的泛化能力。
3、提出了新的双维度扩展对Resnet进行改进,有效的提升现有的网络结构在大规模计算资源上的训练效果,并将均值池化(mean-pooling)替换为最大池化(max-pooling)。mean-pooling误差来源于邻域大小受限造成的统计值方差偏大,使用mean-pooling可以更多的保留图像的背景信息;max-pooling误差来源卷积层参数误差造成估计均值的偏移,使用max-pooling可以更多的保留纹理信息。而农作物病害在不同部位上的表现症状不完全相同,且大部分症状表现在根茎叶区域,因此保留纹理信息比背景信息更为重要。
基于这些改进,本发明实施例具有如下优点:
(1)目前存在的使用深度学习的方法进行检测,都需要上百万张图片进行训练得到模型。本发明实施例使用Fuse和Weight-mean dropout策略,缓解在训练过程中出现的过拟合现象,以及算法泛化能力差的问题,最终达到使用小训练样本达到识别大田农作物病害。
(2)本发明实施例通过使用双维度扩展法对Resnet网络进行改进,相比主流识别算法有较强的泛化能力,在地理位置、气候水土、生物多样性等某个因素的改变的情况下仍具有较高的准确率,有效的提升现有的网络结构在大规模计算资源上的训练效果。
本发明实施例还提供一种基于大田作物病害识别模型的大田作物病害识别方法,大田作物病害识别模型为使用图1所示的训练大田作物病害识别模型的方法得到的模型。如图2所示,该基于大田作物病害识别模型的大田作物病害识别方法包括以下步骤:
S201、获取待识别图像。
S202、将待识别图像输入大田作物病害识别模型,输出识别结果;其中,识别结果为待识别图像记录的场景中有或无大田作物病害。
本发明实施例还提供一种训练大田作物病害识别模型的装置,包括:
图像获取模块301,用于获取原始大田作物病害图像;
模型训练模块302,用于基于原始大田作物病害图像、加权dropout算法及预设的Resnet网络进行模型训练,得到大田作物病害识别模型。
可选地,在一个实施例中,模型训练模块302,用于利用生成对抗网络对原始大田作物病害图像进行数据增强,得到样本图像数据集;基于样本图像数据集、加权dropout算法及Resnet网络进行模型训练,得到大田作物病害识别模型。
可选地,在一个实施例中,模型训练模块302,用于对样本图像数据集进行标签双线性插值和图像融合,得到样本图像训练集和样本图像测试集;基于样本图像训练集、样本图像测试集、加权dropout算法及Resnet网络进行模型训练,得到大田作物病害识别模型。
可选地,在一个实施例中,模型训练模块302,用于利用样本图像训练集及加权dropout算法训练Resnet网络,得到初始大田作物病害识别模型;利用样本图像测试集确定初始大田作物病害识别模型的错误率和/或损失值;当错误率小于错误率阈值和/或损失值小于损失值阈值时,确定初始大田作物病害识别模型为大田作物病害识别模型。
可选地,在一个实施例中,模型训练模块302,用于对Resnet网络进行双维度扩展,得到改进后的Resnet网络;基于原始大田作物病害图像、加权dropout算法及改进后的Resnet网络进行模型训练,得到大田作物病害识别模型。
图3提供的训练大田作物病害识别模型的装置中的各个模块具有实现图1所示实例中各个步骤的功能,并达到与图1所示训练大田作物病害识别模型的方法相同的技术效果,为简洁描述,在此不再赘述。
本发明实施例还提供一种基于大田作物病害识别模型的大田作物病害识别装置,大田作物病害识别模型为使用图1所示的训练大田作物病害识别模型的方法得到的模型,如图4所示,该基于大田作物病害识别模型的大田作物病害识别装置包括:
获取模块401,用于获取待识别图像;
输出模块402,用于将待识别图像输入大田作物病害识别模型,输出识别结果;其中,识别结果为待识别图像记录的场景中有或无大田作物病害。
图4提供的基于大田作物病害识别模型的大田作物病害识别装置中的各个模块具有实现图2所示实例中各个步骤的功能,并达到与图2所示基于大田作物病害识别模型的大田作物病害识别方法相同的技术效果,为简洁描述,在此不再赘述。
图5是本发明实施例提供的一种电子设备的结构示意图。
电子设备可以包括处理器501以及存储有计算机程序指令的存储器502。
具体地,上述处理器501可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本发明实施例的一个或多个集成电路。
存储器502可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器502可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器502可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器502可在综合网关容灾设备的内部或外部。在特定实施例中,存储器502是非易失性固态存储器。在特定实施例中,存储器502包括只读存储器(ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
处理器501通过读取并执行存储器502中存储的计算机程序指令,以实现图1所示的训练大田作物病害识别模型的方法或图2所示的基于大田作物病害识别模型的大田作物病害识别方法。
在一个示例中,电子设备还可包括通信接口503和总线510。其中,如图5所示,处理器501、存储器502、通信接口503通过总线510连接并完成相互间的通信。
通信接口503,主要用于实现本发明实施例中各模块、装置、单元和/或设备之间的通信。
总线510包括硬件、软件或两者,将在线数据流量计费设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线510可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。
另外,本发明实施例可提供一种计算机存储介质来实现。该计算机存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现图1所示的训练大田作物病害识别模型的方法或图2所示的基于大田作物病害识别模型的大田作物病害识别方法。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。

Claims (13)

1.一种训练大田作物病害识别模型的方法,其特征在于,包括:
获取原始大田作物病害图像;
基于所述原始大田作物病害图像、加权dropout算法及预设的Resnet网络进行模型训练,得到大田作物病害识别模型。
2.根据权利要求1所述的训练大田作物病害识别模型的方法,其特征在于,所述基于所述原始大田作物病害图像、加权dropout算法及预设的Resnet网络进行模型训练,得到大田作物病害识别模型,包括:
利用生成对抗网络对所述原始大田作物病害图像进行数据增强,得到样本图像数据集;
基于所述样本图像数据集、所述加权dropout算法及所述Resnet网络进行模型训练,得到所述大田作物病害识别模型。
3.根据权利要求2所述的训练大田作物病害识别模型的方法,其特征在于,所述基于所述样本图像数据集、所述加权dropout算法及所述Resnet网络进行模型训练,得到所述大田作物病害识别模型,包括:
对所述样本图像数据集进行标签双线性插值和图像融合,得到样本图像训练集和样本图像测试集;
基于所述样本图像训练集、所述样本图像测试集、所述加权dropout算法及所述Resnet网络进行模型训练,得到所述大田作物病害识别模型。
4.根据权利要求3所述的训练大田作物病害识别模型的方法,其特征在于,所述基于所述样本图像训练集、所述样本图像测试集、所述加权dropout算法及所述Resnet网络进行模型训练,得到所述大田作物病害识别模型,包括:
利用所述样本图像训练集及所述加权dropout算法训练所述Resnet网络,得到初始大田作物病害识别模型;
利用所述样本图像测试集确定所述初始大田作物病害识别模型的错误率和/或损失值;
当所述错误率小于错误率阈值和/或所述损失值小于损失值阈值时,确定所述初始大田作物病害识别模型为所述大田作物病害识别模型。
5.根据权利要求1所述的训练大田作物病害识别模型的方法,其特征在于,所述基于所述原始大田作物病害图像、加权dropout算法及预设的Resnet网络进行模型训练,得到大田作物病害识别模型,包括:
对所述Resnet网络进行双维度扩展,得到改进后的Resnet网络;
基于所述原始大田作物病害图像、所述加权dropout算法及所述改进后的Resnet网络进行模型训练,得到所述大田作物病害识别模型。
6.一种基于大田作物病害识别模型的大田作物病害识别方法,其特征在于,所述大田作物病害识别模型为使用权利要求1至5任一项所述的训练大田作物病害识别模型的方法得到的模型,包括:
获取待识别图像;
将所述待识别图像输入所述大田作物病害识别模型,输出识别结果;其中,所述识别结果为所述待识别图像记录的场景中有或无大田作物病害。
7.一种训练大田作物病害识别模型的装置,其特征在于,包括:
图像获取模块,用于获取原始大田作物病害图像;
模型训练模块,用于基于所述原始大田作物病害图像、加权dropout算法及预设的Resnet网络进行模型训练,得到大田作物病害识别模型。
8.根据权利要求7所述的训练大田作物病害识别模型的装置,其特征在于,所述模型训练模块,用于利用生成对抗网络对所述原始大田作物病害图像进行数据增强,得到样本图像数据集;基于所述样本图像数据集、所述加权dropout算法及所述Resnet网络进行模型训练,得到所述大田作物病害识别模型。
9.根据权利要求8所述的训练大田作物病害识别模型的装置,其特征在于,所述模型训练模块,用于对所述样本图像数据集进行标签双线性插值和图像融合,得到样本图像训练集和样本图像测试集;基于所述样本图像训练集、所述样本图像测试集、所述加权dropout算法及所述Resnet网络进行模型训练,得到所述大田作物病害识别模型。
10.根据权利要求9所述的训练大田作物病害识别模型的装置,其特征在于,所述模型训练模块,用于利用所述样本图像训练集及所述加权dropout算法训练所述Resnet网络,得到初始大田作物病害识别模型;利用所述样本图像测试集确定所述初始大田作物病害识别模型的错误率和/或损失值;当所述错误率小于错误率阈值和/或所述损失值小于损失值阈值时,确定所述初始大田作物病害识别模型为所述大田作物病害识别模型。
11.一种基于大田作物病害识别模型的大田作物病害识别装置,其特征在于,所述大田作物病害识别模型为使用权利要求1至5任一项所述的训练大田作物病害识别模型的方法得到的模型,包括:
获取模块,用于获取待识别图像;
输出模块,用于将所述待识别图像输入所述大田作物病害识别模型,输出识别结果;其中,所述识别结果为所述待识别图像记录的场景中有或无大田作物病害。
12.一种电子设备,其特征在于,所述电子设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如权利要求1-5任意一项所述的训练大田作物病害识别模型的方法;或如权利要求6所述的基于大田作物病害识别模型的大田作物病害识别方法。
13.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-5任意一项所述的训练大田作物病害识别模型的方法;或如权利要求6所述的基于大田作物病害识别模型的大田作物病害识别方法。
CN201911384204.9A 2019-12-28 2019-12-28 训练大田作物病害识别模型及大田作物病害识别的方法 Active CN113051983B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911384204.9A CN113051983B (zh) 2019-12-28 2019-12-28 训练大田作物病害识别模型及大田作物病害识别的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911384204.9A CN113051983B (zh) 2019-12-28 2019-12-28 训练大田作物病害识别模型及大田作物病害识别的方法

Publications (2)

Publication Number Publication Date
CN113051983A true CN113051983A (zh) 2021-06-29
CN113051983B CN113051983B (zh) 2022-08-23

Family

ID=76507100

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911384204.9A Active CN113051983B (zh) 2019-12-28 2019-12-28 训练大田作物病害识别模型及大田作物病害识别的方法

Country Status (1)

Country Link
CN (1) CN113051983B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114882442A (zh) * 2022-05-31 2022-08-09 广州信诚信息科技有限公司 一种基于电力作业现场的人员装备态势识别方法
CN116310846A (zh) * 2023-05-19 2023-06-23 成都大学 一种基于图像识别和数据挖掘的病虫害识别方法及系统
CN116863488A (zh) * 2023-09-04 2023-10-10 应辉环境科技服务(烟台)有限公司 一种网页验证码自动识别方法、计算设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6765855B1 (en) * 2000-02-16 2004-07-20 Renesas Technology Corp. Signal detection circuit for optical disk
CN106570477A (zh) * 2016-10-28 2017-04-19 中国科学院自动化研究所 基于深度学习的车型识别模型构建方法及车型识别方法
US20190130257A1 (en) * 2017-10-27 2019-05-02 Sentient Technologies (Barbados) Limited Beyond Shared Hierarchies: Deep Multitask Learning Through Soft Layer Ordering
CN109978067A (zh) * 2019-04-02 2019-07-05 北京市天元网络技术股份有限公司 一种基于卷积神经网络与尺度不变特征变换的商标检索方法以及装置
CN110059698A (zh) * 2019-04-30 2019-07-26 福州大学 用于街景理解的基于边缘稠密重建的语义分割方法及系统
CN110298321A (zh) * 2019-07-02 2019-10-01 中国科学院遥感与数字地球研究所 基于深度学习图像分类的道路阻断信息提取

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6765855B1 (en) * 2000-02-16 2004-07-20 Renesas Technology Corp. Signal detection circuit for optical disk
CN106570477A (zh) * 2016-10-28 2017-04-19 中国科学院自动化研究所 基于深度学习的车型识别模型构建方法及车型识别方法
US20190130257A1 (en) * 2017-10-27 2019-05-02 Sentient Technologies (Barbados) Limited Beyond Shared Hierarchies: Deep Multitask Learning Through Soft Layer Ordering
CN109978067A (zh) * 2019-04-02 2019-07-05 北京市天元网络技术股份有限公司 一种基于卷积神经网络与尺度不变特征变换的商标检索方法以及装置
CN110059698A (zh) * 2019-04-30 2019-07-26 福州大学 用于街景理解的基于边缘稠密重建的语义分割方法及系统
CN110298321A (zh) * 2019-07-02 2019-10-01 中国科学院遥感与数字地球研究所 基于深度学习图像分类的道路阻断信息提取

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
GUO JIAN 等: ""Depth Dropout: Efficient Training of Residual Convolutional Neural Networks"", 《 2016 INTERNATIONAL CONFERENCE ON DIGITAL IMAGE COMPUTING: TECHNIQUES AND APPLICATIONS》 *
张枫 等: ""基于残差网络与中心损失的人脸识别"", 《计算机工程与设计》 *
焦计晗 等: ""基于改进AlexNet模型的油菜种植面积遥感估测"", 《计算机测量与控制》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114882442A (zh) * 2022-05-31 2022-08-09 广州信诚信息科技有限公司 一种基于电力作业现场的人员装备态势识别方法
CN116310846A (zh) * 2023-05-19 2023-06-23 成都大学 一种基于图像识别和数据挖掘的病虫害识别方法及系统
CN116310846B (zh) * 2023-05-19 2023-08-29 成都大学 一种基于图像识别和数据挖掘的病虫害识别方法及系统
CN116863488A (zh) * 2023-09-04 2023-10-10 应辉环境科技服务(烟台)有限公司 一种网页验证码自动识别方法、计算设备及存储介质

Also Published As

Publication number Publication date
CN113051983B (zh) 2022-08-23

Similar Documents

Publication Publication Date Title
CN110378381B (zh) 物体检测方法、装置和计算机存储介质
CN108509978B (zh) 基于cnn的多级特征融合的多类目标检测方法及模型
Springenberg et al. Improving deep neural networks with probabilistic maxout units
CN113051983B (zh) 训练大田作物病害识别模型及大田作物病害识别的方法
CN111291809B (zh) 一种处理装置、方法及存储介质
CN112101363B (zh) 基于空洞残差和注意力机制的全卷积语义分割系统及方法
Liu et al. Multi-view self-constructing graph convolutional networks with adaptive class weighting loss for semantic segmentation
Cai et al. Fast mining of a network of coevolving time series
Al-Nima et al. Robustness and performance of deep reinforcement learning
Khaw et al. High‐density impulse noise detection and removal using deep convolutional neural network with particle swarm optimisation
Li et al. The effect of ground truth on performance evaluation of hyperspectral image classification
Li et al. Robust deep neural networks for road extraction from remote sensing images
CN115995042A (zh) 一种视频sar运动目标检测方法及装置
CN115376010A (zh) 一种高光谱遥感影像分类方法
Lee et al. Probing the purview of neural networks via gradient analysis
Dubey et al. An efficient adaptive feature selection with deep learning model-based paddy plant leaf disease classification
Rehman et al. A framework of deep optimal features selection for apple leaf diseases recognition
Baidar Rice crop classification and yield estimation using multi-temporal sentinel-2 data: a case study of terai districts of Nepal
CN117036941A (zh) 一种基于孪生Unet模型的建筑物变化检测方法及系统
Li et al. Enhanced Leaf Area Index Estimation With CROP-DualGAN Network
Zeng et al. Masanet: Multi-angle self-attention network for semantic segmentation of remote sensing images
CN116563285A (zh) 一种基于全神经网络的病灶特征识别与分割方法及系统
CN116189130A (zh) 基于图像标注模型的车道线分割方法及装置
Chen et al. Mapping urban form and land use with deep learning techniques: a case study of Dongguan City, China
Ebert-Uphoff et al. Evaluation, tuning and interpretation of neural networks for meteorological applications

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant