CN113177612B

CN113177612B - 一种基于cnn少样本的农业病虫害图像识别方法

Info

Publication number: CN113177612B
Application number: CN202110567724.4A
Authority: CN
Inventors: 赵冰辰; 戴浏; 温鑫; 俞少作; 鞠璇; 叶晨
Original assignee: Tongji University
Current assignee: Tongji University
Priority date: 2021-05-24
Filing date: 2021-05-24
Publication date: 2022-09-13
Anticipated expiration: 2041-05-24
Also published as: CN113177612A

Abstract

一种基于CNN少样本的农业病虫害图像识别方法，特征是：首先基于自监督学习方法和知识蒸馏技术提出了一种少样本分类方法，再通过导入农业病虫害的训练数据，实现对于病虫害图像的分类。

Description

一种基于CNN少样本的农业病虫害图像识别方法

技术领域

本发明涉及深度学习技术领域。

技术背景

近年来，深度学习技术发展迅猛，人们通过搭建神经网络、导入一定数量的数据集进行训练从而实现物体识别、物体分类等任务。特别是将卷积神经网络(CNN)用于图像分类任务中，模型通过对数据集较好的特征提取，已经到达了较高的准确度。

然而，目前将CNN网络用于农业病虫害识别时往往采用传统的监督学习训练方法，这要求用于训练的数据集需要达到一定的规模。在样本量较小的前提下，利用传统监督学习方法训练的模型往往会″过拟合″，即过分提取导入数据集的数据特征，而对于未知数据的识别能力较差，这导致其在真实任务中表现不佳。同时，考虑到农业病虫害方面的研究现状，目前所能建立的数据库往往规模较小，因此迫切地需要一种适用于少样本的病虫害图像识别技术。

另外，不同病虫害图像之间的差异往往非常细微，集中在某些局部特征上。因此，普通的图像分类技术也不能满足病虫害的识别要求，需要一种更精细的图像分类方法来满足病虫害分类任务的特性。

1)自监督学习方法

自监督学习(Self-Supervised Learning)是无监督学习的一个分支，用以改善监督学习中人工标签的高昂成本以及对人工标签依赖造成容易受攻击的特点，提升模型的表征性能和泛化能力。其核心定义为两个步骤过程：(1)通过″半自动″过程从数据本身获取″标签″；(2)用数据的其他部分信息预测数据的一部分信息。

2)知识蒸馏技术

知识蒸馏技术可以将一个网络的知识(teacher网络)转移到另一个网络(student网络)，其中，两个网络可以是同构或者异构。知识蒸馏技术的做法是先训练teacher网络，然后使用这个teacher网络输出和数据的真实标签对student网络进行训练。知识蒸馏可以用来将网络从大网络转化为一个小网络，并保留接近于大网络的性能；也可以将多个网络的学到的知识转移到一个网络中，使得单个网络的性能接近多个网络集合的结果。

3)细粒度图像分类任务

细粒度图像分类(Fine-grained image categorization)，又被称作子类别图像分类(Sub-category recognition)，是近年来计算机视觉、模式识别等领域一个非常热门的研究课题。其目的是对属于同一基础类别的图像(汽车、狗、花、鸟等)进行更加细致的子类划分，但由于子类别间细微的类间差异以及较大的类内差异，较之普通的图像分类任务，细粒度图像分类难度更大。

细粒度图像的类别精度更加细致，类间差异更加细微，往往只能借助于微小的局部差异才能区分出不同的类别。绝大多数细粒度图像分类算法的流程框架为：首先找到前景对象及其局部区域，之后分别对这些区域提取特征。对所得到的特征进行适当的处理之后，用来完成分类器的训练和预测。完成图像细粒度分类有两个关键点：

①细粒度图像的信噪比很小，包含足够区分度的信息往往只存在于很细小的局部区域中，如何找到并有效利用这些有用的局部区域信息，成为了决定细粒度图像分类算法成功与否的关键所在。

②特征的提取也是决定图像分类准确性的关键因素。根据细粒度图像分类算法的特征，其使用的方法主要有基于人工特征的早期算法、深度卷积网络、强监督的细粒度图像分类、弱监督的细粒度图像分类几种。

实际上，由于不同病虫害图像之间的差别很小，因此针对农业病虫害图像分类的任务就是一种细粒度图像分类任务。

目前，业界往往采用一些传统监督学习方法下的卷积神经网络模型来完成农业病虫害识别任务。采用例如LeNet、GoogleNet等网络进行训练。

最接近现有技术

以一种基于LeNet网络的病虫害图像识别模型为例，该模型使用Keras框架实现。主要实现流程如图1所示。

现有技术可改进点

正如其他监督学习下的卷积神经网络模型，以上所介绍的方法均需要较大的数据集进行训练。在较小数据集下，模型容易出现″过拟合″现象：面对未知的图像数据，模型的识别结果将大大降低，无法在实用中达到可用的地步。

同时，该分类方法为传统的图像分类方法，只能较好地区分不同的″主类别″(例如区分小麦和水稻)，但对于同一主类别下的病虫害″子类别〞(例如区分水稻条纹叶枯病和水稻东格鲁病毒病)的区分效果较差，不能满足农业病虫害图像分类任务的实际需求。

发明内容

基于以上所述的现状，″一种基于CNN少样本的农业病虫害图像识别方案〞随之诞生。该方案结合自监督学习方法和知识蒸馏技术，实现了少样本下较高性能分类模型的训练，并且针对细粒度图像分类任务，具有较高的性能。利用这一技术，我们在样本规模较小、不对样本数据进行标注的前提下，改善了″过拟合″问题，实现了相比其他模型更高的识别率，并简化了数据准备过程。同时，针对农业病虫害图像识别的实际应用场景，本方案由于对数据特征的提取准确度较高，因此能够满足病虫害图像分类的需求。

现有的传统CNN图像分类方法没有较好地解决少样本下模型″过拟合″问题，并且也无法达到对于病虫害图像分类的″细微区分″。这是本发明方案所解决的痛点。本发明方案通过将自监督学习训练方法和蒸馏技术相结合，相比其他模型，提高了少样本分类任务的识别率，实现了对于农业病虫害图像的较精准识别。

技术方案

少样本分类方法，包括两阶段流水线，该流水线利用自监督学习和知识蒸馏来提高CNN模型在少样本下对于图像分类任务的泛化能力：第一阶段是通过自监督学习来学习具有丰富且可概括的视觉表示形式的教师(teacher)模型，第二阶段是通过知识蒸馏将表示形式提取为学生(student)模型，并对其进行微调；

少样本分类方法还为自监督学习中的对比学习训练提出了一种新颖的损失度计算方法，以进一步提升在少样本前提下的分类能力。

基于这样的少样本分类方法，本方案向模型导入农业病虫害图像数据作为训练数据，实现了对于农业病虫害的高性能少样本图像分类任务。

本技术方案优势

本方案最终可以在少样本农业病虫害图像分类领域中，达到以下两种效果：

1、在少样本数据集下改善″过拟合″问题，提高识别准确度

2、针对农业病虫害此类″细粒度图像分类任务″，有较高的性能表现

综上，本方案对少样本农业病虫害图像分类任务的推进有着极大的有益效果。

附图说明

图1为传统的LeNet网络处理农业病虫害图像分类任务。

图2为结合自监督学习和知识蒸馏技术的少样本分类方法。

图3为本方案得出的农业病虫害图像识别模型的准确率。

图4为训练所使用的农业病虫害数据库的部分截图。

具体实施方式

以下结合附图对本发明技术方案做详细说明。

实施例1

该流程为图2表示。

一、少样本分类方法

本方法提出的模型训练分为两个阶段：

第一阶段是通过自我监督对比学习构建一个有效视觉先验，从而用于进一步的超视觉先验训练。

第二阶段是使用第一阶段获取到的权重初始化teacher模型和student模型，teacher模型权重保持不变，而student模型使用classication loss和overhaul-feature-distillation(OFD)loss在预先训练好的检查点上进行自蒸馏，从而进一步对模型进行分类调整。

模型第一阶段借鉴近期发表^[1]的MoCo v2方法，在原有损失函数中增加一个余量系数m，如(2)式所示，从而帮助模型在不良样本集上获得与其他样本集相似的结果。

原始MoCo模型中使用的损失函数如(1)式所示。

加入余量系数m以后，L_margin为最终的损失函数。

模型第二阶段使用第一个阶段自我监督训练得到的检查点进行初始化teacher模型和student模型的权重，随后使用OFD提炼teacher模型和student模型的视觉前沿，蒸馏损失定义为(3)式：

其中Ft和Fs分别为teacher模型特征和student模型特征，StopGrad代表teacher模型的权重不会通过梯度下降进行更新，d_p为距离向量，r为将特征由student模型转为teacher模型的连接函数。

模型评估中，第二阶段的模型损失计算公式为：

其中，L_ce定义为：

二、将少样本分类方法用于细粒度农业病虫害图像分类任务，并进行效果验证

基于以上提出的少样本分类方法，本方案导入了农业病虫害的少样本数据图像，将其应用于病虫害图像识别任务中。

选自Kaggle、CVPR和天池数据挑战赛等渠道汇总了约50000张农业病虫害图像数据(如图4所示)，共覆盖10种作物、27种病害、61类严重程度，其中平均每一类的数据均在1000张以下，符合″少样本″的标准。

如图3所示，经过训练，最终的模型识别率约为88.5％。

通过估计student模型的损失，实验表明本方法可以有效在少样本的情况下训练出良好效果。通过结合其他的一些技巧，本方法在VIPrior提供的lmageNet数据集下取得了理想的成果。

表1

表1展示了该方法训练出的模型(最后一行)相比其他模型的准确率提高情况。

参考文献：

[1]He，K.，Fan，H.，Wu，Y.，Xie，S.，Girshick，R.：Momentum contrast forunsupervised visual representation learnning.In：2020IEEE/CVF Conference onComputer Vision and Pattern Recognition.pp.9729{9738(2020)

Claims

1.一种基于CNN少样本的农业病虫害图像识别方法，特征是：首先基于自监督学习方法和知识蒸馏技术提出了一种少样本分类方法，再通过导入农业病虫害的训练数据，实现对于病虫害图像的分类；

特征是：少样本分类方法，包括两阶段流水线，该流水线利用自监督学习和知识蒸馏来提高CNN模型在少样本下对于图像分类任务的泛化能力：第一阶段是通过自监督学习来学习具有丰富且可概括的视觉表示形式的教师(teacher)模型，第二阶段是通过知识蒸馏将表示形式提取为学生(student)模型，并对其进行微调；

少样本分类方法还为自监督学习中的对比学习训练提出了一种新颖的损失度计算方法，以进一步提升在少样本前提下的分类能力；特征是：模型第二阶段使用第一个阶段自我监督训练得到的检查点进行初始化teacher模型和student模型的权重，随后使用OFD提炼teacher模型和student模型的视觉前沿，蒸馏损失定义为(3)式：

其中F_t和F_S分别为teacher模型特征和student模型特征，StopGrad代表teacher模型的权重不会通过梯度下降进行更新，d_p为距离向量，r为将特征由student模型转为teacher模型的连接函数；特征是：基于少样本分类方法，向模型导入农业病虫害图像数据作为训练数据，实现了对于农业病虫害的高性能少样本图像分类任务；特征是：损失度计算，包括原始MoCo模型中使用的损失函数如(1)式所示：

还包括加入余量系数m以后的L_margin的损失函数：

模型评估中，第二阶段的模型损失计算公式为：

其中，L_ce定义为：