CN115131627B

CN115131627B - 一种轻量化植物病虫害目标检测模型的构建和训练方法

Info

Publication number: CN115131627B
Application number: CN202210769212.0A
Authority: CN
Inventors: 王崎; 黄前顶; 丁慧敏; 吴雪; 陈玉玲
Original assignee: Guizhou University
Current assignee: Guizhou University
Priority date: 2022-07-01
Filing date: 2022-07-01
Publication date: 2024-02-20
Anticipated expiration: 2042-07-01
Also published as: CN115131627A

Abstract

本发明公开了一种轻量化植物病虫害目标检测模型的构建和训练方法，包括：S1数据集增强，S2搭建知识提取模块，S3嵌入知识提取模块，S4训练教师模型和生成数据集，S5搭建学生模型，S6准备蒸馏训练，S7计算蒸馏损失，将S1和S4中生成的数据集整合作为训练数据，将学生模型检测头的输出与标签传入S5中的损失函数，求这部分损失与S7中的蒸馏损失加权和，以此进行反向传播和参数更新，当模型指标达预期时停止训练，否则返回S8。本发明训练时间短、训练算力要求低、数据利用率高、知识迁移针对性强和适合植物病虫害目标检测任务。

Description

一种轻量化植物病虫害目标检测模型的构建和训练方法

技术领域

本发明属于计算机视觉技术领域，具体来说是涉及一种基于知识蒸馏的轻量化植物病虫害目标检测模型的构建和训练方法。

背景技术

植物病虫害治理是农业生产中的重要一环，及时发现植物病虫害能够大大提升治理效果，同时能显著降低治理成本。传统的植物病虫害检测方法主要依靠人工检测，这种方法具有主观性，而且需要检测者具备较高的专业知识和丰富的经验。

随着人工智能和计算机视觉技术的发展，许多解决方案被提出，其中最主流的方法之一是利用计算机视觉中的分类及目标检测任务对植物病虫害进行检测。现有的视觉分类任务在充足的标注样本下能够获得较高的检测精度，但由于分类模型自身的局限性难以在大规模农田中应用。此外，对于现有的使用目标检测对植物病虫害进行识别的模型而言，模型的参数量较大，检测精度和时间互逆，并且对硬件性能要求比较高。虽然目标检测相比分类更具实践难度，但更符合现实农业生产环境的要求。

近年来虽然有许多公共植物病虫害图像数据集问世，但适用于植物病虫害检测的图像量很小，而且仅涉及较少的植物病虫害类别。同时，大部分性能强大的目标检测模型，仅适用于PC端设备，当运用在移动设备上时其性能将大幅降低。在移动设备上难以实现实时目标检测的原因是检测模型无法将海量的参数部署到移动设备中。因此，为解决上述问题，中国专利公开号CN 110826344A于2022年3月1日公开了一种神经网络模型压缩方法、语料翻译方法及其装置，其教师模型与学生模型使用相同的数据集A，教师模型使用数据集A的源数据与目标数据(标签)，学生模型只使用数据集A的源数据，而不使用目标数据(标签)，转而使用教师模型的输出作为目标数据(标签)，即教师模型和学生模型使用相同的数据集数据，教师模型使用数据集的标签进行训练，学生模型使用教师模型的输出作为标签进行训练。由于没能利用数据集A的目标标签，造成了数据浪费。因为学生模型只使用教师模型的输出作为标签进行学习，即学生模型以教师模型的输出作为拟合目标，这使得教师模型的性能上限决定了学生模型的性能上限。这样做降低了学生模型通过数据能够学习得到的知识的上限。且使用的多级教师模型蒸馏方法过于复杂，训练周期过长，训练同等规模的目标模型其需要的算力资源过大。由于使用多级教师，即教师之间存在一定的依赖关系，也不利于后期改进。中国专利公开号CN 113850012A于2021年12月28日公开的一种数据处理模型生成方法、装置、介质及电子设备，其通过数据增强，得到两份样本数据，分别用于教师模型和学生模型的训练，其中，教师模型和学生模型都由相似的两部分结构组成，这两部分结构是主干特征提取网络A于预测网络连接的网络和主干特征提取网络B，其中主干特征提取网络A和主干特征提取网络B是孪生网络(结构相同，共享权重)，换句话说，学生和教师由一对孪生网络和预测网络组成。教师的输出作为学生的训练目标。学生的两部分结构也会进行蒸馏训练。可以理解为学生会进行自蒸馏训练和教师-学生蒸馏训练。由于直接利用预测网络和主干特征提取网络的输出作为训练目标进行学习，学习的方位宽泛，但也一次缺乏针对性，难以对特定知识进行学习。由于将预测网络的输出作为训练目标，该发明能应用于所有的分类任务，但由于目标检测的输出有定位和分类信息，需要考虑空间位置关系，导致该发明不能直接应用于目标检测任务。

发明内容

本发明的目的在于克服上述缺点而提供的一种训练时间短、训练算力要求低、数据利用率高、知识迁移针对性强和适合植物病虫害目标检测任务的轻量化植物病虫害目标检测模型的构建和训练方法。

本发明提出的一种轻量化植物病虫害目标检测模型的构建和训练方法，包括以下步骤：

S1数据集增强：整合现有数据集，进行数据增强；

S2搭建知识提取模块：搭建用于从特征图中提取知识的模块；

S3嵌入知识提取模块：将检测精度优秀的目标检测模型作为知识蒸馏所需的教师模型，将S2中提取知识模块预置于教师模型的颈部输出部分，即检测头与模型颈部之间；

S4训练教师模型和生成数据集：利用教师模型生成植物病虫害分类数据集的目标检测标签；

S5搭建学生模型：将教师模型的颈部和检测头(包含参数)嫁接给学生模型；在学生模型的检测头与颈部之间预置S2中提取知识模块，构建学生模型检测输出与标签的损失函数，固定学生模型的检测头；

S6准备蒸馏训练：固定教师模型参数，开启预置S2中提取知识模块，构建以在S2与S5中预置提取知识模块提取到的知识为输入的损失函数；

S7计算蒸馏损失：将S3和S5中预置的提取知识模块提取到的教师模型和学生模型的非检测头知识传入S6中的损失函数，计算蒸馏损失；

S8计算总损失及反向传播：将S1和S4中生成的数据集整合作为训练数据，将学生模型检测头的输出与标签传入S5中的损失函数，求这部分损失与S7中的蒸馏损失加权和，以此进行反向传播和参数更新，当模型指标达预期时停止训练，否则返回S8。

上述的一种轻量化植物病虫害目标检测模型的构建和训练方法，其中S2搭建知识提取模块的方法包括：对特征图进行通道平均、再乘以宽高即可获取空间注意力掩码搭建空间注意力提取模块，对特征图进行宽高平均、再乘以通道数即可获取通道注意力掩码搭建通道注意力提取模块，和利用标签定位区分前背景生成“01”二值掩码搭建分离前背景模块，分别提取空间注意力、通道注意力特征知识和分离前景与背景，利用标签计算每一个目标对应的负面积因子即目标所占面积的倒数，再为特征图的每一个特征点乘以特征点对应目标的负面积因子搭建消除目标面积影响的模块消除前景个体面积的影响。

上述的一种轻量化植物病虫害目标检测模型的构建和训练方法，其中S3嵌入知识提取模块的方法为：在教师模型的颈部输出部分接入S2中搭建的各个模块，当进行蒸馏训练时，教师模型的前向传播只进行到颈部，教师模型与学生模型颈部的特征图传入知识提取模块，继而计算蒸馏损失。

上述的一种轻量化植物病虫害目标检测模型的构建和训练方法，其中S4训练教师模型和生成数据集的方法为：利用S1中整合增强的数据集训练教师模型，数据集为其前向传播过程提供最初输入，从主干特征提取网络传递到颈部网络，最后到头部与数据集提供的标签计算训练损失，待训练完成后，利用教师模型对植物病虫害分类数据集进行检测，将检测结果转换为目标检测标签，由此生成新的检测数据集。

上述的一种轻量化植物病虫害目标检测模型的构建和训练方法，其中S5搭建学生模型：考虑轻量化的模块构建主干特征提取网络，嫁接教师模型的颈部和头部网络来搭建学生模型，学生模型复制教师模型的颈部和头部的参数，并固定头部网络的参数，在学生模型颈部的输出部分接入S2中搭建的模块。

上述的一种轻量化植物病虫害目标检测模型的构建和训练方法，其中S6准备蒸馏训练：固定教师模型参数，截断教师模型颈部到头部的输出，开启在S3中接入的知识提取模块。

本发明与现有技术相比，具有明显的有益效果，从以上技术方案可知：本发明利用教师模型和适用于分类任务的数据集生成使用与目标检测数据集，并将其应用于目标模型的训练，利用了现有数据，有效扩展了训练数据。在学生模型(目标模型)迁移了教师模型的检测头和颈部网络，使得学生模型具有与教师模型相近的检测精度上限。原始图片经过主干特征提取网络和颈部网络的变换为感兴趣区域明显的特征图，这些特征图能够有效引导检测头去关注感兴趣的目标。对主干特征提取网络进行蒸馏训练，使得目标模型的主干特征提取网络能够输出与教师模型的主干特征提取网络输出的特征图的感兴趣区域相似。

本发明将大模型知识迁移到小模型进行简化，聚焦于迁移主干特征提取网络的知识迁移。由于主干特征提取网络的输出是特征图，对其进行蒸馏训练难度低，并且可进行针对性知识蒸馏。搭建知识提取模块从特征图中针对性地获取知识，由此可实现针对性的知识蒸馏，后续可以通过知识提取模块改进蒸馏效果从而提升模型训练效果。除通过对教师模型的主干特征提取网络进行知识蒸馏的方式获取知识外，也利用标签进行学习，这使得目标模型性能的下限有了保障。综上所述，本发明所需材料易获得，操作简单，用该方法构建的模型可以部署在移动设备上并取得不错的检测效果。具有训练时间短、训练算力要求低、数据利用率高、知识迁移针对性强和适合植物病虫害目标检测任务的优势。

附图说明

图1是本发明的流程示意图；

图2是本发明实施例中教师模型的结构图示意图；

图3是本发明实施例中特征知识提取模块中的全局信息提取模块；

图4是本发明实施例中特征知识提取模块中的空间注意力提取模块；

图5是本发明实施例中特征知识提取模块中的通道注意力提取模块；

图6是本发明实施例中特征知识提取模块中的分离前背景模块；

图7是本发明实施例中特征知识提取模块中的消除目标面积影响模块；

图8是本发明实施例中的学生模型(目标网络)的结构示意图；

图9是本发明实施例中的学生模型的主干特征提取网络的结构示意图；

图10是本发明的学生模型主干特征提取网络“复杂版核心主干”模块的具体结构图；

图11是本发明的学生模型主干特征提取网络“简单版核心主干”模块的具体结构图；

图12是本实施例中的教师模型训练前向传播示意图；

图13是本实施例中蒸馏训练的前向传播示意图。

具体实施方式

以下结合附图及较佳实施例，对依据本发明提出的一种基于知识蒸馏的轻量化植物病虫害目标检测模型的构建和训练方法具体实施方式、结构、特征及其功效，详细说明如后。

实施例1：

参考图1，一种基于知识蒸馏的轻量化植物病虫害目标检测模型的构建和训练方法，包括以下步骤：

S1数据集增强:整合PlantDoc数据集和Northern Leaf Blight数据集，并使用yolov4中提出的Mosaic数据增强方式进行数据增强；

S2搭建知识提取模块：搭建全局信息提取模块(如图3，由卷积、激活函数、归一化方法、矩阵乘法运算和算数加法运算构成)提取教师模型和学生模型颈部输出的特征图的全局特征知识，搭建空间注意力提取模块(如图4，先对特征图进行通道平均，再乘以宽高即可获取空间注意力掩码)、通道注意力提取模块(如图5，先对特征图进行宽高平均，再乘以通道数即可获取通道注意力掩码)和分离前背景模块(如图6，利用标签定位区分前背景生成“01”二值掩码)分别提取空间注意力、通道注意力特征知识和分离前景与背景，搭建消除目标面积影响的模块(如图7，利用标签计算每一个目标对应的负面积因子即目标所占面积的倒数，再为特征图的每一个特征点乘以特征点对应目标的负面积因子)消除前景个体面积的影响；

S3：采取改进yolor模型的方式搭建教师模型(如图2，yolor模型的网络架构)，在改进的yolor的颈部(单阶段目标检测模型的结构可划分为主干特征提取网络、颈部网络和头部网络，其中颈部主要是是主干特征提取网络提取的特征能够适应头部网络)输出部分接入S2中搭建的各个模块(参见图13，教师模型的前向传播仅进行到颈部，教师模型与学生模型颈部传入知识提取模块，继而计算蒸馏损失，同时利用学生模型头部输出与标签计算训练损失，再利用两者的加权和进行训练)。

S4：利用S1中整合增强的数据集和Adam优化算法训练教师模型，其前向传播过程如图12，数据集提供最初输入，从主干特征提取网络传递到颈部网络，最后到头部与数据集提供的标签计算训练损失，待训练完成后，利用教师模型对Plant-Village数据集进行检测，将检测结果转换为标签，由此生出了一个新的检测数据集；

S5：搭建学生模型(如图8，基于MobileNetV3的模块构建主干特征提取网络，嫁接yolor的颈部和头部网络)，其主干特征提取网络MobileDoubleNet(如图9，该网络提供多级特征)基于MobileNetv3的复杂版核心模块(如图10，各子模块均来自于MobileNetV3)和简单版核心模块(如图11,其子模块与图10中的相同)，迁移训练好的教师模型的颈部和头部结构作为学生模型的颈部和头部网络，并固定头部网络的参数，在学生模型颈部的输出部分接入S2中搭建的模块，将教师模型的损失函数测输出作为学生模型检与标签的损失函数；

S5中提到的教师模型的损失函数：

其中，yolor头部将输入特征图分划分K×K个网格，当真的有(即标签指出有)目标的中心落在第i个网格时为1否则为0，Ci表是第i个网格含有目标的概率的标签值，/>表是第i个网格含有目标的概率的预测值，p_i(c)为第i个网格所含目标为c类的概率的标签值所组成的向量(含有目标时为独热向量，不含目标为零向量)，/>为第i个网格所负责预测的目标为c类的概率的标签值所组成的向量，classes为全部类别的集合。

S6：固定教师模型参数，截断教师模型颈部到头部的输出，开启在S3中接入的模块即在S2中提取知识模块，构建以在S2与S5中预置的知识提取模块提取到的知识的损失函数；

S6中的损失函数包含三个部分，其一为特征损失函数，该函数关注教师模型和学生模型在空间、通道和目标面积的差异，函数公式如下：

其中和/>代表教师模型和学生模型在原始图像的宽高维度上的某个特征点，M_i，j、S_i，j、/>和/>分别代表/>分别经过分离前背景模块、消除目标面积影响的模块、空间注意力提取模块和通道注意力提取模块的输出，即提取到的特征知识，α和β为权重参数。

S6中的损失函数包含三个部分中的第二部分为注意力损失函数，该函数关注教师模型和学生模型的空间和通道注意力差异，函数公式如下：

其中γ为权重参数，l₁代表L₁损失函数即l₁(A，B)＝∑|A_B_i|，和/>代表教师模型颈部特征经过空间注意力提取模块和通道注意力提取模块的输出，即教师模型的空间注意力知识和通道注意力知识，/>和/>代表学生模型颈部特征经过空间注意力提取模块和通道注意力提取模块的输出，即学生模型的空间注意力知识和通道注意力知识。

S6中的损失函数包含三个部分中的第三部分为全局语义损失，该函数关注教师模型与学生模型的全局语义差异，函数公式如下：

L_global＝λ∑(GCB(FT)-GCB(FS))²

其中λ是权重参数，GCB(F^T)和GCB(F^S)代表教师模型和学生模型的颈部输出的特征图经过全局信息提取模块后的输出。

S7：将S3和S5中预置的知识提取模块提取教师模型和学生模型非检测头的知识(即S2中设计的模块的输出)传入S6中设计的损失函数，计算蒸馏损失；

S7中的蒸馏损失计算公式：L_distillation＝L_global+L_attention+L_feature

S8：将学生模型检测头的输出与标签传入S5中设计的损失函数，求这部分损失与S7中的蒸馏损失加权和即总损失L_total，如图13，以此进行反向传播以进行蒸馏训练；

S8中总损失：L_total＝L_distillation+ηL_head

其中η为权重参数。

模型参数更新方法采用SGD优化算法，公式如下：

其中θ代表模型参数，l_r代表学习率，代表第i个样本对于的总损失，共m个样本。

本发明所构建的主干特征提取网络是一种基于轻量而且性能强大的深度卷积神经网络模型以适应检测头和轻量紧凑为目标改进的性能更加强大的模型，这将有利于将模型部署的移动终端等性能有限的设备上，有利于真正广泛地应用与农业生产中；同时搭配知识蒸馏方法在显著简化主干特征提取网络的同时使模型能够具备较好的性能，蒸馏的知识由知识提取模块提取，这有将便于进一步改进模型；再配合本发明提出的数据扩充方法，高效利用现有数据，更好地优化模型。

以上所述，仅是本发明的较佳实施例而已，并非对本发明作任何形式上的限制，任何未脱离本发明技术方案内容，依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰，均仍属于本发明技术方案的范围内。

Claims

1.一种轻量化植物病虫害目标检测模型的构建和训练方法，包括以下步骤：

S1数据集增强：整合PlantDoc数据集和Northern Leaf Blight数据集，进行数据增强；

S2搭建知识提取模块：搭建用于从特征图中提取知识的模块，其中S2搭建知识提取模块的方法包括：对特征图进行通道平均、再乘以宽高即可获取空间注意力掩码搭建空间注意力提取模块，对特征图进行宽高平均、再乘以通道数即可获取通道注意力掩码搭建通道注意力提取模块，和利用标签定位区分前背景生成“01”二值掩码搭建分离前背景模块，分别提取空间注意力、通道注意力特征知识和分离前景与背景，利用标签计算每一个目标对应的负面积因子即目标所占面积的倒数，再为特征图的每一个特征点乘以特征点对应目标的负面积因子搭建消除目标面积影响的模块消除前景个体面积的影响；

S3嵌入知识提取模块：将检测精度优秀的目标检测模型作为知识蒸馏所需的教师模型，将S2中提取知识模块预置于教师模型的颈部输出部分；

S5搭建学生模型：在学生模型的颈部输出部分预置S2中的提取知识模块，嫁接教师模型的颈部与检测头给学生模型，构建学生模型检测输出与标签的损失函数，固定学生模型的检测头；

2.如权利要求1所述的一种轻量化植物病虫害目标检测模型的构建和训练方法，其中S3嵌入知识提取模块的方法为：在教师模型的颈部输出部分接入S2中搭建的各个模块，当进行蒸馏训练时，教师模型的前向传播只进行到颈部，教师模型与学生模型颈部的特征图传入知识提取模块，继而计算蒸馏损失。

3.如权利要求1所述的一种轻量化植物病虫害目标检测模型的构建和训练方法，其中S4训练教师模型和生成数据集的方法为：利用S1中整合增强的数据集训练教师模型，数据集为其前向传播过程提供最初输入，从主干特征提取网络传递到颈部网络，最后到头部与数据集提供的标签计算训练损失，待训练完成后，利用教师模型对植物病虫害分类数据集进行检测，将检测结果转换为目标检测标签，由此生成新的检测数据集。

4.如权利要求1所述的一种轻量化植物病虫害目标检测模型的构建和训练方法，其中S5搭建学生模型：考虑轻量化的模块构建主干特征提取网络，嫁接教师模型的颈部和头部网络来搭建学生模型，学生模型复制教师模型的颈部和头部的参数，并固定头部网络的参数，在学生模型颈部的输出部分接入S2中搭建的模块。

5.如权利要求1所述的一种轻量化植物病虫害目标检测模型的构建和训练方法，其中S6准备蒸馏训练：固定教师模型参数，截断教师模型颈部到头部的输出，开启在S3中接入的知识提取模块。