CN115620146A

CN115620146A - 一种基于Transformer的农作物叶片病害检测方法

Info

Publication number: CN115620146A
Application number: CN202211385848.1A
Authority: CN
Inventors: 朱节中; 黄凤星; 杨再强; 余晓栋
Original assignee: Wuxi University
Current assignee: Wuxi University
Priority date: 2022-11-07
Filing date: 2022-11-07
Publication date: 2023-01-17

Abstract

本发明公开了一种基于Transformer的农作物叶片病害检测方法，涉及农作物病害检测技术领域，包括以下步骤：S1、获取n幅用于模型训练的农作物叶片图像；S2、构建初始的叶片病害检测模型；S3、利用样本集训练初始的叶片病害检测模型，从而得到训练完成的叶片病害检测模型；S4、利用训练完成的叶片病害检测模型对待检测的农作物叶片图像进行检测，得到农作物叶片图像中农作物叶片病害检测结果。本发明模型采用编码器和解码器结构，编码器主要采用Transformer完成特征的提取工作，相较于传统的卷积神经网络速度更快，参数量更少；在解码器中，利用Transformer输出特征图进行特征融合的部分采用通道注意力机制，能够很好的减少模型参数量同时不会使性能下降。

Description

一种基于Transformer的农作物叶片病害检测方法

技术领域

本发明涉及农作物病害检测技术领域，更具体地，涉及一种基于Transformer的农作物叶片病害检测方法。

背景技术

在农作物生长过程中，常常会因为天气、微生物、生长环境等因素的影响而感染各种病害。这些病害常发生于植株的茎秆和叶片部分，其中叶片部分的病害特征最为明显且影响最为严重。由于病斑影响了农作物叶片的光合作用导致生长缓慢甚至落叶，从而影响农作物产量。

目前最常见的农作物病害检测方法，农民们根据自己多年的种植经验来判断农作物是否发生了病害，分辨出病害种类以及病害的程度，并根据自己的判断来对其采取相应的防治措施。在农作物种植面积较广的情况下，人工方式很难进行大规模的农作物病害监控，通过人为方式来识别病害是不切实际的，且这种识别方式覆盖面较小，其准确性难以得到保障。而常见的基于深度学习的农作物检测方法通常依赖于卷积神经网络，对硬件的计算性能要求较高，无法很好的满足边缘设备的部署需求。

现有技术公开了一种基于卷积神经网络的苹果树干病害识别与分类方法，该方法利用深度学习的VGG模型进行苹果树干病害检测节约人力，但模型参数量和计算量较高，因此检测速度较慢。

为此，结合以上需求和现有技术中对硬件的计算性能要求较高、检测速度较慢的技术缺陷，本申请提出了一种基于Transformer的农作物叶片病害检测方法。

发明内容

本发明提供了一种基于Transformer的农作物叶片病害检测方法，能够在使用参数量更少的条件下达成更快的病害检测速度。

本发明的首要目的是为解决上述技术问题，本发明的技术方案如下：

本发明第一方面提供了一种基于Transformer的农作物叶片病害检测方法，本方法包括以下步骤：

S1、获取n幅用于模型训练的农作物叶片图像，标记农作物叶片图像中的病害区域，得到完成标记的农作物叶片图像的样本集。

S2、构建初始的叶片病害检测模型，所述初始的叶片病害检测模型包括编码器和解码器，编码器采用Transformer结构进行高层特征提取，解码器采用通道注意力机制对编码器Transformer输出特征图进行特征融合。

S3、利用步骤S1的样本集训练初始的叶片病害检测模型，从而得到训练完成的叶片病害检测模型。

S4、利用训练完成的叶片病害检测模型对待检测的农作物叶片图像进行检测，得到农作物叶片图像中农作物叶片病害检测结果。

进一步的，步骤S1中获取所述标记农作物叶片图像的方法具体为：

S11、获取n幅用于模型训练的农作物叶片图像，其中农作物叶片图像具有RGB三个通道；所述农作物叶片图像包括健康叶片的农作物叶片图像和病害叶片的农作物叶片图像。

S12、标记每一幅病害叶片农作物叶片图像中的病害区域和病害区域的病害类型，标记每一幅健康叶片农作物叶片图像中的健康叶片，根据所述标记数据导出掩码图像，每一幅所述农作物叶片图像对应一幅掩码图像；其中掩码图像和农作物叶片图像长宽相同，掩码图像为单通道的灰度图，掩码图像中每个像素点均对应有病害类型或健康叶片的标签。

进一步的，步骤S2所述叶片病害检测模型的编码器包括：输入层、卷积层和Transformer层，具体为：

输入层输入农作物叶片图像，并将农作物叶片图像传输到第一卷积层；农作物叶片图像的尺寸为H×W×3，其中，H和W分别为农作物叶片图像的长宽，3表示农作物叶片图像具有RGB三个通道。

农作物叶片图像经过第一卷积层，得到第一编码特征图，第一编码特征图的尺寸为H×W×24。

第一编码特征图首先输入池化层进行池化处理，然后经过第二卷积层处理后得到第二编码特征图，第二编码特征图的尺寸为

农作物叶片图像经过池化层进行四倍下采样处理，然后输入第一Transformer层得到第三编码特征图，第三编码特征图尺寸为

第三编码特征图输入第二Transformer层得到第四编码特征图，第四编码特征图尺寸为

第四编码特征图输入第三Transformer层得到第五编码特征图，第五编码特征图尺寸为

第五编码特征图输入第四Transformer层得到第六编码特征图，第六编码特征图尺寸为

进一步的，所述第一Transformer层、第二Transformer层、第三Transformer层和第四Transformer层的具体结构为：

所述第一Transformer层包括：池化层、区块划分操作模块、线性编码操作模块和Transformer Block；农作物叶片图像依次经过池化层、区块划分操作模块、线性编码操作模块和Transformer Block得到第三编码特征图。

其中，区块划分就是将图片划分为几个部分。

第二Transformer层、第三Transformer层和第四Transformer层均为下采样操作模块和Transformer Block依次连接。

其中，所述Transformer层中的下采样操作模块均是将编码特征图划分为

四个区域，然后在深度方向进行拼接变成[0,1,2,3]，再经过线性变换变成[4,5]。

其中，所述下采样流程能够减少模型的参数量。

进一步的，所述Transformer Block具体包括：LN层归一化模块、窗口多头注意力模块、MLP多层感知机、滑动窗口多头注意力模块和跳跃连接模块。

其中，所述LN层归一化模块、窗口多头注意力模块和跳跃连接模块依次连接；接下来LN层归一化模块、MLP多层感知机和跳跃连接模块依次连接；接下来LN层归一化模块、滑动窗口多头注意力模块和跳跃连接模块依次连接；最后LN层归一化模块、MLP多层感知机和跳跃连接模块依次连接。

进一步的，所述卷积层包括两个卷积核，其中卷积核大小为3×3，卷积核步长为1，卷积核Padding为1、卷积核Mish激活函数为Mish＝x×tanh(ln(1+e^x))。

进一步的，步骤S2中所述叶片病害检测模型的解码器包括：卷积核、通道注意力模块和空间注意力模块，具体包括：

第六编码特征图输入解码器的第一层，经过1×1的卷积核后与第五编码特征图进行拼接融合，然后经过3×3的卷积核和通道注意力模块，输出大小为

的第一解码特征图。

第一解码特征图输入解码器的第二层，经过1×1的卷积核后与第四编码特征图进行拼接融合，然后经过3×3的卷积核和通道注意力模块，输出大小为

的第二解码特征图。

第二解码特征图输入解码器的第三层，经过1×1的卷积核后与第三编码特征图进行拼接融合，然后经过3×3的卷积核和通道注意力模块，输出大小为

的第三解码特征图。

第三解码特征图输入解码器的第四层，经过1×1的卷积核后与第二编码特征图进行拼接融合，然后经过3×3的卷积核和空间注意力模块，输出大小为

的第四解码特征图。

第四解码特征图输入解码器的第五层，经过1×1的卷积核后与第一编码特征图进行拼接融合，然后经过3×3的卷积核和空间注意力模块，输出大小为H×W×24的第五解码特征图。

第五解码特征图输入解码器的第六层，经过1×1的卷积核后输出大小为H×W×N的第六解码特征图，其中N为病虫害种类和背景的总和。

进一步的，步骤S3中所述利用样本集训练初始的病害检测模型的过程具体为：样本集包括训练集和测试集，训练集输入到卷积神经网络中得到第六解码特征图，通过Dice损失函数计算第六解码特征图与对应标注掩码图像中的每个子像素点的差值，通过反向传播将计算出来的差值通过反向传播对叶片病害检测模型中的卷积核进行更新；每一次训练过后利用测试集计算训练准确度，当训练准确度达到训练目标则训练完成，保存权重参数得到完成训练的叶片病害检测模型。

进一步的，所述训练准确度的计算方法为：将测试集中的图片输入到叶片病害检测模型中，得到测试集中每一张图片对应的第六解码特征图

计算第六解码特征图

与标记的掩码图像V_k之间的交并比IoU_k和损失值

并计算测试集中所有图片的的平均交并比MIoU和平均损失值，当MIoU＞0.9或平均损失值变化幅度小于3％时即达到训练目标，结束训练并保存模型权重参数Weight。

其中，平均交并比的计算公式为：

其中，Vi表示第i张测试集图片的交并比；平均损失值的计算公式为：

其中，Loss_i表示第i张测试集图片的损失值。

进一步的，步骤S4中所述利用训练完成的病害检测模型对待检测的农作物叶片图像进行检测的过程具体为。

S41、将待检测的农作物叶片图像im转换为0～1之间的张量，得到输入矩阵P。

S42、将输入矩阵P输入叶片病害检测模型，通过叶片病害检测模型得到输出矩阵Q；输出矩阵Q计算方式为

其中

为卷积符号。

S43、通过PLT库将矩阵Q转换为图片，得到的图片即为预测的病害区域和病害类型分布图。

与现有技术相比，本发明技术方案的有益效果是：

本发明提供了一种基于Transformer的农作物叶片病害检测方法，利用叶片病害检测模型检测农作物叶片病害情况，模型采用编码器和解码器结构，模型的编码器主要采用Transformer完成特征的提取工作，相较于传统的卷积神经网络速度更快，参数量更少；在解码器部分中，利用Transformer输出特征图进行特征融合的部分采用通道注意力机制，能够很好的减少模型参数量同时不会使性能下降。

附图说明

图1为本发明一种基于Transformer的农作物叶片病害检测方法的步骤流程示意图。

图2为本发明的叶片病害检测模型结构示意图。

图3为Transformer Block网络结构示意图。

图4为本发明中下采样流程的示意图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是，本发明还可以采用其他不同于在此描述的其他方式来实施，因此，本发明的保护范围并不受下面公开的具体实施例的限制。

实施例1

如图1所示，本发明提供了一种基于Transformer的农作物叶片病害检测方法，本方法包括以下步骤：

本实施例提出了一种基于Transformer的农作物叶片病害检测方法，利用叶片病害检测模型检测农作物叶片病害情况，模型采用编码器和解码器结构，模型的编码器主要采用Transformer完成特征的提取工作，相较于传统的卷积神经网络速度更快，参数量更少；在解码器部分中，利用Transformer输出特征图进行特征融合的部分采用通道注意力机制，能够很好的减少模型参数量同时不会使性能下降。

实施例2

基于上述实施例1，结合图2-图3，本实施例详细阐述本发明一种基于Transformer的农作物叶片病害检测方法的具体内容。

进一步的，步骤S2所述叶片病害检测模型的编码器如图2所示，具体包括：输入层、卷积层和Transformer层，具体为：

其中，区块划分就是将图片划分为几个部分。

四个区域，然后在深度方向进行拼接变成[0，1，2，3]，再经过线性变换变成[4，5]。

其中，所述下采样流程能够减少模型的参数量。

进一步的，所述Transformer Block的结构如图3所示，具体包括：LN层归一化模块、窗口多头注意力模块、MLP多层感知机、滑动窗口多头注意力模块和跳跃连接模块。

的第一解码特征图。

的第二解码特征图。

的第三解码特征图。

的第四解码特征图。

计算第六解码特征图

与标记的掩码图像V_k之间的交并比IoU_k和损失值

其中，平均交并比的计算公式为：

其中，Loss_i表示第i张测试集图片的损失值。

其中

为卷积符号。

实施例3

基于上述实施例1和实施例2，结合图4和表格，本实施例以葡萄病害作为实际样本，对本发明的技术方案作进一步说明。

如图4所示，本发明采用的下采样流程具体为：。

在一个具体的实施例中，采用葡萄病害作为实际样本进行病害检测的过程如下：

S1、采集样本图片，确定学习样本并分类保存。

其中，要得到模型，就需要大量的病虫害样本输入到网络中对神经网络进行训练。实际训练葡萄叶片病害样本包含有：轮斑病、黑腐病、褐斑病以及作为负样本的健康叶片。

首先使用Labelme对病害图片进行多边形标记并导出训练所需的掩码并将其转为范围为[0，4]灰度图。其次设总样本为R_i和对应的掩码图片M_i，i为样本数量。其中R_i图片大小H×W×3，H与W分别为图片的长宽，3为RGB图片的三通道。M_i图片大小为H×W×1。R_i与M_i中每个通道的值均在[0，255]之间，其中M_i中每个像素点的值使用1～4分别代表轮斑病、黑腐病、褐斑病和健康叶片，0代表背景。

S2、划分数据集。

经过分类标记整理到的葡萄病虫害样本图片总计3143张，共四类。首先将R_i中的样本其按照一定比例随机划分训练集Ti和测试集V_k，对应的掩码图片为mT_j和mV_k，其中j＝0.9×i；k＝i-j；k，i∈Z。

S3、训练模型。

利用Transformer网络自主学习样本图片，通过不断的学习得到最好的效果。将T_j中的图片依次输入到网络中。该卷积神经网络结构包含两部分，编码器和解码器组成。

编码器部分采用Transformer结构进行高层特征提取，卷积神经网络进行低层特征提取。

Transformer Block结构如图1所示，包含窗口多头注意力(W-MSA)、层归一化(LN)、感知机(MLP)和滑动窗口多头注意力(SW-MSA)组成。其步骤可分为四步：

1.特征图经过LN层，经过W-MSA，然后进行跳跃连接。

2.连接后的特征图再次经过LN层，经过全连接层MLP，然后进行跳跃连接。

3.特征图经过LN层，经过SW-MSA，然后进行跳跃连接。

4.连接后的特征图再次经过LN层，经过全连接层MLP，然后进行跳跃连接。

卷积层为包含两个卷积核，卷积核大小为3×3，步长为1，Padding为1、Mish激活函数组成，其函数为Mish＝x×tanh(ln(1+e^x))。下采样采用一个大小为2×2，步长为2的最大池化层。

通过卷积层和Transformer结构堆叠，得到编码器，其结构如图2左边部分所示：

第一层为输入层，其大小为H×W×3。

第二层为卷积层，通过两个卷积后操作后，输出大小为H×W×24。其输出记为X1。

第三层为卷积层，经过池化层后的特征图通过两个卷积后操作，输出大小为

其输出记为X2。

第四层为Transformer层，包含区块划分操作、线性编码操作、TransformerBlock。输入层的数据经过4倍下采样后，依次经过区块划分、线性编码、Transformer Block后，输出大小为

其输出记为X3。

第五层为Transformer层，包含下采样操作和Transformer Block。输入的特征图经过下采样输入到Transformer Block。输出大小为

其输出记为X4。

第六五层为Transformer层，包含下采样操作和Transformer Block。输入的特征图经过下采样输入到Transformer Block。输出大小为

其输出记为X5。

第七五层为Transformer层，包含下采样操作和Transformer Block。输入的特征图经过下采样输入到Transformer Block。输出大小为

其输出记为X6。

解码器由3×3的卷积和注意力组成。上采样操作使用线性插值方法。其具体结构自下而上如图2右半边所示

第一层输入为X6，通过1×1的卷积后于X5进行拼接。融合后的向量经过3×3的卷积和通道注意力模块，输出大小为

记为U1。

第二层输入为U1，通过1×1的卷积后于X4进行拼接。融合后的向量经过3×3的卷积和通道注意力模块，输出大小为

记为U2。

第三层输入为U2，通过1×1的卷积后于X3进行拼接。融合后的向量经过3×3的卷积和通道注意力模块，输出大小为

记为U3。

第四层输入为U3，通过1×1的卷积后于X2进行拼接。融合后的向量经过3×3的卷积和空间注意力模块，输出大小为

记为U4。

第五层输入为U4，通过1×1的卷积后于X1进行拼接。融合后的向量经过3×3的卷积和空间注意力模块，输出大小为H×W×24，记为U5。

第六层位输出层，主要作用为输出每个类别的像素位置。U5经过1×1的卷积后输出为M，大小为H×W×N，其中N为病虫害种类于背景的总和，本文中为5。

S4、计算损失函数。

将M_i的图片通过归一化压缩，将其压缩至0～1之间，其后得到的矩阵为A。取输出层M的每个通道数的平均值将其压缩为H×W×1大小，其输出矩阵为B。则Dice损失函数可以表达为

其后经过反向传播更新网络参数，继续进行步骤3直至T_j中的图片全输入到网络中。

S5、计算准确度。

将V_k中的图片输入到网络中，得到每一张图片对应的输出

计算V_k与

之间的交并比IoU_k和损失值

并计算所有验证集V_k的平均交并比

和平均损失值

当MIoU＞0.9或Loss值变化幅度小于3％时，结束训练并保存模型权重参数W。否则返回步骤3。

S6、对未知病害预测

将预测图片im读入并转换为0～1之间的张量，得到输入矩阵P。输出矩阵Q计算方式为

其中

为卷积符号。最后通过PLT库将矩阵Q转换为图片，得到的图片即为预测的病害区域和病害类型分布图。

表1显示了不同模型叶片病害识别性能对比情况，可以看出采用本方法的SW-Unet模型参数量更小，推理速度和识别效果均优于其他模型。

表1不同的方法对葡萄叶片病害识别性能对比

附图中描述结构位置关系的图标仅用于示例性说明，不能理解为对本专利的限制。

显然，本发明的上述实施例仅仅是为清楚地说明本发明所作的举例，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明权利要求的保护范围之内。

Claims

1.一种基于Transformer的农作物叶片病害检测方法，其特征在于，包括以下步骤：

S1、获取n幅用于模型训练的农作物叶片图像，标记农作物叶片图像中的病害区域，得到完成标记的农作物叶片图像的样本集；

S2、构建初始的叶片病害检测模型，所述初始的叶片病害检测模型包括编码器和解码器，编码器采用Transformer结构进行高层特征提取，解码器采用通道注意力机制对编码器Transformer输出特征图进行特征融合；

S3、利用步骤S1的样本集训练初始的叶片病害检测模型，从而得到训练完成的叶片病害检测模型；

2.根据权利要求1所述的一种基于Transformer的农作物叶片病害检测方法，其特征在于，步骤S1中获取所述标记农作物叶片图像的方法具体为：

S11、获取n幅用于模型训练的农作物叶片图像，其中农作物叶片图像具有RGB三个通道；所述农作物叶片图像包括健康叶片的农作物叶片图像和病害叶片的农作物叶片图像；

3.根据权利要求2所述的一种基于Transformer的农作物叶片病害检测方法，其特征在于，步骤S2所述叶片病害检测模型的编码器包括：输入层、卷积层和Transformer层，具体为：

输入层输入农作物叶片图像，并将农作物叶片图像传输到第一卷积层；农作物叶片图像的尺寸为H×W×3，其中，H和W分别为农作物叶片图像的长宽，3表示农作物叶片图像具有RGB三个通道；

农作物叶片图像经过第一卷积层，得到第一编码特征图，第一编码特征图的尺寸为H×W×24；

4.根据权利要求3所述的一种基于Transformer的农作物叶片病害检测方法，其特征在于，所述第一Transformer层、第二Transformer层、第三Transformer层和第四Transformer层的具体结构为：

所述第一Transformer层包括：池化层、区块划分操作模块、线性编码操作模块和Transformer Block；农作物叶片图像依次经过池化层、区块划分操作模块、线性编码操作模块和Transformer Block得到第三编码特征图；

第二Transformer层、第三Transformer层和第四Transformer层均为下采样操作模块和Transformer Block依次连接；

5.根据权利要求4所述的一种基于Transformer的农作物叶片病害检测方法，其特征在于，所述Transformer Block具体包括：LN层归一化模块、窗口多头注意力模块、MLP多层感知机、滑动窗口多头注意力模块和跳跃连接模块；

6.根据权利要求3所述的一种基于Transformer的农作物叶片病害检测方法，其特征在于，所述卷积层包括两个卷积核，其中卷积核大小为3×3，卷积核步长为1，卷积核Padding为1、卷积核Mish激活函数为Mish＝x×tanh(ln(1+e^x))。

7.根据权利要求3所述的一种基于Transformer的农作物叶片病害检测方法，其特征在于，步骤S2中所述叶片病害检测模型的解码器包括：卷积核、通道注意力模块和空间注意力模块，具体包括：

的第一解码特征图；

的第二解码特征图；

的第三解码特征图；

的第四解码特征图；

第四解码特征图输入解码器的第五层，经过1×1的卷积核后与第一编码特征图进行拼接融合，然后经过3×3的卷积核和空间注意力模块，输出大小为H×W×24的第五解码特征图；

8.根据权利要求7所述的一种基于Transformer的农作物叶片病害检测方法，其特征在于，步骤S3中所述利用样本集训练初始的病害检测模型的过程具体为：样本集包括训练集和测试集，训练集输入到卷积神经网络中得到第六解码特征图，通过Dice损失函数计算第六解码特征图与对应标注掩码图像中的每个子像素点的差值，通过反向传播将计算出来的差值通过反向传播对叶片病害检测模型中的卷积核进行更新；每一次训练过后利用测试集计算训练准确度，当训练准确度达到训练目标则训练完成，保存权重参数得到完成训练的叶片病害检测模型。

9.根据权利要求8所述的一种基于Transformer的农作物叶片病害检测方法，其特征在于，所述训练准确度的计算方法为：将测试集中的图片输入到叶片病害检测模型中，得到测试集中每一张图片对应的第六解码特征图

计算第六解码特征图

与标记的掩码图像V_k之间的交并比IoU_k和损失值

并计算测试集中所有图片的的平均交并比MIoU和平均损失值，当MIoU>0.9或平均损失值变化幅度小于3％时即达到训练目标，结束训练并保存模型权重参数Weight；

平均交并比的计算公式为：

其中，V_i表示第i张测试集图片的交并比；平均损失值的计算公式为：

其中，Loss_i表示第i张测试集图片的损失值。

10.根据权利要求9所述的一种基于Transformer的农作物叶片病害检测方法，其特征在于，步骤S4中所述利用训练完成的病害检测模型对待检测的农作物叶片图像进行检测的过程具体为：

S41、将待检测的农作物叶片图像im转换为0～1之间的张量，得到输入矩阵P；

其中

为卷积符号；