CN114511732B

CN114511732B - 一种柑橘斑点状病虫害细粒度图像识别方法

Info

Publication number: CN114511732B
Application number: CN202111682743.8A
Authority: CN
Inventors: 苏家仪; 韦光亮; 王筱东; 朱燕红; 陈华; 韦日彤
Original assignee: Guangxi Talentcloud Information Technology Co ltd
Current assignee: Guangxi Talentcloud Information Technology Co ltd
Priority date: 2021-12-31
Filing date: 2021-12-31
Publication date: 2024-05-14
Anticipated expiration: 2041-12-31
Also published as: CN114511732A

Abstract

本发明属于涉及病虫害识别领域，特别涉及一种柑橘斑点状病虫害细粒度图像识别方法，针对斑点状病虫害特征过于分散的特点，利用视觉Transformer替代卷积神经网络，增加模型对长距离特征的感知能力，持续维持特征的空间关系；针对斑点状病虫害单个斑点目标尺寸较小的特点，利用自编码器学习生成原始图像的方式，提高细节特征的学习能力；针对不同斑点状病虫害类别特征相似的特点，利用中心损失进行监督，促使相同类别的特征聚集在类别特征中心附近，不同类别的类别特征中心彼此远离，提升不同斑点状病虫害类别特征之间的可区分性。

Description

一种柑橘斑点状病虫害细粒度图像识别方法

技术领域

本发明属于涉及病虫害识别领域，特别涉及一种柑橘斑点状病虫害细粒度图像识别方法。

背景技术

柑橘病虫害防治是柑橘种植中的一个非常重要的环节，病虫害发病初期尤为关键，若发现不及时，可能会对果树长势、果实质量等造成重大影响。很多病虫害在发病初期表现出的症状不明显，容易造成误判，如一些斑点状病虫害：溃疡病、脂点黄斑病、黑斑病、芽枝霉斑病、棒孢霉褐斑病、树脂病等，特征分散，症状相近，均呈斑点状随机分布在叶片或果实上，这些相似病害通常只在斑点边缘处有细微差异。

随着计算机视觉与人工智能技术的发展，基于图像的柑橘病虫害识别技术已走进千家万户，用户通过手机拍照的方式即可对柑橘病虫害进行识别。但不同斑点状病虫害直接差异较小，属于细粒度分类的范畴，采用通用识别算法的方式准确率普遍较低。针对斑点状病虫害的自动识别，目前有一些方法可一定程度上提升准确率，基于通用目标检测的方式对叶片或果实所有病虫害区域进行检测，但斑点状病虫害特征分散，且数量众多，需要大量的人工标注，费时费力；基于卷积神经网络注意力机制细粒度分类算法通过利用注意力机制自动学习图像重要特征，无需额外的人工标注，但卷积神经网络主要提取局部特征，且随着网络深度增加只能捕获到特征之间非常弱的长距离关系，不能适应斑点状病虫害特征分散的特点。

发明内容

为了解决上述问题，本发明提供了一种柑橘斑点状病虫害细粒度图像识别方法，具体技术方案如下：

一种柑橘斑点状病虫害细粒度图像识别方法，包括以下步骤：

步骤S1，制作数据集：收集柑橘斑点状病虫害图片，并根据斑点状病虫害类别对图片进行分类标注得到数据集，将数据集中所有标注好的图片按一定比例划分为训练集、验证集与测试集；所述斑点状病虫害类别数为K；

步骤S2，构建细粒度分类网络模型：所述细粒度分类网络模型包括图像重建模型与图像分类模型；所述图像重建模型用于将随机抽样的图像样本分块恢复为原始图像；所述图像分类模型用于对原始图像根据斑点状病虫害类别进行分类；

步骤S3，构建损失函数：损失函数包括图像重建模型的均方差损失函数、图像分类模型的交叉熵损失函数与中心损失函数，所述均方差损失函数用于对比重建图像与输入图像的差距，所述交叉熵损失函数用于计算图像分类的损失，所述中心损失函数用于提升不同斑点状病虫害类别特征之间的可区分性；

步骤S4，图像重建模型训练：将步骤S1中的训练集输入至图像重建模型进行训练，采用步骤S3中的均方差损失函数进行监督训练，设置图像重建模型的学习率为a，每一轮训练结束输出一个中间图像重建模型；

步骤S5，图像重建模型验证：将步骤S1中的验证集输入到步骤S4训练得到的中间图像重建模型进行模型验证，当验证集的均方差损失函数不再下降时将该中间图像重建模型作为最佳的图像重建模型，得到图像重建模型的编码器、嵌入层参数；

步骤S6，图像分类模型训练：将步骤S5中最佳的图像重建模型中的编码器、嵌入层参数作为图像分类模型训练的基准模型参数，将步骤S1中的训练集输入至图像分类模型进行训练，采用步骤S3中的交叉熵损失函数与中心损失函数进行监督训练，设置图像分类模型的学习率为b，每一轮训练结束输出一个中间图像分类模型；

步骤S7，图像分类模型验证：将步骤S1中的验证集输入到步骤S6中训练得到的中间图像分类模型进行模型验证，将准确率最高的中间图像分类模型作为最佳的图像分类模型；

步骤S8，模型推理：将步骤S1中的测试集输入至步骤S7中最佳的图像分类模型进行推理，得到病虫害分类结果。

优选地，所述步骤S1中将数据集中所有标注好的图片按0.8：0.1：0.1的比例划分为训练集、验证集与测试集。

优选地，所述图像重建模型包括第一图像分块单元、第一分块选择单元、第一编码器、第一嵌入层单元、解码器、重建图像单元；所述第一图像分块单元、第一分块选择单元、第一编码器、第一嵌入层单元、解码器、重建图像单元依次连接。

优选地，所述步骤S2中图像重建模型将随机抽样的图像样本分块恢复为原始图像的步骤如下：

步骤S21，图像分块：第一图像分块单元将输入的第b张图像进行缩放，得到缩放后的第b张图像x^b，缩放后的第b张图像b∈{1,2,…,B}，B表示每次迭代的批次数量；对缩放后的第b张图像x^b进行有重叠地滑窗，得到N个图像分块，N个图像分块组成第b张图像的分块向量/>其中H、W、C分别表示缩放后的图片高度、图片宽度和通道数；其中图像分块的数量N的计算方式如下：

其中，P表示分块尺寸，S表示滑窗步长；

步骤S22：图像分块选择：第一分块选择单元对第一图像分块单元得到的第b张图像的分块向量进行图像分块选择，具体是设置分块选择占比R，从第b张图像的分块向量中随机采样R占比的图像分块作为第一编码器的第b张输入图像的分块向量其中/>表示对N*R向下取整；

步骤S23，编码：采用Transformer网络模型对图像分块向量进行编码，得到维度为/>的第一编码器输出的第b张图像的特征向量/>

步骤S24，嵌入：将第一编码器输出的第b张图像的特征向量输入至维度为的全连接层中，F为嵌入层的输出维度，得到第一嵌入层单元输出的第b张图像的特征向量/>

步骤S25，解码：解码器采用Transformer网络模型对第一嵌入层单元输出的第b张图像的特征向量进行解码，将解码器最后一层输入维度为D×(H*W*C)的全连接层，得到输出维度为H*W*C的解码器输出的第b张图像的特征向量/>

步骤S26，重建图像：重建图像单元对解码器输出的第b张图像的特征向量按H×W×C维度进行reshape操作，得到第b张图像的维度为H×W×C的重建图像。

优选地，所述图像分类模型包括第二图像分块单元、第二分块选择单元、第二编码器、第二嵌入层单元、分类层单元；所述第二图像分块单元、第二分块选择单元、第二编码器、第二嵌入层单元、分类层单元依次连接；所述第二图像分块单元复用第一图像分块单元的参数；所述第二分块选择单元复用第一分块选择单元的参数；所述第二编码器复用第一编码器的参数；所述第二嵌入层单元复用第一嵌入层单元的参数；所述分类层的维度为步骤S1中的斑点状病虫害类别数。

优选地，所述步骤S3中的均方差损失函数如下所示：

其中，表示图像重建模型中输入的第b图像的第i个像素点的像素值，/>表示图像重建模型输出的第b图像的重建图像的第i个像素点的像素值。

优选地，所述交叉熵损失函数如下所示：

其中，表示第b张图像对应的one-hot编码的分类标签，/>当k为真实斑点状病虫害类别时/>否则/>表示识别为斑点状病虫害类别k的概率，范围是0～1。

优选地，所述中心损失函数如下所示：

其中，表示第b张图像对应真实类别为k的特征中心；α表示控制更新率；||·||₂运算表示对特征向量进行L2-Norm归一化；←表示向左更新。

优选地，所述图像重建模型的学习率为a大于图像分类模型的学习率为b。

优选地，所述步骤S4中的Transformer网络模型为ViT-B/16网络模型。

本发明的有益效果为：本发明提供了一种柑橘斑点状病虫害细粒度图像识别方法，针对斑点状病虫害特征过于分散的特点，利用视觉Transformer替代卷积神经网络，增加模型对长距离特征的感知能力，持续维持特征的空间关系；针对斑点状病虫害单个斑点目标尺寸较小的特点，利用自编码器学习生成原始图像的方式，提高细节特征的学习能力；针对不同斑点状病虫害类别特征相似的特点，利用中心损失进行监督，促使相同类别的特征聚集在类别特征中心附近，不同类别的类别特征中心彼此远离，，提升不同斑点状病虫害类别特征之间的可区分性。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中，类似的元件或部分一般由类似的附图标记标识。附图中，各元件或部分并不一定按照实际的比例绘制。

图1为本发明的流程示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解，在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

如图1所示，本发明的具体实施方式提供了一种柑橘斑点状病虫害细粒度图像识别方法，包括以下步骤：

步骤S1，制作数据集：收集柑橘斑点状病虫害图片，并根据斑点状病虫害类别对图片进行分类标注得到数据集，将数据集中所有标注好的图片按一定比例划分为训练集、验证集与测试集；所述斑点状病虫害类别数为K；具体是将数据集中所有标注好的图片按0.8：0.1：0.1的比例划分为训练集、验证集与测试集。在本实施例中，斑点状病虫害类别包括溃疡病、脂点黄斑病、黑斑病、芽枝霉斑病、棒孢霉褐斑病、树脂病，此处K＝6。

步骤S2，构建细粒度分类网络模型：所述细粒度分类网络模型包括图像重建模型与图像分类模型；所述图像重建模型用于将随机抽样的图像样本分块恢复为原始图像；所述图像分类模型用于对原始图像根据斑点状病虫害类别进行分类。图像重建模型的分支通过自编码器学习将随机抽样的样本分块恢复为原始图像，以提高模型对细节特征的学习能力，最终提高斑点状病虫害单个斑点的捕获能力。针对斑点状病虫害特征过于分散的特点，采用Transformer结构增加模型对长距离特征的感知能力，持续维持特征的空间关系。

所述图像重建模型包括第一图像分块单元、第一分块选择单元、第一编码器、第一嵌入层单元、解码器、重建图像单元；所述第一图像分块单元、第一分块选择单元、第一编码器、第一嵌入层单元、解码器、重建图像单元依次连接。

图像重建模型将随机抽样的图像样本分块恢复为原始图像的步骤如下：

步骤S21，图像分块：第一图像分块单元将输入的第b张图像进行缩放，得到缩放后的第b张图像x^b，缩放后的第b张图像b∈{1,2,…,B}，B表示每次迭代的批次数量；对缩放后的第b张图像x^b进行有重叠地滑窗，得到N个图像分块，N个图像分块组成第b张图像的分块向量/>其中H、W、C分别表示缩放后的图片高度、图片宽度和通道数；在本实施例中，H＝448、W＝448、C＝3。其中，符号*表示数值相乘，符号×表示维度分隔。

其中图像分块的数量N的计算方式如下：

其中，P表示分块尺寸，S表示滑窗步长；设置P＝16，S＝12，得到N＝1369。

步骤S22：图像分块选择：第一分块选择单元对第一图像分块单元得到的第b张图像的分块向量进行图像分块选择，具体是设置分块选择占比R，从第b张图像的分块向量中随机采样R占比的图像分块作为第一编码器的第b张输入图像的分块向量其中/>表示对N*R向下取整。

设置R＝0.75，注意力头数为12个。

步骤S23，编码：采用Transformer网络模型对图像分块向量进行编码，Transformer网络模型为ViT-B/16网络模型，网络层数为12层，

每层网络输出得到维度为的第一编码器输出的第b张图像的特征向量

步骤S24，嵌入：将第一编码器输出的第b张图像的特征向量输入至维度为的全连接层中，F为嵌入层的输出维度，得到第一嵌入层单元输出的第b张图像的特征向量/>F＝768，/>的维度为768。

步骤S25，解码：解码器采用Transformer网络模型对第一嵌入层单元输出的第b张图像的特征向量进行解码，Transformer网络模型为ViT-B/16网络模型，网络层数为8层，注意力头数为12个，每层的维度为D，将解码器最后一层输入维度为D×(H*W*C)的全连接层，得到输出维度为H*W*C的解码器输出的第b张图像的特征向量/>

所述图像分类模型包括第二图像分块单元、第二分块选择单元、第二编码器、第二嵌入层单元、分类层单元；所述第二图像分块单元、第二分块选择单元、第二编码器、第二嵌入层单元、分类层单元依次连接；所述第二图像分块单元复用第一图像分块单元的参数；所述第二分块选择单元复用第一分块选择单元的参数；所述第二编码器复用第一编码器的参数；所述第二嵌入层单元复用第一嵌入层单元的参数；所述分类层的维度为步骤S1中的斑点状病虫害类别数。

步骤S3，构建损失函数：损失函数包括图像重建模型的均方差损失函数、图像分类模型的交叉熵损失函数与中心损失函数，所述均方差损失函数用于对比重建图像与输入图像的差距，所述交叉熵损失函数用于计算图像分类的损失，所述中心损失函数用于提升不同斑点状病虫害类别特征之间的可区分性。

均方差损失函数如下所示：

交叉熵损失函数如下所示：

其中，表示第b张图像对应的one-hot编码的分类标签，/>当k为真实斑点状病虫害类别时/>否则/>表示识别为斑点状病虫害类别k的概率，范围是0～1，具体是对分类层输出的K维特征进行softmax归一化操作得到。

中心损失函数如下所示：

其中，表示第b张图像对应真实类别为k的特征中心；α表示控制更新率；||·||₂运算表示对特征向量进行L2-Norm归一化；←表示向左更新。/>初始化维度与/>相同，通过公式(5)进行更新，α＝0.01。

步骤S4，图像重建模型训练：将步骤S1中的训练集输入至图像重建模型进行训练，采用步骤S3中的均方差损失函数进行监督训练，优化器为AdamW，初始学习率为a＝0.1，学习率调整策略为余弦退火，批次数量为64，每一轮训练结束输出一个中间图像重建模型；

步骤S6，图像分类模型训练：将步骤S5中最佳的图像重建模型中的编码器、嵌入层参数作为图像分类模型训练的基准模型参数，将步骤S1中的训练集输入至图像分类模型进行训练，优化器为SGD，图像重建模型的学习率为a大于图像分类模型的学习率为b，初始学习率为b＝0.001，学习率调整策略为余弦退火，批次数量为16，采用步骤S3中的交叉熵损失函数与中心损失函数进行监督训练，设置图像分类模型的学习率为b，每一轮训练结束输出一个中间图像分类模型；

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本申请所提供的实施例中，应该理解到，单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元可结合为一个单元，一个单元可拆分为多个单元，或一些特征可以忽略等。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围，其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims

1.一种柑橘斑点状病虫害细粒度图像识别方法，其特征在于：包括以下步骤：

步骤S2，构建细粒度分类网络模型：所述细粒度分类网络模型包括图像重建模型与图像分类模型；所述图像重建模型用于将随机抽样的图像样本分块恢复为原始图像；所述图像分类模型用于对原始图像根据斑点状病虫害类别进行分类；所述图像重建模型包括第一图像分块单元、第一分块选择单元、第一编码器、第一嵌入层单元、解码器、重建图像单元；所述第一图像分块单元、第一分块选择单元、第一编码器、第一嵌入层单元、解码器、重建图像单元依次连接；所述步骤S2中图像重建模型将随机抽样的图像样本分块恢复为原始图像的步骤如下：

步骤S21，图像分块：第一图像分块单元将输入的第b张图像进行缩放，得到缩放后的第b张图像x^b，缩放后的第b张图像B表示每次迭代的批次数量；对缩放后的第b张图像x^b进行有重叠地滑窗，得到N个图像分块，N个图像分块组成第b张图像的分块向量/>其中H、W、C分别表示缩放后的图片高度、图片宽度和通道数；其中图像分块的数量N的计算方式如下：

其中，P表示分块尺寸，S表示滑窗步长；

步骤S22：图像分块选择：第一分块选择单元对第一图像分块单元得到的第b张图像的分块向量进行图像分块选择，具体是设置分块选择占比R，从第b张图像的分块向量/>中随机采样R占比的图像分块作为第一编码器的第b张输入图像的分块向量/> 其中/>表示对N*R向下取整；

步骤S23，编码：采用Transformer网络模型对图像分块向量进行编码，得到维度为的第一编码器输出的第b张图像的特征向量/>

步骤S26，重建图像：重建图像单元对解码器输出的第b张图像的特征向量按H×W×C维度进行reshape操作，得到第b张图像的维度为H×W×C的重建图像；所述图像分类模型包括第二图像分块单元、第二分块选择单元、第二编码器、第二嵌入层单元、分类层单元；所述第二图像分块单元、第二分块选择单元、第二编码器、第二嵌入层单元、分类层单元依次连接；所述第二图像分块单元复用第一图像分块单元的参数；所述第二分块选择单元复用第一分块选择单元的参数；所述第二编码器复用第一编码器的参数；所述第二嵌入层单元复用第一嵌入层单元的参数；所述分类层的维度为步骤S1中的斑点状病虫害类别数；

2.根据权利要求1所述的一种柑橘斑点状病虫害细粒度图像识别方法，其特征在于：所述步骤S1中将数据集中所有标注好的图片按0.8：0.1：0.1的比例划分为训练集、验证集与测试集。

3.根据权利要求1所述的一种柑橘斑点状病虫害细粒度图像识别方法，其特征在于：所述步骤S3中的均方差损失函数如下所示：

4.根据权利要求1所述的一种柑橘斑点状病虫害细粒度图像识别方法，其特征在于：所述交叉熵损失函数如下所示：

其中，表示第b张图像对应的one-hot编码的分类标签，/>当k为真实斑点状病虫害类别时/>否则/> 表示识别为斑点状病虫害类别k的概率，范围是0～1。

5.根据权利要求1所述的一种柑橘斑点状病虫害细粒度图像识别方法，其特征在于：所述中心损失函数如下所示：

6.根据权利要求1所述的一种柑橘斑点状病虫害细粒度图像识别方法，其特征在于：所述图像重建模型的学习率为a大于图像分类模型的学习率为b。

7.根据权利要求1所述的一种柑橘斑点状病虫害细粒度图像识别方法，其特征在于：所述步骤S4中的Transformer网络模型为ViT-B/16网络模型。