CN115861185A

CN115861185A - 一种田间复杂背景的稻飞虱计数模型

Info

Publication number: CN115861185A
Application number: CN202211421105.5A
Authority: CN
Inventors: 陈冬梅; 王海亮; 林佳; 张竞成
Original assignee: Hangzhou Ruikun Technology Co ltd; Hangzhou Dianzi University
Current assignee: Hangzhou Ruikun Technology Co ltd; Hangzhou Dianzi University
Priority date: 2022-11-14
Filing date: 2022-11-14
Publication date: 2023-03-28
Anticipated expiration: 2042-11-14
Also published as: CN115861185B

Abstract

本发明涉及一种田间复杂背景的稻飞虱计数模型，包括：获取包含稻飞虱的拍摄图片；对图片中的稻飞虱位置进行手工标注建立数据集；构建基于YOLO v5的稻飞虱计数模型；将稻飞虱数据集输入计数模型进行训练；将测试图片输入计数模型得到检测结果，检测结果即稻飞虱的定位位置。本发明通过对YOLO v5进行改进，在CSP‑Darknet53主干网络中加入Swin_Transformer模块作为特征提取部分，对检测网络颈部加入CBAM注意力机制、SPP模块并用BIFPN结构融合特征，更改网络的检测尺寸，提高模型田间复杂背景的稻飞虱检测精度。

Description

一种田间复杂背景的稻飞虱计数模型

技术领域

本发明涉及一种田间复杂背景的稻飞虱计数模型，属于虫害图片识别处理技术领域。

背景技术

在实际的农作物生产过程中，害虫的发生是影响作物产量的重大因素。在害虫发生的早期进行精准防治非常重要，传统的害虫发生程度的测定依靠人工在实地场景进行害虫识别与计数，这是一项耗时且劳动密集的任务。统计结果受到调查人员对害虫的识别准确率与主观影响，存在人工成本大，效率低下，主观性等缺点。

随着深度学习的迅速发展，深度学习为这些问题带来了新的解决方案，深度学习方法可以自动从标注数据集中学习到目标的特征，并且获得令人满意的结果。使用深度学习目标检测方法可以减少人力成本，避免人工的主观性误差。有很多学者将目标检测应用于害虫检测中，李文勇在黄色黏虫板上捕捉的粉虱和蓟马图片上使用改进的FasterR-CNN实现了95.2％的平均精度，MartinaLippi将YOLO v4部署到NVIDIAJetsonXavier上，在捕获红尾碧蝽的黏虫板图片的检测速度达到50fps，并且实现了94.5％的平均精度。

使用目标检测进行田间场景的稻飞虱的计数和稻飞虱若虫、长翅稻飞虱与短翅稻飞虱的检测时，面临着稻飞虱目标过小、拍摄距离不一致、光照条件和角度不同等问题。这些问题影响稻飞虱的检测效果，解决这些问题对自动获取稻飞虱的发生情况有重大意义。

发明内容

为了针对田间拍摄背景稻飞虱的图片具有复杂背景，目标过小、拍摄距离不一致、光照条件和角度不同的特点，这些特点严重影响检测的精度，本发明提供了一种基于脑电信号的身体归属感程度辨别方法，实现田间复杂背景稻飞虱的精准检测。

一种田间复杂背景的稻飞虱计数模型的具体步骤如下：

步骤一：拍摄稻飞虱图片，建立稻飞虱计数数据集；

步骤二：构建基于YOLOv5的稻飞虱计数模型，包括加入Swin_Transformer模块的CSP-Darknet53主干网络，在检测网络颈部使用BiFPN特征融合结构并加入CBAM注意力机制和SPP模块，修改网络检测尺寸；

步骤三：将稻飞虱计数数据集输入计数模型进行训练；

步骤四：将处理后的待检测稻飞虱图像输入训练后的计数模型，计数模型输出检测结果，所述检测结果包括图像中每个稻飞虱的定位位置。

所述步骤一具体包括以下步骤：

S1.1：拍摄田间复杂背景的稻飞虱图片，对图片进行清洗，删除低质量图片；

S1.2：对图片进行标注，标注图片上每个稻飞虱的位置与种类，每张图片对应一个包含标注信息的txt文件，图片与对应的标注文件一起组成稻飞虱计数数据集；

S1.3：将稻飞虱计数数据集划分为训练集、验证集和测试集，训练集用于训练模型，验证集用于调整模型训练参数，测试集用于测试模型的泛化能力。

所述步骤二包括，在CSP-Darknet53主干网络加入Swin_Transformer模块，在检测网络颈部加入CBAM注意力机制和SPP模块并使用BiFPN特征融合结构的颈部网络，修改网络检测尺寸；

其中主干网络结构为：输入的通道数为3，长宽为HW的图片，经过步长为2的6×6卷积，得到64×(H/2)×(W/2)特征图，经过步长为2的3×3卷积得到128×(H/4)×(W/4)特征图，经过3个C3模块得到128×(H/4)×(W/4)特征图，经过步长为2的2×2卷积得到256×(H/8)×(W/8)特征图，经过6个C3模块得到256×(W/8)×(W/8)特征图，经过步长为2的3×3卷积得到512×(H/16)×(W/16)特征图，经过9个C3模块得到512×(H/16)×(W/16)特征图，经过步长为2的3×3卷积得到1024×(H/32)×(W/32)特征图，经过3个Swin_Transformer模块得到1024×(H/32)×(W/32)特征图，最后经过一个SPPF模块得到1024×(H/32)×(W/32)特征图。

其中C3模块结构为：C3有两个分支，分支1将输入特征X1通过1×1卷积得到通道数减半的特征X2，分支2将特征X1通过1×1卷积将特征X1通道数减少一半得到特征X3，然后将特征X3输入一个瓶颈结构，在瓶颈结构内先将输入特征X3通过1×1卷积得到通道数减少一半的特征x4，再通过3×3卷积将通道增大一倍得到特征X5，然后将特征X5与特征X3相加得到特征X6，将特征X2与特征X6在通道上进行相加，最后通过1×1卷积得到特征X7。

其中Swin_Transformer模块有两种结构：结构一对输入特征X1在通道上进行归一化，然后进行WindowMult-headSelf-Attention的特征与归一化前的输入特征进行相加得到特征X2，然后将特征X2在通道上进行归一化得到特征X3，再将特征X3在通道上扩增4倍，使用GELU激活函数提高模块的非线性，使用Dropout减少过拟合后将特征的通道数恢复到扩增前的数量，再使用Dropout减少过拟合得到特征X4，最后将特征X4与特征X2相加得到最终特征图。

结构二对输入特征X1在通道上进行归一化，然后进行Shifted-Window Mult-headSelf-Attention的特征与归一化前的输入特征进行相加得到特征X2，与WindowMult-headSelf-Attention的不同的是，Shifted-WindowMult-head Self-Attention可以增加各window与其他window之间的信息交流，将特征X2在通道上进行归一化得到特征X3，再将特征X3在通道上扩增4倍，使用GELU激活函数提高模块的非线性，使用Dropout减少模型过拟合后将特征的通道数恢复到扩增前的数量，再使用Dropout减少过拟合得到特征X4，最后将特征X4与特征X2相加得到最终特征图。

其中SPPF模块为：输入特征X1经过1×1卷积得到通道数减半的特征X2，特征X2通过填充为2的5×5最大池化层得到特征X3，X3通过填充为2的5×5最大池化层得到特征X4，特征X4通过填充为2的5×5最大池化层得到特征X5，将特征X2，特征X3，特征X4，特征X5在通道上相加得到特征X6，特征X6经过1×1卷积得到通道数减半的特征X7。

对检测网络颈部的改进为，在检测网络的颈部使用BiFPN结构融合不同尺寸特征以得到更好的特征融合，并加入SPP模块、Swin_Transformer模块和CBAM模块。

其中SPP模块为，首先将输入特征通道减少一半得到特征X1，特征X1通过填充为2的5×5最大池化层得到特征X2，特征X1通过填充为4的9×9最大池化层得到特征X3，特征X1通过填充为6的13×13最大池化层得到特征X4，将特征X1、特征X2、特征X3、特征X4在通道上进行相加得到特征X5，最后特征X5通过1x1卷积将通道数减少一半的特征X6，使特征通过SPP结构保持尺寸和通道数不变。此结构通过使用不同大小的池化核进行最大池化计算，融合多尺寸特征。

其中CBAM模块结构为，CBAM按顺序由通道注意力模块与空间注意力模块组成。通道注意力模块结构为，将输入特征图经过最大池化层得到1×1×C特征图，然后经过一个两层MLP网络，第一层神经元个数为C/16，第二层神经元个数为C，将经过MLP结构输出的两个特征进行元素上的相加，再经过Sigmoid激活函数得到最终的通道注意力系数n。将通道注意力系数与输入特征图进行相乘得到通道注意力特征，空间注意力模块结构为，基于通道的全局最大池化和全局平局池化得到H×W×1的特征图，将这两个特征图经过7×7卷积得到空间注意力系数H×W×1，再经过Sigmoid激活函数得到空间注意力系数，最后将该系数和输入特征做乘法操作，得到空间注意力特征。

BiFPN模块结构为，将特征图2与经过上采样得到的特征图19在通道上进行相加，经过1个SPP模块和3个C3模块，再使用CBAM模块得到下采样1/4特征图23。将特征图4与特征图18在通道上进行相加，经过1个SPP模块和3个C3模块，再使用CBAM模块得到下采样1/8特征图28。将特征图6与特征图14在通道上进行相加，经过1个SPP模块和3个C3模块，再使用CBAM模块得到下采样1/16特征图33。将特征图10与特征图34在通道上进行相加，经过1个SPP模块和3个Swin_Transformer模块，再使用CBAM模块得到下采样1/32特征图38。BiFPN结构使用残差结构增强了特征表示能力，加入CBAM注意力机制提高网络的特征表达能力，四个不同尺寸的特征融合图分别用于检测特小型稻飞虱、小型稻飞虱、中型稻飞虱与大型稻飞虱。

更改网络检测尺寸的具体内容为：

将对下采样为1/4的融合特征使用[3，4][4，9][7，6][7，13]检测框用于检测特小型目标，1/8的融合特征使用[13，7][12，12][10，19][22，11]检测框用于检测小型目标，1/16的融合特征使用[19，17][16，26][33，18][28，32]检测框用于检测中型目标，1/32的融合特征使用[47，28][40，58][86，53][97，126]检测框用于检测大型目标。

与现有技术相比，本发明的有益效果在于：

第一，本发明通过在CSP-Darknet53主干网络中加入Swin_Transformer模块，增强了主干网络的特征表达能力，为检测网络颈部的特征融合部分提供了更有代表性的特征。第二，在检测网络颈部加入CBAM注意力机制、SPP模块并用BiFPN结构融合特征，融合不同尺寸的特征以提高复杂田间背景的检测精度。第三，增加网络检测尺寸，达到检测不同尺寸稻飞虱的目的。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明田间复杂背景的稻飞虱计数模型的流程图；

图2为本发明目标检测模型结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供了一种基于YOLOv5的目标检测方法，包括：

步骤一：拍摄稻飞虱图片，建立稻飞虱计数数据集；

步骤二：构建基于YOLOv5的稻飞虱计数模型，如图2所示包含加入Swin_Transformer模块(C3STR)的CSP-Darknet53主干网络，在检测网络颈部使用BiFPN特征融合结构并加入CBAM注意力机制和SPP模块，修改网络检测尺寸；

步骤三：将稻飞虱计数数据集输入计数模型进行训练；

所述步骤一具体包括以下步骤：

S1.3：将稻飞虱计数数据集划分70％为训练集、20％验证集和10％测试集，训练集用于训练模型，验证集用于调整模型训练参数，测试集用于测试模型的泛化能力。

更改网络检测尺寸的具体内容为：

将对下采样为1/4的融合特征使用[3，4]、[4，9]、[7，6]、[7，13]检测框用于检测特小型目标，1/8的融合特征使用[13，7]、[12，12]、[10，19]、[22，11]检测框用于检测小型目标，1/16的融合特征使用[19，17]、[16，26]、[33，18]、[28，32]检测框用于检测中型目标，1/32的融合特征使用[47，28]、[40，58]、[86，53]、[97，126]检测框用于检测大型目标。

拍摄田间复杂场景下稻飞虱的图片会随着拍摄装置距离稻飞虱的远近从而得到包含不同大小的稻飞虱图片。本发明通过增加对下采样为1/4特征层的检测，达到更好检测小目标稻飞虱的目的，同时将每层的检测框由3个增加到4个，以便适应不同尺寸的稻飞虱检测。

对上述收集的复杂田间背景稻飞虱图像输入模型进行训练，使用Pytorch

1.7.0框架，模型的输入图像尺寸为608×608，学习率设置为0.001，使用ADAM学习率优化器，批大小为4，迭代轮数为300轮，使用Moasic、Mixup、随机翻转、Copy_paste等数据增强方式，将训练集输入网络训练得到模型。

以上结合附图对本发明的实施方式作了详细说明，但本发明不限于所描述的实施方式。对于本领域的技术人员而言，在不脱离本发明原理和精神的情况下，对这些实施方式进行多种变化、修改、替换和变型，仍落入本发明的保护范围内。

Claims

1.一种田间复杂背景的稻飞虱计数模型，其特征在于：包括以下步骤：

步骤一：拍摄稻飞虱图片，建立稻飞虱计数数据集；

步骤二：构建基于YOLO v5的稻飞虱计数模型，加入Swin_Transformer模块的CSP-Darknet53主干网络，加入CBAM注意力机制和SPP模块并使用BiFPN特征融合结构的颈部网络；

步骤三：将稻飞虱计数数据集输入计数模型进行训练；

2.根据权利要求1所述的一种田间复杂背景的稻飞虱计数模型，其特征在于：所述步骤一具体包括以下步骤：

3.根据权利要求1所述的一种田间复杂背景的稻飞虱计数模型，其特征在于：所述步骤二具体包括：构建基于YOLO v5的稻飞虱计数模型，加入Swin_Transformer模块的CSP-Darknet53主干网络，在检测网络颈部使用BiFPN特征融合结构并加入CBAM注意力机制和SPP模块，修改网络检测尺寸。

4.根据权利要求3所述的一种田间复杂背景的稻飞虱计数模型，其特征在于：所述主干网络结构为：输入的通道数为3，长宽为HW的图片，经过步长为2的6×6卷积，得到64×(H/2)×(W/2)特征图，经过步长为2的3×3卷积得到128×(H/4)×(W/4)特征图，经过3个C3模块得到128×(H/4)×(W/4)特征图，经过步长为2的2×2卷积得到256×(H/8)×(W/8)特征图，经过6个C3模块得到256×(W/8)×(W/8)特征图，经过步长为2的3×3卷积得到512×(H/16)×(W/16)特征图，经过9个C3模块得到512×(H/16)×(W/16)特征图，经过步长为2的3×3卷积得到1024×(H/32)×(W/32)特征图，经过3个Swin_Transformer模块得到1024×(H/32)×(W/32)特征图，后经过一个SPPF模块得到1024×(H/32)×(W/32) 特征图；

其中C3模块结构为：C3有两个分支，分支1将输入特征X1通过1×1卷积得到通道数减半的特征X2，分支2将特征X1通过1×1卷积将特征X1通道数减少一半得到特征X3，然后将特征X3输入一个瓶颈结构，在瓶颈结构内先将输入特征X3通过1×1卷积得到通道数减少一半的特征x4，再通过3×3卷积将通道增大一倍得到特征X5，然后将特征X5与特征X3相加得到特征X6，将特征X2与特征X6在通道上进行相加，最后通过1×1卷积得到特征X7；

5.根据权利要求3所述的一种田间复杂背景的稻飞虱计数模型，其特征在于：所述Swin_Transformer模块有两种结构：

第一种结构对输入特征X1在通道上进行归一化，然后进行Window Mult-head Self-Attention的特征与归一化前的输入特征进行相加得到特征X2，然后将特征X2在通道上进行归一化得到特征X3，再将特征X3在通道上扩增4倍，使用GELU激活函数提高模块的非线性，使用Dropout减少过拟合后将特征的通道数恢复到扩增前的数量，再使用Dropout减少过拟合得到特征X4，最后将特征X4与特征X2相加得到最终特征；

第二种结构对输入特征X1在通道上进行归一化，然后进行Shifted-Window Mult-headSelf-Attention的特征与归一化前的输入特征进行相加得到特征X2，与Window Mult-headSelf-Attention的不同的是，Shifted-Window Mult-head Self-Attention可以增加各window与其他window之间的信息交流，将特征X2在通道上进行归一化得到特征X3，再将特征X3在通道上扩增4倍，使用GELU激活函数提高模块的非线性，使用Dropout减少模型过拟合后将特征的通道数恢复到扩增前的数量，再使用Dropout减少过拟合得到特征X4，最后将特征X4与特征X2相加得到最终特征图。

6.根据权利要求1所述的一种田间复杂背景的稻飞虱计数模型，其特征在于：所述在检测网络的颈部使用BiFPN结构融合不同尺寸特征以得到更好的特征融。