CN115861185B - 一种田间复杂背景的稻飞虱计数方法 - Google Patents

一种田间复杂背景的稻飞虱计数方法 Download PDF

Info

Publication number
CN115861185B
CN115861185B CN202211421105.5A CN202211421105A CN115861185B CN 115861185 B CN115861185 B CN 115861185B CN 202211421105 A CN202211421105 A CN 202211421105A CN 115861185 B CN115861185 B CN 115861185B
Authority
CN
China
Prior art keywords
feature
channel
counting
rice
convolved
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211421105.5A
Other languages
English (en)
Other versions
CN115861185A (zh
Inventor
陈冬梅
王海亮
林佳
张竞成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Ruikun Technology Co ltd
Hangzhou Dianzi University
Original Assignee
Hangzhou Ruikun Technology Co ltd
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Ruikun Technology Co ltd, Hangzhou Dianzi University filed Critical Hangzhou Ruikun Technology Co ltd
Priority to CN202211421105.5A priority Critical patent/CN115861185B/zh
Publication of CN115861185A publication Critical patent/CN115861185A/zh
Application granted granted Critical
Publication of CN115861185B publication Critical patent/CN115861185B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture

Landscapes

  • Image Analysis (AREA)

Abstract

本发明涉及一种田间复杂背景的稻飞虱计数方法,包括:获取包含稻飞虱的拍摄图片;对图片中的稻飞虱位置进行手工标注建立数据集;构建基于YOLOv5的稻飞虱计数模型;将稻飞虱数据集输入计数模型进行训练;将测试图片输入计数模型得到检测结果,检测结果即稻飞虱的定位位置。本发明通过对YOLOv5进行改进,在CSP‑Darknet53主干网络中加入Swin_Transformer模块作为特征提取部分,对检测网络颈部加入CBAM注意力机制、SPP模块并用BIFPN结构融合特征,更改网络的检测尺寸,提高模型田间复杂背景的稻飞虱检测精度。

Description

一种田间复杂背景的稻飞虱计数方法
技术领域
本发明涉及一种田间复杂背景的稻飞虱计数方法,属于虫害图片识别处理技术领域。
背景技术
在实际的农作物生产过程中,害虫的发生是影响作物产量的重大因素。在害虫发生的早期进行精准防治非常重要,传统的害虫发生程度的测定依靠人工在实地场景进行害虫识别与计数,这是一项耗时且劳动密集的任务。统计结果受到调查人员对害虫的识别准确率与主观影响,存在人工成本大,效率低下,主观性等缺点。
随着深度学习的迅速发展,深度学习为这些问题带来了新的解决方案,深度学习方法可以自动从标注数据集中学习到目标的特征,并且获得令人满意的结果。使用深度学习目标检测方法可以减少人力成本,避免人工的主观性误差。有很多学者将目标检测应用于害虫检测中,李文勇在黄色黏虫板上捕捉的粉虱和蓟马图片上使用改进的Faster R-CNN实现了95.2%的平均精度,Martina Lippi将YOLO v4部署到NVIDIA Jetson Xavier上,在捕获红尾碧蝽的黏虫板图片的检测速度达到50fps,并且实现了94.5%的平均精度。
使用目标检测进行田间场景的稻飞虱的计数和稻飞虱若虫、长翅稻飞虱与短翅稻飞虱的检测时,面临着稻飞虱目标过小、拍摄距离不一致、光照条件和角度不同等问题。这些问题影响稻飞虱的检测效果,解决这些问题对自动获取稻飞虱的发生情况有重大意义。
发明内容
为了针对田间拍摄背景稻飞虱的图片具有复杂背景,目标过小、拍摄距离不一致、光照条件和角度不同的特点,这些特点严重影响检测的精度,本发明提供了一种基于脑电信号的身体归属感程度辨别方法,实现田间复杂背景稻飞虱的精准检测。
一种田间复杂背景的稻飞虱计数方法的具体步骤如下:
步骤一:拍摄稻飞虱图片,建立稻飞虱计数数据集;
步骤二:构建基于YOLO v5的稻飞虱计数模型,加入Swin_Transformer模块的CSP-Darknet53主干网络,加入CBAM注意力机制和SPP模块并使用BiFPN特征融合结构的颈部网络得到不同尺寸的特征融合图,对于不同尺寸的特征融合图分别使用不同尺寸的检测框进行目标检测,修改网络检测尺寸;
步骤三:将稻飞虱计数数据集输入计数模型进行训练;
步骤四:将处理后的待检测稻飞虱图像输入训练后的计数模型,计数模型输出检测结果,所述检测结果包括图像中每个稻飞虱的定位位置。
所述步骤一具体包括以下步骤:
S1.1:拍摄田间复杂背景的稻飞虱图片,对图片进行清洗,删除低质量图片;
S1.2:对图片进行标注,标注图片上每个稻飞虱的位置与种类,每张图片对应一个包含标注信息的txt文件,图片与对应的标注文件一起组成稻飞虱计数数据集;
S1.3:将稻飞虱计数数据集划分为训练集、验证集和测试集,训练集用于训练模型,验证集用于调整模型训练参数,测试集用于测试模型的泛化能力。
其中主干网络结构为:输入的通道数为3,长宽为HW的图片,经过步长为2的6×6卷积,得到64×(H/2)×(W/2)特征图,经过步长为2的3×3卷积得到128×(H/4)×(W/4)特征图,经过3个C3模块得到128×(H/4)×(W/4)特征图,经过步长为2的2×2卷积得到256×(H/8)×(W/8)特征图,经过6个C3模块得到256×(W/8)×(W/8)特征图,经过步长为2的3×3卷积得到512×(H/16)×(W/16)特征图,经过9个C3模块得到512×(H/16)×(W/16)特征图,经过步长为2的3×3卷积得到1024×(H/32)×(W/32)特征图,经过3个Swin_Transformer模块得到1024×(H/32)×(W/32)特征图,最后经过一个SPPF模块得到1024×(H/32)×(W/32)特征图。
其中C3模块结构为:C3有两个分支,分支1将输入特征X1通过1×1卷积得到通道数减半的特征X2,分支2将特征X1通过1×1卷积将特征X1通道数减少一半得到特征X3,然后将特征X3输入一个瓶颈结构,在瓶颈结构内先将输入特征X3通过1×1卷积得到通道数减少一半的特征x4,再通过3×3卷积将通道增大一倍得到特征X5,然后将特征X5与特征X3相加得到特征X6,将特征X2与特征X6在通道上进行相加,最后通过1×1卷积得到特征X7。
其中Swin_Transformer模块有两种结构:结构一对输入特征X1在通道上进行归一化,然后进行Window Mult-head Self-Attention的特征与归一化前的输入特征进行相加得到特征X2,然后将特征X2在通道上进行归一化得到特征X3,再将特征X3在通道上扩增4倍,使用GELU激活函数提高模块的非线性,使用Dropout减少过拟合后将特征的通道数恢复到扩增前的数量,再使用Dropout减少过拟合得到特征X4,最后将特征X4与特征X2相加得到最终特征图。
结构二对输入特征X1在通道上进行归一化,然后进行Shifted-Window Mult-headSelf-Attention的特征与归一化前的输入特征进行相加得到特征X2,与Window Mult-headSelf-Attention的不同的是,Shifted-Window Mult-head Self-Attention可以增加各window与其他window之间的信息交流,将特征X2在通道上进行归一化得到特征X3,再将特征X3在通道上扩增4倍,使用GELU激活函数提高模块的非线性,使用Dropout减少模型过拟合后将特征的通道数恢复到扩增前的数量,再使用Dropout减少过拟合得到特征X4,最后将特征X4与特征X2相加得到最终特征图。
其中SPPF模块为:输入特征X1经过1×1卷积得到通道数减半的特征X2,特征X2通过填充为2的5×5最大池化层得到特征X3,X3通过填充为2的5×5最大池化层得到特征X4,特征X4通过填充为2的5×5最大池化层得到特征X5,将特征X2,特征X3,特征X4,特征X5在通道上相加得到特征X6,特征X6经过1×1卷积得到通道数减半的特征X7。
对检测网络颈部的改进为,在检测网络的颈部使用BiFPN结构融合不同尺寸特征以得到更好的特征融合,并加入SPP模块、Swin_Transformer模块和CBAM模块。
其中SPP模块为,首先将输入特征通道减少一半得到特征X1,特征X1通过填充为2的5×5最大池化层得到特征X2,特征X1通过填充为4的9×9最大池化层得到特征X3,特征X1通过填充为6的13×13最大池化层得到特征X4,将特征X1、特征X2、特征X3、特征X4在通道上进行相加得到特征X5,最后特征X5通过1x1卷积将通道数减少一半的特征X6,使特征通过SPP结构保持尺寸和通道数不变。此结构通过使用不同大小的池化核进行最大池化计算,融合多尺寸特征。
其中CBAM模块结构为,CBAM按顺序由通道注意力模块与空间注意力模块组成。通道注意力模块结构为,将输入特征图经过最大池化层得到1×1×C特征图,然后经过一个两层MLP网络,第一层神经元个数为C/16,第二层神经元个数为C,将经过MLP结构输出的两个特征进行元素上的相加,再经过Sigmoid激活函数得到最终的通道注意力系数n。将通道注意力系数与输入特征图进行相乘得到通道注意力特征,空间注意力模块结构为,基于通道的全局最大池化和全局平局池化得到H×W×1的特征图,将这两个特征图经过7×7卷积得到空间注意力系数H×W×1,再经过Sigmoid激活函数得到空间注意力系数,最后将该系数和输入特征做乘法操作,得到空间注意力特征。
BiFPN模块结构为,将特征图2与经过上采样得到的特征图19在通道上进行相加,经过1个SPP模块和3个C3模块,再使用CBAM模块得到下采样1/4特征图23。将特征图4与特征图18在通道上进行相加,经过1个SPP模块和3个C3模块,再使用CBAM模块得到下采样1/8特征图28。将特征图6与特征图14在通道上进行相加,经过1个SPP模块和3个C3模块,再使用CBAM模块得到下采样1/16特征图33。将特征图10与特征图34在通道上进行相加,经过1个SPP模块和3个Swin_Transformer模块,再使用CBAM模块得到下采样1/32特征图38。BiFPN结构使用残差结构增强了特征表示能力,加入CBAM注意力机制提高网络的特征表达能力,四个不同尺寸的特征融合图分别用于检测特小型稻飞虱、小型稻飞虱、中型稻飞虱与大型稻飞虱。
更改网络检测尺寸的具体内容为:
将对下采样为1/4的融合特征使用[3,4][4,9][7,6][7,13]检测框用于检测特小型目标,1/8的融合特征使用[13,7][12,12][10,19][22,11]检测框用于检测小型目标,1/16的融合特征使用[19,17][16,26][33,18][28,32]检测框用于检测中型目标,1/32的融合特征使用[47,28][40,58][86,53][97,126]检测框用于检测大型目标。
与现有技术相比,本发明的有益效果在于:
第一,本发明通过在CSP-Darknet53主干网络中加入Swin_Transformer模块,增强了主干网络的特征表达能力,为检测网络颈部的特征融合部分提供了更有代表性的特征。第二,在检测网络颈部加入CBAM注意力机制、SPP模块并用BiFPN结构融合特征,融合不同尺寸的特征以提高复杂田间背景的检测精度。第三,增加网络检测尺寸,达到检测不同尺寸稻飞虱的目的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明田间复杂背景的稻飞虱计数方法的流程图;
图2为本发明目标检测模型结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种基于YOLO v5的目标检测方法,包括:
步骤一:拍摄稻飞虱图片,建立稻飞虱计数数据集;
步骤二:构建基于YOLO v5的稻飞虱计数模型,如图2所示包含加入Swin_Transformer模块(C3STR)的CSP-Darknet53主干网络,加入CBAM注意力机制和SPP模块并使用BiFPN特征融合结构的颈部网络得到不同尺寸的特征融合图,对于不同尺寸的特征融合图分别使用不同尺寸的检测框进行目标检测,修改网络检测尺寸;
步骤三:将稻飞虱计数数据集输入计数模型进行训练;
步骤四:将处理后的待检测稻飞虱图像输入训练后的计数模型,计数模型输出检测结果,所述检测结果包括图像中每个稻飞虱的定位位置。
所述步骤一具体包括以下步骤:
S1.1:拍摄田间复杂背景的稻飞虱图片,对图片进行清洗,删除低质量图片;
S1.2:对图片进行标注,标注图片上每个稻飞虱的位置与种类,每张图片对应一个包含标注信息的txt文件,图片与对应的标注文件一起组成稻飞虱计数数据集;
S1.3:将稻飞虱计数数据集划分70%为训练集、20%验证集和10%测试集,训练集用于训练模型,验证集用于调整模型训练参数,测试集用于测试模型的泛化能力。
所述步骤二包括,在CSP-Darknet53主干网络加入Swin_Transformer模块,在检测网络颈部加入CBAM注意力机制和SPP模块并使用BiFPN特征融合结构的颈部网络,修改网络检测尺寸;
其中主干网络结构为:输入的通道数为3,长宽为HW的图片,经过步长为2的6×6卷积,得到64×(H/2)×(W/2)特征图,经过步长为2的3×3卷积得到128×(H/4)×(W/4)特征图,经过3个C3模块得到128×(H/4)×(W/4)特征图,经过步长为2的2×2卷积得到256×(H/8)×(W/8)特征图,经过6个C3模块得到256×(W/8)×(W/8)特征图,经过步长为2的3×3卷积得到512×(H/16)×(W/16)特征图,经过9个C3模块得到512×(H/16)×(W/16)特征图,经过步长为2的3×3卷积得到1024×(H/32)×(W/32)特征图,经过3个Swin_Transformer模块得到1024×(H/32)×(W/32)特征图,最后经过一个SPPF模块得到1024×(H/32)×(W/32)特征图。
其中C3模块结构为:C3有两个分支,分支1将输入特征X1通过1×1卷积得到通道数减半的特征X2,分支2将特征X1通过1×1卷积将特征X1通道数减少一半得到特征X3,然后将特征X3输入一个瓶颈结构,在瓶颈结构内先将输入特征X3通过1×1卷积得到通道数减少一半的特征x4,再通过3×3卷积将通道增大一倍得到特征X5,然后将特征X5与特征X3相加得到特征X6,将特征X2与特征X6在通道上进行相加,最后通过1×1卷积得到特征X7。
其中Swin_Transformer模块有两种结构:结构一对输入特征X1在通道上进行归一化,然后进行Window Mult-head Self-Attention的特征与归一化前的输入特征进行相加得到特征X2,然后将特征X2在通道上进行归一化得到特征X3,再将特征X3在通道上扩增4倍,使用GELU激活函数提高模块的非线性,使用Dropout减少过拟合后将特征的通道数恢复到扩增前的数量,再使用Dropout减少过拟合得到特征X4,最后将特征X4与特征X2相加得到最终特征图。
结构二对输入特征X1在通道上进行归一化,然后进行Shifted-Window Mult-headSelf-Attention的特征与归一化前的输入特征进行相加得到特征X2,与Window Mult-headSelf-Attention的不同的是,Shifted-Window Mult-head Self-Attention可以增加各window与其他window之间的信息交流,将特征X2在通道上进行归一化得到特征X3,再将特征X3在通道上扩增4倍,使用GELU激活函数提高模块的非线性,使用Dropout减少模型过拟合后将特征的通道数恢复到扩增前的数量,再使用Dropout减少过拟合得到特征X4,最后将特征X4与特征X2相加得到最终特征图。
其中SPPF模块为:输入特征X1经过1×1卷积得到通道数减半的特征X2,特征X2通过填充为2的5×5最大池化层得到特征X3,X3通过填充为2的5×5最大池化层得到特征X4,特征X4通过填充为2的5×5最大池化层得到特征X5,将特征X2,特征X3,特征X4,特征X5在通道上相加得到特征X6,特征X6经过1×1卷积得到通道数减半的特征X7。
对检测网络颈部的改进为,在检测网络的颈部使用BiFPN结构融合不同尺寸特征以得到更好的特征融合,并加入SPP模块、Swin_Transformer模块和CBAM模块。
其中SPP模块为,首先将输入特征通道减少一半得到特征X1,特征X1通过填充为2的5×5最大池化层得到特征X2,特征X1通过填充为4的9×9最大池化层得到特征X3,特征X1通过填充为6的13×13最大池化层得到特征X4,将特征X1、特征X2、特征X3、特征X4在通道上进行相加得到特征X5,最后特征X5通过1x1卷积将通道数减少一半的特征X6,使特征通过SPP结构保持尺寸和通道数不变。此结构通过使用不同大小的池化核进行最大池化计算,融合多尺寸特征。
其中CBAM模块结构为,CBAM按顺序由通道注意力模块与空间注意力模块组成。通道注意力模块结构为,将输入特征图经过最大池化层得到1×1×C特征图,然后经过一个两层MLP网络,第一层神经元个数为C/16,第二层神经元个数为C,将经过MLP结构输出的两个特征进行元素上的相加,再经过Sigmoid激活函数得到最终的通道注意力系数n。将通道注意力系数与输入特征图进行相乘得到通道注意力特征,空间注意力模块结构为,基于通道的全局最大池化和全局平局池化得到H×W×1的特征图,将这两个特征图经过7×7卷积得到空间注意力系数H×W×1,再经过Sigmoid激活函数得到空间注意力系数,最后将该系数和输入特征做乘法操作,得到空间注意力特征。
BiFPN模块结构为,将特征图2与经过上采样得到的特征图19在通道上进行相加,经过1个SPP模块和3个C3模块,再使用CBAM模块得到下采样1/4特征图23。将特征图4与特征图18在通道上进行相加,经过1个SPP模块和3个C3模块,再使用CBAM模块得到下采样1/8特征图28。将特征图6与特征图14在通道上进行相加,经过1个SPP模块和3个C3模块,再使用CBAM模块得到下采样1/16特征图33。将特征图10与特征图34在通道上进行相加,经过1个SPP模块和3个Swin_Transformer模块,再使用CBAM模块得到下采样1/32特征图38。BiFPN结构使用残差结构增强了特征表示能力,加入CBAM注意力机制提高网络的特征表达能力,四个不同尺寸的特征融合图分别用于检测特小型稻飞虱、小型稻飞虱、中型稻飞虱与大型稻飞虱。
更改网络检测尺寸的具体内容为:
将对下采样为1/4的融合特征使用[3,4]、[4,9]、[7,6]、[7,13]检测框用于检测特小型目标,1/8的融合特征使用[13,7]、[12,12]、[10,19]、[22,11]检测框用于检测小型目标,1/16的融合特征使用[19,17]、[16,26]、[33,18]、[28,32]检测框用于检测中型目标,1/32的融合特征使用[47,28]、[40,58]、[86,53]、[97,126]检测框用于检测大型目标。
拍摄田间复杂场景下稻飞虱的图片会随着拍摄装置距离稻飞虱的远近从而得到包含不同大小的稻飞虱图片。本发明通过增加对下采样为1/4特征层的检测,达到更好检测小目标稻飞虱的目的,同时将每层的检测框由3个增加到4个,以便适应不同尺寸的稻飞虱检测。
对上述收集的复杂田间背景稻飞虱图像输入模型进行训练,使用Pytorch1.7.0框架,模型的输入图像尺寸为608×608,学习率设置为0.001,使用ADAM学习率优化器,批大小为4,迭代轮数为300轮,使用Moasic、Mixup、随机翻转、Copy_paste等数据增强方式,将训练集输入网络训练得到模型。
以上结合附图对本发明的实施方式作了详细说明,但本发明不限于所描述的实施方式。对于本领域的技术人员而言,在不脱离本发明原理和精神的情况下,对这些实施方式进行多种变化、修改、替换和变型,仍落入本发明的保护范围内。

Claims (5)

1.一种田间复杂背景的稻飞虱计数方法,其特征在于:包括以下步骤:
步骤一:拍摄稻飞虱图片,建立稻飞虱计数数据集;
步骤二:构建基于YOLO v5的稻飞虱计数模型,加入Swin_Transformer模块的CSP-Darknet53主干网络,加入CBAM注意力机制和SPP模块并使用BiFPN特征融合结构的颈部网络得到不同尺寸的特征融合图,对于不同尺寸的特征融合图分别使用不同尺寸的检测框进行目标检测;
步骤三:将稻飞虱计数数据集输入计数模型进行训练;
步骤四:将处理后的待检测稻飞虱图像输入训练后的计数模型,计数模型输出检测结果,所述检测结果包括图像中每个稻飞虱的定位位置。
2.根据权利要求1所述的一种田间复杂背景的稻飞虱计数方法,其特征在于:所述步骤一具体包括以下步骤:
S1.1:拍摄田间复杂背景的稻飞虱图片,对图片进行清洗,删除低质量图片;
S1.2:对图片进行标注,标注图片上每个稻飞虱的位置与种类,每张图片对应一个包含标注信息的txt文件,图片与对应的标注文件一起组成稻飞虱计数数据集;
S1.3:将稻飞虱计数数据集划分为训练集、验证集和测试集,训练集用于训练模型,验证集用于调整模型训练参数,测试集用于测试模型的泛化能力。
3.根据权利要求1所述的一种田间复杂背景的稻飞虱计数方法,其特征在于:所述主干网络结构为:输入的通道数为3,长宽为HW的图片,经过步长为2的6×6卷积,得到64×(H/2)×(W/2)特征图,经过步长为2的3×3卷积得到128×(H/4)×(W/4)特征图,经过3个C3模块得到128×(H/4)×(W/4)特征图,经过步长为2的2×2卷积得到256×(H/8)×(W/8)特征图,经过6个C3模块得到256×(W/8)×(W/8)特征图,经过步长为2的3×3卷积得到512×(H/16)×(W/16)特征图,经过9个C3模块得到512×(H/16)×(W/16)特征图,经过步长为2的3×3卷积得到1024×(H/32)×(W/32)特征图,经过3个Swin_Transformer模块得到1024×(H/32)×(W/32)特征图,后经过一个SPPF模块得到1024×(H/32)×(W/32)特征图;
其中C3模块结构为:C3有两个分支,分支1将输入特征X1通过1×1卷积得到通道数减半的特征X2,分支2将特征X1通过1×1卷积将特征X1通道数减少一半得到特征X3,然后将特征X3输入一个瓶颈结构,在瓶颈结构内先将输入特征X3通过1×1卷积得到通道数减少一半的特征x4,再通过3×3卷积将通道增大一倍得到特征X5,然后将特征X5与特征X3相加得到特征X6,将特征X2与特征X6在通道上进行相加,最后通过1×1卷积得到特征X7;
其中SPPF模块为:输入特征X1经过1×1卷积得到通道数减半的特征X2,特征X2通过填充为2的5×5最大池化层得到特征X3,X3通过填充为2的5×5最大池化层得到特征X4,特征X4通过填充为2的5×5最大池化层得到特征X5,将特征X2,特征X3,特征X4,特征X5在通道上相加得到特征X6,特征X6经过1×1卷积得到通道数减半的特征X7。
4.根据权利要求1所述的一种田间复杂背景的稻飞虱计数方法,其特征在于:所述Swin_Transformer模块有两种结构:
第一种结构对输入特征X1在通道上进行归一化,然后进行Window Mult-head Self-Attention的特征与归一化前的输入特征进行相加得到特征X2,然后将特征X2在通道上进行归一化得到特征X3,再将特征X3在通道上扩增4倍,使用GELU激活函数提高模块的非线性,使用Dropout减少过拟合后将特征的通道数恢复到扩增前的数量,再使用Dropout减少过拟合得到特征X4,最后将特征X4与特征X2相加得到最终特征;
第二种结构对输入特征X1在通道上进行归一化,然后进行Shifted-Window Mult-headSelf-Attention的特征与归一化前的输入特征进行相加得到特征X2,与Window Mult-headSelf-Attention的不同的是,Shifted-Window Mult-head Self-Attention可以增加各window与其他window之间的信息交流,将特征X2在通道上进行归一化得到特征X3,再将特征X3在通道上扩增4倍,使用GELU激活函数提高模块的非线性,使用Dropout减少模型过拟合后将特征的通道数恢复到扩增前的数量,再使用Dropout减少过拟合得到特征X4,最后将特征X4与特征X2相加得到最终特征图。
5.根据权利要求1所述的一种田间复杂背景的稻飞虱计数方法,其特征在于:还包括更改网络检测尺寸,将对下采样为1/4的融合特征使用[3,4]、[4,9]、[7,6]、[7,13]检测框用于检测特小型目标,下采样为1/8的融合特征使用[13,7]、[12,12]、[10,19]、[22,11]检测框用于检测小型目标,下采样为1/16的融合特征使用[19,17]、[16,26]、[33,18]、[28,32]检测框用于检测中型目标,下采样为1/32的融合特征使用[47,28]、[40,58]、[86,53]、[97,126]检测框用于检测大型目标。
CN202211421105.5A 2022-11-14 2022-11-14 一种田间复杂背景的稻飞虱计数方法 Active CN115861185B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211421105.5A CN115861185B (zh) 2022-11-14 2022-11-14 一种田间复杂背景的稻飞虱计数方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211421105.5A CN115861185B (zh) 2022-11-14 2022-11-14 一种田间复杂背景的稻飞虱计数方法

Publications (2)

Publication Number Publication Date
CN115861185A CN115861185A (zh) 2023-03-28
CN115861185B true CN115861185B (zh) 2023-08-11

Family

ID=85663349

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211421105.5A Active CN115861185B (zh) 2022-11-14 2022-11-14 一种田间复杂背景的稻飞虱计数方法

Country Status (1)

Country Link
CN (1) CN115861185B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116994244A (zh) * 2023-08-16 2023-11-03 临海市特产技术推广总站(临海市柑桔产业技术协同创新中心) 一种基于Yolov8的柑橘树体果实产量评估方法
CN117292248B (zh) * 2023-10-30 2024-04-26 吉林农业大学 基于深度学习的农田喷药系统及杂草检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020047738A1 (zh) * 2018-09-04 2020-03-12 安徽中科智能感知大数据产业技术研究院有限责任公司 多尺度特征融合网络结合定位模型的害虫自动计数方法
AU2021107321A4 (en) * 2021-08-25 2021-12-16 Sharvil Kishore Darne Crime prediction and prevention using computer vision and deep learning model
CN114898470A (zh) * 2022-06-06 2022-08-12 安徽建筑大学 基于改进YOLOv5的跌倒行为检测方法及系统
CN115147648A (zh) * 2022-06-29 2022-10-04 江苏大学 一种基于改进YOLOv5目标检测的茶叶嫩梢识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020047738A1 (zh) * 2018-09-04 2020-03-12 安徽中科智能感知大数据产业技术研究院有限责任公司 多尺度特征融合网络结合定位模型的害虫自动计数方法
AU2021107321A4 (en) * 2021-08-25 2021-12-16 Sharvil Kishore Darne Crime prediction and prevention using computer vision and deep learning model
CN114898470A (zh) * 2022-06-06 2022-08-12 安徽建筑大学 基于改进YOLOv5的跌倒行为检测方法及系统
CN115147648A (zh) * 2022-06-29 2022-10-04 江苏大学 一种基于改进YOLOv5目标检测的茶叶嫩梢识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
图像自寻的弹药目标检测方法综述;钱立志;《兵工学报》;1-17 *

Also Published As

Publication number Publication date
CN115861185A (zh) 2023-03-28

Similar Documents

Publication Publication Date Title
CN115861185B (zh) 一种田间复杂背景的稻飞虱计数方法
CN109239102B (zh) 一种基于cnn的柔性电路板外观缺陷检测方法
CN108875821A (zh) 分类模型的训练方法和装置、移动终端、可读存储介质
CN112597985B (zh) 一种基于多尺度特征融合的人群计数方法
CN109035273B (zh) 一种免疫层析试纸卡的图像信号快速分割方法
CN110991511A (zh) 一种基于深度卷积神经网络的向日葵作物种子分拣方法
CN112862849B (zh) 一种基于图像分割和全卷积神经网络的田间稻穗计数方法
CN110070071B (zh) 一种基于图像识别的生姜茎叶病虫害识别方法及系统
KR102141302B1 (ko) 회귀 딥러닝 모델 기반의 영상 객체 검출 방법 및 영상처리장치
CN112529005B (zh) 基于语义特征一致性监督金字塔网络的目标检测方法
CN114973002A (zh) 一种基于改进的YOLOv5的麦穗检测方法
CN112686152B (zh) 一种多尺寸输入和多尺寸目标的农作物病虫害识别方法
CN106991428A (zh) 基于自适应池化模型的害虫图像识别方法
CN111797760A (zh) 基于Retinanet改进的农作物病虫害识别方法
CN112036300B (zh) 一种基于多尺度时空传播层的运动目标检测方法
CN113313031A (zh) 一种基于深度学习的车道线检测和车辆横向定位方法
CN116071315A (zh) 一种基于机器视觉的产品可视缺陷检测方法及系统
CN111881914B (zh) 一种基于自学习阈值的车牌字符分割方法及系统
CN114241344A (zh) 一种基于深度学习的植物叶片病虫害严重程度评估方法
CN110321869A (zh) 基于多尺度融合网络的人员检测和提取方法
CN112766305B (zh) 一种基于端到端度量网络的视觉slam闭环检测方法
CN115631186B (zh) 一种基于双分支神经网络的工业元件表面缺陷检测方法
CN116778293A (zh) 一种基于掩膜的图像融合方法
CN117456198A (zh) 一种基于改进的Yolov5神经网络的输电线路故障检测方法
CN116129327A (zh) 一种基于改进YOLOv7算法的红外车辆检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant