CN115713755A - 一种高效精准的草地贪夜蛾的图像识别方法 - Google Patents

一种高效精准的草地贪夜蛾的图像识别方法 Download PDF

Info

Publication number
CN115713755A
CN115713755A CN202310023718.1A CN202310023718A CN115713755A CN 115713755 A CN115713755 A CN 115713755A CN 202310023718 A CN202310023718 A CN 202310023718A CN 115713755 A CN115713755 A CN 115713755A
Authority
CN
China
Prior art keywords
model
image
spodoptera frugiperda
classification
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310023718.1A
Other languages
English (en)
Inventor
张浩文
吴孔明
杨现明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanya National Academy Of Southern Propagation Chinese Academy Of Agricultural Sciences
Institute of Plant Protection of Chinese Academy of Agricultural Sciences
Original Assignee
Sanya National Academy Of Southern Propagation Chinese Academy Of Agricultural Sciences
Institute of Plant Protection of Chinese Academy of Agricultural Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanya National Academy Of Southern Propagation Chinese Academy Of Agricultural Sciences, Institute of Plant Protection of Chinese Academy of Agricultural Sciences filed Critical Sanya National Academy Of Southern Propagation Chinese Academy Of Agricultural Sciences
Priority to CN202310023718.1A priority Critical patent/CN115713755A/zh
Publication of CN115713755A publication Critical patent/CN115713755A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明提供一种高效精准的草地贪夜蛾的图像识别方法,包括获取带有幼虫或成虫的图像,还包括以下步骤:建立包含草地贪夜蛾在内的玉米田间常见害虫的图像数据库;基于优化分类模型和目标定位建立完整的二阶段深度卷积神经网络识别模型;对所述二阶段深度卷积神经网络识别模型进行训练;将所述带有幼虫或成虫的图像输入到训练好的所述二阶段深度卷积神经网络识别模型中,并输出识别结果。本发明提出了一种高效精准的草地贪夜蛾的图像识别方法,设计了一种基于EfficientNet的二阶段分类模型MaizePestNet,可通过引入梯度类激活热力图Grad‑CAM算法进行目标定位降低背景干扰、提高分类精度,并通过知识蒸馏方法压缩模型的参数和体积。

Description

一种高效精准的草地贪夜蛾的图像识别方法
技术领域
本发明涉及虫害图像识别的技术领域,特别是一种高效精准的草地贪夜蛾的图像识别方法。
背景技术
草地贪夜蛾种群主要危害玉米,玉米田的主要害虫有斜纹夜蛾Spodoptera litura(Fabricius)、甜菜夜蛾Spodoptera exigua(Hübne)、棉铃虫Helicoverpa. Armigera(Hübne)、亚洲玉米螟Ostrinia. Furnacalis(Guenée)、粘虫Mythimna. Separata(Walker)、桃蛀螟Conogethes punctiferalis(Guenée)和二点委夜蛾Athetis lepigone(Moschller)等30余种。草地贪夜蛾入侵后,玉米生产上急需一种简便、精准的技术平台识别该虫,帮助农业技术人员和农民做好监测与防控工作。
目前主流的分类模型有VGG、ResNet、DenseNet等。为了对目标实现准确定位,YOLO、SSD、Faster-RCNN等传统目标检测算法也较多应用于害虫识别,但这些目标检测模型的训练需要大量人工标记,对硬件和算力的要求也较高,无法满足低成本、实时性及适用于智能手机轻量化的需求。此外,玉米田间的害虫识别通常只需对单目标进行拍照识别,拍摄图像中的无关背景严重影响识别精度,因此,如何低成本地解决精准定位虫体、排除无关背景以提高识别精度是值得研究的问题。
2019年9月第41卷第9期的西南大学学报公开了于业达、顾偌铖、唐运林、韦俊宏、潘国庆和陈通的题目为《基于深度学习的草地贪夜蛾自动识别》的文章,该方法采集了不同地域、不同生长区间的草地贪夜蛾及相似物种图片,建立了一个草地贪夜蛾识别数据库,利用基于特征融合的深度学习算法,建立了一个三通道T深度卷积神经网络,在现有数据集上的平局识别率达到97%,为草地贪夜蛾的智能识别与防控工作提供了技术支撑。该方法的缺点是样本量小,识别种类少,实际拍摄时难以获取清晰目标虫体以进行准确分类,使得模型适用性不足。且虫体特征复杂多变,不一定能采集三通道的有效信息供模型分类。
发明内容
为了解决上述的技术问题,本发明提出了一种高效精准的草地贪夜蛾的图像识别方法,设计了一种基于EfficientNet的二阶段分类模型MaizePestNet,可通过引入梯度类激活热力图Grad-CAM算法进行目标定位降低背景干扰、提高分类精度,并通过知识蒸馏方法压缩模型的参数和体积。
本发明提供一种高效精准的草地贪夜蛾的图像识别方法,包括获取带有幼虫或成虫的图像,还包括以下步骤:
步骤1:建立包含草地贪夜蛾在内的玉米田间常见害虫的图像数据库;
步骤2:基于优化分类模型和目标定位建立完整的二阶段深度卷积神经网络识别模型;
步骤3:对所述二阶段深度卷积神经网络识别模型进行训练;
步骤4:将所述带有幼虫或成虫的图像输入到训练好的所述二阶段深度卷积神经网络识别模型中,并输出识别结果。
优选的是,所述优化分类模型的方法包括以下子步骤:
步骤201:提取分类模型中影响模型精度的要素;
步骤202:使用不同的系数计算得到基础模型和不同尺度的模型;
步骤203:采用知识蒸馏方法,将8个不同尺度模型中精度最高的模型作为教师模型,用于训练EfficientNet-B0模型,从而实现EfficientNet-B0模型达到最优分类精度,得到优化分类模型。
在上述任一方案中优选的是,影响模型精度的所述要素包括网络深度d、网络宽度w和输入图像分辨率r,公式为
Figure 254025DEST_PATH_IMAGE001
Figure 469368DEST_PATH_IMAGE002
Figure 842580DEST_PATH_IMAGE003
Figure 972210DEST_PATH_IMAGE004
Figure 380058DEST_PATH_IMAGE005
其中,α是网络深度分配系数,β是网络宽度分配系数,γ是网络分辨率分配系数,ϕ是模型资源扩展系数,s.t.为约束条件。
在上述任一方案中优选的是,匹配不同系数以实现模型的最高分类精度。
在上述任一方案中优选的是,所述基础模型的计算方法为固定公式中的ϕ=1,通过NAS搜索得出最优的αβγ,得到基础模型B0。
在上述任一方案中优选的是,所述不同尺度的模型的计算方法为固定αβγ的值,使用不同的ϕ,对所述基础模型的三个维度同时扩展,,得到不同尺度的B1、B2、B3、B4、B5、B6、B7共 7个模型。
在上述任一方案中优选的是,所述完整的二阶段深度卷积神经网络识别模型包括两个阶段:
第一阶段:进行目标定位;
第二阶段:根据定位框对原始图像进行等比例反向裁剪并再次输入EfficientNet-B0网络进行精细分类。
在上述任一方案中优选的是,所述目标定位的方法包括以下子步骤:
步骤211:使用Grad-cam算法求出目标在图像中的激活热图,从预测类别对特征图反向求梯度权重;
步骤212:将所述梯度权重分别与第k个特征图A k 进行加权计算,对加权结果做Relu处理得到对应类别c的激活热力图;
步骤213:进行凸多边形检测以获取目标区域。
在上述任一方案中优选的是,所述梯度权重的计算公式为
Figure 671362DEST_PATH_IMAGE006
其中,
Figure 735133DEST_PATH_IMAGE007
为第k个特征图对类别c的权重,Z为特征图个数,i为特征图的像素横向位 置,j为特征图的像素纵向位置,y c 为所分类别的分值,
Figure 26043DEST_PATH_IMAGE008
为第k个特征图中坐标(x,y)处的 像素值。
在上述任一方案中优选的是,所述激活热力图的计算公式为
Figure 429343DEST_PATH_IMAGE009
其中,
Figure 16182DEST_PATH_IMAGE010
为计算后只保留正值的激活热力值。
在上述任一方案中优选的是,所述步骤23包括以下子步骤:
步骤2131:对所述激活热力图做二值化处理;
步骤2132:进行最大连通域提取,得出二进制图像中单个对象的凸包图像;
步骤2133:根据原始图像与压缩图像之间的长宽比例,计算出原始图像的裁剪区域。
在上述任一方案中优选的是,在所述步骤3中,训练分类模型时,采用加权的交叉熵损失函数,按照训练图像样本数量的倒数计算类别权重,公式为
Figure 239353DEST_PATH_IMAGE011
其中,
Figure 773103DEST_PATH_IMAGE012
为损失函数,
Figure 155542DEST_PATH_IMAGE013
为预测值,y为真实值,w i 为权重,
Figure 54228DEST_PATH_IMAGE014
为第i个样本的预 测值,y i 为第i个样本的真实值。
在上述任一方案中优选的是,在所述步骤3中,所述优化蒸馏分类模型的损失函数为
Figure 390794DEST_PATH_IMAGE015
Figure 134759DEST_PATH_IMAGE016
Figure 574968DEST_PATH_IMAGE017
其中,
Figure 503609DEST_PATH_IMAGE018
Figure 701372DEST_PATH_IMAGE019
分别为老师网络和学生网络经过softmax-T函数计算输出的软标 签,z i 为第i个样本,T为蒸馏温度,z j 为第j个样本,α为蒸馏系数,L KD (W student ) 为损失函数,KLdiv为KL散度函数,CrossEntropy为交叉熵函数,Q s 为学生网络的预测输出结果,y true 为真 实标签值。
本发明提出了一种高效精准的草地贪夜蛾的图像识别方法,采用知识蒸馏技术进一步提升EfficientNet模型的分类精度,同时具有更精简的体积和更快的推理速度,无需对数据集进行人工标注,为草地贪夜蛾的辨识提供了一种精准、高效、便捷的方法,为草地贪夜蛾入侵地区玉米害虫的监测预警和防治工作提供了科技支撑。
附图说明
图1为按照本发明的高效精准的草地贪夜蛾的图像识别方法的一优选实施例的流程图。
图2为按照本发明的高效精准的草地贪夜蛾的图像识别方法的EfficientNet-B0网络的一实施例的结构示意图。
图3为按照本发明的高效精准的草地贪夜蛾的图像识别方法的卷积Block注意力机制的一实施例的结构示意图。
图4为按照本发明的高效精准的草地贪夜蛾的图像识别方法的一优选实施例的训练流程图。
图5为按照本发明的高效精准的草地贪夜蛾的图像识别方法的二阶段深度卷积神经网络识别模型的一实施例的结构示意图。
图6为按照本发明的高效精准的草地贪夜蛾的图像识别方法的使用Grad-CAM算法进行定位的一实施例的幼虫识别结果示意图。
图7为按照本发明的高效精准的草地贪夜蛾的图像识别方法的使用Grad-CAM算法进行定位的一实施例的成虫识别结果示意图。
具体实施方式
下面结合附图和具体的实施例对本发明做进一步的阐述。
实施例一
如图1所示,执行步骤100,获取带有幼虫或成虫的图像。
执行步骤110,建立包含草地贪夜蛾在内的玉米田间常见害虫的图像数据库。
执行步骤120,基于优化分类模型和目标定位建立完整的二阶段深度卷积神经网络识别模型。完整的二阶段深度卷积神经网络识别模型包括两个阶段:
第一阶段:进行目标定位;
第二阶段:根据定位框对原始图像进行等比例反向裁剪并再次输入EfficientNet-B0网络进行精细分类。
其中,优化分类模型的方法包括以下子步骤:
执行步骤1201,提取分类模型中影响模型精度的要素,要素包括网络深度d、网络宽度w和输入图像分辨率r,公式为
Figure 373662DEST_PATH_IMAGE001
Figure 606060DEST_PATH_IMAGE002
Figure 493155DEST_PATH_IMAGE020
Figure 912635DEST_PATH_IMAGE021
Figure 591878DEST_PATH_IMAGE022
其中,α是网络深度分配系数,β是网络宽度分配系数,γ是网络分辨率分配系数,ϕ是模型资源扩展系数,s.t.为约束条件。
执行步骤1202,使用不同的系数计算得到基础模型和不同尺度的模型,匹配不同系数以实现模型的最高分类精度。基础模型的计算方法为固定公式中的ϕ=1,通过NAS搜索得出最优的αβγ,得到基础模型B0;不同尺度的模型的计算方法为固定αβγ的值,使用不同的ϕ,对所述基础模型的三个维度同时扩展,得到不同尺度的B1、B2、B3、B4、B5、B6、B7共 7个模型。
执行步骤1203,采用知识蒸馏方法,将8个不同尺度模型中精度最高的模型作为教师模型,用于训练EfficientNet-B0模型,从而实现EfficientNet-B0模型达到最优分类精度,得到优化分类模型。
目标定位的方法包括以下子步骤:
执行步骤1211,使用Grad-cam算法求出目标在图像中的激活热图,从预测类别对特征图反向求梯度权重,梯度权重的计算公式为
Figure 537838DEST_PATH_IMAGE006
其中,
Figure 949227DEST_PATH_IMAGE007
为第k个特征图对类别c的权重,Z为特征图个数,i为特征图的像素横向位 置,j为特征图的像素纵向位置,y c 为所分类别的分值,
Figure 980637DEST_PATH_IMAGE023
为第k个特征图中坐标(x,y)处的 像素值。
执行步骤1212,将所述梯度权重分别与第k个特征图A k 进行加权计算,对加权结果做Relu处理得到对应类别c的激活热力图,激活热力图的计算公式为
Figure 135675DEST_PATH_IMAGE009
其中,
Figure 703185DEST_PATH_IMAGE010
为计算后只保留正值的激活热力值。
执行步骤1213,进行凸多边形检测以获取目标区域,包括以下子步骤:
执行步骤12131,对所述激活热力图做二值化处理;
执行步骤12132,进行最大连通域提取,得出二进制图像中单个对象的凸包图像;
执行步骤12133,根据原始图像与压缩图像之间的长宽比例,计算出原始图像的裁剪区域。
执行步骤130,对所述二阶段深度卷积神经网络识别模型进行训练。训练分类模型时,采用加权的交叉熵损失函数,按照训练图像样本数量的倒数计算类别权重,公式为
Figure 285476DEST_PATH_IMAGE024
其中,
Figure 7444DEST_PATH_IMAGE012
为损失函数,
Figure 825228DEST_PATH_IMAGE013
为预测值,y为真实值,w i 为权重,
Figure 355566DEST_PATH_IMAGE014
为第i个样本的预 测值,y i 为第i个样本的真实值。
优化蒸馏分类模型的损失函数为
Figure 233392DEST_PATH_IMAGE025
Figure 380340DEST_PATH_IMAGE026
Figure 703612DEST_PATH_IMAGE017
其中,
Figure 478670DEST_PATH_IMAGE027
Figure 137184DEST_PATH_IMAGE028
分别为老师网络和学生网络经过softmax-T函数计算输出的软标 签,z i 为第i个样本,T为蒸馏温度,z j 为第j个样本,α为蒸馏系数,L KD (W student ) 为损失函数,KLdiv为KL散度函数,CrossEntropy为交叉熵函数,Q s 为学生网络的预测输出结果,y true 为真 实标签值,Q s 为学生网络的预测输出结果,y true 为真实标签值。
执行步骤140,将所述带有幼虫或成虫的图像输入到训练好的所述二阶段深度卷积神经网络识别模型中,并输出识别结果。
实施例二
一种高效精准的草地贪夜蛾的图像识别方法,针对玉米田草地贪夜蛾识别特点和需求,从优化深度卷积神经网络的结构和减少图像背景干扰两个方面进行模型构建。首先,建立了一个包含草地贪夜蛾在内的36种玉米田间常见害虫的图像数据库,含成虫和幼虫两种虫态。其次,设计基于EfficientNet-B0的二阶段分类模型MaizePestNet,使用知识蒸馏技术提升EfficientNet-B0模型的分类精度,通过梯度类激活热力图Grad-CAM算法实现目标定位降低背景干扰,将框定的目标输入EfficientNet-B0模型再分类以获得高精度的分类结果,最后,基于该模型开发了草地贪夜蛾的图像识别系统,可通过拍照玉米田害虫图像,进行草地贪夜蛾及其他害虫的种类鉴定。
1、分类网络和知识蒸馏
本方法采用了EfficientNet作为分类模型,它是一种基于MobileV2网络的组合缩放模型,在ImageNet数据集上表现SOTA,MobileV2网络本身就是一个轻量级,精简的高效模型,再将网络深度(depth)、网络宽度(width)和输入图像分辨率(resolution)这三个影响模型精度的要素结合起来,调整这三个要素以完成新网络的设计,同时采用了一组固定的缩放系数统一缩放网络深度,宽度和分辨率。
Depth:
Figure 99324DEST_PATH_IMAGE029
(2 - 1)
Width:
Figure 993330DEST_PATH_IMAGE002
(2 - 2)
Resolution:
Figure 858781DEST_PATH_IMAGE020
(2 - 3)
Figure 281672DEST_PATH_IMAGE021
(2 - 4)
Figure 731108DEST_PATH_IMAGE022
(2 - 5)
公式中,d 是网络深度,w是网络宽度,r是图片分辨率,α是网络深度分配系数,β是网络宽度分配系数,γ是网络分辨率分配系数,ϕ是模型资源扩展系数。
蒸馏技术:首先固定公式中的ϕ=1,然后通过NAS搜索得出最优的αβγ,得出最精简最优化的基础模型EfficientNet-B0.然后固定αβγ的值,使用不同的ϕ,得到不同尺度的EfficientNet-B1, B2, B3, B4, B5, B6, B7共 8个模型。随着φ值增加,对基准模型的三个维度同时扩展,模型参数会增加,性能也会提升,计算资源的消耗也变大。
EfficientNet还添加了注意力机制。如图2所示,EfficientNet是由多个卷积Block结构块组成, 例如Efficientnet-B0是由16个Blocks堆叠构成,分为1、2、2、3、3、4、1个Block。如图3所示,Block的总体设计思路是Inverted residuals结构和残差结构,先输入的特征层进行1x1卷积升维,再做3x3或5x5深度可分离卷积,再进入一个关于通道的注意力机制模块,它负责将通道权重和特征做加权处理,最后通过1x1卷积降维后增加一个大的残差边,构建成一个完整的Block。
通过训练多个不同类型的主流分类模型,包括ResNet101,DenseNet161和EfficientNet-B1~B5,选择其中精度最高的模型作为teacher模型用以训练EfficientNet-B0模型,训练流程示意图如图4所示。
2、二阶段深度卷积神经网络识别模型MaizePestNet
MaizePestNet是基于蒸馏后的EfficientNet-B0构建而成,同时融合Grad-cam算法去除无关背景以提升害虫识别精度。首先使用Grad-cam算法求出目标在图像中的激活热图,从预测类别对特征图反向求梯度,该梯度是特征图对预测结果的影响权重,权重计算公式如下,
Figure 163226DEST_PATH_IMAGE030
(2 - 6)
其中
Figure 614674DEST_PATH_IMAGE007
为第k个特征图对类别c的权重,Z为特征图个数,y c 为所分类别的分值,
Figure 474045DEST_PATH_IMAGE023
为第k个特征图中坐标(x,y)处的像素值。得到每个特征图的权重
Figure 879619DEST_PATH_IMAGE007
后,分别与第k个特 征图A k 进行加权计算,计算公式如下,对加权结果做Relu处理即可得到对应类别c的激活热 力图。
Figure 115428DEST_PATH_IMAGE009
(2 – 7)
获取激活热图后则进行凸多边形检测以获取目标区域。如图4所示,以EfficientNet-B0为例首先对激活热力图(224*224)做二值化处理,即坐标(x,y)对应的激活系数超过一定阈值x设置为True,将x设置为0.2,0.3,0.4,0.5,0.6分别进行测试。其次进行最大连通域提取,得出二进制图像中单个对象的凸包图像,凸包是包含输入图像中所有白色像素周围的最小凸多边形,由于是凸多边形,因此在上下左右四个方向一定存在极值,可以求出最小矩形框,最后根据原始图像与压缩图像之间的长宽比例,计算出原始图像的裁剪区域。
结合KD后的分类模型和目标定位建立完整的二阶段识别模型。如图5所示,第一阶段进行目标初始定位。将原始图像压缩成224*224大小尺寸,输入EfficientNet-B0网络提取特征图Feature Maps,后经过全连接层(Full Connected Layer)进行初始分类,根据分类结果对所有特征图求权重Wi,对特征图加权和后通过Relu函数筛选出对于所分类别有正影响的像素,得到梯度类激活热力图,随后对热力图进行定位框计算,第二阶段根据定位框对原始图像进行等比例反向裁剪并再次输入EfficientNet-B0网络进行精细分类。
3、模型损失函数
训练分类模型时,为解决样本不平衡性,如公式所示,采用了加权的交叉熵损失函 数,按照训练图像样本数量的倒数计算类别权重,对于训练图像少的类别给予更多的权重, 当模型预测错误时,得到更多得惩罚。其中w i 是每个类比的权重,
Figure 689891DEST_PATH_IMAGE031
为模型预测结果,y为真 实标签值。
Figure 720164DEST_PATH_IMAGE032
对于知识蒸馏模型,损失函数如下列公式所示,其中α为蒸馏系数,是一个超参数 设置为0.2-0.8共4个梯度,T为蒸馏温度用于提升蒸馏性能,设置为2-10共5个梯度,
Figure 878613DEST_PATH_IMAGE033
Figure 652534DEST_PATH_IMAGE034
分别为老师网络和学生网络经过softmax-T函数计算输出的软标签,Q s 为学生网络的预 测输出结果,y true 为真实标签值。
Figure 78574DEST_PATH_IMAGE035
Figure 279748DEST_PATH_IMAGE036
Figure 456651DEST_PATH_IMAGE017
4、超参数设置和评价指标
对训练集中的图像进行了随机旋转,随机长宽比裁剪,随机水平翻转处理的数据增强操作,最后将图片尺寸Resize到224*224,用于ResNet,DenseNet和EfficientNet-B0模型的训练,对于其他EfficientNet模型的训练,根据缩放参数调整输入图片的size大小。基于ImageNet的预训练模型进行迁移学习以加速收敛,对每一类模型分别训练50轮, batch大小设置为16,由于显存限制,EfficientNet-B3的batchsize设置为8,EfficientNet-B4和B5的batchsize设置为4,采用随机梯度下降SGD(Stochastic Gradient Descent)优化方法,权值衰减系数设置为0.0005,初始学习率设置为0.01。学习率调整策略为带热启动的cosine退火衰减调整。
采用平均精度(Accuracy), 多分类的Marco精准率(Precision),Marco召回率(Recall),Marco F1-Score来评价不同模型在测试集上的精度,其中 Accuracy ,Precision,Recall, F1-Score的计算公式如下:
Figure 768684DEST_PATH_IMAGE037
Figure 488378DEST_PATH_IMAGE038
Figure 893077DEST_PATH_IMAGE039
Figure 432643DEST_PATH_IMAGE040
式中 TP (True Positive)为真正例,即实际类别是正例的样本被预测为正例,FP(False Positive)为假正例,即实际类别是负例的样本被预测为正例,TN (TrueNegative)为真反例,即实际类别是反例的样本被预测为反例,FN (False Negative)为假反例,即实际类别是正例的样本被预测为反例。将模型返回的Top-1类别作为识别结果,平均精度为模型正确分类样本与总数之比,Marco-Precision,Marco-Recall和Marco-F1是先计算出每个类别的Precision,Recall和 F1值,然后求平均值。
5、数据集的制作与预处理
将训练数据集以8:1:1的总体比例随机划分为训练集(train dataset)、验证集(valid dataset), 测试集(test dataset)。其中,训练集用于训练模型,验证集用于模型选择和调参,测试集用于对模型进行泛化性能的评估,不参与模型训练。训练前对图像数据集中的害虫进行目标截取以消除背景进行分类。
6、MaizePestNet识别结果对比
综合使用知识蒸馏和Grad-CAM算法的结果。分别在测试数据集上进行测试,结果如表1所示。通过融合知识蒸馏和Grad-CAM算法我们基于EfficientNet-B0模型实现了93.32%的识别精度,高于其他模型,表明利用也可以较准确地目标定位和精准的识别,实现了模型预期效果。其Grad-CAM热力图计算、定位和识别效果(激活阈值为0.4)如图6和图7所示。
Figure 79525DEST_PATH_IMAGE041
表1基于EfficientNet-B0的二阶段模型识别效果
7、模型的评价和结论
作为一种弱监督的目标定位和识别模型,相比传统分类模型有以下几个优势,1.采用了知识蒸馏技术进一步提升了的EfficientNet模型的分类精度,同时具有更精简的体积和更快的推理速度,2.相比训练传统的目标检测模型,无需对数据集进行人工标注,仅通过类别标签即可训练模型,3.模型对算力要求低,对资源消耗小,可以部署在无GPU的服务器或者移动终端中。
本发明建立了一个包含草地贪夜蛾在内的36种玉米田间常见害虫的图像数据库,含成虫和幼虫两种虫态。
本发明设计了基于EfficientNet-B0的二阶段分类模型MaizePestNet,平均识别精度超过93%,模型体积减少10倍以上,优于对照组模型。实际具体来说,有3个与其他识别方法不同的创新点:
1)EfficientNet-B0本身就是一种高效且精度高的分类网络模型,保证精度的同时,还降低了模型部署成本和模型计算成本;
2)使用了知识蒸馏技术进一步提升EfficientNet-B0模型的分类精度;
3)通过梯度类激活热力图Grad-CAM算法实现目标定位降低背景干扰。
本发明基于MaizePestNet开发了草地贪夜蛾的图像识别系统和手机端小程序,可通过拍照玉米田害虫图像,随时随地进行草地贪夜蛾及其他害虫的种类鉴定。
为了更好地理解本发明,以上结合本发明的具体实施例做了详细描述,但并非是对本发明的限制。凡是依据本发明的技术实质对以上实施例所做的任何简单修改,均仍属于本发明技术方案的范围。本说明书中每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

Claims (5)

1.一种高效精准的草地贪夜蛾的图像识别方法,包括获取带有幼虫或成虫的图像,其特征在于,还包括以下步骤:
步骤1:建立包含草地贪夜蛾在内的玉米田间常见害虫的图像数据库;
步骤2:基于优化分类模型和目标定位建立完整的二阶段深度卷积神经网络识别模型;所述优化分类模型的方法包括以下子步骤:
步骤201:提取分类模型中影响模型精度的要素;影响模型精度的所述要素包括网络深度d、网络宽度w和输入图像分辨率r,公式为
Figure 396641DEST_PATH_IMAGE001
Figure 579361DEST_PATH_IMAGE002
Figure 798246DEST_PATH_IMAGE003
Figure 599980DEST_PATH_IMAGE004
Figure 679931DEST_PATH_IMAGE005
其中,α是网络深度分配系数,β是网络宽度分配系数,γ是网络分辨率分配系数,ϕ是模型资源扩展系数,s.t.为约束条件;
步骤202:使用不同的系数计算得到基础模型和不同尺度的模型;
所述基础模型的计算方法为固定公式中的ϕ=1,通过NAS搜索得出最优的αβγ,得到基础模型B0;
所述不同尺度的模型的计算方法为固定αβγ的值,使用不同的ϕ,对所述基础模型的三个维度同时扩展,得到不同尺度的B1、B2、B3、B4、B5、B6、B7共7个模型;步骤203:采用知识蒸馏方法,将8个不同尺度模型中精度最高的模型作为教师模型,用于训练EfficientNet-B0模型,使得所述EfficientNet-B0模型达到最优分类精度,得到优化分类模型;
步骤3:对所述二阶段深度卷积神经网络识别模型进行训练;
步骤4:将所述带有幼虫或成虫的图像输入到训练好的所述二阶段深度卷积神经网络识别模型中,并输出识别结果。
2.如权利要求1所述的高效精准的草地贪夜蛾的图像识别方法,其特征在于,所述完整的二阶段深度卷积神经网络识别模型包括两个阶段:
第一阶段:进行目标定位;
第二阶段:根据定位框对原始图像进行等比例反向裁剪并再次输入EfficientNet-B0网络进行精细分类。
3.如权利要求2所述的高效精准的草地贪夜蛾的图像识别方法,其特征在于,所述目标定位的方法包括以下子步骤:
步骤211:使用Grad-cam算法求出目标在图像中的激活热图,从预测类别对特征图反向求梯度权重;
步骤212:将所述梯度权重分别与第k个特征图A k 进行加权计算,对加权结果做Relu处理得到对应类别c的激活热力图;
步骤213:进行凸多边形检测以获取目标区域。
4.如权利要求3所述的高效精准的草地贪夜蛾的图像识别方法,其特征在于,所述梯度权重的计算公式为
Figure 174497DEST_PATH_IMAGE006
其中,
Figure 972689DEST_PATH_IMAGE007
为第k个特征图对类别c的权重,Z为特征图个数,i为特征图的像素横向位置,j 为特征图的像素纵向位置,y c 为所分类别的分值,
Figure 312535DEST_PATH_IMAGE008
为第k个特征图中坐标(x,y)处的像素 值。
5.如权利要求4所述的高效精准的草地贪夜蛾的图像识别方法,其特征在于,所述激活热力图的计算公式为
Figure 512572DEST_PATH_IMAGE009
其中,
Figure 676575DEST_PATH_IMAGE010
为计算后只保留正值的激活热力值。
CN202310023718.1A 2023-01-09 2023-01-09 一种高效精准的草地贪夜蛾的图像识别方法 Pending CN115713755A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310023718.1A CN115713755A (zh) 2023-01-09 2023-01-09 一种高效精准的草地贪夜蛾的图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310023718.1A CN115713755A (zh) 2023-01-09 2023-01-09 一种高效精准的草地贪夜蛾的图像识别方法

Publications (1)

Publication Number Publication Date
CN115713755A true CN115713755A (zh) 2023-02-24

Family

ID=85236183

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310023718.1A Pending CN115713755A (zh) 2023-01-09 2023-01-09 一种高效精准的草地贪夜蛾的图像识别方法

Country Status (1)

Country Link
CN (1) CN115713755A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116894983A (zh) * 2023-09-05 2023-10-17 云南瀚哲科技有限公司 基于知识蒸馏的细粒度农业病虫害图像识别方法及系统
CN117237814A (zh) * 2023-11-14 2023-12-15 四川农业大学 一种基于注意力机制优化的大规模果园虫情监测方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112906747A (zh) * 2021-01-25 2021-06-04 北京工业大学 一种基于知识蒸馏的图像分类方法
CN113449806A (zh) * 2021-07-12 2021-09-28 苏州大学 基于层次结构的二阶段林业害虫识别与检测系统及方法
CN113837073A (zh) * 2021-09-22 2021-12-24 广西大学 一种基于卷积神经网络的核桃虫害识别系统及检测方法
CN114241282A (zh) * 2021-11-04 2022-03-25 河南工业大学 一种基于知识蒸馏的边缘设备场景识别方法及装置
CN115019115A (zh) * 2021-12-31 2022-09-06 华北水利水电大学 基于改进yolov4的烟叶烟梗部位的识别定位系统
CN115393671A (zh) * 2022-08-25 2022-11-25 河海大学 基于多教师知识蒸馏和归一化注意力的岩石类别预测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112906747A (zh) * 2021-01-25 2021-06-04 北京工业大学 一种基于知识蒸馏的图像分类方法
CN113449806A (zh) * 2021-07-12 2021-09-28 苏州大学 基于层次结构的二阶段林业害虫识别与检测系统及方法
CN113837073A (zh) * 2021-09-22 2021-12-24 广西大学 一种基于卷积神经网络的核桃虫害识别系统及检测方法
CN114241282A (zh) * 2021-11-04 2022-03-25 河南工业大学 一种基于知识蒸馏的边缘设备场景识别方法及装置
CN115019115A (zh) * 2021-12-31 2022-09-06 华北水利水电大学 基于改进yolov4的烟叶烟梗部位的识别定位系统
CN115393671A (zh) * 2022-08-25 2022-11-25 河海大学 基于多教师知识蒸馏和归一化注意力的岩石类别预测方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116894983A (zh) * 2023-09-05 2023-10-17 云南瀚哲科技有限公司 基于知识蒸馏的细粒度农业病虫害图像识别方法及系统
CN116894983B (zh) * 2023-09-05 2023-11-21 云南瀚哲科技有限公司 基于知识蒸馏的细粒度农业病虫害图像识别方法及系统
CN117237814A (zh) * 2023-11-14 2023-12-15 四川农业大学 一种基于注意力机制优化的大规模果园虫情监测方法
CN117237814B (zh) * 2023-11-14 2024-02-20 四川农业大学 一种基于注意力机制优化的大规模果园虫情监测方法

Similar Documents

Publication Publication Date Title
CN113065558B (zh) 一种结合注意力机制的轻量级小目标检测方法
Ale et al. Deep learning based plant disease detection for smart agriculture
CN107016405B (zh) 一种基于分级预测卷积神经网络的害虫图像分类方法
CN111950453B (zh) 一种基于选择性注意力机制的任意形状文本识别方法
CN115713755A (zh) 一种高效精准的草地贪夜蛾的图像识别方法
CN112668630B (zh) 一种基于模型剪枝的轻量化图像分类方法、系统及设备
CN108960260B (zh) 一种分类模型生成方法、医学影像图像分类方法及装置
CN110428413B (zh) 一种用于灯诱设备下的草地贪夜蛾成虫图像检测方法
CN113160062B (zh) 一种红外图像目标检测方法、装置、设备及存储介质
CN108710893A (zh) 一种基于特征融合的数字图像相机源模型分类方法
CN109344851A (zh) 图像分类显示方法和装置、分析仪器和存储介质
CN109472801A (zh) 一种用于多尺度的神经形态检测和分割方法
CN109165698A (zh) 一种面向智慧交通的图像分类识别方法及其存储介质
CN102163285A (zh) 一种基于主动学习的跨域视频语义概念检测方法
CN112308825A (zh) 一种基于SqueezeNet的农作物叶片病害识别方法
CN116342931A (zh) 一种多尺度注意力的毛皮图像分类方法、系统和存储介质
Dong et al. Lightweight and efficient neural network with SPSA attention for wheat ear detection
Guehairia et al. Deep random forest for facial age estimation based on face images
CN111860601B (zh) 预测大型真菌种类的方法及装置
CN113361466A (zh) 一种基于多模态交叉指导学习的多光谱目标检测方法
CN117079226A (zh) 一种基于多尺度注意力机制的车辆重识别方法
CN116363518A (zh) 一种基于分焦平面偏振成像的伪装目标检测方法
CN116310386A (zh) 基于浅层自适应增强上下文的CenterNet小目标检测方法
CN116129189A (zh) 一种植物病害识别方法、设备、存储介质及装置
CN115631462A (zh) 基于am-yolox的草莓病虫害检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20230224

RJ01 Rejection of invention patent application after publication