CN114819052A - 一种基于改进的YOLOv5s模型的苹果病害识别方法 - Google Patents

一种基于改进的YOLOv5s模型的苹果病害识别方法 Download PDF

Info

Publication number
CN114819052A
CN114819052A CN202210199557.7A CN202210199557A CN114819052A CN 114819052 A CN114819052 A CN 114819052A CN 202210199557 A CN202210199557 A CN 202210199557A CN 114819052 A CN114819052 A CN 114819052A
Authority
CN
China
Prior art keywords
model
yolov5s
improved
module
apple
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210199557.7A
Other languages
English (en)
Inventor
孙丰刚
兰鹏
王云露
沈东健
张帆
葛成恺
张彬
周筑南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Agricultural University
Original Assignee
Shandong Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Agricultural University filed Critical Shandong Agricultural University
Priority to CN202210199557.7A priority Critical patent/CN114819052A/zh
Publication of CN114819052A publication Critical patent/CN114819052A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及神经网络与目标识别技术领域,更为具体来说,本申请涉及一种基于改进的YOLOv5s模型的苹果病害识别方法。所述方法包括:获取苹果病害数据集,并对所述苹果病害数据集进行预处理;对YOLOv5s模型进行轻量化改进;基于预处理后的苹果病害数据集对改进后的YOLOv5s模型进行训练;利用训练好的改进后的YOLOv5s模型对目标苹果病害图像进行识别。本申请改进后模型达到模型轻量化、存储占用低,利用训练好的改进后的YOLOv5s模型对目标苹果病害图像进行识别,识别速度快且识别精度高。

Description

一种基于改进的YOLOv5s模型的苹果病害识别方法
技术领域
本申请涉及神经网络与目标识别技术领域,更为具体来说,本申请涉及一种基于改进的YOLOv5s模型的苹果病害识别方法。
背景技术
苹果是世界上重要的水果作物,但病害的发生严重影响其产量和质量。及时准确地识别苹果病害能避免病害误识别带来的防治延误和农药滥用等情况,是实现苹果病害防治的重要一步。传统的苹果病害识别方法依赖于个人经验诊断,可靠性和时效性差,在苹果种植和生产规模不断扩大的现状下逐渐难以应对。随着计算机视觉技术的发展,通过人工智能的手段进行病害诊断成为农业发展的必然趋势。
卷积神经网络因其在图像识别领域的优异性能,成为常用的图像识别手段。目前,在病害识别领域,基于图像分类的卷积神经网络应用较多,但其单一图像预测单一标签的特性难以适用于多病害混杂的图像,在实际应用方面有所欠缺。特别地,目标检测作为图像分类的下游任务在进行特征提取的同时往往还要进行大量的锚框计算以对目标实例的位置信息进行预测,对存储和计算资源的占用往往较图像分类任务有所提升,然而却给模型在移动端的后期部署带来一定困难。
发明内容
基于上述技术问题,本发明旨在搭建存储占用低、识别速度快、识别精度高的苹果病害检测模型,该模型以YOLOv5s为基础骨架进行轻量化的改进。
本发明第一方面提供了一种基于改进的YOLOv5s模型的苹果病害识别方法,所述方法包括:
获取苹果病害数据集,并对所述苹果病害数据集进行预处理;
对YOLOv5s模型进行轻量化改进;
基于预处理后的苹果病害数据集对改进后的YOLOv5s模型进行训练;
利用训练好的改进后的YOLOv5s模型对目标苹果病害图像进行识别。
在本发明的一些实施例中,对所述苹果病害数据集进行预处理,包括:
将所述苹果病害数据集中的图像旋转预设角度,以模拟不同拍摄角度的图像;
对旋转后的图像色度、图像饱和度和图像对比度随机增强,以模拟不同光线条件下的图像;
对随机增强后的图像进行锐化处理,以模拟不同清晰度的图像。
在本发明的一些实施例中,所述对YOLOv5s模型进行轻量化改进,包括:
在YOLOv5s模型的骨干网络和颈部网络中配置轻量化幻影瓶颈层;
调整YOLOv5s模型的特征图的宽度;
在YOLOv5s模型的骨干网络中添加卷积块注意力模块,其中,所述卷积块注意力模块包括通道注意力模块和空间注意力模块。
在本发明的一些实施例中,所述对YOLOv5s模型进行轻量化改进还包括:
在YOLOv5s模型的颈部网络中配置特征金字塔模块;
在所述金字塔模块中构建二次堆叠模块。
在本发明的一些实施例中,在所述金字塔模块中构建二次堆叠模块,包括:
获取自注意机制的Transformer编码器;
堆叠两个基于所述自注意机制的Transformer编码器形成二次堆叠模块。
在本发明的一些实施例中,所述基于预处理后的苹果病害数据集对改进后的YOLOv5s模型进行训练之后,还包括:
对改进后的YOLOv5s模型进行评估;
选取评估后确定为训练好的改进后的YOLOv5s模型。
在本发明的一些实施例中,所述利用训练好的改进后的YOLOv5s模型对目标苹果病害进行识别,包括:
将目标苹果病害图像输入训练好的改进后的YOLOv5s模型;
包含所述轻量化幻影瓶颈层的骨干网络对所述目标苹果病害图像进行幻影卷积处理,再经过通道注意力模块和空间注意力模块的加权处理,得到第一特征图;
将所述第一特征图输入改进后的颈部网络,经过特征金字塔模块的特征融合处理,得到第二特征图;
对所述第二特征图进行预测,输出所述目标苹果病害图像所属病害的置信度。
本发明第二方面提供了一种基于改进的YOLOv5s模型的苹果病害识别装置,所述装置包括:
获取模块,用于获取苹果病害数据集,并对所述苹果病害数据集进行预处理;
改进模块,用于对YOLOv5s模型进行轻量化改进;
训练模块,用于基于预处理后的苹果病害数据集对改进后的YOLOv5s模型进行训练;
识别模块,用于利用训练好的改进后的YOLOv5s模型对目标苹果病害图像进行识别。
本发明第三方面提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取苹果病害数据集,并对所述苹果病害数据集进行预处理;
对YOLOv5s模型进行轻量化改进;
基于预处理后的苹果病害数据集对改进后的YOLOv5s模型进行训练;
利用训练好的改进后的YOLOv5s模型对目标苹果病害图像进行识别。
本发明第四方面提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取苹果病害数据集,并对所述苹果病害数据集进行预处理;
对YOLOv5s模型进行轻量化改进;
基于预处理后的苹果病害数据集对改进后的YOLOv5s模型进行训练;
利用训练好的改进后的YOLOv5s模型对目标苹果病害图像进行识别。
本申请的有益效果为:本申请在YOLOv5s模型的骨干网络和颈部网络中配置轻量化幻影瓶颈层,调整YOLOv5s模型的特征图的宽度,在YOLOv5s模型的骨干网络中添加卷积块注意力模块,并在YOLOv5s模型的颈部网络中配置特征金字塔模块,在所述金字塔模块中构建二次堆叠模块,这一系列改进使模型达到模型轻量化、存储占用低,利用训练好的改进后的YOLOv5s模型对目标苹果病害图像进行识别,识别速度快且识别精度高。特别是使用加权双向特征金字塔网络实现了双向跨尺度连接,提高了模型的表征学习能力,增强了特征的鲁棒性,而二次堆叠模块作为检测头,提高了模型的全局信息获取能力。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
构成说明书的一部分的附图描述了本申请的实施例,并且连同描述一起用于解释本申请的原理。
参照附图,根据下面的详细描述,可以更加清楚地理解本申请,其中:
图1示出了本申请一示例性实施例的基于改进的YOLOv5s模型的苹果病害识别方法步骤示意图;
图2示出了本申请一示例性实施例中改进后的YOLOv5s模型整体示意图;
图3示出了本申请一示例性实施例中改进后的YOLOv5s模型中特征金字塔模块工作过程示意图;
图4示出了本申请一示例性实施例改进后的YOLOv5s模型中二次堆叠模块及注意力机制模块工作过程示意图;
图5示出了本申请一示例性实施例的苹果病害识别效果示意图;
图6示出了本申请一示例性实施例的基于改进的YOLOv5s模型的苹果病害识别装置结构示意图;
图7示出了本申请一示例性实施例所提供的一种计算机设备的结构示意图;
图8示出了本申请一示例性实施例所提供的一种存储介质的示意图。
具体实施方式
以下,将参照附图来描述本申请的实施例。但是应该理解的是,这些描述只是示例性的,而并非要限制本申请的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本申请的概念。对于本领域技术人员来说显而易见的是,本申请可以无需一个或多个这些细节而得以实施。在其他的例子中,为了避免与本申请发生混淆,对于本领域公知的一些技术特征未进行描述。
应予以注意的是,这里所使用的术语仅是为了描述具体实施例,而非意图限制根据本申请的示例性实施例。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式。此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在所述特征、整体、步骤、操作、元件和/或组件,但不排除存在或附加一个或多个其他特征、整体、步骤、操作、元件、组件和/或它们的组合。
现在,将参照附图更详细地描述根据本申请的示例性实施例。然而,这些示例性实施例可以多种不同的形式来实施,并且不应当被解释为只限于这里所阐述的实施例。附图并非是按比例绘制的,其中为了清楚表达的目的,可能放大了某些细节,并且可能省略了某些细节。图中所示出的各种区域、层的形状以及它们之间的相对大小、位置关系仅是示例性的,实际中可能由于制造公差或技术限制而有所偏差,并且本领域技术人员根据实际所需可以另外设计具有不同形状、大小、相对位置的区域/层。
下面结合说明书附图1-8给出几个实施例来描述根据本申请的示例性实施方式。需要注意的是,下述应用场景仅是为了便于理解本申请的精神和原理而示出,本申请的实施方式在此方面不受任何限制。相反,本申请的实施方式可以应用于适用的任何场景。
目前,在病害识别领域,基于图像分类的卷积神经网络应用较多,但其单一图像预测单一标签的特性难以适用于多病害混杂的图像,在实际应用方面有所欠缺。目标检测技术以图像中的病斑为实例进行特征学习,可以在一张病害图像中输出多个病斑实例(类别信息+位置信息),从而达到识别多病害图像的目的。
目标检测作为图像分类的下游任务在进行特征提取的同时往往还要进行大量的锚框计算,以对目标实例的位置信息进行预测,对存储和计算资源的占用往往较图像分类任务有所提升,给模型在移动端的后期部署带来一定困难。而且为实现移动端部署的需要,对模型的轻量化处理往往带来一定的精度损失,从而寻求模型复杂度与精度的平衡成为深度学习病斑检测模型技术改进的难点之一。
因此,在本申请一些示例性实施例中,提供了一种基于改进的YOLOv5s模型的苹果病害识别方法,如图1所示,所述方法包括:
S1、获取苹果病害数据集,并对所述苹果病害数据集进行预处理;
S2、对YOLOv5s模型进行轻量化改进;
S3、基于预处理后的苹果病害数据集对改进后的YOLOv5s模型进行训练;
S4、利用训练好的改进后的YOLOv5s模型对目标苹果病害图像进行识别。
在具体实施中,S1中苹果病害数据集主要来自采集数据,小部分来自网络资源。病害图像种类包括苦痘病、炭疽病、果锈病、轮纹病等等,利用LabelImg标注工具标注图像病斑,划分训练集和测试集,并以VOC格式进行构建苹果病害数据集。S1中对所述苹果病害数据集进行预处理,包括:将所述苹果病害数据集中的图像旋转预设角度例如90度、180度、270度,以模拟不同拍摄角度的图像;对旋转后的图像色度、图像饱和度和图像对比度随机增强,以模拟不同光线条件下的图像;对随机增强后的图像进行锐化处理,以模拟不同清晰度的图像。
在具体实施中,参考图2至图4,S2对YOLOv5s模型进行轻量化改进包括:在YOLOv5s模型的骨干网络(Backbone)和颈部网络(Neck)中配置轻量化幻影瓶颈层;调整YOLOv5s模型的特征图的宽度,具体为特征图整体宽度由0.5调整为0.25;在YOLOv5s模型的骨干网络中添加卷积块注意力模块(Convolutional Block Attention Module,CBAM),其中,所述卷积块注意力模块包括通道注意力模块和空间注意力模块;在YOLOv5s模型的颈部网络中配置特征金字塔模块;在所述金字塔模块中构建二次堆叠模块。其中,在所述金字塔模块中构建二次堆叠模块(图2中的TR2模块),包括:获取自注意机制的Transformer编码器;堆叠两个基于所述自注意机制的Transformer编码器形成二次堆叠模块。
具体地,如图2所示,使用的幻影瓶颈层,能够以简单线性操作生成的Ghost特征代替正常卷积生成的冗余特征来降低模型复杂度。幻影卷积包括原始卷积和线性变换两部分。幻影在常规的卷积操作的基础上通过线性变换处理原始特征图生成幻影特征,并利用将两组特征图进行组合形成新的特征图。如图3所示,特征金字塔模块接续骨干网络,可以实现路径聚合从而使骨干网络输出的图像特征进一步融合。再如图3所示,改进YOLOv5s模型沿用BIFPN的思想,对处在同一层级的骨干网络生成的B2特征,特征金字塔网络(即特征金字塔模块)生成的F1特征和路径聚合网络生成的P1特征进行跨局部双向连接,从而形成鲁棒性更强的聚合特征P1特征。如图4所示,Transformer编码器模块1和Transformer编码器模块2堆叠形成二次堆叠模块,而就配置在检测头部位(介于预部网络与输出之间的位置),从而提高了模型的全局信息获取能力。
CBAM通过在空间和通道双重维度上对特征进行加权处理,从而提升模型在空间和通道上对局部信息和空间信息的关注度,包括通道注意力模块和空间注意力模块两部分。在通道注意力模块中,特征图F分别经过全局平均池化和最大池化变为两个通道映射,这两个特征映射通过两层共享的多层感知机进行处理得到的两个新特征,新特征相加后经过Sigmoid激活函数得到权重系数Mc。最后,权重系数Mc与特征F相乘生成缩放后的新特征。计算公式如下:
Mc(F)=σ(MLP(AvgPool(F)))+σ(MLP(MaxPool(F)))
其中,F代表原始特征图,表示Sigmoid激活函数,MLP代表多层感知器。在空间注意力模块中,模块对特征图F经过全局平均池化和最大池化形成的通道映射进行拼接,通过7×7的卷积操作和Sigmoid激活函数后得到权重系数Ms。最后,使用权重系数Ms和特征F’相乘得到新的特征图。计算过程如下:
Ms(F′)=f7×7[(AvgPool(F′);MaxPool(F′))]
其中,F‘代表原始特征图,f7×7代表7×7卷积层。
在一种优选的实施方式中,S3中基于预处理后的苹果病害数据集对改进后的YOLOv5s模型进行训练,采用数据分为两部分:于2021年9月到10月在山东省泰安市肥城市安临站镇黄土岭村采集的400张苦痘病、200张炭疽病,500张果锈病、100张轮纹病图像,相机型号Sony A6000;由网络爬取并筛选的200张炭疽病和轮纹病图像。所有图像均调整为为416×416像素,共1400张苹果果实病害图像。图像通过LabelImg工具进行标注,在xml文件中存储病斑的相对坐标和对应类别。训练集和测试集以8:2的比例进行随机划分,得到1120张训练集和280张测试集,图像的路径信息通过程序写入到对应的train.txt、test.txt文件中,以VOC格式构建苹果果实病害数据集,各病害图像标注名称及数量见表1,训练集数量由1120张扩充为8960张。
表1苹果病害图像数量
Figure BDA0003527012740000101
模型训练在Ubuntu18.04系统下进行,其中,所使用的计算机CPU为Intel(R)Core(TM)i7-9750H,2.60GHz,内存16G,GPU为NVIDIA GeForce RTX 2060,显存6G。为提高网络的训练速度,使用GPU进行加速,cuda的版本为11.1.0,cudnn版本为8.1.0。训练时使用随机梯度下降法(Stochastic Gradient Descent,SGD)作为优化器来对神经网络进行优化,其初始学习率分别设为0.1、0.01、0.001,动量参数设为0.9,权值衰减参数设为0.0005。训练采用warm up策略,在训练的前3个epoch内使用0.0001的学习率进行训练,之后恢复到初始学习率。输入的图像统一调整为512×512像素,batch_size设为16。
在一种优选的实施方式中,所述基于预处理后的苹果病害数据集对改进后的YOLOv5s模型进行训练之后,还包括:对改进后的YOLOv5s模型进行评估;选取评估后确定为训练好的改进后的YOLOv5s模型。具体而言,模型所使用的评估指标为mAP@0.5、mAP@0.5:0.95、参数量和平均检测速度。平均精度(Average Precision,AP)是由查准率(Precision,P)和查全率(Recall,R)绘制的PR曲线的积分,体现模型的整体检测性能,平均精度均值(Mean Average Precision,mAP)是所有分类类别AP的均值,其计算公式如下:
Figure BDA0003527012740000111
Figure BDA0003527012740000112
Figure BDA0003527012740000113
Figure BDA0003527012740000114
其中,TP表示检测正确的正样本数量,FP表示检测错误的正样本数量,FN表示检测错误的负样本数量,N为分类类别数量。mAP@0.5是模型在IOU阈值为0.5时的mAP,mAP@0.5:0.95是模型在不同IOU阈值(0.5到0.95,步长0.05)下进行评估得到的mAP均值。参数量表示模型文件所占存储空间的大小,单位为MB。平均检测速度是模型在CPU下对单张测试集图像进行检测所用时间的均值。
实验中每训练1个epoch进行1次评估,共训练300epoch。通过对使用不同优化策略的YOLOv5s算法进行对比评估,以检验改进模型的有效性,模型利用三种学习率(0.1,0.01,0.001)下训练的模型进行集成推理(同时使用多个模型进行推理,并将多个推理结果进行聚合生成最终预测),以测试最终精度。表2为YOLOv5s模型消融实验结果,列出了不同模型的mAP@0.5:0.95、参数量和平均检测速度。
表2 YOLOv5s模型消融实验结果
Figure BDA0003527012740000121
由表2可知,在YOLOv5s的骨干网络及颈部网络使用幻影结构并调整网络宽度在牺牲一定模型精度的条件下有效降低了模型的参数量,得到了较为轻量化的基线模型YOLOv5s-Ghost(模型A)。与YOLOv5s相比,其检测精度在mAP@0.5下降了1.7%、在mAP@0.5:0.95下降了5.2%,但其参数量缩减了10倍以上,平均检测速度提高了3倍。为提高模型精度,本文在基线模型基础上利用CBAM和BIFPN两个改进策略对模型进行优化并使用基于transformer搭建的TR2模块作为预测头构建改进YOLOv5s模型(模型D),以进一步提高模型的泛化能力。改进YOLOv5s模型的mAP@0.5达到0.909,在基线模型基础上提高了2.6%,超过了YOLOv5s模型;在mAP@0.5:0.95上达到0.671,较基线模型提升了4%。其mAP@0.5:0.95达到0.671,较模型B提升了4%,与YOLOv5s相比有微弱下降,但其参数量仅为2.06MB,平均检测速度达到0.065s/张,优于YOLOv5s模型。
表3为各模型在512×512像素下对苦痘病、炭疽病、果锈病和轮纹病图像的集成推理结果。在AP@0.5指标下,YOLOv5s模型在苦痘病和轮纹病上表现出较高的识别能力,分别达到0.960和0.942,但对炭疽病和果锈病的识别率偏低,仅达到0.800和0.898。加入GhostBottleneck模块后,模型的整体精度进一步降低。相比于基线模型A,模型B在苹果轮纹病的识别性能提升较为明显,模型C在苹果果锈病上表现较优。最终得到的模型D即改进YOLOv5s在炭疽病和果锈病上的AP@0.5达到0.810和0.940,较YOLOv5s模型有一定提高,且模型精度分布更为均衡,表明了本文改进策略的有效性。
表3 YOLOv5s模型在不同病害类别下的识别精度
Figure BDA0003527012740000131
图5为苹果病害识别效果示意图(不对图中文字进行限定,仅起到示意作用),如图5所示,a表示苦痘病,b表示炭疽病,c表示果锈病,d表示轮纹病。可以看到,本申请提出的病害识别模型(训练好的改进后的YOLOv5s模型)以病斑区域为实例输出病斑类别及对应位置信息及相应的置信度信息,从而保证模型的实际识别效果。
在一种优选的实施方式中,可利用训练好的改进后的YOLOv5s模型对目标苹果病害进行识别,具体包括:将目标苹果病害图像输入训练好的改进后的YOLOv5s模型;包含所述轻量化幻影瓶颈层的骨干网络对所述目标苹果病害图像进行幻影卷积处理,再经过通道注意力模块和空间注意力模块的加权处理,得到第一特征图;将所述第一特征图输入改进后的颈部网络,经过特征金字塔模块的特征融合处理,得到第二特征图;对所述第二特征图进行预测,输出所述目标苹果病害图像所属病害的置信度,进而得到苹果病害的所属类别。
本申请在YOLOv5s模型的骨干网络和颈部网络中配置轻量化幻影瓶颈层,调整YOLOv5s模型的特征图的宽度,在YOLOv5s模型的骨干网络中添加卷积块注意力模块,并在YOLOv5s模型的颈部网络中配置特征金字塔模块,在所述金字塔模块中构建二次堆叠模块,这一系列改进使模型达到模型轻量化、存储占用低,利用训练好的改进后的YOLOv5s模型对目标苹果病害图像进行识别,识别速度快且识别精度高。特别是使用加权双向特征金字塔网络实现了双向跨尺度连接,提高了模型的表征学习能力,增强了特征的鲁棒性,而二次堆叠模块作为检测头,提高了模型的全局信息获取能力。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
在本申请一些示例性实施例中,还提供了一种基于改进的YOLOv5s模型的苹果病害识别装置,如图6所示,所述装置包括:
获取模块601,用于获取苹果病害数据集,并对所述苹果病害数据集进行预处理;
改进模块602,用于对YOLOv5s模型进行轻量化改进;
训练模块603,用于基于预处理后的苹果病害数据集对改进后的YOLOv5s模型进行训练;
识别模块604,用于利用训练好的改进后的YOLOv5s模型对目标苹果病害图像进行识别。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
还需要强调的是,本申请实施例中提供的系统可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
下面请参考图7,其示出了本申请的一些实施方式所提供的一种计算机设备的示意图。如图7所示,所述计算机设备包括:处理器200,存储器201,总线202和通信接口203,所述处理器200、通信接口203和存储器201通过总线202连接;所述存储器201中存储有可在所述处理器200上运行的计算机程序,所述处理器200运行所述计算机程序时执行本申请前述任一实施方式所提供的基于改进的YOLOv5s模型的苹果病害识别方法。
其中,存储器201可能包含高速随机存取存储器(RAM:Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口203(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网、广域网、本地网、城域网等。
总线202可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。其中,存储器201用于存储程序,所述处理器200在接收到执行指令后,执行所述程序,前述本申请实施例任一实施方式揭示的所述基于改进的YOLOv5s模型的苹果病害识别方法可以应用于处理器200中,或者由处理器200实现。
处理器200可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器200中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器200可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器201,处理器200读取存储器201中的信息,结合其硬件完成上述方法的步骤。
本申请实施方式还提供一种与前述实施方式所提供的基于改进的YOLOv5s模型的苹果病害识别方法对应的计算机可读存储介质,请参考图8,图8示出的计算机可读存储介质为光盘30,其上存储有计算机程序(即程序产品),所述计算机程序在被处理器运行时,会执行前述任意实施方式所提供的基于改进的YOLOv5s模型的苹果病害识别方法。
另外,所述计算机可读存储介质的例子还可以包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他光学、磁性存储介质,在此不再一一赘述。
本申请的上述实施例提供的计算机可读存储介质与本申请实施例提供的空分复用光网络中量子密钥分发信道分配方法出于相同的发明构思,具有与其存储的应用程序所采用、运行或实现的方法相同的有益效果。
本申请实施方式还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现前述任意实施方式所提供的基于改进的YOLOv5s模型的苹果病害识别方法的步骤,包括:获取苹果病害数据集,并对所述苹果病害数据集进行预处理;对YOLOv5s模型进行轻量化改进;基于预处理后的苹果病害数据集对改进后的YOLOv5s模型进行训练;利用训练好的改进后的YOLOv5s模型对目标苹果病害图像进行识别。
需要说明的是:在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备有固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本申请也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本申请的内容,并且上面对特定语言所做的描述是为了披露本申请的最佳实施方式。在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本申请的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本申请并帮助理解各个发明方面中的一个或多个,在上面对本申请的示例性实施例的描述中,本申请的各个特征有时被一起分组到单个实施例、图或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本申请要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本申请的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
本申请的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本申请实施例的虚拟机的创建装置中的一些或者全部部件的一些或者全部功能。本申请还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序。实现本申请的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
以上所述,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种基于改进的YOLOv5s模型的苹果病害识别方法,其特征在于,所述方法包括:
获取苹果病害数据集,并对所述苹果病害数据集进行预处理;
对YOLOv5s模型进行轻量化改进;
基于预处理后的苹果病害数据集对改进后的YOLOv5s模型进行训练;
利用训练好的改进后的YOLOv5s模型对目标苹果病害图像进行识别。
2.根据权利要求1所述的基于改进的YOLOv5s模型的苹果病害识别方法,其特征在于,对所述苹果病害数据集进行预处理,包括:
将所述苹果病害数据集中的图像旋转预设角度,以模拟不同拍摄角度的图像;
对旋转后的图像色度、图像饱和度和图像对比度随机增强,以模拟不同光线条件下的图像;
对随机增强后的图像进行锐化处理,以模拟不同清晰度的图像。
3.根据权利要求1所述的基于改进的YOLOv5s模型的苹果病害识别方法,其特征在于,所述对YOLOv5s模型进行轻量化改进,包括:
在YOLOv5s模型的骨干网络和颈部网络中配置轻量化幻影瓶颈层;
调整YOLOv5s模型的特征图的宽度;
在YOLOv5s模型的骨干网络中添加卷积块注意力模块,其中,所述卷积块注意力模块包括通道注意力模块和空间注意力模块。
4.根据权利要求3所述的基于改进的YOLOv5s模型的苹果病害识别方法,其特征在于,所述对YOLOv5s模型进行轻量化改进还包括:
在YOLOv5s模型的颈部网络中配置特征金字塔模块;
在所述金字塔模块中构建二次堆叠模块。
5.根据权利要求4所述的基于改进的YOLOv5s模型的苹果病害识别方法,其特征在于,在所述金字塔模块中构建二次堆叠模块,包括:
获取自注意机制的Transformer编码器;
堆叠两个基于所述自注意机制的Transformer编码器形成二次堆叠模块。
6.根据权利要求1所述的基于改进的YOLOv5s模型的苹果病害识别方法,其特征在于,所述基于预处理后的苹果病害数据集对改进后的YOLOv5s模型进行训练之后,还包括:
对改进后的YOLOv5s模型进行评估;
选取评估后确定为训练好的改进后的YOLOv5s模型。
7.根据权利要求5所述的基于改进的YOLOv5s模型的苹果病害识别方法,其特征在于,所述利用训练好的改进后的YOLOv5s模型对目标苹果病害进行识别,包括:
将目标苹果病害图像输入训练好的改进后的YOLOv5s模型;
包含所述轻量化幻影瓶颈层的骨干网络对所述目标苹果病害图像进行幻影卷积处理,再经过通道注意力模块和空间注意力模块的加权处理,得到第一特征图;
将所述第一特征图输入改进后的颈部网络,经过特征金字塔模块的特征融合处理,得到第二特征图;
对所述第二特征图进行预测,输出所述目标苹果病害图像所属病害的置信度。
8.一种基于改进的YOLOv5s模型的苹果病害识别装置,其特征在于,所述装置包括:
获取模块,用于获取苹果病害数据集,并对所述苹果病害数据集进行预处理;
改进模块,用于对YOLOv5s模型进行轻量化改进;
训练模块,用于基于预处理后的苹果病害数据集对改进后的YOLOv5s模型进行训练;
识别模块,用于利用训练好的改进后的YOLOv5s模型对目标苹果病害图像进行识别。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-7任一所述方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-7任一所述方法的步骤。
CN202210199557.7A 2022-03-01 2022-03-01 一种基于改进的YOLOv5s模型的苹果病害识别方法 Pending CN114819052A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210199557.7A CN114819052A (zh) 2022-03-01 2022-03-01 一种基于改进的YOLOv5s模型的苹果病害识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210199557.7A CN114819052A (zh) 2022-03-01 2022-03-01 一种基于改进的YOLOv5s模型的苹果病害识别方法

Publications (1)

Publication Number Publication Date
CN114819052A true CN114819052A (zh) 2022-07-29

Family

ID=82529586

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210199557.7A Pending CN114819052A (zh) 2022-03-01 2022-03-01 一种基于改进的YOLOv5s模型的苹果病害识别方法

Country Status (1)

Country Link
CN (1) CN114819052A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115599107A (zh) * 2022-12-08 2023-01-13 唐山雄炜机器人有限公司(Cn) 基于人工智能的激光自动除锈机器人控制系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115599107A (zh) * 2022-12-08 2023-01-13 唐山雄炜机器人有限公司(Cn) 基于人工智能的激光自动除锈机器人控制系统

Similar Documents

Publication Publication Date Title
KR102557512B1 (ko) 이미지들에서의 오브젝트 검출을 위한 콘텍스트-기반 프라이어들
CN111008640B (zh) 图像识别模型训练及图像识别方法、装置、终端及介质
WO2017215622A1 (zh) 物体分割方法及装置、计算设备
CN109685819B (zh) 一种基于特征增强的三维医学图像分割方法
CN114897779B (zh) 基于融合注意力的宫颈细胞学图像异常区域定位方法及装置
KR20170140214A (ko) 신경망을 위한 훈련 기준으로서의 필터 특이성
WO2018071424A1 (en) All-in-one convolutional neural network for face analysis
KR20180063189A (ko) 선택적 역전파
KR20180048930A (ko) 분류를 위한 강제된 희소성
Zhou et al. Octr: Octree-based transformer for 3d object detection
CN109543662A (zh) 基于区域提议的目标检测方法、系统、装置和存储介质
US20220292819A1 (en) Computer Vision Systems and Methods for Acceleration of High-Resolution Mobile Deep Vision With Content-Aware Parallel Offloading
CN112686274B (zh) 目标对象的检测方法及设备
US20230137337A1 (en) Enhanced machine learning model for joint detection and multi person pose estimation
US20230360256A1 (en) Contextual instance decoupling-based multi-person pose estimation method and apparatus
US20190311248A1 (en) Method for random sampled convolutions with low cost enhanced expressive power
CN114819052A (zh) 一种基于改进的YOLOv5s模型的苹果病害识别方法
CN115564030A (zh) 目标检测模型的压缩方法、检测方法、装置及相关设备
CN111709481A (zh) 一种烟草病害识别方法、系统、平台及存储介质
US20220147748A1 (en) Efficient object detection using deep learning techniques
CN111951260B (zh) 基于部分特征融合卷积神经网络实时目标计数系统及方法
US11605001B2 (en) Weight demodulation for a generative neural network
CN111401335A (zh) 一种关键点检测方法及装置、存储介质
US20240005635A1 (en) Object detection method and electronic apparatus
JP6991960B2 (ja) 画像認識装置、画像認識方法及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination