CN111709489B

CN111709489B - 一种基于改进YOLOv4的柑橘识别方法

Info

Publication number: CN111709489B
Application number: CN202010584280.0A
Authority: CN
Inventors: 陆声链; 陈文康; 李帼
Original assignee: Guangxi Normal University
Current assignee: Guangxi Normal University
Priority date: 2020-06-24
Filing date: 2020-06-24
Publication date: 2022-04-08
Anticipated expiration: 2040-06-24
Also published as: CN111709489A

Abstract

本发明公开了一种基于改进YOLOv4的柑橘识别方法，该方法通过改进YOLOv4网络模型结构，添加了上采样模块和对小目标敏感的检测特征图，能更好的识别个体较小的柑橘，通过对训练得到的网络模型进行稀疏训练，通道剪枝和层剪枝，克服了添加模块带来的内存消耗大和识别时间久等缺陷，运用Canopy算法与k‑means++算法一起进行聚类，让用户得到更适合自己数据集的锚框参数值。进行柑橘识别时，采用改进的YOLOv4网络结构对柑橘数据集进行训练，得到的模型能够更精确的识别个体较小的目标；在网络模型训练前，通过层剪枝和通道剪枝结合，压缩模型的深度和宽度，在不损失精度的前提下，提高了训练速度；对不同时期的树上柑橘进行识别，识别精度高、速度快，能够满足实时识别的需要。

Description

一种基于改进YOLOv4的柑橘识别方法

技术领域

本发明涉及图像识别技术领域，具体是一种基于改进YOLOv4的柑橘识别方法。

背景技术

柑橘是目前我国栽培面积最大、产量最高和消费量最大的水果。长久以来我国柑橘生产还主要依靠人力劳动，因此，计算机视觉识别系统的应用和开发具有十分重要的现实意义。此外，在农学科研中，不少研究者借助计算机视觉识别技术辅助进行果实的产量分析、采摘和病害防控。其中计算机视觉识别系统就是制约当前柑橘生产机械化和自动化技术应用的关键技术之一，在果园自然环境条件下精准快速识别柑橘是实现柑橘自动采摘、精准施药等应用的关键。

许多研究者围绕该问题开展了大量研究，提出了一些解决方法。例如，部分研究者提出基于区域特征的柑橘果实分割识别方法，通过彩色特征图像的颜色特征生成颜色特征向量，进行降维处理，然后通过双目摄像机确定果实的ROI大小，并对ROI进行分数排序，最后对最大分数的ROI作为分割识别区域。近年来，有研究者提出了基于卷积神经网络的果实识别方法，这些方法一般首先获取果实的RGB图片，并进行预处理和标注，构建数据集，设置好网络模型的参数后，将训练集放入卷积神经网络进行训练，最后就能得到果实识别模型。此外，也有人利用基于图像计算的方法，获取待测果实的初始轮廓图像，通过几何形态学方法对图像进行筛选，获取目标果实轮廓，再通过轮廓特征进行分割识别。

现有基于卷积神经网络的柑橘果实识别方法中，一个缺点是在识别柑橘果实时，过于注重对小目标的识别精度，没有考虑卷积神经网络的深度和检测速度；另一个不足是在优化网络结构时，往往降低了识别精度，缺少对指定目标的识别信息。

基于图像计算或区域分割方法识别柑橘的主要缺点是缺乏对复杂环境下，个体较小的柑橘的识别，仅能大致的将柑橘轮廓或者特性描述分割出来，而丢失了一些柑橘的细节，得不到较高的识别精度。

柑橘果实生长在柑橘树上，果实的个体、颜色、生长特性等特征随着生长周期的不同而表现出不同的差异，即使是同一种类的不同柑橘树，生长出的柑橘也不尽相同，不同品种的柑橘更是有不同的性状特征。此外，在柑橘的生长环境中，光照的强度，肥料的利用，病虫的防治等复杂环境中的因素都会影响柑橘的识别。因此，在识别柑橘果实时，考虑柑橘自身的因素和复杂环境的影响是十分必要的。

发明内容

本发明的目的在于克服现有技术的不足，而提供一种基于改进YOLOv4的柑橘识别方法，该方法对YOLOv4算法进行了进一步的改进，其思想是先把用户使用的数据集在卷积神经网络训练时锚框的参数分析出来，再用较深的卷积层结合上采样抽象个体较小的柑橘的特征，最后运用层剪枝和通道剪枝结合去掉卷积神经网络中没有用到的卷积层，达到在不丢失精度的同时提高训练和识别速度的目的，可以在复杂自然环境条件下对不同生长时期、不同遮挡程度的树上柑橘进行识别。

实现本发明目的的技术方案是：

一种基于改进YOLOv4的柑橘识别方法，包括如下步骤：

S1、图像的获取：用户采用数码相机或其他图像采集设备对结有果实的柑橘树进行图像采集，并将采集到的图像按照Pascal VOC数据集的格式将图片命名，同时创建名为Annotations、ImageSets、JPEGImages的三个文件夹；

S2、图像预处理：

S2-1、图像标记：在步骤S1采集到的图像中，运用图像标注工具LabelImg对图像中的柑橘进行标记，标注出柑橘的位置、品种名称并注明每个果实被树叶或者枝干遮挡的程度；

S2-2、图像扩增：若步骤S1采集到的图像不能达到识别一个品种的柑橘需要200张图片的要求，则进行图像扩增；用户选定图像的保存路径和标记信息的XML文件路径，并制定扩增后的图像输出路径，则在原有图像的基础上根据用户的需求量进行图像扩增，用户可以选择图像的亮度、大小、清晰度等参数对图像进行扩增；

S2-3、设置锚框参数，步骤如下：

S2-3-1、用户先根据标记且扩增后的数据集设置名为M-IOU自定阈值和锚框个数；

S2-3-2、采用Canopy算法对数据进行初步的聚类得到聚类中心；

S2-3-3、将步骤S2-3-2得到的聚类中心与M-IOU进行对比，观察聚类中心是否在用户设置的M-IOU周围有较好收敛效果，若满足，则进行下一步，否则从步骤S2-3-1重新设置M-IOU；

S2-3-4、使用k-means++算法对步骤S2-3-2得到的聚类中心再进行一次细致的聚类，重复执行本步骤，选择精度最高的聚类结果作为YOLOv4网络的锚框参数值；

S2-4：划分数据集：将扩增得到的图像和标记文件划分成训练集、测试集、验证集和训练验证集，训练集、测试集、验证集分别占50%、25%、25%，训练验证集为训练集与验证集的累加，占75%；

S3、设置网络模型参数：在YOLOv4网络模型的配置文件中，根据计算机内存、显存的大小，用户最终呈现的识别效果要求，设置卷积神经网络输入图像的尺寸、识别种类的数量和filters值、迭代次数参数；且用户需使用支持cuda加速的显卡类型；

S3-1、当输入图像大小为416*416，参数random为1（开启多尺度训练），batch_szie参数为64，迭代次数为6000，检测物体种类为2时，用户使用cpu训练模型，至少需要4GB内存；使用单GPU训练模型，至少需要6GB；

S3-2、当输入图像大小为416*416，参数random为0（关闭多尺度训练），batch_szie参数为16，迭代次数为6000，检测物体种类为2时，用户使用cpu训练模型，至少需要2GB内存；使用单GPU训练模型，至少需要4GB；

S3-3、当输入图像大小为608*608，参数random为1（开启多尺度训练），batch_szie参数为64，迭代次数为6000，检测物体种类为2时，用户使用cpu训练模型，至少需要4GB内存；使用单GPU训练模型，至少需要8GB；

S3-4、当输入图像大小为608*608，参数random为0（关闭多尺度训练），batch_szie参数为16，迭代次数为6000，检测物体种类为2时，用户使用cpu训练模型，至少需要3GB内存；使用单GPU训练模型，至少需要6GB；

S4. 对YOLOv4网络结构进行改进，得到改进后的YOLOv4网络结构，改进过程如下：

S4-1：在现有的YOLOv4网络结构中，对小目标比较敏感的是深层的网络层，其输出的特征图大小为76*76*3*（5+class_num），较大的特征图上的感受野较小，效果如图2所示。在现有的YOLOv4网络结构基础上，增加一个上采样模块和两个对小目标敏感、大小为152*152的检测特征图，使网络结构更深，使改进后的卷积神经网络学习更深层的信息；

S4-2、新增的检测特征图与现有的YOLOv4网络结构中CSP模块中大小为76*76*512的相连接，用于后续的特征拼接和防止过拟合；

S4-3、新增的两个检测特征图层与现有的YOLOv4网络结构中特征图尺寸为152*152*256、步长为1的卷积层连接；

S4-4、在新增的每层中，加入1*1卷积层进行通道降维，使最后输出的YOLO layer的大小为152*152*3*（5+class_num）；

S5、训练网络模型：对改进后的YOLOv4网络结构进行参数设置，将设置好参数后的改进YOLOv4网络结构放入配置好环境的计算机中，运用训练集和验证集中标记好的图片名进行训练，训练过程中，将测试集中划分好的图片放入计算机中进行测试，得到每一个阶段训练的效果，并设置过程监控-map参数实时观察训练的mAP值，训练结束后保存训练好的网络模型。

S6、压缩网络模型：

S6-1、将步骤S5得到的训练好的网络模型，改进后的YOLOv4网络结构cfg文件，配置好data文件，采用训练验证集再进行一次基础训练，并设置训练参数-epochs 100 -batch-size 64；

S6-2、在YOLOv4网络结构中，将scale参数默认为0.001，用户根据标记且扩增后的数据集，观察mAP、BN分布，数据集种类的多少，适当调小参数s;-sr用于开启稀疏训练，将prune参数设置为1，运用全局s衰减稀疏策略；

所述的全局s衰减稀疏策略，是指在参数epochs值为0.5时权重已经完成部分的稀疏训练，拥有了一定的模型压缩度后，对参数s衰减100倍；

S6-3、通道剪枝：将稀疏训练的结果，采用SlimYOLOv3对通道剪枝策略，通过全局阈值找出各卷积层的mask，用每组shortcut，将相连各卷积层的剪枝mask取并集，把合并后的mask进行剪枝；

S6-4、层剪枝：只考虑剪CSPDarknet53主干网络中的shortcut模块，对每一个shortcut层前一个CBL进行评价，对各层的Gmma均值进行排序，取最小的进行层剪枝；每剪一个shortcut结构，会同时剪掉一个shortcut层和它前面的两个卷积层；

S6-5、经过通道剪枝和层剪枝，分别压缩了模型的宽度和深度，再通过微调fine-tune和迭代式剪枝操作训练，得到压缩后的柑橘识别网络模型；判断步骤S6-2设置的参数所得到的结果是否能满足需要，若不满足，则对参数s进行调整，并重复步骤S6-2-步骤S6-5，选择适合用户数据集的压缩网络模型策略，得到压缩后的柑橘识别网络模型；

S7、运用步骤6）得到的网络模型进行识别：在计算机上准备拍摄好的柑橘图像，在python环境下，通过命令行中输入训练命令，命令内容包括步骤6）压缩后得到的柑橘识别模型和要识别的柑橘图片名，最终得到柑橘的识别结果。

本发明提供的一种基于改进YOLOv4的柑橘识别方法，该方法通过改进YOLOv4网络模型结构，添加了上采样模块和对小目标敏感的检测特征图，能更好的识别个体较小的柑橘，通过对训练得到的网络模型进行稀疏训练，通道剪枝和层剪枝，克服了添加模块带来的内存消耗大和识别时间久等缺陷，此外，运用Canopy算法与k-means++算法一起进行聚类，让用户得到更适合自己数据集的锚框参数值。与现有技术相比，本发明具有如下优点：

（1）用户可以通过预设参数控制数据集的锚框的选择，使得网络得到当前数据集下最优的锚框数值；

（2）进行柑橘识别时，采用了改进的YOLOv4网络结构对柑橘数据集进行训练，训练得到的模型能够更精确的识别个体较小的目标；

（3）在网络模型训练前，通过层剪枝和通道剪枝结合，压缩模型的深度和宽度，在不损失精度的前提下，提高了训练速度；

（4）可以在自然环境条件下，对不同时期的树上柑橘进行识别，具有识别精度高、速度快的特点，能够满足实时识别的需要。

附图说明

图1为本发明一种基于改进YOLOv4的柑橘识别方法的流程图；

图2为聚类结果图；

图3为76*76 YOLO head结构图；

图4为改进后YOLO head结构图；

图5为152*152*256的卷积层与YOLO head结构图；

图6为改进后的YOLOv4网络模型对金橘的识别效果图；

图7为改进后的YOLOv4网络模型对南丰蜜桔的识别效果图；

图8为改进后的YOLOv4网络模型对遮挡不超过50%的金橘识别效果图；

图9为改进后的YOLOv4网络模型对遮挡超过50%的金橘识别效果图；

图10为改进后的YOLOv4网络模型对成熟期的金橘识别效果图；

图11为改进后的YOLOv4网络模型对成熟期的南丰蜜桔识别效果图。

具体实施方式

下面结合附图和实施例对本发明内容做进一步阐述，但不是对本发明的限定。

实施例：

一种基于改进YOLOv4的柑橘识别方法，如图1所示，包括如下步骤：

S1、图像的获取：用户采用数码相机或其他图像采集设备对结有果实的柑橘树进行图像采集，并将采集到的图像按照Pascal VOC数据集的格式将图片命名，同时创建名为Annotations、ImageSets、JPEGImages的三个文件夹，可以不用大量修改代码中文件保存的路径，便于后续网络模型训练的进行；

S2、图像预处理：

S2-1、图像标记：在步骤S1采集到的图像中，运用图像标注工具LabelImg对图像中的柑橘进行标记，标注出柑橘的位置、品种名称并标注每个果实被树叶或者枝干遮挡的程度；本实施例选取了金橘和南丰蜜桔两个品种为例；

（1）框选金橘时，标签可命名为citrus；框选南丰蜜桔时，标签可命名为NanFengOrange；

（2）框选遮挡超过50%的柑橘时，标签可在第（1）步的基础上命名为citrus-o,框选遮挡不超过50%的金橘时，可命名为citrus-e；

（3）框选生长期的柑橘时，标签可以在第（1）步的基础上命名为citrus-g;框选成熟期的柑橘时，标签可命名为citrus-m。

S2-3、设置锚框参数，步骤如下：

S2-3-1、用户先根据上述标记且扩增后的数据集设置名为M-IOU自定阈值和锚框个数；

S2-3-2、采用Canopy算法对数据进行初步的聚类得到聚类中心；

S2-3-4、使用k-means++算法对步骤S2-3-2得到的聚类中心再进行一次细致的聚类，重复执行本步骤，选择精度最高的聚类结果作为YOLOv4网络的锚框参数值，如图2所示；

S3、设置网络模型参数：在YOLOv4网络模型的配置文件中，根据计算机内存、显存的大小，用户最终呈现的识别效果要求，设置卷积神经网络输入图像的尺寸、识别种类的数量和filters值、迭代次数参数；且用户需使用支持cuda加速的显卡类型，例如NVIDIA旗下的GeForce和TITAN系列的显卡；

S4-1：在现有的YOLOv4网络结构中，对小目标比较敏感的是深层的网络层，其输出的特征图大小为76*76*3*（5+class_num），较大的特征图上的感受野较小，效果如图2所示。在现有的YOLOv4网络结构基础上，增加一个上采样模块和两个对小目标敏感、大小为152*152的检测特征图，使网络结构更深，使改进后的卷积神经网络学习更深层的信息，对小目标的表达效果更好，效果如图4所示；

S4-3、新增的两个检测特征图层与现有的YOLOv4网络结构中特征图尺寸为152*152*256、步长为1的卷积层连接，效果如图5所示；

S6、压缩网络模型：

S6-1、将步骤S5得到的训练好的网络模型，改进后的YOLOv4网络结构cfg文件，配置好data文件，利用训练验证集再进行一次基础训练，并设置训练参数-epochs 100 -batch-size 64；

S6-2、在YOLOv4网络结构中，将scale参数默认为0.001，用户根据上述标记且扩增后的数据集，观察mAP、BN分布，数据集种类的多少，适当调小参数s;-sr用于开启稀疏训练，将prune参数设置为1，运用全局s衰减稀疏策略；

将采集到的金橘和南丰蜜桔两个柑橘品种不同生长期的图片输入上述步骤6）得到的网络模型中进行试验，得到的识别结果如图6-图11所示，结果表明，本发明能够快速、准确的识别柑橘的种类和位置。本发明操作容易、实现简单，达到了应用的要求。

本发明方法也可以应用于与柑橘有相同形状特点的果实如苹果、猕猴桃、桃子等。

Claims

1.一种基于改进YOLOv4的柑橘识别方法，其特征在于，包括如下步骤：

S2、图像预处理：

S2-2、图像扩增：若步骤S1采集到的图像不能达到识别一个品种的柑橘需要200张图片的要求，则进行图像扩增；用户选定图像的保存路径和标记信息的XML文件路径，并制定扩增后的图像输出路径，则在原有图像的基础上根据用户的需求量进行图像扩增，用户选择图像的亮度、大小、清晰度参数对图像进行扩增；

S2-3、设置锚框参数，步骤如下：

S2-3-2、采用Canopy算法对数据进行初步的聚类得到聚类中心；

S4-1：在现有的YOLOv4网络结构中，对小目标比较敏感的是深层的网络层，其输出的特征图大小为76*76*3*（5+class_num），较大的特征图上的感受野较小，在现有的YOLOv4网络结构基础上，增加一个上采样模块和两个对小目标敏感、大小为152*152的检测特征图，使网络结构更深，使改进后的卷积神经网络学习更深层的信息；

S5、训练网络模型：对改进后的YOLOv4网络结构进行参数设置，将设置好参数后的改进YOLOv4网络结构放入配置好环境的计算机中，运用训练集和验证集中标记好的图片名进行训练，训练过程中，将测试集中划分好的图片放入计算机中进行测试，得到每一个阶段训练的效果，并设置过程监控-map参数实时观察训练的mAP值，训练结束后保存训练好的网络模型;

S6、压缩网络模型：

2.根据权利要求1所述的一种基于改进YOLOv4的柑橘识别方法，其特征在于，步骤3）中，所述的显卡类型，为如下要求：

S3-1、当输入图像大小为416*416，参数random为1，batch_szie参数为64，迭代次数为6000，检测物体种类为2时，用户使用cpu训练模型，至少需要4GB内存；使用单GPU训练模型，至少需要6GB；

S3-2、当输入图像大小为416*416，参数random为0，batch_szie参数为16，迭代次数为6000，检测物体种类为2时，用户使用cpu训练模型，至少需要2GB内存；使用单GPU训练模型，至少需要4GB；

S3-3、当输入图像大小为608*608，参数random为1，batch_szie参数为64，迭代次数为6000，检测物体种类为2时，用户使用cpu训练模型，至少需要4GB内存；使用单GPU训练模型，至少需要8GB；

S3-4、当输入图像大小为608*608，参数random为0，batch_szie参数为16，迭代次数为6000，检测物体种类为2时，用户使用cpu训练模型，至少需要3GB内存；使用单GPU训练模型，至少需要6GB。