CN116416613A

CN116416613A - 一种基于改进YOLO v7的柑橘果实识别方法及系统

Info

Publication number: CN116416613A
Application number: CN202310392025.XA
Authority: CN
Inventors: 余圣新
Original assignee: Guangxi Zhuang Nationality Autonomous Region Academy of Agricultural Sciences
Current assignee: Guangxi Zhuang Nationality Autonomous Region Academy of Agricultural Sciences
Priority date: 2023-04-13
Filing date: 2023-04-13
Publication date: 2023-07-11

Abstract

本发明公开了一种基于改进YOLOv7的柑橘果实识别方法及系统，包括以下步骤：采集柑橘果实图像；采用Labelme图像标注工具，对柑橘果实图像中的果实目标进行标注，将标注后的柑橘果实图像制作成柑橘果实识别数据集，并将数据集划分为训练集、测试集与验证集；采用opencv图像处理工具，对柑橘果实识别数据集进行数据增强；构建改进的YOLOv7网络识别模型；利用数据增强后的训练集和验证集对改进的YOLOv7网络识别模型进行训练；将数据增强后的测试集输入通过训练的改进的YOLOv7网络识别模型，完成柑橘果实的识别。本发明实现了柑橘果实的精准识别与定位。

Description

一种基于改进YOLO v7的柑橘果实识别方法及系统

技术领域

本发明属于农业智能监测技术领域，具体涉及一种基于改进YOLO v7的柑橘果实识别方法及系统。

背景技术

传统的柑橘果实识别方法是通过人工设计合适的特征描述子，根据特征描述子对图像特征进行提取，实现果实与背景的区分，从而得到果实的具体坐标，如王雅琴等基于色彩空间变换、霍夫变换、二值形态学等传统图像处理方法，实现了自然环境下的果实识别，但精度并不能满足现实需求。熊俊涛等人基于YCbCr颜色模型，实现了自然环境下荔枝果实与果梗的识别，识别精度达到95.50％，但对于遮挡果实识别精度欠佳。司永胜等人基于随机圆环法，提出了归一化的红绿色差分割的方法，实现了自然光下的红苹果识别，识别率为92％，但易受光照强度影响。张春龙等人结合支持向量机与超绿算子，设计了一种混合分类器，实现了绿色苹果的识别，并采用欧式距离变换的方法对图像中粘连果实区域进行了有效分割，平均识别率为89.30％，该模型需分成两步进行，效率不高。Ferhat Kurtulmus等人根据结合绿色柑橘的形状、颜色与纹理特征，通过滑动窗口的方法实现绿色柑橘的检测与识别，识别率为75.3％，但精度较低，且对遮挡果实识别精度不足。这些方法因为需要人工设计特征描述子，在面临不同的田间环境时，需要设计不同的特征描述子，且精度受环境影响明显，因此无法满足在复杂的田间环境中的柑橘识别。彭红星等人利用ResNet-101模型，对SSD网络模型进行了改进，结合迁移学习方法，实现了苹果、荔枝、脐橙、皇帝柑四种水果的识别，平均识别精度mAP为88.40％，识别精度无法满足实际需要。薛月菊等人基于密集连接网络结构，对YOLO v2模型进行改进，同时针对重叠芒果进行了前景标注，减少了重叠边界的干扰，实现了复杂背景下的未成熟芒果识别，识别精度达到97.02％，但需额外进行前景标注，数据集制作难度较大。Wang C Y等人提出了YOLO v7目标检测模型，模型在各大目标识别数据集上均获得了较好的效果，但缺少注意力机制，导致其对单一目标识别精度不足，同时其所使用的CIOU损失函数会在检测框出现相同长宽比时发生退化，从而影响识别精度。

发明内容

针对现有技术的不足，本发明提出了一种基于改进YOLO v7的柑橘果实识别方法及系统，实现柑橘果实的精准识别与定位。

为实现上述目的，本发明提供了如下方案：

一种基于改进YOLO v7的柑橘果实识别方法，包括以下步骤：

采集柑橘果实图像；

采用Labelme图像标注工具，对所述柑橘果实图像中的果实目标进行标注，将标注后的所述柑橘果实图像制作成柑橘果实识别数据集，并将所述数据集划分为训练集、测试集与验证集；

采用opencv图像处理工具，对所述柑橘果实识别数据集进行数据增强；

构建改进的YOLO v7网络识别模型；

利用数据增强后的训练集和验证集对所述改进的YOLO v7网络识别模型进行训练；

将数据增强后的测试集输入通过训练的所述改进的YOLO v7网络识别模型，完成柑橘果实的识别，并采用图像后处理的方式，根据柑橘果实的识别结果，对柑橘果实目标以矩形框标注的形式进行可视化。

优选的，采用Focal-EIOU损失函数，增加所述改进的YOLO v7网络识别模型的训练精度。

优选的，对所述柑橘果实图像中的果实目标进行标注包括：

标注果实中心点的坐标(x,y)、标注框的宽w，高h。

优选的，所述改进的YOLO v7网络识别模型的结构包括：Backbone部分和Head部分；

所述Backbone部分：以YOLO v7模型为基础，在主干网络中的ELAN中引入CA注意力机制，得到ELAN-CA结构，并替换所述YOLO v7模型中的ELAN结构；

所述Head部分：采用多尺度融合的方法，将主干网络中不同位置的ELAN-CA结构的输出特征图以特征金字塔的形式进行多尺度融合。

优选的，在主干网络中的ELAN中引入CA注意力机制的方法包括：

将多层级的果实识别特征图经过ELAN中的Concat模块进行融合；

通过CA注意力机制模块，从融合后的果实识别特征图上获取到水平方向与垂直方向的注意力。

本发明还提供一种基于改进YOLO v7的柑橘果实识别系统，包括：采集模块、数据集制作模块、数据增强模块、模型构建模块、训练模块和识别模块；

所述采集模块用于采集柑橘果实图像；

所述数据集制作模块用于采用Labelme图像标注工具，对所述柑橘果实图像中的果实目标进行标注，将标注后的所述柑橘果实图像制作成柑橘果实识别数据集，并将所述数据集划分为训练集、测试集与验证集；

所述数据增强模块用于采用opencv图像处理工具，对所述柑橘果实识别数据集进行数据增强；

所述模型构建模块用于构建改进的YOLO v7网络识别模型；

所述训练模块用于利用数据增强后的训练集和验证集对所述改进的YOLO v7网络识别模型进行训练；

所述识别模块用于将数据增强后的测试集输入通过训练的所述改进的YOLO v7网络识别模型，完成柑橘果实的识别，并采用图像后处理的方式，根据柑橘果实的识别结果，对柑橘果实目标以矩形框标注的形式进行可视化。

优选的，所述数据集制作模块中，对所述柑橘果实图像中的果实目标进行标注包括：

标注果实中心点的坐标(x,y)、标注框的宽w，高h。

优选的，在主干网络中的ELAN中引入CA注意力机制的过程包括：

将多层级的果实识别特征图经过ELAN中的Concat模块进行融合；

与现有技术相比，本发明的有益效果为：

本发明结合ELAN与CA注意力机制的优势，设计了ELAN-CA结构。ELAN-CA结构通过X方向、Y方向的平均池化，使网络获得了水平方向上的注意力和垂直方向上的注意力，因此，ELAN-CA结构可以在不破坏原有梯度路径的同时，还额外获得水平方向和垂直方向的注意力，增强了网络的学习能力。

再将ELAN-CA分别引入YOLO v7网络中，使得YOLO v7网络也获得了水平方向和垂直方向的注意力，从而提高网络的识别精度，并将主干网络中不同位置的ELAN-CA结构的输出特征图以特征金字塔的形式进行多尺度融合，实现柑橘果实的精准识别与定位。

附图说明

为了更清楚地说明本发明的技术方案，下面对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例中的一种基于改进YOLO v7的柑橘果实识别方法流程示意图；

图2为本发明实施例中的复杂环境下的果实图像；

图3为本发明实施例中的ELAN结构示意图；

图4为本发明实施例中的CA注意力机制示意图；

图5为本发明实施例中的ELAN-CA结构示意图；

图6为本发明实施例中的改进YOLO v7的结构示意图；

图7为本发明实施例中的识别效果图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

实施例一

如图1所示，一种基于改进YOLO v7的柑橘果实识别方法，包括以下步骤：

采集柑橘果实图像；

采用Labelme图像标注工具，对柑橘果实图像中的果实目标进行标注，将标注后的柑橘果实图像制作成柑橘果实识别数据集，并将数据集划分为训练集、测试集与验证集；

采用opencv图像处理工具，对柑橘果实识别数据集进行数据增强；

构建改进的YOLO v7网络识别模型；

利用数据增强后的训练集和验证集对改进的YOLO v7网络识别模型进行训练；

将数据增强后的测试集输入通过训练的改进的YOLO v7网络识别模型，完成柑橘果实的识别，并采用图像后处理的方式，根据柑橘果实的识别结果，对柑橘果实目标以矩形框标注的形式进行可视化。

在本实施例中，采用Focal-EIOU损失函数，改善了CIOU的退化问题，增加了预测框的回归精度，并验证模型识别效果，增加改进的YOLO v7网络识别模型的训练精度。

在本实施例中，如图2所示，分别从不同角度，不同时间段对果实图像进行现场采集，具体的，通过手持相机，分别在上午、中午、下午进行图像采集工作。

在本实施例中，对柑橘果实图像中的果实目标进行标注包括：

标注果实中心点的坐标(x,y)、标注框的宽w，高h。

在本实施例中，以8:1:1的比例将数据集划分训练集、测试集与验证集。

在本实施例中，采用opencv图像处理工具，使用随机裁剪、随机mask、随机拼接、随机旋转的方法，对样本进行数据增强。

在本实施例中，改进的YOLO v7网络识别模型的结构包括：Backbone部分和Head部分；

所述Backbone部分：以YOLO v7模型为基础，在主干网络中的ELAN中引入CA注意力机制，得到ELAN-CA结构，并替换YOLO v7模型中的ELAN结构；

ELAN结构如图3所示，ELAN模块由数个不同步长的CBS模块组成，输入通道数为c，首先分别通过两个CBS卷积模块，得到上下两条通道数为c/2的路径，其中一条再经过4个CBS卷积模块，分别提取第一、第三和第四个CBS卷积模块的输出，再结合另一条路径的输出，统一连接至Concat模块，将特征图进行堆叠，得到通道数为2c的输出，最后再经过一个CBS模块，得到ELAN的输出。

CA注意力机制如图4所示，CA注意力机制输入特征图经过三条网络分支，第一条直接经过权重重载连接到输出端，另外两条分别经过X方向的平均池化与Y方向上的平均池化后，再将其拼接后再分离，分别经过一个卷积核后，最后连接至Re-weight模块，将三条分支进行相乘，得到网络的输出。

ELAN-CA结构如图5所示，改进ELAN-CA结构首先将多层级的果实识别特征图进行融合，同时通道数增加一倍，使得网络能够获得更加详细的信息，即图4中cat模块。然后通过CA注意力机制模块，即图4中CA模块，在不改变其输入输出通道数的前提下，即输入与输出通道数均为2c，使得网络能够从果实识别特征图上获取到水平(X)方向与垂直(Y)方向的注意力，从而有效提升模型在面对体积小、密度高、遮挡严重等的复杂环境下的果实识别能力。

将ELAN-CA结构替换YOLO v7主干网络中的ELAN结构，如图6中Backbone部分所示。在主干网络中的ELAN结构添加CA注意力机制对主干网络进行改进，提高网络对重叠、遮挡柑橘果实的识别能力。

所述Head部分：采用多尺度融合的方法，将主干网络中不同位置的ELAN-CA结构的输出特征图以特征金字塔的形式进行多尺度融合。如图6中Head部分所示。采用多尺度融合的方法，将主干网络中不同位置的不同尺寸的特征图进行融合，在不影响较大果实识别的前提下，增强网络对较小柑橘果实的识别能力。

在本实施例中，将训练所得权重载入改进的YOLO v7网络中，对数据集以外的图像进行预测，取改进的YOLO v7网络的输出，即果实目标的x,y,w,h，并采用图像后处理的方式，根据改进的YOLO v7网络的输出，对柑橘目标以矩形框标注的形式进行可视化。

再将ELAN-CA分别引入YOLO v7网络中，使得YOLO v7网络也获得了水平方向和垂直方向的注意力，从而提高网络的识别精度，识别效果如图7所示。

实施例二

采集模块用于采集柑橘果实图像；

数据集制作模块用于采用Labelme图像标注工具，对柑橘果实图像中的果实目标进行标注，将标注后的所述柑橘果实图像制作成柑橘果实识别数据集，并将数据集划分为训练集、测试集与验证集；

数据增强模块用于采用opencv图像处理工具，对柑橘果实识别数据集进行数据增强；

模型构建模块用于构建改进的YOLO v7网络识别模型；

训练模块用于利用数据增强后的训练集和验证集对改进的YOLO v7网络识别模型进行训练；

识别模块用于将数据增强后的测试集输入通过训练的改进的YOLO v7网络识别模型，完成柑橘果实的识别，并采用图像后处理的方式，根据柑橘果实的识别结果，对柑橘果实目标以矩形框标注的形式进行可视化。

在本实施例中，采用Focal-EIOU损失函数，增加改进的YOLO v7网络识别模型的训练精度。

在本实施例中，数据集制作模块中，对柑橘果实图像中的果实目标进行标注包括：

标注果实中心点的坐标(x,y)、标注框的宽w，高h。

在本实施例中，在主干网络中的ELAN中引入CA注意力机制的过程包括：

将多层级的果实识别特征图经过ELAN中的Concat模块进行融合；

以上所述的实施例仅是对本发明优选方式进行的描述，并非对本发明的范围进行限定，在不脱离本发明设计精神的前提下，本领域普通技术人员对本发明的技术方案做出的各种变形和改进，均应落入本发明权利要求书确定的保护范围内。

Claims

1.一种基于改进YOLOv7的柑橘果实识别方法，其特征在于，包括以下步骤：

采集柑橘果实图像；

构建改进的YOLOv7网络识别模型；

利用数据增强后的训练集和验证集对所述改进的YOLOv7网络识别模型进行训练；

将数据增强后的测试集输入通过训练的所述改进的YOLOv7网络识别模型，完成柑橘果实的识别，并采用图像后处理的方式，根据柑橘果实的识别结果，对柑橘果实目标以矩形框标注的形式进行可视化。

2.根据权利要求1所述的基于改进YOLOv7的柑橘果实识别方法，其特征在于，采用Focal-EIOU损失函数，增加所述改进的YOLOv7网络识别模型的训练精度。

3.根据权利要求1所述的基于改进YOLOv7的柑橘果实识别方法，其特征在于，对所述柑橘果实图像中的果实目标进行标注包括：

标注果实中心点的坐标(x,y)、标注框的宽w，高h。

4.根据权利要求1所述的基于改进YOLOv7的柑橘果实识别方法，其特征在于，所述改进的YOLOv7网络识别模型的结构包括：Backbone部分和Head部分；

所述Backbone部分：以YOLOv7模型为基础，在主干网络中的ELAN中引入CA注意力机制，得到ELAN-CA结构，并替换所述YOLOv7模型中的ELAN结构；

5.根据权利要求4所述的基于改进YOLOv7的柑橘果实识别方法，其特征在于，在主干网络中的ELAN中引入CA注意力机制的方法包括：

将多层级的果实识别特征图经过ELAN中的Concat模块进行融合；

6.一种基于改进YOLOv7的柑橘果实识别系统，其特征在于，包括：采集模块、数据集制作模块、数据增强模块、模型构建模块、训练模块和识别模块；

所述采集模块用于采集柑橘果实图像；

所述模型构建模块用于构建改进的YOLOv7网络识别模型；

所述识别模块用于将数据增强后的测试集输入通过训练的所述改进的YOLOv7网络识别模型，完成柑橘果实的识别，并采用图像后处理的方式，根据柑橘果实的识别结果，对柑橘果实目标以矩形框标注的形式进行可视化。

7.根据权利要求6所述的基于改进YOLOv7的柑橘果实识别系统，其特征在于，采用Focal-EIOU损失函数，增加所述改进的YOLOv7网络识别模型的训练精度。

8.根据权利要求6所述的基于改进YOLOv7的柑橘果实识别系统，其特征在于，所述数据集制作模块中，对所述柑橘果实图像中的果实目标进行标注包括：

标注果实中心点的坐标(x,y)、标注框的宽w，高h。

9.根据权利要求6所述的基于改进YOLOv7的柑橘果实识别系统，其特征在于，所述改进的YOLOv7网络识别模型的结构包括：Backbone部分和Head部分；

10.根据权利要求9所述的基于改进YOLOv7的柑橘果实识别系统，其特征在于，在主干网络中的ELAN中引入CA注意力机制的过程包括：

将多层级的果实识别特征图经过ELAN中的Concat模块进行融合；