CN116416613A - 一种基于改进YOLO v7的柑橘果实识别方法及系统 - Google Patents
一种基于改进YOLO v7的柑橘果实识别方法及系统 Download PDFInfo
- Publication number
- CN116416613A CN116416613A CN202310392025.XA CN202310392025A CN116416613A CN 116416613 A CN116416613 A CN 116416613A CN 202310392025 A CN202310392025 A CN 202310392025A CN 116416613 A CN116416613 A CN 116416613A
- Authority
- CN
- China
- Prior art keywords
- identification
- fruit
- improved
- citrus fruit
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 235000020971 citrus fruits Nutrition 0.000 title claims abstract description 88
- 238000000034 method Methods 0.000 title claims abstract description 27
- 235000013399 edible fruits Nutrition 0.000 claims abstract description 45
- 238000012549 training Methods 0.000 claims abstract description 42
- 238000002372 labelling Methods 0.000 claims abstract description 21
- 238000012360 testing method Methods 0.000 claims abstract description 15
- 238000012795 verification Methods 0.000 claims abstract description 14
- 238000012545 processing Methods 0.000 claims abstract description 8
- 238000004519 manufacturing process Methods 0.000 claims abstract description 6
- 230000007246 mechanism Effects 0.000 claims description 24
- 238000007500 overflow downdraw method Methods 0.000 claims description 7
- 238000012805 post-processing Methods 0.000 claims description 7
- 230000004927 fusion Effects 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 5
- 238000013461 design Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000011176 pooling Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 235000004936 Bromus mango Nutrition 0.000 description 2
- 241000207199 Citrus Species 0.000 description 2
- 241000220225 Malus Species 0.000 description 2
- 240000007228 Mangifera indica Species 0.000 description 2
- 235000014826 Mangifera indica Nutrition 0.000 description 2
- 244000183278 Nephelium litchi Species 0.000 description 2
- 235000009184 Spondias indica Nutrition 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 235000005976 Citrus sinensis Nutrition 0.000 description 1
- 240000002319 Citrus sinensis Species 0.000 description 1
- 241000555678 Citrus unshiu Species 0.000 description 1
- 101100136092 Drosophila melanogaster peng gene Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000581835 Monodora junodii Species 0.000 description 1
- 235000021016 apples Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/68—Food, e.g. fruit or vegetables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/52—Scale-space analysis, e.g. wavelet analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于改进YOLOv7的柑橘果实识别方法及系统,包括以下步骤:采集柑橘果实图像;采用Labelme图像标注工具,对柑橘果实图像中的果实目标进行标注,将标注后的柑橘果实图像制作成柑橘果实识别数据集,并将数据集划分为训练集、测试集与验证集;采用opencv图像处理工具,对柑橘果实识别数据集进行数据增强;构建改进的YOLOv7网络识别模型;利用数据增强后的训练集和验证集对改进的YOLOv7网络识别模型进行训练;将数据增强后的测试集输入通过训练的改进的YOLOv7网络识别模型,完成柑橘果实的识别。本发明实现了柑橘果实的精准识别与定位。
Description
技术领域
本发明属于农业智能监测技术领域,具体涉及一种基于改进YOLO v7的柑橘果实识别方法及系统。
背景技术
传统的柑橘果实识别方法是通过人工设计合适的特征描述子,根据特征描述子对图像特征进行提取,实现果实与背景的区分,从而得到果实的具体坐标,如王雅琴等基于色彩空间变换、霍夫变换、二值形态学等传统图像处理方法,实现了自然环境下的果实识别,但精度并不能满足现实需求。熊俊涛等人基于YCbCr颜色模型,实现了自然环境下荔枝果实与果梗的识别,识别精度达到95.50%,但对于遮挡果实识别精度欠佳。司永胜等人基于随机圆环法,提出了归一化的红绿色差分割的方法,实现了自然光下的红苹果识别,识别率为92%,但易受光照强度影响。张春龙等人结合支持向量机与超绿算子,设计了一种混合分类器,实现了绿色苹果的识别,并采用欧式距离变换的方法对图像中粘连果实区域进行了有效分割,平均识别率为89.30%,该模型需分成两步进行,效率不高。Ferhat Kurtulmus等人根据结合绿色柑橘的形状、颜色与纹理特征,通过滑动窗口的方法实现绿色柑橘的检测与识别,识别率为75.3%,但精度较低,且对遮挡果实识别精度不足。这些方法因为需要人工设计特征描述子,在面临不同的田间环境时,需要设计不同的特征描述子,且精度受环境影响明显,因此无法满足在复杂的田间环境中的柑橘识别。彭红星等人利用ResNet-101模型,对SSD网络模型进行了改进,结合迁移学习方法,实现了苹果、荔枝、脐橙、皇帝柑四种水果的识别,平均识别精度mAP为88.40%,识别精度无法满足实际需要。薛月菊等人基于密集连接网络结构,对YOLO v2模型进行改进,同时针对重叠芒果进行了前景标注,减少了重叠边界的干扰,实现了复杂背景下的未成熟芒果识别,识别精度达到97.02%,但需额外进行前景标注,数据集制作难度较大。Wang C Y等人提出了YOLO v7目标检测模型,模型在各大目标识别数据集上均获得了较好的效果,但缺少注意力机制,导致其对单一目标识别精度不足,同时其所使用的CIOU损失函数会在检测框出现相同长宽比时发生退化,从而影响识别精度。
发明内容
针对现有技术的不足,本发明提出了一种基于改进YOLO v7的柑橘果实识别方法及系统,实现柑橘果实的精准识别与定位。
为实现上述目的,本发明提供了如下方案:
一种基于改进YOLO v7的柑橘果实识别方法,包括以下步骤:
采集柑橘果实图像;
采用Labelme图像标注工具,对所述柑橘果实图像中的果实目标进行标注,将标注后的所述柑橘果实图像制作成柑橘果实识别数据集,并将所述数据集划分为训练集、测试集与验证集;
采用opencv图像处理工具,对所述柑橘果实识别数据集进行数据增强;
构建改进的YOLO v7网络识别模型;
利用数据增强后的训练集和验证集对所述改进的YOLO v7网络识别模型进行训练;
将数据增强后的测试集输入通过训练的所述改进的YOLO v7网络识别模型,完成柑橘果实的识别,并采用图像后处理的方式,根据柑橘果实的识别结果,对柑橘果实目标以矩形框标注的形式进行可视化。
优选的,采用Focal-EIOU损失函数,增加所述改进的YOLO v7网络识别模型的训练精度。
优选的,对所述柑橘果实图像中的果实目标进行标注包括:
标注果实中心点的坐标(x,y)、标注框的宽w,高h。
优选的,所述改进的YOLO v7网络识别模型的结构包括:Backbone部分和Head部分;
所述Backbone部分:以YOLO v7模型为基础,在主干网络中的ELAN中引入CA注意力机制,得到ELAN-CA结构,并替换所述YOLO v7模型中的ELAN结构;
所述Head部分:采用多尺度融合的方法,将主干网络中不同位置的ELAN-CA结构的输出特征图以特征金字塔的形式进行多尺度融合。
优选的,在主干网络中的ELAN中引入CA注意力机制的方法包括:
将多层级的果实识别特征图经过ELAN中的Concat模块进行融合;
通过CA注意力机制模块,从融合后的果实识别特征图上获取到水平方向与垂直方向的注意力。
本发明还提供一种基于改进YOLO v7的柑橘果实识别系统,包括:采集模块、数据集制作模块、数据增强模块、模型构建模块、训练模块和识别模块;
所述采集模块用于采集柑橘果实图像;
所述数据集制作模块用于采用Labelme图像标注工具,对所述柑橘果实图像中的果实目标进行标注,将标注后的所述柑橘果实图像制作成柑橘果实识别数据集,并将所述数据集划分为训练集、测试集与验证集;
所述数据增强模块用于采用opencv图像处理工具,对所述柑橘果实识别数据集进行数据增强;
所述模型构建模块用于构建改进的YOLO v7网络识别模型;
所述训练模块用于利用数据增强后的训练集和验证集对所述改进的YOLO v7网络识别模型进行训练;
所述识别模块用于将数据增强后的测试集输入通过训练的所述改进的YOLO v7网络识别模型,完成柑橘果实的识别,并采用图像后处理的方式,根据柑橘果实的识别结果,对柑橘果实目标以矩形框标注的形式进行可视化。
优选的,采用Focal-EIOU损失函数,增加所述改进的YOLO v7网络识别模型的训练精度。
优选的,所述数据集制作模块中,对所述柑橘果实图像中的果实目标进行标注包括:
标注果实中心点的坐标(x,y)、标注框的宽w,高h。
优选的,所述改进的YOLO v7网络识别模型的结构包括:Backbone部分和Head部分;
所述Backbone部分:以YOLO v7模型为基础,在主干网络中的ELAN中引入CA注意力机制,得到ELAN-CA结构,并替换所述YOLO v7模型中的ELAN结构;
所述Head部分:采用多尺度融合的方法,将主干网络中不同位置的ELAN-CA结构的输出特征图以特征金字塔的形式进行多尺度融合。
优选的,在主干网络中的ELAN中引入CA注意力机制的过程包括:
将多层级的果实识别特征图经过ELAN中的Concat模块进行融合;
通过CA注意力机制模块,从融合后的果实识别特征图上获取到水平方向与垂直方向的注意力。
与现有技术相比,本发明的有益效果为:
本发明结合ELAN与CA注意力机制的优势,设计了ELAN-CA结构。ELAN-CA结构通过X方向、Y方向的平均池化,使网络获得了水平方向上的注意力和垂直方向上的注意力,因此,ELAN-CA结构可以在不破坏原有梯度路径的同时,还额外获得水平方向和垂直方向的注意力,增强了网络的学习能力。
再将ELAN-CA分别引入YOLO v7网络中,使得YOLO v7网络也获得了水平方向和垂直方向的注意力,从而提高网络的识别精度,并将主干网络中不同位置的ELAN-CA结构的输出特征图以特征金字塔的形式进行多尺度融合,实现柑橘果实的精准识别与定位。
附图说明
为了更清楚地说明本发明的技术方案,下面对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中的一种基于改进YOLO v7的柑橘果实识别方法流程示意图;
图2为本发明实施例中的复杂环境下的果实图像;
图3为本发明实施例中的ELAN结构示意图;
图4为本发明实施例中的CA注意力机制示意图;
图5为本发明实施例中的ELAN-CA结构示意图;
图6为本发明实施例中的改进YOLO v7的结构示意图;
图7为本发明实施例中的识别效果图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例一
如图1所示,一种基于改进YOLO v7的柑橘果实识别方法,包括以下步骤:
采集柑橘果实图像;
采用Labelme图像标注工具,对柑橘果实图像中的果实目标进行标注,将标注后的柑橘果实图像制作成柑橘果实识别数据集,并将数据集划分为训练集、测试集与验证集;
采用opencv图像处理工具,对柑橘果实识别数据集进行数据增强;
构建改进的YOLO v7网络识别模型;
利用数据增强后的训练集和验证集对改进的YOLO v7网络识别模型进行训练;
将数据增强后的测试集输入通过训练的改进的YOLO v7网络识别模型,完成柑橘果实的识别,并采用图像后处理的方式,根据柑橘果实的识别结果,对柑橘果实目标以矩形框标注的形式进行可视化。
在本实施例中,采用Focal-EIOU损失函数,改善了CIOU的退化问题,增加了预测框的回归精度,并验证模型识别效果,增加改进的YOLO v7网络识别模型的训练精度。
在本实施例中,如图2所示,分别从不同角度,不同时间段对果实图像进行现场采集,具体的,通过手持相机,分别在上午、中午、下午进行图像采集工作。
在本实施例中,对柑橘果实图像中的果实目标进行标注包括:
标注果实中心点的坐标(x,y)、标注框的宽w,高h。
在本实施例中,以8:1:1的比例将数据集划分训练集、测试集与验证集。
在本实施例中,采用opencv图像处理工具,使用随机裁剪、随机mask、随机拼接、随机旋转的方法,对样本进行数据增强。
在本实施例中,改进的YOLO v7网络识别模型的结构包括:Backbone部分和Head部分;
所述Backbone部分:以YOLO v7模型为基础,在主干网络中的ELAN中引入CA注意力机制,得到ELAN-CA结构,并替换YOLO v7模型中的ELAN结构;
ELAN结构如图3所示,ELAN模块由数个不同步长的CBS模块组成,输入通道数为c,首先分别通过两个CBS卷积模块,得到上下两条通道数为c/2的路径,其中一条再经过4个CBS卷积模块,分别提取第一、第三和第四个CBS卷积模块的输出,再结合另一条路径的输出,统一连接至Concat模块,将特征图进行堆叠,得到通道数为2c的输出,最后再经过一个CBS模块,得到ELAN的输出。
CA注意力机制如图4所示,CA注意力机制输入特征图经过三条网络分支,第一条直接经过权重重载连接到输出端,另外两条分别经过X方向的平均池化与Y方向上的平均池化后,再将其拼接后再分离,分别经过一个卷积核后,最后连接至Re-weight模块,将三条分支进行相乘,得到网络的输出。
ELAN-CA结构如图5所示,改进ELAN-CA结构首先将多层级的果实识别特征图进行融合,同时通道数增加一倍,使得网络能够获得更加详细的信息,即图4中cat模块。然后通过CA注意力机制模块,即图4中CA模块,在不改变其输入输出通道数的前提下,即输入与输出通道数均为2c,使得网络能够从果实识别特征图上获取到水平(X)方向与垂直(Y)方向的注意力,从而有效提升模型在面对体积小、密度高、遮挡严重等的复杂环境下的果实识别能力。
将ELAN-CA结构替换YOLO v7主干网络中的ELAN结构,如图6中Backbone部分所示。在主干网络中的ELAN结构添加CA注意力机制对主干网络进行改进,提高网络对重叠、遮挡柑橘果实的识别能力。
所述Head部分:采用多尺度融合的方法,将主干网络中不同位置的ELAN-CA结构的输出特征图以特征金字塔的形式进行多尺度融合。如图6中Head部分所示。采用多尺度融合的方法,将主干网络中不同位置的不同尺寸的特征图进行融合,在不影响较大果实识别的前提下,增强网络对较小柑橘果实的识别能力。
在本实施例中,将训练所得权重载入改进的YOLO v7网络中,对数据集以外的图像进行预测,取改进的YOLO v7网络的输出,即果实目标的x,y,w,h,并采用图像后处理的方式,根据改进的YOLO v7网络的输出,对柑橘目标以矩形框标注的形式进行可视化。
本发明结合ELAN与CA注意力机制的优势,设计了ELAN-CA结构。ELAN-CA结构通过X方向、Y方向的平均池化,使网络获得了水平方向上的注意力和垂直方向上的注意力,因此,ELAN-CA结构可以在不破坏原有梯度路径的同时,还额外获得水平方向和垂直方向的注意力,增强了网络的学习能力。
再将ELAN-CA分别引入YOLO v7网络中,使得YOLO v7网络也获得了水平方向和垂直方向的注意力,从而提高网络的识别精度,识别效果如图7所示。
实施例二
本发明还提供一种基于改进YOLO v7的柑橘果实识别系统,包括:采集模块、数据集制作模块、数据增强模块、模型构建模块、训练模块和识别模块;
采集模块用于采集柑橘果实图像;
数据集制作模块用于采用Labelme图像标注工具,对柑橘果实图像中的果实目标进行标注,将标注后的所述柑橘果实图像制作成柑橘果实识别数据集,并将数据集划分为训练集、测试集与验证集;
数据增强模块用于采用opencv图像处理工具,对柑橘果实识别数据集进行数据增强;
模型构建模块用于构建改进的YOLO v7网络识别模型;
训练模块用于利用数据增强后的训练集和验证集对改进的YOLO v7网络识别模型进行训练;
识别模块用于将数据增强后的测试集输入通过训练的改进的YOLO v7网络识别模型,完成柑橘果实的识别,并采用图像后处理的方式,根据柑橘果实的识别结果,对柑橘果实目标以矩形框标注的形式进行可视化。
在本实施例中,采用Focal-EIOU损失函数,增加改进的YOLO v7网络识别模型的训练精度。
在本实施例中,数据集制作模块中,对柑橘果实图像中的果实目标进行标注包括:
标注果实中心点的坐标(x,y)、标注框的宽w,高h。
在本实施例中,改进的YOLO v7网络识别模型的结构包括:Backbone部分和Head部分;
所述Backbone部分:以YOLO v7模型为基础,在主干网络中的ELAN中引入CA注意力机制,得到ELAN-CA结构,并替换YOLO v7模型中的ELAN结构;
所述Head部分:采用多尺度融合的方法,将主干网络中不同位置的ELAN-CA结构的输出特征图以特征金字塔的形式进行多尺度融合。
在本实施例中,在主干网络中的ELAN中引入CA注意力机制的过程包括:
将多层级的果实识别特征图经过ELAN中的Concat模块进行融合;
通过CA注意力机制模块,从融合后的果实识别特征图上获取到水平方向与垂直方向的注意力。
以上所述的实施例仅是对本发明优选方式进行的描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。
Claims (10)
1.一种基于改进YOLOv7的柑橘果实识别方法,其特征在于,包括以下步骤:
采集柑橘果实图像;
采用Labelme图像标注工具,对所述柑橘果实图像中的果实目标进行标注,将标注后的所述柑橘果实图像制作成柑橘果实识别数据集,并将所述数据集划分为训练集、测试集与验证集;
采用opencv图像处理工具,对所述柑橘果实识别数据集进行数据增强;
构建改进的YOLOv7网络识别模型;
利用数据增强后的训练集和验证集对所述改进的YOLOv7网络识别模型进行训练;
将数据增强后的测试集输入通过训练的所述改进的YOLOv7网络识别模型,完成柑橘果实的识别,并采用图像后处理的方式,根据柑橘果实的识别结果,对柑橘果实目标以矩形框标注的形式进行可视化。
2.根据权利要求1所述的基于改进YOLOv7的柑橘果实识别方法,其特征在于,采用Focal-EIOU损失函数,增加所述改进的YOLOv7网络识别模型的训练精度。
3.根据权利要求1所述的基于改进YOLOv7的柑橘果实识别方法,其特征在于,对所述柑橘果实图像中的果实目标进行标注包括:
标注果实中心点的坐标(x,y)、标注框的宽w,高h。
4.根据权利要求1所述的基于改进YOLOv7的柑橘果实识别方法,其特征在于,所述改进的YOLOv7网络识别模型的结构包括:Backbone部分和Head部分;
所述Backbone部分:以YOLOv7模型为基础,在主干网络中的ELAN中引入CA注意力机制,得到ELAN-CA结构,并替换所述YOLOv7模型中的ELAN结构;
所述Head部分:采用多尺度融合的方法,将主干网络中不同位置的ELAN-CA结构的输出特征图以特征金字塔的形式进行多尺度融合。
5.根据权利要求4所述的基于改进YOLOv7的柑橘果实识别方法,其特征在于,在主干网络中的ELAN中引入CA注意力机制的方法包括:
将多层级的果实识别特征图经过ELAN中的Concat模块进行融合;
通过CA注意力机制模块,从融合后的果实识别特征图上获取到水平方向与垂直方向的注意力。
6.一种基于改进YOLOv7的柑橘果实识别系统,其特征在于,包括:采集模块、数据集制作模块、数据增强模块、模型构建模块、训练模块和识别模块;
所述采集模块用于采集柑橘果实图像;
所述数据集制作模块用于采用Labelme图像标注工具,对所述柑橘果实图像中的果实目标进行标注,将标注后的所述柑橘果实图像制作成柑橘果实识别数据集,并将所述数据集划分为训练集、测试集与验证集;
所述数据增强模块用于采用opencv图像处理工具,对所述柑橘果实识别数据集进行数据增强;
所述模型构建模块用于构建改进的YOLOv7网络识别模型;
所述训练模块用于利用数据增强后的训练集和验证集对所述改进的YOLO v7网络识别模型进行训练;
所述识别模块用于将数据增强后的测试集输入通过训练的所述改进的YOLOv7网络识别模型,完成柑橘果实的识别,并采用图像后处理的方式,根据柑橘果实的识别结果,对柑橘果实目标以矩形框标注的形式进行可视化。
7.根据权利要求6所述的基于改进YOLOv7的柑橘果实识别系统,其特征在于,采用Focal-EIOU损失函数,增加所述改进的YOLOv7网络识别模型的训练精度。
8.根据权利要求6所述的基于改进YOLOv7的柑橘果实识别系统,其特征在于,所述数据集制作模块中,对所述柑橘果实图像中的果实目标进行标注包括:
标注果实中心点的坐标(x,y)、标注框的宽w,高h。
9.根据权利要求6所述的基于改进YOLOv7的柑橘果实识别系统,其特征在于,所述改进的YOLOv7网络识别模型的结构包括:Backbone部分和Head部分;
所述Backbone部分:以YOLOv7模型为基础,在主干网络中的ELAN中引入CA注意力机制,得到ELAN-CA结构,并替换所述YOLOv7模型中的ELAN结构;
所述Head部分:采用多尺度融合的方法,将主干网络中不同位置的ELAN-CA结构的输出特征图以特征金字塔的形式进行多尺度融合。
10.根据权利要求9所述的基于改进YOLOv7的柑橘果实识别系统,其特征在于,在主干网络中的ELAN中引入CA注意力机制的过程包括:
将多层级的果实识别特征图经过ELAN中的Concat模块进行融合;
通过CA注意力机制模块,从融合后的果实识别特征图上获取到水平方向与垂直方向的注意力。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310392025.XA CN116416613A (zh) | 2023-04-13 | 2023-04-13 | 一种基于改进YOLO v7的柑橘果实识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310392025.XA CN116416613A (zh) | 2023-04-13 | 2023-04-13 | 一种基于改进YOLO v7的柑橘果实识别方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116416613A true CN116416613A (zh) | 2023-07-11 |
Family
ID=87052781
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310392025.XA Pending CN116416613A (zh) | 2023-04-13 | 2023-04-13 | 一种基于改进YOLO v7的柑橘果实识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116416613A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116958086A (zh) * | 2023-07-21 | 2023-10-27 | 盐城工学院 | 具有增强特征融合能力的金属表面缺陷检测方法及系统 |
CN117152139A (zh) * | 2023-10-30 | 2023-12-01 | 华东交通大学 | 一种基于实例分割技术的贴片电感缺陷检测方法 |
-
2023
- 2023-04-13 CN CN202310392025.XA patent/CN116416613A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116958086A (zh) * | 2023-07-21 | 2023-10-27 | 盐城工学院 | 具有增强特征融合能力的金属表面缺陷检测方法及系统 |
CN116958086B (zh) * | 2023-07-21 | 2024-04-19 | 盐城工学院 | 具有增强特征融合能力的金属表面缺陷检测方法及系统 |
CN117152139A (zh) * | 2023-10-30 | 2023-12-01 | 华东交通大学 | 一种基于实例分割技术的贴片电感缺陷检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | A detection method for apple fruits based on color and shape features | |
CN107016405B (zh) | 一种基于分级预测卷积神经网络的害虫图像分类方法 | |
Zhao et al. | Cloud shape classification system based on multi-channel cnn and improved fdm | |
Song et al. | Kiwifruit detection in field images using Faster R-CNN with VGG16 | |
CN116416613A (zh) | 一种基于改进YOLO v7的柑橘果实识别方法及系统 | |
CN110263705A (zh) | 面向遥感技术领域两期高分辨率遥感影像变化检测方法 | |
CN109902806A (zh) | 基于卷积神经网络的噪声图像目标边界框确定方法 | |
CN112233073A (zh) | 一种变电设备红外热成像异常实时检测方法 | |
CN110663971B (zh) | 基于双分支深度融合卷积神经网络的红枣品质分类方法 | |
CN111126325A (zh) | 一种基于视频的智能人员安防识别统计方法 | |
Lin et al. | Detection of strawberry flowers in outdoor field by deep neural network | |
CN111815564B (zh) | 一种检测丝锭的方法、装置及丝锭分拣系统 | |
CN106326932A (zh) | 一种基于神经网络的电力巡线图像自动识别方法、装置 | |
CN111680739A (zh) | 一种目标检测和语义分割的多任务并行方法及系统 | |
CN115272204A (zh) | 一种基于机器视觉的轴承表面划痕检测方法 | |
Zhang et al. | Research on spatial positioning system of fruits to be picked in field based on binocular vision and SSD model | |
Yang et al. | Instance segmentation and classification method for plant leaf images based on ISC-MRCNN and APS-DCCNN | |
CN114821014A (zh) | 基于多模态与对抗学习的多任务目标检测识别方法及装置 | |
CN116740516A (zh) | 基于多尺度融合特征提取的目标检测方法及系统 | |
Sun et al. | GHFormer-Net: Towards more accurate small green apple/begonia fruit detection in the nighttime | |
Shankar et al. | A framework to enhance object detection performance by using YOLO algorithm | |
CN112802027A (zh) | 一种目标对象的分析方法、存储介质及电子装置 | |
CN114863311A (zh) | 一种变电站机器人巡检目标自动跟踪方法及系统 | |
Lu et al. | Intelligent Grading of Tobacco Leaves Using an Improved Bilinear Convolutional Neural Network | |
Wang et al. | A transformer-based mask R-CNN for tomato detection and segmentation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |