CN115311520A - 一种基于视觉识别的百香果成熟度检测及定位方法 - Google Patents

一种基于视觉识别的百香果成熟度检测及定位方法 Download PDF

Info

Publication number
CN115311520A
CN115311520A CN202211000670.4A CN202211000670A CN115311520A CN 115311520 A CN115311520 A CN 115311520A CN 202211000670 A CN202211000670 A CN 202211000670A CN 115311520 A CN115311520 A CN 115311520A
Authority
CN
China
Prior art keywords
passion fruit
image
mature
data set
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211000670.4A
Other languages
English (en)
Inventor
孟海涛
农思远
何喆
韦博文
缪亚伦
李岩舟
聂秋意
向青龙
张宗轩
刘倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangxi University
Original Assignee
Guangxi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangxi University filed Critical Guangxi University
Priority to CN202211000670.4A priority Critical patent/CN115311520A/zh
Publication of CN115311520A publication Critical patent/CN115311520A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/7715Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks

Abstract

本发明公开一种基于视觉识别的百香果成熟度检测及定位方法,所述百香果成熟度检测及定位方法包括:采用双目立体相机实时采集田间果园内的百香果图像,将采集到的百香果图像用于建立VOC数据集,形成待检测百香果图像;获取成熟百香果图像作为原始数据集,然后对原始数据集进行优化,再将优化后的原始数据集送入百香果目标检测模型中对对自然环境下的成熟百香果进行检测、训练出最优模型;将待检测百香果图像输入训练好的最优模型中进行测试,输出图像的识别结果,根据识别结果对百香果进行成熟度判别与定位判断。本发明能在自然环境下对成熟百香果检测及定位,本发明可以克服自然环境下光照和遮挡的影响,快速准确的识别定位成熟的百香果果实。

Description

一种基于视觉识别的百香果成熟度检测及定位方法
技术领域
本发明属于图像识别技术领域,尤其涉及一种基于视觉识别的百香果成熟度检测及定位方法。
背景技术
百香果属于西番莲科西番莲属,多年生的草质藤本植物,随着百香果的市场需求不断加大,在我国南宁许多地方均有大量种植,由于黄百香果具有生长旺盛,适应性强,耐寒性弱,果汁含量高等优点,因此种植及鲜销的主要品种为黄百香果,由于百香果为藤蔓植物,必须依靠攀爬架支撑才能正常生长,经过多地调研,水平棚架广泛应用,篱架高度为2.0~2.2m,以垂枝结果为主。由于百香果的生长特性,单纯依靠人工采摘会消耗大量人力,物力资源,面临采摘耗时长,抢收不及时,采摘效率低,单次收纳量小等问题。目前针对百香果的自动识别检测的研究很少,大部分是基于支撑向量机的果实识别算法、基于果实特色分析、图像分割识别以及基于深度学习技术的相关研究,但是均存在较大的局限性。因此,随着百香果数量增加,采摘效率低,资源浪费大以及现有检测方法的缺陷,无法克服自然环境下复杂光照以及果实被遮挡状况下对果实成熟度进行准确判断的问题,从而难以准确、及时保证果实的实时采收,以减少因果实腐烂、掉落等带来的巨大损失,为此,迫切需要开发一种高精度的方法快速、准确、有效地获取百香果分布数据情况具有重要意义,为后续识别定位采摘成熟的果实提供技术支撑。
发明内容
本发明的目的在于:针对上述存在的问题,提供一种基于视觉识别的百香果成熟度检测及定位方法,本发明能在自然环境下对成熟百香果检测及定位,本发明可以克服自然环境下光照和遮挡的影响,快速准确的识别定位成熟的百香果果实。为了实现上述目的,本发明采用的技术方案如下:
本发明提供了一种基于视觉识别的百香果成熟度检测及定位方法,所述百香果成熟度检测及定位方法包括:采用双目立体相机实时采集田间果园内的百香果图像,将采集到的百香果图像用于建立VOC数据集,形成待检测百香果图像;获取成熟百香果图像作为原始数据集,然后对原始数据集进行优化,再将优化后的原始数据集送入百香果目标检测模型中对对自然环境下的成熟百香果进行检测与训练,训练出最优模型;将待检测百香果图像输入训练好的最优模型中进行测试,输出图像的识别结果,根据识别结果分别对百香果进行成熟度判别与定位判断。
上述方案优选的,对原始数据集进行优化包括通过MSRCP算法对光照图像进优化处理、对随机遮挡图像进行优化处理和利用图像数据增强技术进行扩充原始数据集的规模。
上述方案优选的,通过MSRCP算法对光照图像进优化处理包括如下步骤:
步骤31:将原始数据集jpg.格式存放在VOC2007文件夹下JPEGImages子文件夹内,用编号重新命名,利用Labelimg图片标注工具对原始数据集进行人工标注,再用矩形框将原始数据集中的每个成熟的百香果目标图像进行框选;将熟的百香果目标图像进行标签并储存为TXT格式,然后保存在Annotations标签文件夹下,使标签文件与百香果目标图像一一对应;
步骤32:对框选的原始百香果目标图像RGB进行均衡,然后将原始RGB进行增强并映射到每个对应的色彩通道中;
步骤33:对增强映射后的图像辐照度
Figure BDA0003807296240000021
进行估算,并获取辐照度的最大值与最小值;其辐照度估算满足:
Figure BDA0003807296240000022
式中,fn为滤波器函数;I(x,y)为图像上具体像素点坐标值;
上述方案优选的,所述百香果目标检测模型为YOLOv5网络模型,将优化后的原始数据集送入YOLOv5网络模型中进行检测、训练,获取最优训练模型,所述待检测百香果图像输入训练好的最优YOLOv5网络模型中进行测试,输出待检测百香果图像的识别结果,根据识别结果进行判断百香果成熟度。
上述方案优选的,所述YOLOv5网络模型由CSPDarknet主特征提取网络,FPN加强特征网络以及Yolo Head分类回归网络组成,CSPDarknet主特征提取网络对原始数据集进行特征提取,所提取的各个特征图像送入FPN加强特征网络进行上采样和下采样以实现特征融合训练,Yolo Head分类回归网络对特征融合图像进行分类,获取特征图中的特征点集合,根据特征点集合判断是否有百香果与其对应。
上述方案优选的,所述百香果成熟度检测及定位方法还包括利用预测框对识别出的成熟百香果进行标注和提取成熟的百香果果实轮廓,并在百香果果实轮廓外的对应位置绘制出矩形预测框,对矩形预测框内的百香果果实轮廓进行预处理,获取百香果果实的中心点三维坐标,再根据中心点的三维坐标对成熟的百香果果实进行定位,以便对成熟的百香果果实进行定位采摘。
上述方案优选的,对矩形预测框内的百香果果实轮廓进行预处理以及再对预处理后的百香果果实轮廓图像进行视差计算包括如下步骤:
步骤71,对矩形预测框内的百香果果实的RGB值转换为对应的HSV值,得到基于HSV色彩空间的预测图像,使百香果果实与背景区分最为明显;
步骤72,对HSV色彩空间的预测图像依次选用双边滤波的方式进行滤波、选用Laplacian算子进行边缘锐化,消除预测图像中突出的边缘特征,提取清晰的百香果果实,
步骤73,利用自适应阈值Canny算子对已提取清晰的百香果果实进行边缘检测,获取百香果果实在自然环境状态下均一连续的边缘;
步骤74,利用自适应阈值Canny算子与Hough圆检测算法相结,对百香果果实边缘信息进行检测和提取,然后沿提取出来的边缘信息绘制出在自然环境状态的下百香果果实的;
步骤75,在绘制的百香果果实图像中找到圆心像素点,并以图像中的最左上为坐标系原点,得到圆心像素点在图像上的二维坐标,
步骤76,将二维坐标通过立体匹配及视差计算,得到百香果果实中心点的三维坐标,再根据中心点的三维坐标对成熟的百香果果实进行定位,以便对成熟的百香果果实进行定位采摘。
上述方案优选的,根据中心点的三维坐标对成熟的百香果果实进行定位包括如下步骤:
步骤81:以成熟的百香果果实所在目标位置点P(X,Y)为圆心、双目立体相机的左镜头坐标点Plll)和右镜头坐标点Prrr)为检测点建立三维坐标系XcYcZc,左镜头坐标Pl和右镜头坐标Pr之间的距离为d;
步骤82:在三维坐标系XcYcZc内分别计算百香果果实的目标点P在水平方向距离X、在竖直方向上距离Y以及成熟百香果圆心P与原点直线距离Z;
步骤83:根据目标位置点P、水平方向距离X、竖直方向上的距离Y和距离Z对成熟的百香果果实进行定位,以便对成熟的百香果果实进行定位采摘。
综上所述,由于本发明采用了上述技术方案,本发明具有如下显著效果:
本发明针对百香果果实构建了数据集,该数据集包括未成熟、成熟的百香果表皮颜色分布、光泽度、大小、形状等特征,并通过优化数据集,克服在自然环境下复杂光照条件以及果实被遮挡的问题,然后对自然环境下成熟百香果果实目标检测模型进行训练。基于深度学习训练出最优模型,根据百香果表皮特征分析对相机釆集到的图像进行果实检测,可以对实时采集的图像进行处理,特征提取和分析,有效避免在自然环境下由自然光和遮挡引起的识别准确率不足的问题,从而实现对成熟百香果的快速检测和准确识别。以及实现对成熟果实精准、有效的定位,解决了人工采摘过程的劳动力大、效率低的问题,同时,缩短采摘周期而避免果实掉落腐烂问题,提高作业效率。
附图说明
图1是本发明的一种基于视觉识别的百香果成熟度检测及定位方法的流程图;
图2是本发明的百香果目标模型的检测结构示意图;
图3是本发明的百香果色彩空间的预测处理流程示意图:
图4是本发明的百香果轮廓检测流程示意图;
图5是本发明的百香果果实定位检测原理结构图;
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举出优选实施例,对本发明进一步详细说明。然而,需要说明的是,说明书中列出的许多细节仅仅是为了使读者对本发明的一个或多个方面有一个透彻的理解,即便没有这些特定的细节也可以实现本发明的这些方面。
如图1至图4所示,根据本发明的一种基于视觉识别的百香果成熟度检测及定位方法,所述百香果成熟度检测及定位方法包括如下步骤:采用双目立体相机实时采集田间果园内的百香果图像,将采集到的百香果图像用于建立VOC数据集,形成待百香果图像;获取成熟百香果图像作为原始数据集,然后对原始数据集进行优化,再将优化后的原始数据集送入百香果目标模型中对自然环境下的成熟百香果进行检测与训练,训练出最优模型;将待百香果图像输入训练好的最优模型中进行测试,输出图像的识别结果,根据识别结果分别对百香果进行成熟度判别与定位。
在本发明中,对原始数据集进行优化包括通过MSRCP算法对光照图像进优化处理、对随机遮挡图像进行优化处理和利用图像数据增强技术进行扩充原始数据集的规模,通过对随机遮挡的图像进行处理时,随机选择一个矩形区域,采用随机值进行覆盖,模拟百香果被遮挡的真实场景,矩形区域相对于输入图像的比例范围为0.02~0.40,遮挡区域的最小长宽比为0.3,使得百香果图像生成不同程度的遮挡,不仅可以提高模型泛化能力,而且降低了模型过拟合的概率;使用图像数据增强技术来扩充数据集的规模,降低杂草识别模型对某些图像属性的依赖,减少训练模型过拟合、加强模型的稳定性。
在本发明中,通过MSRCP算法对光照图像进优化处理包括如下步骤:
步骤31:将原始数据集jpg.格式存放在VOC2007文件夹下JPEGImages子文件夹内,用编号重新命名,利用Labelimg图片标注工具对原始数据集进行人工标注,再用矩形框将原始数据集中的每个成熟的百香果目标图像进行框选;将熟的百香果目标图像进行标签并储存为TXT格式,然后保存在Annotations标签文件夹下,使标签文件与百香果目标图像一一对应;
步骤32:对框选的原始百香果目标图像RGB进行转换和均衡处理,然后将原始RGB进行增强并映射到每个对应的色彩通道中;在自然环境下光照情况下检测,先需要对图片进行增强处理,来强化模型对光线变化的适应能力,降低光照强度和拍摄角度对图像亮度的影响,改善了图像的反差,提高了彩色复原功能,使图像的清晰度和色彩都能精确地还原。对原始百香果目标图像RGB进行转换满足如下表达:
Int=(IR+IG+IB)/3
Int为单通道图像;IR为原始图像中红色通道子图像,IG为原始图像中绿色通道子图像,IB为原始图像中蓝色通道子图像;
步骤33:对增强映射后的图像辐照度
Figure BDA0003807296240000051
进行估算,并获取辐照度的最大值与最小值;其辐照度估算满足:
Figure BDA0003807296240000052
式中,fn为滤波器函数;I(x,y)为图像上具体像素点坐标值,
在本发明中通过MSRCP增强的线性量化计算方获取辐照度的最大值,且满足如下表达式:
Figure BDA0003807296240000061
其中,rmsrcp(x,y)表示,线性量化后的辐照度,
Figure BDA0003807296240000062
表示的是
Figure BDA0003807296240000067
中的最大值,
Figure BDA0003807296240000063
表示的是
Figure BDA0003807296240000064
中的最小值,;
为避免图像颜色失真,将反射分量图像采用伽马亮度计算进行校正,可以有效的提高图像质量;然后对校正后的图像颜色进行还原,其中伽马亮度计算满足:
Figure BDA0003807296240000065
其中,γ表示为校准参数,取值为2;Intα为得到的单通道图像。
Figure BDA0003807296240000066
B=Max(IR(i)+IG(i)+IB(i));
i为像素的索引,B为像素点的三个颜色通道子图像相加的最大值,将其带入上一个公式,A为括号内两者的最小值;
为进一步扩大百香果果实本身的颜色特征,对各通道的增强按如下计算:
Rmsrcp(x,y)=AIR,G,B(x,y);
IR,G,B(x,y)为最初对应的通道图像,Rmsrcp(x,y)表示增强处理后的图像;
使用MSRCP增强对原始图像进行优化,能够有效的改善了图片显示效果,有效的减少了光照的影响,在很大程度上提高处理后图像的全局保真性。
在本发明中,如图2所示,所述百香果目标模型为YOLOv5网络模型,将优化后的原始数据集送入YOLOv5网络模型中进行训练,获取最优训练模型,所述待百香果图像输入训练好的最优YOLOv5网络模型中进行测试,输出待百香果图像的识别结果,根据识别结果进行判断百香果成熟度;所述YOLOv5网络模型由CSPDarknet主特征提取网络,FPN加强特征网络以及Yolo Head分类回归网络组成,CSPDarknet主特征提取网络对原始数据集进行特征提取,所提取的各个特征图像送入FPN加强特征网络进行上采样和下采样以实现特征融合训练,Yolo Head分类回归网络对特征融合图像进行分类,获取特征图中的特征点集合,根据特征点集合判断是否有百香果与其对应。
CSPDarknet层:为YOLOv5神经网络模型的主干特征提取网络,包含如下各种模块或层,其中FOCUS:Focus模块在输入图片进行特征提取前,对图片进行切片操作,即邻近下采样,将一张图片切片得到四张图片,四张图片互补且没有信息丢失,从而将输入通道扩充了4倍,即拼接起后的图片相对于原先的RGB三通道模式变成了12个通道,最后将得到的新图片再经过卷积操作,最终得到没有信息丢失情况下的二倍下采样特征图;
Conv2D:二维卷积层;将输入和卷积核作互相关运算,并加上一个标量偏差来得到输出,互相关运算是将一个二维输入数组和一个二维核数组通过互相关运算输出一个二维数组;
BN层:统计每个通道数目所有点的像素值,求得均值和方差,然后在每个通道上分别用该点的像素值减均值除方差得到该点的像素值;
SiLU层:神经网络中的每个神经元节点接受上一层神经元的输出值作为本神经元的输入值,并将输入值传递给下一层,输入层神经元节点会将输入属性值直接传递给下一层(隐层或输出层);上一层节点的输出和下一层节点的输入之间具有一个函数关系,具体的函数称为激活函数。激活函数为非线性函数,用于处理复杂事务操作。
CSPLayer残差模块:将原来的残差块的堆叠进行了一个拆分,拆成左右两部分:主干部分继续进行原来的残差块的堆叠,经过少量处理直接连接到最后,最后通过Concat的方式连接。
SPP池化层:使不同任意尺寸的特征图通过SSP层之后都能输出一个固定长度的向量。然后将这个固定长度的向量输入到后续网络结构中。
FPN:YOLOv5神经网络模型的加强特征提取网络:
Concat:把不同特征层堆叠累加起来的操作,使经过不同处理的特征层进行累加,便于后续对特征的融合。UpSampling:上采样操作。也就是放大图片;DownSampling:下采样操作。也就是缩小图片。无论上采样还是下采样都是在调整图片的大小,只有图片大小尺寸一致才能进行后续多张图片堆叠的操作。
Yolo Head是YOLOv5的分类器与回归器,通过CSPDarknet和FPN可以获得三个加强过的有效特征层,每一个特征层都有宽、高和通道数,此时我们可以将特征图看作一个又一个特征点的集合,每一个特征点都有通道数个特征。对原始图像的数据集直接送入模型训练后得到最佳训练模型的平均准确率仅为81.2%,为此,本发明通过对原始图像进行优化后送入模型训练后得到最佳训练模型,化可以使模型准确率得到提升97.8%。
在本发明中,所述百香果成熟度检测及定位方法还包括利用预测框对识别出的成熟百香果进行标注和提取成熟的百香果果实轮廓,并在百香果果实轮廓外的对应位置绘制出矩形预测框,对矩形预测框内的百香果果实轮廓进行预处理,获取百香果果实的中心点三维坐标,再根据中心点的三维坐标对成熟的百香果果实进行定位,以便对成熟的百香果果实进行定位采摘;在本发明中,如图3和图4所示,对矩形预测框内的百香果果实轮廓进行预处理以及再对预处理后的百香果果实轮廓图像进行视差计算包括如下步骤:
步骤71,对矩形预测框内的百香果果实的RGB值转换为对应的HSV值,得到基于HSV色彩空间的预测图像,使百香果果实与背景区分最为明显;如图3所示,基于HSV色彩空间的预测图像方式由三个部分组成:H通道(色调、色相)、通道(饱和度、色彩纯净度)、V通道(明度)只有V通道受光线影响大,由图3中可知,需从H、S通道获取图像特征,以削弱光线的影响,为此本发明从H通道下百香果果实与背景进行区分最为明显;
步骤72,对HSV色彩空间的预测图像依次选用双边滤波的方式进行滤波、选用Laplacian算子进行边缘锐化,消除预测图像中突出的边缘特征,提取清晰的百香果果实;双边滤波按照如下进行:
设预测输入图像为f(x,y),其具体某个(x,y)邻域内的点表示为f(x,y),滤波输出图像为g(x,y),双边滤波满足如下公式:
Figure BDA0003807296240000081
(x,y)是预测图像的当前处理点,f(i,j)是某个(x,y)邻域内的点;ω(x,y,i,j)是加权系数,为此相邻两点的距离和像素值差满足:
Figure BDA0003807296240000091
双边滤波中的经验参数σd和σr的选择直接影响双边滤波的输出结果。σd控制空间邻近度,σd和σr取值都为150,其大小决定滤波窗口中包含的像素个数;当σd变大时,窗口中包含的像素变多,距离远的像素点对中心像素点的影响增大,平滑程度也越高。σr用来控制灰度邻近度,当σr变大时,则灰度差值较大的点也能影响中心点的像素值,但灰度差值大于σr的像素将不参与运算,使得能够保留图像高频边缘的灰度信息,从而为后续百香果的边缘及轮廓提取做准备;
步骤73,利用自适应阈值Canny算子对已提取清晰的百香果果实进行边缘,获取百香果果实在自然环境状态下均一连续的边缘;
步骤74,利用自适应阈值Canny算子与Hough圆算法相结,对百香果果实边缘信息进行和提取,然后沿提取出来的边缘信息绘制出在自然环境状态的下百香果果实的;通过已提取出的百香果果实边缘信息,将其在图中并绘制出来,例如,绘制黄金百香果果实与圆形极为相似的图形,
步骤75,在绘制的百香果果实图像中找到圆心像素点,并以图像中的最左上为坐标系原点,得到圆心像素点在图像上的二维坐标,根据所出来边缘进行的果实轮廓的提取,并找到百香果的圆心像素点,并以图像左上为坐标系原点,得到该像素点在图像上的坐标(x,y),百香果圆心二维坐标是后续进行立体匹配及视差计算最关键的信息;
步骤76,将二维坐标通过立体匹配及视差计算,得到百香果果实中心点的三维坐标,再根据中心点的三维坐标对成熟的百香果果实进行定位,以便对成熟的百香果果实进行定位采摘。
在本发明中,如图5所示,根据中心点的三维坐标对成熟的百香果果实进行定位包括如下步骤:
步骤81:以成熟的百香果果实所在目标位置点P(X,Y)为圆心、双目立体相机的左镜头坐标点Pll,vl)和右镜头坐标点Prrr)为检测点建立三维坐标系XcYcZc,左镜头坐标Pl和右镜头坐标Pr之间的基线距离为d;目标位置点与双目立体相机的两个光心共三个点组成的平面与各自成像平面的交线称为该目标位置点P在各自成像平面中的极线,如图5所示。当通过标定确定双目立体相机的内外参数后,就可通过两条极线P-Pl以及P-Pr的约束关系式建立对应图像点之间的关系,并由此建立求解图像点三维坐标的方程
步骤82:在三维坐标系XcYcZc内分别计算百香果果实的目标点P相对于左镜头坐标点水平方向距离X、相对于左镜头坐标点竖直方向上距离Y以及成熟百香果圆心P与原点直线距离Z;为此,以双目相机左相机为三维坐标系原点,根据三角形的相似关系可算出成熟百香果圆心P在空间中的三维坐标(X,Y,Z):
Figure BDA0003807296240000101
Figure BDA0003807296240000102
Figure BDA0003807296240000103
f为双目立体相机的焦距,X为成熟百香果圆心P在水平方向上的距离(与左镜头坐标点),Y为成熟百香果圆心P在竖直方向上的距离(与左镜头坐标点),Z为成熟百香果圆心P与三维坐标原点直线的距离。
步骤83:根据目标位置点P、方向距离X、竖直方向上的距离Y和距离Z可得出百香果实际坐标P(X,Y,Z),根据实际坐标值对成熟的百香果果实进行定位,以便对成熟的百香果果实进行定位采摘。准确计算成熟百香果圆心为采用采摘机器人后续采摘工作提供准确的位置信息。通过距离X、Y和Z为采摘机器人对成熟百香果果实进行采摘提供精确的定位,以实现后续采摘工作的完成。该检测方法鲁棒性强、实时性好,能够更好地实现自然环境下成熟百香果的检测及定位,为百香果采摘机器人后续工作奠定了基础。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (8)

1.一种基于视觉识别的百香果成熟度检测及定位方法,其特征在于:所述百香果成熟度检测及定位方法包括:采用双目立体相机实时采集田间果园内的百香果图像,将采集到的百香果图像用于建立VOC数据集,形成待检测百香果图像;获取成熟百香果图像作为原始数据集,然后对原始数据集进行优化,再将优化后的原始数据集送入百香果目标检测模型中对对自然环境下的成熟百香果进行检测与训练,训练出最优模型;将待检测百香果图像输入训练好的最优模型中进行测试,输出图像的识别结果,根据识别结果分别对百香果进行成熟度判别与定位判断。
2.根据权利要求1所述的一种基于视觉识别的百香果成熟度检测及定位方法,其特征在于:对原始数据集进行优化包括通过MSRCP算法对光照图像进优化处理、对随机遮挡图像进行优化处理和利用图像数据增强技术进行扩充原始数据集的规模。
3.根据权利要求3所述的一种基于视觉识别的百香果成熟度检测及定位方法,其特征在于:通过MSRCP算法对光照图像进优化处理包括如下步骤:
步骤31:将原始数据集jpg.格式存放在VOC2007文件夹下JPEGImages子文件夹内,用编号重新命名,利用Labelimg图片标注工具对原始数据集进行人工标注,再用矩形框将原始数据集中的每个成熟的百香果目标图像进行框选;将熟的百香果目标图像进行标签并储存为TXT格式,然后保存在Annotations标签文件夹下,使标签文件与百香果目标图像一一对应;
步骤32:对框选的原始百香果目标图像RGB进行均衡,然后将原始RGB进行增强并映射到每个对应的色彩通道中;
步骤33:对增强映射后的图像辐照度
Figure FDA0003807296230000011
进行估算,并获取辐照度的最大值与最小值;其辐照度估算满足:
Figure FDA0003807296230000012
式中,fn为滤波器函数;I(x,y)为图像上具体像素点坐标值;
4.根据权利要求1所述的一种基于视觉识别的百香果成熟度检测及定位方法,其特征在于:所述百香果目标检测模型为YOLOv5网络模型,将优化后的原始数据集送入YOLOv5网络模型中进行检测、训练,获取最优训练模型,所述待检测百香果图像输入训练好的最优YOLOv5网络模型中进行测试,输出待检测百香果图像的识别结果,根据识别结果分别对百香果进行成熟度判别与定位判断。
5.根据权利要求5所述的一种基于视觉识别的百香果成熟度检测及定位方法,其特征在于:所述YOLOv5网络模型由CSPDarknet主特征提取网络,FPN加强特征网络以及YoloHead分类回归网络组成,CSPDarknet主特征提取网络对原始数据集进行特征提取,所提取的各个特征图像送入FPN加强特征网络进行上采样和下采样以实现特征融合训练,YoloHead分类回归网络对特征融合图像进行分类,获取特征图中的特征点集合,根据特征点集合判断是否有百香果与其对应。
6.根据权利要求1或4所述的一种基于视觉识别的百香果成熟度检测及定位方法,其特征在于:所述百香果成熟度检测及定位方法还包括利用预测框对识别出的成熟百香果进行标注和提取成熟的百香果果实轮廓,并在百香果果实轮廓外的对应位置绘制出矩形预测框,对矩形预测框内的百香果果实轮廓进行预处理,获取百香果果实的中心点三维坐标,再根据中心点的三维坐标对成熟的百香果果实进行定位,以便对成熟的百香果果实进行定位采摘。
7.根据权利要求6所述的一种基于视觉识别的百香果成熟度检测及定位方法,其特征在于:对矩形预测框内的百香果果实轮廓进行预处理以及再对预处理后的百香果果实轮廓图像进行视差计算包括如下步骤:
步骤71,对矩形预测框内的百香果果实的RGB值转换为对应的HSV值,得到基于HSV色彩空间的预测图像,使百香果果实与背景区分最为明显;
步骤72,对HSV色彩空间的预测图像依次选用双边滤波的方式进行滤波、选用Laplacian算子进行边缘锐化,消除预测图像中突出的边缘特征,提取清晰的百香果果实,
步骤73,利用自适应阈值Canny算子对已提取清晰的百香果果实进行边缘检测,获取百香果果实在自然环境状态下均一连续的边缘;
步骤74,利用自适应阈值Canny算子与Hough圆检测算法相结,对百香果果实边缘信息进行检测和提取,然后沿提取出来的边缘信息绘制出在自然环境状态的下百香果果实的;
步骤75,在绘制的百香果果实图像中找到圆心像素点,并以图像中的最左上为坐标系原点,得到圆心像素点在图像上的二维坐标,
步骤76,将二维坐标通过立体匹配及视差计算,得到百香果果实中心点的三维坐标,再根据中心点的三维坐标对成熟的百香果果实进行定位,以便对成熟的百香果果实进行定位采摘。
8.根据权利要求7所述的一种基于视觉识别的百香果成熟度检测及定位方法,其特征在于:根据中心点的三维坐标对成熟的百香果果实进行定位包括如下步骤:
步骤81:以成熟的百香果果实所在目标位置点P(X,Y)为圆心、双目立体相机的左镜头坐标点Plll)和右镜头坐标点Prrr)为检测点建立三维坐标系XcYcZc,左镜头坐标Pl和右镜头坐标Pr之间的距离为d;
步骤82:在三维坐标系XcYcZc内分别计算百香果果实的目标点P在水平方向距离X、在竖直方向上距离Y以及成熟百香果圆心P与原点直线距离Z;
步骤83:根据目标位置点P、水平方向距离X、竖直方向上的距离Y和距离Z对成熟的百香果果实进行定位,以便对成熟的百香果果实进行定位采摘。
CN202211000670.4A 2022-08-19 2022-08-19 一种基于视觉识别的百香果成熟度检测及定位方法 Pending CN115311520A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211000670.4A CN115311520A (zh) 2022-08-19 2022-08-19 一种基于视觉识别的百香果成熟度检测及定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211000670.4A CN115311520A (zh) 2022-08-19 2022-08-19 一种基于视觉识别的百香果成熟度检测及定位方法

Publications (1)

Publication Number Publication Date
CN115311520A true CN115311520A (zh) 2022-11-08

Family

ID=83863037

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211000670.4A Pending CN115311520A (zh) 2022-08-19 2022-08-19 一种基于视觉识别的百香果成熟度检测及定位方法

Country Status (1)

Country Link
CN (1) CN115311520A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116267226A (zh) * 2023-05-16 2023-06-23 四川省农业机械研究设计院 一种基于机器视觉智能识别成熟度的桑葚采摘方法与装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116267226A (zh) * 2023-05-16 2023-06-23 四川省农业机械研究设计院 一种基于机器视觉智能识别成熟度的桑葚采摘方法与装置

Similar Documents

Publication Publication Date Title
Jia et al. Detection and segmentation of overlapped fruits based on optimized mask R-CNN application in apple harvesting robot
CN108573276B (zh) 一种基于高分辨率遥感影像的变化检测方法
Liu et al. A method of segmenting apples at night based on color and position information
CN105718945B (zh) 基于分水岭和神经网络的苹果采摘机器人夜间图像识别方法
CN109636784B (zh) 基于最大邻域和超像素分割的图像显著性目标检测方法
CN109345547B (zh) 基于深度学习多任务网络的交通车道线检测方法及装置
CN111753577B (zh) 自动采摘机器人中的苹果识别与定位方法
CN112598713A (zh) 一种基于深度学习的近岸海底鱼类检测、跟踪统计方法
CN111178177A (zh) 一种基于卷积神经网络的黄瓜病害识别方法
Ji et al. Target recognition method of green pepper harvesting robot based on manifold ranking
TWI745204B (zh) 基於深度學習之高效率光達物件偵測方法
CN114140665A (zh) 一种基于改进YOLOv5的密集小目标检测方法
Song et al. Detection of maize tassels for UAV remote sensing image with an improved YOLOX model
CN114331986A (zh) 一种基于无人机视觉的坝体裂纹识别与测量方法
CN111199245A (zh) 油菜害虫识别方法
CN115272791B (zh) 一种基于YoloV5的茶叶用多目标检测定位方法
CN115861686A (zh) 基于边缘深度学习的荔枝关键生长期识别检测方法及系统
CN115311520A (zh) 一种基于视觉识别的百香果成熟度检测及定位方法
Liu et al. SE-Mask R-CNN: An improved Mask R-CNN for apple detection and segmentation
CN117409339A (zh) 一种用于空地协同的无人机作物状态视觉识别方法
Shuai et al. An improved YOLOv5-based method for multi-species tea shoot detection and picking point location in complex backgrounds
Amean et al. Automatic leaf segmentation and overlapping leaf separation using stereo vision
CN110532935A (zh) 一种大田作物表型信息高通量对等监测系统及监测方法
CN117456358A (zh) 一种基于YOLOv5神经网络的植物病虫害检测方法
CN115861409B (zh) 大豆叶面积测算方法、系统、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination