CN114387520A

CN114387520A - 一种用于机器人采摘的密集李子精准检测方法及其系统

Info

Publication number: CN114387520A
Application number: CN202210042666.8A
Authority: CN
Inventors: 兰玉彬; 王乐乐; 刘圣搏; 赵英杰; 熊章钧; 常坤; 王从越
Original assignee: South China Agricultural University
Current assignee: South China Agricultural University
Priority date: 2022-01-14
Filing date: 2022-01-14
Publication date: 2022-04-22
Anticipated expiration: 2042-01-14
Also published as: CN114387520B

Abstract

本发明公开了一种用于机器人采摘的密集李子精准检测方法及其系统，包括以下步骤：通过图像采集设备采集果园果实的图像；进行检查处理得到符合要求的目标检测图像；对目标检测图像进行不同成熟度果实的数据标注，获取标注图像；将标注图像按比例划分训练集和测试集，获取训练集中成熟比例果实个数；根据训练集中果实成熟比例判定是否需要数据平衡处理；将平衡训练集数据进行数据增强处理；对目标检测模型进行改进；通过改进目标检测模型对数据增强训练集进行训练和预测，得到检测结果；本发明将深度学习模型应用于李子的识别采摘，可部署在机器人采摘平台，为果园的产量估测和采摘机器人的研究提供技术支撑。

Description

一种用于机器人采摘的密集李子精准检测方法及其系统

技术领域

本发明涉及农业机器人的研究领域，特别涉及一种用于机器人采摘的密集李子精准检测方法及其系统。

背景技术

与苹果、柑橘、芒果等果实相比，李子果型小且密集分布，易被果实或枝叶遮挡。李子树多数被种植在山坡上，其果实的生长环境充满复杂性和不确定性的。在目前李子果园中，李子的成熟度识别与采摘任务都是由果农完成。而如今人工成本涨幅很大，人工成本在总成本的占比也在加大。据调查2019年人力成本涨幅高达12-15％。在精准农业中，劳动力短缺和老龄化对于水果产业的发展增添了阻力。综上所述，密集李子采摘机械化、智能化是整个水果产业发展中不可或缺的一环。

在现代精准果园中，由于复杂噪音的干扰，包括风干扰、变化的光照和枝叶遮挡，小目标水果的识别被认为更具挑战性，许多研究人员更喜欢检测大目标水果。虽然相关学者在李子的检测方面做了研究工作，但李子本身簇状生长和不同成熟度混杂的特点，更加大了小目标的检测难度，导致了现有算法在李子检测过程中表现出不佳的性能。到目前为止，尚没有关于在自然环境中检测密集李子的深度学习方法的研究，致使水果采摘机器人在果园中可利用的技术资源是受限的。因此，从实际出发探索出一种高效、准确的李子识别算法是非常有意义的。

发明内容

本发明的主要目的在于克服现有技术的缺点与不足，提供一种用于机器人采摘的密集李子精准检测方法及其系统，实现对密集李子目标果实的快速准确地检测，解决实际果园的需求。

本发明的第一目的在于提供一种用于机器人采摘的密集李子精准检测方法；

本发明的第二目的在于提供一种用于机器人采摘的密集李子精准检测系统；

本发明的第一目的通过以下的技术方案实现：

一种用于机器人采摘的密集李子精准检测方法，包括以下步骤：

通过图像采集设备采集果园果实的图像；

对采集图像进行检查处理，得到符合要求的目标检测图像；

通过数据标注工具对目标检测图像进行数据标注，获取不同成熟度的标注图像；

将标注图像按比例划分训练集，获取训练集中成熟果实个数和未成熟果实个数；

根据训练集中果实成熟比例判断是否进行数据平衡处理，数据平衡处理后得到平衡训练集；

将平衡训练集数据集进行数据增强处理，得到数据增强训练集；

对目标检测模型进行改进，得到改进目标检测模型；

通过改进目标检测模型对数据增强训练集进行训练和预测，得到检测结果。

进一步地，所述通过图像采集设备采集果园果实的图像，具体为：通过高清晰移动采集设备进行不同方向不同距离地图像采集，获得不同颜色、不同姿态、不同大小、不同背景、不同密集遮挡的RGB图像。

进一步地，所述对采集图像进行检查处理，得到符合要求的目标检测图像，具体为：对采集的图像数据进行质量评估，质量评估包括图像的清晰度、背景复杂度，删除模糊图像、未包含果实图像、背景复杂图像，评估合格的图像保留为目标检测图像。

进一步地，所述通过数据标注工具对目标检测图像进行数据标注，获取不同成熟度的标注图像，具体为：通过图像注释工具对目标检测图像采用划分成熟度的方式进行数据标注，包含成熟果实和未成熟果实两个标注类别；对完全裸露的果实进行外切矩形框的方式标注，对遮挡和粘连的果实标注其图像裸露部分，对图像边界出现部分果实和遮挡程度小于K的果实不作标注处理，这里 K为10％。

进一步地，将标注图像按比例划分训练集，获取训练集中成熟果实个数和未成熟果实个数，具体为：将标注图像按8∶2比例划分训练集和预测集；所述训练集包含验证集，训练集和验证集比例为9∶1；通过计算法获取训练集中果实个数；所述数据标注是根据果园中果实颜色划分不同成熟度，李子果实颜色红色部分占比大于0.5被划分为成熟李子，反之为未成熟李子。

进一步地，训练集与测试集的比例一般为8:2数据标注是根据果园中果实颜色划分不同成熟度的，数据标注是真实的数据，是地面验证数据，用于后期评估改进模型输出的IOU大小，其中IOU是指：测试结果与真实结果标注框的重合程度；训练集与验证集的比例一般为9:1，可以自行在代码中修改，这里用的就是9:1，验证集与训练集一起用在模型训练过程中的；

进一步地，所述根据训练集中果实成熟比例进行数据平衡处理，得到平衡训练集，具体为：若训练集中成熟果实和不成熟果实比例大于等于1，则不进行数据平衡处理，若训练集中成熟果实和不成熟果实比例小于1，则进行数据平衡处理，数据平衡处理如下：

S601、假设有数据集s＝[M₁,M₂,...,M_i][N₁,N₂,...,N_j]^T，其中M_i表示数据集样本的种类，N_j表示每一种样本的数量；

S602、比较该数据集中所有类的样本数量值M_iN_j，找出所有类中最大值 M_iN_jmax；

S603、使用M_iN_jmax依次除以剩余类的样本数量值M_iN_j，得到除数C；

S604、选择一种数据量扩增方式，根据除数C对剩余类进行数据量扩增，使得所有类别样本数量向最大值方向扩增，得到M_iN′_j，最终使各类别数量的比值接近于1；

S605、最终输出得到扩增后的数据集T＝[M₁,M₂,...,M_i][N′₁,N′₂,...,N′_jmax]^T。

进一步地，所述将平衡训练集数据集进行数据增强处理，得到数据增强训练集，具体为：利用随机组合方式对训练集进行离线数据增强处理，包含高斯模糊、随机旋转、随机裁掉图像部分区域、直方图均衡化、随机亮度调整、椒盐噪声。

进一步地，为了增强数据的多样性，数据增强做的随机组合方式是任意两种方式进行组合，随机组合的目的是模拟在真实果园中数据获取的图像。

进一步地，所述对目标检测模型进行改进，得到改进目标检测模型，具体为：

以YOLOv4为改进目标检测模型的基础，改进目标检测模型；

S801、使用MobilenetV3代替CSPDarknet53作为骨干特征提取网络，并在特征融合阶段使用深度可分离卷积取代标准卷积；

S802、构建多尺度融合的网络结构；

S803、对来自特征金字塔网络特征融合后输出的4个特征层进行剪枝操作；

S804、改进损失函数；使用Focal Loss替代原有YOLOv4损失函数中的BCE Loss，与CIOU loss形成联合损失函数平衡难分类样本和易分类样本对总损失的贡献度，其计算公式为：

其中，y为样本标签数量；p_t表示属于李子类别的概率；a_t为平衡正负样本权重的系数，0＜a_t＜1；γ为难易样本的调制参数，(1-p_t)^γ被用来调节难易样本的权重。

进一步地，所述通过改进目标检测模型对数据增强训练集进行训练和预测，得到检测结果，具体为：

S901、运行train.py开始训练训练集；

S902、模型训练完毕后，运行test.py检测模型的性能；

S903、得到模型的检测结果指标，所述指标包括平均准确度均值、计算某一类别的平均准确度。

一种用于机器人采摘的密集李子精准检测系统，其特征在于，包括：

图像采集设备，用于采集果园果实的图像；

图像处理模块，用于对采集图像进行检查处理，得到符合要求的目标检测图像；

数据标注模块，用于对目标检测图像进行数据标注，获取标注图像；

标注划分模块，用于将标注图像按比例划分训练集和测试集，获取训练集中熟果实个数和未成熟果实个数；

平衡处理模块，根据训练集中果实成熟比例进行数据平衡处理，得到平衡训练集；

数据增强模块，将平衡训练集数据集进行数据增强处理，得到数据增强训练集；

模型改进模块，对目标检测模型进行改进，得到改进目标检测模型；

模型训练和预测模块，通过改进目标检测模型对数据增强训练集进行训练和预测，得到检测结果；

检测结果输出模块，用于输出检测结果。

本发明与现有技术相比，具有如下优点和有益效果：

本发明根据李子果实的生长特性，提出了一种用于机器人采摘的密集李子精准检测方法。在数据集制作方面，本发明考虑到了不同类别数据量悬殊和密集数据集的问题，使用了基于类别平衡的数据增强方法；在模型改进方面，以 YOLOv4为研究基础，使用MobilenetV3作为骨干特征提取网络，同时在特征融合阶段使用深度可分离卷积来提升模型的准确度和轻量化。为解决模型对密集目标特征提取不足问题，本发明引入152×152尺寸的特征层以实现细粒度检测；同时使用Focal loss与CIOU loss的联合损失函数平衡难分类样本和易分类样本对总损失的贡献度。最后再通过不同阶段的迁移学习来训练改进的模型。进一步地，该方法可为后续果园的产量估测和李子采摘机器人研究的提供技术支撑

附图说明

图1是本发明所述一种用于机器人采摘的密集李子精准检测方法流程图；

图2是本发明所述实施例1中用于机器人采摘的李子检测模型图；

图3是本发明所述一种用于机器人采摘的密集李子精准检测系统结构框图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述，但本发明的实施方式不限于此。

实施例1：

一种用于机器人采摘的密集李子精准检测方法，如图1所示，包括以下步骤：

通过图像采集设备采集果园果实的图像；

对采集图像进行检查处理，得到符合要求的目标检测图像；

对目标检测模型进行改进，得到改进目标检测模型；

具体如下：

第一步，使用4000万像素的智能手机作为采集设备，设置拍摄分辨率为 3840×2160，曝光参数为自动，对焦模式为自动对焦。为了尽可能多地采集自然环境中下李子的果实信息，实验者模拟采摘机器人的操作过程，手持采集设备不断地变换拍摄角度和拍摄距离，以期望能采集到不同颜色、姿态、大小、背景及密集遮挡等情况的RGB图像。

对于采集到的李子图像，其像素为3968×2976，然而过高的像素会导致难以训练和处理。采取双三次缩放算法将图片像素缩放至1920×1440。

第二步，使用目测法对采集的图像数据进行质量评估，删除由于相机抖动造成的模糊图像、未包含目标果实的图像和背景复杂的图像，评估合格的图像保留为目标检测图像，评估不合格的图像删除，即删除掉模糊图像、不包含李子的图像和背景过于复杂的图像。

背景复杂判断：使用log边缘检测算子对图像进行计算，再使用Ostu算法对计算得到的图像进行自动阈值分割，最后统计像素点值为255的像素点数量占总图像的百分比，当大于设定的百分比阈值时，即认为当前图像背景复杂。

对于本采集的李子数据，通过多次实验，设定百分比阈值为20％；当大于 20％时，图像背景复杂，模型训练花费的时间和算力就很大，在对图像进行预测时，检测时间也会增加，对于后期部署在采摘平台上机械臂反应的时间就很长，而这与向往和追求的实时采摘是相悖的；当小于20％时，图像正常。

第三步、使用LabelImg作为图像注释工具，对完全裸露的李子进行外切矩形框的方式标注，对于遮挡或粘连的李子只标注裸露于图像的部分，对在图像边界出现部分李子或遮挡程度小于10％的李子时不作标注处理。保存标注信息的格式为PASCAL VOC。为了识别不同成熟度的李子果实，在标注过程中人工判断成熟度并标记为成熟(plum)与未成熟(raw_plum)两个类别李子。

第四步、按照8:2的比例将数据集划分为训练集(包含验证集)与测试集；使用计数算法获得训练集中成熟果实与未成熟果实的个数。

具体为：将标注图像按比例划分训练集，获取训练集中成熟果实个数和未成熟果实个数，具体为：将标注图像按8∶2比例划分训练集和预测集；所述训练集包含验证集，训练集和验证集比例为9∶1；通过计算法获取训练集中果实个数；所述数据标注是根据果园中果实颜色划分不同成熟度，李子果实颜色红色部分占比大于0.5被划分为成熟李子，反之为未成熟李子。

进一步地，训练集与测试集的比例一般为8:2数据标注是根据果园中果实颜色划分不同成熟度的，数据标注是真实的数据，是地面验证数据，用于后期评估改进模型输出的IOU大小，其中IOU是指：测试结果与真实结果标注框的重合程度；训练集与验证集的比例一般为9:1，即验证集在训练集中占比10％，可以自行在代码中修改，这里用的就是9:1，验证集与训练集一起用在模型训练过程中的；

第五步、根据成熟与否的李子个数比例判定训练集是否需要数据平衡操作。本实施例中成熟李子与未成熟李子数量比例为2.2:1，需要进行数据平衡操作。

数据平衡处理如下：

第六步、本实施例中所用图像数据为1890张李子图像。为防止训练数据量过少造成的过拟合或不收敛现象，需要对训练数据增强以提高检测模型的鲁棒性。在第五步的基础上，训练集中不同成熟度李子数量相近，趋近于1。

所述数据增强处理如下：利用随机组合方式对训练集进行离线数据增强处理，包含高斯模糊、随机旋转、随机裁掉图像部分区域、直方图均衡化、随机亮度调整、椒盐噪声；为了增强数据的多样性，数据增强做的随机组合方式是两种。

第七步、使用改进目标检测模型进行训练。

以YOLOv4为改进目标检测模型的基础，改进目标检测模型，如图2所示；

S801、使用MobilenetV3代替CSPDarknet53作为骨干特征提取网络，并在特征融合阶段使用深度可分离卷积取代标准卷积；改进后的网络结构，其中， Conv表示卷积，DSC表示深度可分离卷积，CBL与CBH表示卷积加批量正则加LekeyReLU或h-swish激活函数的合成模块，Bneck表示块，BneckSE表示带有SE结构的Bneck，Concat表示堆叠，upSampling表示上采样。

S802、构建多尺度融合的网络结构；从主干网络MobileNetV3中输出四个特征层，分别是P1(152×152)、P2(76×76)、P3(38×38)和P4(19×19)。其中， P4特征层的感受野最大，适合大尺寸的目标检测，P3特征层的感受野适合中等尺寸的目标检测，对P2进行上采样，将其与P1特征层融合后可获得较为丰富的浅层信息，从而实现对小目标物体细粒度的检测。在特征传播过程中19×19 尺度特征层仍然经过空间金字塔池化(SPP)结构得到特征层P4。将特征层P4、 P3、P2和P1在FPN结构中通过上采样进行不同金字塔级别的特征图结合，每一个特征层经过卷积和上采样变换，获得与上一个特征层相同的尺度和通道数量，然后经过与上一个特征层堆叠融合可获得信息更加丰富的特征图。

S803、对来自特征金字塔网络特征融合后输出的4个特征层进行剪枝操作；为防止网络过于冗余，对来自FPN特征融合后输出的4个特征层进行剪枝操作。具体操作为将FPN输出的152×152尺度特征层不再进行YOLO Head的预测输出，直接在路径聚合网络(PANet)结构中上采样，因此改进算法也保持三个尺度的预测输出头，即P2'(76×76)、P3'(38×38)、P4'(19×19)。

S804、改进损失函数；由于李子果实体型较小，并且在图像中占据的像素点较少的缘故，当一张图像中同时存在单个、遮挡和密集堆叠的李子果实时，模型会自动关注并训练单个或易识别的简单样本，忽视粘连等难分类的样本。因此寻找合适的损失函数去平衡难分类和易分类样本对总损失的贡献度是很有必要的。而Focal loss函数的作用是在不影响原检测速度的情况下，在训练过程中将一些注意力转移到难分类的样本上；使用FocalLoss替代原有YOLOv4损失函数中的BCE Loss，与CIOU loss形成联合损失函数平衡难分类样本和易分类样本对总损失的贡献度；其计算公式为：

进一步地，使用改进后的检测模型训练制作好的训练集，并用在测试集上进行预测。具体为：为了加快模型收敛，通过不同阶段的迁移学习来训练改进的模型，并使用评估指标在测试集上评估改进模型的鲁棒性情况。为了客观衡量模型对密集李子的目标检测效果，使用准确率(Precision,P)、召回率(Recall, R)、调和均值F1值(F1-score)、平均精度AP、均值平均精度mAP、网络参数量、权重大小和检测速度(FPS)来评价训练后的模型，IoU取值推荐使用0.5。

本实施例选择的模型图像尺寸是608×608时，负责密集小目标进行预测的特征层为76×76，每个特征网格对应的感受野尺寸为8×8。当输入图片大小为 1920×1080时，通过YOLO网格压缩对应长边为25，即当目标特征尺寸小于 25×25像素时将无法有效学习到目标的特征信息。用于模型训练的硬件平台配置为CPU为AMD R5-5600X 3.7GHz，内存为32GB，存储SSD为512GB，显卡为NVIDIA RTX2060S，显存为8GB，操作系统为Windows10，CUDA版本为 10.1，Python版本为3.7，PyTorch版本为1.6。

本实施例输入图像分辨率为1920×1440，随机选择10％训练集图像数据作为验证集，使用K-means算法迭代生成anchors坐标框，使用Adam优化器，采用改进的损失函数对模型进行训练。除了使用离线增强方法外，在训练过程中使用Mosaic数据增强，进一步丰富检测物体的背景，强化网络模型对于李子果实特征的认知，增强模型的鲁棒性和泛化性能。学习率初始值设置为10^(-4)，使用余弦退火学习率在训练过程中进行优化更新。

采取迁移学习的方式进行训练。将训练分为两个阶段，整个阶段训练100 轮次(Epoch)。对于前半个阶段，加载MobileNetV3系网络的预训练权值，对模型主干特征提取网络使用冻结训练50轮次，将模型的学习率初始值设置为1 ×10^(-3)，批大小设置为16。这种操作可以加快收敛速度，并避免预训练权值被破坏。对于后半个阶段，对主干特征提取网络进行解冻，以1×10^(-4)的初始学习率对整个模型进一步训练50轮次，批大小设置为8。通过两个阶段加快整个模型的收敛，缩短了模型的训练时间。

第八步、使用改进后的检测模型训练制作好的训练集，并用在测试集上进行预测。经试验，该改进算法在密集李子上的mAP为88.56％。

实施例2

一种用于机器人采摘的密集李子精准检测系统，如图3所示，包括：

图像采集设备，用于采集果园果实的图像；

检测结果输出模块，用于输出检测结果。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种用于机器人采摘的密集李子精准检测方法，其特征在于，包括以下步骤：

通过图像采集设备采集果园果实的图像；

对采集图像进行检查处理，得到符合要求的目标检测图像；

对目标检测模型进行改进，得到改进目标检测模型；

2.根据权利要求1所述的一种用于机器人采摘的密集李子精准检测方法，其特征在于，所述通过图像采集设备采集果园果实的图像，具体为：通过高清晰移动采集设备进行不同方向不同距离地图像采集，获得不同颜色、不同姿态、不同大小、不同背景、不同密集遮挡的RGB图像。

3.根据权利要求1所述的一种用于机器人采摘的密集李子精准检测方法，其特征在于，所述对采集图像进行检查处理，得到符合要求的目标检测图像，具体为：对采集的图像数据进行质量评估，质量评估包括图像的清晰度、背景复杂度，删除模糊图像、未包含果实图像、背景复杂图像，评估合格的图像保留为目标检测图像。

4.根据权利要求1所述的一种用于机器人采摘的密集李子精准检测方法，其特征在于，所述通过数据标注工具对目标检测图像进行数据标注，获取不同成熟度的标注图像，具体为：通过图像注释工具对目标检测图像采用划分成熟度的方式进行数据标注，包含成熟果实和未成熟果实两个标注类别；对完全裸露的果实进行外切矩形框的方式标注，对遮挡和粘连的果实标注其图像裸露部分，对图像边界出现部分果实和遮挡程度小于K的果实不作标注处理。

5.根据权利要求1所述的一种用于机器人采摘的密集李子精准检测方法，其特征在于，将标注图像按比例划分训练集，获取训练集中成熟果实个数和未成熟果实个数，具体为：将标注图像按8∶2比例划分训练集和预测集；所述训练集包含验证集，训练集和验证集比例为9∶1；通过计算法获取训练集中果实个数；所述数据标注是根据果园中果实颜色划分不同成熟度，李子果实颜色红色部分占比大于0.5被划分为成熟李子，反之为未成熟李子。

6.根据权利要求1所述的一种用于机器人采摘的密集李子精准检测方法，其特征在于，所述根据训练集中果实成熟比例进行数据平衡处理，得到平衡训练集，具体为：若训练集中成熟果实和不成熟果实比例大于等于1，则不进行数据平衡处理，若训练集中成熟果实和不成熟果实比例小于1，则进行数据平衡处理，数据平衡处理如下：

S602、比较该数据集中所有类的样本数量值M_iN_j，找出所有类中最大值M_iN_jmax；

7.根据权利要求1所述的一种用于机器人采摘的密集李子精准检测方法，其特征在于，所述将平衡训练集数据集进行数据增强处理，得到数据增强训练集，具体为：利用随机组合方式对训练集进行离线数据增强处理，包含高斯模糊、随机旋转、随机裁掉图像部分区域、直方图均衡化、随机亮度调整、椒盐噪声。

8.根据权利要求1所述的一种用于机器人采摘的密集李子精准检测方法，其特征在于，所述对目标检测模型进行改进，得到改进目标检测模型，具体为：

以YOLOv4为改进目标检测模型的基础，改进目标检测模型；

S802、构建多尺度融合的网络结构；

S804、改进损失函数；使用Focal Loss替代原有YOLOv4损失函数中的BCE Loss，与CIOUloss形成联合损失函数平衡难分类样本和易分类样本对总损失的贡献度，其计算公式为：

9.根据权利要求1所述的一种用于机器人采摘的密集李子精准检测方法，其特征在于，所述通过改进目标检测模型对数据增强训练集进行训练和预测，得到检测结果，具体为：

S901、运行train.py开始训练训练集；

S902、模型训练完毕后，运行test.py检测模型的性能；

10.一种用于机器人采摘的密集李子精准检测系统，其特征在于，包括：

图像采集设备，用于采集果园果实的图像；

检测结果输出模块，用于输出检测结果。