CN115082815B

CN115082815B - 基于机器视觉的茶芽采摘点定位方法、装置及采摘系统

Info

Publication number: CN115082815B
Application number: CN202210859628.1A
Authority: CN
Inventors: 姜兆亮; 李鑫德; 侯瑞源; 陈国鹏
Original assignee: Shandong University
Current assignee: Shandong University
Priority date: 2022-07-22
Filing date: 2022-07-22
Publication date: 2023-04-07
Anticipated expiration: 2042-07-22
Also published as: CN115082815A

Abstract

本发明提供一种基于机器视觉的茶芽采摘点定位方法、装置及采摘系统，涉及机器视觉及图像处理技术领域，用于解决现有茶芽采摘效率低、质量低的问题，该方法包括：获取茶丛的RGB图像和深度信息；利用茶芽检测网络对所述RGB图像进行茶芽检测，得到茶芽图像和对应的茶芽类型，将所述茶芽图像输入至采摘区域识别网络中识别出不同茶芽类型的茶芽采摘区域，求取茶芽采摘区域的质心像素坐标，求取茶芽采摘区域的质心像素坐标；根据深度信息和茶芽采摘区域的质心像素坐标，确定出茶芽采摘点的三维空间坐标，根据三维空间坐标采摘茶丛的茶芽。这样，可以在兼顾采摘效率的同时保证茶叶质量与茶芽的完整性，满足名优茶单芽采摘要求。

Description

基于机器视觉的茶芽采摘点定位方法、装置及采摘系统

技术领域

本发明属于机器视觉及图像处理技术领域，尤其涉及一种基于机器视觉的茶芽采摘点定位方法、装置及采摘系统。

背景技术

本部分的陈述仅仅是提供了与本申请相关的背景技术信息，不必然构成已经成为本领域一般技术人员所公知的现有技术。

随着茶产业的快速发展，人们对生产优质茶叶的要求越来越高。采茶是茶叶生产的前提。与其他作物的收获时间一样，茶叶的收获也是季节性和非同步的。传统的手工采茶方法效率极低，耗费耕作时间，茶叶质量因人而异，有些新手往往达不到要求。

机械采茶虽然提高了工作效率，但由于缺乏自主性，茶芽和老叶被一刀切，茶叶质量得不到保证，破坏了茶芽的完整性。同时，它也会损害茶树，降低来年的茶叶产量。目前，在茶芽的检测与识别方面，现有方法主要包括数字处理技术、基于机器学习的分类器等用于检测茶芽，也有使用Faster RCNN网络进行茶芽的检测，但是由于茶丛的背景环境复杂，茶芽体积较小，不同类型茶芽的采摘点不同，致使茶芽检测的精度不高。并且，现有方法通常只是将茶芽检测出来，机械手仍然无法得到准确的位置坐标进行采摘。

发明内容

为了解决上述问题，本发明提供一种基于机器视觉的茶芽采摘点定位方法与系统，以在兼顾采摘效率的同时保证茶叶质量与茶芽的完整性，满足名优茶单芽采摘要求。

为了实现上述目的，本发明主要包括以下几个方面：

第一方面，本发明实施例提供一种基于机器视觉的茶芽采摘点定位方法，包括：

获取茶丛的RGB图像和深度信息；

利用茶芽检测网络对所述RGB图像进行茶芽检测，得到茶芽图像和对应的茶芽类型，将所述茶芽图像输入至采摘区域识别网络中识别出不同茶芽类型的茶芽采摘区域，求取茶芽采摘区域的质心像素坐标；所述茶芽类型包括一芽一叶和一芽两叶；

根据所述深度信息和茶芽采摘区域的质心像素坐标，确定出茶芽采摘点的三维空间坐标，根据所述三维空间坐标采摘茶丛的茶芽。

在一种可能的实施方式中，所述茶芽检测网络识别出RGB图像中茶芽的位置区域，将其中的一芽一叶和一芽两叶用矩形框标注出来，通过剪裁得到矩形框内的茶芽图像，并确定茶芽图像对应的茶芽类型。

在一种可能的实施方式中，所述茶芽检测网络的茶芽检测过程包括：从所述RGB图像中提取出多个不同尺度的特征图；将多个不同尺度的特征图输入至特征金字塔网络中进行特征融合，基于融合后的特征对茶芽的位置进行预测，得到茶芽图像和对应的茶芽类型。

在一种可能的实施方式中，采用DarkNet53网络对RGB图像进行特征图的提取，该网络在特征提取时，每一个卷积层后都附带一个批归一化层和激活层，结合残差模块ResNet，输出不同尺度的特征图。

在一种可能的实施方式中，所述采摘区域识别网络的识别过程包括：获取茶芽图像，提取出茶芽的采摘区域信息，生成初始特征图；采用了多种尺度的自适应平均池化层，对所述初始特征图进行池化处理，生成多个特征图，然后将多个特征图与初始特征图连接起来，最后经过卷积层生成最终的预测图；根据所述预测图，确定茶芽采摘区域。

在一种可能的实施方式中，确定茶芽采摘区域的图像空间矩，根据零阶空间矩和一阶空间矩，确定茶芽采摘区域的质心像素坐标。

在一种可能的实施方式中，所述深度信息包括深度贴图参数、图像中心坐标和用于获取RGB图像的相机光学系统的内部参数。

在一种可能的实施方式中，采用如下方式计算茶芽采摘点的三维空间坐标：

；

其中，X是相对于图像中心在X轴上的距离投影，Y是相对于图像中心在Y轴上的距离投影，Z是相对于图像中心在Z轴上的距离投影，（x₀，y₀）是图像中检测对象中心的像素坐标，是具有坐标（x₀，y₀）点处深度贴图的值，C_x是图像中心沿X轴的像素坐标，C_y是图像中心沿Y轴的像素坐标，f_x和f_y分别是用于获取RGB图像的相机光学系统的内部参数。

第二方面，本发明实施例提供一种基于机器视觉的茶芽采摘点定位装置，包括：

获取模块，用于获取茶丛的RGB图像和深度信息；

检测模块，用于利用茶芽检测网络对所述RGB图像进行茶芽检测，得到茶芽图像和对应的茶芽类型，将所述茶芽图像输入至采摘区域识别网络中识别出不同茶芽类型的茶芽采摘区域，求取茶芽采摘区域的质心像素坐标；所述茶芽类型包括一芽一叶和一芽两叶；

定位模块，用于根据所述深度信息和茶芽采摘区域的质心像素坐标，确定出茶芽采摘点的三维空间坐标，根据所述三维空间坐标采摘茶丛的茶芽。

第三方面，本发明实施例提供一种茶芽采摘系统，包括：工控机，以及与所述工控机通信连接的行走机构、采摘机械臂、RGB-D深度相机和采摘机械手；所述RGB-D深度相机用于采集茶丛的RGB图像和深度信息；所述工控机用于执行如上述第一方面，以及第一方面的任一中可能的实施方式中所述的基于机器视觉的茶芽采摘点定位方法，并控制所述行走机构、采摘机械臂和采摘机械手按照所确定的三维空间坐标进行茶芽的采摘。

本发明的有益效果是：

（1）通过获取茶丛的RGB图像和深度信息，检测RGB图像中的茶芽，由于不同茶芽类型的采摘区域不同，因此根据需求将茶芽图像输入至采摘区域识别网络进行不同茶芽类型采摘区域的识别，并求取茶芽采摘区域的质心像素坐标，进而根据质心像素坐标和深度信息，确定出茶芽采摘点的三维空间坐标，这样，通过所确定的三维空间坐标采摘茶丛的茶芽，可以在兼顾采摘效率的同时有效地保证茶叶质量与茶芽的完整性，满足名优茶单芽采摘要求，并且在检测到茶芽的基础上进一步识别茶芽采摘区域，求取质心像素坐标，可以提高茶芽采摘点定位的准确率。

（2）相较于现有方法，提出根据茶芽采摘区域的质心像素坐标和深度信息确定茶芽采摘点的三维空间坐标，可以有效地辅助机械臂进行精准采摘。

（3）本发明所提出的基于机器视觉的茶芽采摘点定位方法可以部署到多台采茶机器人上进行协同作业，大大提高了作业效率，缓解了劳动力不足的问题。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。

图1是本发明实施例所提供的基于机器视觉的茶芽采摘点定位方法的流程示意图之一；

图2是本发明实施例所提供的基于机器视觉的茶芽采摘点定位方法的流程示意图之二；

图3是本发明实施例所提供的茶芽检测网络的结构示意图；

图4是本发明实施例所提供的采摘区域识别网络的结构示意图；

图5是本发明实施例所提供的采摘点三维定位示意图；

图6是本发明实施例所提供的基于机器视觉的茶芽采摘点定位装置的结构示意图；

图7是本发明实施例所提供的茶芽采摘系统的整体结构示意图。

具体实施方式

下面结合附图与实施例对本发明作进一步说明。

应该指出，以下详细说明都是例示性的，旨在对本发明提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本发明的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

传统的手工采茶方法效率极低，茶叶质量因人而异，有些新手往往达不到要求。现有机械采茶虽然提高了工作效率，但由于缺乏自主性，茶芽和老叶被一刀切，茶叶质量得不到保证，破坏了茶芽的完整性，同时，它也会损害茶树，降低来年的茶叶产量。为了解决这一问题，本实施例提出了一种基于机器视觉的茶芽采摘点定位方法、装置及采摘系统，该茶芽采摘定位方法整体上分为三个部分，包括茶芽检测网络、采摘区域识别网络和采摘点定位方法，以实现茶芽的高精度检测、采摘点的准确定位，可以有效地解决茶芽采摘效率低或质量低的问题。

请参阅图1，图1是本发明实施例所提供的基于机器视觉的茶芽采摘点定位方法的流程示意图之一，如图1中所示，本实施例所提供的基于机器视觉的茶芽采摘点定位方法，具体包括以下步骤：

S101：获取茶丛的RGB图像和深度信息。

在具体实施中，RGB图像指的是用红(R)、绿(G)、蓝(B)三个颜色通道模式显示的图像，深度信息包括深度贴图参数、图像中心坐标和用于获取RGB图像的相机光学系统的内部参数。RGB图像和深度信息是相互对应的，可以通过RGB-D深度相机获取茶丛的RGB图像和深度信息。

S102：利用茶芽检测网络对所述RGB图像进行茶芽检测，得到茶芽图像和对应的茶芽类型，将所述茶芽图像输入至采摘区域识别网络中识别出不同茶芽类型的茶芽采摘区域，求取茶芽采摘区域的质心像素坐标；所述茶芽类型包括一芽一叶和一芽两叶。

在具体实施中，本实施例首先利用茶芽检测网络对RGB图像进行茶芽检测，将茶芽类型分为一芽一叶和一芽两叶，不同类型茶芽的采摘区域不同，比如一芽一叶的采摘区域是顶芽的第一个茎节点到第二个茎节点的节间区域，一芽两叶的采摘区域是自顶芽起，第二个茎节点到第三个茎节点的节间区域。RGB图像经过茶芽检测网络，输出得到茶芽图像和对应的茶芽类型，针对不同茶芽类型的茶芽图像分别输入至采摘区域识别网络中进行不同茶芽类型采摘区域的识别，求取茶芽采摘区域的质心像素坐标，以作为采摘点的二维像素坐标。将质心像素坐标映射到RGB图像中，即可得到RGB图像中每个采摘点的像素坐标，采摘点的像素坐标与RGB-D相机获得的深度信息相结合，可以得到采摘点的三维空间坐标，供机械臂进行采摘。

S103：根据所述深度信息和茶芽采摘区域的质心像素坐标，确定出茶芽采摘点的三维空间坐标，根据所述三维空间坐标采摘茶丛的茶芽。

在具体实施中，在获得RGB图像上采摘点像素坐标后，来自RGB-D相机深度图的以毫米为单位的距离信息被借助用来计算相对于相机中心的采摘点的三维空间坐标。其主要原理就是借助相机焦距与深度信息、等效成像平面上采摘点像素坐标与三维空间坐标的相似关系，得到相机坐标系下的采摘点空间坐标，用于指导机械臂对茶芽进行采摘。

本实施例提供一种基于机器视觉的茶芽采摘点定位方法，如图2中所示，通过获取茶丛的RGB图像和深度信息，利用茶芽检测网络确定出RGB图像中的茶芽图像和对应的茶芽类型，将茶芽图像输入至与采摘区域识别网络进行不同茶芽类型采摘区域的识别，并求取茶芽采摘区域的质心像素坐标，进而根据质心像素坐标和深度信息，确定出茶芽采摘点的三维空间坐标，这样，通过所确定的三维空间坐标采摘茶丛的茶芽，可以在兼顾采摘效率的同时有效地保证茶芽的完整性与质量，满足名优茶单芽采摘要求，并且在检测到茶芽的基础上进一步识别茶芽采摘区域，求取质心像素坐标，可以提高茶芽采摘点定位的准确率。

本实施例中，作为一可选实施方式，茶芽检测网络识别出RGB图像中茶芽的位置区域，将其中的一芽一叶和一芽两叶用矩形框标注出来，通过剪裁得到矩形框内的茶芽图像，并确定茶芽图像对应的茶芽类型。这样，可以针对每一个茶芽图像分别进行采摘区域的识别，有利于提高采摘点的准确定位。

本实施例中，作为一可选实施方式，茶芽检测网络的茶芽检测过程包括：从所述RGB图像中提取出多个不同尺度的特征图；将多个不同尺度的特征图输入至特征金字塔网络中进行特征融合，基于融合后的特征对茶芽的位置进行预测，得到茶芽图像和对应的茶芽类型。可选的，采用DarkNet53网络对RGB图像进行特征图的提取，该网络在特征提取时，每一个卷积层后都附带一个批归一化层和激活层，结合残差模块ResNet，输出不同尺度的特征图。

在具体实施中，本发明实施例基于YOLO v3网络构建茶芽检测网络，YOLO v3是对深度卷积神经网络 YOLO 的改进，利用多尺度检测和残差网络实现目标检测，在目标检测方面具有实时性、泛化能力强、精度高等优势。如图3中所示，茶芽检测网络的结构主要包括特征提取网络、特征金字塔FPN以及预测网络三个部分，其中DarkNet53网络结构被用作特征提取网络，该网络在特征提取时，每一个卷积层后都附带一个批归一化层BN和ReLU激活层，结合残差模块ResNet，实现网络深度的增加，并且避免出现梯度爆炸，输出13×13、26×26、52×52三种尺度的特征图。然后三种特征被输入FPN特征金字塔进行融合，实现深层与浅层特征的融合，该结构有利于实现不同目标大小的茶芽检测；最后将特征分别输入预测网络中实现一芽一叶与一芽两叶的位置预测。

作为一可选实施方式，采摘区域识别网络的识别过程包括：获取茶芽图像，提取出茶芽的采摘区域信息，生成初始特征图；采用了多种尺度的自适应平均池化层，对所述初始特征图进行池化处理，生成多个特征图，然后将多个特征图与初始特征图连接起来，最后经过卷积层生成最终的预测图；根据所述预测图，确定茶芽采摘区域。

在具体实施中，基于金字塔场景解析网络（PSPNet）网络构建采摘区域识别网络，金字塔场景解析网络是经典的语义分割网络模型，全局的自适应池化方式使得整体的语义分割效果较好。如图4中所示，给定输入图像（茶芽图像），预训练的ResNet 中包含101个卷积组，每一个卷积组包含卷积、批次正则化及ReLu激活操作，用于提取一芽一叶与一芽两叶采摘区域信息，生成初始特征图。金字塔池模块被用于收集上下文信息，它采用了4种尺度的自适应平均池化层，最终生成尺寸比为1:2:3:6的特征图。然后将其与初始特征图连接起来。最后经卷积层生成中的最终预测图。

在使用茶芽检测网络和采摘区域识别网络之前，需要对其参数进行训练，训练过程为：建立茶芽检测数据集与采摘点识别数据集。首先，选定固定的拍摄角度，拍摄不同茶芽姿态以及天气状况下的茶芽图片。对采集到的5500余张样本进行人为的选择与调整，从中优选出4800张使用LabelImg对图像中的一芽一叶和一芽两叶进行标注，建立茶芽检测数据库，用于训练茶芽检测网络，其中训练集、验证集与测试集按8:1:1的比例随机分配。其次，使用LabelMe标注2000张茶芽图片中的一芽一叶和一芽两叶采摘区域，建立采摘区域识别数据库，用于训练采摘区域识别网络。其中训练集、验证集与测试集按8:1:1的比例随机分配。常用的数据增强技术主要包括镜像操作、旋转、缩放、剪裁、平移以及添加噪声等。最后，对数据库中的样本随机进行水平镜像与添加噪声操作，使茶芽识别数据库扩增为9600张，采摘区域识别数据库扩增为4000张。

作为一可选实施方式，确定茶芽采摘区域的图像空间矩，根据零阶空间矩和一阶空间矩，确定茶芽采摘区域的质心像素坐标。

在具体实施中，在使用PSPNet确定RGB图像上茶芽的采摘区域后，采摘点被确定为采摘区域的质心。采摘点的确定是由采摘区域的图像空间矩确定的，进而根据零阶空间矩和一阶空间矩，确定茶芽采摘区域的质心像素坐标。图像空间矩的计算公式如下：

；

其中，x代表某像素点在像素坐标系中的横坐标，y代表该像素点在像素坐标系中的纵坐标，array(x,y)是该点的像素值，j,i分别代表区域在x方向和y方向的阶数。

区域质心的横坐标（x₀）与纵坐标（y₀）的计算公式为：

；

这里，当j=0，i=1或j=1，i=0时，mom₀₁、mom₁₀称为一阶空间矩；当j=i=0时，mom₀₀称为零阶空间矩。

本实施例中，作为一可选实施方式，深度信息包括深度贴图参数、图像中心坐标和用于获取RGB图像的相机光学系统的内部参数。采用如下方式计算茶芽采摘点的三维空间坐标：

；

其中，X是相对于图像中心在X轴上的距离投影（单位：mm），Y是相对于图像中心在Y轴上的距离投影（单位：mm），Z是相对于图像中心在Z轴上的距离投影（单位：mm），（x₀，y₀）是图像中检测对象中心的像素坐标，是具有坐标（x₀，y₀）点处深度贴图的值，C_x是图像中心沿X轴的像素坐标，C_y是图像中心沿Y轴的像素坐标，f_x和f_y分别是用于获取RGB图像的相机光学系统的内部参数，具体为沿X和Y轴的焦距。

请参阅图6，图6是本发明实施例所提供的基于机器视觉的茶芽采摘点定位装置的结构示意图，如图6中所示，本发明实施例还提供一种基于机器视觉的茶芽采摘点定位装置，所述茶芽采摘点定位装置600，包括：

获取模块610，用于获取茶丛的RGB图像和深度信息；

检测模块620，用于利用茶芽检测网络对所述RGB图像进行茶芽检测，得到茶芽图像和对应的茶芽类型，将所述茶芽图像输入至采摘区域识别网络中识别出不同茶芽类型的茶芽采摘区域，求取茶芽采摘区域的质心像素坐标；所述茶芽类型包括一芽一叶和一芽两叶；

定位模块630，用于根据所述深度信息和茶芽采摘区域的质心像素坐标，确定出茶芽采摘点的三维空间坐标，根据所述三维空间坐标采摘茶丛的茶芽。

本实施例提供的基于机器视觉的茶芽采摘点定位装置用于实现前述的基于机器视觉的茶芽采摘点定位方法，因此基于机器视觉的茶芽采摘点定位装置中的具体实施方式可见前文中的基于机器视觉的茶芽采摘点定位方法的实施例部分，在此不再进行赘述。

请参阅图7，图7是本发明实施例所提供的茶芽采摘系统的整体结构示意图，如图7中所示，本发明实施例还提供一种茶芽采摘系统，包括：工控机2，以及与所述工控机2通信连接的行走机构1、采摘机械臂3、RGB-D深度相机4和采摘机械手5；所述RGB-D深度相机4用于采集茶丛的RGB图像和深度信息；所述工控机2用于执行上述的基于机器视觉的茶芽采摘点定位方法，并控制所述行走机构1、采摘机械臂3和采摘机械手5按照所确定的三维空间坐标进行茶芽的采摘。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体（Read-Only Memory，ROM）或随机存储记忆体（RandomAccessMemory，RAM）等。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于机器视觉的茶芽采摘点定位方法，其特征在于，包括：

获取茶丛的RGB图像和深度信息；利用茶芽检测网络对所述RGB图像进行茶芽检测，得到茶芽图像和对应的茶芽类型，将所述茶芽图像输入至采摘区域识别网络中识别出不同茶芽类型的茶芽采摘区域，确定茶芽采摘区域的图像空间矩，根据零阶空间矩和一阶空间矩，确定茶芽采摘区域的质心像素坐标；所述茶芽类型包括一芽一叶和一芽两叶；

根据所述深度信息和茶芽采摘区域的质心像素坐标，确定出茶芽采摘点的三维空间坐标，根据所述三维空间坐标采摘茶丛的茶芽；其中，图像空间矩的计算公式如下：

；

其中，x代表像素点在像素坐标系中的横坐标，y代表像素点在像素坐标系中的纵坐标，array(x,y)是该像素点的像素值，j,i分别代表区域在x方向和y方向的阶数；

区域质心的横坐标x ₀与纵坐标y ₀的计算公式为：

；

这里，当j=0，i=1或j=1，i=0时，mom ₀₁、mom ₁₀称为一阶空间矩；当j=i=0时，mom ₀₀称为零阶空间矩；

所述深度信息包括深度贴图参数、图像中心坐标和用于获取RGB图像的相机光学系统的内部参数；采用如下方式计算茶芽采摘点的三维空间坐标：

；

其中，X是相对于图像中心在X轴上的距离投影，Y是相对于图像中心在Y轴上的距离投影，Z是相对于图像中心在Z轴上的距离投影，是具有坐标（x₀，y₀）点处深度贴图的值，C_x是图像中心沿X轴的像素坐标，C_y是图像中心沿Y轴的像素坐标，f_x和f_y分别是用于获取RGB图像的相机光学系统的内部参数。

2.如权利要求1所述的基于机器视觉的茶芽采摘点定位方法，其特征在于，所述茶芽检测网络识别出RGB图像中茶芽的位置区域，将其中的一芽一叶和一芽两叶用矩形框标注出来，通过剪裁得到矩形框内的茶芽图像，并确定茶芽图像对应的茶芽类型。

3.如权利要求1所述的基于机器视觉的茶芽采摘点定位方法，其特征在于，所述茶芽检测网络的茶芽检测过程包括：从所述RGB图像中提取出多个不同尺度的特征图；将多个不同尺度的特征图输入至特征金字塔网络中进行特征融合，基于融合后的特征对茶芽的位置进行预测，得到茶芽图像和对应的茶芽类型。

4.如权利要求3所述的基于机器视觉的茶芽采摘点定位方法，其特征在于，采用DarkNet53网络对RGB图像进行特征图的提取，该网络在特征提取时，每一个卷积层后都附带一个批归一化层和激活层，结合ResNet残差模块，输出不同尺度的特征图。

5.如权利要求1所述的基于机器视觉的茶芽采摘点定位方法，其特征在于，所述采摘区域识别网络的识别过程包括：获取茶芽图像，提取出茶芽的采摘区域信息，生成初始特征图；采用了多种尺度的自适应平均池化层，对所述初始特征图进行池化处理，生成多个特征图，然后将多个特征图与初始特征图连接起来，最后经过卷积层生成最终的预测图；根据所述预测图，确定茶芽采摘区域。

6.一种基于机器视觉的茶芽采摘点定位装置，其特征在于，包括：

获取模块，用于获取茶丛的RGB图像和深度信息；

检测模块，用于利用茶芽检测网络对所述RGB图像进行茶芽检测，得到茶芽图像和对应的茶芽类型，将所述茶芽图像输入至采摘区域识别网络中识别出不同茶芽类型的茶芽采摘区域，确定茶芽采摘区域的图像空间矩，根据零阶空间矩和一阶空间矩，确定茶芽采摘区域的质心像素坐标；所述茶芽类型包括一芽一叶和一芽两叶；

定位模块，用于根据所述深度信息和茶芽采摘区域的质心像素坐标，确定出茶芽采摘点的三维空间坐标，根据所述三维空间坐标采摘茶丛的茶芽；其中，图像空间矩的计算公式如下：

；

其中，x代表像素点在像素坐标系中的横坐标，y代表像素点在像素坐标系中的纵坐标，array(x,y)是该像素点的像素值，j,i分别代表区域在x方向和y方向的阶数；

区域质心的横坐标x₀与纵坐标y₀的计算公式为：

；

这里，当j=0，i=1或j=1，i=0时，mom₀₁、mom₁₀称为一阶空间矩；当j=i=0时，mom₀₀称为零阶空间矩；

；

7.一种茶芽采摘系统，其特征在于，包括：工控机，以及与所述工控机通信连接的行走机构、采摘机械臂、RGB-D深度相机和采摘机械手；所述RGB-D深度相机用于采集茶丛的RGB图像和深度信息；所述工控机用于执行如权利要求1至权利要求5任一项所述的基于机器视觉的茶芽采摘点定位方法，并控制所述行走机构、采摘机械臂和采摘机械手按照所确定的三维空间坐标进行茶芽的采摘。