CN111814862A

CN111814862A - 果蔬识别方法及装置

Info

Publication number: CN111814862A
Application number: CN202010621644.8A
Authority: CN
Inventors: 姜沛; 曹锋铭
Original assignee: Ping An International Smart City Technology Co Ltd
Current assignee: Shenzhen Saiante Technology Service Co Ltd
Priority date: 2020-06-30
Filing date: 2020-06-30
Publication date: 2020-10-23

Abstract

本发明实施例提供了果蔬识别方法及装置，本发明涉及人工智能技术领域，方法包括：获取样本图像，样本图像至少包括一种类别的果蔬；获取样本图像中各种类别的果蔬的位置信息以及类别标签；根据样本图像、样本图像中各种类别的果蔬的位置信息以及类别标签对初始深度学习模型进行训练，生成果蔬识别模型；将待识别图像输入训练好的果蔬识别模型，输出识别结果，其中，所述识别结果包括果蔬的类别标签及位置信息。本发明实施例提供的技术方案能够解决现有技术中多类别果蔬识别效率低的问题，此外，本案还涉及区块链技术，所述果蔬的类别标签及位置信息存储于区块链中。

Description

果蔬识别方法及装置

【技术领域】

本发明涉及人工智能技术领域，尤其涉及果蔬识别方法及装置。

【背景技术】

水果蔬菜(以下简称果蔬)识别是通过AI(Artificial Intelligence，人工智能)视觉技术，自动识别图像中出现的水果或者蔬菜的种类，现有的解决方案通过虽然可以兼顾日常中常见的水果蔬菜，但是都是用到的AI视觉中图像分类的策略，即每次只能识别单一种类的目标，对于图像中存在多种水果蔬菜的时候，只能给出一种结果，即图像中出现的最有可能的水果蔬菜种类。这种不能一次识别多种的缺点，限制了该技术的应用领域，比如当我们的目的是为了通过拍摄食材，而给出相关的营养建议时，需要用户拍摄逐次多张，影响用户体验，因此针对上述问题，我们提出了一种单次识别多种果蔬的技术，改善了这一缺点。

【发明内容】

有鉴于此，本发明实施例提供了果蔬识别方法及装置，用以解决现有技术中多类别果蔬识别效率低的问题。

为了实现上述目的，第一方面，本发明实施例提供一种果蔬识别方法，包括：

获取样本图像，所述样本图像至少包括一种类别的果蔬；获取所述样本图像中各种类别的果蔬的位置信息以及类别标签；根据所述样本图像、所述样本图像中各种类别的果蔬的位置信息以及类别标签对初始深度学习模型进行训练，生成果蔬识别模型；将待识别图像输入训练好的果蔬识别模型，得到识别结果，其中，所述识别结果包括果蔬的类别标签及位置信息。

结合第一方面，在一种可行的实施方式中，所述方法还包括：

当所述果蔬识别模型所输出的待测试图像中各种果蔬的类别标签以及各种果蔬的位置信息的准确率小于预设阈值时，获取待测试图像中各种果蔬的实际位置信息以及各种所述商品的实际类别标签；

根据待测试图像、待测试图像中各种果蔬的实际位置信息以及各种果蔬的实际类别标签对所述果蔬识别模型进行训练，直至所述果蔬识别模型所输出的待测试图像中各种果蔬的分类结果以及位置信息的准确率大于或等于预设阈值。

结合第一方面，在一种可行的实施方式中，所述获取所述样本图像中各种类别的果蔬的位置信息以及类别标签，包括：

通过标记工具对每张样本图像中的果蔬进行标注，生成果蔬的位置信息；

设置所标注的果蔬的类别标签，并将所述类别标签与所述果蔬的位置信息进行关联；

根据关联后的所述类别标签与所述果蔬的位置信息生成模型可读的文件。

结合第一方面，在一种可行的实施方式中，利用矩形框对每张样本图像中的果蔬进行标注，将所述矩形框的位置信息确定为所述果蔬的位置信息。

结合第一方面，在一种可行的实施方式中，所述将待识别图像输入训练好的果蔬识别模型，输出识别结果，包括：

当所述识别结果为所述待识别图像中不包含果蔬，则输出图像中不包含果蔬的结论；

当所述识别结果为所述待识别图像中包含果蔬，则输出包括果蔬的类别标签、位置信息及数量的结论。

结合第一方面，在一种可行的实施方式中，在所述获取所述样本图像中各种类别的果蔬的位置信息以及类别标签之前，所述方法还包括：

对所述样本图像进行预处理，所述预处理包括对所述样本图像进行放大和/或缩小和/或亮度增强和/或亮度减弱和/或翻转和/或增加噪声。

结合第一方面，在一种可行的实施方式中，所述果蔬识别模型为YOLOv3模型，所述根据所述样本图像、所述样本图像中各种类别的果蔬的位置信息以及类别标签对初始深度学习模型进行训练，生成果蔬识别模型，包括：

将所述样本图像按照预设的比例分别训练集及验证集；

将训练集输入YOLOv3模型进行训练，直至达到预设的迭代数停止训练；

记录训练集每一次迭代的损失函数值，并基于训练集中的迭代次数和损失函数值绘制训练损失函数曲线图，确定损失函数收敛时所对应的迭代次数的合格范围；

将验证集的每一张样本图像输入迭代次数在合格范围内的每一个YOLOv3模型；

选取识别效果最好的迭代次数值对应的YOLOv3网络模型作为训练好的果蔬识别模型。

为了实现上述目的，第二方面，本发明实施例提供一种果蔬识别装置，所述装置包括：

第一获取单元，用于获取样本图像，所述样本图像至少包括一种类别的果蔬；第二获取单元，用于获取所述样本图像中各种类别的果蔬的位置信息以及类别标签；生成单元，用于根据所述样本图像、所述样本图像中各种类别的果蔬的位置信息以及类别标签对初始深度学习模型进行训练，生成果蔬识别模型；输出单元，用于将待识别图像输入训练好的果蔬识别模型，输出识别结果，其中，所述识别结果包括果蔬的类别标签及位置信息。

为了实现上述目的，第三方面，本发明还提供了一种计算机非易失性存储介质，所述存储介质包括存储的程序，在所述程序运行时控制所述存储介质所在设备执行上述的果蔬识别方法。

为了实现上述目的，第四方面，本发明还提供了一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述的果蔬识别方法。

在本方案中，果蔬识别模型能够一次识别出多个类别的果蔬，例如一种图片上既有香菜、豌豆和萝卜，克服了一次不能识别多种类别的果蔬的缺点。在应用于通过拍摄食材给出相关营养建议时，可以将食材拍摄于同一张照片中，即可识别出里面的多种果蔬，加快识别效率。

【附图说明】

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。

图1是本发明实施例提供的一种果蔬识别方法的流程图；

图2是本发明实施例提供的一种果蔬识别装置的功能框图；

图3是本发明实施例提供的一种可选的计算机设备的示意图。

【具体实施方式】

为了更好的理解本发明的技术方案，下面结合附图对本发明实施例进行详细描述。

应当明确，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。

应当理解，本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

应当理解，尽管在本发明实施例中可能采用术语第一、第二、第三等来描述终端，但这些终端不应限于这些术语。这些术语仅用来将终端彼此区分开。例如，在不脱离本发明实施例范围的情况下，第一终端也可以被称为第二终端，类似地，第二终端也可以被称为第一终端。

取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地，取决于语境，短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。

图1是根据本发明实施例的一种果蔬识别方法的流程图，如图1所示，该方法包括：

步骤S01，获取样本图像，样本图像至少包括一种类别的果蔬；

步骤S02，获取样本图像中各种类别的果蔬的位置信息以及类别标签；

步骤S03，根据样本图像、样本图像中各种类别的果蔬的位置信息以及类别标签对初始深度学习模型进行训练，生成果蔬识别模型；

步骤S04，将待识别图像输入训练好的果蔬识别模型，输出识别结果，其中，识别结果包括果蔬的类别标签及位置信息。

在本方案中，果蔬识别模型能够一次识别出多个类别的果蔬，例如一种图片上既有香菜、豌豆和萝卜，克服了一次不能识别多种类别的果蔬的缺点。在应用于通过拍摄食材给出相关营养建议时，可以将食材拍摄于同一张照片中，即可识别出里面的多种果蔬，加快识别效率。需要强调的是，为进一步保证上述果蔬的类别标签及位置信息的私密和安全性，上述果蔬的类别标签及位置信息还可以存储于一区块链的节点中。

下面基于果蔬识别方法进行详细介绍。

步骤S01，获取样本图像，样本图像至少包括一种类别的果蔬。

具体地，获取通过摄像机拍摄的多种角度下的样本图像。摄像机例如可以是手机自带摄像机、鱼眼摄像机、单反摄像机、监控摄像头等等，为了增加样本的多样性，在本实施例中，我们采用了上述各种摄像机拍的89类水果蔬菜的照片，共计16535张。

对每张样本图像中水果蔬菜类别和位置进行了标注，其中，水果种类和每种果蔬的标注数量见下表1：

表1.果蔬种类及标注数量

在步骤S01之后，上述方法还包括：

对样本图像进行预处理，预处理包括对样本图像进行放大和/或缩小和/或亮度增强和/或亮度减弱和/或翻转和/或增加噪声。

示例性地，将样本图像通过放大和/或缩小调整至统一大小，例如512*512；亮度增强和/或亮度减弱，例如可以把每个patch中所有像素在HSV颜色空间中的饱和度和明度提升0.25～4次幂方，乘以0.7～1.4之间的一个因子，再加一个-0.1～0.1之间的值。还可以在色调通道(H)对每张图片或patch的所有像素增加一个-0.1～0.1之间的值。翻转例如可以是水平翻转(也就是镜像)或竖直翻转，增加噪声，例如椒盐噪声，高斯噪声等。

通过上述手段可以有效增加样本量，以获取更多的样本图像应用于后期的训练过程中，当然还可以采用剪裁、锐化、旋转等处理方式，在此不做限定。

进一步地，步骤S02，获取样本图像中各种类别的果蔬的位置信息以及类别标签。具体包括：

设置所标注的果蔬的类别标签，并将类别标签与果蔬的位置信息进行关联；

根据关联后的类别标签与果蔬的位置信息生成模型可读的文件。

在一种实施方式中，利用矩形框对样本图像中的各种果蔬进行标注，将矩形框的位置信息确定为各种果蔬的位置信息。其中，位置信息包括矩形框的原点坐标以及矩形框的长度和宽度，从而获取果蔬在样本图像中的位置信息。

需要说明的是，可以通过人工标注方式对样本图像中的各种果蔬的位置进行标注；也可以利用标注工具对样本图像中的各种果蔬的位置进行标注。

示例性地，可以利用labelImg或yolomark标注工具对样本图像中的各种果蔬的位置进行标注。选择待标注的样本图像，然后使用开始画矩形框，单击结束画框，并选择所标注的果蔬的类别标号(如表1所示)。针对样本图像中各种果蔬标注矩形框，当样本图像中各种果蔬的位置被标注完后，生成对应的XML文件，该文件记录每个果蔬的类别标号以及位置信息，该位置信息可以通过(x,y,w,h)标识，其中，x和y表示矩形方框左上角顶点坐标，w表示矩形方框的宽，h表示矩形方框的高。最后将XML文件转换为YOLO格式的txt文件。

可选地，所述方法还包括：

将关联后的所述所述类别标签与所述果蔬的位置信息存储于区块链中。

从而保证数据的私密和安全性。

步骤S03，根据样本图像、样本图像中各种类别的果蔬的位置信息以及类别标签对初始深度学习模型进行训练，生成果蔬识别模型。

在具体实现时，初始深度学习模型可以根据各种果蔬的位置信息从样本图像中提取果蔬图像，从果蔬图像中学习该果蔬的特征，进而获取果蔬特征与果蔬的类别标签的关系，从而使得生成的果蔬识别模型可以识别输入数据中各种果蔬的类别。

其中，初始深度学习模型YOLO(You Only Look Once，目标检测)模型，该模型具有运行速度快，占内存少等优点，提高图像识别的实时性。YOLO目标检测网络基于深度卷积网络学习的特征，以检测目标物体，在本实施例中，YOLO模型为YOLO的第3个版本，即YOLOv3模型。

步骤S03，具体包括：

步骤S031，将样本图像按照预设的比例分别训练集及验证集；

步骤S032，将训练集输入YOLOv3模型进行训练，直至达到预设的迭代数停止训练；

步骤S033，记录训练集每一次迭代的损失函数值，并基于训练集中的迭代次数和损失函数值绘制训练损失函数曲线图，确定损失函数收敛时所对应的迭代次数的合格范围；

步骤S034，将验证集的每一张样本图像输入迭代次数在合格范围内的每一个YOLOv3模型；

步骤S035，选取识别效果最好的迭代次数值对应的YOLOv3网络模型作为训练好的果蔬识别模型。

在本实施例中，训练集与验证集中的样本数量的比例为7:3，在其它实施方式中，训练集与验证集中的样本数量的比例也可以为8:2或6:4等等。需要说明的是，在划分训练集与验证集时，本实施例中讲上述大量的样本图像进行了随机打乱标准顺序，以保证数据更加可信、随机及分散，减少由于人为因素带来的偏差。

训练过程分为两个阶段，第一：适应性训练阶段，设置为2个批次的训练集，学习率设置为0.00001，该过程只训练YOLOv3最后一部分全连接层以外的层；通过适应性训练，YOLOv3模型已经具备了提取样本图像局部特征的能力，由YOLOv3模型作为训练的起始能够为我们省下训练自己模型提取特征的过程，从而加速我们训练过程。

第二：正式训练阶段，在这个阶段会对整个网络进行训练，同时学习率也调整为0.000001，在该过程经过33个批次，最终在第35个批次之后训练过程停止，训练批次batch设置为8的时候，我们测试的loss徘徊在5.700附近，该loss是我们经过调整训练批次batch和学习率得到的最佳值，经测试，该训练结果在测试集上得到的mAP为75.6％。

YOLOv3模型的训练参数设置为：最大学习率0.00001，最小学习率0.000001，训练批次batch 8。最后，选取识别效果最好的迭代次数值对应的YOLOv3网络模型作为训练好的果蔬识别模型。

具体地，输出的识别结果包括两种，分别为：

当识别结果为待识别图像中不包含果蔬，则输出图像中不包含果蔬的结论；

当识别结果为待识别图像中包含果蔬，则输出包括果蔬的类别标签、位置信息及数量的结论。

通过本申请提供的果蔬识别模型，能够快速地对同一张图片中的多种类别的果蔬进行识别，能够提高识别效率。

在步骤S04之后，方法还包括：

当果蔬识别模型所输出的待测试图像中各种果蔬的类别标签以及各种果蔬的位置信息的准确率小于预设阈值时，获取待测试图像中各种果蔬的实际位置信息以及各种商品的实际类别标签；

根据待测试图像、待测试图像中各种果蔬的实际位置信息以及各种果蔬的实际类别标签对果蔬识别模型进行训练，直至果蔬识别模型所输出的待测试图像中各种果蔬的分类结果以及位置信息的准确率大于或等于预设阈值。

图2是根据本发明实施例的一种果蔬识别装置的示意图，如图2所示，该装置包括第一获取单元10、第二获取单元20、生成单元30及输出单元40。

第一获取单元10，用于获取样本图像，样本图像至少包括一种类别的果蔬；

第二获取单元20，用于获取样本图像中各种类别的果蔬的位置信息以及类别标签；

生成单元30，用于根据样本图像、样本图像中各种类别的果蔬的位置信息以及类别标签对初始深度学习模型进行训练，生成果蔬识别模型；

输出单元40，用于将待识别图像输入训练好的果蔬识别模型，输出识别结果，其中，识别结果包括果蔬的类别标签及位置信息。

在本方案中，先利用多类别的果蔬样本图像对深度学习模型进行训练，得到果蔬识别模型，该果蔬识别模型能够一次识别出多个类别的果蔬，例如一种图片上既有香菜、豌豆和萝卜，克服了一次不能识别多种类别的果蔬的缺点。在应用于通过拍摄食材给出相关营养建议时，可以将食材拍摄于同一张照片中，即可识别出里面的多种果蔬，加快识别效率。

第一获取单元10，用于通过摄像机拍摄获取多种角度下的样本图像。摄像机例如可以是手机自带摄像机、鱼眼摄像机、单反摄像机、监控摄像头等等，为了增加样本的多样性，在本实施例中，我们采用了上述各种摄像机拍的89类水果蔬菜的照片，共计16535张。

对每张样本图像中水果蔬菜类别和位置进行了标注，其中，水果种类和每种果蔬的标注数量如表1所示。

进一步地，装置还包括预处理单元50，用于对样本图像进行预处理，预处理包括对样本图像进行放大和/或缩小和/或亮度增强和/或亮度减弱和/或翻转和/或增加噪声。

进一步地，第二获取单元20包括标注子单元、关联子单元、生成子单元。

标注子单元，用于通过标记工具对每张样本图像中的果蔬进行标注，生成果蔬的位置信息；

关联子单元，用于设置所标注的果蔬的类别标签，并将类别标签与果蔬的位置信息进行关联；

生成子单元，用于根据关联后的类别标签与果蔬的位置信息生成模型可读的文件。

进一步地，装置还包括存储单元，

存储单元，用于将关联后的所述所述类别标签与所述果蔬的位置信息存储于区块链中。从而保证数据的私密和安全性。

生成单元30在训练过程中，初始深度学习模型可以根据各种果蔬的位置信息从样本图像中提取果蔬图像，从果蔬图像中学习该果蔬的特征，进而获取果蔬特征与果蔬的类别标签的关系，从而使得生成的果蔬识别模型可以识别输入数据中各种果蔬的类别。

具体地，生成单元30包括划分子单元、训练子单元、记录子单元、输入子单元及选取子单元：

划分子单元，用于将样本图像按照预设的比例分别训练集及验证集；

训练子单元，用于将训练集输入YOLOv3模型进行训练，直至达到预设的迭代数停止训练；

记录子单元，用于记录训练集每一次迭代的损失函数值，并基于训练集中的迭代次数和损失函数值绘制训练损失函数曲线图，确定损失函数收敛时所对应的迭代次数的合格范围；

输入子单元，用于将验证集的每一张样本图像输入迭代次数在合格范围内的每一个YOLOv3模型；

选取子单元，用于选取识别效果最好的迭代次数值对应的YOLOv3网络模型作为训练好的果蔬识别模型。

进一步地，输出单元40包括第一输出子单元及第二输出子单元；

第一输出子单元，用于当识别结果为待识别图像中不包含果蔬，则输出图像中不包含果蔬的结论；

第二输出子单元，用于当识别结果为待识别图像中包含果蔬，则输出包括果蔬的类别标签、位置信息及数量的结论。

进一步地，上述装置还包括第三获取单元、再生成单元。

第三获取单元，用于当果蔬识别模型所输出的待测试图像中各种果蔬的类别标签以及各种果蔬的位置信息的准确率小于预设阈值时，获取待测试图像中各种果蔬的实际位置信息以及各种商品的实际类别标签。

再生成单元，用于根据待测试图像、待测试图像中各种果蔬的实际位置信息以及各种果蔬的实际类别标签对果蔬识别模型进行训练，直至果蔬识别模型所输出的待测试图像中各种果蔬的分类结果以及位置信息的准确率大于或等于预设阈值。

本发明实施例提供了一种计算机非易失性存储介质，存储介质包括存储的程序，其中，在程序运行时控制存储介质所在设备执行以下步骤：

获取样本图像，样本图像至少包括一种类别的果蔬；

获取样本图像中各种类别的果蔬的位置信息以及类别标签；

根据样本图像、样本图像中各种类别的果蔬的位置信息以及类别标签对初始深度学习模型进行训练，生成果蔬识别模型；

将待识别图像输入训练好的果蔬识别模型，输出识别结果，其中，识别结果包括果蔬的类别标签及位置信息。

可选地，在程序运行时控制存储介质所在设备执行获取样本图像中各种类别的果蔬的位置信息以及类别标签的步骤，包括：

可选地，在程序运行时控制存储介质所在设备还执行以下步骤：

可选地，在程序运行时控制存储介质所在设备执行将待识别图像输入训练好的果蔬识别模型，输出识别结果，包括：

可选地，在程序运行时控制存储介质所在设备在执行获取样本图像中各种类别的果蔬的位置信息以及类别标签之前，还执行以下步骤：

可选地，果蔬识别模型为YOLOv3模型，在程序运行时控制存储介质所在设备执行根据样本图像、样本图像中各种类别的果蔬的位置信息以及类别标签对初始深度学习模型进行训练，生成果蔬识别模型，包括：

将样本图像按照预设的比例分别训练集及验证集；

图3是本发明实施例提供的一种计算机设备的示意图。如图3所示，该实施例的计算机设备100包括：处理器101、存储器102以及存储在存储器102中并可在处理器101上运行的计算机程序103，处理器101执行计算机程序103时实现实施例中的果蔬识别方法，为避免重复，此处不一一赘述。或者，该计算机程序被处理器101执行时实现实施例中果蔬识别装置中各模型/单元的功能，为避免重复，此处不一一赘述。

计算机设备100可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。计算机设备可包括，但不仅限于，处理器101、存储器102。本领域技术人员可以理解，图3仅仅是计算机设备100的示例，并不构成对计算机设备100的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如计算机设备还可以包括输入输出设备、网络接入设备、总线等。

所称处理器101可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器102可以是计算机设备100的内部存储单元，例如计算机设备100的硬盘或内存。存储器102也可以是计算机设备100的外部存储设备，例如计算机设备100上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。进一步地，存储器102还可以既包括计算机设备100的内部存储单元也包括外部存储设备。存储器102用于存储计算机程序以及计算机设备所需的其他程序和数据。存储器102还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本发明所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各种实施例中的各功能单元可以集成在一个处理单元中，也可以是各种单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机装置(可以是个人计算机，服务器，或者网络装置等)或处理器(Processor)执行本发明各种实施例方法的部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-OnlyMemory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。

Claims

1.一种果蔬识别方法，其特征在于，所述方法包括：

获取样本图像，所述样本图像至少包括一种类别的果蔬；

获取所述样本图像中各种类别的果蔬的位置信息以及类别标签；

根据所述样本图像、所述样本图像中各种类别的果蔬的位置信息以及类别标签对初始深度学习模型进行训练，生成果蔬识别模型；

将待识别图像输入训练好的果蔬识别模型，输出识别结果，其中，所述识别结果包括果蔬的类别标签及位置信息。

2.根据权利要求1所述的方法，其特征在于，所述获取所述样本图像中各种类别的果蔬的位置信息以及类别标签，包括：

3.根据权利要求1所述的方法，其特征在于，利用矩形框对每张样本图像中的果蔬进行标注，将所述矩形框的位置信息确定为所述果蔬的位置信息。

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

5.根据权利要求1所述的方法，其特征在于，所述将待识别图像输入训练好的果蔬识别模型，输出识别结果，包括：

6.根据权利要求1～5任一项所述的方法，其特征在于，在所述获取所述样本图像中各种类别的果蔬的位置信息以及类别标签之前，所述方法还包括：

7.根据权利要求1所述的方法，其特征在于，所述果蔬识别模型为YOLOv3模型，所述根据所述样本图像、所述样本图像中各种类别的果蔬的位置信息以及类别标签对初始深度学习模型进行训练，生成果蔬识别模型，包括：

将所述样本图像按照预设的比例分别训练集及验证集；

8.一种果蔬识别装置，其特征在于，所述装置包括：

第一获取单元，用于获取样本图像，所述样本图像至少包括一种类别的果蔬；

第二获取单元，用于获取所述样本图像中各种类别的果蔬的位置信息以及类别标签；

生成单元，用于根据所述样本图像、所述样本图像中各种类别的果蔬的位置信息以及类别标签对初始深度学习模型进行训练，生成果蔬识别模型；

输出单元，用于将待识别图像输入训练好的果蔬识别模型，输出识别结果，其中，所述识别结果包括果蔬的类别标签及位置信息。

9.一种计算机非易失性存储介质，其特征在于，所述存储介质包括存储的程序，在所述程序运行时控制所述存储介质所在设备执行权利要求1至7任意一项所述的果蔬识别方法。

10.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7任意一项所述的果蔬识别方法。