CN111680732A

CN111680732A - 一种基于深度学习注意力机制碗碟识别的训练方法

Info

Publication number: CN111680732A
Application number: CN202010486861.0A
Authority: CN
Inventors: 熊继平; 朱凌云; 叶灵枫
Original assignee: Zhejiang Normal University CJNU
Current assignee: Zhejiang Normal University CJNU
Priority date: 2020-05-28
Filing date: 2020-05-28
Publication date: 2020-09-18

Abstract

本发明公开了一种基于深度学习注意力机制碗碟识别的训练方法，结合注意力机制的思想来训练卷积神经网络模型，从而提高碗碟识别的准确率。该方法包括：SS1，样本采集。SS2，卷积神经网络训练。本发明结合注意力机制的思想进行样本的采集，建立样本库，并进行后续的卷积神经网络训练。以此能够在训练时减少菜品特征对碗碟识别的影响，突出碗碟的特征，有效提高了碗碟的识别率。

Description

一种基于深度学习注意力机制碗碟识别的训练方法

技术领域

本发明涉及深度学习领域，尤其涉及一种基于深度学习注意力机制碗碟识别的训练方法。

背景技术

最近人工智能的快速发展已经涉及到了餐饮行业，食堂餐厅的计价系统也随之在不断的改革和进步，随着深度学习在目标检测中表现出的优异性能，智能餐厅的计价方式从传统的人工计价逐渐变成了自动计价。现阶段的智能餐厅自动计价系统是搭建在深度神经网络的基础上，这就要求系统需要在使用前进行训练，然而在训练网络的过程中通常会有以下问题：一、训练网络模型需要大量的样本，但是样本的数据集需要人工建立。二、为了提高识别率，网络的层数一般都很多，网络结构整体来说很复杂。三、训练中常常会出现过拟合的问题。

大数据时代的来临使得样本的获取变得容易，然而样本的标注依然是个相对耗费时间和人力的问题，同时第二个问题和第三个问题存在一定的矛盾，网络结构越复杂就越容易出现过拟合，而简化网络结构又会影响识别率，例如公布号为CN109409197A的中国发明专利，提出了一种基于神经网络的碗碟检测方法，该发明通过收集碗碟的各种样本制作可用的数据集，并利用YOLO神经网络提取特征进行定位和分类，选择YOLO的目的是结构简单计算速度快，同时能够避免过拟合，为此需要大量采集样本，这就导致了第一个问题，训练周期长，同时人工标记样本带来了额外的成本。目前对于提升碗碟识别率的方法集中在对网络结构的优化上，这并不能很好的避免这个矛盾。

本发明提供了一种基于深度学习注意力机制碗碟识别的训练方法，适用于有较少样本的数据集的深度学习训练。通过镜像翻转、旋转等方式进行数据增强，对数据集进行扩充，最后送入卷积神经网络训练。该方法能够有效减少前期对数据集的工作量，减少前期对数据集的处理时间与工作量，同时在有少量数据集的情况下，得到与大量数据集训练得出的模型有相同的精度与速度。

发明内容

本发明的目的在于结合注意力机制采集碗碟样本并建立样本训练集，从样本数据集的建立中去解决背景技术中存在的问题，从而避免因优化网络结构而与过拟合问题产生的矛盾。

为了实现上述目的，本发明提供了一种基于深度学习注意力机制碗碟识别的训练方法，该方法包括：

样本采集。

卷积神经网络训练。

其中，根据所述样本采集，包括：

结合注意力机制的样本采集，

样本数据进行标注，

标注好的样本集进行数据扩增，包括：镜像翻转，旋转，亮度变化，随机噪声等。

其中，根据所述卷积神经网络训练，包括：

利用建立后的样本集进行卷积神经网络的训练。

基于上述发明方法，与现有方法相比具有突出的区别和贡献在于：

本发明不需要对神经网络的结构进行修改，通过结合注意力机制的思想进行样本采集和数据集的建立，能够避免为提高识别率进行网络优化而带来的过拟合问题，同时利用该样本采集方式进行神经网络的训练能在一定程度上减弱菜品特征的干扰，凸显碗碟特征，提高碗碟识别的泛化能力。

附图说明：

图1为本申请实施例的一种基于深度学习注意力机制碗碟识别的训练方法的流程图。

图2为本申请实施例的样本数据集建立的流程图。

具体实施方式：

以下将通过具体的实施例及附图来详细介绍本发明的目的、技术方案和优点，但不构成对本发明技术方案的限制。

图1所示为本申请实施例的整个流程示意图，具体实施如下：

步骤S110，样本采集。

步骤S120，卷积神经网络训练。

以下对本申请实施例的若干关键步骤作详细介绍。

图2所示为样本数据集建立，其中：

步骤S210，碗碟样本数据的采集，包括：

本申请实施例采集碗碟样本时需结合注意力机制的思想，在各类碗碟中装入相同的菜品进行采集，同时也应包括对空碗碟的采集，碗碟中装入的菜品种类，经实验证明在菜品类别数量在40到50区间范围内具有较好的泛化能力和检测能力。

步骤S220，利用标注软件对碗碟样本数据进行标注，包括：

本申请实施例利用标注软件对采集好的样本进行标注。

步骤S230，对标注好的碗碟样本数据进行数据扩增，包括：

本申请实施例对标注好的碗碟样本数据进行数据扩增，具体包括：镜像翻转；旋转，每类碗碟旋转的角度应保持一致；亮度变化，每类碗碟的亮度变化范围应相同；随机噪声等数据增强方法，最终获得训练所需的碗碟样本集。

图1所示的本申请实施例的整个流程示意图中，卷积神经网络训练，包括：

本申请实施例将建立好的碗碟样本数据集输入卷积神经网络中进行训练，得到用于碗碟识别的检测模型。

其中碗碟特征主要集中在边缘上，网络结构不需要太深，这能够防止过拟合的同时也可以加快后续碗碟的识别速度。

Claims

1.一种基于深度学习注意力机制碗碟识别的训练方法，其特征在于，所述方法包括以下步骤：

样本采集；

卷积神经网络训练。

2.根据权利要求1所述的一种基于深度学习注意力机制碗碟识别的训练方法，其特征在于，样本采集，包括：

在不同类别的碗碟装入相同类别的菜品，采集碗碟样本；

利用标注软件对采集后的碗碟样本进行标注，

对标注后的碗碟样本进行数据扩增，其中针对碗碟特征，扩增方式应包括：镜像翻转，旋转，亮度变化等；

碗碟样本数据扩增后得到待训练的碗碟数据集。

3.根据权利要求1所述的一种基于深度学习注意力机制碗碟识别的训练方法，其特征在于，卷积神经网络训练，包括：

将扩增后的碗碟样本数据集输入卷积网络中进行训练；

得到用于后续碗碟识别的模型。