CN111680732A - 一种基于深度学习注意力机制碗碟识别的训练方法 - Google Patents
一种基于深度学习注意力机制碗碟识别的训练方法 Download PDFInfo
- Publication number
- CN111680732A CN111680732A CN202010486861.0A CN202010486861A CN111680732A CN 111680732 A CN111680732 A CN 111680732A CN 202010486861 A CN202010486861 A CN 202010486861A CN 111680732 A CN111680732 A CN 111680732A
- Authority
- CN
- China
- Prior art keywords
- dish
- training
- attention mechanism
- deep learning
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于深度学习注意力机制碗碟识别的训练方法,结合注意力机制的思想来训练卷积神经网络模型,从而提高碗碟识别的准确率。该方法包括:SS1,样本采集。SS2,卷积神经网络训练。本发明结合注意力机制的思想进行样本的采集,建立样本库,并进行后续的卷积神经网络训练。以此能够在训练时减少菜品特征对碗碟识别的影响,突出碗碟的特征,有效提高了碗碟的识别率。
Description
技术领域
本发明涉及深度学习领域,尤其涉及一种基于深度学习注意力机制碗碟识别的训练方法。
背景技术
最近人工智能的快速发展已经涉及到了餐饮行业,食堂餐厅的计价系统也随之在不断的改革和进步,随着深度学习在目标检测中表现出的优异性能,智能餐厅的计价方式从传统的人工计价逐渐变成了自动计价。现阶段的智能餐厅自动计价系统是搭建在深度神经网络的基础上,这就要求系统需要在使用前进行训练,然而在训练网络的过程中通常会有以下问题:一、训练网络模型需要大量的样本,但是样本的数据集需要人工建立。二、为了提高识别率,网络的层数一般都很多,网络结构整体来说很复杂。三、训练中常常会出现过拟合的问题。
大数据时代的来临使得样本的获取变得容易,然而样本的标注依然是个相对耗费时间和人力的问题,同时第二个问题和第三个问题存在一定的矛盾,网络结构越复杂就越容易出现过拟合,而简化网络结构又会影响识别率,例如公布号为CN109409197A的中国发明专利,提出了一种基于神经网络的碗碟检测方法,该发明通过收集碗碟的各种样本制作可用的数据集,并利用YOLO神经网络提取特征进行定位和分类,选择YOLO的目的是结构简单计算速度快,同时能够避免过拟合,为此需要大量采集样本,这就导致了第一个问题,训练周期长,同时人工标记样本带来了额外的成本。目前对于提升碗碟识别率的方法集中在对网络结构的优化上,这并不能很好的避免这个矛盾。
本发明提供了一种基于深度学习注意力机制碗碟识别的训练方法,适用于有较少样本的数据集的深度学习训练。通过镜像翻转、旋转等方式进行数据增强,对数据集进行扩充,最后送入卷积神经网络训练。该方法能够有效减少前期对数据集的工作量,减少前期对数据集的处理时间与工作量,同时在有少量数据集的情况下,得到与大量数据集训练得出的模型有相同的精度与速度。
发明内容
本发明的目的在于结合注意力机制采集碗碟样本并建立样本训练集,从样本数据集的建立中去解决背景技术中存在的问题,从而避免因优化网络结构而与过拟合问题产生的矛盾。
为了实现上述目的,本发明提供了一种基于深度学习注意力机制碗碟识别的训练方法,该方法包括:
样本采集。
卷积神经网络训练。
其中,根据所述样本采集,包括:
结合注意力机制的样本采集,
样本数据进行标注,
标注好的样本集进行数据扩增,包括:镜像翻转,旋转,亮度变化,随机噪声等。
其中,根据所述卷积神经网络训练,包括:
利用建立后的样本集进行卷积神经网络的训练。
基于上述发明方法,与现有方法相比具有突出的区别和贡献在于:
本发明不需要对神经网络的结构进行修改,通过结合注意力机制的思想进行样本采集和数据集的建立,能够避免为提高识别率进行网络优化而带来的过拟合问题,同时利用该样本采集方式进行神经网络的训练能在一定程度上减弱菜品特征的干扰,凸显碗碟特征,提高碗碟识别的泛化能力。
附图说明:
图1为本申请实施例的一种基于深度学习注意力机制碗碟识别的训练方法的流程图。
图2为本申请实施例的样本数据集建立的流程图。
具体实施方式:
以下将通过具体的实施例及附图来详细介绍本发明的目的、技术方案和优点,但不构成对本发明技术方案的限制。
图1所示为本申请实施例的整个流程示意图,具体实施如下:
步骤S110,样本采集。
步骤S120,卷积神经网络训练。
以下对本申请实施例的若干关键步骤作详细介绍。
图2所示为样本数据集建立,其中:
步骤S210,碗碟样本数据的采集,包括:
本申请实施例采集碗碟样本时需结合注意力机制的思想,在各类碗碟中装入相同的菜品进行采集,同时也应包括对空碗碟的采集,碗碟中装入的菜品种类,经实验证明在菜品类别数量在40到50区间范围内具有较好的泛化能力和检测能力。
步骤S220,利用标注软件对碗碟样本数据进行标注,包括:
本申请实施例利用标注软件对采集好的样本进行标注。
步骤S230,对标注好的碗碟样本数据进行数据扩增,包括:
本申请实施例对标注好的碗碟样本数据进行数据扩增,具体包括:镜像翻转;旋转,每类碗碟旋转的角度应保持一致;亮度变化,每类碗碟的亮度变化范围应相同;随机噪声等数据增强方法,最终获得训练所需的碗碟样本集。
图1所示的本申请实施例的整个流程示意图中,卷积神经网络训练,包括:
本申请实施例将建立好的碗碟样本数据集输入卷积神经网络中进行训练,得到用于碗碟识别的检测模型。
其中碗碟特征主要集中在边缘上,网络结构不需要太深,这能够防止过拟合的同时也可以加快后续碗碟的识别速度。
Claims (3)
1.一种基于深度学习注意力机制碗碟识别的训练方法,其特征在于,所述方法包括以下步骤:
样本采集;
卷积神经网络训练。
2.根据权利要求1所述的一种基于深度学习注意力机制碗碟识别的训练方法,其特征在于,样本采集,包括:
在不同类别的碗碟装入相同类别的菜品,采集碗碟样本;
利用标注软件对采集后的碗碟样本进行标注,
对标注后的碗碟样本进行数据扩增,其中针对碗碟特征,扩增方式应包括:镜像翻转,旋转,亮度变化等;
碗碟样本数据扩增后得到待训练的碗碟数据集。
3.根据权利要求1所述的一种基于深度学习注意力机制碗碟识别的训练方法,其特征在于,卷积神经网络训练,包括:
将扩增后的碗碟样本数据集输入卷积网络中进行训练;
得到用于后续碗碟识别的模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010486861.0A CN111680732A (zh) | 2020-05-28 | 2020-05-28 | 一种基于深度学习注意力机制碗碟识别的训练方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010486861.0A CN111680732A (zh) | 2020-05-28 | 2020-05-28 | 一种基于深度学习注意力机制碗碟识别的训练方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111680732A true CN111680732A (zh) | 2020-09-18 |
Family
ID=72434675
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010486861.0A Pending CN111680732A (zh) | 2020-05-28 | 2020-05-28 | 一种基于深度学习注意力机制碗碟识别的训练方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111680732A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116503614A (zh) * | 2023-04-27 | 2023-07-28 | 杭州食方科技有限公司 | 餐盘形状特征提取网络训练方法和餐盘形状信息生成方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109508664A (zh) * | 2018-10-26 | 2019-03-22 | 浙江师范大学 | 一种基于深度学习的菜品识别计价方法 |
CN109543606A (zh) * | 2018-11-22 | 2019-03-29 | 中山大学 | 一种加入注意力机制的人脸识别方法 |
JP2019159058A (ja) * | 2018-03-12 | 2019-09-19 | 国立研究開発法人情報通信研究機構 | 音声認識システム、音声認識方法、学習済モデル |
CN110458077A (zh) * | 2019-08-05 | 2019-11-15 | 高新兴科技集团股份有限公司 | 一种车辆颜色识别方法及系统 |
CN111079640A (zh) * | 2019-12-09 | 2020-04-28 | 合肥工业大学 | 一种基于自动扩增样本的车型识别方法及系统 |
-
2020
- 2020-05-28 CN CN202010486861.0A patent/CN111680732A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019159058A (ja) * | 2018-03-12 | 2019-09-19 | 国立研究開発法人情報通信研究機構 | 音声認識システム、音声認識方法、学習済モデル |
CN109508664A (zh) * | 2018-10-26 | 2019-03-22 | 浙江师范大学 | 一种基于深度学习的菜品识别计价方法 |
CN109543606A (zh) * | 2018-11-22 | 2019-03-29 | 中山大学 | 一种加入注意力机制的人脸识别方法 |
CN110458077A (zh) * | 2019-08-05 | 2019-11-15 | 高新兴科技集团股份有限公司 | 一种车辆颜色识别方法及系统 |
CN111079640A (zh) * | 2019-12-09 | 2020-04-28 | 合肥工业大学 | 一种基于自动扩增样本的车型识别方法及系统 |
Non-Patent Citations (1)
Title |
---|
张善文,张传雷,迟玉红,郭竟: "《图像模式识别》", 西安电子科技大学出版社, pages: 25 - 29 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116503614A (zh) * | 2023-04-27 | 2023-07-28 | 杭州食方科技有限公司 | 餐盘形状特征提取网络训练方法和餐盘形状信息生成方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109671102B (zh) | 一种基于深度特征融合卷积神经网络的综合式目标跟踪方法 | |
CN110490195A (zh) | 一种水表表盘读数识别方法 | |
CN104517122A (zh) | 一种基于优化卷积架构的图像目标识别方法 | |
CN111027443B (zh) | 一种基于多任务深度学习的票据文本检测方法 | |
CN108228571B (zh) | 对联的生成方法、装置、存储介质及终端设备 | |
CN113361645B (zh) | 基于元学习及知识记忆的目标检测模型构建方法及系统 | |
CN112489081A (zh) | 一种视觉目标跟踪方法及装置 | |
CN106600965B (zh) | 基于尖锐度的交通流早晚高峰时段自动识别方法 | |
CN111178438A (zh) | 一种基于ResNet101的天气类型识别方法 | |
CN111680732A (zh) | 一种基于深度学习注意力机制碗碟识别的训练方法 | |
CN112883931A (zh) | 基于长短期记忆网络的实时真假运动判断方法 | |
CN112991281B (zh) | 视觉检测方法、系统、电子设备及介质 | |
Pan et al. | Hybrid dilated faster RCNN for object detection | |
CN113744237A (zh) | 一种基于深度学习的渣土流塑性自动检测方法及系统 | |
CN112330662B (zh) | 一种基于多层级神经网络的医学图像分割系统及方法 | |
Li et al. | Performance comparison of saliency detection | |
CN110162797B (zh) | 文章质量检测方法和装置 | |
Liu et al. | Non-destructive detection of highway hidden layer defects using a ground-penetrating radar and adaptive particle swarm support vector machine | |
CN116047418A (zh) | 基于小样本的多模态雷达有源欺骗干扰识别方法 | |
CN116189130A (zh) | 基于图像标注模型的车道线分割方法及装置 | |
CN112419362B (zh) | 一种基于先验信息特征学习的运动目标跟踪方法 | |
Meena Deshpande | License Plate Detection and Recognition using YOLO v4 | |
Sun et al. | Salient object detection based on multi-layer cascade and fine boundary | |
CN113722530B (zh) | 一种细粒度地理位置定位方法 | |
CN117809169B (zh) | 一种小样本水下声呐图像分类方法及其模型搭建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |