CN112115903A

CN112115903A - 提升基于深度学习的菜品识别系统识别精度的方法

Info

Publication number: CN112115903A
Application number: CN202011023188.3A
Authority: CN
Inventors: 陈晓鹏; 梁永坚; 赵晓红
Original assignee: Guangzhou Paike Pushi Information Technology Co ltd
Current assignee: Guangzhou Paike Pushi Information Technology Co ltd
Priority date: 2020-09-25
Filing date: 2020-09-25
Publication date: 2020-12-22

Abstract

本发明公开了一种提升基于深度学习的菜品识别系统精度的方法，对菜品采集连续的多帧图片，求取每一帧图片中各个菜品的中心坐标，利用曼哈顿距离公式计算连续的前后两帧图片中同一个菜品对应的中心坐标差值，直到该中心坐标差值小于设定阈值，取最后一帧图片进行菜品识别；裁剪得到包含菜品的图片进行固定角度范围内的随机旋转和翻转，结合亮度和对比度随机调整得到多张增强图片；提取每张增强图片的菜品信息特征，计算出菜品信息特征均值；菜品信息特征均值与数据库里储存的菜品信息特征进行特征对比判断，输出菜品的识别结果。本发明提供的菜品识别方法可获取稳定图像帧，提高菜品识别精度，增强菜品的预测得分，提高了菜品识别结果的置信度。

Description

提升基于深度学习的菜品识别系统识别精度的方法

技术领域

本发明涉及图像识别技术领域，具体是一种提升基于深度学习的菜品识别系统识别精度的方法。

背景技术

随着社会的快速发展，为了体现方便快捷，现阶段大部分的餐厅都采用了自主挑选菜品，排队进行结账。由于结账分为人工计价和自动计价，随着食客人数的增多，人工计价效率低，正确率无法得到保障等缺点就会显露出来。随着人工智能以及移动端互联网的规模急速增长，人们对于“智能化”的需求越来越大，因此近年来出现了一些自动计价方法。在餐饮行业方面，当前越来越多许高校以及大型企业的食堂，引入菜品智能识别与结算设备。

现有的技术有单独使用深度学习目标检测或语义分割的菜品识别方法在智能结算过程中，智能结算台通过摄像头获取结算时的菜品图片，即可端到端直接获取到每个菜品的具体位置和所属类别，智能结算系统根据每个菜品的检测结果进行快速关联，计算出当前订单的结算总金额。但是，该种方式使用端到端的检测模式对标签数据需求量大，需要更高的人力成本；只适用于固定类别的菜品识别，不能识别新增的菜品，灵活性低；端到端模式的泛化能力差，菜品识别精度低。

还有利用结合深度学习目标检测和图像分类的菜品识别方法，该种方法通过分阶段形式，实现菜品识别。第一阶段，对采集的菜品图片进行目标检测，定位出当前图片中的所有菜品具体位置；第二阶段，根据目标检测定位的每个菜品位置信息，单独扣取每一个菜品作为一个子图，然后将每个菜品子图送进图像分类网络，识别各个菜品子图的菜品类别。最后，智能结算系统根据每个菜品的检测结果进行快速关联，计算出当前订单的结算总金额。融合深度学习目标检测与图像分类方法，虽然速度没有端到端的模式快，但是识别精度比端到端模式高。目标检测只负责菜品检出，能够增强检测模型的泛化能力，使得检出率高。但是，图像分类网络只适合识别固定类别的菜品，同样无法识别新增菜品。而且，即使是只识别固定类别的菜品，也需要引入一些辅助方法，才能达到一个较好的识别精度。

发明内容

本发明提供一种显著提高基于深度学习的菜品识别系统识别精度，菜品识别率高的方法。

本发明所述的提升基于深度学习的菜品识别系统识别精度的方法,包括以下步骤：

S1,对菜品采集连续的多帧图片，求取每一帧图片中各个菜品的中心坐标，利用曼哈顿距离公式计算连续的前后两帧图片中同一个菜品对应的中心坐标差值，直到该中心坐标差值小于设定阈值，取最后一帧图片进行菜品识别；

S2,对图片进行裁剪，得到包含菜品的图片；

S3,对裁剪的图片进行固定角度范围内的随机旋转和翻转，结合亮度和对比度随机调整得到多张增强图片；

S4,提取每张增强图片的菜品信息特征，得到多个不同的菜品信息特征，计算出菜品信息特征均值；

S5，通过菜品信息特征均值与数据库里储存的菜品信息特征进行特征对比判断，最后输出菜品的识别结果。

所述的提升基于深度学习的菜品识别系统识别精度的方法,在采集菜品图片的过程中，通过采集对每一帧图片求取图片中各个菜品的中心坐标，利用曼哈顿距离公式计算连续的前后两帧图片中同一个菜品对应的中心坐标差值，直到该中心坐标差值小于设定阈值，取最后一帧图片进行菜品识别，保证了识别的图片均处于稳定状态，可获取稳定图像帧，降低识别过程中外物干扰的风险，有利于提高菜品识别精度，然后通过对裁剪的图片进行随机旋转变换得到多个特征，计算出该多个特征的特征均值，通过经过数据增强预处理的特征均值与数据库的特征进行比对，有利于增强菜品的预测得分，极大的提高了菜品识别结果的置信度。

附图说明

图1为提升基于深度学习的菜品识别系统识别精度的方法步骤框图。

图2为提升基于深度学习的菜品识别系统识别精度的方法的流程图。

图3为图2中的数据增强预处理流程图。

图4为图2中的菜品纠错流程图。

具体实施方式

如图1-4所示，一种提升基于深度学习的菜品识别系统识别精度的方法,包括以下步骤：

S2,对图片进行裁剪，得到包含菜品的图片；

在采集菜品图片的过程中，一般采用实时采集图像的方式，该种方式容易把手、手机等于菜品无关的干扰物拍进来，会增加模型识别的难度。另外，实时采集会导致同一笔订单中，随着菜品的移动或晃动，该订单的价格单的价格发生连续跳变，大大增加订单少算或多算的风险。对次，通过动静检测方法采集菜品图片，即当菜品被置于识别区域时，设备会对其连续采集N帧图片，对每一帧图片求取各个菜品的中心坐标(x1,y1)，(x2,y2)，... (xn,yn)，然后使用公式

，即曼哈顿距离公式（城市街区距离），计算前后两帧图片同一个菜品对应的中心坐标差值是否均小于设定阈值，若是，说明当前菜品处于稳定待识别状态，取第N帧图片进行菜品识别，获取识别结果；反之，如果前后两帧图片同一个菜品对应的中心坐标差值出现有大于设定阈值的，说明当前菜品未进入稳定待识别状态，需要从第N帧起重新对当前菜品采集图像。动静检测方法，保证了识别的图片均处于稳定状态，可获取稳定图像帧，有效解决价格跳变导致订单少算或多算问题，降低识别过程中外物干扰的风险，有利于提高菜品识别精度，然后通过对裁剪的图片进行随机旋转变换得到多个特征，计算出该多个特征的特征均值，通过经过数据增强预处理的特征均值与数据库的特征进行比对，有利于增强菜品的预测得分，极大的提高了菜品识别结果的置信度。

所述的提升基于深度学习的菜品识别系统识别精度的方法，在对菜品进行采集之前，还包括以下步骤：在后台数据库中选择当餐所涉及的菜单进行筛选排单，减少从数据库中需要提取比对的菜品信息特征。菜品排单可按天选择，以一天为单位，直接选择当天涉及的所有菜单；也可分餐选择，以单餐为单位，选择当餐所涉及的菜单。可使寻找特征对比的模型从原来的几百种类别中搜索变为从几十种类别中搜索，极大地降低了模型的搜索空间，降低相似菜品影响的风险，提高菜品识别精度。

所述的提升基于深度学习的菜品识别系统识别精度的方法，还包括以下步骤：在菜品识别时，当有识别到有新品增加、置信度识别得分相近和置信度识别得分过低时，及时在菜品识别界面报警提醒，转由人工进行干预纠正识别。客户端通过轮询机制，监控后台是否有新菜增加，一旦发现后台添加新菜，及时在菜品识别界面弹出提醒消息，可及时更新数据库里的特征，保证菜品的识别率。菜品在制作出品时，受各种客观因素，如：菜品表面光反射、菜品包裹保鲜膜、酱料和配料等影响，经常会出现一些表面特征很相似，很容易引起识别混淆的相似菜品。为了有效降低这类相似菜品引起的误识别，可提供top5的五个的识别结果，在识别时判断top1和top2两个识别结果的得分差值是否小于设定的阈值，若是，则用显眼的颜色将该菜品的识别框与其他识别正常的菜品的识别框区分开，用以提醒工作人员注意该情况下的识别结果不一定可信，需要进行人工校验，进而降低相似类别菜品带来的误识别风险。菜品在识别过程中受外界因素，如：手/手机遮挡、走影、重叠或外界强光干扰等影响，会降低菜品识别效果。因此，对于识别结果的置信度得分低于设定阈值的结果，同样会用不同颜色的识别框来区别于正常识别框，以提醒当前菜品的识别结果需要进行人工校验，降低误识别风险。

所述的提升基于深度学习的菜品识别系统识别精度的方法，还包括以下步骤：判别当前采集的菜品类别是否在数据库中存在，不存在则进行新增菜品，存在则进行菜品纠错修正类别，纠正完正确的菜品类别后，对该菜品图片进行数据增强并提取特征，与数据库里对应的正确类别的菜品信息特征，进行加权平均，然后再把加权平均的特征更新原数据库中的菜品信息特征，能有效提升下一次同类别菜品的识别效果，进一步提升菜品的识别精度。

Claims

1.一种提升基于深度学习的菜品识别系统精度的方法，其特征在于，包括以下步骤：

S2,对图片进行裁剪，得到包含菜品的图片；

2.根据权利要求1所述的提升基于深度学习的菜品识别系统精度的方法，其特征在于，在对菜品进行采集之前，还包括以下步骤：在后台数据库中选择当餐所涉及的菜单进行筛选排单，减少从数据库中需要提取比对的菜品信息特征。

3.根据权利要求1所述的提升基于深度学习的菜品识别系统精度的方法，其特征在于，还包括以下步骤：在菜品识别时，当有识别到有新品增加、置信度识别得分相近和置信度识别得分过低时，及时在菜品识别界面报警提醒，转由人工进行干预纠正识别。

4.根据权利要求3所述的提升基于深度学习的菜品识别系统精度的方法，其特征在于，还包括以下步骤：判别当前采集的菜品类别是否在数据库中存在，不存在则进行新增菜品，存在则进行菜品纠错修正类别，纠正完正确的菜品类别后，对该菜品图片进行数据增强并提取特征，与数据库里对应的正确类别的菜品信息特征，进行加权平均，然后再把加权平均的特征更新原数据库中的菜品信息特征。