CN110069995A

CN110069995A - 一种基于深度学习的餐盘运动状态识别方法

Info

Publication number: CN110069995A
Application number: CN201910215013.3A
Authority: CN
Inventors: 熊继平; 叶灵枫; 朱凌云
Original assignee: Zhejiang Normal University CJNU
Current assignee: Zhejiang Normal University CJNU
Priority date: 2019-03-16
Filing date: 2019-03-16
Publication date: 2019-07-30

Abstract

本发明公开了一种基于深度学习的餐盘运动状态识别方法，利用卷积神经网络来确定餐盘的运动状态。该方法包括：利用卷积神经网络训练一个餐盘位置检测模型；按关键帧检测餐盘，得到餐盘的位置信息；对关键帧中前后两帧的餐盘位置信息进行判断，确定餐盘的运动状态。该方法能够通过摄像头来确定餐盘的运动状态，在进行餐盘检测时不需要额外的传感器来确定所需检测的餐盘，可以在不影响检测速度的同时减少成本。

Description

一种基于深度学习的餐盘运动状态识别方法

技术领域

本发明涉及计算机视觉领域，尤其涉及一种基于深度学习的餐盘运动状态识别方法。

背景技术

随着人工智能的快速发展，越来越多的领域已经将人工智能应用在实际的生活中。最近智能餐厅越来越受到重视，如何方便快捷的进行结账支付成为了一个研究的热点。现有的基于深度学习的智能支付方式普遍是利用红外，超声波等一些传感器来判断餐盘的运动状态，待餐盘进入摄像头的捕捉区域后触发摄像头拍照进行餐盘或者菜品的识别，最终根据识别结果结账计费。然而上诉方法因为使用了传感器，会额外增加成本，同时对于后期的维护和更新都会带来极大的不便，其次传感器对环境的依赖会直接影响后续的识别。

其次现有的基于传统图像处理的物体运动状态判断方法都存在一些问题，例如帧间差分法，虽然它对光线等场景变化不太敏感，能够适应各种动态环境，但是对于帧间的时间间隔选择没有一个合适的范围，间隔过大过小都会影响它的检测准确率，其次最重要的是它无法检测出静止的物体。背景差分法，在实际的餐厅中很难获得一个统一的背景，因此，需要不断的动态更新背景，这会大大降低检测的速度，同时一些细微的抖动都会对其的检测结果造成干扰。边缘检测法，它对于颜色较为敏感，因此餐盘，菜品的颜色会对其造成很大的影响，同时光照的变化以及拍摄角度都会对其造成干扰。

总体来说，传统的图像处理检测物体运动状态的方法可靠性比较差，存在着光照、图像阴影和噪声、物体的遮挡和检测速度慢等问题，容易受到环境的影响，造成检测结果的不准确及误判，在实际的应用中，难以用来确定餐盘的运动状态。

本发明提供了一种基于深度学习的餐盘运动状态识别方法，通过摄像头获取的餐盘图像关键帧，利用卷积神经网络得到餐盘的位置信息，对比相邻关键帧之间的餐盘位置信息来判断餐盘的运动状态，当餐盘处于静止状态后进行后续的餐盘或者菜品识别工作。该方法能够解决传统图像处理检测餐盘运动状态所存在的问题，同时该方法不需要额外的传感器来触发摄像头，能够减小传感器依赖所造成的影响，并且该方法相对于传感器不会增加所需时间，能够在保证检测速度的同时降低成本。

发明内容

本发明的目的在于能够利用摄像头获取的图片帧来判断餐盘的运动状态，解决目前对于餐盘及菜品检测中常使用红外传感器等一些额外的硬件来判断餐盘的运动状态，在保证检测速度的同时能够有效减少成本。

为了实现上述目的，本发明提供了一种基于深度学习的餐盘运动状态识别方法，该方法包括：

收集餐盘样本，利用卷积神经网络训练一个餐盘位置检测模型；

利用摄像头装置对餐盘图像进行实时检测；

按关键帧对检测得到的餐盘位置信息进行判断；

判断餐盘置于稳定状态后将检测结果输出；

继续检测餐盘运动状态，判断餐盘是否移出摄像头范围，重置显示。

其中，根据所述收集餐盘样本，利用卷积神经网络训练餐盘位置检测模型，包括：

在实际餐厅中采集餐盘样本；

对餐盘样本进行数据增强，标注餐盘数据；

卷积神经网络为基础网络，利用得到的样本训练餐盘检测模型。

其中，根据所述利用摄像头进行实时检测，包括：

利用训练好的检测模型进行实时检测。

其中，根据所述按关键帧对检测得到的餐盘位置信息进行判断，包括：

由检测模型在关键帧位置获取餐盘的位置坐标信息；

对比前后两个关键帧中餐盘的位置信息判断餐盘的运动状态。

其中，根据所述判断餐盘置于稳定状态后将激活后续的餐盘或菜品识别模型，包括：

判断得到餐盘为稳定状态；

激活后续的餐盘或者菜品识别。

其中，根据所述继续检测餐盘运动状态，判断餐盘是否移出摄像头范围，重置显示，包括：

待餐盘或者菜品识别模型输出结果后再次触发餐盘位置检测模型；

按关键帧判断餐盘的位置坐标信息；

当不在获得餐盘的位置坐标信息后，确定餐盘移出摄像头范围，重置显示。

本发明所述的一种基于深度学习的餐盘运动状态识别方法，通过摄像头获取到餐盘图像的关键帧，对比前后两个关键帧中的餐盘坐标信息来确定餐盘的运动状态，具体而言，本发明将首先利用卷积神经网络通过样本来训练一个检测餐盘位置的网络模型，其次通过该模型获取从摄像头捕捉到的餐盘图片的餐盘位置信息，最后对前后关键帧之间的位置信息进行对比分析，确定餐盘的运动状态。

基于上述发明方法，与现有方法相比具有突出的区别和贡献在于：

本发明充分利用图像关键帧之间的餐盘位置信息，能够判断出餐盘处于移动或者静止状态，同时在保证检测速度的同时能够不依赖于红外或超声波等传感器，避免了传感器所带来的干扰因素例如光照、环境等影响，其次能够方便后续的硬件更新，可以大大降低开发和维护的成本。并且本发明相较于传统图像处理中的方法，检测速度更快，识别率更高，对于环境的要求较低，同时也可以降低对图像质量的依赖，减少摄像头成本。

附图说明：

图1为本申请实施例的一种基于深度学习的餐盘运动状态识别方法的流程图。

图2为本申请实施例获取样本并训练模型的流程图。

图3为本申请实施例关键帧的确定以及餐盘运动状态的判断的流程图。

图4为本申请实施例后续的餐盘或菜品识别后重置显示的流程图。

具体实施方式：

以下将通过具体的实施例及附图来详细介绍本发明的目的、技术方案和优点。

图1所示的本申请实施例的整个流程示意图，具体实施如下：

步骤S110，收集实际餐厅中的餐盘样本，利用卷积神经网络训练一个餐盘检测模型；

步骤S120，利用摄像头装置对餐盘图像进行实时检测；

步骤S130，将获取的餐盘图像输入到已训练好的模型中，按关键帧检测餐盘图像，得到餐盘的位置信息；

步骤S140，对连续的前后两帧中的餐盘位置信息进行判断，确定餐盘的运动状态，当餐盘处于静止稳定状态后激活后续的餐盘或菜品检测模型；

步骤S150，继续检测餐盘运动状态，判断餐盘是否移出摄像头范围，重置显示。

以下对本申请实施例的若干关键步骤作详细介绍。

一、图2表示获取样本并训练模型

本申请实施例从餐厅中获取实际的餐盘样本图像，利用标注软件对其进行标注，并利用卷积神经网络训练一个餐盘位置检测模型，其中：

获取的餐盘图像应包含各类别餐盘；

卷积神经网络采用较小的网络结构，提高检测速度。

步骤S210，利用标注软件在获取的餐盘图像中进行各类别餐盘的标注，即在餐盘图像中框出各个类别并打上标签；

步骤S220，将标注好的样本输入到一个浅层的卷积神经网络中进行训练，得到一个餐盘位置检测模型。

二、图3表示关键帧的确定以及餐盘运动状态的判断

本申请实施例从摄像头获取的餐盘连续帧中提取关键帧，并根据餐盘位置检测模型判断餐盘的运动状态，其中：

根据摄像头得到的餐盘图像连续帧，每隔5帧为一个关键帧，以25FPS的摄像头为例，则存在6个关键帧；

在每个关键帧中利用餐盘位置检测模型进行餐盘检测，获取餐盘的坐标信息；

对比前后关键帧中的餐盘坐标信息确定餐盘的运动状态。

步骤S310，从连续的餐盘图像帧中每隔5帧提取关键帧；

步骤S320，在提取出来的关键帧处利用已经训练好的餐盘位置检测模型进行检测，得到餐盘的位置坐标信息；

步骤S330，对比前后两个关键帧处的餐盘位置坐标信息来判断餐盘的运动状态；若前后两帧检测到的餐盘坐标不在发生变化，并且餐盘的坐标个数保持不变，则确定餐盘静止，处于稳定状态；反之则餐盘处于移动状态，继续进行关键帧的对比。

步骤S340，餐盘处于稳定状态后，激活后续的餐盘或菜品检测模型，进行餐盘或者菜品的识别。

三、图4表示后续的餐盘或菜品识别后重置显示

本申请实施例在后续餐盘或菜品识别结束后，继续检测餐盘运动状态，判断餐盘是否移出摄像头范围，重置显示，其中：

待餐盘或菜品检测模型输出识别结果后，餐盘位置检测模型在关键帧处进行检测；

得到关键帧处的餐盘位置坐标信息；

对比前后关键帧处的坐标信息，确定餐盘移出摄像头后重置显示。

步骤S410，得到餐盘或菜品检测模型输出识别结果后，餐盘位置检测模型继续在关键帧处进行餐盘位置的检测；

步骤S420，若餐盘位置检测模型一直检测到坐标信息，则认为餐盘依然处于摄像头范围，若检测模型不再检测到坐标信息，且后续两个关键帧处都不再有坐标信息则认为餐盘移出摄像头范围，重置显示界面。

Claims

1.一种基于深度学习的餐盘运动状态识别方法，用于通过图像信息来确定餐盘的运动状态，其特征在于，所述方法包括以下步骤：

利用摄像头装置对餐盘图像进行实时检测；

按关键帧对检测得到的餐盘位置信息进行判断；

判断餐盘置于稳定状态后将激活后续的餐盘或菜品识别模型；

2.根据权利要求1所述的基于深度学习的餐盘运动状态识别方法，其特征在于，利用卷积神经网络训练一个餐盘位置检测模型，包括：

采集实际餐厅餐盘数据并进行标记；

利用卷积神经网络训练一个餐盘位置检测模型。

3.根据权利要求1所述的基于深度学习的餐盘运动状态识别方法，其特征在于，按关键帧对检测得到的餐盘位置信息进行判断，包括：

确定整个餐盘运动过程中的关键帧；

利用训练好的餐盘位置检测模型在关键帧处进行检测，得到餐盘的位置信息；

通过对比前后关键帧中的餐盘位置信息进行餐盘运动状态的判断。

4.根据权利要求1所述的基于深度学习的餐盘运动状态识别方法，其特征在于，判断餐盘置于稳定状态后将激活后续的餐盘或菜品识别模型，包括：

根据关键帧之间的对比结果确定餐盘处于静止或者移动状态；

若在两个关键帧之间检测到的餐盘数量未发生变化则确定餐盘稳定；

激活后续的餐盘或菜品检测模型进行识别。

5.根据权利要求1所述的基于深度学习的餐盘运动状态识别方法，其特征在于，继续检测餐盘位置，判断餐盘是否移出摄像头范围，重置显示，包括：

待餐盘或菜品检测模型输出识别结果后，再次进行餐盘位置检测；

当检测结果不在输出餐盘位置信息时，确定餐盘已移出摄像头范围；

确认结账结束，重置显示。