CN112329522A

CN112329522A - 一种基于深度学习和图像处理的货架商品模糊检测方法

Info

Publication number: CN112329522A
Application number: CN202011015957.5A
Authority: CN
Inventors: 魏勋; 李一帆
Original assignee: Shanghai Pinlan Data Technology Co ltd
Current assignee: Shanghai Pinlan Data Technology Co ltd
Priority date: 2020-09-24
Filing date: 2020-09-24
Publication date: 2021-02-05

Abstract

本发明公开了一种基于深度学习和图像处理的货架商品模糊检测方法，涉及人工智能计算机视觉、图像处理技术领域。本发明方法包括：S1、获取货架图片；S2、训练货架检测模型；S3、训练商品检测模型；S4、对货架图像进行检测，得到货架区域；S5、对货架区域内的像素计算拉普拉斯方差，如果高于阈值THRESHOLD_1则为清晰图片，反之进入S6；S6、对货架图像进行商品检测，得到商品的bbox列表；S7、对商品bbox区域的像素计算拉普拉斯方差；S8、判断是否为清晰图片，反之为模糊。本发明可以有效的分辨货架商品图片是否模糊，进而将模糊的货架图片筛除，提高系统的准确率。

Description

一种基于深度学习和图像处理的货架商品模糊检测方法

技术领域

本发明涉及人工智能计算机视觉、图像处理技术领域领域，特别是涉及一种基于深度学习和图像处理的货架商品模糊检测方法。

背景技术

在新零售时代，零售生产商为了更好地掌控线下商品的售卖情况，通常会派遣业代人员去超市卖场进行拍照巡检，然后对商品的陈列方式进行审核。这就必须要求采集的货架商品图片是清晰的，否则无法准确的识别商品类别。为了达到这个目的，需要对采集的货架商品图片进行模糊检测。

检测图像是否模糊，通常直接采用拉普拉斯方差法，即对图像的每个像素点计算拉普拉斯梯度，然后再计算其方差，通常方差越大说明图像越清晰，反之图像越模糊。现有技术中主要有：直接对全局图像使用拉普拉斯方差法，很容易受到非货架区域的干扰，例如货架区域比较模糊，但是非货架区域很清晰的情况下，这种判断方法容易失效；某些商品本身像素差异不大，比如一瓶酱油，除去标签部分其他地方都是黑色的，直接使用拉普拉斯方差法，算出的方差值很低，容易被误判成模糊。因此，针对以上问题，提供一种基于深度学习和图像处理的货架商品模糊检测方法具有重要意义。

发明内容

本发明提供了一种基于深度学习和图像处理的货架商品模糊检测方法，解决了以上问题。

为解决上述技术问题，本发明是通过以下技术方案实现的：

本发明的一种基于深度学习和图像处理的货架商品模糊检测方法，包括如下步骤：

S1、获取不同角度，不同光照，不同分辨率的货架图片；

S2、训练货架检测模型；

S3、训练商品检测模型；

S4、对货架图像进行检测，得到货架的bbox，即为货架区域；

S5、对货架区域内的像素计算拉普拉斯方差，如果高于阈值THRESHOLD_1则为清晰图片，反之进入S6；

S6、对货架图像进行商品检测，得到商品的bbox列表；

S7、对商品bbox区域的像素计算拉普拉斯方差；

S8、如果超过一半的商品的拉普拉斯方差大于THRESHOLD_2，则为清晰图片，反之为模糊。

进一步地，所述S2步骤具体包括如下步骤：

S21、收集不同角度，光照的货架图片；

S22、对部分商品图片进行人工标注训练一个较弱的货架检测模型M0；

S23、使用M0对全量数据进行预标注，人工调整；

S24、使用全量数据训练货架检测模型M1。

进一步地，所述S3步骤具体包括如下步骤：

S31、收集不同角度，光照的货架商品图片；

S32、对部分商品图片进行人工标注训练一个较弱的商品检测模型M2；

S33、使用M0对全量数据进行预标注，人工调整；

S34、使用全量数据训练商品检测模型M3。

本发明相对于现有技术包括有以下有益效果：

本发明的一种基于深度学习和图像处理的货架商品模糊检测方法可以有效的分辨货架商品图片是否模糊，进而将模糊的货架图片筛除，提高系统的准确率。

当然，实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明的一种基于深度学习和图像处理的货架商品模糊检测方法的整体步骤图；

图2为本发明的一种基于深度学习和图像处理的货架商品模糊检测方法的原理图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

请参阅图1-2所示，本发明的一种基于深度学习和图像处理的货架商品模糊检测方法，包括如下步骤：

S1、获取不同角度，不同光照，不同分辨率的货架图片；

S2、训练货架检测模型；

S3、训练商品检测模型；

S4、对货架图像进行检测，得到货架的bbox，即为货架区域；

S6、对货架图像进行商品检测，得到商品的bbox列表；

S7、对商品bbox区域的像素计算拉普拉斯方差；

其中，S2步骤具体包括如下步骤：

S21、收集不同角度，光照的货架图片；

S23、使用M0对全量数据进行预标注，人工调整；

S24、使用全量数据训练货架检测模型M1。

其中，S3步骤具体包括如下步骤：

S31、收集不同角度，光照的货架商品图片；

S33、使用M0对全量数据进行预标注，人工调整；

S34、使用全量数据训练商品检测模型M3。

如图2所示，本方案主要使用两大技术，目标检测和拉普拉斯方差法；

1、目标检测：使用RetinaNet的目标检测模型。此模型可以兼顾检测精度和检测速度。RetinaNet使用了Focal Loss能够很好的平衡前景和背景目标，可以使检测器更加集中于难区分的目标，从而提升检测精度；同时又由于它本身的单阶段设计框架，使其能够达到一个较高的FPS(在Nvidia Tesla V100上可达15FPS)。

获得一个基于RetinaNet的商品检测模型具体步骤如下：

S1.收集不同角度，光照的货架商品图片

S2.对部分商品图片进行人工标注训练一个较弱的商品检测模型M0

S3.使用M0对全量数据进行预标注，人工调整

S4.使用全量数据训练商品检测模型M1

RetinaNet训练设置：

1.按照长边1333像素，短边800像素进行图像resize；

2.Batch size设为2；

3.backbone为resnet50，使用基于imageNet的权重；

4.anchor使用默认设置；

5.学习率初始化为0.01，每10个epoch衰减0.1；

6.steps设为10000步，epoch设为50；

RetinaNet前向设置：

1.按照长边1333像素，短边800像素进行图像resize；

2.检测框score阈值设为0.5；

3.检测框NMS阈值设为0.5；

RetinaNet模型的输出结果分为两个部分:物体的检测框，为一个列表，元素为[x1,y1,x2,y2,score]；物体的类别，为一个列表，元素为[class_1_pro,class_2_pro,class_3_pro,...,class_n_pro](每个类别的概率向量)。对物体的类别概率向量取最大值，其对应的索引即为预测类别编号。

2.拉普拉斯方差法：基于拉普拉斯算子计算每个像素点的二阶导数，然后求方差。拉普拉斯算子的差分如下所示：

写成filter mask的形式为：

0	1	0
			1	-4	1
0	1	0

拉普拉斯算子能够强调图像中灰色的突变，计算其方差值，可以从整体上表征这幅图像的清晰程度，方差越大说明图像越清晰，反之则越模糊。然而由于运动模糊的存在，会导致背景区域是清晰但货架区域是模糊的情况，因此需要对货架图片进行目标检测，只计算货架区域的拉普拉斯方差，才能较为准确的判断货架是否模糊；另外由于某些商品本身灰度差异不明显，可能会将其误判为模糊的情况，因此有必要对单个商品计算拉普拉斯方差，继而判断其模糊性。

概括的说，整个方案包括以下8个步骤：

S1、获取不同角度，不同光照，不同分辨率的货架图片；

S2、训练货架检测模型；

S3、训练商品检测模型；

S4、对货架图像进行检测，得到货架的bbox，即为货架区域；

S6、对货架图像进行商品检测，得到商品的bbox列表；

S7、对商品bbox区域的像素计算拉普拉斯方差；

S8、如果超过一半的商品的拉普拉斯方差大于阈值THRESHOLD_2，则为清晰图片，反之为模糊图片。

有益效果：

以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节，也不限制该发明仅为所述的具体实施方式。显然，根据本说明书的内容，可作很多的修改和变化。本说明书选取并具体描述这些实施例，是为了更好地解释本发明的原理和实际应用，从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

Claims

1.一种基于深度学习和图像处理的货架商品模糊检测方法，其特征在于，包括如下步骤：

S1、获取不同角度，不同光照，不同分辨率的货架图片；

S2、训练货架检测模型；

S3、训练商品检测模型；

S4、对货架图像进行检测，得到货架的bbox，即为货架区域；

S6、对货架图像进行商品检测，得到商品的bbox列表；

S7、对商品bbox区域的像素计算拉普拉斯方差；

2.根据权利要求1所述的一种基于深度学习和图像处理的货架商品模糊检测方法，其特征在于，所述S2步骤具体包括如下步骤：

S21、收集不同角度，光照的货架图片；

S23、使用M0对全量数据进行预标注，人工调整；

S24、使用全量数据训练货架检测模型M1。

3.根据权利要求1所述的一种基于深度学习和图像处理的货架商品模糊检测方法，其特征在于，所述S3步骤具体包括如下步骤：

S31、收集不同角度，光照的货架商品图片；

S33、使用M0对全量数据进行预标注，人工调整；

S34、使用全量数据训练商品检测模型M3。