CN112329774A

CN112329774A - 基于图像的商品尺码表自动生成方法

Info

Publication number: CN112329774A
Application number: CN202011248726.9A
Authority: CN
Inventors: 余卓; 卞龙鹏; 张翼翔; 徐桦; 石克阳
Original assignee: Hangzhou Weier Network Technology Co ltd
Current assignee: Guangzhou Tanyu Technology Co ltd
Priority date: 2020-11-10
Filing date: 2020-11-10
Publication date: 2021-02-05
Anticipated expiration: 2040-11-10
Also published as: CN112329774B

Abstract

本申请公开了一种基于图像的商品尺码表自动生成方法，包括如下步骤：将待处理图像输入至第一卷积神经网络以生成字符候选框以及对应的字符候选框的置信度；除去置信度低于预设阈值的字符候选框；除去不包含文本信息的字符候选框；除去两个在竖直方向重合的字符候选框中置信度较低的一个；按照其中心坐标进行行列排序，并将排序后相邻的字符候选框进行合并为一个文本框；形成待识别小图；将所述待识别小图输入第二卷积神经网络进行识别，获取尺码数据；根据身高、体重和尺码的三者的对应关系，生成指定格式的尺码表格。本申请的有益之处在于提供一种能够适应不同图片的文本的检测、识别的基于图像的商品尺码表自动生成方法。

Description

基于图像的商品尺码表自动生成方法

技术领域

本申请涉及图像处理方法，具体而言，涉及一种基于图像的商品尺码表自动生成方法。

背景技术

现阶段，商家在对衣物等商品配置尺码表时，只能手动配置一张表，耗时久且表格太多易出错。而大部分商品的尺码表可由图像里含有的表格来确定，因此从含有尺码信息的图片中提取尺码信息，然后按照一定规则生成尺码表成了商家重要需求。

发明内容

为了解决了现有技术的不足之处，本申请提供一种基于图像的商品尺码表自动生成方法，包括如下步骤：将待处理图像输入至第一卷积神经网络以生成字符候选框以及对应的字符候选框的置信度；对所述第一卷积神经网络生成的字符候选框进行置信度筛选，除去置信度低于预设阈值的字符候选框；对通过所述置信度筛选的字符候选框进行文本信息筛选，除去不包含文本信息的字符候选框；对通过所述文本信息筛选的字符候选框进行非极大值抑制，除去两个在竖直方向重合的字符候选框中置信度较低的一个；对通过极大值抑制的字符候选框按照其中心坐标进行行列排序，并将排序后相邻的字符候选框进行合并为一个文本框；对所述文本框内区域进行截图，形成待识别小图；将所述待识别小图输入第二卷积神经网络进行识别，获取尺码数据；根据身高、体重和尺码的三者的对应关系，生成指定格式的尺码表格。

进一步地，所述第一卷积神经网络采用Faster-RCNN的CTPN文本检测模型。

进一步地，在所述置信度筛选中，置信度的预设阈值取值范围为0.85至0.95。

进一步地，所述文本信息筛选的方法包括如下步骤：判断所述字符候选框的灰度值分布，若灰度值主要集中分布于一个区域，则判定所述字符候选框不含有文本信息；如果所述字符候选框内像素灰度值集中分布于两个及以上的区域，则进行判定灰度值分布最多的两个区域的像素个数N1、N2及框内像素值总个数Ns的数值关系，若N1>Ns*0.1且N2>Ns*0.1，则认为此文本框含有文本信息，反之则认为不含有文本信息。

进一步地，在所述字符候选框按照其中心坐标进行行列排序时，采用冒泡排序方法进行排序。

进一步地，在所述字符候选框按照其中心坐标进行行列排序时，按照先行后列的顺序进行排序。

进一步地，在排序后相邻的字符候选框进行合并为一个文本框时，对于一个所述字符候选框而言，判断按照排序其后的所述字符候选框是否相邻，如果不相邻则，停止判断，如果相邻，则继续判断按照排序的下一个所述字符候选框是否相邻，直至判断为不相邻为止。

进一步地，判断所述字符候选框是否相邻的条件为两个所述字符候选框是否存在重叠的部分。

进一步地，所述第二卷积神经网络采用DenseNet+CTC架构搭建模型。

进一步地，所述基于图像的商品尺码表自动生成方法还包括如下步骤：对所述文本框的截图进行背景色处理从而获得文本信息为深色的待识别小图。

本申请的有益之处在于：提供一种能够适应不同图片的文本的检测、识别的基于图像的商品尺码表自动生成方法。

附图说明

构成本申请的一部分的附图用来提供对本申请的进一步理解，使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是根据本申请一种实施例的基于图像的商品尺码表自动生成方法的步骤示意图；

图2是根据本申请一种实施例的基于图像的商品尺码表自动生成方法中图片经过第一卷积神经网络处理后生成字符候选框的示意图；

图3是图2所示图像经过置信度筛选后的示意图；

图4是图3所示图像经过文本信息筛选后的示意图；

图5是图4所示图像经过非极大值抑制后的示意图；

图6是图5所示图像经过相邻合并后的示意图；

图7是一个待处理图像的视图；

图8是经过本申请方法处理后得到的文本框的示意图；

图9是经过本申请方法处理后生产尺码表。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

参照图1至图9所示，基于图像的商品尺码表自动生成方法，包括如下步骤：将待处理图像输入至第一卷积神经网络以生成字符候选框以及对应的字符候选框的置信度；对第一卷积神经网络生成的字符候选框进行置信度筛选，除去置信度低于预设阈值的字符候选框；对通过置信度筛选的字符候选框进行文本信息筛选，除去不包含文本信息的字符候选框；对通过文本信息筛选的字符候选框进行非极大值抑制，除去两个在竖直方向重合的字符候选框中置信度较低的一个；对通过极大值抑制的字符候选框按照其中心坐标进行行列排序，并将排序后相邻的字符候选框进行合并为一个文本框；对文本框内区域进行截图，形成待识别小图；将待识别小图输入第二卷积神经网络进行识别，获取尺码数据；根据身高、体重和尺码的三者的对应关系，生成指定格式的尺码表格。

具体而言，第一卷积神经网络采用Faster-RCNN的CTPN文本检测模型。

具体而言，在置信度筛选中，置信度的预设阈值取值范围为0.85至0.95。作为进一步优选，置信度的预设阈值取值为0.9。依次对字符候选框进行置信度筛选，如果置信度小于置信度阈值，则除去字符候选框。

具体而言，文本信息筛选的方法包括如下步骤：判断字符候选框的灰度值分布，若灰度值主要集中分布于一个区域，则判定字符候选框不含有文本信息；如果字符候选框内像素灰度值集中分布于两个及以上的区域，则进行判定灰度值分布最多的两个区域的像素个数N1、N2及框内像素值总个数Ns的数值关系，若N1>Ns*0.1且N2>Ns*0.1，则认为此文本框含有文本信息，反之则认为不含有文本信息。

具体而言，在字符候选框按照其中心坐标进行行列排序时，采用冒泡排序方法进行排序。5.

对于保留的字符候选框，按先行后列的顺序进行排序。即对每个字符候选框，确定其中心(x,y)，然后按冒泡排序。两个框进行比较时，先比较候选框的x,若两者的x在同一区域，则认为是同一行，否则较小的x的框排在另一框前面。若是同一行，再比较y，较小的y的框排在另一框前面。

具体而言，在字符候选框按照其中心坐标进行行列排序时，按照先行后列的顺序进行排序。

具体而言，在排序后相邻的字符候选框进行合并为一个文本框时，对于一个字符候选框而言，判断按照排序其后的字符候选框是否相邻，如果不相邻则，停止判断，如果相邻，则继续判断按照排序的下一个字符候选框是否相邻，直至判断为不相邻为止。

具体而言，判断字符候选框是否相邻的条件为两个字符候选框是否存在重叠的部分。具体而言,判断是否重叠即对交集不为0的字符候选框进行水平合并。最终保证每个字符候选框与同一水平的前后字符候选框交集为空，即

其中Ap、An分别为水平方向邻近的前后两个字符候选框。

具体而言，第二卷积神经网络采用DenseNet+CTC架构搭建模型。

具体而言，基于图像的商品尺码表自动生成方法还包括如下步骤：对文本框的截图进行背景色处理从而获得文本信息为深色的待识别小图。

对每个文本框，截取框的图片区域，形成待识别的小图。先将小图转换为灰度图，然后取其左上角位置的点的像素值V1，确定背景像素值范围Va＝[V1-10,V1+10]，然后计算小图中所有像素值不在Va范围内的点的集合D，接着计算集合D的平均像素值，其中Vi是指D内每个像素的像素值。若Vb<Va，则认为此小图文本颜色相对背景为深色，则不进行处理。若Vb>Va,则认为此小图文本颜色相对背景为浅色，需要进行反转，即对此图I进行如下操作：Inew＝255-I。将Inew作为此小图的反转图，输入到文本识别模块。

在文本检测模型得出字符修选框后，本申请采用了非文本过滤方法，只留下包含文本信息的字符候选框，一则可以减少检测结果中非文本的区域，提高文本识别的准确率，二则可以将紧邻的非同一表格的文本进行隔离，减少了文本识别的难度，也有利于后期生成尺码表格时，对于身高-体重-尺码三者的定位。

对于字符候选框构成文本框时，本申请直接按水平角度进行连接，不再采用倾斜梯度，减少了计算量，同时也保证了小图中待检测文本处于水平位置，有利于文本识别。

对于待识别的小图，本申请采用了文本颜色的判定，来决定是否需要对原图进行反转，使所有输入识别模块的小图都是背景浅色文本深色的格式，有利于提高识别的精度与速度。因此本申请可以有效识别包含多种背景/文本颜色的图像中的文本。

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种基于图像的商品尺码表自动生成方法，其特征在于：

所述基于图像的商品尺码表自动生成方法包括如下步骤：

将待处理图像输入至第一卷积神经网络以生成字符候选框以及对应的字符候选框的置信度；

对所述第一卷积神经网络生成的字符候选框进行置信度筛选，除去置信度低于预设阈值的字符候选框；

对通过所述置信度筛选的字符候选框进行文本信息筛选，除去不包含文本信息的字符候选框；

对通过所述文本信息筛选的字符候选框进行非极大值抑制，除去两个在竖直方向重合的字符候选框中置信度较低的一个；

对通过极大值抑制的字符候选框按照其中心坐标进行行列排序，并将排序后相邻的字符候选框进行合并为一个文本框；

对所述文本框内区域进行截图，形成待识别小图；

将所述待识别小图输入第二卷积神经网络进行识别，获取尺码数据；

根据身高、体重和尺码的三者的对应关系，生成指定格式的尺码表格。

2.根据权利要求1所述的基于图像的商品尺码表自动生成方法，其特征在于：

所述第一卷积神经网络采用Faster-RCNN的CTPN文本检测模型。

3.根据权利要求1所述的基于图像的商品尺码表自动生成方法，其特征在于：

在所述置信度筛选中，置信度的预设阈值取值范围为0.85至0.95。

4.根据权利要求1所述的基于图像的商品尺码表自动生成方法，其特征在于：

所述文本信息筛选的方法包括如下步骤：

判断所述字符候选框的灰度值分布，若灰度值主要集中分布于一个区域，则判定所述字符候选框不含有文本信息；

如果所述字符候选框内像素灰度值集中分布于两个及以上的区域，则进行判定灰度值分布最多的两个区域的像素个数N1、N2及框内像素值总个数Ns的数值关系，若N1>Ns*0.1且N2>Ns*0.1，则认为此文本框含有文本信息，反之则认为不含有文本信息。

5.根据权利要求4所述的基于图像的商品尺码表自动生成方法，其特征在于：

在所述字符候选框按照其中心坐标进行行列排序时，采用冒泡排序方法进行排序。

6.根据权利要求5所述的基于图像的商品尺码表自动生成方法，其特征在于：

在所述字符候选框按照其中心坐标进行行列排序时，按照先行后列的顺序进行排序。

7.根据权利要求1所述的基于图像的商品尺码表自动生成方法，其特征在于：

在排序后相邻的字符候选框进行合并为一个文本框时，对于一个所述字符候选框而言，判断按照排序其后的所述字符候选框是否相邻，如果不相邻则，停止判断，如果相邻，则继续判断按照排序的下一个所述字符候选框是否相邻，直至判断为不相邻为止。

8.根据权利要求7所述的基于图像的商品尺码表自动生成方法，其特征在于：

判断所述字符候选框是否相邻的条件为两个同一水平方向邻近的字符候选框是否存在重叠的部分。

9.根据权利要求1所述的基于图像的商品尺码表自动生成方法，其特征在于：

所述第二卷积神经网络采用DenseNet+CTC架构搭建模型。

10.根据权利要求1所述的基于图像的商品尺码表自动生成方法，其特征在于：

所述基于图像的商品尺码表自动生成方法还包括如下步骤：

对所述文本框的截图进行背景色处理从而获得文本信息为深色的待识别小图。