CN112949338A

CN112949338A - 深度学习与Hough变换结合的二维条码精确定位方法

Info

Publication number: CN112949338A
Application number: CN202110283304.3A
Authority: CN
Inventors: 李建伟; 吕娜; 郭宏; 刘成波; 伊亚聪; 胡孔耀; 徐延
Original assignee: Taiyuan University of Science and Technology
Current assignee: Taiyuan University of Science and Technology
Priority date: 2021-03-16
Filing date: 2021-03-16
Publication date: 2021-06-11

Abstract

本发明提供了一种深度学习与Hough变换结合的二维条码精确定位方法；所述方法包括：在复杂光源环境下采集大量Datamatrix码样本图像，然后对其进行样本标注，构造用于边缘提取的训练数据集；利用完全卷积神经网络FCC和深度监督网的深度学习模型HED网络来对待测Datamatrix码样本图像进行边缘提取处理，得到二维码边缘候选区域，实现DM码初定位；通过利用Hough变换对前面获得的二维码候选区域实现精确定位；最后通过解码算法，完成二维码信息的提取。本发明通过提供的二维码的精确定位方法，鲁棒性强，稳定性高，同时准确率高，对于机械加工复杂环境适应良好。

Description

深度学习与Hough变换结合的二维条码精确定位方法

技术领域

本发明属于机器视觉检测技术领域，具体涉及一种深度学习与Hough变换结合的二维码定位方法。

背景技术

在工业领域中，直接零件标识(DPM)技术是一种通过激光蚀刻等手段对产品零部件表面进行直接标记的自动标识技术。利用二维码对工业产品及零部件进行标识，对实现刀具零部件的生成追踪、信息管理、全生命周期管理具有重要意义。由于DataMatrix(DM)条码具有编码容量大、密度高、信息安全性高以及纠错能力强等优点，DM码通常被用作工业产品的永久标识。但在实际应用中工业二维码的应用环境比较恶劣，DataMatrix码的识别通常伴随着噪声、过曝、磨损、污染等问题且金属本身具有低对比度背景、易受污染等特点,导致二维码图像严重磨损、码区污染,从而无法精准定位二维码。因此针对复杂背景够快速准确的识别的DM二维码，尤其是识别条件复杂情况下的二维条码，实现精准定位二维码意义重大。

但是现有的Datamatrix二维码定位方法存在耗时长、复杂环境下识别率低以及无法识别等缺点。

发明内容

1、发明目的。

本发明提供耗时短、定位准确率高且稳定的一种深度学习与Hough变换结合的二维码定位方法。

2、本发明所采用的技术方案。

本发明公开了一种深度学习与形状检测相结合的二维码定位方法，具体步骤为：

S1、获取一定数量的二维码样本图像构造用于边缘提取的训练数据集；

S2、构造边缘提取网络模型与优化，基于完全卷积神经网络FCC和深度监督网的深度学习模型HED边缘检测网络。对制作的数据集进行训练，得出模型；

S3、使用训练好的HED边缘检测模型对待测二维码进行边缘检测，生成边缘概率图，获取相应的边缘图像，实现二维码粗定位；

S4、对所述生成的边缘概率图利用Hough直线检测方法，寻找边缘概率图中的所有直线，后经过直线聚类得出4条边缘线即为二维码轮廓区域，得到精确的二维码定位区域，进而快速进行二维码码片信息的获取；

S5、最后通过RS解码算法，完成二维码信息的提取。

可选地，所述步骤S1的具体过程为：

S11、利用Labelme对每个目标二维码的边界进行人工标记，得到一定数量的边缘训练样本；

S12、利用数据增强算法在一定程度上扩展数据，通过一些图像处理手段，在前景图上添加旋转、平移、透视变换，对复杂环境的背景图进行了随机的裁剪通过实验对比生成合适宽度的边缘线并添加该图像到训练集中，以此提高训练数据集的规模。

可选地，所述步骤S2的具体过程为：

S21、所述HED边缘检测模型是基于FCN与VGG的改进，在VGGNet的基础上将每一个阶段的最后一个卷积层后面(分别为conv1_2，conv2_2，conv3_3，conv4_3，conv5_3)增加一个侧边输出层side-output层，并在侧边输出层上进行深度监督，侧面输出层被实现为具有内核大小为1和输出数为1的卷积层；增加一个混合权重层,用来将所有的侧输出层的预测结果连接到一起，然后通过一个训练的权重融合函数得到最终的边缘输出，得到一个带有侧面输出层的FCN网络结构即为边缘提取网络模型；

S22、用准备好的用于边缘提取的训练数据集以最小的损失函数为目标训练设计好的边缘提取网络模型。

最终HED的损失函数如下。

式中l_side表示像素级的侧边输出代价，α_m表示每个侧边输出的损失函数的权值，在训练中，这一代价函数是遍历输入图像的每一个像素与输出概率图的每一个像素，对于每一张图像，这一损失函数表示为。

其中，β＝|Y_-|/|Y|，1-β＝|Y₊|/|Y|，|Y₊|和|Y_-|分别表示标签中标记为非边缘和边缘的像素的个数；

是由侧边输出的响应值通过sigmoid函数σ(·)计算得到的。

为了直接利用侧输出预测，在网络中添加了一个加权融合层，并在训练中学习融合权重，在融合层处的损失函数为：

式中

h表示各侧边输出层的融合权重，

表示预测结果与标签之间的距离，利用交叉熵函数计算得出。

按照原HED训练出来的网络，检测到的边缘线有一点粗的，为了得到更细的边缘线，通过多次试验找到了一种优化方案。在计算损失函数时，不考虑前5层的cost，不再让每个尺度上得到的图像都参与cost的计算，只使用融合后得到的最终图像来进行计算，单独将最后的融合层的loss作为最后的loss值输出。

最终网络根据融合代价对各卷积核内的参数以及融合权重利用梯度下降法进行迭代优化，改进的目标函数为：

(W,w,h)^*＝argmin(L_fuse(W,w,h)) (4)

测试给定的图像X，我们从侧输出层和加权融合层获得边缘映射预测。

通过进一步聚合这些生成的边缘映射，可以获得最终的统一输出。

可选地，所述步骤S3中，将待识别的二维码作为输入图像输入到边缘提取网络进行边缘提取；从侧面输出层和混合权重层同时获得边缘预测结果，最终的输出就是将这些结果进行聚合提取得到的二维码边缘概率图。

可选地，所述步骤S4中，精确的二维码定位区域由二维码四个精确定位点获得。对所述生成的边缘概率图利用HoughLinesP()函数检测线段，寻找边缘概率图中的所有直线，后经过直线聚类得出4条边缘线，建立其方程求解，得到4条边缘线之间的交点。由4条边缘线围成的区域即为二维码轮廓区域，得到精确的二维码定位区域。

可选地，所述步骤S5中，对得到的精确定位区域的二维码图像扫描生成二进制位图，然后提取码流，采用RS纠错算法进行纠错处理，最后根据编码规则进行码流译码。

本发明的有益效果是。

与现有的二维码定位算法相比，本文所提出的全局嵌套网络是一个相对简单的变量，可以从多个尺度生成预测。该方法有算法复杂度低，鲁棒性强，稳定性高，对复杂环境适应良好等诸多优点。HED边缘检测模型训练好后，在使用时不用设置任何参数；分割效果更好，分割尺度更精细，定位更加准确；大幅降低了传统图像处理方式对二维码定位识别时，因环境噪声对处理结果不理想的严重影响。很好的解决了现有传统图像处理方法对复杂环境下识别率低，定位不准确等受限的问题，极大地提升了二维码定位识别的效率。

附图说明

图1是本发明复杂环境下待测的二维码示意图。

图2是本发明数据集制作例的标记操作示意图以及ground truth图。

图3是本发明整体过程流程图。

图4是改进的HED边缘检测网络架构图。

图5是本发明实例实施中的改进的HED网络定位二维码效果示意图。

图6是本发明实例实施中的二维码精确定位效果示意图。

具体实施方式

下面将结合附图和实施例对本发明作进一步地详细描述。

本发明一种深度学习与Hough变换结合的二维条码精确定位方法的整个过程的流程图如图3所示。具体操作步骤如下。

S1、获取一定数量的二维码样本图像构造用于边缘提取的训练数据集。

本文自建的DM码数据集图片来源于百度图片网络爬虫。搜索关键词DM码进行爬取。对爬取的图片挑选并利用Labelme工具对DM码图像数据集打标，人工标注的时间成本很高，对于神经网络来说，标注少量的训练样本其实是不够的。另外，这些图片覆盖的场景其实也比较少，有些图片的相似度比较高，这样的数据放到神经网络里训练，泛化的效果并不好。所以，还采用技术手段，合成了10000多张训练样本图片。

S2、构造边缘提取网络模型与优化，基于完全卷积神经网络FCC和深度监督网的深度学习模型HED边缘检测网络。对制作的数据集进行训练，得出模型。

所述HED边缘检测模型是基于FCN与VGG的改进，在此基础上进一步优化HED网络，如图5所示。按原HED训练出来的网络，检测到的边缘线有一点粗的，为了得到更细的边缘线，通过多次试验找到了一种优化方案。在计算损失函数时，不考虑前5层的cost，不再让每个尺度上得到的image都参与cost的计算，只使用融合后得到的最终image来进行计算，单独将最后的融合层的loss作为最后的loss值输出。

本算法使用公共的tensorflow库来实现网络框架。网络模型使用的超参数包括：batch-size(4)、学习速率(0.0005)，权重衰变(0.0002)，训练迭代次数1000次。因为嵌套多尺度框架对输入图像尺度不敏感，所以将训练时所有的图像大小调整到256×256，在减少GPU 内存的使用且高效的批处理前提下，尽可能增加原图片的质量。

S3、使用训练好的HED边缘检测模型对待测二维码进行边缘检测，生成边缘概率图，获取相应的边缘图像，实现二维码粗定位。

实验结果如图5所示。该算法在复杂环境下，DM二维码可被准确定位到，得到了很好的边缘检测结果。

S4、对所述生成的边缘概率图利用HoughLinesP()函数检测线段，寻找边缘概率图中的所有直线，后经过直线聚类得出4条边缘线即为二维码轮廓区域，得到精确的二维码定位区域，进而快速进行二维码码片信息的获取。

在二维码图像的二值化图像上利用HoughLinesP()函数检测线段，找到全部的直线，在像素坐标系下此直线的方程。

y＝k_ix+b_i (7)。

可以用极坐标表示为。

ρ＝xcosθ+ysinθ (8)。

得出其极坐标系下的坐标为(ρ,θ)。Hough变换表征了一种直角坐标系与极坐标系的映射关系。利用这种关系，曲线检测问题就被转化为点检测问题。通过累加统计参数坐标内出现点次数最多的(ρ,θ)，该点对应的直线即为原坐标空间中最长的直线。

采用Hough变换得到另外几条边界的直线方程，可得到DM码的顶点坐标。

ρ₁＝xcosθ₁+ysinθ₁，ρ₂＝xcosθ₂+ysinθ₂ (9)。

同理可以求得其他3条边缘线在像素坐标系下的直线方程。根据在最开始固定下的标点顺序，可能从空间坐标上了解到所找到的直线分别对应于原始图片二维码边缘线。根据两直线相交，最终可以分别得到4个特征点的坐标。

实验结果如图6所示。DM二维码被精确定位到，得到了很好的实验效果。

S5、最后通过RS解码算法，完成二维码信息的提取。

Claims

1.一种深度学习与Hough变换结合的二维条码精确定位方法，其特征在于：

S2、构造边缘提取网络模型与优化，基于完全卷积神经网络FCC和深度监督网的深度学习模型HED边缘检测网络，对制作的数据集进行训练，得出模型；

S5、最后通过RS解码算法，完成二维码信息的提取。

2.根据权利要求1所述一种深度学习与Hough变换结合的二维条码精确定位方法，其特征在于：所述步骤S1的具体过程包括：

S11、利用Labelme对每个目标二维码的边界进行标记，得到一定数量的边缘训练样本；

3.根据权利要求1所述一种深度学习与Hough变换结合的二维条码精确定位方法，其特征在于：所述步骤S2的具体过程包括：

S21、所述HED边缘检测模型是基于FCN与VGG的改进，在VGGNet的基础上将每一个阶段的最后一个卷积层后面(分别为conv1_2，conv2_2，conv3_3，conv4_3，conv5_3)增加一个侧边输出层side-output层，并在侧边输出层上进行深度监督，侧面输出层被实现为具有内核大小为1和输出数为1的卷积层；增加一个混合权重层，用来将所有的侧输出层的预测结果连接到一起，然后通过一个训练的权重融合函数得到最终的边缘输出，得到一个带有侧面输出层的FCN网络结构即为边缘提取网络模型；

S22、用准备好的用于边缘提取的训练数据集以最小的损失函数为目标训练设计好的边缘提取网络模型；

最终HED的损失函数如下：

式中l_side表示像素级的侧边输出代价，α_m表示每个侧边输出的损失函数的权值，在训练中，这一代价函数是遍历输入图像的每一个像素与输出概率图的每一个像素；对于每一张图像，这一损失函数表示为：

是由侧边输出的响应值通过sigmoid函数σ(·)计算得到的，为了直接利用侧输出预测，在网络中添加了一个加权融合层，并在训练中学习融合权重，在融合层处的损失函数为：

式中

h＝(h₁,...,h_M)，h表示各侧边输出层的融合权重，

4.按照原HED训练出来的网络，检测到的边缘线有一点粗的，为了得到更细的边缘线，通过多次试验找到了一种优化方案，在计算损失函数时，不考虑前5层的cost，不再让每个尺度上得到的图像都参与cost的计算，只使用融合后得到的最终图像来进行计算，单独将最后的融合层的loss作为最后的loss值输出；最终网络根据融合代价对各卷积核内的参数以及融合权重利用梯度下降法进行迭代优化，改进的目标函数为：

(W,w,h)^*＝argmin(L_fuse(W,w,h)) (4)测试给定的图像X，我们从侧输出层和加权融合层获得边缘映射预测：

通过进一步聚合这些生成的边缘映射，可以得到最终的统一输出：

5.根据权利要求1所述一种深度学习与Hough变换结合的二维条码精确定位方法，其特征在于：所述步骤S3中，将待识别的二维码作为输入图像输入到边缘提取网络进行边缘提取；从侧面输出层和混合权重层同时获得边缘预测结果，最终的输出就是将这些结果进行聚合提取得到的二维码边缘概率图。

6.根据权利要求1所述一种深度学习与Hough变换结合的二维条码精确定位方法，其特征在于：所述步骤S4中，精确的二维码定位区域由二维码4个精确定位点获得，对所述生成的边缘概率图利用Hough直线检测方法，寻找边缘概率图中的所有直线，后经过直线聚类得出4条边缘线即为二维码轮廓区域，得到精确的二维码定位区域。

7.根据权利要求1所述一种深度学习与Hough变换结合的二维条码精确定位方法，其特征在于：所述步骤S5中，对得到的精确定位区域的二维码图像扫描生成二进制位图，然后提取码流，采用RS纠错算法进行纠错处理，最后根据编码规则进行码流译码。