CN115471703A

CN115471703A - 二维码检测方法、模型训练方法、装置、设备及存储介质

Info

Publication number: CN115471703A
Application number: CN202211154222.XA
Authority: CN
Inventors: 洪乐; 刘敏; 赖鼎; 匡文清
Original assignee: Chint Group R & D Center Shanghai Co ltd
Current assignee: Chint Group R & D Center Shanghai Co ltd
Priority date: 2022-09-21
Filing date: 2022-09-21
Publication date: 2022-12-13

Abstract

本发明实施例公开了一种二维码检测方法、模型训练方法、装置、设备及存储介质。方法包括：根据预置的第一检测定位模型获取待检测图像的二维码区域；根据预置的第二检测定位模型获取所述待检测图像中二维码的回字型方块区域；将所述回字型方块区域输入至预置的第一分类模型中，得到所述二维码中回字型方块的第一分类结果；获取所述二维码的非回字型方块区域，并将所述非回字型方块区域输入至预置的第二分类模型中，得到所述二维码中非回字型方块的第二分类结果，进而避免了无法对二维码上轻微缺陷不易区分的技术问题，极大的提高了小型断路器中二维码检测的精度和效率。

Description

二维码检测方法、模型训练方法、装置、设备及存储介质

技术领域

本发明涉及计算机视觉技术领域，尤其涉及一种二维码检测方法、模型训练方法、装置、设备及存储介质。

背景技术

小型断路器在生产的过程中，通常其器件表面会喷上二维码(其下方可能包含字符)，来记录产品信息，以便于查询和溯源。然而，产线上部分小型断路器表面上的二维码可能会存在喷码不完整，浓淡不均等缺陷，因此需要从产线上识别出具有二维码印刷质量缺陷的小型断路器，以便于快速进行修复。

目前，针对二维码检印刷质量缺陷检测算法主要有两个方向：一个方向则是基于传统图像算法，可以实现二维码的手动定位和是否存在缺陷的判定，但实际工业生产中，由于二维码印刷质量缺陷的类型繁多，算法运行时间要求高，传统图像算法存在适用性和效率等方面问题；另一个方向则是基于深度学习方向，如中国专利CN 111524119 A和CN114139564 A，其中，专利CN 111524119A中主要利用GoogLeNet网络模型对二维码是否存在缺陷进行判定，但没有给出二维码定位的方法，同时GoogLeNet分类算法出现时间较早，其精度和效率均较低；而专利CN114139564 A仅采用一个目标检测定位模型(VGG-SSD)进行二维码定位和分类，导致其分类的精确度较低，尤其针对轻微缺陷不易区分，同时VGG-SSD出现时间较早，导致二维码检测的精度和效率均较低。

发明内容

针对现有技术的不足，本发明提供了一种二维码检测方法、模型训练方法、装置、设备及存储介质，旨在解决现有技术中图像中二维码检测的精度和效率均较低的技术问题。

第一方面，本发明实施例提供了一种二维码检测方法，其包括：

根据预置的第一检测定位模型获取待检测图像的二维码区域；

根据预置的第二检测定位模型获取所述待检测图像中二维码的回字型方块区域；

将所述回字型方块区域输入至预置的第一分类模型中，得到所述二维码中回字型方块的第一分类结果；

获取所述二维码的非回字型方块区域，并将所述非回字型方块区域输入至预置的第二分类模型中，得到所述二维码中非回字型方块的第二分类结果。

第二方面，本发明实施例提供了一种模型训练方法，其包括：

获取采集到的样本图像集；

对所述样本图像集中每张样本图像进行标注，得到标注后的样本图像集；

将所述标注后的样本图像集进行前处理，得到第一训练集和验证集；

根据所述第一训练集、所述验证集对二维码图像的检测网络进行训练，其中所述检测网络包括第一检测定位模型、第二检测定位模型、第一分类模型以及第二分类模型；所述第一检测定位模型的检测定位类别包括图像的二维码，所述第二检测定位模型的检测类别包括所述二维码的回字型方块，所述第一分类模型的分类类别包括所述回字型方块，所述第二分类模型的分类类别包括所述二维码中非回字型方块。

第三方面，本发明实施例提供了一种二维码检测装置，其包括：

第一获取单元，用于根据预置的第一检测定位模型获取待检测图像的二维码区域；

第二获取单元，用于根据预置的第二检测定位模型获取所述待检测图像中二维码的回字型方块区域；

第一输入单元，用于将所述回字型方块区域输入至预置的第一分类模型中，得到所述二维码中回字型方块的第一分类结果；

第二输入单元，用于获取所述二维码的非回字型方块区域，并将所述非回字型方块区域输入至预置的第二分类模型中，得到所述二维码中非回字型方块的第二分类结果。

第四方面，本发明实施例提供了一种模型训练装置，其包括：

第三获取单元，用于获取采集到的样本图像集；

标注单元，用于对所述样本图像集中每张样本图像进行标注，得到标注后的样本图像集；

前处理单元，用于将所述标注后的样本图像集进行前处理，得到第一训练集和验证集；

训练单元，用于根据所述第一训练集、所述验证集对二维码图像的检测网络进行训练，其中所述检测网络包括第一检测定位模型、第二检测定位模型、第一分类模型以及第二分类模型；所述第一检测定位模型的检测定位类别包括图像的二维码，所述第二检测定位模型的检测类别包括所述二维码的回字型方块，所述第一分类模型的分类类别包括所述回字型方块，所述第二分类模型的分类类别包括所述二维码中非回字型方块。

第五方面，本发明实施例又提供了一种电子设备，电子设备包括存储器、处理器及存储在存储器中并可在处理器上运行的计算机程序，处理器执行计算机程序时实现如上述的二维码检测方法或模型训练方法。

第六方面，本发明实施例还提供了一种计算机可读存储介质，计算机可读存储介质存储有计算机程序，计算机程序被处理器执行时实现上述的二维码检测方法或模型训练方法。

本发明实施例提供了一种二维码检测方法、模型训练方法、装置、设备及存储介质，通过采用第一检测定位模型获取待检测图像的二维码区域，并采用第二检测定位模型获取二维码的回字型方块区域，最后通过第一分类模型、第二分类模型分别对二维码的回字型方块区域和非回字型方块区域进行分类以确定待检测图像的二维码是否有缺陷。本发明通过采用多个检测定位模型和分类模型对待检测图像的二维码进行检测，避免了无法对二维码上轻微缺陷不易区分的技术问题，极大的提高了二维码检测的精度和效率。

附图说明

为了更清楚地说明本发明实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的应用场景示意图；

图2为本发明实施例提供的二维码检测方法的流程示意图；

图3为本发明实施例提供的二维码检测方法的一流程示意图；

图4为本发明实施例提供的二维码检测方法的另一流程示意图；

图5为本发明实施例提供的生成特征金字塔的示意性框图；

图6为本发明实施例提供的二维码检测方法的另一流程示意图；

图7为本发明实施例提供的模型训练方法的流程示意图；

图8为本发明实施例提供的标注后的小型断路器图像；

图9为本发明实施例提供的二维码标中回字型方块注后的图像；

图10为本发明实施例提供的模型训练方法的一流程示意图；

图11为本发明实施例提供的模型训练方法的另一流程示意图；

图12为本发明实施例提供的二维码检测装置的示意性框图；

图13为本发明实施例提供的模型训练装置的示意性框图；

图14为本发明实施例提供的电子设备的示意性框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解，在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

请参阅图1，系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用，例如网页浏览器应用、搜索类应用、即时通信工具等。

终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器，例如对终端设备101、102、103上显示的页面提供支持的后台服务器。

需要说明的是，本申请实施例所提供的二维码检测方法可以部署于CPU端或移动端等无GPU加速的终端，其中，CPU端或移动端等无GPU加速的终端可以为本实施例中提及的终端设备101、102、103执行，相应地，二维码检测装置一般配置于终端设备101、102、103中。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

请参阅图2，图2示出了二维码检测方法的具体实施方式。

需注意的是，若有实质上相同的结果，本发明的方法并不以图2所示的流程顺序为限，该方法包括如下步骤：

如图2所示，该方法包括以下步骤S110～S140。

S110、根据预置的第一检测定位模型获取待检测图像的二维码区域；

S120、根据预置的第二检测定位模型获取所述待检测图像中二维码的回字型方块区域；

S130、将所述回字型方块区域输入至预置的第一分类模型中，得到所述二维码中回字型方块的第一分类结果；

S140、获取所述二维码的非回字型方块区域，并将所述非回字型方块区域输入至预置的第二分类模型中，得到所述二维码中非回字型方块的第二分类结果。

其中，第一分类结果为回字型方块是否有缺陷的数据信息，第二分类结果为二维码上非回字型方块区域是否有缺陷的数据信息，第一检测定位模型主要用于对待检测图像的二维码进行定位检测以获取待检测图像的二维码区域，第二检测定位模型主要用于对二维码的回字型方块进行定位检测以获取二维码中的回字型方块区域，第一分类模型主要用于对二维码的回字型方块进行分类以判定回字型方块是否有缺陷，第二分类模型主要用于对二维码中回字型方块以外的区域进行分类以判定二维码非回字型方块以外的区域是否有缺陷。

具体的，第一检测定位模型、第二检测定位模型、第一分类模型、第二分类模型在本实施例中可以均为轻量级模型，且均可以部署于CPU端或移动端等无GPU加速的终端，以实现对图像中的二维码进行质量检测。

可以理解，第一检测定位模型、第二检测定位模型可以选择NanoDet-Plus、YOLOv5-n、YOLOX-Nano等轻量级的模型，第一分类模型、第二分类模型可以选择ShuffleNetV2、MobileNetV3、Efficientnet-lite等轻量级的图像分类模型，其具体选择可根据实际应用进行选择，本实施例中不做具体限定。

在本发明实施例所提供的二维码检测方法中，待检测图像可以为小型断路器图像，待检测图像在第一检测定位模型中进行定位检测后，可以通过第二检测定位模型从二维码区域获取出二维码的回字型方块区域，最后通过第一分类模型、第二分类模型分别对二维码的回字型方块区域和非回字型方块区域进行分类以确定待检测图像的二维码是否有缺陷，进而避免了无法对二维码上轻微缺陷不易区分的技术问题，极大的提高了二维码检测的精度和效率。

在本发明实施例所提供的二维码检测方法中，第一检测定位模型、第二检测定位模型可以均采用NanoDet-Plus轻量级的模型，第一分类模型、第二分类模型以及第三分类模型可以均采用ShuffleNetV2轻量级的图像分类模型。其中，NanoDet-Plus包括Backbone网络、PAFPN网络以及Prediction网络三部分，其中Backbone网络主要用于进行特征提取，PAFPN网络主要用于特征融合，Prediction网络主要用于定位预测。其中，Prediction网络中采用了5×5深度可分离卷积，进而能够在增加较少的参数量的情况下提升检测器的感受野并提升性能。

具体的，深度可分离卷积过程分为两步：逐通道卷积(Depthwise Convolution)和逐点卷积(Pointwise Convolution)，在逐通道卷积过程中一个卷积核负责一个通道，一个通道只能被一个卷积核进行卷积，逐点卷积可以为有效的利用不同通道在相同空间位置上的特征信息，其卷积核的尺寸为1×1×M，M为上一层的通道数，此时的卷积运算会将上一步的map在深度方向上进行加权组合，以生成新的特征图。同时，在采用ShuffleNetV2轻量级的图像分类模型进行图像分类时，基于轻量化的设计原则，需保证输入输出通道数相同、组卷积改为普通卷积，同时将残差模块的“Add”操作改为“Concat”以提升模型的速度。

在本实施例中，待检测图像经过Backbone网络、PAFPN网络后，可以生成H×W×96的特征图，并在Prediction网络中经过两次深度可分离卷积，得到的特征维度不变的特征图，并经过1×1的卷积核进行卷积，生成H×W×(R+C)的特征图，其中，R表示单个定位框的对角点坐标，C表示需要预测的类别数，最后将H×W×(R+C)的特征图进行拆分成两个分支，一个分支经过sigmoid激活函数、维度的转置、展平等操作以得到(H×W)×C个类别得分，另一个分支经过维度的转置、展平等操作以得到H×W×R个坐标。

在其他发明实施例中，如图3所示，步骤S110包括步骤S111和S112。

S111、生成所述待检测图像的特征金字塔；

S112、根据所述特征金字塔的特征预测所述待检测图像的二维码区域。

具体的，特征金字塔由待检测图像进行多次特征提取而形成的不同尺寸的特征图，每一层的特征图包括不同分辨率、不同语义强度的特征进而可以实现对二维码以及与二维码相邻字符的精准定位检测。

在其他发明实施例中，如图4所示，步骤S111包括子步骤S1111、S1112和S1113。

S1111、对所述待检测图像进行特征提取，得到所述待检测图像的多层第一特征图；

S1112、根据第一特征融合模块对所述多层第一特征图进行特征融合，得到多层第二特征图；

S1113、根据第二特征融合模块对所述多层第二特征图进行特征融合，得到所述特征金字塔。

具体的，待检测图像经过Backbone网络进行特征提取后，可在PAFPN网络中采用Ghost-PAN结构对特征图进行处理，即Ghost-PAN结构使用了GhostNet中的GhostBlock(冗余模块)作为处理多层之间特征融合的模块，其基本结构单元可以由一组1x1卷积和3x3的Depthwise卷积组成，进而可以极大的减少参数量和计算量。

在本实施例中，如图5所示，待检测图像为小型断路器图像，待检测图像进行特征提取以得到多层第二特征图后，自上而下将更抽象、语义更强的高层特征图进行上采样，同时将该特征横向连接至前一层特征，并通过一个GhostBlock进行特征融合以得到多层第二特征图，并自下而上将最底层特征进行下采样，同时将特征横向连接至前一层特征，并通过一个GhostBlock进行特征融合以得到特征金字塔，进而提高Prediction网络的定位检测的精度。

在其他发明实施例中，如图6所示，步骤S120之前，还包括步骤S120a和S120b。

S120a、根据所述第一检测定位模型获取所述待检测图像中与所述二维码相邻的字符区域；

S120b、将所述字符区域输入至预置的第三分类模型中，得到所述待检测图像中与所述二维码相邻字符的第三分类结果。

在本实施例中，第一检测定位模型还用于对待检测图像中与二维码相邻的字符进行定位检测，以获取待检测图像的二维码区域，第三分类结果为与二维码相邻的字符是否有缺陷的数据信息，第三分类模型主要用于对待检测图像中与二维码相邻的字符的分类以判定该字符是否有缺陷。

可以理解，第三分类模型可以选择ShuffleNetV2、MobileNetV3、Efficientnet-lite等轻量级的图像分类模型，其具体选择可根据实际应用进行选择，本实施例中不做具体限定。

本发明实施例还提供一种模型训练方法，该方法可以由图1中的终端设备101、102、103执行，并通过服务器105部署至其他终端设备中，以便于其他终端设备执行二维码检测方法，同时也可以由服务器105执行，并通过服务器105部署至其他终端设备中，以便于其他终端设备执行二维码检测方法。

如图7所示，该方法包括以下步骤S210～S240。

S210、获取采集到的样本图像集；

S220、对所述样本图像集中每张样本图像进行标注，得到标注后的样本图像集；

S230、将所述标注后的样本图像集进行前处理，得到第一训练集和验证集；

S240、根据所述第一训练集、所述验证集对二维码图像的检测网络进行训练，其中所述检测网络包括第一检测定位模型、第二检测定位模型、第一分类模型以及第二分类模型；所述第一检测定位模型的检测定位类别包括图像的二维码，所述第二检测定位模型的检测类别包括所述二维码的回字型方块，所述第一分类模型的分类类别包括所述回字型方块，所述第二分类模型的分类类别包括所述二维码中非回字型方块。

在本实施例中，检测网络包括第一检测定位模型、第二检测定位模型、第一分类模型以及第二分类模型，第一检测定位模型、第二检测定位模型均采用NanoDet-Plus轻量级的检测定位模型，第一分类模型、第二分类模型均采用ShuffleNetV2轻量级的图像分类模型。第一检测定位模型、第二检测定位模型在进行训练过程中增加了辅助模块(AssignGuidance Module，AGM)，同时配合动态的软标签分配策略(Dynamic Soft LabelAssigner，DSLA)以解决轻量级模型中的最优标签匹配问题。其中，辅助模块可以由4个3x3的卷积核组成，并使用群组归一化(Group Normalization，GN)作为Normalize层，并在不同尺度的特征图之间共享参数，辅助模块在对第一分类模型、第二分类模型进行训练的过程中所消耗的训练资源较少，同时第一分类模型、第二分类模型完成后，可以直接去掉辅助模块。

具体的，第一检测定位模型、第二检测定位模型采用NanoDet-Plus轻量级的检测定位模型时，其损失函数(Generalized Focal Loss，GFL)可以为：

其中，y_l，y_r表示模型具有的二值标签(y_l<y_r)，y表示真实标签，P_yl和P_yr表示网络对这两个标签的预测概率值，P_yl≥0，P_yr≥0，P_yl+P_yr＝1。

第一分类模型、第二分类模型采用ShuffleNetV2轻量级的图像分类模型时，其损失函数(Focal Loss，FL)可以为：

FL(p_t)＝-α_t(1-p_t)^γlog(p_t)

其中，α_t表示控制类别平衡参数，γ表示控制难易样本平衡参数，p_t表示预测的概率值。

另外，当涉及到待检测图像中还存在与二维码相邻的字符时，检测网络还需包括第三分类模型，此时第一检测定位模型的检测定位类别还包括与二维码相邻的字符，第三分类模型用于对与二维码相邻的字符的分类。其中，第三分类模型可以采用ShuffleNetV2轻量级的图像分类模型。

在本实施例中，样本图像集为小型断路器图像集，每张小型断路器图像均存在二维码以及与二维码相邻的字符，同时图像集中包括无缺陷图片(OK)和有缺陷图片(NG)。由于每张小型断路器图像均存在二维码以及与二维码相邻的字符，因此需要对本实施例中二维码、与二维码相邻字符以及二维码上的回字型方块进行检测定位，故需要在样本图像以及二维码上进行标注。

具体的，本发明实施例可以采用Labelimg标注工具以绘制矩形框的方式来表征二维码及其相邻字符位置，并对标注的矩形框进行命名，标注完成后可自动生成XML格式的标注文件，XML文件中包括图像名称、标注的物体的标签名以及标注矩形框的左右端点信息。同时，样本图像中二维码及其相邻字符标注完成后，需基于样本图像以及其XML文件中的二维码名称和标注的矩形框坐标信息，切分出二维码图像，并可再次利用Labelimg标注工具L以绘制矩形框的方式来表征二维码角上存在的回字型方块，最终标注后的二维码、与二维码相邻字符以及二维码上的回字型方块可参阅图8和图9。

另外，在对各模型进行训练前，样本图像集可以直接从产线进行收集，并可在Labelimg标注工具中标注样本图像中的二维码和字符，其标注名可以分别为Qrcode和Character，同时将样本图像中的二维码分割出来，并在二维码上标注回字型方块，其标注名可为Square，标注完成后可自动生成XML格式的标注文件，进而便完成了样本图像集的标注。

可以理解，本实施例提及的标注工具并不仅仅局限于Labelimg标注工具，本发明还可以采用Labelme、VOTT等标注工具进行替换。

具体的，样本图像集标注完成后，便可以利用标注后的样本图像集中的标注文件在标注好的样本图像上分割出与二维码相邻的字符，同时在二维码上将回字型方块与非回字型方块分割开来，并可以分层按8：2的比例将标注后的样本图像集划分为第一训练集和验证集，最后可以利用数据前处理脚本整合至两个预设格式的文件中，两个预设格式的文件可以为json文件，其包括train.json文件和validate.json文件。

另外，第一训练集、验证集在训练第一检测定位模型、第二检测定位模型、第一分类模型、第二分类模型前，需统一缩放至一定尺寸，并向前传播。

在其他发明实施例中，如图10所示，步骤S240包括步骤S241、S242和S243。

S241、根据所述第一训练集对所述第一检测定位模型、所述第二检测定位模型、所述第一分类模型、所述第二分类模型进行迭代训练，并基于遗传算法优化各个模型的超参数，直至各个模型收敛；

S242、根据所述验证集对各个模型进行测试，并根据测试结果以及所述第一训练集生成第二训练集；

S243、根据所述第二训练集对各个模型进行迭代训练，直至各个模型收敛。

在本实施例中，第一训练集输入至第一检测定位模型、第二检测定位模型、第一分类模型、第二分类模型以及第三分类模型中后，向前传播，预测出二维码以及二维码中回字型方块的位置信息后，便可以利用损失函数，并结合预测出的位置信息以及标注信息进行损失值得计算，同时计算准确率，再基于优化器(如Adam)将权重参数沿梯度方向进行微小得更新，重复正向传播和反向传播过程，并进行反复迭代，直至获取最小损失值或最高准确率下最优权重。

其中，由于各模型训练中设计了大量可变的超参数，超参数的参数值的不同会对损失值、准确率、召回率等由重要的影响，因此第一训练集在对各模型进行迭代训练的过程中，需筛选出对各模型具有影响的关键超参数，例如可以以准确率为目标对模型进行训练，以得到一组最优的超参数。其中，超参数的筛选优化可以采用手动调整策略、网格搜索策略、随机搜索策略、贝叶斯优化算法以及遗传算法等方式进行，本实施例中优选遗传算法优化各个模型的超参数。

具体的，第一训练集对各模型进行迭代训练后，可以基于获得的最优权重和验证集对各模型进行测试，并将测试过程中的异常样本(定位错误或类别错误等样本)添加至第一训练集中，以形成第二训练集，然后通过第二训练集对各模型再次进行迭代训练。其中，第二训练集对各模型进行迭代训练过程中，无需再次对各模型的超参数进行优化。

在其他发明实施例中，如图11所示，步骤S240之后，还包括步骤S250和S260。

S250、基于预设的部署框架，将训练后的各个模型进行格式转换，得到格式转换后的各个模型；

S260、结合格式转换后的各个模型编写检测分类的前向推理脚本，并对所述前向推理脚本进行封装。

具体的，各模型训练完成后，还需将各模型部署至终端中以便于终端执行小型断路器图像的检测分类。本实施例在对各模型进行终端部署时，先基将训练完成后的各模型进行格式转换，以使得各模型的格式符合预设的部署框架所规定的格式，进而便可以根据格式转换后的各模型编写检测分类的前向推理脚本，以将各模型进行打包封装。

其中，部署框架可以为NCNN、Caffe、Libtorch、OpenVINO等部署框架，本实施例所采用的部署框架优选NCNN，该框架可以实现无第三方依赖，跨平台操作，在手机端CPU运算速度在开源框架中处于领先水平。当部署框架为NCNN，各模型需先转换成ONNX格式的模型，然后由ONNX格式的模型转换为NCNN框架需要的模型文件，该模型文件可以为Bin文件和Param文件。

在本实施例中，各模型在进行部署时，可以依赖CPU部署于Windows系统所在的前端中，如可以在Visual Studio开发工具(例如Visual Studio 2019)中，新建C++工程项目，配置NCNN库、OPENCV视觉库，调用格式转换后的各模型以编写前向推理脚本，进而便可以对前向推理脚本进行封装成DLL文件以供前端进行调用。

另外，各模型在进行部署时，还可以不依赖CUP部署于移动终端设备中，如可以在Android studio开发工具里配置加载NCNN和OPENCV库文件，编写前向推理脚本，并编写接口文件调用前向推理所需的代码，再通过Java调用接口文件提供的接口以供移动终端进行调用。

本发明实施例还提供了一种二维码检测装置，该装置用于执行前述二维码检测方法的任一实施例。

具体地，请参阅图12，图12是本发明实施例提供的二维码检测装置的示意性框图。

如图12所示，所述的二维码检测装置，该装置包括：第一获取单元110、第二获取单元120、第一输入单元130、第二输入单元140。

第一获取单元110，用于根据预置的第一检测定位模型获取待检测图像的二维码区域；

第二获取单元120，用于根据预置的第二检测定位模型获取所述待检测图像中二维码的回字型方块区域；

第一输入单元130，用于将所述回字型方块区域输入至预置的第一分类模型中，得到所述二维码中回字型方块的第一分类结果；

第二输入单元140，用于获取所述二维码的非回字型方块区域，并将所述非回字型方块区域输入至预置的第二分类模型中，得到所述二维码中非回字型方块的第二分类结果。

在其他发明实施例中，第一获取单元110包括：生成单元和预测单元。

生成单元，用于生成所述待检测图像的特征金字塔；预测单元，用于根据所述特征金字塔的特征预测所述待检测图像的二维码区域。

在其他发明实施例中，生成单元包括：特征提取单元、第一特征融合单元和第二特征融合单元。

特征提取单元，用于对所述待检测图像进行特征提取，得到所述待检测图像的多层第一特征图；第一特征融合单元，用于根据第一特征融合模块对所述多层第一特征图进行特征融合，得到多层第二特征图；第二特征融合单元，用于根据第二特征融合模块对所述多层第二特征图进行特征融合，得到所述特征金字塔。

在其他发明实施例中，二维码检测装置还包括：第四获取单元和第三输入单元。

第四获取单元，用于根据所述第一检测定位模型获取所述待检测图像中与所述二维码相邻的字符区域；

第三输入单元，用于将所述字符区域输入至预置的第三分类模型中，得到所述待检测图像中与所述二维码相邻字符的第三分类结果。

本发明实施例所提供的二维码检测装置用于执行上述根据预置的第一检测定位模型获取待检测图像的二维码区域；根据预置的第二检测定位模型获取所述待检测图像中二维码的回字型方块区域；将所述回字型方块区域输入至预置的第一分类模型中，得到所述二维码中回字型方块的第一分类结果；获取所述二维码的非回字型方块区域，并将所述非回字型方块区域输入至预置的第二分类模型中，得到所述二维码中非回字型方块的第二分类结果。

需要说明的是，所属领域的技术人员可以清楚地了解到，上述二维码检测装置和各单元的具体实现过程，可以参考前述方法实施例中的相应描述，为了描述的方便和简洁，在此不再赘述。

本发明实施例还提供了一种模型训练装置，该装置用于执行前述二维码检测方法的任一实施例。

具体地，请参阅图13，图13是本发明实施例提供的模型训练装置的示意性框图。

如图13所示，模型训练装置包括：第三获取单元210、标注单元220、前处理单元230、训练单元240。

第三获取单元210，用于获取采集到的样本图像集；

标注单元220，用于对所述样本图像集中每张样本图像进行标注，得到标注后的样本图像集；

前处理单元230，用于将所述标注后的样本图像集进行前处理，得到第一训练集和验证集；

训练单元240，用于根据所述第一训练集、所述验证集对二维码图像的检测网络进行训练，其中所述检测网络包括第一检测定位模型、第二检测定位模型、第一分类模型以及第二分类模型；所述第一检测定位模型的检测定位类别包括二维码区域，所述第二检测定位模型的检测类别包括所述二维码的回字型方块区域，所述第一分类模型的分类类别包括所述回字型方块区域，所述第二分类模型的分类类别包括所述二维码中非回字型方块区域。

在其他发明实施例中，训练单元240包括：第一迭代训练单元、测试单元和第二迭代训练单元。

第一迭代训练单元，用于根据所述第一训练集对所述第一检测定位模型、所述第二检测定位模型、所述第一分类模型以及所述第二分类模型进行迭代训练，并基于遗传算法优化各个模型的超参数，直至各个模型收敛；测试单元，用于根据所述验证集对各个模型进行测试，并根据测试结果以及所述第一训练集生成第二训练集；第二迭代训练单元，用于根据所述第二训练集对各个模型进行迭代训练，直至各个模型收敛。

在其他发明实施例中，模型训练装置还包括：格式转换单元和封装单元。

格式转换单元，用于基于预设的部署框架，将训练后的各个模型进行格式转换，得到格式转换后的各个模型。

封装单元，用于结合格式转换后的各个模型编写检测分类的前向推理脚本，并对所述前向推理脚本进行封装。

本发明实施例所提供的模型训练装置用于执行上述获取采集到的样本图像集；对所述样本图像集中每张样本图像进行标注，得到标注后的样本图像集；将所述标注后的样本图像集进行前处理，得到第一训练集和验证集；根据所述第一训练集、所述验证集对二维码图像的检测网络进行训练，其中所述检测网络包括第一检测定位模型、第二检测定位模型、第一分类模型以及第二分类模型；所述第一检测定位模型的检测定位类别包括图像的二维码，所述第二检测定位模型的检测类别包括所述二维码的回字型方块，所述第一分类模型的分类类别包括所述回字型方块，所述第二分类模型的分类类别包括所述二维码中非回字型方块。

需要说明的是，所属领域的技术人员可以清楚地了解到，上述模型训练装置和各单元的具体实现过程，可以参考前述方法实施例中的相应描述，为了描述的方便和简洁，在此不再赘述。

上述二维码检测装置或模型训练装置可以实现为一种计算机程序的形式，该计算机程序可以在如图14所示的电子设备上运行。

请参阅图14，图14是本发明实施例提供的电子设备的示意性框图。

参阅图14，该设备500包括通过系统总线501连接的处理器502、存储器和网络接口505，其中，存储器可以包括存储介质503和内存储器504。

该存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时，可使得处理器502执行二维码检测方法或模型训练方法。

该处理器502用于提供计算和控制能力，支撑整个设备500的运行。

该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境，该计算机程序5032被处理器502执行时，可使得处理器502执行二维码检测方法或模型训练方法。

该网络接口505用于进行网络通信，如提供数据信息的传输等。本领域技术人员可以理解，图14中示出的结构，仅仅是与本发明方案相关的部分结构的框图，并不构成对本发明方案所应用于其上的设备500的限定，具体的设备500可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

其中，所述处理器502用于运行存储在存储器中的计算机程序5032，以实现如下功能：根据预置的第一检测定位模型获取待检测图像的二维码区域；根据预置的第二检测定位模型获取所述待检测图像中二维码的回字型方块区域；将所述回字型方块区域输入至预置的第一分类模型中，得到所述二维码中回字型方块的第一分类结果；获取所述二维码的非回字型方块区域，并将所述非回字型方块区域输入至预置的第二分类模型中，得到所述二维码中非回字型方块的第二分类结果。

其中，所述处理器502用于运行存储在存储器中的计算机程序5032，以实现如下功能：获取采集到的样本图像集；对所述样本图像集中每张样本图像进行标注，得到标注后的样本图像集；将所述标注后的样本图像集进行前处理，得到第一训练集和验证集；根据所述第一训练集、所述验证集对二维码图像的检测网络进行训练，其中所述检测网络包括第一检测定位模型、第二检测定位模型、第一分类模型以及第二分类模型；所述第一检测定位模型的检测定位类别包括图像的二维码，所述第二检测定位模型的检测类别包括所述二维码的回字型方块，所述第一分类模型的分类类别包括所述回字型方块，所述第二分类模型的分类类别包括所述二维码中非回字型方块。

本领域技术人员可以理解，图14中示出的设备500的实施例并不构成对设备500具体构成的限定，在其他实施例中，设备500可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。例如，在一些实施例中，设备500可以仅包括存储器及处理器502，在这样的实施例中，存储器及处理器502的结构及功能与图14所示实施例一致，在此不再赘述。

应当理解，在本发明实施例中，处理器502可以是中央处理单元(CentralProcessing Unit，CPU)，该处理器502还可以是其他通用处理器502、数字信号处理器502(Digital Signal Processor，DSP)、专用集成电路(Application Specific IntegratedCircuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器502可以是微处理器502或者该处理器502也可以是任何常规的处理器502等。

在本发明的另一实施例中提供计算机存储介质。该存储介质可以为非易失性的计算机可读存储介质，也可以是易失性的存储介质。该存储介质存储有计算机程序5032，其中计算机程序5032被处理器502执行时实现以下步骤：根据预置的第一检测定位模型获取待检测图像的二维码区域；根据预置的第二检测定位模型获取所述待检测图像中二维码的回字型方块区域；将所述回字型方块区域输入至预置的第一分类模型中，得到所述二维码中回字型方块的第一分类结果；获取所述二维码的非回字型方块区域，并将所述非回字型方块区域输入至预置的第二分类模型中，得到所述二维码中非回字型方块的第二分类结果。

同时，该存储介质存储有计算机程序5032，其中计算机程序5032被处理器502执行时还可以实现以下步骤：获取采集到的样本图像集；对所述样本图像集中每张样本图像进行标注，得到标注后的样本图像集；将所述标注后的样本图像集进行前处理，得到第一训练集和验证集；根据所述第一训练集、所述验证集对二维码图像的检测网络进行训练，其中所述检测网络包括第一检测定位模型、第二检测定位模型、第一分类模型以及第二分类模型；所述第一检测定位模型的检测定位类别包括图像的二维码，所述第二检测定位模型的检测类别包括所述二维码的回字型方块，所述第一分类模型的分类类别包括所述回字型方块，所述第二分类模型的分类类别包括所述二维码中非回字型方块。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的设备、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本发明所提供的几个实施例中，应该理解到，所揭露的设备、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为逻辑功能划分，实际实现时可以有另外的划分方式，也可以将具有相同功能的单元集合成一个单元，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接，也可以是电的，机械的或其它的形式连接。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台设备500(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种二维码检测方法，其特征在于，包括：

2.根据权利要求1所述的二维码检测方法，其特征在于，所述根据预置的第一检测定位模型获取待检测图像的二维码区域，包括：

生成所述待检测图像的特征金字塔；

根据所述特征金字塔的特征预测所述待检测图像的二维码区域。

3.根据权利要求2所述的二维码检测方法，其特征在于，所述生成所述待检测图像的特征金字塔，包括：

对所述待检测图像进行特征提取，得到所述待检测图像的多层第一特征图；

根据第一特征融合模块对所述多层第一特征图进行特征融合，得到多层第二特征图；

根据第二特征融合模块对所述多层第二特征图进行特征融合，得到所述特征金字塔。

4.根据权利要求1所述的二维码检测方法，其特征在于，在所述根据预置的第二检测定位模型获取所述待检测图像中二维码的回字型方块区域之前，还包括：

根据所述第一检测定位模型获取所述待检测图像中与所述二维码相邻的字符区域；

将所述字符区域输入至预置的第三分类模型中，得到所述待检测图像中与所述二维码相邻字符的第三分类结果。

5.一种模型训练方法，其特征在于，包括：

获取采集到的样本图像集；

6.根据权利要求5所述的模型训练方法，其特征在于，所述根据所述第一训练集、所述验证集对二维码图像的检测网络进行训练，包括：

根据所述第一训练集对所述第一检测定位模型、所述第二检测定位模型、所述第一分类模型以及所述第二分类模型进行迭代训练，并基于遗传算法优化各个模型的超参数，直至各个模型收敛；

根据所述验证集对各个模型进行测试，并根据测试结果以及所述第一训练集生成第二训练集；

根据所述第二训练集对各个模型进行迭代训练，直至各个模型收敛。

7.根据权利要求5所述的模型训练方法，其特征在于，在所述根据所述第一训练集、所述验证集训练第一检测定位模型、第二检测定位模型、第一分类模型以及第二分类模型之后，还包括：

基于预设的部署框架，将训练后的各个模型进行格式转换，得到格式转换后的各个模型；

结合格式转换后的各个模型编写检测分类的前向推理脚本，并对所述前向推理脚本进行封装。

8.根据权利要求5所述的模型训练方法，其特征在于，所述检测网络还包括第三分类模型，所述第一检测定位模型的检测定位类别还包括与所述二维码相邻的字符区域，所述第三分类模型的分类类别包括所述字符区域。

9.一种二维码检测装置，其特征在于，包括：

10.一种模型训练装置，其特征在于，包括：

第三获取单元，用于获取采集到的样本图像集；

训练单元，用于根据所述第一训练集、所述验证集对二维码图像的检测网络进行训练，其中所述检测网络包括第一检测定位模型、第二检测定位模型、第一分类模型以及第二分类模型；所述第一检测定位模型的检测定位类别包括二维码区域，所述第二检测定位模型的检测类别包括所述二维码的回字型方块区域，所述第一分类模型的分类类别包括所述回字型方块区域，所述第二分类模型的分类类别包括所述二维码中非回字型方块区域。

11.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至4中任一项所述的二维码检测方法或如权利要求5至8中任一项所述的模型训练方法。

12.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至4中任一项所述的二维码检测方法或如权利要求5至8中任一项所述的模型训练方法。