CN110942144B

CN110942144B - 集自动化训练、校验、重构于一体的神经网络构建方法

Info

Publication number: CN110942144B
Application number: CN201911238062.5A
Authority: CN
Inventors: 常一志; 安磊; 吴伟刚
Original assignee: Niu Niu Tu Technology Co ltd
Current assignee: Niu Niu Tu Technology Co ltd
Priority date: 2019-12-05
Filing date: 2019-12-05
Publication date: 2023-05-02
Anticipated expiration: 2039-12-05
Also published as: CN110942144A

Abstract

本发明公开一种集自动化训练、校验、重构于一体的神经网络构建方法，先采用训练数据集对网络模型进行训练，学习并提取特征图的高级特征，再用训练数据集校验网络模型的预测、分类精度和检测速度，并在学习训练和校验过程中重构网络模型，对传统神经网络算法参数进行优化，建立了一套集自动化训练、检验、重构于一体的神经网络构建方法，根据神经网络的测试效果来实时自动调整、重构下一个网络模型，直至最后筛选出最佳网络模型；特征提取图上每个网格根据网络校验效果来最终确定采用的回归预测匹配框集，避免了传统网络中因匹配框集合过大影响检测速度，或匹配框集合太小导致特征提取图未能被全面覆盖，有效提高预测的准确率和速度。

Description

集自动化训练、校验、重构于一体的神经网络构建方法

技术领域

本发明涉及计算机技术领域，特别涉及一种集自动化训练、校验、重构于一体的神经网络构建方法。

背景技术

条码技术已被广泛应用于各种技术领域，通过激光打印赋予产品唯一编码，大大方便了各种产品的流通、追溯。扫码时，通过抓取条码上的定位特征识别和读取条码，由于条码使用广泛，其应用场景也复杂多变，在转运产品的过程中经常会致使条码出现扭曲、污损、刮花等情况，弱化条码识别特征，导致条码不能被识别；另外，因扫码环境的特殊性，反光、光线暗淡等情况均会影响条码的识别准确率和识别速度。随着神经网络技术的发展，人们已经将神经网络应用于条码扫描识别技术领域，现有技术中，神经网络对图片的处理、识别速度较低，受神经网络自身结构特性限制，不能满足工业级的实时性要求。

发明内容

本发明提出一种集自动化训练、校验、重构于一体的神经网络构建方法，旨在通过优化神经网络构建方法，快速、高效地筛选出最佳网络模型。

为实现上述目的，本发明提出的应用于条码识别系统的神经网络重构方法，包括如下步骤：

步骤S1：在神经网络识别定位系统中输入初始网络模型的特征提取网络和位置类别检测网络；按照训练配置批量读取训练数据集数据，开始训练；

步骤S2：神经网络识别定位系统自动评估初始网络模型的性能，判断其loss是否过高并欠拟合，是则执行步骤S3，否则执行步骤S4；

步骤S3：增加特征提取网络的网络层数、滤波器个数或网络模型输入图像尺寸来优化重构网络模型，并用优化重构网络模型继续进行训练；

步骤S4：将网络模型继续用测试数据集进行校验，其中，通过改变特征提取网络的网络层数、滤波器个数或网络模型输入图像尺寸来优化重构网络模型，用优化重构网络模型继续进行训练，使优化重构网络模型的漏检率和检测精度均优于模型库中上一个存储网络模型，并保存当前优化重构的网络模型于模型库中；

步骤S5：取所述模型库中储存的效果优化的若干优化重构网络模型，对每一优化重构网络模型取不同的匹配框集继续训练，选取检测精度和召回率最高的网络模型作为最优网络模型。

优选地，在执行步骤S4之前，还需判断当前网络模型是否过拟合，是则减少当前网络模型的网络层数、滤波器个数、加入batchnormal层，并用优化重构网络模型继续进行训练。

优选地，所述步骤S4中，采用测试数据集对网络模型进行校验时，其具体执行为：

检测网络模型的检测速度和检测精度，并将其与神经网络识别定位系统中上一个存储网络模型的检测速度和检测精度进行对比；

当其检测精度低于所述存储网络模型时，增大模型输入图像尺寸、增加网络层数、滤波器个数，并用优化重构网络模型继续进行训练；

当其检测精度高于所述存储网络模型时，减小模型输入图像尺寸、增加网络层数、滤波器个数，并用优化重构网络模型继续进行训练；

当其检测精度达到预设标准，并且，其检测速度高于或低于所述存储网络模型时，减少初始网络模型的网络层数、滤波器个数或减小模型输入图像尺寸来优化重构网络模型，并用优化重构网络模型继续进行训练；

优选地，在将当前优化重构的网络模型与模型库中存储的网络模型进行对比时，当其检测速度高于所述存储网络模型，或其检测精度高于所述存储网络模型时，还分别将之前优化重构的网络模型配置(即网络结构)及其训练好的权重参数存储于所述模型库中。

优选地，所述步骤S5中，在对优化重构网络模型取不同的匹配框集时，其匹配框集的选择原则如下：第一次选择全集，匹配框全部入选；以后每次减掉一个占比最低的尺寸框，直到优化重构网络模型的检测精度或召回率低于上个所述存储网络模型。

优选地，步骤S5中，在第一次选择全集时，是选择10个匹配框。

优选地，所述初始网络模型的特征提取网络和位置类别检测网络的结构如下：

序号

类型

滤波器

尺寸

输入

输出

激活函数

1

卷积层

16

3x3/1

352×352×1

352×352×16

ReLU

2

池化层

2x2/2

352×352×16

176×176×16

ReLU

3

卷积层

32

3x3/1

176×176×16

176×176×32

ReLU

4

池化层

2x2/2

176×176×32

88×88×32

ReLU

5

卷积层

32

3x3/1

88×88×32

ReLU

6

池化层

2x2/2

88×88×32

44×44×32

ReLU

7

卷积层

64

3x3/1

44×44×32

44×44×64

ReLU

8

池化层

2x2/2

44×44×64

22×22×64

ReLU

9

卷积层

128

3x3/1

22×22×64

22×22×128

ReLU

10

池化层

2x2/2

22×22×128

11×11×128

ReLU

11

卷积层

256

3x3/1

11×11×128

11×11×256

ReLU

12

卷积层

35

1x1/1

11×11×256

11×11×35

Liner

优选地，所述优化重构网络模型的特征提取网络和位置类别检测网络的结构如下：

序号

类型

滤波器

尺寸

输入

输出

激活函数

1

卷积层

16

3x3/1

288×288×1

288×288×16

ReLU

2

池化层

2x2/2

288×288×16

144×144×16

ReLU

3

卷积层

32

3x3/1

144×144×16

144×144×32

ReLU

4

池化层

2x2/2

144×144×32

72×72×32

ReLU

5

卷积层

32

3x3/1

72×72×32

ReLU

6

池化层

2x2/2

72×72×32

36×36×32

ReLU

7

卷积层

64

3x3/1

36×36×32

36×36×64

ReLU

8

池化层

2x2/2

36×36×64

18×18×64

ReLU

9

卷积层

128

3x3/1

18×18×64

18×18×128

ReLU

10

池化层

2x2/2

18×18×128

9×9×128

ReLU

11

卷积层

256

3x3/1

9×9×128

9×9×256

ReLU

12

卷积层

35

1x1/1

9×9×256

9×9×35

Liner

优选地，所述训练配置包括一训练和校验图片集，所述训练和校验图片集包含若干数据集，各数据集顺序随机打乱，并按8：2分为训练数据集和测试数据集

优选地，所述训练数据集为包含40000张图片的训练数据集，所述测试数据集为包含10000张图片的测试数据集。

优选地，在对初始网络模型和优化重构网络模型进行训练时，是采用小批量梯度下降法设置神经网络的训练参数时，其中，是将训练参数的批量值设置为64，动量配置为0.9，权值设置为0.0005，训练最大迭代次数为160000，初始学习率设置为0.001，使在迭代次数为120000和130000时分别衰减为原来的10％。

与现有技术相比，本发明的有益效果是：

(1)建立了一套集自动化训练、检验、重构于一体的神经网络构建方法，根据神经网络的测试效果来实时自动调整、重构下一个网络模型，直至最后筛选出最佳网络模型。

(2)特征提取图上每个网格根据网络校验效果来最终确定采用的回归预测匹配框集，避免了传统网络中因匹配框集合过大影响检测速度，或匹配框集合太小导致特征提取图未能被全面覆盖，影响检测的精度和召回率的问题，有效提高预测的准确率和速度。

(3)先采用训练数据集对网络模型进行训练，学习并提取特征图的高级特征，再用训练数据集校验网络模型的预测、分类精度和检测速度，并在学习训练和校验过程中重构网络模型，对传统神经网络算法参数进行优化，增强实时性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图示出的结构获得其他的附图。

图1为本发明高速维码定位识别系统示意图；

图2为本发明高速维码定位识别系统学习训练方法流程图；

图3为本发明学习训练模块构建神经网络的方法流程图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

本发明提出一种基于one-stage策略全卷积神经网络的高速维码定位识别系统，应用于一维码和二维码的定位识别，如图1所示，包括：

数据准备模块，用于准备训练和校验图片集；其中，数据准备模块准备训练和校验图片集，即采集大量各种场景下，不同光照、大小的包含一个或者多个一二维码的图片；并且，在采集后生成训练和校验数据集，即将训练和校验图片集中的每一张图片中的一二维码标记出来，生成一个对应的Label文件，记录此张图片中一二维码的位置和类别。

为使神经网络得到充分的训练，覆盖所有可能的场景，所述数据准备模块收集图片上的维码组合类型包括：单个一维码、单个二维码、多个一维码、多个二维码、单个一维码和多个二维码、多个一维码和单个二维码、多个一维码和多个二维码；图片场景组合涵盖：图片部分残缺、图片大小不同、图片光照不同、图片背景不同、图片拍摄角度不同。

数据增强模块，用于对所述训练和校验图片集进行增强处理，扩大其目前的数据集并扩展数据集覆盖的场景；其中，数据增强模块主要是对训练数据使用：图像旋转、图像扭曲、图像水平翻转，图像数据抖动(曝光、饱和度和色调等)，图像尺寸等图像增强技术对训练和校验集进行处理，扩大了目前的数据集并扩展了数据集覆盖的场景。提高了被训练的卷积神经网络的泛化能力和鲁棒性。

所述训练和校验图片集经过所述数据增强模块进行增强处理后，所述学习训练模块对其数据集顺序随机打乱，然后按8：2分为训练数据集和测试数据集。本实施例中数据准备模块收集5000张不同场景、带有不同种类维码组合的图片，数据增强模块对图片进行多次图像旋转、图像扭曲、图像水平翻转、图像数据抖动处理，拓展数据集中覆盖场景和数量。例如，将图片进行三次水平旋转、两次图像扭曲、两次水平翻转、三次图像数据抖动处理(例如：曝光、饱和度和调色处理)，将5000张图片采用数据增强技术10倍拓展至50000张图片，得到40000张图片的训练数据集和20000张图片的测试数据集。

一二维码检测定位识别模块，用于通过多层卷积网络充分提取各种输入的一二维码的特征，输出特征提取图，并在输出的特征提取图上回归预测输入的一二维码的位置和类别。

所述一二维码检测定位识别模块设置一特征提取网络和一位置类别检测网络；所述特征提取网络设置为多个卷积层和池化层的组合，每个卷积层包含多个卷积核滤波器用来提取输入的一二维码的特征并输出特征提取图；所述位置类别检测网络包括一卷积层，所述卷积层包含多个卷积核滤波器来对所述特征提取图的特征进行检测，并得到输入的一二维码的位置和类别。

本实施例中，所述特征提取网络设置为6个卷积层和5池化层的组合，每2个卷积层中间设置有1池化层，并且，每个池化层步长为2，实现图片的2倍下采样，进一步抽象一二码的高级特征，得到特征提取效果更全面的特征提取图。

如表1所示，为特征提取网络和位置类别检测网络的其中一结构设置，其中，前1-11项为特征提取网络结构，第12项为位置类别检测网络结构。

表1

序号

类型

滤波器

尺寸

输入

输出

激活函数

1

卷积层

16

3x3/1

352×352×1

352×352×16

ReLU

2

池化层

2x2/2

352×352×16

176×176×16

ReLU

3

卷积层

32

3x3/1

176×176×16

176×176×32

ReLU

4

池化层

2x2/2

176×176×32

88×88×32

ReLU

5

卷积层

32

3x3/1

88×88×32

ReLU

6

池化层

2x2/2

88×88×32

44×44×32

ReLU

7

卷积层

64

3x3/1

44×44×32

44×44×64

ReLU

8

池化层

2x2/2

44×44×64

22×22×64

ReLU

9

卷积层

128

3x3/1

22×22×64

22×22×128

ReLU

10

池化层

2x2/2

22×22×128

11×11×128

ReLU

11

卷积层

256

3x3/1

11×11×128

11×11×256

ReLU

12

卷积层

35

1x1/1

11×11×256

11×11×35

Liner

所述位置类别检测网络采用K-means算法预先对所述训练和校验图片集中的所有一二维码的尺度与宽高比例进行统计分析，得到最合适的n个匹配框，并且，在对所述特征提取图的特征进行检测时，对每一个输出特征都做n个匹配框的预测，从而预测得到输入的一二维码的位置和类别，其中n为自然数。由于特征提取图上每个网格都需做多次回归，若匹配框集合过大，会影响检测速度；若匹配框集合集合太小，特征提取图未能被全面覆盖，又会影响检测的精度和召回率。优选地，位置类别检测网络选取占比最高的10个匹配框构成预测候选集，在优化重构网络过程中再最终确定采用的匹配框子集。

学习训练模块，用于设置神经网络的训练参数和管理神经网络的自动化训练过程。

其中，本发明还提供了一种应用于高速维码定位识别系统的学习训练方法，如图2所示，在通过数据准备模块采集收集到的图片，通过数据增强模块进行图片增强处理并拓展，然后按8：2分为训练数据集和测试数据集，其中，将训练数据集输入学习训练模块进行学习训练，通过学习训练模块中存储的神经网络模型进行学习训练，并且，在学习训练后，评估学习训练所使用的神经网络模型的性能，判断其loss是否过高并欠拟合，如果是的话，则需要重新构建神经网络模型，构建的神经网络模型重新判断其loss是否过高并欠拟合，直至其判断为否；如果判断结果为否，则输入测试数据集，校验所使用的网络模型的性能，看其性能是否优于一个所使用的神经网络模型，是，则对该网络模型进行存储，如果否，则继续重新构建神经网络模型，直至其遍历全部训练过程后结束。其中，所述学习训练模块在进行学习训练时，是采用小批量梯度下降法来训练神经网络。具体地，所述学习训练模块在采用小批量梯度下降法训练神经网络时，设置训练参数的批量值为64，动量配置为0.9，权值设置为0.0005，训练最大迭代次数为160000，初始学习率设置为0.001，使在迭代次数为120000和130000时分别衰减为原来的10％。

并且，在上述应用于高速维码定位识别系统的学习训练方法的基础上，本发明还提供了一种集自动化训练、校验、重构于一体的神经网络构建方法，该方法应用于在学习训练后，评估学习训练所使用的神经网络模型的性能时，判断其loss是过高并欠拟合时，用于重新构建神经网络模型。

具体地，本神经网络构建方法执行步骤如下：

a.系统自动设置一初始网络模型，本实施例中按照表1中的方式设置网络模型的特征提取网络和位置类别检测网络。初始网络模型批量读取训练集中图片信息，开始训练。

训练过程中，神经网络识别定位系统自动评估当前神经网络性能，判断其loss是否过高并欠拟合；

若评估结果为是，则增加特征提取网络的网络层数、滤波器个数或网络模型输入图像尺寸来优化重构网络模型，并用优化重构网络模型继续进行训练；

若评估结果为否，则保留重构网络模型于模型库中，并将当前网络模型用测试数据集进行校验。

在采用测试数据集对网络模型进行校验之前，还需判断当前网络模型是否过拟合，本发明设置拟合门限为3％，即测试集的检测精度低于训练集的检测精度3％为过拟合。

若过拟合则减少所述初始网络模型的网络层数、滤波器个数、加入batchnormal层，并用优化重构网络模型继续进行训练。其中batchnormal层为神经网络的一种通用层，对神经网络的每一层输入数据x^(k)做归一化处理，用于防止过拟合。

归一化处理公式如下：

其中：

E[x^(k)]为输入数据均值；

sqrt(Var[x^(k)])为标准差。

b.采用测试数据集对网络模型进行校验时，其具体执行为：

在将当前优化重构的网络模型与模型库中存储的网络模型进行对比时，当其检测速度高于所述存储网络模型，或其检测精度高于所述存储网络模型时，还分别将前优化重构的网络模型配置(即网络结构)及其训练好的权重参数存储于所述模型库中。

c.取所述模型库中储存的效果较优的若干优化重构网络模型，对每一优化重构网络模型取不同的匹配框集继续训练，选取检测精度和召回率最高的网络模型作为最优网络模型。

如表2和表3所示，分别为训练过程中两种重构网络模型的特征提取网络和位置类别检测网络结构。

表2

序号

类型

滤波器

尺寸

输入

输出

激活函数

1

卷积层

16

3x3/1

224×224×1

224×224×16

ReLU

2

池化层

2x2/2

224×224×16

112×112×16

ReLU

3

卷积层

32

3x3/1

112×112×16

112×112×32

ReLU

4

池化层

2x2/2

112×112×32

56×56×32

ReLU

5

卷积层

32

3x3/1

56×56×32

ReLU

6

池化层

2x2/2

56×56×32

28×28×32

ReLU

7

卷积层

64

3x3/1

28×28×32

28×28×64

ReLU

8

池化层

2x2/2

28×28×64

14×14×64

ReLU

9

卷积层

128

3x3/1

14×14×64

14×14×128

ReLU

10

池化层

2x2/2

14×14×128

7×7×128

ReLU

11

卷积层

256

3x3/1

7×7×128

7×7×256

ReLU

12

卷积层

35

1x1/1

7×7×256

9×9×35

Liner

表3

如表4所示，模型I至模型Ⅴ分别为现有技术中YoloV3神经网络、Yolov3tiny神经网络、表1、表2和表3五种网络模型。

表4

根据表4中的检测效果判断，模型Ⅴ为最优网络模型，即在测试图片长宽分别为640和480、图片为灰度图的情况下，网络模型输入288×288×1(长×宽×通道数)的特征图，检测效果最优，即检测图片要先变为长、宽都为288的灰度图，然后通过网络模型定位、识别条码特征图，图片中无论有单个或多个一二维码的类别及其位置坐标都会被同时检出，检测识别精度>95％，检测速度<5ms/帧。

相比于现有技术中的YoloV3神经网络，模型Ⅴ检测速度相比于现有技术中的YoloV3神经网络要快40多倍、Yolov3 tiny神经网络要快近10倍。其中YoloV3神经网络需106层网络结构，占用200多MB存储空间，Yolov3 tiny神经网络需23层网络结构，也需占用35MB存储空间，本发明模型Ⅴ结构简单，只有2MB左右，占用储存空间少，非常适用工业检测设备中的多网络、多功能、分布式检测的布局。

以上所述仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是在本发明的发明构思下，利用本发明说明书及附图内容所作的等效结构变换，或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。

Claims

1.一种集自动化训练、校验、重构于一体的神经网络构建方法，其特征在于，包括如下步骤：

2.如权利要求1所述的神经网络构建方法，其特征在于，在执行步骤S4之前，还需判断当前网络模型是否过拟合，是则减少当前网络模型的网络层数、滤波器个数、加入batchnormal层，并用优化重构网络模型继续进行训练。

3.如权利要求2所述的神经网络构建方法，其特征在于，步骤S4中，采用测试数据集对网络模型进行校验时，其具体执行为：检测网络模型的检测速度和检测精度，并将其与神经网络识别定位系统中上一个存储网络模型的检测速度和检测精度进行对比；

当其检测精度达到预设标准，并且，其检测速度高于或低于所述存储网络模型时，减少初始网络模型的网络层数、滤波器个数或减小模型输入图像尺寸来优化重构网络模型，并用优化重构网络模型继续进行训练。

4.如权利要求3所述的神经网络构建方法，其特征在于，步骤S4中，在将当前优化重构的网络模型与模型库中存储的网络模型进行对比时，当其检测速度高于所述存储网络模型，或其检测精度高于所述存储网络模型时，还分别将之前优化重构的网络模型配置及其训练好的权重参数存储于所述模型库中。

5.如权利要求3所述的神经网络构建方法，其特征在于，步骤S5中，在对优化重构网络模型取不同的匹配框集时，其匹配框集的选择原则如下：第一次选择全集，匹配框全部入选；以后每次减掉一个占比最低的尺寸框，直到优化重构网络模型的检测精度或召回率低于上个所述存储网络模型。

6.如权利要求5所述的神经网络构建方法，其特征在于，步骤S5中，在第一次选择全集时，是选择10个匹配框。

7.如权利要求3所述的神经网络构建方法，其特征在于，所述初始网络模型的特征提取网络和位置类别检测网络的结构如下：

。

8.如权利要求3所述的神经网络构建方法，其特征在于，所述优化重构网络模型的特征提取网络和位置类别检测网络的结构如下：

。

9.如权利要求3所述的神经网络构建方法，其特征在于，所述训练配置包括一训练和校验图片集，所述训练和校验图片集包含若干数据集，各数据集顺序随机打乱，并按8：2分为训练数据集和测试数据集。

10.如权利要求9所述的神经网络构建方法，其特征在于，所述训练数据集为包含40000张图片的训练数据集，所述测试数据集为包含10000张图片的测试数据集；并且，在对初始网络模型和优化重构网络模型进行训练时，是采用小批量梯度下降法设置神经网络的训练参数时，其中，是将训练参数的批量值设置为64，动量配置为0.9，权值设置为0.0005，训练最大迭代次数为160000，初始学习率设置为0.001，使在迭代次数为120000和130000时分别衰减为原来的10％。