CN113762500B

CN113762500B - 一种卷积神经网络在量化时提高模型精度的训练方法

Info

Publication number: CN113762500B
Application number: CN202010497942.0A
Authority: CN
Inventors: 张东
Original assignee: Hefei Ingenic Technology Co ltd
Current assignee: Hefei Ingenic Technology Co ltd
Priority date: 2020-06-04
Filing date: 2020-06-04
Publication date: 2024-04-02
Anticipated expiration: 2040-06-04
Also published as: CN113762500A

Abstract

本发明提供一种卷积神经网络在量化时提高模型精度的训练方法，本方法在训练低比特模型之前就考虑到了位宽限制，所以在训练低比特模型时并不是直接同时量化权重和feature map而是分成两步去走，先量化权重训练得到一个好的模型，然后再量化feature map从而得到最终的模型，这样可以降低低比特模型的训练难度使得模型可以有效的收敛从而提高模型的精度。由于考虑到直接训练2bit模型时，训练难度过大，模型可能无法有效的收敛，所以采用分步训练的方法，降低训练难度，提高模型的收敛速度和最终的效果；在训练量化了权重的模型时同时统计feature map的最大值，从而避免了之后量化feature map时人工设定最大值，使得每一层都能获得一个和实际分布最切合的最大值。

Description

一种卷积神经网络在量化时提高模型精度的训练方法

技术领域

本发明涉及神经网络加速技术领域，特别涉及一种卷积神经网络在量化时提高模型精度的训练方法。

背景技术

近年来，随着科技的飞速发展，大数据时代也已经到来。随着计算机技术的快速发展，基于卷积神经网络的算法成功应用于各个识别领域。深度学习以深度神经网络(DNN)作为模型，在许多人工智能的关键领域取得了十分显著的成果，如图像识别、增强学习、语义分析等。卷积神经网络(CNN)作为一种典型的DNN结构，能有效提取出图像的隐层特征，并对图像进行准确分类，在近几年的图像识别和检测领域得到了广泛的应用。

特别地，基于全精度模型微调低比特模型日益成熟：其技术方案是先用数据集训练一版全精度模型达到目标精度，然后基于全精度模型微调训练一版低比特模型。

然而，现有技术中在训练全精度模型多采用的时Relu函数，由于全精度数表示的实数范围很广，可以满足训练过程中需要的数值范围，可是在训练低比特时，由于位宽的限制，所有其表示范围是有有限的，导致训练过程中模型无法有效的收敛，最终模型的精度并不理想。

此外，现有技术中的常用术语如下：

卷积神经网络(Convolutional Neural Networks,CNN)：是一类包含卷积计算且具有深度结构的前馈神经网络。

量化：量化指将信号的连续取值(或者大量可能的离散取值)近似为有限多个(或较少的)离散值的过程。

低比特：将数据量化为位宽为8bit，4bit或者2bit的数据。

激活函数(Relu函数)，神经网络中的每个神经元节点接受上一层神经元的输出值作为本神经元的输入值，并将输入值传递给下一层，输入层神经元节点会将输入属性值直接传递给下一层(隐层或输出层)。在多层神经网络中，上层节点的输出和下层节点的输入之间具有一个函数关系，这个函数称为激活函数(又称激励函数)，如图1所示，Relu＝max(0,x)，Relu函数及其导数的图像。

BN(Batch normalization)批归一化(BN)就是在深度神经网络训练过程中使得每一层神经网络的输入保持相同分布的。其可以抑制梯度爆炸/消失并加快训练速度。通过归一化操作使网络的每层特征的分布尽可能的稳定。

发明内容

为了解决上述问题，本发明的目的在于：解决现有低比特模型特别是2bit模型在训练过程中精度损失严重和难以收敛的问题。

本方法在训练低比特模型之前就考虑到了位宽限制，所以在训练低比特模型时并不是直接同时量化权重和feature map而是分成两步去走，先量化权重训练得到一个好的模型，然后再量化feature map从而得到最终的模型，这样可以降低低比特模型的训练难度使得模型可以有效的收敛从而提高模型的精度。

具体地，本发明提供一种卷积神经网络在量化时提高模型精度的训练方法，所述方法包括以下步骤：

S1，基于数据集训练一版全精度模型；

S2，在基于全精度模型训练一版只量化了权重的模型，并且在训练的同时统计feature map的最大值；

S3，再基于S2的模型训练一版权重和激活都量化的模型。

所述方法S1进一步包括以下步骤：

S1.1，确定训练数据：

训练模型的数据集是ImageNet1000，该数据集是ImageNet数据集的一个子集，有训练集，验证集，测试集和1000个类别；

S1.2，设立模型：

本步骤中训练采用的基础神经网络模型是MobileNetV1，该网络是一种基于深度可分离卷积的模型；

S1.3，选择激活函数：

所述MobileNetV1模型，在每一层卷积后面会进行BN操作然后是Relu操作；

S1.4，训练网络：

对于网络的训练基本步骤是：先采用adam优化器训练60个epoch，然后再用SGD优化器直至训练结束；

S1.5，测试网络效果：

利用测试集测试网络结果。

所述方法S1.1中有1.2million的训练集，5万验证集，15万测试集。

所述方法S1.3中还可以在训练时将Relu激活函数换为ReluX，ReluX公式如下：

其中，x值设为3.0。

所述方法S2进一步包括以下步骤：

S2.1,训练只量化权重的模型：

数据量化：对于待量化的数据按照如下公式进行量化，得到低比特的数据；

变量说明：W_f为全精度数据是一个数组，W_q为模拟量化后的数据，max_w全精度数据W_f中最大值，min_w全精度数据W_f中最小值,b为量化后的位宽；

S2.2,在所述步骤S2.1中训练时只将权重量化到2bit，feature map不量化，但在训练模型的同时，获取feature map的最大值，具体方法如下：

1:v＝ReluX(v)

2:channels＝getChannelsNum(v)

3:batchNum＝getBatchNum(v)

4:maxValue＝0.0

5:for tag＝0 to bachNum do

6:vValueTag＝v[tag]

7:perChannelMax＝getChannelMax(vValueTag)

8:

9:end for

10:其中，函数说明：getChannelsNum(v)获取featuremap的通道数，getBatchNum(v)获取feature map的batch的大小，getChannelMax(v)获取feature map每个通道上的最大值，reduceSum(v)求变量v的和；S2.3，对每一层激活函数获得的maxValue再通过滑动平均的方法来更新，公式如下所示：

v_t＝β·v_t-1+(1-β)·(θ_t)

其中，变量说明：vt为变量v在t时刻的值，β为加权系数，θ_t为变量v在t时刻的值，v_t-1为变量v在t-1时刻的值；

S2.4，在ReluX的结果后面再在加一个ReluX,ReluX公式如下：

但是此时的X值为maxValue。

所述方法S2.3中，加权系数β的值为0.996。

所述方法S3此时ReluX(x＝maxValue)中x的值为步骤S2训练中统计的featuremap的最大值。

由此，本申请的优势在于：

(1)由于考虑到直接训练2bit模型时，训练难度过大，模型可能无法有效的收敛，所以采用分步训练的方法，降低训练难度，提高模型的收敛速度和最终的效果；

(2)在训练量化了权重的模型时同时统计feature map的最大值，从而避免了之后量化feature map时人工设定最大值，使得每一层都能获得一个和实际分布最切合的最大值。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，并不构成对本发明的限定。

图1是本发明方法中Relu函数及其导函数对应的图像。

图2是本发明方法的步骤S1.3中每一层卷积后面都会加上BN和Relu操作的示意图。

图3是本发明方法的步骤S1.3中将Relu激活函数换为ReluX的示意图。

图4是本发明方法的低比特模型训练流程示意图。

图5是本发明方法的步骤S2.4的流程示意图。

图6是本发明方法的步骤S1-S2的训练流程的流程示意图。

图7是本发明方法中得到一个量化了权重的模型，然后再基于该模型训练一版权重和激活都量化了的模型的流程示意图。

图8是本发明方法的示意流程图。

具体实施方式

为了能够更清楚地理解本发明的技术内容及优点，现结合附图对本发明进行进一步的详细说明。

如图8所示，本发明涉及一种卷积神经网络在量化时提高模型精度的训练方法，所述方法包括以下步骤：

S1，基于数据集训练一版全精度模型；

S3，再基于S2的模型训练一版权重和激活都量化的模型。

具体来说，本发明提供一种提高2比特模型训练精度的方法，包括以下内容：

1全精度模型训练：

1)训练数据：

训练模型的数据集是ImageNet1000，该数据集是ImageNet数据集的一个子集，有大约1.2million的训练集，5万验证集，15万测试集，1000个类别。

2)模型：

本次训练采用的基础神经网络模型是MobileNetV1，该网络是一种基于深度可分离卷积的模型，本文提到的一些修改是在该模型上进行修改的(具体的修改后期会做详细说明)。

3)选择激活函数：

MobileNetV1模型，在每一层卷积后面都会加上BN和Relu操作如图2所示。

不过由于我们训练的模型需要量化到低比特，所以直接采用Relu激活函数的话，每一层激活输出的feature map的最大值是未知并且是没有上界的，这样对量化到低比特是不利的，

由于之后需要将feature map量化到2bit，所以在训练时将Relu激活函数换为ReluX如图3所示。

并且X值设为3.0

4)训练网络：

对于网络的训练基本步骤是：先采用adam优化器训练60个epoch，然后再用SGD优化器直至训练结束。

5)测试网络效果：

利用测试集测试网络结果。

2低比特模型训练：低比特模型训练流程如图4所示，主要分成2步。

1)训练只量化权重的模型：

数据量化：对于待量化的数据按照以下所示的公式进行量化，得到低比特的数据。

变量说明：W_f为全精度数据是一个数组，W_q为模拟量化后的数据，max_w全精度数据W_f中最大值，min_w全精度数据W_f中最小值,b为量化后的位宽。

2)上面第一步训练时只将权重量化到2bit，feature map不量化，不过在训练模型的同时，通过以下处理步骤处理获取feature map的最大值再通过滑动平均的方法统计最大值，具体处理步骤如下：

1：v＝ReluX(v)

2：channels＝getChannelsNum(v)

3：batchNum＝getBatchNum(v)

4：maxValue＝0.0

5：for tag＝0 to bachNum do

6:vValueTag＝v[tag]

7:perChannelMax＝getChannelMax(vValueTag)

8:

9：end for

10：

函数说明：getChannelsNum(v)获取feature map的通道数，getBatchNum(v)获取feature map的batch的大小，getChannelMax(v)获取feature map每个通道上的最大值，reduceSum(v)求变量v的和。

3)对每一层激活函数获得的maxValue再通过滑动平均的方法来更新，公式如下所示：

v_t＝β·v_t-1+(1-β)·(θ_t)

变量说明：v_t为变量v在t时刻的值，β为加权系数，θ_t为变量v在t时刻的值，v_t-1为变量v在t-1时刻的值。加权系数β的值为0.996。

4)在ReluX的结果后面在加一个ReluX，不过此时的X值为maxValue，流程如图5所示。这里的整个训练流程如图6所示。

3经过第一步训练后得到一个量化了权重的模型，然后再基于该模型训练一版权重和激活都量化了的模型具体流程如图7所示。此时ReluX中X的值为第一步训练中统计的feature map的最大值。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明实施例可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种卷积神经网络在量化时提高模型精度的训练方法，其特征在于，所述方法适用于图像识别和检测，包括以下步骤：

S1，基于数据集训练一版全精度模型；所述方法S1进一步包括以下步骤：S1.1，确定训练数据：

S1.2，设立模型：

S1.3，选择激活函数：

S1.4，训练网络：

S1.5，测试网络效果：

利用测试集测试网络结果；

S2，在基于全精度模型训练一版只量化了权重的模型，并且在训练的同时统计featuremap的最大值；所述方法S2进一步包括以下步骤：

S2.1,训练只量化权重的模型：

1:v＝ReluX(v)

2:channels＝getChannelsNum(v)

3:batchNum＝getBatchNum(v)

4:maxValue＝0.0

5:for tag＝0 to bachNum do

6:vValueTag＝v[tag]

7:perChannelMax＝getChannelMax(vValueTag)

8:maxValue+＝reduceSum(perChannelMax)/channels

9:end for

10:maxValue＝maxValue/batchNum；

其中，函数说明：getChannelsNum(v)获取feature map的通道数，getBatchNum(v)获取feature map的batch的大小，getChannelMax(v)获取feature map每个通道上的最大值，reduceSum(v)求变量v的和；

S2.3，对每一层激活函数获得的maxValue再通过滑动平均的方法来更新，公式如下所示：

v_t＝β·v_(t-1)+(1-β)·(θ_t)

其中，变量说明：v_t为变量v在t时刻的值，β为加权系数，θ_t为变量v在t时刻的值，v_(t-1)为变量v在t-1时刻的值；

S2.4，在ReluX的结果后面再在加一个ReluX,ReluX公式如下：

但是此时的X值为maxValue；

S3，再基于S2的模型训练一版权重和激活都量化的模型；所述方法S3此时ReluX(x＝maxValue)中x的值为步骤S2训练中统计的feature map的最大值。

2.根据权利要求1所述的一种卷积神经网络在量化时提高模型精度的训练方法，其特征在于，所述方法S1.1中有1.2million的训练集，5万验证集，15万测试集。

3.根据权利要求1所述的一种卷积神经网络在量化时提高模型精度的训练方法，其特征在于，所述方法S1.3中还可以在训练时将Relu激活函数换为ReluX，ReluX公式如下：

其中，x值设为3.0。

4.根据权利要求1所述的一种卷积神经网络在量化时提高模型精度的训练方法，其特征在于，所述方法S2.3中，加权系数β的值为0.996。