CN113762499B

CN113762499B - 一种分通道量化权重的方法

Info

Publication number: CN113762499B
Application number: CN202010497921.9A
Authority: CN
Inventors: 张东
Original assignee: Hefei Ingenic Technology Co ltd
Current assignee: Hefei Ingenic Technology Co ltd
Priority date: 2020-06-04
Filing date: 2020-06-04
Publication date: 2024-04-02
Anticipated expiration: 2040-06-04
Also published as: CN113762499A

Abstract

本发明提供一种分通道量化权重的方法，所述方法是根据模型的输出通道数来量化权重，当卷积神经网络的权重是4维[height,width,input_channel,output_channel]时，根据output_channel分别统计其他3个维度数据的极值，然后再量化为低比特，根据每个通道的分布特性来量化数据。本申请旨在克服现有技术中存在的缺陷，解决现有低比特模型量化时低比特数据利用不充分，集中在少量几个数值，降低了模型的精度的问题。

Description

一种分通道量化权重的方法

技术领域

本发明涉及神经网络加速技术领域，特别涉及一种分通道量化权重的方法。

背景技术

近年来，随着科技的飞速发展，大数据时代已经到来。深度学习以深度神经网络(DNN)作为模型，在许多人工智能的关键领域取得了十分显著的成果，如图像识别、增强学习、语义分析等。卷积神经网络(CNN)作为一种典型的DNN结构，能有效提取出图像的隐层特征，并对图像进行准确分类，在近几年的图像识别和检测领域得到了广泛的应用。

特别地，根据全局极值量化权重：先从权重中获取整个权重的极值然后再根据这该值将权重量化为低比特。

然而，现有技术中对卷积神经网络权重进行量化时，由于是统计权重中整体的极值，完成对权重的量化，没有考虑到各个通道之间的差异，导致有的通道量化后可能只有少数几个值，从而降低了模型的精度。

此外，现有技术中的常用术语如下：

卷积神经网络(Convolutional Neural Networks,CNN)：是一类包含卷积计算且具有深度结构的前馈神经网络。

量化：量化指将信号的连续取值(或者大量可能的离散取值)近似为有限多个(或较少的)离散值的过程。

低比特：将数据量化为位宽为8bit，4bit或者2bit的数据。

推理：神经网络训练结束后，利用保存的数据进行运算的过程。

发明内容

本申请提出了一种分通道量化权重的方法，旨在克服上述现有技术中存在的缺陷，解决现有低比特模型量化时低比特数据利用不充分，集中在少量几个数值，降低了模型的精度的问题。

具体地，本发明提供一种分通道量化权重的方法，所述方法是根据模型的输出通道数来量化权重，即卷积神经网络的权重是4维的[height,width,input_channel,output_channel]，根据output_channel分别统计其他3个维度数据的极值，然后再量化为低比特，根据每个通道的分布特性来量化数据。

所述方法具体包括以下步骤：

S1，卷积神经网络训练：用全精度算法训练模型，得到一个用于目标分类的网络，即获得模型推理过程中的相关参数，所述相关参数包括，卷积的权重，BiasAdd算子的偏置，BatchNormal算子的gamma，beta，均值和方差；

S2，微调量化后的模型：

S2.1，对于从S1得到的模型按照公式1要求对权重进行量化，

公式1：其中，/>为W_f中某一个通道的数据，/>为W_q中某一个通道的数据，即对W_f数据中的每一个通道数据分别进行公式1的操作得到W_q，W_f为全精度数据，W_q为量化后的数据，max_w全精度数据的最大值，b为量化后的位宽，c代表输出通道中的某个通道；

S2.2，对于量化后的值需要再除以(2^b-1)即其中，W_q为S2.1中对W_f量化得到的数据，W为模型微调阶段送到卷积的权重的数据，便于模型微调的时候能有效的收敛；

S3，feature map的量化：在微调阶段将激活函数设置为Relu6，由Relu6激活函数的特性可知，该激活函数输出结果的数值范围在0到6之间，所以此时feature map的最大值为6，然后再按照公式1对数据进行量化。

所述步骤S3中的所述的relu6激活函数为：

relu6(x)＝min(max(x，0)，6)∈[0，6]；

所述步骤S3中在微调阶段将激活函数设置一个比Relu6更小的值。

所述的设置一个比Relu6更小的值为将激活函数的最大值设置为4.0即relu4(x)＝min(max(x，0)4)。

由此，本申请的优势在于：

1.对权重采用分通道的方法来量化，可以提高低比特数据的利用率。

2.采用分通道量化权重可以消除某些层中异常通道对整个模型的影响。

3.由于每一层权重低比特数据利用更充分，从而模型在微调的时候可以大大提高模型的收敛速度和最终的精度。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，并不构成对本发明的限定。

图1是本发明方法的流程示意图。

图2是现有技术中Relu函数及其导函数对应的图像。

图3是本发明方法的中Relu6激活函数和导函数对应的图像。

具体实施方式

为了能够更清楚地理解本发明的技术内容及优点，现结合附图对本发明进行进一步的详细说明。

如图1所示，本发明的一种分通道量化权重的方法具体包括以下步骤：

S1，卷积神经网络训练：用全精度算法训练模型，全精度算法是以Resnet-50为神经网络结构的图像分类算法，得到一个用于目标分类的网络，即获得模型推理过程中的相关参数，所述相关参数包括，卷积的权重，BiasAdd算子的偏置，BatchNormal算子的gamma，beta，均值和方差；

S2，微调量化后的模型：

S2.1，对于从S1得到的模型按照公式1要求对权重进行量化，

公式1：

其中，为W_f中某一个通道的数据，/>为W_q中某一个通道的数据，即对W_f数据中的每一个通道数据分别进行公式1的操作得到W_q，W_f为全精度数据，W_q为量化后的数据，max_w全精度数据的最大值，b为量化后的位宽，c代表输出通道中的某个通道；

本申请方法还可以表述为，包括以下步骤：

1)卷积神经网络训练：用全精度算法训练模型，得到一个可以用于目标分类的网络，即获得模型推理过程中的相关参数。

2)微调量化后的模型：对于得到的模型按照公式1要求对权重进行量化，不过对于量化后的值需要再除以(2^b-1)即便于模型微调的时候能有效的收敛。

公式1：

变量说明：为W_f中某一个通道的数据，/>为W_q中某一个通道的数据，即对W_f数据中的每一个通道数据分别进行公式1的操作得到W_q，W_f为全精度数据，W_q为量化后的数据，max_w全精度数据的最大值，b为量化后的位宽，c代表输出通道中的某个通道。

3)feature map的量化：由于feature map时模型推理过程中实时计算出来的，所以无法预先知道他的极值，不过由于卷积神经网络现在的激活函数采用的是Relu或者Relu6，所以在微调阶段我们将激活函数设置为Relu6或者更小的一个值，这样feature map的极值就会是已知的了，然后再按照公式1对数据进行量化。

激活函数(Relu函数)，神经网络中的每个神经元节点接受上一层神经元的输出值作为本神经元的输入值，并将输入值传递给下一层，输入层神经元节点会将输入属性值直接传递给下一层(隐层或输出层)。在多层神经网络中，上层节点的输出和下层节点的输入之间具有一个函数关系，这个函数称为激活函数(又称激励函数)，如图2所示，Relu＝max(0，x)，Relu函数及其导数的图像。

如图3所示，所述的relu6激活函数为：

relu6(x)＝nin(max(x，0)，6)∈[0，6]；

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明实施例可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种分通道量化权重的方法，其特征在于，所述分通道量化权重的方法适用于图像识别应用、增强学习、语义分析应用中部署的深度神经网络，所述方法是根据模型的输出通道数来量化权重，当卷积神经网络的权重是4维[height，width，input_channel，output_channel]时，根据output_channeI分别统计其他3个维度数据的极值，然后再量化为低比特，根据每个通道的分布特性来量化数据；所述方法具体包括以下步骤：

S2，微调量化后的模型：

S2.1，对于从S1得到的模型按照公式1要求对权重进行量化，

公式1：

其中，为W_f中某一个通道的数据，/>为W_q中某一个通道的数据，即对W_f数据中的每一个通道数据分别进行公式1的操作得到W_q，W_f为全精度数据，W_q为量化后的数据，max_w为全精度数据W_f的最大值，b为量化后的位宽，c代表输出通道中的某个通道；

2.根据权利要求1所述的一种分通道量化权重的方法，其特征在于，所述步骤S3中的所述relu6激活函数为：

relu6(x)＝min(max(x,0)，6)∈[0,6]；

3.根据权利要求1所述的一种分通道量化权重的方法，其特征在于，所述步骤S3中在微调阶段将激活函数设置一个比relu6更小的值。

4.根据权利要求3所述的一种分通道量化权重的方法，其特征在于，所述设置一个比relu6更小的值为将激活函数的最大值设置为4.0即relu4(x)＝min(max(x,0)4)。