CN113762452B

CN113762452B - 一种量化prelu激活函数的方法

Info

Publication number: CN113762452B
Application number: CN202010497786.8A
Authority: CN
Inventors: 张东; 于康龙
Original assignee: Hefei Ingenic Technology Co ltd
Current assignee: Hefei Ingenic Technology Co ltd
Priority date: 2020-06-04
Filing date: 2020-06-04
Publication date: 2024-01-02
Anticipated expiration: 2040-06-04
Also published as: CN113762452A

Abstract

本发明提供一种量化激活函数为PRELU的方法，包括：S1数据量化，对于待量化的数据按照下列公式(1)所示进行量化，得到低比特的数据，公式(1)变量说明：W_f为全精度数据是一个数组，W_q为量化后的数据，max_w为全精度数据W_f中最大值，min_w为全精度数据W_f中最小值，b为量化后的位宽；S2量化PRELU激活函数，量化公式如公式(2)所示：公式(2)变量说明：当x_i取值大于0时，需要将x_i值乘上参数q₁，如果x_i值小于0时，需要将x_i值乘上参数a_c，c为x_i所在的通道；具体参数说明：x为一个三维数组即{h，w，c}，h，w，c分别为该数组的长，宽，通道数；参数a为一个一维数组{c}，其中的c和x中的c数值是相等的；q₁为1.0的量化；a_c为参数a中第c个通道的数值。

Description

一种量化PRELU激活函数的方法

技术领域

本发明涉及神经网络加速技术领域，特别涉及一种量化PRELU激活函数的方法。

背景技术

近年来，随着科技的飞速发展，大数据时代已经到来。深度学习以深度神经网络(DNN)作为模型，在许多人工智能的关键领域取得了十分显著的成果，如图像识别、增强学习、语义分析等。卷积神经网络(CNN)作为一种典型的DNN结构，能有效提取出图像的隐层特征，并对图像进行准确分类，在近几年的图像识别和检测领域得到了广泛的应用。

特别地，实时量化feature map：将卷积运算出来的结果反量化为全精度数，然后根据实时统计获得的最大最小值完成对feature map的量化。

然而，现有技术中对于激活函数为PRELU时，并不会对其做量化处理，即对输入到PRELU的数据如果是量化后的数据则需要反量化为全精度的数据，PRELU内部做浮点运算，这样对于整个量化模型来说这一块需要做浮点运算，会导致模型运行时间增加。

此外，现有技术中的常用术语如下：

卷积神经网络(Convolutional Neural Networks,CNN)：是一类包含卷积计算且具有深度结构的前馈神经网络。

量化：量化指将信号的连续取值(或者大量可能的离散取值)近似为有限多个(或较少的)离散值的过程。

低比特：将数据量化为位宽为8bit，4bit或者2bit的数据。

推理：神经网络训练结束后，利用保存的数据进行运算的过程。

PReLU(Parametric Rectified Linear Unit)：带参数的ReLU。

发明内容

为了解决上述技术问题，本申请提出了一种量化激活函数为PRELU的方法，旨在克服上述现有技术中存在的缺陷，提出一种量化PRELU的方法，解决现有低比特模型推理过程当激活函数为PRELU时采用全精度计算的问题。

本发明方法会对PRELU函数也做量化处理，即PRELU函数的输入为量化后的数据内部做整型运算，从而提高模型的整体运行时间。

具体地，本发明提供一种量化激活函数为PRELU的方法，所述方法包括以下步骤：

S1，数据量化，对于待量化的数据按照下列公式(1)所示进行量化，得到低比特的数据，

公式(1)

变量说明：W_f为全精度数据是一个数组，W_q为量化后的数据，max_w为全精度数据W_f中最大值，min_w为全精度数据W_f中最小值,b为量化后的位宽；

S2，量化PRELU激活函数，量化公式如公式(2)所示：

公式(2)

变量说明：当x_i取值大于0时，需要将x_i值乘上参数q₁，如果x_i值小于0时，需要将x_i值乘上参数a_c，c为x_i所在的通道；具体参数说明：x为一个三维数组即{h，w，c},h,w,c分别为该数组的长，宽，通道数；参数a为一个一维数组{c}，其中的c和x中的c数值是相等的；q₁为1.0的量化；a_c为参数a中第c个通道的数值。

所述的步骤S2的量化进一步包括：

S2.1，初始化：将0分别赋值给最小值minValue、最大值maxValue；

S2.2，将将Max(c_f)赋值给cMax；将Min(c_f)赋值给Min Value；

其中，Max(x)获取数组x的最大值，c_f为全精度参数c，则Max(c_f)为获取数组c_f的最大值；

Min(x)获取数组x的最小值，c_f为全精度参数c，则Min(c_f)为获取数据c_f的最小值；

S2.3，判断cMax是否大于1.0，如果是，则将cMax赋值给maxValue；

否则将1.0赋值给maxValue；

S2.4，处理量化Quantize(c_f，minValue，maxValue)并赋值给q_c；

处理量化Quantize(1.0，minValue，maxValue)并赋值给q₁；

处理量化Quantize(x_f，Min(x_f)，Max(x_f))并赋值给q_x；

处理量化QPRELU(q_x，q_c，q₁)并将量化结果赋值给res；

其中，q_c为量化后的参数c_f，q₁为1.0的量化，x_f为全精度数据x，q_x为量化后的数据x_f，res为经过量化PRELU激活函数的结果。

所述步骤S2在量化PRELU激活时，由于正负半轴的处理方式是不一样，即x＞0或x＜0的情况不同，采用将正半轴都乘一个1，然后再根据参数c的minValue，maxValue将1量化，以便保证正负半轴的尺度一致。

所述方法还包括确定量化过程中使用PRELU激活函数的步骤，所述PRELU激活函数是个分段函数，如公式(3)所示,当x_i取值大于0时直接取x_i的值，如果x_i值小于0时，需要将x_i值乘上参数a_c，c为x_i所在的通道，

公式(3)具体参数说明：x为一个三维数组即{h，w，c},h,w,c分别为该数组的长，宽，通道数；参数a为一个一维数组{c}，其中的c和x中的c数值是相等的；a_c为参数a中第c个通道的数值。

由此，本申请的优势在于：

(1)当卷积神经网络中如果激活函数为PRELU的话，量化后的模型在推理的时候PRELU运算过程中将不存在浮点运算；

(2)含有PRELU激活函数的模型量化后，模型推理时间的减少。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，并不构成对本发明的限定。

图1是本发明方法的流程示意图。

图2是实现本发明方法中量化的代码化流程示意图。

具体实施方式

为了能够更清楚地理解本发明的技术内容及优点，现结合附图对本发明进行进一步的详细说明。

如图1所示，本发明的一种量化激活函数为PRELU的方法，所述方法包括以下步骤：

公式(1)变量说明：W_f为全精度数据是一个数组，W_q为量化后的数据，max_w为全精度数据W_f中最大值，min_w为全精度数据W_f中最小值,b为量化后的位宽；

S2，量化PRELU激活函数，量化公式如公式(2)所示：

公式(2)变量说明：当x_i取值大于0时，需要将x_i值乘上参数q₁，如果x_i值小于0时，需要将x_i值乘上参数a_c，c为x_i所在的通道；具体参数说明：x为一个三维数组即{h，w，c},h,w,c分别为该数组的长，宽，通道数；参数a为一个一维数组{c}，其中的c和x中的c数值是相等的；q₁为1.0的量化；a_c为参数a中第c个通道的数值。

特别地，本申请的方法还可以表述为以下：

一种量化激活函数为PRELU的方法，包括以下内容：

1)PRELU激活函数实现原理：PRELU激活函数是个分段函数，具体公式如下列公式所示，当x_i取值大于0时直接取x_i的值，如果x_i值小于0时，需要将x_i值乘上参数a_c，c为x_i所在的通道：

具体参数说明：x为一个三维数组即{h，w，c},h,w,c分别为该数组的长，宽，通道数；参数a为一个一维数组{c}，其中的c和x中的c数值是相等的；a_c为参数a中第c个通道的数值。

2)数据量化：对于待量化的数据按照下列公式所示进行量化，得到低比特的数据。

变量说明：W_f为全精度数据是一个数组，W_q为量化后的数据，max_w全精度数据W_f中最大值，min_w全精度数据W_f中最小值,b为量化后的位宽。

3)量化PRELU：如下列公式所示对于输入的数据x_i，x_i的正负会影响数据的运算方式，并且需要考虑到参数a的量化，量化公式如公式(3)所示：

公式(3)

具体的流程，具体描述如下，代码化如图2所示：

1)，初始化：将0分别赋值给最小值minValue、最大值maxValue；

2)，将将Max(c_f)赋值给cMax；将Min(c_f)赋值给minValue；

3)，判断cMax是否大于1.0，如果是，则将cMax赋值给maxValue；

否则将1.0赋值给maxValue；

4)，处理量化Quantize(c_f，minValue，maxValue)并赋值给q_c；

处理量化Quantize(1.0，minValue，maxValue)并赋值给q₁；

处理量化Quantize(x_f，Min(x_f)，Max(x_f))并赋值给q_x；

处理量化QPRELU(q_x，q_c，q₁)并将量化结果赋值给res；

在量化PRELU激活时，由于正负半轴(即x＞0或x＜0的情况)的处理方式是不一样，如果直接对负半轴的参数c采用公式(2)直接量化的话会导致正负半轴的尺度不一致，导致最终的结果不对。将正半轴都乘了一个1，然后再根据参数c的minValue，maxValue将1量化，这样就可以保证正负半轴的尺度一致。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明实施例可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种量化PRELU激活函数的方法，其特征在于，所述量化PRELU激活函数应用于图像识别应用、语义分析应用中部署的深度神经网络，所述方法包括以下步骤：

S2，量化PRELU激活函数，量化公式如公式(2)所示：

公式(2)

变量说明：当x_i取值大于0时，需要将x_i值乘上参数q₁，如果x_i值小于0时，需要将x_i值乘上参数a_c，c为x_i所在的通道；具体参数说明：x为一个三维数组即{h，w，c},h,w,c分别为该数组的长，宽，通道数；参数a为一个一维数组{c}，其中的c和x中的c数值是相等的；q₁为1.0的量化；a_c为参数a中第c个通道的数值；

所述的步骤S2的量化进一步包括：

S2.1，初始化：将0分别赋值给最小值minValue、最大值maxValue；

S2.2，将Max(c_f)赋值给cMax；将Min(c_f)赋值给minValue；

S2.3，判断cMax是否大于1.0，如果是，则将cMax赋值给maxValue；

否则将1.0赋值给maxValue；

S2.4，处理量化Quantize(c_f，minValue，maxValue)并赋值给q_c；

处理量化Quantize(1.0，minValue，maxValue)并赋值给q₁；

处理量化Quantize(x_f，Min(x_f)，Max(x_f))并赋值给a_x；

处理量化QPRELU(q_x，q_c，q₁)并将量化结果赋值给res；

其中，q_c为量化后的参数c_f，q₁为1.0的量化，x_f为全精度数据x，q_x为量化后的数据x_f，res为经过量化PRELU激活函数的结果；

2.根据权利要求1所述的一种量化PRELU激活函数的方法，其特征在于，所述方法还包括确定量化过程中使用PRELU激活函数的步骤，所述PRELU激活函数是个分段函数，如公式(3)所示,当x_i取值大于0时直接取x_i的值，如果x_i值小于0时，需要将x_i值乘上参数a_c，c为x_i所在的通道，

公式(3)