CN109472353A

CN109472353A - 一种卷积神经网络量化电路及量化方法

Info

Publication number: CN109472353A
Application number: CN201811398233.6A
Authority: CN
Inventors: 王子彤; 姜凯; 于治楼
Original assignee: Jinan Inspur Hi Tech Investment and Development Co Ltd
Current assignee: Inspur Group Co Ltd
Priority date: 2018-11-22
Filing date: 2018-11-22
Publication date: 2019-03-15
Anticipated expiration: 2038-11-22
Also published as: CN109472353B

Abstract

本发明公开了一种卷积神经网络量化电路及量化方法，属于人工智能数据处理技术领域，包括原始参数池、比较器阵列、量化参数计算单元和算术运算单元，所述原始参数池用于存储卷积神经网络每层计算所需的原始参数数据，包括每层所有卷积核各通道数据和偏置数据；所述比较器阵列用于对原始参数池中的数据进行统计运算，迭代比较得到卷积神经网络各层参数的最大值及最小值；所述量化参数计算单元用于对所述最大值及最小值进行算术运算，得到模型量化所用的各参数；所述算术运算单元用于对模型进行量化，所得结果均以无符号位指定位数的整数格式表示。本发明经过量化可以降低系统功耗，使卷积神经网络在端上的部署运行得到更可靠的保证。

Description

一种卷积神经网络量化电路及量化方法

技术领域

本发明涉及人工智能数据处理技术领域，具体地说是一种卷积神经网络量化电路及量化方法。

背景技术

卷积神经网络作为人工智能发展大潮中一支重要方向，已呈白热化发展状态。各种新模型新算法层出不穷，为这一领域源源不断注入新的推动力量。其中，网络模型深度增加和规模增大是主要发展方向，在精度不断提高的过程中，神经网络的部署与实现却面临巨大挑战。

由于移动端处理和存储水平发展限制，深度和尺寸成倍增长的人工神经网络只能在大规模计算资源的处理机器中运行，设备功耗和运行速度达不到要求。无法进行端的移植，进而无法集群部署。一些适用于各种场景的新型网络无法得到应用与验证，一定程度上阻碍着算法的优化和网络的进步。

发明内容

本发明的技术任务是针对以上不足之处，提供一种卷积神经网络量化电路及量化方法，可以降低系统功耗，使卷积神经网络在端上的部署运行得到更可靠的保证。

本发明解决其技术问题所采用的技术方案是：

一种卷积神经网络量化电路，包括原始参数池、比较器阵列、量化参数计算单元和算术运算单元，

所述原始参数池用于存储卷积神经网络每层计算所需的原始参数数据，包括每层所有卷积核各通道数据和偏置数据，均以有符号实数型数据格式表达；

所述比较器阵列用于对原始参数池中的数据进行统计运算，迭代比较得到卷积神经网络各层参数的最大值及最小值；

所述量化参数计算单元用于根据一定的算法，对所述最大值及最小值进行算术运算，得到模型量化所用的各参数；

所述算术运算单元用于根据所述量化后的参数，从卷积神经网络首层的原始输入开始，对卷积、累加、池化及全连接等过程进行量化，所得结果均以无符号位指定位数的整数格式表示。

通过量化计算，可以将有符号的实数型数据格式变为无符号指定位数的整数格式，可以降低模型存储容量和带宽需求。

进一步的，该量化电路还包括微调单元，用于对量化结果进行一定范围内的修正，以消除算术运算单元由于移位及乘除法运算带来的误差。

进一步的，该量化电路还包括激活单元，用于根据量化参数，将量化后的数据截短，以满足下一层卷积神经网络输入要求。

优选的，所述量化参数计算单元得到的量化参数包括：卷积核量化零值、量化扩展系数、量化移位位数一、量化移位位数二、输出量化零值、偏置扩展系数和全连接输出量化零值。

进一步的，所述算术运算单元包括加法阵列、位移阵列和乘法器阵列，以实现卷积、累加、池化及全连接等过程中的量化运算，包括：对输入特征图与输入特征图量化零值作差运算，对输入卷积核与卷积核量化零值作差运算，对减去零值的输入特征图及卷积核乘积运算，对乘积结果与量化扩展系数进行乘积运算，对二次乘积结果进行两次量化移位计算，对移位结果和输出量化零值进行求和运算，对原始偏置与偏置扩展系数进行乘积运算，对全连接输出和全连接输出量化零值进行求和。

其中，在量化扩展乘积运算之后以及第一次量化位移之后，需要经过微调单元对结果进行微调计算。

进一步的，所述输入特征图量化零值经模型重新训练得到。

本发明还提供一种卷积神经网络量化方法，该方法通过以下步骤实现：

1)、对原始卷积神经网络各层参数进行数据统计，得到每层每组参数的最大值和最小值；

2)、利用极值及特定算法得到量化过程所需参数，参数包括：卷积核量化零值、量化扩展系数、量化移位位数一、量化移位位数二、输出量化零值、偏置扩展系数和全连接输出量化零值；

3)、在原有卷积神经网络计算过程基础上添加量化计算，从卷积神经网络首层的原始输入开始，对卷积、累加、池化及全连接等过程进行量化，得到量化后的输出结果，所得结果均以无符号位指定位数的整数格式表示；

4)、对结果进行修正及激活截短，消除由于移位及乘除法运算带来的误差，并将量化后的数据截短，以适应下一层卷积神经网络输入。

具体的，所述量化后的输出结果均以无符号位指定位数的整数格式表示。

具体的，利用步骤2)所得到量化过程所需参数，所述量化计算为：对输入特征图与输入特征图量化零值作差运算，对输入卷积核与卷积核量化零值作差运算，对减去零值的输入特征图及卷积核乘积运算，对乘积结果与量化扩展系数进行乘积运算，对二次乘积结果进行两次量化移位计算，对移位结果和输出量化零值进行求和运算，对原始偏置与偏置扩展系数进行乘积运算，对全连接输出和全连接输出量化零值进行求和。

本发明的一种卷积神经网络量化电路及量化方法与现有技术相比，具有以下有益效果：

通过对卷积神经网络模型参数的量化，首先对存储系统的要求放宽，由带符号多位实数转化为无符号八位整形数据，大大降低了模型存储容量与带宽需求，提高仿存速率；在保证计算精度的同时，量化后的模型计算消耗时延降低，业务效率得到提升；量化后系统功耗降低，使得卷积神经网络在端上的部署与运行得到更可靠的保证。

附图说明

图1是本发明的卷积神经网络量化电路的结构框图；

图2是本发明的卷积神经网络量化方法的流程图。

具体实施方式

下面结合具体实施例对本发明作进一步说明。

一种卷积神经网络量化电路，包括原始参数池、比较器阵列、量化参数计算单元、算术运算单元、微调单元和激活单元。

所述微调单元，用于对量化结果进行一定范围内的修正，以消除算术运算单元由于移位及乘除法运算带来的误差。

所述激活单元，用于根据量化参数，将量化后的数据截短，以满足下一层卷积神经网络输入要求。

其中，所述量化参数计算单元得到的量化参数包括：卷积核量化零值、量化扩展系数、量化移位位数一、量化移位位数二、输出量化零值、偏置扩展系数和全连接输出量化零值。

所述算术运算单元包括加法阵列、位移阵列和乘法器阵列，以实现卷积、累加、池化及全连接等过程中的量化运算，包括：对输入特征图与输入特征图量化零值作差运算，对输入卷积核与卷积核量化零值作差运算，对减去零值的输入特征图及卷积核乘积运算，对乘积结果与量化扩展系数进行乘积运算，对二次乘积结果进行两次量化移位计算，对移位结果和输出量化零值进行求和运算，对原始偏置与偏置扩展系数进行乘积运算，对全连接输出和全连接输出量化零值进行求和。

其中，所述输入特征图量化零值经模型重新训练得到。

在发明的一个实施例中，还提供一种卷积神经网络量化方法，该方法通过以下步骤实现：

使用原始参数池存储卷积神经网络每层计算所需的原始参数数据，包括每层所有卷积核各通道数据和偏置数据，均以有符号实数型数据格式表达；

通过使用比较器阵列用于对原始参数池中的数据进行统计运算，迭代比较得到卷积神经网络各层参数的最大值及最小值。

2)、利用极值及特定算法，对所述最大值及最小值进行算术运算，得到量化过程所需参数，参数包括：卷积核量化零值、量化扩展系数、量化移位位数一、量化移位位数二、输出量化零值、偏置扩展系数和全连接输出量化零值；

利用步骤2)所得到量化过程所需参数，所述量化计算为：对输入特征图与输入特征图量化零值作差运算，对输入卷积核与卷积核量化零值作差运算，对减去零值的输入特征图及卷积核乘积运算，对乘积结果与量化扩展系数进行乘积运算，对二次乘积结果进行两次量化移位计算，对移位结果和输出量化零值进行求和运算，对原始偏置与偏置扩展系数进行乘积运算，对全连接输出和全连接输出量化零值进行求和。

在量化扩展乘积运算之后以及第一次量化位移之后，需要经过微调单元对结果进行微调计算。

其中，所述输入特征图量化零值经模型重新训练得到。

通过上面具体实施方式，所述技术领域的技术人员可容易的实现本发明。但是应当理解，本发明并不限于上述的具体实施方式。在公开的实施方式的基础上，所述技术领域的技术人员可任意组合不同的技术特征，从而实现不同的技术方案。

除说明书所述的技术特征外，均为本专业技术人员的已知技术。

Claims

1.一种卷积神经网络量化电路，其特征在于包括原始参数池、比较器阵列、量化参数计算单元和算术运算单元，

所述原始参数池用于存储卷积神经网络每层计算所需的原始参数数据，包括每层所有卷积核各通道数据和偏置数据；

所述量化参数计算单元用于对所述最大值及最小值进行算术运算，得到模型量化所用的各参数；

2.根据权利要求1所述的一种卷积神经网络量化电路，其特征在于还包括微调单元，用于对量化结果进行修正，以消除算术运算单元运算产生的误差。

3.根据权利要求1或2所述的一种卷积神经网络量化电路，其特征在于还包括激活单元，用于根据量化参数，将量化后的数据截短，以满足下一层卷积神经网络输入要求。

4.根据权利要求3所述的一种卷积神经网络量化电路，其特征在于所述量化参数计算单元得到的量化参数包括：卷积核量化零值、量化扩展系数、量化移位位数一、量化移位位数二、输出量化零值、偏置扩展系数和全连接输出量化零值。

5.根据权利要求4所述的一种卷积神经网络量化电路，其特征在于所述算术运算单元包括加法阵列、位移阵列和乘法器阵列，对输入特征图与输入特征图量化零值作差运算，对输入卷积核与卷积核量化零值作差运算，对减去零值的输入特征图及卷积核乘积运算，对乘积结果与量化扩展系数进行乘积运算，对二次乘积结果进行两次量化移位计算，对移位结果和输出量化零值进行求和运算，对原始偏置与偏置扩展系数进行乘积运算，对全连接输出和全连接输出量化零值进行求和。

6.根据权利要求5所述的一种卷积神经网络量化电路，其特征在于在量化扩展乘积运算之后以及第一次量化位移之后，对结果进行微调计算。

7.根据权利要求5所述的一种卷积神经网络量化电路，其特征在于所述输入特征图量化零值经模型重新训练得到。

8.一种卷积神经网络量化方法，其特征在于该方法通过以下步骤实现：

2)、利用极值及特定算法得到量化过程所需参数；

3)、在原有卷积神经网络计算过程基础上添加量化计算，得到量化后的输出结果；

4)、对结果进行修正及激活截短，以适应下一层卷积神经网络输入。

9.根据权利要求8所述的一种卷积神经网络量化方法，其特征在于所述量化后的输出结果均以无符号位指定位数的整数格式表示。

10.根据权利要求8或9所述的一种卷积神经网络量化方法，其特征在于所述量化计算为：对输入特征图与输入特征图量化零值作差运算，对输入卷积核与卷积核量化零值作差运算，对减去零值的输入特征图及卷积核乘积运算，对乘积结果与量化扩展系数进行乘积运算，对二次乘积结果进行两次量化移位计算，对移位结果和输出量化零值进行求和运算，对原始偏置与偏置扩展系数进行乘积运算，对全连接输出和全连接输出量化零值进行求和。