CN108133266B

CN108133266B - 一种基于非均匀量化的神经网络权值压缩方法及使用方法

Info

Publication number: CN108133266B
Application number: CN201711318643.0A
Authority: CN
Inventors: 徐湛; 张倩文; 程亚冰; 张德生
Original assignee: Beijing Information Science and Technology University
Current assignee: Beijing Information Science and Technology University
Priority date: 2017-12-12
Filing date: 2017-12-12
Publication date: 2021-07-09
Anticipated expiration: 2037-12-12
Also published as: CN108133266A

Abstract

本发明涉及一种基于非均匀量化的神经网络权值压缩方法及使用方法，其步骤：基于数据概率对连接权值分组；最大值归一化：将分组后的连接权值做最大值归一化处理，使得连接权值的幅度值处于[‑1 1]；将归一化后的连接权值采用非均匀量化的A律压缩进行压缩编码。本发明能有效保证系统性能，显著降低了连接权值存储所需的容量，有利于深度神经网络在嵌入式系统中的应用。

Description

一种基于非均匀量化的神经网络权值压缩方法及使用方法

技术领域

本发明涉及一种深度学习神经网络压缩方法及使用方法，特别是关于一种在计算机应用领域中应用的基于非均匀量化的神经网络权值压缩方法及使用方法。

背景技术

人工神经网络(ANN)，作为对人脑最简单的一种抽象和模拟，是人们模仿人的大脑神经系统信息处理功能的一个智能化系统，是20世纪80年代以来人工智能领域兴起的研究热点。人工神经网络以数学和物理方法以及信息处理的角度对人脑神经网络进行抽象，并建立某种简化模型，旨在模仿人脑结构及其功能的信息处理系统。

人工神经网络是由多个神经元连接构成，一个典型的人工神经元模型如图1所示。

其中，x_j为神经元i的输入信号，w_ij为连接权值，b为外部刺激，f为激励函数，y_i为神经元的输出，其输出公式为：

由上式可见，由于深度学习网络层数很多，网络规模较大，对于连接权值存储的问题成为嵌入式系统应用的瓶颈。由于连接权值在幅度分布上具有高斯分布的概率密度特征，采用均匀量化不能同时较好的描述幅度大的连接权值和幅度小的连接权值。

发明内容

针对上述问题，本发明的目的是提供一种基于非均匀量化的神经网络权值压缩方法及使用方法，该方法能有效保证系统性能，显著降低了连接权值存储所需的容量，有利于深度神经网络在嵌入式系统中的应用。

为实现上述目的，本发明采取以下技术方案：一种基于非均匀量化的神经网络权值压缩方法，其特征在于包括以下步骤：1)基于数据概率对连接权值分组；2)最大值归一化：将分组后的连接权值做最大值归一化处理，使得连接权值的幅度值处于[-1 1]；3)将归一化后的连接权值采用非均匀量化的A律压缩进行压缩编码。

进一步，所述步骤1)中，分组过程如下：1.1)将权值以0为中心，左右平均分成两组：分组0和分组1；1.2)在分组0中权值增加偏移值C0，该偏移值为分组0的均值，使得权值负值空间域的数据集均值近似为0；1.3)在分组1同样增加偏移值C1，该偏移值为分组1的均值，使得权值正值空间域的数据集均值也近似为0；1.4)通过分组处理后，分组0和分组1近似服从均值为0的高斯分布，并增加一位分组标识符进行分组的区分。

进一步，所述步骤3)中，A律压缩公式F(x)为：

式中，A是压缩参数，x是需要压缩的归一化后的权值。

进一步，所述步骤3)中，在进行A律压缩时，线性的11+1位数据，默认其最高位为符号位，压缩时要保持最高位符号位不变；将压缩后的码字格式定义为PSSSQQQQ,相当于将正负权值输入分为8个区段(0-7)，其中P(7)为符号位；SSS(4-6)表示段值；QQQQ(0-3)表示量化值。

进一步，所述步骤3)中，具体压缩编码过程如下：将归一化后的连接权值分别与最小量化间隔相除计算出每个权值含有的量化单位，对权值的量化单位进行二进制编码，将编码后的二进制数在输入值与压缩编码间的关系表中查找得到相应的压缩后的码字，该码字即为压缩后的连接权值。

进一步，所述输入值与压缩编码间的关系表为：

其中，0代表正，1代表负，压缩前码字符号放在最高位，压缩后码字符号放在最高位，×为压缩中丢弃的比特数。

一种如上述压缩方法的使用方法，即利用压缩后权值进行决策时的使用方法，其特征在于包括以下步骤：1)将非线性编码转换成线性的二进制编码；2)分组合并：根据分组标识符，如果属于分组0，压缩后权值减少偏移常量C0；如果属于分组1，压缩后权值减少偏移常量C1。

进一步，所述步骤1)中，转换时先不考虑符号位，将存储的压缩码字的低7位通过从A律压缩码字到线性码字的扩展转换表得到扩展后的无符号位的11位线性码字，再加上存储的符号位码即得出线性的12位线性码字。

进一步，所述从A律压缩码字到线性码字的扩展转换表为：

本发明由于采取以上技术方案，其具有以下优点：1、本发明的压缩方法与同类方法相比，本发明适用于神经网络中权值的大规模存储，保证了系统性能，显著降低了连接权值存储所需的容量，有利于深度神经网络在嵌入式系统中的应用。2、本发明是基于神经网络应用在资源有限的嵌入式系统中的一个关键环节，对连接权值进行压缩后存储可以有效解决连接权值存储容量大与有限存储空间之间的矛盾。

附图说明

图1是现有典型的人工神经元模型示意图；

图2是本发明的连接权值的压缩存储流程示意图；

图3是本发明分组前的权值分布示意图；

图4是本发明分组后的权值分布示意图；

图5是本发明的权值数据分组、压缩数据格式；

图6是本发明的权值数据解压、数据分组格式。

具体实施方式

下面结合附图和实施例对本发明进行详细的描述。

如图2所示，本发明提供一种基于非均匀量化的神经网络权值压缩方法，该方法是针对神经网络在训练完成后得到的连接权值进行分组，最大值归一化以及压缩编码。具体过程如下：

1)由于在连接权值的训练过程中，通常要进行剪支操作，导致训练得到的神经网络权值分布呈现为双驼峰分布，如图3所示。故基于数据概率对连接权值分组：

1.1)将权值以0为中心，左右平均分成两组：分组0和分组1。

1.2)在分组0中权值增加偏移值C0，该偏移值为分组0的均值，使得权值负值空间域的数据集均值近似为0。

1.3)在分组1同样增加偏移值C1，该偏移值为分组1的均值，使得权值正值空间域的数据集均值也近似为0。

1.4)通过分组处理后，分组0和分组1近似服从均值为0的高斯分布，如图4所示。

其中，通过分组后，需要增加一位分组标识符进行分组的区分。

2)最大值归一化：将分组后的连接权值做最大值归一化处理，使得连接权值的幅度值处于[-1 1]。

3)将归一化后的连接权值采用非均匀量化的A律压缩进行压缩编码，A律压缩公式F(x)为：

式中，A是压缩参数，取值不同其压缩特性亦不相同，国标采用A＝87.6的13折线压缩方式。x是需要压缩的归一化后的权值。

在进行A律压缩时，线性的11+1位数据，默认其最高位为符号位，压缩时要保持最高位符号位不变。将压缩后的码字格式定义为PSSSQQQQ,相当于将正负权值输入分为8个区段(0-7)。其中P(7)为符号位；SSS(4-6)表示段值；QQQQ(0-3)表示量化值。这种编码方式降低了连接权值的存储容量，且使压缩、解压变得简洁而有效率。

输入值与压缩编码间的关系如表1所示：

表1从线性到A律的压缩转换

其中符号位：“0”代表正，“1”代表负，压缩前码字符号放在最高位(比特第12位)，压缩后码字符号放在最高位(比特第8位)，为了简化未写出。abcd表示四位二进制数。在压缩前码字中，当线性码只有四位时abcd表示这四位二进制码，当线性码超过4位时abcd由最高位“1”之后的四位表示。在压缩后码字中abcd表示量化值。×为压缩中丢弃的比特数，输入值越大，被丢弃的比特数越多。也就是说，数值小的连接权值，由于需要被更细致的数值描述，因此被丢弃的比特数少，而对于数值大的连接权值，被丢弃的比特数可以多些，通过上述压缩方法，在显著降低量化位数的情况下，整体的压缩量化损失较小。

具体压缩编码过程如下：

将归一化后的连接权值分别与最小量化间隔(12位线性码对应最小量化间隔为1/2048)相除计算出每个权值含有的量化单位，对权值的量化单位进行二进制编码，将编码后的二进制数在表1中查找得到相应的压缩后的码字。该码字即为压缩后的连接权值。

下面取归一化后连接权值数据集中的一个具体数据进行举例说明。

设数据集中的一个权值i_s＝-0.62，取绝对值后为I_s＝0.62，I_s与最小量化间隔相除得到权值含有的量化单位，可计算I_s＝0.62×2048＝1269.76≈1270Δ个量化单位。

1270＝1024+128+64+32+16+4+2＝2¹⁰+2⁷+2⁶+2⁵+2⁴+2²+2¹

所以相应的12位线性码为110011110110。取除去最高位符号位后的低11位“10011110110”根据从线性到A律的压缩转换表可以得出压缩后码字位为“1110011”，加上符号位后最终得到的压缩码字为11110011。

将所有连接权值压缩后可以在嵌入式平台中进行存储以备神经网络决策时使用。如上所述，所提出的基于连接权值分组压缩的存储数据格式如图5所示。

本发明还提供一种基于非均匀量化的神经网络权值压缩使用方法，即利用压缩后权值进行决策时的使用方法，在利用压缩后的连接权值进行决策时，需要采用与压缩过程相反的两个模块。分别是非线性解压缩模块和分组合并模块；其步骤如下：

1)非线性解压缩模块：将存储的非线性编码转换成线性的二进制编码。

A律扩展原理定义为：

从A律压缩码字到线性码字的扩展转换如表2所示，转换时先不考虑符号位，将存储的压缩码字的低7位通过转换表得到扩展后的无符号位的11位线性码字，再加上存储的符号位码即可得出线性的12位线性码字。解压缩的过程如表2表示。

表2从压缩码字到线性码字的解压缩对应表

2)分组合并：

根据分组标识符，如果属于分组0，压缩后权值减少偏移常量C0；如果属于分组1，压缩后权值减少偏移常量C1，如图6所示。

上述各实施例仅用于说明本发明，各部件的结构、尺寸、设置位置及形状都是可以有所变化的，在本发明技术方案的基础上，凡根据本发明原理对个别部件进行的改进和等同变换，均不应排除在本发明的保护范围之外。

Claims

1.一种基于非均匀量化的神经网络权值压缩方法，其特征在于包括以下步骤：

1)基于数据概率对连接权值分组；

2)最大值归一化：将分组后的连接权值做最大值归一化处理，使得连接权值的幅度值处于[-1 1]；

3)将归一化后的连接权值采用非均匀量化的A律压缩进行压缩编码；

所述步骤1)中，分组过程如下：

1.1)将权值以0为中心，左右平均分成两组：分组0和分组1；

1.2)在分组0中权值增加偏移值C0，该偏移值为分组0的均值，使得权值负值空间域的数据集均值近似为0；

1.3)在分组1同样增加偏移值C1，该偏移值为分组1的均值，使得权值正值空间域的数据集均值也近似为0；

1.4)通过分组处理后，分组0和分组1近似服从均值为0的高斯分布，并增加一位分组标识符进行分组的区分；

所述步骤3)中，在进行A律压缩时，线性的11+1位数据，默认其最高位为符号位，压缩时要保持最高位符号位不变；将压缩后的码字格式定义为PSSSQQQQ,相当于将正负权值输入分为8个区段(0-7)，其中P(7)为符号位；SSS(4-6)表示段值；QQQQ(0-3)表示量化值。

2.如权利要求1所述的一种基于非均匀量化的神经网络权值压缩方法，其特征在于：所述步骤3)中，A律压缩公式F(x)为：

式中，A是压缩参数，x是需要压缩的归一化后的权值。

3.如权利要求1或2所述的一种基于非均匀量化的神经网络权值压缩方法，其特征在于：所述步骤3)中，具体压缩编码过程如下：将归一化后的连接权值分别与最小量化间隔相除计算出每个权值含有的量化单位，对权值的量化单位进行二进制编码，将编码后的二进制数在输入值与压缩编码间的关系表中查找得到相应的压缩后的码字，该码字即为压缩后的连接权值。

4.如权利要求3所述的一种基于非均匀量化的神经网络权值压缩方法，其特征在于：所述输入值与压缩编码间的关系表为：

5.一种如权利要求1至4任一项所述压缩方法的使用方法，即利用压缩后权值进行决策时的使用方法，其特征在于包括以下步骤：

1)将非线性编码转换成线性的二进制编码；

2)分组合并：根据分组标识符，如果属于分组0，压缩后权值减少偏移常量C0；如果属于分组1，压缩后权值减少偏移常量C1。

6.如权利要求5所述的使用方法，其特征在于：所述步骤1)中，转换时先不考虑符号位，将存储的压缩码字的低7位通过从A律压缩码字到线性码字的扩展转换表得到扩展后的无符号位的11位线性码字，再加上存储的符号位码即得出线性的12位线性码字。

7.如权利要求6所述的使用方法，其特征在于：所述从A律压缩码字到线性码字的扩展转换表为：