WO2021174790A1

WO2021174790A1 - 稀疏量化神经网络编码模式识别方法与系统

Info

Publication number: WO2021174790A1
Application number: PCT/CN2020/113050
Authority: WO
Inventors: 周喜川; 刘奎; 梁松红
Original assignee: 重庆大学
Priority date: 2020-03-05
Filing date: 2020-09-02
Publication date: 2021-09-10
Also published as: CN111460905A

Abstract

本发明涉及一种稀疏量化神经网络编码模式识别方法与系统，属于神经网络技术领域。该系统包括CPU、直接存储器访问DMA、串口、总线、控制器、片上内存和神经网络加速器；CPU控制整个计算进程的运行，串口用于接收数据，DMA用于调度输入数据的传输，总线用于传输控制命令和数据；神经网络加速器包括计算阵列与输入帧缓存和输出帧缓存，用于实现数据缓冲和数据复用；输入帧缓存用于抓取每次卷积需要的数据，并将数据进行重新排列；计算阵列用于实现神经网络内部的计算，每个计算阵列包括多个计算单元，每个计算单元实现稀疏量化神经网络中一个宏模块所有计算。本发明中比常规的和其他数据驱动的激活压缩方法更强大，具有更强的鲁棒性。

Description

稀疏量化神经网络编码模式识别方法与系统

技术领域

本发明属于神经网络技术领域，特别是稀疏量化神经网络领域，涉及一种稀疏量化神经网络编码模式识别方法与系统。

背景技术

卷积神经网络对于人工智能已被证明是成功的，在不同的计算机视觉应用上具有巨大的潜力，比如自动驾驶和机器人。但是由于其大量的参数，导致其在资源受限的移动嵌入式平台上的基于模式识别的深度学习依然是一个挑战。为了应对这个挑战，高能效神经网络硬件设计的研究吸引了从学术界到工业界的关注。为了使神经网络硬件系统具有更高的能效，常常需要进行软硬件协同设计，即在算法层面需要对神经网络进行面向硬件实现的优化。目前一种常见的优化方法是对神经网络激活进行量化压缩。通常采用的量化方法是在神经网络反向传播过程中，不断进行迭代的四舍五入取整量化。这种舍入的方法会导致信息的丢失，尤其当数据较小时，会造成很大的数据失真。并且舍入计算不可导，无法在基于梯度下降的神经网络反向传播过程中找到其最优解，从而导致神经网络量化后的性能下降。

另外一种极限压缩深度神经网络的方法使用一位二值制数来表示神经网络，该神经网络通过解决非凸规划问题，使用+1和-1连接来近似神经网络的参数。这种方法虽然可以极大的压缩神经网络，但会引起神经网络性能的大幅下降。

近来，有人提出了一种基于比特感知的方法，证明定点激活中的某些比特可以被删除，并且不会显著影响分类结果。这种方法是基于实验结果删除激活中的某些比特，不具备理论基础，结果并不鲁棒。

发明内容

有鉴于此，本发明的目的在于提供一种稀疏量化神经网络编码模式识别方法与系统。为了使神经网络硬件设计后具有更高的性能，使用的硬件资源更少，期望量化的神经网络准确率更高，码率更低。而上述的量化和压缩方法都是不可微和非凸的，在实际中几乎无法得到其最优的解，导致神经网络激活完整性和分类准确率丢失。代替使用传统的迭代方法来量化和压缩卷积神经网络激活，本发明提出了一种基于稀疏凸优化的信息比特瓶颈方法来实现最优的量化和压缩。该方法基于率失真理论(Rate Distortion Theory)，作为是一种有损的数据压缩编码方法，试图用于确定在定点激活中最重要的比特位，并且使量化损失最小。从技术上讲，比特瓶颈将神经网络的量化与压缩转化为了一个稀疏凸优化的问题，能够估量激活中最重要的比特，达到最小的平方差失真。因为不重要的比特通常是近乎零的系数，因此激活能够被最优的进行按位压缩。该方法能够有效压缩目前的定点神经网络激活，使神经网络激活表示的码率更低，且准确率相比原网络几乎不丢失，能够

节省神经网络硬件系统的硬件资源和功耗。

为达到上述目的，本发明提供如下技术方案：

稀疏量化神经网络编码模式识别方法，该方法包括以下步骤：

假设f：R ^D→I ^d是量化函数，将输入的D-bit实值数据转换为d-bit整数；假设g(·)是指示输入数据码率的函数；根据率失真理论，典型的有损数据压缩方法尝试在给定最大比特数的情况下，最小化失真函数d(·)：

min d(x，f(x))st.g(x)≤η (1)

假定

是与第i个样本相关的浮点激活矢量；标准的量化函数使用D个二值矢量x _i1,x _i2,…,x _iD来近似

记作

x _ij∈{0，1} ^M，表示x _i的第j个比特位的M维二值矢量；假设实值激活

被归一化到[0，2 ^D]的区域，则标准的舍入量化方法使用如下定点数据：

其中每个比特分配有一个常数系数{2 ⁰，...，2 ^D-1}，并且x _ij的值通过四舍五入

得到；

用变量α∈R ^D替换固定系数，如下：

找到并估计与最重要比特相关的最优稀疏系数α；

将N个训练样本上的最小化标准平方失真率定义为

公式(4)等效于以下基于L1范数求解稀疏解的问题：

比特瓶颈操作通过求解公式(5)，以确定稀疏的重要的比特位，并实现最小的率失真；通过求解它的对偶形式来求解公式(5)：

其中λ是用于控制最优的错误率和码率的超参数：公式(6)导致系数α的稀疏解，并且在推理阶段将与D-d零系数相关的激活比特位删除，提高计算效率；

接着进行以下步骤：

步骤1：选择一个预训练好的神经网络模型，设置一个压缩的峰值信噪比PSNR损失阈值，记为T，确定一个初始量化码率，记为D；

步骤2：应用任意基础方法来量化预训练神经网络的激活，得到具有D-bit定点表示的激活，即公式(5)中的x _ij∈{0，1} ^M；

步骤3：在每个卷积层之前，通过求解公式(6)来训练信息比特瓶颈，并将其插入网络模型中以减少基础量化的损失；以相同PNSR损失阈值T为参考，每个比特瓶颈具有不同的稀疏性等级和不同数量的非零系数α _j，等效于压缩后的有效码率小于D；

步骤4：通过反向传播训练过程，对具有信息瓶颈的深层神经网络的权值进行调优和量化；

步骤5：将训练好的神经网络的权值、比特系数矢量α和偏置加载到神经网络硬件系统，硬件系统部署完成。

可选的，包括CPU、直接存储器访问DMA、串口、总线、控制器、片上内存和神经网络加速器；

CPU控制整个计算进程的运行，串口用于接收数据，DMA用于调度输入数据的传输，总线用于传输控制命令和数据；

神经网络加速器包括计算阵列与输入帧缓存和输出帧缓存，用于实现数据缓冲和数据复用；输入帧缓存用于抓取每次卷积需要的数据，并将数据进行重新排列；

计算阵列用于实现神经网络内部的计算，每个计算阵列包括多个计算单元，每个计算单元实现稀疏量化神经网络中一个宏模块所有计算；

控制器用于控制各个模块的协调运作，并且通过总线与CPU通信，接收CPU的指令。

可选的，所述计算阵列包括多个计算单元，每个计算单元实现稀疏量化神经网络中一个宏模块所有计算。

可选的，所述一个宏模块所有计算包括批量归一化计算、比特瓶颈计算、卷积计算、激活计算和池化计算；比特瓶颈计算能够和卷积计算同时进行。

可选的，所述计算单元包括数据缓存模块、归一化和卷积模块、激活和池化模块；

所述数据缓存模块进行数据缓存后，在归一化和卷积模块中进行批量归一化、卷积位乘法阵列和偏置缓存；然后在激活和池化模块中进行激活和池化；然后输出激活。

本发明的有益效果在于：

1、首先，由于比特瓶颈压缩量化方法是凸的，因此它比常规的和其他数据驱动的激活压缩方法更强大，具有更强的鲁棒性。

2、其次，比特瓶颈操作非常灵活，可用于将浮点激活量化和压缩为任意大小的码率，从而使神经网络的硬件系统架构能够在不同应用的效率和精度之间进行权衡，减少硬件设计时的计算资源和存储消耗，以及可以降低整个系统架构的功耗。

3、最后，由于比特瓶颈可以将量化和压缩导致的激活信息丢失降至最低，因此具有比特瓶颈的深度神经网络硬件系统架构可以比使用其他激活压缩方法的硬件系统架构实现更高的分类精度。

本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述，并且在某种程度上，基于对下文的考察研究对本领域技术人员而言将是显而易见的，或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。

附图说明

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作优选的详细描述，其中：

图1为稀疏量化神经网络架构图；

图2为稀疏量化神经网络系统硬件架构图；

图3为基于稀疏量化编码神经网络系统架构使用方法；

图4为实施例示意图。

具体实施方式

以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。需要说明的是，以下实施例中所提供的图示仅以示意方式说明本发明的基本构想，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。

其中，附图仅用于示例性说明，表示的仅是示意图，而非实物图，不能理解为对本发明的限制；为了更好地说明本发明的实施例，附图某些部件会有省略、放大或缩小，并不代表实际产品的尺寸；对本领域技术人员来说，附图中某些公知结构及其说明可能省略是可以理解的。

本发明实施例的附图中相同或相似的标号对应相同或相似的部件；在本发明的描述中，需要理解的是，若有术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此附图中描述位置关系的用语仅用于示例性说明，不能理解为对本发明的限制，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语的具体含义。

最近，人们越来越有兴趣在深度学习研究中阐明信息理论，寻求最佳神经网络激活压缩。通过将深度神经网络视为一种有损数据压缩方法，人们打开了深度神经网络的黑匣子，并使用率失真理论工具分析其性能，该方法已广泛应用于通信领域。

1、提出的稀疏量化编码算法原理阐述

有损数据压缩的目标是在最大编码率的限制下实现最小的率失真。假设f：R ^D→I ^d是量化函数，它将输入的D-bit实值数据转换为d-bit整数。假设g(·)是指示输入数据码率的函数。根据率失真理论，典型的有损数据压缩方法尝试在给定最大比特数的情况下，最小化失真函数d(·)。

min d(x，f(x))st.g(x)≤η (1)

实际上，由于其整数输出，量化函数f(x)是不可微且非凸的，这使其难以求解。与典型基于四舍五入的量化方法不同，其只提供了一个次优解决方案，本文尝试通过将公式(1)重新转化为稀疏编码问题来找到最佳解。

假定

记作

得到；

用变量α∈R ^D替换固定系数，如下：

而且，该方法试图找到并估计与最重要比特相关的最优稀疏系数α。

受到公式(1)的率失真理论的启发，该方法尝试将N个训练样本上的最小化标准平方失真率定义为

其中基于L0范数的约束限制了非零系数的总数，这将导致系数α稀疏。由于α中非零系数的数量等于定点表示中的比特位数，因此公式(4)的约束函数实际上会按照率失真理论的要求限制量化表示中的最大比特位数。

最近的研究表明，公式(4)等效于以下基于L1范数求解稀疏解的问题。

比特瓶颈操作通过求解公式(5)，以确定稀疏的重要的比特位，并实现最小的率失真。在实践中，通常通过求解它的对偶形式来求解公式(5)。

其中λ是用于控制最优的错误率和码率的超参数。公式(6)通常导致系数α的稀疏解，并且在推理阶段将与D-d零系数相关的激活比特位删除，计算效率可以显着提高。

2、基于稀疏量化编码神经网络架构与系统硬件架构设计

如公式(5)所示，信息比特瓶颈操作计算与压缩激活表示形式的每个比特位相关的最佳系数，以便在给出最大编码率的情况下可以实现最小失真率。本部分显示了信息瓶颈在深度神经网络中的工作方式。

比特瓶颈可以插入不同的网络的宏块中，典型的宏块包依次含批量归一化层，比特瓶颈层，卷积层，激活层，池化层(可选)。由于位瓶颈层将归一化的浮点激活转换为压缩的定点激活，卷积层可以将计算量大的浮点乘法替换为高效的定点整数乘法。定点整数乘法通常是以按位计算的方式实现，激活比特的数量与实际按位计算的次数成正比。因此，计算密集型的卷积计算的时间和内存效率能够被极大的提升。

如图1所示，硬件整体架构包括CPU、DMA(直接存储器访问)、串口、总线、片上内存和神经网络加速器6个部分组成。CPU控制整个计算进程的运行，串口用于接收数据，DMA用于调度输入数据的传输，总线用于传输控制命令和数据。神经网络计算加速器主要由计算阵列与输入帧缓存和输出帧缓存组成。输入输出帧缓存用于实现数据缓冲和数据复用。计算阵列用于实现神经网络内部的计算，多个阵列设计，以及每个阵列多个计算单元设计，目的都是实现神经网络的并行计算，增加计算效率。

如图2所示，每个计算单元实现稀疏量化神经网络中一个宏模块所有计算，包括批量归一化计算、比特瓶颈计算、卷积计算、激活计算和池化计算。输入块缓存用于抓取每次卷积需要的数据，并将数据进行重新排列。在硬件设计时，比特瓶颈计算能够和卷积计算同时进行。控制器用于控制各个模块的协调运作，并且通过总线与CPU通信，接收CPU的指令。

3、基于稀疏量化编码神经网络系统架构使用步骤

本专利提出稀疏量化神经网络系统利用比特瓶颈操作提取激活的数据比特间的稀疏性，以减少量化导致的激活完整性和分类准确性的损失。假设有人打算得到一个神经网络激活小于D-bit的稀疏量化神经网络系统，需要进行如下五个步骤。

步骤1：选择一个预训练好的神经网络模型，设置一个压缩的峰值信噪比(PSNR)损失阈值，记为T，确定一个初始量化码率，记为D。

步骤2：应用任意基础方法来量化预训练神经网络的激活，得到具有D-bit定点表示的激活，即公式(5)中的x _ij∈{0，1} ^M。

步骤3：在每个卷积层之前，可通过求解公式(6)来训练信息比特瓶颈，并将其插入网络模型中以减少基础量化的损失。以相同PNSR损失阈值T为参考，每个比特瓶颈都可能具有不同的稀疏性等级和不同数量的非零系数α _j，这等效于压缩后的有效码率小于D。

步骤4：通过反向传播训练过程，对具有信息瓶颈的深层神经网络的权值进行了调优和量化。

步骤5：将训练好的神经网络的权值、比特系数矢量α和偏置加载到神经网络硬件系统。至此，整个硬件系统部署完成，能够投入到实际应用中。

有关使用方法的更多详细信息，请参见图3流程图。

如图4所示，该稀疏量化神经网络硬件系统能够应用在带识别功能的无人机平台上。摄像头拍摄图像，传给硬件系统进行智能信息处理，对视频图像信息进行检测识别，将结果传回无人机控制系统，控制系统可以将信息发给地面接收站，并且控制系统也可以根据识别结果控制电机，从而控制飞机的飞行姿态和路径。该系统可以实现森林火灾检测、特定目标追踪、城市智慧消防、输电线路巡检等功能。稀疏量化神经网络硬件系统能够加快信息处理，实现高速的识别，可以应用在需要进行高速图片信息处理的移动嵌入式系统上，比如无人机、自动驾驶汽车、智能机器人等。

最后说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本技术方案的宗旨和范围，其均应涵盖在本发明的权利要求范围当中。

Claims

稀疏量化神经网络编码模式识别方法，其特征在于：该方法包括以下步骤：

假设f：R ^D→I ^d是量化函数，将输入的D-bit实值数据转换为d-bit整数；假设g(·)是指示输入数据码率的函数；根据率失真理论，典型的有损数据压缩方法尝试在给定最大比特数的情况下，最小化失真函数d(·)：

min d(x，f(x))st.g(x)≤η (1)假定
是与第i个样本相关的浮点激活矢量；标准的量化函数使用D个二值矢量x _i1,x _i2,…,x _iD来近似
记作
x _ij∈{0，1} ^M，表示x _i的第j个比特位的M维二值矢量；假设实值激活
被归一化到[0，2 ^D]的区域，则标准的舍入量化方法使用如下定点数据：

其中每个比特分配有一个常数系数{2 ⁰，...，2 ^D-1}，并且x _ij的值通过四舍五入
得到；

用变量α∈R ^D替换固定系数，如下：

找到并估计与最重要比特相关的最优稀疏系数α；

将N个训练样本上的最小化标准平方失真率定义为

公式(4)等效于以下基于L1范数求解稀疏解的问题：

比特瓶颈操作通过求解公式(5)，以确定稀疏的重要的比特位，并实现最小的率失真；通过求解它的对偶形式来求解公式(5)：

其中λ是用于控制最优的错误率和码率的超参数：公式(6)导致系数α的稀疏解，并且在推理阶段将与D-d零系数相关的激活比特位删除，提高计算效率；

接着进行以下步骤：

步骤1：选择一个预训练好的神经网络模型，设置一个压缩的峰值信噪比PSNR损失阈值，记为T，确定一个初始量化码率，记为D；

步骤2：应用任意基础方法来量化预训练神经网络的激活，得到具有D-bit定点表示的激活，即公式(5)中的x _ij∈{0，1} ^M；

步骤3：在每个卷积层之前，通过求解公式(6)来训练信息比特瓶颈，并将其插入网络模型中以减少基础量化的损失；以相同PNSR损失阈值T为参考，每个比特瓶颈具有不同的稀疏性等级和不同数量的非零系数α _j，等效于压缩后的有效码率小于D；

步骤4：通过反向传播训练过程，对具有信息瓶颈的深层神经网络的权值进行调优和量化；

步骤5：将训练好的神经网络的权值、比特系数矢量α和偏置加载到神经网络硬件系统，硬件系统部署完成。
稀疏量化神经网络编码模式识别系统，其特征在于：包括CPU、直接存储器访问DMA、串口、总线、控制器、片上内存和神经网络加速器；

CPU控制整个计算进程的运行，串口用于接收数据，DMA用于调度输入数据的传输，总线用于传输控制命令和数据；

神经网络加速器包括计算阵列与输入帧缓存和输出帧缓存，用于实现数据缓冲和数据复用；输入帧缓存用于抓取每次卷积需要的数据，并将数据进行重新排列；

计算阵列用于实现神经网络内部的计算；

控制器用于控制各个模块的协调运作，并且通过总线与CPU通信，接收CPU的指令。
根据权利要求2所述的稀疏量化神经网络编码模式识别系统，其特征在于：所述计算阵列包括多个计算单元，每个计算单元实现稀疏量化神经网络中一个宏模块所有计算。
根据权利要求3所述的稀疏量化神经网络编码模式识别系统，其特征在于：所述一个宏模块所有计算包括批量归一化计算、比特瓶颈计算、卷积计算、激活计算和池化计算；比特瓶颈计算能够和卷积计算同时进行。
根据权利要求4所述的稀疏量化神经网络编码模式识别系统，其特征在于：所述计算单元包括数据缓存模块、归一化和卷积模块、激活和池化模块；

所述数据缓存模块进行数据缓存后，在归一化和卷积模块中进行批量归一化、卷积位乘法阵列和偏置缓存；然后在激活和池化模块中进行激活和池化；然后输出激活。