WO2018107414A1

WO2018107414A1 - 压缩/解压缩神经网络模型的装置、设备和方法

Info

Publication number: WO2018107414A1
Application number: PCT/CN2016/110053
Authority: WO
Inventors: 陈天石; 韦洁; 陈云霁; 刘少礼; 支天; 郭崎
Original assignee: 上海寒武纪信息科技有限公司
Priority date: 2016-12-15
Filing date: 2016-12-15
Publication date: 2018-06-21

Abstract

一种压缩/解压缩神经网络模型的装置、设备和方法。其中包括步骤：获取神经网络模型的待压缩参数；采用神经网络算法对所述待压缩参数进行压缩和训练，获得低维的神经网络参数；解压所述低维的神经网络参数，恢复神经网络模型的参数。本发明用自动编码神经网络算法实现压缩/解压缩神经网络模型的装置，可减少神经网络模型的参数，有利于模型的存储和传输。

Description

压缩/解压缩神经网络模型的装置、设备和方法

技术领域

本发明涉及神经网络模型压缩/解压缩算法应用技术领域，更具体地涉及一种压缩/解压缩神经网络模型的装置和设备，还涉及一种压缩/解压缩神经网络模型的方法。

背景技术

近年来，神经网络算法被广泛应用到各个领域，随着问题复杂度和对准确率要求的不断提高，神经网络模型深度不断增加，随之而来的是参数数量的爆炸式增长，这给神经网络模型的存储和传输带来了极大的不便。设想将来手机上每一个应用都具备深度学习的能力，但每一个应用都要传输、存储上G的神经网络模型参数，这显然是不合理的。

传统的降维方法大多是线性的，例如PCA(Principal Component Analysis，主成分分析)选取高维数据中方差最大的部分方向，通过选择这些方向，得到包含最多信息的低维表示。然而，PCA方法的线性性导致抽取出的特征类型有很大限制。

发明内容

本发明提供一种压缩/解压缩神经网络模型的方法，以及压缩/解压缩神经网络模型的装置和设备。

一种压缩/解压缩神经网络模型的方法，包括步骤：

S1：获取神经网络模型的待压缩参数；

S2：采用神经网络算法对所述待压缩参数进行压缩和训练，获得低维的神经网络参数；

S3：解压所述低维的神经网络参数，恢复神经网络模型的参数。

一种压缩/解压缩神经网络模型的装置，包括参数获取模块、模型压缩模块、模型存储模块和模型解压缩模块，其中，

参数获取模块，用于获取神经网络模型的待压缩参数；

模型压缩模块，用于采用神经网络算法压缩所述待压缩参数，并进行训练，获得低维的神经网络参数；

模型解压缩模块，用于解压缩低维的神经网络参数，形成恢复的神经网络参数；以及

存储模块，用于存储神经网络模型的待压缩参数、低维的神经网络参数和恢复的神经网络参数。

一种压缩/解压缩神经网络模型的设备，其中包括：

存储器，用于存储可执行指令；以及

处理器，用于执行存储器中存储的可执行指令，以执行如下操作：

获取神经网络模型的待压缩参数；

采用神经网络算法对所述待压缩参数进行压缩和训练，获得低维的神经网络参数；

解压所述低维的神经网络参数，恢复神经网络模型的参数。

为了对本发明上述及其他方面有更佳了解，下文特列举较佳实施例，并配合所附附图，作如下详细说明：

附图说明

图1为根据本发明一实施例的压缩/解压缩神经网络模型的装置的整体结构的示例框图；

图2为根据本发明一实施例的压缩/解压缩神经网络模型的装置中一种参数获取模块的示例框图；

图3为根据本发明一实施例的压缩/解压缩神经网络模型的装置中一种自动编码神经网络结构的示例框图；

图4为根据本发明一实施例的压缩/解压缩神经网络模型的装置中一种模型压缩模块的示例框图。

图5为根据本发明一实施例的压缩/解压缩神经网络模型的装置中一种模型解压缩模块的示例框图。

图6为根据本发明一实施例的压缩/解压缩神经网络模型的方法流程图。

图7为根据本发明一实施例的压缩/解压缩神经网络模型的设备的方框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本发明作进一步的详细说明。通过以下详细描述，本发明的其它方面、优势和突出特征对于本领域技术人员将变得显而易见。

在本说明书中，下述用于描述本发明原理的各种实施例只是说明，不应该以任何方式解释为限制本发明的范围。参照附图的下述描述用于帮助全面理解由权利要求及其等同物限定的本发明的示例性实施例。下述描述包括多种具体细节来帮助理解，但这些细节应认为仅仅是示例性的。因此，本领域普通技术人员应认识到，在不悖离本发明的范围和精神的情况下，可以对本文中描述的实施例进行多种改变和修改。此外，为了清楚和简洁起见，省略了公知功能和结构的描述。此外，贯穿附图，相同附图标记用于相似功能和操作。

本发明实施例提供压缩/解压缩神经网络模型的装置，可以将训练好的神经网络模型参数进行压缩，可节省模型的存储空间，有利于将神经网络移植到小内存设备。

图1为根据本发明实施方案给出的压缩/解压缩神经网络模型的装置整体结构的示例框图。其中该压缩/解压缩神经网络模型的装置，包括参数获取模块、模型压缩模块、模型存储模块和模型解压缩模块。

其中，参数获取模块，用于获取神经网络模型的待压缩参数；

具体的可以用于获取神经网络模块的待压缩参数，以及进行预处理(例如对待压缩参数进行稀疏化)，为模型压缩模块的输入做准备。其中，获取方式可以是对神经网络模型的待压缩参数进行遍历选取，直至选取的待压缩参数的数量等于设定的维数。

对于上述预处理，可以是对待压缩参数进行稀疏化，当需要对待压缩参数进行稀疏化时，可以包括：对神经网络模型的待压缩参数进行遍历选取，对所述待压缩参数进行稀疏化，对选取的待压缩参数进行判断，小于设定阈值的待压缩参数被置0，选取稀疏化后的非零元并标记非零元的位置坐标，直至选取的待压缩参数的数量等于设定的维数。该稀疏化可有效减少神经网络模型参数，节约存储模型所需的内存空间，有利于模型的传输和移植。

对于待压缩参数，其可以包括网络节点、权值、训练速率、激励函数以及偏置。

优选的，参数获取模块每一次输出设定维数的参数，直到遍历完神经网络模型的全部参数。

图2为本发明实施例的压缩/解压缩神经网络模型的装置中一种参数获取模块示意图。该模块获得神经网络模型一共有l个参数。如图2所示，对一个在卷积神经网络框架(caffe，Convolution Architecture For Feature ECtraction)中搭建的神经网络框架，参数文件中存放的参数为W[l]，模型压缩模块每次输入向量为X[l_input]，用布尔型数组Label[l]来标记稀疏化情况。设某次读取参数为w_i，阈值为threshold，此时X[l_input]前j-1项非空，则：若w_i的绝对值大于等于threshold，则将其存放到数组X[l_input]中，并将Label[i]置1，并读取下一个参数；若读取参数的绝对值小于阈值，则将Label[i]置0并读取下一个参数；直到数组X[l_input]放满(也即实现选取的待压缩参数的数量等于设定的维数)。

其中，模型压缩模块，用于压缩所述待压缩参数，采用神经网络算法进行训练，获得低维的神经网络参数。

具体的，通过自动编码(Auto-encoder)神经网络算法进行压缩，所述自动编码神经网络以多层感知器(MLP)为基础搭建，自动编码神经网络分为压缩(encoder)网络、隐(coder)层和解压缩(decoder)网络，隐层网络的输入和解压缩网络的输出节点数相同，隐层的节点数小于以上两者。所述压缩网络输入待压缩参数，输出至隐层，且输入的节点数大于输出的节点数。解压缩网络同样采用MLP结构，输入层为coder层，输出层与encoder输入层节点数相同。通过在隐层具有最少的节点，可有效减少参数数量、节约内存，有利于模型的存储和传输；在使用时解压缩神经网络模型，同时保证准确率，使神经网络算法更好地应用到实际中。

图3展示了本实例中自动编码神经网络的结构。其中压缩网络(相当于输入层)和解压缩网络(相当于输出层)都为三层MLP网络，输入层和输出层节点数相同为l_input，中间隐层(coder层)的节点数最少为l_compress，即：l_compress＜l_input，层与层之间是全连接的。这样通过神经网络算法压缩后的节点数减少，从而减少存储空间。

图4展示了一种模型压缩的过程，即自动编码神经网络的训练过程。

搭建好如图3所示自动编码神经网络后对权值进行初始化；

将参数提取得到的X[l_input]作为模型压缩模块的输入，前向传播计算得到各层的权重、偏置以及输出层的结果；

将输出层节点的值与X[l_input]进行比较，计算残差；

用梯度下降法更新权重和偏置；直到误差足够小或者达到最大训练次数时停止迭代；中间coder层的输出Y[l_compress]即为输入参数X[l_input]的低维表示。

保存被压缩神经网络模型的结构文件、布尔型数组Label[l]、decoder网络结构文件、decoder网络参数W_d以及coder层的输出Y[l_compress]，这些是解压神经网络模型必需的数据。

对于模型解压缩模块，用于解压低维的神经网络参数，形成恢复的神经网络参数，放置到神经网络中；其中，解压也通过以上所述的自动编码神经网络进行解压，包括有解压缩网络，所述压缩网络输入低维的神经网络参数，恢复神经网络参数的数量，并将恢复的神经网络参数对应的放置到网络中。

图5展示了一种解压缩神经网络模型的过程。将Y[l_compress]输入到参数为W_d的decoder网络，得到长度为l_input的输出X’[l_input]。设解压后的神经网络模型参数为W’[l]，并通过读取数组Label[l]的值将X’[l_input]对应到W’[l]中。若Label[i]为0，说明在参数提取时W[i]的绝对值小于稀疏化的阈值，被省略，则X’[l_input]中没有其对应项，W’[i]值为0；若Label[i]为1，则将X’[j]的值赋给W’[i]；遍历完数组Label[l]即可得到解压后的神经网络模型参数为W’[l]。

对于存储模块，参见图1所示，用于存储神经网络模型的待压缩参数、低维的神经网络参数(也即压缩后的参数)和恢复的神经网络参数。

可选的，当参数获取模块采用稀疏化后，存储模块还用于存储稀疏化时的标记。

上述装置的一种典型性整体工作流程如下：

对一个包括参数和结构的完整神经网络模型。先通过参数提取模块提取出一定数量参数；在模型压缩模块中使用自动编码(auto-encoder)神经网络算法压缩得到参数的低维表示，重复以上过程压缩完所有参数；储存相应的参数和网络结构；解压缩时将低维参数作为解压缩(decoder)网络的输入，恢复得到高维参数并对应放回到被压缩网络模型中，重复以上过程解压缩所有参数；将解压得到的参数对应放回被压缩网络模型，完成解压缩神经网络模型过程。

上述实施例的装置，是应用于待压缩参数进行稀疏化的情况。另一种情况是不进行稀疏化，该种情况下，对于神经网络模型结构和参数、以及自动编码网络结构和参数都可以与稀疏化的设置下同，只是在参数提取、模型储存以及解压缩过程方面有所区别。被压缩神经网络模型参数为W[l]，auto-encoder每次输入向量为X[l_input]。依次读取参数w_i，且令x_i＝w_i，直到i＝l_input。完成一组压缩过程后，继续读取W[l]中的参数。

由于不需要标记参数的稀疏化情况，要保存的数据为：被压缩神经网络模型的结构文件、解压缩网络结构文件、压缩网络参数W_d以及隐层的输出Y[l_compress]。

解压缩过程先将Y[l_compress]输入到参数为W_d的解压缩网络，得到长度为l_input的输出X’[l_input]。设解压后的神经网络模型参数为W’[l]，依次读取x′_i，且令w′_i＝x′_i；若i＝input则解压下一组参数，直到W’[l]全部被赋值。

本发明实施例的装置可有效减少神经网络模型参数，节约存储模型所需的内存空间，有利于模型的传输和移植。

基于同一发明构思，本发明实施例还提供一种压缩/解压缩神经网络模型的方法，参见图6所示，包括步骤：

S1：获取神经网络模型的待压缩参数；

对于步骤S1，其具体可以包括：对神经网络模型的待压缩参数进行遍历选取，直至选取的待压缩参数的数量等于设定的维数。

可选的，还可以对待压缩参数进行预处理，该预处理可以是对待压缩参数进行稀疏化，当需要对待压缩参数进行稀疏化时，可以包括：对神经网络模型的待压缩参数进行遍历选取，对所述待压缩参数进行稀疏化，对选取的待压缩参数进行判断，小于设定阈值的待压缩参数被置0，选取稀疏化后的非零元并标记非零元的位置坐标，直至选取的待压缩参数的数量等于设定的维数。该稀疏化可有效减少神经网络模型参数，节约存储模型所需的内存空间，有利于模型的传输和移植。

当需要对待压缩参数进行稀疏化时，步骤S1包括：对神经网络模型的待压缩参数进行遍历选取，对所述待压缩参数进行稀疏化，对选取的待压缩参数进行判断，小于设定阈值的待压缩参数被置0，选取稀疏化后的非零元并标记非零元的位置坐标，直至选取的待压缩参数的数量等于设定的维数。并且相对应的，如采用稀疏化步骤，则步骤S3中，解压后需要按照非零元的标记位置放置神经网络参数。

进行稀疏化或者非稀疏化时，所述遍历选取按照构建神经网络模型的先后顺序依次获取各层的待压缩参数。

对于步骤S2，其可以包括子步骤：

S21：以多层感知器为基础搭建自动编码神经网络，自动编码神经网络的输入层和输出层节点数相同，并且隐层节点数少于显层节点数；

S22：输入待压缩参数，对自动编码神经网络每层的神经元进行前向传导计算，得到各层的激活值；

S23：令输出等于输入，使用后向传导算法求出输出层以及各层神经元的残差；

S24：利用梯度下降法更新权值W和偏置B，使输出越来越接近输入；

S25：权值和偏置收敛后，输出隐层的值，即为低维的神经网络参数。

与一般有损压缩方法相比，用神经网络算法来压缩神经网络的模型，能够实现运算单元的复用，节约内存。

对于步骤S3，其可以包括：采用自动编码神经网络对低维的神经网络参数进行解压，压缩神经网络包括压缩网络、隐层和解压缩网络，恢复神经网络参数的数量，并将恢复的神经网络参数对应的放置到网络中。优选的，其可以采用步骤S21搭建的自动编码神经网络进行解压缩，恢复到输出层中。使用相应方法在解压时能够更大程度地恢复网络参数，相比于一般的线性降维方法有更高的准确率

对于步骤S1-S3未具体描述的细节，可以参照上述装置中相应模块所执行的指令进行，在此不予赘述。

基于同一发明构思，根据本发明实施例的再一方面，提供一种压缩/解压缩神经网络模型的设备。

图7为根据本发明一实施例的压缩/解压缩神经网络模型的设备的方框图。该设备700包括：

存储器702，用于存储可执行指令；以及

处理器701，用于执行存储器中存储的可执行指令，以执行如下操作：

获取神经网络模型的待压缩参数；

解压所述低维的神经网络参数，恢复神经网络模型的参数。

上述可执行指令对应上述方法中的相应步骤，在于通过处理器执行上述方法步骤对应的可执行指令。

上述处理器701可以是单个CPU(中央处理单元)，但也可以包括两个或更多个处理单元。例如，处理器可以包括通用微处理器、指令集处理器和/或相关芯片组和/或专用微处理器(例如，专用集成电路(ASIC))。处理器还可以包括用于缓存用途的板载存储器。优选的，采用专用的神经网络处理器，并且在指令执行时可以复用该神经网络处理器已经具有的神经网络，节省存储空间。

上述存储器702可以是闪存、随机存取存储器(RAM)、只读存储器(ROM)、EEPROM。优选的，可以采用搭载在芯片上的片上存储装置。存储器702除存储上述指令外，还可以存储指令执行过程中的待压缩参数、低维的神经网络参数，以及恢复的神经网络参数。

通过上述实施例，自动编码神经网络算法通过引入神经网络的非线性性克服了这些限制，并且输出与输入相等的监督模式使其结果更可靠。auto-encoder是一种无监督学习方法，它利用一个输入层和输出层表示相同的含义、具有相同的节点数的多层神经网络，学习一个输入输出相同的“恒等函数”。自动编码神经网络的意义在于学习最中间的隐层，这一层通常节点数较输入层和输出层更少，是输入向量的良好表示。这个过程起到了“降维”的作用，实现高维输入的低维表示。

在前述的说明书中，参考其特定示例性实施例描述了本发明的各实施例。显然，可对各实施例做出各种修改，而不悖离所附权利要求所述的本发明的更广泛的精神和范围。相应地，说明书和附图应当被认为是说明性的，而不是限制性的。

Claims

一种压缩/解压缩神经网络模型的方法，包括步骤：

S1：获取神经网络模型的待压缩参数；

S2：采用神经网络算法对所述待压缩参数进行压缩和训练，获得低维的神经网络参数；

S3：解压所述低维的神经网络参数，恢复神经网络模型的参数。
根据权利要求1所述的方法，其特征在于，步骤S1包括：

对神经网络模型的待压缩参数进行遍历选取，直至选取的待压缩参数的数量等于设定的维数。
根据权利要求1所述的方法，其特征在于，步骤S1包括：

对神经网络模型的待压缩参数进行遍历选取，对所述待压缩参数进行稀疏化，对选取的待压缩参数进行判断，小于设定阈值的待压缩参数被设置为0，选取稀疏化后的非零元并标记非零元的位置坐标，直至选取的待压缩参数的数量等于设定的维数。
根据权利要求2或3所述的方法，其特征在于，所述遍历选取按照构建神经网络模型的先后顺序依次获取各层的待压缩参数。
根据权利要求1所述的方法，其特征在于，步骤S2包括子步骤：

S21：以多层感知器为基础搭建自动编码神经网络，自动编码神经网络的输入层和输出层节点数相同，并且隐层节点数少于输入层节点数；

S22：输入待压缩参数，对自动编码神经网络每层的神经元进行前向传导计算，得到各层的激活值；

S23：令输出等于输入，使用后向传导算法求出输出层以及各层神经元的残差；

S24：利用梯度下降法更新权值W和偏置B，使输出越来越接近输入；

S25：权值和偏置收敛后，输出隐层的值，即为低维的神经网络参数。
根据权利要求5所述的方法，其特征在于，采用步骤S21中自动编码神经网络的部分网络进行解压缩，恢复到输出层中。
一种压缩/解压缩神经网络模型的装置，包括参数获取模块、模型压缩模块、模型存储模块和模型解压缩模块，其中，

参数获取模块，用于获取神经网络模型的待压缩参数；

模型压缩模块，用于采用神经网络算法压缩所述待压缩参数，并进行训练，获得低维的神经网络参数；

模型解压缩模块，用于解压缩低维的神经网络参数，形成恢复的神经网络参数；以及

存储模块，用于存储神经网络模型的待压缩参数、低维的神经网络参数和恢复的神经网络参数。
根据权利要求7所述的装置，其特征在于，所述模型压缩模块中，压缩所述待压缩参数通过自动编码神经网络算法进行压缩，自动编码神经网络分为压缩网络、中间隐层和解压缩网络，所述压缩网络输入待压缩参数，输出至中间隐层，且输入的节点数大于输出的节点数。
根据权利要求8所述的装置，其特征在于，所述自动编码神经网络以多层感知器为基础搭建。
根据权利要求8所述的装置，其特征在于，所述模型解压模块中，解压缩低维的神经网络参数通过所述解压缩网络进行解压，所述解压缩网络输入低维的神经网络参数，恢复神经网络参数的数量。
一种压缩/解压缩神经网络模型的设备，其中包括：

存储器，用于存储可执行指令；以及

处理器，用于执行存储器中存储的可执行指令，以执行如下操作：

获取神经网络模型的待压缩参数；

采用神经网络算法对所述待压缩参数进行压缩和训练，获得低维的神经网络参数；

解压所述低维的神经网络参数，恢复神经网络模型的参数。