CN107784360A

CN107784360A - 步进式卷积神经网络剪枝压缩方法

Info

Publication number: CN107784360A
Application number: CN201711021072.4A
Authority: CN
Inventors: 牟星
Original assignee: Jiangsu Ring Technology Co Ltd
Current assignee: JIANGSU AIGLIM TECHNOLOGY CO.,LTD.
Priority date: 2017-10-27
Filing date: 2017-10-27
Publication date: 2018-03-09

Abstract

本发明公开了一种步进式卷积神经网络剪枝压缩方法，利用GPU计算卷积神经网络模型中每一层神经元的L1范数和方差；根据每一层神经元的L1范数和方差估计每一个神经元当前时刻的重要性；对于当前时刻不重要的神经元，将其强制设置为0，同时将相同位置的反向传播误差项也强制设置为0；卷积神经网络进行m次迭代训练后，重新计算并评估；重新评估过后的所有活动神经元参加下一轮的m次迭代；重复上述过程n次，使学习率随迭代步数进行阶梯式衰减，通过将卷积神经网络中当前时刻不重要的神经元进行剪枝操作，多次迭代后再进行判断，恢复当前时刻重要的神经元，剪枝当前时刻不重要的神经元，重复操作，达到对卷积神经网络进行有效压缩和快速计算的目的。

Description

步进式卷积神经网络剪枝压缩方法

技术领域

本发明涉及卷积神经网络剪枝压缩技术领域，具体涉及一种步进式卷积神经网络剪枝压缩方法。

背景技术

卷积神经网络(Convolutional Neural Networks，CNN)是自2012年快速发展起来、引起广泛重视的一种高效图片识别分类方法深度学习架构，该架构有效提高了图像分类和物体识别的能力。与传统的特征手工提取的方法相比，CNN可以直接输入原始图像、避免了繁杂的前期预处理，且识别精度较高；与传统的反向传输(Back Propagation，BP)神经网络相比，CNN由于使用了共享策略，其神经元的个数大大减少，从而在一定程度上避免了过拟合的现象。

然而对于嵌入式终端设备，由于其计算资源和存储资源比较有限，因此，想要较小的占用内存资源同时获得较快的inference速度，大部分CNN网络例如VGG19/VGG16，ResNet，GoogLeNet等只能部署在有GPU或者FPGA支持的高端云平台。2016年，ICLR的bestpaper提出了一种压缩剪枝方案(Deep Compression)，但是其算法对无效神经元的估计只是对神经元的绝对值大小简单设定了一个阈值，并未考虑到训练过程中神经元的复杂变化，因此压缩效率依然不能令人满意。

发明内容

为解决上述技术问题，本发明提出了一种步进式卷积神经网络剪枝压缩方法，以达到对卷积神经网络进行有效压缩和快速计算的目的。

为达到上述目的，本发明的技术方案如下：一种步进式卷积神经网络剪枝压缩方法，包括：利用GPU计算卷积神经网络模型中每一层神经元的L1范数和方差；根据每一层神经元的L1范数和方差估计每一个神经元当前时刻的重要性；对于满足公式的神经元，第一次将其强制设置为0，同时将相同位置的反向传播误差项也强制设置为0；卷积神经网络进行m次迭代训练后，重新计算当前神经元和第一次被置零的神经元的L1范数和方差；根据重新计算的L1范数和方差对神经元进行重新评估；若当前神经元满足公式则将其强制设置为0，同时将相同位置的反向传播误差项也强制设置为0；若第一次被置零的神经元满足公式则将其恢复成原来的数值同时激活反向误差传递时的误差项；重新评估后满足的所有神经元参加下一轮的m次迭代；重复上述过程n次，使学习率随迭代步数进行阶梯式衰减。

作为优选的，所述m次迭代是人工设置的迭代次数。

作为优选的，所述公式和公式的α,β为超参数，所述超参数是根据数据分布和训练框架和方式得到的参数，用于控制压缩的效率以及训练的收敛速度，当α＝0.8,β＝1.1时压缩效率与收敛速度可以达到较好的平衡。

本发明具有如下优点：

(1).本发明在训练的过程中动态估计每个神经元的重要性，通过不断优化的最小损失函数来优化网络。

(2).在训练过程中被置零的神经元在不同的迭代阶段会被激活，而不是彻底死亡，更好的减少精度的降低，提高了训练速度。

(3).本发明可以调整超参数α,β的大小，用来控制压缩的效率以及训练的收敛速度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为本发明实施例公开的步进式卷积神经网络剪枝压缩方法流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。

本发明提供了一种步进式卷积神经网络剪枝压缩方法，其工作原理是通过将卷积神经网络中当前时刻不重要的神经元进行剪枝操作，多次迭代后再进行判断，恢复当前时刻重要的神经元，剪枝当前时刻不重要的神经元，重复操作，达到对卷积神经网络进行有效压缩和快速计算的目的。

下面结合实施例和具体实施方式对本发明作进一步详细的说明。

如图1所示，一种步进式卷积神经网络剪枝压缩方法，包括：利用GPU计算卷积神经网络模型中每一层神经元的L1范数和方差；根据每一层神经元的L1范数和方差估计每一个神经元当前时刻的重要性；对于满足公式的神经元，第一次将其强制设置为0，同时将相对位置的反向传播误差项也强制设置为0；卷积神经网络进行m次迭代训练后，重新计算当前神经元和第一次被置的零神经元的L1范数和方差；根据重新计算的L1范数和方差对神经元进行重新评估；若当前神经元满足公式则将其强制设置为0，同时将相对位置的反向传播误差项也强制设置为0；若第一次被置零的神经元满足公式则将其恢复成原来的数值同时激活反向误差传递时的误差项；重新评估后满足的神经元参加下一轮的m次迭代；记录迭代的次数，并重复进行迭代，当迭代次数等于n时，结束进程，使学习率随迭代步数进行阶梯式衰减。

其中，l表示层数，i，j表示输入与输出的连接编号，l1表示L1范数，std表示方差，α,β为超参数

其中，所述m次迭代是人工设置的迭代次数。

其中，所述公式和公式的α,β为超参数，所述超参数是根据数据分布和训练框架和方式得到的参数，用于控制压缩的效率以及训练的收敛速度，当α＝0.8,β＝1.1时压缩效率与收敛速度可以达到较好的平衡。

为了发挥GPU的计算能力避免不必要的分支判断，引入标记数组d_prune_index，将暂时被剪掉的神经元在数组中标记为0，否则标记为1。对相同位置的反向传播的误差项也采用类似的标记数组。剪枝时可以直接使用BLAS LEVEL1函数进行计算。

以上所述的仅是本发明所公开的一种步进式卷积神经网络剪枝压缩方法的优选实施方式，应当指出，对于本领域的普通技术人员来说，在不脱离本发明创造构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。

Claims

1.一种步进式卷积神经网络剪枝压缩方法，其特征在于，包括：利用GPU计算卷积神经网络模型中每一层神经元的L1范数和方差；根据每一层神经元的L1范数和方差估计每一个神经元当前时刻的重要性；对于满足公式的神经元，第一次将其强制设置为0，同时将相同位置的反向传播误差项也强制设置为0；卷积神经网络进行m次迭代训练后，重新计算当前神经元和第一次被置零的神经元的L1范数和方差；根据重新计算的L1范数和方差对神经元进行重新评估；若当前神经元满足公式则将其强制设置为0，同时将相同位置的反向传播误差项也强制设置为0；若第一次被置零的神经元满足公式则将其恢复成原来的数值同时激活相同位置反向传递的误差项；重新评估后的满足公式的神经元参加下一轮的m次迭代；重复上述过程n次，使学习率随迭代步数进行阶梯式衰减。

2.根据权利要求1所述的步进式卷积神经网络剪枝压缩方法，其特征在于，所述m次迭代是人工设置的迭代次数。

3.根据权利要求1所述的步进式卷积神经网络剪枝压缩方法，其特征在于，所述公式和公式的α,β为超参数，所述超参数是根据数据分布和训练框架和方式得到的参数，用于控制压缩的效率以及训练的收敛速度，当α＝0.8,β＝1.1时压缩效率与收敛速度可以达到较好的平衡。