CN114330644B

CN114330644B - 一种基于结构搜索和通道剪枝的神经网络模型压缩方法

Info

Publication number: CN114330644B
Application number: CN202111481512.0A
Authority: CN
Inventors: 陈余根; 程文韶; 谭海; 徐寅; 王南
Original assignee: 717th Research Institute of CSIC
Current assignee: Wuhan Huazhong Tianjing Tongshi Technology Co ltd
Priority date: 2021-12-06
Filing date: 2021-12-06
Publication date: 2022-12-16
Anticipated expiration: 2041-12-06
Also published as: CN114330644A

Abstract

本发明公开了一种基于结构搜索和通道剪枝的神经网络模型压缩方法，用于无人车、无人艇等目标检测，采用神经网络结构搜索技术，针对当前数据集和任务，首先训练出一个精度不低但相比常规CNN参数量和计算量都较小的轻量级网络，为网络中每一个层级的结构都赋予一个对应衡量其重要性的缩放因子，同时各层级结构对应缩放因子采用大方差高斯分布初始化，施加L1范数正则化同时采用次梯度优化算法，进行稀疏化训练，将模型中那些接近0的缩放因子对应的层级进行裁剪，对模型进行微调，如果能回到baseline的精度或下降在5%以内进行下一轮模型压缩剪枝，否则结束该程序。

Description

一种基于结构搜索和通道剪枝的神经网络模型压缩方法

技术领域

本发明属于深度学习和人工智能技术领域，涉及深度卷积神经网络(CNN)模型的压缩剪枝，具体涉及一种基于缩放因子特殊初始化和通道裁剪的神经网络模型压缩剪枝方法与系统。

背景技术

随着深度学习的不断发展，深度神经网络在目标检测和目标跟踪领域得到了广泛的应用。但随之而来的是，模型结构越来越复杂，参数和层数不断增多。

在无人车、无人艇等目标的检测中，由成千上万的可学习参数决定的模型大小和模型计算时产生的特征图(feature maps)，这对于嵌入式设备来说是一个极大的存储资源负担；而在高分辨率的网络输入上执行卷积操作会产生巨大的计算量(FLOPs)，从而引起高延迟，这对于需要实时的应用场景显然是不可取的。因此，要在嵌入式设备上部署一个能实时检测目标的CNN，对模型的压缩裁剪成了一个必不可少的步骤。

目前模型压缩主要发展出了非结构化剪枝和结构化剪枝两大类。以Hansong等人为代表提出的非结构化剪枝，是根据预设阈值裁剪权值低的单个连接或神经元，然后再微调模型恢复精度，最终通过逐层裁剪和重训的方式达到模型压缩的目的。但是这种非结构化剪枝需要特定的硬件加速器和计算库(比如稀疏矩阵乘法)支持，开发难度很大。

结构化剪枝则是通过对CNN的filter、channel、filter shape和depth等层次结构施加Group-LASSO回归，对其中某一组权重进行L1-范数正则化，训练后产生稀疏化结构再进行裁剪。这是一种比非结构化剪枝粒度更粗的压缩技术，可以采用现有的深度学习计算库。但这种针对某组神经元的算法训练不易收敛，训练时间较长，模型稀疏程度低。

发明内容

针对现有神经网络模型结构化剪枝技术用于无人车、无人艇等目标检测时存在的缺点，本发明创造旨在提供一种能够训练更加快速收敛、裁剪粒度更加灵活和压缩率更大的卷积神经网络模型压缩剪枝方法与系统。

本发明解决其技术问题所采用的技术方案是：一种基于结构搜索和通道剪枝的神经网络模型压缩方法，用于无人车、无人艇等目标检测，基于轻量级网络搜寻模块和剪枝微调模块，步骤如下

(1)，采用神经网络结构搜索技术，针对神经网络模型当前数据集和任务，训练出一个精度不低但相比常规CNN参数量和计算量都较小的轻量级网络搜寻模块；

(2)，以轻量级网络搜寻模块为baseline，为网络中每一个group/block/channel层级的结构都赋予一个对应衡量其重要性的缩放因子γ，或者直接采用BN层中的缩放因子γ，各层级结构对应缩放因子γ采用大方差高斯分布初始化，然后对缩放因子γ施加L1范数正则化；采用次梯度优化算法进行稀疏化训练，优化目标如下：

其中φ(γ)＝|γ|，Γ是缩放因子γ的集合，λ是正则项权重系数；

则L对某一γ分量γ_i的梯度为：

其中C₀是原代价函数；

同时

sgn(γ_i)为符号函数，a表示处于[-1，1]之间的一个数值；

则针对γ的参数更新过程为

其中α是学习率；

(3)，对练完的模型中接近0的缩放因子γ对应的channel/group/block层级进行裁剪，再对模型进行微调，如果能回到baseline的精度或下降在5％以内，则返回到步骤2)，进行下一轮模型压缩剪枝；否则结束。

所述的一种基于结构搜索和通道剪枝的神经网络模型压缩方法，其步骤(1)中训练轻量级网络搜寻模块依次包括：模型定义，权重初始化和缩放因子大方差高斯分布初始化，次梯度优化和参数迭代更新，判断损失函数是否收敛，否则返回次梯度优化和参数迭代更新，是则完成训练。

所述的一种基于结构搜索和通道剪枝的神经网络模型压缩方法，其步骤(1)中的神经网络结构搜索是从一个预定义的搜索空间

中由搜索策略选择一个结构A，然后把结构A传送到性能评估策略模块，最后由其返回一个性能评估结果给搜索策略；所述的搜索策略采用强化学习，是神经网络结构搜索任务中，将架构的生成看成是一个智能体在选择动作，再通过一个测试集上的效果预测函数来获得奖励；用循环神经网络来表示策略函数，初始化时先用策略梯度算法赋初值，然后用如下近端策略优化算法来进行优化：

所述的一种基于结构搜索和通道剪枝的神经网络模型压缩方法，其步骤(3)中训练过程采用带动量的小批量随机梯度下降优化方法，学习率采用预热方式，初始为0.01，每迭代20000次学习率乘以0.1，通过50000次迭代完成一次完整的训练。

本发明产生的有益效果是：

本专利方法主要采用基于特定数据集及任务驱动的神经网络结构搜索(NAS)轻量级网络设计、各层级结构对应缩放因子大方差高斯分布初始化和基于次梯度优化的一般化结构剪枝等模型压缩技术。

本发明与现有非结构化剪枝方法相比，无需特定的硬件加速器和计算库，实现部署简单；与现有结构化剪枝方法相比，该方法能够训练更加快速地收敛、裁剪粒度更加灵活和压缩率更大。

附图说明

图1是现有技术中的一般化结构化剪枝示意图；

图2为本发明NAS技术流程图；

图3为单元搜索空间示意图；

图4是本发明的算法处理流程框图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步的说明。

本发明公开的一种基于结构搜索和通道剪枝的神经网络模型压缩方法，用于无人车、无人艇等目标检测，基于轻量级网络搜寻模块和剪枝微调模块，步骤如下：

(1)，由轻量级网络搜寻模块搜寻得到一个针对特定数据集及任务的较小网络：采用神经网络结构搜索(NAS)技术，针对神经网络模型当前数据集和任务，首先训练出一个精度不低但相比常规CNN参数量和计算量都较小的轻量级网络。

NAS技术的整体流程如图2所示：从一个预定义的搜索空间

中由搜索策略选择一个结构A，然后把结构A传送到性能评估策略模块，最后由其返回一个性能评估结果给搜索策略。

对于搜索空间，本专利方法中采用单元/模块搜索空间，结构单元/模块可以用更复杂的方式结合，比如多分枝空间，如图3所示。最终的网络架构便可以通过堆叠这些结构单元/模块来构建。单元(cell)搜索空间示意图中符号说明：sep表示depthwise-separableconvolution(深度可分离卷积)；max表示max pooling(最大池化)；identity表示短路连接；concat表示通道合并拼接。

对于搜索策略，本专利方法中采用强化学习。在NAS任务中，将架构的生成看成是一个智能体(agent)在选择动作(action)，再通过一个测试集上的效果预测函数来获得奖励(reward)。用循环神经网络(RNN)来表示策略函数(控制器)，初始化时先用策略梯度(policygradient)算法赋初值，然后用近端策略优化(Proximal Policy Optimization，PPO)算法来进行优化。PPO计算如下式：

(2)，通过baseline模型结构定义文件及稀疏率等超参数，由剪枝微调模块进行稀疏化训练、剪枝和微调，对轻量级网络搜寻模块进一步地压缩：以轻量级网络搜寻模块为baseline，如图1为网络中每一个group/block/channel层级的结构都赋予一个对应衡量其重要性的缩放因子γ，或者为方便直接采用BN层中的缩放因子γ，各层级结构对应缩放因子γ采用大方差高斯分布初始化，以提高模型的稀疏程度和压缩率，然后对缩放因子γ施加L1范数正则化；同时采用次梯度优化算法进行稀疏化训练，优化目标如下：

则L对某一γ分量γ_i的梯度为：

其中C₀是原代价函数；

同时

sgn(γ_i)为符号函数，a表示处于[-1，1]之间的一个数值；

则针对γ的参数更新过程为：

其中，α是学习率。在本方法中，训练过程就采用简单的带动量的小批量随机梯度下降优化方法，学习率采用预热(warm up)方式，初始为0.01，每迭代20000次学习率乘以0.1，一次完整的训练共迭代50000次。

(3)，对于稀疏化训练完的模型，将模型中那些接近0的缩放因子对应的channel/group/block进行裁剪；再对模型进行微调；模型微调后如果能回到baseline的精度或下降在5％以内，则返回到步骤(2)，进行下一轮模型压缩剪枝，否则结束该程序，如图4所示。

上述实施例仅例示性说明本发明的原理及其功效，对于本领域的普通技术人员来说，在不脱离本发明创造构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。

Claims

1.一种基于结构搜索和通道剪枝的神经网络模型压缩方法，其特征在于：步骤如下

则L对某一γ分量γ_i的梯度为：

其中C₀是原代价函数；

同时

sgn(γ_i)为符号函数，a表示处于[-1，1]之间的一个数值；

则针对γ的参数更新过程为

其中α是学习率；

2.根据权利要求1所述的一种基于结构搜索和通道剪枝的神经网络模型压缩方法，其特征在于，所述的步骤(1)中训练轻量级网络搜寻模块依次包括：模型定义，权重初始化和缩放因子大方差高斯分布初始化，次梯度优化和参数迭代更新，判断损失函数是否收敛，否则返回次梯度优化和参数迭代更新，是则完成训练。

3.根据权利要求1所述的一种基于结构搜索和通道剪枝的神经网络模型压缩方法，其特征在于，所述步骤(1)中的神经网络结构搜索是从一个预定义的搜索空间

4.根据权利要求1所述的一种基于结构搜索和通道剪枝的神经网络模型压缩方法，其特征在于，所述的步骤(3)中训练过程采用带动量的小批量随机梯度下降优化方法，学习率采用预热方式，初始为0.01，每迭代20000次学习率乘以0.1，通过50000次迭代完成一次完整的训练。