CN111507383A

CN111507383A - 一种基于进化算法的神经网络自动剪枝方法

Info

Publication number: CN111507383A
Application number: CN202010259201.9A
Authority: CN
Inventors: 纪荣嵘; 唐浪
Original assignee: Xiamen University
Current assignee: Xiamen University
Priority date: 2020-04-03
Filing date: 2020-04-03
Publication date: 2020-08-07

Abstract

本发明涉及一种基于进化算法的神经网络模型自动剪枝方法，提出了基于进化算法的自动剪枝方案，相比较基于强化学习等方案，可以更快更准确的进行神经网络的剪枝。本发明还适用于比较大的数据集，在速度以及精度上，皆达到了最优。

Description

一种基于进化算法的神经网络自动剪枝方法

技术领域

本发明涉及神经网络领域，具体涉及一种基于进化算法的神经网络自动剪枝方法。

背景技术

近年来，随着人工智能以及深度学习的发展，人们对于定制化的深度学习网络结构开始出现指数级别的增长。用户更多的希望深度学习对于当前自身的硬件，产生定制化的网络结构以及参数，这就引导了神经网络自动压缩系统的产生。给定数据集和压缩率，神经自动压缩旨在通过搜索算法在巨大的搜索空间中找到最好的压缩方式。网络压缩已经应用在了各种计算机视觉任务上并取得了成功，例如图像分类、语言建模和语义分割。

目前，神经网络压缩方法主要分为三种方式：模型剪枝，模型量化与知识蒸馏。尽管取得了显着进步，但传统的神经网络压缩方式也难以取得最佳的效果，并且高度依赖于人类专家的手工设计，需要花费很多时间来设计压缩之后的网络结构。例如，基于L1范数剪枝需要根据敏感度来手动设计剪枝的目标网络，设计这样的网络需要花费大量的时间，其随着网络的层数线性增长。

有鉴于此，本发明人针对现有神经网络压缩方法存在的问题而深入构思，且积极研发，遂产生本案。

发明内容

针对现有技术存在的问题，本发明的目的在于提供一种基于进化算法的神经网络自动剪枝方法，其可以提高神经网络的压缩效率。

为实现上述目的，本发明采用的技术方案是：

一种基于进化算法的神经网络模型自动剪枝方法，其包括以下步骤：

步骤1、给定标定好的图像-标签对集合，并将图像-标签对集合划分为训练样本集、测试照片样本集和验证样本集；

给定需要压缩的神经网络及其整体压缩率；

给定进化算法的进化代数，以及初始化进化算法的原始种群，种群为一个集合，其包含了多个向量，每一向量表示一个个体，且每个向量表示了神经网络每一层的压缩率；

步骤2、搜索神经网络的宽度缩放因子，使神经网络模型的大小和推理时的浮点计算次数满足神经网络的整体压缩率；

采用宽度缩放因子对种群每一个体的压缩率进行缩放，得到神经网络每一层的实际压缩率；

步骤3、根据步骤2得到的实际压缩率，对神经网络进行压缩，并采用训练样本集对压缩之后的神经网络进行训练；

步骤4、训练完成后，采用验证样本集对训练后的神经网络进行验证，并记录相应的精度；并将该精度作为种群中该个体的适应度；

步骤5、根据步骤4得到的种群适应度对种群中的个体进行排序，适应度最高的个体被保留，适应度最低的个体被丢弃，并重新随机初始化新的个体，剩下的个体通过交叉变异；更新后得到新的种群，种群的代数加1。

步骤6、重复步骤2-5，直至种群的代数达到设定的进化代数。

所述步骤2中，采用二分搜索的方式搜索神经网络的宽度缩放因子。

采用上述方案后，本发明不需要训练额外的模型来预测Q值等等，复杂度较小，可以更快更准确的进行神经网络的剪枝，提高神经网络的压缩效率。因为收敛速度快所以可以用在比较大的数据集，且在压缩速度以及精度上，皆达到了最优。

此外，本发明可以适用于带有预训练的神经网络（通过继承预训练的权重）以及不带有预训练神经网络（随机初始化神经网络的权重）的剪枝。

附图说明

图1为本发明的方法流程图；

图2为本发明与现有方法在CIFAR-10数据集上的性能比较图；

图3为本发明与现有方法在ILSVRC2012数据集上的性能比较图。

具体实施方式

如图1所示，本发明揭示了一种基于进化算法的神经网络自动剪枝方法，其包括以下步骤：

给定需要压缩的神经网络及其整体压缩率；

步骤2、采用二分搜索的方式搜索神经网络的宽度缩放因子，使神经网络模型的大小和推理时的浮点计算次数满足神经网络的整体压缩率；

步骤6、重复步骤2-5，直至种群的代数达到设定的进化代数。

与现有方法相比，本发明具有以下突出优点：

第一，本发明可以适用于带有预训练的神经网络以及不带有预训练神经网络的剪枝。

第二，本发明提出了基于进化算法的自动剪枝方案，相比较基于强化学习等方案，可以更快更准确的进行神经网络的剪枝，提高神经网络的压缩效率。

第三，本发明可以适用于比较大的数据集，在压缩速度以及精度上，皆达到了最优。

为验证上述效果，通过以下仿真实验作进一步说明；

1.仿真条件

本发明在Pycharm平台上进行开发，开发的深度学习框架基于Pytorch。本发明中主要用的语言为Python，并且利用OpenCV实现本发明中用到的传统视觉算法。

2.仿真内容

我们在Cifar10以及ILSVRC2012数据集上进行仿真，其中，CIFAR-10数据集由10类32x32的彩色图片组成，一共包含60000张图片，每一类包含6000图片。CIFAR-10数据集被划分成了5个训练子集和1个测试集。测试集的图片是从每个类别中随机挑选的1000张图片组成的，每个训练集batch包含来自每一类的5000张图片，一共50000张训练图片。

ILSVRC2012数据集的ImageNet项目是一个用于视觉对象识别软件研究的大型可视化数据库。超过1400万的图像URL被ImageNet手动注释，以指示图片中的对象;在至少一百万个图像中，还提供了边界框。ImageNet包含2万多个类别。

3、仿真结果

图2和图3为仿真的结果，可以发现，相比于其他的方法，本发明的精度更高速度更快，且在比较大的数据集，且在压缩速度以及精度上，皆达到了最优。

以上所述，仅是本发明实施例而已，并非对本发明的技术范围作任何限制，故凡是依据本发明的技术实质对以上实施例所作的任何细微修改、等同变化与修饰，均仍属于本发明技术方案的范围内。

Claims

1.一种基于进化算法的神经网络模型自动剪枝方法，其特征在于：包括以下步骤：

给定需要压缩的神经网络及其整体压缩率；

步骤5、根据步骤4得到的种群适应度对种群中的个体进行排序，适应度最高的个体被保留，适应度最低的个体被丢弃，并重新随机初始化新的个体，剩下的个体通过交叉变异；更新后得到新的种群，种群的代数加1；

步骤6、重复步骤2-5，直至种群的代数达到设定的进化代数。

2.根据权利要求1所述的一种基于进化算法的神经网络模型自动剪枝方法，其特征在于：所述步骤2中，采用二分搜索的方式搜索神经网络的宽度缩放因子。