CN113762505B

CN113762505B - 一种卷积神经网络的按通道l2范数聚类剪枝方法

Info

Publication number: CN113762505B
Application number: CN202110931032.3A
Authority: CN
Inventors: 吴尔杰; 林广栋; 刘小明; 黄光红
Original assignee: CETC 38 Research Institute
Current assignee: CETC 38 Research Institute
Priority date: 2021-08-13
Filing date: 2021-08-13
Publication date: 2023-12-01
Anticipated expiration: 2041-08-13
Also published as: CN113762505A

Abstract

本发明公开了一种卷积神经网络的按通道L2范数聚类剪枝方法及系统，属于剪枝技术领域，包括以下步骤：S1：获取预训练模型；S2：通道K‑Means二聚类；S3：通道裁剪；S4：裁剪结束判断。本发明通过评价卷积核中每个通道的重要性，然后去除不重要的通道，随后进行剪枝模型训练，而后对剪枝是否结束进行判断，完成剪枝后对模型微调并保存，简化了神经网络的计算数据，对深层卷积神经网络的权重起到压缩的作用，大大缩减了存储空间及计算量，值得被推广使用。

Description

一种卷积神经网络的按通道L2范数聚类剪枝方法

技术领域

本发明涉及剪枝技术领域，具体涉及一种卷积神经网络的按通道L2范数聚类剪枝方法。

背景技术

当今社会计算机硬件正在飞速发展，各种针对神经网络的芯片技术都在取得进步，这使得深度学习在移动端硬件的部署应用变成可能。深度学习的在各种场景中的应用已经越来越广泛，从图像识别领域、语音识别领域到机器翻译领域，深度学习无处不在，而卷积神经网络是深度学习的一个方向。

随着卷积神经网络功能越来越强大，性能越来越优异，也使得其参数发展的越来越多、计算越来越复杂，需要大量计算资源来训练和推理，所用的参数数量可以达到几百万甚至几十亿，会带来巨大的计算和内存消耗。卷积神经网络随着发展变得层数深、体积大、参数多导致计算量大的缺点限制了其在移动设备等设备的部署与使用。这就需要对神经网络进行压缩，来提高性能，神经网络压缩简单来说就是在神经网络性能影响不大的情况下，通过一些方法来减少网络的参数和存储空间。神经网络压缩大体上可以分为近似、量化和剪枝三类方法。其中，剪枝的思路就是通过裁剪掉冗余的神经元或者权重，可以有效的减少模型的参数，降低模型运算量和存储空间。

剪枝分为结构化与非结构化两种，其中结构化剪枝对整个卷积核或者通道进行剪枝，非结构化剪枝对卷积核的元素进行剪枝。非结构化剪枝实际应用中需要特殊设备。

现有的深度学习模型剪枝方法是依照阈值，剪去通道范数小于阈值的通道，但是如果通道范数大于阈值而相对于整体作用很小的话，这种方法就出现了欠剪枝。另一种常规模型剪枝的方法是设定比例，按照大小排序剪除较小的通道，如果较小的通道与较大的差距不大，这种方法容易导致过剪枝，为此，提出一种卷积神经网络的按通道L2范数聚类剪枝方法。

发明内容

本发明所要解决的技术问题在于：如何解决现有深度学习模型剪枝方法存在的欠剪枝或过剪枝问题，提供了一种卷积神经网络的按通道L2范数聚类剪枝方法，该方法能够解决传统方法中容易出现的欠剪枝或过剪枝问题，可裁剪掉冗余的卷积核通道，进而有效地减少模型的参数。

本发明是通过以下技术方案解决上述技术问题的，本发明包括以下步骤：

S1：获取预训练模型

将卷积神经网络模型在数据集上训练，得到预训练模型；

S2：通道K-Means二聚类

对预训练模型的卷积核逐个通道计算其L2范数，并对每个卷积核的逐个通道L2范数值进行K-Means二聚类，得到重要通道集合A与次重要通道集合B；

S3：通道裁剪

使用重要通道集合A中最小值减去次重要通道集合B中最大值并除以重要通道集合A中最小值，若计算结果小于设定的阈值，则删除集合B中L2范数接近0的通道；否则按照设定比例将集合B中的通道删除；

S4：裁剪结束判断

重复步骤S1～S3，并重新训练剪枝后卷积神经网络模型，直到剪掉预先设定的通道数目，并在最后一次剪枝后对网络模型进行重新训练。

更进一步地，在所述步骤S1中，数据集为CIFAR-10数据集。

更进一步地，在所述步骤S2中，所述L2范数是指向量各元素的平方和然后求得的平方根。

更进一步地，在所述步骤S2中，K-Means二聚类的具体过程如下：

S21：将通道数据分为2组，则随机选取2个通道作为初始的聚类中心；

S21：然后计算每个通道与各个种子聚类中心之间的距离，把每个通道分配给距离它最近的聚类中心，不断迭代得到最终的聚类中心。

更进一步地，在所述步骤S3中，按照设定比例将集合B中的通道删除时，若集合B的通道数目小于通道总数的设定比例，则将B集合中的通道全部删除，否则对集合B中通道根据L2范数大小进行排序，删除占整个卷积核通道总数设定比例数目的L2范数小的通道。

更进一步地，在所述步骤S3中，通道删除完成后，再次训练卷积神经网络模型，直到模型收敛，也对已被剪枝的卷积核通道的权重参数进行更新，让在推理中发挥作用但却被错误剪枝的通道被重新赋值。

本发明还提供了一种卷积神经网络的按通道L2范数聚类剪枝系统，采用上述的剪枝方法对卷积神经网络模型进行通道裁剪，包括：

模型获取模块，用于将卷积神经网络模型在数据集上训练，得到预训练模型；

通道聚类模块，用于对预训练模型的卷积核逐个通道计算其L2范数，并对每个卷积核的逐个通道L2范数值进行K-Means二聚类，得到重要通道集合A与次重要通道集合B；

通道裁剪模块，用于使用重要通道集合A中最小值减去次重要通道集合B中最大值并除以重要通道集合A中最小值，若计算结果小于设定的阈值，则删除集合B中L2范数接近0的通道；否则按照设定比例将集合B中的通道删除；

结束判断模块，用于重复步骤S1～S3，并重新训练剪枝后卷积神经网络模型，直到剪掉预先设定的通道数目，并在最后一次剪枝后对网络模型进行调整；

中央处理模块，用于向各模块发出指令，完成相关动作；

所述模型获取模块、通道聚类模块、通道裁剪模块、结束判断模块均与中央处理模块电连接。

本发明相比现有技术具有以下优点：通过评价卷积核中每个通道的重要性，然后去除不重要的通道，随后进行剪枝模型训练，而后对剪枝是否结束进行判断，完成剪枝后对模型微调并保存，简化了神经网络的计算步骤，对深层卷积神经网络的权重起到压缩的作用，大大缩减了存储空间及计算量，值得被推广使用。

附图说明

图1是本发明实施例一中卷积神经网络的按通道L2范数聚类剪枝方法的流程示意图；

图2是本发明实施例一中图像通道L2范数K-Means二聚类示意图。

具体实施方式

下面对本发明的实施例作详细说明，本实施例在以本发明技术方案为前提下进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例。

实施例一

如图1所示，本实施例提供一种技术方案：一种卷积神经网络的按通道L2范数聚类剪枝方法，对深层卷积神经网络的权重起到压缩的作用，缩减了存储空间及计算量，包括以下步骤：

步骤1：将卷积神经网络模型在CIFAR-10数据集上训练，得到预训练模型；

步骤2：对预训练模型的卷积核逐个通道计算其L2范数(L2范数是指向量各元素的平方和然后求平方根)，并对每个卷积核的逐个通道L2范数值进行K-Means二聚类(K-Means聚类是一种迭代求解的聚类分析算法，其步骤是，预将数据分为K组，则随机选取K个对象作为初始的聚类中心，然后计算每个对象与各个种子聚类中心之间的距离，把每个对象分配给距离它最近的聚类中心)，得到重要通道集合A与次重要通道集合B，如图2所示；

步骤3：使用重要通道集合A中最小值减去次重要通道集合B中最大值并除以重要通道集合A中最小值，若计算结果小于设定的阈值，则删除B集合中L2范数接近0的通道。否则，说明B集合中的数足够小，相对于A可以忽略，为了防止过度剪枝，如果B集合的通道数目小于通道总数的x％(可以自行定义比例)，就可以将B集合中的通道全部删除，否则，对B中通道根据L2范数大小进行排序，删除占整个卷积核通道总数x％数目的L2范数较小的通道；

步骤4：经过步骤3后，需要再次训练卷积神经网络模型，直到模型收敛，已被剪枝的卷积核通道的权重参数也需要更新，让在推理中发挥作用但却被错误剪枝的通道被重新赋值；

步骤5：重复1、2、3中的步骤，并重新训练剪枝后卷积神经网络模型，直到剪掉预先设定的通道数目，并且在最后一次剪枝后，使用与训练同一个数据集，或者使用其他数据库重新训练网络模型。

综上所述，上述实施例的一种卷积神经网络的按通道L2范数聚类剪枝方法，通过评价卷积核中每个通道的重要性，然后去除不重要的通道，随后进行剪枝模型训练，而后对剪枝是否结束进行判断，完成剪枝后对模型微调并保存，简化了神经网络的计算步骤，对深层卷积神经网络的权重起到压缩的作用，大大缩减了存储空间及计算量，值得被推广使用。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种卷积神经网络的按通道L2范数聚类剪枝方法，其特征在于，包括以下步骤：

S1：获取预训练模型

将卷积神经网络模型在数据集上训练，得到预训练模型；

在所述步骤S1中，数据集为CIFAR-10数据集；

S2：通道K-Means二聚类

S3：通道裁剪

在所述步骤S3中，按照设定比例将集合B中的通道删除时，若集合B的通道数目小于通道总数的设定比例，则将B集合中的通道全部删除，否则对集合B中通道根据L2范数大小进行排序，删除占整个卷积核通道总数设定比例数目的L2范数小的通道；

S4：裁剪结束判断

2.根据权利要求1所述的一种卷积神经网络的按通道L2范数聚类剪枝方法，其特征在于：在所述步骤S2中，所述L2范数是指向量各元素的平方和然后求得的平方根。

3.根据权利要求1所述的一种卷积神经网络的按通道L2范数聚类剪枝方法，其特征在于：在所述步骤S2中，K-Means二聚类的具体过程如下：

4.根据权利要求1所述的一种卷积神经网络的按通道L2范数聚类剪枝方法，其特征在于：在所述步骤S3中，通道删除完成后，再次训练卷积神经网络模型，直到模型收敛，同时对已被剪枝的卷积核通道的权重参数进行更新，让在推理中发挥作用但却被错误剪枝的通道被重新赋值。

5.一种卷积神经网络的按通道L2范数聚类剪枝系统，其特征在于，采用如权利要求1～4任一项所述的剪枝方法对卷积神经网络模型进行通道裁剪，包括：

结束判断模块，用于重复步骤S1～S3，并重新训练剪枝后卷积神经网络模型，直到剪掉预先设定的通道数目，并在最后一次剪枝后对网络模型进行重新训练；

中央处理模块，用于向各模块发出指令，完成相关动作；