CN113935485B

CN113935485B - 一种基于相邻层权重的卷积神经网络裁剪方法

Info

Publication number: CN113935485B
Application number: CN202111531593.0A
Authority: CN
Inventors: 杨岸青; 王彬; 徐凯; 陈石; 赵佳佳; 袁明亮
Original assignee: Jiangsu Peregrine Microelectronics Co ltd
Current assignee: Jiangsu Daoyuan Technology Group Co.,Ltd.
Priority date: 2021-12-15
Filing date: 2021-12-15
Publication date: 2022-03-04
Anticipated expiration: 2041-12-15
Also published as: CN113935485A

Abstract

本发明公开了一种基于相邻层权重的卷积神经网络裁剪方法，计算卷积神经网络中各卷积层中的每个卷积核的权重以及下一层对应通道的权重；对于各卷积层，计算每个卷积核的权重绝对值之和以及下一层对应通道的权重绝对值之和，并与对应所作卷积运算次数相乘后相加，得到衡量卷积层中各卷积核重要性的参数C，将m个C值小于阈值的卷积核以及对应的特征图都裁剪掉，同时裁剪掉下一个卷积层中与被裁剪掉的特征图进行卷积的通道；对裁剪后的网络进行再训练后完成网络裁剪。本方法通过对用于人脸识别等的卷积神经网的当前卷积层权重、下一卷积层权重、卷积运算次数三个要素综合考量，能够在不损失精度的情况下对卷积神经网络进行裁剪。

Description

一种基于相邻层权重的卷积神经网络裁剪方法

技术领域

本发明涉及一种卷积神经网络裁剪方法。

背景技术

卷积神经网络（Convolutional Neural Networks）是一种包含卷积计算且具有深度结构的前馈神经网络，其在图像分类，图像检测，语义分割和视频追踪等领域有着广泛的应用。

随着人工智能技术在生活中的应用越来越多，卷积神经网络的边缘计算也开始兴起，然而效果优秀的卷积神经网络往往参数非常多，限制了其在移动端或者嵌入式芯片上的本地运行。因此往往需要对原有的神经网络进行一定的裁剪。因此如何在不损失精度的条件下对卷积神经网络进行裁剪成为了一个具有实用价值的技术。

发表于ICLR 2017的《Pruning Filters for Efficient ConvNets》公开了一种神经网络裁剪方法，对于卷积神经网络中的一次卷积，过程如图1所示，n _i个大小为w _i*h _i的特征图X _i与n _i+1个通道数为n _i的卷积核进行卷积，产生n _i+1个特征图，而这个特征图又将与n _i+2个通道数为n _i+1的卷积核进行卷积，产生n _i+2个特征图。一旦裁剪掉一个卷积核，那么其输出的特征图数量将减少一个，下一层的卷积核也将对应的减少一个通道。该论文中，确定在单层中需要剪枝的卷积核的方法为：把卷积神经网络的参数权重绝对值之和作为量化的标准，对每一个卷积神经网络的卷积核进行排序，然后去除权重绝对值之和最小的数个卷积核，并去除其下一层对应的通道。对卷积神经网络每层都执行这样的操作，最后即可获得减小了参数量而不损失太多精度的网络。

然而上述方法事实上存在着一个缺陷：由于在去除当前层卷积核时需要同时去除下一层对应的通道，在执行模型裁剪时却没有考虑到下一层的权重。如果被去除的下一层通道权值较大，就可能会带来较大的精度损失。

发明内容

发明目的：针对上述现有技术，提出一种基于相邻层权重的卷积神经网络裁剪方法，能够在不损失精度的情况下对卷积神经网络进行裁剪。

技术方案：一种基于相邻层权重的卷积神经网络裁剪方法，包括：

步骤1：构建卷积神经网络，采集人脸图像数据，对所述人脸图像数据进行预处理后得到训练数据，所述预处理包括归一化和数据增强处理；

步骤2：使用所述训练数据对所述卷积神经网络进行训练，得到训练完成的卷积神经网络，并得到所述卷积神经网络中各卷积层中的每个卷积核的权重F _i,j以及下一层对应通道的权重G _i,j；

步骤3：对于各卷积层，计算每个卷积核的权重绝对值之和A以及下一层对应通道的权重绝对值之和B；

步骤4：对于各卷积层，将每个卷积核的权重绝对值之和A与卷积核所作卷积运算次数n _i相乘，再加上下一层对应通道的权重绝对值之和B与下一层卷积核所作卷积运算次数n _i+2之积，得到衡量卷积层中各卷积核重要性的参数C，并据参数C的大小进行排序；

步骤5：对于当前卷积层，将m个C值小于预设阈值的卷积核以及对应的特征图都裁剪掉，同时裁剪掉下一个卷积层中与被裁剪掉的特征图进行卷积的通道；对所述卷积神经网络中接下来的每一卷积层都采用相同方式进行裁剪；

步骤6：使用所述训练数据对裁剪后的网络进行再训练，得到新的卷积神经网络。

有益效果：本方法通过对用于人脸识别等的卷积神经网的当前卷积层权重、下一卷积层权重、卷积运算次数三个要素综合考量，使卷积神经网络的裁剪精度更高，能够在不损失精度的情况下对卷积神经网络进行裁剪。

附图说明

图1为神经网络卷积过程示意图；

图2为本方法流程图。

具体实施方式

下面结合附图对本发明做更进一步的解释。

如图2所述，本实施例的一种基于相邻层权重的卷积神经网络裁剪方法，用于对VGG16网络进行裁剪后，应用到人脸识别中。VGG16网络有13个卷积层，3层全连接层，本实施例所使用的深度学习框架为pytorch，采用python语言编程实现。

步骤1：构建VGG16网络，采集人脸图像数据，对人脸图像数据进行预处理后得到训练数据，预处理包括归一化和数据增强处理。

步骤2：使用训练数据对网络进行训练，得到训练完成的VGG16网络。将需要裁剪的VGG16网络输入代码工程中，读取VGG16网络中每一卷积层的卷积核数据，计算得到各卷积层中的每个卷积核的权重F _i,j以及下一层对应通道的权重G _i,j。

步骤3：对于各卷积层，计算每个卷积核的权重绝对值之和

以及下一层对应通道的权重绝对值之和

。

步骤4：由于特征图与卷积核进行卷积时，一个卷积核会与所有的特征图进行卷积，而一张特征图会与不同卷积核的一个通道进行卷积。当前卷积层中，一个卷积核的卷积运算为n _i次，其产生的一张特征图接下来所作的卷积运算为n _i+2次。因此，在衡量卷积核的重要性时，对于各卷积层，本发明将每个卷积核的权重绝对值之和A与卷积核所作卷积运算次数n _i相乘，再加上下一层对应通道的权重绝对值之和B与其所作卷积运算次数n _i+2之积，得到衡量卷积层中各卷积核重要性的参数C，即C=A*n _i +B*n _i+2，并据参数C的大小进行排序。

步骤5：对于当前卷积层，将m个C值小于预设阈值的卷积核以及对应的特征图都裁剪掉，同时裁剪掉下一个卷积层中与被裁剪掉的特征图进行卷积的通道，其中阈值可以自行设置。对VGG16网络中接下来的每一卷积层都采用相同方式进行裁剪，各层的m值以及阈值可以根据需要设置，通过调整m值以及阈值来平衡网络裁剪后的大小以及精度。

步骤6：使用原始训练数据对裁剪后的VGG16网络进行再训练，完成模型微调后得到新的网络，该网络能对图像中的人脸进行有效识别。

为验证本发明方法的有效性，本实施例采用专业的cifar-10数据集对裁剪效果进行验证，cifar-10数据集由10个类的60000个32x32彩色图像组成，每个类有6000个图像。有50000个训练图像和10000个测试图像。利用裁剪前后VGG16网络的参数量作为主要性能指标，cifar-10数据集的TOP-1和TOP-5准确率作为裁剪前后的精度指标，结果如表1所示。其中TOP-1准确率是指预测结果中概率最大的那个分类正确的概率，TOP-5准确率是指概率向量最大的前五名中，出现了正确概率的概率。

表1

模型	参数大小	ciTop-1 准确率	Top-5 准确率
				VGG16	28.7M	94.16	99.71
裁剪后的VGG16	19.2M	94.23	99.72

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种基于相邻层权重的卷积神经网络裁剪方法，其特征在于，包括：