CN111340225A

CN111340225A - 一种基于深度卷积神经网络模型压缩和加速方法

Info

Publication number: CN111340225A
Application number: CN202010126702.XA
Authority: CN
Inventors: 罗文�
Original assignee: Sinocloud Wisdom Beijing Technology Co Ltd
Current assignee: Sinocloud Wisdom Beijing Technology Co Ltd
Priority date: 2020-02-28
Filing date: 2020-02-28
Publication date: 2020-06-26

Abstract

本发明公开了一种基于深度卷积神经网络模型压缩和加速方法，包括以下步骤：S1：搭建深度卷积神经网络模型，并使用训练数据对所述模型进行训练，得到预训练模型；S2：按照剪枝比率A，求解得到所述预训练模型中卷积层的冗余通道，对所述冗余通道对应的网络权重参数置零，得到剪枝模型；S3：对所述剪枝模型使用稀疏训练的方式进行训练，得到收敛剪枝模型；S4：根据所述预训练模型和所述收敛剪枝模型，搭建新网络模型；S5：将所述收敛剪枝模型的网络参数按照对应关系赋值给所述新网络模型，得到最终模型，并存储。在本发明在保持准确率基本不变的情况下，压缩模型并降低了预测时间，提升模型的检测效率。

Description

一种基于深度卷积神经网络模型压缩和加速方法

技术领域

本发明涉及深度学习领域，特别是涉及一种基于深度卷积神经网络模型压缩和加速方法。

背景技术

随着深度卷积神经网络的广泛应用，为达到更高的准确率，深度卷积神经网络引入更多的神经元、增加更多的网络层数，这导致深度卷积神经网络的参数变多、模型变大、预测时间变长。而在存储空间和计算资源有限的移动终端或嵌入式设备中，往往难以部署较大的模型。

发明内容

有鉴于此，为克服大模型在存储空间和计算资源有限的移动终端或嵌入式设备的部署问题，本发明提出了一种基于深度卷积神经网络模型压缩和加速方法，该方法在保持模型准确率不变的情况下，压缩深度卷积神经网络模型，降低模型预测时间。具体内容如下：

一种基于深度卷积神经网络模型压缩和加速方法，包括以下步骤：

S1：搭建深度卷积神经网络模型，并使用训练数据对所述模型进行训练，得到预训练模型；

S2：按照剪枝比率A，求解得到所述预训练模型中卷积层的冗余通道，对所述冗余通道对应的网络权重参数置零，得到剪枝模型；

S3：对所述剪枝模型使用稀疏训练的方式进行训练，得到收敛剪枝模型；

S4：根据所述预训练模型和所述收敛剪枝模型，搭建新网络模型；

S5：将所述收敛剪枝模型的网络参数按照对应关系赋值给所述新网络模型，得到最终模型，并存储。

进一步，所述S2包括：通过LASSO回归算法求解得到所述预训练模型中卷积层的冗余通道。

进一步，所述新网络模型不包含所述剪枝模型中的冗余通道。

进一步，所述S5中对最终模型的存储包括：采用三元组方式存储。

进一步，所述剪枝比率A为0.1-0.5。

本发明的有益效果在于：

本发明在保持准确率基本不变的情况下，压缩模型并降低了运算时间和存储空间，提升模型的预测效率。

具体实施方式

下面将更加详细地描述本公开的示例性实施例。应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

S1：搭建深度卷积神经网络模型，并使用训练数据对所述模型进行训练，得到预训练模型。

搭建resnet18基于imagenet数据集的分类网络，所述分类网络包含卷积层和全连接层，并使用训练数据集对该网络进行训练，训练至收敛，训练收敛的模型作为预训练模型；imagenet数据集包含分类用图片以及图片标签；模型训练是指使用训练集数据对模型中的网络权重参数进行优化，以得到更好的网络权重参数；网络模型包含网络结构和网络权重参数。

所述分类网络即网络模型。所述Resnet18中，18指定的是带有权重的18层，包括卷积层和全连接层。神经网络是用来作预测的，例如现在有一个训练好的分类神经网络，给这个网络输入一张图片，网络就会输出这张图可能含有的物品。数据集是用来训练分类网络的；分类网络会根据数据集标注的类别最后回归成哪几类的分类任务。

S2：按照剪枝比率A，通过LASSO回归算法求解得到所述预训练模型中卷积层的冗余通道，对所述冗余通道对应的网络权重参数置零，得到剪枝模型。

剪枝比率是指求解出来的冗余通道数占卷积输入通道的比率。本实例剪枝比率A为0.1-0.5，优选为0.2。

获取预训练模型各卷积层的权重参数，卷积层权重参数是由n(输入通道)、h(高)、w(宽)、c(输出通道)组成的4-D张量。

在训练数据集中采样30张图片，使用这部分图片在预训练模型上作前向传播，并获取每一个卷积层对应的输入数据和输出数据。以第一层卷积层求解冗余通道为例，先将当前卷积层的输入数据、输出数据、卷积权重转换为二维数据，然后再使用LASSO回归算法，求解出冗余通道；其余的卷积层按照第一层卷积层求解冗余通道相同的操作进行。

对于一个卷积层，定义其输入特征图为

(N-批量大小，h_i、w_i-输入特征图宽和高，c_i-卷积输入通道数)，定义卷积权重为

(k_h、k_w-卷积核大小，c_o-卷积输出通道数)，则卷积输出特征图

(h_o、h_w-卷积输出特征图大小，f(·)-卷积操作)；卷积操作可以理解为矩阵相乘，输入特征图X可以生成Nh_ow_o×h_kw_kc_i的矩阵，卷积权重可以生成h_kw_kc_i×c_o的矩阵，则将两个矩阵相乘得到的结果Y＝XW，最终结果可以通过改变维度恢复成4维的输出特征图。

进一步，将X分解为c_i个矩阵{Xi}，每个大小为Nh_ow_o×h_kw_k；同理将W分解为c_i个矩阵{Wi}，每个大小为h_kw_k×c_o；则输出特征图可以改写为

通过假如一个二进制掩码向量β，来决定那些通道剪掉(即βi＝0)那些通道不减掉(即βi＝1),则考虑在稀疏性约束下输出特征图的重构误差，可以通过LASSO回归算法来求解，使得重构误差最小，即通过求解

(||β||1-l₁正则化，λ-常数系数，决定了剪枝通道数量)可得。

对所有的卷积层，创建一个与当前卷积层同样大小的4-D张量的二进制掩码，将对应冗余通道的二进制掩码置0，其余通道置1；并将预训练模型中对应卷积层的权重参数置0，以得到剪枝模型。

S3：对所述剪枝模型使用稀疏训练的方式进行训练，得到收敛剪枝模型。

对S2得到的剪枝网络所有的全连接层，创建一个同样大小的二进制掩码，使剪枝网络在训练过程中，前向传播时全连接和卷积层权重先与二进制掩码相乘，二进制掩码为零的位置对应的权重不参与计算，在反向传播时也不更新；初始状态下全连接层的二进制掩码全为一，卷积层的二进制掩码为S2中的所述的二进制掩码；

使用imagenet数据集对所述网络进行训练时，每迭代训练1000次对网络中卷积层和全连接层中权重值绝对值小于0.001对应位置的二进制掩码置零；

继续训练，直至模型收敛，得到收敛剪枝模型。

S4：根据所述预训练模型所述收敛剪枝模型，搭建新网络模型，使得新网络模型不包含S2中所述卷积层冗余通道。

S5：按照对应关系将所述收敛剪枝模型的网络权重参数赋值给所述新网络模型，得到最终模型，并存储。

使用key-value分布式存储方式对新网络权重进行存储，即对卷积层和全连接层的权重矩阵中非零元素采用位置和值的存储方式进行存储。

将上述压缩和加速方法处理得到的模型，部署到移动终端或嵌入式设备，例如：手机、Pad、arm系列开发板/功能板等。模型预测一张图片中的待分类物品是什么类别(例如：X光机图片中的违禁品是哪一类违禁品)。预测速度提升10％-30％，模型存储空间降低10％-45％。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。

最后需要说明的是：以上所述仅为本发明的较佳实施例，仅用于说明本发明的技术方案，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种基于深度卷积神经网络模型压缩和加速方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于深度卷积神经网络模型压缩和加速方法，其特征在于，所述S2包括：通过LASSO回归算法求解得到所述预训练模型中卷积层的冗余通道。

3.根据权利要求1所述的基于深度卷积神经网络模型压缩和加速方法，其特征在于，所述新网络模型不包含所述剪枝模型中的冗余通道。

4.根据权利要求1所述的基于深度卷积神经网络模型压缩和加速方法，其特征在于，所述S5中对最终模型的存储包括：采用三元组方式存储。

5.根据权利要求1所述的基于深度卷积神经网络模型压缩和加速方法，其特征在于，所述剪枝比率A为0.1-0.5。