CN112215334A

CN112215334A - 一种面向事件相机的神经网络模型压缩方法

Info

Publication number: CN112215334A
Application number: CN202011016049.8A
Authority: CN
Inventors: 赵江; 曾逸文; 蔡志浩; 王英勋; 陈文军
Original assignee: Beihang University
Current assignee: Beihang University
Priority date: 2020-09-24
Filing date: 2020-09-24
Publication date: 2021-01-12

Abstract

本发明属于神经网络模型压缩技术领域，特别涉及一种面向事件相机的神经网络模型压缩方法，包括步骤：从事件相机获取事件流数据，生成事件图像，完成数据集制作；构建神经网络模型，并利用预训练模型初始化所述神经网络模型参数，之后利用数据集进行训练，得到神经网络模型的基础网络；设置学习率，对基础网络进行稀疏训练；对经过稀疏训练后的神经网络模型进行通道剪枝和层剪枝；利用知识蒸馏方法，对经过剪枝后的神经网络模型进行微调；对经过微调后的神经网络模型进行量化训练，进一步压缩神经网络模型大小。本发明通过对神经网络模型进行剪枝和量化，降低模型的大小，提高了模型在嵌入式平台上进行目标检测的速度。

Description

一种面向事件相机的神经网络模型压缩方法

技术领域

本发明属于神经网络模型压缩技术领域，特别涉及一种面向事件相机的神经网络模型压缩方法。

背景技术

人工神经网络是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型。利用神经网络可以对图片进行目标检测，类似于人脑功能一样，分辨出图片中的物体是什么以及位于图片的什么位置。

一些卷积神经网络在某些数据集上的表现甚至超过了人类的图片分辨能力，就如同AlphaGo能够战胜人类一样。但是效果好的卷积神经网络往往被设计的非常复杂、网络模型占用的空间大，而且计算量很大。这些均不利于目标检测算法在计算资源有限的嵌入式设备(如无人机、手机、可穿戴设备等)中布置。

事件相机，是一种受生物启发的视觉传感器，输出像素级亮度变化而不是标准强度帧。事件相机输出结果是以微秒时间分辨率的事件流，相当于以每秒数千帧的速度运行的传统视觉传感器，但是数据量要少得多。与传统相机相比，事件相机具有明显的优势，即非常高的动态范围，无运动模糊，以及微秒级的延迟。

发明内容

针对现有技术存在的如下问题：神经网络中存在着许多对检测影响不大的参数，特别是只检测一两个目标时，去掉一些参数基本不会影响检测的精度；神经网络模型的参数都是用的32bit长度的浮点型数表示，实际上不需要保留那么高的精度，可以通过量化，比如用0-255表示原来32个bit所表示的精度，通过牺牲精度来降低每一个权值所需要占用的空间。本发明提供了一种面向嵌入式平台的神经网络模型压缩方法，本方法通过对神经网络模型进行剪枝和量化，降低模型的大小，提高模型在嵌入式平台上进行目标检测的速度。

本发明提供了一种面向事件相机的神经网络模型压缩方法，包括如下步骤：

S1:从事件相机获取事件流数据，并将事件流数据累计一定时间间隔，生成事件图像，之后对事件图像中的目标进行标注，完成数据集制作；

S2：构建神经网络模型，并利用预训练模型初始化所述神经网络模型参数，之后利用步骤S1中制作的数据集进行训练，得到神经网络模型的基础网络；

S3：设置学习率，对基础网络进行稀疏训练，得到稀疏训练后的神经网络模型；

S4：对经过稀疏训练后的神经网络模型进行通道剪枝和层剪枝；

S5：利用知识蒸馏方法，对经过剪枝后的神经网络模型进行微调；

S6：对经过微调后的神经网络模型进行量化训练，进一步压缩神经网络模型大小。

进一步，步骤S3中对基础网络进行稀疏训练具体过程为：

在目标函数中增加一个关于参数γ的L1正则项，此时目标函数为：

其中，将BN层的参数γ作为神经网络模型的缩放因子；L是目标函数；(x,y)是训练输入和目标；f(x,W)是神经网络模型预测值；W是神经网络模型中的可训练参数，l是基础网络的训练损失函数；g(.)是在缩放因子上的惩罚项，对于任意一个变量s，g(s)＝|s|；λ是

和

两项的平衡因子；

进行稀疏化训练后，神经网络模型的多个缩放因子会趋近于零。

进一步，步骤S4具体过程为：

为整个神经网络模型设定全局阈值p；

对缩放因子的绝对值进行排序，根据全局阈值p剪掉绝对值较小的缩放因子对应的通道；

对每一个shortcut层的前一层的参数γ进行排序；

对参数γ较小的层进行层剪枝，减去对应的shortcut层以及shortcut前面的两层。

进一步，步骤S5具体过程为：

将步骤S2中得到的基础网络作为教师网络，步骤S4剪枝后的神经网络模型作为学生网络，利用式(2)对所述教师网络进行蒸馏得到教师网络的概率分布：

其中，T_Prob是教师网络的概率分布，z_i是最后一层第i个神经元的输出，T是知识蒸馏的温度，j是总共的类别数。

所述学生网络通过KL散度学习得到所述教师网络的概率分布：

其中，KL(T_Prob||S_Prob)是教师网络和学生网络之间的KL散度，S_Prob是学生网络的概率分布，x代表不同类别的目标。

本发明的有益效果：

1)通过通道剪枝，可以去掉一部分对于检测效果影响不大的参数，在损失精度很小的情况下，压缩模型的大小，提高目标检测的速度；

2)在剪枝后使用知识蒸馏利用老师网络训练学生网络，可以帮助剪枝后的网络更快的恢复精度；

3)对模型进行量化处理，可以进一步压缩模型的大小，提升检测速度，便于在嵌入式设备上面部署。

附图说明

图1为本发明实施例的面向事件相机的神经网络模型压缩方法流程图；

图2为本实施例在基础训练时平均精度均值(mAP)随着训练迭代次数的变化图；

图3为本实施例在稀疏训练时平均精度均值(mAP)随着训练迭代次数的变化图；

图4为本实施例在知识蒸馏时平均精度均值(mAP)随着训练迭代次数的变化图；

图5为本实施例检测的效果图。

具体实施方式

下面结合附图和实施例进一步描述本发明，应该理解，以下所述实施例旨在便于对本发明的理解，而对其不起任何限定作用。

本实施例以对行人检测的神经网络进行模型压缩为例，如图1所示，具体包括如下步骤：

S1:从事件相机获取事件流数据，并将事件流数据累计一定时间间隔，生成事件图像，之后对事件图像中的目标进行标注，完成数据集制作。

S2：构建神经网络模型，并利用预训练模型初始化所述神经网络模型参数，之后利用数据集进行训练，得到神经网络模型的基础网络。图2示出了本实施例在基础训练时平均精度均值(mAP)随着训练迭代次数的变化图，最后可以得到基础网络。

S3：设置学习率，对基础网络进行稀疏训练，得到稀疏训练后的神经网络模型。包括以下步骤：

S3.1：在目标函数中增加一个关于γ的L1正则项，此时目标函数L为：

其中，将BN层的参数γ作为神经网络模型的缩放因子；(x,y)是训练输入和目标，f(x,W)是神经网络模型预测值，W是网络中可训练参数，l是基础网络的训练损失函数，g(.)是在缩放因子上的惩罚项，对于任意一个变量s，g(s)＝|s|，即L1-正则化，被广泛地用于稀疏化。λ是

和

两项的平衡因子。有利地，本发明直接将BN层的γ参数作为本神经网络瘦身的缩放因子，可以避免给网络带来额外的成本。

S3.2：对基础网络进行稀疏化训练，模型中许多缩放因子会趋近于零。图3为本实施例在稀疏训练时mAP随着训练迭代次数的变化图，从图中可以看出，稀疏训练时mAP基本没有变化。

S4：对经过稀疏训练后的神经网络模型进行通道剪枝和层剪枝。具体过程为：

S4.1：为整个网络设定全局阈值p；

S4.2：对缩放因子的绝对值进行排序，根据全局阈值p剪掉绝对值较小的缩放因子对应的通道；

S4.3：对每一个shortcut层的前一层的参数γ进行排序。

S4.4：对参数γ较小的层进行层剪枝，减去对应的shortcut层以及shortcut前面的两层。

S5：利用知识蒸馏方法，对经过剪枝后的神经网络模型进行微调。

所述学生网络通过KL散度学习得到所述教师网路的概率分布：

图4为本实施例在知识蒸馏时mAP随着训练迭代次数的变化图，mAP最终会恢复到0.95左右。

S6：对经过微调后的神经网络模型进行量化训练，进一步压缩神经网络模型大小。图5为本实施例检测的效果图，从图中可以看出，利用本发明的压缩方法可以将事件相机拍摄到的人检测出来。

对于本领域的普通技术人员来说，在不脱离本发明创造构思的前提下，还可以对本发明的实施例做出若干变型和改进，这些都属于本发明的保护范围。

Claims

1.一种面向事件相机的神经网络模型压缩方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的方法，其特征在于，步骤S3中对基础网络进行稀疏训练具体过程为：

和

两项的平衡因子；

3.根据权利要求2所述的方法，其特征在于，步骤S4具体过程为：

为整个神经网络模型设定全局阈值p；

对每一个shortcut层的前一层的参数γ进行排序；

4.根据权利要求1所述的方法，其特征在于，步骤S5具体过程为：

其中，T_Prob是教师网络的概率分布，z_i是最后一层第i个神经元的输出，T是知识蒸馏的温度，j是总共的类别数；