CN110929849B

CN110929849B - 一种基于神经网络模型压缩的视频检测方法和装置

Info

Publication number: CN110929849B
Application number: CN201911155878.1A
Authority: CN
Inventors: 杜渂; 邱祥平; 陈春东; 雷霆; 彭明喜; 周赵云; 陈健; 王聚全; 杨博; 刘冉东; 王月; 王孟轩; 张胜; 韩国令; 和传志; 曹若麟
Original assignee: Ds Information Technology Co ltd
Current assignee: Ds Information Technology Co ltd
Priority date: 2019-11-22
Filing date: 2019-11-22
Publication date: 2023-09-01
Anticipated expiration: 2039-11-22
Also published as: CN110929849A

Abstract

本发明提供了一种神经网络模型的压缩方法和装置，包括：获取神经网络模型的待剪枝层中每个待剪节点在当前时刻输入下一层的传输信息；所述待剪枝层为全连接层；根据所述传输信息，计算所述待剪节点在当前时刻的重要度；根据所述待剪节点在当前时刻的重要度，获得所述待剪节点的重要度；根据所述待剪节点的重要度，计算所述待剪节点的被剪概率；根据所有待剪节点的被剪概率对所述待剪枝层进行剪枝操作，以实现模型压缩。本发明能够有效减少网络中的参数量，进而减少运行时耗和计算资源消耗，从而让网络模型占用的存储资源更小，提高网络的可移植性。

Description

一种基于神经网络模型压缩的视频检测方法和装置

技术领域

本发明涉及神经网络模型技术领域，尤指一种基于神经网络模型压缩的视频检测方法和装置。

背景技术

近年来，随着深度神经网络的蓬勃发展，学术圈和工业界共同目睹了深度学习在众多领域的重大突破，但是网络模型的大小和计算量却成为其在实际应用中的瓶颈。

在一些现实应用场景中，网络模型需要满足低时耗和低资源消耗的要求，资源消耗不仅包括计算资源，还包括存储资源、网络带宽资源。存储资源较小的网络模型表示模型文件更小，这意味着模型能够移植到各种存储资源受限的硬件中，增加了模型的可移植性，并有利于模型未来的更新维护。

通过模型压缩的方式减少模型中的参数量可有效减少神经网络的存储资源消耗。但是，不恰当的舍弃模型的某些参数可能会导致模型的表达能力下降，从而影响模型的实际效果。

发明内容

本发明的目的是提供一种基于神经网络模型压缩的视频检测方法和装置，用于减去神经网络模型尾部的全连接层中的冗余节点，减少网络参数量，在保证模型效果的前提下，实现网络压缩、节约网络资源开销。

本发明提供的技术方案如下：

一种基于神经网络模型压缩的视频检测方法，包括：获取神经网络模型的待剪枝层中每个待剪节点在当前时刻输入下一层的传输信息；所述待剪枝层为全连接层；根据所述传输信息，计算所述待剪节点在当前时刻的重要度；根据所述待剪节点在当前时刻的重要度，获得所述待剪节点的重要度；根据所述待剪节点的重要度，计算所述待剪节点的被剪概率；根据所有待剪节点的被剪概率对所述待剪枝层进行剪枝操作，以实现模型压缩。

进一步地，所述的根据所述传输信息，计算所述待剪节点在当前时刻的重要度包括：从所述传输信息中，获取所述待剪节点给下一层的一节点的传播信息向量；根据所述传播信息向量，计算所述待剪节点在当前时刻对所述下一层的一节点的重要度；根据所述待剪节点在当前时刻对所述下一层的所有节点的重要度，得到所述待剪节点在当前时刻的重要度。

进一步地，所述的根据所述传播信息向量，计算所述待剪节点在当前时刻对所述下一层的一节点的重要度，包括：获取所述传播信息向量在各个预设区间的分布概率；根据所述分布概率，利用以下公式计算所述待剪节点在当前时刻对所述下一层的一节点的重要度：

其中，IN_jn为待剪节点j在当前时刻对下一层的节点n的重要度，p_k为所述待剪节点j在当前时刻给所述下一层的节点m的传播信息向量在第k个预设区间的分布概率，N_bin为预设区间的数目。

进一步地，所述的根据所述待剪节点在当前时刻的重要度，获得所述待剪节点的重要度包括：根据所述待剪节点在当前时刻的重要度和所述待剪节点在前一时刻的带记忆重要度，计算所述待剪节点在当前时刻的带记忆重要度；将所述待剪节点在当前时刻的带记忆重要度作为所述待剪节点的重要度。

进一步地，所述的计算所述待剪节点在当前时刻的带记忆重要度之后，还包括：根据以下公式更新所述待剪节点在当前时刻的带记忆重要度：

其中，IM'_jt表示更新后的待剪节点j在t时刻的带记忆重要度，IM_jt表示待剪节点j在t时刻的带记忆重要度，β为记忆力系数，0<β<1。

进一步地，根据以下公式计算待剪节点的被剪概率：

其中，P(j)为待剪节点j的被剪概率，IM_j为待剪节点j的重要度，IM_i为待剪节点i的重要度，M为所述待剪枝层的节点数。

本发明还提供一种基于神经网络模型压缩的视频检测装置，包括：信息获取模块，用于获取神经网络模型的待剪枝层中每个待剪节点在当前时刻输入下一层的传输信息；所述待剪枝层为全连接层；当前重要度计算模块，用于根据所述传输信息，计算所述待剪节点在当前时刻的重要度；节点重要度计算模块，用于根据所述待剪节点在当前时刻的重要度，获得所述待剪节点的重要度；被剪概率计算模块，用于根据所述待剪节点的重要度，计算所述待剪节点的被剪概率；剪枝模块，用于根据所有待剪节点的被剪概率对所述待剪枝层进行剪枝操作，以实现模型压缩。

进一步地，所述当前重要度计算模块，进一步地用于从所述传输信息中，获取所述待剪节点给下一层的一节点的传播信息向量；根据所述传播信息向量，计算所述待剪节点在当前时刻对所述下一层的一节点的重要度；根据所述待剪节点在当前时刻对所述下一层的所有节点的重要度，得到所述待剪节点在当前时刻的重要度。

进一步地，所述节点重要度计算模块包括：带记忆重要度计算单元，用于根据所述待剪节点在当前时刻的重要度和所述待剪节点在前一时刻的带记忆重要度，计算所述待剪节点在当前时刻的带记忆重要度；节点重要度计算单元，用于将所述待剪节点在当前时刻的带记忆重要度作为所述待剪节点的重要度。

进一步地，所述节点重要度计算模块还包括：修正单元，用于根据以下公式更新所述待剪节点在当前时刻的带记忆重要度：

通过本发明提供的一种基于神经网络模型压缩的视频检测方法和装置，能够带来以下有益效果：

1、本发明通过对模型的全连接层进行剪枝操作减去冗余节点以达到减少参数量和资源消耗的目的，起到模型压缩的效果，从而提高模型的可移植性。

2、本发明在计算节点的重要度时，不仅考虑网络权重，同时也考虑样本数据在网络模型中的重要度，一个节点的重要度由其对下一层所有节点的影响的重要度加权获得，充分考虑了数据在层间流动时的传播信息，从而更好地表示节点的重要度。

3、本发明在评估每个待剪节点的重要度时，不仅考虑了当前时刻每个待剪节点对下一层的影响、以及每个待剪节点对不同样本的区分度，还引入了记忆力机制，以消除由于样本波动造成的误差；由于记忆力机制的存在，被剪概率最高的并不一定是当前时刻重要度最低的节点，这为剪枝操作增加了随机成分，提高了剪枝算法的稳定性。

附图说明

下面将以明确易懂的方式，结合附图说明优选实施方式，对一种基于神经网络模型压缩的视频检测方法和装置的上述特性、技术特征、优点及其实现方式予以进一步地说明。

图1是本发明的一种基于神经网络模型压缩的视频检测方法的一个实施例的流程图；

图2是本发明的一种基于神经网络模型压缩的视频检测方法的另一个实施例的流程图；

图3是本发明的一种基于神经网络模型压缩的视频检测方法的另一个实施例的流程图；

图4是本发明的一种基于神经网络模型压缩的视频检测装置的一个实施例的结构示意图；

图5是本发明的一种基于神经网络模型压缩的视频检测装置的另一个实施例的结构示意图；

图6是本发明的一种基于神经网络模型压缩的视频检测装置的另一个实施例的结构示意图。

附图标号说明：

100.信息获取模块，200.当前重要度计算模块，300.节点重要度计算模块，400.被剪概率计算模块，500.剪枝模块，310.带记忆重要度计算单元，320.修正单元，330.节点重要度计算单元。

具体实施方式

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对照附图说明本发明的具体实施方式。显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图，并获得其他的实施方式。

为使图面简洁，各图中只示意性地表示出了与本发明相关的部分，它们并不代表其作为产品的实际结构。另外，以使图面简洁便于理解，在有些图中具有相同结构或功能的部件，仅示意性地绘示了其中的一个，或仅标出了其中的一个。在本文中，“一个”不仅表示“仅此一个”，也可以表示“多于一个”的情形。

在本发明的一个实施例中，如图1所示，一种基于神经网络模型压缩的视频检测方法，包括：

步骤S100获取神经网络模型的待剪枝层中每个待剪节点在当前时刻输入下一层的传输信息；所述待剪枝层为全连接层。

步骤S200根据所述传输信息，计算所述待剪节点在当前时刻的重要度。

步骤S300根据所述待剪节点在当前时刻的重要度，获得所述待剪节点的重要度。

步骤S400根据所述待剪节点的重要度计算所述待剪节点的被剪概率。

步骤S500根据所有待剪节点的被剪概率对所述待剪枝层进行剪枝操作，以实现模型压缩。

具体地，神经网络模型是指包括全连接层的模型，比如基于卷积神经网络(简称CNN)算法构建的模型，其通常由多个卷积层、多个池化层、多个全连接层等构成，其中全连接层和人工神经网络的结构一样，节点数很多，连接线也很多，导致网络参数很多。

待剪枝层为全连接层，可以根据应用需要或剪枝比例需要，选取模型中一个或多个全连接层进行剪枝。

对每个待剪枝层，通过对该层每个节点(即待剪节点)的重要度进行评估、裁剪重要度不高的待剪节点，以减少模型参数量，同时使模型的表达能力不下降。如果选取多个全连接层为待剪枝层，先对第一个全连接层进行剪枝，再对第二个进行剪枝，直至完成对最后一个的剪枝，如此完成整个模型的压缩。

假设当前时刻需要对待剪枝层进行剪枝，在剪枝前，根据待剪节点对下一层的影响，计算每个待剪节点在当前时刻的重要度：

采集当前时刻所有输入样本下待剪节点传输给下一层的传输信息，从中提取待剪节点传输给下一层每一节点的传播信息向量。分析传播信息向量中的数值变化，得到区分度，用该区分度衡量该待剪节点在当前时刻对下一层某个节点的重要度。如果数值变化波动不大，说明在所有输入样本上该待剪节点对下一层该节点影响的区分度弱，进一步表明该待剪节点在当前时刻对下一层该节点的重要度低。

根据待剪节点在当前时刻对下一层所有节点的重要度，得到待剪节点在当前时刻的重要度。

将待剪节点在当前时刻的重要度作为待剪节点的重要度。按照待剪节点的重要度计算待剪节点的被剪概率，比如，重要度越高，被剪概率越低。根据待剪节点的被剪概率对待剪枝层进行剪枝操作，比如，从被剪概率高的待剪节点开始裁剪，直至裁剪掉预设比例的节点数；或设阈值，将高于阈值的节点裁剪掉。

本实施例，通过对模型的全连接层进行剪枝操作减去冗余节点以达到减少参数量和资源消耗的目的，起到模型压缩的效果，从而提高模型的可移植性。

在本发明的另一个实施例中，如图2所示，一种基于神经网络模型压缩的视频检测方法，包括：

步骤S210从所述传输信息中，获取所述待剪节点给下一层的一节点的传播信息向量；

步骤S220根据所述传播信息向量，计算所述待剪节点在当前时刻对所述下一层的一节点的重要度；

步骤S230根据所述待剪节点在当前时刻对所述下一层的所有节点的重要度，得到所述待剪节点在当前时刻的重要度。

步骤S400根据所述待剪节点的重要度，计算所述待剪节点的被剪概率。

具体过程如下：

假设模型为视频检测模型，待剪枝层L_i有M个节点，即M个待剪节点；下一层L_i+1有N个节点，L_i层中的每个节点均与L_i+1层的所有节点存在连边，L_i层中每个节点的输出通过N条带权重连边传播到L_i+1层。总共有N_b个输入样本。

N_b个输入样本下，L_i层中待剪节点j在当前时刻输入下一层的传输信息为：

其中，Inf(L_ij)是一个N_b×N维度的矩阵，每一行表示L_i层中待剪节点j对于每个输入样本的信息向量，总共N_b行表示对于N_b个输入样本分别产生的N_b个信息向量。每一列表示L_i层中待剪节点j在N_b个输入样本上对L_i+1层中的某一个节点的影响，记为待剪节点j给L_i+1层的一节点的传播信息向量。为待剪节点j针对第1个输入样本(即第1张图像)的输出、W_ji表示L_i层的节点j与L_i+1层的节点i之间的权重，/>通过L_i和L_i+1之间的连边，传输到L_i+1层的各个节点。

分析上述矩阵中每一列的数值，以第一列为例，如果该列的数值变化波动不大，表示待剪节点j在N_b个样本上对下一层第1个节点影响的区分度较弱，说明该待剪节点对下一层第1个节点的重要度低。

具体的，统计列向量中各元素落在在各个预设区间的分布概率，根据以下公式获取当前时刻所述待剪节点对所述下一层一节点的重要度：

其中，IN_jn为待剪枝层的待剪节点j在当前时刻对下一层的节点n的重要度，p_k为所述待剪节点j在当前时刻给所述下一层的节点n的传播信息向量在第k个预设区间的分布概率，N_bin为预设区间的数目，j＝1,2,...,M，M为待剪枝层的节点数，n＝1,2,...,N，N为下一层的节点数。

待剪枝节点的这种重要度评价方法类似于信息熵，即节点对于不同输入样本的输出信息分布越离散，区分度越好，表示其具有越高的重要度。

根据待剪节点在当前时刻对下一层所有节点的重要度计算得到待剪节点在当前时刻的重要度，计算方法有多种，比如，直接求和得到：

其中，I_j为待剪节点j在当前时刻的重要度，IN_jn为待剪节点j在当前时刻对下一层的节点n的重要度，N为下一层的节点数，j＝1,2,...,M，M为待剪枝层的节点数。

也可以对N个IN_jn加权求和，得到I_j。

将待剪节点在当前时刻的重要度作为待剪节点的重要度。根据每个待剪节点的重要度计算对应节点的被剪概率：

其中，P_j为待剪枝层待剪节点j的被剪概率，IM_j为待剪节点j的重要度，IM_i为待剪节点i的重要度，M为待剪枝层的节点数。

根据每个待剪枝节点的被剪概率对待剪枝层进行剪枝操作。

本实施例，在计算节点的重要度时，不仅考虑网络权重，同时也考虑样本数据在网络模型中的重要度，一个节点的重要度由其对下一层所有节点的影响的重要度加权获得，充分考虑了数据在层间流动时的传播信息，从而更好地表示节点的重要度。

在本发明的另一个实施例中，如图3所示，一种基于神经网络模型压缩的视频检测方法，包括：

步骤S210从所述传输信息中，获取所述待剪节点给下一层的一节点的传播信息向量。

步骤S220根据所述传播信息向量，计算所述待剪节点在当前时刻对所述下一层的一节点的重要度。

步骤S310根据所述待剪节点在当前时刻的重要度和所述待剪节点在前一时刻的带记忆重要度，计算所述待剪节点在当前时刻的带记忆重要度。

步骤S320修正所述待剪节点在当前时刻的带记忆重要度，并用修正值更新所述待剪节点在当前时刻的带记忆重要度。

步骤S330将所述待剪节点在当前时刻的带记忆重要度作为所述待剪节点的重要度。

具体计算过程如下：

初始化待剪枝层的每个待剪节点的第零时刻的带记忆重要度，比如，设为0，即IM_j0＝0，j＝1,2,...,M，M为待剪枝层的节点数。

记待剪枝层的第一次剪枝时刻为第1时刻，作为当前时刻。进行节点重要度评估，采用与前述实施例相同的方法，计算每个待剪节点在当前时刻的重要度，即I_j1，j＝1,2,...,M。

引入记忆力机制，采用以下公式，且t＝1，计算待剪节点在当前时刻的带记忆重要度IM_j1：

IM_jt＝β*IM_j(t-1)+(1-β)*I_jt

其中，I_jt为待剪枝层待剪节点j在t时刻的重要度，IM_j(t-1)为待剪枝层待剪节点j在(t-1)时刻的带记忆重要度，β为记忆力系数，0<β<1。

β越大，表示带记忆重要度与越远的时间的重要度相关。通过调整β，可以决定带记忆重要度是更多地考虑当前的评价结果还是历史的评价结果。考虑到β带来的衰减，重要度评估结果可以考虑到之前的次评价结果。

由于IM_j(t-1)的初始值很小，这会造成这样的记忆力设计在前期具有极大的偏差，很难准确地反应当前的重要度，因此采用以下偏差修正的方法解决前期误差较大问题：

其中，IM'_jt表示更新后的待剪节点j在t时刻的带记忆重要度，IM_jt表示待剪节点j在t时刻的带记忆重要度，j＝1,2,...,M，M为待剪枝层的节点数。

最开始时由于t较小，0<β<1，所以(1-β^t)较小，对IM_jt产生了放大效果；随着t的增长，分母趋近于1，则IM_j'_t又近似还原到原始的带记忆重要度IM_jt。

用IM'_jt更新IM_jt。

经上述处理，在第一次剪枝时刻，t＝1，得到IM_j1，根据IM_j1计算待剪节点j的被剪概率P_j，根据待剪节点的被剪概率对待剪枝层进行第一次剪枝操作。

重复上述过程，在第二次剪枝时刻，t＝2，得到IM_j2，根据IM_j2计算待剪节点j的被剪概率P_j，根据待剪节点的被剪概率对待剪枝层进行第二次剪枝操作。

……

重复上述过程，直至到达预设的剪枝次数。

本实施例在评估每个待剪节点的重要度时，不仅考虑了当前时刻每个待剪节点对下一层的影响、以及每个待剪节点对不同样本的区分度，还引入了记忆力机制，以消除由于样本波动造成的误差。

与前述实施例不同，待剪节点的重要度评估是根据待剪节点在当前时刻的带记忆重要度计算得到。待剪节点在当前时刻的带记忆重要度不仅与待剪节点在当前时刻的重要度相关，还与以前时刻的带记忆重要度相关。

由于记忆力机制的存在，所以被剪概率最高的并不一定是当前时刻重要度最低的节点，这为剪枝操作增加了随机成分，提高了剪枝算法的稳定性。

将本实施例方法应用于采用CNN结构的视频检测模型的全连接层的剪枝操作，经模型压缩后构建出VFD-SmartNet网络，并和其他一些模型进行对比，包括AlexNet、VGG16、ResNet18、ResNet34、ResNet-like、DenseNet-like模型比较，性能对比如下：

模型	查全率	查准率	参数量	模型文件大小
					AlexNet	0.0949	0.906	50,847,418	406.8MB
VGG16	0.954	0.925	134,244,162	1.1GB
					ResNet18	0.982	0.973	11,188,354	89.7MB
ResNet34	0.98	0.976	21,307,650	256.0MB
					ResNet-like	0.970	0.981	2,788,482	22.5MB
DenseNet-like	0.982	0.985	2,255,374	18.5MB
					VFD-SmartNet	0.985	0.988	41,374	689.9KB

模型压缩效果与参数量和模型文件大小有关，观察表中数据可以看出，VFD-SmartNet模型的参数量有明显的下降且模型文件相较其他模型也非常小，很好地达到了模型压缩的效果，并且查全率和查准率也维持在比较高的水准，可见在保持检测的查全率和查准率大致不变的前提下，能够大量减少网络参数以缩小网络模型文件大小，从而提高模型的可移植性。

在本发明的另一个实施例中，如图4所示，一种基于神经网络模型压缩的视频检测装置，包括：

信息获取模块100，用于获取神经网络模型的待剪枝层中每个待剪节点在当前时刻输入下一层的传输信息；所述待剪枝层为全连接层。

当前重要度计算模块200，用于根据所述传输信息，计算所述待剪节点在当前时刻的重要度。

节点重要度计算模块300，用于根据所述待剪节点在当前时刻的重要度，获得所述待剪节点的重要度。

被剪概率计算模块400，用于根据所述待剪节点的重要度计算所述待剪节点的被剪概率。

剪枝模块500，用于根据所有待剪节点的被剪概率对所述待剪枝层进行剪枝操作，以实现模型压缩。

在本发明的另一个实施例中，如图5所示，一种基于神经网络模型压缩的视频检测装置，包括：

当前重要度计算模块200，用于从所述传输信息中，获取所述待剪节点给下一层的一节点的传播信息向量；根据所述传播信息向量，计算所述待剪节点在当前时刻对所述下一层的一节点的重要度；根据所述待剪节点在当前时刻对所述下一层的所有节点的重要度，得到所述待剪节点在当前时刻的重要度。

具体过程如下：

也可以对N个IN_jn加权求和，得到I_j。

根据每个待剪枝节点的被剪概率对待剪枝层进行剪枝操作。

在本发明的另一个实施例中，如图6所示，一种基于神经网络模型压缩的视频检测装置，包括：

节点重要度计算模块300包括：

带记忆重要度计算单元310，用于根据所述待剪节点在当前时刻的重要度和所述待剪节点在前一时刻的带记忆重要度，计算所述待剪节点在当前时刻的带记忆重要度；

修正单元320，用于修正所述待剪节点在当前时刻的带记忆重要度，并用修正值更新所述待剪节点在当前时刻的带记忆重要度。

节点重要度计算单元330，用于将所述待剪节点在当前时刻的带记忆重要度作为所述待剪节点的重要度。

具体计算过程如下：

IM_jt＝β*IM_j(t-1)+(1-β)*I_jt

最开始时由于t较小，0<β<1，所以(1-β^t)较小，对IM_jt产生了放大效果；随着t的增长，分母趋近于1，则IM'_jt又近似还原到原始的带记忆重要度IM_jt。

用IM'_jt更新IM_jt。

……

重复上述过程，直至到达预设的剪枝次数。

应当说明的是，上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种基于神经网络模型压缩的视频检测方法，其特征在于，包括：

所述神经网络模型采用CNN结构；

针对每个输入图像样本，获取所述神经网络模型的待剪枝层中每个待剪节点在当前时刻输入下一层节点的传输信息；所述待剪枝层为全连接层；

根据所有输入图像样本下所述待剪节点在当前时刻输入下一层同一节点的传输信息的分布的离散程度，确定所述待剪节点在当前时刻的重要度；

根据所述待剪节点在当前时刻的重要度和所述待剪节点在前一时刻的带记忆重要度，计算所述待剪节点在当前时刻的带记忆重要度；

根据以下公式更新所述待剪节点在当前时刻的带记忆重要度：

其中，IM_j'_t表示更新后的待剪节点j在t时刻的带记忆重要度，IM_jt表示待剪节点j在t时刻的带记忆重要度，β为记忆力系数，0<β<1；

将所述更新后的待剪节点在当前时刻的带记忆重要度作为所述待剪节点的重要度；

根据所述待剪节点的重要度，计算所述待剪节点的被剪概率；

根据所有待剪节点的被剪概率对所述待剪枝层进行剪枝操作，以实现模型压缩；

其中，根据所有输入图像样本下所述待剪节点在当前时刻输入下一层同一节点的传输信息的分布的离散程度，确定所述待剪节点在当前时刻的重要度包括：

根据所有输入图像样本下所述待剪节点在当前时刻输入下一层同一节点的传输信息，得到所述待剪节点给下一层的对应节点的传播信息向量；

根据所述传播信息向量，计算所述待剪节点在当前时刻对所述下一层的对应节点的重要度；

根据所述待剪节点在当前时刻对所述下一层的所有节点的重要度，得到所述待剪节点在当前时刻的重要度。

2.根据权利要求1所述的基于神经网络模型压缩的视频检测方法，其特征在于，所述的根据所述传播信息向量，计算所述待剪节点在当前时刻对所述下一层的一节点的重要度，包括：

获取所述传播信息向量在各个预设区间的分布概率；

根据所述分布概率，利用以下公式计算所述待剪节点在当前时刻对所述下一层的一节点的重要度：

其中，IN_jn为待剪节点j在当前时刻对下一层的节点n的重要度，p_k为所述待剪节点j在当前时刻给所述下一层的节点n的传播信息向量在第k个预设区间的分布概率，N_bin为预设区间的数目。

3.根据权利要求1-2任意一项所述的基于神经网络模型压缩的视频检测方法，其特征在于：

根据以下公式计算待剪节点的被剪概率：

4.一种基于神经网络模型压缩的视频检测装置，其特征在于，包括：

所述神经网络模型采用CNN结构；

信息获取模块，用于针对每个输入图像样本，获取所述神经网络模型的待剪枝层中每个待剪节点在当前时刻输入下一层节点的传输信息；所述待剪枝层为全连接层；

当前重要度计算模块，用于根据所有输入图像样本下所述待剪节点在当前时刻输入下一层同一节点的传输信息的分布的离散程度，确定所述待剪节点在当前时刻的重要度；

节点重要度计算模块，用于根据所述待剪节点在当前时刻的重要度和所述待剪节点在前一时刻的带记忆重要度，计算所述待剪节点在当前时刻的带记忆重要度；根据以下公式更新所述待剪节点在当前时刻的带记忆重要度：

被剪概率计算模块，用于根据所述待剪节点的重要度，计算所述待剪节点的被剪概率；

剪枝模块，用于根据所有待剪节点的被剪概率对所述待剪枝层进行剪枝操作，以实现模型压缩；

所述当前重要度计算模块，还用于根据所有输入图像样本下所述待剪节点在当前时刻输入下一层同一节点的传输信息，得到所述待剪节点给下一层的对应节点的传播信息向量；根据所述传播信息向量，计算所述待剪节点在当前时刻对所述下一层的对应节点的重要度；根据所述待剪节点在当前时刻对所述下一层的所有节点的重要度，得到所述待剪节点在当前时刻的重要度。