WO2023102844A1

WO2023102844A1 - 剪枝模块的确定方法、装置及计算机可读存储介质

Info

Publication number: WO2023102844A1
Application number: PCT/CN2021/136849
Authority: WO
Inventors: 高伟; 郭洋; 李革
Original assignee: 北京大学深圳研究生院
Priority date: 2021-12-09
Filing date: 2021-12-09
Publication date: 2023-06-15
Also published as: US20230186091A1; CN114514539A

Abstract

本申请公开了一种剪枝模块的确定方法、装置及计算机可读存储介质，剪枝模块的确定方法包括：获取待剪枝神经网络的输入任务和任务数量，以及所述待剪枝神经网络的组成模块的输出信息；根据所述输入任务、所述任务数量和所述输出信息确定所述组成模块的任务关联度；根据所述任务数量和所述输出信息确定所述组成模块的输入信息保留度；根据所述任务关联度和所述输入信息保留度确定所述组成模块的重要性指标值；根据所述重要性指标值确定所述待剪枝神经网络中的剪枝模块。

Description

剪枝模块的确定方法、装置及计算机可读存储介质

技术领域

本申请涉及神经网络压缩技术领域，尤其涉及一种剪枝模块的确定方法、装置及计算机可读存储介质。

背景技术

神经网络在计算机视觉、自然语言处理等众多领域取得重大突破，但是，在具体的应用过程中，神经网络的计算复杂度与参数存储需求量都比较高，导致其无法部署于一些资源有限的设备上。为了扩增神经网络的适用范围，通常可通过神经网络剪枝的方式进行神经网络压缩并降低神经网络的计算复杂度与参数存储需求量。

然而，目前已有的神经网络剪枝方案通常都是基于神经网络中的权重参数或输出特征图的数据特征来评估网络结构中不同部分的重要程度，然后根据该重要程度进行剪枝操作。如此，在基于数据驱动评估网络结构中不同部分的重要程度时，仅考虑到输出数据本身的数据特性，导致在根据所评估的重要程度进行剪枝时的剪枝准确性有待进一步提高。

技术问题

本申请实施例通过提供一种剪枝模块的确定方法、装置及计算机可读存储介质，旨在解决基于数据驱动评估网络结构中不同部分的重要程度时，仅考虑到输出数据本身的数据特性，导致在根据所评估的重要程度进行剪枝时的剪枝准确性有待进一步提高的技术问题。

技术解决方案

本申请实施例提供了一种剪枝模块的确定方法，所述剪枝模块的确定方法，包括：

获取待剪枝神经网络的输入任务和任务数量，以及所述待剪枝神经网络的组成模块的输出信息；

根据所述输入任务、所述任务数量和所述输出信息确定所述组成模块的任务关联度；

根据所述任务数量和所述输出信息确定所述组成模块的输入信息保留度；

根据所述任务关联度和所述输入信息保留度确定所述组成模块的重要性指标值；

根据所述重要性指标值确定所述待剪枝神经网络中的剪枝模块。

在一实施例中，所述根据所述输入任务、所述任务数量和所述输出信息确定所述组成模块的任务关联度的步骤包括：

获取当前网络层级中所述组成模块的目标序号；

确定当前网络层级中序号小于或等于所述目标序号的目标组成模块；

根据各个所述目标组成模块的输出信息与所述输入任务确定各个所述目标组成模块的输入任务保留度和输入输出信息总和；

根据所述任务数量、所述输入任务保留度和所述输入输出信息总和确定所述组成模块的任务关联度。

在一实施例中，所述输入任务包括至少一张输入任务图，所述输出信息包括输出特征图，所述根据各个所述目标组成模块的输出信息与所述输入任务确定各个所述目标组成模块的输入任务保留度和输入输出信息总和的步骤包括：

对各个所述目标组成模块的输出特征图的分辨率进行调节，以使所述输出特征图的分辨率与所述输入任务图的分辨率一致；

对所述输入任务图和调节后的所述输出特征图进行二值化处理；

对处理后的所述输入任务图和处理后的所述输出特征图取交集，得到各个所述目标组成模块的输入任务保留度；

对处理后的所述输入任务图和处理后的所述输出特征图的取并集，得到各个所述目标组成模块的输入输出信息总和。

在一实施例中，所述根据所述任务数量、所述输入任务保留度和所述输入输出信息总和确定所述组成模块的任务关联度的步骤包括：

获取所述输入任务保留度和所述输入输出信息总和的比值，得到各个所述目标组成模块的任务保留占比；

对各个所述任务保留占比求和，得到任务保留占比和值；

将所述任务保留占比和值与所述任务数量的商值确定为所述组成模块的任务关联度。

在一实施例中，所述根据所述任务数量和所述输出信息确定所述组成模块的输入信息保留度的步骤包括：

获取所述组成模块在当前网络层级中的目标序号，以及所述输入任务包含的图像数量；

根据各个所述目标组成模块的输出信息确定当前网络层级中各个所述目标组成模块的第一能量值，根据前一网络层级中各个组成模块的输出信息确定前一网络层级中的组成模块的第二能量值；

根据所述任务数量、所述第一能量值和所述第二能量值确定所述组成模块的输入信息保留度。

在一实施例中，所述根据各个所述目标组成模块的输出信息确定当前网络层级中各个所述目标组成模块的第一能量值，根据前一网络层级中各个组成模块的输出信息确定前一网络层级中的组成模块的第二能量值的步骤包括：

求取各个所述目标组成模块的输出信息的范数，将所述范数的平方作为各个所述目标组成模块的第一能量值；

求取前一网络层级中的各个组成模块的输出信息的方差，得到所述第二能量值。

在一实施例中，所述根据所述任务数量、所述第一能量值和所述第二能量值确定所述组成模块的输入信息保留度的步骤包括：

获取各个所述第一能量值与所述第二能量值之间的比值，得到各个所述目标组成模块对应的能量占比；

对各个所述能量占比进行求和，得到能量占比和值；

将所述能量占比和值与所述任务数量的商值确定为所述组成模块的输入信息保留度。

在一实施例中，所述根据所述任务关联度和所述输入信息保留度确定所述组成模块的重要性指标值的步骤包括：

对所述任务关联度和所述输入信息保留度进行归一化处理；

将归一化后的所述任务关联度与归一化后的所述输入信息保留度的和值作为所述组成模块的重要性指标值；

或者，将归一化后的所述任务关联度与归一化后的所述输入信息保留度的乘积作为所述组成模块的重要性指标值。

此外，为实现上述目的，本申请还提供了一种剪枝模块的确定装置，所述剪枝模块的确定装置包括存储器、处理器及存储在存储器上并可在处理器上运行网络模型的剪枝程序，所述网络模型的剪枝程序被所述处理器执行时实现如上所述的网络模型的剪枝方法的步骤。

此外，为实现上述目的，本申请还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有剪枝模块的确定程序，所述剪枝模块的确定程序被处理器执行时实现如上所述的剪枝模块的确定方法的步骤。

有益效果

本申请实施例中提供的剪枝模块的确定方法、装置及计算机可读存储介质，通过获取待剪枝神经网络的输入任务和任务数量以及待剪枝神经网络的组成模块的输出信息，然后根据所输入任务、任务数量和所述输出信息确定各组成模块的任务关联度，并根据任务数量和输出信息确定组成模块的输入信息保留度，随后根据任务关联度和输入信息保留度确定所述组成模块的重要性指标值，以根据重要性指标值确定待剪枝神经网络中的剪枝模块，使得可以将各组成模块的输出信息与输入任务关联起来实现基于任务驱动的神经网络剪枝，能够避免仅根据输出数据本身的数据特性对各组成模块进行重要性评估时容易将与输入任务关联的重要模块减掉而对神经网络对输入任务的处理产生影响，进而能够提高剪枝模块确定的准确性，以提高神经网络的剪枝准确性。

附图说明

图1为本申请实施例方案涉及的硬件运行环境的剪枝模块的确定装置结构示意图；

图2是本申请剪枝模块的确定方法第一实施例的流程示意图；

图3为本申请剪枝模块的确定方法第二实施例的流程示意图；

图4为本申请剪枝模块的确定方法第三实施例的流程示意图；

图5为本申请剪枝模块的确定方法第四实施例的流程示意图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明，上述附图只是一个实施例图，而不是本申请的全部。

本发明的实施方式

为了更好的理解上述技术方案，下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

本申请的主要解决方案是：获取待剪枝神经网络的输入任务和任务数量，以及所述待剪枝神经网络的组成模块的输出信息；根据所述输入任务、所述任务数量和所述输出信息确定所述组成模块的任务关联度；根据所述任务数量和所述输出信息确定所述组成模块的输入信息保留度；根据所述任务关联度和所述输入信息保留度确定所述组成模块的重要性指标值；根据所述重要性指标值确定所述待剪枝神经网络中的剪枝模块。

由于目前的神经网络剪枝方案大多是基于数据驱动实现各组成模块的重要性评估的，然而，通过此种方式仅考虑到输出数据本身的数据特征，而忽略了输出数据与输入任务之间的关联，导致剪枝时容易将输入任务相关的组成模块剪掉，不利于提高剪枝的准确性。因而，本申请提出的上述解决方案旨在提高剪枝的准确性。

参照图1，图1为本申请实施例方案涉及的硬件运行环境的剪枝模块的确定装置结构示意图。

如图1所示，该剪枝模块的确定装置可以包括：通信总线1002，处理器1001，例如CPU，用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的剪枝模块的确定装置结构并不构成对剪枝模块的确定装置的限定，可以包括比图示更多或更少的部件，或组合某些部件，或者不同的部件布置。

在图1所示的剪枝模块的确定装置中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接客户端(用户端)，与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的剪枝模块的确定装置的控制程序，并执行以下剪枝模块的确定方法的各个实施例的相关步骤。

基于上述剪枝模块的确定装置的系统架构，提出本申请剪枝模块的确定方法的第一实施例。参照图2，本实施例中，所述剪枝模块的确定方法包括以下步骤：

步骤S10：获取待剪枝神经网络的输入任务和任务数量，以及所述待剪枝神经网络的组成模块的输出信息；

步骤S20：根据所述输入任务、所述任务数量和所述输出信息确定所述组成模块的任务关联度；

步骤S30：根据所述任务数量和所述输出信息确定所述组成模块的输入信息保留度；

步骤S40：根据所述任务关联度和所述输入信息保留度确定所述组成模块的重要性指标值；

步骤S50：根据所述重要性指标值确定所述待剪枝神经网络中的剪枝模块。

需要说明的是，待剪枝神经网络指的是需要进行剪枝以实现神经网络压缩的神经网络，例如，卷积神经网络(Convolutional Neural Networks，CNN)、深度神经网络(Deep Neural Networks，DNN)以及循环神经网络(Recurrent Neural Network，RNN)等；待剪枝神经网络的输入任务指的是输入待剪枝神经网络进行信息处理的输入数据，如数据表、序列表或图像表等；待剪枝神经网络的组成模块的输出信息指的是待剪枝神经网络的组成模块的输出数据，如输出特征图。其中，每个待剪枝神经网络可包括多个组成模块，所述组成模块可包括滤波器、通道以及参数中的至少一个；每个输入任务可包括至少一个输入数据，如至少一个输入图像等。

由于神经网络的计算复杂度和参数存储需求量都比较高，为了提高处理效率以及扩增神经网络的适用范围，需要对神经网络进行压缩，而神经网络剪枝是目前比较常用的神经网络压缩方式。然而，一些实现方式中，通常是基于数据驱动对神经网络的组成成分进行重要性评估的，例如，基于计算通道输出特征图的L1正则化/L2正则化/其他正则化项，通过计算结果的数值排序来确定重要性程度；或者是，对每个权重参数矩阵中所有的元素按照绝对值从小到大进行排序以确定重要性程度；或者是，通过计算滤波器的范数(L1正则化/L2正则化/其他正则化项)来确定滤波器的贡献度，范数大小和贡献度成正比。如此，在评估网络结构中不同组成模块的重要性程度时，仅考虑到输出数据本身的输出特性，而忽略了输出数据与输入任务之间的联系，导致在根据所评估的重要性程度对神经网络进行剪枝时的剪枝准确性有待进一步提高。因而，本申请提出的剪枝模块的确定方法可以结合各个组成模块的输出数据与输入任务之间的联系来评估待剪枝神经网络的重要性，以更加准确地确定待剪枝神经网络的组成模块中的剪枝模块，进而提高对待剪枝神经网络进行剪枝时的剪枝准确性。

具体地，在将输入任务输入待剪枝神经网络后，可对应获取待剪枝神经网络的各个组成模块的输出信息，并对输入待剪枝神经网络的输入任务和该输入任务对应所包含的任务数量进行记录，以便根据待剪枝神经网络的输入任务和任务数量以及待剪枝神经网络的组成模块的输出信息确定待剪枝神经网络的各个组成模块的重要性。

在确定待剪枝神经网络的各个组成模块的重要性时，具体可以是：根据待剪枝神经网络的输入任务和任务数量以及待剪枝神经网络的组成模块的输出信息确定各个组成模块的任务关联度；以及，根据待剪枝神经网络的任务数量和待剪枝神经网络的各个组成模块的输出信息确定各个组成模块的输入信息保留度，进而根据各个组成模块的任务关联度和输入信息保留度确定各个组成模块的重要性指标值。其中，各个组成模块的任务关联度指的是各个组成模块的输出信息与待剪枝神经网络的输入任务之间的关联度；各个组成模块的输入信息保留度指的是各个组成模块的输出信息中包含其输入信息的信息量。

可选地，根据待剪枝神经网络的输入任务和任务数量以及待剪枝神经网络的组成模块的输出信息确定各个组成模块的任务关联度时，考虑到同一网络层级的组成模块之间的信息传输影响，具体可以是：分别对待剪枝神经网络的输入任务和当前网络层级中包含当前组成模块N(N为正整数)在内的前N个组成模块的输出信息取交集得到前N个组成模块中含有的输入任务信息量，并对这前N个组成模块中含有的输入任务信息量进行求和，然后根据任务数量对求和所得的和值取平均值，以得到当前组成模块N对应的任务关联度；或者是，在确定各组成模块的输出信息与输入任务的交集与并集后，根据当前组成模块在当前网络层级中的序号N对前N个组成模块对应的交集与并集的比值进行求和，然后按照任务数量对求和所得的和值取平均值，以得到当前组成模块对应的任务关联度等。

可以理解的是，确定各个组成模块的任务关联度的方式还可以是其他方式，此处仅做列举，不作具体限定。

可选地，根据待剪枝神经网络的任务数量和待剪枝神经网络的各个组成模块的输出信息确定各个组成模块的输入信息保留度时，具体可以是：考虑到同一网络层级的组成模块之间的相互影响，在确定当前网络层级中包含当前组成模块N(N为正整数)在内的前N个组成模块的输出信息对应的能量值，并对所确定的N个能量值进行求和后，按照任务数量对求和所得的和值取平均值，以得到当前组成模块的输入信息保留量；或者是，考虑到相邻网络层级之间的信息流动以及同一网络层级的组成模块之间的相互影响，在确定各组成模块的输出信息与前一网络层级的输出信息对应的能量占比后，根据当前组成模块在当前网络层级中的序号N对前N个组成模块对应的能量占比进行求和，并按照任务数量取平均值，以得到当前组成模块的输入信息保留量等。

可以理解的是，确定各个组成模块的输入信息保留度的方式还可以是其他方式，此处仅做列举，不作具体限定。

可选地，根据各个组成模块的任务关联度和输入信息保留度确定各个组成模块的重要性指标值时，具体可以是：以任务关联度与输入信息保留度的和值作为重要性指标值；或者是，以任务关联度和输入信息保留度的乘积作为重要性指标值；或者是以任务关联度与输入信息保留度的加权和值作为重要性指标值等，此处不作具体限定。

在确定各个组成模块的重要性指标值后，可根据该重要性指标值确定待剪枝神经网络中的剪枝模块。其中，待剪枝神经网络中的剪枝模块指的是待剪枝神经网络的组成模块中可以进行剪枝的组成模块，如滤波器、通道以及参数中的至少一个。在确定待剪枝神经网络中的剪枝模块后，可对剪枝模块进行剪枝处理，以减小待剪枝神经网络的计算复杂度以及数据存储需求量。

可选地，根据该重要性指标值确定待剪枝神经网络中的剪枝模块的方式可以是：将重要性指标值在预设数值范围内的组成模块确定为剪枝模块；或者是，根据预设剪枝率确定需要剪枝的剪枝模块数量后，将所述剪枝模块数量对应的重要性指标值较高的组成模块确定为剪枝模块等，此处不作具体限定。其中，预设数值范围和预设剪枝率可根据实际需求设定，此处不作具体限定。

本实施例通过获取待剪枝神经网络的输入任务和任务数量以及待剪枝神经网络的组成模块的输出信息，然后根据输入任务、任务数量和输出信息确定组成模块的任务关联度，并根据任务数量和输出信息确定组成模块的输入信息保留度，再根据任务关联度和输入信息保留度确定各个组成模块的重要性指标值，并根据重要性指标值确定待剪枝神经网络中的剪枝模块，使得可以将各个组成模块的输出信息与待剪枝神经网络的输入任务关联起来以基于任务驱动评估各个组成模块的重要性，避免仅根据输出数据本身的数据特性进行重要性评估而忽略了输入任务对于神经网络进行信息处理的作用时，容易误将与输入任务关联度较高的组成模块进行剪枝，导致对输入任务的处理造成影响。如此，将各个组成模块的输出信息与待剪枝神经网络的输入任务关联起来基于任务驱动评估各个组成模块的重要性，能够提高待剪枝神经网络的剪枝准确性。

基于上述第一实施例，提出本申请剪枝模块的确定方法的第二实施例。参照图3，本实施例中，步骤S20可包括：

步骤S21：获取当前网络层级中所述组成模块的目标序号；

步骤S22：确定当前网络层级中序号小于或等于所述目标序号的目标组成模块；

步骤S23：根据各个所述目标组成模块的输出信息与所述输入任务确定各个所述目标组成模块的输入任务保留度和输入输出信息总和；

步骤S24：根据所述任务数量、所述输入任务保留度和所述输入输出信息总和确定所述组成模块的任务关联度。

需要说明的是，待剪枝神经网络可包含多个网络层级，每个网络层级中可包括多个组成模块。基于此，可基于各个组成模块的连接关系或处理顺序等对同一网络层级中的不同组成模块进行编号，以便于对同一网络层级中的不同组成模块进行区分。例如，可按照连接关系按照从小到大的顺序逐级排序；或者是，按照处理顺序按照从小到大的顺序进行排序，处理顺序越靠前，对应的排序序号越小。

由于处于同一层级的组成模块之间会存在相互影响，进而影响当前组成模块的任务关联度，因而，在确定当前组成模块的任务关联度之前，可先确定当前网络层级中对当前组成模块的信息处理存在影响的目标组成模块，然后结合目标组成模块的影响和当前组成模块自身的处理能力来确定当前组成模块的任务关联度。具体地，可先确定当前组成模块在其所处的当前网络层级中的目标序号，例如，当前滤波器是当前网络层级中的第几个组成模块。对于排序序号小于目标序号的组成模块均认为是可能对当前组成模块的任务关联度有影响的组成模块。如此，可将当前网络层级中序号小于或等于目标序号的组成模块确定为目标组成模块，例如，在目标序号为1时，将第一个组成模块确定为目标组成模块，在目标序号为3时，将第一个、第二个以及第三个组成模块均确定为目标组成模块，进而可根据目标组成模块的输出信息以及待剪枝神经网络的输入任务和任务数量确定当前组成模块的任务关联度。

具体地，在确定当前组成模块的任务关联度时，可先根据各目标组成模块的输出信息与待剪枝神经网络的输入任务确定各个目标组成模块的输入任务保留度以及各个目标组成模块的输入输出信息总和，然后根据输入待剪枝神经网络的任务数量以及各个目标组成模块的输入任务保留度和输入输出信息总和确定当前组成模块的任务关联度。其中，各个目标组成模块的输入任务保留度指的是各个目标组成模块的输出信息中包含输入任务的信息量；各个目标组成模块的输入输出信息总和指的是各个目标组成模块的输出信息与待剪枝神经网络的输入任务所包含的任务信息的信息总和。

可选地，根据各目标组成模块的输出信息与待剪枝神经网络的输入任务确定各个目标组成模块的输入任务保留度以及输入输出信息总和时，具体可以是：对目标组成模块的输出信息与待剪枝神经网络的输入任务取交集得到各个目标组成模块的输入任务保留度；以及，对目标组成模块的输出信息与待剪枝神经网络的输入任务取并集得到各个目标组成模块的输入输出信息总和。

可选地，所述输入任务以图像分类为例时，若待剪枝神经网络的输入任务包括至少一张输入任务图，对应地，各个组成模块的输出信息包括至少一张输出特征图，则为了便于进行信息比对，可在确定各个目标组成模块的输入任务保留度以及输入输出信息总和之前，先对各个目标组成模块的输出特征图的分辨率进行调节，以将输出特征图的分辨率调节至与输入任务图的分辨率一致。

可选地，为了减少计算量并凸显出感兴趣目标的轮廓，在确定各个目标组成模块的输入任务保留度以及输入输出信息总和之前，还可对输出特征图和输入任务图进行二值化处理。

可选地，根据输入待剪枝神经网络的任务数量以及各个目标组成模块的输入任务保留度和输入输出信息总和确定当前组成模块的任务关联度时，具体可以是：先计算每一个目标组成模块的输入任务保留度和输入输出信息总和的比值得到任务保留占比；然后对各个目标组成模块的任务保留占比进行求和得到任务保留占比总和；再将任务保留占比总和除以任务数量，得到每一项任务对应的任务保留平均值，以该任务保留平均值作为当前组成模块的任务关联度。

一具体的应用实例中，可先对各个目标组成模块的输出特征图进行分辨率调节，以将输出特征图的分辨率调节至与输入任务图的分辨率一致；然后对输入任务图进行二值化处理，得到二值化处理后的输入任务图；并对调节后的输出特征图进行二值化处理，得到二值化处理后的输出特征图；再对二值化处理后的输入任务图和值化处理后的输出特征图取交集，即可得到各个目标组成模块的输入任务保留度；对二值化处理后的输入任务图和值化处理后的输出特征图取并集，即可得到各个目标组成模块的输入输出信息总和；紧接着，获取各个目标组成模块的输入任务保留度与输入输出信息总和的比值，得到各个目标组成模块的任务保留占比；并对所获取的各个任务保留占比求和，得到各个目标组成模块的任务保留占比和值；随后，计算各个目标组成模块的任务保留占比和值与任务数量的商值，即可得到当前组成模块的任务关联度。

例如，对于待剪枝神经网络中第t层的第i个组成模块，假设将输入任务图x的灰度图记为G(x)，网络中第t层的第i个组成模块的网络权重参数为

将其对应的输出特征图记为

则计算待剪枝神经网络中第t层的第i个组成模块的任务关联度可包括如下步骤：

1)可通过双线性插值法将

的分辨率调节至与输入任务图x的分辨率相同，并将调节后的输出特征图记为

2)可基于设定阈值Δ，对G(x)和

进行二值化处理，得到二值化处理后的输入任务图，记为L(x)，以及二值化处理后的输出特征图，记为

计算公式如下：

值得注意的是，所设定的阈值Δ的不同，并不会对最终计算得到的重要性指标值产生影响。

(3)若将序号小于等于i的各个目标组成模块的任务保留占比记为

则根据任务数量d对

取平均值，即可得到待剪枝神经网络中第t层的第i个组成模块的任务关联度，记为

具体的计算公式如下：

值得注意的是，

越大，说明网络中第t层的第i个组成模块提取输入任务的语义信息的能力越强，对输入任务越重要。也即，可将每个组成模块视作和输入任务有关的语义提取器，将每个组成模块的输出特征图视作含有输入任务的语义信息的特征图，通过判定输出特征图中含有多少和输入任务有关的语义信息来评估输入任务和特征图之间的联系，从而确定输出这个特征图的滤波器对任务的语义提取能力。

本实施例通过待剪枝神经网络的输入任务对应的任务数量、目标组成模块的输入任务保留度和输入输出信息总和确定当前组成模块的任务关联度，使得不仅能够将当前组成模块的输出信息与输入任务关联起来，还能充分考虑到当前网络层级中排列靠前的组成模块对当前组成模块的任务关联度的影响，能够提高当前组成模块的任务关联度确定的准确性，进而提高当前组成模块的重要性指标值确定的准确性，以提高剪枝准确性。

基于上述第一实施例，提出本申请剪枝模块的确定方法的第三实施例。参照图4，本实施例中，步骤S30可包括：

步骤S31：获取所述组成模块在当前网络层级中的目标序号，以及所述输入任务包含的图像数量；

步骤S32：确定当前网络层级中序号小于或等于所述目标序号的目标组成模块；

步骤S33：根据各个所述目标组成模块的输出信息确定当前网络层级中各个所述目标组成模块的第一能量值，根据前一网络层级中各个组成模块的输出信息确定前一网络层级中的组成模块的第二能量值；

步骤S34：根据所述任务数量、所述第一能量值和所述第二能量值确定所述组成模块的输入信息保留度。

由于处于同一层级的组成模块之间是存在相互影响，而隔层的组成模块之间并无互相影响，可通过分析相邻层的组成模块之间的信息获取量来测定相邻层的组成模块中的信息流动，以评估当前组成模块的输入信息保留度。具体地，在确定当前组成模块的输入信息保留度之前，可先确定当前网络层级中对当前组成模块的输入信息保留度存在影响的目标组成模块。例如，可先确定当前组成模块在启所处的当前网络层级中的目标序号，例如，当前滤波器是当前网络层级中的第几个滤波器。对于排序序号小于目标序号的组成模块均认为是对当前组成模块的输入信息保留度存在影响的目标组成模块。如此，可将当前网络层级中序号小于或等于目标序号的组成模块确定为目标组成模块，进而可根据目标组成模块的输出信息以及待剪枝神经网络的输入任务对应的任务数量确定当前组成模块的输入信息保留度。

在根据目标组成模块的输出信息和待剪枝神经网络的任务数量确定当前组成模块的输入信息保留度时，具体可以是：先根据各个目标组成模块的输出信息确定当前网络层级中各个目标组成模块的第一能量值；并根据前一网络层级中各个组成模块的输出信息确定前一网络层级中的组成模块的第二能量值；然后根据任务数量、第一能量值和第二能量值确定当前组成模块的输入信息保留度。第一能量值指的是各个目标组成模块的输出信息对应的能量值，第二能量值指的是前一网络层级的输出信息对应的能量值。

可选地，可求取各个目标组成模块的输出信息的范数，将所求取的范数的平方作为各个目标组成模块的第一能量值。这里的范数尤指L2范数，以提高第一能量值计算的准确性。当然，在其他一些实施例中也可以采用其他范数，如L1范数，此处不作具体限定。其中，L2范数指的是向量中各个元素的平方之和再开根号；L1范数指的是向量中各个元素的绝对值之和，也称为“稀疏规则算子”。

可选地，可求取前一网络层级中的各个组成组模块的输出信息的方差作为前一网络层级对应的第二能量值。

可选地，根据任务数量、第一能量值和第二能量值确定当前组成模块的输入信息保留度时，可先获取各个目标组成模块的第一能量值与第二能量值之间的比值，得到各个目标组成模块对应的能量占比，然后对各个能量占比求和得到能量占比和值，再将所得到的能量占比和值除以任务数量，即可得到当前组成模块的输入信息保留度。

一具体的应用实例中，输入任务以图像分类为例时，若待剪枝神经网络的输入任务包括至少一张输入任务图，各个组成模块的输出信息对应包括至少一张输出特征图，则对于待剪枝神经网络中第t层的第i个组成模块，假设网络中第t层的第i个组成模块的网络权重参数为

将其对应的输出特征图记为

将各个目标组成模块的能量占比记为

根据输入待剪枝神经网络的任务数量d对该能量占比

取平均值，即可得到第t层的第i个组成模块的输入信息保留度。具体的计算公式如下：

其中，

表示当输入任务图为x时，网络中第t层的第i个滤波器(网络权重参数为

)的输出特征图；

表示

的L2范数的平方；σ ²(O _t-1(x))表示(t-1)层所有输出特征图的方差。

可用于表征待剪枝神经网络中第t层中第i个滤波器的信息获取能力，具体计算过程为：

这里，计算得到的

越大，说明网络中第t层中第i个滤波器对输入任务的信息获取能力更强，对输入任务越重要。

本实施例通过待剪枝神经网络的输入任务对应的任务数量、待剪枝神经网络的输入任务对应的第一能量值和第二能量值确定组成模块的输入信息保留度，使得能够根据不同网络层级之间的信息流动来评估组成模块的输入信息保留度，以提高组成模块的输入信息保留度确定的准确性，进而提高当前组成模块的重要性指标值确定的准确性，提高剪枝准确性。

基于上述第一实施例，提出本申请剪枝模块的确定方法的第四实施例。参照图5，本实施例中，步骤S40可包括：

步骤S41：对所述任务关联度和所述输入信息保留度进行归一化处理；

步骤S42：将归一化后的所述任务关联度与归一化后的所述输入信息保留度的和值作为所述组成模块的重要性指标值；或者，

步骤S43：将归一化后的所述任务关联度与归一化后的所述输入信息保留度的乘积作为所述组成模块的重要性指标值。

由于待剪枝神经网络中各组成模块的重要性与各组成模块的任务关联度和输入信息保留度有关，因而可根据任务关联度和输入信息保留度确定各组成模块的重要性指标值，以对各组成模块的重要性进行评估。

例如，可对各组成模块的任务关联度和输入信息保留度求和，以求和所得的和值作为各组成模块的重要性指标值；或者，可将各组成模块的任务关联度和输入信息保留度的乘积作为各组成模块的重要性指标值；或者，在对各组成模块的任务关联度和输入信息保留度求和，并计算各组成模块的任务关联度和输入信息保留度的乘积后，可为所得到求和和值和乘积分配不同的权重值，以所分配的权重值对求和和值和乘积进行加权求和，以加权求和得到的加权和值作为各组成模块的重要性指标值等。

一实施例中，为了统一量级以减小异常数据干扰，可先对各组成模块的任务关联度和输入信息保留度进行归一化处理后，获取归一化处理后的任务关联度和输入信息保留度的和值或乘积作为各组成模块的重要性指标值。具体地，可先获取当前网络层级中所有组成模块的任务关联度中的最大任务关联度，以及当前网络层级中所有组成模块的输入信息保留度中的最大输入信息保留度；然后，可获取当前组成模块的任务关联度与最大任务关联度之间的商值，得到归一化处理后的任务关联度，并获取当前组成模块的输入信息保留度与最大输入信息保留度之间的商值，得到归一化处理后的输入信息保留度；进而，对归一化处理后的任务关联度和归一化处理后的输入信息保留度求和，即可得到相应组成模块的重要性指标值；或者，求取归一化处理后的任务关联度与归一化处理后的输入信息保留度的乘积，即可得到相应组成模块的重要性指标值。

本实施例通过对归一化的任务关联度和输入信息保留都求和或者求乘积以获取各组成模块的重要性指标值，使得可以基于任务驱动确定各组成模块的重要性指标值，以提高重要性指标值的准确性，进而提高待剪枝神经网络的剪枝准确性。

一具体的应用实例中，若所述组成模块为待剪枝神经网络中的滤波器，所述待剪枝神经网络的输入信息包括至少一张输入任务图，各组成模块的输出信息包括输出特征图，则可通过评估输入任务和输出特征图之间的联系(任务关联度)，以及测定相邻网络层级之间滤波器中的信息流动(输入信息保留度)来评估各个滤波器的重要性指标值，进而根据重要性指标值确定待剪枝神经网络中的剪枝模块。具体流程如下：

1、评估输入任务和特征图之间的联系(任务关联度)。

可将每个滤波器视作是和输入任务有关的语义提取器，将滤波器的输出特征图视作含有输入任务的语义信息的特征图，通过判定输出特征图中含有多少和输入任务有关的语义信息来评估输入任务和特征图之间的联系，从而确定输出该输出特征图的滤波器对输入任务的语义提取能力，以这种能力作为评价滤波器重要性程度的指标。

具体地：假设输入任务图为x，获取其灰度图G(x)。将输入任务图输入待剪枝神经网络中，假定待剪枝神经网络中第t层中第i个滤波器的网络权重参数为

可将对应的输出特征图记作

然后，通过双线性插值法将输出特征图的扩展为与输入任务图具有相同分辨率的图像，并基于设定阈值，通过以下公式(1)实现对G(x)和

的二值化操作：

其中，L(x)和

为分别对G(x)和

进行二值化操作后得到的结果；并且，设置不同值的阈值Δ，对最终所确定的重要性指标值并无影响。

假定待剪枝神经网络中第t层中第i个滤波器的重要性量化分数(任务保留占比)为

那么对所有的输入任务得到的

进行平均可以得到最终第t层中第i个滤波器的重要性量化分数(任务关联度)

对应于当前输出特征图对应的滤波器对输入任务的语义提取能力，可用于表征输入任务和输出特征图之间的联系，具体的计算过程如公式(2)所示：

其中，d表示输入任务中输入任务图的数量，也即任务数量，而

可通过计算输入任务和输出特征图之间的联系得到，具体的计算过程为求L(x)和

的交并比，即

这里，计算得到的

越大，说明网络中第t层中第i个滤波器提取输入任务的语义信息的能力越强，对输入任务越重要。

2、测定相邻层之间滤波器中的信息流动(输入信息保留度)

在待剪枝神经网络进行前向推理的过程中，输入任务中的信息流会从浅层到深层一层层地在相邻层之间流动。对于一个特定层的滤波器，其会输入前一层的输出特征图，并输出当前层的输出特征图，也就是说隔层之间的滤波器互相之间没有影响。因此，可将每一层的滤波器视作有限状态机，通过分析相邻层滤波器之间的信息获取量来测定相邻层之间的滤波器中的信息流动。

具体地，假定当输入任务图片x时，待剪枝神经网络中第t层中第i个滤波器的重要性量化分数(能量占比)为

那么对所有的输入任务得到的

进行平均可以得到最终第t层中第i个滤波器的重要性量化分数(输入信息保留度)

以表征剪枝神经网络中第t层中第i个滤波器的信息获取能力。具体计算过程如公式(3)所示：

其中，

表示当输入任务图片x时，网络中第t层中第i个滤波器(网络权重参数为

)的输出特征图；

表示

可以通过计算当输入任务图片x时，网络中第t层中第i个滤波器的信息获取能力得到，具体的计算过程为

这里，计算得到的

3、组合得到最终的基于任务驱动的重要性评估策略

可将以上得到的

和

进行组合，以计算各滤波器的重要性指标值，具体如公式(4)所示：

这里，max(A _t)和max(B _t)分别表示待剪枝神经网络的第t层中所有滤波器的

中的最大值，以及

(n _t是网络中第t层具有的滤波器个数)中的最大值。

为了验证本发明的性能，以至少四个典型的神经网络，如VGG-16，ResNet-56，ResNet-110，ResNet-50作为待剪枝神经网络，基于CIFAR-10和ImageNet(ILSVRC2012)两种测试数据集进行网络模型剪枝测试。实验结果表明，本申请提出的基于任务驱动的剪枝方案，相比于基于数据驱动的剪枝方案获得了更优异的网络剪枝性能，包括更高的压缩率、更少参数存储需求和更低的计算复杂度。

也即，以上重要性指标值的两种组合计算方案，均能取得良好效果，可根据具体情况选择使用。

4、联合训练框架

假定任务的损失函数为公式(5)中所示：

其中，f(x,W)是网络的输出，而l(.)是每一个输入训练例子x的损失函数计算式(可以是交叉熵损失或者其他具体的计算式)。y是与训练例子x对应的真实值(ground truth)。

剪枝的具体过程为：假设网络中第t层的剪枝率预先设定为r _t，我们在得到第t层中每一个滤波器重要性指标值

(n _t是网络中第t层具有的滤波器个数)之后，可通过r _t将第t层中重要性量化分数较小的滤波器去除而保留重要性量化分数较大的滤波器以实现剪枝。例如，若将第t层的稀疏度预先设定为r _t＝0.1，则第t层的滤波器中会有10％的滤波器保留，而其余90％的滤波器将会被剪枝去除。此时，可根据第t层每一个滤波器的重要性指标值Γ _t，将前10％个

值最大的滤波器保留，而将其余滤波器去除，来最终实现待剪枝神经网络中第t层的剪枝。

具体的训练框架如下：

1)输入：训练数据对(x,y)，预训练模型参数W＝{W _t,1≤t≤T}(T是待剪枝神经网络中的层数)，预先设定的网络剪枝率r＝{r _t,1≤t≤T}，学习率η，训练迭代次数j，训练停止条件∈。

2)输出：最终剪枝后的网络模型参数

通过上述公式(1)～(4)计算该待剪枝神经网络中基于任务驱动的重要性指标值Γ＝{Γ _t,1≤t≤T}；

3)令

4)通过Γ和r对待剪枝神经网络进行逐层剪枝；

5)当

时，

6)输出剪枝后网络模型参数

需要说明的是，步骤3为基于任务驱动的神经网络模型剪枝的过程；步骤4～5是重训练微调的过程，

表示的训练迭代次数为j次时得到的剪枝后模型参数

与训练迭代次数为(j-1)次时得到的剪枝后模型参数

之间差值的L2范数值。当

时，会持续对剪枝后网络模型参数进行迭代重训练微调。

此外，本申请实施例还提供一种剪枝模块的确定装置，所述剪枝模块的确定装置包括存储器、处理器及存储在所述处理器上并可在处理器上运行的剪枝模块的确定程序，所述处理器执行所述剪枝模块的确定程序时实现如上所述剪枝模块的确定方法的步骤。

此外，本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有剪枝模块的确定程序，所述剪枝模块的确定程序被处理器执行时实现如上所述的剪枝模块的确定方法的步骤。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，电视，或者网络设备等)执行本申请各个实施例所述的方法。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种剪枝模块的确定方法，其中，所述剪枝模块的确定方法包括以下步骤：

获取待剪枝神经网络的输入任务和任务数量，以及所述待剪枝神经网络的组成模块的输出信息；

根据所述输入任务、所述任务数量和所述输出信息确定所述组成模块的任务关联度；

根据所述任务数量和所述输出信息确定所述组成模块的输入信息保留度；

根据所述任务关联度和所述输入信息保留度确定所述组成模块的重要性指标值；

根据所述重要性指标值确定所述待剪枝神经网络中的剪枝模块。
如权利要求1所述的剪枝模块的确定方法，其中，所述根据所述输入任务、所述任务数量和所述输出信息确定所述组成模块的任务关联度的步骤包括：

获取当前网络层级中所述组成模块的目标序号；

确定当前网络层级中序号小于或等于所述目标序号的目标组成模块；

根据各个所述目标组成模块的输出信息与所述输入任务确定各个所述目标组成模块的输入任务保留度和输入输出信息总和；

根据所述任务数量、所述输入任务保留度和所述输入输出信息总和确定所述组成模块的任务关联度。
如权利要求2所述的剪枝模块的确定方法，其中，所述输入任务包括至少一张输入任务图，所述输出信息包括输出特征图，所述根据各个所述目标组成模块的输出信息与所述输入任务确定各个所述目标组成模块的输入任务保留度和输入输出信息总和的步骤包括：

对各个所述目标组成模块的输出特征图的分辨率进行调节，以使所述输出特征图的分辨率与所述输入任务图的分辨率一致；

对所述输入任务图和调节后的所述输出特征图进行二值化处理；

对处理后的所述输入任务图和处理后的所述输出特征图取交集，得到各个所述目标组成模块的输入任务保留度；

对处理后的所述输入任务图和处理后的所述输出特征图的取并集，得到各个所述目标组成模块的输入输出信息总和。
如权利要求2所述的剪枝模块的确定方法，其中，所述根据所述任务数量、所述输入任务保留度和所述输入输出信息总和确定所述组成模块的任务关联度的步骤包括：

获取所述输入任务保留度和所述输入输出信息总和的比值，得到各个所述目标组成模块的任务保留占比；

对各个所述任务保留占比求和，得到任务保留占比和值；

将所述任务保留占比和值与所述任务数量的商值确定为所述组成模块的任务关联度。
如权利要求1所述的剪枝模块的确定方法，其中，所述根据所述任务数量和所述输出信息确定所述组成模块的输入信息保留度的步骤包括：

获取所述组成模块在当前网络层级中的目标序号，以及所述输入任务包含的图像数量；

确定当前网络层级中序号小于或等于所述目标序号的目标组成模块；

根据各个所述目标组成模块的输出信息确定当前网络层级中各个所述目标组成模块的第一能量值，根据前一网络层级中各个组成模块的输出信息确定前一网络层级中的组成模块的第二能量值；

根据所述任务数量、所述第一能量值和所述第二能量值确定所述组成模块的输入信息保留度。
如权利要求5所述的剪枝模块的确定方法，其中，所述根据各个所述目标组成模块的输出信息确定当前网络层级中各个所述目标组成模块的第一能量值，根据前一网络层级中各个组成模块的输出信息确定前一网络层级中的组成模块的第二能量值的步骤包括：

求取各个所述目标组成模块的输出信息的范数，将所述范数的平方作为各个所述目标组成模块的第一能量值；

求取前一网络层级中的各个组成模块的输出信息的方差，得到所述第二能量值。
如权利要求5所述的剪枝模块的确定方法，其中，所述根据所述任务数量、所述第一能量值和所述第二能量值确定所述组成模块的输入信息保留度的步骤包括：

获取各个所述第一能量值与所述第二能量值之间的比值，得到各个所述目标组成模块对应的能量占比；

对各个所述能量占比进行求和，得到能量占比和值；

将所述能量占比和值与所述任务数量的商值确定为所述组成模块的输入信息保留度。
如权利要求1所述的剪枝模块的确定方法，其中，所述根据所述任务关联度和所述输入信息保留度确定所述组成模块的重要性指标值的步骤包括：

对所述任务关联度和所述输入信息保留度进行归一化处理；

将归一化后的所述任务关联度与归一化后的所述输入信息保留度的和值作为所述组成模块的重要性指标值；

或者，将归一化后的所述任务关联度与归一化后的所述输入信息保留度的乘积作为所述组成模块的重要性指标值。
一种剪枝模块的确定装置，其中，所述剪枝模块的确定装置包括存储器、处理器及存储在存储器上并可在处理器上运行网络模型的剪枝程序，所述处理器执行所述网络模型的剪枝程序时实现权利要求1-8中任一项所述的网络模型的剪枝方法的步骤。
一种计算机可读存储介质，其中，所述计算机可读存储介质上存储有网络模型的剪枝程序，所述网络模型的剪枝程序被处理器执行时实现如权利要求1-8中任一项所述的网络模型的剪枝方法的步骤。