CN112241787A

CN112241787A - 神经网络模型剪枝方法及装置

Info

Publication number: CN112241787A
Application number: CN201910651248.7A
Authority: CN
Inventors: 陶雄强; 韩璐
Original assignee: Potevio Information Technology Co Ltd
Current assignee: Potevio Information Technology Co Ltd
Priority date: 2019-07-18
Filing date: 2019-07-18
Publication date: 2021-01-19

Abstract

本发明提出神经网络模型剪枝方法及装置。包括：对于已经训练好的用于特征提取的神经网络模型A₀，计算A₀中每一分枝对最终提取特征的贡献度；将贡献度最小的分枝从A₀中剪除，得到神经网络模型A₀’，对A₀’重新进行训练，训练完毕，判断当前是否满足剪枝迭代终止条件，若是，将已经训练好的神经网络模型A₀’作为最终采用的神经网络模型；否则，令A₀’＝A₀，返回所述计算A₀中每一分枝对最终提取特征的贡献度的动作。由于每次剪除的都是当前模型中对最终提取特征的贡献度最小的分枝，从而在满足神经网络模型剪枝要求的前提下，减少了神经网络模型精度损失。

Description

神经网络模型剪枝方法及装置

技术领域

本发明涉及深度学习技术领域，尤其涉及神经网络模型剪枝方法及装置。

背景技术

随着深度学习神经网络结构的不断发展，深度卷积神经网络在解决目标检测、跟踪与识别等计算机视觉领域问题中取得了巨大的成功。然而，随着深度神经网络性能的不断提升，模型的参数量和计算量越来越大、需要消耗的计算资源较多，严重制约模型的推理速度。

在自动驾驶汽车、智能机器人、智能手机等计算资源受限的智能设备上，资源需求高的神经网络模型无法满足实时性要求。采用神经网络模型训练时，为了追求更高的模型性能，选取的网络结构复杂度往往大于问题所需，导致训练好的网络模型具有一定的冗余性；同时，对网络提取的特征维度同样选取较高，造成模型实际应用推理过程中特征比对的计算复杂度提升。因此，在保持模型精度的前提下，对深度神经网络模型进行压缩和加速推理，受到越来越多的关注。

训练好的神经网络模型本身具有一定的稀疏度，即模型的权重存在一定的零值或接近于零的非零值。所以将这些数值较小的参数去除掉，可以达到压缩模型的效果，从而加速推理过程。现有技术中，针对神经网络模型压缩和加速推理问题，主要对模型进行直接剪枝量化处理，该方法虽然处理简单，但难以兼顾精度与效率的平衡；其次是采用知识蒸馏的方法提炼小网络，此类方法在保持原有模型精度不变情况下，不一定能成功蒸馏出小网络；对于网络所提取的高维度特征，通常采用降维的方式，该方式能够降低特征比对计算复杂度，但同样会造成精度的损失。

发明内容

本发明实施例提出神经网络模型剪枝方法及装置，以在满足神经网络模型剪枝要求的前提下，减少神经网络模型精度损失。

本发明实施例的技术方案是这样实现的：

一种神经网络模型剪枝方法，该方法包括：

对于已经训练好的用于特征提取的神经网络模型A₀，计算A₀中每一分枝对最终提取特征的贡献度；

将贡献度最小的分枝从A₀中剪除，得到神经网络模型A₀’，对A₀’重新进行训练，训练完毕，判断当前是否满足剪枝迭代终止条件，若是，将已经训练好的神经网络模型A₀’作为最终采用的神经网络模型；否则，令A₀’＝A₀，返回所述计算A₀中每一分枝对最终提取特征的贡献度的动作。

所述计算A₀中每一分枝对最终提取特征的贡献度包括：

对于已经训练好的神经网络模型A₀，根据该神经网络模型的分枝权重集合W₀，计算W₀的损失函数值L(W₀)；

对于A₀中的每一分枝i，假设将该分枝i从该神经网络模型A₀中剪除，根据剩余的分枝的权重集合W_i，计算W_i的损失函数值L(W_i)；

计算

其中，MI(W_i)为分枝i的权重与神经网络模型A₀中其它所有分枝的权重的互信息的累和，i表示神经网络模型A₀中分枝的序号，1≤i≤N，N为神经网络模型A₀中分枝的总数。

所述剪枝迭代终止条件为：剪枝次数大于预设次数，或者神经网络模型A₀’的精度小于预设精度阈值。

所述将已经训练好的神经网络模型A₀’作为最终采用的神经网络模型之后进一步包括：

采用最终采用的神经网络模型A₀’对预设的测试样本进行特征提取，得到N维特征向量集合F；

计算F中的每一维特征向量的模型精度贡献度，将模型精度贡献度最小的预设M维特征向量从F中去除，得到N-M维最优特征向量集合F’。

所述计算F中的每一维特征向量的模型精度贡献度包括：

分别计算F与预设模板库中的每个模板的特征向量集合的距离，在得到的所有距离中，统计小于预设第一阈值的距离的数目N_0T和不小于预设第一阈值的距离的数目N_0F，根据N_0T和N_0F计算F的神经网络模型精度

对于N维特征向量集合F中的任一维特征向量f_k，假设将该维特征向量f_k从F中去除，剩余特征向量组成的特征向量集合为F_k，k为F中的特征向量的维序号，1≤k≤K，K为F的总维数；

分别计算F_k与预设模板库中的每个模板的特征向量集合的距离，在得到的所有距离中，统计小于预设第二阈值的距离的数目N_kT和不小于预设第二阈值的距离的数目N_kF，根据N_kT和N_kF计算F_k的神经网络模型精度

计算特征向量f_k的模型精度贡献度ΔACC(f_k)＝|ACC(F)-ACC(F_k)|。

所述将模型精度贡献度最小的预设M维特征向量从F中去除之后进一步包括：

记录该M维非最优特征向量的维序号；

且，所述方法进一步包括：

当要将一实际样本x与预设模板库中的模板进行匹配时，先采用最终采用的神经网络模型A₀’对该实际样本进行特征提取，得到N维特征向量集合F_x；

根据记录的M维非最优特征向量的维序号，将该M维非最优特征向量从F_x中去除，得到最优特征向量集合F_x’；

分别计算F_x’与预设模板库中各模板的特征向量集合的距离，在其中选择小于预设第三阈值的距离对应的模板，将所选择的模板放入粗选模板库中；

分别计算F_x与粗选模板库中各模板的特征向量集合的距离，在其中选择小于预设第四阈值的距离对应的模板，将所选择的模板作为与实际样本x匹配的模板。

一种神经网络模型剪枝装置，该装置包括：

分枝贡献度计算模块，对于已经训练好的用于特征提取的神经网络模型A₀，计算A₀中每一分枝对最终提取特征的贡献度；

修剪模块，根据分枝贡献度计算模块计算得到的A₀中每一分枝对最终提取特征的贡献度，将贡献度最小的分枝从A₀中剪除，得到神经网络模型A₀’，对A₀’重新进行训练，训练完毕，判断当前是否满足剪枝迭代终止条件，若是，将已经训练好的神经网络模型A₀’作为最终采用的神经网络模型；否则，令A₀’＝A₀，通知分枝贡献度计算模块计算A₀中每一分枝对最终提取特征的贡献度。

所述分枝贡献度计算模块计算A₀中每一分枝对最终提取特征的贡献度包括：

计算

所述装置进一步包括：最优特征向量集合确定模块，用于：

采用修剪模块最终采用的神经网络模型A₀’对预设的测试样本进行特征提取，得到N维特征向量集合F；

所述最优特征向量集合确定模块将模型精度贡献度最小的预设M维特征向量从F中去除之后进一步用于：记录该M个非最优特征向量的维序号；

且，所述最优特征向量集合确定模块进一步用于：

当要将一实际样本x与预设模板库中的模板进行匹配时，先采用修剪模块最终采用的神经网络模型A₀’对该实际样本进行特征提取，得到N维特征向量集合F_x；

根据记录的M个非最优特征向量的维序号，将该M个非最优特征向量从F_x中去除，得到最优特征向量集合F_x’；

本发明实施例对已经训练好的神经网络模型，根据每一分枝对最终提取特征的贡献度，将贡献度最小的分枝剪除，然后对剪枝后的神经网络模型重新进行训练，再对训练后得到的新神经网络模型，根据每一分枝对最终提取特征的贡献度，再将贡献度最小的分枝剪除，依此迭代，直至满足剪枝迭代终止条件，由于每次剪除的都是当前模型中对最终提取特征的贡献度最小的分枝，从而在满足神经网络模型剪枝要求的前提下，减少了神经网络模型精度损失。

附图说明

图1为本发明一实施例提供的神经网络模型剪枝方法流程图；

图2为本发明一实施例提供的采用神经网络模型进行模板匹配的方法流程图；

图3为本发明另一实施例提供的神经网络模型剪枝方法流程图；

图4为本发明另一实施例提供的采用神经网络模型进行模板匹配的方法流程图；

图5为本发明实施例提供的神经网络模型剪枝装置的结构示意图。

具体实施方式

下面结合附图及具体实施例对本发明再作进一步详细的说明。

图1为本发明一实施例提供的神经网络模型剪枝方法流程图，其具体步骤如下：

步骤101：对于已经训练好的用于特征提取的神经网络模型A₀，计算A₀中每一分枝对最终提取特征的贡献度。

步骤102：将贡献度最小的分枝从A₀中剪除，得到神经网络模型A₀’，对A₀’重新进行训练，训练完毕，判断当前是否满足剪枝迭代终止条件，若是，将已经训练好的神经网络模型A₀’作为最终采用的神经网络模型；否则，令A₀’＝A₀，返回步骤101。

在实际应用中，步骤101具体包括：

计算

其中，“|...|”为绝对值运算符，MI(W_i)为分枝i的权重与神经网络模型A₀中其它所有分枝的权重的互信息的累和，i表示神经网络模型A₀中分枝的序号，1≤i≤N，N为神经网络模型A₀中分枝的总数。

在实际应用中，步骤102中的剪枝迭代终止条件满足如下条件之一：剪枝次数大于预设次数，或者神经网络模型A₀’的精度小于预设精度阈值。

图2为本发明一实施例提供的采用神经网络模型进行模板匹配的方法流程图，其具体步骤如下：

步骤201：采用步骤102中的最终采用的神经网络模型A₀’对预设的测试样本进行特征提取，得到N维特征向量集合F。

步骤202：计算F中的每一维特征向量的模型精度贡献度，将模型精度贡献度最小的预设M维特征向量从F中去除，得到N-M维最优特征向量集合F’，记录该M维非最优特征向量的维序号。

在实际应用中，计算F中的每一维特征向量的模型精度贡献度包括：

分别计算F_k与模板库中的每个模板的特征向量集合的距离，在得到的所有距离中，统计小于预设第二阈值的距离的数目N_kT和不小于预设第二阈值的距离的数目N_kF，根据N_kT和N_kF计算F_k的神经网络模型精度

计算特征向量f_k的模型精度贡献度ΔACC(f_k)＝|ACC(F)-ACC(F_k)|，其中，“|...|”为绝对值运算符。

步骤203：当要将一实际样本x与预设模板库中的模板进行匹配时，先采用步骤102中的最终采用的神经网络模型A₀’对该实际样本进行特征提取，得到N维特征向量集合F_x。

步骤204：根据记录的M维非最优特征向量的维序号，将该M维非最优特征向量从F_x中去除，得到最优特征向量集合F_x’。

步骤205：分别计算F_x’与预设模板库中各模板的特征向量集合的距离，在其中选择小于预设第三阈值的距离对应的模板，将所选择的模板放入粗选模板库中。

步骤206：分别计算F_x与粗选模板库中各模板的特征向量集合的距离，在其中选择小于预设第四阈值的距离对应的模板，将所选择的模板作为与实际样本x匹配的模板。

图3为本发明另一实施例提供的神经网络模型剪枝方法流程图，其具体步骤如下：

步骤301：采用预设的多个训练样本对用于特征提取的神经网络模型进行训练。

这里，预设的多个训练样本是一组具有同类特征的样本，例如：人脸样本。

步骤302：对于已经训练好的神经网络模型A₀，根据该神经网络模型的分枝权重集合W₀，计算W₀的损失函数值L(W₀)。

损失函数的计算为成熟技术，在此不再赘述。

步骤303：对神经网络模型A₀中的任一分枝i，假设将该分枝i从该神经网络模型A₀中剪除，根据剩余的分枝的权重集合W_i，计算W_i的损失函数值L(W_i)。

i表示神经网络模型A₀中分枝的序号，1≤i≤N，N为神经网络模型A₀中分枝的总数。

步骤304：当对神经网络模型A₀中的所有分枝都执行完步骤303时，对于每一分枝i，根据L(W_i)和L(W₀)，计算该分枝i对最终提取特征的贡献度d(i)。

其中，MI(w_i)为分枝i的权重与神经网络模型A₀中其它所有分枝的权重的互信息的累和。MI(w_i)的计算为成熟技术，在此不再赘述。

步骤305：当计算完所有分枝的贡献度时，选择贡献度最小的分枝，确定将该分枝从从神经网络模型A₀中剪除，得到神经网络模型A₀’。

步骤306：采用预设的多个训练样本对神经网络模型A₀’进行训练。

本步骤中采用的训练样本与步骤301相同。

步骤307：训练完毕，判断当前是否满足剪枝迭代终止条件，若是，执行步骤309；否则，执行步骤308。

剪枝迭代终止条件例如：剪枝次数大于预设次数，或者神经网络模型A₀’的精度小于预设精度阈值。

步骤308：令A₀’＝A₀，返回步骤302。

令A₀’＝A₀的含义是以神经网络模型A₀’替代神经网络模型A₀，然后返回步骤302。

步骤309：将当前神经网络模型A₀’作为最终采用的神经网络模型。

对于部分实际应用领域，需要使用神经网络模型对实际样本进行特征提取，将提取的实际样本的特征与预设的模板库中的各个模板的特征进行对比，以确定实际样本到底与模板库中的哪个模板匹配。例如：人脸识别领域中，当训练好用于人脸特征提取的神经网络模型后，就可使用该模型提取实际人脸的特征，然后将提取的实际人脸的特征与预设的人脸模板库中的各个人脸的特征进行匹配，以确定实际人脸到底是人脸模板库中的哪个人脸，从而确定人脸的身份。

图4为本发明另一实施例提供的采用神经网络模型进行模板匹配的方法流程图，其具体步骤如下：

步骤401：采用步骤309中的最终采用的神经网络模型A₀’对预设的一个测试样本进行特征提取，得到N维特征向量集合F。

若神经网络模型A₀’是用于人脸特征提取的，则这里的预设测试样本就是人脸样本。

步骤402：分别计算F与预设模板库中的每个模板的特征向量集合的距离，在得到的所有距离中，统计小于预设第一阈值的距离的数目N_0T和不小于预设第一阈值的距离的数目N_0F，根据N_0T和N_0F计算F的神经网络模型精度

模板库中的每个模板的特征向量集合是已知的，是已经计算好的。

步骤403：对于N维特征向量集合F中的任一维特征向量f_k，假设将该维特征向量f_k从F中去除，剩余特征向量组成的特征向量集合为F_k。

其中，k为F中的特征向量的维序号，1≤k≤K，K为F的总维数，即为F中包含的特征向量的总数。

步骤404：分别计算F_k与预设模板库中的每个模板的特征向量集合的距离，在得到的所有距离中，统计小于预设第二阈值的距离的数目N_kT和不小于预设第二阈值的距离的数目N_kF，根据N_kT和N_kF计算F_k的神经网络模型精度

由于只有维数相同的特征向量集合之间才能进行距离计算，而F_k的维数为K-1，模板库中的每个模板的特征向量集合的维数为K，因此，在计算F_k与模板库中的每个模板的特征向量集合的距离时，对于每个模板的特征向量集合也需要先将第k维的特征向量去除。

步骤405：计算特征向量f_k的模型精度贡献度ΔACC(f_k)＝|ACC(F)-ACC(F_k)|。

步骤406：当对F中的每一维特征向量都执行完步骤403～405时，在计算得到的所有ΔACC(f_k)(1≤k≤K)中，选择值最小的M个ΔACC(f_k)，将该M个ΔACC(f_k)对应的特征向量作为非最优特征向量，记录该M维非最优特征向量的维序号，将该M维非最优特征向量从F中去除，得到最优特征向量集合F’。

M的取值为预先根据匹配计算量、匹配速度等需求设定的，1≤M≤K。

例如：若ΔACC(f_s)为值最小的M个ΔACC(f_k)中的一个，则将第s维特征向量从F中去除。

步骤407：当要将一实际样本x与预设模板库中的模板进行匹配时，先采用步骤309中的最终采用的神经网络模型A₀’对该实际样本进行特征提取，得到N维特征向量集合F_x。

步骤408：根据步骤406记录的M维非最优特征向量的维序号，将该M维非最优特征向量从F_x中去除，得到最优特征向量集合F_x’。

步骤409：分别计算F_x’与预设模板库中各模板的特征向量集合的距离，在其中选择小于预设第三阈值的距离对应的模板，将所选择的模板放入粗选模板库中。

同样地，由于只有维数相同的特征向量集合之间才能进行距离计算，而F_x’的维数为K-M，模板库中的每个模板的特征向量集合的维数为K，因此，在计算F_x’与模板库中的每个模板的特征向量集合的距离时，对于每个模板也需要先根据步骤406记录的M维非最优特征向量的维序号，将该M维非最优特征向量从该模板的原始特征向量集合中去除，得到最优特征向量集合，然后再计算F_x’与模板库中的每个模板的最优特征向量集合的距离。

步骤410：分别计算F_x与粗选模板库中各模板的特征向量集合的距离，在其中选择小于预设第四阈值的距离对应的模板，将所选择的模板作为与实际样本x匹配的模板。

图5为本发明实施例提供的神经网络模型剪枝装置的结构示意图，该装置主要包括：分枝贡献度计算模块51和修剪模块52，其中：

分枝贡献度计算模块51，对于已经训练好的用于特征提取的神经网络模型A₀，计算A₀中每一分枝对最终提取特征的贡献度。

修剪模块52，根据分枝贡献度计算模块51计算得到的A₀中每一分枝对最终提取特征的贡献度，将贡献度最小的分枝从A₀中剪除，得到神经网络模型A₀’，对A₀’重新进行训练，训练完毕，判断当前是否满足剪枝迭代终止条件，若是，将已经训练好的神经网络模型A₀’作为最终采用的神经网络模型；否则，令A₀’＝A₀，通知分枝贡献度计算模块51计算A₀中每一分枝对最终提取特征的贡献度。

在实际应用中，分枝贡献度计算模块51计算A₀中每一分枝对最终提取特征的贡献度包括：

计算

在实际应用中，上述装置进一步包括：最优特征向量集合确定模块，用于：

在实际应用中，最优特征向量集合确定模块计算F中的每一维特征向量的模型精度贡献度包括：

计算特征向量f_k的模型精度贡献度ΔACC(f_k)＝|ACC(F)-ACC(F_k)|。

在实际应用中，最优特征向量集合确定模块将模型精度贡献度最小的预设M维特征向量从F中去除之后进一步用于：记录该M个非最优特征向量的维序号；

且，最优特征向量集合确定模块进一步用于：

本发明实施例的有益技术效果如下：

对已经训练好的神经网络模型，根据每一分枝对最终提取特征的贡献度，将贡献度最小的分枝剪除，然后对剪枝后的神经网络模型重新进行训练，再对训练后得到的新神经网络模型，根据每一分枝对最终提取特征的贡献度，再将贡献度最小的分枝剪除，依此迭代，直至满足剪枝迭代终止条件，由于每次剪除的都是当前模型中对最终提取特征的贡献度最小的分枝，从而在满足神经网络模型剪枝要求的前提下，减少了神经网络模型精度损失；

另外，根据神经网络模型提取的特征向量集合中每一维特征向量的模型精度贡献度，将贡献度最小的M维特征向量从集合中去除，得到最优特征向量集合，在进行模板匹配时，先采用最优特征向量集合进行粗检索，然后采用全特征向量集合进行细检索，从而在提高匹配速度的同时，保证匹配精度。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。