WO2019091401A1

WO2019091401A1 - 深度神经网络的网络模型压缩方法、装置及计算机设备

Info

Publication number: WO2019091401A1
Application number: PCT/CN2018/114357
Authority: WO
Inventors: 张渊; 陈伟杰; 谢迪; 浦世亮
Original assignee: 杭州海康威视数字技术股份有限公司
Priority date: 2017-11-08
Filing date: 2018-11-07
Publication date: 2019-05-16
Also published as: CN109754077B; CN109754077A

Abstract

一种深度神经网络的网络模型压缩方法、装置及计算机设备，其中，深度神经网络的网络模型压缩方法包括：获取原始深度神经网络（S101）；通过对原始深度神经网络的网络层中各运算单元的重要度进行分析，确定该网络层中重要度低于预设重要度的运算单元作为待删除运算单元（S102）；删除原始深度神经网络中各网络层的待删除运算单元，得到网络模型压缩后的深度神经网络（S103）。通过该方法可以提高目标识别与目标检测的效率。

Description

深度神经网络的网络模型压缩方法、装置及计算机设备

本申请要求于2017年11月08日提交中国专利局、申请号为201711092273.3发明名称为“深度神经网络的网络模型压缩方法、装置及计算机设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及数据处理技术领域，特别是涉及一种深度神经网络的网络模型压缩方法、装置及计算机设备。

背景技术

DNN(Deep Neural Network，深度神经网络)作为机器学习研究中的一个新兴领域，通过模仿人脑的机制来解析数据，是一种通过建立和模拟人脑进行分析学习的智能模型，当前较为流行的DNN包括：CNN(Convolutional Neural Network，卷积神经网络)、RNN(Recurrent Neural Network，循环神经网络)、LSTM(Long Short Term Memory，长短期记忆网络)等。由于DNN可以通过网络模型中多个网络层的运算，快速、准确地对目标进行识别与检测，已在目标检测与分割、行为检测与识别、语音识别等方面得到了广泛的应用。

随着目标识别与目标检测技术的发展，目标特征越来越复杂，需要提取的目标特征也越来越多，这样，使得在DNN网络模型的设计中，网络层以及各网络层中运算单元的数量都在大幅增加，导致目标识别与目标检测的运算复杂度增大，并且大量的网络层和运算单元会消耗过多的内存与带宽资源，影响目标识别与目标检测的效率。

发明内容

本申请实施例的目的在于提供一种深度神经网络的网络模型压缩方法、装置及计算机设备，以提高目标识别与目标检测的效率。具体技术方案如下：

第一方面，本申请实施例提供了一种深度神经网络的网络模型压缩方法，所述方法包括：

获取原始深度神经网络；

通过对所述原始深度神经网络的网络层中各运算单元的重要度进行分析，确定所述网络层中重要度低于预设重要度的运算单元作为待删除运算单元；

删除所述原始深度神经网络中各网络层的待删除运算单元，得到网络模型压缩后的深度神经网络。

可选的，所述通过对所述原始深度神经网络的网络层中各运算单元的重要度进行分析，确定所述网络层中重要度低于预设重要度的运算单元作为待删除运算单元，包括：

提取所述原始深度神经网络的网络层中各运算单元的权值绝对值；

根据所述网络层中各运算单元的权值绝对值，配置各运算单元的重要度，其中，各运输单元的权值绝对值与配置的重要度成正比关系；

基于各运算单元的重要度，确定重要度低于预设重要度的运算单元作为待删除运算单元。

可选的，在所述通过对所述原始深度神经网络的网络层中各运算单元的重要度进行分析，确定所述网络层中重要度低于预设重要度的运算单元作为待删除运算单元之前，所述方法还包括：

利用秩分析工具，对所述原始深度神经网络的网络层进行分析，得到满足预设误差容忍度的条件下，所述网络层中待删除运算单元的第一数目；

所述通过对所述原始深度神经网络的网络层中各运算单元的重要度进行分析，确定所述网络层中重要度低于预设重要度的运算单元作为待删除运算单元，包括：

通过对所述原始深度神经网络的网络层中各运算单元的重要度进行分析，得到所述网络层中各运算单元的重要度；

按照所述网络层中各运算单元的重要度从小到大的顺序选择所述第一数目个运算单元，并将所选择的运算单元作为待删除运算单元。

可选的，在所述删除所述原始深度神经网络中各网络层的待删除运算单元，得到网络模型压缩后的深度神经网络之后，所述方法还包括：

获取利用所述网络模型压缩后的深度神经网络进行运算的输出结果；

如果所述输出结果无法满足预设效果，则利用所述原始深度神经网络的输出结果与所述网络模型压缩后的深度神经网络的输出结果之间的差异，通过预设算法，对所述网络模型压缩后的深度神经网络中各网络层的运算单元中的权值进行调整，直至所述输出结果满足所述预设效果。

获取所述网络模型压缩后的深度神经网络中任一网络层的各运算单元之间的相关度；

判断所述相关度是否小于预设相关度；

若否，则采用预设正则化项，对该网络层的各运算单元中的权值进行调整，直至所述相关度小于所述预设相关度时，停止调整各运算单元中的权值。

第二方面，本申请实施例提供了一种深度神经网络的网络模型压缩装置，所述装置包括：

第一获取模块，用于获取原始深度神经网络；

第一确定模块，用于通过对所述原始深度神经网络的网络层中各运算单元的重要度进行分析，确定所述网络层中重要度低于预设重要度的运算单元作为待删除运算单元；

删除模块，用于删除所述原始深度神经网络中各网络层的待删除运算单元，得到网络模型压缩后的深度神经网络。

可选的，所述第一确定模块，具体用于：

可选的，所述装置还包括：

分析模块，用于利用秩分析工具，对所述原始深度神经网络的网络层进行分析，得到满足预设误差容忍度的条件下，所述网络层中待删除运算单元的第一数目；

所述第一确定模块，具体用于：

可选的，所述装置还包括：

第二获取模块，用于获取利用所述网络模型压缩后的深度神经网络进行运算的输出结果；

第一调整模块，用于如果所述输出结果无法满足预设效果，则利用所述原始深度神经网络的输出结果与所述网络模型压缩后的深度神经网络的输出结果之间的差异，通过预设算法，对所述网络模型压缩后的深度神经网络中各网络层的运算单元中的权值进行调整，直至所述输出结果满足所述预设效果。

可选的，所述装置还包括：

第三获取模块，用于获取所述网络模型压缩后的深度神经网络中任一网络层的各运算单元之间的相关度；

判断模块，用于判断所述相关度是否小于预设相关度；

第二调整模块，用于若所述判断模块的判断结果为否，则采用预设正则化项，对该网络层的各运算单元中的权值进行调整，直至所述相关度小于所述预设相关度时，停止调整各运算单元中的权值。

第三方面，本申请实施例提供了一种计算机可读存储介质，用于存储可执行代码，所述可执行代码用于在运行时执行：本申请实施例第一方面所提供的深度神经网络的网络模型压缩方法。

第四方面，本申请实施例提供了一种应用程序，用于在运行时执行：本申请实施例第一方面所提供的深度神经网络的网络模型压缩方法。

第五方面，本申请实施例提供了一种计算机设备，包括处理器和计算机可读存储介质，其中，

所述计算机可读存储介质，用于存放可执行代码；

所述处理器，用于执行所述计算机可读存储介质上所存放的可执行代码时，实现本申请实施例第一方面所提供的深度神经网络的网络模型压缩方法的步骤。

综上可见，本申请实施例提供的方案中，通过对获取到的原始深度神经网络的网络层中各运算单元的重要度进行分析，确定该网络层中重要度低于预设重要度的运算单元作为待删除运算单元，进而得到原始深度神经网络中各网络层的待删除运算单元，删除原始深度神经网络中各网络层的待删除运算单元，即可以得到网络模型压缩后的深度神经网络。由于待删除运算单元的重要度低于预设重要度，即对目标识别与目标检测的结果影响相对较小，因此，删除待删除运算单元，并不会影响到对目标的识别与检测，这样，通过删除各网络层的待删除运算单元，实现压缩深度神经网络的网络模型，达到降低目标识别与目标检测的运算复杂度、减小内存与带宽资源消耗的目的，从而提高目标识别与目标检测的效率。

附图说明

为了更清楚地说明本申请实施例和现有技术的技术方案，下面对实施例和现有技术中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请一实施例的深度神经网络的网络模型压缩方法的流程示意图；

图2为本申请另一实施例的深度神经网络的网络模型压缩方法的流程示意图；

图3为本申请又一实施例的深度神经网络的网络模型压缩方法的流程示意图；

图4为本申请再一实施例的深度神经网络的网络模型压缩方法的流程示意图；

图5为本申请一实施例的深度神经网络的网络模型压缩装置的结构示意图；

图6为本申请另一实施例的深度神经网络的网络模型压缩装置的结构示意图；

图7为本申请又一实施例的深度神经网络的网络模型压缩装置的结构示意图；

图8为本申请再一实施例的深度神经网络的网络模型压缩装置的结构示意图；

图9为本申请实施例的计算机设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案、及优点更加清楚明白，以下参照附图并举实施例，对本申请进一步详细说明。显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

下面通过具体实施例，对本申请进行详细的说明。

为了提高目标检测的效率，本申请实施例提供了一种深度神经网络的网络模型压缩方法、装置及计算机设备。

下面，首先对本申请实施例所提供的深度神经网络的网络模型压缩方法进行介绍。

本申请实施例所提供的深度神经网络的网络模型压缩方法的执行主体可以为实现图像分类、语音识别、目标检测等功能的计算机设备，也可以为具有图像分类、目标检测等功能的摄像机，还可以为具有语音识别功能的麦克风，执行主体中至少包括具有数据处理能力的核心处理芯片。实现本申请实施例所提供的深度神经网络的网络模型压缩方法的方式可以为设置于执行主体中的软件、硬件电路和逻辑电路中的至少一种方式。

如图1所示，为本申请实施例所提供的一种深度神经网络的网络模型压缩方法，该深度神经网络的网络模型压缩方法可以包括如下步骤：

S101，获取原始深度神经网络。

原始深度神经网络为实现图像分类、语音识别、目标检测等目标识别与目标检测功能的深度神经网络，是按照需要识别与检测的目标特征所设计的深度神经网络。通过获取原始深度神经网络，可以得到原始深度神经网络的网络模型，即该原始深度神经网络的网络层、各网络层的运算单元以及各网络层的网络参数，这里的网络参数包括该网络层中包含的运算单元的数量以及各运算单元中的具体数值。

由于在当前目标识别与目标检测技术中，目标特征复杂，需要提取的目标特征繁多，这样，使得原始深度神经网络中网络模型的结构复杂，网络层及各网络层中运算单元的数量庞大，且大量的网络层和运算单元会消耗过多的内存与带宽资源，导致目标识别与目标检测的运算复杂度较大，因此，在本实施例中，需要对原始深度神经网络进行分析，通过对网络模型进行压缩，达到降低运算复杂度的目的，进而提高目标识别与目标检测的效率。

S102，通过对原始深度神经网络的网络层中各运算单元的重要度进行分析，确定该网络层中重要度低于预设重要度的运算单元作为待删除运算单元。

原始深度神经网络的网络层中各运算单元可以用于提取不同的目标特征，例如在进行人脸识别的深度神经网络中，一个网络层中包含有用于提取眼睛特征的运算单元、用于提取鼻子特征的运算单元、用于提取耳朵特征的运算单元、用于提取脸部轮廓的运算单元等等，实际在进行特征提取的过程中，有些特征对于目标识别与目标检测的结果影响较大，而有些特征对于目标识别与目标检测的结果基本无影响，例如，在用于人脸识别的深度神经网络中，眼睛特征、鼻子特征、耳朵特征等对于结果影响较大，如果不提取这些特征，无法正确检测和识别人脸；而头发颜色、是否佩戴眼镜、是否佩戴耳环等特征对于结果的影响相对较小，如果不提取这些特征，并不会影响检测和识别人脸的结果。

对原始深度神经网络的网络层中各运算单元的重要度进行分析，可以是通过对各运算单元对于目标识别与目标检测结果的影响程度进行分析实现的，运算单元对于目标识别与目标检测结果的影响程度越强，则说明运算单元的重要度越高，其中，影响程度可以是表征重要度的属性参数，如各运算单元的权值，样本训练的过程中，深度神经网络各运算单元的权值会不断被调整，以人脸识别为例，经过样本训练后，用于提取眼睛、鼻子、耳朵等特征的运算单元的权值绝对值大于用于提取发色、眼镜、耳环等特征的运算单元的权值绝对值，则说明提取眼睛、鼻子、耳朵等特征的运算单元对于人脸识别结果的影响程度要强于提取发色、眼镜、耳环等特征的运算单元，即用于提取眼睛、鼻子、耳朵等特征的运算单元的重要度更高；再如各运算单元提取的特征元素(像素等)占所需识别和检测的目标总元素的比例，可以通过特征提取和对特征元素的分析得到，仍然以人脸识别为例，通过运算单元提取眼睛、鼻子、耳朵等特征，这些特征的元素占目标总元素的比例要大于运算单元提取到的发色、眼镜、耳环等特征的元素占目标总元素的比例，则说明提取眼睛、鼻子、耳朵等特征的运算单元对于人脸识别结果的影响程度要强于提取发色、眼镜、耳环等特征的运算单元，即用于提取眼睛、鼻子、耳朵等特征的运算单元的重要度更高。通过对各运算单元的重要度进行分析，可以得到各运算单元的重要度，例如可以根据各运算单元对于目标识别与目标检测结果的影响程度，配置相应的重要度。

在得到各运算单元的重要度后，可以分别与预设重要度进行比较，如果重要度低于预设重要度，则将该运算单元确定为待删除运算单元。其中，预设重要度为预先设定的运算单元的重要程度，一般根据需要识别和检测的目标的特征对目标识别和目标检测的影响设定，例如，重要度分为第一重要度、第二重要度、第三重要度、第四重要度，并且对目标识别与目标检测的影响程度的顺序依次为第一重要度强于第二重要度、第二重要度强于第三重要度、第三重要度强于第四重要度。假设第一重要度、第二重要度及第三重要度对应的运算单元所提取的特征对于识别和检测的目标来说不可或缺，即如果没有这些特征，无法正确识别和检测目标，而第四重要度对应的运算单元所提取的特征对于最终的目标识别和检测结果影响不大，则可以将第三重要度设定为预设重要度，如果一个运算单元的重要度为第四重要度，由于低于预设重要度，则可以将该运算单元确定为待删除运算单元。

预设重要度还可以是根据通过分析得到网络层中可以删除的运算单元的个数后确定的重要度，例如，针对某一网络层，通过分析得到该网络层可删除的运算单元的个数为5，而该网络层中运算单元的总数为12，则可以将其余7个运算单元中最小的重要度确定为预设重要度，一般情况下，5个可删除的运算单元的重要度均小于该预设重要度，这样，即可将重要度低于预设重要度的5个运算单元确定为待删除运算单元。对于原始深度神经网络中每个网络层均执行S102的步骤，则可以得到每个网络层的待删除运算单元。

可选的，S102具体可以为：

第一步，提取原始深度神经网络的网络层中各运算单元的权值绝对值。

第二步，根据该网络层中各运算单元的权值绝对值，配置各运算单元的重要度，其中，各运输单元的权值绝对值与配置的重要度成正比关系。

第三步，基于各运算单元的重要度，确定重要度低于预设重要度的运算单元作为待删除运算单元。

原始深度神经网络的网络层中各运算单元的权值绝对值分别代表了该运算单元对目标识别与目标检测的结果的影响程度，权值绝对值越大，则说明该运算单元对目标识别与目标检测的结果的影响程度越强。因此，可以根据各运算单元的权值绝对值，配置各运算单元的重要度，具体的，可以直接将权值绝对值作为重要度，也可以根据权值绝对值，将一定区间内的权值绝对值对应配置为高等重要度、中等重要度、低等重要度，且权值绝对值与重要度之间为正比关系，即权值绝对值越大，则重要度越高。当然，还可以根据需求，将重要度进行更为详细的划分，例如，划分成第一重要度、第二重要度、第三重要度、第四重要度等等。基于各运算单元的重要度，则可以将重要度低于预设重要度的运算单元确定为待删除运算单元，例如，预设重要度为中等重要度，则可以将低等重要度的运算单元确定为待删除运算单元。

S103，删除原始深度神经网络中各网络层的待删除运算单元，得到网络模型压缩后的深度神经网络。

原始深度神经网络中各网络层的待删除运算单元即为对目标识别与目标检测的结果影响较小的运算单元，由于这些运算单元对目标识别与目标检测的结果影响较小，可以直接将原始深度神经网络中各网络层的待删除运算单元删除，这样，可以在不影响目标识别与目标检测的结果的基础上，实现压缩深度神经网络的网络模型，从而达到降低目标识别与目标检测的运算复杂度、减小内存与带宽资源消耗的目的，进而提高目标识别与目标检测的效率。

应用本实施例，通过对获取到的原始深度神经网络的网络层中各运算单元的重要度进行分析，确定该网络层中重要度低于预设重要度的运算单元作为待删除运算单元，进而得到原始深度神经网络中各网络层的待删除运算单元，删除原始深度神经网络中各网络层的待删除运算单元，即可以得到网络模型压缩后的深度神经网络。由于待删除运算单元的重要度低于预设重要度，即对目标识别与目标检测的结果影响相对较小，因此，删除待删除运算单元，并不会影响到对目标的识别与检测，这样，通过删除各网络层的待删除运算单元，实现压缩深度神经网络的网络模型，达到降低目标识别与目标检测的运算复杂度、减小内存与带宽资源消耗的目的，从而提高目标识别与目标检测的效率。

基于图1所示实施例，本申请实施例还提供了一种深度神经网络的网络模型压缩方法，如图2所示，该深度神经网络的网络模型压缩方法可以包括如下步骤：

S201，获取原始深度神经网络。

S202，利用秩分析工具，通过对原始深度神经网络的网络层进行分析，得到满足预设误差容忍度的条件下，该网络层中待删除运算单元的第一数目。

针对具有m _i个运算单元的原始深度神经网络的第i个网络层Layer _i，m _i个运算单元组成的矩阵的秩表征了网络层Layer _i中有几个重要的运算单元，例如，若通过秩分析工具，分析得到m _i个运算单元组成的矩阵的秩为3，而原始深度神经网络的网络层Layer _i中实际的运算单元的总数为8个，则说明网络层 Layer _i中有3个重要的运算单元，而有5个运算单元并非重要的运算单元，则可以删除的运算单元的最大数目为5，为了保证目标的识别与检测的结果在一定误差范围以内，待删除运算单元的数目的确定需要基于预设误差容忍度ε，再例如，若删除4个运算单元，结果误差会大于预设误差容忍度ε，而若删除3个运算单元，结果误差小于预设误差容忍度ε，则可以将待删除运算单元的第一数目确定为3。通常情况下，为了最大程度的精简深度神经网络的网络结构，第一数目可以确定为满足预设误差容忍度的条件下，可以删除的运算单元的最大数目，当然，如果第一数目为小于该最大数目的数值，例如上述实例中，也可以将第一数目确定为2或者1，这样，也可以达到简化深度神经网络的网络结构的目的，因此，也属于本申请实施例的保护范围。示例性的，秩分析工具可以是PCA(Principal Component Analysis，主成分分析)方法，当然，秩分析工具可以为通过分析得到矩阵的秩的任一种方法，这里不再一一赘述。

S203，通过对该网络层中各运算单元的重要度进行分析，得到该网络层中各运算单元的重要度。

可以按照图1所示实施例的S102的步骤，对该网络层中各运算单元的重要度进行分析，得到该网络层中各运算单元的重要度，这里不再赘述。

S204，按照该网络层中各运算单元的重要度从小到大的顺序选择n _i个运算单元，并将该n _i个运算单元作为待删除运算单元，其中，n _i为网络层Layer _i中待删除运算单元的第一数目。

在确定待删除运算单元的第一数目及得到网络层中各运算单元的重要度之后，可以将重要度最低的几个运算单元确定为待删除运算单元，对于网络层Layer _i，如果待删除运算单元的数目为n _i个，运算单元的总数为m _i个，则可以将重要度最低的n _i个运算单元确定为待删除运算单元，这样，网络层Layer _i最终的运算单元的个数为m _i-n _i个。例如，待删除运算单元的第一数目为3个，第i个网络层Layer _i的10个运算单元的重要度从小到大依次为：第五运算单元、第二运算单元、第七运算单元、第一运算单元、第八运算单元、第十运算单元、第六运算单元、第三运算单元、第四运算单元、第九运算单元，在确定第一数目和重要度大小之后，可以将预设重要度设定为第一运算单元的重要度，从而能够将重要度较低的第五运算单元、第二运算单元和第七运算单元确定为待删除运算单元。

S205，删除原始深度神经网络中各网络层的待删除运算单元，得到网络模型压缩后的深度神经网络。

应用本实施例，通过对获取到的原始深度神经网络的网络层中各运算单元的重要度进行分析，确定该网络层中重要度低于预设重要度的运算单元作为待删除运算单元，进而得到原始深度神经网络中各网络层的待删除运算单元，删除原始深度神经网络中各网络层的待删除运算单元，即可以得到网络模型压缩后的深度神经网络。在通过秩分析工具确定待删除运算单元的第一数目，预设重要度就可以根据该第一数目以及各运算单元的重要度的大小设定，由于待删除运算单元的重要度低于预设重要度，即对目标识别与目标检测的结果影响相对较小，因此，删除待删除运算单元，并不会影响到对目标的识别与检测，这样，通过删除各网络层的待删除运算单元，实现压缩深度神经网络的网络模型，达到降低目标识别与目标检测的运算复杂度、减小内存与带宽资源消耗的目的，从而提高目标识别与目标检测的效率，可以将重要度最低的、与该第一数目对应的几个待删除运算单元删除，删除待删除运算单元后的深度神经网络满足预设误差容忍度条件，保证了目标识别与目标检测的结果的误差在一定范围内，具有较高的准确性。

基于图1所示实施例，本申请实施例还提供了一种深度神经网络的网络模型压缩方法，如图3所示，该深度神经网络的网络模型压缩方法可以包括如下步骤：

S301，获取原始深度神经网络。

S302，通过对原始深度神经网络的网络层中各运算单元的重要度进行分析，确定该网络层中重要度低于预设重要度的运算单元作为待删除运算单元。

S303，删除原始深度神经网络中各网络层的待删除运算单元，得到网络模型压缩后的深度神经网络。

S304，获取利用网络模型压缩后的深度神经网络进行运算的输出结果。

S305，如果输出结果无法满足预设效果，则利用原始深度神经网络的输出结果与网络模型压缩后的深度神经网络的输出结果之间的差异，通过预设算法，对网络模型压缩后的深度神经网络中各网络层的运算单元中的权值进行调整，直至输出结果满足预设效果。

由于各运算单元之间并非完全没有相关性，也就是如果删除了一些运算单元，可能对其他运算单元的特征提取性能产生一定的影响，导致利用网络模型压缩后的深度神经网络进行运算的输出结果无法满足预设效果，其中，预设效果为需要达到的目标识别与目标检测的效果，即实际的输出结果与需要达到的效果之间存在一定的偏差，为了减小该偏差，可以利用原始深度神经网络的输出结果与网络模型压缩后的深度神经网络的输出结果之间的差异，通过预设算法，对网络模型压缩后的深度神经网络中各网络层的运算单元中的权值进行调整，直至调整后的网络模型压缩后的深度神经网络的输出结果满足预设效果，其中，预设算法可以为当前通用的反向梯度传播算法，例如BP算法，这里不再详述。

应用本实施例，通过对获取到的原始深度神经网络的网络层中各运算单元的重要度进行分析，确定该网络层中重要度低于预设重要度的运算单元作为待删除运算单元，进而得到原始深度神经网络中各网络层的待删除运算单元，删除原始深度神经网络中各网络层的待删除运算单元，即可以得到网络模型压缩后的深度神经网络。由于待删除运算单元的重要度低于预设重要度，即对目标识别与目标检测的结果影响相对较小，因此，删除待删除运算单元，并不会影响到对目标的识别与检测，这样，通过删除各网络层的待删除运算单元，实现压缩深度神经网络的网络模型，达到降低目标识别与目标检测的运算复杂度、减小内存与带宽资源消耗的目的，从而提高目标识别与目标检测的效率。并且，如果利用网络模型压缩后的深度神经网络进行运算的输出结果无法满足预设效果，则利用原始深度神经网络的输出结果与网络模型压缩后的深度神经网络的输出结果之间的差异，通过预设算法，对运算单元中的权值进行调整，直至输出结果满足预设效果，有效避免了运算单元之间具有较高的相关性所导致的输出结果无法满足需要达到的效果的情况，保证了目标识别与目标检测的结果准确性。

基于图1所示实施例，本申请实施例还提供了一种深度神经网络的网络模型压缩方法，如图4所示，该深度神经网络的网络模型压缩方法可以包括如下步骤：

S401，获取原始深度神经网络。

S402，通过对原始深度神经网络的网络层中各运算单元的重要度进行分析，确定该网络层中重要度低于预设重要度的运算单元作为待删除运算单元。

S403，删除原始深度神经网络中各网络层的待删除运算单元，得到网络模型压缩后的深度神经网络。

S404，获取网络模型压缩后的深度神经网络中任一网络层的各运算单元之间的相关度。

S405，判断相关度是否小于预设相关度，若是，则执行S406，否则执行S407。

S406，停止调整各运算单元中的权值。

S407，采用预设正则化项，对该网络层的各运算单元中的权值进行调整。

在删除待删除运算单元之后，网络模型压缩后的深度神经网络的网络层中各运算单元之间可能还存在较高的相关度，相关度较高的情况下，各运算单元之间仍然存在一定的冗余信息，导致网络模型的性能较差，如果各运算单元之间的相关度大于或等于预设相关度，则说明该网络层的冗余信息较多，网络结构不够精简，则可以采用预设正则化项，例如正交正则化项，对该网络层的各运算单元进行调整，直至相关度小于预设相关度。如果原始深度神经网络中采用了例如传统L2正则化项，可以将该传统L2正则化项替换为例如正交正则化项的预设正则化项，以实现减小各运算单元间的相关度的目的。

应用本实施例，通过对获取到的原始深度神经网络的网络层中各运算单元的重要度进行分析，确定该网络层中重要度低于预设重要度的运算单元作为待删除运算单元，进而得到原始深度神经网络中各网络层的待删除运算单元，删除原始深度神经网络中各网络层的待删除运算单元，即可以得到网络模型压缩后的深度神经网络。由于待删除运算单元的重要度低于预设重要度，即对目标识别与目标检测的结果影响相对较小，因此，删除待删除运算单元，并不会影响到对目标的识别与检测，这样，通过删除各网络层的待删除运算单元，实现压缩深度神经网络的网络模型，达到降低目标识别与目标检测的运算复杂度、减小内存与带宽资源消耗的目的，从而提高目标识别与目标检测的效率。并且，通过对网络模型压缩后的深度神经网络中网络层的各运算单元之间的相关度进行判断，如果相关度大于或等于预设相关度，则采用预设正则化项，对该网络层的各运算单元中的权值进行调整，直至相关度小于预设相关度，有效降低冗余信息对结果精度的影响，保证了目标识别与目标检测的结果精度。

基于图3及图4所示实施例，本申请实施例还提供了一种深度神经网络的网络模型压缩方法，该深度神经网络的网络模型压缩方法可以包括图3所示实施例与图4所示实施例的所有步骤，即不仅利用预设正则化项进行各运算单元中权值的调整，还监测输出结果，在输出结果无法满足预设效果的情况下，对各运算单元中权值进行调整，从而实现目标识别与目标检测结果的高精度、高准确性要求，这里不再详述。

相应于上述方法实施例，本申请实施例提供了一种深度神经网络的网络模型压缩装置，如图5所示，该深度神经网络的网络模型压缩装置可以包括：

第一获取模块510，用于获取原始深度神经网络；

第一确定模块520，用于通过对所述原始深度神经网络的网络层中各运算单元的重要度进行分析，确定所述网络层中重要度低于预设重要度的运算单元作为待删除运算单元；

删除模块530，用于删除所述原始深度神经网络中各网络层的待删除运算单元，得到网络模型压缩后的深度神经网络。

可选的，所述第一确定模块520，具体可以用于：

基于图5所示实施例，本申请实施例还提供了一种深度神经网络的网络模型压缩装置，如图6所示，该深度神经网络的网络模型压缩装置可以包括：

第一获取模块610，用于获取原始深度神经网络；

分析模块620，用于利用秩分析工具，对所述原始深度神经网络的网络层进行分析，得到满足预设误差容忍度的条件下，所述网络层中待删除运算单元的第一数目；

第一确定模块630，用于通过对所述原始深度神经网络的网络层中各运算单元的重要度进行分析，得到所述网络层中各运算单元的重要度；按照所述网络层中各运算单元的重要度从小到大的顺序选择所述第一数目个运算单元，并将所选择的运算单元作为待删除运算单元；

删除模块640，用于删除所述原始深度神经网络中各网络层的待删除运算单元，得到网络模型压缩后的深度神经网络。

应用本实施例，通过对获取到的原始深度神经网络的网络层中各运算单元的重要度进行分析，确定该网络层中重要度低于预设重要度的运算单元作为待删除运算单元，进而得到原始深度神经网络中各网络层的待删除运算单元，删除原始深度神经网络中各网络层的待删除运算单元，即可以得到网络模型压缩后的深度神经网络。在通过秩分析工具确定待删除运算单元的第一数目，预设重要度就可以根据该第一数目以及各运算单元的重要度的大小设定，由于待删除运算单元的重要度低于预设重要度，即对目标识别与目标检测的结果影响相对较小，因此，删除待删除运算单元，并不会影响到对目标的识别与检测，这样，通过删除各网络层的待删除运算单元，实现压缩深度神经网络的网络模型，达到降低目标识别与目标检测的运算复杂度、减小内存与带宽资源消耗的目的，从而提高目标识别与目标检测的效率，可以将重要度最低的与该数目对应的几个待删除运算单元删除，删除待删除运算单元后的深度神经网络满足预设误差容忍度条件，保证了目标识别与目标检测的结果的误差在一定范围内，具有较高的准确性。

基于图5所示实施例，本申请实施例还提供了一种深度神经网络的网络模型压缩装置，如图7所示，该深度神经网络的网络模型压缩装置可以包括：

第一获取模块710，用于获取原始深度神经网络；

第一确定模块720，用于通过对所述原始深度神经网络的网络层中各运算单元的重要度进行分析，确定所述网络层中重要度低于预设重要度的运算单元作为待删除运算单元；

删除模块730，用于删除所述原始深度神经网络中各网络层的待删除运算单元，得到网络模型压缩后的深度神经网络；

第二获取模块740，用于获取利用所述网络模型压缩后的深度神经网络进行运算的输出结果；

第一调整模块750，用于如果所述输出结果无法满足预设效果，则利用所述原始深度神经网络的输出结果与所述网络模型压缩后的深度神经网络的输出结果之间的差异，通过预设算法，对所述网络模型压缩后的深度神经网络中各网络层的运算单元中的权值进行调整，直至所述输出结果满足所述预设效果。

基于图5所示实施例，本申请实施例还提供了一种深度神经网络的网络模型压缩装置，如图8所示，该深度神经网络的网络模型压缩装置可以包括：

第一获取模块810，用于获取原始深度神经网络；

第一确定模块820，用于通过对所述原始深度神经网络的网络层中各运算单元的重要度进行分析，确定所述网络层中重要度低于预设重要度的运算单元作为待删除运算单元；

删除模块830，用于删除所述原始深度神经网络中各网络层的待删除运算单元，得到网络模型压缩后的深度神经网络；

第三获取模块840，用于获取所述网络模型压缩后的深度神经网络中任一网络层的各运算单元之间的相关度；

判断模块850，用于判断所述相关度是否小于预设相关度；

第二调整模块860，用于若所述判断模块850的判断结果为否，则采用预设正则化项，对该网络层的各运算单元中的权值进行调整，直至所述相关度小于所述预设相关度时，停止调整各运算单元中的权值。

基于图7及图8所示实施例，本申请实施例还提供了一种深度神经网络的网络模型压缩装置，该深度神经网络的网络模型压缩装置可以包括图7所示实施例与图8所示实施例的所有模块，以实现目标识别与目标检测结果的高精度、高准确性要求，这里不再详述。

另外，相应于上述实施例所提供的深度神经网络的网络模型压缩方法，本申请实施例提供了一种计算机可读存储介质，用于存储可执行代码，所述可执行代码用于在运行时执行：本申请实施例所提供的深度神经网络的网络模型压缩方法；具体的，所述深度神经网络的网络模型压缩方法，可以包括：

获取原始深度神经网络；

本实施例中，计算机可读存储介质存储有在运行时执行本申请实施例所提供的深度神经网络的网络模型压缩方法的可执行代码，因此能够实现：由于待删除运算单元的重要度低于预设重要度，即对目标识别与目标检测的结果影响相对较小，因此，删除待删除运算单元，并不会影响到对目标的识别与检测，这样，通过删除各网络层的待删除运算单元，实现压缩深度神经网络的网络模型，达到降低目标识别与目标检测的运算复杂度、减小内存与带宽资源消耗的目的，从而提高目标识别与目标检测的效率。

另外，相应于上述实施例所提供的深度神经网络的网络模型压缩方法，本申请实施例提供了一种应用程序，用于在运行时执行：本申请实施例所提供的深度神经网络的网络模型压缩方法；具体的，本申请实施例所提供的深度神经网络的网络模型压缩方法，可以包括：

获取原始深度神经网络；

本实施例中，应用程序在运行时执行本申请实施例所提供的深度神经网络的网络模型压缩方法，因此能够实现：由于待删除运算单元的重要度低于预设重要度，即对目标识别与目标检测的结果影响相对较小，因此，删除待删除运算单元，并不会影响到对目标的识别与检测，这样，通过删除各网络层的待删除运算单元，实现压缩深度神经网络的网络模型，达到降低目标识别与目标检测的运算复杂度、减小内存与带宽资源消耗的目的，从而提高目标识别与目标检测的效率。

另外，相应于上述实施例提供的深度神经网络的网络模型压缩方法，本申请实施例提供了一种计算机设备，如图9所示，包括处理器901和计算机可读存储介质902，其中，

计算机可读存储介质902，用于存放可执行代码；

处理器901，用于执行计算机可读存储介质902上所存放的可执行代码时，实现如下步骤：

获取原始深度神经网络；

可选的，所述处理器901在实现所述通过对所述原始深度神经网络的网络层中各运算单元的重要度进行分析，确定所述网络层中重要度低于预设重要度的运算单元作为待删除运算单元的步骤中，具体可以实现：

可选的，所述处理器901还可以实现：

所述处理器901在实现所述通过对所述原始深度神经网络的网络层中各运算单元的重要度进行分析，确定所述网络层中重要度低于预设重要度的运算单元作为待删除运算单元的步骤中，具体可以实现：

可选的，所述处理器901还可以实现：

判断所述相关度是否小于预设相关度；

计算机可读存储介质902与处理器901之间可以通过有线连接或者无线连接的方式进行数据传输，并且计算机设备可以通过有线通信接口或者无线通信接口与其他的设备进行通信。

上述计算机可读存储介质可以包括RAM(Random Access Memory，随机存取存储器)，也可以包括NVM(Non-volatile Memory，非易失性存储器)，例如至少一个磁盘存储器。可选的，计算机可读存储介质还可以是至少一个位于远离前述处理器的存储装置。

上述处理器可以是通用处理器，包括CPU(Central Processing Unit，中央处理器)、NP(Network Processor，网络处理器)等；还可以是DSP(Digital Signal Processor，数字信号处理器)、ASIC(Application Specific Integrated Circuit，专用集成电路)、FPGA(Field-Programmable Gate Array，现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

本实施例中，该计算机设备的处理器通过读取计算机可读存储介质中存储的可执行代码来运行与所述可执行代码对应的程序，该程序在运行时执行本申请实施例所提供的深度神经网络的网络模型压缩方法，因此能够实现：由于待删除运算单元的重要度低于预设重要度，即对目标识别与目标检测的结果影响相对较小，因此，删除待删除运算单元，并不会影响到对目标的识别与检测，这样，通过删除各网络层的待删除运算单元，实现压缩深度神经网络的网络模型，达到降低目标识别与目标检测的运算复杂度、减小内存与带宽资源消耗的目的，从而提高目标识别与目标检测的效率。

对于计算机设备、应用程序以及计算机可读存储介质实施例而言，由于其所涉及的方法内容基本相似于前述的方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置、计算机设备、应用程序以及计算机可读存储介质实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请的较佳实施例而已，并不用以限制本申请，凡在本申请的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本申请保护的范围之内。

Claims

一种深度神经网络的网络模型压缩方法，其特征在于，所述方法包括：

获取原始深度神经网络；

通过对所述原始深度神经网络的网络层中各运算单元的重要度进行分析，确定所述网络层中重要度低于预设重要度的运算单元作为待删除运算单元；

删除所述原始深度神经网络中各网络层的待删除运算单元，得到网络模型压缩后的深度神经网络。
根据权利要求1所述的方法，其特征在于，所述通过对所述原始深度神经网络的网络层中各运算单元的重要度进行分析，确定所述网络层中重要度低于预设重要度的运算单元作为待删除运算单元，包括：

提取所述原始深度神经网络的网络层中各运算单元的权值绝对值；

根据所述网络层中各运算单元的权值绝对值，配置各运算单元的重要度，其中，各运输单元的权值绝对值与配置的重要度成正比关系；

基于各运算单元的重要度，确定重要度低于预设重要度的运算单元作为待删除运算单元。
根据权利要求1所述的方法，其特征在于，在所述通过对所述原始深度神经网络的网络层中各运算单元的重要度进行分析，确定所述网络层中重要度低于预设重要度的运算单元作为待删除运算单元之前，所述方法还包括：

利用秩分析工具，对所述原始深度神经网络的网络层进行分析，得到满足预设误差容忍度的条件下，所述网络层中待删除运算单元的第一数目；

所述通过对所述原始深度神经网络的网络层中各运算单元的重要度进行分析，确定所述网络层中重要度低于预设重要度的运算单元作为待删除运算单元，包括：

通过对所述原始深度神经网络的网络层中各运算单元的重要度进行分析，得到所述网络层中各运算单元的重要度；

按照所述网络层中各运算单元的重要度从小到大的顺序选择所述第一数目个运算单元，并将所选择的运算单元作为待删除运算单元。
根据权利要求1所述的方法，其特征在于，在所述删除所述原始深度神经网络中各网络层的待删除运算单元，得到网络模型压缩后的深度神经网络之后，所述方法还包括：

获取利用所述网络模型压缩后的深度神经网络进行运算的输出结果；

如果所述输出结果无法满足预设效果，则利用所述原始深度神经网络的输出结果与所述网络模型压缩后的深度神经网络的输出结果之间的差异，通过预设算法，对所述网络模型压缩后的深度神经网络中各网络层的运算单元中的权值进行调整，直至所述输出结果满足所述预设效果。
根据权利要求1所述的方法，其特征在于，在所述删除所述原始深度神经网络中各网络层的待删除运算单元，得到网络模型压缩后的深度神经网络之后，所述方法还包括：

获取所述网络模型压缩后的深度神经网络中任一网络层的各运算单元之间的相关度；

判断所述相关度是否小于预设相关度；

若否，则采用预设正则化项，对该网络层的各运算单元中的权值进行调整，直至所述相关度小于所述预设相关度时，停止调整各运算单元中的权值。
一种深度神经网络的网络模型压缩装置，其特征在于，所述装置包括：

第一获取模块，用于获取原始深度神经网络；

第一确定模块，用于通过对所述原始深度神经网络的网络层中各运算单元的重要度进行分析，确定所述网络层中重要度低于预设重要度的运算单元作为待删除运算单元；

删除模块，用于删除所述原始深度神经网络中各网络层的待删除运算单元，得到网络模型压缩后的深度神经网络。
根据权利要求6所述的装置，其特征在于，所述第一确定模块，具体用于：

提取所述原始深度神经网络的网络层中各运算单元的权值绝对值；

根据所述网络层中各运算单元的权值绝对值，配置各运算单元的重要度，其中，各运输单元的权值绝对值与配置的重要度成正比关系；

基于各运算单元的重要度，确定重要度低于预设重要度的运算单元作为待删除运算单元。
根据权利要求6所述的装置，其特征在于，所述装置还包括：

分析模块，用于利用秩分析工具，对所述原始深度神经网络的网络层进行分析，得到满足预设误差容忍度的条件下，所述网络层中待删除运算单元的第一数目；

所述第一确定模块，具体用于：

通过对所述原始深度神经网络的网络层中各运算单元的重要度进行分析，得到所述网络层中各运算单元的重要度；

按照所述网络层中各运算单元的重要度从小到大的顺序选择所述第一数目个运算单元，并将所选择的运算单元作为待删除运算单元。
根据权利要求6所述的装置，其特征在于，所述装置还包括：

第二获取模块，用于获取利用所述网络模型压缩后的深度神经网络进行运算的输出结果；

第一调整模块，用于如果所述输出结果无法满足预设效果，则利用所述原始深度神经网络的输出结果与所述网络模型压缩后的深度神经网络的输出结果之间的差异，通过预设算法，对所述网络模型压缩后的深度神经网络中各网络层的运算单元中的权值进行调整，直至所述输出结果满足所述预设效果。
根据权利要求6所述的装置，其特征在于，所述装置还包括：

第三获取模块，用于获取所述网络模型压缩后的深度神经网络中任一网络层的各运算单元之间的相关度；

判断模块，用于判断所述相关度是否小于预设相关度；

第二调整模块，用于若所述判断模块的判断结果为否，则采用预设正则化项，对该网络层的各运算单元中的权值进行调整，直至所述相关度小于所述预设相关度时，停止调整各运算单元中的权值。
一种计算机可读存储介质，其特征在于，用于存储可执行代码，所述可执行代码用于在运行时执行：权利要求1-5任一项所述的深度神经网络的网络模型压缩方法。
一种应用程序，其特征在于，用于在运行时执行：权利要求1-5任一项所述的深度神经网络的网络模型压缩方法。
一种计算机设备，其特征在于，包括处理器和计算机可读存储介质，其中，

所述计算机可读存储介质，用于存放可执行代码；

所述处理器，用于执行所述计算机可读存储介质上所存放的可执行代码时，实现权利要求1-5任一所述的深度神经网络的网络模型压缩方法。