WO2022198606A1

WO2022198606A1 - 深度学习模型的获取方法、系统、装置及存储介质

Info

Publication number: WO2022198606A1
Application number: PCT/CN2021/083129
Authority: WO
Inventors: 张雪
Original assignee: 深圳市大疆创新科技有限公司
Priority date: 2021-03-26
Filing date: 2021-03-26
Publication date: 2022-09-29

Abstract

本申请提供一种深度学习模型的获取方法，所述方法包括：获取第一深度学习模型和表征深度学习模型性能的期望参数，所述深度学习模型性能至少包括以下之一：所述深度学习模型的大小、运行速度和运行精度；根据所述期望参数，对所述第一深度学习模型进行剪枝，得到第二深度学习模型；固定所述第一深度学习模型的参数，对所述第一深度学习模型和所述第二深度学习模型进行联合训练，获得满足所述期望参数的第一目标深度学习模型。应用本申请实施例所提供的方法，能够获取满足不同平台或者不同应用场景的需求的深度学习模型，且还能够克服相关技术中计算资源的浪费，以及在计算资源紧张的情况下，无法获取合适的深度学习模型的缺陷。

Description

深度学习模型的获取方法、系统、装置及存储介质

技术领域

本申请涉及深度学习技术领域，尤其涉及一种深度学习模型的获取方法、系统、装置及计算机可读存储介质。

背景技术

随着深度学习技术的快速发展，深度学习模型的应用越来越广泛。当前，深度学习模型可以部署在如服务器集群、服务器、移动终端等等的各类平台上，以及应用在人脸识别、美颜、语义分割等诸多不同场景中。然而，由于不同平台具有不同的计算性能，以及不同应用场景往往具有不同的计算需求，为了能够使深度学习模型达到不同平台或不同应用场景的运行速度以及运行精度等等的需求，相关技术中，针对不同平台或不同应用场景对同一种深度学习模型有不同需求的研发，基本以训练多个分离的模型为主。

相关技术所使用的上述方法，虽然可以获得满足不同平台或不同应用场景的需求的深度学习模型，但是，由于多个分离的深度学习模型的训练会消耗很多重复的计算资源，造成计算资源的巨大浪费。此外，在计算资源紧张的情况下，多个分离的深度学习模型的训练，也存在实现困难的缺陷。

发明内容

为克服相关技术中，为了获取适用于不同平台或不同应用场景的深度学习模型，采用分离训练多个深度学习模型的方法中所存在的浪费计算资源、实现困难等诸多缺陷，本申请提供了一种深度学习模型的获取方法、系统、装置及计算机可读存储介质。

根据本申请实施例的第一方面，提供一种深度学习模型的获取方法，所述方法包括：获取第一深度学习模型和表征深度学习模型性能的期望参数，所述深度学习模型性能至少包括以下之一：所述深度学习模型的大小、运行速度和运行精度；根据所述期望参数，对所述第一深度学习模型进行剪枝，得到第二深度学习模型；固定所述第一深度学习模型的参数，对所述第一深度学习模型和所述第二深度学习模型进行联合训练，获得满足所述期望参数的第一目标深度学习模型。

根据本申请实施例的第二方面，提供另一种深度学习模型的获取方法，所述方法包括：获取第一深度学习模型和所述深度学习模型的期望裁剪量；根据所述期望裁剪量，确定所述第一深度学习模型的每个神经网络层的第一参量的裁剪量，所述第一参量至少包括神经元、向量、卷积核或滤波器中的一个；每次对所述第一深度学习模型中需要剪枝的第一神经网络层，去掉不同的指定数量的第一参量，获得所述第一神经网络层之后的第二神经网络层所输出的第一特征图，所述第二神经网络层为所述第一神经网络层去掉所述指定数量的第一参量前后，输出的特征图尺寸未发生变化的神经网络层；获得多个所述第一特征图和与所述第一特征图对应的第二特征图之间的误差，所述第二特征图为所述第二神经网络层在所述第一神经网络层未去掉所述指定数量的第一参量之前所输出的特征图；基于所述期望裁剪量和所述多个误差，确定需要裁剪的第一参量；对所述需要裁剪的第一参量进行裁剪，获得第二目标深度学习模型。

根据本申请实施例的第三方面，提供一种深度学习模型获取系统，所述系统包括第一平台和第二平台；所述第一平台，用于基于本申请实施例的第一方面和第二方面所述的方法，获取目标深度学习模型；所述第二平台，用于部署所述目标深度学习模型；所述平台至少包括以下之一：服务器集群、服务器、移动终端。

根据本申请实施例的第四方面，提供一种深度学习模型获取装置，所述装置包括存储器和处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现本申请实施例第一方面和第二方面所述的方法。

根据本申请实施例的第五方面，提供一种计算机可读存储介质，所述计算机可读存储介质上存储有若干计算机指令，所述计算机指令被执行时实现本申请实施例第一方面和第二方面所述的方法。

本申请的实施例提供的技术方案可以包括以下有益效果：

在本申请的实施例中，基于表征深度学习模型性能的期望参数，对预先获取的第一深度学习模型进行剪枝，得到满足所述期望参数的第二深度学习模型之后，固定所述第一深度学习模型的参数，对所述第一深度学习模型和所述第二深度学习模型进行联合训练，能够对所述第二深度学习模型进行精度恢复，使得最终获得的第一目标深度学习模型，相对于所述第一深度学习模型，不仅为轻量化的深度学习模型，同时还具备较高的运行精度。可见，应用本申请实施例所提供的方法，能够基于第一深度学习模型，获得剪枝后的深度学习模型之后，不采用重新训练的方法，而是基于所述第一深度学习模型，对剪枝之后的深度学习模型进行精度恢复，获取满足不同平台或者不同应用场景的需求的深度学习模型。能够克服相关技术中，需要对适用于不同平台或者不同应用场景的深度学习模型进行分离且重复的训练而导致的计算资源的浪费，以及在计算资源紧张的情况下，无法获取合适的深度学习模型的缺陷。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本说明书。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本说明书根据一示例性实施例示出的第一种深度学习模型的获取方法的流程示意图。

图2是本说明根据一示例性实施例示出的第一种剪枝方法的流程示意图。

图3是本说明根据一示例性实施例示出的一种4种不同粒度的剪枝方法的比较示意图。

图4是本说明根据一示例性实施例示出的一种对深度学习模型的连接和神经元进行裁剪的原理示意图。

图5是本说明根据一示例性实施例示出的第一种剪枝方法的原理示意图。

图6是本说明根据一示例性实施例示出的一种蒸馏网络示意图。

图7是本说明根据一示例性实施例示出的第二种剪枝方法的流程示意图。

图8是本说明根据一示例性实施例示出的第三种剪枝方法的原理示意图。

图9是本说明书根据一示例性实施例示出的第二种深度学习模型的获取方法的流程示意图。

图10是本说明书根据一示例性实施例示出的一种对第二目标深度学习模型进行精度恢复的流程示意图。

图11是本说明书根据一示例性实施例示出的一种深度学习模型获取系统的结构示意图。

图12是本说明书根据一示例性实施例示出的一种深度学习模型获取装置的结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

在本申请使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本申请。在本申请说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本申请可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本申请范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

近年来，由于基于深度学习模型的各种技术方案，相对于传统的算法具有学习能力强、适应力强、可移植性好等诸多优点，深度学习技术迅猛发展。

目前，对于同一种深度学习模型，可能会存在需要部署在不同平台以及应用到不同场景的需求。例如，对于同一种用于对无人机所采集的图像进行特征识别的深度学习模型，对于用户来说，为了方便使用，增强用户体验，所述深度学习模型需要部署在用户端的移动终端或者专用的控制终端上；而对于无人机厂商来说，为了方便监控所述无人机的飞行安全，所述深度学习模型可能需要部署在无人机厂商端的服务器或者服务器集群上；此外，对于第三方监管结构来说，为了监控所述无人机的飞行状态，所述深度学习模型可能需要部署在所述第三方监管结构的服务器或者服务器集群上。

对于不同的移动终端、专用的控制终端、服务器以及服务器集群等平台，往往具有不同的计算性能。同一种深度学习模型，存在着无法直接部署在不同平台上使用的问题。例如，为了能够发挥出服务器集群最大计算能力，针对服务器集群所训练出来的深度学习模型为重量级深度学习模型，即训练出的深度学习模型的大小较大、具有较高的运算精度和较快的运算速度。然而，由于移动终端的计算性能远远低于服务器集群的计算性能，故针对服务器集群所训练出来的深度学习模型并不能直接部署在移动终端上，如果强行部署在移动终端上，则可能会导致所述移动终端的运算速度十分慢，甚至出现计算资源崩溃的情况。

同一个深度学习模型，即使部署在同一个平台上，但是基于应用场景的需求，可能对所述深度学习模型的性能也存在着不同的需求。例如，对于同一个用于目标识别的深度学习模型，在实时应用场景中，则需要所述深度学习模型具有较快的运行速度，而在实时性要求不高的应用场景中，则可能对于运行速度没有太高的要求。

相关技术中，为了解决同一种深度学习模型，无法直接部署在不同平台上以及无法更好地应用在不同的场景中的问题，通常会采用独立地训练多个分离的深度学习模型的方法。即针对不同的平台或应用场景，采用相同的深度学习框架，基于各个平台自身的计算性能或不同应用场景的目标需求进行训练，最终获得适用于不同平台或不同应用场景的多个深度学习模型。

虽然相关技术中的技术方案理论上能够获得适用于不同平台或不同应用场景的多个深度学习模型，但是由于采用分离训练的方式，那么，针对不同的平台或应用场景进行训练，每次训练都需要从深度学习框架这个起点进行重新训练，进而会导致消耗很多的重复的计算资源，造成计算资源的巨大浪费。此外，在计算资源比较紧张的情况下，相关技术中所采用的技术方案，甚至会存在无法实现的问题。

为了解决相关技术在获取适用于不同平台或者不同应用场景的深度学习模型的过程中，所存在的重复计算资源的浪费问题以及在计算资源比较紧张的情况下，相关技术甚至无法获取适用于不同平台或者不同应用场景的深度学习模型的问题，本申请提供了一种深度学习模型的获取方法，如图1所示，是本申请实施例所提供的第一种深度学习模型的获取方法，所述方法包括：

步骤101，获取第一深度学习模型和表征深度学习模型性能的期望参数，所述深度学习模型性能至少包括以下之一：所述深度学习模型的大小、运行速度和运行精度；

步骤102，根据所述期望参数，对所述第一深度学习模型进行剪枝，得到第二深度学习模型；

步骤103，固定所述第一深度学习模型的参数，对所述第一深度学习模型和所述第二深度学习模型进行联合训练，获得满足所述期望参数的第一目标深度学习模型。

其中，所述第一深度学习模型，可以是基于现有的或者自己开发的深度学习框架，利用具有计算能力的平台，尤其是计算能力较强的平台训练获得，也可以是直接从其他的地方获取的由第三方训练完成的深度学习模型，当然，还可以是其他获取方式，本申请实施例对此不做限制。

所述表征深度学习模型性能的期望参数，可以通过预先设置的方式获取，也可以是通过向所述第一目标深度学习模型需要部署的需求平台获取，还可以是通过向第三方获取的方式得到，本申请实施例对此不做限定。

在一些实施例中，所述表征深度学习模型性能的期望参数，可以基于所述第一目标深度学习模型需要部署的需求平台的计算性能确定。例如，步骤101中所获取的第一深度学习模型是用于图像特征识别的，在服务器上训练完成，大小为10M；而步骤103所述的第一目标深度学习模型，是需要部署在移动终端上的，而所述移动终端仅具有5M的缓存。那么，基于作为需求平台的所述移动终端的性能，可以确定所述表征深度学习模型性能的期望参数中，所述第一目标深度学习模型的大小应为5M以下，可以据此确定所述表征深度学习模型性能的期望参数为所述深度学习模型的大小不大于5M。当然，本领域技术人员应当理解，上述举例仅为示例性说明，当然，所述需求平台的计算性能，除了可以以缓存大小来表征，还可以以计算速度、计算精度等等参数表征，相应地，所述表征深度学习模型性能的期望参数，还可以是基于所述需求平台的计算速度、计算精度等等，所确定的所述深度学习模型的运行速度和运行精度等等。

在一些实施例中，所述表征深度学习模型性能的期望参数，可以基于所述第一目标深度学习模型的应用场景确定。例如，步骤101中所获取的第一深度学习模型是用于图像特征识别的，在服务器上训练完成，能够识别10微米分辨率的细节。对于某些应用场景，比如疾病的智能诊断上，这种超高分辨率是十分有意义的，能够帮助医生发现微小的病变位置。然而，如果步骤103中所述的深度学习模型还是部署在同一服务器上，但是是应用到无人机的目标物体识别上，那么，对于无人机来说，有意义的目标物体，通常尺寸不会十分小，而识别尺寸小至微米级别的物体，例如浮沉，本身也没有太大的意义。那么，基于所述第一目标深度学习模型的应用场景，可以确定所述表征深度学习模型性能的期望参数中，所述深度学习模型的运行精度的级别。当然，本领域技术人员应当理解，上述举例仅为示例性说明，所述深度学习模型的应用场景，还可以转化为计算速度、模型大小等等来表征，相应地，所述表征深度学习模型性能的期望参数，还可以是基于应用场景所需求的计算速度、模型大小等等，所确定的所述深度学习模型的运行速度和大小等等。

深度学习模型从卷积层到全连接层存在着大量冗余的参数，神经网络的各个层中，大量的神经元激活值、向量、卷积核以及滤波器等等，趋近于0。将这些神经元、向量、卷积核以及滤波器去除后，深度学习模型可以表现出与原来的模型相同或者近似的表达能力，这种情况被称为深度学习模型的过参数化，去除各个神经网络层中，对深度学习模型表达能力影响较小的神经元、向量、卷积核和滤波器，就是剪枝过程。

在本申请实施例中，步骤102，根据所述期望参数，对所述第一深度学习模型进行剪枝，可以由多种实现方式，本申请对所述剪枝所采用的具体方式不做限制。在下文，给出本申请所提供的几种具体的剪枝方式，但是，本领域技术人员应当理解，下文各个实施例仅为示例性说明，并非是对所述剪枝方式的限定，所述剪枝可以参考相关技术实现，也可以是本领域技术人员自己所改进的其他剪枝方式。

通过上述实施例可以看到，应用本申请实施例所提供的方法，能够基于第一深度学习模型，获得剪枝后的深度学习模型之后，不采用重新训练的方法，而是基于所述第一深度学习模型，对剪枝之后的深度学习模型进行精度恢复，获取满足不同平台或者不同应用场景的需求的深度学习模型。能够克服相关技术中，需要对适用于不同平台或者不同应用场景的深度学习模型进行分离且重复的训练而导致的计算资源的浪费，以及在计算资源紧张的情况下，无法获取合适的深度学习模型的缺陷。

在一些实施例，如图2所示，步骤102，根据所述期望参数，对所述第一深度学习模型进行剪枝，包括：

步骤201，根据所述期望参数，确定所述第一深度学习模型的每个神经网络层的第一参量的裁剪量，所述第一参量至少包括神经元、向量、卷积核或滤波器；

步骤202，每次从所述第一深度学习模型中需要剪枝的第一神经网络层，去掉不同的指定数量的第一参量，获得所述第一神经网络层之后的第二神经网络层所输出的第一特征图，所述第二神经网络层为所述第一神经网络层去掉所述指定数量的第一参量前后，输出的特征图尺寸未发生变化的神经网络层；

步骤203，获得多个所述第一特征图和与所述第一特征图对应的第二特征图之间的误差，所述第二特征图为所述第二神经网络层在所述第一神经网络层未去掉所述指定数量的第一参量之前所输出的特征图；

步骤204，基于所述裁剪量和所述多个误差，确定需要裁剪的第一参量。

对于深度学习模型进行剪枝，根据粒度的不同，可以如图3所示，至少粗分为4个粒度。图3(A)为细粒度剪枝(Fine-grained)，对神经元或者神经元之间的权重连接进行剪枝，是粒度最小的剪枝；图3(B)为向量剪枝(Vector-level)，相对于细粒度剪枝粒度更大，属于卷积核内部(Intra-kernel)的剪枝；图3(C)为卷积核剪枝(Kernel-level)，即去除卷积层中的某个卷积核，它将丢弃对输入通道中对应计算通道的响应；图4(D)为滤波器剪枝(Filter-level)，对整个卷积核组进行剪枝。因此，在步骤201中，被裁剪的第一参量可以是神经元、向量、卷积核或者滤波器。

图4给出了一个对深度学习模型的连接和神经元进行裁剪的原理示意图。在图4(A)中，神经元r ₁、r ₂和r ₃不为0，且神经网络层与神经元r ₁、r ₂和r ₃的连接也不为0；在图4(B)中，对神经网络层与神经元r ₂之间的连接置0，使得权重连接矩阵变得稀疏，这就是权重连接剪枝。向量剪枝、卷积核剪枝以及滤波器剪枝与权重连接剪枝类似，分别是将卷积层中的某些向量、卷积核和滤波器去除，从而对深度学习模型进行“瘦身”，减小深度学习模型的大小。当去除的权重连接、神经元、向量、卷积核以及滤波器对整个深度学习模型的性能影响较小时，去除这些参量，能够在保证深度学习模型计算性能的同时，减小深度学习模型的大小，提高运行速度。

在这里，以所述第一参量为滤波器，对步骤102，根据所述期望参数，对所述第一深度学习模型进行剪枝的步骤201至204进行说明，对神经元、向量以及卷积核等其他类型的第一参量，进行剪枝的过程同对滤波器进行剪枝的过程类似，本申请实施例不做赘述。

当在步骤101获取了所述期望参数，则可以通过多种方式，确定出为了获得所述第一目标深度学习模型，需要对所述第一深度学习模型的每个神经网络层的第一参量进行裁剪的数量。

在一些实施例中，所述裁剪量，可以是开发人员基于所述期望参数，根据经验预先设置的固定裁剪量。例如，开发人员可以预先设置，对所述第一深度学习模型的第一个卷积层去掉3个滤波器，对第二个卷积层去掉2个滤波器....当然，基于此种方法确定裁剪量，效率低下，且可靠性差。

故，在一些实施例中，步骤201，根据所述期望参数，确定所述第一深度学习模型的每个神经网络层的第一参量的裁剪量，可以包括：

步骤2011，根据所述期望参数，确定对所述第一深度学习模型的每个神经网络层的第一参量进行裁剪的比例；

步骤2012，根据所述比例和所述第一深度学习模型，确定所述第一深度学习模型的每个神经网络层的第一参量的裁剪量。

下面，给出一个示例进行说明。例如，所述第一深度学习模型，是用于对人脸进行美颜的模型，在具有较高计算性能的服务器中完成训练，大小为10M。如果想要将所述第一深度学习模型部署在用户的手机上，所述手机在运行模型时，能够提供的缓存仅为5M，那么，需要对所述第一深度学习模型进行剪枝以实现对所述第一深度学习模型的“瘦身”。基于10M和5M之间的比例关系，可知，需要至少对所述第一深度学习模型的每个神经网络层的第一参量裁剪的比例为50％。基于这个比例，结合所述第一深度学习模型每个神经网络层的所述第一参量的数量，即可确定对所述第一深度学习模型的每个神经网络层的第一参量的裁剪数量。

通过上述实施例可以看到，基于所述期望参数和所述第一深度学习模型，确定对所述第一深度学习模型的每个神经网络层的第一参量进行裁剪的数量，不需要开发人员的干预，可以自动化实现，简单方便，容易实现。

由于深度学习模型进行训练时，使用了大量的卷积层由浅至深地提取输入数据特征的特点，故对大部分的深度学习模型进行剪枝时，存在如下特点：对深度学习模型靠近输入端的神经网络层(下文称为“浅层”)进行剪枝，可以大大提高所述深度学习模型的运行速度，但是剪枝后的深度学习模型的运行精度会有所降低；对深度学习模型靠近输出端的神经网络层(下文称为“深层”)进行剪枝，可以大大降低剪枝之后的深度学习模型的参数量，降低剪枝之后的深度学习模型的大小，且剪枝之后的深度学习模型的运行精度的降低程度小于对浅层的神经网络层进行剪枝的运行精度的降低程度。

基于上述对深度学习模型进行剪枝的特点，步骤2011，根据所述期望参数，确定对所述第一深度学习模型的每个神经网络层的第一参量进行剪枝的裁剪比例，可以根据不同的预设的分配策略，“均匀”地对所述深度学习模型的每个神经网络层的所述第一参量分配相同的裁剪比例，这种情况下，不需要考虑剪枝后的深度学习模型的大小和运行速度的权衡；也可以“非均匀”地对所述深度学习模型的每个神经网络层分配不同的裁剪比例，从而在降低剪枝后的深度学习模型的大小和提升剪枝后的深度学习模型的运行速度之间，进行权衡，从而适用不同的应用场景和部署平台。

故，在一些实施例中，步骤2011，根据所述期望参数，确定对所述第一深度学习模型的每个神经网络层的第一参量进行剪枝的裁剪比例，包括：

步骤2011a，根据所述期望参数，确定对所述第一深度学习模型的第一参量进行裁剪的总比例；

步骤2011b，基于预设的分配策略，向所述第一深度学习模型的多个神经网络层分配不同的裁剪比例，所述不同的裁剪比例使得对所述第一深度学习模型进行裁剪后，所获得的深度学习模型的总裁剪比例在所述总比例的预设误差范围之内。

其中，所述预设的分配策略，可以基于应用场景和部署平台的特点设定，以表征优先提升剪枝后的深度学习模型的运行速度，还是降低剪枝后的深度学习模型的大小。例如，所述第一深度学习模型，为在服务器上训练完成的用于进行目标对象识别的模型。基于所述第一深度学习模型所获取的第一目标深度学习模型，是部署在用户的手机上实现的。此种情况下，应当优先降低剪枝后的深度学习模型的大小。故预设的分配策略，可以是对所述第一深度学习模型的前N个神经网络层分配的裁剪比例为a，对所述第一深度学习模型的第N+1个神经网络层至最后一个神经网络层，分配的裁剪比例为b，且所述裁剪比例a<所述裁剪比例b，以及对所述第一深度学习基于所述裁剪比例进行剪枝后的深度学习模型的总裁剪比例在所述总比例的预设误差范围之内，从而使得对所述第一深度学习模型的深层神经网络的所述第一参量进行剪枝，以保证剪枝后的第一深度学习模型具有较小的大小，适用于手机平台。

本领域技术人员应当理解，上述预设的分配策略，仅为示例性说明。所述预设的分配策略，还可以是其他内容，例如，在优先降低剪枝后的深度学习模型的大小的情况下，还可以先确定所述第一深度学习模型的中间神经网络层，该中间神经网络层之前的神经网络层，裁剪比例以固定的递减值分配，该中间神经网络层之后的神经网络层，裁剪比例以固定的递增值分配，基于所述第一深度学习模型的总裁剪比例，进行方程求解，可以确定所述第一深度学习模型的每个神经网络层的所述第一参量的裁剪比例，从而使得对所述第一深度学习模型的深层神经网络的所述第一参量进行剪枝，以保证剪枝后的第一深度学习模型具有较小的大小，适用于手机平台。本申请实施例对所述预设的分配策略的具体内容以及对所述第一深度学习模型的多个神经网络分配不同的裁剪比例的具体方式不做限制。

对于一些应用场景和一些平台，剪枝后的第一深度学习模型的大小和运行速度重要程度相同或者相近的情况下，步骤2011，根据所述期望参数，确定对所述第一深度学习模型的每个神经网络层的第一参量进行剪枝的裁剪比例，包括：

步骤2011c，根据所述期望参数，确定对所述第一深度学习模型的第一参量进行裁剪的总比例；

步骤2011d，分别向所述第一深度学习模型的多个神经网络层分配相同的裁剪比例，所述相同的裁剪比例使得对所述第一深度学习模型进行裁剪后，所获得的深度学习模型的总裁剪比例在所述总比例的预设误差范围之内。

在该实施例中，对所述第一深度学习模型的多个神经网络层分配相同的裁剪比例，简单方便，不需要过多额外的计算量，能够快速确定对所述第一深度学习模型的多个神经网络层分配的裁剪比例。

在通过步骤201，确定了对所述第一深度学习模型的每个神经网络层的第一参量的裁剪量之后，基于步骤202和步骤203，能够获取多个所述第一特征图和与所述第一特征图对应的第二特征图之间的误差，以下，以所述第一参量为滤波器，结合图5对剪枝过程的步骤202和步骤203进行说明。

如图5所示，图5(A)为所述第一深度学习模型在剪枝之前，第i层特征图(i为不小于1的正整数)，维度为C*H*W，其中，C为通道数，H是高度，W是宽度。图5(B)为维度为Oi*C*h*w的第i层滤波器组，其中，Oi为所述滤波器组中滤波器的个数，C与第i层特征图的通道数C相等，h是所述滤波器组的高度，w是所述滤波器组的宽度，对第i层神经网络层进行剪枝操作就是把第i层滤波器个数Oi去掉指定数量的图5(B)中以虚线的长方体表示的滤波器。以去掉第i层滤波器组的一个滤波器为例，裁剪掉第i层滤波器组中的一个滤波器之后，第i层滤波器组的维度就变成了(Oi-1)*C*h*w，对应的第i+1层的特征图的维度就变成了(Oi-1)*H*W，如图5(C)所示，即裁剪掉一个滤波器的表现为深度学习模型的下一层输出的特征图少一个通道，图5(C)中虚线框就表示被剪枝掉的一个通道。此时，由于第i+1层的特征图的维度的改变，第i+1层的滤波器组的通道数也要相应变成和第i+1层的特征图相同的通道数Oi-1，如图5(D)中的长方体上的虚线所示，即为被裁剪掉的一个通道。第i+1层滤波器组被剪掉一个通道后，对第i+2层特征图的输出维度并没有任何影响，如图5(E)所示，为剪枝后的第i+2层特征图。由于剪枝后的第i+2层输出的特征图和剪枝前的输出的特征图维度完全相同，故可以计算获得该层特征图在剪枝前后的误差。根据上述过程，对所述第一深度学习模型中的每个神经网络层，每次去掉不同的滤波器，能够得到多个滤波器所对应的不同特征图在剪枝前后之间的误差。

在上述示例中，是以对所述第一深度学习模型的神经网络层去掉一个的滤波器为例进行说明，本领域技术人员应当理解，对所述第一深度学习模型的神经网络层，也可以是去掉神经元、向量以及卷积核等类型的第一参量，当去掉的是这些第一参量时，同样，可以基于剪枝前后，维度并未发生变化且位于所述剪枝的神经网络层之后的特征图，获得同一特征图剪枝前后的误差。

此外，对于所述第一参量的剪枝数量，可以在一次剪枝过程中，仅去掉一个所述第一参量，也可以是同时去掉多个所述第一参量，例如，在一次剪枝过程中，同时去掉一个滤波器组的3个滤波器，本申请实施例对此不做限制。

基于上述实施例的步骤202和步骤203，获取了多个同一特征图在剪枝前后的误差之后，结合步骤201所确定的裁剪量，可以确定需要裁剪的第一参量。

在一些实施例中，步骤204，基于所述裁剪量和所述多个误差，确定需要裁剪的第一参量，包括：

步骤2041，对所述多个误差进行排序；

步骤2042，基于所述排序结果，保留误差最小的所述裁剪量的第一参量。

基于步骤202和步骤203，能够获得去掉多个所述第一参量，所对应的多个第一特征图和第二特征图之间的误差，对所述多个误差进行排序，如果误差较小，则说明去掉该第一参量，对于后续的神经网络层的影响较小；如果误差较大，则说明去掉该第一参量，对于后续的神经网络层的影响较大。因此，通过对所述多个误差进行排序，以排序结果衡量对应所去掉的第一参量对所述第一深度学习模型的影响，基于所述排序结果，确定需要去掉的所述第一参量，科学有效，计算量低，容易实现。

当然，除了上述实施例所述的基于排序结果，确定需要保留或者去掉的第一参量的方式之外，还可以基于所述误差，通过其他方式确定需要保留或者去掉的第一参量。例如，可以采用将所述多个误差的每个误差与其余误差进行比较，当确定自己是最小的误差时，确定该误差所对应的第一参量可以去掉，从而确定第一个可以去掉的第一参量，依次类推，直至确定出的可以去掉的第一参量的数量，等于步骤201所确定的裁剪量。

在一些实施例中，所述第一特征图与所述第二特征图之间的误差，可以基于所述第一特征图与所述第二特征图的距离确定，所述距离，可以为欧式距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、马氏距离等等，本申请实施例不做限制。

通过上述实施例可以看到，采用距离这个参量来衡量所述第一特征图与所述第二特征图之间的误差，计算方便，容易确定。

经过上述各个步骤，能够确定对所述第一深度学习模型进行剪枝时，需要去掉的所述第一参量，进而能够得到第二深度学习模型。在得到了所述第二深度学习模型之后，可以基于步骤103，固定所述第一深度学习模型的参数，对所述第一深度学习模型和所述第二深度学习模型进行联合训练，获得满足所述期望参数的第一目标深度学习模型。

对于步骤103所述的第一深度学习模型和第二深度学习模型的联合训练，可以基于多种具体的方式实现，本申请实施例对此不做限制。

在一些实施例里中，步骤103，可以基于知识迁移技术中的蒸馏技术来实现，即将所述第一深度学习模型作为教师模型(teacher model)，将所述第二深度学习模型作为学生模型(student model)，固定所述第一深度学习模型的参数，基于第一深度学习模型和第二深度学习模型，建立一个与这两个深度学习模型都有关的损失函数，向着两个深度学习模型输入相同的训练数据，基于所述损失函数调整所述第二深度学习模型的参数，以实现在所述第一深度学习模型的引导下，对所述第二深度学习模型进行精度恢复的效果。

如图6所示，给出了一种具体的蒸馏网络：将训练数据输入所述第一深度学习模型，所述第一深度学习模型只参与前向传递，输出的结果经升温(/T)后，经过第一Softmax，得到软化的Soft target；同样的训练数据输入至所述第二深度学习模型，输出结果经过和所述第一深度学习模型相同的温度(/T)后，经过第二Softmax，与Soft target进行KL散度计算，得到蒸馏损失；同样的训练数据输入至所述第二深度学习模型，输出结果经过第三Softmax，与硬目标进行交叉熵计算，得到学生损失；基于所述蒸馏损失和所述学生损失，构建联合损失，对所述第二深度学习模型进行训练，即能够实现在所述第一深度学习模型的指导下，对所述第二深度学习模型进行精度恢复。

本领域技术人员应当理解，上述基于蒸馏技术实现联合训练以及所述的蒸馏网络仅为示例性说明，当然还可以采用其他方式，来基于所述第一深度学习模型，对所述第二深度学习模型进行联合训练，本申请实施例对此不做限制。

通过上述各个实施例可以看到，基于表征深度学习模型性能的期望参数，对预先获取的第一深度学习模型进行剪枝，得到满足所述期望参数的第二深度学习模型之后，固定所述第一深度学习模型的参数，对所述第一深度学习模型和所述第二深度学习模型进行联合训练，能够对所述第二深度学习模型进行精度恢复，使得最终获得的第一目标深度学习模型，相对于所述第一深度学习模型，不仅为轻量化的深度学习模型，同时还具备较高的运行精度。可见，应用本申请实施例所提供的方法，应用本申请实施例所提供的方法，能够基于第一深度学习模型，获得剪枝后的深度学习模型之后，不采用重新训练的方法，而是基于所述第一深度学习模型，对剪枝之后的深度学习模型进行精度恢复，获取满足不同平台或者不同应用场景的需求的深度学习模型。能够克服相关技术中，需要对适用于不同平台或者不同应用场景的深度学习模型进行分离且重复的训练而导致的计算资源的浪费，以及在计算资源紧张的情况下，无法获取合适的深度学习模型的缺陷。

对于步骤102，根据所述期望参数，对所述第一深度学习模型进行剪枝，除了基于上述实施例所述方法之外，还可以采用其他剪枝方式。

在一些实施例中，步骤102，根据所述期望参数，对所述第一深度学习模型进行剪枝，可以如图7所示，包括：

步骤701，每次对所述第一深度学习模型中的多个神经网络层，去掉不同的指定数量的第一参量，获得多个第三深度学习模型，所述第一参量至少包括神经元、向量、卷积核或滤波器；

步骤702，获取表征每个第三深度学习模型性能的评价参数，所述性能至少包括第三深度学习模型的大小、运行速度和运行精度；

步骤703，基于所述评价参数与所述期望参数，确定所述第一深度学习模型中，需要裁剪的第一参量。

其中，步骤701，每次对所述第一深度学习模型中的多个神经网络层，去掉不同的指定数量的第一参量，可以基于预设的顺序来进行，例如，从所述第一深度学习模型的第一个神经网络层开始，每次去掉1个所述第一参量，获得对应的第三深度学习模型，进而获取每个所述第三深度学习模型性能的评价参数，如，每个所述第三深度学习模型的大小，以及向每个第三深度学习模型输入相同的未标注的数据，获得每个第三深度学习模型的输出的运行时间、运行精度等等。在获得了对所述第一深度学习模型进行剪枝之后的第三深度学习模型性能的评价参数之后，基于所述评价参数与所述期望参数，能够确定在所述第一深度学习模型中，需要裁剪的第一参量。

在一些实施例中，步骤703，基于所述评价参数与所述期望参数，确定所述第一深度学习模型中，需要裁剪的第一参量，包括：

步骤7031，获取所述评价参数与所述期望参数的距离；

步骤7032，对所述距离进行排序；

步骤7034，基于所述距离排序结果，确定需要裁剪的第一参量。

在上述步骤702中，能够获取对所述第一深度学习模型的多个神经网络层，去掉不同的指定数量的第一参量后，所获得的多个第三深度学习模型的性能评价参数。通过步骤与7031，获取所述评价参数与所述期望参数的距离，能够量化在步骤701中，在单次中对所述第一深度学习模型中的神经网络层所去掉的第一参量，对于深度学习模型性能的影响程度。例如，剪枝之前的所述第一深度学习模型，在服务器上训练完成，大小为10M，用于人脸美颜时，运行时间为10ms(此处，用“运行时间”来衡量“运行速度”)。对所述第一深度学习模型进行剪枝和精度恢复之后，所获得的第一目标深度学习模型是需要部署在用户的移动终端上的，期望的模型大小为5M，运行时间为18ms。应用上述实施例所述的方法，对于所述第一深度学习模型的第一层神经网络层去掉第1个滤波器之后，所获得的第三深度学习模型的大小为9.8M，用于人脸美颜时，运行速度为30ms；对于所述第一深度学习模型的第一层神经网络层去掉第2个滤波器之后，所获得的第三深度学习模型的大小为9.9M，用于人脸美颜时，运行速度为34.7ms....对于所述第一深度学习模型的第N层神经网络层去掉第n个滤波器之后，所获得的第三深度学习模型的大小为6.6M，用于人脸美颜时，运行速度为40.1ms。对于所获得的多个第三深度学习模型的性能评价参数(即指多个第三深度学习模型的大小、运行速度、运行精度等)，与所述期望参数(即指期望的模型大小、运行时间与运行精度等)，获得多个所述评价参数与所述期望参数的距离，如表1所示。

表1：剪枝后的第三深度学习模型的评价参数与期望参数的距离

对多个所述评价参数与所述期望参数之间的距离进行排序，基于距离排序结果，可以确定需要裁剪的第一参量。结合表1进行说明，可以仅基于所述模型大小距离或者运行时间距离进行排序，确定需要裁剪的所述第一参量；当然，也可以对所述模型大小距离以及运行时间距离进行加权，获得综合距离，综合考虑所述深度学习模型大小与运行时间的影响，确定需要裁剪的所述第一参量。

本领域技术人员应当理解，上述例子仅为示例性说明，所述评价参数还可以是所述深度学习模型的运行精度、运行速度等等，本申请实施例对此不做限制。

通过上述实施例可以看到，对所述第一深度学习模型，去掉不同的指定数量的第一参量，获得多个第三深度学习模型，基于多个所述第三深度学习模型性能的评价参数，结合所述期望参数，能够实现以目的为导向，简单有效地确定需要剪枝的所述第一参量，获取满足不同平台或者不同应用场景的需求的深度学习模型，且还能够克服相关技术中，需要对适用于不同平台或者不同应用场景的深度学习模型进行分离且重复的训练而导致的计算资源的浪费，以及在计算资源紧张的情况下，无法获取合适的深度学习模型的缺陷。

此外，对于步骤102，根据所述期望参数，对所述第一深度学习模型进行剪枝，得到第二深度学习模型，步骤201～步骤204，以及步骤701～步骤703，分别给出了不同的剪枝方法。本领域技术人员应当理解，步骤202以及步骤701中，所述的指定数量，可以为任意整数，即对于所述第一深度学习模型的每个神经网络层，可以不裁剪第一参量，也可以一次去掉多个第一参量。即在每次对所述第一深度学习模型中，需要剪枝的第一神经网络层，去掉一组所述第一参量(即一组包含1个以上的所述第一参量)。然后获得多个剪枝前后的尺寸不发生变化的特征图的误差，基于所述多个误差，确定每组所述第一参量是否被裁剪。其中，每组所包含的所述第一参量的数量可以相同，也可以不同，本申请实施例对此不做限制。

在一些实施例中，步骤202以及步骤701中，所述指定数量为1。即每次对所述第一深度学习模型中需要剪枝的第一神经网络层，去掉1个所述第一参量，所第一参量至少包括神经元、向量、卷积核或滤波器。

通过上述实施例可以看到，每次对所述第一深度学习模型中，需要剪枝的第一神经网络层，去掉1个所述第一参量，能够精确地确定每个所述第一参量的裁剪对于所述第一深度学习模型性能的影响，使得后续所确定的需要裁剪的所述第一参量是对所述第一深度学习模型性能影响较小的所述第一参量，从而保证对所述第一深度学习模型进行“瘦身”的同时，保证所述第一深度学习模型的性能不发生较大的下降。

在对所述第一深度学习模型进行剪枝之后，能够获得第二深度学习模型，然后，通过步骤103，对所述第一深度学习模型和第二深度学习模型进行联合训练，可以实现精度恢复。关于步骤3所采用的联合训练，可以基于多种具体的方式实现，例如，可以基于相关技术中的蒸馏技术来实现，本申请实施例对此不做限制。

对于步骤102，根据所述期望参数，对所述第一深度学习模型进行剪枝，还可以参考相关技术来实现。在一些实施例中，根据所述期望参数，对所述第一深度学习模型进行剪枝，包括：

基于NAS方式，对所述第一深度学习模型进行自动剪枝。NAS，即为神经结构搜索(Neural Architecture Search，简称NAS)，是一种自动设计神经网络的技术，可以通过算法根据样本集自动设计出高性能的网络结构，在某些任务上甚至可以媲美人类专家的水准，甚至发现某些人类之前未曾提出的网络结构，这可以有效的降低神经网络的使用和实现成本。

如图8所示，给出了NAS方式的原理示意图。NAS方式的原理是给定一个称为搜索空间的候选神经网络结构集合，基于预设的搜索策略，从所述搜索空间中搜索出网络结构，基于预设的性能评估策略，对搜索出的网络结构进行优劣评估，进而确定所述搜索出的网络结构是否为最优网络结构。其中，预设的性能评估策略，即用某些指标，例如运行精度、运行速度等来度量，称为性能评估。

对于本申请实施例而言，所述搜索空间可以是所述第一神经网络所包含的全部神经网络结构的集合。所述性能评估策略，可以根据部署平台以及应用场景的需求，设定要求搜索出的网络结构的运行速度、运行精度以及大小。基于NAS方式，能够自动组合出网络结构，直至所述网络结构满足性能评估策略，即完成了对所述第一深度学习模型的剪枝过程。

基于NAS方式，能够对所述第一深度学习模型进行剪枝，获得所述第二深度学习模型。然后，通过步骤103，对所述第一深度学习模型和第二深度学习模型进行联合训练，可以实现精度恢复。关于步骤3所采用的联合训练，可以基于多种具体的方式实现，例如，可以基于相关技术中的蒸馏技术来实现，本申请实施例对此不做限制。

通过上述实施例可以看到，应用本申请实施例所提供的方法，能够基于第一深度学习模型，获得剪枝后的深度学习模型之后，不采用重新训练的方法，而是对所述第一深度学习模型和剪枝后的深度学习模型进行联合训练，实现对剪枝之后的深度学习模型进行精度恢复，获取满足不同平台或者不同应用场景的需求的深度学习模型。能够克服相关技术中，需要对适用于不同平台或者不同应用场景的深度学习模型进行分离且重复的训练而导致的计算资源的浪费，以及在计算资源紧张的情况下，无法获取合适的深度学习模型的缺陷。

与前文所述的一种深度学习模型的获取方法相对应，本申请实施例还提供了另外一种深度学习模型的获取方法，如图9所示，所述方法包括：

步骤901，获取所述第一深度学习模型和所述深度学习模型的期望裁剪量；

步骤902，根据所述期望裁剪量，确定所述第一深度学习模型的每个神经网络层的第一参量的裁剪量，所述第一参量至少包括神经元、向量、卷积核或滤波器；

步骤903，每次对所述第一深度学习模型中需要剪枝的第一神经网络层，去掉不同的指定数量的第一参量，获得所述第一神经网络层之后的第二神经网络层所输出的第一特征图，所述第二神经网络层为所述第一神经网络层去掉所述指定数量的第一参量前后，输出的特征图尺寸未发生变化的神经网络层；

步骤904，获得多个所述第一特征图和与所述第一特征图对应的第二特征图之间的误差，所述第二特征图为所述第二神经网络层在所述第一神经网络层未去掉所述指定数量的第一参量之前所输出的特征图；

步骤905，基于所述期望裁剪量和所述多个误差，确定需要裁剪的第一参量；

步骤906，对所述需要裁剪的第一参量进行裁剪，获得第二目标深度学习模型。

其中，所述第一深度学习模型，可以是基于现有的或者自己开发的深度学习框架，利用计算性能较强的平台训练获得，也可以是直接从其他的地方获取的由第三方训练完成的深度学习模型，当然，还可以是其他获取方式，本申请实施例对此不做限制。

所述深度学习模型的期望裁剪量，可以是预先设定的固定期望裁剪量，即不考虑所述第一深度学习模型的性能，对于所有的第一深度学习模型，都裁剪固定比例或者固定数量的所述第一参量，所述性能包括所述所述第一深度学习模型的大小，运行速度和运行精度。当然，也可以是预先设定的与所述第一深度学习模型的性能参数相关的裁剪量，例如，对于大小小于第一阈值的所述第一深度学习模型，裁剪第一比例或者第一数量的所述第一参量，对于大小在第一阈值和第二阈值之间的所述第一深度学习模型，裁剪第二比例或者第二数量的所述第一参量，对于大小在第二阈值和第三阈值之间的所述第一深度学习模型，裁剪第三比例或者第三数量的所述第一参量...依次类推，本申请实施例对所述深度学习模型的期望裁剪量的获取方式不做限定。

在一些实施例中，所述期望裁剪量根据表征深度学习模型性能的期望参数确定，所述深度学习模型性能至少包括所述深度学习模型的大小、运行速度和运行精度。即在这些实施例中，所述期望裁剪量并非是预设的裁剪量，而是根据表征深度学习模型性能的期望参数确定。所述表征深度学习模型性能的期望参数，可以通过预先设置的方式获取，也可以是通过向所述第二目标深度学习模型需要部署的需求平台获取，还可以是通过向第三方获取的方式得到，本申请实施例对此不做限定。

在一些实施例中，所述表征深度学习模型性能的期望参数，可以基于所述第二目标深度学习模型需要部署的平台的计算性能确定，也可以基于所述第二目标深度学习模型的应用场景确定。相关内容可以参见本申请实施例所提供的第一种深度学习模型的获取方法中的对应部分，本申请实施例在此对此不再赘述。

在一些实施例中，所述期望裁剪量根据表征深度学习模型性能的期望参数确定，包括：

步骤9011，根据所述期望参数，确定对所述第一深度学习模型的每个神经网络层的第一参量进行裁剪的比例；

步骤9012，根据所述比例和所述第一深度学习模型，确定所述第一深度学习模型的每个神经网络层的第一参量的裁剪数量。

本申请实施例所述的步骤9011与步骤9012，同本申请实施例所提供的第一种深度学习模型的获取方法中的步骤2011与步骤2012类似，相关内容已经在前文详细介绍，这里不再赘述。

在一些实施例中，步骤902，根据所述期望裁剪量，确定所述第一深度学习模型的每个神经网络层的第一参量的裁剪量，可以包括：

步骤9021，基于预设的分配策略，向所述第一深度学习模型的每个神经网络层分配不同的裁剪量，所述不同的裁剪量使得对所述第一深度学习模型进行裁剪后，所获得的深度学习模型的总裁剪量在所述期望裁剪量的预设误差范围之内；或者，

步骤9022，分别向所述第一深度学习模型的多个神经网络层分配相同的裁剪量，所述相同的裁剪量使得对所述第一深度学习模型进行裁剪后，所获得的深度学习模型的总裁剪量在所述期望裁剪量的预设误差范围之内。

本申请实施例所述的步骤9021，同本申请实施例所提供的第一种深度学习模型的获取方法中的步骤2011b类似；步骤9022，同本申请实施例所提供的第一种深度学习模型的获取方法中的步骤2011d类似。关于此部分的相关内容已经在前文详细介绍，这里不再赘述。

通过该实施例可以看到，根据所述期望裁剪量，采用步骤9021确定所述第一深度学习模型的每个神经网络层的第一参量的裁剪量，能够在优先保证深度学习模型的大小还是优先保证深度学习模型的运行速度之间做出权衡，使得剪枝后的深度学习模型能够满足不同平台及不同应用场景的应用需求。而采用步骤9022确定所述第一深度学习模型的每个神经网络层的第一参量的裁剪量，计算简单，容易实现，能够节省计算资源。

在一些实施例中，步骤905，基于所述期望裁剪量和所述多个误差，确定需要裁剪的第一参量，包括：

步骤9051，对所述多个误差进行排序；

步骤9052，基于所述排序结果，保留误差最小的所述期望裁剪量的第一参量。

本申请实施例所述的步骤9051与步骤9052，同本申请实施例所提供的第一种深度学习模型的获取方法中的步骤2041与步骤2042类似，相关内容已经在前文详细介绍，这里不再赘述。

通过上述实施例可以看到，通过对所述多个误差进行排序，以排序结果衡量对应所去掉的第一参量对所述第一深度学习模型的影响，基于所述排序结果，确定需要去掉的所述第一参量，科学有效，计算量低，容易实现。

同前文所述的第一种深度学习模型的获取方法类似，步骤903中的指定数量，可以为任意整数，即对于所述第一深度学习模型的每个神经网络层，可以不裁剪第一参量，也可以一次去掉多个第一参量，本申请实施例对此不做限制。

在一些实施例中，步骤903中，所述指定数量为1。即每次对所述第一深度学习模型中需要剪枝的第一神经网络层，去掉1个所述第一参量，所第一参量至少包括神经元、向量、卷积核或滤波器。

在一些实施例中，如图10所示，本申请实施例所提供的第二种深度学习模型的获取方法还包括：基于与所述第一深度学习模型相同的训练数据和损失函数，对步骤906所获取的第二目标深度学习进行训练，以获得精度恢复后的深度学习模型。

当然，本领域技术人员应当理解，也可以采用前文所述的，固定所述第一深度学习模型的参数，对所述第一深度学习模型和所述第二目标深度学习模型进行联合训练，获得精度恢复的深度学习模型。

通过上述各个实施例可以看到，基于深度学习模型性能的期望裁剪量，对预先获取的第一深度学习模型进行剪枝，得到第二目标深度学习模型之后，对所述第二目标深度学习模型进行精度恢复，使得最终获得的深度学习模型，相对于所述第一深度学习模型，不仅为轻量化的深度学习模型，同时还具备较高的运行精度。可见，应用本申请实施例所提供的方法，能够基于第一深度学习模型，获取满足不同平台或者不同应用场景的需求的深度学习模型，且还能够克服相关技术中，需要对适用于不同平台或者不同应用场景的深度学习模型进行分离且重复的训练而导致的计算资源的浪费，以及在计算资源紧张的情况下，无法获取合适的深度学习模型的缺陷。

与本申请实施例所提供的深度学习模型的获取方法相对应，本申请实施例还提供了一种如图11所示的深度学习模型获取系统，所述系统包括第一平台1101和第二平台1102；所述第一平台1101，用于基于本申请前文各个实施例所提供的深度学习模型的获取方法，获取所述目标深度学习模型，所述第二平台1102，用于部署所述目标深度学习模型。

其中，所述平台至少包括以下之一：服务器集群、服务器、移动终端等等，当然，还可以是其他能够获取或部署所述深度学习模型的平台，本申请实施例对此不做限制。

通过上述实施例可以看到，基于本申请实施例所提供的深度学习模型获取系统，能够基于所述第一平台获取所述目标深度学习模型，所述第二平台能够部署所述第一平台所获取的所述目标深度学习模型，能够克服相关技术中，需要对适用于不同平台或者不同应用场景的深度学习模型进行分离且重复的训练而导致的计算资源的浪费，以及在计算资源紧张的情况下，无法获取合适的深度学习模型的缺陷。

相应地，本申请实施例还提供了一种与所述深度学习模型获取方法相对应的装置。如图12所示，为本申请实施例所提供的一种深度学习模型获取装置的硬件结构图，所述装置包括存储器1201和处理器1202及存储在所述存储器上并可在处理器运行的计算机程序，所述处理器执行所述程序时实现本申请实施例所提供的任一方法实施例。所述存储器1201可以是所述深度学习模型获取装置的内部存储单元，例如是设备的硬盘或者内存。所述存储器1201也可以是所述深度学习模型获取装置的外部存储设备，例如所述设备上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。进一步地，所述存储器1201还可以既包括所述深度学习模型获取装置的内部存储单元也包括外部存储设备。所述存储器用于存储所述计算机程序以及所述设备所需的其他程序和数据。所述存储器还可以用于暂时地存储已经输出或者将要输出的数据。当存储器存储的程序被执行时，所述处理器1202调用存储器1201中存储的程序，用于执行前述各实施例的方法，所述方法已在前文详细介绍，这里不再赘述。

当然，本领域技术人员应当理解，通常根据该深度学习模型获取装置的实际功能，还可以包括其他硬件，例如网络接口等等，本申请对此不再赘述。

在本申请的实施例中还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现本申请上述方法中的所有实施例，在此不再赘述。

所述计算机可读存储介质可以是任一电子设备的内部存储单元，例如电子设备的硬盘或内存。所述计算机可读存储介质也可以是所述电子设备的外部存储设备，例如所述设备上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。进一步地，所述计算机可读存储介质还可以既包括所述电子设备的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述电子设备所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random Access Memory，RAM)等。

上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本领域技术人员在考虑说明书及实践这里申请的发明后，将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未申请的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本申请的真正范围和精神由下面的权利要求指出。

应当理解的是，本申请并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

以上所述仅为本申请的较佳实施例而已，并不用以限制本申请，凡在本申请的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本申请保护的范围之内。

Claims

一种深度学习模型的获取方法，其特征在于，包括：

获取第一深度学习模型和表征深度学习模型性能的期望参数，所述深度学习模型性能至少包括以下之一：所述深度学习模型的大小、运行速度和运行精度；

根据所述期望参数，对所述第一深度学习模型进行剪枝，得到第二深度学习模型；

固定所述第一深度学习模型的参数，对所述第一深度学习模型和所述第二深度学习模型进行联合训练，获得满足所述期望参数的第一目标深度学习模型。
根据权利要求1所述的方法，其特征在于，所述表征深度学习模型性能的期望参数，基于所述第一目标深度学习模型需要部署的需求平台的计算性能和\或所述第一目标深度学习模型的应用场景确定。
根据权利要求1所述的方法，其特征在于，根据所述期望参数，对所述第一深度学习模型进行剪枝，包括：

根据所述期望参数，确定所述第一深度学习模型的每个神经网络层的第一参量的裁剪量，所述第一参量至少包括神经元、向量、卷积核或滤波器；

每次从所述第一深度学习模型中需要剪枝的第一神经网络层，去掉不同的指定数量的第一参量，获得所述第一神经网络层之后的第二神经网络层所输出的第一特征图，所述第二神经网络层为所述第一神经网络层去掉所述指定数量的第一参量前后，输出的特征图尺寸未发生变化的神经网络层；

获得多个所述第一特征图和与所述第一特征图对应的第二特征图之间的误差，所述第二特征图为所述第二神经网络层在所述第一神经网络层未去掉所述指定数量的第一参量之前所输出的特征图；

基于所述裁剪量和所述多个误差，确定需要裁剪的第一参量。
根据权利要求3所述的方法，其特征在于，根据所述期望参数，确定所述第一深度模型的每个神经网络层的第一参量的裁剪量，包括：

根据所述期望参数，确定对所述第一深度学习模型的每个神经网络层的第一参量进行裁剪的比例；

根据所述比例和所述第一深度学习模型，确定所述第一深度学习模型的每个神经网络层的第一参量的裁剪数量。
根据权利要求4所述的方法，其特征在于，所述确定对所述第一深度学习模型的每个神经网络层的第一参量进行剪枝的裁剪比例，包括：

根据所述期望参数，确定对所述第一深度学习模型的第一参量进行裁剪的总比例；

基于预设的分配策略，向所述第一深度学习模型的多个神经网络层分配不同的裁剪比例，所述不同的裁剪比例使得对所述第一深度学习模型进行裁剪后，所获得的深度学习模型的总裁剪比例在所述总比例的预设误差范围之内；

或者，

根据所述期望参数，确定对所述第一深度学习模型的第一参量进行裁剪的总比例；

分别向所述第一深度学习模型的多个神经网络层分配相同的裁剪比例，所述相同的裁剪比例使得对所述第一深度学习模型进行裁剪后，所获得的深度学习模型的总裁剪比例在所述总比例的预设误差范围之内。
根据权利要求3所述的方法，其特征在于，基于所述裁剪量和所述多个误差，确定需要裁剪的第一参量，包括：

对所述多个误差进行排序；

基于所述排序结果，保留误差最小的所述裁剪量的第一参量。
根据权利要求3所述的方法，其特征在于，所述第一特征图和与所述第一特征图对应的第二特征图之间的误差，基于所述第一特征图与所述第二特征图的距离确定。
根据权利要求1所述的方法，其特征在于，根据所述期望参数，对所述第一深度学习模型进行剪枝，包括：

每次对所述第一深度学习模型中的多个神经网络层，去掉不同的指定数量的第一参量，获得多个第三深度学习模型，所述第一参量至少包括神经元、向量、卷积核或滤波器；

获取表征每个第三深度学习模型性能的评价参数，所述性能至少包括第三深度学习模型的大小、运行速度和运行精度；

基于所述评价参数与所述期望参数，确定所述第一深度学习模型中，需要裁剪的第一参量。
根据权利要求8所述的方法，其特征在于，基于所述评价参数与所述期望参数，确定所述第一深度学习模型中，需要裁剪的第一参量，包括：

获取所述评价参数与所述期望参数的距离；

对所述距离进行排序；

基于所述距离排序结果，确定需要裁剪的第一参量。
根据权利要求3或8所述的方法，其特征在于，所述指定数量为1。
根据权利要求1所述的方法，其特征在于，根据所述期望参数，对所述第一深度学习模型进行剪枝，包括：

基于NAS方式，对所述第一深度学习模型进行自动剪枝。
一种深度学习模型的获取方法，其特征在于，包括：

获取第一深度学习模型和所述深度学习模型的期望裁剪量；

根据所述期望裁剪量，确定所述第一深度学习模型的每个神经网络层的第一参量的裁剪量，所述第一参量至少包括神经元、向量、卷积核或滤波器中的一个；

每次对所述第一深度学习模型中需要剪枝的第一神经网络层，去掉不同的指定数量的第一参量，获得所述第一神经网络层之后的第二神经网络层所输出的第一特征图，所述第二神经网络层为所述第一神经网络层去掉所述指定数量的第一参量前后，输出的特征图尺寸未发生变化的神经网络层；

获得多个所述第一特征图和与所述第一特征图对应的第二特征图之间的误差，所述第二特征图为所述第二神经网络层在所述第一神经网络层未去掉所述指定数量的第一参量之前所输出的特征图；

基于所述期望裁剪量和所述多个误差，确定需要裁剪的第一参量；

对所述需要裁剪的第一参量进行裁剪，获得第二目标深度学习模型。
根据权利要求12所述的方法，其特征在于，所述期望裁剪量根据表征深度学习模型性能的期望参数确定，所述深度学习模型性能至少包括所述深度学习模型的大小、运行速度和运行精度。
根据权利要求13所述的方法，其特征在于，所述期望裁剪量根据表征深度学习模型性能的期望参数确定，包括：

根据所述期望参数，确定对所述第一深度学习模型的每个神经网络层的第一参量进行裁剪的比例；

根据所述比例和所述第一深度学习模型，确定所述第一深度学习模型的每个神经网络层的第一参量的裁剪数量。
根据权利要求12所述的方法，其特征在于，根据所述期望裁剪量，确定所述第一深度学习模型的每个神经网络层的第一参量的裁剪量，包括：

基于预设的分配策略，向所述第一深度学习模型的每个神经网络层分配不同的裁剪量，所述不同的裁剪量使得对所述第一深度学习模型进行裁剪后，所获得的深度学习模型的总裁剪量在所述期望裁剪量的预设误差范围之内；

或者，

分别向所述第一深度学习模型的多个神经网络层分配相同的裁剪量，所述相同的裁剪量使得对所述第一深度学习模型进行裁剪后，所获得的深度学习模型的总裁剪量在所述期望裁剪量的预设误差范围之内。
根据权利要求12所述的方法，其特征在于，基于所述期望裁剪量和所述多个误差，确定需要裁剪的第一参量，包括：

对所述多个误差进行排序；

基于所述排序结果，保留误差最小的所述期望裁剪量的第一参量。
根据权利要求12所述的方法，其特征在于，所述指定数量为1。
根据权利要求12所述的方法，其特征在于，所述第一特征图和与所述第一特征图对应的第二特征图之间的误差，基于所述第一特征图与第二特征图的距离确定。
根据权利要求12所述的方法，其特征在于，所述方法还包括：

基于与所述第一深度学习模型相同的训练数据和损失函数，对所述第二目标深度学习模型进行训练。
一种深度学习模型获取系统，其特征在于，所述系统包括第一平台和第二平台；

所述第一平台，用于基于权利要求1至19任一所述的方法，获取所述目标深度学习模型；

所述第二平台，用于部署所述目标深度学习模型；

所述平台至少包括以下之一：服务器集群、服务器、移动终端。
一种深度学习模型获取装置，其特征在于，所述装置包括：存储器和处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现权利要求1至19任一所述的方法。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有若干计算机指令，所述计算机指令被执行时实现权利要求1至19任一所述方法的步骤。