WO2022022417A1

WO2022022417A1 - 一种校准方法、装置、终端设备及存储介质

Info

Publication number: WO2022022417A1
Application number: PCT/CN2021/108133
Authority: WO
Inventors: 李康; 丁瑞强; 李涵; 祝夭龙
Original assignee: 北京灵汐科技有限公司
Priority date: 2020-07-29
Filing date: 2021-07-23
Publication date: 2022-02-03
Also published as: US20230196197A1; CN111915017B; US11816547B2; CN111915017A

Abstract

一种校准方法、装置、终端设备及存储介质。所述方法包括：确定模型中每个待校准层的层属性信息（S110）；根据总可用资源和各所述待校准层的层属性信息，确定每个所述待校准层所在的组（S120）；其中，任意所述待校准层的层属性信息包括层所需资源，所述层所需资源为对该待校准层进行校准时所需占用的资源；所述总可用资源为用于进行校准的总资源。利用该方法，可在总可用资源能够支持的前提下，对所有待校准层进行合理分组，使各次校准操作中的层所需的资源尽量均衡且较大，从而充分利用资源，进而减少校准操作的次数，提升了模型校准时的计算速度。

Description

一种校准方法、装置、终端设备及存储介质

技术领域

本发明涉及数据处理技术领域，尤其涉及一种校准方法、校准装置、终端设备及计算机可读存储介质。

背景技术

模型量化是深度学习领域一种常用的技术，通过将模型参数和输入从高精度量化为低精度，如从float32(浮点32位)量化为int8(整型8位)，可以提高模型运算速度并减小模型大小。

为了降低模型量化过程中精度的损失，需要对模型进行校准，即将典型应用数据输入模型中(模型推理)，以得到各待校准层(可由用户指定)产生的、需进行量化的数据的动态范围，再根据该动态范围确定量化因子(统计量计算)。而量化因子用于进行量化。

深度学习技术的模型计算量大，各层产生的数据维度大(张量大、尺寸大)，对数据进行校准所需的内存多；校准装置内存有限，无法一次校准所有待校准层。目前的校准算法中，通常是按照模型中数据传输的方向，对模型的各待校准层依次进行校准，每次固定校准一层或相邻的多层。

但不同待校准层在校准中所需的内存不同，可能导致部分校准操作中的待校准层所需的内存已接近校准装置上限，另一些校准操作中的待校准层所需的内存还很小，无法充分利用校准装置的资源，所需校准次数多，时间长。

发明内容

本发明实施例提供了一种校准方法、校准装置、终端设备及计算机可读存储介质，提升了模型校准时的速度。

第一方面，本发明实施例提供了一种校准方法，其包括：确定模型中每个待校准层的层属性信息；根据总可用资源和各所述待校准层的层属性信息，确定每个所述待校准层所在的组；其中，任意所述待校准层的层属性信息包括层所需资源，所述层所需资源为对该待校准层进行校准时所需占用的资源；所述总可用资源为用于进行校准的总资源。

在一些实施例中，所述根据总可用资源和各所述待校准层的层属性信息，确定每个所述待校准层所在的组，包括：从没有所在组的所述待校准层中，确定所述层所需资源最大的待校准层为目标层；至少根据所述目标层的层属性信息，确定所述目标层所在的组；从所述目标层所在的组的组可用资源中，减去所述目标层的层所需资源；若仍存在没有所在组的所述待校准层，则返回所述从没有所在组的所述待校准层中，确定所述层所需资源最大的待校准层为目标层的步骤。

在一些实施例中，所述至少根据所述目标层的层属性信息，确定所述目标层所在的组包括：若存在组可用资源大于或等于目标层的层所需资源的组，则从中选择一个为目标层所在的组；若不存在组可用资源大于或等于目标层的层所需资源的组，则创建一个组，并确定该组为目标层所在的组，设定该组的组可用资源等于所述总可用资源。

在一些实施例中，所述若存在组可用资源大于或等于目标层的层所需资源的组，则从中选择一个为目标层所在的组包括：从组可用资源大于或等于目标层的层所需资源的组中，确定代价值最小的组为目标层所在的组；其中，任意所述组的代价值为该组的第一时间与第二时间的差值，所述第一时间为对该组中当前所有的待校准层和所述目标层进行校准所需的时间，所述第二时间为对该组中当前所有的待校准层进行校准所需的时间。

在一些实施例中，所述从组可用资源大于或等于目标层的层所需资源的组中，确定代价值最小的组为目标层所在的组包括：确定每个组的最大顺序号；任意所述组的最大顺序号为该组的所有待校准层的顺序号的最大值，任意待校准层的顺序号为该待校准层在模型中按照预设处理顺序的排序；若存在最大顺序号大于所述目标层的顺序号的组，则从中选择一个为目标层所在的组；若不存在最大顺序号大于目标层的顺序号的组，确定最大顺序号的值最大的组为目标层所在的组。

在一些实施例中，所述资源为内存。

在一些实施例中，在所述根据总可用资源和各所述待校准层的层属性信息，确定每个所述待校准层所在的组后，还包括：选择一个未校准的组，对该组中所有的待校准层进行校准；若仍存在未校准的组，则返回所述选择一个未校准的组，对该组中所有的待校准层进行校准的步骤。

第二方面，本发明实施例提供了一种校准装置，其包括：第一确定模块，用于确定模型中每个待校准层的层属性信息；第二确定模块，用于根据总可用资源和各所述待校准层的层属性信息，确定每个所述待校准层所在的组。

第三方面，本发明实施例提供了一种终端设备，其包括：一个或多个处理器；存储装置，用于存储一个或多个程序；当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本发明实施例提供的任意一种校准方法。

第四方面，本发明实施例提供了一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序所述计算机程序被处理器执行时实现本发明实施例提供的任意一种校准方法。

本发明实施例提供了一种校准方法、装置、终端设备及存储介质，其中首先确定模型中每个待校准层的层属性信息(层所需资源)；然后根据各待校准层的层所需资源和总可用资源，确定待校准层的分组，即确定各次校准操作对应的待校准层。利用上述技术方案，可在总可用资源能够支持的前提下，对所有待校准层进行合理分组，尽量使各次校准操作中的层所需的资源尽量均衡且较大，从而充分利用资源，在大部分情况下可减少校准操作的次数(减少组的个数)，提升了模型校准时的计算速度。

附图说明

图1为本发明实施例提供的一种校准方法的流程示意图。

图2为本发明实施例提供的一种校准方法中确定待校准层所在组的过程示意图。

图3为本发明实施例提供的一种校准装置的结构示意图。

图4为本发明实施例提供的一种终端设备的结构示意图。

图5为本发明实施例提供的一种计算机可读存储介质的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

在更加详细地讨论示例性实施例之前应当提到的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理，但是其中的许多操作可以被并行地、并发地或者同时实施。此外，各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止，但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。此外，在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

本发明使用的术语“包括”及其变形是开放性包括，即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”。

需要注意，本发明中提及的“第一”、“第二”等概念仅用于对相应内容进行区分，并非用于限定顺序或者相互依存关系。

需要注意，本发明中提及的“一个”、“多个”的修饰是示意性而非限制性的，本领域技术人员应当理解，除非在上下文另有明确指出，否则应该理解为“一个或多个”。

第一方面，本发明实施例提供了一种校准方法。

本发明实施例的校准方法可应用至模型量化场景，即校准方法用于对模型中的待校准层进行校准，以得到各待校准层的量化因子，量化因子可以用于实现模型量化。

本发明实施例的校准方法可由校准装置来执行，其中校准装置可由软件和/或硬件实现，并一般集成在终端设备上，在本发明实施例中终端设备包括但不限于：手机、电脑和个人数字助理等设备。

其中，模型是按照深度学习技术建立的任何运算模型，例如神经网络模型等。每个模型可处理一定的问题，如图像识别、语音识别等。而每个模型包括多个依次设置的层，每个层可对进入其中的数据(如输入模型的数据，或前一层输出的数据)进行一定处理(如卷积处理、全连接处理等)，并将产生的数据向后输出(如输出至下一层，或从模型输出)。

其中，待校准层是模型中需要进行校准(得到量化因子)的层，其可以是模型中的所有层或部分层。待校准层可通过用户指定等方式确定，本发明对其不进行限定。

图1为本发明实施例提供的一种校准方法的流程示意图，所述校准方法包括以下步骤S110至S120。

S110、确定模型中每个待校准层的层属性信息。

其中，任意所述待校准层的层属性信息包括层所需资源，所述层所需资源为对该待校准层进行校准时所需占用的资源。

本步骤中首先确定各待校准层的层属性信息，其确定的具体手段不作限定，如可基于待校准层的配置(如输入数据的尺寸、卷积核的尺寸、移动步长、函数的参数等)确定。

其中，层属性信息至少包括层所需资源，即，在进行校准操作的过程中，用于对该待校准层产生的数据进行处理的资源，也就是该待校准层在单次的校准操作中必须“占用”的资源。

在一些实施例中，资源包括内存。

作为本发明实施例的一种方式，所有资源(总可用资源、层所需资源、组可用资源等)至少包括内存资源。当然，以上各资源还可包括其它类型的资源，如处理器的运算资源等。

S120、根据总可用资源和各所述待校准层的层属性信息，确定每个所述待校准层所在的组。

其中，所述总可用资源为用于进行校准的总资源。

根据每次校准操作中可利用的总资源(总可用资源)，以及各待校准层在被校准时所需的资源(层所需资源)，将各待校准层分入不同的组中，即在本公开实施例的校准方法中，在实际进行校准操作之前，可预先确定在每次校准操作中应对哪些层进行校准。

从而，对每个组中的待校准层，可在同一次校准操作中校准。

其中，分入每个组中的所有待校准层的层所需资源之和不能大于总可用资源(否则该次校准操作无法进行)，但应满足该要求的基础上尽量较大，以使分入每个组的待校准层尽可能充分利用总可用资源，保证分入每个组的待校准层的平均数尽量较多，即所需的组的个数(即校准操作的次数)较少。

其中，总资源可以是校准装置所具有的所有资源，也就是校准装置在每次校准操作中能提供的总资源。当然，在不同次的校准操作中，校准装置的资源(总可用资源)是可被反复利用的。

本发明实施例中，首先确定模型中每个待校准层的层属性信息(层所需资源)；然后根据各待校准层的层所需资源和总可用资源，确定待校准层的分组，即确定各次校准操作对应的待校准层。利用上述技术方案，可在总可用资源能够支持的前提下，对所有待校准层进行合理分组，尽量使各次校准操作中的层所需的资源尽量均衡且较大，从而充分利用资源，在大部分情况下可减少校准操作的次数(减少组的个数)，提升了模型校准时的计算速度。

参照图1，在一些实施例中，在所述根据总可用资源和各所述待校准层的层属性信息，确定每个所述待校准层所在的组(S120)后，还包括以下步骤S130至S140。

S130、选择一个未校准的组，对该组中所有的待校准层进行校准。

S140、若仍存在未校准的组，则返回所述选择一个未校准的组，对该组中所有的待校准层进行校准的步骤。

在确定完分组后，可开始校准过程，而每次校准操作中，对且仅对一个组中的所有待校准层进行，而对不同组中的待校准层则分别校准(即多次校准操作)。

如前，相对于每次对预定次序、预定个数的待校准层进行校准的相关技术，根据本发明实施例的方式，可使每次校准操作的资源被尽量充分的利用，即每次校准操作中尽量对较多的待校准层进行校准，从而在大部分情况下分组的个数较少，也就是校准的次数少，所需的总时间少。

在一些实施例中，所述根据总可用资源和各所述待校准层的层属性信息，确定每个所述待校准层所在的组(S120)，包括：从没有所在组的所述待校准层中，确定所述层所需资源最大的待校准层为目标层；至少根据所述目标层的层属性信息，确定所述目标层所在的组；从所述目标层所在的组的组可用资源中，减去所述目标层的层所需资源；若仍存在没有所在组的所述待校准层，则返回所述从没有所在组的所述待校准层中，确定所述层所需资源最大的待校准层为目标层的步骤。

其中，“没有所在组的待校准层”是指，在进行以上步骤时，尚未被分入某个组中的待校准层，也就是尚未作为目标层进行以上分组后的待校准层。

参照图2，具体进行分组的过程可包括：从当前尚未分组的待校准层中，选择层所需资源(如在校准操作中占用的内存)最大的一个为当前的目标层，并对该目标层进行分组，且在分组后，从该组的组可用资源(即对应该组的还未被“占用”的资源)中，减去该目标层的层所需资源；之后判断是否仍存在没有所在组的所述待校准层，若是则重新从未分组的待校准层选择目标层(当然之前的目标层已分组，故不再属于未分组的待校准层)，若否则结束。

参照图2，对每个目标层的分组过程可包括：若当前已存在的组中，有一个或多个组的组可用资源比目标层的层所需资源大(即当前有能容纳目标层的组)，即可将目标层分入这样的组中(后续从其组可用资源中减去目标层的层所需资源)；若不存在以上的组(即当前没有能容纳目标层的组)，则需要“新建”一个组(即要求新增一次校准过程)，并将目标层分入该新增的组中，且设定该新增的组的组可用资源的数值等于总可用资源(后续从其组可用资源中减去目标层的层所需资源)。

参照图2，当存在能容纳目标层的组时，可将目标层分入其中代价值最小的组中(当然，若仅存在一个能容纳目标层的组，则其必然就是代价值最小的组)。

其中，一个组的“代价值”表示，当把目标层分入该组后，该组对应的校准操作的时间，相对于在将目标层分入该组之前，该组对应的校准操作的时间的“增量”。

也就是说，当要把目标层分入已有的组中时，应当保证分入后，该组对应的校准操作时间不增长或增长的较小，以缩短校准的时间。

其中，待校准层的顺序号表示待校准层在模型中，按照预设的数据传输方向所处的位置，如代表待校准层是模型中的第一层L1(即顺序号为1)、第二层L2(即顺序号为2)、第三层L3(即顺序号为3)、第四层L4(即顺序号为4)等。

作为本发明实施例的一种方式，具体可根据“顺序号”确定组的的代价值。即，若部分组(当然是能容纳目标层的组)中，已有的待校准层的最大的顺序号(组的最大顺序号)比目标层的顺序号更大，则将目标层分入这样的组中；若是能容纳目标层的组中，已有的待校准层的顺序号均比目标层的顺序号小，则选择一个最大顺序号的值最大的组为目标层所在的组。

在校准中，需要将典型数据输入至模型所在的装置，运行模型，以使其各待校准层产生用于校准的数据，并输入至校准装置。而任意一次校准操作对应的待校准层，若仅为模型中的部分层，则该次校准操作不必运行模型的所有层，而只要运行至其对应的顺序号最大的待校准层即可(当然该顺序号最大的待校准层之前的所有层，不论是否校准都必须运行)。

由此，如果目标层的顺序号比一个组中已有待校准层的最大顺序号(即该组的校准操作中需运行到的最后一层)小，则将目标层分入该组中后，相应校准操作中并不用使模型运行“更多层”，从而模型的运行时间没有增加，也就是校准操作的实际时间没有增加，即该组的代价值为0(或接近于0)。

相应的，如果目标层的顺序号比任意组的最大顺序号都大，则应当将其分入最大顺序号的值最大的组，以保证目标层分入后，相应校准操作中模型“多运行”的层数最少，即代价值最小。

示例性的，本发明提供的校准方法可抽象为一个装箱问题。

例如，假设模型有依次设置的四个层L1、L2、L3、L4，其全部为待校准层，而校准装置的总内存为16G。

其中，每个组(每次校准操作)对应一个箱子，总可用资源(每次校准操作可用的资源，如内存)相当于各箱子的容量(也可理解为箱子可反复使用)；而每个待校准层相当于一堆沙子，其层所需资源(其在校准操作中所需占用的资源，如内存)相当于沙子的量。而将待校准层分组的过程，相当于将每堆沙子装入一个相应的箱子，每次装入后箱子的剩余空间(即组可用资源，如内存)减小，且该过程中应保证每个箱子的沙子不会“溢出”，同时尽量使每个箱子装满，以减少所需箱子的总数量。

由此，将沙子装入箱子的规则如下：

首先，确定各待校准层所需的内存大小(即确定各堆沙子的大小)，然后，按照内存从大到小的顺序，将每一待校准层在已开的箱子(就是指，单次校准操作可承受的内存)中，挑选代价值最小的一个箱子装入；或者是当已开的箱子装不下某一待校准层的时候，打开一个新的箱子。

代价值最小是指，当这个箱子再装入这一待校准层时，其对应的校准操作的总体计算时长不会增长或增长较小。其中，计算时长可按照模型中数据传输的顺序(顺序号)来决定的，例如，L4的计算时长大于L3、L3的计算时长大于L2、L2的计算时长大于L1。也就是说，按照数据传输的顺序，靠后的待校准层的计算时长大于靠前的待校准层的计算时长。

示例性的，本发明提供的校准方法的执行主体可以为编译器的校准装置，校准方法包括如下步骤：

S1，计算L1～L4每层所需的内存，如L1、L2、L3、L4所需的内存分别为8G、1G、10G、0.5G(即四堆沙子的量)。确定每次校准操作中可用的内存为16G(即每个箱子的容量)。

S2，按照内存从大到小对各待校准层进行排序，L3—L1—L2—L4。

S3，装L3(按内存从大到小的顺序装)，由于此时没有箱子，故先开第一个箱子，将L3放入第一个箱子中，第一个箱子剩余6G。

S4，装L1，由于第一个箱子装L3后剩余6G，无法再容纳L1(8G)，因此，再开第二个箱子，将L1放入第二个箱子中，第二个箱子剩余8G。

S5，装L2，通过遍历两个已开的箱子，发现两个箱子都可以装L2，那么需要对装入的代价值进行计算，第一个箱子中已装的是L3，位于L2之后，故当L2装入第一个箱子后，计算时长不会增长，即代价值为0；而第二个箱子中已装的L1位于L2之前，当L2装入第二个箱子后，计算时长会变为L2的计算时长，代价值较大；因此，将L2装入第一个箱子中，第一个箱子剩余5G。

S6，装L4，同样，两个箱子均可容纳L4，而且，第一个箱子放入L4之后，代价值是从L3的计算时(第二时间)长变为L4的计算时长(第一时间)，这个代价值比L4装入第二个箱子的代价值(从L2的计算时长变为L4的计算时长)小，因此，将L4装入第一个箱子，第一个箱子剩余4.5G。

S7，以箱子为单位依次对各箱子中的各待校准层进行校准，如在第一次校准操作中对第一个箱子中的L2、L3、L4进行校准，在第二次校准操作中对第一个箱子中的L1进行校准，以确定对应的量化因子。

第二方面，如图3所示，本发明实施例提供了一种校准装置30，该装置30可适用于对模型中待校准层进行校准的情况，其中该装置30可由软件和/或硬件实现，并一般集成在终端设备上。

该装置30包括：

第一确定模块31，用于确定模型中每个待校准层的层属性信息；

第二确定模块32，用于根据总可用资源和各所述待校准层的层属性信息，确定每个所述待校准层所在的组。

本发明实施例的校准装置30可实现本发明实施例中任一项所述的校准方法。

在一些实施例中，所述资源为内存。

第三方面，参照图4，本发明实施例提供一种终端设备40。

终端设备40包括：一个或多个处理器41(图4中以一个处理器41为例)和存储装置42；存储装置42用于存储一个或多个程序；所述一个或多个程序被所述一个或多个处理器41执行，使得所述一个或多个处理器41实现如本发明实施例中任一项所述的校准方法。

所述终端设备40还可以包括：输入装置43和输出装置44。

终端设备40中的处理器41、存储装置42、输入装置43和输出装置44可以通过总线或其他方式连接，图4中以通过总线连接为例。

该终端设备40中的存储装置42作为一种计算机可读存储介质，可用于存储一个或多个程序，所述程序可以是软件程序、计算机可执行程序以及模块，如本发明实施例提供的校准方法对应的程序指令/模块(例如，图3所示的校准装置30中的模块，包括：第一确定模块31、第二确定模块32)。处理器41通过运行存储在存储装置42中的软件程序、指令以及模块，从而执行终端设备40的各种功能应用以及数据处理，即实现上述方法实施例中的校准方法。

存储装置42可包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端设备40的使用所创建的数据等。此外，存储装置42可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储装置42可进一步包括相对于处理器41远程设置的存储器，这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置43可用于接收输入的数字或字符信息，以及产生与终端设备40的用户设置以及功能控制有关的键信号输入。输出装置44可包括显示屏等显示设备。

第四方面，参照图5，本发明实施例提供了一种计算机可读存储介质50，其上存储有计算机程序，该计算机程序被处理器执行时用于执行本发明实施例任意一项的校准方法

本发明实施例的计算机存储介质，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质50。计算机可读存储介质50例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质50的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(Random Access Memory，RAM)、只读存储器(Read Only Memory，ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory，EPROM)、闪存、光纤、便携式CD-ROM、光存储器件、磁存储器件、或者上述的任意合适的组合。计算机可读存储介质50可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于：电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质50以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、无线电频率(Radio Frequency，RF)等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

一种校准方法，其特征在于，包括：

确定模型中每个待校准层的层属性信息；

根据总可用资源和各所述待校准层的层属性信息，确定每个所述待校准层所在的组；

其中，任意所述待校准层的层属性信息包括层所需资源，所述层所需资源为对该待校准层进行校准时所需占用的资源；所述总可用资源为用于进行校准的总资源。
根据权利要求1所述的方法，其特征在于，所述根据总可用资源和各所述待校准层的层属性信息，确定每个所述待校准层所在的组，包括：

从没有所在组的所述待校准层中，确定所述层所需资源最大的待校准层为目标层；

至少根据所述目标层的层属性信息，确定所述目标层所在的组；

从所述目标层所在的组的组可用资源中，减去所述目标层的层所需资源；

若仍存在没有所在组的所述待校准层，则返回所述从没有所在组的所述待校准层中，确定所述层所需资源最大的待校准层为目标层的步骤。
根据权利要求2所述的方法，其特征在于，所述至少根据所述目标层的层属性信息，确定所述目标层所在的组包括：

若存在组可用资源大于或等于目标层的层所需资源的组，则从中选择一个为目标层所在的组；

若不存在组可用资源大于或等于目标层的层所需资源的组，则创建一个组，并确定该组为目标层所在的组，设定该组的组可用资源等于所述总可用资源。
根据权利要求3所述的方法，其特征在于，所述若存在组可用资源大于或等于目标层的层所需资源的组，则从中选择一个为目标层所在的组包括：

从组可用资源大于或等于目标层的层所需资源的组中，确定代价值最小的组为目标层所在的组；

其中，任意所述组的代价值为该组的第一时间与第二时间的差值，所述第一时间为对该组中当前所有的待校准层和所述目标层进行校准所需的时间，所述第二时间为对该组中当前所有的待校准层进行校准所需的时间。
根据权利要求4所述的方法，其特征在于，所述从组可用资源大于或等于目标层的层所需资源的组中，确定代价值最小的组为目标层所在的组包括：

确定每个组的最大顺序号；任意所述组的最大顺序号为该组的所有待校准层的顺序号的最大值，任意待校准层的顺序号为该待校准层在模型中按照预设处理顺序的排序；

若存在最大顺序号大于所述目标层的顺序号的组，则从中选择一个为目标层所在的组；

若不存在最大顺序号大于目标层的顺序号的组，确定最大顺序号的值最大的组为目标层所在的组。
根据权利要求1至5中任意一项所述的方法，其特征在于，

所述资源为内存。
根据权利要求1所述的方法，其特征在于，在所述根据总可用资源和各所述待校准层的层属性信息，确定每个所述待校准层所在的组后，还包括：

选择一个未校准的组，对该组中所有的待校准层进行校准；

若仍存在未校准的组，则返回所述选择一个未校准的组，对该组中所有的待校准层进行校准的步骤。
一种校准装置，其特征在于，包括：

第一确定模块，用于确定模型中每个待校准层的层属性信息；

第二确定模块，用于根据总可用资源和各所述待校准层的层属性信息，确定每个所述待校准层所在的组。
一种终端设备，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
一种计算机可读存储介质，特征在于，上存储有计算机程序，其所述计算机程序被处理器执行时实现如权利要求1-7中任一所述的方法。