WO2022246986A1

WO2022246986A1 - 数据处理方法、装置、设备及计算机可读存储介质

Info

Publication number: WO2022246986A1
Application number: PCT/CN2021/106602
Authority: WO
Inventors: 顾佳昕; 吴佳祥; 沈鹏程; 李绍欣
Original assignee: 腾讯云计算（北京）有限责任公司
Priority date: 2021-05-27
Filing date: 2021-07-15
Publication date: 2022-12-01
Also published as: CN113762503A; US20230252294A1

Abstract

一种数据处理方法，装置、设备及计算机可读存储介质。其中方法包括：采用第一数据集对第一模型进行训练，采用第二数据集对第一模型进行训练；从N个网络层中确定第一目标网络层，对第一目标网络层进行量化；采用第二数据集对量化后的第一模型进行训练，从N个网络层中继续确定第二目标网络层，对第二目标网络层进行量化，直至N个网络层中不存在未量化的网络层，得到第二模型。可见，在对第一模型进行迭代训练过程中，通过对目标网络层进行量化来更新第一模型，实现了更好的模型量化。

Description

数据处理方法、装置、设备及计算机可读存储介质

本申请要求于2021年05月27日提交、申请号为202110583709.9、发明名称为“数据处理方法、装置、设备及计算机可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能领域，具体涉及一种数据处理方法、装置、设备及计算机可读存储介质。

背景技术

随着计算机技术的不断发展，越来越多的神经网络模型被应用于各类业务中；例如，人脸识别模型被应用于人脸检测，噪声优化模型被应用于降低噪声。研究发现，神经网络模型的表征能力与其规模(参数量，计算量)有着较强的正相关性；简单来说，规模较大的神经网络模型的预测结果的精确度优于规模较小的神经网络模型的预测结果的精确度。但是，规模越大的神经网络在部署时，对设备的配置参数要求越高，比如要求更大的存储空间，要求更高的运行速度等等。因此，为了将规模大的神经网络配置在存储空间有限或者功耗有限的设备中，需要对大规模的神经网络进行量化处理。目前，在人工智能领域中，如何对神经网络模型进行量化处理成为研究的热点问题之一。

发明内容

本申请实施例提供了一种数据处理方法、装置、设备及计算机可读存储介质，实现了模型量化。

一方面，本申请实施例提供了一种数据处理方法，包括：

采用第一数据集对第一模型进行训练，所述第一数据集包括第一数据以及所述第一数据的训练标签，所述第一数据是未经处理的数据，所述第一模型包括N个网络层，N为正整数；

采用第二数据集对所述第一模型进行训练，所述第二数据集包括第二数据以及所述第二数据的训练标签，所述第二数据是量化后的数据；

从所述N个网络层中确定第一目标网络层，所述第一目标网络层是未量化的网络层，对所述第一目标网络层进行量化；

采用所述第二数据集对量化后的所述第一模型进行训练，从所述N个网络层中确定第二目标网络层，所述第二目标网络层是未量化的网络层，对所述第二目标网络层进行量化，直至所述N个网络层中不存在未量化的网络层，得到第二模型。

一方面，本申请实施例提供了一种数据处理装置，包括：

获取单元，用于采用第一数据集对第一模型进行训练，所述第一数据集包括第一数据以及所述第一数据的训练标签，所述第一数据是未经处理的数据，所述第一模型包括N个网络层，N为正整数；

处理单元，用于采用所述第二数据集对所述第一模型进行训练；所述第二数据集包括第二数据以及所述第二数据对应的训练标签，所述第二数据是量化后的数据；以及用于从所述N个网络层中确定第一目标网络层，所述第一目标网络层是未量化的网络层，对所述第一目标网络层进行量化；以及用于采用所述第二数据集对量化后的所述第一模型进行训练，从所述N个网络层中确定第二目标网络层，所述第二目标网络层是未量化的网络层，对所述第二目标网络层进行量化，直至所述N个网络层中不存在未量化的网络层，得到第二模型。

相应地，本申请实施例还提供了一种数据处理设备，包括：存储装置和处理器；所述存储装置中存储有计算机程序；处理器，执行计算机程序，实现上述的数据处理方法。

相应地，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时，上述的数据处理方法被实现。

相应地，本申请提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中，计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述的数据处理方法。

在本申请实施例中，采用第一数据集对第一模型进行训练，采用第二数据集对第一模型进行训练；从N个网络层中确定第一目标网络层，对第一目标网络层进行量化；采用第二数据集对量化后的第一模型进行训练，从N个网络层中确定第二目标网络层，对第二目标网络层进行量化，直至N个网络层中不存在未量化的网络层，得到第二模型。可见，在对第一模型进行迭代训练过程中，通过对目标网络层进行量化来更新第一模型，能够减小神经网络模型的规模，从而实现了模型量化。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1a为本申请实施例提供的一种模型量化系统的结构示意图；

图1b为本申请实施例提供的另一种模型量化系统的结构图示意图；

图2为本申请实施例提供的一种数据处理方法的流程图；

图3为本申请实施例提供的另一种数据处理方法的流程图；

图4a为本申请实施例提供的一种预训练模型的更新流程图；

图4b为本申请实施例提供的一种量化模型的应用场景图；

图4c为本申请实施例提供的另一种量化模型的应用场景图；

图5为本申请实施例提供的一种数据处理装置的结构示意图；

图6为本申请实施例提供的一种数据处理设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。

本申请实施例涉及神经网络模型，在迭代训练过程中，通过分阶段在待训练模型中的多个待量化网络层中插入伪量化算子，得到待转换模型；将待转换模型进行转换，并对转换后的模型进行训练，最终得到待训练模型所对应的量化模型，以达到减小神经网络模型的规模的目的。

神经网络模型的表征能力与其规模(比如参数量、计算量)有着较强的正相关性，越深越宽的模型，其性能往往优于较小的模型。然而，一味地扩大模型大小，虽然能提高人脸识别的精度，但是对于模型的实际应用与部署造成了极大的障碍，尤其是在计算能力、功耗受限的移动设备上。因此，在训练得到一个全精度的预训练模型之后，各个部署该模型的设备会根据自身情况对预训练模型进行压缩处理后再部署，对模型的压缩处理可以理解为对模型进行量化。本申请实施例在模型量化研究过程中提出了以下几种模型量化方法：

1)后量化方案(post-quantization)：后量化方案先利用传统的深度神经网络模型训练方法，针对特定的模型结构、损失函数，训练得到一个全精度的模型，全精度的模型为未进行量化的模型。然后将模型的参数利用特定的量化方法，量化至约定的位数，如量化至int8，即整型化；接着利用少批量的训练数据，例如训练数据为2000张图像，或训练数据的数据量远小于训练集规模的数据量，得到模型中各个层输出的范围，即激活函数的值域大小，进而对模型中各个网络层的输出进行量化，最终得到的模型即量化后的模型，此时对某一层网络层而言，参与计算的模型参数与上一层的激活输出均为量化后的定点数，上一层的激活输出即为本层的输入。

2)量化感知训练方案(Quantization Aware Training，QAT)：在后量化方案的量化步骤中，模型参数仅仅被量化，无法将量化带来的精度损失考虑到训练过程中，针对量化本身调整模型参数，即未考虑量化对模型的精度带来的影响。为此，在量化感知的训练方案中，模型参数的后面与激活函数的后面均被插入伪量化节点，用于模拟量化过程。该方案能在训练过程模拟了量化后的处理，训练完即可得到量化后的模型，故能够很大程度的缩减量化带来的识别精度损失。

3)分阶段逐层量化的模型量化训练方案：量化感知训练过程中，不是一次性插入全部的伪量化节点，而是由浅至深，按照规则，分阶段、逐层插入伪量化节点。也就是说，每次对模型中的一层网络层进行量化后，会对模型进行训练，也即是对模型的参数进行调整。最终，当模型中所有需要量化的网络层量化完成，且模型收敛时，得到更新后的模型。

实践发现，上述3种方案中，后量化方案直接对全精度的模型进行后量化，无法保证量化后模型能够获得很好的识别效果。这是因为在全精度模型的训练过程中，没有将量化带来的误差考虑其中。而模型往往对准确率要求极高，模型量化带来的误差会导致错误的识别结果，其带来的损失不可估量。

量化感知训练的方案，能在一定程度上调整量化后模型参数，尽可能减少量化操作带来的误差，但是在实际操作中，伪量化算子的一次性插入会破坏训练的稳定性，使得模型无法收敛到最优点。这是因为量化操作对应的伪量化算子会降低模型的表征能力，表征能力过于剧烈的跳变会使得模型跳出原本收敛的最优点，而陷入其他次优点。

分阶段逐层量化的模型量化训练方案，分阶段插入的方式相比于一次性插入的方式，能够将模型表征能力的“巨变”切分为若干个“小跳变”。在插入伪量化节点后，后续层仍能够保留全精度的处理流程，能够逐步适应量化带来误差，渐进的调整自身的参数。这种“温和”的模型量化感知训练方式，能极大程度地减少量化误差对模型训练的干扰，使得通过该方法训练得到的量化模型，在得到模型大小缩减、推理速度提升的收益后，仍然能保持较高的识别精度，达到模型应用的实际要求。

由上述分析可知，分阶段逐层量化的模型量化训练方案在实际应用中效果更佳，因此本申请主要对分阶段逐层量化的模型量化训练方案进行详细介绍。基于分阶段逐层量化的模型量化训练方案本申请提供了一种模型量化系统，图1a为本申请实施例提供的一种模型量化系统的结构示意图，在图1a所示的模型量化系统中包括数据处理设备101和模型存储设备102，可选地，数据处理设备101和模型存储设备102均是终端，比如智能手机、平板电脑、便携式个人计算机、移动互联网设备(Mobile Internet Devices，MID)等设备，例如智能手机为Android手机、iOS手机等；或者，数据处理设备101和模型存储设备102均是服务器，比如独立的物理服务器，或者多个物理服务器构成的服务器集群或者分布式系统，或者提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network，内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。

在图1a中以数据处理设备101为终端，模型存储设备102为服务器为例进行示意。模型存储设备102主要用于存储训练完成的第一模型，该第一模型是模型存储设备102采用第一数据集进行训练的，或者是其他设备采用第一数据集训练完成后上传到模型存储设备102中存储的，第一数据集中包括全精度的第一数据以及第一数据的训练标签，全精度的第一数据是指未处理的第一数据。可选地，模型存储设备102是区块链网络中的一个节点，能够实现将第一模型存储在区块链中，区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。其本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，用区块链所串接的分布式账本能让多方有效记录交易，且可永久查验此交易(不可篡改)。区块链中的数据具有不可篡改性，将第一模型存储到区块链中能够保证第一模型的安全性。

当数据处理设备101中需要部署第一模型时，数据处理设备101首先获取数据处理设备的配置参数，比如存储空间、运行内存以及功耗情况等等；然后判断数据处理设备的配置参数与第一模型的部署条件是否匹配，如果匹配，则直接从模型存储设备102中获取第一模型，并将第一模型部署在数据处理设备中；如果数据处理设备的配置参数与第一模型的部署条件不匹配，则数据处理设备101采用上述提出的分阶段逐层量化的模型量化训练方案对模型存储设备102中获取的第一模型进行量化处理，得到量化模型，该量化模型的部署条件与数据处理设备的配置参数相匹配，进而将量化模型部署在数据处理设备101中。

后续，数据处理设备101采集待处理的数据，并调用量化模型对待处理的数据进行识别处理，输出识别结果。比如量化模型是人脸识别模型，数据处理设备101采集待识别人脸数据(即待处理的数据)，调用量化模型对待识别人脸数据进行识别处理，输出识别结果。

基于上述的模型量化系统，本申请实施例还提供另一种模型量化系统的结构示意图，如图1b所示。在图1b中，模型量化系统包括训练数据模块、全精度模型训练模块、分阶段量化感知训练模块、量化模型转换模块、量化模型执行模块，以及模型应用模块。其中，训练数据模块主要负责对全精度模型模块和分阶段量化感知训练模块所需要的数据进行预处理。可选地，在全精度模型训练阶段，训练数据模块为其提供原始的训练数据，该训练数据为预处理、归一化后的全精度形式；而在分阶段量化感知训练阶段，训练数据模块为其提供量化后的训练数据，该训练数据为预处理、归一化后的量化形式。需要说明的是，量化训练模块所需的数据预处理形式需要参考后续量化模型执行模块的一些限制，比如，常用的TNN(一种移动端深度学习推理框架)量化模型执行框架仅支持输入形式为范围-1至+1的对称量化形式，故该模块则需要将训练数据处理为相应的范围-1至+1的对称量化形式。

全精度模型训练模块为神经网络训练模块，用于为后续分阶段量化感知训练模块提供高精度的预训练模型。可选地，全精度模型训练步骤分为：0)初始化模型参数；1)获取特定大小的训练数据及其对应的标签；2)利用全精度的模型推理得到预测结果，并利用标签根据事先设计好的损失函数确定模型损失；3)根据损失确定各个参数的梯度；4)根据事先规定的方式更新模型参数；5)重复执行1)～4)直至模型收敛；6)得到全精度的第一模型，该第一模型为未量化的模型。

分阶段量化感知训练模块用于对第一模型中需要进行量化的网络层进行量化，由浅至深，按照规则，分阶段、逐层插入伪量化节点，得到更新后的第一模型。

量化模型转换模块用于对更新后的第一模型进行模型转换，得到量化模型。由于分阶段量化感知训练模块中得到的更新后的第一模型中包含伪量化算子，且模型参数仍为全精度，故需要进一步处理。量化模型执行模块用于对输入的待预测数据进行处理得到预测结果。相比于全精度的浮点数计算，量化后的定点数计算需要相应的处理器底层指令支持。量化模型执行模块利用量化模型转换模块中得到的量化模型，对输入数据进行推理，得到预测结果。以int8量化为例，开源项目TNN、NCNN(一种神经网络前向计算框架)等框架能够对int8数值计算做专门的底层支持与优化，以真正发挥模型量化的优点。模型应用模块用于将量化模型部署至数据处理设备中。

总结上述，图1b所示的模型量化系统在进行模型量化时，过程概括为如下：(1)分阶段量化感知训练模型从全精度模型训练模块获取第一模型，该第一模型包括N个网络层，第一模型是采用第一数据集对初始模型进行迭代训练得到的，可选地，第一数据集是由数据模块提供的，第一数据集包括全精度的第一数据以及第一数据的训练标签，全精度数据是指未经处理的原始数据，未经处理包括未经过量化处理、压缩处理、模糊处理或者裁剪处理等。(2)分阶段量化感知模块从数据模块获取第二数据集，并采用第二数据集对第一模型进行迭代训练，第二数据集包括量化的第二数据以及第二数据集对应的训练标签，对于信号来说，量化可以理解为将连续的信号转换为离散的信号；对于图像来说，量化可以理解为将图像的清晰度降低；对于数据来说，量化可以理解为将高精度数据转换为低精度数据。(3)在迭代训练过程中，若检测到当前迭代次数满足目标条件，例如当前迭代次数能被P整除，P为正整数，则从N个网络层中确定出未量化的目标网络层；在一个实施例中，目标网络层是由第一模型中的卷积层和全连接层组成的网络层集合中未被量化处理过的网络层；进一步地，对目标网络层进行量化，例如通过伪量化算子对目标网络层中的参数进行运算，并采用量化后的目标网络层更新第一模型；(4)采用第二数据集对更新后的第一模型进行训练，也即是将第二数据输入更新后的第一模型，并根据更新后的第一模型输出的结果和第二数据的训练标签，对更新后的第一模型的N个网络层的参数进行更新，得到第二模型。可以理解的是，通过重复执行步骤(3)和步骤(4)，即在迭代训练过程中，能够逐步对第一模型中需要进行量化的网络层进行量化，也即是分阶段进行量化，直至第一模型中所有需要进行量化的网络层均完成量化，且第一模型收敛，得到第二模型。进一步地，通过量化模型转换模块对第二模型进行量化转换，可选地，基于量化系数对第二模型中的网络参数进行量化转换，得到最终的量化模型。量化模型执行模块调用量化模型转换模块转换得到的量化模型对待处理数据进行处理，得到处理结果；例如，量化模型转换模块转换得到的量化模型是人脸识别模型，量化模型执行模块调用人脸识别模型对待识别人脸数据进行识别，得到人脸识别结果，待识别人脸数据即为待处理数据，人脸识别结果即为处理结果。此外，量化模型转换模块转换得到的量化模型还能够通过模型应用模块部署到数据处理设备中；例如，通过模型应用模块将人脸识别模型部署到摄像头中，人脸识别模型即为量化模型，摄像头即为数据处理设备。

请参阅图2，图2为本申请实施例提供的一种数据处理方法的流程图。该方法由一个数据处理设备来执行，本申请实施例的所述方法包括如下步骤：

S201、获取第一模型。

第一模型是指使用全精度的训练数据对初始模型训练完成的模型，初始模型是人脸识别模型、噪声识别模型、文本识别模型、疾病预测模型等。其中，第一模型是采用第一数据集对初始模型进行迭代训练得到的，第一数据集包括全精度的第一数据以及第一数据的训练标签，全精度数据是指未经处理的原始数据，未经处理包括未经过量化处理、压缩处理、模糊处理或者裁剪处理等，第一数据的训练标签用于对第一模型中的参数进行优化；可选地，第一模型是训练至收敛的全精度的模型，第一模型的训练过程包括：1)获取特定大小的训练数据，也即是获取第一数据集中的第一数据及其对应的标签；2)利用全精度的模型推理得到预测结果，并利用训练标签根据事先设计好的损失函数确定模型损失；3)根据损失确定各个参数的梯度；4)根据目标方式更新模型参数，以使优化后的模型的预测结果，相比于优化前更加接近第一数据的训练标签；5)重复执行1)～4)直至模型收敛；6)得到全精度的第一模型。

其中，第一模型包括N个网络层，N为正整数。

S202、获取第二数据集，采用第二数据集对第一模型进行训练。

第二数据集包括量化的第二数据以及第二数据对应的训练标签，第二数据对应的训练标签用于对第一模型中的参数进行优化。对于信号来说，量化可以理解为将连续的信号转换为离散的信号；对于图像来说，量化可以理解为将图像的清晰度降低；对于数据来说，量化可以理解为将高精度数据转换为低精度数据，如将浮点型数据转换为整型数据。

采用第二数据集对第一模型进行训练是指：将第二数据输入第一模型，并根据第一模型输出的结果和第二数据的训练标签，对第一模型的N个网络层的参数进行优化，使得优化后的模型的预测结果相比于优化前更加接近第二数据的训练标签。可选地，每次训练包括前向运算和反向运算，反向运算又称为后向运算；其中，前向运算是指，在训练数据输入第一模型后，通过第一模型的N个网络层中的神经元对输入的数据进行加权处理，并根据加权处理的结果输出训练数据的预测结果；反向运算是指，根据预测结果、训练数据对应的训练标签以及第一模型对应的损失函数，确定模型损失，并根据损失确定各个参数的梯度，进而对第一模型的参数进行更新，使得更新后的第一模型的预测结果相比于更新前，更趋近于训练数据对应的训练标签。

可选的，第二数据集是对第一数据集进行量化处理后得到的，在进行量化处理时，还需要考虑量化模型在执行时的限制；例如，常用的TNN量化模型执行框架仅支持输入形式为范围-1至+1的对称量化形式，故该模块则需要将训练数据处理为相应的范围-1至+1的对称量化形式。

根据上述步骤S201和步骤S202的内容可知，也即是数据处理设备采用第一数据集对第一模型进行训练，然后采用第二数据集对第一模型进行训练。其中，第一数据集包括第一数据以及第一数据的训练标签，第一数据是未经处理的数据，第二数据集包括第二数据以及第二数据的训练标签，第二数据是量化后的数据。其中，采用第一数据集对第一模型进行训练是指采用第一数据集对第一模型进行多次迭代训练，得到训练后的第一模型。

S203、在当前迭代次数满足目标条件的情况下，从N个网络层中确定第一目标网络层，对第一目标网络层进行量化，以及根据量化后的目标网络层更新第一模型。

其中，目标条件是确定目标网络层所需满足的条件。可选地，目标条件是由用户指定的；例如，用户指定在迭代次数为第3次，第5次，第11次，第19次或者第23次时，选取目标网络层，对目标网络层进行量化。可选地，目标条件由开发人员设定的，以使迭代次数满足一定规律；例如，开发人员设定每进行P次迭代，则选取目标网络层，对目标网络层进行量化，P为正整数；又例如，若当前迭代次数满足目标规律时，则选取目标网络层，对目标网络层进行量化，例如目标规律为等比数列或者等差数列等；目标条件还可以是，在数据处理设备检测到第一模型收敛的情况下，则选取目标网络层，对目标网络层进行量化。其中，第一目标网络层是指未量化的网络层。

在一种实施方式中，目标网络层是由用户指定的；例如，用户指定对第一模型的第3层网络层，第10层网络层和第15层网络层逐一进行量化。可选地，目标网络层是数据处理设备根据判断条件从第一模型中确定的，例如，数据处理设备按照由浅至深的顺序，逐一进行判断，例如数据处理设备当前判断的是第j层网络层，即前j-1层均不符合目标网络层的判断条件，j为正整数，且j小于等于N；在第j层网络层属于目标层，且第j层网络层未经过量化的情况下，则将第j层网络层确定为目标网络层，例如目标层为卷积层或者全连接层。

进一步地，数据处理设备对目标网络层进行量化的过程包括：获取量化系数，并基于该量化系数与第一参数确定伪量化算子，第一参数是指目标网络层中的参数，在一个实施例中，第一参数是指目标网络层中绝对值最大的参数；将第一参数与伪量化算子进行目标运算，并采用目标运算结果替换目标网络层中的参数，目标运算结果是指进行目标运算所得到的参数。根据量化后的目标网络层更新第一模型，例如，将第一模型中量化前的目标网络层替换为量化后的目标网络层，从而实现对第一模型进行更新。

在根据量化后的目标网络层更新第一模型后，第一模型中除目标网络层之外的一个或多个网络层中的参数也需要随之更新，以便于更新后的第一模型的预测结果更接近实际结果，实际结果是指第二数据的训练标签。

根据上述内容可知，数据处理设备对目标网络层进行量化的过程，也即是获取量化系数，基于量化系数构建伪量化算子，采用伪量化算子对第一参数进行运算，采用运算结果替换第一参数，第一参数是指第一目标网络层中的参数。

其中，伪量化算子为包括量化系数的函数，该伪量化算子用于对任一参数进行运算，来将该任一参数进行伪量化。可选地，伪量化算子包括量化算子和反量化算子。

S204、采用第二数据集对更新后的第一模型进行训练，得到量化模型。

在一种实施方式中，数据处理设备将第二数据输入更新后的第一模型，并根据更新后的第一模型输出的结果和第二数据的训练标签，对更新后的第一模型的网络层的参数进行更新，使得更新后的第一模型的预测结果更接近实际结果，进而得到量化模型，实际结果是指第二数据的训练标签。

可以理解的是，在迭代训练过程中，通过重复执行步骤S203和步骤S204，数据处理设备逐步对待量化网络模型中需要量化的网络层进行量化，也即是分阶段进行量化，即每次选择待量化网络模型中的一个需要量化的网络层进行量化，直至待量化网络模型中所有需要量化的网络层均完成量化，且第一模型收敛，得到最终的量化模型。实践发现，通过本申请提供的数据处理方法对模型进行处理，能够减小神经网络模型的规模，能够保留神经网络模型的表征能力，降低了直接对神经网络模型中的所有网络层进行量化带来的识别精度损失。

根据上述内容可知，数据处理设备执行多次迭代过程得到第二模型，也即是采用第二数据集对第一模型进行训练，从N个网络层中确定第一目标网络层，该第一网络层是未量化的网络层。数据处理设备对第一目标网络层进行量化，采用第二数据集对量化后的第一模型进行训练，从N个网络层中确定第二目标网络层，该第二目标网络层是未量化的网络层。数据处理设备对第二目标网络层进行量化，直至N个网络层中不存在未量化的网络层，得到第二模型。

在每次迭代过程中，数据处理设备采用第二数据集对第一模型进行训练，然后对目标网络层进行量化，得到量化后的第一模型，迭代过程停止的条件为N个网络层中不存在未量化的网络层。因此，在每次迭代过程中，数据处理设备都会在N个网络层中选取至少一个目标网络层进行量化，从而分阶段进行多次量化，采用量化和训练相交替的方式，循序渐进地将N个网络层中的所有网络层进行量化，使模型逐步适应量化带来误差，相比于一次性将所有网络层进行量化，本申请实施例的方案能够保留模型的表征能力，降低量化所导致的误差。

在本申请实施例中，获取第一模型，以及第二数据集，采用第二数据集对第一模型进行训练；从N个网络层中确定第一目标网络层，对第一目标网络层进行量化；采用第二数据集对量化后的第一模型进行训练，从N个网络层中确定第二目标网络层，对第二目标网络层进行量化，直至N个网络层中不存在未量化的网络层，得到第二模型。可见，在对第一模型进行迭代训练过程中，通过对目标网络层进行量化来更新第一模型，能够减小神经网络模型的规模，从而实现了模型量化。

请参阅图3，图3为本申请实施例提供的另一种数据处理方法的流程图。该方法由一个数据处理设备来执行，本申请实施例的所述方法包括如下步骤：

S301、获取第一模型。

在一种实施方式中，响应于在数据处理设备中部署第一模型的请求，数据处理设备获取第一模型，在获取第一模型后，数据处理设备根据自身的配置参数判断自身是否满足部署第一模型的部署条件，数据处理设备的配置参数包括存储空间、处理能力、功耗等；响应于数据处理设备的配置参数与第一模型的部署条件不匹配，则继续执行步骤S302-步骤S308，或者执行步骤S202-步骤S204，进而得到第一模型对应的量化模型，响应于量化模型的部署条件与数据处理设备的配置参数相匹配，部署该量化模型；相应地，在数据处理设备的配置参数与第一模型的部署条件匹配的情况下，则数据处理设备直接部署第一模型。

根据上述内容可知，在数据处理设备中部署模型的过程，也即是数据处理设备响应于数据处理设备的配置参数与第一模型的部署条件不匹配，获取第二数据集，从N个网络层中确定未量化的第一目标网络层，对第一目标网络层进行量化，得到更新后的第一模型，继续采用第二数据集对更新后的第一模型进行训练，从N个网络层中继续确定未量化的第二目标网络层，对第二目标网络层进行量化，直至N个网络层中不存在未量化的网络层，得到第二模型。数据处理设备基于量化系数对第二模型中的网络参数进行量化转换，得到量化模型，该量化模型的部署条件与数据处理设备的配置参数相匹配。数据处理设备将量化模型部署在数据处理设备中。

其中，基于量化系数对第二模型中的网络参数进行量化转换的过程详见下述步骤S307，在此暂不作说明。

S302、获取第二数据集，采用第二数据集对第一模型进行训练。

步骤S301和步骤S302的实施方式可参考图2中步骤S201和步骤S202中的实施方式，在此不再赘述。

S303、在当前迭代次数满足目标条件的情况下，从N个网络层中确定第一目标网络层。

在一种实施方式中，N个网络层中包括按照顺序连接的M个卷积层和W个全连接层，M和W为正整数，且M和W均小于N。数据处理设备按照顺序从M个卷积层和W个全连接层中，选择未进行量化的网络层，并将选择的网络层作为第一目标网络层。例如，第一模型中第3层-第7层为卷积层，第21层-第23层为全连接层，且第3层和第4层已进行过量化处理，则数据处理设备按照由浅至深的顺序，将第5层确定为目标待量化网络层。

S304、获取量化系数，基于量化系数与第一参数确定伪量化算子。

在一种实施方式中，第一参数的数量为至少一个，第一参数为第一目标网络层中的参数。数据处理设备获取量化系数的过程包括：确定量化位数，量化位数是由用户根据量化需求设定的，或者是由开发人员预先设置好的；并从至少一个第一参数中确定满足绝对值要求的目标第一参数。在一个实施例中，目标第一参数是至少一个第一参数中，绝对值最大的第一参数。进一步地，数据处理设备将目标第一参数和量化位数代入量化系数运算规则中进行运算，得到量化系数。

在得到量化系数后，数据处理设备基于量化系数和第一参数确定伪量化算子。在一个实施例中，数据处理设备将第一参数和量化系数进行相除运算，采用取整函数对相除运算结果进行取整运算，再将取整运算结果与量化系数进行相乘运算，得到伪量化算子，可选地，确定方法如下述公式1所示。

公式1：

其中，Q表示伪量化算子，R为第一参数，D表示量化系数，round()函数表示取整，即大于或者等于0.5的部分向上进位，反之则舍去。在一个实施例中，

MAX＝max(abs(R))；abs()为绝对值函数，abs(R)表示求R的绝对值，max(abs(R))即目标第一参数，也即是绝对值最大的第一参数，L为量化位数，对于整形化而言，L＝8，即量化位数为8位。

从公式1能够看出，伪量化算子是基于量化系数构建的。并且，从量化系数的公式能够看出，数据处理设备是根据目标第一参数和量化位数来确定量化系数的，该量化系数与目标第一参数正相关，该量化系数与量化位数负相关。

S305、将第一参数与伪量化算子进行运算，采用运算结果替换第一目标网络层中的第一参数。

在一种实施方式中，数据处理设备在得到伪量化算子后，将伪量化算子与第一参数进行运算，得到运算结果，该运算结果包括第一目标网络层中各个参数对应的量化后的参数，该运算包括相乘或者相除等，第一参数即第一目标网络层中的参数，采用量化后的参数替换掉第一目标网络层中的参数，得到量化后的第一目标网络层。

其中，将第一参数与伪量化算子进行运算是指采用伪量化算子对第一参数进行运算。上述步骤S305，也即是采用伪量化算子对第一参数进行运算，采用运算结果替换所述第一参数。

S306、采用第二数据集对更新后的第一模型进行训练，得到第二模型。

在一种实施方式中，数据处理设备根据量化后的目标网络层更新第一模型，得到更新后的第一模型。即在更新目标网络层后，采用第二数据集对更新后的第一模型进行训练，也即是对更新后的第一模型进行参数调整，得到第二模型。也就是说，当数据处理设备根据伪量化算子更新第一模型中的一层网络层的参数后，可能会对其他网络层造成影响，因此每更新一层网络层的参数，需要采用第二数据集对更新后的第一模型进行训练，来调整第一模型中的参数，以使得更新后的第一模型的预测结果更接近实际结果，这里所说的实际结果是指第二数据的训练标签。

进一步地，数据处理设备采用第二数据集对更新后的第一模型进行训练过程中，在当前迭代次数满足目标条件，且N个网络层中存在待量化的网络层的情况下，将待量化的网络层确定为目标网络层，触发执行对目标网络层进行量化的步骤。

也就是说，在迭代训练过程中，通过重复执行步骤S303-步骤S306，数据处理设备能够逐步对待量化网络模型中需要进行量化的网络层进行量化，也即是分阶段进行量化，即每次选择待量化网络模型中的一个需要进行量化的网络层进行量化，直至待量化网络模型中所有需要进行量化的网络层均完成量化，且第一模型收敛，得到最终的量化模型。实践发现，通过本申请提供的数据处理方法对模型进行处理，能够减小神经网络模型的规模，保留了神经网络模型的表征能力，降低了直接对神经网络模型中的所有网络层进行量化带来的识别精度损失。

上述步骤S306，也即是继续采用第二数据集对量化后的第一模型进行训练，从N个网络层中确定第二目标网络层，第二目标网络层是未量化的网络层，对第二目标网络层进行量化，直至N个网络层中不存在未量化的网络层，得到第二模型。

图4a为本申请实施例提供的一种第一模型的更新流程图。如图4a所示，第一模型的更新流程包括Step1-Step7：

Step1:数据处理设备获取第一模型，可选地，该第一模型的参数是全精度模型训练模块采用训练数据模块中的全精度数据集对初始模型进行预训练得到的，全精度数据集即第一数据集。

Step2:数据处理设备根据分阶段量化规则，确定伪量化节点的插入时机以及插入位置，插入时机是指触发确定目标网络层，对目标网络层进行量化的目标条件。本申请提出的分阶段逐层量化方案对应的示例规则为：由浅层至深层，每隔N步在需要量化的网络层的关联位置处插入伪量化算子，以模拟实际的量化操作。例如，在两层网络层之间插入伪量化算子。其中，一步是指对模型进行一轮前向运算和反向运算，也即是将训练数据输入模型，得到预测结果，根据预测结果和训练数据的标签对模型进行更新。

Step3:在Step2中数据处理设备判定当前网络层中需要插入伪量化算子的情况下，则根据上述公式1插入当前网络层对应的伪量化算子，也即是通过伪量化算子对当前网络层的参数进行更新，实施方式可参考步骤S304和步骤S305，在此不再赘述。

Step4:数据处理设备获取训练数据，可选地，该训练数据是由训练数据模块提供的训练数据，例如训练数据是训练数据模块对全精度数据进行量化后得到的。

Step5：数据处理设备在带有伪量化算子的第一模型中进行前向处理，确定损失函数。

Step6：数据处理设备根据损失函数确定预训练模型中各个参数的梯度，更新第一模型的参数。需要说明的是，此时处理的数据仍为全精度形式，伪量化算子仅仅模拟了量化操作。

Step7:为了确保第一模型中所有网络层均已完成量化，判断第一模型中是否还存在未量化的网络层，在第一模型中不存在未量化的网络层，并且第一模型已经收敛的情况下，则停止迭代更新第一模型，输出得到的第二模型；在第一模型中存在未量化的网络层的情况下，则继续重复step2～6，直至第一模型中不存在未量化的网络层，且第一模型已经收敛，得到第二模型。

S307、基于量化系数对第二模型中的网络参数进行量化转换，得到量化模型。

在一种实施方式中，数据处理设备获取第二模型中量化后的网络层对应的伪量化算子的量化系数，以及量化后的网络层的参数，根据量化后的网络层对应的伪量化算子的量化系数，以及量化后的网络层的参数对第二模型进行转换，得到量化模型。数据处理设备提取各个伪量化算子中对应网络层的量化系数D和对应网络层量化后的参数Z＝round(R/D)，此时Z为L比特的定点数，量化系数D为全精度数。对于激活输出的量化算子，除了提取量化系数D外，保留对应的伪量化算子。在提取上述参数后，数据处理设备通过模型转换框架，将第二模型转换为量化模型，例如模型转换框架包括tflite(一种轻量级推理库)或者onnx(Open Neural Network Exchange，开放神经网络交换)等框架。

在另一种实施方式中，数据处理设备在得到量化模型后，根据自身的配置参数判断量化模型是否满足部署条件，在量化模型满足部署条件的情况下，则部署量化模型；在量化模型不满足部署条件的情况下，则通过调整量化位数进一步缩小量化模型的规模，以便于得到满足部署条件的量化模型，量化位数越小，则模型的规模越小，模型的规模与模型所需的存储空间、计算能力、功耗等有关。因此，数据处理设备能够通过调整对第一模型进行量化所采用的量化位数，来调整量化后得到的量化模型的部署条件，以使该量化模型的部署条件与该数据处理设备的配置参数相匹配。

在一种实施方式中，数据处理设备在部署量化模型后，数据处理设备获取待预测数据；对待预测数据进行量化，例如通过训练数据模块对待预测数据进行量化，并调用量化模型对量化后的待预测数据进行数据处理。可选地，量化模型是人脸识别模型，数据处理设备包括具有图像采集功能的设备，例如摄像头等，待预测数据是待处理人脸数据。数据处理设备通过具有图像采集功能的设备采集待处理人脸数据，并对待处理人脸数据进行量化，得到量化人脸数据，该量化人脸数据即为量化后的待预测数据，数据处理设备从量化人脸数据中确定人脸区域，例如对量化人脸数据进行裁剪，得到人脸区域，调用人脸识别模型对量化人脸区域进行人脸识别，并输出识别结果。可以理解的是，通过从量化人脸数据中确定人脸区域，能够进一步减小人脸识别模型的运算量，提高人脸识别模型的识别效率。可选地，量化模型是语音识别模型，数据处理设备包括语音采集设备，例如麦克风，待预测数据是待识别语音数据。数据处理设备通过语音采集设备采集的待识别语音数据，并对待识别语音数据进行量化，得到量化语音数据，量化语音数据即为量化后的待预测数据，数据处理设备调用语音识别模型对量化语音数据进行语音识别，并输出识别结果。可选地，量化模型还可以是预测模型，例如预测用户可能喜欢的商品、视频等，或者量化模型是分类模型，例如对短视频进行分类等。

本申请实施例中，获取第一模型，以及第二数据集，并采用第二数据集对第一模型进行训练；从N个网络层中确定未量化的第一目标网络层，对第一目标网络层进行量化，得到更新后的第一模型；继续采用第二数据集对更新后的第一模型进行训练，从N个网络层中继续确定未量化的第二目标网络层，对第二目标网络层进行量化，直至N个网络层中不存在未量化的网络层，得到第二模型。可见，在对第一模型进行迭代训练过程中，通过对目标网络层进行量化来更新第一模型，能够减小神经网络模型的规模；实践发现，通过渐进优化的方式不仅能够得到紧凑、高效的识别模型，还能够显著降低量化误差对训练过程的干扰，进而优化量化模型的性能，例如提高量化模型的识别速度以及识别精度等。

基于上述的数据处理方法，本申请实施例提供了一种量化模型的应用场景，参见图4b，为本申请实施例提供的一种量化模型的应用场景图。在图4b中，数据处理设备401是部署了人脸识别模型的摄像头，人脸识别模型的部署方式可参考上述步骤S201-步骤S204，或者参考步骤S301-步骤S307，在此不再赘述。此外，该摄像头中存储了待寻找的目标人脸，例如走失的小孩的照片，摄像头采集经过摄像采集区域402的人的人脸数据，并将这些人脸与目标人脸进行比对，在检测到采集的人脸数据中存在与目标人脸匹配的人脸的情况下，则输出提示信息，与目标人脸匹配的人脸是指该人脸与目标人脸的相似度高于阈值。可选地，数据处理设备401将区域402中采集的人脸数据进行量化处理，得到量化后的人脸数据，例如人脸数据为人脸图片，对人脸图片进行量化处理是指调整人脸图片的清晰度。数据处理设备401从量化后的人脸数据中确定出量化人脸区域，调用人脸识别模型对量化人脸区域进行人脸识别，并输出人脸识别结果。可选地，对量化人脸区域进行人脸识别是指检测量化人脸区域与目标人脸相似度。

参见图4c，为本申请实施例提供的另一种量化模型的应用场景图。在图4c中，数据处理设备403是部署了人脸识别模型的门禁设备，该门禁设备中存储了具有开门权限的目标用户的人脸；响应于检测到开门请求，门禁设备采集当前请求开门的请求用户的人脸，在请求用户的人脸与目标用户的人脸匹配的情况下，则开门，在不匹配的情况下，则输出提示信息，该提示信息用于提示请求用户不具有开门权限。可选地，数据处理设备403将摄像采集区域404中采集的人脸数据进行量化处理，得到量化后的人脸数据，例如人脸数据为人脸图片，对人脸图片进行量化处理是指调整人脸图片的清晰度。数据处理设备403从量化后的人脸数据中确定出人脸区域，调用人脸识别模型对量化人脸区域进行人脸识别，在人脸识别通过的情况下，则开门；在人脸识别未通过的情况下(相似度低于阈值)，则提示请求用户不具有开门权限。可选地，对量化人脸区域进行人脸识别是指检测量化人脸区域与目标用户的人脸之间的相似度，相似度高于阈值则说明人脸识别通过，相似度不高于阈值则说明人脸识别未通过。

上述详细阐述了本申请实施例的方法，为了便于更好地实施本申请实施例的上述方案，相应地，下面提供了本申请实施例的装置。

请参见图5，图5为本申请实施例提供的一种数据处理装置的结构示意图，该装置可以搭载在图1a所示的数据处理设备101，或者模型存储设备102上。图5所示的数据处理装置能够用于执行上述图2和图3所描述的方法实施例中的部分或全部功能。其中，各个单元的详细描述如下：

获取单元501，用于采用第一数据集对第一模型进行训练，所述第一数据集包括第一数据以及所述第一数据的训练标签，所述第一数据是未经处理的数据，所述第一模型包括N个网络层，N为正整数；

处理单元502，用于采用所述第二数据集对所述第一模型进行训练；所述第二数据集包括第二数据以及所述第二数据对应的训练标签，所述第二数据是量化后的数据；以及用于从所述N个网络层中确定第一目标网络层，所述第一目标网络层是未量化的网络层，对所述第一目标网络层进行量化；以及用于采用所述第二数据集对量化后的所述第一模型进行训练，从所述N个网络层中确定第二目标网络层，所述第二目标网络层是未量化的网络层，对所述第二目标网络层进行量化，直至所述N个网络层中不存在未量化的网络层，得到第二模型。

在一个实施例中，处理单元502，用于：

获取量化系数，基于量化系数构建伪量化算子；

采用伪量化算子对第一参数进行运算，采用运算结果替换第一参数，第一参数是指第一目标网络层中的参数。

在一个实施例中，第一参数的数量为至少一个；处理单元502，用于：

确定量化位数，从至少一个第一参数中确定目标第一参数，目标第一参数满足绝对值要求；

根据目标第一参数和量化位数，确定量化系数，量化系数与目标第一参数正相关，量化系数与量化位数负相关。

在一个实施例中，处理单元502，用于：

将第一参数和量化系数进行相除运算，采用取整函数对相除运算结果进行取整运算；

将取整运算结果与量化系数进行相乘运算，得到运算结果。

在一个实施例中，N个网络层中包括按照顺序连接的M个卷积层和W个全连接层，M和W为正整数，且M和W均小于N；处理单元502，用于：

按照顺序从M个卷积层和W个全连接层中，选择未量化的网络层；

将选择的网络层作为第一目标网络层。

在一个实施例中，处理单元502，还用于：

在当前迭代次数满足目标条件，且N个网络层中存在未量化的网络层的情况下，将未量化的网络层确定为第一目标网络层。

在一个实施例中，目标条件包括：当前迭代次数能被P整除，P为正整数。

在一个实施例中，处理单元502，用于：

基于量化系数对第二模型中的网络参数进行量化转换，得到量化模型。

在一个实施例中，处理单元502，用于：

获取第二模型中量化后的网络层对应的伪量化算子的量化系数，以及量化后的网络层的参数；

根据量化后的网络层对应的伪量化算子的量化系数，以及量化后的网络层的参数对第二模型进行转换，得到量化模型。

在一个实施例中，处理单元502，还用于：

响应于在数据处理设备中部署第一模型的请求，获取数据处理设备的配置参数；

响应于数据处理设备的配置参数与第一模型的部署条件不匹配，执行采用第二数据集对第一模型进行训练的步骤；

基于量化系数对第二模型中的网络参数进行量化转换，得到量化模型，量化模型的部署条件与数据处理设备的配置参数相匹配；

将量化模型部署在数据处理设备中。

在一个实施例中，量化模型为人脸识别模型；处理单元502，还用于：

采集待识别人脸数据；

对待识别人脸数据进行量化，得到量化人脸数据；

从量化人脸数据中确定人脸区域；

调用量化模型对人脸区域进行识别处理，输出识别结果。

根据本申请的一个实施例，图2和图3所示的数据处理方法所涉及的部分步骤可由图5所示的数据处理装置中的各个单元来执行。例如，图2中所示的步骤S201和步骤S202可由图5所示的获取单元501执行，步骤S203和步骤S204可由图5所示的处理单元502执行。图3中所示的步骤S301和步骤S302可由图5所示的获取单元501执行，步骤S303-步骤S308可由图5所示的处理单元502执行。图5所示的数据处理装置中的各个单元分别或全部合并为一个或若干个另外的单元来构成，或者其中的某个或者某些单元还能够再拆分为功能上更小的多个单元来构成，实现同样的操作，而不影响本申请的实施例的技术效果的实现。上述单元是基于逻辑功能划分的，在实际应用中，一个单元的功能也能够由多个单元来实现，或者多个单元的功能由一个单元实现。在本申请的其它实施例中，数据处理装置包括其它单元，在实际应用中，这些功能也能够由其它单元协助实现，并且由多个单元协作实现。

根据本申请的另一个实施例，通过在包括中央处理单元(CPU，Central Processing Unit)、随机存取存储介质(RAM，Random Access Memory)、只读存储介质(ROM，Read-Only Memory)等处理元件和存储元件的例如计算机的通用计算装置上运行能够执行如图2和图3中所示的相应方法所涉及的各步骤的计算机程序(包括程序代码)，来构造如图5中所示的数据处理装置，以及来实现本申请实施例的数据处理方法。计算机程序可以记载于例如计算机可读记录介质上，并通过计算机可读记录介质装载于上述计算装置中，并在其中运行。

基于同一发明构思，本申请实施例中提供的数据处理装置解决问题的原理与有益效果与本申请方法实施例中数据处理装置解决问题的原理和有益效果相似，可以参见方法的实施的原理和有益效果，为简洁描述，在这里不再赘述。

请参阅图6，图6为本申请实施例提供的一种数据处理设备的结构示意图，数据处理设备至少包括处理器601、通信接口602和存储器603。其中，处理器601、通信接口602和存储器603可通过总线或其他方式连接。其中，处理器601(或称中央处理器(Central Processing Unit，CPU))是终端的计算核心以及控制核心，其能够解析终端内的各类指令以及处理终端的各类数据，例如：CPU能够用于解析用户向终端所发送的开关机指令，并控制终端进行开关机操作；再如：CPU能够在终端内部结构之间传输各类交互数据，等等。可选地，通信接口602包括标准的有线接口、无线接口(如WI-FI、移动通信接口等)，受处理器601的控制用于收发数据；通信接口602还能够用于终端内部数据的传输以及交互。存储器603(Memory)是终端中的记忆设备，用于存放程序和数据。可以理解的是，此处的存储器603既可以包括终端的内置存储器，当然也可以包括终端所支持的扩展存储器。存储器603提供存储空间，该存储空间存储了终端的操作系统，可包括但不限于：Android系统、iOS系统、Windows Phone系统等等，本申请对此并不作限定。

在本申请实施例中，处理器601通过运行存储器603中的可执行程序代码，用于执行如下操作：

作为一种可选的实施例，处理器601还用于执行如下操作：

获取量化系数，基于量化系数构建伪量化算子；

作为一种可选的实施例，第一参数的数量为至少一个，处理器601还用于执行如下操作：

作为一种可选的实施例，处理器601还用于执行如下操作：

将取整运算结果与量化系数进行相乘运算，得到运算结果。

作为一种可选的实施例，N个网络层中包括按照顺序连接的M个卷积层和W个全连接层，M和W为正整数，且M和W均小于N；处理器601还用于执行如下操作：

将选择的网络层作为第一目标网络层。

作为一种可选的实施例，处理器601还用于执行如下操作：

作为一种可选的实施例，目标条件包括：当前迭代次数能被P整除，P为正整数。

作为一种可选的实施例，处理器601还用于执行如下操作：

将量化模型部署在数据处理设备中。

作为一种可选的实施例，量化模型为人脸识别模型；处理器601还用于执行如下操作：

采集待识别人脸数据；

对待识别人脸数据进行量化，得到量化人脸数据；

从量化人脸数据中确定人脸区域；

调用量化模型对人脸区域进行识别处理，输出识别结果。

基于同一发明构思，本申请实施例中提供的数据处理设备解决问题的原理与有益效果与本申请方法实施例中数据处理方法解决问题的原理和有益效果相似，可以参见方法的实施的原理和有益效果，为简洁描述，在这里不再赘述。

本申请实施例还提供一种计算机可读存储介质，计算机可读存储介质中存储有一条或多条指令，一条或多条指令用于由处理器加载以执行如下操作：

作为一种可选的实施例，一条或多条指令还用于由处理器加载以执行如下操作：

获取量化系数，基于量化系数构建伪量化算子；

作为一种可选的实施例，第一参数的数量为至少一个，一条或多条指令还用于由处理器加载以执行如下操作：

将取整运算结果与量化系数进行相乘运算，得到运算结果。

作为一种可选的实施例，N个网络层中包括按照顺序连接的M个卷积层和W个全连接层，M和W为正整数，且M和W均小于N；一条或多条指令还用于由处理器加载以执行如下操作：

将选择的网络层作为第一目标网络层。

将量化模型部署在数据处理设备中。

作为一种可选的实施例，量化模型为人脸识别模型；一条或多条指令还用于由处理器加载以执行如下操作：

采集待识别人脸数据；

对待识别人脸数据进行量化，得到量化人脸数据；

从量化人脸数据中确定人脸区域；

调用量化模型对人脸区域进行识别处理，输出识别结果。

本申请实施例还提供一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述方法实施例的数据处理方法。

本申请实施例还提供一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行如下操作：

作为一种可选的实施例，处理器还执行该计算机指令，使得该计算机设备执行如下操作：

获取量化系数，基于量化系数构建伪量化算子；

作为一种可选的实施例，第一参数的数量为至少一个，处理器还执行该计算机指令，使得该计算机设备执行如下操作：

将取整运算结果与量化系数进行相乘运算，得到运算结果。

作为一种可选的实施例，N个网络层中包括按照顺序连接的M个卷积层和W个全连接层，M和W为正整数，且M和W均小于N；处理器还执行该计算机指令，使得该计算机设备执行如下操作：

将选择的网络层作为第一目标网络层。

将量化模型部署在数据处理设备中。

作为一种可选的实施例，量化模型为人脸识别模型；处理器还执行该计算机指令，使得该计算机设备执行如下操作：

采集待识别人脸数据；

对待识别人脸数据进行量化，得到量化人脸数据；

从量化人脸数据中确定人脸区域；

调用量化模型对人脸区域进行识别处理，输出识别结果。

本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。

本申请实施例装置中的模块可以根据实际需要进行合并、划分和删减。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序存储于一计算机可读存储介质中，可读存储介质包括：闪存盘、只读存储器(Read-Only Memory，ROM)、随机存取器(Random Access Memory，RAM)、磁盘或光盘等。

以上所揭露的仅为本申请一种可选实施例而已，当然不能以此来限定本申请之权利范围，本领域普通技术人员可以理解实现上述实施例的全部或部分流程，并依本申请权利要求所作的等同变化，仍属于发明所涵盖的范围。

Claims

一种数据处理方法，应用于数据处理设备，所述方法包括：

采用第一数据集对第一模型进行训练，所述第一数据集包括第一数据以及所述第一数据的训练标签，所述第一数据是未经处理的数据，所述第一模型包括N个网络层，N为正整数；

采用第二数据集对所述第一模型进行训练，所述第二数据集包括第二数据以及所述第二数据的训练标签，所述第二数据是量化后的数据；

从所述N个网络层中确定第一目标网络层，所述第一目标网络层是未量化的网络层，对所述第一目标网络层进行量化；

采用所述第二数据集对量化后的所述第一模型进行训练，从所述N个网络层中确定第二目标网络层，所述第二目标网络层是未量化的网络层，对所述第二目标网络层进行量化，直至所述N个网络层中不存在未量化的网络层，得到第二模型。
如权利要求1所述的方法，其中，所述对所述第一目标网络层进行量化，包括：

获取量化系数，基于所述量化系数构建伪量化算子；

采用所述伪量化算子对第一参数进行运算，采用运算结果替换所述第一参数，所述第一参数是指所述第一目标网络层中的参数。
如权利要求2所述的方法，其中，所述第一参数的数量为至少一个，所述获取量化系数，包括：

确定量化位数，从至少一个第一参数中确定目标第一参数，所述目标第一参数满足绝对值要求；

根据所述目标第一参数和所述量化位数，确定所述量化系数，所述量化系数与所述目标第一参数正相关，所述量化系数与所述量化位数负相关。
如权利要求2所述的方法，其中，所述采用所述伪量化算子对第一参数进行运算，包括：

将所述第一参数和所述量化系数进行相除运算，采用取整函数对相除运算结果进行取整运算；

将取整运算结果与所述量化系数进行相乘运算，得到所述运算结果。
如权利要求1所述的方法，其中，所述N个网络层包括按照顺序连接的M个卷积层和W个全连接层，M和W为正整数，且M和W均小于N，所述从所述N个网络层中确定第一目标网络层，包括：

按照顺序从M个卷积层和W个全连接层中，选择未量化的网络层；

将选择的网络层作为所述第一目标网络层。
如权利要求1所述的方法，其中，所述从所述N个网络层中确定第一目标网络层，包括：

在当前迭代次数满足目标条件，且所述N个网络层中存在未量化的网络层的情况下，将未量化的网络层确定为所述第一目标网络层。
如权利要求6所述的方法，其特征在于，所述目标条件包括：当前迭代次数能被P整除，P为正整数。
如权利要求1所述的方法，其中，所述对所述第二目标网络层进行量化，直至所述N个网络层中不存在未量化的网络层，得到第二模型之后，所述方法还包括：

基于量化系数对所述第二模型中的网络参数进行量化转换，得到量化模型。
如权利要求8所述的方法，其中，所述基于量化系数对所述第二模型中的网络参数进行量化转换，得到量化模型，包括：

获取所述第二模型中量化后的网络层对应的伪量化算子的量化系数，以及所述量化后的网络层的参数；

根据量化后的网络层对应的伪量化算子的量化系数，以及所述量化后的网络层的参数对所述第二模型进行转换，得到所述量化模型。
如权利要求1所述的方法，其中，所述采用第二数据集对所述第一模型进行训练之前，所述方法还包括：

响应于在数据处理设备中部署所述第一模型的请求，获取所述数据处理设备的配置参数；

响应于所述数据处理设备的配置参数与所述第一模型的部署条件不匹配，执行所述采用第二数据集对所述第一模型进行训练的步骤；

所述对所述第二目标网络层进行量化，直至所述N个网络层中不存在未量化的网络层，得到第二模型之后，所述方法还包括：

基于量化系数对所述第二模型中的网络参数进行量化转换，得到量化模型，所述量化模型的部署条件与所述数据处理设备的配置参数相匹配；

将所述量化模型部署在所述数据处理设备中。
如权利要求10所述的方法，其中，所述量化模型为人脸识别模型，在将所述量化模型部署在所述数据处理设备中后，所述方法还包括：

采集待识别人脸数据；

对所述待识别人脸数据进行量化，得到量化人脸数据；

从所述量化人脸数据中确定人脸区域；

调用所述量化模型对所述人脸区域进行识别，输出识别结果。
一种数据处理装置，所述数据处理装置包括：

获取单元，用于采用第一数据集对第一模型进行训练，所述第一数据集包括第一数据以及所述第一数据的训练标签，所述第一数据是未经处理的数据，所述第一模型包括N个网络层，N为正整数；

处理单元，用于采用所述第二数据集对所述第一模型进行训练；所述第二数据集包括第二数据以及所述第二数据对应的训练标签，所述第二数据是量化后的数据；以及用于从所述N个网络层中确定第一目标网络层，所述第一目标网络层是未量化的网络层，对所述第一目标网络层进行量化；以及用于采用所述第二数据集对量化后的所述第一模型进行训练，从所述N个网络层中确定第二目标网络层，所述第二目标网络层是未量化的网络层，对所述第二目标网络层进行量化，直至所述N个网络层中不存在未量化的网络层，得到第二模型。
一种数据处理设备，包括：存储装置和处理器；

所述存储装置中存储有计算机程序；

处理器，用于加载并执行所述计算机程序，以实现如权利要求1-11任一项所述的数据处理方法。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序适于被处理器加载并执行如权利要求1-11任一项所述的数据处理方法。