WO2021053381A1

WO2021053381A1 - 神经网络模型的压缩与加速方法、数据处理方法及装置

Info

Publication number: WO2021053381A1
Application number: PCT/IB2019/059565
Authority: WO
Inventors: 金庆; 廖震宇; 杨林杰
Original assignee: 字节跳动有限公司
Priority date: 2019-09-20
Filing date: 2019-11-07
Publication date: 2021-03-25
Also published as: CN110659725B; CN110659725A

Abstract

一种神经网络模型的压缩与加速方法、数据处理方法及装置、存储介质。神经网络模型包括线性层，神经网络模型的参数包括预备权值参数；压缩与加速方法包括：对神经网络模型的参数进行量化，以得到量化模型，量化模型的参数包括线性层的量化权值参数；以及，对量化模型进行尺度变换处理，以得到目标量化模型。对量化模型进行尺度变换处理，包括：基于线性层的输出神经元的数量或线性层的预备权值参数的标准差，计算线性层的尺度变换参数；以及，基于线性层的尺度变换参数，对线性层的量化权值参数进行尺度变换处理，以得到线性层的标准量化权值参数。

Description

神经网络模型的压缩与加速方法、数据处理方法及装置本申请要求于 201 9年 9月 20 日递交、题为“ 神经网络模型的压缩与加速方法、数据处理方法及装置” 的中国专利申请第 201 91 0893276. X号的优先权，在此全文引用上述中国专利申请公开的内容以作为本申请的一部分。技术领域本公开的实施例涉及一种神经网络模型的压缩与加速方法、数据处理方法及装置、存储介质。背景技术人工智能 ( Artificial Intelligence， AI ) 是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。发明内容本公开至少一个实施例提供一种神经网络模型的压缩与加速方法，所述神经网络模型包括线性层，所述神经网络模型的参数包括预备权值参数，所述压缩与加速方法包括：对所述神经网络模型的参数进行量化，以得到量化模型，所述量化模型的参数包括所述线性层的量化权值参数；以及对所述量化模型进行尺度变换处理，以得到目标量化模型；其中，对所述量化模型进行所述尺度变换处理，包括：基于所述线性层的输出神经元的数量或所述线性层的预备权值参数的标准差，计算所述线性层的尺度变换参数；以及基于所述线性层的尺度变换参数，对所述线性层的量化权值参数进行所述尺度变换处理，以得到所述线性层的标准量化权值参数。例如，在本公开一些实施例提供的压缩与加速方法中，所述线性层包括从卷积层、递归层和全连接层组成的群组中选择的至少一个。例如，在本公开一些实施例提供的压缩与加速方法中，所述线性层未被批量归一化层直接跟随。例如，在本公开一些实施例提供的压缩与加速方法中，对所述神经网络模型的参数进行量化，以得到所述量化模型，包括：对所述线性层的预备权值参数进行钳位处理，以得到所述线性层的钳位权值参数；以及对所述线性层的钳位权值参数进行量化处理，以得到所述线性层的量化权值参数。例如，在本公开一些实施例提供的压缩与加速方法中，基于所述线性层的输出神经元的数量，计算所述线性层的尺度变换参数，包括：根据第一尺度变换参数计算公式计算所述线性层的尺度变换参数，所述第一尺度变换参数计算公式表示为：

其中， RSF表示所述线性层的尺度变换参数， A表示所述线性层的输出神经元的数量， Q表示所述线性层的量化权值矩阵， VAF{ Q表示所述线性层的量化权值矩阵的元素的方差。例如，在本公开一些实施例提供的压缩与加速方法中，所述线性层的量化权值参数的比特位的位数为 1-8。例如，在本公开一些实施例提供的压缩与加速方法中，所述线性层的量化权值参数的比特位的位数为 1-2。例如，在本公开一些实施例提供的压缩与加速方法中，基于所述线性层的输出神经元的数量，计算所述线性层的尺度变换参数，包括：根据第二尺度变换参数计算公式计算所述线性层的尺度变换参数，所述第二尺度变换参数计算公式表示为：

其中， RSF表示所述线性层的尺度变换参数，出神经元的数量， W表示所述线性层的辅助权值矩

性层的辅助权值矩阵的元素的方差；所述线性层的辅助权值矩阵表示为：

W= 2W- 1 其中， W表示所述线性层的钳位权值矩阵。例如，在本公开一些实施例提供的压缩与加速方法中，基于所述线性层的预备权值参数的标准差，计算所述线性层的尺度变换参数，包括：根据第三尺度变换参数计算公式计算所述线性层的尺度变换参数，所述第三尺度变换参数计算公式表示为：

其中， RSF表示所述线性层的尺度变换参数， W表示所述线性层的预备权值矩阵， VAR V\j（示所述线性层的辅助

元素的方差；所述线性层的辅助权值矩阵表示为：

W= 2W- 1 其中， W表示所述线性层的钳位权值矩阵。例如，在本公开一些实施例提供的压缩与加速方法中，所述线性层的量化权值参数的比特位的位数为 3-8。例如，在本公开一些实施例提供的压缩与加速方法中，基于所述线性层的尺度变换参数，对所述线性层的量化权值参数进行所述尺度变换处理，以得到所述线性层的标准量化权值参数，包括：根据尺度变换公式对所述线性层的量化权值参数进行所述尺度变换处理，所述尺度变换公式表示为： cf_j = RSF ^· q_j 其中， Cf表示所述线性层的标准量化权值矩阵， Cf_j 表示所述线性层的标准量化权值矩阵的第 i行第 j列的参数， Q表示所述线性层的量化权值矩阵， 4 表示所述线性层的量化权值矩阵的第 i行第 j列的参数。例如，在本公开一些实施例提供的压缩与加速方法中，对所述线性层的预备权值参数进行所述钳位处理，以得到所述线性层的钳位权值参数，包括：根据钳位公式对所述线性层的预备权值参数进行所述钳位处理，所述钳位公式表示为：其中， W表示所述线性层的钳位权值矩阵，％表示所述钳位权值矩阵的第 i行第 j列的参数， W表示所述线性层的预备权值矩阵，％表示所述线性层的预备权值矩阵的第 i行第 j列的参数， ^ 表示所述线性层的预备权值矩阵的第 m行第 n列的参数， t anh(.)表示双曲正切函数， max( .)表示取最大值函数。例如，在本公开一些实施例提供的压缩与加速方法中，对所述线性层的钳位权值参数进行所述量化处理，以得到所述线性层的量化权值参数，包括：根据量化公式对所述线性层的钳位权值参数进行所述量化处理，所述量化公式表示为：

Q_j = -^― r ound( ( 2^ - 1)V^ ) - 1 2 1 其中， Q表示所述线性层的量化权值矩阵， 4 表示所述线性层的量化权值矩阵的第 i行第 j列的参数， b表示量化比特位的位数， r ound㈠表示四舍五入函数。例如，本公开一些实施例提供的压缩与加速方法，还包括：采用与所述神经网络模型相同的训练参数配置，对所述目标量化模型进行训练。例如，在本公开一些实施例提供的压缩与加速方法中，所述目标量化模型的训练过程包括：前向传播阶段、后向传播阶段和标准量化阶段；所述前向传播阶段包括 :使用当前的目标量化模型对训练输入数据进行处理，以得到训练输出数据，并基于所述训练输出数据计算损失值；所述后向传播阶段包括：基于所述损失值，计算梯度，并基于所述梯度对当前的神经网络模型的参数进行修正，以得到更新的神经网络模型；所述标准量化阶段包括：对更新的神经网络模型的参数进行量化，以得到更新的量化模型，以及对所述更新的量化模型进行尺度变换处理，以得到更新的目标量化模型。例如，在本公开一些实施例提供的压缩与加速方法中，所述神经网络模型包括激活层，所述激活层包括 PACT激活函数，所述 PACT激活函数表示为：其中， x表示所述激活层的输出， x表示所述激活层的输入， a表示所述 PACT 激活函数的激活值参数；对所述神经网络模型的参数进行量化，以得到所述量化模型，还包括: 根据激活值量化公式对所述激活层的输出进行所述量化处理，所述激活值量化公式表示为： ry w, q = - r ound( ( 2^s - 1) — )

2^s - 1 a 其中， q表示所述激活层的输出的量化值， a 表示所述激活层的输出的量化值的比特位的位数， r ound(-)表示四舍五入函数。例如，在本公开一些实施例提供的压缩与加速方法中，所述后向传播阶段还包括：根据激活值梯度公式计算激活值梯度，并基于所述激活值梯度对当前的激活值参数进行修正，以得到更新的激活值参数，所述激活值

例如，在本公开一些实施例提供的压缩与加速方法中，所述训练参数配置包括：初始学习率、学习率调整方案、权值衰减、训练集的迭代次数、优化器和批尺寸。例如，在本公开一些实施例提供的压缩与加速方法中，在对所述神经网络模型的参数进行量化前，所述压缩与加速方法还包括：对所述神经网络模型进行预训练，以得到所述神经网络模型的预备权值参数。例如，在本公开一些实施例提供的压缩与加速方法中，对所述神经网络模型进行所述预训练，包括：采用恺明初始化方案对所述神经网络模型的参数进行初始化。例如，在本公开一些实施例提供的压缩与加速方法中，所述神经网络模型包括 ResNet、 MobileNet-Vl、 MobileNet-V2和 YGG-Net之一。本公开至少一个实施例还提供一种数据处理方法，包括：采用本公开任一实施例提供的压缩与加速方法得到的所述目标量化模型对输入数据进行处理。本公开至少一个实施例还提供一种数据处理装置，包括：存储器，用于非暂时性存储计算机可读指令；以及处理器，用于运行计算机可读指令; 其中，所述计算机可读指令被所述处理器运行时执行本公开任一实施例提供的压缩与加速方法或执行本公开任一实施例提供的数据处理方法。本公开至少一个实施例还提供一种存储介质，非暂时性地存储计算机可读指令，其中，当所述非暂时性计算机可读指令由计算机执行时可以执行本公开任一实施例提供的压缩与加速方法的指令或者可以执行本公开任一实施例提供的数据处理方法的指令。附图说明为了更清楚地说明本公开实施例的技术方案，下面将对实施例的附图作简单地介绍，显而易见地，下面描述中的附图仅仅涉及本公开的一些实施例，而非对本公开的限制。图 1为一种卷积神经网络的示意图；图 2A为一种卷积神经网络的结构示意图；图 2B为一种卷积神经网络的工作过程示意图；图 3为另一种卷积神经网络的结构示意图；图 4为本公开至少一实施例提供的一种神经网络模型的压缩与加速方法的流程图；图 5为本公开至少一实施例提供的一种对应于图 4中所示的步骤 S100 的示例性流程图；图 6 为本公开至少一实施例提供的另一种对应于图 4 中所示的步骤 S100 的示例性流程图；图 7为本公开至少一实施例提供的一种对应于图 4中所示的步骤 S200 的示例性流程图；图 8为本公开至少一实施例提供的一种对应于图 4中所示的步骤 S300 的示例性流程图；图 9为本公开至少一实施例提供的一种数据处理装置的示意性框图；以及图 10为本公开至少一实施例提供的一种存储介质的示意图。具体实施方式为使本公开实施例的目的、技术方案和优点更加清楚，下面将结合本公开实施例的附图，对本公开实施例的技术方案进行清楚、完整地描述。显然，所描述的实施例是本公开的一部分实施例，而不是全部的实施例。基于所描述的本公开的实施例，本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例，都属于本公开保护的范围。除非另外定义，本公开使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开中使用的“第一” 、 “第二” 以及类似的词语并不表示任何顺序、数量或者重要性，而只是用来区分不同的组成部分。 “包括 ”或者 “包含 ”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同，而不排除其他元件或者物件。 “连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接，而是可以包括电性的连接，不管是直接的还是间接的。 “上”、 “下”、 “左”、 “右”等仅用于表示相对位置关系，当被描述对象的绝对位置改变后，则该相对位置关系也可能相应地改变。下面通过几个具体的实施例对本公开进行说明。为了保持本公开实施例的以下说明清楚且简明，本公开省略了已知功能和已知部件的详细说明。当本公开实施例的任一部件在一个以上的附图中出现时，该部件在每个附图中由相同或类似的参考标号表示。在 AI领域的算法技术当中，深度学习 (Deep Learning) 受到学术界与工业界的广泛关注，各国科学家、研究人员、企业、网络社区等都在大力研究并推动深度学习的神经网络模型的研究与发展。随着深度学习在图像分类、目标检测以及自然语言处理等领域取得突破进展，将其应用到实际生活场景的需求也愈发强烈。当前，移动与便携式电子设备极大地方便了人们的生活，而深度学习将极大地提高这些设备的智能性与娱乐性。因此，将深度学习的神经网络模型部署在移动端与嵌入式系统便成为迫切需求。但是，应用深度学习的神经网络模型在实际部署中，通常面临模型尺寸过大的问题，例如神经网络模型的文件大小一般从几十兆到上百兆不等，这样的文件大小，对于移动端来说，下载时耗费的流量以及带宽影响所导致的传输等待时间过长是用户无法忍受的；特别是对于一些存储空间有限的嵌入式系统，可能根本没有足够的存储空间来存储这么大的神经网络模型文件。同时，深度学习的神经网络模型对计算资源及计算能力要求高；在使用大型神经网络模型进行计算时，移动端与嵌入式系统抑或无法提供其所需的计算资源，抑或计算缓慢，导致响应延迟太高而无法满足实际应用场景。此外，神经网络模型耗电量也大。在神经网络计算过程中，处理器需要频繁读取神经网络模型的参数，因此较大的神经网络模型也相应带来更高的内存访问次数，而频繁的内存访问也会极大提高耗电量，高耗电量不利于将神经网络模型部署在移动端。因此，为了在资源有限的硬件设备上部署性能良好的神经网络，就需要对神经网络模型进行压缩和加速。由于量化模型在硬件上移植会非常方便，因此，在众多的对神经网络模型进行压缩和加速方法中，对神经网络模型进行量化的方法具有巨大的发展潜力。本公开至少一实施例提供一种神经网络模型的压缩与加速方法。该神经网络模型包括线性层，神经网络模型的参数包括预备权值参数；该压缩与加速方法包括：对神经网络模型的参数进行量化，以得到量化模型，量化模型的参数包括线性层的量化权值参数；以及，对量化模型进行尺度变换处理，以得到目标量化模型。其中，对量化模型进行尺度变换处理，包括：基于线性层的输出神经元的数量或线性层的预备权值参数的标准差，计算线性层的尺度变换参数；以及，基于线性层的尺度变换参数，对线性层的量化权值参数进行尺度变换处理，以得到线性层的标准量化权值参数。本公开的一些实施例还提供对应于上述压缩与加速方法的数据处理方法及装置、存储介质。本公开的实施例提供的神经网络模型的压缩与加速方法通过对量化模型进行尺度变换处理，得到目标量化模型，可以提高目标量化模型的精度，改善目标量化模型的性能。最初，卷积神经网络 ( Convolutional Neural Network, CNN ) 主要用于识别二维形状，其对图像的平移、比例缩放、倾斜或其他形式的变形具有高度不变性。 CNN主要通过局部感知野和权值共享来简化神经网络模型的复杂性、减少权重的数量。随着深度学习技术的发展， CNN的应用范围已经不仅仅限于图像识别领域，其也可以应用在人脸识别、文字识别、动物分类、图像处理等领域。图 1示出了一种卷积神经网络的示意图。例如，该卷积神经网络可以用于图像处理，其使用图像作为输入和输出，并通过卷积核替代标量的权重。图 1中仅示出了具有 3层结构的卷积神经网络，本公开的实施例对此不作限制。如图 1所示,卷积神经网络包括输入层 101 隐藏层 102和输出层 103。输入层 101具有 4个输入，隐藏层 102具有 3个输出，输出层 103具有 2个输出，最终该卷积神经网络最终输出 2幅图像。例如，输入层 101的 4个输入可以为 4幅图像，或者 1幅图像的四种特征图像。隐藏层 102的 3个输出可以为经过输入层 101输入的图像的特征图像。例如，如图 1所示，卷积层

核，偏置 ^是叠加到卷积层的输出的标量，其中， k是表示输入层 101的标签， i和 j分别是输入层 101的单元和隐藏层 102的单元的标签。例如，第一卷积层 201包括第一组卷积核（图 1中的 < ）和第一组偏置（图 1中的）。第二卷积层 202包括第二组卷积核（图 1中的 <）和第二组偏置（图 1中的 b ）通常，每个卷积层包括数十个或数百个卷积核，若卷积神经网络为深度卷积神经网络，则其可以包括至少五层卷积层。例如，如图 1所示，该卷积神经网络还包括第一激活层 203和第二激活层 204。第一激活层 203位于第一卷积层 201之后，第二激活层 204位于第二卷积层 202之后。激活层（例如，第一激活层 203和第二激活层 204）包括激活函数，激活函数用于给卷积神经网络引入非线性因素，以使卷积神经网络可以更好地解决较为复杂的问题。激活函数可以包括线性修正单元（ ReLU）函数、 S型函数（ Sigmoid函数）或双曲正切函数（ tanh函数）等。 ReLU 函数为非饱和非线性函数， Sigmoid函数和 tanh函数为饱和非线性函数。例如，激活层可以单独作为卷积神经网络的一层，或者激活层也可以被包含在卷积层（例如，第一卷积层 201可以包括第一激活层 203, 第二卷积层 202可以包括第二激活层 204）中。例如，在第一卷积层 201中，首先，对每个输入应用第一组卷积核中的若干卷积核 < 和第一组偏置中的若干偏置 ^ , 以得到第一卷积层 201 的输出；然后，第一卷积层 201的输出可以通过第一激活层 203进行处理，以得到第一激活层 203的输出。在第二卷积层 202中，首先，对输入的第一激活层 203的输出应用第二组卷积核中的若干卷积核 < 和第二组偏置中的若干偏置 ^ , 以得到第二卷积层 202的输出；然后，第二卷积层 202的输出可以通过第二激活层 204进行处理，以得到第二激活层 204的输出。例如，第一卷积层 201的输出可以为对其输入应用卷积核 <后再与偏置相加的结果，第二卷积层 202的输出可以为对第一激活层 203的输出应用卷积核

需要对卷积神经网络进行训练。经过训练之后，卷积神经网络的卷积核和偏置在图像处理期间保持不变。在训练过程中，各卷积核和偏置通过多组输入 /输出示例图像以及优化算法进行调整，以获取优化后的卷积神经网络模型。图 2A示出了一种卷积神经网络的结构示意图，图 2B示出了一种卷积神经网络的工作过程示意图。例如，如图 2A和 2B所示，输入图像通过输入层输入到卷积神经网络后，依次经过若干个处理过程 (如图 2A中的每个层级) 后输出类别标识。卷积神经网络的主要组成部分可以包括多个卷积层、多个下采样层和全连接层。例如，一个完整的卷积神经网络可以由这三种层叠加组成。例如，图 2A仅示出了一种卷积神经网络的三个层级, 即第一层级、第二层级和第三层级。例如，每个层级可以包括一个卷积模块和一个下采样层。例如，每个卷积模块可以包括卷积层。由此，每个层级的处理过程可以包括：对输入图像进行卷积 ( convolution ) 以及下采样 ( sub-sampling /down-sampling )。例如，根据实际需要，每个卷积模块还可以包括批量归一化 ( batch normalization ) 层，从而每个层级的处理过程还可以包括批量归一化处理。例如，批量归一化层用于对特征图进行批量归一化处理，以使特征图像的像素的灰度值在预定范围内变化，从而降低计算难度，提高对比度。例如，预定范围可以为［-1 , 1］。例如，批量标准化层的处理方式可以参考常见的批量标准化处理的过程，在此不再赘述。卷积层是卷积神经网络的核心层。在卷积神经网络的卷积层中，一个神经元只与部分相邻层的神经元连接。卷积层可以对输入图像应用若干个卷积核 (也称为滤波器)，以提取输入图像的多种类型的特征。每个卷积核可以提取一种类型的特征。卷积核一般以随机小数矩阵的形式初始化，在卷积神经网络的训练过程中卷积核将通过学习以得到合理的权值。对输入图像应用一个卷积核之后得到的结果被称为特征图像（ feature map），特征图像的数目与卷积核的数目相等。每个特征图像由一些矩形排列的神经元组成，同一特征图像的神经元共享权值，这里共享的权值就是卷积核一个层级的卷积层输出的特征图像可以被输入到相邻的下一个层级的卷积层并再次处理以得到新的特征图像。例如，如图 2A所示，第一层级的卷积层可以输出第一特征图像，该第一特征图像被输入到第二层级的卷积层再次处理以得到第二特征图像。例如，如图 2B所示，卷积层可以使用不同的卷积核对输入图像的某一个局部感受域的数据进行卷积，卷积结果被输入激活层，该激活层根据相应的激活函数进行计算以得到输入图像的特征信息。例如，如图 2 A和 2B所示，下采样层设置在相邻的卷积层之间，下采样层是下采样的一种形式。一方面，下采样层可以用于缩减输入图像的规模，简化计算的复杂度，在一定程度上减小过拟合的现象；另一方面，下采样层也可以进行特征压缩，提取输入图像的主要特征。下采样层能够减少特征图像的尺寸，但不改变特征图像的数量。例如，一个尺寸为 12x12 的输入图像，通过 6x6的卷积核对其进行采样，那么可以得到 2x2的输出图像，这意味着输入图像上的 36个像素合并为输出图像中的 1个像素。最后一个下采样层或卷积层可以连接到一个或多个全连接层，全连接层用于连接提取的所有特征。全连接层的输出为一个一维矩阵，也就是向量。图 3示出了另一种卷积神经网络的结构示意图。例如，参见图 3所示的示例，最后一个卷积层（即第 t个卷积层）的输出被输入到平坦化层以进行平坦化操作（Flatten）。平坦化层可以将特征图像（2D 图像）转换为向量（ 1D）。该平坦化操作可以按照如下的方式进行：

^Vk ^~ fklj,k%j 其中， v是包含 k个元素的向量， f是具有 i行 j列的矩阵。然后，平坦化层的输出（即 1D向量）被输入到一个全连接层（ FCN）。全连接层可以具有与卷积神经网络相同的结构，但不同之处在于，全连接层使用不同的标量值以替代卷积核。例如，最后一个卷积层的输出也可以被输入到均化层（AVG）。均化层用于对输出进行平均操作，即利用特征图像的均值表示输出图像，因此，一个 2D 的特征图像转换成为一个标量。例如，如果卷积神经网络包括均化层，则其可以不包括平坦化层。例如，根据实际需要，均化层或全连接层可以连接到分类器，分类器可以根据提取的特征进行分类，分类器的输出可以作为卷积神经网络的最终输出，即表征图像类别的类别标识 ( label )。例如，分类器可以为支持向量机 ( Support Vector Machine, SVM ) 分类器、 softmax分类器以及最邻近规则 ( KNN ) 分类器等。如图 3所示，在一个示例中，卷积神经网络包括 softmax分类器， softmax分类器是一种逻辑函数的生成器，可以把一个包含任意实数的 K维向量 z压缩成 K维向量 cr(z)。 softmax分类器的公式如下：

其中， Z_j.表示 K维向量 z中第 j个元素， cr(z)表示每个类别标识 ( label ) 的预测概率， ⑵为实数，且其范围为 (0, 1), K维向量 ⑵的和为 1。根据以上公式， K维向量 z中的每个类别标识均被赋予一定的预测概率，而具有最大预测概率的类别标识被选择作为输入图像的标识或类别。下面结合附图对本公开的一些实施例及其示例进行详细说明。图 4为本公开至少一实施例提供的一种神经网络模型的压缩与加速方法的流程图。例如，该压缩与加速方法可以用于对 ResNet (例如， ResNet-50)、 MobileNet-Vl、 MobileNet-V2和 YGG-Net等各种神经网络模型进行量化，以实现上述各种神经网络模型的压缩与加速。需要说明的是，该压缩与加速方法的适用范围包括但不限于以上列举的各种神经网络模例如，如图 4所示，该压缩与加速方法包括步骤 S000至步骤 S300。步骤 S000: 对神经网络模型进行预训练，以得到神经网络模型的预备权值参数。例如，在步骤 S000 中，该神经网络模型可以是未经训练的全精度模型 ( full-precision model )。例如，可以采用常规的训练方法、训练技巧 ( tricks) 以及训练参数 (例如，包括超参数) 配置对该全精度模型进行预训练。例如，训练参数配置通常包括：初始学习率 (initial learning rate)、学习率调整方案 (learning rate scheduler)、权值衰减 (weight decay)、训练集的迭代次数 (the number of epochs)、优化器 (optimizer) 和批尺寸 (batch size) 等。例如，在一些示例中，初始学习率可以设置为 0.05，学习率调整方案可以采用余弦退火调整方案 (cosine annealing scheduler)，权值衰减可以设置为 4 x 10 ⁵ , 训练集的迭代次数可以设置为 150次，优化器可以采用随机梯度下降 (stochastic gradient descent， SGD) 优化器，批尺寸可以设置为 2048或 1024等。需要说明的是，上述训练参数配置是示例性的，不应视作对本公开的限制。在本公开的实施例中，训练参数配置可以根据实际需要进行设定。例如，神经网络模型的预训练过程通常包括：对神经网络模型的参数进行初始化；使用神经网络模型对训练输入数据进行处理，得到训练输出数据；基于训练输出数据，通过损失函数计算损失值；基于损失值计算梯度，并对神经网络模型的参数进行修正。例如，在一些示例中，可以采用彳岂明初始化 ( Kaiming Initialization) 方案对神经网络模型的参数进行初始化。例如，可以将神经网络模型的参数初始化为符合高斯分布的随机数。例如，可以使神经网络模型的各功能层 (例如，卷积层、全连接层等) 的初始权值参数符合高斯分布，例如，该高斯分布的期望为 0，该高斯分布的标准差为该功能层的输出神经元的数量的倒数。例如，对于一个卷积层而言，该卷积层的输出神经元的数量等于该卷积层的输出通道数与该卷积层的卷积核中的元素数量之积;例如，对于一个全连接层而言，该全连接层的输出神经元的数量等于该全连接层输出的特征的数量。例如，在一些示例中，训练输入数据的类型依赖于神经网络模型的处理对象，例如根据神经网络模型的处理对象的不同，训练输入数据可以包括图像、文本、语音等。以 ResNet、MobileNet-Vl、MobileNet-V2和 YGG-Net 等神经网络模型为例，其训练输入数据可以为图像，例如可以使用 ImageNet数据库中的图像作为其训练输入数据。例如，在一些示例中，损失函数可以根据实际需要进行选择，例如，损失函数可以包括但不限于 0-1损失函数、平方损失函数、对数损失函数、交叉熵损失函数 (cross-entropy cost function)等之中的一种或其任意组合，本公开的实施例对此不作限制。例如，在一些示例中，可以采用随机梯度下降算法或批量梯度下降 (batch gradient descent, BGD) 算法等计算梯度，并根据该梯度对神经网络模型的参数进行修正。例如，在一些示例中，神经网络模型的预训练过程还可以包括：判断神经网络模型的训练是否满足预定条件，若不满足预定条件，则重复对其进行训练；若满足预定条件，则停止对其进行训练，得到训练好的神经网络模型。例如，在一个示例中，上述预定条件为训练输入数据对应的损失值不再显著减小；例如，在另一个示例中，上述预定条件为神经网络模型的训练次数或训练周期达到预定数目；本公开的实施例对此不作限制。需要说明的是，上述说明仅是示意性阐述神经网络模型的训练过程。本领域技术人员应当知道，在训练过程中，需要利用大量样本数据对神经网络模型进行训练；同时，在每一个样本数据的训练过程中，都可以包括多次反复迭代以对神经网络模型的参数进行修正。又例如，训练阶段还包括对神经网络模型的参数进行微调 (fine-tune)，以获取更优化的参数。例如，在一些示例中，神经网络模型包括线性层，例如，线性层包括卷积层 ( convolution layer )、递归层 ( recurrent layer ) 和全连接层 (fully-connected layer) 等至少之一。例如，在一些示例中，神经网络模型还包括非线性层，例如，非线性层包括批量归一化层 (batch normalization layer) 和激活层 (activation layer，例如采用非线性激活函数) 等。例如，经过预训练后，神经网络模型的参数为预备权值参数。例如，在一些示例中，预备权值参数为全精度的 32位的浮点数。需要说明的是，在一些示例中，本公开的实施例提供的压缩与加速方法可以不包括步骤 S000，例如，可以直接基于本领域中已经训练好的神经网络模型，执行步骤 S100至步骤 S300，以得到目标量化模型。在此情况下，该已经训练好的神经网络模型的参数为预备权值参数。步骤 S100: 对神经网络模型的参数进行量化，以得到量化模型。例如，在步骤 S100中，可以采用 DoReFa方案对神经网络模型的参数进行量化。例如，对神经网络模型的参数进行量化，是指将神经网络模型的至少部分参数从例如高精度的浮点数 (例如，全精度的 32位的浮点数) 变为例如低精度的定点数 (例如， 1-8位的定点数) ，从而实现对神经网络模型的压缩与加速。需要说明的是，在步骤 S100 中，也可以采用其他类型的量化方案对神经网络模型的参数进行量化，本公开的实施例对此不作限制。以下，基于 DoReFa方案，对步骤 S100中的量化过程进行详细说明。例如， DoReFa方案的具体细节可以参见文献， Shuchang Zhou, Yuxin Wu, Zekun Ni, Xinyu Zhou, He Wen, and Yuheng Zou. Dorefa-Net: Training Low Bitwidth Convolutional Neural Networks With Low Bitwidth Gradients , arXiv: 1606.06160, 2016。在此将该文献全文引用结合于此，以作为本公开的一部分。图 5为本公开至少一实施例提供的一种对应于图 4中所示的步骤 S100 的示例性流程图。例如，如图 5所示，对神经网络模型的参数进行量化，以得到量化模型，即步骤 S100，包括步骤 S110至步骤 S120。步骤 S110: 对线性层的预备权值参数进行钳位处理，以得到线性层的钳位权值参数。例如，“ 钳位处理” 是指对一组参数 (例如，线性层的预备权值参数) 按照一定的规则 (例如，根据某一个公式) 进行缩放，使缩放后的参数的取值范围限制在某一区间，以便于后续进一步处理。例如，在一些示例中，可以根据钳位公式对线性层的预备权值参数进行钳位处理，以将线性层的钳位权值参数的取值范围限制在预定区间，例如预定区间可以为［0, 1］，但不限于此。例如，通过钳位处理，可以使线性层的参数 (即线性层的钳位权值参数) 在预定区间中的分布更加均匀，从而有利于减小后续步骤中的量化误差。例如，在一些示例中，钳位公式可以表示为：

其中， W表示线性层的钳位权值矩阵 (包括线性层的钳位权值参数)，

% 表示钳位权值矩阵的第 i行第 j列的参数， W表示线性层的预备权值矩阵 (包括线性层的预备权值参数)，％表示线性层的预备权值矩阵的第 i

t anh( -)表示双曲正切函数， max( -)表示取最大值函数。例如，上述钳位公式可以将线性层的钳位权值参数的取值范围限制在区间［0, 1］中。步骤 S120: 对线性层的钳位权值参数进行量化处理，以得到线性层的量化权值参数。例如，在一些示例中，可以根据权值量化公式对线性层的钳位权值参数进行量化处理，以得到线性层的量化权值参数。例如，在一些示例中，权值量化公式可以表示为：

Q_j = -^― r ound( ( 2^ - 1)V^ ) - 1 2 1 其中， Q表示线性层的量化权值矩阵 (包括线性层的量化权值参数)， Q_j 表示线性层的量化权值矩阵的第 i行第 j列的参数， b表示线性层的量化权值参数的比特位的位数， r ound(-)表示四舍五入函数。例如，量化模型的参数包括线性层的量化权值参数。例如，为了便于量化模型移植到移动端与嵌入式系统，线性层的量化权值参数的比特位的位数 b —般设定为 1-8位 (bit)。当然，线性层的量化权值参数的比特位的位数也可以根据需要设定为更多位，本公开的实施例对此不作限制。图 6 为本公开至少一实施例提供的另一种对应于图 4 中所示的步骤 S100 的示例性流程图。图 6所示的步骤 S100除了包括图 5中所示的步骤 S110和步骤 S120之外，还包括步骤 S130。例如，在一些示例中，神经网络模型包括激活层。例如，激活层可以包括 PACT激活函数，但不限于此。例如， PACT激活函数表示为：

其中， x所述激活层的输出， x表示激活层的输入， a表示 PACT激活函数的激活值参数。例如， a为浮点数 (floating number)。例如， PACT 激活函数可以减小激活层的输出的量化误差。例如，如图 6所示，对神经网络模型的参数进行量化，以得到量化模型，即步骤 S100，还包括步骤 S130。步骤 S130: 对激活层的输出进行量化处理。例如，在一些示例中，可以根据激活值量化公式对激活层的输出进行量化处理。例如，激活值量化公式可以表示为： q

其中， q表示激活层的输出的量化值， a 表示激活层的输出的量化值的比特位的位数， r ound㈠表示四舍五入函数。例如， q为动态固定点数 (dynamic fixed-point number) ; 例如，激活层的输出的量化值的比特位的位数 a —般设定为例如 1 -8位，例如 2-4位等。例如，在本公开的实施例中，对激活层的输出进行量化处理，有利于提升量化模型的运算速度，从而有利于实现本公开的实施例提供的压缩与加速方法的加速功能。需要说明的是，在本公开的实施例中，可以不对神经网络模型中的批量归一化层进行量化处理，也可以不对神经网络模型中最后的全连接层的偏置（bias）进行量化处理。在研究中，本申请的发明人发现：一方面，根据步骤 S100得到的量化模型通常存在精度下降和性能退化的问题；另一方面，在神经网络模型或 /和量化模型中，如果保持权值的梯度处于同一尺度量级，可以防止梯度爆炸和梯度消失的问题，从而有利于提高量化模型的精度和改善量化模型的性能。例如，为了保持权值的梯度处于同一尺度量级，在神经网络模型中，可以在线性层之后直接连接批量归一化层（线性层的输出经过批量归一化层的处理之后再输入到后续的功能层中）；但是，在神经网络模型中，往往还包括未被批量归一化层直接跟随的线性层，例如， ResNet、 MobileNet-Vl、 MobileNet-V2和 YGG-Net等神经网络模型中用于输出的最后一层全连接层等。因此，本公开的实施例提供的压缩与加速方法，在步骤 S100之后，还包括步骤 S200，以对量化模型进行进一步处理。步骤 S200: 对量化模型进行尺度变换处理，以得到目标量化模型。例如，在一些示例中，在相同的效率约束（ efficiency constraints）下，与步骤 S100得到的量化模型相比，步骤 S200得到的目标量化模型可以具有更高的精度以及更好的性能。例如，相同的效率约束是指模型的尺寸（对应于模型占用的存储空间）、能耗、延迟（对应于模型的处理速度）等基本相同。例如，在一些示例中，步骤 S200 得到的目标量化模型的性能可以与对应的全精度模型的性能相当或者比全精度模型的性能更优（参考后续表 1-2）。图 7为本公开至少一实施例提供的一种对应于图 4中所示的步骤 S200 的示例性流程图。例如，如图 7所示，对量化模型进行尺度变换处理，以得到目标量化模型，即步骤 S200包括步骤 S210至步骤 S220。步骤 S210:基于线性层的输出神经元的数量或线性层的预备权值参数的标准差，计算线性层的尺度变换参数。例如，在一些示例中，基于线性层的输出神经元的数量，计算线性层的尺度变换参数，包括：根据第一尺度变换参数计算公式计算线性层的尺度变换参数。例如，第一尺度变换参数计算公式表示为：

其中， RSF表示线性层的尺度变换参数， A表示线性层的输出神经元的数量， Q表示线性层的量化权值矩阵（包括线性层的量化权值参数）， VAR Q 表示线性层的量化权值矩阵的元素的方差。例如，在一些示例中，当线性层的量化权值参数的比特位的位数为 1-2 位时，与采用后续两种尺度变换参数计算公式计算得到的线性层的尺度变换参数 RSF相比，采用第一尺度变换参数计算公式计算得到的线性层的尺度变换参数 RSF，可以使目标量化模型更快收敛。需要说明的是，在本公开的实施例中，当线性层的量化权值参数的比特位的位数为其他值（例如， 3-8 位）时，仍然可以采用第一尺度变换参数计算公式计算线性层的尺度变换参数 RSF_o 例如，在另一些示例中，基于线性层的输出神经元的数量，计算线性层的尺度变换参数，包括：根据第二尺度变换参数计算公式计算线性层的尺度变换参数。例如，第二尺度变换参数计算公式表示为：

其中， RSF表示线性层的尺度变换线性层的输出神经元的数量， W表示线性层的辅助权值矩阵，线性层的辅助权值矩阵的元素的方差。线性层的辅助权值矩

W= 2W- 1 其中， W表示线性层的钳位权值矩阵。需要说明的是，在上述示例中，线性层的辅助权值矩阵 W是为了说明第二尺度变换参数计在神经网络模型及其量化模型中并不包括线性层的辅助

例如，在再一些示例中，基于线性层的预备权值参数的标准差，计算线性层的尺度变换参数，包括：根据第三尺度变换参数计算公式计算线性层的尺度变换参数。例如，第三尺度变换参数计算公式表示为:

其中， W表示线性层的钳位权值矩阵。需要说明的是，在上述示例中，线性层的辅助权值矩阵 W是为了说明第三尺度变换参数计算公式而引入的，在神经网络模型及其量化模型中并不包括线性层的辅助权值矩阵 k 需要说明的是，在一些示例中，基于第一尺度变换参数计算公式计算的线性层的尺度变换参数 RSF得到的目标量化模型、基于第二尺度变换参数计算公式计算的线性层的尺度变换参数 RSF得到的目标量化模型、以及基于第三尺度变换参数计算公式计算的线性层的尺度变换参数 RSF 得到的目标量化模型，三者的精度和性能基本相当。例如，在一些示例中，当线性层的量化权值参数的比特位的位数为 3-8 位时，可以选用第一尺度变换参数计算公式、第二尺度变换参数计算公式和第三尺度变换参数计算公式中的任意一个计算线性层的尺度变换参数 RSF ，同时，得到的目标量化模型的精度和性能基本相当。需要说明的是，在本公开的至少一个实施例中，当线性层的量化权值参数的比特位的位数为其他值（例如， 1-2 位）时，仍然可以采用第二尺度变换参数计算公式或第三尺度变换参数计算公式计算线性层的尺度变换参数 RSF_o 步骤 S220: 基于线性层的尺度变换参数，对线性层的量化权值参数进行尺度变换处理，以得到线性层的标准量化权值参数。例如，在一些示例中，基于线性层的尺度变换参数，对线性层（例如，未被批量归一化层直接跟随的线性层）的量化权值参数进行尺度变换处理，有利于保持量化模型中的权值的梯度处于同一尺度量级，从而有利于提高量化模型的精度和改善量化模型的性能。例如，在一些示例中，可以根据尺度变换公式对线性层的量化权值参数进行尺度变换处理。例如，所述尺度变换公式可以表示为： cf_j = RSF q_j 其中， cf表示线性层的标准量化权值矩阵（包括线性层的标准量化权值参数）， Cf_j表示线性层的标准量化权值矩阵的第 i行第 j列的参数， Q表示线性层的量化权值矩阵， Q_j表示线性层的量化权值矩阵的第 i行第 j列的参数。需要说明的是，在本公开的实施例中，可以只对未被批量归一化层直接跟随的线性层的量化权值参数进行尺度变换处理，即可以不对被批量归一化层直接跟随的线性层的量化权值参数进行尺度变换处理。当然，也可以同时对未被批量归一化层直接跟随的线性层和被批量归一化层直接跟随的线性层的量化权值参数进行尺度变换处理。本公开的实施例对此不作限制。步骤 S300: 采用与神经网络模型相同的训练参数配置，对目标量化模型进行训练。例如，在步骤 S300 中，神经网络模型的训练参数配置可以参考步骤 S000 中的相关描述，在此不再重复赘述。图 8为本公开至少一实施例提供的一种对应于图 4中所示的步骤 S300 的示例性流程图。例如，如图 8所示，采用与神经网络模型相同的训练参数配置，对目标量化模型进行训练，即步骤 S300 包括：前向传播阶段、后向传播阶段和标准量化阶段，以及重复执行这三个阶段的操作，以得到训练好的目标量化模型。前向传播阶段、后向传播阶段和标准量化阶段分别对应于下述步骤 S310、步骤 S320和步骤 S330。步骤 S310: 使用当前的目标量化模型对训练输入数据进行处理，以得到训练输出数据，并基于训练输出数据计算损失值。例如，目标量化模型的训练过程的前向传播阶段的操作，即步骤 S310, 可以相应地参考神经网络模型（例如，全精度模型）的前向传播阶段的操作，在此不再重复赘述。步骤 S320: 基于损失值，计算梯度，并基于梯度对当前的神经网络模型的参数进行修正，以得到更新的神经网络模型；例如，目标量化模型的训练过程的后向传播阶段的操作，即步骤 S320, 可以相应地参考神经网络模型（例如，全精度模型）的后向传播阶段的操作，在此不再重复赘述。例如，在一些示例中，在本公开的实施例提供的压缩与加速方法还包括步骤 S130 （即对激活层的输出进行量化处理）的情况下，在步骤 S320 中，可以根据激活值梯度公式计算激活值梯度，并基于激活值梯度对当前的激活值参数进行修正，以得到更新的激活值参数。例如，在一些示例中，对于前述 PACT 激活函数和激活值量化公式而言，激活值梯度公式可以表示为：

其中， ^7 / 3a表示所述激活值梯度。例如，采用上述激活值梯度公式计算激活值梯度，有利于减小量化误差。步骤 S330: 对更新的神经网络模型的参数进行量化，以得到更新的量化模型，以及对更新的量化模型进行尺度变换处理，以得到更新的目标量化模型。例如，目标量化模型的训练过程的标准量化阶段的操作，即步骤 S330, 可以参考前述步骤 S100和步骤 S200的相关表述，在此不再重复赘述。例如，通过上述步骤 S310至步骤 S330对目标量化模型进行训练，可以提高目标量化模型的精度，并改善目标量化模型的性能。需要说明的是，在目标量化模型的训练过程中，并不直接对目标量化模型的参数（包括线性层的标准量化权值参数）进行更新，而是通过对神经网络模型的参数进行修正，再进行量化和尺度变换处理，从而实现目标量化模型的参数的更新。需要说明的是，与基于线性层的预备权值参数的标准差计算线性层的尺度变换参数（即采用第三尺度变换参数计算公式或第二尺度变换参数计算公式计算性层的尺度变换参数）相比，基于线性层的输出神经元的数量计算线性层的尺度变换参数（即采用第一尺度变换参数计算公式或第二尺度变换参数计算公式计算性层的尺度变换参数）的过程中不需要计算 VAF^ V\j（，因此可以减少运算量，从而有利于加快目标量化模型的训练速度。需要说明的是，在一些示例中，目标量化模型可以不存储线性层的标准量化权值参数，而是存储线性层的量化权值参数和尺度变换参数，从而减少目标量化模型的尺寸（即占用的存储空间）。在应用该目标量化模型进行数据处理时，可以通过线性层的量化权值参数和尺度变换参数计算得到线性层的标准量化权值参数，或者，还可以先通过线性层的量化权值参数对线性层的输入进行处理得到线性层的输出，再用尺度变换参数对线性层的输出进行处理，本公开的实施例对此不作限制。例如，相应地，目标量化模型可以不存储目标量化模型中的线性层（例如全连接层）的偏置，而是存储量化模型中的线性层（例如全连接层）的偏置；从而，在应用该目标量化模型进行数据处理时，可以通过尺度变化参数将量化模型中的线性层的偏置转变为目标量化模型中的线性层的偏置，或者，还可以先通过量化模型中的线性层的量化权值参数和量化模型中的线性层的偏置对线性层的输入进行处理得到线性层的输出，再用尺度变换参数对线性层的输出进行处理，本公开的实施例对此不作限制。需要说明的是，在实际应用中，本公开的实施例提供的压缩与加速方法，可以根据实际需要，选择性地（例如，二者择其一，或者同时）对神经网络模型的权值参数（即权值量化）和激活层的输出（即激活值量化）进行量化。需要说明的是，在本公开的实施例中，神经网络模型及其量化模型均可以采用软件、硬件、固件或其任意组合等方式实现，从而执行相应的处理过程。需要说明的是，本公开的实施例中，上述神经网络模型的压缩与加速方法的流程可以包括更多或更少的操作，这些操作可以顺序执行或并行执行。虽然上文描述的神经网络模型的压缩与加速方法的流程包括特定顺序出现的多个操作，但是应该清楚地了解，多个操作的顺序并不受限制。上文描述的神经网络模型的压缩与加速方法可以执行一次，也可以按照预定条件执行多次。本公开的实施例提供的神经网络模型的压缩与加速方法通过对量化模型进行尺度变换处理，得到目标量化模型，可以提高目标量化模型的精度，改善目标量化模型的性能。本公开至少一实施例还提供一种数据处理方法，该数据处理方法包括：采用本公开任一实施例提供的压缩与加速方法得到的目标量化模型对输入数据进行处理，以得到输出数据。例如，在一些示例中，输入数据的类型依赖于目标量化模型的处理对象，例如根据目标量化模型的处理对象的不同，输入数据可以包括图像、文本、语音等。以 ResNet、 MobileNet-Vl、 MobileNet-V2和 VGG-Net等神经网络模型及其目标量化模型为例，其输入数据可以为图像。例如，输出数据可以表示目标量化模型对输入数据进行推理预测的结果。以 ResNet、 MobileNet-Vl、 MobileNet-V2和 VGG-Net等神经网络模型及其目标量化模型为例，其输出数据可以表示对图像（即输入数据）的分类结果。例如，在一些示例中，目标量化模型可以部署在智能手机、平板电脑、车载导航仪等移动端和嵌入式系统中，从而该移动端和嵌入式系统等可以执行上述数据处理方法。以下，以 MobileNet-Yl神经网络模型和 MobileNet-Y2神经网络模型为例，通过表 1-2示例性地示出了不同比特位宽下的量化方案精度对比。表 1为针对 MobileNet-Vl和 MobileNet-Y2的不同比特位宽（即量化比特位的数量）下的量化方案精度对比表（对权值和激活值进行量化）；表 2 为针对 MobileNet-Vl 和 MobileNet-Y2的不同比特位宽下的量化方案精度对比表（对权值进行量化，不对激活值进行量化）。需要说明的是，在表 1-2中， PACT（parameterized clipping activation）、

HAQ （hardware-aware automated quantization）、 Deep Compression为已口的量化方案， SAT为本公开的实施例提供的量化方案（即压缩与加速方法），其中，线性层的尺度变换参数是基于线性层的输出神经元的数量计算得到的（采用第三尺度变换参数计算公式）。还需要说明的是， HAQ 方案的比特位宽是灵活变化的（flexible），因此表 1-2中的 HAQ方案的比特位宽是等效位宽，例如，其等效位宽分别为 2、 3、 4、 5、 6、 8等，从而可以与对应的比特位宽下的其他量化方案进行精度对比。另外，在表 1-2中， FP表示对应的全精度模型； Acc.-l表示模型输出的一种候选类别是输入图像的正确类别的概率， Acc.-5表示模型输出的五种候选类别包括输入图像的正确类别的概率。例如， PACT方案的具体细节可以参见文献， Jungwook Choi, Zhuo Wang, Swagath Yenkataramani, Pierce I-Jen Chuang, Yijayalakshmi Srmivasan, and Kailash Gopalakrishnan. PACT: Parameterized Clipping Activation for Quantized Neural Networks, arXiv: 1805.06085, 2018; HAQ方案的具体细节可以参见文献， Kuan Wang, Zhijian Liu, Yujun Lin, Ji Lin, and Song Han. HAQ: Hardware- Aware Automated Quantization with Mixed Precision, arXiv: 1811.08886, 2019; Deep Compression方案的具体细节可以参见文献， Song Han, Huizi Mao, and William J Dally. Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding. arXiv: 1510.00149, 2015。在此将上述文献全文引用结合于此，以作为本公开的一部分。表 1. 针对 MobileNet-V 1 和 MobileNet-V2的不同比特位宽下的量化方案精度对比表（对权值和激活值进行量化）

MobileNet-V 1 MobileNet- V2 量化方案比特位宽 Acc.-l Acc.-5 Acc.-l Acc.-5

PACT 4bit^ 703 S92 704 89.4

HAQ flexible 67.40 87.90 66.99 87.33

SAT 4bits 71.3 89.9 71.1 90.0

PACT 5bit^ 7U 806 7L2 89.8

HAQ flexible 70.58 89.77 70.90 89.91

SAT 5bits 71.9 90.3 72.0 90.4

PACT 6bit^ TL2 S92 7L5 90.0

HAQ flexible 71.20 90.19 71.89 90.36

SAT 6bits 72.3 90.4 72.3 90.6

PACT 8bit^ 7L3 S9J 7L7 89.9

HAQ flexible 70.82 89.85 71.81 90.25

SAT 8bits 72.6 90.7 72.5 90.7

PACT FP 12A 902 711 90.5

SAT FP 71.7 90.2 71.8 90.2 表 2. 针对 MobileNet-V 1 和 MobileNet- V2的不同比特位宽下的量化方案精度对比表（对权值进行量化，不对激活值进行量化）

MobileNet-Vl MobileNet- V2

Quant. Method Weights Acc.-l Acc.-5 Acc.-l Acc.-5

Deep Compression 2bits 37.62 64.31 58.07

HAQ flexible 57.14 81.87 66.75

SAT 2bits 66.3 86.8 66.8

Deep Compression 3bits 65.93 86.85 68.00 87.96

HAQ flexible 67.66 88.21 70.90 89.76

SAT 3bits 70.7 89.5 71.1 89.9

Deep Compression 4bits 71.14 89.84 71.24 89.93

HAQ flexible 71.74 90.36 71.47 90.23

SAT 4bits 72.1 90.2 72.1 90.6

Deep Compression FP 70.90 89.90 71.87 90.32 HAQ FP 70.90 89.90 71.87 90.32

SAT FP 71.7 90.2 71.8 90.2 根据表 1-2可知，采用本公开的实施例提供的压缩与加速方法得到的目标量化模型的精度在大部分情况下均高于其他几种已知的量化方案得到的量化模型，由此说明，本公开的实施例提供的压缩与加速方法可以提高目标量化模型的精度，改善目标量化模型的性能。本公开的实施例提供的数据处理方法的技术效果可以参考上述实施例中关于神经网络模型的压缩与加速方法的相应描述，在此不再赘述。本公开至少一实施例还提供一种数据处理装置。图 9为本公开至少一实施例提供的一种数据处理装置的示意性框图。例如，如图 9所示，该数据处理装置 500包括存储器 510和处理器 520 _o 例如，存储器 510用于非暂时性存储计算机可读指令，处理器 520用于运行该计算机可读指令，该计算机可读指令被处理器 520运行时执行本公开任一实施例提供的神经网络模型的压缩与加速方法或 /和数据处理方法。例如，存储器 510和处理器 520之间可以直接或间接地互相通信。例如，在一些示例中，如图 9所示，该数据处理装置 500还可以包括系统总线 530，存储器 510和处理器 520之间可以通过系统总线 530互相通信，例如，处理器 520可以通过系统总线 1006访问存储器 510。例如，在另一些示例中，存储器 510和处理器 520等组件之间可以通过网络连接进行通信。网络可以包括无线网络、有线网络、和 /或无线网络和有线网络的任意组合。网络可以包括局域网、互联网、电信网、基于互联网和 /或电信网的物联网 ( Internet of Things )、和 /或以上网络的任意组合等。有线网络例如可以采用双绞线、同轴电缆或光纤传输等方式进行通信，无线网络例如可以采用 3G/4G/5G移动通信网络、蓝牙、 Zigbee或者 WiFi等通信方式。本公开对网络的类型和功能在此不作限制。例如，处理器 520可以控制数据处理装置中的其它组件以执行期望的功能。处理器 520可以是中央处理单元 (CPU)、张量处理器 (TPU) 或者图形处理器 GPU 等具有数据处理能力和 /或程序执行能力的器件。中央处理器 (CPU) 可以为 X86或 ARM 架构等。 GPU 可以单独地直接集成到主板上，或者内置于主板的北桥芯片中。 GPU 也可以内置于中央处理器 (CPU) 上。例如，存储器 510可以包括一个或多个计算机程序产品的任意组合，计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和 /或非易失性存储器。易失性存储器例如可以包括随机存取存储器（RAM ）和 /或高速缓冲存储器（cache）等。非易失性存储器例如可以包括只读存储器（ROM）、硬盘、可擦除可编程只读存储器（EPROM）、便携式紧致盘只读存储器（CD-ROM）、 USB存储器、闪存等。例如，在存储器 510上可以存储一个或多个计算机指令，处理器 520 可以运行所述计算机指令，以实现各种功能。在计算机可读存储介质中还可以存储各种应用程序和各种数据，例如线性层的预备权值参数、线性层的标准量化权值参数、线性层的尺度变换参数、激活值参数以及应用程序使用和 /或产生的各种数据等。例如，存储器 510存储的一些计算机指令被处理器 520执行时可以执行根据上文所述的压缩与加速方法中的一个或多个步骤。又例如，存储器 510 存储的另一些计算机指令被处理器 520执行时可以执行根据上文所述的数据处理方法中的一个或多个步骤。例如，如图 9所示，数据处理装置 500还可以包括允许外部设备与数据处理装置 500进行通信的输入接口 540。例如，输入接口 540可被用于从外部计算机设备、从用户等处接收指令。数据处理装置 500还可以包括使数据处理装置 500和一个或多个外部设备相互连接的输出接口 550。例如，数据处理装置 500可以通过输出接口 550显示图像等。通过输入接口 1010 和输出接口 1012与数据处理装置 500通信的外部设备可被包括在提供任何类型的用户可与之交互的用户界面的环境中。用户界面类型的示例包括图形用户界面、自然用户界面等。例如，图形用户界面可接受来自用户采用诸如键盘、鼠标、遥控器等之类的（诸）输入设备的输入，以及在诸如显示器之类的输出设备上提供输出。此外，自然用户界面可使得用户能够以无需受到诸如键盘、鼠标、遥控器等之类的输入设备强加的约束的方式来与数据处理装置 500交互。相反，自然用户界面可依赖于语音识别、触摸和指示笔识别、屏幕上和屏幕附近的手势识别、空中手势、头部和眼睛跟踪、语音和语音、视觉、触摸、手势、以及机器智能等。另外，数据处理装置 500尽管在图 9中被示出为单个系统，但可以理解，数据处理装置 500也可以是分布式系统，还可以布置为云设施（包括公有云或私有云）。因此，例如，若干设备可以通过网络连接进行通信并且可共同执行被描述为由数据处理装置 500执行的任务。例如，关于压缩与加速方法的处理过程的详细说明可以参考上述压缩与加速方法的实施例中的相关描述，关于数据处理方法的处理过程的详细说明可以参考上述数据处理方法的实施例中的相关描述，重复之处不再赘述。例如，在一些示例中，该数据处理装置可以包括但不限于智能手机、平板电脑、车载导航仪等移动端和嵌入式系统。需要说明的是，本公开的实施例提供的数据处理装置是示例性的，而非限制性的，根据实际应用需要，该数据处理装置还可以包括其他常规部件或结构，例如，为实现数据处理装置的必要功能，本领域技术人员可以根据具体应用场景设置其他的常规部件或结构，本公开的实施例对此不作限制。本公开的实施例提供的数据处理装置的技术效果可以参考上述实施例中关于压缩与加速方法以及数据处理方法的相应描述，在此不再赘述。本公开至少一实施例还提供一种存储介质。图 10 为本公开一实施例提供的一种存储介质的示意图。例如，如图 10所示，该存储介质 600非暂时性地存储计算机可读指令 601，当非暂时性计算机可读指令 601 由计算机（包括处理器）执行时可以执行本公开任一实施例提供的压缩与加速方法的指令或者可以执行本公开任一实施例提供的数据处理方法的指令。例如，在存储介质 600上可以存储一个或多个计算机指令。存储介质 600 上存储的一些计算机指令可以是例如用于实现上述压缩与加速方法中的一个或多个步骤的指令。存储介质上存储的另一些计算机指令可以是例如用于实现上述数据处理方法中的一个或多个步骤的指令。例如，存储介质可以包括平板电脑的存储部件、个人计算机的硬盘、随机存取存储器（RAM）、只读存储器（ROM）、可擦除可编程只读存储器（EPROM）、光盘只读存储器（CD-ROM）、闪存、或者上述存储介质的任意组合，也可以为其他适用的存储介质。本公开的实施例提供的存储介质的技术效果可以参考上述实施例中关于压缩与加速方法以及数据处理方法的相应描述，在此不再赘述。对于本公开，有以下几点需要说明： ( 1) 本公开实施例附图中，只涉及到与本公开实施例涉及到的结构，其他结构可参考通常设计。

(2) 在不冲突的情况下，本公开同一实施例及不同实施例中的特征可以相互组合。以上，仅为本公开的具体实施方式，但本公开的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本公开揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应以权利要求的保护范围为准。

Claims

权利要求书

1、一种神经网络模型的压缩与加速方法，所述神经网络模型包括线性层，所述神经网络模型的参数包括预备权值参数，所述压缩与加速方法包括：对所述神经网络模型的参数进行量化，以得到量化模型，所述量化模型的参数包括所述线性层的量化权值参数；以及对所述量化模型进行尺度变换处理，以得到目标量化模型；其中，对所述量化模型进行所述尺度变换处理，包括：基于所述线性层的输出神经元的数量或所述线性层的预备权值参数的标准差，计算所述线性层的尺度变换参数；以及基于所述线性层的尺度变换参数，对所述线性层的量化权值参数进行所述尺度变换处理，以得到所述线性层的标准量化权值参数。

2、根据权利要求 1 所述的压缩与加速方法，其中，所述线性层包括从卷积层、递归层和全连接层组成的群组中选择的至少一个。

3、根据权利要求 1 或 2所述的压缩与加速方法，其中，所述线性层未被批量归一化层直接跟随。

4、根据权利要求 1-3任一项所述的压缩与加速方法，其中，对所述神经网络模型的参数进行量化，以得到所述量化模型，包括：对所述线性层的预备权值参数进行钳位处理，以得到所述线性层的钳位权值参数；以及对所述线性层的钳位权值参数进行量化处理，以得到所述线性层的量化权值参数。

5、根据权利要求 4 所述的压缩与加速方法，其中，基于所述线性层的输出神经元的数量，计算所述线性层的尺度变换参数，包括：根据第一尺度变换参数计算公式计算所述线性层的尺度变换参数，所述第一尺度变换参数计算公式表示为：

其中， RSF表示所述线性层的尺度变换参数， A表示所述线性层的输出神经元的数量， Q表示所述线性层的量化权值矩阵， VAF{ Q表示所述线性层的量化权值矩阵的元素的方差。

6、根据权利要求 5 所述的压缩与加速方法，其中，所述线性层的量化权值参数的比特位的位数为 1-8。

7、根据权利要求 6 所述的压缩与加速方法，其中，所述线性层的量化权值参数的比特位的位数为 1-2。

8、根据权利要求 4 所述的压缩与加速方法，其中，基于所述线性层的输出神经元的数量，计算所述线性层的尺度变换参数，包括：根据第二尺度变换参数计算公式计算所述线性层的尺度变换参数，所述第二尺度变换参数计算公式表示为：

1

RSF

Vn - VARVV 其中， RSF表示所述线性层的尺度变换参数， A表示所述线性层的输出神经元的数量， W表示所述线性层的辅助权值矩阵， VAR 表示所述线性层的辅助权值矩阵的元素的方差；所述线性层的辅助权值矩阵表示为： W= 2W- 1 其中， W表示所述线性层的钳位权值矩阵。

9、根据权利要求 4 所述的压缩与加速方法，其中，基于所述线性层的预备权值参数的标准差，计算所述线性层的尺度变换参数，包括：根据第三尺度变换参数计算公式计算所述线性层的尺度变换参数，所述第三尺度变换参数计算公式表示为：

VAR VV

RSF =

V VAR VV 其中， RSF表示所述线性层的尺度变换参数， W表示所述线性层的预备权值矩阵， VAR V\j（表示所述线性层的预备权值矩阵的元素的方差，表示所述线性层的辅助权值矩阵， VAR 表示所述线性层的辅助权值矩阵的元素的方差；所述线性层的辅助权值矩阵表示为：

W= 2W- 1 其中， w表示所述线性层的钳位权值矩阵。

10、根据权利要求 8或 9所述的压缩与加速方法，其中，所述线性层的量化权值参数的比特位的位数为 1-8。

11、根据权利要求 10所述的压缩与加速方法，其中，所述线性层的量化权值参数的比特位的位数为 3-8。

12、根据权利要求 5-11任一项所述的压缩与加速方法，其中，基于所述线性层的尺度变换参数，对所述线性层的量化权值参数进行所述尺度变换处理，以得到所述线性层的标准量化权值参数，包括：根据尺度变换公式对所述线性层的量化权值参数进行所述尺度变换处理，所述尺度变换公式表示为： cf_j = RSF q_j 其中， Cf表示所述线性层的标准量化权值矩阵， Cf_j 表示所述线性层的标准量化权值矩阵的第 i行第 j列的参数， Q表示所述线性层的量化权值矩阵， Q_j表示所述线性层的量化权值矩阵的第 i行第 j列的参数。

13、根据权利要求 4-12任一项所述的压缩与加速方法，其中，对所述线性层的预备权值参数进行所述钳位处理，以得到所述线性层的钳位权值参数，包括：根据钳位公式对所述线性层的预备权值参数进行所述钳位处理，所述钳位公式表示为： t anh( V)( W = max It anh(

_

其中， W表示所述线性层的钳位权值矩阵，％表示所述钳位权值矩阵的第 i行第 j列的参数， W表示所述线性层的预备权值矩阵，％表示所述线性层的预备权值矩阵的第 i行第 j列的参数， ^ 表示所述线性层的预备权值矩阵的第 m行第 n列的参数， t anh( .)表示双曲正切函数， max( .)表示取最大值函数。

14、根据权利要求 13 所述的压缩与加速方法，其中，对所述线性层的钳位权值参数进行所述量化处理，以得到所述线性层的量化权值参数，包括：根据权值量化公式对所述线性层的钳位权值参数进行所述量化处理，所述权值量化公式表示为:

Q_j = -^― r ound( ( 2^ - 1)V^ ) - 1 2 1 其中， Q表示所述线性层的量化权值矩阵， 4 表示所述线性层的量化权值矩阵的第 i行第 j列的参数， b表示所述线性层的量化权值参数的比特位的位数， r ound(.)表示四舍五入函数。

15、根据权利要求 4-14任一项所述的压缩与加速方法，还包括：采用与所述神经网络模型相同的训练参数配置，对所述目标量化模型进行训练。

16、根据权利要求 15 所述的压缩与加速方法，其中，所述目标量化模型的训练过程包括：前向传播阶段、后向传播阶段和标准量化阶段；所述前向传播阶段包括：使用当前的目标量化模型对训练输入数据进行处理，以得到训练输出数据，并基于所述训练输出数据计算损失值；所述后向传播阶段包括：基于所述损失值，计算梯度，并基于所述梯度对当前的神经网络模型的参数进行修正，以得到更新的神经网络模型；所述标准量化阶段包括：对更新的神经网络模型的参数进行量化，以得到更新的量化模型，以及对所述更新的量化模型进行尺度变换处理，以得到更新的目标量化模型。

17、根据权利要求 16 所述的压缩与加速方法，其中，所述神经网络模型包括激活层，所述激活层包括 PACT激活函数，所述 PACT激活函数表示为：

其中， X表示所述激活层的输出， X表示所述激活层的输入， dr表示所述 PACT激活函数的激活值参数；对所述神经网络模型的参数进行量化，以得到所述量化模型，还包括: 根据激活值量化公式对所述激活层的输出进行所述量化处理，所述激活值量化公式表示为： q ound( ( 2^s - 1) — )

a 其中， q表示所述激活层的输出的量化值， a 表示所述激活层的输出的量化值的比特位的位数， r ound( -)表示四舍五入函数。

18、根据权利要求 17 所述的压缩与加速方法，其中，所述后向传播阶段还包括：根据激活值梯度公式计算激活值梯度，并基于所述激活值梯度对当前的激活值参数进行修正，以得到更新的激活值参数，式表示为： ound(

其中， dq / da表示所述激活值梯度。

19、根据权利要求 15-18任一项所述的压缩与加速方法，其中，所述训练参数配置包括：初始学习率、学习率调整方案、权值衰减、训练集的迭代次数、优化器和批尺寸。

20、根据权利要求 1-19任一项所述的压缩与加速方法，其中，在对所述神经网络模型的参数进行量化前，所述压缩与加速方法还包括：对所述神经网络模型进行预训练，以得到所述神经网络模型的预备权值参数。

21、根据权利要求 20 所述的压缩与加速方法，其中，对所述神经网络模型进行所述预训练，包括：采用恺明初始化方案对所述神经网络模型的参数进行初始化。

22、根据权利要求 1-21任一项所述的压缩与加速方法，其中，所述神经网络模型包括 ResNet、 MobileNet-Vl、 MobileNet-V2和 YGG-Net之一。

23、一种数据处理方法，包括：采用权利要求 1-22 任一项所述的压缩与加速方法得到的所述目标量化模型对输入数据进行处理。

24、一种数据处理装置，包括：存储器，用于非暂时性存储计算机可读指令；以及处理器，用于运行计算机可读指令；其中，所述计算机可读指令被所述处理器运行时执行根据权利要求 1-22任一项所述的压缩与加速方法或执行根据权利要求 23所述的数据处理方法。

25、一种存储介质，非暂时性地存储计算机可读指令，其中，当所述非暂时性计算机可读指令由计算机执行时可以执行根据权利要求 1-22 任一项所述的压缩与加速方法的指令或者可以执行根据权利要求 23 所述的数据处理方法的指令。