WO2020001401A1

WO2020001401A1 - 深度神经网络中的网络层运算方法及装置

Info

Publication number: WO2020001401A1
Application number: PCT/CN2019/092553
Authority: WO
Inventors: 张渊; 谢迪; 浦世亮
Original assignee: 杭州海康威视数字技术股份有限公司
Priority date: 2018-06-27
Filing date: 2019-06-24
Publication date: 2020-01-02
Also published as: EP3816866A4; EP3816866A1; CN110647974A; US20210271973A1

Abstract

一种深度神经网络中的网络层运算方法及装置，该方法包括：获取深度神经网络中网络层的权值张量,其中，权值张量包括多个滤波器（S101），针对网络层的权值张量中各滤波器，将滤波器拆分为多个定点卷积核的线性组合，其中，各定点卷积核中的权值为具有指定位宽的定点量化值（S102），将网络层的输入数据与滤波器的各定点卷积核分别进行卷积运算，得到多个卷积结果，并根据滤波器的多个定点卷积核的线性组合方式，将各卷积结果加权求和，得到滤波器的运算结果（S103），确定各滤波器的运算结果组成网络层的输出数据（S104）。通过本方法及装置，可以提高深度神经网络的运算效率。

Description

深度神经网络中的网络层运算方法及装置

本申请要求于2018年6月27日提交中国专利局、申请号为201810679580.X发明名称为“深度神经网络中的网络层运算方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及机器学习技术领域，特别涉及一种深度神经网络中的网络层运算方法及装置。

背景技术

DNN(Deep Neural Network，深度神经网络)作为机器学习研究中的一个新兴领域，通过模仿人脑的机制来解析数据，是一种通过建立和模拟人脑进行分析学习的智能模型。目前，例如CNN(Convolutional Neural Network，卷积神经网络)、RNN(Recurrent Neural Network，循环神经网络)、LSTM(Long Short Term Memory，长短期记忆网络)等已在目标检测与分割、行为检测与识别、语音识别等方面得到了很好的应用。

传统的DNN一般采用双精度或单精度浮点数据的乘/加操作来实现网络基本单元的运算，由于参与运算的数据量往往较大，导致在进行DNN的运算时，每次运算的运算量很大，使得DNN的运算效率较低。

发明内容

本申请实施例的目的在于提供一种深度神经网络中的网络层运算方法及装置，以提高DNN的运算效率。具体技术方案如下：

第一方面，本申请实施例提供了一种深度神经网络中的网络层运算方法，所述方法包括：

获取深度神经网络中网络层的权值张量，其中，所述权值张量包括多个滤波器；

针对所述网络层的各滤波器，将该滤波器拆分为多个定点卷积核的线性组合，其中，各定点卷积核中的权值为具有指定位宽的定点量化值；

针对所述网络层的各滤波器，将所述网络层的输入数据与该滤波器的各定点卷积核分别进行卷积运算，得到多个卷积结果，并根据该滤波器的多个定点卷积核的线性组合方式，将各卷积结果加权求和，得到该滤波器的运算结果；

确定各滤波器的运算结果组成所述网络层的输出数据。

可选的，在所述针对所述网络层的各滤波器，将该滤波器拆分为多个定点卷积核的线性组合之前，所述方法还包括：

根据所述深度神经网络的预设应用精度，确定预设量化比特数；

所述针对所述网络层的各滤波器，将该滤波器拆分为多个定点卷积核的线性组合，包括：

针对所述网络层的各滤波器，根据所述预设量化比特数，将该滤波器拆分为多个定点卷积核的线性组合，其中，各定点卷积核对应的指定位宽之和等于所述预设量化比特数。

可选的，所述网络层包括卷积层，所述卷积层的权值张量的大小为S×S×I×O；

针对所述卷积层的各滤波器，按照预设拆分公式，将该滤波器拆分为多个定点卷积核的线性组合，其中，所述预设拆分公式为：

所述w ⁱ为所述卷积层的第i个滤波器，所述i∈[1,O]，所述p为对所述滤波器w ⁱ拆分后得到的定点卷积核的数量，所述α _j为第j个定点卷积核的预设线性加权系数，所述t _j为第j个定点卷积核，所述t _j的大小为S×S×I，所述B为预设量化比特数，所述b _j为第j个定点卷积核对应的指定位宽。

可选的，所述根据该滤波器的多个定点卷积核的线性组合方式，将各卷积结果加权求和，得到该滤波器的运算结果，包括：

针对所述卷积层的各滤波器，按照该滤波器的各定点卷积核的预设线性加权系数，对各定点卷积核的卷积结果进行加权，并将各加权后的卷积结果相加，得到该滤波器的运算结果。

可选的，所述网络层包括全连接层，所述全连接层的权值张量的大小为M×N，所述全连接层的各滤波器为大小为1×N的各向量；

针对所述全连接层的大小为1×N的各向量，按照预设拆分公式，将该向量拆分为多个定点卷积核的线性组合，其中，所述预设拆分公式为：

所述v ^x为所述全连接层的第x个大小为1×N的向量，所述x∈[1,M]，所述q为对所述向量v ^x拆分后得到的定点卷积核的数量，所述β _y为第y个定点卷积核的预设线性加权系数，所述t _y为第y个定点卷积核，所述t _y的大小为1×N，所述B为预设量化比特数，所述b _y为第y个定点卷积核对应的指定位宽。

针对所述全连接层的大小为1×N的各向量，根据该向量的各定点卷积核的预设线性加权系数，对各定点卷积核的卷积结果进行加权，并将各加权后的卷积结果相加，得到该向量的运算结果。

第二方面，本申请实施例提供了一种深度神经网络中的网络层运算装置，所述装置包括：

获取模块，用于获取深度神经网络中网络层的权值张量，其中，所述权值张量包括多个滤波器；

拆分模块，用于针对所述网络层的各滤波器，将该滤波器拆分为多个定点卷积核的线性组合，其中，各定点卷积核中的权值为具有指定位宽的定点量化值；

运算模块，用于针对所述网络层的各滤波器，将所述网络层的输入数据与该滤波器的各定点卷积核分别进行卷积运算，得到多个卷积结果，并根据该滤波器的多个定点卷积核的线性组合方式，将各卷积结果加权求和，得到该滤波器的运算结果；

确定模块，用于确定各滤波器的运算结果组成所述网络层的输出数据。

可选的，所述获取模块，还用于根据所述深度神经网络的预设应用精度，确定预设量化比特数；

所述拆分模块，具体用于：

可选的，所述运算模块，具体用于：

所述拆分模块，具体用于：

可选的，所述运算模块，具体用于：

第三方面，本申请实施例提供了一种电子设备，包括处理器和机器可读存储介质，所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令，所述处理器被所述机器可执行指令促使执行本申请实施例第一方面所提供的方法。

第四方面，本申请实施例提供了一种机器可读存储介质，存储有机器可执行指令，在被处理器调用和执行时，所述机器可执行指令促使所述处理器执行本申请实施例第一方面所提供的方法。

第五方面，本申请实施例提供了一种应用程序，用于在运行时执行：本申请实施例第一方面所提供的方法。

综上可见，本申请实施例提供的方案中，通过获取深度神经网络中网络层的权值张量，针对网络层的权值张量中各滤波器，将该滤波器拆分为多个定点卷积核的线性组合，将网络层的输入数据与该滤波器的各定点卷积核分别进行卷积运算，得到多个卷积结果，并根据该滤波器的多个定点卷积核的线性组合方式，将各卷积结果加权求和，得到该滤波器的运算结果，确定各滤波器的运算结果组成网络层的输出数据。由于各定点卷积核中的权值为具有指定位宽的定点量化值，通过对浮点数据进行定点量化，将网络层权值张量中包括浮点权值的滤波器拆分为多个包括定点量化权值的定点卷积核的线性组合，对定点量化值的运算量小于对浮点数据的运算量，因此，降低了DNN每次进行运算的运算量，从而提高了DNN的运算效率。

附图说明

为了更清楚地说明本申请实施例和现有技术的技术方案，下面对实施例和现有技术中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例的深度神经网络中的网络层运算方法的流程示意图；

图2为本申请实施例的卷积层各滤波器的拆分示意图；

图3为本申请实施例的全连接层大小为1×N的各向量的拆分示意图；

图4为相应的网络层运算与本申请实施例的网络层运算的对比示意图；

图5为本申请实施例的深度神经网络中的网络层运算装置的结构示意图；

图6为本申请实施例的电子设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案、及优点更加清楚明白，以下参照附图并举实施例，对本申请进一步详细说明。显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

为了提高DNN的运算效率，本申请实施例提供了一种深度神经网络中的网络层运算方法、装置、电子设备、机器可读存储介质及应用程序。

下面，首先对本申请实施例所提供的深度神经网络中的网络层运算方法进行介绍。

本申请实施例所提供的一种深度神经网络中的网络层运算方法的执行主体可以为执行智能算法的电子设备，电子设备可以为具有目标检测与分割、行为检测与识别或者语音识别的智能设备，例如远程计算机、远程服务器、智能相机、智能语音设备等等，执行主体中应该至少包括搭载有核心处理芯片的处理器。实现本申请实施例所提供的一种深度神经网络中的网络层运算方法的方式可以为设置于执行主体中的软件、硬件电路和逻辑电路中的至少一种方式。

如图1所示，本申请实施例所提供的一种深度神经网络中的网络层运算方法，可以包括如下步骤：

S101，获取深度神经网络中网络层的权值张量，其中，权值张量包括多个滤波器。

深度神经网络中的网络层用于进行卷积、点乘等网络运算，网络层可以包括卷积Conv层及全连接层，各网络层中均包含有进行网络运算的权值张量。DNN为一个较为宽泛的数据处理方法，DNN可以为CNN、RNN、LSTM等数据处理方法中的任意一种。

权值张量中包括：Conv层中的具体权值或者全连接层中的具体权值。将第k个Conv层的权值张量记为W，其大小为S×S×I×O，并且及w＝W(:,:,:,i)为该Conv层的第i个滤波器，第i个滤波器的大小为S×S×I，即可以将Conv层的权值张量依据输出特征向量的个数划分为O个滤波器；对于全连接层来讲，将第l个全连接层的权值张量记为V，其大小为M×N，则全连接层的输出特征向量的个数为M，因此，全连接层的第j个滤波器的大小为1×N，可以将全连接层的权值张量依据输出特征向量的个数划分为M个滤波器。

S102，针对网络层的各滤波器，将该滤波器拆分为多个定点卷积核的线性组合，其中，各定点卷积核中的权值为具有指定位宽的定点量化值。

网络层中权值张量的权值通常情况下是浮点数据，浮点数据可以表示为一个定点量化值与权重的乘积，或者多个定点量化值与对应权重的加权和，其中权重可以是通过多次训练的过程得到，权重表示缩放系数，对定点量化值进行相乘可以得到近似的浮点数据。

在实际应用场景部署神经网络模型时，不同应用场景下对模型权值需要的比特数是不同的，对于某些较难的任务，如实现人脸识别功能，权值需要16比特位宽表示；对于某些较简单的任务，如实现目标检测功能，权值需要4比特位宽表示。在这种情况下，较大位宽会使得运算率无法得到明显的降低，同一硬件平台存在多种比特数的支持需求会增强电路设计的复杂度，降低电路规整性，因此，可以通过权值拆分的方法，将权值张量统一到低比特定点卷积核，大大降低了运算量及电路设计的规整性。例如，当某一滤波器需要8比特位宽支持时，可以将其拆分为4个2比特的定点卷积核的线性组合，每次只需要对2比特的定点数据进行运算；当某一滤波器需要4比特位宽支持时，可以将其拆分为2个2比特的定点卷积核的线性组合，每次只需要对2比特的定点数据进行运算，这种方案明显降低了运算量，提高了电路设计的规整性，这里线性组合的权重表示尺度系数可以通过训练得到。

可选的，在S102之前，本申请实施例所提供的方法还可以执行如下步骤：根据深度神经网络的预设应用精度，确定预设量化比特数。

则S102具体可以为：针对网络层的各滤波器，根据预设量化比特数，将该滤波器拆分为多个定点卷积核的线性组合，其中，各定点卷积核对应的指定位宽之和等于预设量化比特数。

如上所述，深度神经网络的预设应用精度决定了权值张量中各权值量化后的预设量化比特数，预设应用精度越大，预设量化比特数就越大。在进行各滤波器的拆分时，为了保证拆分结果的准确性，拆分得到的各定点卷积核对应的指定位宽之和等于预设量化比特数。

可选的，网络层可以包括Conv层，Conv层的权值张量的大小可以为S×S×I×O。

则S102具体可以为：针对Conv层的各滤波器，按照预设拆分公式，将该滤波器拆分为多个定点卷积核的线性组合。预设拆分公式如公式(1)所示。

其中，w ⁱ为Conv层的第i个滤波器，i∈[1,O]，p为对滤波器w ⁱ拆分后得到的定点卷积核的数量，α _j为第j个定点卷积核的预设线性加权系数，t _j为第j个定点卷积核，t _j的大小为S×S×I，B为预设量化比特数，b _j为第j个定点卷积核对应的指定位宽。

针对网络中的Conv层，将该Conv层中大小为S×S×I的滤波器w ⁱ拆分为p个低比特定点卷积核的线性组合，并记第j个定点卷积核的低比特定点比特数位宽(即指定位宽)为b _j。通过公式(1)将Conv层的权值张量中各滤波器拆分后，网络模型中每个Conv层的权值张量可以表示为如图2所示，即模型浮点滤波器拆分为多个低比特定点卷积核的线性组合，实质上也就是多个低比特定点卷积核中低比特定点权值的线性组合。

可选的，网络层可以包括全连接层，全连接层的权值张量的大小可以为M×N，全连接层的各滤波器为大小为1×N的各向量。

则S102具体可以为：针对全连接层的大小为1×N的各向量，按照预设拆分公式，将该向量拆分为多个定点卷积核的线性组合。预设拆分公式如公式(2)所示。

其中，v ^x为全连接层的第x个大小为1×N的向量，x∈[1,M]，q为对向量v ^x拆分后得到的定点卷积核的数量，β _y为第y个定点卷积核的预设线性加权系数，t _y为第y个定点卷积核，t _y的大小为1×N，B为预设量化比特数，b _y为第y个定点卷积核对应的指定位宽。

针对网络中的全连接层，该全连接层中每个大小为1×N的向量可以理解为该全连接层的滤波器，将该全连接层中每个大小为1×N的向量拆分为q个低比特定点卷积核的线性组合，并记第y个定点卷积核的低比特定点比特数位宽(即指定位宽)为b _y。通过公式(2)将全连接层的权值张量中各向量拆分后，网络模型中每个全连接层的权值张量可以表示为如图3所示，即模型浮点向量拆分为多个低比特定点卷积核的线性组合，实质上也就是多个低比特定点卷积核中低比特定点权值的线性组合。

S103，针对网络层的各滤波器，将网络层的输入数据与该滤波器的各定点卷积核分别进行卷积运算，得到多个卷积结果，并根据该滤波器的多个定点卷积核的线性组合方式，将各卷积结果加权求和，得到该滤波器的运算结果。

通过S102对网络层的权值张量定点化，可以将一个针对浮点权值Conv层或浮点权值全连接层的运算拆分为对多个低比特定点权值Conv层或全连接层的运算操作，如图4所示，在网络模型运算时，可以将图4左部分所示的模型结构拆分为图4右部分的模型结构进行运算，在大大减少模型参数量及运算量的同时，降低了硬件平台计算颗粒度，提升了硬件平台的资源利用率。

输入数据与各定点卷积核的卷积运算就是进行点乘、相加的过程，这里不再赘述。在得到每个定点卷积核的卷积结果后，可以根据该滤波器的多个定点卷积核的线性组合方式，例如线性组合方式为加权求和的方式，则将卷积结果也进行相同方式的加权求和，即可得到该滤波器的运算结果。

可选的，在网络层为Conv层时，S103具体可以为：针对Conv层的各滤波器，按照该滤波器的各定点卷积核的预设线性加权系数，对各定点卷积核的卷积结果进行加权，并将各加权后的卷积结果相加，得到该滤波器的运算结果。

在网络层为全连接层时，S103具体可以为：针对全连接层的大小为1×N的各向量，根据该向量的各定点卷积核的预设线性加权系数，对各定点卷积核的卷积结果进行加权，并将各加权后的卷积结果相加，得到该向量的运算结果。

在S102中已对网络层分别为Conv层和全连接层，进行滤波器拆分的过程进行介绍，在进行拆分的过程中，滤波器表示为定点卷积核与预设线性加权系数乘积、相加的线性组合，因此，在进行卷积运算时，输入数据分别与各定点卷积核进行卷积运算，并根据预设线性加权系数，对卷积结果进行加权求和，得到滤波器的运算结果。

S104，确定各滤波器的运算结果组成网络层的输出数据。

网络层的滤波器对应了网络层的输出特征向量的个数，因此，网络层的输出数据实际为各滤波器的运算结果的组合，例如，如果一个网络层包括5个滤波器，则该网络层的输出数据实际包括5个特征向量。

应用本实施例，通过获取深度神经网络中网络层的权值张量，针对网络层的权值张量中各滤波器，将该滤波器拆分为多个定点卷积核的线性组合，将网络层的输入数据与该滤波器的各定点卷积核分别进行卷积运算，得到多个卷积结果，并根据该滤波器的多个定点卷积核的线性组合方式，将各卷积结果加权求和，得到该滤波器的运算结果，确定各滤波器的运算结果组成网络层的输出数据。由于各定点卷积核中的权值为具有指定位宽的定点量化值，通过对浮点数据进行定点量化，将网络层权值张量中包括浮点权值的滤波器拆分为多个包括定点量化权值的定点卷积核的线性组合，对定点量化值的运算量小于对浮点数据的运算量，因此，降低了DNN每次进行运算的运算量，从而提高了DNN的运算效率。

相应于上述方法实施例，本申请实施例提供了一种深度神经网络中的网络层运算装置，如图5所示，该深度神经网络中的网络层运算装置可以包括：

获取模块510，用于获取深度神经网络中网络层的权值张量，其中，所述权值张量包括多个滤波器；

拆分模块520，用于针对所述网络层的各滤波器，将该滤波器拆分为多个定点卷积核的线性组合，其中，各定点卷积核中的权值为具有指定位宽的定点量化值；

运算模块530，用于针对所述网络层的各滤波器，将所述网络层的输入数据与该滤波器的各定点卷积核分别进行卷积运算，得到多个卷积结果，并根据该滤波器的多个定点卷积核的线性组合方式，将各卷积结果加权求和，得到该滤波器的运算结果；

确定模块540，用于确定各滤波器的运算结果组成所述网络层的输出数据。

可选的，所述获取模块510，还可以用于根据所述深度神经网络的预设应用精度，确定预设量化比特数；

所述拆分模块520，具体可以用于：

可选的，所述网络层可以包括卷积层，所述卷积层的权值张量的大小可以为S×S×I×O；

所述拆分模块520，具体可以用于：

可选的，所述运算模块530，具体可以用于：

可选的，所述网络层可以包括全连接层，所述全连接层的权值张量的大小可以为M×N，所述全连接层的各滤波器可以为大小为1×N的各向量；

所述拆分模块520，具体可以用于：

可选的，所述运算模块530，具体可以用于：

为了提高DNN的运算效率，本申请实施例还提供了一种电子设备，如图6所示，包括处理器601和机器可读存储介质602，其中，

机器可读存储介质602，用于存储能够被处理器601执行的机器可执行指令；

处理器601，用于被机器可读存储介质602上所存放的机器可执行指令促使执行本申请实施例提供的深度神经网络中的网络层运算方法的所有步骤。

机器可读存储介质602与处理器601之间可以通过有线连接或者无线连接的方式进行数据传输，并且电子设备可以通过有线通信接口或者无线通信接口与其他的设备进行通信。

上述机器可读存储介质可以包括RAM(Random Access Memory，随机存取存储器)，也可以包括NVM(Non-volatile Memory，非易失性存储器)，例如至少一个磁盘存储器。可选的，机器可读存储介质还可以是至少一个位于远离前述处理器的存储装置。

上述处理器可以是通用处理器，包括CPU(Central Processing Unit，中央处理器)、NP(Network Processor，网络处理器)等；还可以是DSP(Digital Signal Processor，数字信号处理器)、ASIC(Application Specific Integrated Circuit，专用集成电路)、FPGA(Field-Programmable Gate Array，现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

本实施例中，该电子设备的处理器通过读取机器可读存储介质中存储的机器可执行指令，并通过运行该机器可执行指令，能够实现：通过获取深度神经网络中网络层的权值张量，针对网络层的权值张量中各滤波器，将该滤波器拆分为多个定点卷积核的线性组合，将网络层的输入数据与该滤波器的各定点卷积核分别进行卷积运算，得到多个卷积结果，并根据该滤波器的多个定点卷积核的线性组合方式，将各卷积结果加权求和，得到该滤波器的运算结果，确定各滤波器的运算结果组成网络层的输出数据。由于各定点卷积核中的权值为具有指定位宽的定点量化值，通过对浮点数据进行定点量化，将网络层权值张量中包括浮点权值的滤波器拆分为多个包括定点量化权值的定点卷积核的线性组合，对定点量化值的运算量小于对浮点数据的运算量，因此，降低了DNN每次进行运算的运算量，从而提高了DNN的运算效率。

另外，相应于上述实施例所提供的深度神经网络中的网络层运算方法，本申请实施例提供了一种机器可读存储介质，用于机器可执行指令，所述机器可执行指令促使处理器执行本申请实施例提供的深度神经网络中的网络层运算方法的所有步骤。

本实施例中，机器可读存储介质存储有在运行时执行本申请实施例所提供的深度神经网络中的网络层运算方法的机器可执行指令，因此能够实现：通过获取深度神经网络中网络层的权值张量，针对网络层的权值张量中各滤波器，将该滤波器拆分为多个定点卷积核的线性组合，将网络层的输入数据与该滤波器的各定点卷积核分别进行卷积运算，得到多个卷积结果，并根据该滤波器的多个定点卷积核的线性组合方式，将各卷积结果加权求和，得到该滤波器的运算结果，确定各滤波器的运算结果组成网络层的输出数据。由于各定点卷积核中的权值为具有指定位宽的定点量化值，通过对浮点数据进行定点量化，将网络层权值张量中包括浮点权值的滤波器拆分为多个包括定点量化权值的定点卷积核的线性组合，对定点量化值的运算量小于对浮点数据的运算量，因此，降低了DNN每次进行运算的运算量，从而提高了DNN的运算效率。

另外，本申请实施例还提供了一种应用程序，用于在运行时执行：本申请实施例所提供的深度神经网络中的网络层运算方法。

本申请实施例中，应用程序在运行时执行本申请实施例所提供的深度神经网络中的网络层运算方法，因此能够实现：通过获取深度神经网络中网络层的权值张量，针对网络层的权值张量中各滤波器，将滤波器拆分为多个定点卷积核的线性组合，将网络层的输入数据与滤波器的各定点卷积核分别进行卷积运算，得到多个卷积结果，并根据滤波器的多个定点卷积核的线性组合方式，将各卷积结果加权求和，得到滤波器的运算结果，确定各滤波器的运算结果组成网络层的输出数据。由于各定点卷积核中的权值为具有指定位宽的定点量化值，通过对浮点数据进行定点量化，将网络层权值张量中包括浮点权值的滤波器拆分为多个包括定点量化权值的定点卷积核的线性组合，对定点量化值的运算量小于对浮点数据的运算量，因此，降低了DNN每次进行运算的运算量，从而提高了DNN的运算效率。

对于电子设备、机器可读存储介质以及应用程序实施例而言，由于其所涉及的方法内容基本相似于前述的方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置、电子设备、机器可读存储介质以及应用程序实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请的较佳实施例而已，并不用以限制本申请，凡在本申请的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本申请保护的范围之内。

Claims

一种深度神经网络中的网络层运算方法，其特征在于，所述方法包括：

获取深度神经网络中网络层的权值张量，其中，所述权值张量包括多个滤波器；

针对所述网络层的各滤波器，将该滤波器拆分为多个定点卷积核的线性组合，其中，各定点卷积核中的权值为具有指定位宽的定点量化值；

针对所述网络层的各滤波器，将所述网络层的输入数据与该滤波器的各定点卷积核分别进行卷积运算，得到多个卷积结果，并根据该滤波器的多个定点卷积核的线性组合方式，将各卷积结果加权求和，得到该滤波器的运算结果；

确定各滤波器的运算结果组成所述网络层的输出数据。
根据权利要求1所述的方法，其特征在于，在所述针对所述网络层的各滤波器，将该滤波器拆分为多个定点卷积核的线性组合之前，所述方法还包括：

根据所述深度神经网络的预设应用精度，确定预设量化比特数；

所述针对所述网络层的各滤波器，将该滤波器拆分为多个定点卷积核的线性组合，包括：

针对所述网络层的各滤波器，根据所述预设量化比特数，将该滤波器拆分为多个定点卷积核的线性组合，其中，各定点卷积核对应的指定位宽之和等于所述预设量化比特数。
根据权利要求1或2所述的方法，其特征在于，所述网络层包括卷积层，所述卷积层的权值张量的大小为S×S×I×O；

所述针对所述网络层的各滤波器，将该滤波器拆分为多个定点卷积核的线性组合，包括：

针对所述卷积层的各滤波器，按照预设拆分公式，将该滤波器拆分为多个定点卷积核的线性组合，其中，所述预设拆分公式为：

所述w ⁱ为所述卷积层的第i个滤波器，所述i∈[1,O]，所述p为对所述滤波器w ⁱ拆分后得到的定点卷积核的数量，所述α _j为第j个定点卷积核的预设线性加权系数，所述t _j为第j个定点卷积核，所述t _j的大小为S×S×I，所述B为预设量化比特数，所述b _j为第j个定点卷积核对应的指定位宽。
根据权利要求3所述的方法，其特征在于，所述根据该滤波器的多个定点卷积核的线性组合方式，将各卷积结果加权求和，得到该滤波器的运算结果，包括：

针对所述卷积层的各滤波器，按照该滤波器的各定点卷积核的预设线性加权系数，对各定点卷积核的卷积结果进行加权，并将各加权后的卷积结果相加，得到该滤波器的运算结果。
根据权利要求1或2所述的方法，其特征在于，所述网络层包括全连接层，所述全连接层的权值张量的大小为M×N，所述全连接层的各滤波器为大小为1×N的各向量；

所述针对所述网络层的各滤波器，将该滤波器拆分为多个定点卷积核的线性组合，包括：

针对所述全连接层的大小为1×N的各向量，按照预设拆分公式，将该向量拆分为多个定点卷积核的线性组合，其中，所述预设拆分公式为：

所述v ^x为所述全连接层的第x个大小为1×N的向量，所述x∈[1,M]，所述q为对所述向量v ^x拆分后得到的定点卷积核的数量，所述β _y为第y个定点卷积核的预设线性加权系数，所述t _y为第y个定点卷积核，所述t _y的大小为1×N，所述 B为预设量化比特数，所述b _y为第y个定点卷积核对应的指定位宽。
根据权利要求5所述的方法，其特征在于，所述根据该滤波器的多个定点卷积核的线性组合方式，将各卷积结果加权求和，得到该滤波器的运算结果，包括：

针对所述全连接层的大小为1×N的各向量，根据该向量的各定点卷积核的预设线性加权系数，对各定点卷积核的卷积结果进行加权，并将各加权后的卷积结果相加，得到该向量的运算结果。
一种深度神经网络中的网络层运算装置，其特征在于，所述装置包括：

获取模块，用于获取深度神经网络中网络层的权值张量，其中，所述权值张量包括多个滤波器；

拆分模块，用于针对所述网络层的各滤波器，将该滤波器拆分为多个定点卷积核的线性组合，其中，各定点卷积核中的权值为具有指定位宽的定点量化值；

运算模块，用于针对所述网络层的各滤波器，将所述网络层的输入数据与该滤波器的各定点卷积核分别进行卷积运算，得到多个卷积结果，并根据该滤波器的多个定点卷积核的线性组合方式，将各卷积结果加权求和，得到该滤波器的运算结果；

确定模块，用于确定各滤波器的运算结果组成所述网络层的输出数据。
根据权利要求7所述的装置，其特征在于，所述获取模块，还用于根据所述深度神经网络的预设应用精度，确定预设量化比特数；

所述拆分模块，具体用于：

针对所述网络层的各滤波器，根据所述预设量化比特数，将该滤波器拆分为多个定点卷积核的线性组合，其中，各定点卷积核对应的指定位宽之和等于所述预设量化比特数。
根据权利要求7或8所述的装置，其特征在于，所述网络层包括卷积层，所述卷积层的权值张量的大小为S×S×I×O；

所述拆分模块，具体用于：

针对所述卷积层的各滤波器，按照预设拆分公式，将该滤波器拆分为多个定点卷积核的线性组合，其中，所述预设拆分公式为：

所述w ⁱ为所述卷积层的第i个滤波器，所述i∈[1,O]，所述p为对所述滤波器w ⁱ拆分后得到的定点卷积核的数量，所述α _j为第j个定点卷积核的预设线性加权系数，所述t _j为第j个定点卷积核，所述t _j的大小为S×S×I，所述B为预设量化比特数，所述b _j为第j个定点卷积核对应的指定位宽。
根据权利要求9所述的装置，其特征在于，所述运算模块，具体用于：

针对所述卷积层的各滤波器，按照该滤波器的各定点卷积核的预设线性加权系数，对各定点卷积核的卷积结果进行加权，并将各加权后的卷积结果相加，得到该滤波器的运算结果。
根据权利要求7或8所述的装置，其特征在于，所述网络层包括全连接层，所述全连接层的权值张量的大小为M×N，所述全连接层的各滤波器为大小为1×N的各向量；

所述拆分模块，具体用于：

针对所述全连接层的大小为1×N的各向量，按照预设拆分公式，将该向量拆分为多个定点卷积核的线性组合，其中，所述预设拆分公式为：

所述v ^x为所述全连接层的第x个大小为1×N的向量，所述x∈[1,M]，所述q为对所述向量v ^x拆分后得到的定点卷积核的数量，所述β _y为第y个定点卷积核的预设线性加权系数，所述t _y为第y个定点卷积核，所述t _y的大小为1×N，所述 B为预设量化比特数，所述b _y为第y个定点卷积核对应的指定位宽。
根据权利要求11所述的装置，其特征在于，所述运算模块，具体用于：

针对所述全连接层的大小为1×N的各向量，根据该向量的各定点卷积核的预设线性加权系数，对各定点卷积核的卷积结果进行加权，并将各加权后的卷积结果相加，得到该向量的运算结果。
一种电子设备，其特征在于，包括处理器和机器可读存储介质，所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令，所述处理器被所述机器可执行指令促使执行权利要求1-6任一项所述的方法。
一种机器可读存储介质，其特征在于，存储有机器可执行指令，在被处理器调用和执行时，所述机器可执行指令促使所述处理器执行权利要求1-6任一项所述的方法。
一种应用程序，其特征在于，用于在运行时执行：权利要求1-6任一项所述的方法。