CN109284822A

CN109284822A - 一种神经网络运算装置及方法

Info

Publication number: CN109284822A
Application number: CN201710927144.5A
Authority: CN
Inventors: 陈天石; 刘少礼; 王在; 胡帅
Original assignee: Shanghai Cambricon Information Technology Co Ltd
Current assignee: Shanghai Cambricon Information Technology Co Ltd
Priority date: 2017-07-20
Filing date: 2017-07-20
Publication date: 2019-01-29
Anticipated expiration: 2037-07-20
Also published as: CN111176727B; CN111221578B; EP3686734A4; CN107832082B; CN107729990A; CN107729989A; CN110036369B; CN110688158B; US11983534B2; CN107608715A; CN107608715B; CN110597558A; CN111176727A; CN111221578A; CN107807819B; CN110597558B; CN109284822B; US20230024840A1; CN107992329A; US11481215B2

Abstract

本披露提供了一种神经网络运算装置，包括第一幂次转换单元，用于将神经网络输入数据中的非幂次数据转换为幂次数据；运算单元，用于接收神经网络运算的数据和指令并根据运算指令对其接收的神经元数据及权值数据执行神经网络运算；其中，所述运算单元接收的所述数据包括经第一幂次转换单元转换的幂次数据。本披露提供的技术方案具有计算速度快，效率高的优点。

Description

一种神经网络运算装置及方法

技术领域

本披露涉及一种神经网络运算装置及方法。

背景技术

数据处理是大部分算法需要经过的步骤或阶段，在计算机引入数据处理领域后，越来越多的数据处理通过计算机来实现，现有的算法中有计算设备在进行神经网络的数据计算时速度慢，效率低。

披露内容

本披露实施例提供了一种神经网络运算装置及方法，可提升计算装置的处理速度，提高效率。

第一方面，提供一种神经网络运算装置，包括：第一幂次转换单元，用于将神经网络输入数据中的非幂次数据转换为幂次数据；运算单元，用于接收神经网络运算的数据和指令并根据运算指令对其接收的神经元数据及权值数据执行神经网络运算；其中，所述运算单元接收的所述数据包括经第一幂次转换单元转换的幂次数据；所述指令为卷积神经网络运算指令，包括：至少1个操作码和至少1个操作域，其中，所述操作码用于指示所述卷积神经网络运算指令的功能，所述操作域用于指示所述卷积神经网络运算指令的数据信息；所述数据信息包括：立即数或寄存器号，具体包括：输入数据的起始地址和数据长度，卷积核的起始地址和数据长度，以及激活函数的类型。

可选的，还包括：存储单元，用于存储数据和指令；其中，该存储单元与所述第一幂次转换单元连接以接收所述幂次数据。

可选的，还包括：控制单元及输出神经元缓存单元；其中

所述控制单元，与所述存储单元连接，用于控制数据和指令的交互，其接收该存储单元发送的数据和指令，并将指令译码成运算指令；

所述运算单元，与所述控制单元连接，接收该控制单元发送的数据和运算指令，并根据运算指令对其接收的神经元数据及权值数据执行神经网络运算；以及

所述输出神经元缓存单元，与所述运算单元连接，用于接收运算单元输出的神经元数据并发送至所述控制单元作为下一层神经网络运算的输入数据。

可选的，所述控制单元，包括：

数据控制模块，与所述存储单元连接，用于实现存储单元和各缓存模块之间的数据和指令交互；

指令缓存模块，与所述数据控制模块连接，用于接收该数据控制模块发送的指令；

译码模块，与所述指令缓存模块连接，用于从指令缓存模块中读取指令，并将其译码成运算指令；

输入神经元缓存模块，与所述数据控制模块连接，用于从该数据控制模块获取相应的输入神经元数据；

权值缓存模块，与所述数据控制模块连接，用于从数据控制模块获取相应的权值数据；其中，

所述运算单元，分别与所述译码模块、输入神经元缓存模块及权值缓存模块连接，接收各运算指令、神经元数据及权值数据，根据运算指令对其接收的神经元数据和权值数据执行相应的神经网络运算。

可选的，所述第一幂次转换单元用于将神经网络输入数据中的非幂次权值数据转换为幂次权值数据。

可选的，还包括：第二幂次转换单元；其中，

所述第一幂次转换单元用于将神经网络输入数据中的非幂次神经元数据及非幂次权值数据分别转换为幂次神经元数据及幂次权值数据，并发送至所述存储单元；

所述第二幂次转换单元与所述输出神经元缓存单元连接，用于将其接收的神经元数据转换为幂次神经元数据并发送至所述控制单元作为下一层神经网络运算的输入数据。

可选的，若神经网络输入数据为幂次数据则直接存入神经网络运算装置。

可选的，幂次数据包括幂次神经元数据、幂次权值数据；其中，

所述幂次神经元数据表示神经元数据的数值采用其幂指数值形式表示，其中，所述幂次神经元数据包括符号位和幂次位，符号位采用一位或多位比特位表示神经元数据的符号，幂次位采用m 位比特位表示神经元数据的幂次位数据，m为大于1的正整数；

所述幂次权值数据表示权值数据的数值采用其幂指数值形式表示，其中，所述幂次权值数据包括符号位和幂次位，符号位采用一位或多位比特位表示权值数据的符号，幂次位采用m位比特位表示权值数据的幂次位数据，m为大于1的正整数。

可选的，该神经网络运算装置的存储单元预存有编码表，用于提供幂次神经元数据及幂次权值数据的每个幂次位数据对应的指数数值。

可选的，所述编码表设置一个或者多个幂次位数据为置零幂次位数据，其对应的幂次神经元数据及幂次权值数据为0。

可选的，所述卷积神经网络运算指令包括：卷积计算指令，用于将卷积核w乘以输入数据xi，进行求和，然后加上偏置b后做激活运算s(h)，得到最终的输出结果。

可选的，所述卷积神经网络运算指令包括：COMPUTE指令、CONFIG指令、IO指令、NOP指令、JUMP指令或MOVE指令；

所述COMPUTE指令包括：卷积神经网络sigmoid指令、卷积神经网络TanH指令、卷积神经网络ReLU指令以及卷积神经网络group指令；

所述卷积神经网络sigmoid指令，用于在装置分别从存储器的指定地址取出指定大小的输入数据和卷积核，在卷积运算部件中做卷积操作，然后根据所述sigmoid指令将输出结果做sigmoid激活；

所述卷积神经网络TanH指令，用于在装置分别从存储器的指定地址取出指定大小的输入数据和卷积核，在卷积运算部件中做卷积操作，然后根据所述TanH指令将输出结果做TanH激活；

所述卷积神经网络ReLU指令，用于在装置分别从存储器的指定地址取出指定大小的输入数据和卷积核，在卷积运算部件中做卷积操作，然后根据所述ReLU指令将输出结果做ReLU激活；

所述卷积神经网络group指令，用于装置分别从存储器的指定地址取出指定大小的输入数据和卷积核，划分group之后，在卷积运算部件中做卷积操作，然后根据所述group指令将输出结果做激活。

可选的，所述CONFIG指令，用于指引装置在每层人工神经网络计算开始前配置当前层计算需要的各种常数；

或所述IO指令，用于指引装置实现从外部存储空间读入计算需要的输入数据以及在计算完成后将数据存回至外部存储空间；

或所述NOP指令，用于指引装置清空当前装置内部所有控制信号缓存队列中的控制信号；

或所述JUMP指令，用于指引装置实现控制流的跳转；

或所述MOVE指令，用于指引装置内部地址空间中某一地址的数据搬运至内部地址空间的另一地址。

第二方面，提供一种神经网络运算方法，所述方法包括：

获取指令、幂次神经元数据及幂次权值数据；

根据运算指令对幂次神经元数据及幂次权值数据进行神经网络运算；

所述指令为卷积神经网络运算指令，包括：至少1个操作码和至少1个操作域，其中，

所述操作码用于指示所述卷积神经网络运算指令的功能，所述操作域用于指示所述卷积神经网络运算指令的数据信息；

所述数据信息包括：立即数或寄存器号，具体包括：输入数据的起始地址和数据长度，卷积核的起始地址和数据长度，以及激活函数的类型。

可选的，所述方法还包括：

将神经网络运算后的神经元数据输出并作为下一层神经网络运算的输入数据；重复神经网络运算步骤直到神经网络最后一层运算结束。

可选的，所述获取指令、权值数据及神经元数据，包括：

将指令、神经元数据及权值数据输入存储单元；

数据控制模块接收该存储单元发送的指令、神经元数据及权值数据；

指令缓存模块、输入神经元缓存模块及权值缓存模块分别接收该数据控制模块发送的指令、神经元数据及权值数据；其中，若输入存储单元的权值数据为非幂次权值数据则经第一幂次转换单元转换为幂次权值数据输入所述存储单元；若输入存储单元的权值数据为幂次权值数据则直接输入所述存储单元；输出神经元缓存单元接收所述计算单元发送的神经网络运算后得到的神经元数据并发送至所述数据控制模块作为下一层神经网络运算的输入数据。

可选的，所述获取指令、权值数据及神经元数据，包括：

将指令、神经元数据及权值数据输入存储单元；

指令缓存模块、输入神经元缓存模块及权值缓存模块分别接收该数据控制模块发送的指令、神经元数据及权值数据；其中，若输入存储单元的神经元数据及权值数据为非幂次神经元数据及非幂次权值数据则经第一幂次转换单元转换为幂次神经元数据及幂次权值数据输入所述存储单元；若输入存储单元的神经元数据及权值数据为幂次神经元数据及幂次权值数据则直接输入所述存储单元；出神经元缓存单元接收所述计算单元发送的神经网络运算后得到的神经元数据；第二幂次转换单元接收输出神经元缓存单元发送的神经元数据将其转换为幂次神经元数据，并发送至所述数据控制模块作为下一层神经网络运算的输入数据。

可选的，所述方法包括：

译码模块从指令缓存模块中读取指令，并将其译码成各运算指令；

运算单元分别接收所述译码模块、输入神经元缓存模块及权值缓存模块发送的运算指令、神经元数据以及权值数据，并根据运算指令对神经元数据和权值数据进行神经网络运算。

或所述JUMP指令，用于指引装置实现控制流的跳转；

可以看出，通过本披露实施例，计算装置设置有寄存器单元了存储介质，其分别存储标量数据以及矩阵数据，并且本披露为两种存储器分配了单位读取方式以及批量读取方式，通过对矩阵数据的特点分配匹配其特征的数据读取方式，能够很好的利用带宽，避免因为带宽的瓶颈对矩阵计算速度的影响，另外，对于寄存器单元来说，由于其存储的为标量数据，设置了标量数据的读取方式，提高了带宽的利用率，所以本披露提供的技术方案能够很好的利用带宽，避免带宽对计算速度的影响，所以其具有计算速度快，效率高的优点。

附图说明

图1A是一种计算装置结构示意图。

图1B是另一种计算装置结构示意图。

图2A是本披露实施例提供的计算装置的另一种结构示意图。

图2B是本披露实施例提供的卷积计算指令的流程示意图。

图3为依据本披露的神经网络运算装置的结构示意图。

图4为依据本披露的神经网络运算装置的结构示意图。

图5为依据本披露的神经网络运算方法流程图。

图5.1为依据本披露的编码表的示意图。

图5.2为依据本披露的编码表的另一示意图。

图5.3为依据本披露的编码表的另一示意图。

图5.4为依据本披露的编码表的另一示意图。

图5.5为依据本披露的幂次数据的表示方法示意图。

图5.6为依据本披露的神经元与幂次权值的乘法操作示意图。

图5.7为依据本披露的神经元与幂次权值的乘法操作示意图。

图6为依据本披露的神经网络运算方法流程图。

图6.1为依据本披露的编码表的示意图。

图6.2为依据本披露的编码表的另一示意图。

图6.3为依据本披露的编码表的另一示意图。

图6.4为依据本披露的编码表的另一示意图。

图6.5为依据本披露的幂次数据的表示方法示意图。

图6.6为依据本披露的幂次神经元与幂次权值的乘法操作示意图。

具体实施方式

本披露提供一种矩阵计算装置，包括存储单元、寄存器单元和矩阵运算单元，存储单元中存储有矩阵，寄存器单元中存储有矩阵存储的地址矩阵运算单元根据矩阵运算指令在寄存器单元中获取矩阵地址，然后，根据该矩阵地址在存储单元中获取相应的矩阵，接着，根据获取的矩阵进行矩阵运算，得到矩阵运算结果。本披露将参与计算的矩阵数据暂存在高速暂存存储器上，使得矩阵运算过程中可以更加灵活有效地支持不同宽度的数据，提升包含大量矩阵计算任务的执行性能。

需要说明的是，本披露具体实施方式中的矩阵具体可以为m*n矩阵、1*n矩阵或m*1矩阵，其中m、n为大于等于2的整数。当矩阵为1*n矩阵或m*1矩阵时，也可以称为向量，下述矩阵均可以为上述三种类型矩阵中的任意一种，下面不在赘述。以人工神经网络算法为例，多种神经网络算法中都含有大量的矩阵运算。在神经网络中，输出神经元的运算表达式为y＝f(wx+b)，其中 w是第一矩阵，x是第二矩阵、b是第三矩阵，计算输出矩阵y的过程为矩阵w与矩阵x相乘，加上矩阵b。因此，矩阵运算成为目前各种计算装置在设计时需要考虑的问题，现有的矩阵的计算速度慢，无法满足用户对计算装置的要求，效率低。

参阅图1A，图1A为一种计算装置，在如图1A所示的矩阵的计算装置中，其包含多个通用处理器101(CPU)，每个CPU均包含自身的内存，其处理的方法可以为，多个CPU并行处理矩阵的计算，此方案虽在在矩阵的计算中采用并行处理的方式，但是其并不能有效的提高效率，因为对于矩阵运算中，第二矩阵运算的结果可能需要使用第一矩阵运算的结果，具体的，第一矩阵运算为f(1)＝A+B，第二矩阵运算为：f(2)＝f(1)+C，对于第二矩阵运算来说，其需要提取第一矩阵运算的结果f(1)才能够进行实际的矩阵计算处理，此种情况在神经网络计算中尤为突出，由于多个CPU并行处理矩阵运算，那么在矩阵计算的分配时，很有可能CPU1执行第一矩阵运算， CPU2执行第二矩阵运算，那么对于CPU2来说，其需要从CPU1提取第一矩阵运算的结果f(1)，所以对于多CPU并行处理矩阵来说，多个CPU之间的通讯成为矩阵运算的瓶颈，影响矩阵计算的速度。

参阅图1B，图1B为另一种计算装置，在如图1B所示的计算装置中，其包含有图形处理器 (GPU)102，通过GPU102来执行矩阵的运算，对于GPU来说，其本身也包含内存1021，GPU102 在处理矩阵运算时，GPU102需要从内存1021中提取矩阵运算所需的矩阵，矩阵由于其数据量大，单个矩阵所占用的存储空间比标量要大很多，对于GPU102来说，虽然其运算能够非常强，但是 GPU102的内存的容量不够，无法存储大量的矩阵，为了解决这个问题，图1B配置了片外数据库 103，GPU102可以从片外数据库103中读取矩阵，具体的读取方式为，GPU102从片外数据库103 中提取待计算的矩阵，将该矩阵存储在内存1021中，在执行矩阵运算时，进行矩阵指令的译码处理，然后从内存1021中提取该矩阵进行计算。此技术方案在执行矩阵计算中，GPU102进行矩阵指令的译码会占用GPU很大部分的计算能力，，影响矩阵的计算速度，效率低。

本披露中提到的输入神经元和输出神经元并非是指整个神经网络的输入层中神经元和输出层中神经元，而是对于网络中任意相邻的两层，处于网络前馈运算下层中的神经元即为输入神经元，处于网络前馈运算上层中的神经元即为输出神经元。以卷积神经网络为例，设一个卷积神经网络有L层，K＝1,2,...,L-1，对于第K层和第K+1层来说，我们将第K层称为输入层，其中的神经元为所述输入神经元，第K+1层称为输出层，其中的神经元为所述输出神经元。即除最顶层外，每一层都可以作为输入层，其下一层为对应的输出层。

参阅图2A，图2A提供了一种计算装置，该计算装置包括：存储介质611(可选的)、寄存器单元612、互联模块613、运算单元614、控制单元615和数据访问单元616；

其中，运算单元614包括：加法计算器、乘法计算器、比较器、激活运算器中至少二种。

互联模块613，用于控制运算单元614中计算器的连接关系使得该至少二种计算器组成不同的计算拓扑结构。

指令存储单元(可以是寄存器单元，指令缓存，高速暂存存储器)612，用于存储该运算指令、数据块的在存储介质的地址、运算指令对应的计算拓扑结构。

该运算指令可以包括：操作域以及操作码，以卷积计算指令为例，如表1所示，其中，寄存器0、寄存器1、寄存器堆2、寄存器3、寄存器4可以为操作域。其中，每个寄存器0、寄存器1、寄存器2、寄存器3、寄存器4可以是一个或者多个寄存器。

存储介质611可以为片外存储器，当然在实际应用中，也可以为片内存储器，用于存储数据块，该数据块具体可以为n维数据，n为大于等于1的整数，例如，n＝1时，为1维数据，即向量，如 n＝2时，为2维数据，即矩阵，如n＝3或3以上时，为多维数据。

控制单元615，用于从寄存器单元612内提取运算指令、该运算指令对应的操作域以及该运算指令对应的第一计算拓扑结构，将该运算指令译码成执行指令，该执行指令用于控制运算单元执行运算操作，将该操作域传输至数据访问单元616，将该计算拓扑结构传输至互联模块613。

数据访问单元616，用于从存储介质611中提取该操作域对应的数据块，并将该数据块传输至互联模块613。

互联模块613、用于接收第一计算拓扑结构和数据块。一个实施例里，互联模块613还根据第一计算拓扑结构对数据块重新摆放。

运算单元614，用于该执行指令调用运算单元614的计算器对该数据块执行运算操作得到运算结果，将该运算结果传输至数据访问单元存储在存储介质内。一个实施例里，运算单元614，用于按第一计算拓扑结构以及该执行指令调用计算器对重新摆放的数据块执行运算操作得到运算结果，将该运算结果传输至数据访问单元存储在存储介质内。

另一个实施例里，互联模块613、用于依据控制运算单元614中计算器的连接关系形成第一计算拓扑结构。

本披露提供的计算装置设置了互联模块，此互联模块能够根据运算指令的需要将运算单元内的计算器组合连接得到与该运算指令对应的计算拓扑结构，进而在后续的运算单元运算时无需对计算的中间数据执行存储或提取操作，此结构实现单一指令即能实现一次输入即能够进行多次计算器的运算得到计算结果的优点，提高了计算效率。

下面通过不同的运算指令来说明如图2A所示的计算装置的具体计算方法，这里的运算指令以卷积计算指令为例，该卷积计算指令可以应用在神经网络中，所以该卷积计算指令也可以称为卷积神经网络。对于卷积计算指令来说，其实际需要执行的公式可以为:s＝s(∑wx_i+b),其中，即将卷积核w乘以输入数据x_i，进行求和，然后加上偏置b后做激活运算s(h)，得到最终的输出结果s。依据该公式即可以得到该计算拓扑结构为，乘法运算器-加法运算器-(可选的)激活运算器。

上述卷积计算指令可以包括指令集，该指令集包含有不同功能的卷积神经网络COMPUTE指令以及CONFIG指令、IO指令、NOP指令、JUMP指令和MOVE指令。在一种实施例中，COMPUTE 指令包括：

卷积神经网络sigmoid指令，根据该指令，装置分别从存储器(优选的高速暂存存储器或者标量寄存器堆)的指定地址取出指定大小的输入数据和卷积核，在卷积运算部件中做卷积操作，优选的，然后将输出结果做sigmoid激活；

卷积神经网络TanH指令，根据该指令，装置分别从存储器(优选的高速暂存存储器)的指定地址取出指定大小的输入数据和卷积核，在卷积运算部件中做卷积操作，优选的，然后将输出结果做TanH激活；

卷积神经网络ReLU指令，根据该指令，装置分别从存储器(优选的高速暂存存储器)的指定地址取出指定大小的输入数据和卷积核，在卷积运算部件中做卷积操作，优选的，然后将输出结果做ReLU激活；以及

卷积神经网络group指令，根据该指令，装置分别从存储器(优选的高速暂存存储器)的指定地址取出指定大小的输入数据和卷积核，划分group之后，在卷积运算部件中做卷积操作，优选的，然后将输出结果做激活。

CONFIG指令在每层人工神经网络计算开始前配置当前层计算需要的各种常数。

IO指令实现从外部存储空间读入计算需要的输入数据以及在计算完成后将数据存回至外部空间。

NOP指令负责清空当前装置内部所有控制信号缓存队列中的控制信号，保证NOP指令之前的所有指令全部指令完毕。NOP指令本身不包含任何操作；

JUMP指令负责控制将要从指令存储单元读取的下一条指令地址的跳转，用来实现控制流的跳转；

MOVE指令负责将装置内部地址空间某一地址的数据搬运至装置内部地址空间的另一地址，该过程独立于运算单元，在执行过程中不占用运算单元的资源。

如图2A所示的计算装置执行卷积计算指令的方法具体可以为：

控制单元615从寄存器单元612内提取卷积计算指令、卷积计算指令对应的操作域以及卷积计算指令对应的第一计算拓扑结构(乘法运算器-加法运算器-加法运算器-激活运算器)，控制单元将该操作域传输至数据访问单元，将该第一计算拓扑结构传输至互联模块。

数据访问单元存储介质内提取该操作域对应的卷积核w和偏置b(当b为0时，不需要提取偏置b)，将卷积核w和偏置b传输至计算单元。

计算单元的乘法运算器将卷积核w与输入数据Xi执行乘法运算以后得到第一结果，将第一结果输入到加法运算器执行加法运算得到第二结果，将第二结果和偏置b执行加法运算得到第三结果，将第三结果输到激活运算器执行激活运算得到输出结果s，将输出结果s传输至数据访问单元存储至存储介质内。其中，每个步骤后都可以直接输出结果传输到数据访问存储至存储介质内，无需下面的步骤。另外，将第二结果和偏置b执行加法运算得到第三结果这一步骤可选，即当b 为0时，不需要这个步骤。

另外，加法运算和乘法运算的顺序可以调换。

本披露提供的技术方案通过一个指令即卷积计算指令即实现了卷积的计算，在卷积计算的中间数据(例如第一结果、第二结果、第三结果)均无需存储或提取，减少了中间数据的存储以及提取操作，所以其具有减少对应的操作步骤，提高卷积的计算效果的优点。

图2B是本披露实施例提供的卷积神经网络运算装置执行卷积神经网络的流程图，如图2B所示，执行卷积神经网络指令的过程包括：

在步骤S6B1，在指令存储单元的首地址处预先存入一条IO指令。

在步骤S6B2，控制器单元从指令存储单元的首地址读取该条IO指令，根据译出的控制信号，数据访问单元从存储介质读取相应的所有卷积神经网络运算指令，并将其缓存在指令存储单元中。

在步骤S6B3，控制器单元接着从指令存储单元读入下一条IO指令，根据译出的控制信号，数据访问单元从存储介质读取运算单元需要的所有数据块(例如，包括输入数据、用于作快速的激活函数运算的插值表、用于配置运算器件参数的常数表、偏置数据等)。

在步骤S6B4，控制器单元接着从指令存储单元读入下一条CONFIG指令，根据译出的控制信号，装置配置该层神经网络计算需要的各种常数。例如，运算单元根据控制信号里的参数配置单元内部寄存器的值，所述参数包括例如激活函数需要的数据。

在步骤S6B5，控制器单元接着从指令存储单元读入下一条COMPUTE指令，根据译出的控制信号，互连模块将卷积窗口内的输入数据发给计算单元内的各计算器。

在步骤S6B6，根据COMPUTE指令译出的控制信号，互联模块将乘法计算器、加法计算器和激活计算器连接形成第一计算拓扑结构。

在步骤S6B7，乘法运算器将卷积核w与输入数据Xi执行乘法运算以后得到第一结果，将第一结果输入到加法运算器执行加法运算得到第二结果，将第二结果和偏置b执行加法运算得到第三结果，将第三结果输入到激活运算器执行激活运算得到输出结果s，将输出结果s传输至数据访问单元存储至存储介质内。其中，将第二结果和偏置b执行加法运算得到第三结果这一步骤可选，即当b为0时，不需要这个步骤。

本披露还提供了一种神经网络运算装置。图3为依据本实施例神经网络运算装置的示意图。在一种可选实施例中，该神经网络运算装置可以为如图2A所示的计算装置，在如图2A所示的计算装置内，可以添加在幂次转换单元，该幂次转换单元与存储介质连接，用于将神经网络输入数据中非幂次权值数据转换为幂次权值数据。可选的，上述计算装置还可以包括：控制单元以及运算单元等等，控制单元以及运算单元的具体描述可以参见如图2A所示实施例的描述，这里不再赘述，另外，上述如图2A所示的计算装置还可以增加或扩展如图3所示的神经网络运算装置。另一种可选实施例中，神经网络运算装置的结构如图3，包括：

存储单元1，用于存储数据和指令；

控制单元，与所述存储单元连接，用于控制数据和指令的交互，其接收该存储单元发送的数据和指令，并将指令译码成运算指令；

运算单元7，与所述控制单元连接，接收该控制单元发送的数据和运算指令，并根据运算指令对其接收的神经元数据及权值数据执行神经网络运算；

输出神经元缓存单元8，与所述运算单元连接，用于接收运算单元输出的神经元数据；并将其发送至所述控制单元。由此可作为下一层神经网络运算的输入数据；以及

幂次转换单元9，其与所述存储单元连接，用于将神经网络输入数据中非幂次权值数据转换为幂次权值数据，并发送至所述存储单元。而对于神经网络输入数据中的幂次权值数据，则直接存入存储单元。

具体的，所述控制单元包括：

数据控制模块2，与所述存储单元连接，用于存储单元和各缓存模块之间的数据和指令交互；

指令缓存模块3，与所述数据控制模块连接，用于接收数据控制模块发送的指令；

译码模块4，与所述指令缓存模块连接，用于从指令缓存模块中读取指令，并将其译码成各运算指令；

输入神经元缓存模块5，与所述数据控制模块连接，用于接收数据控制模块发送的神经元数据；

权值缓存模块6，与所述数据控制模块连接，用于接收从数据控制模块发送的权值数据。

进一步的，所述运算单元7，分别与所述译码模块、输入神经元缓存模块及权值缓存模块连接，接收各运算指令、神经元数据及权值数据，用于根据各运算指令对其接收的神经元数据和权值数据执行相应的运算。所述输出神经元缓存单元8，与所述运算单元连接，用于接收运算单元输出的神经元数据；并将其发送至所述控制单元的数据控制模块2。由此可作为下一层神经网络运算的输入数据

其中，存储单元从外部地址空间接收数据和指令，该数据包括神经网络权值数据、神经网络输入数据等。

进一步的，幂次转换操作有多种可选方式。下面列举本实施例所采用的三种幂次转换操作：

第一种幂次转换方法：

其中，d_in为幂次转换单元的输入数据，d_out为幂次转换单元的输出数据，s_in为输入数据的符号， s_out为输出数据的符号，d_in+为输入数据的正数部分，d_in+＝d_in×s_in，d_out+为输出数据的正数部分，d_out+＝d_out×s_out，表示对数据x做取下整操作。

第二种幂次转换方法：

d_out+＝|log₂(d_in+)|

其中，

其中，d_in为幂次转换单元的输入数据，d_out为幂次转换单元的输出数据，s_in为输入数据的符号， s_out为输出数据的符号，d_in+为输入数据的正数部分，d_in+＝d_in×s_in，d_out+为输出数据的正数部分， d_out+＝d_out×s_out，表示对数据x做取上整操作。

第三种幂次转换方法：

其中，

其中，d_in为幂次转换单元的输入数据，d_out为幂次转换单元的输出数据；s_in为输入数据的符号， s_out为输出数据的符号；d_in+为输入数据的正数部分，d_in+＝d_in×s_in，d_out+为输出数据的正数部分， d_out+＝d_out×s_out；[x]表示对数据x做四舍五入操作。

本披露还提供了另一种神经网络运算装置。图4为依据本实施例神经网络运算装置的示意图。请参照图4，本实施例神经网络运算装置，包括：

存储单元101，用于存储数据和指令；该存储单元从外部地址空间接收数据和指令，该数据包括神经网络权值数据、神经网络输入数据等。

运算单元107，与所述控制单元连接，接收该控制单元发送的数据和运算指令，并根据运算指令对其接收的权值数据和神经元数据执行神经网络运算；

输出神经元缓存单元108，与所述运算单元连接，用于接收运算单元输出的神经元数据，并将其发送至所述控制单元；

幂次转换单元109，其与所述存储单元连接，用于将神经网络输入数据中非幂次神经元数据及非幂次权值数据分别转换为幂次神经元数据及幂次权值数据，并发送至所述存储单元。而对于神经网络输入数据中的幂次神经元数据及幂次权值数据，则直接存入存储单元；以及

幂次转换单元110，其与所述输出神经元缓存单元108连接，用于将神经网络运算后的神经元数据转换为幂次神经元数据，并发送至所述控制单元。

进一步的，所述控制单元包括：

数据控制模块102，与所述存储单元连接，用于存储单元和各缓存模块之间的数据和指令交互；

指令缓存模块103，与所述数据控制模块连接，用于接收数据控制模块发送的指令；

译码模块104，与所述指令缓存模块连接，用于从指令缓存模块中读取指令，并将其译码成各运算指令；

输入神经元缓存模块105，与所述数据控制模块连接，用于接收数据控制模块发送的神经元数据；

权值缓存模块106，与所述数据控制模块连接，用于接收从数据控制模块发送的权值数据。

具体的，所述运算单元107，分别与所述译码模块、输入神经元缓存模块及权值缓存模块连接，接收各运算指令、神经元数据及权值数据，用于根据各运算指令对其接收的神经元数据和权值数据执行相应的运算。

所述幂次转换单元110，与所述数据控制模块连接，用于将神经网络运算后的神经元数据转换为幂次神经元数据，并发送至所述控制单元的数据控制模块102。通过幂次转换单元110获得的幂次神经元数据可作为神经网络运算下一层的输入神经元。

另外，所述幂次转换的具体操作方法与前述实施例相同，此处不再赘述。

另外，本披露实施例还提供了一种神经网络运算方法，图5为本实施例神经网络运算方法的流程图。具体而言，本披露实施例的神经网络为多层神经网络，对于每层神经网络可按图5所示的运算方法进行运算，其中，神经网络第一层输入幂次权值数据可通过存储单元从外部地址读入，若外部地址读入的权值数据已经为幂次权值数据则直接传入存储单元，否则先通过幂次转换单元转换为幂次权值数据。请参照图5，本实施例单层神经网络运算方法，包括：

步骤S1，获取指令、神经元数据及幂次权值数据。

其中，所述步骤S1包括以下子步骤：

S11，将指令、神经元数据及权值数据输入存储单元；其中，对幂次权值数据直接输入存储单元，对非幂次权值数据经过幂次转换单元转换后输入存储单元；

S12，数据控制模块接收该存储单元发送的指令、神经元数据及幂次权值数据；

S13，指令缓存模块、输入神经元缓存模块及权值缓存模块分别接收所述数据控制模块发送的指令、神经元数据及幂次权值数据并分发给译码模块或运算单元。

所述幂次权值数据表示权值数据的数值采用其幂指数值形式表示，具体为，幂次权值数据包括符号位和幂次位，符号位用一位或多位比特位表示权值数据的符号，幂次位用m位比特位表示权值数据的幂次位数据，m为大于1的正整数。存储单元预存有编码表，提供幂次权值数据的每个幂次位数据对应的指数数值。编码表设置一个或者多个幂次位数据(即置零幂次位数据)为指定对应的幂次权值数据为0。也就是说，当幂次权值数据的幂次位数据是编码表里的置零幂次位数据时候，表示该幂次权值数据为0。

编码表的对应关系可以是任意的。

例如，编码表的对应关系可以是乱序的。如图5.1所示一种m为5的编码表的部分内容，幂次位数据为00000的时候对应指数数值为0。幂次位数据为00001的时候对应指数数值为3。幂次位数据为00010的时候对应指数数值为4。幂次位数据为00011的时候对应指数数值为1。幂次位数据为00100的时候对应幂次权值数据为0。

编码表的对应关系也可以是正相关的，存储单元预存一个整数值x和一个正整数值y，最小的幂次位数据对应指数数值为x，其他任意一个或多个幂次位数据对应幂次权值数据为0。x表示偏置值，y表示步长。在一种实施例情况下，最小的幂次位数据对应指数数值为x，最大的幂次位数据对应幂次权值数据为0，最小和最大的幂次位数据之外的其他的幂次位数据对应指数数值为(幂次位数据+x)*y。通过预设定不同的x和y以及通过改变x和y的数值，幂次的表示范围变得可配，可以适用于需要不同数值范围的不同的应用场景。因此，本神经网络运算装置的应用范围更加广泛，使用更加灵活可变，可根据用户需求来做调整。

在一种实施方式中，y为1，x的数值等于-2^m-1。由此幂次权值数据所表示的数值的指数范围为-2^m-1～2^m-1-1。

在一种实施方式中，如图5.2所示，一种m为5，x为0，y为1的编码表的部分内容，幂次位数据为00000的时候对应指数数值为0。幂次位数据为00001的时候对应指数数值为1。幂次位数据为00010的时候对应指数数值为2。幂次位数据为00011的时候对应指数数值为3。幂次位数据为11111的时候对应幂次权值数据为0。如图5.3所示，另一种m为5，x为0，y为2的编码表的部分内容，幂次位数据为00000的时候对应指数数值为0。幂次位数据为00001的时候对应指数数值为2。幂次位数据为00010的时候对应指数数值为4。幂次位数据为00011的时候对应指数数值为6。幂次位数据为11111的时候对应幂次权值数据为0。

编码表的对应关系可以是负相关的，存储单元预存一个整数值x和一个正整数值y，最大的幂次位数据对应指数数值为x，其他任意一个或多个幂次位数据对应幂次权值数据为0。x表示偏置值，y表示步长。在一种实施例情况下，最大的幂次位数据对应指数数值为x，最小的幂次位数据对应幂次权值数据为0，最小和最大的幂次位数据之外的其他的幂次位数据对应指数数值为(幂次位数据-x)*y。通过预设定不同的x和y以及通过改变x和y的数值，幂次的表示范围变得可配，可以适用于需要不同数值范围的不同的应用场景。因此，本神经网络运算装置的应用范围更加广泛，使用更加灵活可变，可根据用户需求来做调整。

在一种实施方式中，y为1，x的数值等于2^m-1。由此幂次权值数据所表示的数值的指数范围为-2^m-1-1～2^m-1。

如图5.4所示，一种m为5的编码表的部分内容，幂次位数据为11111的时候对应数数值为0。幂次位数据为11110的时候对应指数数值为1。幂次位数据为11101的时候对应指数数值为2。幂次位数据为11100的时候对应指数数值为3。幂次位数据为00000的时候对应幂次权值数据为0。

编码表的对应关系可以是幂次位数据最高位代表置零位，幂次位数据其他m-1位对应指数数值。当幂次位数据最高位为0时，对应幂次权值数据为0；当幂次位数据最高位为1时，对应幂次权值数据不为0。反之亦可，即当幂次位数据最高位为1时，对应幂次权值数据为0；当幂次位数据最高位为0时，对应幂次权值数据不为0。用另一种语言来描述，即幂次权值数据的幂次位被分出一个比特来指示幂次权值数据是否为0。

在一个具体实例图5.5所示，符号位为1位，幂次位数据位为7位，即m为7。编码表为幂次位数据为11111111的时候对应幂次权值数据为0，幂次位数据为其他数值的时候幂次权值数据对应相应的二进制补码。当幂次权值数据符号位为0，幂次位为0001001，则其表示具体数值为2⁹，即512；幂次权值数据符号位为1，幂次位为1111101，则其表示具体数值为-2^-3，即-0.125。相对于浮点数据，幂次数据只保留数据的幂次位，极大减小了存储数据所需的存储空间。

通过幂次数据表示方法，可以减小存储权值数据所需的存储空间。在本实施例所提供示例中，幂次数据为8位数据，应当认识到，该数据长度不是固定不变的，在不同场合下，根据数据权值的数据范围采用不同的数据长度。

步骤S2，根据运算指令对神经元数据及幂次权值数据进行神经网络运算。其中，所述步骤S2 包括以下子步骤：

S21，译码模块从指令缓存模块中读取指令，并将其译码成各运算指令；

S22，运算单元分别接收所述译码模块、输入神经元缓存模块及权值缓存模块发送的运算指令、幂次权值数据以及神经元数据，并根据运算指令对神经元数据及幂次表示的权值数据进行神经网络运算。

所述神经元与幂次权值乘法操作具体为，神经元数据符号位与幂次权值数据符号位做异或操作；编码表的对应关系为乱序的情况下查找编码表找出幂次权值数据幂次位对应的指数数值，编码表的对应关系为正相关的情况下记录编码表的指数数值最小值并做加法找出幂次权值数据幂次位对应的指数数值，编码表的对应关系为负相关的情况下记录编码表的最大值并做减法找出幂次权值数据幂次位对应的指数数值；将指数数值与神经元数据幂次位做加法操作，神经元数据有效位保持不变。

具体实例一如图5.6所示，神经元数据为16位浮点数据，符号位为0，幂次位为10101，有效位为0110100000，则其表示的实际数值为1.40625*2⁶。幂次权值数据符号位为1位，幂次位数据位为5位，即m为5。编码表为幂次位数据为11111的时候对应幂次权值数据为0，幂次位数据为其他数值的时候幂次位数据对应相应的二进制补码。幂次权值为000110，则其表示的实际数值为 64，即2⁶。幂次权值的幂次位加上神经元的幂次位结果为11011，则结果的实际数值为1.40625*2¹²，即为神经元与幂次权值的乘积结果。通过该运算操作，使得乘法操作变为加法操作，减小计算所需的运算量。

具体实例二如图5.7所示，神经元数据为32位浮点数据，符号位为1，幂次位为10000011，有效位为10010010000000000000000，则其表示的实际数值为-1.5703125*2⁴。幂次权值数据符号位为1位，幂次位数据位为5位，即m为5。编码表为幂次位数据为11111的时候对应幂次权值数据为0，幂次位数据为其他数值的时候幂次位数据对应相应的二进制补码。幂次神经元为111100，则其表示的实际数值为-2^-4。(神经元的幂次位加上幂次权值的幂次位结果为01111111，则结果的实际数值为1.5703125*2⁰，即为神经元与幂次权值的乘积结果。

可选的，还包括步骤S3，将神经网络运算后的神经元数据输出并作为下一层神经网络运算的输入数据。

其中，所述步骤S3可包括以下子步骤：

S31，输出神经元缓存单元接收所述计算单元发送的神经网络运算后得到的神经元数据。

S32，将输出神经元缓存单元接收的神经元数据传输给数据控制模块，通过输出神经元缓存单元获得的神经元数据可作为神经网络运算下一层的输入神经元，再重复步骤S1至步骤S3直到神经网络最后一层运算结束。

另外，通过幂次转换单元获得的幂次神经元数据可作为神经网络运算下一层的输入幂次神经元，再重复步骤1至步骤3直到神经网络最后一层运算结束。通过改变存储单元预存的整数值x 和正整数值y，可以调整神经网络运算装置所能表示的幂次神经元数据范围。

另外，本披露实施例还提供了另一种神经网络运算方法，图6为本实施例神经网络运算方法的流程图。

具体而言，本披露实施例的神经网络为多层神经网络，对于每层神经网络可按图6所示的运算方法进行运算，其中，神经网络第一层输入幂次权值数据可通过存储单元从外部地址读入，若外部地址读入的数据已经为幂次权值数据则直接传入存储单元，否则先通过幂次转换单元转换为幂次权值数据；而神经网络第一层输入幂次神经元数据可通过存储单元从外部地址读入，若外部地址读入的数据已经为幂次数据则直接传入存储单元，否则先通过幂次转换单元转换为幂次神经元数据，此后各层神经网络的输入神经元数据可由在该层之前的一层或多层神经网络的输出幂次神经元数据提供。请参照图6，本实施例单层神经网络运算方法，包括：

步骤S4，获取指令、幂次神经元数据及幂次权值数据。

其中，所述步骤S4包括以下子步骤：

S41，将指令、神经元数据及权值数据输入存储单元；其中，对幂次神经元数据及幂次权值数据直接输入存储单元，对非幂次神经元数据及非幂次权值数据则经过所述第一幂次转换单元转换为幂次神经元数据及幂次权值数据后输入存储单元；

S42，数据控制模块接收该存储单元发送的指令、幂次神经元数据及幂次权值数据；

S43，指令缓存模块、输入神经元缓存模块及权值缓存模块分别接收所述数据控制模块发送的指令、幂次神经元数据及幂次权值数据并分发给译码模块或运算单元。

所述幂次神经元数据及幂次权值数据表示神经元数据及权值数据的数值采用其幂指数值形式表示，具体为，幂次神经元数据及幂次权值数据均包括符号位和幂次位，符号位用一位或多位比特位表示神经元数据及权值数据的符号，幂次位用m位比特位表示神经元数据及权值数据的幂次位数据，m为大于1的正整数。存储单元的存储单元预存有编码表，提供幂次神经元数据及幂次权值数据的每个幂次位数据对应的指数数值。编码表设置一个或者多个幂次位数据(即置零幂次位数据)为指定对应的幂次神经元数据及幂次权值数据为0。也就是说，当幂次神经元数据及幂次权值数据的幂次位数据是编码表里的置零幂次位数据时候，表示该幂次神经元数据及幂次权值数据为0。

编码表的对应关系可以是任意的。

例如，编码表的对应关系可以是乱序的。如图6.1所示一种m为5的编码表的部分内容，幂次位数据为00000的时候对应指数数值为0。幂次位数据为00001的时候对应指数数值为3。幂次位数据为00010的时候对应指数数值为4。幂次位数据为00011的时候对应指数数值为1。幂次位数据为00100的时候对应幂次神经元数据及幂次权值数据为0。

编码表的对应关系也可以是正相关的，存储单元预存一个整数值x和一个正整数值y，最小的幂次位数据对应指数数值为x，其他任意一个或多个幂次位数据对应幂次神经元数据及幂次权值数据为0。x表示偏置值，y表示步长。在一种实施例情况下，最小的幂次位数据对应指数数值为x，最大的幂次位数据对应幂次神经元数据及幂次权值数据为0，最小和最大的幂次位数据之外的其他的幂次位数据对应指数数值为(幂次位数据+x)*y。通过预设定不同的x和y以及通过改变x和y 的数值，幂次的表示范围变得可配，可以适用于需要不同数值范围的不同的应用场景。因此，本神经网络运算装置的应用范围更加广泛，使用更加灵活可变，可根据用户需求来做调整。

在一种实施例方式中，y为1，x的数值等于-2^m-1。由此幂次神经元数据及幂次权值数据所表示的数值的指数范围为-2^m-1～2^m-1-1。

在一种实施例方式中，如图6.2所示一种m为5，x为0，y为1的编码表的部分内容，幂次位数据为00000的时候对应指数数值为0。幂次位数据为00001的时候对应指数数值为1。幂次位数据为00010的时候对应指数数值为2。幂次位数据为00011的时候对应指数数值为3。幂次位数据为11111的时候对应幂次神经元数据及幂次权值数据为0。如图6.3所示另一种m为5，x为0， y为2的编码表的部分内容，幂次位数据为00000的时候对应指数数值为0。幂次位数据为00001 的时候对应指数数值为2。幂次位数据为00010的时候对应指数数值为4。幂次位数据为00011的时候对应指数数值为6。幂次位数据为11111的时候对应幂次神经元数据及幂次权值数据为0。

编码表的对应关系可以是负相关的，存储单元预存一个整数值x和一个正整数值y，最大的幂次位数据对应指数数值为x，其他任意一个或多个幂次位数据对应幂次神经元数据及幂次权值数据为0。x表示偏置值，y表示步长。在一种实施例情况下，最大的幂次位数据对应指数数值为x，最小的幂次位数据对应幂次神经元数据及幂次权值数据为0，最小和最大的幂次位数据之外的其他的幂次位数据对应指数数值为(幂次位数据-x)*y。通过预设定不同的x和y以及通过改变x和y 的数值，幂次的表示范围变得可配，可以适用于需要不同数值范围的不同的应用场景。因此，本神经网络运算装置的应用范围更加广泛，使用更加灵活可变，可根据用户需求来做调整。

在一种实施例方式中，y为1，x的数值等于2^m-1。由此幂次神经元数据及幂次权值数据所表示的数值的指数范围为-2^m-1-1～2^m-1。

如图6.4所示一种m为5的编码表的部分内容，幂次位数据为11111的时候对应数数值为0。幂次位数据为11110的时候对应指数数值为1。幂次位数据为11101的时候对应指数数值为2。幂次位数据为11100的时候对应指数数值为3。幂次位数据为00000的时候对应幂次神经元数据及幂次权值数据为0。

编码表的对应关系可以是幂次位数据最高位代表置零位，幂次位数据其他m-1位对应指数数值。当幂次位数据最高位为0时，对应幂次神经元数据及幂次权值数据为0；当幂次位数据最高位为1时，对应幂次神经元数据及幂次权值数据不为0。反之亦可，即当幂次位数据最高位为1时，对应幂次神经元数据及幂次权值数据为0；当幂次位数据最高位为0时，对应幂次神经元数据及幂次权值数据不为0。用另一种语言来描述，即幂次神经元数据及幂次权值数据的幂次位被分出一个比特来指示幂次神经元数据及幂次权值数据是否为0。

在一个具体实例方式中，如图6.5所示，符号位为1位，幂次位数据位为7位，即m为7。编码表为幂次位数据为11111111的时候对应幂次神经元数据及幂次权值数据为0，幂次位数据为其他数值的时候幂次神经元数据及幂次权值数据对应相应的二进制补码。当幂次神经元数据及幂次权值数据符号位为0，幂次位为0001001，则其表示具体数值为2⁹，即512；幂次神经元数据及幂次权值数据符号位为1，幂次位为1111101，则其表示具体数值为-2^-3，即-0.125。相对于浮点数据，幂次数据只保留数据的幂次位，极大减小了存储数据所需的存储空间。

通过幂次数据表示方法，可以减小存储神经元数据及权值数据所需的存储空间。在本实施例所提供示例中，幂次数据为8位数据，应当认识到，该数据长度不是固定不变的，在不同场合下，根据神经元数据及权值数据的数据范围采用不同的数据长度。

步骤S5，根据运算指令对幂次神经元数据及幂次权值数据进行神经网络运算。其中，所述步骤S5包括以下子步骤：

S51，译码模块从指令缓存模块中读取指令，并将其译码成各运算指令；

S52，运算单元分别接收所述译码模块、输入神经元缓存模块及权值缓存模块发送的运算指令、幂次神经元数据及幂次权值数据，并根据运算指令对幂次神经元数据及幂次权值数据进行神经网络运算。

所述幂次神经元与幂次权值乘法操作具体为，幂次神经元数据符号位与幂次权值数据符号位做异或操作；编码表的对应关系为乱序的情况下查找编码表找出幂次神经元数据及幂次权值数据幂次位对应的指数数值，编码表的对应关系为正相关的情况下记录编码表的指数数值最小值并做加法找出幂次神经元数据及幂次权值数据幂次位对应的指数数值，编码表的对应关系为负相关的情况下记录编码表的最大值并做减法找出幂次神经元书记及幂次权值数据幂次位对应的指数数值；将幂次神经元数据对应的指数数值与幂次权值数据对应的指数数值做加法操作。

具体实例一如图6.6所示，幂次神经元数据和幂次权值数据符号位为1位，幂次位数据位为4 位，即m为4。编码表为幂次位数据为1111的时候对应幂次权值数据为0，幂次位数据为其他数值的时候幂次位数据对应相应的二进制补码。幂次神经元数据为00010，则其表示的实际数值为 2²。幂次权值为00110，则其表示的实际数值为64，即2⁶。幂次神经元数据和幂次权值数据的乘积为01000，其表示的实际数值为2⁸。

可以看到，幂次神经元数据和幂次权值的乘法运算相比于浮点数据的乘法以及浮点数据和幂次数据的乘法都更加的简单方便。

本实施例方法还可进一步包括，步骤S6，将神经网络运算后的神经元数据输出并作为下一层神经网络运算的输入数据。

其中，所述步骤S6包括以下子步骤：

S61，输出神经元缓存单元接收所述计算单元发送的神经网络运算后得到的神经元数据。

S62，将输出神经元缓存单元接收的神经元数据传输给数据控制模块，通过输出神经元缓存单元获得的神经元数据可作为神经网络运算下一层的输入神经元，再重复步骤S4至步骤S6直到神经网络最后一层运算结束。

由于神经网络运算后得到的神经元数据也为幂次数据，将其传输给数据控制模块所需带宽相比于浮点数据所需带宽大大减少，因此进一步减小了神经网络存储资源和计算资源的开销，提高了神经网络的运算速度。

所披露的实施例的所有的模块都可以是硬件结构，硬件结构的物理实现包括但不局限于物理器件，物理器件包括但不局限于晶体管，忆阻器，DNA计算机。

以上所述的具体实施例，对本披露的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本披露的具体实施例而已，并不用于限制本披露，凡在本披露的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本披露的保护范围之内。

Claims

1.一种神经网络运算装置，其特征在于，包括：

第一幂次转换单元，用于将神经网络输入数据中的非幂次数据转换为幂次数据；

运算单元，用于接收神经网络运算的数据和指令并根据运算指令对其接收的神经元数据及权值数据执行神经网络运算；其中，所述运算单元接收的所述数据包括经第一幂次转换单元转换的幂次数据；

2.根据权利要求1所述的神经网络运算装置，其特征在于，还包括：存储单元，用于存储数据和指令；其中，该存储单元与所述第一幂次转换单元连接以接收所述幂次数据。

3.根据权利要求1或2所述的神经网络运算装置，其特征在于，还包括：控制单元及输出神经元缓存单元；其中

4.根据权利要求3所述的神经网络运算装置，其特征在于，所述控制单元，包括：

5.根据权利要求1至4中任一项所述的神经网络运算装置，其特征在于，所述第一幂次转换单元用于将神经网络输入数据中的非幂次权值数据转换为幂次权值数据。

6.根据权利要求4中任一项所述的神经网络运算装置，其特征在于，还包括：第二幂次转换单元；其中，

7.根据权利要求1至6中任一项所述的神经网络运算装置，其特征在于，若神经网络输入数据为幂次数据则直接存入神经网络运算装置。

8.根据权利要求1至7中任一项所述的神经网络运算装置，其特征在于，幂次数据包括幂次神经元数据、幂次权值数据；其中，

所述幂次神经元数据表示神经元数据的数值采用其幂指数值形式表示，其中，所述幂次神经元数据包括符号位和幂次位，符号位采用一位或多位比特位表示神经元数据的符号，幂次位采用m位比特位表示神经元数据的幂次位数据，m为大于1的正整数；

9.根据权利要求8所述的神经网络运算装置，其特征在于，该神经网络运算装置的存储单元预存有编码表，用于提供幂次神经元数据及幂次权值数据的每个幂次位数据对应的指数数值。

10.根据权利要求9所述的神经网络运算装置，其特征在于，所述编码表设置一个或者多个幂次位数据为置零幂次位数据，其对应的幂次神经元数据及幂次权值数据为0。

11.根据权利要求1所述的装置，其特征在于，

所述卷积神经网络运算指令包括：卷积计算指令，用于将卷积核w乘以输入数据X_i，进行求和，然后加上偏置b后做激活运算s(h)，得到最终的输出结果。

12.根据权利要求1所述的装置，其特征在于，

所述卷积神经网络运算指令包括：COMPUTE指令、CONFIG指令、IO指令、NOP指令、JUMP指令或MOVE指令；

13.根据权利要求11所述的装置，其特征在于，

所述CONFIG指令，用于指引装置在每层人工神经网络计算开始前配置当前层计算需要的各种常数；

或所述JUMP指令，用于指引装置实现控制流的跳转；

14.一种神经网络运算方法，其特征在于，所述方法包括：

获取指令、幂次神经元数据及幂次权值数据；

15.根据权利要求14所述的方法，其特征在于，所述方法还包括：

16.根据权利要求14所述的方法，其特征在于，所述获取指令、权值数据及神经元数据，包括：

将指令、神经元数据及权值数据输入存储单元；

17.根据权利要求14所述的方法，其特征在于，所述获取指令、权值数据及神经元数据，包括：

将指令、神经元数据及权值数据输入存储单元；

18.根据权利要求14所述的方法，其特征在于，所述方法包括：

19.根据权利要求14所述的方法，其特征在于，

20.根据权利要求14所述的方法，其特征在于，

21.根据权利要求20所述的方法，其特征在于，

或所述JUMP指令，用于指引装置实现控制流的跳转；