CN107832082B

CN107832082B - 一种用于执行人工神经网络正向运算的装置和方法

Info

Publication number: CN107832082B
Application number: CN201710927267.9A
Authority: CN
Inventors: 陈天石; 刘少礼; 王在; 胡帅
Original assignee: Shanghai Cambricon Information Technology Co Ltd
Current assignee: Shanghai Cambricon Information Technology Co Ltd
Priority date: 2017-07-20
Filing date: 2017-07-20
Publication date: 2020-08-04
Anticipated expiration: 2037-07-20
Also published as: CN111176727B; CN111221578B; EP3686734A4; CN107729990A; CN107729989A; CN110036369B; CN110688158B; US11983534B2; CN107608715A; CN107608715B; CN110597558A; CN111176727A; CN111221578A; CN107807819B; CN110597558B; CN109284822B; US20230024840A1; CN107992329A; US11481215B2; CN110825434B

Abstract

本披露提供了一种用于执行人工神经网络正向运算的装置，包括浮点数据统计模块、数据转换单元和定点数据运算模块。本披露提供的技术方案具有计算速度快，效率高的优点。

Description

一种用于执行人工神经网络正向运算的装置和方法

技术领域

本披露涉及一种用于执行人工神经网络正向运算的装置和方法。

背景技术

数据处理是大部分算法需要经过的步骤或阶段，在计算机引入数据处理领域后，越来越多的数据处理通过计算机来实现，现有的算法中有计算设备在进行神经网络的数据计算时速度慢，效率低。

披露内容

本披露实施例提供了一种神经网络运算装置和方法，可提升计算装置的处理速度，提高效率。

第一方面，提供一种用于执行人工神经网络正向运算的装置，包括浮点数据统计模块、数据转换单元和定点数据运算模块，

所述浮点数据统计模块用于对所述人工神经网络正向运算所需的各个类型的数据进行统计分析，得到小数点位置Point location；

所述数据转换单元用于根据所述浮点数据统计模块得到的所述小数点位置Pointlocation来实现长位数浮点数据类型向短位数定点数据类型的转换；

所述定点数据运算模块用于在所述数据转换单元将所有所述人工神经网络正向运算中所需的输入、权值和/或偏置数据均采用短位数定点数据类型表示之后，对所述短位数定点数据进行人工神经网络正向运算；

所述人工神经网络正向运算的指令为卷积神经网络运算指令，包括：至少1个操作码和至少1个操作域，其中，

所述操作码用于指示所述卷积神经网络运算指令的功能，所述操作域用于指示所述卷积神经网络运算指令的数据信息；

所述数据信息包括：立即数或寄存器号，具体包括：输入数据的起始地址和数据长度，卷积核的起始地址和数据长度，以及激活函数的类型。

第二方面，提供一种执行人工神经网络正向运算的方法，包括以下步骤：

获取所述人工神经网络各个层的长位数浮点数据，包括每一层的权值、偏置和/或输入输出值；

对获取的所述长位数浮点数据，统计落在一列逐渐缩小的区间：[-2^X-1-i，2^X-1-i-2^-i]i＝0，1，...，N中的比例，其中X是短位数定点数据类型的总位数；得到的相应的比例记为：p₀，p₁，…，p_N，其中N是预先设定的一个正整数；

对于所述长位数浮点数据，预先设定一个溢出率EPL，取小数点位置Pointlocation为：max{i|p_i≥1-EPL，i∈{0，1，...，N}}；即在0，1，...，N中取最大的i，使得p_i≥1-EPL；

根据所述小数点位置Point location，将所有所述长位数浮点数据采用短位数定点数据类型表示；

对所述短位数定点数据执行人工神经网络正向运算；

可以看出，通过本披露实施例，计算装置设置有寄存器单元了存储介质，其分别存储标量数据以及矩阵数据，并且本披露为两种存储器分配了单位读取方式以及批量读取方式，通过对矩阵数据的特点分配匹配其特征的数据读取方式，能够很好的利用带宽，避免因为带宽的瓶颈对矩阵计算速度的影响，另外，对于寄存器单元来说，由于其存储的为标量数据，设置了标量数据的读取方式，提高了带宽的利用率，所以本披露提供的技术方案能够很好的利用带宽，避免带宽对计算速度的影响，所以其具有计算速度快，效率高的优点。

附图说明

图1A是一种计算装置结构示意图。

图1B是另一种计算装置结构示意图。

图2A是本披露实施例提供的计算装置的另一种结构示意图。

图2B是本披露实施例提供的卷积计算指令的流程示意图。

图3为根据本披露一实施例的用于存储数据的定点数据结构的具体表示方法；

图4为根据本披露一实施例的用于执行人工神经网络正向运算的装置中浮点数据统计模块的示例框图；

图5为根据本披露一实施例的用于执行人工神经网络正向运算的装置中正向运算模块的短位数定点计算部分示例框图；

图6为根据本披露一实施例的神经网络正向运算过程的示例框图；

图7示意性示出了根据本披露一实施例的用于执行人工神经网路正向运算装置的运算流程示例框图；

图8为根据本披露一实施例的算法实施总体流程图。

具体实施方式

本披露提供一种矩阵计算装置，包括存储单元、寄存器单元和矩阵运算单元，存储单元中存储有矩阵，寄存器单元中存储有矩阵存储的地址矩阵运算单元根据矩阵运算指令在寄存器单元中获取矩阵地址，然后，根据该矩阵地址在存储单元中获取相应的矩阵，接着，根据获取的矩阵进行矩阵运算，得到矩阵运算结果。本披露将参与计算的矩阵数据暂存在高速暂存存储器上，使得矩阵运算过程中可以更加灵活有效地支持不同宽度的数据，提升包含大量矩阵计算任务的执行性能。

需要说明的是，本披露具体实施方式中的矩阵具体可以为m＊n矩阵、1＊n矩阵或m＊1矩阵，其中m、n为大于等于2的整数。当矩阵为1＊n矩阵或m＊1矩阵时，也可以称为向量，下述矩阵均可以为上述三种类型矩阵中的任意一种，下面不在赘述。以人工神经网络算法为例，多种神经网络算法中都含有大量的矩阵运算。在神经网络中，输出神经元的运算表达式为y＝f(wx+b)，其中w是第一矩阵，x是第二矩阵、b是第三矩阵，计算输出矩阵y的过程为矩阵w与矩阵x相乘，加上矩阵b。因此，矩阵运算成为目前各种计算装置在设计时需要考虑的问题，现有的矩阵的计算速度慢，无法满足用户对计算装置的要求，效率低。

参阅图1A，图1A为一种计算装置，在如图1A所示的矩阵的计算装置中，其包含多个通用处理器101(CPU)，每个CPU均包含自身的内存，其处理的方法可以为，多个CPU并行处理矩阵的计算，此方案虽在在矩阵的计算中采用并行处理的方式，但是其并不能有效的提高效率，因为对于矩阵运算中，第二矩阵运算的结果可能需要使用第一矩阵运算的结果，具体的，第一矩阵运算为f(1)＝A+B，第二矩阵运算为：f(2)＝f(1)+C，对于第二矩阵运算来说，其需要提取第一矩阵运算的结果f(1)才能够进行实际的矩阵计算处理，此种情况在神经网络计算中尤为突出，由于多个CPU并行处理矩阵运算，那么在矩阵计算的分配时，很有可能CPU1执行第一矩阵运算，CPU2执行第二矩阵运算，那么对于CPU2来说，其需要从CPU1提取第一矩阵运算的结果f(1)，所以对于多CPU并行处理矩阵来说，多个CPU之间的通讯成为矩阵运算的瓶颈，影响矩阵计算的速度。

参阅图1B，图1B为另一种计算装置，在如图1B所示的计算装置中，其包含有图形处理器(GPU)102，通过GPU102来执行矩阵的运算，对于GPU来说，其本身也包含内存1021，GPU102在处理矩阵运算时，GPU102需要从内存1021中提取矩阵运算所需的矩阵，矩阵由于其数据量大，单个矩阵所占用的存储空间比标量要大很多，对于GPU102来说，虽然其运算能够非常强，但是GPU102的内存的容量不够，无法存储大量的矩阵，为了解决这个问题，图1B配置了片外数据库103，GPU102可以从片外数据库103中读取矩阵，具体的读取方式为，GPU102从片外数据库103中提取待计算的矩阵，将该矩阵存储在内存1021中，在执行矩阵运算时，进行矩阵指令的译码处理，然后从内存1021中提取该矩阵进行计算。此技术方案在执行矩阵计算中，GPU102进行矩阵指令的译码会占用GPU很大部分的计算能力，，影响矩阵的计算速度，效率低。

本披露中提到的输入神经元和输出神经元并非是指整个神经网络的输入层中神经元和输出层中神经元，而是对于网络中任意相邻的两层，处于网络前馈运算下层中的神经元即为输入神经元，处于网络前馈运算上层中的神经元即为输出神经元。以卷积神经网络为例，设一个卷积神经网络有L层，K＝1，2，...，L-1，对于第K层和第K+1层来说，我们将第K层称为输入层，其中的神经元为所述输入神经元，第K+1层称为输出层，其中的神经元为所述输出神经元。即除最顶层外，每一层都可以作为输入层，其下一层为对应的输出层。

参阅图2A，图2A提供了一种计算装置，该计算装置包括：存储介质611(可选的)、寄存器单元612、互联模块613、运算单元614、控制单元615和数据访问单元616；

其中，运算单元614包括：加法计算器、乘法计算器、比较器、激活运算器中至少二种。

互联模块613，用于控制运算单元614中计算器的连接关系使得该至少二种计算器组成不同的计算拓扑结构。

指令存储单元(可以是寄存器单元，指令缓存，高速暂存存储器)612，用于存储该运算指令、数据块的在存储介质的地址、运算指令对应的计算拓扑结构。

该运算指令可以包括：操作域以及操作码，以卷积计算指令为例，如表1所示，其中，寄存器0、寄存器1、寄存器堆2、寄存器3、寄存器4可以为操作域。其中，每个寄存器0、寄存器1、寄存器2、寄存器3、寄存器4可以是一个或者多个寄存器。

存储介质611可以为片外存储器，当然在实际应用中，也可以为片内存储器，用于存储数据块，该数据块具体可以为n维数据，n为大于等于1的整数，例如，n＝1时，为1维数据，即向量，如n＝2时，为2维数据，即矩阵，如n＝3或3以上时，为多维数据。

控制单元615，用于从寄存器单元612内提取运算指令、该运算指令对应的操作域以及该运算指令对应的第一计算拓扑结构，将该运算指令译码成执行指令，该执行指令用于控制运算单元执行运算操作，将该操作域传输至数据访问单元616，将该计算拓扑结构传输至互联模块613。

数据访问单元616，用于从存储介质611中提取该操作域对应的数据块，并将该数据块传输至互联模块613。

互联模块613、用于接收第一计算拓扑结构和数据块。一个实施例里，互联模块613还根据第一计算拓扑结构对数据块重新摆放。

运算单元614，用于该执行指令调用运算单元614的计算器对该数据块执行运算操作得到运算结果，将该运算结果传输至数据访问单元存储在存储介质内。一个实施例里，运算单元614，用于按第一计算拓扑结构以及该执行指令调用计算器对重新摆放的数据块执行运算操作得到运算结果，将该运算结果传输至数据访问单元存储在存储介质内。

另一个实施例里，互联模块613、用于依据控制运算单元614中计算器的连接关系形成第一计算拓扑结构。

本披露提供的计算装置设置了互联模块，此互联模块能够根据运算指令的需要将运算单元内的计算器组合连接得到与该运算指令对应的计算拓扑结构，进而在后续的运算单元运算时无需对计算的中间数据执行存储或提取操作，此结构实现单一指令即能实现一次输入即能够进行多次计算器的运算得到计算结果的优点，提高了计算效率。

下面通过不同的运算指令来说明如图2A所示的计算装置的具体计算方法，这里的运算指令以卷积计算指令为例，该卷积计算指令可以应用在神经网络中，所以该卷积计算指令也可以称为卷积神经网络。对于卷积计算指令来说，其实际需要执行的公式可以为：s＝s(∑wx_i+b)，其中，即将卷积核w乘以输入数据xi，进行求和，然后加上偏置bb后做激活运算s(h)，得到最终的输出结果s。依据该公式即可以得到该计算拓扑结构为，乘法运算器-加法运算器-(可选的)激活运算器。

上述卷积计算指令可以包括指令集，该指令集包含有不同功能的卷积神经网络COMPUTE指令以及CONFIG指令、IO指令、NOP指令、JUMP指令和MOVE指令。在一种实施例中，COMPUTE指令包括：

卷积神经网络sigmoid指令，根据该指令，装置分别从存储器(优选的高速暂存存储器或者标量寄存器堆)的指定地址取出指定大小的输入数据和卷积核，在卷积运算部件中做卷积操作，优选的，然后将输出结果做sigmoid激活；

卷积神经网络TanH指令，根据该指令，装置分别从存储器(优选的高速暂存存储器)的指定地址取出指定大小的输入数据和卷积核，在卷积运算部件中做卷积操作，优选的，然后将输出结果做TanH激活；

卷积神经网络ReLU指令，根据该指令，装置分别从存储器(优选的高速暂存存储器)的指定地址取出指定大小的输入数据和卷积核，在卷积运算部件中做卷积操作，优选的，然后将输出结果做ReLU激活；以及

卷积神经网络group指令，根据该指令，装置分别从存储器(优选的高速暂存存储器)的指定地址取出指定大小的输入数据和卷积核，划分group之后，在卷积运算部件中做卷积操作，优选的，然后将输出结果做激活。

CONFIG指令在每层人工神经网络计算开始前配置当前层计算需要的各种常数。

IO指令实现从外部存储空间读入计算需要的输入数据以及在计算完成后将数据存回至外部空间。

NOP指令负责清空当前装置内部所有控制信号缓存队列中的控制信号，保证NOP指令之前的所有指令全部指令完毕。NOP指令本身不包含任何操作；

JUMP指令负责控制将要从指令存储单元读取的下一条指令地址的跳转，用来实现控制流的跳转；

MOVE指令负责将装置内部地址空间某一地址的数据搬运至装置内部地址空间的另一地址，该过程独立于运算单元，在执行过程中不占用运算单元的资源。

如图2A所示的计算装置执行卷积计算指令的方法具体可以为：

控制单元615从寄存器单元612内提取卷积计算指令、卷积计算指令对应的操作域以及卷积计算指令对应的第一计算拓扑结构(乘法运算器-加法运算器-加法运算器-激活运算器)，控制单元将该操作域传输至数据访问单元，将该第一计算拓扑结构传输至互联模块。

数据访问单元存储介质内提取该操作域对应的卷积核w和偏置b(当b为0时，不需要提取偏置b)，将卷积核w和偏置b传输至计算单元。

计算单元的乘法运算器将卷积核w与输入数据X_i执行乘法运算以后得到第一结果，将第一结果输入到加法运算器执行加法运算得到第二结果，将第二结果和偏置b执行加法运算得到第三结果，将第三结果输到激活运算器执行激活运算得到输出结果s，将输出结果s传输至数据访问单元存储至存储介质内。其中，每个步骤后都可以直接输出结果传输到数据访问存储至存储介质内，无需下面的步骤。另外，将第二结果和偏置b执行加法运算得到第三结果这一步骤可选，即当b为0时，不需要这个步骤。

另外，加法运算和乘法运算的顺序可以调换。

本披露提供的技术方案通过一个指令即卷积计算指令即实现了卷积的计算，在卷积计算的中间数据(例如第一结果、第二结果、第三结果)均无需存储或提取，减少了中间数据的存储以及提取操作，所以其具有减少对应的操作步骤，提高卷积的计算效果的优点。

图2B是本披露实施例提供的卷积神经网络运算装置执行卷积神经网络的流程图，如图2B所示，执行卷积神经网络指令的过程包括：

在步骤S6B1，在指令存储单元的首地址处预先存入一条IO指令。

在步骤S6B2，控制器单元从指令存储单元的首地址读取该条IO指令，根据译出的控制信号，数据访问单元从存储介质读取相应的所有卷积神经网络运算指令，并将其缓存在指令存储单元中。

在步骤S6B3，控制器单元接着从指令存储单元读入下一条IO指令，根据译出的控制信号，数据访问单元从存储介质读取运算单元需要的所有数据块(例如，包括输入数据、用于作快速的激活函数运算的插值表、用于配置运算器件参数的常数表、偏置数据等)。

在步骤S6B4，控制器单元接着从指令存储单元读入下一条CONFIG指令，根据译出的控制信号，装置配置该层神经网络计算需要的各种常数。例如，运算单元根据控制信号里的参数配置单元内部寄存器的值，所述参数包括例如激活函数需要的数据。

在步骤S6B5，控制器单元接着从指令存储单元读入下一条COMPUTE指令，根据译出的控制信号，互连模块将卷积窗口内的输入数据发给计算单元内的各计算器。

在步骤S6B6，根据COMPUTE指令译出的控制信号，互联模块将乘法计算器、加法计算器和激活计算器连接形成第一计算拓扑结构。

在步骤S6B7，乘法运算器将卷积核w与输入数据Xi执行乘法运算以后得到第一结果，将第一结果输入到加法运算器执行加法运算得到第二结果，将第二结果和偏置b执行加法运算得到第三结果，将第三结果输入到激活运算器执行激活运算得到输出结果s，将输出结果s传输至数据访问单元存储至存储介质内。其中，将第二结果和偏置b执行加法运算得到第三结果这一步骤可选，即当b为0时，不需要这个步骤。

本披露还公开了一种用于执行人工神经网络正向运算的装置，在一种可选的实施方案中，该用于执行人工神经网络正向运算的装置可以为如图2A所示的计算装置，该计算装置还可以包括定点数据转换模块及相应的定点数据运算模块，所述定点数据转换模块包括浮点数据统计模块和数据转换单元；上述如图2A所示的计算装置还可以添加如图3或图4所示的单元或模块。其中，浮点数据统计模块用于统计及计算获得人工神经网络正向运算中存储各个类型数据所需的指数位偏移及指数位所需的比特位数；浮点数据转换单元用于实现短位数浮点数据类型与长位数浮点数据类型，例如32位浮点数据类型的转换；浮点运算模块用于完成针对于短位数浮点数据所需的各类运算。

其中，″长位数浮点数据″表示原来的浮点数据，例如32位浮点数据，也可以是针对标准的64位或者16位浮点数等，这里只是以32位为具体实施例进行说明；″较少位数浮点数据″，又名″短位数浮点数据″，表示相对于原来的浮点数据来说，采用更少的位数来表示的浮点数据。

根据本披露实施例的多层人工神经网络的正向运算，包括两层或者两层以上的多个神经元。对于正向运算中所需的输入、权值、偏置等数据，均采用短位数浮点数据类型表示，并用短位数浮点数据类型参与各个层之间的运算。

本披露公开了一种用于执行神经网络正向运算的装置，该用于执行神经网络正向运算的装置在一种可选的技术方案中，可以为如图2A所示的计算装置，该计算装置可以包括定点数据转换模块及相应的定点数据运算模块，所述定点数据转换模块包括浮点数据统计模块和数据转换单元；如图2A所示的计算装置还可以包括如图3、4、5所示装置的模块或单元。其中，浮点数据统计模块用于统计及计算获得人工神经网络正向运算中存储各个类型数据的合适的定点位置；数据转换单元用于实现短位数定点数据类型与长位数浮点数据类型的转换；定点运算模块用于完成针对于短位数定点数据所需的各类正向运算。

其中，“长位数浮点数据”表示原来的浮点数据，例如32位浮点数据，也可以是针对标准的64位或者16位浮点数等，这里只是以32位为具体实施例进行说明；“较少位数定点数据”，又名“短位数定点数据”，表示相对于原来的浮点数据来说，采用更少的位数来表示的定点数据。

根据本披露实施例的多层人工神经网络的正向运算，包括两层或者两层以上的多个神经元。对于正向运算中所需的输入、权值、偏置等数据，均采用短位数定点数据类型表示，并用短位数定点数据类型参与各个层之间的运算。

图3示出了根据本披露实施例的用于存储数据的短位数定点数据结构的具体表示方法。其中，1bit位用于表示符号，M位用于表示整数部分，N位用于表示小数部分；相比于32位浮点数据表示形式，本披露采用的短位定点数据表示形式除了占用比特位数更少外，对于神经网络中同一层、同一类型的数据，如第一个卷积层的所有权值数据，还另外设置了一个标志位Point location记录小数点的位置，这样可以根据实际数据的分布调整数据表示的精度与可表示数据范围。

图4示出了浮点数据统计模块的示例框图。包括数据提取单元21、统计单元22和分析单元23。该模块的目的是，通过提取采用32位浮点数据类型的神经网络中的所有32位浮点数据，并通过分析这些数据得到神经网络中用短位数定点描述各个不同类型数据所需的小数点位置Point location，以便在之后的短位数定点正向运算中有更好的效果。其中，数据提取单元用于提取32位浮点正向训练中各个不同类型的数据；统计单元用于统计同一类型数据的数据范围及各个数据段的数据分布情况；分析单元根据统计单元统计的结果，得出用短位数定点表示各个类型数据应当设定的小数点位置Point location。

图5示出了正向运算模块的短位数定点计算部分的示例框图。包括运算缓存单元31、数据转换单元32、舍入单元33。其中：运算缓存单元用精度较高的数据类型存储正向运算的中间结果，这是由于在正向运算时，加法或者乘法运算可能会导致数据范围扩大；运算结束后，对超出短位数定点精度范围的数据，进行舍入操作，接着通过数据转换单元32将缓存区的数据转换为短位数定点数据。

舍入单元33可以完成对超出短位定点精度范围的数据进行舍入操作，该单元可以为随机舍入单元、四舍五入单元、向上舍入单元、向下舍入单元、截断舍入单元等，通过不同的舍入单元可以实现对超出短位数定点精度范围数据进行不同的舍入操作。

随机舍入单元执行如下操作：

其中，ε为当前短位数定点数据表示格式所能表示的最小正数，即2^{-Point_location}，

表示对原数据x直接截得短位数定点数据所得的数(类似于对小数做向下取整操作)，w.p.表示概率，即随机舍入获得的数据y为

的概率为

为

的概率为

四舍五入单元执行如下操作：

其中，y表示四舍五入后的短位定点数据，x表示四舍五入前的长位浮点数据，ε为当前短位数定点数据表示格式所能表示的最小正整数，即2^{-Point_location}，

为ε的整数倍，其值为小于或等于x的最大数。

向上舍入单元执行如下操作：

y＝|x|；

其中，y表示向上舍入后的短位定点数据，x表示向上舍入前的长位浮点数据，

为ε的整数倍，其值为大于或等于x的最小数，ε为当前短位数定点数据表示格式所能表示的最小正整数，即2^{-Point_location}。

向下舍入单元执行如下操作：

为ε的整数倍，其值为小于或等于x的最大数，ε为当前短位数定点数据表示格式所能表示的最小正整数，即2^{-Point_location}。

截断舍入单元执行如下操作：

y＝[x]；

其中，y表示截断舍入后的短位定点数据，x表示截断舍入前的长位浮点数据，[x]表示对原数据x直接截得短位数定点数据所得的数。

本披露还公开了一种执行人工神经网络正向运算的方法，具体实施步骤为：

通过已训练好的神经网络32位浮点模型获取神经网络各个层的32位浮点模型数据，包括每一层的权值、偏置、输入输出值及其它数据参数。

对不同层，对于每一种类型的数据，统计落在一列逐渐缩小的区间：[-2^X-1-i，2^X ^-1-i-2^-i]i＝0，1，...，N中的比例(X是短位数定点数据类型的总位数)；得到的相应的比例记为：p₀，p₁，...，p_N，其中N是预先设定的一个正整数；

对于每一种类型的数据，预先设定一个溢出率EPL，取小数点位置Point location为：max{i|p_i≥1-EPL，i∈{0，1，...，N}}；即在0，1，...，N中取最大的i，使得p_i≥1-EPL；

根据所述小数点位置Point location，将所有所述长位数浮点数据采用短位数定点数据类型表示。

对统计得到的短位定点表示方式用于神经网络正向运算，即神经网络正向运算中所有数据用短位定点格式表示，同时，对神经网络的权值和偏置数据保留一份32位浮点数据表示的副本，然后做正向训练。对于正向运算中，某些运算会导致数据范围扩大，如加法、乘法等，需要用缓存空间存储中间计算结果，中间结果用32位浮点形式存储，计算完后再转回相应的短位定点格式。32位浮点转短位定点过程需要用舍入方式，其中包括随机舍入、四舍五入舍入等，分别表示如下：

随机舍入单元执行如下操作：

的概率为

为

的概率为

四舍五入单元执行如下操作：

为ε的整数倍，其值为小于或等于x的最大数。

向上舍入单元执行如下操作：

向下舍入单元执行如下操作：

截断舍入单元执行如下操作：

y＝[x]；

正向运算结束后，做反向运算时，需要通过短位定点转32位浮点数据转换单元将正向运算中的数据转换为32位浮点参与反向运算，其中，参与反向运算的权值和偏置数据用正向运算中保留的32位浮点数据表示的副本，反向运算结束后，在通过32位浮点转短位定点数据转换单元转为短位定点参与之后的正向运算，同时，仍对神经网络的权值和偏置数据保留32位定点数据表示的副本，转换过程中需要做舍入操作，操作同正向运算中的舍入操作。

重复进行如上所述的正向及反向运算直到神经网络训练完成。

图6是示出根据一个实施例的单层人工神经网络正向运算流程图。该运算过程在如图2A所示的计算装置中实现。该流程图描述利用本披露的装置和指令集实现的一种单层神经网络正向运算的过程。对于每一层来说，首先对输入神经元向量进行加权求和计算出本层的中间结果向量。该中间结果向量加偏置并激活得到输出神经元向量。将输出神经元向量作为下一层的输入神经元向量。

图7示意性示出了根据本披露一实施例的运算流程示例框图。该运算过程在如图2A所示的计算装置中实现。其中，正向运算模块51包含了图5所示的短位数定点计算模块，正向运算得到的除权值、偏置外的参数在进行反向传播时要先通过X位-32位浮点转换单元53转换成32位浮点数进行反向传播运算，反向运算模块53进行的反向传播运算结束后，需要通过32位浮点-X位转换单元54转换成短位数定点数据，在转换过程中，需对超出短位数定点精度范围的数据进行同图3中的舍入操作，此处舍入操作由随机舍入单元55完成。

图8示出了根据本披露实施例的算法实施总体流程图。该运算过程在如图2A所示的计算装置中实现。细节操作在对图3到图7的说明中已经给出，详细步骤和披露内容中的具体实施步骤完全相同，这里不作赘述。

通过将正向运算的数据用短位数定点表示，充分利用了短位数定点数据格式的数据范围空间，相对于32位浮点数据表示，极大地减少了存储网络参数所需的空间，优化了硬件的面积功耗比。

以上所述的具体实施例，对本披露的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本披露的具体实施例而已，并不用于限制本披露，凡在本披露的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本披露的保护范围之内。

Claims

1.一种用于执行人工神经网络正向运算的装置，包括浮点数据统计模块、数据转换单元和定点数据运算模块，其特征在于，

所述浮点数据统计模块用于对所述人工神经网络正向运算所需的各个类型的数据进行统计分析，得到各个类型数据应当设定的小数点位置Point_location；

所述数据转换单元用于根据所述浮点数据统计模块得到的所述小数点位置Point_location来实现长位数浮点数据类型向短位数定点数据类型的转换；所述短位数定点数据类型的数据结构包括一位符号位、M位整数位、N位小数位和一个用于记录小数点的位置的标志位；

2.如权利要求1所述的用于执行人工神经网络正向运算的装置，其特征在于，所述浮点数据统计模块包括数据提取单元、统计单元和分析单元，其中，所述数据提取单元用于提取基于长位数浮点数据的正向运算中各种不同类型的数据；所述统计单元用于统计同一类型数据的数据范围及各数据段的数据分布情况；所述分析单元根据统计单元统计的结果，得出用短位数定点表示各个类型数据应当设定的小数点位置Point_location。

3.如权利要求1所述的用于执行人工神经网络正向运算的装置，其特征在于，所述用于执行人工神经网络正向运算的装置还包括舍入单元，所述舍入单元用于在运算结束后，对超出短位数定点精度范围的数据进行舍入操作。

4.如权利要求3所述的用于执行人工神经网络正向运算的装置，其特征在于，所述舍入单元选自随机舍入单元、四舍五入单元、向上舍入单元、向下舍入单元、截断舍入单元中的任一种；

其中，所述随机舍入单元执行如下操作：

其中，y表示随机舍入后的短位定点数据，x表示随机舍入前的长位浮点数据，ε为当前短位数定点数据表示格式所能表示的最小正数，即2^{-Point_location}，

表示对原数据x直接截得短位数定点数据所得的数，w.p.表示概率，即随机舍入获得的数据y为

的概率为

为

的概率为

所述四舍五入单元执行如下操作：

其中，y表示四舍五入后的短位定点数据，x表示四舍五入前的长位浮点数据，ε为当前短位数定点数据表示格式所能表示的最小正数，即2^{-Point_location}，

为ε的整数倍，其值为小于或等于x的最大数；

所述向上舍入单元执行如下操作：

为ε的整数倍，其值为大于或等于x的最小数，ε为当前短位数定点数据表示格式所能表示的最小正数，即2^{-Point_location}；

所述向下舍入单元执行如下操作：

为ε的整数倍，其值为小于或等于x的最大数，ε为当前短位数定点数据表示格式所能表示的最小正数，即2^{-Point_location}；

所述截断舍入单元执行如下操作：

y＝[x]；

5.如权利要求3所述的用于执行人工神经网络正向运算的装置，其特征在于，所述数据转换单元先通过所述舍入单元对待处理的数据进行舍入操作，再根据浮点数据统计模块得到的小数点位置Point_location来实现长位数浮点数据类型向短位数定点数据类型的转换。

6.如权利要求1所述的用于执行人工神经网络正向运算的装置，其特征在于，所述用于执行人工神经网络正向运算的装置还包括运算缓存单元，所述运算缓存单元采用长位数浮点数据类型存储正向运算中加法和乘法的中间运算结果。

7.根据权利要求1所述的装置，其特征在于，

所述卷积神经网络运算指令包括：卷积计算指令，用于将卷积核w乘以输入数据x_i，进行求和，然后加上偏置b后做激活运算s(h)，得到最终的输出结果。

8.根据权利要求1所述的装置，其特征在于，

所述卷积神经网络运算指令包括：COMPUTE指令、CONFIG指令、IO指令、NOP指令、JUMP指令或MOVE指令；

所述COMPUTE指令包括：卷积神经网络sigmoid指令、卷积神经网络TanH指令、卷积神经网络ReLU指令以及卷积神经网络group指令；

所述卷积神经网络sigmoid指令，用于在装置分别从存储器的指定地址取出指定大小的输入数据和卷积核，在卷积运算部件中做卷积操作，然后根据所述sigmoid指令将输出结果做sigmoid激活；

所述卷积神经网络TanH指令，用于在装置分别从存储器的指定地址取出指定大小的输入数据和卷积核，在卷积运算部件中做卷积操作，然后根据所述TanH指令将输出结果做TanH激活；

所述卷积神经网络ReLU指令，用于在装置分别从存储器的指定地址取出指定大小的输入数据和卷积核，在卷积运算部件中做卷积操作，然后根据所述ReLU指令将输出结果做ReLU激活；

所述卷积神经网络group指令，用于装置分别从存储器的指定地址取出指定大小的输入数据和卷积核，划分group之后，在卷积运算部件中做卷积操作，然后根据所述group指令将输出结果做激活。

9.根据权利要求8所述的装置，其特征在于，

所述CONFIG指令，用于指引装置在每层人工神经网络计算开始前配置当前层计算需要的各种常数；

或所述IO指令，用于指引装置实现从外部存储空间读入计算需要的输入数据以及在计算完成后将数据存回至外部存储空间；

或所述NOP指令，用于指引装置清空当前装置内部所有控制信号缓存队列中的控制信号；

或所述JUMP指令，用于指引装置实现控制流的跳转；

或所述MOVE指令，用于指引装置内部地址空间中某一地址的数据搬运至内部地址空间的另一地址。

10.一种执行人工神经网络正向运算的方法，其特征在于，包括以下步骤：

对获取的所述长位数浮点数据，统计落在一列逐渐缩小的区间：[-2^X-1-i,2^X-1-i-2^-i]i＝0,1,...,N中的比例，其中X是短位数定点数据类型的总位数；得到的相应的比例记为：p₀,p₁,...,p_N，其中N是预先设定的一个正整数；

对于所述长位数浮点数据，为每一种类型的数据预先设定一个溢出率EPL，取小数点位置Point_location为：max{i|p_i≥1-EPL,i∈{0,1,...,N}}；即在0,1,...,N中取最大的i，使得p_i≥1-EPL；

根据所述小数点位置Point_location，将所有所述长位数浮点数据采用短位数定点数据类型表示；所述短位数定点数据类型的数据结构包括一位符号位、M位整数位、N位小数位和一个用于记录小数点的位置的标志位；

对所述短位数定点数据执行人工神经网络正向运算；

11.如权利要求10所述的方法，其特征在于，在所述执行人工神经网络正向运算的方法中，对所述人工神经网络不同层、不同类型的数据分别进行统计分析，获得相对于所述人工神经网络不同类型的数据的小数点位置Point_location，并分别进行计算。

12.如权利要求10所述的方法，其特征在于，所述对短位数定点数据执行人工神经网络正向运算的步骤中，对于正向运算中的加法运算和乘法运算，将其中间计算结果采用长位数浮点数据形式存储。

13.如权利要求10所述的方法，其特征在于，在执行完所述人工神经网络正向运算之后，将参与反向运算的权值和偏置数据采用在正向运算时保留的长位数浮点数据表示的副本、其余数据采用由短位数定点数据转换成的长位数浮点数据后再进行反向运算。

14.根据权利要求10所述的方法，其特征在于，

所述卷积神经网络运算指令包括：卷积计算指令，用于将卷积核w乘以输入数据xi，进行求和，然后加上偏置b后做激活运算s(h)，得到最终的输出结果。

15.根据权利要求10所述的方法，其特征在于，

16.根据权利要求15所述的方法，其特征在于，

或所述JUMP指令，用于指引装置实现控制流的跳转；