WO2022007880A1

WO2022007880A1 - 数据精度配置方法和装置、神经网络设备、介质

Info

Publication number: WO2022007880A1
Application number: PCT/CN2021/105173
Authority: WO
Inventors: 何伟; 祝夭龙
Original assignee: 北京灵汐科技有限公司
Priority date: 2020-07-09
Filing date: 2021-07-08
Publication date: 2022-01-13
Also published as: CN111831354B; CN111831354A

Abstract

本发明公开了输出数据的精度配置方法和装置、神经网络设备、计算机可读存储介质。本发明的方法应用于神经网络设备中，所述方法包括：获取神经网络中的接收层的权重精度，其中，所述接收层为发送层的下一层，所述发送层为神经网络中除最后一层外的任意一层；至少根据所述接收层的权重精度对所述发送层的待输出数据的精度进行配置。本发明通过采用上述技术方案，可以灵活配置部署在神经网络设备中的神经网络中的一层或多层的输出数据的精度，进而优化神经网络设备的性能。

Description

数据精度配置方法和装置、神经网络设备、介质

技术领域

本发明实施例涉及人工智能技术领域，尤其涉及输出数据的精度配置方法和装置、神经网络设备、计算机可读存储介质。

背景技术

基于计算机系统的神经网络包括大量神经元，可按照类似人脑的方式处理问题，如进行图像识别、语音识别以及自然语言处理等。神经网络中的不同神经元相互连接，基于以上连接关系神经网络分为多层，每层包括一个或多个神经元，在前层中的每个神经元与在后层中的一个或多个神经元连接，并可向在后层中的神经元发送数据。

每层神经元还有权重数据，例如是该层中每个神经元与在前层神经元间的连接的权重值(如构成权重矩阵)。通常，一层中所有的权重数据具有相同精度，即每层神经元具有统一的权重精度。

当数据输入神经网络的一层时可与该层权重数据进行计算得到结果数据，相关技术中可对结果数据的精度进行转换，得到符合精度要求的输出数据。其中，各层神经网络的输出数据的精度一般是预先规定的所有层均相同的输出数据的精度。然而，这种输出数据的精度配置方案不够灵活，需要改进。

发明内容

本发明实施例提供了输出数据的精度配置方法和装置、神经网络设备、计算机可读存储介质。

第一方面，本发明实施例提供一种输出数据的精度配置方法，其中，所述方法应用于神经网络设备中，所述方法包括：获取神经网络中的接收层的权重精度，其中，所述接收层为发送层的下一层，所述发送层为神经网络中除最后一层外的任意一层；至少根据所述接收层的权重精度对所述发送层的待输出数据的精度进行配置。

在一些实施例中，在所述获取神经网络中的接收层的权重精度前，还包括：获取所述发送层的所述待输出数据的精度。

在一些实施例中，所述至少根据所述接收层的权重精度对所述发送层的待输出数据的精度进行配置，包括：根据所述待输出数据的精度以及所述接收层的权重精度，确定目标精度；将所述待输出数据的精度配置成目标精度。

在一些实施例中，所述获取所述发送层的所述待输出数据的精度，包括：获取所述发送层的输入数据的精度和所述发送层的权重精度；根据所述输入数据的精度和所述发送层的权重精度确定所述发送层的待输出数据的精度，所述待输出数据的精度大于或等于所述输入数据的精度和所述发送层的权重精度中较高的精度。

在一些实施例中，在所述接收层的权重精度低于所述待输出数据的精度时，所述目标精度低于所述待输出数据的精度，且不低于所述接收层的权重精度。

在一些实施例中，在所述接收层的权重精度不低于所述待输出数据的精度时，所述目标精度不低于所述待输出数据的精度，且不高于所述接收层的权重精度。

在一些实施例中，所述至少根据所述接收层的权重精度对所述发送层的待输出数据的精度进行配置，包括：将所述接收层的权重精度确定为目标精度；将所述待输出数据的精度配置成目标精度。

在一些实施例中，在所述至少根据所述接收层的权重精度对所述发送层的待输出数据的精度进行配置之后，还包括：将配置后得到的输出数据输出至所述接收层。

在一些实施例中，所述神经网络设备基于众核架构实现。

第二方面，本发明实施例提供一种输出数据的精度配置装置，其中，所述装置集成于神经网络设备中，所述装置包括：权重精度获取模块，用于获取神经网络中的接收层的权重精度，其中，所述接收层为发送层的下一层，所述发送层为神经网络中除最后一层外的任意一层；精度配置模块，用于至少根据所述接收层的权重精度对所述发送层的待输出数据的精度进行配置。

第三方面，本发明实施例提供一种神经网络设备，其中，所述神经网络设备包含至少一个处理核，所述处理核用于实现上述任意一种的输出数据的精度配置方法。

在一些实施例中，所述神经网络设备包括多个形成众核架构的处理核。

第四方面，本发明实施例提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理核执行时实现上述任意一种的输出数据的精度配置方法。

本发明实施例中提供的输出数据的精度配置方案，应用于神经网络设备中，获取神经网络中的发送层的待输出数据的精度，在对待输出数据进行输出之前，先获取接收层的权重精度，接收层为发送层的下一层，并根据接收层的权重精度对待输出数据的精度进行配置。通过采用上述技术方案，可以灵活配置部署在神经网络设备中的神经网络中的一层或多层的输出数据的精度，进而优化神经网络设备的性能。

附图说明

图1为相关技术中的一种输出数据的精度配置方案示意图。

图2为本发明实施例提供的一种输出数据的精度配置方法的流程示意图。

图3为本发明实施例提供的又一种输出数据的精度配置方法的流程示意图。

图4为本发明实施例提供的一种输出数据的精度配置方案示意图。

图5为本发明实施例提供的另一种输出数据的精度配置方法的流程示意图。

图6为本发明实施例提供的一种输出数据的精度配置装置的结构框图。

图7为本发明实施例提供的一种神经网络设备的结构框图。

图8为本发明实施例提供的一种计算机可读存储介质的结构框图。

具体实施方式

下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

在更加详细地讨论示例性实施例之前应当提到的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理，但是其中的许多步骤可以被并行地、并发地或者同时实施。此外，各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止，但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。

需要注意，本发明实施例中提及的“第一”、“第二”等概念仅用于对不同的装置、模块、单元或其它对象进行区分，并非用于限定这些装置、模块、单元或其它对象所执行的功能的顺序或者相互依存关系。

为了更好地理解本发明实施例，下面对相关技术进行介绍。

本发明实施例的神经网络设备中配置有神经网络。本发明实施例中的神经网络可包括人工神经网络(Artificial Neural Network，ANN)，也可包括脉冲神经网络(Spiking Neural Network，SNN)以及其它类型的神经网络(如卷积神经网络CNN等)。神经网络的具体类型不做限定，例如可以是声学模型、语音识别模型以及图像识别模型等等，可以应用于数据中心、安防领域、智能医疗领域、自动驾驶领域、智慧交通领域、智能家居领域以及其它相关领域。

图1为相关技术中的一种神经网络的输出数据的精度配置方案示意图，其神经网络设备中承载的神经网络的各层的权重精度(图中每层下方标识的精度)是相同的，且设定各层输出数据的精度(图中层间箭头处标识的精度)也相同，故每层的输入数据与权重进行的计算过程对应的精度计算过程(图中最靠下的两个精度相乘)通常也是相同的。但是，以上方式可能导致精度损失，或导致数据传输量的增加等。

如图1所示，为了便于说明，仅示出了神经网络中的四层，从前到后依次分别为L1、L2、L3和L4。L1的输入数据的精度(数据精度)为FP32(32位浮点)，L1的权重精度为FP32，那么乘累加操作中对应的精度的计算过程为FP32*FP32，而计算直接得到的结果数据(计算结果)的精度通常高于FP32。而相关技术中，可以规定包括L1在内的所有层的输出数据精度为FP32，故要对以上计算结果进行精度截取后，才能作为输出数据。或者，如果相关技术规定包括L1在内的所有层的输出数据精度更高，则要将计算结果补齐为更高精度后才能输出。即，相关技术中每层神经网络输出数据的精度，通常是统一设置的数据精度，显然这种输出数据的精度配置方式不够灵活。

而在本发明实施例中，不是直接设定所有层的输出数据精度相同，而是根据在后层的权重精度，具体为每层配置相应的权重精度；而当不同层的权重精度不同时，则不同层的输出数据的精度也可能不同，即神经网络可采用混合精度，从而使每个层的输出数据的精度都能符合其需求，更好地平衡存储容量和计算能耗，与神经网络识别率(或准确率)之间的关系。

第一方面，本发明实施例提供一种输出数据的精度配置方法。

图2为本发明实施例提供的一种输出数据的精度配置方法的流程示意图，该方法用于神经网络设备中，并可以由输出数据的精度配置装置执行，其中该装置可由软件和/或硬件实现，一般可集成在神经网络设备中，例如神经网络设备中的处理核中。

如图2所示，该方法包括以下步骤201和步骤202。

步骤201、获取神经网络中的接收层的权重精度，其中，所述接收层为发送层的下一层，所述发送层为神经网络中除最后一层外的任意一层。

本发明实施例中，对神经网络的具体结构不做限定，例如神经网络中包含的神经元层数可以是两层以上的任意层数。

其中，发送层和接收层是相互对应的两层，即接收层是接收当前的发送层的输出数据的层，故该发送层并不一定是神经网络中排在最前面的层，而可以是除最后一层之外的任意一层；相应的，接收层可以是除神经网络的第一层之外的任意一层。

示例性的，神经网络的每一层可配置在一个或多个处理核中，而每个处理核可包含处理器并自带存储器，故每层的计算可在该层所在的处理核本地进行，而输出数据则发送给下一层所在的处理核。例如，发送层所在的发送处理核，可根据发送层的输入数据和发送层的权重参数(如权重矩阵等)计算得到待输出数据，并输出至接收层所在的接收处理核。

本发明实施例中，一层的权重精度是指该层中所有神经元的权重值(如神经元与在前层神经元间的连接的权重值)的精度，故通常而言，一层所有神经元的权重值的精度应当是相同的，以使一层有一个统一的权重精度。其中，若一层中不同神经元的权重精度不同，也是可行的。

本发明实施例中，不同层的权重精度可以是不同的，获取接收层的权重精度的具体方式不做限定。例如，可以在编译阶段将接收层的权重精度存储在发送处理核内的存储区，在获取到发送层的待输出数据后，从该存储区读取接收层的权重精度；又如，假设接收层对应的处理核为接收处理核，接收处理核内的存储区中可以存储有接收层的权重精度，发送处理核可通过核间通信的方式从接收处理核获取接收层的权重精度。

步骤202、至少根据所述接收层的权重精度对所述发送层的待输出数据的精度进行配置。

本发明实施例中，参考接收层的权重精度对发送层的待输出数据的精度进行配置(或者说设定)，并将配置后的、具有所需精度的数据作为发送层实际输出的数据(输出数据)，其具体的参考方式和配置方式不做限定。

示例性的，可将待输出数据的精度配置成比接收层的权重精度低的精度，也可将待输出数据的精度配置成比接收层的权重精度高的精度，或者可将待输出数据的精度配置成与接收层的权重精度相同的精度，得到输出数据的精度。

接收层的权重精度和输出数据的精度之间相差的精度等级可以是第一预设精度等级差值。其中，精度等级用于表示数据精度的高低，精度越高，对应的精度等级越高，不同精度等级对应的精度值可根据实际需求设置。例如，精度Int4(4位整型)和FP16之间，还存在Int8，相差的精度等级可以是2，而Int4和Int8之间相差的精度等级可以是1。假设接收层的权重精度为FP16，第一预设精度等级差值为2，若将待输出数据的精度配置成比接收层的权重精度低的精度，则将待输出数据的精度配置成Int4。

本发明实施例中提供的输出数据的精度配置方法，应用于神经网络设备中，获取神经网络中的发送层的待输出数据的精度，在对待输出数据进行输出之前，先获取接收层的权重精度，并根据接收层的权重精度对待输出数据的精度进行配置。通过采用上述技术方案，可以灵活配置部署在神经网络设备中的神经网络中的一层或多层的输出数据的精度，进而优化神经网络设备的性能。

在一些实施例中，如图2所示，在所述获取神经网络中的接收层的权重精度前，还包括：步骤200、获取所述发送层的所述待输出数据的精度。

在获取接收层的权重精度前，还可先获取发送层的待输出数据的精度，也就是说在“不进行”本发明实施例的方法的情况下，发送层的待输出数据的“原本”应具有的精度。例如，为发送层的输入数据与权重数据进行乘累加计算后得到的计算结果的精度。

一般的，待输出数据的精度大于或等于发送层的输入数据精度和权重精度中的较高者。在发送层中，如果输入数据精度和权重精度本身就比较低(如Int2、Int4或Int8)，在乘累加操作后之后，计算结果的精度(位数)可能不足(例如无法满足对应的处理核等硬件配置方面的需求)，就需要提高精度，那么待输出数据的精度通常来说，会增加得比较高(例如分别增加到Int8或Int16)，且输入数据精度和权重精度中较高者越低，需要提升的精度等级越多；相反，如果输入数据精度和权重精度本身就已经比较高了(比如FP16、FP32或FP64)，那么待输出数据的精度可能就不会增加，或者增加的比较少(例如从FP16增加到FP32)，因为，经过乘累加操作后的精度已经足够高。

本发明实施例中，可根据发送层的输入数据的精度和权重精度确定其待输出数据的精度，具体是保证待输出数据的精度大于或等于输入数据的精度和权重精度中的较高者。因为乘累加运算过程的结果的精度，通常是高于其运算用的两个参数的精度中的任意一种的。

本发明实施例中，可根据以上得到的接收层的权重精度和发送层的待输出数据的精度，共同确定一个“目标精度”，并将待输出数据的精度配置成目标精度，即设定发送层实际的输出数据具有目标精度。

当待输出数据的精度(原本的精度)比权重精度高时，可降低待输出数据的精度，但不应降低到比权重精度更低，以免影响神经网络的识别率。这样设置的好处在于，相当于根据所述接收层的权重精度对所述待输出数据的精度进行截取操作，使得待输出数据的精度降低，从而降低数据传输量，在接收层进行数据计算时，也能够降低计算量，进而降低数据处理所带来的能耗。

其中，此时目标精度可能等于接收层的权重精度，即可直接将所述接收层的权重精度确定为目标精度。这样设置的好处在于，相当于将所述待输出数据的精度截取为与所述接收层的权重精度相一致的精度，可以最大限度的降低数据传输量以及降低数据处理所带来的能耗，提高算力。

当待输出数据的精度(原本的精度)不比权重精度高(包括相同或更低)时，可使待输出数据的精度保持不变，或者可升高待输出数据的精度，但不能升高到比权重精度更高，以提高神经网络的识别率。

其中，此时目标精度也可能等于接收层的权重精度，即可直接将所述接收层的权重精度确定为目标精度。

作为本发明实施例的另一种方式，也可不判断接收层的权重精度和发送层的待输出数据的精度的关系，而是直接将接收层的权重精度确定为目标精度。这样可简化该方法的实现过程，且保证任意一层中计算用的输入数据的精度都等于该层的权重精度，更好地平衡存储容量和计算能耗，与神经网络识别率(或准确率)之间的关系。

在配置待输出数据的精度后，可将配置后的具有所需精度的数据作为输出数据，直接传输到接收层，例如传输到接收层所在的接收处理核，以便接收层对应的处理核进行接收层的相关计算。

在一些实施例中，所述神经网络设备基于众核架构实现。

众核架构包括多个处理核，且可以具备多核重组特性，处理核与处理核之间没有主从之分，可以灵活的用软件来配置任务，把不同的任务同时配置在不同的处理核中(如每个处理核配置一层神经元)，实现多任务的并行处理，可以由一系列处理核构成阵列来完成神经网络的计算，能够高效支持各种神经网络算法，提高设备性能。

示例性的，神经网络设备可采用片上网络，如二维网格(2D Mesh)的片上网络，用于核与核之间的通信互联，而设备与外部的通信可以通过高速串口实现。

图3为本发明实施例提供的又一种输出数据的精度配置方法的流程示意图，如图3所示，该方法包括：

步骤301、获取神经网络中的发送层的待输出数据。

其中，每次执行本方法时，所述发送层可为所述神经网络中的最后一层之外的任意一层。当然，在不同的执行本方法的过程中，发送层可以不同，即发送层不是神经网络中的某一个特定层。

步骤302、获取接收层的权重精度，其中，所述接收层为所述发送层的下一层。

步骤303、判断接收层的权重精度是否低于发送层的待输出数据的精度，若是，则执行步骤304；否则，执行步骤305。

可选的，本发明实施例中，也可不判断接收层的权重精度和发送层的待输出数据的精度的大小，直接将接收层的权重精度确定为目标精度。

步骤304、将接收层的权重精度确定为目标精度，将发送层的待输出数据的精度配置成目标精度，得到输出数据，执行步骤306。

步骤305、保持发送层的待输出数据的精度不变或将发送层的待输出数据的精度配置成接收层的权重精度，得到输出数据。

其中，保持发送层的待输出数据的精度不变可以减少发送层与接收层之间的传输量。

步骤306、将输出数据输出至接收层，例如输出至接收层对应的处理核。

本发明实施例提供的输出数据的精度配置方案，应用于神经网络设备中，获取神经网络中的发送层的待输出数据，在对待输出数据进行输出之前，先获取下一层的权重精度，并将待输出数据的精度配置成与下一层的权重精度相同的精度，得到输出数据并输出至下一层(如输出至下一层对应的处理核)。

通过采用上述技术方案在数据输出之前按照下一层的权重精度直接配置，可减少数据转换中的精度损失，当后一层权重精度低于前一层时，可降低数据传输量，降低数据处理能耗。

图4为本发明实施例提供的一种输出数据的精度配置方案示意图，如图4所示，为了便于说明，仅示出了神经网络中的四层，从前到后依次分别为L1、L2、L3和L4。

对于L1来说，输入数据的精度为Int8，L1的权重精度为Int8，那么乘累加操作中对应的精度的计算过程为Int8*Int8，从而以上乘累加操作得到的计算结果的精度为FP16。但在相关技术中，若设定输出数据精度统一为Int8，则需要保证L1实际输出的数据的精度为Int8，即需要将以上计算结果的FP16的精度截取为Int8，之后再从L1输出该精度Int8的数据。由于L2的权重精度为FP16，则在L2中进行计算时，又需要将截取后的Int8的精度补齐为FP16的精度，在这个过程中造成先截取掉的那些精度的损失，且引入了不必要的截取和补齐过程，消耗了更多运算量。

而本发明实施例中，先获取L2的权重精度，那么得知L1的待输出数据的原本的精度(计算结果的精度)与L2的权重精度相同(均为FP16)，故根据L2的权重精度应将待输出数据的精度配置为FP16，即不会对待输出数据(计算结果)进行精度截取操作，而是直接将待输出数据输出得到FP16精度的输出数据，可减少数据转换中的精度损失，并减少不必要的运算。

对于L3来说，输入数据的精度为FP16，权重精度为FP16，在相关技术中，若设定输出数据精度统一为FP16，则L3输出数据的精度也应该是FP16(实际该FP16也是通过对计算结果进行精度截取得到的)。但L4的权重精度为Int8，故其计算中所需的数据精度实际只有Int8，因此若L3的输出数据精度为FP16，则相当于在L3和L4之间增加了部分“无效的”的数据传输量。

而本发明实施例中，先获取L4的权重精度为Int8，那么得知L3的待输出数据的原本的精度高于L4的权重精度时，可将待输出数据的精度配置为Int8，即将L3的计算结果直接精度截取至Int8(而不是截取至FP16)，从而使其实际输出数据的精度为Int8，故L3与L4之间只要传输该精度为Int8的数据即可。

相比于相关技术，本发明实施例的方式降低了L3的输出数据的精度，减少了L3和L4之间的数据传输量，也即减少了L3所在的处理核和L4所在的处理核中间的数据通信量，且对L4的计算精度不会产生影响，大大提升了性能。

图5为本发明实施例提供的另一种输出数据的精度配置方法的流程示意图，以神经网络为图像识别模型为例，假设图像识别模型为卷积神经网络模型(CNN)，例如可包括卷积层、池化层和全连接层，分别对应神经网络设备中的第一处理核、第二处理核和第三处理核，该方法可包括：

步骤503、通过第一处理核获取待识别图像数据，并根据待识别图像数据和卷积层的权重参数计算卷积层的待输出特征图数据，获取池化层的权重精度，将卷积层的待输出特征图数据的精度配置成池化层的权重精度，得到卷积层的输出特征图数据，并输出至第二处理核。

步骤504、通过第二处理核根据卷积层的输出特征图数据和池化层的权重参数计算池化层的待输出特征向量数据，获取全连接层的权重精度，将池化层的待输出特征向量数据的精度配置成全连接层的权重精度，得到池化层的输出特征向量数据，并输出至第三处理核。

步骤505、通过第三处理核根据池化层的输出特征向量数据和全连接层的权重参数计算并输出图像识别结果。

本发明实施例提供的输出数据的精度配置方法，应用于图像识别场景时，卷积层和池化层对应的处理核在进行图像数据输出之前，先根据下一层的权重精度来确定图像输出数据的精度，可在减少图像信息转换中的精度损失的同时，降低图像数据传输量，降低图像数据处理能耗，也即在保证计算精度的前提下，提高算力并降低功耗，使得承载图像识别网络模型的神经网络设备的性能得到有效提升，也能够提高图像识别模型的识别效率。

第二方面，本发明实施例提供一种输出数据的精度配置装置600。

图6为本发明实施例提供的一种输出数据的精度配置装置600的结构框图，该装置可由软件和/或硬件实现，一般可集成在神经网络设备中，可通过执行输出数据的精度配置方法来进行输出数据的精度配置。如图6所示，该装置至少包括以下权重精度获取模块602和精度配置模块603。

权重精度获取模块602，用于获取神经网络中的接收层的权重精度，其中，所述接收层为发送层的下一层，所述发送层为神经网络中除最后一层外的任意一层。

精度配置模块603，用于至少根据所述接收层的权重精度对所述发送层的待输出数据的精度进行配置。

本发明实施例中提供的输出数据的精度配置装置600，应用于神经网络设备中，获取神经网络中的发送层的待输出数据的精度，在对待输出数据进行输出之前，先获取接收层的权重精度，接收层为发送层的下一层，并根据接收层的权重精度对待输出数据的精度进行配置。通过采用上述技术方案，可以灵活配置部署在神经网络设备中的神经网络中的一层或多层的输出数据的精度，进而优化神经网络设备的性能。

在一些实施例中，如图6所示，装置600还包括：待输出数据获取模块601，用于获取所述发送层的所述待输出数据的精度。

在一些实施例中，所述神经网络设备基于众核架构实现。

第三方面，参照图7，本发明实施例提供了一种神经网络设备700，所述神经网络设备700包括至少一个处理核701，所述处理核701用于实现本发明实施例提供的输出数据的精度配置方法。

在一些实施例中，该神经网络设备700包括多个形成众核架构的处理核701。

本发明实施例的神经网络设备700可以采用众核架构，即其中包括多个处理核701，每个处理核701包含处理器并自带存储器，且不同处理核701之间可通过片上网络702(如2D Mesh)实现信息交互，从而每个处理核701可进行一定的计算，而通过多个处理核701可共同实现神经网络的计算。

例如，每个处理核701内可配置有神经网络的一个层。当然，若是一个处理核701内配置有神经网络的多个层，或仅配置有神经网络的一个层的一部分，或配置有神经网络的多个层的各一部分，也是可行的。

其中，众核架构的神经网络设备700的具体实现形式可以是多样的，例如设备可包括多个芯片(IC)的阵列，每个芯片内有一个处理核701或多个处理核701；或者，设备也可仅包括一个芯片，而芯片内有多个处理核701。

其中，当神经网络设备700包括多个芯片的阵列时，可同时高效的支持不同的神经网络，例如既能高效支持ANN算法，又能高效支持SNN算法。具体的，此时神经网络设备700的不同芯片中可以承载不同的神经网络模型，具体可以根据实际需求进行配置，扩展性好，能得到极大算力的芯片阵列，且算力效率不会下降，可支持多核重组特性，实现多任务并行处理。

第四方面，参照图8，本发明实施例提供了一种计算机可读存储介质800，其上存储有计算机程序，该计算机程序被处理核执行时实现本发明实施例提供的输出数据的精度配置方法。

上述实施例中提供的输出数据的精度配置装置、神经网络设备、计算机可读存储介质可执行本发明任意实施例所提供的输出数据的精度配置方法，具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节，可参见本发明任意实施例所提供的输出数据的精度配置方法。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其它等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

一种输出数据的精度配置方法，其特征在于，所述方法应用于神经网络设备中，所述方法包括：

获取神经网络中的接收层的权重精度，其中，所述接收层为发送层的下一层，所述发送层为神经网络中除最后一层外的任意一层；

至少根据所述接收层的权重精度对所述发送层的待输出数据的精度进行配置。
根据权利要求1所述的方法，其特征在于，在所述获取神经网络中的接收层的权重精度前，还包括：

获取所述发送层的所述待输出数据的精度。
根据权利要求2所述的方法，其特征在于，所述至少根据所述接收层的权重精度对所述发送层的待输出数据的精度进行配置，包括：

根据所述待输出数据的精度以及所述接收层的权重精度，确定目标精度；

将所述待输出数据的精度配置成目标精度。
根据权利要求2所述的方法，其特征在于，所述获取所述发送层的所述待输出数据的精度，包括：

获取所述发送层的输入数据的精度和所述发送层的权重精度；

根据所述输入数据的精度和所述发送层的权重精度确定所述发送层的待输出数据的精度，所述待输出数据的精度大于或等于所述输入数据的精度和所述发送层的权重精度中较高的精度。
根据权利要求3或4所述的方法，其特征在于，

在所述接收层的权重精度低于所述待输出数据的精度时，所述目标精度低于所述待输出数据的精度，且不低于所述接收层的权重精度。
根据权利要求3或4所述的方法，其特征在于，

在所述接收层的权重精度不低于所述待输出数据的精度时，所述目标精度不低于所述待输出数据的精度，且不高于所述接收层的权重精度。
根据权利要求1所述的方法，其特征在于，所述至少根据所述接收层的权重精度对所述发送层的待输出数据的精度进行配置，包括：

将所述接收层的权重精度确定为目标精度；

将所述待输出数据的精度配置成目标精度。
根据权利要求1所述的方法，其特征在于，在所述至少根据所述接收层的权重精度对所述发送层的待输出数据的精度进行配置之后，还包括：

将配置后得到的输出数据输出至所述接收层。
根据权利要求1、2、3、4、7、8所述的方法，其特征在于，所述神经网络设备基于众核架构实现。
一种输出数据的精度配置装置，其特征在于，所述装置集成于神经网络设备中，所述装置包括：

权重精度获取模块，用于获取神经网络中的接收层的权重精度，其中，所述接收层为发送层的下一层，所述发送层为神经网络中除最后一层外的任意一层；

精度配置模块，用于至少根据所述接收层的权重精度对所述发送层的待输出数据的精度进行配置。
一种神经网络设备，其特征在于，所述神经网络设备包含至少一个处理核，所述处理核用于实现如权利要求1-9任一所述的方法。
根据权利要求11所述的设备，其特征在于，包括多个形成众核架构的处理核。
一种计算机可读存储介质，其特征在于，其上存储有计算机程序，所述计算机程序被处理核执行时实现如权利要求1-9任一项所述的方法。