WO2019165679A1

WO2019165679A1 - 一种包括比特转换装置的神经网络处理器及其方法

Info

Publication number: WO2019165679A1
Application number: PCT/CN2018/082179
Authority: WO
Inventors: 韩银和; 闵丰; 许浩博; 王颖
Original assignee: 中国科学院计算技术研究所
Priority date: 2018-03-01
Filing date: 2018-04-08
Publication date: 2019-09-06
Also published as: CN108345938A

Abstract

一种神经网络处理器，以及采用所述神经网络处理器对神经网络的数据进行比特转换的方法。所述神经网络处理器中包括比特转换装置（101），该比特转换装置（101）包括：输入接口（102）、控制单元（105）、数据转换单元（103）、和输出接口（104）；其中，所述控制单元（105）用于产生针对所述数据转换单元（103）的控制信号；所述输入接口（102）用于接收原始数据；所述数据转换单元（103）用于根据所述控制信号对所述原始数据进行比特转换，以将所述原始数据转换为采用更少的比特位数进行表达的比特转换结果；所述输出接口（104）用于将所述比特转换结果输出所述比特转换装置（101）。通过该方法可以减少表达数据所采用的比特位数，降低计算所需的硬件成本、和能耗，提高计算速度。

Description

一种包括比特转换装置的神经网络处理器及其方法

技术领域

本发明涉及人工智能领域，尤其涉及对神经网络处理器的改进。

背景技术

人工智能的深度学习技术在近几年得到了飞速的发展，在解决高级抽象认知问题上，例如图像识别、语音识别、自然语言理解、天气预测、基因表达、内容推荐和智能机器人等领域得到了广泛应用并且被证实了具有出色的表现。这使得对于人工智能技术的开发和改进成为了学术界和工业界的研究热点。

深度神经网络是人工智能领域具有最高发展水平的感知模型之一，该类网络通过建立模型来模拟人类大脑的神经连接结构，采用多个变换阶段分层对数据特征进行描述，为图像、视频和音频等大规模数据处理任务带来了突破性进展。深度神经网络的模型属于一种运算模型，其包含大量的节点，这些节点之间采用网状的互连结构，被称作为深度神经网络的神经元。在两个节点之间的连接强度代表信号在该两个节点间的加权值，即权重，以与生物学意义上的神经网络中的记忆相对应。

针对神经网络计算的专用处理器，即神经网络处理器也得到了相应的发展。在实际的神经网络计算处理过程中，需要对大量的数据反复地进行卷积、激活、池化等操作，这需要消耗极大量的计算时间，严重影响了用户的使用体验。这使得如何减少神经网络的计算时间成为了针对神经网络处理器的一种改进策略。

发明内容

因此，本发明的目的在于克服上述现有技术的缺陷，提供一种神经网络处理器，该神经网络处理器中包括比特转换装置，该比特转换装置包括：

输入接口、控制单元、数据转换单元、和输出接口；

其中，

所述控制单元用于产生针对所述数据转换单元的控制信号；

所述输入接口用于接收原始数据；

所述数据转换单元用于根据所述控制信号对所述原始数据进行比特转换，以将所述原始数据转换为采用更少的比特位数进行表达的比特转换结果；

所述输出接口用于将所述比特转换结果输出所述比特转换装置。

优选地，根据所述神经网络处理器，其中所述控制单元用于根据设置的参数或者输入的参数确定执行比特转换的规则，以产生所述控制信号；

其中，所述参数包括与所述原始数据的比特位数以及所述比特转换结果的比特位数相关的信息。

优选地，根据所述神经网络处理器，其中所述数据转换单元用于根据所述控制信号，确定所述原始数据中的保留位以及截断位，并且根据所述原始数据的保留位以及所述原始数据的截断位中的最高位确定所述比特转换结果。

优选地，根据所述神经网络处理器，其中所述数据转换单元用于根据所述控制信号，确定所述原始数据中的保留位以及截断位，并且将所述原始数据中的保留位作为所述比特转换结果。

优选地，根据所述神经网络处理器，其中所述数据转换单元用于根据所述控制信号对所述原始数据进行比特转换，以原始数据转化为采用原本一半的比特位数进行表达的比特转换结果。

一种采用上述任意一项所述的神经网络处理器对神经网络的数据进行比特转换的方法，包括：

1)所述控制单元产生针对数据转换单元的控制信号；

2)所述输入接口接收来自所述比特转换装置外部的需要执行比特转换的原始数据；

3)所述数据转换单元根据所述控制信号对所述原始数据进行比特转换，以将所述原始数据转换为采用更少的比特位数进行表达的比特转换结果；

4)所述输出接口将所述比特转换结果输出所述比特转换装置。

优选地，根据所述方法，其中步骤1)包括：

1-1)所述控制单元根据设置的参数或者输入的参数确定执行比特转换的规则；

1-2)所述控制单元产生与所述规则对应的控制信号；

优选地，根据所述方法，其中步骤3)包括：

所述数据转换单元根据所述控制信号，基于所述原始数据的保留位以及所述原始数据的截断位中的最高位确定所述比特转换结果。

优选地，根据所述方法，其中步骤3)包括：

所述数据转换单元根据所述控制信号，将所述原始数据中的保留位作为所述比特转换结果。

优选地，根据所述方法，在已完成对神经网络数据的缓存、并且尚未完成卷积运算时，将缓存的神经网络数据输入所述比特转换装置以执行步骤1)-4)，或者在已完成对数据的卷积运算、并且尚未完成激活运算时，将卷积运算的结果输入所述比特转换装置以执行步骤1)-4)。

一种计算机可读存储介质，其中存储有计算机程序，所述计算机程序在被执行时用于实现上述任意一项所述的方法。

与现有技术相比，本发明的优点在于：

本发明提供一种用于神经网络处理器的比特转换装置，其可被用于在神经网络的各种计算过程中对表达数据所采用的比特位数进行调整。通过减少表达数据所采用的比特位数，可以降低计算所需的硬件成本、提高计算速度、减少神经网络处理器对数据存储空间的需要、并且降低执行神经网络计算的能耗。

附图说明

以下参照附图对本发明实施例作进一步说明，其中：

图1示出了根据本发明的一个实施例的比特转换装置的模块图；

图2是根据本发明的一个实施例的比特转换装置中各个单元的连接关系图；

图3是根据本发明的一个实施例的采用如图1所示出的比特转换装置对神经网络数据进行比特转换的方法流程；

图4a是根据本发明的一个实施例在比特转换装置的数据转换单元中用于在“四舍五入模式”下执行比特转换的硬件结构图；

图4b是根据本发明的一个实施例在比特转换装置的数据转换单元中用于在“直接截断模式”下执行比特转换的硬件结构图。

具体实施方式

下面结合附图和具体实施方式对本发明作详细说明。

如前文中所述，在设计神经网络处理器时，希望能够减少神经网络的计算时间。对此，发明人认为可以通过适当地减少参与到神经网络计算的数据的比特位数，例如采用更少的比特位来代表原本需要较多比特位来表示的数据，降低运算量以减少神经网络的计算时间。这是由于，发明人在对现有技术的研究中发现，神经网络的算法对于计算的中间结果存在相对较高的容错性，即便采用更少的比特位来代表原本需要较多比特位来表示的数据的做法会改变参与计算的数据的精度从而影响所获得的中间结果的准确性，然而这并不会对神经网络最终输出的结果造成较大的影响。

在本发明中，将这种缩减计算所使用的数据的比特位的方式称作为对数据的“裁剪操作”。并且，将对表达数值所需的二进制比特位数进行调整的过程称作为“比特转换”。例如，针对十进制的数值0.5，采用Q7定点数据进行表示的结果为01000000(这里Q7采用8比特中的最左侧第一个比特位作为符号位，采用其余7个比特位表示小数部分，由此来表示-1到1之间的精度为7的小数)，在进行比特转换时，可以将原本采用Q7表示的结果修改为采用Q3进行表示，获得结果0100(与Q7相类似地，Q3同样采用最左侧第一个比特作为符号位，不同的是其采用3个比特位表示小数部分，可以表示-1到1之间的精度为3的小数)。

基于上述分析，本发明提出了一种用于神经网络处理器的比特转换装置。通过所述比特转换装置可以根据设置的或者基于用户输入的参数确定执行比特转换的规则，以对数据执行比特转换。通过这样的转换，神经网络处理器可以对相对较少量的数据进行处理，并由此提升处理速度、降低神经网络处理器的能耗。发明人认为，在逻辑组合电路中，数据运算的速度与数值表达的比特位数成反比；数据运算的能耗与数值表达的比特位成正比；故对数据进行比特转换后，可达到加速计算与降低功耗的效果。

图1示出了根据本发明的一个实施例的比特转换装置101，包括：作为输入接口的输入总线单元102、数据转换单元103、作为输出接口的输出总线单元104、控制单元105。

其中，输入总线单元102，用于获取需要进行比特转换的神经网络数据，以将其提供至数据转换单元103。在一些实施例中，输入总线单元102可以并行地接收和/或传输多个待转换数据。

数据转换单元103，用于根据例如设置的或者基于用户输入的参数而确定的执行比特转换的规则，对来自输入总线单元102的神经网络数据执行比特转换。

输出总线单元104，用于将经由数据转换单元103处理所获得的比特转换的结果从比特转换装置101中输出，以提供至神经网络处理中用于执行后续处理的装置。

控制单元105，用于确定比特转换的规则，选择相应的比特转换模式来控制数据转换单元103执行比特转换的操作。所述控制单元105可以通过分析设置的参数或者由用户输入的参数来确定执行比特转换的规则，以从预先设置的各种转换模式中进行选择。这里参数可以包括待转换数据的比特位数以及转换后的数据比特位数，也可以是待转换数据所采用的二进制的表达方式以及转化后的数据所期望采用的二进制的表达方式，例如Q7、Q3等。例如，根据用户输入的参数，确定将采用Q7表示的神经网络数据转换为采用Q3表示。在减少表达所采用的比特位时，可以采用“四舍五入”的方式，例如将01011000转换为0110，也可以采用“直接截断”的方式，例如将01011000转换为0101。这里的“四舍五入”或者“直接截断”等转换方式既可以由用户输入，也可以被设置为是固定的。

在一些实施例中，输入总线单元102和/或输出总线单元104可以并行地接收和/或传输多个待转换数据。

图2是根据本发明的一个实施例的比特转换装置中各个单元的连接关系图。其中，输入总线单元的比特位数为128bit，输出总线的比特位数为64bit。控制单元从比特转换装置外部接收由用户输入的参数，其用于根据确定的比特转换规则以产生用于数据转换单元的模式切换信号，使得数据转换单元可以获知在当前状况下需要采用何种方式以执行比特转换。并且，控制单元还可以产生用于控制输入总线单元开始接收数据或者暂停接收数据的输入控制信号，以及用于控制输出总线单元开始输出或者暂停输出比特转换结果的输出控制信号。

下面将通过一个实施例介绍采用如图1所示出的比特转换装置对神经网络数据进行比特转换的方法过程。参考图3，所述方法包括：

步骤1.基于设置的转换需求参数或者由用户输入的参数，由比特转换装置101中的控制单元105确定所使用的比特转换的规则。所述设置的转换需求参数、所述由用户输入的参数中包括与需要转换的神经网络数据的比特位数以及转化后的数据比特位数相关的信息。所述设置的转换需求参数、所述由用户输入的参数还可以包括在进行比特转换时的截断规则，例如“四舍五入”或者“直接截断”等规则。

基于上述规则，可以由控制单元105从预先设置的比特转换模式中进行选择。根据本发明的一个实施例，所述比特转换模式包括“四舍五入模式”和“直接截断模式”，对于所述两种不同模式的处理方式将在随后的步骤中进行介绍。

步骤2.比特转换装置101中的输入总线单元102将其所获得的需要执行比特转换的神经网络数据提供至数据转换单元103。

这里的输入总线单元102可以包括多个能够并行接收数据的接口，以并行地接收来自比特转换装置101外部的需要执行比特转换的神经网络数据。类似的，输入总线单元102也可以包括多个能够并行输出数据的接口，从而并行地将数据提供至数据转换单元103，以进行比特转换的处理。

步骤3.数据转换单元103依据控制单元105所确定的比特转换的规则，对需要执行比特转换的神经网络数据执行比特转换。

在此步骤中，可以由数据转换单元103接收来自控制单元105的控制信号以依据所述规则执行比特转换。

发明人发现，在降低计算所使用的数据的比特位数时，若是缩减后的比特位数大于等于原本数据的比特位数的一半，则可以使得神经网络处理器在硬件成本、处理速度、和准确率之间达到折中。因此，在本发明中优选地，将需要执行比特转换的神经网络数据的比特位数缩减为原本的一半，例如采用固定的硬件结构来执行比特转换，以将32bit的数据转化为16bit、将16bit的数据转化为8bit、将8bit的数据转化为4bit、将4bit的数据转化为2bit、以及将2bit的数据转化为1bit等。

在执行比特转换的过程中，可以根据所述规则，将需要执行比特转换的神经网络数据的各个比特位划分为保留位和截断位，其中保留位为所述神经网络数据的各个比特位中较高的一个或多个比特位，截断位为所述神经网络数据的各个比特位中的其余比特位。例如，对于8bit的数据10101111而言，若采用将其比特位数缩减为原本的一半的方式，则其保留位为1010，其截断位为1111。

图4a示出了根据本发明的一个实施例在数据转换单元103中用于在“四舍五入模式”下执行比特转换的硬件装置结构，其中16个8bit的需要执行比特转换的神经网络数据被并行地输入到数据转换单元103中，每一个8bit的神经网络数据中的4bit的保留位中除去符号位以外的比特位(例如a ₁、a ₂、a ₃)和对应的截断位中的最高位(例如a ₄)被分别用作为加法器的两个输入，所述加法器的输出以及所述神经网络数据中的符号位共同被用作为针对所述8bit的神经网络数据执行比特转换后的结果。

参考图4a进行举例说明，在“四舍五入模式”下，假设输入到转换单元103中的神经网络数据为10101111(反码)，表示其表示十进制的-0.6328125，其截断位为1111，将截断位的最高位1与保留位中除符号位之外的3个比特位010相加，基于所述神经网络数据中的符号位与加法器的结果得到比特转换后的结果为1011(反码)，表示十进制的-0.625。

图4b示出了根据本发明的一个实施例在数据转换单元103中用于在“直接截断模式”下执行比特转换的硬件装置结构，其中16个8bit的需要执行比特转换的神经网络数据被并行地输入到数据转换单元103中，每一个8bit的神经网络数据中的4bit的保留位(例如a ₀、a ₁、a ₂、a ₃)被直接用作为针对所述8bit的神经网络数据执行比特转换后的结果。

参考图4b进行举例说明，在“直接截断模式”下，假设输入到转换单元103中的神经网络数据为10101111(反码)，则执行比特转换后的结果为1010。

步骤4.由输出总线单元104将经由数据转换单元103处理所获得的比特转换的结果从比特转换装置101中输出，以提供至神经网络处理中用于执行后续处理的装置。

由本发明上述实施例所提供的比特转换装置可以作为神经网络处理器的一部分，在针对神经网络的各种计算过程中使用。

例如，可以在已完成对神经网络数据的缓存、并且尚未完成卷积运算时，采用比特转换装置对缓存的神经网络数据进行比特转换。这样做的原因在于，神经网络的不同网络层对数据所采用的比特位数可能存在不同的要求，为了适应于所需要的计算速度、以及期望的能耗，可以由比特转换装置对缓存的神经网络数据进行比特转换，并将经过比特转换所获得的结果提供至用于执行卷积运算的单元以执行卷积运算。

又例如，可以在已完成对数据的卷积运算、并且尚未完成激活运算时，采用比特转换装置对卷积运算的结果进行比特转换。这样做的原因在于，卷积运算单元的累加操作往往会增加所获得的卷积运算的结果的比特位数，为了适应于后续操作对比特位数的要求(例如对于一些采用硬件方式实现的激活运算单元而言，其所使用的比特位数往往是固定的)，需要对卷积运算的结果进行比特转换。

基于上述实施例，本发明提供一种用于神经网络处理器的比特转换装置，其可被用于在神经网络的各种计算过程中对表达数据所采用的比特位数进行调整。通过减少表达数据所采用的比特位数，可以降低计算所需的硬件成本、提高计算速度、减少神经网络处理器对数据存储空间的需要、并且降低执行神经网络计算的能耗。

需要说明的是，上述实施例中介绍的各个步骤并非都是必须的，本领域技术人员可以根据实际需要进行适当的取舍、替换、修改等。

最后所应说明的是，以上实施例仅用以说明本发明的技术方案而非限制。尽管上文参照实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，对本发明的技术方案进行修改或者等同替换，都不脱离本发明技术方案的精神和范围，其均应涵盖在本发明的权利要求范围当中。

Claims

一种神经网络处理器，该神经网络处理器中包括比特转换装置，该比特转换装置包括：

输入接口、控制单元、数据转换单元、和输出接口；

其中，

所述控制单元用于产生针对所述数据转换单元的控制信号；

所述输入接口用于接收原始数据；

所述数据转换单元用于根据所述控制信号对所述原始数据进行比特转换，以将所述原始数据转换为采用更少的比特位数进行表达的比特转换结果；

所述输出接口用于将所述比特转换结果输出所述比特转换装置。
根据权利要求1所述的神经网络处理器，其中所述控制单元用于根据设置的参数或者输入的参数确定执行比特转换的规则，以产生所述控制信号；

其中，所述参数包括与所述原始数据的比特位数以及所述比特转换结果的比特位数相关的信息。
根据权利要求2所述的神经网络处理器，其中所述数据转换单元用于根据所述控制信号，确定所述原始数据中的保留位以及截断位，并且根据所述原始数据的保留位以及所述原始数据的截断位中的最高位确定所述比特转换结果。
根据权利要求2所述的神经网络处理器，其中所述数据转换单元用于根据所述控制信号，确定所述原始数据中的保留位以及截断位，并且将所述原始数据中的保留位作为所述比特转换结果。
根据权利要求1所述的神经网络处理器，其中所述数据转换单元用于根据所述控制信号对所述原始数据进行比特转换，以原始数据转化为采用原本一半的比特位数进行表达的比特转换结果。
一种采用如权利要求1-5中任意一项所述的神经网络处理器对神经网络的数据进行比特转换的方法，包括：

1)所述控制单元产生针对数据转换单元的控制信号；

2)所述输入接口接收来自所述比特转换装置外部的需要执行比特转换的原始数据；

3)所述数据转换单元根据所述控制信号对所述原始数据进行比特转换，以将所述原始数据转换为采用更少的比特位数进行表达的比特转换结果；

4)所述输出接口将所述比特转换结果输出所述比特转换装置。
根据权利要求6所述的方法，其中步骤1)包括：

1-1)所述控制单元根据设置的参数或者输入的参数确定执行比特转换的规则；

1-2)所述控制单元产生与所述规则对应的控制信号；

其中，所述参数包括与所述原始数据的比特位数以及所述比特转换结果的比特位数相关的信息。
根据权利要求7所述的方法，其中步骤3)包括：

所述数据转换单元根据所述控制信号，基于所述原始数据的保留位以及所述原始数据的截断位中的最高位确定所述比特转换结果。
根据权利要求7所述的方法，其中步骤3)包括：

所述数据转换单元根据所述控制信号，将所述原始数据中的保留位作为所述比特转换结果。
根据权利要求6-9中任意一项所述的方法，在已完成对神经网络数据的缓存、并且尚未完成卷积运算时，将缓存的神经网络数据输入所述比特转换装置以执行步骤1)-4)，或者在已完成对数据的卷积运算、并且尚未完成激活运算时，将卷积运算的结果输入所述比特转换装置以执行步骤1)-4)。
一种计算机可读存储介质，其中存储有计算机程序，所述计算机程序在被执行时用于实现如权利要求6-10中任意一项所述的方法。