WO2021259231A1

WO2021259231A1 - 人工智能芯片和基于人工智能芯片的数据处理方法

Info

Publication number: WO2021259231A1
Application number: PCT/CN2021/101414
Authority: WO
Inventors: 蔡权雄; 牛昕宇
Original assignee: 深圳鲲云信息科技有限公司
Priority date: 2020-06-22
Filing date: 2021-06-22
Publication date: 2021-12-30
Also published as: CN111857989B; CN111857989A; US20230126978A1

Abstract

本申请实施例提供了一种人工智能芯片和基于人工智能芯片的数据处理方法。该人工智能芯片包括：用于基于AI算法对待处理数据进行处理的数据流网络，所述数据流网络包括：至少一个计算模块，每个计算模块设置为基于所述AI算法对应的至少一个运算节点中的一个对所述待处理数据进行计算，输出计算结果；所述每个计算模块对应的下一流转模块，设置为与所述每个计算模块连接，接收所述每个计算模块输出的计算结果，并对所述计算结果进行处理；其中，所述待处理数据按照预设的数据流向在所述数据流网络中流动。

Description

人工智能芯片和基于人工智能芯片的数据处理方法

本申请要求在2020年6月22日提交中国专利局、申请号为202010575487.1的中国专利申请的优先权，该申请的全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及人工智能技术领域，例如涉及一种人工智能芯片和基于人工智能芯片的数据处理方法。

背景技术

随着人工智能的迅速发展，市场上出现了许多用于计算人工智能学习模型的AI芯片。

目前，常用的人工智能(Artificial Intelligence，AI)芯片是通过指令集的方式获取数据，并按照AI算法的运算规则对数据进行处理。

然而，通过指令集的方式获取数据，需要消耗AI芯片的资源来实现，导致AI芯片的资源利用率较低。

发明内容

以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

本申请实施例提供一种人工智能芯片和基于人工智能芯片的数据处理方法，以提高AI芯片的资源利用率。

第一方面，本申请实施例提供了一种人工智能芯片，用于基于AI算法对待处理数据进行处理的数据流网络，所述数据流网络包括：

至少一个计算模块，每个计算模块设置为基于所述AI算法对应的至少一个运算节点中的一个运算节点对所述待处理数据进行计算，输出计算结果；

所述每个计算模块对应的下一流转模块，设置为与所述每个计算模块连接，接收所述每个计算模块输出的计算结果，并对所述计算结果进行处理；

其中，所述待处理数据按照预设的数据流向在所述数据流网络中流动。

第二方面，本申请实施例提供了一种基于人工智能芯片的数据处理方法，所述方法包括：

数据流网络中至少一个计算模块中的每个计算模块基于AI算法对应的至少一个运算节点中的一个运算节点对待处理数据进行计算，输出计算结果，所述数据流网络用于基于所述AI算法对所述待处理数据进行处理；

下一流转模块接收所述每个计算模块输出的计算结果，并对所述计算结果进行处理，其中所述下一流转模块设置为与所述每个计算模块连接；

附图说明

图1是本申请实施例一提供的人工智能芯片的结构示意图；

图2是本申请实施例提供的另一种人工智能芯片的结构示意图；

图3是本申请实施例提供的一种运行CNN模型的人工智能芯片的结构示意图；

图4是本申请实施例提供的另一种人工智能芯片的结构示意图；

图4A是本申请实施例提供的一种人工智能芯片中控制流坝的结构示意图；

图5是本申请实施例提供的基于人工智能芯片的数据处理方法。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的示例实施例仅仅用于解释本申请，而非对本申请的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本申请相关的部分而非全部结构。

在更加详细地讨论示例性实施例之前应当提到的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理，但是其中的许多步骤可以被并行地、并发地或者同时实施。此外，各步骤的顺序可以被重新安排。当其操作完成时处理可以被终止，但是还可以具有未包括在附图中的附加步骤。处理可以对应于方法、函数、规程、子例程、子计算机程序等等。

此外，术语“第一”、“第二”等可在本文中用于描述各种方向、动作、步骤或元件等，但这些方向、动作、步骤或元件不受这些术语限制。这些术语仅用于将第一个方向、动作、步骤或元件与另一个方向、动作、步骤或元件区分。举例来说，在不脱离本申请的范围的情况下，可以将第一有效信号为第二有效信号，且类似地，可将第二有效信号称为第一有效信号。第一有效信号和第二有效信号两者都是有效信号，但其不是同一有效信号。术语“第一”、“第二”等而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

图1为本申请实施例提供的一种人工智能芯片的结构示意图。如图1所示，本申请实施例提供了一种人工智能芯片10，包括用于基于AI算法对待处理数据进行处理的数据流网络，所述数据流网络包括：至少一个计算模块110和下一流转模块120。本实施例的人工智能芯片适用于基于预设的数据流向和AI算法对待处理数据进行数据处理。其中：

所述计算模块110设置为基于所述AI算法对应的其中一个运算节点对所述待处理数据进行计算，输出计算结果；

当前计算模块110对应的下一流转模块120，设置为接收所述计算模块110输出的计算结果，并对所述计算结果进行处理；

在本实施例中，待处理数据是指需要通过AI算法进行处理的数据。例如，待处理数据可以是待处理的图像数据、待处理的文本数据等可以基于AI算法进行处理的数据，此处不作具体限制。AI算法是指人工智能模型对应的算法，例如卷积神经网络(Convolutional Neural Network，CNN)模型对应的算法等，此处不作具体限制。运算节点为AI算法中用于计算的节点。需要说明的是，AI算法的本质是一些数学模型，因此有一些系数，通过AI算法进行计算时，需要AI算法对应系数和待处理数据通过给计算模块110进行计算。当前计算模块110为至少一个计算模块110的其中一个，本实施例不限定当前计算模块110具体为哪个计算模块110。其中，数据流向按照AI算法的运算顺序表征在数据流网络中，指示待处理数据的流动方向。

示例性的，CNN模型包括卷积层、池化层和全连接层，则CNN算法为在卷积层计算，然后在池化层计算，最后在全连接层进行计算，则运算节点可以是在卷积层、池化层或全连接层计算的节点，也可以是在卷积层内计算的其中一个节点，例如第一卷积子层或第二卷积子层的计算模块110，此处不作具体限制。

其中，下一流转模块120是指与当前计算模块110连接的下一模块。例如，下一流转模块120可以是当前计算模块110对应的下一计算模块，或者是当前计算模块110对应的下一存储模块，可以根据需要设置，此处不作具体限制。需要说明的是，计算模块110的数量可以根据具体的人工智能模型对应的AI算法确定，数据流向也可以根据AI算法的运算过程确定，即确定待处理数据在计算模块110和下一流转模块120之间的流动，本实施例不作具体限制。

可以理解的是，待处理数据是按照预设的数据流向在数据流网络中流动，计算模块110和下一流转模块120均不需要对数据进行获取，只需要等待数据按照数据流向到达计算模块110和下一流转模块120时，对获取到的待处理数据进行处理即可，减少了指令的开销，提高了芯片的资源利用率。

参考图2，图2是本实施例提供的另一种人工智能芯片的结构示意图。在一个实施例中，例如，数据流网络还包括处理模块130，其中：

处理模块130，设置为对所述待处理数据进行处理，得到所述待处理数据所携带的参数；

所述计算模块110设置为基于所述参数对所述待处理数据进行计算。

其中，处理模块130可以与芯片外的片外存储200直接相连，设置为接收片外存储200发送的待处理数据后，对待处理数据进行处理以得到数据流网络计算所需的参数，供数据流网络中的计算模块110基于所述参数对所述待处理数据进行计算。

参考图3，图3为本实施例提供的一种运行CNN模型的人工智能芯片的结构示意图。通过图3可知，本实施例中的待处理数据为待处理的图像数据，人工智能芯片包括计算模块A 111、计算模块B 112和计算模块C 113，其中，计算模块A 111设置为在卷积层计算，计算模块B 112设置为在池化层计算，计算模块C 113设置为在全连接层计算。则预设的数据流向依次为计算模块A 111、计算模块B 112和计算模块C 113。可以理解的是，待处理的图像数据按照预设的数据流向在计算模块A 111、计算模块B 112和计算模块C 113中流动，图像数据到达计算模块A 111时，进行卷积层的计算，计算完成后到达计算模块B 112，进行池化层的计算，最后到达计算模块C 113进行全连接层的计算，输出最后的计算结果。其中，最后的计算结果可以保存在人工智能芯片外的片外存储中，此处不作具体限制。同时参考图1和图3，当计算模块A 111作为当前计算模块110时，则对应的下一流转模块120为计算模块B 112，当计算模块C 113为当前计算模块110时，对应的下一流转模块120为存储最后的计算结果的最终存储模块(存储模块并未在图1和图3中示出)。

例如，当相邻的两个计算模块110，例如计算模块A111和计算模块B112之间设置有中间存储模块时，则计算模块A111的下一流转模块120则是该中间存储模块，此处不作具体限制。可以理解的是，当上一计算模块110已计算完成，但下一计算模块110未计算完成时，将上一计算模块110的计算结果先发送至中间存储模块等待，则上一计算模块110可以处于空闲状态，继续获取新的数据进行计算，且在下一计算模块110计算完成时，中间存储模块再将上一计算模块110的计算结果发送至下一计算模块进行计算，进一步提高了芯片的资源利用率。

可以理解的是，本实施例的上一计算模块110和下一计算模块110仅表示存在数据交互的两个计算模块110，而不限于具体的计算模块110。

需要说明的是，为了使芯片的资源利用率最大化，数据的流向需要保证计算模块110和下一流转模块120之间刚好没有空闲时间，本实施例不作具体限制。

参考图4，图4是本实施例提供的另一种人工智能芯片的结构示意图。本实施例中的当前计算模块110和所述下一流转模块120之间设置有控制流坝140，其中，所述控制流坝140设置为控制所述计算结果由所述当前计算模块110向所述下一流转模块120流动。

例如，为了实现通过控制流坝140作为计算模块110和下一流转模块120之间的自动流控制，其基本思想如下：

A)输入数据速率(F_in)＝有效输入数据数/单位时间(T_d)

B)输出数据速率(F_out)＝有效输出数据数/单位时间(T_d)

C)在整个运行期间，如果F_in＝F_out，则

为了完全避免背压：数据坝应该能够存储max(F_in)-min(F_out)数据。控制流坝140将计算模块110和下一流转模块120的内部状态结合在一起。纯粹由硬件决定是否将数据从当前计算模块110中流出来。因此，该控制流坝140可以理解为调节数据流的屏障。基于算法要求，控制流坝140进一步扩展为支持预定静态流量控制。

例如，控制流坝140包括写入端、读取端、满载端和空载端，还包括：

第一与门，与所述写入端连接以组成上行有效端，所述上行有效端设置为接收所述当前计算模块110发送的第一有效信号；

第二与门，与所述读取端连接以组成下行许可端，所述下行许可端设置为接收所述下一流转模块120发送的第二有效信号；

第一非门，与所述满载端连接以组成上行许可端，所述第上行许可端设置为发送第一许可信号给所述当前计算模块110和第一与门；

第二非门，与所述空载端连接以组成下行有效端，所述下行有效端设置为发送第二有效信号给所述下一流转模块120和第二与门。

例如，所述当前计算模块110设置为接收所述控制流坝140发送的第一许可信号；

所述当前计算模块110提供所述第一有效信号给所述控制流坝140，以将所述待处理数据中的目标数据写入所述控制流坝140，所述当前计算模块110设置为按照所述运算节点指向的处理方式对所述目标数据进行处理，得到所述计算结果，其中目标数据为待处理数据中，适用当前计算模块110进行计算的数据；

所述控制流坝140设置为接收所述下一流转模块120发送的第二许可信号；

所述控制流坝140提供所述第二有效信号给所述下一流转模块120，以将所述计算结果写入所述下一流转模块120。

本实施例中，当前计算模块110接收到控制流坝140发送的第一许可信号，即表示控制流坝140已准备好接收当前计算模块110中需要写入的数据，在当前计算模块110接收到控制流坝140发送的第一许可信号后，当前计算模块110可以读取计算结果。当前计算模块110给控制流坝140提供第一有效信号，即表示当前计算模块110可以将计算结果写入控制流坝140中，在控制流坝140接收到当前计算模块110发送的第一有效信号后，控制流坝140可以写入计算结果。

当前计算模块110接收到控制流坝140发送的第一许可信号，同时控制流坝140也接收到当前计算模块110发送的第一有效信号时，计算结果便开始从当前计算模块110中写入控制流坝140。其中，当任一信号停止发送时，即控制流坝140停止给当前计算模块110发送第一许可信号或当前计算模块110停止给控制流坝140发送第一有效信号时，该通信的传输将会立即停止。此时，计算结果已经从当前计算模块110中写入控制流坝140内，控制流坝140中存储有计算结果。当控制流坝140接收到下一流转模块120发送的第一许可信号，即表示下一流转模块120已准备好接收控制流坝140中需要写入的数据，在控制流坝140接收到下一流转模块120发送的第二许可信号后，下一流转模块120可以读取计算结果。当控制流坝140提供第二有效信号给下一流转模块120，即表示控制流坝140可以将计算结果写入下一流转模块120中，在下一流转模块120接收到控制流坝140发送的第二有效信号后，下一流转模块120可以写入计算结果。

当控制流坝140接收到下一流转模块120发送的第一许可信号，同时下一流转模块120也接收到控制流坝140发送的第二有效信号时，计算结果便开始从控制流坝140中写入下一流转模块120。其中，当任一信号停止发送时，即下一流转模块120停止给控制流坝140发送第二许可信号或控制流坝140停止给下一流转模块120发送第二有效信号时，该通信的传输将会立即停止。由此完成计算结果从当前计算模块110到下一流转模块120的传输。另外需要说明的是，计算结果并非指按顺序的计算结果，该计算结果可以为实际通信中的任意一段数据。

本申请实施例的技术方案，人工智能芯片包括用于基于AI算法对待处理数据进行处理的数据流网络，所述数据流网络包括至少一个计算模块，所述计算模块设置为基于所述AI算法对应的其中一个运算节点对所述待处理数据进行计算，输出计算结果；当前计算模块对应的下一流转模块，设置为接收所述计算模块输出的计算结果，并对所述计算结果进行处理；其中，所述待处理数据按照预设的数据流向在所述数据流网络中流动，避免了AI芯片通过指令集的方式获取数据，需要消耗AI芯片的资源来实现，导致AI芯片的资源利用率较低的情况，提高了AI芯片的资源利用率。

图5为本申请实施例提供的一种基于人工智能芯片的数据处理方法，可适用于基于预设的数据流向和AI算法对待处理数据进行数据处理的场景，该方法可以本实施例提供的人工智能芯片实现。

如图5所示，本申请实施例提供的基于人工智能芯片的数据处理方法包括：

S610、数据流网络中的至少一个计算模块基于AI算法对应的其中一个运算节点对待处理数据进行计算，输出计算结果，所述数据流网络用于基于所述AI算法对所述待处理数据进行处理；

其中，数据流网络是指人工智能芯片中，各个模块组成的用于基于AI算法对待处理数据进行处理的网络。待处理数据是指需要通过AI算法进行处理的数据。例如，待处理数据可以是待处理的图像数据、待处理的文本数据等可以基于AI算法进行处理的数据，此处不作具体限制。AI算法是指人工智能模型对应的算法，例如CNN模型对应的算法等，此处不作具体限制。运算节点为AI算法中用于计算的节点。需要说明的是，AI算法的本质是一些数学模型，因此有一些系数，通过AI算法进行计算时，需要AI算法对应系数和待处理数据通过给计算模块进行计算。

示例性的，CNN模型包括卷积层、池化层和全连接层，则CNN算法为在卷积层计算，然后在池化层计算，最后在全连接层进行计算，则运算节点可以是在卷积层、池化层或全连接层计算的节点，也可以是在卷积层内计算的其中一个节点，例如第一卷积子层或第二卷积子层的计算模块，此处不作具体限制。

S620、当前计算模块对应的下一流转模块接收所述计算模块输出的计算结果，并对所述计算结果进行处理，其中，所述待处理数据按照预设的数据流向在所述数据流网络中流动。

其中，当前计算模块为至少一个计算模块的其中一个，本实施例不限定当前计算模块具体为哪个计算模块。下一流转模块是指与当前计算模块连接的下一模块。例如，下一流转模块可以是当前计算模块对应的下一计算模块，或者是当前计算模块对应的下一存储模块，可以根据需要设置，此处不作具体限制。需要说明的是，计算模块的数量可以根据具体的人工智能模型对应的AI算法确定，数据流向也可以根据AI算法的运算过程确定，即确定待处理数据在计算模块和下一流转模块之间的流动，本实施例不作具体限制。

可以理解的是，待处理数据是按照预设的数据流向在数据流网络中流动，计算模块和下一流转模块均不需要对数据进行获取，只需要等待数据按照数据流向到达计算模块和下一流转模块时，对获取到的待处理数据进行处理即可，减少了指令的开销，提高了芯片的资源利用率。

在一个示例实施方式中，该基于人工智能芯片的数据处理方法还包括：

数据流网络中的处理模块对待处理数据进行处理，得到所述待处理数据所携带的参数；所述计算模块基于AI算法对应的其中一个运算节点对所述待处理数据进行计算，包括：确定所述计算模块对应的AI算法对应的其中一个运算节点；所述计算模块基于所述运算节点对所述参数进行计算。

其中，处理模块可以与芯片外的片外存储直接相连，设置为接收片外存储发送的待处理数据后，对待处理数据进行处理以得到数据流网络计算所需的参数，供数据流网络中的计算模块基于所述参数对所述待处理数据进行计算。

例如，可以将数据流网络中的计算瓶颈对应的目标计算模块设置为至少两个目标计算子模块串行计算，或将数据流网络中的计算瓶颈对应的目标计算模块设置为至少两个目标计算子模块并行计算，使芯片的资源利用率最大化。

在一个示例实施方式中，当前计算模块和所述下一流转模块之间设置有控制流坝，该基于人工智能芯片的数据处理方法还包括：所述控制流坝控制所述计算结果由所述当前计算模块向所述下一流转模块流动。

例如，为了实现通过控制流坝作为计算模块和下一流转模块之间的自动流控制，其基本思想如下：

A)输入数据速率(F_in)＝有效输入数据数/单位时间(T_d)

B)输出数据速率(F_out)＝有效输出数据数/单位时间(T_d)

C)在整个运行期间，如果F_in＝F_out，则

为了完全避免背压：数据坝应该能够存储max(F_in)-min(F_out)数据。控制流坝将计算模块和下一流转模块的内部状态结合在一起。纯粹由硬件决定是否将数据从当前计算模块中流出来。因此，该控制流坝可以理解为调节数据流的屏障。基于算法要求，控制流坝进一步扩展为支持预定静态流量控制。

在一个示例实施方式中，控制流坝包括写入端、读取端、满载端和空载端，还包括第一与门、第二与门、第一非门和第二非门，所述第一与门与所述写入端连接以组成上行有效端，所述第二与门与所述读取端连接以组成下行许可端，第一非门与所述满载端连接以组成上行许可端，第二非门与所述空载端连接以组成下行有效端，基于人工智能芯片的数据处理方法还包括：所述上行有效端接收所述当前计算模块发送的第一有效信号；所述下行许可端接收所述下一流转模块发送的第二有效信号；所述第上行许可端发送第一许可信号给所述当前计算模块和第一与门，以触发当前计算模块的数据向控制流坝传输；所述下行有效端发送第二有效信号给所述下一流转模块和第二与门，以触发控制流坝存储的当前计算模块的数据向下一流转模块传输。第一有效信号和第一许可信号是为了控制当前计算模块流向控制流坝的数据流，第二有效信号和第二许可信号是为了控制控制流坝流向下一流转模块的数据流。当前计算模块中的数据流入控制流坝，并被控制流坝保存，在条件满足时，控制流坝向下一流转模块传输其保存的数据。

例如，所述当前计算模块提供所述第一有效信号给所述控制流坝，以将所述待处理数据中的目标数据写入所述控制流坝，所述当前计算模块设置为按照所述运算节点指向的处理方式对所述目标数据进行处理，得到所述计算结果。

所述控制流坝设置为接收所述下一流转模块发送的第二许可信号；

所述控制流坝设置为提供所述第二有效信号给所述下一流转模块，以将所述计算结果写入所述下一流转模块。

在本实施方式中，当前计算模块接收到控制流坝发送的第一许可信号，即表示控制流坝已准备好接收当前计算模块中需要写入的数据，在当前计算模块接收到控制流坝发送的第一许可信号后，当前计算模块可以读取计算结果。当前计算模块给控制流坝提供第一有效信号，即表示当前计算模块可以将计算结果写入控制流坝中，在控制流坝接收到当前计算模块发送的第一有效信号后，控制流坝可以写入计算结果。

当前计算模块接收到控制流坝发送的第一许可信号，同时控制流坝也接收到当前计算模块发送的第一有效信号时，计算结果便开始从当前计算模块中写入控制流坝。其中，当任一信号停止发送时，即控制流坝停止给当前计算模块发送第一许可信号或当前计算模块停止给控制流坝发送第一有效信号时，该通信的传输将会立即停止。此时，计算结果已经从当前计算模块中写入控制流坝内，控制流坝中存储有计算结果。当控制流坝接收到下一流转模块发送的第二许可信号，即表示下一流转模块已准备好接收控制流坝中需要写入的数据，在控制流坝接收到下一流转模块发送的第二许可信号后，下一流转模块可以读取计算结果。当控制流坝提供第二有效信号给下一流转模块，即表示控制流坝可以将计算结果写入下一流转模块中，在下一流转模块接收到控制流坝发送的第二有效信号后，下一流转模块可以写入计算结果。

当控制流坝接收到下一流转模块发送的第二许可信号，同时下一流转模块也接收到控制流坝发送的第二有效信号时，计算结果便开始从控制流坝中写入下一流转模块。其中，当任一信号停止发送时，即下一流转模块停止给控制流坝发送第二许可信号或控制流坝停止给下一流转模块发送第二有效信号时，该通信的传输将会立即停止。由此完成计算结果从当前计算模块到下一流转模块的传输。另外需要说明的是，计算结果并非指按顺序的计算结果，该计算结果可以为实际通信中的任意一段数据。

本申请实施例的技术方案，通过数据流网络中的至少一个计算模块基于AI算法对应的其中一个运算节点对待处理数据进行计算，输出计算结果，所述数据流网络用于基于所述AI算法对所述待处理数据进行处理；当前计算模块对应的下一流转模块接收所述计算模块输出的计算结果，并对所述计算结果进行处理，其中，所述待处理数据按照预设的数据流向在所述数据流网络中流动，提高AI芯片的资源利用率。

注意，上述仅为本申请的示例实施例及所运用技术原理。本领域技术人员会理解，本申请不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此，虽然通过以上实施例对本申请进行了较为详细的说明，但是本申请不仅仅限于以上实施例，在不脱离本申请构思的情况下，还可以包括更多其他等效实施例，而本申请的范围由所附的权利要求范围决定。

图4A是本申请实施例提供的一种人工智能芯片中控制流坝的结构示意图。控制流坝包括：第一非门41与满载端组成的上行许可端，第一与门42与写入端组成的上行有效端，第二与门43与读取端组成的下行许可端，第二非门44与空载端组成的下行有效端。控制流坝中还包括贮存器，设置为存储数据。上行许可端发送第一许可信号给当前计算模块和第一与门42；上行有效端接收当前计算模块发送的第一有效信号，在第一与门42中，A1代表的事件为“当前计算模块向上行有效端发送第一有效信号”，B1代表的事件为“上行许可端向当前计算模块发送第一许可信号”，C1代表的事件为“当前计算模块的计算结果写入控制流坝中”；下行有效端发送第二有效信号给下一流转模块和第二与门；下行许可端接收下一流转模块发送的第二有效信号，在第二与门43中，A2代表的事件为“下行许可端接收下一流转模块发送的第二许可信号”，B2代表的事件为“下行有效端向下一流转模块发送第二有效信号”，C2代表的事件为“下一流转模块读取当前计算模块的计算结果”。在当前计算模块110向控制流坝140发送第一有效信号，控制流坝140向当前计算模块110发送第一许可信号时，当前计算模块110的计算结果可以流向控制流坝140中的贮存器中进行存储；在下一流转模块120向控制流坝140发送第二许可信号，控制流坝140向下一流转模块120发送第二有效信号时，下一流转模块120读取控制流坝140中存储的计算结果。

Claims

一种人工智能AI芯片，包括设置为基于AI算法对待处理数据进行处理的数据流网络，所述数据流网络包括：

至少一个计算模块，每个计算模块设置为基于所述AI算法对应的至少一个运算节点中的一个对所述待处理数据进行计算，输出计算结果，；

所述每个计算模块对应的下一流转模块，设置为与所述每个计算模块连接，接收所述每个计算模块输出的计算结果，并对所述计算结果进行处理；

其中，所述待处理数据按照预设的数据流向在所述数据流网络中流动。
如权利要求1所述的人工智能芯片，所述数据流网络还包括：

处理模块，设置为对所述待处理数据进行处理，得到所述待处理数据所携带的参数；

所述计算模块设置为基于所述参数对所述待处理数据进行计算。
如权利要求1所述的人工智能芯片，其中，所述每个计算模块和所述下一流转模块之间设置有控制流坝，所述控制流坝设置为控制所述计算结果由所述每个计算模块流向所述下一流转模块。
如权利要求3所述的人工智能芯片，其中，所述控制流坝包括写入端、读取端、满载端和空载端，还包括：

第一与门，与所述写入端连接以组成上行有效端，所述上行有效端设置为接收所述每个计算模块发送的第一有效信号；

第二与门，与所述读取端连接以组成下行许可端，所述下行许可端设置为接收所述下一流转模块发送的第二许可信号；

第一非门，与所述满载端连接以组成上行许可端，所述第上行许可端设置为发送第一许可信号给所述每个计算模块和所述第一与门；

第二非门，与所述空载端连接以组成下行有效端，所述下行有效端设置为发送第二有效信号给所述下一流转模块和第二与门。
如权利要求4所述的人工智能芯片，其中，所述每个计算模块设置为接收所述控制流坝发送的第一许可信号；

所述每个计算模块提供所述第一有效信号给所述控制流坝，以将所述待处理数据中的目标数据写入所述控制流坝，所述每个计算模块设置为按照所述运算节点指向的处理方式对所述目标数据进行处理，得到所述计算结果；

所述控制流坝设置为接收所述下一流转模块发送的第二许可信号；

所述控制流坝设置为提供所述第二有效信号给所述下一流转模块，以将所述计算结果写入所述下一流转模块。
一种基于人工智能芯片的数据处理方法，包括：

数据流网络中至少一个计算模块中的每个计算模块基于AI算法对应的至少一个运算节点中的一个对待处理数据进行计算，输出计算结果，所述数据流网络用于基于所述AI算法对所述待处理数据进行处理；

所述每个计算模块对应的下一流转模块接收所述每个计算模块输出的计算结果，并对所述计算结果进行处理，其中所述下一流转模块设置为与所述每个计算模块连接；

其中，所述待处理数据按照预设的数据流向在所述数据流网络中流动。
如权利要求6所述的方法，还包括：

数据流网络中的处理模块对待处理数据进行处理，得到所述待处理数据所携带的参数；

所述每个计算模块基于AI算法对应的至少一个运算节点中的一个对所述待处理数据进行计算，包括：

确定所述每个计算模块对应的AI算法对应的至少一个运算节点中的一个；

所述每个计算模块基于所述确定的运算节点对所述参数进行计算。
如权利要求6所述的方法，其中，所述每个计算模块和所述下一流转模块之间设置有控制流坝，所述方法还包括：

所述控制流坝控制所述计算结果由所述每个计算模块流向所述下一流转模块。
如权利要求8所述的方法，其中，所述控制流坝包括写入端、读取端、满载端和空载端，还包括第一与门、第二与门、第一非门和第二非门，所述第一与门与所述写入端连接以组成行有效端，所述第二与门与所述读取端连接以组成下行许可端，第一非门与所述满载端连接以组成上行许可端，第二非门与所述空载端连接以组成下行有效端，所述方法还包括：

所述上行有效端接收所述每个计算模块发送的第一有效信号；

所述下行许可端接收所述下一流转模块发送的第二许可信号；

所述第上行许可端发送第一许可信号给所述每个计算模块和所述第一与门；

所述下行有效端发送第二有效信号给所述下一流转模块和第二与门。
如权利要求9所述的方法，其中，所述每个计算模块提供所述第一有效信号给所述控制流坝，以将所述待处理数据中的目标数据写入所述控制流坝，所述每个计算模块设置为按照所述运算节点指向的处理方式对所述目标数据进行处理，得到所述计算结果；

所述控制流坝接收所述下一流转模块发送的第二许可信号；

所述控制流坝提供所述第二有效信号给所述下一流转模块，以将所述计算结果写入所述下一流转模块。