CN111857989B

CN111857989B - 人工智能芯片和基于人工智能芯片的数据处理方法

Info

Publication number: CN111857989B
Application number: CN202010575487.1A
Authority: CN
Inventors: 蔡权雄
Original assignee: Shenzhen Corerain Technologies Co Ltd
Current assignee: Shenzhen Corerain Technologies Co Ltd
Priority date: 2020-06-22
Filing date: 2020-06-22
Publication date: 2024-02-27
Anticipated expiration: 2040-06-22
Also published as: US20230126978A1; WO2021259231A1; CN111857989A

Abstract

本发明实施例提供了一种人工智能芯片和基于人工智能芯片的数据处理方法。该人工智能芯片包括：用于基于AI算法对待处理数据进行处理的数据流网络，所述数据流网络包括：至少一个计算模块，所述计算模块用于基于所述AI算法对应的其中一个运算节点对所述待处理数据进行计算，输出计算结果；当前的计算模块对应的下一流转模块，用于接收所述计算模块输出的计算结果，并对所述计算结果进行处理；其中，所述待处理数据按照预设的数据流向在所述数据流网络中流动。通过待处理数据按照预设的数据流向在数据流网络中流动进行数据处理，达到提高AI芯片的资源利用率的效果。

Description

人工智能芯片和基于人工智能芯片的数据处理方法

技术领域

本发明实施例涉及人工智能技术领域，尤其涉及一种人工智能芯片和基于人工智能芯片的数据处理方法。

背景技术

随着人工智能的迅速发展，市场上出现了许多用于计算人工智能学习模型的AI芯片。

目前，常用的AI芯片是通过指令集的方式获取数据，并按照AI算法的运算规则对数据进行处理。

然而，通过指令集的方式获取数据，需要消耗AI芯片的资源来实现，导致 AI芯片的资源利用率较低。

发明内容

本发明实施例提供一种人工智能芯片和基于人工智能芯片的数据处理方法，以实现提高AI芯片的资源利用率的效果。

第一方面，本发明实施例提供了一种人工智能芯片，用于基于AI算法对待处理数据进行处理的数据流网络，所述数据流网络包括：

至少一个计算模块，所述计算模块用于基于所述AI算法对应的其中一个运算节点对所述待处理数据进行计算，输出计算结果；

当前的计算模块对应的下一流转模块，用于接收所述计算模块输出的计算结果，并对所述计算结果进行处理；

其中，所述待处理数据按照预设的数据流向在所述数据流网络中流动。

可选的，所述数据流网络还包括：

处理模块，用于对所述待处理数据进行处理，得到所述待处理数据所携带的参数；

所述计算模块用于基于所述参数对所述待处理数据进行计算。

可选的，所述当前的计算模块和所述下一流转模块之间设置有控制流坝，所述控制流坝用于控制所述计算结果由所述当前的计算模块向所述下一流转模块流动。

可选的，所述控制流坝包括写入端、读取端、满载端和空载端，还包括：

第一与门，与所述写入端连接以表示上行有效端，所述上行有效端用于接收所述当前的计算模块发送的第一有效信号；

第二与门，与所述读取端连接以表示下行许可端，所述下行许可端用于接收所述下一流转模块发送的第二有效信号；

第一非门，与所述满载端连接以表示上行许可端，所述第上行许可端用于发送第一许可信号给所述当前的计算模块和第一与门；

第二非门，与所述空载端连接以表示下行有效端，所述下行有效端用于发送第二有效信号给所述下一流转模块和第二与门。

可选的，所述当前的计算模块用于接收所述控制流坝发送的第一许可信号；

所述当前的计算模块提供所述第一有效信号给所述控制流坝，以将所述待处理数据中的第一数据写入所述控制流坝，所述当前的计算模块用于按照所述运算节点指向的处理方式对所述第一数据进行处理，得到所述计算结果；

所述控制流坝用于接收所述下一流转模块发送的第二许可信号；

所述控制流坝提供所述第二有效信号给所述下一流转模块，以将所述计算结果写入所述下一流转模块。

第二方面，本发明实施例提供了一种基于人工智能芯片的数据处理方法，所述方法包括：

数据流网络中的至少一个计算模块基于AI算法对应的其中一个运算节点对待处理数据进行计算，输出计算结果，所述数据流网络用于基于所述AI算法对所述待处理数据进行处理；

下一流转模块接收所述计算模块输出的计算结果，并对所述计算结果进行处理；

可选的，所述方法还包括：

数据流网络中的处理模块对待处理数据进行处理，得到所述待处理数据所携带的参数；

所述计算模块基于AI算法对应的其中一个运算节点对所述待处理数据进行计算，包括：

确定所述计算模块对应的AI算法对应的其中一个运算节点；

所述计算模块基于所述运算节点对所述参数进行计算。

可选的，所述当前的计算模块和所述下一流转模块之间设置有控制流坝，所述方法还包括：

所述控制流坝控制所述计算结果由所述当前的计算模块向所述下一流转模块流动。

可选的，所述控制流坝包括写入端、读取端、满载端和空载端，还包括第一与门、第二与门、第一非门和第二非门，所述第一与门与所述写入端连接以表示上行有效端，所述第二与门与所述读取端连接以表示下行许可端，第一非门与所述满载端连接以表示上行许可端，第二非门与所述空载端连接以表示下行有效端，所述方法还包括：

所述上行有效端接收所述当前的计算模块发送的第一有效信号；

所述下行许可端接收所述下一流转模块发送的第二有效信号；

所述第上行许可端发送第一许可信号给所述当前的计算模块和第一与门；

所述下行有效端发送第二有效信号给所述下一流转模块和第二与门。

可选的，所述当前的计算模块提供所述第一有效信号给所述控制流坝，以将所述待处理数据中的第一数据写入所述控制流坝，所述当前的计算模块用于按照所述运算节点指向的处理方式对所述第一数据进行处理，得到所述计算结果；

所述控制流坝接收所述下一流转模块发送的第二许可信号；

本发明实施例的人工智能芯片包括用于基于AI算法对待处理数据进行处理的数据流网络，所述数据流网络包括：至少一个计算模块，所述计算模块用于基于所述AI算法对应的其中一个运算节点对所述待处理数据进行计算，输出计算结果；当前的计算模块对应的下一流转模块，用于接收所述计算模块输出的计算结果，并对所述计算结果进行处理；其中，所述待处理数据按照预设的数据流向在所述数据流网络中流动，解决了AI芯片是通过指令集的方式获取数据，需要消耗AI芯片的资源来实现，导致AI芯片的资源利用率较低的问题，实现了提高AI芯片的资源利用率的效果。

附图说明

图1是本发明实施例一提供的人工智能芯片的结构示意图；

图2是本发明实施例二提供的另一种人工智能芯片的结构示意图；

图3是本发明实施例二提供的一种运行CNN模型的人工智能芯片的结构示意图；

图4是本发明实施例三提供的另一种人工智能芯片的结构示意图；

图5是本发明实施例二提供的基于人工智能芯片的数据处理方法。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

在更加详细地讨论示例性实施例之前应当提到的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理，但是其中的许多步骤可以被并行地、并发地或者同时实施。此外，各步骤的顺序可以被重新安排。当其操作完成时处理可以被终止，但是还可以具有未包括在附图中的附加步骤。处理可以对应于方法、函数、规程、子例程、子计算机程序等等。

此外，术语“第一”、“第二”等可在本文中用于描述各种方向、动作、步骤或元件等，但这些方向、动作、步骤或元件不受这些术语限制。这些术语仅用于将第一个方向、动作、步骤或元件与另一个方向、动作、步骤或元件区分。举例来说，在不脱离本申请的范围的情况下，可以将第一有效信号为第二有效信号，且类似地，可将第二有效信号称为第一有效信号。第一有效信号和第二有效信号两者都是有效信号，但其不是同一有效信号。术语“第一”、“第二” 等而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

实施例一

图1为本发明实施例一提供的一种人工智能芯片的结构示意图。如图1所示，本发明实施例提供了一种人工智能芯片10，包括用于基于AI算法对待处理数据进行处理的数据流网络，所述数据流网络包括：至少一个计算模块110 和下一流转模块120。本实施例的人工智能芯片适用于基于预设的数据流向和 AI算法对待处理数据进行数据处理。其中：

所述计算模块110用于基于所述AI算法对应的其中一个运算节点对所述待处理数据进行计算，输出计算结果；

当前的计算模块110对应的下一流转模块120，用于接收所述计算模块110 输出的计算结果，并对所述计算结果进行处理；

在本实施例中，待处理数据是指需要通过AI算法进行处理的数据。可选的，待处理数据可以是待处理的图像数据、待处理的文本数据等可以基于AI算法进行处理的数据，此处不作具体限制。AI算法是指人工智能模型对应的算法，例如CNN模型对应的算法等，此处不作具体限制。运算节点为AI算法中用于计算的节点。需要说明的是，AI算法的本质是一些数学模型，因此有一些系数，通过AI算法进行计算时，需要AI算法对应系数和待处理数据通过给计算模块110 进行计算。当前的计算模块110为至少一个计算模块110的其中一个，本实施例不限定当前的计算模块110具体为哪个计算模块110。其中，数据流向按照 AI算法的运算顺序表征在数据流网络中，指示待处理数据的流动方向。

示例性的，CNN模型包括卷积层、池化层和全连接层，则CNN算法为在卷积层计算，然后在池化层计算，最后在全连接层进行计算，则运算节点可以是在卷积层、池化层或全连接层计算的节点，也可以是在卷积层内计算的其中一个节点，例如第一卷积子层或第二卷积子层的计算模块110，此处不作具体限制。

其中，下一流转模块120是指与当前的计算模块110连接的下一模块。可选的，下一流转模块120可以是当前的计算模块110对应的下一计算模块，或者是当前的计算模块110对应的下一存储模块，可以根据需要设置，此处不作具体限制。需要说明的是，计算模块110的数量可以根据具体的人工智能模型对应的AI算法确定，数据流向也可以根据AI算法的运算过程确定，即确定待处理数据在计算模块110和下一流转模块120之间的流动，本实施例不作具体限制。

可以理解的是，待处理数据是按照预设的数据流向在数据流网络中流动，计算模块110和下一流转模块120均不需要对数据进行获取，只需要等待数据按照数据流向到达计算模块110和下一流转模块120时，对获取到的待处理数据进行处理即可，减少了指令的开销，提高了芯片的资源利用率。

参考图2，图2是本实施例提供的另一种人工智能芯片的结构示意图。在一个实施例中，可选的，数据流网络还包括处理模块130，其中：

处理模块130，用于对所述待处理数据进行处理，得到所述待处理数据所携带的参数；

所述计算模块110用于基于所述参数对所述待处理数据进行计算。

其中，处理模块130可以与芯片外的片外存储200直接相连，用于接收片外存储200发送的待处理数据后，对待处理数据进行处理以得到数据流网络计算所需的参数，供数据流网络中的计算模块110基于所述参数对所述待处理数据进行计算。

参考图3，图3为本实施例提供的一种运行CNN模型的人工智能芯片的结构示意图。通过图3可知，本实施例中的待处理数据为待处理的图像数据，人工智能芯片包括计算模块A111、计算模块B112和计算模块C113，其中，计算模块A111用于在卷积层计算，计算模块B112用于在池化层计算，计算模块C113 用于在全连接层计算。则预设的数据流向依次为计算模块A111、计算模块B112 和计算模块C113。可以理解的是，待处理的图像数据按照预设的数据流向在计算模块A111、计算模块B112和计算模块C113中流动，图像数据到达计算模块 A111时，进行卷积层的计算，计算完成后到达计算模块B112，进行池化层的计算，最后到达计算模块C113进行全连接层的计算，输出最后的计算结果。其中，最后的计算结果可以保存在人工智能芯片外的片外存储中，此处不作具体限制。同时参考图1和图3，当计算模块A111作为当前的计算模块110时，则对应的下一流转模块120为计算模块B112，当计算模块C113为当前的计算模块110 时，对应的下一流转模块120为存储最后的计算结果的最终存储模块。

可选的，当相邻的两个计算模块110，例如计算模块A111和计算模块B112 之间设置有中间存储模块时，则计算模块A111的下一流转模块120则是该中间存储模块，此处不作具体限制。可以理解的是，当上一计算模块110已计算完成，但下一计算模块110未计算完成时，将上一计算模块110的计算结果先发送至中间存储模块等待，则上一计算模块110可以处于空闲状态，继续获取新的数据进行计算，且在下一计算模块110计算完成时，中间存储模块再将上一计算模块110的计算结果发送至下一计算模块进行计算，进一步提高了芯片的资源利用率。

可以理解的是，本实施例的上一计算模块110和下一计算模块110仅表示存在数据交互的两个计算模块110，而不限于具体的计算模块110。

需要说明的是，为了使芯片的资源利用率最大化，数据的流向需要保证计算模块110和下一流转模块120之间刚好没有空闲时间，本实施例不作具体限制。

参考图4，图4是本实施例提供的另一种人工智能芯片的结构示意图。本实施例中的当前的计算模块110和所述下一流转模块120之间设置有控制流坝 140，其中，所述控制流坝140用于控制所述计算结果由所述当前的计算模块 110向所述下一流转模块120流动。

具体的，为了实现通过控制流坝140作为计算模块110和下一流转模块120 之间的自动流控制，其基本思想如下：

A)输入数据速率(F_in)＝有效输入数据数/单位时间(T_d)

B)输出数据速率(F_out)＝有效输出数据数/单位时间(T_d)

C)在整个运行期间，如果F_in＝＝F_out，则

为了完全避免背压：数据坝应该能够存储max(F_in)–min(F_out)数据。控制流坝140将计算模块110和下一流转模块120的内部状态结合在一起。纯粹由硬件决定是否将数据从当前的计算模块110中流出来。因此，该控制流坝140可以理解为调节数据流的屏障。基于算法要求，控制流坝140进一步扩展为支持预定静态流量控制。

可选的，控制流坝140包括写入端、读取端、满载端和空载端，还包括：

第一与门，与所述写入端连接以表示上行有效端，所述上行有效端用于接收所述当前的计算模块110发送的第一有效信号；

第二与门，与所述读取端连接以表示下行许可端，所述下行许可端用于接收所述下一流转模块120发送的第二有效信号；

第一非门，与所述满载端连接以表示上行许可端，所述第上行许可端用于发送第一许可信号给所述当前的计算模块110和第一与门；

第二非门，与所述空载端连接以表示下行有效端，所述下行有效端用于发送第二有效信号给所述下一流转模块120和第二与门。

具体的，所述当前的计算模块110用于接收所述控制流坝140发送的第一许可信号；

所述当前的计算模块110提供所述第一有效信号给所述控制流坝140，以将所述待处理数据中的第一数据写入所述控制流坝140，所述当前的计算模块 110用于按照所述运算节点指向的处理方式对所述第一数据进行处理，得到所述计算结果，其中第一数据为待处理数据中，适用当前的计算模块110进行计算的数据；

所述控制流坝140用于接收所述下一流转模块120发送的第二许可信号；

所述控制流坝140提供所述第二有效信号给所述下一流转模块120，以将所述计算结果写入所述下一流转模块120。

本实施例中，当前的计算模块110接收到控制流坝140发送的第一许可信号，即表示控制流坝140已准备好接收当前的计算模块110中需要写入的数据，在当前的计算模块110接收到控制流坝140发送的第一许可信号后，当前的计算模块110可以读取计算结果。当前的计算模块110给控制流坝140提供第一有效信号，即表示当前的计算模块110可以将计算结果写入控制流坝140中，在控制流坝140接收到当前的计算模块110发送的第一有效信号后，控制流坝 140可以写入计算结果。

当前的计算模块110接收到控制流坝140发送的第一许可信号，同时控制流坝140也接收到当前的计算模块110发送的第一有效信号时，计算结果便开始从当前的计算模块110中写入控制流坝140。其中，当任一信号停止发送时，即控制流坝140停止给当前的计算模块110发送第一许可信号或当前的计算模块110停止给控制流坝140发送第一有效信号时，该通信的传输将会立即停止。此时，计算结果已经从当前的计算模块110中写入控制流坝140内，控制流坝 140中存储有计算结果。当控制流坝140接收到下一流转模块120发送的第一许可信号，即表示下一流转模块120已准备好接收控制流坝140中需要写入的数据，在控制流坝140接收到下一流转模块120发送的第二许可信号后，控制流坝140可以读取计算结果。当控制流坝140提供第二有效信号给下一流转模块120，即表示控制流坝140可以将计算结果写入下一流转模块120中，在下一流转模块120接收到控制流坝140发送的第二有效信号后，下一流转模块120 可以写入计算结果。

当控制流坝140接收到下一流转模块120发送的第一许可信号，同时下一流转模块120也接收到控制流坝140发送的第二有效信号时，计算结果便开始从控制流坝140中写入下一流转模块120。其中，当任一信号停止发送时，即下一流转模块120停止给控制流坝140发送第二许可信号或控制流坝140停止给下一流转模块120发送第二有效信号时，该通信的传输将会立即停止。由此完成计算结果从当前的计算模块110到下一流转模块120的传输。另外需要说明的是，计算结果并非指按顺序的计算结果，该计算结果可以为实际通信中的任意一段数据。

本发明实施例的技术方案，人工智能芯片包括用于基于AI算法对待处理数据进行处理的数据流网络，所述数据流网络包括至少一个计算模块，所述计算模块用于基于所述AI算法对应的其中一个运算节点对所述待处理数据进行计算，输出计算结果；当前的计算模块对应的下一流转模块，用于接收所述计算模块输出的计算结果，并对所述计算结果进行处理；其中，所述待处理数据按照预设的数据流向在所述数据流网络中流动，达到提高AI芯片的资源利用率的技术效果。

实施例二

图5为本发明实施例二提供的一种基于人工智能芯片的数据处理方法，可适用于基于预设的数据流向和AI算法对待处理数据进行数据处理的场景，该方法可以本实施例提供的人工智能芯片实现。

如图5所示，本发明实施例二提供的基于人工智能芯片的数据处理方法包括：

S610、数据流网络中的至少一个计算模块基于AI算法对应的其中一个运算节点对待处理数据进行计算，输出计算结果，所述数据流网络用于基于所述AI 算法对所述待处理数据进行处理；

其中，数据流网络是指人工智能芯片中，各个模块组成的用于基于AI算法对待处理数据进行处理的网络。待处理数据是指需要通过AI算法进行处理的数据。可选的，待处理数据可以是待处理的图像数据、待处理的文本数据等可以基于AI算法进行处理的数据，此处不作具体限制。AI算法是指人工智能模型对应的算法，例如CNN模型对应的算法等，此处不作具体限制。运算节点为AI 算法中用于计算的节点。需要说明的是，AI算法的本质是一些数学模型，因此有一些系数，通过AI算法进行计算时，需要AI算法对应系数和待处理数据通过给计算模块进行计算。

示例性的，CNN模型包括卷积层、池化层和全连接层，则CNN算法为在卷积层计算，然后在池化层计算，最后在全连接层进行计算，则运算节点可以是在卷积层、池化层或全连接层计算的节点，也可以是在卷积层内计算的其中一个节点，例如第一卷积子层或第二卷积子层的计算模块，此处不作具体限制。

S620、当前的计算模块对应的下一流转模块接收所述计算模块输出的计算结果，并对所述计算结果进行处理，其中，所述待处理数据按照预设的数据流向在所述数据流网络中流动。

其中，当前的计算模块为至少一个计算模块的其中一个，本实施例不限定当前的计算模块具体为哪个计算模块。下一流转模块是指与当前的计算模块连接的下一模块。可选的，下一流转模块可以是当前的计算模块对应的下一计算模块，或者是当前的计算模块对应的下一存储模块，可以根据需要设置，此处不作具体限制。需要说明的是，计算模块的数量可以根据具体的人工智能模型对应的AI算法确定，数据流向也可以根据AI算法的运算过程确定，即确定待处理数据在计算模块和下一流转模块之间的流动，本实施例不作具体限制。

可以理解的是，待处理数据是按照预设的数据流向在数据流网络中流动，计算模块和下一流转模块均不需要对数据进行获取，只需要等待数据按照数据流向到达计算模块和下一流转模块时，对获取到的待处理数据进行处理即可，减少了指令的开销，提高了芯片的资源利用率。

在一个可选的实施方式中，该基于人工智能芯片的数据处理方法还包括：

数据流网络中的处理模块对待处理数据进行处理，得到所述待处理数据所携带的参数；所述计算模块基于AI算法对应的其中一个运算节点对所述待处理数据进行计算，包括：确定所述计算模块对应的AI算法对应的其中一个运算节点；所述计算模块基于所述运算节点对所述参数进行计算。

其中，处理模块可以与芯片外的片外存储直接相连，用于接收片外存储发送的待处理数据后，对待处理数据进行处理以得到数据流网络计算所需的参数，供数据流网络中的计算模块基于所述参数对所述待处理数据进行计算。

可选的，可以将数据流网络中的计算瓶颈对应的目标计算模块设置为至少两个目标计算子模块串行计算，或将数据流网络中的计算瓶颈对应的目标计算模块设置为至少两个目标计算子模块并行计算，使芯片的资源利用率最大化。

在一个可选的实施方式中，当前的计算模块和所述下一流转模块之间设置有控制流坝，该基于人工智能芯片的数据处理方法还包括：所述控制流坝控制所述计算结果由所述当前的计算模块向所述下一流转模块流动。

具体的，为了实现通过控制流坝作为计算模块和下一流转模块之间的自动流控制，其基本思想如下：

A)输入数据速率(F_in)＝有效输入数据数/单位时间(T_d)

B)输出数据速率(F_out)＝有效输出数据数/单位时间(T_d)

C)在整个运行期间，如果F_in＝＝F_out，则

为了完全避免背压：数据坝应该能够存储max(F_in)–min(F_out)数据。控制流坝将计算模块和下一流转模块的内部状态结合在一起。纯粹由硬件决定是否将数据从当前的计算模块中流出来。因此，该控制流坝可以理解为调节数据流的屏障。基于算法要求，控制流坝进一步扩展为支持预定静态流量控制。

在一个可选的实施方式中，控制流坝包括写入端、读取端、满载端和空载端，还包括第一与门、第二与门、第一非门和第二非门，所述第一与门与所述写入端连接以表示上行有效端，所述第二与门与所述读取端连接以表示下行许可端，第一非门与所述满载端连接以表示上行许可端，第二非门与所述空载端连接以表示下行有效端，基于人工智能芯片的数据处理方法还包括：所述上行有效端接收所述当前的计算模块发送的第一有效信号；所述下行许可端接收所述下一流转模块发送的第二有效信号；所述第上行许可端发送第一许可信号给所述当前的计算模块和第一与门；所述下行有效端发送第二有效信号给所述下一流转模块和第二与门。

具体的，所述当前的计算模块提供所述第一有效信号给所述控制流坝，以将所述待处理数据中的第一数据写入所述控制流坝，所述当前的计算模块用于按照所述运算节点指向的处理方式对所述第一数据进行处理，得到所述计算结果；

所述控制流坝接收所述下一流转模块发送的第二许可信号；

在本实施方式中，当前的计算模块接收到控制流坝发送的第一许可信号，即表示控制流坝已准备好接收当前的计算模块中需要写入的数据，在当前的计算模块接收到控制流坝发送的第一许可信号后，当前的计算模块可以读取计算结果。当前的计算模块给控制流坝提供第一有效信号，即表示当前的计算模块可以将计算结果写入控制流坝中，在控制流坝接收到当前的计算模块发送的第一有效信号后，控制流坝可以写入计算结果。

当前的计算模块接收到控制流坝发送的第一许可信号，同时控制流坝也接收到当前的计算模块发送的第一有效信号时，计算结果便开始从当前的计算模块中写入控制流坝。其中，当任一信号停止发送时，即控制流坝停止给当前的计算模块发送第一许可信号或当前的计算模块停止给控制流坝发送第一有效信号时，该通信的传输将会立即停止。此时，计算结果已经从当前的计算模块中写入控制流坝内，控制流坝中存储有计算结果。当控制流坝接收到下一流转模块发送的第一许可信号，即表示下一流转模块已准备好接收控制流坝中需要写入的数据，在控制流坝接收到下一流转模块发送的第二许可信号后，控制流坝可以读取计算结果。当控制流坝提供第二有效信号给下一流转模块，即表示控制流坝可以将计算结果写入下一流转模块中，在下一流转模块接收到控制流坝发送的第二有效信号后，下一流转模块可以写入计算结果。

当控制流坝接收到下一流转模块发送的第一许可信号，同时下一流转模块也接收到控制流坝发送的第二有效信号时，计算结果便开始从控制流坝中写入下一流转模块。其中，当任一信号停止发送时，即下一流转模块停止给控制流坝发送第二许可信号或控制流坝停止给下一流转模块发送第二有效信号时，该通信的传输将会立即停止。由此完成计算结果从当前的计算模块到下一流转模块的传输。另外需要说明的是，计算结果并非指按顺序的计算结果，该计算结果可以为实际通信中的任意一段数据。

本发明实施例的技术方案，通过数据流网络中的至少一个计算模块基于AI 算法对应的其中一个运算节点对待处理数据进行计算，输出计算结果，所述数据流网络用于基于所述AI算法对所述待处理数据进行处理；当前的计算模块对应的下一流转模块接收所述计算模块输出的计算结果，并对所述计算结果进行处理，其中，所述待处理数据按照预设的数据流向在所述数据流网络中流动，达到提高AI芯片的资源利用率的技术效果。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种人工智能芯片，其特征在于，包括用于基于AI算法对待处理数据进行处理的数据流网络，所述数据流网络包括：

其中，所述待处理数据按照预设的数据流向在所述数据流网络中流动；

所述当前的计算模块和所述下一流转模块之间设置有控制流坝，所述控制流坝用于控制所述计算结果由所述当前的计算模块向所述下一流转模块流动；

所述控制流坝包括写入端、读取端、满载端和空载端，还包括：

第一非门，与所述满载端连接以表示上行许可端，所述上行许可端用于发送第一许可信号给所述当前的计算模块和所述第一与门；

第二非门，与所述空载端连接以表示下行有效端，所述下行有效端用于发送所述第二有效信号给所述下一流转模块和所述第二与门。

2.如权利要求1所述的人工智能芯片，其特征在于，所述数据流网络还包括：

3.如权利要求1所述的人工智能芯片，其特征在于，所述当前的计算模块用于接收所述控制流坝发送的第一许可信号；

4.一种基于人工智能芯片的数据处理方法，其特征在于，所述方法包括：

当前的计算模块对应的下一流转模块接收所述计算模块输出的计算结果，并对所述计算结果进行处理；

所述当前的计算模块和所述下一流转模块之间设置有控制流坝，所述方法还包括：

所述控制流坝控制所述计算结果由所述当前的计算模块向所述下一流转模块流动；

所述控制流坝包括写入端、读取端、满载端和空载端，还包括第一与门、第二与门、第一非门和第二非门，所述第一与门与所述写入端连接以表示上行有效端，所述第二与门与所述读取端连接以表示下行许可端，所述第一非门与所述满载端连接以表示上行许可端，所述第二非门与所述空载端连接以表示下行有效端，所述方法还包括：

所述上行许可端发送第一许可信号给所述当前的计算模块和所述第一与门；

所述下行有效端发送所述第二有效信号给所述下一流转模块和所述第二与门。

5.如权利要求4所述的方法，其特征在于，所述方法还包括：

确定所述计算模块对应的AI算法对应的其中一个运算节点；

所述计算模块基于所述运算节点对所述参数进行计算。

6.如权利要求4所述的方法，其特征在于，所述当前的计算模块提供所述第一有效信号给所述控制流坝，以将所述待处理数据中的第一数据写入所述控制流坝，所述当前的计算模块用于按照所述运算节点指向的处理方式对所述第一数据进行处理，得到所述计算结果；

所述控制流坝接收所述下一流转模块发送的第二许可信号；