CN111913812A

CN111913812A - 一种数据处理方法、装置、设备及存储介质

Info

Publication number: CN111913812A
Application number: CN202010637439.0A
Authority: CN
Inventors: 程雷; 江大白; 胡增
Original assignee: China Applied Technology Co Ltd
Current assignee: China Applied Technology Co Ltd
Priority date: 2020-07-03
Filing date: 2020-07-03
Publication date: 2020-11-10
Anticipated expiration: 2040-07-03
Also published as: CN111913812B

Abstract

本发明实施例公开了一种数据处理方法、装置、设备及存储介质，该方法包括：将待处理任务的存储器地址发送至人工智能加速器；在人工智能指令集中设置中断触发点，并将对应的第一类型人工智能指令的编号发送至人工智能加速器；向人工智能加速器发送命令执行指令，以使人工智能加速器读取并执行人工智能指令集；当获取到人工智能加速器发送的中断通知时，判断人工智能指令集是否处理完成，并在确定人工智能指令集处理完成时，结束待处理任务。本申请提供的技术方案，实现了中央处理器与人工智能加速器之间的数据通信，简化了数据通信流程，提高了数据处理效率。

Description

一种数据处理方法、装置、设备及存储介质

技术领域

本发明实施例涉及芯片技术领域，尤其涉及一种数据处理方法、装置、设备及存储介质。

背景技术

科技的不断进步，使得芯片技术得到了迅速发展，伴随着集成电路工艺的不断提高，中央处理器(Central processing unit，CPU)在逻辑结构、运行效率以及功能外延上均取得了巨大发展。

作为计算机系统的运算和控制核心，CPU是信息处理和程序运行的最终执行单元，可以解释计算机指令以及处理计算机软件中的数据，但CPU对于复杂数学运算的处理能力较低，现有技术中通常为CPU配备协处理器，用于处理复杂的数学运算。

然而，CPU与协处理器之间的通信逻辑复杂，且CPU只能获取协处理器的最终运算结果，数据处理方式单一。

发明内容

本发明实施例提供了一种数据处理方法、装置、设备及存储介质。

第一方面，本发明实施例提供了一种数据处理方法，包括：

当获取到待处理任务时，获取所述待处理任务的存储器地址，并将所述待处理任务的存储器地址发送至人工智能加速器；其中，所述待处理任务包括待处理数据和人工智能指令集，所述人工智能指令集包括至少一条人工智能指令；

将所述人工智能指令集中的至少一条第一类型人工智能指令设置为中断触发点，并将至少一条所述第一类型人工智能指令的编号发送至所述人工智能加速器；

向所述人工智能加速器发送命令执行指令，以使所述人工智能加速器根据所述人工智能指令集的存储器地址读取所述人工智能指令集，并根据所述待处理数据的存储器地址，执行所述人工智能指令集中的至少一条所述人工智能指令；

当获取到所述人工智能加速器发送的中断通知时，判断所述人工智能指令集是否处理完成；其中，所述中断通知由所述人工智能加速器执行到所述第一类型人工智能指令时触发；

若确定所述人工智能指令集处理完成，则结束所述待处理任务。

第二方面，本发明实施例提供了一种数据处理方法，包括：

当获取到中央处理器发送的待处理任务的存储器地址时，记录所述待处理任务的存储器地址；其中，所述待处理任务包括待处理数据和人工智能指令集，所述人工智能指令集包括至少一条人工智能指令；

获取所述中央处理器发送的作为中断触发点的至少一条第一类型人工智能指令的编号，并记录至少一条所述第一类型人工智能指令的编号；

当获取到所述中央处理器发送的命令执行指令时，根据所述人工智能指令集的存储器地址读取所述人工智能指令集，并根据所述待处理数据的存储器地址，执行所述人工智能指令集中的至少一条所述人工智能指令；

当执行到所述第一类型人工智能指令时，向所述中央处理器发送中断通知。

第三方面，本发明实施例提供了一种数据处理装置，包括：

地址信息发送模块，用于当获取到待处理任务时，获取所述待处理任务的存储器地址，并将所述待处理任务的存储器地址发送至人工智能加速器；其中，所述待处理任务包括待处理数据和人工智能指令集，所述人工智能指令集包括至少一条人工智能指令；

中断触发点设置模块，用于将所述人工智能指令集中的至少一条第一类型人工智能指令设置为中断触发点，并将至少一条所述第一类型人工智能指令的编号发送至所述人工智能加速器；

命令执行指令发送模块，用于向所述人工智能加速器发送命令执行指令，以使所述人工智能加速器根据所述人工智能指令集的存储器地址读取所述人工智能指令集，并根据所述待处理数据的存储器地址，执行所述人工智能指令集中的至少一条所述人工智能指令；

判断执行模块，用于当获取到所述人工智能加速器发送的中断通知时，判断所述人工智能指令集是否处理完成；其中，所述中断通知由所述人工智能加速器执行到所述第一类型人工智能指令时触发；

处理任务完成模块，用于若确定所述人工智能指令集处理完成，则结束所述待处理任务。

第四方面，本发明实施例提供了一种数据处理装置，包括：

地址信息接收模块，用于当获取到中央处理器发送的待处理任务的存储器地址时，记录所述待处理任务的存储器地址；其中，所述待处理任务包括待处理数据和人工智能指令集，所述人工智能指令集包括至少一条人工智能指令；

中断触发点获取模块，用于获取所述中央处理器发送的作为中断触发点的至少一条第一类型人工智能指令的编号，并记录至少一条所述第一类型人工智能指令的编号；

命令执行指令接收模块，用于当获取到所述中央处理器发送的命令执行指令时，根据所述人工智能指令集的存储器地址读取所述人工智能指令集，并根据所述待处理数据的存储器地址，执行所述人工智能指令集中的至少一条所述人工智能指令；

中断通知发送模块，用于当执行到所述第一类型人工智能指令时，向所述中央处理器发送中断通知。

第五方面，本发明实施例还提供了一种设备，设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器实现本发明实施例一或实施例二所述的数据处理方法。

第六方面，本发明实施例还提供了一种包含计算机可执行指令的存储介质，计算机可执行指令在由计算机处理器执行时实现本发明实施例一或实施例二所述的数据处理方法。

本发明实施例的技术方案，CPU将待处理任务的存储器地址和中断触发点发送至AI加速器，以使AI加速器读取并执行AI指令，并在获取到AI加速器发送的中断通知时，判断AI指令集是否处理完成，实现了CPU与AI加速器之间的数据通信，简化了数据通信流程，同时，在判断AI指令集未处理完成时，还可以实现CPU与AI加速器之间的接力运算，合理利用了CPU和AI加速器的计算资源，提高了数据处理效率，也扩展了可处理业务的范围。

附图说明

图1是本发明实施例一供的一种数据处理方法的流程图；

图2A是本发明实施例二供的一种数据处理方法的流程图；

图2B是本发明具体应用场景一提供的一种数据处理方法的流程图；

图3是本发明实施例三提供的一种数据处理装置的结构框图；

图4是本发明实施例四提供的一种数据处理装置的结构框图；

图5是本发明实施例五提供的一种设备的结构框图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1为本发明实施例一提供的一种数据处理方法的流程图，本实施例适用于中央处理器与作为协处理器的人工智能(Artificial Intelligence，AI)加速器之间的数据通信，该方法可以由本发明实施例三中的数据处理装置来执行，该装置可以通过软件和/或硬件实现，并集成在终端设备的CPU中，典型的可以集成在具有图像处理或语音识别功能的终端设备的CPU中，该方法具体包括如下步骤：

S110、当获取到待处理任务时，获取所述待处理任务的存储器地址，并将所述待处理任务的存储器地址发送至人工智能加速器；其中，所述待处理任务包括待处理数据和人工智能指令集，所述人工智能指令集包括至少一条人工智能指令。

CPU本身具备一定的数据处理能力，但是对于特定的处理任务，尤其是涉及复杂的数学运算时，例如，图像数据处理任务和语音数据处理任务，CPU的执行效率较低、执行效果较差；AI加速器，也即AI芯片，是用于处理人工智能应用中的大量计算任务的装置；在本发明实施例中，AI加速器作为CPU的协处理器(Coprocessor)，执行特定的数据计算，例如，图像数据计算和语音数据计算，以弥补CPU在图像和语音处理能力上的不足。以图像处理任务为例，一个图像处理任务的AI指令集中通常可以包括卷积运算指令、线性整流函数运算指令和双曲正切函数运算指令等多种AI指令，而每条AI指令都需要对大量数据(即待处理数据)进行处理。

可选的，在本发明实施例中，CPU包括基于RISC-V架构的CPU；RISC-V是基于精简指令集(RISC)原则的第五代开源指令集架构(ISA)，具有开源、简捷和易扩展的特点，相比于基于复杂指令集(CISC)架构的CPU，基于RISC-V架构的CPU的处理速度和处理效率均优于基于CISC架构的CPU。RISC-V指令集包括基本指令集和扩展指令集，在本发明实施例中，CPU通过RISC-V扩展指令集与AI加速器模块通信，用以扩展CPU的数据运算能力；由于CPU与AI加速器通过标准的RISC-V扩展指令集通信，任何基于RISC-V指令集的CPU均适用，因此，CPU的实现方式灵活，可以根据不同的应用需求使用不同内核的CPU，极大的扩展了AI加速器的适配范围。

CPU可以通过解析待处理任务直接获取其所在存储器的地址，也可以为所述待处理任务分配相应的内存空间，并记录对应的存储器地址，也即由CPU完成对待处理任务的存储操作；特别的，为了避免数据的混淆，为待处理数据和AI指令集分配不同的存储器进行存储；CPU在确定存储器地址后，通过地址设定指令将待处理数据的存储器地址和AI指令集的存储器地址发送至AI加速器。

可选的，在本发明实施例中，所述待处理任务包括基于图像的神经网络模型的数值计算，和/或基于语音的神经网络模型的数值计算；所述待处理数据包括神经网络模型的输入数据和神经网络模型的权重值；神经网络，即人工神经网络(Artificial NeuralNetworks，ANNs)，是通过模仿动物神经网络行为特征，进行分布式并行信息处理的算法模型，通过调整内部节点之间的互联关系进行数据处理；神经网络模型的输入数据，也即神经网络模型要进行各种数学运算的运算对象；权重值是神经网络模型中各输入数据的权重数据，输入数据与权重值的乘积即为输入数据的变化值；特别的，CPU将输入数据和权重值存储于不同的内存区域，例如，输入数据存储在第一双倍速率同步动态随机存储器(DoubleData Rate Synchronous Dynamic Random Access Memory，简称DDR)或静态随机存取存储器(Static Random-Access Memory，简称SRAM)中；权重数据存储在第二DDR或Flash(闪存芯片)中。

S120、将所述人工智能指令集中的至少一条第一类型人工智能指令设置为中断触发点，并将至少一条所述第一类型人工智能指令的编号发送至所述人工智能加速器。

中断触发点，也即触发中断通知的时刻，CPU对AI指令集的所有AI指令进行编号后，将AI指令集中的一条或多条AI指令设置为中断触发点，使得AI加速器执行到该AI指令时，向CPU发送中断通知，而第一类型AI指令，也即触发中断通知的AI指令；具体的，当AI指令集中的所有AI指令均由AI加速器执行时，CPU只需要将AI指令集中的最后一条AI指令设定为中断触发点即可，也即AI加速器执行完最后一条AI指令后，向CPU发送中断通知；当AI加速器无法执行AI指令集中的部分AI指令，或者为了减少AI加速器的数据处理量，CPU将部分AI指令设定为由CPU自身处理时，也即CPU与AI加速器交替计算(即接力计算)时，除了将最后一条AI指令设定为中断触发点，还需要设置其它中断触发点；例如，一个AI指令集中包括10条AI指令，CPU将编号1-5的AI指令分配由AI加速器执行，编号6和7的AI指令由CPU完成，编号8-10的AI指令由AI加速器完成，CPU将编号为5和10的AI指令设置为中断触发点，也即AI加速器在执行完编号为5和10的AI指令时均会向CPU发送中断通知。CPU可以通过中断触发设定指令，将至少一条所述第一类型人工智能指令的编号发送至所述人工智能加速器。

特别的，对于中断触发点的设定，可以在获取到待处理任务后，将所有的中断触发点预先规划好，并将规划好的中断触发点全部发送给AI加速器，例如上述技术方案中，将5号和10号AI指令设定为中断触发点，在待处理任务开始执行之前，将5号和10号AI指令的编号均发送至AI加速器，而AI加速器通过中断队列来存储各个中断触发点；还可以在获取到待处理任务后，只规划第一个中断触发点，每次在获取到AI加速器发送的中断通知后，判断是否还需要设置下一个中断触发点，如果需要则设定下一个中断触发点，在向AI加速器发送进度更新指令的同时，将设定好的下一个中断触发点的编号发送至AI加速器，例如上述技术方案中，在获取到待处理任务后，将5号AI指令设定为中断触发点，并将该AI指令的编号发送至AI加速器，当获取到AI加速器发送的第一次中断通知后，将10号AI指令设定为下一个中断触发点，并在执行完7号AI指令，向AI加速器发送进度更新指令的同时，将10号AI指令的编号发送至AI加速器。

S130、向所述人工智能加速器发送命令执行指令，以使所述人工智能加速器根据所述人工智能指令集的存储器地址读取所述人工智能指令集，并根据所述待处理数据的存储器地址，执行所述人工智能指令集中的至少一条所述人工智能指令。

CPU通过发送命令执行指令，使AI加速器读取并执行AI指令集；AI加速器根据AI指令集的存储器地址获取相应的AI指令集，并按顺序依次执行该AI指令集中的AI指令，并根据AI指令，从待处理数据的存储器地址读取数据。

S140、当获取到所述AI加速器发送的中断通知时，判断所述人工智能指令集是否处理完成；其中，所述中断通知由所述AI加速器执行到所述第一类型人工智能指令时触发。

当AI加速器执行到中断触发点对应的AI指令，也即第一类型AI指令时，在执行完该AI指令后，向CPU发送中断处理通知；CPU可以根据中断通知对应的AI指令的指令编号，确定AI指令集是否处理完成，以上述技术方案为例，获取到的中断通知对应的AI指令的编号为5，由于AI指令集包括1-10号AI指令，因此，可以确定该AI指令集并未处理完成；还可以根据中断通知的数量来确定，例如，CPU将编号为5和10的AI指令设置为中断触发点，也即该AI指令集包括两个中断通知，而当前中断通知是该AI指令集对应的第一个中断通知，因此，可以确定该AI指令集未处理完成。

S150、若确定所述人工智能指令集处理完成，则结束所述待处理任务。

CPU确定待处理任务完成后，可以将其加入历史任务清单，以便于对历史处理任务的追溯。

可选的，在本发明实施例中，在判断所述人工智能指令集是否处理完成后，还包括：若确定所述人工智能指令集未处理完成，则根据与所述中断通知对应的第一类型人工智能指令的编号，继续执行所述人工智能指令集，直至执行到第二类型人工智能指令时，向所述人工智能加速器发送进度更新指令，以使所述人工智能加速器根据所述第二类型人工智能指令的编号更新当前执行指令编号，并使所述人工智能加速器根据所述第二类型人工智能指令的编号，继续执行所述人工智能指令集；其中，所述第二类型人工智能指令为所述中央处理器停止执行所述人工智能指令集的人工智能指令，所述第二类型人工智能指令根据所述待处理任务设定。CPU执行到第二类型AI指令时，在执行完该第二类型AI指令后，即停止执行AI指令集，转而交由AI加速器继续执行AI指令集中的剩余AI指令；具体的，以上述技术方案为例，CPU获取到的当前中断通知对应的第一类型AI指令的编号为5号，并确定该AI指令集并未处理完成，CPU从6号AI指令开始执行，当执行到7号AI指令时，确定7号AI指令为第二类型AI指令，其相邻的下一个AI指令应该交由AI加速器执行，因此，CPU在执行完7号AI指令后，停止对AI指令集中剩余AI指令的执行，并通过进程更新指令，将该编号(即7号)发送至AI加速器；AI加速器将当前执行指令编号修改为8号AI指令(即将当前执行指令编号修改为对应的第二类型AI指令的下一条指令)，也即AI加速器由8号AI指令开始执行AI指令集中的剩余AI指令。特别的，在本发明实施例中，第二类型AI指令的数量为第一类型AI指令的数量减1。

现有技术中，AI加速器只能在AI指令集处理完成后，向CPU发送中断通知，以通知CPU数据处理结束，不能实现与CPU之间的交互计算，而本申请通过CPU和AI加速器通过接力计算的方式，不但合理利用了CPU和AI加速器的计算资源，也扩展了可处理业务的范围，对于一些由CPU或AI加速器独立计算完成的待处理业务，可通过交互计算的方式实现。

可选的，在本发明实施例中，在获取所述待处理任务的存储器地址前，还包括：向人工智能加速器发送系统重置指令，以使所述人工智能加速器执行系统重置操作；或在结束所述待处理任务后，还包括：向所述人工智能加速器发送系统重置指令，以使所述人工智能加速器执行系统重置操作。AI加速器执行的系统重置操作包括重置当前执行指令编号、记录的待处理任务的存储器地址和记录的第一类型人工智能指令的编号。

实施例二

图2A为本发明实施例二提供的一种数据处理方法的流程图，本实施例适用于中央处理器与作为协处理器的人工智能(Artificial Intelligence，AI)加速器之间的数据通信，该方法可以由本发明实施例中的数据处理装置来执行，该装置可以通过软件和/或硬件实现，并集成在终端设备的AI加速器中，典型的可以集成在具有图像处理或语音识别功能的终端设备的AI加速器中，该方法具体包括如下步骤：

S210、当获取到中央处理器发送的待处理任务的存储器地址时，记录所述待处理任务的存储器地址；其中，所述待处理任务包括待处理数据和人工智能指令集，所述人工智能指令集包括至少一条人工智能指令。

S220、获取所述中央处理器发送的作为中断触发点的至少一条第一类型人工智能指令的编号，并记录至少一条所述第一类型人工智能指令的编号。

S230、当获取到所述中央处理器发送的命令执行指令时，根据所述人工智能指令集的存储器地址读取所述人工智能指令集，并根据所述待处理数据的存储器地址，执行所述人工智能指令集中的至少一条所述人工智能指令。

S240、当执行到所述第一类型人工智能指令时，向所述中央处理器发送中断通知。

本发明实施例的技术方案，AI指令根据CPU发送的待处理任务的存储器地址和中断触发点，读取并执行AI指令，并在执行到第一类型AI指令集时，向CPU发送中断通知，以使CPU根据该中断通知判断AI指令集是否处理完成，实现了CPU与AI加速器之间的数据通信，简化了数据通信流程，同时，在判断AI指令集未处理完成时，还可以实现CPU与AI加速器之间的接力运算，合理利用了CPU和AI加速器的计算资源，提高了数据处理效率，也扩展了可处理业务的范围。

具体应用场景一

图2B为本发明具体应用场景一提供的一种数据处理方法的流程图，本应用场景在上述技术方案的基础上进行具体化，在本应用场景中，AI指令集包括两个第一类型AI指令和一个第二类型AI指令；

CPU获取到待处理任务时，获取待处理任务的存储器地址；CPU将待处理任务的存储器地址发送至AI加速器；AI加速器接收并记录待处理任务的存储器地址；CPU将AI指令集中的至少一条第一类型AI指令设置为中断触发点；CPU将至少一条第一类型AI指令的编号发送至AI加速器；AI加速器接收并记录第一类型AI指令的编号；CPU向AI加速器发送命令执行指令；AI加速器根据AI指令集的存储器地址读取AI指令集，并根据待处理数据的存储器地址，执行AI指令集中的至少一条AI指令；AI加速器执行到第一个第一类型AI指令时，发送中断通知；CPU接收中断通知，并判断AI指令集是否处理完成；

CPU确定AI指令集未处理完成，继续执行AI指令集，直至执行到第二类型AI指令；CPU向AI计数器发送进度更新指令；AI加速器根据所述第二类型AI指令的编号更新当前执行指令编号；AI加速器根据当前执行指令编号，继续执行AI指令集，直至执行到第二个第一类型AI指令；AI加速器向CPU发送中断通知；CPU接收中断通知，并判断AI指令集是否处理完成；CPU确定AI指令集处理完成，结束待处理任务。

本发明实施例的技术方案，CPU将待处理任务的存储器地址和中断触发点发送至AI加速器，AI加速器读取并执行AI指令，并在执行到第一类型AI指令集时，向CPU发送中断通知，CPU根据该中断通知，判断AI指令集是否处理完成，实现了CPU与AI加速器之间的数据通信，简化了数据通信流程，同时，实现了CPU与AI加速器之间的接力运算，合理利用了CPU和AI加速器的计算资源，提高了数据处理效率，也扩展了可处理业务的范围。

实施例三

图3是本发明实施例三所提供的一种数据处理装置的结构框图，具体包括：地址信息发送模块310、中断触发点设置模块320、命令执行指令发送模块330、判断执行模块340和处理任务完成模块350；

地址信息发送模块310，用于当获取到待处理任务时，获取所述待处理任务的存储器地址，并将所述待处理任务的存储器地址发送至人工智能加速器；其中，所述待处理任务包括待处理数据和人工智能指令集，所述人工智能指令集包括至少一条人工智能指令；

中断触发点设置模块320，用于将所述人工智能指令集中的至少一条第一类型人工智能指令设置为中断触发点，并将至少一条所述第一类型人工智能指令的编号发送至所述人工智能加速器；

命令执行指令发送模块330，用于向所述人工智能加速器发送命令执行指令，以使所述人工智能加速器根据所述人工智能指令集的存储器地址读取所述人工智能指令集，并根据所述待处理数据的存储器地址，执行所述人工智能指令集中的至少一条所述人工智能指令；

判断执行模块340，用于当获取到所述人工智能加速器发送的中断通知时，判断所述人工智能指令集是否处理完成；其中，所述中断通知由所述人工智能加速器执行到所述第一类型人工智能指令时触发；

处理任务完成模块350，用于若确定所述人工智能指令集处理完成，则结束所述待处理任务。

可选的，在上述技术方案的基础上，所述待处理任务包括基于图像的神经网络模型的数值计算，和/或基于语音的神经网络模型的数值计算；所述待处理数据包括所述神经网络模型的输入数据和所述神经网络模型的权重值。

可选的，在上述技术方案的基础上，地址信息发送模块310，具体用于为所述待处理任务分配相应的内存空间，并记录对应的存储器地址。

可选的，在上述技术方案的基础上，数据处理装置，还包括：

系统重置指令发送模块，用于在获取所述待处理任务的存储器地址前向人工智能加速器发送系统重置指令，以使所述人工智能加速器执行系统重置操作，或在结束所述待处理任务后，向所述人工智能加速器发送系统重置指令，以使所述人工智能加速器执行系统重置操作。

进度更新指令发送模块，用于若确定所述人工智能指令集未处理完成，则根据与所述中断通知对应的第一类型人工智能指令的编号，继续执行所述人工智能指令集，直至执行到第二类型人工智能指令时，向所述人工智能加速器发送进度更新指令，以使所述人工智能加速器根据所述第二类型人工智能指令的编号更新当前执行指令编号，并使所述人工智能加速器根据当前执行指令编号，继续执行所述人工智能指令集。

上述装置可执行本发明实施例一所提供的数据处理方法，具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节，可参见本发明实施例一提供的方法。

实施例四

图4是本发明实施例四所提供的一种数据处理装置的结构框图，具体包括：地址信息接收模块410、中断触发点获取模块420、命令执行指令接收模块430和中断通知发送模块440；

地址信息接收模块410，用于当获取到中央处理器发送的待处理任务的存储器地址时，记录所述待处理任务的存储器地址；其中，所述待处理任务包括待处理数据和人工智能指令集，所述人工智能指令集包括至少一条人工智能指令；

中断触发点获取模块420，用于获取所述中央处理器发送的作为中断触发点的至少一条第一类型人工智能指令的编号，并记录至少一条所述第一类型人工智能指令的编号；

命令执行指令接收模块430，用于当获取到所述中央处理器发送的命令执行指令时，根据所述人工智能指令集的存储器地址读取所述人工智能指令集，并根据所述待处理数据的存储器地址，执行所述人工智能指令集中的至少一条所述人工智能指令；

中断通知发送模块440，用于当执行到所述第一类型人工智能指令时，向所述中央处理器发送中断通知。

可选的，在上述技术方案的基础上，数据处理装置，包括：

系统重置执行模块，用于根据中央处理器发送的系统重置指令，执行系统重置操作。

可选的，在上述技术方案的基础上，数据处理装置，包括：

进度更新指令获取模块，用于获取中央处理器发送的进度更新指令，并根据第二类型人工智能指令的编号更新当前执行指令编号，以及根据当前执行指令编号，继续执行所述人工智能指令集。

上述装置可执行本发明实施例二所提供的数据处理方法，具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节，可参见本发明实施例二提供的方法。

实施例五

图5为本发明实施例五提供的一种设备的结构示意图。图5示出了适于用来实现本发明实施方式的示例性设备12的框图。图5显示的设备12仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图5所示，设备12以通用计算设备的形式表现。设备12的组件可以包括但不限于：一个或者多个处理器或者处理单元16，系统存储器28，连接不同系统组件(包括系统存储器28和处理单元16)的总线18。

总线18表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(ISA)总线，微通道体系结构(MAC)总线，增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。

设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被设备12访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

系统存储器28可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(RAM)30和/或高速缓存存储器32。设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统34可以用于读写不可移动的、非易失性磁介质(图5未显示，通常称为“硬盘驱动器”)。尽管图5中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线18相连。系统存储器28可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本发明各实施例的功能。

具有一组(至少一个)程序模块42的程序/实用工具40，可以存储在例如系统存储器28中，这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。

设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信，还可与一个或者多个使得用户能与该设备12交互的设备通信，和/或与使得该设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且，设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器20通过总线18与设备12的其它模块通信。应当明白，尽管图中未示出，可以结合设备12使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

处理单元16通过运行存储在系统存储器28中的程序，从而执行各种功能应用以及数据处理，例如实现本发明实施例一或实施例二所提供的数据处理方法。也即：当获取到待处理任务时，获取所述待处理任务的存储器地址，并将所述待处理任务的存储器地址发送至人工智能加速器；其中，所述待处理任务包括待处理数据和人工智能指令集，所述人工智能指令集包括至少一条人工智能指令；将所述人工智能指令集中的至少一条第一类型人工智能指令设置为中断触发点，并将至少一条所述第一类型人工智能指令的编号发送至所述人工智能加速器；向所述人工智能加速器发送命令执行指令，以使所述人工智能加速器根据所述人工智能指令集的存储器地址读取所述人工智能指令集，并根据所述待处理数据的存储器地址，执行所述人工智能指令集中的至少一条所述人工智能指令；当获取到所述人工智能加速器发送的中断通知时，判断所述人工智能指令集是否处理完成；其中，所述中断通知由所述人工智能加速器执行到所述第一类型人工智能指令时触发；若确定所述人工智能指令集处理完成，则结束所述待处理任务。或当获取到中央处理器发送的待处理任务的存储器地址时，记录所述待处理任务的存储器地址；其中，所述待处理任务包括待处理数据和人工智能指令集，所述人工智能指令集包括至少一条人工智能指令；获取所述中央处理器发送的作为中断触发点的至少一条第一类型人工智能指令的编号，并记录至少一条所述第一类型人工智能指令的编号；当获取到所述中央处理器发送的命令执行指令时，根据所述人工智能指令集的存储器地址读取所述人工智能指令集，并根据所述待处理数据的存储器地址，执行所述人工智能指令集中的至少一条所述人工智能指令；当执行到所述第一类型人工智能指令时，向所述中央处理器发送中断通知。

实施例六

本发明实施例六还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明实施例一或实施例二所述的数据处理方法；该方法包括：

或当获取到中央处理器发送的待处理任务的存储器地址时，记录所述待处理任务的存储器地址；其中，所述待处理任务包括待处理数据和人工智能指令集，所述人工智能指令集包括至少一条人工智能指令；

本发明实施例的计算机存储介质，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种数据处理方法，其特征在于，应用于中央处理器中，包括：

2.根据权利要求1所述的方法，其特征在于，所述待处理任务包括基于图像的神经网络模型的数值计算，和/或基于语音的神经网络模型的数值计算；所述待处理数据包括所述神经网络模型的输入数据和所述神经网络模型的权重值。

3.根据权利要求1所述的方法，其特征在于，所述获取所述待处理任务的存储器地址，包括：

为所述待处理任务分配相应的内存空间，并记录对应的存储器地址。

4.根据权利要求1所述的方法，其特征在于，在获取所述待处理任务的存储器地址前，还包括：

向人工智能加速器发送系统重置指令，以使所述人工智能加速器执行系统重置操作；

或在结束所述待处理任务后，还包括：

向所述人工智能加速器发送系统重置指令，以使所述人工智能加速器执行系统重置操作。

5.根据权利要求1所述的方法，其特征在于，在判断所述人工智能指令集是否处理完成后，还包括：

若确定所述人工智能指令集未处理完成，则根据与所述中断通知对应的第一类型人工智能指令的编号，继续执行所述人工智能指令集，直至执行到第二类型人工智能指令时，向所述人工智能加速器发送进度更新指令，以使所述人工智能加速器根据所述第二类型人工智能指令的编号更新当前执行指令编号，并使所述人工智能加速器根据当前执行指令编号，继续执行所述人工智能指令集；其中，所述第二类型人工智能指令为所述中央处理器停止执行所述人工智能指令集的人工智能指令，所述第二类型人工智能指令根据所述待处理任务设定。

6.一种数据处理方法，其特征在于，应用于人工智能加速器中，包括：

7.一种数据处理装置，其特征在于，包括：

8.一种数据处理装置，其特征在于，包括：

9.一种设备，其特征在于，所述设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-5中任一所述的数据处理方法，或实现如权利要求6所述的数据处理方法。

10.一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-5中任一所述的数据处理方法，或执行如权利要求6所述的数据处理方法。