WO2022261867A1

WO2022261867A1 - 一种任务调度方法和装置

Info

Publication number: WO2022261867A1
Application number: PCT/CN2021/100415
Authority: WO
Inventors: 张森; 赵庆贺; 杨意
Original assignee: 华为技术有限公司
Priority date: 2021-06-16
Filing date: 2021-06-16
Publication date: 2022-12-22
Also published as: CN117222980A

Abstract

一种任务调度方法和装置，涉及计算机技术领域，缓解了调度装置每次执行任务图时，CPU都要重新将该任务图对应的依赖关系初始化到调度装置，导致初始化时间较长，影响计算效率的问题。该方法为：任务调度装置包括一个或多个任务图模板，每个任务图模板用于指示该任务图模板包括的多个任务之间的依赖关系，以及每个任务的处理方式；任务调度装置，用于：获取第一任务图的输入数据和第一任务图对应的任务图模板标识；基于第一任务图对应的任务图模板标识，在一个或多个任务图模板中确定第一任务图对应的任务图模板；基于第一任务图的输入数据和第一任务图对应的任务图模板，对第一任务图进行调度。

Description

一种任务调度方法和装置

技术领域

本申请实施例涉及计算机技术领域，尤其涉及一种任务调度方法和装置。

背景技术

目前，为了提高计算设备的计算能力，通常计算设备可以采用多核异构的系统架构，该架构包括多核中央处理器(central processing unit，CPU)和加速器，多核CPU用于执行通用的计算任务，加速器用于执行专用的计算任务。

在多核异构系统中，对于较为复杂的任务图，多个任务之间可能存在相互依赖关系(比如，一个任务的执行依赖于另一个任务的计算结果)。为了减轻并行编程的难度，调度软件可以根据输入和输出确定多个任务之间的依赖关系，并将准备就绪的任务调度到可执行任务的CPU核或者加速器上执行。但是，在多核异构系统中，对于依赖关系相同的多个任务图，每次执行任务图时，CPU都要重新将该任务图对应的依赖关系初始化到调度装置中，再由调度装置维护该任务图中的多个任务之间的依赖关系，以确保计算正常进行。这将造成调度装置调度任务图、解析任务图的依赖关系时，初始化的时间较长，CPU和调度装置之间交互冗余，影响计算效率的问题。

发明内容

本申请实施例提供一种任务调度方法和装置，能够节省依赖关系载入到任务调度装置的时间，提升计算效率。

为达到上述目的，本申请实施例采用如下技术方案：

本申请实施例的第一方面，提供一种任务调度装置，该任务调度装置包括一个或多个任务图模板，每个任务图模板用于指示该任务图模板包括的多个任务之间的依赖关系，以及每个任务的处理方式；任务调度装置，用于：获取第一任务图的任务信息；该第一任务图的任务信息包括第一任务图的输入数据和第一任务图对应的任务图模板标识；基于第一任务图对应的任务图模板标识，在任务调度装置包括的一个或多个任务图模板中确定第一任务图对应的任务图模板；基于第一任务图的输入数据和第一任务图对应的任务图模板，对第一任务图进行调度。

可选的，处理方式和依赖关系均相同的多个任务图对应的任务图模板相同。例如，任务图1用于计算(1+2)*(4-3)，任务图2用于计算(5+6)*(8-7)，任务图1中多个任务之间的依赖关系与任务图2中多个任务之间的依赖关系相同，而且任务图1中多个任务的计算方式与任务图2中多个任务的计算方式也相同。因此，任务图1和任务图2的任务图模板相同，均为(a+b)*(c-d)。任务图1和任务图2的区别在于两个任务图的输入数据不同。

可选的，任务图模板包括的多个任务可以串行执行，也可以并行执行。例如，任务图模板包括的多个任务中，一部分任务在执行时可以串行执行，一部分任务在执行时可以并行执行。

基于本方案，由于任务调度装置支持将静态的任务图模板内置在该任务调度装置中，从而在后续执行与该任务图模板的依赖关系和处理方式均相同的多个任务图时，无需再次将依赖关系和处理方式初始化到任务调度装置中，因此后续执行该多个任务图时只获取动态的输入数据以及要用的任务图模板的标识即可，能够节省依赖关系载入到任务调度装置的时间。也就是说，本申请实施例提供的任务调度装置，通过创建一次任务图模板，就可以重复多次执行与该任务图模板的处理方式和依赖关系均相同的任务图，而且在后续执行该多个任务图时，无需再次将静态的处理方式和依赖关系载入任务调度装置，能够节省将静态的处理方式和依赖关系载入任务调度装置的时间，提升计算效率。

在一种可能的实现方式中，上述任务调度装置，还用于获取一个或多个任务图模板；每个任务图模板包括任务信息表、第一同步信息表和第二同步信息表；其中，任务信息表包括多个任务标识，以及每个任务标识对应的处理方式；第一同步信息表包括多个事件，以及每个事件对应的一个或多个屏障barrier的标识，多个事件与多个任务一一对应，每个事件用于指示其对应的任务执行完成；第二同步信息表包括多个barrier、每个barrier对应的一个或多个触发条件、以及每个barrier满足其对应的触发条件时的待执行任务标识。

可选的，任务调度装置获取的任务图模板可以是CPU发送给任务调度装置的，也可以是预置在任务调度装置中的，本申请实施例对此并不限定。

基于本方案，每个任务图模板的数据结构可以采用任务信息表、第一同步信息表和第二同步信息表这三张表来描述，任务调度装置获取任务图模板即为获取该任务图模板对应的任务信息表、第一同步信息表和第二同步信息表，从而使得任务调度装置后续调度任务图时可以基于这三张表进行调度，以确保任务图模板中多个任务的计算能够正常进行。而且任务调度装置在后续调度处理方式和依赖关系均与任务图模板相同的多个任务图时，可以直接基于该任务图模板调度任务，无需再次将处理方式和依赖关系载入任务调度装置，能够节省将静态的处理方式和依赖关系载入任务调度装置的时间，提升计算效率。

在另一种可能的实现方式中，上述任务调度装置包括耦合连接的第一接口、任务图控制电路、任务状态机，以及第二接口；其中，任务图控制电路，用于通过第一接口获取任务图模板，以及第一任务图的任务信息；任务状态机，用于基于第二同步信息表，在确定第一barrier的值满足其对应的第一触发条件时，根据第一任务标识、第一任务图的输入数据，以及第一任务图对应的任务信息表，从任务图控制电路获取第一任务标识对应的第一任务，并通过第二接口向计算单元发送第一任务；该第一任务标识为第一barrier的值满足第一触发条件时待执行的任务的标识。。

可选的，在第二同步信息表包括首任务的触发条件(比如，首个任务T1对应的触发条件b1＝0)时，对于第一任务图模板中的首个任务，可以由任务图控制电路向任务状态机发送首任务触发信号，该首任务触发信号用于指示任务状态机查询第二同步信息表，确定b1的值是否满足首任务对应的触发条件。在任务状态机确定b1的值满足首任务对应的触发条件时，任务状态机根据首任务标识，第一任务图的输入数据，以及第一任务图对应的任务信息表，从任务图控制电路获取首任务的任务内容，并将该首任务的任务内容通过第二接口发送给计算单元。

可选的，在第二同步信息表不包括首任务的触发条件时，对于第一任务图模板中的首个任务，也可以由任务图控制电路向任务状态机发送首任务执行信号，任务状态机根据该首任务执行信号，从任务图控制电路获取首任务的任务内容，并将该首任务的任务内容通过第二接口发送给计算单元。

可选的，对于首任务之后的其他任务，任务状态机可以在barrier的值更新时，查询第二同步信息表，确定该barrier的值是否满足其对应的触发条件。

基于本方案，通过任务状态机基于第二同步信息表，确定每个barrier的值是否满足其对应的触发条件，并在barrier的值满足触发条件时，确定待执行任务标识，并从任务图控制电路获取该待执行任务的任务内容，并将该任务发给计算单元。从而能够确保任务调度装置调度任务图中的每个任务时都能按照其对应的任务图模板进行调度，而且任务调度装置在调度任务时，可以依据任务调度装置中的任务图模板获取处理方式，不需要将任务的处理方式重新载入任务调度装置，因此能够节省将静态的处理方式载入任务调度装置的时间，提升计算效率。

在又一种可能的实现方式中，上述第一任务为多个时，计算单元并行执行多个第一任务。

基于本方案，通过将触发条件相同的多个任务并行执行，能够维持好多个任务之间的依赖关系，提升计算效率。

在又一种可能的实现方式中，上述任务调度装置还包括耦合连接的事件解析电路和同步计数电路，该同步计数电路包括多个计数器，每个计数器对应一个barrier；事件解析电路，用于在第一任务执行完成的情况下，通过第一接口接收第一事件，并基于第一同步信息表确定第一事件对应的第二barrier的标识，通知同步计数电路修改第二barrier对应的计数器的值；其中，该第一事件用于指示第一任务执行完成；同步计数电路，用于修改第二barrier对应的计数器的值。

可选的，同步计数电路修改第二barrier对应的计数器的值时，可以将该第二barrier对应的计数器的值加一，也可以将该第二barrier对应的计数器的值减一，还可以将该第二barrier对应的计数器的值加上或减去其他数值。实际应用中，同步计数电路修改barrier对应的计数器的值时，是将计数器的值增大(例如，加一)还是减小(例如，减一)，与该计数器的初始值有关。

示例性的，在第一任务执行完成后，通过向任务调度装置发送指示第一任务执行完成的第一事件，第一接口解析该第一事件，并向事件解析电路发送该第一事件。事件解析电路接收该第一事件，并查询第一同步信息表，确定第一事件对应的第二barrier的标识并通知同步计数电路修改该第二barrier对应的计数器的数值。同步计数电路修改第二barrier对应的计数器的数值后，向任务状态机通知该第二barrier的标识。任务状态机基于第二同步信息表判断该第二barrier的值是否满足其对应的触发条件，在该第二barrier的值满足其对应的触发条件的情况下，从任务图控制电路获取下一个待执行的任务，并向计算单元发送该任务。直至第一任务图中的所有任务执行完毕。

基于本方案，通过第一同步信息表和第二同步信息表，能够正确的维护好任务图中多个任务的依赖关系，以确保各个任务正常执行。该方案在维护任务图中多个任务的依赖关系时，无需再次将依赖关系载入任务调度装置中，直接依据任务调度装置中的第一同步信息表和第二同步信息表即可，因此能够节省将静态的依赖关系载入任务调度装置的时间，提升计算效率。

在又一种可能的实现方式中，上述任务图控制电路，还用于修改或删除任务图模板。

基于本方案，任务调度装置可以对其存储的多个任务图模板进行修改、删除和新增，从而使得任务调度装置中的任务图模板更灵活，能够适用于更多场景。

在又一种可能的实现方式中，上述任务图模板包括第一任务和第二任务，该第一任务和第二任务复用同一个barrier。

可选的，多个任务复用同一个barrrier是指该多个任务的触发可以依赖于同一个barrier。即在第二同步信息表中，当多个任务复用同一个barrrier时，该barrier的值满足一个或多个触发条件时，对应的待执行任务为该多个任务。

基于本方案，任务图模板中的多个任务可以复用同一个barrier。由于一个barrier的值可以通过一个计数器维护，当多个任务复用同一个barrier时，可以减少计数器的数量，从而减小芯片面积。

在又一种可能的实现方式中，第一任务和第二任务满足以下情况中的至少一种：第一任务和第二任务均没有父节点；或者，第一任务和第二任务具有相同的父节点；或者，第一任务为第二任务唯一的父节点；或者，第一任务和第二任务的根节点复用同一个barrier，且第一任务为第二任务唯一的父节点。

需要说明的是，一个任务图模板中的多个任务如果满足以上四种情况中的任一种或多种，该多个任务可以复用同一个barrier。实际应用中，多个任务复用同一个barrier的情况不限于上述四种情况，具体可以根据任务图模板中多个任务的依赖关系，确定多个任务是否能复用同一个barrier。

基于本方案，通过多个任务复用同一个barrier时，可以减少计数器的数量，从而减小芯片面积。

在又一种可能的实现方式中，一个barrier对应多个触发条件，该多个触发条件包括首个触发条件和其他触发条件，该首个触发条件的触发顺序早于其他触发条件的触发顺序；第二同步信息表包括第一子信息表和第二子信息表，第一子信息表包括多个barrier，每个barrier对应的首个触发条件，以及每个barrier满足其对应的首个触发条件时的待执行的任务的标识；第二子信息表包括多个barrier，每个barrier对应的其他触发条件，以及每个barrier满足其对应的其他触发条件时的待执行的任务的标识。

可选的，上述第一子信息表存储在任务调度装置的缓存cache中，第二子信息表存储在内存中。

基于本方案，通过将每个barrier对应的首触发条件存储在DDR中，将每个barrier对应的其他触发条件存储在DDR中，能够减小任务调度装置的芯片面积。

在又一种可能的实现方式中，在barrier对应的其他触发条件为多个的情况下，第二子信息表中该barrier对应的多个其他触发条件按触发顺序先后依次排列；任务图控制电路，还用于在barrier的值满足其对应的首个触发条件时，按照第二子信息表中该barrier对应的多个其他触发条件的触发顺序，从内存中读取下一个其他触发条件，并将该barrier对应的首个触发条件替换为该其他触发条件。

可选的，barrier对应的多个触发条件中，该下一个其他触发条件的触发顺序紧接着第一触发条件。即该下一个其他触发条件为第一barrier的值满足第一触发条件之后，下一个会被第一barrier触发的触发条件。比如第二个触发条件。

可选的，由于任务控制电路将cache中存储的barrier对应的首个触发条件替换为该barrier对应的第二个触发条件。因此，任务图控制电路，还用于在barrier的值满足cache中的第二个触发条件时，按照第二子信息表中该barrier对应的多个其他触发条件的触发顺序，从内存中读取第三个触发条件，并将cache中的第二个触发条件替换为该第三个触发条件。以此类推，直至同一个barrier对应的多个触发条件全部遍历完。

基于本方案，通过将首个触发条件存储在任务调度装置的cache中，将其他触发条件存储在DDR中，并通过动态的替换cache中的触发条件，可以依次将触发条件载入cache，该方案能够减小任务调度装置的芯片面积，提高芯片的可扩展性。

本申请实施例的第二方面，提供一种任务调度方法，应用于任务调度装置，该任务调度装置包括一个或多个任务图模板，每个任务图模板用于指示该任务图模板包括的多个任务之间的依赖关系，以及每个任务的处理方式；该方法包括：任务调度装置获取第一任务图的任务信息；第一任务图的任务信息包括第一任务图的输入数据和第一任务图对应的任务图模板标识。任务调度装置基于第一任务图对应的任务图模板标识，在任务调度装置包括的一个或多个任务图模板中确定第一任务图对应的任务图模板。任务调度装置基于第一任务图的输入数据和第一任务图对应的任务图模板，对第一任务图进行调度。

在一种可能的实现方式中，上述方法还包括：任务调度装置获取一个或多个任务图模板；每个任务图模板包括任务信息表、第一同步信息表和第二同步信息表；其中，任务信息表包括多个任务标识，以及每个任务标识对应的处理方式；第一同步信息表包括多个事件，以及每个事件对应的一个或多个屏障barrier的标识，多个事件与多个任务一一对应，每个事件用于指示其对应的任务执行完成；第二同步信息表包括多个barrier、每个barrier对应的一个或多个触发条件、以及每个barrier满足其对应的触发条件时的待执行任务标识。

在另一种可能的实现方式中，上述任务调度装置包括耦合连接的第一接口、任务图控制电路、任务状态机，以及第二接口；任务调度装置获取任务图和第一任务图的任务信息，包括：任务图控制电路通过第一接口获取任务图，以及第一任务图的任务信息；任务调度装置基于第一任务图的输入数据和第一任务图对应的任务图模板，对第一任务图进行调度，包括：任务状态机基于第二同步信息表，在确定第一barrier的值满足其对应的第一触发条件时，根据第一任务标识、第一任务图的输入数据，以及第一任务图对应的任务信息表，从任务图控制电路获取第一任务标识对应的第一任务，并通过第二接口向计算单元发送第一任务；该第一任务标识为第一barrier的值满足第一触发条件时待执行的任务的标识。

在又一种可能的实现方式中，任务调度装置还包括耦合连接的事件解析电路和同步计数电路，该同步计数电路包括多个计数器，每个计数器对应一个barrier；任务调度装置基于第一任务图的输入数据和第一任务图对应的任务图模板，对第一任务图进行调度，还包括：事件解析电路在第一任务执行完成的情况下，通过第一接口接收第一事件，并基于第一同步信息表确定第一事件对应的第二barrier的标识，通知同步计数电路修改第二barrier对应的计数器的值；其中，该第一事件用于指示第一任务执行完成；同步计数电路修改第二barrier对应的计数器的值。

在又一种可能的实现方式中，上述方法还包括：任务图控制电路修改或删除任务图模板。

在又一种可能的实现方式中，上述任务图模板包括第一任务和第二任务，第一任务和第二任务复用同一个barrier。

在又一种可能的实现方式中，一个barrier对应多个触发条件，多个触发条件包括首个触发条件和其他触发条件，首个触发条件的触发顺序早于其他触发条件的触发顺序；第二同步信息表包括第一子信息表和第二子信息表，第一子信息表包括多个barrier，每个barrier对应的首个触发条件，以及每个barrier满足其对应的首个触发条件时的待执行的任务的标识；第二子信息表包括多个barrier，每个barrier对应的其他触发条件，以及每个barrier满足其对应的其他触发条件时的待执行的任务的标识。

在又一种可能的实现方式中，上述第一子信息表存储在任务调度装置的缓存cache中，上述第二子信息表存储在内存中。

在又一种可能的实现方式中，在barrier对应的其他触发条件为多个的情况下，第二子信息表中该barrier对应的多个其他触发条件按触发顺序先后依次排列；上述方法还包括：任务图控制电路在barrier的值满足其对应的首个触发条件时，按照第二子信息表中该barrier对应的多个其他触发条件的触发顺序，从内存中读取下一个其他触发条件，并将该barrier对应的首个触发条件替换为该其他触发条件。

上述第二方面以及第二方面的各种实现方式的效果描述可以参考第一方面相应效果的描述，在此不再赘述。

本申请实施例的第三方面，提供一种计算设备，所述计算设备包括中央处理器CPU，以及如上述第一方面所述的任务调度装置，所述CPU用于向所述任务调度装置发送所述任务图模板。

在一种可能的实现方式中，所述计算设备还包括增强型短消息服务EMS和计算单元，所述EMS用于接收来自所述任务调度装置的待执行任务，并将所述待执行任务分配给所述计算单元，所述计算单元用于执行所述待执行任务。

附图说明

图1为本申请实施例提供的一种调度装置的结构示意图；

图2为本申请实施例提供的另一种调度装置的的结构示意图；

图3为本申请实施例提供的一种任务图模板的结构示意图；

图4为本申请实施例提供的另一种任务图模板的结构示意图；

图5为本申请实施例提供的又一种任务图模板的结构示意图；

图6为本申请实施例提供的一种多任务复用barrier时的任务图模板的结构示意图；

图7为本申请实施例提供的一种任务图模板中不复用barrier与复用barrier的结构示意图；

图8为申请实施例提供的一种任务调度装置的结构示意图；

图9为申请实施例提供的一种计算设备的结构示意图；

图10为申请实施例提供的一种任务调度方法的流程示意图；

图11为申请实施例提供的另一种任务调度方法的流程示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述。在本申请中，“至少一个”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B的情况，其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指的这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b或c中的至少一项(个)，可以表示：a，b，c，a和b，a和c，b和c，或，a和b和c，其中a、b和c可以是单个，也可以是多个。另外，为了便于清楚描述本申请实施例的技术方案，在本申请的实施例中，采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分，本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定。比如，本申请实施例中的第一子信息表中的“第一”和第二子信息表中的“第二”仅用于区分不同的子信息表。本申请实施例中出现的第一、第二等描述，仅作示意与区分描述对象之用，没有次序之分，也不表示本申请实施例中对设备个数的特别限定，不能构成对本申请实施例的任何限制。

需要说明的是，本申请中，“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其他实施例或设计方案更优选或更具优势。确切而言，使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。

目前，在人工智能、高性能计算(high performance computing，HPC)等场景中，为了提高计算设备的计算能力，通常计算设备的计算架构可以为异构计算的硬件架构，该架构包括中央处理器(central processing unit，CPU)，以及一个或多个加速器。CPU用于执行通用的计算任务，加速器用于执行专用的计算任务。该专用的计算任务可以包括人工智能(artificial intelligence，AI)处理，例如人工神经网络，机器学习(machine learning，ML)训练，ML优化/学习，推断，分类等操作，可视数据处理，网络数据处理，对象检测，规则分析，内容处理操作等。该加速器可以为神经网络处理器(neural-network process unit，NPU)，可包括图形处理器(graphics processing unit，GPU)，数字信号处理器(digital signal processor，DSP)，片上系统(system on chip，SOC)，现场可编程门阵列(Field-Programmable Gate Array，FPGA)、专用集成电路 (application specific integrated circuit，ASIC)等中的一个或多个。该加速器还可以为本申请下述实施例中的任务调度装置。

在异构系统中，对于较为复杂的任务图，多个任务之间可能存在相互依赖关系(比如，一个任务的执行依赖于另一个任务的计算结果)。为了减轻并行编程的难度，调度软件可以根据输入和输出确定多个任务之间的依赖关系，并将准备就绪的任务调度到可执行任务的CPU核或者加速器上执行。

例如，如图1所示的一种调度装置，该调度装置可以称为任务大师(Task Maestro)，该调度装置调度任务的方法可以包括以下几个步骤：

1.主处理器核(Master Core)添加任务描述符(Task Description)到任务大师(Task Maestro)；

2.任务大师(Task Maestro)将任务描述符存储至任务池(Task Pool)；

3.检查模块(Check Deps)检查任务之间的依赖关系，将准备就绪的任务通过调度模块调度给计算单元(Worker Core)执行，并修改依赖关系表(Dependence Table)；

4.检查模块(Check Deps)继续检查是否有任务准备就绪，并将准备就绪的任务继续调度给计算单元(Worker Core)执行，直到所有任务执行完成。

但是，图1所示的调度装置在调度任务时，对于处理方式和依赖关系相同的多个任务图，每次执行该任务图时，主处理器核Master Core都要重新将该任务图对应的任务描述符(任务描述符包括任务的处理方式和任务的依赖关系)初始化到调度装置中，再由调度装置维护该任务图中的多个任务之间的依赖关系，以确保计算正常进行。因此，图1所示的调度装置不支持将静态的依赖关系和处理方式内置在调度装置中，这将造成调度装置解析任务图的依赖关系时，初始化的时间较长，Master Core和调度装置之间交互冗余，影响计算效率的问题。

再例如，如图2所示的一种任务调度图(task scheduling graph，TSG)装置，该TSG装置包括任务库、事件计数器和刷新命令模块。该TSG装置调度任务的方法可以包括以下几个步骤：

1.主处理器核(Master Core)初始化任务描述符(Task Description)，依赖关系表，以及事件计数器Counter；

2.TSG装置调度准备就绪的任务调度到计算单元(Worker Core)；

3.计算单元(Worker Core)执行完该任务后产生事件，TSG装置通过刷新命令模块，修改事件计数器Counter，事件计数器满足触发条件后，产生准备就绪的任务，TSG装置将该准备就绪的任务继续调度给计算单元(Worker Core)；

4.直到所有任务执行完后，TSG装置通知主处理器核(Master Core)，主处理器核(Master Core)重新初始化新的任务。

但是，图2所示的调度装置在调度任务时，对于处理方式和依赖关系相同的多个任务图，每次执行该任务图时，Master Core都要重新将该任务图对应的任务描述符初始化到TSG装置中，再由TSG装置通过事件计数器和刷新命令维护该任务图中的多个任务之间的依赖关系，以确保计算正常进行。因此，图2所示的调度装置不支持将静态的依赖关系和处理方式内置在调度装置中，每个任务图都要重新初始化到TSG装置，这将造成初始化时间较长，影响计算效率的问题。而且该方案中每个任务都配置一个计数器，因此计数器的数量较多，导致TSG装置的芯片面积较大。

为了缓解调度装置在调度处理方式和依赖关系相同的多个任务图时，每次CPU都要重新将该任务图对应的处理方式和依赖关系初始化到调度装置中，造成初始化时间较长，影响计算效率的问题，本申请实施例提供一种任务调度装置，该任务调度装置通过创建一次任务图模板，从而在后续执行与该任务图模板的处理方式和依赖关系均相同的多个任务图时，无需将静态的处理方式和依赖关系再次载入任务调度装置。即，本申请实施例提供的任务调度装置支持将静态的任务图模板内置，从而能够节省将静态的处理方式和依赖关系载入任务调度装置的时间，提升计算效率。

本申请实施例提供一种任务调度装置，该任务调度装置可以应用于通信处理器、HPC和AI计算等领域。该任务调度装置可以为通信设备或计算设备中的芯片。

任务调度装置，用于获取一个或多个任务图模板。可选的，任务调度装置获取的任务图模板可以是CPU发送给任务调度装置的，也可以是预置在任务调度装置中的，本申请实施例对此并不限定。

任务调度装置中的每个任务图模板用于指示该任务图模板包括的多个任务之间的依赖关系，以及每个任务的处理方式。

示例性的，任务图模板包括的多个任务中，如果一个任务的执行依赖于另一个任务的计算结果，那么这两个任务之间存在依赖关系。每个任务的处理方式可以包括每个任务的计算方式、数据复制方式、数据搬移方式等。

例如，以任务图模板包括任务1、任务2和任务3，任务图模板用于计算(a+b)*(c-d)为例，任务1的处理方式为a+b，任务2的处理方式为c-d，任务3的处理方式为将任务1的计算结果e与任务2的计算结果f相乘。该任务图模板中任务1和任务2执行完成之后，任务3才可以开始执行。即，任务3的执行依赖于任务1和任务2的计算结果。该任务图模板用于指示任务1、任务2和任务3的计算方式，以及任务1、任务2和任务3之间的依赖关系。

处理方式和依赖关系均相同的多个任务图对应的任务图模板相同。例如，任务图1用于计算(1+2)*(4-3)，任务图2用于计算(5+6)*(8-7)，任务图1中多个任务之间的依赖关系与任务图2中多个任务之间的依赖关系相同，而且任务图1中多个任务的计算方式与任务图2中多个任务的计算方式也相同。因此，任务图1和任务图2的任务图模板相同，均为(a+b)*(c-d)。任务图1和任务图2的区别在于两个任务图的输入数据不同。即本申请实施例中的任务调度装置支持将静态的任务图模板内置在该任务调度装置中，从而在后续执行该任务图模板对应的多个任务图时，无需将依赖关系和处理方式再次初始化到任务调度装置中，因此，后续执行该多个任务图时只获取动态的输入数据以及要用的任务图模板的标识即可，能够节省依赖关系载入到任务调度装置的时间。

可选的，任务图模板包括的多个任务可以串行执行，也可以并行执行。例如，任务图模板包括的多个任务中，一部分任务在执行时可以串行执行，一部分任务在执行时可以并行执行，本申请实施例对于任务图模板中多个任务的具体执行方式并不限定。

本申请实施例中任务调度装置中的任务图模板可以用于任意多任务计算的场景，下面简单介绍三种场景下的任务图模板。

图3为一种无线通信中L2调度的任务图模板，如图3所示，在无线通信系统中的5G商用下行共享信道(downlink shared channel，DL-SCH)中，可以将其调度过程抽象为图3所示的任务图模板。其中，T0为传输时间间隔(transport time interval，TTI)中断定时触发任务，T1为小区级调度任务，T2为空域调度任务，T3为频域调度任务，T4为用户级后处理任务。主处理器核Master Core可以将图3所示的任务图模板载入到本申请的任务调度装置中，由本申请的任务调度装置完成多个任务的依赖关系的解析和调度，保证任务执行的并行度。

图4为一种HPC中矩阵计算的任务图模板，HPC中的矩阵计算可以抽象为图4所示的任务图模板，以矩阵计算为A[i]＝(a[i]+b[i])*(c[i]+d[i])为例，T0为加法运算，

T1为乘法运算。主处理器核Master Core将图4中的任务图模板抽象为两个T0和一个T1载入到本申请的任务调度装置中，由本申请的任务调度装置完成多个任务的依赖关系解析和调度，保证任务执行的并行度。可以理解的，HPC中的矩阵计算除乘法和加法外，还可以包括矩阵LU分解等多种矩阵计算，图4仅以任务图模板包括加法和乘法为例进行示意。

图5为一种AI计算场景中卷积神经网络(convolutional neural networks，CNN)的任务图模板，图5中的(a)所示的CNN的各个计算步骤可以抽象为图5中的(b)所示的任务图模板。其中，T1是前处理，T2、T3、T4是直接存储器访问(direct memory access，DMA)任务，T5是VADD，T6、T7是卷积CONV，T8是池化Pool，T9是DMA。主处理器核Master Core将图5所示的任务图模板载入到本申请的任务调度装置中，由本申请的任务调度装置完成多个任务的依赖关系解析和调度，保证任务执行的并行度。

任务调度装置中的任务图模板不限于上述三种场景的任务图模板，任何多任务计算的场景都可以将多个任务之间的依赖关系和处理方式抽象为任务图模板。

可选的，每个任务图模板可以包括任务信息表、第一同步信息表和第二同步信息表。本申请实施例中每个任务图模板的数据结构可以采用任务信息表、第一同步信息表和第二同步信息表这三张表来描述。下面分别对这三张表进行介绍。

任务信息表包括多个任务标识，以及每个任务标识对应的处理方式。可选的，每个任务标识对应的处理方式可以为每个任务的具体计算方式。

示例性的，以任务图模板包括N个任务为例，任务信息表可以如表1所示。

表1

任务调度装置基于表1所示的任务信息表，可以获取每个任务的处理方式。表1所示的任务信息表用于指示任务图模板的静态处理方式。

示例性的，表1中的TaskType0至TaskTypeN表示任务标识，在任务信息表中每个任务标识对应一个函数关系function，TaskInfo表示函数中具体变量的指针位置，任务调度装置基于表1中的TaskInfo和function可以得到每个任务标识对应的具体计算方式。

例如，以TaskType0对应的任务为a+b为例，function0为加法，TaskInfo0用于指示变量a和变量b的指针位置，根据任务标识TaskType0，查表1可知，TaskType0对应的任务为a+b。可以理解的，变量a和变量b的具体数值为动态的数据，可以根据不同的任务图实时获取该动态数据。而上述任务信息表中存储的每个任务的处理方式为静态数据，因此，多个任务图都可以采用上述任务信息表获取任务的处理方式，只是对于不同任务图动态数据的数值不相同。

可选的，任务信息表还可以包括任务优先级、队列编号、任务计算量、亲和性标签TAG(同一个亲和性标签TAG可以发给同一个计算单元执行)等信息。负载均衡模块接收任务调度装置调度的任务后，可以基于任务优先级、队列编号、任务计算量、亲和性标签TAG等信息进行负载均衡、优先级调度、亲和性调度等操作。

第一同步信息表包括多个事件，以及每个事件对应的一个或多个屏障barrier的标识，该多个事件与多个任务一一对应，每个事件用于指示其对应的任务执行完成。

其中，barrier用于协调多个任务并行工作，只有在barrier满足触发条件时，才能继续执行下一个任务。每个barrier可以对应一个计数器，该barrier的值即为其对应的计数器的数值。

示例性的，以任务图模板包括N个任务为例，每个任务都可以对应一个事件Event，每个事件用于指示其对应的任务执行完成，第一同步信息可以如表2所示。

表2

在每个任务执行完成时，任务调度装置基于第一同步信息表，可以获取每个事件对应的barrier的标识，并基于该事件对应的barrier的标识，修改该barrier对应的计数器的数值。可选的，任务调度装置修改barrier对应的计数器的数值时，可以将该barrier对应的计数器的数值加一，也可以将该第二barrier对应的计数器的数值减一。实际应用中，任务调度装置修改barrier对应的计数器的值时，是将计数器的值加一还是减一，与计数器的初始值有关。下述实施例以barrier的初始值均为0，任务调度装置修改一次barrier对应的计数器的值是将其加一为例进行说明。

可选的，一个事件可以对应一个或多个barrier。如表2所示，当一个事件对应多个barrier时，该事件对应的任务执行完成后，修改该事件对应的多个barrier的值。

可选的，多个事件也可以对应同一个barrier。即该多个事件对应的多个任务中每个任务执行完成后都要修改该barrier的值。例如，以Event0、Event1和Event2分别表示Task0、Task1、Task2执行完成为例，如表2所示，由于Event0、Event1和Event2对应的barrier的标识均包括0x1，故Task0执行完成后，任务调度装置将barrier0x1的值加一，Task1执行完成后，任务调度装置将barrier0x1的值再加一，Task2执行完成后，任务调度装置将barrier0x1的值又加一。

第二同步信息表包括多个barrier、每个barrier对应的触发条件，以及每个barrier满足其对应的触发条件时的待执行任务标识。第二同步信息表中，每个barrier可以对应一个或多个触发条件，每个barrier满足其对应的一个触发条件时的待执行任务可以为一个或多个。

可选的，第二同步信息表还可以包括每个barrier的有效位，每个barrier的有效位用于指示该barrier是否有效。第二同步信息表还可以包括每个待执行任务标识对应的执行次数。

示例性的，以一个barrier对应两个触发条件为例，第二同步信息可以如表3所示。

表3

在barrier的值更新的情况下，任务调度装置基于该barrier的标识，查询第二同步信息表，确定该barrier的值是否满足其对应的触发条件。在该barrier的值满足其对应的触发条件时，任务调度装置基于第二同步信息表，确定待执行的任务标识，并基于任务信息表(表1)获取该任务标识对应的任务内容，然后向计算单元发送该任务。

如表3所示，一个barrier可以对应多个触发条件，barrier的值满足不同触发条件时，待执行的任务不同。当一个barrier对应多个触发条件时，第二同步信息表中该多个触发条件可以按照触发顺序依次排列。例如，表3中的触发条件trigger_condition0的触发顺序早于trigger_condition1的触发顺序。

根据上述表3可以确定每个barrier的值是否满足其对应的触发条件。在barrier的值满足其对应的触发条件的情况下，依据表3可以获取下一个待执行的任务的标识。

可选的，多个任务可以复用同一个barrier。多个任务复用同一个barrrier是指该多个任务的触发可以依赖于同一个barrier。即在第二同步信息表中，当多个任务复用同一个barrrier时，该barrier的值满足一个或多个触发条件时，对应的待执行任务为该多个任务。由于一个barrier的值可以通过一个计数器维护，当多个任务复用同一个barrier时，可以减少计数器的数量，从而减小芯片面积。

示例性的，以任务图模板包括第一任务和第二任务为例，该第一任务和第二任务可以复用同一个barrier。以第一任务和第二任务复用barrier0为例，在第二同步信息表中，第一任务可以为barrier0满足第一触发条件时对应的待执行任务，第二任务可以为barrier0满足第二触发条件时对应的待执行任务，该第一触发条件和第二触发条件可以相同，也可以不同。也就是说，复用同一个barrier的多个任务的触发条件可以相同，也可以不同。当第一触发条件和第二触发条件相同时，第一任务和第二任务为并行执行的两个任务。

在本申请实施例中，第一任务和第二任务满足以下四种情况中的至少一种时，第一任务和第二任务可以复用同一个barrier。

情况一、第一任务和第二任务均没有父节点。

可选的，在任务图模板中第一任务和第二任务为根节点时，第一任务和第二任务可以复用同一个barrier。

例如，以任务图模板包括任务T1至T4，任务T1、任务T2和任务T3为任务T4的父节点为例。如图6中的(a)所示，由于任务T1、任务T2和任务T3为根节点，即任务T1、任务T2和任务T3没有父节点，因此任务T1、任务T2和任务T3可以复用同一个barrier。如图6中的(a)所示，任务1、任务2和任务3的触发条件可以相同，以任务1、任务2和任务3复用barrier0，任务1、任务2和任务3的触发条件为barrier0＝0为例，当barrier0为0时，触发任务1、任务2和任务3，计算单元并行执行任务T1、任务T2和任务T3。

情况二、第一任务和第二任务具有相同的父节点。

例如，以任务图模板包括任务T1至T5，任务T1、任务T2和任务T3为任务T4和任务T5的父节点，任务T4和任务T5可以并行执行为例。如图6中的(b)所示，由于任务T4和任务T5的父节点均为任务T1至T3，因此任务T4和任务T5的父节点相同，故任务T4和任务T5可以复用同一个barrier。如图6中的(b)所示，任务T4和任务T5的触发条件可以相同，以任务T4和任务T5复用barrier0，任务T4和任务 T5的触发条件为barrier0＝3为例，当barrier0为3时，触发任务T4和任务T5，计算单元并行执行任务T4和任务T5。

结合上述情况一和情况二可知，任务图模板中触发条件相同的多个任务可以复用同一个barrier。

情况三、第一任务为第二任务唯一的父节点。

例如，以任务图模板包括任务T1至T5，任务T1、任务T2和任务T3为任务T4的父节点，任务T4为任务T5的父节点为例。如图6中的(c)所示，由于任务T4为任务T5唯一的父节点，因此任务T4和任务T5可以复用同一个barrier。如图6中的(c)所示，任务T4和任务T5的触发条件不同，以任务T4的触发条件为barrier0＝3，任务T5的触发条件为barrier0＝4为例，当barrier0为3时触发任务T4，任务T4执行完成后，barrier0的值修改为4，满足任务T5的触发条件，触发任务T5，计算单元执行任务T5。

情况四、第一任务和第二任务的根节点复用同一个barrier，且第一任务为第二任务唯一的父节点。

例如，以任务图模板包括任务T1至T5，任务T1、任务T2和任务T3为任务T4的父节点，任务T4为任务T5的父节点为例。如图6中的(d)所示，由于任务T4和任务T5的根节点为任务T1、任务T2和任务T3，任务T1、任务T2和任务T3可以复用同一个barrier，而且任务T4为任务T5唯一的父节点，因此任务T4和任务T5可以复用同一个barrier。如图6中的(d)所示，任务T4和任务T5的触发条件不同，以任务T4的触发条件为barrier0＝3，任务T5的触发条件为barrier0＝4为例，当barrier0为3时触发任务T4，任务T4执行完成后，barrier0的值修改为4，满足任务T5的触发条件，触发任务T5，计算单元执行任务T5。

结合上述情况三和情况四可知，任务图模板中触发条件不同的多个任务也可以复用同一个barrier。

例如，以任务图模板包括8个任务，分别为任务T1至任务T8为例。如图7中的(a)所示的一种任务图模板的结构示意图，在不复用barrier(或计数器)的情况下，图7中的(a)所示的任务图模板中的任务T1至任务T8的触发依赖于barrier1至barrier7。即任务T1至任务T8的触发分别依赖于不同的barrier。在不复用barrier(或计数器)的情况下，图7中的(a)所示的任务图模板对应的第二信息表如下表4所示。

表4

再例如，以任务图模板包括8个任务，分别为任务T1至任务T8为例。如图7中的(b)所示的一种任务图模板的结构示意图，在复用barrier(或计数器)的情况下，图7中的(b)所示的任务图模板中，由于任务T1为任务T2唯一的父节点，任务T1为任务T3唯一的父节点，任务T2和任务T3的父节点相同均为任务T1，而且任务T2为任务T4唯一的父节点，因此任务T1、任务T2、任务T3和任务T4均可以复用同一个barrier，记为图7中的(b)所示的b1。由于任务T7是任务T8唯一的父节点，因此任务T7和任务T8可以复用同一个barrier，记为图7中的(b)所示的b4。在复用barrier(或计数器)的情况下，图7中的(b)所示的任务图模板对应的第二信息表如下表5所示。

表5

根据上述表4和表5可知，对于同一个任务图模板，在不复用barrier(或计数器)的情况下，任务T1至任务T8的触发依赖于barrier1至barrier7共7个barrier，而在复用barrier(或计数器)的情况下，任务T1至任务T8的触发依赖于barrier1至barrier4共4个barrier。由于一个barrier的值通过一个计数器维护，因此，对于同一个任务图模板，复用barrier相比于不复用barrier，能够大大减少计数器的数量，减小芯片面积。

可选的，一个barrier满足其对应的一个触发条件时的待执行任务如果为多个，该多个待执行任务可以并行执行。例如，如表5所示，b1的值为1时，待执行的任务为任务T2和任务T3，计算单元可以并行执行该任务T2和任务T3。

可选的，任务调度装置中存储的任务信息表、第一同步信息表和第二同步信息表可以是CPU(例如，Master core)发送给任务调度装置的，也可以是预先配置在任务调度装置中的，本申请实施例对此并不限定。

可以理解的，本申请实施例中的任务图模板的数据结构可以用任务信息表(表1)、第一同步信息表(表2)和第二同步信息表(表3)这三张表描述。任务调度装置可以基于这三张表对多个任务进行调度。

可选的，任务调度装置可以对其存储的多个任务图模板进行修改和删除，也可以新增任务图模板。

任务调度装置调度任务的过程包括：获取第一任务图的任务信息；基于第一任务图对应的任务图模板标识，在该任务调度装置存储的一个或多个任务图模板中确定第一任务图对应的任务图模板；基于第一任务图的输入数据和第一任务图对应的任务图模板，对第一任务图进行调度。

其中，第一任务图的任务信息包括第一任务图的输入数据和第一任务图对应的任务图模板标识。示例性的，任务调度装置可以接收来自CPU、Master core或加速器的第一任务图的输入数据和第一任务图对应的任务图模板标识。

可选的，由于任务调度装置中存储了多个任务图模板，每个任务图模板的数据结构可以通过上述任务信息表(表1)、第一同步信息表(表2)和第二同步信息表(表3)来描述。任务调度装置可以根据第一任务图对应的任务图模板标识，在其存储的多个任务图模板中确定第一任务图对应的任务信息表(表1)、第一同步信息表(表2)和第二同步信息表(表3)。

可选的，任务调度装置可以基于第一任务图对应的任务信息表、第一同步信息表和第二同步信息表对第一任务图进行调度。

下面以任务调度装置包括多个电路模块为例，结合每个电路模块对任务调度装置调度任务的过程进行详细介绍。

示例性的，如图8所示，本申请实施例提供的任务调度装置可以包括耦合连接的第一接口801、任务图控制电路802、任务状态机803，以及第二接口804。

其中，任务图控制电路802，用于通过第一接口801获取任务图模板，以及第一任务图的任务信息。

可选的，该第一接口801负责接收和识别来自上游模块的命令，并将不同命令路由到不同模块。例如，第一接口801接收CPU发送的任务图模板后，将该任务图模板路由至任务图控制电路802。再例如，第一接口801接收计算单元发送的指示任务执行完成的事件后，解析该事件，并将该事件路由至事件解析电路。

示例性的，任务图控制电路802可以通过第一接口801接收来自CPU的任务图模板。该任务图模板只在任务调度装置创建一次，即可供后续任务图执行多次。可以理解的，本申请实施例中的任务图模板中的依赖关系和处理方式均为静态信息，在后续多次执行任务图时，只获取任务图的动态数据以及要用的任务图模板的标识即可。比如，以第一任务图和第二任务图对应的任务图模板相同为例，任务调度装置创建一次该任务图模板，后续执行第一任务图和第二任务图时，无需将依赖关系和处理方式再次载入任务调度装置，只载入第一任务图和第二任务图的动态数据，以及要用的任务图模板的标识即可，因此能够节省任务图的初始化时间。

任务状态机803，用于基于第二同步信息表，在确定第一barrier的值满足其对应的第一触发条件时，根据第一任务标识、第一任务图的输入数据，以及第一任务图对应的任务信息表，从任务图控制电路802获取第一任务标识对应的第一任务，并通过第二接口804向计算单元发送该第一任务。该第一任务标识为第一barrier的值满足第一触发条件时待执行的任务的标识。

可选的，该第二接口804负责和下游模块交互，用于将准备就绪的任务发送给负载均衡单元或者计算单元。该第一接口801和第二接口804可以为两个不同的物理接口，也可以为同一个物理接口。当第一接口801和第二接口804为同一个物理接口时，该物理接口既可以接收命令或数据，也可以发送命令或数据。图8仅以第一接口801和第二接口804为不同的物理接口为例进行示意。

示例性的，任务状态机803确定barrier的值是否满足其对应的触发条件的时机，可以包括以下两种情况。

第一种情况，在第二同步信息表包括首任务的触发条件(比如，表5中首个任务T1对应的触发条件b1＝0)时，对于第一任务图模板中的首个任务，可以由任务图控制电路802向任务状态机803发送首任务触发信号，该首任务触发信号用于指示任务状态机803查询第二同步信息表，确定b1的值是否满足首任务对应的触发条件。在任务状态机803确定b1的值满足首任务对应的触发条件时，任务状态机803根据首任务标识，第一任务图的输入数据，以及第一任务图对应的任务信息表，从任务图控制电路802获取首任务的任务内容，并将该首任务的任务内容通过第二接口804发送给计算单元。

第二种情况，对于首任务之后的其他任务，任务状态机803可以在barrier的值更新时，查询第二同步信息表，确定该barrier的值是否满足其对应的触发条件。

可选的，在第二同步信息表不包括首任务的触发条件(比如，表5中不包括首个任务T1对应的触发条件b1＝0)时，对于第一任务图模板中的首个任务，也可以由任务图控制电路802向任务状态机803发送首任务执行信号，任务状态机803根据该首任务执行信号，从任务图控制电路802获取首任务的任务内容，并将该首任务的任务内容通过第二接口804发送给计算单元。

可选的，在第一barrier的值满足其对应的第一触发条件时，如果待执行的第一任务多个，计算单元并行执行该多个第一任务。例如，第一任务为多个时，任务状态机803可以向多个计算单元分别发送该多个第一任务，以使得该多个计算单元并行执行该多个第一任务。

如图8所示，任务调度装置还可以包括事件解析电路805和同步计数电路806，该同步计数电路806包括多个计数器，每个barrier对应一个计数器，每个barrier的值即为其对应的计数器的值。

事件解析电路805，用于在第一任务执行完成的情况下，通过第一接口801接收第一事件，并基于第一同步信息表确定第一事件对应的第二barrier的标识，通知同步计数电路806修改第二barrier对应的计数器的值。其中，第一事件用于指示第一任务执行完成。

同步计数电路806，用于修改第二barrier对应的计数器的值。

可选的，上述第二barrier与第一barrier可以为同一个barrier，也可以为不同的barrier。

可选的，同步计数电路806修改第二barrier对应的计数器的值时，可以将该第二barrier对应的计数器的值加一，也可以将该第二barrier对应的计数器的值减一，还可以将该第二barrier对应的计数器的值加上或减去其他数值。实际应用中，同步计数电路806修改barrier对应的计数器的值时，是将计数器的值增大(例如，加一)还是减小(例如，减一)，与该计数器的初始值有关。

例如，当barrier对应的计数器的初始值为0时，同步计数电路806修改第二barrier对应的计数器的值时可以将该计数器的值加一。在该实现方式中，当barrier的值增加到一定数值时，该barrier满足其对应的触发条件。

再例如，当barrier对应的计数器的初始值为根据任务之间的依赖关系预设的非零数值时，同步计数电路806修改第二barrier对应的计数器的值时可以将该计数器的值减一。在该实现方式中，当barrier的值减到0时，该barrier满足其对应的触发条件。

本申请实施例对于同步计数电路806修改barrier对应的计数器的值的具体方法并不限定，下述实施例以barrier的初始值为0，同步计数电路806修改一次barrier对应的计数器的值是将其加一为例进行说明。

示例性的，计算单元执行完第一任务后，可以向任务调度装置发送指示第一任务执行完成的第一事件，第一接口801解析该第一事件，并向事件解析电路805发送该第一事件。事件解析电路805接收该第一事件，并查询第一同步信息表，确定第一事件对应的的第二barrier的标识，并通知同步计数电路806修改该第二barrier对应的计数器的数值。同步计数电路806修改第二barrier对应的计数器的数值后，向任务状态机803通知该第二barrier的标识。任务状态机803基于第二同步信息表判断该第二barrier的值是否满足其对应的触发条件，在该第二barrier的值满足其对应的触发条件的情况下，从任务图控制电路802获取下一个待执行的任务，并向计算单元发送该任务。直至第一任务图模板中的所有任务执行完毕。

可以理解的，本申请实施例提供的任务调度装置支持将静态的任务图模板内置，从而任务调度装置在执行处理方式和依赖关系均相同的多个任务图时，不需要CPU每次将任务图对应的处理方式和依赖关系初始化到任务调度装置中，减少了任务图的初始化时间。也就是说，本申请实施例提供的任务调度装置，通过创建一次任务图模板，就可以重复多次执行与该任务图模板的处理方式和依赖关系均相同的任务图，而且在后续执行该多个任务图时，无需再次将静态的处理方式和依赖关系载入任务调度装置，能够节省将静态的处理方式和依赖关系载入任务调度装置的时间，提升计算效率。而且本申请实施例提供的任务图模板中多个任务可以复用barrier，能够减少同步计数电路中计数器的数量，从而减小任务调度装置的面积，提高芯片的可扩展性。

下面结合图7和图9对本申请实施例提供的任务调度装置调度任务的过程进行介绍。

示例性的，结合图7中的(a)所示的任务图模板，以任务图模板中多个任务不复用同一个barrier，b1至b7的初始值为0为例。图7中的(a)所示的任务图模板对应的第一同步信息表如下表6所示。

表6

结合上述表1、表6和表4，对本申请实施例提供的任务调度装置调度任务的过程进行介绍。

如图9所示，任务图控制电路802通过第一接口801接收来自CPU的任务图模板，并存储该任务图模板，该任务图模板的数据结构可以采用表1、表4和表6这三张表描述。任务图控制电路802通过第一接口801接收来自CPU的第一任务图的任务信息，该第一任务图对应的任务图模板如图7中的(a)所示。任务图控制电路802向任务状态机803发送首任务触发信号，任务状态机803基于该首任务触发信号查询表4，确认b1的初始值0满足首任务对应的触发条件b1＝0，任务状态机803根据首任务标识T1、第一任务图的输入数据，以及表1，从任务图控制电路802获取T1的任务内容，并通过第二接口804向计算单元发送任务T1。

计算单元执行完任务T1后，向第一接口801发送指示任务T1执行完成的Event1。第一接口801解析该Event1，并向事件解析电路805发送该Event1，事件解析电路805接收该Event1，并查询表6，确定Event1对应的barrier的标识为b2，并通知同步计数电路806修改b2对应的计数器的数值。同步计数电路806将b2的值修改为1，并向任务状态机803通知该b2的标识。任务状态机803基于表4，确定b2的值满足其对应的触发条件b2＝1，待执行任务标识为T2和T3，任务状态机803基于待执行任务标识以及表1，从任务图控制电路802获取任务T2和任务T3，并向计算单元1和计算单元2发送任务T2和任务T3。

计算单元并行执行任务T2和任务T3，计算单元执行完任务T2和任务T3后，向第一接口801发送指示任务T2和任务T3执行完成的Event2和Event3。第一接口801解析该Event2和Event3，并向事件解析电路805发送该Event2和Event3，事件解析电路805接收该Event2和Event3，并查询表6，确定Event2对应的barrier的标识为b3和b5，Event3对应的barrier的标识为b4和b5，并通知同步计数电路806修改b3、b4和b5对应的计数器的数值。同步计数电路806将b3的值修改为1，将b4的值修改为1，将b5的值修改为2，并向任务状态机803通知该b3、b4和b5的标识。任务状态机803基于表4，确定b3的值满足其对应的触发条件b3＝1，b5的值满足其对应的触发条件b5＝2，待执行任务标识为T4和T6，任务状态机803基于待执行任务标识以及表1，从任务图控制电路802获取待执行的任务T4和任务T6，并向计算单元发送任务T4和任务T6。

计算单元执行完任务T4后，向第一接口801发送指示任务T4执行完成的Event4。第一接口801解析该Event4，并向事件解析电路805发送该Event4，事件解析电路805接收该Event4，并查询表6，确定Event4对应的barrier的标识为b4，并通知同步计数电路806修改b4对应的计数器的数值。同步计数电路806将b4的值修改为2，并向任务状态机803通知该b4的标识。任务状态机803基于表4，确定b4的值满足其对应的触发条件b4＝2，待执行任务标识为T5，任务状态机803基于待执行任务标识以及表1，从任务图控制电路802获取待执行的任务T5，并向计算单元发送任务T5。

计算单元执行完任务T6后，向第一接口801发送指示任务T6执行完成的Event6。第一接口801解析该Event6，并向事件解析电路805发送该Event6，事件解析电路805接收该Event6，并查询表6，确定Event6对应的barrier的标识为b6，并通知同步计数电路806修改b6对应的计数器的数值。同步计数电路806将b6的值修改为1，并向任务状态机803通知该b6的标识。任务状态机803基于表4，确定b6的值不满足其对应的触发条件b6＝2。可选的，计算单元可以并行执行任务T4和任务T6。

计算单元执行完任务T5后，向第一接口801发送指示任务T5执行完成的Event5。第一接口801解析该Event5，并向事件解析电路805发送该Event5，事件解析电路805接收该Event5，并查询表6，确定Event5对应的barrier的标识为b6，并通知同步计数电路806修改b6对应的计数器的数值。同步计数电路806将b6的值修改为2，并向任务状态机803通知该b6的标识。任务状态机803基于表4，确定b6的值满足其对应的触发条件b6＝2，待执行任务标识为T7，任务状态机803基于待执行任务标识以及表1，从任务图控制电路802获取待执行的任务T7，并向计算单元发送任务T7。

计算单元执行完任务T7后，向第一接口801发送指示任务T7执行完成的Event7。第一接口801解析该Event7，并向事件解析电路805发送该Event7，事件解析电路805接收该Event7，并查询表6，确定Event7对应的barrier的标识为b7，并通知同步计数电路806修改b7对应的计数器的数值。同步计数电路806将b7的值修改为1，并向任务状态机803通知该b7的标识。任务状态机803基于表4，确定b7的值满足其对应的触发条件b7＝1，待执行任务标识为T8，任务状态机803基于待执行任务标识以及表1，从任务图控制电路802获取待执行的任务T8，并向计算单元发送任务T8。任务T8执行完成后第一任务图模板中的所有任务执行完毕。

示例性的，结合图7中的(b)所示的任务图模板，以任务图模板中多个任务复用同一个barrier，b1至b4的初始值为0为例。图7中的(b)所示的任务图模板对应的第一同步信息表如下表7所示。

表7

结合上述表1、表7和表5，对本申请实施例提供的任务调度装置调度任务的过程进行介绍。

如图9所示，任务图控制电路802通过第一接口801接收来自CPU的任务图模板，并存储该任务图模板，该任务图模板的数据结构可以采用表1、表7和表5这三张表描述。任务图控制电路802通过第一接口801接收来自CPU的第一任务图的任务信息，该第一任务图对应的任务图模板如图7中的(b)所示。任务图控制电路802向任务状态机803发送首任务触发信号，任务状态机803基于该首任务触发信号查询表5，确认b1的初始值0满足首任务对应的触发条件b1＝0，任务状态机803根据首任务标识T1、第一任务图的输入数据，以及表1，从任务图控制电路802获取T1的任务内容，并通过第二接口804向计算单元发送任务T1。

计算单元执行完任务T1后，向第一接口801发送指示任务T1执行完成的Event1。第一接口801解析该Event1，并向事件解析电路805发送该Event1，事件解析电路805接收该Event1，并查询表7，确定Event1对应的barrier的标识为b1，并通知同步计数电路806修改b1对应的计数器的数值。同步计数电路806将b1的值修改为1，并向任务状态机803通知该b1的标识。任务状态机803基于表5，确定b1的值满足其对应的触发条件b1＝1，待执行任务标识为T2和T3，任务状态机803基于待执行任务标识以及表1，从任务图控制电路802获取任务T2和任务T3，并向计算单元1和计算单元2发送任务T2和任务T3。

计算单元并行执行任务T2和任务T3，计算单元执行完任务T2和任务T3后，向第一接口801发送指示任务T2和任务T3执行完成的Event2和Event3。第一接口801解析该Event2和Event3，并向事件解析电路805发送该Event2和Event3，事件解析电路805接收该Event2和Event3，并查询表7，确定Event2对应的barrier的标识为b1和b2，Event3对应的barrier的标识为b2和b3，并通知同步计数电路806修改b1、b2和b3对应的计数器的数值。同步计数电路806将b1的值修改为2，将b2的值修改为2，将b3的值修改为1，并向任务状态机803通知该b1、b2和b3的标识。任务状态机803基于表5，确定b1的值满足其对应的触发条件b1＝2，b2的值满足其对应的触发条件b2＝2，待执行任务标识为T4和T6，任务状态机803基于待执行任务标识以及表1，从任务图控制电路802获取待执行的任务T4和任务T6，并向计算单元发送任务T4和任务T6。

计算单元执行完任务T4后，向第一接口801发送指示任务T4执行完成的Event4。第一接口801解析该Event4，并向事件解析电路805发送该Event4，事件解析电路805接收该Event4，并查询表7，确定Event4对应的barrier的标识为b3，并通知同步计数电路806修改b3对应的计数器的数值。同步计数电路806将b3的值修改为2，并向任务状态机803通知该b3的标识。任务状态机803基于表5，确定b3的值满足其对应的触发条件b3＝2，待执行任务标识为T5，任务状态机803基于待执行任务标识以及表1，从任务图控制电路802获取待执行的任务T5，并向计算单元发送任务T5。

计算单元执行完任务T6后，向第一接口801发送指示任务T6执行完成的Event6。第一接口801解析该Event6，并向事件解析电路805发送该Event6，事件解析电路805接收该Event6，并查询表7，确定Event6对应的barrier的标识为b4，并通知同步计数电路806修改b4对应的计数器的数值。同步计数电路806将b4的值修改为1，并向任务状态机803通知该b4的标识。任务状态机803基于表5，确定b4的值不满足其对应的触发条件b4＝2。可选的，计算单元可以并行执行任务T4和任务T6。

计算单元执行完任务T5后，向第一接口801发送指示任务T5执行完成的Event5。第一接口801解析该Event5，并向事件解析电路805发送该Event5，事件解析电路805 接收该Event5，并查询表7，确定Event5对应的barrier的标识为b4，并通知同步计数电路806修改b4对应的计数器的数值。同步计数电路806将b4的值修改为2，并向任务状态机803通知该b4的标识。任务状态机803基于表5，确定b4的值满足其对应的触发条件b4＝2，待执行任务标识为T7，任务状态机803基于待执行任务标识以及表1，从任务图控制电路802获取待执行的任务T7，并向计算单元发送任务T7。

计算单元执行完任务T7后，向第一接口801发送指示任务T7执行完成的Event7。第一接口801解析该Event7，并向事件解析电路805发送该Event7，事件解析电路805接收该Event7，并查询表7，确定Event7对应的barrier的标识为b4，并通知同步计数电路806修改b4对应的计数器的数值。同步计数电路806将b4的值修改为3，并向任务状态机803通知该b4的标识。任务状态机803基于表5，确定b4的值满足其对应的触发条件b4＝3，待执行任务标识为T8，任务状态机803基于待执行任务标识以及表1，从任务图控制电路802获取待执行的任务T8，并向计算单元发送任务T8。任务T8执行完成后第一任务图模板中的所有任务执行完毕。

可选的，在第二同步信息表中的一个barrier对应多个触发条件的情况下，由于该多个触发条件所占的存储资源大，需要较大的存储器件存储该多个触发条件。为了减小任务调度装置的芯片面积，可以将第二同步信息表划分为第一子信息表和第二子信息表，并将第一子信息表存储在任务调度装置中，将第二子信息表存储在内存中。

其中，第一子信息表包括多个barrier，每个barrier对应的首个触发条件，以及每个barrier满足其对应的首个触发条件时的待执行的任务的标识。第二子信息表包括多个barrier，每个barrier对应的其他触发条件，以及每个barrier满足其对应的其他触发条件时的待执行的任务的标识。对于同一个barrier，其对应的首个触发条件的触发顺序早于其对应的其他触发条件的触发顺序。

例如，以每个barrier对应的首个触发条件为trigger_condition0，每个barrier对应的其他触发条件为trigger_condition1和trigger_condition2为例，第一子信息表和第二子信息表分别如表8和表9所示。

表8

表9

可选的，第一子信息表可以存储在任务调度装置的缓存cache中，第二子信息表可以存储在内存(例如，双倍速率(double data rate，DDR)同步动态随机存储器)中，该内存不在任务调度装置中，为任务调度装置以外的存储器。可以理解的，本申请实施例通过将部分触发条件存储在DDR中，可以减小任务调度装置的芯片面积。

示例性的，在barrier对应的计数器的初始值为0的情况下，该barrier满足首个触发条件时的值可以小于barrier满足其他触发条件时的值，从而使得首个触发条件的触发顺序早于其他触发条件的触发顺序。在barrier对应的计数器的初始值为根据任务之间的依赖关系预设的非零数值的情况下，该barrier满足首个触发条件时的值可以大于barrier满足其他触发条件时的值，从而使得首个触发条件的触发顺序早于其他触发条件的触发顺序。

可选的，上述第二子信息表中的多个触发条件可以按照触发顺序依次排列。

任务图控制电路802，还用于在barrier的值满足其对应的首个触发条件时，按照第二子信息表中该barrier对应的多个其他触发条件的触发顺序，从内存中读取下一个其他触发条件，并将该barrier对应的首个触发条件替换为该其他触发条件。

barrier对应的多个触发条件中，该下一个其他触发条件的触发顺序紧接着第一触发条件。即该下一个其他触发条件为第一barrier的值满足第一触发条件之后，下一个会被第一barrier触发的触发条件。比如第二个触发条件。

可选的，由于任务控制电路将cache中存储的barrier对应的首个触发条件替换为该barrier对应的第二个触发条件。因此，任务图控制电路802，还用于在barrier的值满足cache中的第二个触发条件时，按照第二子信息表中该barrier对应的多个其他触发条件的触发顺序，从内存中读取第三个触发条件，并将cache中的第二个触发条件替换为该第三个触发条件。以此类推，直至同一个barrier对应的多个触发条件全部遍历完。

示例性的，以barrier对应的触发条件为3个为例，该3个触发条件按照触发顺序依次为首个触发条件，第二个触发条件和第三个触发条件(该第二个触发条件和第三个触发条件即为上述其他触发条件)，任务调度装置的缓存cache中存储首个触发条件，DDR中存储第二个触发条件和第三个触发条件。当barrier的值满足首个触发条件时，任务图控制电路802从DDR中读取第二个触发条件，并将cache中的首个触发条件替换为第二个触发条件。当barrier的值满足第二个触发条件时，任务图控制电路802从DDR中读取下一个其他触发条件(即第三个触发条件)，并将cache中的第二个触发条件替换为第三个触发条件。

可以理解的，本申请实施例通过将首个触发条件存储在任务调度装置的cache中，将其他触发条件存储在DDR中，并通过动态的替换cache中的触发条件，可以依次将触发条件载入cache，该方案能够减小任务调度装置的芯片面积，提高芯片的可扩展性。

本申请实施例还提供一种计算设备，如图9所示，该计算设备包括中央处理器CPU，以及图8所示的任务调度装置，CPU用于向任务调度装置发送任务图模板。

可选的，该计算设备还可以包括增强型短消息服务(enhanced message severice，EMS)和计算单元，该EMS用于接收来自任务调度装置的待执行任务，并将该待执行任务分配给计算单元。该计算单元用于执行该待执行任务。该计算单元可以为加速器或处理器。该EMS为硬件队列管理和负载均衡模块，用于将待执行任务均衡的分配给计算单元。

示例性的，本申请实施例还提供一种任务调度方法，如图10所示，该任务调度方法应用于图8所示的任务调度装置，该任务调度方法包括以下步骤：

S1001、任务调度装置获取第一任务图的任务信息。

该第一任务图的任务信息包括第一任务图的输入数据和第一任务图对应的任务图模板标识。

该任务调度装置包括一个或多个任务图模板，任务调度装置中的任务图模板可以是接收来自CPU的任务图模板，也可以是预置在任务调度装置中的任务图模板。

可选的，任务图模板的数据结构可以采用上述任务信息表、第一同步信息表和第二同步信息表这三张表来描述。

可选的，上述步骤S1001可以由图8所示的任务调度装置中的任务图控制电路802执行，该任务图控制电路802可以通过第一接口801接收来自CPU或加速器的第一任务图的任务信息。

S1002、基于第一任务图对应的任务图模板标识，在一个或多个任务图模板中确定第一任务图对应的任务图模板。

可选的，上述步骤S1002可以由图8所示的任务调度装置中的任务图控制电路802执行，该任务图控制电路802根据第一任务图对应的任务图模板标识，可以在其存储的多个任务图模板中确定第一任务图对应的任务图模板。

S1003、基于第一任务图的输入数据和第一任务图对应的任务图模板，对第一任务图进行调度。

下面以任务调度装置为图8所示的任务调度装置为例，对步骤S1003的具体执行步骤进行说明。如图11所示，上述步骤S1003可以包括以下步骤：

S10031、任务状态机基于第二同步信息表，在确定第一barrier的值满足其对应的第一触发条件时，根据第一任务标识、第一任务图的输入数据，以及第一任务图对应的任务信息表，从任务图控制电路获取第一任务标识对应的第一任务，并通过第二接口向计算单元发送第一任务。

该第一任务标识为第一barrier的值满足第一触发条件时待执行的任务的标识。

可选的，对于第一任务图中的首个任务，在上述步骤S10031之前，任务图控制电路802可以向任务状态机803发送首任务触发信号，该首任务触发信号用于指示任务状态机803查询第二同步信息表，确定barrier(在第二同步信息表中该barrier的值满足触发条件对应的待执行任务为首任务)的初始值是否满足首任务对应的触发条件。在任务状态机803确定该barrier的初始值满足首任务对应的触发条件时，任务状态机803根据首任务标识，第一任务图的输入数据，以及第一任务图对应的任务信息表，从任务图控制电路802获取首任务的任务内容，并将该首任务的任务内容通过第二接口804发送给计算单元。

可选的，对于第一任务图中首任务之后的其他任务，任务状态机803可以在barrier的值更新时，查询第二同步信息表，确定该barrier的值是否满足其对应的触发条件。

可选的，如果第一barrier的值满足其对应的第一触发条件时待执行的第一任务为多个，那么计算单元并行执行该多个第一任务。

可选的，任务图模板中的多个任务可以复用同一个barrier。多个任务复用同一个barrrier是指该多个任务的触发可以依赖于同一个barrier。即，在第二同步信息表中，如果多个任务复用同一个barrrier，那么该barrier的值满足一个或多个触发条件时，对应的待执行任务就是该多个任务。关于多个任务复用同一个barrier的相关描述可以参考前述实施例，在此不再赘述。

S10032、事件解析电路在第一任务执行完成的情况下，通过第一接口接收第一事件，并基于第一同步信息表确定第一事件对应的第二barrier的标识，通知同步计数电路修改第二barrier对应的计数器的值。

其中，第一事件用于指示第一任务执行完成。

第一事件对应的第二barrier可以为一个，也可以为多个。第二barrier可以与第一barrier相同，也可以与第一barrier不同。

可选的，在计算单元执行完成第一任务后，可以向第一接口发送指示第一任务执行完成的第一事件，第一接口解析该第一事件，并将第一事件路由至事件解析电路805。事件解析电路805基于第一事件标识，查询第一同步信息表，确定该第一事件对应的一个或多个第二barrier的标识，并通知同步计数电路806修改该第二barrier对应的计数器的数值。

S10033、同步计数电路修改第二barrier对应的计数器的值。

示例性的，同步计数电路修改第二barrier对应的计数器的值后，该第二barrier的值更新。

可选的，同步计数电路806修改第二barrier对应的计数器的值后，可以向任务状态机803通知该第二barrier的标识。任务状态机803基于第二同步信息表判断该第二barrier的值是否满足其对应的触发条件，并在该第二barrier的值满足其对应的触发条件的情况下，继续执行上述步骤S10031-S10033，直至第一任务图中的所有任务执行完毕。

可选的，当第一barrier对应多个触发条件时，如果第一barrier对应的首个触发条件存储在任务调度装置的cache中，第一barrier对应的其他触发条件存储在DDR中，上述步骤S1003还可以包括：

S10034、在第一barrier的值满足其对应的第一触发条件时，任务图控制电路按照第二子信息表中第一barrier对应的其他触发条件的触发顺序，从内存中读取下一个其他触发条件，并将任务调度装置中的第一barrier对应的触发条件替换为该下一个其他触发条件。

第一barrier对应的多个触发条件中，该下一个其他触发条件的触发顺序紧接着第一触发条件。即该下一个其他触发条件为第一barrier的值满足第一触发条件之后，下一个会被第一barrier触发的触发条件。比如，该第一barrier对应的第一触发条件为首个触发条件时，该下一个其他触发条件即为第一barrier对应的第二个触发条件。再比如，该第一barrier对应的第一触发条件为第二个触发条件时，该下一个其他触发条件即为该第一barrier对应的第三个触发条件。

在第一触发条件为首个触发条件的情况下，上述步骤S10034可以包括：在第一barrier的值满足cache中该第一barrier对应的首个触发条件时，任务图控制电路按照第二子信息表中该第一barrier对应的其他触发条件的触发顺序，从内存中读取下一个其他触发条件，并将cache中的第一barrier对应的首个触发条件替换为该下一个其他触发条件。

在第一触发条件为首个触发条件之后的其他触发条件时，上述步骤S10034可以包括：在第一barrier的值满足cache中的该第一barrier对应的第一触发条件时，任务图控制电路按照第二子信息表中该第一barrier对应的其他触发条件的触发顺序，从内存中读取下一个其他触发条件，并将cache中该第一barrier对应的第一触发条件替换为该下一个其他触发条件。

示例性的，以第一barrier对应的触发条件为3个为例，该3个触发条件按照触发顺序依次为首个触发条件，第二个触发条件和第三个触发条件(该第二个触发条件和第三个触发条件即为上述其他触发条件)，任务调度装置的缓存cache中存储首个触发条件，DDR中存储第二个触发条件和第三个触发条件。当第一barrier的值满足其对应的首个触发条件时，任务图控制电路802从DDR中读取该第一barrier对应的第二个触发条件，并将cache中的第一barrier对应的首个触发条件替换为该第二个触发条件。当第一barrier的值满足其对应的第二个触发条件时，任务图控制电路802从DDR中读取该第一barrier对应的第三个触发条件，并将cache中的第一barrier对应的第二个触发条件替换为该第三个触发条件。

可选的，步骤S10034可以在步骤S10031之后执行，也可以与步骤S10031同时执行，本申请实施例对此并不限定。

需要说明的是，上述步骤S10031-S10034的具体实现方式可以参考前述实施例的相关描述，在此不再赘述。

本申请实施例提供的任务调度方法，由于任务调度装置中存储了静态的任务图模板，因此每次执行任务图时不需要将依赖关系和处理方式再次初始化至任务调度装置，只需要将任务图的动态数据初始化至任务调度装置即可，因此，减少了将依赖关系和处理方式初始化至任务调度装置的时间。与现有技术中每次都需要CPU重新将任务图对应的处理方式和依赖关系初始化到任务调度装置中相比，本申请实施例通过创建一次任务图模板，就可以重复多次执行与该任务图模板的处理方式和依赖关系均相同的多个任务图，而且在后续执行该多个任务图时，无需再次将静态的处理方式和依赖关系载入任务调度装置，够节省将静态的处理方式和依赖关系载入任务调度装置的时间，提升计算效率。而且本申请实施例提供的任务图模板中多个任务可以复用barrier，能够减少同步计数电路中计数器的数量，从而减小任务调度装置的面积，提高芯片的可扩展性。本申请实施例进一步通过将首个触发条件存储在cache中，将其他触发条件存储在DDR中，并通过动态的替换cache中的触发条件，可以依次将触发条件载入cache，该方案能够减小任务调度装置的芯片面积，提高芯片的可扩展性。

结合本申请公开内容所描述的方法或者算法的步骤可以硬件的方式来实现，也可以是由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成，软件模块可以被存放于随机存取存储器(random access memory，RAM)、闪存、可擦除可编程只读存储器(erasable programmable ROM，EPROM)、电可擦可编程只读存储器(electrically EPROM，EEPROM)、寄存器、硬盘、移动硬盘、只读光盘(CD-ROM)或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质耦合至处理器，从而使处理器能够从该存储介质读取信息，且可向该存储介质写入信息。当然，存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。另外，该ASIC可以位于核心网接口设备中。当然，处理器和存储介质也可以作为分立组件存在于核心网接口设备中。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质，其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本发明的保护范围之内。

Claims

一种任务调度装置，其特征在于，所述任务调度装置包括一个或多个任务图模板，每个所述任务图模板用于指示该任务图模板包括的多个任务之间的依赖关系，以及每个所述任务的处理方式；所述任务调度装置，用于：

获取第一任务图的任务信息；所述第一任务图的任务信息包括所述第一任务图的输入数据和所述第一任务图对应的任务图模板标识；

基于所述第一任务图对应的任务图模板标识，在所述一个或多个任务图模板中确定所述第一任务图对应的任务图模板；

基于所述第一任务图的输入数据和所述第一任务图对应的任务图模板，对所述第一任务图进行调度。
根据权利要求1所述的装置，其特征在于，

所述任务调度装置，还用于获取所述一个或多个任务图模板；每个所述任务图模板包括任务信息表、第一同步信息表和第二同步信息表；其中，所述任务信息表包括多个任务标识，以及每个所述任务标识对应的处理方式；所述第一同步信息表包括多个事件，以及每个所述事件对应的一个或多个屏障barrier的标识，所述多个事件与所述多个任务一一对应，每个所述事件用于指示其对应的所述任务执行完成；所述第二同步信息表包括多个barrier、每个所述barrier对应的一个或多个触发条件、以及每个barrier满足其对应的触发条件时的待执行任务标识。
根据权利要求2所述的装置，其特征在于，所述任务调度装置包括耦合连接的第一接口、任务图控制电路、任务状态机，以及第二接口；其中，

所述任务图控制电路，用于通过所述第一接口获取所述任务图模板，以及所述第一任务图的任务信息；

所述任务状态机，用于基于所述第二同步信息表，在确定第一barrier的值满足其对应的第一触发条件时，根据第一任务标识、所述第一任务图的输入数据，以及所述第一任务图对应的任务信息表，从所述任务图控制电路获取所述第一任务标识对应的第一任务，并通过所述第二接口向计算单元发送所述第一任务；所述第一任务标识为所述第一barrier的值满足第一触发条件时待执行的任务的标识。
根据权利要求3所述的装置，其特征在于，所述第一任务为多个时，所述计算单元并行执行多个所述第一任务。
根据权利要求3或4所述的装置，其特征在于，所述任务调度装置还包括耦合连接的事件解析电路和同步计数电路，所述同步计数电路包括多个计数器，每个计数器对应一个barrier；

所述事件解析电路，用于在所述第一任务执行完成的情况下，通过所述第一接口接收第一事件，并基于所述第一同步信息表确定所述第一事件对应的第二barrier的标识，通知所述同步计数电路修改所述第二barrier对应的计数器的值；其中，所述第一事件用于指示所述第一任务执行完成；

所述同步计数电路，用于修改所述第二barrier对应的计数器的值。
根据权利要求3-5中任一项所述的装置，其特征在于，

所述任务图控制电路，还用于修改或删除所述任务图模板。
根据权利要求2-6中任一项所述的装置，其特征在于，所述任务图模板包括第一任务和第二任务，所述第一任务和所述第二任务复用同一个barrier。
根据权利要求7所述的装置，其特征在于，所述第一任务和所述第二任务满足以下情况中的至少一种：

所述第一任务和所述第二任务均没有父节点；或者，

所述第一任务和所述第二任务具有相同的父节点；或者，

所述第一任务为所述第二任务唯一的父节点；或者，

所述第一任务和所述第二任务的根节点复用同一个barrier，且所述第一任务为所述第二任务唯一的父节点。
根据权利要求2-8中任一项所述的装置，其特征在于，一个所述barrier对应多个触发条件，所述多个触发条件包括首个触发条件和其他触发条件，所述首个触发条件的触发顺序早于所述其他触发条件的触发顺序；

所述第二同步信息表包括第一子信息表和第二子信息表，所述第一子信息表包括所述多个barrier，每个所述barrier对应的所述首个触发条件，以及每个所述barrier满足其对应的所述首个触发条件时的待执行的任务的标识；所述第二子信息表包括所述多个barrier，每个所述barrier对应的所述其他触发条件，以及每个所述barrier满足其对应的所述其他触发条件时的待执行的任务的标识。
根据权利要求9所述的装置，其特征在于，所述第一子信息表存储在所述任务调度装置的缓存cache中，所述第二子信息表存储在内存中。
根据权利要求10所述的装置，其特征在于，在所述barrier对应的所述其他触发条件为多个的情况下，所述第二子信息表中该barrier对应的多个所述其他触发条件按触发顺序先后依次排列；

所述任务图控制电路，还用于在所述barrier的值满足其对应的所述首个触发条件时，按照所述第二子信息表中该barrier对应的多个所述其他触发条件的触发顺序，从内存中读取下一个所述其他触发条件，并将该barrier对应的所述首个触发条件替换为该其他触发条件。
一种任务调度方法，其特征在于，应用于任务调度装置，所述任务调度装置包括一个或多个任务图模板，每个所述任务图模板用于指示该任务图模板包括的多个任务之间的依赖关系，以及每个所述任务的处理方式；所述方法包括：

所述任务调度装置获取第一任务图的任务信息；所述第一任务图的任务信息包括所述第一任务图的输入数据和所述第一任务图对应的任务图模板标识；

所述任务调度装置基于所述第一任务图对应的任务图模板标识，在所述一个或多个任务图模板中确定所述第一任务图对应的任务图模板；

所述任务调度装置基于所述第一任务图的输入数据和所述第一任务图对应的任务图模板，对所述第一任务图进行调度。
根据权利要求12所述的方法，其特征在于，所述方法还包括：

所述任务调度装置获取所述一个或多个任务图模板；每个所述任务图模板包括任务信息表、第一同步信息表和第二同步信息表；其中，所述任务信息表包括多个任务标识，以及每个所述任务标识对应的处理方式；所述第一同步信息表包括多个事件，以及每个所述事件对应的一个或多个屏障barrier的标识，所述多个事件与所述多个任务一一对应，每个所述事件用于指示其对应的所述任务执行完成；所述第二同步信息表包括多个barrier、每个所述barrier对应的一个或多个触发条件、以及每个barrier满足其对应的触发条件时的待执行任务标识。
根据权利要求13所述的方法，其特征在于，所述任务调度装置包括耦合连接的第一接口、任务图控制电路、任务状态机，以及第二接口；

所述任务调度装置获取所述任务图和所述第一任务图的任务信息，包括：所述任务图控制电路通过所述第一接口获取所述任务图，以及所述第一任务图的任务信息；

所述任务调度装置基于所述第一任务图的输入数据和所述第一任务图对应的任务图模板，对所述第一任务图进行调度，包括：所述任务状态机基于所述第二同步信息表，在确定第一barrier的值满足其对应的第一触发条件时，根据第一任务标识、所述第一任务图的输入数据，以及所述第一任务图对应的任务信息表，从所述任务图控制电路获取所述第一任务标识对应的第一任务，并通过所述第二接口向计算单元发送所述第一任务；所述第一任务标识为所述第一barrier的值满足第一触发条件时待执行的任务的标识。
根据权利要求14所述的方法，其特征在于，所述第一任务为多个时，所述计算单元并行执行多个所述第一任务。
根据权利要求14或15所述的方法，其特征在于，所述任务调度装置还包括耦合连接的事件解析电路和同步计数电路，所述同步计数电路包括多个计数器，每个计数器对应一个barrier；所述任务调度装置基于所述第一任务图的输入数据和所述第一任务图对应的任务图模板，对所述第一任务图进行调度，还包括：

所述事件解析电路在所述第一任务执行完成的情况下，通过所述第一接口接收第一事件，并基于所述第一同步信息表确定所述第一事件对应的第二barrier的标识，通知所述同步计数电路修改所述第二barrier对应的计数器的值；其中，所述第一事件用于指示所述第一任务执行完成；

所述同步计数电路修改所述第二barrier对应的计数器的值。
根据权利要求14-16中任一项所述的方法，其特征在于，所述方法还包括：

所述任务图控制电路修改或删除所述任务图模板。
根据权利要求14-17中任一项所述的方法，其特征在于，所述任务图模板包括第一任务和第二任务，所述第一任务和所述第二任务复用同一个barrier。
根据权利要求18所述的方法，其特征在于，所述第一任务和所述第二任务满足以下情况中的至少一种：

所述第一任务和所述第二任务均没有父节点；或者，

所述第一任务和所述第二任务具有相同的父节点；或者，

所述第一任务为所述第二任务唯一的父节点；或者，

所述第一任务和所述第二任务的根节点复用同一个barrier，且所述第一任务为所述第二任务唯一的父节点。
根据权利要求14-19中任一项所述的方法，其特征在于，一个所述barrier对应多个触发条件，所述多个触发条件包括首个触发条件和其他触发条件，所述首个触发条件的触发顺序早于所述其他触发条件的触发顺序；

所述第二同步信息表包括第一子信息表和第二子信息表，所述第一子信息表包括所述多个barrier，每个所述barrier对应的所述首个触发条件，以及每个所述barrier满足其对应的所述首个触发条件时的待执行的任务的标识；所述第二子信息表包括所述多个barrier，每个所述barrier对应的所述其他触发条件，以及每个所述barrier满足其对应的所述其他触发条件时的待执行的任务的标识。
根据权利要求20所述的方法，其特征在于，所述第一子信息表存储在所述任务调度装置的缓存cache中，所述第二子信息表存储在内存中。
根据权利要求21所述的方法，其特征在于，在所述barrier对应的所述其他触发条件为多个的情况下，所述第二子信息表中该barrier对应的多个所述其他触发条件按触发顺序先后依次排列；所述方法还包括：

所述任务图控制电路在所述barrier的值满足其对应的所述首个触发条件时，按照所述第二子信息表中该barrier对应的多个所述其他触发条件的触发顺序，从内存中读取下一个所述其他触发条件，并将该barrier对应的所述首个触发条件替换为该其他触发条件。
一种计算设备，其特征在于，所述计算设备包括中央处理器CPU，以及如权利要求1-11中任一项所述的任务调度装置，所述CPU用于向所述任务调度装置发送所述任务图模板。
根据权利要求23所述的计算设备，其特征在于，所述计算设备还包括增强型短消息服务EMS和计算单元，所述EMS用于接收来自所述任务调度装置的待执行任务，并将所述待执行任务分配给所述计算单元，所述计算单元用于执行所述待执行任务。