CN111813453B

CN111813453B - 具有ooda多处理器的计算板卡

Info

Publication number: CN111813453B
Application number: CN202010866776.7A
Authority: CN
Inventors: 谭光明; 邵恩; 张春明; 段勃
Original assignee: Western Institute Of Advanced Technology Institute Of Computing Chinese Academy Of Sciences
Current assignee: Western Institute Of Advanced Technology Institute Of Computing Chinese Academy Of Sciences
Priority date: 2020-04-30
Filing date: 2020-08-25
Publication date: 2023-08-01
Anticipated expiration: 2040-08-25
Also published as: CN111813453A; CN111506349A

Abstract

本发明公开了一种具有OODA多处理器的计算板卡，该计算板卡包括OODA四个具有不同计算功能的处理器，四个所述处理器通过调度控制器分配不同的工作流作业；在处理一项流式作业时，并按照预设的计算顺序依次顺序循环调用四个处理器，执行流式作业。四个处理器在处理OODA工作流负载时，分别执行观察、调整、想定、行动在内的四类计算算法，并根据OODA工作负载对不同处理器依次占用的特点，使多个OODA工作负载依次占用不同处理器，提高负载流水线执行效率。

Description

具有OODA多处理器的计算板卡

技术领域

本发明涉及一种具有OODA多处理器的计算板卡。

背景技术

随着具有前后依赖关系的OODA类工作流(Workflow)计算任务，逐渐成为主要计算负载，针对计算板卡的结构设计逐渐向“流式”化处理计算负载的设计思路延伸。然而，现有板卡设计难以保证以计算板卡能够高效的流水线方式执行OODA类工作流负载。

OODA环(OODA Loop)理论最早由美国空军上校John Boyd于1966年提出，是用于描述军事指挥决策过程的主要模型框架。OODA环依次由：观察(Observe)，调整(Orient)，想定(Decide)，行动(Act)，在内共四步以循环方式执行军事决策。OODA环理论完成决策或复杂问题的思维过程，整是人脑理性思维的思维定式。

发明内容

本发明的目的是提供一种具有OODA多处理器的计算板卡，以解决现有板卡设计难以保证以计算板卡能够高效的流水线方式执行OODA类工作流负载的问题。

为解决上述技术问题，本发明提供一种具有OODA多处理器的计算板卡，包括OODA四个具有不同计算功能的处理器，四个所述处理器通过调度控制器分配不同的工作流作业；在处理一项流式作业时，并按照预设的计算顺序依次顺序循环调用四个处理器，执行流式作业。

进一步地，各个所述处理器与同一个共享内存直连，且通过相互之间通过该共享内存进行分区间的数据传递。

进一步地，四个所述处理器包括第一处理器、第二处理器、第三处理器和第四处理器；所述第一处理器匹配有观察类算法，用于处理数据匹配类型作业；所述第二处理器匹配有调整类算法，用于处理机器学习的训练类作业；所述第三处理器匹配有想定类算法，用于处理机器学习的推理类作业；所述第四处理器匹配有行动类算法，用于处理控制类算法作业。

进一步地，OODA类工作流负载可分为多个OODA处理流程，一个OODA类工作负载包括多个子作业，单个子作业需要依次占用第一处理器、第二处理器、第三处理器和第四处理器。

进一步地，当具有多个OODA类工作负载同时占用同一块OODA多处理器计算卡时，使不同工作流作业依次占用各个处理器。

进一步地，每个计算板卡的共享内存与三个资源池互连接口直接相连，用于访问其他计算板卡处理器的通信接口。

本发明的有益效果为：该计算机板卡在处理具有OODA个独立步骤的工作流计算任务，可通过四处理器和共享板卡内存方式，以流水线方式处理工作流，实现“板卡级”多工作流并行执行，提高处理工作流的处理效率，实现对工作流任务的并行流水线加速。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，在这些附图中使用相同的参考标号来表示相同或相似的部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为本发明一个实施例的OODA多处理器的计算板卡结构示意图；

图2为本发明一个实施例的OODA工作流负载举例示意图；

图3为本发明一个实施例的单个OODA工作流负载包含多个子作业举例示意图。

具体实施方式

如图1所示的具有OODA多处理器的计算板卡，该计算办卡包括OODA四个具有不同计算功能的处理器，四个所述处理器通过调度控制器分配不同的工作流作业；在处理一项流式作业时，并按照预设的计算顺序依次顺序循环调用四个处理器，执行流式作业(即按照O1->O2->D3->A4->O1的顺序，循环执行)。

该计算机板卡在处理具有OODA个独立步骤的工作流计算任务，可通过四处理器和共享板卡内存方式，以流水线方式处理工作流，实现“板卡级”多工作流并行执行，提高处理工作流的处理效率，实现对工作流任务的并行流水线加速。

每个计算板卡的共享内存与三个资源池互连接口直接相连，用于访问其他计算板卡处理器的通信接口。各个所述处理器与同一个共享内存直连，且通过相互之间通过该共享内存进行分区间的数据传递。

四个所述处理器包括四个功能相互独立的第一处理器O1、第二处理器O2、第三处理器D3和第四处理器A4，四个处理器分配给的不同工作流作业分别如下：

如图2所示，所述第一处理器O1匹配有观察类算法，用于处理数据匹配类型作业，给图片通过分类设置标签；其匹配相应算法可包括数据压缩算法、图像标记算法和数据清洗算法。

所述第二处理器O2匹配有调整类算法，用于处理机器学习的训练类作业，根据数据分类得到的训练数据，实施训练；其匹配相应算法可包括人脸(特征)训练算法、敏感数据(特征)算法和线性回归算法。

所述第三处理器D3匹配有想定类算法，用于处理机器学习的推理类作业，根据训练得到的模型，实施推理；其匹配相应算法可包括数据预测算法、信号识别算法和图像识别算法。

所述第四处理器A4匹配有行动类算法，用于处理控制类算法作业，根据推理结果实施控制；其匹配相应算法可包括无人机飞行控制算法、机械臂控制算法和机器人控制算法。

此外，OODA类工作流负载可分为多个OODA处理流程。

如图3所示，一个OODA类工作负载包括多个子作业(Job)，单个子作业需要依次占用第一处理器O1、第二处理器O2、第三处理器D3和第四处理器A4。当具有多个OODA类工作负载同时占用同一块OODA多处理器计算卡时，使不同工作流作业依次占用各个处理器，提高流水线处理效率。

在处理具有多于四个步骤的工作流作业时，利用共享内存与三个资源池互连接口直接相连的设计，可利用其它计算板卡处理单独计算板卡之外的作业步骤，并行形成流水线，使得该计算机板卡的任务规模变得可扩展。

最后说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的宗旨和范围，其均应涵盖在本发明的权利要求范围当中。

Claims

1.一种具有OODA多处理器的计算板卡，其特征在于，包括OODA四个具有不同计算功能的处理器，四个所述处理器通过调度控制器分配不同的工作流作业；在处理一项流式作业时，并按照预设的计算顺序依次顺序循环调用四个处理器，执行流式作业；

各个所述处理器与同一个共享内存直连，且相互之间通过该共享内存进行分区间的数据传递；

四个所述处理器包括第一处理器、第二处理器、第三处理器和第四处理器；所述第一处理器匹配有观察类算法，用于处理数据匹配类型作业；所述第二处理器匹配有调整类算法，用于处理机器学习的训练类作业；所述第三处理器匹配有想定类算法，用于处理机器学习的推理类作业；所述第四处理器匹配有行动类算法，用于处理控制类算法作业；

每个计算板卡的共享内存与三个资源池互连接口直接相连，用于访问其他计算板卡处理器的通信接口。

2.根据权利要求1所述的具有OODA多处理器的计算板卡，其特征在于，OODA类工作流负载可分为多个OODA处理流程，一个OODA类工作负载包括多个子作业，单个子作业需要依次占用第一处理器、第二处理器、第三处理器和第四处理器。

3.根据权利要求2所述的具有OODA多处理器的计算板卡，其特征在于，当具有多个OODA类工作负载同时占用同一块OODA多处理器计算卡时，使不同工作流作业依次占用各个处理器。