CN111813453B - 具有ooda多处理器的计算板卡 - Google Patents
具有ooda多处理器的计算板卡 Download PDFInfo
- Publication number
- CN111813453B CN111813453B CN202010866776.7A CN202010866776A CN111813453B CN 111813453 B CN111813453 B CN 111813453B CN 202010866776 A CN202010866776 A CN 202010866776A CN 111813453 B CN111813453 B CN 111813453B
- Authority
- CN
- China
- Prior art keywords
- ooda
- processor
- processors
- class
- computing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 claims abstract description 22
- 238000000034 method Methods 0.000 claims abstract description 8
- 238000004364 calculation method Methods 0.000 claims abstract description 6
- 230000006870 function Effects 0.000 claims abstract description 5
- 238000012549 training Methods 0.000 claims description 7
- 238000010801 machine learning Methods 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 claims description 3
- 238000004891 communication Methods 0.000 claims description 3
- 238000005192 partition Methods 0.000 claims description 3
- 238000013461 design Methods 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- RZVHIXYEVGDQDX-UHFFFAOYSA-N 9,10-anthraquinone Chemical compound C1=CC=C2C(=O)C3=CC=CC=C3C(=O)C2=C1 RZVHIXYEVGDQDX-UHFFFAOYSA-N 0.000 description 1
- 241001522296 Erithacus rubecula Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011112 process operation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3836—Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution
- G06F9/3851—Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution from multiple instruction streams, e.g. multistreaming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/54—Interprogram communication
- G06F9/544—Buffers; Shared memory; Pipes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/5011—Pool
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Multi Processors (AREA)
Abstract
本发明公开了一种具有OODA多处理器的计算板卡,该计算板卡包括OODA四个具有不同计算功能的处理器,四个所述处理器通过调度控制器分配不同的工作流作业;在处理一项流式作业时,并按照预设的计算顺序依次顺序循环调用四个处理器,执行流式作业。四个处理器在处理OODA工作流负载时,分别执行观察、调整、想定、行动在内的四类计算算法,并根据OODA工作负载对不同处理器依次占用的特点,使多个OODA工作负载依次占用不同处理器,提高负载流水线执行效率。
Description
技术领域
本发明涉及一种具有OODA多处理器的计算板卡。
背景技术
随着具有前后依赖关系的OODA类工作流(Workflow)计算任务,逐渐成为主要计算负载,针对计算板卡的结构设计逐渐向“流式”化处理计算负载的设计思路延伸。然而,现有板卡设计难以保证以计算板卡能够高效的流水线方式执行OODA类工作流负载。
OODA环(OODA Loop)理论最早由美国空军上校John Boyd于1966年提出,是用于描述军事指挥决策过程的主要模型框架。OODA环依次由:观察(Observe),调整(Orient),想定(Decide),行动(Act),在内共四步以循环方式执行军事决策。OODA环理论完成决策或复杂问题的思维过程,整是人脑理性思维的思维定式。
发明内容
本发明的目的是提供一种具有OODA多处理器的计算板卡,以解决现有板卡设计难以保证以计算板卡能够高效的流水线方式执行OODA类工作流负载的问题。
为解决上述技术问题,本发明提供一种具有OODA多处理器的计算板卡,包括OODA四个具有不同计算功能的处理器,四个所述处理器通过调度控制器分配不同的工作流作业;在处理一项流式作业时,并按照预设的计算顺序依次顺序循环调用四个处理器,执行流式作业。
进一步地,各个所述处理器与同一个共享内存直连,且通过相互之间通过该共享内存进行分区间的数据传递。
进一步地,四个所述处理器包括第一处理器、第二处理器、第三处理器和第四处理器;所述第一处理器匹配有观察类算法,用于处理数据匹配类型作业;所述第二处理器匹配有调整类算法,用于处理机器学习的训练类作业;所述第三处理器匹配有想定类算法,用于处理机器学习的推理类作业;所述第四处理器匹配有行动类算法,用于处理控制类算法作业。
进一步地,OODA类工作流负载可分为多个OODA处理流程,一个OODA类工作负载包括多个子作业,单个子作业需要依次占用第一处理器、第二处理器、第三处理器和第四处理器。
进一步地,当具有多个OODA类工作负载同时占用同一块OODA多处理器计算卡时,使不同工作流作业依次占用各个处理器。
进一步地,每个计算板卡的共享内存与三个资源池互连接口直接相连,用于访问其他计算板卡处理器的通信接口。
本发明的有益效果为:该计算机板卡在处理具有OODA个独立步骤的工作流计算任务,可通过四处理器和共享板卡内存方式,以流水线方式处理工作流,实现“板卡级”多工作流并行执行,提高处理工作流的处理效率,实现对工作流任务的并行流水线加速。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,在这些附图中使用相同的参考标号来表示相同或相似的部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本发明一个实施例的OODA多处理器的计算板卡结构示意图;
图2为本发明一个实施例的OODA工作流负载举例示意图;
图3为本发明一个实施例的单个OODA工作流负载包含多个子作业举例示意图。
具体实施方式
如图1所示的具有OODA多处理器的计算板卡,该计算办卡包括OODA四个具有不同计算功能的处理器,四个所述处理器通过调度控制器分配不同的工作流作业;在处理一项流式作业时,并按照预设的计算顺序依次顺序循环调用四个处理器,执行流式作业(即按照O1->O2->D3->A4->O1的顺序,循环执行)。
该计算机板卡在处理具有OODA个独立步骤的工作流计算任务,可通过四处理器和共享板卡内存方式,以流水线方式处理工作流,实现“板卡级”多工作流并行执行,提高处理工作流的处理效率,实现对工作流任务的并行流水线加速。
每个计算板卡的共享内存与三个资源池互连接口直接相连,用于访问其他计算板卡处理器的通信接口。各个所述处理器与同一个共享内存直连,且通过相互之间通过该共享内存进行分区间的数据传递。
四个所述处理器包括四个功能相互独立的第一处理器O1、第二处理器O2、第三处理器D3和第四处理器A4,四个处理器分配给的不同工作流作业分别如下:
如图2所示,所述第一处理器O1匹配有观察类算法,用于处理数据匹配类型作业,给图片通过分类设置标签;其匹配相应算法可包括数据压缩算法、图像标记算法和数据清洗算法。
所述第二处理器O2匹配有调整类算法,用于处理机器学习的训练类作业,根据数据分类得到的训练数据,实施训练;其匹配相应算法可包括人脸(特征)训练算法、敏感数据(特征)算法和线性回归算法。
所述第三处理器D3匹配有想定类算法,用于处理机器学习的推理类作业,根据训练得到的模型,实施推理;其匹配相应算法可包括数据预测算法、信号识别算法和图像识别算法。
所述第四处理器A4匹配有行动类算法,用于处理控制类算法作业,根据推理结果实施控制;其匹配相应算法可包括无人机飞行控制算法、机械臂控制算法和机器人控制算法。
此外,OODA类工作流负载可分为多个OODA处理流程。
如图3所示,一个OODA类工作负载包括多个子作业(Job),单个子作业需要依次占用第一处理器O1、第二处理器O2、第三处理器D3和第四处理器A4。当具有多个OODA类工作负载同时占用同一块OODA多处理器计算卡时,使不同工作流作业依次占用各个处理器,提高流水线处理效率。
在处理具有多于四个步骤的工作流作业时,利用共享内存与三个资源池互连接口直接相连的设计,可利用其它计算板卡处理单独计算板卡之外的作业步骤,并行形成流水线,使得该计算机板卡的任务规模变得可扩展。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (3)
1.一种具有OODA多处理器的计算板卡,其特征在于,包括OODA四个具有不同计算功能的处理器,四个所述处理器通过调度控制器分配不同的工作流作业;在处理一项流式作业时,并按照预设的计算顺序依次顺序循环调用四个处理器,执行流式作业;
各个所述处理器与同一个共享内存直连,且相互之间通过该共享内存进行分区间的数据传递;
四个所述处理器包括第一处理器、第二处理器、第三处理器和第四处理器;所述第一处理器匹配有观察类算法,用于处理数据匹配类型作业;所述第二处理器匹配有调整类算法,用于处理机器学习的训练类作业;所述第三处理器匹配有想定类算法,用于处理机器学习的推理类作业;所述第四处理器匹配有行动类算法,用于处理控制类算法作业;
每个计算板卡的共享内存与三个资源池互连接口直接相连,用于访问其他计算板卡处理器的通信接口。
2.根据权利要求1所述的具有OODA多处理器的计算板卡,其特征在于,OODA类工作流负载可分为多个OODA处理流程,一个OODA类工作负载包括多个子作业,单个子作业需要依次占用第一处理器、第二处理器、第三处理器和第四处理器。
3.根据权利要求2所述的具有OODA多处理器的计算板卡,其特征在于,当具有多个OODA类工作负载同时占用同一块OODA多处理器计算卡时,使不同工作流作业依次占用各个处理器。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010363731.8A CN111506349A (zh) | 2020-04-30 | 2020-04-30 | 具有ooda多处理器的计算板卡 |
CN2020103637318 | 2020-04-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111813453A CN111813453A (zh) | 2020-10-23 |
CN111813453B true CN111813453B (zh) | 2023-08-01 |
Family
ID=71869699
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010363731.8A Pending CN111506349A (zh) | 2020-04-30 | 2020-04-30 | 具有ooda多处理器的计算板卡 |
CN202010866776.7A Active CN111813453B (zh) | 2020-04-30 | 2020-08-25 | 具有ooda多处理器的计算板卡 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010363731.8A Pending CN111506349A (zh) | 2020-04-30 | 2020-04-30 | 具有ooda多处理器的计算板卡 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN111506349A (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105892480A (zh) * | 2016-03-21 | 2016-08-24 | 南京航空航天大学 | 异构多无人机系统协同察打任务自组织方法 |
CN109542516A (zh) * | 2018-11-13 | 2019-03-29 | 西安邮电大学 | 一种加速arm处理器并行工作系统及其工作方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130088352A1 (en) * | 2011-10-06 | 2013-04-11 | David Amis | Systems and methods utilizing sensory overload to deter, delay, or disrupt a potential threat |
WO2016153790A1 (en) * | 2015-03-23 | 2016-09-29 | Oracle International Corporation | Knowledge-intensive data processing system |
CN107783839A (zh) * | 2017-09-05 | 2018-03-09 | 中国科学院空间应用工程与技术中心 | 一种多载荷数据处理方法及系统 |
CN109901820B (zh) * | 2019-01-17 | 2022-03-04 | 西北工业大学 | 一种符合do-178b/c的机载软件敏捷开发过程的优化方法 |
CN209512643U (zh) * | 2019-02-02 | 2019-10-18 | 河南黄烨科技有限公司 | 基于无线vr/ar/mr技术的瞄准系统 |
CN110034961B (zh) * | 2019-04-11 | 2022-02-15 | 重庆邮电大学 | 以ooda链为元体的渗率计算方法 |
CN111080258B (zh) * | 2019-12-18 | 2020-11-17 | 中国人民解放军军事科学院国防科技创新研究院 | 一种基于角色状态机的群体无人系统协同任务管理子系统 |
-
2020
- 2020-04-30 CN CN202010363731.8A patent/CN111506349A/zh active Pending
- 2020-08-25 CN CN202010866776.7A patent/CN111813453B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105892480A (zh) * | 2016-03-21 | 2016-08-24 | 南京航空航天大学 | 异构多无人机系统协同察打任务自组织方法 |
CN109542516A (zh) * | 2018-11-13 | 2019-03-29 | 西安邮电大学 | 一种加速arm处理器并行工作系统及其工作方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111813453A (zh) | 2020-10-23 |
CN111506349A (zh) | 2020-08-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107704922B (zh) | 人工神经网络处理装置 | |
CN107679620B (zh) | 人工神经网络处理装置 | |
CN107679621B (zh) | 人工神经网络处理装置 | |
US9798551B2 (en) | Scalable compute fabric | |
US11789895B2 (en) | On-chip heterogeneous AI processor with distributed tasks queues allowing for parallel task execution | |
US11782870B2 (en) | Configurable heterogeneous AI processor with distributed task queues allowing parallel task execution | |
US9146777B2 (en) | Parallel processing with solidarity cells by proactively retrieving from a task pool a matching task for the solidarity cell to process | |
US10783436B2 (en) | Deep learning application distribution | |
WO2017185336A1 (zh) | 用于执行pooling运算的装置和方法 | |
US20200371835A1 (en) | Method And Apparatus For Scheduling Matrix Operations In Digital Processing Systems | |
US20120233621A1 (en) | Method, program, and parallel computer system for scheduling plurality of computation processes including all-to-all communications (a2a) among plurality of nodes (processors) constituting network | |
CN111209094A (zh) | 请求处理方法、装置、电子设备及计算机可读存储介质 | |
CN111813453B (zh) | 具有ooda多处理器的计算板卡 | |
KR100590764B1 (ko) | 멀티프로세서 시스템에서 스케줄러를 이용한 대규모데이터 처리 방법 | |
DE112022000723T5 (de) | Verzweigungsvorgang für eine schaltung eines neuronalen prozessors | |
WO2021179222A1 (zh) | 一种调度装置、调度方法、加速系统及无人机 | |
CN111767133A (zh) | 用于可重配置脉动阵列的系统和方法 | |
CN111984328B (zh) | 具有ooda循环分区机制的流式处理器 | |
CN111858073B (zh) | 具有ooda多分区可替换机制的处理器 | |
CN111813562B (zh) | 具有ooda多分区io资源池机制的服务器主机 | |
Patil et al. | Review on a comparative study of various task scheduling algorithm in cloud computing environment | |
Ercan et al. | Scheduling image processing tasks in a multilayer system | |
De Giusti et al. | Towards a Malleable Tensorflow Implementation | |
US20120272045A1 (en) | Control method and system of multiprocessor | |
Bondarenko et al. | Development of an algorithm for resource allocation in distributed systems based on two-criteria process assessment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |