CN111813453B - 具有ooda多处理器的计算板卡 - Google Patents

具有ooda多处理器的计算板卡 Download PDF

Info

Publication number
CN111813453B
CN111813453B CN202010866776.7A CN202010866776A CN111813453B CN 111813453 B CN111813453 B CN 111813453B CN 202010866776 A CN202010866776 A CN 202010866776A CN 111813453 B CN111813453 B CN 111813453B
Authority
CN
China
Prior art keywords
ooda
processor
processors
class
computing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010866776.7A
Other languages
English (en)
Other versions
CN111813453A (zh
Inventor
谭光明
邵恩
张春明
段勃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Western Institute Of Advanced Technology Institute Of Computing Chinese Academy Of Sciences
Original Assignee
Western Institute Of Advanced Technology Institute Of Computing Chinese Academy Of Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Western Institute Of Advanced Technology Institute Of Computing Chinese Academy Of Sciences filed Critical Western Institute Of Advanced Technology Institute Of Computing Chinese Academy Of Sciences
Publication of CN111813453A publication Critical patent/CN111813453A/zh
Application granted granted Critical
Publication of CN111813453B publication Critical patent/CN111813453B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3836Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution
    • G06F9/3851Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution from multiple instruction streams, e.g. multistreaming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/544Buffers; Shared memory; Pipes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5011Pool
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Multi Processors (AREA)

Abstract

本发明公开了一种具有OODA多处理器的计算板卡,该计算板卡包括OODA四个具有不同计算功能的处理器,四个所述处理器通过调度控制器分配不同的工作流作业;在处理一项流式作业时,并按照预设的计算顺序依次顺序循环调用四个处理器,执行流式作业。四个处理器在处理OODA工作流负载时,分别执行观察、调整、想定、行动在内的四类计算算法,并根据OODA工作负载对不同处理器依次占用的特点,使多个OODA工作负载依次占用不同处理器,提高负载流水线执行效率。

Description

具有OODA多处理器的计算板卡
技术领域
本发明涉及一种具有OODA多处理器的计算板卡。
背景技术
随着具有前后依赖关系的OODA类工作流(Workflow)计算任务,逐渐成为主要计算负载,针对计算板卡的结构设计逐渐向“流式”化处理计算负载的设计思路延伸。然而,现有板卡设计难以保证以计算板卡能够高效的流水线方式执行OODA类工作流负载。
OODA环(OODA Loop)理论最早由美国空军上校John Boyd于1966年提出,是用于描述军事指挥决策过程的主要模型框架。OODA环依次由:观察(Observe),调整(Orient),想定(Decide),行动(Act),在内共四步以循环方式执行军事决策。OODA环理论完成决策或复杂问题的思维过程,整是人脑理性思维的思维定式。
发明内容
本发明的目的是提供一种具有OODA多处理器的计算板卡,以解决现有板卡设计难以保证以计算板卡能够高效的流水线方式执行OODA类工作流负载的问题。
为解决上述技术问题,本发明提供一种具有OODA多处理器的计算板卡,包括OODA四个具有不同计算功能的处理器,四个所述处理器通过调度控制器分配不同的工作流作业;在处理一项流式作业时,并按照预设的计算顺序依次顺序循环调用四个处理器,执行流式作业。
进一步地,各个所述处理器与同一个共享内存直连,且通过相互之间通过该共享内存进行分区间的数据传递。
进一步地,四个所述处理器包括第一处理器、第二处理器、第三处理器和第四处理器;所述第一处理器匹配有观察类算法,用于处理数据匹配类型作业;所述第二处理器匹配有调整类算法,用于处理机器学习的训练类作业;所述第三处理器匹配有想定类算法,用于处理机器学习的推理类作业;所述第四处理器匹配有行动类算法,用于处理控制类算法作业。
进一步地,OODA类工作流负载可分为多个OODA处理流程,一个OODA类工作负载包括多个子作业,单个子作业需要依次占用第一处理器、第二处理器、第三处理器和第四处理器。
进一步地,当具有多个OODA类工作负载同时占用同一块OODA多处理器计算卡时,使不同工作流作业依次占用各个处理器。
进一步地,每个计算板卡的共享内存与三个资源池互连接口直接相连,用于访问其他计算板卡处理器的通信接口。
本发明的有益效果为:该计算机板卡在处理具有OODA个独立步骤的工作流计算任务,可通过四处理器和共享板卡内存方式,以流水线方式处理工作流,实现“板卡级”多工作流并行执行,提高处理工作流的处理效率,实现对工作流任务的并行流水线加速。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,在这些附图中使用相同的参考标号来表示相同或相似的部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本发明一个实施例的OODA多处理器的计算板卡结构示意图;
图2为本发明一个实施例的OODA工作流负载举例示意图;
图3为本发明一个实施例的单个OODA工作流负载包含多个子作业举例示意图。
具体实施方式
如图1所示的具有OODA多处理器的计算板卡,该计算办卡包括OODA四个具有不同计算功能的处理器,四个所述处理器通过调度控制器分配不同的工作流作业;在处理一项流式作业时,并按照预设的计算顺序依次顺序循环调用四个处理器,执行流式作业(即按照O1->O2->D3->A4->O1的顺序,循环执行)。
该计算机板卡在处理具有OODA个独立步骤的工作流计算任务,可通过四处理器和共享板卡内存方式,以流水线方式处理工作流,实现“板卡级”多工作流并行执行,提高处理工作流的处理效率,实现对工作流任务的并行流水线加速。
每个计算板卡的共享内存与三个资源池互连接口直接相连,用于访问其他计算板卡处理器的通信接口。各个所述处理器与同一个共享内存直连,且通过相互之间通过该共享内存进行分区间的数据传递。
四个所述处理器包括四个功能相互独立的第一处理器O1、第二处理器O2、第三处理器D3和第四处理器A4,四个处理器分配给的不同工作流作业分别如下:
如图2所示,所述第一处理器O1匹配有观察类算法,用于处理数据匹配类型作业,给图片通过分类设置标签;其匹配相应算法可包括数据压缩算法、图像标记算法和数据清洗算法。
所述第二处理器O2匹配有调整类算法,用于处理机器学习的训练类作业,根据数据分类得到的训练数据,实施训练;其匹配相应算法可包括人脸(特征)训练算法、敏感数据(特征)算法和线性回归算法。
所述第三处理器D3匹配有想定类算法,用于处理机器学习的推理类作业,根据训练得到的模型,实施推理;其匹配相应算法可包括数据预测算法、信号识别算法和图像识别算法。
所述第四处理器A4匹配有行动类算法,用于处理控制类算法作业,根据推理结果实施控制;其匹配相应算法可包括无人机飞行控制算法、机械臂控制算法和机器人控制算法。
此外,OODA类工作流负载可分为多个OODA处理流程。
如图3所示,一个OODA类工作负载包括多个子作业(Job),单个子作业需要依次占用第一处理器O1、第二处理器O2、第三处理器D3和第四处理器A4。当具有多个OODA类工作负载同时占用同一块OODA多处理器计算卡时,使不同工作流作业依次占用各个处理器,提高流水线处理效率。
在处理具有多于四个步骤的工作流作业时,利用共享内存与三个资源池互连接口直接相连的设计,可利用其它计算板卡处理单独计算板卡之外的作业步骤,并行形成流水线,使得该计算机板卡的任务规模变得可扩展。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (3)

1.一种具有OODA多处理器的计算板卡,其特征在于,包括OODA四个具有不同计算功能的处理器,四个所述处理器通过调度控制器分配不同的工作流作业;在处理一项流式作业时,并按照预设的计算顺序依次顺序循环调用四个处理器,执行流式作业;
各个所述处理器与同一个共享内存直连,且相互之间通过该共享内存进行分区间的数据传递;
四个所述处理器包括第一处理器、第二处理器、第三处理器和第四处理器;所述第一处理器匹配有观察类算法,用于处理数据匹配类型作业;所述第二处理器匹配有调整类算法,用于处理机器学习的训练类作业;所述第三处理器匹配有想定类算法,用于处理机器学习的推理类作业;所述第四处理器匹配有行动类算法,用于处理控制类算法作业;
每个计算板卡的共享内存与三个资源池互连接口直接相连,用于访问其他计算板卡处理器的通信接口。
2.根据权利要求1所述的具有OODA多处理器的计算板卡,其特征在于,OODA类工作流负载可分为多个OODA处理流程,一个OODA类工作负载包括多个子作业,单个子作业需要依次占用第一处理器、第二处理器、第三处理器和第四处理器。
3.根据权利要求2所述的具有OODA多处理器的计算板卡,其特征在于,当具有多个OODA类工作负载同时占用同一块OODA多处理器计算卡时,使不同工作流作业依次占用各个处理器。
CN202010866776.7A 2020-04-30 2020-08-25 具有ooda多处理器的计算板卡 Active CN111813453B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010363731.8A CN111506349A (zh) 2020-04-30 2020-04-30 具有ooda多处理器的计算板卡
CN2020103637318 2020-04-30

Publications (2)

Publication Number Publication Date
CN111813453A CN111813453A (zh) 2020-10-23
CN111813453B true CN111813453B (zh) 2023-08-01

Family

ID=71869699

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202010363731.8A Pending CN111506349A (zh) 2020-04-30 2020-04-30 具有ooda多处理器的计算板卡
CN202010866776.7A Active CN111813453B (zh) 2020-04-30 2020-08-25 具有ooda多处理器的计算板卡

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202010363731.8A Pending CN111506349A (zh) 2020-04-30 2020-04-30 具有ooda多处理器的计算板卡

Country Status (1)

Country Link
CN (2) CN111506349A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105892480A (zh) * 2016-03-21 2016-08-24 南京航空航天大学 异构多无人机系统协同察打任务自组织方法
CN109542516A (zh) * 2018-11-13 2019-03-29 西安邮电大学 一种加速arm处理器并行工作系统及其工作方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130088352A1 (en) * 2011-10-06 2013-04-11 David Amis Systems and methods utilizing sensory overload to deter, delay, or disrupt a potential threat
WO2016153790A1 (en) * 2015-03-23 2016-09-29 Oracle International Corporation Knowledge-intensive data processing system
CN107783839A (zh) * 2017-09-05 2018-03-09 中国科学院空间应用工程与技术中心 一种多载荷数据处理方法及系统
CN109901820B (zh) * 2019-01-17 2022-03-04 西北工业大学 一种符合do-178b/c的机载软件敏捷开发过程的优化方法
CN209512643U (zh) * 2019-02-02 2019-10-18 河南黄烨科技有限公司 基于无线vr/ar/mr技术的瞄准系统
CN110034961B (zh) * 2019-04-11 2022-02-15 重庆邮电大学 以ooda链为元体的渗率计算方法
CN111080258B (zh) * 2019-12-18 2020-11-17 中国人民解放军军事科学院国防科技创新研究院 一种基于角色状态机的群体无人系统协同任务管理子系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105892480A (zh) * 2016-03-21 2016-08-24 南京航空航天大学 异构多无人机系统协同察打任务自组织方法
CN109542516A (zh) * 2018-11-13 2019-03-29 西安邮电大学 一种加速arm处理器并行工作系统及其工作方法

Also Published As

Publication number Publication date
CN111813453A (zh) 2020-10-23
CN111506349A (zh) 2020-08-07

Similar Documents

Publication Publication Date Title
CN107704922B (zh) 人工神经网络处理装置
CN107679620B (zh) 人工神经网络处理装置
CN107679621B (zh) 人工神经网络处理装置
US9798551B2 (en) Scalable compute fabric
US11789895B2 (en) On-chip heterogeneous AI processor with distributed tasks queues allowing for parallel task execution
US11782870B2 (en) Configurable heterogeneous AI processor with distributed task queues allowing parallel task execution
US9146777B2 (en) Parallel processing with solidarity cells by proactively retrieving from a task pool a matching task for the solidarity cell to process
US10783436B2 (en) Deep learning application distribution
WO2017185336A1 (zh) 用于执行pooling运算的装置和方法
US20200371835A1 (en) Method And Apparatus For Scheduling Matrix Operations In Digital Processing Systems
US20120233621A1 (en) Method, program, and parallel computer system for scheduling plurality of computation processes including all-to-all communications (a2a) among plurality of nodes (processors) constituting network
CN111209094A (zh) 请求处理方法、装置、电子设备及计算机可读存储介质
CN111813453B (zh) 具有ooda多处理器的计算板卡
KR100590764B1 (ko) 멀티프로세서 시스템에서 스케줄러를 이용한 대규모데이터 처리 방법
DE112022000723T5 (de) Verzweigungsvorgang für eine schaltung eines neuronalen prozessors
WO2021179222A1 (zh) 一种调度装置、调度方法、加速系统及无人机
CN111767133A (zh) 用于可重配置脉动阵列的系统和方法
CN111984328B (zh) 具有ooda循环分区机制的流式处理器
CN111858073B (zh) 具有ooda多分区可替换机制的处理器
CN111813562B (zh) 具有ooda多分区io资源池机制的服务器主机
Patil et al. Review on a comparative study of various task scheduling algorithm in cloud computing environment
Ercan et al. Scheduling image processing tasks in a multilayer system
De Giusti et al. Towards a Malleable Tensorflow Implementation
US20120272045A1 (en) Control method and system of multiprocessor
Bondarenko et al. Development of an algorithm for resource allocation in distributed systems based on two-criteria process assessment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant