CN111813453A - 具有ooda多处理器的计算板卡 - Google Patents

具有ooda多处理器的计算板卡 Download PDF

Info

Publication number
CN111813453A
CN111813453A CN202010866776.7A CN202010866776A CN111813453A CN 111813453 A CN111813453 A CN 111813453A CN 202010866776 A CN202010866776 A CN 202010866776A CN 111813453 A CN111813453 A CN 111813453A
Authority
CN
China
Prior art keywords
ooda
processor
processors
multiprocessor
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010866776.7A
Other languages
English (en)
Other versions
CN111813453B (zh
Inventor
谭光明
邵恩
张春明
段勃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Western Institute Of Advanced Technology Institute Of Computing Chinese Academy Of Sciences
Original Assignee
Western Institute Of Advanced Technology Institute Of Computing Chinese Academy Of Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Western Institute Of Advanced Technology Institute Of Computing Chinese Academy Of Sciences filed Critical Western Institute Of Advanced Technology Institute Of Computing Chinese Academy Of Sciences
Publication of CN111813453A publication Critical patent/CN111813453A/zh
Application granted granted Critical
Publication of CN111813453B publication Critical patent/CN111813453B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3836Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution
    • G06F9/3851Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution from multiple instruction streams, e.g. multistreaming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/544Buffers; Shared memory; Pipes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5011Pool
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Multi Processors (AREA)

Abstract

本发明公开了一种具有OODA多处理器的计算板卡,该计算板卡包括OODA四个具有不同计算功能的处理器,四个所述处理器通过调度控制器分配不同的工作流作业;在处理一项流式作业时,并按照预设的计算顺序依次顺序循环调用四个处理器,执行流式作业。四个处理器在处理OODA工作流负载时,分别执行观察、调整、想定、行动在内的四类计算算法,并根据OODA工作负载对不同处理器依次占用的特点,使多个OODA工作负载依次占用不同处理器,提高负载流水线执行效率。

Description

具有OODA多处理器的计算板卡
技术领域
本发明涉及一种具有OODA多处理器的计算板卡。
背景技术
随着具有前后依赖关系的OODA类工作流(Workflow)计算任务,逐渐成为主要计算负载,针对计算板卡的结构设计逐渐向“流式”化处理计算负载的设计思路延伸。然而,现有板卡设计难以保证以计算板卡能够高效的流水线方式执行OODA类工作流负载。
OODA环(OODA Loop)理论最早由美国空军上校John Boyd于1966年提出,是用于描述军事指挥决策过程的主要模型框架。OODA环依次由:观察(Observe),调整(Orient),想定(Decide),行动(Act),在内共四步以循环方式执行军事决策。OODA环理论完成决策或复杂问题的思维过程,整是人脑理性思维的思维定式。
发明内容
本发明的目的是提供一种具有OODA多处理器的计算板卡,以解决现有板卡设计难以保证以计算板卡能够高效的流水线方式执行OODA类工作流负载的问题。
为解决上述技术问题,本发明提供一种具有OODA多处理器的计算板卡,包括OODA四个具有不同计算功能的处理器,四个所述处理器通过调度控制器分配不同的工作流作业;在处理一项流式作业时,并按照预设的计算顺序依次顺序循环调用四个处理器,执行流式作业。
进一步地,各个所述处理器与同一个共享内存直连,且通过相互之间通过该共享内存进行分区间的数据传递。
进一步地,四个所述处理器包括第一处理器、第二处理器、第三处理器和第四处理器;所述第一处理器匹配有观察类算法,用于处理数据匹配类型作业;所述第二处理器匹配有调整类算法,用于处理机器学习的训练类作业;所述第三处理器匹配有想定类算法,用于处理机器学习的推理类作业;所述第四处理器匹配有行动类算法,用于处理控制类算法作业。
进一步地,OODA类工作流负载可分为多个OODA处理流程,一个OODA类工作负载包括多个子作业,单个子作业需要依次占用第一处理器、第二处理器、第三处理器和第四处理器。
进一步地,当具有多个OODA类工作负载同时占用同一块OODA多处理器计算卡时,使不同工作流作业依次占用各个处理器。
进一步地,每个计算板卡的共享内存与三个资源池互连接口直接相连,用于访问其他计算板卡处理器的通信接口。
本发明的有益效果为:该计算机板卡在处理具有OODA个独立步骤的工作流计算任务,可通过四处理器和共享板卡内存方式,以流水线方式处理工作流,实现“板卡级”多工作流并行执行,提高处理工作流的处理效率,实现对工作流任务的并行流水线加速。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,在这些附图中使用相同的参考标号来表示相同或相似的部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本发明一个实施例的OODA多处理器的计算板卡结构示意图;
图2为本发明一个实施例的OODA工作流负载举例示意图;
图3为本发明一个实施例的单个OODA工作流负载包含多个子作业举例示意图。
具体实施方式
如图1所示的具有OODA多处理器的计算板卡,该计算办卡包括OODA四个具有不同计算功能的处理器,四个所述处理器通过调度控制器分配不同的工作流作业;在处理一项流式作业时,并按照预设的计算顺序依次顺序循环调用四个处理器,执行流式作业(即按照O1->O2->D3->A4->O1的顺序,循环执行)。
该计算机板卡在处理具有OODA个独立步骤的工作流计算任务,可通过四处理器和共享板卡内存方式,以流水线方式处理工作流,实现“板卡级”多工作流并行执行,提高处理工作流的处理效率,实现对工作流任务的并行流水线加速。
每个计算板卡的共享内存与三个资源池互连接口直接相连,用于访问其他计算板卡处理器的通信接口。各个所述处理器与同一个共享内存直连,且通过相互之间通过该共享内存进行分区间的数据传递。
四个所述处理器包括四个功能相互独立的第一处理器O1、第二处理器O2、第三处理器D3和第四处理器A4,四个处理器分配给的不同工作流作业分别如下:
如图2所示,所述第一处理器O1匹配有观察类算法,用于处理数据匹配类型作业,给图片通过分类设置标签;其匹配相应算法可包括数据压缩算法、图像标记算法和数据清洗算法。
所述第二处理器O2匹配有调整类算法,用于处理机器学习的训练类作业,根据数据分类得到的训练数据,实施训练;其匹配相应算法可包括人脸(特征)训练算法、敏感数据(特征)算法和线性回归算法。
所述第三处理器D3匹配有想定类算法,用于处理机器学习的推理类作业,根据训练得到的模型,实施推理;其匹配相应算法可包括数据预测算法、信号识别算法和图像识别算法。
所述第四处理器A4匹配有行动类算法,用于处理控制类算法作业,根据推理结果实施控制;其匹配相应算法可包括无人机飞行控制算法、机械臂控制算法和机器人控制算法。
此外,OODA类工作流负载可分为多个OODA处理流程。
如图3所示,一个OODA类工作负载包括多个子作业(Job),单个子作业需要依次占用第一处理器O1、第二处理器O2、第三处理器D3和第四处理器A4。当具有多个OODA类工作负载同时占用同一块OODA多处理器计算卡时,使不同工作流作业依次占用各个处理器,提高流水线处理效率。
在处理具有多于四个步骤的工作流作业时,利用共享内存与三个资源池互连接口直接相连的设计,可利用其它计算板卡处理单独计算板卡之外的作业步骤,并行形成流水线,使得该计算机板卡的任务规模变得可扩展。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (6)

1.一种具有OODA多处理器的计算板卡,其特征在于,包括OODA四个具有不同计算功能的处理器,四个所述处理器通过调度控制器分配不同的工作流作业;在处理一项流式作业时,并按照预设的计算顺序依次顺序循环调用四个处理器,执行流式作业。
2.根据权利要求1所述的具有OODA多处理器的计算板卡,其特征在于,各个所述处理器与同一个共享内存直连,且通过相互之间通过该共享内存进行分区间的数据传递。
3.根据权利要求2所述的具有OODA多处理器的计算板卡,其特征在于,四个所述处理器包括第一处理器、第二处理器、第三处理器和第四处理器;所述第一处理器匹配有观察类算法,用于处理数据匹配类型作业;所述第二处理器匹配有调整类算法,用于处理机器学习的训练类作业;所述第三处理器匹配有想定类算法,用于处理机器学习的推理类作业;所述第四处理器匹配有行动类算法,用于处理控制类算法作业。
4.根据权利要求3所述的具有OODA多处理器的计算板卡,其特征在于,OODA类工作流负载可分为多个OODA处理流程,一个OODA类工作负载包括多个子作业,单个子作业需要依次占用第一处理器、第二处理器、第三处理器和第四处理器。
5.根据权利要求4所述的具有OODA多处理器的计算板卡,其特征在于,当具有多个OODA类工作负载同时占用同一块OODA多处理器计算卡时,使不同工作流作业依次占用各个处理器。
6.根据权利要求1所述的具有OODA多处理器的计算板卡,其特征在于,每个计算板卡的共享内存与三个资源池互连接口直接相连,用于访问其他计算板卡处理器的通信接口。
CN202010866776.7A 2020-04-30 2020-08-25 具有ooda多处理器的计算板卡 Active CN111813453B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010363731.8A CN111506349A (zh) 2020-04-30 2020-04-30 具有ooda多处理器的计算板卡
CN2020103637318 2020-04-30

Publications (2)

Publication Number Publication Date
CN111813453A true CN111813453A (zh) 2020-10-23
CN111813453B CN111813453B (zh) 2023-08-01

Family

ID=71869699

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202010363731.8A Pending CN111506349A (zh) 2020-04-30 2020-04-30 具有ooda多处理器的计算板卡
CN202010866776.7A Active CN111813453B (zh) 2020-04-30 2020-08-25 具有ooda多处理器的计算板卡

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202010363731.8A Pending CN111506349A (zh) 2020-04-30 2020-04-30 具有ooda多处理器的计算板卡

Country Status (1)

Country Link
CN (2) CN111506349A (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130088352A1 (en) * 2011-10-06 2013-04-11 David Amis Systems and methods utilizing sensory overload to deter, delay, or disrupt a potential threat
CN105892480A (zh) * 2016-03-21 2016-08-24 南京航空航天大学 异构多无人机系统协同察打任务自组织方法
CN107430613A (zh) * 2015-03-23 2017-12-01 甲骨文国际公司 知识密集型数据处理系统
CN107783839A (zh) * 2017-09-05 2018-03-09 中国科学院空间应用工程与技术中心 一种多载荷数据处理方法及系统
CN109542516A (zh) * 2018-11-13 2019-03-29 西安邮电大学 一种加速arm处理器并行工作系统及其工作方法
CN109901820A (zh) * 2019-01-17 2019-06-18 西北工业大学 一种符合do-178b/c的机载软件敏捷开发过程的优化方法
CN110034961A (zh) * 2019-04-11 2019-07-19 重庆邮电大学 以ooda链为元体的渗率计算方法
CN209512643U (zh) * 2019-02-02 2019-10-18 河南黄烨科技有限公司 基于无线vr/ar/mr技术的瞄准系统
CN111080258A (zh) * 2019-12-18 2020-04-28 中国人民解放军军事科学院国防科技创新研究院 一种基于角色状态机的群体无人系统协同任务管理子系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130088352A1 (en) * 2011-10-06 2013-04-11 David Amis Systems and methods utilizing sensory overload to deter, delay, or disrupt a potential threat
CN107430613A (zh) * 2015-03-23 2017-12-01 甲骨文国际公司 知识密集型数据处理系统
CN105892480A (zh) * 2016-03-21 2016-08-24 南京航空航天大学 异构多无人机系统协同察打任务自组织方法
CN107783839A (zh) * 2017-09-05 2018-03-09 中国科学院空间应用工程与技术中心 一种多载荷数据处理方法及系统
CN109542516A (zh) * 2018-11-13 2019-03-29 西安邮电大学 一种加速arm处理器并行工作系统及其工作方法
CN109901820A (zh) * 2019-01-17 2019-06-18 西北工业大学 一种符合do-178b/c的机载软件敏捷开发过程的优化方法
CN209512643U (zh) * 2019-02-02 2019-10-18 河南黄烨科技有限公司 基于无线vr/ar/mr技术的瞄准系统
CN110034961A (zh) * 2019-04-11 2019-07-19 重庆邮电大学 以ooda链为元体的渗率计算方法
CN111080258A (zh) * 2019-12-18 2020-04-28 中国人民解放军军事科学院国防科技创新研究院 一种基于角色状态机的群体无人系统协同任务管理子系统

Also Published As

Publication number Publication date
CN111506349A (zh) 2020-08-07
CN111813453B (zh) 2023-08-01

Similar Documents

Publication Publication Date Title
US11442785B2 (en) Computation method and product thereof
CN107704922B (zh) 人工神经网络处理装置
CN107679621B (zh) 人工神经网络处理装置
US9798551B2 (en) Scalable compute fabric
US9146777B2 (en) Parallel processing with solidarity cells by proactively retrieving from a task pool a matching task for the solidarity cell to process
CN106663021B (zh) 虚拟化环境中的智能gpu调度
WO2019001418A1 (zh) 数据共享系统及其数据共享方法
CN110300959B (zh) 用于动态运行时任务管理的方法、系统、设备、装置和介质
CN111209094A (zh) 请求处理方法、装置、电子设备及计算机可读存储介质
CN105242954A (zh) 一种虚拟cpu与物理cpu之间的映射方法及电子设备
WO2021113007A1 (en) Apparatus and methods for virtualization
CN111813453A (zh) 具有ooda多处理器的计算板卡
CN111813562B (zh) 具有ooda多分区io资源池机制的服务器主机
CN111984328B (zh) 具有ooda循环分区机制的流式处理器
JP7347537B2 (ja) 分散処理システム
CN111858073B (zh) 具有ooda多分区可替换机制的处理器
De Giusti et al. Towards a Malleable Tensorflow Implementation
CN117311941A (zh) 图像处理方法及相关设备
KR20240041159A (ko) Cpu-gpu 협업 시스템 및 방법
CN111586144A (zh) 具有ooda分形机制的计算机群构建方法
CN115964164A (zh) 计算机实现的方法、硬件加速器以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant