CN102360309B - 片上多核异构系统的调度系统与调度执行方法 - Google Patents
片上多核异构系统的调度系统与调度执行方法 Download PDFInfo
- Publication number
- CN102360309B CN102360309B CN 201110299619 CN201110299619A CN102360309B CN 102360309 B CN102360309 B CN 102360309B CN 201110299619 CN201110299619 CN 201110299619 CN 201110299619 A CN201110299619 A CN 201110299619A CN 102360309 B CN102360309 B CN 102360309B
- Authority
- CN
- China
- Prior art keywords
- task
- module
- variable
- core
- scheduling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Multi Processors (AREA)
Abstract
本发明公开了一种片上多核异构系统的调度系统与调度执行方法,所述系统包括提供需要执行的任务的适用多个异构软硬件的用户服务模块、在片上多核计算平台执行多个任务的计算服务模块,其特征在于所述用户服务模块与计算服务模块间设置核心调度模块,所述核心调度模块接受用户服务模块的任务请求,通过记录判断不同任务之间的数据依赖关系,将任务请求并行地调度到不同的计算服务模块上执行;所述计算服务模块以
IP
核的形式封装,并通过可重构控制器实现
IP
核的动态加载;所述计算服务模块与片上多核异构系统的多个计算处理器片上互联,接受核心调度模块的指令执行不同类型的计算任务。该系统通过在运行时对任务进行相关性的监测和自动并行化来提高平台的吞吐率和系统的性能。
Description
技术领域
本发明属于片上多核计算平台的调度技术领域,具体涉及一种片上多核计算平台的任务调度系统及进行任务乱序执行方法。
背景技术
片上多核处理器已经成为多核处理器的研究发展方向。随着半导体技术的发展,片上能够集成的资源越来越多,片上多核系统,尤其是异构多核系统,可以发挥不同计算单元的优势,加速不同嵌入式应用的性能。采用异构体系结构的计算系统可同时利用多种计算模式,能够充分发挥不同计算模式在不同应用领域所具有的优势。因此,将各种可行的计算模式集成在一片芯片中,将成为当前的异构计算系统(特别是嵌入式计算系统)的发展趋势。
异构计算系统中存在着大量异构的计算逻辑单元,例如通用处理器、ASIP和可重构逻辑单元等等,以不同的计算模式实现的计算任务在执行特征上具有很大的差异。因此,如何将应用有效地划分为相应计算模式下运行的计算任务是异构计算系统设计中需要首先解决的问题。在异构计算系统中,主要存在着两种任务类型:运行在处理器(包括通用处理器和ASIP)上的软件任务和运行在可重构逻辑单元上的硬件任务。当前,计算系统的软硬件划分方法可以被分为三类:(1)由设计者显式地指定需要采用硬件方式执行的计算任务,这要求设计者具有相当程度的硬件电路设计知识,以便准确地获知哪些计算任务能够以硬件执行的方式获得较高的加速比;(2)通过软件剖析,将程序中耗时最多的一个或几个计算任务采用硬件方式执行,这忽略了软件任务与硬件任务在执行特征上的差异,未必能够获得优化的任务划分方案;(3)对于每个能够以硬件方式执行的计算任务,根据它的硬件执行时间(包括各种额外的时间开销,例如配置时间)与它的软件执行时间之间的比较结果,判定该任务究竟以何种方式运行,但是这种方法没有考虑任务执行的前驱/后继任务对其执行造成的影响,可能会发生资源空等的情况。综上所述,存在于异构计算系统中的硬件任务增加了计算任务划分的复杂度,如何合理地对软/硬件任务进行划分是亟待解决的难题。
在任务级并行问题中,不同任务之间有可能采用相同的变量而导致数据相关的产生,从而限制了任务并行。任务并行化中,常见的相关有写后读(RAW),写后写(WAW)和读后写(WAR)三种不同类型的相关,其中WAW和WAR为伪数据相关,可以通过调度算法或者编程模型来解决。目前较为成熟的解决方案大多采用并行编程来解决,例如OpenMP,MPI,Intel’s TBB,CUDA,OpenCL和Cilk等。然而这些编程模型大多依赖程序员对任务进行手动划分,从而在。从任务调度本身的策略来看,如果将每个任务抽象成一条“宏指令”来处理,则单核中解决指令集并行算法都可以扩展到多核的任务级来提高任务级并行性。由于片上多核系统上提供了充分的计算资源,为任务的高效运行提供了保证,因此,在此基础上提高任务集在多核平台上的乱序执行粒度是提高系统任务级并行性和吞吐率的一个有效手段。
总的来说,目前的并行编程模型中的任务并行调度方法中的任务划分和调度方法均需要程序员进行手动干预和配置,从而限制了平台能够获得的性能优化效果。本发明因此而来。
发明内容
为了克服背景技术中存在的不足,本发明的一个目的在于提供一个片上多核计算平台上的任务调度系统和利用所述任务调度系统所使用的任务乱序执行方法,通过在运行时对任务进行相关性的监测和自动并行化来提高平台的吞吐率和系统的性能。
为了解决现有技术中的这些问题,本发明提供的技术方案是:
一种片上多核异构系统的调度系统,包括提供需要执行的任务的适用多个异构软硬件的用户服务模块、在片上多核计算平台执行多个任务的计算服务模块,其特征在于所述用户服务模块与计算服务模块间设置核心调度模块,所述核心调度模块接受用户服务模块的任务请求,通过记录判断不同任务之间的数据依赖关系,将任务请求并行地调度到不同的计算服务模块上执行;所述计算服务模块以IP核的形式封装,并通过可重构控制器实现IP核的动态加载;所述计算服务模块与片上多核异构系统的多个计算处理器片上互联,接受核心调度模块的指令执行不同类型的计算任务。
优选的,所述片上多核计算平台的任务调度系统,其特征在于所述核心调度模块包括接受用户服务模块的若干个任务请求形成任务队列的任务队列、用来提供在指令发射到计算服务模块时对可能存在相关的数据进行相关判断和数据索引的变量状态表、用来标记平台中各个计算单元运行状态的功能部件状态表,以及用来保存变量值的变量表。
优选的,所述片上多核计算平台的任务调度系统,其特征在于所述变量状态表包括多个变量编号及各个变量目前被占用的功能部件编号。
优选的,所述片上多核计算平台的任务调度系统,其特征在于所述功能部件状态表包括若干个标记目前状态表中所执行的任务请求名称Name、当前任务请求的繁忙状态Busy、源操作数Fj和Fk、源操作数的标记位Qj和Qk,准备状态标记位Rj和Rk,以及目的操作数Fi的表项。
优选的,所述片上多核计算平台的任务调度系统,其特征在于所述变量表中存储了系统中所有变量的实际值。
本发明的另一目的在于提供一种片上多核系统的任务乱序执行方法,其特征在于所述方法包括以下步骤:
(1)用户服务模块提供新的服务请求,核心调度模块接收到请求后根据任务队列的状态判断是否将新的服务请求加入任务队列;当任务队列未满时加入任务队列;
(2)核心调度模块查询功能状态表,判断是否存在与任务对应的功能部件,并且判断新的服务请求采用的目标变量是否存在于变量表中;当变量表中没有任务将目标变量作为输出变量时,且变量表非满时,将变量加入变量状态表,并更新功能部件状态表;
(3)查询所述变量对应表中源操作数的空闲状态;若有源操作数仍处于忙的状态,则等待所有的源操作数均处于就绪状态;否则将实际值赋给源操作数Fj和Fk,并更新准备状态标记位Rj和Rk;
(4)当任务请求中的源数据都准备完毕之后,重新针对计算部件进行一次软硬件任务划分。此步骤中分别针对任务可能运行的功能部件的运行时间进行预估,从而获得一个运行时间最短的选择,将其对应的功能部件状态表进行更新。
(5)访问请求被发送到特定的计算服务模块;计算完毕之后,判断当前任务与所有之前的任务之间是否存在读后写相关,如果是进行等待,直到相关消除则将变量值更新到变量表中,并将变量状态表中的Busy状态修改为no。
优选的,所述方法步骤(2)中更新功能部件状态表时,包括Name更新为目标功能部件、Busy更新为yes、并更新源操作数Fj和Fk、源操作数的标记位Qj和Qk,源操作数准备状态Rj和Rk,以及目的操作数Fi的表项。
优选的,所述方法步骤(5)中当计算服务模块计算完毕后,检查功能部件状态表中任务的源操作数是否与当前执行任务的目的操作数相同,从而来判断是否存在读后写相关。
相对于现有技术中的方案,本发明的优点是:
1、本发明接收用户的任务请求之后,可以直接检测该任务与目前平台中执行的任务的数据相关性,如存在写后读与写后写相关,则能够自动进行任务的等待,而对于无相关及读后写相关的任务则可以进行发射执行,除此之外,将不能即时执行的任务请求进行缓冲,当数据和计算单元都准备完毕时实现任务的自动发射。因此,本发明消除了不同任务之间的WAR伪相关,并能够自动检测WAW和RAW两种相关。
2、本发明包含任务自动划分和调度模块。由于平台中集成了不同类型的计算资源,模块中记录了各种计算资源的属性和运行时状态。在任务运行时,该模块及其调度方法可以针对任务的属性和计算资源的实时状态来进行任务的划分和调度。
综上所述,本发明得到一种片上多核异构系统的调度系统与任务乱序执行方法,所述系统包括提供需要执行的任务的多个异构的软硬件用户服务模块、在片上多核计算平台执行多个任务的计算服务模块,其特征在于所述用户服务模块与计算服务模块间设置核心调度服务模块,所述核心调度服务模块接受用户服务模块的任务请求为输入,通过记录判断不同任务之间的数据依赖关系,将任务请求并行地调度到不同的计算服务模块上执行.所述软硬件用户服务模块与核心调度模块之间通过片上互联相连,分别用来执行不同类型的计算任务。所述硬件计算服务模块以IP核的形式封装,并通过可重构控制器实现IP核的动态加载。该系统通过在运行时对任务进行相关性的监测和自动并行化来提高平台的吞吐率和系统的性能。
附图说明
下面结合附图及实施例对本发明作进一步描述:
图1为本发明实施例片上多核计算平台的系统架构图;
图2是本发明实施例片上多核计算平台的任务调度系统的系统架构图。
具体实施方式
以下结合具体实施例对上述方案做进一步说明。应理解,这些实施例是用于说明本发明而不限于限制本发明的范围。实施例中采用的实施条件可以根据具体厂家的条件做进一步调整,未注明的实施条件通常为常规实验中的条件。
实施例
如图1所示,该片上多核计算平台的任务调度系统,包括提供需要执行的任务的用户服务模块、在片上多核计算平台执行多个任务的计算服务模块,所述用户服务模块与计算服务模块间设置核心调度模块,所述核心调度模块接受用户服务模块的任务请求为输入,通过记录判断不同任务之间的数据依赖关系,将任务请求并行地调度到不同的计算服务模块上执行。
图2显示了片上多核计算平台的任务调度系统的系统架构图,模块中包括一个任务队列,一个变量状态表,一组保留站以及再请求缓冲表组成,具体的模块如下:
1)任务队列
任务队列用来对用户发送的任务请求进行存储。由于不同的任务之间存在数据依赖关系,因此任务在发射到不同的处理器上执行之前在任务队列上存储。
2)变量状态表
变量状态表所实现的功能为:在指令发射时,对可能存在相关的数据进行相关判断和数据索引。
表1变量状态表
表1为变量状态表,主要用来记录在程序运行过程中的各个变量对应关系。由于在多核系统中,可以将每一条服务请求抽象成一条指令来对待,所有的请求的相关性都是通过变量的使用依赖来判断的。由于本模块向用户提供编程时使用的变量,因此表格的大小取决于存储空间和效率的限制。变量的数目太多会导致系统的查找开销会比较大,若太少则无法充分扩展系统的性能。因此本发明以32为典型值,提供了32个变量供用户使用。
在表中,功能部件域中保存的信息为使用当前变量的目标任务,用于标记该变量依赖的目标任务。
3)功能部件状态表
表2功能部件状态表
上表为本发明所述的功能部件状态表。在功能部件状态表中,保存的信息有如下:
Name:标记目前功能部件状态表中所执行的功能名称;Busy:当前功能模块的繁忙状态;Fi:目的操作数;Fj Fk:两个源操作数;Qj Qk:两个源操作数的标记位:若执行完毕,则对源操作数赋值,否则将对应的标记位标记为源操作指令的再请求缓冲表项的入口;Rj Rk:源操作数是否准备好的标记。
4)变量表
表3变量表
变量表的大小与变量状态表相同,主要用来记录在程序运行过程中产生的各个变量的实际值。
具体的任务乱序执行的调度方案流程如下:
(1)用户发送一条新的服务请求到任务调度系统。请求表示为c=Serv(a,b);其中,a、b是该请求要使用的变量。
(2)将该请求加入到访问请求队列中,若队列已满,则等待。
(3)查询功能状态表,判断是否存在与任务对应的功能部件,若没有空闲的功能部件,则等待;
(4)查询变量状态表,判断此请求采用的目标变量(c)是否在表中。若目标变量不存在且变量状态表不满,则将变量加入表中;若表满则当前请求等待,直到变量表中有空闲表项时再进行发射。若表中已经存在有对应的表项(c),且表项的Busy属性为yes,则表明当前已经有其它的任务写入目标变量,则等待。
(5)查询所述变量对应表中源操作数(a,b)的空闲状态;若有源操作数仍处于忙的状态,则等待所有的源操作数均处于就绪状态;否则将实际值赋给源操作数Fj和Fk,并更新标记位Rj和Rk;
(6)当任务请求中的源数据都准备完毕之后,重新针对计算部件进行一次软硬件任务划分。此步骤中分别针对任务可能运行的功能部件的运行时间进行预估,从而获得一个运行时间最短的选择,将其对应的功能部件状态表进行更新。
(7)访问请求被发送到特定的计算服务模块;计算完毕之后,检查功能部件状态表中任务的源操作数是否与当前执行任务的目的操作数(c)相同,如果是则说明有WAR相关,则等待,直到相关消除则将变量值更新到变量表中,并将变量状态表中的Busy状态修改为no。
上述实例只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人是能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡根据本发明精神实质所做的等效变换或修饰,都应涵盖在本发明的保护范围之内。
Claims (3)
1.一种片上多核异构系统的调度系统,包括提供需要执行的任务的适用多个异构软硬件的用户服务模块、在片上多核计算平台执行多个任务的计算服务模块,其特征在于所述用户服务模块与计算服务模块间设置核心调度模块,所述核心调度模块接受用户服务模块的任务请求,通过记录判断不同任务之间的数据依赖关系,将任务请求并行地调度到不同的计算服务模块上执行;所述计算服务模块以IP核的形式封装,并通过可重构控制器实现IP核的动态加载;所述计算服务模块与片上多核异构系统的多个计算处理器片上互联,接受核心调度模块的指令执行不同类型的计算任务;所述核心调度模块包括接受用户服务模块的若干个任务请求形成任务队列的任务队列、用来提供在指令发射到计算服务模块时对可能存在相关的数据进行相关判断和数据索引的变量状态表、用来标记平台中各个计算单元运行状态的功能部件状态表,以及用来保存变量值的变量表;所述功能部件状态表包括若干个标记目前状态表中所执行的任务请求名称Name、当前任务请求的繁忙状态Busy、源操作数Fj和Fk、源操作数的来源Qj和Qk,标记位Rj和Rk,以及目的操作数Fi的表项;所述变量状态表包括多个变量编号及各个变量目前被占用的功能部件编号;所述变量表中存储了系统中所有变量的实际值。
2.一种片上多核计算平台的任务调度执行方法,其特征在于所述方法中任务乱序执行,所述方法包括以下步骤:
(1)用户服务模块提供新的服务请求,核心调度模块接收到请求后根据任务队列的状态判断是否将新的服务请求加入任务队列;当任务队列未满时加入任务队列;
(2)核心调度模块查询功能部件状态表,判断是否存在与任务对应的功能部件,并且判断新的服务请求采用的目标变量是否存在于变量表中;当变量表中没有任务将目标变量作为输出变量时,且变量表非满时,将变量加入变量状态表,并更新功能部件状态表;更新功能部件状态表时,包括Name更新为目标功能部件、Busy更新为yes、并更新源操作数Fj和Fk、源操作数的标记位Qj和Qk,准备状态标记位Rj和Rk,以及目的操作数Fi的表项;
(3)查询所述变量对应表中源操作数的空闲状态;若有源操作数仍处于忙的状态,则等待所有的源操作数均处于就绪状态;否则将实际值赋给源操作数Fj和Fk,并更新标记位Rj和Rk;
(4)当任务请求中的源数据都准备完毕之后,重新针对计算部件进行一次软硬件任务划分;核心调度模块针对任务可能运行的功能部件的运行时间进行预估,从而获得一个运行时间最短的选择,将其对应的功能部件状态表进行更新;
(5)访问请求被发送到特定的计算服务模块;计算完毕之后,判断当前任务与所有之前的任务之间是否存在读后写相关,如果是进行等待,直到相关消除则将变量值更新到变量表中,并将变量状态表中的Busy状态修改为no。
3.根据权利要求2所述的方法,其特征在于所述方法步骤(5)中当计算服务模块计算完毕后,检查功能部件状态表中任务的源操作数是否与当前执行任务的目的操作数相同,判断是否存在读后写相关。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110299619 CN102360309B (zh) | 2011-09-29 | 2011-09-29 | 片上多核异构系统的调度系统与调度执行方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110299619 CN102360309B (zh) | 2011-09-29 | 2011-09-29 | 片上多核异构系统的调度系统与调度执行方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102360309A CN102360309A (zh) | 2012-02-22 |
CN102360309B true CN102360309B (zh) | 2013-12-18 |
Family
ID=45585641
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201110299619 Active CN102360309B (zh) | 2011-09-29 | 2011-09-29 | 片上多核异构系统的调度系统与调度执行方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102360309B (zh) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103377032A (zh) * | 2012-04-11 | 2013-10-30 | 浙江大学 | 一种基于异构多核芯片的细粒度科学计算并行处理装置 |
CN102662765B (zh) * | 2012-04-28 | 2014-09-03 | 中国科学技术大学 | 一种运行效率指导的可重构多核处理器的资源分配方法 |
CN103324465A (zh) * | 2013-05-10 | 2013-09-25 | 刘保国 | 多变量、复杂控制系统的并行算法及结构 |
CN103885826B (zh) * | 2014-03-11 | 2017-04-12 | 武汉科技大学 | 一种多核嵌入式系统实时任务调度实现方法 |
CN104375805A (zh) * | 2014-11-17 | 2015-02-25 | 天津大学 | 采用多核处理器仿真可重构处理器并行计算过程的方法 |
CN104615488B (zh) * | 2015-01-16 | 2018-01-19 | 华为技术有限公司 | 异构多核可重构计算平台上任务调度的方法和装置 |
CN104778083B (zh) * | 2015-03-27 | 2018-07-03 | 华为技术有限公司 | 异构多核可重构计算平台上任务调度的方法和装置 |
CN105718318B (zh) * | 2016-01-27 | 2019-12-13 | 戴西(上海)软件有限公司 | 一种基于辅助工程设计软件的集合式调度优化方法 |
CN105573829B (zh) * | 2016-02-02 | 2019-03-12 | 沈文策 | 一种快速处理系统中高流量数据的方法 |
CN107678840B (zh) * | 2016-08-01 | 2021-08-24 | 百度在线网络技术(北京)有限公司 | 用于运行任务的系统、方法和装置 |
CN108572862B (zh) * | 2017-03-08 | 2021-12-03 | 华为技术有限公司 | 一种流程调度方法以及流程调度设备 |
CN107124575A (zh) * | 2017-04-14 | 2017-09-01 | 苏州科达科技股份有限公司 | 一种媒体处理方法、装置及媒体服务器 |
US10802829B2 (en) | 2017-11-30 | 2020-10-13 | International Business Machines Corporation | Scalable dependency matrix with wake-up columns for long latency instructions in an out-of-order processor |
US10942747B2 (en) | 2017-11-30 | 2021-03-09 | International Business Machines Corporation | Head and tail pointer manipulation in a first-in-first-out issue queue |
US10564976B2 (en) | 2017-11-30 | 2020-02-18 | International Business Machines Corporation | Scalable dependency matrix with multiple summary bits in an out-of-order processor |
US10901744B2 (en) | 2017-11-30 | 2021-01-26 | International Business Machines Corporation | Buffered instruction dispatching to an issue queue |
US10884753B2 (en) | 2017-11-30 | 2021-01-05 | International Business Machines Corporation | Issue queue with dynamic shifting between ports |
US10572264B2 (en) | 2017-11-30 | 2020-02-25 | International Business Machines Corporation | Completing coalesced global completion table entries in an out-of-order processor |
US10922087B2 (en) | 2017-11-30 | 2021-02-16 | International Business Machines Corporation | Block based allocation and deallocation of issue queue entries |
US10564979B2 (en) | 2017-11-30 | 2020-02-18 | International Business Machines Corporation | Coalescing global completion table entries in an out-of-order processor |
WO2019106462A1 (en) * | 2017-11-30 | 2019-06-06 | International Business Machines Corporation | Scalable dependency matrix with one or a plurality of summary bits in an out-of-order processor |
US11568269B2 (en) | 2017-12-28 | 2023-01-31 | Cambricon Technologies Corporation Limited | Scheduling method and related apparatus |
CN109976809B (zh) * | 2017-12-28 | 2020-08-25 | 中科寒武纪科技股份有限公司 | 调度方法及相关装置 |
CN109978129B (zh) * | 2017-12-28 | 2020-08-25 | 中科寒武纪科技股份有限公司 | 调度方法及相关装置 |
CN109978149B (zh) * | 2017-12-28 | 2020-10-09 | 中科寒武纪科技股份有限公司 | 调度方法及相关装置 |
CN109976887B (zh) * | 2017-12-28 | 2020-03-24 | 中科寒武纪科技股份有限公司 | 调度方法及相关装置 |
CN108319503B (zh) * | 2018-02-27 | 2024-06-11 | 东莞中子科学中心 | 分布式异构计算方法及系统 |
CN109862023B (zh) * | 2019-02-27 | 2020-08-07 | 中国科学院软件研究所 | 一种嵌入式设备实现加速计算和高速网络数据传输方法 |
CN111694675B (zh) | 2019-03-15 | 2022-03-08 | 上海商汤智能科技有限公司 | 任务调度方法及装置、存储介质 |
CN113495791B (zh) * | 2021-09-07 | 2021-12-14 | 上海燧原科技有限公司 | 一种任务处理系统、方法及芯片 |
CN117349223A (zh) * | 2022-06-29 | 2024-01-05 | 中科寒武纪科技股份有限公司 | 片上系统、指令系统、编译系统及相关产品 |
CN116204288B (zh) * | 2023-02-08 | 2024-02-27 | 北京四维远见信息技术有限公司 | 混合云数据处理系统和方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102135950B (zh) * | 2011-03-10 | 2012-11-28 | 中国科学技术大学苏州研究院 | 基于星型互联架构的片上异构多核系统及其通信方法 |
CN102129390B (zh) * | 2011-03-10 | 2013-06-12 | 中国科学技术大学苏州研究院 | 片上多核计算平台的任务调度系统及进行任务并行化方法 |
CN102193826B (zh) * | 2011-05-24 | 2012-12-19 | 哈尔滨工程大学 | 一种异构多核处理器高效任务调度方法 |
-
2011
- 2011-09-29 CN CN 201110299619 patent/CN102360309B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN102360309A (zh) | 2012-02-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102360309B (zh) | 片上多核异构系统的调度系统与调度执行方法 | |
CN102129390B (zh) | 片上多核计算平台的任务调度系统及进行任务并行化方法 | |
US11782870B2 (en) | Configurable heterogeneous AI processor with distributed task queues allowing parallel task execution | |
CN112465129B (zh) | 片内异构人工智能处理器 | |
US8250548B2 (en) | Method for controlling heterogeneous multiprocessor and multigrain parallelizing compiler | |
US8528001B2 (en) | Controlling and dynamically varying automatic parallelization | |
CN102023844B (zh) | 并行处理器及其线程处理方法 | |
US20070150895A1 (en) | Methods and apparatus for multi-core processing with dedicated thread management | |
JP2013538398A (ja) | ハイブリッド・コンピューティング環境における高スループット・コンピューティングの方法、システム及びプログラム | |
CN105045658A (zh) | 一种利用多核嵌入式dsp实现动态任务调度分发的方法 | |
CN110990154B (zh) | 一种大数据应用优化方法、装置及存储介质 | |
CN107463442B (zh) | 一种星载多核SoC任务级负载均衡并行调度方法 | |
US20140068581A1 (en) | Optimized division of work among processors in a heterogeneous processing system | |
CN102968344A (zh) | 一种多虚拟机迁移调度的方法 | |
CN104243617A (zh) | 一种异构集群中面向混合负载的任务调度方法及系统 | |
Wang et al. | SOMP: Service-oriented multi processors | |
CN101833439B (zh) | 基于分合思想的并行计算硬件结构 | |
CN101976204B (zh) | 面向服务的异构多核计算平台及其使用的任务调度方法 | |
CN107943592B (zh) | 一种面向gpu集群环境的避免gpu资源争用的方法 | |
US9760969B2 (en) | Graphic processing system and method thereof | |
Tsuji et al. | Multiple-spmd programming environment based on pgas and workflow toward post-petascale computing | |
Wang et al. | FPM: A flexible programming model for MPSoC on FPGA | |
CN114661460A (zh) | 面向异构众核处理器的ai框架两级并行加速方法 | |
CN103810041A (zh) | 一种支持动态伸缩的并行计算的方法 | |
WO2019153681A1 (zh) | 一种智能指令调度器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |