CN101393530A

CN101393530A - 基于超立方体结构的cmp任务分配方法

Info

Publication number: CN101393530A
Application number: CNA2008101370176A
Authority: CN
Inventors: 姚文斌; 李旭明
Original assignee: Harbin Engineering University
Current assignee: Harbin Engineering University
Priority date: 2008-08-27
Filing date: 2008-08-27
Publication date: 2009-03-25
Anticipated expiration: 2028-08-27
Also published as: CN100589080C

Abstract

本发明提供的是一种基于超立方体结构的CMP任务分配方法。本发明的关键在于将超立方体结构数学模型(以超立方体结构的顶点来表示各个处理器的内核，边表示内核与内核之间的联系)引入到CMP任务分配算法中，根据待运行任务的特征属性，将占用不同资源的任务合理地分配到各个处理器内核中。通过引入基于超立方体结构的CMP任务分配算法，可以使得不同资源占用的任务合理地分配到适当的处理器内核中，从而提高了CMP中各个处理器内核的整体利用率，大大地缩短了完成全部任务所需的执行时间，从而改进了CMP的处理效率和使用效能。

Description

基于超立方体结构的CMP任务分配方法

(一)技术领域

本发明涉及的是一种计算机CMP体系结构中处理器内核任务调度技术。

(二)背景技术

随着集成电路制造工艺的不断进步，微处理器性能得到了不断的提升。单个处理器芯片上集成10亿个晶体管即将实现，在此情况下，进一步利用程序本身所具有的并行性以提高处理器性能成为当前系统结构设计者所面对的一个关键问题。

传统的处理器设计中大多通过并发执行单个串行程序中的多条指令来提取并行性，为此，处理器设计采用了诸如乱序执行、猜测执行和硬件分支预测等技术来改进系统的并发执行。然而，随着越来越多复杂技术的应用，使得处理器的设计和验证变得越来越难以控制。为此，提出了CMP(片上多处理器)体系结构。

CMP是指在一个处理器芯片上集成多个微处理器内核(也称为处理单元)，每个微处理器内核实质上都是一个相对简单的微处理器，各个微处理器都能够相对独立地执行程序代码。

CMP的基本架构主要结构包括：

(1)处理器内核：CMP中包括多个相对独立的处理器内核，内核往往具有中央处理单元、独立的Cache结构等。

(2)核间通信结构：主流的片上高效通信机制有两种，一种基于总线共享的Cache结构，以斯坦福大学的Hydra处理器为代表；另一种是基于片上的互连结构，以麻省理工学院的RAW处理器为代表。其中，前者是指每个处理器内核拥有共享的二级或三级Cache，用于保存比较常用的数据，并通过连接核心的总线进行通信，具有结构简单，容易实现与验证，且对系统程序员接口友好的优点，缺点是基于总线的结构可扩展性较差，适用于集成4个或4个以下CPU核心的CMP处理器；后者是指每个处理器内核拥有独立的处理单元和cache，各个CPU核心间通过交叉开关和片上互联网络等方式连接在一起，各个CPU核心之间通过消息进行通信，这种结构的优点是可扩展性好，适合于集成16个以上CPU核心的CMP处理器。

对于具有多个处理单元的多核处理器系统来讲，将大量的计算线程合理、高效地分配到相应的处理器单元上是CMP研究的重点问题。当前，CMP结构下操作系统任务调度算法主要包括：一是全局就绪队列调度；二是局部就绪队列调度。

全局队列调度是指操作系统维护一个全局的任务就绪队列，当系统中有一个CPU内核空闲时，操作系统就从全局任务就绪队列中选取一个就绪任务开始在此核心上执行。这种方法的优点是CPU内核利用率较高，逻辑设计也比较简单，但任务可能需要在各内核之间进行切换，因为当某一个任务已经分配给处理器的A内核，可是当任务运行的过程中因某种原因而被阻塞时，系统发现B内核为空闲，那么系统会把正在A内核执行的任务分配给B内核，这样会削弱A内核中的cache命中率。

局部就绪队列调度是指系统为每个CPU内核维护一个局部的任务就绪队列，当系统中有一个CPU内核空闲时，便从该内核的任务就绪队列中选取恰当的任务执行，这种方法的优点是任务基本上不需要在多个CPU内核之间进行切换，有利于提高CPU内核里的cache命中率，但CPU内核的利用率较低，因为当系统中的某个CPU内核A所维护的任务就绪队列中任务应经执行完毕，而其他CPU内核B的就绪队列中仍有任务需要执行，那么A内核只能等待，这样就浪费了宝贵的内核资源。

(三)发明内容

本发明的目的在于提供一种将CMP中处理器内核逻辑划分为具有不同维数的超立方体结构，根据任务资源分配表的功能需求，将不同任务分配到CMP中的立方体结构中，可以使任务能够较快的在各个处理器内核之中运行，大大地缩短任务的执行时间。

本发明的目的是这样实现的：

具有N个处理单元的单芯片多处理器CMP，将其逻辑划分为具有多维立方体结构，至多为k维立方体，其中k≤N，处理单元的个数与具有一维立方体结构的节点个数n₁、具有二维立方体结构的节点个数n₂、具有k维立方体结构的节点个数n_k之间满足N＝n₁+n₂+…+n_k；

设单芯片多处理器CMP将要执行的任务队列为P₁P₂…P_p，每个任务P_i的资源使用参数表为(d_i，t_i)，其中，d_i表示执行该任务需要i维立方体运算资源、t_i表示执行该任务i维立方体所需要的执行时间；

首先建立多维立方体结构的数据结构n₁→n₂→...→n_k，其中：节点总数为N、n₁，n₂，…，n_k构成了1维立方体、2维立方体、…、k维立方体的队列，每一个n_i指向一个长度为j的指针队列m_i1，m_i2，…，m_ij，指针队列中每一个元素包含参数表(t_act，t_total)，其中t_act表示在该立方体上运行的任务的当前运行时间，t_total表示在该立方体上为完成分配给它的任务、未来还需要的时间；每一个m_ik指向一个即将在该立方体上执行任务队列P_k1，…，P_kl，如果没有分配任务给该立方体，则mik指向空。

其具体方法步骤为：

1：输入任务队列P＝P₁P₂…P_p及其资源使用参数表(d_i，t_i)；

2：建立n₁→n₂→...→n_k多维立方体的数据结构，并对该数据结构初始化；

3：如果当前的任务队列为空，执行步骤10；

否则，执行步骤4；

4：从任务队列中取出第一个任务P1及其参数表(d₁，t₁)；

5：如果d₁>k，输出无法分配任务P₁，执行步骤10；

否则，执行步骤6；

6：(6-8步骤把任务分配到相应的立方体中)

根据d₁的值i(i≤k)找到所对应的立方体结构n_i及其指向的长度为j的指针队列

7：队列

中，其中任意一个元素

对应着参数表(t_ak，t_bk)，从队列对应的参数表元素t_b1，t_b2，…，t_bj中选取最小值t_bk，确定t_bk对应的指针m_ik；

8：从任务队列中删除任务P₁，并将任务P₁插入到m_ik指向的任务队列的尾部；

9：t_ak＝t_ak+t₁；

10：遍历指针n₁，n₂，…，n_k及其指向的后代指针队列将全部指针的参数t_a1，t_a2，…，t_ak值均加1，即t_al＝t_al+1；

11：遍历全部的

如果参数t_a1，t_a2，…，t_ak的值大于相对应指向执行任务队列中第一个任务P′的时间t′，则从该任务队列中删除第一个任务P′，并且将指向任务P′的指针m_p′指向P′的后继，t_bp′＝t_bp′-t′，t_ap′＝0；

12：如果当前的任务队列P不为空，则执行步骤4；

否则，执行步骤13；

13：遍历全部的

如果

j∈(1，i_k)，m_ij均指向空，则程序执行完毕；

否则，执行步骤10。

本发明的关键在于如何进行对多个处理器内核之间的任务分配和调度，为此引入了超立方体结构数学模型，以超立方体结构的顶点表示来表示各个处理器的内核，边则表示内核与内核之间的联系。通过引入基于超立方体结构的CMP任务分配算法，可以使任务能够较快的在各个处理器内核之中运行，从而大大地缩短了任务的执行时间。

其主要创新点如下：

(1)根据CMP的空间结构，将具有N个处理单元的CMP中处理器单元以超立方体结构进行逻辑划分，划分为具有不同维数的超立方体结构(至多为k维立方体，其中k≤N)，具有一维立方体结构的节点个数n₁，具有二维立方体结构的节点个数n₂，具有k维立方体结构的节点个数n_k，即N＝n₁+n₂+…+n_k；

(2)根据任务所需要使用的资源参数表，将任务快速地分配到最先完成之前所分配到任务的超立方体中，从而、实现任务的快速分配、缩短系统运行时间。

(四)附图说明

图1：k个多维立方体构成的CMP数据结构；

图2：i维立方体的数据结构。

(五)具体实施方式

下面结合附图举例对本发明做更详细地描述：

本发明所述算法的特征在于：

具有N个处理单元的单芯片多处理器CMP，将其逻辑划分为具有多维立方体结构(至多为k维立方体，其中k≤N)，具有一维立方体结构的节点个数n₁，具有二维立方体结构的节点个数n₂，具有k维立方体结构的节点个数n_k，即N＝n₁+n₂+…+n_k。

设单芯片多处理器CMP将要执行的任务队列为P₁P₂…P_p，每个任务P_i的资源使用参数表为(d_i，t_i)，其中，d_i表示执行该任务需要i维立方体运算资源，t_i表示执行该任务i维立方体所需要的执行时间。

首先建立多维立方体结构的数据结构如图1所示。其中，节点总数为N，n₁，n₂，…，n_k构成了1维立方体、2维立方体、…、k维立方体的队列，每一个n_i指向一个长度为j的指针队列m_i1，m_i2，…，m_ij，指针队列中每一个元素包含参数表(t_act，t_total)，其中t_act表示在该立方体上运行的任务的当前运行时间，t_total表示在该立方体上为完成分配给它的任务、未来还需要的时间；每一个m_ik指向一个即将在该立方体上执行任务队列P_k1，…，P_kl，如果没有分配任务给该立方体，则m_ik指向空。

算法如下：

1：输入任务队列P＝P₁P₂…P_p及其资源使用参数表(d_i，t_i)

2：建立如图1所示多维立方体的数据结构，并对该数据结构初始化。

3：如果当前的任务队列为空，执行步骤10；

否则，执行步骤4

4：从任务队列中取出第一个任务P₁及其参数表(d₁，t₁)

5：如果d₁>k，输出无法分配任务P₁，执行步骤10；

否则，执行步骤6

6：(6-8步骤把任务分配到相应的立方体中)根据d₁的值i(i≤k)找到所对应的立方体结构n_i及其指向的长度为j的指针队列

7：队列

中，其中任意一个元素

对应着参数表(t_ak，t_bk)，从队列对应的参数表元素t_b1，t_b2，…，t_bj中选取最小值t_bk，确定t_bk对应的指针m_ik

8：从任务队列中删除任务P₁，并将任务P₁插入到m_ik指向的任务队列的尾部

9：t_ak＝t_ak+t₁

10：遍历指针n₁，n₂，…，n_k及其指向的后代指针队列将全部指针的参数t_a1，t_a2，…，t_ak值均加1，即t_al＝t_al+1

11：遍历全部的

如果参数t_a1，t_a2，…，t_ak的值大于相对应指向执行任务队列中第一个任务P′的时间t′，则从该任务队列中删除第一个任务P′(意味着第一个任务已经执行完毕)，并且将指向任务P′的指针m_p′指向P′的后继，t_bp′＝t_bp′-t′，t_ap′＝0

12：如果当前的任务队列P不为空，则执行步骤4；

否则，执行步骤13

13：遍历全部的如果

j∈(1，i_k)，mij均指向空，则程序执行完毕；

否则，执行步骤10。

基于超立方体结构的CMP任务分配方法具体实施模式是这样的：

整个算法具体实施模式是分两个过程，第一个过程是如何把任务分配到最先完成的子立方体中，第二个过程是如何判断某个分配到子立方体中的任务已经完成。

第一个过程

先把需要执行的任务初始化成一个队列，每个任务Pi由两个参数表示，分别是d_i和t_i其中，d_i表示执行该任务需要i维立方体，t_i表示在i维立方体执行该任务所需要的时间。把立方体的维数从1维到k维建成一个队列，每一维又是一个指针队列，用来指向需要在此维数的立方体执行的任务队列，而每一个指针队列的每一项也包含两个参数t_act和t_total，其中t_act表示在当前指针队列里任务的运行时间，t_total表示在该立方体上为完成分配给它的任务、未来还需要的时间。从源任务队列中取出第一个任务，通过它的参数d_i确定应该把它插入到哪一个维数所对应的任务队列，假设被分配到第k维，第k维也是一个指针队列，它指向的是正在或将要执行的任务，通过比较第k维上所有指针队列中每一项的t_total值，找出t_total值最小的指针，不妨设m_ik，那么就可以判断第一个任务在第k维立方体上用时最少，把第一个任务插入到m_ik所指向的指针队列中，至此任务已经分配到最先完成它的某维的子立方体中，第一个过程结束。

第二个过程

假设第k维上的指针队列里有P₁P₂...P_j，通过拿第k维上所有指针队列中的每一个t_act和该维指针队列指向的第一个任务P′完成的时间t′进行比较，如果t′比每一个t_act都小的话，说明当前系统运行的时间已经超出了任务P′的执行时间，即任务P′已经完成，第二个过程结束。然后采取循环的办法，依次从源任务队列中取下一个任务进行判断，至此整个算法的实施模式结束。

Claims

1、一种基于超立方体结构的CMP任务分配方法，其特征是：具有N个处理单元的单芯片多处理器CMP，将其逻辑划分为具有多维立方体结构，至多为k维立方体，其中k≤N，处理单元的个数与具有一维立方体结构的节点个数n₁、具有二维立方体结构的节点个数n₂、具有k维立方体结构的节点个数n_k之间满足N＝n₁+n₂+…+n_k；

首先建立多维立方体结构的数据结构n₁→n₂→...→n_k，其中：节点总数为N、n₁，n₂，…，n_k构成了1维立方体、2维立方体、…、k维立方体的队列，每一个n_i指向一个长度为j的指针队列m_i1，m_i2，…，m_ij，指针队列中每一个元素包含参数表(t_act，t_total)，其中t_act表示在该立方体上运行的任务的当前运行时间，t_total表示在该立方体上为完成分配给它的任务、未来还需要的时间；每一个m_ik指向一个即将在该立方体上执行任务队列P_k1，…，P_kl，如果没有分配任务给该立方体，则m_ik指向空。

2、根据权利要求1所述的基于超立方体结构的CMP任务分配方法，其特征是：其具体方法步骤为：

(1)输入任务队列P＝P₁P₂…P_p及其资源使用参数表(d_i，t_i)；

(2)建立n₁→n₂→...→n_k多维立方体的数据结构，并对该数据结构初始化；

(3)如果当前的任务队列为空，执行步骤10；否则，执行步骤4；

(4)从任务队列中取出第一个任务P₁及其参数表(d₁，t₁)；

(5)如果d₁>k，输出无法分配任务P₁，执行步骤10；否则，执行步骤6；

(6)(6-8步骤把任务分配到相应的立方体中)根据d₁的值i(i≤k)找到所对应的立方体结构n_i及其指向的长度为j的指针队列