WO2007020739A1

WO2007020739A1 - スケジューリング方法およびスケジューリング装置

Info

Publication number: WO2007020739A1
Application number: PCT/JP2006/310907
Authority: WO
Inventors: Keisuke Inoue; Seiji Murata
Original assignee: Sony Computer Entertainment Inc.
Priority date: 2005-08-15
Filing date: 2006-05-31
Publication date: 2007-02-22
Also published as: JP4963018B2; JP2007052511A; US8375390B2; EP1923784A4; CN101180609A; US20090031315A1; EP1923784A1; CN101180609B

Abstract

　図１において、スレッド情報をメインメモリ３０に保持する。スレッド情報はビット列と直近実行情報を含む。ビット列の各ビットはそれぞれ１つのスレッドに割り当てられており、ビットの番号と値はそれぞれスレッドの番号と、スレッドが実行可能な状態にあるか否かを示す。直近実行情報は直近に実行されたスレッドの番号である。プロセッサ１２は、直近に実行されたスレッドを示すビットがビット列の末尾になるようにビット列をローテートし、ローテートされたビット列の先頭から順に、実行可能状態にあるスレッドに対応するビットを検索し、最も先に得たビットの番号を、次に実行するスレッドの番号として選出する。そして、この番号のビットの値を、実行不可であることを示すように変更するとともに、直近実行情報を、このビットの番号にセットしてスレッド情報を更新する。この操作は、アトミックコマンドを用いてなされる。

Description

明細書

スケジューリング方法およびスケジューリング装置

技術分野

[0001] 本発明は、マルチプロセッサシステムにおける並列処理の実行単位のスケジユーリング方法および装置に関する。

背景技術

[0002] 最近のマルチタスクをサポートするオペレーティングシステムは、複数のプロセスを同時に実行することができるマルチタスク環境を実現するとともに、これらのプロセスがプロセス内部で複数のスレッドを生成して並行処理を行うことができるマルチスレツド技術を搭載してヽる。プロセスは実行時に固有のリソースやアドレス空間が割り当てられ、他のプロセスの領域にアクセスすることができない。これに対してスレッドは、プロセス内部で生成される実行単位であり、各スレッドはプロセス内の領域に互いに自由にアクセスすることができる。スレッドは、オペレーティングシステムが CPU (Centr al Processing Unit)の実行時間を割り当てる基本的な実行単位となる。本明細書にぉ、て、スレッドの割り当てをスケジューリングと!/、う。

[0003] 1つのシステム内に複数のプロセッサを搭載したマルチプロセッサシステムでは、並列に、あるいは協調して処理を実行して処理全体の高速ィ匕を図ることができる。通常、マルチプロセッサシステムにおいて、共有メモリにタスクキューと呼ばれる待ち行列に実行可能なスレッドが保持される。これらのスレッドは、ずれかのプロセッサに割り当てられて、実行される。スレッドを割り当てる方法によって、プロセスの実行速度ゃメモリ消費量などの性能が変わってくるため、マルチプロセッサシステムでは、シングルプロセッサシステムにおけるスケジューリングと異なった工夫が必要となる。

[0004] マルチプロセッサシステムにおけるスケジューリングについて、たとえば、スレッドを管理する役割を担う管理ユニットが各プロセッサと通信し、それぞれのプロセッサに割り当てるスレッドをスケジューリングする方法が考えられる。

[0005] 管理ユニットによってスケジューリングを行うこの方法では、管理ユニットとプロセッサ間の通信において、メッセージ遅延が起きることが多ぐスレッドの実行を遅延させてしまうという問題がある。この問題を解決するために、各プロセッサによって自己支配的にスケジューリングする方法が考えられる。この方法では各プロセッサ上でおのおのスケジューラを実行し、共有メモリにあるタスクキューにアクセスして、実行するスレッドを選択する。

[0006] この方法では、各プロセッサがスケジューラを実行している間、すなわちスケジユーリング中において、共有メモリ上のタスクキューが他のプロセッサによって修正されることを防ぐために、スケジューラがタスクキューをロックする。この間、割り込みを禁止するか否かはシステムの設計者にとってジレンマである。

[0007] スケジューリング中に割り込みを禁止しない場合には、スケジューラがタスクキューをロックしている最中に、割り込みを受け付けてしまう。この場合、割り込み処理が終了し、ロックが開放されるまで、スケジューリングが実行されない結果になってしまい、システムの効率低下につながる。

[0008] 一方、スケジューリング中に割り込みを禁止すると、システムの割り込み応答性能が低下してしまう問題がある。これらの問題はこれまで述べたマルチプロセッサ上で動作するカーネルスケジューラだけの問題でなぐマルチプロセッサ 'マルチスレッド環境でのユーザレベルスケジューラ（すなわち、各プロセッサで動作するスレッド上でスケジユーラを実行することで、ユーザレベルにお、てマルチスレッドを実現する方式）の場合も同様である。

[0009] 特に、ユーザレベルスケジューラを実行しているカーネルスレッドは各プロセッサ上のカーネルレベルスケジューラによってスケジューリングされ、他のカーネルスレッドによってプリェンブト (横取り）される可能性があるため、タスクキューのロックはより深刻な問題を引き起しかねない。この場合、横取りされた際にそのカーネルスレッドで動作するユーザレベルスケジューラがロックを取得して、た場合には、他のプロセッサのスレッド上で動作するユーザレベルスケジューラがロックが解除されるまでスケジユーリングすることができなくなる。

発明の開示

発明が解決しょうとする課題

[0010] 本発明は上記事情に鑑みてなされたものであり、その目的は、マルチプロセッサシステムにおける並列処理の実行単位をプロセッサに割り当てる順序を制御して処理効率を向上させることができるスケジューリング技術を提供することにある。

課題を解決するための手段

[0011] 本発明に力かる態様は、マルチプロセッサシステムにおいて、プロセッサの実行対象となる実行単位をスケジューリングする方法に関する。このスケジューリング方法は、マルチプロセッサシステムに含まれる複数のプロセッサの実行対象となる各実行単位に識別子を付与し、各実行単位のそれぞれが実行可能な状態にある力ゝ否カゝを実行単位の識別子に対応づけて示す実行可否情報と、各実行単位のうちの、直近に実行された実行単位の識別子を示す直近実行情報とを含む実行単位情報を保持する。そして、実行単位情報に基づいて、直近に実行された実行単位の識別子以外の識別子を優先的に選出する制約の下でいずれかの実行可能な実行単位の識別子を、プロセッサによって実行される実行単位の識別子として選出するとともに、実行単位情報を更新する。

[0012] 本発明のこの態様は、管理ユニットによってスケジューリングするシステムに適用してもよく、各プロセッサ自身によってスケジューリングを行うシステムに適用してもよい

[0013] また、本発明のこの態様は、各プロセッサ上で直接動作するスケジューラだけではなぐ各プロセッサ上のスケジューラが提供するスレッド上で動作するユーザレベルスケジユーリングを用いるシステムに適用してもよい。

[0014] ここで、実行可否情報は、各実行単位について識別子として 1ビットを割り当てたビット列として保持され、ビットの選出および実行単位情報の更新を不可分操作、すなわちアトミック操作によって行うようにしてもょヽ。

[0015] 「不可分操作」は、これ以上分割できな、最小単位の操作を意味し、マルチプロセッサシステムにおいて、他のプロセッサが行う操作との相互作用なしに実行されることが保証される操作である。

[0016] なお、以上の構成要素の任意の組合せ、本発明をシステム、プログラム、プログラムを記憶した記憶媒体として表現したものも、本発明の態様としては有効である。

発明の効果 [0017] 本発明は、マルチプロセッサシステムにおける並列処理の実行単位をスケジユーリングすることにお、て有利である。

図面の簡単な説明

[0018] [図 1]本発明に力かる実施形態のマルチプロセッサシステムを示す図である。

[図 2]図 1に示すマルチプロセッサシステムのタスクキューを示す図である。

[図 3]図 2に示すタスクキューに含まれるスレッド情報の構成を示す図である。

[図 4]図 3に示すスレッド情報の詳細を説明するための図である。

[図 5]プロセッサによりスレッドを選出する処理を示すフローチャートである。

[図 6]図 5に示す処理に伴うスレッド情報の変化を示す図である。

[図 7]プロセッサによりスレッドを追加する処理を示すフローチャートである。

[図 8]図 7に示す処理に伴うスレッド情報の変化を示す図である。

[図 9]ユーザレベルスケジューラを用いるマルチプロセッサシステムの例を示す図である。

[図 10]図 9に示すマルチプロセッサシステムにおけるスレッドのグルーピング例を示す図である。

[図 11]図 9に示すマルチプロセッサシステムにおけるスレッドのスケジューリング例を示す図である。

符号の説明

[0019] 10…処理ユニット、 12· ··プロセッサ、 14…ローカルメモリ、 16· ··メモリ制御部、

20· ··メインバス、 30· "メインメモリ、 40· ··スレッド情報、 50· ··スレッドアドレス情報、 60…スレッド実体、 100…マルチプロセッサシステム、 110…処理ユニット、 112…プロセッサ、 114· ··メモリ制御部、 120· ··メインバス、 130· "メインメモリ発明を実施するための最良の形態

[0020] マルチプロセッサシステムにおいて、各プロセッサの実行単位たとえばスレッドのスケジユーリング中に、スレッドを記憶したタスク一キューがほかのプロセッサにより修正されることを防ぐために、タスクキューをロックする必要があった。

[0021] このロックによって、スケジューリング中に、割り込みを禁止するとシステムの割り込み応答性能が低下し、割り込みを禁止しないと、割り込み処理が終わり、ロックが解除されるまでスケジューリングができな、と!/、うジレンマがあった。

[0022] 上述した問題を解決するために、本発明者は、下記の技術を提案する。

[0023] 各スレッドに識別子を付与し、これらのスレッドのそれぞれが実行可能な状態にあるか否かをスレッドの識別子に対応づけて示す実行可否情報と、各スレッドのうちの、直近に実行されたスレッドの識別子を示す直近実行情報とを含むスレッド情報を保持する。そして、スレッド情報に基づいて、直近に実行されたスレッドの識別子以外の識別子を優先的に選出するという制約の下で、いずれかの実行可能なスレッドの識別子を、プロセッサに割り当てるスレッドの識別子として選出する。

[0024] ここで、スレッドの実体 (以下スレッド実体と!/、う）を、プロセッサが選出された識別子に基づ!/、て取得することができる、かなる方法で保持してもよ、。たとえばスレッド実体を識別子と対応づけて保存するようにしてもよ!ヽし、各スレッド実体をメモリのそれぞれの所定の領域に保存するとともに、スレッド実体が保存された領域の開始アドレスとその識別子とを対応づけてメモリに保存するようにしてもょ、。

[0025] この技術は、スレッド実体と、いずれのスレッドを実行するかの選出を行うために必要なスレッド情報とに分けてメモリに保存する。そのために、スケジューリングする際に当たって、スレッド実体を記憶した領域をロックする必要がなぐスケジューリング中に割り込みを禁止する力否かのジレンマを解消することができる。

[0026] この技術は、ユーザレベルスケジューラを実行するシステムにおいても、上記ジレンマを解消することができるとともに、ユーザレベルスケジューラゆえの問題も解決することができる。

[0027] たとえば、マルチプロセッサシステム、特に OS (オペレーティングシステム)機能を実行できるプロセッサが限られるような非対称のマルチプロセッサシステムにおいては、各プロセッサで動作する OSが提供するカーネルスレッド上にユーザレベルスレツドを作成して、自己支配的にスケジューリングする方法、すなわちユーザレベルスケジユーラを用いる方法は、マルチプロセッサシステムの処理効率を向上させる有効な方法であると考えられる。この方法では、ユーザレベルスケジューラを用いることに起因するスケジューリングの破淀とヽぅ問題がある。 [0028] たとえば、ユーザレベルスケジューラを実行しているスレッドは、各プロセッサの上のカーネルスケジューラによってスケジューリングされ、ほかのカーネルスレッドによってプリェンブトされる可能性がある。そのため、プリェンブトされた際にそのスレッドで動作するユーザレベルスケジューラがロックを取得して、た場合には、ほかのプロセッサのスレッド上で動作するユーザレベルスケジューラがロックが解除されるまで、スケジユーリングができなくなり、プロセッサの処理効率を下げてしまう。さらに、ロックが解除されるまでの時間は、状況に依存してしまい、見積もることが困難になるため、システムの不安定を引き起こす原因にもなりえる。

[0029] ここで、マルチプロセッサシステムにお、て各プロセッサが自律的に動作するカーネルスケジューラを実行する従来のシステムについて考える。タスクキューにスレッド 1、スレッド 2、スレッド 3が入っており、複数のプロセッサのうちのプロセッサ Aは、タスクキューにあるスレッドを実行することができる状態になった場合を想定する。

[0030] プロセッサ Aは、実行するスレッドを選出するために、タスクキューをー且自分の口一カルメモリにコピーし、タスクキュー力も例えばスレッド 1を選出した後に、タスクキュ一からスレッド 1を削除する更新処理を行って、更新されたタスクキューをメインメモリに書き戻す。タスクキューのコピーが開始するときから、タスクキューの書戻しが終了するまでの間、共有メモリ上のタスクキューが他のプロセッサによって修正されることを防ぐために、タスクキューをロックする。タスクキューがロックされている間、他のプロセッサは、タスクキューに入ったスレッドを実行できる状態になったとしても、タスクキュ一を利用することができないため、ロックの期間が長いほどシステムの処理効率が低下する。

[0031] また、プロセッサ Aで動作するスケジューラは前述したように割り込みによってプリエンプトされる可能性がある。プロセッサ Aがタスクキューをロックした状態でプリェンプトされると、ほかのプロセッサは、プロセッサ Aが割り込み処理力も復帰し、ロックが解除されるまでスケジューリングを行うことができず、スレッド 2、 3を実行することが不可能となる。これでは、システムは処理効率が低下するとともに、不安定にもなりかねない。

なお、上記説明は、プロセッサ A、 · · ·を、プロセッサ A、 · · ·上で動作するユーザレベルスケジューラを実行するスレッド（たとえばスレッド a、 · · ·)に置き換えれば、ユーザレベルスケジューラを実行するシステムにも適用することができる。具体的には、ュ一ザレベルスケジューラを実行するシステムにお、て、たとえばプロセッサ A上で動作するユーザレベルスケジューラを実行するスレッド _aも、割り込みによってプリェンプトされる可能性がある。スレッド aが、タスクキューがロックされた状態でプリェンブトされると、ほかのスレッドは、スレッド aが割り込み処理力復帰し、ロックが解除されるまでスケジューリングを行うことができない。すなわち、ユーザレベルスケジューラを用いるシステムにおいても同じように、タスクキューのロック起因して、システムは処理効率が低下し、不安定になりかねない問題がある。

[0032] また、マルチプロセッサシステムにお、ては、各々のプロセッサがそれぞれの処理ユニットに含まれる开で存在する。これらの処理ユニットは PPU (Power Processin g Unit)と SPU (Synergistic Processing Unit)とに分けることができる。 SPU のすべてが同一のアーキテクチャを用いて実現されてもよぐそれぞれ異なる構成を有してもよい。 PPUは、 SPUに対してローカルに、たとえば SPUと同一のチップ、同一のパッケージ、同一の回路基板、同一の製品に位置してもよいし、 SPUに対してリモートに、たとえばバスやインターネットなどの通信ネットワークを介して接続可能な異なる製品に位置してもよい。同様に、 SPUは、互いにローカルにまたはリモートに位置してちょい。

[0033] スケジューリング禁止区間の存在と禁止時間の見積もりの困難さはマルチプロセッサシステムの処理効率を下げる要因になる。ユーザレベルスケジューラを実行するスレッドのすべてが SPUのスレッド（以下 SPUスレッドという）であれば、この問題を解決する方法としては、スレッドをグループ化してグループ単位でスケジューリングする方法が考えられる。ここで、図 9に示すマルチプロセッサシステムを例にして説明する。

[0034] 図 9に示すマルチプロセッサシステムは、複数の処理ユニット 110とメインメモリ 130 と有し、それらはメインバス 120に接続されている。各処理ユニット 110は、プロセッサ 112、ローカルメモリ 114、メモリ制御部 116を有する。プロセッサ 112は、ローカルメモリ 114に対してデータを読み書きすることができる。メモリ制御部 116は、他の処理ユニット 110のプロセッサ 112からローカルメモリ 114のデータを参照するときのインタ一フェースを与えるとともに、メモリの同期、排他制御の機能を提供する。

[0035] ここで、メインメモリ 130に設けられたタスクキューに SPUスレッドのみが記憶されている場面について考える。この場合、タスクキュー内のスレッドが図 10に示すようにグルーピングされる。図 10において、スレッドグループ 1は 3つのスレッド thla、 thlb、 t hlcを含む。スレッドグループ 2は、 1つのスレッド th2aを含む。このようなスレッドが 1 つだけの場合もスレッドグループとして扱う。同様に、スレッドグループ 3は、 2つのスレッド th3a、 th3bを含む。スレッドグループ 4は、 1つのスレッド th4aを含む。

[0036] これらのスレッドのスケジューリングは、同一スレッドグループに属するすべてのスレッドを同時にいずれかのプロセッサ 112に割り当てることを条件として行われる。第 1 スレッドグループがプロセッサ 112に割り当てられるときは、第 1スレッドグループに属する 3つのスレッド thla、 thlb、 thlcが同時にいずれかのプロセッサ 112に割り当てることができる場合に限られる。 3つのスレッド thla、 thlb、 thlcの 1つまたは 2つがプロセッサ 112に割り当てられ、残りがメインメモリ 130に退避して、る t 、う状況は作らない。

[0037] 図 11は、スレッドグループ単位でスレッドがプロセッサ 112に割り当てられる様子を説明する図である。同図は、プロセッサ総数 4のマルチプロセッサシステムにおいて、図 10に示した 4つのスレッドグループに属するスレッドのプロセッサ 112への割り当て状態を示している。ある時刻において、第 1スレッドグループに属する 3つのスレッド t hla、 thlb、 thlcは、それぞれ第 1プロセッサ、第 2プロセッサ、第 3プロセッサに割り当てられ、第 2スレッドグループに属する 1つのスレッド th2aは、第 4プロセッサに割り当てられている。それ以外の第 3スレッドグループに属する 2つのスレッド th3a、 th3b 、および第 4スレッドグループに属する 1つのスレッド th4aはメインメモリ 112に退避されている。

[0038] このようなシステムによれば、 1つのスレッドグループ内に所属する複数のスレッドを必ず同時に、ずれかのプロセッサに割り当てるようにする。スレッドグループ内において、ロックを取ったスレッドだけがプリェンブトされることがないため、スケジユーリングの禁止区間を限定することができる。

[0039] し力し、 PPUのスレッド（以下 PPUスレッドという）と SPUスレッドが非同期にスケジユーリングされる環境では、 PPUスレッドと SPUスレッドで同じタスクキューを共有した場合には下記の問題が生じうる。ある PPUスレッドがタスクキューのロックを取ったまま他の PPUスレッドにプリェンブトされると、 SPUスレッドはこの PPUスレッドが再実行されるまで待たざるを得ないため、スケジューリングの禁止区間を限定することができなくなってしまう。

[0040] 本発明者が提案したスケジューリング技術は、スレッド情報とスレッド実体を分けて保存し、プロセッサは、いずれのスレッドを実行するかの選出を行う際、スレッド情報のみをロードすればよい。選出を終え、スレッド情報の更新 (具体的には、直近に実行されたスレッドの識別子を、選出されたスレッドの識別子に変更する処理と、選出されたスレッドの識別子を該識別子の対応するスレッドが実行不可であることを示すように修正する処理)を終了すれば、更新されたスレッド情報をメインメモリにストアする。その後、プロセッサは、選出した識別子に対応するスレッド実体をコピーする力コピ一する間、他のプロセッサは、スレッド情報を利用することができる。こうすることによつて、スレッド情報は 1つのプロセッサに占有される時間が短いため、スレッド情報をロックしたとしても、システム全体の処理効率の低下を軽減させることができる。

[0041] さらに、本発明者は、実行可否情報を、各スレッドについて識別子として 1ビットを割り当てたビット列として保持することを提案する。こうすることによって、スレッドの選出、スレッド情報の更新などを、アトミック操作やアトミック命令を用いて行うことができ、ロック操作を伴わな、すなわちロックレスのタスクキューを実現することができる。ロック操作がなければ、上述した、タスクキューのロックに起因するおのおのの問題も解消される。

[0042] 図 1は、本発明の実施形態となるマルチプロセッサシステム 100の構成を示す。マルチプロセッサシステム 100は、複数の処理ユニット 10とメインメモリ 30とを有し、それらはメインバス 20に接続されている。各処理ユニット 10は、プロセッサ 12、ロー力ルメモリ 14、メモリ制御部 16を有する。プロセッサ 12は、ローカルメモリ 14に対してデータを読み書きすることができる。メモリ制御部 16は、他の処理ユニット 10のプロセッサ 12からローカルメモリ 14のデータを参照するときのインターフェースを与えるとともに、メモリの同期、排他制御の機能を提供する。 [0043] 処理ユニット 10のうちのいずれか 1つは、スレッドのスケジューリングに関して他の処理ユニットに対するサービスユニットの役割を担う。サービスユニットの役割としては

、たとえばメインメモリ 30の割当てや、メインメモリ 30内のスレッドに関する最初の記憶に関わることなどである。メインメモリ 30の割当ては、たとえばスレッド情報に割り当てられる領域、領域の容量や、スレッドの実体に割り当てられるべきメモリ容量を決定することなどとすることができる。

[0044] なお、このサービスユニットは、いずれの処理ユニット 10によって担当されてもよい。

[0045] ある時刻において、各プロセッサ 12には 1つのスレッドが動作し、マルチプロセッサシステム 100全体で並列に複数のスレッドが実行される。各プロセッサ 12において動作しているスレッドは、処理ユニット 10内のローカルメモリ 14やメモリ制御部 16内のレジスタなどのすべての資源を占有して使用することができる。

[0046] この状態において、処理待ちしているスレッドは、そのコンテキストがメインメモリ 30 に保持される。スレッドのコンテキストは、そのスレッドが実行された処理ユニット 10内で占有するすべての資源の状態であり、スレッドがプロセッサ 12において動作しているときに各種レジスタに保持されている値の集合、ローカルメモリ 14に保持されたデータ、メモリ制御部 16の各種レジスタの内部状態などである。スレッドがプロセッサ 12 上で動作していないときは、そのスレッドのコンテキストをメインメモリ 30にコピーしておき、再度プロセッサ 12によって処理可能となったときに、そのコンテキストをメインメモリ 30から読み込んで、処理を継続することができる。スレッドのコンテキストは、スレッド実体に該当する。

[0047] 図 2は、メインメモリ 30により記憶された、スレッドに関する情報を示す。これらの情報は、スレッド情報 40、スレッドアドレス情報 50と、スレッド実体 60であり、マルチプロセッサシステム 100におけるタスクキューの役割を担う。なお、これらの情報が記憶される領域は、サービスユニットによって割り当てられ、ほかの処理ユニット 10に通知される。

[0048] スレッド情報 40は、実行可否情報と直近実行情報とを含む。実行可否情報は、各スレッドに対してそれぞれ付与された識別子を、それぞれのスレッドが実行可能な状態にあるカゝ否かを示す情報に対応づけたものである。図 3は、スレッド情報 40の詳細を示す。

[0049] ビット列（isSchedulable)は、実行可否情報であり、それに含まれる 1ビットが 1つのスレッドに対応し、ビット番号はスレッドの番号に対応する。なお、マルチプロセッサシステム 100は、ビット番号そのものをスレッドの番号として用いて処理の簡潔化を図る

[0050] ビット列 isSchedulableの各ビットの値はそのビットに対応するスレッドが実行可能状態にある力否かを示している。ここで、ビットの値の「1」は実行可能であることを示し、「0」は実行不可であることを示すようにされている。ビット列 isSchedulableに含まれるビットの数は、実行可否情報の保持用に割り当てられた領域の容量に相当し、ここでは 128ビットとする。

[0051] lastScheduledは、ビット列 isSchedulableに含まれる各ビットのうち、直近に実行されたビットの番号を示す整数値を取る変数である。

[0052] isSchedulableと lastScheduledによって、図 4の例のように、実行可能なスレッドの番号、直近に実行されたスレッドの番号が示される。図 4の例では、ビット列 isSche dulableのうち、値力「1」であるビット（図中矢印 B、 C、 Dが示すビット）が 3つあり、この 3つのビット番号に対応するスレッドは実行可能スレッドである。値が「0」であるほかのビットについて、それらに対応するスレッドは、実行不可である。また、 lastSchedu ledの値に等し、ビット番号（図中矢印 Aが示すビットの番号）に対応するスレッドは、直近に実行されたスレッドであり、その状態は実行不可である。

[0053] スレッドアドレス情報 50は、各スレッドの番号ここではビット列 isSchedulableに含まれるビットの番号と、その番号に対応するスレッドの実体が保存された領域の開始ァドレスとを対応づけたものである。どの番号のスレッド実体を、どのアドレスの領域に保存するかについては、サービスユニットによって決められる。

[0054] 処理待ちのスレッドがな!/、状態にぉ、て、スレッド情報 40のビット列 isSchedulable の各ビットの値が「0」である。

[0055] 処理ユニット 10の処理が進み、スレッドが生成される。生成されたスレッドは、またいずれかの処理ユニット 10によって実行される。処理待ちのスレッドが生じた際に、タスクキューが利用される。ここで、例として図 4に示すタスクキューの状態を起点にして、処理ユニット 10が次に実行するスレッドを選出する処理、およびこの選出に伴うスレツド情報の更新処理を図 5のフローチャートを用いて説明する。

[0056] 図 4に示す状態では、マルチプロセッサシステム 100の各処理ユニット 10は、それぞれ処理中のスレッドがあり、処理待ちしている実行可能なスレッドは 3つあり、この 3 つのスレッドのそれぞれの実体は、メインメモリ 30に記憶されている。

[0057] この状態において、ある処理ユニット 10において、処理中のスレッドの処理が終了すると、この処理ユニット 10のプロセッサ 12は、次に実行するスレッドを選出するために、スレッド情報 40に含まれるビット列 isSchedulableと lastScheduledを、ローカルメモリ 14にロードする（S10)。マルチプロセッサシステム 100において、処理ユニット 10は、スレッド情報 40に関わる処理をアトミックコマンドを用いて行い、ここでは、スレッド情報 40をロードするためのコマンドとして、たとえば「lwarx」または「getllar」を用いる。なお、図 6の A欄に示すビット列 isSchedulableは、図 4に示すビット列 isSche dulableである。

[0058] プロセッサ 12は、ロードしたビット列 isSchedulable (図 6の A欄に示すビット列）を、 lastScheduledの値に等しい番号のビット（図 6の矢印 A1が示すビット）が末尾になるように、矢印 Lが示す方向、すなわち左方向にローテートする（S 14)。これによつて、図 6の A欄のビット列 isSchedulableは、同図の B欄のビット列 isSchedulableになる。図示のように、（lastScheduled+ 1)の番号のビット（矢印 B1が示すビット）力ビット列 isSchedulableの先頭に位置し、 lastScheduledの番号のビット（矢印 B3が示すビット）がビット列 isSchedulableの末尾になる。

[0059] プロセッサ 12は、続いてローテートされたビット列 isSchedulableに対して先頭から順に、値力「l」であるビットの検索を行い、最も先に検出したビット (矢印 B2が示すビット）の番号を、次に実行するスレッドの番号として得る（S 18)。ビットの検索に用いるコマンドとして、たとえばビット列 isSchedulableの先頭力も連続した、「0」の値を有するビットの数を数える「Count Leading Zero」を用いることができる。「Count L eading ZeroJにより得られた値（図 6に示す B欄のビット列 isSchedulableの例では 4)に（lastScheduled + 1)を加算して得た値は、次に実行するスレッドの番号として選出される。 [0060] そして、プロセッサ 12は、選出した番号のビットの値を「0」にセットするとともに、 last Scheduledをこの番号にセットして、スレッド情報 40の更新を行う（S20)。更新されたスレッド情報 40は、メインメモリ 30にストアされる（S24)。ここで、ビットの値の更新は、図 6の C欄に示す 128ビットのビット列を用いて行う。 C欄のビット列は、 128ビットを有し、ステップ S 18において選択された番号と同じ番号のビット（矢印 C1が示すビット）のみが「1」の値を有する。プロセッサ 12は、図 6の B欄のビット列 isSchedulable と、 C欄のビット列とを、「AtomicAndc」コマンドで演算することによって B欄のビット列 isSchedulableを更新する。また、更新されたビット列 isSchedulableのストアに用 V、るコマンドは、たとえば「stwcx」または「putllc」とすることができる。

[0061] 図 6の D欄は、更新されたスレッド情報 40を示す。ここで、次に実行するスレッドとして選出されたビット (矢印 D1が示すビット）は、直近に実行されたスレッドを示すビットとなり、その値が「1」から「0」になっている。

[0062] その後、プロセッサ 12は、スレッドアドレス情報 50を参照して、選出した番号のスレッドに対応するスレッド実体 60の開始アドレスを取得するとともに、この開始アドレスにより示される領域力スレッド実体 60をローカルメモリ 14にロードして処理する。

[0063] 次に図 7のフローチャートを用いて、タスクキューに実行可能となったスレッドを追カロする処理につ!、て説明する。

[0064] 処理ユニット 10のプロセッサ 12は、新たに実行可能となったスレッドをタスクキューに追加するために、スレッド情報 40に含まれるビット列 isSchedulableをローカルメモリ 14にロードする（S50)。このビット列 isSchedulableはたとえば図 8の A欄に示すビット列 isSchedulableである。プロセッサ 12は、 A欄のビット列 isSchedulableの各ビットのうちの、値が「0」であるいずれかのビット（たとえば矢印 A1が示すビット）の番号を、追加するスレッドのビット番号として選出する。そして、プロセッサ 12は、 A欄のビット列 isSchedulableと、 B欄に示すビット列とを「AtomicOr」コマンドで演算して C 欄に示すビット列 isSchedulableを得る（S54)。図 8の B欄に示すビット列は、 128ビットを有し、プロセッサ 12により選出された番号と同じ番号のビット (矢印 B1が示すビット）のみが「1」の値を有する。

[0065] 続いて、プロセッサ 12は、ステップ S54により得られたビット列 isSchedulable (図 8 の C欄のビット列）をメインメモリ 30にストアして、スレッドを追加するためのスレッド情報 40の更新を終了する（S58)。

[0066] プロセッサ 12は、この後、追加するスレッドの実体を、ステップ S54において選出したビット番号に対して割り当てられた領域にコピーして、スレッドを追加する処理を終了する。

[0067] このように、図 1に示すマルチプロセッサシステム 100によれば、各プロセッサ 12自身によって、タスクキューからスレッドを選出する処理、タスクキューを更新する処理を行っているので、システム全体の処理効率を向上させることができる。

[0068] また、タスクキューを構成する際に、スレッド情報とスレッド実体とに分けて保存し、スレッドの選出、更新は、スレッド情報のみを用いて行うことができるようにしたので、より効率の良、マルチプロセッサシステムを実現して、る。

[0069] さらに、スレッド情報としてビット列 isSchedulableと、 lastScheduledとの 2つの変数を用いることによって、スレッドの選出と更新を、アトミックコマンドで行うことを可能とした。これによつて、ロックレスのタスクキューを実現している。

[0070] ロックレスのタスクキューの実現により、スケジューリング中に割り込みを受け付けるか否かのジレンマを解消することができる。

[0071] また、直近に実行されたスレッドの情報が保持され、スレッドを選出する際に、直近に実行されたスレッド以外のスレッドを優先的に選出するとともに、この選出に伴って当該情報を更新する。これにより、直近に実行されたスレッドがまた実行可能になつても、他の実行可能なスレッドが優先的に実行されるため、スレッドのスケジユーリングにお、て重要な公平性を保つことができる。

[0072] ここで、図 1に示すマルチプロセッサシステム 100は、カーネルスケジューラのみをを用、るマルチプロセッサシステムであるが、マルチプロセッサシステム 100に用いられたスケジューリング方法は、各プロセッサ上で動作するスレッド上で実現されたュ一ザレベルスケジューラを用いたシステムにも適用することができる。その場合、スケジユーリング中に割り込みを受け付けるか否かのジレンマを解消することができるとともに、前述した、ユーザレベルスケジューラを用いることに起因する問題も解消することがでさる。 [0073] 以上、本発明を実施の形態をもとに説明した。実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せに、ろ、ろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。

[0074] また、図 1に示す実施形態は、各プロセッサが自律的にスケジューリングを行うシステムであるが、本発明のスケジューリング方法は、このようなシステムに限らず、たとえばひとつの管理ユニットによってスケジューリングするシステムにも適用することができる。

[0075] また、本発明を適用したデバイスも、本発明の範囲にある。これらのデバイスには、パーソナルコンピュータやサーバなどに限らず、携帯電話、ゲーム機、モノくイルコンピュータ、個人携帯情報機器 (PDA)、デジタルテレビなどが含まれる。

産業上の利用可能性

[0076] 以上のように本発明は、複数のプロセスを並列に処理するコンピュータ、携帯電話、ゲーム機器などの電子機器に利用可能である。

Claims

請求の範囲

[1] マルチプロセッサシステムに含まれる複数のプロセッサの実行対象となる各実行単位に識別子を付与し、

各実行単位のそれぞれが実行可能な状態にあるカゝ否カゝを実行単位の識別子に対応づけて示す実行可否情報と、各実行単位のうちの、直近に実行された実行単位の識別子を示す直近実行情報とを含む実行単位情報を保持し、

実行単位情報に基づ、て、直近に実行された実行単位の識別子以外の識別子を優先的に選出する制約の下でいずれかの実行可能な実行単位の識別子を、プロセッサによって実行される実行単位の識別子として選出するとともに、実行単位情報を更新することを特徴とするスケジューリング方法。

[2] 前記実行単位情報が、各プロセッサがアクセス可能なメモリに保持され、

前記選出および更新は、選出された識別子に対応する実行単位を実行するプロセッサ自身によって行われることを特徴とする請求項 1記載のスケジューリング方法。

[3] 実行可否情報は、各実行単位について識別子として 1ビットを割り当てたビット列として保持され、

前記選出および更新は、不可分操作によって行われることを特徴とする請求項 1または 2記載のスケジューリング方法。

[4] 直近に実行された実行単位に対応するビットが末尾になるようにビット列をローテ一トし、

ローテートされたビット列の先頭力も順に実行可能な実行単位のビットを検索することによって前記選出を行うことを特徴とする請求項 3記載のスケジューリング方法。

[5] 前記選出および更新は、選出された識別子に対応する実行単位を実行するプロセッサに対応するローカルメモリに前記実行単位情報をロードしたうえで行われ、さらに、前記更新が完了した後、前記実行単位情報を前記メモリに格納することを特徴とする請求項 2に記載のスケジューリング方法。

[6] 前記識別子と、当該識別子に対応する実行単位のコンテキストの前記メモリにおける格納先のアドレスとを対応づけたアドレス情報を前記メモリにさらに保持し、前記実行単位情報を前記メモリに格納した後、前記アドレス情報を参照して、選出された識別子に対応する実行単位のコンテキストを前記メモリから読み出すことにより当該実行単位を実行することを特徴とする請求項 5に記載のスケジューリング方法。

[7] マルチプロセッサシステムに含まれる複数のプロセッサの実行対象となる各実行単位のそれぞれが実行可能な状態にあるか否かを、それぞれの実行単位に対して付与された識別子に対応づけて示す実行可否情報と、各実行単位のうちの、直近に実行された実行単位の識別子を示す直近実行情報とを含む実行単位情報を保持する実行単位情報保持部と、

前記実行単位情報に基づ!、て、直近に実行された実行単位の識別子以外の識別子を優先的に選出する制約の下でいずれかの実行可能な実行単位の識別子を、プ口セッサによって実行される実行単位の識別子として選出する実行単位選出部と、前記選出に伴!ヽ、前記実行単位情報を更新する実行単位情報更新部とを備えることを特徴とするスケジューリング装置。

[8] 前記実行単位情報保持部は、各プロセッサがアクセス可能なメモリに前記実行単位情報を保持し、

前記実行単位選出部および前記実行単位情報更新部は、選出された識別子に対応する実行単位を実行するプロセッサ自身により構成されることを特徴とする請求項 7記載のスケジューリング装置。

[9] 前記実行単位情報保持部は、実行可否情報を、各実行単位につ!、て識別子として 1ビットを割り当てたビット列として保持し、

前記実行単位選出部および前記実行単位情報更新部は、不可分操作によって前記選出および前記更新を行うことを特徴とする請求項 7または 8記載のスケジユーリング装置。

[10] 前記実行単位選出部は、直近に実行された実行単位に対応するビットが末尾になるようにビット列をローテートし、

ローテートされたビット列の先頭力も順に実行可能な実行単位のビットを検索することによって前記選出を行うことを特徴とする請求項 9記載のスケジューリング装置。

[11] マルチプロセッサシステムに含まれる複数のプロセッサの実行対象となる各実行単位のそれぞれが実行可能な状態にあるか否かを、それぞれの実行単位に対して付与された識別子に対応づけて示す実行可否情報と、各実行単位のうちの、直近に実行された実行単位の識別子を示す直近実行情報とを含む実行単位情報を保持する機能と、

前記実行単位情報に基づ!、て、直近に実行された実行単位の識別子以外の識別子を優先的に選出する制約の下でいずれかの実行可能な実行単位の識別子を、プ口セッサによって実行される実行単位の識別子として選出するとともに、前記実行単位情報を更新する機能とをコンピュータに実行せしめることを特徴とするプログラム。プログラムを記憶した記憶媒体であって、

前記プログラムは、

マルチプロセッサシステムに含まれる複数のプロセッサの実行対象となる各実行単位のそれぞれが実行可能な状態にあるか否かを、それぞれの実行単位に対して付与された識別子に対応づけて示す実行可否情報と、各実行単位のうちの、直近に実行された実行単位の識別子を示す直近実行情報とを含む実行単位情報を保持する機能と、

前記実行単位情報に基づ!、て、直近に実行された実行単位の識別子以外の識別子を優先的に選出する制約の下でいずれかの実行可能な実行単位の識別子を、プ口セッサによって実行される実行単位の識別子として選出するとともに、前記実行単位情報を更新する機能とをコンピュータに実行せしめること特徴とする記憶媒体。