WO2006059543A1

WO2006059543A1 - スケジューリング方法、スケジューリング装置およびマルチプロセッサシステム

Info

Publication number: WO2006059543A1
Application number: PCT/JP2005/021663
Authority: WO
Inventors: Naohiro Nishikawa
Original assignee: Sony Computer Entertainment Inc.
Priority date: 2004-12-01
Filing date: 2005-11-25
Publication date: 2006-06-08
Also published as: US8166482B2; US7913257B2; TW200632743A; JP2006155480A; EP1837762A4; EP1837762A1; TWI410866B; CN101069161A; US20110119674A1; US20060123420A1; JP4606142B2; CN101069161B; EP1837762B1

Abstract

　スレッド状態管理部３２は、複数のスレッドをグループ化して、スレッドグループの状態を管理する。実行待ちキュー３０は、実行待ちおよび実行中の状態にあるスレッドグループを優先度順かつ同一優先度内ではＦＩＦＯ（First In First Out）順でキューイングする。割り当てリスト生成部１２は、実行待ちキュー３０の先頭から順にスレッドグループを取り出し、そのスレッドグループに属するすべてのスレッドを同時にいずれかのプロセッサに割り当てられる場合に限り、そのスレッドグループをスレッド割り当てリスト１８に追加する。スレッド割り当て部１４は、スレッド割り当てリスト１８に格納されたスレッドグループに属するすべてのスレッドをプロセッサに割り当てる。

Description

明細書

スケジューリング方法、スケジューリング装置およびマルチプロセッサシステム

技術分野

[0001] この発明はマルチプロセッサシステムにおける並列処理の実行単位のスケジユーリング方法およびスケジューリング装置、ならびにマルチプロセッサシステムに関する。背景技術

[0002] 最近のマルチタスクをサポートするオペレーティングシステムは、複数のプロセスを同時に実行することができるマルチプロセス環境を実現するとともに、さらに、これらのプロセスがプロセス内部で複数のスレッドを生成して並行処理を行うことのできるマルチスレッド技術を搭載して、る。プロセスは実行時に固有のリソースやアドレス空間が割り当てられ、他のプロセスの領域にアクセスすることはできない。これに対してスレッドは、プロセスの内部で生成される実行単位であり、各スレッドはプロセス内の領域に互いに自由にアクセスすることができる。スレッドは、オペレーティングシステムが CPUの実行時間を割り当てる基本的な単位となる。

[0003] スレッドを CPUに割り当てるスレッドスケジューリング方式として、待ち行列に入って V、るスレッドを一定時間毎に順番に選んで実行する単純なラウンドロビン方式や、スレッドの優先度の順に実行するプライオリティ方式などがある。ラウンドロビン方式では、待ち行列にあるスレッドが一定時間ごとに公平に CPUに割り当てられて実行される。プライオリティ方式では、優先度毎に設けられた待ち行列に各優先度のスレッドがキューイングされ、優先度の高、待ち行列から順にスレッドが選択され CPUに割り当てられて実行される。

発明の開示

発明が解決しょうとする課題

[0004] 1つのシステム内に複数のプロセッサを搭載したマルチプロセッサシステムでは、並列に処理を実行して処理全体の高速ィ匕を図ることができる。マルチプロセッサシステムにおいて、マルチスレッド環境を実現する場合、スレッドをいずれかのプロセッサに割り当てて実行することになり、スレッドの実行順序によって、プロセスの実行速度やメモリ消費量などの性能が変わってくる。マルチプロセッサシステムにおけるスレッドスケジユーリングでは、プロセッサ資源の利用の効率化や、スレッド間のデータの受け渡しや通信の効率ィ匕などにっ、ても配慮する必要があり、シングルプロセッサシステムにおけるスレッドスケジューリングとは違った工夫が必要となる。

[0005] 本発明はこうした課題に鑑みてなされたものであり、その目的は、マルチプロセッサシステムにおける並列処理の実行単位をプロセッサに割り当てる順序を制御して、処理効率を上げ、プロセッサの利用効率を高めることのできるスケジューリング技術を提供することにある。

課題を解決するための手段

[0006] 上記課題を解決するために、本発明のある態様のスケジューリング方法は、マルチプロセッサシステムにお、て、並列処理されるスケジューリング対象の実行単位を複数のプロセッサに割り当てる順序をスケジュールする方法であって、 1つ以上の前記スケジューリング対象の実行単位をグループィ匕し、同一グループに属する前記実行単位の各々により占有されるプロセッサ内の資源を互いに参照できるように、各実行単位が参照するアドレス空間に前記資源をマップし、同一グループに属するすべての実行単位は同時に、ずれかのプロセッサに割り当てると、う制約の下で、グループのプロセッサへの割り当てを制御する。

[0007] 本発明の別の態様もまた、スケジューリング方法である。この方法は、マルチプロセッサシステムにお、て、並列処理されるスケジューリング対象の実行単位を複数のプ口セッサに割り当てる順序をスケジュールする方法であって、 1つ以上の前記スケジュ一リング対象の実行単位をグループ化してグループ単位でプロセッサへの割り当てを管理し、前記グループ毎に設定される優先度順でかつ同一優先度内では前記グループが待ち行列に到着した順で前記グループの優先順位を決め、同一グループに属するすべての実行単位は同時にいずれかのプロセッサに割り当てるという制約の下で、実行待ちおよび実行中の状態にあるグループを前記優先順位にしたがってプロセッサに割り当てる。

[0008] この態様によると、優先順位にしたがって、同一グループに属するすべての実行単位を同時にプロセッサに割り当てることができる。この優先順位は、同一優先度内では待ち行列への到着順に順位が決められるため、同一優先度のグループ間で到着順を守ることができる。実行待ちだけでなく既に実行中の状態にあるグループも含めて、優先順位を決めてプロセッサに割り当てるため、割り当てるべきグループのプロセッサへの割り当て処理を一括して簡単に行うことができる。

[0009] 本発明のさらに別の態様もまた、スケジューリング方法である。この方法は、マルチプロセッサシステムにお、て、並列処理されるスケジューリング対象の実行単位を複数のプロセッサに割り当てる順序をスケジュールする方法であって、 1つ以上の前記スケジューリング対象の実行単位を含むグループの内、実行待ちおよび実行中の状態にあるグループを前記グループ毎に設定される優先度順でかつ同一優先度内では到着順に格納した実行待ちキューの先頭力順に前記グループを取り出し、取り出したグループに属するすべての実行単位を同時に、ずれかのプロセッサに割り当てることができる場合に限り、そのグループに属するすべての実行単位をプロセッサに割り当て、そうでない場合は、それ以降に前記実行待ちキュー力も取り出されるグループの割り当てを優先する。

[0010] この態様によると、プロセッサの総数の制約から、グループに属するすべての実行単位を同時にプロセッサに割り当てることができな、場合、優先順位のより低ヽグループに割り当て権を譲渡することで、マルチプロセッサシステムのプロセッサの利用効率を向上することができる。

[0011] 前記実行待ちキューの先頭力順次取り出されるグループに属する各実行単位が既にいずれかのプロセッサに割り当てられて実行中である場合、その実行中である実行単位は、他のプロセッサに割り当て先を変更されて再配置されないように、その実行中である実行単位の当該プロセッサへの割り当てを確保してもよい。これにより、既にプロセッサに割り当てられて実行中であるグループに属する各実行単位については、既に割り当てられたプロセッサへの割り当てを維持することができ、割り当て処理に力かるコストを削減できる。

[0012] 本発明のさらに別の態様は、スケジューリング装置である。この装置は、マルチプロセッサシステムにお、て、並列処理されるスケジューリング対象の実行単位を複数のプロセッサに割り当てる順序をスケジュールする装置であって、 1つ以上の前記スケジユーリング対象の実行単位をグループ化し、同一グループに属する前記実行単位の各々により占有されるプロセッサ内の資源を互いに参照できるように、各実行単位が参照するアドレス空間に前記資源をマップして管理するメモリ制御部と、実行待ちおよび実行中の状態にあるグループを格納した実行待ちキューと、前記実行待ちキユーの先頭力も順にグループを取り出し、取り出したグループに属するすべての実行単位を同時にいずれかのプロセッサに割り当てることができる場合に限り、そのダループに属するすべての実行単位を複数のプロセッサに割り当てる割り当て部とを含む。

[0013] 本発明のさらに別の態様もまた、スケジューリング装置である。この装置は、マルチプロセッサシステムにお、て、並列処理されるスケジューリング対象の実行単位を複数のプロセッサに割り当てる順序をスケジュールする装置であって、 1つ以上の前記スケジューリング対象の実行単位を含むグループの内、実行待ちおよび実行中の状態にあるグループを前記グループ毎に設定される優先度順でかつ同一優先度内では到着順に格納した実行待ちキューと、前記実行待ちキューの先頭力順にグループを取り出し、取り出したグループに属するすべての実行単位を同時にいずれかのプロセッサに割り当てることができる場合に限り、そのグループを割り当てリストに追カロする割り当てリスト生成部と、前記割り当てリスト生成部により生成された前記割り当てリストに格納されたグループに属するすべての実行単位を複数のプロセッサに割り当てる割り当て部とを含む。

[0014] 本発明のさらに別の態様は、マルチプロセッサシステムである。このシステムは、並列処理されるスケジューリング対象の実行単位を複数のプロセッサに割り当てて並列に実行するマルチプロセッサシステムであって、 1つのプロセッサは、前記スケジユーリング対象の実行単位を他の複数のプロセッサに割り当てるスケジューラを含む。前記スケジューラは、 1つ以上の前記スケジューリング対象の実行単位をグループィ匕し、同一グループに属する前記実行単位の各々により占有されるプロセッサ内の資源を互ヽに参照できるように、各実行単位が参照するアドレス空間に前記資源をマップして管理するメモリ制御部と、実行待ちおよび実行中の状態にあるグループを格納した実行待ちキューと、前記実行待ちキューの先頭力も順にグループを取り出し、取り出したグループに属するすべての実行単位を同時に、ずれかのプロセッサに割り当てることができる場合に限り、そのグループに属するすべての実行単位を複数のプロセッサに割り当てる割り当て部とを含む。

[0015] 本発明のさらに別の態様もまた、マルチプロセッサシステムである。このシステムは、並列処理されるスケジューリング対象の実行単位を複数のプロセッサに割り当てて並列に実行するマルチプロセッサシステムであって、 1つのプロセッサは、前記スケジユーリング対象の実行単位を他の複数のプロセッサに割り当てるスケジューラを含む。前記スケジューラは、 1つ以上の前記スケジューリング対象の実行単位を含むダループの内、実行待ちおよび実行中の状態にあるグループを前記グループ毎に設定される優先度順でかつ同一優先度内では到着順に格納した実行待ちキューと、前記実行待ちキューの先頭力順にグループを取り出し、取り出したグループに属するすベての実行単位を同時にいずれかのプロセッサに割り当てることができる場合に限り、そのグループを割り当てリストに追加する割り当てリスト生成部と、前記割り当てリスト生成部により生成された前記割り当てリストに格納されたグループに属するすべての実行単位を複数のプロセッサに割り当てる割り当て部とを含む。

[0016] 本発明のさらに別の態様もまた、スケジューリング方法である。この方法は、マルチプロセッサシステムにお、て、並列処理されるスケジューリング対象の実行単位を複数のプロセッサに割り当てる順序をスケジュールする方法であって、複数のプロセッサの内、少なくとも 1つのプロセッサを並列処理されるスケジューリング対象の実行単位の割り当て対象から除外し、非割り当て対象のプロセッサ上で動作するスケジユール対象とならない実行単位により独占的に占有される当該プロセッサ内の資源を前記スケジューリング対象の実行単位カゝら参照できるように、各実行単位が参照するァドレス空間に前記資源をマップした上で、前記実行単位の割り当て対象のプロセッサへの割り当てを制御する。

[0017] 本発明のさらに別の態様もまた、スケジューリング装置である。この装置は、マルチプロセッサシステムにお、て、並列処理されるスケジューリング対象の実行単位を複数のプロセッサに割り当てる順序をスケジュールする装置であって、複数のプロセッサの内、少なくとも 1つのプロセッサを並列処理されるスケジューリング対象の実行単位の割り当て対象から除外し、非割り当て対象のプロセッサ上で動作するスケジユール対象とならない実行単位により独占的に占有される当該プロセッサ内の資源を前記スケジューリング対象の実行単位力も参照できるように、各スケジューリング対象の実行単位が参照するアドレス空間に前記資源をマップして管理するメモリ制御部と、実行待ちおよび実行中の状態にある前記スケジューリング対象の実行単位を格納した実行待ちキューと、前記実行待ちキューの先頭力順に前記スケジューリング対象の実行単位を取り出し、 V、ずれかのプロセッサに割り当てる割り当て部とを含む。

[0018] なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、コンピュータプログラム、データ構造などの間で変換したものもまた、本発明の態様として有効である。

発明の効果

[0019] 本発明によれば、マルチプロセッサシステムの資源を有効利用し、並列処理の高速ィ匕を図ることができる。

図面の簡単な説明

[0020] [図 1]実施の形態 1に係るマルチプロセッサシステムの構成図である。

[図 2]図 1のプロセッサに割り当てられたスレッドから見たアドレス空間を説明する図である。

[図 3]図 1のプロセッサで動作するスレッドとスレッドの所属するスレッドグループを説明する図である。

[図 4]図 3に示すスレッドグループ単位でスレッドがプロセッサに割り当てられる様子を説明する図である。

[図 5]スレッドの状態遷移を説明する図である

[図 6]実施の形態 1に係るスケジューリング装置の構成図である。

[図 7]図 6のスレッド状態テーブルを説明する図である。

[図 8]図 6の実行待ちキューを説明する図である。

[図 9]図 6のスケジューリング配列を説明する図である。

[図 10]実施の形態 1に係るスケジューリング装置によるスケジューリング手順を説明するフローチャートである。

[図 11]ある時刻でのスレッドの割り当ての手順を説明する図である。

[図 12]別の時刻でのスレッドの割り当ての手順を説明する図である。

[図 13]図 11および図 12のスレッドスケジューリングによるスレッドの割り当て状態の時間変化を示す図である。

[図 14]図 6のスレッド状態テーブルの別の例を説明する図である。

[図 15]ある時刻でのスレッドの割り当ての手順を説明する図である。

[図 16]図 15のスレッドスケジューリングによるスレッドの割り当て状態の時間変化を示す図である。

[図 17]図 6のスレッド状態テーブルのさらに別の例を説明する図である。

[図 18]ある時刻でのスレッドの割り当ての手順を説明する図である。

[図 19]別の時刻でのスレッドの割り当ての手順を説明する図である。

[図 20]さらに別の時刻でのスレッドの割り当ての手順を説明する図である。

[図 21]さらに別の時刻でのスレッドの割り当ての手順を説明する図である。

[図 22]図 18〜図 21のスレッドスケジューリングによるスレッドの割り当て状態の時間変化を示す図である。

[図 23]実施の形態 2に係るマルチプロセッサシステムのプロセッサに割り当てられたスレッドから見たアドレス空間を説明する図である。

[図 24]実施の形態 3に係るマルチプロセッサシステムのプロセッサに割り当てられたスレッドから見たアドレス空間を説明する図である。

[図 25]実施の形態 3に係るマルチプロセッサシステムにおけるスレッドスケジユーリングによるスレッドの割り当て状態の時間変化を示す図である。

符号の説明

10 スケジューラ、 12 割り当てリスト生成部、 14 スレッド割り当て部、 16 割り当てスレッド数カウンタ、 18 スレッド割り当てリスト、 20 スケジューリング配列、

30 実行待ちキュー、 32 スレッド状態管理部、 34 スレッド状態テーブル、 1 00 プロセッシングエレメント、 110 メインバス、 120 メインメモリ、 130 プロセッサ、 140 ローカルメモリ、 150 メモリ制御部、 200 スケジューリング装置。発明を実施するための最良の形態

[0022] 実施の形態 1

図 1は、実施の形態 1に係るマルチプロセッサシステムの構成図である。マルチプロセッサシステムは、複数のプロセッシングエレメント（PE) 100とメインメモリ 120を有し、それらはメインバス 110に接続されている。各プロセッシングエレメント 100は、プロセッサ 130、ローカルメモリ 140、およびメモリ制御部 150を含む。プロセッサ 130は口一カルメモリ 140に対してデータを読み書きすることができる。メモリ制御部 150は、他のプロセッシングエレメント 100のプロセッサ 130からローカルメモリ 140のデータを参照するときのインタフェースを与えるとともに、メモリの同期'排他制御の機能を提供する。

[0023] プロセッシングエレメント 100のいずれか一つには、並列処理の実行単位であり、スケジユーリングの対象となる実行実体 (以下、スレッドという）をスケジューリングする機能をもたせる。このスケジューリング機能は特権レベルで動作する。特権レベルでは、マルチプロセッサシステムのすべての資源にアクセスする権限を有する。一方、スケジユーリング機能をもたない他のプロセッシングエレメント 100上で動作するプログラムは、ユーザレベルで動作する。ユーザレベルでは、特権レベルに比べてアクセスできる資源が限られる。

[0024] スレッドスケジューリングにより、ある時刻に各プロセッサ 130には 1つのスレッドが割り当てられ、マルチプロセッサシステム全体で並列に複数のスレッドが実行される。各プロセッサ 130に割り当てられたスレッドは、プロセッシングエレメント 100内のロー力ルメモリ 140やメモリ制御部 150内部のレジスタなどのすベての資源を占有して使用することができる。

[0025] スレッドがいずれのプロセッサ 130にも割り当てられていない場合、スレッドのコンテキストはメインメモリ 120に退避される。スレッドのコンテキストは、そのスレッドが割り当て先のプロセッシングエレメント 100 (以下、割り当て先 PEという）内で占有するすべての資源の状態であり、スレッドがプロセッサ 130において動作しているときに各種レジスタ内に保持されている値の集合、ローカルメモリ 140に保持されたデータ、メモリ制御部 150の各種レジスタの内部状態などである。スレッドがプロセッサ 130上で動作していないときは、そのスレッドのコンテキストをメインメモリ 120にコピーしておき、再度プロセッサ 130に割り当てられたときに、そのコンテキストを読み込んで、処理を継続できるようにする。

[0026] 本実施の形態では、 1つ以上のスレッドを要素として含むスレッドグループが定義され、スレッドグループ単位でスケジューリングが行われ、スレッドグループに属するすベてのスレッドは同時にいずれかのプロセッサ 130に割り当てられる。スレッドグループ内の一部のスレッドがプロセッサ 130に割り当てられ、残りのスレッドがメインメモリ 1 20に残留する状態にはならない。したがって、同一スレッドグループ内のすべてのスレッドは、実行待ち、実行中などの遷移状態を共有することになる。同一スレッドダループに属するスレッドは、互いのアドレス空間をカーネルのシステムコールを用いずに直接参照することができる。

[0027] 図 2は、プロセッサ 130に割り当てられたスレッドから見たアドレス空間 170を説明する図である。アドレス空間 170には、共有データを含むメインメモリがマップされたメインメモリ領域 172と、同一グループ内の各スレッドの占有資源がマップされたスレッドマップ領域 174とが含まれる。

[0028] スレッドマップ領域 174には、同一グループ内の各スレッドに対応してスレッドマツプ # l〜# _nが配置されている。プロセッサ数を nとすると同一グループ内に最大 n個のスレッドを設けることができるから、スレッドマップにっ、ても n個分の領域が確保されている。各スレッドマップ # l〜# nは、対応する各スレッドが割り当て先 PE内で占有する資源の一部をメモリマップしたものであり、符号 175で示すように、ローカルメモリと、メモリ制御部 150を外部力も制御するためのレジスタ群を含む力メモリ制御部 150を外部から制御するためのレジスタ群は、すべてがアクセス可能ではなぐ後述の通信用レジスタのみがアクセス可能であり、斜線で示した他のレジスタにはァクセスすることはできない。アクセス可能なレジスタだけでなぐアクセス不可能なレジスタも含めて、レジスタ群全体をマップしておくことで、アクセス可能なレジスタの種類に関係なぐスレッドマップのサイズを一定にすることができ、スレッドマップの先頭アドレスに対するオフセット値が固定値になり、プログラマにとって管理がしゃすくなる。

[0029] 各スレッドにより割り当て先 PE内で占有される資源の一部がアドレス空間にマップされることにより、同一グループ内の各スレッドは、互いに他のスレッドが占有する資源の一部にシステムコールを介さずにアクセスして操作することが可能となる。メモリ制御部 150を外部から制御するためのレジスタについては、操作を許可するレジスタに限ってアドレス空間にマップすることで、外部からの操作に一定の制限を設けることができる。

[0030] 第 1のスレッドマップ # 1には、スレッドベースアドレスを先頭アドレスとしてスレッドマップのサイズ分の領域が割り当てられている。第 2のスレッドマップ # 2の先頭アドレスは、スレッドベースアドレスにスレッドマップのサイズに対応したオフセット値を加算したアドレスになる。

[0031] 同一グループのスレッドをコンフィギュレーションする際、スレッドマップの番号 # 1 〜 # nを指定することにより、そのスレッドがどのスレッドマップを使用するかが決まる。後述のスケジューリング装置 200は、同一グループ内の各スレッドがどのスレッドマップを使用して、るかをスレッドマップの設定情報としてメモリに保持し、スレッド割り当て時にスレッドの割り当て先 PEのメモリ制御部 150にスレッドマップの設定情報を設定する。各プロセッシングエレメント 100のメモリ制御部 150は、スレッドがスケジュールされたときに、同一グループ内の各スレッドの資源がどのスレッドマップにメモリマップされているかをスレッドマップの設定情報により把握することができ、アドレス空間 170のスレッドマップにもとづいて、他のスレッドの資源に対するアクセス要求を D MAによって処理することができる。

[0032] なお、より詳細には、後述のスケジューリング装置 200のスレッド状態管理部 32が、スレッドグループのスレッドマップの設定情報を管理し、スレッドマップの設定情報を一例としてスレッド状態テーブル 34に格納して保持する。また、スケジューリング装置 200のスレッド割り当て部 14力スレッドをプロセッサに割り当てる処理を行い、スレツドグループのスレッドマップの設定情報をメモリ制御部 150に設定する処理を行う。プ口セッサに割り当てられたスレッドは、スレッドグループのスレッドマップの設定情報がメモリ制御部 150に設定された後に、スタートする。

[0033] たとえば、 2つのスレッド Al、 A2が同一のグループ Aに属するとする。グループ A の初期設定によって、グループ Aのアドレス空間の第 1領域 EA1に第 1スレッド A1の資源カモリマップされ、アドレス空間の第 2領域 EA2に第 2スレッド A2の資源力 Sメモリマップされたとする。グループ Aの各スレッド Al、 A2がスケジューリングされ、第 1プ口セッサにスレッド A1が割り当てられ、第 2プロセッサにスレッド A2が割り当てられたとする。

[0034] このとき、第 1プロセッサ上で動作する第 1スレッド A1から、第 2スレッド A2のスレッドマップである第 2領域 EA2にアクセスすると、第 2プロセッサの資源が第 2スレッド A2 の資源として参照される。第 1スレッド Al、第 2スレッド A2のプロセッサへの割り当てと実行は、資源が準備されてカゝら行われるため、第 1スレッド A1から第 2スレッド A2のスレッドマップである第 2領域 EA2へのアクセスは、第 2スレッド A2がどのプロセッサに割り当てられているかに関係なぐ必ず第 2スレッド A2の資源へのアクセスであることが保証される。第 2スレッド A2が第 1スレッド A1のスレッドマップである第 1領域 EA1 にアクセスする場合も同様である。

[0035] このように、いずれかのプロセッサ 130に割り当てられたスレッドは、アドレス空間 17 0内に設定されたスレッドマップのアドレスにアクセスすることで、同一グループ内の他のスレッドが占有する資源に DMAによって直接アクセスすることができる。

[0036] 同一グループ内の他のスレッドは、いずれかのプロセッサ 130に割り当てられている力どのプロセッサ 130に割り当てられるかは、スケジューリングの度に異なる。しかし、スレッドマップは、スレッドがどのプロセッサに割り当てられるかに関係なぐァドレス空間 170内の同じアドレスに設定されている。したがって、同一グループ内の各スレッドは、スレッドのプロセッサへの割り当て状態には関係なぐアドレス空間 170内のスレッドマップにアクセスすることで、他のスレッドの資源に一貫してアクセスできることが保証される。

[0037] 各プロセッシングエレメント 100のメモリ制御部 150内部には、スレッド間の同期通信のために使用可能な通信用レジスタが設けられて、る。この通信用レジスタの値は、当該プロセッシングエレメント 100のプロセッサ 130から特殊な命令によって読むことができ、通信用レジスタに値がまだ書き込まれていないときは、当該プロセッサ 130 は、通信用レジスタに値が書き込まれるまで待つ。

[0038] また、この通信用レジスタは、自分以外のプロセッシングエレメント 100のメモリ制御部 150から書き込みができる。メモリ制御部 150内部の通信用レジスタは、スレッドの占有資源として、アドレス空間 170内にスレッドマップとしてメモリマップされている。したがって、あるスレッドは、自分のアドレス空間 170内のスレッドマップを参照して、他のプロセッシングエレメント 100のメモリ制御部 150の通信用レジスタにアクセスすることができ、値を書き込むことができる。

[0039] アドレス空間 170にメモリマップされた通信用レジスタを利用すると、メモリ制御部 1 50は、自スレッドの通信用レジスタに他スレッドが値を書き込むまで、ハートウェア的にプロセッサがストールする機構を実現することができ、スレッド間で同期通信が可能となる。

[0040] また、メモリ制御部 150がもつアドレス空間の参照機能を用いて、メモリでのポーリングによる排他処理や同期処理を行うこともできる。メモリ制御部 150を介したメインメモリに対するデータの読み書きを、メモリ制御部 150がもつメモリ同期化命令を用いて行うことにより、メモリの同期'排他制御を行うことができる。

[0041] このように、同一スレッドグループに属するすべてのスレッドは、同時にいずれかのプロセッサ 130に割り当てられて実行されるため、プロセッシングエレメント 100のメモリ制御部 150によるアドレス空間の参照機能、同期'排他制御機構を活用して、効率的なデータ転送、同期通信、メモリの排他処理'同期処理などを行うことができ、処理効率が上がる。

[0042] 図 3 (a)〜（d)は、スレッドグループを説明する図である。図 3 (a)は、 3つのスレッド t hla、 thlb、 thlcを含む第 1スレッドグループを示す。図 3 (b)は、 1つのスレッド th2 aを含む第 2スレッドグループを示す。このようなスレッドが 1つだけの場合もスレッドグループとして扱う。同様に、図 3 (c)は、 2つのスレッド th3a、 th3bを含む第 3スレッドグループを示す。図 3 (d)は、 1つのスレッド th4aを含む第 4スレッドグループを示す。

[0043] スレッドグループに属するスレッドの内、 1つのスレッドはプライマリスレッドに指定され、そのスレッドグループを代表する。スレッドグループ単位でスレッドスケジユーリングを行う際、プライマリスレッドを操作することでそのスレッドグループに属するすべてのスレッドをまとめて操作することができる。

[0044] 図 4は、スレッドグループ単位でスレッドがプロセッサ 130に割り当てられる様子を説明する図である。同図は、プロセッサ総数 4のマルチプロセッサシステムにおいて、図 3に示した 4つのスレッドグループに属するスレッドのプロセッサ 130への割り当て状態を示している。ある時刻において、第 1スレッドグループに属する 3つのスレッド thl a、 thlb、 thlcは、それぞれ第 1プロセッサ、第 2プロセッサ、第 3プロセッサに割り当てられ、第 2スレッドグループに属する 1つのスレッド th2aは、第 4プロセッサに割り当てられている。それ以外の第 3スレッドグループに属する 2つのスレッド th3a、 th3b、および第 4スレッドグループに属する 1つのスレッド th4aはメインメモリ 120に退避されている。

[0045] スレッドスケジューリングは、同一スレッドグループに属するすべてのスレッドを同時にいずれかのプロセッサ 130に割り当てることを条件として行われる。第 1スレッドダループがプロセッサ 130に割り当てられるときは、第 1スレッドグループに属する 3つのスレッド thla、 thlb、 thlcが同時にいずれかのプロセッサ 130に割り当てることができる場合に限られる。 3つのスレッド thla、 thlb、 thlcの 1つまたは 2つがプロセッサ 1 30に割り当てられ、残りがメインメモリ 120に退避して、ると、う状況は作らな!/、。

[0046] 図 5は、スレッドの状態遷移を説明する図である。スレッドは生成（create)コマンドにより生成され、未構築 (not configured)状態 42になる。未構築状態 42にあるスレッドに対してコンフィギュレーションコマンドを実行すると、構築（configured)状態 44に遷移する。コンフィギュレーションコマンドの引数にプライマリスレッドを指定することで、そのスレッドをプライマリスレッドと同一のスレッドグループに所属させることができる。構築状態 44にあるスレッドに対して削除 (delete)コマンドを実行すると、そのスレッドは削除され、そのスレッドに使用したメモリ領域は解放される。

[0047] 未構築状態 42と構築状態 44を合わせて休止 (dormant)状態 40と、う。構築状態 4 4にあるプライマリスレッドに対してスタートコマンドを実行すると、そのプライマリスレツドを含め、そのスレッドグループに属するすべてのスレッドが実行待ち（ready)状態 5 2に遷移する。以降、スレッドグループに属するすべてのスレッドは、動作（operationa 1)状態 50内で一緒に状態遷移する。以降、動作状態 50内での状態遷移を説明する際、簡単のため、スレッドという力これは同一スレッドグループに属するすべてのスレッドを意味している。なお、スレッドグループに対するコマンドは、プライマリスレッドに対して実行することにより、そのスレッドグループに属するすべてのスレッドに作用する。

[0048] 実行待ち状態 52にあるスレッドは、ウェイトコマンドにより同期待ち（waiting)状態 56 に遷移し、同期待ち状態 56にあるスレッドは、シグナルを受けて実行待ち状態 52に戻る。

[0049] 実行待ち状態 52にあるスレッドは、ディスパッチ（dispatch)コマンドにより実行中（ru nning)状態 54に遷移し、実行中状態 54にあるスレッドは、ィールド (yield)コマンドにより実行待ち状態 52に戻り、ウェイトコマンドにより同期待ち状態 56に遷移し、サスぺンド（suspend)コマンドにより中断状態 60に遷移する。

[0050] 同期待ち状態 56にあるスレッドは、サスペンドコマンドにより同期待ち中断 (waiting and suspended)状態 58に遷移し、同期待ち中断状態 58にあるスレッドは、レジュ一ム (res醒 e)コマンドにより同期待ち状態 56に復帰する。同期待ち中断状態 58にあるスレッドは、シグナルを受けて中断 (suspended)状態 60に遷移する。

[0051] 中断状態 60にあるスレッドは、レジュームコマンドにより実行待ち状態 52に遷移し、実行待ち状態 52にあるスレッドは、サスペンドコマンドにより中断状態 60に遷移する

[0052] 実行中状態 54にあるスレッドは、例外処理が起こると中止（stopped)状態 62に遷移し、中止状態 62にあるスレッドは、リスタートコマンドにより実行中状態 54または実行待ち状態 52に遷移する。

[0053] 実行待ち状態 52、実行中状態 54、中止状態 62、および中断状態 60にあるスレツドはそれぞれ終了（terminate)すると、スレッドは動作状態 50から休止状態 40に移行し、構築状態 44に遷移する。

[0054] 上記の動作状態 50にあるスレッドの内、実行中状態 54にあるスレッドは、プロセッサ 130に割り当てられており、それ以外の状態にあるスレッドはメインメモリ 120に退避されている。

[0055] 図 6は、実施の形態 1に係るスケジューリング装置 200の構成図である。同図は機能に着目したブロック図を描いており、これらの機能ブロックはハードウェアのみ、ソフトウェアのみ、またはそれらの糸且合せによっていろいろな形で実現することができる。スケジューリング装置 200は、図 1のプロセッシングエレメント 100のいずれか一つに設けられ、プロセッサ 130、ローカルメモリ 140、およびメモリ制御部 150を用いて実現される。さらにメインメモリ 120を用いて実現してもよい。以下、図 6の構成を説明するにあたり、適宜図 7〜図 9を参照する。

[0056] スレッド状態管理部 32は、スレッドの生成と削除、スレッドグループの設定、スレッドグループの優先度、およびスレッドグループ単位の状態遷移をスレッド状態テーブル 34によって管理する。

[0057] 図 7は、スレッド状態テーブル 34を説明する図である。スレッド状態テーブル 34は、スレッドグループ ID70、スレッドグループに属するスレッド数 72、スレッドグループの遷移状態 74、スレッドグループに属するスレッド 76、およびスレッドグループの優先度 78を対応づけて格納する。スレッドの生成と削除、スレッドグループの設定と状態変化、優先度の設定などがあると、スレッド状態管理部 32はスレッド状態テーブル 34 を更新する。

[0058] 同図の例では、グループ ID1の第 1スレッドグループは、スレッド数が 3で、 3つのスレッド thla、 thlb、 thlcを含み、優先度は 1に設定されており、現在の遷移状態は実行中である。グループ ID2の第 2スレッドグループは、スレッド数が 1で、 1つのスレッド th2aを含み、優先度は 2に設定されており、現在の遷移状態は実行中である。グループ ID3の第 3スレッドグループは、スレッド数が 2で、 2つのスレッド th3a、 th3bを含み、優先度は 2に設定されており、現在の遷移状態は実行待ちである。グループ I D4の第 4スレッドグループは、スレッド数が 1で、 1つのスレッド th4aを含み、優先度は 4に設定されており、現在の遷移状態は実行待ちである。優先度は値が小さいほど優先度が高いとし、優先度は、ここでは 16段階とするが、 256段階にするなど設計の自由度がある。

[0059] スレッド状態管理部 32は、スレッド状態テーブル 34で管理されているスレッドダループの内、実行待ち状態または実行中状態にあるスレッドグループを実行待ちキュ一 30にキューイングする。実行待ちキュー 30は、実行待ち状態または実行中状態にあるスレッドグループをスレッドグループ毎に設定された優先度順で、かつ同一優先度内では先に入れられたものが先に取り出される FIFO (First In First Out)順で優先順位を決めてキューイングした待ち行列である。

[0060] 図 8は、実行待ちキュー 30を説明する図である。優先度 1〜16のリストの各エントリには、その優先度をもつスレッドグループのプライマリスレッドが FIFO順でキューイングされる。

[0061] 同図の例では、優先度 1のエントリには、第 1スレッドグループのプライマリスレッド pt hiがキューイングされ、優先度 2のエントリには、第 2スレッドグループのプライマリスレッド pth2と第 3スレッドグループのプライマリスレッド pth3がこの順でキューイングされ、優先度 4のエントリには、第 4スレッドグループのプライマリスレッド pth4がキューイングされて、る。第 2スレッドグループは第 3スレッドグループよりも先にキューに入れられたため、第 2スレッドグループのプライマリスレッド pth2は第 3スレッドグループのプライマリスレッド pth3よりも先にキューイングされている。

[0062] 実行待ちキュー 30の先頭の位置にある優先度 1のプライマリスレッド pthlから優先度 2のエントリの先頭にキューイングされているプライマリスレッド pth2にリンクがつけられる。さらに優先度 2のエントリの最初のプライマリスレッド pth2から同一優先度内で次にキューイングされているプライマリスレッド pth3にリンクがつけられ、さらにそのプライマリスレッド pth3から優先度 4のプライマリスレッド pth4にリンクがつけられる。これによつて、プライマリスレッド pthl、 pth2、 pth3、 pth4の順に取り出すことができるように優先順位が決められた実行待ちキュー 30が生成される。

[0063] スレッド状態管理部 32は、スレッドグループの状態が実行待ち、実行中の!/、ずれの状態でもなくなった場合、実行待ちキュー 30からそのスレッドグループのプライマリスレッドを削除する。また、新たに生成され、スタートコマンドにより実行待ち状態になつたスレッドグループのプライマリスレッドや、同期待ち状態などから復帰して実行待ち状態になったスレッドグループのプライマリスレッドを該当する優先度のエントリに FIF O順で挿入し、実行待ちキュー 30を更新する。

[0064] スケジューラ 10は、実行待ちキュー 30にキューイングされているスレッドグループを先頭から取り出して、プロセッサに割り当てる制御をするものであり、割り当てリスト生成部 12とスレッド割り当て部 14とを含む。スレッド状態管理部 32は、スレッドグループの状態が同期待ち、中断などの状態に遷移したり、スレッドが終了することにより、再スケジューリングが必要となった場合、割り当てリスト生成部 12に通知する。

[0065] 割り当てリスト生成部 12は、スレッド状態管理部 32から再スケジューリングの指示を受けて、これから述べる「マーキング処理」または「割り当てリスト生成処理」を行う。

[0066] 割り当てリスト生成部 12は、割り当てスレッド数カウンタ 16、スレッド割り当てリスト 18

、およびスケジューリング配列 20を利用して、スレッドスケジューリングを行う。

[0067] 割り当てスレッド数カウンタ 16は、プロセッサ 130に割り当てるスレッド数をカウントするものであり、以下、単に「カウンタ」という。スレッド割り当てリスト 18は、プロセッサ 130に割り当てるスレッドグループのプライマリスレッドを格納するものであり、以下、単に「割り当てリスト」という。スケジューリング配列 20は、スレッドのプロセッサ 130への割り当て状況を保持するスケジュールテーブルであり、個々のプロセッサ 130を特定するプロセッサ番号とそのプロセッサ 130に割り当てられたスレッドとを対応づけた配列である。

[0068] 図 9は、スケジューリング配列 20を説明する図である。スケジューリング配列 20は、プロセッサ番号 80、そのプロセッサに割り当てられたスレッド 82、およびマーク 84が対応づけて格納される。プロセッサ番号 80は、プロセッサに一意に対応する識別番号である。マーク 84は、割り当てリスト生成部 12のマーキング処理において、スレッドのプロセッサへの割り当てを確保するためのフラグとして用いられる。同図の例では、プロセッサ総数は 4であり、第 1〜第 4プロセッサが 1から 4の番号で識別される。プロセッサ番号 1〜3には、第 1スレッドグループの 3つのスレッド thla、 thlb、 thlcがそれぞれ割り当てられ、プロセッサ番号 4には、第 2スレッドグループのスレッド th2aが割り当てられている。

[0069] 割り当てリスト生成部 12は、スレッドスケジューリングを開始するにあたって、カウンタ 16をゼロに初期化し、割り当てリスト 18を空にする。

[0070] 割り当てリスト生成部 12は、実行待ちキュー 30の先頭力も順にプライマリスレッドを取り出す。以下、取り出したプライマリスレッドが属するスレッドグループを「割り当て候補スレッドグループ」と呼ぶ。割り当てリスト生成部 12は、割り当て候補スレッドグループに属するスレッドの個数をカウンタ 16に加算する。カウンタ 16の値がマルチプロセッサシステムのプロセッサ総数を超えてしまう場合は、割り当てリスト生成部 12は、その割り当て候補スレッドグループを割り当て候補カゝら外して、カウンタ 16の値を加算前の値に戻す。

[0071] 割り当てリスト生成部 12は、スケジューリング配列 20を参照することにより、実行待ちキュー 30から順次取り出した割り当て候補スレッドグループが、既に実行中の状態にあるかどうかを調べる。割り当て候補スレッドグループに属する各スレッドがスケジュ一リング配列 20にあれば、その割り当て候補スレッドグループに属する各スレッドは実行中である。その場合、スケジューリング配列 20において、実行中のスレッドが割り当てられているプロセッサ番号にマークをつける。これを「マーキング処理」という。マ一キング処理により、マークをつけたプロセッサ番号に既に割り当てられたスレッドは、他のプロセッサに割り当て先を変更されて再配置されないように、当該プロセッサへの割り当てが確保される。

[0072] 割り当てリスト生成部 12は、割り当て候補スレッドグループに属する各スレッドがスケジユーリング配列 20にない場合、すなわち、その割り当て候補スレッドグループは実行中状態でな、場合は、その割り当て候補スレッドグループのプライマリスレッドを割り当てリスト ₁₈に追加する。これを「割り当てリスト生成処理」という。割り当てリスト生成処理によって、割り当てリスト 18には、今回のスケジューリングで新たにプロセッサ 130に割り当てられるスレッドグループがリストアップされる。

[0073] 割り当てリスト生成部 12は、カウンタ 16の値がプロセッサ総数に達する力実行待ちキュー 30の末尾力もプライマリスレッドを取り出すに至るまで、マーキング処理、割り当てリスト生成処理の!/ヽずれかを繰り返し行う。

[0074] 割り当てリスト生成部 12による処理が終了すると、スレッド割り当て部 14は、割り当てリスト 18からプライマリスレッドを取り出し、そのスレッドグループに属するすべてのスレッドをスケジューリング配列 20のマークされて!/ヽな、プロセッサ番号に割り振る。このとき、マークされていないプロセッサ番号に割り当てられて実行中状態にあったスレッドは、プリェンブトされ、実行待ち状態に遷移する。スレッド割り当て部 14は、スレッド状態管理部 32にプリェンブトされたスレッドを通知し、スレッド状態管理部 32はスレッド状態テーブル 34を更新し、そのスレッドの状態変化を管理する。

[0075] スレッドの割り当て状況を保持するスケジューリング配列 20にしたがって、実際にスレッドはプロセッサ 130に割り当てられ、実行に移される。これによつて、既に実行中状態にあったスレッドは、継続して同じプロセッサ 130上で実行され、実行待ち状態にあったスレッドはプロセッサ 130に新たに割り当てられ、実行中状態に変化する。スレッド状態管理部 32は、スレッド状態テーブル 34を更新して各スレッドの状態変化を管理する。

[0076] 図 10は、以上の構成のスケジューリング装置 200によるスレッドスケジューリング手順を説明するフローチャートである。

[0077] スレッド状態管理部 32は、スレッドの遷移状態が実行中状態力も同期待ち状態や中断状態に変わったり、スレッドが終了した場合に、割り当てリスト生成部 12にスレツドのスケジューリングを指示する。割り当てリスト生成部 12は、カウンタ 16と割り当てリスト 18を初期化する（S10)。

[0078] 割り当てリスト生成部 12は、実行待ちキュー 30の先頭力も割り当て候補スレッドグループを取り出す (S 12)。割り当てリスト生成部 12は、割り当て候補スレッドグループに属するスレッドの個数をカウンタ 16にカロ算することにより、害り当てスレッド数をカウントする（S14)。

[0079] 割り当てリスト生成部 12は、カウンタ 16の値がプロセッサ総数以下であるかどうかを判定する（S16)。カウンタ 16の値がプロセッサ総数を超えていた場合、その割り当て候補スレッドグループに属するすべてのスレッドを同時にいずれかのプロセッサに割り当てることはできな!、ため、カウンタ 16から当該割り当て候補スレッドグループのスレッド数を減算してカウンタ値を元に戻し（S 18)、ステップ S26の処理に進む。

[0080] カウンタ 16の値がプロセッサ総数以下である場合（S 16の Y)、割り当てリスト生成部 12は、割り当て候補スレッドグループに属する各スレッドがスケジューリング配列 2 0に格納されているかどうかを調べる（S20)。スケジューリング配列 20において、割り当て候補スレッドグループに属するスレッドがいずれかのプロセッサ番号に割り振られて、れば、そのスレッドは前回のスケジューリングにお!/、てそのプロセッサに割り当てられて実行されていたことになる。

[0081] 割り当てリスト生成部 12は、割り当て候補スレッドグループに属する各スレッドがスケジユーリング配列 20に存在する場合（S20の Y)、スケジューリング配列 20において、そのスレッドが割り振られているプロセッサ番号にマークを付ける（S22)。マークされたプロセッサ番号に割り当てられたスレッドは、他のプロセッサに割り当て先を変更されて再配置されなヽように、当該プロセッサへの割り当てが確保される。

[0082] 割り当てリスト生成部 12は、割り当て候補スレッドグループに属する各スレッドがスケジユーリング配列 20に存在しない場合 (S20の N)、割り当てリスト生成部 12は、その割り当て候補スレッドグループを割り当てリスト 18に追加する（S23)。

[0083] 割り当てリスト生成部 12は、カウンタ 16の値がプロセッサ総数に等しい場合（S24 の Y)、それ以上のスレッドの割り当てはできないため、割り当てリスト 18の生成を終了し、ステップ S30に進む。また、割り当てリスト生成部 12は、割り当て候補スレッドグループが実行待ちキュー 30の末尾力も取り出されたものである場合（S26の Y)、もはや次に割り当てるべきスレッドがないから、この場合も割り当てリスト 18の生成を終了し、ステップ S30に進む。

[0084] 割り当てリスト生成部 12は、カウンタ 16の値がプロセッサ数に達しておらず（S24の N)、割り当て候補スレッドグループが実行待ちキュー 30の末尾カゝら取り出されたものでない場合（S26の N)、実行待ちキュー 30の次のスレッドグループを取り出し（S28 )、ステップ S14以降の処理を繰り返す。

[0085] ステップ S30において、スレッド割り当て部 14は、割り当てリスト 18に格納されたスレッドグループに属する各スレッドをスケジューリング配列 20にお!/、てマークされて!/ヽないプロセッサ番号に割り振る。このとき、マークされていないプロセッサ番号に既に割り振られて、たスレッドはそのプロセッサへの割り当てを横取りされる。割り当てリスト 18に格納されたすベてのスレッドグループについて、プロセッサ番号への割り振り処理が完了した時点で、一連のスレッドスケジューリング処理は終了する。

[0086] 以下、上記のスレッドスケジューリング手順をいくつかの例を用いて説明する。図 11 〜図 13は、図 7のスレッド状態テーブル 34に示された条件の下でのスレッドスケジュ一リング手順を説明する図である。

[0087] マルチプロセッサシステムのプロセッサ総数は 4であるとする。 4個のスレッドグルーブカ^、ずれも実行待ちの状態にあり、 V、ずれのスレッドもまだプロセッサに割り当てられて、な、初期状態にあるとする。このときの時刻を toとする。 [0088] 図 11 (a)は、実行待ちキュー 30の初期状態であり、第 1スレッドグループのプライマリスレッド pthl (以下、第 1プライマリスレッドと呼ぶ）は優先度 1のエントリに、第 2スレッドグループのプライマリスレッド pth2 (以下、第 2プライマリスレッドと呼ぶ）と第 3スレッドグループのプライマリスレッド pth3 (以下、第 3プライマリスレッドと呼ぶ）は優先度 2のエントリに、第 4スレッドグループのプライマリスレッド pth4 (以下、第 4プライマリスレッドと呼ぶ）は優先度 4のエントリにそれぞれキューイングされて、る。

[0089] ここで、第 2プライマリスレッド pth2は第 3プライマリスレッド pth3よりも先にキューィングされている。したがって、実行待ちキュー 30は、第 1プライマリスレッド pthl、第 2 プライマリスレッド pth2、第 3プライマリスレッド pth3、第 4プライマリスレッド pth4の順に優先順位が決められた待ち行列になる。

[0090] 図 11 (b)は、割り当てリスト生成部 12によるマーキング処理と割り当てリスト生成処理の過程を説明する図である。処理過程テーブル 15は、割り当てリスト生成部 12が実行待ちキュー 30の先頭力も順次取り出したプライマリスレッドに対して、マーキング処理か割り当てリスト生成処理のいずれを行つたかを示し、また、そのときのカウンタ 1 6の値を示す。

[0091] 割り当てリスト生成部 12は、図 11 (a)の実行待ちキュー 30の先頭力も第 1プライマリスレッド pthlを取り出し、第 1スレッドグループのスレッド数 3をカウンタ 16に加算する。スケジューリング配列 20は空の状態であり、いずれのスレッドもマーキング処理の対象となることはないから、第 1プライマリスレッド pthlはそのまま割り当てリスト 18に格納される。

[0092] 次に、割り当てリスト生成部 12は、図 11 (a)の実行待ちキュー 30の次のエントリである第 2プライマリスレッド pth2を取り出し、第 2スレッドグループのスレッド数 1をカウンタ 16に加算する。第 2プライマリスレッド pth2は、同様にマーキング処理の対象となることはなく、割り当てリスト 18に追加される。このときカウンタ値は 4になっており、プ口セッサ総数に達しているため、割り当てリスト生成部 12は、割り当てリスト 18の生成を終了する。

[0093] スレッド割り当て部 14は、図 11 (b)の割り当てリスト 18にリストアップされた第 1、第 2 スレッドグループに属するすべてのスレッドをスケジューリング配列 20のマークされて V、な、プロセッサ番号に割り振る。

[0094] 図 11 (c)は、割り当てリスト 18にしたがってスレッドが割り振られたスケジューリング配列 20を示す。いずれのプロセッサ番号もマークされておらず、第 1〜第 3プロセッサには第 1スレッドグループの 3つのスレッド thla、 thlb、 thlcが割り振られ、第 4プ口セッサには第 2スレッドグループの 1つのスレッド th2aが割り振られる。これによつて、現時刻 toにおけるスレッドスケジューリングが完了する。

[0095] その後、時刻 tlにおいて、第 1スレッドグループの各スレッドが同期待ちになったり、中断するか、終了するなど、実行中状態でも実行待ち状態でもない状態になったとする。図 12 (a)は、時刻 tlにおける実行待ちキュー 30を示す図である。第 1プライマリスレッド pthlは実行待ちでも実行中でもなくなるため、スレッド状態管理部 32は、第 1プライマリスレッド pthlを実行待ちキュー 30から外す。その結果、時刻 tlでは、実行待ちキュー 30の先頭は第 2プライマリスレッド pth2となっている。

[0096] 割り当てリスト生成部 12は、スレッド状態管理部 32の通知を受けて、カウンタ 16と割り当てリスト ₁₈を初期化して、スケジューリングを開始する。図 12 (b)は、時刻 tlにおける割り当てリスト生成部 12によるマーキング処理と割り当てリスト生成処理の過程を示す。

[0097] 割り当てリスト生成部 12は、実行待ちキュー 30の先頭力も第 2プライマリスレッド pth 2を取り出し、カウンタ 16に第 2スレッドグループのスレッド数 1を加算し、カウンタ値を 1とする。

[0098] 割り当てリスト生成部 12は、第 2スレッドグループのスレッド th2aがスケジューリング配列 20にあるかどうかを調べる。この時点でスケジューリング配列 20は、 1つ前の時刻 tOにおける図 11 (c)の状態にあり、第 2スレッドグループのスレッド th2aはプロセッサ番号 4に割り振られているから、割り当てリスト生成部 12は、図 12 (c)のように、スケジユーリング配列 20のプロセッサ番号 4にマークを付ける。

[0099] 次に、割り当てリスト生成部 12は、実行待ちキュー 30の次のエントリである第 3ブライマリスレッド pth3を取り出し、カウンタ 16に第 3スレッドグループのスレッド数 2を加算し、カウンタ値を 3とする。

[0100] 割り当てリスト生成部 12は、第 3スレッドグループのスレッド th3a、 th3bがスケジュ一リング配列 20にあるかどうかを調べる。第 3スレッドグループのスレッド th3a、 th3b は、図 11 (c)に示す時刻 tOにおけるスケジューリング配列 20にはないことから、割り当てリスト生成部 12は、第 3プライマリスレッド pth3を割り当てリスト 18に追加する。

[0101] 割り当てリスト生成部 12は、実行待ちキュー 30のさらに次のエントリである第 4ブライマリスレッド pth4を取り出し、第 4スレッドグループのスレッド数 1をカウンタ 16に加算し、カウンタ値を 4とする。

[0102] 割り当てリスト生成部 12は、同様にして、第 4スレッドグループのスレッド th4aがスケジユーリング配列 20にないことから、割り当てリスト 18に第 4プライマリスレッド pth4を追加する。割り当てリスト生成部 12は、カウンタ 16の値がプロセッサ総数 4に達しているため、割り当てリスト 18の生成を終了する。

[0103] スレッド割り当て部 14は、図 12 (b)の割り当てリスト 18にリストアップされた第 3、第 4 スレッドグループに属するすべてのスレッドをスケジューリング配列 20のマークされて V、な、プロセッサ番号に割り振る。

[0104] 図 12 (c)は、割り当てリスト 18にしたがってスレッドが割り振られたスケジューリング配列 20を示す図である。プロセッサ番号 4はマークされているため、そのプロセッサ番号に割り振られた第 2スレッドグループのスレッド th2aはそのまま割り当てが維持される。マークされていないプロセッサ番号 1〜3には、第 3スレッドグループの 2つのスレッド th3a、 th3b、第 4スレッドグループの 1つのスレッド th4aがそれぞれ割り振られる。これによつて、現時刻 tlにおけるスレッドスケジューリングが完了する。

[0105] 図 13は、図 11および図 12で説明したスレッドスケジューリングによるスレッドの割り当て状態の時間変化を示す図である。時刻 tOにおいて、第 1〜第 3プロセッサ（PE1 〜PE3)には、第 1スレッドグループの 3つのスレッド thla〜thlcがそれぞれ割り当てられ、第 4プロセッサ（PE4)には、第 2スレッドグループのスレッド th2aが割り当てられて実行される。

[0106] 時刻 tlにおいて、第 1スレッドグループの 3つのスレッド thla〜thlcが同期待ちになるなどにより実行待ちキュー 30から外れたため、再スケジューリングが行われる力その時点で最も優先順位が高い第 2スレッドグループのスレッド th2aは第 4プロセッサに割り当てられたまま継続して実行され、空いた第 1〜第 3プロセッサには、第 3スレッドグノレープの 2つのスレッド th3a、 th3b、第 4スレッドグノレープの 1つのスレッド th

4aがそれぞれ割り当てられて実行される。

[0107] 図 14〜図 16は、別のスレッドスケジューリング例を説明する図である。この例において、「優先順位の逆転」が起こることを説明する。

[0108] 図 14は、本例におけるスレッド状態テーブル 34を示す。第 3スレッドグループのスレッド数は 4である点だけが図 7の例とは異なり、それ以外の条件は図 7の例と同じである。したがって、最初の時刻 tOにおけるスケジューリング結果は、図 11と同じであるから説明を省略する。第 1スレッドグループの各スレッドが同期待ちになるなどにより、実行待ちキュー 30から外れた時刻 tlにおけるスケジューリング手順を説明する。

[0109] 図 15 (a)は、時刻 tlにおける実行待ちキュー 30の状態を示す図である。図 12 (a) と同様、第 1プライマリスレッド pthlが実行待ちキュー 30から外れた結果、実行待ちキュー 30の先頭は第 2プライマリスレッド pth2となる。

[0110] 図 15 (b)は、時刻 tlにおける割り当てリスト生成部 12によるマーキング処理と割り当てリスト生成処理の過程を説明する図である。

[0111] 割り当てリスト生成部 12は、実行待ちキュー 30の先頭力も第 2プライマリスレッド pth

2を取り出し、カウンタ 16に第 2スレッドグループのスレッド数 1を加算し、カウンタ値を

1とする。

[0112] 割り当てリスト生成部 12は、第 2スレッドグループのスレッド th2aがスケジューリング配列 20にあることから、図 15 (c)のように、スケジューリング配列 20においてスレッド t h2aが割り振られたプロセッサ番号 4にマークを付ける。

[0113] 次に、割り当てリスト生成部 12は、実行待ちキュー 30の次のエントリである第 3ブライマリスレッド pth3を取り出す。割り当てリスト生成部 12は、カウンタ 16に第 3スレッドグループのスレッド数 4をカ卩算すると、カウンタ値は 5になることから、第 3スレッドグループの割り当てはできな、と判定し、第 3スレッドグループにつ、ては割り当て候補から外し、マーキング処理も割り当てリスト生成処理も行わな、。

[0114] 割り当てリスト生成部 12は、実行待ちキュー 30のさらに次のエントリである第 4ブライマリスレッド pth4を取り出す。カウンタ 16に第 4スレッドグループのスレッド数 1をカロ算し、カウンタ値を 2とする。割り当てリスト生成部 12は、第 4スレッドグループのスレツド th4aがスケジューリング配列 20にないことから、割り当てリスト 18に第 4プライマリスレッド pth4を追加する。第 4スレッドグループのスレッド th4aは実行待ちキュー 30の最後のエントリであるから、割り当てリスト生成部 12は、割り当てリスト 18の生成を終了する。

[0115] スレッド割り当て部 14は、図 15 (b)の割り当てリスト 18にリストアップされた第 4スレツドグループに属するすべてのスレッドをスケジューリング配列 20のマークされていな Vヽプロセッサ番号に割り振る。

[0116] 図 15 (c)は、割り当てリスト 18にしたがってスレッドの割り当てが行われたスケジュ一リング配列 20を示す。マークされたプロセッサ番号 4に割り当てられた第 2スレッドグループのスレッド th2aはそのまま割り振りが維持され、マークされて!/ヽな、プロセッサ番号 1に、第 4スレッドグループの 1つのスレッド th4aが割り振られる。これによつて、現時刻 tlにおけるスレッドのスケジューリングが完了する。

[0117] 図 16は、本例におけるスレッドの割り当て状態の時間変化を示す図である。時刻 tO におけるスレッドの割り当ては図 13と同じである。時刻 tlにおいて、最も優先されるべき第 2スレッドグループのスレッド th2aが実行中のまま状態が維持されるのは図 13 と同じであるが、次に優先されるべき第 3スレッドグループはスレッド数力であるため、空きプロセッサに割り当てることができず、優先順位が第 3スレッドグループよりも低 V、第 4スレッドグループのスレッド th4aが第 1プロセッサに割り当てられて実行される。

[0118] このように、同一スレッドグループに属するすべてのスレッド数を同時にいずれかのプロセッサに割り当てると、う制約があるため、優先順位を最大限守ると!、ぅスケジュ一リングポリシーでスケジューリングを行って、ても、プロセッサ資源の利用効率を上げるために、優先順位を逆転させることがある。

[0119] 上記の例のようにスレッドスケジューリングにおいて優先順位の逆転が起こる条件を定式化すると次のようになる。 H、 M、 Lをスレッドグループとし、 P (X)をスレッドグループ Xの優先度、 N (X)をスレッドグループ Xに属するスレッドの個数、 nをプロセッサ総数とすると、優先度について P (H)≥P (M) >P (L)が成り立つ場合であって、スレッド数について、以下の関係が成り立つとき、優先順位の逆転が起こる。

N (H) +N (M) >n N (H) +N (L)≤n

[0120] 上記の関係式が成り立つ場合、スレッドグループ Mに属するすべてのスレッドをプ口セッサに割り当てることはできな、が、優先度がそれよりも低、スレッドグループ N に属するすべてのスレッドはプロセッサに割り当てることができるため、本実施の形態のスレッドスケジューリング方式では、プロセッサの使用効率を上げるために、優先順位を逆転させて、優先順位がより低、スレッドグループ Nを割り当てる。

[0121] 図 17〜図 22は、さらに別のスレッドスケジューリング例を説明する図である。この例では、すでに割り当てられたスレッドが他の優先順位の高、スレッドによってプロセッサへの割り当てを横取りされる状況を説明する。

[0122] 図 17は、スレッド状態テーブル 34を説明する図である。第 1スレッドグループ力も第 5スレッドグループまでのスレッドグループがあり、スレッド数はそれぞれ 2、 3、 1、 1、 3 であり、優先度はそれぞれ 1、 2、 3、 4、 5である。

[0123] 図 18 (a)〜（c)は、最初の時刻 tOにおけるスケジューリングを説明する図である。実行待ちキュー 30は、図 18 (a)のように、第 1〜第 5プライマリスレッド pthl〜pth5がこの順でキューに入っている。

[0124] 図 18 (b)は、割り当てリスト生成部 12によるマーキング処理と割り当てリスト生成処理の過程を示す。割り当てリスト生成部 12は、実行待ちキュー 30の先頭力も第 1ブライマリスレッド pthlを取り出し、カウンタ 16にスレッド数 2をカ卩算し、カウンタ値を 2とするとともに、第 1プライマリスレッド pthlを割り当てリスト 18に追加する。

[0125] 割り当てリスト生成部 12は、実行待ちキュー 30の次のエントリである第 2プライマリスレッド pth2を取り出す力第 2スレッドグループのスレッド数は 3であり、カウンタ 16に加算するとプロセッサ総数 4を超えるため、第 2スレッドグループは割り当てることができない。

[0126] そこで、割り当てリスト生成部 12は、実行待ちキュー 30のさらに次のエントリである第 3プライマリスレッド pth3を取り出し、第 3スレッドグループのスレッド数 1をカウンタ 1 6に加算し、カウンタ値を 3とし、第 3プライマリスレッド pth3を割り当てリスト 18に追カロする。これにより、第 2スレッドグループよりも優先順位が低い第 3スレッドグループが優先的にプロセッサに割り当てられる優先順位の逆転が起こる。 [0127] さらに、割り当てリスト生成部 12は、実行待ちキュー 30の次のエントリである第 4ブライマリスレッド pth4を取り出し、第 4スレッドグループのスレッド数 1をカウンタ 16に加算し、カウンタ値を 4とし、第 4プライマリスレッド pth4を割り当てリスト 18に追加する。割り当てリスト生成部 12は、カウンタ 16の値がプロセッサ総数 4に達したため、割り当てリスト 18の生成を終了する。

[0128] スレッド割り当て部 14は、図 18 (b)の割り当てリスト 18にリストアップされた第 1、第 3 、および第 4スレッドグループに属する各スレッドをスケジューリング配列 20に割り振る。図 18 (c)のように、プロセッサ番号 1、 2には第 1スレッドグループの 2つのスレッド la、スレッド lbがそれぞれ割り振られ、プロセッサ番号 3には第 3スレッドグループのスレッド 3aが割り振られ、プロセッサ番号には第 4スレッドグループのスレッド th4aが割り振られる。

[0129] その後、時刻 tlにおいて第 1スレッドグループの各スレッドが同期待ちになったとする。その結果、図 19 (a)のように、実行待ちキュー 30の先頭は第 2プライマリスレッド p th2になる。

[0130] 割り当てリスト生成部 12は、図 19 (b)のように、実行待ちキュー 30の先頭力も第 2プライマリスレッド pth2を取り出し、第 2スレッドグループのスレッド数 3をカウンタ 16に加算し、カウンタ値を 3とする。第 2スレッドグループのスレッドは 1つ前の時刻 tOにおけるスケジューリング配列 20にないから、割り当てリスト生成部 12は、第 2プライマリスレッド pth2を割り当てリスト 18に追加する。

[0131] 次に、割り当てリスト生成部 12は、実行待ちキュー 30の次のエントリである第 3ブライマリスレッド pth3を取り出し、第 3スレッドグループのスレッド数 1をカウンタ 16に加算し、カウンタ値を 4とする。第 3スレッドグループのスレッド th3aは、 1つ前の時刻 tO におけるスケジューリング配列 20にあるから、割り当てリスト生成部 12は、図 19 (c)のように、スケジューリング配列 20にお!/、て第 3スレッドグループのスレッド th3aが割り振られたプロセッサ番号 3にマークを付ける。

[0132] カウンタ 16の値がプロセッサ総数 4に達したため、スレッド割り当て部 14は、図 19 ( c)のように、割り当てリスト 18にリストされた第 2スレッドグループに属する 3つのスレツド th2a、 th2b、 th2cをスケジューリング配列 20のマークされていないプロセッサ番号 1、 2、 4に割り振る。このとき、プロセッサ番号 4に割り振られていた第 4スレッドグループのスレッド th4aはプロセッサへの割り当てを第 2スレッドグノレープのスレッド th2cによって横取りされる。

[0133] 時刻 t2において、第 3スレッドグループのスレッド th3aが終了したとする。これにより、図 20 (a)に示すように、実行待ちキュー 30から第 3プライマリスレッド pth3が外される。

[0134] 図 20 (b)に示すように、割り当てリスト生成部 12は、実行待ちキュー 30の先頭から第 2プライマリスレッド pth2を取り出し、第 2スレッドグループのスレッド数 3をカウンタ 1 6に加算し、カウンタ値を 3とする。割り当てリスト生成部 12は、第 2スレッドグループの各スレッドはスケジューリング配列 20に既にあるため、図 20 (c)のように、第 2スレッドグループのスレッド th2a、 th2b、 th2cが割り振られているプロセッサ番号 1、 2、 4にマークを付ける。

[0135] 次に、割り当てリスト生成部 12は、実行待ちキュー 30の次のエントリである第 4ブライマリスレッド pth4を取り出し、第 4スレッドグループのスレッド数 1をカウンタ 16に加算し、カウンタ値を 4とし、第 4スレッドグループのスレッドはスケジューリング配列 20にな、から、第 4プライマリスレッド pth4を割り当てリスト 18に追加する。

[0136] カウンタ 16の値がプロセッサ総数 4に達したため、スレッド割り当て部 14は、図 20 ( c)のように、割り当てリスト 18にリストされた第 4スレッドグループのスレッド th4aをスケジユーリング配列 20のマークされていないプロセッサ番号 3に割り振る。

[0137] 時刻 t3において、第 2スレッドグループのスレッド th2aが終了したとする。これにより、図 21 (a)に示すように、実行待ちキュー 30から第 2プライマリスレッド pth2が外される。

[0138] 図 21 (b)に示すように、割り当てリスト生成部 12は、実行待ちキュー 30の先頭から第 4プライマリスレッド pth4を取り出し、第 4スレッドグループのスレッド数 1をカウンタ 1 6に加算し、カウンタ値を 1とする。割り当てリスト生成部 12は、第 4スレッドグループの各スレッドはスケジューリング配列 20に既にあるため、図 21 (c)のように、第 4スレッドグループのスレッド th4aが割り当てられているプロセッサ番号 3にマークをつける。

[0139] 次に、割り当てリスト生成部 12は、実行待ちキュー 30の次のエントリである第 5ブライマリスレッド pth5を取り出し、カウンタ 16に第 5スレッドグループのスレッド数 3を加算し、カウンタ値を 4とする。第 5スレッドグループのスレッドはスケジューリング配列 20 にないから、第 5プライマリスレッド pth5を割り当てリスト 18に追加される。

[0140] カウンタ 16の値がプロセッサ総数 4に達したため、スレッド割り当て部 14は、図 21 ( c)のように、割り当てリスト 18にリストされた第 5スレッドグループのスレッド th5a、 th5 b、 th5cをスケジューリング配列 20のマークされていないプロセッサ番号 1、 2、 4にそれぞれ割り当てる。

[0141] 図 22は、本例におけるスレッドの割り当て状態の時間変化を示す図である。時刻 tO では、第 1プロセッサ、第 2プロセッサに第 1スレッドグループの 2つのスレッド thla、 t hlbが割り当てられ、第 3プロセッサに第 3スレッドグループのスレッド th3aが割り当てられ、第 4プロセッサに第 4スレッドグループのスレッド th4aが割り当てられて実行される。

[0142] 時刻 tlにおいて、第 1スレッドグループが同期待ちとなり、再スケジューリングが起こる。このとき、その時点で最も優先順位が高い第 2スレッドグループの 3つのスレッド th 2a、 th2b、 th2cが割り当てられるため、第 4プロセッサに割り当てられていた優先順位の低い第 4スレッドグループのスレッド th4aはプリェンブトされる。し力し、時刻 t2において、第 3スレッドグループが終了すると、代わりに第 4スレッドグループのスレッド t h4aが第 3プロセッサに割り当てられる。時刻 t3において、第 2スレッドグループが終了すると、代わりに第 5スレッドグループのスレッド th5a、 th5b、 th5cが第 1、第 2、第 4プロセッサにそれぞれ割り当てられる。

[0143] 以上述べたように、本実施の形態のスケジューリング装置 200によれば、スレッドをグループ化し、同一スレッドグループに属する複数のスレッドは同時に!/、ずれかのプ口セッサに割り当てて実行することにより、マルチプロセッサシステムの同期 ·排他制御機構を利用して、スレッドグループ内のスレッド間で互、のアドレス空間を効率よく参照したり、メモリの排他処理を効率よく行うことができる。また、スレッド間で通信したり、メモリを共有する場合も、スレッドグループ内のスレッドは同時にプロセッサに割り当てられるため、効率よくスレッド間通信を行ったり、メモリの共有を行うことができる。

[0144] 仮に、同一スレッドグループに属する複数のスレッドの中に、プロセッサに割り当てられているものと、プロセッサに割り当てられずに、スレッドのコンテクストがメインメモリに退避されているものとがあるとすると、スレッドの実体が現在どこにあるかを知る必要があり、カーネルに問い合わせて、システムコールを通じてデータの読み出しをすることになり、そのための処理機構は複雑でコストがかかる。し力しながら、本実施の形態では、あるスレッドがプロセッサ上にある場合は、同一スレッドグループの他のスレッドも必ず他のプロセッサ上にあることが保証されるため、処理効率を高めることができる。

[0145] 本実施の形態のスレッドスケジューリングでは、同一スレッドグループに属するすべてのスレッドを同時にプロセッサに割り当てるという条件のもと、優先順位の高いスレッドを極力最優先にし、かつ、マルチプロセッサの資源の利用効率を最大限に上げることができる。優先順位の高いスレッドグループのスレッドを割り当てるために、先に割り当てられたより優先順位の低、スレッドはプリェンブトされる。このプリェンプションによって優先順位を守ることができる。また、プロセッサ総数の制約から、あるスレツドグループの割り当てができな、場合は、より優先順位の低、スレッドグループが優先され、優先順位の逆転が起こることもある。この優先順位の逆転によって、プロセッサの利用効率を高めることができる。

[0146] 本実施の形態の実行待ちキュー 30は、実行待ち状態にあるスレッドグループだけでなぐ実行中状態にあるスレッドグループも優先度順でかつ同一優先度内では FIF O順でキューイングしている。これにより、スレッドグループの FIFO順を守ってスケジユーリングができる。仮に、実行中状態にあるスレッドグループを実行待ちキュー 30 力外してしまうとすると、 FIFO順を維持するためには、 FIFO順を別途記憶しておく必要があり、処理が複雑になり、効率が低下することになる。し力しながら、本実施の形態では、実行中状態にあるスレッドグループも FIFO順で実行待ちキュー 30に保持するため、 FIFO順を維持しながら、割り当て処理を一括して行うことができる。そのため、割り当て処理の効率が良ぐ処理も簡単である。

[0147] また、本実施の形態では、割り当てリスト生成部 12がスケジューリング配列 20においてマーキング処理をすることにより、既に割り当てられたスレッドが割り当て先のプ口セッサを変更されて再配置されることがないことを保証することができる。実行中状態にあったスレッドが継続してスケジューリングされて実行される場合に、そのスレッドは同一のプロセッサにおいて連続して実行されることになるため、スレッドのプロセッサへの割り当て処理を省くことができ、処理効率が向上する。

[0148] 実施の形態 2

実施の形態 2に係るマルチプロセッサシステムは、図 1のマルチプロセッサシステムと同じ構成であり、スレッドスケジューリングにより、ある時刻に各プロセッサ 130には 1 つのスレッドが割り当てられ、マルチプロセッサシステム全体で並列に複数のスレッドが実行される。

[0149] 本実施の形態のマルチプロセッサシステムでは、複数のプロセッサ 130の内、少なくとも 1つのプロセッサ 130がスレッドスケジューリングの対象外となり、残りのプロセッサ 130にスレッドがスレッドスケジューリングにより割り当てられる点が実施の形態 1と異なる。

[0150] また、実施の形態 1では、 1つ以上のスレッドを含むスレッドグループが定義され、スレッドグループ単位でスケジューリングが行われた力本実施の形態では、スレッドグループは特に定義されず、スレッド単位でスケジューリングが行われる。スレッドスケジユーリング方式は、実施の形態 1で説明した優先度順かつ同一優先度内では FIF O順でスレッドのプロセッサへの割り当てを制御してもよぐ通常のラウンドロビン方式やプライオリティ方式を採用してもよい。

[0151] スレッドの割り当て対象外のプロセッシングエレメント 100 (以下、非割り当て対象 P Eという）のプロセッサ 130上には、当該プロセッシングエレメント 100内の資源を独占的に占有する実行実体が動作し、この実行実体は、スケジューリングの対象外であるため、いったんプロセッサに割り当てられると、当該プロセッサへの割り当てを横取りされることがない。以下、この非割り当て対象 PE上で動作するスケジューリング対象とならな、実行実体のことを、「非スケジューリング対象実行実体」と呼ぶ。

[0152] 非スケジューリング対象実行実体は、非割り当て対象 PE内のローカルメモリ 140やメモリ制御部 150内部のレジスタなどのすベての資源を占有して使用することができる。これは、スレッドスケジューリングによりプロセッシングエレメント 100に割り当てられたスレッド力プロセッシングエレメント 100内のローカルメモリ 140やメモリ制御部 1 50内部のレジスタなどのすベての資源を占有して使用することができることと同じである。また、非スケジューリング対象実行実体が占有する資源については、外側からすなわち他のプロセッシングエレメント 100からもアクセスできるように、一部のァクセスを許可しな、クリティカルな資源を除、て、ほとんどすべての資源がアドレス空間にマップされる。

[0153] 図 23は、あるプロセッサ 130に割り当てられたスレッドから見たアドレス空間 170を説明する図である。非割り当て対象 PEで動作する非スケジューリング対象実行実体が時間的に占有する資源は、他のプロセッシングエレメント 100で動作する各スレッドのアドレス空間 170にメモリマップされる。アドレス空間 170には、共有データを含むメインメモリがマップされたメインメモリ領域 172と、非スケジューリング対象実行実体の占有資源がマップされた非スケジューリング対象実行実体マップ領域 176とが含まれる。

[0154] 非スケジューリング対象実行実体マップ領域 176には、この例では、 2つの非スケジユーリング対象実行実体マップ # 1、 # 2が配置されている。すなわち、本例では、 2 つのプロセッシングエレメント 100が非割り当て対象 PEとして選ばれ、各非割り当て対象 PE上で非スケジューリング対象実行実体が動作して、る。各非スケジューリング対象実行実体マップ # 1、 # 2は、各非スケジューリング対象実行実体が非割り当て対象 PE内で占有する資源をメモリマップしたものであり、符号 177で示すように、ローカルメモリと、メモリ制御部 150を外部から制御するためのレジスタ群を含む。レジスタ群には、実施の形態 1で説明した同期通信のための通信用レジスタの他、プログラムの実行や停止を行うためのプログラム制御用レジスタや、 DMAを制御するための D

MA制御用レジスタなどがあり、実施の形態 1で説明した図 2のスレッドマップの場合とは異なり、これらのすべてのレジスタにアクセスが可能である。これらのレジスタにァクセスすることにより、非スケジューリング対象実行実体が占有するプロセッサ資源を直接、きめ細力べ操作することが可能である。

[0155] 第 1の非スケジューリング対象実行実体マップ # 1には、非スケジューリング対象実行実体ベースアドレスを先頭アドレスとして非スケジューリング対象実行実体マップのサイズ分の領域が割り当てられている。第 2の非スケジューリング対象実行実体マツプ # 2の先頭アドレスは、非スケジューリング対象実行実体ベースアドレスに非スケジユーリング対象実行実体マップのサイズに対応したオフセット値を加算したアドレスになる。この例では、 2つの非スケジューリング対象実行実体マップ # 1、 # 2しか配置されていないが、一般には、スレッドスケジューリングの対象外となり、非スケジユーリング対象実行実体が動作するプロセッシングエレメント 100の数だけ、非スケジユーリング対象実行実体マップが設けられる。

[0156] 非スケジューリング対象実行実体を生成する際に、生成関数の戻り値として返される ID力も非スケジューリング対象実行実体マップの番号が決まり、その非スケジユーリング対象実行実体がアドレス空間 170内のどの非スケジューリング対象実行実体マツプを使用するかが静的に決まる。各プロセッシングエレメント 100のメモリ制御部 150 は、各非スケジューリング対象実行実体がどの非スケジューリング対象実行実体マツプを使用している力ゝを非スケジューリング対象実行実体マップの設定情報として保持する。各プロセッシングエレメント 100のメモリ制御部 150は、各非スケジューリング対象実行実体の資源がどの非スケジューリング対象実行実体マップにメモリマップされている力を非スケジューリング対象実行実体マップの設定情報により把握することができ、アドレス空間 170の非スケジューリング対象実行実体マップにもとづいて、非スケジユーリング対象実行実体の資源に対するアクセス要求を DMAによって処理することができる。

[0157] たとえば、システム初期化時に第 1、第 2プロセッサがスレッドスケジューリングの対象力も外され、第 1プロセッサで第 1非スケジューリング対象実行実体 R1が動作し、第 2プロセッサで第 2非スケジューリング対象実行実体 R2が動作するとする。また、第 3、第 4プロセッサにスレッドがスケジューリングされて割り当てられるとする。

[0158] 第 1、第 2非スケジューリング対象実行実体 Rl、 R2の生成時に、スレッドのアドレス空間の第 1領域 ER1に第 1非スケジューリング対象実行実体 R1の資源カモリマツプされ、第 2領域 ER2に第 2非スケジューリング対象実行実体 R2の資源カモリマツプされたとする。スレッドスケジューリングにより、第 3プロセッサに第 1スレッド A1が割り当てられ、第 4プロセッサに第 2スレッド A2が割り当てられたとする。

[0159] このとき、第 3プロセッサ上で動作する第 1スレッド A1から、第 1非スケジューリング対象実行実体 R 1の非スケジューリング対象実行実体マップである第 1領域 ER 1にァクセスすると、第 1プロセッサの資源が第 1非スケジューリング対象実行実体 R1の資源として参照される。第 1スレッド A1から第 1非スケジューリング対象実行実体 R1の非スケジューリング対象実行実体マップである第 1領域 ER1へのアクセスは、第 1非スケジューリング対象実行実体 R1がどのプロセッサで動作しているかに関係なぐ必ず第 1非スケジューリング対象実行実体 R1の資源へのアクセスであることが保証される。第 1スレッド A1が第 2非スケジューリング対象実行実体 R2の非スケジューリング対象実行実体マップである第 2領域 ER2にアクセスする場合も同様である。

[0160] 第 4プロセッサ上で動作する第 2スレッド A2が第 1、第 2非スケジューリング対象実行実体 Rl、 R2の非スケジューリング対象実行実体マップである第 1領域 ER1、第 2 領域 ER2にアクセスする場合も全く同様である。

[0161] このように、いずれかのプロセッサ 130に割り当てられたスレッドは、アドレス空間 17 0内に設定された非スケジューリング対象実行実体マップのアドレスにアクセスすることで、非スケジューリング対象実行実体が占有する資源に DMAによって直接ァクセスすることができる。

[0162] スレッドがアドレス空間にメモリマップされた非スケジューリング対象実行実体の占有資源にアクセスすることにより、非スケジューリング対象実行実体が動作するプロセッサのハードウェア資源をシステムコールを介さずに直接的に操作することができ、スレッドが参照するアドレス空間には、非スケジューリング対象実行実体が占有する資源のほとんどがマップされているから、より多くのハードウェア資源の制御をユーザの管理にゆだねることができる。たとえば、プログラムの実行、停止などの操作を外側力行うことも可能になる。

[0163] また、実施の形態 1で述べた同期機構は、本実施の形態においても有効である。スレッドが、アドレス空間にメモリマップされた非スケジューリング対象実行実体の資源の一つであるメモリ制御部 150内の通信用レジスタに値を書き込む操作を行ヽ、非スケジユーリング対象実行実体がその通信用レジスタに対する書き込みの完了を待つことにより、非スケジューリング対象実行実体とスレッドの間で同期を取ることができる [0164] 非スケジューリング対象実行実体の他の使い方として、非スケジューリング対象実行実体の占有資源をグラフィックス表示装置などのデバイスのメモリ空間にメモリマツプし、非スケジューリング対象実行実体が動作するプロセッシングエレメント 100とグラフィックス表示装置との間で非スケジューリング対象実行実体の占有資源を利用した同期機構を実現してもよい。

[0165] 実施の形態 3

実施の形態 2のマルチプロセッサシステムでは、スレッドグループを定義しなかった力実施の形態 1と同様にスレッドをグループ化し、スレッドグループ単位でスケジュ一リングを行ってもよい。実施の形態 3のマルチプロセッサシステムは、実施の形態 1 のマルチプロセッサシステムにお!/、て、実施の形態 2で述べた非スケジューリング対象実行実体の占有資源をアドレス空間にメモリマップする方法を採用したものである

[0166] 本実施の形態のマルチプロセッサシステムでは、実施の形態 2と同様、複数のプロセッサ 130の内、少なくとも 1つのプロセッサ 130がスレッドスケジューリングの対象外となり、残りのプロセッサ 130にスレッドがスレッドスケジューリングにより割り当てられる。また、本実施の形態のマルチプロセッサシステムでは、実施の形態 1と同様、 1つ以上のスレッドを含むスレッドグループが定義され、スレッドグループ単位でスケジュ一リングが行われる。実施の形態 1および実施の形態 2と共通する構成と動作については説明を省略し、異なる構成と動作についてのみ説明する。

[0167] 図 24は、あるプロセッサ 130に割り当てられたスレッドから見たアドレス空間 170を説明する図である。アドレス空間 170には、共有データを含むメインメモリがマップされたメインメモリ領域 172と、同一グループ内の各スレッドの占有資源がマップされたスレッドマップ領域 174と、非スケジューリング対象実行実体の占有資源がマップされた非スケジューリング対象実行実体マップ領域 176とが含まれる。

[0168] スレッドマップ領域 174については、実施の形態 1で述べた通りであり、非スケジュ一リング対象実行実体マップ領域 176につ、ては、実施の形態 2で述べた通りである。なお、符号 175で示される各スレッドマップに含まれる資源と、符号 177で示される各非スケジューリング対象実行実体マップに含まれる資源は、スレッドマップに含まれる資源にはアクセスが許されないものがあるという違いはある力マップされる資源の種類としては同じであるから、両マップのサイズは同じであり、先頭アドレスに対するオフセット値は同じ値になる。

[0169] スレッドマップ領域 174は、同一グループに属するスレッドのアドレス空間に対して設定されるものであり、異なるグループに属するスレッドからは参照することができないが、非スケジューリング対象実行実体マップ領域 176は、スレッドの属するグループに関係なく固定して配置されており、同じアドレスで参照することができる。また、非スケジューリング対象実行実体マップ領域 176は、メインメモリ 120に退避されることがな、ため、スレッドのアドレス空間におヽて、つでも参照可能である。

[0170] 図 25は、本実施の形態のスレッドスケジューリングによるスレッドの割り当て状態の時間変化を示す図である。この例では、第 1および第 2プロセッサが非割り当て対象 P Eとして選ばれ、それ以外の第 3〜第 6プロセッサにスレッドがスケジュールされて割り当てられる。

[0171] 第 1プロセッサでは第 1非スケジューリング対象実行実体が実行され、第 2プロセッサでは第 2非スケジューリング対象実行実体が実行される。これらの非スケジユーリング対象実行実体は、スケジューリングの対象ではないため、非スケジューリング対象実行実体が削除されるまで、各プロセッサを時間的に占有し続ける。

[0172] 第 3〜第 6プロセッサについては、図 22で説明した実施の形態 1のスレッドスケジュ一リングの例と同じ方法でスレッドがスレッドグループ単位でスケジュールされて、割り当てられる。

[0173] なお、非スケジューリング対象実行実体が削除されてプロセッサへの割り当てが解放された場合は、そのプロセッサはスレッドの割り当てた対象に加えられてもよい。たとえば、第 2非スケジューリング対象実行実体が削除されて、第 2プロセッサが解放された場合、次のスケジューリングのタイミングにおいて、第 2プロセッサをスレッドの割り当て対象に追加し、第 2〜第 6プロセッサに対してスレッドをスケジューリングして割り当てるようにしてもよい。

[0174] 以上、本発明を実施の形態をもとに説明した。実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せに、ろ、ろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。

[0175] 上記の実施の形態では、マルチプロセッサシステムとして、すべてのプロセッシングエレメントが同じ構成である対称型マルチプロセッサシステムを例にあげて説明し、 Vヽずれか一つのプロセッシングエレメントがスレッドの管理'スケジューリング機能をもつように構成した。マルチプロセッサシステムは、管理用プロセッシングエレメントを含む非対称型マルチプロセッサシステムであってもよぐ管理用プロセッシングエレメントにスレッドの管理'スケジューリング機能をもたせてもよい。また、スケジューリング機能はオペレーティングシステム (OS)の機能の一部として実現されてもよぐ OS上で動作する一つのプロセスとして実現されてもょ、。

[0176] 上記の説明では、プロセス内部で生成されるスレッドを並列処理単位とするスレッドスケジューリングを説明した力本発明は、プロセスを並列処理単位としたプロセススケジユーリングにも同様に適用することができる。

産業上の利用可能性

[0177] 本発明は、マルチプロセッサのスケジューリング技術に適用することができる。

Claims

請求の範囲

[1] マルチプロセッサシステムにおいて、並列処理されるスケジューリング対象の実行単位を複数のプロセッサに割り当てる順序をスケジュールする方法であって、

1つ以上の前記スケジューリング対象の実行単位をグループ化し、同一グループに属する前記実行単位の各々により占有されるプロセッサ内の資源を互いに参照できるように、各実行単位が参照するアドレス空間に前記資源をマップし、同一グループに属するすべての前記実行単位は同時にいずれかのプロセッサに割り当てるという制約の下で、グループのプロセッサへの割り当てを制御することを特徴とするスケジユーリング方法。

[2] マルチプロセッサシステムにおいて、並列処理されるスケジューリング対象の実行単位を複数のプロセッサに割り当てる順序をスケジュールする方法であって、

1つ以上の前記スケジューリング対象の実行単位をグループ化してグループ単位でプロセッサへの割り当てを管理し、前記グループ毎に設定される優先度順でかつ同一優先度内では前記グループが待ち行列に到着した順で前記グループの優先順位を決め、同一グループに属するすべての実行単位は同時にいずれかのプロセッサに割り当てるという制約の下で、実行待ちおよび実行中の状態にあるグループを前記優先順位にしたがってプロセッサに割り当てることを特徴とするスケジューリング方法。

[3] マルチプロセッサシステムにおいて、並列処理されるスケジューリング対象の実行単位を複数のプロセッサに割り当てる順序をスケジュールする方法であって、

1つ以上の前記スケジューリング対象の実行単位を含むグループの内、実行待ちおよび実行中の状態にあるグループを前記グループ毎に設定される優先度順でかつ同一優先度内では到着順に格納した実行待ちキューの先頭力順に前記グループを取り出し、取り出したグループに属するすべての実行単位を同時にいずれかのプロセッサに割り当てることができる場合に限り、そのグループに属するすべての実行単位をプロセッサに割り当て、そうでない場合は、それ以降に前記実行待ちキューから取り出されるグループの割り当てを優先することを特徴とするスケジューリング方法。

[4] プロセッサに割り当てる前記実行単位の数がプロセッサ総数に達する力、または前記実行待ちキューの末尾カゝら前記グループが取り出されるに至るまで、前記実行待ちキュー力順次取り出されるグループのプロセッサへの割り当て処理を繰り返すことを特徴とする請求項 3に記載のスケジューリング方法。

[5] 前記実行待ちキューの先頭から順次取り出されるグループに属する各実行単位が既にいずれかのプロセッサに割り当てられて実行中である場合、その実行中である実行単位は、他のプロセッサに割り当て先を変更されて再配置されないように、その実行中である実行単位の当該プロセッサへの割り当てを確保することを特徴とする請求項 3または 4に記載のスケジューリング方法。

[6] マルチプロセッサシステムにおいて、並列処理されるスケジューリング対象の実行単位を複数のプロセッサに割り当てる順序をスケジュールする装置であって、

1つ以上の前記スケジューリング対象の実行単位をグループ化し、同一グループに属する前記実行単位の各々により占有されるプロセッサ内の資源を互いに参照できるように、各実行単位が参照するアドレス空間に前記資源をマップして管理するメモリ制御部と、

実行待ちおよび実行中の状態にあるグループを格納した実行待ちキューと、前記実行待ちキューの先頭力も順にグループを取り出し、取り出したグループに属するすべての実行単位を同時にいずれかのプロセッサに割り当てることができる場合に限り、そのグループに属するすべての実行単位を複数のプロセッサに割り当てる割り当て部とを含むことを特徴とするスケジューリング装置。

[7] 当該装置は、実行単位をグループ化する初期設定の際に、同一グループに属する各実行単位が占有する前記資源の前記アドレス空間へのマップ先の領域を決定し、その資源のマップ先の領域に関する設定情報を当該グループが削除されるまで保持することを特徴とする請求項 6に記載のスケジューリング装置。

[8] 前記割り当て部によりいずれかのプロセッサに同時に割り当てられた同一グループに属する第 1および第 2の実行単位について、前記第 1の実行単位が、前記アドレス空間にマップされた同一グループ内の前記第 2の実行単位の資源領域にデータを書き込む操作を行うことにより、同一グループ内の前記第 1の実行単位力前記第 2 の実行単位にデータが渡されることを特徴とする請求項 6または 7に記載のスケジュ一リング装置。

[9] 前記割り当て部によりいずれかのプロセッサに同時に割り当てられた同一グループに属する第 1および第 2の実行単位について、前記第 1の実行単位が、前記アドレス空間にマップされた同一グループ内の前記第 2の実行単位の資源領域にデータを書き込む操作を行い、前記第 2の実行単位が、当該資源に対するデータの書き込みの完了を待つことにより、同一グループ内の前記第 1の実行単位と前記第 2の実行単位の間で同期が取られることを特徴とする請求項 6または 7に記載のスケジューリング装置。

[10] マルチプロセッサシステムにおいて、並列処理されるスケジューリング対象の実行単位を複数のプロセッサに割り当てる順序をスケジュールする装置であって、

1つ以上の前記スケジューリング対象の実行単位を含むグループの内、実行待ちおよび実行中の状態にあるグループを前記グループ毎に設定される優先度順でかつ同一優先度内では到着順に格納した実行待ちキューと、

前記実行待ちキューの先頭力も順にグループを取り出し、取り出したグループに属するすべての実行単位を同時にいずれかのプロセッサに割り当てることができる場合に限り、そのグループをプロセッサへの割り当て候補となるグループを格納した割り当てリストに追加する割り当てリスト生成部と、

前記割り当てリスト生成部により生成された前記割り当てリストに格納されたグループに属するすべての実行単位を複数のプロセッサに割り当てる割り当て部とを含むことを特徴とするスケジューリング装置。

[11] 前記割り当てリスト生成部は、プロセッサに割り当てる実行単位の個数がプロセッサ総数に達するか、または前記実行待ちキューの末尾カゝら前記グループが取り出されるに至るまで、前記割り当てリストの生成処理を繰り返すことを特徴とする請求項 10 に記載のスケジューリング装置。

[12] 実行中の状態にある実行単位とその実行単位が割り当てられているプロセッサとの対応関係を保持するスケジュールテーブルをさらに含み、

前記割り当てリスト生成部は、前記実行待ちキューから順次取り出したグループに属する各実行単位が前記スケジュールテーブルにある場合、その実行単位が割り当てられて!/、るプロセッサにフラグを設定し、前記実行待ちキューから順次取り出したグループに属する各実行単位が前記スケジュールテーブルになぐそのグループに属するすべての実行単位を同時にいずれかのプロセッサに割り当てることができる場合、そのグループを前記割り当てリストに追加し、

前記割り当て部は、前記割り当てリストに格納されたグループに属するすべての実行単位を前記スケジュールテーブルにお、て前記フラグが設定されて、な、プロセッサに割り当てることを特徴とする請求項 10または 11に記載のスケジューリング装置

[13] 同一グループに属する各実行単位がそれぞれの占有するプロセッサ内の資源を互いに参照できるように、前記資源は各実行単位が参照するアドレス空間にマップされていることを特徴とする請求項 10から 12のいずれかに記載のスケジューリング装置。

[14] 前記割り当て部によりいずれかのプロセッサに同時に割り当てられた同一グループに属する各実行単位が、前記アドレス空間にマップされた同一グループに属する各実行単位の資源領域に対してデータを読み書きすることにより、同一グループに属する複数の実行単位の間でデータの共有がなされることを特徴とする請求項 13に記載のスケジューリング装置。

[15] 前記割り当て部によりいずれかのプロセッサに同時に割り当てられた同一グループに属する第 1および第 2の実行単位について、前記第 1の実行単位が、前記アドレス空間にマップされた同一グループ内の前記第 2の実行単位の資源領域にデータを書き込む操作を行うことにより、同一グループ内の前記第 1の実行単位力前記第 2 の実行単位にデータが渡されることを特徴とする請求項 13に記載のスケジューリング装置。

[16] 前記割り当て部によりいずれかのプロセッサに同時に割り当てられた同一グループに属する第 1および第 2の実行単位について、前記第 1の実行単位が、前記アドレス空間にマップされた同一グループ内の前記第 2の実行単位の資源領域にデータを書き込む操作を行い、前記第 2の実行単位が、当該資源に対するデータの書き込みの完了を待つことにより、同一グループ内の前記第 1の実行単位と前記第 2の実行単位の間で同期が取られることを特徴とする請求項 13に記載のスケジューリング装置。

[17] 並列処理されるスケジューリング対象の実行単位を複数のプロセッサに割り当てて並列に実行するマルチプロセッサシステムであって、

1つのプロセッサは、前記スケジューリング対象の実行単位を他の複数のプロセッサに割り当てるスケジューラを含み、

前記スケジューラは、

実行待ちおよび実行中の状態にあるグループを格納した実行待ちキューと、前記実行待ちキューの先頭力も順にグループを取り出し、取り出したグループに属するすべての実行単位を同時にいずれかのプロセッサに割り当てることができる場合に限り、そのグループに属するすべての実行単位を複数のプロセッサに割り当てる割り当て部とを含むことを特徴とするマルチプロセッサシステム。

[18] 並列処理されるスケジューリング対象の実行単位を複数のプロセッサに割り当てて並列に実行するマルチプロセッサシステムであって、

前記スケジューラは、

前記実行待ちキューの先頭力も順にグループを取り出し、取り出したグループに属するすべての実行単位を同時にいずれかのプロセッサに割り当てることができる場合に限り、そのグループを割り当てリストに追加する割り当てリスト生成部と、

前記割り当てリスト生成部により生成された前記割り当てリストに格納されたグループに属するすべての実行単位を複数のプロセッサに割り当てる割り当て部とを含むことを特徴とするマルチプロセッサシステム。

[19] 並列処理されるスケジューリング対象の実行単位を 1つ以上含むグループの内、実行待ちおよび実行中の状態にあるグループを前記グループ毎に設定される優先度順でかつ同一優先度内では到着順に格納した実行待ちキューの先頭力順にダループを取り出すステップと、

実行中の状態にある実行単位とその実行単位が割り当てられてヽるプロセッサとの対応関係を保持するスケジュールテーブルを参照し、前記実行待ちキューから順次取り出したグループに属する各実行単位が前記スケジュールテーブルにある場合、その実行単位が割り当てられて、るプロセッサにフラグを設定するステップと、前記実行待ちキューから順次取り出したグループに属する各実行単位が前記スケジュールテーブルになぐそのグループに属するすべての実行単位を同時に、ずれかのプロセッサに割り当てることができる場合、そのグループを前記割り当てリストに追加するステップと、

前記割り当てリストに格納されたグループに属するすべての実行単位を前記スケジユールテーブルにお、て前記フラグが設定されてヽな、プロセッサに割り当てるステップとをコンピュータに実行させることを特徴とするプログラム。

[20] マルチプロセッサシステムにおいて、並列処理されるスケジューリング対象の実行単位を複数のプロセッサに割り当てる順序をスケジュールする方法であって、複数のプロセッサの内、少なくとも 1つのプロセッサを並列処理されるスケジユーリング対象の実行単位の割り当て対象力も除外し、非割り当て対象のプロセッサ上で動作するスケジュール対象とならない実行単位により独占的に占有される当該プロセッサ内の資源を前記スケジューリング対象の実行単位カゝら参照できるように、各実行単位が参照するアドレス空間に前記資源をマップした上で、前記実行単位の割り当て対象のプロセッサへの割り当てを制御することを特徴とするスケジューリング方法。

[21] マルチプロセッサシステムにおいて、並列処理されるスケジューリング対象の実行単位を複数のプロセッサに割り当てる順序をスケジュールする装置であって、複数のプロセッサの内、少なくとも 1つのプロセッサを並列処理されるスケジユーリング対象の実行単位の割り当て対象力も除外し、非割り当て対象のプロセッサ上で動作するスケジュール対象とならない実行単位により独占的に占有される当該プロセッサ内の資源を前記スケジューリング対象の実行単位カゝら参照できるように、各スケジユーリング対象の実行単位が参照するアドレス空間に前記資源をマップして管理するメモリ制御部と、

実行待ちおよび実行中の状態にある前記スケジューリング対象の実行単位を格納した実行待ちキューと、

前記実行待ちキューの先頭カゝら順に前記スケジューリング対象の実行単位を取り出し、 V、ずれかのプロセッサに割り当てる割り当て部とを含むことを特徴とするスケジユーリング装置。

[22] 非割り当て対象のプロセッサ上で動作する非スケジューリング対象の実行単位により独占的に占有される当該プロセッサ内の資源の前記アドレス空間へのマップ先の領域は、いずれのスケジューリング対象の実行単位力も見ても同じアドレスに固定されて、ることを特徴とする請求項 21に記載のスケジューリング装置。

[23] 前記割り当て部により!、ずれかのプロセッサに割り当てられた前記スケジューリング対象の実行単位が、前記アドレス空間にマップされた非割り当て対象のプロセッサ上で動作する非スケジューリング対象の実行単位の資源領域にデータを書き込む操作を行うことにより、非割り当て対象のプロセッサの資源が直接的に制御されることを特徴とする請求項 21または 22に記載のスケジューリング装置。

[24] 前記割り当て部により!、ずれかのプロセッサに割り当てられた前記スケジューリング対象の実行単位が、前記アドレス空間にマップされた非割り当て対象のプロセッサ上で動作する非スケジューリング対象の実行単位の資源領域にデータを書き込む操作を行、、前記非割り当て対象のプロセッサ上で動作する非スケジューリング対象の実行単位が、当該資源に対するデータの書き込みの完了を待つことにより、前記スケジユーリング対象の実行単位と前記非スケジューリング対象の実行単位の間で同期が取られることを特徴とする請求項 21または 22に記載のスケジューリング装置。