JPH08292932A

JPH08292932A - マルチプロセッサシステムおよびマルチプロセッサシステムにおいてタスクを実行する方法

Info

Publication number: JPH08292932A
Application number: JP3696496A
Authority: JP
Inventors: Tetsuya Tanaka; 哲也田中; Akira Fukuda; 晃福田; Hitoshi Tanuma; 仁田沼
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1995-02-24
Filing date: 1996-02-23
Publication date: 1996-11-05

Abstract

(57)【要約】【課題】細粒度のタスクに適したタスクの実行方法を
提供する。【解決手段】プロセッサ３０〜３２を含むマルチプロ
セッサシステム１においてタスクを実行する方法であっ
て、プロセッサ３０〜３２のうちタスクＴ１を実行中の
プロセッサが新たなタスクＴ２を生成した場合におい
て、プロセッサ３０〜３２のうち「空き状態」を有する
プロセッサがあるか否かを検出するステップと、「空き
状態」を有するプロセッサが検出された場合には、タス
クＴ２をそのプロセッサに割り当てることにより、その
プロセッサによるタスクＴ２の実行を開始し、そのプロ
セッサの状態を「空き状態」から「実行状態」に変更
し、タスクＴ１の実行が中断されていないことを示す第
１の値を有するフラグを格納するステップと、「空き状
態」を有するプロセッサが検出されない場合には、タス
クＴ１の実行を中断し、中断したプロセッサによるタス
クＴ２の実行を開始し、タスクＴ１の実行が中断された
ことを示す第２の値を有するフラグを格納するステップ
とを包含する方法。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、複数のタスクを並
列に実行する複数のプロセッサを含むマルチプロセッサ
システムおよびそのマルチプロセッサシステムにおいて
タスクを実行する方法に関する。

【０００２】

【従来の技術】近年、マルチプロセッサシステムは汎用
計算機の並列処理による高性能化のアプローチの一つと
して注目されている。マルチプロセッサシステムにおい
ては複数のプロセッサを一つのバスに接続し、主記憶装
置を共有する共有メモリ型のマルチプロセッサシステム
が主に採用されている。

【０００３】このようなマルチプロセッサシステムは通
常、複数のプロセッサチップをプリント基板上に実装す
るため、各プロセッサの処理速度に対し、プロセッサ間
のバスを用いる通信や同期の処理速度は遅い。そのた
め、処理単位であるタスクの処理時間がプロセッサ間の
通信や同期の時間に対し十分大きい場合に用いられる。
この場合のタスクの大きさは中粒度〜粗粒度と呼ばれ実
行命令数で数１０００命令程度以上とされている。この
ように、処理単位を大きくする（粒度を粗くする）こと
でタスクの実行時間に対して相対的にプロセッサ通信や
同期の時間を小さくしている。

【０００４】さらに、近年半導体の集積化技術は急速に
発展している。そのため、チップ内に多くの機能ユニッ
トやメモリを搭載することができるようになってきてい
る。マルチプロセッサシステムにおいても今後複数のプ
ロセッサをワンチップに搭載することが可能になると思
われる。その場合、プロセッサが接続されるバスもチッ
プ内に入ることになりプロセッサ間の通信や同期の高速
化はそこで実行するタスクの粒度の選択肢を広げる。即
ち、タスクの大きさが細粒度、命令数で数１０〜数１０
０命令程度の並列処理が可能になりつつある。今後、こ
のような細粒度のタスクを並列処理することが主流にな
ると予想される。近年注目されているオブジェクト指向
プログラミングや関数型言語を用いたプログラミング
は、いずれも「細粒度のタスクを並列処理する」ことに
合致したものであるからである。

【０００５】一方、マルチプロセッサシステムでは、複
数のタスクを物理的に限られたプロセッサ数に割り当て
ることになるため、タスクの実行順序を決定し、どのプ
ロセッサに対しどのタスクを割り当てるかを適切に選択
することが行われる。この処理を動的に行うため、まず
実行待ちタスクを一次記憶などのタスク管理装置に格納
しておき、次に空きプロセッサを検出し、空きプロセッ
サがある場合は、実行待ちタスクの中から実行すべきタ
スクを選択し、選択したタスクを空きプロセッサに割り
当てることが行われる。このときのタスク選択は仕事全
体の実行時間を最小にするなどの目的で行われる。こう
いったタスクの実行順序を決定し、タスクをどのプロセ
ッサに割り当てるかを決定する処理をスケジューリング
といい、決定方法の異なるさまざまなアルゴリズムがあ
る。また、タスク生成によって実行すべきタスクが生じ
た場合、タスク管理装置に実行待ちタスクとして登録す
る処理もある。

【０００６】図１２にマルチプロセッサシステムにおけ
る、従来のプロセッサ割当方法の動作説明図を示す。図
１２において、プロセッサ２はタスクを生成し、実行待
ちのタスクとしてタスク管理装置にタスク４を登録して
いる。プロセッサ０はプロセッサ１が「空き状態」であ
ることを検出すると、タスク管理装置の実行待ちのタス
クをスケジューリングアルゴリズムにしたがって一つを
選択し、選択されたタスクはプロセッサ０によりプロセ
ッサ１に割り当てられる。このとき、プロセッサ０はス
ケジューリングの処理を、プロセッサ２はタスク登録の
処理をそれぞれ行っている。

【０００７】これは、例えば特開昭６３−２０８９４８
号公報に示すように空きプロセッサ（図１２ではプロセ
ッサ１）がタスクレディーキュー（図１２ではタスク管
理装置）の監視を行い、実行待ちのタスクを自動的に取
り出し処理する場合でも、「空き状態」のプロセッサが
スケジューリングの処理を行っている。

【０００８】また、例えば特開昭６２−１９０５４８号
公報に示されるように、タスクを依頼した依頼プロセッ
サが、依頼された被依頼プロセッサでのタスクの状態を
監視しておき、被依頼プロセッサがタスクの終了を検出
した場合、空きプロセッサとなった被依頼プロセッサに
ほかのタスクを適切に選択し割り当てる方法がある。こ
の方法においては、依頼プロセッサが被依頼プロセッサ
の状態を監視する処理を行っている。

【０００９】前記したスケジューリング処理やタスクの
登録処理、もしくは被依頼プロセッサを監視する処理は
それぞれ内容は異なるもののタスクをプロセッサに割り
当て実行するまでのオーバヘッド即ちタスク処理に付随
するオーバヘッドと考えることができる。図１３はタス
クの処理時間と前記したオーバヘッドの処理時間のタイ
ムチャートを示している。図１３に示すようにタスクの
粒度が中〜粗粒度の場合はタスクの処理時間に対してオ
ーバヘッドの処理時間が相対的に小さいため、オーバヘ
ッドの処理時間を無視できるレベルにある。

【００１０】

【発明が解決しようとする課題】しかしながら、上記の
ようなタスク処理に付随するオーバヘッドを持つマルチ
プロセッサシステムにおいて、プロセッサ間の通信や同
期を高速化することで細粒度の並列処理を行う場合は、
タスクの処理時間に対して相対的にオーバヘッドの処理
時間が大きくなる。

【００１１】図１４は細粒度の場合のタスクの処理時間
とオーバヘッドの処理時間のタイムチャートを示してい
る。図１４に示すようにオーバヘッドの処理時間はタス
クの処理時間に比べて相対的に大きくなり、オーバヘッ
ドの処理時間が無視できず仕事全体としての処理時間が
大きくなるという問題を有する。

【００１２】本発明は上記問題点に鑑み、細粒度の並列
処理をプロセッサ間の通信や同期が高速なマルチプロセ
ッサにおいて、タスク管理やスケジューリング、タスク
状態の監視を行わないことで、前記したオーバヘッドを
なくし、その代わりのプロセッサに対する動的なタスク
割当を一元的、単純かつ高速に行う方法を提供すること
にある。

【００１３】

【課題を解決するための手段】本発明の方法は、「空き
状態」と「実行状態」とを有する複数のプロセッサを含
むマルチプロセッサシステムにおいてタスクを実行する
方法であって、該複数のプロセッサのうち第１タスクを
実行中の第１プロセッサが新たな第２タスクを生成した
場合において、該複数のプロセッサのうち「空き状態」
を有する第２プロセッサがあるか否かを検出するステッ
プと、「空き状態」を有する第２プロセッサが検出され
た場合には、該第２タスクを該第２プロセッサに割り当
てることにより、該第２プロセッサによる該第２タスク
の実行を開始し、該第２プロセッサの状態を「空き状
態」から「実行状態」に変更し、該第１タスクの実行が
中断されていないことを示す第１の値を有するフラグを
格納するステップと、「空き状態」を有する第２プロセ
ッサが検出されない場合には、該第１プロセッサによる
該第１タスクの実行を中断し、該第１プロセッサによる
該第２タスクの実行を開始し、該第１タスクの実行が中
断されたことを示す第２の値を有するフラグを格納する
ステップとを包含しており、これにより上記目的が達成
される。

【００１４】前記方法は、前記第２タスクの実行が終了
した後、前記フラグが前記第１の値と前記第２の値のう
ちのいずれを有するかを判定するステップと、前記フラ
グが前記第１の値を有すると判定された場合には、前記
第２プロセッサの状態を「実行状態」から「空き状態」
に変更するステップと、前記フラグが前記第２の値を有
すると判定された場合には、前記第１タスクの実行が中
断されたところから前記第１プロセッサによる前記第１
タスクの実行を再開するステップとをさらに包含しても
よい。

【００１５】前記複数のプロセッサのそれぞれは、前記
複数のプロセッサを互いに識別する識別子を有してお
り、前記「空き状態」を有する第２プロセッサの検出
は、該識別子を用いて行われてもよい。

【００１６】前記複数のプロセッサのそれぞれは、タス
クを割り当てる優先順位を決定する優先度を有してお
り、前記第２プロセッサへの前記第２タスクの割り当て
は、該優先度に基づいて行われてもよい。

【００１７】本発明の他の方法は、「空き状態」と「実
行状態」とを有する複数のプロセッサを含むマルチプロ
セッサシステムにおいて、「停止状態」と「第１実行状
態」と「第２実行状態」とを有するタスクを実行する方
法であって、該複数のプロセッサのうち第１タスクを実
行中の第１プロセッサが新たな第２タスクを生成した場
合において、該複数のプロセッサのうち「空き状態」を
有する第２プロセッサがあるか否かを検出するステップ
と、「空き状態」を有する第２プロセッサが検出された
場合には、該第２タスクを該第２プロセッサに割り当て
ることにより、該第２プロセッサによる該第２タスクの
実行を開始し、該第２プロセッサの状態を「空き状態」
から「実行状態」に変更し、該第２タスクの状態を「停
止状態」から「第１実行状態」に変更するステップと、
「空き状態」を有する第２プロセッサが検出されない場
合には、該第１プロセッサによる該第１タスクの実行を
中断し、該第１プロセッサによる該第２タスクの実行を
開始し、該第２タスクの状態を「停止状態」から「第２
実行状態」に変更するステップとを包含しており、これ
により上記目的が達成される。

【００１８】前記方法は、前記第２タスクの実行が終了
した後、前記第２タスクの状態を判定するステップと、
前記第２タスクが「第１実行状態」を有すると判定され
た場合には、前記第２プロセッサの状態を「実行状態」
から「空き状態」に変更し、前記第２タスクの状態を
「第１実行状態」から「停止状態」に変更するステップ
と、前記第２タスクが「第２実行状態」を有すると判定
された場合には、前記第２タスクの状態を「第２実行状
態」から「停止状態」に変更するステップとをさらに包
含してもよい。

【００１９】前記複数のプロセッサのそれぞれは、前記
複数のプロセッサを互いに識別する識別子を有してお
り、前記「空き状態」を有する第２プロセッサの検出
は、該識別子を用いて行われてもよい。

【００２０】前記複数のプロセッサのそれぞれは、タス
クを割り当てる優先順位を決定する優先度を有してお
り、前記第２プロセッサへの前記第２タスクの割り当て
は、該優先度に基づいて行われてもよい。

【００２１】本発明のマルチプロセッサシステムは、複
数のタスクを並列に実行する複数のプロセッサと、該複
数のプロセッサの状態を管理し、該複数のプロセッサの
それぞれからの問い合わせに応じて「空き状態」のプロ
セッサの識別子を返す状態管理手段とを備えており、該
複数のプロセッサのそれぞれは、新たなタスクが発生し
た時点で、該状態管理手段に対して「空き状態」のプロ
セッサがあるか否かを問い合わる。これにより上記目的
が達成される。

【００２２】前記状態管理手段は、該プロセッサからの
問い合わせに応答して、現在の状態を次の状態に遷移さ
せる手段と、該次の状態に基づいて該問い合わせに対す
る応答を出力する手段とを備えていてもよい。

【００２３】前記マルチプロセッサシステムは、該複数
のプロセッサのそれぞれについて、命令キャッシュメモ
リとデータキャッシュメモリとをさらに備えていてもよ
い。

【００２４】前記マルチプロセッサシステムは、前記複
数のプロセッサ間で命令アドレスおよびパケットアドレ
スを転送するためのネットワークをさらに備えていても
よい。

【００２５】該複数のタスクのそれぞれは、細粒度であ
ってもよい。

【００２６】

【発明の実施の形態】以下、図面を参照しながら、本発
明の実施の形態を説明する。

【００２７】図１は、本発明のマルチプロセッサシステ
ム１の構成を示す。マルチプロセッサシステム１は、集
積回路上にインプリメントされる。マルチプロセッサシ
ステム１は、バスを介して主記憶装置２に接続される。

【００２８】マルチプロセッサシステム１は、要素プロ
セッサユニット１０〜１２を含む。要素プロセッサユニ
ット１０〜１２のそれぞれは、同一の構成を有してい
る。マルチプロセッサシステム１に含まれる要素プロセ
ッサユニットの数は、３に限定されるわけではない。マ
ルチプロセッサシステム１は、任意の個数の要素プロセ
ッサユニットを含み得る。

【００２９】要素プロセッサユニット１０〜１２は、そ
れぞれ、プロセッサ３０〜３２と命令キャッシュ（Ｉ
Ｃ）３３〜３５とデータキャッシュ（ＤＣ）３６〜３８
とを有している。命令キャッシュ（ＩＣ）は、命令を格
納するためのキャッシュメモリであり、読み出し専用で
ある。データキャッシュ（ＤＣ）は、データを格納する
ためのキャッシュメモリであり、読み出しと書き込みが
できる。

【００３０】共有キャッシュ２０は、要素プロセッサユ
ニット１０〜１２によって共有されている。命令セット
やデータセットは、通常、主記憶装置２に格納されてい
る。データセットは、必要に応じてバスインタフェース
２３を介して共有キャッシュ２０にロードされる。共有
キャッシュ２０は、主記憶装置２と比較して非常に高速
に動作することが好ましい。データキャッシュ（ＤＣ）
と共有キャッシュ２０とは、アドレスに応じて使い分け
られる。例えば、アドレスが０ｘ００００００００〜０
ｘ７ｆｆｆｆｆｆｆの範囲内である場合には、データキ
ャッシュ（ＤＣ）がアクセスされ、アドレスが０ｘ８０
００００００〜０ｘｆｆｆｆｆｆｆｆの範囲内である場
合には、共有キャッシュ２０がアクセスされる。

【００３１】要素プロセッサユニット１０〜１２は、ネ
ットワーク２１を介して相互に接続される。ネットワー
ク２１は、要素プロセッサユニット１０〜１２の相互間
で命令アドレスやパケットアドレスを転送するために使
用される。ネットワーク２１は、例えば、３×３のクロ
スバースイッチを用いて実現することができる。

【００３２】プロセッサ状態管理装置２２は、プロセッ
サ３０〜３２の状態を管理する。プロセッサ３０〜３２
のそれぞれは、「実行状態」および「空き状態」のいず
れか一方の状態を有する。

【００３３】プロセッサ３０〜３２のそれぞれには固定
された優先度が予め割り当てられている。ここでは、プ
ロセッサ３０〜３３は、この順番に高い優先度を有して
いると仮定する。優先度は、複数のプロセッサがプロセ
ッサ状態管理装置２２を同時にアクセスする場合におい
て、その複数のプロセッサのうちのどのプロセッサにプ
ロセッサ状態管理装置２２に優先的にアクセスすること
を許すかを決定するために使用される。

【００３４】プロセッサ３０〜３２のそれぞれは、プロ
セッサ３０〜３２を互いに識別するための識別子（Ｉ
Ｄ）を有している。典型的には、識別子（ＩＤ）は、番
号によって表現される。

【００３５】プロセッサ３０〜３２のそれぞれは、それ
の内部にパケットのアドレスを保持する。パケットのア
ドレスは、例えば、プロセッサ３０〜３２の内部のレジ
スタ（図示せず）に保持される。これにより、プロセッ
サ３０〜３２は、パケットを参照することができる。パ
ケットの詳細は、図６を参照して後述される。

【００３６】マルチプロセッサシステム１は、複数のタ
スクを並列に実行する機能を有する。例えば、プロセッ
サ３０がタスクＴ１を実行しているのと並行して、プロ
セッサ３１はタスクＴ２を実行することができる。

【００３７】本明細書では、「タスク」とは、命令セッ
トとデータセットとの組であると定義する。命令セット
とデータセットとは、いずれも主記憶装置２に格納され
る。プロセッサ３０〜３２のそれぞれは、命令セットか
ら命令を逐次読み出し、読み出された命令を解釈実行す
る。データセットは、プロセッサ３０〜３２が命令セッ
トから読み出された命令を解釈実行する際、必要に応じ
て参照される。また、後述されるパケットは、データセ
ットの少なくとも一部である。

【００３８】図２は、タスクの概念を模式的に示す。こ
の例では、タスク１は、命令セット１とデータセット１
の組によって定義され、タスク２は、命令セット１とデ
ータセット２の組によって定義され、タスク３は、命令
セット２とデータセット３の組によって定義される。命
令セット１〜２とデータセット１〜３は、それぞれ、主
記憶装置２に格納されている。

【００３９】図３は、プロセッサ３０〜３２の状態を管
理するプロセッサ状態管理装置２２の構成例を示す。プ
ロセッサ状態管理装置２２は、入力（ＲＥＱ０〜ＲＥＱ
２、ＲＥＳＥＴ０〜ＲＥＳＥＴ２）に応答して出力（Ｉ
Ｄ０〜ＩＤ２、ＮＭＰ０〜ＮＭＰ２）を提供する組み合
わせ回路を含んでいる。その組み合わせ回路は、現在の
状態（Ｓ）と入力（ＲＥＱ０〜ＲＥＱ２、ＲＥＳＥＴ０
〜ＲＥＳＥＴ２）とに応じて次の状態（ｎｅｘｔＳ）を
決定し、次の状態に対応する出力（ＩＤ０〜ＩＤ２、Ｎ
ＭＰ０〜ＮＭＰ２）を提供する。現在の状態（Ｓ）から
次の状態（ｎｅｘｔＳ）への遷移は、例えば、表１に示
される状態遷移表に従って決定される。

【００４０】

【表１】

【００４１】図３において、Ｓは現在の状態、Ｎｅｘｔ
Ｓは次の状態を示す。これらの状態は、プロセッサ３０
〜３２の状態を示す。例えば、Ｓ＝００１は、プロセッ
サ３０の状態が「実行状態」であり、プロセッサ３１と
プロセッサ３２の状態が「空き状態」であることを示し
ている。ＮｅｘｔＳについても同様である。

【００４２】図３において、ＲＥＱ０〜ＲＥＱ２は、プ
ロセッサ３０〜３２からプロセッサ状態管理装置２２に
入力されるリクエストを表す。これらのリクエストは、
「空き状態」のプロセッサの識別子を得ることをプロセ
ッサ状態管理装置２２に依頼するものである。表１で
は、ＲＥＱ０〜ＲＥＱ２をまとめてＲＥＱと表記してい
る。例えば、ＲＥＱ＝１０１は、ＲＥＱ０が１（アサー
ト）であり、ＲＥＱ１が０（ネゲート）であり、ＲＥＱ
２が１（アサート）であることを示している。

【００４３】図３において、ＲＥＳＥＴ０〜ＲＥＳＥＴ
２は、プロセッサ３０〜３２からプロセッサ状態管理装
置２２に入力されるリセットを表す。これらのリセット
は、プロセッサ状態管理装置２２内に保持されているプ
ロセッサ３０〜３２の状態を「実行状態」から「空き状
態」に変更することをプロセッサ状態管理装置２２に依
頼するものである。表１では、ＲＥＳＥＴ０〜ＲＥＳＥ
Ｔ２をまとめてＲＥＳＥＴと表記している。例えば、Ｒ
ＥＳＥＴ＝０１０は、ＲＥＳＥＴ０が０（ネゲート）で
あり、ＲＥＳＥＴ１が１（アサート）であり、ＲＥＳＥ
Ｔ２が０（ネゲート）であることを示している。

【００４４】図３において、ＩＤ０〜ＩＤ２は、プロセ
ッサ３０〜３２からのリクエストに対して「空き状態」
のプロセッサの識別子を通知する信号を表す。これらの
信号は、プロセッサ３０〜３２からのリクエストに応答
してプロセッサ状態管理装置２２から出力される。ＩＤ
０〜ＩＤ２の値の意味は、以下のとおりである。

【００４５】００：プロセッサ３０が「空き状態」であ
る。

【００４６】０１：プロセッサ３１が「空き状態」であ
る。

【００４７】１０：プロセッサ３２が「空き状態」であ
る。

【００４８】図３において、ＮＭＰ０〜ＮＭＰ２は、プ
ロセッサ３０〜３２からのリクエストに対して「空き状
態のプロセッサが存在しない」旨を通知する信号を表
す。これらの信号は、プロセッサ３０〜３２からのリク
エストに応答してプロセッサ状態管理装置２２から出力
される。ＮＭＰ０〜ＮＭＰ２の値の意味は、以下のとお
りである。

【００４９】０：「空き状態」のプロセッサが存在す
る。「空き状態」のプロセッサの識別子は、ＩＤ０〜Ｉ
Ｄ０２の値によって示される。

【００５０】１：「空き状態」のプロセッサが存在しな
い。この場合、ＩＤ０〜ＩＤ２の値は、ｄｏｎ’ｔｃ
ａｒｅである。

【００５１】以下、図４と図５とを参照して、プロセッ
サ状態管理装置２２の機能および動作を説明する。プロ
セッサ状態管理装置２２は、マルチプロセッサシステム
に含まれるすべてのプロセッサの状態を管理する。具体
的には、プロセッサ状態管理装置２２は、プロセッサの
識別子とプロセッサの状態とを一対にしてプロセッサ状
態管理装置２２内に保持する。プロセッサの識別子は、
複数のプロセッサを互いに識別するために使用される。
典型的には、プロセッサの識別子は整数で表現される。
プロセッサの状態は、「実行状態」か「空き状態」かの
いずれかである。

【００５２】プロセッサ状態管理装置２２は、あるプロ
セッサからのリクエストに応答して、「空き状態」のプ
ロセッサが存在するか否かを判定する。「空き状態」の
プロセッサが存在した場合には、プロセッサ状態管理装
置２２は、その「空き状態」のプロセッサの識別子をそ
のリクエストを発したプロセッサに返す。「空き状態」
のプロセッサが存在しなかった場合には、プロセッサ状
態管理装置２２は、「空き状態のプロセッサが存在しな
い」旨のメッセージをそのリクエストを発したプロセッ
サに返す。

【００５３】「空き状態」のプロセッサが複数個存在す
る場合には、プロセッサ状態管理装置２２は、「空き状
態」の複数のプロセッサのうち優先度の最も高いプロセ
ッサの識別子をそのリクエストを発したプロセッサに返
す。また、複数のプロセッサからのリクエストが同時に
プロセッサ状態管理装置２２に到達した場合には、その
リクエストを発した複数のプロセッサのうち優先度の高
いものから順に上述した処理が行われる。

【００５４】図４（ａ）および（ｂ）は、プロセッサ状
態管理装置２２の動作の一例を示す。プロセッサ状態管
理装置２２は、４つのプロセッサ０〜３の状態を管理し
ている。図４（ａ）に示す例では、プロセッサ０とプロ
セッサ１の状態は「実行状態」であり、プロセッサ２と
プロセッサ３の状態は「空き状態」である。プロセッサ
０からのリクエストとプロセッサ１からのリクエストが
プロセッサ状態管理装置２２に入力される。

【００５５】プロセッサ状態管理装置２２は、プロセッ
サ０からのリクエストに応答して、「空き状態」のプロ
セッサ２の識別子をプロセッサ０に返し、プロセッサ１
からのリクエストに応答して、「空き状態」のプロセッ
サ３の識別子をプロセッサ１に返す（図４（ｂ）参
照）。「空き状態」のプロセッサの識別子は、プロセッ
サの優先度に従って返される。また、プロセッサ状態管
理装置２２は、プロセッサ状態管理装置２２内に保持さ
れているプロセッサ２の状態を「空き状態」から「実行
状態」に変更し、プロセッサ３の状態を「空き状態」か
ら「実行状態」に変更する。

【００５６】図５（ａ）および（ｂ）は、プロセッサ状
態管理装置２２の動作の他の一例を示す。プロセッサ状
態管理装置２２は、４つのプロセッサ０〜３の状態を管
理している。図５（ａ）に示す例では、プロセッサ０と
プロセッサ１とプロセッサ２の状態は「実行状態」であ
り、プロセッサ３の状態は「空き状態」である。プロセ
ッサ０からのリクエストとプロセッサ１からのリクエス
トがプロセッサ状態管理装置２２に入力される。

【００５７】プロセッサ状態管理装置２２は、プロセッ
サ０からのリクエストに応答して、「空き状態」のプロ
セッサ３の識別子をプロセッサ０に返し、プロセッサ１
からのリクエストに応答して、「空き状態のプロセッサ
が存在しない」旨のメッセージをプロセッサ１に返す
（図５（ｂ）参照）。「空き状態のプロセッサが存在し
ない」旨のメッセージは、例えば、プロセッサ状態管理
装置２２から出力されるリターンコードの値によって表
される。「空き状態」のプロセッサの識別子は、プロセ
ッサの優先度に従って返される。また、プロセッサ状態
管理装置２２は、プロセッサ状態管理装置２２内に保持
されているプロセッサ３の状態を「空き状態」から「実
行状態」に変更する。

【００５８】図４と図５に示される例では、プロセッサ
状態管理装置２２によって管理されるプロセッサの数は
４である。しかし、これは、説明の便宜上のためであ
り、本発明が４つのプロセッサを有するマルチプロセッ
サシステムに限定されるわけではない。本発明は、任意
の数のプロセッサを含むマルチプロセッサシステムに適
用され得る。

【００５９】図６は、パケット５０の構成を示す。パケ
ット５０は、ロックビットを格納するロックビット領域
５１と、リターンビットを格納するためのリターンビッ
ト領域５２と、リターンアドレスを格納するためのリタ
ーンアドレス領域５３と、引数を格納するための引数領
域５４と、戻り値を格納するための戻り値領域５５とを
有している。パケット５０は、タスク毎に共有メモリ２
０上に確保され、タスクに所有される。これ以降、「タ
スクに所有されたパケット」を単に「タスクのパケッ
ト」と呼ぶ。パケット５０は、タスク間のデータの受け
渡しやタスクの情報を保持するために使用される。

【００６０】パケット５０のロックビット領域５１に
は、ロックビットが格納される。ロックビットは、パケ
ット５０を所有するタスクが実行中である間、他のタス
クからその実行中のタスクへのアクセスを禁止するか否
かを示す。ロックビットが”１”であることは、アクセ
スを禁止していることを示す。ロックビットが”０”で
あることは、アクセスを禁止していないことを示す。

【００６１】パケット５０のリターンビット領域５２に
は、リターンビットが格納される。リターンビットは、
パケット５０を所有するタスクを実行する前に、他のタ
スクを中断したか否かを示す。リターンビットが”０”
であることは、「パケット５０を所有するタスクを実行
する前に、他のタスクを中断していない」ことを示す。
これは、「空き状態」のプロセッサにパケット５０を所
有するタスクが割り当てられた場合に相当する。リター
ンビットが”１”であることは、「パケット５０を所有
するタスクを実行する前に、他のタスクを中断した」こ
とを示す。これは、「空き状態」のプロセッサが存在し
なかったため、タスクを実行中のプロセッサがそのタス
クの実行を中断して、パケット５０を所有する別のタス
クを実行する場合に相当する。

【００６２】パケット５０のリターンアドレス領域５３
には、リターンアドレスが格納される。リターンアドレ
スは、リターンビットが”１”である場合にのみ参照さ
れる。リターンアドレスは、中断されたタスクへの戻り
アドレスを示す。

【００６３】パケット５０の引数領域５４には、パケッ
ト５０を所有するタスクへの引数が格納される。

【００６４】パケット５０の戻り値領域５５には、パケ
ット５０を所有するタスクの実行結果である戻り値が格
納される。

【００６５】図７は、プロセッサ３０〜３２がｆｏｒｋ
命令を解釈実行する手順を示す。プロセッサ３０〜３２
は、主記憶装置２に格納されている命令セットから命令
を読み出す。読み出された命令がｆｏｒｋ命令である場
合には、プロセッサ３０〜３２は、図７に示す処理を実
行する。

【００６６】以下、図７を参照して、プロセッサ３０が
ｆｏｒｋ命令を解釈実行する手順をステップごとに詳細
に説明する。他のプロセッサ３１および３２がｆｏｒｋ
命令を解釈実行する場合も同様である。なお、ｆｏｒｋ
命令は、オペランドとして、新たなタスクの処理内容を
示す命令列の先頭アドレス（以降、単に命令アドレスと
いう）と新たなタスクのパケット５０のアドレス（以
降、単にパケットアドレスという）とをとる。

【００６７】ステップ（ａ）：プロセッサ３０は、「空
き状態」のプロセッサが存在するか否かをプロセッサ状
態管理装置２２に問い合わせる。このような問い合わせ
は、例えば、プロセッサ３０がプロセッサ状態管理装置
２２にリクエスト（ＲＥＱ０＝１）を送ることにより達
成される。プロセッサ状態管理装置２２は、そのリクエ
ストに応答して「空き状態」のプロセッサが存在するか
否かを判定する。

【００６８】「空き状態」のプロセッサが存在する場合
には、プロセッサ状態管理装置２２は、その「空き状
態」のプロセッサの識別子をプロセッサ３０に返す。
「空き状態」のプロセッサの識別子は、例えば、プロセ
ッサ３０がプロセッサ状態管理装置２２から出力される
ＩＤ０の値を参照することによって得られる。「空き状
態」のプロセッサが複数個存在する場合には、優先度の
最も高いプロセッサの識別子が得られる。また、複数の
プロセッサが同時にｆｏｒｋ命令を解釈実行する場合に
は、優先度の高いプロセッサから順にｆｏｒｋ命令を解
釈実行する。このようにして、プロセッサ３０は、「空
き状態」のプロセッサの識別子を取得する。

【００６９】「空き状態」のプロセッサが存在しない場
合には、プロセッサ状態管理装置２２は、「空き状態の
プロセッサが存在しない」旨のメッセージをプロセッサ
３０に返す。「空き状態のプロセッサが存在しない」旨
のメッセージは、例えば、プロセッサ３０がプロセッサ
状態管理装置２２から出力されるＮＭＰ０の値を参照す
ることによって得られる。

【００７０】ステップ（ｂ）：「空き状態」のプロセッ
サが存在した場合には、プロセッサ３０は、ステップ
（ｃ）〜（ｅ）の処理を行う。「空き状態」のプロセッ
サが存在しない場合には、プロセッサ３０は、ステップ
（ｆ）〜（ｇ）の処理を行う。

【００７１】ステップ（ｃ）：ここでは、「空き状態」
のプロセッサは、プロセッサ３１であると仮定する。こ
の場合、プロセッサ３０は、ｆｏｒｋ命令のオペランド
として与えられたタスクの命令アドレスとタスクのパケ
ットアドレスとをネットワーク２１を介してプロセッサ
３１に転送する。

【００７２】ステップ（ｄ）：プロセッサ３０は、ｆｏ
ｒｋ命令のオペランドとして与えられたタスクのパケッ
トアドレスによって指定されるパケット５０のロックビ
ット領域５１に”１”を書き込み、リターンビット領域
５２に”０”を書き込む。その後、プロセッサ３０は、
ｆｏｒｋ命令の処理を完了し、次の命令の処理を行う。

【００７３】ステップ（ｅ）：プロセッサ３１は、ネッ
トワーク２１を介してプロセッサ３０からタスクの命令
アドレスとタスクのパケットアドレスとを受け取る。プ
ロセッサ３１は、受け取ったパケットアドレスによって
指定されるパケット５０を参照しながら、受け取った命
令アドレスによって指定される命令から処理を開始す
る。

【００７４】以上のステップ（ａ）〜（ｅ）により、プ
ロセッサ３０は、プロセッサ３１によって実行される処
理とは異なる処理を独立に実行することとなる。すなわ
ち、プロセッサ３０とプロセッサ３１とによって並列処
理が開始される。ｆｏｒｋ命令の処理はここで終了す
る。

【００７５】ステップ（ｆ）：プロセッサ３０は、ｆｏ
ｒｋ命令のオペランドとして与えられたタスクのパケッ
トアドレスによって指定されるパケット５０のロックビ
ット領域５１に”１”を書き込み、リターンビット領域
５２に”１”を書き込む。また、ｆｏｒｋ命令の次の命
令のアドレスをリターンアドレス領域５３に書き込む。
プロセッサ３０は、実行中のタスクを中断する。

【００７６】ステップ（ｇ）：プロセッサ３０は、ｆｏ
ｒｋ命令のオペランドとして与えられたタスクのパケッ
トアドレスによって指定されるパケット５０を参照しな
がら、ｆｏｒｋ命令のオペランドとして与えられたタス
クの命令アドレスによって指定される命令から処理を開
始する。ｆｏｒｋ命令の処理はここで終了する。

【００７７】以下、図８を参照して、プロセッサ３０が
ｕｎｌｏｃｋ命令を解釈実行する手順をステップごとに
詳細に説明する。他のプロセッサ３１および３２がｕｎ
ｌｏｃｋ命令を解釈実行する場合も同様である。

【００７８】ステップ（ｈ）：プロセッサ３０は、実行
中のタスクが所有するパケット５０のリターンビット領
域５２の値が”０”であるか否かを判定する。リターン
ビット領域５２の値が”０”であることは、プロセッサ
３０が処理を中断したタスクが存在しないことを示す。
従って、リターンビット領域５２の値が”０”である場
合には、プロセッサ３０は、ステップ（ｉ）の処理を行
う。リターンビット領域５２の値が”１”であること
は、プロセッサ３０が処理を中断したタスクが存在する
ことを示す。従って、リターンビット領域５２の値が”
１”である場合には、プロセッサ３０は、ステップ
（ｊ）の処理を行う。

【００７９】ステップ（ｉ）：プロセッサ３０は、実行
中のタスクが所有するパケット５０のロックビット領域
５１に”０”を書き込み、プロセッサ３０の状態を「空
き状態」にする。「空き状態」となったプロセッサ３０
は、これ以降の処理を行わない。ｕｎｌｏｃｋ命令の処
理はここで終了する。

【００８０】ステップ（ｊ）：プロセッサ３０は、実行
中のタスクが所有するパケット５０のロックビット領域
５１に”０”を書き込む。さらに、プロセッサ３０は、
リターンアドレス領域５３に格納されているアドレスか
らの命令を処理することにより、中断されたタスクを復
帰させる。ｕｎｌｏｃｋ命令の処理はここで終了する。

【００８１】表２は、ｆｏｒｋ命令およびｕｎｌｏｃｋ
命令の解釈実行に応答して、マルチプロセッサシステム
の状態がどのように遷移するかを示す。表２に示される
例では、マルチプロセッサシステムは、プロセッサＰ１
とプロセッサＰ２とを有していると仮定する。

【００８２】

【表２】

【００８３】図９に示されるように、マルチプロセッサ
システムの状態は、プロセッサの状態とタスクの状態と
に区分される。

【００８４】プロセッサは、２つの状態を有する。一方
の状態は「空き状態（ＩＤＬＥ）」であり、他方の状態
は「実行状態（ＲＵＮ）」である。これらの状態は、プ
ロセッサ状態管理装置２２によって管理されている状態
と同じものである。プロセッサの状態が「実行状態（Ｒ
ＵＮ）」である場合には、そのプロセッサはいずれかの
タスクを実行中である。

【００８５】タスクは、３つの状態を有する。１つ目の
状態は「停止状態（ＳＴＯＰ）」であり、２つ目の状態
は「第１実行状態（ＥＸ１）」であり、３つ目の状態は
「第２実行状態（ＥＸ２）」である。「停止状態（ＳＴ
ＯＰ）」は、プロセッサがタスクの実行を待っている状
態であるかタスクの実行を終了した状態である。「第１
実行状態（ＥＸ１）」は、他のタスクの実行を中断する
ことなく現在のタスクが実行されている状態である。
「第２実行状態（ＥＸ２）」は、他のタスクの実行を中
断してその後現在のタスクが実行されている状態であ
る。プロセッサの状態が「実行状態（ＲＵＮ）」である
場合には、そのプロセッサに実行されているタスクの状
態は、「第１実行状態（ＥＸ１）」と「第２実行状態
（ＥＸ２）」のうちのいずれかである。

【００８６】表２を再び参照して、マルチプロセッサシ
ステムの状態がどのように遷移するかを説明する。マル
チプロセッサシステムの状態は、イベントの発生に応答
して、そのイベントと現在の状態に基づいて次の状態に
遷移する。ここで、「Ｐｘ．ｆｏｒｋ」という表記は、
「プロセッサＰｘがｆｏｒｋ命令を実行した」というイ
ベントが発生したことを表し、「Ｐｘ．ｕｎｌｏｃｋ」
という表記は、「プロセッサＰｘがｕｎｌｏｃｋ命令を
実行した」というイベントが発生したことを表す。

【００８７】表２の第１行は、プロセッサＰ１が「実行
状態」（タスクＴ１を実行中）であり、プロセッサＰ２
が「空き状態」であり、タスクＴ１が「第１実行状態」
であり、タスクＴ２が「停止状態」である場合におい
て、「プロセッサＰ１がｆｏｒｋ命令を実行した」とい
うイベントに応答して、プロセッサＰ２の状態が「空き
状態」から「実行状態」（タスクＴ２を実行中）に変更
され、タスクＴ２の状態が「停止状態」から「第１実行
状態」に変更されることを示す。このように状態が遷移
するのは、新たなタスクＴ２が生成された時点でタスク
Ｔ２が「空き状態」のプロセッサＰ２に割り当てられる
からである。

【００８８】表２の第２行は、表２の第１行における次
の状態が現在の状態である場合において、「プロセッサ
Ｐ２がｕｎｌｏｃｋ命令を実行した」というイベントに
応答して、プロセッサＰ２の状態が「実行状態」（タス
クＴ２を実行中）から「空き状態」に変更され、タスク
Ｔ２の状態が「第１実行状態」から「停止状態」に変更
されることを示す。

【００８９】表２の第３行は、プロセッサＰ１が「実行
状態」（タスクＴ１を実行中）であり、プロセッサＰ２
が「実行状態」（他のタスクを実行中）であり、タスク
Ｔ１が「第１実行状態」であり、タスクＴ２が「停止状
態」である場合において、「プロセッサＰ１がｆｏｒｋ
命令を実行した」というイベントに応答して、プロセッ
サＰ１の状態が「実行状態」（タスクＴ１を実行中）か
ら「実行状態」（タスクＴ２を実行中）に変更され、タ
スクＴ２の状態が「停止状態」から「第２実行状態」に
変更されることを示す。このように状態が遷移するの
は、新たなタスクＴ２が生成された時点で「空き状態」
のプロセッサが存在しないため、プロセッサＰ１がタス
クＴ１の実行を中断してタスクＴ２の実行を開始するか
らである。

【００９０】表２の第４行は、表２の第３行における次
の状態が現在の状態である場合において、「プロセッサ
Ｐ１がｕｎｌｏｃｋ命令を実行した」というイベントに
応答して、プロセッサＰ１の状態が「実行状態」（タス
クＴ２を実行中）から「実行状態」（タスクＴ１を実行
中）に変更され、タスクＴ２の状態が「第２実行状態」
から「停止状態」に変更されることを示す。

【００９１】以下、ｆｏｒｋ命令とｕｎｌｏｃｋ命令を
含むプログラムを並列処理する場合におけるマルチプロ
セッサシステム１の動作を説明する。

【００９２】図１０は、１から４までの和（１＋２＋３
＋４）を二分木に基づいて計算するプログラムの手順を
示す。このプログラムは、ｍａｉｎとｓｕｍの２つの部
分に分かれており、ｍａｉｎは主プログラム、ｓｕｍは
再帰呼び出し可能でかつ並列処理可能なサブルーチンで
ある。ｓｕｍはｎとｍの２つの引数をとり、ｎ＋１から
ｍまでの和を求めるものである。ｍａｉｎはｎ＝０、ｍ
＝４を引数としてｓｕｍを呼び出すものである。

【００９３】まず、初期状態として、プロセッサ３０は
ｍａｉｎを実行していると仮定する。プロセッサ３０の
状態は「実行状態」である。また、プロセッサ３１およ
びプロセッサ３２の状態は「空き状態」であると仮定す
る。

【００９４】以下、プログラムの各ステップ（Ａ）〜
（Ｈ）について、マルチプロセッサシステム１がどのよ
うに動作するかを詳細に説明する。

【００９５】ステップ（Ａ）：プロセッサ３０は、ｎ＝
０、ｍ＝４を引数としてｓｕｍサブルーチンを実行す
る。具体的には、プロセッサ３０は、共有キャッシュメ
モリ２０上にパケット５０（Ｐｋ１）を確保し、そのパ
ケット５０（Ｐｋ１）の引数領域５４に値０と値４とを
格納する。次に、プロセッサ３０は、ｓｕｍの命令の先
頭アドレスとパケット５０（Ｐｋ１）の先頭アドレスと
をオペランドとして、ｅｘｅｃ命令を実行する。ｅｘｅ
ｃ命令とは、図７に示すｆｏｒｋ命令の処理手順のうち
ステップ（ｆ）と（ｇ）のみに対応する命令である。ｅ
ｘｅｃ命令は、ｆｏｒｋ命令と同様にして、オペランド
としてタスクの命令アドレスとタスクのパケットアドレ
スとをとる。

【００９６】プロセッサ３０は、パケット５０（Ｐｋ
１）のロックビット領域５１に”１”を書き込み、パケ
ット５０（Ｐｋ１）のリターンビット領域５２に”１”
を書き込み、リターンアドレス領域５３にｅｘｅｃ命令
の次の命令のアドレスを格納する（図７のステップ
（ｆ）を参照）。また、プロセッサ３０は、パケット５
０（Ｐｋ１）を参照しながらｓｕｍの命令の実行を開始
する（図７のステップ（ｇ）を参照）。

【００９７】ステップ（Ｂ）：プロセッサ３０は、パケ
ット５０（Ｐｋ１）から引数ｎと引数ｍとを読み出し、
（ｎ＋１）とｍとを比較する。（ｎ＋１）とｍが等しい
場合には、処理はステップ（Ｇ）に進み、その他の場合
には、処理はステップ（Ｃ）に進む。ｓｕｍサブルーチ
ンがｍａｉｎから最初に呼ばれた場合には、ｎ＝０、ｍ
＝４であるから、（ｎ＋１）とｍとは等しくない。従っ
て、処理は、ステップ（Ｃ）に進む。

【００９８】ステップ（Ｃ）：プロセッサ３０は、ｋ＝
（ｎ＋ｍ）ｄｉｖ２を計算する。ここで、（ｎ＋ｍ）＝
４であるから、ｋ＝２となる。

【００９９】ステップ（Ｄ）：プロセッサ３０は、ｎと
ｋとを引数としてｓｕｍサブルーチンを実行する。具体
的には、プロセッサ３０は、共有キャッシュメモリ２０
上にパケット５０（Ｐｋ２）を確保し、そのパケット５
０（Ｐｋ２）の引数領域５４に値ｎ（＝０）と値ｋ（＝
２）とを格納する。次に、プロセッサ３０は、ｓｕｍの
命令の先頭アドレスとパケット５０（Ｐｋ２）の先頭ア
ドレスとをオペランドとして、ｆｏｒｋ命令を実行す
る。

【０１００】プロセッサ３１とプロセッサ３２はいずれ
も「空き状態」である。プロセッサ３０は、優先度に従
って「空き状態」のプロセッサ３１の識別子を得る（図
７のステップ（ａ）を参照）。プロセッサ３０は、タス
クの命令アドレスとタスクのパケットアドレスとをプロ
セッサ３１に転送する（図７のステップ（ｂ）を参
照）。プロセッサ３０は、パケット５０（Ｐｋ２）のロ
ックビット領域５１に”１”を書き込み、パケット５０
（Ｐｋ２）のリターンビット領域５２に”０”を書き込
む（図７のステップ（ｄ）を参照）。さらに、プロセッ
サ３１は、パケット５０（Ｐｋ２）を参照しながらｓｕ
ｍの命令の実行を開始する（図７のステップ（ｅ）を参
照）。このようにして、プロセッサ３０とプロセッサ３
１とはｓｕｍサブルーチンを並列に実行する。

【０１０１】ステップ（Ｅ）：プロセッサ３０は、ｋと
ｍとを引数としてｓｕｍサブルーチンを実行する。具体
的には、プロセッサ３０は、共有キャッシュメモリ２０
上にパケット５０（Ｐｋ３）を確保し、そのパケット５
０（Ｐｋ３）の引数領域５４に値ｋ（＝２）と値ｍ（＝
４）とを格納する。次に、プロセッサ３０は、ｓｕｍの
命令の先頭アドレスとパケット５０（Ｐｋ３）の先頭ア
ドレスとをオペランドとして、ｅｘｅｃ命令を実行す
る。プロセッサ３０がｅｘｅｃ命令の実行を開始する前
に、パケット５０（Ｐｋ１）はスタック領域に退避され
る。

【０１０２】プロセッサ３０は、パケット５０（Ｐｋ
３）のロックビット領域５１に”１”を書き込み、パケ
ット５０（Ｐｋ３）のリターンビット領域５２に”１”
を書き込み、リターンアドレス領域５３にｅｘｅｃ命令
の次の命令のアドレスを格納する（図７のステップ
（ｆ）を参照）。また、プロセッサ３０は、パケット５
０（Ｐｋ３）を参照しながらｓｕｍの命令の実行を開始
する（図７のステップ（ｇ）を参照）。

【０１０３】ステップ（Ｆ）：プロセッサ３０は、ステ
ップ（Ｅ）において呼び出したｓｕｍサブルーチンの実
行を終了した後、スタック領域に退避したパケット５０
（Ｐｋ１）を復帰させる。その後、プロセッサ３０は、
ｓ１とｓ２とを加算する。ここで、ｓ１は、ステップ
（Ｄ）において実行されたｓｕｍサブルーチンの結果を
示す。従って、ｓ１は、パケット５０（Ｐｋ２）の戻り
値領域５５に格納される。ｓ２は、ステップ（Ｅ）にお
いて実行されたｓｕｍサブルーチンの結果を示す。従っ
て、ｓ２は、パケット５０（Ｐｋ３）の戻り値領域５５
に格納される。プロセッサ３０がステップ（Ｅ）におい
て呼び出したｓｕｍサブルーチンの実行を終了した時点
では、パケット５０（Ｐｋ２）を所有するタスクはまだ
実行中である可能性がある。プロセッサ３０は、パケッ
ト５０（Ｐｋ２）を所有するタスクの実行が終了した
後、パケット５０（Ｐｋ２）の戻り値領域５５に格納さ
れている値を読み出し、その値をｓ１とする。ここで
は、ｓ１＝３である。パケット５０（Ｐｋ２）を所有す
るタスクの実行が終了したか否かは、パケット５０（Ｐ
ｋ２）のロックビット領域５１の値を参照することによ
り判定される。パケット５０（Ｐｋ２）のロックビット
領域５１の値が”０”であることは、パケット５０（Ｐ
ｋ２）を所有するタスクの実行が終了したことを示す。

【０１０４】同様にして、プロセッサ３０は、パケット
５０（Ｐｋ３）を所有するタスクの実行が終了した後、
パケット５０（Ｐｋ３）の戻り値領域５５に格納されて
いる値を読み出し、その値をｓ２とする。ここでは、ｓ
２＝７である。プロセッサ３０は、ｓ１＋ｓ２を計算す
る。その結果、ｓ＝１０が得られる。

【０１０５】ステップ（Ｈ）：プロセッサ３０は、ｓの
値をパケット５０（Ｐｋ１）の戻り値領域５５に格納す
る。その後、プロセッサ３０は、ｕｎｌｏｃｋ命令を実
行する。

【０１０６】プロセッサ３０は、パケット５０（Ｐｋ
１）のリターンビット領域５２に格納されている値が”
１”であるか否かを判定する（図８のステップ（ｈ）を
参照）。は、”１”である。従って、プロセッサ３０
は、パケット５０（Ｐｋ１）のロックビット領域５１
に”０”を格納し、リターンアドレス領域５３に格納さ
れているアドレスからの命令を実行する（図８のステッ
プ（ｊ）を参照）。この場合、ｍａｉｎのステップ
（Ａ）の次の命令から処理が再開される。

【０１０７】ステップ（Ｇ）：ステップ（Ｂ）におい
て、ｎ＋１＝ｍであると判定された場合は、処理はステ
ップ（Ｇ）に進む。プロセッサ３０は、ｓに引数ｍの値
を代入する。その後、処理はステップ（Ｈ）に進む。

【０１０８】ここで、ステップ（Ｄ）において呼び出さ
れたｓｕｍサブルーチンやステップ（Ｅ）において呼び
出されたｓｕｍサブルーチンにおいても、上述したステ
ップ（Ｂ）〜（Ｈ）が実行されることに注意されたい。
ｓｕｍサブルーチンは、再帰呼び出し可能なサブルーチ
ンだからである。

【０１０９】このように、ｓｕｍサブルーチンを再帰的
に呼び出すことにより、１から４の和（１＋２＋３＋
４）を並列に計算することが達成される。この例では、
ステップ（Ｄ）におけるｆｏｒｋ命令とステップ（Ｅ）
におけるｅｘｅｃ命令によって２つのタスクが生成され
ている。ｆｏｒｋ命令は「空き状態」のプロセッサがあ
る限りそのプロセッサにタスクを割り当てるために使用
される命令であり、ｅｘｅｃ命令は、あくまで自プロセ
ッサにタスクを割り当てるために使用される命令であ
る。

【０１１０】図１１は、上述した処理の内容を模式的に
示したものである。図１１に示されるように、タスクｓ
ｕｍ（０，４）からｆｏｒｋ命令とｅｘｅｃ命令とによ
り２つのタスクｓｕｍ（０，２）とタスクｓｕｍ（２，
４）とが生成される。タスクｓｕｍ（０，２）はプロセ
ッサ３１に割り当てられ、タスクｓｕｍ（２，４）はプ
ロセッサ３０に割り当てられる。同様に、２つのタスク
のそれぞれからさらに２つのタスクが生成される。「空
き状態」のプロセッサが存在する限り他のプロセッサに
タスクが割り当てられる。

【０１１１】タスクｓｕｍ（２，４）からタスクｓｕｍ
（２，３）とタスクｓｕｍ（３，４）とが生成される。
しかし、いずれのタスクもプロセッサ３０に割り当てら
れる。タスク（２，３）の割り当て時に「空き状態」の
プロセッサがすでに存在しなくなっているからである。

【０１１２】このように、本発明のマルチプロセッサシ
ステム１におけるプロセッサ３０〜３２のそれぞれは、
ｆｏｒｋ命令を解釈実行することにより、「空き状態」
のプロセッサが存在する場合にはそのプロセッサにタス
クを割り当て、「空き状態」のプロセッサが存在しない
場合には実行中のタスクの実行を中断して、そのプロセ
ッサにタスクを割り当てる。このようにして、処理すべ
きタスクが生成されると同時に「空き状態」のプロセッ
サか、あるいはタスクを生成したプロセッサのいずれか
にその生成されたタスクが割り当てられる。その結果、
生成さたタスクは即時に実行される。これにより、従来
のマルチプロセッサシステムでは必要とされた処理すべ
きタスクを保存する機構や、タスクの実行順序をスケジ
ューリングする機構は不要となる。また、「空き状態」
のプロセッサが存在する場合には、必ずそのプロセッサ
にタスクが割り当てられるため、プロセッサの利用効率
も高い。

【０１１３】さらに、ｆｏｒｋ命令やｕｎｌｏｃｋ命令
は簡単なハードウェアで実現することができ、高速な処
理も実現することができる。

【０１１４】従って、集積回路上に実装されたマルチプ
ロセッサシステム１において、例示した０から４までの
和を求めるプログラムのような、タスクの処理時間がス
ケジューリング処理時間や実行待ちタスクの管理処理に
要する時間に比べて小さいプログラムを並列処理する場
合には、本発明のタスク実行方法は非常に有用である。

【０１１５】なお、集積回路の外部から割り込みが入っ
た場合には、プロセッサ状態管理装置２２を用いて「空
き状態」のプロセッサを検出し、「空き状態」のプロセ
ッサのうち最も優先度の低いプロセッサに割り込み処理
を行わせることにより、割り込み処理による性能低下を
低減できる。

【０１１６】なお、集積回路のプロセッサがすべて「空
き状態」になったことは、プロセッサ状態管理装置２２
を用いて検出することができる。従って、この場合に
は、いずれかのプロセッサで例外処理を行うことにより
デッドロックを回避することができる。

【０１１７】

【発明の効果】以上のように、本発明によれば、あるプ
ロセッサで新たなタスクを生成したときにそのタスクの
実行を他あるいは自プロセッサによりただちに開始する
ことができる。このことは、タスクを保持しておく機構
やタスクの実行順序をスケジューリングする機構を不要
にする。また、実行待ちのタスクを選択し、その選択さ
れたタスクを「空き状態」のプロセッサに割り当てる処
理も不要となる。

【０１１８】その結果、タスクの処理時間に比較してプ
ロセッサ割り当てに要する時間が少なくてすむ。これに
より、マルチプロセッサシステムにおいて、粒度の細か
い並列処理の高速化を図ることができる。

【図面の簡単な説明】

【図１】本発明のマルチプロセッサシステム１の構成を
示す図である。

【図２】タスクの概念を模式的に示す図である。

【図３】マルチプロセッサシステム１におけるプロセッ
サ状態管理装置２２の構成例を示す図である。

【図４】（ａ）および（ｂ）は、プロセッサ状態管理装
置２２の動作の一例を説明する図である。

【図５】（ａ）および（ｂ）は、プロセッサ状態管理装
置２２の動作の他の一例を説明する図である。

【図６】パケット５０の構成を示す図である。

【図７】プロセッサ３０〜３２がｆｏｒｋ命令を解釈実
行する手順を示す図である。

【図８】プロセッサ３０〜３２がｕｎｌｏｃｋ命令を解
釈実行する手順を示す図である。

【図９】プロセッサの状態とタスクの状態とを説明する
図である。

【図１０】１から４までの和を二分木に基づいて計算す
るプログラムの手順を示す図である。

【図１１】図１０に示すプログラムの処理の内容を模式
的に示した図である。

【図１２】従来のプロセッサ割当方法の動作を説明する
図である。

【図１３】タスクが中粒度〜粗粒度である場合におけ
る、タスクの処理時間とオーバヘッドの処理時間とを示
すタイムチャートである。

【図１４】タスクが細粒度である場合における、タスク
の処理時間とオーバヘッドの処理時間とを示すタイムチ
ャートである。

【符号の説明】

１マルチプロセッサシステム２主記憶装置１０〜１２要素プロセッサユニット２０共有キャッシュ２１ネットワーク２２プロセッサ状態管理装置２３バスインターフェース３０〜３２プロセッサ３３〜３５命令キャッシュ（ＩＣ）３６〜３８データキャッシュ（ＤＣ）

Claims

【特許請求の範囲】

【請求項１】「空き状態」と「実行状態」とを有する
複数のプロセッサを含むマルチプロセッサシステムにお
いてタスクを実行する方法であって、該複数のプロセッサのうち第１タスクを実行中の第１プ
ロセッサが新たな第２タスクを生成した場合において、
該複数のプロセッサのうち「空き状態」を有する第２プ
ロセッサがあるか否かを検出するステップと、「空き状態」を有する第２プロセッサが検出された場合
には、該第２タスクを該第２プロセッサに割り当てるこ
とにより、該第２プロセッサによる該第２タスクの実行
を開始し、該第２プロセッサの状態を「空き状態」から
「実行状態」に変更し、該第１タスクの実行が中断され
ていないことを示す第１の値を有するフラグを格納する
ステップと、「空き状態」を有する第２プロセッサが検出されない場
合には、該第１プロセッサによる該第１タスクの実行を
中断し、該第１プロセッサによる該第２タスクの実行を
開始し、該第１タスクの実行が中断されたことを示す第
２の値を有するフラグを格納するステップとを包含する
方法。
【請求項２】前記方法は、前記第２タスクの実行が終了した後、前記フラグが前記
第１の値と前記第２の値のうちのいずれを有するかを判
定するステップと、前記フラグが前記第１の値を有すると判定された場合に
は、前記第２プロセッサの状態を「実行状態」から「空
き状態」に変更するステップと、前記フラグが前記第２の値を有すると判定された場合に
は、前記第１タスクの実行が中断されたところから前記
第１プロセッサによる前記第１タスクの実行を再開する
ステップとをさらに包含する、請求項１に記載の方法。
【請求項３】前記複数のプロセッサのそれぞれは、前
記複数のプロセッサを互いに識別する識別子を有してお
り、前記「空き状態」を有する第２プロセッサの検出
は、該識別子を用いて行われる、請求項１に記載の方
法。
【請求項４】前記複数のプロセッサのそれぞれは、タ
スクを割り当てる優先順位を決定する優先度を有してお
り、前記第２プロセッサへの前記第２タスクの割り当て
は、該優先度に基づいて行われる、請求項１に記載の方
法。
【請求項５】「空き状態」と「実行状態」とを有する
複数のプロセッサを含むマルチプロセッサシステムにお
いて、「停止状態」と「第１実行状態」と「第２実行状
態」とを有するタスクを実行する方法であって、該複数のプロセッサのうち第１タスクを実行中の第１プ
ロセッサが新たな第２タスクを生成した場合において、
該複数のプロセッサのうち「空き状態」を有する第２プ
ロセッサがあるか否かを検出するステップと、「空き状態」を有する第２プロセッサが検出された場合
には、該第２タスクを該第２プロセッサに割り当てるこ
とにより、該第２プロセッサによる該第２タスクの実行
を開始し、該第２プロセッサの状態を「空き状態」から
「実行状態」に変更し、該第２タスクの状態を「停止状
態」から「第１実行状態」に変更するステップと、「空き状態」を有する第２プロセッサが検出されない場
合には、該第１プロセッサによる該第１タスクの実行を
中断し、該第１プロセッサによる該第２タスクの実行を
開始し、該第２タスクの状態を「停止状態」から「第２
実行状態」に変更するステップとを包含する方法。
【請求項６】前記方法は、前記第２タスクの実行が終了した後、前記第２タスクの
状態を判定するステップと、前記第２タスクが「第１実行状態」を有すると判定され
た場合には、前記第２プロセッサの状態を「実行状態」
から「空き状態」に変更し、前記第２タスクの状態を
「第１実行状態」から「停止状態」に変更するステップ
と、前記第２タスクが「第２実行状態」を有すると判定され
た場合には、前記第２タスクの状態を「第２実行状態」
から「停止状態」に変更するステップとをさらに包含す
る、請求項５に記載の方法。
【請求項７】前記複数のプロセッサのそれぞれは、前
記複数のプロセッサを互いに識別する識別子を有してお
り、前記「空き状態」を有する第２プロセッサの検出
は、該識別子を用いて行われる、請求項５に記載の方
法。
【請求項８】前記複数のプロセッサのそれぞれは、タ
スクを割り当てる優先順位を決定する優先度を有してお
り、前記第２プロセッサへの前記第２タスクの割り当て
は、該優先度に基づいて行われる、請求項５に記載の方
法。
【請求項９】複数のタスクを並列に実行する複数のプ
ロセッサと、該複数のプロセッサの状態を管理し、該複数のプロセッ
サのそれぞれからの問い合わせに応じて「空き状態」の
プロセッサの識別子を返す状態管理手段とを備えたマル
チプロセッサシステムであって、該複数のプロセッサのそれぞれは、新たなタスクが発生
した時点で、該状態管理手段に対して「空き状態」のプ
ロセッサがあるか否かを問い合わる、マルチプロセッサ
システム。
【請求項１０】前記状態管理手段は、該プロセッサか
らの問い合わせに応答して、現在の状態を次の状態に遷
移させる手段と、該次の状態に基づいて該問い合わせに
対する応答を出力する手段とを備えている、請求項９に
記載のマルチプロセッサシステム。
【請求項１１】前記マルチプロセッサシステムは、該
複数のプロセッサのそれぞれについて、命令キャッシュ
メモリとデータキャッシュメモリとをさらに備えてい
る、請求項９に記載のマルチプロセッサシステム。
【請求項１２】前記マルチプロセッサシステムは、前
記複数のプロセッサ間で命令アドレスおよびパケットア
ドレスを転送するためのネットワークをさらに備えてい
る、請求項９に記載のマルチプロセッサシステム。
【請求項１３】該複数のタスクのそれぞれは、細粒度
である、請求項９に記載のマルチプロセッサシステム。