WO2003040948A1

WO2003040948A1 - Ordinateur et procede de commande

Info

Publication number: WO2003040948A1
Application number: PCT/JP2001/009788
Authority: WO
Inventors: Akira Naruse; Kouichi Kumon; Mitsuru Sato
Original assignee: Fujitsu Limited
Priority date: 2001-11-08
Filing date: 2001-11-08
Publication date: 2003-05-15
Also published as: US7337274B2; JPWO2003040948A1; US20040210723A1; JP4253796B2

Description

明細書コンピュータ及び制御方法技術分野

本発明は、キャッシュメモリを備えた複数のプロセッサを有する共有メモリ型マルチプロセッサ構成のコンピュータ及び制御方法に関し、特に、同期処理などに用いられるスピンウェイト命令の命令実行効率を改善するためのコンピュータ及び制御方法に関する。背景技術

従来、キャッシュメモリを備えた複数のプロセッサでメインメモリを共有する共有メモリ型マルチプロセッサシステムにおいては、プロセッサ間の同期処理にスピンウェイトが用いられることが多い。

このプロセッサ間の同期処理にスピンウェイトを使用する代表的な例がスピンロックである。スピンロックの命令処理は図 1のように、検証部 1 0 0と設定部 1 0 2の手順で実現されることが多い。検証部 1 0 0は、ロック獲得ポイントに達したプロセス又はスレツドがステップ S 1で変数 Xをロードし、ステップ S 2 で変数 Xが例えば X = 0といったロック獲得が可能であることを示す値か否か判定し、 X = 0になるまでステップ S 1， S 2の処理を繰り返すスピンを行って待つスピンウェイトを行う。設定部 1 0 2 は、「 tes t— and— set」や「compare— and— j ump」などのイン夕一ロック命令を用いて、ステップ S 3でロック変数値 Xを X = 1に設定してスピンロック処理を抜ける。もしロック変数値 X = 1の設定に失敗したら検証部 1 0 0に戻りスピンウェイトを継続する。このように、ロック獲得が可能であるかどうかをチェックするスピンロックの検証部 1 0 0でスピンウェイトが用いられることが多い。

スピンロック以外では、共有メモリ型マルチプロセッサシステムにおけるプロセッサ間の同期処理にスピンウェイトを使用するバリア同期がある。バリア同期とは、同期対象であるプロ.セス又はスレツドが同期ポイントで待ち合わせを行うことであり、メモリベースのバリア同期の場合には、図 2の手順で実現されることが多い。まず設定部 1 0 4のステップ S 1において、プロセス又はスレツドが同期ボイントに達する前は口ック変数 Xは X == 0である。同期ボイントに達するとプロセス又はスレツドは、「tes t— and_set」や「co即 are— and— ]' u即」などのイン夕一ロック命令を用いて該当するプロセス又はスレツドに対応するロック変数 X のビットを 1に設定し、検証部 1 0 6に進む。検証部 1 0 6は、ステップ S 2でロック変数 Xをロードし、ステップ S 3でバリア同期の対象となっている全プロセス又は全スレッドのビットが 1になるまで、即ち al l X = lまでスピンして待つスピンウェイトを行う。全プロセス又は全スレツドが同期ポイントに達すると、 al l X = lになり、同期がとられた状態でスピンウェイトを抜けて次の処理に移行する。このようにバリア同期でも、全プロセス又は全スレッドが同期ボイントに達しているかどうかをチェックする検証部 1 0 6でスピンウェイトが用いられることが多い。

また、 I /Oデバイス（入出力デバイス）との同期にもスピンウェイトが使用されている。通常の I ZO処理では、プロセッサと I ZOデバイス間の同期には割り込みを使うのが一般的であった。これは、 Iノ〇デバイスがプロセッサと比ベて非常に遅く、 I z oデバイスからの応答をプロセッサが待ち続けることの損失が大きかったためである。しかし、 I /Oデバイスの高速化により、一部の I ZOデバイスにおいては割り込みを使うことによる弊害が出てきている。一般的に割り込みはオーバーヘッド（遅延）が大きいので、 I ZOデバイス本来の速度を活かせない。そのため、一部の高速 I /oデバイスに関しては、スピンウェイトによる同期処理を採用し始めている。

しかしながら、スピンウェイトの実行には無駄が多い。スピンウェイトは、ゥエイト終了条件となっている変数値が他のプロセッサや I ZOデバイスなどの他のエージェントにより所望の値に変更されるまで延々と同じ命令列の実行を繰り返す。繰り返しの回数となるスピン回数は、場合によっては数百回、数千回に及ぶこともめずらしくなく、ある意味でプロセッサを無駄に使用しているといえる。電力消費の観点から考えると、スピンウェイトのあいだは無駄に電力を消費していることになる。また、複数スレツドの同時実行が可能な S MT (S imul t aneous Mul t i- Threading archi tec ture)プロセッサにおいては、スピンウェイトを実行中のスレツドが他の実行スレッドの妨げとなる可能性がある。一般的に S M Tプロセッサでは、プロセッサリソースはスレッド間で共有されている。このプロセッサリソースは、実行スレツド毎に均等に割当てられるのではなく、各スレツドの状態に応じて割当てられるプロセッサリソースの数や量が変わるというのが一般的である。プロセッサリソース割当てを決定する基準にはいろいろな方法が提案されているが、例えば次のようなアプローチがある。

( 1 ) キャッシュミスを起こしたスレツドへのリソース割当てを減らす； ( 2 ) 投機的に実行している命令数が多いスレッドへのリソース割当てを減らする；

( 3 ) リザべ一ションステーションに登録されている命令数の多いスレツドへのリソース割当てを減らす；

これらのアプローチは、よりスムーズに命令を実行できる可能性の高いスレツドに優先的にプロセッサリソースを割当てようという考えに基づいている。ここスピンウェイトは命令を非常にスムーズに実行することができる。なぜなら、同じ命令列の実行を繰り返しているだけなので、キャッシュミスも起らないし、分岐予測も外れることがないからである。したがって、 S MTプロセッサにおいては、スピンウェイトを実行中のスレツドに期せずして優先的にプロセッサリソースを割当てることになる。すると、スピンウェイト実行中スレッドに比べ、生産性の高い命令列を実行していると思われる他のスレッドへのプロセッサリソースの割当てが減ってしまい、結果としてプロセッサの性能が下がる可能性がある。この様に、スピンウェイ卜には

( 1 ) 電力を無駄に消費する；

( 2 ) S MTプロセッサの性能が下げる可能性が高い；

といった問題がある。

この問題への対策として、スピンウェイトが始まったことを検出したら、スピンウェイトの実行を停止し、スピンウェイトから抜けられる条件が整ったら割り込みにより通知し、実行を再開するという手法もある。しかし、スピンウェイトから抜けられる条件が整ったことを、割り込みで通知してしまっては元も子もなレ^ そもそもスピンウェイトは低遅延を実現するために採用しているのであり、割り込みを使つたら時間コストがが大きくなつてしまう。

また、同期専用のハードウェアを備えるという手法もある。しかし、その場合にはハードウェアコストが高くなる。現在、メモリベースの同期処理が一般的となっている背景には、汎用デバイス（メモリ）を用いて同期処理を行うことによるコスト削減のメリットが大きいという歴史的な経緯がある。

本発明は、スピンウェイトの実行で生じる電力やプロセッサリソースの無駄を省いて命令実行効率を高めるコンピュータ及び制御方法を提供することを目的とする。発明の開示。

本発明は、キャッシュメモリを備えた複数のプロセッサを有するコンピュータにおいて、プロセッサによるスピンウェイト命令の実行中を検出した際に、スピンウェイトの終了条件となっている変数値の監視を指示した後にプロセッサの動作状態を変更させるスピンウェイト検出部と、スピンウェイト検出部から指示された変数値を監視し、この変数値が変更されたことを検出した場合にプロセッサに値変更を通知して動作状態を元に戻す値変更検出部とを設けたことを特徴とする。このように本発明は、スピンウェイトから脱出できる可能性がない時、もしくは可能性が低い時は、プロセッサの動作状態を変更することにより、スピンゥエイト実行中に生ずる無駄を削減する。また本発明によれば、プロセッサにスピンウェイト検出部を設け、またキャッシュメモリに値変更検出部を設けるといつた少量のハードウェアの追加により、スピンウェイトが終了する可能性が無いか又は低いときの無駄を削減し、スピンウェイトの低遅延という特徴を損ねることなく、プロセッサの命令実行効率を良くする。

スピンウェイト検出部は、プロセッサによるスピンウェイト命令の実行中を検出した際に、スピンウェイト命令の実行で参照している変数値が格納されたキヤッシュメモリのキャッシュブロックの監視を値変更検出部に指示する。値変更検出部は、キャッシュブロックの状態が他のプロセッサ又は入出力ュニットにより無効化されたことを検出した場合に、プロセッサに値変更を通知する。変更検出部は、キャッシュブロックがキャッシュメモリから追い出されたことを検出した場合にも、プロセッサに値変更を通知する。

スピンウェイト検出部は、プロセッサによるスピンウェイト命令の実行中を検出した際に、スピンウェイト命令の実行で参照している変数値が格納されているメモリアドレスに対するバスリクエストの監視を値変更検出部に指示する。値変更検出部は、スピンウェイト検出部から指示された変数値が格納されているメモリアドレスに対するバスリクェストを監視し、他のプロセッサ又は入出力ュニットから前記メモリアドレスに対するバスリクエストを検出した場合に、プロセッザに値変更を通知する。

プロセッサは通常モードと低消費電力モードの少なくとも 2つ以上の動作モードを持っている場合、スピンウェイト検出部は、スピンウェイト命令の実行中を検出した際にプロセッサの動作モードを低消費電力モードに変更する。また値変更検出部は、スピンウェイトの終了条件となっている変数値の変更を検出した際に、プロセッサの動作モードを通常モードに変更させる。これによりスピンゥェィト実行中にプロセッサの消費電力量を削減できる。

プロセッサはプログラム実行を停止する機能を持っている場合、スピンウェイト検出部は、スピンウェイト命令の実行中を検出した際にプロセッサにプロダラムの実行を停止させる。また値変更検出部は、スピンウェイトの終了条件となつている変数値の変更を検出した際に、プロセッサにプログラムの実行を再開させる。これによりスピンウェイト実行中にプログラムの実行が停止され、これに伴いプロセッサの消費電力量を削減できる。

プロセッサは、複数スレッドを同時実行できる構造（S MTプロセッサ）を持つている場合、スピンウェイト検出部は、スピンウェイト命令の実行中のスレツドを検出した際に、このスレッドへのプロセッサリソースの割当てを減少又は停止させる。また値変更検出部は、スピンウェイトの終了条件となっている変数値の変更を検出した際に、スレツドへのプロセッサリソースの割当てを増加又は再開させる。これにより S M Pプロセッサにおけるスレツドのスピンウェイト実行中に、他のスレッドプログラムの実行が停止され、スピンウェイト実行スレッドによる他のスレツドへの悪影響を回避し、結果としてプロセッサの性能が上がる。プロセッサはスピンウェイト専用命令を持っており、スピンウェイト検出部は、プロセッサによるスピンウェイト専用命令の実行からスピンウェイト実行中を検出する。またスピンウェイト検出部は、プロセッサによる実効済命令列を格納するバッファと、スピンウェイト専用命令の命令列を記録する命令列記録部と、ッファと命令列記録部とを比較して命令列が一致した際に、スピンウェイト実行中を検出する比較部とを備える。

本発明は、キャッシュメモリを備えた複数のプロセッサを有するコンピュータの制御方法を提供するものであり、

プロセッサによるスピンウェイト命令の実行中を検出した際に、スピンウェイトの終了条件となっている変数値の監視を開始した後にプロセッサの動作状態を変更させ、

監視中に変数値が変更されたことを検出した場合にプロセッサに値変更を通知して動作状態を元に戻させることを特徴とする。

この制御方法の詳細はコンピュータの場合と基本的に同じになる。図面の簡単な説明

図 1は従来のスピンロック処理の説明図；

図 2は従来のバリア同期処理の説明図；

図 3は本発明が適用される共有メモリ型マルチプロセッサシステムのブック図；図 4は本発明によるプロセッサの実施形態のブロック図

図 5は図 4におけるスピンウェイト検出部の実施形態ブロック図；

図 6はキヤッシュブロックを監視する図 4における値変更検出部の実施形態のブロック図；

図 7はスピンウェイト検出時にキャッシュブロックを監視して値変更を検出する本発明の処理手順のタイムチャート；

図 8は本発明による同期処理の説明図

図 9はバストランザクションを監視する図 4における値変更検出部の他の実施形態のブロック図；図 1 0は本発明によるスピンウェイト検出時にバストランザクションを監視して値変更を検出する本発明の処理手順のタイムチャート；

図 1 1は本発明が適用される S MTプロセッサの概略構成のブロック図；図 1 2はスピンウェイトを検出してプロセッサリソースを削減する本発明の処理手順のタイムチヤ一ト；発明を実施するための最良の形態

図 3は、本発明が適用される共有メモリ型マルチプロセッサシステムのブロック図である。図 3において、マルチプロセッサシステムは、例えば 4台のプロセッサ 1 0— 1〜： L 0 — 4を備えており、プロセッサ 1 0— 1〜： L 0 — 4ごとにキャッシュメモリ 1 2—：！〜 1 2— 4が設けられている。キャッシュメモリ 1 2— 1〜1 2— 4はバス 1 4を介して共有メモリとして使用されるメインメモリ 1 6 を接続している。またバス 1 4には入出力ユニット 1 8が接続され、この入出力ュニット 1 8としては例えば入出力エージェントとして機能する入出力プロセッサであり、外部のハードディスクドライブ H D Dなどのサブシステムゃネットヮ —ク、更にはキーボード、マウス、ディスプレイなどの入出力機器を接続している。

図 4は、図 3のプロセッサ 1 0— 1の実施形態である。なお、他のプロセッサ 1 0 _ 2〜1 0 — 4も同じ実施形態となる。図 4において、プロセッサ 1 0— 1 は、プロセッサコア 1 1、キャッシュメモリインタフェース 2 0を備える。またキャッシュメモリ 1 2— 1は、プロセッサインタフェース 2 4、キャッシュメモリ制御部 2 6、バスインタフェース 2 8及びキャッシュメモリアレイ 3 0を備えている。このようなプロセッサ 1 0— 1及びキャッシュメモリ 1 2— 1の構成は従来のプロセッサと同じであるが、本発明にあってはプロセッサ 1 0— 1側に新たにスピンウェイト検出部 2 2を設け、同時にキャッシュメモリ 1 2— 1側に値変更検出部 3 2を設けている。プロセッサ 1 0— 1に設けられたスピンウェイト検出部 2 2は、プロセッサコア 1 1によるスピンウェイト命令の実行中を検出した際に、スピンウェイトの終了条件となっている変数値の監視をキャッシュメモリ 1 2 _ 1側に設けた値変更検出部 3 2に指示した後に、プロセッサ 1 0— 1の動作状態を変更させる。スピンウェイト検出部 2 2によるプロセッサ 1 0— 1の動作状態の変更としては、スピンウェイト命令の実行中に生ずる無駄を削減する動作状態に変更するものであり、具体的には次のようになる。

例えばプロセッサ 1 0 — 1が通常モードと低消費電力モ一ドの少なくとも 2つの動作モードを持っている場合には、スピンウェイト検出部 2 2でスピンウェイト命令の実行中を検出した際にはプロセッサの動作モードを低消費電力モードに変更する。またプロセッサがプログラム実行を停止する機能を持っている場合には、スピンウェイト検出部 2 2でスピンウェイト命令の実行中を検出した際にプ口セッサにプログラムの実行を停止させる。このスピンゥヱイト命令の実行を検出した際の低消費電力モードへの変更あるいはプログラムの実行停止のいずれも、スピンウェイトの終了条件が所定の値に変更されるまで延々とスピンウェイトの命令列の実行を繰り返すスピンにより、プロセッサの無駄な動作や無駄に使用している消費電力を防ぐようにする。もちろん、スピンウェイト命令検出時のプロセッサによるプログラムの実行停止は低消費電力モードの 1つの形態に含まれると言うこともできる。

キャッシュメモリ 1 2 _ 1側に設けた値変更検出部 3 2は、スピンウェイト検出部 2 2から指示されたスピンウェイトの終了条件となっている変数値を監視し、この変数値が他のプロセッサ 1 0 _ 2〜1 0— 4や入出力ュニット 1 8により変更されたことを検出した場合に、プロセッサ 1 0— 1側に値変更を通知してプロセッサの動作状態を元に戻す。例えば、スピンウェイト命令実行中の検出でプロセッサか低消費電力モードに変更されていた場合には通常モードに戻す。またスピンウェイト命令の実行中の検出でプロセッサのプログラムの実行停止となっていた場合にはプログラムの実行を再開させる。

図 5は、図 4のプロセッサ 1 0— 1に設けているスピンウェイト検出部 2 2の実施形態である。スピンウェイト検出部 2 2は、実行済命令列バッファ 3 4、スピンウェイ卜命令列記録部 3 6及び比較部 3 8を備える。この実施形態にあっては、既存の命令セット I S A (Instruction Set Architecture) をそのまま使用した場合を例に取っている。スピンウェイト検出部 2 2は、まずスピンウェイト命令列記録部 3 6にスピンウェイトであることを示す命令列を予め記録する。この命令列の記録は複数個でもよく、また記録内容は予め定められたものであっても良い。実行済命令列バッファ 3 4には、プロセッサコアで実行が完了した命令列が記録される。比較部 3 8は、スピンウェイト命令列記録部 3 6に記録している基準となる命令列と実行済命令列バッファ 3 4に記録された命令列を比較し、両者が一致したら即ちスピンウェイト命令列が実行されていることを検出したら、キャッシュメモリインタフェース 2 0に対しスピンウェイト命令列検出信号 E 1 を出力する。

図 6は、図 4のキャッシュメモリ 1 2— 1側に設けている値変吏検出部 3 2の実施形態である。この実施形態において値変更検出部 3 2には、監視対象先記録部 4 0とキャッシュステート監視部 4 2を設けている。プロセッサにおいてスピンウェイト命令の実行によりスピンウェイトが始まると、図 5に示したスピンゥエイト検出部 2 2よりスピンウェイト命令列検出信号 E 1が出力され、図 6の値変更検出部 3 2に設けている監視対象アドレス記録部 4 0にスピンウェイトの終了条件として参照している変数値を格納しているキャッシュブロック、具体的にはキャッシュメモリエントリを、キャッシュメモリ制御部 2 6を経由して受けて記録する。キャッシュステート監視部 4 2は監視対象アドレス記録部 4 0に記録されたキャッシュメモリエントリを監視しており、このエントリのキャッシュステート（キャッシュ状態）が更新されたら、キャッシュメモリ制御部 2 6を介してプロセッサ側に値変更検出信号 E 2を出力する。

この実施形態において、キャッシュプロトコルとしては M E S Iプロトコルを例にとっており、この場合、キャッシュステート監視部 4 2は監視対象となるェントリのキヤッシュステートが無効 Iに更新されたら値変更検出信号 E 2を出力する。なおキャッシュステート監視部 4 2としては、スピンウェイト終了条件となっている変数値の書き換えに対応したキャッシュステートの無効 Iの更新から値変更検出信号 E 2を出力しているが、キャッシュメモリの L R Uアルゴリズムにより監視対象となっているキャッシュメモリエントリの追い出しが行われた場合にも値変更検出信号 E 2を出力する。

図 7は、スピンウェイト検出時にスピンウェイト終了条件となっている変数値が格納されているキャッシュメモリエントリ（キャッシュブロック）を監視して値変更を検出する本発明の処理手順のタイムチャートである。まずスピンウェイト検出部 2 2がステップ S 1でプロセッサ 1 0— 1でスピンウェイト命令を実行中か否かチェックしている。プロセッサ 1 0— 1でスピンウェイト命令が実行されると、図 5の実施形態に示したようなスピンウェイト検出部 2 2でスピンゥェイト命令の実行が検出され、スピンウェイト命令検出信号 E 1が出力される。これによって、ステップ S 2でスピンウェイト検出部 2 2は、スピンウェイトで参照している変数値が格納されたキャッシュブロックの監視をキャッシュメモリ 1 2— 1側の値変更検出部 3 2に指示する。これと同時にスピンウェイト検出部 2 2は、ステップ S 3でプロセッサ 1 0— 1によるスピンウェイト命令の実行を停止し、低消費電力の動作状態に入る。

スピンウェイト検出部 2 2からキャッシュブロックの監視 ¾指示された値変更検出部 3 2は、ステップ S 1 0 1でプロセッサから指示されたキャッシュブロックの監視を開始する。即ち、ステップ S 1 0 2で監視対象となるキャッシュプロックにおけるキャッシュステート即ちキャッシュ状態の状態変化、具体的には無効化が行われたか否かを検出している。この状態で他のプロセッサ 1 0— 1〜1 0— 4のいずれか、あるいは入出力ュニット 1 8によるキャッシュブロックの更新があると、監視しているキャッシュブロックのキャッシュステートが無効状態に更新される。これをステップ S 1 0 2で検出すると、ステップ S 1 0 3に進み、キャッシュブロックの状態変化を図 6の値変更検出部 3 0より値変更検出信号 E 2として出力し、キャッシュブロックの状態変化即ち無効化をプロセッサ側に通知する。この値変更検出信号を受けて、スピンウェイト検出部 2 2にあっては、ステップ S 4でプロセッサ 1 0— 1によるスピンウェイト命令の実行を再開する図 8は、マルチプロセッサシステムにおけるバリア同期処理を例にとって本発明の処理手順を示した説明図である。図 8 (A) はバリア同期処理の対象となるマルチプロセッサシステムの一部であり、説明を簡単にするため 2台のプロセッサ 1 0— 1， 1 0— 2のバリア同期処理を例にとっている。またプロセッサ 1 0 一 1， 1 0— 2に設けたキャッシュメモリ 1 2— 1， 1 2— 2にあっては、スピンウェイト命令の実行で参照しているスピンウェイトの終了条件となっている 2 ビットの変数値とキャッシュブロックにおけるキャッシュステートを示している _t このキャッシュステートは M E S Iプロトコルに対応しており、また変数値は 2 台のプロセッサ 1 0— 1， 1 0 — 2のバリア同期であることから、それぞれに対応した 2ビットの情報であり、同期ポイントに達する前の状態では「0 0」となつている。

図 8 ( B ) 〜（G) は、図 7に示した本発明の処理手順に従ったパリア同期処理の動作の遷移状態を時間的に分けて表わしている。図 8 ( B ) はバリア同期の対象となっている 2台のプロセッサ 1 0— 1 , 1 0— 2の内、プロセッサ 1 0— 1が同期ポイントに達してスピンウェイトした状態である。即ちプロセッサ 1 0 _ 1は、同期ポイントへの到達で図 2に示した設定部 1 0 4の処理により、キヤッシュメモリ 1 2— 1の対象エントリの変数値のうち自分の対応ビットを 1にセットし、これにより変数値は「0 0」から「0 1」となる。このキャッシュメモリ 1 2 — 1の変数値の更新に際し、同じキャッシュブロックを持っているプロセッサ 1 0— 2のキャッシュメモリ 1 2— 2にあっては、キャッシュステートの無効化が行われる。なおキャッシュメモリ 1 2— 1にあっては、該当するキヤッシュブロックのキャッシュステートは変更 Mに更新される。

この図 8 ( B ) のようにプロセッサ 1 0 _ 1でスピンウェイト状態になると、図 4のようにプロセッサ 1 0— 1に設けているスピンウェイト検出部 2 2がスピンウェイト命令の実行中を検出し、キャッシュメモリ 1 2 — 1に対し該当するキャッシュブロックのキャッシュステートが無効 Iになるか否かの監視を指示する。同時にプロセッサ 1 0— 1に対し例えばスピンウェイトのプログラム実行を停止させる。これにより図 8 ( C) のように、プロセッサ 1 0— 1はスピンウェイトのプログラム実行を停止した状態となり、一方、プロセッサ 1 0 — 2は通常モードでプログラム実行を続けている。

図 8 (D) はプロセッサ 1 0— 2が同期ポイントに達したときの処理である。プロセッサ 1 0— 2が同期ポイントに達すると、スピンウエイト命令の実行によりキャッシュメモリ 1 2— 2からスピンウェイト終了条件となる変数値の読み込みを行う。このときキヤッシュメモリ 1 2— 2の該当キャッシュブロックは無効 I状態にあることから、キャッシュプロトコルによりプロセッサ 1 0 — 1のキヤッシュメモリ 1 2— 2から変数値を読み出してキャッシュステートを共有 S状態にした後にプロセッサ 1 0— 2で読み取る。続いて図 8 (E) のように、プロセッサ 1 0— 2は自分に割り当てられているビットを 1に書き換えることで変数値を「1 1」とする。この変数値の更新により、プログラムの実行停止にあるプロセッサ 1 0—1のキャッシュメモリ 1 2 — 1に対し変数値の無効化が行われ、キャッシュステートはそれまでの共有 Sから無効 Iに更新される。このキャッシュメモリ 1 2— 1における無効 Iへの状態変化を図 4のキャッシュメモリ 1 2— 1 側に設けている値変更検出部 3 2で検出すると、プロセッサ 1 0— 1に対し値変更通知を行い、これによつて、それまで停止していたプログラムの実行が再開される。

このため、プログラムの実行を再開したプロセッサ 1 0— 1は、図 8 ( F ) でスピンウェイト命令の実行によりキャッシュメモリ 1 2 - 1の該当キャッシュブロックの変数値「1 1」を読み込み、これによつてスピンウェイト終了条件が成立したことを認識する。このときプロセッサ 1 2— 2側にあっても、変数値「1 1」の認識でスピンウェイト終了条件を判定しており、これにより 2台のプロセッサ 1 0— 1， 1 0— 2のバリア同期が取られ、図 8 ( G) のようにスピンゥェィトを終了して、次のプログラムの実行処理に移行することになる。

図 9は、図 4のキャッシュメモリ 1 2— 1側に設けている値変更検出部 3 2の他の実施形態であり、この実施形態にあってはスピンウェイトの終了条件となつている変数値を格納しているキャッシュブロックに対する他のプロセッサ、あるいは入出力ユニットによる変数値変更のためのパストランザクション（バスリクエスト）を監視して値変更を検出するようにしたことを特徴とする。

図 9の値変更検出部 3 2は、図 6と同じ監視対象アドレス記録部 4 0に対しバストランザクション監視部 4 4を設けている。プロセッサ側でスピンウェイト命令の実行が開始されると、スピンウェイ卜で参照しているデータアドレスが監視対象ァドレス記録部 4 0に記録される。バストランザクシヨン監視部 4 4は、監視対象アドレスに対する他のプロセッサあるいは入出力ュニットからのパス 1 4 によるトランザクションをバスインタフェースス 2 8を介して監視しており、監視しているバストランザクションを検出すると、値変更検出信号 E 2をキヤッシュメモリ制御部 2 6を経由してプロセッサ側に出力する。このバスヨンの監視による値変更検出は、スピンウェイトの終了条件となっている変数値の変更を直接検出するものではなく、正確には変数値が変更される可能性があることを検出していると言うことができる。

図 1 0は、図 9のバストランザクションの監視により値変更を検出する場合の本発明の処理手順のタイムチャートである。スピンウェイト検出部 2 2は、ステップ S 1でプロセッサでのスピンウェイト命令実行中を検出すると、ステップ S 2で、スピンウェイト命令で参照している変数値が格納されているキャッシュブロック、即ちデ一夕アドレスの監視の指示をキャッシュメモリ側の値変更検出部

3 2に対し行う。またステップ S 3で、スピンウェイト検出部 2 2はプロセッサに対しスピンウェイト命令列検出実行を出力して、プロセッサによるスピンゥェィト命令の実行を停止させる。

キャッシュメモリ側の値変更検出部 3 2にあっては、ステップ S 1 0 1でプロセッサ側から指示されたデ一タアドレスに対するバストランザクションを監視し、監視対象のキャッシュブロックに対するバストランザクションをステップ S 1 0 2で検出すると、ステップ S 1 0 3でバストランザクションによる状態変化（可能性）を値変更検出信号の出力によりプロセッサ側に通知する。これを受けてスピンウェイト検出部 2 2にあっては、ステップ S 4でプロセッサによるスピンゥエイト命令の実行を再開することになる。

次に図 3のプロセッサ 1 0 _ 1〜1 0— 4として S M Tプロセッサを使用した場合について、スピンウェイト命令実行中のプロセッサに対するプロセッサリソースの割当てを削減する本発明の他の実施形態を説明する。

図 1 1は、本発明が適用される S M Tプロセッサの概略構成である。 S M Tプ口セッサは、命令ポインタ 4 6— 1 , 4 6— 2、フェッチ Zデコード 4 8— 1 ,

4 8— 2、実行ユニット 5 0、リタイヤメントユニット 5 2、 1次命令キヤッシュユニット 5 4、 1次データキャッシュユニット 5 6及び 2次キャッシュュニット 5 8を備えている。このような概略構成を持つ S MTプロセッサは、同時に複数スレツドを実行するため通常は命令ポインタを複数持っており、この例では 2 つの命令ポインタ 4 6— 1， 4 6— 2を持った場合を示している。この命令ポィンタ 4 6— 1， 4 6— 2及びフェッチ/デコード 4 8— 1， 4 8— 2で実現される 2つのスレツドの実行にあっては、実行ュニット 5 0などのリソースをスレツド間で共有することにより、リソースの有効利用率を高めており、これが S MT プロセッサの狙いである。このように複数のスレツドでプロセッサリソースを共有する S MTプロセッサにあっては、次にどのスレツドの命令を実行ュニット 5 0に割り当てるかを極める方針がいろいろ提案されている。そこで本発明は、この実行ュニットなどのプロセッサリソースをどのスレツドの命令に割り当てるかを決める方針の決定に利用することができる。具体的には、スピンウェイト実行中のスレツドを検出したら、スピンウェイト命令を実行中のスレツドに対する実行ュニットなどのプロセッサリソースの割当てを削減もしくは停止する。これによってスピンウェイトではない、より意味のある命令を実行している他のスレツドの命令を実行ユニットに割り当てる機会が増え、その結果、 S MTプロセッサの処理性能の向上が期待できる。

図 1 2は、 S MTプロセッサについてスピンウェイトを検出してプロセッサリソースを削減する本発明の処理手順のタイムチヤ一トである。 S M Tプロセッサ側のスピンウェイト検出部 2 2は、ステップ S 1で複数のスレッドの内のあるスレツドでスピンウェイト実行中か否かをチェックしており、実行中を検出すると、ステップ S 2に進み、スピンウェイトで参照している変数値が格納されたキヤッシュブロックの監視をキャッシュメモリ側の値変更検出部 3 2に指示する。またステップ S 3で、スピンウェイト命令を実行中のスレツドの命令を割り当てるプ口セッサリソースの削減または停止を行う。具体的には、例えば命令ポインタ 4 6 - 1及びフェッチ /デコード 4 8— 1側で実行されるスレッドの命令でスピンウェイト実行中が検出された場合には、このスレツドによる命令の実行ュニット 5 0に対する割当てを削減または停止し、スピンウェイト命令以外の命令を実行している命令ポインタ 4 6 - 2 , フェッチ /デコード 4 8— 2側となる他のスレッドの命令に実行ュニット 5 0を割り当てる。

キャッシュメモリ側の値変更検出部 3 2にあっては、ステップ S 1 0 1でプロセッサ側から指示されたキャッシュブロックのキャッシュステートを監視し、ステツプ S 1 0 2でキャッシュステート即ち状態が無効 Iに更新されたことを検出すると、ステップ S 1 0 3でキャッシュブロックの状態変化をプロセッサ側に通知する。これを受けてスピンウェイト検出部 2 2側にあっては、ステップ S 4でスピンウェイト命令を実行中のスレツドに対するそれまでのプロセッサリソースの割当ての削減または停止を解除する。

なお上記の実施形態にあっては、キャッシュプロトコルとして M E S Iプロトコルを例にとるものであつたが、無効 Iへの更新を含むものであれば適宜のキヤッシュプロトコルであってもよい。また上記の実施形態にあっては、スピンゥェィト終了条件のための変更値として該当するキャッシュブロックのキャッシュステートの無効化、あるいはこのステ一トに対するバストランザクションからキヤッシュ終了条件となっている変数値を直接または間接的に監視しているが、これ以外の変数値の直接または間接的な監視であっても良いことはもちろんである。また上記の実施形態にあっては、スピンウェイト実行中を検出した際のプロセッサの動作状態の変更として、低消費電力モードへの変更、プログラムの実行停止、更には S MTプロセッサにあってはプロセッサリソースの割当て減少または停止を例に取るものであつたが、これ以外に適宜のスピンウェイト命令の実行で生ずる無,駄を省くプロセッサの動作状態の変更であれば適宜のものを含む。また本発明は上記の実施形態に限定されず、その利点と目的を損なうことのない適宜の変形を含む。更に本発明は上記の実施形態に示した数値による限定は受けない。【産業上の利用可能性】

以上説明してきたように本発明によれば、スピンウェイトの特徴である遅延の低さを犠牲にすることなく、スピンウェイト命令実行によって発生する無駄な命令実行やプロセッサの動作を制限することができ、その結果としてプロセッサの電力消費を節減することができる。

また S MTプロセッサにあっては、スピンウェイト実行スレッドによる他のスレツドへの悪影響を回避することができ、 S MTプロセッサの処理能力を向上させることができる。

Claims

請求の範囲

1 .キャッシュメモリを備えた複数のプロセッサを有するコンピュータに於いて、前記プロセッサによるスピンウェイト命令の実行中を検出した際に、前記スピンウェイ卜の終了条件となっている変数値の監視を指示した後に前記プロセッサの動作状態を変更させるスピンウェイト検出部と、 .

前記スピンウェイト検出部から指示された変数値を監視し、該変数値が変更されたことを検出した場合に前記プロセッサに値変更を通知して動作状態を元に戻す値変更検出部と、

を備えたことを特徴とするコンピュータ。

2 . 請求の範囲 1のコンピュータにおいて、前記スピンウェイト検出部は、前記プロセッサによるスピンウェイト命令の実行中を検出した際に、前記スピンゥェィト命令の実行で参照している前記変数値が格納された前記キャッシュメモリのキャッシュブロックの監視を前記値変更検出部に指示し、

前記値変更検出部は、前記スピンウェイト検出部から指示されたキャッシュブロックを監視し、該キャッシュブロックの状態が変更されたことを検出した場合に前記プロセッサに値変更を通知することを特徴とするコンピュータ。

3 . 請求の範囲 2のコンピュータに於いて、前記値変更検出部は、前記キヤッシュブロックの状態が他のプ口セッサ又は入出力ユニットにより無効化されたことを検出した場合に、前記プロセッサに値変更を通知することを特徴とするコンビュ一タ。

4 . 請求の範囲 2のコンピュータに於いて、前記値変更検出部は、前記キヤッシュブロックがキャッシュメモリから追い出されたことを検出した場合に、前記プ口セッサに値変更を通知することを特徴とするコンピュータ。

5 . 請求の範囲 1のコンピュータに於いて、前記スピンウェイト検出部は、前記プロセッサによるスピンウェイト命令の実行中を検出した際に、前記スピンウェイト命令の実行で参照している変数値が格納されているメモリアドレスに対するバスリクエストの監視を前記値変更検出部に指示し、

前記値変更検出部は、前記スピンウェイト検出部から指示された変数値が格納されているメモリアドレスに対するバスリクエストを監視し、他のプロセッサ又は入出力ュニッ卜から前記メモリアドレスに対するバスリクエストを検出した場合に、前記プロセッサに値変更を通知することを特徴とするコンピュータ。

6 . 請求の範囲 1のコンピュータに於いて、

前記プロセッサは通常モードと低消費電力モ一ドの少なくとも 2つ以上の動作モードを持っており、

前記スピンウェイト検出部は、スピンウェイト命令の実行中を検出した際に前記プロセッサの動作モードを低消費電力モードに変更し、

前記値変更検出部は、前記スピンウェイトの終了条件となっている変数値の変更を検出した際に、前記プロセッサの動作モードを通常モードに変更させることを特徴とするコンピュータ。

7 . 請求の範囲 1のコンビュ一夕に於いて、

前記プロセッサはプログラム実行を停止する機能を持っており、

前記スピンウェイト検出部は、スピンウェイト命令の実行中を検出した際に前記プロセッサにプログラムの実行を停止させ、

前記値変更検出部は、前記スピンウェイトの終了条件となっている変数値の変更を検出した際に、前記プロセッサにプログラムの実行を再開させることを特徴とするコンピュータ。

8 . 請求の範囲 1のコンピュータに於いて、

前記プロセッサは、複数スレツドを同時実行できる構造を持っており、前記スピンウェイト検出部は、スピンウェイト命令の実行中のスレツドを検出した際に、該スレツドへのプロセッサリソースの割当てを減少又は停止させ、前記値変更検出部は、前記スピンウェイトの終了条件となっている変数値の変更を検出した際に、前記スレツドへのプロセッサリソースの割当てを増加又は再開させることを特徴とするコンピュータ。

9 . 請求の範囲 1のコンピュータに於いて、前記プロセッサはスピンウェイト専用命令を持っており、前記スピンウェイト検出部は、前記プロセッサによるスピンウェイト専用命令の実行からスピンウェイト実行中を検出することを特徴とするコンピュータ。

1 0 . 請求の範囲 1のコンピュータに於いて、前記スピンウェイト検出部は、前記プロセッサによる実効済命令列を格納するバッファと、

前記スピンウェイト専用命令の命令列を記録するスピンウェイト命令列記録部と、

前記バッファとスピンウェイト命令列記録部とを比較して命令列が一致した際に、スピンウェイト実行中を検出することを特徴とするコンピュータ。

1 1 . キャッシュメモリを備えた複数のプロセッサを有するコンピュータの制御方法に於いて、

前記プロセッサによるスピンウェイト命令の実行中を検出した際に、前記スピンウェイトの終了条件となっている変数値の監視を開始した後に前記プロセッサの動作状態を変更させ、

前記変数値が変更されたことを検出した場合に前記プロセッサに値変更を通知して動作状態を元に戻すことを特徴とするコンピュータの制御方法。

1 2 . 請求の範囲 1 1のコンピュータの制御方法に於いて、

前記プロセッサによるスピンウェイト命令の実行中を検出した際に、前記スピンウェイト命令の実行で参照している前記変数値が格納された前記キャッシュメモリのキャッシュブロックの監視を開始し、前記キャッシュブロックの監視中に、該キャッシュブロックの状態が変更されたことを検出した場合に前記プロセッサに値変更を通知することを特徴とするコンピュー夕の制御方法。

1 3 . 請求の範囲 1 2のコンピュータの制御方法に於いて、前記キャッシュブロックの状態が他のプロセッサ又は入出力ュニットにより無効化されたことを検出した場合に、前記プロセッサに値変更を通知することを特徴とするコンピュータの制御方法。

1 4 . 請求の範囲 1 2のコンピュータの制御方法に於いて、前記キャッシュブロックがキャッシュメモリから追い出されたことを検出した場合に、前記プロセッサに値変更を通知することを特徴とするコンピュータの制御方法。

1 5 . 請求の範囲 1 1のコンピュータの制御方法に於いて、

前記プロセッサによるスピンウェイト命令の実行中を検出した際に、前記スピンウェイト命令の実行で参照している変数値が格納されているメモリアドレスに対するバスリクエストの監視を開始し、

前記メモリアドレスに対するバスリクエストの監視中に、他のプロセッサ又は入出力ュニッ卜から前記メモリアドレスに対するバスリクエストを検出した場合に、前記プロセッサに値変更を通知することを特徴とするコンピュータの制御方

1 6 . 請求の範囲 1 1のコンピュータの制御方法に於いて、

前記プロセッサは通常モードと低消費電力モードの少なくとも 2つ以上の動作モ一ドを持っており、

前記スピンウェイト命令の実行中を検出した際に前記プロセッサの動作モードを低消費電力モードに変更させ、

前記スピンウェイトの終了条件となっている変数値の変更を検出した際に、前記プロセッサの動作モードを通常モードに変更させることを特徴とするコンビュ一夕の制御方法。

1 7 . 請求の範囲 1 1のコンピュータの制御方法に於いて、

前記スピンウェイト命令の実行中を検出した際に前記プロセッサにプログラムの実行を停止させ、

前記スピンウェイトの終了条件となっている変数値の変更を検出した際に、前記プロセッサにプログラムの実行を再開させることを特徴とするコンピュータの制御方法。

1 8 . 請求の範囲 1 1のコンピュータの制御方法に於いて、

前記プロセッサは、複数スレツドを同時実行できる構造を持っており、前記スピンウェイト命令の実行中のスレツドを検出した際に、該スレツドへのプロセッサリソースの割当てを減少又は停止させ、

スピンウェイ卜の終了条件となっている変数値の変更を検出した際に、前記スレッドへのプロセッサリソースの割当てを増加又は再開させることを特徴とするコンピュータの制御方法。

1 9 . 請求の範囲 1 1のコンピュータの制御方法に於いて、前記プロセッサはスピンウェイト専用命令を持っており、前記プロセッサによるスピンウェイト専用命令の実行からスピンウェイト実行中を検出することを特徴とするコンピュータの制御方法。

2 0 . 請求の範囲 1 9のコンピュータの制御方法に於いて、前記スピンウェイト検出は、

前記スピンウェイト専用命令の命令列をスピンウェイト命令列記録部に記録し、前記プロセッサによる実行済命令列を順次バッファに格納し、

前記バッファとスピンウェイト命令列記録部とを比較して命令列が一致した際に、スピンウェイト実行中を検出することを特徴とするコンピュータの制御方法。