JP3320312B2

JP3320312B2 - ディレクトリ・ベースのキャッシュ・コヒーレンス・プロトコルによるマルチプロセッサのための無効バス最適化

Info

Publication number: JP3320312B2
Application number: JP19172496A
Authority: JP
Inventors: サンドラ・ジョンソン・ベイラー; ヤルサン・ス
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1995-09-25
Filing date: 1996-07-22
Publication date: 2002-09-03
Anticipated expiration: 2016-07-22
Also published as: EP0764905A1; DE69616226D1; KR100234503B1; KR970016951A; EP0764905B1; US5778437A; JPH0991255A; DE69616226T2

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は一般に、各々が専用
キャッシュを有する複数のプロセッサがマルチステージ
相互接続ネットワークにより共用メモリに接続される、
マルチプロセッサ・システムに関し、特に、ディレクト
リ・ベースのキャッシュ・コヒーレンス・プロトコルの
使用による、マルチプロセッサ・システムにおける無効
バスの最適化によるシステム性能の改良に関する。

【０００２】

【従来の技術】並列処理システムの登場は、従来のユニ
プロセッサ・システムに勝る性能的な向上を潜在的に招
いた。主メモリ帯域幅は、こうしたシステム内の益々高
速化するプロセッサにより求められる要求を満足するこ
とができなかった。この問題に起因するアクセス・ギャ
ップを緩和する１つの方法は、プロセッサにキャッシュ
・メモリとして既知の小さな高速バッファを関連付ける
ことである。このキャッシュ・メモリは通常、主メモリ
よりも桁違いに高速であり、プロセッサのスピードに適
合する。

【０００３】共用メモリ・マルチプロセッサは通常、関
連付けられる専用キャッシュ・メモリを有する多数のプ
ロセッサ、大域メモリ、及びプロセッサと特定のまたは
全ての大域メモリ間の相互接続ネットワークから構成さ
れる。大域メモリは主メモリを構成し、これはプロセッ
サにより共用され、しばしば複数のメモリ・モジュール
として実現される。共用メモリ・システム内のメモリ・
ラインの複数のコピーを有し得る複数キャッシュの導入
は、データの非一貫性を生じ得る。一般に、この問題を
解決するために、現在使用可能な２つの方法が存在す
る。それらはハードウェア及びソフトウェアによるキャ
ッシュ・コヒーレンスである。本発明はハードウェア・
キャッシュ・コヒーレンス・プロトコルを取り扱う。

【０００４】ハードウェア・プロトコルは、バス（また
はスヌーピ）・ベース及びディレクトリ・ベースの２つ
のタイプに細分化される。バス・ベース・プロトコル
は、一般に比較的少数のプロセッサを有するシステムで
使用されるのに対して、ディレクトリ・ベース・プロト
コルは、改良されたスケーラビリティを有する大規模シ
ステムで使用される。ディレクトリ・ベースのプロトコ
ルでは、大域ディレクトリが通常、主メモリに関連付け
られ、主にキャッシュ・ラインの大域状態を決定するた
めに使用される情報の他に、キャッシュ・ラインのコピ
ーを有するキャッシュ・メモリの数及び（または）位置
を含む。

【０００５】従来のディレクトリ・ベースのキャッシュ
・コヒーレンス・プロトコルでは、全てのプロセッサが
同時にキャッシュ・コヒーレンス活動を調査することを
可能にする大域機構が存在しない。従って、大域ディレ
クトリは、ラインの大域状態、及びラインのコピーを有
するプロセッサの識別または番号を記録するために使用
される。プロセッサがラインを変更しようと試み、その
ラインへの排他的読出し／書込みアクセスを有さない場
合、プロセッサは変更要求をマルチステージ相互接続ネ
ットワーク（ＭＩＮ）を介して、そのラインに関連付け
られる大域ディレクトリ・エントリに送信する。ディレ
クトリは次に、そのラインのコピーを有するプロセッサ
に無効を送信するか、またはそのラインのコピーを有す
るプロセッサの識別が知れてない場合には、同様にＭＩ
Ｎを介して無効を全てのプロセッサに同報する。無効肯
定応答が次にディレクトリに、またはそのラインの変更
を要求するキャッシュに、ＭＩＮを介して返送される。
ＭＩＮを行き交う無効及び肯定応答に関連付けられるオ
ーバヘッドが、ＭＩＮにおけるかなりの競合を生じ、性
能を低下させる。

【０００６】大域ディレクトリ・ベースのキャッシュ・
コヒーレンス・プロトコルに関する、幾つかの研究が実
施された。

【０００７】しかしながらこれらの研究はいずれも、無
効及び続く肯定応答により引き起こされるネットワーク
待ち時間がこれらのプロトコルの性能に及ぼす影響を低
減するための方策を考慮していない。ＭＩＮを用いるマ
ルチプロセッサ及び専用キャッシュは、通常、ディレク
トリ・ベースのキャッシュ・コヒーレンス・プロトコル
によりデータの一貫性を維持するが、ネットワーク遅延
がこうしたシステムの性能を制限し得る。なぜなら、無
効に帰するプロセッサ書込みに、ネットワークを通じる
２回の往復が要求されるからである。

【０００８】キャッシュに関連付けられるスヌーピング
・バスを有するマルチプロセッサ、及びプロセッサをメ
モリ・モジュールに接続する相互接続ネットワークのシ
ステムでは、全てのコヒーレンス関連活動がこのバスを
介して発生する。バスがマルチプロセッサ・システムの
大域通信源として機能するので、キャッシュ・コヒーレ
ンス・プロトコルにおいて無効肯定応答は要求されな
い。ＭＩＮは単にキャッシュとメモリ間のデータ転送の
ために使用される。このアーキテクチャは最大６４プロ
セッサまでスケーラブルである。しかしながら、プロセ
ッサの数が増加したときに、スヌーピング・バスが飽和
し、システムのスケーラビリティを制限する可能性が存
在する。

【０００９】

【発明が解決しようとする課題】従って、本発明の目的
は、スケーラブル・マルチプロセッサ・システムにおい
て使用されるマルチステージ相互接続ネットワーク（Ｍ
ＩＮ）にとって有用な最適化機構を提供することであ
り、この機構は、通常こうしたシステムにおいて遭遇す
るネットワーク遅延無しに、キャッシュ・コヒーレンス
を提供する一方、システムのスケーラビリティを維持す
るものである。

【００１０】本発明の別の特定の目的は、ネットワーク
待ち時間の欠点を軽減し、システム性能を改良する、ス
ケーラブル・マルチプロセッサ・システムのための大域
ディレクトリ・ベースのキャッシュ・コヒーレンス・プ
ロトコルを提供することである。

【００１１】

【課題を解決するための手段】本発明によれば、無効バ
スが無効専用のために、または無効及び肯定応答のため
に使用される。専用キャッシュ、マルチステージ相互接
続ネットワーク（ＭＩＮ）、及びインタリーブド・メモ
リ・モジュールを有する共用メモリ・マルチプロセッサ
・システムが、本発明の好適な態様では想定される。キ
ャッシュ・コヒーレンス・プロトコルは、ディレクトリ
・ベースのプロトコルにより実現されるものと想定され
る。本発明は特に、ディレクトリ・ベースのコヒーレン
ス・プロトコルにおける無効及び肯定応答のＭＩＮオー
バヘッドを低減するように、設計される。

【００１２】本発明による最適化機構では、プロセッサ
が共用データを変更しようとするとき、遠隔キャッシュ
内の全てのデータを無効にするために、無効バスをマル
チステージ相互接続ネットワーク（ＭＩＮ）のプロセッ
サ側に含む。無効バスは、プロセッサがコヒーレンス・
プロトコルの無効活動を同時に調査することを容易にす
る大域機構を提供する。ディレクトリ・ベースのプロト
コルが想定されるので、ディレクトリはキャッシュ・ラ
インに関する状態情報を保持する必要がある。しかしな
がら、本発明は従来のディレクトリ・ベースのプロトコ
ルとは異なる。なぜなら本発明では、キャッシュ・ライ
ンのコピーを有するキャッシュの識別を知る必要がな
く、単にキャッシュ・ラインのコピーを有するキャッシ
ュの実際の数を知ればよいからである。従って、無効が
バス上に出力される場合、ディレクトリがキャッシュ・
ラインのコピーを有する全てのキャッシュが無効にされ
たことを知るように、無効肯定応答も必要とされる。

【００１３】本発明と従来のアーキテクチャとの違い
は、従来の場合には、バス・ベースのキャッシュ・コヒ
ーレンス・プロトコルを使用する点であり、キャッシュ
・コヒーレンスが完全にバス上で実現される。それに対
して、本発明はディレクトリ・ベースのキャッシュ・コ
ヒーレンス・プロトコルを使用する。キャッシュ・コヒ
ーレンス・プロトコルの大半が、ディレクトリを用いて
実現される。このことは、従来のスヌーピ・バス・アプ
ローチにおいては要求されない無効肯定応答の使用を必
要とする。同時に、本発明は従来のディレクトリ・ベー
スのプロトコルとも異なり、キャッシュ・ラインのコピ
ーを有するプロセッサを追跡する必要がなく、無効のた
めに使用される無効バスが追加される。単にキャッシュ
・ラインのコピーを有するプロセッサの実際の数が要求
されるので、大域ディレクトリ・サイズ要求が小さくな
り、無効バスがＭＩＮ競合を低減し、性能を改良する。

【００１４】好適な態様では、大域ディレクトリが、分
散大域ディレクトリを形成するメモリ・モジュールに関
連付けられる複数の大域ディレクトリ・モジュールとし
て実現される。プロセッサが共用キャッシュ・ラインを
書込もうとするときに要求されるプロトコル・アクショ
ンを最適化するために、無効バスが使用される。自身の
キャッシュ内のデータを変更しようとするプロセッサ
は、そのデータのアドレスを無効バス上に出力し、同時
に記憶要求を大域ディレクトリに送信する。全てのキャ
ッシュが無効バスに接続されるので、データのコピーを
有するこれらのキャッシュは、データが変更されようと
していることを知り、続いてそれらのコピーを無効にす
る。コピーを無効にするキャッシュもまた、無効肯定応
答信号を大域ディレクトリに送信する。同時に、プロセ
ッサは記憶要求を大域ディレクトリに送信する。大域デ
ィレクトリは無効肯定応答を待機し、許可信号をプロセ
ッサに送信する。

【００１５】この無効バスが存在しない場合、従来のデ
ィレクトリ・ベースのキャッシュ・コヒーレンス・プロ
トコルでは、ネットワークを渡る２度の往復が要求され
る。本発明の無効バスは、記憶要求及び無効をオーバラ
ップさせ、ネットワークを通じるトリップ（trip）を低
減することにより、スケーラブル・システムの性能を改
良する。従来技術は、そのアプローチが最大６４のプロ
セッサに対してスケーラブルであることを提示している
が、本発明はそれ以上にスケーラブルである。例えば、
Ｐプロセッサによるマルチプロセッサ・システムであっ
て、それらのプロセッサの半分がキャッシュ・ラインの
読出し専用のコピーを保持するものと仮定しよう。別の
プロセッサがあるキャッシュ・ラインを変更したいと
き、Ｐ／２の全てのプロセッサがそのキャッシュ・ライ
ンを変更しようとする。従来のアーキテクチャでは、第
１のプロセッサのキャッシュがバス上に無効信号を出力
する。次にＰ／２の全てのプロセッサが、そのキャッシ
ュ・ラインのそれぞれのコピーを無効にし、キャッシュ
・ラインが次に要求キャッシュに転送される。次に、Ｐ
／２の全てのプロセッサがキャッシュ・ラインを変更し
ようと試み、無効を送信し、キャッシュ・ラインのコピ
ーを獲得するために、バスを調停する。通常、無効の送
信には１バス・サイクルを、またバス上でのキャッシュ
・ラインの転送にはｌｓ／４バス・サイクル（ｌｓはキ
ャッシュ・ライン・サイズ（バイト））を要する。従っ
て、このトランザクションを完了するために要求される
バス・サイクル数は、次のようになる。

【数１】（Ｐ／２＋１）（１＋ｌｓ／４）

【００１６】マルチプロセッサ・システムのスケーラビ
リティは、バス上に出力される要求により制限される。
前記関係は、従来によるシステムにおいて、バス上に出
力される要求の１次近似として作用する。

【００１７】本発明の第１の態様によれば、バス上に無
効だけが出力される。従って、トランザクションを完了
するために要求される総バス・サイクル数は、次のよう
になる。

【数２】Ｐ／２＋１

【００１８】本発明の第２の態様では、要求される総バ
ス・サイクル数は、以降で示されるように無効及び応答
を含み、無効肯定応答が１バス・サイクルを要すると仮
定されるので、次のようになる。

【数３】Ｐ＋Ｐ／２＋１

【００１９】ライン・サイズが１２８バイトの６４プロ
セッサ・システムでは、従来のアーキテクチャは１０８
９バス・サイクルを要する。それに対して本発明の第１
の態様では、同数のプロセッサに対して３３バス・サイ
クルを要するだけであり、本発明の第２の態様では、９
７バス・サイクルを要するに過ぎない。結果的に、本発
明の第１の態様は３３倍（＝１０８９／３３）スケーラ
ブルであり、本発明の第２の態様は１１倍（＝１０８９
／９６）スケーラブルとなる。従って、従来の６４プロ
セッサ・システムと同一の性能に対して、本発明はその
第１及び第２の態様において、それぞれ少なくとも２１
１２（＝６４×３３）及び７０４（＝６４×１１）のプ
ロセッサにスケーラブルである。

【００２０】

【発明の実施の形態】図１乃至図４を参照すると、マル
チプロセッサ・システムにおける従来のディレクトリ・
ベースの無効プロトコルが示される。ここではマルチス
テージ相互接続ネットワーク（ＭＩＮ）を含むマルチプ
ロセッサ・システムを想定する。プロセッサとディレク
トリ間の全ての通信は、ＭＩＮ（図示せず）を介する。
図１において、プロセッサＰ１がディレクトリに変更要
求を発行する。他の各プロセッサＰ２乃至ＰＰは、変更
要求が発行されるラインに対する読出し専用アクセスを
有するものとし、この情報がディレクトリ内に記憶され
る。図２では、ディレクトリが無効を他の各プロセッサ
Ｐ２乃至ＰＰに発行する。次に図３において、各プロセ
ッサＰ２乃至ＰＰが、前記ラインのそれぞれのコピーを
無効にし、無効肯定応答をディレクトリに送信する。デ
ィレクトリが、変更されるラインのコピーを有する各プ
ロセッサから全ての無効肯定応答を受信した場合にの
み、ディレクトリは図４に示されるように、プロセッサ
Ｐ１に対して変更要求を許可する。

【００２１】図５乃至図７では、従来の無効プロトコル
が最適化されて示される。前回同様、プロセッサＰ１が
ディレクトリに変更要求を送信するが（図５）、ディレ
クトリは各プロセッサＰ２乃至ＰＰに無効を送信する他
に、変更要求の条件付き許可をプロセッサＰ１に送信す
る（図６）。変更要求の許可は、プロセッサＰ１が他の
プロセッサから所定数の無効肯定応答を受信することに
依存する。この所定数は変更要求の条件付き許可と一緒
に、ディレクトリによりプロセッサＰ１に提供される。
図７では、プロセッサＰ１は各プロセッサＰ２乃至ＰＰ
から無効肯定応答を直接受信し、その後プロセッサＰ１
はラインを自由に変更する。

【００２２】図８を参照すると、本発明を実現するＭＩ
Ｎベースのマルチプロセッサ・システムの機能ブロック
図が示される。システムはマルチステージ相互接続ネッ
トワーク（ＭＩＮ）１０を含み、これには複数のメモリ
・モジュール（ＭＭ）１２₁乃至１２_mが接続される。Ｍ
ＩＮは既知であり、例えばChuan-Lin Wu及びTse-YunFen
gによる"On a class of Multistage Interconnection N
etworks"、IEEE Transactions on Computers、Vol.C-2
9、No.8、August 1980、pp.694-702を参照されたい。メ
モリ・モジュール１２₁乃至１２_mは、システムの共用主
メモリを含む。主メモリには大域ディレクトリが関連付
けられ、これはキャッシュ・ラインの大域状態を決定す
るために使用される情報の他に、キャッシュ・ラインの
コピーを有するキャッシュ・メモリの数及び（または）
位置を含む。

【００２３】図８に示されるシステムの大域ディレクト
リは、複数の大域ディレクトリ・モジュール１４₁乃至
１４_mを含み、これらはメモリ・モジュールと一緒に分
散され、分散大域ディレクトリ（ＤＧＤ）１４を形成す
る。ＤＧＤ１４はキャッシュ・ラインの大域状態を決定
するために使用される情報の他に、キャッシュ・ライン
のコピーを有するキャッシュ・メモリの数及び（また
は）位置を含む。ＭＩＮ１０には更に複数のキャッシュ
（Ｃ）１６₁乃至１６_pが接続され、これらはプロセッサ
（Ｐ）１８₁乃至１８_pに対応するローカル・キャッシュ
である。これらの各キャッシュは無効バス２０に直接接
続される。無効バスは後述されるように、あるプロセッ
サにより発行される無効要求の処理を最適化し、ネット
ワークを通じて無効を送信する必要を排除する。

【００２４】分散大域ディレクトリ１４は、どのキャッ
シュがキャッシュ・ラインのコピーを有するかを知らな
くてもよい。キャッシュ識別のための幾つかの設計オプ
ションが存在する。１つの設計技法によれば、ディレク
トリがキャッシュ・ラインのコピーを有する全てのキャ
ッシュを決定するための情報を有する。別の設計技法で
は、１ディレクトリ・エントリにつき少数のキャッシュ
識別子を有する。キャッシュ・ラインを共用するキャッ
シュの数が、キャッシュ識別子の数以下の場合、ディレ
クトリはそのキャッシュ・ラインを有するキャッシュを
認識する。それ以外では、ディレクトリはそのキャッシ
ュ・ラインを有するキャッシュの数だけを認識する。

【００２５】図９乃至図１１は、本発明の第１の態様に
よる無効プロトコルを示す。図９では、プロセッサＰ１
が変更要求をディレクトリに発行し、同時に無効要求を
無効バス上に出力する。変更されるキャッシュ・ライン
（無効バス上のアドレスにより識別される）のコピーを
有するプロセッサは、対応するキャッシュ・ラインを無
効にし、図１０に示されるように無効肯定応答をディレ
クトリに送信する。ディレクトリが全ての無効肯定応答
を受信すると、ディレクトリは図１１に示されるように
許可をプロセッサＰ１に与える。

【００２６】図１２及び図１３は、本発明の第２の態様
による無効プロトコルを示す。図１２では、プロセッサ
Ｐ１が変更要求をディレクトリに発行し、同時に無効要
求を無効バス上に出力する。図１３では、ディレクトリ
が、変更されるキャッシュ・ラインのコピーを有するプ
ロセッサの数に相当する無効肯定応答を受信した後、条
件付き変更許可にてプロセッサＰ１に応答する。この
時、無効肯定応答は無効バスを介して、他のプロセッサ
からプロセッサＰ１に直接提供される。

【００２７】図１４乃至図１７は、幾つかのプロトコル
の性能を比較するタイミング図である。図１乃至図４に
示される従来のシステムのオペレーションが、図１４に
示される。ここでネットワーク遅延は４時間単位を含
み、バス・サイクルは１時間単位を含むものとする。変
更要求はネットワークを介してディレクトリに送信され
なければならないので、変更要求は図１４において、４
時間単位を消費する。同様に、無効はディレクトリから
ネットワークを介して、変更されるキャッシュ・ライン
のコピーを保持する他のプロセッサに伝達されなければ
ならないので、４時間単位を消費する。無効肯定応答も
ネットワークを介して、ディレクトリに伝達されなけれ
ばならないので、別の４時間単位を消費する。最後に、
ディレクトリは変更要求の許可をネットワークを介して
要求プロセッサに送信するので、更に別の４時間単位を
消費する。結局、このプロセスは合計１６時間単位を消
費することになる。

【００２８】図５乃至図７に示される最適化された従来
のプロトコルが、図１５に示される。ここでは最初の２
サイクルは従来のプロトコルと同一である。しかしなが
ら、この場合には、変更要求の許可が、要求プロセッサ
が全ての無効肯定応答を他のプロセッサから直接受信す
ることを条件とするので、許可サイクルと無効サイクル
または無効肯定応答サイクルとのオーバラップが存在
し、結果的に４時間単位を節約する。

【００２９】従来のプロトコル及び最適化された従来の
プロトコルに比較して、本発明の両方の態様は、相当な
時間を節約し、大規模マルチプロセッサ・システムの性
能を多大に改良する。図９乃至図１１に示される本発明
の第１の態様のプロトコルが、図１６に示される。変更
要求が無効バス上に同時に出力され、ネットワークを介
してディレクトリに送信されるので、他のプロセッサが
無効肯定応答をディレクトリに送信開始するまでに、１
サイクル・バス遅延だけが生じる。従って、ディレクト
リは、変更要求を受信してから１バス・サイクル遅延内
に、許可をネットワークを介して要求プロセッサに送信
する。このサイクルはたった９時間単位で完了する。

【００３０】本発明の第２の態様によるプロトコルは、
より大きな時間の節約を達成し、従って性能的な利点を
有する。図１２及び図１３に示されるこのプロトコル
が、図１７に示される。この場合、無効バスが変更要求
とそれに応答する無効肯定応答の両方を伝搬する。従っ
て、ディレクトリは変更要求の受信に際して、即時条件
付き許可を発行し、結果的にサイクルが完了するのに８
時間単位が消費されるだけである。

【００３１】従来のＮエントリ分散大域ディレクトリに
おけるＮエントリ分散大域ディレクトリ、並びに本発明
の第１及び第２の態様におけるＮエントリ大域ディレク
トリのメモリ・マップが、それぞれ図１８及び図１９に
示される。図１８に示される従来のディレクトリでは、
エントリがディレクトリ・タグ（dtag）、大域状態（gs
tate）、Ｎプロセッサの各プロセッサ識別（ＰＩＤ）、
書戻しまたは無効肯定応答の待機を示す事象フラグ（Ｗ
ＴＥＶＮＴ）、及び書戻し／無効肯定応答の発生を引き
起こした要求事象の事象フラグ（ＲＱＥＶＮＴ）から構
成される。よりコンパクトなエントリを提供するため
に、ＰＩＤがＰベクトルにより置換されてもよく、そこ
では各ビットがプロセッサを表す。それに対して、本発
明のＮエントリ分散大域ディレクトリはより単純であ
り、ＰＩＤまたはＰベクトルの必要を排除する。図１９
に示されるように、本発明における大域ディレクトリ内
のエントリは、dtag、gstate、及びＷＴＥＶＮＴ及びＲ
ＱＥＶＮＴフラグだけを要求する。

【００３２】まとめとして、本発明の構成に関して以下
の事項を開示する。

【００３３】（１）共用メモリ・マルチプロセッサ・シ
ステムであって、各々が関連キャッシュ・メモリを有す
る複数のプロセッサと、前記各プロセッサのキャッシュ
・メモリに接続されるマルチステージ相互接続ネットワ
ークと、前記マルチステージ相互接続ネットワークに接
続される複数のインタリーブド・メモリ・モジュール
と、キャッシュ・ラインの大域状態を決定するために使
用される情報を含み、分散大域ディレクトリを構成する
複数の大域ディレクトリ・モジュールにより構成される
大域ディレクトリであって、前記各メモリ・モジュール
が関連する前記大域ディレクトリ・モジュールを有す
る、前記大域ディレクトリと、前記各キャッシュ・メモ
リに直接接続される無効バスと、を含み、前記プロセッ
サが、変更しようとするデータのアドレスを前記無効バ
ス上に出力すると同時に、データ変更のための記憶要求
を前記大域ディレクトリに送信し、前記無効バス上のア
ドレスにより識別される前記キャッシュ・ラインのコピ
ーを有する全ての前記キャッシュ・メモリが、それらの
前記コピーを無効にし、前記大域ディレクトリがデータ
の変更を許可する許可信号を前記プロセッサに送信す
る、共用メモリ・マルチプロセッサ・システム。（２）大域ディレクトリが前記ラインのコピーを有する
前記キャッシュ・メモリの数に関する情報を含む、前記
（１）記載の共用メモリ・マルチプロセッサ・システ
ム。（３）前記キャッシュ・メモリが、前記無効バス上のア
ドレスにより識別される前記キャッシュ・ラインのコピ
ーを無効にする際、無効肯定応答信号を大域ディレクト
リに送信し、前記大域ディレクトリが、前記無効肯定応
答信号の受信に際して、データを変更しようとする前記
プロセッサに前記許可信号を送信する、前記（１）記載
の共用メモリ・マルチプロセッサ・システム。（４）前記キャッシュ・メモリが、前記無効バス上のア
ドレスにより識別される前記キャッシュ・ラインのコピ
ーを無効にする際、無効肯定応答信号をデータを変更し
ようとする前記プロセッサに直接送信し、前記大域ディ
レクトリが前記許可信号に加えて、前記プロセッサが受
信すべき無効肯定応答の数を送信する、前記（１）記載
の共用メモリ・マルチプロセッサ・システム。（５）複数のインタリーブド・メモリ・モジュールが複
数のプロセッサにマルチステージ相互接続ネットワーク
を介して接続される、共用メモリ・マルチプロセッサ・
システムにおけるキャッシュ・コヒーレンスを維持する
無効プロトコルであって、キャッシュ・ラインの大域
状態を決定するために使用される情報を含む大域ディレ
クトリを提供するステップであって、前記大域ディレク
トリが分散大域ディレクトリを構成する複数の大域ディ
レクトリ・モジュールにより構成され、前記各メモリ・
モジュールが関連する前記大域ディレクトリ・モジュー
ルを有する、前記ステップと、前記各キャッシュ・メモ
リに直接接続される無効バスを提供するステップと、デ
ータを変更しようとする前記プロセッサが、該データの
アドレスを前記無効バス上に出力すると同時に、データ
変更のための記憶要求を前記大域ディレクトリに送信す
るステップと、前記無効バス上のアドレスにより識別さ
れる前記キャッシュ・ラインのコピーを有する全ての前
記キャッシュ・メモリが、それらの前記コピーを無効に
するステップと、前記大域ディレクトリがデータの変更
を許可する許可信号を前記プロセッサに送信するステッ
プと、を含む、無効プロトコル。（６）前記キャッシュ・メモリが、前記無効バス上のア
ドレスにより識別される前記キャッシュ・ラインのコピ
ーを無効にする際、無効肯定応答信号を大域ディレクト
リに直接送信するステップと、前記大域ディレクトリが
前記無効肯定信号を受信の際に、データを変更しようと
する前記プロセッサに前記許可信号を送信するステップ
と、を含む、前記（５）記載の無効プロトコル。（７）前記キャッシュ・メモリが、前記無効バス上のア
ドレスにより識別される前記キャッシュ・ラインのコピ
ーを無効にする際、データを変更しようとする前記プロ
セッサに無効肯定応答信号を直接送信するステップと、
前記大域ディレクトリが前記許可信号に加えて、前記プ
ロセッサが受信すべき無効肯定応答の数を送信するステ
ップと、を含む、前記（５）記載の無効プロトコル。

【図面の簡単な説明】

【図１】ディレクトリ・ベースのキャッシュ・コヒーレ
ンス・マルチプロセッサ・システムにおける従来の無効
プロトコルを示す機能ブロック図である。

【図２】ディレクトリ・ベースのキャッシュ・コヒーレ
ンス・マルチプロセッサ・システムにおける従来の無効
プロトコルを示す機能ブロック図である。

【図３】ディレクトリ・ベースのキャッシュ・コヒーレ
ンス・マルチプロセッサ・システムにおける従来の無効
プロトコルを示す機能ブロック図である。

【図４】ディレクトリ・ベースのキャッシュ・コヒーレ
ンス・マルチプロセッサ・システムにおける従来の無効
プロトコルを示す機能ブロック図である。

【図５】最適化された従来の無効プロトコルを示す機能
ブロック図である。

【図６】最適化された従来の無効プロトコルを示す機能
ブロック図である。

【図７】最適化された従来の無効プロトコルを示す機能
ブロック図である。

【図８】本発明の好適な態様によるディレクトリ及び無
効バスを有するシステムの機能図である。

【図９】無効バスが無効のためだけに使用される本発明
の第１の態様による無効プロトコルを示す機能ブロック
図である。

【図１０】無効バスが無効のためだけに使用される本発
明の第１の態様による無効プロトコルを示す機能ブロッ
ク図である。

【図１１】無効バスが無効のためだけに使用される本発
明の第１の態様による無効プロトコルを示す機能ブロッ
ク図である。

【図１２】無効バスが無効及び肯定応答のために使用さ
れる本発明の第２の態様による無効プロトコルを示す機
能ブロック図である。

【図１３】無効バスが無効及び肯定応答のために使用さ
れる本発明の第２の態様による無効プロトコルを示す機
能ブロック図である。

【図１４】従来の無効プロトコルにおいて、要求を処理
するために要する時間を示すタイミング図である。

【図１５】最適化された従来の無効プロトコルにおい
て、要求を処理するために要する時間を示すタイミング
図である。

【図１６】本発明の第１の態様において、要求を処理す
るために要する時間を示すタイミング図である。

【図１７】本発明の第２の態様において、要求を処理す
るために要する時間を示すタイミング図である。

【図１８】従来の無効アプローチにおけるＮ−エントリ
分散大域ディレクトリのメモリ・マップを示す図であ
る。

【図１９】本発明の第１及び第２の態様におけるＮ−エ
ントリ分散大域ディレクトリのメモリ・マップを示す図
である。

【符号の説明】

１２メモリ・モジュール１４大域ディレクトリ・モジュール１６キャッシュ１８プロセッサ

───────────────────────────────────────────────────── フロントページの続き (72)発明者ヤルサン・スアメリカ合衆国10570、ニューヨーク州プレザントビル、ディアフィールド・レーン・サウス 45 (56)参考文献特開平５−128071（ＪＰ，Ａ) 特開平５−35697（ＪＰ，Ａ) 特開平４−151751（ＪＰ，Ａ) 特開平３−163640（ＪＰ，Ａ) 特開平２−129741（ＪＰ，Ａ) 特開平２−45848（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06F 15/16 - 15/177 G06F 12/08 - 12/12

Claims

(57)【特許請求の範囲】

【請求項１】各々が関連キャッシュ・メモリを有する複
数のプロセッサと、前記プロセッサの各々のキャッシュ・メモリに接続され
たマルチステージ相互接続ネットワークと、前記マルチステージ相互接続ネットワークに接続された
複数のインタリーブド・メモリ・モジュールと、キャッシュ・ラインの大域状態を決定するために使用さ
れる情報及び前記キャッシュ・ラインのコピーを有する
キャッシュ・メモリの数に関する情報を含み、分散大域
ディレクトリを構成し且つ前記メモリ・モジュールの各
々に関連した複数の大域ディレクトリ・モジュールを有
する大域ディレクトリと、前記キャッシュ・メモリの各々に直接接続された無効バ
スと、を含む共用メモリ・マルチプロセッサ・システムにおい
て、データを変更しようとするプロセッサが、変更されるべ
きデータのアドレスを前記無効バス上に出力すると同時
に、データ変更を求める要求を前記大域ディレクトリに
送信するステップと、前記無効バス上のアドレスによって識別されたキャッシ
ュ・ラインのコピーを有するすべてのキャッシュ・メモ
リが前記コピーを無効にするステップと、前記キャッシュ・メモリが、前記無効バス上のアドレス
によって識別されたキャッシュ・ラインのコピーを無効
にしたことに応答して前記データを変更しようとするプ
ロセッサに無効肯定応答信号を直接に送信するステップ
と、前記データを変更しようとするプロセッサがデータの変
更を行う前に受信すべき無効肯定応答の数を含む条件付
き許可信号を、前記大域ディレクトリが該プロセッサに
送信するステップと、を含む方法。