JPH05128071A

JPH05128071A - 多重プロセツサ・システムの性能の最適化装置及び方法

Info

Publication number: JPH05128071A
Application number: JP4106604A
Authority: JP
Inventors: Sandra J Baylor; サンドラ・ジヨンソン・バイラー; Kevin P Mcauliffe; ケビン・パトリツク・マツクアウリフエ; Bharat D Rathi; バハラート・デイープ・ラシ
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1991-05-23
Filing date: 1992-04-24
Publication date: 1993-05-25
Anticipated expiration: 2011-07-24
Also published as: CA2062910C; CA2062910A1; US5313609A; JP2516300B2

Abstract

(57)【要約】【目的】多重プロセツサ・システムにおいて、データ
の整合性を維持するデイレクトリ・ベースのプロトコル
を与える。【構成】供給側キヤツシユ・メモリによつて排他的に
修正されたキヤツシユ・ラインを、要求側キヤシユ・メ
モリが要求した時、メモリへの書き戻しの間で、修正さ
れたキヤツシユ・ラインの修正されたデータ・ワードを
集合的にインターセプトするために、大域デイレクトリ
の中に２つのバツフアが設けられる。一方の修正ワード
用バツフアは修正されたキヤツシユ・ラインの修正ワー
ドを獲得するのに使われる。他方のライン用バツフアは
書き戻し動作の間でメモリから転送された古いキヤツシ
ユ・ラインをストアする。最後に、両バツフアは要求側
キヤツシユに修正された全てのデータ・ラインを同時に
与える。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、複数のキヤツシユ・メ
モリ及び共有メモリを有する多重プロセツサ（ＭＰ）シ
ステム、より詳細に言えば、ＭＰシステム中の複数のプ
ロセツサの間で共有されているデータの整合性を維持す
る装置及び方法に関する。

【０００２】

【従来の技術及び発明が解決しようとする課題】多重プ
ロセツサ・システム（ＭＰ）による並列処理の出現は、
通常の単一プロセツサ・システムの性能を越えた大幅な
性能の改善をする可能性がある。ＭＰシステムにおける
多重のプロセツサは、過去何十年の間用いられている技
術の多段相互接続ネツトワーク（multistage interconn
ection network-ＭＩＮ）を通して、同時に並列にメモ
リと通信することができる。

【０００３】これをより詳細に説明すると、通常のＭＩ
Ｎ構成において、プロセツサはＭＩＮの特別のポートに
接続されている。通常のＭＩＮは制御可能なスイツチの
段を持つている。ＭＩＮは、制御可能なスイツチによつ
て、１つ以上のメモリ・ラインを、任意の時間で任意の
プロセツサに接続することができる。事実、ＭＩＮによ
つて、幾つかのプロセツサはメモリと同時通信ができる
ので、真の意味の並列処理が容易に達成される。

【０００４】然しながら、多くのプロセツサがＭＰシス
テムに付加されるようになり、しかも、プロセツサの速
度は常に高速化の一途を辿つたので、メイン・メモリの
帯域幅は、それらの多くの高性能プロセツサにより求め
られる要求のペースに合わせることができなくなつてき
た。より具体的に言えば、プロセツサとメイン・メモリ
との間の距離は次第に離れざるを得なくなり、しかも、
プロセツサがメイン・メモリにアクセスする回数は益々
増加するので、プロセツサのメモリ・アクセス時間は全
体として増加してくる。従つて、ＭＰシステムにおける
高性能のデータ処理に対して、メイン・メモリの帯域幅
が主要な隘路となつてきた。

【０００５】この隘路を取り除くために、プロセツサの
メモリ・アクセスの時間を減少するためのキヤツシユ・
メモリをプロセツサと関連付けることができる。キヤツ
シユ・メモリはこの分野で広く知られている。キヤツシ
ユ・メモリは、コンピユータのプログラミングに対して
実質的に透明であり、ハードウエアで管理される高速度
バツフアである。キヤツシユ・メモリはメイン・メモリ
とキヤツシユ・メモリとの間のデータ転送の基本ユニツ
トであるキヤツシユ・メモリのデータ・ラインを持つデ
ータ・アレイと、データ・アレイ中のデータの位置に関
するデータ・アドレスをマツプするデイレクトリとを含
んでいる。事実、キヤツシユ・メモリのデータ・ライン
はインストラクシヨンか、または実際のデータの何れか
であり得る。更に、キヤツシユ・メモリはメイン・メモ
リの速度よりも１０倍以上の高い速度を持つており、通
常は、キヤツシユ・メモリに関連するプロセツサが有す
る高い速度と同じ速度である。

【０００６】プロセツサに関連するキヤツシユ・メモリ
の長所と、関連するプロセツサにおいて実行されるプロ
グラム構造の長所とを取り入れることによつて、システ
ムの性能は向上される。プログラム中のインストラクシ
ヨン・セツトの中の多くのインストラクシヨンは繰り返
しが多い。キヤツシユ・メモリはキヤツシユ・ラインに
よつて充填することができる。キヤツシユ・ラインは、
キヤツシユ・ラインの再充填が必要とされる前の或る時
間の間、データ・ワード及びインストラクシヨンを必要
とするプロセツサの要求に答えることができる。換言す
れば、プロセツサは、キヤツシユ・ラインよりも遥かに
短いデータ・ワード（即ち、ワード、ｄワード、または
バイト）を要求すると言うことである。また、プロセツ
サにより、データ・ワードがキヤツシユ・メモリに求め
られて、データ・ワードがキヤツシユ・メモリのデータ
・ライン中に見出された場合、キヤツシユ「ヒツト」が
生じたと言われる。プロセツサにより、データ・ワード
がキヤツシユ・メモリに求められて、データ・ワードが
キヤツシユ・メモリのデータ・ライン中に見出されない
場合、キヤツシユ「ミス」が生じたと言われ、その結
果、キヤツシユ・メモリの再充填が求められる。キヤツ
シユ・メモリは、本質的には、プロセツサとメイン・メ
モリとの間にある容量の大きいバツフアとして用いられ
る記憶装置である。

【０００７】メモリ・スペースを共有するか、または大
域メモリを持つ多くのプロセツサを有するＭＰシステム
において、ＭＰシステムは、共有されたメモリ・スペー
ス中のすべてのデータの間の「整合性」、即ちデータの
一貫性を維持していなければならない。データは、メイ
ン・メモリや、キヤツシユ・メモリのような他の遠隔位
置に置かれたメモリを含んで幾つかの異なつたメモリ位
置の中に存在することがあり得る。

【０００８】データの「整合性」は、各プロセツサが、
共有メモリの特定のアドレスに対応する最新のデータに
アクセスしなければならない概念を対象としている。つ
まり、或るアドレスにあるデータ・ワードが１つ、また
はそれ以上のキヤツシユ・メモリ及び／又はメイン・メ
モリによつて、同時に共有されている場合に、上述のメ
モリ位置の１つの位置において、データ・ワードが更
新、または変更された時、データの一貫性を維持するた
めに、そのデータ・ワードの最新のバージヨンは、すべ
てのプロセツサにより識別され、かつ利用可能にされな
ければならない。本明細書において、用語「データ」と
は、インストラクシヨン、または実際に処理されるデー
タとか、未処理のデータなどを含んで、メモリ中にスト
アされたあらゆる情報を意味する。

【０００９】データの整合性を維持するために、ソフト
ウエアのアプローチ及びハードウエアのアプローチの両
方が通常の方法で用いられている。更に、ハードウエア
のアプローチは、通常、２つのタイプ、即ちバス・ベー
ス（「スヌーピー」）のプロトコルと、デイレクトリ・
ベースのプロトコルとの２つに分けられる。バス・ベー
スのプロトコルは、プロセツサの数が比較的少ないＭＰ
システムに用いられているのに反して、デイレクトリ・
ベースのプロトコルは、改良されたスケーラビリテイ
（scalability）を有するＭＰシステムに使用される。
この理由は、最近の傾向がＭＩＮの共通使用を指向した
多数の並列処理用プロセツサを使用する方向にあるから
である。

【００１０】デイレクトリ・ベースのプロトコルに関し
て、データ間の整合性、即ち、データの一貫性を保証す
るために、ＭＰシステムが動作している間において、
「交互質問（cross interrogation）」がキヤツシユ・
メモリの間で遂行される。「交互質問」は異なつたプロ
トコルのうちの任意の１つを用いて実行される。通常、
交互質問は、キヤツシユ・ラインの転送及び／又はキヤ
ツシユのデイレクトリ中の制御ビツトの処理を含んでい
る。

【００１１】交互質問のために実行されるプロトコル
は、ＭＰシステムの中で使用されるキヤツシユ・メモリ
のタイプに大きく依存している。通常、キヤツシユ・メ
モリは、「書き込み（write-thru−ＷＴ）」タイプか、
または、「書き戻し（write-back−ＷＢ）」タイプの何
れかに分類されている。更に、従来の技術に従つた或る
種のキヤツシユ・メモリは、適正に制御されるならば、
何れのタイプによつてもデータを取り扱う能力を持つて
いる。

【００１２】ＷＴキヤツシユ・メモリにおいて、データ
・ワードは、キヤツシユ・ラインのデータ・ワードをプ
ロセツサによつて更新し、或は変更する度毎に、メイン
・メモリに「書き込み」が行なわれる。従つて、最も新
しいデータは、常に、メイン・メモリ中に存在する。

【００１３】ＷＢキヤツシユ・メモリにおいては、ＷＢ
キヤツシユ・メモリ中のデータ・ワードが遠隔地の装置
によつて要求された時とか、またはデータ・ワードがキ
ヤツシユ・メモリ中で置換された時にのみ、そのデータ
・ワードは、ＷＢキヤツシユ・メモリからメイン・メモ
リに書き込まれる。その結果、地域的なプロセツサがそ
れ自身に関連した地域的なＷＢキヤツシユ・メモリ中の
データ・ワードを変更した場合、ＭＰシステム中の他の
メモリ・ロケーシヨンがその変更を知ることなく、ある
いはその変更により割り込まれることなく、地域的なプ
ロセツサは、そのＷＢキヤツシユ・メモリ中のデータ・
ワードを何度でも変更することができる。

【００１４】ＷＢキヤツシユ・メモリがＭＩＮを有する
ＭＰシステム中で使用された時、当業者間で広く知られ
ている大域デイレクトリを使用することができる。大域
デイレクトリは、データの整合性を維持する目的のため
に、メイン・メモリと関連される。大域デイレクトリ
は、キヤツシユ・メモリのデータ・ラインの大域デイレ
クトリの状態を表わす情報と、キヤツシユ・メモリのデ
ータ・ラインのコピーを持つキヤツシユ・メモリの数及
び／又は位置とを決定するために用いられる情報とを含
んでいる。これに関連して、１９８２年１１月のコンピ
ユータに関するＩＥＥＥ会報Ｃ−３１巻、１１号の「Ef
fects of Cache Coherency in Multiprocessors」と題
するドゥボア（M.Dbois）等の文献と、コンピユータ・
アーキテクチヤに関する１９８８年国際シンポジユーム
の会報の２８０頁乃至２８９頁の「AnEvaluation of Di
rectory Schemes forCache Coherence」と題するアガル
ワル（A.Agarwal）等の文献を参照されたい。

【００１５】デイレクトリ・ベースのプロトコルに関し
て若干の研究がされているけれども、実用的な設計は殆
どない。更に、入手可能な通常のプロトコルも問題を含
んでいる。交互質問が開始される度毎に、キヤツシユ・
メモリを使用したすべてのプロセツサは、問い合わせが
キヤツシユ・メモリ中のデータ・ワードに行なわれてい
る間で、臨時に待機しなければならない。その結果、キ
ヤツシユ・メモリの質問のために、プロセツサの性能は
これと妥協した性能に低下する。

【００１６】更に、より多くのプロセツサがＭＰシステ
ム中に付加されると、交互質問の実行回数は更に増加す
る。その結果、キヤツシユ・メモリとの対話はより多く
発生し、処理時間が長くなり、そして、ＭＰシステムの
相互接続ネツトワークの通信は混雑することになる。従
つて、要求される多数の交互質問はＭＰシステム中の有
用な仕事を行なうプロセツサの数を減少することにな
る。

【００１７】

【課題を解決するための手段】本発明は、キヤツシユ・
メモリ、共有されたメモリ及びＭＩＮを有するＭＰシス
テムの大域デイレクトリにおいて、修正ワード用バツフ
ア及びライン用バツフアを設けている。大域デイレクト
リは、キヤツシユ・ラインの状態及び制御に関する情報
をストアし、かつ、修正ワード用バツフア及びライン用
バツフアを制御するように構成される。

【００１８】本発明に従つて、要求側のキヤツシユ・メ
モリは、最初に、キヤツシユ・ラインの大域デイレクト
リに要求を送る。大域デイレクトリは、データ・ライン
が修正されており、供給側のキヤツシユ・メモリ中に存
在することを決定する。

【００１９】次に、キヤツシユ・ライン中の修正された
ワードだけを書き戻すための要求が大域デイレクトリか
ら供給側のキヤツシユ・メモリに送られ、これと同時
に、メモリから古いキヤツシユ・ラインを転送するため
の要求が、大域デイレクトリからメモリに送られる。

【００２０】更に、修正されたワードの書き戻しの間
で、修正されたワードは大域デイレクトリの修正ワード
用バツフアによつて獲得され、そして、これと同時に、
メモリからの古いキヤツシユ・ラインが大域デイレクト
リのライン用バツフア中にストアされる。古いキヤツシ
ユ・ラインは、修正されたキヤツシユ・ラインが持つア
ドレスの識別子（identity）と対応するけれども、古い
キヤツシユ・ラインはキヤツシユ・ラインの最新のバー
ジヨンではないから、古いキヤツシユ・ラインの部分は
使用しない。

【００２１】最後に、修正されたキヤツシユ・ライン全
体は、大域デイレクトリから要求側のキヤツシユ・メモ
リに転送され、修正されたワードは修正ワード用バツフ
アによつて供給され、そして、キヤツシユ・ラインの残
りはライン用バツフアによつて供給される。

【００２２】本発明は上述のように従来の技術の欠点を
克服し、更に、以下のような利点を持つている。

【００２３】本発明は、ＭＰシステムにおいて、デイレ
クトリ・ベースの整合性プロトコルのために、非常に好
ましく、かつ高性能の書き戻し方式を与える。

【００２４】これを具体的に言えば、本発明は、２つの
動作、即ち（１）大域デイレクトリとメモリとの間のデ
ータ・ライン転送動作と、（２）プロセツサからメモリ
への書き戻し動作の２つの動作を同時に行なわせること
によつて、ＭＰシステムの性能を改善する。

【００２５】上述の同時に起きる動作の結果として、プ
ロセツサからの読み取り要求を処理するために必要とさ
れる時間は非常に減少される（約４４％の減少）。その
理由は、データ・ライン要求を処理するために、メモリ
の待ち時間の大部分が取り除かれるためである。従来の
プロトコルにおいては、修正されたすべてのワードがメ
モリに書き戻された後にだけ、データ・ラインが要求側
のキヤツシユ・メモリに転送されるので、遅延が生じ
る。

【００２６】総括的に言えば、本発明はデータの整合性
を維持するために必要とする時間を減少し、従つて、Ｍ
Ｐシステムに対するより多くのプロセツサを付加する場
合に生じる性能低下が小さい。換言すれば、本発明によ
つて、ＭＰシステムに付加することのできるプロセツサ
の数を効果的に高めることができる。

【００２７】

【実施例】図１は本発明を適用することのできる多重プ
ロセツサ（ＭＰ）のアーキテクチヤ１００のブロツク図
が示されている。多重プロセツサのアーキテクチヤ１０
０は、関連するｐ個のキヤツシユ・メモリ１１２乃至１
１６を有するＰ個のプロセツサ１０２乃至１０６を含ん
でいる。ｐ個のキヤツシユ・メモリ１１２乃至１１６
は、キヤツシユ・メモリの複数の概念的なレベルを含ん
でいるが、この概念的なレベルは公知である。

【００２８】キヤツシユ・メモリ１１２乃至１１６は多
段相互接続ネツトワーク（ＭＩＮ）１１８を通してメモ
リ１２０に接続されている。ＭＩＮ１１８は、プロセツ
サ１０２乃至１０６からメモリ１２０へのアクセスと、
メモリからプロセツサへのアクセスを制御する。メモリ
１２０は、関連するｍ個の大域デイレクトリ１３３乃至
１３７を有するｍ個メモリ・モジユール（ＭＭ）１２３
乃至１２７を持つている。既に述べたように、大域デイ
レクトリは、データの整合性を維持するのに使用する技
術分野で公知である。

【００２９】ＭＩＮ１１８は任意の数の入力及び出力を
持つことができ、そして、入力及び出力の数は同じであ
る必要はないことには注意を払う必要がある。

【００３０】図２は８プロセツサ・システムのためのＭ
ＩＮ２００の低レベルのブロツク図を示している。図示
されたように、ＭＩＮ２００は、参照数字２０２乃至２
０６によつて示された３つの段、即ち段１乃至段３の各
々のための４個の同じ２*２スイツチを持つている。段
１は２*２スイツチ２１２乃至２１８で構成されてい
る。段２は２*２スイツチ２２２乃至２２８で構成され
ている。段３は２*２スイツチ２３２乃至２３８で構成
されている。ＭＰシステム中のプロセツサの数が増加す
れば、段の数及び段毎の２*２スイツチの数も同様に増
加する。

【００３１】図２の２*２スイツチの代表的な例が図３
に示してある。図３に示されているように、２*２スイ
ツチ３０２は入力Ｉ、Ｊ及び出力Ｐ、Ｑを持つている。
入力Ｉは出力Ｐ、または出力Ｑのいずれにも接続するこ
とができる。同様に、入力Ｊは出力Ｐ、または出力Ｑの
いずれにも接続することができる。接続は制御信号によ
つて行なわれる。本発明は２*２スイツチ構造を有する
スイツチ２０２乃至２３８のみに制限されるものでない
ことには注意を喚起する必要がある。換言すれば、ｍ及
びｎを任意の整数として、スイツチ２０２乃至２３８は
ｍ*ｎ構造を取ることができる。

【００３２】図２に示した３段のＭＩＮ２００を持つ８
プロセツサ・システムにおいてデータの整合性を維持す
るための通常のプロトコルは、図４乃至図８を参照して
以下に説明される。図４乃至図８は、プロセツサＰ₂に
よつて排他的に所有されている修正されたデータ・ライ
ンＬをプロセツサＰ₆と関連するキヤツシユ・メモリの
中にコピーするために必要な通常のステツプを説明する
ものである。

【００３３】最初に、データ・ラインＬはメモリ・モジ
ユールＭ₄のメモリにストアされているものと仮定す
る。また、２つのプロセツサＰ₂及びＰ₆はこれらのプロ
セツサと関連するキヤツシユ・メモリ中にデータ・ライ
ンＬのコピーを現在共有しているものと仮定する。更
に、プロセツサＰ₂がデータ・ラインＬ中のデータを修
正したものと仮定する。従つて、プロセツサＰ₂はライ
ンＬの排他的に修正された（ＥＸＭ）コピーを持つてお
り、ラインＬはプロセツサＰ₆のキヤツシユ・メモリ中
の常駐の情報ではない。ここで、ラインＬ中に位置付け
られた或るデータを、Ｐ₆が読み取りたいと望んだとす
る。従つて、プロセツサＰ₂によつて排他的に所有され
ている修正されたデータ・ラインＬはプロセツサＰ₆と
関連するキヤツシユ・メモリに書き込まれなければなら
ない。

【００３４】従来の技術において、プロセツサＰ₆はデ
ータ・ラインＬの読み取りを先ず要求する。図４を参照
すると、「読み取り要求」はＭＩＮ２００を通してプロ
セツサＰ₆から転送され、最終的には、参照数字４２０
で示されたメモリ・モジユール４と関連された参照数字
４１０で示された大域デイレクトリ４に到着する。ＭＩ
Ｎ２００において、読み取り要求は、大域デイレクトリ
ＧＤ₄に到達するために、図示されたように、スイツチ
２１６、２２２及び２３４を次々に通つて移動する。

【００３５】第２のステツプは、図５を参照して説明す
る。大域デイレクトリ４はプロセツサＰ₂に「書き戻し
要求」を送る。この書き戻し要求は、プロセツサＰ₂に
届けられるように、スイツチ２３４、２２２及び２１２
を次々に通つて移動する。

【００３６】第３のステツプは図６を参照して説明す
る。プロセツサＰ₂はラインＬの修正されたデータをス
イツチ２１２、２２２及び２３４を通してメモリ・モジ
ユールＭ₄に転送する。

【００３７】第４のステツプは図７を参照して説明す
る。大域デイレクトリＧＤ₄は、メモリ・モジユールＭ₄
からプロセツサＰ₆へ、データ・ラインＬを転送するこ
とを要求する。

【００３８】Ｍ₄からＰ₆なデータ・ラインＬを転送する
経路を示す図８に示された最後のステツプにおいて、デ
ータ・ラインＬは、スイツチ２３４、２２２及び２１６
を次々に通つてメモリ・モジユールＭ₄からプロセツサ
Ｐ₆に転送される。

【００３９】性能の観点から見ると、上述のプロトコル
を実施するために費された時間は、可成り長い時間を必
要とする。２*２スイツチ２１２乃至２３８のスイツチ
時間は、通常、約１クロツク・サイクルを必要とする。
例えば、大域デイレクトリ４１０のアクセス時間は約１
クロツク・サイクルである。更にメモリ・モジユール４
２０のアクセス時間は、約６クロツク・サイクルを必要
とする。

【００４０】上述のスイツチ時間及びアクセス時間が通
常の整合性プロトコルに適用可能であるとして、図４乃
至図８で説明された整合性プロトコルを遂行するのに必
要な時間は、下記の表１に示された分析に基くと、約２
５クロツク・サイクルである。

【００４１】表１整合性プロト２*２スイツ大域デイレクメモリ・モジ合計時間コルのステツチのスイツチトリＧＤ₄のユールＭ₄のプの順番時間（クロツアクセス時間アクセス時間ク・サイクル（クロツク・（クロツク・）サイクル）サイクル） −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− １３１０４２３００３３３３６９４００６６５３００３２５

【００４２】図９は、本発明に従つた大域デイレクトリ
５００の高レベルのブロツク図である。この大域デイレ
クトリ５００のために、所望の性能の向上を達成するの
に最適な書き戻しプロトコルを実行することができる。

【００４３】図示されているように、本発明の新規な大
域デイレクトリ５００は状態及び制御ブロツク５０２
と、コントローラ５０６と関連したライン用バツフア５
０４と、コントローラ５１０と関連した修正ワード用バ
ツフア５０８とを持つている。本発明の顕著な特徴は、
これらのバツフアは、修正されたデータがメモリ中にス
トアされる前に、メモリに差し向けられる、即ちメモリ
に書き戻されるキヤツシユ・ラインの修正されたワード
を捕獲し、ストアするライン用バツフア５０４及び修正
ワード用バツフア５０８を含ませたことにある。

【００４４】図９の新規な大域デイレクトリ５００の低
レベルのブロツク図を示した図１０を参照して、上述の
本発明の特徴の細部を以下に説明する。

【００４５】図１０に示されているように、大域デイレ
クトリ５００の状態及び制御ブロツク５０２はＮ個の状
態ラインを含んでいる。Ｎ個の状態ラインはＭＰシステ
ム中のキヤツシユ・ラインを監視する。Ｎ個の状態ライ
ンは、ＭＰシステム、またはそのサブセツト中のすべて
のキヤツシユ・ラインと対応させることができる。ＭＰ
システムのサブセツトの場合には、残りの状態ラインは
他のメモリ位置にストアして、必要な時に検索すること
ができる。

【００４６】Ｎ個の状態ラインの各々は、参照数字６０
２で示されたように、大域デイレクトリの状態及び制御
ブロツク５０２によつて処理することのできる複数個の
標識を含んでいる。例えば、Ｎ個の状態ラインの各々は
デイレクトリ・タグ（ｄｔａｇ）６０４を持つている。
ｄｔａｇ６０４はキヤツシユ・ラインを特に識別するた
めの単なるバイナリ・コードである。

【００４７】Ｎ個の状態ラインの各々は大域デイレクト
リの状態（ｇｓｔａｔｓ）標識６０６を持つている。良
好な実施例において、大域デイレクトリの状態標識６０
６は、合計４つの異なつた大域デイレクトリの状態、即
ち「排他的」状態と、「排他的修正（ＥＸＭ）」状態
と、「読み取り専用」状態と、ＭＰシステムのｐ個のキ
ヤツシユ・メモリのすべてにおいて「存在せず」状態と
を表示するために、２つのビツトを含んでいる。

【００４８】参照数字６０８乃至６１０で示したよう
に、プロセツサ識別子（ＰＩＤ）は、どのプロセツサが
状態ライン６０２に対応するかを表示する。例えば、
「ＰＩＤ_x（ｌｏｇ₂Ｐ）」は、ｐ個のプロセツサのうち
のプロセツサ「ｘ」が状態ライン６０２に対応すること
を表わしている。

【００４９】Ｎ個の状態ラインの各々は、状態ラインが
書き戻しを待つている状態（ＷＴＥＶＥＮＴ）なのか、
或は、プロセツサから発生した他の状態を待つているの
かを特定する状態標識６１２を持つている。良好な実施
例において、ＷＴＥＶＥＮＴ標識６１２は単一のビツト
である。若し、状態ラインが書き戻しを待つている間
に、状態ラインによつて識別されたデータ・ラインの要
求が発生したならば、その要求は、書き戻しが発生され
るまで、大域デイレクトリによつて処理されない。

【００５０】最後に、Ｎ個の状態ラインの各々は、書き
戻しを発生させた状態を特定する要求状態（ＲＱＥＶＥ
ＮＴ）標識６１４を持つている。良好な実施例におい
て、ＲＱＥＶＥＮＴ標識６１４は、３つの状態、即ち
「読み取り要求」状態と、「ストア要求」状態と、「修
正要求」状態のために、２つのビツトを含んでいる。

【００５１】ライン用バツフア５０４は、特別のタグが
先頭に置かれたデータを含む「Ｓ」データ・ラインを持
つている。更に、修正ワード用バツフア５０８は、特別
のタグが先頭に置かれたデータを含む「Ｔ」データ・ワ
ードを持つている。

【００５２】図４乃至図８を参照して説明した従来のプ
ロトコルとは対照的に異なつているＭＰシステムにおけ
るデータの整合性を維持するための新規なプロトコル
を、図１１乃至図１４を参照して以下に説明する。図１
１乃至図１４は、図４乃至図８と同じように、８プロセ
ツサ・システムを対象としている。プロセツサの数（即
ち、８）は説明を単純にするために選ばれた任意に決め
られる数である。図１１乃至図１４は、プロセツサＰ₆
と関連したキヤツシユ・メモリにおいて、プロセツサＰ
₂によつて排他的に所有されている修正されたデータ・
ラインＬをコピーするためのステツプを順番に並べて示
してある。

【００５３】最初に、図１１に示されているように、大
域デイレクトリ５００の状態及び制御ブロツク５０２に
おいて、修正データ・ラインＬに対応する状態ライン７
０２（Ｎ個のうちの１つのデータ・ライン）は、排他的
に修正されたデータ・ラインＬのコピーを、プロセツサ
Ｐ₂が持つていることを表示する。これをより具体的に
言えば、状態ライン７０２のプロセツサ標識子（ＰＩ
Ｄ）は、「ＰＩＤ₂（ｌｏｇ₂Ｐ）」であり、プロセツサ
Ｐ₂がデータ・ラインを持つていることを表示する。更
に、参照数字７０４で示されているように、ラインＬが
排他的に修正（ＥＸＭ）されたことを表示するように、
大域デイレクトリの状態（ｇｓｔａｔｓ）標識がセツト
される。

【００５４】図１１を参照すると、スイツチ２１６、２
２２及び２３４を通して、読み取り要求（ステツプ１）
がプロセツサＰ₆から大域デイレクトリＧＤ₄に送られ
る。大域デイレクトリ５００の制御ブロツク５０２は、
特別のタグ７０６を通して、読み取り要求を特定の状態
ライン７０２に一致させる。大域デイレクトリＧＤ₄の
制御ブロツクはＰＩＤの状態及びｇｓｔａｔｓを認識す
るので、その制御ブロツクは、プロセツサＰ₂が排他的
に修正されたデータ・ラインＬを持つていることを認識
する。

【００５５】図１２に示されているように、書き込み要
求（ステツプ２）は、夫々スイツチ２３４、２２２及び
２１２を介して大域デイレクトリＧＤ₄からプロセツサ
Ｐ₂に送られる。上述の動作と同時に、矢印７０８で示
されているように、大域デイレクトリＧＤ₄からメモリ
・モジユールＭ₄に、転送要求が送られる。本質的に
は、転送要求は、メモリ・モジユールＭ₄からデータ・
ラインＬの転送を大域デイレクトリＧＤ₄に要請する。

【００５６】前述のステツプ２の間で、大域デイレクト
リ５００の大域デイレクトリの状態及び制御ブロツク５
０２はＷＴＥＶＥＮＴ標識６１２及びＲＱＥＶＥＮＴ標
識６１４を処理する。データを書き戻すためのプロセツ
サを待つている状態であることを、大域デイレクトリの
状態及び制御ブロツク５０２が表示するために、大域デ
イレクトリの状態及び制御ブロツク５０２はＷＴＥＶＥ
ＮＴ標識６１２をセツトする。このことを別の面から言
うと、大域デイレクトリの状態及び制御ブロツク５０２
がデータ・ラインを修正するためにプロセツサＰ₂を待
つている間で、状態ライン７０２によつて表示されたデ
ータ・ラインのすべての要求は、プロセツサＰ₂からの
書き戻しが発生するまで、大域デイレクトリの状態及び
制御ブロツク５０２によつて処理されないことを意味す
る。更に、大域デイレクトリの制御ブロツク５０２は、
Ｐ₆が読み取り要求を送つたので、「読み取り要求」の
ためのＲＱＥＶＥＮＴ標識６１４をセツトする。

【００５７】図１３に示されているように、次のステツ
プの間で、修正されたデータ・ラインＬはプロセツサＰ
₂から、メモリ・モジユール４（参照数字４２０）及び
大域デイレクトリＧＤ₄（参照数字５００）との両方に
同時に転送される。この動作と同時に、データ・ライン
Ｌの転送要求はメモリ・モジユールＭ₄において処理さ
れ、そして、データ・ラインＬはメモリ・モジユールＭ
₄から大域デイレクトリＧＤ₄中のライン用バツフア５０
４に転送される。多くの場合、大域デイレクトリ５００
は、大域デイレクトリがプロセツサＰ₂から修正された
データ・ラインＬを受け取る前にメモリ・モジユールＭ
₄からデータ・ラインＬを受け取る。

【００５８】大域デイレクトリ５００が修正されたデー
タ・ラインＬを受け取つた時、大域デイレクトリは、何
故大域デイレクトリが修正されたラインＬを受け取つた
かを決めるために、ＲＱＥＶＥＮＴ標識６１４をチエツ
クする。この問い合わせを受けると、この例の場合、大
域デイレクトリは、プロセツサＰ₆が読み取り要求を発
生したことを決定する。更に修正されたデータ・ライン
Ｌのヘツダ中のビツト・ベクトルから、大域デイレクト
リ５００は、データ・ラインＬのどちらのデータ・ワー
ドが変更されたのかを決定することができる。変更され
たデータ・ワードは修正ワード用バツフア５０８中にス
トアされ、そしてビツト・ベクトルはライン用バツフア
のコントローラ５０６に送られる。以下に説明されるよ
うに、ライン用バツフアのコントローラ５０６は、修正
されないワードを要求側のプロセツサＰ₆に転送するた
めに、プロトコルの次のステツプにおいて、ビツト・ベ
クトルによつて供給される情報を使用する。

【００５９】最後に図１４に示されているように、本発
明に従つて、修正されたデータ・ラインＬは大域デイレ
クトリＧＤ₄からプロセツサＰ₆に転送される。修正され
たデータ・ラインＬの修正されたワードは、修正ワード
用バツフア５０８からプロセツサＰ₆に転送され、他
方、データ・ラインＬの残りの（変更されなかつた）ワ
ードはライン用バツフア５０４からプロセツサＰ₆に転
送される。

【００６０】上述の動作の後、大域デイレクトリの状態
及び制御ブロツク５０２はｇｓｔａｔｓ標識６０６及び
ＰＩＤ標識６０８を修正する。プロセツサＰ₂及びＰ₆の
両方がデータ・ラインのコピーを持つているので、大域
デイレクトリの制御ブロツク５０２は、図１４に「Ｒ
Ｏ」として示されているように、「読み取り専用」に、
状態ライン７０２のｇｓｔａｔｓ６０６をセツトする。
更に、大域デイレクトリ制御ブロツク５０２は、プロセ
ツサＰ₂及びＰ₆がデータ・ラインＬのコピーを現在持つ
ていることを表示するためにＰＩＤ標識６０８をセツト
する。

【００６１】従来の整合性プロトコルに必要とした図４
乃至図８に関連して特定されたスイツチング時間及びア
クセス時間の２５クロツク・サイクルの時間を再度取り
上げて比較すると、本発明に従つた整合性プロトコルを
遂行するために必要な時間は約１４クロツク・サイクル
であり、従来のプロトコルの場合よりも遥かに短い時間
である。この１４クロツク・サイクルは下記の表２に示
した分析に基いている。

【００６２】表２整合性プロト２*２スイツ大域デイレクメモリ・モジ合計時間コルのステツチのスイツチトリＧＤ₄のユールＭ₄のプの順番時間（クロツアクセス時間アクセス時間ク・サイクル（クロツク・（クロツク・）サイクル）サイクル） −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− １３１０４２３００３３３１０４４３００３１４

【００６３】表２に示したように、大域デイレクトリ５
００に対して、ライン用バツフア５０４と、修正ワード
用バツフア５０８とを付加したことは、プロセツサＰ₆
からの読み取り要求を処理するために必要とされる時間
の長さを４４％減少する。この理由は、本発明によつ
て、メモリ・モジユールを待つことに含まれた多くの時
間を除去していることによる。従来のプロトコルにおい
て、データ・ラインは、すべての修正されたデータ・ラ
インがメモリ・モジユールＭ₄に書き込まれた後にの
み、要求側のキヤツシユ・メモリに転送される。従つ
て、本発明は、２つの動作、即ち（１）大域デイレクト
リＧＤ₄とメモリ・モジユールＭ₄との間のデータ・ライ
ンの転送動作と、（２）プロセツサからメモリへの書き
戻し動作との２つの動作を同時に発生させることによつ
てＭＰシステムを高性能にする。

【００６４】以上、本発明の１実施例を説明してきた
が、例えば、プロセツサ、キヤツシユ・メモリ及びメモ
リ・モジユールの数を上述の実施例とは異なつた数にす
るなどの多くの変更が、この道の専門家によつて容易に
行なうことができるので、本発明の技術的範囲は、上述
の実施例にのみ限定されるものではない。

【００６５】

【発明の効果】本発明により、書き戻しキヤツシユ・メ
モリと、共有されたメイン・メモリに接続された多段相
互接続ネツトワークを含む多重プロセツサ・システムに
おいて、従来の技術に比較してプロセツサの数を増加す
ることができ、処理時間が遥かに速いシステムが与えら
れる。

【図面の簡単な説明】

【図１】多段相互接続ネツトワーク（ＭＩＮ）を通し
て、ｍ個の大域デイレクトリに関連されたメモリ・モジ
ユール（ＭＭ）を有するメモリに接続されたｐ個のプロ
セツサを含む多重プロセツサ・システムのブロツク図で
ある。

【図２】ＭＩＮは、夫々の段に対して４つの２*２スイ
ツチを持つている８プロセツサ・システムのためのＭＩ
Ｎの低レベルのブロツク図である。

【図３】入力Ｉ、Ｊ及び出力Ｐ、Ｑを有する図２に示し
た２*２スイツチと動作を説明するための図である。

【図４】３段のＭＩＮを有する８プロセツサ・システム
におけるデータの整合性を維持するための従来のプロト
コルにおいて、プロセツサＰ₆と関連するキヤツシユ・
メモリ中に存在しており、プロセツサＰ₂によつて排他
的に所有されている修正されたデータ・ラインＬをコピ
ーするための第１のステツプを説明するための図であ
る。

【図５】３段のＭＩＮを有する８プロセツサ・システム
におけるデータの整合性を維持するための従来のプロト
コルにおいて、プロセツサＰ₆と関連するキヤツシユ・
メモリ中に存在しており、プロセツサＰ₂によつて排他
的に所有されている修正されたデータ・ラインＬをコピ
ーするための第２のステツプを説明するための図であ
る。

【図６】３段のＭＩＮを有する８プロセツサ・システム
におけるデータの整合性を維持するための従来のプロト
コルにおいて、プロセツサＰ₆と関連するキヤツシユ・
メモリ中に存在しており、プロセツサＰ₂によつて排他
的に所有されている修正されたデータ・ラインＬをコピ
ーするための第３のステツプを説明するための図であ
る。

【図７】３段のＭＩＮを有する８プロセツサ・システム
におけるデータの整合性を維持するための従来のプロト
コルにおいて、プロセツサＰ₆と関連するキヤツシユ・
メモリ中に存在しており、プロセツサＰ₂によつて排他
的に所有されている修正されたデータ・ラインＬをコピ
ーするための第４のステツプを説明するための図であ
る。

【図８】３段のＭＩＮを有する８プロセツサ・システム
におけるデータの整合性を維持するための従来のプロト
コルにおいて、プロセツサＰ₆と関連するキヤツシユ・
メモリ中に存在しており、プロセツサＰ₂によつて排他
的に所有されている修正されたデータ・ラインＬをコピ
ーするための第５のステツプを説明するための図であ
る。

【図９】本発明に従つた大域デイレクトリの高レベルの
ブロツク図である。

【図１０】図２の大域デイレクトリの低レベルのブロツ
ク図である。

【図１１】３段のＭＩＮを有する８プロセツサ・システ
ムにおけるデータの整合性を維持するための本発明に従
つたプロトコルにおいて、プロセツサＰ₆と関連するキ
ヤツシユ・メモリ中に存在しており、プロセツサＰ₂に
よつて排他的に所有されている修正されたデータ・ライ
ンＬをコピーするための第１のステツプを説明するため
の図である。

【図１２】３段のＭＩＮを有する８プロセツサ・システ
ムにおけるデータの整合性を維持するための本発明に従
つたプロトコルにおいて、プロセツサＰ₆と関連するキ
ヤツシユ・メモリ中に存在しており、プロセツサＰ₂に
よつて排他的に所有されている修正されたデータ・ライ
ンＬをコピーするための第２のステツプを説明するため
の図である。

【図１３】３段のＭＩＮを有する８プロセツサ・システ
ムにおけるデータの整合性を維持するための本発明に従
つたプロトコルにおいて、プロセツサＰ₆と関連するキ
ヤツシユ・メモリ中に存在しており、プロセツサＰ₂に
よつて排他的に所有されている修正されたデータ・ライ
ンＬをコピーするための第３のステツプを説明するため
の図である。

【図１４】３段のＭＩＮを有する８プロセツサ・システ
ムにおけるデータの整合性を維持するための本発明に従
つたプロトコルにおいて、プロセツサＰ₆と関連するキ
ヤツシユ・メモリ中に存在しており、プロセツサＰ₂に
よつて排他的に所有されている修正されたデータ・ライ
ンＬをコピーするための第４のステツプを説明するため
の図である。

【符号の説明】

１００多重プロセツサ（ＭＰ）のアーキテクチヤ１０２乃至１０６プロセツサ１１２乃至１１６キヤツシユ・メモリ１１８、２００多段相互接続ネツトワーク（ＭＩＮ）１２０メモリ１２３乃至１２７メモリ・モジユール１３３乃至１３７、５００大域デイレクトリ５０２大域デイレクトリの状態及び制御ブロツク５０４ライン用バツフア５０８修正ワード用バツフア５０６、５１０コントローラ６０４デイレクトリ・タグ６０６大域デイレクトリの状態標識６０８乃至６１０プロセツサ識別子６１２ＷＴＥＶＥＮＴ標識（待ち状態標識）６１４ＲＱＥＶＥＮＴ標識（要求状態標識）

───────────────────────────────────────────────────── フロントページの続き (72)発明者ケビン・パトリツク・マツクアウリフエアメリカ合衆国ニユーヨーク州、ピークスキル、ローマ・コート７番地 (72)発明者バハラート・デイープ・ラシアメリカ合衆国ニユウヨーク州、マホパツク、レイクビユー・ドライブ、ルート８ 167シイ（番地なし）

Claims

【特許請求の範囲】

【請求項１】データ・ラインの転送動作と書き戻し動
作を同時に行なわせることによつて、書き戻しキヤツシ
ユ・メモリと、共有されたメモリに接続された多段相互
接続ネツトワークとを有する多重プロセツサ・システム
の性能を最適化するための装置であつて、修正されたワードがキヤツシユ・メモリから書き戻され
た時に、すべての修正されたワードをストアするように
構成された修正ワード用バツフアを含むことと、上記メモリから転送された古いキヤツシユ・ラインをス
トアするように構成されたライン用バツフアを含み、上
記古いキヤツシユ・ラインのアドレス見出しは上記修正
されたキヤツシユ・ラインのアドレスの識別子と対応す
ることと、上記修正ワード用バツフアと上記ライン用バツフアとに
関連された大域デイレクトリを含み、該大域デイレクト
リは、キヤツシユ・ラインに関する状態情報及び制御情
報をストアするように構成されており、上記キヤツシユ
・メモリから上記修正されたワードの書き戻しを要求す
ると同時に、上記メモリから上記古いキヤツシユ・ライ
ンを要求するように構成されており、そして、上記修正
されたキヤツシユ・ラインを、上記修正ワード用バツフ
ア及び上記ライン用バツフアを組み合せて、要求側のキ
ヤツシユ・メモリに書き込ませるように構成されている
こととを特徴とする多重プロセツサ・システムの性能の
最適化装置。
【請求項２】上記システムの各キヤツシユ・ラインに
対応する上記大域デイレクトリが利用可能な状態ライン
を含んでおり、該状態ラインは特定のキヤツシユ・ライ
ンと、大域デイレクトリの状態と、キヤツシユ・ライン
を所有する１つ、または、それ以上のプロセツサと、状
態ラインが書き戻しを待つている状態にあるか否かを表
示する待ち状態標識と、書き戻し要求が発生したことを
識別する要求状態標識とを特定することを特徴とする請
求項１に記載の多重プロセツサ・システムの性能の最適
化装置。
【請求項３】上記多段相互接続ネツトワークは上記段
の各々の中に４個のスイツチを持つ３つの段を有するこ
とと、上記スイツチは２つの入力と２つの出力を有し、
かつ任意の入力を任意の出力に切り換えるように構成さ
れていることとを特徴とする請求項１に記載の多重プロ
セツサ・システムの性能の最適化装置。
【請求項４】書き戻しキヤツシユと、共有されたメモ
リに接続された多段相互接続ネツトワークとを有する多
重プロセツサ・システムの性能を、データ・ライン転送
動作及び書き戻し動作を同時に行なわせることによつて
最適化する装置において、キヤツシユ・メモリからの修正されたキヤツシユ・ライ
ンの転送要求と、メモリからの古いキヤツシユ・ライン
の転送要求とを受け取る制御手段を含み、上記古いキヤ
ツシユ・ラインのアドレス識別子は、上記修正されたキ
ヤツシユ・ラインと、上記大域デイレクトリから上記修
正されたキヤツシユ・ラインを転送する上記手段のアド
レス識別子と対応することと、上記キヤツシユ・メモリから書き戻された修正されたワ
ードを、上記大域デイレクトリにおいて獲得すると同時
に、上記メモリから上記古いキヤツシユ・ラインをスト
アするバツフア手段を含むこととを特徴とする多重プロ
セツサ・システムの性能の最適化装置。
【請求項５】上記修正されたワードをストアするため
に構成された修正ワード用バツフアと、上記古いキヤツ
シユ・ラインをストアするために構成されたライン用バ
ツフアとを含むことを特徴とする請求項４に記載の多重
プロセツサ・システムの性能の最適化装置。
【請求項６】上記システムの各キヤツシユ・ラインに
対応する上記制御手段が利用可能な状態ラインを含み、
該状態ラインの各々は特定のキヤツシユ・ラインと、大
域デイレクトリの状態と、キヤツシユ・ラインを所有す
る１つ、またはそれ以上のプロセツサと、状態ラインが
書き戻しを待つているか否かを表示する待ち状態標識
と、書き戻し要求が生じたことを識別する要求状態標識
とを含むことを特徴とする請求項４に記載の多重プロセ
ツサ・システムの性能の最適化装置。
【請求項７】上記多段相互接続ネツトワークは、上記
段の各々の中に４つのスイツチを持つ３つの段を有する
ことと、上記スイツチは２つの入力と２つの出力を有
し、かつ任意の入力を任意の出力に切り換えるように構
成されていることとを特徴とする請求項４に記載の多重
プロセツサ・システムの性能の最適化装置。
【請求項８】書き戻しキヤツシユ・メモリと、大域デ
イレクトリによつて監視され、共有されたメモリに接続
された多段相互接続ネツトワークとを有する多重プロセ
ツサ・システムの性能を、データ・ライン転送動作と書
き戻し動作とを同時に行なわせて、最適化するための方
法において、 (a) 修正されたキヤツシユ・ラインの大域デイレクト
リを要求するステツプと、 (b) 供給側キヤツシユ・メモリから上記修正されたキ
ヤツシユ・ライン中の修正されたワードの書き戻しを要
求するステツプであつて、上記古いキヤツシユ・ライン
のアドレスの識別子は上記修正されたキヤツシユ・ライ
ンのアドレスの識別子と対応しており、 (c) 上記大域デイレクトリにおいて、上記供給側キヤ
ツシユ・メモリから書き戻された上記修正されたワード
を獲得すると同時に、上記メモリから上記古いキヤツシ
ユ・ラインをストアするステツプと、 (d) 上記大域デイレクトリから上記修正されたキヤツ
シユ・ラインを転送するステツプとを含む多重プロセツサ・システムの性能を最適化する方
法。
【請求項９】ヘツダの中のビツト・ベクトルを使用す
ることによつて修正されたワードを識別するステツプを
含むことを特徴とする請求項８に記載の多重プロセツサ
・システムの性能を最適化する方法。
【請求項１０】データが上記修正されたデータ・ライ
ン中で修正されたことを上記大域デイレクトリにおいて
決定するステツプと、上記供給側キヤツシユ・メモリの
アドレスの識別子を決定するステツプとを含むことを特
徴とする請求項８に記載の多重プロセツサ・システムの
性能を最適化する方法。