JPH10340227A

JPH10340227A - ローカル・グローバル・アドレス・スペース及びマルチアクセス・モードを用いたマルチプロセッサ・コンピュータ・システム

Info

Publication number: JPH10340227A
Application number: JP9208230A
Authority: JP
Inventors: Erik E Hagersten; エリック・イー・ハガーステン; Paul N Loewenstein; ポール・エヌ・ローウェンステイン
Original assignee: Sun Microsystems Inc
Current assignee: Sun Microsystems Inc
Priority date: 1996-07-01
Filing date: 1997-06-30
Publication date: 1998-12-22
Also published as: US5887138A; EP0817076A1; DE69724354T2; EP0817076B1; DE69724354D1

Abstract

(57)【要約】【課題】ネットワーク・トラフィックが低減され、要
求側ノードに応答する際の待ち時間が短縮された、分散
共用メモリ・システムを有するマルチプロセッサ・コン
ピュータ・システムを提供する。【解決手段】ノード内のプロセッサは、ノード間通信
を必要とするトランザクションを開始できる。ローカル
・アドレスはグローバル・アドレスに変換できる。要求
側ノードからホーム・ノードへ要求が送られると、ホー
ム・ノードは、要求されたデータのキャッシュ済みコピ
ーを保持するスレーブ・ノードへ読取りデマンドまたは
無効化デマンド、あるいはその両方を送る。スレーブ
は、データと肯定応答のどちらかを用いて要求側ノード
に応答する。各応答はさらに、要求側が予期している応
答の数を含む。要求側ノードは、予期していたすべての
応答を受け取ると、ホームへ完了メッセージを送り返
し、トランザクションが完了したものとみなし、その後
の処理を継続する。

Description

【発明の詳細な説明】

【０００１】関連特許出願の相互参照本特許出願は、開
示が引用によって本明細書に組み込まれた、下記の関連
特許出願に関係するものである。１．本出願と同時出願されたＨａｇｅｒｓｔｅｎ等の
「ＥｘｔｅｎｄｉｎｇＴｈｅＣｏｈｅｒｅｎｃｅＤ
ｏｍａｉｎＢｅｙｏｎｄＡＣｏｍｐｕｔｅｒＳ
ｙｓｔｅｍＢｕｓ」（参照番号Ｐ９９０）。２．本出願と同時出願されたＨａｇｅｒｓｔｅｎの「Ｍ
ｅｔｈｏｄＡｎｄＡｐｐａｒａｔｕｓＯｐｔｉｍｉ
ｚｉｎｇＧｌｏｂａｌＤａｔａＲｅｐｌｉｅｓ
ＩｎＡＣｏｍｐｕｔｅｒＳｙｓｔｅｍ」（参照番
号Ｐ９９１）。３．本出願と同時出願されたＨａｇｅｒｓｔｅｎ等の
「ＭｅｔｈｏｄＡｎｄＡｐｐａｒａｔｕｓＰｒｏｖ
ｉｄｉｎｇＳｈｏｒｔＬａｔｅｎｃｙＲｏｕｎｄ
−ＲｏｂｉｎＡｒｂｉｔｒａｔｉｏｎＦｏｒＡｃ
ｃｅｓｓＴｏＡＳｈａｒｅｄＲｅｓｏｕｒｃｅ」
（参照番号Ｐ９９２）。４．本出願と同時出願されたＳｉｎｇｈａｌ等の「Ｉｍ
ｐｌｅｍｅｎｔｉｎｇＳｎｏｏｐｉｎｇＯｎＡＳ
ｐｌｉｔ−ＴｒａｎｓａｃｔｉｏｎＣｏｍｐｕｔｅｒ
ＳｙｓｔｅｍＢｕｓ」（参照番号Ｐ９９３）。５．本出願と同時出願されたＳｉｎｇｈａｌ等の「Ｓｐ
ｌｉｔＴｒａｎｓａｃｔｉｏｎＳｎｏｏｐｉｎｇ
ＢｕｓＰｒｏｔｏｃｏｌ」（参照番号Ｐ９８９）。６．本出願と同時出願されたＨｅｌｌｅｒ等の「Ｉｎｔ
ｅｒｃｏｎｎｅｃｔｉｏｎＳｕｂｓｙｓｔｅｍＦｏ
ｒＡＭｕｌｔｉｐｒｏｃｅｓｓｏｒＣｏｍｐｕｔ
ｅｒＳｙｓｔｅｍＷｉｔｈＡＳｍａｌｌＮｕ
ｍｂｅｒＯｆＰｒｏｃｅｓｓｏｒｓＵｓｉｎｇＡ
ＳｗｉｔｃｈｉｎｇＡｒｒａｎｇｅｍｅｎｔＯｆ
ＬｉｍｉｔｅｄＤｅｇｒｅｅ」（参照番号Ｐ１６０
９）。７．本出願と同時出願されたＷａｄｅ等の「Ｓｙｓｔｅ
ｍＡｎｄＭｅｔｈｏｄＦｏｒＰｅｒｆｏｒｍｉ
ｎｇＤｅａｄｌｏｃｋＦｒｅｅＭｅｓｓａｇｅ
ＴｒａｎｓｆｅｒＩｎＣｙｃｌｉｃＭｕｌｔｉ−
ＨｏｐＤｉｇｉｔａｌＣｏｍｐｕｔｅｒＮｅｔｗ
ｏｒｋ」（参照番号Ｐ１５７２）。８．本出願と同時出願されたＣａｓｓｉｄａｙ等の「Ｓ
ｙｎｃｈｒｏｎｉｚａｔｉｏｎＳｙｓｔｅｍＡｎｄ
ＭｅｔｈｏｄＦｏｒＰｌｅｓｉｏｃｈｒｏｎｏｕ
ｓＳｉｇｎａｌｉｎｇ」（参照符号Ｐ１５９３）。９．本出願と同時出願されたＨａｇｅｒｓｔｅｎ等の
「ＭｅｔｈｏｄｓＡｎｄＡｐｐａｒａｔｕｓＦｏ
ｒＡＣｏｈｅｒｅｎｃｅＴｒａｎｓｆｏｒｍｅｒ
ＦｏｒＣｏｎｎｅｃｔｉｎｇＣｏｍｐｕｔｅｒ
ＳｙｓｔｅｍＣｏｈｅｒｅｎｃｅＤｏｍａｉｎｓ」
（参照番号Ｐ１５１９）。１０．本出願と同時出願されたＨａｇｅｒｓｔｅｎ等の
「ＭｅｔｈｏｄｓＡｎｄＡｐｐａｒａｔｕｓＦｏ
ｒＡＣｏｈｅｒｅｎｃｅＴｒａｎｓｆｏｒｍｅｒ
ＷｉｔｈＬｉｍｉｔｅｄＭｅｍｏｒｙＦｏｒ
ＣｏｎｎｅｃｔｉｎｇＣｏｍｐｕｔｅｒＳｙｓｔｅ
ｍＣｏｈｅｒｅｎｃｅＤｏｍａｉｎｓ」（参照番号
Ｐ１５３０）。１１．本出願と同時出願されたＨａｇｅｒｓｔｅｎ等の
「ＭｅｔｈｏｄｓＡｎｄＡｐｐａｒａｔｕｓＦｏ
ｒＳｈａｒｉｎｇＤａｔａＯｂｊｅｃｔｓＩｎ
ＡＣｏｍｐｕｔｅｒＳｙｓｔｅｍ」（参照番号Ｐ
１４６３）。１２．本出願と同時出願されたＨａｇｅｒｓｔｅｎ等の
「ＭｅｔｈｏｄｓＡｎｄＡｐｐａｒａｔｕｓＦｏ
ｒＡＤｉｒｅｃｔｏｒｙ−ＬｅｓｓＭｅｍｏｒｙ
ＡｃｃｅｓｓＰｒｏｔｏｃｏｌＩｎＡＤｉｓ
ｔｒｉｂｕｔｅｄＳｈａｒｅｄＭｅｍｏｒｙＣｏ
ｍｐｕｔｅｒＳｙｓｔｅｍ」（参照番号Ｐ１５３
１）。１３．本出願と同時出願されたＨａｇｅｒｓｔｅｎ等の
「ＨｙｂｒｉｄＭｅｍｏｒｙＡｃｃｅｓｓＰｒｏ
ｔｏｃｏｌＩｎＡＤｉｓｔｒｉｂｕｔｅｄＳｈ
ａｒｅｄＭｅｍｏｒｙＣｏｍｐｕｔｅｒＳｙｓｔ
ｅｍ」（参照番号Ｐ１５５０）。１４．本出願と同時出願されたＨａｇｅｒｓｔｅｎ等の
「ＭｅｔｈｏｄｓＡｎｄＡｐｐａｒａｔｕｓＦｏ
ｒＳｕｂｓｔａｎｔｉａｌｌｙＭｅｍｏｒｙ−Ｌｅ
ｓｓＣｏｈｅｒｅｎｃｅＴｒａｎｓｆｏｒｍｅｒ
ＦｏｒＣｏｎｎｅｃｔｉｎｇＣｏｍｐｕｔｅｒＳ
ｙｓｔｅｍ」（参照番号Ｐ１５２９）。１５．本出願と同時出願されたＨａｇｅｒｓｔｅｎの
「ＡＭｕｌｔｉｐｒｏｃｅｓｓｉｎｇＳｙｓｔｅｍ
ＩｎｃｌｕｄｉｎｇＡｎＥｎｈａｎｃｅｄＢｌｏ
ｃｋｉｎｇＭｅｃｈａｎｉｓｍＦｏｒＲｅａｄ
ＴｏＳｈａｒｅＴｒａｎｓａｃｔｉｏｎｓＩｎ
ＡＮＵＭＡＭｏｄｅ」（参照番号Ｐ１７８６）。１６．本出願と同時出願されたＧｕｚｏｖｓｋｉｙ等の
「ＥｎｃｏｄｉｎｇＭｅｔｈｏｄＦｏｒＤｉｒｅｃ
ｔｏｒｙＳｔａｔｅＩｎＣａｃｈｅＣｏｈｅｒｅ
ｎｔＤｉｓｔｒｉｂｕｔｅｄＳｈａｒｅｄＭｅｍ
ｏｒｙＳｙｓｔｅｍ」（参照番号Ｐ１５２０）。１７．本出願と同時出願されたＮｅｓｈｅｉｍ等の「Ｓ
ｏｆｔｗａｒｅＵｓｅＯｆＡｄｄｒｅｓｓＴｒ
ａｎｓｌａｔｉｏｎＭｅｃｈａｎｉｓｍ」（参照番号
Ｐ１５６０）。１８．本出願と同時出願されたＬｏｗｅｎｓｔｅｉｎ等
の「Ｄｉｒｅｃｔｏｒｙ−Ｂａｓｅｄ，Ｓｈａｒｅｄ−
Ｍｅｍｏｒｙ，ＳｃａｌｅａｂｌｅＭｕｌｔｉｐｒｏ
ｃｅｓｓｏｒＣｏｍｐｕｔｅｒＳｙｓｔｅｍＨａ
ｖｉｎｇＤｅａｄｌｏｃｋ−ｆｒｅｅＴｒａｎｓａ
ｃｔｉｏｎＦｌｏｗＳａｎｓＦｌｏｗＣｏｎｔ
ｒｏｌＰｒｏｔｏｃｏｌ」（参照番号Ｐ１５６１）。１９．本出願と同時出願されたＮｅｓｈｅｉｍの「Ｍａ
ｉｎｔａｉｎｉｎｇＡＳｅｑｕｅｎｔｉａｌＳｔｏ
ｒｅｄＯｒｄｅｒ（ＳＳＯ）ＩｎＡＮｏｎ−Ｓ
ＳＯＭａｃｈｉｎｅ」（参照番号Ｐ１５６２）。２０．本出願と同時出願されたＷｏｎｇ−Ｃｈａｎの
「ＮｏｄｅＴｏＮｏｄｅＩｎｔｅｒｒｕｐｔＭ
ｅｃｈａｎｉｓｍＩｎＡＭｕｌｔｉｐｒｏｃｅｓ
ｓｏｒＳｙｓｔｅｍ」（参照番号Ｐ１５８７）。２１．１９９６年４月８日に出願された、「Ｄｅｔｅｒ
ｍｉｎｉｓｔｉｃＤｉｓｔｒｉｂｕｔｅｄＭｕｌｔ
ｉｃａｃｈｅＣｏｈｅｒｅｎｃｅＰｒｏｔｏｃｏ
ｌ」と題するＨａｇｅｒｓｔｅｎ等の出願第０８／６３
０７０３号。２２．１９９５年１２月２２日に出願された、「ＡＨ
ｙｂｒｉｄＮＵＭＡＣｏｍａＣａｓｈｉｎｇＳｙ
ｓｔｅｍＡｎｄＭｅｔｈｏｄｓＦｏｒＳｅｌｅｃ
ｔｉｎｇＢｅｔｗｅｅｎＴｈｅＣａｃｈｉｎｇ
Ｍｏｄｅｓ」と題するＨａｇｅｒｓｔｅｎ等の出願第０
８／５７７２８３号。２３．１９９５年１２月２２日に出願された、「ＡＨ
ｙｂｒｉｄＮＵＭＡＣｏｍａＣａｓｈｉｎｇＳｙ
ｓｔｅｍＡｎｄＭｅｔｈｏｄｓＦｏｒＳｅｌｅｃ
ｔｉｎｇＢｅｔｗｅｅｎＴｈｅＣａｃｈｉｎｇ
Ｍｏｄｅｓ」と題するＷｏｏｄ等の出願第０８／５７５
７８７号。２４．本出願と同時出願されたＨａｇｅｒｓｔｅｎ等の
「ＦｌｕｓｉｎｇＯｆＣａｃｈｅＭｅｍｏｒｙ
ＩｎＡＣｏｍｐｕｔｅｒＳｙｓｔｅｍ」（参照番
号Ｐ１４１６）。２５．本出願と同時出願されたＨａｇｅｒｓｔｅｎ等の
「ＥｆｆｉｃｉｅｎｔＡｌｌｏｃａｔｉｏｎＯｆＣ
ａｃｈｅＭｅｍｏｒｙＳｐａｃｅＩｎＡＣｏｍ
ｐｕｔｅｒＳｙｓｔｅｍ」（参照番号Ｐ１５７６）。２６．本出願と同時出願されたＨａｇｅｒｓｔｅｎ等の
「ＥｆｆｉｃｉｅｎｔＳｅｌｅｃｔｉｏｎＯｆＭｅ
ｍｏｒｙＳｔｏｒａｇｅＭｏｄｅｓＩｎＡＣ
ｏｍｐｕｔｅｒＳｙｓｔｅｍ」（参照番号Ｐ１７２
６）。２７．本出願と同時出願されたＨａｇｅｒｓｔｅｎ等の
「Ｓｋｉｐ−ｌｅｖｅｌＷｒｉｔｅ−ｔｈｒｏｕｇｈ
ＩｎＡＭｕｌｔｉ−ｌｅｖｅｌＭｅｍｏｒｙ
ＯｆＡＣｏｍｐｕｔｅｒＳｙｓｔｅｍ」（参照番
号Ｐ１７３６）。２８．本出願と同時出願されたＨａｇｅｒｓｔｅｎの
「ＡＭｕｌｔｉｐｒｏｃｅｓｓｉｎｇＳｙｓｔｅｍ
ＣｏｎｆｉｇｕｒｅｄｔｏＰｅｒｆｏｒｍＥｆｆ
ｉｃｉｅｎｔＷｒｉｔｅＯｐｅｒａｔｉｏｎｓ」
（参照番号Ｐ１５００）。２９．本出願と同時出願されたＨａｇｅｒｓｔｅｎの
「ＡＭｕｌｔｉｐｒｏｃｅｓｓｉｎｇＳｙｓｔｅｍ
ＣｏｎｆｉｇｕｒｅｄｔｏＰｅｒｆｏｒｍＥｆｆ
ｉｃｉｅｎｔＢｌｏｃｋＣｏｐｙＯｐｅｒａｔｉ
ｏｎｓ」（参照番号Ｐ１５１５）。３０．本出願と同時出願されたＨａｇｅｒｓｔｅｎの
「ＡＭｕｌｔｉｐｒｏｃｅｓｓｉｎｇＳｙｓｔｅｍ
ＩｎｃｌｕｄｉｎｇＡｎＡｐｐａｒａｔｕｓＦ
ｏｒＯｐｔｉｍｉｚｉｎｇＳｐｉｎ−ＬｏｃｋＯ
ｐｅｒａｔｉｏｎｓ」（参照番号Ｐ１５２５）。３１．本出願と同時出願されたＨａｇｅｒｓｔｅｎ等の
「ＡＭｕｌｔｉｐｒｏｃｅｓｓｉｎｇＳｙｓｔｅｍ
ＣｏｎｆｉｇｕｒｅｄｔｏＤｅｔｅｃｔａｎｄ
ＥｆｆｉｃｉｅｎｔｌｙＰｒｏｖｉｄｅｆｏｒＭ
ｉｇｒａｔｏｒｙＤａｔａＡｃｃｅｓｓＰａｔｔ
ｅｒｎｓ」（参照番号Ｐ１５５５）。３２．本出願と同時出願されたＨａｇｅｒｓｔｅｎの
「ＡＭｕｌｔｉｐｒｏｃｅｓｓｉｎｇＳｙｓｔｅｍ
ＣｏｎｆｉｇｕｒｅｄｔｏＳｔｏｒｅＣｏｈｅ
ｒｅｎｃｙＳｔａｔｅＷｉｔｈｉｎＭｕｌｔｉｐ
ｌｅＳｕｂｎｏｄｅｓｏｆａＰｒｏｃｅｓｓｉ
ｎｇＮｏｄｅ」（参照番号Ｐ１５２７）。３３．本出願と同時出願されたＨａｇｅｒｓｔｅｎ等の
「ＡＭｕｌｔｉｐｒｏｃｅｓｓｉｎｇＳｙｓｔｅｍ
ＣｏｎｆｉｇｕｒｅｄｔｏＰｅｒｆｏｒｍＰｒ
ｅｆｅｔｃｈｉｎｇＯｐｅｒａｔｉｏｎｓ」（参照番
号Ｐ１５７１）。３４．本出願と同時出願されたＨａｇｅｒｓｔｅｎ等の
「ＡＭｕｌｔｉｐｒｏｃｅｓｓｉｎｇＳｙｓｔｅｍ
ＣｏｎｆｉｇｕｒｅｄｔｏＰｅｒｆｏｒｍＳｙ
ｎｃｈｒｏｎｉｚａｔｉｏｎＯｐｅｒａｔｉｏｎｓ」
（参照番号Ｐ１５５１）３５．本出願と同時出願されたＨａｇｅｒｓｔｅｎ等の
「ＡＭｕｌｔｉｐｒｏｃｅｓｓｉｎｇＳｙｓｔｅｍ
ＨａｖｉｎｇＣｏｈｅｒｅｎｃｙ−Ｒｅｌａｔｅｄ
ＥｒｒｏｒＬｏｇｇｉｎｇＣａｐａｂｉｌｉｔｉ
ｅｓ」（参照番号Ｐ１７１９）。３６．本出願と同時出願されたＨａｇｅｒｓｔｅｎ等の
「ＡＭｕｌｔｉｐｒｏｃｅｓｓｉｎｇＳｙｓｔｅｍ
ＣｏｎｆｉｇｕｒｅｄｔｏＰｅｒｆｏｒｍＳｏ
ｆｔｗａｒｅＩｎｉｔｉａｔｅｄＰｒｅｆｅｔｃｈ
Ｏｐｅｒａｔｉｏｎｓ」（参照番号Ｐ１７８７）。３７．本出願と同時に出願されたＬｏｅｗｅｎｓｔｅｉ
ｎ等の「ＭｕｌｔｉｐｒｏｃｅｓｓｉｎｇＳｙｓｔｅ
ｍＥｍｐｌｏｙｉｎｇＡＴｈｒｅｅ−ＨｏｐＣ
ｏｍｍｕｎｉｃａｔｉｏｎＰｒｏｔｏｃｏｌ」（参照
番号Ｐ１７８５）。３８．本出願と同時出願されたＨａｇｅｒｓｔｅｎ等の
「ＭｕｌｔｉｐｒｏｃｅｓｓｉｎｇＳｙｓｔｅｍＥ
ｍｐｌｏｙｉｎｇＡＣｏｈｅｒｅｎｃｙＰｒｏｔｏ
ｃｏｌＩｎｃｌｕｄｉｎｇＡＲｅｐｌｙＣｏｕ
ｎｔ」（参照番号Ｐ１５７０）。

【０００２】

【発明の属する技術分野】本発明は、マルチプロセッサ
・コンピュータ・システムの分野に関し、詳細には、分
散共用メモリ・アーキテクチャを有するマルチプロセッ
サ・コンピュータ・システム内で使用される通信プロト
コルに関する。

【０００３】

【従来の技術】多重処理コンピュータ・システムは、コ
ンピューティング・タスクを実行するために使用できる
２つ以上のプロセッサを含む。１つのプロセッサ上で特
定のコンピューティング・タスクを実行し、同時に他の
プロセッサが、関係のないコンピューティング・タスク
を実行することができる。別法として、特定のコンピュ
ーティング・タスクの構成要素を複数のプロセッサ間で
分散し、コンピューティング・タスク全体を実行するの
に必要な時間を短縮することができる。一般的に言え
ば、プロセッサは、１つまたは複数のオペランドに対す
る演算を実行して結果を生成するように構成された装置
である。演算は、プロセッサによって実行される命令に
応答して実行される。

【０００４】市販の多重処理コンピュータ・システムで
広く使用されているアーキテクチャは、対称型マルチプ
ロセッサ（ＳＭＰ）アーキテクチャである。通常、ＳＭ
Ｐコンピュータ・システムは、キャッシュ階層を通じて
共用バスに接続された複数のプロセッサを備える。共用
バスにはメモリも接続され、メモリはシステム内のプロ
セッサ間で共用される。メモリ内の特定のメモリ位置へ
のアクセスは、他の特定のメモリ位置へのアクセスと同
様な時間で行われる。メモリ内の各位置に一様にアクセ
スできるので、この構造はしばしば、一様なメモリ・ア
ーキテクチャ（ＵＭＡ）と呼ばれる。

【０００５】プロセッサは多くの場合、内部キャッシュ
と共に構成され、ＳＭＰコンピュータ・システム内のプ
ロセッサと共用バスとの間のキャッシュ階層には通常、
１つまたは複数のキャッシュが含まれる。特定のメイン
・メモリ・アドレスに存在するデータの複数のコピーを
これらのキャッシュに記憶することができる。特定のア
ドレスが所与の時間に１つのデータ値しか記憶しない共
用メモリ・モデルを維持するために、共用バス・コンピ
ュータ・システムはキャッシュ・コヒーレンシを使用す
る。一般的に言えば、特定のメモリ・アドレスに記憶さ
れているデータに対する演算の効果がキャッシュ階層内
のデータの各コピーに反映される場合、その演算はコヒ
ーレントである。たとえば、特定のメモリ・アドレスに
記憶されているデータを更新したときには、前のデータ
のコピーを記憶しているキャッシュにその更新を供給す
ることができる。別法として、特定のメモリ・アドレス
へのその後のアクセスによって、更新済みコピーがメイ
ン・メモリから転送されるように、前のデータのコピー
をキャッシュ内で無効化することができる。共用バス・
システムの場合、通常、スヌープ・バス・プロトコルが
使用される。共用バス上で実行される各コヒーレント・
トランザクションは、キャッシュ内のデータと突き合わ
せて調べられる（あるいは「スヌープ」される）。影響
を受けるデータのコピーが見つかった場合、コヒーレン
ト・トランザクションに応答して、そのデータを含むキ
ャッシュ・ラインの状態を更新することができる。

【０００６】残念なことに、共用バス・アーキテクチャ
は、多重処理コンピュータ・システムの有用性を制限す
るいくつかの欠点を有する。バスはピーク帯域幅を利用
することができる（たとえば、バスを介して転送できる
バイト数／秒）。バスに追加プロセッサを取り付ける
と、プロセッサにデータおよび命令を供給するのに必要
な帯域幅がピーク・バス帯域幅を超えることがある。い
くつかのプロセッサが使用可能なバス帯域幅を待たなけ
ればならないので、プロセッサの帯域幅要件が使用可能
なバス帯域幅を超えるとコンピュータ・システムの性能
が影響を受ける。

【０００７】また、共用バスにより多くのプロセッサを
追加するとバスに対する容量負荷が増大し、場合によっ
てはバスの物理長が増加する。容量負荷が増大しバス長
が延びると、バスを横切って信号が伝搬する際の遅延が
長くなる。伝搬遅延が長くなるので、トランザクション
の実行時間が長くなる。したがって、より多くのプロセ
ッサを追加するほど、バスのピーク帯域幅が減少する。

【０００８】これらの問題は、プロセッサの動作周波数
および性能が引き続き向上していることによってさらに
深刻化する。より高い周波数およびより高度なプロセッ
サ・マイクロアーキテクチャによって性能が向上するの
で、帯域幅要件は、プロセッサの数が同じであっても前
のプロセッサ世代より高くなる。したがって、前に多重
処理コンピュータ・システムに十分な帯域幅を与えたバ
スが、より高性能のプロセッサを使用する同様なコンピ
ュータ・システムには不十分であることがある。

【０００９】多重処理コンピュータ・システム用の他の
構造は、分散共用メモリ・アーキテクチャである。分散
共用メモリ・アーキテクチャは、内部にプロセッサおよ
びメモリが存在する複数のノードを含む。複数のノード
は、その間の結合されたネットワークを介して通信す
る。全体的に考えると、複数のノード内に含まれるメモ
リは、コンピュータ・システムの共用メモリを形成す
る。通常、ディレクトリを使用して、どのノードが特定
のアドレスに対応するデータのキャッシュ・コピーを有
するかが識別される。ディレクトリを調べることによっ
てコヒーレンシ活動を生成することができる。

【００１０】分散共用メモリ・システムは、スケーリン
グ可能であり、共用バス・アーキテクチャの制限を解消
する。多くのプロセッサ・アクセスはノード内で完了す
るので、通常、ノードがネットワーク上で有する帯域幅
要件は、共用バス・アーキテクチャが共用バス上で与え
なければならない帯域幅要件よりもずっと低い。ノード
は、高いクロック周波数および帯域幅で動作し、必要に
応じてネットワークにアクセスすることができる。ノー
ドのローカル帯域幅に影響を与えずにネットワークに追
加ノードを追加することができる。その代わり、ネット
ワーク帯域幅のみが影響を受ける。

【００１１】分散共用メモリ・システム内のノード間の
コヒーレンスは多くの場合、コヒーレンス・プロトコル
の分散実施形態を使用して維持される。多くのそのよう
なコヒーレンス・プロトコルは、要求がまず要求側ノー
ドからホーム・ノードへ送られる４ホップ応答を使用す
る。ホーム・ノードはこれに応答して、データのキャッ
シュ済みコピーを保持するスレーブ・ノードへ読取り／
無効化デマンドを送る。スレーブはデマンドに応じてホ
ーム・ノードに応答する。４ホップ応答プロトコルが完
了するのは、ホーム・ノードが要求側ノードに応答した
ときである。

【００１２】残念なことに、リモート・ノードからデー
タにアクセスしなければならないときに生成される通信
パターンによって、かなりの量のネットワーク・トラフ
ィックが生成される。また、すべてのスレーブ・ノード
がホーム・ノードに応答した後、要求側ノードは、ホー
ム・ノードが要求側ノードへ完了表示を送るまで待たな
いかぎりトランザクションが完了したとみなすことはで
きない。これによって、コヒーレンシ・トランザクショ
ンに関連するクリティカル・パスの全体的な待ち行列時
間が長くなる。

【００１３】

【発明が解決しようとする課題】したがって、ネットワ
ーク・トラフィックが低減され要求側ノードに応答する
際の待ち時間が短縮された、分散共用メモリ・システム
を有するマルチプロセッサ・コンピュータ・システムが
望ましい。

【００１４】

【課題を解決するための手段】上記で概略的に述べた問
題は主として、本発明によってローカル・アドレス空間
およびグローバル・アドレス空間ならびに複数のアクセ
ス・モードを使用するマルチプロセッサ・コンピュータ
・システムによって解決される。一実施形態では、要求
側ノードからホーム・ノードへ要求が送られると、ホー
ム・ノードは、要求されたデータのキャッシュ済みコピ
ーを保持するスレーブ・ノードへ読取りデマンドまたは
無効化デマンド、あるいはその両方を送る。ホーム・ノ
ードからスレーブ・ノードへのデマンドはそれぞれ、要
求側エージェントが受け取ることを予期している応答の
数を示す値を含むことができるので有利である。スレー
ブは、データと肯定応答のどちらかを用いて要求側ノー
ドに応答する。各応答はさらに、要求側が予期している
応答の数を含むことができる。要求側ノードは、予期し
ていたすべての応答を受け取ると、トランザクションが
完了したものとみなし、その後の処理を継続することが
できる。このように、すべての通信は、最大でキャッシ
ュ・コヒーレンス・プロトコルのクリティカル・パス上
での３ホップ通信しか必要としない。したがって、キャ
ッシュ・コヒーレンス・プロトコルの結果としての全体
的なネットワーク・トラフィックを削減できるので有利
である。さらに、要求側ノードがトランザクションを完
了するためのクリティカル・パスの待ち時間を短縮する
ことができる。

【００１５】一実施形態では、要求側ノードは、予期し
ていたすべての応答を受け取った後、ホームへ完了メッ
セージを送ることができる。ホーム・ノードは次いで、
完了したトランザクションのコヒーレンシ単位上に置か
れた「ブロック」を削除することができる。

【００１６】要求側ノードはさらにあるいは別法とし
て、スレーブ・ノードからデータを受け取った後、ホー
ム・ノードへデータを送り、メモリ反映を行うことがで
きる。さらに、ホーム・ノードは、要求されたデータを
適当な状態、たとえばリード・ツー・オウン要求のため
に共用された状態で含む場合、他のノードへデマンドを
送ることはない。その代わりに、ホーム・ノードは要求
側ノードに直接応答する。

【００１７】本発明によるシステムおよび方法によっ
て、多重処理コンピュータ・システム内でグローバル・
コヒーレンシ・プロトコルを効率的にかつ簡単に実施す
ることができるので有利である。このプロトコルでは、
いくつかのダーティ・キャッシュ済みコピーがそれぞれ
の異なるノードに存在することができ、そのうちの１つ
が所有者状態であり古いコピーがホーム・ノードに存在
する、所有者ベースのプロトコルが可能である。

【００１８】本発明の他の目的および利点は、下記の詳
細な説明を読み添付の図面を参照したときに明らかにな
ろう。

【００１９】

【発明の実施の形態】本発明では様々な修正形態および
変更形態が可能であるが、本発明の特定の実施形態が、
一例として図示され、本明細書に詳しく記載されてい
る。しかし、図面および詳細な説明が、開示した特定の
形態に本発明を制限するものではなく、本発明が、添付
の特許請求の範囲で定義した本発明の趣旨および範囲内
のすべての修正形態、等価物、変更形態をカバーするも
のであることを理解されたい。

【００２０】次に、図１を参照すると、多重処理コンピ
ュータ・システム１０の一実施形態のブロック図が示さ
れている。コンピュータ・システム１０は、ポイント・
ツー・ポイント・ネットワーク１４によって相互接続さ
れた複数のＳＭＰノード１２Ａないし１２Ｄを含む。本
明細書で特定の参照符号とその後に続く文字で参照され
た要素は、集合的に参照符号のみで参照する。たとえ
ば、ＳＭＰノード１２Ａないし１２Ｄを集合的にＳＭＰ
ノード１２と呼ぶ。図の実施形態では、各ＳＭＰノード
１２は、複数のプロセッサと、外部キャッシュと、ＳＭ
Ｐバスと、メモリと、システム・インタフェースとを含
む。たとえば、ＳＭＰノード１２Ａは、プロセッサ１６
Ａないし１６Ｂを含む複数のプロセッサと共に構成され
る。プロセッサ１６は外部キャッシュ１８に接続され、
外部キャッシュ１８はさらにＳＭＰバス２０に結合され
る。また、メモリ２２およびシステム・インタフェース
２４はＳＭＰバス２０に結合される。さらに、ＳＭＰバ
ス２０に１つまたは複数の入出力（Ｉ／Ｏ）インタフェ
ース２６を結合することができる。入出力インタフェー
ス２６は、シリアル・ポートおよびパラレル・ポート、
ディスク・ドライブ、モデム、プリンタなどの周辺装置
とのインタフェースをとるために使用される。他のＳＭ
Ｐノード１２Ｂないし１２Ｄを同様に構成することがで
きる。

【００２１】一般的に言えば、所与のトランザクション
では、特定のＳＭＰノード１２は要求側ノードとして働
くことも、あるいはホーム・ノードとして働くことも、
あるいはスレーブ・ノードとして働くこともできる。要
求側ノードからホーム・ノードへ要求が送られると、ホ
ーム・ノードは、要求されたデータのキャッシュ済みコ
ピーを保持するスレーブ・ノードへ読取り要求または無
効化要求、あるいはその両方を送る。ホーム・ノードか
らスレーブ・ノードへのデマンドは、要求側エージェン
トが受け取ることを予期している応答の数を示す値を含
むので有利である。スレーブは、データと肯定応答のど
ちらかを用いて要求側ノードに応答する。各応答はさら
に、要求側が予期している応答の数を含むことができ
る。要求側ノードは、予期していたすべての応答を受け
取ると、トランザクションが完了したものとみなし、そ
の後の処理を継続することができる。このように、すべ
ての通信は、最大でキャッシュ・コヒーレンス・プロト
コルのクリティカル・パス上での３ホップ通信しか必要
としない。したがって、キャッシュ・コヒーレンス・プ
ロトコルの結果としての全体的なネットワーク・トラフ
ィックを削減できるので有利である。さらに、要求側ノ
ードがトランザクションを完了するためのクリティカル
・パスの待ち時間を短縮することができる。

【００２２】一実施形態では、要求側ノードは、予期し
ていたすべての応答を受け取った後、ホームへ完了メッ
セージを送ることができる。ホーム・ノードは次いで、
完了したトランザクションのコヒーレンシ単位上に置か
れた「ブロック」を削除することができる。

【００２３】要求側ノードは、さらに、あるいは別法と
して、スレーブ・ノードからデータを受け取った後、ホ
ーム・ノードへデータを送り、メモリ反映を行うことが
できる。さらに、ホーム・ノードは、要求されたデータ
を適当な状態、たとえばリード・ツー・オウン要求のた
めに共用された状態で含む場合、他のノードへデマンド
を送ることはない。その代わりに、ホーム・ノードは要
求側ノードに直接応答する。システム１０に関連する通
信プロトコルに関する詳細を下記でさらに与える。

【００２４】ここで使用されているように、メモリ動作
とは、データを発送元から宛先へ転送させる動作であ
る。発送元または宛先、あるいはその両方は、開始側内
の記憶位置でも、あるいはメモリ内の記憶位置でもよ
い。発送元または宛先は、メモリ内の記憶位置であると
き、メモリ動作と共に搬送されるアドレスを介して指定
される。メモリ動作は、読取り動作でも、あるいは書込
み動作でもよい。読取り動作では、データが開始側の外
側の発送元から開始側内の宛先へ転送される。逆に、書
込み動作では、データが開始側内の発送元から開始側の
外側の宛先へ転送される。図１に示したコンピュータ・
システムでは、メモリ動作は、ＳＭＰバス２０上の１つ
または複数のトランザクションと、ネットワーク１４上
の１つまたは複数のコヒーレンシ動作を含むことができ
る。

【００２５】各ＳＭＰノード１２は基本的に、メモリ２
２を共用メモリとして有するＳＭＰシステムである。プ
ロセッサ１６は、高性能プロセッサである。一実施形態
では、各プロセッサ１６は、ＳＰＡＲＣプロセッサ・ア
ーキテクチャのバージョン９に適合するＳＰＡＲＣプロ
セッサである。しかし、プロセッサ１６が任意のプロセ
ッサ・アーキテクチャを使用できることに留意された
い。

【００２６】通常、プロセッサ１６は、内部命令キャッ
シュと内部データ・キャッシュとを含む。したがって、
外部キャッシュ１８はＬ２キャッシュと呼ばれる（レベ
ル２を表す。内部キャッシュはレベル１キャッシュであ
る）。プロセッサ１６が内部キャッシュと共に構成され
ていない場合、外部キャッシュ１８はレベル１キャッシ
ュである。「レベル」の語が、特定のキャッシュがプロ
セッサ１６内の処理コアにどのくらい近接しているかを
識別するために使用されることに留意されたい。レベル
１は、処理コアに最も近く、レベル２は２番目に近く、
以下同様である。外部キャッシュ１８は、それに結合さ
れたプロセッサ１６から頻繁にアクセスされるメモリ・
アドレスに迅速にアクセスする。外部キャッシュ１８が
様々な特定のキャッシュ構成として構成できることに留
意されたい。たとえば、外部キャッシュ１８によってセ
ットアソシエーティブ構成または直接マップ構成を使用
することができる。

【００２７】ＳＭＰバス２０は、プロセッサ１６（キャ
ッシュ１８を通じた通信）とメモリ２２とシステム・イ
ンタフェース２４と入出力インタフェース２６との間の
通信に適応する。一実施形態では、ＳＭＰバス２０は、
アドレス・バスおよび関連する制御信号、ならびにデー
タ・バスおよび関連する制御信号を含む。アドレス・バ
スとデータ・バスが別々のものなので、ＳＭＰバス２０
上で分割トランザクション・バス・プロトコルを使用す
ることができる。一般的に言えば、分割トランザクショ
ン・バス・プロトコルは、アドレス・バス上で行われる
トランザクションが、データ・バス上で行われる並行ト
ランザクションとは異なるものでよいプロトコルであ
る。アドレスとデータを使用するトランザクションは、
アドレス・バス上でアドレスおよび関連する制御情報が
搬送されるアドレス・フェーズと、データ・バス上でデ
ータが搬送されるデータ・フェーズとを含む。特定のア
ドレス・フェーズに対応するデータ・フェーズの前に、
他のトランザクションに関する追加アドレス・フェーズ
または追加データ・フェーズ、あるいはその両方を開始
することができる。アドレス・フェーズと対応するデー
タ・フェーズは、多数の方法で相関付けることができ
る。たとえば、データ・トランザクションをアドレス・
トランザクションと同じ順序で行うことができる。別法
として、トランザクションのアドレス・フェーズとデー
タ・フェーズを固有のタグを介して識別することができ
る。

【００２８】メモリ２２は、プロセッサ１６によって使
用されるデータおよび命令コードを記憶するように構成
される。メモリ２２は、ダイナミック・ランダム・アク
セス・メモリ（ＤＲＡＭ）を備えることが好ましい。た
だし、任意のタイプのメモリを使用することができる。
メモリ２２は、他のＳＭＰノード１２内の図示した同様
なメモリと共に、分散共用メモリ・システムを形成す
る。分散共用メモリのアドレス空間の各アドレスは、そ
のアドレスのホーム・ノードと呼ばれる特定のノードに
割り当てられる。ホーム・ノードとは異なるノード内の
プロセッサは、ホーム・ノードのアドレスにあるデータ
にアクセスし、場合によってはデータをキャッシュする
ことができる。したがって、ＳＭＰノード１２どうしの
間と、特定のＳＭＰノード１２Ａないし１２Ｄ内のプロ
セッサ１６とキャッシュ１８との間に、コヒーレンシが
維持される。システム・インタフェース２４はノード間
コヒーレンシを与え、それに対してＳＭＰバス２０上の
スヌーピングはノード内コヒーレンシを与える。

【００２９】システム・インタフェース２４は、ノード
間コヒーレンシを維持するだけでなく、他のＳＭＰノー
ド１２との間のデータ転送を必要とするＳＭＰバス２０
上のアドレスを検出する。システム・インタフェース２
４は、転送を実行し、トランザクションのための対応す
るデータをＳＭＰバス２０上に与える。図の実施形態で
は、システム・インタフェース２４はポイント・ツー・
ポイント・ネットワーク１４に結合される。しかし、代
替実施形態では他のネットワークを使用できることに留
意されたい。ポイント・ツー・ポイント・ネットワーク
では、ネットワーク上の各ノード間に個別の接続が存在
する。特定のノードは、専用リンクを介して第２のノー
ドと直接通信する。特定のノードは、第３のノードと通
信するときは、第２のノードと通信するために使用した
リンクとは異なるリンクを使用する。

【００３０】図１では４つのＳＭＰノード１２が示され
ているが、任意の数のノードを使用するコンピュータ・
システム１０の実施形態が企図されることに留意された
い。

【００３１】図２Ａおよび２Ｂは、コンピュータ・シス
テム１０の一実施形態によってサポートされる分散メモ
リ・アーキテクチャの概念図である。具体的には、図２
Ａおよび２Ｂは、図１の各ＳＭＰノード１２がデータを
キャッシュしメモリ・アクセスを実行する代替方法を示
す。コンピュータ・システム１０がそのようなアクセス
をサポートする方法に関する詳細については、下記で詳
しく説明する。

【００３２】次に、図２Ａを参照すると、コンピュータ
・システム１０の一実施形態によってサポートされる第
１のメモリ・アーキテクチャ３０を示す論理図が示され
ている。アーキテクチャ３０は、複数のプロセッサ３２
Ａないし３２Ｄと、複数のキャッシュ３４Ａないし３４
Ｄと、複数のメモリ３６Ａないし３６Ｄと、相互接続ネ
ットワーク３８とを含む。複数のメモリ３６は分散共用
メモリを形成する。アドレス空間内の各アドレスは、１
つのメモリ３６内の位置に対応する。

【００３３】アーキテクチャ３０は非一様メモリ・アー
キテクチャ（ＮＵＭＡ）である。ＮＵＭＡアーキテクチ
ャでは、第１のメモリ・アドレスにアクセスするのに必
要な時間の長さが、第２のメモリ・アドレスにアクセス
するのに必要な時間の長さと大幅に異なることがある。
アクセス時間は、アクセスの開始側と、アクセスされた
データを記憶しているメモリ３６Ａないし３６Ｄの位置
に依存する。たとえば、プロセッサ３２Ａが、メモリ３
６Ａに記憶されている第１のメモリ・アドレスにアクセ
スする場合、このアクセス時間は、メモリ３６Ｂないし
３６Ｄのうちの１つに記憶されている第２のメモリ・ア
ドレスへのアクセスのアクセス時間よりもずっと短い。
すなわち、プロセッサ３２Ａによるメモリ３６Ａへのア
クセスはローカルに（たとえば、ネットワーク３８上で
の転送なしに）完了することができ、それに対してメモ
リ３６Ｂへのプロセッサ３２Ａアクセスはネットワーク
３８を介して実行される。通常、ネットワーク３８を通
じたアクセスは、ローカル・メモリ内で完了するアクセ
スよりも低速である。たとえば、ローカル・アクセスは
数百ナノ秒で完了することができ、それに対してネット
ワークを介したアクセスは数マイクロ秒を占有する可能
性がある。

【００３４】リモート・ノードに記憶されているアドレ
スに対応するデータは任意のキャッシュ３４にキャッシ
ュすることができる。しかし、キャッシュ３４がそのよ
うなリモート・アドレスに対応するデータを放棄した
後、リモート・アドレスへのその後のアクセスはネット
ワーク３８上での転送を介して完了する。

【００３５】ＮＵＭＡアーキテクチャは、主として特定
のローカル・メモリに対応するアドレスを使用するソフ
トウェア・アプリケーションに優れた性能特性を付与す
ることができる。一方、より多くのランダム・アクセス
・パターンを有し、メモリ・アクセスを特定のローカル
・メモリ内のアドレスに制限しないソフトウェア・アプ
リケーションは、特定のプロセッサ３２がリモート・ノ
ードへの反復アクセスを実行するときに大量のネットワ
ーク・トラフィックを経験する。

【００３６】次に図２Ｂを参照すると、図１のコンピュ
ータ・システム１０によってサポートされる第２のメモ
リ・アーキテクチャ４０を示す論理図が示されている。
アーキテクチャ４０は、複数のプロセッサ４２Ａないし
４２Ｄと、複数のキャッシュ４４Ａないし４４Ｄと、複
数のメモリ４６Ａないし４６Ｄと、ネットワーク４８と
を含む。しかし、メモリ４６はキャッシュ４４とネット
ワーク４８との間に論理的に結合される。メモリ４６
は、より大規模なキャッシュ（たとえば、レベル３のキ
ャッシュ）として働き、対応するプロセッサ４２からア
クセスされるアドレスを記憶する。メモリ４６は、対応
するプロセッサ４２から作用を受けているデータを「ア
トラクトする」と言われる。図２Ａに示したＮＵＭＡア
ーキテクチャとは異なり、アーキテクチャ４０は、ロー
カル・プロセッサがリモート・データにアクセスする際
にリモート・データをローカル・メモリに記憶すること
によってネットワーク４８上のアクセスの数を低減させ
る。

【００３７】アーキテクチャ４０をキャッシュ専用メモ
リ・アーキテクチャ（ＣＯＭＡ）と呼ぶ。メモリ４６の
組合せで形成された分散共用メモリ内の複数の位置は、
特定のアドレスに対応するデータを記憶することができ
る。特定の記憶位置に特定のアドレスの永久的なマッピ
ングが割り当てられることはない。その代わり、特定の
アドレスに対応するデータを記憶する位置は、その特定
のアドレスにアクセスするプロセッサ４２に基づいて動
的に変化する。逆に、ＮＵＭＡアーキテクチャでは、メ
モリ４６内の特定の記憶位置が特定のアドレスに割り当
てられる。アーキテクチャ４０は、アーキテクチャ上で
実行中のアプリケーションによって実行されるメモリ・
アクセス・パターンに調整し、メモリ４６どうしの間で
コヒーレンシが維持される。

【００３８】好ましい実施形態では、コンピュータ・シ
ステム１０は、図２Ａおよび２Ｂに示した両方のメモリ
・アーキテクチャをサポートする。具体的には、メモリ
・アドレスに、１つのＳＭＰノード１２Ａないし１２Ｄ
からＮＵＭＡ方式でアクセスし、同時に他のＳＭＰノー
ド１２Ａないし１２ＤからＣＯＭＡ方式でアクセスする
ことができる。一実施形態では、ＳＭＰバス２０上のア
ドレスのあるビットが、他のＳＭＰノード１２を、与え
られたアドレスのホーム・ノードとして識別している場
合に、ＮＵＭＡアクセスが検出される。そうでない場合
は、ＣＯＭＡアクセスが仮定される。他の詳細を下記に
与える。

【００３９】一実施形態では、ＣＯＭＡアーキテクチャ
は、ハードウェア技法とソフトウェア技法の組合せを使
用して実施される。ハードウェアは、ページのローカル
にキャッシュされたコピー間のコヒーレンシを維持し、
ソフトウェア（たとえば、コンピュータ・システム１０
で使用されるオペレーティング・システム）は、キャッ
シュされたページを割り振り、割り振り解除する責任を
負う。

【００４０】図３は、一般に、図１に示したＳＭＰノー
ド１２Ａに適合する、ＳＭＰノード１２Ａの一実施形態
の詳細を示す。他のノード１２も同様に構成することが
できる。図１の各ＳＭＰノード１２の特定の代替実施形
態も可能であることに留意されたい。図３に示したＳＭ
Ｐノード１２Ａの実施形態は、サブノード５０Ａやサブ
ノード５０Ｂなど複数のサブノードを含む。各サブノー
ド５０は、２つのプロセッサ１６および対応するキャッ
シュ１８と、メモリ部分５６と、アドレス・コントロー
ラ５２と、データ・コントローラ５４とを含む。サブノ
ード５０内のメモリ部分５６は集合的に、図１のＳＭＰ
ノード１２Ａのメモリ２２を形成する。他のサブノード
（図示せず）はさらに、ＳＭＰバス２０に結合され入出
力インタフェース２６を形成する。

【００４１】図３に示したように、ＳＭＰバス２０は、
アドレス・バス５８とデータ・バス６０とを含む。アド
レス・コントローラ５２はアドレス・バス５８に結合さ
れ、データ・コントローラ５４はデータ・バス６０に結
合される。図３は、システム・インタフェース論理ブロ
ック６２と、変換記憶域６４と、ディレクトリ６６と、
メモリ・タグ（ＭＴＡＧ）６８とを含むシステム・イン
タフェース２４も示す。論理ブロック６２は、アドレス
・バス５８とデータ・バス６０の両方に結合され、下記
で詳しく説明するようにある種の状況でアドレス・バス
５８上で無視信号７０をアサートする。論理ブロック６
２は、変換記憶域６４、ディレクトリ６６、ＭＴＡＧ６
８、ネットワーク１４にも結合される。

【００４２】図３の実施形態では、各サブノード５０
は、ＳＭＰバス２０が配置されたバックプレーンに挿入
できるプリント回路ボード上に構成される。このよう
に、ＳＭＰノード１２内に含まれるプロセッサまたは入
出力インタフェース２６あるいはその両方の数は、サブ
ノード５０を挿入しあるいは取り外すことによって変更
することができる。たとえば、コンピュータ・システム
１０は最初、少数のサブノード５０と共に構成すること
ができる。コンピュータ・システム１０のユーザが必要
とするコンピューティング・パワーが増大するにつれて
必要に応じて追加サブノード５０を追加することができ
る。

【００４３】アドレス・コントローラ５２は、キャッシ
ュ１８とＳＭＰ２０のアドレス部分との間のインタフェ
ースを形成する。図の実施形態では、アドレス・コント
ローラ５２は、出力待ち行列７２といくつかの入力待ち
行列７４とを含む。出力待ち行列７２は、アドレス・コ
ントローラ５２がアドレス・バス５８へのアクセスを許
可されるまで出力待ち行列に接続されたプロセッサから
のトランザクションをバッファする。アドレス・コント
ローラ５２は、出力待ち行列７２に記憶されているトラ
ンザクションを、それらが出力待ち行列７２に入れられ
た順に実行する（すなわち、出力待ち行列７２はＦＩＦ
Ｏ待ち行列である）。アドレス・コントローラ５２によ
って実行されるトランザクション、ならびにキャッシュ
１８およびプロセッサ１６の内部のキャッシュによって
スヌープされるアドレス・バス５８から受け取られるト
ランザクションは、入力待ち行列７４に入れられる。

【００４４】出力待ち行列７２と同様に、入力待ち行列
７４はＦＩＦＯ待ち行列である。すべてのアドレス・ト
ランザクションは、各サブノード５０の入力待ち行列７
４（場合によっては、アドレス・トランザクションを開
始したサブノード５０の入力待ち行列７４内）に記憶さ
れる。したがって、アドレス・トランザクションは、ス
ヌーピングのために、アドレス・トランザクションがア
ドレス・バス５８上で行われる順にキャッシュ１８およ
びプロセッサ１６に与えられる。トランザクションがア
ドレス・バス５８上で行われる順序は、ＳＭＰノード１
２Ａの順序である。しかし、完全なシステムは１つのグ
ローバル・メモリ順序を有することが予期される。この
ように順序が予期されるため、ネットワーク１４上の動
作の順序によってグローバル順序を確立する必要がある
ので、コンピュータ・システム１０が使用するＮＵＭＡ
アーキテクチャとＣＯＭＡアーキテクチャの両方で問題
が生じる。２つのノードがあるアドレスに対するトラン
ザクションを実行する場合、そのアドレスのホーム・ノ
ードで対応するコヒーレンシ動作が行われる順序は、各
ノード内で見られる２つのトランザクションの順序を定
義する。たとえば、同じアドレスに対して２つの書込み
トランザクションが実行される場合、そのアドレスのホ
ーム・ノードに２番目に到着する書込み動作は２番目に
完了する書込みトランザクションであるべきである（す
なわち、両方の書込みトランザクションによって更新さ
れるバイト位置は、両方のトランザクションの完了時に
第２の書込みトランザクションから与えられる値を記憶
する）。しかし、第２のトランザクションを実行するノ
ードは実際には、ＳＭＰバス２０上で最初に第２のトラ
ンザクションを行わせることができる。無視信号７０に
よって、ＳＭＰノード１２の残りの部分が第２のトラン
ザクションに反応することなしに、第２のトランザクシ
ョンをシステム・インタフェース２４へ転送することが
できる。

【００４５】したがって、システム・インタフェース論
理ブロック６２は、アドレス・コントローラ５２の出力
待ち行列／入力待ち行列構造によって課される順序付け
制約と共に効果的に動作するために、無視信号７０を使
用する。アドレス・バス５８上にトランザクションが与
えられ、システム・インタフェース論理ブロック６２
が、このトランザクションに応答してリモート・トラン
ザクションを実行すべきであることを検出すると、論理
ブロック６２は無視信号７０をアサートする。あるトラ
ンザクションに対して無視信号７０をアサートすると、
アドレス・コントローラ５２は入力待ち行列７４へのそ
のトランザクションの格納を抑制する。したがって、無
視されたトランザクションに続いて行われ、ＳＭＰノー
ド１２Ａ内でローカルに完了する他のトランザクション
は、入力待ち行列７４の順序付け規則を破らずに、無視
されたトランザクションに対して所定の順序とは異なる
順序で完了することができる。具体的には、ネットワー
ク１４上のコヒーレンシ活動に応答してシステム・イン
タフェース２４によって実行されるトランザクション
を、無視されたトランザクションの後に続けて実行し完
了することができる。リモート・トランザクションから
応答が受け取られたときに、システム・インタフェース
論理ブロック６２によって、無視されたトランザクショ
ンをアドレス・バス５８上で再発行することができる。
それによって、トランザクションは、入力待ち行列７４
に入れられ、再発行時に行われるトランザクションと共
に順序正しく完了することができる。

【００４６】一実施形態では、特定のアドレス・コント
ローラ５２からのトランザクションが無視された後、そ
の特定のアドレス・コントローラ５２からのその後のコ
ヒーレント・トランザクションも無視される。特定のプ
ロセッサ１６からのトランザクションは、アドレス・バ
ス５８上に与えられることによって課される順序付け要
件にはかかわらず、互いに重要な順序付け関係を有する
ことができる。たとえば、トランザクションは、ＳＰＡ
ＲＣアーキテクチャに含まれるＭＥＭＢＡＲ命令などの
メモリ同期命令によって他のトランザクションから分離
することができる。プロセッサ１６は、トランザクショ
ンを、それらが互いに実行される順に搬送する。トラン
ザクションは、出力待ち行列７２内で順序付けされ、し
たがって、特定の出力待ち行列７２から発行されるトラ
ンザクションは順序正しく実行されるはずである。特定
のアドレス・コントローラ５２からのその後のトランザ
クションを無視することによって、特定の出力待ち行列
７２に関するインオーダー規則を保存することができ
る。さらに、特定のプロセッサからのすべてのトランザ
クションを順序付けなくて済むことに留意されたい。し
かし、アドレス・バス５８上で、どのトランザクション
を順序付けなければならないかと、どのトランザクショ
ンを順序付けなくてもよいかを判定することは困難であ
る。したがって、この実施形態で、論理ブロック６２は
特定の出力待ち行列７２からのすべてのトランザクショ
ンの順序を維持する。この規則の例外を許容するサブノ
ード５０の他の実施形態が可能であることに留意された
い。

【００４７】データ・コントローラ５４は、データ・バ
ス６０、メモリ部分５６、キャッシュ１８との間でデー
タをルーティングする。データ・コントローラ５４は、
アドレス・コントローラ５２と同様な入力待ち行列と出
力待ち行列とを含むことができる。一実施形態では、デ
ータ・コントローラ５４は、バイト・スライス・バス構
成の複数の物理装置を使用する。

【００４８】図３に示したプロセッサ１６は、メモリ管
理装置（ＭＭＵ）７６Ａないし７６Ｂを含む。ＭＭＵ７
６は、プロセッサ１６上で実行される命令コードによっ
て生成されたデータ・アドレスと、命令アドレスに対し
て、仮想アドレス・物理アドレス変換を実行する。命令
の実行に応答して生成されるアドレスは仮想アドレスで
ある。言い換えれば、仮想アドレスは、命令コードのプ
ログラマによって作成されるアドレスである。仮想アド
レスは（ＭＭＵ７６内で具体化される）アドレス変換機
構を通過し、アドレス変換機構から対応する物理アドレ
スが作成される。物理アドレスは、メモリ２２内の記憶
位置を識別する。

【００４９】アドレス変換は多数の理由で実行される。
たとえば、アドレス変換機構を使用して、あるメモリ・
アドレスに対する特定のコンピューティング・タスクの
アクセスを許可または拒否することができる。このよう
に、あるコンピューティング・タスク内のデータおよび
命令は、他のコンピューティング・タスクのデータおよ
び命令から分離される。また、コンピューティング・タ
スクのデータおよび命令の各部分は、ハード・ディスク
・ドライブに「ページアウト」することができる。ある
部分がページアウトされると、その変換は無効化され
る。コンピューティング・タスクによるその部分へのア
クセス時には、変換が失敗しているために割り込みが行
われる。この割り込みによって、オペレーティング・シ
ステムは、ハード・ディスク・ドライブから対応する情
報を検索することができる。このように、メモリ２２内
の実際のメモリよりも多くの仮想メモリを使用すること
ができる。仮想メモリの他の多くの用途が良く知られて
いる。

【００５０】再び、図１に示したコンピュータ・システ
ム１０を、図３に示したＳＭＰノード１２Ａ実施形態と
共に参照すると分かるように、ＭＭＵ７６によって算出
される物理アドレスは、プロセッサ１６が配置されたＳ
ＭＰノード１２に関連付けられたメモリ２２内の位置を
定義するローカル物理アドレス（ＬＰＡ）である。ＭＴ
ＡＧ６８は、メモリ２２内の各「コヒーレンシ単位」ご
とにコヒーレンシ状態を記憶する。ＳＭＰバス２０上で
アドレス変換が実行されると、システム・インタフェー
ス論理ブロック６２は、アクセスされたコヒーレンシ単
位に関する、ＭＴＡＧ６８に記憶されているコヒーレン
シ状態を調べる。ＳＭＰノード１２がこのアクセスを実
行するのに十分な、このコヒーレンシ単位へのアクセス
権を有することをコヒーレンシ状態が示している場合、
アドレス変換は続行する。しかし、トランザクションを
完了する前にコヒーレンシ活動を実行すべきであること
をコヒーレンシ状態が示している場合、システム・イン
タフェース論理ブロック６２は無視信号７０をアサート
する。論理ブロック６２は、ネットワーク１４上でコヒ
ーレンシ動作を実行し、適当なコヒーレンシ状態を得
る。適当なコヒーレンシ状態が得られると、論理ブロッ
ク６２は、無視されたトランザクションをＳＭＰバス２
０上で再発行する。それに続いて、トランザクションが
完了する。

【００５１】一般的に言えば、特定の記憶位置（たとえ
ば、キャッシュまたはメモリ２２）でコヒーレンシ単位
に関して維持されるコヒーレンシ状態は、そのＳＭＰノ
ード１２でのコヒーレンシ単位へのアクセス権を示す。
このアクセス権は、コヒーレンシ単位の妥当性と、その
ＳＭＰノード１２内でコヒーレンシ単位のコピーに対し
て与えられている読取り／書込み許可を示す。一実施形
態では、コンピュータ・システム１０によって使用され
るコヒーレンシ状態は、修正、所有、共用、無効であ
る。修正状態は、ＳＭＰノード１２が対応するコヒーレ
ンシ単位を更新したことを示す。したがって、他のＳＭ
Ｐノード１２はこのコヒーレンシ単位のコピーを有さな
い。また、修正されたコヒーレンシ単位は、ＳＭＰノー
ド１２から放棄されると、再びホーム・ノードに記憶さ
れる。所有状態は、このコヒーレンシ単位に対してＳＭ
Ｐノード１２が責任を負うが、他のＳＭＰノード１２が
コピーを共用している可能性があることを示す。この場
合も、コヒーレンシ単位は、ＳＭＰノード１２から放棄
されると、再びホーム・ノードに記憶される。共用状態
は、ＳＭＰノード１２がコヒーレンシ単位を読み取るこ
とはできるが、所有状態を得ないかぎり更新することは
できないことを示す。また、他のＳＭＰノード１２もこ
のコヒーレンシ単位のコピーを有する可能性がある。最
後に、無効状態は、ＳＭＰノード１２がコヒーレンシ単
位のコピーを有さないことを示す。一実施形態では、修
正状態は、書込み許可を示すが、無効状態を除く状態
は、対応するコヒーレンシ単位への読取り許可を示す。

【００５２】本明細書では、コヒーレンシ単位は、コヒ
ーレンシのために単位とみなされるメモリのいくつかの
連続バイトである。たとえば、コヒーレンシ単位内の１
バイトが更新された場合、コヒーレンシ単位全体が更新
されたとみなされる。特定の一実施形態では、コヒーレ
ンシ単位はキャッシュ・ラインであり、連続６４バイト
を備える。しかし、コヒーレンシ単位が任意の数のバイ
トを備えることができることが理解されよう。

【００５３】システム・インタフェース２４は、変換記
憶域６４を使用してローカル物理アドレスからグローバ
ル・アドレス（ＧＡ）への変換を記憶する変換機構も含
む。グローバル・アドレス内のあるビットは、そのグロ
ーバル・アドレスに関するコヒーレンシ情報が記憶され
ているアドレスのホーム・ノードを識別する。たとえ
ば、コンピュータ・システム１０の実施形態は、図１の
ＳＭＰノードなど４つのＳＭＰノード１２を使用するこ
とができる。そのような実施形態では、グローバル・ア
ドレスの２ビットがホーム・ノードを識別する。グロー
バル・アドレスの最上位部分のビットはホーム・ノード
を識別するために使用されることが好ましい。同じビッ
トが、ローカル物理アドレスではＮＵＭＡアクセスを識
別するために使用される。ＬＰＡのビットが、ローカル
・ノードがホーム・ノードではないことを示す場合、そ
のＬＰＡはグローバル・アドレスであり、トランザクシ
ョンはＮＵＭＡモードで実行される。したがって、オペ
レーティング・システムは、ＮＵＭＡタイプ・ページの
場合はＭＭＵ７６にグローバル・アドレスを置く。逆
に、オペレーティング・システムは、ＣＯＭＡタイプ・
ページの場合にはＭＭＵ７６にＬＰＡを置く。ＬＰＡ
が、ＧＡに等しくてよい（ホームが、ＬＰＡが与えられ
たノードのメモリ２２内にある、ＮＵＭＡアドレスなら
びにグローバル・アドレスの場合）ことに留意された
い。また、ＬＰＡは、他のＳＭＰノード１２にホームを
有するデータのコピーを記憶するために使用される記憶
位置を識別するときはＧＡに変換することができる。

【００５４】特定のホーム・ノードのディレクトリ６６
は、どのＳＭＰノード１２が、コピー間のコヒーレンシ
が維持できるようにホーム・ノードに割り当てられた所
与のグローバル・アドレスに対応するデータのコピーを
有するかを識別する。また、ホーム・ノードのディレク
トリ６６は、コヒーレンシ単位を所有するＳＭＰノード
１２を識別する。したがって、キャッシュ１８とプロセ
ッサ１６との間のローカル・コヒーレンシはスヌーピン
グを介して維持され、それに対してシステム・ワイド
（またはグローバル）コヒーレンシはＭＴＡＧ６８およ
びディレクトリ６６を使用して維持される。ディレクト
リ６６は、ＳＭＰノード１２Ａに割り当てられた（すな
わち、ＳＭＰノード１２Ａがホーム・ノードである）コ
ヒーレンシ単位に対応するコヒーレンシ情報を記憶す
る。

【００５５】図３の実施形態では、ディレクトリ６６お
よびＭＴＡＧ６８が各コヒーレンシ単位ごとに情報を記
憶することに留意されたい。逆に、変換記憶域６４は、
ページに関して定義されたローカル物理・グローバル変
換を記憶する。ページは、複数のコヒーレンシ単位を含
み、通常、サイズが数キロバイト、あるいは場合によっ
ては数メガバイトである。

【００５６】したがって、ソフトウェアは、ページごと
にローカル物理アドレス／グローバル・アドレス変換を
作成する。それによって、リモートに記憶されているグ
ローバル・ページのコピーを記憶するローカル・メモリ
・ページを割り振る。したがって、メモリ２２のブロッ
クはページごとにも特定のグローバル・アドレスに割り
振られる。しかし、前述のように、コヒーレンシ状態お
よびコヒーレンシ活動はコヒーレンシ単位上で実行され
る。したがって、メモリの特定のグローバル・アドレス
にページが割り振られたときに、ページに対応するデー
タは必ずしも、割り振られたメモリへ転送されるわけで
はない。その代わり、プロセッサ１６がページ内の様々
なコヒーレンシ単位にアクセスすると、それらのコヒー
レンシ単位はコヒーレンシ単位の所有者から転送され
る。このように、ＳＭＰノード１２Ａから実際にアクセ
スされたデータは、対応するメモリ２２へ転送される。
ＳＭＰノード１２Ａからアクセスされないデータは転送
できず、そのため、メモリ２２内のページの割り振り時
にデータのページを転送する実施形態と比べてネットワ
ーク１４上の全体的な帯域幅使用度が低減する。

【００５７】一実施形態では、変換記憶域６４、または
ディレクトリ６６、またはＭＴＡＧ６８、あるいはそれ
らの組合せはそれぞれ、関連する変換、ディレクトリ、
ＭＴＡＧ情報の一部しか記憶しないキャッシュでよいこ
とに留意されたい。変換、ディレクトリ、ＭＴＡＧ情報
の全体は、メモリ２２内のテーブルまたは専用メモリ記
憶域（図示せず）に記憶される。アクセスに必要な情報
が、対応するキャッシュにない場合、テーブルはシステ
ム・インタフェース２４からアクセスされる。

【００５８】次に、図４を参照すると、例示的なディレ
クトリ・エントリ７１が示されている。ディレクトリ・
エントリ７１は、図３に示したディレクトリ６６の一実
施形態によって使用することができる。ディレクトリ６
６の他の実施形態は、異なるディレクトリ・エントリを
使用することができる。ディレクトリ・エントリ７１
は、有効ビット７３と、書き直しビット７５と、所有者
フィールド７７と、共用者フィールド７９とを含む。デ
ィレクトリ・エントリ７１は、ディレクトリ・エントリ
のテーブル内に存在し、対応するコヒーレンシ単位を識
別するグローバル・アドレスを介してテーブル内に配置
される。具体的には、コヒーレンシ単位に関連付けられ
たディレクトリ・エントリ７１は、コヒーレンシ単位を
識別するグローバル・アドレスで形成されたオフセット
位置にあるディレクトリ・エントリのテーブル内に記憶
される。

【００５９】有効ビット７３は、セットされると、ディ
レクトリ・エントリ７１が有効である（すなわち、その
ディレクトリ・エントリ７１は、対応するコヒーレンシ
単位に関するコヒーレンシ情報を記憶している）ことを
示す。有効ビット７３は、クリアされると、そのディレ
クトリ・エントリ７１が無効であることを示す。

【００６０】所有者フィールド７７は、１つのＳＭＰノ
ード１２をコヒーレンシ単位の所有者として識別する。
所有側ＳＭＰノード１２Ａないし１２Ｄは、コヒーレン
シ単位を修正状態と所有状態のどちらかで維持する。通
常、所有側ＳＭＰノード１２Ａないし１２Ｄは、コヒー
レンシ単位を修正状態で得る（下記の図１８を参照され
たい）。それに続いて、所有側ＳＭＰノード１２Ａない
し１２Ｄは、コヒーレンシ単位のコピーを他のＳＭＰノ
ード１２Ａないし１２Ｄに与える際に所有状態に遷移す
ることができる。他のＳＭＰノード１２Ａないし１２Ｄ
はコヒーレンシ単位を共用状態で得る。一実施形態で
は、所有者フィールド７７は、４つのＳＭＰノード１２
Ａないし１２Ｄのうちの１つをコヒーレンシ単位の所有
者として識別するようにコード化された２つのビットを
備える。

【００６１】共用者フィールド７９は、各ＳＭＰノード
１２Ａないし１２Ｄに割り当てられた１つのビットを含
む。ＳＭＰノード１２Ａないし１２Ｄがコヒーレンシ単
位の共用コピーを維持している場合、共用者フィールド
７９内の対応するビットがセットされる。逆に、ＳＭＰ
ノード１２Ａないし１２Ｄがコヒーレンシ単位の共用コ
ピーを維持していない場合、共用者フィールド７９内の
対応するビットはクリアされる。このように、共用者フ
ィールド７９は、図１のコンピュータ・システム１０内
に存在するコヒーレンシ単位のすべての共用コピーを示
す。

【００６２】書き直しビット７５は、セットされると、
所有者フィールド７７を介してコヒーレンシ単位の所有
者として識別されたＳＭＰノード１２Ａないし１２Ｄが
コヒーレンシ単位の更新済みコピーをホームＳＭＰノー
ド１２に書き込んだことを示す。ビット７５は、クリア
されると、所有側ＳＭＰノード１２Ａないし１２Ｄがコ
ヒーレンシ単位の更新済みコピーをホームＳＭＰノード
１２Ａないし１２Ｄに書き込んでいないことを示す。

【００６３】次に図５を参照すると、システム・インタ
フェース２４の一実施形態のブロック図が示されてい
る。図５に示したように、システム・インタフェース２
４は、ディレクトリ６６と、変換記憶域６４と、ＭＴＡ
Ｇ６８とを含む。変換記憶域６４は、グローバル・アド
レス・ローカル物理アドレス（ＧＡ２ＬＰＡ）変換装置
８０およびローカル物理アドレス・グローバル・アドレ
ス（ＬＰＡ２ＧＡ）変換装置８２として示されている。

【００６４】システム・インタフェース２４は、ＳＭＰ
バス２０またはネットワーク１４上で実行すべきトラン
ザクションを記憶するための入力待ち行列と出力待ち行
列も含む。具体的には、図の実施形態では、システム・
インタフェース２４は、ヘッダ・パケットをネットワー
ク１４との間でバッファするための入力ヘッダ待ち行列
８４と出力ヘッダ待ち行列８６とを含む。ヘッダ・パケ
ットは、実行すべき動作を識別し、その後に続くデータ
・パケットの数およびフォーマットを指定する。出力ヘ
ッダ待ち行列８６は、ネットワーク１４上で送るべきヘ
ッダ・パケットをバッファし、入力ヘッダ待ち行列８４
は、システム・インタフェース２４が、受け取ったヘッ
ダ・パケットを処理するまで、ネットワーク１４から受
け取ったヘッダ・パケットをバッファする。同様に、デ
ータ・パケットは、データがそれぞれ、ＳＭＰデータ・
バス６０およびネットワーク１４上で転送されるまで入
力データ待ち行列８８および出力データ待ち行列９０に
バッファされる。

【００６５】ＳＭＰ出力待ち行列９２、ＳＭＰ入力待ち
行列９４、ＳＭＰ入出力入力待ち行列（ＰＩＱ）９６
は、アドレス・バス５８との間でアドレス・トランザク
ションをバッファするために使用される。ＳＭＰ出力待
ち行列９２は、アドレス・バス５８上のシステム・イン
タフェース２４から与えられるトランザクションをバッ
ファする。無視されたトランザクションに関するコヒー
レンシ活動の完了に応答して待機させられた再発行トラ
ンザクションは、ＳＭＰ出力待ち行列９２にバッファさ
れる。また、ネットワーク１４から受け取られたコヒー
レンシ活動に応答して生成されたトランザクションは、
ＳＭＰ出力待ち行列９２にバッファされる。ＳＭＰ入力
待ち行列９４は、システム・インタフェース２４によっ
て処理されるコヒーレンシ関連トランザクションを記憶
する。逆にＳＭＰＰＩＱ９６は、他のＳＭＰノード１
２に存在する入出力インタフェースへ搬送される入出力
トランザクションを記憶する。入出力トランザクション
は一般に、非コヒーレントとみなされ、したがってコヒ
ーレンシ活動を生成しない。

【００６６】ＳＭＰ入力待ち行列９４およびＳＭＰＰ
ＩＱ９６は、トランザクション・フィルタ９８から、待
機させるべきトランザクションを受け取る。トランザク
ション・フィルタ９８はＭＴＡＧ６８およびＳＭＰアド
レス・バス５８に結合される。トランザクション・フィ
ルタ９８は、他のＳＭＰノード１２上の入出力インタフ
ェースを識別する入出力トランザクションをアドレス・
バス５８上で検出した場合、そのトランザクションをＳ
ＭＰＰＩＱ９６に入れる。ＬＰＡアドレスへのコヒー
レント・トランザクションがトランザクション・フィル
タ９８によって検出された場合、ＭＴＡＧ６８から得た
対応するコヒーレンシ状態が調べられる。トランザクシ
ョン・フィルタ９８は、コヒーレンシ状態に応じて、無
視信号７０をアサートすることができ、コヒーレンシ・
トランザクションをＳＭＰ入力待ち行列９４で待機させ
ることができる。コヒーレント・トランザクションを実
行するのに十分な、コヒーレンシ単位へのアクセス権
が、ＳＭＰノード１２Ａによって維持されていないこと
をＭＴＡＧ６８が示している場合には、無視信号７０が
アサートされ、コヒーレンシ・トランザクションが待機
させられる。逆に、ＳＭＰノード１２Ａによって十分な
アクセス権が維持されていることをＭＴＡＧ６８が示し
ている場合、無視信号７０がアサート解除されコヒーレ
ンシ・トランザクションは生成されない。

【００６７】ＳＭＰ入力待ち行列９４およびＳＭＰＰ
ＩＱ９６からのトランザクションは、システム・インタ
フェース２４内の要求エージェント１００によって処理
される。ＬＰＡ２ＧＡ変換装置８２は、要求エージェン
ト１００による動作の前に、トランザクションのアドレ
ス（ＬＰＡアドレスである場合）を、ＳＭＰアドレス・
バス５８上に与えられるローカル物理アドレスから、対
応するグローバル・アドレスに変換する。要求エージェ
ント１００は次いで、グローバル・アドレスによって識
別されたホーム・ノードへ送られる特定のコヒーレンシ
要求を指定するヘッダ・パケットを生成する。このコヒ
ーレンシ要求は出力ヘッダ待ち行列８６に入れられる。
それに続いて、コヒーレンシ応答が入力ヘッダ待ち行列
８４で受け取られる。要求エージェント１００は、入力
ヘッダ待ち行列８４から得たコヒーレンシ応答を処理
し、場合によっては（下記で説明するように）ＳＭＰ出
力待ち行列９２に関する再発行トランザクションを生成
する。

【００６８】システム・インタフェース２４には、ホー
ム・エージェント１０２とスレーブ・エージェント１０
４とが含まれる。ホーム・エージェント１０２は、入力
ヘッダ待ち行列８４から受け取ったコヒーレンシ要求を
処理する。ホーム・エージェント１０２は、特定のグロ
ーバル・アドレスに関してディレクトリ６６に記憶され
ているコヒーレンシ情報から、他のＳＭＰノード１２内
の１つまたは複数のスレーブ・エージェントへコヒーレ
ンシ・デマンドを送るべきかどうかを判定する。一実施
形態では、ホーム・エージェント１０２は、影響を受け
るコヒーレンシ単位に対応するコヒーレンシ情報をブロ
ックする。言い換えれば、そのコヒーレンシ単位に関連
するその後の要求は、コヒーレンシ要求に対応するコヒ
ーレンシ活動が完了するまで実行されない。一実施形態
によれば、ホーム・エージェント１０２は、（入力ヘッ
ダ待ち行列８４を介して）コヒーレンシ要求を開始した
要求エージェントからコヒーレンシ完了を受け取る。コ
ヒーレンシ完了は、コヒーレンシ活動が完了したことを
示す。ホーム・エージェント１０２は、コヒーレンシ完
了を受け取ると、影響を受けるコヒーレンシ単位に対応
するコヒーレンシ情報上のブロックを削除する。コヒー
レンシ情報がコヒーレンシ活動が完了するまでブロック
されるので、ホーム・エージェント１０２が、コヒーレ
ンシ要求の受取時にただちに実行されたコヒーレンシ活
動に応じてコヒーレンシ情報を更新できることに留意さ
れたい。

【００６９】スレーブ・エージェント１０４は、コヒー
レンシ・デマンドを入力ヘッダ待ち行列８４を介して他
のＳＭＰノード１２のホーム・エージェントから受け取
る。スレーブ・エージェント１０４は、特定のコヒーレ
ンシ・デマンドに応答して、コヒーレンシ・トランザク
ションをＳＭＰ出力待ち行列９２で待機させる。一実施
形態では、コヒーレンシ・トランザクションによって、
キャッシュ１８およびプロセッサ１６の内部のキャッシ
ュは、影響を受けるコヒーレンシ単位を無効化すること
ができる。コヒーレンシ単位がキャッシュ内で修正され
た場合、修正済みデータはシステム・インタフェース２
４へ転送される。別法として、コヒーレンシ・トランザ
クションによって、キャッシュ１８およびプロセッサ１
６の内部のキャッシュは、コヒーレンシ単位のコヒーレ
ンシ状態を共用に変更することができる。スレーブ・エ
ージェント１０４は、コヒーレンシ・デマンドに応答し
て活動を完了した後、コヒーレンシ・デマンドに対応す
るコヒーレンシ要求を開始した要求エージェントへコヒ
ーレンシ応答を送る。コヒーレンシ応答は出力ヘッダ待
ち行列８６で待機させられる。コヒーレンシ・デマンド
に応答して活動を実行する前に、コヒーレンシ・デマン
ドと共に受け取られたグローバル・アドレスがＧＡ２Ｌ
ＰＡ変換装置８０を介してローカル物理アドレスに変換
される。

【００７０】一実施形態によれば、要求エージェント１
００、ホーム・エージェント１０２、スレーブ・エージ
ェント１０４によって実行されるコヒーレンシ・プロト
コルは書込み無効化ポリシーを含む。言い換えれば、Ｓ
ＭＰノード１２内のプロセッサ１６があるコヒーレンシ
単位を更新すると、他のＳＭＰノード１２内に記憶され
ているそのコヒーレンシ単位のコピーは無効化される。
しかし、他の実施形態では他の書込みポリシーを使用す
ることができる。たとえば、書込み更新ポリシーを使用
することができる。書込み更新ポリシーによれば、ある
コヒーレンシ単位が更新されると、更新済みデータは各
ＳＭＰノード１２に記憶されているそのコヒーレンシ単
位の各コピーへ送られる。

【００７１】次に図６を参照すると、要求エージェント
１００に対応するＳＭＰノード１２内のＳＭＰバス２０
上の特定のトランザクションに応答して、第１のＳＭＰ
ノード１２Ａないし１２Ｄ（「要求側ノード」）の要求
エージェント１００と第２のＳＭＰノード１２Ａないし
１２Ｄ（「ホーム・ノード」）のホーム・エージェント
１０２と第３のＳＭＰノード１２Ａないし１２Ｄ（「ス
レーブ・ノード」）のスレーブ・エージェント１０４と
の間で実行される通常のコヒーレンシ活動を示す図が示
されている。図１に示すようなコンピュータ・システム
１０の一実施形態によって使用される特定のコヒーレン
シ活動を、下記で図１４ないし１８に関して詳しく説明
する。この説明の残りの部分全体にわたって、参照符号
１００、１０２、１０４は、要求エージェント、ホーム
・エージェント、スレーブ・エージェントを識別するた
めに使用される。エージェントが他のエージェントと通
信する際、２つのエージェントがそれぞれの異なるＳＭ
Ｐノード１２Ａないし１２Ｄに存在することが多いこと
を理解されたい。

【００７２】要求エージェント１００は、ＳＭＰバス２
０からトランザクションを受け取ると、トランザクショ
ンに適したコヒーレンシ要求を形成し、トランザクショ
ンのアドレスに対応するホーム・ノードへコヒーレンシ
要求を送る（参照符号１１０）。コヒーレンシ要求は、
要求エージェント１００から要求されたアクセス権なら
びに影響を受けるコヒーレンシ単位のグローバル・アド
レスを示す。要求されたアクセス権は、要求エージェン
ト１００に対応するＳＭＰノード１２で試みられている
トランザクションの実行を可能にするのに十分なもので
ある。

【００７３】ホーム・エージェント１０２は、コヒーレ
ンシ要求を受け取ると、関連するディレクトリ６６にア
クセスし、どのＳＭＰノード１２が、影響を受けるコヒ
ーレンシ単位のコピーを記憶しているかを判定する。ま
た、ホーム・エージェント１０２はコヒーレンシ単位の
所有者を判定する。ホーム・エージェント１０２は、影
響を受けるコヒーレンシ単位のコピーを記憶している各
ノードのスレーブ・エージェント１０４と、影響を受け
るコヒーレンシ単位に対する所有コヒーレンシ状態を有
するノードのスレーブ・エージェント１０４へのコヒー
レンシ・デマンドを生成することができる（参照符号１
１２）。コヒーレンシ・デマンドは、受取側ＳＭＰノー
ド１２内の影響を受けるコヒーレンシ単位の新しいコヒ
ーレンシ状態を示し、さらに受け取るべき応答の数を示
す「応答カウント」値を含むことができる。コヒーレン
シ要求が未処理なので、ホーム・エージェント１０２
は、影響を受けるコヒーレンシ単位に関連するその後の
コヒーレンシ要求がホーム・エージェント１０２によっ
て開始されないように、影響を受けるコヒーレンシ単位
に対応するコヒーレンシ情報をブロックする。また、ホ
ーム・エージェント１０２は、コヒーレンシ要求が完了
したことを反映するようにコヒーレンシ情報を更新す
る。

【００７４】ホーム・エージェント１０２は、要求エー
ジェント１００へコヒーレンシ応答を送ることもできる
（参照符号１１４）。コヒーレンシ応答は、スレーブ・
エージェント１０４から発行されるコヒーレンシ応答の
数を示すことができる。別法として、ある種のトランザ
クションは、スレーブ・エージェント１０４との対話な
しで完了することができる。たとえば、ホーム・エージ
ェント１０２を含むＳＭＰノード１２内の入出力インタ
フェース２６を目標とする入出力トランザクションは、
ホーム・エージェント１０２によって完了することがで
きる。ホーム・エージェント１０２は、関連するＳＭＰ
バス２０に関するトランザクションを待機させ（参照符
号１１６）、次いで、トランザクションが完了したこと
を示す応答を送ることができる。

【００７５】スレーブ・エージェント１０４は、ホーム
・エージェント１０２からのコヒーレンシ・デマンドに
応答して、関連するＳＭＰバス２０上に与えるトランザ
クションを待機させることができる（参照符号１１
８）。また、スレーブ・エージェント１０４は要求エー
ジェント１００へコヒーレンシ応答を送る（参照符号１
２０）。コヒーレンシ応答は、特定のコヒーレンシ要求
に応答して受け取られたコヒーレンシ・デマンドがその
スレーブによって完了したことを示す。コヒーレンシ応
答はさらに、応答カウント値を含むことができる。コヒ
ーレンシ応答は、コヒーレンシ・デマンドが完了したと
き、あるいはコヒーレンシ・デマンドが、対応するＳＭ
Ｐノード１２上で確実に完了し、影響を受けるコヒーレ
ンシ単位に対する状態変化がコヒーレンシ・デマンドが
完了するよりも前に実行される、コヒーレンシ・デマン
ドが完了するよりも前の時間に、スレーブ・エージェン
ト１０４によって送られる。

【００７６】要求エージェント１００は、影響を受ける
各スレーブ・エージェント１０４からコヒーレンシ応答
を受け取ると、（たとえば、受け取った応答の数が応答
カウント値に等しいとき）ホーム・エージェント１０２
へコヒーレンシ完了を送る（参照符号１２２）。ホーム
・エージェント１０２は、コヒーレンシ完了を受け取る
と、対応するコヒーレンシ情報からブロックを削除す
る。要求エージェント１００は、再発行トランザクショ
ンを、ＳＭＰバス２０上で実行できるように待機させ、
ＳＭＰノード１２内でトランザクションを完了すること
ができる（参照符号１２４）。

【００７７】コヒーレンシ要求を発行した要求エージェ
ント１００によって各コヒーレンシ要求に固有のタグが
割り当てられることに留意されたい。その後に続くコヒ
ーレンシ・デマンド、コヒーレンシ応答、コヒーレンシ
完了はこのタグを含む。このように、特定のコヒーレン
シ要求に関するコヒーレンシ活動は、関連する各エージ
ェントによって識別することができる。さらに、非コヒ
ーレント・トランザクション（たとえば、入出力トラン
ザクション）に応答して非コヒーレント動作を実行でき
ることに留意されたい。非コヒーレント動作は、要求側
ノードとホーム・ノードしか使用しないものでよい。さ
らに、ホーム・エージェント１０２によって各コヒーレ
ンシ要求に異なる固有のタグを割り当てることができ
る。それぞれの異なるタグは、ホーム・エージェント１
０２を識別し、要求側のタグの代わりにコヒーレンシ完
了を表すために使用される。

【００７８】次に図７を参照すると、ＳＭＰバス２０上
でのリード・ツー・オウン・トランザクションに応答し
たコンピュータ・システム１０の例示的な実施形態に関
するコヒーレンシ活動を示す図が示されている。リード
・ツー・オウン・トランザクションが実行されるのは、
プロセッサ１６によって要求された特定のデータに関し
てキャッシュ・ミスが検出され、プロセッサ１６がコヒ
ーレンシ単位への書込み許可を要求したときである。ス
トア・キャッシュ・ミスはたとえば、リード・ツー・オ
ウン・トランザクションを生成することができる。

【００７９】要求エージェント１００、ホーム・エージ
ェント１０２、いくつかのスレーブ・エージェント１０
４を図７に示す。ＳＭＰバス２０からリード・ツー・オ
ウン・トランザクションを受け取ったノードは、影響を
受けるコヒーレンシ単位を無効状態で記憶する（たとえ
ば、コヒーレンシ単位はそのノードには記憶されな
い）。要求ノード１００の下付き文字「ｉ」は無効状態
を示す。ホーム・ノードは、コヒーレンシ単位を共用状
態で記憶し、いくつかのスレーブ・エージェント１０４
に対応するノードもコヒーレンシ単位を共用状態で記憶
する。ホーム・エージェント１０２およびスレーブ・エ
ージェント１０４の下付き文字「ｓ」は、それらのノー
ドでの共用状態を示す。リード・ツー・オウン動作は、
要求されたコヒーレンシ単位を要求側ノードへ転送させ
る。要求側ノードはコヒーレンシ単位を修正状態で受け
取る。

【００８０】要求エージェント１００は、ＳＭＰバス２
０からリード・ツー・オウン・トランザクションを受け
取ると、コヒーレンシ単位のホーム・ノードへリード・
ツー・オウン・コヒーレンシ要求を送る（参照符号１３
０）。受取側ホーム・ノードのホーム・エージェント１
０２は、１つまたは複数の他のノードに関する共用状態
を検出する。スレーブ・エージェントが所有状態ではな
く共用状態であるので、ホーム・ノードは、要求された
データを直接供給することができる。ホーム・エージェ
ント１０２は、要求されたコヒーレンシ単位に対応する
データを含むデータ・コヒーレンシ応答を要求エージェ
ント１００へ送る（参照符号１３２）。データ・コヒー
レンシ応答は、要求エージェント１００がデータの所有
権を得る前に他のノードのスレーブ・エージェントから
受け取るべき肯定応答の数も示す。ホーム・エージェン
ト１０２は、要求側ＳＭＰノード１２Ａないし１２Ｄが
コヒーレンシ単位の所有者であり、他のＳＭＰノード１
２Ａないし１２Ｄがそれぞれ無効であることを示すよう
にディレクトリ６６を更新する。要求エージェント１０
０からのコヒーレンシ完了の受取時に、コヒーレンシ単
位に関するコヒーレンシ情報がブロック解除されると、
ディレクトリ６６は各ＳＭＰノード１２でのコヒーレン
シ単位の状態に一致する。

【００８１】ホーム・エージェント１０２は、影響を受
けるコヒーレンシ単位の共用コピーを維持している各ス
レーブ・エージェント１０４へ無効化コヒーレンシ・デ
マンドを送る（参照符号１３４Ａ、１３４Ｂ、１３４
Ｃ）。各コヒーレンシ・デマンドは応答カウント値を含
むことができる。無効化コヒーレンシ・デマンドは、受
取側スレーブ・エージェントにノード内の対応するコヒ
ーレンシ単位を無効化させ、無効化が完了したことを示
す肯定コヒーレンシ応答を要求側ノードへ送らせる。各
スレーブ・エージェント１０４は、コヒーレンシ単位の
無効化を完了し、それに続いて肯定コヒーレンシ応答を
送る（参照符号１３６Ａ、１３６Ｂ、１３６Ｃ）。一実
施形態では、各肯定応答は、コヒーレンシ単位に関して
要求エージェント１００が受け取るべき応答の総数を示
す応答カウント値を含む。

【００８２】要求エージェント１００は、スレーブ・エ
ージェント１０４から各肯定コヒーレンシ応答を受け取
り、ホーム・エージェント１０２からデータ・コヒーレ
ンシ応答を受け取った後、ホーム・エージェント１０２
へコヒーレンシ完了を送る（参照符号１３８）。要求エ
ージェント１００は、そのローカル・メモリ内のコヒー
レンシ単位を無効化し、ホーム・エージェント１０２
は、対応するコヒーレンシ情報に対するブロックを解除
する。データ・コヒーレンシ応答１３２および肯定コヒ
ーレンシ応答１３６が、特に各ノード内の未処理のトラ
ンザクションの数に応じて任意の順序で受け取ることが
できることに留意されたい。

【００８３】図８は、スレーブ・エージェント１０３が
コヒーレンシ単位の現所有者であり他のスレーブ・エー
ジェント１０４がコヒーレンシ単位の共用コピーを有す
るときの、リード・ツー・オウン・トランザクション要
求に対するコヒーレンシ活動を示す図である。要求エー
ジェント１００は、ホーム・エージェント１０２へリー
ド・ツー・オウン要求を送ることによってトランザクシ
ョンを開始する（参照符号１３３Ａ）。これによって、
ホーム・エージェント１０２はこのラインへの新しいト
ランザクションをブロックする。ホーム・エージェント
１０２は、要求側をこのラインの単一の所有者としてマ
ーク付けし、所有者スレーブ・エージェント１０３へＲ
ＴＯデマンドを送る（参照符号１３３Ｂ）。また、リー
ド・ツー・オウン・デマンドは、受け取るべき応答の数
を示す応答カウント値を含む。ホーム・エージェントは
また、コヒーレンシ無効化デマンドを共用コピーと共に
他のすべてのスレーブ・エージェント１０４へ送る（参
照符号１３３Ｃ）。これらのメッセージはそれぞれ、受
け取るべき応答の数を示すこともできる。

【００８４】所有者スレーブ・エージェント１０３は、
要求側エージェント１００へのデータを用いて応答し
（参照符号１３３）、そのコピーを無効化する。このメ
ッセージは同様に、応答カウント値を含む。すべての共
用者スレーブ・エージェント１０４は、要求側エージェ
ントへ無効化肯定応答を送り、（参照符号１３３Ｅ）、
そのコピーを無効化する。これらのメッセージのそれぞ
れと共に応答カウント値も送られる。要求エージェント
１００は、すべての肯定応答およびデータを受け取った
後、ホーム・エージェント１０２へコヒーレンシ完了を
送り返す（参照符号１３３Ｆ）。ホーム・エージェント
１０２はこれに応答して、このラインのブロックを削除
する。

【００８５】図９は、要求エージェント１００が共用コ
ピーを有しホーム・エージェント１０２へリード・ツー
・オウン要求を送るトランザクションを示す（参照符号
１３５Ａ）。ホーム・エージェント１０２は、リード・
ツー・オウン要求を受け取ると、このラインへの次のト
ランザクションをブロックする。ホーム・エージェント
１０２はさらに、このラインのコピーを有する他のすべ
てのノードへ無効化デマンドを送る（参照符号１３５
Ｂ）（ただし、要求側へは送らない）。これらのデマン
ドは応答カウント値を含む。ホーム・エージェント１０
２はさらに、要求エージェント１００を単一の所有者と
してマーク付けする。

【００８６】すべてのスレーブ・エージェント（１０３
および１０４）は、要求エージェント１００へ無効化肯
定応答を送り（参照符号１３５Ｃおよび１３５Ｄ）、そ
れらのコピーを無効化する。これらのメッセージはさら
に、応答カウント値を含む。最後に、要求エージェント
１００は、すべての肯定応答を受け取った後、ホーム・
エージェント１０２へコヒーレンシ完了メッセージを送
り返す（参照符号１３５Ｅ）。これによって、ホーム・
エージェント１０２はこのラインからブロックを削除す
る。

【００８７】図１０は、スレーブがコヒーレンシ単位の
所有者であるときの、リード・ツー・シェア要求に対す
るコヒーレンシ活動を示す。上記の説明と同様に、コヒ
ーレンシ活動は、要求エージェント１００がホーム・エ
ージェント１０２へリード・ツー・シェア要求を送った
ときに開始する（参照符号１３７Ａ）。これによって、
ホーム・エージェント１０２はこのラインへの新しいト
ランザクションをブロックする。ホーム・エージェント
１０２は、要求側を共用者としてマーク付けし、所有者
スレーブ・エージェント１０３へＲＴＳデマンドを送る
（参照符号１３７Ｂ）。所有者スレーブ・エージェント
１０３は、要求エージェント１００へのデータを用いて
応答し（参照符号１３７Ｃ）、所有状態のままになる。
最後に、要求エージェント１００がホーム・エージェン
トへコヒーレンシ完了メッセージを送り（参照符号１３
７Ｄ）、それによってこのラインのブロックが削除され
る。

【００８８】リード・ツー・シェア・トランザクション
要求では、応答カウントが１であることに留意された
い。そのようなトランザクションでは、応答カウント値
が、上記でリード・ツー・オウン・トランザクションに
関して説明したように、ホーム・エージェントからスレ
ーブへ送られ要求側エージェントへ転送されるように、
システムを実施することができる。別法として、応答カ
ウント値をこのようなトランザクションでは搬送できな
いようにする。その代わり、単一の応答を受け取った直
後にコヒーレンシ完了メッセージを送るように要求エー
ジェントを構成することができる。

【００８９】さらに、応答カウントが１つのコヒーレン
シ・デマンドおよび対応する１つのコヒーレンシ応答の
みを介して送られる実施形態が可能であることに留意さ
れたい。上記の実施形態では、すべてのデマンドトラン
ザクションおよび応答トランザクションが応答カウント
を含むため、どの応答が最初に要求エージェントに到達
するかは不明なので、実施形態を簡略化することができ
る。これによって、単一のデータ応答しかないケースも
カバーする対称型設計が可能になる。

【００９０】次に図１１を参照すると、要求エージェン
ト１００によって使用される例示的な状態マシンを示す
フローチャート１４０が示されている。要求エージェン
ト１００は、フローチャート１４０で表した状態マシン
の複数の独立のコピーを含むことができ、そのため、複
数の要求を並行して処理することができる。

【００９１】要求エージェント１００は、ＳＭＰ入力待
ち行列９４からトランザクションを受け取ると、要求準
備完了状態１４２を開始する。要求準備完了状態１４２
では、要求エージェント１００は、影響を受けるコヒー
レンシ単位のグローバル・アドレスで識別されるホーム
・ノードに存在するホーム・エージェント１０２へコヒ
ーレンシ要求を送る。要求エージェント１００は、コヒ
ーレンシ要求を送ると、要求アクティブ状態１４４に遷
移する。要求アクティブ状態１４４中に、要求エージェ
ント１００はスレーブ・エージェント１０４から（およ
び任意選択でホーム・エージェント１０２から）コヒー
レンシ応答を受け取る。各コヒーレンシ応答が受け取ら
れると、要求エージェント１００は、コヒーレンシ活動
を開始したトランザクションのタイプに応じて新しい状
態に遷移する。また、要求活動状態１４２は、タイマを
使用して、所定のタイムアウト期間内にコヒーレンシ応
答が受け取られるなかったことを検出することができ
る。ホーム・エージェント１０２によって指定された応
答の数を受け取る前にタイマが満了した場合、要求エー
ジェント１００はエラー状態に遷移する（図示せず）。
さらに、ある種の実施形態は、読取り転送が失敗したこ
とを示す応答を使用することができる。そのような応答
が受け取られた場合、要求エージェント１００は、要求
準備完了状態１４２に遷移し再び読取りを試みる。

【００９２】エラーやタイムアウトなしで応答が受け取
られる場合、状態は読取りトランザクションに関しては
要求エージェント１００によって読取り完了状態１４６
に遷移する。読取りトランザクションの場合、受け取ら
れる応答のうちの１つに、要求されたコヒーレンシ単位
に対応するデータを含めることができることに留意され
たい。要求エージェント１００は、ＳＭＰバス２０上で
読取りトランザクションを再発行し、さらにホーム・エ
ージェント１０２へコヒーレンシ完了を送る。それに続
いて、要求エージェント１００はアイドル状態１４８に
遷移する。次いで、図１１に示した状態マシンを使用し
て、要求エージェント１００によって新しいトランザク
ションを処理することができる。

【００９３】逆に、書込みトランザクションには書込み
アクティブ状態１５０および無視書込み再発行状態１５
２が使用される。コンピュータ・システム１０のある種
の書込みトランザクションでは、ネットワーク１４上で
コヒーレンシ活動が開始されても、無視信号７０はアサ
ートされない。たとえば、入出力書込みトランザクショ
ンは無視されない。書込みデータは、システム・インタ
フェース２４へ転送され、そこに記憶される。ＳＭＰバ
ス２０上での書込みトランザクションのデータ・フェー
ズよりも前にコヒーレンシ応答が受け取られた場合にシ
ステム・インタフェース２４へデータを転送できるよう
に、非無視書込みトランザクションには書込みアクティ
ブ状態１５０が使用される。対応するデータが受け取ら
れた後、要求エージェント１００は書込み完了状態１５
４に遷移する。書込み完了状態１５４中に、コヒーレン
シ完了応答がホーム・エージェント１０２へ送られる。
それ続いて、要求エージェント１００がアイドル状態１
４８に遷移する。

【００９４】無視された書込みトランザクションは、無
視書込み再発行状態１５２への遷移を介して処理され
る。無視書込み再発行状態１５２中に、要求エージェン
ト１００は、無視された書込みトランザクションをＳＭ
Ｐバス２０上で再発行する。このように、書込みデータ
を発送側プロセッサ１６から転送することができ、対応
する書込みトランザクションをプロセッサ１６によって
解除することができる。要求エージェント１００は、書
込みデータをコヒーレンシ完了と共に送るべきかどうか
に応じて、無視書込みアクティブ状態１５６と無視書込
み完了状態１５８のどちらかに遷移する。無視書込みア
クティブ状態１５６は、書込みアクティブ状態１５０と
同様に、ＳＭＰバス２０からのデータ転送を待つために
使用される。無視書込み完了状態１５８中に、ホーム・
エージェント１０２へコヒーレンシ完了が送られる。そ
れに続いて、要求エージェント１００がアイドル状態１
４８に遷移する。要求エージェント１００は、ＳＭＰ入
力待ち行列９４からトランザクションを受け取ると、ア
イドル状態１４８から要求準備完了状態１４２に遷移す
る。

【００９５】次に図１２を参照すると、ホーム・エージ
ェント１０２に関する例示的な状態マシンを示すフロー
チャート１６０が示されている。ホーム・エージェント
１０２は、それに対する複数の未処理の要求を処理でき
るように、フローチャート１６０で表した状態マシンの
複数の独立のコピーを含むことができる。しかし、一実
施形態によれば、複数の未処理の要求が同じコヒーレン
シ単位に影響を与えることはない。

【００９６】ホーム・エージェント１０２は、要求受取
状態１６２でコヒーレンシ要求を受け取る。この要求
は、コヒーレント要求とその他のトランザクション要求
のどちらかとして分類することができる。一実施形態に
よれば、他のトランザクション要求には、入出力読取り
要求および入出力書込み要求と、割り込み要求と、管理
要求を含めることができる。非コヒーレント要求は、状
態１６４の間にＳＭＰバス２０上でトランザクションを
送ることによって処理される。それに続いて、コヒーレ
ンシ完了が送られる。コヒーレンシ完了の受取時に、入
出力書込みトランザクションおよび割り込み許可トラン
ザクションによって、ホーム・ノード内のＳＭＰバス２
０上でデータ・トランザクションが送られる（データ専
用状態１６５）。データが転送されると、ホーム・エー
ジェント１０２はアイドル状態１６６に遷移する。別法
として、コヒーレンシ完了の受取時に、入出力読取りト
ランザクション、管理トランザクション、割り込み拒否
トランザクションによって、アイドル状態への遷移が行
われる。

【００９７】逆に、ホーム・エージェント１０２は、コ
ヒーレンシ要求を受け取ると検査状態１６８に遷移す
る。検査状態１６８は、コヒーレンシ要求の影響を受け
るコヒーレンシ単位に関してコヒーレンシ活動が進行中
であるかどうかを検出するために使用される。コヒーレ
ンシ活動が進行中である（すなわち、コヒーレンシ情報
がブロックされている）場合、ホーム・エージェント１
０２は、進行中のコヒーレンシ活動が完了するまで検査
状態１６８のままである。それに続いて、ホーム・エー
ジェント１０２は設定状態１７０に遷移する。

【００９８】設定状態１７０中に、ホーム・エージェン
ト１０２は、ブロックすべき影響を受けるコヒーレンシ
単位に対応するコヒーレンシ情報を記憶するディレクト
リ・エントリの状況を設定する。ブロック状況によっ
て、影響を受けるコヒーレンシ単位へのその後の活動の
進行が妨げられ、コンピュータ・システム１０のコヒー
レンシ・プロトコルが簡略化される。ホーム・エージェ
ント１０２は、受け取ったコヒーレンシ要求に対応する
トランザクションの読取り特性または書込み特性に応じ
て、読取り状態１７２または書込み応答状態１７４に遷
移する。

【００９９】ホーム・エージェント１０２は、読取り状
態１７２中に、読取りトランザクションに関して更新さ
れるコヒーレンシ・デマンドをスレーブ・エージェント
１０４に発行する。ホーム・エージェント１０２は、要
求エージェント１００からコヒーレンシ完了が受け取ら
れるまで読取り状態１７２のままであり、その後、ブロ
ック状況クリア状態１７６に遷移する。読取りを求める
コヒーレンシ要求が失敗する可能性のある実施形態で
は、ホーム・エージェント１０２は、読取りトランザク
ションの失敗を示すコヒーレンシ完了を受け取ると、影
響を受けるディレクトリ・エントリの状態をコヒーレン
シ要求の前の状態に復元する。

【０１００】書込み状態１７４中に、ホーム・エージェ
ント１０２は要求エージェント１００へコヒーレンシ応
答を送る。ホーム・エージェント１０２は、要求エージ
ェント１００からコヒーレンシ完了が受け取られるまで
応答書込み状態１７４のままである。コヒーレンシ完了
と共にデータが受け取られた場合、ホーム・エージェン
ト１０２は書込みデータ状態１７８に遷移する。別法と
して、ホーム・エージェント１０２は、データを含まな
いコヒーレンシ完了を受け取ったときに、ブロック状況
クリア状態１７６に遷移する。

【０１０１】ホーム・エージェント１０２は、受け取っ
た書込みデータを転送するために、書込みデータ状態１
７８中にＳＭＰバス２０上で書込みトランザクションを
発行する。たとえば、書込みストリーム動作（後述）に
よって、データがホーム・エージェント１０２へ転送さ
れる。ホーム・エージェント１０２は、受け取ったデー
タを、記憶するためにメモリ２２へ送る。それに続い
て、ホーム・エージェント１０２はブロック状況クリア
状態１７６に遷移する。

【０１０２】ホーム・エージェント１０２は、ブロック
状況クリア状態１７６で受け取ったコヒーレンシ要求の
影響を受けるコヒーレンシ単位に対応するコヒーレンシ
情報のブロック状況をクリアする。それに続いて、コヒ
ーレンシ情報にアクセスすることができる。非ブロック
・コヒーレンシ情報内に存在する状態は、前に受け取っ
たコヒーレンシ要求によって開始されたコヒーレンシ活
動を反映する。ホーム・エージェント１０２は、対応す
るコヒーレンシ情報のブロック状況をクリアすることに
よって、アイドル状態１６６に遷移する。ホーム・エー
ジェント１０２は、コヒーレンシ要求を受け取ると、ア
イドル状態１６６から受取要求状態１６２に遷移する。

【０１０３】次に図１３を参照すると、スレーブ・エー
ジェント１０４に関する例示的な状態マシンを示すフロ
ーチャート１８０が示されている。スレーブ・エージェ
ント１０４は、受取状態１８２中にコヒーレンシ・デマ
ンドを受け取る。スレーブ・エージェント１０４は、コ
ヒーレンシ・デマンドに応答して、ＳＭＰバス２０上に
与えられるトランザクションを待機させる。このトラン
ザクションによって、キャッシュ１８およびプロセッサ
１６の内部のキャッシュの状態が、受け取ったコヒーレ
ンシ・デマンドに応じて変化する。スレーブ・エージェ
ント１０４は、このトランザクションを要求発送状態１
８４の間待機させる。

【０１０４】応答発送状態１８６中に、スレーブ・エー
ジェント１０４は、トランザクションを開始した要求エ
ージェント１００へコヒーレンシ応答を送る。様々な実
施形態によれば、スレーブ・エージェント１０４が、Ｓ
ＭＰバス２０に関するトランザクションを待機させ、あ
るいはＳＭＰバス２０上のトランザクションが首尾良く
完了したときに要求発送状態１８４から応答発送状態１
８６に遷移できることに留意されたい。スレーブ・エー
ジェント１０４は、コヒーレンシ応答を送った後、アイ
ドル状態１８８に遷移する。スレーブ・エージェント１
０４は、コヒーレンシ・デマンドを受け取るとアイドル
状態１８８から受取状態１８２に遷移することができ
る。

【０１０５】次に図１４ないし１７を参照すると、例示
的なコヒーレンシ要求タイプ、コヒーレンシ・デマンド
・タイプ、コヒーレンシ応答タイプ、コヒーレンシ完了
タイプをリストしたいくつかの表が示されている。図１
４ないし１７の表に示したタイプは、コンピュータ・シ
ステム１０の一実施形態によって使用することができ
る。他の実施形態は、他の数組のタイプを使用すること
ができる。

【０１０６】図１４は、コヒーレンシ要求のタイプをリ
ストした表１９０である。第１の列１９２は、下記の図
１８で使用される各要求タイプのコードをリストしたも
のである。第２の列１９４は、コヒーレンシ要求タイプ
をリストしたものであり、第３の列１９６は、コヒーレ
ンシ要求の発送元を示すものである。図１５ないし１７
では、同様な列がコヒーレンシ・デマンド、コヒーレン
シ応答、コヒーレンシ完了に使用される。「Ｒ」は要求
エージェント１００を示し、「Ｓ」はスレーブ・エージ
ェント１０４を示し、「Ｈ」はホーム・エージェント１
０２を示す。

【０１０７】リード・ツー・シェア要求は、特定のＳＭ
Ｐノードにコヒーレンシ単位が存在せず、ＳＭＰバス２
０からコヒーレンシ単位へのトランザクションの性質
上、コヒーレンシ単位への読取りアクセスが必要である
ときに実行される。たとえば、キャッシュ可能読取りト
ランザクションではリード・ツー・シェア要求が実行さ
れる。一般的に言えば、リード・ツー・シェア要求と
は、共用状態のコヒーレンシ単位のコピーを求める要求
である。同様に、リード・ツー・オウン要求とは、所有
状態のコヒーレンシ単位のコピーを求める要求である。
他のＳＭＰノード内のコヒーレンシ単位のコピーは無効
状態に変更すべきである。リード・ツー・オウン要求
は、たとえばキャッシュ可能書込みトランザクションの
キャッシュ・ミスに応答して実行することができる。

【０１０８】読取りストリームおよび書込みストリーム
とは、コヒーレンシ単位全体の読取りまたは書込みを求
める要求である。これらの動作は通常、ブロック・コピ
ー動作に使用される。プロセッサ１６およびキャッシュ
１８は、読取りストリーム要求または書込みストリーム
要求に応答して与えられたデータはキャッシュしない。
その代わり、読取りストリーム要求の場合には、コヒー
レンシ単位がプロセッサ１６へのデータとして与えら
れ、書込みストリーム要求の場合にはメモリ２２にデー
タが書き込まれる。リード・ツー・シェア要求、リード
・ツー・オウン要求、読取りストリーム要求をＣＯＭＡ
動作（たとえば、ＲＴＳ、ＲＴＯ、ＲＳ）またはＮＵＭ
Ａ動作（たとえば、ＲＴＳＮ、ＲＴＯＮ、ＲＳＮ）とし
て実行できることに留意されたい。

【０１０９】書き直し要求は、コヒーレンシ単位のホー
ム・ノードにコヒーレンシ単位が書き込まれるときに実
行される。ホーム・ノードは、コヒーレンシ単位を書き
直す許可と共に応答する。コヒーレンシ単位は次いで、
コヒーレンシ完了と共にホーム・ノードに渡される。

【０１１０】無効要求は、他のＳＭＰノード内のコヒー
レンシ単位のコピーを無効化するために実行される。無
効化要求が生成される例示的なケースは、共用または所
有されているコヒーレンシ単位への書込みストリーム・
トランザクションである。書込みストリーム・トランザ
クションではコヒーレンシ単位が更新され、したがって
他のＳＭＰノード内のコヒーレンシ単位のコピーが無効
化される。

【０１１１】入出力読取りトランザクションおよび入出
力書込みトランザクションに応答して入出力読取り要求
および入出力書込み要求が送られる。入出力トランザク
ションは非コヒーレントである（すなわち、トランザク
ションはキャッシュされず、トランザクションに対して
コヒーレンシは維持されない）。入出力ブロック・トラ
ンザクションでは、通常の入出力トランザクションより
も大きな、データの一部が転送される。一実施形態で
は、ブロック入出力動作で６４バイトの情報が転送さ
れ、それに対して非ブロック入出力トランザクションで
８バイトが転送される。

【０１１２】フラッシュ要求では、コヒーレンシ単位の
コピーが無効化される。修正されたコピーはホーム・ノ
ードへ返される。割り込み要求は、リモートＳＭＰノー
ド内の特定の装置への割り込みを知らせるために使用さ
れる。割り込みは特定のプロセッサ１６に与えることが
でき、そのプロセッサは、割り込みに応答して所定のア
ドレスに記憶されている割り込みサービス・ルーチンを
実行することができる。管理パケットは、ノード間であ
る種のリセット信号を送るために使用される。

【０１１３】図１５は、例示的なコヒーレンシ・デマン
ド・タイプをリストした表１９８である。表１９０と同
様に、表１９８には列１９２、１９４、１９６が含まれ
る。リード・ツー・シェア・デマンドは、コヒーレンシ
単位の所有者へ搬送され、それによってその所有者は要
求側ノードへデータを送る。同様に、リード・ツー・オ
ウン・デマンドおよび読取りストリーム・デマンドによ
って、コヒーレンシ単位の所有者は要求側ノードへデー
タを送る。また、リード・ツー・オウン・デマンドによ
って、所有者は所有者ノード内のコヒーレンシ単位の状
態を無効に変更する。読取りストリーム・デマンドおよ
びリード・ツー・シェア・デマンドによって、所有者ノ
ードにおける状態が（修正から）所有に変更される。

【０１１４】無効化デマンドでは、対応するコヒーレン
シ単位は転送されない。その代わり、無効化デマンドで
はコヒーレンシ単位のコピーが無効化される。最後に、
管理デマンドは管理要求に応答して搬送される。各デマ
ンドが要求エージェント１００からの要求に応答してホ
ーム・エージェント１０２によって開始されることを留
意されたい。

【０１１５】図１６は、コンピュータ・システム１０の
一実施形態によって使用される例示的な応答タイプをリ
ストした表２００である。図１４および１５と同様に、
図１６はコヒーレンシ応答に関する列１９２、１９４、
１９６を含む。

【０１１６】データ応答とは、要求されたデータを含む
応答である。所有者スレーブ・エージェントは通常、コ
ヒーレンシ要求に関するデータ応答を与える。しかし、
ホーム・エージェントは入出力読取り要求に関するデー
タを与えることができる。

【０１１７】肯定応答は、特定のコヒーレンシ要求に関
連するコヒーレンシ・デマンドが完了したことを示す。
スレーブ・エージェントは通常、肯定応答を与えるが、
ホーム・エージェントは、ホーム・ノードがコヒーレン
シ単位の所有者であるときに肯定応答を（データと共
に）与える。

【０１１８】スレーブ所有なし応答、アドレス・マップ
なし応答、エラー応答は、エラーが検出されたときにス
レーブ・エージェント１０４によって搬送される。スレ
ーブ所有なし応答は、コヒーレンシ単位の所有者および
スレーブがもはやコヒーレンシ単位を所有していないと
きにホーム・エージェント１０２によってスレーブが識
別された場合に送られる。アドレス・マップなし応答
は、所有権を主張している装置が、対応するＳＭＰバス
２０上にはないデマンドを、スレーブが受け取った場合
に、送られる。スレーブ・エージェントによって検出さ
れた他のエラー条件はエラー応答を介して示される。

【０１１９】ホーム・エージェント１０２は、スレーブ
・エージェント１０４が使用できるエラー応答以外のエ
ラー応答を与えることができる。対応する要求がホーム
・エージェント１０２によるサービスを必要としていな
いことを示すために、ホーム・エージェント１０２によ
って否定肯定（ＮＡＣＫ）および否定応答（ＮＯＰＥ）
が使用される。ＮＡＣＫトランザクションを使用して、
対応する要求がホーム・ノードによって拒否されたこと
を示すことができる。たとえば、割り込み要求は、受取
側ノードによって割り込みが拒否された場合にＮＡＣＫ
を受け取る。受取側ノードによって割り込みが受け入れ
られた場合には肯定応答（ＡＣＫ）が搬送される。ＮＯ
ＰＥトランザクションは、受取側ノードによって記憶さ
れていないコヒーレンシ単位のための対応するフラッシ
ュ要求が搬送されたことを示すために使用される。

【０１２０】図１７は、コンピュータ・システム１０の
一実施形態による例示的なコヒーレンシ完了タイプを示
す表２０２である。図１７は、図１４ないし１６と同様
に、コヒーレンシ完了に関する列１９２、１９４、１９
６を含む。

【０１２１】データなしの完了は、特定の要求が完了し
たことを示す、要求エージェント１００からホーム・エ
ージェント１０２への信号として使用される。ホーム・
エージェント１０２は、これに応答して、対応するコヒ
ーレンシ情報をブロック解除する。ＳＭＰバス２０上の
異なるトランザクションに対応する２種類のデータ完了
が含まれている。一方のタイプの再発行トランザクショ
ンでは、ＳＭＰバス２０上でデータ・フェーズしか使用
されない。この再発行トランザクションは、一実施形態
では入出力書込みトランザクションおよび割り込みトラ
ンザクションに使用することができる。他方のタイプの
再発行トランザクションではアドレス・フェーズとデー
タ・フェーズの両方が使用される。書込みストリームや
書き直しなどのコヒーレント書込みは、アドレス・フェ
ーズとデータ・フェーズの両方を含む再発行トランザク
ションを使用することができる。最後に、要求された状
態を得ることに失敗した読取り要求に関する、失敗を示
す完了が含まれている。

【０１２２】次に図１８を参照すると、ＳＭＰバス２０
上の様々なトランザクションに対するコヒーレンシ活動
を示す表２１０が示されている。表２１０は、他のＳＭ
Ｐノード１２へ要求を送らせるトランザクションを示
す。ＳＭＰノード内で完了するトランザクションは示さ
れていない。列内の「−」は、特定の行内で考えられる
ケースではその列に関して実行される活動がないことを
示す。要求エージェント１００によってＳＭＰバス２０
上で受け取られるトランザクションを示すトランザクシ
ョン列２１２が含まれている。ＭＴＡＧ列２１４は、ト
ランザクションに対応するアドレスによってアクセスさ
れるコヒーレンシ単位のＭＴＡＧの状態を示す。図の状
態は、前述のＭＯＳＩ状態と「ｎ」状態とを含む。
「ｎ」状態は、コヒーレンシ単位が、トランザクション
が開始されたＳＭＰノードではＮＵＭＡモードでアクセ
スされることを示す。したがって、コヒーレンシ単位の
ローカル・コピーは要求側ノード・メモリには記憶され
ない。その代わり、コヒーレンシ単位は、ホームＳＭＰ
ノード（または所有者ノード）から転送され、メモリ２
２に記憶されずに要求側プロセッサ１６またはキャッシ
ュ１８へ送られる。

【０１２３】要求列２１６は、トランザクションのアド
レスによって識別されるホーム・エージェントへ送られ
るコヒーレンシ要求をリストしたものである。ホーム・
エージェント１０２は、列２１６にリストしたコヒーレ
ンシ要求を受け取ると、ディレクトリ６６に記録されて
いる要求側ノードのコヒーレンシ単位の状態を検査す
る。Ｄ列２１８は、要求側ノードに関して記録されるコ
ヒーレンシ単位の現状態をリストしたものであり、Ｄ’
列２２０は、受け取ったコヒーレンシ要求に応答してホ
ーム・エージェント１０２によって更新された、要求側
ノードに関して記録されるコヒーレンシ単位の状態をリ
ストしたものである。ホーム・エージェント１０２は、
コヒーレンシ単位の所有者への第１のコヒーレンシ・デ
マンドと、コヒーレンシ単位の共用コピーを維持してい
るノードへの追加コヒーレンシ・デマンドを生成するこ
とができる。所有者へ送られるコヒーレンシ・デマンド
を列２２２に示し、それに対して共用ノードへ送られる
コヒーレンシ・デマンドを列２２４に示す。さらに、ホ
ーム・エージェント１０２は要求側ノードへコヒーレン
シ応答を送ることができる。ホーム・エージェント応答
を列２２６に示す。

【０１２４】コヒーレンシ単位の所有者として示された
ＳＭＰノード内のスレーブ・エージェント１０４は、列
２２８に示したようにコヒーレンシ応答を送る。共用ノ
ードとして示されたノード内のスレーブ・エージェント
１０４は、受け取ったコヒーレンシ・デマンドで示され
た状態変化を実行した後に、列２３０に示したコヒーレ
ンシ応答を用いて、列２２４に示したコヒーレンシ・デ
マンドに応答する。

【０１２５】要求エージェント１００は、適当な数のコ
ヒーレンシ応答を受け取ると、ホーム・エージェント１
０２へコヒーレンシ完了を送る。様々なトランザクショ
ンに使用されるコヒーレンシ完了を列２３２に示す。

【０１２６】一例を挙げると、行２３４は、対応するＭ
ＴＡＧ状態が無効であるＳＭＰバス２０上のリード・ツ
ー・シェア・トランザクションに対するコヒーレンシ活
動を示す。対応する要求エージェント１００は、リード
・ツー・シェア・トランザクションに関連付けられたグ
ローバル・アドレスで識別されたホーム・ノードへリー
ド・ツー・シェア・コヒーレンシ要求を送る。行２３４
に示したケースでは、ホーム・ノードのディレクトリ
は、要求側ノードがデータを無効状態で記憶しているこ
とを示す。要求側ノードに関するホーム・ノードのディ
レクトリ内の状態は共用に更新され、ホーム・エージェ
ント１０２により、ディレクトリによって所有者として
示されたノードへリード・ツー・シェア・コヒーレンシ
・デマンドが送られる。トランザクションが共用状態を
得ようとするので、共用者へはデマンドは送られない。
所有者ノード内のスレーブ・エージェント１０４は、コ
ヒーレンシ単位に対応するデータを要求側ノードへ送
る。要求側ノード内の要求エージェント１００は、デー
タを受け取るとホーム・ノード内のホーム・エージェン
ト１０２へコヒーレンシ完了を送る。したがって、トラ
ンザクションが完了する。

【０１２７】Ｄ列２１８に示した状態がＭＴＡＧ列２１
４の状態に合致しないことがあることに留意されたい。
たとえば、行２３６は、ＭＴＡＧ列２１４では無効状態
のコヒーレンシ単位を示す。しかし、Ｄ列２１８内の対
応する状態は、修正でも、あるいは所有でも、あるいは
共用でもよい。そのような状況が発生するのは、コヒー
レンシ単位への現トランザクションに関するＭＴＡＧ６
８へのアクセスがアドレス・バス５８上で実行されると
きに、コヒーレンシ単位に関する要求側ノードからの前
のコヒーレンシ要求がコンピュータ・システム１０内で
未処理であるときである。しかし、特定のアクセス時に
ディレクトリ・エントリがブロックされるので、未処理
の要求は、現要求によるディレクトリ６６のアクセスよ
りも前に完了する。このため、生成されるコヒーレンシ
・デマンドは、（ディレクトリがアクセスされるときの
ＭＴＡＧ状態に合致する）ディレクトリ状態に依存す
る。行２３６に示した例では、コヒーレンシ単位が現
在、要求側ノードに存在していることをディレクトリが
示しているので、リード・ツー・シェア要求は、単に要
求側ノード内のＳＭＰバス２０上で読取りトランザクシ
ョンを再発行することによって完了することができる。
したがって、ホーム・ノードは、応答カウント１を含
め、要求に肯定応答し、それに続いて要求側ノードは読
取りトランザクションを再発行することができる。さら
に、表２１０には多数のタイプのトランザクションがリ
ストされているが、コンピュータ・システム１０の様々
な実施形態に応じて他のトランザクションを使用できる
ことに留意されたい。

【０１２８】上記の例示的な実施形態ではＳＭＰノード
１２について説明したが、一般的に言えば、コンピュー
タ・システム１０の実施形態は１つまたは複数の処理ノ
ードを含むことができる。本明細書では、処理ノード
は、少なくとも１つのプロセッサと対応するメモリとを
含む。他の処理ノードと通信する回路も含まれる。コン
ピュータ・システム１０の実施形態に複数の処理ノード
が含まれるとき、処理ノード内の対応するメモリは分散
共用メモリを形成する。処理ノードはリモート処理ノー
ドまたはローカル処理ノードと呼ぶことができる。処理
ノードは、特定のプロセッサを含まない場合、その特定
のプロセッサに対してリモート処理ノードである。逆
に、特定のプロセッサを含む処理ノードは、その特定の
プロセッサのローカル処理ノードである。

【０１２９】当業者には、上記の開示を完全に理解した
後に多数の変形形態および修正形態が明らかになろう。
たとえば、本明細書に示した様々なブロックおよび構成
要素はハードウェア実施形態に関して説明したが、代替
実施形態では、ハードウェア機能のすべてまたは一部を
ソフトウェアで実施することができる。特許請求の範囲
は、すべてのそのような変形形態および修正形態を包含
するものと解釈されるものである。

【図面の簡単な説明】

【図１】マルチプロセッサ・コンピュータ・システムの
ブロック図である。

【図２】図１に示したコンピュータ・システムの一実施
形態によってサポートされる非一様メモリ・アーキテク
チャを示す概念ブロック図（Ａ）、図１に示したコンピ
ュータ・システムの一実施形態によってサポートされる
キャッシュ専用メモリ・アーキテクチャを示す概念ブロ
ック図（Ｂ）である。

【図３】図１に示した対称型多重処理ノードの一実施形
態のブロック図である。

【図４】図３に示したディレクトリの一実施形態に記憶
された例示的なディレクトリ・エントリを示す図であ
る。

【図５】図１に示したシステム・インタフェースの一実
施形態のブロック図である。

【図６】要求エージェントとホーム・エージェントとス
レーブ・エージェントとの間の通常のコヒーレンシ動作
に応答して実行される活動を示す図である。

【図７】プロセッサからのリード・ツー・オウン要求に
応答して実行される例示的なコヒーレンシ動作の図であ
る。

【図８】スレーブ・エージェントがコヒーレンシ単位の
現所有者であり他のエージェントがコヒーレンシ単位の
共用コピーを有するときの、リード・ツー・オウン要求
に対するコヒーレンシ活動を示す図である。

【図９】要求エージェントが共用コピーを有しリード・
ツー・オウン要求をホーム・エージェントへ送るときの
コヒーレンシ活動を示す図である。

【図１０】スレーブがコヒーレンシ単位の所有者である
ときのリード・ツー・シェア要求に対するコヒーレンシ
活動を示す図である。

【図１１】図５に示した要求エージェントの一実施形態
に関する例示的な状態マシンを示すフローチャートであ
る。

【図１２】図５に示したホーム・エージェントの一実施
形態に関する例示的な状態マシンを示すフローチャート
である。

【図１３】図５に示したスレーブ・エージェントの一実
施形態に関する例示的な状態マシンを示すフローチャー
トである。

【図１４】システム・インタフェースの一実施形態によ
る要求タイプをリストした表である。

【図１５】システム・インタフェースの一実施形態によ
るデマンド・タイプをリストした表である。

【図１６】システム・インタフェースの一実施形態によ
る応答タイプをリストした表である。

【図１７】システム・インタフェースの一実施形態によ
る完了タイプをリストした表である。

【図１８】システム・インタフェースの一実施形態によ
る、プロセッサによって実行される様々な動作に応答し
て実行されるコヒーレンシ動作を表す表である。

【符号の説明】

１０コンピュータ・システム１２ＳＭＰノード１４ポイント・ツー・ポイント・ネットワーク１６プロセッサ１８外部キャッシュ２０ＳＭＰバス２２メモリ２４システム・インタフェース２６入出力インタフェース

─────────────────────────────────────────────────────

【手続補正書】

【提出日】平成９年１２月１９日

【手続補正１】

【補正対象書類名】図面

【補正対象項目名】全図

【補正方法】変更

【補正内容】

【図４】

【図７】

【図１】

【図８】

【図９】

【図１０】

【図２】

【図６】

【図１４】

【図３】

【図５】

【図１７】

【図１１】

【図１５】

【図１６】

【図１２】

【図１３】

【図１８】

───────────────────────────────────────────────────── フロントページの続き (71)出願人 591064003 901 ＳＡＮＡＮＴＯＮＩＯＲＯＡＤＰＡＬＯＡＬＴＯ，ＣＡ 94303，Ｕ. Ｓ．Ａ. (72)発明者ポール・エヌ・ローウェンステインアメリカ合衆国・94301・カリフォルニア州・パロアルト・チャニングアヴェニュ・919

Claims

【特許請求の範囲】

【請求項１】多重処理コンピュータ・システムであっ
て、第１のプロセッサと、第１のメモリと、第１のシステム
・インタフェースとを含む第１の処理ノードと、前記第１の処理ノードに結合され、第１のメモリと共に
分散共用メモリ・システムを構成する第２のメモリを含
む、第２の処理ノードとを備え、前記第１のプロセッサが、第１のアドレスを有する第１
のトランザクションを開始するように構成され、前記第
１のアドレスが、前記第１のメモリ内に記憶されている
第１のコヒーレンシ単位を識別する場合はローカル物理
アドレスであり、前記第１のアドレスが、前記第２のメ
モリ内の第２のコヒーレンシ単位を識別する場合はグロ
ーバル・アドレスであり、前記第１のシステム・インタ
フェースが、前記第１のアドレスが前記グローバル・ア
ドレスである場合にＮＵＭＡコヒーレンシ要求を開始す
るように構成され、前記第１のシステム・インタフェー
スが、前記アドレスが前記ローカル物理アドレスであり
前記第１のコヒーレンシ単位が前記第２のメモリ内の第
３のコヒーレンシ単位のコピーである場合にＣＯＭＡコ
ヒーレンシ要求を開始するように構成されることを特徴
とする多重処理コンピュータ・システム。
【請求項２】前記第１のシステム・インタフェース
が、前記ＣＯＭＡコヒーレンシ要求を開始する前に前記
ローカル物理アドレスを対応するグローバル・アドレス
に変換するように構成されたローカル物理アドレス／グ
ローバル・アドレス変換装置を備えることを特徴とする
請求項１に記載の多重処理コンピュータ・システム。
【請求項３】前記第１のシステム・インタフェースが
さらに、前記ローカル物理アドレスに対応するコヒーレ
ンシ状態を含む複数のコヒーレンシ状態を記憶する記憶
域を備えることを特徴とする請求項２に記載の多重処理
コンピュータ・システム。
【請求項４】前記第１のシステム・インタフェース
が、前記コヒーレンシ状態を調べることによって前記Ｃ
ＯＭＡコヒーレンシ要求が生成されるかどうかを判定す
るように構成されることを特徴とする請求項３に記載の
多重処理コンピュータ・システム。
【請求項５】前記複数のコヒーレンシ状態が、前記第
１のメモリに記憶されている各コヒーレンシ単位ごとの
コヒーレンシ状態を含むことを特徴とする請求項３に記
載の多重処理コンピュータ・システム。
【請求項６】前記第１の処理ノードが、前記第１のプ
ロセッサを含む第１の複数のプロセッサを備えることを
特徴とする請求項１に記載の多重処理コンピュータ・シ
ステム。
【請求項７】前記第１の処理ノードが、対称型多重処
理ノードを備えることを特徴とする請求項６に記載の多
重処理コンピュータ・システム。
【請求項８】前記第１の複数のプロセッサが、前記第
１の処理ノード内の共用バス上でトランザクションを行
うように結合され、前記第１のシステム・インタフェー
スも前記共用バスに結合されることを特徴とする請求項
７に記載の多重処理コンピュータ・システム。
【請求項９】前記第１の複数のプロセッサがそれぞ
れ、第１の複数の外部キャッシュのそれぞれのキャッシ
ュを介して前記共用バスに結合されることを特徴とする
請求項８に記載の多重処理コンピュータ・システム。
【請求項１０】さらに、前記第１の処理ノードおよび
前記第２の処理ノードに結合された第３の処理ノードを
備え、前記第２の処理ノードが、前記第３の処理ノード
が前記第３のコヒーレンシ単位の第２のコピーを記憶し
ている場合に前記第１の処理ノードからのコヒーレンシ
要求に応答して前記第３の処理ノードに対するコヒーレ
ンシ・デマンドを生成するように構成され、前記第３の
処理ノードが、前記コヒーレンシ・デマンドに応答して
前記第１の処理ノードへコヒーレンシ応答を送るように
構成されることを特徴とする請求項１に記載の多重処理
コンピュータ・システム。
【請求項１１】前記コヒーレンシ応答が、前記第３の
コヒーレンシ単位を含み、前記第１のシステム・インタ
フェースが、前記第１のプロセッサに前記第３のコヒー
レンシ単位を与えるように構成され、前記第１のシステ
ム・インタフェースがさらに、前記コヒーレンシ要求が
前記ＣＯＭＡコヒーレンシ要求である場合に前記第３の
コヒーレンシ単位を前記第１のコヒーレンシ単位として
前記第１のメモリに記憶するように構成されることを特
徴とする請求項１０に記載の多重処理コンピュータ・シ
ステム。
【請求項１２】多重処理システム内の処理ノード用の
システム・インタフェースであって、前記処理ノード内のプロセッサによって開始されたトラ
ンザクションを受け取るように結合され、前記トランザ
クションに対応するアドレスがローカル物理アドレスで
ある場合に前記トランザクションに応答してＣＯＭＡコ
ヒーレンシ要求を生成するように構成され、前記アドレ
スがグローバル・アドレスである場合に前記トランザク
ションに応答してＮＵＭＡコヒーレンシ要求を生成する
ように構成された、要求エージェントと、前記要求エージェントに結合され、前記ローカル物理ア
ドレスを対応するグローバル・アドレスに変換するよう
に構成された、ローカル物理アドレス／グローバル・ア
ドレス変換装置とを備えることを特徴とするシステム・
インタフェース。
【請求項１３】前記要求エージェントが、前記ローカ
ル物理アドレス／グローバル・アドレス変換装置から前
記対応するグローバル・アドレスを受け取り、前記要求
エージェントがさらに、前記対応するグローバル・アド
レスおよび前記ＣＯＭＡコヒーレンシ要求に関するアド
レスを使用するように構成されることを特徴とする請求
項１２に記載のシステム・インタフェース。
【請求項１４】さらに、前記アドレスが前記ローカル
物理アドレスである場合に前記トランザクションの前記
アドレスに対応するコヒーレンシ単位に対応するコヒー
レンシ状態を記憶するように構成された記憶域を備える
ことを特徴とする請求項１２に記載のシステム・インタ
フェース。
【請求項１５】さらに、前記記憶域および前記要求エ
ージェントに結合されたトランザクション・フィルタを
備え、前記トランザクション・フィルタが、前記コヒー
レンシ状態で表されるアクセス権が前記トランザクショ
ンを前記処理ノード内で完了するのに十分なものである
かどうかを判定するように構成され、かつ前記アクセス
権が前記トランザクションを前記処理ノード内で完了す
るのに不十分なものである場合に、前記トランザクショ
ンを前記要求エージェントへ搬送するように構成され、
かつ前記アクセス権が前記トランザクションを前記処理
ノード内で完了するのに十分なものである場合に、前記
トランザクションの前記要求エージェントへの搬送を抑
制するように構成されることを特徴とする請求項１４に
記載のシステム・インタフェース。
【請求項１６】第１のプロセッサと第１のメモリとを
備える第１の処理ノードを含み、さらに、第２の処理ノ
ードを含む、多重処理コンピュータ・システムを操作す
る方法であって、前記第１のプロセッサによって実行される、コヒーレン
シ単位に対応するアドレスを有するトランザクションを
開始することと、前記アドレスが、前記多重処理コンピュータ・システム
によって使用され前記第１の処理ノードに割り当てられ
るアドレス空間の第１の部分内に存在する場合に、ＣＯ
ＭＡコヒーレンシ要求を生成することと、前記アドレスが、前記第２の処理ノードに割り当てられ
る前記アドレス空間の第２の部分内に存在する場合に、
ＮＵＭＡコヒーレンシ要求を生成することとを含むこと
を特徴とする方法。
【請求項１７】さらに、前記第１の処理ノード内で、
前記コヒーレンシ単位を含むコヒーレンシ応答を受け取
ることと、前記第１のプロセッサに前記コヒーレンシ単
位を与えることとを含むことを特徴とする請求項１６に
記載の方法。
【請求項１８】さらに、前記コヒーレンシ応答が前記
ＣＯＭＡコヒーレンシ要求に応答するものである場合
に、前記コヒーレンシ単位を前記第１のメモリに記憶す
ることを含むことを特徴とする請求項１７に記載の方
法。
【請求項１９】さらに、前記コヒーレンシ応答が前記
ＮＵＭＡコヒーレンシ要求に応答するものである場合
に、前記コヒーレンシ単位の前記第１のメモリへの記憶
を抑制することを含むことを特徴とする請求項１８に記
載の方法。
【請求項２０】ＣＯＭＡコヒーレンシ要求の前記生成
が、前記第１の処理ノードに記憶されているアクセス権
が前記トランザクションを前記第１の処理ノード内で完
了するのに不十分なものである場合に実行されることを
特徴とする請求項１６に記載の方法。