JPH11161619A

JPH11161619A - マルチプロセッサ・コンピュータ・システム用スヌープ・フィルタ

Info

Publication number: JPH11161619A
Application number: JP10183806A
Authority: JP
Inventors: Andrew E Phelps; アンドリュー・イー・フェルプス
Original assignee: Sun Microsystems Inc
Current assignee: Sun Microsystems Inc
Priority date: 1997-06-30
Filing date: 1998-06-30
Publication date: 1999-06-18
Also published as: US5966729A; EP0889403A3; DE69841190D1; EP0889403A2; EP0889403B1

Abstract

(57)【要約】【課題】マルチプロセッサ・コンピュータ・システム
における複数のプロセッサのグループに処理を分配する
ための改良方法および装置を提供する。【構成】まず、アドレス・リクエストを第一のプロセ
ッサのグループで受信する。アドレス・リクエストは、
リクエストされたメモリ・ページに対応するメモリアド
レスと関連付けられる。次に、アドレス・リクエストに
関係するプロセッサのグループとアドレス・リクエスト
に関係しないプロセッサのグループを識別する。そし
て、関係するプロセッサのグループに対してほぼ同時に
アドレス・リクエストを同報通信し、関係しないプロセ
ッサのグループに対して同報通信をしない。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、マルチプロセッサ
・コンピュータ・システムに関し、より詳しくはマルチ
プロセッサ・コンピュータ・システムにおけるメモリ・
アクセス・リクエスト処理に関する。

【０００２】

【従来の技術】従来のプロセッサの計算処理速度は急激
に増加しているが、さらに高速の計算処理能力が必要と
されている。計算処理上の大きな課題には、天気予報、
核融合モデリングおよび航空機のシミュレーション等が
あり、ここでは現在供給可能なものをはるかに超える実
質的な計算処理能力が必要とされている。装置が高速化
されるにしたがってプロセッサも高速化されてきている
が、求められる性能レベルはコンピュータ上の複雑な問
題を処理するためにいまなお不十分である。

【０００３】高性能の計算処理を達成するために、複数
の別々のプロセッサが相互接続され、パラレル処理を可
能にするマルチプロセッサ・コンピュータ・システムを
構成している。

【０００４】マルチプロセッサ計算処理システムにおい
て、プロセッサ・メモリ・リクエストを満足させる二種
類の遅延源が存在する。第一の遅延源は、メイン・メモ
リへのアクセス・タイムであり、第二の遅延源は、各種
プロセッサを接続する相互接続ネットワークによって課
せられるコミュニケーション遅延である。相互接続ネッ
トワークの帯域幅が不適正である場合、コミュニケーシ
ョン遅延は帯域幅の競合によってかなり増加する。

【０００５】相互接続ネットワークの帯域幅およびアク
セス・タイムの制限に対して提案される１つの解決策
は、個々のプロセッサにおいて専用のキャッシュメモリ
を使用することである。キャッシュ・パラメータを適正
に選択することによって、伝達比（キャッシュからメイ
ン・メモリに通過するメモリ・リクエストとキャッシュ
で形成される初期リクエストとの比率）と有効アクセス
・タイムを減少させることができる。残念ながら、メイ
ン・メモリ位置の複数コピーが可能であることによっ
て、専用のキャッシュには、スティル・データ（stale
data）の問題（またはマルチキャッシュ・コヒーレンシ
ーの問題）が生じる。

【０００６】提案されるもう１つの解決策は、コヒーレ
ンシー・ディレクトリ（coherencydirectories ）の使
用を含む。コヒーレンシー・ディレクトリは、トラック
を保持する概して大きな分割メモリ・ブロックであり、
このブロックは、トラックを保持して、マルチプロセッ
サ・コンピュータ・システムにおけるそのプロセッサ
が、メモリのいずれかのラインを所有する。残念なが
ら、コヒーレンシー・ディレクトリは追加メモリを必要
とするため高価である。また、コヒーレンシー・ディレ
クトリは通常、テーブル索引フォーマットに構成される
ためメモリが低速である。さらに、メモリの呼出しをア
ドレス・リクエストごとに行う必要があるため、コヒー
レンシー・ディレクトリは、システム全体の性能をかな
り低下させる可能性がある。

【０００７】さらに最近、共有メモリマルチ処理システ
ムは、シングル・バス（例えばアドレス・バス）によっ
てプロセッサ（またはプロセッサ・グループ）を相互接
続した。残念ながら、プロセッサの速度が高速化する
と、シングル・バスを介して接続できるプロセッサの個
数が減少する。バスの使用に伴う課題の１つは、さらに
多くの装置をバスに追加すると性能が低下することであ
る。これは、さらに多くのプロセッサをバスに追加する
と、プロセッサが使用できるバスの帯域幅が実際狭まる
ことを意味する。

【０００８】図１Ａは、従来のマルチプロセッサ・コン
ピュータ・システム１００の一部を示したブロック図で
あり、各種プロセッサ・グループ間の代表的なスヌープ
結果パスを図示している。コンピュータ・システム１０
０は、第一のプロセッサ・グループ１１０と第二のプロ
セッサ・グループ１２０と第三のプロセッサ・グループ
１３０とアドレス相互接続１５０とデータ相互接続１６
０とを含む。なお、図１Ａではプロセッサ・グループを
３つのみ図示しているが、マルチプロセッサ・コンピュ
ータ・システム１００は、一般に適当数のプロセッサ・
グループを含むことに留意されたい。プロセッサ１１
０、１２０および１３０の通信は、二方向バス１４０お
よび１４２によって行われる。各プロセッサ・グループ
１１０、１２０および１３０は、スヌープ結果ディスト
リビュータとアドレス・リピータを含む。アドレス・リ
ピータは、二方向バス１４０および１４２によってアド
レス相互接続１５０と通信するために使用される。概し
て、アドレス相互接続１５０は、アドレス・リクエスト
をコンピュータ・システム１００内にある各アドレス・
リピータに同報通信するが、データ相互接続１６０はポ
イントとポイントとのルータとして作動する。

【０００９】動作時に、プロセッサ・グループ１１０、
１２０および１３０は、その各メモリアドレス・リクエ
ストを直接アドレス相互接続１５０に転送する。アドレ
ス相互接続１５０は、相反するアドレス・リクエストを
いずれも仲介し、同時にシステム１００内にある（オリ
ジナル・リクエスタ・グループを含む）あらゆるプロセ
ッサ・グループに対して選択されたリクエストされたア
ドレス・リクエストを同報通信し返す。受信すると、各
プロセッサ・グループは、グループ・スヌープ結果を作
成し、その独自のスヌープ結果ディストリビュータに記
憶する。次に、各グループのスヌープ結果ディストリビ
ュータは、システム１００内にある各プロセッサ・グル
ープ内のその他スヌープ結果ディストリビュータすべて
に対してその各グループ・スヌープ結果を同報通信す
る。このようにして、コンピュータ・システム１００内
にある各プロセッサ・グループは、その他すべてのプロ
セッサ・グループのグループ・スヌープ結果を入手す
る。その後、プロセッサ・グループは、アドレス・リク
エストを開始し、コンピュータ・システム１００内にあ
る適正なメモリ位置に対して方向づけされる。このよう
なスヌープ結果ディストリビュータを有するスヌープシ
ステムを利用した従来のマルチプロセッサシステムは、
ＣＡ，ＭｏｕｎｔａｉｎＶｉｅｗにあるサンマイクロ
システムズ社製造のＳＴＡＲＦＩＲＥシステムによって
実現されている。

【００１０】図１Ｂは、図１Ａに図示された従来のマル
チプロセッサ・コンピュータ・システム１００における
典型的なメモリアドレス・リクエスト・トランザクショ
ンを示すフローチャートである。

【００１１】従来のマルチプロセッサ・コンピュータ・
システムのメモリアドレス・リクエスト・トランザクシ
ョン・プロセス１５０では、まず、個々のプロセッサが
アドレス・リクエストを関係するアドレス・リピータに
送出する（１０）。当業者に周知のように、プロセッサ
・グループにおける少なくとも１つのプロセッサが、通
常アドレス・リクエストを生成し、メモリの特定のブロ
ックを検索する。アドレス・リクエストは、典型的に
は、メモリのブロックがプロセッサによってリクエスト
されているという目的を示す特定のメモリコマンドと関
連付けられている。アドレス・リクエスタ１２は、受信
したアドレス・リクエストを従来のマルチプロセッサ・
コンピュータ・システム１００と関連するアドレス相互
接続に転送する（１２）。アドレス相互接続は、適切な
相反仲介の後、選択されたアドレス・リクエスト１４を
従来のマルチプロセッサ・コンピュータ・システム１０
０内に含まれるすべてのアドレス・リピータに対して同
報通信する（１４）。ここには、プロセッサのオリジナ
ル・リクエスタ・グループと関連するアドレス・リピー
タを含む。各関連するアドレス・リピータ１６は、受信
されたアドレス・リクエストをその関連する個々のプロ
セッサのそれぞれに対して同報通信する（１６）。個々
のプロセッサは、それぞれ、順番にその各メモリキャッ
シュに照会してリクエストされたメモリアドレスのコピ
ーを所有したかもしくは共有したかのいずれかを決定す
る（１８）。この決定１８に基づいて、各プロセッサ
は、個々のスヌープ結果を生成し、この結果は、次に、
プロセッサのグループと関連付けられるスヌープ結果デ
ィストリビュータに転送される（２０）。スヌープ結果
ディストリビュータは、次に、個々のプロセッサから受
信されたすべての個々のスヌープ結果を組み合わせて
（２２）グループ・スヌープ結果を形成する。次に、ス
ヌープ結果ディストリビュータは、グループ・スヌープ
結果をコンピュータ・システム１００内にあるすべての
他のスヌープ結果ディストリビュータに対して同報通信
する（２４）。各スヌープ結果ディストリビュータは、
グループ・スヌープ結果をシステム１００内にあるプロ
セッサの他のグループすべてから同報通信し、かつ受信
することができるためである。

【００１２】各スヌープ結果ディストリビュータは、コ
ンピュータ・システム１００内にあるあらゆる他のスヌ
ープ結果ディストリビュータから受信されたグループ・
スヌープ結果を組み合わせて（２６）グローバル・スヌ
ープ結果を形成する。グローバル・スヌープ結果には、
システム１００内にあるすべてのプロセッサ・グループ
にリクエストされたメモリアドレスと関連するメモリの
ページの所有に関する情報が含まれる。各スヌープ結果
ディストリビュータはグローバル・スヌープ結果をその
関連するプロセッサのグループ内にある個々のプロセッ
サすべてに転送する（２８）。グローバルスヌープ結果
を受信すると、オリジナル・リクエスタ・プロセッサは
メモリのリクエストしたページを入手する（３０）。

【００１３】コンピュータ・システムに追加されたプロ
セッサの数が増加すると、アドレス・バスの関連性のな
いデータの量によってシステムの性能全体が低下する。
例えば、さらに多くのプロセッサがコンピュータ・シス
テムに追加されると、ある点で最大アドレス帯域幅がシ
ステム性能全体の改良を阻止してしまう。その場合、よ
り多くのプロセッサを追加しても追加の性能は得られな
い。

【００１４】

【発明が解決しようとする課題】したがって、マルチプ
ロセッサ・コンピュータ・システムにおける各種プロセ
ッサ間のアドレス・リクエストの送信を減少させるテク
ニックが必要である。

【００１５】

【課題を解決するための手段】広義に記載すると、本発
明は、マルチプロセッサ・コンピュータ・システム中の
プロセッサの複数のグループ中にアドレス・リクエスト
を分配する改善された方法および装置に関する。本発明
によると、アドレス・リクエストは、メモリのリクエス
トされたページに関係するプロセッサのグループにのみ
同報通信される。このようにして、アドレス・リクエス
トの分配に必要となるアドレスの帯域幅は、それに応じ
て減少する。

【００１６】本発明は、例えば方法、コンピュータ・シ
ステムおよび装置として実施することを含めて、様々な
態様で実施できる。本発明のいくつかの実施態様を後述
する。

【００１７】アドレス・リクエストをマルチプロセッサ
・コンピュータ・システムにおける複数のプロセッサの
グループに分配するための方法である本発明の実施態様
は、第一のプロセッサのグループにおいて、リクエスト
されたメモリ・ページに対応するメモリアドレスと関連
付けるアドレス・リクエストを受信する操作と、プロセ
ッサのグループのアドレス・リクエストに関係するプロ
セッサのグループを識別する操作と、アドレス・リクエ
ストを関係するプロセッサのグループに対してほぼ同時
に同報通信し、関係しないプロセッサのグループに対し
て同報通信しない操作とを含む。

【００１８】マルチプロセッサ・コンピュータ・システ
ムである本発明の一実施態様は、複数のプロセッサのグ
ループを含む。複数のプロセッサのグループは第一のプ
ロセッサのグループを含み、これは、リクエストされた
メモリ・ページに対応するメモリアドレスと関連付けら
れるアドレス・リクエストを受信する。また、関係する
プロセッサのグループは、アドレス・リクエストに関係
するプロセッサのグループであり、関係しないプロセッ
サのグループは、アドレス・リクエストに関係しないプ
ロセッサのグループである。マルチプロセッサ・コンピ
ュータ・システムは、複数のアドレス・リピータをさら
に含み、各アドレス・リピータは、プロセッサのグルー
プの１つと関連付けられ、アドレス・リクエストを受信
し、かつ同報通信できる。コンピュータ・システムは、
複数のスヌープ・フィルタをさらに含み、それぞれがプ
ロセッサのグループの１つと関連付けられ、それぞれが
関係するプロセッサのグループと、関係しないプロセッ
サのグループとを識別できる。さらに、コンピュータ・
システムは、アドレス相互接続を含み、プロセッサのグ
ループのそれぞれに関連するスヌープ・フィルタのそれ
ぞれに電気的に接続されている。アドレス相互接続は、
アドレス・リクエストを関係するプロセッサのグループ
に対してほぼ同時に同報通信することができ、かつ関係
しないプロセッサのグループに対して同報通信をしな
い。

【００１９】さらに別の実施形態において、マルチプロ
セッサ・コンピュータ・システムは、複数の処理要素
と、前記処理要素によって共有される共有リソースと、
前記処理要素および前記共有リソースを相互接続するバ
スと、トラヒック・フィルタとを含む。トラヒック・フ
ィルタは、トラヒック・オペレーションを減少させ、マ
ルチプロセッサ・コンピュータ・システムにおけるバス
でのトラヒックを減少させる。

【００２０】本発明には多数の利点がある。本発明にお
ける１つの利点は、アドレス相互接続の帯域幅によって
システム全体の性能低下をなくすことである。本発明の
もう１つの利点は、アドレス相互接続によって多数のプ
ロセッサまたはプロセッサのグループについてアドレス
・リクエストを処理できることである。本発明のまた別
の利点は、同時に多数のアドレス・リクエストを分配で
きることである。

【００２１】

【発明の実施の形態】本発明の他の態様および利点は、
本発明の原理を例として説明する、添付の図面とともに
行った以下の詳細な説明から明らかになろう。

【００２２】本発明は、添付の図面とともに以下の詳細
な説明を読めば容易に理解できよう。図面中、同じ参照
番号は同じ要素を示す。

【００２３】本発明はマルチプロセッサ・コンピュータ
・システムにおいて複数グループのプロセッサにアドレ
ス・リクエストを分配するための改良方法および装置に
関する。本発明において、アドレス・リクエストはメモ
リのリクエストされたページに関係するプロセッサのグ
ループのみに同報通信される。このようにすればアドレ
ス・リクエストの分配に必要なアドレス帯域幅はこれに
応じて縮小する。ここで、「プロセッサ・グループ」と
は１つのボード（例えば、プリント配線基板）を共有す
るあらゆる数のプロセッサでもよいし、またはコンピュ
ータ・システムに含まれる全プロセッサのサブセットで
もよい。例として２、３あげれば、１２のプロセッサシ
ステムの場合、１グループが３台のプロセッサとして、
４グループとしてもよいし、１グループを１台とした１
２グループでもよい。もちろん、プロセッサの各グルー
プが同数のプロセッサを含む必要はない。

【００２４】本発明の一実施形態において、スヌープ・
フィルタは、中央に集められたブロード・キャスターが
関係するプロセッサ・グループおよび処理に関係のない
プロセッサ・グループを認識することを可能にする。ス
ヌープ・フィルタは別々の集積回路チップ、もう１つと
一体化している集積回路チップ、またはコンピュータ・
システムのチップである。

【００２５】関係するプロセッサ・グループとは、メモ
リの要求された、すなわちリクエストされたブロック
（例えば、ページまたはライン）上でオペレーションを
実行したことのあるプロセッサ・グループである。別の
実施形態では、そのグループのいずれかのプロセッサ
が、メモリのリクエストされたブロックのいずれかのラ
インのキャッシュコピーを得るリクエストを行った場合
には、そのプロセッサ・グループはメモリのリクエスト
ブロックに関係しているといえる。もう１つの実施形態
では、そのグループのいずれかのプロセッサがメモリの
リクエストブロックに関係する場合は、そのプロセッサ
・グループがメモリのリクエストブロックに関係すると
いえる。例として、ＲｅａｄｔｏＯｗｎ（所有の読
み取り）オペレーションは、リクエストしたプロセッサ
がリクエストされたメモリ・アドレスに関係するメモリ
・ブロックへの書き込み、もしくは修正を望むオペレー
ションである。リクエストされたメモリ・ブロックの内
容は変更されるので、リクエストされたメモリ・ブロッ
クのキャッシュコピーを有するすべてのプロセッサは、
メモリ・ブロックのコピーが唯一有効の場合に、メモリ
・ブロックのコピーのリクエストしているプロセッサへ
の最初の配送の後、リクエストされたメモリ・ブロック
のコピーを無効にする。メモリ制御装置は、グローバル
スヌープ結果がメモリのコピーが有効だと示した場合
に、メモリにそのコピーを配送するよう指示する。もう
１つの関係するメモリオペレーション例はＲｅａｄｔ
ｏＳｈａｒｅ（共有の読み取り）である。このＲｅａ
ｄｔｏＳｈａｒｅは、リクエストしたプロセッサが
メモリ・リクエストページを読み出すことのみ望み、他
プロセッサのキャッシュまたはメモリ内のリクエストさ
れたブロックの他の有効コピーを排除しないオペレーシ
ョンである。

【００２６】本発明の実施形態は図２〜図７Ｃを参照し
ながら以下に説明される。しかしながら、その分野の当
業者はここに与えられている図に関する説明は解説のた
めであり、本発明はこれらの実施形態に限られるもので
はないことを容易に理解するであろう。

【００２７】図２は本発明の一実施形態におけるマルチ
プロセッサ・コンピュータ・システム２００のブロック
図である。マルチプロセッサ・コンピュータ・システム
２００は複数のプロセッサ・グループ、細かくいえば、
少なくともプロセッサ・グループ２１０およびプロセッ
サ・グループ２２０を含む。ここで示される実施形態で
は、プロセッサ・グループ２１０は関係するスヌープ・
フィルタ２３０を有し、プロセッサ・グループ２２０は
関係するスヌープ・フィルタ２３２を有する。通常、プ
ロセッサ・グループ２１０は複数のプロセッサを含む。
しかしながら、一般的に、プロセッサ・グループは１つ
または複数の処理要素を含む。この実施形態では、プロ
セッサ・グループ２１０はアドレス・リピータ２１３お
よびスヌープ結果ディストリビュータ２１２を含む。ア
ドレス・リピータ２１３はプロセッサ・グループ２１０
で受信されたアドレス・リクエストをアドレス・リピー
タバスインタフェース２４０を介してスヌープ・フィル
タ２３０へ転送する。同様に、プロセッサ・グループ２
２０はアドレス・リピータ２６３、スヌープ結果ディス
トリビュータ２６２を含み、同様に操作される。

【００２８】コンピュータ・システム２００により実行
されるスヌーピング操作は、プロセッサ・グループ２１
０を参照しながら説明されるが、通常すべてのプロセッ
サ・グループは同様に操作される。スヌープ・フィルタ
２３０は、アドレス・リクエストを受信すること、およ
び適切な出力コマンドを作成することが可能である。ス
ヌープ・フィルタ２３０は次に、出力コマンドをバスイ
ンタフェース２４２経由でアドレス相互接続２５０へ転
送する。一般的に、アドレス相互接続２５０は、ポイン
トとポイントとのルータ、またはバスとしてデータ相互
接続２７０が作動するコンピュータ・システム２００内
に含まれるそれぞれのアドレス・リピータへトランザク
ション（例えば、トランザクション・リクエスト）を同
報通信する。

【００２９】コンピュータ・システム２００内のすべて
のプロセッサ・グループは、個々のアドレス・リクエス
トをアドレス相互接続２５０に転送する。中央アドレス
アービタ（図に示されていない）は、アドレス相互接続
２５０に含まれてから、適切な仲介アルゴリズムに基づ
いてアドレス相互接続２５０で受信されたアドレス・リ
クエストから１つのアドレス・リクエストを選択する。
選択されたアドレス・リクエスト（関係するコマンドお
よびメモリ・ページ・アドレスと共に）は、それから、
関係をもたないプロセッサ・グループのスヌープ・フィ
ルタへ、別の相反しないアドレス・リクエストを同報通
信すると同時に、すべての関係するプロセッサ・グルー
プのためにアドレス相互接続２５０によりスヌープ・フ
ィルタへほぼ同時に同報通信する。

【００３０】各プロセッサ・グループに関連付けられる
スヌープ・フィルタは、各関係するプロセッサ・グルー
プ用に、選択されたアドレス・リクエストおよびコマン
ドを関係するアドレス・リピータへ転送する。各アドレ
ス・リピータは次に、順に、選択されたアドレス・リク
エストおよびコマンドを関係するグループ・プロセッサ
内のすべての個別プロセッサへ転送する。例として、ス
ヌープ・フィルタ２３０は選択されたアドレス・リクエ
ストおよびコマンドを受信し、そしてその後関連するア
ドレス・リピータ２１３を介して同じものをプロセッサ
・グループ２１０へ転送する。

【００３１】説明されている実施形態において、プロセ
ッサ・グループ２１０に含まれる個々のプロセッサは次
に、それら自身のメモリキャッシュに照会して、リクエ
ストされたメモリ・ページのコピーを持つかどうかを決
定し、個々のスヌープ結果を作成する。別の実施形態に
おいて、プロセッサ・グループ２１０に含まれる個々の
プロセッサは、それら自身のメモリキャッシュに照会し
て、リクエストされるメモリ・ページに関係するメモリ
ラインのコピーを持つかどうかを決定し、個々のスヌー
プ結果を作成する。そのため、プロセッサ・グループ２
１０内の各プロセッサは、そのような個々のスヌープ結
果すべてがグループ・スヌープ結果へ集積されるプロセ
ッサ・グループのために、スヌープ結果をスヌープ結果
ディストリビュータ２１２へ転送する。スヌープ結果デ
ィストリビュータ２１２は次に、グループ・スヌープ結
果をプロセッサ・グループ２１０からシステム２００内
の全スヌープ結果ディストリビュータへ同報通信する。
スヌープ結果ディストリビュータ２１２はまた、コンピ
ュータ・システム２００の他のスヌープ結果ディストリ
ビュータからグループ・スヌープ結果を受信することが
可能であり、またそれらをグローバルスヌープ結果に集
積することも可能である。グローバルスヌープ結果はシ
ステム２００内の全プロセッサのスヌープ情報を含む。

【００３２】図３は図２に示されているマルチプロセッ
サ・コンピュータ・システム２００のプロセッサ・グル
ープ２１０の詳細ブロック図である。この実施形態にお
いて、プロセッサ・グループ２１０は個々のプロセッサ
２１１ａ、２１１ｂ、２１１ｃ、および２１１ｄを含
む。しかしながら、プロセッサ・グループ２１０はあら
ゆる適当数のプロセッサを含んでもよいことは理解され
るべきである。システム稼動中に、プロセッサ２１１
ａ、２１１ｂ、２１１ｃ、または２１１ｄのそれぞれ
は、対応する二方向アドレス・バス２１９ａ、２１９
ｂ、２１９ｃ、および２１９ｄを介してアドレス・リク
エストをアドレス・リピータ２１３に供給できる。例え
ば、プロセッサ２１１ｂは、二方向アドレス・バス２１
９ｂを介してアドレス・リピータ２１３へアドレス・リ
クエストを運べる。この実施形態では、プロセッサ・グ
ループ２１０の各プロセッサがアドレス・リクエストを
生成するが、アドレス・リピータ２１３はただ１つのア
ドレス・リクエストをそれぞれのサイクルに転送する。
この、アドレス・リピータ２１３による転送するアドレ
ス・リクエストの選択は、当分野で知られている仲介ア
ルゴリズムを使用することにより達成される。説明され
ている実施形態において、リクエストされた際に、プロ
セッサ２１１ａ、２１１ｂ、２１１ｃ、および２１１ｄ
の各々もまた各自のスヌープ結果をコネクタ２１８ａ、
２１８ｂ、２１８ｃ、および２１８ｄのそれぞれを介し
てスヌープ結果ディストリビュータ２１２へ転送する。

【００３３】本実施形態において、スヌープ結果ディス
トリビュータ２１２もまたメモリ２１５からのメモリ・
リクエストページの取り出しを助けるためにメモリ制御
装置２１４へ入力を生産する。例として、システム稼働
中にスヌープ結果ディストリビュータ２１２はメモリ制
御装置２１４へグローバルスヌープ結果を供給するが、
メモリ制御装置２１４はそれから、適切であれば、メモ
リ２１５にアドレス・リクエストに関係するメモリコマ
ンドに従って行動するよう指示する。一実施形態におい
て、メモリ２１５は、リクエスタープロセッサ・グルー
プのページ・アドレス・リクエストに基づいて、コネク
タ２１７を介してローカル・プロセッサ（すなわち、プ
ロセッサ２１１ａ、２１１ｂ、２１１ｃ、および２１１
ｄのうちの１つ）へ、データ相互接続２７０およびデー
タ・インタフェース２１６を介して非ローカル・プロセ
ッサへ、メモリ・リクエストページを送る。

【００３４】図４は本発明の一実施形態におけるスヌー
プ・フィルタ３００のブロック図である。図４に示され
るスヌープ・フィルタ３００は、各プロセッサ・グルー
プが各自に関連するスヌープ・フィルタを有するコンピ
ュータ・システム２００に含まれる複数のプロセッサ・
グループの１つに関連付けられている例示的なスヌープ
・フィルタである。スヌープ・フィルタ３００がシステ
ム２００内の他プロセッサ・グループのそれぞれに複製
されていることを理解されたい。

【００３５】スヌープ・フィルタ３００はアドレス・バ
スインタフェース２４０を介してアドレス・リピータ２
１３から受信したアドレス・リクエストを並べる入力待
ち行列３２２を含む。この実施形態では、入力待ち行列
３２２からのアドレスビットが関係マップ３２０および
関係キャッシュ３２４へのインデックスを決める。マル
チプレクサ３２３は関係マップ３２０、関係キャッシュ
３２４、およびアドレス相互接続２５０に電気的に接続
されているバスインタフェース２４２へ待機アドレス・
リクエスト、関係中止インディケータ、または新規の関
係インディケータを転送する。決定論理ブロック３２８
は処理され、入力待ち行列３２２から待機アドレス・リ
クエストを受信するのと同様に、関係マップ３２０およ
び関係キャッシュ３２４の両方から出力データを受信す
る。

【００３６】この実施形態では、リモート書き込みマッ
プ３２６もまたデータを関係マップ３２０および関係キ
ャッシュ３２４へ書き込むために含まれている。リモー
ト書き込みマップ３２６は、関係するプロセッサ・グル
ープへローカルなメイン・メモリのページ毎に少なくと
も１ビットを含む。メモリ・ページに関係するビットが
設定される場合は、非ローカル・プロセッサ・グループ
にはメモリ・ページの少なくとも１キャッシュ・ライン
の所有が認められている。一実施形態においては、リモ
ート書き込みマップ３２６は１Ｍ×１ＳＲＡＭとして論
理的に構成される６４Ｋ×１８記憶装置の形をとっても
よい。

【００３７】スヌープ・フィルタ３００もまたページ・
スクラブ装置３５０およびマルチプレクサ３５２を含
む。ページ・スクラブ装置３５０は処理され、負のスヌ
ープ結果をもつあらゆるメモリ・ページでスクラブ操作
が実行される。スクラブ操作は、必要のない入力される
アドレス・トラヒックを排除するのに使用される。ペー
ジ・スクラブ装置３５０は、着信トラヒックを観測し、
スヌープ結果のないローカル・プロセッサ・グループの
アドレスを選択する。ページ・スクラブ装置３５０は次
に、使用されていないサイクル中に一連の局所読み出し
を始め、それから選択ページを監視し、このメモリ・ペ
ージへの発信トランザクションがある場合、または正の
スヌープ結果の着信トランザクションがある場合には、
このページのスクラブは中止され、新規のページが選択
される。ページ・スクラブ装置３５０はこのページのラ
イン毎に、ローカルグループでローカルトランザクショ
ンを生成するか、もしくは空サイクルに挿入される。メ
モリの各行に、初めにＲｅａｄｔｏＳｈａｒｅが生
成され、ローカル所有のコピーが存在しない場合には、
関係するプロセッサ・グループのあらゆる共有コピーを
無効にするＲｅａｄｔｏＯｗｎが続けられる。マルチ
プレクサ３５２はページ・スクラブ装置３５０から入力
待ち行列３２２へＲｅａｄｔｏＯｗｎおよびＲｅａ
ｄｔｏＳｈａｒｅコマンドを供給する。しかしなが
ら、所有コピーが存在する場合には、ページ・スクラブ
は中止され新規のページが選択される。ページ・スクラ
ブがページの最後に到達した場合には、関係中止処理が
生成され、それによって関係する関係マップおよび関係
キャッシュを更新する。

【００３８】もう１つの実施形態では、ソフトウェア・
スクラブがスクラブ装置に関係中止処理の２番目のタイ
プを生成させる、スヌープ・フィルタの制御レジスタに
書き込むことにより実行される。これは、オペレーティ
ング・システムがディスクからページを読み込んだ後、
またはページをゼロにした後、またはすべてのキャッシ
ュを無効にする処理でその上に上書きコピーした後に行
われる。

【００３９】この実施形態では、二種類ある関係中止処
理がページ・スクラブ装置３５０により作成される。一
番目の種類ではページ・スクラブ装置３５０はローカル
・プロセッサ・グループに非ローカルメモリ・ページで
の関係を失わせるトランザクションを生成する。二番目
の種類では、関係中止処理が行われ、これはすべての非
ローカルグループでメモリのローカルページ内の関係を
失わせる。

【００４０】この実施形態では、決定論理ブロック３２
８が、しばしばバスインタフェース２４２を介してアド
レス相互接続２５０に伝達される関係マスク４００を生
成する。ある状況では、決定論理ブロック３２８はパイ
プライン保持回路（図に示されていない）へ返送される
パイプ保持信号７００を作成することもある。パイプ保
持信号は関係マスクがメモリ・リクエストページ用に作
成されるまで、入力待ち行列３２２、関係マップ３２０
のパイプライン・ステージおよび自身のスヌープ・フィ
ルタの決定ブロック３２８への入力を差し控えることに
より、一時的にパイプライン・オペレーションを停止す
る効果を持つ。

【００４１】関係マップ３２０はＳＲＡＭ装置または動
的データ保存および取り出しが可能な他の適切な記憶装
置の形をとってもよい。一実施形態では、関係マップ３
２０は８Ｍ×１ＳＲＡＭとして論理的に構成される６４
Ｋ×１８装置の形をとってもよい。好ましくは、関係マ
ップ３２０はメイン・メモリのページ毎に少なくとも１
関係ビットを含み、またローカルおよび非ローカルメモ
リ・ページを理解するように構成される。説明されてい
る実施形態において、各関係ビットは８Ｋのページメモ
リに対応する。

【００４２】動作では、メイン・メモリの各ローカルペ
ージに関連する関係マップ３２０中の少なくとも１つの
関係ビットが、非ローカル・プロセッサ・グループに常
駐するプロセッサがメモリのリクエストされたローカル
ページでのオペレーションを以前に行っていた場合、設
定される。あるいはまた、ローカル・プロセッサ・グル
ープに常駐するプロセッサがかつてメモリのリクエスト
された非ローカルページでオペレーションを行ったこと
がある場合は、少なくとも１関係ビットがメイン・メモ
リの各非ローカルページに設定される。

【００４３】例として、図５は例示的な関係マップ３２
０を示している。関係マップ３２０は、プロセッサ・グ
ループ２１０と関係するものと仮定される。関係マップ
３２０は関係ビット３２１および関係３２２を含む相当
数の関係ビットを含む。関係ビット３２１は非ローカル
ページ・アドレス６１０（すなわち、グループ２１０外
のメモリに常駐する）に関連し、関係ビット３２２はロ
ーカルページ・アドレス６２０（すなわち、プロセッサ
・グループ２１０に常駐する）に関係する。この例で、
関係ビット３２１が図に示されるように論理１（論理０
に設定するとしてもよい）に設定されてる場合は、プロ
セッサ・グループ２１０内の少なくとも１つのプロセッ
サが非ローカルページ・アドレス６１０に多少関係する
ということである。あるいはまた、関係マップ３２０内
の関係ビット３２２が論理１に設定されている場合は、
グループ２１０外の少なくとも１つのプロセッサがロー
カルページ・アドレス６２０に多少関係するということ
である。

【００４４】図６は本発明の一実施形態における関係マ
ップ３２０およびプロセッサ・グループ２１０に関係す
る関係キャッシュ３４０を例示的に表現したものであ
る。好ましくは、各関係キャッシュはプロセッサ・グル
ープと同様に関係マップに関連付けられている。関係キ
ャッシュは一般的に、関係マップでの関係するプロセッ
サ・グループが非ローカル・プロセッサ・グループと共
有しているページ・アドレスのダイレクト・マップまた
はセット・アソシエート・キャッシュとして組織され
る。

【００４５】関係キャッシュ３４０に含まれる各ページ
・アドレスは関係マスクに関係する。関係マスクはマル
チプロセッサシステム２００内の各プロセッサ・グルー
プ用にシングル・グループ関係ビット４０２を含む。各
グループ関係ビットはリクエストされたページ・アドレ
スの関係するプロセッサ・グループの関係を示す。

【００４６】システム内のスヌープ・フィルタ操作を容
易にするために必要な追加ビットは、関係キャッシュ３
４０で供給されてもよい。例えば、更新ビット４０４が
関係するメモリ・ページでの新規の関係を示すのに加え
られてもよいし、また別の実施形態では「リモート書き
込みＯＫ」ビット４０６が、関連するページ・アドレス
が非ローカル・プロセッサ・グループにより所有されて
いるキャッシュ・ラインの少なくとも１つを有すること
を示すために、加えられてもよい。

【００４７】図６に示された例として、関係キャッシュ
３４０は非ローカルページ・アドレスタグ６１０に関係
する関係マスク４００を含む。この実施形態では、関係
マスク４００はシステム２００内のすべてのプロセッサ
・グループのグループ関係ビットを含む。上記のよう
に、ページ・アドレスタグ６１０はプロセッサ・グルー
プ２１０に関して非ローカルであり、また関係ビット３
２１が設定されるため、プロセッサ・グループ２１０は
ページ・アドレスタグ６１０に関係を持つ。この場合、
関係マスク４００のプロセッサ・グループ２１０に関係
するグループ関係ビット４０８が非ローカルページ・ア
ドレス６１０のプロセッサ・グループ２１０により関係
を示すために設定される。

【００４８】図４〜図６を参照しながら、スヌープ・フ
ィルタ３００の働きが説明される。一実施形態におい
て、プロセッサ・グループ２１０はローカルページ・ア
ドレス６１０に関係するアドレス・リクエストをアドレ
ス・リピータ２１３に転送する。アドレス・リピータ２
１３は、次に、アドレス・リピータバスインタフェース
２４０を介してスヌープ・フィルタ２３０の入力待ち行
列３２２へアドレス・リクエストを転送する。

【００４９】入力待ち行列３２２からアドレス・リクエ
ストが開放された後、スヌープ・フィルタ３００がロー
カルページ・アドレス６１０に関係する関係マップ３２
０の関係ビット３２１が設定されているかいないかを決
定する。この例では、ローカルページ・アドレス６１０
の関係ビット３２１は設定されているので、関係する関
係マスク（新規のアドレス・リクエストをまだ含んでい
ない前のオペレーションに基づいて）が関係キャッシュ
３４０から取り出され、関係マップ３２０から取り出さ
れたデータに加えて、決定ブロック３２８へ転送され
る。決定論理３２８はアドレス・リクエストの関係マス
ク４００を生成する。決定論理３２８は、バスインタフ
ェース２４２を介して関係マスク４００を、アドレス・
リクエストおよび関係するメモリコマンドと組み合わさ
れるアドレス相互接続２５０へ転送する。

【００５０】図７Ａ〜図７Ｃは本発明の一実施形態にお
けるマルチプロセッサ・コンピュータ・システム２００
でのシングル・メモリ・アドレス・リクエスト処理のフ
ィルタされた処理７００の詳細を表す流れ図である。以
下の説明においては、一般的にマルチプロセッサ・コン
ピュータ・システム２００の複数のプロセッサ・グルー
プが本質的には同時に複数のアドレス・リクエストを生
成することに注意すべきである。ここでは、説明を明確
にするために、プロセッサ・グループ２１０から１つの
アドレス・リクエストのためにフィルタされたスヌープ
処理７００が実行されるものとして説明される。

【００５１】メモリアドレス・リクエストのライフサイ
クルは、関係するメモリアドレスを持つメモリ・ページ
のリクエストを作成するプロセッサ・グループ内の個々
のプロセッサから開始される。図７Ａを参照して、最初
にリクエストするプロセッサを含むプロセッサのグルー
プに関係するアドレス・リピータはメモリ・ページ・ア
ドレス・リクエストを受信する（５１）。プロセッサの
リクエスター・グループに関係するスヌープ・フィルタ
はメモリ・ページ・アドレス・リクエストを受信する
（５２）。リクエストされたメモリ・ページ・アドレス
が一旦スヌープ・フィルタにより受信されたら、スヌー
プ・フィルタに関係する関係マップが取り出される（５
４）。次に、決定論理ブロックがメモリ・ページ・アド
レスがローカルまたは非ローカルアドレスであるかを決
定する（５５）。アドレスがローカルであると決定され
た場合、関係マップはメモリ・リクエスト・ページに関
係する関係マップ内のエントリーが０または１かを決定
するためにもう一度照会する（６９）。メモリ・リクエ
スト・ページに関係するエントリーが０であった場合、
スヌープ・フィルタに関係する論理ブロックがメモリ・
リクエスト・ページの関係マスクを、１に設定されるリ
クエスター・プロセッサ・グループを除いたすべてのグ
ループのすべての関係するビットを０に設定することに
より、「自己状態」（ｓｅｌｆｓｔａｔｅ）に設定す
る（７０）。このようにして、アドレス・リクエストは
優先順の一貫性を維持するためだけに発信プロセッサ・
グループに返される。

【００５２】一方、メモリ・リクエストページに関連す
る関係するマップ中のエントリーが１であった場合、ス
ヌープ・フィルタに関係する関係キャッシュは照会して
（７１）、リクエストされたページが関係キャッシュに
含まれるかどうかを決定する。メモリのリクエストされ
たページ・アドレスが関係キャッシュに含まれていない
と決定された場合には、関係マスクの全関係ビットが１
に設定されるのと同時に、更新ビットが設定される（７
２）。このようにして、更新ビットが設定されているた
めに、すべてのプロセッサ・グループは特別処理として
ページ・アドレス・リクエストを受信する。しかしなが
ら、ページ・アドレス・リクエストが関係キャッシュに
含まれていると決定された場合には、論理ブロックが関
係マスクを関係キャッシュから取り出されるパターンに
設定する（７３）。

【００５３】リクエストされたページ・アドレスがリク
エスタープロセッサ・グループに対して非ローカルであ
ると決定された場合には（５５）、決定論理ブロックが
メモリ・リクエストページに関係するエントリーが０ま
たは１であるかを決定する（５６）。しかしながら、１
であると決定された場合には、処理過程はローカルアド
レスであった場合と同様である。図７Ｃを参照して、リ
クエストされたページ・アドレスでの関係マップ内のエ
ントリーが０である場合は、論理ブロックがパイプ保持
信号を生成する（５２）。パイプ保持信号はリクエスタ
ー・プロセッサ・グループのすべての処理を一時停止す
る効果を持つ。このようにして、新規の関係処理が行わ
れ、それによりリクエスター・プロセッサ・グループ
が、今までは関係しなかったメモリ・リクエストページ
が関係するものになったことを、他の全プロセッサ・グ
ループに伝達する。新規の関係処理は、論理ブロックが
メモリ・リクエスト・ページに関係する関係マスクのす
べての関係ビットを１に設定する（５９）ことにより開
始される。関係マスクは中央アドレス・アービタに含ま
れる中央アドレス相互接続に転送される（６０）。中央
アドレス・アービタは、次に、受信したすべてのアドレ
ス・リクエストを優先させ、またシステム仲介アルゴリ
ズムに基づいて１つのリクエストを選択する。中央アド
レス・アービタがリクエストを認めた際、新規の関係処
理をすべての非ローカル・スヌープ・フィルタに転送す
る（６１）。各非ローカル・スヌープ・フィルタはそれ
ぞれの関係キャッシュに照会して（６２）、メモリのリ
クエストされたページがその中に含まれているかどうか
を決定する。メモリ・リクエストページのアドレスが関
係する関係キャッシュに含まれている場合には、リクエ
スト・ボードに関係するビットを１に設定することによ
り、各非ローカルスヌープ・フィルタがそれぞれの関係
マスクを更新する（６３）。次に、各非ローカルスヌー
プ・フィルタは関係マップを読み出し（６４）、その結
果を中央アドレスアービタへ転送する。中央アドレスア
ービタはその結果を全非ローカル・スヌープ・フィルタ
から、新規の関係マスクを関係キャッシュに蓄積、イン
ストールし（６６）、関係する関係マップに１をインス
トールする（６７）リクエスター・プロセッサ・グルー
プに関係するスヌープ・フィルタへ転送する（６５）。
最後に、論理ブロックはリクエスタープロセッサ・グル
ープのパイプをアンロックする効果をもつアンロック・
パイプ信号を転送する（６８）。パイプが一旦アンロッ
クされたら、リクエスター・プロセッサ・グループは同
様の過程をたどることが可能である。

【００５４】次に、図７Ｂを参照する。スヌープ・フィ
ルタはメモリ・ページ・アドレス・リクエストおよびオ
リジナル・コマンドに加えて、更新された関係マスクを
アドレス相互接続に含まれる中央アドレスアービタに転
送する（７４）。中央アドレスアービタは次に、アドレ
ス・リクエストおよび関連するコマンドを関係するプロ
セッサ・グループのスヌープ・フィルタに対して同報通
信する（７６）と同時に、非関係処理を他のプロセッサ
・グループのスヌープ・フィルタに対して同報通信する
（７７）。関係する各プロセッサ・グループのスヌープ
・フィルタは更新ビットが設定されているかどうか決定
する（７９）。更新ビットが設定されていると決定され
た場合、スヌープ・フィルタは関係する関係マップを読
み出し（８０）、メモリ・リクエスト・ページに関係す
る関係マップからオリジナル・リクエスター・プロセッ
サ・グループに関連するスヌープ・フィルタへビットを
転送する（８１）。

【００５５】関係するそれぞれのプロセッサ・グループ
の各スヌープ・フィルタは関係するプロセッサ・グルー
プに関係するすべてのスヌープ・フィルタにアドレス・
リクエストを同時に転送する（８２）。各アドレス・リ
ピータは、それから、関係するプロセッサ・グループに
含まれるすべてのプロセッサに同時に同報通信する（８
３）。関係するプロセッサ・グループの個々の各プロセ
ッサはリクエストされたページの共有または所有される
コピーがあるかどうか決定する（８４）。関係するプロ
セッサ・グループの全個別プロセッサはそれぞれのスヌ
ープ結果を関係するスヌープ結果ディストリビュータに
転送する（８５）。関係するスヌープ結果ディストリビ
ュータは次に、受信した個々のスヌープ結果をまとめ、
グループ・スヌープ結果にする（８６）。各スヌープ結
果ディストリビュータはシステム２００に含まれる関係
するプロセッサ・グループに関係するすべての関係ある
スヌープ結果ディストリビュータにグループ・スヌープ
結果を分配する（８７）。その後、プロセッサがメモリ
・リクエストページにアクセスする（８８）。

【００５６】説明されている実施形態において、アドレ
ス相互接続２５０は相反するアドレス・リクエスト間で
必要な相反仲介を行ってもよいし、また同報通信するの
に適切なアドレス・リクエストを選択してもよい。この
実施形態において、仲介アルゴリズムは概して最優先の
プロセッサ・グループを有する。与えられたいかなるサ
イクルにおいても、アルゴリズムは未解決のリクエスト
をもつプロセッサ・グループがいくつあるかを見て、ど
のプロセッサが最優先かを決定する。仲介アルゴリズム
は一番目の満たされていない最優先のプロセッサ・グル
ープか、または円順で一番目のプロセッサ・グループの
すぐ後のプロセッサ・グループを選択する。リクエスト
が一旦認められると、そのプロセッサ・グループには最
も低い優先権が割り当てられ、ライン上で次だったプロ
セッサ・グループに最も高い優先権が割り当てられる。
別の実施形態では、他の仲介アルゴリズムが適用されて
もよい。

【００５７】相反アービタがアドレス・リクエストを選
んだ後、アドレス相互接続２５０は選択されたアドレス
・リクエスト（例えば、アドレス・リクエスト２９０）
を型通りに関係するプロセッサ・グループに関係するす
べてのアドレス・リピータに対して同報通信するのと同
時に、あらゆる非相反処理を関係しないプロセッサ・グ
ループに関係するアドレス・リピータに対して同報通信
する。

【００５８】選択されたアドレス・リクエスト２９０が
一旦各関係するプロセッサ・グループ内の個別プロセッ
サのそれぞれに受信されると、各個別プロセッサはそれ
ぞれのメモリキャッシュに照会することによりそれぞれ
の個別スヌープ結果を作成する。このようにしてリクエ
ストされたメモリ・ブロックの共有または所有されたコ
ピーがあるかどうかを決定する。そのような決定の上
で、各プロセッサはそのグループに関連のあるスヌープ
結果ディストリビュータへ各自のスヌープ結果を転送す
る。スヌープ結果ディストリビュータはそこで、受信し
た個別スヌープ結果をグループ・スヌープ結果に蓄積
し、システム２００内の関係するグループにあるすべて
のスヌープ結果ディストリビュータへグループ・スヌー
プ結果を伝達する。伝達と同時に、各スヌープ結果ディ
ストリビュータはシステム２００内の他のすべての関係
するプロセッサ・グループからすべてのグループ・スヌ
ープ結果を受信し、蓄積し、グローバルスヌープ結果を
構成する。グローバルスヌープ結果はシステム２００内
のすべての関係するプロセッサおよびメモリ制御装置に
転送される。

【００５９】例として、プロセッサ２１１ａ〜２１１ｄ
はそれぞれのメモリキャッシュ（図に示されていない）
に照会する、およびその結果をコネクタ２１８ａ〜２１
８ｄのそれぞれを経由してスヌープ結果ディストリビュ
ータ２１２に転送することにより個々のスヌープ結果を
生成する。スヌープ結果ディストリビュータ２１２は、
個別プロセッサスヌープ結果をグループ・スヌープ結果
に組み入れ、そこで他のすべての関係プロセッサ・グル
ープにグループ・スヌープ結果を伝達する。本質的には
同時に、スヌープ結果ディストリビュータ２１２はシス
テム２００内の他のすべてのスヌープ結果ディストリビ
ュータからグループ・スヌープ結果を受信する。グロー
バル・スヌープ結果へすべてのグループ・スヌープ結果
が最終的に蓄積された上で、スヌープ結果ディストリビ
ュータ２１２はプロセッサ２１１ａ〜２１１ｄのそれぞ
れに、またメモリ制御装置２１４へグローバル・スヌー
プ結果を転送する。メモリ制御装置２１４は次に、メモ
リ２１５に関連するメモリコマンドに従って行動するよ
う指示する。

【００６０】本発明の多数の特徴および利点は以上の説
明から明らかであり、したがって、前記の請求の範囲は
本発明のこのようなすべての特徴および利点を包含する
ものである。さらに、多数の修正および変更が当業者に
は容易に思い付くので、本発明を図示し、説明した正確
な構成および動作に限定することを望まない。したがっ
て、適切なすべての修正形および等価物は本発明の範囲
内に入るものとする。

【図面の簡単な説明】

【図１Ａ】従来のマルチプロセッサ・コンピュータ・シ
ステムの一部分のブロック図である。

【図１Ｂ】従来のマルチプロセッサ・コンピュータ・シ
ステムにおける典型的なメモリ・リクエスト処理を示す
フローチャートである。

【図２】本発明の一実施形態における、関係するスヌー
プ・フィルタをもつプロセッサ・グループを有するマル
チプロセッサ・コンピュータ・システムのブロック図で
ある。

【図３】図２に示されるマルチプロセッサ・コンピュー
タ・システムのプロセッサ・グループの詳細ブロック図
である。

【図４】本発明の一実施形態におけるスヌープ・フィル
タのブロック図である。

【図５】本発明の一実施形態における関係マップを示す
図である。

【図６】本発明の一実施形態における関係キャッシュを
示す図である。

【図７Ａ〜図７Ｃ】本発明の一実施形態でのマルチプロ
セッサ・コンピュータ・システムにおける、シングルメ
モリアドレス・リクエスト処理の、フィルタされたスヌ
ープ処理の詳細を示すフローチャートである。

【符号の説明】

２００マルチプロセッサ・コンピュータ２１０プロセッサ・グループ２１１ａプロセッサ２１１ｂプロセッサ２１１ｃプロセッサ２１１ｄプロセッサ２１８ａコネクタ２１８ｂコネクタ２１８ｃコネクタ２１８ｄコネクタ２１９ａ二方向アドレス・バス２１９ｂ二方向アドレス・バス２１９ｃ二方向アドレス・バス２１９ｄ二方向アドレス・バス２１２スヌープ結果ディストリビュータ２１３アドレス・リピータ２１４メモリ制御装置２１５メモリ２１６データ・インタフェース２２０プロセッサ・グループ２３０スヌープ・フィルタ２３２スヌープ・フィルタ２４０アドレス・リピータバスインタフェース２４２バスインタフェース２５０アドレス相互接続２６２スヌープ結果ディストリビュータ２６３アドレス・リピータ２７０データコネクタ３００スヌープ・フィルタ３２０関係マップ３２２入力待ち行列３２３マルチプレクサ３２４関係キャッシュ３２６リモート書き込みマップ３２８決定論理ブロック３５０ページ・スクラブ装置３５２マルチプレクサ４００関係マスク４０２シングルグループ関係マップ４０４更新ビット４０６「リモート書き込みＯＫ」ビット６１０非ローカルページ・アドレス６２０ローカルページ・アドレス６２２ローカルページ・アドレス７００パイプ保持信号

【手続補正書】

【提出日】平成１０年１０月２３日

【手続補正１】

【補正対象書類名】図面

【補正対象項目名】全図

【補正方法】変更

【補正内容】

【図１Ａ】

【図１Ｂ】

【図５】

【図２】

【図６】

【図３】

【図４】

【図７Ａ】

【図７Ｂ】

【図７Ｃ】

フロントページの続き (71)出願人 591064003 901 ＳＡＮＡＮＴＯＮＩＯＲＯＡＤＰＡＬＯＡＬＴＯ，ＣＡ 94303，Ｕ. Ｓ．Ａ.

Claims

【特許請求の範囲】

【請求項１】リクエストされたメモリ・ページに対応
するメモリ・アドレスに関係するアドレス・リクエスト
を第一のプロセッサのグループにおいて受信するステッ
プと、アドレス・リクエストに関するプロセッサのグループを
識別し、かつアドレス・リクエストに関係しないプロセ
ッサのグループを識別するステップと、関係するプロセッサのグループにアドレス・リクエスト
をほぼ同時に同報通信し、関係しないプロセッサのグル
ープに同報通信をしないステップと、を備えたマルチプ
ロセッサ・コンピュータ・システム内にある複数のプロ
セッサのグループにおいてアドレス・リクエストを分配
する方法。
【請求項２】複数のプロセッサのグループが少なくと
もリクエストされたメモリ・ページに対応するメモリア
ドレスに関連するアドレス・リクエストを受信する第一
のプロセッサのグループと、アドレス・リクエストに関係するプロセッサのグループ
を含む関係するプロセッサのグループと、アドレス・リクエストに関係しないプロセッサのグルー
プを含む関係しないプロセッサのグループと、を含む複数のプロセッサのグループと、各アドレス・リピータがプロセッサのグループの１つと
関連付けられ、各アドレス・リピータがアドレス・リク
エストを受信しかつ同報通信できる複数のアドレス・リ
ピータと、各スヌープ・フィルタがプロセッサのグループの１つと
関連付けられ、各スヌープ・フィルタが関係するプロセ
ッサのグループと関係しないプロセッサのグループとを
識別できる複数のスヌープ・フィルタと、各プロセッサのグループと関連する各スヌープ・フィル
タと電気的に接続され、関係するプロセッサのグループ
にほぼ同時にアドレス・リクエストを同報通信できかつ
関係しないプロセッサのグループに同報通信しないアド
レス相互接続と、を備えたマルチプロセッサ・コンピュ
ータ・システム。
【請求項３】アドレス・リクエストに関係するプロセ
ッサのグループのうち少なくとも一つについて関係中止
処理を生成するスクラブ装置をさらに備えた請求項２に
記載のマルチプロセッサ・コンピュータ・システム。
【請求項４】複数の処理要素と、前記処理要素によって共有される共有リソースと、前記処理要素および前記共有リソースを相互接続するバ
スと、マルチプロセッサ・コンピュータ・システムにおけるバ
スでのトラヒックを減少させるトラヒック・フィルタ
と、を備えたマルチプロセッサ・コンピュータ・システ
ム。