JPH06274461A

JPH06274461A - 範囲指定可能なキャッシュ一致保証機能を有するマルチプロセッサシステム

Info

Publication number: JPH06274461A
Application number: JP5058332A
Authority: JP
Inventors: Michio Morioka; 道雄森岡; Kenichi Kurosawa; 憲一黒沢; Tetsuaki Nakamigawa; 哲明中三川; Suketaka Ishikawa; 佐孝石川
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1993-03-18
Filing date: 1993-03-18
Publication date: 1994-09-30
Anticipated expiration: 2013-11-05
Also published as: JP2819982B2; US6631447B1

Abstract

(57)【要約】【目的】大規模なマルチプロセッサシステムにおいて、
高速でかつプロセッサ間の通信量を低減可能なキャッシ
ュ一致保証を行い得るシステムの提供にある。【構成】プロセッサ２００に内蔵されるアドレス変換バ
ッファ２２０にキャッシュ一致保証の範囲を指定できる
属性情報２２３を保持し、プロセッサーメモリインター
フェース装置３００内に、キャッシュ一致保証属性情報
２２３に応じて、クラスタ１００内でのみキャッシュ一
致保証すれば良いのか、システム内の全キャッシュメモ
リ２４０を対象にキャッシュ一致保証すべきかを判定す
るキャッシュ一致保証制御機構３１０を設けた。【効果】データの特徴に合わせて、キャッシュ一致保証
すべき範囲を限定することができ、キャッシュ一致保証
制御の遅延を大幅に改善できる。また、メモリ読みだし
／書き込みごとにシステム内の全てのプロセッサにブロ
ードキャストする必要がなく、プロセッサ間の通信量を
大幅に低減することが可能になる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、計算機システムにおけ
るマルチプロセッサの高性能化に係り、特に分散したキ
ャッシュメモリの一致保証制御に係わるものである。

【０００２】

【従来の技術】近年、数十台から数千台のプロセッサを
効率良く動作させるスケーラブルな共有メモリマルチプ
ロセッサの研究が盛んである。これらのシステムでは、
Non-uniform Memory Access Architecture (ＮＵＭＡ)
と呼ばれる分散メモリ型システム構成を採用するものが
多い。すなわち、１つの共有メモリを数千台のプロセッ
サで共有すると、共有メモリのアクセスがボトルネック
となって十分な性能が得られない。ＮＵＭＡ構成とは、
これをさけるために、共有メモリを分散させるシステム
構成である。

【０００３】一方、プロセッサの高周波化に伴って、主
メモリアクセスのレイテンシがシステムの性能を決定す
る重要な要因となってきている。レイテンシを改善する
には主メモリをプロセッサの近くに実装することが望ま
しい。この点でも、各プロセッサごとにローカルメモリ
を持たせた分散メモリ型システム構成(ＮＵＭＡ)が適し
ている。本構成によれば、プロセッサの動作周波数向上
に合わせて、ローカルメモリの動作周波数を向上でき、
レイテンシを大幅に改善できる可能性がある。これら、
分散メモリシステムの従来例としては、以下がある。

【０００４】（１）Stanford大学のDASHシステム Daniel Lenoski, et. al.,“The DASH Prototype: Impl
ementation andPerformance”,Proc. 19th Int. Symp.
on Computer Architecture,1992. (2)SCI(Scalable Coherent Interface) David B. Gustavson, “The Scalable Coherent Interf
ace and RelatedStandards Projects”, IEEE MICRO, p
p.10−22, 1992. （３）IBM RP3(Research Parallel Processor) The IBM Research Parallel Processor Prototype(RP
3)：Introductionand Architecture”, Proc. of the 1
985 Int. Conf. on ParallelProcessing, pp.764−771,
1985. 分散メモリ型システムにおける重要な課題として、数千
台のプロセッサの中に分散されているキャッシュメモリ
の一致保証制御がある。これは、各プロセッサのキャッ
シュメモリに登録されている内容を保証するための機構
である。

【０００５】従来、数台程度のマルチプロセッサでは、
バススヌーピング方式と呼ばれるキャッシュ一致保証方
式を採用している。これは、各プロセッサが共有バスに
接続され、共有バス上のトランザクションを監視するこ
とによってキャッシュ一致保証を実現する方式である。
即ち、あるデータを読み出したいプロセッサは、そのア
ドレスを共有バスにブロードキャストする。他のプロセ
ッサは共有バス上のトランザクションを監視し、自分の
キャッシュメモリに最新データがある場合は、該データ
を要求プロセッサに転送する。

【０００６】しかし、このバススヌーピング方式をその
まま数千台の共有メモリマルチプロセッサに適用する
と、以下の問題が発生する。１つは、数千台のプロセッ
サにブロードキャストし、全てのプロセッサからキャッ
シュ一致保証の報告を受けとるために時間が掛かってし
まうことである。このため、分散メモリ構成によってロ
ーカルメモリへのレイテンシが向上しても、キャッシュ
一致保証の遅延がネックとなって、データを即座に使う
ことができないといった問題が発生する。また２つ目の
問題点は、共有バスの負荷が大きくなってしまうことで
ある。すなわち、各プロセッサがメモリを読み書きする
たびに全てのプロセッサにブロードキャストが行われ
る。このためシステム全体で見ると、共有バス上に非常
に多くのトランザクションが発生することになる。さら
には、各プロセッサにある共有バス監視機構の一致保証
制御の頻度も多くなり、これがボトルネックとなって、
共有バスの性能を十分に引き出すことができないといっ
た問題も発生する。

【０００７】これらの問題を解決するキャッシュ一致方
式としては、ディレクトリ方式とソフトウエア制御方式
の２つが知られている。ディレクトリ方式とは、分散さ
れた各メモリごとに該メモリのコピーがどのキャッシュ
に存在するかを示すディレクトリを持つ方式である。こ
れによって、全てのプロセッサに対するブロードキャス
トやバス監視の機構は不要となる。

【０００８】ディレクトリ方式のなかにも、マップ方式
と分散リンク方式の２つがある。

【０００９】前述のＤＡＳＨシステムはマップ方式を採
用している。マップ方式とは、共有メモリの管理データ
単位ごとに、該データがどのキャッシュメモリに存在す
るかを示すプレゼンスビットを設ける方式である。従っ
てプレゼンスビットはシステム内に存在するキャッシュ
メモリと同じ数のビット数が必要である。本方式の変形
されたものとして、限定マップ方式や、グループマップ
方式も知られている。限定マップ方式とは、共有メモリ
上のデータのコピーがキャッシュメモリに存在する数を
限定することによって、プレゼンスビットのビット数を
削減する方式である。また、グループマップ方式とは、
いくつかのプロセッサを一つのグループと定義し、グル
ープを対象にしてプレゼンスビットを設ける方式であ
る。これによってプレゼンスビットのビット数を削減す
ることが可能になる。各グループ内では、バススヌーピ
ング方式で一致保証を実現するなどが可能である。前述
のＤＡＳＨシステムは、実際にはグループマップ方式を
採用している。

【００１０】ディレクトリ方式のもう１つの方式である
分散リンク方式は、前述のＳＣＩシステムが採用してい
る方式である。分散リンク方式とは、共有メモリ、及び
キャッシュメモリの各データにリンク情報をもたせ、こ
のリンク情報を用いてコピーされたデータをすべて繋い
でリンクドリストを作成する方式である。例えば、ある
プロセッサが、共有メモリ上のあるデータのコピーをキ
ャッシュ上から消去するといった要求を出すと、キャッ
シュ一致保証制御は、該当する共有メモリデータのリン
ク情報をたどって最初のコピーを見つけて消去する。最
初のコピーがリンク情報を持っていれば、更にそのリン
ク情報をたどって次のコピーを見つけ消去する。本方式
によれば、マップ方式に比べディレクトリ情報を削減す
ることが可能になる。

【００１１】ディレクトリ方式とは異なる、もう１つの
重要なキャッシュ一致保証方式にソフトウエア制御方式
がある。前述のＩＢＭＲＰ３が本方式を採用してい
る。ソフトウエア制御方式とは、ページ単位（例えば４
Ｋバイト）にキャッシング可能／不可能の属性を指定で
きる機構と、ユーザープログラムからキャッシュメモリ
のエントリを無効化できる機構を有する方式である。例
えばタスクに固有のローカルデータはキャッシング可能
属性とし、タスク間で共有されるデータはキャッシング
不可属性に指定する。そして、タスクが他のプロセッサ
に移動するときは、現在のプロセッサのキャッシュメモ
リにあるローカルデータは全て無効化する。これによ
り、ローカルデータは他のキャッシュメモリに存在しな
いことが保証できるので、キャッシュ一致保証のための
機構は不要となる。また共有データはキャッシュ上に登
録されないので、キャッシュ一致保証そのものが必要な
い。また、他の例としては、タスク間で共有されるデー
タのなかでも、読みだし専用の共有データはキャッシン
グ可能属性とする方式も考えられる。また、タスク間で
共有されるデータを全てキャッシング可能属性とする方
式も可能である。この場合は、フラグやセマフォアを用
いて共有データにアクセスできるタスクを１つに限定す
る。共有データを変更したタスクは、フラグやセマフォ
アを解放する前に、キャッシュ無効化機能によって、変
更した内容を主メモリに反映する。以上に示した方式に
よれば、バススヌープ機構やディレクトリ機構といった
ハードウエアによるキャッシュ一致保証機構無しに、ス
ケーラブルな共有メモリマルチプロセッサを実現するこ
とが可能となる。

【００１２】

【発明が解決しようとする課題】

１．ディレクトリ方式（マップ方式）における問題点ディレクトリ方式の１つであるマップ方式の問題点は、
ディレクトリのサイズが大きくなり、ディレクトリを読
みだすのに時間がかかることである。例えば、３２台の
プロセッサが５１２Ｍバイトの共有メモリを共有してい
る構成を考える。メモリの管理単位は３２バイトを１ブ
ロックとすると、ディレクトリのサイズは、５１２Ｍバ
イト／３２バイト×３２ビット＝６４Ｍバイトとなる。
グループマップ方式で、４台を１グループにしたとして
もディレクトリのサイズは１６Ｍバイトとなる。これを
ＤＲＡＭで実装するとアクセス時間が遅くなってしま
い、ＳＲＡＭで実装するとコストが高くなってしまうと
いった問題がある。ディレクトリの読みだし時間が大き
くなると、キャッシュ一致保証の遅延も大きくなり、メ
モリのレイテンシは改善されない。

【００１３】２．ディレクトリ方式（分散リンク方式）
における問題点ディレクトリ方式の１つである分散リンク方式の問題点
は、ディレクトリサイズが大きくなることに加え、リン
ク情報をたどっていくことによってキャッシュ一致保証
を行うため、キャッシュ一致保証の遅延が大きくなって
しまうことである。ディレクトリ情報のサイズに関して
は、前述のシステム例では、５１２Ｍバイト／３２バイ
ト×５ビット＝１０Ｍバイトとなる。マップ方式に比較
すると小容量だが、やはりＤＲＡＭで実装する必要があ
り、アクセス時間が大きくなってしまう。また、リンク
情報のもう一つの問題点を例を用いて説明すると、ある
プロセッサが自キャッシュメモリ上のデータを更新する
ため、他のキャッシュ上のコピーを無効化する要求を発
行したとする。この時、キャッシュ一致保証機構は、ま
ず共有メモリ上の対応するデータのリンク情報を読みだ
し、その内容に従って他キャッシュメモリのエントリを
無効化する。この処理をリンクがつながっている限り繰
り返す必要がある。このため、全てのキャッシュ上のコ
ピーを無効化し終わるまでにかなり時間がかかるといっ
た問題がある。

【００１４】３．ソフトウエア制御方式における問題点ソフトウエア制御方式の問題点は、共有データをキャッ
シュメモリに登録しない方式では、共有データアクセス
に対するキャッシュの効果を期待できず、アクセスレイ
テンシが悪化し、また共有バスのトラッフィックを軽減
できないことである。また、ソフト保証によって、共有
データをキャッシュに登録できる方式では、プログラマ
がキャッシュ一致保証を意識する必要があり、プログラ
マへの負担が大き過ぎるといった問題もある。

【００１５】本発明の目的は、大規模なマルチプロセッ
サシステムにおいて、高速でかつプロセッサ間の通信量
を低減可能なキャッシュ一致保証を行い得るシステムの
提供及びプロセッサの提供にある。

【００１６】

【課題を解決するための手段】上記目的を達成するた
め、本発明では、キャッシュメモリとアドレス変換バッ
ファを有する少なくとも２以上のプロセッサと、ローカ
ル共有メモリと、この２以上のプロセッサとローカル共
有メモリとに接続され、プロセッサからのローカル共有
メモリへのアクセスを制御するメモリインタフェース装
置を有するクラスタをバスを介して複数接続し、このク
ラスタ内のプロセッサからのグローバル共有メモリへの
アクセスを制御するシステム制御装置を備えたマルチプ
ロセッサシステムにおいて、プロセッサからのアクセス
に対し、クラスタ内のキャッシュメモリのみを対象とし
て一致保証すべきか又はシステム内の全てのキャッシュ
メモリを対象として一致保証すべきかを識別する範囲属
性情報をアドレス変換バッファに保持する構成としたも
のである。

【００１７】また、本発明では、プロセッサからのアク
セスに対し、システム内の全てのキャッシュメモリを対
象として一致保証すべきか又は限定された範囲のキャッ
シュメモリを対象として一致保証すべきかを識別する範
囲属性情報をアドレス変換バッファに保持するようにし
た上、更に、メモリインタフェース装置内に、アドレス
変換バッファに保持された範囲属性情報に基づいてキャ
ッシュ一致保証すべき範囲を判定するキャッシュ一致保
証範囲判定手段と、キャッシュ一致保証範囲判定手段に
よる判定結果に応じて指定された範囲内のプロセッサに
対してキャッシュ一致保証に使用される情報をブロード
キャストするブロードキャスト手段を設けたものであ
る。尚、キャッシュ一致保証範囲判定手段は、具体的に
は、自クラスタの番号を示す情報を保持する自クラスタ
番号レジスタと、この自クラスタ番号レジスタに保持さ
れた情報と、プロセッサからのアクセスアドレスである
仮想アドレスをアドレス変換バッファにて変換された実
アドレスとを比較する比較器を有し、この比較器による
比較結果と、アドレス変換バッファに保持された範囲属
性情報とに基づいてキャッシュ一致保証すべき範囲を決
定するものである。

【００１８】また更に本発明では、主記憶装置に記憶さ
れた命令のうちその一部を保持する命令キャッシュメモ
リと、この主記憶装置に記憶されたデータのうちその一
部を保持するデータキャッシュメモリと、前記命令キャ
ッシュメモリ又は主記憶装置から実行すべき命令を読み
出す命令フェッチユニットと、この命令フェッチユニッ
トにより読み出された命令を解釈し、前記データキャッ
シュメモリ又は主記憶装置からデータを読み出し、解釈
された命令を実行する命令実行ユニットと、前記命令フ
ェッチユニット又は命令実行ユニットより発せられる仮
想アドレスを実アドレスに変換するアドレス変換バッフ
ァを有するプロセッサにおいて、複数のプロセッサが接
続された場合に、これら複数のプロセッサに存在する複
数のキャッシュメモリのうちキャッシュ一致保証すべき
範囲を指定する範囲属性情報をアドレス変換バッファに
保持する構成としたものである。

【００１９】

【作用】プロセッサがメモリアクセス要求を発行する
と、アドレス変換バッファによって、仮想アドレスが実
アドレスに変換される。この時、アドレス変換バッファ
に保持されたキャッシュ一致保証すべき範囲を識別する
範囲属性情報によって、メモリアクセスのキャッシュ一
致保証すべき範囲が決定される。

【００２０】更にまた、メモリインタフェース装置で
は、キャッシュ一致保証範囲判定手段により、アドレス
変換バッファに保持されたキャッシュ一致保証すべき範
囲を識別する範囲属性情報とアドレス変換バッファによ
り変換された実アドレス（メモリアドレス）を用いて、
キャッシュ一致保証すべき範囲が決定される。次に、範
囲限定ブロードキャスト手段により、キャッシュ一致致
保証範囲判定手段の結果により、決定された範囲のプロ
セッサに対してのみ、キャッシュ一致保証に使用される
情報がブロードキャストされる。

【００２１】これにより、ローカルデータ，共有デー
タ，スタック領域といったデータの特徴に合わせて、キ
ャッシュ一致保証すべき範囲を限定することが可能とな
る。特に、大規模なマルチプロセッサシステムでは、キ
ャッシュ一致保証の範囲が限定されるので、システム内
の全てのキャッシュを対象にキャッシュ一致保証する必
要がなく、キャッシュ一致保証制御の遅延を大幅に改善
できる。また、限定された範囲のプロセッサに対しての
みキャッシュ一致保証に使用される情報がブロードキャ
ストされるので、メモリ読みだし／書き込みごとにシス
テム内の全てのプロセッサにブロードキャストする必要
もなく、プロセッサ間の通信量を大幅に低減することが
可能になる。

【００２２】また、命令キャッシュメモリ，データキャ
ッシュメモリとこの命令キャッシュメモリ又は主記憶装
置から実行すべき命令を読み出す命令フェッチユニット
と、命令フェッチユニットにより読み出された命令を解
釈し、データキャッシュメモリ又は主記憶装置からデー
タを読み出し、命令を実行する命令実行ユニットと、命
令フェッチユニット又は命令実行ユニットより発せられ
る仮想アドレスを実アドレスに変換するアドレス変換バ
ッファを有するプロセッサにおいて、これら複数のプロ
セッサが接続された場合に、複数のプロセッサに存在す
る複数のキャッシュメモリのうちキャッシュ一致保証す
べき範囲を指定する範囲属性情報がアドレス変換バッフ
ァに保持されるので、データの特徴に合わせて、キャッ
シュ一致保証すべき範囲を限定することが可能となり、
複数のプロセッサを接続するようなマルチプロセッサシ
ステムに好適なプロセッサの提供が可能となる。

【００２３】

【実施例】図１は、本発明が適用されるマルチプロセッ
サシステムの全体構成を示している。本構成では、複数
のプロセッサ２００が、プロセッサローカルバス１６０
０を介してプロセッサーメモリインターフェース装置３
００に接続される。プロセッサーメモリインターフェー
ス装置３００には、ローカル共有メモリバス1700を介し
てローカル共有メモリ４００が接続される。また、キャ
ッシュ一致保証の高速化機構として、キャッシュメモリ
の複製タグ２０００も接続される。これは、複数のプロ
セッサ２００に内蔵されるキャッシュメモリに登録され
ているデータの有無を識別するためのものである。

【００２４】これら、複数のプロセッサ２００，プロセ
ッサーメモリインターフェース装置３００，ローカル共
有メモリ４００，複製タグ２０００が集合体としてクラ
スタ１００と呼ばれる。複数のクラスタ１００はプロセ
ッサグローバルバス１８００を介して、システム制御装
置５００に接続される。システム制御装置５００はグロ
ーバル共有メモリバス１９００を介してグローバル共有
メモリ６００に接続される。また、システム制御装置５
００は、入出力バス２１００を介して入出力制御装置７
００，ネットワーク制御装置８００，ファイル制御装置
９００，グラフィックス制御装置１０００に接続され
る。ファイル制御装置９００は、固定ディスク装置１３
００とローカル共有メモリ４００あるいはグローバル共
有メモリ６００との間のデータ転送を制御する。ネット
ワーク制御装置８００は、FDDI，Ethernetといったネッ
トワークとローカル共有メモリ４００あるいはグローバ
ル共有メモリ６００との間のデータ転送を制御する。グ
ラフィックス制御装置1000は表示用フレームメモリ１４
１０とローカル共有メモリ４００あるいはグローバル共
有メモリ６００間のデータ転送を制御する。転送された
データは、グラフィックス制御装置１０００により表示
装置１４００に表示される。また、Ｉ／Ｏ制御装置７０
０はフロッピーディスク装置１１００やプリンタ装置１
２００と、ローカル共有メモリ４００あるいはグローバ
ル共有メモリ６００間のデータ転送を制御する。各Ｉ／
Ｏ制御装置は、ＤＭＡ（Direct Memory Access）機能を
持つ。ＤＭＡ機能により各Ｉ／Ｏ装置はプロセッサ２０
０に負荷をかけることなく、Ｉ／Ｏバス２１００を介し
てローカル共有メモリ４００あるいはグローバル共有メ
モリ６００間でデータの転送が可能である。

【００２５】プロセッサ２００からのメモリ空間へのア
クセスあるいはＩ／Ｏ空間へのアクセス要求は、一旦プ
ロセッサーメモリインターフェース装置３００に受け付
けられる。プロセッサーメモリインターフェース装置３
００では受け付けたアクセスのアドレスからアクセス先
を判定する。自クラスタ内のローカル共有メモリ400へ
のアクセスであれば、ローカル共有メモリ４００への書
き込み／読みだしを実行する。プロセッサ２００から、
他クラスタのローカル共有メモリ４００へのアクセスで
あれば、プロセッサグローバルバス１８００を介して他
クラスタのプロセッサーメモリインターフェース３００
にアクセス要求を転送する。他クラスタのプロセッサー
メモリインターフェース３００はこれを受けてローカル
共有メモリ４００の書き込み／読みだしを実行する。一
方、プロセッサ２００からグローバル共有メモリ６０
０、あるいはＩ／Ｏ装置へのアクセス（以下プロセッサ
によるＩ／Ｏ直接アクセスと呼ぶ）であれば、プロセッ
サグローバルバス１８００を介してシステム制御装置５
００にアクセス要求を転送する。

【００２６】システム制御装置５００は、プロセッサグ
ローバルバス１８００から受け付けたアクセスのアドレ
スからアクセス先を判定する。グローバル共有メモリ６
００へのアクセスであれば、グローバル共有メモリ６０
０への書き込み／読みだしを実行する。Ｉ／Ｏ空間への
アクセスであれば、Ｉ／Ｏバス２１００上にアクセス要
求を発行する。各Ｉ／Ｏ装置７００，８００，９００，
１０００は、Ｉ／Ｏバス２１００上のアクセス要求を受
付け、そのアドレスから自装置へのアクセスかどうかを
検証する。自装置へのアクセス要求であれば要求された
処理（レジスタの設定，Ｉ／Ｏ装置の制御等）を実施す
る。尚、図１４に、本実施例における特徴部分であるプ
ロセッサ２００，ローカル供給メモリ４００及びグロー
バル共有メモリ６００の周辺部分の概略構成を示す。

【００２７】図２は、プロセッサ２００からみたローカ
ル共有メモリ４００，グローバル共有メモリ６００のア
ドレス割当ての一例を示している。各クラスタ１００の
ローカル共有メモリ４００に対して順次アドレスを割当
て、最後にグローバル共有メモリ６００が割り当てられ
る。あるプロセッサ２００から全てのメモリに対してア
クセスが可能である。アドレス割当は、ここで示した割
当に限らず、他の割当も可能である。例えば、各クラス
タ１００内のローカル共有メモリをバンクとみなし、あ
るまとまったデータ単位（例えば３２バイト）でインタ
ーリーブ動作させるメモリ割当も可能である。これらの
実メモリ空間の割り当て情報は、各クラスタ１００内の
プロセッサーメモリインターフェース３００内のレジス
タに設定される。

【００２８】図３は、プロセッサ２００の内部構成を示
している。命令フェッチユニット２１１はプログラムの
実行に必要な命令をローカル共有メモリ４００あるいは
グローバル共有メモリ６００から読みだす。読みだされ
た命令は命令実行ユニット２１０に転送される。命令実
行ユニット２１０は、命令の意味を解釈し、命令実行に
必要なデータを共有メモリ４００，６００から読みだし
演算を実行する。命令用アドレス変換バッファ２５３，
２５４，２５５，２５６、及びデータ用アドレス変換バ
ッファ２２１，２２４，２２２，２２３は仮想記憶シス
テムを実現するために設けられている。それぞれ、命令
フェッチユニット２１１及び命令実行ユニット２１０
が、共有メモリ４００，６００を読みだす時に発行する
仮想アドレスを実際の共有メモリアドレス（以下、実ア
ドレス）に変換する。

【００２９】命令用アドレス変換バッファは、仮想アド
レスページ番号部２５３と、仮想アドレスページ番号２
５３の有効／無効を示す有効フラグ部２５４，仮想アド
レスページ番号２５３に対応した実アドレスページ番号
部２５５、及びキャッシュ一致保証の範囲を示すキャッ
シュ一致保証範囲属性情報２５６から構成される。本実
施例では、キャッシュ一致保証範囲属性情報２５６は、
クラスタ内だけでキャッシュ一致保証を実施すればよい
ローカルキャッシュコヒーレンシ（ＬＣＣ）と、システ
ム内の全てのキャッシュメモリでキャッシュ一致保証を
実施すべきグローバルキャッシュコヒーレンシ（ＧＣ
Ｃ）と２つの属性を定義する。当然ながら、他のキャッ
シュ一致保証の範囲指定の方法も考えられる。例えば、
キャッシュ一致保証すべきグループ番号をキャッシュ一
致保証範囲属性情報２５６として持つことも可能であ
る。

【００３０】命令フェッチユニット２１１が仮想アドレ
ス２５０を発行すると、その中の一部がインデックスア
ドレス２５２として命令用アドレス変換バッファ２５
３，２５４，２５５，２５６の読みだしに用いられる。
仮想アドレスページ番号部２５３は、仮想アドレス２５
０の上位アドレスである２５１と比較器２５７で比較さ
れる。アドレスが一致しかつ有効フラグ部２５４が有効
であればアドレス変換が成功し、命令キャッシュメモリ
２７０に通知される。アドレス変換の結果得られた実ア
ドレスページ番号部２５５は命令キャッシュメモリ２７
０のアクセスアドレスとして利用される。

【００３１】一方、キャッシュ一致保証範囲属性情報２
５６は、命令キャッシュ制御部280に送られキャッシュ
一致保証の範囲限定に使用される。データ用アドレス変
換バッファ２２１，２２４，２２２，２２３も命令用ア
ドレス変換バッファと同等の機能を有する。よって、こ
こでは、詳細説明を省く。

【００３２】命令キャッシュメモリ２７０は、共有メモ
リ４００，６００上にある命令の一部を複写して保持す
る高速メモリである。命令フェッチユニット２１１が要
求する命令が命令キャッシュメモリ２７０内に存在すれ
ば、共有メモリ４００，600にアクセスすることなく即
座に命令を読みだすことができる。要求する命令がキャ
ッシュメモリに存在しない場合、命令キャッシュメモリ
２７０は、命令キャッシュ制御部２８０を介して共有メ
モリ４００，６００にデータを要求する。

【００３３】命令キャッシュ制御部２８０は、命令キャ
ッシュメモリ２７０からの共有メモリアクセスを受け付
け、プロセッサローカルバス１６００を経由してプロセ
ッサーメモリインターフェース３００にアクセスを送
る。このとき、信号線１６０３によりキャッシュ一致保
証範囲属性情報２５６も同時に送る。プロセッサーメモ
リインターフェース３００から、応答データが返送され
てくると、これを命令キャッシュメモリ２７０に登録す
る。このとき、応答データのキャッシュ登録属性情報１
６０２に従って、キャッシュ登録不可属性であれば、命
令フェッチユニット２１１に応答データを転送するが、
命令キャッシュメモリ２７０には登録しない。

【００３４】データキャッシュメモリ２４０は、共有メ
モリ４００，６００のデータの一部を保持する高速メモ
リである。命令実行ユニット２１０が要求するデータが
キャッシュメモリ２４０内に存在すれば、共有メモリ４
００，６００にアクセスすることなく即座にデータを提
供することができる。要求するデータがキャッシュメモ
リに存在しない場合、データキャッシュメモリ２４０
は、データキャッシュ制御部２８２を介して共有メモリ
４００，６００にデータを要求する。キャッシュメモリ
２４０と共有メモリ４００，６００との間のデータ転送
は、一般に３２バイトから１２８バイト程度のブロック
を転送単位とすることによりキャッシュメモリのヒット
率の向上を計っている。

【００３５】本実施例におけるデータキャッシュメモリ
２４０では、ストアイン方式により命令実行ユニット２
１０からの主メモリ書き込み処理を高速化している。ス
トアイン方式では、書き込み対象となるデータがデータ
キャッシュメモリ２４０上に存在しかつそのデータのコ
ピーが他のキャッシュメモリに存在しなければ、データ
キャッシュメモリにのみ書き込みを行い、共有メモリ４
００，６００には書き込みを行わない。書き込みが行わ
れたデータキャッシュ内のブロックをダーティーブロッ
クと呼ぶ。ダーティブロックは、データキャッシュメモ
リ２４０が溢れたときに共有メモリ４００，６００に書
き戻される。命令実行ユニット２１０は、データキャッ
シュメモリ２４０内の任意のダーティーブロックを強制
的に共有メモリに書き戻す命令を実行することができ
る。データキャッシュメモリ２４０から掃き出されたダ
ーティーブロックは、データキャッシュ制御部２８２を
介してプロセッサローカルバス１６００に転送される。
データキャッシュ制御部282は、命令キャッシュ制御部
２８０とほぼ同等な動作となるので詳細説明は省略す
る。

【００３６】バスモニター及びキャッシュ一致保証制御
部２８１は、プロセッサ間でキャッシュ一致保証を行う
機構である。プロセッサローカルバス１６００上にキャ
ッシュ一致保証の対象となるトランザクションが発行さ
れると、バスモニター及びキャッシュ一致保証制御部２
８１は、このトランザクションを取り込みデータキャッ
シュメモリ２４０、及び命令キャッシュメモリ２７０を
検索し、該当するブロックが存在するかどうか、あるい
は該当ブロックがダーティブロックかどうかを判定す
る。そして必要であれば、該当するダーティブロックを
アクセス要求元に転送する。

【００３７】図４は、プロセッサーメモリインターフェ
ース装置３００の内部構成を示している。プロセッサロ
ーカルバス受信部３５１はプロセッサ２００からのアク
セス要求を受け付ける制御を行う。ローカル／リモート
メモリ制御部３３０は、プロセッサローカルバス受信部
３５１から受け取ったアクセスのアドレスから、アクセ
ス先が自クラスタ内ローカル共有メモリ４００か、他ク
ラスタ内ローカル共有メモリか、グローバル共有メモリ
６００かを判定する。ローカル共有メモリ400へのアク
セスであれば、バス２０１１を介してローカル共有メモ
リ起動制御部３７０にアクセス要求を転送する。また、
アクセス先が他クラスタ内ローカル共有メモリか、グロ
ーバル共有メモリ６００であれば、バス２０１０を経由
してグローバルバス送信部３８０にアクセスを転送す
る。プロセッサローカルバス送信部３５２は、ローカル
共有メモリ受信部３７１からバス２０１５を介して送ら
れてくるローカル共有メモリ４００の読みだしデータを
受取り、プロセッサローカルバス１６００を介して要求
元プロセッサにデータを転送する。またグローバルバス
受信部３８２からバス２０１３を介して送られてくる他
クラスタ内ローカル共有メモリ、あるいはグローバル共
有メモリ６００の読みだしデータを受取り、プロセッサ
ローカルバス１６００を介して要求元プロセッサにデー
タを転送する。

【００３８】ローカルバスキャッシュ一致保証監視装置
３５０は、クラスタ内のプロセッサ２００に内蔵された
キャッシュメモリ２４０，２７０を対象に、キャッシュ
メモリ一致保証の結果を監視する機構である。プロセッ
サローカルバス１６００上にキャッシュ一致保証の対象
となるトランザクションが発行されると、キャッシュメ
モリ一致保証の監視が開始される。プロセッサローカル
バス１６００に接続された全てのプロセッサ２００から
のキャッシュ一致保証の検証結果をまとめ、信号３５１
によりローカル／グローバルキャッシュコヒーレンシ制
御部３１０に報告する。

【００３９】ローカル／グローバルキャッシュコヒーレ
ンシ制御部３１０は、４つの機能を有する。即ち、キャ
ッシュ一致保証範囲判定機能，範囲限定ブロードキャス
ト機能，データ供給元選択機能、及びキャッシュ登録制
御機能である。キャッシュ一致保証範囲判定機能は、プ
ロセッサローカルバス１６００から受け取ったアクセス
のキャッシュ一致保証範囲属性情報１６０３及びアクセ
ス先情報から、自クラスタ内のキャッシュ一致保証のみ
でよいのか、全てのキャッシュメモリに対して一致保証
すべきかを判定する。最も単純な範囲判定アルゴリズム
としては、キャッシュ一致保証範囲属性がローカルキャ
ッシュコヒーレンシで、かつアクセス先が自クラスタ内
のローカル共有メモリ４００である時に限り、自クラス
タ内のキャッシュ一致保証のみで完了とする。それ以外
は全てのキャッシュに対して一致保証を行うといった方
式が挙げられる。また、範囲限定ブロードキャスト機能
は、キャッシュ一致保証範囲判定の結果に従い、自クラ
スタ内のキャッシュ一致保証のみでよい場合は、クラス
タ外へのブロードキャストは行わない。また、全キャッ
シュメモリが一致保証の対象となる場合には、バス２０
１０，グローバルバス送信部３８０を経由して、プロセ
ッサグローバルバス１８００にキャッシュ一致保証のた
めのトランザクションを送出する。データ供給元選択機
能は、自クラスタ内のキャッシュ一致保証のみの場合
は、ローカルバスキャッシュ一致保証制御部３５０の結
果を待って、キャッシュ間転送すべきか、ローカル共有
メモリ４００の内容を読みだすべきかを決定する。一
方、全キャッシュメモリが一致保証の対象となる場合に
は、プロセッサグローバルバス１８００に接続される全
てのクラスタからのキャッシュ一致保証報告、及びロー
カルバスキャッシュ一致保証制御部３５０からの報告を
待って、キャッシュ間転送すべきか、共有メモリ４０
０，６００の内容を読みだすべきかを決定する。

【００４０】キャッシュ登録制御機能は、キャッシュ一
致保証範囲判定結果及びアクセス先に従って、応答デー
タをキャッシュメモリに登録して良いかどうかを決定
し、キャッシュ登録属性情報１６０２とともにデータを
プロセッサに転送する。最も単純な登録アルゴリズムと
しては、キャッシュ一致保証範囲属性がローカルキャッ
シュコヒーレンシで、かつアクセス先が自クラスタ内の
ローカル共有メモリ400である場合、およびキャッシュ
一致保証範囲属性がグローバルキャッシュコヒーレンシ
である場合にキャッシュメモリへの登録を許可する。そ
れ以外は、即ち、キャッシュ一致保証範囲属性がローカ
ルキャッシュコヒーレンシで、アクセス先がクラスタ外
である場合はキャッシュへの登録を禁止する。

【００４１】グローバルバス受信部３８２は、他クラス
タからのローカル共有メモリアクセスを受付け、バス２
０１４を介してローカル共有メモリ起動制御部３７０に
アクセスを転送する。また、自クラスタから外部に向け
て発行されたメモリ読みだし要求のレスポンスデータを
受信し、バス２０１３を介してプロセッサローカルバス
送信部３５２に転送する。グローバルバス送信部３８０
は、ローカル／リモートメモリ制御部３３０において自
クラスタ外と判定されたアクセスを受信し、プロセッサ
グローバルバス１８００に送出する。また、バス２０１
２を介してローカル共有メモリレスポンス制御部３７１
からのレスポンスデータを受取り、アクセス元のクラス
タに送信する。

【００４２】グローバルバスキャッシュ一致保証監視装
置３８１は、自クラスタ内のプロセッサ２００が、クラ
スタ外部に対してキャッシュ一致保証を必要とするアク
セスを発行したときに起動され、他クラスタからのキャ
ッシュ一致保証の結果を監視する。そして全クラスタか
らの結果をまとめてローカル／グローバルキャッシュコ
ヒーレンシ制御部３１０に報告する。グローバルバスキ
ャッシュ一致保証監視装置３８１のもう１つの機能は、
クラスタ間でキャッシュ一致保証を行う機構である。プ
ロセッサグローバルバス１８００上にキャッシュ一致保
証の対象となるトランザクションが発行されると、グロ
ーバルバスキャッシュ一致保証監視装置３８１はこのト
ランザクションを取り込む。そしてバス２０２２を介し
てこのトランザクションを複製タグ制御部３６０に送
る。複製タグ制御部３６０は、データキャッシュ用複製
タグメモリ２００２、及び命令キャッシュ用複製タグメ
モリ２００１を検索し、該当するブロックがクラスタ内
に存在するかどうか、あるいは該当ブロックがダーティ
ブロックかどうかを判定する。グローバルバスキャッシ
ュ一致保証監視装置３８１は、複製タグ制御部３６０か
らの判定結果を受けて、プロセッサグローバルバス１８
００を経由して、アクセス元クラスタに判定結果を報告
する。ダーティブロックが存在する場合は、ローカル共
有バス送信部３５２を経由して該当ブロックを保持して
いるクラスタ内のプロセッサに対して、アクセス要求元
にデータを転送するよう要求する。

【００４３】図５は、ローカル／グローバルキャッシュ
コヒーレンシ制御部３１０の更に詳細な内部構成を示し
ている。主な構成要素は、キャッシュ一致保証範囲判定
機能３２０，範囲限定ブロードキャスト機能３２１，デ
ータ供給元選択機能３２２、及びキャッシュ登録制御機
能３２３の４つである。キャッシュ一致保証範囲判定機
能３２０の内部には、自クラスタの番号を示すクラスタ
番号レジスタ３１１がある。プロセッサローカルバスか
ら受け取った実アドレス３１６から、ハッシュ論理３１
２を経由して取り出された情報とクラスタ番号レジスタ
３１１を比較器３１３によって比較することにより、実
アドレス３１６が自クラスタ内のローカル共有メモリ４
００に対するものか、他クラスタあるいはグローバル共
有メモリに対するものかを判定する。ハッシュ論理の最
も単純な例としては、実アドレス３１６の上位アドレス
部の一部を切り出してクラスタ番号レジスタ３１１と比
較するといった論理がありうる。例えば、０番のクラス
タに２５６メガバイトのローカルメモリがある場合、実
アドレスで0x00000000番地から0x0FFFFFFF番地までは、
０番のクラスタ内のローカルメモリがアクセス対象であ
り、それ以上はクラスタ外部のメモリがアクセス対象と
なる。当然ながら、ハッシュ論理３１２には共有メモリ
のアドレス割当てによってさまざまな方式があり得る。
アクセス対象の判定結果は、プロセッサ２００から受け
取ったアクセス対象のページのキャッシュ一致保証範囲
属性情報３１５を含めて、キャッシュ一致保証の範囲を
決定する。即ちアクセス対象が自クラスタ内でキャッシ
ュ一致保証範囲属性情報がローカルキャッシュコヒーレ
ンシ（ＬＣＣ）の場合は、キャッシュ一致保証の範囲は
自クラスタ内のみ。また、アクセス対象がクラスタ外で
キャッシュ一致保証範囲属性情報がローカルキャッシュ
コヒーレンシ（ＬＣＣ）の場合あるいはキャッシュ一致
保証範囲属性情報がグローバルキャッシュコヒーレンシ
（ＧＣＣ）の場合には、キャッシュ一致保証の範囲は外
部のクラスタも含むことになる。

【００４４】本実施例では、図６に示す５つのタイプの
メモリアクセスが発生し得る。この中で、自クラスタ内
のキャッシュ一致保証のみでよい場合とは、アクセス対
象が自クラスタ内のローカル共有メモリで、且つページ
のキャッシュ一致保証属性がローカルキャッシュ一致保
証（ＬＣＣ）であるものに限られる。他のタイプのメモ
リアクセスは、システム内の全てのキャッシュメモリを
対象にしてキャッシュ一致保証を行う必要がある。ま
た、キャッシュメモリへの登録が不可となるメモリアク
セスは、アクセス対象が他クラスタ内のローカル共有メ
モリで、且つページのキャッシュ一致保証属性がローカ
ルキャッシュ一致保証属性（ＬＣＣ）となっているもの
である。即ち、キャッシュ一致保証の範囲外からのアク
セスはキャッシュに登録することができない。

【００４５】図７は、前述した５つのタイプのメモリア
クセスの例を示している。３０００はタスク０の仮想ア
ドレス空間、３１００はタスク１の仮想アドレス空間を
示している。また、３３００はクラスタ０のローカル共
有メモリの実アドレス空間、３３１０はクラスタ１のロ
ーカル共有メモリの実アドレス空間、３２００はグロー
バル共有メモリの実アドレス空間を示している。また、
プロセッサ３３０１，３３０２はクラスタ０内のプロセ
ッサを表し、プロセッサ３３１１，３３１２はクラスタ
１内のプロセッサを表している。これら、各タスクの仮
想アドレス空間から、実アドレス空間へのマッピングは
オペレーティングシステムのページ割り当て機構が管理
するアドレス変換マップに登録されている。今タスク０
がクラスタ０のプロセッサで実行され、タスク１がクラ
スタ１のプロセッサで実行されていると仮定する。タス
ク０のローカルキャッシュ一致保証属性のページ３００
１は、アドレス変換によってクラスタ０のローカル共有
メモリ３３０３に割り当てられている。このページへの
アクセスは自クラスタ対象で、ローカルキャッシュ一致
保証属性のアクセスとなる。タスク０のローカルキャッ
シュ一致保証属性ページ３００２は、アドレス変換によ
ってクラスタ１のローカル共有メモリ3313に割り当てら
れている。このページへのアクセスは他クラスタ対象
で、ローカルキャッシュ一致保証属性のアクセスとな
る。タスク１のグローバルキャッシュ一致保証属性ペー
ジ３１０１は、アドレス変換によってクラスタ０のロー
カル共有メモリ３３０４に割り当てられている。このペ
ージへのアクセスは他クラスタ対象で、グローバルキャ
ッシュ一致保証属性のアクセスとなる。タスク１のグロ
ーバルキャッシュ一致保証属性ページ３１０２は、アド
レス変換によってクラスタ１のローカル共有メモリ３３
１４に割り当てられている。このページへのアクセスは
自クラスタ対象で、グローバルキャッシュ一致保証属性
のアクセスとなる。タスク１のグローバルキャッシュ一
致保証属性ページ３１０３は、アドレス変換によってグ
ローバル共有メモリ３３２１に割り当てられている。こ
のページへのアクセスはグローバル共有メモリ対象で、
グローバルキャッシュ一致保証属性のアクセスとなる。

【００４６】次に、図８〜図１３を用いて、メモリアク
セス処理手順を示す。

【００４７】（１）自クラスタ内のローカル共有メモリ
に対するブロックリード図８は、自クラスタ内のローカル共有メモリに対するア
クセスの処理フローを示す。プロセッサ２００が発行す
るブロックリード要求は、プロセッサローカルバス１６
００を経由してプロセッサーメモリインターフェース装
置３００に送信される。この時同時にクラスタ内の他の
プロセッサは、該ブロックリード要求を監視し、自キャ
ッシュ内のキャッシュ検索を行う。プロセッサーメモリ
インターフェース装置３００は、受け取ったアクセスの
アドレスから自クラスタ内のローカル共有メモリへのア
クセスであることを識別する（９０１）。次に、プロセ
ッサ２００のアドレス変換バッファのキャッシュ一致保
証属性２２３から受け取った情報をもとに、ローカルキ
ャッシュ一致保証属性のデータかどうかを判定する（９
０２）。ローカルである場合は、クラスタ内キャッシュ
一致保証が終了するのを待つ（９０３）。次にクラスタ
内の他のキャッシュメモリ上にダーティブロックが存在
するかどうかを判定する（９０４）。存在する場合はク
ラスタ内でキャッシュ間転送を行い、ローカル共有メモ
リ４００の読みだしはキャンセルする(９０５)。そして
応答データをアクセス元のキャッシュメモリに登録する
(906）。また、ダーティブロックが存在しない場合は、
ローカル共有メモリ４００から読みだしたデータをアク
セス元に転送し（９０９）、キャッシュメモリに登録す
る（９０８）。

【００４８】一方、ローカルキャッシュ一致保証属性の
判定９０２の結果、グローバル属性の場合には、プロセ
ッサメモリインターフェース装置３００は、プロセッサ
グローバルバス１８００にメモリアドレスをブロードキ
ャストする（９０９）。そして、全てのクラスタに対す
るグローバルキャッシュ一致保証が終了するまで待つ
（９１０）。他クラスタはブロードキャストされたアド
レスを受取り、複製タグ２０００を検索することによっ
て、該当データのキャッシュ一致保証制御を行う。キャ
ッシュ一致保証の結果、他クラスタにダーティブロック
が存在するかどうかを判定する（９１１）。他クラスタ
にダーティブロックが存在しなければ、自クラスタ内の
ローカル共有メモリ４００のデータを読みだしアクセス
元に転送し（９１４）、キャッシュに登録する（９１
５）。他クラスタにダーティブロックが存在する場合、
該当クラスタのプロセッサーメモリインターフェース３
００がダーティブロックを持つプロセッサ２００に対し
てキャッシュ間データ転送を要求する。ダーティブロッ
クはクラスタ間を渡ってアクセス元のクラスタに転送さ
れる。この時、自クラスタ内のローカル共有メモリ４０
０の読みだしはキャンセルする（９１２）。そして、応
答データは要求元プロセッサのキャッシュメモリに登録
される（９１３）。

【００４９】（２）他クラスタ内のローカル共有メモリ
に対するブロックリード図９は、他クラスタ内のローカル共有メモリに対するア
クセスの処理フローを示す。プロセッサ２００が発行す
るブロックリード要求は、プロセッサローカルバス１６
００を経由してプロセッサーメモリインターフェース装
置３００に送信される。この時同時にクラスタ内の他の
プロセッサは、該ブロックリード要求を監視し、自キャ
ッシュ内のキャッシュ検索を行う。プロセッサーメモリ
インターフェース装置３００は、受け取ったアクセスの
アドレスから他クラスタ内のローカル共有メモリへのア
クセスであることを識別する（１００１）。次に、プロ
セッサ２００のアドレス変換バッファのキャッシュ一致
保証属性２２３から受け取った情報をもとに、ローカル
キャッシュ一致保証属性のデータかどうかを判定する
（１００２）。ローカルである場合は、プロセッサグロ
ーバルバス１８００を経由して、ブロックリード要求を
目標のクラスタに転送する（１００３）。目標クラスタ
はブロックリード要求を受け付けると、ローカル共有メ
モリを読みだすとともに、複製タグ２０００を検索する
ことによって、該当データのクラスタ内キャッシュ一致
保証制御を行う（１００４）。次に対象クラスタ内のキ
ャッシュメモリ上にダーティブロックが存在するかどう
かを判定する（１００５）。キャッシュ一致保証の結
果、ダーティブロックが存在しなければ、ローカル共有
メモリから読みだしたデータをアクセス元のクラスタに
転送し（１００６）、キャッシュメモリに登録せず処理
を終える（１００７）。目標クラスタ内にダーティブロ
ックが存在する場合は、目標クラスタのプロセッサーメ
モリインターフェース３００がダーティブロックを持つ
プロセッサ２００に対してキャッシュ間データ転送を要
求する。ダーティブロックはクラスタ間を渡ってアクセ
ス元のクラスタに転送される。この時、目標クラスタ内
のローカル共有メモリ４００の読みだしはキャンセルす
る（１００８）。そして、応答データをキャッシュメモ
リに登録せず処理を終える（１００９）。

【００５０】一方、アクセスしたページがグローバルキ
ャッシュ一致保証属性の場合には、プロセッサグローバ
ルバス１８００を介して、ブロックリード要求を目標の
クラスタに転送するとともに、メモリアドレスを全クラ
スタにブロードキャストする（１０１０）。そして、全
てのクラスタに対するグローバルキャッシュ一致保証が
終了するまで待つ（１０１１）。他クラスタはブロード
キャストされたアドレスを受取り、複製タグ２０００を
検索することによって、該当データのキャッシュ一致保
証制御を行う。キャッシュ一致保証の結果、他クラスタ
にダーティブロックが存在するかどうか判定する(１０
１２)。他クラスタにダーティブロックが存在しなけれ
ば、目標クラスタ内のローカル共有メモリ４００のデー
タを読みだしアクセス元クラスタに転送し(１０１３)、
キャッシュに登録する(１０１４)。他クラスタにダーテ
ィブロックが存在する場合、該当クラスタのプロセッサ
ーメモリインターフェース３００がダーティブロックを
持つプロセッサ２００に対してキャッシュ間データ転送
を要求する。ダーティブロックはクラスタ間を渡ってア
クセス元クラスタに転送される。この時、目標クラスタ
内のローカル共有メモリ４００の読みだしはキャンセル
する（１０１５）。そして応答データはアクセス元のキ
ャッシュメモリに登録される（１０１６）。

【００５１】（３）グローバル共有メモリに対するブロックリード図１０は、グローバル共有メモリ６００に対するアクセ
スの処理フローを示す。プロセッサ２００が発行するブ
ロックリード要求は、プロセッサローカルバス１６００
を経由してプロセッサーメモリインターフェース装置３
００に送信される。この時同時にクラスタ内の他のプロ
セッサは、該ブロックリード要求を監視し、自キャッシ
ュ内のキャッシュ検索を行う。プロセッサーメモリイン
ターフェース装置３００は、受け取ったアクセスのアド
レスからグローバル共有メモリへのアクセスであること
を識別する（１１０１）。次にプロセッサグローバルバ
ス１８００を経由して、ブロックリード要求をシステム
制御装置５００に転送するとともに、メモリアドレスを
全クラスタにブロードキャストする(１１０２)。そし
て、全てのクラスタに対するグローバルキャッシュ一致
保証が終了するまで待つ（１１０３）。他クラスタはブ
ロードキャストされたアドレスを受取り、複製タグ２０
００を検索することによって、該当データのキャッシュ
一致保証制御を行う。キャッシュ一致保証により、他ク
ラスタにダーティブロックが存在するかどうか判定する
（１１０８）、他クラスタにダーティブロックが存在し
なければ、システム制御装置５００はグローバル共有メ
モリ６００のデータを読みだしアクセス元クラスタに転
送し（１１０４）、キャッシュに登録する（１１０
５）。他クラスタにダーティブロックが存在する場合、
該当クラスタのプロセッサーメモリインターフェース３
００がダーティブロックを持つプロセッサ２００に対し
てキャッシュ間データ転送を要求する。ダーティブロッ
クはクラスタ間を渡ってアクセス元のクラスタに転送さ
れる。この時、グローバル共有メモリ６００の読みだし
はキャンセルする（１１０６）。そして応答データは、
アクセス元プロセッサのキャッシュメモリに登録される
（１１０７）。

【００５２】（４）自クラスタ内のローカル共有メモリ
に対するキャッシュフラッシュ図１１は、自クラスタ内のローカル共有メモリに対する
キャッシュフラッシュの処理フローを示す。プロセッサ
２００が発行するキャッシュフラッシュ要求は、プロセ
ッサローカルバス１６００を経由してプロセッサーメモ
リインターフェース装置３００に送信される。この時同
時にクラスタ内の他のプロセッサは、該キャッシュフラ
ッシュ要求を監視し、自キャッシュ内のキャッシュ検索
を行う。また、アクセス元プロセッサはメモリ同期化命
令を実行し、メモリ同期化終了報告を待つ。プロセッサ
ーメモリインターフェース装置３００は、受け取ったア
クセスのアドレスから自クラスタ内のローカル共有メモ
リへのアクセスであることを識別する（１２０１）。次
に、プロセッサ２００のアドレス変換バッファのキャッ
シュ一致保証属性２２３から受け取った情報をもとに、
ローカルキャッシュ一致保証属性のデータかどうかを判
定する（１２０２）。ローカルである場合は、クラスタ
内キャッシュ一致保証が終了するのを待つ（１２０
３）。キャッシュ一致保証の結果、クラスタ内の他のキ
ャッシュメモリ上にダーティブロックが存在するかどう
かを判定する（１２０４）。クラスタ内の他のキャッシ
ュメモリ上にダーティブロックが存在する場合はクラス
タ内でダーティブロックの書き戻しを行い(１２０５)、
アクセス元にメモリが同期したことを報告する(１２０
６)。また、ダーティブロックが存在しない場合は、即
座にアクセス元にメモリが同期したことを報告し処理を
終了する（１２０７）。

【００５３】一方、ローカルキャッシュ一致保証属性の
判定の結果、グローバル属性の場合には、プロセッサグ
ローバルバス１８００にメモリアドレスをブロードキャ
ストする（１２０８）。そして、全てのクラスタに対す
るグローバルキャッシュ一致保証が終了するまで待つ
（１２０９）。他クラスタはブロードキャストされたア
ドレスを受取り、複製タグ２０００を検索することによ
って、該当データのキャッシュ一致保証制御を行う。キ
ャッシュ一致保証の結果、他クラスタにダーティブロッ
クが存在するかどうか判定する（１２１０）。他クラス
タにダーティブロックが存在しなければ、即座にアクセ
ス元にメモリが同期したことを報告する（１２１１）。
他クラスタにダーティブロックが存在する場合、該当ク
ラスタのプロセッサーメモリインターフェース３００が
ダーティブロックを持つプロセッサ２００に対してダー
ティブロックの書き戻しを要求する。ダーティブロック
はクラスタ間を渡ってアクセス元のローカル共有メモリ
に書き戻される(１２１２)。そして、アクセス元にメモ
リが同期したことを報告する（１２１３）。

【００５４】（５）他クラスタ内のローカル共有メモリ
に対するキャッシュフラッシュ図１２は、他クラスタ内のローカル共有メモリに対する
キャッシュフラッシュの処理フローを示す。プロセッサ
２００が発行するキャッシュフラッシュ要求は、プロセ
ッサローカルバス１６００を経由してプロセッサーメモ
リインターフェース装置３００に送信される。この時同
時にクラスタ内の他のプロセッサは、該ブロックリード
要求を監視し、自キャッシュ内のキャッシュ検索を行
う。プロセッサーメモリインターフェース装置３００
は、受け取ったアクセスのアドレスから他クラスタ内の
ローカル共有メモリへのアクセスであることを識別する
(1301)。次に、プロセッサ２００のアドレス変換バッフ
ァのキャッシュ一致保証属性２２３から受け取った情報
をもとに、ローカルキャッシュ一致保証属性のデータか
どうかを判定する（１３０２）。ローカルである場合
は、プロセッサグローバルバス１８００を経由して、キ
ャッシュフラッシュ要求を目標のクラスタに転送する
（１３０３）。目標クラスタはキャッシュフラッシュ要
求を受け付けると、複製タグ２０００を検索することに
よって、該当データのクラスタ内キャッシュ一致保証制
御を行う（１３０４）。キャッシュ一致保証の結果、対
象クラスタ内にダーティブロックが存在するかどうか判
定する（１３０５）。ダーティブロックが存在しなけれ
ば、アクセス元のプロセッサにメモリ同期化が終了した
ことを報告して処理を終える（１３０６）。目標クラス
タ内にダーティブロックが存在する場合は、目標クラス
タのプロセッサーメモリインターフェース３００がダー
ティブロックを持つプロセッサ２００に対してダーティ
ブロックの書き戻しを要求する。ダーティブロックは目
標クラスタ内でローカル共有メモリへ書き戻され（１３
０７）、アクセス元にメモリ同期化が終了したことを報
告する(１３０８)。

【００５５】一方、アクセスしたページがグローバルキ
ャッシュ一致保証属性の場合には、プロセッサグローバ
ルバス１８００を介して、キャッシュフラッシュ要求を
全クラスタにブロードキャストする（１３０９）。そし
て、全てのクラスタに対するグローバルキャッシュ一致
保証が終了するまで待つ（１３１０）。他クラスタはブ
ロードキャストされたアドレスを受取り、複製タグ２０
００を検索することによって、該当データのキャッシュ
一致保証制御を行う。キャッシュ一致保証の結果、他ク
ラスタにダーティブロックが存在するかどうか判定する
（１３１１）。他クラスタにダーティブロックが存在し
なければ、即座にアクセス元のプロセッサにメモリ同期
化が終了したことを報告する（１３１２）。他クラスタ
にダーティブロックが存在する場合、該当クラスタのプ
ロセッサーメモリインターフェース３００がダーティブ
ロックを持つプロセッサ２００に対してダーティブロッ
クの書き戻しを要求する。ダーティブロックはクラスタ
間を渡って、目標クラスタに転送され、ローカル共有メ
モリへ書き戻される（１３１３）。そして、アクセス元
にメモリ同期化が終了したことを報告する（１３１
４）。

【００５６】（６）グローバル共有メモリに対するキャ
ッシュフラッシュ図１３は、グローバル共有メモリ６００に対するキャッ
シュフラッシュの処理フローを示す。プロセッサ２００
が発行するキャッシュフラッシュ要求は、プロセッサロ
ーカルバス１６００を経由してプロセッサーメモリイン
ターフェース装置３００に送信される。この時同時にク
ラスタ内の他のプロセッサは、該ブロックリード要求を
監視し、自キャッシュ内のキャッシュ検索を行う。プロ
セッサーメモリインターフェース装置３００は、受け取
ったアクセスのアドレスからグローバル共有メモリへの
アクセスであることを識別する（１４０１）。次にプロ
セッサグローバルバス１８００を経由して、キャッシュ
フラッシュ要求を全クラスタにブロードキャストする
（１４０２）。そして、全てのクラスタに対するグロー
バルキャッシュ一致保証が終了するまで待つ（１４０
３）。他クラスタはブロードキャストされたアドレスを
受取り、複製タグ２０００を検索することによって、該
当データのキャッシュ一致保証制御を行う。キャッシュ
一致保証の結果、他クラスタにダーティブロックが存在
するかどうか判定する（１４０４）。他クラスタにダー
ティブロックが存在しなければ、即座にアクセス元のプ
ロセッサにメモリ同期化が終了したことを報告する（１
４０５）。他クラスタにダーティブロックが存在する場
合、該当クラスタのプロセッサーメモリインターフェー
ス３００がダーティブロックを持つプロセッサ２００に
対してダーティブロックの書き戻しを要求する。ダーテ
ィブロックはシステム制御装置５００に転送され、グロ
ーバル共有メモリ６００へ書き戻される（１４０６）。
そして、アクセス元にメモリ同期化が終了したことを報
告する（１４０７）。

【００５７】

【発明の効果】本発明によれば、ローカルデータ，共有
データ，スタック領域といったデータの特徴に合わせ
て、キャッシュ一致保証すべき範囲を限定することがで
き、システム内の全てのキャッシュを対象にキャッシュ
一致保証する必要がなく、キャッシュ一致保証制御の遅
延を大幅に改善できる。

【００５８】また、キャッシュ一致保証すべき範囲が限
定されるので、メモリ読みだし／書き込みごとにシステ
ム内の全てのプロセッサにブロードキャストする必要が
なく、プロセッサ間の通信量を大幅に低減することが可
能になる。

【００５９】また、キャッシュ一致保証すべき範囲を限
定する機構により、１０−２０Ｍバイトといった大きな
容量を必要とするディレクトリ方式にくらべ、少ない物
量で効率の良いキャッシュ一致保証が可能となる。

【図面の簡単な説明】

【図１】本発明の一実施例であるマルチプロセッサシス
テムの全体構成図。

【図２】本発明の実施例におけるプロセッサからみえる
実メモリ空間のアドレス割付を示す図。

【図３】本発明の実施例におけるプロセッサの内部構成
図。

【図４】本発明の実施例におけるプロセッサーメモリイ
ンターフェース装置の内部構成図。

【図５】本発明の実施例におけるローカル／グローバル
キャッシュ一致保証制御部の内部構成図。

【図６】アクセスタイプの分類を示す説明図。

【図７】メモリ割当，タスク割当の一例を表す図。

【図８】自クラスタ内ローカル共有メモリへのブロック
リード処理のフロー図。

【図９】他クラスタ内ローカル共有メモリへのブロック
リード処理のフロー図。

【図１０】グローバル共有メモリへのブロックリード処
理のフロー図。

【図１１】自クラスタ内ローカル共有メモリへのキャッ
シュフラッシュ処理のフロー図。

【図１２】他クラスタ内ローカル共有メモリへのキャッ
シュフラッシュ処理のフロー図。

【図１３】グローバル共有メモリへのキャッシュフラッ
シュ処理のフロー図。

【図１４】プロセッサ，ローカル共有メモリ及びグロー
バル共有メモリ周辺の概略構成を表す図。

【符号の説明】

１００…クラスタ、２００…プロセッサ、２２０…アド
レス変換バッファ、２２１…仮想アドレスページ番号、
２２２…実アドレスページ番号、２２３…キャッシュ一
致保証範囲属性情報、２４０…キャッシュメモリ、３０
０…プロセッサーメモリインターフェース装置、４００
…ローカル共有メモリ、５００…システム制御装置、６
００…グローバル共有メモリ、１６００…プロセッサロ
ーカルバス、１８００…プロセッサグローバルバス、２
０００…キャッシュメモリの複製タグ。

───────────────────────────────────────────────────── フロントページの続き (72)発明者石川佐孝神奈川県海老名市下今泉810番地株式会社日立製作所オフィスシステム事業部内

Claims

【特許請求の範囲】

【請求項１】キャッシュメモリ及びアドレス変換バッフ
ァを有する少なくとも２以上のプロセッサと、ローカル
共有メモリと、前記２以上のプロセッサとローカル共有
メモリとに接続され前記プロセッサからのローカル共有
メモリへのアクセスを制御するメモリインタフェース装
置を有するクラスタをバスを介して複数接続し、前記ク
ラスタ内のプロセッサからのグローバル共有メモリへの
アクセスを制御するシステム制御装置を備えたマルチプ
ロセッサシステムにおいて、前記プロセッサからのアク
セスに対し、クラスタ内のキャッシュメモリのみを対象
として一致保証すべきか、又はシステム内の全てのキャ
ッシュメモリを対象として一致保証すべきかを識別する
範囲属性情報を前記アドレス変換バッファに保持するこ
とを特徴とするマルチプロセッサシステム。
【請求項２】キャッシュメモリ及びアドレス変換バッフ
ァを有する少なくとも２以上のプロセッサと、ローカル
共有メモリと、前記２以上のプロセッサとローカル共有
メモリとに接続され前記プロセッサからのローカル共有
メモリへのアクセスを制御するメモリインタフェース装
置を有するクラスタをバスを介して複数接続し、前記ク
ラスタ内のプロセッサからのグローバル共有メモリへの
アクセスを制御するシステム制御装置を備えたマルチプ
ロセッサシステムにおいて、前記プロセッサからのアク
セスに対し、システム内の全てのキャッシュメモリを対
象として一致保証すべきか、又は限定された範囲のキャ
ッシュメモリを対象として一致保証すべきかを識別する
範囲属性情報を前記アドレス変換バッファに保持するこ
とを特徴とするマルチプロセッサシステム。
【請求項３】キャッシュメモリ及びアドレス変換バッフ
ァを有する少なくとも２以上のプロセッサと、ローカル
共有メモリと、前記２以上のプロセッサとローカル共有
メモリとに接続され前記プロセッサからのローカル共有
メモリへのアクセスを制御するメモリインタフェース装
置を有するクラスタをバスを介して複数接続し、前記ク
ラスタ内のプロセッサからのグローバル共有メモリへの
アクセスを制御するシステム制御装置を備えたマルチプ
ロセッサシステムにおいて、前記プロセッサからのアク
セスに対し、システム内の全てのキャッシュメモリを対
象として一致保証すべきか、又は限定された範囲のキャ
ッシュメモリを対象として一致保証すべきかを識別する
範囲属性情報を前記アドレス変換バッファに保持し、前
記メモリインタフェースは、前記アドレス変換バッファ
に保持された範囲属性情報に基づいてキャッシュ一致保
証すべき範囲を判定するキャッシュ一致保証範囲判定手
段を有することを特徴とするマルチプロセッサシステ
ム。
【請求項４】請求項１乃至３のうちのいずれかにおい
て、前記アドレス変換バッファは複数のエントリを有
し、各エントリ毎に前記範囲属性情報を保持することを
特徴とするマルチプロセッサシステム。
【請求項５】請求項３において、前記キャッシュ一致保
証範囲判定手段は、前記プロセッサからのアクセスアド
レスである仮想アドレスが前記アドレス変換バッファに
て変換された実アドレスと、当該実アドレスに対応する
前記属性情報とに基づいてキャッシュ一致保証すべき範
囲を判定することを特徴とするマルチプロセッサシステ
ム。
【請求項６】請求項３又は５において、前記キャッシュ
一致保証範囲判定手段は、自クラスタの番号を示す情報
を保持する自クラスタ番号レジスタと、当該自クラスタ
番号レジスタに保持された情報と前記プロセッサからの
アクセスアドレスである仮想アドレスを前記アドレス変
換バッファにて変換された実アドレスとを比較する比較
器を有することを特徴とするマルチプロセッサシステ
ム。
【請求項７】キャッシュメモリ及びアドレス変換バッフ
ァを有する少なくとも２以上のプロセッサと、ローカル
共有メモリと、前記２以上のプロセッサとローカル共有
メモリとに接続され前記プロセッサからのローカル共有
メモリへのアクセスを制御するメモリインタフェース装
置を有するクラスタをバスを介して複数接続し、前記ク
ラスタ内のプロセッサからのグローバル共有メモリへの
アクセスを制御するシステム制御装置を備えたマルチプ
ロセッサシステムにおいて、前記プロセッサからのアク
セスに対し、システム内の全てのキャッシュメモリを対
象として一致保証すべきか、又は限定された範囲のキャ
ッシュメモリを対象として一致保証すべきかを識別する
範囲属性情報を前記アドレス変換バッファに保持し、前
記メモリインタフェース装置は、前記アドレス変換バッ
ファに保持された範囲属性情報に基づいてキャッシュ一
致保証すべき範囲を判定するキャッシュ一致保証範囲判
定手段と、前記キャッシュ一致保証範囲判定手段による
判定結果に応じて指定された範囲内のプロセッサに対し
てキャッシュ一致保証に使用される情報をブロードキャ
ストするブロードキャスト手段を有することを特徴とす
るマルチプロセッサシステム。
【請求項８】キャッシュメモリ及びアドレス変換バッフ
ァを有する少なくとも２以上のプロセッサと、ローカル
共有メモリと、前記２以上のプロセッサとローカル共有
メモリとに接続され前記プロセッサからのローカル共有
メモリへのアクセスを制御するメモリインタフェース装
置を有するクラスタをバスを介して複数接続し、前記ク
ラスタ内のプロセッサからのグローバル共有メモリへの
アクセスを制御するシステム制御装置を備えたマルチプ
ロセッサシステムにおいて、前記プロセッサからのアク
セスに対し、システム内の全てのキャッシュメモリを対
象として一致保証すべきか、又は限定された範囲のキャ
ッシュメモリを対象として一致保証すべきかを識別する
範囲属性情報を前記アドレス変換バッファに保持し、前
記メモリインタフェース装置は、前記アドレス変換バッ
ファに保持された範囲属性情報に基づいてキャッシュ一
致保証すべき範囲を判定するキャッシュ一致保証範囲判
定手段と、前記キャッシュ一致保証範囲判定手段による
判定結果に応じて指定された範囲内のプロセッサに対し
てキャッシュ一致保証の終了を監視するキャッシュ一致
保証監視手段と、キャッシュ一致保証終了後、自クラス
タ内のキャッシュ間でデータ転送すべきか、前記ローカ
ル共有メモリの読み出しをすべきか又は前記グローバル
共有メモリの読み出しを実行すべきかを選択するデータ
供給元選択手段を有することを特徴とするマルチプロセ
ッサシステム。
【請求項９】請求項３，７又は８において、前記メモリ
インタフェース装置は、前記キャッシュ一致保証範囲判
定手段の結果に従って、指定された範囲内の前記プロセ
ッサからのアクセスであれば、当該プロセッサのキャッ
シュメモリにキャッシュ一致保証の結果である応答デー
タを登録可能とし、指定された範囲外の前記プロセッサ
からのアクセスであれば、当該プロセッサのキャッシュ
メモリに登録不可とするキャッシュ登録制御手段を有す
ることを特徴とするマルチプロセッサシステム。
【請求項１０】キャッシュメモリおよびアドレス変換バ
ッファを有する複数のプロセッサと、前記プロセッサの
実行する命令及びデータを記憶する主記憶装置と、前記
複数のプロセッサと前記主記憶装置に接続され前記プロ
セッサからの主記憶装置へのアクセスを制御するメモリ
インタフェース装置からなるマルチプロセッサシステム
において、前記プロセッサからのアクセスに対し、シス
テム内の全てのキャッシュメモリを対象にキャッシュ一
致保証すべきか、又は限定された範囲のキャッシュメモ
リを対象にしてキャッシュ一致保証すべきかを識別する
範囲属性情報を前記アドレス変換バッファに保持するこ
とを特徴とするマルチプロセッサシステム。
【請求項１１】キャッシュメモリおよびアドレス変換バ
ッファを有する複数のプロセッサと、前記プロセッサの
実行する命令及びデータを記憶する主記憶装置と、前記
複数のプロセッサと前記主記憶装置に接続され前記プロ
セッサからの主記憶装置へのアクセスを制御するメモリ
インタフェース装置からなるマルチプロセッサシステム
において、前記プロセッサからのアクセスに対し、シス
テム内の全てのキャッシュメモリを対象にキャッシュ一
致保証すべきか、又は限定された範囲のキャッシュメモ
リを対象にしてキャッシュ一致保証すべきかを識別する
範囲属性情報を前記アドレス変換バッファに保持し、前
記メモリインタフェース装置は、前記アドレス変換バッ
ファに保持された範囲属性情報に基づいてキャッシュ一
致保証すべき範囲を判定するキャッシュ一致保証範囲判
定手段を有することを特徴とするマルチプロセッサシス
テム。
【請求項１２】請求項１１において、前記メモリインタ
フェース装置は、前記キャッシュ一致保証範囲判定手段
による判定結果に応じて指定された範囲内のプロセッサ
に対してキャッシュ一致保証に使用される情報をブロー
ドキャストするブロードキャスト手段を有することを特
徴とするマルチプロセッサシステム。
【請求項１３】請求項１１または１２において、前記メ
モリインタフェース装置は、前記キャッシュ一致保証範
囲判定手段による判定結果に応じて指定された範囲内の
プロセッサに対してキャッシュ一致保証の終了を監視す
るキャッシュ一致保証監視手段と、キャッシュ一致保証
終了後、キャッシュ間でデータ転送すべきか、前記主記
憶装置の読み出しを実行すべきかを選択するデータ供給
元選択手段を有することを特徴とするマルチプロセッサ
システム。
【請求項１４】請求項１，２，３，７，８，１０または
１１において、前記アドレス変換バッファに保持された
範囲属性情報により指定される範囲のプロセッサに対し
特定のタスクを割り当てるタスク割当て機能を有するこ
とを特徴とするマルチプロセッサシステム。
【請求項１５】主記憶装置に記憶された命令のうちその
一部を保持する命令キャッシュメモリと、前記主記憶装
置に記憶されたデータのうちその一部を保持するデータ
キャッシュメモリと、前記命令キャッシュメモリ又は主
記憶装置から実行すべき命令を読み出す命令フェッチユ
ニットと、前記命令フェッチユニットにより読み出され
た命令を解釈し、前記データキャッシュメモリ又は主記
憶装置からデータを読み出し、前記解釈された命令を実
行する命令実行ユニットと、前記命令フェッチユニット
又は命令実行ユニットより発せられる仮想アドレスを実
アドレスに変換するアドレス変換バッファを有するプロ
セッサであって、前記アドレス変換バッファは、複数の
プロセッサが接続された場合に、複数のキャッシュメモ
リのうちキャッシュ一致保証すべき範囲を指定する範囲
属性情報を保持する領域を有することを特徴とする範囲
指定可能なプロセッサ。