JP2565648B2

JP2565648B2 - 変換索引バッファのコヒーレンス維持方法及びシステム

Info

Publication number: JP2565648B2
Application number: JP5207505A
Authority: JP
Inventors: チャールズ・ロバーツ・ムーア; ジョン・ステファン・ムヒク
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1992-10-09
Filing date: 1993-08-23
Publication date: 1996-12-18
Anticipated expiration: 2011-12-18
Also published as: EP0592121B1; JPH06187241A; DE69327288D1; US5437017A; EP0592121A1; DE69327288T2

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は一般的には改良型マルチ
プロセッサデータ処理システムに関し、より特定化する
ならば、マルチプロセッサデータ処理システムにおいて
メモリコヒーレンスを維持する改良方法とシステムに関
する。なおより特定化するならば本発明は、マルチプロ
セッサデータ処理システムにおいてプロセッサ間割込み
を利用せずに変換索引バッファ（ＴＬＢ）のコヒーレン
スを維持する改良方法とシステムに関する。

【０００２】

【従来の技術】最近の技術を利用したデータ処理システ
ムの設計者は、同様のシステムのパーフォマンスを向上
させるよう絶えず試みてきた。データ処理システム効率
を向上させる１つの技法は、短いサイクル時間と低いサ
イクル当たりの命令（ＣＰＩ）比を達成することであ
る。向上したデータ処理システムへ上記技術を適用した
優れた例は、ＩｎｔｅｒｎａｔｉｏｎａｌＢｕｓｉｎ
ｅｓｓＭａｃｈｉｎｅｓＣｏｒｐｏｒａｔｉｏｎのＲ
ＩＳＣシステム６０００（ＲＳ／６０００）というコン
ピュータである。ＲＳ／６０００システムはマルチユー
ザ商用環境と同様に、数値的に高度な工学・科学への適
用で優れた性能を発揮するよう設計されている。ＲＳ／
６０００のプロセッサはマルチスカラ形式のインプリメ
ンテーションを採用しており、これはマルチ命令を発生
させ、それらを同時に実行させることを意味する。

【０００３】マルチ命令の同時発生と実行には、高度な
命令バンド幅を有する並列実行可能な独立機能ユニット
が必要である。ＲＳ／６０００システムは現実にパイプ
ライン方式の別々の分岐、固定点及び浮動点の処理ユニ
ットを利用してマルチ命令の発生と実行を達成してい
る。そのようなシステムで重大なパイプライン上の遅延
ペナルティは、条件分岐命令の実行から生じる。条件分
岐命令とは、１つ乃至それ以上の命令処理の選択結果に
応じてアプリケーション中で指定された条件分岐の選択
指示命令である。このように、条件分岐命令がパイプラ
インキューを経由してそのキューの実行位置へ伝搬する
時刻までのランタイム遅延を避けるため、その条件分岐
決定前に、条件分岐命令後のキュー命令を実行する必要
がある。

【０００４】マルチスカラプロセッサシステムで発生す
る１つの遅延源は、そのようなシステムが典型的には同
時にマルチタスクを実行する事実にある。それらの各マ
ルチタスクは典型的に、そのタスク実行に利用する有効
または仮想アドレス空間を有する。そのような有効また
は仮想アドレス空間内の配置は、システムメモリを実ア
ドレスへ”変換する”アドレスを含む。実アドレスの単
一空間に、マルチスカラプロセッサシステムの複数の有
効または仮想アドレスを変換することは時に一般的であ
る。これらのアドレスをシステムメモリの実アドレスへ
変換する必要があるため、各マルチタスクによる有効ま
たは仮想アドレスの利用は、マルチスカラプロセッサシ
ステムに補足的遅延を発生させ、そのため適切な命令や
データがメモリから回収させ、マルチスカラプロセッサ
システムを形成する複数の独立な機能ユニットの１つへ
ディスパッチする命令キューに配置させる。

【０００５】マルチスカラプロセッサシステムの有効ま
たは仮想アドレスメモリがシステムメモリの実アドレス
へすぐに変換される１つの技術は、いわゆる”変換索引
バッファ”（ＴＬＢ）の利用にある。変換索引バッファ
（ＴＬＢ）とは、変換アルゴリズムを利用し生成され
た、有効または仮想メモリアドレスと実メモリアドレス
間の変換関係を含むバッファである。変換索引バッファ
（ＴＬＢ）デバイスの利用がアドレス間変換を行う妥当
な有効手法を提供する一方、密結合対称型マルチプロセ
ッサシステムにおいてそのようなバッファを利用すると
バッファ間のコヒーレンスに問題が生じる。マルチプロ
セッサが通常システムの実メモリを読書きするデータ処
理システムにおいて、そのメモリシステムがコヒーレン
ト状態で動作するよう注意を払わねばならない。つま
り、マルチプロセッサ動作の結果、メモリシステムがイ
ンコヒーレントになってはならない。そのようなマルチ
プロセッサデータ処理システムの各プロセッサは典型的
に、アドレス変換用の変換索引バッファ（ＴＬＢ）を含
み、システムメモリの局面の一部として、コヒーレンス
を維持するようマルチプロセッサシステム中のあるプロ
セッサの単一変換索引バッファ（ＴＬＢ）への変化を各
変換索引バッファ（ＴＬＢ）へ注意深く首尾一貫して変
換する必要がある。

【０００６】前記マルチプロセッサの変換索引バッファ
（ＴＬＢ）のコヒーレンス維持は、全ての変換索引バッ
ファ（ＴＬＢ）の改良に対し、プロセッサ間割込みとソ
フトウエア同期を利用し典型的に達成される。これらの
アプローチはマルチプロセッサシステムにわたったコヒ
ーレンスを保証するために利用できる。しかしながら、
割込みとソフトウエア同期の利用必要性は、マルチプロ
セッサコンピュータシステムで実質的なパーフォマンス
低下となる。

【０００７】それゆえ、マルチプロセッサデータ処理シ
ステムにおいてプロセッサ間割込みを利用せずに変換索
引バッファのコヒーレンスを維持する利用方法とシステ
ムが必要であることは明らかである。

【０００８】

【発明が解決しようとする課題】それゆえ本発明の１つ
の目的は、改良型マルチプロセッサデータ処理システム
を提供することである。

【０００９】本発明のもう１つの目的は、マルチプロセ
ッサデータ処理システムにおいてメモリコヒーレンス維
持の改良方法とシステムを提供することである。

【００１０】さらに本発明のもう１つの目的は、マルチ
プロセッサデータ処理システムにおいてプロセッサ間割
込みを利用せずに変換索引バッファのコヒーレンスを維
持する改良方法とシステムを提供することである。

【００１１】

【課題を解決するための手段】前記課題は以下で記述さ
れるように達成される。変換索引バッファ（ＴＬＢ）
は、有効または仮想アドレスをシステムメモリの実アド
レスへ効率的に変換するデータ処理システムでしばしば
利用される。全システムメモリにアクセスするマルチプ
ロセッサを含むシステムでは、各プロセッサは有効アド
レスを実アドレスへ変換する変換索引バッファ（ＴＬ
Ｂ）を含んでおり、それゆえ全変換索引バッファ（ＴＬ
Ｂ）間のコヒーレンスが維持されねばならない。マルチ
プロセッサシステムのいずれかのプロセッサによる変換
索引バッファ無効化（ＴＬＢＩ）命令の実行に応じた一
意的バス構造を同報通信するため、ここで明らかにされ
た方法とシステムを利用する。各プロセッサの保留中の
変換索引バッファ無効化（ＴＬＢＩ）命令が無いことの
みに応じて、そのバスに沿った他のプロセッサによりそ
のバス構造が受理される。このように、同報通信された
変換索引バッファ無効化（ＴＬＢＩ）命令は、システム
の全プロセッサによってその命令が受理されれば、マル
チプロセッサシステムの他のプロセッサによって実行の
みが行われる。システムの全プロセッサで、変換索引バ
ッファ無効化（ＴＬＢＩ）命令を実行開始後、保留中の
命令実行は変換索引バッファ無効化（ＴＬＢＩ）命令が
実行される後まで一時的に中断させられる。それゆえ、
メモリキューの全読書き操作がコヒーレンスを達成する
まで命令実行を保留する。次に、利用アドレスがなおも
妥当であることを保証するため、改良型変換索引バッフ
ァ（ＴＬＢ）を利用して全ての保留命令とプリフェッチ
命令を再フェッチする。

【００１２】本発明の補足的な話題、特徴及び利点と同
様に、上記内容を引き続き詳細な記述で明らかにする。

【００１３】

【実施例】ここで以下の図に関連し、特に図１では、本
発明の方法とシステムのインプリメンテーションのため
利用される、マルチプロセッサデータ処理システム６を
描写した高レベルブロックダイヤグラムが描写されてい
る。描写されているように、マルチプロセッサデータ処
理システム６は、バス８を利用してシステムメモリ１８
へ各々結合されたマルチスカラプロセッサ１０を利用し
て構築される。マルチプロセッサデータ処理システム６
といった密結合対称型マルチプロセッサシステムで、マ
ルチプロセッサデータ処理システム６の各プロセッサ１
０はメモリ１８への読書きのため利用される。このよう
に、メモリ１８のデータと命令がコヒーレンスであり続
けるよう保証するため、システムとインタロックを利用
せねばならない。

【００１４】図１に描写され、ここでより詳細に説明さ
れるように、マルチプロセッサデータ処理システム６の
各プロセッサ１０は、命令またはデータ用の有効または
仮想アドレスをシステムメモリ１８の実アドレスへ効率
的に変換するため利用される、変換索引バッファ（ＴＬ
Ｂ）を含んでいる。変換索引バッファ（ＴＬＢ）がメモ
リ空間を構成するという事実の観点から、その正確な操
作を保証するため、マルチプロセッサデータ処理システ
ム６の各変換索引バッファ（ＴＬＢ）間のコヒーレンス
を維持することが重要である。

【００１５】ここで図２では、図１のマルチプロセッサ
データ処理システム６を提供するため利用するマルチス
カラプロセッサ１０の高レベルブロックダイヤグラムが
描写されている。描写されているように、マルチスカラ
プロセッサ１０はマルチスカラプロセッサ１０によりデ
ータ、命令やシステムメモリ１８（図１を見よ）から読
書きされる同様のものを格納するため利用するメモリキ
ュー３６を含むのが望ましい。メモリキュー３６内に格
納されるデータや命令はキャッシュ／メモリインタフェ
ース２０を利用して、当技術の専門家に公知の方法でア
クセスされる。キャッシュメモリシステムの整列と利用
は、データ処理技術で公知の専門技術であり、本実施例
で記載しない。しかしながら、最近の関連キャッシュ技
術を利用してメモリアクセスの大きな割合を、キャッシ
ュ／メモリインタフェース２０に一時的に格納されたデ
ータを利用して達成することを、当技術の専門家は認識
すると思われる。

【００１６】キャッシュ／メモリインタフェース２０か
らの命令は典型的には、複数のキュー位置をなるべく含
むよう命令キュー２２へロードされる。マルチスカラコ
ンピュータシステムの典型的実施例では、命令キューは
８個のキュー位置を含み、それゆえ与えられたサイクル
内でキャッシュ／メモリインタフェース２０が何個の妥
当な命令を通過させたか、命令キュー２２でいくらの空
間が利用できるかにより、０乃至８個の命令を命令キュ
ー２２へロードする。

【００１７】同様のマルチスカラプロセッサシステムで
典型的なように、命令キュー２２はマルチ実行ユニット
へ命令をディスパッチさせるため利用される。図２に描
写されているように、マルチスカラプロセッサ１０は浮
動点プロセッサユニット２４、固定点プロセッサユニッ
ト２６と分岐プロセッサユニット２８を含む。このよう
に、命令キュー２２は１サイクル内で０乃至３個の命令
を各実行ユニットの１つへディスパッチさせる。

【００１８】命令キュー２２よりディスパッチされる順
次命令に加えて、いわゆる”条件分岐命令”を分岐プロ
セッサによる実行のため命令キュー２２へロードする。
条件分岐命令とは、１つ乃至それ以上の順次命令処理の
選択結果に応じてアプリケーションで選択される付随条
件分岐を指定した命令である。マルチスカラプロセッサ
１０といったパイプライン型プロセッサシステムでのラ
ンタイム遅延を最小化する試みでは、命令キュー２２の
条件分岐命令の存在が検出され、その条件分岐命令の結
果が予測される。当技術の専門家にとって公知のよう
に、条件分岐を”選択せず”と予測した時、命令キュー
の順次命令は単に現在のパスに沿って継続され、変更さ
れる命令はない。しかしながら、分岐発生予測が間違い
の場合、命令キューは後続プログラムオーダ中に条件分
岐命令を持つ順次命令を除去せねばならず、目的命令を
フェッチせねばならない。代りに、条件分岐命令を”選
択する”と予測した場合、その予測が正しいと決定され
るならば後続の条件分岐のため目的命令をフェッチし、
利用する。そしてもちろん”選択する”と予測した場
合、目的命令を除去し、後続のプログラムオーダ中に条
件分岐命令を持つ順次命令を回収せねばならない。

【００１９】記述したように、マルチスカラプロセッサ
１０はまた条件レジスタ３２を含むことが望ましい。マ
ルチスカラプロセッサ１０で処理される順次命令結果を
利用する際に発生するさまざまな比較結果を一時的に格
納するため、条件レジスタ３２を利用する。このよう
に、浮動点プロセッサユニット２４、固定点プロセッサ
ユニット２６と分岐プロセッサユニット２８は条件レジ
スタ３２に全て結合されている。条件レジスタ３２のあ
る特定条件の状態を検出し、分岐開始条件の発生に応じ
て目的命令をフェッチする目的でその際利用される目的
アドレスを生成するため、前記状態を分岐プロセッサユ
ニット２８へ結合する。

【００２０】その後、分岐プロセッサユニット２８はフ
ェッチャ３０へ目的アドレスを結合する。フェッチャ３
０は、後続の条件分岐に必要な目的命令のフェッチアド
レスを計算し、キャッシュ／メモリインタフェース２０
へそれらのフェッチアドレスを結合する。当技術の専門
家が認識しているように、それらのフェッチアドレスに
関連する目的アドレスがキャッシュ／メモリインタフェ
ース２０に存在している場合、それらの目的命令は命令
キュー２２へロードされる。代りに、その目的命令はメ
モリ１８よりフェッチされ、その後それらの目的命令を
フェッチするため必要な遅延の後、キャッシュ／メモリ
インタフェース２０から命令キュー２２へロードされ
る。

【００２１】当技術の専門家が認識しているように、マ
ルチスカラプロセッサ１０の各タスクは典型的に有効メ
モリまたはそれと共に仮想メモリ空間に関連し、各タス
クのインプリメントに必要な命令は有効または仮想アド
レスを利用してその空間内に配置される。このようにフ
ェッチャ３０は、各タスクにより利用される有効アドレ
スからの命令のため実アドレスを決定できなければなら
ない。以上に述べたように、フェッチャ３０の前記イン
プリメンテーションでは典型的に、有効または仮想命令
アドレスから実命令アドレスを決定するため、複雑な変
換索引バッファ（ＴＬＢ）、シーケンスレジスタとマル
チ変換アルゴリズムを結合させるか、代りにそのような
複雑な変換能力を有するメモリ管理ユニット（ＭＭＵ）
へアクセスするため同様な命令フェッチャを必要とす
る。

【００２２】また、メモリ管理ユニット（ＭＭＵ）がマ
ルチスカラプロセッサ１０に描写されている。より詳細
にこのことが記述されるように、メモリ管理ユニット
は、マルチスカラプロセッサ１０で各有効アドレスをシ
ステムメモリの実アドレスへ変換するために利用され
る、変換索引バッファ（ＴＬＢ）と、全ての必要なレジ
スタと、変換アルゴリズムを含むことが望ましい。フェ
ッチユニットでは典型的にメモリ管理ユニット（ＭＭ
Ｕ）をアクセスする優先権が非常に低く、それゆえメモ
リ管理ユニット（ＭＭＵ）を利用し実命令アドレスを得
る時に多少の遅延が予測される。

【００２３】ここで図３では、図２の変換索引バッファ
（ＴＬＢ）とマルチスカラプロセッサ１０のメモリ管理
ユニット（ＭＭＵ）を描写したより詳細なブロックダイ
ヤグラムが描写されている。図３に描写されているよう
に、キャッシュ／メモリインタフェース２０、フェッチ
ャ３０とメモリ管理ユニット３４間の関係が描写されて
いる。公知のメモリ管理ユニットにおいて典型的なよう
に、メモリ管理ユニット（ＭＭＵ）は実質的に整列済の
変換索引バッファ（ＴＬＢ）４０を含む。当技術の専門
家は、有効または仮想アドレスを実アドレスへ変換する
かなり高速化技術として変換索引バッファ（ＴＬＢ）を
時に利用することを認識すると思われる。また、ＰＴＥ
変換器４２とＢＡＴ変換器４４がメモリ管理ユニット
（ＭＭＵ）３４に存在する。ＰＴＥ変換器４２はむしろ
ページテーブル型変換のインプリメントに利用され、Ｂ
ＡＴ変換器４４はアドレスブロック型変換形式の変換に
利用される。ページテーブル型変換が、首尾一貫して配
列されたメモリページを持つシステムで発生する一方、
アドレスブロック型変換が例えばメモリが２８キロバイ
トブロック乃至８メガバイトの範囲のサイズを有する定
義済アドレスブロックに帰する点で、これら２つの変換
アルゴリズムが実質的に異なっていることを、当技術の
専門家は認識すると思われる。

【００２４】このように図３に関連し、ＰＴＥ変換器４
２に接続した変換索引バッファ（ＴＬＢ）４０を利用す
ることで、マルチスカラプロセッサ１０（図２を見よ）
のページテーブル型変換を利用して全有効アドレスをシ
ステムメモリの実アドレスへ変換することを、当技術の
専門家は認識すると思われる。もちろん、当技術の専門
家はまた、セグメントレジスタが同様な変換に対しても
また利用されることを認識すると思われる。代りに、ア
ドレスブロック型変換はＢＡＴ変換器４４のみを利用し
達成される。描写されている方法によるマルチ変換アル
ゴリズムの提供によって、マルチスカラプロセッサ１０
の各有効または仮想アドレスをメモリ管理ユニット（Ｍ
ＭＵ）３４を利用してシステムメモリの実アドレスへ変
換する。

【００２５】当技術の専門家が認識するように、フェッ
チャ３０がフェッチアドレスを、分岐プロセッサユニッ
ト２８によって選択された目的命令のために、キャッシ
ュ／メモリインタフェース２０へ結合するために利用さ
れる。分岐プロセッサユニット２８からフェッチャ３０
に結合された各目的アドレスに対して、フェッチアドレ
スが決定され、キャッシュ／メモリインタフェース２０
に結合される。本発明が描写する実施例では、メモリ管
理ユニット３４の変換索引バッファ（ＴＬＢ）をアクセ
スすることでこれらのアドレスがしばしば決定される。
マルチプロセッサデータ処理システム６の各マルチスカ
ラプロセッサ１０中のコヒーレンスを維持するため、各
マルチスカラプロセッサ１０の各変換索引バッファ（Ｔ
ＬＢ）４０間のコヒーレンスを維持する必要があること
は明らかである。

【００２６】ここで図４では、図１のマルチプロセッサ
データ処理システムのあるマルチスカラプロセッサによ
る変換索引バッファ無効化（ＴＬＢＩ）命令の起動を描
写した高レベルフローチャートが描写されている。有効
または仮想アドレスをシステムメモリの実アドレスへ変
換するためさもなくば利用される、変換索引バッファ
（ＴＬＢ）のエントリを無効化するため、変換索引バッ
ファ無効化（ＴＬＢＩ）命令がデータ処理システムに生
じることを、当技術の専門家は認識すると思われる。も
ちろん、同様の状況はシステムメモリのデータや命令の
再配置の結果、または有効または仮想アドレスとシステ
ムメモリの実アドレス間の変換関係を改良する何らかの
他の操作結果として発生する。

【００２７】図４に描写されているように、そのプロセ
スはブロック５０で始まり、ブロック５２へその後進
む。ブロック５２は図１のマルチスカラデータ処理シス
テム６のマルチスカラプロセッサの固定点プロセッサユ
ニットで変換索引バッファ無効化（ＴＬＢＩ）命令が”
実行”位置にあるか否かの決定手段を描写している。こ
の状況が発生しなければ、変換索引バッファ無効化（Ｔ
ＬＢＩ）命令が、システムの固定点プロセッサユニット
中で”実行”位置にあると検出される時刻まで、その過
程が単に繰返されるだけである。変換索引バッファ無効
化（ＴＬＢＩ）命令を検出後、その過程はブロック５４
へ進む。ブロック５４は、局所マルチスカラプロセッサ
１０の変換索引バッファ（ＴＬＢ）上での局所的変換索
引バッファ無効化（ＴＬＢＩ）命令のパーフォマンスを
描写している。その後、その過程はブロック５６へ進
む。

【００２８】ブロック５６は局所マルチスカラプロセッ
サ１０によるバスアクセスのための仲裁（アービトレー
ション）を描写し、その後その過程はブロック５８へ進
む。ブロック５８は、アクセスがバス８（図１を見よ）
に保証されているか否かの決定手順を描写し、アクセス
が保証されていなければ、再びバスアクセス仲裁を試み
るよう繰返しブロック５６へ復帰する。ブロック５８で
決定されたように、バス８へのアクセス獲得後、その過
程はブロック６０へ進む。ブロック６０は、実行された
変換索引バッファ無効化（ＴＬＢＩ）命令と関連付けら
れる変換索引バッファ無効化（ＴＬＢＩ）命令のバス構
造をバス８を経由して他のプロセッサに同報通信する描
写である。当業者ならば前記内容を参照すれば、トラン
ザクションコード拡張セットを用いて既存のメモリバス
構造を利用できること、及び、変換索引バッファ無効化
（ＴＬＢＩ）命令は、”インデックス”に基づいた無効
処理にすることもできるし、又は、変換索引バッファ無
効化（ＴＬＢＩ）命令により無効にされるページの仮想
アドレス全体を同報通信するようにすることもできると
いうことを認識すると思われる。

【００２９】次に、その過程はブロック６２へ進む。マ
ルチプロセッサ処理システム６のマルチスカラプロセッ
サシステムの１つが、同報通信する変換索引バッファ無
効化（ＴＬＢＩ）命令のバス構造を受理しなかったこと
を指示する、”リトライ”メッセージが検出されている
か否かの決定手順をブロック６２は描写している。この
発生により、上記方法で変換索引バッファ無効化（ＴＬ
ＢＩ）命令のバス構造の同報通信を再度試みるため繰返
しその過程がブロック５６へ復帰する。しかしながら、
イベント中に”リトライ”メッセージが検出されなけれ
ば、このことはマルチスカラデータ処理システム６中の
各マルチスカラ処理システムが変換索引バッファ無効化
（ＴＬＢＩ）命令のバス構造の同報通信を受理したこと
を示し、その過程はこの時、ブロック６４へ進む。再度
ブロック６４は、バスアクセスのための局所マルチスカ
ラプロセッサによる仲裁を描写し、その過程はこの時ブ
ロック６６へ進む。ブロック６６はバスへのアクセスが
得られているか否かの決定手順を描写している。アクセ
スが得られていなければ、バスアクセスが獲得される時
刻まで、その過程はブロック６４へ繰返し復帰する。

【００３０】ブロック６８では、バスへのアクセス獲得
後、マルチプロセッサデータ処理システム１０内で最初
に命令を実行したプロセッサによって”同期”信号が同
報通信されることをブロック６８は描写している。この
信号は、マルチプロセッサデータ処理システムの各マル
チスカラプロセッサが変換索引バッファ無効化（ＴＬＢ
Ｉ）命令を実行したか否かを決定するため利用される。

【００３１】ここでブロック７０で、イベント中に”リ
トライ”メッセージが検出されていることはマルチプロ
セッサデータ処理システム６中の１つ乃至それ以上のプ
ロセッサが変換索引バッファ無効化（ＴＬＢＩ）命令完
了に失敗したことを示し、マルチプロセッサデータ処理
システム６中の全マルチスカラプロセッサが変換索引バ
ッファ無効化（ＴＬＢＩ）命令を実行している確証を得
るよう再度試みるため、その過程はブロック６４へ繰返
し復帰する。各プロセッサがその命令を実行完了した指
示を受信後、その過程はブロック７２へ進み、復帰す
る。

【００３２】ここで図５では、本発明の方法とシステム
に従って、図１のマルチプロセッサデータ処理システム
にわたる変換索引バッファ無効化（ＴＬＢＩ）命令の処
理を描写した高レベル論理フローチャートが描写されて
いる。描写されているように、この過程はブロック１０
０で始まり、その後ブロック１０２へ進む。ブロック１
０２は、バス８に沿って同報通信される変換索引バッフ
ァ無効化（ＴＬＢＩ）命令のバス構造がマルチプロセッ
サデータ処理システム６のマルチスカラプロセッサにお
いて検出されているか否かの決定手順を描写している。
検出されていなければ、このイベントが発生する時刻ま
でその過程を単に繰返す。

【００３３】さらにブロック１０２で、イベント中に変
換索引バッファ無効化（ＴＬＢＩ）命令バス構造が検出
されていなければ、その過程はブロック１０４へ進む。
以前の変換索引バッファ無効化（ＴＬＢＩ）命令がなお
も保留中で、また実行完了にないことを示す、”ＴＬＢ
Ｉ保留”フラグがセットさせているか否かの決定手順を
ブロック１０４は表現する。フラグがセットされていれ
ば、現行マルチプロセッサが変換索引バッファ無効化
（ＴＬＢＩ）命令のバス構造を受理していないことを示
す”リトライ”メッセージの言明を表現するブロック１
０６へその過程が進む。その後、その過程はブロック１
０８へ進み、復帰する。

【００３４】再びブロック１０４でイベント中に”ＴＬ
ＢＩ保留”フラグがセットさせていなければ、その過程
はブロック１１０へ進む。変換索引バッファ無効化（Ｔ
ＬＢＩ）命令のバス構造がもう１つのプロセッサで受理
されなかったことを示す”リトライ”メッセージを、マ
ルチプロセッサデータ処理システム６の他のマルチスカ
ラプロセッサが言明したか否かの決定手順をブロック１
１０は表現する。言明されたならば、その過程はブロッ
ク１１２へ進む。ブロック１１２は、変換索引バッファ
無効化（ＴＬＢＩ）命令のバス構造の無視を表現し、こ
の時その過程はブロック１０８へ進み、復帰する。

【００３５】再びブロック１１０で、イベント中に”Ｔ
ＬＢＩ保留”フラグがセットさせておらず、マルチプロ
セッサデータ処理システム６の他のプロセッサが１つ
も”リトライ”メッセージを言明していなければ、その
過程はブロック１１４へ進む。ブロック１１４は、”Ｔ
ＬＢＩ保留”フラグのセットを表現し、変換索引バッフ
ァ無効化（ＴＬＢＩ）命令の実行過程を始める。

【００３６】ここでブロック１１６で、そこで描写され
ている過程はマルチスカラプロセッサ命令のディスパッ
チ中断と、そのプロセッサ内キューで保留中の命令のア
ドレス格納を表現している。次に、その過程はブロック
１１８へ進む。なんらの保留中の命令もすぐに実行状態
にないことを示す、浮動点プロセッサの”実行”位置が
クリアされたか否かの決定手順をブロック１１８は表現
する。クリアされていなければ、この条件が発生時刻ま
でその過程が単に繰返される。

【００３７】なおもブロック１１８で、固定点プロセッ
サの”実行”位置がクリアさせていることを決定後、そ
の過程はブロック１２０へ進む。このマルチスカラプロ
セッサに対する固定点プロセッサの”実行”位置へ関連
変換索引バッファ無効化”ＴＬＢＩ”命令を挿入するこ
とをブロック１２０は表現する。その時その過程はブロ
ック１２２へ進む。ブロック１２２は変換索引バッファ
無効化（ＴＬＢＩ）命令の局所パーフォマンスを表現す
る。

【００３８】次に、本発明の重要な特徴に従って、その
過程はブロック１２４へ進む。ブロック１２４は、メモ
リキュー３６の全操作がコヒーレンスを達成しているか
否かの決定手順を表現する。つまり、マルチプロセッサ
データ処理システム６の各マルチスカラプロセッサはメ
モリキュー３６内で保留中とされている読書き操作を認
識している。メモリキュー３６（図２を見よ）の全操作
がコヒーレンスを達成していないイベントでは、この条
件が発生する時刻までその過程を単に繰返す。その後、
メモリキュー３６の全操作がコヒーレンスを達成した
後、その過程はブロック１２６へ進む。

【００３９】ブロック１２６は、命令キューのプレフェ
ッチバッファ除去を表現している。前記内容参照時に、
そのフェッチャが必然的に命令キューより高速に実行
し、結果として変換索引バッファ無効化（ＴＬＢＩ）命
令実行によって無効化されたアドレスからの命令をフェ
ッチャがプレフェッチすることを、当技術の専門家は認
識すると思われる。それゆえ、変換索引バッファ（ＴＬ
Ｂ）の変更発生後、それらのバッファに配置された全命
令がフェッチされることを保証する命令キュープレフェ
ッチバッファを除去する必要がある。

【００４０】次に、その過程はブロック１２８へ進む。
改良型変換索引バッファ（ＴＬＢ）を利用した、このマ
ルチスカラプロセッサから格納保留中の命令のアドレス
への分岐をブロック１２８は、表現する。上述のよう
に、この過程は変換索引バッファ（ＴＬＢ）の最新デー
タを利用して、そのプロセッサの実行位置に置かれた命
令が回収されていることを保証することが必要である。
その後、”ＴＬＢＩ保留”フラグがクリアされ、標準的
なディスパッチと命令実行が再開される。その後、その
過程はブロック１３０へ進み、復帰する。

【００４１】最後に図６では、本発明の方法とシステム
に従って、図１のマルチプロセッサデータ処理システム
にわたる変換索引バッファ無効化（ＴＬＢＩ）命令の同
期を描写した高レベル論理フローチャートが描写されて
いる。描写されているように、この過程はブロック８０
で始まり、その後ブロック８２へ進む。ブロック８２
は、マルチプロセッサデータ処理システム６のマルチス
カラプロセッサによる”同期”信号の検出を描写してい
る。イベント中にこの信号が検出されていなければ、同
期”信号が検出される時刻までその過程を単に繰返す。

【００４２】”同期”信号検出後、その過程はブロック
８４へ進む。変換索引バッファ無効化（ＴＬＢＩ）命令
が現在のマルチスカラプロセッサ内で保留状態か否かの
決定手順をブロック８４は描写する。プロセッサの”Ｔ
ＬＢＩ保留”フラグの状態をチェックすることで、この
ことを達成するのが望ましい。そのイベント中で”ＴＬ
ＢＩ保留”のフラグがセットさせていなければ、その過
程は単にブロック８８へ進み、復帰する。代りに、”Ｔ
ＬＢＩ保留”のフラグがセットさせていれば、その過程
はブロック８６へ進む。本変換索引バッファ無効化（Ｔ
ＬＢＩ）命令についてマルチプロセッサデータ処理シス
テムにわたりまだ同期が達成されていないことを示す、
このプロセッサによる”リトライ”メッセージ言明をブ
ロック８６は表現する。

【００４３】上記内容の参照時には、当技術の専門家
は、以下のことを認識すると思われる。ここでの本発明
が、マルチプロセッサシステム中の変換索引バッファ
（ＴＬＢ）のコヒーレンスを維持するための方法とシス
テムを提示し、しかも上記マルチプロセッサシステムは
プロセッサ間割込みとソフトウエア同期を必要とせず、
各マルチスカラプロセッサにより受理されねばならない
各変換索引バッファ無効化（ＴＬＢＩ）命令に関連する
バス構造の同報通信による達成と、各マルチスカラプロ
セッサのメモリキューと命令キューの操作を無効化し、
その後変換索引バッファ（ＴＬＢ）を利用し完了させる
保証による達成で、上記マルチプロセッサシステムの各
変換索引バッファ（ＴＬＢ）で真のコヒーレンスが実現
される。変換索引バッファ無効化（ＴＬＢＩ）命令をマ
ルチスカラプロセッサの実行パイプラインへ挿入するこ
とで、次の命令への効率的分岐を変換索引バッファ無効
化（ＴＬＢＩ）命令実行終了時に発生させ、放棄される
予定でプリフェッチ中であり新しい前後関係下で再フェ
ッチされる後続の命令を許可する。

【００４４】

【発明の効果】本発明により、改良型マルチプロセッサ
データ処理システムが提供され、マルチプロセッサデー
タ処理システムにおいてメモリコヒーレンス維持の改良
方法とシステムが提供される。

【図面の簡単な説明】

【図１】本発明の方法とシステムのインプリメンテーシ
ョンに利用されるマルチプロセッサデータ処理システム
を描写した高レベルブロックダイヤグラムである。

【図２】図１中のマルチプロセッサデータ処理システム
のあるマルチスカラプロセッサを描写した高レベルブロ
ックダイヤグラムである。

【図３】図２中のマルチスカラプロセッサの変換索引バ
ッファ（ＴＬＢ）とメモリ管理ユニット（ＭＭＵ）を描
写したより詳細なブロックダイヤグラムである。

【図４】本発明の方法とシステムに従って、図１のマル
チプロセッサデータ処理システムのあるマルチスカラプ
ロセッサで変換索引バッファ（ＴＬＢ）の起動を描写し
た高レベル論理フローチャートである。

【図５】本発明の方法とシステムに従って、図１のマル
チプロセッサデータ処理システムにわたり変換索引バッ
ファ無効化（ＴＬＢＩ）命令の処理を描写した高レベル
論理フローチャートである。

【図６】本発明の方法とシステムに従って、図１のマル
チプロセッサデータ処理システムにわたり変換索引バッ
ファ無効化（ＴＬＢＩ）命令の同期を描写した高レベル
論理フローチャートである。

【符号の説明】

６マルチプロセッサデータ処理システム８バス１０マルチスカラプロセッサ１８システムメモリ２０キャッシュ／メモリインタフェース２２命令キュー２４浮動点プロセッサユニット２６固定点プロセッサユニット２８分岐プロセッサユニット３０フェッチャ３２条件レジスタ３４メモリ管理ユニット３６メモリキュー４０変換索引バッファ（ＴＬＢ）４２ＰＴＥ変換器４４ＢＡＴ変換器

───────────────────────────────────────────────────── フロントページの続き (72)発明者ジョン・ステファン・ムヒクアメリカ合衆国78759 テキサス州、オースティン、アルバーストーン・ウェイ 8606 (56)参考文献特開平１−109452（ＪＰ，Ａ) 特開昭63−201854（ＪＰ，Ａ)

Claims

(57)【特許請求の範囲】

【請求項１】システムメモリと、バス経由で共に結合さ
れた複数プロセッサとを有し、前記複数プロセッサの各々がマルチ命令を実行するマル
チプロセッサユニットと、前記システムメモリの読書き
操作を実行するメモリ管理ユニットと、命令又はデータ
の有効アドレスを該システムメモリの実アドレスへ変換
する変換索引バッファ（ＴＬＢ）とを有するマルチプロ
セッサコンピュータシステムにおいて、前記複数プロセッサのうちの選択された１つのプロセッ
サで変換索引バッファ無効化命令が実行されるのに応じ
て、前記バス経由で変換索引バッファ無効化を示すバス
構造を他のプロセッサに同報通信する同報通信段階と、実行保留中の変換索引バッファ無効化命令が無いことの
みに応じて前記複数プロセッサのうち前記変換索引バッ
ファ無効化命令を実行したプロセッサ以外のプロセッサ
で前記変換索引バッファ無効化を示すバス構造を受理す
る受理段階と、前記複数プロセッサの一つにおいて前記変換索引バッフ
ァ無効化を示すバス構造を受理しないことに応じて、該
受理しないプロセッサにより前記バス経由でリトライ・
メッセージを他のプロセッサに同報通信する段階と、前記変換索引バッファ無効化命令を実行したプロセッサ
以外の全プロセッサで前記変換索引バッファ無効化を示
すバス構造が受理されることのみ応じて、該全プロセッ
サで該変換索引バッファ無効化命令を実行する実行段階
とを含む、変換索引バッファのコヒーレンスを維持する維持方法。
【請求項２】前記変換索引バッファ無効化命令の実行保
留を設定するのに応じて、各前記複数プロセッサ内で保
留中の命令の実行を中断させる中断段階をさらに含む、請求項１に記載の変換索引バッファのコヒーレンスを維
持する維持方法。
【請求項３】前記変換索引バッファ無効化命令の実行保
留を設定するのに応じて、前記保留中の命令のアドレス
を一時的に格納する格納段階をさらに含む、請求項２に記載の変換索引バッファのコヒーレンスを維
持する維持方法。
【請求項４】実行保留中の命令の中断後、前記変換索引
バッファ無効化命令を前記複数プロセッサ内のプロセッ
サユニットへ挿入する挿入段階をさらに含む、請求項３
に記載の変換索引バッファのコヒーレンスを維持する維
持方法。
【請求項５】システムメモリと、バス経由で共に結合さ
れた複数プロセッサとを有し、前記複数プロセッサの各々がマルチ命令を実行するマル
チプロセッサユニットと、前記システムメモリの読書き
操作を実行するメモリ管理ユニットと、命令又はデータ
の有効アドレスを該システムメモリの実アドレスへ変換
する変換索引バッファ（ＴＬＢ）とを有するマルチプロ
セッサコンピュータシステムにおいて、前記複数プロセッサのうちの選択された１つのプロセッ
サで変換索引バッファ無効化命令が実行されるのに応じ
て、前記バス経由で変換索引バッファ無効化を示すバス
構造を他のプロセッサに同報通信する同報通信手段と、実行保留中の変換索引バッファ無効化命令が無いことの
みに応じて前記複数プロセッサのうち前記変換索引バッ
ファ無効化命令を実行したプロセッサ以外のプロセッサ
で前記変換索引バッファ無効化を示すバス構造を受理す
る手段と、前記複数プロセッサの一つにおいて前記変換索引バッフ
ァ無効化を示すバス構造を受理しないことに応じて、該
受理しないプロセッサにより前記バス経由でリトライ・
メッセージを他のプロセッサに同報通信する手段と、前記変換索引バッファ無効化命令を実行したプロセッサ
以外の全プロセッサで前記変換索引バッファ無効化を示
すバス構造が受理されることのみ応じて、該全プロセッ
サで該変換索引バッファ無効化命令を実行する実行手段
とを含む、変換索引バッファのコヒーレンスを維持するための維持
システム。
【請求項６】前記変換索引バッファ無効化命令の実行保
留を設定するのに応じて、各前記複数プロセッサ内で保
留中の命令の実行を中断させる中断手段をさらに含む、請求項５に記載の変換索引バッファのコヒーレンスを維
持する維持システム。
【請求項７】前記変換索引バッファ無効化命令の実行保
留を設定するのに応じて、前記保留中の命令のアドレス
を一時的に格納する格納手段をさらに含む、請求項６に記載の変換索引バッファのコヒーレンスを維
持する維持システム。
【請求項８】実行保留中の命令の中断後、前記変換索引
バッファ無効化命令を前記複数プロセッサ内のプロセッ
サユニットへ挿入する挿入手段をさらに含む、請求項７
に記載の変換索引バッファのコヒーレンスを維持する維
持システム。