JP2000076130A - リモ―ト資源管理システム - Google Patents

リモ―ト資源管理システム

Info

Publication number
JP2000076130A
JP2000076130A JP11075531A JP7553199A JP2000076130A JP 2000076130 A JP2000076130 A JP 2000076130A JP 11075531 A JP11075531 A JP 11075531A JP 7553199 A JP7553199 A JP 7553199A JP 2000076130 A JP2000076130 A JP 2000076130A
Authority
JP
Japan
Prior art keywords
remote
controller
fetch
interface
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11075531A
Other languages
English (en)
Other versions
JP3589394B2 (ja
Inventor
Huben Gary Allen Van
ゲーリー・アレン・バンフベン
A Blake Michael
マイケル・エイ・ブレイク
Maku Park-Kin
パク−キン・マク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2000076130A publication Critical patent/JP2000076130A/ja
Application granted granted Critical
Publication of JP3589394B2 publication Critical patent/JP3589394B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/08Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
    • G06F12/0802Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
    • G06F12/0806Multiuser, multiprocessor or multiprocessing cache systems
    • G06F12/0815Cache consistency protocols
    • G06F12/0817Cache consistency protocols using directory methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Memory System Of A Hierarchy Structure (AREA)
  • Multi Processors (AREA)
  • Memory System (AREA)

Abstract

(57)【要約】 【課題】 対称マルチプロセッサ・システムにおける、
高速リモート記憶クラスタ・インタフェース制御装置を
提供すること。 【解決手段】 対称多重処理において、資源を管理する
リモート資源管理システムが、対称マルチプロセッサ・
システムのクラスタ・ノード間のインタフェースを有す
る、対称マルチプロセッサの複数のクラスタを含み、そ
の各々が、ローカル・インタフェース及びインタフェー
ス制御装置を有する。それぞれがローカル・インタフェ
ース制御装置を有する、リモート記憶制御装置、及びロ
ーカル−リモート間データ・バスが存在する。リモート
資源マネージャが、対称マルチプロセッサの2つのクラ
スタ間のインタフェースを管理し、リモート記憶制御装
置により資源を管理し、所望のオペレーションを実行す
るエージェントとして作用するリモート制御装置に作業
を分配し、リモート・リクエスタが作業処理のために使
用可能な場合にだけ転送される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はコンピュータ・シス
テムに関して、特に、高速リモート記憶クラスタ・イン
タフェース制御装置に関する。
【0002】
【従来の技術】歴史的に、システム設計者は、大規模な
密結合対称マルチプロセッサ(SMP)・コンピュータ
・システムにおいて、高性能を達成するために、様々な
手段を使用してきた。そうした手段は、個々のプロセッ
サまたはプロセッサ・クラスタを、1つの共用システム
・バスを介して結合するものから、プロセッサをクラス
タとして一緒に結合し、クラスタがクラスタ−クラスタ
間インタフェースを用いて通信するもの、更に、多数
(すなわち32乃至1024)のプロセッサから構成さ
れる並列システムが、中央スイッチ(すなわちクロスバ
ー・スイッチ)を介して相互接続される、集中的に相互
接続されたネットワークに及ぶ。
【0003】共用バス方法は、通常、最も廉価なシステ
ム設計を提供する。なぜなら、単一バス・プロトコル
が、複数のタイプの資源をサービスするからである。更
に、追加のプロセッサ、クラスタまたは周辺装置が経済
的にバスに接続され、システムを発展させる。しかしな
がら、大規模なシステムでは、調停オーバヘッドと結合
されるシステム・バス上の輻輳(congestion)が、全体
システム性能を劣化させ、低SMP効率を生成する傾向
がある。これらの問題は、500MHzを超える周波数
で実行されるプロセッサを使用する対称マルチプロセッ
サ・システムでは侮り難い。
【0004】集中的に相互接続されるシステムは通常、
システム内の全てのプロセッサに対して、共用資源に対
する等しい待ち時間の利点を提供する。理想的なシステ
ムでは、等しい待ち時間は、システム構造またはメモリ
階層の事前知識無しに、複数のアプリケーション、また
はアプリケーション内の並列スレッドが、使用可能なプ
ロセッサ間で分散されることを可能にする。これらのタ
イプのシステムは一般に、1つ以上の大規模クロスバー
・スイッチを用いて実現され、データをプロセッサとメ
モリの間で転送する。基礎を成す設計はしばしば、大規
模ピン・パッケージング要求、及び高価なコンポーネン
ト・パッケージングの必要性を生じ得る。更に、有効な
共用キャッシュ構造を実現することは困難である。
【0005】密結合クラスタ化方法は、妥協策として作
用する。本願では、用語"クラスタ"は、1つの主メモリ
を共用するプロセッサの集合を指し示し、従って、特定
のクラスタへの親和性に関係なく、システム内の任意の
プロセッサが、主メモリの任意の部分をアクセスするこ
とができる。非一様メモリ・アクセス(NUMA)・ア
ーキテクチャと異なり、ここでの例で参照されるクラス
タは、メモリと各クラスタ内に配置される第2レベル・
キャッシュ間のデータ・コヒーレンスを維持するため
に、専用のハードウェアを使用し、それにより、メモリ
階層またはメモリ・バンク・インタリーブなどの物理区
分の無い、統一された1つのイメージをソフトウェアに
提供する。これらのシステムの1つの利点は、クラスタ
内の密結合プロセッサの性質が、データがそれを必要と
するプロセッサの近くに存在するとき、優れた性能を提
供することである。例えば、データがクラスタの第2レ
ベル・キャッシュ内、またはそのクラスタに接続される
メモリ・バンク・インタリーブ内に存在する場合であ
る。更に、通常、中央相互接続システム内で見い出され
る大規模Nウェイ・クロスバー・スイッチと比較し、よ
りコスト効率の良いパッケージングを実現する。しかし
ながら、クラスタ化方法は、プロセッサが頻繁に他のク
ラスタからデータを要求する場合、低性能を生じ得、続
く待ち時間が増大したり帯域幅が不十分になる。
【0006】中央相互接続システムに関連する多くの高
価な問題が廉価に解決されるまで、市場は共用バスまた
はクラスタ設計にもとづく経済的なシステムとして存在
し続けることであろう。本発明は従来のインタフェース
設計の多くの欠点を除去し、高価なハイ・レベル・パッ
ケージまたは過度なオンボード・キャッシュの必要無し
に、システムがプロセッサ性能を最大化するものであ
る。本発明に関連する分野の従来技術は、廉価な高周波
記憶制御装置を設計する全体的な問題の、孤立した側面
だけを解決する様々なアプローチを教示する。しかしな
がら、以下の例で示されるように、それらは本発明で掲
げられる目的を満足する完全な解決策を提供するには及
ばない。
【0007】対称マルチプロセッサの2つのクラスタか
らなるシステムが、Krygowskiらによる1985年3月
5日付けの米国特許第4503497号で述べられてい
る。この発明は、専用のストアイン・キャッシュを有す
るプロセッサ間の、キャッシュ・コヒーレンスを維持す
る改善された方法を教示する。しかしながら、これはク
ラスタ内に存在し、そのクラスタに接続される全てのプ
ロセッサにより共用される、ストアイン・パイプライン
化レベル2(L2)キャッシュに関連する様々な問題を
解決しない。この方法はまた、全てのタイプのオペレー
ション(プロセッサ、I/O、メモリ、同報通信、相互
クラスタ同期など)に対して、クラスタ・インタフェー
スの総効率を最大化することに着目していない。
【0008】超大規模SMPシステムの例が、Millerら
による1992年12月1日付けの米国特許第5168
547号、及びChenらによる1993年3月23日付け
の米国特許第5197130号で開示されている。両者
は多数のクラスタを含むコンピュータ・システムについ
て述べており、各々のクラスタが、多数の(すなわち3
2個の)プロセッサ及び外部インタフェース手段を有す
る。各プロセッサは、全てのクラスタ内の全ての共用資
源に対して対称アクセスを有する。コンピュータ・シス
テムは、大規模クロスバー・スイッチと、高度インタリ
ーブド共用主メモリと、出所と宛先間の経路が使用可能
になるまでトランザクションをステージするための、一
連のインバウンド・キュー及びアウトバウンド・キュー
と、データの同期及び共用のために使用される、クラス
タ調停手段内の大域資源のセットとの組み合わせに頼る
ことにより、その性能目標を達成する。この開示はま
た、階層メモリ・システム(第2レベル・キャッシュを
含む)を使用すること無く、複数の並列プロセッサ間で
ジョブを区分する、より効率的な手段を実現するアーキ
テクチャを教示する。
【0009】複数のI/O装置をクラスタ化し、それら
を高機能制御装置により管理することにより、全体シス
テム性能を向上するための幾つかの方法が考案された。
Rawlingsらによる1979年5月29日付けの米国特許
第4156907号、同じくRawlingsらによる1980
年4月29日付けの米国特許第4200930号は、ホ
スト・システムからのデータ転送及びメッセージ転送を
オフロードするための、ファームウェアにより使用可能
になるI/Oプロセッサを含む、改善されたアダプタ・
クラスタ・モジュール及びデータ通信サブシステムを教
示する。この発明は無数の伝送プロトコルを用いて、様
々なリモート周辺装置とのインタフェースを可能にす
る。アダプタ・クラスタ・モジュールは主に、プロトコ
ルが不一致の下で作用する"バイト"・トラフィックを、
単一プロトコルを用いて、より効率的にホスト・システ
ムに伝送される全メッセージに変換することに関わる。
この発明はまた、ホスト・システムが機能停止を生じる
ときでも、通信サブシステムがリモート周辺伝送を処理
し続けることを可能にする、幾つかの信頼性機構及び可
用性機構を使用する。そこで開示される技術は、確かに
I/Oサブシステム・レベルにおける性能問題を改善す
るが、それらはホスト・コンピュータ・システム内の2
つのプロセッサ間の、または1つのプロセッサと主メモ
リ間の高速データ転送の必要性を解決しない。
【0010】本発明により解決される全体的な問題の断
片を解決する幾つかの発明が存在するが、どれも全ての
側面を解決しない。より重要な点は、これらの発明で開
示される概念の集結が、本発明により提供される全体効
率の度合いを与えないことである。例えば、Barucchiら
による1995年2月21日付けの米国特許第5392
401号は、2つのプロセッサ間でデータを転送する改
善された方法を教示する。しかしながら、この発明はク
ロスバー・スイッチの使用に頼り、共用第2レベル・キ
ャッシュのキャッシュ・コヒーレンスを教示しない。Fl
etcherによる1984年4月24日付けの米国特許第4
445174号は、専用キャッシュ及び共用レベル2
(L2)キャッシュによりプロセッサをインタロックす
る手段を教示するが、クラスタ−クラスタ間インタフェ
ースに関連する帯域幅及び待ち時間の問題を解決しな
い。Chinnaswamyらによる1993年2月9日付けの米
国特許第5185875号は、データをキャッシュにロ
ードするのと同時に、データを被要求プロセッサに転送
することにより、記憶制御ユニット間のデータ転送待ち
時間を低減する方法を教示する。類似の技術が今日、コ
ンピュータ・システム設計において広く使用されている
が、この発明は、記憶制御ユニットがキャッシュへのア
クセスを要求する各システム資源(I/O及びメモリを
含む)に対して、専用ピン・インタフェースを提供でき
ない場合に生じる問題を解決しない。Keeleyによる19
88年11月15日付けの米国特許第4785395号
は、少なくとも1対のプロセッサの間でキャッシュを共
用する方法を教示する。しかしながら、この特許は、全
てのプロセッサがキャッシュを等しい待ち時間でアクセ
スすることを仮定する。
【0011】幾つかの発明が、共用バス・システムにお
いてトラフィックを調停する技術について述べており、
そこでは、個々のプロセッサまたはプロセッサのクラス
タが、共用バスを介して、主メモリ及び外部I/O装置
と通信する。例えば、Fischerによる1988年11月
15日付けの米国特許第4785394号は、共用バス
の使用を調停する方法について述べている。その技術
は、応答者にイニシエータよりも高い優先権を与え、た
とえ受信モジュールが使用中であっても、要求が受信モ
ジュールに対して開始されることを可能にする。本発明
は、リモート側の資源が作業に順応できる場合にだけ、
クラスタ−クラスタ間インタフェースを使用中にするこ
とにより、この調停オペレーションを改善する。更に、
応答者とイニシエータ間の調停が、各サイクル毎に固定
の優先権無しに動的に実行される。Tetrickらによる1
986年2月11日付けの米国特許第4570220号
は、シリアル・バス及びパラレル・バスの組み合わせに
よりシステム・バスを構成する。バスが幾つかの"エー
ジェント"により共用され、エージェントはハンドシェ
ーク・シーケンスに従事し、バスの使用権を獲得しなけ
ればならない。本発明は任意のタイプのバス交渉を実行
する必要無しに、1クロック・サイクルで新たな要求を
動的に開始できるように、リモート資源を追跡する。
【0012】
【発明が解決しようとする課題】本発明の目的は、対称
マルチプロセッサ・システムにおける、高速リモート記
憶クラスタ・インタフェース制御装置を提供することで
ある。
【0013】
【課題を解決するための手段】本発明は、双節(bi-nod
al)SMPシステム内の2つのクラスタ間のインタフェ
ースを管理する手段について述べる。好適な実施例が、
複数の中央プロセッサを含む対称多重処理システム内に
組み込まれる。各中央プロセッサは、専用L1キャッシ
ュ、複数のI/Oアダプタ、及び主メモリを有し、任意
のプロセッサまたはI/Oアダプタが、メモリの任意の
部分をアクセスできる。プロセッサ及びI/Oアダプタ
の総数は、2つのクラスタに等しく分割される。更に、
主メモリがバンクまたはインタリーブから構成され、そ
の半分が各クラスタに接続される。
【0014】各クラスタ内には記憶制御装置が存在し、
これは共用第2レベル・キャッシュ、様々な制御装置、
及びあらゆるプロセッサ、I/Oアダプタ、及び主メモ
リとの個別のインタフェース(またはポート)を含む。
本実施例で表されるキャッシュは、複数のバンクまたは
インタリーブからなり、その内容が8ウェイ・アソシア
ティブ・ディレクトリにより管理される。図1に示され
る記憶制御装置は、主要機能要素を表し、更に好適な実
施例に関連して詳述される。しかしながら、1クラスタ
内の記憶制御装置の概要は、本発明の側面を理解する上
で有益である。
【0015】記憶制御装置の主要機能は、プロセッサ及
びI/Oアダプタからの、主メモリに対するデータ・フ
ェッチ要求及びストア要求を処理することである。記憶
制御装置は、ソフトウェア及びオペレーティング・シス
テムからは体系的に見えない共用第2レベル・キャッシ
ュを含むので、記憶制御装置はディレクトリ・アクセス
及びキャッシュ・アクセスを実行する役目をする。全て
の入来要求が記憶制御装置上のポートに入力し、そこで
中央プロセッサ(CFAR)またはI/O制御装置によ
り受信される。これらの制御装置は中央優先ユニットに
要求を生成し、中央優先ユニットが要求を調停し、リク
エスタの1つをそのアドレスにもとづき選択し、2つの
マルチステージ・パイプラインの1つに入力する。パイ
プラインの各ステージの間、リクエスタはキャッシュ、
ローカル・キャッシュ・フェッチ/ストア制御装置、デ
ータ経路制御、データ経路FIFOバッファ、リモート
・キャッシュ・フェッチ/ストア制御装置などの、様々
な資源をアクセスし、それらを予約する。
【0016】要求がパイプラインから出力するとき、ロ
ーカル・フェッチ/ストア制御装置の1つが、完了を通
じてオペレーションを管理する役目をする。しばしばこ
れは、パイプラインを通じる追加の経路を要求し、それ
によりローカル・フェッチ/ストア制御装置は、中央優
先調停にも参加しなければならず、リクエスタとも見な
される。本実施例では、ローカル・フェッチ/ストア制
御装置の一部として、キャッシュ制御装置及び主メモリ
制御装置を含み、それらの間で、次のオペレーション、
すなわち、キャッシュ・インタリーブからのデータのア
クセス、キャッシュ・ミス発生時における主メモリへの
データ・アクセスの処理、キャッシュ・インタリーブへ
のストア・オペレーションの実行、及び主メモリ・アク
セスからの入来データのための空間を確保するために、
(最長未使用法による)キャッシュから主メモリへの時
効データの追放のために必要な全ての資源(FIFOバ
ッファ及びクロスポイント・スイッチなどのデータ経路
要素)を含む。
【0017】前述のように、主メモリ・バンクは双節S
MPシステムの2つのクラスタ間で物理的に分散され
る。しかしながら、主メモリは、SMPシステム内のど
こかに配置される任意のプロセッサまたはI/Oアダプ
タにとって、1つの統一されたエンティティとして現れ
る。従って、本実施例は、リモート・フェッチ/ストア
制御装置として知られる、追加の制御装置のセットを組
み込む。記憶制御装置は、各クラスタ上で、メモリ・バ
ンクに割当てられる主メモリ・アドレスを追跡する。デ
ータ・アクセス(フェッチ要求)が、ローカル・クラス
タ上でキャッシュ・ミスを発生する度に(ここで用語"
ローカル"は、発信元プロセッサまたはI/Oアダプタ
が接続されるクラスタを指し示す)、ローカル・フェッ
チ/ストア制御装置はリモート(または"他の")・クラ
スタに、データがそのキャッシュ内に存在するか否かを
問い合わさなければならない。これらのリモート問い合
わせは、リモート・フェッチ制御装置により処理され、
それらはローカル・フェッチ/ストア制御装置と同様
に、要求を中央優先ユニットに発行し、資源をアクセス
する。
【0018】更に、データ・アクセスがリモート・キャ
ッシュにおいてミスするが、アドレスがそのアドレスが
リモート・クラスタに接続されるメモリ・バンクに属す
ることを示す場合、リモート・フェッチ/ストア制御装
置がまた、主メモリ制御装置と相互作用し、主メモリ・
アクセスを開始する。メモリへのデータの記憶を必要と
するオペレーション(時効データのキャッシュからの追
放など)のために、アドレスが再度、ローカル・フェッ
チ/ストア制御装置がオペレーション全体を処理できる
か否か、或いはリモート・ストア・オペレーションが双
節インタフェースを介して開始されなければならないか
を判断する。この状況では、リモート・ストア・オペレ
ーションがリモート・ストア制御装置により処理され、
後者が主メモリ制御装置と相互作用し、データを主メモ
リ・インタリーブに記憶する。ローカル・フェッチ/ス
トア制御装置同様、リモート・フェッチ/ストア制御装
置も、クラスタ間オペレーションを処理するために必要
な全ての資源(データ経路、FIFOバッファ、及びク
ロスポイント・スイッチを含む)を含む。
【0019】本発明は、前述のリモート・フェッチ/ス
トア制御装置を含む資源を管理し、これらのリモート・
フェッチ/ストア制御装置に作業を分配するリモート管
理システムに関する。リモート・フェッチ/ストア制御
装置は、エージェントとして動作し、作業要求を開始し
たリクエスタに関する知識を要求すること無く、所望の
オペレーションを実行する。対称マルチプロセッサの複
数のクラスタ間の絶え間の無い通信の必要無しに、作業
を処理するためにリモート資源が使用可能なときにだけ
作業が分配される。従って、最小のインタフェース通信
信号が使用される。
【0020】本発明のリモート資源管理システムは、対
称マルチプロセッサの2つのクラスタ間のインタフェー
スを、少ない数の入出力ピンを用いて、効率的に管理す
る。ピン制限を克服し、その上、S/390エンタープ
ライズ・サーバなどの非常に複雑なコンピュータ・シス
テム内に統合することを可能にするため、幾つかの技術
が使用される。ここでS/390サーバでは、1クラス
タが複数の超高速プロセッサ、共用L2キャッシュ、複
数のI/Oアダプタ手段、及び主メモリを含み得る。こ
うしたシステムでは、性能が際だって優れ、キャッシュ
・ミスに関連付けられる待ち時間が最小化されなければ
ならない。従って、本発明はパッケージング・コストを
最小化する一方で、全体システム性能を最大化すること
を探究する。
【0021】まず第1に、各クラスタ上の1つのインタ
フェース・ユニットが、インタフェースの完全な制御を
担う。こうした制御には、待ち行列化された要求を優先
順位付けするステップ、インタフェースを通じて新たな
オペレーションを送信するステップ、他の側からの返却
応答を処理するステップ、及びクラスタ間の全てのデー
タの転送を監視するステップが含まれる。制御I/Oの
数の制限により、本発明はリモート資源管理と、コマン
ド再マップ化との新たな組み合わせにより、伝送される
必要がある情報の量を最小化する。ローカル・インタフ
ェース制御装置は、作業要求をリモート側に開始するだ
けでなく、リモート側のフェッチ/ストア制御装置を管
理し、それにより新たなオペレーションを使用可能な制
御装置に即時経路指定する。リモート・フェッチ/スト
ア制御装置は単に、ローカル・インタフェース制御装置
のために作業するエージェントとなり、ローカル・イン
タフェース制御装置がリクエスタのために作業する。こ
のように活動することにより、オペレーションの所有者
を識別する情報を送信する必要性を排除する。なぜな
ら、リモート側はそれを知る必要性を有さないからであ
る。
【0022】リモート制御装置の更なる単純化が、コマ
ンド再マップ化オペレーションを通じて達成され、それ
により幾つかのローカル・オペレーションが、1つのア
トミック・リモート・オペレーションに結合される。例
えば、データの読出し専用コピーに対するプロセッサ・
フェッチ要求、及び記憶保護キーを含む読出し専用デー
タに対するフェッチ要求が、リモート・クラスタ上のフ
ェッチ制御装置が、同一の状態図及びキャッシュ管理オ
ペレーションを使用することを要求する。従って、イン
タフェース制御装置はこれらの両方を、読出し専用ライ
ン・フェッチとして知られる、1つの単純化されたリモ
ート記憶クラスタ(RSC)・インタフェース制御装置
コマンドに再マップし、それによりリモート記憶クラス
タ・インタフェース制御装置(RSC)により処理され
なければならないオペレーションの数を低減する。
【0023】この再マップ化オペレーションの追加の利
点は、不要なデータ転送を除去することにより、インタ
フェース・データ経路をより効率的に管理する能力であ
る。64バイトのI/Oストアについて鑑みると、入来
する64バイトが主メモリに記憶される以前に、同一の
データ・ラインの最も最近のコピーと併合されることが
要求される。このオペレーションは、ターゲット主記憶
アドレス及び現キャッシュ状態に依存して、次の3つの
異なる状況を生じ得る。 1.データがリモート側の主メモリをターゲットとし、
ローカル・キャッシュにおいてミスする場合、I/Oス
トア・データが他の側に送信され、併合されなければな
らない。このことはRSCインタフェース制御装置(R
SC IC)が、ローカル・クラスタからリモート・ク
ラスタにストア・オペレーションを実行することを必要
とする。 2.データがローカル・メモリをターゲットとするが、
リモート・キャッシュにおいてヒットする場合、リモー
ト側からラインが検索され、ローカル・クラスタ上で併
合が実行される必要がある。このことは可能なデータ・
フェッチと共に、リモート側との相互問い合わせを必要
とする。 3.ラインのコピーが両方のキャッシュ内に存在する場
合、リモート側のラインを無効にするアクションだけが
要求される。なぜなら、入来する64バイトは、ローカ
ル・キャッシュ内のコピーと併合されるからである。
【0024】より単純な設計は、インタフェースを介し
て、I/Oストア・コマンドを無条件に64バイトのデ
ータと一緒に送信することである。すると、他の側のリ
モート・フェッチ/ストア制御装置が、ディレクトリ・
ステータスにもとづき、必要なアクションを実行する。
しかしながら、3つのケースの内の2つにおいて、スト
ア・データの転送は、不必要にローカル−リモート間デ
ータ・バスを拘束する。ディレクトリ情報を送信するた
めに、追加の制御ラインも要求され得る。本発明は、最
後の2つのケースを、それぞれ"強制追放(force cast
out)"コマンド及び"読出し専用無効(read-only inval
idate)"コマンドに再マップする、高機能インタフェー
ス制御装置を使用する。
【0025】コマンド再マップ化は幾つかの利点を提供
する。第1に、それはリモート・フェッチ/ストア制御
装置の設計を単純化する。なぜなら、多くのオペレーシ
ョンが、単純なアトミック・インタフェース・オペレー
ションのサブセットにマップされるからである。第2
に、クラスタ間でディレクトリ情報を送信するために、
追加の制御I/Oが要求されない。第3に、待ち時間の
増加を防止するために、コマンド再マップ化が、新たな
コマンドがインタフェースを横断するための優先順位が
発行されるのと同一サイクル内に実行される。
【0026】リモート管理システムは、1つのまたは複
数のパイプライン化レベル2キャッシュをサービスする
ための、多数のフェッチ制御装置及びストア制御装置を
含む、ハイエンド記憶サブシステムとインタフェースす
るように設計される。一連の優先ステーションが、イン
タフェースを介して送信される要求を究極的に選択する
ために使用される。複数のパイプが関与するが、各パイ
プ内の優先ステーションは、フェッチ要求またはストア
要求の1つを選択し、RSC ICに転送する。同一の
サイクルの間、RSC ICは高性能優先オペレーショ
ンを使用し、コマンド・タイプ及び資源可用性にもとづ
き、最適な要求を選択する。複数のパイプが任意の所与
のサイクルにおいて、インタフェースの使用を要求でき
るので、リモート・フェッチ制御装置が使用可能である
限り、オペレーションはストアよりもフェッチを優先す
る。それ以外では、リモート・ストア制御装置が使用可
能である限り、ストアが実行され、データ経路がそれら
のストア・オペレーションにとって使用可能になる。両
方の要求がフェッチであり、両方が使用可能な資源を有
する場合、単純なラウンド・ロビンが優遇される方の要
求を決定する。両方の要求がストアの場合、どちらのパ
イプが使用可能な資源を有するかにより、勝者が決定さ
れる。再度、両方共に使用可能な資源を有する場合、単
純なラウンド・ロビンが使用される。この方法は事実
上、作業要求及び使用可能な資源が存在する限り、コマ
ンドが伝送されることを保証する。更に、プロセッサ・
フェッチに与えられる優先処置が、全体システム性能を
向上させる。最後に、ローカル・インタフェース制御装
置内のリモート資源の管理により、インタフェース・サ
イクルがリモート側で結局、待ち行列化される作業の伝
送のために浪費されないように保証される。
【0027】更に、L1キャッシュ・ミスによるプロセ
ッサのデータ・アクセス待ち時間を低減するために、R
SC ICは、フェッチ制御装置またはストア制御装置
がインタフェースの使用を要求していないサイクルの
間、"高速路指定(fast-pathing)"技術を使用する。こ
れらのサイクルの間、全てのパイプが有効なCPフェッ
チのためにモニタされる。もしそれが見い出されると、
即時リモート側にディスパッチされ、その間、ローカル
・キャッシュ・フェッチ制御装置が並列にロードされ
る。これはフェッチ要求が、リモート側への1サイクル
のヘッド開始を獲得することを可能にし、それにより返
却データの待ち時間を低減する。
【0028】リモート・キャッシュをヒットするデータ
・フェッチの最良の待ち時間と、ローカル主メモリから
のデータ・アクセスとの間には、大きな相違が存在する
ので、RSC ICは、リモート・キャッシュ・ヒット
をローカル・フェッチ制御装置に伝達する能力を有し、
それにより、主記憶アクセスの取り消しを可能にする。
このことは別の要求のためにメモリ・バンクを解放する
ことにより、システム性能全体に寄与する。
【0029】RSC ICは同期応答バス及び非同期応
答バスの両方を使用し、キャッシュ・コヒーレンスを維
持する一方、性能を最大化する。要求がリモート側のキ
ャッシュ状態をテストする以前に、オペレーションを完
了するための正確なパイプ・サイクル数を決定すること
は不可能であるので、非同期応答バスが全ての最終応答
に対して使用される。これらの応答は、リモート・オペ
レーションの公式の終りをマークし、しばしばオリジナ
ル・リクエスタに転送される。更に、最終応答はデータ
変更情報(ライン変更ステータス)によりタグ付けさ
れ、これがローカル・ディレクトリが適切な最終状態に
より更新されることを可能にする。最終応答は、単一の
最終応答インタフェース・バスの競合により遅延され得
るので、初期リモート・キャッシュ相互問い合わせ(X
I:cross interrogation)の結果を、それが知れるや
否や報告することにより性能が改善され得る。RSCは
常に、このXI結果を同期XI応答バスを用いて、最小
の時間フレーム内に報告できる。これが可能な理由は、
記憶クラスタ(SC)の中央優先ステーションが、リモ
ート側から受信される新たな要求が、即時適切なパイプ
ラインに受け入れられるように保証するからである。初
期ディレクトリ検索が固定パイプ・サイクル内に実行さ
れ、結果がXI応答バスを介して返送される。オペレー
ションを開始したインタフェース制御装置は、XI応答
が将来の固定サイクル数以内に使用可能であることを知
り、従って、単純なステージング機構が、ヒット/ミス
結果を要求フェッチ/ストア制御装置に転送するために
使用される。
【0030】制御インタフェースを管理することに加
え、RSC ICは全てのクラスタ−クラスタ間データ
・フローを管理する。本発明は、各パイプが双方向に1
サイクル当たり16バイトを転送することを可能にす
る、十分なデータ・フローI/Oを含み、RSC IC
は潜在的に、1サイクル当たり64バイトの最大スルー
プットを使用することができる。2つの単方向データ経
路が存在するが、所与のデータ経路が、クラスタAから
クラスタBに転送されるストア・データ、及びクラスタ
BからクラスタAに返却されるフェッチ・データのため
の、コンジット(conduit)として作用しなければなら
ない。RSC ICは衝突を回避するだけでなく、予め
バスを予約すること無くそれを実行する。このことはR
SC ICが、ローカル・ストア制御装置からの要求
を、常駐リモート・フェッチ制御装置からの要求と比較
し、フェッチ・データを返却することを可能にする。両
者がデータ経路を競合するサイクルの間、優先権が返却
フェッチ・データに与えられる。再度、これは全体シス
テム性能を支援する。更に、フェッチ・データがリモー
ト主メモリから獲得される場合、データがメモリ・バン
クからアクセスされるとき、RSC ICが対応するデ
ータ経路をモニタする。RSCデータ経路が使用可能な
場合、データがリモート・フェッチ・バッファをバイパ
スし、それにより、データの一時的バッファリングに関
連付けられる正規の待ち時間を低減する。
【0031】本発明は、全体システム・スループットを
改善するために複製される、リモート記憶制御装置の資
源の管理を改善する方法を証明した。例えば、リモート
・キャッシュをヒットする、連続的フェッチ要求の効率
を最大化するために使用される1つの技術は、複製のリ
モート・フェッチ資源の間で、作業要求を交互すること
である。全てのフェッチが、転送されるデータの最初の
16バイトに相当する最終応答により終了する。これに
関する利点は、リモート・フェッチ制御装置のバッファ
がまだ空の間に、リモート・フェッチ資源が即時新たな
作業に割当てられることである。逆に欠点は、新たな作
業の一部が、リモート・キャッシュをヒットするデータ
・フェッチである場合に生じる。バッファはまだ空であ
ろうから、リモート・フェッチ制御装置はバッファが使
用可能になるまで、要求をパイプを通じてリサイクルし
なければならない。RSC ICは、複製のリモート・
フェッチ制御装置が使用可能であれば、第2のフェッチ
要求をその複製のリモート・フェッチ制御装置に送信す
ることにより、この状況を緩和する。それにより、第1
のバッファがまだそのデータ転送を完了している間、第
2のリモート・フェッチ制御装置が、そのバッファのロ
ードを開始できる。このことは、第1のバッファの転送
の完了時に、第2のバッファが即時、そのデータをイン
タフェースを介して転送することを可能にする。
【0032】リモート・インタフェースはまた、オペレ
ーションがリモート側で成功裡に完了し得ない場合に、
多くのオペレーションが再試行されるようにすることに
より、高い信頼性及び可用性を示す。これらのタイプの
問題は、2つの主なカテゴリ、すなわち拒絶とインタフ
ェース・エラーとに分類される。オペレーションは、潜
在的な相互クラスタ・デッドロックを回避するため、リ
モート・クラスタにより拒絶され得る。これらのデッド
ロックは、記憶サブシステム・フェッチ制御装置及びス
トア制御装置の数が、それらにサービスするRSC資源
の数よりも多い場合に発生し得る。リモート・フェッチ
制御装置及びストア制御装置は、相互クラスタ・デッド
ロックを生じ得るオペレーション・シーケンスをモニタ
するように設計される、デッドロック回避機構を含む。
こうした状況の検出に際して、制御装置は特殊な拒絶応
答を開始クラスタに返却することにより、保留のオペレ
ーションを拒絶する。RSC ICが次に、拒絶を発信
元フェッチ/ストア制御装置に転送し、オペレーション
が再試行される。デッドロック窓が消えるまで、オペレ
ーションは連続的に拒絶され、再試行される。新たなR
SCオペレーションに付随する任意の制御情報に対し
て、インタフェース・パリティ・エラーが検出されると
き、他のタイプの回復が発生する。コマンドが送信され
た後、固定サイクル数以内にインタフェース・エラー・
ステータスを伝送するために、同期インタフェースが使
用される。エラーの場合、発信元フェッチ/ストア制御
装置がそれを通知され、実質的に回復の適格性を決定す
る。RSC ICは自動的に対応するRSC資源をリセ
ットし、オペレーションが再度要求されることを可能に
する。これらの及び他の改善が、以下で詳述される。本
発明の利点及び特徴をより理解するため、以下の説明及
び図面を参照されたい。
【0033】本発明は好適な実施例に関連して述べられ
るが、当業者であれば、ここで開示される概念が3つ以
上のクラスタを含み、本実施例とは異なる記憶クラスタ
を使用するシステムにも適用可能であることが理解でき
よう。更に、本発明は、異なる数及び構成の機能ユニッ
トを有する、代替の記憶制御装置の実施例についても考
慮する。これらには、キャッシュ構造、主メモリ構成、
データ経路資源(バッファ、制御バスなど)の数及びサ
イズ、様々な制御装置の構成、及びパイプラインの数及
びサイズなどが含まれる。
【0034】
【発明の実施の形態】図1は、双節対称マルチプロセッ
サ・システムの1つの記憶制御装置クラスタを示す。本
発明はリモート記憶クラスタ・インタフェース制御装置
(RSC IC)10として表され、これは1対のロー
カル・フェッチ/ストア制御装置11、リモート・フェ
ッチ/ストア制御装置12、及び集中型マルチステージ
・パイプライン13のセットと相互作用する。これらの
パイプラインは、中央優先14ステーションにより供給
され、これはN個の中央処理ユニット制御装置15また
はN個のI/Oアダプタ制御装置16から発生する非同
期の作業要求を優先順位付けする。各CPU制御装置
は、SMPシステム内の特定の中央プロセッサ(CP
U)と親和性を有する。パイプラインは共用レベル2ス
トアイン・キャッシュを含み、それに対して、全ての中
央処理ユニット、I/Oアダプタ及びローカル・フェッ
チ/ストア制御装置及びリモート・フェッチ/ストア制
御装置が、読出しアクセス及び書込みアクセスを有す
る。好適な実施例で使用されるキャッシュ・コヒーレン
ス・オペレーションは、データが読出し専用状態または
排他的所有状態でキャッシュ内に存在することを可能に
する。ここで読出し専用状態では、両方のクラスタ上の
全てのプロセッサ及びI/Oアダプタが、データのコピ
ーをアクセスすることができ、排他的所有状態では、1
つのプロセッサだけが任意の時刻にデータを所有でき
る。たとえ別のプロセッサが現在所与のデータを所有し
ていようと、任意のクラスタ上の任意のプロセッサが、
任意の時刻にそのデータの所有権を要求し得る。
【0035】好適な実施例はデュアル・パイプライン設
計を使用し、そこでは中央パイプライン13、リモート
・フェッチ/ストア制御装置12、及びローカル・フェ
ッチ/ストア制御装置11が全て重複される。本発明で
開示される概念は、記憶制御装置(SC)の周囲の構造
に独立であり、3つ以上のパイプラインを使用する従来
的または新たな単一パイプラインSC設計により効果的
に実現され得る。当業者であれば、RSC IC10の
インタフェース方法、及び内部機能ブロック図が、ほと
んどのSC構造に当てはまるように、容易にスケーリン
グされ得ることが理解できよう。
【0036】RSCインタフェース制御装置10は、様
々なSC機能ユニットと相互作用する幾つかのサブユニ
ットから構成される。パイプライン13及びフェッチ/
ストア制御装置11、12の1対のセットからの要求を
サービスする、1つのリモート記憶クラスタ・インタフ
ェースだけしか存在しないので、唯一のRSC IC
が、複数のローカル・インタフェース、及びクラスタ−
クラスタ間インタフェースに順応しなければならない。
更に、RSC ICは、ローカル・クラスタからリモー
ト・クラスタへの、及びその逆のトラフィック・フロー
を管理しなければならない。図2は、詳細なインタフェ
ースと、RSC IC10を含むサブユニットを示す。
【0037】好適な実施例の記憶制御装置の性質によ
り、大半の要求はローカル・フェッチ/ストア制御装置
11から到来する。これらの要求は、LFAR要求とし
て知られるフェッチ要求と、LSAR要求として知られ
るストア要求とに分けられる。好適な実施例では、各パ
イプラインに対して、4つのLFAR要求及び4つのL
SAR要求が存在し、従って、RSCインタフェースの
使用を競合する、合計16の可能なLFSAR要求が存
在する。LFSAR制御装置内の事前優先(pre-priori
ty)ステーションは、各パイプから1つのリクエスタを
選択し、高々2つの要求を1クロック・サイクルでRS
C ICに転送する。再度、本発明の趣旨は、任意の数
のLFARリクエスタ及びLSARリクエスタが、任意
の数のパイプラインの間で分配されることを可能にす
る。更に、LFSAR制御装置11内の事前優先ステー
ションが、RSC IC内のコマンド優先ユニットに直
接組み込まれ得る。
【0038】LFSAR制御装置11とRSC IC1
0間のインタフェースに注意を向けると、1パイプライ
ンに関連付けられる制御装置の各セットに対して、1つ
のインタフェースが存在する。各インタフェースは、要
求バス、C3コマンド・バス、C3リクエスタIDバ
ス、及びC3アドレス・バスを含む。8ビット要求バス
は、LFARリクエスタ及びLSARリクエスタの各々
に対して1ビットを含み、1ビットだけが任意のサイク
ルで活動化され得る。このビットは、事前優先ステーシ
ョンによりそのサイクルにおいて選択される、LFAR
制御装置またはLSAR制御装置のIDを示す。対応す
るバスが、パイプラインにコマンドを開始したCPU、
I/OアダプタまたはSC制御装置の、コマンド、アド
レス及びIDを伝達する。この情報の全てが、パイプラ
インの第3ステージに相当するC3サイクルで、RSC
ICに提供される。RSC ICがLFSAR要求
を、それが提供されるサイクルにおいて優遇することが
できない場合、LFSAR制御装置は同一の要求を提供
し続けるか、次のサイクルで新たな要求を動的に選択し
得る。
【0039】LFSAR制御装置に加え、パイプライン
13自身もまた、高速路指定と呼ばれるオペレーション
を可能にするリクエスタとして作用する。高速路指定
は、フェッチが要求され、いずれのLFSAR制御装置
11からも保留の作業が存在しない場合、RSCが両方
のパイプをモニタし、リモート・フェッチ・オペレーシ
ョンを発行することを可能にする。C1コマンド、C1
アドレス、及びC1リクエスタIDが、各パイプの第1
ステージ(C1サイクル)から獲得され、RSCICの
RSC優先21サブユニット内の事前優先ステーション
に送信される。事前優先ステーションの出力が、主優先
ステーション(同様にRSC優先21サブユニット内に
配置される)に転送され、そこでLFSAR制御装置1
1からの要求と競合する。
【0040】各サイクルごとに、RSC優先21ステー
ションは保留の作業要求を調査し、高性能オペレーショ
ンにより、インタフェースを横断することを許可される
要求を決定する。要求の選択に際して、選択されたオペ
レーションのパイプラインに対応するLFSAR制御装
置11に、グラント(許可)が送信される。グラントは
選択されたオペレーションが、LFSAR制御装置11
からの保留の要求であったか、或いはパイプライン13
から開始された高速路オペレーションであったかを示
す。グラントがLFSAR制御装置に発行されている
間、選択されたコマンドが、その関連アドレス、リクエ
スタID、及びRSC資源を示すタグ・ラインと共に、
RSCインタフェースを介して、リモート・クラスタに
送信される。
【0041】全てのRSCオペレーションが、リモート
・クラスタから特定のタイプの完了応答を要求する。更
に、データ・フェッチは、要求されたデータがリモート
・キャッシュ内に存在するか否かを示す相互問い合わせ
(XI)応答を要求する。全ての応答がRSC IC1
0を通じて処理され、オリジナル・リクエスタに直接的
に、または間接的に転送される。大半の時間、応答が復
号され、適切なステータス、解放及びキャッシュ・コヒ
ーレンス情報が、LFAR制御装置またはLSAR制御
装置に転送される。しかしながら、多くのオペレーショ
ンが、応答をオリジナルCPU制御装置(CFAR)1
5に返送することに携わる。応答の最終的な宛先に関わ
らず、RSC ICはあらゆるオペレーションにとって
必要な全ての情報を追跡し、それにより、全てのRSC
オペレーションにおける応答情報が、1つの符号化応答
バス上で多重化され得る。RSC ICは、応答ハンド
ラ22への入来応答を受信する。応答ハンドラのジョブ
は、応答を復号し、適切な情報をLFSAR制御装置1
1またはCPU制御装置15に伝送することである。
【0042】図2はまた、リモート・フェッチ/ストア
制御装置12とRSC ICとの間のインタフェースを
示す。リモート・フェッチ/ストア制御装置は、別々の
リモート・フェッチ制御装置(RFAR)12a及びリ
モート・ストア制御装置(RSAR)12bに分けられ
る。リモート・フェッチ制御装置12aは、他のクラス
タからフェッチ要求を受信し、それらをパイプライン1
3を通じて処理し、(可能であれば)データを必要な応
答情報と一緒に返却する役目をする。リモート・ストア
制御装置12bは、入来ストア・オペレーション(及び
任意の付随データ)を受信し、それらをパイプライン1
3を通じて処理し、必要な応答情報を返却する。各パイ
プラインは、自身に関連付けられるRFAR12a制御
装置及びRSAR12b制御装置を有する。従って、所
与のサイクル内に最大4つの要求がRSC ICに提供
され、情報が符号化応答バス上に返却される。RSC
IC内の応答優先23サブユニットが、これらの要求を
調停し、符号化応答バス上のトラフィックを管理する。
RFAR制御装置がフェッチ・データを返却する必要が
ある場合、応答優先23ステーションがRSC優先21
ステーション及びクロスポイント(XPT)制御装置2
5と通信し、データ経路が使用可能になるように保証す
る。
【0043】本発明の重要な側面の1つは、資源レジス
タ24を使用し、ローカル側の全てのリモート活動を追
跡することである。インタフェースI/Oを最小化し、
スループットを最大化するために、RSC ICは、ロ
ーカル側のオリジナル・リクエスタのためのエージェン
トとして作用する。RSC ICはリモート側のRFA
R資源及びRSAR資源を追跡し、絶え間の無いクラス
タ−クラスタ間通信の必要性を除去する。資源レジスタ
24はRSC優先21ステーションと相互作用し、RS
C資源が使用可能な場合にだけ、オペレーションが開始
されるように保証する。オペレーションの開始に際し
て、RSC ICは選択されたRFARまたはRSAR
を"使用中(in use)"とマークし、その資源は、オペレ
ーションの完了を示す応答が受信されるまで使用中であ
り続ける。これらの応答は次に、資源をリセットし、そ
れを新たなオペレーションのために使用可能にするため
に使用される。
【0044】好適な実施例では、合計8つのRSC資源
レジスタ24が存在し、各パイプラインに対して、2つ
のRFAR及び2つのRSARが存在する。2つのRF
AR/RSARの各々は、互いに同一であり、複数のリ
モート・フェッチ及びストア・オペレーションが、各パ
イプにより同時に処理されることを可能にすることによ
り、主に性能を向上するために存在する。再度、本発明
は1パイプ当たり、2つのRFAR及び2つのRSAR
を要求したり、それに制限されるものではない。全ての
リモート資源は、存在する数に関係無しに、同様に追跡
される。
【0045】オペレーションの選択に先立ち、オリジナ
ル・パイプライン・コマンドがRSCコマンドに変換さ
れる。多くの場合、結果のRSCコマンドはオリジナル
・コマンドと同一であるが、特定の場合では、コマンド
・コード・ポイントが再マップされ、類似のオペレーシ
ョンが1つのRSCコード・ポイントを共用することを
可能にする。このステップは、全てのRSCフェッチ・
コマンドが連続範囲内(好適な実施例では'01'x乃
至'1F'x)に収まる一方、全てのストア・コマンド
が、異なる連続範囲内(好適な実施例では'20'x乃
至'3F'x)に収まることを保証する。オペレーション
の開始に際して、RSC ICは2つの選択ビットを使
用し、他の側に対して8つの資源の内で、新たに選択さ
れたオペレーションをサービスする資源を示す。2つの
ビットは、パイプラインと、そのパイプライン内の1対
の資源の内で、コマンドを処理すべき方の資源を示す。
コマンドのビット0は、コマンドがフェッチ・タイプ
(ビット0=0)か、ストア・タイプ(ビット0=1)
かを決定する。全てのフェッチ・コマンドはRFARに
よりサービスされ、ストア・コマンドはRSARにより
処理される。コマンド及びアドレスが常に伝送されなけ
ればならないので、このアプローチは両方の側を同期す
るために、2つの追加のインタフェース制御ビットが1
度だけ伝送されることを必要とする。ここで好適な実施
例は、コマンド、アドレス及び選択ラインに加え、要求
IDを伝送するためのRSCインタフェース・バスを示
す。この要求IDは純粋に、RSCインタフェースを通
じて、リモート側のCPU制御装置またはI/Oアダプ
タ制御装置などのリクエスタに転送される情報である。
本発明が使用する技術は、その目的を達成するために、
オリジナル・リクエスタのIDの知識を必要としない。
【0046】最後のサブユニットは、クロスポイント
(XPT)制御装置25であり、これはクラスタを接続
する4つのデータ経路を管理する役目をする。好適な実
施例では、各パイプに対して、2つの単方向データ経路
が存在し、同時に4つのデータ転送が発生することを可
能にする。各データ経路は、4つのオペレーションが同
時に発生し得るように、それ自身のXPTバスを有す
る。データ経路は16バイト幅であり、各サイクルにつ
き4倍長ワード(16バイト)を転送することができ
る。
【0047】RSCコマンド変換:本発明の目的の1つ
は、リモート資源管理を用い、クラスタ−クラスタ間イ
ンタフェースを介して交換されなければならない情報の
量の他に、リモート・フェッチ/ストア制御装置12の
サイズ及び複雑度を最小化することである。複雑な記憶
制御装置を有するハイエンドSMPシステムでは、事実
上、ローカル・クラスタ内で開始され得るあらゆるコマ
ンドが、リモート・クラスタ上で処理されるために、イ
ンタフェースを介して送信され得る。これらのコマンド
が一連のアトミック・オペレーションに分解されると
き、リモート側のRSCフェッチ/ストア制御装置12
が、同一の状態マシンを用い、幾つかの類似のコマンド
を処理することができる。従って、RSC設計を単純化
するために、ローカル側のオリジナル・コマンドのある
ものは、等価な"基本(base)"RSCコマンドに再マッ
プされる。例えば、"記憶保護キーを有する排他的フェ
ッチ"は、"キーの無い排他的フェッチ"と同一のパイプ
ライン・シーケンス及びディレクトリ更新アクションを
生じる。従って、RSCインタフェース制御装置は、キ
ーを有する排他的フェッチ・コマンド('06'x)を、
それをインタフェースを介して送信する以前に、単純な
排他的フェッチ・コマンド('02'x)に再マップす
る。
【0048】好適な実施例は、図3に示されるハードウ
ェアにより、コマンド変換を実現する。オリジナル・コ
マンドが、フリップ・ビット発生器26に入力する。こ
こでフリップ・ビット発生器は、コマンド変換テーブル
28のフリップ・ビット列を実現するために要求される
論理ゲートから構成される。オリジナル・コマンドがデ
ィレクトリ・ステータス及びターゲットL3と結合さ
れ、フリップされる必要があるビットを決定する。結果
のフリップ・ビットがXLAT27ブロックにおいて、
オリジナル・コマンドと排他的論理和され、コマンド変
換テーブル28のRSCコマンド列内に示される所望の
RSC基本コマンドを生成する。RSCコマンド変換器
は、1クロック・サイクル内に変換を実行するように設
計される、独立な機能ユニットである。従って、当業者
であれば、これが使用され得る柔軟性を理解することが
できよう。例えば、コマンド変換器は物理的に、RSC
インタフェース制御装置10の一部として実現される
か、或いはRSCに作業要求を開始する制御装置内に含
まれ得る。更に、コマンド変換器は、RSCコマンド優
先ステーションと同一の論理サイクルに統合されるか、
オリジナル・コマンドが使用可能な場合、前のサイクル
で実行されてもよい。例えば、好適な実施例では、パイ
プライン高速路コマンドが第2のパイプライン・ステー
ジ(C2)で使用可能であり、従って、RSCコマンド
優先サイクル以前に変換され得る。
【0049】コマンド変換の使用は、幾つかの点でイン
タフェース効率を向上する。まず第1に、多くのオペレ
ーションがリモート側に、所望のデータがローカル・キ
ャッシュ内に存在するか否かを問い合わせる必要がな
い。従って、コマンド変換器はディレクトリ・ステータ
スを用い、これらのタイプのオペレーションを、RSC
インタフェースの使用を要求するものから除外する。第
2に、コマンド変換は、データが1度転送され、処理さ
れ、次にオリジナル側に返却されるのではなく、データ
転送が1方向にだけ送信されればよいことを保証する。
例えば、I/Oストア64バイト(コマンド28)は、
変換が無い場合、たとえデータの最終的な宛先がローカ
ルL3メモリであっても、64バイトのデータの無条件
伝送を生じる。このことは、64バイトがリモート側に
転送され、ターゲット・ラインに併合され、更新された
ラインがインタフェースを介して再度返却され、ローカ
ル・クラスタに接続されるL3メモリに記憶されなけれ
ばならないことを意味する。本発明は、宛先アドレスが
リモートL3メモリであり、データがキャッシュ内に存
在しない場合、ローカルL3及びディレクトリ・ステー
タスを用いて、インタフェースを介して64バイトを送
信するだけにより、データ転送を最適化する。データが
キャッシュ・ミスを生じ、ターゲットL3がローカル側
であり、更にデータがリモート・キャッシュ内でヒット
する場合、それをリモート・キャッシュから転送するよ
うに要求する問い合わせが、他の側に送信される。この
状況では、初期データ転送は発生せず、ターゲット・ラ
インがリモート・キャッシュ内に保持されている場合、
データがインタフェースを介して戻されるだけである。
たとえデータがリモート・キャッシュ内に存在しても、
オペレーション全体は、リモート側からローカル側への
1度のデータ転送を必要とするだけであり、ローカル側
でデータがI/Oストア・データと併合され、ローカル
L3メモリ内に記憶される。最後に、I/Oストアの第
3の可能な状況は、ターゲット・データが両方のキャッ
シュ内に読出し専用状態で存在する場合である。再度、
この場合、I/Oストア・データがデータのローカル・
コピーと併合され、インタフェースを介してデータを転
送する必要がない。代わりに、オリジナル・コマンドが
読出し専用無効コマンドに変換され、それがリモート・
フェッチ制御装置12aに転送され、リモート・キャッ
シュ内のデータのコピーが無効とマークされる。
【0050】RSC優先ステーション:作業要求をでき
るだけ効率的且つ好都合に処理するために、RSCイン
タフェース制御装置10が多重レベル高機能優先ステー
ションを使用する。図4は、全体的な優先ステーション
を示し、これは主コマンド優先ステーション33と、そ
れに供給するパイプライン事前優先ステーション32と
を含む。パイプライン事前優先ステーションは、両方の
パイプラインの第1ステージ(C1)をモニタし、高速
路候補を探索する。任意のCPUフェッチ・コマン
ド('01'x乃至'07'x)が、高速路指定の候補と見
なされる。いずれかのパイプ・コマンドが候補の場合、
それが事前優先ステーション32に入力し、他のパイプ
ライン・コマンドと共に、C2ステージング・エリアへ
の選択を競合する。1つのパイプだけがそのサイクルに
おいて有効な候補を有する場合、それが自動的に選択さ
れる。両方のパイプが有効な候補を有する場合、単純な
ラウンド・ロビンが次の順番のものを決定する。
【0051】パイプ・コマンドがC2ステージング・エ
リアに選択されると、それが第2パイプライン・ステー
ジ(C2)に関連付けられる様々なインタフェース信号
と比較される。これらのC2拒絶信号には、様々なCP
U制御装置15からのディレクトリ・ステータス、拒絶
信号、及びLFSAR制御装置11からの高速路阻止信
号が含まれる。これらの信号の組み合わせが、C2ステ
ージング・エリア内の現オペレーションが、完全に拒絶
されるべきか、或いは主コマンド優先ステーション33
に転送されるべきかを決定する。オペレーションを拒絶
する可能な原因には、次のものが含まれる。 ○リモート側にデータを問い合わす必要性を否定する適
切な状態を有する、ローカル・ディレクトリをヒットす
るCPUフェッチ ○任意のCPU CFAR制御装置15からの拒絶信号 ○C2パイプライン有効のリセット ○LFSAR制御装置11からの高速路阻止信号 ○L3メモリ構成アレイからの無効アドレス指示
【0052】拒絶条件が存在しない場合、コマンドは主
コマンド優先ステーション33に転送され、そこで両方
のLFSAR制御装置11からの要求と競合する。
【0053】図4に示されるように、コマンド優先ステ
ーション33は、パイプライン事前優先ステーション3
2から転送されるパイプライン高速路情報の他に、各L
FSAR制御装置11から信号のセットを受信する。更
に、コマンド優先ステーションは、8つの資源レジスタ
24及びXPT制御装置25とインタフェースし、知能
的に好適なオペレーションを選択する。
【0054】基本的に、オペレーションは、LFSAR
オペレーションが保留でRSC資源が使用可能な場合、
常にLFSARオペレーションを選択しようとする。1
つのLFSAR制御装置11だけが要求しており、RS
C資源が使用可能な場合、そのLFSARが選択され
る。両方のLFSAR制御装置11が要求しており、一
方だけが使用可能な資源を有する場合、そのLFSAR
が選択される。両方のLFSAR制御装置11が要求し
ており、両方が使用可能な資源を有する場合、フェッチ
・タイプのオペレーションがストア・タイプよりも優先
される。両方の要求が同一のタイプの場合、単純なラウ
ンド・ロビンが次の順番を決定する。最後に、LFSA
R制御装置11が要求していない場合、或いはLFSA
R要求を優遇する資源が使用可能でない場合、高速路要
求が選択される。
【0055】資源の可用性は、オペレーションのタイプ
に依存して変化する。フェッチは最も単純な場合であ
る。なぜなら、要求される資源が、フェッチ・オペレー
ションを処理するパイプラインに対応するリモート・フ
ェッチ制御装置(RFAR)12aだけであるからであ
る。RFARは、それらが他のフェッチ・オペレーショ
ンを処理するために使用中であるか、或いは、資源ディ
セーブル・スイッチが活動化され得るために使用不能で
あり得る。コマンド優先ステーション33は、各RSC
資源のディセーブル・スイッチ及び有効ビットをモニタ
し可用性を判断する。
【0056】システム性能を更に向上させるために、優
先オペレーションが応答ハンドラ22と協働し、リモー
ト・フェッチの効率を最大化する。通常、フェッチは次
の使用可能なRFAR制御装置12aにディスパッチさ
れる。リモート・クラスタ上のRFARが、パイプライ
ン内のフェッチ要求を処理し、そのデータ・バッファの
ロードを開始する。同時に、それはインタフェースを介
してリモート側のRSC IC10に、最終応答及びデ
ータを返却するように要求を発行する。最終応答が伝送
されるや否や、そのRFAR資源が使用可能と見なさ
れ、新たな作業を受諾することが可能になる。新たな非
データ・オペレーションがそのRFARに送信される場
合、RFARはそれを、以前のフェッチからの後続バイ
トがまだデータ・バッファから読出されている間に処理
することができる。しかしながら、新たなオペレーショ
ンが第2のデータ・フェッチの場合、そのオペレーショ
ンはバッファが使用可能になるまで、リモート側のパイ
プラインを通じて、連続的にリサイクルされる。
【0057】本発明は、第2のフェッチ要求が到来する
とき、両方の資源が使用可能であれば、連続的なデータ
・フェッチが交互のRFAR制御装置に送信されるよう
に保証することにより、この状況を回避する。例えば、
RFAR A0が第1のフェッチを処理しており、RF
AR A0がまだ使用中の間に、第2のフェッチが到来
する場合、(RFAR A1が使用可能と仮定して、)
第2のフェッチがRFAR A1に経路指定される。更
に、最終応答が伝送され、RFAR A0が使用可能に
なり、第2のフェッチが到来する場合にも、(RFAR
A0バッファがまだデータを転送しているので、)第
2のフェッチはRFAR A1に経路指定される。しか
しながら、RFAR A0がまだ使用中の間に、読出し
専用無効のような非データ・オペレーションが到来した
場合、それはRFAR A1に経路指定される。これに
データ・フェッチに相当する第3のオペレーションが続
く場合、RFAR A0が使用可能であれば、たとえバ
ッファがまだ後続バイトの転送のために使用中であって
も、この新たなデータ・フェッチがRFAR A0に送
信される。換言すると、要求を異なるRFARに交互に
渡す機構は、1対のいずれかの資源の可用性に従う。
【0058】図5は、前述の機構と、RSC優先ステー
ション21との間の相互作用を示す論理ブロック図であ
る。RSC資源24の各対に対して、資源トグル機能が
RSC IC内に存在する。パイプラインAに対するR
FAR対を表す1つの資源トグル器35が、図5に示さ
れる。これは各RFAR資源(A0及びA1)から可用
性信号を受信する。これらの可用性信号は、他の6つの
RSC資源からのそれらと一緒に、RSC優先ステーシ
ョン21にも供給される。更に、パイプAフェッチ・グ
ラント信号が、RSC優先ステーションにより生成さ
れ、資源トグル器35に供給される。最後に、適切な条
件が存在する場合、資源トグル器がトグル保持ラッチ3
6を介して、次のオペレーションに割当てられる資源対
の一方を制御する。資源トグル器は1つの選択信号を生
成し、これがフェッチ・グラント信号と2度論理積さ
れ、ロードRFAR A0信号及びロードRFAR A
1信号が生成される。そして、これらがRFAR A0
資源レジスタ及びA1資源レジスタに転送される。
【0059】図5に示されるトグル器真理値表37は、
選択信号及びトグル保持ラッチ36が更新される様子を
示す。2つの資源の一方だけが使用可能な場合、選択信
号はトグル保持ラッチ36の状態に関係無しに、使用可
能な資源をデフォルト指定する。両方の資源が使用可能
で、フェッチ・グラントがこのパイプラインに対して発
行された場合、トグル保持ラッチの現状態が選択信号を
駆動する。更に、トグル保持ラッチが次のサイクル
で、"他の"資源に仕向けられる続くフェッチを見越して
更新される(但し、他の資源が使用可能な場合)。トグ
ル器真理値表37の最下部に示されるように、使用可能
信号は資源有効ビット59aと、ディセーブル・ビット
59fと、最終応答がこの資源に対して受信済みで、そ
れがこのサイクルで"使用可能"と見なされることを示す
RST_RFAR_A0ラッチとの関数である。
【0060】ストア・タイプ・オペレーションは、コマ
ンドを伴う初期データ転送を含み得るので、フェッチよ
りも複雑である。コマンド優先ステーション33が、デ
ィセーブル・スイッチ及び有効ビットをテストすること
により、RFARと同様に、リモート・ストア制御装置
(RSAR)12bの可用性の一部を決定する。コマン
ド優先ステーション33がRSC基本コマンドを復号
し、それがデータ転送を要求するか否かを見分ける。コ
マンドがデータ転送を要求する場合、データ・バスの可
用性がテストされなければならない。このテストを合格
するためには、次の2つの条件が満たされなければなら
ない。 1.ストアを発行するパイプラインに対応するデータ・
バスが、データ転送のために使用中でないこと。 2.対応するRFAR制御装置12aが、他のクラスタ
から発行されたフェッチ・オペレーションに対するデー
タの返却のために、データ経路の使用を要求していない
こと。
【0061】両方の条件が満たされる場合、またはIS
Kオペレーション(コマンド30)など、ストア・コマ
ンドがデータ経路の使用を要求しない場合、ストア・オ
ペレーションの資源基準が満足される。
【0062】前述の優先オペレーションは、資源が使用
可能である限り、新たなオペレーションがリモート側に
転送されることを保証する。更に、LFSAR制御装置
11を優先化することにより、LFSAR資源のスルー
プットを向上し、それにより、互いに競合のために待機
し、インタロックされる資源により引き起こされる資源
輻輳及びデッドロックを低減する。一旦オペレーション
が選択されると、コマンド(そのオリジナルのまたは再
マップされたコードポイントによる)がRSCインタフ
ェースを介して、27ビットのフル・アドレスと一緒に
送信される。リモート側のRSCコマンド・ディストリ
ビュータが、C0_C1_CMDコマンド・バスのビッ
ト0の値に従い、コマンドをRFARまたはRSARに
経路指定する。更に、C0_C1_PIPE_SEL及
びC0_C1_REQ_REG_SELが、コマンドを
オペレーションを処理するパイプラインに関連付けられ
る選択RFSAR制御装置12aまたは12bに仕向け
るために使用される。このリモート資源管理技術は、複
数のパイプライン間で広がる非常に多数の記憶制御装置
の資源が、限られた数のI/Oを用いて、共用RSCイ
ンタフェースを使用することを可能にする。
【0063】前述したように、C0_C1_REQID
は、インタフェースを介して送信される発信元リクエス
タのIDであるが、リモート管理オペレーションには参
加しない。このIDは純粋に、リモート側に転送され、
それを必要とする記憶制御装置の資源に渡される情報と
して扱われる。
【0064】新たなRSCオペレーションを発行すると
き、コマンド優先ステーション33はグラントを対応す
るLFSAR制御装置11に発行する。好適な実施例で
は、このグラントを1サイクル遅延することにより、ク
リティカルなタイミング経路を緩和する。しかしなが
ら、この遅延は、LFSAR制御装置からの要求ライン
が、必要とされるよりも1サイクル長く活動状態である
ことを意味する。RSC優先ステーションはこれを考慮
して、次のオペレーションのために要求を分析し、その
同一のオペレーションを再度選択してサイクルを浪費し
ないように保証する。2つのタイプのグラントが各LF
SAR制御装置11に発行され、それらは何がRSC優
先ステーション内で生じたかを明示する。正規のグラン
トはLFSAR要求が選択されるとき発行され、特殊な
高速路グラントは、パイプライン高速路コマンドが選択
されるとき発行される。
【0065】RSC資源レジスタ:一旦RSC優先ステ
ーション21が、インタフェースを介して送信するコマ
ンドを選択すると、コマンド及びその関連情報(LFS
AR ID、リクエスタID、及びLFSARバッファ
ID)が、適切なRSC資源レジスタにロードされる。
図6は、コマンドが適切な保持レジスタにステージされ
る様子を示す。CLCコマンド42及びC3パイプ・コ
マンド43ステージング・レジスタの目的は、図6の右
上の3ウェイ多重化41を通じて、クリティカル経路上
のタイミングを緩和することである。全てのCLCコマ
ンドがLFSAR制御装置11から発生し、タイミング
的にクリティカルである。全体システム性能を向上する
ために、リモート・オペレーションがインタフェースを
介して、1サイクルで送信される。この同一のコマンド
は、優先論理及び小さなクロスポイント・スイッチを横
断し、適切なRSC資源レジスタに達しなければならな
いので、これは困難な経路を提供する。好適な実施例
は、入来するCLCコマンド及びパイプ・コマンドをク
ロスポイント・スイッチを介して送信する前にステージ
ングすることにより、これを解決する。
【0066】図6を再度参照すると、各LFSAR制御
装置11要求に関連付けられるコマンドは、CLCコマ
ンド・ステージング・レジスタ42にステージされる。
それと並列に、パイプライン事前優先ステーション32
により選択されるC2パイプライン・コマンドが、C3
パイプ・コマンド・ステージング・レジスタ43にステ
ージされる。更に並列に、CLC及びパイプ・コマンド
・フローが、3ウェイ多重化41を介して転送される。
この多重化は、コマンド優先ステーション33から来る
グラント・ラインにより制御される。各CLCコマンド
は、CLCパイプラインに関連付けられる2つのRFA
Rコマンド45レジスタまたはRSARコマンド47レ
ジスタのいずれかにロードされる。このことは、各CL
Cコマンドが4つの可能な宛先を有することを意味す
る。高速路コマンドはCPUフェッチ・オペレーション
に制限されるので、それらは2つのRFARコマンド4
5レジスタだけにロードされ得る。コマンドは、2ウェ
イ多重化44及びゲートウェイ46から成るクロスポイ
ント・スイッチを介して経路指定される。2ウェイ多重
化は、CLCコマンド42及びC3パイプ・コマンド4
3レジスタ間を選択する信号により制御される。ゲート
ウェイ46は、CLCコマンド42の通過を許可する信
号ゲート・ラインにより制御される。これらの全ての制
御信号は直交し、選択RSCオペレーションのグラント
を、次の使用可能な資源を選択する優先論理に結合する
ことにより生じる。
【0067】RSCは8つの資源レジスタ24を含み、
これらが全ての相互クラスタ・オペレーションを処理す
る。このことは、各パイプラインに対する2つのフェッ
チ及び2つのストア・オペレーションが、同時に発生す
ることを可能にする。オペレーション全体は、ローカル
RSCインタフェース制御装置10により追跡されるの
で、オペレーションを完了するために要求される全ての
情報は、資源レジスタ24内に保持されなければならな
い。図7は、1セットの資源レジスタ59の詳細図を示
し、これはディセーブル・ビット、有効ビット、コマン
ド・レジスタ、オリジナル・リクエスタIDレジスタ、
LFSAR制御装置IDレジスタ、及びLFSARバッ
ファ・レジスタを含む。好適な実施例では、LFSAR
制御装置11内の各パイプに対して、2つのLFAR及
び2つのLSARが存在するが、各パイプに対して、2
つのLFSARバッファだけしか存在しない。従って、
LFSAR制御装置11は新たなオペレーションの度
に、2つのバッファの一方を各LFSAR IDに動的
に割当てなければならない。従って、バッファIDが各
新たな要求と共に、RSC IC10に伝達されなけれ
ばならない。
【0068】当業者であれば、LFSAR資源、バッフ
ァの総数、及びそれらのお互いの関係が本発明に影響を
及ぼさないことが理解できよう。バッファの数がLFS
AR資源の数に等しく、固定の関係に従う場合、RSC
ICはこの情報を追跡するために余分な資源レジスタ
を要求しない。しかしながら、RSC ICが、好適な
実施例で示される以外の追加の情報を追跡する必要があ
る他の実施例も存在し得る。資源レジスタ内で追跡され
なければならない情報の量に関係無しに、ここで開示さ
れる原理は当てはまるものである。
【0069】図7に戻り、この図は多少より複雑なRF
AR資源の詳細を示す。なぜなら、RFARが、C3高
速路ステージング・レジスタ55a及びCLCステージ
ング・レジスタ55bの両方を含むからである。図6
は、資源レジスタのコマンド部分だけを示したが、8つ
の全ての資源レジスタを示した。それに対して図7は、
1つの資源だけを示すが、所与のRSCオペレーション
を追跡するために要求される全ての情報が、資源レジス
タにロードされる様子を示す。全ての制御信号はコマン
ド優先ステーション33から発生する。この図では、優
先グラント(実際に使用される信号のサブセット)だけ
を用い、様々な資源レジスタをロードする論理タイミン
グを示す。
【0070】まず第1に、オペレーションがグラントを
発行された後のサイクルで、有効ビット59aがロード
される。ORゲート54が、オペレーションが正規のC
LCオペレーションか、パイプライン高速路オペレーシ
ョンかに関わらず、有効ビットがロードされるように保
証する。有効ビットは、資源が使用可能か否かを決定す
る上で重要な役割をするので、これは資源が次の優先サ
イクルにおいて、使用不能とマークされることを保証す
る。グラントを資源レジスタ59のセット全体にファン
アウトすることにより生じる、タイミング・クリティカ
ル経路を緩和するために、本発明は、残りの情報がロー
ド以前に遅延可能である事実を利用する。
【0071】LFSAR制御装置11から発行されるC
LCオペレーションは、論理タイミングに関して最も単
純である。これらのオペレーションのために、ステージ
されたCLCグラント53が、ORゲート54を介し
て、2ウェイ多重化56及びゲートウェイ58を制御す
る。それにより、このグラントが活動状態のとき、CL
Cステージング・レジスタ55bを含む全ての情報が、
有効ビット59aのロードに続くサイクルで、資源レジ
スタの残りのセット59b乃至59dにロードされる。
【0072】パイプライン高速路オペレーションは、C
3高速路ステージング・レジスタ55aにステージさ
れ、そこにはC3コマンド及びリクエスタIDレジスタ
だけが存在する。この状況では、ステージされた高速路
グラントLC52aが、2ウェイ多重化56を介して、
C3パイプライン・コマンド及びリクエスタIDを選択
し、それらをコマンド59b及びリクエスタID59c
資源レジスタにロードする。これらの高速路オペレーシ
ョンがパイプラインの第3ステージに達すると、それら
がLFAR資源にロードされ、LFARバッファに割当
てられる。これは多くのCPUフェッチ・オペレーショ
ンが複数のパイプライン・パスを要求し、LFARがフ
ェッチ・オペレーション全体を管理することが要求され
るために必要である。従って、一旦この割当てが知れる
と、LFSAR制御装置11が、パイプライン高速路オ
ペレーションの直後のサイクルで、特殊な要求をRSC
IC10に提示する。要求と一緒に、LFSARイン
タフェースは、LFAR ID及びLFARバッファI
Dを含む。RSC ICは高速路グラントLC2トリガ
により、情報がCLC BFRレジスタ及びCLC R
EQレジスタ55b内で使用可能になるタイミングを示
す。これによりコマンド59b及びリクエスタID59
cレジスタに続くサイクルで、この情報がゲートウェイ
58を介してゲートされ、LFSARバッファ59d及
びLFSAR ID59eレジスタにロードされる。
【0073】好適な実施例は更に、エンコーダ57の使
用を示し、これはCLC REQレジスタ内に存在する
8つの要求信号の8対3符号化を実行し、IDを3ビッ
ト値として、LFSAR IDレジスタ59eに記憶す
る。更に、ディセーブル・レジスタ59fとして示され
る追加の1ビットが、完全性のために含まれる。この1
ビット・レジスタは走査可能なレジスタであり、好適な
実施例のUBUSを介してロードされ得る。各RSC資
源レジスタは、こうしたディセーブル・ビットを有し、
これはマイクロコードやファームウェア・ロード、また
はシステム・リセットなどを通じて、資源が永久にまた
は一時的に使用禁止になることを可能にする。このビッ
トは、RSC IC10の通常のシステム・オペレーシ
ョンでは何の役割も演じないが、エンジニアリング・デ
バッグ及びインタフェース性能分析において有用であ
る。
【0074】応答処理:図2に示される応答ハンドラ2
2は、リモート・クラスタから返却される全ての応答ト
ラフィックを処理し、適切な完了信号をイニシエータに
送信する役目をする。RSC IC10により受信され
る、2つの主な応答のタイプが存在する。RSCオペレ
ーションの多くは、データがリモート・キャッシュ内に
存在するか否かを決定するための、リモート相互問い合
わせ(XI)を含む。これらのオペレーションの1つが
呼び出されると、コマンドが他の側で受信され、保証さ
れた優先レベルによりリモート・パイプに入力する。パ
イプへのこの保証付きのエントリは、オペレーションが
インタフェースを介して発せられる時点と、ヒット/ミ
ス結果が知れる時点との間に、同期関係が存在すること
を可能にする。本実施例では、コマンドがRSCインタ
フェースに提供されてから4サイクル後に、XI応答が
返却される。
【0075】RSC優先21サイクルで始まり、応答ハ
ンドラ22は図8に示されるステージング機構を用い
て、XI応答を追跡する。ローカル・キャッシュでミス
を発生する特定のタイプのフェッチの性能を向上するた
めに、RSC ICは、同期インタフェースに結合さ
れ、フェッチがローカルL3メモリまたはリモートL3
メモリのいずれをターゲットとするかを示すアドレス・
ビットにより、自動的にオペレーションを退けるか否か
を決定する。例えば、フェッチがリモートL3メモリを
ターゲットとする場合、RSC資源はオペレーションが
完了するまで、有効に維持されなければならない。なぜ
なら、所望のデータがリモート・キャッシュまたはリモ
ートL3メモリのいずれかから到来するからである。し
かしながら、アドレスがローカルL3メモリをターゲッ
トとし、データがリモート・キャッシュ内に存在しない
場合には、データ・フェッチがローカルLFAR制御装
置により処理されるので、資源が新たなオペレーション
のために解放され得る。
【0076】毎サイクルごとに、CLCコマンド・レジ
スタ55bの各々がデコーダ61により分析され、それ
が相互問い合わせ(XI)を要求するフェッチ・コマン
ドの1つであるか否かが見分けられる。この結果が、C
LCローカルL3ビット60と、このCLCオペレーシ
ョンがグラントを発行されたことを示すRSC優先ステ
ーション21からの信号と結合される。並列に、C3パ
イプ・ローカルL3ビットが、高速路オペレーションが
グラントを発行されたことを示す、RSC優先ステーシ
ョン21からの類似の信号と結合される。定義上、全て
の高速路オペレーションは、相互問い合わせを要求す
る。グラントは相互に排他的なので、1つの分岐だけが
任意のサイクルにおいて活動化され得る。これらの信号
が、2ウェイAND/OR多重化63内で図示のように
結合され、条件が真であれば、4ビットL3ステージン
グ・パイプライン64の1ビットをロードする。このパ
イプラインは、各サイクルに対して、4ビット・ステー
ジング・レジスタを含み、ステージ2から開始し、ステ
ージ6で終了する。4ビットの各々は、RFAR資源1
2aの1つを表す。図8では示されていないが、前述し
た機能を成す全ての要素が、4回複製され、結果の出力
がステージ2のビットの各々に供給される。再度、これ
らのRFAR資源の1つだけが、任意の所与のサイクル
でロードされるので、L3ステージング・パイプライン
64内の各ステージの4ビットは直交する。パイプライ
ンのステージ6は、XI応答が応答ハンドラ22により
受信されるときのサイクルに対応する。4ビットのいず
れかが活動状態で、XI応答がミスの場合、有効ビット
59aをオフにすることにより、対応するRSC資源レ
ジスタがリセットされる。
【0077】データ・フェッチのサブセットの間にだけ
ロードされる特殊L3ステージング・パイプライン64
に加え、図8はRFSARステージング・パイプライン
67を示し、これは新たに開始されたあらゆるRSCオ
ペレーションによりロードされる。各RSC資源レジス
タ24は、資源が最後のサイクルでロードされたことを
示す1ビット・ラッチを含む。これらの8つの資源ロー
ド・ラッチ65は直交する。なぜなら、各サイクルにお
いて、1資源だけが新たなオペレーションによりロード
され得るからである。これらの8つのレジスタの出力
は、8対3エンコーダ66により符号化され、3ビット
符号化値が、RFSARステージング・パイプ67内に
記憶される。このパイプラインもまたステージ2から開
始し、ステージ6で終了する。3ビットRSC資源ID
は有効ビットと結合され、ステージ6に達するまで、各
サイクルごとにステージを通じてパイプライン処理され
る。論理タイミングに関しては、このIDは、XI応答
及びリモート・インタフェース・エラー信号が受信され
るのと同一サイクルのステージ6に到来する。
【0078】インタフェース・エラーの場合、3ビット
RFSAR IDが復号され、オペレーションに関わる
RSC資源レジスタ21をリセットするために使用され
る。更に、ハードウェア・ルックアップ・テーブル68
を用いて、3ビットRSCIDにより、資源レジスタの
LFSAR ID59eレジスタを指標化する。LFS
AR IDレジスタの内容が更に復号され、インタフェ
ース・エラー信号を適切なLFAR制御装置またはLS
AR制御装置に送信するために使用される。例えば、R
FSARステージング・パイプライン67のステージ6
が、値"010"を含む場合、これはパイプAのRSAR
0がRSC資源であることを示す。ルックアップ・テー
ブル68はこの時、パイプA RSAR0資源内のLF
SAR IDレジスタを復号し、その値がこの特定のオ
ペレーションに関連付けられるLSARを指し示す。所
与のオペレーションを、対応するローカルLFAR制御
装置またはLSAR制御装置に関連付ける能力は、多く
のRSCオペレーションの再試行を可能にする。しばし
ば、インタフェース・エラーは断続的に発生し、従って
オペレーションを再試行する能力が、不要なシステム機
能停止を阻止する。
【0079】RFSARステージング・パイプライン6
7を使用する追加のシステム性能改善は、高速読出し専
用無効(FAST READ-ONLY INVALIDATE)である。RSC
オペレーションの1つは読出し専用無効であり、キャッ
シュ内に存在するデータの読出し専用コピーが、リモー
ト側で無効にされなければならない。これは例えば、C
PUが排他的所有権により、データのフェッチを希望
し、他のCPUがデータの読出し専用コピーを有すると
きに発生する。他のCPUがリモート側に存在する場
合、RSC ICは読出し専用無効コマンドを送信し、
他のクラスタ上のリモート・フェッチ制御装置12aが
それを処理する。通常、これはディレクトリ・エントリ
を無効にする単純なパイプライン・パスを生じる。時
々、これらの初期パイプライン・パスは、リモートCP
Uのために同一のラインのアクセスを試みる別の制御装
置とのアドレス比較を生成する。これらの衝突が発生す
るとき、衝突を完全に解決する以前に、排他的所有権を
要求しているCPUにデータを所有させることが安全な
場合がある。本発明におけるリモート・フェッチ制御装
置12aは、初期パイプライン・パスの間に、これら
の"安全な"状況を検出し、同期XI応答バスを介して、
RSC ICに安全に進行可能であることを知らせる能
力を有する。
【0080】図9は、読出し専用無効ステージング・パ
イプライン75を示し、これは前述の他の2つのステー
ジング・パイプラインと同様に作用する。両方のパイプ
ラインのCLCコマンド・レジスタ55bが、読出し専
用無効オペレーションを除外するROIデコーダ73に
より復号される。これがCLCグラント53と結合さ
れ、有効な読出し専用オペレーションが開始されたこと
を示す。再度、これらの内の1つだけが、任意の所与の
サイクルで開始され得る。結果がROI多重化74に供
給され、読出し専用無効ステージング・パイプライン7
5のステージ2をセットするために使用される。このビ
ットは下流のステージ6にパイプライン処理され、そこ
で応答ハンドラ22に受信されたXI応答と提携する。
RO無効ステージ6ビットが活動状態で、XI応答がミ
スの場合、RFSARステージ6レジスタ67及びLF
SARルックアップ・テーブル68が、関連するLFA
R制御装置を解放するために使用され、初期オペレーシ
ョンの完了を可能にする。リモート・フェッチ制御装置
は読出し専用無効を処理し続け、従ってRSC資源有効
ビットが活動状態に維持される。一旦リモート・フェッ
チ制御装置12aがオペレーションを完了すると、それ
は最終応答を返却し、これがオペレーションを退け、資
源が新たな作業を受諾することを可能にする。その間、
読出し専用無効に関連付けられるLFARが、新たなオ
ペレーションを開始したかもしれない。読出し専用無効
に対する最終応答が、新たなLFARオペレーションに
対する最終応答と間違えられないようにするため、RS
C ICは各RFAR資源に対する保持レジスタを含
む。高速読出し専用無効機構がLFARを解放するため
に使用される都度、適切な保持レジスタがセットされ、
今度の最終応答がそのLFARに知らされることを防止
する。一旦最終応答が受信され、オペレーションが公式
に完了されると、保持レジスタが残りの資源レジスタと
一緒にリセットされる。
【0081】相互問い合わせ以外の、リモート・オペレ
ーションに関わる本発明の全てのオペレーションは、符
号化最終応答により終了する。応答ハンドラ22が符号
化応答IDバスを用い、応答をオペレーションを開始し
たLFSAR IDと突き合わせる。最低限、RSC
IC10は発信元LFSAR制御装置に、オペレーショ
ンが完了したことを知らせ、後者は資源を解放すること
ができる。データがリモート側からフェッチされる場
合、データ・アドバンス(advance)が対応するローカ
ルLFAR制御装置に送信され、LFAR制御装置はロ
ーカル・ディレクトリ・ステータスを更新できる。更
に、RSC XPTコードポイントがデータ・フロー・
チップに送信されるように、信号がXPT制御措置25
に送信される。
【0082】リモート・オペレーションのサブセットは
また、全応答コードがCFAR制御装置15に転送され
るように要求する。例えば、CFAR制御装置はこの信
号応答により、早期応答及び最終応答を中央処理ユニッ
トに返送しなければならない。本発明で定義される7つ
の応答ビットの内、ビット0及びビット1は、実際の応
答値内に含まれない。代わりに、それらは次の特殊な意
味を有する。 ○ビット0は、通常、デッドロック状況を回避するため
に、リモート・オペレーションが拒絶されたことを示
す。このビットにより、再試行信号が適切なLFSAR
に送信される。LFSARはオペレーションを後に再試
行しようとする。 ○ビット1は、ラインが変更状態のリモート・キャッシ
ュをヒットしたことを示す。この情報は、データ・フェ
ッチの間にLFARにより、ローカル・ディレクトリの
最終状態を計算するために使用される。
【0083】残りのビットは、開始オペレーションに依
存して、様々な完了コードを示すために符号化される。
【0084】応答優先:リモート側から返却される応答
を処理することに加え、RSC ICは応答優先機能を
用い、応答をリモート側に送信する。これらの応答は相
互問い合わせ(XI)形式であり、リモート・クラスタ
から開始され、ローカル・クラスタ上で処理されるオペ
レーションの最終応答である。(合計4つのリクエスタ
に対する)各パイプラインからのローカルRFAR12
a制御装置及びRSAR12b制御装置が、最終応答を
RSC IC10に送信するためのXI応答及び要求を
提示する。相互問い合わせはフェッチ・オペレーション
だけに関与するので、RFAR制御装置12aだけがX
I応答を提示できる。更に、1つの相互問い合わせだけ
がリモート側により1度に開始され得、それらがパイプ
ラインを通じて、固定サイクル数で処理されることが保
証されているので、4つの可能なRFARXI応答の1
つだけが、任意の所与のサイクルにおいて活動状態であ
り得る。従って、応答優先23論理は単に4つのXI応
答を一緒に論理和し、出力をインタフェースに転送す
る。
【0085】最終応答要求は、RFAR12a制御装置
及びRSAR12b制御装置から生じ得、リモート・オ
ペレーションが長さ的に大きく変化するので、応答は非
同期に発生する。応答優先23論理がRSC優先ステー
ション21と相互作用し、いずれかの最終応答要求が優
遇され得るかを判断する。データ・フェッチ以外のオペ
レーションでは、応答論理は単純な優先オペレーション
を用い、4つのRFSARの1つを選択し、応答をイン
タフェースを介して転送する。2つ以上のRFSARが
要求を同一のサイクルに発行する場合、オペレーション
はRFARをRSARよりも優先する。このことは、C
PUにより要求されるフェッチ・データが、不必要にR
SAR応答トラフィックにより遅延されないように保証
することにより、システム性能を向上させる。両方のR
FARが同一サイクルにおいて要求を提示する場合、オ
ペレーションはラウンド・ロビンを用い、RFARの一
方を選択する。優遇されるRFARが存在せず、2つ以
上のRSARが要求している場合、単純なラウンド・ロ
ビンがRSARを選択する。
【0086】本発明の新規の側面の1つは、共用データ
・バスの効率を最大化するための、応答優先機能23と
RSC優先ステーション21間の相互作用である。(遠
隔的に開始されたフェッチに関する)フェッチ・データ
の返却は、局所的に開始されたストア・オペレーション
と同一のデータ経路を共用しなければならないので、ス
トア転送の完了を待機している間に、フェッチが遅延さ
れる潜在性が存在する。応答優先は、フェッチ・データ
を返却しようとする最終応答要求のために、次のステッ
プを実行することにより、この潜在性を低減する。 1.要求元RFARのパイプラインに対応するデータ経
路が、使用可能か否かをチェックする。使用可能でない
場合、RSAR要求が保留であれば、優先論理が即時そ
のRSAR要求を選択する。 2.データ経路が使用可能な場合、優先論理がRFAR
を選択し、RSC優先ステーションに、データ転送を含
む保留のLSARストア・オペレーションの選択を阻止
するように伝える。
【0087】両方の優先機能21及び23内のオペレー
ションは、周期的に動的であり、これはそれらが各サイ
クルごとに現環境を評価し、1サイクル内に全ての判断
を下すことを意味する。従って、データ経路が使用不能
なために、要求が遅延される場合、その要求は自身がサ
ービスされ得る最初のサイクルにおいてサービスされ
る。インタフェースを介する伝送のための要求が選択さ
れる都度、グラントが要求元RFSARに送信され、要
求元RFSARは現要求を取り下げ、新たな要求を次の
サイクルで発行できる。実際の応答に加え、RSC I
Cはまた、応答を返却しているRFSARを示す3ビッ
ト符号化応答IDバスを送信する。他の側の応答ハンド
ラ22がこの3ビットのIDを復号し、リセットされる
必要のあるRSC資源レジスタを解析する。
【0088】全ての応答がRSCインタフェースを1サ
イクル内に横断するが、2つのオペレーションは追加の
情報のために応答バスを使用する。キー・オペレーショ
ンの間、実際のキーが応答の直後に続く。テスト・バイ
ト・アブソリュート(TBA)・オペレーションの間に
は、更にTBAステータスが次のサイクルで応答に続
く。いずれの場合も、RFSAR制御装置が、応答要求
に付随して、これが2サイクル・オペレーションである
ことを示す特殊な信号を、RSC ICに送信する。そ
れにより応答優先23は、第2のサイクルの間に、新た
なRFSAR最終応答を選択するのを回避する。
【0089】クロスポイント(XPT)制御装置:好適
な実施例のRSCインタフェースは、合計4つの4倍長
ワード(QW)・データ経路をサポートする。各パイプ
に対して、各方向(ローカルからリモート、及びリモー
トからローカルの方向)に1つのデータ経路が存在す
る。物理的に、各データ経路はその実現に2つのSCD
チップを要求し、各データ・チップがダブル・ワード
(DW)を伝搬する。この設計は共用バス構造と、真に
専用のポイント−ポイント間データ・フローとの間の妥
協案である。各方向において、単方向データ経路が存在
するが、各データ経路は、インタフェースの両側から開
始されたデータを多重化しなければならない。例えば、
リモートSCをローカルSCに接続するデータ経路は、
局所的に開始されたフェッチ要求に応答して、データを
返却するためにいつでも使用されるか、或いはリモート
側により開始されたストア・オペレーションに伴うスト
ア・データを伝送するために使用され得る。理想的に
は、これらのオペレーションは別々のデータ経路により
分離されるべきであるが、パッケージ化制限がこれを阻
む。しかしながら、各パイプに対して、単方向バスが両
方向に存在する事実が、1サイクルにつき4つのQW
(すなわち64バイト)の同時移動を可能にする。
【0090】RSC ICは、4つの全てのデータ経路
を監視するクロスポイント(XPT)制御装置25を含
む。実際、各データ経路の半分が、各クラスタ上のXP
T制御装置により制御される。例えば、ローカルSCか
らリモートSCに転送されるデータは、ローカルRSC
ICにより駆動され、リモートRSC ICにより受
信される。従って、XPTバスの駆動部分はローカルR
SC ICから発生する一方、受信部分はリモートRS
C ICから到来する。4つの全てのデータ経路が11
ビット制御バスにより制御され、ここでビット(0:
5)は受信側を制御し、ビット(6:10)は駆動側を
制御する。これらの部分的XPTバスは、以下では、受
信XPT(RCV XPT)及び駆動XPT(DRV_
XPT)と呼ばれる。
【0091】図10は、1つのRSC IC内の1パイ
プラインの受信XPT及び駆動XPTの内部論理を示
す。クリティカル・タイミング経路を緩和するために、
XPT情報が可能であれば事前にセット・アップされ
る。XPT発生器81a論理の役割は、RSC資源情報
と外部信号との組み合わせを用い、適切なデータ経路制
御をセット・アップすることである。トリガ82a及び
82bは、転送データに関して、XPT情報を正に正確
な時間にRSC XPTバス上に解放するゲートとして
作用する。RSC XPTバスのビットは、データ・チ
ップ上の様々なバッファ制御装置及びクロスポイント・
スイッチにより受信される。この論理は単純なデコーダ
を含み、これらがバッファ・アドレス及び書込み制御、
更にセレクタを活動化する。データ・チップは、データ
転送の背後の論理オペレーションの知識を有さないの
で、RSC XPTバスが、各QWの転送に対して1
度、"パルス駆動"されなければならない。従って、デー
タのラインが転送を要求する場合、RSC ICは適切
な値を16連続サイクルの間、RSC XPTバス上に
保持しなければならない。
【0092】XPT制御装置25のRCV_XPT部分
に注目すると、RCV XPT発生器81a論理が、R
FAR資源レジスタ、ブロックXPT信号、及びRSC
_CMDにより供給されるように示される。前述のよう
に、データは2つの理由のために、すなわち、局所的に
開始された要求からの返却フェッチ・データ、または遠
隔的に開始されたストア・オペレーションからの入来ス
トア・データのために、このSCにより受信され得る。
前者の場合、このRSC ICがフェッチ・オペレーシ
ョンを担当し、RFAR資源レジスタのセット内に全て
の情報を有する。XPT発生器論理は、コマンド59
b、要求ID59c、LFARバッファ59d、及びL
FAR ID59eレジスタ内の情報を使用し、RCV
_XPTの値を計算し、データ転送長を決定する。長さ
が1QWよりも大きい場合、XPT制御装置83が適切
なサイクル数によりロードされる。これは全て、コマン
ドがインタフェースを介してディスパッチされた少し後
で発生する。データが返却されるとき、第1のQWは常
に、符号化応答'03'x、'23'x、'05'x、また
は'18'x乃至'1B'xを伴う。(マッチングenc_resp
_idを有する)これらの応答の1つをトリガ論理82a
に受信すると、RCV_XPTがRSC_XPTバス上
に解放される。複数のQWが含まれる場合、XPT制御
装置はカウントが尽きるまで、RCV_XPT値を供給
し続ける。RCV_XPTはオペレーションに従い、デ
ータを適切なCPUポート、I/Oポート、LSARバ
ッファ、またはLFARバッファ(後にキャッシュに含
むため)に仕向ける。特定の状況の下では、ローカルC
PUに仕向けられるデータが、最後の瞬間、CPUに送
信されるのを阻止しなければならない。RSC IC
は、各LFAR11制御装置及びCFAR15制御装置
から、トリガを抑制するために使用される幾つかの阻止
信号を受信する。
【0093】RCV_XPTバスの使用に関する第2の
状況は、リモート・クラスタから開始されたストア・デ
ータの受信に関わる。これは完全に非同期な事象である
ので、XPT発生器81a及びトリガ論理82aが同時
に呼び出される。RSC ICは、ローカルRSAR制
御装置12bからのデータ・アドバンス・トリガと同様
に、入来RSC_CMDバスの一部をモニタする。RS
AR_DADVが活動状態で、コマンドのサブセットが
適切な値に復号される場合、RCV_XPTがセット・
アップされて、RSC_XPTバスに提供され、それに
よりローカル・データ経路チップが入来データを受諾
し、それをRSARバッファに経路指定するように指示
される。
【0094】駆動XPT(DRV_XPT)は類似に作
用する。再度、2つの状況がこのデータ経路の使用を要
求する。第1の状況は、局所的に開始されたストア・オ
ペレーションに関わる。この場合、RSAR資源レジス
タが、必要に応じてDRV_XPTをセット・アップ
し、XPT制御装置83をロードするために必要な全て
の情報を保持する。トリガ論理82bにより受信される
RSAR_ST_OP信号が、インタフェースを介する
コマンドの発行に関して、データが転送され始めるタイ
ミングを制御する。他の側のRSARがリモートRSC
ICにRSAR_DADVを活動化し、後者が"起動
(wake up)"し、ストア・データを受諾し得る。RSA
R_ST_OP信号は、単にRSARコマンド59bレ
ジスタの復号であり、現オペレーションがストア・デー
タ転送を要求するか否かを判断する。全てのストア・デ
ータはローカル側のLSARバッファから発生し、DR
V_XPTがこれらのバッファの読出しを制御する。
【0095】他の状況は、他の側により要求されたフェ
ッチ・データの返却に関わる。このデータの源はRFA
Rバッファ、PMAインタフェースまたは任意のCPU
リモート・センス・レジスタであるので、XPT発生器
81b論理が、MBA_IDに加え、RFAR制御装置
12aからの信号の組み合わせを使用する。非0のMB
A_IDは、データがそのIDに対応するリモート・セ
ンス・レジスタから到来することを示す。IDが0の場
合、データがRFARバッファまたはPMAインタフェ
ースのいずれから到来するかを決定するために、様々な
RFAR信号が使用される。これらの信号の1つである
PMA_DATA_RDY信号は、データがL3メモリ
から記憶制御装置に転送されている時間窓の間に、RF
AR制御装置12aにより生成される。この窓の間に、
応答優先23がRFAR符号化応答要求を処理できる場
合、データがRFARバッファをバイパスし、直接RS
Cインタフェースに転送され得る。他方、応答優先23
がグラントを要求元RFARに発行する以前に窓の終り
に達する場合、PMA_DATA_RDY信号が取り下
げられる。この時、XPT発生器81b論理が、RSC
インタフェースが使用可能になり、データをバッファか
らインタフェースに転送できるようになるまで、データ
をバッファに経路指定する。本発明のこの側面は、リモ
ート・クラスタへのCPフェッチの間、不要なバッファ
・ロード及びアンロードを排除することにより、一層シ
ステム性能を向上させる。
【0096】DRV_XPTのセット・アップに加え、
RFAR制御装置12aからの幾つかの信号が、データ
転送長の導出を可能にするCRF_XFR_LENバス
を構成する。返却データの場合、トリガ論理82b
が、"返却フェッチ・データ"を示すENC_RESP値
に結合される、応答優先ステーションからのRFARグ
ラントにより活動化される。これはDRV_XPTが、
RSC_XPTバスの別の半分上に解放されることを可
能にする。再度、転送長が1QWよりも大きい場合、X
PT制御装置83はカウンタが尽きるまで、連続的にR
SC_XPTを活動化する。
【0097】ここでRSCの非同期の性質は、頻繁な衝
突を導く点に注意を要する。こうした衝突は例えば、ロ
ーカルRSCがストア・オペレーションを開始しようと
する一方で、リモート・フェッチ・オペレーションのた
めに、同時にデータを返却しようとするなどである。デ
ータ経路上で衝突を回避する一方、性能を最大化するた
めに、XPT制御装置25は優先ステーションと密接に
相互作用し、常に可能であれば、返却フェッチ・データ
が優先権を有するように保証する。また、一旦データ経
路が使用中になると、優先ステーションは即時、データ
経路を要求しない新たなオペレーションの開始に集中
し、常に作業がクラスタ間で転送され続けるように努力
する。
【0098】ディセーブル・スイッチ:RSC資源レジ
スタの各々は、図7に示される1ビットのディセーブル
・ラッチ59fを含む。このラッチが'1'に走査される
と、資源のあらゆる組み合わせが永久に禁止される。更
に、これらのラッチはUBUSレジスタ内の4つのビッ
トを用いてセットされ得る。好適な実施例で示される記
憶制御装置は、一連のこれらのUBUSレジスタを含
み、それらはファームウェア及びCPミリコードを通じ
て、読出され、書込まれ、変更され得る。ディセーブル
・ラッチは、これらのミリコード制御式UBUSレジス
タの1つを介して制御されるので、RSC資源の動的な
ディセーブル化(すなわち使用不能にすること)が、ミ
リコード・ルーチンまたは一時的パッチの一部として達
成され得る。こうした用途の1つは、様々な作業負荷に
対する複製資源の効果を決定する比較性能分析である。
【0099】下位のコード・ポイント'1'x乃至'6'x
は、コード・ポイント'8'x乃至'F'xとは異なって作
用する。コード・ポイント'8'x乃至'F'xの呼び出し
は、RSC IC内の関連ディセーブル・ビットを活動
化することにより、単に選択資源をディセーブルする。
複数の資源の任意の所望の組み合わせの使用を禁止する
ため、連続的なUBUS書込みオペレーションが使用さ
れ得る。下位コード・ポイントはディセーブル状況を生
じ、それによりRSC IC内の優先論理がディセーブ
ル・モードをモニタし、インタフェース活動を適宜制限
する。例えば、モード'2'xが選択される場合、優先論
理は、第1のオペレーションが完了するまで、第2のオ
ペレーションが開始されないように保証する。
【0100】まとめとして、本発明の構成に関して以下
の事項を開示する。
【0101】(1)対称多重処理環境において資源を管
理するリモート資源管理システムであって、対称マルチ
プロセッサ・システムのクラスタ・ノード間のインタフ
ェースを有する、対称マルチプロセッサの複数のクラス
タと、ローカル・インタフェース及びローカル・インタ
フェース制御装置と、それぞれが前記ローカル・インタ
フェース制御装置を有する1つ以上のリモート記憶制御
装置と、ローカル−リモート間データ・バスと、複数の
プロセッサ、共用キャッシュ・メモリ、複数のI/Oア
ダプタ及び主メモリをそれぞれが有する、前記対称マル
チプロセッサの2つの前記クラスタ間のインタフェース
を管理するリモート資源マネージャとを含み、前記リモ
ート資源マネージャがリモート記憶制御装置により資源
を管理し、作業要求を開始したリクエスタの知識を必要
とすること無く、所望のオペレーションを実行するエー
ジェントとして作用する前記リモート制御装置に前記作
業を分配し、前記対称マルチプロセッサの前記クラスタ
間の絶え間の無い通信の必要無しに、リモート・リクエ
スタが作業処理のために使用可能な場合にだけ、前記作
業が転送される、リモート資源管理システム。 (2)待ち行列化された要求を優先順位付けするステッ
プと、新たなオペレーションを前記インタフェースを介
して送信するステップと、他の側からの返却応答を処理
するステップと、前記クラスタ間の全てのデータの転送
を監視するステップとを含む、インタフェース・タスク
の制御を担う各クラスタ上の1つのインタフェース・マ
クロを有し、前記ローカル・インタフェース制御装置
が、前記作業要求を前記リモート側に開始するだけでな
く、前記リモート側のフェッチ/ストア制御装置を管理
することにより、新たなオペレーションを使用可能な前
記リモート制御装置に即時経路指定し、それにより前記
リモート制御装置が、前記ローカル・インタフェース制
御装置のために作用するエージェントとなり、前記ロー
カル・インタフェース制御装置がリクエスタのために作
用し、オペレーションの所有者を識別する情報を送信す
る必要性を排除する、前記(1)記載のリモート資源管
理システム。 (3)幾つかのローカル・オペレーションが1つのアト
ミック・リモート・オペレーションと結合されることを
可能にする、コマンド再マップ化オペレーションを有す
る、前記(2)記載のリモート資源管理システム。 (4)データの読出し専用コピーのためのプロセッサ・
フェッチ要求、及び記憶保護キーを含む読出し専用デー
タのためのフェッチ要求が、前記リモート・クラスタ上
の前記フェッチ制御装置が、同一の状態図及びキャッシ
ュ管理オペレーションを使用するように要求し、前記イ
ンタフェース制御装置が前記両方の要求を、読出し専用
ライン・フェッチとして知られる、1つの単純化された
リモート記憶クラスタ(RSC)・インタフェース制御
装置コマンドに再マップすることにより、前記RSCイ
ンタフェース制御装置(RSC IC)により処理され
なければならないオペレーションの数を低減する、前記
(3)記載のリモート資源管理システム。 (5)ストア・データの転送が不必要にローカル−リモ
ート間データ・バスを拘束し、ディレクトリ情報を送信
するために追加の制御ラインが要求される場合、前記イ
ンタフェース制御装置がディレクトリ・ステータスにも
とづき、転送コマンドを"強制追放"コマンドまたは"読
出し専用無効"コマンドに再マップする、前記(4)記
載のリモート資源管理システム。 (6)1つ以上のパイプライン階層レベル・キャッシュ
をサービスする多数のフェッチ・リモート制御装置及び
ストア・リモート制御装置を含む、ハイエンド記憶サブ
システムを有するインタフェースを有し、一連の優先ス
テーションがインタフェースを介して送信される要求を
選択し、複数のパイプが関わる場合、各パイプ内の事前
優先ステーションが、RSC ICに転送されるフェッ
チ要求またはストア要求を選択し、同一のサイクルの
間、前記リモート記憶制御装置の前記インタフェース制
御装置が、優先オペレーションを用い、コマンド・タイ
プ及び資源可用性にもとづき、最適な要求を選択する、
前記(1)記載のリモート資源管理システム。 (7)前記優先オペレーションにおいて、前記複数のパ
イプが任意の所与のサイクルにおいて、前記インタフェ
ースの使用を要求できるので、リモート・フェッチ制御
装置が使用可能な限り、前記オペレーションがストアよ
りもフェッチを優先し、それ以外では、リモート・スト
ア制御装置が使用可能な限り、ストアが実行され、デー
タ経路を要求するこれらのストア・オペレーションのた
めに前記データ経路が使用可能となり、両方の要求がフ
ェッチで、両者が使用可能な資源を有する場合、ラウン
ド・ロビンが優遇される方の要求を決定し、両方の要求
がストアの場合、どちらのパイプが使用可能な資源を有
するかにより勝者が決定され、両方の要求が全て使用可
能な資源を有する場合、ラウンド・ロビンが使用され
る、前記(6)記載のリモート資源管理システム。 (8)各ローカル・インタフェース制御装置内に、リモ
ート側で待ち行列化される作業の送信のために、インタ
フェース・サイクルが浪費されないように保証する、リ
モート資源のマネージャを有する、前記(6)記載のリ
モート資源管理システム。 (9)各リモート記憶制御装置の前記ローカル・インタ
フェース制御装置が、同期応答バス及び非同期応答バス
の両方を用いて、キャッシュ・コヒーレンスを維持する
一方、性能を最大化し、非同期応答バスが、前記リモー
ト・オペレーションの公式な終了を示し、しばしばオリ
ジナル・リクエスタに転送される全ての最終応答のため
に使用され、前記最終応答が、ローカル・ディレクトリ
を適切な最終状態により更新することを可能にする変更
ライン情報によりタグ付けされる、前記(6)記載のリ
モート資源管理システム。 (10)前記リモート制御装置のインタフェース制御装
置マネージャが、全てのクラスタ−クラスタ間データ・
フローを管理し、前記ローカル・ストア制御装置からの
要求を、フェッチ・データを返却しようとする常駐リモ
ート・フェッチ制御装置からの要求と比較し、両者が前
記データ経路を競合するサイクルの間、優先権が返却フ
ェッチ・データに与えられ、フェッチ・データが前記リ
モート主メモリから獲得される場合、前記リモート制御
装置の前記インタフェース制御装置マネージャが、デー
タがメモリ・バンクからアクセスされるとき、対応する
前記データ経路をモニタ及び管理し、前記リモート記憶
制御装置のデータ経路が使用可能なとき、データが前記
リモート・フェッチ・バッファをバイパスし、データの
一時的バッファリングに関連付けられる正規の待ち時間
を低減する、前記(9)記載のリモート資源管理システ
ム。 (11)全体システム・スループットを向上するために
複製されたリモート記憶制御装置の資源の管理を向上す
るために、前記リモート制御装置の前記インタフェース
制御装置マネージャが、前記複製のリモート・フェッチ
資源の間の交互の作業要求により、リモート・キャッシ
ュをヒットする連続フェッチ要求を管理し、第2のフェ
ッチ要求を複製のリモート制御装置に、もしそれが使用
可能であれば送信し、前記複製のリモート制御装置がそ
のバッファのロードを開始することを可能にし、その
間、第1のリモート制御装置のバッファはまだそのデー
タ転送を完了中であり、前記第1のバッファ転送の完了
時に、第2のバッファが即時そのデータをインタフェー
スを介して転送することを可能にする、前記(9)記載
のリモート資源管理システム。 (12)前記リモート制御装置の前記インタフェース制
御装置マネージャが、相互クラスタ・デッドロックを生
じ得るオペレーション・シーケンスをモニタするために
設計されたデッドロック回避機構を管理し、こうした状
況を検出すると、前記リモート制御装置の前記インタフ
ェース制御装置マネージャが、特殊な拒絶応答を発信元
クラスタに返却することにより、保留のオペレーション
を拒絶し、前記リモート制御装置の前記インタフェース
制御装置が前記拒絶を発信元フェッチ/ストア制御装置
に転送し、それにより前記オペレーションが再試行さ
れ、前記デッドロック窓が消滅するまで連続的に拒絶さ
れ、再試行される、前記(9)記載のリモート資源管理
システム。 (13)新たなリモート記憶制御装置オペレーションを
伴う任意の制御情報において、インタフェース・パリテ
ィ・エラーが検出されるとき、同期インタフェースを用
いコマンドが送信された後、固定サイクル数以内にイン
タフェース・エラー・ステータスを送信し、エラーの場
合、発信元フェッチ/ストア制御装置がそれを通知さ
れ、続いて回復の適格性を決定し、前記リモート記憶制
御装置の前記インタフェース制御装置が自動的に対応す
るリモート記憶制御装置の資源をリセットし、前記オペ
レーションが再度要求されることを可能にする、前記
(9)記載のリモート資源管理システム。 (14)前記システムが、コマンドのスーパセットをよ
り小さく効率的なサブセットに再マップすることによ
り、前記リモート制御装置の複雑度を軽減し、不要なデ
ータ転送を回避することにより、インタフェース効率を
向上させる、コマンド再マップ化機構を含む、前記
(1)記載のリモート資源管理システム。 (15)前記コマンド再マップ化がフリップ・ビットを
用いて、要求されるゲート数を低減し、更に機能が1論
理サイクル内に実行されるようにすることにより、シス
テム性能を向上させる、前記(14)記載のリモート資
源管理システム。 (16)局所的に開始されたオペレーションと、アウト
バウンド・データ及びインバウンド・データが前記デー
タ・バスを共用することを可能にするリモート・リター
ンを処理する統一制御を提供することにより、インタフ
ェースI/Oを低減する一方、全体システム性能に関し
て、前記バスが高効率に管理されることを可能にする、
前記(6)記載のリモート資源管理システム。 (17)前記優先オペレーションが、前記要求及び前記
リモート記憶制御装置の資源を毎サイクルごとに動的に
分析し、フェッチ要求をストア要求に優先させ、局所的
に開始された要求及び遠隔的に開始されたオペレーショ
ンへの応答の両方、及びデータ経路を要求するオペレー
ションのデータ経路可用性を考慮し、適切な資源が使用
可能な場合にだけ、オペレーションが前記インタフェー
スを介して送信されるようにすることにより、システム
性能とインタフェース利用とを効率的に均衡させる、前
記(6)記載のリモート資源管理システム。 (18)前記リモート資源管理マネージャが、リモート
・キャッシュ内のディレクトリ・ミスに際して、資源を
固定時間内に自動的に解放するための同期相互問い合わ
せと、RSC ICがCPフェッチを探索中のパイプラ
インをモニタするための、前記CPフェッチのためのパ
イプ高速路指定とを提供し、前記CPフェッチの発見に
際して、該フェッチが前記RSC ICに提供される以
前に、LFAR制御装置にロードされなければならない
正規の場合よりも、前記フェッチを1サイクル前に開始
し、前記相互問い合わせが前記インタフェースを介して
送信されるのと同時に、ローカルPMAがデータのフェ
ッチを開始する早期PMAフェッチ/取り消しをサポー
トし、前記リモート・キャッシュ内のヒットに際して、
前記RSC ICが前記ローカルLFAR制御装置に、
前記早期PMAフェッチを取り消し、メモリ・インタリ
ーブを解放するように指示し、前記フェッチ・バッファ
が階層キャッシュ・アクセスをバイパスし、データが前
記階層キャッシュ(PMA)から受信されている間、前
記RSC ICがクラスタ−クラスタ間データ経路をモ
ニタし、前記データ経路が使用可能な場合、データが自
動的に前記フェッチ・バッファをバイパスし、前記PM
A受信ポートから直接RSCインタフェースに転送され
る、前記(1)記載のリモート資源管理システム。 (19)前記リモート資源管理マネージャが、1つのク
ロスポイント制御装置により、4ウェイ同時データ転送
が可能な4つのデータ経路を管理し、各前記データ経路
が、局所的に開始されるオペレーション及び遠隔的に開
始されるオペレーションを多重化することにより、前記
データ経路の可用性が、次のディスパッチ・オペレーシ
ョンを決定するために優先機構に伝送される、前記
(1)記載のリモート資源管理システム。 (20)前記リモート資源管理マネージャが、前記リモ
ート側が読出し専用無効において要求される全てのステ
ップを完了する以前に、前記ローカルLFAR制御装置
を解放し、前記LFAR制御装置が、リモート・オペレ
ーション及び続く読出し専用無効の送信を含む、新たな
オペレーションを開始できるようにする加速読出し専用
無効オペレーションと、インタフェース・パリティ・エ
ラーの場合、RSC資源を自動的にリセットし、関連す
るLFAR制御装置またはLSAR制御装置がオペレー
ションを再試行できるように前記制御装置へ通知する、
同期インタフェース・チェックの使用と、前記リモート
RFAR制御装置またはRSAR制御装置が潜在的デッ
ドロックを検出し、対応するLFAR制御装置またはL
SAR制御装置に拒絶応答を送信し、前記制御装置がオ
ペレーションを再試行することを可能にする、相互クラ
スタ・デッドロック回避手段と、連続的なデータ・フェ
ッチが、RFAR資源またはRSAR資源対の交互の資
源に分配されるようにし、前記資源対の両方のメンバが
使用可能な場合、先のフェッチの後続バイトがまだ他の
バッファ内で処理されている間に、後のフェッチがロー
ドを開始するためのリモート・バッファを有することを
保証する、RSC資源対の使用とを提供する、前記
(1)記載のリモート資源管理システム。
【図面の簡単な説明】
【図1】双節対称マルチプロセッサ・システムの1つの
記憶制御装置クラスタを示す図である。
【図2】リモート・クラスタから返却される全ての応答
トラフィックを処理する応答ハンドラ、詳細なインタフ
ェース、及びリモート記憶制御装置RSC IC10を
含むサブユニットと、リモート・フェッチ/ストア制御
装置12とRSC IC間のインタフェースを示す図で
ある。
【図3】コマンド変換のハードウェアの好適な実施例を
示す図である。
【図4】主コマンド優先ステーション33と、それに供
給するパイプライン優先ステーション32を含む、全体
優先ステーションを示す図である。
【図5】前述の機構とRSC優先ステーション21との
相互作用を示す論理ブロック図である。
【図6】コマンドが適切な資源保持レジスタにステージ
される様子を示す図である。
【図7】ディセーブル・ビット、有効ビット、コマンド
・レジスタ、オリジナル・リクエスタIDレジスタ、L
FSAR制御装置IDレジスタ、及びLFSARバッフ
ァ・レジスタを提供する、資源レジスタ59の1つのセ
ットの詳細図である。
【図8】ステージング機構と、応答ハンドラ22がステ
ージング機構を用い、XI応答を追跡する様子を示す図
である。
【図9】他のステージング・パイプラインと同様に作用
する、読出し専用無効ステージング・パイプライン75
を示す図である。
【図10】RSC IC内のクロスポイントを受信及び
駆動する1パイプラインの内部論理図である。
【符号の説明】
10 リモート記憶クラスタ・インタフェース制御装置
(RSC IC) 11 ローカル・フェッチ/ストア制御装置 12 リモート・フェッチ/ストア制御装置 15 中央処理ユニット制御装置 16 I/Oアダプタ制御装置 22 応答ハンドラ 23 応答優先 24、59 資源レジスタ 25 クロスポイント(XPT)制御装置 26 フリップ・ビット発生器 32 パイプライン事前優先ステーション 33 コマンド優先ステーション 35 資源トグル器 41 3ウェイ多重化 44、56 2ウェイ多重化 46、58 ゲートウェイ 53 CLCグラント 54 ORゲート 65 資源ロード・ラッチ 74 ROI多重化
───────────────────────────────────────────────────── フロントページの続き (72)発明者 マイケル・エイ・ブレイク アメリカ合衆国12590、ニューヨーク州ワ ッピンガーズ・フォールズ、セントラル・ アベニュー 3 (72)発明者 パク−キン・マク アメリカ合衆国12603、ニューヨーク州ポ キプシ、トロッター・レーン 7

Claims (20)

    【特許請求の範囲】
  1. 【請求項1】対称多重処理環境において資源を管理する
    リモート資源管理システムであって、 対称マルチプロセッサ・システムのクラスタ・ノード間
    のインタフェースを有する、対称マルチプロセッサの複
    数のクラスタと、 ローカル・インタフェース及びローカル・インタフェー
    ス制御装置と、 それぞれが前記ローカル・インタフェース制御装置を有
    する1つ以上のリモート記憶制御装置と、 ローカル−リモート間データ・バスと、 複数のプロセッサ、共用キャッシュ・メモリ、複数のI
    /Oアダプタ及び主メモリをそれぞれが有する、前記対
    称マルチプロセッサの2つの前記クラスタ間のインタフ
    ェースを管理するリモート資源マネージャとを含み、前
    記リモート資源マネージャがリモート記憶制御装置によ
    り資源を管理し、作業要求を開始したリクエスタの知識
    を必要とすること無く、所望のオペレーションを実行す
    るエージェントとして作用する前記リモート制御装置に
    前記作業を分配し、前記対称マルチプロセッサの前記ク
    ラスタ間の絶え間の無い通信の必要無しに、リモート・
    リクエスタが作業処理のために使用可能な場合にだけ、
    前記作業が転送される、リモート資源管理システム。
  2. 【請求項2】待ち行列化された要求を優先順位付けする
    ステップと、新たなオペレーションを前記インタフェー
    スを介して送信するステップと、他の側からの返却応答
    を処理するステップと、前記クラスタ間の全てのデータ
    の転送を監視するステップとを含む、インタフェース・
    タスクの制御を担う各クラスタ上の1つのインタフェー
    ス・マクロを有し、前記ローカル・インタフェース制御
    装置が、前記作業要求を前記リモート側に開始するだけ
    でなく、前記リモート側のフェッチ/ストア制御装置を
    管理することにより、新たなオペレーションを使用可能
    な前記リモート制御装置に即時経路指定し、それにより
    前記リモート制御装置が、前記ローカル・インタフェー
    ス制御装置のために作用するエージェントとなり、前記
    ローカル・インタフェース制御装置がリクエスタのため
    に作用し、オペレーションの所有者を識別する情報を送
    信する必要性を排除する、請求項1記載のリモート資源
    管理システム。
  3. 【請求項3】幾つかのローカル・オペレーションが1つ
    のアトミック・リモート・オペレーションと結合される
    ことを可能にする、コマンド再マップ化オペレーション
    を有する、請求項2記載のリモート資源管理システム。
  4. 【請求項4】データの読出し専用コピーのためのプロセ
    ッサ・フェッチ要求、及び記憶保護キーを含む読出し専
    用データのためのフェッチ要求が、前記リモート・クラ
    スタ上の前記フェッチ制御装置が、同一の状態図及びキ
    ャッシュ管理オペレーションを使用するように要求し、
    前記インタフェース制御装置が前記両方の要求を、読出
    し専用ライン・フェッチとして知られる、1つの単純化
    されたリモート記憶クラスタ(RSC)・インタフェー
    ス制御装置コマンドに再マップすることにより、前記R
    SCインタフェース制御装置(RSC IC)により処
    理されなければならないオペレーションの数を低減す
    る、請求項3記載のリモート資源管理システム。
  5. 【請求項5】ストア・データの転送が不必要にローカル
    −リモート間データ・バスを拘束し、ディレクトリ情報
    を送信するために追加の制御ラインが要求される場合、
    前記インタフェース制御装置がディレクトリ・ステータ
    スにもとづき、転送コマンドを"強制追放"コマンドまた
    は"読出し専用無効"コマンドに再マップする、請求項4
    記載のリモート資源管理システム。
  6. 【請求項6】1つ以上のパイプライン階層レベル・キャ
    ッシュをサービスする多数のフェッチ・リモート制御装
    置及びストア・リモート制御装置を含む、ハイエンド記
    憶サブシステムを有するインタフェースを有し、一連の
    優先ステーションがインタフェースを介して送信される
    要求を選択し、複数のパイプが関わる場合、各パイプ内
    の事前優先ステーションが、RSC ICに転送される
    フェッチ要求またはストア要求を選択し、同一のサイク
    ルの間、前記リモート記憶制御装置の前記インタフェー
    ス制御装置が、優先オペレーションを用い、コマンド・
    タイプ及び資源可用性にもとづき、最適な要求を選択す
    る、請求項1記載のリモート資源管理システム。
  7. 【請求項7】前記優先オペレーションにおいて、前記複
    数のパイプが任意の所与のサイクルにおいて、前記イン
    タフェースの使用を要求できるので、リモート・フェッ
    チ制御装置が使用可能な限り、前記オペレーションがス
    トアよりもフェッチを優先し、それ以外では、リモート
    ・ストア制御装置が使用可能な限り、ストアが実行さ
    れ、データ経路を要求するこれらのストア・オペレーシ
    ョンのために前記データ経路が使用可能となり、両方の
    要求がフェッチで、両者が使用可能な資源を有する場
    合、ラウンド・ロビンが優遇される方の要求を決定し、
    両方の要求がストアの場合、どちらのパイプが使用可能
    な資源を有するかにより勝者が決定され、両方の要求が
    全て使用可能な資源を有する場合、ラウンド・ロビンが
    使用される、請求項6記載のリモート資源管理システ
    ム。
  8. 【請求項8】各ローカル・インタフェース制御装置内
    に、リモート側で待ち行列化される作業の送信のため
    に、インタフェース・サイクルが浪費されないように保
    証する、リモート資源のマネージャを有する、請求項6
    記載のリモート資源管理システム。
  9. 【請求項9】各リモート記憶制御装置の前記ローカル・
    インタフェース制御装置が、同期応答バス及び非同期応
    答バスの両方を用いて、キャッシュ・コヒーレンスを維
    持する一方、性能を最大化し、非同期応答バスが、前記
    リモート・オペレーションの公式な終了を示し、しばし
    ばオリジナル・リクエスタに転送される全ての最終応答
    のために使用され、前記最終応答が、ローカル・ディレ
    クトリを適切な最終状態により更新することを可能にす
    る変更ライン情報によりタグ付けされる、請求項6記載
    のリモート資源管理システム。
  10. 【請求項10】前記リモート制御装置のインタフェース
    制御装置マネージャが、全てのクラスタ−クラスタ間デ
    ータ・フローを管理し、前記ローカル・ストア制御装置
    からの要求を、フェッチ・データを返却しようとする常
    駐リモート・フェッチ制御装置からの要求と比較し、両
    者が前記データ経路を競合するサイクルの間、優先権が
    返却フェッチ・データに与えられ、フェッチ・データが
    前記リモート主メモリから獲得される場合、前記リモー
    ト制御装置の前記インタフェース制御装置マネージャ
    が、データがメモリ・バンクからアクセスされるとき、
    対応する前記データ経路をモニタ及び管理し、前記リモ
    ート記憶制御装置のデータ経路が使用可能なとき、デー
    タが前記リモート・フェッチ・バッファをバイパスし、
    データの一時的バッファリングに関連付けられる正規の
    待ち時間を低減する、請求項9記載のリモート資源管理
    システム。
  11. 【請求項11】全体システム・スループットを向上する
    ために複製されたリモート記憶制御装置の資源の管理を
    向上するために、前記リモート制御装置の前記インタフ
    ェース制御装置マネージャが、前記複製のリモート・フ
    ェッチ資源の間の交互の作業要求により、リモート・キ
    ャッシュをヒットする連続フェッチ要求を管理し、第2
    のフェッチ要求を複製のリモート制御装置に、もしそれ
    が使用可能であれば送信し、前記複製のリモート制御装
    置がそのバッファのロードを開始することを可能にし、
    その間、第1のリモート制御装置のバッファはまだその
    データ転送を完了中であり、前記第1のバッファ転送の
    完了時に、第2のバッファが即時そのデータをインタフ
    ェースを介して転送することを可能にする、請求項9記
    載のリモート資源管理システム。
  12. 【請求項12】前記リモート制御装置の前記インタフェ
    ース制御装置マネージャが、相互クラスタ・デッドロッ
    クを生じ得るオペレーション・シーケンスをモニタする
    ために設計されたデッドロック回避機構を管理し、こう
    した状況を検出すると、前記リモート制御装置の前記イ
    ンタフェース制御装置マネージャが、特殊な拒絶応答を
    発信元クラスタに返却することにより、保留のオペレー
    ションを拒絶し、前記リモート制御装置の前記インタフ
    ェース制御装置が前記拒絶を発信元フェッチ/ストア制
    御装置に転送し、それにより前記オペレーションが再試
    行され、前記デッドロック窓が消滅するまで連続的に拒
    絶され、再試行される、請求項9記載のリモート資源管
    理システム。
  13. 【請求項13】新たなリモート記憶制御装置オペレーシ
    ョンを伴う任意の制御情報において、インタフェース・
    パリティ・エラーが検出されるとき、同期インタフェー
    スを用いコマンドが送信された後、固定サイクル数以内
    にインタフェース・エラー・ステータスを送信し、エラ
    ーの場合、発信元フェッチ/ストア制御装置がそれを通
    知され、続いて回復の適格性を決定し、前記リモート記
    憶制御装置の前記インタフェース制御装置が自動的に対
    応するリモート記憶制御装置の資源をリセットし、前記
    オペレーションが再度要求されることを可能にする、請
    求項9記載のリモート資源管理システム。
  14. 【請求項14】前記システムが、コマンドのスーパセッ
    トをより小さく効率的なサブセットに再マップすること
    により、前記リモート制御装置の複雑度を軽減し、不要
    なデータ転送を回避することにより、インタフェース効
    率を向上させる、コマンド再マップ化機構を含む、請求
    項1記載のリモート資源管理システム。
  15. 【請求項15】前記コマンド再マップ化がフリップ・ビ
    ットを用いて、要求されるゲート数を低減し、更に機能
    が1論理サイクル内に実行されるようにすることによ
    り、システム性能を向上させる、請求項14記載のリモ
    ート資源管理システム。
  16. 【請求項16】局所的に開始されたオペレーションと、
    アウトバウンド・データ及びインバウンド・データが前
    記データ・バスを共用することを可能にするリモート・
    リターンを処理する統一制御を提供することにより、イ
    ンタフェースI/Oを低減する一方、全体システム性能
    に関して、前記バスが高効率に管理されることを可能に
    する、請求項6記載のリモート資源管理システム。
  17. 【請求項17】前記優先オペレーションが、前記要求及
    び前記リモート記憶制御装置の資源を毎サイクルごとに
    動的に分析し、フェッチ要求をストア要求に優先させ、
    局所的に開始された要求及び遠隔的に開始されたオペレ
    ーションへの応答の両方、及びデータ経路を要求するオ
    ペレーションのデータ経路可用性を考慮し、適切な資源
    が使用可能な場合にだけ、オペレーションが前記インタ
    フェースを介して送信されるようにすることにより、シ
    ステム性能とインタフェース利用とを効率的に均衡させ
    る、請求項6記載のリモート資源管理システム。
  18. 【請求項18】前記リモート資源管理マネージャが、リ
    モート・キャッシュ内のディレクトリ・ミスに際して、
    資源を固定時間内に自動的に解放するための同期相互問
    い合わせと、RSC ICがCPフェッチを探索中のパ
    イプラインをモニタするための、前記CPフェッチのた
    めのパイプ高速路指定とを提供し、前記CPフェッチの
    発見に際して、該フェッチが前記RSC ICに提供さ
    れる以前に、LFAR制御装置にロードされなければな
    らない正規の場合よりも、前記フェッチを1サイクル前
    に開始し、前記相互問い合わせが前記インタフェースを
    介して送信されるのと同時に、ローカルPMAがデータ
    のフェッチを開始する早期PMAフェッチ/取り消しを
    サポートし、前記リモート・キャッシュ内のヒットに際
    して、前記RSC ICが前記ローカルLFAR制御装
    置に、前記早期PMAフェッチを取り消し、メモリ・イ
    ンタリーブを解放するように指示し、前記フェッチ・バ
    ッファが階層キャッシュ・アクセスをバイパスし、デー
    タが前記階層キャッシュ(PMA)から受信されている
    間、前記RSC ICがクラスタ−クラスタ間データ経
    路をモニタし、前記データ経路が使用可能な場合、デー
    タが自動的に前記フェッチ・バッファをバイパスし、前
    記PMA受信ポートから直接RSCインタフェースに転
    送される、請求項1記載のリモート資源管理システム。
  19. 【請求項19】前記リモート資源管理マネージャが、1
    つのクロスポイント制御装置により、4ウェイ同時デー
    タ転送が可能な4つのデータ経路を管理し、各前記デー
    タ経路が、局所的に開始されるオペレーション及び遠隔
    的に開始されるオペレーションを多重化することによ
    り、前記データ経路の可用性が、次のディスパッチ・オ
    ペレーションを決定するために優先機構に伝送される、
    請求項1記載のリモート資源管理システム。
  20. 【請求項20】前記リモート資源管理マネージャが、 前記リモート側が読出し専用無効において要求される全
    てのステップを完了する以前に、前記ローカルLFAR
    制御装置を解放し、前記LFAR制御装置が、リモート
    ・オペレーション及び続く読出し専用無効の送信を含
    む、新たなオペレーションを開始できるようにする加速
    読出し専用無効オペレーションと、 インタフェース・パリティ・エラーの場合、RSC資源
    を自動的にリセットし、関連するLFAR制御装置また
    はLSAR制御装置がオペレーションを再試行できるよ
    うに前記制御装置へ通知する、同期インタフェース・チ
    ェックの使用と、 前記リモートRFAR制御装置またはRSAR制御装置
    が潜在的デッドロックを検出し、対応するLFAR制御
    装置またはLSAR制御装置に拒絶応答を送信し、前記
    制御装置がオペレーションを再試行することを可能にす
    る、相互クラスタ・デッドロック回避手段と、 連続的なデータ・フェッチが、RFAR資源またはRS
    AR資源対の交互の資源に分配されるようにし、前記資
    源対の両方のメンバが使用可能な場合、先のフェッチの
    後続バイトがまだ他のバッファ内で処理されている間
    に、後のフェッチがロードを開始するためのリモート・
    バッファを有することを保証する、RSC資源対の使用
    とを提供する、請求項1記載のリモート資源管理システ
    ム。
JP07553199A 1998-03-23 1999-03-19 リモート資源管理システム Expired - Lifetime JP3589394B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/046430 1998-03-23
US09/046,430 US6038651A (en) 1998-03-23 1998-03-23 SMP clusters with remote resource managers for distributing work to other clusters while reducing bus traffic to a minimum

Publications (2)

Publication Number Publication Date
JP2000076130A true JP2000076130A (ja) 2000-03-14
JP3589394B2 JP3589394B2 (ja) 2004-11-17

Family

ID=21943414

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07553199A Expired - Lifetime JP3589394B2 (ja) 1998-03-23 1999-03-19 リモート資源管理システム

Country Status (6)

Country Link
US (1) US6038651A (ja)
EP (1) EP0945798A3 (ja)
JP (1) JP3589394B2 (ja)
KR (1) KR100297908B1 (ja)
CN (1) CN1133943C (ja)
CA (1) CA2262314C (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002533813A (ja) * 1998-12-21 2002-10-08 アドバンスト・マイクロ・ディバイシズ・インコーポレイテッド メモリキャンセルメッセージを用いたシステムメモリ帯域幅の節約およびキャッシュコヒーレンシ維持
JP2015512102A (ja) * 2012-03-02 2015-04-23 エイアールエム リミテッド 第1および第2のプロトコルドメインを有するデータ処理装置およびデータ処理装置に関する方法

Families Citing this family (122)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001515243A (ja) * 1997-09-05 2001-09-18 サン・マイクロシステムズ・インコーポレーテッド クラスタ保護メカニズムを使用する多重処理コンピュータ・システム
JP3636871B2 (ja) * 1997-09-16 2005-04-06 株式会社日立製作所 並列プロセッサシステム
JP3858492B2 (ja) 1998-12-28 2006-12-13 株式会社日立製作所 マルチプロセッサシステム
WO2001009776A1 (en) * 1999-08-02 2001-02-08 Tae Gyu Lee Remote saving method of the search information on the internet
US7996843B2 (en) * 1999-08-25 2011-08-09 Qnx Software Systems Gmbh & Co. Kg Symmetric multi-processor system
US6920519B1 (en) 2000-05-10 2005-07-19 International Business Machines Corporation System and method for supporting access to multiple I/O hub nodes in a host bridge
US6826619B1 (en) 2000-08-21 2004-11-30 Intel Corporation Method and apparatus for preventing starvation in a multi-node architecture
US6751721B1 (en) * 2000-08-31 2004-06-15 Hewlett-Packard Development Company, L.P. Broadcast invalidate scheme
US6487643B1 (en) 2000-09-29 2002-11-26 Intel Corporation Method and apparatus for preventing starvation in a multi-node architecture
US6671793B1 (en) 2000-10-02 2003-12-30 International Business Machines Corporation Method and system for managing the result from a translator co-processor in a pipelined processor
US6640289B2 (en) * 2000-11-15 2003-10-28 Unisys Corporation Software controlled cache line ownership affinity enhancements in a multiprocessor environment
US6772298B2 (en) 2000-12-20 2004-08-03 Intel Corporation Method and apparatus for invalidating a cache line without data return in a multi-node architecture
US6738871B2 (en) * 2000-12-22 2004-05-18 International Business Machines Corporation Method for deadlock avoidance in a cluster environment
US6738872B2 (en) * 2000-12-22 2004-05-18 International Business Machines Corporation Clustered computer system with deadlock avoidance
US6738870B2 (en) * 2000-12-22 2004-05-18 International Business Machines Corporation High speed remote storage controller
US7234029B2 (en) * 2000-12-28 2007-06-19 Intel Corporation Method and apparatus for reducing memory latency in a cache coherent multi-node architecture
US6791412B2 (en) * 2000-12-28 2004-09-14 Intel Corporation Differential amplifier output stage
US20020087766A1 (en) * 2000-12-29 2002-07-04 Akhilesh Kumar Method and apparatus to implement a locked-bus transaction
US6721918B2 (en) 2000-12-29 2004-04-13 Intel Corporation Method and apparatus for encoding a bus to minimize simultaneous switching outputs effect
US20020087775A1 (en) * 2000-12-29 2002-07-04 Looi Lily P. Apparatus and method for interrupt delivery
US6785773B2 (en) * 2001-03-29 2004-08-31 International Business Machines Corporation Verification of global coherence in a multi-node NUMA system
US6918021B2 (en) * 2001-05-10 2005-07-12 Hewlett-Packard Development Company, L.P. System of and method for flow control within a tag pipeline
US6785758B1 (en) * 2001-06-01 2004-08-31 Advanced Micro Devices, Inc. System and method for machine specific register addressing in a split transactional unidirectional bus architecture
US7159216B2 (en) * 2001-11-07 2007-01-02 International Business Machines Corporation Method and apparatus for dispatching tasks in a non-uniform memory access (NUMA) computer system
US20030101160A1 (en) * 2001-11-26 2003-05-29 International Business Machines Corporation Method for safely accessing shared storage
DE10164338A1 (de) * 2001-12-28 2003-07-17 Thomson Brandt Gmbh Verfahren zur Einstellung eines Betriebsparameters in einem Peripherie-IC und Vorrichtung zur Durchführung des Verfahrens
US7792978B2 (en) 2001-12-28 2010-09-07 At&T Intellectual Property I, L.P. System and method to remotely manage and audit set top box resources
US7219121B2 (en) * 2002-03-29 2007-05-15 Microsoft Corporation Symmetrical multiprocessing in multiprocessor systems
US8103748B2 (en) * 2002-05-20 2012-01-24 International Business Machines Corporation Rule-based method and system for managing heterogenous computer clusters
US7155525B2 (en) * 2002-05-28 2006-12-26 Newisys, Inc. Transaction management in systems having multiple multi-processor clusters
US7103636B2 (en) * 2002-05-28 2006-09-05 Newisys, Inc. Methods and apparatus for speculative probing of a remote cluster
US7281055B2 (en) * 2002-05-28 2007-10-09 Newisys, Inc. Routing mechanisms in systems having multiple multi-processor clusters
US7243282B2 (en) * 2002-07-29 2007-07-10 Hewlett-Packard Development Company, L.P. Method and apparatus for implementing multiple remote diagnose register chains
US20040039816A1 (en) * 2002-08-23 2004-02-26 International Business Machines Corporation Monitoring method of the remotely accessible resources to provide the persistent and consistent resource states
US7577755B2 (en) * 2002-11-19 2009-08-18 Newisys, Inc. Methods and apparatus for distributing system management signals
US7228351B2 (en) * 2002-12-31 2007-06-05 International Business Machines Corporation Method and apparatus for managing resource contention in a multisystem cluster
US20040139142A1 (en) * 2002-12-31 2004-07-15 International Business Machines Corporation Method and apparatus for managing resource contention
US7047370B1 (en) * 2003-01-14 2006-05-16 Cisco Technology, Inc. Full access to memory interfaces via remote request
US7380082B2 (en) * 2003-03-25 2008-05-27 Emc Corporation Reading virtual ordered writes at local storage device
US20040199727A1 (en) * 2003-04-02 2004-10-07 Narad Charles E. Cache allocation
US7383336B2 (en) 2003-04-24 2008-06-03 International Business Machines Corporation Distributed shared resource management
US7085897B2 (en) * 2003-05-12 2006-08-01 International Business Machines Corporation Memory management for a symmetric multiprocessor computer system
US7437728B2 (en) * 2003-06-12 2008-10-14 Microsoft Corporation System and method for CPU bandwidth allocation
US7386626B2 (en) * 2003-06-23 2008-06-10 Newisys, Inc. Bandwidth, framing and error detection in communications between multi-processor clusters of multi-cluster computer systems
US7577727B2 (en) 2003-06-27 2009-08-18 Newisys, Inc. Dynamic multiple cluster system reconfiguration
US7117419B2 (en) * 2003-08-05 2006-10-03 Newisys, Inc. Reliable communication between multi-processor clusters of multi-cluster computer systems
US7159137B2 (en) * 2003-08-05 2007-01-02 Newisys, Inc. Synchronized communication between multi-processor clusters of multi-cluster computer systems
US7395347B2 (en) * 2003-08-05 2008-07-01 Newisys, Inc, Communication between and within multi-processor clusters of multi-cluster computer systems
US7103823B2 (en) * 2003-08-05 2006-09-05 Newisys, Inc. Communication between multi-processor clusters of multi-cluster computer systems
US7426578B2 (en) 2003-12-12 2008-09-16 Intercall, Inc. Systems and methods for synchronizing data between communication devices in a networked environment
US7590845B2 (en) * 2003-12-22 2009-09-15 Lenovo Singapore Pte. Ltd. Key cache management through multiple localities
US7380039B2 (en) 2003-12-30 2008-05-27 3Tera, Inc. Apparatus, method and system for aggregrating computing resources
US7757033B1 (en) 2004-02-13 2010-07-13 Habanero Holdings, Inc. Data exchanges among SMP physical partitions and I/O interfaces enterprise servers
US7664110B1 (en) 2004-02-07 2010-02-16 Habanero Holdings, Inc. Input/output controller for coupling the processor-memory complex to the fabric in fabric-backplane interprise servers
US7860097B1 (en) 2004-02-13 2010-12-28 Habanero Holdings, Inc. Fabric-backplane enterprise servers with VNICs and VLANs
US7860961B1 (en) 2004-02-13 2010-12-28 Habanero Holdings, Inc. Real time notice of new resources for provisioning and management of fabric-backplane enterprise servers
US7685281B1 (en) 2004-02-13 2010-03-23 Habanero Holdings, Inc. Programmatic instantiation, provisioning and management of fabric-backplane enterprise servers
US7843907B1 (en) 2004-02-13 2010-11-30 Habanero Holdings, Inc. Storage gateway target for fabric-backplane enterprise servers
US7990994B1 (en) 2004-02-13 2011-08-02 Habanero Holdings, Inc. Storage gateway provisioning and configuring
US7633955B1 (en) 2004-02-13 2009-12-15 Habanero Holdings, Inc. SCSI transport for fabric-backplane enterprise servers
US8868790B2 (en) 2004-02-13 2014-10-21 Oracle International Corporation Processor-memory module performance acceleration in fabric-backplane enterprise servers
US7843906B1 (en) 2004-02-13 2010-11-30 Habanero Holdings, Inc. Storage gateway initiator for fabric-backplane enterprise servers
US8145785B1 (en) * 2004-02-13 2012-03-27 Habanero Holdings, Inc. Unused resource recognition in real time for provisioning and management of fabric-backplane enterprise servers
US7873693B1 (en) 2004-02-13 2011-01-18 Habanero Holdings, Inc. Multi-chassis fabric-backplane enterprise servers
US7953903B1 (en) 2004-02-13 2011-05-31 Habanero Holdings, Inc. Real time detection of changed resources for provisioning and management of fabric-backplane enterprise servers
US8112584B1 (en) * 2004-06-28 2012-02-07 Cisco Technology, Inc Storage controller performing a set of multiple operations on cached data with a no-miss guarantee until all of the operations are complete
US20140067771A2 (en) * 2004-07-09 2014-03-06 International Business Machines Corporation Management of a Scalable Computer System
US8713295B2 (en) 2004-07-12 2014-04-29 Oracle International Corporation Fabric-backplane enterprise servers with pluggable I/O sub-system
US7840731B2 (en) * 2004-08-25 2010-11-23 Cisco Technology, Inc. Accelerated data switching on symmetric multiprocessor systems using port affinity
US8254411B2 (en) * 2005-02-10 2012-08-28 International Business Machines Corporation Data processing system, method and interconnect fabric having a flow governor
US20060176890A1 (en) * 2005-02-10 2006-08-10 International Business Machines Corporation Data processing system, method and interconnect fabric for improved communication in a data processing system
US8230178B2 (en) * 2005-02-10 2012-07-24 International Business Machines Corporation Data processing system and method for efficient coherency communication utilizing coherency domain indicators
US7765405B2 (en) * 2005-02-25 2010-07-27 Microsoft Corporation Receive side scaling with cryptographically secure hashing
CN1317447C (zh) * 2005-05-09 2007-05-23 烟台万华超纤股份有限公司 一种阻燃性聚氨酯合成革及其制备方法
US8429630B2 (en) 2005-09-15 2013-04-23 Ca, Inc. Globally distributed utility computing cloud
JP4584124B2 (ja) * 2005-11-24 2010-11-17 エヌイーシーコンピュータテクノ株式会社 情報処理装置およびそのエラー処理方法ならびに制御プログラム
US7587543B2 (en) * 2006-01-23 2009-09-08 International Business Machines Corporation Apparatus, method and computer program product for dynamic arbitration control
US20080022079A1 (en) * 2006-07-24 2008-01-24 Archer Charles J Executing an allgather operation with an alltoallv operation in a parallel computer
US8495308B2 (en) * 2006-10-09 2013-07-23 International Business Machines Corporation Processor, data processing system and method supporting a shared global coherency state
US8161480B2 (en) 2007-05-29 2012-04-17 International Business Machines Corporation Performing an allreduce operation using shared memory
US20090006663A1 (en) * 2007-06-27 2009-01-01 Archer Charles J Direct Memory Access ('DMA') Engine Assisted Local Reduction
KR20090004266A (ko) * 2007-07-06 2009-01-12 한국전자통신연구원 자체 제어 기능을 갖는 기능 모듈 및 이의 동작 제어방법과, 이를 이용한 시스템
US7818504B2 (en) * 2007-09-26 2010-10-19 International Business Machines Corporation Storage system that prioritizes storage requests
US8422402B2 (en) 2008-04-01 2013-04-16 International Business Machines Corporation Broadcasting a message in a parallel computer
US8484440B2 (en) 2008-05-21 2013-07-09 International Business Machines Corporation Performing an allreduce operation on a plurality of compute nodes of a parallel computer
US7836185B2 (en) * 2008-06-27 2010-11-16 International Business Machines Corporation Common resource management in a server cluster
US8281053B2 (en) 2008-07-21 2012-10-02 International Business Machines Corporation Performing an all-to-all data exchange on a plurality of data buffers by performing swap operations
KR20100026509A (ko) * 2008-08-29 2010-03-10 삼성전자주식회사 복수의 데이터 플로우를 전송하는 반도체 장치
US9384042B2 (en) * 2008-12-16 2016-07-05 International Business Machines Corporation Techniques for dynamically assigning jobs to processors in a cluster based on inter-thread communications
US9396021B2 (en) * 2008-12-16 2016-07-19 International Business Machines Corporation Techniques for dynamically assigning jobs to processors in a cluster using local job tables
US8122132B2 (en) * 2008-12-16 2012-02-21 International Business Machines Corporation Techniques for dynamically assigning jobs to processors in a cluster based on broadcast information
US8239524B2 (en) 2008-12-16 2012-08-07 International Business Machines Corporation Techniques for dynamically assigning jobs to processors in a cluster based on processor workload
US20110145837A1 (en) * 2009-12-14 2011-06-16 Bower Kenneth S Filtering Broadcast Recipients In A Multiprocessing Environment
US8332460B2 (en) 2010-04-14 2012-12-11 International Business Machines Corporation Performing a local reduction operation on a parallel computer
US9424087B2 (en) 2010-04-29 2016-08-23 International Business Machines Corporation Optimizing collective operations
US8949577B2 (en) 2010-05-28 2015-02-03 International Business Machines Corporation Performing a deterministic reduction operation in a parallel computer
US8688880B2 (en) * 2010-06-23 2014-04-01 International Business Machines Corporation Centralized serialization of requests in a multiprocessor system
US8776081B2 (en) 2010-09-14 2014-07-08 International Business Machines Corporation Send-side matching of data communications messages
US8566841B2 (en) 2010-11-10 2013-10-22 International Business Machines Corporation Processing communications events in parallel active messaging interface by awakening thread from wait state
US8635411B2 (en) 2011-07-18 2014-01-21 Arm Limited Data processing apparatus and method for managing coherency of cached data
US8893083B2 (en) 2011-08-09 2014-11-18 International Business Machines Coporation Collective operation protocol selection in a parallel computer
US8910178B2 (en) 2011-08-10 2014-12-09 International Business Machines Corporation Performing a global barrier operation in a parallel computer
US8667501B2 (en) 2011-08-10 2014-03-04 International Business Machines Corporation Performing a local barrier operation
US8996718B2 (en) * 2012-02-02 2015-03-31 Apple Inc. TCP-aware receive side coalescing
US9495135B2 (en) 2012-02-09 2016-11-15 International Business Machines Corporation Developing collective operations for a parallel computer
US8706847B2 (en) 2012-02-09 2014-04-22 International Business Machines Corporation Initiating a collective operation in a parallel computer
KR101366967B1 (ko) 2012-06-12 2014-02-25 엘에스산전 주식회사 메모리 공유 회로
CN102880585B (zh) * 2012-09-28 2015-05-06 无锡江南计算技术研究所 用于具有多个处理器核心的处理器系统的同步器
US9561469B2 (en) * 2014-03-24 2017-02-07 Johnson Matthey Public Limited Company Catalyst for treating exhaust gas
US9858189B2 (en) * 2015-06-24 2018-01-02 International Business Machines Corporation Hybrid tracking of transaction read and write sets
US9760494B2 (en) 2015-06-24 2017-09-12 International Business Machines Corporation Hybrid tracking of transaction read and write sets
US10642780B2 (en) 2016-03-07 2020-05-05 Mellanox Technologies, Ltd. Atomic access to object pool over RDMA transport network
US10387415B2 (en) * 2016-06-28 2019-08-20 International Business Machines Corporation Data arrangement management in a distributed data cluster environment of a shared pool of configurable computing resources
US10380034B2 (en) * 2017-07-14 2019-08-13 International Business Machines Corporation Cache return order optimization
US10552367B2 (en) 2017-07-26 2020-02-04 Mellanox Technologies, Ltd. Network data transactions using posted and non-posted operations
US11163489B2 (en) * 2018-05-23 2021-11-02 SK Hynix Inc. Workload clusterization for memory system and method of executing the same
CN109388609B (zh) * 2018-09-30 2020-02-21 中科驭数(北京)科技有限公司 基于加速核的数据处理方法和装置
US10802966B2 (en) 2019-02-14 2020-10-13 International Business Machines Corporation Simultaneous, non-atomic request processing within an SMP environment broadcast scope for multiply-requested data elements using real-time parallelization
JP6894459B2 (ja) * 2019-02-25 2021-06-30 華邦電子股▲ふん▼有限公司Winbond Electronics Corp. 疑似スタティックランダムアクセスメモリとその動作方法
US11099905B2 (en) 2019-02-26 2021-08-24 International Business Machines Corporation Efficient remote resource allocation within an SMP broadcast scope maintaining fairness between operation types
CN111367672A (zh) * 2020-03-05 2020-07-03 北京奇艺世纪科技有限公司 数据缓存方法、装置、电子设备及计算机存储介质
CN115114188B (zh) * 2022-06-23 2023-04-07 云南大学 一种嵌入式处理器高速缓存器结构及控制方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4156907A (en) * 1977-03-02 1979-05-29 Burroughs Corporation Data communications subsystem
US4200930A (en) * 1977-05-23 1980-04-29 Burroughs Corporation Adapter cluster module for data communications subsystem
US4570220A (en) 1983-11-25 1986-02-11 Intel Corporation High speed parallel bus and data transfer method
US5204954A (en) * 1987-11-18 1993-04-20 International Business Machines Corporation Remote storage management mechanism and method
US4939724A (en) * 1988-12-29 1990-07-03 Intel Corporation Cluster link interface for a local area network
US5197130A (en) * 1989-12-29 1993-03-23 Supercomputer Systems Limited Partnership Cluster architecture for a highly parallel scalar/vector multiprocessor system
US5168547A (en) * 1989-12-29 1992-12-01 Supercomputer Systems Limited Partnership Distributed architecture for input/output for a multiprocessor system
US5513325A (en) * 1992-12-23 1996-04-30 Unisys Corporation Technique for coupling CTOS units to non-CTOS host
JPH08235092A (ja) * 1995-02-22 1996-09-13 Kofu Nippon Denki Kk データ転送制御装置
US6105053A (en) * 1995-06-23 2000-08-15 Emc Corporation Operating system for a non-uniform memory access multiprocessor system
US5887146A (en) * 1995-08-14 1999-03-23 Data General Corporation Symmetric multiprocessing computer with non-uniform memory access architecture
US5784697A (en) * 1996-03-27 1998-07-21 International Business Machines Corporation Process assignment by nodal affinity in a myultiprocessor system having non-uniform memory access storage architecture
US5878268A (en) * 1996-07-01 1999-03-02 Sun Microsystems, Inc. Multiprocessing system configured to store coherency state within multiple subnodes of a processing node

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002533813A (ja) * 1998-12-21 2002-10-08 アドバンスト・マイクロ・ディバイシズ・インコーポレイテッド メモリキャンセルメッセージを用いたシステムメモリ帯域幅の節約およびキャッシュコヒーレンシ維持
JP4718012B2 (ja) * 1998-12-21 2011-07-06 アドバンスト・マイクロ・ディバイシズ・インコーポレイテッド メモリキャンセルメッセージを用いたシステムメモリ帯域幅の節約およびキャッシュコヒーレンシ維持
JP2015512102A (ja) * 2012-03-02 2015-04-23 エイアールエム リミテッド 第1および第2のプロトコルドメインを有するデータ処理装置およびデータ処理装置に関する方法
US9372798B2 (en) 2012-03-02 2016-06-21 Arm Limited Data processing apparatus having first and second protocol domains, and method for the data processing apparatus

Also Published As

Publication number Publication date
KR100297908B1 (ko) 2001-09-26
CN1236136A (zh) 1999-11-24
EP0945798A3 (en) 2005-06-15
JP3589394B2 (ja) 2004-11-17
KR19990077851A (ko) 1999-10-25
US6038651A (en) 2000-03-14
CA2262314A1 (en) 1999-09-23
CN1133943C (zh) 2004-01-07
CA2262314C (en) 2002-08-13
EP0945798A2 (en) 1999-09-29

Similar Documents

Publication Publication Date Title
JP3589394B2 (ja) リモート資源管理システム
US11907528B2 (en) Multi-processor bridge with cache allocate awareness
US7590805B2 (en) Monitor implementation in a multicore processor with inclusive LLC
CA2051222C (en) Consistent packet switched memory bus for shared memory multiprocessors
US5440698A (en) Arbitration of packet switched busses, including busses for shared memory multiprocessors
US6738871B2 (en) Method for deadlock avoidance in a cluster environment
US6738872B2 (en) Clustered computer system with deadlock avoidance
US5265235A (en) Consistency protocols for shared memory multiprocessors
US6738870B2 (en) High speed remote storage controller
EP0166341B1 (en) Multiprocessor system with fast path means for storage accesses
CN100524252C (zh) 一种嵌入式系统芯片及数据读写处理方法
US7395379B2 (en) Methods and apparatus for responding to a request cluster
US7383336B2 (en) Distributed shared resource management
JPH06214960A (ja) 多重プロセッサシステム
JP2002182976A (ja) マルチプロセッサ・システムにおけるメモリ・アクセスの動的直列化
JPH11282820A (ja) スイッチをベースとするマルチプロセッサシステムに使用するための順序サポート機構
JP2000112910A (ja) 非一様メモリ・アクセス・コンピュ―タ・システム及びその操作方法
CA2051209C (en) Consistency protocols for shared memory multiprocessors
US6950913B2 (en) Methods and apparatus for multiple cluster locking
US5987544A (en) System interface protocol with optional module cache
US20010037426A1 (en) Interrupt handling via a proxy processor
US7797472B2 (en) Method and apparatus for providing overlapping defer phase responses
JP2002024007A (ja) プロセッサシステム
JP2017199970A (ja) データ送信装置、データ送受信システムおよびデータ送信装置の制御方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040127

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040426

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040810

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20040810

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040812

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080827

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080827

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090827

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090827

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100827

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100827

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110827

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120827

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130827

Year of fee payment: 9

EXPY Cancellation because of completion of term