JPH05508497A

JPH05508497A - 非順次源アクセスのための方法およびその装置

Info

Publication number: JPH05508497A
Application number: JP3514424A
Authority: JP
Inventors: ウイルソン，ジミー　アール．; ビアード，ダグラス　アール．; チェン，スティーブ　エス．; エッカート，ロジャー　イー．; ヘッセル，リチャード　イー．; フェルプス，アンドルー　イー．; シルベイ，アレクサンダー　エイ．; バンダウォーン，ブライアン　ディー．
Original assignee: クレイ、リサーチ、インコーポレーテッド
Priority date: 1990-06-11
Filing date: 1991-06-10
Publication date: 1993-11-25
Also published as: AU8447491A; WO1991020038A1; US5208914A

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】非順次資源アクセスのための方法およびその装置技　術　分　野本発明は、コンピュータおよび電子論理システムのための記憶システムおよび記憶管理に関する。さらに詳しく言えば、本発明は、要求が発行された順序に対して順序通りでなく応答が返され得る、共用資源、特にメインメモリに対して要求を発行することができる非順次記憶アクセスのための方法およびその装置に関する。

先　行　技　術共用ハードウェア資源、特にメインメモリにアクセスするための複数リクエスタシステムにおける従来の方法および装置は、そのシステムによるデータまたは命令に対する上書きまたは不正確なアクセスを防止するために、その共用資源に対する要求が相互に時間順序的なまたは整列された関係を維持することを必要としている。実際、共用資源に対する乱順アクセスの可能性は、通常、データおよび／または命令への不正確なアクセスとみなされ、従来技術では記憶アクセスハザードと呼ばれている。

従来技術において、多重プロセッサシステムにおける共用資源へのアクセスを制御するために使用される一つの技法は、その共用資源への要求を大域的決定アルゴリズムによって取り扱う中央制御機構を維持することである。その多重プロセッサシステムが物理的に小さいシステムで少数のりクエスタおよび少数の共用資源しか有していない場合、この方法は有効である。多数のりクエスタおよび多数の共用資源を備えたもっと大規模な多重プロセッサシステムでは、大域的決定アルゴリズムを用いた中央ｍａｙ方式は、扱いにくくなり、その決定時間がその多重プロセッサの全処理性能に影響を及ぼし始める。

別の従来技術の技法は、以前の決定がクリアされている場合にのみ所定の決定がなされるように、各種決定を時間タグによりインタロックすることである。この方式に伴う問題は、それらの時間タグを更新するシステム内を信号が伝わるための過渡時間が妨げとなり、やはり、全システム性能が不利に影響を受けるということである。

本質的に、資源ロックアウトおよび共用資源アクセスの問題は、従来技術のスーパコンピュータでは、各資源をその多重プロセッサシステム全体で順次的にスケジュールする中央＃ｉ１機構を利用することによって管理されている。この方式は、システム性能を犠牲にして、記憶アクセスハザードの問題を効果的に回避する。

多重プロセッサシステムでの共用資源にアクセスするための新規な方法およびシステムを設計する際に、考慮すべき４つの問題が存在する。第１の問題は、その共用資源のスルーブツトをいかにして最大にするかである。

第２の問題は、そのプロセッサと共用資源との間のバンド幅をいかにして最大にするかである。第３の問題は、プロセッサと共用資源との間のアクセス時間をいかにして最小にするかである。最後の問題は、資源要求について予測可能な結果が得られるように、いかにしてアクセスハザードを回避するかである。コンピュータ処理システムがこれらの問題の全部に対する最適な解決を得られない場合、そのシステムの性能は事実上限定される。

例えば、メインメモリに対して３つの要求を行ったプロセッサの問題を考慮する。各要求は、結果として３つの個別の論理機構によって処理されることになるメインメモリの異なる区分に向けられるものとする。従来技術では、これらの要求のそれぞれは連続している必要があり、以降の要求は、先行する要求が完了するまで開始することができない。この３つの要求の例では、順次アクセスのその要求条件は、事実上、そのメインメモリに関係する論理の２７３がアイドル状態となる結果をもたらす。この制限は、バイブライン化動作として行われるように作業の安定した流れを処理要素および共用資源に付与することによってその処理要素および共用資源を継続的にビジー状態に保つことをその目的とする、高性能システムにおいて特に大きな打撃となる。

しばしばスーパコンピュータと称される、そうした高性能コンピュータ処理システムの処理速度および柔軟性を向上させる努力において、本発明に対し先に提出された特許出願である、’Ｃ１ｕｓｔｅｒ　Ａｒｃｈｉｔｅｃｔｕｒｅ　ｆｏｒ　ａ　Ｈｉｇｈｌｙ　Ｐａｒａｌｌｅｌ　５ｃａｌａｒ／Ｖｅｃｔｏｒ　Ｍｕｌｔｉｐｒ。

ｃｅｓｓｏｒ　Ｓｙｓｔｅｍ“と題する、ＰＣＴ出願番号ＰＣＴ／ＵＳ９０１０７６６５は、複数のプロセッサおよび外部インタフェースが、メインメモリ、大域レジスタまたは割り込み機構といった共用資源の共通な集合に対して複数かつ同時の要求を行うことができる、スーパコンピュータ用アーキテクチャを提供している。各資源をその多重プロセッサシステム全体で順次的にスケジュールするために中央制御機構を利用するこの従来技術の技法は、この形式の高度並列多重プロセッサ用クラスタアーキテクチャにとっては許容できない。従って、全部の共用資源にわたる全部のりクエスタに対して等しくかつ民主的なアクセスを保証し、各共用資源が独立した速度でしかもアクセスハザードを回避するように同時的にデータを処理できるようにすることによって、多重プロセッサシステムにおける性能を向上させるために、記憶アクセスのための新規な方法および装置が必要とされ本発明は、複数リクエスタシステムにおける共用資源への非順次アクセスのための方法および装置を提供する。

これを実現するために、本発明は、データをその宛先で効果的に再順序づけるために各種のタグを使用する。最も単純な形態では、このタグは、方向情報に関する別のタグを位置づけるためのバッファ内の場所へ、または、そのタグに関係する応答を発するためのバッファまたはプロセッサ（レジスタ）内の場所へ、スイッチング論理を方向づける。例えば、メモリからデータをロードするには、そのリクエスタが、要求信号、アドレスおよび要求タグを付与することが必要になる。要求信号は、そのアドレスおよび要求タグの妥当性を検査する。アドレスは、その要求されたデータのメモリ内の記憶場所を指定する。要求タグは、データがそのプロセッサへ返された時にそのデータを入れるための場所を指定する。

本発明に従った非順次共用資源アクセス用装置は、同じくその多重プロセッサシステムの共用資源にアクセスすることができる複数のプロセッサおよび複数の入出力インタフェースを有する多重プロセッサシステムにおいて使用される。好適な実施例における共用資源は、メインメモリ、大域レジスタおよび割り込み機構を含む。１クラスタの密結合プロセッサ内での非順次アクセスのために、本発明は、そのプロセッサからの複数の資源要求を生成するための要求生成資源と、その要求生成資源に動作可能に接続されており、それらの資源要求が生成された時間順序で資源要求を受信し、その資源要求を共用資源へ経路指定するためのスイッチング手段と、その要求された資源が使用可能になるとその資源要求にサービスする共用資源手段とを含む。各資源要求は、要求された共用資源のアドレス、および、その資源要求が返されるべきリクエスタ内の記憶場所を指定する要求タグを含む。

スイッチング手段に関係するスイッチング論理は、その資源要求に関係づけられた要求タグを格納するためのタグ待ち行列と、そのタグ待ち行列からの個々の要求タグを資源応答に関係づけるための論理手段と、その資源応答および個々の要求タグをプロセッサへ返すための手段とを含む。共用資源に関係するスイッチング論理は、共用資源との間で要求を経路指定するためのスイッチング手段と、要求を正しく経路指定するための制御論理と、複数の決定要求を取り扱うための論理と、要求されている最終データエンティティを格納または検索するための論理とを含む。

他の実施例において、本発明はまた、プロセッサの密結合クラスタの外部にある共用資源に対する非順次アクセスも可能にする。この実施例では、クラスタタグと称する新しいタグを生成するために要求タグに付加的な経路指定情報を付属させるために、遠隔クラスタアダプタが論理手段に備わる。このクラスタタグは、目標クラスタの遠隔クラスタアダプタに渡され、そこで、その要求から取り外され、タグバッファに格納される。目標クラスタの内部で使用されるために新しい要求タグが生成される。その応答が目標クラスタの遠隔クラスタアダプタに返されると、返された要求タグは、タグバッファ内でそれに関係する対応したクラスタタグを位置づけるために使用される。その応答およびクラスタタグはその後、要求側クラスタに返される。要求側クラスタの遠隔クラスタアダプタで、そのクラスタタグは、付加的な戻り経路指定情報および要求タグの各部に分解される。

付加的な戻り経路指定部は、その応答および要求タグ部を要求側スイッチング手段に返すために使用される。

このシステムの特殊な帰結は、制御が局所的に取り扱われ、共用資源に対するアクセスに関する決定が迅速に、かつ、その資源の十分な利用度を保証するために必要な時間にのみ行われるということである。極めて高いシステムバンド幅と結合された可能な最高のシステムスルーブツトを維持することによって、本発明は、リクエスタが最小限のアクセス時間で処理するデータを安定して供給されることを保証し、それにより、システムバンド幅およびスルーブツトパラメータの所定の集合について多重プロセッサシステムの全性能を向上させる。

本発明の目的は、要求が発行された時間順序に対してその応答が乱順で返され得る、共用資源に要求を発行することができる非順次記憶アクセスのための方法および装置を供することである。

本発明の第２の目的は、共用資源システムの各構成要素が同時並行的に、かつ、潜在的に異なる速度で動作できることを保証することによって、インタリーブト共用資源システムにおける性能を向上させることができる、記憶アクセスのための方法および装置を供することである。

本発明の第３の目的は、その多重プロセッサシステムが多数のりクエスタおよび多数の共用資源によって機器構成されている場合に、高バンド幅、高スルーブツトおよび低待ち時間を付与する、多重プロセッサシステム用記憶アクセスシステムのための方法および装置を供することである。

本発明の上述その他の目的は、図面、好適な実施例の詳細な説明および添付された請求の範囲によって明白となるであろう。

図面の説明図１ａ、ｌｂ、ｌｃおよび１ｄは、傘来技術および本発明のバイブライン化要求／応答記憶アクセス技法の説明図である。

図２は、本発明の好適な実施例の単一の多重プロセッサクラスタのブロック図である。

図３８および３ｂは、本発明の好適な実施例の４クラスタ実施例のブロック図である。

図４は、好適な実施例のアービトレーションノード手段を示した単一の多重プロセッサクラスタのブロック図である。

図５ａおよび５ｂは、本発明の好適な実施例における人出力インタフェースの詳細ブロック図である。

図６ａおよび６ｂは、プロセッサ内の入出力インタフェースに関係するボートの詳細ブロック図である。

図７ａ、７ｂ、７ｃ、７ｄおよび７ｅは、本発明の各種要求タグの説明図である。

図８は、外部インタフェースボートのブロック図である。

図９は、要求タグとコマンドブロックワードとの間の対応を示す。

図１Ｏは、本発明の好適な実施例におけるＮＲＣＡ手段の詳細ブロック図である。

図１１ｇおよび１１ｂは、本発明の好適な実施例におけるＭＲＣＡ手段の詳細ブロック図である。

好適な実施例の説明まず、図１ａ〜１ｄによって、従来技術と比較して、本発明のバイブライン化乱順アクセス機構について説明する。これらの図は、メモリ／共用資源アーキテクチャの各レベルでの要求／応答動作に適用可能である。多重りクエスタシステムにおいて一般にアクセスされる共用資源はメモリであることが理解されるはずなので、本発明の好適な実施例もメモリへのアクセスに関して説明スることになるが、本発明は、そのアクセスはいずれの形式の共用ハードウェア資源に対して行われるものと想定している。この意味で、共用ハードウェア資源には、メモリ、大域レジスタ、割り込み機構の他、ボート、経路、機能単位、レジスタ、待ち行列、バンクなどを含む。

図１８は、作来技術のシステムにおいて、一連の要求および応答の流れがどのように取り扱われるがを示している。乱順アクセスまたはストリーム化の機能がまったくないので、連続した要求はそれぞれ、その次の要求が開始できるまで、その関係する応答が完了するのを待たなければならない。図１ｂについて言えば、一部の従来技術のベクトルプロセッサは、各応答が返されるのを待つ必要がなく、ベクトルレジスタのロードまたは書き込みを行う連続した要求を発する能力を支援している。図１ｂに示すそうした限られたバイブライン化技法は、メインメモリにアクセスするベクトルプロセッサに適用されているが、他のシステム資源には適用されていない。

対照的に、図１ｃは、全部の要求およびそれらの関係する応答が時間順序になっているが、応答１は要求ｎが発行される前に返され得る、インタリーブされた系列の要求および応答を示している。図１ｄでは、本発明の乱順アクセス機構の全能力が、要求およびその関係する応答が時間順序に対するいかなる特殊な関係も伴わずに生起していることによって例示されている。この図に示された記憶アクセスシステムでは、応答２は、応答１より前に返され得る。図１ｄに図示されたバイブライン技法は、従来技術においては適用されていない。

好適な実施例を説明する上で、以下では、多重プロセッサシステムの好適な実施例の説明から始め、次に、各種リクエスタおよびそれらの関係するボートの説明に始まって、その多重プロセッサシステムの共用資源へ話を進め、非順次アクセスのための方法および装置について説明する。

〔多重プロセッサシステム〕

図２によって、本発明とともに用いられる多重プロセッサシステムの好適な実施例の単一の多重プロセッサクラスタのアーキテクチャについて説明する。高度並列スカシ／多重プロセッサシステム用ステム用のこの好ましいクラスタアーキテクチャは、共用資源の大規模な集合１２（メインメモリ１４、大域レジスタ１６、割り込み機構１８など）を共用する複数の高速プロセッサ１０を支援することができる。プロセッサ１０は、ベクトルおよびスカラ両方の並列処理が可能で、アービトレーションノード手段２０を介して共用資源１２に接続されている。また、アービトレーションノード手段２０を介して、複数の外部インタフェースポート２２および入出力コンセントレータ（ＩＯＣ）２４が接続されており、それらはさらに様々な外部データ送信装置２６と接続されている。これらの外部データ送信装置２６は、高速チャネル３０によって入出力コンセントレータ２４に連結された二次記憶システム（ＳＭＳ）２８を含むことができる。

外部データ送信装置２６はまた、１つ以上の標準チャネル３４によって入出力コンセントレータ２４に連結された他の各種周辺装置およびインタフェース３２を含むことができる。これらの周辺装置およびインタフェース３２は、ディスク記憶装置、テープ記憶装置、プリンタ、外部プロセッサおよび通信ネットワークを含むことができる。プロセッサ１０、共用資源１２、アービトレーションノード２０および外部インタフェースポート２２は、一体として、本発明の好適な実施例に従った高度並列多重プロセッサシステム用の単一の多重プロセッサクラスタ４０を構成する。

多重プロセッサクラスタ４０の好適な実施例は、プロセッサ１０、共用資源１２、アービトレーションノード２０および外部インタフェースポート２２を１つ以上のクラスタ４０に物理的に編成することによって、現在の共用記憶スーパコンピュータの直接接続インタフェースの問題を克服する。図３ａおよび３ｂに示す好適な実施例ではＪ４０ａ、４０ｂ、４０ｃおよび４０ｄの４つのクラスタが存在する。これらのクラスタ４０ａ、４０ｂ。

４０ｃおよび４０ｄのそれぞれは、そのクラスタに関係づけられた自己自身のプロセッサ１０”＋　１０　ｂ。

１０ｃおよび１０ｄ、共用資源１２ａ、１２ｂ、１２ｃおよび１２ｄ１および、外部インタフェースポート２２　ａ、　２２　ｂ、　２２　ｃおよび２２ｄの集合を物理的に有する。クラスタ４０　ａ、　４０　ｂ、　４０　ｃおよび４０ｄは、各アービトレーションノード手段２０ａ、２０ｂ。

２０ｃおよび２０ｄの論理部分である遠隔クラスタアダプタ４２によって相互接続されている。クラスタ４０ａ。

４０ｂ、４０ｃおよび４０ｄは物理的に分離されているが、これらのクラスタの論理的編成および遠隔クラスタアダプタ４２による物理的相互接続は、クラスタ４０ａ。

４０ｂ、４０Ｃおよび４０ｄの全部にわたる共用資源１２ｇ、１２ｂ、１２ｃおよび１２ｄの全部に対する所望の対称的アクセスを可能にする。

次に図４によって、単一のクラスタ４０のアービトレーションノード手段２０の好適な実施例について説明する。概念的なレベルでは、アービトレーションノード手段２０は、プロセッサ１０および外部インタフェースポート２２を、同一のクラスタ４０内の共用資源１２へ、および、遠隔クラスタアダプタ４２を通じて他のクラスタ４０内の共用資源１２へ、対称的に相互接続させる、複数のクロスバ−スイッチを含む。通常、フルクロスバ−スイッチは、各リクエスタが各資源に接続することを可能にするはずである。本発明では、アービトレーションノード手段２０は、資源より多数のりクエスタが存在する状況において、フルクロスバ−スイッチと同様の結果を得ることを可能にする。好適な実施例では、アービトレーションノード手段２０は、１６個のアービトレーションノード４４および遠隔クラスタアダプタ手段４２を含む。遠隔クラスタアダプタ手段４２は、ノード遠隔クラスタアダプタ（Ｎ　ＲＣＡ）手段４６およびメモリ遠隔クラスタアダプタ（ＭＲＣＡ）手段４８に分割される。

ＮＲＣＡ手段４６は、アービトレーションノード４４が他の全部の多重プロセッサクラスタ４０の遠隔クラスタアダプタ手段４２にアクセスできるようにする。

同様に、ＭＲＣＡ手段４８は、他の全部の多重プロセッサクラスタ４０の遠隔クラスタアダプタ手段４２からのそのクラスタ４０の共用資源１２に対するアクセスを制御する。

この実施例では、その１６個のアービトレーションノード４４は、３２個のプロセッサ１０および３２個の外部インタフェースポート２２をメインメモリ１４、大域レジスタ１６および割り込み機構１８ならびにＮＲＣＡ手段４６と相互接続させている。各アービトレーションノード４４は、８本の双方向並列経路５０によってメインメモリ１４と接続されている。単一の並列双方向経路５２は、各アービトレーションノード４４をＮＲＣＡ手段４６に接続させている。好適な実施例では、各アービトレーションノード４４からの同じ経路５２も、アービトレーションノード４４を大域レジスタ１６および割り込み機構１８に接続させるために使用されているが、この相互接続を実施するために個別の経路が使用できることは理解されるであろう。

各アービトレーションノード４４と同様に、ＭＲＣＡ手段４８は、８本の双方向並列経路５４によってメインメモリ１４と接続されている。同様に、単一の並列双方向経路５６は、ＭＲＣＡ手段４８を大域レジスタ１６および割り込み機構１８に接続させている。好適な実施例では、合計６本の並列双方向経路５８が、クラスタ４０を相互接続するために使用されている。例えば、クラスタ４０ｇは、各クラスタ４０ｂ、４０ｃおよび４０ｄと接続する２本の経路５８を有する。このようにして、ＭＲＣＡ手段４８は、他のクラスタ４０が、そのクラスタ４０の共用資源１２への直接アクセスを行えるようにする。

図５８および５ｂに示すように、メモリポート３１０のそれぞれ、ＮＲＣＡボート３１２、および、プロセッサポート３１４．３１．５，３１６および３１７のそれぞれのためのアービトレーションネットワーク３０３および３０６は、アービトレーションノード４４を含む。また、アービトレーションノード４４には、入力ボート待ち行列３０１、クロスバー３０２および３０７、タグ待ち行列３０４およびデータ待ち行列３０５が含まれる。

本願で詳細に説明するように、アービトレーションネットワーク３０３および３０６は、最旧の参照が最初に処理されるようにするために、先着順サービス複数リクエスタトグル方式を使用している。同一経過時間の複数の旧参照の場合、公平アルゴリズムが、そのアービトレーションネットワーク３０３または３０６によってそれぞれ制御されるポート３１０および３１２ならびに３１５゜３１６および３１７への等しいアクセスを保証する。

他のスーパコンピュータでは、メモリのリターンは、要求が送出された順序と同順で戻る。従って、データが戻る際にそのデータをどこに入れるかに関してはまったく曖昧さはないので、そのプロセッサのメモリリターン論理は単純である。

しかし、メモリのリターンを順序通りに制限することは、その順序づけの制約により共用資源がいずれかの順序の破約を明白に知るまで待たされることになるので、性能を犠牲にすることも意味し、それゆえ、並行活動の量を低減させることになる。早期の戻りは、その記憶システムの不均質な待ち時間のために、以前に要求されたリターンよりも短い待ち時間を伴って戻るようなリターンである。リターンが、要求が送出された順序と同順で戻るように制限されていない場合、それを保証するために、その記憶サブシステムはソート機構を付与しなければならない。これは、データを要求する複数のポートお誹びそのデータを返す複数の記憶部が存在する場合、相当の負担になる。

本発明では、メモリのデータリターンは、その要求の順序に対して乱順て戻ることができる。要求が待ち行列に蓄積した時は常に、その応答は、要求がその待ち行列に最初に入れられた相対時間に関して乱順て返され得るというのが、その多重プロセッサ全体の待ち行列およびアービトレーションネットワークの特徴である。これは、早期の要求のデータが後期の要求のデータよりも後に戻ることがあるということを意味する。しかしながら、プロセッサにおける順序づけの制限のために、早期に着信したデータを使用することが可能ではない場合もある。

例えば、算術演算に伴うデータは、再現可能な結果が望まれる際には、元のプログラムで指定された同じ順序で使用されなければならない。従って、本発明では、メモリリターンデータは、それがすでに実際に使用できるかどうかにかかわらず、その最終宛先（ベクトルレジスタ、スカシレジスタ、Ｌレジスタ、命令キャッシュバッファまたは人出力バッファ）に入れられる。そのデータが使用できるかどうかは、以前に発行された要求の応答状態にもとづく。

本発明は、全部のシステム資源が、図１ｂ〜１ｄに示したようなバイブライン技法の全部を用いてアクセスされ得る、共用資源アクセスのための方法および装置を供することである。これを実現するために、本発明は、要求および応答を記録し、そのデータをその宛先で事実上再び順序づけるために、タグおよび待ち行列を使用する。

最も単純な形態では、タグは、方向情報用の別のタグを位置づけるためのそのバッファ内の場所、または、そのタグに関係する応答を入れるためのバッファまたはプロセッサ（レジスタ）内の場所を、その論理に知らせる。

例えば、メモリからデータを要求するには、そのリクエスタが要求信号、アドレスおよび要求タグを付与することをめる。要求信号は、そのアドレスおよび要求タグの妥当性を検査する。アドレスは、メインメモリにおける応答データの位置を指定する。要求タグは、データがプロセッサに返される際にそのデータを入れる場所を指定する。その好適な実施例の説明を、共用資源にアクセスするための複数のポートを有するシステムにおいて各プロセッサを備えた多重プロセッサシステムの文脈で行ってきたが、本発明が、各プロセッサがメモリにアクセスするための単一のポートしか持たない、または、メモリにアクセスするための複数のポートを有する単一プロセッサシステムに対しても等しく適用可能であることは明らかであろう。

〔プロセッサ〕

以下の節では、好適な実施例のプロセッサ１０が、スカシ、ベクトルおよび命令要求をどのようにして管理するかを詳細に説明する。４つのベクトルロードポート、１つのスカシロードボートおよび１つの命令ロードポートが存在する。各ポートは、乱順応答を発行するための異なる機構を有する。

図６ａおよび６ｂについて説明すれば、ベクトルロードポート７２４，７２６，７２８および７３０は、要求信号、アドレス、および、そのデータがベクトルレジスタ７１８に向けられている記憶アクセス用要求タグを付与する。４つのベクトルロードポートが存在し、各ロードポートは、いずれかの所定の時間に２つの未決のベクトルロードを支援する。ベクトルロードポートは、特定のベクトルレジスタ７１８へのメモリリターンのための可変サイズ要求を行う。各要求群は、１〜６４個の個別の要求から構成することができる。各ポートへのそれら２つの可能な未決ベクトルロードのうち、一度に一方だけが要求を発行することができる。しかし、メモリリターンの非順次性のために、第２のロードに関するリターンの全部が第１のロードのリターンのいずれかより前に着信するということも想定できる。ベクトルロードポート制御機構７３２は、データが正しいレジスタに入れられ、そのレジスタの全部の既発行データが使用されるまではそのデータが使用されないように保証しなければならない。

図７ａに示す通り、ベクトルポートからの各メモリリターンおよびアドレスに伴う要求タグは、そのメモリリターンの宛先を指示するのに十分な大きさである。

すなわち、２つの可能なベクトルレジスタのうちのいずれにそのデータを入れるか、および、そのベクトルレジスタのどの記憶場所を使用するかである。要求が発行されると、ベクトルロードポート制御機構は、正しいタグがその要求およびアドレスに続くように保証する。そのベクトルタグの第１の構成要素は、宛先レジスタ識別子ビットである。好適な実施例では、そのタグの一部として宛先レジスタ番号を送信する代わりに、プロセッサは単に、２つのレジスタのうちの一方を指示する単一のピットを送信する。その特定のレジスタ番号は、命令発行時に確立され、ロード命令がポートに発行されるごとに異なることができる。タグには単一の宛先レジスタ識別子しか含まれていないので、いずれかの所定の時間には２つのロードだけが未決となり得る。一つのポート内でのタグ衝突（同一宛先レジスタビットの再使用）は、そのタグピットを再使用する前に、各レジスタの全部の応答が返るのを待つことによって防止される。さらに、各ポートからの連続したロードは、常に、異なる宛先レジスタタグピットを使用する。各ベクトルレジスタについて（しかし異なるベクトルロードポートにおいて）複数のローフトルレジスタロードが完了するのを待つことによって避けられる。

ベクトルタグの第２の部分は、ベクトルレジスタの要素番号である。これは単に、所定のレジスタのいずれのワードがその記憶データによって更新されるはずかを指定する。

ベクトルレジスタの第３の、そして最後の部分は、そのプロセッサ１０に関するロード要求を事実上破棄する、「取り消し」標識である。しかし、記憶システムにとって、取り消された要求は、ごくわずかな例外を伴って、取り消されていない要求とまったく同様に扱われる。この例外とは、取り消されたクラスタ外要求は性能上の理由でクラスタ内に転送されるということである。要求が発行された後にその要求を取り消すことができるこの能力は、要求を取り扱うプロセッサ１０およびアービトレーションノード４４の部分とアドレスを取り扱うプロセッサ１０およびアービトレーションノード４４の部分との間の、時間が決定的である何らかのハンドシェーキングを削除するので、効果的な記憶待ち時間の低減をもたらす。この実施例では、取り消しビットは、アドレスの妥当性検査および要求アービトレーションがオーバラップでき、プロセッサ１０およびアービトレーションノード４４内で並行して実施されるようにする。すなわち、例えば、アービトレーションノード４４は記憶要求のアービトレーションを進め、同時に、プロセッサ１０内のそのアドレス制御論理はその記憶要求のアドレスが有効な要求であるかどうか、つまり正しいアドレス範囲内にあるかどうかを判定する。プロセッサ１０がそのアドレスが範囲外であると判定した場合、取り消しビットが設定され、その要求はクラスタ内アドレスへ向けられる。

ある種の動作では、この取り消し機能は、ループにおいてデータのボトムローディングを可能にすることで有益である。このソフトウェア技法では、記憶待ち時間の作用は、そのアドレスが有効であるかどうかがわかる前にデータをプリフェッチすることによって回避される。

好ましい多重プロセッサシステムでは、プログラムは、マツピング例外をオフにし、ランダムなアドレス（そのデータ空間外のアドレスでさえ）で問題なくメモリにアクセスすることができ、その取り消し機構はそのプログラムが禁止データにアクセスできないように保証する。

従って、プログラムは、それが使用するアドレスを検査する前にメモリにアクセスすることができ、ロード命令は、ループの上部ではなく下部に置くことができる（「ボトムローディング」）。

再び図６８および６ｂに戻って、スカラ要求タグについて説明する。メモリへの単一のスカラボート７２２は、Ｓレジスタ７１４およびＬレジスタ７１６への記憶データの経路を付与する。正しいデータ順序づけを保証するために、スカラポートは、ベクトルボートと同様に、各記憶要求およびアドレスに要求タグを付加する。

図７ｂに示すように、このスカラ要求タグは、宛先レジスタ形式およびレジスタ番号を指示する。スカラタグの第１の部分は、レジスタ形式である。これは、ＬレジスタとＳレジスタの応答を識別する。スカラタグの第２の部分は、レジスタ番号である。これは、どちらのレジスタ番号（ＬまたはＳ）にリターンデータを入れるかを指示する。タグ衝突は、レジスタ当たりただ一つの未決の参照を、または、Ｌレジスタの場合はレジスタ群当たりただ一つの未決の参照を許可することによって防止される。スカラタグの第３の、そして最後の部分は、ユーザプログラムが、それらの許可されたアドレス空間外にあるデータにアクセスしないように防ぐ、「取り消し」標識である。この機構については、本願書の各所で説明されている。

図６ａおよび６ｂに示す通り、スカラロードボート７２２は、Ｌレジスタ７１６またはＳレジスタ７１４のいずれかに向けられたリターンを受け取る。そのリターンタグのＬ／Ｓビットは、そのデータがメモリから返った時にいずれの宛先レジスタ形式に書き込むかを決定する。

Ｓレジスタが書き込まれる場合、その要求タグは２つの機能を実行する。まず、そのレジスタを未予約にさせ、それによりＳレジスタファイルの書き込みアドレスを形成する。Ｌレジスタが書き込まれる場合、タグは同じ２つの機能を実行する。しかし、Ｌレジスタは、個々のレジスタではなく、ブロック単位で予約されたりされながったりする。

スカラボート応答について概説した要求タグ方式は、Ｌレジスタロードが、Ｓレジスタロードなどの高優先順位ロードによって割り込まれることを許す。出方アドレスにはいかなる順序づけも課されず、また、入力データストリームにもまったく課されないので、一方のレジスタロード（例えば、Ｌレジスタ）の集合をバックグラウンドアクティビティとして扱い、他方の集合（Ｓレジスタ）を高優先順位のフォアグラウンドアクティビティとして扱うことが可能である。その後、正しいソフトウェア支援によって、Ｌレジスタは、ブロックロードおよびストアによってアクセスされるソフトウェア管理キャッシュとして扱われることができる。

再び図６ａおよび６ｂに戻って、命令要求タグについて説明する。命令および入出カポ−ドア２０は、メモリから命令キャラシュア１０および入出力バッファ７１２への経路を付与する。正しい命令の順序づけを保証するために、この命令ボートは、他のボートと同様に、その要求およびアドレスとともに要求タグを付与する。命令要求タグは、図７ｃに示す通り、その命令の応答のためのバッファ番号およびそのバッファ内の要素番号を指示する。

ベクトルボートレジスタ番号と同様に、この命令ボートバッファ番号標識は、単一のタグビットで符号化される。これは、未決のバッファ要求の数を２つに制限するが、命令ロードに関係する制御およびデータ経路を単純にする。命令タグ衝突は、新しい充填の開始を許可する前に、最旧のバッファ充填が完了するのを待つことによって回避される。同一バッファへの複数の未決ロードは、キャッシュ置換方針によって禁止されている。タグの符号化は、リターン宛先が命令キャッシュバッファ７１２または入出力応答バッファ７１０のいずれであるかを指示する。

各ベクトルロードボート７２４，７２６．７２８および７３０は、「バック」ビットの２つの集合を維持しており、その一方は、そのボートの各可能な未決ベクトルレジスタ用のものである。メモリからリターンが戻ると、そのレジスタおよび要素番号のバックビットは１に設定され、そのデータはそのベクトルレジスタに書き込まれる。しかし、制御機構７３２は、以前の要素を含むそれまでの全部の要素がメモリから返されるまで、そのデータが使用されないようにする。これは、応答が乱順て戻っても、ベクトルレジスタの全部の要素が順番に使用されることを保証する。

ベクトルレジスタの全部の要素がメモリから返されると、その側のバックビットは「ノットバ・ツク」とマークされ、そのバックビットの集合は別のロード命令に使用可能となる。そのタグが要求が取り消されたことを指示しているベクトルおよびスカラロードデータは、非信号のＮａＮ　（Ｎｏｔ　ａ　Ｎｕｍｂｅｒ：　ｒ非数値」）によって破棄され、交替される。これは、本発明の好適な実施例が、オペランドマツピング例外を使用可能としないプログラムによるアクセスから記憶データを保護する方法である。命令データがメモリ１４から返されると、プロセッサ１０は、それを入れるべき場所を決定するためにそのリターンタグを使用する。命令リターンは、データリターンとは異なり、マツブトモードであれば命令マツピング例外が常に使用可能であるので、取り消し機能を使用しない。

非コヒーレント記憶システムに関係するハザードを回避するために、プロセッサ１０および外部インタフェースボート２２は、アービトレーションノード４４がそのタグ以外の情報を付与することをめる。

この情報は、要求の順序づけ、および、それらの要求が特定の共用資源によって処理されるためにコミットされる時に関係している。好適な実施例では、コヒーレンシーを保証するために使用されるこの技法は、「データマーク機構」と称する。このデータマーク機構は、原特許願書においてより詳細に開示されている。

〔外部インタフェースポート〕

プロセッサ１０によって発行される要求に加え、本発明は、外部インタフェースポート２２を介して発行された周辺装置からの資源要求にもサービスすることができる。外部インタフェースポート２２によってメインメモリ１４または大域レジスタ１６からフェッチされたデータは、それが要求された順序とは異なる順序で戻ることができる。本発明のこの非順次アクセスを実現するために、外部インタフェースポート２２に関係するｌ０Ｃ２４およびＳＭＳ　２８は、外部インタフェースポート２２を通じてなされる資源要求に要求タグを付加する。

図８によって、好適な実施例の外部インタフェースポート２２の詳細な説明を行う。外部インタフェースポート２２は、クラスタチャネルインタフェース（ＣＣＩ）１２０を物理的に接続するメモリボートケーブル（図示せず）によってメインメモリ１４からコマンドおよびデータワードのパケットを受け入れる。コマンドワードはコマンドバッファ３５０に入れられ、データはデータＦＩＦＯバッファ３６０に経路指定される。コマンドバッファ３５０にコマンドが存在すると、外部インタフェースポート２２の制御論理３７０は、アービトレーションノード４４を通じてメモリ１４ヘアクセスを要求することになる。コマンドワードのワードカウント、コマンド、アドレスおよびｍタグフィールドからのデータは、その要求が認識される際にアービトレーションノード４４へ配信する準備として各自のレジスタ３８２，３８４．３８６および３８８ヘロードされる。行われたすべてのワード要求について、新しい要求タグおよびアドレスが計算されなければならない。

フェッチ要求の場合、いかなるデータも送信されないが、アドレスおよび要求タグは、そのコマンドワードカウントフィールドの内容に等しい要求数について送信される。要求タグは、０に設定された下位６ビツトに始まり、タグの正しい数が送信されるまでそのフィールドの内容を増分させて計算される。同様に、要求のアドレスは、そのコマンドワードに存在するアドレスに始まって、各要求が認識されるごとにそれを増分させて計算される。

ストア要求の場合、データＦＩＦＯ３６０内の次のワードがアドレス、タグおよびコマンド情報とともに提示される。ワードカウント値は、各要求後に減分される。

ワードカウント値が０に達すると、以降の要求はいっさい行われない。ＦＩＦＯ３５０および３６０は、可能であれば必ず、アービトレーションノード４４を絶えずビジー状態にしておくために外部インタフェースポート２２でコマンドおよびデータが常に使用可能であることを保証するようにコマンドおよびデータを保持するために使用される。

フェッチされたデータは、転送レジスタ３９０を介して共用資源から戻る。その要求がなされた時に発行された要求タグは、そのデータとともに返される。転送レジスタ３９０の出力は、メインメモリ１４に接続されている。外部インタフェースボート２２を連結するケーブルのデータ線に関係する制御線は、有効データワードがＣＣ１１２０のバスにあることを指示するために挿入されている。

入出力要求タグは、ＩＯＣ２４を通じて伝わる際にそのデータパケットに先行するコマンドワードとともに送信される。タグは、そのデータをｒＯｃ　２４のいずれのバッファが受信するかを指示する４ビツトフイールド、および、そのデータが格納されるそのバッファ内の記憶場所を指示する６ビツトフイールドを含む。４ビツトのバッファ選択フィールドは、図９に示すようにデコードされる。コード１０１１は、データを２つのＳＭＴＣコマンドバッファのうちの一方に方向づける。残りの６つのタグピットは、その応答データワードがいずれのバッファおよびそのいずれの記憶場所へ格納されるかを指示する。コード１１１１は、ｌ０Ｃ２４によっては使用されない。それは、プロセッサの命令キャッシュフェッチ動作に予約されている。ＩＯＣ２４は、メモリボートをその命令キャッシュと共用する。

６ビツトフイールドは、要求がなされた際に各個別のデータワード要求について外部インタフェースボートで生成される。要求は、最下位アドレスに始まり順に行われる。図７ｄによれば、入出力要求タグ、すなわち、６ビツトワード識別子および４ビツト宛先識別子は、１０ビツトタグフイールドに入れられる。このタグは、記憶システムによって要求とともに伝わり、データの各ワードとともにＩＯＣ２４へ返される。その後、要求タグは、そのデータワードを適切なバッファおよびそのバッファの記憶場所へ方向づけるためにＩＯＣ２４によって使用される。

要求がなされた際の連続順序でタグが生成されるので、宛先バッファの記憶場所をアドレス指定するためにタグを使用することは、データが、いずれの任意の順序で戻っても、必ず正しい順序でバッファにロードされることを保証する。従って、データをバッファから連続順序で読み出すことは、データが正しい順序で宛先へ返されることを保証する。

〔アービトレーションノード〕

再び図５ａおよび５ｂに戻って、共用資源の観点から見ると（この場合、経路５０および５２）、各入力要求は、要求アービトレーションネットワーク３０３によってアービトレーションが行われる。同様の応答アービトレーションネットワーク３０６は、それらの各自のプロセッサポー）−３１５，３１６または３１７へ戻る応答データのアービトレーションを行う。入力する要求の場合、入力待ち行列３０１が、その要求アービトレーションネットワーク３０３によって渡されるのを待つ最大１６個の要求を保持する。返される応答の場合、データ待ち行列３０５が、その応答アービトレーションネットワーク３０６がそれらの応答データを宛先ボート３１５．３１６または３１７へ戻すのを待つ最大６４個の応答を保持する。これらの待ち行列３０１および３０５のそれぞれは、リクエスタと共用資源の間でデータが流れる際のいずれかの制御待ち時間を範囲に収めるように戦略的に大きさが取られている。また、データが記憶部から返されると、その関係するタグはタグ待ち行列３０４から検索され、データおよびタグがデータ待ち行列３０５ヘロードされる前に、再び付属される。ＮＲＣＡ経路５２による応答の場合、データおよびその関係するタグはすでに対にされており、ＮＲＣＡおよびＭＲＣＡ手段は関係するデータおよびタグを取り扱う。

要求アービトレーションネットワーク３０３が、入力している要求が使用可能な資源を要求しており、最高優先順位を有しており、かつ、記憶部へ向けられていると判定した場合、その要求のアドレスおよびデータ構成要素は経路５０に置かれ、その正しい記憶部へ経路指定される。要求アービトレーションネットワーク３０３が、入力している要求が使用可能な資源を要求しており、最高優先順位を有しており、かつ、ＮＲＣＡ　４６へ向けられていると判定した場合、その要求のアドレス、データおよびタグ構成要素は経路５２に置かれ、その正しい共用資源１２へ経路指定される。アービトレーションネットワーク３０３は、それらの相互接続配線５０および５２へのアクセスを事実上制御していることに留意しなければならない。その要求経路に沿った以降のアービトレーションネットワークは、他の共用資源へのアクセスを制御する。データは、要求された順序とは異なる順序で要求ボート３１５，３１６および３１７へ返され得る。

アービトレーションノード４４は、各ロードアドレスとともにタグの集合を受信し、後の参照のためにそれらを待ち行列に入れる。データがメインメモリから返されると、それらのタグは対応するデータワードに再び付属され、データおよびタグの両者はその要求側ボートへ返される。プロセッサ１０は、そのデータを正しい宛先へ入れるためにこれらのタグを利用し、それが正しい順序で使用されるように保証する。

〔メインメモリ〕

再び図５ａおよび５ｂに戻って、メモリ参照に関して、各記憶部のスイッチング論理４００は、所定のアービトレーションノード４４からのその特定の記憶下位区分に対する全部の入力要求を収集する各記憶下位区分に下位区分キャッチ待ち行列４０１を含む。各アービトレーションノード４４は、各記憶部１４に自己自身のキャッチ待ち行列の集合を有する。バンク要求アービトレーションネットワーク４０５は、各サイクルでそのバンク４０３への未決の要求を有する下位区分キャッチ待ち行列４０１のその群の間でアービトレーションを行う。要求が選択されると、その選択された要求はその宛先バンク４０３へ発行される。要求がストアである場合、アドレスおよびデータがそのバンクへ発行される。要求がロードである場合、そのアドレスだけがそのバンクへ発行される。要求がロードアンドフラグである場合、そのアドレスおよびデータがそのバンクへ発行される。ロードおよびロードアンドフラグについては、バンク４０３からのその応答データは、応答アービトレーションネットワーク４０７がその記憶部からの出力応答を許可する前にホールド待ち行列４０６で保持される。

〔遠隔クラスタアダプタ〕

次に図１０について説明する。ＮＲＣＡ手段４６の場合、入力待ち行列６１０または６３０が入力要求を収集する。入力待ち行列６１０は、外部インタフェースへ向けられた参照を保持する。アービトレーションネットワーク６１２は、各サイクルで外部資源への未決の要求を有するその１群の入力待ち行列６１０の間でアービトレーションを行う。要求が選択されると、その選択された要求は、アドレス、データ、および、経路５８に置かれるその要求タグおよび付加的な情報（図７０参照）から構成されるクラスタタグと称する新しいタグとともに、その宛先資源へ発行される。入力待ち行列６３０は、割り込み機構、大域レジスタまたは５ＥＴＮレジスタへ向けられた参照を保持する。アービトレーションネット７ −り６３４は、各サイクルでその資源６２０．６３２または６３３への未決の要求を有するその１群の入力待ち行列６３０の間でアービトレーションを行う。その要求が許可されると、それはその宛先資源へ発行される。データが大域レジスタ６３３またはＳ　ＥＴＮレジスタ６３２からアービトレーションノード４４へ返される場合、高優先順位の要求がその出力アービトレーションネットワーク６１５に提示され、それによりそのアービトレーションノードへ戻る出力経路はクリアされることになる。

ボート５８を介してＭＲＣＡ手段４８から戻るデータおよびタグは、待ち行列６１４に受信される。大域レジスタ６３３または５ＥＴＮレジスタ６３２からのデータは、事前にアービトレーションが行われ、ただちに、関係するタグとともに戻り経路５２に置かれる。各クロックサイクルにおいて、応答アービトレーションネットワーク６１５は、ボート５２または５６の戻りデータ経路についてアービトレーションを行う。データ待ち行列６１４、大域レジスタ６３３または５ＥＴＮレジスタ６３２から適切なデータが選択され、適切なボート５２または５６へ返される。

次に図１１ｇおよび１１ｂについて説明すれば、ＭＲＣＡ手段４８は、それらを介して他のクラスタからのストアおよびロード動作が受信される６つのボート５２０が存在する。これらのボートのそれぞれは、受信待ち行列５００．タグバッファ５０２、応答待ち行列５０４、および、ボート制御論理５０１および５０３から構成される。各ボートは、他の全部のボートから独立して動作する。別のクラスタからボートに着信した全部の動作は、そのクラスタへ返される。これは、ストアもロードも含む。ＭＲＣＡ手段４８の待ち行列およびアービトレーション（５０６，５０７，５０８，５０９，５１０，５１１および５１２）は、本質的に、アービトレーションノード４４の待ち行列およびアービトレーション（それぞれ、３０１，３０２，３０３，３０４，３０５，３０６および３０７）と同様に動作する。

ある動作が外部クラスタからＭＲＣＡポート５２０に着信すると、そのデータ、アドレスおよびタグ情報が、６４個の記憶場所の深さを持つ受信待ち行列５００に書き込まれる。この受信待ち行列５００に妥当な動作が書き込まれた後、ボート制御論理５０１は、その動作がＭＲＣＡ手段４８に渡され得るかどうかを判定するために資源検査を実行する。３つの検査される資源が存在する。

検査される第１の資源はタグの可用性に関する。動作がＭＲＣＡ手段４８に渡されると、その要求とともに着信した元のクラスタタグはタグバッファ５０２に書き込まれ、新しい８ビツト要求タグがタグジェネレータ５０１によって生成される。その元のタグが書き込まれるタグバッファ５０２の記憶場所のアドレスは、その新しい要求タグになる。この要求タグは一意でなければならないので、新しいクラスタタグが生成されＭＲＣＡ手段４８に渡されると、それは、その動作がＭＲＣＡ手段４８′ｂ１らそのボートへ返されるまで、再使用することはできない。この論理の実施は、要求タグが順に生成されなければならないことを要する。生成される次の要求タグがＭＲＣＡ手段４８においてまだ未決である場合、そのボートは、受信待ち行列５００から自己の次の動作を発行することができない。タグバッファ５０２は２５６個の記憶場所の深さを持つ。

ＭＲＣＡ手段４８へ動作が発行できる前に検査されなければならない第２の資源は、リターン待ち行列５０４における記憶場所の可用性に関する。ＭＲＣＡ手段４８はアービトレーションノード４４に戻り動作を保持させるための機構をまったく持っていないので、ＭＲＣＡ手段４８は、アービトレーションノード４４がら戻るいずれかの動作を格納するためにリターン待ち行列５０４に記憶場所が常に存在するように保証しなければならない。

このリターン待ち行列５０４は１２８個の記憶場所の深さを持つ。リターン待ち行列５０４の記憶場所の全部が割り当てられると、記憶場所が使用可能となるまで、他のいかなる動作もＭＲＣＡ手段４８に発行できない。

ＭＲＣＡ手段４８内のボート待ち行列５０６は、受信待ち行列５００からの動作が発行できる前に検査されなければならない第３の資源である。ボート制御論理５０１は、現在の動作の総数をボート待ち行列５０６に保持する。ボート待ち行列５０６が一杯になると、ポート制御論理５０１は、記憶場所が使用可能となるまで、発行を抑止しなければならない。

ＭＲＣＡ手段４８から動作が戻ると、データが存在する場合、そのデータは、リターン待ち行列５０４に直接格納される。その動作とともに返される要求タグは、そのタグバッファにアクセスし、元のクラスタタグ５０３を回復させるために使用される。この元のクラスタタグは、タグバッファ５０２から抽出され、そのデータとともにリターン待ち行列５０４に格納される。その後、ポート制御論理５０１は、そのクラスタ間経路５２０の遠端のクラスタについて資源検査を行う。その遠端クラスタが自己の受信待ち行列に使用可能な記憶場所を有していれば、リターン待ち行列５０４はロードされない。記憶場所がなければ、待ち行列の記憶場所が使用可能となるまで、データは保持される。

好適な実施例の説明を提示してきたが、本発明の精神を逸脱することなく、各種変更がなし得ることが想定される。従って、本発明の範囲は、好適な実施例の説明よりもむしろ、添付請求の範囲によって規定されるべきものと意図する。

Ｆｉｇ、　２Ｆｉｇ、　３ａ翫３ｂＦｉｇ、　５Ｆｉｇ、　Ｉｌａ要　約　書複数リクエスタシステムにおいて共用資源（１２）に対する非順次アクセスのための方法および装置は、データをその宛先で効果的に再順序づけるために各種のタグを使用する。最も単純な形態では、このタグは、方向情報に関する別のタグを位置づけるためにバッファ内の場所へ、または、そのタグに関係する応答を発するためにバッファまたはプロセッサ（レジスタ）内の場所へ、スイッチング論理を方向づける。例えば、メモリ（１４）からデータをロードするには、そのリクエスタが、要求信号、アドレスおよび要求タグを付与することが必要になる。

要求信号は、そのアドレスおよび要求タグの妥当性を検査する。アドレスは、その要求されたデータのメモリ（１４）内の記憶場所を指定する。要求タグは、データがそのプロセッサへ返された時にそのデータを入れるための場所を指定する。そのリクエスタのスイッチング論理（４４）は、その資源要求に関係する要求タグを格納するためのタグ待ち行列と、そのタグ待ち行列からの個々の要求タグを資源応答に関係づけるための論理手段と、その資源応答および個々の要求タグをり゛クエスタへ返すための手段とを含む。メモリ（１４）に関係するスイッチング論理（４００）は、共用資源との間で要求く経路指定するための制御論理と、複数の決定要求を取り扱うための論理と、要求されている最終データエンティティを格納または検索するための論理とを含む。

国際調査報告

Claims

【特許請求の範囲】

１．複数のプロセッサを有する多重プロセッサにおける非順次共用資源アクセスのための装置であって、前記共用資源はメインメモリ、大域レジスタおよび割り込み機構を含むものであり、前記装置が、前記プロセッサのそれぞれと動作可能に接続されており、前記プロセッサからの複数の資源要求を生成するための要求生成手段であり、前記資源要求のそれぞれは、要求された共用資源のアドレスと、その資源要求が返されるべきプロセッサ内の記憶場所を指定する要求タグとを含むものである、前記要求生成手段と、前記要求生成手段と動作可能に接続されており、前記資源要求が生成された時間順に前記資源要求を受信し、前記資源要求を前記共用資源に経路指定するためのスイッチング手段であり、前記スイッチング手段は、前記資源要求に関係する前記要求タグを格納するためのタグ待ち行列と、前記タグ待ち行列からの各要求タグを資源応答に関係づけるための論理手段と、前記資源要求および各要求タグを前記プロセッサに返すための手段とを含むものである、前記スイッチング手段と、前記スイッチング手段および前記共用資源と動作可能に接続されており、前記要求された資源が使用可能となった時に前記資源要求にサービスし、前記資源要求がサービスされた順序で前記スイッチング手段に前記資源応答を返すための手段とを含んでおり、それによって、前記資源要求が発行された時間順序に対して前記資源応答が乱順で返され得ることを特徴とする装置。
２．請求項１記載の装置であって、前記スイッチング手段がさらに、前記多重プロセッサシステムの所定のクロックサイクルで前記共用資源へ経路指定される前記資源要求間でアービトレーションを行うためのアービトレーションノード手段を含むことを特徴とする装置。
３．請求項２記載の装置であって、前記各要求タグを関係づけるための論理手段がさらに、前記要求生成手段からの取り消し指示を受信し、前記取り消し指示に応答して前記資源要求が前記共用資源へ経路指定された時より以前の前記資源要求を取り消すための取り消し論理手段を含むことを特徴とする装置。
４．請求項３記載の装置であって、前記取り消し論理手段は、前記資源要求に応答して非数値を返すことによって資源要求が取り消されたことを指示することを特徴とする装置。
５．請求項１記載の装置であって、前記スイッチング手段がさらに、前記資源要求のアドレスの妥当性を検証するためのアドレス検証手段を含むことを特徴とする装置。
６．請求項５記載の装置であって、前記各要求タグを関係づけるための論理手段がさらに、前記要求生成手段からの取り消し指示を受信し、前記取り消し指示に応答して前記資源要求が前記共用資源へ経路指定された時より以前の前記資源要求を取り消すための取り消し論理手段を含むことを特徴とする装置。
７．複数のリクエスタを有する多重プロセッサにおける非順次共用資源アクセスのための装置であって、前記リクエスタはプロセッサおよび外部インタフェースポートの両者を含むものであり、前記共用資源はメインメモリ、大域レジスタおよび割り込み機構を含むものであり、前記装置が、各リクエスタと動作可能に接続されており、前記リクエスタからの複数の資源要求を生成するための要求生成手段であり、前記資源要求のそれぞれは、要求された共用資源のアドレスと、その資源要求が返されるべきリクエスタ内の記憶場所を指定する要求タグとを含むものである、前記要求生成手段と、前記要求生成手段と動作可能に接続されており、前記資源要求が生成された時間順に前記資源要求を受信し、前記資源要求を前記共用資源に経路指定するためのスイッチング手段であり、前記スイッチング手段は、前記資源要求に関係する前記要求タグを格納するためのタグ待ち行列と、前記タグ待ち行列からの各要求タグを資源応答に関係づけるための論理手段とを含むものである、前記資源要求および各要求タグを前記リクエスタに返すための手段とを含むものである、前記スイッチング手段と、前記スイッチング手段および前記共用資源と動作可能に接続されており、前記要求された資源が使用可能となった時に前記資源要求にサービスし、前記資源要求がサービスされた順序で前記スイッチング手段に前記資源応答を返すための手段とを含んでおり、それによって、前記資源要求が発行された時間順序に対して前記資源応答が乱順で返され得ることを特徴とする装置。
８．請求項７記載の装置であって、前記スイッチング手段がさらに、前記多重プロセッサシステムの所定のクロックサイクルで前記共用資源へ経路指定される前記資源要求間でアービトレーションを行うためのアービトレーションノード手段、および、前記資源要求のアドレスの妥当性を検証するためのアドレス検証手段を含むことを特徴とする装置。
９．請求項８記載の装置であって、前記各要求タグを関係づけるための論理手段がさらに、前記要求生成手段からの取り消し指示を受信し、前記取り消し指示に応答して前記資源要求が前記共用資源へ経路指定された時より以前の前記資源要求を取り消すための取り消し論理手段を含むことを特徴とする装置。
１０．請求項７記載の装置であって、前記リクエスタおよび共用資源が複数のクラスタに編成されており、また、前記スイッチング手段がさらに、遠隔クラスタの共用資源へ向けられたそのクラスタのリクエスタからの資源要求を受信し、それらの要求を前記遠隔クラスタの遠隔クラスタアダプタ手段へ転送し、前記遠隔クラスタからの資源応答を受信し、かつ、前記クラスタの共用資源へ向けられた前記遠隔クラスタの遠隔クラスタアダプタ手段からの資源要求を受信し、前記遠隔クラスタヘ前記資源応答を返すための、各クラスタに関係づけられた遠隔クラスタアダプタ手段を含むことを特徴とする装置。
１１．多重プロセッサシステムであって、１つ以上のリクエスタ間で待ち行列およびパイプラインを確立するための手段と、資源へ要求を行うための手段と、前記要求がなされた時間順序とは異なる順序で前記要求がサービスされ得るように前記要求に応答するための１つ以上の資源手段とを含むことを特徴とする多重プロセッサシステム。
１２．複数のプロセッサを有する多重プロセッサシステムにおいて共用資源にアクセスするための方法であって、前記共用資源はメインメモリ、大域レジスタおよび割り込み機構を含むものであり、前記方法が、前記プロセッサの１つからの資源要求を生成する段階であり、前記資源要求のそれぞれは、要求された共用資源のアドレスと、前記資源要求が返されるべきプロセッサ内の記憶場所を指定する要求タグとを含むものである、前記要求生成段階と、前記資源要求が発行された時間順に前記共用資源に関係するスイッチング機構へ前記資源要求を提示する段階と、前記資源要求に関係する前記要求タグを前記スイッチング手段のタグ待ち行列に格納する段階と、資源応答を生じるために前記要求された資源が使用可能となった時に前記資源要求にサービスする段階と、前記資源要求がサービスされた順序で前記スイッチング手段に前記資源応答を返す段階と、前記タグ待ち行列からの前記各要求タグを前記資源応答に関係づける段階と、前記資源要求および各要求タグを前記プロセッサに返す段階とを含んでおり、それによって、前記資源要求が発行された時間順序に対して前記資源応答が乱順で返され得ることを特徴とする方法。
１３．請求項１２記載の方法であって、前記資源要求にサービスする段階が、前記多重プロセッサシステムの所定のクロックサイクルで前記共用資源へ経路指定される前記資源要求間でアービトレーションを行う段階と、前記資源要求のアドレスの妥当性を検証する段階とを含むことを特徴とする方法。
１４．請求項１３記載の方法であって、前記資源要求にサービスする段階がさらに、前記資源要求に関係する取り消し指示を検査し、前記取り消し指示に応答して前記資源要求が前記共用資源へ経路指定された時より以前の前記資源要求を取り消す段階を含むことを特徴とする方法。
１５．請求項１４記載の方法であって、前記資源要求を取り消す段階が前記取り消し指示に応答して非数値を返すことによって前記資源要求が取り消されたことを指示することを特徴とする方法。
１６．複数のリクエスタを有する多重リクエスタシステムにおいて共用資源にアクセスするための方法であって、前記リクエスタはプロセッサおよび外部インタフェースポートの両者を含むものであり、前記共用資源はメインメモリ、大域レジスタおよび割り込み機構を含むものであり、前記方法が、前記リクエスタの１つからの資源要求を生成する段階であり、前記資源要求のそれぞれは、要求された共用資源のアドレスと、前記資源要求が返されるべきリクエスタ内の記憶場所を指定する要求タグとを含むものである、前記要求生成段階と、前記資源要求が発行された時間順に前記共用資源に関係するスイッチング機構へ前記資源要求を提示する段階と、前記資源要求に関係する前記要求タグを前記スイッチング手段のタグ待ち行列に格納する段階と、資源応答を生じるために前記要求された資源が使用可能となった時に前記資源要求にサービスする段階と、前記資源要求がサービスされた順序で前記スイッチング手段に前記資源応答を返す段階と、前記タグ待ち行列からの前記各要求タグを前記資源応答に関係づける段階と、前記資源要求および各要求タグを前記プロセッサに返す段階とを含んでおり、それによって、前記資源要求が発行された時間順序に対して前記資源応答が乱順で返され得ることを特徴とする方法。
１７．請求項１６記載の方法であって、前記資源要求にサービスする段階が、前記多重プロセッサシステムの所定のクロックサイクルで前記共用資源へ経路指定される前記資源要求間でアービトレーションを行う段階と、前記資源要求のアドレスの妥当性を検証する段階とを含むことを特徴とする方法。
１８．請求項１７記載の方法であって、前記資源要求にサービスする段階がさらに、前記資源要求に関係する取り消し指示を検査し、前記取り消し指示に応答して前記資源要求が前記共用資源へ経路指定された時より以前の前記資源要求を取り消す段階を含むことを特徴とする方法。
１９．請求項１６記載の方法であって、前記リクエスタおよび共用資源が複数のクラスタに編成されており、かつ、前記資源要求にサービスする段階がさらに、遠隔クラスタの共用資源へ向けられた前記クラスタのリクエスタから遠隔資源要求を受信することと、前記遠隔資源要求を遠隔クラスタに転送し、前記遠隔クラスタから資源応答を受信することを含むことを特徴とする方法。
２０．請求項１９記載の方法であって、前記資源要求にサービスする段階がさらに、前記クラスタの共用資源に向けられた前記遠隔クラスタから遠隔資源要求を受信することと、前記遠隔要求について前記遠隔クラスタヘ前記資源応答を返すことを含むことを特徴とする方法。