A.はじめに
以下では、本発明の好適な実施例を実現するシステムの詳細な説明を、システムの簡単な全体像から始め、システムの主な機能ユニットのそれぞれの詳細な説明に進みながら行う。システムの主な機能ユニットのそれぞれの説明は、システム内の他の機能ユニットに対する、その機能ユニットの相互の構造的及び動作的な関係の説明を含む、ブロック図レベルの説明から始める。1つの機能ユニットのブロック図レベルの説明に続いては、その機能ユニットの選択された機能及び動作の更なる説明を行う。
各説明には図面を付して説明の対応する部分を図解するが、各図面は対応する説明に特に焦点を合わせているのであり、その機能ユニットのすべての要素を示すのではない。ただし、各機能ユニットの主要な要素は、その機能ユニットの説明に関係する図面において図解されている。
1.システム10の説明
図2及び図3を参照すると、本発明を組み入れて実現している対称型マルチプロセシング・システム10の一般的なブロック図が示されている。図1は図2と図3との関係を示す図3である。示されているように、システム10は、システムの複数の機能ユニットを相互接続する拡張型アーキテクチャの多重(multiple)プロセッサ(XA−MP)バス12を含む。システムの機能ユニットには、データとシステム動作及びデータ上の動作を制御するプログラムとを記憶する1つ又は複数のメモリ・モジュール(MMs)14と、プログラムの命令に応答してプログラムによって指示される動作を実行する1つ又は複数のプロセッサ・モジュール(PMs)16と、XA−MPバス12及びシステムの機能ユニットをシステムの他の要素に接続する他のオルタネート・システム(AS)バス20に相互接続する1つ又は複数のブリッジ・モジュール(BMs)18と、が含まれる。ASバス20は、たとえば、インテルのi486バスや、EISA及びMCAバスを含み得る。ASバス20は、たとえばインテルのi486マイクロプロセッサなどのマイクロプロセッサ等の処理要素及びメモリや、ディスク・ドライブ、キーボード、通信コントローラ、及びグラフィック・アダブタなどの視覚的表示発生器を含み得る入出力装置24などのシステムの他の要素22に相互接続されている。
図2及び図3に示され以下で説明するように、XA−MPバス12は、データを移動(トランスポート)させる1つ又は2つのデータ・バス26と、メモリ及び入出力空間アドレスとスライス情報とを移動させるアドレス(ADDR)バス28と、バスに関連する動作をXA−MPバス12から接続されたシステムのユニットによって実行させるように指示するコマンドを移動させるコマンド(CMD)バス30と、から成る。また、XA−MPバス12には、システムの機能ユニットがそれらの間での仲裁をしてXA−MPバス12ヘアクセスしたり以下で説明するそれ以外の動作をするのに用いる複数の仲裁(ARB)ライン32と、割り込み動作において用いられる割り込み(INT)ライン34と、以下で必要に応じて説明される多数の制御(CNTL)ライン35とが関連している。XA−MPバス12のすべてのラインとXA−MPバス12に関連するすべての制御ラインとは、両端においてレジスタ又はラッチされており、すべてのバス動作は、ラッチされたデータ及び信号との関係でのみ実行されることに注意されたい。
やはり以下で論じるが、XA−MPバス12のデータ・バス26は、XA−MPバス12のADDRバス28及びCMDバス30とは動作的に分離されており独立であって、XA−MPバス12上の情報転送のプライマリ・モードは、すなわち、MMs14からの読み取りに対しては、順序付き(ordered)転送の形態である。更に、2つのデータ・バス26は、動作的には相互に独立であり、それぞれが他方とは独立に転送を実行する。
順序付き転送においては、各機能ユニットは、その機能ユニットにおける順序付き要求行列の動作を通じてそれ自体のメモリ要求をトラッキングし、情報要求側と提供された情報との間の通常の一連のハンドシェーキング動作は除去され、よって、メモリ読み取りの速度の強化が実行される。XA−MPバス12は、また、非順序(out−of−order)モードでも動作することができ、その場合には、データ・バス26の動作は、ADDRバス28及びCMDバス30の動作に結合されており、要求側と提供側との間のハンドシェーキングを要求する非順序転送を行う。
XA−MPバス12に結合したシステムの各機能ユニットは、対応するタイプの機能ユニットによって実行されるべき動作を実行する動作要素の組から成っている。これらの動作要素には、XA−MPバス12のADDRバス28とCMDバス30とに接続されXA−MPバス12に関する機能ユニットの動作を制御するバス・インターフェース制御ユニットと、それぞれがデータ・バス26の1つに接続されその機能ユニットの動作要素とXA−MPバス12との間でデータを移動させる2つのバス・インターフェース・データ・パス・ユニットと、が含まれる。システム10の別の構成では、XA−MPバス12は、ただ1つのデータ・バス26を含む又は用い、その機能ユニットは、従って、その1つのデータ・バス26に接続するただ1つのデータ・パスを含む又は用いる。
たとえばMM14の場合には、動作要素は、メモリ記憶素子(MSE)36から成り、これは、たとえば、そのようなメモリに通常用いられるシングル・インライン・メモリ・モジュール(SIMM)の集積回路として構成されるコラム及びローのアレーのダイナミック・ランダムアクセス・メモリ(DRAMs)から成り得る。メモリ・バス・インターフェース制御ユニットは、メモリ・コントローラ(MC)38から成り、他方、メモリ・データ・パス・ユニットは、一方が各データ・バス26に接続された1対のメモリ・データ・パス(MDPs)40から構成されている。XA−MPバス12が1つのデータ・バス26を含む構成の場合には、MM14は、対応して、1つのMDP40を含む。
PM16の場合には、動作要素は、それぞれが内部的なプライマリ・キャッシュとそれに伴うキャッシュ・メカニズム(CM)44とを有し、それぞれがセカンダリ・キャッシュ(SC)46とキャッシュ・ディレクトリ及びコントローラ(CD)48とから構成され得る、1つ又は複数のプロセッサ・ユニット42から成る。それぞれのプロセッサ・ユニット42に対してはPM16バス・インターフェース制御ユニットが存在し、これは、メモリ・バス・コントローラ(MBC)50と各プロセッサ・ユニット42に対する1つ又は複数のプロセッサ・データ・パス(PDPs)52から成るデータ・パス・ユニットとによって表され、各プロセッサ・ユニット42に伴うPDPs52の数はやはりデータ・バス26のXA−MPバス12の数に依存する。示されているように、各PM16は、更に、INTライン34から接続された1つ又は複数のアドバンスト・プロセッサ割り込みコントローラ(APICs)54を含み、プロセッサ・ユニット42に対する割り込み動作を扱う。
最後に、BM18の場合には、動作要素(OEs)56はBM18が支持すべき動作のタイプに依存しており、たとえば、種々のタイプのASバス20又は特定の目的のための動作要素とインターフェースするバス・インターフェース論理の組から成る。BM18においては、バス・インターフェース制御ユニットは、1つ又は複数のアドバンスト・バス・インターフェース・コントローラ(ABICs)58から成り、これが、MBCs50と本質的に同じタイプの機能を実行する。各バス・インターフェース制御ユニットに伴ってバス・インターフェース・データ・ユニットがあり、各バス・インターフェース・データ・ユニットは、やはりデータ・バス26の数に依存する1つ又は複数のデータ・バス・インターフェース・コントローラ(DBICs)60から構成され、これが、PDPs52及びMDPs40と本質的に同じタイプの機能を形成する。各BM18は、また、APIC54を含み、割り込み動作を扱う。
2.システム10のアーキテクチャ上のいくつかの特徴の概要
上述のように、システム10は、対称型マルチプロセシング・システムであり、そこでは処理は、メモリ・モジュール14に記憶されているプログラムの制御の下に複数の処理ユニット42の任意のものにおいて実行され得る。以下で概要を述べるように、そしてその後で詳細を説明するように、このシステムは、多重処理を同時に実行する統一された動作環境を与え、他方で、多くのシステム機能は、1つの機能ユニットに集中されるのではなくシステムの複数の機能ユニットに分散されている。
たとえば、システム10は、1つのアドレス空間内ですべての動作を実行することによって統一された環境を提供し、そこでは、システムのすべてのデータ、プログラム及び情報の記憶機能はその1つのアドレス空間を占める。そのようなデータ、プログラム及び情報の記憶機能は、たとえば、MMs14のメモリ空間や、プロセッサ・ユニット42のレジスタや、ビデオ・コントローラ及び入出力装置の表示メモリなどの情報記憶機能やオペレーティング・システム及びパーソナル・コンピュータで通常用いられているROM BIOSsなどBIOSsを記憶するのに要求される空間などのそれ以外の情報記憶機能を含む。
しかし、情報記憶の管理は、一般的に、システムの複数の機能ユニットの間に分散されており、それによって、たとえば、MMs14は、MSEs36がデータ及びプログラムを記憶するのに用いるアドレス空間内のアドレス位置を管理する責任を有する。同様にして、PMs16は、プロセッサ・ユニット42のレジスタが占めるアドレス空間位置を管理する責任を機能的に有し、一方、BMs18は、ビデオ・ディスプレイ・コントローラが用いROMが占めるアドレス空間位置とROM BIOSsなどのプログラム及びデータを記憶するその他のメモリとを管理する責任を有する。
このシステムの1つのアドレス空間の管理は、プロセッサ・レジスタなどの種々の記憶手段と、MMs14における物理的メモリ位置と、ROM BIOSsのためにビデオ・ディスプレイ・コントローラのためのビデオ・メモリとしてROMにおいて提供される記憶装置とを、アドレス空間内にマッピングすることによって、本質的には実行される。システム10では、各機能ユニットは、従って、それに伴う記憶空間をシステムの1つのアドレス空間内にマッピングする責任を有している。
システムのアドレス空間の分散された管理を図解するために、各プロセッサ・ユニット42は、それに伴うレジスタのブロックを有しており、バス動作に関係する制御情報を記憶する。しかし、システム10においては、これらのレジスタは、システム幅の1つのアドレス空間の一部としてアドレス指定される。
これを達成するために、各プロセッサは、それに伴うレジスタを有し、本質的に、システムのアドレス空間におけるレジスタのブロックの中の最初のレジスタの最初のアドレスを表すオフセット・アドレスであるポインタを記憶する。システムの初期化の際には、システム内の各処理ユニットないし各機能ユニットは、XA−MPバス12上の位置又は「スライス」番号を決定し、各機能ユニットは、XA−MPバス12上の位置との関係では、「スライス」と呼ばれる。以下でシステム10の仲裁メカニズムに関して更に述べるように、機能ユニットのスライス番号は、XA−MPバス12のアクセスに対するその機能ユニットの相対的なプライオリティを決定するのに使用され、システム10の仲裁メカニズムの動作を介してシステムの初期化の際に決定される。
スライス番号は、次に、レジスタの各ブロックに対するオフセット・ポインタ値を決定するのに用いられ、これらの値は関連するレジスタに記憶されてそのブロックのレジスタをアドレス指定する際に使用され、レジスタのブロックには、通常はシステムのアドレス空間内の高い位置にアドレス空間位置が指定され、MMs14内のシステム・メモリに指定されたアドレス空間とのコンフリクトを避ける。
以下で説明するように、このスライス番号情報のあるものは、システムの他の機能ユニットに提供され、そのアドレス指定可能なメモリ又は記憶領域をシステムのアドレス空間内にマッピングするのに用いられる。たとえば、このスライス番号は、処理ユニットの機能ユニットからMMs14に提供され、以下のMMs14の説明で述べる態様でMMs14によって用いられ、システムのアドレス空間のアドレスをメモリ内のSIMMメモリ・チップの物理的アドレス位置に変換するアドレス翻訳テーブルとして構成する。
アドレス指定可能な記憶装置又はそれに伴いバス動作に関係するメモリ空間を有する各機能ユニットに対して同様な処理が続き、各機能ユニットは、それに伴う記憶装置又はメモリ空間をシステムのアドレス空間にマッピングする。各機能ユニットは、その後は、その機能ユニット内の又はそれに伴うメモリ又は記憶アドレス位置を参照するXA−MPバス12上のアドレスを検出する責任を有し、適切に応答する。
同様にして、システムの各機能ユニットは、データやプログラム命令などのその記憶空間に存在するすべての情報の管理の責任を有する。システムの分散機能のこの側面は、キャッシュされた情報との関係で特に意義をもつが、これは、各機能ユニットはMMs14を除いてその機能ユニットによって用いられる又は動作を与えられる情報を記憶するキャッシュ・メカニズムを与えられているからである。したがって、PM16には、その中に存在する処理ユニット42の数に依存して1つ又は複数のキャッシュが与えられ、処理ユニット42の動作を制御するプログラム命令と処理ユニット42によって動作を与えられるデータとを記憶する。同様にして、システム10に対し主に入出力ユニットであるBMs18には、XA−MPバス12から接続された機能ユニットとBMs18から接続されたバス又は装置との間で転送される情報のためのキャッシュが提供される。
システム機能のシステムの複数の機能ユニットの間での分散を更に図解するために、対称型マルチプロセッサ・システムでは、1つの処理がシステム内の任意のプロセッサ上で実行されること、また、1つの処理が1つのプロセッサに指定され実行を開始し、たとえばその処理のプロセッサ時間スライスの終了までに実行を停止し、後に、システムの別のプロセッサ上で実行を再開することは、広く知られている。システム10では、1つの処理がある処理ユニット42に指定され、その処理に所属しMMs14からその当初の処理ユニット42に関連するキャッシュ・メカニズムに読み取られたデータ及び命令を用いて処理ユニット42において実行が開始され、それによって、キャッシュ・メカニズムにキャッシュされたデータ及び命令は、その処理が実行されている機能ユニットに、すなわち、プロセッサ42とそれに関連するキャッシュ・メカニズムとに「所属」する。この処理が後に上述のように当初の処理ユニット42から「切り換え」られた場合には、当初の処理ユニット42にキャッシュされていたデータ及び命令はその当初の処理ユニット42のキャッシュ・メカニズムにあるままであって、その処理ユニット42がデータ及び命令をメモリに転送して返すのにキャッシュ・メモリ空間が足りないなどの理由かない限りは、その当初の処理ユニット42に所属し続ける。
その処理は、別の処理ユニット42上で実行を再開する場合には、その処理に要求されるデータ及び命令が実行されることを要求し、以下で述べるように、XA−MPバス12上にデータ及び命令への要求を置く。次に実行されるイベントのシーケンスは、メモリから最初に読み取られたデータが修正(変更、modify)されていたかどうかに依存し、以下で更に詳細に説明されるように、システム10では、いかなる時刻においても、データのただ1つのコピーだけが存在することが許される。
メモリから当初の処理ユニット42のキャッシュ・メカニズムに読み取られたデータが修正されておらずキャッシュ・メカニズム内に修正されたとのマークがなされていない場合には、有効なコピーは、メモリの中に存在するコピーであると推測され、メモリからその処理がその上で現に実行されているプロセッサ・ユーット42のキャッシュ・メカニズムに読み取られる。データが修正されていて最初の処理ユニット42のキャッシュ・メカニズムの中に修正されたとのマークを付して存在する場合には、データのこの修正されたコピーが、データの唯一の有効なコピーであり最初の処理ユニット42に「所属」する。後に更に説明するように、システム10の各機能ユニットは、「スヌーピング」と呼ばれる処理においてXA−MPバス12上に現れるすべての読み取り要求をモニタし、最初の処理ユニット42は、よって、データの「シェアされた(shared)」コピーを含む任意の他の機能ユニットのように、新たな処理ユニット42によってXA−MPバス12上に置かれたデータ読み取り要求を検出する。
後でXA−MPバス12の詳細な説明やシステム10に関する他の説明部分で述べるように、要求されたデータのコピーを有する任意の機能ユニットは、XA−MPバス12上のデータに対する要求を検出し、その要求に肯定応答するが、これは、従来技術におけるシステムでは、肯定応答するユニットが要求されたデータを提供することによって応答する肯定応答からなっていた。しかし、システム10では、最初の処理ユニット42のようにデータの修正されたコピーを有する機能ユニットは、メモリにおける読み取り動作をキャンセルし要求側の機能ユニットにデータはメモリ以外のソースから提供されることを告げるメモリ・サイクル禁止(MCI)及びCDMコマンドをアサートする。データの有効なコピーすなわちデータの修正されたコピーを有する機能ユニットは、次に、XA−MPバス12に対して仲裁を行い、データの修正されたコピーを非順序の転送を介して新たな処理ユニット42に与える。最初の所有している処理ユニット42からデータの修正されたコピーを受け取る処理ユニット42は、データの「所有者」となり、応答の際にはそのデータを管理する責任を想定する。
以下で詳細に述べられるシステム10の機能要素の間のシステム機能の分散の他の例には、機能ユニットの間のXA−MPバス12アクセスの仲裁と、メモリ読み取りを要求している各機能ユニットがそれ自身の読み取り要求のトラッキングと対応するメモリ応答の検出及び応答の責任を有するメモリからの順序付き読み取りの実行と、SIMMモジュールのタイプ、バス転送速度及びそれ以外のファクタに依存するメモリ動作の適合的タイミングと、が含まれる。
以上で、本発明を実現するシステム10の一般的な構成と動作とを説明したので、以下では、システム10の機能ユニットを更に詳細に説明する。
B.システム10の詳細な説明
1.XA一MPバス12
再び図2及び図3を参照すると、XA−MPバス12は、データを移動させる1つ又は2つのデータ・バス26と、メモリ空間アドレスを移動させるアドレス(ADDR)バス28と、XA−MPバス12から接続されたシステム・ユニットによって実行されるべきバスに関係した動作を示すコマンドを移動させるコマンド(CMD)バス30と、から構成されている。やはり示されているように、複数の仲裁(ARB)ライン32がXA−MPバス12に関連しており、システムの複数の機能ユニットがXA−MPバス12へのアクセスに関してそれらの間で仲裁をするのに用いられる。また、以下で述べるそれ以外の動作も行う。XA−MPバス12には割り込み(INT)ライン34も関連しており、これは、割り込み動作及び制御(CNTL)ライン35において用いられる。
以下での説明のために、システムで用いられるプライマリ・データ要素は、情報すなわちデータ及び命令はシステム10のキャッシュの中に各ラインがキャッシュ・メモリにおける1つのアドレス位置を占めるラインとして参照されるユニットでキャッシュされているから、キャッシュ・ラインとして参照されるデータ又は命令のブロックであることに注意すべきである。
各キャッシュ・ラインは、256ビットすなわち32バイトの情報を含み、各データ・バス26は、64ビットすなわち8バイトの幅を有しており、それによって、データ・バス26上の1つのキャッシュ・ラインの転送は、実際のデータ転送に4つのバス・クロック・サイクルを要する。更に、メモリからの標準的な読み取りは、1つのキャッシュ・ラインから成り、すなわち、メモリへの1つの読み取り要求の結果として、32バイトのキャッシュ・ラインがXA−MPバス12上を要求側に転送され、よって、バスの4つの転送が必要となる。
各XA−MPバス12の動作は、更に、「バス所有者」の間での切り換えのために1つのバス・クロック・サイクルを要求する。すなわち、1つのバス・クロック・サイクルが、XA−MPバス12が動作を実行するのにバスを現に使用している機能ユニットから次のバス動作のためのバスへのアクセスを取得した次の機能ユニットへ転送されるのを制御するのに必要となる。
後でMMs14に関して述べるように、各MM14のMSEs36は、アドレス位置のデュアル・コラムとして構成されており、そこでは、一方のコラムが偶数のアドレス位置を含み、他方のコラムは奇数のアドレス位置を含み、各コラムは、64ビットの情報を記憶する。MMs14は、よって、当初はハーフ・キャッシュ・ラインとして構成され、2つのコラムを横断する各ローは、128ビットのハーフ・キャッシュ・ラインを有し、SIMM回路の2つのコラムを横断する1つのローからの1つの読み取り動作は、ハーフ・キャッシュ・ラインの情報を提供する。システム・アドレス空間マッピングへのMM14は、好ましくは、連続するハーフ・キャッシュ・ラインが別のグループのSIMM回路に記憶されるように構成されており、それによって、2つの連続するハーフ・キャッシュ・フインは異なるメモリRAS(ロー・アドレス・ストローブ)信号すなわち異なるRASドライバ回路を用いてMMs14から読み出され、よって、80nsのSIMMを用いる際の更なるアクセス遅延時間を除去する。
上述のように、システム10のこの好適実施例においては、XA−MPバス12には、幅がそれぞれ64ビットすなわちハーフ・キャッシュ・ラインである2つのデータ・バス26が与えられ、バス上の情報転送速度を高めている。
以上で述べてきたように、2つのデータ・バス26は、相互に独立に動作する。データ・バス26のいずれもか、メモリからの読み取りなどのバス・データ転送を実行するために使用され、1つのバス・データ転送は一方又は他方のデータ・バス26上で完全に実行され、2つのバス転送が、一方は一方のデータ・バス26上で、他方は他方のデータ・バス26上で、同時に実行される。
メモリからのキャッシュ・ライン読み取りのような1つの「標準的な」XA−MPバス12の動作は、よって、5つのバス・クロック・サイクルを必要とするが、その場合、1つは送信機能ユニットがバスの制御を行うためであり、4つは2つのデータ・バス26の1つの上のデータ転送のためである。XA−MPバス12及びMMs14の詳細な説明で述べられるように、システム10は、単一バス・ワード転送を行い、転送は偶数又は奇数のキャッシュ・ライン・アドレスを用いて開始され、すなわち、偶奇偶奇・・・の順に制限されない。
上述のように、XA−MPバス12のデータ・バス26は、XA−MPバス12のADDRバス28及びCMDバス30とは動作的に分離されており独立であって、MMs14からの読み取りのためのXA−MPバス12上の情報転送は、順序付き転送の形式を有しており、読み取り要求への応答は、なされた順序で満たされる。順序付きの読み取り動作においては、応答は、要求が応答のための要求を受け取った機能ユニットによって受け取られてから数バス・サイクル後に生じ、これは、応答のために他の要求行列が存在したかどうかに依存する。このタイプの動作は、この応答が要求から時間内に(in time)除去され得るので、「スプリット・サイクル」を称される。
システム10における順序付きの転送では、各機能ユニットは、他の機能ユニットのメモリ要求とは独立に、各機能ユニットにおける順序付きの要求行列(ordered request queue)の動作を通じて、それ自身のメモリ要求をトラッキングする。順序付きの要求行列によって、機能ユニットが、メモリからそれ自身及び他の機能ユニットへのメモリ読み取りとすべての順序付きの転送との要求の両方をトラッキングすることと、いつメモリからの順序の付いた(in order)転送がその要求の1つに応答して提供されるかを検出する。次に1つの機能ユニットが、XA−MPバス12からデータを受け取ることによって応答する。従来型のバスにおいて情報要求側と情報提供側との間で実行されるハンドシェーキング動作の通常のシーケンスは、順序付きの読み取りサイクルの応答部分の間、このように除去される。
非順序モードでは、データ・バス26の動作は、ADDRバス28及びCMDバス30の動作に結合され、要求側と提供側との間のハンドシェーキングを要求する非順序転送を実行する。このような非順序転送では、要求に応答して情報を提供するユニットは、必ずしもその要求がXA−MPバス12上に置かれたのと同じシーケンスでそうするのではなく、情報提供側は、したがって、アドレスすなわちその要求を行っているユニットのスライス番号を調べなければならない。要求された情報を提供するユニットは、要求側のユニットすなわち情報を受け取る側のユニットのスライス番号をADDRバス28上に置き適切なコマンドをCMDバス30上に置きデータをデータ・バス26上に置くことによって、データ・バス26の動作をADDRバス28及びCMDバス30に結合させる。そして、受け取る側のユニットは、そのスライス番号とコマンドとに応答してデータを受け取る。
後に述べるように、メモリからのデータ読み取りの要求は、順序付きの要求としてXA−MPバス12上に置かれる。情報がメモリからではなくプロセッサ・ユニットのキャッシュ・メカニズムから戻された従前の例のようにデータがメモリ以外のユニットから提供される場合には、この情報を含むユニットは、上述したようにメモリ動作をキャンセルすることによって応答し、非順序応答を生じる。そうするために、応答側のユニットは、要求側のユニットのアドレスすなわちスライス番号を取得しなければならず、要求側のユニットからではなくバス仲裁メカニズムから要求側ユニットのスライス番号を取得し、よって、要求側のユニットは、各要求に対して自己識別アドレスを提供する必要がない。それぞれの情報読み取り要求は、順序付きの要求として要求側のユニットによって最初は発生され、その要求側のユニットは、その要求がどのように満たされるかを前もって知る必要はない。
上述したように、順序付きの動作は、キャッシュ・ラインとメモリからのバス・ワード読み取りのために用いられ、システム10の中の読み取り動作の多数を有している。非順序動作は、キャッシュからキャッシュへの転送、ワード転送及びBMs18を介しての入出力動作のために用いられ、よって、動作のそれぞれのタイプに対するXA−MPバス12の動作を最適化する。
2.メモリ・モジュール14
a.メモリ・コントローラ38の説明
以上で述べてきたように、各MM14は、SIMMモジュールのようなメモリ回路のロー及びコラム・アレーであるMSE36から構成され、当該技術分野で周知のように、アドレス指定可能にデータを記憶し提供する。各MM14は、更に、そのMM14に対して制御機能を提供するMC38と、MSE36とXA−MPバス12との間にデータ・パスを形成しそれぞれがデータ・バス26の1つに接続されている1つ又は複数のMDPs40と、を含む。
図4及び図5を参照すると、MC38とMDP40とのブロック図が示されている。最初に図4を参照すると、MC38及びXA−MPバス12とバス動作に関連する制御ラインとの間の第1の(プライマリ)インターフェースは、XAMP制御インターフェース(XAMPCI)62とコマンド・アドレス入力ブロック(CMDAI)64とによって提供される。
XAMPCI62は、XA−MPバス12動作に関連する制御ラインのあるものとインターフェースし、これは、以下のMC38の詳細な説明において説明される。図4に示されるように、XA−MPバス12からXAMPインターフェース62への入力信号は、システム仲裁メカニズム(ARB)の9つのARB信号ラインを含み、コマンド・ストローブ(CS#)が、CMDバス30上のコマンドの存在を示す。
XAMPCI62からの出力信号はACK及びNAK信号を含み、CAE#信号が、メモリが受け取ったコマンド及びアドレスが誤っていることを示す。DS0#及びDS1#は、2つのデータ・バス26に対する個別のデータ・ストローブ信号であり、ORD0#及びORD1#は、2つのデータ・バス26に対する個別の信号でありORD#信号に対応してデータ・バス26上に順序付きの応答が存在していることを示す。
示されているように、XAMPCI62は、メモリ・コマンドFIFO(先入れ先だしメモリ)への局所的応答出力を与え、以下述べるように、メモリによって応答される動作要求が受け取られたことを示す。XAMPCI62は、また、それぞれがデータ・バス26の1つに対応し対応するデータ・バス26からMDP40へのデータ転送をイネーブルするのに用いられるBIN0#及びBIN1#を含むMDP40への複数の出力を与える。BOUT0#及びBOUT1#は、それぞれが、データ・バス26の1つに対応し、メモリから対応するデータ・バス26へのデータ転送をイネーブルするのに用いられる信号である。BACK0#及びBACK1#は、それぞれが、データ・バス26の1つに対応し、対応するデータ・バス26上の書き込みサイクルが有効に肯定応答されたとえばMCIによって吸収されないことをMDP40に表す信号である。
CMDAI64は、ADDRバス28及びCMDバス30とインターフェースし、以下のMC38の詳細な説明で述べる他のバス動作制御ラインに対して、アドレス及びコマンドを受け取り提供する。CMDAI64への入力には、ADDRバス28上に現れるアドレスと、CMDバス30からのコマンド信号(CMD)と、コマンドがCMDバス30上に存在することを示すコマンド・ストローブ信号CS#と、が含まれる。AP及びCP入力は、それぞれ、アドレス及びコマンド・パリティ・ビットである。信号BUSL#は、要求側の機能ユニットがロックされている、すなわち、拡張された周期の間XA−MPバス12の制御を受けることを示すバス制御ライン入力である。
図4に示されているように、CMDAI64は、その中への記憶のために上述のメモリ・コマンドFIFOに出力を提供し、この出力は、メモリ要求のアドレス及びコマンドといくつかの制御ビットとを含む。CMDAI64は、また、XAMPCI62にヒット及び誤り(エラー)出力を提供して、それぞれどの場合に受け取られたメモリ要求が何らかの理由で有効又は無効であるかを示す。
図4には、MC38は、更に、例外及び誤り条件を扱うために提供される例外制御(EXCEPT)66を介して、XA−MPバス12及び関連するバス動作制御ラインとのインターフェースを有することが示されている。EXCEPT66についてはここではこれ以上説明しないが、MC38の詳細な説明の部分で更に述べることにする。MC38は、また、走査制御(SCAN)65を含み、これについても、MC38の詳細な説明の箇所で述べる。
メモリ動作要求は、上述のメモリ制御FIFO(MC FIFO)68の動作を介して、MC38においてパイプラインされる。示されているように、MCFIFO68は、CMDAI64とXAMPCI62とから実行されるべきメモリ動作を定義するアドレス、コマンド及び応答入力を受け取り、受け取られた順序で動作されるべき動作を記憶する。
これ以外の入力がMDP40からMC FIFO68に提供されるが、この入力には、MDP40によって対応するデータ・バス26上で検出されたパリティ誤り(エラー)の存在を示すMDPE0#及びMDPE1#バス制御信号が含まれる。メモリ・サイクル禁止(MCI#)信号は、既に述べたように現在のメモリ動作がキャンセルされたことを示し、キャッシュ・データ修正(CDM#)及びキャッシュ・データ共有(shared)(CDS#)信号は、要求されたデータの修正された又は共有されたコピーの存在が別の機能ユニットにおいて示されていることと現在のメモリ・サイクルがキャンセルされていることとを、示している。ACK#及びNAK#信号は、それぞれが、MC38は現在のメモリ動作を受け取った又は受け取っていないことを示し、一方、コマンド又はアドレス誤り(CAE#)は、MC38がコマンド又はアドレス誤りを検出したことを示す。
MC FIFO68とEXCEPT66とは、それぞれが、MCマネジャ70との制御信号インターフェースを有し、MCマネジャ70は、メモリ動作に対して基本的な制御及び管理機能を提供する。示されているように、MCマネジャ70は、ペンディングな要求の存在を示す要求信号FREQUENTをMC FIFO68から受け取り、その代わりに、その要求は実行してよいことを示すFGRANT信号を提供する。MCマネジャ70は、同時に、要求を実行し得ることを示すEGRANT信号をEXCEPT66に提供し、ペンディングな要求の存在を示すEREQUENTを受け取る。
これらの信号の結果として、MCマネジャ70は、次に、アドレス(ADDR)の発生、ロー・アドレス・ストローブ(RASs)、コラム・アドレス・ストローブ(CASs)及びMMs14のMSEs36への書き込みイネーブル(WE)信号を制御する際にDRAMコントローラ72によって用いられる制御出力をDRAMコントローラ72に提供する。通常のように、MSEs36は、SIMMモジュールとして物理的に構成されたDRAMsから成る。
DRAMコントローラ72へのその他の入力には、MC FIFO68から又はEXCEPTION66から提供されたアドレス、サイクル及びレーン制御信号が含まれ、これらは、MMs14の詳細な説明で述べられるように、本質的に、MC FIFO68に記憶された要求アドレス及びコマンド情報から導かれるアドレス指定情報である。
図4に示されるように、MC38は、MC FIFO68からの入力を有する可視レジスタ・ブロック(VRB)74と、EXCEPTION66と、MCマネジャ70と、システムにアクセス可能であり誤り情報の基本的制御を記憶し提供するのに用いられるレジスタから成るMDPインターフェース(MDPI)76と、を含む。
MDPI76は、MC38とMDP40との間の制御及び同期インターフェースを提供し、MC38によるメモリ動作の制御によるMDP40を介してのMM14への及びMM14からのデータ転送を制御し同期化する。
示されているように、MC38とMDP40との間で交換されるこれらの制御信号は、MC38とMDP40との間を通過するコマンドであるマルチビットのMCコマンド(MCMD0及びMCMD1)を含み、よって、各ユニットは、他方の何らかの動作を要求する。MC38及びMDP40の詳細な説明に示されるように、これらのコマンドは、本質的に、MSE36がSIMMアレーのDRAMからのバス・ワード又はキャッシュ・ラインの読み取りを実行するかどうかなどの、実行されるべきメモリ読み取り又は書き込み動作の特定のタイプに関するものである。データ・ラインMDATA0#及びMDATA1#は、MC38とMDP40との詳細な説明で述べるように、MC38とMDP40との間のMC38/MDP40動作において用いられるデータを通過させるのに用いられ、信号MGO0#及びMGO1#は、MC38又はMDP40によって動作を開始させるのに用いられる。
b.メモリ・データ・パス40の説明
次に図5を参照すると、MDP40のブロック図が示されている。上述のように、MC38は、本質的に、MM14に対してすべてのタイミング及び制御機能及び信号を与え、また、MM14によって実行されるメモリ及びXA−MPバス12動作を与える。他方で、MDP40は、本質的に、XA−MPバス12とMSE36のメモリ要素との間のパイプラインされたデータ・パスである。既に述べたように、各MM14は、2つのMDP40を有しており、その一方はデータ・バス26のそれぞれと接続され、データ・バス26へのデータ接続を有する各機能ユニットは、それぞれが、同様に、この2つのデータ・バス26に接続された2つの同様のデータ・パス要素を含む。ただ1つのデータ・バス26を用いる又は有するシステム10の構成においては、各MM14はただ1つのMDP40を有する又は用い、また、それぞれの機能ユニットは、同様に、1つのデータ・バス26に接続するためのただ1つのデータ・パス要素を有する又は用いる。
MDP40は、XA−MPバス12へのXA−MPバス12データ・インターフェース(XAMPDI)78と、MSEs36のDRAMへのDRAMインターフェース(DRMI)80とを含む。示されているように、XAMPDI78は、XA−MPバス12のデータ・バス26に対して双方向のデータ・インターフェースを有し、XA−MPバス12を用いて、64ビットのデータ(BD)と8ビットのデータ・パリティ(BDP)とを転送する。XAMPDI78は、更に、XA−MPバス12に関連する制御ラインに対して双方向のバス未訂正データ誤り(BUDE#)信号ライン・インターフェースを有し、メモリに提供される又はメモリから読み取られるデータにおける未訂正の誤りを示す信号を受け取り提供する。
MDP40のMSEs36とのインターフェースは、DRMI80を介して提供され、MSE36のDRAMとの間の2つの双方向の64ビット幅のデータ・パスからなり、これは、図5では、DD0(63:0)とDD1(63:0)と称されている。既に述べたように、MSEs36のメモリ要素は、偶数アドレスのコラムと奇数アドレスのコラムとの2つのコラムとして構成されており、各コラムは、1バス・ワード又は4分の1キャッシュ・ライン幅を有している。MSE36のメモリ要素に接続された2つのデータ・バスは、したがって、1バス・ワードを1つのメモリ内部サイクルで、又は、1つのキャッシュ・ラインを2つのメモリ内部サイクルで転送する能力をもつ。MSEs36への各データ・バスすなわちDD0(63:0)及びDD1(63:0)に関連し並列であるのは、DC0(7:0)及びDC1(7:0)と識別されている2つの双方向の誤り検出及び訂正バスであり、MSEs36とMDP40のメモリ要素の間でデータ・チェック・ビットを搬送する。この点で、MSEsは、情報だけを記憶するのではなく、MSEs36の各バス・ワード幅のコラムのローはメモリ要素を含みその中に記憶される対応するバス・ワードに関連するデータ・チェック・ビットを記憶することに注意するべきである。
XA−MPバス12からの入力パスは、XAMPDI78から書き込み・パス・メモリ(WRITE PATH)82に延び、MSE36へのデータ書き込みをパイプラインするのに用いられる。以下で述べるように、WRITE PATH82は、また、データとDRMI80からのチェック・ビット・パスとにおいて接続された出力EDAC発生器及び訂正器(EDAC)84からのデータ・パス入力を有する。MDP40の詳細な説明において述べられるように、このパスは、データ書き込み及び訂正動作のために用いられる。
WRITE PATH82からのデータ・パス出力はDRMI80へのデータ・パス入力に接続され、情報がそれを介してMSEs36に書き込まれるパスを提供する。WRITE PATH82からのデータ・パス出力は、また、MSEs36の中に書き込まれる各バス・ワードに対するチェック・ビットを発生する書き込みチェック・ビット発生器(WCBG)86へのデータ・パス入力に接続されており、WRITE PATH82からMSEs36の中に書き込まれるべきバス・ワードとして提供されたデータと並列に、DRM180へのチェック・ビット書き込みパス入力を介してチェック・ビットを提供する。
WRITE PATH82のデータ・ワード出力は、また、MDPレジスタ(MDPRs)88への入力として提供されて、何らかのMDP40レジスタの書き込みを許容する。WRITE PATH82及びMDPR88の出力は、上述のようにMDPI76とインターフェースするMCインターフェース(MCI)90への入力として提供され、MDPI76と交換される制御及びデータ信号を発生させるのに用いられる。示されるように、MDPI76と交換される制御及びデータ信号は、更に、空のFIFO上の要求された読み取り動作又は一杯のFIFO上の書き込み動作などのWRITE PATH82を有するFIFO又はREAD PATH92を有するFIFOにおける誤りが存在する場合を示すFIFO誤り信号(FIFOERO#)を含む。
次にMDP40を通るデータ出力パスを考えると、DRMI80を介してのMSEs36から読み取られたデータ及びチェック・ビットは、EDAC84への入力として提供され、EDAC84は、誤り検出及び訂正動作を実行し、MSEs36から読み取られたバス・ワードに対して訂正されたデータ・ビットと、誤り信号SBE#及びMBE#を発生する。これらはすべて、READ PATH92への入力として提供される。
READ PATH92は、本質的に、MM14から読み取られたデータをパイプラインするFIFOであり、READ PATH92のデータ・ビット出力はXAMPDI78に提供されて、要求されるようにSA−MPバス12上に転送される。
最後に、MDP40は、MDP40のある動作を制御する状態機械(STATE)94を含む。示されるように、STATE94は、XA−MPバス12からMDP40へのデータ転送をイネーブルするMC38からのバスイン(BIN#)信号と、MDP40からXA−MPバス12へのデータ転送をイネーブルするMC38からのバスアウト(BOUT#)信号とを受け取る。MC38からのこの他の信号は、有効な肯定応答された書き込みサイクルを示すバス肯定応答信号(BACK#)と、MDP40を初期化する初期化(INIT)信号とを含む。STATE94は、また、MC38から、BDATA、MGO及びMCMDを受け取るが、これに関する更なる説明は、MC38及びMDP40の詳細な説明においてなされる。
以上でMM14の全体的な構成及び動作を特にMC38とMDP40とに焦点を合わせて説明したが、以下では、MM14の特定の機能及び動作について説明する。
3.記憶されたデータに対する誤り訂正
MMs14は、読み取り・訂正・再書き込みの動作によってMSEs36に記憶されたデータの誤り訂正を行い、その場合に、読み取り・訂正・再書き込みの動作は、メモリ要素との間の情報の通常の読み取り及び書き込みを遅延させないような態様で実行される。この点で、既に、MDP40がメモリから読み取られた情報の誤り検出及び訂正をEDAC84の動作を通じて行い、WCBG86の動作を通じてメモリに書き込まれる情報に対してチェック・ビットを発生し、このチェック・ビットはメモリの中に書き込まれ、情報と共に記憶されることは説明されている。
MDP40がメモリからバス・ワードを読み取りデータにおける誤りを検出する、すなわち、データがそのデータに関連するチェック・ビットに従う場合には、MC38は、MCDEを受け取り、EDAC84を介してXA−MPバス12へ転送される誤りが訂正されつつあるデータのアドレス位置を記して、この誤りアドレス情報(ERROR ADDR)を訂正行列(CORRQ)96に記憶する。
図6に示されているように、また既に説明したように、メモリ要求、すなわち、実行されるべき動作を示すコマンドと、読み取られる又は書き込まれるべき情報のアドレスとは、XAMPCI62によってXA−MPバス12から受け取られ、メモリによって実行される場合にはXAMPCI62から成るパイプライン行列に記憶され、MC38とMDP40とによって実行される。既に述べたように、バス・ワード及びキャッシュ・ラインのメモリ読み取り動作は、順序付きの動作として実行され、各動作は受け取られた順に実行される。MC38及びMDP40の動作は、MC38によって維持されるペンディング要求行列(PREQQ)98の動作を介して調整され、その場合に、MC38はすべてのペンディングな要求の識別(ID)を記憶する。MDP40は、次に、実行されたものとして要求に関する情報を提供し、この情報をMC38のPREQQ98に提供し、よって、MC38とMDP40との同期が維持されることを可能にする。
XAMPCI62、CORRQ96及びPREQQ98に関連しているのは、XAMPCI62におけるペンディングな要求の状態をモニタしてペンディングな要求の待ち行列がいつ空になるかを検出する動作仲裁装置(OPARE)100である。待ち行列が空である場合には、OPARE100はCORRQ96をチェックし、メモリが未訂正の誤りを含む何らかの記憶位置を検出したかどうかを判断し、任意のそのようなアドレスがCORRQ96において待ち行列になっている場合には、読み取り・訂正・再書き込み動作を実行する。それぞれのそのような動作においては、MDP40は、MC38の制御動作と協力して、DRMI80を介してMSE36からのそのアドレス位置からデータを読み取り、EDAC84を介してデータを訂正し、WRITE PATH82を介してデータを元に戻す。データは、WRITE PATH82を通ってWCBG86まで通過し、そこで新しいチェック・ビットが発生され、訂正されたデータと新しいチェック・ビットとがDRMI80を介してMSE36に再度書き込まれる。OPARE100がCORRQ96が一杯であることを検出した場合でも、データ訂正動作は、上述の場合と待った駆動用に行われるが、ペンディングな要求がある場合にも実行される。
MMs14は、よって、誤りを含む識別(ID)及び位置を記憶しペンディングな要求がない場合には読み取り・訂正・再書き込み動作を実行することによって、読み取り及び書き込み動作の実行に干渉せずにMSEs36に記憶されたデータに関して誤り検出及び訂正を実行する。
MDP40の別の特徴を図5を参照することによって説明するが、そこでは、READ PATH92のFIFO空き信号出力によって提供されるバイパス・パス・ゲート(BPG)102の制御と共に、READ PATH92の周囲のゲートされたバイパス・データ・パスが表されている。上述のように、READ PATH92は、本質的にFIFO行列であり、読み取り要求動作の結果生じる情報及びパリティ・ビットは、その待ち行列を介して実行された順にXA−MPバス12まで通過する。すべての要求が実行された場合には、待ち行列は空になり、XA−MPバス12への転送が可能になる前に新たな要求がREAD PATH92の待ち行列を通過しなければならないが、これは複数のクロック・サイクルを要求し、待ち行列の深さ(depth)に依存する。しかし、待ち行列が空である場合には、この条件はFIFO空き信号をBPG102にアサートするREAD PATH92によって検出され、BPG102は、READ PATH92の周囲に及び直接にXAMPDI78にゲートすることによって応答し、MC38はMDP40にBOUT信号を送出して、データがXA−MPバス12上に置かれることを要求し、よって、要求された情報をREAD PATH92を介して入手可能になるよりも1クロック・サイクルだけ早くXA−MPバス12に提供する。
4.適合的(adaptive)メモリ・タイミング
MM14は、MM14の動作を適合させてMM14で用いられる特定のSIMM回路によって可能な限り最大の動作速度が得られるような態様でメモリ動作を制御する際に、MC38によって発生されMC38及びMDP40によって用いられるメモリ動作タイミング信号の絶対的及び相対的タイミングを適合的に変更する能力を更に有している。制御可能な信号は、SIMMタイミング信号を含み、これには、MC38のDRAMコントローラ72によって発生されるRAS、CAS及びWEが含まれ、更に、MC38によって発生されMC38及びMDP40によって用いられMM14の動作を制御するそれ以外のタイミング信号も含まれる。
図7を参照すると、SIMM回路が、特定のSIMM回路の少なくともサイズと速度とを示す何らかのピン出力に符号化された値を提供することは周知である。現在のシステムにおいては、SIMM回路のピンを介して入手可能なこれらの符号化された値は、MM14のMSEs36の外に運ばれて、MC38に利用可能にされる。このシステムは、更に、MM14の記憶位置に置かれたプロフィール記憶装置104を含み、そこでは、プロフィール記憶装置104は、MSE36に現れるSIMMグループの各タイプに対してプロフィール106を含み得る。
各プロフィール106は、SIMMモジュールの対応するタイプのタイミング特性を表す値の組を含み、そこでは、このタイミング特性は種々の最大ゲート遅延、再充電時間、SIMMモジュールの内部回路のタイミング・イベント間隔を表す。現在のシステムでは、タイミング特性の値は、ナノ秒などの時間の単位では表されず、ダブル速度クロックでのカウントのようなSIMMモジュールの比較タイミング特性を表す値である。しかし、このタイミング特性値は、SIMMモジュールとMM14において用いられる基本クロックとの両方のタイミング特性を容易に表しタイミング信号を発生するように選択される。
システムの初期化においては、MC38は、SIMMモジュールのピン出力から提供されるSIMMモジュール符号化されたタイミング特性値を読み取り、その符号化された値を用いて対応する1つ又は複数のプロフィール106をプロフィール記憶装置104から選択し読み取る。タイミング特性値は、次に、MM14のMC38におけるタイミング計算装置108に提供される。タイミング計算装置108には、各SIMM動作を実行するのに必要になる最大時間間隔を計算するのに必要な計算機能が備わっており、これはたとえば、1つのRAS信号と次のRAS信号との間で生じなければならない最大時間、書き込みイネーブル信号と書き込みイネーブル信号の結果との間で生じ得る最大時間などである。
タイミング計算装置108は、SIMMの動作において生じ得るタイミング・イベントの時刻を表すタイミング制御値の組を計算して提供し、その場合に、各タイミング・イベントはタイミング信号によって表され、タイミング制御値は、SIMM動作を制御するのに用いられるMM14の内部クロックのクロック周期の単位を有する。このシステムにおいては、タイミング・イベントは、「絶対」時間及び「相対」時間の両方として決定すなわち計算され、「絶対」イベントが生じる時刻はメモリ動作サイクルの開始を表すT0 に対して決定され、「相対」イベントは前のイベントに対して決定される。たとえば、RAS及びCAS信号が生じる時刻は、メモリ・サイクルのT0 開始に対する絶対イベントとして決定され、他方で、WEが生じる時刻すなわちデータがSIMMモジュールから現れる時刻は、RAS及びCAS信号の生起などの前のイベントに対して決定され得る。
次に、タイミング制御値がDRAMコントローラ72に提供され、DRAMコントローラ72によって用いられて、RAS、CAS及びWEなどの実際のタイミング信号をSIMMモジュールに発生する。
本発明の別の実施例では、システム初期化においてタイミング計算装置108を介してタイミング値を計算するのではなく、各プロフィールに対するタイミング値を予め計算し、タイミング値をDRAMコントローラ72に単にロードすることが好ましい。
このシステムのこの実施例では、システム内の各MM14は1つのプロフィール106を用い、その特定のMM14に含まれる最低のSIMMモジュールにマッチするプロフィールを選択する。別の実施例では、1つのMM14内で複数のプロフィール106を用いてMSE36内に異なるSIMMを備えることが可能である。この後者の場合では、DRAMコントローラ72は、DRAMコントローラ72に関連するレジスタの組において可能なタイミング値の2つ又はそれより多くの細を記憶し、アクセスされるアドレス位置に依存するすなわち現にアクセスされているSIMMモジュールのタイプに依存するタイミング値の組を選択する。
本発明の更に別の実施例では、プロフィール106に含まれるタイミング特性値は、更に、データ・バス26又はXA−MPバス12のデータ送信速度を反映するタイミング特性値を含み、これらの値は、DRAMコントローラ72に提供されるタイミング制御値を計算する際に用いられる。更に別の構成では、1つのシステムの中のデータ・バス26が異なる送信速度を有することがあり、プロフィール106は、それらの異なる転送速度に対してタイミング特性値を含む。この場合には、やはり、DRAMコントローラ72にはタイミング制御値の複数の組が与えられこれらを用い、任意のメモリ・サイクルの間に用いられる値は、どのデータ・バス26に情報が書き込まれる又はどのデータ・バス26から情報が読み取られるかに依存する。
最後に、上述のように、MSE36は、2つのパーティションとして当初構成され、よって、MSEs36からの読み取り及びMSEs36への書き込みは、イネーブルされる場合には、すなわち、MSEs36の別の部分へ又はその別の部分に一般にインターリーブされ、よって、MSEs36への及びMSEs36からの全体的なデータ転送速度を増加させる。このシステムのこの実施例では、メモリ・サイクルのインターリーブすなわちメモリ・サイクルのMSEs36のパーティションへの交換は、プロフィール106において提供されたタイミング特性値によって制御され、一方がMSE36のSIMMアレーの各パーティションにタイミング信号を与える2つの有効なDRAMコントローラ72によって実行される。この場合には、コントローラのそれぞれによって発生されるタイミング信号の一方は、他方のコントローラに提供されるタイミング信号であり、この他方のコントローラすなわちT0 タイミング信号のメモリ・タイミング・サイクルを開始する。
したがって、各コントローラは、他方のコントローラによって発生される、それ自身のタイミング・サイクルの結論と次のタイミング・サイクルの開始との間の間隔を決定し、よって、タイミング・サイクルのインターリーブを制御する。各コントローラによって発生されたタイミング・サイクルの開始イベントは、他方のコントローラに対する開始イベントを発生するコントローラのタイミング・サイクルの間の任意の時刻に生じるように計算され、タイミング・サイクルのオーバラップ又は非オーバラップの任意の程度又は周期を許容し、タイミング・サイクルのインターリーブはプロフィール情報によって決定される。
最後に、タイミング計算装置108とDRAMコントローラ72とは、システム10のこの構成においては、2状態マシンとして実現される。
MM14の更なる特徴においては、DRAMコントローラ72によって制御されるパーティションのリフレッシュ・サイクルは、個別に制御され、パーティションのDRAMのリフレッシュ・サイクルは、スタガーされてリフレッシュにより消費されるピーク電力を減少させ、これは、一度にパーティションのすべてのDRAMを読み取ることを含む。リフレッシュ制御ビットは、DRAMコントローラ72内に読み取られ及びDRAMコントローラ72に提供され、リフレッシュ・サイクルのタイミングを制御する。
5.順序付きおよび順序の無いバス転送
上述されたように、XA−MPバス12上の情報転送の最初のモードは順序付き動作によりそしてバス・ワードとメモリからの貯蔵物ライン・リードのために使用される。メモリ以外の機能ユニットは要求に応答するが、プロセッサ・ユニットがその貯蔵庫のなかの要求されたデータの修正されたコピーを保持する時に、MCI命令を主張することによりメモリ中の読取り要求を取消しそして要求がメモリ以外の別の機能ユニットおよび順序の無い転送により遂行されるであろうことを要求者に知らせる。
上述されるように、順序付き転送は、要求がバスの上に置かれている順序付きのメモリにより応答し、そしてXA−MPバス12の要求者利得コントローラおよびADDRバス28上に要求された情報のアドレスを、制御信号と共に置くことにより初期化される。各機能ユニット中の順序付けされた要求キューの動作を介し、他の機能と独立して、各機能ユニットは自己の順序付きメモリ要求を追跡する。各機能ユニット中の順序付き要求キューは、その機能ユニットであるか別の機能ユニットであるかにかかわらず、メモリ読取りのための自己の要求とメモリからの全ての順序付の転送を許容し、メモリからの順序付の転送が自己の要求のひとつに応答してXA−MPバス12の上に現れる時を検出する。機能ユニットは、それからXA−MPバス12からデータを受け取ることにより応答しても良い。応答者が要求された情報とバス制御信号を、順序付き要求が受信されそして情報の受信をさらに確認することを要求されない順序で、XA−MPバス12上に乗せることのみを要求される分割バス動作の応答部分において、順序付き転送は、情報要求者と情報提供者の間に実行される初期接続手順の通常の順序を省く。
この記述に含まれる資料を含む、今述べられた本発明の実施例の記述の他のセクションで述べたように順序付きバス動作の実行を簡単に検討して要約すると、機能ユニットのバス・インターフェース制御ユニットは、情報のアドレスをADDRバス28に、バス・ワード用の条件付き命令をCMD30上の貯蔵物ラインまたは2重貯蔵ライン上に乗せそして命令ストローブ(CS)を王張することにより情報要求をXA−MPバス上に乗せるであろう。そのアドレス・スペースが要求のアドレスを含むMM14は、そのアドレス・スペース内にあるとして要求を識別しそしてACKを主張するMM14により指示されるように、要求を受取ることにより応答するであろう。
他の機能ユニットにより主張されるMCI命令により取消されないならば、メモリは要求をMCFIFO68キュー中に配置して受信された順序で実行される。MC FIFO68に記憶された要求情報は、要求された動作の型および要求された情報のアドレスを含んでいる。もし要求がMCI命令により取消されるならば、要求は取消されそしてMC FIFO68に配置されないであろう。
要求が最終的にMC FIFO68により実行されるならば、メモリは1以上のバス転送において要求された情報をデータ・バス26の一つに乗せる。メモリはまた、データ・バス26の情報に依存して提供されるORD#0またはOED#1信号、そしてデータ・ストローブ(DS)を主張することを含む、適切な制御信号を転送の開始時にバス上に主張する。
元の要求機能ユニットのバス・インターフェース制御要素は、XA−MPバス12に現れる全ての順序付け応答の発生を検出するように、CMDバス30およびORD制御ラインを監視することによりXA−MPバス上の順序付け応答を発生を検出するであろう。もし応答がXA−MPバス12により早く乗せられている順序付け要求に対応しているならば、情報が送られるデータ・バス26からの該情報を受取りそしてデータ・ストローブにより指示されたようにデータ・バス26からの情報を読取ることにより、機能ユニットは応答するであろう。
システム10のこの実施例においては、メモリだけがオペレーション・キューをMC FIFO68に有し、このメモリだけが一度に1つよりも多い未処理リクエストを収納することができる。従って、このメモリ以外の機能ユニットは、それらの未処理リクエストを記憶するために、それらのバス・インターフェース制御エレメントにただ1つのレジスタまたはメモリが必要になる。しかし、別の実施例として、各機能ユニットのバス・インターフェース制御エレメントにリクエスト・キューを与えて複数の未処理リクエストを記憶させることができる。この構成においては、各機能ユニットのインオーダー・リクエスト・キューは各MM14におけるインオーダー・リクエスト・キューと同じ態様で拡張することができる。
メモリ及び他の機能ユニットのバス制御インターフェースの構成及び動作について前述したので、次にメモリ及び各機能ユニットのインオーダー・キューについて述べることによって、メモリ及びインオーダー・キューによって動作し信号のやり取りをする機能ユニットの機能エレメントは、特にメモリ及び他の機能ユーットの説明を参照することによって、理解されるであろう。
次に図8を参照すると、機能ユニットにおけるインオーダー・キュー及びメモリにおけるインオーダー・キューの機能ブロック図が示される。ここで、各機能ユニットのバス制御インターフェース・エレメント及び各MM14の各MC38内にインオーダー・キューがあることに注目すべきである。
図示のごとく、機能ユニットにあるインオーダー・リクエスト・キューはファンクショナル・ユニット・インオーダー・キュー(FUIQ)110として識別され、MC38にあるインオーダー・リクエスト・キューはメモリ・インオーダー・キュー(MIQ)112として識別される。その各々は、リクエスト・キューとレスポンス・キューから構成され、それぞれファンクショナル・ユニット・リクエスト・キュー(FUREQ)114、メモリ・リクエスト・キュー(MREQ)116、ファンクショナル・ユニット・レスポンス・キュー(FURSQ)118、及びメモリ・レスポンス・キュー(MRSQ)120と呼ばれる。FUREQI14は機能ユニットによって与えられるインオーダー・リクエストを追跡し、MREQI16はMM14のためのMIC38によって受入れられたインオーダー・リクエストを追跡し、FURSQ118はいずれかのMM14からXA−MPバス12に現れたインオーダー・レスポンスを追跡し、MRSQ120はいずれかのMM14からXA−MPバス12に現れたインオーダー・レスポンスを追跡する。
最初にFUIQ110を参照すると、機能ユニットのファンクショナル・ユニット・バス・コントロール・インターフェース(FUBCI)122は、前述したようにXA−MPバス12上にインオーダー・リクエストを配置し、その各インオーダー・リクエストの配置時に、リクエスト(REQ)の指示をFUREQ114に挿入する。FUREQ114は、例えば、単一ビット幅のラップ・アラウンド・シフト・レジスタで構成して、出力を入力に戻して接続することが可能であり、それによってリクエストは充填されるまでループを回転する。この構成においては、リクエスト指示REQの挿入は、シフト・レジスタの入力に1ビット、例えば論理「1」を与えることによって行われる。FUBCI112は、いずれかの機能ユニットによってXA−MPバス12上に配置された各インオーダー・リクエストを検出し、XA−MPバス12上にインオーダー・リクエストが現れる毎にFUREQ114をクロックすることによって、FUREQ114におけるREQ指示がシフト・レジスタに沿って移動され、REQ指示の位置は、インオーダー・リクエストの相対順位を表すことになり、その相対順位によって他のすべての機能ユニットによって作成される他のすべてのインオーダー・リクエストに対するその機能ユニットを表す。
FUIQ110は、FURSQ118のオペレーションによってXA−MPバス12上に現れるインオーダー・レスポンスを追跡し、FURSQ118は、FUBCI122がXA−MPバス12上のMM14からのインオーダー・レスポンスを検出する毎に機能ユニットFUBCI122によってクロックされる。それに応答して、FURSQ118はポインタ(ORDP)を発生し、そのポインタはインオーダー・レスポンスのシーケンスの中から最新のインオーダー・レスポンスの出現を識別する。FURSQ118及びMIQ112内の類似のMRSQ120は、図8においては、最新レスポンスを表す1ビットを移動させる回転シフト・レジスタとして示されるが、その代わりにカウンタを使用することも可能であり、そのカウンタの数出力は、常にレスポンス・シーケンスにおける最新レスポンスを示すことになる。
FUREQ114における各REQ指示の位置は、COMPARE122によってFURSQ118からのORDPと比較され、REQ指示の位置がORDPによって示される最新レスポンスと一致することが検出されると、オウン・レスポンス(OPWNRES)出力がFUBCI122に発生され、その出力は最新インオーダー・レスポンスが機能ユニットによってそれより前に与えられたインオーダー・リクエストに一致することを示す。
従って、要約すれば、FURSQ118は、XA−MPバス12上の適切な順の応答の逐次的な発生を追跡し表示する。一方FUREQ114は、XA−MPバス12上に送出された適切な順の逐次的要求の中の機能ユニット自体の適切な順の要求の位置を追跡し表示する。そしてFURSQ118とFUREQ114の同時発生は、機能ユニットによる適切な順の要求の送出に対応する適切な順の応答を表示する。
MIQ112を参照すると、各MM14は他のMM14と独立に適切な順の動作を実行するので、各MM14は、XA−MPバス12上に有る全てのMM14のより実行される適切な順の動作に関連するそれ自身の適切な順の動作を追跡し表示することを要求され、同時に各MM14は、それ自身のアドレス空間に向けられた適切な順の要求を認識して受け入れ、かつその要求に応答する。
MIQ112はFUIQ110とほとんど同じ仕方で動作し、MRSQ120はFURSQ118と同じ仕方でXA−MPバス12上に現れた全ての適切な順の応答を追跡する。しかしながら、MREQ116は、他の全ての適切な順の要求に関連するMM14により受け入れられた適切な順の要求を追跡し、要求が受け入れられたことの表示(MYREQ)をMREQ116が要求を受け入れる度に、MREQ116へ置く。MC38は、XA−MPバス12上に現れた各適切な順の要求を検出し、適切な順の要求が任意のMM14によって受け入れられる度に、すなわちMCIによって取り消されない適切な順の要求の発生の度に、MREQ116をクロックする。説明したように、MREQ116は従って、MM14によって受け入れられた種々のMYREQ表示を含み得、従ってMREQ116は、XA−MPバス12上に現れた各適切な順の要求の一連の発生を表し、MM14によって受け入れられた各要求がMYREQによって表され、かつ他のMM14によって受け入れられた各要求が論理「0」のような他の表示によって表される、一連の要求表示を含み得る。
MRSQ120のORDP出力とMREQ116からのMYREQの同時発生が有ると、これは、それがシステム10のMM14によって受け入れられた次の適切な順の要求であることを表すので、FUIQ110と同じ仕方で、COMPARE124は自己要求(OWNREQ)出力を与え、それによってMM14がそのMC FIFO68内に記憶していた対応する適切な順の要求を実行するべきことを表示する。そのMM14のMC38は、その要求を実行することによってそのOWNREQに応答する。
適切な順の動作や乱れた順の動作の実行のこれ以上の説明は、システム10のこの説明の一部である参考資料を含む、他のセクションに有る。
6.アドレス空間のマッピング
前述のように、システム10は、全てのデータ、プログラム及びバス動作に関連するシステムの情報記憶機能が単一のアドレス空間を使用するようにして、そのような単一のアドレス空間で全ての動作を実行することによって統合環境を提供する。そのような情報記憶機能は、例えばMM14内のメモリー空間、プロセッサーユニット42のレジスター及び、ビデオコントローラやI/Oデバイスの表示メモリーやオペレーティングシステム及びパーソナルコンピュータで通常用いられるROM BIOSのようなBIOSの記憶に必要な空間のような、他の情報記憶機能を含み得る。
しかしながら、バスに関連する情報記憶の管理はシステムの機能ユニットに分散されており、そのため、例えばMM14は、MSE36によってデータやプログラムを記憶するのに用いられるアドレス空間内のアドレス位置を管理することができる。同様の仕方で、PM16は機能上PM16のバス関連レジスターによって占有されているアドレス空間位置を管理することができ、一方BM18はビデオディスプレイコントローラによって用いられるアドレス空間位置や読み出し専用メモリー及びROM BIOSのようなプログラムやデータを記憶するための他のメモリーのアドレス空間位置を管理することができる。
単一のシステムアドレス空間の管理は、PM16レジスター、MM14内の物理的記憶位置、ROM BIOS用のROM内に与えられた記憶やビデオディスプレイコントローラ用のビデオメモリーのような種々の記憶手段をアドレス空間内にマッピングによって本来実行される。従ってシステム10においては、各機能ユニットはそのバス動作関連記憶空間を単一のシステムアドレス空間にマッピングすることができる。このマッピングの一例は、以前にPM16レジスターをシステムアドレス空間にマッピングすることに関連して論及した。
このプロセスは、図9に機能的かつ図解的に示されており、該図9はそれぞれの機能ユニットで実行される基本的なマッピング機能を示している。ここで説明する機能が、メモリ・レジデント・テーブルまたはプログラムされたゲート・アレイを介する等の、多数の手法で実行することができるが、実行される基本的な機能が、それぞれの実行に対してほほ同一であることは、明らかであろう。
図9は、機能ユニットにおいてマッピングを実行し、かつ、XA−MPバス(XAMP ADDR)12を介してシステム・メモリに供給されるシステム・メモリ・スペース・アドレスと、それぞれの機能ユニット中の、図9において機能ユニット・メモリ・スペース(FUMS)128として表している、1つまたは複数の記憶スペースとの関連づけを実行するためのアドレス・スペース・マップ(ASMP)126の使用態様を示している。
図示されているように、それぞれのFUMS128は、メモリ・スペース・サブスペース(MSSS)130として構築すなわち仕切って構成することができ、MSSS130は、MM14のMSE36のように、単一のメモリ・スペース内の隣接領域を表している。また各FUM128は、ROM BIOSに対する個別のROM及びビデオ・ディスプレイ・コントローラに対するビデオ・メモリ等の、メモリ内の個別の位置及び機能ユニットにアクセス可能な記憶スペース内に仕切って構成することもできる。
ADMP126は、機能ユニット・メモリ・スペースのそれぞれのMSSS130に対するマップ・エントリ(MPE)132を含んでおり、それぞれのMPE132は、XAMP ADDRアドレスによって表されるように、システム・アドレス・スペースのアドレスまたはアドレス・レンジに対応している。
それぞれのMPE132に含まれる情報は、ある特別の機能ユニットに依存しており、該特別の機能ユニットに対してアドレス・スペース・マッピングが実行され、該情報は、XAMP ADDRアドレスまたはアドレス・レンジに対応しているメモリ・スペース(MSSSO130)を該機能ユニットが含んでいることを表す、ビット134として表される少なくとも1つのビットを含んでいる。ビット134は、例えば、MM14において用いられ、MM14が、メモリ読み出し要求の一部分としての、XA−MPバス12を介して供給されるアドレスによって示される情報を含んでいるメモリ・スペースを含んでいることを検出するために用いられる。
この例についてさらに説明すると、それぞれのMPE132は複数のビットすなわちフィールドをさらに含んでおり、該フィールドは、行、列、及び対応するメモリ位置を含んでいるSIMMモジュールのグループを識別する情報を含んでいる。したがって、アドレス位置が所定のMM14内にあるかどうかを高速で識別するとともに、行、列、及びアドレス指定情報を含むSIMMモジュールのグループ番号を同時に供給することによって、SIMMモジュールにおける物理的位置にXA−MPバス12上のメモリ要求中のアドレスを、MPE132からの情報が同一速度で変換することができる。そしてこの情報は、DRAMコントローラ72に供給され、それにより、SIMMモジュール内のアドレス指定された位置からの読みだし動作を、遅延なく実行することができる。
システム10の機能6ユニットにおいて提供されたアドレス・スペース・マッピング動作の別の例においては、システム・アドレス・スペースに関連してMSSS130のアドレス配置をオフセットすることが望ましい。このような場合の一例として、システムすなわちプロセッサのレジスタ等のような特殊の対象物に対するある下位アドレスを反転する必要があるが、MM14がSIMMのメモリ位置で構成された隣接するアドレス・スペースを含む場合が考えられる。この例においては、MM14の外部の機能ユニットが、反転されるべきアドレス位置を識別するためのレジスタを含み、MM14のMPE132をオフセットの順位でADMP126に入れ込むことができ、それにより、MM14において実行されるメモリ位置マッピングに、システム・アドレス・スペースにおける自動オフセットを提供することができる。同様に、SIMMからのコード化サイズ情報がシステムにおいて用いられて、それぞれのMM14に関するADMP126のオフセットを発生することができ、それにより、メモリ位置マッピングに対するそれぞれのMM14のアドレス・スペースが、個別のMM14のメモリ位置をマッピングして隣接するアドレス・スペースを形成するように、オフセットされる。
必要に応じ、機能ユニットのアドレス・マッピング要求に応じて、MPE134に含まれる情報を機能ユニットの間で異ならせることができ、このような例は、MM14のメモリ位置のマッピングと比較すると、プロセッサ・ユニット42のマッピングである。他の機能ユニットにおいて、情報は例えば、対応するメモリすなわち記憶位置が書き込み不能すなわち読み出し専用であるかどうかに、依存するようにすることができる。
最後に、システム10の現在の実施態様においては、機能ユニットに対するアドレス・マッピングは、システムの初期化時に実行されるか、またはその直前に実行され、記憶され、そしてシステムの初期化時に機能ユニットのADMP126にロードされる。
7.バス・アクセス・アービトレーション
先に述べたように、システムの機能ユニット間に分布されるシステム機能の間には、システムの機能ユニットによるXA−MPバス12への争い(contention)及び仲裁がある。
システム10の機能ユニットは「スライス」とも称されるが、該機能ユニットのそれぞれは、仲裁ライン(ARB)32に接続された仲裁ロジックを含み、相対的優先基準に基づいてXA−MPバス12へのアクセスに対して争う。それぞれの優先度はXA−MPバス12に沿った「スライス」の位置によって決定される。
図10には、システム10の仲裁機構が図解的、機能的に表示されている。既に述べたように、仲裁は、複数の仲裁ライン(ARB)32を介して実行され、TYUUSAIラインはARB32−0〜ARB32−9で示されている。システム10のそれぞれのスライスすなわち機能ユニットは、図10においてはSLICE134−0〜SLICE134−9として表され、したがって、システム10がスライスすなわち機能ユニットを有するものとして示されている。図10の上部には、SLICE134からARB32への接続が図示されており、図10の下部には、1つのSLICE134における仲裁ロジックの機能ブロック図が示されている。
図示されているように、SLICE134それぞれに対する仲裁ロジックは、それぞれのARBライン32に接続された入力を有する仲裁信号ラッチ(ARBL)138と、同様にARBライン32のそれぞれに接続された入力を有する仲裁マスク・レジスタ(ARBM)138と、仲裁コントロール(ARBC)140とを含んでいる。ARBC140は、SLICE134に対応しているARBライン32に接続され、自身のARBライン32上にSLICEのARB信号をアサートする。
図10に図示されているように、スライス134それぞれからARBライン32への接続は、ARBM138への入力接続に関しては、他のSLICE134に関してシフトされている。すなわち、それぞれのSLICE134のARBM138は、ARB32−0、ARB32−1・・・に接続された入力を有している。これらのシフトされた接続は、ARBライン32とSLICE134との接続交差部に示した丸印によって、図10にシンボル化されて示されている。これらの丸印は、ARBライン32とARBM138への第1のビット入力との間の接続を示しており、順次増大する番号がつけられた接続の方向は、丸印の側の矢印によって示されている。ARBライン32への接続は、「ラッピング・アラウンド」によって、それぞれのSLICE134の入力に番号順に交差し、それにより、ARBライン32のそれぞれが、それぞれのSLICE134のARBM138入力に接続される。それぞれのARBライン32はまた、ARBL136の入力に接続されているが、これは非シフト接続である。
システム10の現在の実現態様においては、低い優先度のスライスを含んでいるPM16で、最も高い優先度のスライスにBRIDGE56が割り当てられる。この割り当ては固定的なものではないが、任意の機能ユニットを任意のスライス位置に割り当てることができる。スライス位置とスライスの相対的優先度とがシステムの初期化の時点で決定され、システム・マスタ機能ユニット、これは通常BRIDGE56であるが、該ユニットがARBC140からのARB信号出力に論理レベルをアサートする。ARBライン32とARBM138の入力とがシフト接続されているため、マスタ・ユニットからの論理レベルは、ラッチのARBCM138を横切る一連の入力に現れ、また、任意のスライスのARBM138入力に論理レベルが現れる入力が、スライス番号としたがってスライスの相対的優先度とを決定する。ARBライン32の入力はラッチされて、それぞれのスライスのARBM138に記憶され、以下に説明するように、XA−MPバス12へのアクセスの時点を決定するときに「マスク」としてそれぞれのスライスによって後に用いられる。
ARBライン32にただ1つのスライスがアサートされた場合には、そのスライスはXA−MPバス12のコントロールを受け、かつ仲裁は要求されない。しかしながら、複数のスライスが同一のバス・クロック・サイクルの間にARB信号をアサートした場合には、これらのスライスは、バスに最初にアクセスするスライスがどれであるかを決定するために、仲裁される。これに関連し、仲裁機構は、クロック・サイクル毎にARB信号をSRBL136にラッチして、ARBC140において仲裁動作を実行する。
もし多数のスライスが同じクロックサイクルの間にそれらのARB信号をアサートしたとき、それらのスライスは、1つの“グループ”を形成し、このグループは、それらの間でXA−MPバス12の制御を保持するが、この保持は、それらのARB信号のアサートを各々がそのバスへのアクセスを得るまで続け、そして各々が、そのバス動作を実行し終えた後にそのバスへのアクセスを放棄しそれらのARB信号を解放する、ということにより行う。1グループを形成するスライス間でのバスアクセスの選択及びシーケンスは、システム初期化時に各スライスのARBM138に記憶された“マスク”を介して行う。1グループ内の各スライスは、各クロックサイクル時に、そのマスクを、そのARBL136内にラッチされた現在のARB信号(これらは、各クロックサイクル時に再びラッチされる)と比較する。この動作は、通常、そのスライスのマスクを現在ラッチされているARB信号と論理的にAND演算することにより行う。もしあるスライスのARBC140が、そのスライスのARBL136内に現在ラッチされているARB信号をもつより高い優先順位のスライスがあること、を発見した場合、そのスライスは、優先権並びにバスの制御を、その高優先順位のスライスに譲る。
上記グループ内の各スライスは、次に、各連続するクロックサイクル時にそれらの間で、バス制御の獲得について、各高優先順位のスライスがそのバス動作を完了したときのそれらの相対的優先順位に従って仲裁を行う。各スライスは、そのバス動作を終えると、バスの制御を放棄し、そしてそのARB信号のアサートを止める。
各スライスのARBC140のロジック回路に施された優先順位仲裁ルールによれば、あるグループのメンバーであるスライスであって、しかもそのバス動作を終えてバスの制御を放棄したかあるいはそのARB信号のアサートを止めることによりそのグループから脱するかしたスライスは、バスに対する制御をアサートしようと試みることは、そのグループのどのメンバーもその各々のバス動作を完了するかあるいはそのグループのメンバーとしてARB信号のアサートを止めることによりそのグループから脱するかするまでは、行いそうにない。
更に各ARBC140のロジック回路に施された優先順位仲裁ルールによれば、あるグループにないどのスライスも、そのARB信号をアサートしたりあるいはそのグループへの加入を試みることは、そのグループのどのメンバーもそのバス動作を完了するかあるいはそのグループから脱するかするまでは、行うことができない。このルールの例外は、ある高い優先順位のスライスが、あるグループに押し入ることがあるが、ただし2つの隣接したグループに押し入ることは、もしそれがその最初のグループからNAK処理により外に出された場合には、行うことができない、ということである。
システム10の仲裁機構は、バスアクセス仲裁のオーバーラップを許容するが、バスアクセスのオーバーラップを許容することはしないが、これは、ARBC140内にある手段を設けて、これにより、スライスは、ARB信号から、たった1つのスライスだけがあるグループに留まっているか、あるいは、単一のスライスのみがその時バスへのアクセスを要求している(即ち、実効上、たった1つのメンバーのグループ)、ということを判定できるようにする。各バス関連ラインの各端部におけるバスラインラッチ(ARB32ラインを含む)を介するタイミングと、連続したバスクロックサイクルでのARB信号ラッチ及びアクセス仲裁の交互実行とにより、潜在的な要求者が、バスの現行の所有者のARB32ラインが次のバスサイクルにおいて解放されるということを確かめ、そしてそのバスサイクルの間にそのARB信号をアサートすることができるようになり、これにより、そのARB信号がその次バスサイクル時に各スライスのARBL136にラッチされるようにする、ことができる。待機中の各要求者は、これにより、バスの単一のプロセッサの前のグループの最後のメンバーがそのバス動作を完了しつつある間に、バスに対する次の仲裁を開始することができる。
最後に、前に述べたように、情報の読取に対するある種の要求は、イン・オーダー(順序正しい)動作ではなくアウト・オブ・オーダー(順序外れ)動作をもたらすことがあり、そのアウト・オブ・オーダー動作においては、その要求は、別の機能性ユニットのMCI信号のアサートにより、メモリ内でキャンセルされ、また、そのメモリ動作をキャンセルしたその機能性ユニットはその後に、その要求を、アウト・オブ・オーダー動作を実行することにより満たすことになる。上記したように、要求に対するアウト・オブ・オーダー応答においては、応答側ユニットは、バスへのアクセスについての仲裁を行い、そしてバスの制御を得たときに、ADDR Bus28、CMD Bus30及びDATA Bus26の動作を実効上互いに結合するが、これは、そのバスに、その要求された情報を、これがアウト・オブ・オーダー応答であることを示すコマンドと、その要求を出した機能性ユニットのアドレスとを共に置くことにより行う。
また上記したように、要求側の機能性ユニットは、単一又は多数のバスワードに対するあるいは単一又は多数のキャッシュラインに対する要求を行うとき、それ自身のアドレスあるいはその他の識別を送ることにより自分自身の正体を示すということを行わないが、それは、先に述べたように、その要求はイン・オーダー動作として満たされることが期待されているからである。アウト・オブ・オーダー応答者にとっては、そのアウト・オブ・オーダー応答を行うときには要求者を識別する必要があり、これは、仲裁機構を通して行う。即ち、要求者がそれ自身の識別を送っていない間、要求者のスライス番号は、本システムの各他の機能性ユニットにより利用可能となっており、従ってMCIをアサートしてメモリ動作のキャンセルするアウト・オブ・オーダー応答者は、その要求者のスライス番号(図10において、そのARBC140からのSlice Number(SLICEN)として識別)を読み取り記憶し、そしてその後、アウト・オブ・オーダー応答を実行するときにそのスライス番号を要求者アドレスとして使う。
仲裁機構の構造、機能及び動作の更なる詳細については、システム10の機構ユニットに関するアペンディックス、即ちアペンディックス5、10及び11(それぞれ、“仲裁ロジック−A,一B,及び一C”と題する)にみることができる。
8.ブリッジ・インターフェース・コントローラ56
図11はブリッジ・インターフェース・コントローラ56の機能的概観のブロック図を示し、このブリッジ・インターフェース・コントローラはXA−MPバス212とASバス20とを相互接続する。ASバス20は、(好適な実施例において、)従来のインテルi486プロセッサとそれに関連するRAMメモリとを、標準のパーソナル・コンピュータ・システムの他のコンポーネントに相互接続するものと同じインテルi486バスである。
ブリッジ・インターフェース・コントローラ56は、サーバ(server)・ワークステーションのマザー・ボードに設置され得、そこにおいては、ASバス20は、従来のEISA又はMCI PCコンパチブルI/Oバス及び従来のIBM PCコンパチブルのファイル・サーバに用いられるタイプのコントローラ・システム及びそれと同様のものに接続し得る。おそらく、マザー・ボードには、ローカル・エリア・ネットワーク・アダプタ・カードのような、アクセサリー・カードのためのEISA又はMCIスロットが装備されているであろう。また、それは、1つ以上のハード・ディスク・ドライブ・システム又は他のタイプの標準ディスク・ドライブ・コントローラ・システムに導くSCSIバスを駆動し得るであろう。例えば、典型的なPC142のブロック図を示す図21を参照されたい。
それは、また、ASバスと関連して、典型的に、例えば割り込みコントローラのような、標準PC支援用ハードウエアと、幾つかの直接メモリ・アクセス・デバイスと、アクセサリー・デバイスがAS20へのアクセスを得ること及びAS20の制御を得ることを可能とするバス・マスクリング・ハードウエアと、が存在することを意図している。最も典型的には、ディスクの読み取り及び書き込みのような、そのようなタスクを行う直接メモリ・アクセス・デバイスが、中央処理装置から受信したデータ出力コマンドに応答し、メイン・システムRAMへの及びそこからのEISA又はMCAバス・コントローラ及びブリッジ・インターフェース・コントローラ56を経ての、ディスク・ドライブへの及びそこからの直接メモリ・アクセス(DMA)読み取り及び書き込みを始める。
図11に関して、機能的に、ブリッジ・インターフェース・コントローラはASバス20へのXA−MPバス・ウインドウを示し、このASバス20を通じて、即ちXA−MPバス・ウインドウを通じて、DMAコントローラ及びEISA又はMCIバスに接続された他のバス・マスタ(master)が、コマンドが従来のi486マイクロプロセッサと関連するRAMメモリに送られたかのようなそれと全く同じ様式で、データ記憶及び検索コマンドをアドレスすることができる。これらのコマンドは、シーケンサ146を経て、ウインドウ144を経て、XA−MPバス・インターフェース148を経てXA−MPバス12に渡される。しかしながら、これらコマンドのうちの多くのものは、XA−MPバス21にアクセスする必要なく、ブリッジ・インターフェース・コントローラ56内のキャッシュ(後に説明する)を参照することによって満足させられ得る。
このブリッジ・インターフェース・コントローラはまた、XA−MPバス12へのi486バス・ウインドウ150を示しており、このXA−MPバス12を通じて、即ちi486バス・ウインドウ150を通じて、XA−NPバス12に接続された複数のプロセッサが、EISA又はMCAバスに接続されたいずれのもの、例えば、シリアル及びパラレル通信ポート、VGA又は他のディスプレイ装置、ROMベースのプログラム・コードなど、へも直接にアクセスすることができる。このようなアクセスは、キャッシュされることはなく、XA−MPバス21からインターフェース148を経てi486バス・ウインドウ150へ、そしてシーケンサ146からASバス20へ、そしてその先の多種のアクセサリーに、直接に渡される。
ハードウエア的な観点から、ブリッジ・インターフェース・コントローラは、3個のLSIチップとABICチップ152(図12)と、1個又は2個のDBICチップ154(図13)とで構成される。これらは、図17に示されるようにバス20及び21に接続されている。DBICチップ154のそれぞれはXA−MPバス21内の2つのデータ・バスの個々のものに接続し、両方のものがASバス20に接続する。両方がキャッシュ・メモリを含み、そして、関連するアドレス・タグはABIC152内に含まれる。バスアドレスライン及び制御ラインはABIC152に第一に接続し、これはブリッジ・コントロール・ロジックの殆どを含む。ブリッジ・インターフェース・コントローラの状態を定義する状態レジスタ156はまた、ABIC152内に含まれる。これらのレジスタはアクセス可能なようにプログラムされねばならないので、シリアルI/Oインターフェース158、160及び162が与えられ、それによって、レジスタの値が、ASバス20のデータ・ライン“0”を経てDBIC154とABIC152との間でシリアルにシフトされ得、それによって、レジスタ156がXA−MPバス21のデータ・バス部分からロードされかつそこヘアンロード(unload)され得る。図13及び14は、各タイプのチップにどのエレメントが在るかを示す。残りの図面ではこの2つのタイプのチップを区別しておらず、ブリッジ・インターフェース・コントローラは単一のデバイスであると考えている。図13及び14で見られる信号の説明はアペンディクスで見付けられる。
図14は、EISA、ISA、又はMCA又はSCSIバス・システムにおけるASバス20の先に在るバス・マスタ又は直接メモリ・アクセス・デバイスから開始されるデータ書き込み要求の処理に関連するブリッジ・インターフェース・コントローラ56のそれらエレメントを機能的な様式で示す。
ASバス書き込み要求がXA−MPバス・ウインドウ144によって受信されると、ブリッジ・インターフェース・コントローラは、まず、i486バス・ウインドウ150を閉じ、一時的にASバスへのCPUアクセスを切る(ステップ162)。(図16に示すi486コマンド待ち行列164に記憶された)いずれの係属中のCPUコマンドも直ちに実行されてクリアされる(ステップ166)。次に、ブリッジ・インターフェース・コントローラ56は、ASバス20を、DMA又はバス・マスタ又は他のデバイスが使用するために、リリースする(ステップ168)。
次に、それが書き込み要求である場合、キャッシュ170が、指定されたアドレスに対応するキャッシュ・ラインを含んでいるかどうかについてテストされる(i486スヌープ(snoop)・ロジック172)。ウインドウ144に与えられるアドレスのタグ部分がキャッシュ170に与えられ、そして、比較信号が、データのラインがキャッシュ170内に存在するかどうかをスヌープ・ロジック172に知らせる。ラインが存在する場合、HIT(ヒット)信号によって、キャッシュへの書き込みオペレーション(ステップ174)が行われる。もしそれがキャッシュにおける最後のバイトであるならば、そして、このキャッシュ・ラインが(図18 - -図14のステップ180- - に示す変更されたビット174によってマークされたような)変更されたバイトを含んでいると仮定すると、ステップ180で、キャッシュ・ラインがRAMに自動的に書き戻され、後の入来するキャッシュ・ラインのデータを受信するのに使用するために自由にされる。ここでは、複数のバイト又はワードの転送が行われていると仮定している。キャッシュ・ラインが入来するデータで一杯になるとすぐにこのようにキャッシュ・ラインを自由にすることによって、データ入力プロセスが2つのキャッシュ・ラインに限定され、キャッシュ全体にオーバーライト(overwrite)せず、それによって、同時に進行しているであろう他の入力又は出力転送を妨げる。即ち、キャッシュは、入来するメモリ書き込み要求のためのバッファのように機能し、また、後に説明するが、他の時に及び中央処理装置に対してI/Oキャッシュとして動作する。
最後に、ステップ182において、キャッシュ・ラインにおけるn番目のバイトが書き込まれたかどうかについてのオプションのテストが行われる(nは調整可能)。もしそうであるならば、および、私達がこのキャッシュ・ラインの終わりに近付いているならば、184で、コントローラ56はBICLコマンドを生成する。これは、複数のプロセッサと関連するすべての他のキャッシュによって感知される。これらのキャッシュのうちのいずれかが、変更された次のシーケンスのキャッシュ・ラインの変更されたコピーを含むならば、このBICLコマンドは、それらが変更されたラインをRAMに書き戻すようにさせ、それらのキャッシュ・エントリを“無効”とマーク付けするようにさせる。同様に、この、次のシーケンスの変更ラインの変更されていないコピーを含むキャッシング・ユニット・キャッシュは、それらのキャッシュ・エントリを“無効”とマーク付けする。即ち、このBICLコマンド(“ブリッジ無効キャッシュ・ライン(Bridge Invalidate Cache Line)”コマンド)は、データ転送の必要なく、システムがブリッジ・キャッシュにデータ・バイトを受信するようにする。いずれかの中央処理装置がこの同じキャッシュ・ラインに、それが入来するデータでロードされているときに、アクセスを試みると、XA−MPバスと関連するスヌープ・ロジック186(図18)は、このキャッシュ・ラインは“変更された”とマークされていることを検出し、メモリ要求の試みを、ステップ188で、替えられたバイトが(WBWコマンドによって、メモリが替えられたバイトとキャッシュ・ラインの残りの部分(remainder)とをマージして)RAMメモリに再記憶(restore)されるまでNAKする。
スヌープ・ロジック172がMISS(ミス)を生成することによって示されるように、キャッシュ・ラインがキャッシュ170に既に存在していなければ、190で、RAMのみが更新されたキャッシュ・ラインのコピーを有することを確かなものとするためにBICLコマンドが生成され、ステップ174で、入来するデータはキャッシュ170における空のキャッシュ・ラインに書き込まれ、その読み取り性(readability)ビット192(図18)がマーク付けされて、それが幾つかの規定されていないデータを含むことを示すようにセットされ、その変更された(modified)ビット176(図18)のうちの適当なものをセットしてどれが新しい入来データ・バイトであるか及びどれが無効バイトであるかを示すようにされる。しかし、もし幾つかの他のキャッシュがこの特定のキャッシュ・ラインの変更されたコピーを含んでいるならば、その特定のキャッシュと関連するスヌープ・ロジック186は、キャッシュ・ユニットに、変更された値をRAMに戻すための時間を与えるようにNAK信号(194で検出される)を生成する。周辺デバイスはBICLが受け入れられるまで停止(stall)され、変更された値がRAMに戻される。殆どの場合、ステップ182及び184は、BICLコマンドが早い時間に出て行くようにするので、このNAK及び後続の遅延は起こらない。
図15は、EISA、ISA、又はMCA又はSCSIバス・システムにおけるASバス20の先に在るバス・マスタ又は直接メモリ・アクセス・デバイスから開始されるデータ読み取り要求の処理に関連するブリッジ・インターフェース・コントローラ56のそれらエレメンを機能的様式で示す。
次に、読み取りの場合、キャッシュ170は、指定されたアドレスに対応するキャッシュ・ラインを含むかどうかについてテストされる(i486スヌープ・ロジック172)。ウインドウ144に与えられるアドレスのタグ部分がキャッシュ170に与えられ、そして比較信号がスヌープ・ロジック172に、データのラインがキャッシュ170内に存在するかどうかについて知らせる。
キャッシュ・ラインが存在する場合にはHITが発生し、ステップ198が、要求されたデータをキャッシュから待っているデバイスに転送する。ステップ200で、n番目のバイト(nは調節可能)がちょうど読まれたところであれば、オプションで、202において、RCLコマンドが発行され、次の連続するデータのキャッシュ・ラインが、RAMから(又は、それが変更された形で存在している或るキャッシュから)検索されるようにする。キャッシュ・ライン・データが存在しない場合にはMISSが発生し、ステップ204は、RAMメモリから(又は、それが変更されている或る他のキャッシュから)キャッシュ・ラインを検索するRCLコマンドを開始する。時間を節約するために、新しいキャッシュ・ラインがキャッシュにロードされるのと同時に、それはまたキャッシュをバイパスし、パラレルの経路を経て要求しているデバイスに直接進む(ステップ205)。
複数のCPUによって開始されかつブリッジ・インターフェース・コントローラの先にあるデバイスで指示されるデータの読み取り及び書き込みは、図16に示されるi486バス・ウインドウに送られる。これらの要求には2つのタイプがあり得る。書き込みの場合にはアクノレッジメント(acknowledgment)を必要とする実際のCPUのI/O要求と、ある様式でASバス20のアドレス・スペースにマップされるべきCPUメモリ読み取り要求及び書き込み要求とである。好適な実施例は、図16の206で、多種のこのようなASバス20アドレス・スペース・マッピングを含み、以下のものを含む。
RAMメモリの低い幾つかのメガバイトの、ASバス・アドレス・スペースのメモリ・アドレス側へのISAコンパチブル・マッピングがあり、4K、16K、64K、及びIMegサイズのこのようなメモリのブロックは、読み取りのみ(ASバス読み取り、RAMへ書き込み)、書き込みのみ(ASバスへ書き込み、RAMから読み取り)、読み取り/書き込み(ASバス読み取り及び書き込み)、及びRAMのみ(AS動作なし)、とマーク付けされ得る。これによって、ROMがRAMにおいて陰にされる(shadowed)ようにし、VGA及びEGAビデオ・グラフィックス・コントローラに対して要求されるように、一般にASバス・スペースにおける或るRAMがRAMの中に現れるようにし、陰にするために用いられるRAMが読み取りのみに効果的にされるように、する。また、或るRAMへのアクセスは、多種のPC ROM BIOSプログラムによって必要とされるようにスイッチ・オン及びオフされ得る。これのすべてに必要なことはIBM PCコンパチブルのコンピュータ・システムの設計の当業者には明らかであり、詳細な説明は必要ではない。4つの再配置可能なウインドウが提供され、それは、大変高いメモリ・アドレス(ベース・レジスタ“relowin base”における開始アドレスよりも上)を、ASアドレス・スペースにおける2つの4MBと2つの8MBのウインドウにマップする。これは、オペレーティング・システムを妨害することなく、ビデオ・グラフィックス・コントローラを使用することを容易にする。このオペレーティング・システムは自身の目的のためにメモリの下部の16MBのすべてを必要とするものである。サイズが16バイトから4gバイトまで可変の、他のウインドウは、XA−MPメモリ・アドレス・サイクルを、ASバスI/Oアドレス・スペース・サイクルにマップする。このウインドウは、レジスタ“begin‐con”及び“end con”によって定められる。
これらのASアドレス・マッピングそして読み取りのみ(read only)、書き込みのみ(write only)などの特性は、レジスタ156(図17)内に記憶された値によって定められる。これは、ASバス・アドレス・マッピング206(図16)の結果となり、それがi486バス・ウインドウ150が、ブリッジ・インターフェース・コントローラ56の先にあるデバイスにアドレス指定されたメモリ及びI/O読み取り及び書き込み要求を認識しかつ捕らえるようにし、かつこれらの要求を捕らえるようにする。
ASバス・アドレス・スペースへのXA−MPバス・アクセスは、簡単に受け入れられ、ACKされ、MCIされ、そして処理される(コマンド待ち行列164は一杯であるか、又はi486バス・ウインドウが閉じられて、DMA又はバス・マスタのデータ転送が発生しているときに図14及び15のステップ162に続く動作を待っているので、それらがNAKされていない場合)。MCIは正常なRAMによるいずれの応答も取り消し、そして要求をしているCPUに、応答が“シーケンスからはずれた(out of sequence)”応答となるであろうことをアドバイスする。
4つまでのそのような要求がバス・コマンド待ち行列164において、要求している中央処理装置のスライス番号とともに、待ち行列にされる。これらのコマンドはASバス20に与えられる。応答が戻ってくると、ブリッジ・コントローラ56は、メイン・バスに対するアービトレーション(arbitrate)を行う。(そして、それは最高の優先順位を割り当てられているので、それを素早く得る。)次に、それは、要求するスライスにアドレス指定されかつ戻されたデータを伴うRWRコマンドを生成する。または、I/Oアドレス・スペース書き込みの場合、それは、単に、バス・アドレス・サイクルのみを用いかつデータ・サイクルを用いずにIOWR(I/O書き込み応答)コマンドを送る。
IBM PCコンパチビリティのために、幾つかのブリッジ・インターフェース・コントローラは割り込みアクノレッジ・コマンドに応答するように設計され得る。複数プロセッサの中からのi486またはペンティアム(Pentium、登録商標)・プロセッサがハードウエア割り込みをアクノレッジし、割り込み番号を呼ぶとき、MBC50は、INTAコマンドを生成する。このコマンドは、i486バスが割り込みをアクノレッジして割り込み番号を要求しているかのように、ASのi486バスに渡される。EISA又はMCIロジックによって戻される割り込み番号は、次に、割り込み番号をデータとしてもつRWRコマンドの形でMBC50に渡し戻され、最終的に、それを必要とするペンティアム又はi486に与えられる。
ブリッジ・インターフェース・コントローラのレジスタのアクセス・コマンドは、図17に示すステップ208によって処理される。
9.キャッシュ・スヌープ・ロジック
図18、19及び20は、どの1つのパリティもキャッシュ・ラインを所有しない対称のバス・キャッシング・システムにおいて複数のCPU及びブリッジ・インターフェース・コントローラのキャッシュが同時にかつ協力して機能することを可能にするMESIキャッシュ・スヌーピング・プロトコルの構造(図18)及び機能的オベレーション(図19及び20)を示す。即ち、それは、(オーナーシップ(ownership)が排他的アクセス(これは、唯一の、しかしキャッシュ・ラインへの排他的アクセスではないことを意味する)によって置換される)従来のMOSIシステムと異なる。
規定は以下のようである。キャッシュはキャッシュ・ラインのコピーを含むことができない、または、それは特定のキャッシュ・ラインを含むための排他的(ただ1つの、を意味する)キャッシュであり得る、または、他のものがまたコピーを含むならば、それはキャッシュ・ラインへの共用(sharing)アクセスであり得る、または、キャッシュ・ラインが替えられていたならば、それは変更されたキャッシュ・ラインであり、誰もそれを有することができない、または、何れかの者がそれらのコピーを変更するならば、私達は私達のコピーを、私達がそれを有していなかったかのように、無効とマーク付けして、再使用のためのスペースを自由にしそして変更されたデータをメモリに送り返す。
従って、各キャッシュ・ラインは、フラッグ・ビットM(“変更”に対する)、E(“排他的”に対する)、S(“共用される”に対する)及びI(“無効”に対する)、を伴う。そして、図18に示すように、信号ACK(“私はそれを有する”に対する)、NAK(“後に再度試みよ”に対する)、MCI(“それはシーケンスを外れてあなたに来るであろう”に対する)、CMD(“私はそれが変更されたのを有する”に対する)及びCDS(“私はそれを共用している”)が、キャッシュを有するスライス・デバイスのすべてに送られる。これらは、アドレスがXA−MPバス21に与えられると、キャッシュが互いの内容をスヌープすることを可能にする。
図18に示されるように、各キャッシュはタグ比較ロジック210を含み、それは、何れかのXA−MPバス・アドレスのタグ部分とローカル・キャッシュ170内に含まれるタグ212とを比較することが可能であり、アドレスがキャッシュ170内に存在するならば比較信号をXA−MPバス・スヌープ・ロジック186に提供する。XA−MPバス・ロジックは、最初に、ACK信号を生成する(RAMメモリがこれをし得るがこれをし、次に、スヌープ・ロジック186はMESIビット192を検査し、以下のものを信号で伝える)。
−−排他的ビット又は共用ビットがセットされたならば、それはCDS信号を生成する。
−−MODビットがセットされたならば、それはCMD信号を、そしてまたMCI信号を生成し、ステップ188が、シーケンスを外れたキャッシュからキャッシュへのRLR転送によって、変更されたキャッシュ・ラインを送り戻すであろうことを伝え(しかし、ブリッジ・コントローラのキャッシュは要求をNAKし、WCL(すべてのデータが有効である場合)又は1つ以上のWBW(何れかが無効である場合)を用いRAMに替えられたデータを送り、これが完了するまでNAKを行い、次にキャッシュ・ラインを無効とマーク付けする。
−−さもなければ応答がない。
ブリッジ・インターフェース・コントローラと関連するキャッシュは、それが、どのバイトが有効データであるかを示す変更されたビット176と、(周辺デバイスのオペレーションへの出力の間に関して)キャッシュ・ラインが完全に読み取り可能なデータのみを含むかどうかを示す読み取り性(readability)ビット192とを有する、という点で他のものと異なる。ステップ188は、CPUキャッシュの場合、故障(out of order)RLR転送を用いてキャッシュへ変更されたデータ・キャッシュを転送し、そして、ブリッジ・コントローラの転送の場合、変更されたデータをRAMに送り戻し、要求しているプロセッサをNAKする。ブリッジ・コントローラのキャッシュはまた、図18の172及び図14及び15に示すように、周辺デバイスへのキャッシュとして働くが、それは、RAM及びそれと同様のものへのDMA転送に対してバッファとして以上に機能するように上記で説明したように変更される。
a)書き込みサイクル
キャッシュ・スヌーピング(snooping)・オペレーションは図19及び20に要約される。CPUのキャッシュに対して、キャッシュ・ライン270への書き込みに応答して、ローカルのキャッシュのスヌーブ・ロジックは、ローカルのコピーが222で“排他的”とマークされたを見るために検査され、そうであるならば、224で“変更された”とマークされる。どの他のキャッシュもコピーを含んでいないので、これ以上のことは行われる必要がない。どのXA−MPバス・アドレスもデータ・サイクルも要求されない。
226で、“共用された”とマークとされると、“PICL”コマンドが他のスヌープ・ロジック・ユニットに送り出されて、他のキャッシュに存在するこのデータの他のコピーを無効にし、そして再び、それは“変更された”とマークされる。すべての他のコピーがそれらのローカル・スヌープ・ロジックによって“無効”とマークされる。これは、XA−MPバス・アドレス・サイクルのみを用い、データ・サイクルを用いない。
232で、“変更された”とマークされると、同じステップがとられる。何れの者も“変更された”あるいは“排他的”コピーを有さないので、PICLコマンドは、インコヒーレンシー(incoherency)・エラーを検出することができることに留意されたい。
238で、私達のローカル・キャッシュのコピーが無効又はなくなっている場合、或る者はRILを行いステップ220に戻り、キャッシュ・ラインへの書き込みを再び試みる。
ブリッジのキャッシュに対して、ローカルのキャッシュのスヌープ・ロジック270は、ローカル・コピーが“変更された”とマークされているかどうかを見るために検査をする。そうであるならば、これ以上行われる必要がない。
“変更された”とマークされていないならば、BICLコマンドが他のスヌープ・ロジック・ユニットに送られて、他のキャッシュに存在するこのデータの他のコピーを無効にし、そしてそれは“変更された”とマークされる。
これは、変更されたデータを含むキャッシュをNAKするように及びデータをRAMに送り返すように強制し(図14のステップ184、190、194及び196を参照せよ)、CPUのキャッシュに対しては、変更されたデータはRAMに、それが或る新しいトランザクションによってローカル・キャッシュから強制的に出されるまで、戻されない。次に、それはキャッシュ書き戻し(writeback)レジスタに移動され(そこにおいて、それはいまだアクティブなキャッシュにあり)、それはWCL要求によってメモリに送り戻される。
b)読み取りサイクル
データがローカル・キャッシュに存在しない読み取り要求は(図20、ステップ242)、RCL読み取りキャッシュ・ライン・コマンドの実行で開始される。RAMメモリは、アドレスが有効であるならばACKする。すべてのキャッシュにおけるスヌープ・ロジック186は、衝突(collision)に対してアドレス及びローカル・キャッシュを試験し、次に、ヒットが存在する場合にはMESIビットの状態を検査する。CMD信号は、変更されたコピーが或るキャッシュに存在することを示し、CDS信号は、変更されていないコピーがどこかに存在することを示す。CMDまたはCDS応答がない場合(ステップ244及び246)、戻されたキャッシュ・ラインは248で排他的とマークされる。他のコピーがどこかに存在したならば(ステップ246)、すべてのコピーは“共用される”とマークされる。変更されたコピーがCPUのキャッシュに存在したならば(ステップ252)、変更されたコピーを含むキャッシュはMCI信号に応答し(ステップ258)、ステップ260で、キャッシュに直接にキャッシュする変更されたキャッシュ・ラインの、シーケンスから外れた転送を開始する。同じ変更された値に対するこのような要求の素早いシーケンスは、ウォーターフォール(waterfall)効果を引き起こすことができ、そこでは、それはキャッシュからキャッシュへ迅速に転送され、1つのキャッシュ(最後のキャッシュ)のみがその“変更された”信号の組を有する。
変更された値を含むキャッシュがブリッジ・コントローラ・キャッシュであるならば(ステップ252)、データは、たぶん、DMA転送からRAMに到着しているところである。この場合、読み取りキャッシュ・ラインの要求は、ブリッジ・コントローラのスヌープ・ロジックによってNAKされ、そして、変更されたデータはRAMに書き込まれる(図20のステップ256及び図18のステップ188)。
ブリッジI/Oロジック及びオペレーションの更なる詳細は、アペンデイックス9の“ブリッジ・インターフェース・コントローラ”と題されたところで見つけられる。
10.プロセッサ・モジュール16
上記で説明したシステム10の特徴、構造、及びオペレーションは、このシステムの必要不可欠なすべての機能的ユニットにおいて実現されるので、PM16の基本的なオペレーションの特徴は、上記の説明から及びPM16のエレメントに関係する適切なアペンデイックスから、理解されるであろう。その中には、“メモリ・バス・コントローラ”と題されたアペンデイックス6と、“プロセッサ・データ経路”と題されたアペンデイックス7とが含まれる。
従って、以下に、適切なアペンデイックスと、PM16の特徴とシステム10の以前説明した特徴との関係とを理解するのを助けるために、要約ブロック図のレベルでPM16を説明する。
図22を参照すると、PM16の全体のブロック図が示されており、そして、以前説明したように、各PM16はプロセッシング・ユニット42を含み、それは、第2のキャッシュ機構46に関連するプロセッシング・ユニット42に対する第一キャッシュ支持データ及び命令の読み取り及び書き込みと、直接のプロセッサ・ユニット42のオペレーションを支持するための第2のキャッシュ・ディレクトリ48とを含む。PM16のこの好適な実施例に関連するアペンデイックスにおいて、プロセッサ・ユニット42はタイトルP5によって指定され、キャッシュ・ディレクトリ48及び第2のキャッシュ46はタイトルC5C及びC8Cによって指定され、そこにおいて、P5はペンティアム・マイクロプロセッサであり、C5C及びC8Cは、インテル社からの関連のキャッシュ機構であり、適切な製品書類においてこれらのタイトルで呼ばれることに留意されたい。
各PM16は、更に、割り込み処理のためのアドバンスト・プロセッサ割り込みコントローラ(Advanced Processor lnterrupt Controller)(APIC54)と、スヌーピング・オペレーションで用いるためのキャッシュ機構44のタグ・ディレクトリの複製を記憶するための複製ディレクトリ(Duplicate Directory)300とを含む。
各PM16は、また、以前説明したように、XA−MPバス12に関するPM16のオペレーションを制御するためのMBC50と、2つのPDP52の形である2つのデータ経路、即ち、1つは偶数データ・バス26用で1つは奇数データ・バス26用、とを含む。
a.メモリ・バス・コントローラ50
次に図24及び図25を参照すると、MBC50に更に重点を置いた更なるブロック図が図解されている。図23は、図24と図25との関係を示す。示されているように、MBC50は、PDPs52を制御するプロセッサ・データ・パス制御302と、ACK/NAK発生器304とアドレス・レジスタ(A)306と、スライスのスライス番号を記憶するスロットID308と、アドレス・デコード・メカニズム(ADDR デコード)310とを含む。
MBC50は、更に、制御レジスタ312とADAMP126との組と、状態及び識別レジスタ312の組と、実行モニタ・レジスタ314とを含む。MBC50は、また、「Tag RAM」と示され、状態情報を記憶する関連する状態RAM318を有する複写(duplicate)ディレクトリ300を制御する第2のタグ・コントローラ316を含む。
図26を参照すると、MBCは、更に、XA−MPインターフェース制御322、クロック発生器322、仲裁論理324、スヌープ制御論理186、アドレス・マッピング制御326、トラップ/状態論理328及び誤り論理330を含む種々の制御論理を含む。
b.プロセッサ・データ・パス52
次に図27を参照すると、PDP52のブロック図が示されている。示されているように、PDP52は、XA−MPバス12へのXA−MPバス・インターフェース332と、出力FIFO334と、入力FIFO336と、キャッシュ・メカニズム44へのキャッシュ・データ・インターフェース338とから成る。入力データ・パスに関連するのは入力データ・パリティ・チェック340であり、出力データ・パスに関連するのは出力パリティ制御342である。
PDP52とMBC50との間のインターフェースは、MBCインターフェース344、MBC−IN346及びMBC−OUT348を介して提供される。PDP52の動作は、状態マシン350によって提供される。
PDP52は、更に、エラー・コレクタ360、クロック信号を与える位相ロック・ループ362及び走査制御364を含む。
以上で本発明の現時点での好適実施例を終わる。以上で述べてきた発明は、その本質的な特性から離れることなくこれ以外の形式でも具体化され得る。よって、この実施例は、あらゆる点において説明のためのものであって制限を意図したものではなく、本発明の範囲は、以上の説明ではなく、請求の範囲によって示される。請求の範囲の均等の意味及び範囲に含まれるあらゆる変更及び修正は、したがって、その範囲内に含まれるものとする。