JP4348093B2 - マップテーブルを用いてメモリにインタリーブ方式でアクセスする方法 - Google Patents

マップテーブルを用いてメモリにインタリーブ方式でアクセスする方法 Download PDF

Info

Publication number
JP4348093B2
JP4348093B2 JP2003043586A JP2003043586A JP4348093B2 JP 4348093 B2 JP4348093 B2 JP 4348093B2 JP 2003043586 A JP2003043586 A JP 2003043586A JP 2003043586 A JP2003043586 A JP 2003043586A JP 4348093 B2 JP4348093 B2 JP 4348093B2
Authority
JP
Japan
Prior art keywords
entry
memory
cell
address
entries
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2003043586A
Other languages
English (en)
Other versions
JP2003271569A (ja
JP2003271569A5 (ja
Inventor
アシシュ・ガプタ
ウィリアム・アール・ブライグ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HP Inc
Original Assignee
Hewlett Packard Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Co filed Critical Hewlett Packard Co
Publication of JP2003271569A publication Critical patent/JP2003271569A/ja
Publication of JP2003271569A5 publication Critical patent/JP2003271569A5/ja
Application granted granted Critical
Publication of JP4348093B2 publication Critical patent/JP4348093B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/06Addressing a physical block of locations, e.g. base addressing, module addressing, memory dedication
    • G06F12/0607Interleaved addressing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multi Processors (AREA)
  • Memory System (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Memory System Of A Hierarchy Structure (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は概して、コンピュータシステムのセルマップに関する。本発明は特に、ウェイ数のより大きなインタリーブを行うためにエントリグループ化を利用するセルマップを用いてメモリをインタリーブするシステムおよび方法に関する。
【0002】
【従来の技術】
歴史的に見て、主メモリは物理的に中央バス上に配置されてきた。この種のシステム内では、完全な物理アドレスからなるメモリ要求がメモリサブシステムに転送され、データが戻される。分散メモリシステムでは、主メモリは多くの異なるセルにわたって物理的に分散される。セルはいくつかのプロセッサ、入出力(I/O)装置、セルコントローラ、およびメモリからなり得る。
【0003】
分散システムでは、メモリをインタリーブしてもしなくてもよい。従来技術によるメモリをインタリーブするシステムおよび方法は、たとえば下に示す特許文献1の、Williams他に1996年6月25日付けで発行された「METHODS AND APPARATUS FOR INTERLEAVING MEMORY TRANSACTIONS INTO AN ARBITRARY NUMBER OF BANKS」、および特許文献2のBrockmann他に1994年3月8日付けで発行された「FLEXIBLE N-WAY MEMORY INTERLEAVING」に説明および記載されており、これらは本発明の所有者に譲渡されている。メモリが複数の物理的なセルに分割される、または複数の物理的なセルにわたって分割される非インタリーブアクセス方法では、まず第1のセルのすべてのメモリに順次アクセスし、次いで第2のセル中の利用可能なすべてのメモリに順次アクセスし、以下同様を行うことにより、連続したメモリ空間が1つにまとめられたブロックとしてアドレス指定される。各セルが可能な限りの最大メモリ量で構成されていた場合、システムからそのメモリは1つの連続したメモリブロックのように見え、1つの連続したメモリブロックとしてアドレス指定される。しかし、すべてのセルが最大メモリ容量に構成されているわけではない場合、この非インタリーブ方式では、セル内のメモリブロックの損失に対応してメモリ空間内に穴が生じうる。また、非インタリーブメモリでは、命令およびデータの双方が順次使用される傾向があるため、特定のセルへの複数の順次アクセスが必要である。ローカルに格納される場合には恩恵を受けるが、別のセルにおけるリモートメモリに連続してもしくは頻繁にアクセスするプロセッサは、ローカルセルおよびリモートセルの双方、ならびに接続ネットワークにおける処理リソースおよび通信リソースを含む相当なオーバヘッドを消費する。かなり続くと、これらリソースが他の処理に利用できなくなり、システムパフォーマンスが劣化することになり得る。
【0004】
代替として、分散メモリシステム内のメモリにインタリーブプロトコルを介してアクセスすることができる。いくつかのセルにわたりメモリをインタリーブすると、より均等にメモリにアクセスすることができる。たとえば、システムがバスシステムを介して共に接続された2個のセルを含み、各セルがメモリおよび4個の別個のプロセッサを含む場合、セル1におけるメモリをセル2におけるメモリでインタリーブすることにより、システム中の8個すべてのプロセッサがより均等に各メモリロケーションにアクセスする。2個のセルにメモリをインタリーブすることはまた、メモリロケーションにアクセスする際の各プロセッサの待ち時間遅延が一貫するように保証する。2つのメモリロケーションにメモリをインタリーブすると、プロセッサがメモリにアクセスしようと試みるか、またはメモリから情報を検索しようと試みる場合のボトルネックの可能性も減少する。
【0005】
インタリーブの一例として、システムに包含されるメモリが0、1、2、および3とラベルの付いた4個のセルに分散するものと仮定する。さらに、セル0およびセル1はそれぞれ8ギガバイト(GB)のメモリを含み、セル2およびセル3はそれぞれ4GBのメモリを含むものと仮定する。したがって、システム全体としては24GBのメモリを含む。分散メモリは以下のようにインタリーブすることができる。4個のセルはそれぞれ少なくとも4GBのメモリを含むため、最初のインタリーブエントリであるエントリ0は、セル0、1、2、および3それぞれからの4GBのメモリ、総計で16GBのメモリを含む。ここで、セル2およびセル3で利用可能なすべてのメモリがインタリーブエントリ0に使用されてしまった。セル0およびセル1それぞれは4GBの未使用メモリを含む。インタリーブエントリ1は、セル0からの4GBのメモリを含むとともにセル1からの4GBのメモリを含む。したがって、インタリーブエントリ1は、セル0から4GBかつセル1から4GBで、8GBのメモリを含む。ここで、4個のセルにおける24GBのメモリが2個のインタリーブエントリに分割された。ここで4個のセルからの24GBのメモリは、以下のような1つの連続ブロックとして見ることができる。GB0〜15はセル0、1、2、および3の下半分に配置され、GB16〜23はセル0〜1の上部分に配置される。このインタリーブはキャッシュラインレベルで行われる。プロセッサからは、24GBの情報は1つの連続したブロックに見える。24GBの情報は、1つの連続したブロックとして見えるが、物理的には4個の異なるセルに分散されている。
【0006】
大型コンピュータシステムは、セルマップを使用してプロセッサアクセスを分散させてホットスポットを回避している。セルマップは、セル/ノードベースのシステムについて宛先モジュールを見つけるために使用されている。セルマップを使用してメモリをセルにインタリーブし、より均等なアクセスパターンをメモリに提供している。セルマップエントリは、1、2、4、8、16、32、および64ウェイインタリーブを提供するために使用されてきた。セルマップエントリのサイズが、メモリがインタリーブされるウェイ数を決める。
【0007】
セルマップを使用する従来のシステムでは、セルマップエントリの数およびサイズを予め決定する必要があった。より大きなウェイ数のインタリーブを行うには、セルマップ構造をそれに従って事前に設計する必要があった。使用可能なインタリーブのウェイ数は、システムサイズ、メモリ構成、および他のパラメータに依存する。インタリーブのウェイ数が増えるとエントリも増え、より多くのリソースを使用する。従来のシステムによっては、ウェイ数のより大きなインタリーブが必要であるが、システムのリソースが限られているため、エントリにつきウェイ数の小さいインタリーブを行わなければならないか、またはウェイ数のより大きなインタリーブにエントリのサブセットを1つだけ確保し、残りのエントリがウェイ数のより小さいインタリーブを提供するものがある。従来のシステムでは、セルマップが常に効率よく使用されているとは限らず、ウェイ数のより大きなインタリーブを提供するようにスケーラブルではない。
【0008】
【特許文献1】
米国特許第5,530,837号
【特許文献2】
米国特許第5,293,607号
【0009】
【発明が解決しようとする課題】
ウェイ数のより小さなインタリーブエントリと組み合わせることによってウェイ数のより大きなインタリーブを達成することが望ましい。
【0010】
【課題を解決するための手段】
本発明の一形態は、連続した論理アドレス空間を使用して複数のメモリにインタリーブ方式でアクセスする方法を提供する。少なくとも1つのマップテーブルが設けられる。少なくとも1つのマップテーブルは、複数のエントリを含む。各エントリは、複数のエントリ項目を含む。各エントリ項目は、メモリの1つを識別する。第1の論理アドレスを受信する。第1の論理アドレスは、複数のアドレスビットを含む。複数のアドレスビットは、少なくとも1つのマップテーブルにおける第1のエントリの組に対応する第1のアドレスビットの組を含む。第1のエントリの組における第1のエントリは、アドレスビットの第1の組および第2の組に基づいて識別される。第1のエントリにおける第1のエントリ項目は、アドレスビットの第3の組に基づいて識別される。第1のエントリ項目によって識別されるメモリにアクセスが行われる。
【0011】
【発明の実施の形態】
以下の好ましい実施形態の詳細な説明では、本発明の一部をなし、本発明を実施し得る特定の実施形態を例として示す添付図面を参照する。本発明の範囲から逸脱することなく他の実施形態を利用することができるとともに、構造的または論理的な変更を行い得ることを理解されたい。したがって以下の詳細な説明は、限定を意味するものと解釈すべきではなく、本発明の範囲は併記の特許請求の範囲によって定義される。
【0012】
図1は、クロスバー125を介して接続された4個のセル105、110、115、および120を含む処理システムまたはノード100を示すブロック図である。各セルは対応するメモリブロックを有する。すなわち、セル105にはメモリ130、セル110にはメモリ135、セル115にはメモリ140、またセル120にはメモリ145がある。各セルはまた、4個のプロセッサ(セル105の場合、150、155、160、および165と符号が付与される)と、入出力(I/O)モジュール(セル105の場合では170と符号が付与される)と、セルコントローラ(セル105では175と符号が付与される)とを備える。
【0013】
4個のプロセッサ150〜165それぞれおよびI/Oモジュール170は、メモリ130へのアクセスを要求する。セルコントローラ175は、I/Oモジュール170およびプロセッサ150〜165の双方とメモリ130との間のインタフェースである。メモリアクセスデバイス(たとえば、プロセッサ150〜165のいずれか、またはI/Oモジュール170)がメモリの正確な部分にアクセスするために、セルコントローラ175が、メモリアクセスデバイスが知っている論理メモリアドレスを物理アドレスに変換する。物理アドレスは、セルコントローラ175にメモリ要求のルーティング方法を伝える。セル1中の任意のメモリアクセスデバイスは、セル115のメモリ140、セル120のメモリ145、またはセル110のメモリ135にもアクセスすることができる。セルコントローラ175は、セルマップを使用して、メモリアクセスデバイスからの論理メモリアドレスを変換して、適切なメモリにアクセスするために使用することのできる適切な物理アドレスにする。一実施形態では、セルコントローラ175は、各メモリアクセスデバイスごとに異なるセルマップを含む。図1に示す実施形態では、セルコントローラ175は、取り付けられたメモリアクセスデバイスごとに1つずつ、合わせて5つの異なるセルマップを含む。
【0014】
セルマップの一実施形態は、複数の行および複数の列を有するテーブルであり、各行がインタリーブエントリに対応し、行中の各列がシステムにおけるセルの1つを識別するエントリ項目に対応する。
【0015】
図2は、4個のセル:セル0、セル1、セル2、およびセル3にメモリが分散した分散メモリシステム200を示す。セル0は総計で8ギガバイト(GB)のメモリを含み、セル1は6GBのメモリを含み、セル2は4GBのメモリを含み、セル3は2GBのメモリを含む。一実施形態では、これら4個のセルへのインタリーブは、以下のようにして達成される。まず、インタリーブに利用可能なメモリ量が最小なのはどのセルかについて査定を行う。この場合、セル3は2GBのメモリしか含まない。したがって、インタリーブエントリ0は、セル0、1、2、および3から2GBのメモリ、総計で8GBのメモリをインタリーブする。その結果得られるインタリーブエントリを図3の行305に示す。図3中、各行は最大8個のセルメモリを識別する。行305の上には、3ビットの8つの組み合わせがあり、3ビットの各組み合わせが行305(および行310)における8つのエントリ項目の1つに関連付けられる。3ビットのこれら組み合わせを使用して特定のエントリ項目を識別するが、これについてさらに詳細に後述する。
【0016】
次に、査定を行って、利用可能な任意のセルに残っている最小のメモリ量を決定する。この場合、セル2における2GBである。セル0、セル1、およびセル2にわたるインタリーブは、図4に示す3つのインタリーブエントリを使用することによって提供される。インタリーブエントリ1、2、および3(図4中の3ビット組み合わせの下にある最初の3行それぞれ)は、セル0の二番目の2GBブロック、セル1の二番目の2GBブロック、およびセル2の一番上の2GB部分に使用される。この時点において、インタリーブエントリ0は、総計8GBの情報をアドレス指定するが、インタリーブエントリ1、2、および3はそれぞれ2GBの情報を含む。セル3のメモリリソースは、インタリーブエントリ0で完全に使用されてしまった。セル2のメモリリソースは、インタリーブエントリ3の完成を通してなくなった。
【0017】
本プロセスにおける次のステップは、割り当てられずに残っている任意のセルのメモリを識別することである。この場合、セル1に2GBのメモリが残っている。インタリーブエントリ4は、通常であれば、セル0からの2GBのメモリおよびセル1からの2GBのメモリを含むことになろう。この配列により、すでにマッピングされた14GBに4GBが追加され、総計で18GBになる。しかし、一実施形態では、各テーブルエントリがグループサイズの整数倍で、すなわち16GBで始まることが好ましい。したがって、セル0およびセル1における4GBが1つのインタリーブエントリを占めることができるようにするには、次に2GBを追加する必要がある。このため、インタリーブエントリ4(図示せず)は、セル0にある一番上の2GBを表し、マッピングする。ここで、今までに定義されたインタリーブエントリ(0、1、2、3、および4)は16GBのメモリを含むことになる。インタリーブエントリ5(図示せず)は、セル1にある残りの2GBおよびセル0における残りの2GBをマッピングする。これは、これまでにエントリ0、1、2、3、および4に割り当てられた16GBが4GBの倍数であるため差し支えない。要約すると、セル0〜セル3に含まれる20GBのメモリはここで、6つのインタリーブエントリに含められる。最初のインタリーブエントリは、4個のセルそれぞれから2GBずつ、合わせて8GBの情報を含む。インタリーブエントリ1、2、3、および4は2GBを含み、インタリーブエントリ5は4GBを有する。
【0018】
インタリーブグループは、所与のメモリ範囲でのインタリーブに制限される同量のメモリを有する複数のセルのユニットとして定義される。インタリーブグループは1つまたは複数のインタリーブエントリで構成される。インタリーブグループ0は、インタリーブエントリ0内にある8GB、換言すれば4個のセルそれぞれからの2GBで構成される。インタリーブグループ1は、インタリーブエントリ1、2、および3内にある6GB、換言すればセル0からの2GB、セル1からの2GB、およびセル2からの2GBで構成される。インタリーブグループ2は、セル0の一番上の2GB(すなわち、インタリーブエントリ4)で構成される。インタリーブグループ3は、セル0およびセル1それぞれからの2GBで構成される(すなわち、インタリーブエントリ5)。
【0019】
所望の物理メモリが配置されている特定のセルを識別するには、入力メモリアドレスからの第1のアドレスビットの組を使用してセルマップの行を識別し、入力メモリアドレスからの第2のアドレスビットの組を使用して識別された行にインデックスを付け、エントリ項目を識別する。一実施形態では、44ビットメモリアドレスが使用され、アドレスビット29〜43が第1のアドレスビットの組に対応し、ビット6〜8が第2のアドレスビットの組に対応する。3ビット(たとえば、ビット6〜8)を使用して、8列すなわち8個のエントリ項目を有するエントリにインデックスを付ける。16エントリ項目を有するエントリの場合には、4ビット(たとえば、ビット6〜9)をインデックス付けに使用する。同様に、エントリサイズが倍になるごとに、追加のインデックス付けビットを1個使用する。
【0020】
インタリーブは、アクセスされた連続メモリ量が少なく保たれる場合に最も効果的である。キャッシュラインインタリーブでは、セルマップはキャッシュラインが配置されるセルを示す。このため、インタリーブエントリ0(図3における行305)を再び参照すると、キャッシュラインがセル0、1、2、および3の間でインタリーブされた場合、行305はどのようにセルがテーブル内で表されるかを示す。一実施形態では、行305の上にある複数の3ビット組み合わせでの3ビットは、入力論理メモリアドレスのアドレスビット6〜8に対応する。入力アドレスのこれら3ビットを使用して、行にインデックスを付け、エントリ項目の1つを識別する。行305における各エントリ項目は、4個のセルの1つを識別する。図3に示すように、メモリアドレスのビット6〜8が000である場合、これは、メモリの物理アドレスがセル0にあることをセルコントローラに示す。メモリアドレスのビット6〜8の値が001である場合、これはメモリの物理アドレスがセル1にあることをセルコントローラに示す。同様に、セルコントローラは、メモリアドレスのビット6〜8について可能な他の6つの値それぞれを使用して、テーブルからのセルを識別する。
【0021】
再び図1を参照して、4個のセルを有する単一ノードを示す。各セルはそれぞれのメモリデバイスを有する。しかし、システム全体が2個の4セルノードを有する場合には、それぞれメモリを有する8個のセルが利用可能である。これらセルにセル0〜セル7とラベルを付ける場合、メモリを8個すべてのセルにわたってインタリーブすることができるであろう。図3の行310は、どのようにメモリを8個すべてのセルにインタリーブすることができるかを示す。この場合、3ビット指示子(メモリアドレスのビット6〜8)は、8個のセルのうちいずれがメモリの物理アドレスを含むかを示す。したがって、行310は8ウェイインタリーブを示し、行305は4ウェイインタリーブを示す。
【0022】
システムが3セル構成を有する場合、セルマップは、3ウェイインタリーブを示す図4に示すようになる。3個のセルは、セルマップにおいて3行にわたって効率的にマッピングされる。1行目の1列目は、セル0の値を含む。1行目の2列目は、セル1の値を含む。1行目の3列目は、セル2の値を含む。このシーケンスは、最後のセルが3行目の最後の列で終わるまで繰り返される。
【0023】
セルマップの行は、マスク、コンパレータ、およびメモリアクセスデバイスからのメモリアドレスビットの組み合わせを介してセルコントローラによって識別される。マスクを使用して、適切な行の決定に関係のないアドレスのビットをマスクする。コンパレータは、マスクしたアドレス部分を整合値と比較して、セルマップの対応する行を識別する。
【0024】
図5は、シングルキャッシュラインインタリーブの場合の64ウェイインタリーブドセルマップエントリを示すブロック図である。図5におけるセルマップエントリは64ウェイインタリーブであるため、メモリアドレスの6ビット(たとえば、ビット6〜11)をエントリへのインデックス付けに使用する。エントリイネーブルブロック510は、入力メモリアドレスのビット29〜ビット43を含むアドレス部分505を使用してセルマップの適切な行を識別する。アドレス範囲は、行選択に使用するアドレス部分505から決定される。図5に示すように、エントリイネーブルブロック510は、以下の式Iを実行する。
【0025】
【数1】
Entry_enable=((ADDR AND MASK)==cmp)
式I
【0026】
式Iに示すように、エントリイネーブルブロック510は、アドレス部分505をマスクしてアドレスの最下位ビットを破棄し、マスクされたアドレスをその行の比較値または整合値である「cmp」と比較する。比較における値が等しい場合、Entry_enableに、マッチする行を示す論理的に真の値が割り当てられる。値が等しくない場合、Entry_enableに、マッチしない行であることを示す偽の論理値が割り当てられる。
【0027】
行が選択されると、メモリアドレスのビット6〜11を使用して、セルマップのその行内の64個のエントリ項目の1つを識別し、「CELL」および「Cell_Addr」が決定され、出力される。「CELL」は、セルを一意に識別するセルIDを表し、「Cell_Addr」はセルアドレスを表し、これについてさらに詳細に後述する。図5に示すように、アドレス部分515は、アドレスビット6〜11および29〜42を含み、アドレスビット6〜11および29〜42を使用して適切なセルIDおよびセルアドレスを決定する。アドレス入力520に示すように、さらなる入力によってさらなるテーブルエントリ項目を選択することができる。図5に示すように、以下の式IIに示すような比較を行うことによって列が選択される。
【0028】
【数2】
Column_Select=(ADDR[11:6]==0x0)
式II
【0029】
式IIからわかるように、メモリアドレスのビット6〜11を、列に対応する16進数の値(たとえば、この場合では0x0であり、これは一列目に対応する)と比較する。比較している値が等しい場合、Column_Selectは、マッチングを示す真の論理値を含む。比較している値が等しくない場合、Column_Selectは、マッチングがないことを示す偽の論理値を含む。
【0030】
エントリイネーブルブロック510でのコンパレータおよびマスクの使用について、図6を参照してさらに詳細に述べる。図6は、十進数の0〜16を表す二進数を示す。0〜16の範囲の10進数は4つの異なるグループ:0〜3を含むグループ605、4〜7を含むグループ610、8〜11を含むグループ615、および12〜15を含むグループ620に分けられている。マスクを効果的に使用するために、種々のグループを識別する方法が必要である。この場合、最初の2ビット、すなわち最上位2ビット(最左端の2ビット)を使用して各種グループを区別することができることがわかる。グループ605に表示される4つの数はそれぞれ00で始まり、グループ610の中の数はそれぞれ01で始まり、グループ615の中の数はそれぞれ10で始まり、グループ620の中の数はそれぞれ11で始まる。したがって、1100からなるマスクが確立される。重要な各ビットには「1」を配置し、重要ではない、すなわち「無関係な」各ビットには「0」を配置する。コンパレータは、メモリブロックの開始アドレスに等しくセットされる。マスクを使用して、4つのグループ605〜620のいずれに所望のビットシーケンスが存在するかを判定する。2つの最上位ビットの比較により、セルマップ内の特定の行が決定される。
【0031】
コンパレータおよびマスクの使用をさらに説明するため、いくつかの例を考察する。図7を参照すると、ノードは4個のセルを含み、セル0は5GBのメモリを有し、セル1は3GB、セル2も3GB、またセル3も3GBのメモリを有する。16進数表記では、1GBは0X000_40000000である。図7のインタリーブエントリ0は、4個のセルそれぞれから2GB、総計8GBのメモリを含む。このメモリブロックの範囲は0GBから最大8GBである。コンパレータは、0X000_00000000に等しい。マスクの値は、メモリロケーションが8GBよりも大きいかどうかを判定するために調べる必要のあるビットを識別することによって決定される。値が8GBを越えるかどうかを判定するために調べなければならない各ビット位置に、「1」を配置する。このため、16進数表記では、マスクは0Xffe_00000000に等しい。16進数表記での最下位の8つの数で表されるビットは、メモリロケーションの値が8GBを越えているかどうかの判定に必要ないため、調べる必要はない。したがってマスクは、メモリアクセスデバイスの1つからのメモリ値が8GBを越えるか否かを判定するために調べる必要のあるビット位置のみを含む。確立されたこのマスクおよびコンパレータを使用すると、0〜8GBの範囲にあるいずれのアクセスもインタリーブエントリ0しか起動しない。対応するセルマップの適切な行内において、セル番号は0、1、2、3、0、1、2、3として識別され得る。これは、図3における行305と同様である。この構成は、セル0〜3の間での4ウェイインタリーブを達成する。インタリーブエントリ1の場合、ここでも4個すべてのセルが使用されるが、今度は各セルから1GBのメモリのみが使用される。この場合、コンパレータ値は、8GBに等しい0X002_00000000に等しい。これは、このインタリーブエントリの開始値である。この場合のマスク値は、0Xfff_00000000である。インタリーブエントリ1が確立されると、セル0に2GBが残る。
【0032】
概して、インタリーブは、まず最大のブロックにわたって行われるため、続いて次のインタリーブブロックのサイズはより小さい。セル0に残っている2GBは、通常であれば、図7に示す1GBチャンクに分けられる。しかし、この場合、インタリーブエントリ0およびインタリーブエントリ1に含まれる12GBは、セル0に残っている2GBで割り切れる。したがって、インタリーブエントリ2は、セル0に残っている2GBのメモリを含むことになり、コンパレータ値は12GBである0X003_00000000になり、マスク値は0Xfff_80000000になる。
【0033】
最後の例として、図8に示すように、ノードが3個のセルを含み、各セルが2GBのメモリを含む場合、インタリーブは以下のように行われる。インタリーブエントリ0の場合、コンパレータは0X000_00000000、すなわち0GBである。マスクは0Xfff_80000000である。これにより、セル0の最初の1GBおよびセル1の最初の1GBの間でインタリーブすることができるようになる。この場合の行エントリは、0の後に1が続き、行の全長にわたりこれが交互になったものからなる。これは、ここでもセル0から1GBおよびセル1から1GBというメモリの最初の2GBにわたり2ウェイでインタリーブする。
【0034】
インタリーブエントリ1の場合、コンパレータ値は0X000_80000000であり、これはすなわち2GBに等しい。この場合のマスク値は、0Xfff_80000000である。対応するセルマップ行は、行の全長にわたって1と2が交互になったものであり、これにより、セル1からの2番目のGBおよびセル2からの最初のGBにわたり2ウェイインタリーブすることができる。
【0035】
インタリーブエントリ2は、0X001_00000000のコンパレータ値を有し、これは4GBに等しい。マスク値は、0Xfff_80000000である。このインタリーブエントリのセルマップ内の対応する行は、行の全長にわたって2と0が交互になったものである。このインタリーブエントリは、セル2およびセル0にわたり2ウェイでインタリーブし、最後の2GBのメモリを含む。
【0036】
一実施形態では、セルコントローラは、セルIDだけの場合よりも、より多くの情報をセルマップエントリ項目から取得する。たとえば、セルコントローラをセル0に送る(direct)いくつかのセルマップエントリ項目がありうる。セル0に含まれるメモリは、様々なインタリーブエントリに分けられている場合がある。一実施形態では、セルマップエントリ項目は、セル0のメモリ内のどこに要求される情報が格納されているかの指示もセルコントローラに供給する。本発明の一形態では、CELL_ADDRすなわちセルアドレスを使用して、セルコントローラを特定のメモリアクセスのためにセルメモリ内の特定の512メガバイト(MB)領域に送る。セルアドレス式の一実施形態を以下の式IIIで提供する。
【0037】
【数3】
CELL_ADDR=((ADDR[42:29]&CHUNK_MASK)>>インタリーブ+CHUNK_START
式III
【0038】
アドレスビット29〜42は、特定のセル内のどこからデータの読み出しを開始するかを決定する際に使用される。式IIIに含まれるCHUNK_MASKは、先に考察したマスクの逆(inverse:インバース)である。CHUNK_MASKの目的は、セルコントローラをメモリブロックの正確な部分に導くことである。マスクしたアドレス部分は右シフト(記号「>>」で表される)され、インタリーブに使用されていたビットを削除する(式IIIでは「インタリーブ」と表される)。セルマップテーブルが8列を含む場合、3つのインタリーブビットが列の識別に使用される。セルマップが16列を有する場合、列の識別に4ビットが使用される。CHUNK_STARTは、他のインタリーブエントリ専用の、または他のインタリーブエントリによって以前使用されていたメモリの量である。たとえば、再び図2のインタリーブエントリ1を参照すると、インタリーブエントリ1は、エントリ0が4個のセルそれぞれから2GBを占めた後に来た。したがって、セル0の2番目の2GB部分がアドレス指定されている場合、CHUNK_STARTはインタリーブエントリ0に含まれた2GBである。あるいは、引き続き図2を参照すると、セル0における2GBおよびセル1における2GBを含むインタリーブエントリ5は、セル0およびセル1の双方における4GBのCHUNK_STARTを有する。要約すると、CELL_ADDR式は、メモリアクセスデバイスからのアドレスビットを使用し、所与のブロック内の特定のメモリロケーションに到達するようにするオフセットに等しいメモリ量を追加し、右シフトしてインタリーブにすでに使用しておりブロック内のロケーションを決定するためにもはや必要のないビットを削除し、他のインタリーブエントリ内のインタリーブにあてられていたセルメモリを追加する。
【0039】
図9は、セルマップ900の一実施形態の図である。セルマップ900は、複数のエントリ904をそれぞれ含むモジュールIDテーブル912およびチャンク開始テーブル914を含む。各エントリ904は複数のエントリ項目910を含む。代替の実施形態では、モジュールID情報およびチャンク開始情報を単一テーブルに組み込むことができる。別の代替実施形態では、セルマップ900はチャンク開始テーブル914を含まない。各エントリ904におけるエントリ項目910中の数は、インタリーブのウェイ数に基づく。たとえば、16ウェイインタリーブの場合、モジュールIDテーブル912およびチャンク開始テーブル914はそれぞれ、エントリ904毎に少なくとも16個のエントリ項目910をそれぞれ含むことになる(図9に示すように)。また、64ウェイインタリーブの場合、モジュールIDテーブル912およびチャンク開始テーブル914はそれぞれ、エントリ904毎に少なくとも64個のエントリ項目910を含むことになる。一実施形態では、モジュールIDテーブル912における各エントリ項目910は、宛先モジュール識別のために8ビットモジュールID値を含み、チャンク開始テーブル914における各エントリ項目910は、メモリロケーションの識別に使用されるチャンク開始値を含む。受信した各入力アドレス902に基づき、後述するように、適切なモジュールID値916およびチャンク開始値918が識別され、セルマップ900から出力される。
【0040】
以下の表1は、セルマップベースシステムの一実施形態を実施する擬似コードを含む。
【0041】
【表1】
Figure 0004348093
【0042】
上記表1の場合、以下の仮定を行う。すなわち、アドレスサイズの実施は50ビット(すなわち、ビット0〜49)である;各エントリ904は16ウェイインタリーブされる(したがって、エントリ904内でのインデックス付けのために4ビットが必要である);システムはシングルキャッシュラインインタリーブを実行している;キャッシュラインサイズは64バイトである(よって、アドレスビット6〜9がエントリ904内のインデックス付けに使用される);おおよそ32〜64個のエントリ904が各プロセッサインタフェースに設けられる;かつ、最小アドレス指定可能メモリは1/2GBである(よって、アドレスマスク(Address Mask)はビット29〜49を使用する)。
【0043】
上記仮定は一例のシステムに基づき、かつ特定の実施に基づいて変更を行いうることが理解されよう。たとえば、キャッシュラインサイズが64バイトではなく128バイトである場合には、入力アドレス902のビット7〜10がエントリ904内のインデックス付けに使用される。キャッシュラインサイズが256バイトである場合は、入力アドレス902のビット8〜11がエントリ904内のインデックス付けに使用される。キャッシュラインサイズが倍になるごとに、4つのインデックス付けビットがそれぞれ左に1ビット位置分シフトする。別の例では、最小アドレス指定可能メモリが1/2GBではなく64メガバイト(MB)である場合、アドレスマスク(Address Mask)は、ビット29〜49ではなくビット24〜49を使用する。種々のキャッシュラインサイズおよび異なる最小アドレス指定可能メモリサイズの他に、種々のアドレスサイズ、シングルキャッシュラインインタリーブではなくマルチキャッシュラインインタリーブ、およびインタリーブの種々のウェイ数を含むがこれらに限定されない他の変更を行うこともできる。
【0044】
表1に列挙される最初の項目はIncoming_Address[49:0]であり、これは入力アドレス902として図9に表される。一実施形態では、入力アドレス902はプロセッサアドレスであり、0〜49の番号が付けられた50ビットを含む。入力アドレス902は、第1のアドレス部分902A、第2のアドレス部分902B、および第3のアドレス部分902Cを含む。
【0045】
表1に列挙される2番目の項目は、Address Match[49:29]である。一実施形態では、セルマップ900における各エントリ904は、Address Match[49:29]の特定の値に関連付けられる。
【0046】
表1に列挙する3番目の項目は、Address Mask[49:29]である。Address Mask[49:29]は、入力アドレス902から関連するビットを抽出するためにセルコントローラ(たとえば、セルコントローラ175)により使用される。一実施形態では、入力アドレス902のビット29〜49は第1のアドレス部分902Aと呼ばれる。セルコントローラ175は、マスクされた第1のアドレス部分902Aを、Address Match値と比較してマッチするエントリ904を識別する。
【0047】
モジュールIDテーブル912におけるエントリ904は、表1に列挙される4番目の項目で表され、この項目はModule_id_table_in_entry[エントリにおけるインタリーブのMax_waysBits_per_module_id]である。Module_id_table_in_entryの括弧内の値は、モジュールIDテーブル912におけるエントリ904のビットサイズを表す。各モジュールIDに8ビットを使用し(すなわち、Bits_per_module_id=8)、かつエントリ904が16ウェイインタリーブされる(すなわち、エントリにおけるインタリーブのMax_Ways=16)と仮定すると、モジュールIDテーブル912の各エントリ904に必要なビット数は128(すなわち、8×16)になる。64ウェイインタリーブエントリ904の場合、モジュールIDテーブルエントリ904のサイズは512ビット(すなわち、64×8)になる。モジュールIDにつき8ビットを使用すると、256個のモジュールを一意に識別することができる。特定の実施に応じて、モジュールIDにつき他のビット数を使用してもよい。
【0048】
チャンク開始テーブル914のエントリ904は、表1に列挙される5番目の項目で表され、この項目はChunk_start_table_in_entry[エントリにおけるインタリーブのMax_Ways0.5GBのチャンクすべてをアドレス指定するために必要なビット数]である。Chunk_start_table_in_entryの括弧内の値は、チャンク開始テーブル914におけるエントリ904のビットサイズを表す。すべての1/2GBチャンクをアドレス指定するために8ビットが使用され、かつエントリ904が16ウェイインタリーブされる(すなわち、エントリにおけるインタリーブのMax_ways=16)と仮定すると、チャンク開始テーブル914の各エントリ904に必要なビット数は128(すなわち、8×16)になる。64ウェイインタリーブエントリ904の場合、チャンク開始テーブルエントリ904のサイズは512ビット(すなわち、64×8)になる。
【0049】
表1に列挙される6番目の項目は、Hit_for_that_entry=((Incoming_Address[49:29]]&Address Mask[49:29])==Address Match[49:29])である。一実施形態では、セルマップ900における各エントリ904は、Address Match[49:29]の特定の値に関連付けられ、表1に列挙される6番目の項目のようなヒット式が、ヒットが識別されるまで、セルマップ900における各エントリ904について実行される。変数Hit_for_that_entryは、(Incoming_Address[49:29]]&Address Mask[49:29])とAddress Match[49:29]の比較に応じて、真の論理値かあるいは偽の論理値のいずれかを含むことになる。(Incoming_Address[49:29]]&Address Mask[49:29])の値とAddress Match[49:29]の値が等しくない場合、Hit_for_that_entryは、偽の論理値になり、マッチしないエントリであることを示す。(Incoming_Address[49:29]]&Address Mask[49:29])の値とAddress Match[49:29]の値が等しい場合、Hit_for_that_entryは、真の論理値になり、マッチするエントリであることを示す。
【0050】
モジュールIDテーブル912の各エントリ904の場合、チャンク開始テーブル914に対応するエントリ904がある。ヒットがエントリ904に対して生成される場合、モジュールIDテーブルエントリからのモジュールID値916が出力され、対応するチャンク開始テーブルエントリからチャンク開始番号918が出力される。一実施形態では、チャンク開始番号918は、モジュールID値916によって識別されるメモリ内のメモリロケーションを識別するための1/2GBの倍数である。エントリ904内の適切なモジュールID値916およびチャンク開始番号918を識別するための式は、表1の7番目および8番目の項目に列挙される。
【0051】
表1に列挙される7番目の項目は、Physical_destination_module=Module_id_table_in_entry[Incoming_Address[9:6]]である。この項目が示すように、入力アドレス902のビット6〜9を使用して、モジュールIDテーブル912でマッチするエントリ904における16個のエントリ項目910の1つを識別する。一実施形態では、入力アドレス902のビット6〜9は第3のアドレス部分902Cと呼ばれる。識別されたエントリ項目910からのモジュールID値は、変数Physical_destination_moduleに格納される。64ウェイインタリーブエントリ904を有するモジュールIDテーブル912の場合、モジュールIDテーブルエントリ904にインデックスを付ける式は、Physical_destination_module=Module_id_table_in_entry[Incoming_Address[11:6]]である。この場合、第3のアドレス部分902Cはアドレスビット6〜11を含み、これらのアドレスビットを使用してモジュールIDテーブルエントリ904にインデックスを付ける。
【0052】
表1に列挙される8番目の項目は、Chunk_start=Chunk_start_table_in_entry[Incoming_Address[9:6]]である。この項目が示すように、入力アドレス902の第3のアドレス部分902Cを使用して、チャンク開始テーブル914でマッチするエントリ904における16個のエントリ項目910の1つを識別する。識別されたエントリ項目910からのチャンク開始番号が変数chunk_startに格納される。64ウェイインタリーブエントリ904を有するチャンク開始テーブル914の場合には、チャンク開始テーブルエントリ904にインデックスを付けるための式は、Chunk_start=Chunk_start_table_in_entry[Incoming_Address[11:6]]である。この場合、第3のアドレス部分902Cはアドレスビット6〜11を含み、これらのアドレスビットをチャンク開始テーブルエントリ904へのインデックス付けに使用する。上述したように、一実施形態では、特定のメモリロケーションを識別するために、チャンク開始値をセルアドレス式(たとえば、式III)で使用する。
【0053】
セルマップ900におけるエントリ904の数およびインタリーブのウェイ数は通常、システムのサイズおよびトポロジに基づいて選択される。典型的なシステムでは、セルマップ900は通常、約32〜64個のインタリーブエントリ904を含み、各エントリは16ウェイあるいは64ウェイでインタリーブされる。64ウェイインタリーブによってもたらされる柔軟性が望ましい場合、従来技術では、16ウェイインタリーブに必要なフリップフロップの数に4を乗算した数のフリップフロップの使用が必要であった。このような従来技術は、リソースの利用において非効率的であるか、あるいは性能が限られていた。
【0054】
本発明の一実施形態は、複数のウェイ数のより小さなインタリーブエントリ904を組み合わせることによってウェイ数のより大きなインタリーブエントリを提供する。以下の説明では、基本となるインタリーブエントリサイズが16ウェイであり、かつウェイ数のより大きなインタリーブエントリサイズが32ウェイ〜512ウェイの範囲にあるものと仮定する。代替の実施形態では、他のインタリーブエントリサイズを提供しうることが理解されよう。一実施形態では、ウェイ数のより大きなインタリーブは、入力アドレス902のうちのより多くのビットを比較して所与のエントリ904についてヒットを見つけることによって達成される。
【0055】
以下の表2は、本発明の一実施形態を実施する擬似コードを含む。
【0056】
【表2】
Figure 0004348093
【0057】
上記表2からわかるように、表2に含まれる擬似コードは、Address Mask LowerおよびAddress Match Lower(表2中の3番目および4番目の項目)が追加され、ヒット方程式(表2中の7番目の項目)が変更されたことを除けば、表1に含まれる擬似コードと同様である。これらの違いについて以下に述べる。
【0058】
以下の表3は、本発明の一実施形態による種々のインタリーブサイズについてのAddress_Mask_Lowerに使用されるビット値を列挙したものである。
【0059】
【表3】
Figure 0004348093
【0060】
ent_a、ent_b、ent_c、およびent_dという名称の4個の16ウェイエントリ904を組み合わせる、すなわち一緒のグループにすることにより、64ウェイインタリーブエントリを実施することが望ましいものと仮定する。64ウェイインタリーブが望ましいため、上記表3に示すように、Address_Mask_Lower[15:10]は4個のエントリについて000011になる。4個のエントリすべてについて、Address_Match[49:29]およびAddress_Mask[49:29]は同じになる。しかし、Address_Match_Lowerは4個のエントリごとに異なる。以下の表4は、4個のエントリそれぞれのAddress_Match_lower[15:10]に使用される値を列挙する。
【0061】
【表4】
Figure 0004348093
【0062】
表2の7番目の項目に示すように、エントリのヒットは以下の場合に生成される。すなわち、(1)Address_Mask[49:29]でマスクされた入力アドレス902のビット29〜49(すなわち、第1のアドレス部分902A)が、エントリ904のAddress_Match[49:29]に等しく、かつ(2)Address_Mask_Lower[15:10]でマスクした入力アドレス902のビット10〜15(すなわち、第2のアドレス部分902B)が、エントリ902のAddress_match_lower[15:10]に等しい場合である。ヒット方程式の第1の部分は、ent_a、ent_b、ent_c、ent_dそれぞれについて真となる。しかし、ヒット方程式の第2の部分は、4個のエントリうち1つのエントリのみについて真となる。ent_aのヒットは、完全な64ウェイインタリーブの0〜15ウェイインタリーブについて生成され、ent_bのヒットは、完全な64ウェイインタリーブの16〜31ウェイインタリーブについて生成され、ent_cのヒットは、完全な64ウェイインタリーブの32〜47ウェイインタリーブについて生成され、ent_dのヒットは、完全な64ウェイインタリーブの48〜63ウェイインタリーブについて生成される。
【0063】
エントリ904のヒットが生成されると、入力アドレス902のビット6〜9(すなわち、第3のアドレス部分902C)を使用して、表2の8番目および9番目の項目に示すように、また上述したように、モジュールIDテーブルエントリから宛先モジュールID916を識別するとともに、チャンク開始テーブルエントリからチャンク開始値918を識別する。
【0064】
本発明の一形態は、拡張性を提供しながら、セルマップのサイズを最適化できるようにする。一実施形態では、セルマップエントリ904を組み合わせて、ウェイ数のより大きなインタリーブを行う能力を犠牲にすることなく、セルコントローラ175におけるロジックをより効率的に使用することのできるウェイ数のより大きなインタリーブエントリを形成することが可能である。本発明の一実施形態を実施するロジックは比較的単純であり、従来のセルマップの実施と比較して、比較する必要のあるアドレスビットの増加は数個だけである。本発明の一形態では、従来のセルマップの実施よりもかなり大きな柔軟性を提供する。この発明は、例として次のような実施形態を含む。
【0065】
(1) 連続した論理アドレス空間を使用して複数のメモリ(130、135、140、145)にインタリーブ方式でアクセスする方法であって、
複数のエントリ(904)を含む少なくとも1つのマップテーブル(900)を設けることであって、前記エントリはそれぞれ複数のエントリ項目(910)を含み、該エントリ項目(910)はそれぞれ前記メモリの1つを識別し、
複数のアドレスビット(902A〜902C)を含む第1の論理アドレス(902)を受信することであって、前記複数のアドレスビットは、前記少なくとも1つのマップテーブルにおける第1のエントリの組に対応する第1のアドレスビットの組を含み、
前記アドレスビットの前記第1の組および第2の組に基づいて、前記第1のエントリの組中の第1のエントリを識別することと、
前記アドレスビットの第3の組に基づいて、前記第1のエントリにおける第1のエントリ項目を識別することと、
前記第1のエントリ項目によって識別された前記メモリにアクセスすることと、
を含む方法。
【0066】
(2) 前記第1、第2、および第3のアドレスビットの組は重複しない(1)記載の方法。
【0067】
(3) 前記第1のアドレスビットの組は、前記第2のアドレスビットの組よりも上位のビットを含み、前記第2のアドレスビットの組は、前記第3のアドレスビットの組よりも上位のビットを含む(1)記載の方法。
【0068】
(4) 前記少なくとも1つのマップテーブルに複数のメモリオフセット値(914)を格納することと、
前記第1の論理アドレスに基づいて前記メモリオフセット値の1つを識別することとをさらに含み、
前記第1のエントリ項目によって識別されるメモリは、前記識別されたメモリオフセット値に少なくとも部分的に基づくメモリロケーションにおいてアクセスされる(1)記載の方法。
【0069】
(5) 前記メモリはそれぞれ少なくとも1つのメモリセグメントを含み、該メモリセグメントはグループに編成され、各グループにおける前記メモリセグメントは均等なサイズを有し、前記少なくとも1つのマップテーブルにおける各エントリは前記メモリセグメントグループの1つに対応する(1)記載の方法。
【0070】
(6) 連続した論理アドレス空間をインタリーブ様式で複数のメモリ(130、135、140、145)にマッピングする方法であって、前記論理アドレス空間における各論理アドレス(902)は、重複しない第1、第2、および第3のアドレス部分(902A〜902C)を含み、
複数のインタリーブエントリ(904)を含む少なくとも1つのマップテーブル(900)を設けることであって、前記インタリーブエントリはそれぞれ、メモリのMウェイインタリーブを表すM個のエントリ項目(910)を含み、前記Mは整数値であり、前記エントリ項目はそれぞれ前記メモリの1つを識別し、
複数の論理アドレスを前記インタリーブエントリそれぞれに関連付けることであって、前記インタリーブエントリの第1の組における前記各インタリーブエントリに関連付けられた前記論理アドレスは、前記第1のアドレス部分について共通の値を含み、前記第1のインタリーブエントリの組はN個のインタリーブエントリを含み、前記Nは整数値であり、前記第1のインタリーブエントリの組は集合的に単一のM×Nウェイインタリーブエントリを表し、
前記第1の組における前記インタリーブエントリに関連づけられた前記論理アドレスの前記第2および第3のアドレス部分に基づいて、前記M×Nウェイインタリーブエントリ内のエントリ項目にインデックスを付けることと、
を含む方法。
【0071】
(7) 連続した論理アドレス空間を使用して複数のメモリ(130、135、140、145)へのインタリーブ方式のアクセスを提供するシステム(100)であって、
複数のインタリーブエントリ(904)を含む少なくとも1つのマップテーブル(900)であって、前記インタリーブエントリはそれぞれ基本数のエントリ項目(910)を含み、該エントリ項目はそれぞれ前記メモリの1つを識別する、少なくとも1つのマップテーブル(900)と、
該少なくとも1つのマップテーブルにおけるインタリーブエントリの組に対応する第1の部分(902A)をそれぞれ含む論理アドレス(902)を受信するコントローラ(175)と、
前記基本数の倍数である所望のウェイ数のインタリーブを表すインタリーブエントリサイズ識別子とを備え、
前記コントローラ(175)は、受信した論理アドレスの前記第1の部分、前記受信した論理アドレスの第2の部分(902B)、および前記インタリーブエントリサイズ識別子に基づいて、前記少なくとも1つのマップテーブルにおけるインタリーブエントリを識別するように構成され、前記コントローラは、前記受信した論理アドレスの第3の部分(902C)に基づいて、前記識別されたインタリーブエントリにおけるエントリ項目を識別するように構成されるシステム。
【0072】
(8) 前記コントローラは、前記受信した論理アドレスをマスクして前記第1の論理アドレスの部分を抽出し、該抽出した第1の論理アドレスの部分を複数の整合値と比較してマッチングを識別するように構成される(7)記載のシステム。
【0073】
(9) 前記インタリーブエントリサイズ識別子はマスク値であり、前記コントローラは、前記受信した論理アドレスを前記マスク値でマスクして前記第2の論理アドレスの部分を抽出し、該抽出した第2の論理アドレスの部分を複数の整合値と比較してマッチングを識別するように構成される(7)記載のシステム。
【0074】
(10) 前記インタリーブエントリサイズ識別子はマスク値であり、前記コントローラは、所望のインタリーブエントリサイズに基づいて複数のマスク値の中から1つを選択し、前記受信した論理アドレスを前記選択したマスク値でマスクして前記第2の論理アドレスの部分を抽出し、該抽出した第2の論理アドレスの部分を複数の整合値と比較してマッチングを識別するように構成される(7)記載のシステム。
【0075】
好ましい実施形態の説明を目的として、本発明の特定の実施形態を本明細書に図示し説明したが、本発明の範囲から逸脱することなく図示し説明した特定の実施形態を多種多様な代替および/または同等の実施で置き換えてもよいことが当業者には理解されよう。化学、機械、電気機械、電気、およびコンピュータの分野における当業者は、本発明が非常に広範囲の実施形態において実施されうることをたやすく理解しよう。本願は、本明細書に述べた好ましい実施形態のあらゆる改変または変形を網羅するものである。したがって、本発明は特許請求の範囲およびその等価物によってのみ制限されるものと明らかに意図される。
【図面の簡単な説明】
【図1】4個のセルおよび1個のクロスバーを含むノードを示すブロック図である。
【図2】メモリが4個のセルに分散する分散メモリシステムを示すブロック図である。
【図3】4ウェイインタリーブおよび8ウェイインタリーブを示すテーブルである。
【図4】3ウェイインタリーブを示すテーブルである。
【図5】シングルキャッシュラインインタリーブの64ウェイインタリーブドセルマップエントリを示すブロック図である。
【図6】インタリーブグループの間での顕著な特徴を識別するチャートである。
【図7】2のべき乗ではないメモリ量を含むセルにわたるインタリーブのブロック図である。
【図8】3個のセルにわたるインタリーブのブロック図である。
【図9】本発明の一実施形態によるメモリインタリーブを提供するセルマップの図である。

Claims (3)

  1. 連続した論理アドレス空間を使用してメモリが複数のセルに分散したメモリシステムにインタリーブ方式でアクセスする方法であって、
    複数のエントリを含む少なくとも1つのマップテーブルを設けるステップであって、前記エントリはそれぞれ複数のエントリ項目を含み、該エントリ項目はそれぞれ前記複数のセルに分散したメモリの1つを識別し、少なくとも一つのエントリは、複数の前記セルのメモリをエントリ項目として含む、マップテーブルを設けるステップと、
    複数のアドレスビットを含む第1の論理アドレスを受信するステップであって、前記複数のアドレスビットは、前記少なくとも1つのマップテーブルにおけるエントリの第1の組を特定する第1の組のアドレスビットを含み、前記エントリの第1の組における各エントリは、同一の組の他のエントリのエントリ項目とは異なるエントリ項目を含むステップと、
    前記複数のアドレスビット前記第1の組のアドレスビットで特定された前記エントリの前記第1の組の中の第1のエントリを識別する第2の組のアドレスビットを含んでおり、前記第1および第2の組のアドレスビットにより、前記エントリの前記第1の組の中の第1のエントリを識別するステップと、
    前記複数のアドレスビットは前記第1および第2の組のアドレスビットにより識別されたエントリの中の第1のエントリ項目を識別する第3の組のアドレスビットを含み、該第3の組のアドレスビットに基づいて、前記第1のエントリにおける第1のエントリ項目を識別するステップと、
    前記第1のエントリ項目によって識別された前記メモリにアクセスするステップと、
    を含む方法。
  2. メモリが複数のセルに分散したメモリシステムへのインタリーブ方式のアクセスを提供するシステムであって、
    複数のエントリを含む少なくとも1つのマップテーブルであって、前記エントリは複数のエントリ項目を含み、該エントリ項目はそれぞれ前記複数のセルに分散したメモリの1つを識別し、少なくとも一つのエントリは、複数の前記セルのメモリをエントリ項目として含む、マップテーブルと、
    第1の論理アドレスを受信するコントローラであって、前記第1の論理アドレスは複数のアドレスビットを含み、該複数のアドレスビットは前記少なくとも1つのマップテーブルにおけるエントリの第1の組を特定する第1の組のアドレスビットを含み、前記第1の組の全てのエントリは、同一の組の他のエントリエントリ項目とは異なる複数のエントリ項目を含む、コントローラと、を有し、
    前記複数のアドレスビットは前記第1の組のアドレスビットで特定された前記エントリの前記第1の組の中の第1のエントリを識別する第2の組のアドレスビットを含み、前記コントローラは、前記第1および第2の組のアドレスビットにより、前記エントリの前記第1の組の中の第1のエントリを識別し、前記複数のアドレスビットに含まれる第3の組のアドレスビットに基づいて、前記第1のエントリにおける第1のエントリ項目を識別するよう構成されている、システム。
  3. 前記コントローラは、前記第1のエントリ項目で識別されたメモリをアクセスするよう構成されている、請求項2に記載のシステム。
JP2003043586A 2002-02-22 2003-02-21 マップテーブルを用いてメモリにインタリーブ方式でアクセスする方法 Expired - Lifetime JP4348093B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/080,440 2002-02-22
US10/080,440 US6874070B2 (en) 2002-02-22 2002-02-22 System and method for memory interleaving using cell map with entry grouping for higher-way interleaving

Publications (3)

Publication Number Publication Date
JP2003271569A JP2003271569A (ja) 2003-09-26
JP2003271569A5 JP2003271569A5 (ja) 2006-04-06
JP4348093B2 true JP4348093B2 (ja) 2009-10-21

Family

ID=27803675

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003043586A Expired - Lifetime JP4348093B2 (ja) 2002-02-22 2003-02-21 マップテーブルを用いてメモリにインタリーブ方式でアクセスする方法

Country Status (2)

Country Link
US (1) US6874070B2 (ja)
JP (1) JP4348093B2 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7577816B2 (en) * 2003-08-18 2009-08-18 Cray Inc. Remote translation mechanism for a multinode system
US8307194B1 (en) 2003-08-18 2012-11-06 Cray Inc. Relaxed memory consistency model
US7437521B1 (en) 2003-08-18 2008-10-14 Cray Inc. Multistream processing memory-and barrier-synchronization method and apparatus
US7743223B2 (en) 2003-08-18 2010-06-22 Cray Inc. Decoupling of write address from its associated write data in a store to a shared memory in a multiprocessor system
US7421565B1 (en) * 2003-08-18 2008-09-02 Cray Inc. Method and apparatus for indirectly addressed vector load-add -store across multi-processors
US7366873B1 (en) 2003-08-18 2008-04-29 Cray, Inc. Indirectly addressed vector load-operate-store method and apparatus
US7171499B2 (en) * 2003-10-10 2007-01-30 Advanced Micro Devices, Inc. Processor surrogate for use in multiprocessor systems and multiprocessor system using same
US8806103B2 (en) 2004-04-28 2014-08-12 Hewlett-Packard Development Company, L.P. System and method for interleaving memory
JP2006018489A (ja) * 2004-06-30 2006-01-19 Hitachi Ltd 複数ノード間のメモリインターリーブシステム
US8190809B2 (en) * 2004-11-23 2012-05-29 Efficient Memory Technology Shunted interleave for accessing plural memory banks, particularly those having partially accessed cells containing data for cache lines
CN101069211A (zh) * 2004-11-23 2007-11-07 高效存储技术公司 分页存储器及其智能存储器区段的交错寻址的多次缩略的方法和装置
US7478769B1 (en) 2005-03-09 2009-01-20 Cray Inc. Method and apparatus for cooling electronic components
US7657818B2 (en) * 2005-06-22 2010-02-02 Adaptive Spectrum And Signal Alignment, Inc. Dynamic minimum-memory interleaving
JP4810542B2 (ja) * 2005-12-28 2011-11-09 富士通株式会社 メモリ制御方法、プログラム及び装置
US20070261059A1 (en) * 2006-04-25 2007-11-08 Orth Joseph F Array-based memory abstraction
US20130232304A1 (en) * 2012-03-05 2013-09-05 Qualcomm Incorporated Accelerated interleaved memory data transfers in microprocessor-based systems, and related devices, methods, and computer-readable media
US9256531B2 (en) 2012-06-19 2016-02-09 Samsung Electronics Co., Ltd. Memory system and SoC including linear addresss remapping logic
US11316713B2 (en) 2019-11-25 2022-04-26 International Business Machines Corporation Virtual drawers in a server

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5293607A (en) 1991-04-03 1994-03-08 Hewlett-Packard Company Flexible N-way memory interleaving
US5530837A (en) 1994-03-28 1996-06-25 Hewlett-Packard Co. Methods and apparatus for interleaving memory transactions into an arbitrary number of banks
US5655113A (en) 1994-07-05 1997-08-05 Monolithic System Technology, Inc. Resynchronization circuit for a memory system and method of operating same
EP0931290A1 (en) * 1997-03-21 1999-07-28 International Business Machines Corporation Address mapping for system memory
EP1050819A1 (en) * 1999-05-03 2000-11-08 Sgs Thomson Microelectronics Sa Computer memory access
US6526459B1 (en) 1999-11-10 2003-02-25 Ati International Srl Allocation of input/output bus address space to native input/output devices
US6480943B1 (en) * 2000-04-29 2002-11-12 Hewlett-Packard Company Memory address interleaving and offset bits for cell interleaving of memory
US6598130B2 (en) * 2000-07-31 2003-07-22 Hewlett-Packard Development Company, L.P. Technique for referencing distributed shared memory locally rather than remotely

Also Published As

Publication number Publication date
JP2003271569A (ja) 2003-09-26
US20030167383A1 (en) 2003-09-04
US6874070B2 (en) 2005-03-29

Similar Documents

Publication Publication Date Title
JP4348093B2 (ja) マップテーブルを用いてメモリにインタリーブ方式でアクセスする方法
US11435925B2 (en) Method and system for reconfigurable parallel lookups using multiple shared memories
US6754776B2 (en) Method and system for logical partitioning of cache memory structures in a partitoned computer system
Fan et al. Cuckoo filter: Practically better than bloom
US7373514B2 (en) High-performance hashing system
JP3599352B2 (ja) フレキシブルなn−ウェイ・メモリ・インターリーブ方式
US7346750B2 (en) Memory interleave system
KR101190403B1 (ko) 캐쉬 섹터 할당
US20040111420A1 (en) Performance and memory bandwidth utilization for tree searches using tree fragmentation
US6480943B1 (en) Memory address interleaving and offset bits for cell interleaving of memory
EP0179401A2 (en) Dynamically allocated local/global storage system
US8751751B2 (en) Method and apparatus for minimizing cache conflict misses
EP2159708A1 (en) Method for selecting hash function, method for storing and searching routing table and devices thereof
US6725216B2 (en) Partitioning search key thereby distributing table across multiple non-contiguous memory segments, memory banks or memory modules
JP2009529756A (ja) テストデータのフォーマット変換
JP4445708B2 (ja) マップテーブルを使用して入出力モジュールにアクセスする方法
JP4240610B2 (ja) 計算機システム
WO2013004193A1 (en) Method and apparatus for index-based virtual addressing
CN112783648A (zh) 基于内存区域的内存分配方法和设备以及访问方法和设备
JP3808373B2 (ja) 分散共有メモリ装置及び分散処理方法
US6721858B1 (en) Parallel implementation of protocol engines based on memory partitioning
CN113986780A (zh) 一种自由映射方法、装置、存储介质及电子设备
CN116610665A (zh) 一种用于自增式数据检索的装置和方法
CN115617501A (zh) 用于利用率感知存储器分配的系统、方法和设备
JP2002525754A (ja) 知識ベースのサーチ方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060214

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080229

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080311

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080610

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080613

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080623

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090630

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090717

R150 Certificate of patent or registration of utility model

Ref document number: 4348093

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120724

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120724

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130724

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130724

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130724

Year of fee payment: 4

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130724

Year of fee payment: 4

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130724

Year of fee payment: 4

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term