JP6761891B2 - 柔軟なアドレスデコード機能を備えるメモリコントローラ - Google Patents

柔軟なアドレスデコード機能を備えるメモリコントローラ Download PDF

Info

Publication number
JP6761891B2
JP6761891B2 JP2019500870A JP2019500870A JP6761891B2 JP 6761891 B2 JP6761891 B2 JP 6761891B2 JP 2019500870 A JP2019500870 A JP 2019500870A JP 2019500870 A JP2019500870 A JP 2019500870A JP 6761891 B2 JP6761891 B2 JP 6761891B2
Authority
JP
Japan
Prior art keywords
address
memory
decoder
access
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019500870A
Other languages
English (en)
Other versions
JP2019520660A5 (ja
JP2019520660A (ja
Inventor
エム. ブランドル ケビン
エム. ブランドル ケビン
エイチ. ハミルトン トーマス
エイチ. ハミルトン トーマス
カナヤマ ヒデキ
カナヤマ ヒデキ
バラクリシュナン ケダーナス
バラクリシュナン ケダーナス
アール. マグロ ジェームズ
アール. マグロ ジェームズ
シェン グァンハオ
シェン グァンハオ
フォウラー マーク
フォウラー マーク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced Micro Devices Inc
Original Assignee
Advanced Micro Devices Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Advanced Micro Devices Inc filed Critical Advanced Micro Devices Inc
Publication of JP2019520660A publication Critical patent/JP2019520660A/ja
Publication of JP2019520660A5 publication Critical patent/JP2019520660A5/ja
Application granted granted Critical
Publication of JP6761891B2 publication Critical patent/JP6761891B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C7/00Arrangements for writing information into, or reading information out from, a digital store
    • G11C7/10Input/output [I/O] data interface arrangements, e.g. I/O data control circuits, I/O data buffers
    • G11C7/1051Data output circuits, e.g. read-out amplifiers, data output buffers, data output registers, data output level conversion circuits
    • G11C7/1063Control signal output circuits, e.g. status or busy flags, feedback command signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/16Handling requests for interconnection or transfer for access to memory bus
    • G06F13/1668Details of memory controller
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/06Addressing a physical block of locations, e.g. base addressing, module addressing, memory dedication
    • G06F12/0607Interleaved addressing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/0223User address space allocation, e.g. contiguous or non contiguous base addressing
    • G06F12/023Free address space management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/08Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
    • G06F12/10Address translation
    • G06F12/1009Address translation using page tables, e.g. page table structures
    • G06F12/1018Address translation using page tables, e.g. page table structures involving hashing techniques, e.g. inverted page tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/16Handling requests for interconnection or transfer for access to memory bus
    • G06F13/1605Handling requests for interconnection or transfer for access to memory bus based on arbitration
    • G06F13/1642Handling requests for interconnection or transfer for access to memory bus based on arbitration with request queuing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/40Bus structure
    • G06F13/4004Coupling between buses
    • G06F13/4027Coupling between buses using bus bridges
    • G06F13/4031Coupling between buses using bus bridges with arbitration
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C11/00Digital stores characterised by the use of particular electric or magnetic storage elements; Storage elements therefor
    • G11C11/21Digital stores characterised by the use of particular electric or magnetic storage elements; Storage elements therefor using electric elements
    • G11C11/34Digital stores characterised by the use of particular electric or magnetic storage elements; Storage elements therefor using electric elements using semiconductor devices
    • G11C11/40Digital stores characterised by the use of particular electric or magnetic storage elements; Storage elements therefor using electric elements using semiconductor devices using transistors
    • G11C11/401Digital stores characterised by the use of particular electric or magnetic storage elements; Storage elements therefor using electric elements using semiconductor devices using transistors forming cells needing refreshing or charge regeneration, i.e. dynamic cells
    • G11C11/4063Auxiliary circuits, e.g. for addressing, decoding, driving, writing, sensing or timing
    • G11C11/407Auxiliary circuits, e.g. for addressing, decoding, driving, writing, sensing or timing for memory cells of the field-effect type
    • G11C11/408Address circuits
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C7/00Arrangements for writing information into, or reading information out from, a digital store
    • G11C7/10Input/output [I/O] data interface arrangements, e.g. I/O data control circuits, I/O data buffers
    • G11C7/1072Input/output [I/O] data interface arrangements, e.g. I/O data control circuits, I/O data buffers for memories with random access ports synchronised on clock signal pulse trains, e.g. synchronous memories, self timed memories
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/14Protection against unauthorised use of memory or access to memory
    • G06F12/1408Protection against unauthorised use of memory or access to memory by using cryptography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2212/00Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
    • G06F2212/10Providing a specific technical effect
    • G06F2212/1041Resource optimization
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C7/00Arrangements for writing information into, or reading information out from, a digital store
    • G11C7/10Input/output [I/O] data interface arrangements, e.g. I/O data control circuits, I/O data buffers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Dram (AREA)
  • Memory System (AREA)
  • Bus Control (AREA)
  • Power Sources (AREA)

Description

本開示は、概して、データ処理システムに関し、より詳細には、可変サイズを有するメモリとインタフェースすることの可能なメモリコントローラを備えるデータ処理システムに関する。
コンピュータシステムは、通常、安価で高密度のダイナミックランダムアクセスメモリ(DRAM)チップをメインメモリとして使用する。今日販売されている殆どのDRAMチップは、JEDEC(Joint Electron Devices Engineering Council)によって公表された様々なダブルデータレート(DDR)DRAM規格と互換性がある。JEDECが新たなDDR規格を公表しているので、DDR3やDDR4等の複数の世代のDDR DRAMが普及しているかなりの期間が存在する。また、JEDECは、グラフィックスDDR(gDDR)メモリと呼ばれる最新のグラフィックスプロセッサのニーズに合わせて特別に設計された他のクラスのDRAMを規格化しており、1つの世代であるgDDR5が今日も普及している。したがって、メモリコントローラが、これらのメモリタイプに加えて、潜在的には他の新たなメモリタイプにも柔軟にインタフェースできることが重要である。
メモリコントローラの柔軟性は、これを使用する様々なタイプの製品のニーズを満たすために、メモリシステムにとっても重要である。例えば、メモリは、通常、レイアウト及びデコードを単純化するために2のべき乗の密度で設計されている。現代の集積回路リソグラフィ技術が進化するにつれて、メモリチップの密度は、歴史的に指数関数的に増加してきた。このように、4、8、16ギガビット(Gb)密度のDDR DRAMが一般に入手可能になる現在まで、DRAMのサイズは、1980年代半ばに利用可能であった64キロビット(64Kb)から128Kb、256Kbまで等に歴史的に進化してきた。この傾向が継続しない可能性のある理由が2つある。第1に、半導体リソグラフィ技術が物理的限界に近づきつつある。したがって、メモリ製造業者は、2のべき乗ではない中間サイズを提供する可能性がある。第2に、設計者は、最も近い2のべき乗のサイズに近くない密度を有するメモリを必要とする場合があり、次の高い密度に伴う余分な製品コストを望まない場合がある。したがって、メモリ製造業者は、これらの現実をより良く満たすために、2のべき乗でないメモリサイズを設計し始めている。2のべき乗でないメモリへのインタフェースは、余分なコストをかけずに全ての可能な構成を満たす回路を設計するために、メモリコントローラ製造業者に対して追加の負担をかけることになる。
メモリコントローラが、ページ競合を引き起こすことなく、インターリーブ方式で異なるバンクにアクセスすることができれば、メモリシステムは、より効率的に動作する。メモリコントローラは、異なるバンクへのアクセスをインターリーブすることによって、同じバンクの異なる行への一連のアクセスに必要となるオーバーヘッドを部分的に隠すことができる。既知のメモリコントローラは、同じランク及びバンクへの連続的なアクセスが複数のバンクに亘って拡散されるように、入力アドレスをスクランブル又は「スウィズル(swizzle)」する回路を使用する。例えば、メモリコントローラは、特定のアドレスビットを使用してバンクアドレスをスクランブルすることによって、アドレス空間の比較的小さい領域におけるメモリアクセスが異なるバンクにマッピングされる。このメモリコントローラによって実施されるバンクスクランブルアルゴリズムは、システムのタイプ、アプリケーションプログラム及びオペレーティングシステムによって生成されるアクセスの特性等に応じて、所望のインターリーブレベルを有するアクセスパターンを一部のシステムに提供するが、他のシステムには提供しない。
いくつかの実施形態による、データ処理システムのブロック図である。 図1のデータ処理システムでの使用に適したアドバンストプロセッシングユニット(APU)のブロック図である。 いくつかの実施形態による、図2のAPUでの使用に適したメモリコントローラ及び関連する物理インタフェース(PHY)のブロック図である。 いくつかの実施形態による、図2のAPUでの使用に適した他のメモリコントローラ及び関連するPHYのブロック図である。 いくつかの実施形態による、メモリコントローラのブロック図である。 いくつかの実施形態による、図5のメモリコントローラの一部を実装するのに使用可能なメモリコントローラのブロック図である。 いくつかの実施形態による、図6の非2のべき乗(non-power-of-two)デコーダとして使用可能なアドレスデコーダの簡略化ブロック図である。 2つの領域デコーダを使用して非2のべき乗アドレス空間用にプログラムされている場合に図7のアドレスデコーダによって実行されたアドレスマッピングを示す図である。 いくつかの実施形態による、チップ選択インターリーブを実施するようにプログラムされている場合に図7のアドレスデコーダによって実行されたアドレスマッピングを示す図である。 いくつかの実施形態による、図5のアドレスデコーダを実装するのに使用可能なアドレスデコーダのブロック図である。 いくつかの実施形態による、図5のアドレスデコーダを実装するのに使用可能な他のアドレスデコーダのブロック図である。
以下の説明では、異なる図面における同じ参照番号の使用は、類似又は同一のアイテムを示す。特に断りのない限り、「接続された」という用語及びその関連する動詞の形態は、従来技術で知られている手段による直接接続及び間接的な電気的接続を含み、直接接続の説明は、間接的な電気的接続の適切な方式を用いる別の実施形態も含む。
以下に一形態で説明するように、メモリコントローラは、アクセスアドレスを含むメモリアクセス要求を受信するホストインタフェースと、メモリアクセスをメモリシステムに提供するメモリインタフェースと、アドレスデコーダと、コマンドキューと、アービタと、を含む。アドレスデコーダは、ホストインタフェースに接続されており、ハッシュ関数を使用して、アクセスアドレスを、複数の領域のうち選択された領域にプログラム可能にマッピングする。アドレスデコーダは、複数のプログラム可能なビットに応じて、アクセスアドレスの対応する複数のビットのうち何れのビットがハッシュ関数で使用されるかを決定し、第1の2のべき乗のサイズを有する一次デコーダと、第2の2のべき乗のサイズを有する二次デコーダとを使用して、アクセスアドレスを、非2のべき乗のサイズを有する第1領域にマッピングするようにプログラム可能である。コマンドキューは、アドレスデコーダに接続されており、メモリアクセス要求及び領域マッピング信号を記憶する。アービタは、領域マッピング信号に部分的に基づいて評価された複数の基準に基づいて、コマンドキューからメモリアクセス要求を選択し、これに応じて、対応するメモリアクセスをメモリインタフェースに提供する。
例えば、アドレスデコーダは、領域がメモリシステムのチップ選択信号に対応する、複数の領域デコーダを含むことができる。各領域デコーダは、一次デコーダ及び二次デコーダの両方を含むことができる。一次デコーダは、アクセスアドレスを受信して、一次領域選択信号を提供するためのものであり、第1ベースアドレス及び第1の2のべき乗のサイズを有する。二次デコーダは、アクセスアドレスを受信して、二次領域選択信号を提供するためのものであり、第2ベースアドレス及び第2の2のべき乗のサイズを有する。領域デコーダは、一次領域選択信号及び二次領域選択信号のうち少なくとも一方のアクティベートに応じて、対応する領域マッピング信号をアクティベートするための論理回路をさらに含む。例えば、領域は2+2(N−1)のサイズを有することができ、一次デコーダは2の領域サイズをデコードし、二次デコーダは2(N−1)の領域サイズをデコードする。このようにして、領域は、2つのコンパクトな2のべき乗のデコーダで実装される、例えば6ギガバイト(6GB)のサイズを有することができる。
他の例では、メモリコントローラは、第1領域デコーダと、第2領域デコーダと、をさらに含む。第1領域デコーダは、第3の2のべき乗のサイズを有する第1の一次デコーダと、第3の2のべき乗のサイズを有する第1の二次デコーダとを使用して、アクセスアドレスを、2のべき乗のサイズを有する第1領域に選択的にマッピングし、これに応じて第1領域マッピング信号を提供する。第2領域デコーダは、第3の2のべき乗のサイズを有する第2の一次デコーダと、第3の2のべき乗のサイズを有する第2の二次デコーダとを使用して、アクセスアドレスを、2のべき乗のサイズを有する第2領域に選択的にマッピングし、これに応じて第2領域マッピング信号を提供する。メモリコントローラは、第1の一次デコーダと、第2の一次デコーダと、第1の二次デコーダと、第2の二次デコーダと、の各々の間で、アクセスアドレスに対応するメモリ空間をインターリーブする。
他の形態では、デバイスは、ホストインタフェースと、メモリインタフェースと、アドレスデコーダと、コマンドキューと、アービタと、を含むメモリコントローラを有する。ホストインタフェースは、アクセスアドレスを含むメモリアクセス要求を受信する。メモリインタフェースは、メモリアクセスをメモリシステムに提供する。アドレスデコーダは、ホストインタフェースに接続されており、アクセスアドレスを、複数の領域のうち選択された領域にプログラム可能にマッピングする。アドレスデコーダは、第1の2のべき乗のサイズを有する一次デコーダと、第2の2のべき乗のサイズを有する二次デコーダとを使用して、アクセスアドレスを、非2のべき乗のサイズを有する第1領域にマッピングするようにプログラム可能であり、これに応じて第1領域マッピング信号を提供する。コマンドキューは、アドレスデコーダに接続されており、メモリアクセス要求及び領域マッピング信号を記憶する。アービタは、領域マッピング信号に部分的に基づいて評価された複数の基準に基づいて、コマンドキューからメモリアクセス要求を選択し、これに応じて、対応するメモリアクセスをメモリインタフェースに提供する。さらに他の形態では、メモリコントローラを有するデバイスは、ホストインタフェースと、メモリインタフェースと、アドレスデコーダと、コマンドキューと、アービタと、を含む。ホストインタフェースは、アクセスアドレスを含むメモリアクセス要求を受信する。メモリインタフェースは、ハッシュされたアドレスを含むメモリアクセスを、メモリシステムに提供する。アドレスデコーダは、ホストインタフェースに接続されており、ハッシュ関数を使用して、アクセスアドレスを、メモリシステムの複数の領域のうち選択された領域にプログラム可能にマッピングする。アドレスデコーダは、複数のプログラム可能なビットに応じて、アクセスアドレスの対応する複数のビットのうち何れのビットがハッシュ関数で使用されるかを決定する。コマンドキューは、アドレスデコーダに接続されており、ハッシュされたアドレスを含むメモリアクセス要求を記憶する。アービタは、複数の基準に基づいてコマンドキューからメモリアクセス要求を選択し、これに応じて、ハッシュされたアドレスを含む対応するメモリアクセスをメモリインタフェースに提供する。
さらに他の形態では、方法は、アクセスアドレスを含むメモリアクセス要求を受信することを含む。アクセスアドレスがデコードされ、これに応じて、対応する領域マッピング信号が提供される。デコードすることは、第1の2のべき乗のサイズを有する第1の一次デコーダと、第2の2のべき乗のサイズを有する第1の二次デコーダとを使用して、アクセスアドレスを、非2のべき乗のサイズを有する第1領域に選択的にマッピングすることを含む。アクセスアドレスを第1領域にマッピングすることに応じて、第1領域マッピング信号が提供される。メモリアクセス要求及び領域マッピング信号が記憶され、記憶されたメモリアクセス要求が、領域マッピング信号に部分的に基づいて評価された複数の基準に基づいて選択される。選択されたメモリアクセス要求に応じて、対応するメモリアクセスが提供される。
さらに他の形態では、方法は、アクセスアドレスを含むメモリアクセス要求を受信することを含む。アクセスアドレスがデコードされ、これに応じて、対応する領域マッピング信号が提供される。デコードすることは、複数のプログラム可能なビットに応じて、アクセスアドレスの対応する複数のビットのうち何れのビットがハッシュ関数で使用されるかを決定し、ハッシュ関数を使用してアクセスアドレスを選択的にハッシュすることを含む。デコードしたことに応じて、領域マッピング信号が提供される。メモリアクセス要求及び領域マッピング信号が記憶され、記憶されたメモリアクセス要求が、領域マッピング信号に部分的に基づいて評価された複数の基準に基づいて選択される。選択されたメモリアクセス要求に応じて、対応するメモリアクセスが提供される。
図1に、いくつかの実施形態による、データ処理システム100のブロック図である。データ処理システム100は、アクセラレーテッドプロセッシングユニット(APU)の形態のデータプロセッサ110と、メモリシステム120と、PCIe(Peripheral Component Interconnect Express)システム150と、ユニバーサルシリアルバス(USB)システム160と、ディスクドライブ170と、を含む。データプロセッサ110は、データ処理システム100の中央処理ユニット(CPU)として動作し、最新のコンピュータシステムにおいて有用な様々なバス及びインタフェースを提供する。これらのインタフェースには、2つのダブルデータレート(DDRx)メモリチャネル、PCIeリンクに接続するためのPCIeルートコンプレックス、USBネットワークに接続するためのUSBコントローラ、及び、SATA(Serial Advanced Technology Attachment)大容量記憶デバイスへのインタフェースが含まれる。
メモリシステム120は、メモリチャネル130と、メモリチャネル140と、を含む。メモリチャネル130は、この例では別々のランクに対応する代表的なDIMM134,136,138を含む、DDRxバス132に接続されたデュアルインラインメモリモジュール(DIMM)のセットを含む。同様に、メモリチャネル140は、代表的なDIMM144,146,148を含む、DDRxバス142に接続されたDIMMのセットを含む。
PCIeシステム150は、データプロセッサ110内のPCIeルートコンプレックスに接続されたPCIeスイッチ152と、PCIeデバイス154と、PCIeデバイス156と、PCIeデバイス158と、を含む。PCIeデバイス156は、システム基本入出力システム(BIOS)メモリ157に接続されている。システムBIOSメモリ157は、様々な不揮発性メモリタイプ(例えば、読み出し専用メモリ(ROM)、フラッシュEEPROM(Electrically Erasable Programmable ROM)等)の何れかであってもよい。
USBシステム160は、データプロセッサ110内のUSBマスタに接続されたUSBハブ162と、USBハブ162にそれぞれ接続された代表的なUSBデバイス164,166,168と、を含む。USBデバイス164,166,168は、例えばキーボード、マウス、フラッシュEEPROMポート等のデバイスであってもよい。
ディスクドライブ170は、SATAバスを介してデータプロセッサ110に接続されており、オペレーティングシステム、アプリケーションプログラム、アプリケーションファイル等のための大容量ストレージを提供する。
データ処理システム100は、メモリチャネル130及びメモリチャネル140を設けることによって、最新のコンピューティングアプリケーションでの使用に適している。各メモリチャネル130,140は、最新のDDRメモリ(例えば、DDRバージョン4(DDR4)、低電力DDR4(LPDDR4)、グラフィックスDDRバージョン5(gDDR5)及び高帯域幅メモリ(HBM)等)に接続されてもよいし、将来のメモリ技術に適応されてもよい。これらのメモリは、高いバス帯域幅及び高速動作を提供する。同時に、これらは、ラップトップコンピュータ等のバッテリ駆動アプリケーションの電力を節約する低電力モードを設けており、組み込み型サーマルモニタリングも設けている。
図2は、図1のデータ処理システム100での使用に適したAPU200のブロック図である。APU200は、中央処理ユニット(CPU)コアコンプレックス210と、グラフィックスコア220と、ディスプレイエンジン230のセットと、メモリ管理ハブ240と、データファブリック250と、周辺コントローラ260のセットと、周辺バスコントローラ270のセットと、システム管理ユニット(SMU)280と、メモリコントローラ290のセットと、を含む。
CPUコアコンプレックス210は、CPUコア212と、CPUコア214と、を含む。この例では、CPUコアコンプレックス210は2つのCPUコアを含むが、他の実施形態では、CPUコアコンプレックス210は任意の数のCPUコアを含んでもよい。各CPUコア212,214は、制御ファブリックを形成するシステム管理ネットワーク(SMN)及びデータファブリック250に対して双方向に接続されており、メモリアクセス要求をデータファブリック250に提供することができる。各CPUコア212,214は、単一コアであってもよいし、例えばキャッシュ等の特定のリソースを共有する2つ以上の単一コアを有するコアコンプレックスであってもよい。
グラフィックスコア220は、例えば、頂点処理、フラグメント処理、シェーディング、テクスチャブレンディング等のグラフィックス処理を、高度に統合された並列方式で実行することの可能な高性能グラフィックス処理ユニット(GPU)である。グラフィックスコア220は、SMN及びデータファブリック250に対して双方向に接続されており、メモリアクセス要求をデータファブリック250に提供することができる。これに関して、APU200は、CPUコアコンプレックス210及びグラフィックスコア220が同じメモリ空間を共有する統合メモリアーキテクチャ、又は、CPUコアコンプレックス210及びグラフィックスコア220がメモリ空間の一部を共有するメモリアーキテクチャの何れかをサポートすることができる。グラフィックスコア220は、CPUコアコンプレックス210がアクセスできない専用のグラフィックスメモリも使用する。
ディスプレイエンジン230は、グラフィックスコア220によって生成されたオブジェクトをレンダリング及びラスタライズして、モニタに表示する。グラフィックスコア220及びディスプレイエンジン230は、メモリシステム120の適切なアドレスに一様に変換されるために共通のメモリ管理ハブ240に対して双方向に接続されており、メモリ管理ハブ240は、かかるメモリアクセスを生成し、メモリシステムから返された読出しデータを受信するために、データファブリック250に対して双方向に接続されている。
データファブリック250は、任意のメモリアクセスエージェントとメモリコントローラ290との間でメモリアクセス要求及びメモリ応答をルーティングするためのクロスバースイッチを含む。また、データファブリック250は、システム構成に基づくメモリアクセスの宛先と、仮想接続毎のバッファとを決定するためのシステムメモリマップであって、BIOSによって定義されたシステムメモリマップを含む。
周辺コントローラ260は、USBコントローラ262と、SATAインタフェースコントローラ264と、を含み、これらの各々が、システムハブ266及びSMNバスに対して双方向に接続されている。これらの2つのコントローラは、APU200で使用可能な周辺コントローラの単なる例示である。
周辺バスコントローラ270は、システムコントローラ(即ち「サウスブリッジ」(SB))272と、PCIeコントローラ274と、を含み、これらの各々が、入出力(I/O)ハブ276及びSMNバスに対して双方向に接続されている。また、I/Oハブ276は、システムハブ266及びデータファブリック250に対して双方向に接続されている。したがって、例えば、CPUコアは、データファブリック250がI/Oハブ276を介してルーティングするアクセスを通じて、USBコントローラ262、SATAインタフェースコントローラ264、SB272、又は、PCIeコントローラ274内のレジスタをプログラムすることができる。
SMU280は、APU200上のリソースの動作を制御し、それらの間の通信を同期させるローカルコントローラである。SMU280は、APU200上の様々なプロセッサのパワーアップシーケンシングを管理し、リセット、イネーブル及び他の信号を介して複数のオフチップデバイスを制御する。SMU280は、APU200の各コンポーネントにクロック信号を提供するために、図2に示されていない1つ以上のクロックソース(例えば位相ロックループ(PLL)等)を含む。また、SMU280は、様々なプロセッサ及び他の機能ブロックの電力を管理し、CPUコア212,214及びグラフィックスコア220から測定された消費電力値を受信して、適切な電力状態を判断してもよい。
また、APU200は、様々なシステムモニタリング及び省電力機能を実装する。特に、1つのシステムモニタリング機能は、サーマルモニタリングである。例えば、SMU280は、APU200が高温になると、CPUコア212,214及び/又はグラフィックスコア220の周波数及び電圧を低減させてもよい。APU200が非常に高温になった場合には、APU200が完全にシャットダウンされてもよい。サーマルイベントは、SMU280によって、外部センサからSMNバスを介して受信されてもよく、SMU280は、これに応じてクロック周波数及び/又は電源電圧を低下させてもよい。
図3は、いくつかの実施形態による、図2のAPU200での使用に適したメモリコントローラ300及び関連する物理インタフェース(PHY)330のブロック図である。メモリコントローラ300は、メモリチャネル310と、パワーエンジン320と、を含む。メモリチャネル310は、ホストインタフェース312と、メモリチャネルコントローラ314と、物理インタフェース316と、を含む。ホストインタフェース312は、メモリチャネルコントローラ314を、スケーラブルデータポート(SDP)を介してデータファブリック250に双方向に接続する。物理インタフェース316は、メモリチャネルコントローラ314を、DDR−PHYインタフェース仕様(DFI)に準拠するバスを介してPHY330に双方向に接続する。パワーエンジン320は、SMNバスを介してSMU280に双方向に接続されており、APB(Advanced Peripheral Bus)を介してPHY330に双方向に接続されており、メモリチャネルコントローラ314にも双方向に接続されている。PHY330は、例えば図1のメモリチャネル130又はメモリチャネル140等のメモリチャネルに対する双方向接続を有する。メモリコントローラ300は、単一のメモリチャネルコントローラ314を使用した単一のメモリチャネル用のメモリコントローラの例示であり、以下にさらに説明するメモリチャネルコントローラ314の動作を制御するためのパワーエンジン320を有する。
図4は、いくつかの実施形態による、図2のAPU200での使用に適した別のメモリコントローラ400及び関連するPHY440,450のブロック図である。メモリコントローラ400は、メモリチャネル410,420と、パワーエンジン430と、を含む。メモリチャネル410は、ホストインタフェース412と、メモリチャネルコントローラ414と、物理インタフェース416と、を含む。ホストインタフェース412は、メモリチャネルコントローラ414を、SDPを介してデータファブリック250に双方向に接続する。物理インタフェース416は、DFI仕様に準拠しており、メモリチャネルコントローラ414をPHY440に双方向に接続する。メモリチャネル420は、ホストインタフェース422と、メモリチャネルコントローラ424と、物理インタフェース426と、を含む。ホストインタフェース422は、メモリチャネルコントローラ424を、別のSDPを介してデータファブリック250に双方向に接続する。物理インタフェース426は、DFI仕様に準拠しており、メモリチャネルコントローラ424をPHY450に双方向に接続する。パワーエンジン430は、SMNバスを介してSMU280に双方向に接続されており、APBを介してPHY440,450に双方向に接続されており、メモリチャネルコントローラ414,424にも双方向に接続されている。PHY440は、例えば図1のメモリチャネル130等のメモリチャネルに対する双方向接続を有する。PHY450は、例えば図1のメモリチャネル140等のメモリチャネルに対する双方向接続を有する。メモリコントローラ400は、2つのメモリチャネルコントローラを有するメモリコントローラの例示であり、共有のパワーエンジン430を使用して、以下にさらに説明するように、メモリチャネルコントローラ414及びメモリチャネルコントローラ424の各々の動作を制御する。
図5は、いくつかの実施形態による、メモリコントローラ500のブロック図である。メモリコントローラ500は、概して、メモリチャネルコントローラ510と、パワーコントローラ550と、を含む。メモリチャネルコントローラ510は、インタフェース512と、キュー514と、コマンドキュー520と、アドレス生成器522と、連想メモリ(CAM)524と、リプレイキュー530と、リフレッシュロジックブロック532と、タイミングブロック534と、ページテーブル536と、アービタ538と、エラー訂正コード(ECC)チェックブロック542と、ECC生成ブロック544と、データバッファ(DB)546と、を含む。
インタフェース512は、外部バスを介したデータファブリック250との第1双方向接続と、出力と、を有する。メモリコントローラ500において、この外部バスは、「AXI4」として知られている、英国ケンブリッジのARM Holdings,PLCによって規格化されたアドバンストエクステンシブルインタフェースバージョン4と互換性があるが、他の実施形態では、他のタイプのインタフェースであってもよい。インタフェース512は、FCLK(又はMEMCLK)ドメインとして知られる第1クロックドメインから、UCLKドメインとして知られるメモリコントローラ500の内部の第2クロックドメインへのメモリアクセス要求を変換する。同様に、キュー514は、UCLKドメインから、DFIインタフェースに関連するDFICLKドメインへのメモリアクセスを提供する。
アドレス生成器522は、データファブリック250からAXI4バスを介して受信したメモリアクセス要求のアドレスをデコードする。メモリアクセス要求は、標準化フォーマット(normalized format)で表現された物理アドレス空間内のアクセスアドレスを含む。アドレス生成器522は、標準化アドレス(normalized address)を、メモリシステム120内の実際のメモリデバイスをアドレス指定し、関連するアクセスを効率的にスケジューリングするのに使用可能なフォーマットに変換する。このフォーマットは、メモリアクセス要求を特定のランク、行アドレス、列アドレス、バンクアドレス及びバンクグループに関連付ける領域識別子を含む。システムBIOSは、起動時に、メモリシステム120内のメモリデバイスにクエリしてそのサイズ及び構成を判断し、アドレス生成器522に関連する構成レジスタのセットをプログラムする。アドレス生成器522は、構成レジスタに記憶された構成を使用して、標準化アドレスを適切なフォーマットに変換する。コマンドキュー520は、たとえばCPUコア212及び214ならびにグラフィックスコア220などのデータ処理システム100内のメモリアクセスエージェントから受け取ったメモリアクセス要求のキューである。コマンドキュー520は、データ処理システム100内のメモリアクセスエージェント(例えば、CPUコア212,214及びグラフィックスコア220等)から受信したメモリアクセス要求のキューである。コマンドキュー520は、アドレス生成器522によってデコードされたアドレスフィールドと、アクセスタイプ及びサービス品質(QoS)識別子を含むメモリアクセスをアービタ538が効率的に選択するのを可能にする他のアドレス情報と、を記憶する。CAM524は、例えばライトアフターライト(WAW)及びリードアフターライト(RAW)順序付けルール等の順序付けルールを実施するための情報を含む。
リプレイキュー530は、例えば、アドレス及びコマンドパリティ応答、DDR4 DRAMの書込み巡回冗長チェック(CRC)応答、又は、gDDR5 DRAMの書込み及び読出しCRC応答等の応答を待つアービタ538によって取り出されたメモリアクセスを記憶するための一時的なキューである。リプレイキュー530は、ECCチェックブロック542にアクセスして、返されたECCが正しいか否か又はエラーを示しているかを判別する。リプレイキュー530は、何れかのサイクルでパリティ又はCRCエラーの場合にアクセスが再実行されるのを可能にする。
リフレッシュロジック532は、メモリアクセスエージェントから受信した通常の読出し及び書込みメモリアクセス要求とは別に生成される様々なパワーダウン、リフレッシュ、終端抵抗(ZQ)較正サイクルのためのステートマシンを含む。例えば、メモリランクがプリチャージパワーダウン状態にある場合には、リフレッシュサイクルを実行するために定期的に起動されなければならない。リフレッシュロジック532は、リフレッシュコマンドを定期的に生成して、DRAMチップ内のメモリセルのチャージオフストレージキャパシタのリークによって生じるデータエラーを防止する。さらに、リフレッシュロジック532は、ZQを定期的に較正して、システム内の熱変化によるオンダイ終端抵抗のミスマッチを防止する。
アービタ538は、コマンドキュー520に双方向に接続されており、メモリチャネルコントローラ510の中心部分である。アービタ538は、メモリバスの利用を改善するために、インテリジェントなアクセススケジューリングによって効率を改善する。アービタ538は、タイミングブロック534を使用して、コマンドキュー520内の特定のアクセスの発行に適しているか否かをDRAMタイミングパラメータに基づいて判断することによって、適切なタイミング関係を実施する。例えば、各DRAMは、アクティブコマンド間の最小指定時間(「tRC」として知られる)を有する。タイミングブロック534は、リプレイキュー530に双方向に接続されており、このタイミングパラメータ及びJEDEC規格で規定された他のタイミングパラメータに基づいて適格性を判断するカウンタのセットを維持する。ページテーブル536は、リプレイキュー530に双方向に接続されており、アービタ538のメモリチャネルの各バンク及びランクのアクティブページに関する状態情報を維持する。
ECC生成ブロック544は、インタフェース512から受信した書込みメモリアクセス要求に応じて、書込みデータに従ってECCを計算する。DB546は、受信したメモリアクセス要求の書込みデータ及びECCを記憶する。アービタ538が、メモリチャネルにディスパッチするための対応する書込みアクセスを選ぶと、DB546は、結合した書込みデータ/ECCをキュー514に出力する。
パワーコントローラ550は、AXI(Advanced Extensible Interface, version 1)へのインタフェース552と、APBインタフェース554と、パワーエンジン560と、を含む。インタフェース552は、SMNへの第1双方向接続であって、図5に別に示された「EVENT_n」と付されたイベント信号を受信するための入力を含む第1双方向接続と、出力と、を含む。APBインタフェース554は、インタフェース552の出力に接続された入力と、APBを介してPHYに接続するための出力と、を有する。パワーエンジン560は、インタフェース552の出力に接続された入力と、キュー514の入力に接続された出力と、を有する。パワーエンジン560は、構成レジスタ562のセットと、マイクロコントローラ(μC)564と、セルフリフレッシュコントローラ(SLFREF/PE)566と、信頼性のある読出し/書込みタイミングエンジン(RRW/TE)568と、を含む。構成レジスタ562は、AXIバスを介してプログラムされており、メモリコントローラ500内の様々なブロックの動作を制御するための構成情報を記憶する。したがって、構成レジスタ562は、図5に詳細に示されていないこれらのブロックに接続された出力を有する。セルフリフレッシュコントローラ566は、リフレッシュロジック532によるリフレッシュの自動生成に加えて、リフレッシュの手動生成を可能にするエンジンである。信頼性のある読出し/書込みタイミングエンジン568は、DDRインタフェース最大読出しレイテンシ(MRL)トレーニング及びループバックテスト等の目的のために、連続的なメモリアクセスストリームをメモリ又はI/Oデバイスに提供する。
メモリチャネルコントローラ510は、関連するメモリチャネルへのディスパッチのためにメモリアクセスを選択することを可能にする回路を含む。アドレス生成器522は、所望のアービトレーションの決定を行うために、アドレス情報を、メモリシステム内のランク、行アドレス、列アドレス、バンクアドレス及びバンクグループを含むプリデコードされた情報にデコードし、コマンドキュー520は、プリデコードされた情報を記憶する。構成レジスタ562は、受信したアドレス情報をアドレス生成器522がどのようにデコードするのかを決定するための構成情報を記憶する。アービタ538は、デコードされたアドレス情報と、タイミングブロック534によって示されたタイミング適格性情報と、ページテーブル536によって示されたアクティブページ情報と、を使用して、例えばQoS要件等の他の基準を遵守しながらメモリアクセスを効率的にスケジューリングする。例えば、アービタ538は、メモリページを変更するのに必要なプリチャージ及びアクティベートコマンドのオーバーヘッドを避けるために、オープンページへのアクセスを優先し、或るバンクへのオーバーヘッドアクセスを、他のバンクへの読出し及び書込みアクセスをインターリーブすることによって隠す。特に、アービタ538は、通常動作中に、異なるページを選択する前にプリチャージされる必要があるまで、異なるバンク内のページオープンを維持することを決定してもよい。
図6に、いくつかの実施形態による、図5のメモリコントローラ500の一部を実装するのに使用可能なメモリコントローラ600のブロック図である。メモリコントローラ600は、図5のアドレスデコーダ522を、非従来型のメモリサイズに適応するために、非2のべき乗のアドレスデコーダ610として実装する。例えば、メモリコントローラ600は、データファブリック250から要求を受信し、この要求を、非2のべき乗のメモリサイズ(例えば、6GB等)のDIMMにプログラム可能にマッピングすることができる。この動作については、以下により詳細に説明する。
メモリコントローラ600は、SDPを使用してデータファブリック250からメモリアクセス要求を受信するための入力ポートを有する。各メモリアクセス要求は、「CONTROL」と付された制御信号のセットと、「NORMALIZED ADDRESS」と付された40ビットのアドレスと、「DATA」と付された256個のデータ信号のセットと、を含む。CONTROL信号は、アクセス要求のタグ、要求のサイズ、要求されたサービスの質、アクセスのタイプ(例えば、読出し又は書込み)等を含む。NORMALIZED ADDRESSは、サポートされている全てのアドレスビットを含み、先頭にゼロが暗黙的に付加された40ビットのアドレスである。DATA信号は、単一のメモリアクセス要求に関連する十分な数の信号を含む。例えば、CPUコアは、256ビットのキャッシュラインサイズを有する最終レベルのキャッシュ(last level cache)を含む場合がある。したがって、キャッシュラインをメモリにライトバックするには、256ビットの転送が必要になる。図3のPHY330等の物理インタフェースは、対応するメモリアクセスを、8〜64ビット又は72ビット(64ビット+8ビットのエラー訂正コード)のDDR DIMMのバーストとして実行することができるが、メモリコントローラは、256のDATAビットの全てを、メモリアクセス要求の一部として受信する。
メモリコントローラ600は、先に図5に示したように、非2のべき乗のアドレスデコーダ610と、書込みデータバッファ546と、を含む。アドレスデコーダ610は、NORMALIZED ADDRESSを受信するための入力を含み、「CS[n]」と付されたn個のチップ選択信号のセットと、「CHIP_ID」と付された3つのチップ識別信号のセットと、「ROW_ADDRESS」と付されたデコードされた行アドレスと、「COLUMN_ADDRESS」と付されたレコードされた列アドレスと、「BG」と付されたバンクグループ信号と、「BA」と付されたバンクアドレス信号と、を提供するための出力を含む。メモリコントローラ600は、アドレスデコーダ610のこれらの出力をCONTROL信号と共にコマンドキュー520に提供して、コマンドキュー520に記憶させることによって、アービタ538が、メモリアクセス要求の効率的な順序付けに関する決定を行うことができる。また、メモリコントローラ600は、COLUMN_ADDRESS信号、BG信号及びBA信号をページテーブル536に提供して、ページテーブル536が、アクセス要求を各DRAMチップのオープンページに関連付けるのを可能にする。
書込みデータバッファ546は、256ビットのDATA信号を受信するための入力と、BEQ514の入力に接続された出力と、を有する保持バッファである。データファブリック250は、散在する(interspersed)読出し及び書込みメモリアクセス要求をメモリコントローラ600に提供するので、書込みデータバッファ546は、受信した全てのメモリアクセス要求に使用されるのではなく、書込みのみに使用される。
動作中、システムBIOSは、起動時にメモリチャネル130,140の各メモリモジュール上のシリアルプレゼンス検出(SPD)ROMにクエリして、それぞれの密度及び構成を決定する。システムBIOSは、この情報を用いてアドレスデコーダ610の構成可能なアドレスデコーダレジスタをプログラムして、所定のワークロード及びメモリチップ構成に対するアドレスマップを定義する。また、システムBIOSは、この情報をオペレーティングシステムが利用できるようにして、論理アドレスから物理アドレスへの仮想アドレス変換に使用されるページテーブルをプログラムできるようにする。ページテーブルは、NORMALIZED ADDRESS(標準化アドレス)のフォーマットである。レジスタがシステムBIOSによって構成された後、アドレスデコーダ610は、これらを使用して、標準化アドレスをデコードすることによって、各アクセス要求を、対応するチップ選択を有する特定の領域にマッピングする。
例えば、メモリが2のべき乗のサイズを有するDDR4メモリである場合、アドレスデコーダ522は、以下の表1に示すように、標準化アドレスを様々な出力信号にデコードする。
Figure 0006761891
メモリコントローラ600は、いくつかのDIMMと共に動作するために、ランク乗算(rank multiplication)として知られる機能もサポートする。ランク乗算を有するシステムでは、所定のDIMM上の各パッケージ集積回路は、スルーシリコンビア(TSV:through-silicon-via)技術を使用して相互接続されたメモリチップの3次元(3D)スタックを含む。例えば、DDR4規格では、2、4及び8メモリチップのスタックをサポートするために、3ビットのチップ識別入力信号C[2:0]が規定されている。このようにして、領域内の選択された論理ランクを識別するために、スタック内の各メモリチップが、共通のチップ選択信号と、符号化されたC[2:0]信号との両方によって選択される。アドレスデコーダ610は、ランク乗算を実施するために、標準化アドレスを、論理ランクにプログラム可能にデコードし、選択された領域に対するワンホット(one-hot)のチップ選択信号をアクティベートし、選択された論理ランクに対応する符号化されたC[2:0]信号を提供する。
アドレスデコーダ610は、非2のべき乗のアドレスのデコードをサポートする。次に、アドレスデコーダ610の構成について説明する。
図7は、いくつかの実施形態による、図6の非2のべき乗デコーダ610の簡略化ブロック図である。非2のべき乗のアドレスデコーダ610は、対応するチップ選択信号によって定義された異なるランクに関連する領域デコーダのセット700を含む。図7に示す例では、領域デコーダのセット700は、それぞれ「CS0」、「CS1」、「CS2」、「CS3」と付された4つのチップ選択信号に関連する4つの領域デコーダ710を含む。各領域デコーダ710は、一次デコーダ720と、二次デコーダ730と、「OR」と付された論理回路740と、「CFG」と付された、一次デコーダ720に関連する構成レジスタ750の第1セットと、「CFG」と付された、二次デコーダ730に関連する構成レジスタ760の第2セットと、を含む。なお、構成レジスタ750,760の各々は、一次デコーダ720及び二次デコーダ730と論理的に関連付けられており、物理的に異なっていてもよいし、図5の構成レジスタ562等の中央レジスタセット内の他の構成レジスタと組み合わせられてもよい。
構成レジスタ750,760の各々は、SMNバスに接続された入力と、一次デコーダ720及び二次デコーダ730の各々に使用されるレジスタ値を提供するための出力と、を有する。一次デコーダ720は、標準化アドレスを受信するための第1入力と、構成レジスタ750の出力に接続された第2入力と、一次チップ選択信号を提供するための出力と、を有する。一次チップ選択信号は、それぞれ「CSPRI0」、「CSPRI1」、「CSPRI2」、「CSPRI3」と付されている。二次デコーダ730は、標準化アドレスを受信するための第1入力と、構成レジスタ760の出力に接続された第2入力と、一次チップ選択信号を出力するための出力と、を有する。一次チップ選択信号は、それぞれ「CSSEC0」、「CSSEC1」、「CSSEC2」、「CSSEC3」と付されている。論理回路740は、一次デコーダ720の出力に接続された第1入力と、二次デコーダ730の出力に接続された第2入力と、信号「CS0」、「CS1」、「CS2」、「CS3」の何れかを提供するための出力と、を有する。
構成レジスタ750,760の各々のセットは、標準化アドレスをデコードして領域にマッピングすることができるように、領域の属性を定義するのに十分ないくつかのレジスタを含む。一例では、ベースアドレスレジスタは、領域の開始アドレスを定義し、領域の最下位アドレスに対応し、アドレスマスクレジスタは、領域のサイズを定義し、それによってデコードに使用される有効ビットを識別する。各デコーダは、アドレスマスクレジスタに応じてマスクされた標準化アドレスの有効ビットを、ベースアドレスレジスタの対応するビットと比較する。一致した場合、デコーダは、それぞれのチップ選択信号を出力し、論理回路740は、最終チップ選択信号を出力する。アクティブハイのチップ選択信号の場合、論理回路740は、論理OR関数を使用して実装される。
一実施形態では、一次デコーダの各々は、2のサイズの領域をサポートし、二次デコーダの各々は、2(N−1)のサイズの領域をサポートする。ここで、Nは整数である。例えば、Nが32に等しい場合、6GBの合計領域サイズに対して、一次デコーダ720は4GBの領域サイズをサポートし、二次デコーダは2GBの領域サイズをサポートする。
同じ領域に割り当てられた一次デコーダ及び二次デコーダの両方を設け、それらの結果を組み合わせることによって、領域デコーダ710は、複雑なビット毎のデコードを行わずに非2のべき乗のメモリサイズをサポートし、それによってデコーダのサイズを縮小する。一次デコーダ及び二次デコーダの各々が2のべき乗のサイズを有するので、コンパクトな回路を用いて、迅速且つ効率的に、標準化アドレスビットのサブセットに対する領域デコードを実行することができる。デコード演算に必要なビット数を減らすことによって、アドレスデコーダ610は、アドレスをより高速にデコードすることが可能である。例えば、40ビットの標準化アドレスのうち32ビットを、任意の領域サイズのベースレジスタ及びリミットレジスタとビット毎に完全に比較するには、現在のCMOS論理プロセスを使用してより高いクロックレートでも、解決するのに1クロックサイクル以上が必要になる。
アドレスデコーダ610を使用して、一次デコーダ及び二次デコーダの両方によって非2のべき乗の領域サイズをサポートすることができるが、他の実施形態によれば、追加の構成が可能である。例えば、各アドレスデコーダは、2、2(N−1)、2(N−2)のサイズをそれぞれ有する一次デコーダ、二次デコーダ、三次デコーダを含むことができる。例えば、Nが32に等しい場合、この構成によって、1GBの増分で1〜7GBの領域サイズへの標準化アドレスのデコードが可能になる。この概念は、さらに4つ以上のデコーダにも拡張することができる。
図8は、2つの領域デコーダを使用して非2のべき乗アドレス空間用にプログラムされている場合に図7のアドレスデコーダによって実行されたアドレスマッピングを示す図800である。図800は、標準化アドレス空間810と、第1領域820と、第2領域830と、を含む。標準化アドレス空間810は、デコードされた信号CSPRI0に関連する4GBのサブ領域812と、デコードされた信号CSPRI1に関連する4GBのサブ領域814と、デコードされた信号CSSEC0に関連する2GBのサブ領域816と、デコードされた信号CSSEC1に関連する2GBのサブ領域と、を有する。サブ領域812は、アドレス0x0から始まり、アドレス0x0_FFFF_FFFF(4G−1(232−1))まで及び、0xは先頭にゼロが暗黙的に付加された40ビットの16進アドレスを示す。サブ領域814は、アドレス0x1_0000_0000(232)から始まり、アドレス0x1_FFFF_FFFF(8G−1(232+232−1))まで及ぶ。サブ領域816は、アドレス0x2_0000_0000(8G)から始まり、アドレス0x2_7FFF_FFFF(10G−1)まで及ぶ。サブ領域818は、アドレス0x2_8000_0000(10G)から始まり、アドレス0x2_FFFF_FFFF(12G−1)まで及ぶ。第1領域820は、CS0に関連する6GBの領域であり、4GBの一次部分822と、2GBの二次部分824と、を有する。第1領域820は、それぞれ128K(131,072)バイトの48K(49,152)行で実装されており、一次領域822は、行アドレス0x0から行アドレス0x7FFFまでの32K(32,768)行で実装されており、二次領域824は、行アドレス0x8000から0xbFFFまでの16K行で実装されている。同様に、第2領域830は、それぞれ128Kバイトの48K行で実装されており、一次領域832は、行アドレス0x0から行アドレス0x7FFFまでの32K行で実装されており、二次領域834は、行アドレス0x8000から0xbFFFまでの16K行で実装されている。
このデコード演算を実行するために、システムBIOSは、構成レジスタを表2に示すようにプログラムする。
Figure 0006761891

なお、ビット[7:0]は、256バイトのバイトアドレス指定を表すことに留意されたい。これらのビットは実装の便宜上切り捨てられ、ベースレジスタの場合に0、マスクレジスタの場合に1と推測される。
(メモリアクセスインターリーブ)
既知のメモリコントローラは、バンクアドレスを形成するために入力アドレスの特定のビットがデコードされるバンクスウィズルモードとして知られる追加のインターリーブモードを使用する。これらの特定のビットは、新たなバンク(又は、DDR4の場合には、バンク及びバンクグループの両方)のビットを生成するためのアクセスアドレスの特定のビット(例えば、下位の行アドレスビット等)を含む。このようにして、本来ページ競合を引き起こしていたであろう連続するアドレスのセットの異なる部分がバンク間で分割され、より高い効率をもたらす。
いくつかの実施形態によれば、本明細書に記載のメモリコントローラは、物理アドレス空間を異なる領域のセットにインターリーブするためのプログラム可能なメカニズムを含む。このようにして、上述したメモリコントローラ(例えば、図2のメモリコントローラ292,294又は図5のメモリコントローラ500)は、プログラムの実行中に遭遇し得る一連のアクセスをDRAMの複数のランクに拡散させることによって、より効率的に動作することができる。これにより、ページのプリチャージやページのアクティベート等のオーバーヘッドサイクルを有効なサイクル内に隠すことができる。第1メカニズムは、一次領域デコーダ及び二次領域デコーダを使用して実現することができるチップ選択インターリーブである。
図9は、いくつかの実施形態による、2つのアドレスデコーダを使用してチップ選択インターリーブを実施するようにプログラムされている場合に図7のアドレスデコーダによって実行されたアドレスマッピングを示す図900である。図900は、標準化アドレス空間910と、第1領域920と、第2領域930と、を含む。標準化アドレス空間910は、デコードされた信号CSPRI0に関連する2GBのサブ領域912と、デコードされた信号CSPRI1に関連する2GBのサブ領域914と、デコードされた信号CSSEC0に関連する2GBのサブ領域916と、デコードされた信号CSSEC1に関連する2GBのサブ領域918と、を有する。サブ領域912は、アドレス0x0から始まり、アドレス0x0_7FFF_FFFF(2G−1(231−1))まで及ぶ。サブ領域914は、アドレス0x8_0000_0000(231)から始まり、アドレス0x0_FFFF_FFFF(4G−1(231+231−1))まで及ぶ。サブ領域916は、アドレス0x1_0000_0000(4GB)から始まり、アドレス0x1_7FFF_FFFF(6G−1)まで及ぶ。サブ領域918は、アドレス0x1_8000_0000(6G)から始まり、アドレス0x1_FFFF_FFFF(8G−1)まで及ぶ。第1領域920は、CS0に関連する4GBの領域であり、2GBの部分922と、2GBの部分924と、を有する。第1領域920は、それぞれ128Kバイトの16K行で実装されており、一次領域922は、行アドレス0x0から行アドレス0x3FFFまでの16K行で実装されており、二次領域924は、行アドレス0x4000から0x7FFFまでの16K行で実装されている。同様に、第2領域930は、それぞれ128Kバイトの16K行で実装されており、一次領域932は、行アドレス0x0から行アドレス0x3FFFまでの16K行で実装されており、二次領域934は、行アドレス0x4000から0x7FFFまでの16K行で実装されている。
チップ選択インターリーブモードでは、メモリコントローラ600は、単一のDIMMランクが標準化アドレス空間内の連続するアドレスセットを占有するのとは対照的に、チャネル上の複数のDIMMランクに亘って物理アドレス空間をインターリーブする。チップ選択(CS)インターリーブでは、より小さいアドレス領域で潜在的により多くのDRAMバンクを使用することができるので、ページ競合を減らし、事実上より多くのDRAMバンクが使用可能になる。チップ選択インターリーブを使用するには、2つの要件がある。第1に、インターリーブされたチップ選択信号の数は2のべき乗である。第2に、領域は同じサイズである。図9の例では、同じサイズ(4GB)を有する2つの領域に対して2つ(2)のチップ選択が存在する。
メモリコントローラ600は、領域及びチップ選択信号を選択するために使用される上位の標準化アドレスビットを、所望のインターリーブサイズに対応する標準化アドレスの下位ビットと交換することによって、チップ選択インターリーブをプログラム可能に実施する。BaseAddrCS及びAddrMaskCSレジスタを設定してインターリーブのサイズを示すことによって、CSインターリーブモードを設定することができる。例えば、2−CSシステムにおいて1024KBの標準化アドレス範囲上で一次デコーダのみをインターリーブし、次いで二次デコーダのみをインターリーブする場合、レジスタの設定は、以下の表3に示すようになる。
Figure 0006761891

これにより、領域912,914は、0x0から0x0_FFFF_FFFFまでのアドレスに亘って双方向にインターリーブされ、アドレスビット12でCS0及びCS1の何れを使用するかが決まる。同様に、領域916,918も0x1_0000_0000から0x1_FFFF_FFFFまでのアドレスに亘って双方向にインターリーブされ、アドレスビット12でCS0及びCS1の何れを使用するかが決まる。
表1に示す例では、アドレスビットA[12](1024KBのサイズに対応する)は、列アドレスビット9(COL[9])にマッピングされている。このマッピングによって、インターリーブを実装する際のファームウェアの柔軟性がさらに向上する。現在の例では、A[12]がCSインターリーブに使用され、COL[9]がA[13]にマッピングされ、上位のアドレスビットが表1のパターンに従ってバンク及びバンクグループアドレスに使用される(すなわち、A[14]がBA0に使用され、A[15]がBA1に使用される等)。
第2メカニズムは、ハッシュとして知られている。ハッシュは、より多くのアドレスビットを使用可能にすることによって、より細かい粒度を提供する。ハッシュで使用されるアドレスビットの数及び位置をユーザによってプログラムすることができるので、ハッシュ演算が特定のアプリケーション及びソフトウェアコードの特徴に合わせて調整することができるように、柔軟性を提供することができる。
図10は、いくつかの実施形態による、図5のアドレスデコーダ522を実装するのに使用可能なメモリコントローラ1000の一部のブロック図である。メモリコントローラ1000は、アドレスデコーダ1010と、構成レジスタのセット1020と、を含む。アドレスデコーダ1010は、チップ選択(CS)ハッシュ回路1012と、バンクアドレス(BA)ハッシュ回路1014と、を含む。CSハッシュ回路1012は、インタフェース512から40ビットのNORMALIZED ADDRESS(標準化アドレス)を受信するための入力と、「CS_HASH」と付された、ハッシュされたチップ選択信号のセットを提供するための出力と、を有する。BAハッシュ回路1014は、CSハッシュ回路1012の出力に接続された第1入力と、標準化アドレスを受信するための第2入力と、CHIP_ID、ROW_ADDRESS、COLUMN_ADDRESS、BG及びBA_HASH信号を提供するための出力と、を有する。メモリコントローラ1000は、これらの出力をCONTROL信号と共に使用して、デコードされたメモリアクセスを、コマンドキュー520に提供してコマンドキュー520に記憶させることによって、アービタ538が、メモリアクセス要求の効率的な順序付けに関する決定を行うことができる。
アドレスデコーダ1010は、上述したように、メモリチャネル内の各メモリチップのベースアドレス及びサイズについての様々な構成レジスタからフィールドを受信する。また、アドレスデコーダ1010は、プログラム可能なハッシュ関数をサポートするために、追加の構成レジスタを使用する。図10は、これらの追加の構成レジスタのみを示している。図示した実施形態では、アドレスデコーダ1010は、最大4つのチップ選択信号と、最大32個のバンクと、をサポートする。したがって、構成レジスタ1020は、符号化CS信号のビットに対応する2つのCSハッシュレジスタのセット1030と、符号化BA信号のビットに対応する5つのBAハッシュレジスタのセット1040と、を含む。
CSハッシュレジスタのセット1030は、CS_HASH[0]に関連する第1CSハッシュレジスタ1032と、CS_HASH[1]に関連する第2CSハッシュレジスタ1034と、を含む。各CSハッシュレジスタは、レジスタビット31:1において「NORMALIZED ADDRESS XOR[39:9]」と付された30ビットフィールドと、レジスタビット0において「EN」と付されたイネーブルフィールドと、を含む32ビットのレジスタである。BAハッシュレジスタのセット1040は、ハッシュされたバンクアドレスビットBA_HASH[0]、BA_HASH[1]、BA_HASH[2]、BA_HASH[3]及びBA_HASH[4]の各々に関連するBAハッシュレジスタ1042,1044,1046,1048,1050を含む。各BAハッシュレジスタは、レジスタビット31:14において「ROWXOR[17:0]」と付された18ビットの行排他的論理和(XOR)フィールドと、レジスタビット13:1において「COLXOR[12:0]」と付された13ビットの列排他的論理和フィールドと、レジスタビット0において「EN」と付されたイネーブルフィールドと、の3つのフィールドを有する32ビットのレジスタである。
アドレスデコーダ1010は、標準化アドレスの選択されたビットを使用して、ビット毎のXOR演算を実行する。CSハッシュ回路1012は、最初に、標準化アドレスの最上位の31ビットのうち選択されたビットを使用して、チップ選択ビットをハッシュする。CSハッシュレジスタのNORMALIZED ADDRESS XORフィールドの各ビットは、標準化アドレスの指示されたビットに対してビット毎の排他的OR(XOR)演算を選択的に実行するために使用される。2つのチップ選択信号は、以下の式(1)及び式(2)に従ってハッシュされる。
Figure 0006761891

Figure 0006761891

ここで、^は、XOR演算子を表し、^()は、ビット対の各々に対するビット毎のXOR演算子を表す。
メモリデコーダ1010は、最初に、メモリのサイズに基づいてCS[1:0]ビットを見つける。次に、CSハッシュを実行して、式(1)及び(2)を使用してCS_HASH値を計算する。CSハッシュ回路1012が、ハッシュされたCS_HASH値を決定した後に、BAハッシュ回路1014は、式(3)〜式(7)を使用してBAハッシュを実行することによって、BA_HASH値を計算する。
Figure 0006761891

Figure 0006761891

Figure 0006761891

Figure 0006761891

Figure 0006761891

ここで、CSビットに対応する標準化アドレスのビット自体を、CSビットのハッシュに使用することはできない。そうしないと、全てのCS_HASH値が強制的に0になるからである。これらのレジスタ値の設定に関する追加の制限について、さらに後述する。
いくつかの実施形態では、CS及びBAハッシュ関数は、さらなるレベルのメモリ構成に拡張することができる。例えば、HBMメモリは、「擬似チャネル」として知られる概念を実装する。擬似チャネルは、以下の式(8)に示すように、対応するハッシュ式及び対応する擬似チャネルレジスタを使用して、ハッシュされ得る。
Figure 0006761891

この場合、メモリコントローラは、追加のハッシュ回路及び追加の構成レジスタを使用する。
既知のメモリコントローラは、バンクアドレスをハッシュし、固定のハッシュ関数を使用するだけである。メモリコントローラ1000は、その柔軟性を高めるために、2つの追加のメカニズムを提供する。第1に、メモリコントローラ1000は、チップ選択を選択的にハッシュすることによって、アクセスを分割する際のさらなる柔軟性を可能にする。例えば、4つのランク及び4つのチップ選択を有するメモリを使用して、近接するメモリアクセスのセットを、4倍以上のメモリバンクに亘ってより広範に拡散させることができる。このより広い拡散によって、メモリコントローラ1000がオーバーヘッドをより良く隠すことを可能にする。第2に、メモリコントローラ1000は、ハッシュ関数自体をプログラム可能にし、これにより、処理環境により良く適合するように変更可能にすることができる。例えば、モバイルシステムは、デスクトップシステムやサーバよりも少数のタスクを実行し、物理アドレス空間においてより高度のコード及びデータの集中を使用する傾向があることから、比較的小さい物理メモリ領域へのより多くのメモリアクセスが複数のチップ及びバンクに亘ってより広く拡散されるのを保証するために、より複雑なハッシュアルゴリズムから恩恵を受けるであろう。一方、デスクトップシステム及びサーバシステムは、よりマルチタスク化及びマルチスレッド化される傾向があることから、より単純なハッシュアルゴリズムで十分な場合がある。何れの場合も、ハッシュアルゴリズムは、システムBIOSによって選択的にプログラムされ得るハッシュレジスタのセットを通じてプログラム可能である。
図11は、いくつかの実施形態による、図5のアドレスデコーダ522を実装するのに使用可能なメモリコントローラ1100の他の部分のブロック図である。図示したように、メモリコントローラ1100は、ハッシュ回路1120と、これに続く非2のべき乗デコーダ1130と、を有するアドレスデコーダ1110を含む。ハッシュ回路1120は、アクセスアドレスを受信するための入力と、出力と、を有しており、図10のハッシュ回路1010を用いて実装することができる。非2のべき乗デコーダ1130は、ハッシュ回路1120の出力に接続された入力と、デコードされたアドレスを提供するための出力と、を有しており、図6及び図7の非2のべき乗デコーダ回路610を用いて実装することができる。メモリコントローラ1100は、ハッシュメカニズム及び非2のべき乗メモリサイズのデコーダを別々に実装できるだけでなく、これらを単一のメモリデコーダ1110内で一緒に使用することも可能であることを示している。この場合、ハッシュメカニズムは、非2のべき乗デコードにシームレスに先行して、両方の機能をサポートすることによって、さらに高められた柔軟性をメモリコントローラに提供する。
また、ハッシュ演算は、非2のべき乗メモリサイズでシームレスに使用することができる。ハッシュ回路1012が非2のべき乗メモリアドレスサイズでハッシュ演算を実行する方法を、特定の例に関して説明することができる。この例では、デュアルランク12Gbメモリが2つの領域デコーダを使用して実装され、CS0用の第1領域デコーダは、一次デコーダ(CS0p)及び二次デコーダ(CS0s)を使用して12Gbのメモリ空間にマッピングし、CS1用の第2領域デコーダは、一次デコーダ(CS1p)及び二次デコーダ(CS1s)を使用して12Gbのメモリ空間にマッピングする。この例では、インターリーブは、簡単な方法で行われる。
Figure 0006761891

Figure 0006761891
システムBIOSが非2のべき乗サイズを設定するように非2のべき乗デコーダ1130を構成した場合、DRAMアーキテクチャに起因して、ハッシュ関数に追加の制限がある。例えば、図8及び図9に示す構成によれば、48K行しか存在せず、Row[MSB:MSB−1]に対応するROWXORビットは、3つの状態が正しい数のバンク状態に正しく変換されないので、ハッシュ演算のために有効にされるべきではない。代わりに、これらのビットは、2のべき乗サイズのメモリでのみ使用することができる。
したがって、上述したメモリコントローラは、様々な構成可能オプションを通じて柔軟なアドレスマッピングを実行することによって、様々な選択肢をユーザに提供することが可能である。これらのアドレスマッピングの選択肢は、非2のべき乗メモリサイズのサポート、インターリーブ及びハッシュを含み、これらの全てが1つの結合されたデコーダ(アドレスデコーダ522)で実装される。
図5及び図6のメモリコントローラは、ハードウェア及びソフトウェアの様々な組み合わせによって実装されてもよい。例えば、デコーダ610は、速度及び効率の目的のためにハードウェア回路で実装されてもよい。このハードウェア回路は、プライオリティエンコーダ、有限ステートマシン、プログラマブルロジックアレイ(PLA)等を含んでもよい。いくつかの実施形態では、メモリコントローラ500の他の機能ブロックは、ソフトウェアの制御下でデータプロセッサによって実行されてもよい。いくつかのソフトウェアコンポーネントは、少なくとも1つのプロセッサによる実行のためにコンピュータ可読記憶媒体に記憶されてもよく、非一時的なコンピュータメモリ又はコンピュータ可読記憶媒体に記憶された命令に対応してもよい。様々な実施形態では、非一時的なコンピュータ可読記憶媒体は、磁気若しくは光ディスク記憶デバイス、例えばフラッシュメモリ等のソリッドステート記憶デバイス、又は、他の不揮発性メモリデバイスを含む。非一時的なコンピュータ可読記憶媒体に記憶されたコンピュータ可読命令は、ソースコード、アセンブリ言語コード、オブジェクトコード、又は、1つ以上のプロセッサによって解釈及び/若しくは実行可能な他の命令フォーマットであってもよい。
図5のメモリコントローラ500、図6のアドレスデコーダ610、又は、これらの任意の部分は、プログラムによって読出され、集積回路を製造するために直接的若しくは間接的に使用され得るデータベース又は他のデータ構造の形態のコンピュータアクセス可能なデータ構造によって記述されてもよいし表現されてもよい。例えば、このデータ構造は、例えばVerilog又はVHDL等の高水準設計言語(HDL)におけるハードウェア機能の動作レベルの記述であってもよいし、レジスタ転送レベル(RTL)記述であってもよい。記述は、ゲートのリストを含むネットリストを合成ライブラリから生成するために当該記述を合成し得る合成ツールによって読出されてもよい。ネットリストは、集積回路を含むハードウェアの機能を表すゲートのセットを含む。そして、ネットリストを配置及びルーティングして、マスクに適用される幾何学的形状を記述するデータセットを生成してもよい。マスクは、集積回路を製造するために様々な半導体製造工程で使用されてもよい。或いは、コンピュータアクセス可能な記憶媒体上のデータベースは、所望により、ネットリスト(合成ライブラリ有り若しくは無し)又はデータセットであってもよいし、グラフィックデータシステム(GDS)IIデータであってもよい。
特定の実施形態について説明してきたが、これらの実施形態に対する様々な修正が当業者には明らかであろう。例えば、メモリコントローラ500は、DDRxメモリ以外の他のタイプのメモリ(例えば、高帯域幅メモリ(HBM)、RAMバスDRAM(RDRAM)及び異なるタイプのDIMM等)とインタフェースをとることができる。また、メモリコントローラ500は、異なるサイズのメモリにアクセスするように拡張可能である。2のべき乗デコーダの数は、他の実施形態において変わるであろう。図示した実施形態では、DDRメモリにおいて有用なメモリアドレス指定及び制御信号を説明したが、これらは使用されるメモリのタイプに応じて変わるであろう。また、例示的なデータ処理システム100は、例えば図2のAPU200等のCPUコア及びGPUコアの両方を有するAPUに基づいていたが、上述した技術は、CPU(1つ以上CPUコアを有するがGPUコアを有しないシステム)及びGPU(CPUコアを有していないが1つ以上のGPUコアを有するシステム)にも適合され得る。
したがって、添付の特許請求の範囲によって、開示された実施形態の範囲内に含まれる、開示された実施形態の全ての変更を包含することが意図される。

Claims (19)

  1. メモリコントローラ(500)を有するデバイス(100,200)であって、
    メモリコントローラ(500)は、
    アクセスアドレスを含むメモリアクセス要求を受信するホストインタフェース(512)と、
    メモリアクセスをメモリシステム(120)に提供するメモリインタフェース(514)と、
    前記アクセスアドレスを、複数の領域のうち選択された領域にプログラム可能にマッピングするために、前記ホストインタフェース(512)に接続されたアドレスデコーダ(522,610)であって、第1の2のべき乗のサイズを有する一次デコーダ(720)と、第2の2のべき乗のサイズを有する二次デコーダ(730)とを使用して、前記アクセスアドレスを、非2のべき乗のサイズを有する第1領域にマッピングするようにプログラム可能であり、前記アクセスアドレスを前記第1領域にマッピングすることに応じて第1領域マッピング信号を提供する、アドレスデコーダ(522,610)と、
    前記メモリアクセス要求及び領域マッピング信号を記憶するために前記アドレスデコーダ(522,610)に接続されたコマンドキュー(520)と、
    前記領域マッピング信号に部分的に基づいて評価された複数の基準に基づいて、前記コマンドキュー(520)から前記メモリアクセス要求を選択し、これに応じて、対応するメモリアクセスを前記メモリインタフェース(514)に提供するアービタ(538)と、を備える、
    デバイス(100,200)。
  2. 前記領域マッピング信号は、前記メモリシステム(120)のチップ選択信号に対応する、
    請求項1のデバイス(100,200)。
  3. 前記アドレスデコーダ(522,610)は、複数の領域デコーダを備え、
    領域デコーダ(710)毎に、
    前記一次デコーダ(720)は、前記アクセスアドレスを受信し、一次領域選択信号を提供し、第1ベースアドレス及び第1の2のべき乗のサイズを有し、
    前記二次デコーダ(730)は、前記アクセスアドレスを受信し、二次領域選択信号を提供し、第2ベースアドレス及び第2の2のべき乗のサイズを有し、
    前記領域デコーダ(710)は、前記一次領域選択信号及び前記二次領域選択信号のうち少なくとも一方のアクティベートに応じて、対応する領域マッピング信号をアクティベートするための論理回路(740)をさらに備える、
    請求項1のデバイス(100,200)。
  4. 前記第1領域は、2+2(N−1)(Nは整数)のサイズを有し、
    前記一次デコーダ(720)は、サイズ2のサブ領域をデコードし、
    前記二次デコーダ(730)は、サイズ2(N−1)の領域をデコードする、
    請求項3のデバイス(100,200)。
  5. 前記アドレスデコーダ(522,610)は、前記アクセスアドレスをデコードして、行アドレス、列アドレス、バンクアドレス及びバンクグループを提供する、
    請求項3のデバイス(100,200)。
  6. 各領域デコーダ(710)は、
    前記一次デコーダ(720)に関連する第1構成レジスタのセット(750)と、
    前記二次デコーダ(730)に関連する第2構成レジスタのセット(760)と、をさらに備える、
    請求項3のデバイス(100,200)。
  7. 第3の2のべき乗のサイズを有する第1の一次デコーダ(720)と、前記第3の2のべき乗のサイズを有する第1の二次デコーダ(730)とを使用して、前記アクセスアドレスを、2のべき乗のサイズを有する第1領域(920)に選択的にマッピングし、これに応じて前記第1領域マッピング信号を提供する第1領域デコーダ(710,CS0)と、
    前記第3の2のべき乗のサイズを有する第2の一次デコーダ(720)と、前記第3の2のべき乗のサイズを有する第2の二次デコーダ(730)とを使用して、前記アクセスアドレスを、2のべき乗のサイズを有する第2領域(930)に選択的にマッピングし、これに応じて第2領域マッピング信号を提供する第2領域デコーダ(710,CS1)と、をさらに備え、
    前記メモリコントローラ(500)は、前記第1の一次デコーダ(720)と、前記第2の一次デコーダ(720)と、前記第1の二次デコーダ(730)と、前記第2の二次デコーダ(730)と、の各々の間で、前記アクセスアドレスに対応するメモリ空間をインターリーブする、
    請求項1のデバイス(100,200)。
  8. 前記デバイス(100,200)は、データ処理システム(100)であって、
    前記アクセスアドレスを有するメモリアクセス要求を提供するためのメモリアクセスエージェント(110,210,220)と、
    前記メモリアクセスに応答するメモリシステム(120)であって、少なくとも1つの非2のべき乗領域を含む複数の領域を有するメモリシステム(120)と、をさらに備える、
    請求項1のデバイス(100,200)。
  9. 前記デバイス(200)は、単一の集積回路チップ上に形成されたマイクロプロセッサ(100)であって、
    前記アクセスアドレスを有するメモリアクセス要求を提供するためのメモリアクセスエージェント(110,210,220)をさらに備える、
    請求項1のデバイス(100,200)。
  10. アクセスアドレスを含むメモリアクセス要求を受信することと、
    前記アクセスアドレスをデコードし、これに応じて、対応する領域マッピング信号を提供することであって、前記デコードすることは、第1の2のべき乗のサイズを有する第1の一次デコーダ(720)と、第2の2のべき乗のサイズを有する第1の二次デコーダ(730)とを使用して、前記アクセスアドレスを、非2のべき乗のサイズを有する第1領域に選択的にマッピングすることを含む、ことと、
    前記アクセスアドレスを前記第1領域にマッピングすることに応じて、第1領域マッピング信号を提供することと、
    前記メモリアクセス要求及び領域マッピング信号を記憶することと、
    記憶された前記メモリアクセス要求を、前記領域マッピング信号に部分的に基づいて評価された複数の基準に基づいて選択することと、
    選択されたメモリアクセス要求に応じて、対応するメモリアクセスを提供することと、を含む、
    方法。
  11. 前記選択されたメモリアクセス要求の前記対応する領域マッピング信号に応じて、複数のチップ選択信号のうち選択されたチップ選択信号をアクティベートすることをさらに含む、
    請求項10の方法。
  12. 前記デコードすることは、
    第1アクセスアドレスが、第1ベースアドレス及び前記第1の2のべき乗のサイズによって定義された第1サブ領域内に存在する場合に、前記第1アクセスアドレスをデコードして一次領域選択信号を提供することと、
    前記第1アクセスアドレスが、第2ベースアドレス及び前記第2の2のべき乗のサイズによって定義された第2サブ領域内に存在する場合に、前記第1アクセスアドレスをデコードして二次領域選択信号を提供することと、
    前記一次領域選択信号及び前記二次領域選択信号のうち少なくとも一方のアクティベートに応じて、対応する領域マッピング信号をアクティベートすることと、を含む、
    請求項10の方法。
  13. 前記第1アクセスアドレスをデコードして一次領域選択信号を提供すること、及び、前記第1アクセスアドレスをデコードして二次領域選択信号を提供すること、の各々は、
    前記第1アクセスアドレスをデコードして行アドレス、列アドレス、バンクアドレス及びバンクグループを提供することを含む、
    請求項12の方法。
  14. 第3の2のべき乗のサイズを有する前記第1の一次デコーダ(720)と、前記第3の2のべき乗のサイズを有する前記第1の二次デコーダ(730)とを使用して、前記アクセスアドレスを、2のべき乗のサイズを有する前記第1領域(920)に選択的にマッピングし、これに応じて第1領域マッピング信号を提供することと、
    前記第3の2のべき乗のサイズを有する第2の一次デコーダ(720)と、前記第3の2のべき乗のサイズを有する第2の二次デコーダ(730)とを使用して、前記アクセスアドレスを、2のべき乗のサイズを有する第2領域(930)に選択的にマッピングし、これに応じて第2領域マッピング信号を提供することと、をさらに含み、
    前記アクセスアドレスを前記第1領域(920)に選択的にマッピングすること、及び、前記アクセスアドレスを前記第2領域(930)に選択的にマッピングすること、の各々は、前記第1の一次デコーダ(720)と、前記第2の一次デコーダ(720)と、前記第1の二次デコーダ(730)と、前記第2の二次デコーダ(730)と、の間で、前記アクセスアドレスに対応するメモリ空間(910)をインターリーブすることを含む、
    請求項10の方法。
  15. 前記デコードすることは、
    複数のプログラム可能なビットに応じて、前記アクセスアドレスの対応する複数のビットのうち何れのビットがハッシュ関数で使用されるかを決定し、前記ハッシュ関数を使用して前記アクセスアドレスを選択的にハッシュすることをさらに含む、
    請求項10の方法。
  16. メモリコントローラ(500)を有するデバイス(100,200)であって、
    メモリコントローラ(500)は、
    アクセスアドレスを含むメモリアクセス要求を受信するホストインタフェース(512)と、
    メモリアクセスをメモリシステム(120)に提供するメモリインタフェース(514)であって、前記メモリアクセスは、ハッシュされたアドレスを含む、メモリインタフェース(514)と、
    ハッシュ関数を用いて、前記アクセスアドレスを、前記メモリシステム(120)の複数の領域のうち選択された領域にプログラム可能にマッピングするために、前記ホストインタフェース(512)に接続されたアドレスデコーダ(522,1010)であって、複数のプログラム可能なビットに応じて、前記アクセスアドレスの対応する複数のビットのうち何れのビットが前記ハッシュ関数で使用されるかを決定するアドレスデコーダ(522,1010)と、
    前記ハッシュされたアドレスを含むメモリアクセス要求をを記憶するために前記アドレスデコーダ(522,1010)に接続されたコマンドキュー(520)と、
    複数の基準に基づいて前記コマンドキュー(520)から前記メモリアクセス要求を選択し、これに応じて、前記ハッシュされたアドレスを含む対応するメモリアクセスを前記メモリインタフェース(514)に提供するアービタ(538)と、を備え、
    前記アドレスデコーダ(522,1010)は、
    前記アクセスアドレスと、前記アクセスアドレスのプログラム可能な部分をハッシュするための少なくとも1つのプログラム可能なチップ選択ハッシュビットと、に応じて、1つのハッシュされたチップ選択信号を各アクセス要求に関連付けるチップ選択ハッシュ回路(1012)と、
    前記アクセスアドレスと、前記ハッシュされたチップ選択信号と、前記アクセスアドレスのプログラム可能な部分をハッシュするための少なくとも1つのプログラム可能なバンクアドレスハッシュビットと、に応じて、各アクセス要求を、選択されハッシュされたチップ選択に対応するチップ内の1つのバンクに関連付けるバンクアドレスハッシュ回路(1014)と、を備え、
    前記デバイス(100,200)は、符号化されたチップ選択信号のビットにそれぞれ対応する複数のチップ選択構成レジスタ(1020)をさらに備え、各チップ選択構成レジスタは、前記アクセスアドレスのビットにそれぞれ対応する複数のビットを記憶し、対応するビットが前記ハッシュ関数の一部を形成するかどうかを定義する、
    デバイス(100,200)。
  17. 前記チップ選択ハッシュ回路(1012)は、前記符号化されたチップ選択信号のビット毎に、前記複数のチップ選択構成レジスタ(1020)のうち対応するレジスタ内のビットが示す前記アクセスアドレスの複数のビットの各々の間で排他的論理和演算を実行する、
    請求項16のデバイス(100,200)。
  18. メモリコントローラ(500)を有するデバイス(100,200)であって、
    メモリコントローラ(500)は、
    アクセスアドレスを含むメモリアクセス要求を受信するホストインタフェース(512)と、
    メモリアクセスをメモリシステム(120)に提供するメモリインタフェース(514)であって、前記メモリアクセスは、ハッシュされたアドレスを含む、メモリインタフェース(514)と、
    ハッシュ関数を用いて、前記アクセスアドレスを、前記メモリシステム(120)の複数の領域のうち選択された領域にプログラム可能にマッピングするために、前記ホストインタフェース(512)に接続されたアドレスデコーダ(522,1010)であって、複数のプログラム可能なビットに応じて、前記アクセスアドレスの対応する複数のビットのうち何れのビットが前記ハッシュ関数で使用されるかを決定するアドレスデコーダ(522,1010)と、
    前記ハッシュされたアドレスを含むメモリアクセス要求をを記憶するために前記アドレスデコーダ(522,1010)に接続されたコマンドキュー(520)と、
    複数の基準に基づいて前記コマンドキュー(520)から前記メモリアクセス要求を選択し、これに応じて、前記ハッシュされたアドレスを含む対応するメモリアクセスを前記メモリインタフェース(514)に提供するアービタ(538)と、を備え、
    前記アドレスデコーダ(522,1010)は、
    前記アクセスアドレスと、前記アクセスアドレスのプログラム可能な部分をハッシュするための少なくとも1つのプログラム可能なチップ選択ハッシュビットと、に応じて、1つのハッシュされたチップ選択信号を各アクセス要求に関連付けるチップ選択ハッシュ回路(1012)と、
    前記アクセスアドレスと、前記ハッシュされたチップ選択信号と、前記アクセスアドレスのプログラム可能な部分をハッシュするための少なくとも1つのプログラム可能なバンクアドレスハッシュビットと、に応じて、各アクセス要求を、選択されハッシュされたチップ選択に対応するチップ内の1つのバンクに関連付けるバンクアドレスハッシュ回路(1014)と、を備え、
    前記デバイス(100,200)は、符号化されたバンクアドレス信号のビットにそれぞれ対応する複数のバンクアドレス構成レジスタ(1030)をさらに備え、各バンクアドレス構成レジスタは、前記アクセスアドレスのビットにそれぞれ対応する複数のビットを記憶し、前記アクセスアドレスの対応するビットが前記ハッシュ関数で使用されるかどうかを定義する、
    デバイス(100,200)。
  19. 前記バンクアドレスハッシュ回路(1014)は、前記符号化されたバンクアドレス信号のビット毎に、前記複数のバンクアドレス構成レジスタ(1030)のうち対応するレジスタ内のビットが示す前記アクセスアドレスの複数のビットの各々の間で排他的論理和演算を実行する、
    請求項18のデバイス(100,200)。
JP2019500870A 2016-07-15 2016-09-23 柔軟なアドレスデコード機能を備えるメモリコントローラ Active JP6761891B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/211,887 2016-07-15
US15/211,887 US10403333B2 (en) 2016-07-15 2016-07-15 Memory controller with flexible address decoding
PCT/US2016/053358 WO2018013158A1 (en) 2016-07-15 2016-09-23 Memory controller with flexible address decoding

Publications (3)

Publication Number Publication Date
JP2019520660A JP2019520660A (ja) 2019-07-18
JP2019520660A5 JP2019520660A5 (ja) 2019-10-24
JP6761891B2 true JP6761891B2 (ja) 2020-09-30

Family

ID=60940724

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019500870A Active JP6761891B2 (ja) 2016-07-15 2016-09-23 柔軟なアドレスデコード機能を備えるメモリコントローラ

Country Status (6)

Country Link
US (1) US10403333B2 (ja)
EP (1) EP3485383A4 (ja)
JP (1) JP6761891B2 (ja)
KR (1) KR20190019200A (ja)
CN (1) CN109478169B (ja)
WO (1) WO2018013158A1 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018094620A1 (zh) * 2016-11-23 2018-05-31 华为技术有限公司 一种内存分配方法和设备
US11082523B2 (en) * 2017-02-09 2021-08-03 International Business Machines Corporation System, method and computer program product for a distributed virtual address space
IT201800002895A1 (it) * 2018-02-21 2019-08-21 Stmicroelectronics Application Gmbh Sistema di elaborazione, relativo circuito integrato, dispositivo e procedimento
KR102583448B1 (ko) * 2018-04-10 2023-09-27 에스케이하이닉스 주식회사 온도 관리를 위해 주소를 제어하는 반도체 메모리 장치
US11194382B2 (en) * 2018-10-16 2021-12-07 Advanced Micro Devices, Inc. Speculative exit from power down mode of a dynamic random access memory rank
US10642734B1 (en) * 2018-12-03 2020-05-05 Advanced Micro Devices, Inc. Non-power of two memory configuration
KR20210034726A (ko) 2019-09-20 2021-03-31 삼성전자주식회사 메모리 모듈, 그것을 제어하는 메모리 제어기의 에러 정정 방법, 및 그것을포함하는 컴퓨팅 시스템
US11403217B2 (en) * 2019-10-30 2022-08-02 Qualcomm Incorporated Memory bank group interleaving
US11537319B2 (en) 2019-12-11 2022-12-27 Advanced Micro Devices, Inc. Content addressable memory with sub-field minimum and maximum clamping
US11561862B2 (en) 2020-05-29 2023-01-24 Advanced Micro Devices, Inc. Refresh management for DRAM
CN112286844B (zh) * 2020-10-30 2022-09-02 烽火通信科技股份有限公司 一种可适配业务地址映射的ddr4控制方法及装置
US11379388B1 (en) * 2021-03-31 2022-07-05 Advanced Micro Devices, Inc. Credit scheme for multi-queue memory controllers
US11972140B2 (en) 2021-04-26 2024-04-30 Apple Inc. Hashing with soft memory folding
US11693585B2 (en) 2021-04-26 2023-07-04 Apple Inc. Address hashing in a multiple memory controller system
CN113312277A (zh) * 2021-06-29 2021-08-27 合肥忆芯电子科技有限公司 存储体地址映射装置、方法及电子设备
JP7168731B1 (ja) 2021-07-19 2022-11-09 Necプラットフォームズ株式会社 メモリアクセス制御装置、メモリアクセス制御方法、及び、メモリアクセス制御プログラム
US11934313B2 (en) 2021-08-23 2024-03-19 Apple Inc. Scalable system on a chip
US20230418772A1 (en) * 2022-06-24 2023-12-28 Advanced Micro Devices, Inc. Memory controller with pseudo-channel support
CN116049047B (zh) * 2022-12-30 2024-04-12 成都电科星拓科技有限公司 一种eeprom访问方法
CN116700631B (zh) * 2023-08-03 2023-09-29 摩尔线程智能科技(北京)有限责任公司 任务管理装置、方法、图形处理器及电子设备

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5142672A (en) * 1987-12-15 1992-08-25 Advanced Micro Devices, Inc. Data transfer controller incorporating direct memory access channels and address mapped input/output windows
US5748939A (en) * 1993-06-30 1998-05-05 Intel Corporation Memory device with a central control bus and a control access register for translating an access request into an access cycle on the central control bus
JP3713312B2 (ja) * 1994-09-09 2005-11-09 株式会社ルネサステクノロジ データ処理装置
US5764963A (en) * 1995-07-07 1998-06-09 Rambus, Inc. Method and apparatus for performing maskable multiple color block writes
US7318114B1 (en) 2004-10-29 2008-01-08 Sun Microsystems, Inc. System and method for dynamic memory interleaving and de-interleaving
US7480781B2 (en) 2004-12-30 2009-01-20 Intel Corporation Apparatus and method to merge and align data from distributed memory controllers
US9171585B2 (en) * 2005-06-24 2015-10-27 Google Inc. Configurable memory circuit system and method
US7620793B1 (en) * 2006-08-28 2009-11-17 Nvidia Corporation Mapping memory partitions to virtual memory pages
JP5018074B2 (ja) * 2006-12-22 2012-09-05 富士通セミコンダクター株式会社 メモリ装置,メモリコントローラ及びメモリシステム
US7904626B2 (en) * 2007-06-07 2011-03-08 Renesas Electronics Corporation Arbiter and arbitration method of multiple data accesses
US8438320B2 (en) * 2007-06-25 2013-05-07 Sonics, Inc. Various methods and apparatus for address tiling and channel interleaving throughout the integrated system
US7793038B2 (en) * 2007-06-26 2010-09-07 International Business Machines Corporation System and method for programmable bank selection for banked memory subsystems
US7813212B2 (en) * 2008-01-17 2010-10-12 Mosaid Technologies Incorporated Nonvolatile memory having non-power of two memory capacity
US20120137090A1 (en) * 2010-11-29 2012-05-31 Sukalpa Biswas Programmable Interleave Select in Memory Controller
US9432298B1 (en) * 2011-12-09 2016-08-30 P4tents1, LLC System, method, and computer program product for improving memory systems
US9141541B2 (en) 2013-09-20 2015-09-22 Advanced Micro Devices, Inc. Nested channel address interleaving
US9213600B2 (en) 2013-11-11 2015-12-15 Seagate Technology Llc Dynamic per-decoder control of log likelihood ratio and decoding parameters
US9293188B2 (en) * 2014-02-03 2016-03-22 Advanced Micro Devices, Inc. Memory and memory controller for high reliability operation and method

Also Published As

Publication number Publication date
JP2019520660A (ja) 2019-07-18
US20180019006A1 (en) 2018-01-18
EP3485383A4 (en) 2020-04-22
US10403333B2 (en) 2019-09-03
KR20190019200A (ko) 2019-02-26
CN109478169A (zh) 2019-03-15
EP3485383A1 (en) 2019-05-22
CN109478169B (zh) 2023-07-28
WO2018013158A1 (en) 2018-01-18

Similar Documents

Publication Publication Date Title
JP6761891B2 (ja) 柔軟なアドレスデコード機能を備えるメモリコントローラ
JP6730453B2 (ja) 細かい粒度のリフレッシュ
JP6761873B2 (ja) セルフリフレッシュステートマシンmopアレイ
CN109564556B (zh) 具有条纹和读取/写入事务管理的存储器控制器仲裁器
JP6840145B2 (ja) 高速メモリインタフェースのためのコマンドアービトレーション
KR102370477B1 (ko) 가상 컨트롤러 모드를 가진 메모리 컨트롤러
JP6761870B2 (ja) 低電力メモリのスロットリング
US11494316B2 (en) Memory controller with a plurality of command sub-queues and corresponding arbiters
JP7357169B2 (ja) Dramのリフレッシュ管理
EP3270294B1 (en) Command arbitration for high-speed memory interfaces
JP2024512623A (ja) マルチキューメモリコントローラのためのクレジット方式
EP3270295A1 (en) Memory controller with virtual controller mode

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190408

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190912

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190912

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200811

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200907

R150 Certificate of patent or registration of utility model

Ref document number: 6761891

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250