JP6840145B2 - 高速メモリインタフェースのためのコマンドアービトレーション - Google Patents

高速メモリインタフェースのためのコマンドアービトレーション Download PDF

Info

Publication number
JP6840145B2
JP6840145B2 JP2018524749A JP2018524749A JP6840145B2 JP 6840145 B2 JP6840145 B2 JP 6840145B2 JP 2018524749 A JP2018524749 A JP 2018524749A JP 2018524749 A JP2018524749 A JP 2018524749A JP 6840145 B2 JP6840145 B2 JP 6840145B2
Authority
JP
Japan
Prior art keywords
memory
sub
arbitration
arbiter
controller
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018524749A
Other languages
English (en)
Other versions
JP2019525271A (ja
JP2019525271A5 (ja
Inventor
アール. マグロ ジェームズ
アール. マグロ ジェームズ
バラクリシュナン ケダーナス
バラクリシュナン ケダーナス
ペン ジャクソン
ペン ジャクソン
カナヤマ ヒデキ
カナヤマ ヒデキ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced Micro Devices Inc
Original Assignee
Advanced Micro Devices Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Advanced Micro Devices Inc filed Critical Advanced Micro Devices Inc
Publication of JP2019525271A publication Critical patent/JP2019525271A/ja
Publication of JP2019525271A5 publication Critical patent/JP2019525271A5/ja
Application granted granted Critical
Publication of JP6840145B2 publication Critical patent/JP6840145B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/36Handling requests for interconnection or transfer for access to common bus or bus system
    • G06F13/362Handling requests for interconnection or transfer for access to common bus or bus system with centralised access control
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/16Handling requests for interconnection or transfer for access to memory bus
    • G06F13/1668Details of memory controller
    • G06F13/1689Synchronisation and timing concerns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/16Handling requests for interconnection or transfer for access to memory bus
    • G06F13/1605Handling requests for interconnection or transfer for access to memory bus based on arbitration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/16Handling requests for interconnection or transfer for access to memory bus
    • G06F13/1605Handling requests for interconnection or transfer for access to memory bus based on arbitration
    • G06F13/1642Handling requests for interconnection or transfer for access to memory bus based on arbitration with request queuing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/40Bus structure
    • G06F13/4063Device-to-bus coupling
    • G06F13/4068Electrical coupling

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Bus Control (AREA)
  • Memory System (AREA)
  • Dram (AREA)
  • Read Only Memory (AREA)

Description

本開示は、概して、データ処理システムに関し、より詳細には、高速メモリインタフェースを有するデータ処理システムで使用されるメモリコントローラに関する。
コンピュータシステムは、通常、安価で高密度のダイナミックランダムアクセスメモリ(DRAM)チップをメインメモリとして使用する。今日販売されている多くのDRAMチップは、半導体技術協会(JEDEC:Joint Electron Devices Engineering Council)によって公布された様々なダブルデータレート(DDR)DRAM規格と互換性がある。DDR DRAMは、高速アクセス回路を有する従来のDRAMメモリセルアレイを使用して、高い転送レートを達成し、メモリバスの利用を改善する。例えば、DDR4 DRAMは、12〜15ナノ秒(ns)のアクセス時間を必要とするメモリセルアレイを使用するが、1.6ギガヘルツ(GHz)のメモリクロック周波数に対応して最大3.2ギガトランスファー毎秒(GT/秒)の速度で大量のデータにアクセスし、データをシリアル化する。転送は、良好な伝送ライン性能のために、オンダイターミネーション(on-die termination)を有する疑似オープンドレイン技術を使用する。そのレートでポイントツーポイントインタフェースを動作させて高速転送を達成することが可能であるが、メモリコントローラがメモリアクセスをスケジュールするのに十分な速度で動作することが、ますます困難になっている。
典型的なDDRメモリコントローラは、待ち状態の読出し及び書込み要求を記憶するためにキューを維持して、メモリコントローラが、待ち状態の要求をアウトオブオーダで選択することによって、効率を高めるのを可能にする。例えば、メモリコントローラは、現在の行をプリチャージし、別の行を繰り返しアクティブにするオーバヘッドを回避するために、メモリの所定ランク内の同じ行に対する複数のメモリアクセス要求(「ページヒット」と呼ばれる)をアウトオブオーダでキューから取り出し、これらの要求を連続してメモリシステムに発行することができる。しかしながら、DDR4等の最新のメモリ技術で利用可能なバス帯域幅を活用しながら、深いキューからのアクセスをスキャン及び取り出すことを、既知のメモリコントローラを用いて達成することが困難になってきている。
いくつかの実施形態による、データ処理システムのブロック図である。 図1のデータ処理システムでの使用に適したアクセラレーテッドプロセッシングユニット(APU)のブロック図である。 いくつかの実施形態による、図2のAPUでの使用に適したメモリコントローラ及び関連する物理インタフェース(PHY)のブロック図である。 いくつかの実施形態による、図2のAPUでの使用に適した他のメモリコントローラ及び関連するPHYのブロック図である。 いくつかの実施形態による、メモリコントローラのブロック図である。 いくつかの実施形態による、図5のアービタとして使用され得るアービタのブロック図である。
以下の説明において、異なる図面において同じ参照番号を使用することは、類似又は同一の項目を示している。特に断らない限り、「接続された」という用語及びこれに関連する動詞形は、当技術分野において既知の手段による直接接続及び間接的な電気接続の両方を含む。特に断らない限り、直接接続の説明は、適切な形態の間接的な電気接続を使用する代替の実施形態をも意味する。
以下の一形態で説明するように、メモリコントローラは、コマンドキューと、アービタと、を含む。コマンドキューは、メモリアクセス要求を受信及び記憶するためのものである。アービタは、コントローラサイクル中にメモリアクセス要求の中から対応する複数のサブアービトレーションの勝者(winner)を提供する複数のサブアービタを含み、複数のサブアービトレーションの勝者の中から何れかを選択して、対応するコントローラサイクルにおいて複数のメモリコマンドを提供する。いくつかの実施形態では、メモリコマンドサイクルは、コントローラサイクルより短くてもよい。例えば、コントローラは、コントローラクロック信号に従って動作する一方で、メモリサイクルは、コントローラクロック信号よりも高い周波数を有するメモリクロック信号によって規定される。複数のサブアービタは、コマンドキュー内のページヒットコマンドの中から第1サブアービトレーション勝者を選択する第1サブアービタと、コマンドキュー内のページ競合コマンドの中から第2サブアービトレーション勝者を選択する第2サブアービタと、コマンドキュー内のページミスコマンドの中から第3サブアービトレーション勝者を選択する第3サブアービタと、を含むことができる。アービタは、第1サブアービトレーション勝者、第2サブアービトレーション勝者、及び、第3サブアービトレーション勝者の中から何れかを選択するための最終アービタ(final arbiter)をさらに含むことができる。
別の形態では、データ処理システムは、複数のメモリアクセス要求を提供するメモリアクセスエージェントと、メモリシステムと、メモリアクセスエージェント及びメモリシステムに接続されたメモリコントローラと、を含む。メモリコントローラは、コマンドキューと、アービタとを含む。コマンドキューは、メモリアクセスエージェントから受信したメモリアクセスコマンドを記憶する。アービタは、コントローラサイクル中にメモリアクセス要求の中から対応する複数のサブアービトレーション勝者を提供し、複数のサブアービトレーション勝者の中から何れかを選択して、対応するコントローラサイクルにおいて複数のメモリコマンドを提供する複数のサブアービタを含む。
さらに別の形態では、性能及び効率を向上させるために、メモリアクセス要求間でアービトレーションを行う方法を使用することができる。複数のメモリアクセス要求が受信され、コマンドキューに記憶される。第1コントローラサイクル中に、メモリアクセス要求の中から複数のサブアービトレーション勝者が選択される。複数のサブアービトレーション勝者の中から複数のメモリコマンドが選択され、対応する複数のメモリコマンドサイクルにおいて提供される。
図1は、いくつかの実施形態によるデータ処理システム100のブロック図である。データ処理システム100は、概して、アクセラレーテッドプロセッシングユニット(APU)の形態のデータプロセッサ110と、メモリシステム120と、周辺機器相互接続エクスプレス(PCIe)システム150と、ユニバーサルシリアルバス(USB)システム160と、ディスクドライブ170と、を含む。データプロセッサ110は、データ処理システム100の中央処理装置(CPU)として動作し、現代のコンピュータシステムにおいて有用な様々なバス及びインタフェースを提供する。これらのインタフェースには、2つのダブルデータレート(DDRx)メモリチャネルと、PCIeリンクへの接続用のPCIeルートコンプレックスと、USBネットワークへの接続用のUSBコントローラと、SATA(Serial Advanced Technology Attachment)大容量記憶デバイスへのインタフェースと、が含まれる。
メモリシステム120は、メモリチャネル130と、メモリチャネル140と、を含む。メモリチャネル130は、本例において別々のランクに対応する代表的なDIMM134,136,138を含む、DDRxバス132に接続されたデュアルインラインメモリモジュール(DIMM)のセットを含む。同様に、メモリチャネル140は、代表的なDIMM144,146,148を含む、DDRxバス142に接続されたDIMMのセットを含む。
PCIeシステム150は、データプロセッサ110内のPCIeルートコンプレックスに接続されたPCIeスイッチ152と、PCIeデバイス154と、PCIeデバイス156と、PCIeデバイス158と、を含む。PCIeデバイス156は、システム基本入出力システム(BIOS)メモリ157に接続されている。システムBIOSメモリ157は、例えばリードオンリメモリ(ROM)、フラッシュEEPROM(electrically erasable programmable ROM)等の様々な不揮発性メモリタイプの何れかであってもよい。
USBシステム160は、データプロセッサ110内のUSBマスタに接続されたUSBハブ162と、USBハブ162にそれぞれ接続された代表的なUSBデバイス164,166,168と、を含む。USBデバイス164,166,168は、例えばキーボード、マウス、フラッシュEEPROMポート等のデバイスであってもよい。
ディスクドライブ170は、SATAバスを介してデータプロセッサ110に接続されており、オペレーティングシステム、アプリケーションプログラム、アプリケーションファイル等のための大容量ストレージを提供する。
データ処理システム100は、メモリチャネル130及びメモリチャネル140を提供することによって、最新のコンピューティングアプリケーションでの使用に適している。各メモリチャネル130,140は、例えばDDRバージョン4(DDR4)、低電力DDR4(LPDDR4)、グラフィックスDDRバージョン5(GDDR5)及び高帯域幅メモリ(HBM)等の最新のDDRメモリに接続されてもよいし、将来のメモリ技術に適応されてもよい。これらのメモリは、高いバス帯域幅及び高速動作を提供する。同時に、これらは、ラップトップコンピュータ等のバッテリ駆動アプリケーションの電力を節約する低電力モードを提供し、組み込み型サーマルモニタリングも提供する。
図2は、図1のデータ処理システム100での使用に適したAPU200のブロック図である。APU200は、概して、中央処理装置(CPU)コアコンプレックス210と、グラフィックスコア220と、ディスプレイエンジン230のセットと、メモリ管理ハブ240と、データファブリック250と、周辺コントローラ260のセットと、周辺バスコントローラ270のセットと、システム管理ユニット(SMU)280と、メモリコントローラ290のセットと、を含む。
CPUコアコンプレックス210は、CPUコア212と、CPUコア214と、を含む。本例において、CPUコアコンプレックス210は2つのCPUコアを含むが、他の実施形態では、CPUコアコンプレックス210は任意の数のCPUコアを含んでもよい。各CPUコア212,214は、制御ファブリックを形成するシステム管理ネットワーク(SMN)及びデータファブリック250に対して双方向に接続されており、メモリアクセス要求をデータファブリック250に提供することができる。各CPUコア212,214は、単一コアであってもよいし、例えばキャッシュ等の特定のリソースを共有する2つ以上の単一コアを有するコアコンプレックスであってもよい。
グラフィックスコア220は、例えば、頂点処理、フラグメント処理、シェーディング、テクスチャブレンド等のグラフィックス操作を、高度に統合された並列形式で実行することの可能な高性能グラフィックス処理ユニット(GPU)である。グラフィックスコア220は、SMN及びデータファブリック250に対して双方向に接続されており、メモリアクセス要求をデータファブリック250に提供することができる。これに関して、APU200は、CPUコアコンプレックス210及びグラフィックスコア220が同じメモリ空間を共有するユニファイドメモリアーキテクチャ、又は、CPUコアコンプレックス210及びグラフィックスコア220がメモリ空間の一部を共有するメモリアーキテクチャをサポートしてもよいが、グラフィックスコア220は、CPUコアコンプレックス210がアクセスできない専用のグラフィックスメモリも使用する。
ディスプレイエンジン230は、グラフィックスコア220によって生成されたオブジェクトをレンダリング及びラスタライズして、モニタに表示する。グラフィックスコア220及びディスプレイエンジン230は、メモリシステム120の適切なアドレスに一様に変換されるために共通のメモリ管理ハブ240に対して双方向に接続されており、メモリ管理ハブ240は、かかるメモリアクセスを生成し、メモリシステムから返された読出しデータを受信するために、データファブリック250に対して双方向に接続されている。
データファブリック250は、任意のメモリアクセスエージェントとメモリコントローラ290との間でメモリアクセス要求及びメモリ応答をルーティングするためのクロスバースイッチを含む。また、データファブリック250は、システム構成に基づくメモリアクセスの宛先と、仮想接続毎のバッファとを判断するためのシステムメモリマップであって、BIOSによって定義されたシステムメモリマップを含む。
周辺コントローラ260は、USBコントローラ262と、SATAインタフェースコントローラ264と、を含み、これらの各々が、システムハブ266及びSMNバスに対して双方向に接続されている。これらの2つのコントローラは、APU200で使用可能な周辺コントローラの単なる例示である。
周辺バスコントローラ270は、システムコントローラ(即ち「サウスブリッジ」(SB))272と、PCIeコントローラ274と、を含み、これらの各々が、入出力(I/O)ハブ276及びSMNバスに対して双方向に接続されている。また、I/Oハブ276は、システムハブ266及びデータファブリック250に対して双方向に接続されている。したがって、例えば、CPUコアは、データファブリック250がI/Oハブ276を介してルーティングするアクセスを通じて、USBコントローラ262、SATAインタフェースコントローラ264、SB272、又は、PCIeコントローラ274内のレジスタをプログラムすることができる。
SMU280は、APU200上のリソースの動作を制御し、それらの間の通信を同期させるローカルコントローラである。SMU280は、APU200上の様々なプロセッサのパワーアップシーケンシングを管理し、リセット、イネーブル及び他の信号を介して複数のオフチップデバイスを制御する。SMU280は、APU200の各コンポーネントにクロック信号を提供するために、図2に示されていない1つ以上のクロック源(例えば位相同期ループ(PLL)等)を含む。また、SMU280は、様々なプロセッサ及び他の機能ブロックの電力を管理し、CPUコア212,214及びグラフィックスコア220から測定された電力消費値を受信して、適切な電力状態を判断してもよい。
また、APU200は、様々なシステムモニタリング及び省電力機能を実装する。特に、1つのシステムモニタリング機能は、サーマルモニタリングである。例えば、SMU280は、APU200が高温になると、CPUコア212,214及び/又はグラフィックスコア220の周波数及び電圧を低減させてもよい。APU200が非常に高温になった場合には、APU200が完全にシャットダウンされてもよい。サーマルイベントは、SMU280によって、外部センサからSMNバスを介して受信されてもよく、SMU280は、これに応じてクロック周波数及び/又は電源電圧を低下させてもよい。
図3は、いくつかの実施形態による、図2のAPU200での使用に適したメモリコントローラ300及び関連する物理インタフェース(PHY)330のブロック図である。メモリコントローラ300は、メモリチャネル310と、電力エンジン320と、を含む。メモリチャネル310は、ホストインタフェース312と、メモリチャネルコントローラ314と、物理インタフェース316と、を含む。ホストインタフェース312は、メモリチャネルコントローラ314を、スケーラブルデータポート(SDP)を介してデータファブリック250に双方向に接続する。物理インタフェース316は、メモリチャネルコントローラ314を、DDR−PHYインタフェース仕様(DFI)に準拠するバスを介してPHY330に双方向に接続する。電力エンジン320は、SMNバスを介してSMU280に双方向に接続されており、APB(Advanced Peripheral Bus)を介してPHY330に双方向に接続されており、メモリチャネルコントローラ314にも双方向に接続されている。PHY330は、例えば図1のメモリチャネル130又はメモリチャネル140等のメモリチャネルに対する双方向接続を有する。メモリコントローラ300は、単一のメモリチャネルコントローラ314を使用した単一のメモリチャネル用のメモリコントローラの例示であり、以下にさらに説明するメモリチャネルコントローラ314の動作を制御するための電力エンジン320を有する。
図4は、いくつかの実施形態による、図2のAPU200での使用に適した別のメモリコントローラ400及び関連するPHY440,450のブロック図である。メモリコントローラ400は、メモリチャネル410,420と、電力エンジン430と、を含む。メモリチャネル410は、ホストインタフェース412と、メモリチャネルコントローラ414と、物理インタフェース416と、を含む。ホストインタフェース412は、メモリチャネルコントローラ414を、SDPを介してデータファブリック250に双方向に接続する。物理インタフェース416は、DFI仕様に準拠しており、メモリチャネルコントローラ414をPHY440に双方向に接続する。メモリチャネル420は、ホストインタフェース422と、メモリチャネルコントローラ424と、物理インタフェース426と、を含む。ホストインタフェース422は、メモリチャネルコントローラ424を、別のSDPを介してデータファブリック250に双方向に接続する。物理インタフェース426は、DFI仕様に準拠しており、メモリチャネルコントローラ424をPHY450に双方向に接続する。電力エンジン430は、SMNバスを介してSMU280に双方向に接続されており、APBを介してPHY440,450に双方向に接続されており、メモリチャネルコントローラ414,424にも双方向に接続されている。PHY440は、例えば図1のメモリチャネル130等のメモリチャネルに対する双方向接続を有する。PHY450は、例えば図1のメモリチャネル140等のメモリチャネルに対する双方向接続を有する。メモリコントローラ400は、2つのメモリチャネルコントローラを有するメモリコントローラの例示であり、共有の電力エンジン430を使用して、以下にさらに説明するように、メモリチャネルコントローラ414及びメモリチャネルコントローラ424の各々の動作を制御する。
図5は、いくつかの実施形態による、メモリコントローラ500のブロック図である。メモリコントローラ500は、メモリチャネルコントローラ510と、電力コントローラ550と、を含む。メモリチャネルコントローラ510は、インタフェース512と、キュー514と、コマンドキュー520と、アドレス生成器522と、コンテンツアドレス可能メモリ(CAM)524と、再生キュー530と、リフレッシュロジックブロック532と、タイミングブロック534と、ページテーブル536と、アービタ538と、エラー訂正コード(ECC)チェックブロック542と、ECC生成ブロック544と、データバッファ(DB)546と、を含む。
インタフェース512は、外部バスを介したデータファブリック250との第1双方向接続と、出力と、を有する。メモリコントローラ500において、この外部バスは、「AXI4」として知られている、英国ケンブリッジのARM Holdings,PLCによって仕様化されたアドバンストエクステンシブルインタフェースバージョン4と互換性があるが、他の実施形態では、他のタイプのインタフェースであってもよい。インタフェース512は、FCLK(又はMEMCLK)ドメインとして知られる第1クロックドメインから、UCLKドメインとして知られるメモリコントローラ500の内部の第2クロックドメインへのメモリアクセス要求を変換する。同様に、キュー514は、UCLKドメインから、DFIインタフェースに関連するDFICLKドメインへのメモリアクセスを提供する。
アドレス生成器522は、データファブリック250からAXI4バスを介して受信したメモリアクセス要求のアドレスを復号化する。メモリアクセス要求は、正規化されたアドレスとして表わされる物理アドレス空間内のアクセスアドレスを含む。アドレス生成器522は、正規化されたアドレスを、メモリシステム120内の実際のメモリデバイスをアドレス指定し、関連するアクセスを効率的にスケジュールするのに使用可能なフォーマットに変換する。このフォーマットは、メモリアクセス要求を特定のランク、行アドレス、列アドレス、バンクアドレス及びバンクグループに関連付ける領域識別子を含む。システムBIOSは、起動時に、メモリシステム120内のメモリデバイスにクエリしてそのサイズ及び構成を判断し、アドレス生成器522に関連する構成レジスタのセットをプログラムする。アドレス生成器522は、構成レジスタに記憶された構成を使用して、正規化されたアドレスを適切なフォーマットに変換する。コマンドキュー520は、データ処理システム100内のメモリアクセスエージェント(例えば、CPUコア212,214及びグラフィックスコア220等)から受信したメモリアクセス要求のキューである。コマンドキュー520は、アドレス生成器522によって復号化されたアドレスフィールドと、アクセスタイプ及びサービス品質(QoS)識別子を含むメモリアクセスをアービタ538が効率的に選択するのを可能にする他のアドレス情報と、を記憶する。CAM524は、例えばライトアフターライト(WAW)及びリードアフターライト(RAW)順序付けルール等の順序付けルールを実施するための情報を含む。
再生キュー530は、例えば、アドレス及びコマンドパリティ応答、DDR4 DRAMの書込み巡回冗長検査(CRC)応答、又は、GDDR5 DRAMの書込み及び読出しCRC応答等の応答を待つアービタ538によって取り出されたメモリアクセスを記憶するための一時的なキューである。再生キュー530は、ECCチェックブロック542にアクセスして、返されたECCが正しいか否か又はエラーを示しているか否かを判別する。再生キュー530は、何れかのサイクルでパリティ又はCRCエラーの場合にアクセスが再生されるのを可能にする。
リフレッシュロジック532は、メモリアクセスエージェントから受信した通常の読出し及び書込みメモリアクセス要求とは別に生成される様々なパワーダウン、リフレッシュ、及び、終端抵抗(ZQ)較正サイクルのためのステートマシンを含む。例えば、メモリランクがプリチャージパワーダウンにある場合には、リフレッシュサイクルを実行するために定期的に起動されなければならない。リフレッシュロジック532は、オートリフレッシュコマンドを定期的に生成して、DRAMチップ内のメモリセルのチャージオフストレージキャパシタのリークによって生じるデータエラーを防止する。さらに、リフレッシュロジック532は、ZQを定期的に較正して、システム内の熱変化によるオンダイ終端抵抗のミスマッチを防止する。また、リフレッシュロジック532は、どの場合にDRAMデバイスを別のパワーダウンモードにするのかを決定する。
アービタ538は、コマンドキュー520に双方向に接続されており、メモリチャネルコントローラ510の中心部分である。アービタ538は、メモリバスの利用を改善するために、インテリジェントなアクセススケジューリングによって効率を改善する。アービタ538は、タイミングブロック534を使用して、コマンドキュー520内の特定のアクセスの発行に適しているか否かをDRAMタイミングパラメータに基づいて判断することによって、適切なタイミング関係を実施する。例えば、各DRAMは、同じバンクへの起動コマンド間の最小指定時間(「tRC」として知られる)を有する。タイミングブロック534は、再生キュー530に双方向に接続されており、このタイミングパラメータ及びJEDEC仕様で指定された他のタイミングパラメータに基づいて適格性を判断するカウンタのセットを維持する。ページテーブル536は、再生キュー530に双方向に接続されており、アービタ538のメモリチャネルの各バンク及びランクのアクティブページに関する状態情報を維持する。
ECC生成ブロック544は、インタフェース512から受信した書込みメモリアクセス要求に応じて、書込みデータに従ってECCを計算する。DB546は、受信したメモリアクセス要求の書込みデータ及びECCを記憶する。アービタ538が、メモリチャネルにディスパッチするための対応する書込みアクセスを選ぶと、DB546は、結合した書込みデータ/ECCをキュー514に出力する。
電力コントローラ550は、アドバンストエクテンシブルインタフェースバージョン1(AXI)へのインタフェース552と、APBインタフェース554と、電力エンジン560と、を含む。インタフェース552は、SMNへの第1双方向接続であって、図5に別に示された「イベント_n」と付されたイベント信号を受信するための入力を含む第1双方向接続と、出力と、を含む。APBインタフェース554は、インタフェース552の出力に接続された入力と、APBを介してPHYに接続するための出力と、を有する。電力エンジン560は、インタフェース552の出力に接続された入力と、キュー514の入力に接続された出力と、を有する。電力エンジン560は、構成レジスタ562のセットと、マイクロコントローラ(μC)564と、セルフリフレッシュコントローラ(SLFREF/PE)566と、信頼性のある読出し/書込みトレーニングエンジン(RRW/TE)568と、を含む。構成レジスタ562は、AXIバスを介してプログラムされており、メモリコントローラ500内の様々なブロックの動作を制御するための構成情報を記憶する。したがって、構成レジスタ562は、図5に詳細に示されていないこれらのブロックに接続された出力を有する。セルフリフレッシュコントローラ566は、リフレッシュロジック532によるリフレッシュの自動生成に加えて、リフレッシュの手動生成を可能にするエンジンである。信頼性のある読出し/書込みトレーニングエンジン568は、DDRインタフェース読出しレイテンシトレーニング及びループバックテスト等の目的のために、連続的なメモリアクセスストリームをメモリ又はI/Oデバイスに提供する。
メモリチャネルコントローラ510は、関連するメモリチャネルへのディスパッチのためにメモリアクセスを選択することを可能にする回路を含む。アドレス生成器522は、所望のアービトレーションの決定を行うために、アドレス情報を、メモリシステム内のランク、行アドレス、列アドレス、バンクアドレス及びバンクグループを含むプリデコードされた情報に復号化し、コマンドキュー520は、プリデコードされた情報を記憶する。構成レジスタ562は、受信したアドレス情報をアドレス生成器522がどのように復号するのかを決定するために、構成情報を記憶する。アービタ538は、復号化されたアドレス情報と、タイミングブロック534によって示されたタイミング適格性情報と、ページテーブル536によって示されたアクティブページ情報と、を使用して、例えばQoS要件等の他の基準を遵守しながらメモリアクセスを効率的にスケジューリングする。例えば、アービタ538は、メモリページを変更するのに必要なプリチャージ及びアクティブ化コマンドのオーバヘッドを避けるために、オープンページへのアクセスを優先し、或るバンクへのオーバヘッドアクセスを、他のバンクへの読出し及び書込みアクセスをインタリーブすることによって隠す。特に、アービタ538は、通常動作中に、異なるページを選択する前にプリチャージされる必要があるまで、異なるバンク内のページオープンを維持することを決定してもよい。
図6は、いくつかの実施形態による、図5のメモリコントローラ500の一部600のブロック図である。この一部600は、アービタ538と、アービタ538の動作に関連する制御回路660のセットと、を含む。アービタ538は、サブアービタ605のセットと、最終アービタ650と、を含む。サブアービタ605は、サブアービタ610と、サブアービタ620と、サブアービタ630と、を含む。サブアービタ610は、「PH ARB」と付されたページヒットアービタ612と、出力レジスタ614と、を含む。ページヒットアービタ612は、コマンドキュー520に接続された第1入力及び第2入力と、出力と、を有する。レジスタ614は、ページヒットアービタ612の出力に接続されたデータ入力と、UCLK信号を受信するためのクロック入力と、出力と、を有する。サブアービタ620は、「PC ARB」と付されたページ競合アービタ622と、出力レジスタ624と、を含む。ページ競合アービタ622は、コマンドキュー520に接続された第1入力及び第2入力と、出力と、を有する。レジスタ624は、ページ競合アービタ622の出力に接続されたデータ入力と、UCLK信号を受信するためのクロック入力と、出力と、を有する。サブアービタ630は、「PM ARB」と付されたページミスアービタ632と、出力レジスタ634と、を含む。ページミスアービタ632は、コマンドキュー520に接続された第1入力及び第2入力と、出力と、を有する。レジスタ634は、ページミスアービタ632の出力に接続されたデータ入力と、UCLK信号を受信するためのクロック入力と、出力と、を有する。最終アービタ650は、リフレッシュロジック532の出力に接続された第1入力と、ページクローズプレディクタ662からの第2入力と、出力レジスタ614の出力に接続された第3入力と、出力レジスタ624の出力に接続された第4入力と、出力レジスタ634の出力に接続された第5入力と、「CMD1」と付された第1出力であって、第1アービトレーション勝者をキュー514に提供するための第1出力と、「CMD2」と付された第2出力であって、第2アービトレーション勝者をキュー514に提供するための第2出力と、を有する。
制御回路660は、図5に関して上述したように、タイミングブロック534と、ページテーブル536と、ページクローズプレディクタ662と、を含む。タイミングブロック534は、入力と、ページヒットアービタ612、ページ競合アービタ622及びページミスアービタ632の各々の第1入力に接続された出力と、を有する。ページテーブル534は、再生キュー530の出力に接続された入力と、再生キュー530の入力に接続された出力と、コマンドキュー520の入力に接続された出力と、タイミングブロック534の入力に接続された出力と、ページクローズプレディクタ662の入力に接続された出力と、を有する。ページクローズプレディクタ662は、ページテーブル536の1つの出力に接続された入力と、出力レジスタ614の出力に接続された入力と、最終アービタ650の第2入力に接続された出力と、を有する。
アービタ538は、動作中、各エントリのページ状態、各メモリアクセス要求の優先度、及び、要求間の依存関係を考慮することによって、メモリアクセス要求(コマンド)をコマンドキュー520及びリフレッシュロジック532から選択する。優先度は、AXI4バスから受信されコマンドキュー520に記憶された要求のサービス品質(即ちQoS)に関連するが、メモリアクセスのタイプ、及び、アービタ538のダイナミック動作に基づいて変更され得る。アービタ538は、既存の集積回路技術の処理制限と伝送制限との間の不整合に対処するために並行して動作する3つのサブアービタを含む。各サブアービトレーションの勝者は、最終アービタ650に提示される。最終アービタ650は、これらの3つのサブアービトレーション勝者のうち何れかを、リフレッシュロジック532からのリフレッシュ動作と同様に選択し、読出し又は書込みコマンドを、ページクローズプレディクタ662によって決定された自動プリチャージ付き読出し又は書込みコマンドにさらに変更してもよい。
ページヒットアービタ612、ページ競合アービタ622及びページミスアービタ632の各々は、タイミングブロック534の出力に接続された入力を有しており、これらの各々のカテゴリに入るコマンドキュー520内のコマンドのタイミング適格性を判断する。タイミングブロック534は、各ランクの各バンクの特定の動作に関連する期間をカウントするバイナリカウンタのアレイを含む。状態を判断するのに必要なタイマの数は、タイミングパラメータ、所定のメモリタイプのバンク数、及び、所定のメモリチャネル上のシステムによってサポートされるランク数に依存する。次に、順番に実装されるタイミングパラメータの数は、システムに実装されるメモリのタイプに依存する。例えば、GDDR5メモリは、他のDDRxメモリタイプよりも多くのタイミングパラメータに対応するために、より多くのタイマを必要とする。タイミングブロック534は、バイナリカウンタとして実装されたジェネリックタイマのアレイを含むことによって、異なるメモリタイプに対して調整され、再利用され得る。
ページヒットは、オープンページに対する読出し又は書込みサイクルである。ページヒットアービタ612は、オープンページに対するコマンドキュー520内のアクセス間のアービトレーションを行う。タイミングブロック534内のタイマによって追跡され、ページヒットアービタ612によってチェックされるタイミング適格性パラメータは、例えば、列アドレスストローブ(CAS)に対する行アドレスストローブ(RAS)の遅延時間(tRCD)及びCASレイテンシ(tCL)を含む。例えば、tRCDは、RASサイクルでページが開かれた後に当該ページに読出し又は書込みアクセスする前に経過する必要がある最小時間を指定する。ページヒットアービタ612は、アクセスの割り当てられた優先度に基づいて、サブアービトレーション勝者を選択する。一実施形態では、優先度は4ビットのワンホット値であり、4つの値の中で優先度を示しているが、この4つのレベルの優先度スキームが単なる一例に過ぎないことは明らかである。ページヒットアービタ612が同じ優先度レベルで2つ以上の要求を検出した場合、最も古いエントリが勝者となる。
ページ競合は、バンク内の他の行が現在アクティブ化されているときの当該バンク内の或る行へのアクセスである。ページ競合アービタ622は、対応するバンク及びランクで現在オープンのページと競合するページに対するコマンドキュー520内のアクセス間のアービトレーションを行う。ページ競合アービタ622は、プリチャージコマンドの発行を引き起こすサブアービトレーション勝者を選択する。タイミングブロック534でタイマによって追跡され、ページ競合アービタ622によってチェックされるタイミング適格性パラメータは、例えば、active to prechargeコマンド期間(tRAS)を含む。ページ競合アービタ622は、アクセスの割り当てられた優先度に基づいて、サブアービトレーション勝者を選択する。ページ競合アービタ622が同じ優先度レベルで2つ以上の要求を検出した場合、最も古いエントリが勝者となる。
ページミスは、プリチャージ状態にあるバンクへのアクセスである。ページミスアービタ632は、プリチャージされたメモリバンクに対するコマンドキュー520内のアクセス間のアービトレーションを行う。タイミングブロック534でタイマによって追跡され、ページミスアービタ632によってチェックされるタイミング適格性パラメータは、例えば、prechargeコマンド期間(tRP)を含む。同じ優先度レベルでページミスである2つ以上の要求が存在する場合、最も古いエントリが勝者となる。
各サブアービタは、各々のサブアービトレーション勝者の優先度値を出力する。最終アービタ650は、ページヒットアービタ612、ページ競合アービタ622及びページミスアービタ632の各々からのサブアービトレーション勝者の優先度値を比較する。最終アービタ650は、一度に2つのサブアービトレーション勝者を考慮して、相対優先度比較のセットを実行することによって、サブアービトレーション勝者間の相対優先度を決定する。
最終アービタ650は、3つのサブアービトレーション勝者間の相対優先度を決定した後に、サブアービトレーション勝者が競合するか否か(即ち、それらが同じバンク及びランクを対象としているかどうか)を判断する。かかる競合がない場合、最終アービタ650は、最高の優先度を有する最大2つのサブアービトレーション勝者を選択する。競合が生じた場合、最終アービタ650は、以下のルールに従う。最終アービタ650は、ページヒットアービタ612のサブアービトレーション勝者の優先度値がページ競合アービタ622の優先度値よりも高く、これらが両方とも同じバンク及びランクに対するものである場合に、ページヒットアービタ612によって示されたアクセスを選択する。最終アービタ650は、ページ競合アービタ622のサブアービトレーション勝者の優先度値がページヒットアービタ612の優先度値よりも高く、これらが両方とも同じバンク及びランクに対するものである場合に、いくつかの追加要因に基づいて勝者を選択する。場合によっては、ページクローズプレディクタ662は、自動プリチャージ属性を設定することによって、ページヒットアービタ612によって示されたアクセスの終了時にページを閉じる。
ページヒットアービタ612内では、優先度は、メモリアクセスエージェントからの要求優先度によって最初に設定されるが、アクセスのタイプ(読出し又は書込み)及びアクセスのシーケンスに基づいて動的に調整される。概して、ページヒットアービタ612は、読出しに対してより高い暗黙の優先度を割り当てるが、書込みが完了に向けて進行するのを保証するための優先度上昇メカニズムを実装する。
ページクローズプレディクタ662は、ページヒットアービタ612が読出し又は書込みコマンドを選択すると、自動プリチャージ(AP)属性を有するコマンドを送信するか否かを決定する。読出し又は書込みサイクル中、自動プリチャージ属性は、事前に定義されたアドレスビットで設定されており、読出し又は書込みサイクルが完了した後に自動プリチャージ属性によってDDRデバイスがページを閉じることによって、メモリコントローラが後でそのバンクに対して別個のプリチャージコマンドを送信する必要性を回避する。ページクローズプレディクタ662は、選択されたコマンドと同じバンクにアクセスする他の要求であって、コマンドキュー520内に既に存在する他のリクエストを考慮する。ページクローズプレディクタ662がメモリアクセスをAPコマンドに変換する場合には、そのページへの次のアクセスはページミスとなる。
アービタ538は、メモリコントローラクロックサイクル毎に1つのコマンド又は2つのコマンドの何れかの発行をサポートする。例えば、DDR4 3200は、1600MHzのメモリクロック周波数で動作するDDR4 DRAMのスピードビンである。集積回路処理技術によって、メモリコントローラ500が1600MHzで動作することができる場合、メモリコントローラ500は、メモリコントローラクロックサイクル毎に1つのメモリアクセスを発行することができる。この場合、最終アービタ650は、メモリコントローラクロックサイクル毎に単一のアービトレーション勝者のみを選択する1Xモードで動作することができる。
但し、DDR4 3600又はLPDDR4 4667等の高速メモリの場合、1600MHzのメモリコントローラのクロック速度は、メモリバスの全帯域幅を使用するには遅すぎる場合がある。アービタ538は、これらの高性能のDRAMに対応するために、最終アービタ650がメモリコントローラクロックサイクル毎に2つのコマンド(CMD1及びCMD2)を選択する2Xモードをサポートする。アービタ538は、このモードを提供して、各サブアービタがより遅いメモリコントローラクロックを使用して並列に動作することを可能にする。図6に示すように、アービタ538は3つのサブアービタを含み、2Xモードでは、最終アービタ650は、3つの勝者のうち最適な2つの勝者として2つのアービトレーション勝者を選択する。
2Xモードでは、メモリコントローラ500は、最高速度よりも遅いメモリコントローラクロック速度で動作して、メモリコントローラコマンド生成をメモリクロックサイクルに合わせることが可能であることに留意されたい。メモリコントローラが、最大1600MHzのクロック速度で動作可能なDDR4 3600の例では、クロック速度を、2Xモードにおいて900MHzまで低減することができる。
異なるメモリアクセスタイプに対して異なるサブアービタを使用することによって、各アービタは、全てのアクセスタイプ(ページヒット、ページミス及びページ競合)間のアービトレーションを行うことが必要な場合よりも単純なロジックで実装され得る。したがって、アービトレーションロジックを単純化することができ、アービタ538のサイズを比較的小さく保つことができる。ページヒット、ページ競合及びページミスのためにサブアービタを使用することによって、アービタ538は、データ転送を伴うアクセスのレイテンシを隠すために、互いに適したペアとなる2つのコマンドの選択を可能にする。
他の実施形態では、アービタ538は、2Xモードをサポートするために少なくとも2つのサブアービタを有する限り、異なる数のサブアービタを含むことができる。例えば、アービタ538は、4つのサブアービタを含んでもよく、メモリコントローラクロックサイクル毎に最大4つのアクセスが選択されるのを可能にする。さらに他の実施形態では、アービタ538は、任意の単一タイプの2つ以上のサブアービタを含むことができる。例えば、アービタ538は、2つ以上のページヒットアービタ、2つ以上のページ競合アービタ、及び/又は、2つ以上のページミスアービタを含むことができる。この場合、アービタ538は、各コントローラサイクルで同じタイプの2つ以上のアクセスを選択することができる。
図5及び図6の回路は、ハードウェア及びソフトウェアの様々な組み合わせで実装されてもよい。例えば、ハードウェア回路は、プライオリティエンコーダ、有限ステートマシン、プログラマブルロジックアレイ(PLA)等を含んでもよく、アービタ538は、待ち状態のコマンドの相対タイミング適格性を評価するために、記憶されたプログラム命令を実行するマイクロコントローラで実装され得る。この場合、いくつかの命令は、マイクロコントローラによる実行のために、非一時的なコンピュータメモリ又はコンピュータ可読記憶媒体に記憶されてもよい。様々な実施形態では、非一時的なコンピュータ可読記憶媒体は、磁気若しくは光ディスク記憶デバイス、例えばフラッシュメモリ等のソリッドステート記憶デバイス、又は、他の不揮発性メモリデバイスを含む。非一時的なコンピュータ可読記憶媒体に記憶されたコンピュータ可読命令は、ソースコード、アセンブリ言語コード、オブジェクトコード、又は、1つ以上のプロセッサによって解釈及び/若しくは実行可能な他の命令フォーマットであってもよい。
図1のAPU110、図5のメモリコントローラ500又はこれらの一部(例えば、アービタ538等)は、プログラムによって読出され、集積回路を製造するために直接的若しくは間接的に使用されるデータベース又は他のデータ構造の形態のコンピュータアクセス可能なデータ構造によって記述されてもよいし表現されてもよい。例えば、このデータ構造は、例えばVerilog又はVHDL等の高水準設計言語(HDL)におけるハードウェア機能の動作レベル記述であってもよいし、レジスタ転送レベル(RTL)記述であってもよい。記述は、ゲートのリストを含むネットリストを合成ライブラリから生成するために当該記述を合成し得る合成ツールによって読出されてもよい。ネットリストは、集積回路を含むハードウェアの機能を表すゲートのセットを含む。そして、ネットリストを配置及びルーティングして、マスクに適用される幾何学的形状を記述するデータセットを生成してもよい。マスクは、集積回路を製造するために様々な半導体製造工程で使用されてもよい。或いは、コンピュータアクセス可能な記憶媒体上のデータベースは、所望により、ネットリスト(合成ライブラリ有り若しくは無し)又はデータセットであってもよいし、グラフィックデータシステム(GDS)IIデータであってもよい。
特定の実施形態について説明してきたが、これらの実施形態に対する様々な修正が当業者には明らかであろう。例えば、メモリチャネルコントローラ510及び/又は電力エンジン550の内部アーキテクチャは、異なる実施形態において変更することができる。メモリコントローラ500は、例えば高帯域幅メモリ(HBM)、RAMバスDRAM(RDRAM)等のようなDDRxメモリ以外の他のタイプのメモリにインタフェースすることができる。例示された実施形態では、別々のDIMMに対応するメモリの各ランクを示したが、他の実施形態では、各DIMMは複数のランクをサポートすることができる。
1つの形態では、本明細書に開示されたメモリコントローラは、コマンドキューと、複数のサブアービタを含むアービタと、を備える。1つの態様によれば、複数のサブアービタは、第1サブアービトレーション勝者、第2サブアービトレーション勝者及び第3サブアービトレーション勝者を提供するための第1サブアービタ、第2サブアービタ及び第3サブアービタと、2つの最終アービトレーション勝者を選択するための最終アービタと、を含み、最終アービタは、第1アービトレーション勝者、第2アービトレーション勝者及び第3アービトレーション勝者とオーバヘッドコマンドとから、2つの最終アービトレーション勝者を選択する。この場合、オーバヘッドコマンドは、パワーダウンコマンド、オートリフレッシュコマンド及び較正コマンドのうち何れかを含んでもよい。
別の形態では、本明細書に開示されたメモリコントローラは、メモリアクセスエージェントと、メモリシステムと、メモリアクセスエージェント及びメモリシステムに接続されたメモリコントローラと、を含むデータ処理システムの一部である。
さらに別の形態では、方法は、複数のメモリアクセス要求を受信することと、複数のメモリアクセス要求をコマンドキューに記憶することと、コマンドキューからメモリアクセス要求を選択することであって、第1コントローラサイクル期間中にメモリアクセス要求の中から複数のサブアービトレーション勝者を選択することと、対応する複数のメモリコマンドサイクルにおいて複数のコマンドを提供するために複数のサブアービトレーション勝者の中から何れかを選択することとを含む、ことと、を含む。1つの態様によれば、方法は、対応する第2の複数のメモリサイクルにおいて第2の複数のメモリコマンドを提供するために、複数のサブアービトレーション勝者の何れかと、オーバーヘッドコマンドとを選択することと、オーバヘッドコマンドを、パワーダウンコマンド、オートリフレッシュコマンド及び較正コマンドのうち何れかとして提供することと、をさらに含む。別の態様によれば、複数のメモリコマンドを提供するために、複数のサブアービトレーション勝者の中から何れかを選択することは、対応する複数のメモリコマンドサイクルにおいて複数のメモリコマンドを提供するために、複数のサブアービトレーション勝者の中から何れかを選択することを含み、メモリコマンドサイクルは、コントローラサイクルよりも短い。さらに別の態様によれば、第1コントローラサイクル中に、メモリアクセス要求の中から複数のサブアービトレーション勝者を選択することは、第1コントローラサイクル中に、メモリアクセス要求の中から同じタイプの第1の複数のサブアービトレーション勝者を選択することを含み、方法は、第1コントローラサイクル中に、同じタイプの2つの最終アービトレーション勝者を選択することをさらに含む。
したがって、添付の特許請求の範囲によって、開示された実施形態の範囲内に含まれる、開示された実施形態の全ての変更を包含することが意図される。

Claims (14)

  1. メモリコントローラ(500)であって、
    メモリアクセス要求を受信し、記憶するコマンドキュー(520)と、
    コントローラサイクル中に前記メモリアクセス要求の中から対応する複数のサブアービトレーション勝者を提供する複数のサブアービタ(605)と、複数のメモリコマンドをメモリに提供するために、対応するコントローラサイクルにおいて前記複数のサブアービトレーション勝者の中から複数の最終アービトレーション勝者を選択する最終アービタ(650)と、を備えるアービタ(538)と、を備え、
    メモリコマンドサイクルは前記対応するコントローラサイクルよりも短く、
    前記メモリコントローラは、前記最終アービタによって選択された前記複数の最終アービトレーション勝者を前記複数のメモリコマンドとして、対応するメモリコマンドサイクルで前記メモリに提供する、
    メモリコントローラ(500)。
  2. 前記コントローラサイクルは、コントローラクロック信号によって定義され、
    前記メモリコマンドサイクルは、メモリクロック信号によって定義され、
    前記メモリクロック信号は、前記コントローラクロック信号よりも高い周波数を有する、
    請求項1のメモリコントローラ(500)。
  3. 前記複数のサブアービタ(605)は、
    前記コマンドキュー(520)に接続された第1サブアービタ(610)であって、コントローラクロック信号に同期して、前記コマンドキュー(520)内のアクティブエントリの中から第1サブアービトレーション勝者を決定する第1サブアービタ(610)と、
    前記コマンドキュー(520)に接続された第2サブアービタ(620)であって、前記コントローラクロック信号に同期して、前記コマンドキュー(520)内の前記アクティブエントリの中から前記第1サブアービトレーション勝者とは異なる第2サブアービトレーション勝者を決定する第2サブアービタ(620)と、を備え、
    前記メモリコントローラ(500)は、メモリクロック信号の第1サイクルにおいて前記第1サブアービトレーション勝者を第1メモリコマンドとして出力し、前記メモリクロック信号の後続のサイクルにおいて前記第2サブアービトレーション勝者を第2メモリコマンドとして出力するように動作し、前記メモリクロック信号の周波数は、前記コントローラクロック信号の周波数よりも高い、
    請求項1のメモリコントローラ(500)。
  4. 前記複数のサブアービタ(605)は、
    前記コマンドキュー(520)に接続された第3サブアービタ(630)であって、前記コントローラクロック信号に同期して、前記コマンドキュー(520)内のアクティブエントリの中から第3サブアービトレーション勝者を決定する第3サブアービタ(630)を備える、
    請求項3のメモリコントローラ(500)。
  5. 前記最終アービタ(650)は、
    前記第1サブアービトレーション勝者、前記第2サブアービトレーション勝者及び前記第3サブアービトレーション勝者の中から2つの最終アービトレーション勝者を選択し、前記2つの最終アービトレーション勝者を前記第1メモリコマンド及び前記第2メモリコマンドとして提供する、
    請求項4のメモリコントローラ(500)。
  6. 前記複数のサブアービタ(605)は、前記第1サブアービタ(610)、前記第2サブアービタ(620)及び前記第3サブアービタ(630)のうち何れかと同じタイプの少なくとも1つの他のサブアービタを備え、
    前記最終アービタ(650)は、前記対応するコントローラサイクルにおいて前記複数のサブアービタ(605)の中から前記同じタイプの2つのサブアービタからの2つの最終アービトレーション勝者を選択する、
    請求項5のメモリコントローラ(500)。
  7. 前記第1サブアービタ(610)は、前記コマンドキュー(520)内のページヒットメモリアクセス要求から前記第1サブアービトレーション勝者を選択し、
    前記第2サブアービタ(620)は、前記コマンドキュー(520)内のページ競合メモリアクセス要求から前記第2サブアービトレーション勝者を選択し、
    前記第3サブアービタ(630)は、前記コマンドキュー(520)内のページミスメモリアクセス要求から前記第3サブアービトレーション勝者を選択する、
    請求項4のメモリコントローラ(500)。
  8. 前記複数のサブアービタ(605)の各々は、前記コマンドキュー(520)内の関連するタイプのメモリアクセス要求の中からサブアービトレーション勝者を選択し、
    前記複数のサブアービタ(605)のうち少なくとも2つは、同じタイプのサブアービトレーション勝者を選択し、
    前記アービタ(538)は、前記対応するコントローラサイクルにおいて前記複数のサブアービトレーション勝者の中から前記同じタイプの2つの最終アービトレーション勝者を選択する、
    請求項1のメモリコントローラ(500)。
  9. メモリアクセス要求を提供するメモリアクセスエージェント(110,210,220)と、
    メモリシステム(120)と、
    請求項1〜8の何れかのメモリコントローラと、を備える、
    データ処理システム(100)。
  10. 前記メモリアクセスエージェントは、
    中央処理ユニットコア(212,214)と、
    グラフィックス処理ユニットコア(220)と、
    前記中央処理ユニットコア(212,214)及び前記グラフィックス処理ユニットコア(220)を前記メモリコントローラ(500)に相互接続するデータファブリック(250)と、を備える、
    請求項9のデータ処理システム(100)。
  11. メモリコントローラによって用いられる方法であって、
    複数のメモリアクセス要求を受信することと、
    前記複数のメモリアクセス要求をコマンドキュー(520)に記憶することと、
    前記コマンドキュー(520)からメモリアクセス要求を選択することであって、第1コントローラサイクル中に前記メモリアクセス要求の中からそれぞれのサブアービトレーションの複数のサブアービトレーション勝者を選択することと、複数の最終アービトレーション勝者に対応する複数のメモリコマンドをメモリに提供するために、対応するコントローラサイクルにおいて前記複数のサブアービトレーション勝者の中から前記複数の最終アービトレーション勝者を選択することとを含む、ことと、を含み、
    メモリコマンドサイクルは前記対応するコントローラサイクルよりも短い、
    方法。
  12. 前記複数のサブアービトレーション勝者を選択することは、
    前記コマンドキュー(520)内のページヒットコマンドから第1サブアービトレーション勝者を選択することと、
    前記コマンドキュー(520)内のページ競合コマンドから第2サブアービトレーション勝者を選択することと、
    前記コマンドキュー(520)内のページミスコマンドから第3サブアービトレーション勝者を選択することと、を含む、
    請求項11の方法。
  13. 前記コマンドキュー内の前記ページヒットコマンド、前記ページ競合コマンド及び前記ページミスコマンドのうち何れかから第4サブアービトレーション勝者を選択することと、
    前記第1コントローラサイクルにおいて、前記第1サブアービトレーション勝者、前記第2サブアービトレーション勝者、前記第3サブアービトレーション勝者及び前記第4サブアービトレーション勝者の中から同じタイプの2つの最終アービトレーション勝者を選択することと、を含む、
    請求項12の方法。
  14. 対応するコントローラサイクルにおいて第2の複数のメモリコマンドを前記メモリに提供するために、前記複数のサブアービトレーション勝者の中から何れかとオーバヘッドコマンドとを選択することを含む、
    請求項11の方法。
JP2018524749A 2016-07-15 2016-09-22 高速メモリインタフェースのためのコマンドアービトレーション Active JP6840145B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/211,815 2016-07-15
US15/211,815 US10684969B2 (en) 2016-07-15 2016-07-15 Command arbitration for high speed memory interfaces
PCT/US2016/053131 WO2018013157A1 (en) 2016-07-15 2016-09-22 Command arbitration for high speed memory interfaces

Publications (3)

Publication Number Publication Date
JP2019525271A JP2019525271A (ja) 2019-09-05
JP2019525271A5 JP2019525271A5 (ja) 2019-11-07
JP6840145B2 true JP6840145B2 (ja) 2021-03-10

Family

ID=60940659

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018524749A Active JP6840145B2 (ja) 2016-07-15 2016-09-22 高速メモリインタフェースのためのコマンドアービトレーション

Country Status (5)

Country Link
US (1) US10684969B2 (ja)
JP (1) JP6840145B2 (ja)
KR (1) KR102442078B1 (ja)
CN (1) CN107924375B (ja)
WO (1) WO2018013157A1 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10037150B2 (en) * 2016-07-15 2018-07-31 Advanced Micro Devices, Inc. Memory controller with virtual controller mode
CN110729006B (zh) * 2018-07-16 2022-07-05 超威半导体(上海)有限公司 存储器控制器中的刷新方案
US11126375B2 (en) * 2019-07-18 2021-09-21 Micron Technology, Inc. Arbiter circuit for commands from multiple physical functions in a memory sub-system
US11200106B2 (en) * 2019-08-12 2021-12-14 Advanced Micro Devices, Inc. Data integrity for persistent memory systems and the like
US20210200695A1 (en) * 2019-12-27 2021-07-01 Advanced Micro Devices, Inc. Staging memory access requests
US12056065B2 (en) * 2020-03-13 2024-08-06 Altera Corporation Orthogonal multi-phase scheduling circuitry
US11222685B2 (en) * 2020-05-15 2022-01-11 Advanced Micro Devices, Inc. Refresh management for DRAM
US11625352B2 (en) * 2020-06-12 2023-04-11 Advanced Micro Devices, Inc. DRAM command streak management
CN111984387B (zh) * 2020-08-26 2024-06-25 上海兆芯集成电路股份有限公司 用于调度发布队列中指令的方法及处理器
CN112466361B (zh) * 2020-11-25 2023-11-21 海光信息技术股份有限公司 一种dimm的数据初始化方法、装置、系统及设备
US11379388B1 (en) * 2021-03-31 2022-07-05 Advanced Micro Devices, Inc. Credit scheme for multi-queue memory controllers
US11687281B2 (en) * 2021-03-31 2023-06-27 Advanced Micro Devices, Inc. DRAM command streak efficiency management
US11669274B2 (en) 2021-03-31 2023-06-06 Advanced Micro Devices, Inc. Write bank group mask during arbitration
US11995008B2 (en) * 2021-06-22 2024-05-28 Advanced Micro Devices, Inc. Memory controller with hybrid DRAM/persistent memory channel arbitration
US11755246B2 (en) * 2021-06-24 2023-09-12 Advanced Micro Devices, Inc. Efficient rank switching in multi-rank memory controller
US12073114B2 (en) * 2021-09-30 2024-08-27 Advanced Micro Devices, Inc. Stacked command queue
US12117945B2 (en) 2022-06-24 2024-10-15 Advanced Micro Devices, Inc. Memory controller with pseudo-channel support
US20240005971A1 (en) * 2022-06-29 2024-01-04 Advanced Micro Devices, Inc. Channel and sub-channel throttling for memory controllers
US20240078017A1 (en) * 2022-09-01 2024-03-07 Advanced Micro Devices, Inc. Memory controller and near-memory support for sparse accesses
US12079144B1 (en) 2022-09-21 2024-09-03 Apple Inc. Arbitration sub-queues for a memory circuit
CN115632665B (zh) * 2022-12-20 2023-07-14 苏州浪潮智能科技有限公司 一种存储校验的系统和服务器
CN116974963B (zh) * 2023-09-25 2023-12-15 上海云豹创芯智能科技有限公司 一种访问存储器的装置及其方法、芯片、存储介质

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6138197A (en) * 1998-09-17 2000-10-24 Sun Microsystems, Inc. Apparatus and method for limit-based arbitration scheme
US6295586B1 (en) 1998-12-04 2001-09-25 Advanced Micro Devices, Inc. Queue based memory controller
US6804758B2 (en) 2001-06-29 2004-10-12 Xgi Technology Inc. Method for adaptive arbitration of requests for memory access in a multi-stage pipeline engine
US7426621B2 (en) 2005-12-09 2008-09-16 Advanced Micro Devices, Inc. Memory access request arbitration
US7617368B2 (en) 2006-06-14 2009-11-10 Nvidia Corporation Memory interface with independent arbitration of precharge, activate, and read/write
US8271746B1 (en) * 2006-11-03 2012-09-18 Nvidia Corporation Tiering of linear clients
US7734856B2 (en) 2007-08-22 2010-06-08 Lantiq Deutschland Gmbh Method for operating a plurality of arbiters and arbiter system
US9195618B2 (en) 2009-06-16 2015-11-24 Nvidia Corporation Method and system for scheduling memory requests
US8615629B2 (en) 2010-01-18 2013-12-24 Marvell International Ltd. Access scheduler
US8838853B2 (en) * 2010-01-18 2014-09-16 Marvell International Ltd. Access buffer
US8285892B2 (en) 2010-05-05 2012-10-09 Lsi Corporation Quantum burst arbiter and memory controller
US8977819B2 (en) 2010-09-21 2015-03-10 Texas Instruments Incorporated Prefetch stream filter with FIFO allocation and stream direction prediction
US9911477B1 (en) * 2014-04-18 2018-03-06 Altera Corporation Memory controller architecture with improved memory scheduling efficiency
US9697118B1 (en) * 2015-12-09 2017-07-04 Nxp Usa, Inc. Memory controller with interleaving and arbitration scheme

Also Published As

Publication number Publication date
US10684969B2 (en) 2020-06-16
CN107924375B (zh) 2023-08-08
KR102442078B1 (ko) 2022-09-08
KR20190022428A (ko) 2019-03-06
US20180018291A1 (en) 2018-01-18
JP2019525271A (ja) 2019-09-05
CN107924375A (zh) 2018-04-17
WO2018013157A1 (en) 2018-01-18

Similar Documents

Publication Publication Date Title
JP6840145B2 (ja) 高速メモリインタフェースのためのコマンドアービトレーション
JP6761873B2 (ja) セルフリフレッシュステートマシンmopアレイ
CN110729006B (zh) 存储器控制器中的刷新方案
JP2019521448A (ja) ストリーク及び読出し/書込みトランザクション管理を有するメモリコントローラアービタ
US11494316B2 (en) Memory controller with a plurality of command sub-queues and corresponding arbiters
JP6761870B2 (ja) 低電力メモリのスロットリング
JP7521132B2 (ja) アービトレーション中の書き込みバンクグループのマスク
US11755246B2 (en) Efficient rank switching in multi-rank memory controller
KR20230004912A (ko) 효율적인 메모리 버스 관리
US11625352B2 (en) DRAM command streak management
EP3270294B1 (en) Command arbitration for high-speed memory interfaces
JP2024528414A (ja) ハイブリッドdram/永続メモリチャネルアービトレーションを有するメモリコントローラ
US20220317928A1 (en) Dram command streak efficiency management

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181030

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190611

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190924

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190924

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20190924

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20190926

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200325

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200804

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201030

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210119

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210216

R150 Certificate of patent or registration of utility model

Ref document number: 6840145

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250