JP2004326633A - 階層型メモリシステム - Google Patents

階層型メモリシステム Download PDF

Info

Publication number
JP2004326633A
JP2004326633A JP2003123132A JP2003123132A JP2004326633A JP 2004326633 A JP2004326633 A JP 2004326633A JP 2003123132 A JP2003123132 A JP 2003123132A JP 2003123132 A JP2003123132 A JP 2003123132A JP 2004326633 A JP2004326633 A JP 2004326633A
Authority
JP
Japan
Prior art keywords
memory
cache
interrupt
cpu
hierarchical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003123132A
Other languages
English (en)
Inventor
Koji Hosoki
浩二 細木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2003123132A priority Critical patent/JP2004326633A/ja
Publication of JP2004326633A publication Critical patent/JP2004326633A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Memory System Of A Hierarchy Structure (AREA)

Abstract

【課題】単一の主記憶を持つ階層型メモリシステムにおいて、主記憶のスループット低下とレイテンシ増加を低減し、データ転送性能を向上する。
【解決手段】第1のCPUとローカルメモリを有するプロセッサエレメントと、プロセッサエレメントと主記憶との間に配置する第1のキャッシュメモリと、第1のキャッシュメモリに直接アクセス可能な第2のCPUを持ち、第2のCPUはプロセッサエレメントからの割込み処理を受け付ける手段と、第2のCPUは主記憶の行アドレスミスが発生しにくいように記述された割込み処理ルーチンに従い、あらかじめプロセッサエレメントが必要とするデータを第1のキャッシュメモリに転送する手段を持つことにより、ランダムな主記憶へのアクセスパターンを排除し、行アドレスミスの発生しない主記憶アクセスが可能とし、高いスループットと低いレイテンシの両方を得る。
【選択図】 図7

Description

【0001】
【発明の属する技術分野】
本発明は、主記憶、キャッシュメモリおよびプロセッサを有する階層型メモリ・システムに係り、特に、主記憶アクセスを効率的に行うための技術に関する。
【0002】
【従来の技術】
画像処理など実時間処理という高い処理能力が必要なメディア処理では、固定機能のMPEG専用LSI等、ハードワイヤによる専用チップ等が用いられていたが、近年、メディア演算器を含むメディア・プロセッサを使用した、ソフトウェアによるアプローチが注目されている。このソフトウェアによるアプローチにより、一つのLSIにて多種の応用に対応可能で、画像処理や音声処理などの異なった機能を1チップ上にて実現できる。
【0003】
さらに、このメディア処理に加え、画像表示やネットワーク接続などの機能を一つのプロセッサに組込みむという、組込み型LSIが主流となりつつある。
【0004】
このような組込み型LSIによるアプローチでは、ユニファイドメモリが使用される。これは、LSIに一つの主記憶を接続し、LSI内に配置された全エージェントが、この一つの主記憶を共有使用するもので、LSIのポート数を削減することにより、システムのトータルコストを削減できる。
【0005】
また、近年の製造技術の微細化により、LSIは益々高速化の道を辿っている。これに対し、DRAMなどの主記憶の動作速度向上は進んでおらず、LSIの動作速度との速度比は益々大きくなる。これを回避するため、動作速度向上ではなく、DDR−シンクロナスDRAMなどの使用によるスループット向上というアプローチが採られている。これは、処理速度ではなく、総データ転送量を大きくするという方式で、同一行アドレスへのアクセスは、ウェイトなしでアクセス可能なバーストモードの使用により、データ転送量を大きくするものである。
【0006】
このような主記憶のスループット向上を効果的に利用するには、階層型キャッシュメモリを使用した方式が採られる。
【0007】
特開平5−73415号公報に記載の技術では、汎用処理を実行するプロセッサと主記憶の間に1次キャッシュと2次キャッシュが接続され、プロセッサのアクセスは、まず1次キャッシュに行い、1次キャッシュにそのデータが格納されていない場合は、2次キャッシュをアクセスし、2次キャッシュにもデータが格納されていないときに初めて主記憶をアクセスすることにより、主記憶への余分なアクセスを排除して性能を向上させている。
【0008】
更に、特開平9−128293号公報に記載の技術では、ソフトウェアにより1次キャッシュや2次キャッシュに対してプリフェッチを行うことが可能で、実際にプロセッサがデータを使用する前に、キャッシュメモリへのプリフェッチが完了することにより、主記憶の処理速度を相対的に向上させる方式が採られている。
【0009】
【特許文献1】
特開平5−73415号公報
【特許文献2】
特開平9−128293号公報
【0010】
【発明が解決しようとする課題】
先に示した従来の技術では、遅い主記憶へのアクセス時間を、高いスループットに置換えることにより、性能向上を実現している。
【0011】
しかしながら、ユニファイドメモリによる主記憶を使用した組込み型LSIでは、複数のエージェントがランダムに一つの主記憶をアクセスするため、主記憶の行アドレスミスが頻発する。行アドレスミスが発生すると、再度行アドレスを設定するシーケンスが必要となり、この処理ペナルティが非常に大きく、主記憶のスループットが著しく低下すると共に、処理速度も低下する。特に画像表示を含む組込み型LSIでは、プロセッサによる汎用処理の速度が低下すると共に画像表示も滞るため、システムとして十分な性能を得ることは困難であった。
【0012】
本発明の課題は、ユニファイドメモリによる主記憶を有する組込み型LSIにおいて、ランダムなアクセスパターンによる主記憶の行アドレスミス数を低減し、主記憶の高いスループットを得ることである。
【0013】
また、本発明の第2の課題は、主記憶の高いスループットと共に、低いアクセスレイテンシをもつことにより、より高い性能を得ることである。
【0014】
【課題を解決するための手段】
上記目的を達成するために本発明の形態によれば、第1のCPUとローカルメモリを有するプロセッサエレメントと、プロセッサエレメントと主記憶との間に配置する第1のキャッシュメモリと、第1のキャッシュメモリに直接アクセス可能な第2のCPUを持ち、第2のCPUはプロセッサエレメントからの割込み処理を受け付ける手段と、第2のCPUは主記憶の行アドレスミスが発生しにくいように記述された割込み処理ルーチンに従い、あらかじめプロセッサエレメントが必要とするデータを第1のキャッシュメモリに転送する手段を持つことにより、ランダムな主記憶へのアクセスパターンを排除し、行アドレスミスの発生しない主記憶アクセスが可能となる。また、第1のCPUは、第1のキャッシュメモリを2次階層のメモリとして使用することで、高いスループットと低いレイテンシの両方を得る事ができる。
【0015】
また、ローカルメモリと第1のキャッシュメモリの間に、ローカルメモリと第1のキャッシュメモリ間のデータ転送を可能とするダイレクトメモリアクセスコントローラを有することにより、第1のCPUが必要とするデータが、より低いレイテンシでアクセス可能なローカルメモリ内にあらかじめ格納することが可能で、より低いレイテンシでのデータアクセスが可能となる。
【0016】
更に、第2のCPUが直接アクセス可能な第1のキャッシュメモリと並列にIOメモリと、IOメモリとディスプレイリフレッシュコントローラのようなIOデバイス間でのダイレクトメモリアクセスを行うダイレクトメモリアクセスコントローラを有し、ダイレクトメモリアクセスコントローラから第2のCPUに対して割込み要求を発行できる手段を持つことにより、表示系といった高いスループットを要するIOデバイスを含む場合においても、主記憶の高いスループットを得ることが可能となる。
【0017】
【発明の実施の形態】
本発明の実施の形態について、図面を参照して詳細に説明する。
【0018】
本発明の第1の実施形態について、図1を参照して説明する。図1は、本実施形態における階層型メモリシステムの構成を説明するためのブロック図である。
【0019】
本階層型メモリシステムは、汎用的な演算や、メディア演算を行うCPU2と、CPU2専用のローカルメモリ3からなるプロセッサエレメントであるPE1が、制御線11とデータ線12により接続されるN次階層キャッシュ制御部5と、N次階層キャッシュ制御部5は、制御線15とデータ線16により主記憶7を制御するための主記憶制御部6に接続される。本実施例の説明では、説明を容易にするため、ローカルメモリ3をキャッシュメモリとして説明する。但し、本ローカルメモリは、キャッシュメモリでもメモリマッピングされたIOメモリでも本発明では制限を持たない。
【0020】
N次階層キャッシュ制御部5は内部にキャッシュメモリを持つ(図3にて後述)。従って、CPU2から見ると、ローカルメモリ3を1次キャッシュとし、N次階層キャッシュ制御部5内のキャッシュメモリを2次キャッシュとして接続され、終端に主記憶に接続される、一般的な2次階層キャッシュメモリを持つシステムとなる。
【0021】
更に、N次階層キャッシュ制御部5には、N次階層キャッシュ制御部5を制御するためのCPUであるNC−CPU4が直接接続する。このNC−CPU4は、命令列によりN次階層キャッシュ制御部5内のキャッシュメモリをアクセス可能なCPUである。
【0022】
図2にNC−CPU4のブロック図を示す。NC−CPU4は、命令列に示された命令を順次実行する一般的なCPUである。また、割込み処理も実行可能なCPUである。
【0023】
命令列は命令メモリ402に格納され、プログラムカウンタ401が生成するプログラムカウンタ値410を元に、命令メモリ402を読み出し、読み出された命令411を命令デコーダ403にてデコードし、デコード結果414を演算器431とレジスタ432からなる演算実行部430に転送し、通常の演算を実行する。また命令デコーダ403は、ブランチ命令によりプログラムカウンタ401を制御するための信号412を生成する。
【0024】
命令は、算術演算、論理演算、ブランチ命令、メモリアクセス命令など、汎用的な命令である。ここで、メモリアクセス命令は、ロード命令、ストア命令、プリフェッチ命令などを持つ。
【0025】
デコード結果414がメモリアクセス命令の場合、制御線13にその、命令のオペランドやアクセスアドレスなどを転送し、データ線14には、対応するデータが配送される。ここでデータ線14は一つのパスとして説明するが、ロードデータとストアデータを分割しても構わない。
【0026】
また、NC−CPU4は、割込みテーブル420と、割込み禁止フラグ404の少なくとも2種のレジスタを持つ。
【0027】
割込みテーブル420は、図3に示すように、割込み毎に設定された割込み処理ルーチンが格納されたアドレス、すなわち、プログラムカウンタ値を格納するテーブルで、割込みが発生した場合(割込み有無フラグがセット)、そのプログラムカウンタ値が示すアドレスにジャンプする。尚、割込み処理終了後は、割込み発生前のプログラムカウンタ値に戻る、一般的な割込み処理を実現する。
【0028】
割込み禁止フラグ404は、割込み発生を抑止するレジスタで、本割込み禁止フラグ値414が割込み禁止と示している期間は、割込みテーブル420内の割込み有無フラグがセットされていても、割込みを発生することができない。
【0029】
これらのレジスタはIOマッピングされ、NC−CPU4、及び、PE1は制御線11とデータ線12を介してアクセス可能である。尚、本実施例では、説明を容易にするために、これらのレジスタをIOマッピングとしているが、他の手段においても制限を持たない。
【0030】
図4はN次階層キャッシュ制御部5のブロック図である。N次階層キャッシュ制御部5は、PE1およびNC−CPU4の2つのマスタからアクセス可能な一般的なキャッシュメモリ構成である。PE1からのアクセス要求である制御線11とNC−CPU4からのアクセス要求である制御線13が調停回路50に入力され、アクセス調停を行い、キャッシュメモリ53を制御するメモリ制御部52に制御信号56を伝える。また、PE1からのデータ線12とNC−CPU4からのデータ線14を選択するため、調停パス51を制御線55により制御する。調停パス51は、2マスタからのアクセスを調停する。尚、本実施例の説明では、説明を容易にするために2つのアクセスを調停する方式としているが、インタリーブ型のキャッシュ方式の採用により、競合ペナルティを回避可能な構成も可能である。
【0031】
メモリ制御部52は、一般的なキャッシュメモリ制御を行い、内部にキャッシュメモリのアドレスタグを持ち、アクセスがデータリードにてキャッシュミスした場合には、制御線15を介してデータリード要求を発行し、データが返送された場合、データ線16を介してキャッシュメモリ53を更新し、同時に内部のアドレスタグを更新する。尚、キャッシュメモリ53は、ライトスルー方式でもライトバック方式でも可能で、本発明においては制限を持たない。
【0032】
図1から図4の説明をまとめると、N次階層キャッシュ制御部5内のキャッシュメモリ53は、PE1から見ると2次階層キャッシュ、NC−CPU4から見ると、1次階層キャッシュとなることが、本実施形態の特徴である。
【0033】
図5を用いて、本実施形態の処理シーケンスを説明する。PE1とNC−CPU4は完全に並列動作可能なプロセッサエレメントとして見え、メディア処理などの主となる応用処理をPE1にて実行し、PE1が必要とするデータの読み込みをあらかじめNC−CPU4にてキャッシュメモリ53まで行う。従って、PE1が必要とするデータは、すでにキャッシュメモリ53に格納される、すなわち2次階層キャッシュまでは格納されており、PE1はレイテンシの大きな主記憶7を直接アクセスするよりも性能が向上する。
【0034】
NC−CPU4の起動は、割込みテーブル420を使用した割込みにより行う。通常、NC−CPU4は、自身のメインルーチンを実行しているが、命令列中に割込み禁止フラグ404を解除する命令(本実施例ではIOレジスタにて設定)が発行されると、割込み禁止フラグをリセットし、この期間、割込みを受けつける。この時、PE1より割込み要求が発生している場合、NC−CPU4は割込みテーブル520に従い、割込み処理を開始する。本図では割込み起動A、B、Cである。それぞれの割込み処理はデータリードA、B、Cで表し、プリフェッチ命令により、主記憶7よりキャッシュメモリ53までデータを読み込む。割込み処理、すなわちキャッシュメモリへのプリフェッチが終了した時点で、自身のメインルーチンに戻り、再度割込み禁止フラグ404をセットし、割込み禁止状態とする。従って、メインルーチン中、もしくは割り込み処理中のNC−CPU4は、主記憶7のアクセス権をほぼ100%使用可能となる。よって、主記憶7のスループット向上を実現するような、行アドレスミスの発生しない主記憶アクセスプログラムを使用することにより、主記憶7の性能を引き出すことが可能である。
【0035】
また、NC−CPU4が持つ命令にキャッシュメモリ53のフラッシュを行う命令を持つことにより、主記憶7への書き込みもバーストモードにて実現可能である。更に、プリフェッチ命令の代わりにロード命令を実行し、NC−CPU4内の演算器431にてデータを加工後、キャッシュメモリ53にストアすることにより、データフロー型マルチプロセッサ構成として動作する。例えば、表示系のビット演算などが可能となる。この時、セマフォやポーリングによる同期化処理も必要となるが、NC−CPU4自身がキャッシュ領域にセマフォやポーリングフラグを生成することで同期化が可能となる。
【0036】
尚、NC−CPU4による処理が終了する前に、同一アドレスに対しPE1のアクセス要求が発行された場合、キャッシュメモリ53は、PE1から見ると単に2次階層キャッシュとして動作するため、整合性破壊の問題は発生しない。
【0037】
本構成により、キャッシュメモリ53に対して、主記憶7のスループットを有効に使用可能となる。
【0038】
本発明の第2の実施形態について、図6を参照して説明する。図6は、本実施形態における階層型メモリシステムの構成を説明するためのブロック図で、図1の実施形態に対し、プロセッサエレメントであるPE100とN次階層キャッシュ制御部5の間に、ローカルメモリ300とN次階層キャッシュ制御部5内のキャッシュメモリ53間のデータ転送を行うDMAC8を接続した構成である。ここで、ローカルメモリ300は、PE100自身のマスタアクセスに加え、DMAC8のスレーブアクセスの両者を受付け、スレーブアクセス20に対するデータがローカルメモリ300に存在しない場合、PE100自身のマスタアクセス同様、通常のキャッシュミスシーケンスを実行可能な構成をとる。また、ローカルメモリ300をキャッシュメモリではなく、ローカルなIOメモリとしてもよい。
【0039】
本実施例の説明では、DMAC8とN次階層キャッシュ制御部5の間にセレクタ9を設け、N次階層キャッシュ制御部5は、同時に1つのスレーブアクセスを受け付けることが可能な構成としたが、一般的なアクセスキューの使用やインタリーブ型キャッシュなどの使用により、並列動作も可能であるが、本発明ではこれに限定を持たない。
【0040】
DMAC8は、キャッシュメモリとキャッシュメモリ間、若しくはIO空間の間にてダイレクトメモリアクセスを行う一般的なアクセラレータである。
【0041】
処理シーケンスとしては、図5に処理シーケンスに加え、DMAC8により、キャッシュメモリ53からローカルメモリ300にデータ転送を行うことで、PE100は、確実に1次階層キャッシュであるローカルメモリ300に対してデータアクセスが可能となり、2次階層キャッシュに比べ、より性能を向上できる。
【0042】
従って、NC−CPU4とN時階層キャッシュ制御部5の使用により、主記憶7からキャッシュメモリ53までのデータ転送は、第1の実施例の説明時に延べた通り、高いスループットを得ることが可能であると共に、DMAC8の使用により、PE100が使用するデータは、あらかじめローカルメモリ300に格納されているため、PE100はローカルメモリ300に対し、より小さなレイテンシによるアクセスが可能で、スループットとレイテンシ共に、性能向上が可能となる。
【0043】
本発明の第3の実施形態について、図7を参照して説明する。図7は、本実施形態における階層型メモリシステムの構成を説明するためのブロック図で、図1の実施形態に対し、DMA制御部501を介してIOデバイス502を接続した構成である。IOデバイス502は、ディスプレイ表示や音声入出力、ネットワークなど、汎用のIOデバイスとする。尚、本実施例では説明を容易にするため、本IOデバイス502をディスプレイ表示用のディスプレイリフレッシュコントローラ(以下、DRCと表記)とする。
【0044】
DMA制御部501は、IOデバイス502であるDRCからデータ転送要求が発生したとき、NC−CPU400にDMA割込み要求510を発行する。またDMA制御部501は、N次階層メモリ制御部500に対し、制御線511とデータ線512を介してデータアクセス可能な構成をとる。
【0045】
図8は本実施例における、第2のNC−CPU400を示したブロック図であり、図2に示した第1のNC−CPU4に対して、少なくとも2つの違いをもつ構成である。1つ目は、DMA制御部501が発行する割込み要求510を受託可能であり、動作方法は第1の実施例の方法と同じである。
【0046】
2つ目は、NC−CPU400の持つ命令に、第1の実施例の説明時に述べたメモリアクセス命令に加え、主記憶空間からIOメモリ空間にデータを転送可能なメモリ−メモリ転送命令を持つことである。
【0047】
図9に、N次階層メモリ制御部500のブロック図を示す。これは図4の説明にて述べたN次階層キャッシュ制御部5に対し、2つの違いを持つ。一つは、内部にキャッシュメモリ61とIOメモリ62からなるメモリ60を持ち、図7の説明にて述べたメモリ−メモリ転送命令にて、IOメモリ62に対してもアクセス可能な構成をとる。2つ目の違いは、DMA制御部501から制御線511とデータ線512を介してメモリ60にアクセス可能な構成である。尚、ここでは説明を容易にするため、DMA制御部501はIOメモリ62のみをアクセス可能として説明するが、本発明はこれに限定されない。
【0048】
以上を踏まえ、IOデバイス502がDRCの場合について、その振舞いを説明する。まず、DMA制御部501が発行する割込み要求510に対する割込み処理では、メモリーメモリ転送により、主記憶7上に格納された表示データをキャッシュメモリ61経由でIOメモリ62に転送する。従って、一つの割込み処理ルーチンにて、主記憶7からバーストモードにて表示データを読込むことが可能で、主記憶7のスループットを有効に使用可能となる。
【0049】
同期化処理終了後、DMA制御部501は制御線511にてIOメモリ62を読み出し、データ線512を介して、DMA制御部501に返送し、表示データをIOデバイス502に送り画像表示を行う。
【0050】
ここで、NC−CPU400のメインルーチンやPE100からの割込み処理も、それぞれ主記憶7がバーストモードにてアクセス可能な命令列を採ることにより、主記憶7のスループット性能を十分に引き出すことが可能となる。
【0051】
ここでは、IOデバイス502をDRCとして説明した。これは、IOデバイス502が出力IOである。次に、IOデバイス502が音声入力のような入力IOのシーケンスについて説明する。
【0052】
この場合、まずDMA制御部501は、制御線511によりIOメモリ62に対しデータ線512を介して入力データを格納する。次に割込み要求510を発行する。割込み処理ルーチンでは、IOメモリ62に格納されたデータをレジスタ432に読み出し、主記憶7に対してデータをライトすることにより、入力データを主記憶7に書き出すことができる。
【0053】
尚、本説明ではDMA制御部501はIOメモリ62のみアクセス可能としたが、制御線511に物理アドレスを与えることで、キャッシュメモリ61にも直接アクセスすることも可能となる。
【0054】
従って、IOデバイス502に対しても、高いスループットと小さなレイテンシによる性能向上を実現できる。
【0055】
本発明の第4の実施形態について、図10を参照して説明する。図10は、本実施形態における階層型メモリシステムの構成を説明するためのブロック図で、第2の実施形態と第3の実施形態の両特長を持ち、DMAC8とDMA制御部501、及びIOデバイス502を持つ構成である。
【0056】
本構成により、PE100及びIOデバイス502共に、高いスループットと低いレイテンシによる性能向上を得ることができる。
【0057】
【発明の効果】
上述の様に本発明の実施形態によれば、主記憶のアクセスにおいて、高いスループットを得るためのバーストモードを効率よく使用可能で、処理性能が向上する。
【図面の簡単な説明】
【図1】本発明の第1の実施形態を説明するためのブロック図である。
【図2】本発明の実施形態における第1のNC−CPUの構成を説明するための図である。
【図3】本発明の実施形態における割込みテーブルを説明するための図である。
【図4】本発明の実施形態におけるN次階層キャッシュ制御部を説明するための図である。
【図5】本発明の実施形態における処理シーケンスを説明するための図である。
【図6】本発明の第2の実施形態を説明するための図である。
【図7】本発明の第3の実施形態を説明するための図である。
【図8】本発明の実施形態における第2のNC−CPUの構成を説明するための図である。
【図9】本発明の実施形態におけるN次階層メモリ制御部を説明するための図である。
【図10】本発明の第4の実施形態を説明するための図である。
【符号の説明】
1…プロセッサエレメントPE、2…CPU、3…ローカルメモリ、4…NC−CPU、5…N次階層キャッシュ制御部、6…主記憶制御部、7…主記憶、8…DMAC、53…キャッシュメモリ、60…メモリ、203…データメモリ、404…割込み禁止フラグ、420…割込みテーブル、430…演算実行部、501…DMA制御部、502…IOデバイス。

Claims (6)

  1. 第1のCPUと第1のローカルメモリを有するプロセッサエレメントと、プロセッサエレメントと主記憶の間に第1のキャッシュメモリを有する階層型メモリシステムにおいて、
    第1のキャッシュメモリを1次階層キャッシュとして制御可能な第2のCPUを有し、第2のCPUは割込み種ごとにジャンプするプログラムカウンタ値を保存する割込みテーブルと、割込み発生を抑止する割込み禁止フラグを有し、
    割込み禁止フラグが割込み受託状態と示しているときに割込みが発生した場合、割込みテーブルに示された対応するプログラムカウンタ値にジャンプし、割込み処理終了後、割込み発生前のプログラムカウンタ値に復帰する手段を有し、
    プロセッサエレメントは、第2のCPUに対し割込み要求を発行する手段と、第1のキャッシュメモリに対しアクセスする手段を持つことを特徴とする階層型メモリシステム。
  2. 請求項1に記載のシステムにおいて、
    システム上に主記憶が1つしか存在しないユニファイドメモリ構成であることを特徴とする階層型メモリシステム。
  3. 請求項1に記載のシステムにおいて、
    ローカルメモリは第2のキャッシュメモリで構成され、プロセッサエレメントは、第2のキャッシュメモリを1次階層キャッシュとして使用し、第1のキャッシュを2次階層キャッシュとして使用できることを特徴とする階層型メモリシステム。
  4. 請求項1に記載のシステムにおいて、
    プロセッサエレメントと第1のキャッシュメモリとの間に、ローカルメモリと第1のキャッシュメモリ間でデータ転送を可能とするダイレクトメモリアクセスコントローラを有することを特徴とする階層型メモリシステム。
  5. 請求項1に記載のシステムにおいて、
    第1のキャッシュメモリと並列に、IOマッピングされたIOメモリを有し、第2のCPUはIOメモリに対してアクセスする手段と、
    IOメモリもしくは第1のキャッシュメモリとIOデバイス間のダイレクトメモリアクセスを行うダイレクトメモリアクセスコントローラと、
    ダイレクトメモリアクセスコントローラは第2のCPUに対して割込み要求を発行できることを特徴とする階層型メモリシステム。
  6. 請求項5に記載のシステムにおいて、
    IOデバイスは、ディスプレイを表示するためのディスプレイリフレッシュコントローラであることを特徴とする階層型メモリシステム。
JP2003123132A 2003-04-28 2003-04-28 階層型メモリシステム Pending JP2004326633A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003123132A JP2004326633A (ja) 2003-04-28 2003-04-28 階層型メモリシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003123132A JP2004326633A (ja) 2003-04-28 2003-04-28 階層型メモリシステム

Publications (1)

Publication Number Publication Date
JP2004326633A true JP2004326633A (ja) 2004-11-18

Family

ID=33501107

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003123132A Pending JP2004326633A (ja) 2003-04-28 2003-04-28 階層型メモリシステム

Country Status (1)

Country Link
JP (1) JP2004326633A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008059496A (ja) * 2006-09-04 2008-03-13 Fujitsu Ltd 動画像処理装置
US7657667B2 (en) 2004-03-25 2010-02-02 International Business Machines Corporation Method to provide cache management commands for a DMA controller
JP2011515001A (ja) * 2008-03-28 2011-05-12 インテル コーポレイション 異なるキャッシュ・コヒーレンス・ドメインの間の情報共有技法
JP2012043031A (ja) * 2010-08-13 2012-03-01 Fujitsu Ltd 共有キャッシュメモリ装置

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7657667B2 (en) 2004-03-25 2010-02-02 International Business Machines Corporation Method to provide cache management commands for a DMA controller
JP2008059496A (ja) * 2006-09-04 2008-03-13 Fujitsu Ltd 動画像処理装置
JP2014167831A (ja) * 2008-03-28 2014-09-11 Intel Corp 異なるキャッシュ・コヒーレンス・ドメインの間の情報共有技法
US9035959B2 (en) 2008-03-28 2015-05-19 Intel Corporation Technique to share information among different cache coherency domains
JP2013054789A (ja) * 2008-03-28 2013-03-21 Intel Corp 異なるキャッシュ・コヒーレンス・ドメインの間の情報共有技法
JP2014032708A (ja) * 2008-03-28 2014-02-20 Intel Corp 異なるキャッシュ・コヒーレンス・ドメインの間の情報共有技法
JP2014096176A (ja) * 2008-03-28 2014-05-22 Intel Corp 異なるキャッシュ・コヒーレンス・ドメインの間の情報共有技法
CN103824251A (zh) * 2008-03-28 2014-05-28 英特尔公司 在不同高速缓存一致性域之间共享信息的技术
JP2011515001A (ja) * 2008-03-28 2011-05-12 インテル コーポレイション 異なるキャッシュ・コヒーレンス・ドメインの間の情報共有技法
US9035960B2 (en) 2008-03-28 2015-05-19 Intel Corporation Technique to share information among different cache coherency domains
US9035962B2 (en) 2008-03-28 2015-05-19 Intel Corporation Technique to share information among different cache coherency domains
US10204051B2 (en) 2008-03-28 2019-02-12 Intel Corporation Technique to share information among different cache coherency domains
JP2016085766A (ja) * 2008-03-28 2016-05-19 インテル コーポレイション 異なるキャッシュ・コヒーレンス・ドメインの間の情報共有技法
CN103279426B (zh) * 2008-03-28 2017-03-01 英特尔公司 在不同高速缓存一致性域之间共享信息的技术
US9665488B2 (en) 2008-03-28 2017-05-30 Intel Corporation Technique to share information among different cache coherency domains
CN103824251B (zh) * 2008-03-28 2017-09-26 英特尔公司 在不同高速缓存一致性域之间共享信息的技术
US9946650B2 (en) 2008-03-28 2018-04-17 Intel Corporation Technique to share information among different cache coherency domains
US10078590B2 (en) 2008-03-28 2018-09-18 Intel Corporation Technique to share information among different cache coherency domains
JP2012043031A (ja) * 2010-08-13 2012-03-01 Fujitsu Ltd 共有キャッシュメモリ装置

Similar Documents

Publication Publication Date Title
JP5272274B2 (ja) メモリアクセスの順序を変更するシステム、装置、および方法
US8055872B2 (en) Data processor with hardware accelerator, accelerator interface and shared memory management unit
US6732242B2 (en) External bus transaction scheduling system
JP4764360B2 (ja) メモリ属性を用いるための技術
US8266383B1 (en) Cache miss processing using a defer/replay mechanism
US20070226422A1 (en) Multi-master system and data transfer system
US8095744B2 (en) Device for controlling access from a plurality of masters to shared memory composed of a plurality of banks each having a plurality of pages
JP5100176B2 (ja) マルチプロセッサシステム
KR20040023692A (ko) 다수의 스레드의 동시 실행을 지원하는 컴퓨터시스템에서의 인터럽트 처리 메커니즘
JP2002530731A (ja) 異常メモリアクセスまたは異なる時間のメモリアクセス実行の際のデータバス上のデータ衝突を検出するための方法および装置
US20120311266A1 (en) Multiprocessor and image processing system using the same
JP2002530743A (ja) ページタグレジスタを使用して、メモリデバイス内の物理ページの状態を追跡すること
JP5499987B2 (ja) 共有キャッシュメモリ装置
US6928525B1 (en) Per cache line semaphore for cache access arbitration
US20030105929A1 (en) Cache status data structure
JP5382113B2 (ja) 記憶制御装置及びその制御方法
JP2004326633A (ja) 階層型メモリシステム
JP2009175960A (ja) 仮想マルチプロセッサシステム
JP4693843B2 (ja) メモリ制御装置及びメモリ制御方法
US20100131718A1 (en) Multiprocessor system
JP2003345648A5 (ja)
JP2009505178A (ja) 少なくとも2つの命令実行部と少なくともデータ及び/または命令のための第1記憶装置または記憶領域とを備えたコンピュータシステムにおいて、データ及び/または命令を格納する装置及び方法
US20120054439A1 (en) Method and apparatus for allocating cache bandwidth to multiple processors
JP4583981B2 (ja) 画像処理装置
US8560748B2 (en) Information processing system including interrupt processing function

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060403

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060420

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090723

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090818

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100112