JP2005190494A - 高速プロセッサシステム、これを使用する方法及び記録媒体 - Google Patents

高速プロセッサシステム、これを使用する方法及び記録媒体 Download PDF

Info

Publication number
JP2005190494A
JP2005190494A JP2005029278A JP2005029278A JP2005190494A JP 2005190494 A JP2005190494 A JP 2005190494A JP 2005029278 A JP2005029278 A JP 2005029278A JP 2005029278 A JP2005029278 A JP 2005029278A JP 2005190494 A JP2005190494 A JP 2005190494A
Authority
JP
Japan
Prior art keywords
processor system
speed processor
mpu
cpu
cache memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005029278A
Other languages
English (en)
Other versions
JP4656565B2 (ja
JP2005190494A5 (ja
Inventor
Akio Oba
章男 大場
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Interactive Entertainment Inc
Original Assignee
Sony Computer Entertainment Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Computer Entertainment Inc filed Critical Sony Computer Entertainment Inc
Priority to JP2005029278A priority Critical patent/JP4656565B2/ja
Publication of JP2005190494A publication Critical patent/JP2005190494A/ja
Publication of JP2005190494A5 publication Critical patent/JP2005190494A5/ja
Application granted granted Critical
Publication of JP4656565B2 publication Critical patent/JP4656565B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Memory System (AREA)
  • Memory System Of A Hierarchy Structure (AREA)

Abstract

【課題】 本発明は、従来のプログラミングスタイルを維持したまま、並列分散処理が可能な高速プロセッサシステムを提供することを目的とする。
【解決手段】 本発明に係る高速プロセッサシステムは、CPUと、複数個に並列接続されたDRAMと、階層構造に形成された複数個のキャッシュメモリを備え、各々のキャッシュメモリにはCPUに対してバイナリ互換性のあるプロセッサとして機能するMPUが夫々備えられている。
【選択図】 図2

Description

本発明は、階層的に構成された並列コンピュータシステムにあって、今までのプログラミングスタイルのままで高速にて並列処理を行う高速プロセッサシステム、これを使用する方法及び記録媒体に関する。
現在、大量のデータを高速に処理する方式としては、例えば、CPUと、キャッシュメモリを有する低速大容量のDRAMとを備えた高速プロセッサシステムが知られている。この高速プロセッサシステムにおいては、図1に示すように、1次キャッシュを内蔵したCPU1に対して、共通バスラインを介して接続された複数個の並列配置のDRAM2が設けられ、そしてDRAM2の処理速度をCPU1に近づけるために、各DRAM2には2次キャッシュ3が備えられている。
このような図1の回路構成において、CPU1からの命令によってDRAM2の内容が読み出されて処理されまた書き込まれる。このとき、DRAM2の所望の内容がキャッシュ3に存在すればヒットとなって、CPU10は2次キャッシュ3に対してアクセスができて高速データ処理が可能となる。しかし、所望の内容がキャッシュ3に存在しないミスヒットの場合には、キャッシュ3は改めてDRAM2からその内容を読み出すことになる。
そして、上述の例に示されプロセッサ、DRAM、キャッシュを組み合わせた高速プロセッサシステムの構成自体は、通常のプログラミングスタイルで制御できるという特徴を有して現在の主流となっている。
しかしながら、このキャッシュを階層的に組み合わせた高速プロセッサシステムでは、CPUは1つであり並列処理をすることができない。また、1つのCPUを用いた通常のプログラミングは、元々、並列処理を前提に作られていないので、そのままで並列プロセッッシングシステムを実行しようとするのは難しく、実用上ネックとなっている。
本発明は、上述の問題に鑑み、新規な高速プロセッサシステム、該高速プロセッサシステムを使用する方法及びコンピュータ可読・実行可能なプログラムを記録した記録媒体を提供することを目的とする。
本発明は、上述の問題に鑑み、今までのプログラミングスタイルを維持したままで、並列プロセッサを得る高速プロセッサシステム、該高速プロセッサシステムを使用する方法及びコンピュータ可読・実行可能なプログラムを記録した記録媒体を提供することを目的とする。
本発明に係る高速プロセッサシステムは、1次キャッシュメモリを有するCPUと、前記の下層に配置され、第1のMPUを有する2次キャッシュと、前記2次キャッシュメモリに対して相互いに並列配置され、各々が、第2のMPUを持つ3次キャッシュを有する複数個のメインメモリとを備えた高速プロセッサシステムであって、前記第1及び第2のMPUは、キャッシュロジック機能とプロセッサ機能とを夫々有して、分散並列処理を可能としている。
更に本発明に係る高速プロセッサシステムは、上述の高速プロセッサシステムであって、前記1次、2次及び3次キャッシュメモリは、順に、相対的に長いラインサイズをもっている。
このとき、前記2次キャッシュメモリは、前記CPUからは2次キャッシュメモリとしてアクセスされ、また、前記第1のMPUからは1次キャッシュメモリとしてアクセスされる。
また、前記3次キャッシュメモリは、前記CPUからは3次キャッシュメモリとしてアクセスされ、前記第1のMPUからは2次キャッシュメモリとしてアクセスされ、また、前記第2のMPUからは1次キャッシュメモリとしてアクセスされる。
また、前記第1及び第2のMPUのデータ処理は、前記CPUからのプリフェッチ命令又はインテリジェントプリフェッチ命令による制御プロトコルに従って実行される。このとき、前記第1及び第2のMPUは、データの転送粒度や転送頻度によって選択的にデータ処理を実行している。
例えば、前記第1のMPUは、複数個の前記メインメモリに記録されたデータ及びプログラムを用いて、主として、大域転送又は低演算高転送処理を実行する。前記第2のMPUは、該MPUが付設する単一の前記メインメモリに記録されたデータ及びプログラムを用いて、主として、ローカルオブジェクトの処理を実行する。
更に本発明に係る高速プロセッサシステムは、上述の高速プロセッサシステムであって、ASIC−DRAMとしてワンチップ内に形成されている。
更に本発明に係る高速プロセッサシステムを使用する方法は、1次キャッシュメモリを有するCPUと、前記の下層に配置され、第1のMPUを有する2次キャッシュと、前記2次キャッシュメモリに対して相互いに並列配置され、各々が第2のMPUを持つ3次キャッシュを有する複数個のメインメモリとを備えた高速プロセッサシステムを使用する方法であって、前記CPUによって、主として、高度な演算処理を実行し、前記第1のMPUによって、複数個の前記メインメモリに記録されたデータ及びプログラムを用いて、主として、大域転送又は低演算高転送処理を実行し、前記第2のMPUによって、該MPUが付設する単一の前記メインメモリに記録されたデータ及びプログラムを用いて、主として、ローカルオブジェクト処理を実行し、こうして分散並列処理を可能としている。
ここで、前記第1及び第2のMPUの処理は、前記CPUからのプリフェッチ命令又はインテリジェントプリフェッチ命令による制御プロトコルに従って実行される。したがって、前記高速プロセッサは、通常のプログラミングスタイルで制御している。
更に本発明に係る高速プロセッサシステムは、1次キャッシュメモリを有するCPUと、前記CPUに対して相互いに並列配置され、各々が、MPUを持つ2次キャッシュメモリを有する複数個のメインメモリとを備えた高速プロセッサシステムであって、前記MPUは、キャッシュロジック機能とプロセッサ機能とを夫々有して、分散並列処理を可能としている。
本発明によれば、新規な高速プロセッサシステム、該高速プロセッサシステムを使用する方法及びコンピュータ可読・実行可能なプログラムを記録した記録媒体を提供することができる。
本発明によれば、今までのプログラミングスタイルを維持したままで、並列プロセッサを得る高速プロセッサシステム、該高速プロセッサシステムを使用する方法及びコンピュータ可読・実行可能なプログラムを記録した記録媒体を提供することができる。
ここで、図2〜図9を参照して本発明による実施の形態の一例を説明する。図2に示す高速プロセッサシステムの構成は、1次キャッシュであるIキャッシュ(インストラクション・キャッシュ)10a、Dキャッシュ(データ・キャッシュ)10b及びスクラッチパッド・メモリ10c(以上を「1次キャッシュ」とも称する。)を有するCPU10と、その接続されたユニファイド・キャッシュ・メモリ(「2次キャッシュ」とも称する。)11と、更に最下層にバスラインを介して相互に並列接続された複数個のユニファイド・キャッシュ・メモリ(「3次キャッシュ」とも称する。)12と、DRAM13-1〜13-3とを備えている。また、2次キャッシュ及び3次キャッシュには、キャッシュロジックとして、MPU(Micro processing Unit)14及び16が、夫々内蔵されている。
このように、各層にキャッシュを備えるのは、高速処理のためである。これらキャッシュメモリは、下層に行く程キャッシュメモリの容量単位であるラインサイズ、即ちバーストread/write長(一括読み出し/書き込み長)が長くなっている。なお、図2に示す構成では、2次キャッシュ11の存在は必須なものでなく、1次キャッシュを有するCPU10と、各々がユニファイド・キャッシュ・メモリ12を有する複数個のDRAM13とからなる構成も採ることができる。
図2に示す構成では、2次キャッシュ11及び3次キャッシュ12のキャッシュロジックとして内蔵されているMPU14及び16と、CPU10とは、相互にバイナリ互換性を有している。これらMPU14、16は二つの機能、即ち、キャッシュロジックとしての機能とプロセッサとしての機能とを有する。キャッシュロジック機能とは、CPU10の制御によりキャッシュメモリを制御するための機能であり、また、プロセッサ機能とは、CPU10に対して分散並列システム用サブCPUとして果たす機能である。
図3は、図2に示す高速プロセッサ構造を、具体的に半導体チップ15に具現化したものである。このチップ15には、DRAM13として主要部を構成するDRAMアレイ13aと、センスアンプ13bと、ロー・アドレス13cと、カラム・アドレス13dと、制御回路13eと、データ入出力回路13fとが形成されている。この図3に示すチップ15では、キャッシュメモリとしてはSRAM12が備えられ、このSRAM12は、DRAMアレイ13aのデータの入出力をつかさどるセンスアンプ13bと直結され、かつデータ入出力回路13fとの間でデータのやりとりがされる。
このSRAM12であるキャッシュメモリは、キャッシュ・ロジック機能とプロセッサ機能とを有するMPU14によって制御される。キャッシュ・ロジック機能の面に関しては、MPU14の制御のもと、SRAM12はシンプルなユニファイド・キャッシュとして働き、このSRAM12を介してDRAMアレイ13aに対してRead/Writeを行う。
また、プロセッサ機能の面に関しては、図2の例では、CPU10から見てSRAM12は3次キャッシュメモリとなり、CPU10からMPU14へ送られる制御信号のもと、MPU14は、DRAM13a内のプログラムとデータとからなるオブジェクトを実行したり、所定のプリフェッチ命令によりデータの先読みを行ったりする。
ここで、MPU14は、CPU10からのプリフェッチ命令により駆動される。一般に、CPUとメモリとの間に配置された高速メモリとしてのキャッシュによって、プロセッサシステムのスピードが左右されるので、最近では、キャッシュを積極的に利用する傾向があり、具体的には、CPUは、プリフェッチ命令を用いてデータの先読みを行っている。本発明では、このキャッシュ制御のためのプリフェッチ命令をMPU14に対しても適用して、MPU14によってプロセッシングまで行っている。
ここで、MPU14としては、具体的には、ARM(Advanced RISC Machines)やMIPS(Microprocessor without interlocked Pipe Stage)のような比較的小さなコアでも構成でき、かつハイパフォーマンスなCPUも構成できるスケーラブルなRISC(Restricted Instruction Set Computer)―CPUコアを採用してシステム内のキャッシュメモリに内蔵することができる。
図4は、図2に示すCPU10と2次キャッシュ11との具体的構成を示したものである。2次キャッシュ11は、基本的にはユニファイド・キャッシュ11aを内蔵したプロセッサとして把握できる。このプロセッサ機能を果たすMPU16は、CPU10に対して2次キャッシュメモリとなり、2次キャッシュとして働くことができる。2次キャッシュ内部のユニファイド・キャッシュ11aはSRAMにより構成され、CPU10に対しては2次キャッシュ、MPU16からは1次キャッシュとしてアクセスされる。なお、図4に示す符号17は、DRAM13に接続されるメモリインタフェースを示している。
この2次キャッシュ11は、前述の通り、1次キャッシュ(Iキャッシュ,Dキャッシュ,スクラッチパッド)と比較して、相対的に長いバーストRead/Write長を持っている。2次キャッシュ11は、CPU10からの制御プロトコルにより2次キャッシュとして動作したり、3次キャッシュやメインメモリ内のプログラムとデータからなるオブジェクトの処理(主として、高度な演算処理ではなく、DRAM13-1〜13-3相互間のデータ転送回数が多い処理)を実行する。
また、CPU10からの命令により、3次キャッシュ12に内蔵されたMPU14が実行するプリフェッチ命令よりも一層広い、例えば複数のDRAM相互間に跨るような範囲の一層高度なプリフェッチ命令を実行する。
図5は、図2に示す回路構成にあって通常のキャッシュモードによるデータの流れ、即ち、MPU14,16がキャッシュロジック機能のみを果たし、プロセッサ機能を果たしていない場合を示している。DRAM13のデータがCPU10によって処理される場合、DRAM13のデータの読み込みは、転送粒度(一度に転送されるデータ量)が比較的大きく且つ転送頻度が比較的少ない最下位の3次キャッシュ12から、その上位の2次キャッシュ11に転送され、更に最上位の1次キャッシュへと転送されて、CPU10に送られる。反対に、DRAM13へのデータの書き込みは、その逆の道筋を辿ることになる。
この結果、データのアクセスは何度も行われることになり、現在のCPU10のスタック機能(例えば、後入れ先出し記憶方式)によれば、このようなアクセスは一見有効である。しかし、例えば、画像処理とか大量のデータの探索等のような、CPU10より1回しかアクセスしないデータによって、何度もアクセスしなけばならないデータがキャッシュアウトされる事態が発生し、その結果、アクセス回数が増大し非常に無駄が多いことになる。このような無駄の存在は、今まで説明した本発明のキャッシュ・コントロールを行う発想につながるものである。
しかしながら、現時点では、図5のように何回もアクセスするパスがあることを前提として、プロセッサシステムの設計がされている。しかし、このようなメモリアーキテクチャを用い、通常のプログラミングで動作させることに対しても図5の如く適用が可能であることは現実に非常に有用なことである。
図6は、3次キャッシュ12内のMPU14が、プロセッサ機能を発揮する場合を示し、ここでは、MPU14は、ローカルオブジェクトの分散処理を実行している。即ち、CPU10にて処理する必要がないローカルオブジェクトに関しては、CPU10からのプリフェッチ命令の制御プロトコルによって、MPU14がこのようなローカルオブジェクトの処理を実行している。ローカルオブジェクトとしては、単一のDRAMブロックに記録されたプログラムとデータとがあり、ローカルオブジェクトの処理としては、例えば、単なるインクリメント演算や最大値を求める演算のような処理が挙げられる。このように、MPU14において分散並列処理を実行することができる。なお、ローカルオブジェクト処理が実行されるDRAMブロックは、分散処理の際には上位キャッシュからブロック単位でキャッシュアウトされる。
図7は、2次キャッシュ11内のMPU16が、プロセッサ機能を発揮する場合を示し、ここでは、MPU16は、一定の範囲でオブジェクトの分散処理を実行している。即ち、CPU10にて処理する必要がない処理に関しては、CPU10からの制御プロトコルによって、MPU16がこのような処理を実行している。このような分散処理としては、例えば大域転送処理や低演算高転送処理が挙げられ、例えばDRAM13-1から別のDRAM13-2に転送処理する場合がある。
MPU16は、基本的には全メモリにアクセスすることができるので、MPU16は、マルチプロセッサシステムとして、CPU10の実行する処理を代行することができる。しかし、CPU10に比較して、MPU16は演算能力が相対的に低いので、大量データの大域転送のような大きな転送粒度の転送が適しており、CPU10の高い演算能力や上位キャッシュの機能が必要でない処理を選択的に実行することができる。このMPU16による処理も、CPU10からの制御プロトコルによって実行される。
図8はインテリジェントプリフェッチ命令の具体的説明を示すものである。従来のプログラミングスタイルを維持したまま、CPU10からみて下位のMPU16,14等に対する制御の方法として、インテリジェントプリフェッチ命令(IPREF)が用いられる。図8においては、CPU10内において、10aはIキャッシュを、10bはDキャッシュを、夫々示している。ここで、MPU16がプロセッサ機能を果たすに際し、キャッシュ・コヒーレンスの問題があり、即ちMPU16によるプログラムの実行の結果によりデータが変わった場合、CPU10のDキャッシュ10bのデータと整合がとれなくなる。この問題を回避するため、CPU10がMPU16に仕事をさせるに際しては、CPU10のDキャッシュ10bのデータをキャッシュアウトして、Dキャッシュ10bの内容をMPU16によるプログラムの実行に基づく新たなデータ(指定データ)によって更新することとする。
MPU16はキャッシュであるので、キャッシュとして制御をしようとするもので、キャッシュに対する制御命令として、通常のキャッシュに対するプリフェッチ命令と同様に、IPREFによりMPU16に仕事をさせている。即ち、IPREFにてキャッシュに対する制御とMPU16に対する制御とを同時に行うことができる。因に、MPU16に対するプリフェッチ命令ではMPU16はキャッシュとして働くことになるが、IPREFではプログラムにより仕事をすることになる。
つまり、図8において、IPREFはCPU10の拡張命令であり、実行されることによりDキャッシュ10bの対象領域をキャッシュアウトして、下位のMPU付きキャッシュに制御プロトコルを送る。下位の指定MPUではこの制御プロトコルを受け取り指定プログラムを実行し、DRAMや下位のメモリブロックにアクセスし、所定のデータをキャッシュメモリ上にセットする。
以下は最大値データの検索例を示している。
Figure 2005190494
この例において、DRAM0〜3には予め図8に示す指定データが登録されているものとし、ここにいうIPREF DRAM0〜3は予め指定されたプログラムを実行するものである。そして、予め登録されたプログラムはIPREF命令によりDキャッシュ10bの指定領域をキャッシュアウトしてから実行される。ここではDRAM0〜3に対してIPREFを実行させて行き、CPU10にはDRAM1〜3に対して制御プロトコルを送り、最大値がキャッシュに入った状態でLoad命令を実行する。DRAMの粒度にもよるがIPREFとLoadの計8命令で4つの最大値を求めることができ、最大値相互間のチェックにより真の最大値を得る。
本発明によれば、キャッシュメモリにMPUを内蔵し、このMPUをキャッシュロジックとしてあるいはその層以下のプロセッサとして働かせることにより、今までのプログラミングスタイルのままで高速で無駄のない並列処理を行うことができる。
図1は、従来の並列プロセッサの一例のブロック図を示す図である。 図2は、本発明の実施の形態の一例のブロック図を示す図である。 図3は、DRAM、MPU、キャッシュのチップ配置の具体例を示すブロック図である。 図4は、2次キャッシュ及びMPUの内部構成を示すブロック図である。 図5は、通常のキャッシュモードを示すデータ流れ図を示す図である。 図6は、ローカルオブジェクト分散実行のデータ流れ図を示す図である。 図7は、2次キャッシュによる転送処理に伝わるデータ流れ図を示す図である。 図8は、インテリジェントプリフェッチ命令に伝わる具体的説明図を示す図である。 図9は、ASIC DRAMのチップシステムを示す図を示す図である。
符号の説明
10:CPU、
11:2次キャッシュ、
12:3次キャッシュ、
13:DRAM、
14,16:MPU

Claims (24)

  1. 1次キャッシュメモリを有するCPUと、
    前記の下層に配置され、第1のMPUを有する2次キャッシュと、
    前記2次キャッシュメモリに対して相互いに並列配置され、各々が、第2のMPUを持つ3次キャッシュを有する複数個のメインメモリとを備えた高速プロセッサシステムにおいて、
    前記第1及び第2のMPUは、キャッシュロジック機能とプロセッサ機能とを夫々有して、分散並列処理を可能としていることを特徴とする、高速プロセッサシステム。
  2. 請求の範囲1に記載の高速プロセッサシステムにおいて、
    前記1次、2次及び3次キャッシュメモリは、順に、相対的に長いラインサイズをもっている、高速プロセッサシステム。
  3. 請求の範囲1に記載の高速プロセッサシステムにおいて、
    前記CPU、前記第1のMPU及び第2のMPUは、相互にバイナリ互換性を有している、高速プロセッサシステム。
  4. 請求の範囲1に記載の高速プロセッサシステムにおいて、
    前記2次キャッシュメモリ及び3次キャッシュメモリは、ユニファイド・キャッシュ・メモリからなる、高速プロセッサシステム。
  5. 請求の範囲1に記載の高速プロセッサシステムにおいて、
    前記2次キャッシュメモリは、前記CPUからは2次キャッシュメモリとしてアクセスされ、また、前記第1のMPUからは1次キャッシュメモリとしてアクセスされる、高速プロセッサシステム。
  6. 請求の範囲1に記載の高速プロセッサシステムにおいて、
    前記3次キャッシュメモリは、前記CPUからは3次キャッシュメモリとしてアクセスされ、前記第1のMPUからは2次キャッシュメモリとしてアクセスされ、また、前記第2のMPUからは1次キャッシュメモリとしてアクセスされる、高速プロセッサシステム。
  7. 請求の範囲1に記載の高速プロセッサシステムにおいて、
    前記第1及び第2のMPUのデータ処理は、前記CPUからのプリフェッチ命令又はインテリジェントプリフェッチ命令による制御プロトコルに従って実行される、高速プロセッサシステム。
  8. 請求の範囲1に記載の高速プロセッサシステムにおいて、
    前記第1及び第2のMPUは、データの転送粒度や転送頻度によって選択的にデータ処理を実行している、高速プロセッサシステム。
  9. 請求の範囲1に記載の高速プロセッサシステムにおいて、
    前記第1のMPUは、複数個の前記メインメモリに記録されたデータ及びプログラムを用いて、主として、大域転送又は低演算高転送処理を実行する、高速プロセッサシステム。
  10. 請求の範囲1に記載の高速プロセッサシステムにおいて、
    前記第2のMPUは、該MPUが付設する単一の前記メインメモリに記録されたデータ及びプログラムを用いて、主として、ローカルオブジェクトの処理を実行する、高速プロセッサシステム。
  11. 請求の範囲1に記載の高速プロセッサシステムにおいて、
    前記メインメモリはDRAMからなり、
    前記1次及び2次キャッシュメモリはSRAMからなる、高速プロセッサシステム。
  12. 請求の範囲1に記載の高速プロセッサシステムにおいて、
    前記高速プロセッサシステムは、ASIC−DRAMとしてワンチップ内に形成されている、高速プロセッサシステム。
  13. 1次キャッシュメモリを有するCPUと、前記の下層に配置され、第1のMPUを有する2次キャッシュと、前記2次キャッシュメモリに対して相互いに並列配置され、各々が第2のMPUを持つ3次キャッシュを有する複数個のメインメモリとを備えた高速プロセッサシステムを使用する方法において、
    前記CPUによって、主として、高度な演算処理を実行し、
    前記第1のMPUによって、複数個の前記メインメモリに記録されたデータ及びプログラムを用いて、主として、大域転送又は低演算高転送処理を実行し、
    前記第2のMPUによって、該MPUが付設する単一の前記メインメモリに記録されたデータ及びプログラムを用いて、主として、ローカルオブジェクト処理を実行し、こうして分散並列処理を可能としている、高速プロセッサシステムを使用する方法。
  14. 請求の範囲13に記載の高速プロセッサシステムを使用する方法において、
    前記第1及び第2のMPUの処理は、前記CPUからのプリフェッチ命令又はインテリジェントプリフェッチ命令による制御プロトコルに従って実行される、高速プロセッサシステムを使用する方法。
  15. 請求の範囲13に記載の高速プロセッサシステムを使用する方法において、
    前記高速プロセッサは、通常のプログラミングスタイルで制御されている、高速プロセッサシステムを使用する方法。
  16. 請求の範囲13に記載の高速プロセッサシステムを使用する方法において、
    前記第1及び第2のMPUの双方又はいずれか一方がプロセッサ機能を発揮してデータ処理を行っているときは、該MPUのブロックはキャッシュアウトされている、高速プロセッサシステムを使用する方法。
  17. コンピュータ可読・実行可能なプログラムを記録した記憶媒体において、
    前記コンピュータ可読・実行可能なプログラムは、1次キャッシュメモリを有するCPUと、前記の下層に配置され、第1のMPUを有する2次キャッシュと、前記2次キャッシュメモリに対して相互いに並列配置され、各々が第2のMPUを持つ3次キャッシュを有する複数個のメインメモリとを備えた高速プロセッサシステムに適用され、
    前記コンピュータ可読プログラムは、前記CPUから前記第1及び第2のMPUに対するプリフェッチ命令又はインテリジェントプリフェッチ命令による制御プロトコルを含み、
    前記第1のMPUによって、複数個の前記メインメモリに記録されたデータ及びプログラムを用いて、主として、大域転送又は低演算高転送処理が実行され、
    前記第2のMPUによって、該MPUが付設する単一の前記メインメモリに記録されたデータ及びプログラムを用いて、主として、ローカルオブジェクト処理が実行される、こうして分散並列処理を可能としている、記憶媒体。
  18. 1次キャッシュメモリを有するCPUと、
    前記CPUに対して相互いに並列配置され、各々が、MPUを持つ2次キャッシュメモリを有する複数個のメインメモリとを備えた高速プロセッサシステムにおいて、
    前記MPUは、キャッシュロジック機能とプロセッサ機能とを夫々有して、分散並列処理を可能としていることを特徴とする、高速プロセッサシステム。
  19. 請求の範囲18に記載の高速プロセッサシステムにおいて、
    前記2次キャッシュメモリは、ユニファイド・キャッシュ・メモリからなる、高速プロセッサシステム。
  20. 請求の範囲18に記載の高速プロセッサシステムにおいて、
    前記2次キャッシュメモリは、前記CPUからは2次キャッシュメモリとしてアクセスされ、また、前記MPUからは1次キャッシュメモリとしてアクセスされる、高速プロセッサシステム。
  21. 請求の範囲18に記載の高速プロセッサシステムにおいて、
    前記MPUのデータ処理は、前記CPUからのプリフェッチ命令又はインテリジェントプリフェッチ命令による制御プロトコルに従って実行される、高速プロセッサシステム。
  22. 請求の範囲18に記載の高速プロセッサシステムにおいて、
    前記MPUは、該MPUが付設する単一の前記メインメモリに記録されたデータ及びプログラムを用いて、主として、ローカルオブジェクトの処理を実行する、高速プロセッサシステム。
  23. 請求の範囲18に記載の高速プロセッサシステムにおいて、
    前記メインメモリはDRAMからなり、
    前記1次及び2次キャッシュメモリはSRAMからなる、高速プロセッサシス
    テム。
  24. 請求の範囲18に記載の高速プロセッサシステムにおいて、
    前記高速プロセッサシステムは、ASIC−DRAMとしてワンチップ内に形成されている、高速プセッサシステム。

JP2005029278A 1999-01-21 2005-02-04 高速プロセッサシステム、これを使用する方法及び記録媒体 Expired - Fee Related JP4656565B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005029278A JP4656565B2 (ja) 1999-01-21 2005-02-04 高速プロセッサシステム、これを使用する方法及び記録媒体

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP1348699 1999-01-21
JP2005029278A JP4656565B2 (ja) 1999-01-21 2005-02-04 高速プロセッサシステム、これを使用する方法及び記録媒体

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2000595256A Division JP3698358B2 (ja) 1999-01-21 2000-01-21 高速プロセッサシステム、これを使用する方法及び記録媒体

Publications (3)

Publication Number Publication Date
JP2005190494A true JP2005190494A (ja) 2005-07-14
JP2005190494A5 JP2005190494A5 (ja) 2007-03-08
JP4656565B2 JP4656565B2 (ja) 2011-03-23

Family

ID=34796879

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005029278A Expired - Fee Related JP4656565B2 (ja) 1999-01-21 2005-02-04 高速プロセッサシステム、これを使用する方法及び記録媒体

Country Status (1)

Country Link
JP (1) JP4656565B2 (ja)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01229345A (ja) * 1988-02-16 1989-09-13 Sun Microsyst Inc データ処理装置
JPH0239339A (ja) * 1988-07-29 1990-02-08 Hitachi Ltd キヤツシユメモリ装置
JPH02214937A (ja) * 1988-12-30 1990-08-27 Internatl Business Mach Corp <Ibm> データ処理装置
JPH033047A (ja) * 1989-05-31 1991-01-09 Nec Corp 演算機能付きメモリ
JPH06274414A (ja) * 1993-03-19 1994-09-30 Hitachi Ltd キャッシュメモリを有する計算機の改良
JPH06318154A (ja) * 1992-03-13 1994-11-15 Sun Microsyst Inc 算術演算の必要性を最小にする方法及びそのための結果キャッシュ
JPH1031621A (ja) * 1996-07-17 1998-02-03 Nec Corp キャッシュメモリシステム
JPH10133947A (ja) * 1996-07-01 1998-05-22 Sun Microsyst Inc 統合されたプロセッサ・メモリ装置
JPH10214223A (ja) * 1997-01-29 1998-08-11 Hitachi Ltd 情報処理システム

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01229345A (ja) * 1988-02-16 1989-09-13 Sun Microsyst Inc データ処理装置
JPH0239339A (ja) * 1988-07-29 1990-02-08 Hitachi Ltd キヤツシユメモリ装置
JPH02214937A (ja) * 1988-12-30 1990-08-27 Internatl Business Mach Corp <Ibm> データ処理装置
JPH033047A (ja) * 1989-05-31 1991-01-09 Nec Corp 演算機能付きメモリ
JPH06318154A (ja) * 1992-03-13 1994-11-15 Sun Microsyst Inc 算術演算の必要性を最小にする方法及びそのための結果キャッシュ
JPH06274414A (ja) * 1993-03-19 1994-09-30 Hitachi Ltd キャッシュメモリを有する計算機の改良
JPH10133947A (ja) * 1996-07-01 1998-05-22 Sun Microsyst Inc 統合されたプロセッサ・メモリ装置
JPH1031621A (ja) * 1996-07-17 1998-02-03 Nec Corp キャッシュメモリシステム
JPH10214223A (ja) * 1997-01-29 1998-08-11 Hitachi Ltd 情報処理システム

Also Published As

Publication number Publication date
JP4656565B2 (ja) 2011-03-23

Similar Documents

Publication Publication Date Title
JP3698358B2 (ja) 高速プロセッサシステム、これを使用する方法及び記録媒体
JP3323212B2 (ja) データプレフェッチの方法およびその装置
JP3289661B2 (ja) キャッシュメモリシステム
JP2021034052A (ja) 異種メモリを有するメモリシステム、これを含むコンピュータシステム及びそのデータ管理方法
JP4656565B2 (ja) 高速プロセッサシステム、これを使用する方法及び記録媒体
JPH04250542A (ja) コンピューターメモリシステム
JP2580263B2 (ja) バッファ記憶装置
JP2000047942A (ja) キャッシュメモリ制御装置及びその制御方法
JP2964504B2 (ja) 文書処理装置
JPH0644139A (ja) ディスクキャッシュシステムおよびそのページ置き換え制御方法
JP2554761B2 (ja) データ転送パス制御方式
JP3204157B2 (ja) 計算機のデータ供給方式
JPH10320278A (ja) メモリコントローラ及びコンピュータシステム
JPH11203198A (ja) メモリアクセス制御装置
JPH0793215A (ja) 半導体記憶装置
US8230173B2 (en) Cache memory system, data processing apparatus, and storage apparatus
US7840757B2 (en) Method and apparatus for providing high speed memory for a processing unit
JPH04291642A (ja) キャッシュ制御方式
MXPA01007416A (en) High-speed processor system, method of using the same, and recording medium
JP2000066946A (ja) メモリコントローラ
JPH1055308A (ja) キャッシュメモリ
JP2002259209A (ja) 演算処理システム
JPH02226447A (ja) コンピユータ・システムおよびその記憶装置アクセス方法
JP2000105727A (ja) マルチプロセッサ、シングルプロセッサおよびデータ記憶制御方法
JPH0415495B2 (ja)

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050624

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050628

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070119

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100216

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100416

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101109

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20101124

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101217

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140107

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees