JPH0830568A - 分散メモリ型並列計算機のキャッシュ制御方式 - Google Patents

分散メモリ型並列計算機のキャッシュ制御方式

Info

Publication number
JPH0830568A
JPH0830568A JP6167903A JP16790394A JPH0830568A JP H0830568 A JPH0830568 A JP H0830568A JP 6167903 A JP6167903 A JP 6167903A JP 16790394 A JP16790394 A JP 16790394A JP H0830568 A JPH0830568 A JP H0830568A
Authority
JP
Japan
Prior art keywords
address
memory
main memory
cache
cache area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6167903A
Other languages
English (en)
Inventor
Yoichi Koyanagi
洋一 小柳
Nagatake Shiraki
長武 白木
Kenji Horie
健志 堀江
Toshiyuki Shimizu
俊幸 清水
Hiroaki Ishihata
宏明 石畑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP6167903A priority Critical patent/JPH0830568A/ja
Priority to US08/503,916 priority patent/US5742843A/en
Publication of JPH0830568A publication Critical patent/JPH0830568A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Memory System (AREA)
  • Memory System Of A Hierarchy Structure (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】 【目的】本発明は、分散メモリ型並列計算機において、
各PEに分散して存在している主メモリをシステム全体
で1つの広大なメモリ空間が存在しているように動作さ
せる分散共有メモリシステムにおいて、前記主メモリの
一部をキャッシュ領域とすることによりキャッシュ領域
を拡大してリモートPEからデータを転送する確率を減
少させることにより動作を高速化する方式を提供するこ
とを目的とする。 【構成】プロセッサ1はアドレスバス2を介してアドレ
スをキャッシュ領域アクセス部3内のアドレス検出手段
4に転送する。前記アドレス検出部4においてタグがヒ
ットした場合には、アドレス変換部10で生成されたア
ドレスは主メモリ制御装置6に転送される。主メモリ8
の一部には前述したキャッシュ領域9が設けられる。こ
のキャッシュ領域9は主メモリ8の領域の一部を分割し
て構成されるが、この主メモリ8とキャッシュ領域9と
が主メモリ制御装置6によってアクセスされる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は分散メモリ型並列計算機
に係り、特に各並列計算機に設けられたキャッシュメモ
リのキャッシュ制御方式に関する。
【0002】
【従来の技術】近年、各PEに分散して存在しているメ
モリを各PEが共有して使用することにより、システム
全体で1つの広大なメモリ空間が存在しているように動
作させる分散共有メモリ機構が用いられるようになって
きた。並列計算機における分散共有メモリ機構は、プロ
グラミングが難しいとされてきた並列計算機のソフトウ
ェア開発において、従来のプログラムからの移行を容易
にする、あるいは並列化コンパイラの実現を容易にする
などの利点をもたらす。
【0003】しかしながら、ネットワークを介して分散
されたメモリのアクセスはプロセッサの通常の動作に比
べて遅く、システム全体のPEを効率良く動作させるこ
とは難しい。
【0004】この問題点に対し、各PEに高速、小容量
のキャッシュメモリを置き、それをうまく制御して、分
散されたメモリへのアクセス回数を減らし、メッセージ
通信の頻度を減少させて、プロセッサを効率よく動作さ
せる手法がいくつかある。
【0005】ところが、これら方法は、専用のキャッシ
ュメモリと、プロセッサからみたキャッシュメモリの内
容の一貫性を保つキャッシュコヒーレンシと呼ばれる極
めて複雑な機構とメッセージ通信プロトコルを必要とし
ていた。また、汎用性を重視したその複雑な操作のため
に、アプリケーションの性質、すなわちメモリのload/
store のパターンによっては、システム全体の性能が十
分発揮できない場合もあった。
【0006】
【発明が解決しようとする課題】分散型並列計算機シス
テムでは、loadの場合にはHit すると外部キャッシュか
らそのデータを読み出せばよいが、Missの場合はアクセ
ス例外を発生し対応するリモートPEから自PEの外部
キャッシュにアドレスとその内容とを転送し、いったん
外部キャッシュにstore してから再度アクセスを実行す
るので、リモートPEから該当データを自PEの外部キ
ャッシュに転送しなければならない。従来の外部キャッ
シュの容量は小さいので、loadの場合にMissする確率が
多く、リモートPEからデータを転送することが頻繁に
起こった。このため、従来の分散共有メモリ型並列計算
機においてはリモートloadの場合に、時間がかかるとい
う問題がある。
【0007】また、Missする場合を少なくするために外
部キャッシュの容量を増やそうとするとコストがかかる
という問題がある。本発明は分散共有メモリ型並列計算
機において外部キャッシュメモリに代えてキャッシュ領
域を主メモリの領域に提供することによりキャッシュの
容量を拡大し、これによってリモートPEよりデータを
もってくる確率を減らし、並列計算機の演算速度を向上
することを目的とする。
【0008】
【課題を解決するための手段】第1図は本発明のプロセ
シングエレメント(PE)の原理ブロック図である。プ
ロセッサ1はアドレスバス2を介してアドレスをキャッ
シュ領域アクセス部3内のアドレス検出手段4に転送す
るとともに、データバス5を介してデータを主記憶メモ
リ制御装置6に転送する。
【0009】このアドレス検出手段4はプロセッサ1か
ら発生されるアドレスのタグ部とタグメモリ7のタグ部
とを比較してHit の検出が行われる。このアドレス比較
の結果Miss Hitした場合には、このMiss Hitしたアドレ
スは他PEに転送されリモートload要求を行う。ここ
で、アドレスのタグ部はPE番号と主メモリ18のキャ
ッシュ領域9のアドレスの一部とからなる。
【0010】このアドレス検出部4においてタグがHit
した場合には、アドレス変換部10で生成されたアドレ
スは主メモリ制御装置6に転送される。主メモリ8のロ
ーカル空間の一部には前述したキャッシュ領域9が設け
られる。このキャッシュ領域9は主メモリ8の領域の一
部を分割して構成されるが、この主メモリ8とキャッシ
ュ領域9とが主メモリ制御装置6によってアクセスされ
る。
【0011】
【作用】第1図に示した本発明の原理図によれば、外部
キャッシュメモリを廃止して主メモリ8の一部の領域を
キャッシュ領域9として構成したので、キャッシュ領域
9の容量を、外部キャッシュメモリに比較して数段と大
きくすることができる。これによりキャッシュMissの確
率を減らし、リモートプロセッサエレメントからloadす
る頻度を減少して、並列計算機の演算速度を向上でき
る。
【0012】さらに、従来は外部キャッシュメモリにア
クセスするための外部キャッシュメモリ専用のキャッシ
ュメモリ制御装置が必要であったが、本発明においては
キャッシュ領域を主メモリ領域の一部に構成したので、
外部キャッシュメモリ専用のメモリ制御装置が不要とな
った。言い換えれば、メモリ制御装置はリードコントロ
ーラ、ライトコントローラ、アドレスデコーダ、マルチ
プレクサ等からなるので1つの主メモリ制御装置6によ
って主メモリ8のキャッシュ領域9にも主メモリのキャ
ッシュ領域9以外にもアクセス可能となることにより、
構成の簡単化を図れる。
【0013】
【実施例】図2は本発明にかかる分散メモリ型並列計算
機のシステム構成図を示す。プロセシングエレメントP
Eはプロセッサ1と主メモリ8とより成る。例えば10
24台のPEが相互結合網21を介して接続されてい
る。
【0014】図3は前記分散型メモリ計算機の分散共有
メモリ空間の説明図である。物理アドレス31は0乃至
24ビットのメモリアドレス空間と25〜34ビットの
PE番号と35ビットに設けられた共有メモリ空間か
(0)あるいはローカル空間か(1)を示すビットから
構成される。
【0015】PE番号0のメモリ空間は、ローカル空間
と共有空間とから成り、その共有空間のうちのPE番号
0用の共有空間はメモリ(PE0)であり、PE番号1
のプロセシングエレメントに設けられた共有メモリ空間
は共有メモリ(PE=1)であり、・・・以下同様にP
E番号N−1のプロセシングエレメントに設けられた共
有メモリ空間は共有メモリ(PE=N−1)を有する。
各プロセシングエレメントPE=0・・・N−1のメモ
リに設けられた共有空間は他のPEからもアクセス可能
であり、その意味において共有メモリが各PEに対して
分散して設けられていることになる。
【0016】図4は本発明の一実施例の各プロセシング
エレメントPEの内部構成図である。プロセシングエレ
メントPEはプロセッサ1と主メモリ8とを有し、プロ
セッサ1がキャッシュ領域アクセス部3を制御するとと
もに、キャッシュ領域アクセス部3は主メモリ8を制御
する。メッセージコントローラ22はデータの転送の場
合にはプロセッサ1から直接制御されるとともに、キャ
ッシュ領域アクセス部3からアドレス信号が入力され
る。メッセージコントローラ22の出力はプロセシング
エレメントPEの外部に送出され相互結合網21を介し
て転送される。
【0017】キャッシュ領域アクセス部3はプロセッサ
1からのアドレスを検出するアドレス検出部4、アドレ
ス検出部4で検出されたアドレスはタグメモリ7に転送
されてタグメモリ7に記憶されているアドレスと比較さ
れ、Hit した場合にはアドレス変換部10を介して変換
されたアドレスにより主メモリ8内に設けられたキャッ
シュ領域9へのアクセスを行う。アドレス検出部4で検
出されたアドレスとタグメモリ7に記憶されたアドレス
との比較の結果、loadの時は Miss をした場合、store
のときはHit とMissの場合ともに、リモートプロセッサ
エレメントPEをアクセスすることとなる。
【0018】図4に示した本発明の実施例のプロセシン
グエレメントPEの動作をより具体的に説明する。ま
ず、リモートstore は、プロセッサ1が発行したstore
命令のアドレス部の上位数ビットを宛先PEの番号と
し、残りの下位ビットを当該PEのメモリアドレスとす
るリモートstore コマンドメッセージをメッセージコン
トローラ22が発生し、そのメッセージを受け取ったP
Eのメッセージコントローラがそのコマンドを解釈し
て、メモリにメッセージのデータをストアすることで実
現される。
【0019】次にリモートloadは、プロセッサ1が発行
したload命令のアドレス部の上位数ビットを宛先PEの
番号とし、残りの下位ビットを当該PEのメモリアドレ
スとするリモートloadコマンドメッセージをメッセージ
コントローラ22が発生し、そのメッセージを受け取っ
たPEのメッセージコントローラがそのコマンドを解釈
して、メモリのデータを読み出してコマンドを発行した
PEに結果のメッセージを返送し、それを受け取った元
のPEのメッセージコントローラがそのメッセージのデ
ータをプロセッサに通知することで実現される。
【0020】これらのリモートload/store が実現され
ることにより、全てのPEにおいて、あるアドレスへの
メモリアクセスが、あるPEのローカルメモリのあるア
ドレスに一意に決まってなされるので、システム全体と
して1つの共有メモリが存在しているように見える、分
散共有メモリが構築される。
【0021】このようにして実現された分散共有メモリ
において、キャッシュ領域アクセス部3に設けられたリ
モートアクセスのアドレスを検出する手段4とタグメモ
リ7によってそのアドレスに対応するデータのコピーが
ローカルメモリのある部分すなわちキャッシュ領域に存
在していることを検出することができる。主メモリ8に
コピーが存在していることを検出するための、コピーの
存在を記憶するタグメモリ7をプロセッサ1が読み出
し、更新することができる。
【0022】リモートloadを行った時、アドレス検出手
段4によりそのアドレスに対応するデータのコピーが主
メモリ8に存在していることが検出された時、リモート
loadのアドレスを対応している主メモリ8に存在するコ
ピーのアドレスに変換するアドレス変換手段10を用い
てそのコピーを読み出し、リモートアクセスの代わりに
プロセッサに結果を返す。
【0023】リモートloadを行った時、アドレス検出手
段4によりそのアドレスに対応するデータのコピーが主
メモリ8に存在していないことが検出された時、プロセ
ッサに例外処理を要求し、その例外処理では、アドレス
変換手段10によって生成されるべきメモリアドレスに
リモートのPEのデータの領域をネットワークを通して
転送し、タグメモリ7を更新してコピーが存在すること
を示すようにする。
【0024】プロセッサ1がプリフェッチ機能によりリ
モートメモリのプリフェッチを行った時、アドレス検出
手段4によりそのアドレスに対応するデータのコピーが
主メモリ8に存在していることが検出された時、プリフ
ェッチのアドレスを対応している主メモリ8に存在する
コピーのアドレスに変換するアドレス変換手段10を用
いてそのコピーを読み出し、プロセッサに結果を返す。
【0025】プロセッサがプリフェッチ機能によりリモ
ートメモリのプリフェッチを行った時、アドレス検出手
段4によりそのアドレスに対応するデータのコピーが主
メモリ8に存在していないことが検出された時、プロセ
ッサに例外処理を要求し、その例外処理では、アドレス
変換手段10によって生成されるべきメモリアドレスに
リモートのPEのデータの領域をネットワークを通して
転送し、タグメモリ7を更新してコピーが存在すること
を示すようにする。
【0026】リモートstore を行った時、アドレス検出
手段4によりそのアドレスの内容のコピーが主メモリ8
に存在していることが検出された時、リモートstore の
アドレスを対応している主メモリ8に存在するコピーの
アドレスに変換するアドレス変換手段10を用いてその
コピーが存在するアドレスのメモリにデータを書き込む
とともに、メッセージコントローラ22にリモートstor
e の発行を要求する。
【0027】さらに、リモートstore を行った時、アド
レス検出手段4によりそのアドレスに対応するデータの
コピーが主メモリ8に存在していないことが検出された
時、メッセージコントローラ22にリモートstore の発
行を要求する。
【0028】図5はライトスルーの場合のPE0の主メ
モリ8に設けられたキャッシュ領域9とリモートstore
が行われるPE1の主メモリ8との関係を示す。図5に
おいてプロセシングエレメントPE0においてそのタグ
メモリ7のタグとプロセッサ1から送られてきたアドレ
スとの比較を行う。リードがHit のときは、PE0の主
メモリ8のキャッシュ領域9からリードが行われ、リー
ドがMissHitのときは、例外処理を実行してリモートP
E1から該当アドレスの内容を転送してきて、タグメモ
リ7に該当アドレスを格納するとともに、キャッシュ領
域9にそのアドレスの内容を格納する。
【0029】ライトのHit が生じた場合にはそのアドレ
スに対応するアドレスがプロセシングエレメントPE0
の主メモリ8のキャッシュ領域9に存在することになる
ので、そのキャッシュ領域9に対してライトが行われ
る。そして、ライトスルー動作に従ってリモートのプロ
セシングエレメントPE1の主メモリ8の共有メモリ空
間に対してリモートstore が行われる。ライトのMiss H
itのときは、プロセシングエレメントPE1の主メモリ
8の共有メモリ空間に対してライトが行われる。
【0030】図6は図4におけるキャッシュ領域アクセ
ス部3をより具体的に示したものである。プロセッサの
アドレス空間は36ビット(64Gバイト)であると
し、その半分の空間35ビット(32Gバイト)を分散
共有メモリ空間として動作させる。もし、システムのP
E数が1024台であったなら、この35ビットの上位
10ビットがPE番号を表し、残り25ビット(32M
バイト)がそれぞれのPEの分散共有メモリのためのア
ドレスとなる。
【0031】リモートメモリのコピーを持つための領域
は、2Mバイトで、ローカルメモリの分散共有メモリと
して使っている領域とは重ならないアドレスを確保す
る。そのためのアドレスの先頭をWTPBASEに設定
しておく。その2Mバイトを2048個の1Kバイトの
領域に分割し、その1Kバイトの範囲で、リモートメモ
リの内容のコピーを保持することになる。
【0032】物理アドレスの0乃至11ビットは1ペー
ジ分のデータすなわち4Kバイトのデータを示し、12
ビット〜20ビットまでの9ビット512エントリはタ
グメモリ7のアドレスを示し、21ビット〜34ビット
はPE番号とそのPEにおける主メモリのアドレスを含
むアドレスを示し、35ビットはローカルメモリ領域か
共有メモリ領域かを示す。
【0033】タグメモリ7は、14ビットの上位アドレ
ス部と4ビットのサブラインを1ワードとする、512
ワードのRAMで構成される。図6を用いて、ライトス
ルーページ方式でライトがHit した場合について説明す
る。アドレス検出手段4は比較器31とアンド回路32
とからなる。まずアドレス検出手段4はプロセッサ1か
ら前記36ビットの物理アドレスを入力し、35ビット
の分散共有メモリアドレスの内の上位14ビットのアド
レスとそこから下位の9ビットのアドレスとするタグメ
モリ7から引き出されたアドレスの内容とを比較器31
で比較する。さらに10ビットおよび11ビットの2ビ
ットをデコードした値とタグメモリ7の4本のサブライ
ンの値とを比較する(図示せず)。言い換えれば、35
ビットの分散共有メモリ空間の、上位14ビットと、そ
こから下位9ビットをアドレスとするタグメモリのワー
ドの上位アドレス部を比較器31で比較し、値が一致し
て、さらに4Kバイトを4つに分割した領域に対応する
サブラインのビットが1であった場合、アンド回路32
の出力は1となり、そのアクセスはHit した(コピーが
主メモリ8のキャッシュ領域9に存在している)とす
る。アドレス部が一致しない、または一致してもサブラ
インのビットが1になっていないならば、そのアクセス
はMissした(コピーが主メモリ8のキャッシュ領域9に
存在していない)とする。
【0034】アンド回路32の出力のHit/Miss信号によ
ってキャッシュヒットまたはミスヒットを判定し、主メ
モリ8内のキャッシュ領域9をアクセスするか否かを決
定する。
【0035】ヒットの場合には、4KBからなるページ
を示す12bit と512エントリを示す9bit とで示さ
れるアドレスのうちの1つのアドレスと、キャッシュ領
域アクセス手段3内に設定されている9ビットのWTP
BASEアドレスとの値とをアドレス変換手段10に設
けられた加算器33によって加えあわせ、その加えあわ
せられたアドレスによって1ページ分のメモリ領域(4
KB)の内の1KBのアドレス領域のうち1つのアドレ
スを特定することとなる。このようにして主メモリ8の
中のキャッシュ領域9を主メモリ制御装置6を用いてア
クセスすることが可能となる。
【0036】そしてライトスルーであるから主メモリ8
のキャッシュ領域9に書き込んだ後には再びリモートst
ore のアドレスが自PEの共有メモリ空間を指している
場合には自PEの主メモリ8の共有メモリ空間をアクセ
スするととなる。もちろん、共有メモリ空間が他PEに
存在するときには自PEの主記憶の中のキャッシュ領域
に書き込んだ後に他PEの該当するアドレス領域にデー
タを書き込むこととなる。
【0037】上述したload/store 、およびHit /Miss
の組み合せの動作の詳細を、表1に示す。
【0038】
【表1】
【0039】動作をまとめると、store に関しては、コ
ピーが存在する場合、コピーを更新してかつリモートst
ore を行い、コピーが存在しない場合、リモートstore
のみを行う(write-through 動作)。load/プリフェッ
チに関しては、コピーが存在する場合、そのコピーから
データを読み出し、コピーが存在しない場合、プロセッ
サの例外処理によってソフトウェアでデータを転送して
メモリにコピーを作る。
【0040】本発明によると、単にリモートload/stor
e のみを行う分散共有メモリと比べると、一度コピーを
作成したキャッシュ領域内の以降のloadは、リモートlo
adにならずに自身のメモリから読み込まれるので、デー
タの処理速度は格段に速くなる。すなわち、データは自
PEの外部キャッシュメモリに存在する場合が一番高速
にアクセスできるのであるが、外部キャッシュメモリの
容量は大きくできないので、多数のプロセシングエレメ
ントを結合した並列計算機システムにあってはリモート
load/store を行う頻度が多くなってしまうが、本発明
によって、キャッシュ領域を自PEの主メモリ内に設定
したので、キャッシュ領域を大きく設定でき、リモート
load/store の動作が起こる確率を低下できるので、シ
ステム全体としては格段と高速化が図れることとなっ
た。
【0041】ただし、この方式においては、一度コピー
が作られた領域への書き込みは、そのままでは、自身の
PEの書き込みしか反映されない。すなわち、あるメモ
リ領域が書き換えられたとして、他のPEでその領域の
コピーを持っている場合は、そのコピーへは書き換え結
果は反映されない。これが反映されていないことは、プ
ログラム作成者の責任において、認識されていると仮定
している。ある実行時点で、他のPEの書き込みを反映
させたい場合には、プログラムで表メモリの当該ワード
をクリアしてコピーを破棄したことを示せば良い。多く
の並列プログラムのアプリケーションは、このような反
映の時点を適切に選ぶことで並列化の効率を高めるもの
であり、このようなプログラム構造を期待する本方式に
よって、不必要なリモートメモリのloadや、複雑なキャ
ッシュメモリのコンシステンシ制御を一切行わずに、分
散共有メモリシステムを効率良く動作させることを可能
とする。
【0042】本発明の上記実施例においてはライトスル
ーページについて説明したが、ライトバックの場合であ
っても主記憶にキャッシュ領域を設けたことはキャッシ
ュヒットの確率を向上させることができる。
【0043】
【発明の効果】本発明によれば、主記憶装置の一部にキ
ャッシュ領域を設けたので、外部キャッシュメモリを不
要とし、したがって外部キャッシュメモリ用のメモリ制
御装置も不要となるうえに、該キャッシュ領域の容量を
大きるすることができ、従って、キャッシュにおけるヒ
ットの確率が増えるので並列計算機システムにおいて他
PEの主記憶からデータを転送させてくる確率が減少す
るので、並列計算機の演算速度を格段と高速化すること
ができる。さらに、外部キャッシュを不要としたので、
外部キャッシュ用メモリ制御装置も不要となり、構成の
簡単化を図れる。
【図面の簡単な説明】
【図1】本発明の原理図である。
【図2】分散メモリ型並列計算機の構成図である。
【図3】分散共有メモリ空間の説明図である。
【図4】本発明に係るプロセシングエレメントの実施例
の構成図である。
【図5】本発明におけるライトスルーページの動作説明
図である。
【図6】図4のキャッシュ領域アクセス部の具体的構成
図である。
【符号の説明】
1 プロセッサ 2 アドレスバス 3 キャッシュ領域アクセス部 4 アドレス検出手段 5 データバス 6 主メモリ制御装置 7 タグメモリ 8 主メモリ 9 キャッシュ領域 10 アドレス変換手段
───────────────────────────────────────────────────── フロントページの続き (72)発明者 清水 俊幸 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (72)発明者 石畑 宏明 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 プロセッサと主メモリからなるプロセシ
    ングエレメント(PE)が相互結合網で多数接続された
    分散メモリ型並列計算機において、 前記主メモリを制御する主メモリ制御手段と、 前記主メモリの一部に設けられたキャッシュ領域を前記
    主メモリ制御手段を介してアクセスするキャッシュ領域
    アクセス手段とを具備することを特徴とする分散メモリ
    型並列計算機のキャッシュ制御方式。
  2. 【請求項2】 前記キャッシュ領域アクセス手段は、 PE番号と前記キャッシュ領域に記憶されたデータのア
    ドレスの一部からなるタグを記憶するタグメモリと、 前記プロセッサから出力されるアドレスの一部であるタ
    グと前記タグメモリのタグとを比較してキャッシュヒッ
    トを判定するアドレス検出手段と、 前記プロセッサから出力されるアドレスを前記キャッシ
    ュ領域にアクセスするためのアドレスに変換するアドレ
    ス変換手段とを有することを特徴とする請求項1記載の
    分散メモリ型並列計算機のキャッシュ制御方式。
  3. 【請求項3】 前記アドレス変換手段は前記プロセッサ
    から出力されるキャッシュ領域に対応するアドレスにキ
    ャッシュ領域アクセス手段の内部に設定されているベー
    スアドレスを加えて前記主メモリ上での前記キャッシュ
    領域のアドレスを生成することを特徴とする請求項1記
    載の分散メモリ型並列計算機のキャッシュ制御方式。
  4. 【請求項4】 前記主メモリ制御手段は主メモリのキャ
    ッシュ領域のアクセスと主メモリのキャッシュ領域以外
    の領域へのアクセスとを兼用して行うことを特徴とする
    請求項1記載の分散メモリ型並列計算機のキャッシュ制
    御方式。
  5. 【請求項5】 プロセッサと主メモリからなるプロセシ
    ングエレメント(PE)が相互結合網で多数接続された
    分散メモリ型並列計算機において、 プロセッサが発行したstore 命令のアドレス部の上位数
    ビットを宛先PEの番号とし、残りの下位ビットを当該
    PEの主メモリアドレスとするリモートstoreコマンド
    メッセージを発生し、そのメッセージを受け取ったPE
    がそのコマンドを解釈して、主メモリにメッセージのデ
    ータをストアすることで、リモートstore を実行する手
    段と、 プロセッサが発行したload命令のアドレス部の上位数ビ
    ットを宛先PEの番号とし、残りの下位ビットを当該P
    Eのメモリアドレスとするリモートloadコマンドメッセ
    ージを発生し、そのメッセージを受け取ったPEのがそ
    のコマンドを解釈して、メモリのデータを読み出してコ
    マンドを発行したPEのプロセッサに結果のメッセージ
    を返送することで、リモートloadを実行する手段と、 前記リモートstore 実行手段あるいは前記リモートload
    実行手段がリモートアクセスを行う際に、リモートアク
    セスのアドレスに対応するデータのコピーが主メモリの
    キャッシュ領域に存在していることを検出するキャッシ
    ュ領域アクセス手段を備えることを特徴とする並列計算
    機のキャッシュ制御方式。
  6. 【請求項6】 前記キャッシュ領域アクセス手段は、主
    メモリのキャッシュ領域にリモートアクセスのアドレス
    に対応するデータのコピーが存在していることを検出す
    るために、コピーの存在を記憶するタグメモリを備える
    ことを特徴とする請求項5記載の並列計算機のキャッシ
    ュ制御方式。
  7. 【請求項7】 前記キャッシュ領域アクセス手段は、 リモートloadを行った時、そのアドレスに対応するデー
    タのコピーが主メモリのキャッシュ領域に存在している
    ことを検出する手段と、 リモートloadのアドレスを対応している主メモリのキャ
    ッシュ領域に存在するコピーのアドレスに変換する手段
    を備え、そのコピーを読み出し、リモートアクセスの代
    わりにプロセッサに結果を返すことを特徴とする請求項
    5記載の並列計算機のキャッシュ制御方式。
  8. 【請求項8】 前記キャッシュ領域アクセス手段は、 リモートloadを行った時、そのアドレスの内容のコピー
    が主メモリのキャッシュ領域に存在していないことを検
    出する手段と、 このとき、主メモリのキャッシュ領域へのリモートPE
    のデータの領域のネットワークを通しての転送に伴って
    更新されるタグメモリとを有することを特徴とする請求
    項5記載の並列計算機のキャッシュ制御方式。
  9. 【請求項9】 前記キャッシュ領域アクセス手段は、 プロセッサがプリフェッチ機能によりリモートメモリの
    プリフェッチを行った時、そのアドレスの内容のコピー
    が主メモリのキャッシュ領域に存在していることを検出
    する手段と、 プリフェッチのアドレスを対応している主メモリのキャ
    ッシュ領域に存在するコピーのアドレスに変換する手段
    を備えて、そのコピーを読み出し、プロセッサに結果を
    返すことを特徴とする請求項5記載の並列計算機のキャ
    ッシュ制御方式。
  10. 【請求項10】 前記キャッシュ領域アクセス手段は、 プロセッサがプリフェッチ機能によりリモートメモリの
    プリフェッチを行った時、そのアドレスの内容のコピー
    が主メモリに存在していないことを検出する手段と、 このとき、主メモリのキャッシュ領域のリモートPEの
    データの領域のネットワークを通しての転送に伴って更
    新されるタグメモリとを有することを特徴とする請求項
    5記載の並列計算機のキャッシュ制御方式。
  11. 【請求項11】 前記キャッシュ領域アクセス手段は、 リモートstore を行った時、そのアドレスの内容のコピ
    ーが主メモリに存在していることを検出する手段と、 リモートstore のアドレスを対応している主メモリのキ
    ャッシュ領域に存在するコピーのアドレスに変換する手
    段とを備えて、そのコピーが存在するアドレスの主メモ
    リにデータを書き込むとともに、リモートstore を発行
    することを特徴とする請求項5記載の並列計算機のキャ
    ッシュ制御方式。
  12. 【請求項12】 前記キャッシュ領域アクセス手段は、 リモートstore を行った時、そのアドレスの内容のコピ
    ーが主メモリに存在していないことを検出する手段を有
    し、 このとき、リモートstore を発行することを特徴とする
    請求項5記載の並列計算機のキャッシュ制御方式。
  13. 【請求項13】 ライトバック動作において、主メモリ
    のキャッシュ領域にリモートアクセスアドレスの内容の
    コピーを記憶する請求項5記載の並列計算機のキャッシ
    ュ制御方式。
JP6167903A 1994-07-20 1994-07-20 分散メモリ型並列計算機のキャッシュ制御方式 Pending JPH0830568A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP6167903A JPH0830568A (ja) 1994-07-20 1994-07-20 分散メモリ型並列計算機のキャッシュ制御方式
US08/503,916 US5742843A (en) 1994-07-20 1995-07-19 Control system for access between processing elements in a parallel computer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6167903A JPH0830568A (ja) 1994-07-20 1994-07-20 分散メモリ型並列計算機のキャッシュ制御方式

Publications (1)

Publication Number Publication Date
JPH0830568A true JPH0830568A (ja) 1996-02-02

Family

ID=15858195

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6167903A Pending JPH0830568A (ja) 1994-07-20 1994-07-20 分散メモリ型並列計算機のキャッシュ制御方式

Country Status (1)

Country Link
JP (1) JPH0830568A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008515069A (ja) * 2004-09-30 2008-05-08 インターナショナル・ビジネス・マシーンズ・コーポレーション プロセッサ・リソースの仮想化のためのシステムおよび方法
WO2013001615A1 (ja) * 2011-06-28 2013-01-03 富士通株式会社 データ処理方法およびデータ処理システム
JP2013130976A (ja) * 2011-12-20 2013-07-04 Fujitsu Ltd 情報処理装置およびメモリアクセス方法
JP2014160502A (ja) * 2014-04-28 2014-09-04 Fujitsu Ltd 情報処理装置およびメモリアクセス方法
JP2015148890A (ja) * 2014-02-05 2015-08-20 富士通株式会社 情報処理装置、情報処理システム、および情報処理システムの制御方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008515069A (ja) * 2004-09-30 2008-05-08 インターナショナル・ビジネス・マシーンズ・コーポレーション プロセッサ・リソースの仮想化のためのシステムおよび方法
JP4639233B2 (ja) * 2004-09-30 2011-02-23 インターナショナル・ビジネス・マシーンズ・コーポレーション プロセッサ・リソースの仮想化のためのシステムおよび方法
WO2013001615A1 (ja) * 2011-06-28 2013-01-03 富士通株式会社 データ処理方法およびデータ処理システム
US9529549B2 (en) 2011-06-28 2016-12-27 Fujitsu Limited Data processing method for storing data and restoration information and data processing system
JP2013130976A (ja) * 2011-12-20 2013-07-04 Fujitsu Ltd 情報処理装置およびメモリアクセス方法
JP2015148890A (ja) * 2014-02-05 2015-08-20 富士通株式会社 情報処理装置、情報処理システム、および情報処理システムの制御方法
US9710047B2 (en) 2014-02-05 2017-07-18 Fujitsu Limited Apparatus, system, and method for varying a clock frequency or voltage during a memory page transfer
JP2014160502A (ja) * 2014-04-28 2014-09-04 Fujitsu Ltd 情報処理装置およびメモリアクセス方法

Similar Documents

Publication Publication Date Title
JP3323212B2 (ja) データプレフェッチの方法およびその装置
US7613884B2 (en) Multiprocessor system and method ensuring coherency between a main memory and a cache memory
JPH0668735B2 (ja) キヤツシユメモリ−
JP3236287B2 (ja) マルチプロセッサシステム
JP2007048296A (ja) 複数のアドレス・キャッシュ・エントリーを無効にする方法、装置およびシステム
JP2004199677A (ja) キャッシュを動作させるためのシステム及び方法
JP2008512758A (ja) 仮想アドレス・キャッシュに格納されたデータを共用する仮想アドレス・キャッシュ及び方法
US6862675B1 (en) Microprocessor and device including memory units with different physical addresses
JPH0830568A (ja) 分散メモリ型並列計算機のキャッシュ制御方式
JP2001249846A (ja) キャッシュメモリ装置及びデータ処理システム
JPS60237553A (ja) キヤツシユコヒ−レンスシステム
JP2552704B2 (ja) データ処理装置
US5933856A (en) System and method for processing of memory data and communication system comprising such system
JPH07234819A (ja) キャッシュメモリ
JP2700147B2 (ja) 命令キャッシュ・フラッシュ・オン・rei制御
JPH06103477B2 (ja) 並列キャッシュメモリ
JPH05342101A (ja) 階層キャッシュ・メモリ
JP2637853B2 (ja) キャッシュメモリ装置
JP3219810B2 (ja) データ処理装置
JPH0553912A (ja) キヤツシユメモリの制御方法
JPH05324473A (ja) キャッシュメモリ方式及びマイクロプロセッサ装置
JPS63240651A (ja) キヤツシユメモリ
JPH0793215A (ja) 半導体記憶装置
JPH06250926A (ja) 複数階層のキャッシュメモリを備えたデータ処理システム
JP2542284B2 (ja) 緩衝記憶装置および緩衝記憶装置システム

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20020115