JPH04152452A - 間接処理依頼機能を持つ並列計算機 - Google Patents

間接処理依頼機能を持つ並列計算機

Info

Publication number
JPH04152452A
JPH04152452A JP2276229A JP27622990A JPH04152452A JP H04152452 A JPH04152452 A JP H04152452A JP 2276229 A JP2276229 A JP 2276229A JP 27622990 A JP27622990 A JP 27622990A JP H04152452 A JPH04152452 A JP H04152452A
Authority
JP
Japan
Prior art keywords
data
address
element processor
processing
processing request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2276229A
Other languages
English (en)
Inventor
Tetsuro Saito
斉藤 鉄郎
Kousuke Sakota
迫田 行介
Akira Muramatsu
晃 村松
Hiroshi Ota
寛 太田
Eiichiro Maeda
栄一郎 前田
Naoki Hamanaka
濱中 直樹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Microcomputer System Ltd
Hitachi Ltd
Hitachi Nuclear Engineering Co Ltd
Renesas Technology America Inc
Original Assignee
Hitachi Microcomputer System Ltd
Hitachi Ltd
Hitachi Nuclear Engineering Co Ltd
Hitachi Micro Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Microcomputer System Ltd, Hitachi Ltd, Hitachi Nuclear Engineering Co Ltd, Hitachi Micro Systems Inc filed Critical Hitachi Microcomputer System Ltd
Priority to JP2276229A priority Critical patent/JPH04152452A/ja
Publication of JPH04152452A publication Critical patent/JPH04152452A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Advance Control (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、並列計算機に関し、特に要素プロセッサ台数
の多い場合に必要とされる物理的に分散した共有メモリ
を持つ超並列計算機に適する。
〔従来の技術〕
処理依頼機能をもつ並列計算機は特開平1−13194
9に述べられている。この従来例は、「それぞれデータ
保持用のメモリを有する複数の要素プロセッサがネット
ワークにより相互に交信可能に結合されている並列計算
機において、第1の要素プロセッサに接続された第1の
メモリに保持された第1のデータと、第2の要素プロセ
ッサに接続された第2のメモリ内の第2のデータを指定
するアドレスと、該第1.第2の要素プロセッサに接続
された第2のデータについて施すべき処理の種別とを含
む処理要求を該第1の要素プロセッサから該第2の要素
プロセッサに送出する第1の手段と、該第2の要素プロ
セッサに設けられ、該アドレスに応答して該第2のメモ
リから該第2のデータを読み出し、該第1のデータと該
第2のデータに対して該処理を施し、該処理の結果デー
タを該第2のメモリに格納する第2の手段」を持つ。ま
た、該第2の手段は該第2の要素プロセッサで実行中の
処理を中断して該処理要求を出よう窮された処理を実行
する手段を有する。あるいは、該第2の手段は、該処理
結果データを該第2のメモリ中の、該第2のデータが記
憶されていた記憶位置に書き込む手段を有する。また、
該第1の手段は該第1のデータおよび該アドレスを指定
する命令に応答して該アドレスから該処理要求を送出す
べき要素プロセッサを判別する手段を有することなどを
特徴とする。
ここで考える並列計算機は物理的には分散されているが
、論理的には共有方式のメモリ(特開平1−13194
9に準じて、以下では分散型共有メモリと呼ぶ)を持つ
システムである。このタイプの並列計算機で処理依頼機
能を持たないものは次のような間接インデックスの再帰
型計算: A(L(I))=A(L(I))十B(I)を第1の要
素プロセッサで実行するとき、第11図のようにまずA
(L(1))をそれを保有する第2の要素プロセッサか
ら読み出し、それに第1の要素プロセッサが保有するB
(I)を加算して、結果を第2の要素プロセッサの元の
A (L (I ))に書き込む。このときは第1の要
素プロセッサではだ2の要素プロセッサが保有するA(
L(I))を受は取るまで実行が中断され、第2の要素
プロセッサでは第1の要素プロセッサからA(L(I)
)とB(I)の加算結果を返されるまで実行が中断され
る。
上に挙げた特開平1−131949ではこのような計算
(即ち、再帰型計算)は第12図に示すようにA、(L
(Iン)のアドレスとデータB(I)と、B(I)とA
(L(1))との間の演算種別(即ち、加算処理)から
なる処理要求を第1の要素プロセッサからA(L(I)
)を保有する第2の要素プロセッサに送出し、第2の要
素プロセッサに前記処理を実行させる。この場合は第1
1図に現れる2つの待ち(ハツチの部分)は無くなる。
〔発明が解決しようとする課題〕
前記従来技術は次のプログラムのように間接アドレスの
データ:B(L(I))を参照する場合に問題が発生す
る。
A(I)=A(I)+B(L(r)) (1)該データをロードするときに要素プロセッサが遊
ぶ。つまり、第13図に示すようにB(L(I))を保
有する第2の要素プロセッサに該データを送ってもらう
ための依頼を第1の要素プロセッサから出し、次に該デ
ータが第2の要素プロセッサから送られてくるまで待つ
必要がある。第13図でハツチの部分が該当する待ちで
ある。
(2)特開平1−131949の場合は、予めB(L(
I))を保有する要素プロセッサが分かる場合はB(L
(I))を保有する要素プロセッサが処理依頼を出せば
要素プロセッサの遊びがなくなるが。
実行時にしかB(L(I))を保有する要素プロセッサ
が分からないときはそれもできない。また予めB(L(
I))を保有する要素プロセッサが分かる場合でもプロ
グラムを書き換える必要がある。
本発明の目的は間接アドレスのプログラムをオーバーヘ
ッドを少なく実行する方法を提供することにある。同時
に通常のシリアルなプログラムを並列計算機向けに変換
するときに変更量を少なくする。
〔課題を解決するための手段〕
上記目的を達成するため、本発明では第1の要素プロセ
ッサに内蔵された第1のメモリ内の第1のデータを指定
するアドレスと第2の要素プロセッサに内蔵された第2
のメモリ内の第2のデータを指定するアドレスと前記第
2の要素プロセッサを指定する要素プロセッサ番号と前
記第1.第2のデータに施すべき処理の種別とを含む処
理依頼を第3の要素プロセッサから前記第1の要素プロ
セッサに送出する第1の手段と前記第1の要素プロセッ
サに設けられ、前記第1のデータを前記第1のアドレス
にしたがって読み出す第2の手段と前記第1のデータと
前記第2のアドレスと前記要素プロセッサ番号と前記流
すべき処理の種別からなる処理依頼を送出する第3の手
段とを設ける。
上記目的を達成するための別の方式として本発明では第
1の要素プロセッサに内蔵された第1のメモリの第1の
データを指定する第1のアドレスと第2の要素プロセッ
サに内蔵された第2のメモリの第2のデータを指定する
第2のアドレスと前記第2のデータの送信依頼とからな
る処理依頼を前記第1の要素プロセッサから前記第2の
要素プロセッサに送出する第1の手段と、前記第2の要
素プロセッサに設けられ、前記第2のアドレスから第2
のデータを読み出し、前記第1のアドレスと第2のデー
タと、データの格納依頼とからなる処理依頼を前記第1
の要素プロセッサに送出する手段とを設ける。
〔作用〕
第14図に示すように該プログラムを実行中の第1の要
素プロセッサは参照するデータが第2の要素プロセッサ
に接続されているメモリに存在する場合は前記第2の要
素プロセッサに前記参照するデータのアドレスと自分に
接続されているメモリ中の定義されるデータのアドレス
と演算処理内容(この場合は加算)と間接処理依頼とを
送出する。これを割り込みとして受信した前記第2の要
素プロセッサは自分の処理を中断して自分に接続されて
いる前記メモリから前記データを読み出し。
前記定義されるデータのアドレスと前記データと前記演
算処理内容からなる処理依頼を前記該プログラムを実行
中の第1の要素プロセッサに送出する。これを割り込み
として受信した前記第1の要素プロセッサは前記定義さ
れるデータと前記データとの間で前記演算処理内容で指
定の演算を実行し、前記アドレスに格納する。
別の方式では該プログラムを実行中の要素プロセッサは
他要素プロセッサに存在する参照するデータの前記他要
素プロセッサに内蔵されたメモリでのアドレスと前記デ
ータを格納するべき自分に内蔵されたメモリでのアドレ
スとデータ送信依頼とを前記他要素プロセッサに送出す
る。これを割り込みとして受信した前記他要素プロセッ
サは前記他要素プロセッサに内蔵されたメモリでのアド
レスからデータを読み出し、前記データを格納するへき
アドレスと前記データとデータの格納依頼とを前記該プ
ログラムを実行中の要素プロセッサに送出する。これを
割り込みとして受信した前記該プログラムを実行中の要
素プロセッサは前記データを自分に内蔵されたメモリの
前記データを格納するへきアドレスに格納する。
どちらの方式でも該プログラムを実行中の要素プロセッ
サはデータの到着を待つ事なく次の動作に移ることがで
きる。
〔実施例〕
本発明の実施例を図に基づいて説明する。第1図は本発
明を実現する要素プロセッサ(以下ではPEと略す)の
1つの内部構成説明図である。第1図で3はPEの動作
を制御する制御回路、5はメモリ、7は種々な演算(算
術演算、論理演算等)を行う演算器、91,93.95
は相互結合網から情報を受信するバッファ、11は前記
バッファに受信した情報のサイズが入る受信カウンタ、
101.103,105は相互結合網に送信する情報を
入れるバッファ、21は前記バッファ(101,103
,105)の情報の送り先のPEの番号を入れるレジス
タ、13は前記バッファ(101,103,105)に
格納した情報のサイズを入れる送信カウンタ、17はデ
ータ部95の切り分けと転送先の切り替えを行う転送分
岐回路、19は演算器7とメモリ5のデータの転送を切
り替えたり、メモリ5や演算器7からデータ部105に
データを転送したりする転送分岐回路である。23は相
互結合網から情報を受信するライン、24は相互結合網
が11にサイズを書き込んだり11がOかどうかを検査
するライン、25は相互結合網が13の値を検査したり
、Oを書き込むライン、26は相互結合網がバッファ(
101,103,105)の情報の送り先のPE番号を
読み取るライン、27はバッファ(lol、103,1
05)の情報を相互結合網が読み取るラインである。
第3図は本発明を実現する並列計算機の全体図である。
第3図でホスト計算機4は補助記憶装置や通信回線との
入呂力やプログラムのPEへのロートなどを受は持つ。
相互結合網2は27のラインから送信カウンタ13で指
定のサイズの情報を読み取ってカウンタ13に0を書き
込む。レジスタ21で指定された番号のPEに対して、
受信カウンタ11がOになるまで待って23のラインか
ら前記情報を書き込む、レジスタ11に書き込んだ情報
のサイズを書く。
第2図は受信用のバッファ(91,93,95)や送信
用のバッファ(101,103,105)に書き込まれ
るデータの構造説明図である。バッファは201の構造
をしており、処理コードとアドレス部は固定長であるが
、データ部は処理コードにより使用されるサイズが違う
。203は間接処理依頼の場合のデータ構造、207は
処理依頼の場合のデータ構造、205はデータ転送依頼
の場合のデータ構造をそれぞれ示している。
以下、第5図から第8図により制御回路3の動作を説明
する。PEは通常のフォンノイマン型の処理装置である
が、ここでは本発明に係わらない部分の説明は省略する
第5図はPEの制御回路3の動作を説明するフローチャ
ートである。命令を1回実行する(ステップ501)度
に、受信カウンタ11が0かどうかを調べ(ステップ5
03)、受信カウンタ11がOならば次に実行する命令
をフェッチ(ステップ505)L、ステップ501に戻
る。受信カウンタ11が0でないときは命令の実行を中
断して受信処理に移り(ステップ607)、受信処理終
了後ステップ503に戻る。
第6図は受信処理の動作を説明するフローチャートであ
る。まず処理コード91を調べ(ステップ601)、処
理コード91が処理依頼ならばその処理を実行しくステ
ップ605)、処理コード91が間接処理依頼ならばそ
の処理を実行する(ステップ603)。
第7図は処理ニード91が間接処理依頼の場合の動作を
説明するフローチャートである。間接処理依頼の場合に
受信するパケットは第2図の203の構造を持つ。まず
203に表されたPE番号のフィールドが自分自身かを
調へ、PE番号が自分自身ならばステップ715に分岐
しくステップ701)、分岐しないときは送信カウンタ
13が0になるのを待ち(ステップ703)、データ部
95からPE番号とリモート演算対象アドレスをそれぞ
れPE番号レジスタ21と103に転送しくステップ7
05)、アドレス部93で指定のデータをメモリ5から
読み出して107に転送しくステップ707)、受信カ
ウンタ11をOにして(ステップ709)、処理依頼の
処理コードを101に書き込み(ステップ711)、送
信カウンタ13に処理コード101とアドレス部103
とデータ部に書き込んだデータのサイズとの合計を書き
込み(ステップ713)、終了する。203のPE番号
が自分自身の場合は、アドレス部93をメモリ5に送り
、該アドレスのデータを転送分岐回路19を介して演算
器7に送り(ステップ715)、データ部95の内部フ
ィールドのリモート演算対象アドレス(第2図203)
を転送分岐回路17を介してレジスタ15に待避しくス
テップ717)、受信カウンタ11に0をセットしくス
テップ719)、前記アドレスをさらにメモリ5に送り
該アドレスのデータを転送分岐回路17を介して演算器
7に送り、ステップ715で演算器7に送ったデータと
の間で処理コード91で指定の演算を実行させ(ステッ
プ721)、前記演算結果をレジスタ15で指定のアド
レスに格納しくステップ723)、終了する。
第8図は処理コード91が処理依頼の場合の動作説明の
フローチャートである。91が処理依頼のときに受信す
るパケットは第2図の207の構造を持つ。アドレス部
93をレジスタ15に待避しながらメモリ5に送り(ス
テップ801)、データ部95から演算データを転送分
岐回路17を介して演算器7に送り、メモリ5から93
で指定のデータを読み呂し、転送分岐回路19を介して
演算器7に送り、依頼された演算を実行しくステップ8
03)、受信カウンタ11にOをセットしくステップ8
05)、演算器7での演算結果をレジスタ15で指定さ
れる(メモリ5の)アドレスに格納する(ステップ80
7)。
ここから本発明の間接処理依頼がPEでどのように実行
されるかを述べる。間接処理依頼は処理の種別とデータ
の属性によりいくつかの種類に分かれる。処理の種別と
しては加算、減算2乗算。
除算、シフト、論理演算等が考えられる。データの属性
には浮動小数点数と固定少数点数や32ビツトか64ビ
ツト等がある。ここでは例として64ビツトの浮動小数
点数の間接加算依頼を取り上げる。まず第4図の(2)
のプログラムを考える。ここでA、B、L、Mは配列で
あり、PEに分散して割り付けられ、インデックスが同
一のA(J)、B(J)、L(J)、M(J)は同じP
Eに割り付けられる。AとBは8バイト実数を要素とし
LとMは4バイト整数を要素とする。間接処理依頼の処
理は3つのPEに渡る6第1に第4図の(2)のプログ
ラムのコードを含むPE(これはインデックスエに対応
する配列を割り付けられるPE)、第2にB(M(I)
)を保有するPE(これはインデックスM(I)に対応
する配列を割り付けられるPE) 、第3に演算の対象
データ(この例ではA(L(I))を保有するPE(こ
れはインデックスL(I)に対応する配列を割り付けら
れるPE)である。これらをそれぞれ第1のPE、第2
のPE、第3のPEと呼ぶ。
第9図を用いて本発明がどのように機能するかをおおま
かに説明する。
第1のPEは第4図の(2)のプログラムを実行するが
第1のPE自身はA(L(I))もB(M(I))も保
有していない。そこで第1のPEから第2のPE、すな
わちB(M(I))を保有するPEに第3のPEに処理
依頼を行うように依頼する間接処理依頼を行う。これを
受は取った第2のPEでは自分の保有するB(M(I)
)を読み出し、第3のPEに処理依頼する。この処理依
頼を受は取った第3のPEがA(L(I))にB(M(
I))を加算する処理を実行して間接処理依頼は終了す
る。
第1のPEの処理:第1のPEでは第2図の(2〕のプ
ログラムを以下のように実行する。
ユーザのプログラムはM(I)から要素B(M(I))
を保有するPEを計算する。他のPEがB(M(I))
を保有する場合は間接処理依頼の命令を発行する。
間接処理依頼の命令書式は XROP  pHll、ADDRI、PEA2.ADD
R2の形式である。ここでXROPはオペコード部で演
算の種類とデータの属性により何通りかに分かれる。P
ER1は間接処理依頼を送るPEを指定する番号であり
、この例ではB(M(I)5を保有するPEを指定する
。ADDRlはPEA1のメモリ中のデータのアドレス
であり、ここではB(M(I))のアドレスを指定する
。PEA2はPEA1のPEから処理依頼を送るPEを
指定する番号であり、この例ではA(L(I))を保有
するPEを指定する。ADDR2はPEA2のメモリ中
のデータのアドレスであり、この例ではA(L(I))
のアドレスを指定する。PEA1゜PE#2.ADDR
I、ADDR2はレジスタまたはメモリで渡される。
間接処理依頼命令が発行されると、第1のPEの制御回
路3はPE#1.PE#2.ADDRI。
ADDR2から間接処理依頼のパケットを作成する。送
信カウンタ13が0になるまで待ち、PE31をPE番
号レジスタ21に書き込み、8バイト実数の間接加算依
頼の処理コードを101に書き込み、ADDRIをアド
レス部103に書き込み、ADDR2とPE#2をデー
タ部107(第2図の201のリモート演算対象アドレ
スとPE番号の部分)に書き込む。そして処理コード1
01、アドレス部103.データ部107を合わせたサ
イズを送信カウンタ13に書き込む。制御回路3はこの
あと次の命令の実行に移る。
101.103,107に書き込まれたデータは結合網
2によりPE番号レジスタ21で指定のPE、この場合
は第2のPEに送られる。
第2のPEの処理:制御回路3は命令を1回実行する(
ステップ501)度に、受信カウンタ11を検査して(
ステップ503)、11が0でなければ受信処理に移る
(ステップ5o7)。まず、処理コート91を読み(ス
テップ601)、間接処理依頼と分かると間接処理依頼
に移る(ステップ603)。データ部のPE番号(第2
図203参照)が第2のPE自身でないときは、送信カ
ウンタ13がOになるのを待ち(ステップ703)−デ
ータ部95からPE番号とリモート演算対象のアドレス
をそれぞれPE番号レジスタ21とアドレス部103に
送り(ステップ7o5)、アドレス部93で指定のデー
タをメモリ5から読み出し、データ部105に転送しく
ステップ107)、受信カウンタ11に○をセットしく
ステップ709)、処理依頼の処理コードを101に書
き(ステップ711)、送信カウンタ13に(101,
103,105)に書き込んだ情報の合計サイズを書き
込み(ステップ713)、ステップ701でPE番号が
第2のPE自身のときは、アドレス部93をメモリ5に
送り、該アドレスのデータを転送分岐回路19を介して
演算器7に送り(ステップ715)、データ部95の内
部フィールドのリモート演算対象アドレスを転送分岐回
路17を介して15に送り、待避しくステップ717)
、受信カウンタ11にOをセットしくステップ719)
、前記リモート演算対象アドレスをメモリ5に送り、該
アドレスのデータを読み高し、転送分岐回路17を介し
て演算器7に送り、91で指定された演算を実行させ(
ステップ721)、演算結果をレジスタ15で指定され
たアドレスに格納する(ステップ723)。
第2のPEの処理でステップ701のPE番号が第2の
PE自身と一致する場合は間接処理依頼は第2のPEで
終了し、第3のPEの処理は存在しない。また第3のP
Eが第1のPEと一致する場合、例えば第4図の(1)
のプログラム、もある。
第3図のPEの処理二制御回路3は命令を1回実行する
(ステップ501)度に、受信カウンタ11を検査して
(ステップ503)、11が0でなければ受信処理に移
る(ステップ507)。まず、処理コード91を読み(
ステップ601)、処理依頼と分かると処理依頼に移る
(ステップ605)。アドレス部93をレジスタ15に
待避してメモリ5に送り(ステップ801)、データ部
95のデータと前記アドレス部93で指定のデータとを
演算器7に送り、91で指定された演算を実行しくステ
ップ803)、受信カウンタ11に0をセントしくステ
ップ805)、?寅算器7での演算結果をレジスタ15
で指定のアドレスに格納する(ステップ8o7)。
次に間接処理依頼の変型としてデータの転送依頼を考え
る。これは第4図の(3)のようなプログラムを実行す
る場合にユーザプログラムはB(L(I))とC(M(
I))をA(I)を保有するPEにデータの転送依頼命
令を発行する。転送依頼命令の書式は XLOAD  ADDRI、ADDR2,PE#である
。ここでXLOADはオペコードであり、データサイズ
により何種類かある。ADDRIは転送してもらうデー
タを格納するアドレスで、ADDR2は転送してもらう
データのアドレスであり、PE#は転送してもらうデー
タを保有するPEを指定する。
転送依頼命令が発行されると制御回路3は第4図の20
5のパケットを作って、データを保有するPEに送信す
る。まず、送信カウンタ13が0になるのを待ち、AD
DRlをデータ格納アドレスに書き込み、ADDR2を
アドレス部103に書き込み、PE#をPE番号レジス
タ21に書き込み、データ転送依頼の処理コードを10
1に書き込み、送信カウンタ13に(101,103゜
105)に書き込んだデータの総計を書く。
次にこのパケットを受信したPEの制御装置3の処理を
第10図に従って説明する。
制御装置3は送信カウンタ13がOになるのを待ち(ス
テップ1001)、データ部95からPE番号とデータ
格納アドレス(第2図203)をPE番号レジスタ21
と103に転送しくステップ1003)、アドレス部9
3で指定のアドレスからデータを読み出し107に転送
しくステップ1005)、受信フラグ11を0にして(
ステップ1007)、データ格納の処理コードを101
に書き、送信カウンタ13に処理コートのサイズとデー
タ格納アドレスのサイズと格納するデータのサイズの和
を書く (ステップ1011)。
該パケットは前記PE番号レジスタ21で指定のPEに
送られる。これを受信したPE(この場合はデータ転送
依頼を送ったPE)では受信したパケットのデータ部9
5をアドレス部93で指定のアドレスに格納する。
第10図で述へたデータ転送依頼ではプログラムを実行
するPEでは転送依頼を出したデータはワーク領域に格
納されるが、参照するときは転送の終了を保証する手段
が必要になる。それには転送データを格納するワーク領
域としてタグ付きのメモリを使用すれば良い。タグ付き
メモリは特開平1−194055 1i’並列計算機」
がある。プログラムを実行するPEの制御回路3は転送
依頼のパケットを送る前にタグをリセットする。そして
格納依頼のパケットを受信してデータをタグ付きメモリ
に格納するときにタグをセットする。該データを参照す
るときはタグがセットされていなければビジーウェイト
する。
〔発明の効果〕
本発明によれば、プログラムを実行するPEが再帰型演
算で参照するデータを他のPEが保有する場合にもデー
タのロードを待つ必要がなく、間接処理依頼を前記他の
PEに送ることにより前記プログラムを実行するPEは
次の動作に移れる。
また定義されるデータがプログラムを実行するPEに依
存しなくても同じ処理で実行できる利点もある。
【図面の簡単な説明】
第1図は要素プロセッサの本発明に係わる構成部分の説
明図、第2図は要素プロセッサが受信するパケットのう
ち本発明に係わるものの構造説明図、第3図は並列計算
機システムの全体図、第4図は本発明による実行動作が
改良されるプログラムの一例を示す図、第5図は制御回
路3の動作の説明図、第6図は制御回路3の受信処理の
説明図、第7図は受信処理のうち処理コード91が処理
依頼の場合の詳細説明図、第8図は受信処理のうち処理
コート91が間接処理依頼の場合の詳細説明図、第9図
は間接処理依頼の処理の流れの説明図、第1o図は間接
処理依頼のうちデータ転送依頼の処理説明図、第11図
は通常の分散型共有メモリの並列計算機での間接アドレ
スのプログラム実行説明図、第12図は処理依頼機能を
持つ並列計算機での間接アドレスのプログラム実行説明
図、第13図は処理依頼機能を持つ並列計算機で間接ア
ドレスの参照があるプログラムの実行説明図、第14図
は本発明を使用して間接アドレスの参照があるプログラ
ムの実行説明図である。 1・要素プロセッサ、2・・・相互結合網、3・・・制
御回路、4・・・ホスト計算機、5・メモリ、7・・演
算器、11・・受信カウンタ、13・・・送信カウンタ
、15・レジスタ、17.19・・転送分岐回路、21
・・PE番号レジスタ、91,93.95・・・受信バ
ッファ、101,103,107・・送信バッファ。 第 4 (2) A  (Iン ・A(1)十 8(ム (1υA  (
1(x>)  ・ A  (1(1))−f  B(M
(丁))A (1)  =A  (1)  +F3(L
  (1))  ′f c(f’i(I〕)箭 図 閉 拓 図 拓 凶

Claims (1)

  1. 【特許請求の範囲】 1、それぞれデータ保持用のメモリを有する複数の要素
    プロセッサを互いに結合した処理依頼機能を持つ並列計
    算機において、 第1の要素プロセッサに内蔵された第1のメモリ内の第
    1のデータを指定するアドレスと第2の要素プロセッサ
    に内蔵された第2のメモリ内の第2のデータを指定する
    アドレスと前記第2の要素プロセッサを指定する要素プ
    ロセッサ番号と前記第1、第2のデータに施すべき処理
    の種別とを含む処理依頼を第3の要素プロセッサから前
    記第1の要素プロセッサに送出する第1の手段と、前記
    第1の要素プロセッサに設けられ、前記第1のデータを
    前記第1のアドレスにしたがって読み出す第2の手段と
    、前記第1のデータと前記第2のアドレスと前記要素プ
    ロセッサ番号と前記施すべき処理の種別からなる処理依
    頼を前記第1の要素プロセッサから前記第2の要素プロ
    セッサに送出する第3の手段とを有することを特徴とす
    る間接処理依頼機能を持つ並列計算機。 2、それぞれデータ保持用のメモリを有する複数の要素
    プロセッサを互いに結合した並列計算機において、 第1の要素プロセッサに内蔵された第1のメモリの第1
    のデータを指定する第1のアドレスと第2の要素プロセ
    ッサに内蔵された第2のメモリの第2のデータを指定す
    る第2のアドレスと前記第2のデータの送信依頼とをか
    らなる処理依頼を前記第1の要素プロセッサから前記第
    2の要素プロセッサに送出する第1の手段と、前記第2
    の要素プロセッサに設けられ、前記第2のアドレスから
    第2のデータを読み出し、前記第1のアドレスと第2の
    データと、データの格納依頼とをからなる処理依頼を前
    記第1の要素プロセッサに送出する手段とを設けたこと
    を特徴とする間接処理依頼機能を持つ並列計算機。 3、請求項2に記載の計算機において、各要素プロセッ
    サはデータの受信で同期を取る手段をもつことを特徴と
    する間接処理依頼機能を持つ並列計算機。
JP2276229A 1990-10-17 1990-10-17 間接処理依頼機能を持つ並列計算機 Pending JPH04152452A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2276229A JPH04152452A (ja) 1990-10-17 1990-10-17 間接処理依頼機能を持つ並列計算機

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2276229A JPH04152452A (ja) 1990-10-17 1990-10-17 間接処理依頼機能を持つ並列計算機

Publications (1)

Publication Number Publication Date
JPH04152452A true JPH04152452A (ja) 1992-05-26

Family

ID=17566495

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2276229A Pending JPH04152452A (ja) 1990-10-17 1990-10-17 間接処理依頼機能を持つ並列計算機

Country Status (1)

Country Link
JP (1) JPH04152452A (ja)

Similar Documents

Publication Publication Date Title
US4951193A (en) Parallel computer with distributed shared memories and distributed task activating circuits
EP0087978B1 (en) Information processing unit
US5870625A (en) Non-blocking memory write/read mechanism by combining two pending commands write and read in buffer and executing the combined command in advance of other pending command
US5386566A (en) Inter-processor communication method for transmitting data and processor dependent information predetermined for a receiving process of another processor
JPH01131949A (ja) 処理依頼機能を持つ並列計算機
JPH03219345A (ja) 多ポートキャッシュメモリ制御装置
US5021991A (en) Coprocessor instruction format
US5696957A (en) Integrated circuit comprising a central processing unit for executing a plurality of programs
JP3431941B2 (ja) データ処理システムにおける命令の実行順序を決定する方法および装置
US20030177273A1 (en) Data communication method in shared memory multiprocessor system
JP2736237B2 (ja) 遠隔メモリアクセス制御装置
US4994961A (en) Coprocessor instruction format
JPH04152452A (ja) 間接処理依頼機能を持つ並列計算機
JP2568017B2 (ja) マイクロプロセッサ及びそれを使用したデータ処理システム
US4758978A (en) Method and apparatus for selectively evaluating an effective address for a coprocessor
JPH08212178A (ja) 並列計算機
JP2602241B2 (ja) 並列計算機
JPS592058B2 (ja) 記憶装置
JP2765882B2 (ja) 並列計算機,ベクトルレジスタ間データフロー同期装置およびネットワークプリセット装置
JP3144918B2 (ja) ベクトル処理装置
JP2517859B2 (ja) 並列プロセス管理方法
US4811274A (en) Method and apparatus for selectively evaluating an effective address for a coprocessor
JPS59151242A (ja) デ−タ駆動型計算機の待ち行列制御方式
KR950008838B1 (ko) 멀티미디어 지식처리를 위한 병렬처리 컴퓨터의 노드 컴퓨터 구조
JPS58154058A (ja) マルチプロセッサシステム