JPH04167191A - 分散メモリ型並列計算機における高速データ転送方式 - Google Patents
分散メモリ型並列計算機における高速データ転送方式Info
- Publication number
- JPH04167191A JPH04167191A JP2294329A JP29432990A JPH04167191A JP H04167191 A JPH04167191 A JP H04167191A JP 2294329 A JP2294329 A JP 2294329A JP 29432990 A JP29432990 A JP 29432990A JP H04167191 A JPH04167191 A JP H04167191A
- Authority
- JP
- Japan
- Prior art keywords
- data
- register
- address
- memory
- holding means
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 5
- 238000003672 processing method Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 241000353097 Molva molva Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
Landscapes
- Multi Processors (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔目次〕
概要
産業上の利用分野
従来の技術(第4図、第5図)
発明が解決しようとする課題
課題を解決するための手段(第1図)
作用
実施例(第2図、第3図)
発明の効果
〔概要〕
分散メモリ型並列計算機における高速データ転送方式に
関し、 分散メモリ型の並列計算機システムにおいて、多次元巨
大配列を各プロセッサに分割配列したとき、任意次元方
向に高速アクセス可能とすることを目的とし、 プロセッサとメモリを有するプロセッシング・エレメン
トを複数接続し、2次元以上の次元の行列データを各プ
ロセッシング・エレメントにおいて並列処理するデータ
処理方式において、プロセッシング・エレメントに転送
制御部を設けるとともに、この転送制御部に、アドレス
保持手段と、データ間隔保持手段と、これらアドレス保
持手段とデータ間隔保持手段のデータを加算する加算手
段と、データ数保持手段と、データ数を計数するカウン
ト手段と、これらデータ数保持手段とカウント手段の各
位を比較する比較手段を設け、前記アドレス保持手段に
セットされた先頭アドレスと、加算手段の出力にもとつ
きメモリを順次アクセスして高速に必要とするデータを
得るように構成する。
関し、 分散メモリ型の並列計算機システムにおいて、多次元巨
大配列を各プロセッサに分割配列したとき、任意次元方
向に高速アクセス可能とすることを目的とし、 プロセッサとメモリを有するプロセッシング・エレメン
トを複数接続し、2次元以上の次元の行列データを各プ
ロセッシング・エレメントにおいて並列処理するデータ
処理方式において、プロセッシング・エレメントに転送
制御部を設けるとともに、この転送制御部に、アドレス
保持手段と、データ間隔保持手段と、これらアドレス保
持手段とデータ間隔保持手段のデータを加算する加算手
段と、データ数保持手段と、データ数を計数するカウン
ト手段と、これらデータ数保持手段とカウント手段の各
位を比較する比較手段を設け、前記アドレス保持手段に
セットされた先頭アドレスと、加算手段の出力にもとつ
きメモリを順次アクセスして高速に必要とするデータを
得るように構成する。
〔産業上の利用分野]
本発明は多次元行列データの各プロセッサ間スライドア
クセス方式に関し、特に各プロセッサのメモリ上に分散
配置された所定のデータを他のプロセッサより高速アク
セス可能としたものである。
クセス方式に関し、特に各プロセッサのメモリ上に分散
配置された所定のデータを他のプロセッサより高速アク
セス可能としたものである。
多数のデータを高速で処理するため、プロセッサとメモ
リを有する多数のプロセッシング・エレメント(Pro
cessing E1es+ent:PE)をネ・ント
ワークで接続し、プロセッサ間でデータの送受信を行う
並列接続コンピュータ処理方式がある。このような並列
接続コンピュータ処理方式により例えば気象のシミュレ
ーションのような科学計算が行れている。
リを有する多数のプロセッシング・エレメント(Pro
cessing E1es+ent:PE)をネ・ント
ワークで接続し、プロセッサ間でデータの送受信を行う
並列接続コンピュータ処理方式がある。このような並列
接続コンピュータ処理方式により例えば気象のシミュレ
ーションのような科学計算が行れている。
このとき、演算対象のモデルを格子状に切り、各格子点
の流速、圧力、温度等を与えられた条件の元で計算を行
う。例えば天気予報の場合、格子点を細かくすれば地域
に密着した正確な予測が可能となる。しかし格子点の数
が多い程データ量も大きくなり、第4図に100で示す
共通メモリに全部のデータを格納するとき、共通メモリ
は巨大な容量のものが必要となる。
の流速、圧力、温度等を与えられた条件の元で計算を行
う。例えば天気予報の場合、格子点を細かくすれば地域
に密着した正確な予測が可能となる。しかし格子点の数
が多い程データ量も大きくなり、第4図に100で示す
共通メモリに全部のデータを格納するとき、共通メモリ
は巨大な容量のものが必要となる。
このため、各PE01PEI、−P E nをネットワ
ーク101で接続し、各PEにはそれぞれCPU及びメ
モリMを設ける。そしてこれらのPEで各格子点の演算
を遂行する。第4図の例では、PEOが共通メモリ領域
のうち、メモリ領域S。
ーク101で接続し、各PEにはそれぞれCPU及びメ
モリMを設ける。そしてこれらのPEで各格子点の演算
を遂行する。第4図の例では、PEOが共通メモリ領域
のうち、メモリ領域S。
のデータにもとづき演算を行い、PEIがメモリ領域S
1のデータにもとづき演算を行い、PEnがメモリ領域
Snのデータにもとづき演算を行う。
1のデータにもとづき演算を行い、PEnがメモリ領域
Snのデータにもとづき演算を行う。
そしてこれらの演算結果は各PEのメモリMに保持され
ている。なお共通メモリ100におけるデータ配列は、
矢印に示す如く配列されているものとする。
ている。なお共通メモリ100におけるデータ配列は、
矢印に示す如く配列されているものとする。
ところで科学演算の場合に、例えば行列間の乗算が行わ
れることがある。この場合、PEでは、第4図の共通メ
モリ100に一点鎖線で示す如く、縦方向に配置された
データを必要とする。この縦方向の配置データは、一部
は自己のメモリM内に保持されているが、その他のもの
は他のPEより転送することが必要となる。例えば、第
5図に示す如く、データ配列される場合、PEOでは一
点鎖線で示すデータを必要とするため、PEIからアド
レス49.59.69.79のデータを転送することが
必要となる。なお、第5図の数字はアドレスである。
れることがある。この場合、PEでは、第4図の共通メ
モリ100に一点鎖線で示す如く、縦方向に配置された
データを必要とする。この縦方向の配置データは、一部
は自己のメモリM内に保持されているが、その他のもの
は他のPEより転送することが必要となる。例えば、第
5図に示す如く、データ配列される場合、PEOでは一
点鎖線で示すデータを必要とするため、PEIからアド
レス49.59.69.79のデータを転送することが
必要となる。なお、第5図の数字はアドレスである。
ところで、メモリは、アドレス順方向に連続アクセスす
ることは可能であるが、前記−点鎖線のように他の方向
については連続アクセスすることができない。
ることは可能であるが、前記−点鎖線のように他の方向
については連続アクセスすることができない。
そのため、このような場合、メモリ領域S1全体をとり
込み必要とするデータを抽出するか、それとも必要とす
るデータ単位にアドレスを送出して転送させることが必
要であり、そのため高速に所望のデータを得ることがで
きず、データ処理速度が遅くなるという問題がある。
込み必要とするデータを抽出するか、それとも必要とす
るデータ単位にアドレスを送出して転送させることが必
要であり、そのため高速に所望のデータを得ることがで
きず、データ処理速度が遅くなるという問題がある。
したがって本発明の目的は、このように巨大多次元配列
を各プロセッサ上のメモリに分散配置した場合でも高速
に所望のデータが得られる多次元行列データの各プロセ
ッサ間スライドアクセス方式を提供することである。
を各プロセッサ上のメモリに分散配置した場合でも高速
に所望のデータが得られる多次元行列データの各プロセ
ッサ間スライドアクセス方式を提供することである。
前記目的を達成するため、本発明では、第1図に示す如
く、PEIにCPUl0、メモリ部11、転送制御部1
2を設けるとともに、メモリ部11に配列データ部11
−〇と管理テーブル11−1を設ける。配列データ部1
1−〇は、前記巨大な共通メモリの分散された例えばメ
モリ領域S1の部分を格納するものである。
く、PEIにCPUl0、メモリ部11、転送制御部1
2を設けるとともに、メモリ部11に配列データ部11
−〇と管理テーブル11−1を設ける。配列データ部1
1−〇は、前記巨大な共通メモリの分散された例えばメ
モリ領域S1の部分を格納するものである。
転送制御部12には、加算器12−0、比較器12−1
、レジスタ12−2〜12−5、カウンタ12−6、+
1加算器12−7等が設けられている。なお13はドラ
イバである。
、レジスタ12−2〜12−5、カウンタ12−6、+
1加算器12−7等が設けられている。なお13はドラ
イバである。
いま、PEIよりPEOに対し、第5図に示す如く、ア
ドレス49.59.69.79の4個のデータを送出す
る場合について説明する。
ドレス49.59.69.79の4個のデータを送出す
る場合について説明する。
PEIのCPUl0は、メモリ部11の管理テーブル1
1−1に、送信先即ち宛先PE (DEST PE)
としてPEOを記入し、レングス(LENGTH)とし
て4を記入し、ソース側続出アドレス(SRCADR)
として49を記入し、ソース側続出データ距離(SRC
D I ST)として10を記入し、送出先PEの記入
先アドレス(DEST ADR)としてBOを記入し
、送出先の配列データ部に対するデータ間隔値(DES
T DIST)として1(連続的に格納する)を記入
する。なおこれらの各データは、送信先のPEOより伝
送されてもよく、ソース側のPEIで作成してもよい。
1−1に、送信先即ち宛先PE (DEST PE)
としてPEOを記入し、レングス(LENGTH)とし
て4を記入し、ソース側続出アドレス(SRCADR)
として49を記入し、ソース側続出データ距離(SRC
D I ST)として10を記入し、送出先PEの記入
先アドレス(DEST ADR)としてBOを記入し
、送出先の配列データ部に対するデータ間隔値(DES
T DIST)として1(連続的に格納する)を記入
する。なおこれらの各データは、送信先のPEOより伝
送されてもよく、ソース側のPEIで作成してもよい。
CPUl0が転送制御部12に起動をかけると、転送制
御部12はメモリ部11よりこの管理テーブル11−1
を読み出し、レジスタ12−3にソース側続出アドレス
(49)をセットし、レジスタ12−4にソース側続出
データ距離(10)をセントし、レジスタI2−5には
送出データ長(4)をセットし、カウンタ12−6を初
期設定値「0」とする。
御部12はメモリ部11よりこの管理テーブル11−1
を読み出し、レジスタ12−3にソース側続出アドレス
(49)をセットし、レジスタ12−4にソース側続出
データ距離(10)をセントし、レジスタI2−5には
送出データ長(4)をセットし、カウンタ12−6を初
期設定値「0」とする。
最初は、リード・アドレス・レジスタであるレジスタエ
2−2にレジスタ12−3にセットされた続出アドレス
(49)がセットされ、メモリ部11を読み出すので、
アドレス49のデータが出力される。このとき、カウン
タ12−6は+1されてrl」となる。
2−2にレジスタ12−3にセットされた続出アドレス
(49)がセットされ、メモリ部11を読み出すので、
アドレス49のデータが出力される。このとき、カウン
タ12−6は+1されてrl」となる。
次にレジスタ12−2にはレジスタ12−3にセットさ
れた(49)と、レジスタ12−4にセットされた(1
0)が加算器12−〇で加算された(59)がセットさ
れるので、アドレス59のデータが出力され、カウンタ
12−6は+1されてU2」となる。このようにしてレ
ジスタ12−2に(69)(79)が順次セットされて
アドレス(69)(79)のデータが出力されたとき、
カウンタ12−6は「4」をカウントするので、比較器
12−1はレジスタ12−5にセットされたデータ長と
一致したことを検知し、データの読み出しは終了する。
れた(49)と、レジスタ12−4にセットされた(1
0)が加算器12−〇で加算された(59)がセットさ
れるので、アドレス59のデータが出力され、カウンタ
12−6は+1されてU2」となる。このようにしてレ
ジスタ12−2に(69)(79)が順次セットされて
アドレス(69)(79)のデータが出力されたとき、
カウンタ12−6は「4」をカウントするので、比較器
12−1はレジスタ12−5にセットされたデータ長と
一致したことを検知し、データの読み出しは終了する。
転送制御部12は、このようにして得られた、アドレス
49.59.69.79のデータを送出するため、管理
テーブル11−1より送出先としてPEO、データ長と
して4、記入先アドレスとしてBO、データ間隔値とし
て1を記入したヘッダを有するパケットを作りこれに前
記各アドレスのデータ49.59.69.79をのせて
通信ネットワークCに送出する。
49.59.69.79のデータを送出するため、管理
テーブル11−1より送出先としてPEO、データ長と
して4、記入先アドレスとしてBO、データ間隔値とし
て1を記入したヘッダを有するパケットを作りこれに前
記各アドレスのデータ49.59.69.79をのせて
通信ネットワークCに送出する。
このようにして演算器2では所定のデータが簡単に得ら
れることになる。
れることになる。
本発明の一実施例を第2図にもとづき説明する。
第2図において第1図と同一記号は同一部分を示す。
PEOは、PEIと同様に構成され、CPU 10′、
メモリ部11′、受信制御部14、レシーバ15を具備
している。なお、第2図は、PEIからPEOにデータ
転送する場合を示しているために、他の構成については
省略しているが、PEOにはPEIに示したものと同様
に転送制御部、ドライバ等が設けられており、PEIに
はこれまたPEOに示したものと同様に受信制御部、レ
シーバ等が設けられている。
メモリ部11′、受信制御部14、レシーバ15を具備
している。なお、第2図は、PEIからPEOにデータ
転送する場合を示しているために、他の構成については
省略しているが、PEOにはPEIに示したものと同様
に転送制御部、ドライバ等が設けられており、PEIに
はこれまたPEOに示したものと同様に受信制御部、レ
シーバ等が設けられている。
メモリ部11′には、配列データ部11−0’と管理テ
ーブル部11−1’が設けられる。
ーブル部11−1’が設けられる。
受信制御部14には、加算器14−0、比較器14−1
、レジスタ14−2〜14−5、カウンタ14−6、+
1加算器14−7等が設けられている。
、レジスタ14−2〜14−5、カウンタ14−6、+
1加算器14−7等が設けられている。
■ いまPEOで、PEIが分散保持しているデータの
転送要求を求めるとき、PEOは転送依軌電文を作成し
、転送データ数(LENGTH)、データの読み出し先
頭位置を示すソース側続出アドレス(SRCADH)
、ソース側続出データ距離(SRCDIST)、PEO
における受信データの記入先頭位置を示す記入先アドレ
ス(DEST ADR) 、受信データの記入距離を
示すデータ間隔値(DEST D I ST)を記入
した送信電文を作成し、図示省略したドライバ及び通信
ネットワークCを経由してこれをPEIに送出する。ソ
ース側のPEIでは、これを図示省略したレシーバを介
して受信し、そのデータを解読し、メモリ部11の管理
テーブル11−1にこれらを記入する。
転送要求を求めるとき、PEOは転送依軌電文を作成し
、転送データ数(LENGTH)、データの読み出し先
頭位置を示すソース側続出アドレス(SRCADH)
、ソース側続出データ距離(SRCDIST)、PEO
における受信データの記入先頭位置を示す記入先アドレ
ス(DEST ADR) 、受信データの記入距離を
示すデータ間隔値(DEST D I ST)を記入
した送信電文を作成し、図示省略したドライバ及び通信
ネットワークCを経由してこれをPEIに送出する。ソ
ース側のPEIでは、これを図示省略したレシーバを介
して受信し、そのデータを解読し、メモリ部11の管理
テーブル11−1にこれらを記入する。
■ PEIでは、CPUl0がこの受信電文にもとづき
、メモリ11の管理テーブル11−1に宛先となる送出
先PEOを記入し、これら管理テーブル11−1にもと
づき送信パケットのヘッダをメモリ部11に作成する。
、メモリ11の管理テーブル11−1に宛先となる送出
先PEOを記入し、これら管理テーブル11−1にもと
づき送信パケットのヘッダをメモリ部11に作成する。
この場合、管理テーブル11−1をヘッダとしてもよい
。このヘッダには、前記の如く、宛先PE番号(DES
T PE)、転送データ数つまりレングス(LENG
TH)、ソース側続出アドレス(SRCADR)、ソー
ス側続出データ距@ (SRCD I ST)、送出先
PEの記入先アドレス(D E S T’ A DR
)、そのデータ間隔値(DEST D I ST)が
記入される。
。このヘッダには、前記の如く、宛先PE番号(DES
T PE)、転送データ数つまりレングス(LENG
TH)、ソース側続出アドレス(SRCADR)、ソー
ス側続出データ距@ (SRCD I ST)、送出先
PEの記入先アドレス(D E S T’ A DR
)、そのデータ間隔値(DEST D I ST)が
記入される。
■ それからCPUl0が転送制御部12に対し起動信
号を送出し、起動をかける。
号を送出し、起動をかける。
■ 転送制御部12は、メモリ部ll上のヘッダを読み
出し、レジスタ12−3にソース側続出アドレス(SR
CADR)をセットし、レジスタ12−4にソース側読
出データ距離(SRCDIST)をセットし、レジスタ
12−5には、レングス(LENGTH)をセットし、
カウンタ12−6を初期値「0」にする。
出し、レジスタ12−3にソース側続出アドレス(SR
CADR)をセットし、レジスタ12−4にソース側読
出データ距離(SRCDIST)をセットし、レジスタ
12−5には、レングス(LENGTH)をセットし、
カウンタ12−6を初期値「0」にする。
■ 次に転送制御部12は、レジスタ12−4に記入さ
れたソース側続出アドレスをレジスタ12−2に記入し
てこれを開始アドレスとしてメモリ部11−0を読み出
し、カウンタ12−6を+1し、次にレジスタ12−3
に記入された開始アドレスにレジスタ12−4に記入さ
れたソース側読出データ距離を加算器12−0に加算し
てレジスタ12−2にセットし、次の読み出しアドレス
としてメモリ部11−0を読み出す。このとき加算器1
2−0の加算値をレジスタ12−3に転記する。このよ
うにして、メモリ部11から所望のデータを順次読み出
す。そしてカウンタ12−6の値がレジスタ12−5に
セットされたランレングスと一致したことを比較器12
−1が検出するとき、所望の数のデータが読出されたこ
とが示されるので、この読み出し処理が終了する。
れたソース側続出アドレスをレジスタ12−2に記入し
てこれを開始アドレスとしてメモリ部11−0を読み出
し、カウンタ12−6を+1し、次にレジスタ12−3
に記入された開始アドレスにレジスタ12−4に記入さ
れたソース側読出データ距離を加算器12−0に加算し
てレジスタ12−2にセットし、次の読み出しアドレス
としてメモリ部11−0を読み出す。このとき加算器1
2−0の加算値をレジスタ12−3に転記する。このよ
うにして、メモリ部11から所望のデータを順次読み出
す。そしてカウンタ12−6の値がレジスタ12−5に
セットされたランレングスと一致したことを比較器12
−1が検出するとき、所望の数のデータが読出されたこ
とが示されるので、この読み出し処理が終了する。
■ このようにして順次読み出されたデータは、前記ヘ
ッダとともにパケットに組み立てられ、ドライバ13を
介して通信ネットワークCに送出される。
ッダとともにパケットに組み立てられ、ドライバ13を
介して通信ネットワークCに送出される。
■ 通信ネットワークは、パケットのヘッダ内の宛先P
EI域を認識して所定の宛先のPEOにこれを転送する
。
EI域を認識して所定の宛先のPEOにこれを転送する
。
■ PEOは、レシーバ15を経由してこれを受信する
。受信制御部14は、受信を開始すると、そのヘッダを
解読して格納先の先頭アドレス(DADR)をレジスタ
14−3にセットし、データ間隔(DD I ST)を
レジスタ14−4にセットし、レングス(DLENG)
をレジスタ14−5にセットする。またカウンタ14−
2を初期値r□、に初期化する。
。受信制御部14は、受信を開始すると、そのヘッダを
解読して格納先の先頭アドレス(DADR)をレジスタ
14−3にセットし、データ間隔(DD I ST)を
レジスタ14−4にセットし、レングス(DLENG)
をレジスタ14−5にセットする。またカウンタ14−
2を初期値r□、に初期化する。
■ 受信制御部14は、レジスタ14−3に記入された
先頭アドレスをレジスタ14−2にセットしてこれを書
込み開始アドレスとして、最初のデータをメモリ部11
′に記入する。そしてカウンタ14−6を+1する。
先頭アドレスをレジスタ14−2にセットしてこれを書
込み開始アドレスとして、最初のデータをメモリ部11
′に記入する。そしてカウンタ14−6を+1する。
[相] 次に受信制御部14は、加算器14−0により
レジスタ14−3に記入された先頭アドレスとレジスタ
14−4に記入されたデータ間隔を加算して得られたア
ドレス先をレジスタ14−2に記入し、2番目のデータ
をメモリ部11′に格納する。このとき加算値をレジス
タ14−3に記入する。そしてカウンタ14−6を更に
+1する。
レジスタ14−3に記入された先頭アドレスとレジスタ
14−4に記入されたデータ間隔を加算して得られたア
ドレス先をレジスタ14−2に記入し、2番目のデータ
をメモリ部11′に格納する。このとき加算値をレジス
タ14−3に記入する。そしてカウンタ14−6を更に
+1する。
■ このようなことを順次繰り返してメモリ部11′に
転送データを順次記入し、これにもとづきカウンタ14
−6のカウント値がレジスタ14−5にセットされたレ
ングスと一致したとき、比較器14−1から終了信号が
出力され、受信制御部14はCPU 10’に終了を通
知する。これによりメモリ部11′の、例えば配列デー
タ部11−〇′では、そのアドレス方向にデータが格納
されることになる。
転送データを順次記入し、これにもとづきカウンタ14
−6のカウント値がレジスタ14−5にセットされたレ
ングスと一致したとき、比較器14−1から終了信号が
出力され、受信制御部14はCPU 10’に終了を通
知する。これによりメモリ部11′の、例えば配列デー
タ部11−〇′では、そのアドレス方向にデータが格納
されることになる。
なお、前記説明では、PEOからPEIに対するデータ
転送要求にもとづきデータ転送する例について説明した
が、これのみに限定されるものではなく、このようなデ
ータ転送要求がなくとも、あらかじめ演算器PEIより
PEOにこのようなデータを転送するように制御するこ
ともできる。
転送要求にもとづきデータ転送する例について説明した
が、これのみに限定されるものではなく、このようなデ
ータ転送要求がなくとも、あらかじめ演算器PEIより
PEOにこのようなデータを転送するように制御するこ
ともできる。
なお、前記説明は、データが2次元配列されている場合
について説明したが、例えば第3図に示す如く3次元配
列されている場合も同様である。
について説明したが、例えば第3図に示す如く3次元配
列されている場合も同様である。
第3図において例えば「2.102.202.302.
402」というデータが必要の場合は、先頭アドレスと
して「2」を、データ間隔としてrlooJを、レング
スとして「5」を設定することにより容易に得ることが
できる。
402」というデータが必要の場合は、先頭アドレスと
して「2」を、データ間隔としてrlooJを、レング
スとして「5」を設定することにより容易に得ることが
できる。
そして第3図に示す矢印Fの位置に縦方向に接話した面
でのデータが必要の場合には、前記の手法によりまず「
2.102、〜402」を求め、次に「7.107〜4
07」を求めて、これを順次行い、最後に「97.19
7〜497」を求めることにより面、つまり2次元とし
てのデータを得ることもできる。
でのデータが必要の場合には、前記の手法によりまず「
2.102、〜402」を求め、次に「7.107〜4
07」を求めて、これを順次行い、最後に「97.19
7〜497」を求めることにより面、つまり2次元とし
てのデータを得ることもできる。
本発明によれば、分散メモリ型の並列計算機システムに
おいて、多次元巨大配列データ即ち2次元以上の次元の
行列データを各プロセッサに分割配置した際の任意次元
方向のデータに高速にアクセスすることができるので、
これにもとづき気象シュミレーション等の如き複雑な演
算を高速処理することが可能となる。
おいて、多次元巨大配列データ即ち2次元以上の次元の
行列データを各プロセッサに分割配置した際の任意次元
方向のデータに高速にアクセスすることができるので、
これにもとづき気象シュミレーション等の如き複雑な演
算を高速処理することが可能となる。
第1図は本発明の原理構成図、
第2図は本発明の一実施例構成図、
第3図は3次元メモリ説明図、
第4図は分散メモリ型の並列計算機システム説明図、
第5図は2次元配列メモリ説明図である。
0−CPU
11− メモリ部
12−転送制御部
12−0−−−加算器
12−1−比較器
116−カウンタ
Claims (1)
- 【特許請求の範囲】 プロセッサとメモリを有するプロセッシング・エレメン
トを複数接続し、2次元以上の次元の行列データを各プ
ロセッシング・エレメントにおいて並列処理するデータ
処理方式において、 プロセッシング・エレメントに転送制御部(12)を設
けるとともに、 この転送制御部(12)に、 アドレス保持手段(12−3)と、 データ間隔保持手段(12−4)と、 これらアドレス保持手段(12−3)とデータ間隔保持
手段(12−4)のデータを加算する加算手段(12−
0)と、 データ数保持手段(12−5)と、 これらデータ数保持手段(12−5)とカウント手段(
12−6)の各値を比較する比較手段(12−1)を設
け、 前記アドレス保持手段(12−3)にセットされた先頭
アドレスと、加算手段(12−0)の出力にもとづきメ
モリを順次アクセスして高速に必要とするデータを得る
ようにしたことを特徴とする分散メモリ型並列計算機に
おける高速データ転送方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2294329A JPH04167191A (ja) | 1990-10-31 | 1990-10-31 | 分散メモリ型並列計算機における高速データ転送方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2294329A JPH04167191A (ja) | 1990-10-31 | 1990-10-31 | 分散メモリ型並列計算機における高速データ転送方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH04167191A true JPH04167191A (ja) | 1992-06-15 |
Family
ID=17806293
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2294329A Pending JPH04167191A (ja) | 1990-10-31 | 1990-10-31 | 分散メモリ型並列計算機における高速データ転送方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH04167191A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6745233B1 (en) | 1999-09-28 | 2004-06-01 | Fujitsu Limited | Data transfer technique for distributed memory type parallel computer |
US7096312B2 (en) | 2002-03-20 | 2006-08-22 | Seiko Epson Corporation | Data transfer device and method for multidimensional memory |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02162440A (ja) * | 1988-12-15 | 1990-06-22 | Fujitsu Ltd | データ転送制御方式 |
-
1990
- 1990-10-31 JP JP2294329A patent/JPH04167191A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02162440A (ja) * | 1988-12-15 | 1990-06-22 | Fujitsu Ltd | データ転送制御方式 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6745233B1 (en) | 1999-09-28 | 2004-06-01 | Fujitsu Limited | Data transfer technique for distributed memory type parallel computer |
US7096312B2 (en) | 2002-03-20 | 2006-08-22 | Seiko Epson Corporation | Data transfer device and method for multidimensional memory |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0186150B1 (en) | Parallel processing computer | |
EP0501524A2 (en) | Parallel processor | |
JPH06243113A (ja) | 並列計算機における計算モデルのマッピング法 | |
JPH06162227A (ja) | ベクトル並列計算機 | |
US5710932A (en) | Parallel computer comprised of processor elements having a local memory and an enhanced data transfer mechanism | |
EP0492174A2 (en) | Parallel processor | |
Jagadish et al. | An efficient scheme for interprocessor communication using dual-ported RAMs | |
JPS63201851A (ja) | バッファ記憶アクセス方法 | |
JPH04167191A (ja) | 分散メモリ型並列計算機における高速データ転送方式 | |
US7263543B2 (en) | Method for manipulating data in a group of processing elements to transpose the data using a memory stack | |
Ravindran et al. | On topology and bisection bandwidth of hierarchical-ring networks for shared-memory multiprocessors | |
Bokka et al. | Time-optimal domain-specific querying on enhanced meshes | |
US5513364A (en) | Data transfer device and multiprocessor system | |
CN112486402A (zh) | 一种存储节点及系统 | |
JP2542460B2 (ja) | デ―タ転送割込制御方式 | |
EP0326164A2 (en) | Parallel computer comprised of processor elements having a local memory and an enhanced data transfer mechanism | |
JP3209630B2 (ja) | データ転送装置及びマルチプロセッサシステム | |
JPH054258U (ja) | 並列分散処理装置 | |
CN106383791A (zh) | 一种基于非统一内存访问架构的内存块组合方法及装置 | |
Denning | The Science of Computing: Multigrids and hypercubes | |
Lee et al. | An efficient method for distributing data in hypercube computers | |
BERESFORD-SMITH et al. | Optimal algorithms for constrained reconfigurable meshes | |
Shukla et al. | A kernel-independent, pipelined architecture for real-time 2-D convolution | |
US7930518B2 (en) | Method for manipulating data in a group of processing elements to perform a reflection of the data | |
Slotnick | Achieving Large Computing Capabilities Through An Array Computer |