JPH06290283A - 並列データ処理装置 - Google Patents

並列データ処理装置

Info

Publication number
JPH06290283A
JPH06290283A JP7814493A JP7814493A JPH06290283A JP H06290283 A JPH06290283 A JP H06290283A JP 7814493 A JP7814493 A JP 7814493A JP 7814493 A JP7814493 A JP 7814493A JP H06290283 A JPH06290283 A JP H06290283A
Authority
JP
Japan
Prior art keywords
processor
local memory
processors
data processing
parallel data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7814493A
Other languages
English (en)
Inventor
Atsuo Ozaki
敦夫 尾▲崎▼
Hiroyuki Miyata
裕行 宮田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP7814493A priority Critical patent/JPH06290283A/ja
Publication of JPH06290283A publication Critical patent/JPH06290283A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)
  • Advance Control (AREA)

Abstract

(57)【要約】 【目的】 制御部からの指令に基づき並列に同一のデー
タ処理を行なう同一構成のローカルメモリを有する要素
プロセッサを複数個具備した並列データ処理装置を使用
して、画像処理や行列演算などを高速に処理する。 【構成】 任意の要素プロセッサ(マスタプロセッサと
呼ぶ)11に、その他の任意個数の要素プロセッサ(ス
レイブプロセッサと呼ぶ)13のローカルメモリ14を
選択的に読み出せるようなセレクタ12と、上記スレイ
ブプロセッサのローカルメモリへ選択的に書き込みが行
なえるような制御信号15およびデータ線16と、各要
素プロセッサの演算部をマスク制御できる機能を備え
る。 【効果】 ローカルメモリの容量を大きくすることがで
きるため、外部メモリなどからのデータ転送を少なくす
る、もしくは無くすことができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、たとえば、制御部か
らの指令に基づき並列に同一のデータ処理を行なう同一
構成のローカルメモリを有する要素プロセッサを複数個
具備した並列データ処理装置を使用して、画像処理や行
列演算などのアプリケーションを適用させた場合に関す
るものである。
【0002】
【従来の技術】図15は、J.L.Potter,”T
he Massively Parallel Pro
cessor”,The MIT Press,(19
85)に示された従来の2次元格子状に基本演算要素を
配置した並列データ処理装置の構成を示すものである。
Front ends41は、Host Comput
er42と並列データ処理装置専用のプログラムとデー
タを制御するProgram and Data Ma
negement Unit(PDMU)43から構成
されており、システム全体の制御を行なう。Stagi
ng Memory44は、2次元に広がったデータを
格納する共有メモリである。ArrayUnit(AR
U)45は、128×128個の基本演算要素から構成
されており、全体は、一つの制御部からの命令に基づき
常に同じ動作をする(SIMD)方式である。Arra
y Control Unit(ACU)46は、上記
ARUの演算を制御する演算制御部である。
【0003】次に動作について説明する。まず、図15
の並列データ処理装置では、並列データ処理装置全体を
制御するPDMU43,PDMU43とARU45を専
用のバスを介して結合されたStaging Memo
ry44,128×128個の基本演算から構成されて
いるARU45,ARUの演算を制御する演算制御部で
あるACU46から構成されている。並列データ処理装
置を制御するプログラムはPDMU43内メモリに格納
され、このPDMU43でスカラ演算やプログラムの順
序制御、Staging MemoryおよびACUを
介してARUへのデータの入出力制御、ARUの実行制
御などを行なう。
【0004】
【発明が解決しようとする課題】従来の並列データ処理
装置において、物理的に存在するローカルメモリよりも
大きいメモリ容量が必要であるアプリケーションを並列
処理する場合に、外部のメモリと、ローカルメモリとの
データ転送を行なうことにより、ローカルメモリの容量
不足を補わなければならなかった。また、複数の要素プ
ロセッサが保持しているデータを用いて、一つの要素プ
ロセッサにより演算等の逐次処理を行ない、その実行結
果を上記複数の要素プロセッサに分配して再び並列処理
を行なうような処理では、上記複数の要素プロセッサが
保持している上記データを、各々任意の一つの要素プロ
セッサにデータ転送して、上記任意の一つの要素プロセ
ッサは、上記演算等の逐次処理を行ない、その実行結果
を上記複数の要素プロセッサ各々にデータ転送しなけれ
ばならなかった。
【0005】この発明は、上記のような問題点を解消す
るためになされたもので、ローカルメモリの容量不足を
補えるとともに、高速処理が可能な並列データ処理装置
を得ることを目的とする。
【0006】
【課題を解決するための手段】この発明に係わる並列デ
ータ処理装置は、並列データ処理装置の任意の要素プロ
セッサ(マスタプロセッサ)に、その他の任意個数の要
素プロセッサ(スレイブプロセッサ)のローカルメモリ
を選択的に読み出しおよび書き込みができるようにセレ
クタ、制御線およびデータ線を備え付けることにより、
上記任意の要素プロセッサ(マスタプロセッサ)は、論
理的にローカルメモリの容量を増大させるものである。
【0007】また、一つに統合されたマスタプロセッサ
およびスレイブプロセッサの各ローカルメモリに対して
書き込み制御を行なう制御線をすべてイネーブルにする
機能を設け、上記マスタプロセッサが上記各ローカルメ
モリへ同時にアクセスするものである。
【0008】
【作用】この発明における並列データ処理装置は、複数
の要素プロセッサを統合して、その中の一つをマスタプ
ロセッサとし上記統合された複数の要素プロセッサ(ス
レイブプロセッサ)のローカルメモリを選択的に読み出
し、また各要素プロセッサのローカルメモリへ書き込み
制御を行なう制御線およびデータ線を備え付けることに
より、上記統合された複数の要素プロセッサ(スレイブ
プロセッサ)のローカルメモリへ選択的に書き込みでき
るようにしたことにより、上記マスタプロセッサは、論
理的に増幅されたローカルメモリに対して、ランダムア
クセス操作を行なうことができる。このことにより、動
作する要素プロセッサ(マスタプロセッサ)の個数は、
上記並列データ処理装置が具備している要素プロセッサ
数よりも少なくなるが、上記並列データ処理装置が具備
している要素プロセッサ数よりも並列度が小さく、上記
並列データ処理装置が具備しているローカルメモリより
も大きいメモリ容量を必要とするアプリケーションをこ
の発明に係わる並列データ処理装置に適用させた場合に
有効である。
【0009】また、上記統合された各要素プロセッサの
ローカルメモリへ書き込み制御を行なう上記制御線をす
べてイネーブルにする機能を備え付けることにより、上
記マスタプロセッサが保持する値を上記統合されたすべ
ての要素プロセッサのローカルメモリに書き込むことが
できるため、上記統合された要素プロセッサ内でのブロ
ードキャスト機能を実現することができる。
【0010】
【実施例】
実施例1.以下、この発明の一実施例を図について説明
する。例えば、図1と図2は、4×4個の要素プロセッ
サを有する並列データ処理装置であり、11はマスタプ
ロセッサとして動作するためにセレクタ12とデータ線
16を備えた要素プロセッサ、13はスレイブプロセッ
サとして演算部にマスク(図中、斜線でマスクを表わ
す)をかけることができる要素プロセッサ、14は要素
プロセッサ11,13が有するローカルメモリ、15は
ローカルメモリ14に書き込みを行なうために設けられ
た制御線、ローカルメモリ14の右端に位置する四角1
7は、制御線15により、ローカルメモリへの書き込み
がイネーブルであるかないかを示すライトイネーブル部
で、黒く塗りつぶされたものがイネーブル状態を示すも
のである。図1と図2では、PE(0,0)はローカル
メモリ(1,0)へ、PE(2,0)はローカルメモリ
(3,0)へ、PE(0,2)はローカルメモリ(1,
2)へ、PE(2,2)はローカルメモリ(3,2)へ
の書き込みが許可されている(イネーブルである)こと
を示している。
【0011】この一実施例である図1と図2に示した並
列データ処理装置に、相互作用を及ぼさない2×2個の
並列性を持ったアプリケーションを適用させる場合を考
える。ここで2×2個の各要素が演算に必要とするデー
タ量は、物理的に用意されているローカルメモリ14の
容量よりも4倍程度、大きいものであったとする。この
場合、図1と図2に示す並列データ処理装置は、論理的
に図3のように見ることができるため、上記アプリケー
ションの各要素を論理的に一つのローカルメモリに格納
することができる。このためPE(0,0),PE
(2,0),PE(0,2),PE(2,2)の各要素
プロセッサをマスタプロセッサとすることにより、外部
メモリとのデータ転送を行なうことなく、論理的に4倍
に増幅された各自のローカルメモリにおいて、データ処
理を行えば良いことになる。
【0012】
【数1】
【0013】が与えられた時には、各々以下の演算を図
1と図2の並列データ処理装置において、同時に処理す
ることを考える。(以下は、(1)の場合)
【0014】
【数2】
【0015】ここで、(1),…,(4)式の与えられ
た行列を30度((9)式)、60度((10)式)、
90度((11)式)、120度((12)式)回転さ
せる変換テーブルは以下のとおりである。
【0016】
【数3】
【0017】これらの各変換テーブルは、各要素プロセ
ッサが具備しているローカルメモリ14にちょうど格納
できる程度のデータであるとする。
【0018】この場合、図1と図2および図3に示すよ
うな構成を取ることにより、要素プロセッサPE(0,
0)、PE(2,0),PE(0,2),PE(2,
2)の論理的に増幅された各ローカルメモリ21,2
2,23,24のそれぞれに(9),(10),(1
1),(12)式のすべての変換テーブルを格納するこ
とができるため、並列データ処理装置を制御する制御部
は、要素プロセッサPE(0,0)に(1)式の行列
を、PE(2,0)に(2)式の行列を、PE(0,
2)に(3)式の行列を、PE(2,2)に(4)式の
行列をデータ転送することにより、PE(0,0),P
E(2,0),PE(0,2),PE(2,2)の各要
素プロセッサは、外部メモリとのデータ(この例では上
記変換テーブル)の入出力を行なうことなく上記行列演
算を行なうことができる。
【0019】ここでは隣接する4個の要素プロセッサを
統合した例であるが、セレクタや制御線およびデータ線
を増やすことにより、4個以上の要素プロセッサにして
も、同様の処理が可能である。
【0020】実施例2.例えば、図3に示すように4個
の要素プロセッサを統合させ、マスタプロセッサ11に
よる逐次処理を行った後、この逐次処理の実行結果をス
レイブプロセッサの各ローカルメモリにブロードキャス
トして、再び4個の要素プロセッサを並列処理させたい
場合では、従来はマスタプロセッサによる逐次処理の実
行結果を各スレイブプロセッサのローカルメモリへ各々
データ転送してから、上記4個の要素プロセッサによる
並列処理を再開しなければならなかった。
【0021】しかし、図4と図5に示すように、マスタ
プロセッサ11から統合された各要素プロセッサのロー
カルメモリに対して、書き込み制御を行なう制御線15
に、統合されている全ての要素プロセッサのローカルメ
モリへの書き込みをイネーブル31にする機能を備え付
けることにより、統合されている要素プロセッサ内での
ブロードキャスト機能を実現させることができる。簡単
な具体例として、
【0022】
【数4】
【0023】の4つの2×2行列の逆行列を4つ同時に
求めることを考える。ここで行列の各要素a11,…,b
11,…は各要素プロセッサが具備しているローカルメモ
リにちょうど格納できる程度の大きなデータであるとす
る。以下にこの発明に係わる並列データ処理装置を用い
た処理手順を示す。
【0024】step1.各行列の要素は、各要素プロ
セッサのローカルメモリにマッピングされる。(図6s
tep1) step2.各行列毎に、4個の要素プロセッサを統合
して、各マスタプロセッサPE(0,0),PE(2,
0),PE(0,2),PE(2,2)により、a11
22−a1221,b1122−b1221,c1122−c12
21,d1122−d1221を計算する。(図7step
2) step3.上記ブロードキャスト機能により、各マス
タプロセッサから統合された各要素プロセッサのローカ
ルメモリへ、step2の計算結果をブロードキャスト
する。(図8step3) step4.再び4×4個の要素プロセッサが動作でき
るように上記統合を解き、各要素プロセッサは、各自が
保持している行列要素とブロードキャストされた値とを
演算することにより、逆行列が求まる。(図9step
4)
【0025】実施例3.次に、図10に基づいて、セレ
クタおよびデータ線の切替え動作の実施例について説明
する。上記制御部から、各セレクタへ、2bitの制御
信号を送ることができる制御線を備え付けることによ
り、例えば、00,01,10,11の4通りの信号を
送ることができるようにしておく。このことを用いて、
例えば、図1のPE(0,0)に備え付けられているセ
レクタ12では、この制御線61を通して、制御部から
00の信号が来たときは、要素プロセッサPE(0,
0)の演算部は、PE(0,0)のローカルメモリから
の読み出しが可能となり、01の信号が来たときは、要
素プロセッサPE(0,1)のローカルメモリからの読
み出しが可能となり、10の信号が来たときは、要素プ
ロセッサPE(1,1)のローカルメモリからの読み出
しが可能となり、11の信号が来たときは、要素プロセ
ッサPE(1,0)のローカルメモリからの読み出しが
可能となるように実現する。同様に、図2の要素プロセ
ッサPE(2,0)に備え付けられているセレクタ12
では、この制御線61を通して、制御部から00の信号
が来たときは、要素プロセッサPE(2,0)の演算部
は、要素プロセッサPE(2,0)のローカルメモリか
らの読み出しが可能となり、01の信号が来たときは、
要素プロセッサPE(2,1)のローカルメモリからの
読み出しが可能となり、10の信号が来たときは、要素
プロセッサPE(3,1)のローカルメモリからの読み
出しが可能となり、11の信号が来たときは、要素プロ
セッサPE(3,0)のローカルメモリからの読み出し
が可能となるように実現する。その他、要素プロセッサ
PE(0,2),PE(2,2)に備え付けられている
セレクタ12においても同様の切替え動作を行なう。ま
た、この制御部からの制御信号の操作は、例えば、制御
部内のプログラムにより実行させる。
【0026】実施例4.ここでは、SIMDマシンにお
けるマスク制御の説明を図11〜図14に基づいて説明
する。まず、SIMDマシンにおけるマスク制御につい
て説明する。各要素プロセッサ(PE)は、1bitの
マスクフラグを保持しており、このマスクフラグが立っ
ていない場合(アクティブ状態)では、通常の演算処理
等を行うが、このマスクフラグが立っている場合(ノン
アクティブ状態)では、そのPEは、制御部からの命令
により、演算部は動作するが、そのPEの内部状態は、
変えない。すなわち、ノンアクティブ状態のPE内のレ
ジスタおよびローカルメモリの内容は変化しない。
【0027】次に各PEが2×2の二次元格子状に接続
されている場合でのマスクの切替え動作の実施例につい
て説明する。各PEは図11に示すように、各自の二次
元の座標値を各ローカルメモリの任意の番地に保持して
いるものとする。例えば、PE(1,1)は(1,1)
という自己の座標値をローカルメモリに保持する。ここ
で、制御部の命令により要素プロセッサPE(1,1)
71の演算部だけをアクティブにし、その他の要素プロ
セッサ(PE)72の演算部にはマスクを掛ける処理手
順を以下に示す。 [制御部命令] (1)値(1,1)を各PEの演算部にブロードキャス
トする。(図11(1)) (2)各PEは、各自の座標値をローカルメモリから、
演算部へロードする。(図12(2)) (3)各ページの演算部において、(1)よりブロード
キャストされた値と、(2)によりロードされた値を引
き算する。(図13(3)) (4)上記(3)で演算された結果が、0(=(0,
0))より大きいPEは、各自の演算部にマスクを掛け
る。(図14(4))
【0028】マスクを解除する動作は、すべてのPEの
マスクフラグをアクティブにする制御命令を用意してお
き、この命令によりすべてのPEのマスクフラグをアク
ティブにする。
【0029】また、ライトイネーブル部17の切替え動
作も同様に、各PEの座標値を用いて、任意または全て
のPEのローカルメモリへの書き込み動作を行なえるよ
うに実現する。
【0030】以上のように、前述した実施例による並列
データ処理装置は、並列データ処理装置が具備する要素
プロセッサ数よりも並列度が小さく、物理的に存在する
ローカルメモリよりも大きな容量を必要とするアプリケ
ーションを実行させる場合、動作する要素プロセッサ
(マスタプロセッサ)の数を上記アプリケーションの並
列度の数と同じにし、上記マスタプロセッサは、残りの
動作しない要素プロセッサ(スレイブプロセッサ)のロ
ーカルメモリへアクセスできる機能を備え付けることに
より、上記動作する要素プロセッサ(マスタプロセッ
サ)のとの容量を論理的に増大させる。また、マスタプ
ロセッサがスレイブプロセッサのローカルメモリをアク
セスする場合、スレイブプロセッサの演算部は、マスク
機能によりマスクをかけられており、動作できないよう
にする。
【0031】そして、マスク制御により、上記マスタプ
ロセッサだけをアクティブ(動作状態)にして、上記ス
レイブプロセッサにはマスクをかける(非動作状態にす
る)方法としては、例えば上記要素プロセッサが2次元
もしくは3次元の格子状に接続されている場合に、上記
各要素プロセッサに、その格子上に位置する座標値など
の固有値を保持させ、その固有値を用いて、上記制御部
からの指令によりアクティブにする要素プロセッサ(マ
スタプロセッサ)を決定するなどが考えられる。
【0032】また、複数の要素プロセッサが保持してい
るデータを用いて、一つの要素プロセッサにより演算等
の逐次処理を行ない、その実行結果を上記複数の要素プ
ロセッサに分配して再び並列処理を行なう場合でも、上
記手段により、上記複数の要素プロセッサを統合して、
その一つをマスタプロセッサ、その他をスレイブプロセ
ッサとすることにより、上記マスタプロセッサは、上記
スレイブプロセッサのローカルメモリにアクセスできる
ため上記複数の要素プロセッサが保持しているデータの
転送、および上記実行結果を上記マスタプロセッサは、
上記複数の要素プロセッサへ転送する必要がなくなり、
また、統合された上記複数の要素プロセッサにおいて、
上記マスタプロセッサは、上記統合されたスレイブプロ
セッサのローカルメモリへ書き込み制御を行なう制御線
をすべてイネーブルにできる機能を備え付けることによ
り、上記マスタプロセッサから、上記統合された各要素
プロセッサのローカルメモリへ上記実行結果をブロード
キャストする。
【0033】以上のように、上記実施例によれば、並列
データ処理装置において、複数の要素プロセッサを統合
し、その中の一つをマスタプロセッサとしてセレクタを
備え付けることにより、上記統合された複数の要素プロ
セッサ(スレイブプロセッサ)のローカルメモリを選択
的に読み出しすることができる。また、各要素プロセッ
サのローカルメモリへ書き込み制御を行なう制御線およ
びデータ線を備え付けることにより、上記マスタプロセ
ッサは上記統合された複数の要素プロセッサ(スレイブ
プロセッサ)のローカルメモリへ選択的に書き込みでき
るようにしたことにより、上記マスタプロセッサは、論
理的に増大されたローカルメモリに対して、ランダムア
クセス操作を行なうことができる。このため、動作する
要素プロセッサ(マスタプロセッサ)の個数は、上記並
列データ処理装置が具備している要素プロセッサ数より
も少なくなってしまうが、上記並列データ処理装置が具
備している要素プロセッサ数よりも並列度が小さく、上
記並列データ処理装置が具備しているローカルメモリよ
りも大きいメモリ容量を必要とするアプリケーションを
この発明に係わる並列データ処理装置に適用させた場合
に、外部メモリなどからのデータ転送を減らす、もしく
は無くすことができる。
【0034】また、統合された各要素プロセッサのロー
カルメモリに対して書き込み制御を行なう上記制御線を
すべてイネーブルにする機能を備え付けることにより、
マスタプロセッサが保持する値を上記統合されたすべて
の要素プロセッサのローカルメモリに書き込むことがで
きるため、上記統合された要素プロセッサ内でのブロー
ドキャスト機能を実現できる。このため従来ならば上記
統合された各要素プロセッサへ逐次的にデータ転送しな
ければならなかった処理を省くことができる。
【0035】
【発明の効果】以上のようにこの発明によれば、動作す
る要素プロセッサの数は減少するが、動作する要素プロ
セッサの論理的なローカルメモリ容量は増加させること
ができ、高速な処理が行える。また、マスタプロセッサ
が保持しているデータを上記スレイブプロセッサのロー
カルメモリにブロードキャストでき、より高速処理が行
なえる。
【図面の簡単な説明】
【図1】この発明に係わる並列データ処理装置の一実施
例であり、4×4個の要素プロセッサを具備した並列デ
ータ処理装置へ2×2個の並列度を持つアプリケーショ
ンを実行させる場合の説明図。
【図2】この発明に係わる並列データ処理装置の一実施
例であり、4×4個の要素プロセッサを具備した並列デ
ータ処理装置へ2×2個の並列度を持つアプリケーショ
ンを実行させる場合の説明図。
【図3】図1を論理的に見た図。
【図4】この発明の一実施例であり、局所的にブロード
キャスト機能を実現するための図。
【図5】この発明の一実施例であり、局所的にブロード
キャスト機能を実現するための図。
【図6】この発明に係わる並列データ処理装置の他の実
施例の処理手順を示す図。
【図7】この発明に係わる並列データ処理装置の他の実
施例の処理手順を示す図。
【図8】この発明に係わる並列データ処理装置の他の実
施例の処理手順を示す図。
【図9】この発明に係わる並列データ処理装置の他の実
施例の処理手順を示す図。
【図10】セレクタおよびデータ線の切替え動作の説明
図。
【図11】演算部のマスキング/非マスキングの切替え
動作の説明図。
【図12】演算部のマスキング/非マスキングの切替え
動作の説明図。
【図13】演算部のマスキング/非マスキングの切替え
動作の説明図。
【図14】演算部のマスキング/非マスキングの切替え
動作の説明図。
【図15】従来の2次元格子状に基本演算要素(PE)
を配置した並列データ処理装置の構成図。
【符号の説明】
11 マスタプロセッサである要素プロセッサ 12 セレクタ 13 スレイブプロセッサである要素プロセッサ 14 要素プロセッサが具備するローカルメモリ 15 各ローカルメモリに対してwrite制御を行な
う制御線 16 マスタプロセッサからマスタプロセッサおよびス
レイブプロセッサのローカルメモリへデータを送るため
のデータ線 17 制御線により、各ローカルメモリのwrite制
御をイネーブルにするかしないかを示すライトイネーブ
ル部 21 増幅されたローカルメモリ 22 増幅されたローカルメモリ 23 増幅されたローカルメモリ 24 増幅されたローカルメモリ 31 制御線に、すべてのローカルメモリへのwrit
e制御をイネーブルにする機能を付け加えたことによ
り、すべてのローカルメモリのwrite制御がイネー
ブル状態となっていることを示すライトイネーブル部 41 front−ends 42 Host Computer 43 Program and Data Manag
ement Unit 44 Staging Memory 45 Array Unit 46 Array Control Unit 61 制御部からの制御信号 71 マスクを掛けない要素プロセッサ(アクティブ状
態) 72 マスクを掛ける要素プロセッサ(ノンアクティブ
状態)

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 制御部からの指令に基づき並列にデータ
    処理を行なう演算部とローカルメモリを有する要素プロ
    セッサを複数個具備した並列データ処理装置において、 任意の要素プロセッサ(マスタプロセッサと呼ぶ)は、
    その他の任意個数の要素プロセッサ(スレイブプロセッ
    サと呼ぶ)のローカルメモリのデータを選択的に読み出
    せる手段と、上記スレイブプロセッサのローカルメモリ
    へデータを選択的に書き込める手段と、各スレイブプロ
    セッサの演算部をマスク制御できる手段を備えることを
    特徴とする並列データ処理装置。
  2. 【請求項2】 上記並列データ処理装置において、各マ
    スタプロセッサがスレイブプロセッサのローカルメモリ
    に対して、同時にアクセスできる手段を備えることを特
    徴とする請求項1記載の並列データ処理装置。
JP7814493A 1993-04-05 1993-04-05 並列データ処理装置 Pending JPH06290283A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7814493A JPH06290283A (ja) 1993-04-05 1993-04-05 並列データ処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7814493A JPH06290283A (ja) 1993-04-05 1993-04-05 並列データ処理装置

Publications (1)

Publication Number Publication Date
JPH06290283A true JPH06290283A (ja) 1994-10-18

Family

ID=13653700

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7814493A Pending JPH06290283A (ja) 1993-04-05 1993-04-05 並列データ処理装置

Country Status (1)

Country Link
JP (1) JPH06290283A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011123082A (ja) * 2001-07-16 2011-06-23 Kla-Tencor Corp 半導体における周期構造の実時間分析
JP2018514888A (ja) * 2015-04-22 2018-06-07 インターナショナル マイクロシステムズ インコーポレイテッドInternational Microsystems, Inc. 独立型アレイコンピュータ

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011123082A (ja) * 2001-07-16 2011-06-23 Kla-Tencor Corp 半導体における周期構造の実時間分析
JP2018514888A (ja) * 2015-04-22 2018-06-07 インターナショナル マイクロシステムズ インコーポレイテッドInternational Microsystems, Inc. 独立型アレイコンピュータ

Similar Documents

Publication Publication Date Title
US6067609A (en) Pattern generation and shift plane operations for a mesh connected computer
JP2671120B2 (ja) データ処理セルおよびデータプロセッサ
EP0539595A1 (en) Data processor and data processing method
JPS62208158A (ja) マルチプロセツサシステム
JPH04348451A (ja) 並列計算機
JPH01150963A (ja) 計算機におけるipl方法
WO1999053412A9 (en) Global input/output support for a mesh connected computer
CA2478570A1 (en) Data processing apparatus and system and method for controlling memory access
US20220283985A1 (en) Data processing engine tile architecture for an integrated circuit
US3710349A (en) Data transferring circuit arrangement for transferring data between memories of a computer system
US20080209165A1 (en) Simd microprocessor, image processing apparatus including same, and image processing method used therein
JPH06290283A (ja) 並列データ処理装置
JP4311847B2 (ja) 並列プロセッサ及びそれを用いた画像処理装置
JPH0282378A (ja) 並列計算機におけるイベントスケジューリング処理方式
US11061673B1 (en) Data selection network for a data processing engine in an integrated circuit
US10579559B1 (en) Stall logic for a data processing engine in an integrated circuit
JPH0664606B2 (ja) 画像処理装置
Siegel et al. Parallel memory system for a partitionable SIMD/MIMD machine
US7503046B2 (en) Method of obtaining interleave interval for two data values
US20230289398A1 (en) Efficient Matrix Multiply and Add with a Group of Warps
Weems Jr Real-time considerations in the design of the image understanding architecture
JP2007018536A (ja) 並列プロセッサ
Reeves Chapter Seven Meshes and Hypercubes for Computer Vision
Mannos Powerful hardware/software architecture for a minicomputer-based interactive image processing system
Tudruj et al. Fine-grain numerical computations in dynamic smp clusters with communication on the fly