JPH0467253A - 並列データ処理装置 - Google Patents

並列データ処理装置

Info

Publication number
JPH0467253A
JPH0467253A JP2178620A JP17862090A JPH0467253A JP H0467253 A JPH0467253 A JP H0467253A JP 2178620 A JP2178620 A JP 2178620A JP 17862090 A JP17862090 A JP 17862090A JP H0467253 A JPH0467253 A JP H0467253A
Authority
JP
Japan
Prior art keywords
processor
block
data
blocks
processors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2178620A
Other languages
English (en)
Inventor
Toshio Kondo
利夫 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2178620A priority Critical patent/JPH0467253A/ja
Publication of JPH0467253A publication Critical patent/JPH0467253A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] この発明は並列データ処理装置に関し、特に内蔵してい
るプロセッサ配列が路間−の構成のプロセッサの縦続的
な配列で構成され、プロセッサ配列を実装するための複
数プロセッサを搭載するモジュール間の接続線が少なく
とも伝搬演算を高速に実行することのできる並列データ
処理装置に関する。
[従来の技術] 従来より、プロセッサ配列型の並列データ処理装置の設
計に於いて、離れたプロセッサ間のデータの転送、演算
を如何に高速に行うかは、重要な問題の1つである。一
般に、高速性を追及すると、プロセッサ間の接続線の数
が極端に増えたり、プロセッサの間の接続構成の単純性
かくずれ、装置の実現が困難になったりするためである
。特に、プロセッサの2次元配列から成るプロセッサア
レイ型の並列データ処理装置では、そのプロセッサ数か
多いためにより深刻なものとなる。
このため、2次元プロセッサアレイ型の並列データ処理
装置では、接続線の数の増加の小さい高速化法である伝
搬演算方式が有用である( A、P。
Reeves、 +A Systematically
 Designed BinaryArray Pro
cessor 、 IEEE Trans、 Comp
ut、、 vol、C−29,pp、278−287(
1980)を参照)。ここで、伝搬演算とは、プロセッ
サ間を、途中クロックで同期をとることなく、プロセッ
サ内で演算を施しながらその結果を隣接プロセッサ間の
接続線を介して次々と伝搬させる演算である。尚、演算
機能を通過に選ぶと、単なるデータ転送になる。上記伝
搬演算方式が、本来通常のバスを用いる転送方式に比べ
ると、装置の実現容易性が殆ど低下しないにもかかわら
ず、次のような利点を有しているからである。すなわち
、1)同期やメモリレジスタアクセスの回数が少な(な
るので、データを加工しながらプロセッサ間を次々と引
渡すことにより実現可能な処理、例えば総和演算を高速
化することができる。2)バスと異なり、転送系が一組
のデータで占有されることがないので、互いに転送区間
が重複しなければ同一の転送系で、同時に複数組のデー
タ転送を行うことが可能である。
また、上記伝搬演算は、画像処理に於けるランレングス
抽出処理、塗り潰し処理、連結領域抽出処理等で、プロ
セッサ配列全体に広がるデータ間の処理を効率的に実行
する手段としても有効である。
しかしながら、このような演算方式は、途中経由するプ
ロセッサの数に比例して伝搬時間が増加する。このため
、経由するプロセッサの数が多い場合、転送、演算時間
が長くなり過ぎるという問題、或いは実際に演算を行う
プロセッサが、その時点で伝搬演算に関わっているプロ
セッサ、換言すれば伝搬の先頭波面にあるプロセッサに
限られ、実効的な並列度が低下するという問題がある。
そこで、第3図(a)に示されるように、プロセッサ配
列を複数のプロセッサから成るプロセッサブロックに分
割し、第3図(b)に示されるようにプロセッサブロッ
ク毎にバイパスを付加し、これによって伝搬演算を階層
的に行うことで並列度を上げる方式が考えられている(
特願昭55−27623号公報参照)。すなわち、複数
のプロセッサ10から成るプロセッサブロックIII 
、 H2,113、・・・ 11Eは、接続線12によ
って接続されている。上記プロセッサ10は、演算ユニ
ット13及び検出器14を有するプロセッサ1o11o
2、・・・10oと演算ユニット13のみ有するプロセ
ッサloEから成っている。そして、プロセッサ1o1
102、・・・、10.、は、それぞれ接続線15及び
16で接続され、バイパスI7と共にセレクタI8に接
続されている。このセレクタ18は、上記プロセッサ1
0!1と接続線19で接続されている。
[発明が解決しようとする課題] しかしながら、このバイパスについては、その後検討し
た結果、このままでは階層かの手数が大きくなり過ぎて
、高速化を図る上で約に立たない場合か少なくないこと
が明らかになってきた。例えば、画像の情報圧縮のため
の符号化、文字認識に於ける特徴抽出等に用いられる1
次元プロセッサ配列上の、2値ラインの白、或いは黒連
結の長さ(ランレングス)を求める処理が上げられる。
上記伝搬演算によるランレングス抽出処理を以下に述べ
る。いま、ラインを構成する白点或いは黒点の画素が、
プロセッサに一対一で割付けられているとする。すると
、ライン上の各自連結及び黒連結内の左端の先頭プロセ
ッサを発信プロセッサ、他のプロセッサを加算プロセッ
サとする右方向(先頭から末尾に向かう)の伝搬加算を
実行するだけでよいものである。ここで、発信プロセッ
サとは、伝搬加算中に、左隣からの入力を無視し、「1
」を加算して右隣のプロセッサに出力するプロセッサで
ある。これらのプロセッサの動作から明らかなように、
伝搬と共に、各プロセッサには、そのプロセッサ自体の
属する連結の左端からの距離が求まっていく。伝搬が連
結の右端まで到達すると、その右端のプロセッサに連結
のランレングスか得られる。このようなランレングス抽
出処理を、第3図(a)及び(b)に示されるような従
来のバイパス方式を適用した1次元のプロセッサ配列で
階層的に実行しようとすると、その手順は以下のステッ
プに述べる如く複雑なものとなる。
ステップ1)、複数のプロセッサブロックII。
112、・・・llEのうち、左端のプロセッサと白或
いは黒連結の先頭のプロセッサを発信プロセッサとし、
それ以外を加算プロセッサになるように各プロセッサの
状態レジスタをセットする。
ステップ2)、各プロセッサブロック1l1112、・
・・llE内で、画像データに対する伝搬加算を実行す
る。そして、その結果を演算ユニット13内のレジスタ
A(図示せず)に格納する。
ステップ3)、セレクタ18の左隣のプロセッサlO0
を0発信プロセッサに設定し、右端のプロセッサ10.
は、保持する画像データが゛連結の先頭か否かにより、
発信、加算プロセッサとなる状態レジスタを設定する。
ステップ4)、プロセッサブロック内のプロセッサ配列
(プロセッサ10Eは除く)の画像データに連結の先頭
の有無を検出器14の並びで検出し、連結の先頭かある
場合には、セレクタ18を左隣のプロセッサ10.側に
選択するように制御する。また、連結の先頭か無い場合
には、セレクタ18をバイパス17側に選択するように
制御して、右端のプロセッサIOEのレジスタA(図示
せず)のデータについて、プロセッサブロック11間の
伝搬加算を行い、その結果をレジスタB(図示せず)に
格納する。このとき、プロセッサ108が元々の画像デ
ータの連結の先頭である場合には、当然発信プロセッサ
となり、セレクタ18からの入力は無視して、そのプロ
セッサ自体か保持するレジスタAの内容をそのまま出力
する。但し、このレジスタAには、先のプロセッサブロ
ック111.112 、・・・H[!内の伝搬演算でも
、発信プロセッサとしてセレクタ18からの入力を無視
しており、「1」がそのまま入っている。
ステップ5)、各プロセッサブロックll+112、・
・11Hの右端のプロセッサlOEを発信プロセッサと
し、右端以外で画像データの連結の先頭のプロセッサを
O発信の発信プロセッサとなるように状態レジスタをセ
ットする。
ステップ6)9各プロセツサブロツク11111□、・
・・l1gの右端のプロセッサ10I!のレジスタBに
、得られたプロセッサブロックレベルの加算結果を、右
隣のプロセッサブロックに伝搬転送で転送し、レジスタ
Cに格納する。この場合、連結の先頭のプロセッサ以降
には、上記加算結果は伝わらない。尚、伝搬転送とは、
発信プロセッサ以外の途中のプロセッサが、左隣のプロ
セッサから受けたデータを、そのまま右隣のプロセッサ
に伝搬させる伝搬演算のことである。
ステップ7)、上記レジスタAの内容と、レジスタCの
内容を加算し、全体の伝搬加算結果とする。
このようなバイパス方式では、所゛要マシンサイクル数
の大きい伝搬演算、伝搬転送の回数が3回と多く、その
うえその実行前にプロセッサ配列の状態設定を一々必要
としている。このため、配列サイズがかなり大きいもの
でない限りバイパスを用いない場合に比べて、全体の所
要マシンサイクル数は小さくはならいもので、各プロセ
ッサ間の伝搬演算の高速化を図ることかできないもので
あった。
この発明は上記のような点に鑑みてなされたもので、各
プロセッサ間の接続が単純且つ容易で、効率的な演算、
転送が可能な伝搬演算を高速に実行することのできる並
列データ処理装置を提供することを目的とする。
[課題を解決するための手段] すなわちこの発明は、縦続的に接続されて複数配列され
たプロセッサを内蔵する複数のプロセッサブロックを縦
続的に配列して成る並列データ処理装置に於いて、上記
複数のプロセッサブロック内に複数配列されたプロセッ
サのうち先頭のプロセッサが有する保持データを出力す
る第1の出力手段と、上記先頭のプロセッサ以外のプロ
セッサであって上記先頭のプロセッサ側に位置される隣
接プロセッサからの入力データと、それ自身か有する保
持データとを演算した結果を上記複数配列されたプロセ
ッサのうち末尾のプロセッサ側に位置された隣接プロセ
ッサに出力する第2の出力手段と、この第2の出力手段
の出力データと、この第2の出力手段の出力データ及び
上記複数のプロセッサブロックの先頭のプロセッサブロ
ック側に隣接されたプロセッサブロックからの入力デー
タとの間で演算した結果の出力データとの何れかを、上
記複数のプロセッサブロックの末尾のプロセッサブロッ
ク側に隣接されたプロセッサブロックに出力するべく選
択する選択手段と、この選択手段で選択された出力デー
タを各々のプロセッサブロック内の全プロセッサの状態
に応じて制御する制御手段と、上記隣接されたプロセッ
サブロックからの入力データを上記各々のプロセッサブ
ロック内の各プロセッサに入力する手段とを具備するこ
とを更に具備する。
[作用] この発明の並列データ処理装置によれば、プロセッサ間
の伝搬演算に係るプロセッサ配列が所定の大きさのプロ
セッサブロックに分けられており、ブロック毎に、バイ
パスと、このバイパスを用いるプロセッサブロック間の
伝搬演算専用の演算器と、上記プロセッサブロック内の
プロセッサの状態に応じてバイパスを用いるプロセッサ
ブロック間の伝搬演算を制御する制御ユニットを有して
いる。上記プロセッサブロック間の伝搬演算専用の演算
器を、プロセッサブロック毎に設け、プロセッサブロッ
ク内の各プロセッサとバイパスを接続することにより、
ブロック内の伝搬演算とバイパスレベルの伝搬演算を同
時に実行することができ、伝搬演算の高速化を図ってい
る。
[実施例] 以下図面を参照して、この発明の詳細な説明する。尚、
上述した従来例と同一の部分には同一の参照番号を付し
て説明を省略するものとする。
第1図(a)〜(e)は、この発明の並列データ処理装
置の一実施例で、プロセッサのMXN台の規則的な配列
、この場合はM台のプロセッサブロックN組で構成され
る1次元配列、及び制御ユニット等で構成される並列デ
ータ処理装置を示したものである。
第1図(a)はプロセッサブロックの1次元配列を示し
たもので、同図に於いて、20+ 、202.205、
・・・ 2ONはM台のプロセッサを有するプロセッサ
ブロックであり、これらプロセッサブロック201.2
Dz 、20i 、”’、2ONノ間は、それぞれ接続
線12て接続されている。また、上記プロセッサブロッ
ク20、202.203、−12ONは、各々が信号線
21を介してプロセッサ配列制御用の信号を発生する制
御ユニット22に接続されている。この制御ユニット2
2で発生された信号が、信号線21を介して全プロセッ
サに転送される。尚、以下の説明に於いて、不特定のプ
ロセッサブロックは参照番号を20として説明する。
第1図(b)は、同図(a)に示されたプロセッサブロ
ックの構成図を示したものである。
但し、ここではプロセッサブロック20..20□、2
05、・・・、2ONのうちの1つとしてプロセッサブ
ロック20□を例として説明するが、他のプロセッサブ
ロック20□、203 、・・・、2ONについても同
様である。上記プロセッサブロック20□は、M台のプ
ロセッサ23+ 、232.233 、・・・、23M
を有している。そして、それぞれのプロセッサ23..
23□、233、・・・、23M内は、演算ユニット2
4及び論理和ゲートで構成される発信プロセッサの検出
器14から成っている。また、この検出器14と演算ユ
ニット24は接続線25で接続され、上記演算ユニット
24は接続線26を介してバイパス17に接続される。
更に、隣接するプロセッサの演算ユニット24及ヒ検出
器14は、それぞれ接続線15及び16で接続されてい
る。尚、プロセッサ20Mの出力は、演算ユニット27
に供給されるようになっている。また、以下の説明に於
いて、不特定のプロセッサは参照番号を23として説明
する。
第1図(c)は、上記演算ユニット24の構成を示すも
ので、28はセレクタであり、接続線15とレジスタ2
9を介して接続線26が接続されていると共に、伝搬演
算時に同一機能となる演算論理装置(ALU)30に接
続されている。このALU30には、接続線25に接続
されたレジスタ31か接続されているレジスタ32.3
3.34が接続されている。そして、上記ALU30は
、レジスタ32.33.34と共にセレクタ35に接続
されている。このセレクタ35の出力が、レジスタ31
の出力と共に接続線15を介して次段の演算ユニット2
4に転送されるようになっている。尚、レジスタ32.
33.34は、レジスタファイル構成をとっており、入
力ポートと出力ポートはそれぞれ共通のものとなってい
る。また、T1、T2、T3、T4及びT5は、端子で
ある。
第1図(d)は、上記演算ユニット27の構成を示した
もので、端子T6及びT7を介してバイパス17及び接
続線15が接続されたALU3Bを有している。また、
セレクタ37は、このA L U 3Bの出力を受ける
と共に、上記接続線15及び端子T8を介して接続線1
6が接続されている。そして、セレクタ37の選択出力
がプロセッサブロック20の出力として、端子T9及び
接続線12を介して転送されるようになっている。
更に、第1図(e)は、発信プロセッサの検出器14を
示すもので、接続線16及び25に接続された論理和ゲ
ート38で構成されている。尚、T10、TILTI2
及びT13は端子である。
次に、このような構成の並列データ処理装置の動作につ
いて説明する。
ステップ1)、各演算ユニット24のレジスタ31に、
発信プロセッサでは「1」の値を、それ以外のプロセッ
サでは「0」の値をセットし、次のステップの伝搬演算
に於ける各プロセッサの状態を決定する。
ステップ2)、プロセッサブロック20内と、バイパス
17経由のプロセッサブロック20間で、同時に伝搬演
算を行う。このとき、プロセッサブロック20内の伝搬
演算は、各演算ユニット24内のレジスタ31の状態デ
ータによりセレクタ35を制御し、発信、伝搬プロセッ
サを設定することによって行う。具体的には、状態デー
タが「1」のプロセッサ(発信プロセッサ)では、セレ
クタ35をレジスタ32側に選択し、レジスタ32の保
持データをそのまま出力させる。一方、状態データが「
0」のプロセッサ(伝搬プロセッサ)では、セレクタ3
5によりALU30側の人力を選択する。そして、AL
U30に於いて、左隣のプロセッサ23からの入力デー
タと、自身の保持データを演算した結果を出力させて、
プロセッサ間の伝搬演算を行い、その結果をレジスタ3
3に格納する。このとき、セレクタ28は、左隣のプロ
セッサ23からの入力、すなわちレジスタ29側でなく
接続線15側を選択する。
一方、バイパス17を用いたプロセッサブロック20間
の伝搬演算は、検出器14の並びで生成する信号により
、演算ユニット27内のセレクタ37を制御することで
行う。すなわち、検出器14の並びで生成する信号が、
「1」の場合には左隣のプロセッサ23から、端子T5
、接続線15、端子T7を介してくる入力を、「0」の
場合にはA L U 36からの入力を選択するように
制御する。検出器14の並びで生成する信号は、各検出
器14の論理機能が論理和であることから明らかなよう
に、プロセッサブロック20内のプロセッサ23の何れ
かに発信プロセッサか存在すれば「1」、そうでなけれ
ば「0」である。
したがって、プロセッサブロック20内のプロセッサ2
3の何れかに発信プロセッサが存在する場合は、隣接プ
ロセッサブロック内の伝搬演算結果を、そのまま右隣の
プロセッサブロックに出力する。
これに対し、何れにも発信プロセッサが存在しない場合
は、バイパス17を介して受取る左隣のプロセッサブロ
ックの出力と、自身のプロセッサブロックの伝搬演算結
果との間で、ALU3Eiによって演算を行う。そして
、その演算結果を右隣のプロセッサブロックに出力する
ことで、バイパス17を用いたプロセッサブロック20
間の伝搬演算を行い、バイパス17上に得られる結果を
レジスタ29に格納する。
筒、この伝搬演算に於いてALU30とALU36の機
能は同一のものである。プロセッサブロック20内の左
端のプロセッサ23□に対する入力は、検出器14に対
しては図示される如く 「0」である。
そして、演算ユニット24に対しては、伝搬演算の内容
によって変化する。演算の種類が加算、論理和のような
場合には、図示される如く 「0」であるか、論理積等
の場合には「1」を入力する。
ステップ3)、プロセッサブロック20内とプロセッサ
ブロック20間の伝搬演算を統合し、全体の伝搬演算結
果をレジスタ34に得る。これは、各演算ユニット24
で、レジスタ29からの入力を選択するようにセレクタ
28を制御し、検出器14の端子T12、T4を介して
供給される信号によりセレクタ35を制御する。このと
き、信号の値が「1」の場合にはレジスタ33からの入
力を選択するようにし、同信号値が「0」の場合にはA
LU30からの入力を選択するように、セレクタ35を
制御する。
プロセッサブロック20内で発信プロセッサ及びその右
側に位置されるプロセッサ20では、レジスタ38の内
容をそのままにしてレジスタ34に戻すようにし、発信
プロセッサより左側に位置されるプロセッサ20では、
レジスタ29とレジスタ33の間で、ALU30によっ
て演算し、その結果がレジスタ34に格納されるように
する。
このように構成された並列データ処理装置によれば、従
来の装置に比べてマシンサイクルの大きい伝搬演算の回
数が1回のみと少なくなり、これに伴って発信、伝搬プ
ロセッサの設定が1回のみとなる等、全体の所要サイク
ル数を大きく低減することができ、伝搬演算性能を著し
く改善することかできる。
第2図は、上述した第1の実施例に於けるステップ3)
の機能をハードウェア化することにより更に高速化を図
ったこの発明の第2の実施例を示すもので、演算ユニッ
トの構成図である。尚、上述した第1の実施例と同一の
部分には同一の参照番号を付して説明を省略するものと
する。
第2図に於いて、演算ユニット24′内のALU30に
は、レジスタ32.33が接続されていると共に、端子
T1を介して接続線15が接続されている。また、セレ
クタ35は、端子T5を介して接続線15に接続される
と共に、ALU39及びセレクタ40に接続されている
。上記ALU39は、上述したALU30.36と同一
機能を有するもので、端子T2を介して接続線26か接
続され、その出力はセレクタ40に供給されるようにな
っている。
次に、この第2の実施例の動作について説明する。
ステップ1′)、各演算ユニット24′ のレジスタ3
1に、発信プロセッサでは「1」の値を、それ以外のプ
ロセッサではrOJの値をセットし、次のステップの伝
搬演算に於ける各プロセッサの状態を決定する。
ステップ2′)、プロセッサブロック20内と、バイパ
ス17経由のプロセッサブロック20間で、同時に伝搬
演算を行う。このとき、プロセッサブロック2Q内の伝
搬演算は、各演算ユニット24′内のレジスタ31の状
態データによりセレクタ35を制御し、発信、伝搬プロ
セッサを設定することによって行う。具体的には、状態
データが「1」のプロセッサ(発信プロセッサ)では、
セレクタ35をレジスタ32側に選択し、レジスタ32
の保持データをそのまま出力させる。一方、状態データ
が「0」のプロセッサ(伝搬プロセッサ)では、セレク
タ35によりALU30側の入力を選択する。そして、
このALU30に於いて、左隣のプロセッサ23からの
入力データと、自身の保持データとの間で演算した結果
を出力させて、プロセッサ間の伝搬演算を行う。また、
バイパス17を用いるプロセラサブボッ220間の伝搬
演算は、検出器14の並びで生成する信号により、演算
ユニット27内のセレクタ37を制御することて行う。
すなわち、検出器14の並びで生成する信号が、「1」
の場合には左隣のプロセッサ23の端子T5からの入力
データを、「0」の場合にはA L U 3Gからの入
力データを選択するように制御する。検出器14の並び
で生成する信号は、各検出器14の論理機能から明らか
なように、プロセッサブロック20内のプロセッサ23
の何れかに発信プロセッサが存在すれば「1」、そうで
なければ「0」である。
したがって、プロセッサブロック20内のプロセッサ2
3の何れかに発信プロセッサが存在する場合は、隣接プ
ロセッサブロック内の伝搬演算結果を、そのまま右隣の
プロセッサブロックに出力する。
これに対し、何れにも発信プロセ・ソサか存在しない場
合は、バイパス17を介して受取る左隣のプロセッサブ
ロックの出力と、自身のプロセッサブロックの伝搬演算
結果との間で、ALU3Bによって演算を行う。
更に、各プロセッサ23では、その結果ノくイノくス1
7上に得られるプロセッサプロ・7220間の伝搬演算
結果と、プロセッサブロック20内の伝搬演算結果とを
、ALU39を用いて演算する。また、検出器14で生
成され、端子T12、T4を介して供給される制御信号
により、セレクタ40を制御する。このとき、上記制御
信号の値が「1」の場合にはセレクタ35からの入力デ
ータを選択するようにし、同信号値が「0」の場合には
ALU39からの入力データを選択するように、それぞ
れ制御する。プロセッサブロック20内で発信プロセ・
ソサ及びその右側に位置されるプロセッサ20では、レ
ジスタ32の内容をそのままにしてレジスタ33に戻す
ようにし、発信プロセッサより左側に位置されるプロセ
ッサ20では、ALU39の演算結果を選択してレジス
タ33に格納されるようにする。
以上述べた第1及び第2の実施例は、共に1次元のプロ
セッサ配列で、且つ転送方向を図中左から右の片側方向
に限られた比較的簡単な例であるが、これに限られるも
のではなく、2次元以上のプロセッサ配列、或いは双方
向の転送系にも適用可能なことは勿論である。
このように構成すれば、プロセッサ間の接続が単純、規
則的且つ局所的なうえ、プロセッサ配列を実装するため
の複数プロセッサを搭載する、LS I、ボード等のモ
ジュール間の接続線が少なくて、効率的な演算、転送が
可能な伝搬演算を、高速に実行することができる。
また、この発明に於いてプロセッサ単位の規則制は、演
算ユニットが途中に入るため若干崩れるものの、プロセ
ッサブロック単位での規則制は維持されており、LSI
化する際の設計に対する負担は小さいものとなる。更に
、プロセッサブロック単位でLSI化することで、バイ
パス、検出器間の結線のハードウェア或いはコストを押
えることかでき、小型化、経済化とも両立することがで
きる。
[発明の効果] 以上のようにこの発明によれば、各プロセッサ間の接続
か単純且つ容易で、効率的な演算、転送か可能な伝搬演
算を高速に実行することのできる並列データ処理装置を
提供することかでき、プロセッサ配列全体で保持するデ
ータに対するランレングス処理等を高速に処理すること
か可能となる。
【図面の簡単な説明】
第1図(a)〜(e)はこの発明の並列データ処理装置
の一実施例で、第1図(a)はプロセッサブロックの1
次元配列及び制御ユニット等で構成される並列データ処
理装置を示した図、第1図(b)は、同図(a)のプロ
セッサブロックの構成を示した図、第1図(c)は、同
図(b)の演算ユニットの構成を示した図、第1図(d
)は同図(b)の演算ユニットの構成を示した図、第1
図(e)は発信プロセッサの検出器を示した図、第2図
はこの発明の第2の実施例を示すもので、第1図(b)
の演算ユニットの他の構成例を示した図、第3図(a)
及び(b)は従来の並列データ処理装置を示したもので
、同図(a)はプロセッサブロックの1次元配列を示し
た図、第3図(b)は同図(a)のプロセッサブロック
の構成を示した図である。 IL 、10□、・・・、IOl、・・・、IOE 、
 23.231232.23. 、・・・、23M・・
・プロセッサ、11+ 、112.113、・・・ f
ig 、20.20□  202.203 、・・・2
ON・・・プロセッサブロック、13.24.24′2
7・・・演算ユニット、14・・・検出器、17・・・
バイパス、21・・・制御信号線、22・・・制御ユニ
ット、28.35.37.40・・・セレクタ、29.
31.32.33.34.30.36.39・・・論理
演算装置(ALU) 、38・・・論理ゲート。 出願人代理人 弁理士 鈴江武彦 図(a) 図−(b)

Claims (2)

    【特許請求の範囲】
  1. (1)縦続的に接続されて複数配列されたプロセッサを
    内蔵する複数のプロセッサブロックを縦続的に配列して
    成る並列データ処理装置に於いて、 上記複数のプロセッサブロック内に複数配列されたプロ
    セッサのうち先頭のプロセッサが有する保持データを出
    力する第1の出力手段と、 上記先頭のプロセッサ以外のプロセッサであって上記先
    頭のプロセッサ側に位置される隣接プロセッサからの入
    力データと、それ自身が有する保持データとを演算した
    結果を上記複数配列されたプロセッサのうち末尾のプロ
    セッサ側に位置された隣接プロセッサに出力する第2の
    出力手段と、この第2の出力手段の出力データと、この
    第2の出力手段の出力データ及び上記複数のプロセッサ
    ブロックの先頭のプロセッサブロック側に隣接されたプ
    ロセッサブロックからの入力データとの間で演算した結
    果の出力データとの何れかを、上記複数のプロセッサブ
    ロックの末尾のプロセッサブロック側に隣接されたプロ
    セッサブロックに出力するべく選択する選択手段と、 この選択手段で選択された出力データを各々のプロセッ
    サブロック内の全プロセッサの状態に応じて制御する制
    御手段と、 上記隣接されたプロセッサブロックからの入力データを
    上記各々のプロセッサブロック内の各プロセッサに入力
    する手段と を具備することを特徴とする並列データ処理装置。
  2. (2)上記各々のプロセッサブロック内の上記先頭のプ
    ロセッサであって、それ自身の保持データと上記複数の
    プロセッサブロックの先頭のプロセッサブロック側の隣
    接プロセッサブロックからの入力データとの間の演算を
    行う第1の演算手段と、上記各々のプロセッサブロック
    内の上記先頭のプロセッサ以外のプロセッサであって、
    上記複数のプロセッサブロックの先頭のプロセッサブロ
    ック側の隣接プロセッサブロックからの入力データと、
    上記先頭のプロセッサからの入力データ及びそれ自身の
    保持データとの間の演算結果とを演算する第2の演算手
    段を更に具備する請求項1に記載の並列データ処理装置
JP2178620A 1990-07-06 1990-07-06 並列データ処理装置 Pending JPH0467253A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2178620A JPH0467253A (ja) 1990-07-06 1990-07-06 並列データ処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2178620A JPH0467253A (ja) 1990-07-06 1990-07-06 並列データ処理装置

Publications (1)

Publication Number Publication Date
JPH0467253A true JPH0467253A (ja) 1992-03-03

Family

ID=16051633

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2178620A Pending JPH0467253A (ja) 1990-07-06 1990-07-06 並列データ処理装置

Country Status (1)

Country Link
JP (1) JPH0467253A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009181509A (ja) * 2008-01-31 2009-08-13 Sanyo Electric Co Ltd 演算処理回路
US7730504B2 (en) 2003-07-28 2010-06-01 Sony Corporation Disc cartridge

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7730504B2 (en) 2003-07-28 2010-06-01 Sony Corporation Disc cartridge
JP2009181509A (ja) * 2008-01-31 2009-08-13 Sanyo Electric Co Ltd 演算処理回路

Similar Documents

Publication Publication Date Title
US4979096A (en) Multiprocessor system
JP2006012182A (ja) データ処理システムとその方法
EP0150910A2 (en) Digital image frame processor
US4745546A (en) Column shorted and full array shorted functional plane for use in a modular array processor and method for using same
KR20010031192A (ko) 기계시각시스템에서의 영상데이터와 같은 논리적으로인접한 데이터샘플들을 위한 데이터처리시스템
JP2001229378A (ja) 画像演算装置
CN110674927A (zh) 一种用于脉动阵列结构的数据重组方法
EP0295646A2 (en) Arithmetic operation processing apparatus of the parallel processing type and compiler which is used in this apparatus
US5715436A (en) Image processing LSI circuit with image preprocessing, feature extraction and matching
JPH0467253A (ja) 並列データ処理装置
Benedetti et al. A novel system architecture for real-time low-level vision
Robin et al. Functionally asynchronous array processor for morphological filtering of greyscale images
Herron et al. A general-purpose high-speed logical transform image processor
JPS63147255A (ja) 複数の直列接続段を有する計算用プロセッサおよびこのプロセッサを応用したコンピュータならびに計算方法
JP2516611B2 (ja) 並列デ−タ処理装置
US4631662A (en) Scanning alarm electronic processor
JP3040529B2 (ja) 動画像処理装置
JPH05342172A (ja) マルチプロセッサシステム
JPS6464075A (en) Image processor
JP2714015B2 (ja) 論理回路合成装置
JP2819661B2 (ja) 離散コサイン変換・スカラ量子化変換回路
JPS63316133A (ja) 演算処理装置
JPH0668055A (ja) ディジタル信号処理装置
JPH04364525A (ja) 並列演算装置
JPS63141131A (ja) パイプライン制御方式