JPH02259867A - プロセッサアレイ - Google Patents

プロセッサアレイ

Info

Publication number
JPH02259867A
JPH02259867A JP1328572A JP32857289A JPH02259867A JP H02259867 A JPH02259867 A JP H02259867A JP 1328572 A JP1328572 A JP 1328572A JP 32857289 A JP32857289 A JP 32857289A JP H02259867 A JPH02259867 A JP H02259867A
Authority
JP
Japan
Prior art keywords
memory
data
processing elements
processing element
adjacent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1328572A
Other languages
English (en)
Inventor
Thomas Thorpe Roger
ロジャー トーマス ソープ
Jhon Broughton Andrew
アンドリュー ジョン ブロートン
J Hunt David
デヴイッド ジョン ハント
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AMT Holdings Ltd
Original Assignee
AMT Holdings Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AMT Holdings Ltd filed Critical AMT Holdings Ltd
Publication of JPH02259867A publication Critical patent/JPH02259867A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/80Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
    • G06F15/8007Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors single instruction multiple data [SIMD] multiprocessors
    • G06F15/8023Two dimensional arrays, e.g. mesh, torus

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、並列処理コンピュータ システムに使用され
るプロセッサ アレイに関する。このようなアレイは、
例えば英国特許出願第GB−A−1445714号に示
されている。
(従来技術) このようなプロセッサ アレイは行及び列状に配置され
た一連の単一ビット処理要素から構成されるのか普通で
ある。各処理要素は、アレイのエッジ−トのものを除い
て北、南、東及び西方向のアレイ内のその四つの最隣接
要素に接続され、これらの要素の間のデータ転送を可能
にする。更に、各処理要素はその夫々の行及び列に関連
するデータ ハスに接続される。各処理要素はローカル
 ストアを備え、かっこのローカル ストアに接続され
たメモリ入力及びメモリ出力を有する。多くの用途にお
いて、各処理′#素に対して使用可能なストアの量を増
加させることか望ましく、このため各処理要素はこの処
理要素のメモリ出力においてローカル ストアと共通に
接続されると共に外部メモリに当該処理要素を結合させ
るように構成されたメそリ ビンを備えている。
(発明の構成) 本発明によれば、一連の処理要素からなるプロセッサ 
アレイが提供される。各処理要素は最隣接入力と、その
処理要素から関連するストアにデータを送出するメモリ
出力と、その処理要素の少なくとも幾つかのメモリ出力
に接続されたメモリ ビンを備える。このメモリ ビン
は更に夫々の処理要素の最隣接入力の少なくとも一つの
メモリ出力に接続されると共に各処理要素に隣接する処
理要素の最隣接入力の少なくとも一つにデータを送出す
るように構成されたことを特徴とする。更に、その処理
要素はそれら”の各ストアにデータを転送すると共にそ
れらの各メモリ出力を介して個別の非重畳動作によりデ
ータを出力することにより隣接処理要素にデータをシフ
トさせるように構成されたことを特徴とする。
従来のプロセッサ アレイにおいては、各処理要素にデ
ータをメモリに書込むと共に隣接処理要素にシフトさせ
る個別専用出力を設ける必要かあった。しかし1本発明
の発明者は、アレイの動作を、メモリにアクセスする必
要かなくかつ単一の命令内で隣接シフトを行なう必要か
ないように拘束することにより両機能に対して単一出力
か用いられるように処理要素を構成することかでき、従
ってアレイの構成を簡略化できることを見出している。
また、アレイの件部を制限することとは別にメモリアク
セスのタイミング及び隣接シフト動作に対する拘束は重
要な利点を与えることか見出されている。メモリアクセ
ス及び隣接シフトは時間のかかる動作である。これらが
単一命令ではけっして生じないようにすることにより、
命令のための最大可能実行時間かかなり低減され、従っ
て全ての命令に使用される基本クロックサイクルの長さ
はそれに対応して短縮できる。
本発明によるプロセッサ アレイは、好ましくは一連の
サブ アレイから構成される装置れらのサブ アレイの
エツジに沿う処理要素のメモリ ビンは隣接アレイの対
向する夫々のエツジに沿う処理要素の最隣接入力に接続
されて一つのサブ アレイから隣接サブ アレイへのデ
ータのシフトのためのデータ路を提供する。
&Tましくは、メモリ ビンは一端部かメモリ出力に、
また夫々の処理要素の最隣接入力の少なくとも一つに接
続されると共に、他端部が隣接処理要素のメモリ ビン
に接続される。
夫々のサブ アレイのエツジとは別に、一つの処理要素
のメモリ出力から隣接要素へのデータの送出のためのデ
ータ路はサブ アレイが形成されるチップの内部配線に
より与えられる。
しかし、アレイの全範囲に沿ってデータをシフトさせる
ことを可能とするためには、一つのサブ アレイのエツ
ジ上のプロセッサ要素を隣接サブ アレイの対向エツジ
上のものに接続する外部接続が必要とされる。上述のよ
うに、各処理要素はそのメモリ ビンの形態の少なくと
も一つの外部接続を既に備えている。メモリ ビンは処
理要素への外部メモリの接続を可能にするために設けら
れた双方向ピンである。本発明においては、データシフ
ト及びメモリアクセス機能は完全に分離しているのでア
レイのエツジにおけるプロセッサ要素のメモリ ビンを
使用してサブ アレイ間で必要な接続を与えることか可
能である0例えば、各サブ アレイが8×8の処理要素
を収容するとき、処理要素の上部(北)行に関わる8本
の双方向メモリ ビンを用いて処理要素チップに論理的
には北にデータを出力する(北へのシフトに対して)こ
とかできるか、又はそのチップからデータを入力する(
南へのシフトに対して)ことができる。同様に、処理要
素の下部(南の)行に関わる8本のメモリ ビンを用い
て処理要素チップへ論理的には南へデータを創出し、又
はそれからデータを受信する。アレイのエツジにおける
メモリピンも同様にして東又は西へのシフトのために使
用される。
好ましくは、サブ アレイは正方形をなし、また各サブ
 アレイの対角線的に対向するコーナーの二対の一方は
付加的なメモリ ビンを備え、一方のビンは二つのコー
ナーの夫々に隣接して形成されると共にその夫々のコー
ナーの処理要素を隣接するサブ アレイの対向するコー
ナーの処理要素に接続するように構成されろ。
(実施例) 以下、本発明の実施例を図面を参照して説明する。
第1図は、本発明におけるプロセッサ アレイの一実施
例におけるサブ アレイ間の接続を示す接続図である。
IAにおいて、プロセッサ アレイlは一連のサブ ア
レイを備えている0本実施例において。
は各サブ アレイSは8×8構成の64個のプロセッサ
要素を備え、またプロセッサ アレイは全体として8×
8構成のこのようなサブ アレイを有して64x64の
全体に渡るアレイサイズを与えるように構成される0図
では説明な分かり易くするため四つのサブ アレイだけ
か示しである。
第3図は本実施例の処理要素内でのデータ流を示す図で
ある0図において、各処理要素は入力マルチブレ・フサ
に接続される四つの最隣接人力NNとローカル ストア
からデータを受信するメモリ入力Nlとを備えている。
処理要素PEはメモリ入力Mlと入カマルチブレクサM
UXからの信号をその人力て受信する演算ユニットAL
Uとを備える。演算ユニットALUは、AND回路、及
びサム アント キャリレジスタ(sum and c
arry registers) QとCとを夫々備え
る。演算ユニットALUは更にアクティビティ制御レジ
スタAを備える。アクティビティ制御レジスタの使用方
法及び処理要素の他の特徴は、本願の出願人と同じ出願
人によって本願と同じ出願臼に出願されて現在係属して
いる欧州特許出願第80/3119102号に詳細に示
されている。
演算ユニットALUの出力は処理要素PEのメモリ出力
MOに送出される。この出力MOは、各処理要素PEの
ローカル ストア、北、南、東及び西方向の処理要素の
最隣接入力にメモリ出力MOを結合するデータ路に、更
に双方向メモリ ビンPに共通接続される。以下に詳細
に説明するように、サブ アレイのエツジとに形成され
た処理要素PEの場合には、メモリピンPが使用され隣
接サブ アレイの処理要素PEの最隣接入力に接続する
ためのデータ路の一つを提供する。
本願の出願人による先願の英国特許第GB−B−201
9620号及び第GB−B−2019621号に示され
るように、演算ユニットALUは一つの動作態様におい
てそれがその入力をメモリ出力MOに直接結合するコネ
クタとして作用するように構成される。この回路構成に
は、その入力の二つが等しいときは、キャリ出力はこれ
らの二つの入力に萼しいが和(su鵬)の出力は他の入
力に導しくなるという加算器回路の性質が用いられる。
上記に引用した特許に示される構成においては、データ
出力は加算器のキャリ出力からとられる。このことは1
本願実施例とはデータ出力が和レジスタ(sus re
gister)Qからとられるという点で異なっている
。第4図に示すように、レジスタQb’らの出力は出力
マルチプレクサMUX 1、MUX2を介してメモリ出
力MOに接続される。このようにして、この処理要素の
他の態様によれば、隣接!2素から他の隣接要素にアレ
イに沿ってデータをシフトさせることができ、即ち演算
ユニットALυを介して隣接入力から特定の処理要素の
メモリ出力に、従ってデータシフト方向の隣接処理要素
の最隣接入力に至るデータをシフトさせることができる
マルチプレクサMυX1、MυX2はメモリ出力MOに
対して次のようなオブシiン(選択)を与える。
(1)上部マルチプレクサMUX2は、その上部入力を
選択する。これにより、メモリに対する処理要素出力の
無条件書込みが与えられる。
(2)上部マルチプレクサMUX2はその上部入力を選
択し、また処理a索出力はキャリとして作用する。この
場合、メモリ出力MOは処理要素のラインに沿うキャリ
の非同期伝搬を与える隣接出力路として使用される。
(3)下部マルチプレクサMUX lはその上部入力、
即ち古いメモリ内容の5REQを選択し。
また上部マルチプレクサMUX2はもし「アクティビテ
ィ」レジスタの値か偽のときは下部マルチプレクサMU
XIからの出力を選択し、又はアクティビティ レジス
タの値か真のときは処理要素出力を選択する。これによ
りアクティビティ制御された書込みがメモリに対してな
される。
(4)上部マルチプレクサMUX2は、1部マルチプレ
クサMUXIの場合と同様に、その下部入力を選択する
。この場合、Qレジスタの内容かMO上に出力され、更
に隣接処理要素に送出される。これは隣接シフト機能を
果たすものである。
各サブ アレイのエツジとは別に、最隣接接続のための
データ路は全体としてチップ内部に形成される。しかし
、各サブ アレイは個別チップLに形成され、従ってサ
ブ アレイのエツジにおいては外部条件はデータを一つ
のサブアレイから他のサブ アレイに連続的にシフトさ
せる必要がある。既に説明したように、各処理要素PE
はそのメモリ人力Ml及びメモリ出力MOに接続される
と共に、主として処理要素PE内のローカル ストアの
他に付加的な外部メモリの使用を可能にするように設け
られた双方向メモリ ビンPの形態の少なくとも一つの
外部接続部を増して形成される。
しかしながら、実際には外部メモリを処理要素に接続す
ることは必ずしも要求されず、従ってメモリ ビンPは
未使用のままで残される。
従って、メモリ出力から隣接サブ アレイの対応するエ
ツジ上の処理要素の最隣接入力への接続のためサブ ア
レイのエツジにおける処理要素のメモリ ビンか使用さ
れる。第5図に示すように、隣接サブ アレイS1.S
2のエツジにおける処理要素PE1、PE2のメモリ 
ピンP1、P2は二つのサブ アレイS1.S2の間で
単一の双方向接続を形成するように結合される。これら
のピンP1.P2の夫々は、メモリ出力MO、メモリ入
力Ml及びその夫々の処理要素PEの最隣接人力NNの
少なくとも一つに接続される0次に、例えば北方向への
データシフトにおいて、データはピンPを介して処理要
素PE2のメモリ出力MOからサブ アレイS2の北に
直ろに隣接するサブ アレイSlに至る。同様に、デー
タが南方向にシフトされるときは、このデータはピンP
を介してメモリ出力MOからPE2の最隣接入力NNに
到達する。ピンPは更に処理費、IPEを外部ストアに
接続するために使用され、この場合以下に示すように個
々のピンP1.P2の間にバッファか用いられる。
完全なアレイの配線が考えられるときは、サブ アレイ
の論理コーナーにおける処理要素の要件の間には対立か
あることか見出されている。従って、本実施例ては各サ
ブ アレイの北西及び南東コーナーに関わる二つの臨時
のピンか設けられる。同様に、北東及び南西コーナーに
臨時のピンを設けることにより同様の効果を奏すること
かできる。
第1表 ピン グループ ここで、Nは北へのシフトなど、Oは出力、■は入力、
−は使用されない入力1本は使用されない出力(即ち、
駆動される)を夫々表わす。
第1表は各シフト方向に対してどのピンか駆動されるか
を示したものである。ピンPは共にまとめられシフトの
各方向に対する各ピン クループの使用法と共にラベル
されている。北又は南方向へのシフトか行なわれるとき
は、東又は西方向へのシフトに対してのみ使用されるピ
ン(クループ5及び6)は使用されないか、夫々の場合
幾つかのピンかこれらの出力を更に駆動し定義されない
論理レベルに対するピンの「フローティング」を回避す
る。第1図に示したようにサブ アレイか相互接続され
ているときは、各シフト方向に対して各ネット(即ら、
相互接続ピンの組)か正確に一つのピンにより駆動され
、またこのネットをたかだか一つのピンか入力として使
用している。
第1図は、外部メモリをチップに接続することか要求さ
れない場合に適した構成を示す図である。このチップは
、その命令セットかメモリアクセスとデータシフトとを
共に含む単一の命令を含まないように構成される。従っ
て、ビンは同時に最隣接データ及びメモリデータを搬送
することを要求されないので、チップを外部メモリと共
に使用することがなお可能である。しかしながら、第1
図の相互接続は種々の処理要素PEのメモリ信号か共通
に接続されるように構成される。これを解決するため、
アレイが外部メモリ双方向トライ ステート バス ド
ライ ハ (external  鳳emory  b
idirectionalLri−state bus
 drivers)Bと共に使用されるときは、トライ
バBが第2図に示すようにアレイ間に接続される。これ
らのトライバBはそれ自体従来的な構成のものであるが
、シフト方向に貰って一方又は他方の方向にイネーブル
(enable)にされる、メモリアクセス中に全ての
ハス ドライバBはディスエーブル(disable)
にされ、またメモリ ピンPはPEチップにより駆動さ
れる(メモリ書込みに対して)かメモリ チップにより
駆動される(メモリ読み出しに対して)、構成を簡単に
するため、バス ドライバはまたアレイのコーナーにお
ける付加的なビンに対して設けられるか、これらはアレ
イの機能に対して必ずしも必要なものではない。
実際には、アレイは幾つかの異なる印刷回路基板に沿っ
て物理的に分配され、またこれらの基板の間での臨時の
バッファの挿入はシステムの電気的性質を改良する付加
的な目的のためになされる。
以上示した実施例は、外部メモリの有無とは関わりなし
に使用町癒な一般目的のチップに対して与えられたか、
本発明は外部メモリか必要とされないパッケージ チッ
プと共に同様に使用することかできる。この場合、チッ
プの中央の論理的に36のPE(即ち、6×6)のメモ
リ バッドに対する接続はなされず、従ってパッケージ
をより小さくすることができる。
【図面の簡単な説明】
第1図は、本発明の一実施例におけるサブ アレイ間の
接続を示す回路図、 第2図は、他の実施例におけるサブ アレイの相互接続
を示す回路図、 第3図は、処理要素内でのデータ流を示す回路図、 第4図は、処理要素の一つを示す回路図、及び 第5図は、隣接サブ アレイのエツジ上の二つの処理要
素間の結線を示す回路図である。 (主要部分の符号の説明) l ・・・・・・・・・・・・ プロセッサ アレイP
E  ・・・・・・・・・ 処理要素S  ・・・・・
・・・・ サブ アレイMUX・・・・・・・・・ マ
ルチプレクサALU  ・・・・・・ 演算ユニットA
 ・・・・・・・・・・・・ アクティビティ制御レジ
スタQ ・・・・・・・・・・・・  和レジスタ図面
の浄書(内容に変更なし) Ft’g、 7゜ 手続補正書 (方式) %式% 1、事件の表示 平成1年特許願第328572号 2、発明の名称 プロセッサ アレイ 3、補正をする者 参件との関係

Claims (1)

  1. 【特許請求の範囲】 1、一連の処理要素(PE)からなり、各処理要素(P
    E)が最隣接入力(NN)と、処理要素(PE)からの
    データを関連するストアに転送するメモリ出力(MO)
    と、処理要素(PE)の少なくとも幾つかのメモリ出力
    に接続されたメモリピン(P1、P2)とを 備えたプロセッサアレイにおいて、 前記メモリピンは、各処理要素(PE) の最隣接入力(NN)の少なくとも一つに 更に接続されると共に各処理要素(PE) に隣接する処理要素(PE)の最隣接入力 (NN)の少なくとも一つにデータを送出するように構
    成され、 更に前記処理要素(PE)は、それらの各 ストアにデータを転送すると共に個々の重畳しない動作
    においてそれらの各メモリ出力 (MO)を介してデータを出力することにより隣接処理
    要素(PE)にデータをシフトさせるように構成された
    ことを特徴とするプロセッサアレイ。 2、前記メモリピン(P1、P2)は、一方の端部がメ
    モリ出力(MO)に、また各処理要素(PE)の最隣接
    入力の少なくとも一方に接続されると共に、他方の端部
    が隣接処理要素(PE)のメモリピン(P1、P2) に接続されることを特徴とする請求項1記載のプロセッ
    サアレイ。 3、前記プロセッサアレイは一連のサブア レイ(S)からなり、またこれらのサブア レイ(S)のエッジに沿う処理要素のメモ リピン(P1、P2)は隣接サブアレイ 夫々の両エッジに沿い処理要素の最隣接入力(NN)に
    接続されて一つのサブアレイ (S)から隣のサブアレイ(S)にデータ をシフトさせるためのデータ路を提供することを特徴と
    する請求項1又は2記載のプロセッサアレイ。 4、前記サブアレイ(S)は正方形をなし、また各サブ
    アレイの対角線的に対向するコ ーナーの二対の一方はメモリピン(P)を 付加的に備え、一つのピンは二つのコーナーの夫々に隣
    接して形成されると共に、各コーナーの処理要素(PE
    )を隣接サブアレ イ(S)の対向するコーナーの処理要素 (PE)に接続するように構成されることを特徴とする
    請求項3記載のプロセッサアレ イ。 5、隣接サブアレイ(S)のメモリピン (P)の間に接続されると共にサブアレイ (S)の各エッジ上の処理要素(PE)に外部メモリを
    接続するように構成されたバッファを備えることを特徴
    とする請求項3又は4記載のプロセッサアレイ。
JP1328572A 1988-12-20 1989-12-20 プロセッサアレイ Pending JPH02259867A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB888829624A GB8829624D0 (en) 1988-12-20 1988-12-20 Processor array
GB8829624.9 1988-12-20

Publications (1)

Publication Number Publication Date
JPH02259867A true JPH02259867A (ja) 1990-10-22

Family

ID=10648757

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1328572A Pending JPH02259867A (ja) 1988-12-20 1989-12-20 プロセッサアレイ

Country Status (3)

Country Link
EP (1) EP0375400A1 (ja)
JP (1) JPH02259867A (ja)
GB (1) GB8829624D0 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0539595A4 (en) * 1991-04-09 1994-07-20 Fujitsu Ltd Data processor and data processing method

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1445714A (en) * 1973-04-13 1976-08-11 Int Computers Ltd Array processors
GB1536933A (en) * 1977-03-16 1978-12-29 Int Computers Ltd Array processors
US4149242A (en) * 1977-05-06 1979-04-10 Bell Telephone Laboratories, Incorporated Data interface apparatus for multiple sequential processors

Also Published As

Publication number Publication date
GB8829624D0 (en) 1989-02-15
EP0375400A1 (en) 1990-06-27

Similar Documents

Publication Publication Date Title
US7272691B2 (en) Interconnect switch assembly with input and output ports switch coupling to processor or memory pair and to neighbor ports coupling to adjacent pairs switch assemblies
US4876641A (en) Vlsi data processor containing an array of ICs, each of which is comprised primarily of an array of processing
KR100288038B1 (ko) 초대규모집적에 적합한 파이프라인 반도체장치
EP1382117B9 (en) A field programmable gate array and microcontroller system-on-a-chip
US6073185A (en) Parallel data processor
US8482313B2 (en) Universal digital block interconnection and channel routing
EP1391991A1 (en) Integrated circuit device
US20010038298A1 (en) Field programmable processor devices
JPH03211689A (ja) プロセッサ配列システム
US7185174B2 (en) Switch complex selectively coupling input and output of a node in two-dimensional array to four ports and using four switches coupling among ports
EP0728337B1 (en) Parallel data processor
US20050024983A1 (en) Providing a register file memory with local addressing in a SIMD parallel processor
US7409529B2 (en) Method and apparatus for a shift register based interconnection for a massively parallel processor array
JP2001250113A (ja) 信号処理デバイス及び画像信号処理システム
WO2004010286A2 (en) Self-configuring processing element
JPH10233676A (ja) 論理アレイブロック内でローカル相互接続ラインを配列する方法およびプログラマブル論理回路
US7840826B2 (en) Method and apparatus for using port communications to switch processor modes
JPH02259867A (ja) プロセッサアレイ
Chin et al. A dynamically reconfigurable interconnection chip
GB2400195A (en) Processing array topography
JPH08297652A (ja) アレイプロセッサ
JP4212161B2 (ja) 半導体装置
JPH03204959A (ja) 半導体集積回路装置
JPS62239545A (ja) スキヤンパス回路内蔵形ゲ−トアレイマスタ−
JPH01293796A (ja) デジタル信号交換器