JPS6359651A - デ−タ処理装置 - Google Patents
デ−タ処理装置Info
- Publication number
- JPS6359651A JPS6359651A JP62186779A JP18677987A JPS6359651A JP S6359651 A JPS6359651 A JP S6359651A JP 62186779 A JP62186779 A JP 62186779A JP 18677987 A JP18677987 A JP 18677987A JP S6359651 A JPS6359651 A JP S6359651A
- Authority
- JP
- Japan
- Prior art keywords
- data
- elements
- columns
- rows
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 claims description 30
- 238000012546 transfer Methods 0.000 claims description 13
- 238000005192 partition Methods 0.000 claims description 12
- 230000008878 coupling Effects 0.000 claims 1
- 238000010168 coupling process Methods 0.000 claims 1
- 238000005859 coupling reaction Methods 0.000 claims 1
- 230000001351 cycling effect Effects 0.000 claims 1
- 102100032533 ADP/ATP translocase 1 Human genes 0.000 description 2
- 101000796932 Homo sapiens ADP/ATP translocase 1 Proteins 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 238000013506 data mapping Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000000034 method Methods 0.000 description 2
- 101100136064 Mycobacterium tuberculosis (strain ATCC 25618 / H37Rv) PE13 gene Proteins 0.000 description 1
- 101150087801 PE23 gene Proteins 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/80—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
- G06F15/8007—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors single instruction multiple data [SIMD] multiprocessors
- G06F15/8023—Two dimensional arrays, e.g. mesh, torus
Landscapes
- Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multi Processors (AREA)
- Image Processing (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
ロ の ′4− ・ 1−r+本発明は各ロ
ーカルメモリー内に保持されているデーターに対して並
列に動作可能な処理素子のアレイから成り、前記素子は
互いに行及び列をなして接続されていて、各行及び列を
成して隣接している素子間におけるデータの転送を許容
する処理装置に関する。
ーカルメモリー内に保持されているデーターに対して並
列に動作可能な処理素子のアレイから成り、前記素子は
互いに行及び列をなして接続されていて、各行及び列を
成して隣接している素子間におけるデータの転送を許容
する処理装置に関する。
この種の装置は例えば、英国特許明細書No、I445
714及び2103400に記述されていて、大規模な
アレイ又はベクトルを有する、多数の個別データ要素(
i Lems)からなるデータを処理するのに特に有用
である。
714及び2103400に記述されていて、大規模な
アレイ又はベクトルを有する、多数の個別データ要素(
i Lems)からなるデータを処理するのに特に有用
である。
この様な装置を作動させる為には、データを何等かの方
法で処理素子上にマツプする必要がある、すなわち各デ
ータ要素を特定の処理素子に割当てて該素子上にて動作
させることである。また演算の過程に於てはデータのマ
ツピングを変更する事も必要とされる。データ要素のマ
ツピングと相異なるマツピング間に於いての転送とにつ
いてはP、M、フランンダース(P、M、Flande
rs)著のIEEE)ランザクジョン・オンeコンピュ
ータ(Transactions on Comput
ers) 、 C−31巻、第9号、(1982年9月
発行)「アレイ処理装置上のデータ移動の階級ヘノ統合
アプローチJ (A unified approac
hto a class of data movem
ents on an arrayprocessor
)に於て論述されている。
法で処理素子上にマツプする必要がある、すなわち各デ
ータ要素を特定の処理素子に割当てて該素子上にて動作
させることである。また演算の過程に於てはデータのマ
ツピングを変更する事も必要とされる。データ要素のマ
ツピングと相異なるマツピング間に於いての転送とにつ
いてはP、M、フランンダース(P、M、Flande
rs)著のIEEE)ランザクジョン・オンeコンピュ
ータ(Transactions on Comput
ers) 、 C−31巻、第9号、(1982年9月
発行)「アレイ処理装置上のデータ移動の階級ヘノ統合
アプローチJ (A unified approac
hto a class of data movem
ents on an arrayprocessor
)に於て論述されている。
本発明の目的は前記の如く、相異なるデータマツピング
間の転送を容易に実行できるデータ処理装置を提供する
ことにある。
間の転送を容易に実行できるデータ処理装置を提供する
ことにある。
l五立11
本発明によれば、各ローカルメモリー内に保持されてい
るデータ上で並列に動作可能な処理素子のアレイを具備
し、前記素子はデータの転送を各行及び各列内の隣接す
る素子間に実行する為に互いに行及び列を成して結合さ
れているデータ処理装置に於て、館記行および列もしく
は行または列は、この行および列もしくは行またはを複
数の区画にサブ分割する為と、データをこの区画内の素
子を介して循環して移動する為に各区画内の最初と最後
の素子を連結する為とのスイッチ手段を有していること
を特徴とするデータ処理装置が提供される。
るデータ上で並列に動作可能な処理素子のアレイを具備
し、前記素子はデータの転送を各行及び各列内の隣接す
る素子間に実行する為に互いに行及び列を成して結合さ
れているデータ処理装置に於て、館記行および列もしく
は行または列は、この行および列もしくは行またはを複
数の区画にサブ分割する為と、データをこの区画内の素
子を介して循環して移動する為に各区画内の最初と最後
の素子を連結する為とのスイッチ手段を有していること
を特徴とするデータ処理装置が提供される。
大JL例
第1図を参照して説明すると、処理素子(PE)は演3
>及び論理ユニット(ALU)10及びPE内に於ける
処理用のデータ要素を保持するローカルメモリー11と
を含む。ローカルメモリー11はランダム・アクセスメ
モリーであり、かつ4ビツト中の入力及び出力とを具備
している。
>及び論理ユニット(ALU)10及びPE内に於ける
処理用のデータ要素を保持するローカルメモリー11と
を含む。ローカルメモリー11はランダム・アクセスメ
モリーであり、かつ4ビツト中の入力及び出力とを具備
している。
該PEとその他のPEとの間のデータの転送は転送レジ
スターと呼ばれる4ビツトのシフトレジスター12を介
して行なわわる。転送レジスターはローカルメモリー1
1のデータ入力に接続され、かつ後に述へる同一チップ
上に於て選択されるべき他のPEにも接続されている4
ビツト巾の平行出力経路13を有している。転送レジス
ター12はアレイ内の4つの最も隣接しているPEへ後
述する東西南北方向の経路をとって出力信号を供給する
直列の出力経路14をも具備している。
スターと呼ばれる4ビツトのシフトレジスター12を介
して行なわわる。転送レジスターはローカルメモリー1
1のデータ入力に接続され、かつ後に述へる同一チップ
上に於て選択されるべき他のPEにも接続されている4
ビツト巾の平行出力経路13を有している。転送レジス
ター12はアレイ内の4つの最も隣接しているPEへ後
述する東西南北方向の経路をとって出力信号を供給する
直列の出力経路14をも具備している。
転送レジスターは第1のマルチプレクサ−15から1回
に4ビツトの入力データを並列に受信できる。この代わ
りに、第2のマルチプレクサ−16から直列に1回に1
ビツトの入力データを受信できる。
に4ビツトの入力データを並列に受信できる。この代わ
りに、第2のマルチプレクサ−16から直列に1回に1
ビツトの入力データを受信できる。
第一のマルチプレクサ−15は5つの入力(0〜4)を
具備している。入力0はローカルメモリー11のデータ
出力に接続されている。
具備している。入力0はローカルメモリー11のデータ
出力に接続されている。
入力1〜4は第4図を参照して後に述べる様に同一チッ
プ上の他のPEの並列出力経路13に接続されている。
プ上の他のPEの並列出力経路13に接続されている。
第二のマルチプレクサ−16は9つの入力O〜8を具備
している。入力0〜3はアレイ内の4つの隣接するPE
の直列出力経路14からの東西南北信号を東西南北の方
向で受信する為に接続されている。入力4〜7は本発明
には無関係である。入力8は第5図を参照して後述する
長距漣経路回路からのLDR信号を受信する。
している。入力0〜3はアレイ内の4つの隣接するPE
の直列出力経路14からの東西南北信号を東西南北の方
向で受信する為に接続されている。入力4〜7は本発明
には無関係である。入力8は第5図を参照して後述する
長距漣経路回路からのLDR信号を受信する。
ここで第2図において処理素子PE0O−PE33の4
×4のサブアレイを具備する大規模集積回路(VLS
I )チップが示されている。
×4のサブアレイを具備する大規模集積回路(VLS
I )チップが示されている。
−F記の如く、各PEの直列出力経路14は同一チップ
上において隣接しているPEの東西南北入力に接続され
ている。
上において隣接しているPEの東西南北入力に接続され
ている。
北側サブアレイ(PEOO5PEO1、PE02及びP
E03)の4つのPEの場合、各直列出力経路14はま
た送信回路22を介して4つの入力及び出力もしくは入
力または出力ピン21に接続されている。この入力及び
出力もしくは入力または出力ピン21はまた受信回路2
3を介してこれら4つのPEの才入力に接続されている
。
E03)の4つのPEの場合、各直列出力経路14はま
た送信回路22を介して4つの入力及び出力もしくは入
力または出力ピン21に接続されている。この入力及び
出力もしくは入力または出力ピン21はまた受信回路2
3を介してこれら4つのPEの才入力に接続されている
。
同様にして、西側サブアレイの4つのPE(PEOO1
PEIO1PE20及びPE30)は転送回路25を介
して4つの入力及び出力もしくは入力または出力ピン2
4にそれぞれ接続される自身の直列出力経路14を具備
している。ピン24はまた受信回路26を介してこれら
4つのPEの画入力にも接続されている。
PEIO1PE20及びPE30)は転送回路25を介
して4つの入力及び出力もしくは入力または出力ピン2
4にそれぞれ接続される自身の直列出力経路14を具備
している。ピン24はまた受信回路26を介してこれら
4つのPEの画入力にも接続されている。
東側の4つのPE (PEO3、PE13、PE23及
びPE33)及び南側の4つのPE(PE30、PE3
1、PE32及びPE33)の直列出力経路14はそれ
ぞれ組として4つの2:1マルチプレクサ−27の入力
に接続され、その出力は転送回路28を介してピン29
の4つの入力及び出力もしくは入力または出力へ送られ
ている。ピン29はさらに受信回路30を介して東側の
PEの原入力に接続され、南側のPEの南天力に接続さ
れている。
びPE33)及び南側の4つのPE(PE30、PE3
1、PE32及びPE33)の直列出力経路14はそれ
ぞれ組として4つの2:1マルチプレクサ−27の入力
に接続され、その出力は転送回路28を介してピン29
の4つの入力及び出力もしくは入力または出力へ送られ
ている。ピン29はさらに受信回路30を介して東側の
PEの原入力に接続され、南側のPEの南天力に接続さ
れている。
ピン29は攻にサブアレイの東側のPEと南側のPEと
の間で分有(shared)されていることが明らかで
ある。ピンがかくして分有されている理由はデーターを
送る為にVLSI上に必要とされるピンの総数を少なく
する為である。この特徴は前記英国特許明細書No、2
1034QOに述べられている。
の間で分有(shared)されていることが明らかで
ある。ピンがかくして分有されている理由はデーターを
送る為にVLSI上に必要とされるピンの総数を少なく
する為である。この特徴は前記英国特許明細書No、2
1034QOに述べられている。
第3図は16個のVLSIチップが相互に結合されて1
6列16行のPEからなるアレイを形成する方法を示し
ている。
6列16行のPEからなるアレイを形成する方法を示し
ている。
本図から明らかなように、各チップの北側のピン21は
隣接するチップの多重化ピン29に北方向にて接続され
、各チッップの西側のピン24は隣接するチップの多重
化ビン29に西方向にて接続されている。各チップの多
重化ビン29は隣接するチップのピン21に南方向にて
接続されるとともに、隣接するチップのピン24にも東
方向にて接続されている。
隣接するチップの多重化ピン29に北方向にて接続され
、各チッップの西側のピン24は隣接するチップの多重
化ビン29に西方向にて接続されている。各チップの多
重化ビン29は隣接するチップのピン21に南方向にて
接続されるとともに、隣接するチップのピン24にも東
方向にて接続されている。
PEとチップ間の接続は、ここまで述べた如く、データ
を隣接するPE間に於て東西南北のどの方向へも転送す
ることが可能となる。
を隣接するPE間に於て東西南北のどの方向へも転送す
ることが可能となる。
データを北へ送信する為に、各PEのマルチプレクサ−
16はその南天力を選択する様に、すなわちその隣接す
る南側の直列出力13からデータを選択する様にセット
されている。
16はその南天力を選択する様に、すなわちその隣接す
る南側の直列出力13からデータを選択する様にセット
されている。
同様に、データを東へ受信する為に、各PEのマルチプ
レクサ−16はその内入力を選択する様に、すなわち隣
接する西側の直列出力13からのデータを選択する様に
セットされている。
レクサ−16はその内入力を選択する様に、すなわち隣
接する西側の直列出力13からのデータを選択する様に
セットされている。
データを南側もしくは西側へ送信する場合は、マルチプ
レクサ−27は各チ・lプのサブアレイに於ける適切な
側を選択するようにセットされなければならない。
レクサ−27は各チ・lプのサブアレイに於ける適切な
側を選択するようにセットされなければならない。
データーを南側へ送信する為に、&PEのマルチプレク
サ−16はかくして、その北側入力を選択する様にセッ
トされ、同時に、各チップのマルチプレクサ−27はサ
ブアレイの南側からのデーターを選択する様にセットさ
れる。
サ−16はかくして、その北側入力を選択する様にセッ
トされ、同時に、各チップのマルチプレクサ−27はサ
ブアレイの南側からのデーターを選択する様にセットさ
れる。
同様にして、データを西側へ送信″4−る為に、各PE
のマルチプレクサ−16はその原入力を選択する様セッ
トされ、同時に各チップのマルチプレクサ−27はサブ
アレイの西側からデータを選択する為にセットされる。
のマルチプレクサ−16はその原入力を選択する様セッ
トされ、同時に各チップのマルチプレクサ−27はサブ
アレイの西側からデータを選択する為にセットされる。
上記の如き最隣接の接続に加えて、PEはアレイの各行
及び列を区画に分割する為にも又接続されなければなら
ないし、PE内のデーターの7ツビングの変換を容易に
する為にも各区画の2つの半分区画が交換されなければ
ならない。
及び列を区画に分割する為にも又接続されなければなら
ないし、PE内のデーターの7ツビングの変換を容易に
する為にも各区画の2つの半分区画が交換されなければ
ならない。
16X16のアレイの場合、データーの交換が実行ざわ
る4つのレベルがある。
る4つのレベルがある。
(1)各行及び列がPEからなる8組に分割され、デー
タは各組の2個のPE間に於て交換される。
タは各組の2個のPE間に於て交換される。
(2)各行及び列は4区画に分割され、各区画は4個の
PEを含み、そしてデーターは各区画の最初の2個のP
Eと最後の2個のPEの間で交換される。
PEを含み、そしてデーターは各区画の最初の2個のP
Eと最後の2個のPEの間で交換される。
(3)各行及び列は2区画に分割され、各区画は8個の
PEを含み、そしてデータは各区画の最初の4個のPE
と最後の4個のPEの間で交換される。
PEを含み、そしてデータは各区画の最初の4個のPE
と最後の4個のPEの間で交換される。
(4)データーは各行及び列の最初の8個のPEと最後
の8個のPEの間で交換される。
の8個のPEの間で交換される。
第1及び第2のレベルの交換はPE内のマルチプレクサ
−15を介して実行される。(第1図) 上述の如く、各マルチプレクサ−15は同一チップ上の
他の4個のPEの並列出力経路13に接続される自身の
入力1〜4を具備している。これらの接続を具体的に示
すと下記の通りである。
−15を介して実行される。(第1図) 上述の如く、各マルチプレクサ−15は同一チップ上の
他の4個のPEの並列出力経路13に接続される自身の
入力1〜4を具備している。これらの接続を具体的に示
すと下記の通りである。
マルチプレクサ−15の入力
PE 1 2 3 400 0
f 02 10 200f 00 0
3 11 2103 02 0f 13
23かくして、例えば、PE0Oの場合(第1図参
照)、マルチプレクサ−15の入力1〜4はそれぞれP
EO1、PEO2、PEl0及びPE20の出力経路1
3に接続されている。
f 02 10 200f 00 0
3 11 2103 02 0f 13
23かくして、例えば、PE0Oの場合(第1図参
照)、マルチプレクサ−15の入力1〜4はそれぞれP
EO1、PEO2、PEl0及びPE20の出力経路1
3に接続されている。
前記の第1のレベルのデータ交換をPHの行に起こす為
に、各マルチプレクサ−15は自身の入力1を選択する
為に作動される。第4A図に示すように、このことが同
一の行内のPEの各隣接組内でデータ交換を実行する為
にチップの各行の4個のPEを接続させる。
に、各マルチプレクサ−15は自身の入力1を選択する
為に作動される。第4A図に示すように、このことが同
一の行内のPEの各隣接組内でデータ交換を実行する為
にチップの各行の4個のPEを接続させる。
同様にして、PEの行に第2のレベルのデータ交換を起
こす為に、各マルチプレクサ−15は自身の入力2を選
択する為に作動される。このことが第4B図に示す如く
、チップの各行の4個のPEを互いに接続させる。この
ことか各行の第1及び第2のPEのデータを同一行内の
第3及び第4のPEのデータとそわぞれ交換させる。
こす為に、各マルチプレクサ−15は自身の入力2を選
択する為に作動される。このことが第4B図に示す如く
、チップの各行の4個のPEを互いに接続させる。この
ことか各行の第1及び第2のPEのデータを同一行内の
第3及び第4のPEのデータとそわぞれ交換させる。
あるいは、PEの列の第1及び第2のレベルの交換が入
力2及び3を選択することにより実行される。
力2及び3を選択することにより実行される。
第5図によると、チップの各行は自身に集る長距S経路
回路50を具備している。これら回路50のうちの唯一
つが図示さねているが他の行も同様の回路と具備してい
る。各長距離経路回路は2個のマルチプレクサ−51及
び52を具備している。
回路50を具備している。これら回路50のうちの唯一
つが図示さねているが他の行も同様の回路と具備してい
る。各長距離経路回路は2個のマルチプレクサ−51及
び52を具備している。
マルチプレクサ−51の入力Oは行内の第2のチップの
ビン29に接続され、一方、入力1は行内の第4のチッ
プのビン29に接続されている。マルチプレクサ−51
の出力は行内の第3のチップの西側のPEのLDR入力
に接続されている。
ビン29に接続され、一方、入力1は行内の第4のチッ
プのビン29に接続されている。マルチプレクサ−51
の出力は行内の第3のチップの西側のPEのLDR入力
に接続されている。
マルチプレクサ−52の入力0は行内の第4のチップの
ビン29に接続されており、一方、入力1は行内の第2
のチップのビン29に接続されている。マルチプレクサ
−52の出力は行内の第1のチップの西側のPEのLD
R入力に接続ざわている。
ビン29に接続されており、一方、入力1は行内の第2
のチップのビン29に接続されている。マルチプレクサ
−52の出力は行内の第1のチップの西側のPEのLD
R入力に接続ざわている。
同様に、チップの各列は自身に集まる長距離経路回路5
3を有している。(1つだけをし1示)これら回路53
はそれぞれ図示の如くマルチプレクサ−51及び52と
同様の方法で接続さねている2個のマルチプレクサ−5
4反び55を具備している。
3を有している。(1つだけをし1示)これら回路53
はそれぞれ図示の如くマルチプレクサ−51及び52と
同様の方法で接続さねている2個のマルチプレクサ−5
4反び55を具備している。
PEの行においてF記のレベル3の交換を起こす為に、
マルチプレクサ−51及び52は入力0を選択する為に
作動される。同時に各チップの西側の各PE内のマルチ
プレクサ−!6は自身のLDR入力を選択するために作
動ざわ、一方、他のすべてのPE内のマルチプレクサ−
16は自身の百入力を選択する2)に作動される。この
ことが各群のPEをループ状に接続させておいて、PE
の各行を8個のPEの2つの群に分割させる。かくして
データは各ループを循環して移動される。16回の移動
の後に、各ループの2個の半分1■におけるデータか所
望通りに交換されることか理解てきる。
マルチプレクサ−51及び52は入力0を選択する為に
作動される。同時に各チップの西側の各PE内のマルチ
プレクサ−!6は自身のLDR入力を選択するために作
動ざわ、一方、他のすべてのPE内のマルチプレクサ−
16は自身の百入力を選択する2)に作動される。この
ことが各群のPEをループ状に接続させておいて、PE
の各行を8個のPEの2つの群に分割させる。かくして
データは各ループを循環して移動される。16回の移動
の後に、各ループの2個の半分1■におけるデータか所
望通りに交換されることか理解てきる。
同様にして、PEの行にレベル4の交換を剋こす1)に
、マルチプレクサ−51及び52は入力1を選択する為
に作動される。各PE内のマルチプレクサ−16はレベ
ル3の交換の為に作動される。PEの各行はかくして単
一のループとして接続される。このループ内で32回の
移動後、このループの2つの半分部のデータか所定通り
交換される。
、マルチプレクサ−51及び52は入力1を選択する為
に作動される。各PE内のマルチプレクサ−16はレベ
ル3の交換の為に作動される。PEの各行はかくして単
一のループとして接続される。このループ内で32回の
移動後、このループの2つの半分部のデータか所定通り
交換される。
上記のシステムをより大きなPEアレイ、例えば32x
32のアレイ又は64X64のアレイに容易に拡張しう
ることは明らかであろう。
32のアレイ又は64X64のアレイに容易に拡張しう
ることは明らかであろう。
本発明による処理装置の例は添付図面を参照して説明さ
れている。 第1図は処理素子(PE)を示し、第2図はPEの4×
4のサブ・アレイからなる集積回路チップを示し、第3
図はPEの16x16のアレイを形成する為に相互に接
続された16個の上記チップを示し、第4図は最初の2
つのレベルのデータ転送を実行する為のチップ内での接
続を示し、第5図は更なる2つのレベルのデータ転送を
実行する為のチップ間の接続を示す。 [主要部分の符号の説明] PE・・・・・・・・・処理素子 10・・・演算及び論理ユニット(ALU)11・・・
・・・・・・ローカルメモリー13・・・・・・・・・
並列出力経路 14・・・・・・・・・直列出力経路 15.16.17・・・マルチプレクサ−21,24,
29・・・出力及び入力もしくは出力または入力ピン 22.25.28・・・転送回路 23.26・・・・・・・・・・・・受信回路50.5
3・・・・・・・・・・・・長距離経路回路51.52
,54.55・・・スイッチ手段FIG、3
れている。 第1図は処理素子(PE)を示し、第2図はPEの4×
4のサブ・アレイからなる集積回路チップを示し、第3
図はPEの16x16のアレイを形成する為に相互に接
続された16個の上記チップを示し、第4図は最初の2
つのレベルのデータ転送を実行する為のチップ内での接
続を示し、第5図は更なる2つのレベルのデータ転送を
実行する為のチップ間の接続を示す。 [主要部分の符号の説明] PE・・・・・・・・・処理素子 10・・・演算及び論理ユニット(ALU)11・・・
・・・・・・ローカルメモリー13・・・・・・・・・
並列出力経路 14・・・・・・・・・直列出力経路 15.16.17・・・マルチプレクサ−21,24,
29・・・出力及び入力もしくは出力または入力ピン 22.25.28・・・転送回路 23.26・・・・・・・・・・・・受信回路50.5
3・・・・・・・・・・・・長距離経路回路51.52
,54.55・・・スイッチ手段FIG、3
Claims (1)
- 【特許請求の範囲】 1、各ローカルメモリー(11)内に保持されているデ
ータに対して並列に、動作可能な処理素子(PE)のア
レイからな成り、前記素子は互いに行及び列をなして接
続されてい て、各行及び列を成して隣接している素子間におけるデ
ータの転送を許容するデータ処置装置において、前記各
行及び列もしくは行または列は前記行及び列もしくは行
または列を複数の区画にサブ分割し、データを前記区画
内の前記素子を介して循環して移動させる為に各区画内
の最初と最後との素子を連結する為のスイッチ手段(5
1、52及び54、 55)を有していることを特徴とするデータ処理装置。 2、特許請求の範囲第1項に記載の装置であって、前記
スイッチ手段は各行及び列もしくは行または列を異なる
複数のレベルのうちの一つのレベルにおいてサブ分割す
る為に作動され、前記行及び列もしくは行または列は各
レベルにおいて該レベルに特定な複数の区画にサブ分割
され、前記スイッチ手段は各区画の最初と最後の素子を
結合することによりデータを前記区画の素子を介して循
環して移動させる為に作動されることを特徴とするデー
タ処理装置。 3、特許請求の範囲第2項に記載の装置であって、該装
置が更に前記処理素子のサブアレ イを各々有している複数の集積回路チップ (20)を有していることを特徴とするデータ処理装置
。 4、特許請求の範囲第3項に記載の装置であって、前記
スイッチ手段は、各チップ内にあって、独立した各区画
内のすべての素子が同一チップ内に位置される第一のレ
ベルに於いて前記の行及び列もしくは行または列をサブ
分割する為の第一のスイッチ論理(15)と、前記チッ
プの外側にあって、各区画内の素子が2個以上の前記チ
ップ内に位置される第二のレベルにおいて前記行及び列
もしくは行または列をサブ分割する為の第二のスイッチ
論理(51、52及び54、55)とを含むことを特徴
とするデータ処理装置。 5、特許請求の範囲第4項記載の装置であって、前記第
一のスイッチ論理(15)は、チップ内に於て並列デー
タ経路(13)を介して処理素子間でデータを移動させ
るための手段を有し、前記第二のスイッチ論理(51、
52及び54、55)は直列経路(14)を介して処理
素子間で移動させる為の手段を 有していることを特徴とするデータ処理装 置。 6、特許請求の範囲第5項記載の装置であって、各処理
素子は、前記の並列データ経路 (13)のうち一つを設定する並列出力と、前記の直列
経路(14)のうち一つを設定 する直列出力とを有するシフトレジスター (12)とを含むことを特徴とするデータ処理装置。 7、特許請求の範囲第6項記載の装置であって、各処理
素子は、前記第1のスイッチ論理を設定するマルチプレ
クサー(15)を有 し、前記マルチプレクサーは前記シフトレジシター(1
2)の並列入力に接続されている出力を有し、前記マル
チプレクサーはまた前記処理素子のローカルメモリー(
11)に接続されている第1の入力と、他の処理素子の
並列データ経路(13)に接続されている更なる入力と
を同一チップ内に有することを特徴とするデータ処理装
置。 8、特許請求の範囲第7項記載の装置であって、前記各
処理素子は、シフトレジスター (12)の直列入力に接続されている出力 と、前記第2のスイッチ論理(51、52及び54、5
5)に接続されている第1の入力(LDR)と、アレイ
内において隣接している処理素子の直列データ経路(1
4)に接続されている更なる入力(東西南北)とを有す
るマルチプレクサー(16)を有していることを特徴と
するデータ処理装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB8618943 | 1986-08-02 | ||
GB868618943A GB8618943D0 (en) | 1986-08-02 | 1986-08-02 | Data processing apparatus |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6359651A true JPS6359651A (ja) | 1988-03-15 |
Family
ID=10602158
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62186779A Pending JPS6359651A (ja) | 1986-08-02 | 1987-07-28 | デ−タ処理装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US4876641A (ja) |
EP (1) | EP0256661B1 (ja) |
JP (1) | JPS6359651A (ja) |
DE (1) | DE3765059D1 (ja) |
GB (1) | GB8618943D0 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012133793A (ja) * | 1997-10-10 | 2012-07-12 | Altera Corp | プロセッサアレイ及びその形成方法 |
Families Citing this family (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE68920388T2 (de) * | 1988-09-19 | 1995-05-11 | Fujitsu Ltd | Paralleles Rechnersystem mit Verwendung eines SIMD-Verfahrens. |
GB2232512A (en) * | 1989-05-31 | 1990-12-12 | Plessey Telecomm | Processor unit networks |
EP0444368B1 (en) * | 1990-02-28 | 1997-12-29 | Texas Instruments France | Digital Filtering with SIMD-processor |
DE4017132A1 (de) * | 1990-05-28 | 1991-12-05 | Oliver Bartels | Datenverarbeitungsanlage |
US5133073A (en) * | 1990-05-29 | 1992-07-21 | Wavetracer, Inc. | Processor array of N-dimensions which is physically reconfigurable into N-1 |
US5590345A (en) * | 1990-11-13 | 1996-12-31 | International Business Machines Corporation | Advanced parallel array processor(APAP) |
GB2251964B (en) * | 1991-01-15 | 1994-09-14 | Sony Corp | Processor arrays |
JPH04248642A (ja) * | 1991-01-18 | 1992-09-04 | Kenneth W Iobst | メモリ集積回路のpimチップおよびその制御方法 |
JPH04290155A (ja) * | 1991-03-19 | 1992-10-14 | Fujitsu Ltd | 並列データ処理方式 |
JPH04293151A (ja) * | 1991-03-20 | 1992-10-16 | Fujitsu Ltd | 並列データ処理方式 |
EP0562251A2 (en) * | 1992-03-24 | 1993-09-29 | Universities Research Association, Inc. | Parallel data transfer network controlled by a dynamically reconfigurable serial network |
US5331315A (en) * | 1992-06-12 | 1994-07-19 | Universities Research Association, Inc. | Switch for serial or parallel communication networks |
US6502180B1 (en) * | 1997-09-12 | 2002-12-31 | California Institute Of Technology | Asynchronous circuits with pipelined completion process |
DE19756591B4 (de) * | 1997-12-18 | 2004-03-04 | Sp3D Chip Design Gmbh | Vorrichtung zum hierarchischen Verbinden einer Mehrzahl von Funktionseinheiten in einem Prozessor |
US6185667B1 (en) * | 1998-04-09 | 2001-02-06 | Teranex, Inc. | Input/output support for processing in a mesh connected computer |
US6754802B1 (en) * | 2000-08-25 | 2004-06-22 | Micron Technology, Inc. | Single instruction multiple data massively parallel processor systems on a chip and system using same |
GB2374442B (en) * | 2001-02-14 | 2005-03-23 | Clearspeed Technology Ltd | Method for controlling the order of datagrams |
US20070124565A1 (en) * | 2003-06-18 | 2007-05-31 | Ambric, Inc. | Reconfigurable processing array having hierarchical communication network |
US7350036B2 (en) * | 2005-08-01 | 2008-03-25 | Intel Corporation | Technique to perform concurrent updates to a shared data structure |
US7890559B2 (en) * | 2006-12-22 | 2011-02-15 | International Business Machines Corporation | Forward shifting of processor element processing for load balancing |
US8122297B2 (en) * | 2007-10-18 | 2012-02-21 | International Business Machines Corporation | Method and apparatus for parallel and serial data transfer |
FR2984556B1 (fr) * | 2011-12-20 | 2014-09-26 | Commissariat Energie Atomique | Systeme et procede de communication entre un circuit d'acquisition et un circuit de traitement de donnees |
US10866753B2 (en) | 2018-04-03 | 2020-12-15 | Xilinx, Inc. | Data processing engine arrangement in a device |
US11379389B1 (en) | 2018-04-03 | 2022-07-05 | Xilinx, Inc. | Communicating between data processing engines using shared memory |
US10747690B2 (en) | 2018-04-03 | 2020-08-18 | Xilinx, Inc. | Device with data processing engine array |
US10891132B2 (en) | 2019-05-23 | 2021-01-12 | Xilinx, Inc. | Flow convergence during hardware-software design for heterogeneous and programmable devices |
US11301295B1 (en) | 2019-05-23 | 2022-04-12 | Xilinx, Inc. | Implementing an application specified as a data flow graph in an array of data processing engines |
US10891414B2 (en) | 2019-05-23 | 2021-01-12 | Xilinx, Inc. | Hardware-software design flow for heterogeneous and programmable devices |
US11188312B2 (en) | 2019-05-23 | 2021-11-30 | Xilinx, Inc. | Hardware-software design flow with high-level synthesis for heterogeneous and programmable devices |
US10977018B1 (en) | 2019-12-05 | 2021-04-13 | Xilinx, Inc. | Development environment for heterogeneous devices |
US11443091B1 (en) | 2020-07-31 | 2022-09-13 | Xilinx, Inc. | Data processing engines with cascade connected cores |
US11496418B1 (en) | 2020-08-25 | 2022-11-08 | Xilinx, Inc. | Packet-based and time-multiplexed network-on-chip |
US11288222B1 (en) | 2020-09-28 | 2022-03-29 | Xilinx, Inc. | Multi-die integrated circuit with data processing engine array |
US11520717B1 (en) | 2021-03-09 | 2022-12-06 | Xilinx, Inc. | Memory tiles in data processing engine array |
US11336287B1 (en) | 2021-03-09 | 2022-05-17 | Xilinx, Inc. | Data processing engine array architecture with memory tiles |
US11848670B2 (en) | 2022-04-15 | 2023-12-19 | Xilinx, Inc. | Multiple partitions in a data processing array |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3308436A (en) * | 1963-08-05 | 1967-03-07 | Westinghouse Electric Corp | Parallel computer system control |
US3815095A (en) * | 1972-08-29 | 1974-06-04 | Texas Instruments Inc | General-purpose array processor |
US3979728A (en) * | 1973-04-13 | 1976-09-07 | International Computers Limited | Array processors |
US3898480A (en) * | 1974-04-04 | 1975-08-05 | Rockwell International Corp | Multiphase logic circuit |
US4174514A (en) * | 1976-11-15 | 1979-11-13 | Environmental Research Institute Of Michigan | Parallel partitioned serial neighborhood processors |
GB2020457B (en) * | 1978-05-03 | 1982-03-10 | Int Computers Ltd | Array processors |
US4215401A (en) * | 1978-09-28 | 1980-07-29 | Environmental Research Institute Of Michigan | Cellular digital array processor |
GB2074351B (en) * | 1980-03-28 | 1984-01-04 | Int Computers Ltd | Data processing system |
NL8002787A (nl) * | 1980-05-14 | 1981-12-16 | Philips Nv | Multiprocessor-rekenmachinesysteem voor het uitvoeren van een recursief algorithme. |
US4344134A (en) * | 1980-06-30 | 1982-08-10 | Burroughs Corporation | Partitionable parallel processor |
GB2103400B (en) * | 1981-08-06 | 1985-01-09 | Int Computers Ltd | Data processing system |
US4745546A (en) * | 1982-06-25 | 1988-05-17 | Hughes Aircraft Company | Column shorted and full array shorted functional plane for use in a modular array processor and method for using same |
US4622632A (en) * | 1982-08-18 | 1986-11-11 | Board Of Regents, University Of Washington | Data processing system having a pyramidal array of processors |
US4644496A (en) * | 1983-01-11 | 1987-02-17 | Iowa State University Research Foundation, Inc. | Apparatus, methods, and systems for computer information transfer |
US4580215A (en) * | 1983-03-08 | 1986-04-01 | Itt Corporation | Associative array with five arithmetic paths |
US4546428A (en) * | 1983-03-08 | 1985-10-08 | International Telephone & Telegraph Corporation | Associative array with transversal horizontal multiplexers |
US4709327A (en) * | 1983-05-31 | 1987-11-24 | Hillis W Daniel | Parallel processor/memory circuit |
US4621339A (en) * | 1983-06-13 | 1986-11-04 | Duke University | SIMD machine using cube connected cycles network architecture for vector processing |
GB8401805D0 (en) * | 1984-01-24 | 1984-02-29 | Int Computers Ltd | Data processing apparatus |
US4720780A (en) * | 1985-09-17 | 1988-01-19 | The Johns Hopkins University | Memory-linked wavefront array processor |
US4773038A (en) * | 1986-02-24 | 1988-09-20 | Thinking Machines Corporation | Method of simulating additional processors in a SIMD parallel processor array |
-
1986
- 1986-08-02 GB GB868618943A patent/GB8618943D0/en active Pending
-
1987
- 1987-07-10 EP EP87306110A patent/EP0256661B1/en not_active Expired - Lifetime
- 1987-07-10 DE DE8787306110T patent/DE3765059D1/de not_active Expired - Fee Related
- 1987-07-28 JP JP62186779A patent/JPS6359651A/ja active Pending
- 1987-07-31 US US07/080,300 patent/US4876641A/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012133793A (ja) * | 1997-10-10 | 2012-07-12 | Altera Corp | プロセッサアレイ及びその形成方法 |
Also Published As
Publication number | Publication date |
---|---|
EP0256661B1 (en) | 1990-09-19 |
GB8618943D0 (en) | 1986-09-10 |
DE3765059D1 (de) | 1990-10-25 |
EP0256661A3 (en) | 1989-04-26 |
US4876641A (en) | 1989-10-24 |
EP0256661A2 (en) | 1988-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS6359651A (ja) | デ−タ処理装置 | |
EP0085520B1 (en) | An array processor architecture utilizing modular elemental processors | |
US4739476A (en) | Local interconnection scheme for parallel processing architectures | |
US4215401A (en) | Cellular digital array processor | |
EP0086052B1 (en) | Segregator functional plane for use in a modular array processor | |
US4270170A (en) | Array processor | |
EP0112885B1 (en) | Interconnecting plane for modular array processor | |
US9047440B2 (en) | Logical cell array and bus system | |
EP0132926B1 (en) | Parallel processor | |
US6356993B1 (en) | Dual aspect ratio PE array with no connection switching | |
US4467422A (en) | Array processor | |
US20030088754A1 (en) | Methods and apparatus for manifold array processing | |
JPH03211689A (ja) | プロセッサ配列システム | |
JPH0589066A (ja) | 多次元並列処理システム | |
US4270169A (en) | Array processor | |
US4524428A (en) | Modular input-programmable logic circuits for use in a modular array processor | |
EP1384158A2 (en) | An apparatus for controlling access in a data processor | |
US20040133750A1 (en) | Apparatus for controlling access in a data processor | |
GB2419005A (en) | System for a plurality of processing elements to access a register file memory with local and global addressing | |
US5133073A (en) | Processor array of N-dimensions which is physically reconfigurable into N-1 | |
US4543642A (en) | Data Exchange Subsystem for use in a modular array processor | |
EP0375401A1 (en) | Processor array | |
EP0240354A1 (en) | Memory Architecture for multiprocessor computers | |
GB2103400A (en) | Data processing system | |
JPH0214742B2 (ja) |