JPH08171537A - メッシュ・アレイ・プロセッサ - Google Patents

メッシュ・アレイ・プロセッサ

Info

Publication number
JPH08171537A
JPH08171537A JP5128714A JP12871493A JPH08171537A JP H08171537 A JPH08171537 A JP H08171537A JP 5128714 A JP5128714 A JP 5128714A JP 12871493 A JP12871493 A JP 12871493A JP H08171537 A JPH08171537 A JP H08171537A
Authority
JP
Japan
Prior art keywords
processor
array
cluster
folded
mesh
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5128714A
Other languages
English (en)
Inventor
Gerald G Pechanek
ジェラルド・ジョージ・ペチャネック
Stamatis Vassiliadis
スタマティス・バッシライアディス
G Delgado-Fnias Jose
ホセ・ガダルプ・デルガド−フライアス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH08171537A publication Critical patent/JPH08171537A/ja
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A21BAKING; EDIBLE DOUGHS
    • A21BBAKERS' OVENS; MACHINES OR EQUIPMENT FOR BAKING
    • A21B1/00Bakers' ovens
    • A21B1/02Bakers' ovens characterised by the heating arrangements
    • A21B1/24Ovens heated by media flowing therethrough
    • A21B1/245Ovens heated by media flowing therethrough with a plurality of air nozzles to obtain an impingement effect on the food
    • AHUMAN NECESSITIES
    • A21BAKING; EDIBLE DOUGHS
    • A21BBAKERS' OVENS; MACHINES OR EQUIPMENT FOR BAKING
    • A21B1/00Bakers' ovens
    • A21B1/42Bakers' ovens characterised by the baking surfaces moving during the baking
    • A21B1/48Bakers' ovens characterised by the baking surfaces moving during the baking with surfaces in the form of an endless band

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Food Science & Technology (AREA)
  • Multi Processors (AREA)
  • Baking, Grill, Roasting (AREA)

Abstract

(57)【要約】 【目的】 対角線折り返し三角メッシュ・コンピュータ
に正方メッシュ・コンピュータと同じ機能を与えるが、
接続性は半数になる大規模並列対角線折り返しメッシュ
・アレイ・プロセッサを提供する。 【構成】 本発明では、対角線折り返しメッシュ・アレ
イ・プロセッサに変更が加えられ、汎用性の高いプロセ
ッサ・ノードが与えられ、処理ノード間の接続性が高ま
ると共に、元の構造のイメージ処理と有限差分の機能が
維持される。対角線折り返し三角アレイ構造を繰返し折
り返すことによって、処理要素が集積され、これに接続
を追加することにより接続性が向上する。接続性は標準
的なメッシュ構成では改良が難しい。本発明による折り
返し構造は、元のメッシュの機能を維持しながらその能
力を拡大する。バイトニック・ソートの例は改良された
接続性の有用性を示す。この多重折り返しアレイの概念
を6接点六角アレイに応用して、この概念の一般性を明
らかにしている。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はマルチメディアのイメー
ジ処理とコンピュータ、特に大規模並列アレイ・プロセ
ッサに関する。
【0002】
【従来の技術】エンジニアは、更に高速なコンピュータ
を求めながら、現在のマシンの足枷になっている複雑な
問題を解決するために、数百、数千の低コスト・マイク
ロプロセッサを並列に接続したスーパーコンピュータを
開発している。このようなマシンは大規模並列マシンと
呼ばれる。並列動作する複数のコンピュータは数十年前
からある。初期の並列マシンには、1960年代に稼働
を始めたILLIACがある。このほかのマルチプロセ
ッサとしては、Cedar、Sigma−1、Butt
erflyとMonarch、Intel ipsc、
Connection Machine、Caltec
h COSMIC、N Cube、IBMRP3、IB
M GF11、NYU Ultra Compute
r、Intel Delta、及びTouchston
eがある(1990年12月4日公開のXuらによる米国特許第
4975834号明細書の部分要約を参照されたい)。
【0003】ILLIACから始まった大型マルチプロ
セッサは、スーパーコンピュータとみられている。商業
的に最大の成功をおさめたスーパーコンピュータは、複
数のベクトル・プロセッサをベースにしており、Cra
y ResearchのY−MPシステム、IBM 3
090をはじめ、Amdahl、Hitachi、Fu
jitsu、NECなど他のメーカーのマシンに代表さ
れる。
【0004】現在の大規模並列(MP)プロセッサは、
スーパーコンピュータ並の能力をもつと考えられてい
る。このようなコンピュータ・システムは、相互結合網
で多数のマルチプロセッサを集積し、それらを並列に動
作するようにプログラムする。これらのコンピュータの
動作モードはこれまで2つある。MIMDモード・マシ
ンとSIMDモード・マシンがある。おそらく商用分野
で最もよく知られているのは、Thinking Ma
chines社のConnection Machin
esシリーズ1、2であろう。これらは基本的にはSI
MDマシンである。大規模並列マシンの多くは、並列に
相互接続されたマルチプロセッサを使用して、並行性す
なわち並列動作機能を実現している。i860などIn
telのマルチプロセッサが同社及び他のメーカーによ
って用いられている。N Cubeは、このようなマシ
ンをIntel 386マイクロプロセッサで開発して
いる。他のマシンはいわゆる"トランスピュータ"チップ
で作られている。InmosTransputer I
MS T800がその一例である。Inmos Tra
nsputer T800は、高速浮動小数点プロセッ
サを搭載した32ビット・デバイスである。
【0005】開発されているシステムの一例として、数
個のInmos Transputer T800チッ
プは各々、32の通信リンク入力と32のリンク出力を
もつ。各チップが1つのプロセッサ、少量のメモリ、及
びローカル・メモリと外部インタフェースへの通信リン
クを備える。また、システムを構築する場合は、IMS
C011、C012などの通信リンク・アダプタが接
続される。また、例えば32のリンク入力と32のリン
ク出力の間にクロスバ・スイッチを設けて別のトランス
ピュータ・チップ間のポイント・ツー・ポイント接続を
得るために、IMS C004などのスイッチが利用さ
れる。また、専用デバイス、グラフィクス・コントロー
ラ、ディスク・コントローラなどの要件に合った特別の
目的に用いられるように、トランスピュータに適用され
る特殊回路やインタフェース・チップがある。Inmo
s IMS M212は16ビット・プロセスであり、
オンチップ・メモリと通信リンクを備える。これはハー
ドウェアとロジックによってディスク・ドライブを制御
し、プログラマブル・ディスク・コントローラまたは汎
用インタフェースとして使用できる。Inmosは並行
性(並列動作)を利用するために、特殊言語、Occa
mをトランスピュータのために開発した。プログラマ
は、トランスピュータ網をOccam言語で直接記述す
る必要がある。
【0006】MPマシンには、異なるトポロジでプロセ
ッサ・チップが相互接続された並列プロセッサ・アレイ
を用いるものがある。トランスピュータはクロスバ網に
IMS C004チップを追加する。ハイパーキューブ
接続を用いるシステムもある。バスまたはメッシュでマ
ルチプロセッサと関連回路を接続するシステムもある。
スイッチをプロセッサ・アドレス可能網として用いる回
路スイッチ・プロセッサによって相互接続されるシステ
ムもある。一般にプロセッサ・アドレス可能網は、昨
秋、ローレンス・リバモア研究所で配線によって相互接
続された14基のRISC/6000のように、粗雑な
マルチプロセッサとみられている。
【0007】いわゆるデータ処理の"大チャレンジ"に取
り組むために、Intel、nCubeなどによって超
大規模マシンが開発されているが、これらのコンピュー
タは極めて高価である。最近の見積によると、"大チャ
レンジ"に取り組むために米国政府から開発援助を受け
ているコンピュータで、3千万ドルから7千5百万ドル
(Teraコンピュータ)のコストがかかる。こうし
た"大チャレンジ"には、気象モデリング、流体の撹乱、
汚染の分散、人のゲノムと海流循環のマッピング、色力
学、半導体やスーパーコンピュータのモデリング、燃焼
系、視覚と認知などの問題がある。
【0008】大規模並列処理システムの実現に伴う問題
として、3つの異なる処理領域すなわちイメージ処理、
パターン認識、及びコンピュータ・グラフィクスから成
ると考えられるビジュアル情報処理がある。イメージ処
理、パターン認識、及びコンピュータ・グラフィクスの
統合は、イメージ・コンピューティングと呼ばれ、将来
のマルチメディア・ワークステーションに求められる能
力を表わす。マルチメディアとは情報の理解可能性を高
めて、人とコンピュータの対話を改良するために、イメ
ージ、グラフィクス、映像、音声、テキストを介するな
どにより、情報を2つ以上の形で表わす方式をいう。
【0009】ソートも大規模並列処理に適した分野であ
る。
【0010】
【発明が解決しようとする課題】大規模並列アレイ・プ
ロセッサにとっての問題は、イメージ処理、有限差分法
の問題、及びソートの問題に適切に取り組むことであ
る。
【0011】イメージ処理で用いられるアルゴリズムに
たたみ込み(convolution) がある。これはイメージ・
ピクセルの各値を、まわりの定義された領域すなわちピ
クセルのウィンドウ内のピクセルの加重和に置換えるも
のである。M×M正方のたたみ込みウィンドウはM×M
の重み群から成り、各々、ウィンドウ内の関連するピク
セルに対応する(Cypherらによる"SIMD Architectures
and Algorithms forImage Processing and Computer Vi
sion、" IEEE Transactions on Acoustics、Speech、an
d Signal Processing、Vol.37、No.12、pp.2158-217
4、December1989)。ピクセルのアレイがN×Nの場
合、たたみ込みアルゴリズムにはM22の乗算が必要で
ある。Nを1024、Mを3とすると1つのイメージ・
フレームのたたみ込みに、9百万回の乗算と積和演算が
必要になり、処理が毎秒30フレームのビデオ・データ
に対するものであれば、毎秒2億7千万回の乗算と積和
演算が必要になる。このデータを処理するのがユニプロ
セッサの場合、たたみ込みウィンドウの重みはそれぞれ
個別にフェッチしなければならず、乗算と加算は別々の
演算として処理され、その後、ピクセルの加重平均が書
込まれると、たたみ込みは、ピクセル当たり27回の個
別演算(読出し9回、乗算9回、加算8回、書込み1
回)になり、毎秒2千7百万回×30回の演算すなわち
毎秒8億1千万回の演算になる(Goveらによる"Image C
omputing Requirements for the 1990s:from Multimed
ia to Medicine、" Proceedings of the SPIE Vol.144
4-ImageCapture、Formatting、and Display、pp.318-3
33、1991)。このように計算負荷が大きいことから、シ
ステム・プロセッサからイメージ処理タスクの負荷を無
くし、イメージ・コンピューティングに必要な適切なス
ループットを与える専用プロセッサが提案されている。
このような専用プロセッサの1つが、最近接点メッシュ
接続コンピュータ(nearest neighbor mesh connected
computer)である(Cypherらの上記文献、Batcherによ
る"Design of a Massively ParallelProcessor、" IEEE
Transactions on Computers Vol.C-29、No.9、pp.8
36-840、September 1980、及びUhrによる"Multi-Comput
er Architectures forArtificial Intelligence、" New
York、New York:John Wiley & Sons、chap.8、pp.9
7、1987 )。このコンピュータでは複数のプロセッサ要
素(PE)が、それらの東西南北の方向の接点PEに接
続され、すべてのPEが同期した単一命令複数データ
(SIMD)の形態で動作する。PEはその接点PEの
いずれとも通信できるが、同時に通信できるPEは1つ
とされる。例えば、PEはそれぞれ、東の方向の接点P
Eと1つの通信サイクルで通信できる。また、データと
命令が1つのブロードキャスト通信期間にすべてのPE
に同時に伝えられるようにブロードキャスト・メカニズ
ムが存在することも前提になっている。インタフェース
はThinking Machines CM−1シリ
ーズのように、ビット直列が普通である。
【0012】大規模並列アレイ・プロセッサ(1992年4
月6日出願のPechanekらによるUSSN 07/864
112)では、イメージ処理たたみ込みと有限差分法の
アプリケーションの計算ニーズを、1つの対角線折り返
し(diagonal-fold )プロセッサ・アレイがまかなっ
た。大規模並列アレイ・プロセッサの接続性をスケーリ
ングによって改良し、イメージ処理と有限差分法の要件
に対応する汎用処理ノード・アーキテクチャを与えなが
ら、ソートなど、より汎用性の高いアプリケーションに
対応する能力を拡大する方法の必要性は認識されてい
る。
【0013】
【課題を解決するための手段】本発明者が改良を加えた
結果、新しいマシン機構が得られた。プロセッサの相互
結合系を折り返して簡易性と高速化を実現する方法を編
み出した。この方法では、複数のプロセッサ・ユニット
を結合して正方メッシュまたは六角メッシュと同等の機
構が得られると共に、従来の方法を採用した場合に必要
な配線の問題がなくなる。この等価性に加えて、ここで
述べる多重折り返し構造(multiplefolded structure)
は、プロセッサ間の接続性を改良し、アレイ構成を簡単
にスケーリングでき、従来の方法に必要なラップ・アラ
ウンド配線のすべてを再配置する必要がない。本発明の
配線では、直接的な相互接続とローカルな相互接続が可
能になり、スケーラビリティが得られる。
【0014】その結果、プロセッサのクラスタがアレイ
構成で相互接続された、数千ものコンピュータ・プロセ
ッサ・ユニットを持つコンピュータ・システムの並列ア
レイ構造が得られる。このアレイ構造では、上記の複数
のコンピュータ・プロセッサ・ユニットが、大規模並列
コンピュータ・システム構成で機能し、マルチメディ
ア、微分方程式を解く有限差分法、ソートなどの汎用ア
プリケーションが実行される。本発明者は、その初期の
大規模並列アレイ・プロセッサの折り返しの概念を拡大
して、現在、メッシュ相互結合系の第1、第2、及び第
3の折り返しでクラスタ・プロセッサ・ユニットを結合
できるようにしている。
【0015】本発明のシステムでは、プロセッサ要素
(PE)のアレイに、算術論理機能を備え、外部通信を
可能にする機能アレイが追加形成される。多重折り返し
PEは、アレイ構造の一部であり、クラスタとして構成
され、処理要素が多重折り返しにより相互接続される。
複数の処理要素の各々は、PEとその接点PEとの接続
を可能にする。PE間にはコンピュータ・インタフェー
スが設けられ、配線を共有した対称型処理を可能にする
網構造が得られる。例えば、データを北の方向に送信す
るPEはすべて、接続された処理要素であり、共に南北
の配線を東西の配線と共有する。これにより性能に影響
を与えることなく複雑な配線を少なくすることができ
る。
【0016】本発明のアレイ構成の相互接続は、算術機
能を持つプロセッサ・クラスタ・ユニットに結合される
手段を設けて、多重折り返しアレイ・プロセッサを形成
し、対称型デュアル処理要素のデータ要素の簡単な交換
によってマトリックス変換演算を1サイクルで実行させ
ることによって得られる。これにより、処理要素のアレ
イとの併用が可能になり、イメージ処理やマルチメディ
アのアプリケーション、微分方程式を解く有限差分法、
及びソートのための並列2Dたたみ込みメカニズムが得
られる。
【0017】本発明の大規模並列コンピュータ・システ
ム用のプロセッサ・クラスタ・ユニットは、複数の実行
ユニット、データと命令を受信するブロードキャスト・
メモリ・インタフェース、及びプロセッサ・クラスタ・
ユニットと、同ユニットの並列アレイの他のプロセッサ
・クラスタ・ユニットとをつなぐ複数のプロセッサ間通
信インタフェース手段を備える。クラスタ・ユニットは
上記ブロードキャスト・メモリ・インタフェースに接続
された命令データ・バッファを備え、命令とデータを受
信する。命令データ・バッファには、制御命令を処理す
る命令レジスタが接続される。実行ユニットの各々に複
数のデータ記憶レジスタが設けられ、データは分配ユニ
ットによってこれに送られる。分配ユニットは命令レジ
スタによって制御され、データ・バッファと複数の実行
ユニットに接続される。ユニットを相互接続するため
に、複数の実行ユニットの上記データ記憶レジスタに共
通セレクタ・ユニットが接続され、データ記憶レジスタ
のデータが検索され、上記データが、選択された実行ユ
ニット及び上記複数のプロセッサ間通信インタフェース
に送られる。
【0018】本発明ではまた、新しい計算機構が得られ
る(後述)。
【0019】
【実施例】
1.概要 本発明を実現するマシンは、大規模並列多重折り返しク
ラスタ・プロセッサ・メッシュ・アレイと呼ばれる。以
下これについて説明する。本発明は、大規模並列コンピ
ューティング・システムをマルチメディアのイメージ処
理や、ソートなど汎用性の高いアプリケーションに適し
たシステムにすることができる装置に関係する。ここで
述べるのは、大規模並列アレイ・プロセッサのアーキテ
クチャと関連コンピュータ・システム・アーキテクチャ
に対応し、バイトニック・ソートなどの汎用アプリケー
ションのための本発明の大規模並列多重折り返しクラス
タ・プロセッサ・メッシュ・アレイに採用できる、新し
いプロセッサ素子(PE)である。
【0020】多重折り返しの概念を利用した好適なマシ
ン構成を2つ示す。1つは正方「東西南北」の最近接点
メッシュ・プロセッサ・アレイの能力をエミュレートし
拡大する構成、もう1つは六角6接点メッシュ・プロセ
ッサ・アレイの能力をエミュレートし拡大する構成であ
る。
【0021】いずれの構成のPEも、ラップ・アラウン
ド結合構造で最近接点によって相互接続される。各PE
は新しい構造への正方または六角のメッシュのアルゴリ
ズムの送信をサポートする折り返しの前に、元の平方4
接点または六角6接点のアレイの参照記法で識別され
る。
【0022】アレイの多重折り返しにより、ラップ・ア
ラウンド線がローカルPE間の接続線になり、アレイの
スケーリングが簡素化されると共に、スケーリングされ
たアレイの接続性が改良される。プロセッサのクラスタ
内に接続線を追加することによって、アレイ全体の接続
性が改良される。この改良により、クラスタ内のプロセ
ッサに関しては、折り返し前の元のアレイ構成の同じプ
ロセッサ間に比べて通信距離が大幅に短縮される。
【0023】本発明による正方4接点アレイ構成の記法
では、上記処理ユニットが各々、折り返し前に元のN×
Nマトリックスに関して2つの添字を用いる記法、PE
column 、row (column(列)、row (行))によって識
別される。装置のプロセッサ・ユニットは、データ記憶
要素、実行ユニット、命令とデータを通信するためのブ
ロードキャスト・インタフェース、初期化をサポートす
るデータ記憶インタフェース、及びプロセッサ間インタ
フェースと呼ばれるラップ・アラウンド・インタフェー
スと通信手段を持つ最近接点を含む。
【0024】以上が本発明の概要である。実施例の詳細
に進む前に、ビジュアル情報の処理が3つの異なる処理
領域すなわちイメージ処理、パターン認識、及びコンピ
ュータ・グラフィクスから成ると考えられることを繰返
しておく(Goveらによる上記文献を参照)。これら3つ
の領域を1つにまとめたものが、イメージ・コンピュー
ティングと呼ばれ、将来のマルチメディア・ワークステ
ーションに求められる能力を表わす。マルチメディアと
は、情報の理解可能性を高めて、人とコンピュータの対
話を改良するために、イメージ、グラフィクス、映像、
音声、テキストを介するなどにより、情報を2つ以上の
形で表わす方式をいう(Goveらによる上記文献を参照の
こと)。イメージ処理に用いられるアルゴリズムの1つ
に、たたみ込み(convolution) がある。これはイメー
ジ・ピクセルの各値を、まわりの定義された領域すなわ
ちピクセルのウィンドウ内のピクセルの加重和に置換え
るものである。これは処理システムにとっては大きな計
算負荷になる。そこで、システム・プロセッサからイメ
ージ処理タスクの負荷をなくし、イメージ・コンピュー
ティングに必要な適切なスループットを与える専用プロ
セッサが提案されている。イメージ・コンピューティン
グに用いられる専用プロセッサの1つが、最近接点メッ
シュ接続コンピュータ構成である(Batcherによる上記
文献、Uhrによる上記文献、及びCypherらによる上記文
献を参照)。
【0025】本発明の大規模並列対角線折り返しメッシ
ュ・アレイ・プロセッサは、対角線折り返し三角メッシ
ュ・コンピュータで構成し、正方メッシュ・コンピュー
タと同じ機能を与えたが接続線は半数とした。対角線折
り返しメッシュ・アレイ・プロセッサは、ここでは、よ
り汎用性の高いプロセッサ・ノードを与え、処理ノード
間の接続性を改良しながらも、元の構造のイメージ処理
と有限差分の機能を提供するために変更が加えられる。
最初に多重折り返しメッシュ・プロセッサ構成を示し、
たたみ込みと有限差分の両方のアルゴリズムをサポート
するために大規模並列対角線折り返しメッシュ・アレイ
・ノードの能力を取入れた共通プロセッサ・ノード・ア
ーキテクチャの説明に進む。次にプロセッサ・アレイの
接続性を改良する方法に触れ、折り返しの概念を6接点
六角アレイ・プロセッサ構成に応用する例を示す。
【0026】本発明に従い、本発明についてはビット直
列インタフェースと共に説明することにする。もちろん
他の手段や方法によっても効果的な並列インタフェース
を提供することは可能である。例えば、Howard Olnowic
h は1991年11月27日出願のUSSN 07/79960
2、"Multi-Media Serial Line Switching Adapterfor
Parallel Networks and Heterogenous and Homologous
Computer Systems"のなかで、マルチ・システム環境に
おいて、ビット直列通信と並列通信とのインタフェース
をとるためにあるプロトコルを使用する方法について述
べている。
【0027】本発明のマシンは、P.M.KoggeによるU
SSN 07/798788(1991年11月27日出
願)、"Dynamic Multi-mode Parallel Processor Array
Architecture" に述べられているように、適切な網接続
によりMIMD、SIMD、SISMの各モード間の動
的スイッチングを可能にするシステムに採用することが
できる。本発明のPEは多数のノードから成る並列アレ
イ・プロセッサの一部を形成する。ノードはそれぞれ専
用のPEとメモリ、及び他のノードと外部通信するため
のポートを備える。
【0028】2.最近接点メッシュ構成 図1に最近接点メッシュ接続コンピュータを示す(Batc
herによる上記文献、Uhrによる上記文献、及びCypher
らによる上記文献を参照)。複数のプロセッサ要素(P
E)がそれぞれの東西南北の接点PEに接続され、すべ
てのPEが同期した単一命令複数データ(SIMD)の
形で動作する。あるPEはその接点PEのどれとも通信
ができるが、一度に1つの接点PEとしか通信できない
とする。例えば、PEはどれも1つの通信サイクルでそ
の東の接点PEと通信できる。また、1つのブロードキ
ャスト通信期間に、データと命令が同時にすべてのPE
に伝えられるとする。複雑な配線を最小限度にするため
に、PE間にはビット直列インタフェースを想定してい
る。
【0029】図1で処理要素はPEijとした。"i"はマ
トリックスの列を、"j"はマトリックスの行を示す。処
理要素PEijは各々、北(N)、東(E)、南(S)、
西(W)とした4つのインタフェース・ポートを含む。
図1はM×Mのメッシュ・アレイで、M=8、すなわち
8×8のアレイであり、PEはM2 個である。ラップ・
アラウンド接続すなわちトーラス構成のとき、各行はM
個の結合線を含み、行数がMのとき、水平結合線はM2
個である。各列はM個の結合線をふくみ、列数がMのと
き、垂直結合線はM2 個である。ラップ・アラウンド接
続を持つメッシュ接続コンピュータの線数の合計は2M
2 (K)である。Kはプロセッサ間結合線の数に等し
く、ビット直列インタフェースの場合、Kは1に等し
い。
【0030】3.多重折り返しメッシュ・アレイ・プロ
セッサ 図1のメッシュ接続コンピュータ構成では、情報が送信
される時に用いられるPE接続線は50%だけである。
接続線が半数のメッシュ接続コンピュータと同じ機能と
性能が達成できるのが望ましい。これによりM2 個の線
が節約されると共に、これに対応するチップ面積も節約
されるからである。この能力を実現するのが対角線折り
返しコンピュータ構成である。PEの対角線折り返し構
成を作るプロセスの最初のステップは、正方メッシュ接
続コンピュータを対角線要素、PEii(すなわちi=
j)に沿って折り返すことである。例えば図1の8×8
メッシュは、図2の対角線折り返しメッシュになる(Pe
chanekらによる上記文献参照)。図3乃至図4では対称
を成すPE、PEijとPEjiを併記している。対称を成
すPEは送信ポートと受信ポートを共有する(図2)。
上のPE、PEijのW、S、N、Eの各ポートは各々、
下のPE、PEjiのN、E、W、Sの各ポートと共有さ
れる。共有されたI/Oポートは、(PEの方向を示す
ポートの符号)/(下のPEの方向を示すポートの符
号)のように示した。PEijは上のPEを、PEjiは下
のPEを表わす。この上下のPEの記法はあくまで便宜
上のものである。
【0031】正方メッシュ構造の対角線に沿った折り返
しにより、正方メッシュの上端が西の端に揃い、正方メ
ッシュの東の端が南の端に揃う。正方メッシュ・コンピ
ュータ構成の2M個のラップ・アラウンド接続線は、正
方アレイの南北の端と東西の端の間にあり、ラップ・ア
ラウンド接続線をM個しか要しない対角線折り返しメッ
シュ構成で共有することができる。対角線折り返しメッ
シュ・アレイ線の総数は、Pechanekらによる上記文献
で、正方メッシュ構成に必要な線のちょうど半数である
ことが実証された。
【0032】図3乃至図4の三角メッシュは、もう一
度、PE(PE−18、PE−81)、(PE−27、
PE−72)、(PE−36、PE−63)、(PE−
45、PE−54)から成る対角線に沿って折り返せ
ば、図7乃至図8に示す三角アレイが得られる。
【0033】図7乃至図8の三角メッシュは、(PE−
14/PE−41、PE−58/PE−85、PE−2
4/PE−42、PE−57/PE−75、PE−34
/PE−43、PE−56/PE−65、PE−44/
PE−55)から成るグループ1と、(PE−15/P
E−51、PE−48/PE−84、PE−25/PE
−52、PE−47/PE−74、PE−35/PE−
53、PE−46/PE−64、PE−45/PE−5
4)から成るグループ2の2つのプロセッサ・グループ
の間の仮想線に沿ってもう一度折り返すことで、図11
乃至図13に示す三角アレイが得られる。
【0034】図11乃至図13を調べ、図1に示す正方
メッシュについてプロセッサの位置を比較すると、図1
1乃至図13のプロセッサの第1列に正方メッシュの
N、S、E、Wの各端のプロセッサ、すなわち北端のP
E−11、PE−21、...、PE−81、東端のP
E−81、PE−82、...、PE−88、南端のP
E−18、PE−28、...、PE−88、及び西端
のPE−11、PE−12、...、PE−18が含ま
れる。図11乃至図13の第3対角線折り返しメッシュ
の第2列は、正方メッシュのプロセッサの第2同心列す
なわち北の第2同心端PE−22、PE−3
2、...、PE−72、東の第2同心端PE−72、
PE−73、...、PE−77、南の第2同心端PE
−27、PE−37、...、PE−77、及び西の第
2同心端PE−22、PE−23、PE−27を含む。
これは、対応する処理要素の同心列を含む第3対角線折
り返しメッシュの各列について同様である。また図11
乃至図13と図3乃至図4を比較すると、ラップ・アラ
ウンド線に伴う長い接続線は、プロセッサ・グループ内
でローカル接続線になることが分かる。
【0035】4.プロセッサ・ノード・アーキテクチャ PEの多重折り返しクラスタ・プロセッサ構成を作るプ
ロセスの最初のステップは、メッシュ接続コンピュータ
を対角線要素PEii(すなわちi=j)に沿って折り返
すことである。これで対称を成すPE、PEijとPEji
がまとめられる。対称を成すPEは送信ポートと受信ポ
ートを共有する。すなわちPEijのW、S、N、Eの各
ポートはそれぞれPEjiのN、E、W、Sの各ポートと
共有される。対称を成すPEのI/Oポートのこの共有
は、イメージ処理タスクの互換とたたみ込みのための対
角線折り返し対称型PE"セル"構造として図4に詳しく
示した。たたみ込みの詳細と実施例については、Pechan
ekによる上記文献を参照されたい。図14で内部対称型
PE"セル"は内部PEの両方に共通なレジスタWab、2
つのピクセル・レジスタPij、Pji、マトリックスPま
たはその転置形PTを選択するセレクタ、2つの結果レ
ジスタR^ij、R^ji、及び2つの受信レジスタRij、R
jiから成る。PEはまた、ビット直列乗算器("*" で図
示)とビット直列加算器("+"で図示)を含む。対称型
デュアルPE"セル"では4つのI/Oポートしか用いら
れず、ブロードキャスト・コマンドをデコードする1つ
の "コマンド制御" ロジックから制御される。"コマン
ド制御"ロジックはI/Oポートの方向だけでなく、I
/Oポートを送信レジスタと受信レジスタにリンクする
スイッチのセッティングも制御する。共有されたI/O
ポートは(PEの方向を示すポートの符号)/(下のP
Eの方向を示すポートの符号)の形で示した。PEij
上のPEを、PEjiは下のPEを表わす。上下のPEの
記法はあくまで便宜上のものである。
【0036】図15、図18は、4つの送信モードをサ
ポートする内部スイッチのセッティングを示す。図15
では"コマンド制御"により、スイッチとトランスミッタ
/レシーバが転送を北(N)に、受信を南(S)から行
なうようにセットされている。上下両方のPEが北へ送
信しながら南から情報を受信する。これは、図15の矢
印で、また上PEijの送信については記法"N/_"、下
PEjiの送信については"_/N"で示した。受信された
情報は図15の矢印と、上PEijの受信ポートについて
は記法"S/_"、下PEjiの受信ポートについては"_
/S"で示した。対称型PE"セル"の4つのI/Oポー
トについてこの記法を用いることで、図2、図5、図9
(PEijが上PE、PEjiが下PE)に示すように、対
称型PEについて符号を簡素化することができる。
【0037】図14に示すように、デュアル・プロセッ
サの内部スイッチは8つの接続点A、B、C、D、W、
X、Y、Zから成る。構成は次のとおりである。 ・点Aは、プロセッサ間インタフェースからデータを受
信するプロセッサPijのレジスタRijに接続される。 ・点Bは、データをプロセッサ間インタフェースに送る
プロセッサPijのレジスタR^ijに接続される。 ・点Cは、データをプロセッサ間インタフェースに送る
プロセッサPjiのレジスタR^jiに接続される。 ・点Dは、プロセッサ間インタフェースからデータを受
信するプロセッサPjiのレジスタRjiに接続される。 ・点Wは、PEijの西とPEjiの北の接点PE間でデー
タを送受信するメカニズムに接続される。 ・点Xは、PEijの南とPEjiの東の接点PE間でデー
タを送受信するメカニズムに接続される。 ・点Yは、PEijの北とPEjiの西の接点PE間でデー
タを送受信するメカニズムに接続される。 ・点Zは、PEijの東とPEjiの南の接点PE間でデー
タを送受信するメカニズムに接続される。
【0038】デュアル・プロセッサ・スイッチは、点
A、B、C、Dと点W、X、Y、Zの間に、スイッチの
状態に応じて接続パスと無接続パスを与える。あるスイ
ッチ状態では、点AとW、BとZ、CとX、DとYの間
に「東送信、西受信」のパスが与えられる。第2のスイ
ッチ状態では点AとX、BとY、CとW、DとZの間に
「北送信、南受信」のパスが与えられる。第3スイッチ
状態では、AとY、BとX、CとZ、DとWの間に「南
送信、北受信」のパスが、第4スイッチ状態では、Aと
Z、BとW、CとY、DとXの間に「西送信、東受信」
のパスが与えられる。送受信メカニズムは、4つの双方
向ドライバ/レシーバ・メカニズムから成り、各々、あ
る状態に応答して信号をPEから、接続された受信側P
Eへ駆動し、別の状態に応答してPEへの信号を、接続
された送信側PEから受信し、4つの双方向ドライバ/
レシーバ・メカニズムのうち、「東送信、西受信」、
「北送信、南受信」、「南送信、北受信」、「西送信、
東受信」の4つの事例について2つのメカニズムだけが
データを同時に送信し、2つだけがデータを同時に受信
するようにする制御機構が与えられる。
【0039】対角線PE(図19)は、西/北ポートと
南/東ポートを共有し、対角線PE"セル"当たり2つの
ポートしか要しない。図20乃至図23は、4つの送信
モードをサポートする内部スイッチのセッティングを示
す。対角線プロセッサの内部スイッチ・メカニズムは、
4つの接続点A、B、X、Yから成り、点Aは受信デー
タ・レジスタRiiに、点Bはデータをプロセッサ間イン
タフェースに与えるレジスタR^ii に、点Xは対角線P
Eの西と北(W/N)の接点PEとの間でデータを送受
信するメカニズムに、点Yは対角線PEの南と東(S/
E)の接点PEの間でデータを送受信するメカニズムに
それぞれ接続される。この対角線スイッチは、点A、
B、及び点X、Yの間にスイッチ状態に応じて接続パス
と無接続パスを与える。あるスイッチ状態では、点Aと
Xの間と点BとYの間に、2つの送受信事例すなわち
「点Y経由の南送信、点X経由の北受信」と「点Y経由
の東送信、点X経由の西受信」の接続パスが与えられ
る。第2のスイッチ状態では、点AとYの間と点BとX
の間に、2つの送受信事例すなわち点X経由の北送信、
点Y経由の南受信と、点X経由の西送信、点Y経由の東
受信の接続パスが与えられる。送受信メカニズムは、2
つの双方向ドライバ/レシーバ・メカニズムから成り、
各々、ある状態に応答して信号をPEから、接続された
受信側PEに駆動し、別の状態に応答してPEへの信号
を接続された送信側PEから受信し、双方向ドライバ/
レシーバ・メカニズムが両方同時にデータを駆動または
両方同時にデータを受信しないように制御機構が与えら
れる。
【0040】有限差分法と、その対角線折り返しメッシ
ュ・アレイ・プロセッサでの実現については、Pechanek
らによる上記文献を参照されたい。有限差分法について
は、PE内部構造(図14)が図24のように変更され
る。対角線PEも図19に示した形式から、デュアルP
E構造と同様に変更される。対角線PEは1つの実行ユ
ニットと、1つのPEに適したレジスタを含み、その構
造は図24から類推される。この新しいPE内部構造に
も同じ送受信I/Oポートと制御機構が用いられるが、
計算機能には変更が加えられる。図25、図28に東西
南北の送信モードのスイッチとI/Oポートの構成を示
す。このイメージ処理たたみ込み例ではスイッチと送受
信I/Oポートは同じである。
【0041】次に、図29、図30に示したたたみ込み
と有限差分法の両方の処理構造の計算能力を取入れた一
般処理構造について述べる。各プロセッサ要素には最少
4つのレジスタが必要であり、技術や用途の拡大に応じ
て拡張レジスタが定義される。図29、図30に示した
一般処理要素構造には、図15乃至図18と、図25乃
至図28の標準スイッチ・インタフェースが用いられ
る。図29、図30の実行ユニット(XU)は、3つの
レジスタ・オペランド入力を用いて、必要な算術論理機
能を与える。ブロードキャスト・インタフェースには命
令/データ・バッファが与えられ、レジスタには独立し
た初期化パスが与えられる。初期化パスは外部データ・
メモリ・インタフェースなどであり、処理要素のデータ
記憶能力を更に拡大するものである。同様に、外部命令
メモリにはブロードキャストや外部メモリ命令を処理す
る優先プロトコルを加えることができる。この対称型P
Eは2つの処理要素を含み、対角線PEは1つの処理要
素を含む。図29、図30で送受信I/Oポートは次の
参照記法を用いる。
【0042】(上PEi、jの方向)/(下PEj、i
の方向)−i、j
【0043】終わりの"−i、j"は、以下に述べるよう
にPEのクラスタ内のPEを識別するうえで重要であ
る。
【0044】対称型PEと対角線PEは、構造を更に2
回折り返すことによってまとめられる。3回の折り返し
ではグループ内のプロセッサが8個になり、各々、i、
jの初期値が与えられていれば以下のように求めること
ができる。 ・PEij ・PEji ・PEj、M-i+1 ・PEM-i+1、j ・PEi、M-j+1 ・PEM-j+1、i ・PEM-j+1、M-i+1 ・PEM-i+1、M-j+1
【0045】あるMの値について数の組合わせが2つ可
能なことから、8個のプロセッサのクラスタについて"
i、j"を選択する範囲は、1≦i≦M/2、1≦j≦
M/2、i≠j、及びij≠jiによって制限される。
M=8のとき、8個のプロセッサのグループについてi
とjの有効な組合わせは次のとおりである。 ・1、2 ・1、3 ・1、4 ・2、3 ・2、4 ・3、4
【0046】図11乃至図13と比較するとi=1、j
=2のとき、8個のプロセッサのグループは次のとおり
である。 ・PE1、2 ・PE2、1 ・PE2、8 ・PE8、2 ・PE1、7 ・PE7、1 ・PE7、8 ・PE8、7
【0047】3回の折り返しの後、対角線グループの4
つのプロセッサは次の関係を保つ。すなわち1≦i≦M
/2のとき4つのプロセッサは次のとおりである。 ・PEii ・PEi、M-i+1 ・PEM-i+i、j ・PEM-i+i、M-i+i
【0048】図11乃至図13と比較するとi=3のと
き、4つのプロセッサの対角線グループは次のとおりで
ある。 ・PE3、3 ・PE3、6 ・PE6、3 ・PE6、6
【0049】8個のPEのグループは図31のように表
わされ、4個のPEの対角線グループは図32のように
表わされる。図31で、アスタリスクをつけたPEによ
って参照される対称型PEは次のポートを使用する。 ・PEi、j/PEj、iは、ポート(N/W)−i、j、
(E/S)−i、j、(W/N)−i、j、及び(S/
E)−i、jを使用する。 ・PEi、M-j+1/PEM-j+1、iは、ポート(N/W)−
i、M−j+1、(E/S)−i、M−j+1、(W/
N)−i、M−j+1、及び(S/E)−i、M−j+
1を使用する。 ・PEi、M-i+1/PEM-i+1、jは、ポート(N/W)−
j、M−i+1、(E/S)−j、M−i+1、(W/
N)−j、M−i+1、及び(S/E)−j、M−i+
1を使用する。 ・PEM-j+1、M-i+1/PEM-i+1、M-j+1は、ポート(N/
W)−M−j+1、M−i+1、(E/S)−M−j+
1、M−i+1、(W/N)−M−j+1、M−i+
1、及び(S/E)−M−j+1、M−i+1を使用す
る。
【0050】上述のように、対角線PEは西/北ポート
と南/東ポートを共有し、対角線PE"セル"当たり2つ
のポートしか要しない。図32でPEiiは、ポート(W
/N)−i、iと(S/E)−i、iを、PE
M-i+1、M-i+1 はポート(W/N)−M−i+1、M−i
+1と、(S/E)−M−i+1、M−i+1をアスタ
リスクで示した対称型PEのPEi、M-i+1 は、4つのポ
ート(N/W)−i、M−i+1、(E/S)−i、M
−i+1、(W/N)−i、M−i+1、及び(S/
E)−i、M−i+1を使用する。図11乃至図13に
示した8×8の第3折り返しクラスタ・プロセッサ・メ
ッシュ・アレイは、図31、図32に示した記法とクラ
スタ・プロセッサの符号を用いて図33乃至図35のよ
うに書き直される。図33乃至図35から分かるように
多重折り返しの場合でも、プロセッサのクラスタ間の配
線は極めて規則的であり、トーラス型のラップ・アラウ
ンド配線を実現するのに必要な長い線はなく、プロセッ
サ・クラスタ内のローカル配線だけである。
【0051】5.接続性の向上 接続性は3回折り返し構造で、折り返しによりまとめら
れたプロセッサ間の配線を増やすことによって高めるこ
とができる。これらの線は、折り返し構造ではプロセッ
サのグループに対してローカルであり、正方メッシュで
は、同等の配線を行なおうとする場合には距離が長くな
り、線の交点が多くなることにより、容易には追加され
ない。図38乃至図40に接続性を高めた多重折り返し
クラスタ・プロセッサ・メッシュ・アレイを示す。これ
は接続線を追加した図11乃至図13と同じである。
(追加した線は元の線と区別するために"−+−+−"で
示した。)クラスタ・プロセッサの接続性の向上によっ
て得られる論理的な相互結合性に対応するために必要な
配線の複雑さが分かるように、正方メッシュ・アレイ・
プロセッサに追加する必要のあるプロセッサの1クラス
タの追加線の例を図41に示した。図41の場合、追加
された線は図38乃至図40にのみ示した単一クラスタ
・プロセッサ(PE−1、2、PE−2、1、PE−
2、8、PE−8、2、PE−1、7、PE−7、1、
PE−7、8、及びPE−8、7)に論理的な相互結合
性を与える。
【0052】8個のプロセッサのグループのそれぞれを
接続する追加線を導入する方法は数多くある。1つは、
プロセッサ・グループのI/Oポートを追加することで
ある。その場合、4個の対角線PEのグループ当たり6
つ、8個の対称型PEのグループ当たり12個である。
図29、図30のPE構造は、図53、図34、図44
に示すようにI/Oポートを追加するために変更され
る。
【0053】規約により、また図38乃至図40に示し
た追加線の接続、図42、図34、図16に示した追加
I/Oポート、PT1、PT2、PT3をもとにすれ
ば、PE間の "水平" 追加線はPT1ポート、PE間
の"垂直"追加線はPT2ポート、そしてPE間の"対角
線"追加線はPT3ポートである。水平PT1、垂直P
T2、及び対角線PT3の各ポートの配線は、図38乃
至図40に示した追加線に関係する。図31、図32の
クラスタ符号は、追加I/Oポートを導入するために変
更を加え、図45、図46のように書き直している。プ
ロセッサ間のメッセージはすべて、メッセージの宛先P
Eを示すタグがついているとする。クラスタ・プロセッ
サの符号を用いた8×8の第3折り返しクラスタ・プロ
セッサ・メッシュ・アレイ(図33乃至図35)は、接
続性拡張記法とクラスタ・プロセッサの符号を用いて書
き直し(図47乃至図48)、追加I/Oポートは図4
5、図46に示した。図47乃至図48から分かるよう
に、配線とI/Oポートを追加しても、プロセッサのク
ラスタ間の配線は極めて規則的である。
【0054】もう1つ、クラスタ内のプロセッサ間に相
互結合性を与える方法は、クラスタ内のプロセッサを拡
張分配/選択メカニズムで組合わせることである。これ
によりローカル・クラスタ通信がこの組合わせ構造内に
とどまり、そのためにI/Oポートを追加する必要がな
い。実施例として複数の実行ユニットを示しているが、
実行ユニットが2つの場合、I/Oポートは、組合わさ
れたプロセッサ・クラスタ・ユニットにその機能が導入
された時に無くし得ることも示している。
【0055】多重折り返しを用いた相互結合の利点は、
プロセッサのパッケージ化も任意になるということであ
る。装置はチップ上に独立したプロセッサ・ユニットと
共に複数のプロセッサ・ユニットをも使用でき、本発明
の相互結合によりいずれのタイプのユニットも接続する
ことができる。
【0056】6.多重折り返しクラスタ・プロセッサ・
メッシュ・アレイ Z×Zメッシュのアレイ、例えば図1の8×8メッシュ
は、元のメッシュに同心のプロセッサ・リング(図50
のアスタリスクで囲んだPE)を追加し、それに応じて
ラップ・アラウンド線を拡張することによって、(Z+
2)×(Z+2)アレイ、例えば図50の10×10メ
ッシュに拡大することができる。この多重折り返しメッ
シュ・アレイ・プロセッサでは、同じ拡大が、新しい処
理要素列を追加して、Z×Zのローカル・ラップ・アラ
ウンド線を断ち(8×8アレイの例は図33乃至図35
に示した)、前のラップ・アラウンド線ポートを、追加
された列のPEの対応するI/Oポートに接続すること
によって得られる。新たに追加されたPE列は、新しい
メッシュ・アレイのラップ・アラウンド配線が(Z+
2)×(Z+2)になる。いずれの場合もPEは番号が
振り直される。図51乃至図52に、図33乃至図3
5、図47乃至図48の8×8構成から拡大した10×
10の多重折り返しクラスタ・プロセッサ・メッシュ・
アレイを示す。図51乃至図52では、変更された8×
8ラップ・アラウンド配線と10×10ラップ・アラウ
ンド配線しか示していない。4、8個のプロセッサ・ク
ラスタ内の接続性を高める配線は、クラスタの内側とし
ており、図示していない。
【0057】7.接続性を高めた多重折り返し六角プロ
セッサ・アレイ ここでは、前節で展開した折り返しの概念を6接点六角
プロセッサ・アレイ(図53)に応用する。図53のプ
ロセッサ・ノードは、外側の同心プロセッサ・リングの
ノードをAxx、次の同心プロセッサ・リングをBx
x、中央のプロセッサ・ノードをE01などと示す。
【0058】図53の六角プロセッサ・アレイは、ノー
ドA01、B01、C01、D01、E01、D04、
C07、B10、及びA13から成る対角線に沿って折
り返され、図54に示したプロセッサ構成になる。図5
4で、折り返しにより重なったプロセッサ・ノードは、
A02/A24、B02/B18のように、デュアル・
プロセッサ・ノードとして組合わせられる。図示の結合
線は図3乃至図4の対角線折り返しメッシュと同様に、
組合わせるかどうかを用途に応じて選択できる。
【0059】図54の折り返された六角アレイは次に、
2つの対角線に沿って折り返され、独立した折り返し操
作は2回になる。第1折り返しは、対角線A05/A2
1、B04/B16、C03/C11、D02/D0
6、及びE01に沿い、第2折り返しは、対角線A09
/A17、B07/B13、C05/C09、D03/
D05、及びE01に沿っている。いずれの折り返しも
内向きでプロセッサ・ノードが、上記対角線が境界を成
す三角アレイに折り重なる。得られる構成を図55に示
す。これは処理要素のクラスタから成り、クラスタ・ノ
ードの3つの処理要素が2つの端部で用いられ、クラス
タ・ノードの6つの処理要素がアレイの他の部分を成
す。例えばA05/A13/A21、B04/B10/
B16、C03/C07/C11、D02/D04/D
06、D01/D03/D05、C01/C05/C0
9、B01/B07/B13、及びA01/A09/A
17は、8個の3クラスタ・ノードを成す。単独の処理
要素E01は最後の処理要素になる。
【0060】3つまたは6つのクラスタ・プロセッサ・
グループ内で、図38乃至図40と同様の方法でローカ
ル接続線が追加される。以前に拡張I/Oポートなどの
相互結合法と同様の方式を用いた場合は、接続性の改良
により通信距離が短縮されるが、これは典型的な6接点
六角プロセッサ・アレイ(図53)で容易に達成するこ
とができる。ローカル・クラスタ線による論理的な接続
性の向上の一例を、6プロセッサのクラスタ・ノードB
02/B06/B08/B12/B14/B18を標準
6接点六角プロセッサ・アレイにマップした場合につい
て図56に示す。
【0061】多重折り返し六角プロセッサ・アレイは、
多重折り返し正方メッシュ・アレイ・プロセッサをスケ
ーリングする場合と同様の方法でスケーリングすること
ができる。元の六角プロセッサ・アレイを取囲む同心プ
ロセッサ・リングを多重折り返し六角アレイに追加する
には、プロセッサの端部を拡張して三角プロセッサ・ア
レイ(図53など)に追加すればよい。同心プロセッサ
・リングを1つ追加するには、プロセッサの1行または
1列(見る方向による)を、両側で3プロセッサのクラ
スタが境界を成す複数の6プロセッサ・クラスタから成
る三角形の端部に追加する必要がある。例えば図55で
は、同心プロセッサ・リングの追加は、両側で3プロセ
ッサのクラスタが境界を成す6プロセッサの4クラスタ
から成るクラスタ要素の線形アレイ(合計30個のプロ
セッサ要素)を追加することになる。この新しい線形ア
レイは、既存のプロセッサ端、A05/A13/A2
1、A04/A06/A12/A14/A20/A2
2、A03/A07/A11/A15/A19/A2
3、A02/A08/A10/A16/A18/A2
4、及びA01/A09/A17、と相互接続される。
【0062】8.接続性を改良した多重折り返しクラス
タ・プロセッサ・アレイのバイトニック・ソート ここでは、バイトニック・ソートに多重折り返しクラス
タ・プロセッサ・メッシュ・アレイを用いた例について
述べる(Knuthによる"The Art of ComputerProgramming
Volume 3 / Sorting and Searching、" Phillippine
s:Addison-Wesley Publishing Company、Inc.、cha
p.5.3.4、pp.232-233、1973を参照)。図57乃至
図60、図61乃至図64にKnuth (1973)による記法
を用いた6ステージ・バイトニック・ソータを示す。図
の線分は処理要素間の転送、比較、戻りの操作を示す。
点(ドット)は開始側PE、矢印は比較操作が行なわれ
る宛先PEを示す。比較された2つの値のうち小さい値
は開始側PEに返される。図65乃至図66はソート前
の初期整数データ・セットがPEにロードされた8×8
メッシュを示す。図67乃至図69は多重折り返しクラ
スタ・プロセッサ・メッシュ・アレイにロードされた同
じ初期データ・セットを示す。図70乃至図71は図5
7乃至図60について、バイトニック・ソートの第5ス
テージ第5パートを、図73乃至図75はバイトニック
・ソートの第6ステージ第1パートを示す。第6ステー
ジ第1パートでは、数が標準メッシュ内の3つのPEを
経由して宛先に届かなければならず、データの戻りにま
た最高3つまでのPE交点が伴い、転送操作は比較ごと
に合計6回になる。多重折り返しクラスタ・プロセッサ
・メッシュ・アレイでは、これと同じ第6ステージ第1
パートの転送シーケンスが、宛先への転送1回と戻りの
転送1回で実現される。
【0063】
【発明の効果】 【図面の簡単な説明】
【図1】たたみ込みイメージ処理の8×8メッシュの図
である。
【図2】新しいPE符号で書き直した8×8対角線折り
返しメッシュの図である。
【図3】新しいPE符号で書き直した8×8対角線折り
返しメッシュの図である。
【図4】新しいPE符号で書き直した8×8対角線折り
返しメッシュの図である。
【図5】実施例に従った8×8の第2対角線折り返しメ
ッシュ・アレイの図である。
【図6】実施例に従った8×8の第2対角線折り返しメ
ッシュ・アレイの図である。
【図7】実施例に従った8×8の第2対角線折り返しメ
ッシュ・アレイの図である。
【図8】実施例に従った8×8の第2対角線折り返しメ
ッシュ・アレイの図である。
【図9】実施例に従った8×8の第3折り返しクラスタ
・プロセッサ・メッシュ・アレイの図である。
【図10】実施例に従った8×8の第3折り返しクラス
タ・プロセッサ・メッシュ・アレイの図である。
【図11】実施例に従った8×8の第3折り返しクラス
タ・プロセッサ・メッシュ・アレイの図である。
【図12】実施例に従った8×8の第3折り返しクラス
タ・プロセッサ・メッシュ・アレイの図である。
【図13】実施例に従った8×8の第3折り返しクラス
タ・プロセッサ・メッシュ・アレイの図である。
【図14】互換とたたみ込みをサポートする対角線折り
返し対称型PE"セル"構造の図である。
【図15】互換とたたみ込みをサポートする対角線折り
返し対称型PE"セル"構造の図である。
【図16】互換とたたみ込みをサポートする対角線折り
返し対称型PE"セル"構造の図である。
【図17】互換とたたみ込みをサポートする対角線折り
返し対称型PE"セル"構造の図である。
【図18】互換とたたみ込みをサポートする対角線折り
返し対称型PE"セル"構造の図である。
【図19】互換とたたみ込みをサポートする対角線折り
返し対称型PE"セル"構造の図である。
【図20】互換とたたみ込みをサポートする対角線折り
返し対称型PE"セル"構造の図である。
【図21】互換とたたみ込みをサポートする対角線折り
返し対称型PE"セル"構造の図である。
【図22】互換とたたみ込みをサポートする対角線折り
返し対称型PE"セル"構造の図である。
【図23】互換とたたみ込みをサポートする対角線折り
返し対称型PE"セル"構造の図である。
【図24】有限差分法をサポートする対角線折り返し対
称型PE"セル"構造の図である。
【図25】有限差分法をサポートする対角線折り返し対
称型PE"セル"構造の図である。
【図26】有限差分法をサポートする対角線折り返し対
称型PE"セル"構造の図である。
【図27】有限差分法をサポートする対角線折り返し対
称型PE"セル"構造の図である。
【図28】有限差分法をサポートする対角線折り返し対
称型PE"セル"構造の図である。
【図29】実施例として、たたみ込みと有限差分法を組
合わせたPE"セル"構造の図である。
【図30】実施例として、たたみ込みと有限差分法を組
合わせたPE"セル"構造の図である。
【図31】クラスタ・プロセッサ・グループの符号を示
す図である。
【図32】クラスタ・プロセッサ・グループの符号を示
す図である。
【図33】クラスタ・プロセッサの符号を用いた8×8
の第3折り返しクラスタ・プロセッサ・メッシュ・アレ
イの図である。
【図34】クラスタ・プロセッサの符号を用いた8×8
の第3折り返しクラスタ・プロセッサ・メッシュ・アレ
イの図である。
【図35】クラスタ・プロセッサの符号を用いた8×8
の第3折り返しクラスタ・プロセッサ・メッシュ・アレ
イの図である。
【図36】実施例として、接続性を改良した8×8の第
3折り返しクラスタ・プロセッサ・メッシュ・アレイの
図である。
【図37】実施例として、接続性を改良した8×8の第
3折り返しクラスタ・プロセッサ・メッシュ・アレイの
図である。
【図38】実施例として、接続性を改良した8×8の第
3折り返しクラスタ・プロセッサ・メッシュ・アレイの
図である。
【図39】実施例として、接続性を改良した8×8の第
3折り返しクラスタ・プロセッサ・メッシュ・アレイの
図である。
【図40】実施例として、接続性を改良した8×8の第
3折り返しクラスタ・プロセッサ・メッシュ・アレイの
図である。
【図41】1つのクラスタ・プロセッサ・グループに配
線を追加した8×8メッシュの図である。
【図42】改良された接続性をサポートするポートを追
加した4プロセッサの対角線クラスタPEの図である。
【図43】改良された接続性をサポートするポートを追
加した4プロセッサの対角線クラスタPEの図である。
【図44】改良された接続性をサポートするポートを追
加した8プロセッサのクラスタPEの図である。
【図45】接続性を改良したプロセッサ・グループの符
号を示す図である。
【図46】接続性を改良したプロセッサ・グループの符
号を示す図である。
【図47】クラスタ内に配線を追加し接続性を改良した
8×8の第3折り返しクラスタ・プロセッサ・メッシュ
・アレイの図である。
【図48】クラスタ内に配線を追加し接続性を改良した
8×8の第3折り返しクラスタ・プロセッサ・メッシュ
・アレイの図である。
【図49】クラスタ内に配線を追加し接続性を改良した
8×8の第3折り返しクラスタ・プロセッサ・メッシュ
・アレイの図である。
【図50】"新規"PEの同心リングを追加することによ
って8×8メッシュを拡大した10×10メッシュの図
である。
【図51】8×8の多重折り返しメッシュをスケーリン
グした10×10の多重折り返しメッシュの図である。
【図52】8×8の多重折り返しメッシュをスケーリン
グした10×10の多重折り返しメッシュの図である。
【図53】六角6プロセッサ接点アレイの図である。
【図54】第1折り返し六角6プロセッサ接点アレイの
図である。
【図55】第3折り返し六角6プロセッサ接点アレイの
図である。
【図56】ノードB02/B06/B08/B12/B
14/B18に配線を追加した六角アレイの図である。
【図57】パートとして示した転送、比較、戻りの各操
作のステージから成る64数バイトニック・ソート・シ
ーケンスの図である。
【図58】パートとして示した転送、比較、戻りの各操
作のステージから成る64数バイトニック・ソート・シ
ーケンスの図である。
【図59】パートとして示した転送、比較、戻りの各操
作のステージから成る64数バイトニック・ソート・シ
ーケンスの図である。
【図60】パートとして示した転送、比較、戻りの各操
作のステージから成る64数バイトニック・ソート・シ
ーケンスの図である。
【図61】パートとして示した転送、比較、戻りの各操
作のステージから成る64数バイトニック・ソート・シ
ーケンスの図である。
【図62】パートとして示した転送、比較、戻りの各操
作のステージから成る64数バイトニック・ソート・シ
ーケンスの図である。
【図63】パートとして示した転送、比較、戻りの各操
作のステージから成る64数バイトニック・ソート・シ
ーケンスの図である。
【図64】パートとして示した転送、比較、戻りの各操
作のステージから成る64数バイトニック・ソート・シ
ーケンスの図である。
【図65】バイトニック・ソートのための8×8メッシ
ュの初期データ・ロードを示す図である。
【図66】バイトニック・ソートのための8×8メッシ
ュの初期データ・ロードを示す図である。
【図67】バイトニック・ソートのために初期データ・
ロードの接続性を改良した第3折り返しクラスタ・プロ
セッサ・メッシュ・アレイの図である。
【図68】バイトニック・ソートのために初期データ・
ロードの接続性を改良した第3折り返しクラスタ・プロ
セッサ・メッシュ・アレイの図である。
【図69】バイトニック・ソートのために初期データ・
ロードの接続性を改良した第3折り返しクラスタ・プロ
セッサ・メッシュ・アレイの図である。
【図70】バイトニック・ソートのステージ5パート5
の接続性を改良した第3折り返しクラスタ・プロセッサ
・メッシュ・アレイの図である。
【図71】バイトニック・ソートのステージ5パート5
の接続性を改良した第3折り返しクラスタ・プロセッサ
・メッシュ・アレイの図である。
【図72】バイトニック・ソートのステージ5パート5
の接続性を改良した第3折り返しクラスタ・プロセッサ
・メッシュ・アレイの図である。
【図73】バイトニック・ソートのステージ6パート1
の接続性を改良した第3折り返しクラスタ・プロセッサ
・メッシュ・アレイの図である。
【図74】バイトニック・ソートのステージ6パート1
の接続性を改良した第3折り返しクラスタ・プロセッサ
・メッシュ・アレイの図である。
【図75】バイトニック・ソートのステージ6パート1
の接続性を改良した第3折り返しクラスタ・プロセッサ
・メッシュ・アレイの図である。
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成7年1月6日
【手続補正1】
【補正対象書類名】図面
【補正対象項目名】全図
【補正方法】変更
【補正内容】
【図1】
【図2】
【図3】
【図5】
【図8】
【図9】
【図15】
【図16】
【図19】
【図20】
【図21】
【図22】
【図4】
【図14】
【図17】
【図24】
【図25】
【図26】
【図27】
【図6】
【図35】
【図36】
【図7】
【図31】
【図10】
【図18】
【図11】
【図13】
【図12】
【図30】
【図23】
【図28】
【図29】
【図32】
【図44】
【図33】
【図34】
【図45】
【図37】
【図56】
【図38】
【図39】
【図40】
【図41】
【図57】
【図42】
【図54】
【図43】
【図58】
【図46】
【図47】
【図48】
【図49】
【図50】
【図51】
【図59】
【図52】
【図53】
【図55】
【図63】
【図60】
【図61】
【図62】
【図64】
【図65】
【図66】
【図67】
【図68】
【図69】
【図70】
【図71】
【図72】
【図73】
【図74】
【手続補正書】
【提出日】平成8年1月10日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】図面の簡単な説明
【補正方法】変更
【補正内容】
【図面の簡単な説明】
【図1】たたみ込みイメージ処理の8×8メッシュの図
である。
【図2】新しいPE符号で書き直した8×8対角線折り
返しメッシュの図である。
【図3】新しいPE符号で書き直した8×8対角線折り
返しメッシュの図である。
【図4】新しいPE符号で書き直した8×8対角線折り
返しメッシュの図である。
【図5】実施例に従った8×8の第2対角線折り返しメ
ッシュ・アレイの図である。
【図6】実施例に従った8×8の第2対角線折り返しメ
ッシュ・アレイの図である。
【図7】実施例に従った8×8の第2対角線折り返しメ
ッシュ・アレイの図である。
【図8】実施例に従った8×8の第3折り返しクラスタ
・プロセッサ・メッシュ・アレイの図である。
【図9】実施例に従った8×8の第3折り返しクラスタ
・プロセッサ・メッシュ・アレイの図である。
【図10】実施例に従った8×8の第3折り返しクラス
タ・プロセッサ・メッシュ・アレイの図である。
【図11】実施例に従った8×8の第3折り返しクラス
タ・プロセッサ・メッシュ・アレイの図である。
【図12】実施例に従った8×8の第3折り返しクラス
タ・プロセッサ・メッシュ・アレイの図である。
【図13】互換とたたみ込みをサポートする対角線折り
返し対称型PE"セル"構造の図である。
【図14】互換とたたみ込みをサポートする対角線折り
返し対称型PE"セル"構造の図である。
【図15】互換とたたみ込みをサポートする対角線折り
返し対称型PE"セル"構造の図である。
【図16】互換とたたみ込みをサポートする対角線折り
返し対称型PE"セル"構造の図である。
【図17】互換とたたみ込みをサポートする対角線折り
返し対称型PE"セル"構造の図である。
【図18】互換とたたみ込みをサポートする対角線折り
返し対称型PE"セル"構造の図である。
【図19】互換とたたみ込みをサポートする対角線折り
返し対称型PE"セル"構造の図である。
【図20】互換とたたみ込みをサポートする対角線折り
返し対称型PE"セル"構造の図である。
【図21】互換とたたみ込みをサポートする対角線折り
返し対称型PE"セル"構造の図である。
【図22】互換とたたみ込みをサポートする対角線折り
返し対称型PE"セル"構造の図である。
【図23】有限差分法をサポートする対角線折り返し対
称型PE"セル"構造の図である。
【図24】有限差分法をサポートする対角線折り返し対
称型PE"セル"構造の図である。
【図25】有限差分法をサポートする対角線折り返し対
称型PE"セル"構造の図である。
【図26】有限差分法をサポートする対角線折り返し対
称型PE"セル"構造の図である。
【図27】有限差分法をサポートする対角線折り返し対
称型PE"セル"構造の図である。
【図28】実施例として、たたみ込みと有限差分法を組
合わせたPE"セル"構造の図である。
【図29】実施例として、たたみ込みと有限差分法を組
合わせたPE"セル"構造の図である。
【図30】クラスタ・プロセッサ・グループの符号を示
す図である。
【図31】クラスタ・プロセッサ・グループの符号を示
す図である。
【図32】クラスタ・プロセッサの符号を用いた8×8
の第3折り返しクラスタ・プロセッサ・メッシュ・アレ
イの図である。
【図33】クラスタ・プロセッサの符号を用いた8×8
の第3折り返しクラスタ・プロセッサ・メッシュ・アレ
イの図である。
【図34】クラスタ・プロセッサの符号を用いた8×8
の第3折り返しクラスタ・プロセッサ・メッシュ・アレ
イの図である。
【図35】実施例として、接続性を改良した8×8の第
3折り返しクラスタ・プロセッサ・メッシュ・アレイの
図である。
【図36】実施例として、接続性を改良した8×8の第
3折り返しクラスタ・プロセッサ・メッシュ・アレイの
図である。
【図37】実施例として、接続性を改良した8×8の第
3折り返しクラスタ・プロセッサ・メッシュ・アレイの
図である。
【図38】実施例として、接続性を改良した8×8の第
3折り返しクラスタ・プロセッサ・メッシュ・アレイの
図である。
【図39】実施例として、接続性を改良した8×8の第
3折り返しクラスタ・プロセッサ・メッシュ・アレイの
図である。
【図40】1つのクラスタ・プロセッサ・グループに配
線を追加した8×8メッシュの図である。
【図41】改良された接続性をサポートするポートを追
加した4プロセッサの対角線クラスタPEの図である。
【図42】改良された接続性をサポートするポートを追
加した4プロセッサの対角線クラスタPEの図である。
【図43】改良された接続性をサポートするポートを追
加した8プロセッサのクラスタPEの図である。
【図44】接続性を改良したプロセッサ・グループの符
号を示す図である。
【図45】接続性を改良したプロセッサ・グループの符
号を示す図である。
【図46】クラスタ内に配線を追加し接続性を改良した
8×8の第3折り返しクラスタ・プロセッサ・メッシュ
・アレイの図である。
【図47】クラスタ内に配線を追加し接続性を改良した
8×8の第3折り返しクラスタ・プロセッサ・メッシュ
・アレイの図である。
【図48】クラスタ内に配線を追加し接続性を改良した
8×8の第3折り返しクラスタ・プロセッサ・メッシュ
・アレイの図である。
【図49】"新規"PEの同心リングを追加することによ
って8×8メッシュを拡大した10×10メッシュの図
である。
【図50】8×8の多重折り返しメッシュをスケーリン
グした10×10の多重折り返しメッシュの図である。
【図51】8×8の多重折り返しメッシュをスケーリン
グした10×10の多重折り返しメッシュの図である。
【図52】六角6プロセッサ接点アレイの図である。
【図53】第1折り返し六角6プロセッサ接点アレイの
図である。
【図54】第3折り返し六角6プロセッサ接点アレイの
図である。
【図55】ノードB02/B06/B08/B12/B
14/B18に配線を追加した六角アレイの図である。
【図56】パートとして示した転送、比較、戻りの各操
作のステージから成る64数バイトニック・ソート・シ
ーケンスの図である。
【図57】パートとして示した転送、比較、戻りの各操
作のステージから成る64数バイトニック・ソート・シ
ーケンスの図である。
【図58】パートとして示した転送、比較、戻りの各操
作のステージから成る64数バイトニック・ソート・シ
ーケンスの図である。
【図59】パートとして示した転送、比較、戻りの各操
作のステージから成る64数バイトニック・ソート・シ
ーケンスの図である。
【図60】パートとして示した転送、比較、戻りの各操
作のステージから成る64数バイトニック・ソート・シ
ーケンスの図である。
【図61】パートとして示した転送、比較、戻りの各操
作のステージから成る64数バイトニック・ソート・シ
ーケンスの図である。
【図62】パートとして示した転送、比較、戻りの各操
作のステージから成る64数バイトニック・ソート・シ
ーケンスの図である。
【図63】パートとして示した転送、比較、戻りの各操
作のステージから成る64数バイトニック・ソート・シ
ーケンスの図である。
【図64】バイトニック・ソートのための8×8メッシ
ュの初期データ・ロードを示す図である。
【図65】バイトニック・ソートのための8×8メッシ
ュの初期データ・ロードを示す図である。
【図66】バイトニック・ソートのために初期データ・
ロードの接続性を改良した第3折り返しクラスタ・プロ
セッサ・メッシュ・アレイの図である。
【図67】バイトニック・ソートのために初期データ・
ロードの接続性を改良した第3折り返しクラスタ・プロ
セッサ・メッシュ・アレイの図である。
【図68】バイトニック・ソートのために初期データ・
ロードの接続性を改良した第3折り返しクラスタ・プロ
セッサ・メッシュ・アレイの図である。
【図69】バイトニック・ソートのステージ5パート5
の接続性を改良した第3折り返しクラスタ・プロセッサ
・メッシュ・アレイの図である。
【図70】バイトニック・ソートのステージ5パート5
の接続性を改良した第3折り返しクラスタ・プロセッサ
・メッシュ・アレイの図である。
【図71】バイトニック・ソートのステージ5パート5
の接続性を改良した第3折り返しクラスタ・プロセッサ
・メッシュ・アレイの図である。
【図72】バイトニック・ソートのステージ6パート1
の接続性を改良した第3折り返しクラスタ・プロセッサ
・メッシュ・アレイの図である。
【図73】バイトニック・ソートのステージ6パート1
の接続性を改良した第3折り返しクラスタ・プロセッサ
・メッシュ・アレイの図である。
【図74】バイトニック・ソートのステージ6パート1
の接続性を改良した第3折り返しクラスタ・プロセッサ
・メッシュ・アレイの図である。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 スタマティス・バッシライアディス アメリカ合衆国13850、ニューヨーク州ベ スタル、ベスタル・ロード 717 (72)発明者 ホセ・ガダルプ・デルガド−フライアス アメリカ合衆国13850、ニューヨーク州エ ンドウェル、レイシー・ドライブ 612

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】複数のコンピュータ・プロセッサ・ユニッ
    トと、 上記プロセッサ・ユニットをアレイ構成のプロセッサの
    相互接続クラスタとして結合する手段とを含み、 上記アレイ構成により、マルチメディア、微分方程式を
    解く有限差分法、ソートなどの汎用アプリケーションを
    実行するように、上記複数のコンピュータ・プロセッサ
    ・ユニットが大規模並列コンピュータ・システム構成に
    おいて機能し、 上記プロセッサ・ユニットを結合する手段が、第1、第
    2、及び第3のメッシュ結合折り返しを含む、 大規模並列コンピューティング・システム装置。
  2. 【請求項2】上記の相互接続されたプロセッサのクラス
    タが、プロセッサ・ユニット間の最近接点接続、アレイ
    ・ラップ・アラウンド接続、及びクラスタ内のプロセッ
    サ間の完全な接続性を与える、請求項1記載の装置。
  3. 【請求項3】クラスタ・プロセッサの多重折り返し構成
    で、セクション単位に順次に配列されたクラスタのメッ
    シュ・アレイや線形アレイが、セクション当たり1つの
    同心リングとして機能するように、プロセッサのクラス
    タの上記アレイ構成がプロセッサ・ユニットの同心リン
    グとして機能する、請求項1記載の装置。
  4. 【請求項4】上記システムの上記構成がスケーラブルで
    あり、プロセッサのクラスタのアレイ構成のスケーラビ
    リティにより、プロセッサのクラスタの複数のセクショ
    ンを多重折り返しクラスタ・プロセッサ・アレイとして
    追加でき、追加された各セクションが、折り返されてい
    ない元のアレイ構成の新たに追加されたプロセッサの同
    心リングを表わす、請求項1記載の装置。
  5. 【請求項5】プロセッサのクラスタが、命令とデータの
    記憶ユニット、実行手段、及びI/Oインタフェース/
    ポートを含み、命令とデータを受信し、初期化、プロセ
    ッサ間通信、及びブロードキャスト通信をサポートす
    る、プロセッサ・ユニットの複数の組合わせを有する、
    請求項1記載の装置。
  6. 【請求項6】上記アレイ構成が対角線に沿って折り返さ
    れて三角アレイを成し、更に、折り返された三角形の底
    辺に垂直な線に沿って2回折り返された、M×Mマトリ
    ックスの形に配置され、4プロセッサの対角線クラスタ
    と、8プロセッサのクラスタから成るM2 個の処理ユニ
    ットから成り、最近接点から成るプロセッサ間通信イン
    タフェースを備え、M×Mアレイのラップ・アラウンド
    接続構造と論理的に完全な接続性がプロセッサの上記ク
    ラスタ内で得られる、請求項1記載の装置。
  7. 【請求項7】M2 個の処理ユニットから成り、各ユニッ
    トがラップ・アラウンド通信で最近接点の東西南北のI
    /Oポートを処理し、対角線に沿って折り込まれた上記
    北と南のI/Oポートを上記東と西のI/Oポートと共
    有することができるM×Mマトリックスの形に配置され
    た、請求項8記載の装置。
  8. 【請求項8】上記アレイ構成が対角線に沿って折り返さ
    れて六角アレイの半分を成して、シングル処理ユニット
    が対角線上に、デュアル処理ユニットが他の部分に位置
    し、次に、折り返された半分の六角アレイ内の2つの対
    角線に沿って折り返されて、内向きの折り返し操作が2
    回になり、折り返された半分の六角アレイの上記対角線
    が境界を成す三角アレイ上に処理ユニットが折り重な
    り、1つのシングル・プロセッサ・ユニット、3回折り
    返し六角アレイの2つの端部から成る3プロセッサの複
    数のクラスタ、及び上記3回折り返し六角アレイの他の
    部分から成る6プロセッサの複数のクラスタから成り、
    最近接点から成るプロセッサ間通信インタフェースを備
    え、上記プロセッサのクラスタ内にラップ・アラウンド
    接続構造と論理的に完全な接続性が得られる、処理ユニ
    ットの六角6接点機構を含む、請求項1記載の装置。
  9. 【請求項9】算術論理機能を実行し、少なくとも処理要
    素(PE)のアレイとの外部通信を可能にする手段を含
    み、複数のPEが複数の処理要素がクラスタとして配置
    されて、数回折り返されて相互接続されたアレイ構成の
    一部であり、上記複数の処理要素の各々がPEを接点P
    Eに接続する手段を有し、PE間にコンピュータ・イン
    タフェースが設けられて網構造が与えられ、上記網構造
    によって対称型処理が可能になり、処理要素をまとめて
    南北の線を東西の線と共有することによって、例えば、
    データを北に送信するすべてのPEの配線を共有でき、
    よって性能に影響を与えることなく複雑な配線を少なく
    する、コンピュータ機能アレイ。
  10. 【請求項10】算術機能を処理する手段を持つ処理要素
    と、同様のPEをまとめて多重折り返しのアレイ・プロ
    セッサを形成する手段とから成り、2重対称型処理要素
    のデータ要素を交換するだけで、1サイクルで実行され
    るマトリックス変換操作が得られ、処理要素のアレイと
    の併用が可能になり、イメージ処理やマルチメディアの
    アプリケーション、微分方程式を解く有限差分法、及び
    ソートのための並列2Dたたみ込みメカニズムが得られ
    る、コンピュータ機能アレイ要素。
  11. 【請求項11】複数の実行ユニットと、 データと命令を受信するブロードキャスト・メモリ・イ
    ンタフェースと、プロセッサ・クラスタ・ユニットの並
    列アレイのプロセッサ・クラスタ・ユニットから他のプ
    ロセッサ・クラスタ・ユニットへの多重プロセッサ間通
    信インタフェース手段と、 上記ブロードキャスト・メモリ・インタフェースに接続
    されてそこから命令とデータを受信する命令データ・バ
    ッファと、 上記命令データ・バッファに接続された制御機能を処理
    する命令レジスタと、 各実行ユニットのための複数のデータ記憶レジスタと、 上記命令レジスタによって制御され、上記データ・バッ
    ファと複数の実行ユニットに接続された分配ユニット
    と、 上記複数の実行ユニットのデータ記憶レジスタに接続さ
    れて、そこからデータを検索し、上記データを選択され
    た実行ユニット及び上記多重プロセッサ間通信インタフ
    ェース手段へ送るセレクタ・ユニットとを含む、 大規模並列コンピュータ・システムのプロセッサ・クラ
    スタ・ユニット。
  12. 【請求項12】上記多重プロセッサ間通信インタフェー
    ス手段が、ローカル・クラスタ情報をクラスタ内の別の
    プロセッサ及び上記クラスタ・ユニットの外部に送るた
    めにプロセッサI/O通信手段を与え、クラスタ・プロ
    セッサ・ユニット間のローカル通信のための命令をデコ
    ードする手段を含む、請求項14記載のプロセッサ・ク
    ラスタ・ユニット。
  13. 【請求項13】プロセッサ・クラスタ・ユニットの大規
    模並列アレイ構成が、対角線に沿って折り返されて三角
    アレイを成し、更に、折り返された三角形の底辺に垂直
    な線に沿って2回折り返されてM×Mマトリックスの形
    に配置され、4プロセッサの対角線クラスタと8プロセ
    ッサのクラスタから成り、最近接点から成るプロセッサ
    間通信インタフェースを備え、上記プロセッサのクラス
    タ内にM×Mアレイのラップ・アラウンド接続構造と論
    理的に完全な接続性が与えられた、M2 個の処理ユニッ
    トから成る、請求項14記載の装置。
  14. 【請求項14】プロセッサ・クラスタ・ユニットの大規
    模並列アレイ構成が、M2 個の処理ユニットから成り、
    各ユニットが最近接点の東西南北のI/Oポートを処理
    し、対角線に沿って折り返され、上記南北のI/Oポー
    トと東西のI/Oポートの共有を可能にするM×Mマト
    リックスの形にラップ・アラウンド通信網が設けられ
    た、請求項14記載の装置。
JP5128714A 1992-06-26 1993-05-31 メッシュ・アレイ・プロセッサ Pending JPH08171537A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US904916 1992-06-26
US07/904,916 US6041398A (en) 1992-06-26 1992-06-26 Massively parallel multiple-folded clustered processor mesh array

Publications (1)

Publication Number Publication Date
JPH08171537A true JPH08171537A (ja) 1996-07-02

Family

ID=25419970

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5128714A Pending JPH08171537A (ja) 1992-06-26 1993-05-31 メッシュ・アレイ・プロセッサ

Country Status (2)

Country Link
US (3) US6041398A (ja)
JP (1) JPH08171537A (ja)

Families Citing this family (89)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6041398A (en) * 1992-06-26 2000-03-21 International Business Machines Corporation Massively parallel multiple-folded clustered processor mesh array
US5401940A (en) * 1990-01-10 1995-03-28 Patentsmith Ii, Inc. Oscillating air dispensers for microwave oven
US5717192A (en) * 1990-01-10 1998-02-10 Patentsmith Technology, Ltd. Jet impingement batch oven
IT1268279B1 (it) * 1994-07-29 1997-02-27 Polin & C Spa Ing Forno di cottura, in particolare per pane o prodotti di pasticceria
US5584237A (en) * 1994-12-12 1996-12-17 Zesto Inc. Heated air-circulating oven
US5671660A (en) * 1994-12-12 1997-09-30 Moshonas; Georges Heated air-circulating oven
US5553394A (en) * 1995-05-11 1996-09-10 Reliance/Comm Tech Corporation Radial jet reattachment nozzle heat sink module for cooling electronics
CA2191786A1 (en) 1996-11-29 1998-05-29 Georges Moshonas Impingement food apparatus
US5934178A (en) * 1997-01-04 1999-08-10 Heat & Control, Inc. Air impingement oven
EP0859199B1 (en) * 1997-01-04 2004-10-20 Heat and Control, Inc. Air impingement oven
US6167502A (en) * 1997-10-10 2000-12-26 Billions Of Operations Per Second, Inc. Method and apparatus for manifold array processing
DE59701287D1 (de) * 1997-12-23 2000-04-20 Eloma Gmbh Groskuechentechnik Verfahren zum Entfeuchten eines Garraumes eines Dampfgargerätes sowie Vorrichtung hierfür
DE19820068A1 (de) * 1998-05-06 1999-11-11 Werner & Pfleiderer Lebensmitt Heizregister mit Wirbelblechen
KR100803640B1 (ko) * 1998-05-23 2008-02-19 에너시스트 디벨롭먼트 센터 엘.엘.씨. 그리스 제어 및 매연 감소 성능을 갖는 높은 열전달율의대류형 오븐
DE19824172A1 (de) * 1998-05-29 1999-12-09 Rational Gmbh Gargerät mit Energiespeicher- und Energieentnahmesystem
DE59904891D1 (de) * 1998-10-22 2003-05-08 Rational Ag Gargerät mit katalysator
NL1010836C2 (nl) * 1998-12-17 2000-06-23 O T B Engineering B V Oven voor het vervaardigen van zonnecellen.
DE19908800A1 (de) * 1999-03-01 2000-09-07 Bsh Bosch Siemens Hausgeraete Gargerät mit Temperatursensor
US6053094A (en) * 1999-03-15 2000-04-25 Cados; Dimitri Pita bread cooking apparatus
CN1359461A (zh) * 1999-03-23 2002-07-17 必胜客公司 冲击式烘烤炉的气流装置和方法
US6338623B1 (en) * 2000-04-29 2002-01-15 Richard A. Durrant Rotational molding oven
US6323462B1 (en) * 2000-06-23 2001-11-27 Wisconsin Oven Corporation Conveyor oven usable as pre-bake oven in a print plate imaging and processing system and method of using same
US6526961B1 (en) 2000-07-10 2003-03-04 Lincoln Foodservice Products, Inc Conveyor oven
DE10060155A1 (de) * 2000-12-04 2002-06-20 Bsh Bosch Siemens Hausgeraete Gargerät
US20100223295A1 (en) * 2000-12-06 2010-09-02 Io Informatics, Inc. Applied Semantic Knowledgebases and Applications Thereof
US20020156756A1 (en) * 2000-12-06 2002-10-24 Biosentients, Inc. Intelligent molecular object data structure and method for application in heterogeneous data environments with high data density and dynamic application needs
NL1017040C2 (nl) * 2001-01-05 2002-07-08 Koppens Bv Oven met luchtstraalinrichting.
WO2002076218A1 (en) 2001-03-22 2002-10-03 Zesto Food Equipment Manufacturing Inc. Multiconveyor convection oven
US7392287B2 (en) * 2001-03-27 2008-06-24 Hemisphere Ii Investment Lp Method and apparatus for sharing information using a handheld device
US6604931B2 (en) 2001-04-30 2003-08-12 Richard A Durrant Bi-axial rotational molding oven
JP2002333978A (ja) * 2001-05-08 2002-11-22 Nec Corp Vliw型プロセッサ
US6996548B2 (en) * 2001-05-11 2006-02-07 Hemisphere Ii Investment Lp Method and apparatus for providing a reward for the use of a processor in a parallel processing environment
US6866033B2 (en) * 2001-09-14 2005-03-15 Fmc Technologies Inc. Cooking oven damper system for regulating upper and lower flow paths
US6712064B2 (en) * 2001-09-14 2004-03-30 Fmc Technologies Inc. Cooking oven with improved heat distribution manifold system
US7296510B2 (en) * 2001-10-19 2007-11-20 Sharp Kabushiki Kaisha Cooking device
US6592364B2 (en) 2001-11-30 2003-07-15 David Zapata Apparatus, method and system for independently controlling airflow in a conveyor oven
US7308852B2 (en) * 2001-12-28 2007-12-18 Sharp Kabushiki Kaisha Heating cooking device
US6656036B1 (en) * 2002-05-28 2003-12-02 Spx Corporation Air directing vane and method
US7008658B2 (en) * 2002-05-29 2006-03-07 The Boc Group, Inc. Apparatus and method for providing treatment to a continuous supply of food product by impingement
EP1642073B1 (de) * 2003-07-01 2008-02-20 Strahm Textile Systems AG Umluftofen
US6880545B2 (en) * 2003-08-28 2005-04-19 Gas Research Institute Dual conveyor jet impingement oven
ES2537300T3 (es) * 2003-09-16 2015-06-05 Lincoln Foodservice Products, Inc. Horno con cinta transportadora con retorno de aire mejorado y método
US6920777B1 (en) * 2004-02-02 2005-07-26 Agilent Technologies, Inc. Intake cross-sheets for gas chromatographic oven
EP1729583A4 (en) * 2004-03-05 2015-02-25 Turbochef Tech Inc PASS OVEN
US6833533B1 (en) * 2004-03-12 2004-12-21 Wolfe Electric, Inc. Air impingement conveyor over
US20050205547A1 (en) * 2004-03-22 2005-09-22 Hatco Corporation Conveyor oven
DE102004020194A1 (de) * 2004-04-22 2005-11-17 Linde Ag Vorrichtung zum Gefrieren und/oder Kühlen von Gegenständen in einem mit einem Ventilator ausgestatteten Kühlraum
KR20070116784A (ko) * 2004-12-14 2007-12-11 에노디스 코포레이션 충돌, 대류, 극초단파 오븐 및 방법
US7340992B1 (en) * 2005-01-27 2008-03-11 Wolfe Electric, Inc. Dual belt conveyor oven
ATE369527T1 (de) * 2005-04-29 2007-08-15 Neubauer Kurt Mkn Maschf Gargerät mit einem garraumablauf und einem siphon
ITPS20060024A1 (it) * 2006-07-27 2008-01-28 Moretti Forni S P A Sistema per ottimizzazione della funzionalita' di forni a nastro a gas per alimenti
WO2008030500A2 (en) * 2006-09-05 2008-03-13 Lincoln Foodservice Products, Inc. Improved air flow path for an air impingement finger duct
JP2010506565A (ja) * 2006-10-13 2010-03-04 リンカーン フードサービス プロダクツ エルエルシー 高質量流開口を有する空気吹付け式オーブン
EP2139341B1 (en) * 2007-03-10 2016-11-16 TurboChef Technologies, Inc. Compact conveyor oven
US20080264623A1 (en) * 2007-04-30 2008-10-30 Bramhall Marcus E Ovens, finger ducts therefor, and methods for distributing air in a finger duct
US8022341B2 (en) 2007-05-15 2011-09-20 Appliance Scientific, Inc. High-speed cooking oven with optimized cooking efficiency
US8026463B2 (en) 2007-05-15 2011-09-27 Appliance Scientific, Inc. High-speed cooking oven with optimized cooking efficiency
US8455797B2 (en) * 2007-05-15 2013-06-04 Appliance Scientific, Inc. High-speed cooking oven with optimized cooking efficiency
US8129665B2 (en) * 2007-05-15 2012-03-06 Appliance Scientific, Inc. Apparatus and method for heating or cooling an object using a fluid
US7435931B1 (en) 2007-05-15 2008-10-14 Appliance Scientific, Inc. High-speed cooking oven with optimized cooking efficiency
US8134102B2 (en) * 2007-05-15 2012-03-13 Appliance Scientific, Inc. High-speed cooking oven with cooking support
US7731659B2 (en) * 2007-10-18 2010-06-08 Lifescan Scotland Limited Method for predicting a user's future glycemic state
US7695434B2 (en) * 2007-10-19 2010-04-13 Lifescan Scotland, Ltd. Medical device for predicting a user's future glycemic state
PL2110020T3 (pl) * 2008-04-18 2015-01-30 Gea Food Solutions Bakel Bv Piec i sposób sterowania przepływem powietrza i przeciekami powietrza pomiędzy dwiema komorami
PL2987410T3 (pl) * 2008-06-19 2021-11-08 Gea Food Solutions Bakel B.V. Piec spiralny z kontrolowanym przepływem powietrza na szerokości taśmy
DE102008053332A1 (de) * 2008-10-27 2010-04-29 Völkl, Thomas Temperiertunnel und Verfahren zu seinem Betrieb
US8531943B2 (en) * 2008-10-29 2013-09-10 Adapteva Incorporated Mesh network
KR101031967B1 (ko) 2009-06-05 2011-04-29 전경표 이송 구이장치
WO2011140258A1 (en) 2010-05-04 2011-11-10 Appliance Scientific, Inc. Oven circulating heated air
WO2011140503A1 (en) 2010-05-06 2011-11-10 Appliance Scientific, Inc. A plurality of accelerated cooking ovens with master-slave power assembly
WO2012096758A1 (en) * 2011-01-11 2012-07-19 Cleveland Range, Llc Conveyor oven and method with improved design for installation and removal of conveyor assembly
US20140199446A1 (en) * 2013-01-11 2014-07-17 Star Manufacturing International, Inc. Split-Belt Conveyor Toaster
US11292706B2 (en) * 2014-12-30 2022-04-05 Edward Showalter Apparatus, systems and methods for preparing and dispensing foods
US11639797B2 (en) 2015-05-05 2023-05-02 Ovention, Inc. Cooking oven having an active vent
US9874358B2 (en) * 2015-05-05 2018-01-23 Appliance Innovation, Inc. Oven based on a combination of heated air and infrared heating element
US10890336B2 (en) 2015-06-08 2021-01-12 Alto-Shaam, Inc. Thermal management system for multizone oven
US9879865B2 (en) 2015-06-08 2018-01-30 Alto-Shaam, Inc. Cooking oven
US9677774B2 (en) 2015-06-08 2017-06-13 Alto-Shaam, Inc. Multi-zone oven with variable cavity sizes
US10088172B2 (en) 2016-07-29 2018-10-02 Alto-Shaam, Inc. Oven using structured air
US10337745B2 (en) 2015-06-08 2019-07-02 Alto-Shaam, Inc. Convection oven
US11294815B2 (en) * 2015-06-10 2022-04-05 Mobileye Vision Technologies Ltd. Multiple multithreaded processors with shared data cache
AU2017231095B2 (en) * 2016-03-09 2022-12-08 Dmp Enterprises Pty Ltd Conveyor-type oven
US10241972B2 (en) * 2017-03-16 2019-03-26 International Business Machines Corporation Matrix multiplication on a systolic array
CN114615914A (zh) * 2019-06-19 2022-06-10 德卢卡炉灶技术有限责任公司 用于基于能量可用性加热的烤箱内的加热分布和传送系统的动态调制和二进制化
US11656849B2 (en) * 2019-08-14 2023-05-23 Vorticity Inc. Dedicated hardware system for solving partial differential equations
US11403070B2 (en) 2019-08-19 2022-08-02 Vorticity Inc. Systolic array design for solving partial differential equations
US11921813B2 (en) 2019-08-20 2024-03-05 Vorticity Inc. Methods for utilizing solver hardware for solving partial differential equations
US11497217B2 (en) 2019-09-09 2022-11-15 Wolfe Electric, Inc. Air impingement conveyor oven
CN215305176U (zh) * 2021-06-15 2021-12-28 江门市新会恒隆家居创新用品有限公司 多士炉

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63245553A (ja) * 1987-03-31 1988-10-12 Toshiba Corp 並列処理システム

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3098260A (en) * 1962-02-08 1963-07-23 Monsanto Chemicals Annealing apparatus
US3308740A (en) * 1965-01-15 1967-03-14 Disco Eng Inc Draft-free air curtain closure
US3289432A (en) * 1965-08-06 1966-12-06 Emhart Corp Display case
US3369375A (en) * 1965-12-13 1968-02-20 Mccray Refrigerator Company In Refrigerated display case
US3397631A (en) * 1966-08-01 1968-08-20 Dualjet Corp Air curtain using ionized air
DE1281469B (de) * 1967-02-10 1968-10-31 Huettenwerk Oberhausen Ag Vorrichtung fuer die Waermebehandlung von metallischem Gut, insbesondere Walzgut
DE7222326U (de) * 1972-06-15 1972-11-02 Burger Eisenwerke Ag Back- und waermeofen
US3884213A (en) * 1973-03-30 1975-05-20 Donald P Smith Cooking apparatus
US4094627A (en) * 1974-11-06 1978-06-13 Milton Jr Clare L Oven system
US4338911A (en) * 1976-05-19 1982-07-13 Smith Donald P Cooking apparatus
US4479776A (en) * 1981-07-22 1984-10-30 Smith Donald P Thermal treatment of food products
US4154861A (en) * 1976-05-19 1979-05-15 Smith Donald P Heat treatment of food products
US4116620A (en) * 1977-05-23 1978-09-26 Tec Systems, Inc. Web drying apparatus having means for heating recirculated air
JPS56149531A (en) * 1980-04-22 1981-11-19 Sharp Corp Hot-air circulation type cooker
US4377109B1 (en) * 1981-05-22 1996-08-06 Wolverine Corp Apparatus for baking food products such as pizzas and the like
US4474498A (en) * 1982-01-22 1984-10-02 Smith Donald P Multiple-pass impingement heating and cooling device
US4679542A (en) * 1982-03-19 1987-07-14 Donald P. Smith Fan-plenum configuration
US4576090A (en) * 1982-05-19 1986-03-18 Mastermatic, Inc. Tunnel heater
US4462383A (en) * 1982-06-09 1984-07-31 Lincoln Manufacturing Company, Inc. Impingement food preparation apparatus
US4626661A (en) * 1984-04-16 1986-12-02 Lincoln Manufacturing Company, Inc. Air delivery system for an impingement food preparation oven
US4591336A (en) * 1984-04-19 1986-05-27 Moco Thermal Industries Oven for curing resin-coated wires
US4831238A (en) * 1985-10-15 1989-05-16 Donald P. Smith High volume forced convection tunnel oven
US4965435A (en) * 1985-10-15 1990-10-23 Donald P. Smith Forced convection tunnel oven
US4701340A (en) * 1985-12-09 1987-10-20 Lincoln Foodservice Products, Inc. Impingement and steam oven apparatus for preparing food products
AU575743B2 (en) * 1986-05-15 1988-08-04 Kabushiki Kaisha Toshiba Circulating air cooker
US4753215A (en) * 1987-01-14 1988-06-28 Lincoln Foodservice Products, Inc. Burner for low profile inpingement oven
US4757800A (en) * 1987-01-14 1988-07-19 Lincoln Foodservice Products, Inc. Air flow system for a low profile impingement oven
US4796199A (en) * 1987-02-24 1989-01-03 Oregon Graduate Center Neural-model, information-handling architecture and method
US4834063A (en) * 1987-05-28 1989-05-30 Stein Associates, Inc. Food cooking oven with duct fingers and method
EP0370021A1 (en) * 1987-07-14 1990-05-30 Bellas, Inc. Method and apparatus for pulse heating and cooking food products
JPH0277871A (ja) * 1988-06-14 1990-03-16 Mitsubishi Electric Corp 神経回路網
US4881519A (en) * 1988-07-18 1989-11-21 Lincoln Foodservice Products, Inc. Hot air oven having infra-red radiant surfaces
US5117387A (en) * 1988-08-18 1992-05-26 Delco Electronics Corporation Microprogrammed timer processor
US5134690A (en) * 1989-06-26 1992-07-28 Samatham Maheswara R Augumented multiprocessor networks
CA2024203C (en) * 1989-09-22 2002-07-30 Donald P. Smith Balanced air return convection oven
US6041398A (en) * 1992-06-26 2000-03-21 International Business Machines Corporation Massively parallel multiple-folded clustered processor mesh array
US5025775A (en) * 1990-06-04 1991-06-25 Lincoln Foodservice Products, Inc. Air delivery system and oven control circuitry cooling system for a low profile impingement oven
US5180898A (en) * 1991-07-25 1993-01-19 G. S. Blodgett Corporation High velocity conveyor oven

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63245553A (ja) * 1987-03-31 1988-10-12 Toshiba Corp 並列処理システム

Also Published As

Publication number Publication date
US6041398A (en) 2000-03-21
US5423248A (en) 1995-06-13
US5683240A (en) 1997-11-04

Similar Documents

Publication Publication Date Title
JPH08171537A (ja) メッシュ・アレイ・プロセッサ
US6405185B1 (en) Massively parallel array processor
US5682491A (en) Selective processing and routing of results among processors controlled by decoding instructions using mask value derived from instruction tag and processor identifier
US5577262A (en) Parallel array processor interconnections
US5659785A (en) Array processor communication architecture with broadcast processor instructions
US6023753A (en) Manifold array processor
US8443169B2 (en) Interconnection network connecting operation-configurable nodes according to one or more levels of adjacency in multiple dimensions of communication in a multi-processor and a neural processor
US5754871A (en) Parallel processing system having asynchronous SIMD processing
US5710935A (en) Advanced parallel array processor (APAP)
US5963745A (en) APAP I/O programmable router
EP0570729A2 (en) Apap I/O programmable router
US5157785A (en) Process cell for an n-dimensional processor array having a single input element with 2n data inputs, memory, and full function arithmetic logic unit
JPH0727516B2 (ja) Simdアレイ・プロセツサ
KR20010015731A (ko) 복합 어레이 처리에 대한 방법 및 장치
US4524428A (en) Modular input-programmable logic circuits for use in a modular array processor
JP2009059346A (ja) 複数のマルチモードプロセッサに接続するための方法および装置
CN112486905A (zh) 可重构异构化pea互连方法
WO2022001454A1 (zh) 集成计算装置、集成电路芯片、板卡和计算方法
WO2022001457A1 (zh) 一种计算装置、芯片、板卡、电子设备和计算方法
Lim et al. Survey of parallel computers
Pechanek et al. An introduction to an array memory processor for application specific acceleration
Pechanek et al. A massively parallel diagonal-fold array processor
Baker et al. Simulation Between Enhanced Meshes and the Multiple Associative Computing (MASC) Model
Jain Parallel Processing With the TMS320C40 Parallel Digital Signal Processor
SE466074B (sv) Digital signalbehandlingsanordning med processorelement som innefattar en enbitsbuss