JP2549241B2 - コンピュータ・システム - Google Patents

コンピュータ・システム

Info

Publication number
JP2549241B2
JP2549241B2 JP5111877A JP11187793A JP2549241B2 JP 2549241 B2 JP2549241 B2 JP 2549241B2 JP 5111877 A JP5111877 A JP 5111877A JP 11187793 A JP11187793 A JP 11187793A JP 2549241 B2 JP2549241 B2 JP 2549241B2
Authority
JP
Japan
Prior art keywords
pme
array
data
node
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP5111877A
Other languages
English (en)
Other versions
JPH0675931A (ja
Inventor
トマス・ノーマン・バーカー
クライブ・アラン・コリンズ
マイケル・チャールズ・ダップ
ジェームズ・ウォレン・ディーフェンデルファー
ドナルド・ジョージ・グライス
ビリー・ジャック・ノウルズ
ドナルド・マイケル・レスマイスター
リチャード・エドワード・ニア
エリー・ユージン・レター
デイヴィッド・ブルース・ロルフ
ヴィンセント・ジョン・スモーラル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH0675931A publication Critical patent/JPH0675931A/ja
Application granted granted Critical
Publication of JP2549241B2 publication Critical patent/JP2549241B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、密並列のプロセッサ及
びアーキテクチャに関し、詳細には、処理要素のアレイ
にデータを出し入れすることに関する。
【0002】
【従来の技術】はじめに、本明細書で用いられる用語に
ついて説明する。
【0003】・ALU ALUとは、プロセッサの演算論理回路部分である。
【0004】・アレイ アレイとは、1次元または多次元における要素のアレイ
を指す。アレイは、順番に並べた1組のデータ項目(ア
レイ要素)を含むことができるが、FORTRANのよ
うな言語では、それらのデータ項目は単一の名前で識別
される。他の言語では、順番に並べた1組のデータ項目
の名前は、すべて同じ属性を持つ順番に並べた1組のデ
ータ要素を指す。プログラム・アレイでは、一般に数ま
たは次元属性によって次元が指定される。アレイの宣言
子でアレイの各次元のサイズを指定する言語もあり、ア
レイがテーブル内の要素のアレイとなっている言語もあ
る。ハードウェア的な意味では、アレイは、大規模並列
アーキテクチャにおいて全体として同一な構造(機能要
素)の集合体である。データ並列コンピュータ処理にお
けるアレイ要素は、動作を割り当てることができ、並列
状態のとき、それぞれ独立にかつ並列に必要な動作を実
行できる要素である。一般に、アレイは処理要素の格子
と考えることができる。アレイの各セクションに区分デ
ータを割り当てることにより、区分データを規則的な格
子パターン内で移動することができる。ただし、データ
に索引を付け、あるいはデータをアレイ中の任意の位置
に割り当てることが可能である。
【0005】・アレイ・ディレクタ アレイ・ディレクタとは、アレイの制御プログラムとし
てプログラミングされる単位である。アレイ・ディレク
タは、アレイとしてアレイされた機能要素のグループの
マスタ制御プログラムとしての機能を果す。
【0006】・アレイ・プロセッサ アレイ・プロセッサには主として、複数命令複数データ
方式(MIMD)と単一命令複数データ方式(SIM
D)との2種類がある。MIMDアレイ・プロセッサで
は、アレイ中の各処理要素が、それ自体のデータを使っ
てそれ自体の固有の命令ストリームを実行する。SIM
Dアレイ・プロセッサでは、アレイ中の各処理要素が、
共通の命令ストリームを介して同一の命令に限定され
る。ただし、各処理要素に関連するデータは固有であ
る。本発明の好ましいアレイ・プロセッサには他にも特
徴がある。本明細書では、これを拡張並列アレイ・プロ
セッサと呼び、APAPという略語を使用する。
【0007】・非同期 非同期とは、規則的な時間関係がないことである。すな
わち、各機能の実行間の関係が予測不能であり、各機能
の実行間に規則的または予測可能な時間関係が存在しな
い。制御状況では、制御プログラムは、データが、アド
レスされている遊休要素を待っているとき、制御が渡さ
れる位置にアドレスする。このため、諸操作が、どの事
象とも時間が一致しないのに順序通りのままとなる。
【0008】・BOPS/GOPS BOPSまたはGOPSは、1秒当たり10億回の動作
という同じ意味の略語である。GOPSを参照された
い。
【0009】・回線交換/蓄積交換 これらの用語は、ノードのネットワークを介してデータ
・パケットを移動するための2つの機構を指す。蓄積交
換は、データ・パケットを各中間ノードで受信し、その
メモリに格納してから、その宛先に向かって転送する機
構である。回線交換は、中間ノードに、その入力ポート
を出力ポートに論理的に接続するよう指令して、データ
・パケットが、中間ノードのメモリに入らずに、ノード
を直接通過して宛先に向かうことができるようにする機
構である。
【0010】・クラスタ クラスタとは、制御ユニット(クラスタ制御装置)と、
それに接続されたハードウェア(端末、機能ユニット、
または仮想構成要素)とから成るステーション(または
機能ユニット)である。本明細書では、クラスタは、ノ
ード・アレイとも称するプロセッサ・メモリ要素(PM
E)のアレイを含む。通常、クラスタは512個のPM
E要素を有する。
【0011】本発明の全PMEノード・アレイは、それ
ぞれ1つのクラスタ制御装置(CC)によってサポート
される1組のクラスタから成る。
【0012】・クラスタ制御装置 クラスタ制御装置とは、それに接続された複数の装置ま
たは機能ユニットの入出力動作を制御する装置である。
クラスタ制御装置は通常、IBM 3601金融機関通
信制御装置におけるように、該ユニットに格納され、そ
こで実行されるプログラムの制御を受けるが、IBM
3272制御装置におけるように、ハードウェアで完全
に制御可能である。
【0013】・クラスタ・シンクロナイザ クラスタ・シンクロナイザとは、あるクラスタのすべて
または一部分の動作を管理して、諸要素の同期動作を維
持し、各機能ユニットがプログラムの実行と特定の時間
関係を維持できるようにする機能ユニットである。
【0014】・制御装置 制御装置とは、相互接続ネットワークのリンクを介した
データおよび命令の伝送を指令する装置である。制御装
置の動作は、制御装置が接続されたプロセッサによって
実行されるプログラム、または制御装置内で実行される
プログラムによって制御される。
【0015】・CMOS CMOSとは、相補型金属酸化膜半導体技術の略語であ
る。これは、ダイナミック・ランダム・アクセス・メモ
リ(DRAM)の製造に広く使用されている。NMOS
は、ダイナミック・ランダム・アクセス・メモリの製造
に使用されるもう1つの技術である。本発明では相補型
金属酸化膜半導体の方を使用するが、拡張並列アレイ・
プロセッサ(APAP)の製造に使用する技術によっ
て、使用される半導体技術の範囲が制限されることはな
い。
【0016】・ドッティング ドッティングとは、物理的な接続によって3本以上のリ
ード線を結合することを指す。たいていのバックパネル
・バスではこの接続方法を使用している。この用語は、
過去のOR DOTSと関係があるが、ここでは、非常
に単純なプロトコルによってバス上に結合できる複数の
データ源を識別するのに使用する。
【0017】本発明における入出力ジッパの概念を用い
て、あるノードに入る入力ポートが、あるノードから出
る出力ポート、またはシステム・バスからくるデータに
よって駆動できるという概念を実施することができる。
逆に、あるノードから出力されるデータは、別のノード
およびシステム・バスへの入力として使用できる。シス
テム・バスと別のノードへのデータ出力は、同時には実
行されず、別のサイクルで実行されることに留意された
い。
【0018】ドッティングは、それを利用することによ
り2ポート式のPEまたはPMEまたはピケットを様々
な編成のアレイに使用できる、H−DOTの議論で使用
されている。2次元メッシュおよび3次元メッシュ、ベ
ース2Nキューブ、スパース・ベース4Nキューブ、ス
パース・ベース8Nキューブを含めて、いくつかのトポ
ロジーが議論されている。
【0019】・DRAM DRAMとは、コンピュータが主記憶装置として使用す
る共通記憶装置であるダイナミック・ランダム・アクセ
ス・メモリの略語である。ただし、DRAMという用語
は、キャッシュとして、または主記憶装置ではないメモ
リとして使用するのにも適用できる。
【0020】・浮動小数点 浮動小数点数は、固定小数部すなわち小数部と、約束上
の基数または基底に対する指数部の2つの部分で表され
る。指数は、10進小数点の実際の位置を示す。典型的
な浮動小数点の表記法では、実数0.0001234は
0.1234−3と表される。ここで、0.1234は
小数部であり、−3は指数である。この例では、浮動小
数点基数または基底は10であり、暗示的な1より大き
な正の固定整数基底を表す。浮動小数点表示で明示的に
示される、あるいは浮動小数点表示で指数部で表される
指数でこの基底をべき乗し、次に小数部を掛けると、表
される実数が求められる。数字リテラルは、浮動小数点
表記法で表すことも実数で表すこともできる。
【0021】・FLOPS この用語は、1秒当たりの浮動小数点命令数を指す。浮
動小数点演算には、ADD(加算)、SUB(減算)、
MPY(乗算)、DIV(除算)と、しばしばその他の
多くの演算が含まれる。1秒当たり浮動小数点命令数と
いうパラメータは、しばしば加算命令または乗算命令を
使って算出され、一般に50/50ミックスとみなすこ
とができる。演算には、指数部、小数部の生成と、必要
な小数部の正規化が含まれる。本発明では、32ビット
または48ビットの浮動小数点フォーマットを扱うこと
ができる(これより長くてもよいが、そのようなフォー
マットはミックスではカウントしなかった)。浮動小数
点演算を固定小数点命令(正規またはRISC)で実施
する際には、複数の命令が必要である。性能を計算する
際に10対1の比率を使用する人もあれば、比率を6.
25にした方が適切であることを示す研究もある。アー
キテクチャごとに比率が異なる。
【0022】・機能ユニット 機能ユニットとは、ある目的を達成できる、ハードウェ
ア、ソフトウェア、あるいはその両方のエンティティで
ある。
【0023】・Gバイト Gバイトとは10億バイトを指す。Gバイト/秒は、1
秒当たり10億バイトということになる。
【0024】・GIGAFLOPS 1秒当たり109個の浮動小数点命令
【0025】・GOPSおよびPETAOPS GOPSまたはBOPSは、1秒当たり10億回の演算
という同じ意味を持つ。PETAOPSは、現在のマシ
ンの潜在能力である1秒当たり1兆回の演算という意味
である。本発明のAPAPマシンでは、これらの用語
は、1秒当たり10億個の命令数を意味するBIP/G
IPとほぼ同じである。1つの命令で複数の演算(すな
わち、加算と乗算の両方)を実行できるマシンもある
が、本発明ではそのようにはしない。また、1つの演算
を実行するのに多数の命令を要する場合もある。たとえ
ば、本発明では複数の命令を使って、64ビット演算を
実行している。しかし、演算をカウントする際、対数演
算のカウントは行わなかった。性能を記述するにはGO
PSを使用する方が好ましいが、それを一貫して使うこ
とはしなかった。MIP/MOP、その上の単位として
BIP/BOP、およびMegaFLOPS/Giga
FLOPS/TeraFLOPS/PetaFLOPS
が使用される。
【0026】・ISA ISAとは、命令セット・アーキテクチャを意味する。
【0027】・リンク リンクとは、物理的または論理的要素である。物理的リ
ンクは要素またはユニットを結合するための物理接続で
あり、一方コンピュータ・プログラミングにおけるリン
クは、プログラムの別々の部分間で制御およびパラメー
タのやり取りを行う命令またはアドレスである。多重シ
ステムでは、実アドレスまたは仮想アドレスで識別され
るリンクを識別するプログラム・コードによって指定さ
れる、2つのシステム間の接続がリンクである。したが
って、リンクには一般に、物理媒体、任意のプロトコ
ル、ならびに関連する装置およびプログラミングが含ま
れる。すなわち、リンクは論理的であるとともに物理的
である。
【0028】・MFLOPS MFLOPSは、1秒当たり106個の浮動小数点命令
を意味する。
【0029】・MIMD MIMDは、アレイ内の各プロセッサがそれ自体の命令
ストリームを持ち、したがって多重命令ストリームを有
し、1処理要素当たり1つずつ配置された複数データ・
ストリームを実行する、プロセッサ・アレイ・アーキテ
クチャを指すのに使用される。
【0030】・モジュール モジュールとは、離散しており識別可能なプログラム単
位、あるいは他の構成要素と共に使用するように設計さ
れたハードウェアの機能単位である。また、単一の電子
チップに含まれるPEの集合体もモジュールと呼ばれ
る。
【0031】・ノード 一般に、ノードとはリンクの接合部である。PEの汎用
アレイでは、1つのPEをノードとすることができる。
ノードはまた、モジュールというPEの集合体を含むこ
ともできる。本発明では、ノードはPMEのアレイから
形成されており、この1組のPMEをノードと称する。
ノードは8個のPMEであることが好ましい。
【0032】・ノード・アレイ PMEから構成されるモジュールの集合体をノード・ア
レイと呼ぶことがある。これは、モジュールから構成さ
れるノードのアレイである。ノード・アレイは通常、
2、3個より多いPMEであるが、この用語は複数を包
含する。
【0033】・PDE PDEとは、偏微分方程式である。
【0034】・PDE緩和解法プロセス PDE緩和解法プロセスとは、PDE(偏微分方程式)
を解く方法である。PDEを解くには、既知の分野にお
けるスーパー・コンピュータの計算能力の大半を使用
し、したがってこれは緩和プロセスの好例となる。PD
E方程式を解く方法は多数あり、複数の数値解法に緩和
プロセスが含まれている。たとえば、PDEを有限要素
法で解く場合、緩和の計算に大部分の時間が費やされ
る。熱伝達の分野の例を考えてみよう。煙突内に高温の
ガスがあり、外では冷たい風が吹いているとすると、煙
突のレンガ内の温度勾配はどのようになるだろうか。レ
ンガを小さなセグメントとみなし、セグメント間を熱が
どのように流れるかを温度差の関数として表す方程式を
書くと、伝熱PDEが有限要素問題に変換される。ここ
で、内側と外側の要素を除くすべての要素が室温であ
り、境界セグメントが高温のガスと冷たい風の温度であ
るとすると、緩和を開始するための問題ができあがる。
その後、コンピュータ・プログラムでは、セグメントに
流れ込む、あるいはセグメントから流れ出る熱の量に基
づいて各セグメント内の温度変数を更新することによ
り、時間をモデル化する。煙突における1組の温度変数
を緩和して、物理的な煙突で発生する実際の温度分布を
表すには、モデル中のすべてのセグメントを処理するサ
イクルに何回もかけなければならない。目的が煙突にお
けるガス冷却をモデル化することである場合、諸要素を
気体方程式に拡張しなければならず、そうすると、内側
の境界条件が別の有限要素モデルとリンクされ、このプ
ロセスが続く。熱の流れが隣接するセグメント間の温度
差に依存することに留意されたい。したがって、PE間
通信経路を使って温度変数を分配する。PDE関係が並
列計算にうまく適用できるのは、この近隣接通信パター
ンまたは特性による。
【0035】・ピケット これは、アレイ・プロセッサを構成する要素のアレイ内
の要素である。この要素は、データ・フロー(ALU
REGS)、メモリ、制御機構、通信マトリックスのこ
の要素と関連する部分から構成される。この単位は、並
列プロセッサ要素およびメモリ要素と、その制御機構お
よびアレイ相互通信機構の一部から成るアレイ・プロセ
ッサの1/nを指す。ピケットは、プロセッサ・メモリ
要素(PME)の1つの形である。本発明のPMEチッ
プ設計プロセッサ論理回路は、関連出願に記載されてい
るピケット論理を実施し、あるいはノードとして形成さ
れたプロセッサ・アレイ用の論理を持つことができる。
ピケットという用語は、処理要素を表す、一般的に使用
されているアレイ用語のPEと似ており、好ましくはビ
ット並列バイトの情報をクロック・サイクルで処理する
ための処理要素とローカル・メモリの組合せからなる、
処理アレイの要素である。好ましい実施例は、バイト幅
データ・フロー・プロセッサ、32バイト以上のメモ
リ、原始制御機構、および他のピケットとの通信機構か
ら構成されている。
【0036】「ピケット」という用語は、トム・ソーヤ
ーと、彼の白いフェンスに由来している。ただし、機能
的には、軍隊のピケット・ラインと類似性があることも
理解されよう。
【0037】・ピケット・チップ ピケット・チップは、単一のシリコン・チップ上に複数
のピケットを含んでいる。
【0038】・ピケット・プロセッサ・システム(また
はサブシステム) ピケット・プロセッサは、ピケットのアレイと、通信ネ
ットワークと、入出力システムと、マイクロプロセッ
サ、キャンド・ルーチン・プロセッサ、およびアレイを
実行するマイクロコントローラから成るSIMD制御装
置とから構成されるトータル・システムである。
【0039】・ピケット・アーキテクチャ ピケット・アーキテクチャは、SIMDアーキテクチャ
の好ましい実施例であり、次のことを含む複数の多様な
問題に対応できる機能をもつ。 −セット連想処理 −並列数値中心処理 −イメージに類似した物理的アレイ処理
【0040】・ピケット・アレイ ピケット・アレイは、幾何的順序でアレイされたピケッ
トの集合体であり、規則正しいアレイである。
【0041】・PMEすなわちプロセッサ・メモリ要素 PMEは、プロセッサ・メモリ要素を表す。本明細書で
は、PMEという用語を、本発明の並列アレイ・プロセ
ッサの1つを形成する、単一のプロセッサ、メモリ、お
よび入出力可能なシステム要素もしくはユニットを指す
のに使用する。PMEは、ピケットを包含する用語であ
る。PMEは、プロセッサ、それと結合されたメモリ、
制御インタフェース、およびアレイ通信ネットワーク機
構の一部分から成るプロセッサ・アレイの1/nであ
る。この要素は、ピケット・プロセッサにおけるよう
に、正規のアレイの接続性を持つPME、あるいは上述
の多重PMEノードにおけるように、サブアレイの一部
としてのPMEを備えることができる。
【0042】・経路指定 経路指定とは、メッセージを宛先に届けるための物理経
路を割り当てることである。経路の割当てには、発信元
と宛先が必要である。これらの要素またはアドレスは、
一時的な関係または類縁性を持つ。メッセージの経路指
定は、しばしば、割当てのテーブルを参照することによ
って得られるキーに基づいて行われる。ネットワーク内
では、宛先は、リンクを識別する経路制御アドレスによ
って、伝送される情報の宛先としてアドレス指定され
る、任意のステーションまたはネットワークのアドレス
指定可能ユニットである。宛先フィールドは、メッセー
ジ・ヘッダ宛先コードで宛先を識別する。
【0043】・SIMD アレイ内のすべてのプロセッサが、単一命令ストリーム
から、1処理要素当たり1つずつ配置された複数データ
・ストリームを実行するように指令を受ける、プロセッ
サ・アレイ・アーキテクチャ。
【0044】・SIMDMIMDまたはSIMD/MI
MD SIMDMIMDまたはSIMD/MIMDとは、ある
時間の間MIMDからSIMDに切り換えて複雑な命令
を処理できる二重機能を持ち、したがって2つのモード
を持つマシンを指す用語である。シンキング・マシンズ
社(Thinking Machines, Inc)のコネクション・マシン
(Connection Machine)モデルCM−2をMIMDマシ
ンのフロント・エンドまたはバック・エンドとして配置
すると、プログラマは、二重モードとも称する、複数の
モードを動作させてある問題の別々の部分を実行するこ
とができた。これらのマシンは、ILLIAC以来存在
しており、バスを使用してマスタCPUを他のプロセッ
サと相互接続している。マスタ制御プロセッサは、他の
CPUの処理に割り込む能力を持つ。他のCPUは、独
立のプログラム・コードを実行できる。割込み中、チェ
ックポイント機能用に何らかの処理が必要である(制御
されるプロセッサの現状況のクローズおよびセーブ)。
【0045】・SIMIMD SIMIMDは、アレイ内のすべてのプロセッサが、単
一命令ストリームから、1処理要素当たり1つずつ配置
された複数データ・ストリームを実行するように指令を
受ける、プロセッサ・アレイ・アーキテクチャである。
この構成内では、命令実行を模倣する、各ピケット内の
データ従属演算が、SIMD命令ストリームによって制
御される。
【0046】これは、SIMD命令ストリームを使用し
て複数命令ストリーム(1ピケット当たり1個)を順序
付けし、複数データ・ストリーム(1ピケット当たり1
個)を実行することの可能な、単一命令ストリーム・マ
シンである。SIMIMDは、PMEシステムによって
実行できる。
【0047】・SISD SISDは、単一命令単一データの略語である。
【0048】・スワッピング スワッピングとは、ある記憶域のデータ内容を別の記憶
域のデータ内容と相互に交換することをいう。
【0049】・同期操作 MIMDマシンにおける同期動作は、各アクションがあ
る事象(通常はクロック)に関係付けられる、動作モー
ドである。この事象は、プログラム・シーケンス中で規
則的に発生する、指定された事象とすることができる。
動作は多数の処理要素にディスパッチされ、それらの処
理要素はそれぞれ独立して機能を実行する。動作が完了
しないかぎり、制御は制御装置に返されない。
【0050】要求が機能ユニットのアレイに対するもの
である場合、アレイ内の要素に制御装置から要求が出さ
れ、その要素は、制御装置に制御が返される前に動作を
完了しなければならない。
【0051】・TERAFLOPS TERAFLOPSは、1秒当たり1012個の浮動小数
点命令を意味する。
【0052】・VLSI VLSIとは、(集積回路に適用される)超大規模集積
の略語である。
【0053】・ジッパ ジッパとは、新規に提供される、アレイ構成の通常の相
互接続の外部にある装置からリンクを確立するための機
能である。
【0054】・回線交換方式 中間のPMEによる追加
の操作なしにメッセージが中間PMEを通過して最終宛
先に向うように、中間PMEが入力ポートを出力ポート
に論理的に接続する、アレイ内のPME間でのデータ転
送の方法。
【0055】・入力転送完了割込み 転送完了タグを伴
う入出力メッセージ・ワードを受け取ったときに行われ
る、プログラム・コンテキスト切替えの要求。
【0056】・ブレイクイン 入出力ポートがプロセッ
サ透過性コンテキスト切替えを引き起こし、プロセッサ
・データ流と制御経路を使ってデータ転送を自己管理す
るための機構。
【0057】・実行時ソフトウェア 処理要素上で実行
されるソフトウェアであり、オペレーティング・システ
ム、エグゼクティブ・プログラム、適用業務プログラ
ム、サービス・プログラムなどを含む。
【0058】・メモリ・リフレッシュ 現情報の再書込
み中にメモリの使用が中断される、動的RAM技術で必
要とされる機能。
【0059】・ジッパ 一群のネットワーク・リングの
動的ブレイク。「ジップ」されたときは、データはネッ
トワークに出入りせずにリングを回ることができる。
「ジップ解除」されると、リングはブレイクされてネッ
トワークへのエッジを形成し、リングを回るデータがそ
こを通ってネットワークに出入りする。
【0060】
【発明が解決しようとする課題】本発明の背景として、
メッシュ、トーラスその他の次元ネットワーク内での高
速入出力は、より高速の入出力によって強化される。従
来のシステムは、ネットワークに関して本発明の機能を
有さない。リングをブレイクしてネットワークへのエッ
ジを形成し、リングを回るデータがそこを通ってネット
ワークに出入りできるようにする機能を提供することは
重要であると考える。
【0061】
【課題を解決するための手段】多重PMEコンピュータ
・システム用の高速入出力は、ネットワーク結合にブレ
イクインしてネットワーク結合を切り換える方法を提供
する。このシステム結合をジッパと称する。
【0062】本発明の入出力ジッパの概念を用いて、あ
るノードに入るポートをあるノードから出るポートまた
はシステム・バスから来るデータで駆動することができ
るという概念を実施することができる。逆に、あるノー
ドから出されたデータが、別のノード及びシステム・バ
スへの入出力にとって使用可能になる。システム・バス
へのデータ出力と別のノードへのデータ出力は、同時で
はなく異なるサイクルに行われる。ジッパは、相互接続
されたノードのネットワークにデータを出し入れし、ノ
ードをメッシュ、リングまたは折返しトーラスとして相
互接続するシステム中で使用され、したがってネットワ
ークへのエッジはなく、ジッパ機構はリングをリングに
直交する次元に沿って論理的にブレイクして、ネットワ
ークへのエッジを確立させる。結合は、エッジのないネ
ットワークとエッジをもつネットワークの間でネットワ
ークを論理的に切り換える。エッジが活動状態のとき、
データはエッジを通ってネットワークに出入りし、この
結合により、ネットワークに入るデータの分散またはネ
ットワークから出るデータの収集が可能となり、その結
果、エッジを通るデータ速度が、ネットワークの外部の
システムの持続データ速度及びピーク・データ速度に一
致するようになる。
【0063】ジッパは、一群のネットワーク・リングの
動的ブレイクを可能にする。「ジップ」されると、デー
タはネットワークに出入りせずにリングを回ることがで
きる。「ジップ解除」されると、リングはブレイクされ
てネットワークへのエッジを形成し、リングを回るデー
タがそこを通ってネットワークに出入りする。
【0064】上記その他の改良点は、下記の詳細な説明
に記載されている。本発明と、その利点及び特徴をより
よく理解するため、下記の説明及び図面を参照された
い。
【0065】下記の詳しい説明では、図面を参照しなが
ら、本発明の好ましい実施例とその利点及び特徴を例に
よって説明する。
【0066】
【0067】
【実施例】 本発明は、データ転送とプログラム割込みと
を備えた完全な入出力システムを含む2次元以上の入出
力構造を利用して、チップ内でその構造に多数のSIM
Dプロセッサ・メモリ要素(PME)を付加するという
概念に基づいている 。以下の記述は、1チップ当り8個
のSIMD/MIMD PMEを有する4次元入出力構
造について行うが、より高次元にまたは1次元当りさら
に多くのPMEに拡張することもできる。
【0068】本発明では、これらの概念をプロセッサ間
通信から外部入出力機構に拡張する。さらに、処理アレ
イの制御に必要なインターフェース及び要素をも記述す
る。要約すると、入出力のタイプは次の3種ある。
(a)プロセッサ間、(b)プロセッサと外部の間、
(c)同報通信/制御。大規模並列処理システムでは、
これらすべてのタイプの入出力帯域幅をプロセッサの計
算能力と釣り合わせる必要がある。アレイ内で、これら
の要件は、非常に高速の割込み状態スワップ能力を付加
された16ビット命令セット・アーキテクチャ・コンピ
ュータ(以下ではPMEと称する)を複製することによ
って満足される。PMEの特徴は、他の大規模並列マシ
ンの処理要素と比較すると独特である。それは、処理、
経路指定、記憶及び入出力を完全に分散させることがで
きる。この特徴は他のどの設計にもない。
【0069】拡張並列アレイ・プロセッサ(APAP)
のブロック図を図1に示す。APAPは、ホスト・プロ
セッサ1の付属物である。ホスト・プロセッサ上で実行
されるプログラムによってデータとコマンドが発行され
る。これらのデータとコマンドを、アレイ・ディレクタ
のアプリケーション・インターフェース(API)3で
受け取って変換する。次いでAPIからデータとコマン
ドが、クラスタ・シンクロナイザ4とクラスタ制御装置
5を経てクラスタ6に渡される。これらのクラスタは、
APAPのメモリを提供し並列処理を行う。クラスタ
シンクロナイザ4とクラスタ制御装置5が提供する機能
は、データとコマンドを適切なクラスタに経路指定し、
クラスタ間の負荷の均衡をはかることである。
【0070】クラスタは、修正ハイパーキューブとして
相互接続されたいくつかのPMEから構成される。ハイ
パーキューブ内では、各セルが、アドレスが1ビット位
置だけ異なるどのセルをも隣接セルとしてアドレスする
ことができる。リング内ではどのセルも、アドレスが±
1だけ異なる2つのセルを隣接セルとしてアドレスする
ことができる。APAP用に使用される修正ハイパーキ
ューブは、この両方の手法を組み合わせて、リングから
ハイパーキューブを構築する。リングの交差部をノード
と定義する。本発明の好ましい実施例では、ノードは2
n個のPME20と同報通信/制御インターフェース
(BCI)部21を含む。PMEはノード内で2×nア
レイとして構成される。ここで、nはアレイを特徴づけ
る次元またはリングの数であり、物理的チップ・パッケ
ージの制限を受ける。好ましい実施例ではn=4であ
る。チップ技術が向上するにつれて、"n"が大きくなる
と、アレイ内で可能な次元が高くなる。
【0071】図3及び4に、PMEからのアレイの構築
を示す。8個のPMEが相互接続されてノード151を
形成している。8個のノードからなるグループがX次元
リング(16PME)として相互接続され、それとオー
バーラップする8個のノードのグループがY次元リング
152として相互接続される。これによって、ノードの
8×8アレイ(512PME)を含む単一の2次元クラ
スタが得られる。クラスタは最大で8×8アレイに組み
合わされて、4次元アレイ要素を形成する。このアレイ
要素を横切る8個のノードの各グループが、W次元とZ
次元で組み合わされる。4つの次元すべてにおける単一
ノードの相互接続経路が153に示されている。アレイ
が正規形または直交形である必要はないことに留意され
たい。特定のアプリケーションまたは構成で、任意のま
たはすべての次元でのノードの数を定義し直すことがで
きる。
【0072】各PMEは、1つのノード・リング23、
26内にしか存在できない(図2)。リングをW、X、
Y、Zと呼ぶ。1チップ内のPME20は対になってお
り(たとえば、+W、−W)、一方のPMEはデータを
時計回りにノード・リング23、26に沿って外部へ移
動し、他方のPMEは反時計回りにノード・リング2
3、26に沿って外部移動し、したがって1つのPM
Eが各ノードの外部ポート専用となる。各リング内の2
個のPMEに、その外部入出力ポートに因んだ名前を付
ける(+W、−W、+X、−X、+Y、−Y、+Z、−
Z)。ノード内にも2個のリング22があり、4個の+
nPME及び4個の−nPME(n=W、X、Y、Z)
を相互接続する。こうした内部リングは、メッセージが
外部リング間を移動するための経路を提供する。APA
Pは4次元直交アレイと見なすことができるので、内部
リングにより、メッセージがアレイ中をすべての次元で
移動できるようになる。このため、それ自体のノード・
リング内のPMEまたはそのノード内の隣接PMEをア
ドレスすることにより、どのPMEも目的に向けてメッ
セージをステップできる、アドレス指定構造が得られ
る。
【0073】各PMEは、図5では4個の入力ポートと
4個の出力ポート(左85、92、右86、95、縦9
3、94、外部80、81)をもつ。入力ポートのうち
の3個と出力ポートのうちの3個は、チップ上の他のP
MEへの全2重2点間接続である。第4のポートは、オ
フチップPMEへの全2重2点間接続である。好ましい
実施例では物理的パッケージにおけるピン及び電力上の
拘束のために、実際の入出力インターフェースは4ビッ
ト幅の経路97、98、99であり、これらは図15に
示すPME間データ・ワード96、100の4個のニッ
ブルを多重化するために使用される。
【0074】好ましい実施例では、このPMEの入出力
設計は、3種の入出力動作モードを提供する。
【0075】・通常モード 隣接する2つのPME間で
のデータ転送に使用される。データ転送はPMEソフト
ウェアによって開始される。隣接するPMEより遠くに
あるPME宛のデータは、隣接するPMEが受け取っ
て、それをその隣接PMEから発するかのように転送す
る。
【0076】・回線交換モード データ及び制御がPM
E中を通過できるようにする。このモードを使うと、直
接隣接していないPME間での高速通信が可能になる。
【0077】・ジッパ・モード クラスタ内のノードに
データをロードし、またはそこからデータを読み取るた
めに、アレイ制御装置が使用する。ジッパ・モードは、
通常モード及び回線交換モードの諸特徴を使って、クラ
スタ・カード上のPMEのアレイとの間でデータを高速
で転送する。
【0078】アレイ内の各リングW、X、Y、Zは連続
的であり、アレイへのエッジはない。概念上は、ジッパ
は、2つのノード間のインターフェースでリングを論理
的にブレイクして、一時エッジを形成するものである。
ジッパが非活動状態の場合、アレイはエッジをもたな
い。ジッパが活動化されると、2つのノード列間のすべ
てのインターフェースがブレイクされ、得られる「エッ
ジ」がアレイとアレイ制御装置の間でのデータ転送に使
用される。たとえば、図6を参照すると、ジッパ接続が
X=0のノードに沿った−Xインターフェース上に置
かれる場合、X=8(PME15)250のノード
とX=0(PME0)253のノード列の間のインタ
ーフェースは、もはや2点間ではなく、第3の(ホス
ト)インターフェース251が付加される。通常、デー
タは、PME0 253とPME15 250の間
を、そこにホスト・インターフェースがないかのように
通過する。しかし、PME実行時ソフトウェアの制御下
では、ジッパが活動化された場合、アレイの一時エッジ
を介してPME250、253とホスト・インターフェ
ース251の間をデータが通過する。単一クラスタの行
に沿ったジッパは8個のノードでリングをブレイクす
る。今日の技術に基づけば、好ましい実施例では、単一
のジッパを介して単一クラスタとの間で毎秒約57メガ
バイトをパスすることができる。光接続など将来技術が
発展すれば、このデータ速度は大幅に増加すると期待さ
れる。
【0079】図7は、この概念をどのように拡張すれ
ば、クラスタの2つの「エッジ」255、256上にジ
ッパを置くことができるかを示している。この手法で
は、異なるデータが各ジッパ内に渡される場合は、入出
力帯域幅が毎秒約114メガバイトに増加し、同一のデ
ータが各ジッパ内に渡される場合は、毎秒約57メガバ
イトの直交データ移動をサポートする。直交データ移動
は、アレイ内での高速の転置操作及び行列乗算操作をサ
ポートする。理論上は各ノード間インターフェース上に
ジッパが存在し得るが、実際にはジッパ・インターフェ
ースを持つ各PMEは、そのメモリが満杯になってそれ
以上データを受け入れることができないようになるのを
避けるために、アレイ入出力データを他のPMEに移す
ことができなければならない。ジッパの数は、各PME
でどれだけのメモリが使用できるかを決定する技術と、
ジッパ上のPMEとアレイ内の別のPMEの間でジッパ
・データを移動できる速度によって制限される。
【0080】図1は、n個のクラスタからなるアレイを
示している。好ましい実施例では、各クラスタが2個の
直交ジッパをサポートする。このアレイの最大アレイ入
出力速度は、毎秒2n×57メガバイトである。このア
レイの最大直交アレイ入出力速度は、毎秒n×157メ
ガバイトである。
【0081】ジッパの好ましい実施例では、ジッパ入力
とジッパ出力の2つの動作モードがある。ジッパ入力動
作はアレイ制御装置からクラスタ上の選択されたPME
のグループにデータを転送する。ジッパ入力動作は、ア
レイ制御装置実行時ソフトウェアによって開始される。
アレイ制御装置実行時ソフトウェアは、まずPMESI
MDモード同報通信コマンドを使って、ジッパ・インタ
ーフェースに沿ったPMEをジッパ通常(ZN)モード
またはジッパ回線交換(ZC)モードにする。次いで、
アレイ制御装置実行時ソフトウェアが、ZNモードのS
IMD PMEソフトウェアに受け取るべきワードのカ
ウントを与える。ZNモードでは、PMEはXインター
フェース80(図5)からデータを受け取ることができ
るが、まずそのインターフェースのためにメモリ内の入
力バッファをセットアップしなければならない。メモリ
内の2つの位置232、233(図8)が、各入力デー
タ・バッファの開始アドレスと、バッファに格納された
ワード数とを格納するために予約されている。さらに、
PME制御レジスタ2(図9)が、入力インターフェー
スを使用可能にするビット173および入出力割込みを
可能にするビット172を含んでいる。SIMD PM
E同報通信ソフトウェアは、予約されたメモリ位置23
0、231(図8)に出力データ・ブロックを定義する
ためのロードを行い、PME制御レジスタ2に入力デー
タの転送を可能にするためのロードを行う。ZNモード
では、PMEは遊休状態にあり、入出力割込みまたはZ
Cモードへの切り換えを待つ。
【0082】PMEが可能な1つの構成をとる場合のジ
ッパ入力動作を図10に示す。この図には、8ワードを
異なる3つのPMEに転送する例が示してある。データ
・インターフェース(ジッパ)がデータをPME260
に転送し、このアレイを介してPMEからPMEに移動
される。
【0083】本発明の好ましい実施例では、アレイ制御
装置は最初にPME A260、PME B261、
ME D263をZNモードに設定し、PME C26
2をZCモードに設定する。ジッパ入力動作では、PM
E制御レジスタ1の"Z"ビット163と"CS"ビット1
70をセットすると、PMEがZCモードになる。"Z"
ビット163をセットし、"CS"ビット170をリセッ
トすると、PMEがZNモードになる。PME A、
B、Dには、それぞれ初期受信カウント3、4、1が割
り当てられる。PME Aは、通常の受信シーケンスを
使ってその3データ・ワードを受け取る。ワード・カウ
ントが0になると、PME AのハードウェアがPME
制御レジスタ1の"CS"ビット170をセットし、PM
A264をZCモードに入らせる。PME B26
9とPME275でも同じシーケンスが実行され
る。(PME Dへの)最終ワード転送時271に、ア
レイ制御装置は、転送完了(TC)タグ・ビット224
(図13)を挿入することができる。TCビットがセッ
トされると、PME A〜Dはそのビットを検出し、入
出力割込み要求171を生成する。TCビット224が
セットされていない場合、PME A〜Dは転送終了時
にZCモード272〜275に留まる。
【0084】図11に示すように、ジッパ・インターフ
ェース上で要求240が検出されると、受信側PMEは
肯定応答241を送出し、データを入力レジスタ87に
ロードする。次いで受信シーケンスが開始し、カウント
233を取り出して減分し、入力バッファ・アドレス2
32を取り出して増分し、データ・ワードをPMEメモ
リ41(図12)に格納する。受信シーケンスは送信シ
ーケンスと類似している。このシーケンスは、遊休PM
Eにブレイクインし、メモリ41及びALU42へのア
クセスをサイクル・スチールすることにより、入出力ア
ドレスとカウント・フィールドを更新させ、入力データ
・ワードをメモリ41にロードさせる。カウントが0に
達してモードがZCに切り換わるか、あるいはTCタグ
を受け取って対応する入力割込みレジスタ・ビット17
1がセットされ、割込みコード190が「転送完了」を
示すようになるかするまで、このシーケンスが続く。
【0085】PMEは、下記の条件が満たされる場合、
要求に応答して肯定応答を生成する。 ・入力レジスタ87、100が空 ・要求が抑制されていない174 ・割込み182がその要求入力上で保留中ではない。 ・要求入力が回線交換されていない。 ・要求がすべての現要求のうちで最高の優先順位をも
つ。
【0086】入力レジスタ87、100は、肯定応答2
26が生成されてから受信シーケンスがデータ・ワード
をメモリに格納するまで、ビジー状態になる。入力レジ
スタがビジー状態になると、肯定応答は抑制される。ビ
ジー状態のとき、入力レジスタは受信シーケンスが実行
される前に重ね書きされるのを防止される(受信シーケ
ンスはメモリ・リフレッシュのために遅延される可能性
があるので)。
【0087】TCタグ・ビット224が送信側ジッパか
ら送られた場合、割込みレジスタ171(図9)におい
てそのインターフェース用の割込みラッチがセットされ
る。PME実行時ソフトウェアによって割込みラッチが
リセットされるまで、そのインターフェース上でそれ以
上肯定応答226は生成されない。たとえば、TCタグ
・ビット224がXインターフェース80からのデータ
転送時にセットされた場合、L割込みがとられL割込み
ラッチがリセットされるまで、Xからのそれ以上の要求
は抑制される。
【0088】TCタグ・ビット224がセットされてデ
ータ・ワードが転送され、受信側PMEがZNモードで
ある場合、外部インターフェース用の入出力割込み17
1が生成され、割込みコード190がTCを反映するよ
うにセットされる。さらに、送信側ジッパからTCタグ
が送られないうちにバッファ・カウントが0になる場
合、PMEはZCモードに切り換わる
【0089】PMEは、ZN受信モードのとき、メモリ
・リフレッシュ・シーケンスとジッパ入力のための受信
シーケンスしか実行できない。これが必要なのは、ジッ
パのデータ転送が最大PMEクロック速度で起こり得る
からである。PME命令の実行や非ジッパ入力用の受信
シーケンスのための時間はない。ZNモードの間、PM
ハードウェアは、ジッパ入力要求を除くすべての入力
要求を抑制する。
【0090】ジッパ出力動作で、データがクラスタ内の
選択されたPMEグループからアレイ制御装置に転送さ
れる。ジッパ出力動作は、アレイ制御装置実行時ソフト
ウェアによって開始され、このソフトウェアはまずSI
MDモード同報通信コマンドを使って、ジッパ・インタ
ーフェースの周りのPMEをジッパ通常(ZN)モード
とジッパ回線交換(ZC)モードのどちらかに置く。次
いでアレイ制御装置は、ZNモードのPME SIMD
ソフトウェアに、送信すべきワード数を与える。
【0091】概念的には、データは発信側PMEのメイ
ン・メモリからホスト・コンピュータのメイン・メモリ
に転送される。好ましい実施例では、各インターフェー
スごとに、出力データ・ブロックの開始アドレスとその
ブロックに格納されているワードの数を格納するための
記憶位置230、231が、メモリ内に2個ずつ予約さ
れている。さらに、PME制御レジスタ1(図参照)
がデータ出力の宛先とモードを制御する。同報通信SI
MD PMEソフトウェアは、転送モードを定義するた
め、PME制御レジスタ1へのロードを行う。同報通信
SIMD PMEソフトウェアとPME実行時ソフトウ
ェアのどちらかが、ホストに転送すべきデータを指定さ
れたメモリ位置にロードする。次いで同報通信SIMD
PMEソフトウェアがアドレスとカウントを指定のメ
モリ位置にロードする。次にそのソフトウェアはPME
制御レジスタ1へのロードを行い、最後にOUT命令を
実行して、データ送信シーケンスを開始させる。
【0092】PMEの可能な1つの構成でのジッパ出力
動作を図14に示す。この図では、8ワードを異なる3
つのPMEに転送する例が示されている。データ・イン
ターフェース(ジッパ)はデータをPME280から転
送し、アレイを介してPMEからPMEへ移される。
【0093】この例では、アレイ制御装置が最初にPM
A280、PME B281、PME D283を
ZNモードに設定し、PME C282をZCモードに
設定する。ジッパ出力動作では、PME制御レジスタ1
の"Z"ビット163と"CS"ビット170をセットする
と、PMEがZCモードになる。"Z"ビット163をセ
ットし、"CS"ビット170をリセットすると、PME
はZNモードになる。PME A、PME B、PME
Dにはそれぞれ3、4、1のカウントが割り当てられ
ている。PME Aは通常送信シーケンスを使ってその
3データ・ワードを送信する。ワード・カウントが0に
なると、PME A内のハードウェアがPME制御レジ
スタ1の"CS"ビット170をセットして、PME A
284をZCモードに入らせる。PME B289及び
PME D295内でも同じシーケンスが起こる。PM
E DのPME制御レジスタ"TC"164がセットされ
ている場合、(PME Dからの)最後のワード転送時
にPME Dは転送完了(TC)タグ・ビット224を
挿入する。TCタグがセットされている場合、PME
A〜Dはそのビットを検出し、入出力割込み要求171
を生成することになる。TCタグがセットされていない
場合は、PME A〜Dは転送終了時にZCモードに留
まる。
【0094】送信シーケンスでデータ・ワードが送信さ
れるごとに、カウント231が減分され、開始アドレス
230が増分され、メモリ41から1データ・ワードが
読み取られる。そのデータ・ワードは送信レジスタ4
7、96にロードされ、選択されたPME97、161
インターフェースに送られる。送信シーケンスは遊休P
MEにブレイクインして、メモリ41及びALU42へ
のアクセスをサイクル・スチールすることにより、入出
力アドレス及びカウント・フィールドを更新させ、かつ
送信レジスタ47、96へのロードを行わせる。ジッパ
転送では、PME制御レジスタ1のCXビット165が
セットされ、その結果、送信シーケンスが完了するまで
PMEプロセッサは遊休状態になる。このシーケンス
は、カウントが0に達するまで続く。
【0095】データ転送インターフェースは4ビット幅
97である。したがって、図13に示すように、各16
ビット・データ・ワード220は、4つの4ビット切片
(ニッブル)として送られる。データと一緒にタグ・ニ
ッブル221とパリティ・ニッブル222も送られる。
転送フォーマットは223に示してある。
【0096】送信シーケンスを図16に示す。インター
フェース上で送信側PMEが受信側ジッパ・インターフ
ェースに要求225を発生する。肯定応答226を受け
取ると、送信側PMEはデータ転送を開始し、次の送信
シーケンスが起こることができる。肯定応答を受け取る
まで、次の送信シーケンスは起こらない。
【0097】PME制御レジスタ1のTCビット164
がセットされる場合、TCビット224は最後に転送さ
れたデータ・ワードのタグ・フィールド中でセットされ
ることになる。このビットは、受信側ジッパにデータ転
送の終了を知らせる。
【0098】PMEはZN送信モードのとき、送信シー
ケンスとメモリ・リフレッシュ・シーケンスしか実行で
きない。これが必要なのは、ジッパ・データ転送が最大
PMEクロック速度で起こり得るからである。PME命
令の実行や非ジッパ入力用の受信シーケンスのための時
間はない。ZN送信モードの間、PMEハードウェアは
すべての入力要求を抑制する。
【0099】ジッパ・インターフェースは、図17の上
端と下端に示すように、アレイ制御装置をクラスタ上の
ノードに接続する。通常のインターフェースは、2つの
ニッブル(4ビット)一方向2点間インターフェースか
らなり、これは2つのPME間で双方向全2重転送をも
たらす。基本的には、データ経路202、要求線20
3、肯定応答線204を使って、左側のPME200
ら情報が転送される。同時に、データ経路211、要求
212、肯定応答線213を使って、右側のPME2
01から情報を転送することができる。ジッパがインタ
ーフェース上にインストールされるとき、データをアレ
イ内に入れるためにデータ経路214、要求線215、
肯定応答線216が付加され、データをアレイから出る
ためにデータ経路217、要求線218、肯定応答線
19が付加される。アレイ制御装置実行時ソフトウェア
は、PME201へのジッパ送信シーケンスを実行した
いとき、PME200の実行時ソフトウェアに、20
2、203、204を使用不能にさせる。同時に、アレ
イ制御装置実行時ソフトウェアは、PME200へのジ
ッパ受信シーケンスを実行したいとき、PME201の
実行時ソフトウェアに、211、212、213を使用
不能にさせる。ジッパ論理の配置は全く任意であること
に留意されたい。これは、容易に同一ノードの+X及び
−Xインターフェース上に置くこともでき、またW、
Y、Zノード・インターフェースのいずれかまたはすべ
て上に置くこともできる。
【0100】本発明の好ましい実施例について記述した
が、当業者なら現在でも将来も、頭記の特許請求の範囲
に含まれる様々な改良や改善を行えることが理解されよ
う。特許請求の範囲は、最初に開示された本発明の適切
な保護を維持するものと解釈すべきである。
【図面の簡単な説明】
【図1】典型的な拡張並列アレイ・プロセッサ(APA
P)を例示し、特にAPAPの主要要素と、ホスト・プ
ロセッサまたは他のデータ発信元/宛先へのAPAPイ
ンターフェースとを示す機能構成図である。
【図2】プロセッサ・メモリ要素(PME)ノードの実
施例を示し、特にノードを構成する様々な要素の相互接
続を示す概略図である。
【図3】修正2進ハイパーキューブを示す概略図であ
る。
【図4】修正2進ハイパーキューブを示す概略図であ
る。
【図5】回路交換経路を示す概略図である。
【図6】単一のPME−PMEインターフェース上のジ
ッパ接続を示す概略図である。
【図7】クラスタへの2つの直交する接続上のジッパ接
続を示す概略図である。
【図8】割込み及び入出力処理用の予約された記憶位置
を示す概略図である。ここで、実メモリ位置は、レベル
範囲の開始記憶アドレスにオフセットを加えて求める。
たとえば、右入力データ・バッファ・カウントは00C
O+003Dまたは^X^00FDにある。
【図9】割込みの実施態様をサポートするPME制御レ
ジスタ及び相互接続ネットワークを示す概略図である。
【図10】ジッパ受信シーケンスを示す概略図である。
【図11】プロセッサ・メモリ要素の実施例を例示する
データ流れ図である。このデータ流れの主要セクション
としては、主記憶域、汎用レジスタ、ALU及びレジス
タ、及び相互接続メッシュの一部分がある。
【図12】PME入出力間で転送されるタグ、パリテ
ィ、及びデータ・ワードを示す概略図である。
【図13】ジッパ送信シーケンスを示す概略図である。
【図14】PE入出力データ流れを示す概略図である。
【図15】PME入出力間での出力インターフェースの
順序付けを示す概略図である。
【図16】転送シーケンスを示す図である。
【図17】物理的ジッパ・インターフェースを示す概略
図である。
【符号の説明】
1 ホスト・プロセッサ 2 ホスト・メモリ 3 アプリケーション・プログラム・インターフェース
(API) 4 クラスタ同期装置 5 クラスタ制御装置 6 クラスタ 20 プロセッサ・メモリ要素(PME) 21 同報通信/制御インターフェース(BCI)部 22 リング 23 ノード・リング 26 ノード・リング 151 ノード 152 Y次元リング 153 4次元アレイ要素 154 相互接続経路
フロントページの続き (72)発明者 クライブ・アラン・コリンズ アメリカ合衆国12601、ニューヨーク州 ポーキープシー、モンロー・ドライブ 9 (72)発明者 マイケル・チャールズ・ダップ アメリカ合衆国13760、ニューヨーク州 エンドウェル、アイヴォン・アベニュー 1130 (72)発明者 ジェームズ・ウォレン・ディーフェンデ ルファー アメリカ合衆国13827、ニューヨーク州 オウェゴ、フロント・ストリート 396 (72)発明者 ドナルド・ジョージ・グライス アメリカ合衆国12401、ニューヨーク州 キングストン、ソーキル=ラビー・ロー ド 2179 (72)発明者 ビリー・ジャック・ノウルズ アメリカ合衆国12401、ニューヨーク州 キングストン、ハーリー・アベニュー 72 (72)発明者 ドナルド・マイケル・レスマイスター アメリカ合衆国13850、ニューヨーク州 ヴェスタル、コリンズ・ヒル・ロード 108エイ (72)発明者 リチャード・エドワード・ニア アメリカ合衆国13732、ニューヨーク州 アパラチン、フォレスト・ヒル・ロード 109 (72)発明者 エリー・ユージン・レター アメリカ合衆国18851、ペンシルバニア 州ウォレン・センター、エイチ・シー・ アール34 ボックス29ビー (72)発明者 デイヴィッド・ブルース・ロルフ アメリカ合衆国12491、ニューヨーク州 ウェスト・ハリー、パイン・トリー・ロ ード 24 (72)発明者 ヴィンセント・ジョン・スモーラル アメリカ合衆国13760、ニューヨーク州 エンドウェル、スカイライン・テラス 812

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】相互接続されたノードのリングを含み、そ
    の各ノードが複数の相互接続された処理要素を含むネッ
    トワークと、前記 リングを前記リングに直交する次元に沿って論理的
    にブレイクして、ネットワークエッジが確立されるよ
    うにする手段と、 ネットワークをエッジのないネットワークとエッジのあ
    るネットワークの間で動的に切り換える手段と、前記 エッジが活動状態のとき、前記エッジを介してネッ
    トワークにデータを出し入れする手段と、 含む、相互接続されたノードのネットワークにデータ
    を出し入れするための装置。
  2. 【請求項2】前記処理要素は、隣接する2つの処理要素
    間でデータを転送する通常モードまたは中間の処理要素
    がデータおよび制御情報を通過させる回線交換モードで
    動作する、 請求項1に記載の装置。
  3. 【請求項3】通常モードで動作する処理要素が自身のバ
    ッファに所定量の入力データを受け取ると回線交換モー
    ドに切り換わり、他の処理要素が入力データを受け取れ
    るようにする、請求項2に記載の装置
  4. 【請求項4】処理アレイを構成する多次元ネットワーク
    の形に相互接続された複数のノードを含み各ノードは通信経路を介して通信する複数のプロセッサ
    ・メモリ要素(PME)を含み前記処理アレイは、ブレイクによりノードの外部と通信
    するためのインターフェースを提供するリングを有す
    コンピュータ・システム
  5. 【請求項5】前記ノードのPMEは複数の外部ポートを
    与えるよう相互接続されて前記リングを形成し前記リングを論理的にブレイクして外部との通信のため
    のエッジを与える手段を更に含む、 請求項4に記載のコンピュータ・システム。
  6. 【請求項6】前記処理アレイを制御するアレイ制御装置
    を更に含み、前記エッジが前記処理アレイと前記アレイ制御装置の間
    でのデータ転送に使用される 、 請求項に記載のコンピュータ・システム。
JP5111877A 1992-05-22 1993-05-13 コンピュータ・システム Expired - Lifetime JP2549241B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US88725992A 1992-05-22 1992-05-22
US887259 1992-05-22

Publications (2)

Publication Number Publication Date
JPH0675931A JPH0675931A (ja) 1994-03-18
JP2549241B2 true JP2549241B2 (ja) 1996-10-30

Family

ID=25390778

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5111877A Expired - Lifetime JP2549241B2 (ja) 1992-05-22 1993-05-13 コンピュータ・システム

Country Status (1)

Country Link
JP (1) JP2549241B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8595734B2 (en) 2009-02-27 2013-11-26 Nec Corporation Reduction of processing time when cache miss occurs

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62102482A (ja) * 1985-10-28 1987-05-12 Matsushita Electric Ind Co Ltd 情報記録再生装置
KR100228795B1 (ko) * 1996-12-31 1999-11-01 윤종용 재할당 섹터가 있는 트랙에서의 억세스성능 향상방법
JP4091493B2 (ja) 2003-07-08 2008-05-28 アスモ株式会社 連結装置、及びワイパブレード
KR100677466B1 (ko) * 2004-10-13 2007-02-02 케이씨더블류 주식회사 와이퍼 블레이드 조립체에 사용되는 와이퍼 커넥터 조립체

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8595734B2 (en) 2009-02-27 2013-11-26 Nec Corporation Reduction of processing time when cache miss occurs

Also Published As

Publication number Publication date
JPH0675931A (ja) 1994-03-18

Similar Documents

Publication Publication Date Title
US5617577A (en) Advanced parallel array processor I/O connection
US5594918A (en) Parallel computer system providing multi-ported intelligent memory
US10282338B1 (en) Configuring routing in mesh networks
US5737628A (en) Multiprocessor computer system with interleaved processing element nodes
US5630162A (en) Array processor dotted communication network based on H-DOTs
US8737392B1 (en) Configuring routing in mesh networks
US8151088B1 (en) Configuring routing in mesh networks
JP2642039B2 (ja) アレイ・プロセッサ
US5428803A (en) Method and apparatus for a unified parallel processing architecture
US5765015A (en) Slide network for an array processor
JP2549241B2 (ja) コンピュータ・システム
JP2525117B2 (ja) アレイ・プロセッサ
Bhanota et al. The BlueGene/L supercomputer
CN112486905A (zh) 可重构异构化pea互连方法
JP2561800B2 (ja) コンピュータシステム装置
JP2657090B2 (ja) 計算機のデータ通信システム
JPH0652126A (ja) 相互接続ノード・ネットワークのメッセージ通過装置及びそのコンピュータ・システム
Agrawal et al. B-HIVE: hardware and software for an experimental multiprocessor
JP2975722B2 (ja) 計算機のデータ通信システム
JP2869100B2 (ja) 並列計算機の要素プロセッサ
JP2625628B2 (ja) 浮動小数点コンピュータ・システム
JP2840295B2 (ja) 計算機のデータ通信システム
JPH0619864A (ja) アレイプロセッサと処理素子と大量並列プロセッサ
JP2834909B2 (ja) 計算機のデータ通信システム
Khan et al. RSM—a restricted shared memory architecture for high speed interprocessor communication