JPH06509894A - 超並列コンピュータ・システムの入出力構成 - Google Patents
超並列コンピュータ・システムの入出力構成Info
- Publication number
- JPH06509894A JPH06509894A JP5504468A JP50446893A JPH06509894A JP H06509894 A JPH06509894 A JP H06509894A JP 5504468 A JP5504468 A JP 5504468A JP 50446893 A JP50446893 A JP 50446893A JP H06509894 A JPH06509894 A JP H06509894A
- Authority
- JP
- Japan
- Prior art keywords
- value
- destination
- offset
- address
- processing element
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
- G06F15/163—Interprocessor communication
- G06F15/173—Interprocessor communication using an interconnection network, e.g. matrix, shuffle, pyramid, star, snowflake
- G06F15/17337—Direct connection machines, e.g. completely connected computers, point to point communication networks
- G06F15/17343—Direct connection machines, e.g. completely connected computers, point to point communication networks wherein the interconnection is dynamically configurable, e.g. having loosely coupled nearest neighbor architecture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
- G06F15/163—Interprocessor communication
- G06F15/173—Interprocessor communication using an interconnection network, e.g. matrix, shuffle, pyramid, star, snowflake
- G06F15/17356—Indirect interconnection networks
- G06F15/17368—Indirect interconnection networks non hierarchical topologies
- G06F15/17381—Two dimensional, e.g. mesh, torus
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/55—Prevention, detection or correction of errors
- H04L49/555—Error detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/88—Monitoring involving counting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Multi Processors (AREA)
- Image Processing (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。
Description
【発明の詳細な説明】
超並列コンビエータ・システムの入出力構成発明の背景
本発明は、一般的には、ディジタル・コンピュータ・システムの分野に関し、具
体的には、超並列コンピユーテイング・システムに関するものである。
なお、本明細書の記述は本件出願の優先権の基礎たる米国特許出願筒07/74
6.038号(1991年8月16日出願)の明細書の記載に基づくものであっ
て、当該米国特許出願の番号を参照することによって当該米国特許出願の明細書
の記載内容が本明細書の一部分を構成するものとする。
ディジタル・コンピュータ・システムは、一般的に3つの基本エレメント、つま
り、メモリ・エレメント、入出力エレメントおよびプロセッサ・エレメントから
構成されている。メモリ・エレメントは情報をアドレス可能な記憶ロケーション
にストアしている。この情報には、データとそのデータを処理するための命令が
含まれる。プロセッサ・エレメントは情報をメモリ・エレメントからフェッチし
、その情報を命令またはデータとして解釈し、データを命令に従って処理し、処
理したデータをメモリ・エレメントへ戻す。入出力エレメントは、プロセッサ・
エレメントの制御を受けてメモリ・エレメントとやりとりして、命令および処理
すべきデータを含む情報をメモリへ転送し、処理済みのデータをメモリ・エレメ
ントから取り出す。
近年では、開発されたコンピュータは非常に多数のプロセッシング−エレメント
(processing element)を内蔵しており、すべてがほぼ同一
の命令ストリームで同時に稼働し、しかも、各プロセッシング・エレメントが別
々のデータ・ストリームを処理するようになっている。これらのプロセッサは、
”SIMDプロセッサ」(SIMD: single−instruction
/multiple data−単一命令/複数データ)、もっと広い意味では
、r SPMDプロセッサJ (SPMD: single−program/
multiple−data−単一プログラム/複数データ)と呼ばれている。
本明細書では、以下”SPMD”と総称することにする。
SPMDプロセッサは多数のアプリケーションで利用されている。例えば、イメ
ージ処理、信号処理、人工知能、データベース・オペレーション、および電子回
路や流体力学などの分野のコンピュータ・シミュレーションといったものである
。イメージ処理では、各プロセッシング・エレメントはイメージ(画像)のビク
セル(画素−picture element)の処理を行って、イメージ全体
を向上するために使用されている。信号処理では、プロセッサは、信号を定義し
たデータの「高速フーリエ変換」といった計算を実行するために必要な複数の計
算を同時並行に実行している。人工知能では、プロセッサは、特定のアプリケー
ションのストアされた知識を表している広範なルール・ベースのサーチ(探索)
を行っている。同様に、データベース・オペレーションでは、プロセッサはデー
タベースに置かれたデータのサーチを行っているが、ソートや他のオペレーショ
ンを行っている場合もある。例えば、電子回路のコンピュータ・シミュレーショ
ンでは、各プロセッサは電子回路の一部分を表し、プロセッサの繰返し計算は、
回路の他の部分からの信号に対する、その部分の応答を示すようになっている。
同様に、流体力学のシミュレーシぢンでは、天気予報、航空機設計などの多数の
アプリケーションで利用されているが、各プロセッサは空間の一点と関連づけら
れ、計算の結果として、流体の流れ、温度、圧力などの種々要因に関する情報を
得ている。
代表的なSPMDシステムは、プロセッシング・エレメントのアレイ(配列)と
ルータ・ネットワークを含むSPMDアレイ、制御プロセッサ、および入出力コ
ンポーネントを含んでいる。入出力コンポーネントは、制御プロセッサの制御の
もとで、データを処理のためにアレイへ転送し、処理されたデータをアレイから
受け取ってストア、表示などを行うことができる。制御プロセッサはSPMDア
レイも制御し、命令をプロセッシング・エレメントへ繰返しブロードキャストし
て並列に実行させる。ルータ・ネットワークは、プロセッシング・エレメントが
計算の結果を他のプロセッシング・エレメントへ伝えて、以後の計算で使用でき
るようにする。
SPMDコンピュータを含めて、多数のプロセッサを搭載したコンピュータは種
々のタイプがあるが、これらのコンピュータには、データやその他の情報を入出
力エレメントとプロセッサ間で高速に転送する能力が欠如している。
発明の概要
本発明は、新規で改良した入出力構成を備えた並列コンピュータ・システムを提
供するものである。
以下、本発明を要約して説明する。本発明の1つの目的は、ルーチング・ネット
ワーク(routingnetwork)で相互に結合された複数のプロセッシ
ング・エレメントと入出カプロセッサを備えたコンピュータを提供することであ
る。ルーチング・ネットワークは、プロセッシング・エレメントと入出カプロセ
ッサとの間でメツセージを転送する。プロセッシング・エレメントはルーチング
・ネットワーク経由でメツセージに入れて入出カプロセッサから送られてきたデ
ータに対して処理オペレーションを行い、処理を終えたデータをメツセージに入
れてルーチング・ネットワーク経由で入出カプロセッサへ転送する。プロセッシ
ング・エレメントは、第1の選択された一連のリーフ・ノード(leaf no
de)として結合されている。入出カプロセッサは、ルーチン・ネットワークの
第2の選択された一連のリーフ・ノードとして結合されており、入出力オペレー
ションの期間に、プロセッシング・エレメントの少なくとも選択されたサブセッ
トを構成する一連のプロセッシング・エレメントへルーチング・ネットワーク経
由で転送するメツセージを生成するための複数の人出力バッファを含んでいる。
本発明の別の目的は、前記ルーチング・ネットワークの一連のリーフ・ノードに
結合されて、入出力オペレーションの期間に、各々が該ルーチン・ネットワーク
の第2の一連のノードの1つに結合され、アドレスで指定された複数のデータ・
レシーバ(受信側)へ該ルーチン・ネットワーク経由で転送するメツセージを生
成するための複数の人出力バッファを含む入出カプロセッサを提供することであ
る。各入出カプロセッサは、各々がメツセージに入ってデータ・レシーバへ送信
される複数のデータ項目をバッファリングしておくための送信データ・バッファ
を含んでいる。宛先データ・レシーバ・アドレスおよびオフセット・ジェネレー
タは、入出力オペレーションに参加している人出カバッファの数とデータ・レシ
ーバの数に応じて、宛先データ・レシーバ・アドレス値と宛先オフセット値を繰
返し生成する。
図面の簡単な説明
本発明の特徴事項は、請求の範囲に記載されている通りである。本発明の上記お
よびその他の利点の理解を容易にするために、以下、添付図面を参照して詳しく
説明する。
第1図は、本発明によって構築された超並列コンピュータ・システムを示す概要
ブロック図である。
第2図は、第1図に示すコンピュータ・システムにおいてデータ・ルータ経由で
送信されるメツセージ・パケットの構造を示す図である。
第3A図および第3B図は、本発明の理解を容易にするために示したもので、第
1図のコンビエータ・システムの一部分の全構造を示す機能ブロック図である。
第4A図および第4B図は、第2図に示すメツセージ・パケット部分の生成に関
連して使用される、第3A図に示した情報生成部分で用いられる回路の構成を示
すロジック図である。
実施例の詳細な説明
第1図は、本発明に従って構築された超並列コンピュータ・システム10を示す
概要ブロック図である。
第1図に示すように、システム1oは、複数のプロセッシング・エレメント11
(0)〜11(N)(全体を符号11で示す)、スカシ・プロセッサ12(0
)〜12(M)(全体を符号12で示す)および入出カプロセッサ13(0)〜
13(K)(全体を符号12で示す)を含んでいる。例えば、ディスクやテープ
記憶ユニット、ビデオ表示デバイス、プリンタなどの入出カニニット(図示せず
)を入出カプロセッサに接続すれば、データおよびプログラム・コマンドを含む
情報を入力して、システム内のプロセッシング・エレメント11およびスカシ・
プロセッサ12に処理させることが可能であり、処理されたデータを受け取って
ストア、表示および印刷することができる。また、スカシ・プロセッサ12を、
例えば、ビデオ表示端末などの入出カニニットに接続すれば、−Å以上のオペレ
ータがシステムlo全体を制御することもできる。
システム10は複数の予備プロセッシング・エレメント11s(0)〜ll5(
J) (全体を符号IIsで示す)を含むことが可能である。その用途について
は、下達する。
システムIOは、さらに、制御ネットワーク14、データ・ルータ15および診
断ネットワーク16を含んでいる。制御ネットワーク14は、1つまたは2つ以
上のスカシ・プロセッサ12がプログラム・コマンドをプロセッシング・エレメ
ント11にブロードキャストすることを可能にする。コマンドを受け取ったプロ
セッシング・エレメント11はコマンドをほぼ同時に実行する。
また、制御ネットワーク14は、プロセッシング・エレメント11がステータス
(状況)情報を生成することを可能にし、この情報はスカシ・プロセッサ12に
送られる。制御ネットワーク14は、「スキャン」および「縮小(reduce
) Jオペレーションと呼ばれる、特定タイプの算術演算を実行するために、プ
ロセッシング・エレメント11によっても使用される。制御ネットワーク14は
プロセッシング・エレメント11間のステータス情報と同期化情報を得るために
も使用できる。
データ・ルータ15は、プロセッシング・エレメント11、スカシ・プロセッサ
12および入出カプロセッサ13間でデータを転送する。具体的には、スカシ・
プロセッサ12の制御の下で、入出カプロセッサ13は処理すべきデータを人出
カニニットから取り出し、そのデータをそれぞれのスカシ・プロセッサ12とプ
ロセッシング・エレメント11へ配布する。処理が行われている間、スカシ・プ
ロセッサ12とプロセッシング・エレメント11は、データ・ルータ15を経由
してデータを相互間で転送し合うことができる。さらに、プロセッシング・エレ
メント11とスカシ・プロセッサ12は処理したデータを入出カプロセッサ13
へ転送することができる。スカシ・プロセッサ12の制御の下で、入出カプロセ
ッサ13は、データ・ルータ15がら送られてきた処理済みデータを、特定の入
出カニニットへ送ってストア、表示、印刷などを行うことができる。特定の実施
例では、データ・ルータ15は、入出力コマンドをスカシ・プロセッサ12がら
入出カプロセッサ13へ転送し、入出力ステータス情報を入出カプロセッサ13
からスカシ・プロセッサ12へ転送するためにも使用される。
診断ネットワーク16は、診断プロセッサ(第1図には示されていない)の制御
の下で、システム1oの他の部分をテストして、欠陥個所を判別し、その所在を
突き止め、診断することを容易にする。診断プロセッサは1つまたは2つ以上の
スカシ・プロセッサ12を装備することが可能である。さらに、診断ネットワー
ク16はシステム10の他の部分の特定の動作条件を設定するためにも使用でき
る。
システムIOは同期式である。すなわち、そのエレメントのすべては、クロック
回路17から与えられるグローバルSYS CLKシステム信号に従って動作す
る。
特定の実施例では、システム10は、数100または数1000のプロセッシン
グ・エレメント11を含んでおり、これらは、スカシ・プロセッサ12がらブロ
ードキャストされてきたコマンドの制御の下で並列に動作して、1つの問題を処
理するようになっている。この実施例では、プロセッシング・エレメント11は
同じコマンドを受けて並列に動作して個々のデータ・セットを処理することによ
り、並列コンピュータ・システムを構成している。
さらに、システム10は、制御ネットワーク14を論理的に分割することにより
、論理的に複数の論理的サブシステムに動的に分割できるので、別々の問題を、
あるいは単一問題の別々の部分をこれらの論理的サブシステムに並行に処理させ
ることができる。その場合には、各論理的区画(partition)は、少な
くとも1つのスカシ・プロセッサ12と複数のプロセッシング・エレメント11
を含んでおり、スカシ・プロセッサ12はその区画内のプロセッシング・エレメ
ントにコマンドを送って、処理させる。予備プロセッシング・エレメント11s
は、これらが制御ネットワーク14およびデータ・ルータ15と結合される位置
を除き、プロセッシング・エレメント11と大体同じであるので、ある区画内の
プロセッシング・エレメント11に障害が起こったときにその代用として使用で
きる。従って、必要な数のプロセッシング・エレメント11をもつ区画を構成す
るにはプロセッシング・エレメント11が不足している場合には、プロセッシン
グ・エレメントの数を増やすことができ、また、追加のプロセッシング・エレメ
ント11を用意して、それらを区画に組み入れることも可能である。以下の説明
において、特に断りがない限り、プロセッシング・エレメント11というときは
、単数の場合も、複数の場合も、単数または複数の予備プロセッシング・エレメ
ントIIsも含まれているものとする。つまり、プロセッシング・エレメント1
1と予備プロセッシング・エレメントIIsは、プロセッシング・エレメント1
1で総称することにする。
システムIOの一実施例における制御ネットワーク14、データ・ルータ15、
および診断ネットワーク16ノ詳細は、国際出願No、 PCT/US9110
7.383 、国際出願臼1991年io月3日、出願人Thinking M
achinesCorporation 、発明の名称「並列コンピュータ・シ
ステムJ (Parallel Computer System) (公開番
号WO92106436、公開日1992年4月16日)に説明されているので
、その詳しい説明は省略する。簡単に説明すれば、制御ネットワーク14とデー
タ・ルータ15は一般にツリー形状のネットワークである(データ・ルータ15
は実際には「ファツト・ツリーJ (fat tree)になっている)。この
構造では、プロセッシング・ニレメン1−11、スカシ・プロセッサ12および
入出カプロセッサ13はリーフ(leaf)で結合されている。さらに、上記国
際出願にその詳細が説明されているように、プロセッシング・エレメント11、
スカシ・プロセッサ12および入出カプロセッサ13は、それぞれに含まれるネ
ットワーク・インタフェース回路を通して、データ・ルータ15および制御ネッ
トワーク14経由で相互に連絡できるようになっている(その詳細説明は省略す
る)。
本発明は、一般的に、システム1oにおける入出力オペレーションを目的として
いる。一般的には、入出カプロセッサ13と、ある区画のプロセッシング・エレ
メント11およびスカシ・プロセッサ12との間の入出力オペレーションはその
スカシ・プロセッサ12の制御を受けて行われる。スカシ・プロセッサ12は、
入出力コマンド情報をその区画のプロセッシング・エレメント11と入出カプロ
セッサ13へ送ることによって、入出力オペレーションに関与する。スカシ・プ
ロセッサ13は入出力コマンド情報をデータ・ルータ15経由で入出カプロセッ
サ13へ送るので、複数の区画間で入出カプロセッサ13を共用することができ
る。どの場合も、スカシ・プロセッサ12からプロセッシング・エレメント11
と入出カプロセッサ13の両方へ送られる入出力コマンド情報は、特に、入出力
オペレーションを識別するオペレーションIDを含んでいる。
上記の国際出願には、プロセッシング・エレメント11、スカシ・プロセッサ1
2および入出カプロセッサ13が相互間で情報を転送し合うためにデータ・ルー
タ15および制御ネットワーク14経由で送信するメツセージ・パケットの構造
が詳しく説明されている。そこに記載されている発明によれば、データ・ルータ
15経由で送信されるメツセージ・パケット、特に、第2図に示す特定の構造を
もつ入出力メツセージ・パケットが使用されている。第2図に示すように、入出
力メツセージ・パケット2230はメツセージ・アドレス部分31、メツセージ
・データ部分32およびチェック部分33を含んでいる。メツセージ・アドレス
部分は送信側デバイスから目的の受信側までの経路を指定するために使用される
。送信側デバイスと目的の受信側は、プロセッシング・エレメント11、スカシ
・プロセッサ12または入出カプロセッサ13であることが可能である。
メツセージ・アドレス部分31はHEADER部分を含んでおり、ここにはレベ
ル識別子(ID)と一連の下り経路識別子(ID)DN″i” (指標”i”は
”M”から”1”までの整数である)が収められる。HEADER部分のレベル
識別子は、送信側デバイスと目的の受信側の両方を含んでいる、ツリー内の最下
位レベルを指定しており、データ・ルータ15は、初期状態では、送信側デバイ
スからの入出力メツセージ・パケット2230をツリー内のそのレベルまで結合
する。そのあと、データ・ルータは連続する下り経路ID DN″i”を使用し
て、入出力メツセージ・パケット2230が目的の受信側にだどりつ(までツリ
ーを下ってい(。
メツセージ・データ部分32はいくつかのフィールドからなっている。つまり、
メツセージ長さフィールド34、メツセージ・タグ・フィールド35、宛先バッ
ファIDフィールド2231、宛先バッファ・オフセット・フィールド2232
、および宛先データ・フィールド2233である。メツセージ長さフィールド3
4はメツセージ・データ部分34の長さを指定する。メツセージ・タグ・フィー
ルド35は、データ・ルート15経由で送ることができる他のタイプのメツセー
ジ・パケットと区別して、パケットが入出力メツセージ・パケットであることを
示すオペレーティング・システム情報を入れておくことができる。
宛先バッファID部分2231と宛先バッファ・オフセット部分2232に入る
内容としては、受信側デバイスが使用する情報がある。例えば、入出カプロセッ
サ13から転送された入出力メツセージ・パケット2230の場合には、プロセ
ッシング・エレメント110)またはスカシ・プロセッサ12によって使用され
、プロセッング・エレメント11(i)またはスカシ・プロセッサ12からそこ
へ送られてきた入出力メツセージ・パケット2230の場合には、入出カプロセ
ッサ13によって使用される。具体的には、宛先バッファID部分2231の内
容は入出力オペレーションIDからのものであり、これは、入出力コマンドに入
れてスカシ・プロセッサ12から与えられる。代表的な例として、入出力オペレ
ーション時に、データが受信側によって受信されて、そこにある人出力バッファ
に入れられる場合には、宛先バッファID部分2231の内容を使用すると、受
信側が宛先データ部分2233の内容をロードできる特定のバッファを指定する
ことができる。宛先バッファ・オフセット部分2232は受信側が宛先データ部
分2232の内容をロードするバッファ内の特定ロケーションを指定する。上述
したように、複数の異なる入出力オペレーションをシステムIOで同時に実行で
きるので、入出力メツセージ・パケットの宛先バッファより部分2231に異な
る値を入れることができる。
さらに、特定のメツセージ送信側は、一方ではプロセッシング・エレメントu(
i)またはスカシ・プロセッサ12を含んでおり、他方では入出カプロセッサ1
3を含んでいるので、データを送信する順序で入出力メツセージ・パケット22
30を生成して送信することができるが、メツセージ受信側は入出力メツセージ
・パケット2230をランダムな順番に受信する場合がある。
各入出力メツセージ・パケット2230の宛先バッファ・オフセット部分223
2の内容を使用すると、受信側は、宛先バッファID部分2231の内容で示さ
れた特定入出力オペレーションに関連する受信入出力メツセージ・パケット22
30の宛先データ部分2233に入っているデータを正しい順序にすることがで
きる。
最後に、チェック部分33は巡回冗長検査値を収めており、これは、入出力メツ
セージ・パケット223oが正しく受信されたかを検査するために使用される。
本発明は、入出力メツセージ・パケット223oのメツセージ・アドレス部分3
1と宛先バッファ・オフセット部分2232の情報を生成するための構成を提供
するものである。
以下では、第3A図および第3B図を参照して、並列モード・メツセージ転送オ
ペレーションについて簡単に説明する。これらの概略図に示すように、複数の入
出力バッファ・ノード2201 (0)〜2201 (6) (第3A図)は符
号11(01〜11(5)(第3B図)で示すプロセッシング・エレメントの区
画と一緒に入出力オペレーションに参加する入出カプロセッサ13の部分を含ん
でいる。具体的には、第3A図に概略図で示すように、各人力バッファ・ノード
2201 (i)には、ネットワーク・インタフェース2277(i) 、並列
送信アドレス/オフセット・ジェネレータ2278(i)およびバッファ・メモ
リ2223(i)内の並列モード・バッファが置かれている。
同様に、第3B図に概略図で示すように、各プロセッシング・エレメント11(
i)には、ネットワーク・インタフェース202 (i)とメモリ・バッファ2
223 (i)が置かれている。順番の指標(index)が付いた人出力バッ
ファ・ノード220(i)のネットワーク・インタフェース2277(i)は、
データルータ15の順番のリーフとして結合されている。同様に、順番の指標が
付いたプロセッシング・エレメント11(i)のネットワーク・インタフェース
202(i)は、データ・ルータ15の順番のリーフとして結合されている。人
出力バッファ・ノード2201 (i)のネットワーク・インタフェース227
7(i)のデータ・ルータ15との結合は、プロセッシング・エレメント11(
i)のネットワーク・インタフェース202 (i)の結合に隣接させることも
、別々にすることも可能である。人出力オペレーションに参加する人出力バッフ
ァ・ノードとプロセッシング・エレメントの数は、一般的に、それぞれ”N”と
”NPE”で示されている。
第3A図に概略図で示すように、入出力オペレーションが行われているとき、デ
ータを入出力メツセージ・パケットに入れて入出力デバイス(図示せず)からプ
ロセッシング・エレメントへ転送しようすると、デバイス・インタフェース22
o2はラウンド・ロビン(round−robinj方式でデータを入出力メツ
セージ・バッファ220(i)へ転送する。つまり、デバイス・インタフェース
2202は最初のデータ項目を人出力バッファ・ノード2201 (0)へ、二
番目のデータ項目を人出カバッファ・ノード2202(1)へ、三番目のデータ
項目を人出力バッファ・ノード2201(2)へ(以下、同様)送信する。ここ
で、各「データ項目」とは、入出力デバイスから受け取って、入出力メツセージ
・パケットに入れて送信するデータ量のことである。デバイス・インタフェース
2202が入出力オペレーションに関係している最後の人出力バッファ・ノード
(この例では、人出力バッファ・ノード2201 (7)へデータ項目を送信す
ると、次のデータ項目を人出力バッファ・ノード2201(0)へ送信する。こ
のようにして、データはラウンド・ロビン方式で人出力バッファ・ノードへ送ら
れることになる。
人出力バッファ・ノード2201 (i)へ送られるデータ項目は、入出力デバ
イスとデバイス・インタフェース2202によって配列されてから、指標”i”
の値が大きくなる順にプロセッシング・エレメントへ送られ、この場合も、プロ
セッシング・エレメントの参照符号の権標順にラウンド・ロビン方式で送信され
る。しかし、人出力バッファ2201(i)へ送られる順番のデータ項目の特定
の個数を同じプロセッシング・エレメントへ送ることも可能である。この場合、
その数を「ストライビング・ファクタJ (striping factor)
と呼ぶことにし、全体を”C“で示している。
さらに、人出力バッファ・ノード2201 (0)によって順番に受信されたデ
ータ項目は、それぞれのバッファ・メモリ2223(i)のバッファ内の、連続
するオフセットをもつロケーションにストアされる。第3A図と第3B図では、
バッファのベース、つまり、オフセットがゼロのロケーションはそれぞれのバッ
ファの最上部ロケーションに示されており、連続するオフセットはバッファ内の
降順の順番位置に示されている。
従って、例えば、第3A図および第3B図に示すように、7つの人出力バッファ
・ノード2201 (0)〜2201 (6)および、6つのプロセッシング・
エレメント11(01〜11(5)からなり、ストライビング・ファクタが3で
ある例を使用すると、プロセッシング・ニレメンhll(01あての最初の3メ
ツセージのデータ項目はデバイス・インタフェース2202から人出力バッファ
・ノード2201(0)〜2201 (2+へ転送され、それぞれのバッファ・
メモリ2223(0)〜2223 (2)内では”PE(0) MSG(0)”
〜”PE(01MSG(2)”で表される。デバイス・インタフェース2202
は次に、プロセッシング・エレメント11(1)あての最初の3メツセージのデ
ータ項目を人出力バッファ・ノード2201 (3)へ送信し、これらは、それ
ぞれのバッファ・メモリ2223(3)〜2201 (5)内では”PE(1)
MSG(0)”〜”PE(1) MSG(2)”で表される。そのあと、デバ
イス・インタフェース2202はプロセッシング・エレメント11(2)あての
最初のメツセージのデータ項目を人出力バッファ・ノード2201 (6)へ、
同じプロセッシング・エレメント11(2)あての二番目と三番目のメツセージ
のデータ項目を大力バッファ・ノード2201 (0)と2201(1)へ送信
する。これらのデータ項目は、それぞれのバッファ・メモリ2223(6)、2
223 (0)および2223(1)内でそれぞれ符号“PE(2) MSG(
0)”、”PE(2) MSG(1)”および”PE(2) MSG(3)”で
表される。デバイス・インタフェースは連続するデータ項目を同じ方法で人出力
バッファ・ノード2201へ送信する。
以下の説明では、データ項目は”PE(x) MSG(y)”で総称する。なお
、”X”はプロセッシング・エレメントを示し、”y”はオフセットを示す。第
3A図に示すように、プロセッシング・エレメント11(0)へ送信するために
入出力デバイスから与えられた最初の連続するデータ項目の最初のデータ項目P
E(0) MSG(0)は人出力バッファ・ノード2201 (0)のバッファ
・メモリ2230(01のバッファ内のオフセット・ゼロに置かれている。最後
のプロセッシング・エレメント11(5)へ送られる最初の連続するデータ項目
の最後のデータ項目PE(5) MSG(2)は、人出力バッファ・ノード22
01 (3)のバッファ・メモリ2223 (3)のバッファ内のオフセット2
に置かれている。入出力オペレーションに参加している人出力バッファ・ノード
2201 (0)〜2201 (6)群のバッファにまたがる、このバッファ・
ロケーションのセットは「フレーム」と呼ばれる。
もっと広い意味では、フレームは入出力オペレーションに参加している人出力バ
ッファ・ノード2201 (i)のバッファにまたがるバッファ・ロケーション
のセットであり、最初のプロセッシング・エレメント11(01ヘスドライブ(
stripelとして送られる一連のデータ項目のうちの最初のデータ項目PE
(x) MSG(y)から、最後のプロセッシング・エレメント11 (51へ
同じストライブとして送られる対応する一連のデータ項目のうちの最後のデータ
項目PE(x) MSG(y)までに渡る。
バッファ・メモリ2223(i)に置かれている一連のフレームの各々は、フレ
ームID値で識別される。つまり、データ項目PE(0) MSG(0)が置か
れているバッファ・メモリ2223 (0)のバッファのオフセット・ゼロから
、データ項目PE(5) MSG(2)が置かれているバッファ・メモリ222
3 (3)のバッファのオフセット2までのロケーションを収めているフレーム
は、フレーム・ゼロと示される。同様に、データ項目PE(Q) IAsG(3
)が置かれているバッファ・メモリ2223 (4)のバッファのオフセット2
から、データ項目PE(5) MSG(5)が置かれているバッファ・メモリの
バッファのオフセットまでのロケーションを収めているフレームはフレーム1と
示される。以下、同様である。
特定のプロセッシング・エレメント11(i)またはスカシ・プロセッサ12へ
送られる、フレーム内の一連のデータエ頁目PE(x)MSG(y)は「ストラ
イブJ (stripe)と呼ばれる。バッファ・メモリに置かれている一連の
ストライブの各々はストライブ・オフセット値で示され、これはフレームの先頭
からのストライブのオフセットを示している。つまり、最初のフレームでは、最
初のストライブ内のデータ項目、つまり、オフセット・ゼロに置かれ、データ項
目PE(0) MSG(0)〜PE(0) MSG(2)を収めているストライ
ブは、入出力オペレーションに参加している、シリーズ中の最初のプロセッシン
グ・エレメント11(0)へ送信されるものである。同様に、二番目のストライ
ブ内のデータ項目、つまり、オフセット1に置かれ、データ項目PE(1) M
SG(0)〜PE(1) MSG(2)を収めているストライブは、入出力オペ
レーションに参加している、シリーズ中の二番目のプロセッシング・エレメント
11(1)へ入出力メツセージ・パケット2230に入って送信される。
以下、同様である。
フレーム内の各バッファ・ロケーションはスロット(slot)と呼ばれ、フレ
ームの先頭からの特定のスロットのオフセットを示すスロット・オフセット値で
識別される。従って、バッファ・メモリ2223(0)のバッファのオフセット
・ゼロのロケーションは、スロット・オフセット値がゼロとなっており、バッフ
ァ・メモリ2223(1)のバッファのオフセット・ゼロのロケーションは、ス
ロット・オフセット値が1となっている。以下、同様である。データ項目PE(
5) MSG(2)が置かれているバッファ・メモリ2223(3)のバッファ
のオフセット2のロケーションは、スロット・オフセット値が14になっている
。同様に、データ項目PE(01MSG(3)を収めていて、そのデータ項目が
二番目のフレームの最初のスロットであるバッファ・メモリ2223(4)のバ
ッファのオフセット2のロケーションは、スロット・オフセット値がゼロになっ
ている。以上から理解されるように、フレーム内のスロットの数、従って、フレ
ーム内のデータ項目PE(x) MSG(y)の数は、プロセッシング・エレメ
ントの数NPEにストライビング・ファクタCを掛けたものである。
上述したように、人出力バッファ・ノード2201 (i)はそれぞれのバッフ
ァ・メモリに置かれている連続するデータ項目PE(x) MSG(y)を、第
8B図に示すように、プロセッシング・エレメント11(i)へ送信する。第3
B図に示すように、各プロセッシング・エレメントは、データ項目ID PE(
x) MSG(y)中のその指標゛、i”のデータ項目を収めているメツセージ
を受け取り、それを連続するオフセット“y゛にストアする。このことから理解
されるように、データ項目ID PE(x) MSG(y)中の指標”X゛と”
y”はプロセッシング・エレメントIDとオフセットをそれぞれ参照している。
さらに、以上から理解されるように、人出力オペレーションにおいて、逆方向に
、データ項目をプロセッシング・エレメント11(i)の連続するバッファ・オ
フセットから人出力バッファ・ノードのバッファ・メモリ2223を経由して入
出力デバイスへ送、信するには、補足的なオペレーションが行われる。しかし、
この場合には、プロセッシング・エレメント11(0)はそのバッファに入って
いる最初の3デ一タ項目PE(0) MSG(0)、PE(0) MSG(1)
およびPE(0) MSG(2)を人出力バッファ・ノード2202(0)〜2
201 (2)へ送信する。以下、同様である。従って、入出力メツセージ・パ
ケットのアドレス部分31に使用されている人出力バッファ・ノードIDは、指
標”X”と関係づけられる。
各人出力バッファ・ノード2201 (i)に置かれた並列送信アドレス/オフ
セット・ジェネレータ2278(i)はプロセッシング・エレメントID”X”
、特に、プロセッシング・エレメントのアドレスを示す情報を、各入力メツセー
ジ・パケットごとに生成し、この情報はネットワーク・インタフェース2277
(i)が使用して、入出力メツセージ・パケット2230のメツセージ・アド
レス部分31の情報を生成する。さらに、並列送信アドレス/オフセット・ジェ
ネレータ2278(i)は、データ項目PE(x) MSG(y)のオフセット
”y”を生成する。このオペレーションでは、並列送信アドレス/オフセット・
ジェネレータ2278(i)はいくつかの情報項目を使用して動作する。情報項
目には、次のようなものがある。
(a)入出力オペレーションに参加している人出力バッファ・ノードの数”N”
(b)ストライビング・ファクタ“C”(C)人出力オペレーションに参加して
いるプロセッシング・エレメントの数”NPE”
(d)人出力バッファ・ノード2201 (i)の指標”i”(e)入出力オペ
レーションに参加している区画内の最初のプロセッシング・エレメントのアドレ
ス(システムのプロセッシング・エレメントのベースを基準にしたアドレス)。
上記の情報項目は、入出力オペレーションの開始時に得ることができる。
これらの情報項目から、並列送信アドレス/オフセット・ジェネレータ2278
は、入出力オペレーションで最初の入出力メツセージ・パケット2230を生成
するときに使用される次の初期値を判断することができる。
(a)初期宛先プロセッシング・エレメント・アドレス値
(b)初期宛先オフセット値。これは、(i)初期オフセット・ベース値と(i
f)初期オフセット・デルタ値がらなり、これらの両方を並列送信アドレス/オ
フセット・ジェネレータ2278が使用して、初期宛先プロセッシング・エレメ
ント・バッファ・オフセット値を判断する。
(c)初期スロット値
次の増分値は、入出力オペレーションで後続の入出力メツセージ・パッケージ2
230 (もしあれば)を生成するときに使用される。
(d)宛先プロセッシング・エレメント・アドレス増分値
(e)オフセット増分値。(i)オフセット・ベース増分値と(ii)オフセッ
ト・デルタ増分値を含んでいる。
(f)スロット増分値。
以上から理解されるように、これらの値は、入出力オペレーションの開始時に代
替値として得ることができる。
並列送信アドレス/オフセット・ジェネレータ2278 (i)は、詳細ブロッ
ク図を第4A図と第4B図に示すように、4つの生成セクションを含んでいる。
つまり、宛先プロセッシング・エレメント・アドレス生成セクション231O、
オフセット・デルタ生成セクション2311、オフセット・ベース生成セクショ
ン2312、スロット・カウント・セクション2313である。オフセット・ベ
ース生成セクション2312とオフセット・デルタ生成セクション2311は、
それぞれ、0FFSET BASE信号と0FFSET DELTA信号を生成
し、これらの信号は加算器2314に入力される。これを受けて、加算器231
4は、0FFSET BASE信号と0FFSET DELTA信号で表された
値の算術和に対応する値を表すDEST 0FFSET宛先オフセット信号を生
成し、これらの信号はラッチ2315にラッチされる。また、並列送信アドレス
/オフセット・ジェネレータ2278 (i)はバス2287経由でDEST
0FFSET信号を送り、この信号は、入出力メツセージ・パケットの宛先バッ
ファ・オフセット部分を生成するときにネットワーク・インタフェース2277
によって使用される。
宛先オフセット値は、基本的に2つのコンポーネントから作られる。1つは人出
力バッファ・ノードによって送信されるデータ項目PE(x) MSG(y)を
収めているフレームのフレームIDに関するものであり、もう1つは同じプロセ
ッシング・エレメント11(i)またはスカラ・プロセッサ12へ送信されるフ
レーム内のシリーズ中のデータ項目を収めているスロットのオフセットに関する
ものである。具体的には、オフセット・ベース生成セクション2312によって
生成された叶FSETBASE信号によって示されたバイナリ・コード化値は、
フレームID値に関するコンポーネントを表している。
同様に、0FFSET DELTA信号によって示されたバイナリ・コード化値
は、ストライブ内のシーケンス中のデータ項目を収めているスロットの位置を表
している。
オフセット・ベース生成セクションは初期オフセット・ベース値とオフセット・
ベース増分値を、ストライビング・ファクタ”C”およびスロット・カウント・
セクシml:/2313から(7)BUMP 0FFSET BASE信号と一
緒に使用して、0FFSET BASE信号を生成する。並列送信アドレス/オ
フセット・ジェネレータ227g(i)の初期オフセット・ベース値は、入出力
オペレーション期間に送信される最初のデータ項目のフレームに関するものであ
る。データ項目PE(x) MSG(y)のフレームID値は、(a)人出力バ
ッファ・ノードの指標”i”を、(blフレーム内のデータ項目数で割ってめた
間中の最大整数であり、フレーム内のデータ項目数は、入出力オペレーションに
参加するプロセッシング・エレメント11(i)の数”NPE”にストライビン
グ・ファクタ”C“を掛けたものと同じである。フレームIDの方はストリング
・ファクタ”C”が掛けられるが、これは、後続の各フレームについては、各ス
トライブ内の最初のデータ項目PE(x) MSG(y)のベース・オフセット
値がこの値に対応しているためである。 オフセット・ベース増分値は、人出力
バッファ・ノードが入出力メツセージ・パケット2230の送信と送信の間にイ
ンクリメントしていくフレームの数に関するものである。これから理解されるよ
うに、フレームの数は、(a)入出力オペレーションに参加する人出力バッファ
・ノード2201 (i)の数”N”を、(b)フレーム内のスロット数で割っ
てめた間中の最大整数に相当しており、フレーム内のスロット数は、入出力オペ
レーションに参加するプロセッシング・エレメント11(i)の数”NPE”に
ストライビング・ファクタ”C”を掛けたものである。この値もストライビング
ファクタ”C”が掛けられるが、これは、後続の各フレームのベースがフレーム
IDにストライビング・ファクタを掛けてめた値から始まるためである。
以上から理解されるように、入出力オペレーションに参加する人出力バッファ・
ノード2201 (i)の数”N”がフレーム内のスロット数の倍数になってい
ないと、送信されるデータ項目PE(x) MSG(y)を収めているスロット
のオフセットは、後続の各入出力メツセージ・パケットごとに変化する。スロッ
ト・オフセットの変化は、(a)入出力オペレーションに参加する入出力バッフ
ァ・ノード2201 (i)の数”N”を、フ(b)フレーム内のスロット数で
割ってめた商の余りに相当しており、フレーム内のスロット数は、入出力オペレ
ーションに参加しているプロセッシング・エレメント11(i)の数”NPE”
にストライビング・ファクタ”C”を掛けたものであり、その余りの方は、フレ
ーム内のスロット数をモジューロとした数”N”に対応する。スロット・オフセ
ットがこのように変化すると、オフセット・ベース生成セクション2312は、
ある入出力メツセージ・パケット2230からの次のパケットへのスロットのオ
フセットの変化がフレーム内のスロット数を越えているとベース・オフセット値
をさらにインクリメントする。スロット・カウント・セクション2313は、こ
のようなことが起こると、BUMP 0FFSET BASE信号を生成する。
スロット・カウント・セクション2313は、並列送信アドレス/オフセット・
ジェネレータ2278 (i)が現在DEST PE ADRS信号とDEST
0FFSET信号を生成シテいル対象となっているデータ項目PE(x) M
SG(y)のフレーム内のスロットの現在の指標を更新する。スロット・カウン
ト・セクション2313は初期スロット値とスロット増分値を、フレーム内のス
ロット数に対応する補正値と一緒に使用して、並列送信アドレス/オフセット・
シエネレ−92278(i)が現在DEST PE ADRS信号とDEST
0FFSET信号を生成している対象となっているデータ項目PE(x) MS
G(y)のフレーム内のスロットの現在の指標を更新する。初期スロット値は、
フレーム内のスロット数をモジューロとする、並列送信アドレス/オフセット・
ジェネレータ2278 (i)の指標(i)の値に対応している。スロット増分
値は、上述したように、フレーム内のスロット数をモジューロとする、人出力バ
ッファ・モジュール2201(i)の数”N”である。
スロット・カウント・セクション2313がフレーム内のスロット数を越えるス
ロット・カウント値を生成するときは、BUMP 0FFSET BASE信号
を肯定し、スロット・カウント値をフレーム内のスロット数だけ減少する。
その結果は、次のフレーム内のスロットのオフセットである。
宛先プロセッシング・エレメント・アドレス生成セクション2312は、(i)
初期宛先プロセッシング・エレメント・アドレス値、(it)宛先プロセッシン
グ・エレメント・アドレス増分値、(iii)入出力オベレーシジンに参加して
いるプロセッシング・エレメントの数”NPE”、 (iv)入出力オペレーシ
ョンに参加している区画内の最初のプロセッシング・エレメントのアドレス(シ
ステムのプロセッシング・エレメントのベースを基準にしたアドレス)、および
(v)オフセット・デルタ生成セクションからのBUMP DEST ADR5
宛先アドレス信号を使用して、DEST PE ADR5宛先プロセッシング・
エレメント・アドレス信号を生成する。並列送信アドレス/オフセット・ジェネ
レータ2278(i)ハDEsTPEADR3信号をネットワーク・インタフェ
ース2277に結合し、ネットワーク・インタフェース2277はこの信号を使
用して入出力メツセージ・パケット223oのメツセージ・アドレス部分31を
生成する。
以上から理解されるように、フレーム内のストライブのシーケンスについては、
ストライブ内のスロットに入っているデータ項目PE(x) MsG(y)のす
べては、入出力オペレーションに参加している1つのプロセッシング・エレメン
ト11(i)またはスカシ・プロセッサ12へ入出力メツセージ・パケット22
3oに入って送信される。従って、各並列送信アドレス/オフセット・ジェネレ
ータ2278 (i)の初期宛先プロセッシング・エレメント・アドレス値は、
人出力バッファ・ノード2201 (i)から送信される最初のデータ項目PE
(x)MSG (y)を収めているフレーム内のストライブのストライブ・オフ
セット値に関するものである。ストライブ・オフセット値の方は、人出力バッフ
ァ・ノードの指標”i“を、フレーム内のストライブ数をモジューロとするスト
ライビング・ファクタ”C”で除した商の最大整数に対応している。フレーム名
のストライブ数は、入出力オペレーションに参加しているプロセッシング・エレ
メント11(i)とスカシ・プロセッサ12の数である”NPE”に対応してい
る。
このようにして生成されたストライブ値は、実際には、入出力オペレーションに
参加している区画内の最初のプロセッシング・エレメント11(0)またはスカ
シ・プロセッサ12からのオフセットであり、人出力バッファ・ノードによって
生成される最初の入出力メツセージ・パケット2230に対するものである。従
って、初期宛先プロセッシング・エレメント・アドレス値は、このストライブ・
オフセット値に、入出力オペレーションに参加している最初のプロセッシング・
エレメント11(0)またはスカシ・プロセッサ12のアドレス(システムlO
のプロセッシング・エレメントのベースを基準にした)を加えたものである。
宛先プロセッシング・エレメント・アドレス増分値は、その入出力メツセージ・
バッファ2201 (i)によって生成される後続の各入出力メツセージ・パケ
ット2230の宛先プロセッシング・エレメント・アドレスを生成するとき並列
送信アドレス/オフセット・ジェネレータ2278 (i)によって使用される
。宛先プロセッシング・エレメント・アドレス増分値は、人出力バッファ・ノー
ド2201 (i)が入出力メツセージ・パケット2230の送信と送信の間に
インクリメントするフレーム内のストライブ数に関するものである。従って、宛
先プロセッシング・エレメント・アドレス増分値は、入出力オペレーションに参
加している人出力バッファ・ノード2201 (i)の数”N”を、フレーム内
のストライブ数”NPE”をモジューロとするストライビング・ファクタ”C”
で除した最大整数を総和したものである。
以上から理解されるように、入出力オペレーションに参加している人出力バッフ
ァ・ノード2201 (i)の数”N”がフレーム内のストライブ数の倍数にな
っていないと、ストライブ内で送信されるデータ項目PE(x)MSG (y)
を収めているスロットのオフセットは後続の各入出力メツセージ・パケットごと
に変化する。このスロット・オフセットの変化は、(a)入出力オペレーション
に参加している人出力バッファ・ノード2201 (i)の数”N”を、(b)
ストライブ内のスロット数、つまり、ストライビング・ファクタ”C”で除して
めた商の余りに対応し、この余りの方は、ストライビング・ファクタ゛C”をモ
ジューロとする数”N”に対応している。ストライブ内のスロット・オフセット
がこのように変化すると、宛先プロセッシング・エレメント・アドレス生成セク
ション231Oは、ある入出力メツセージ・パケット2230かも次のパケット
までのスロットのオフセット変化がストライブ内のスロット数を越えていたとき
、宛先プロセッシング・エレメント・アドレスをさらにインクリメントする。オ
フセット・デルタ生成セクション2311は、このようなことが起こると、BU
)IIP DEST ADR3信号を生成する。
オフセット・デルタ生成セクション2311は0FFSETDELTA信号も生
成するが、この信号は、上述したようにDEST 0FFSET信号の成分を表
しており、そのバイナリ・コード化値はストライブ内で、つまり、同じプロセッ
シング・エレメント11(i)またはスカシ・プロセッサ12へ送信されるフレ
ーム内の一連のデータ項目内で送信されるデータ項目PE(x) MSG(y)
のスロットの位置を示している。さらに、オフセット・デルタ生成セクション2
311は、宛先プロセッシング・エレメント・アドレス生成セクション231O
へ送られるBUMPDEST ADRSバンブ宛先アドレス信号を生成する。
並列送信アドレス/オフセット・ジェネレータ2278(i)の初期オフセット
・デルタ値は、ストライブ内で並列送信アドレス/オフセット・ジェネレータ2
278 (i)によって生成される最初のデータ項目PE(x)MSG (y)
を収めているスロットのオフセットに対応している。従って、初期オフセット・
デルタ値は、(a)入出力バッファ・ノード2201 (i)の指標”i”を、
(b)フレーム内のスロット数、つまり、入出力オペレーションに参加している
プロセッシング・エレメント11(i)の数”NPE”にストライビング・ファ
クタ”C”を掛けたもので除してめた商の余りに対応している。特に断りがなけ
れば、初期オフセット・デルタ値はストライビング・ファクタ”C”をモジュー
ロとする入出カッ\・ソファ・ノードの指標”i”に対応している。
オフセット・デルタ増分値は、人出カバ・ソファ・ノード2201 (i)が人
出力メッセージ・パケ・ント2230の送信と送信との間にインクリメントする
ストライブ内のスロット数に関するものである。上述したように、人出力バッフ
ァ・ノード2201(i)が入出力メツセージ・パケット2230の送信と送信
との間にインクリメントするストライブの数は、宛先プロセッシング・エレメン
ト・アドレス生成セクション2310によって判断された宛先プロセッシング・
エレメント・アドレス値の変化があれば、その変化に関するものである。従って
、オフセット・デルタ増分値は、(a)入出力オペレーションに参加している人
出力バッファ・ノード2201 (i)の数”N”を、(b)ストライブ内のス
ロット数、つまり、ストライビング・ファクタ”C”で除してめた商の余りであ
る。特に断りがなければ、オフセット・デルタ増分値は、入出力オペレーション
に参加している人出力バッファ・ノード2201 (i)の数”C”で、ストラ
イビング・ファクタ”C”をモジューロとしたものである。
上記から理解されるように、オフセット・デルタ生成セクション2311によっ
てオフセット・デルタ値がある入出力メツセージ・パケット2230から次のパ
ケットまでにインクリメントされた結果、オフセット・デルタ値がストライビン
グ・ファクタ”C”より大か等しくなると、オフセット・デルタ値は、実際には
、宛先プロセッシング・エレメント・アドレス生成セクション2310によって
判断された宛先プロセッシング・エレメント・アドレス値で示されたストライブ
より先に進んだストライブ内のスロットに関係するものである。この先に進んだ
ストライブの方は、宛先プロセッシング・エレメント・アドレス値で示されたも
のをより先の次のプロセッシング・エレメント11(i)ヘデータ項目PE(x
) MSG(y)が送信されるスロットを含んでいる。
そのようなことが起こると、オフセット・デルタ生成セクション2311はBU
MP DEST ADRSバンブ宛先アドレス信号を肯定して、宛先プロセッシ
ング・エレメント・アドレス生成セクション2310が宛先プロセッシング・エ
レメント・アドレスをさらにインクリメントすることを可能にする。さらに、オ
フセット・デルタ生成セクション2311は、インクリメントされたオフセット
・デルタ値からストライビング・ファクタを減算して、送信されるデータ項目に
ついて宛先プロセッシング・エレメント・アドレス生成セクション2310によ
って生成された宛先プロセッシング・エレメント・アドレスに関連するストライ
ブ内にあって、入出力メツセージ・パケットに入れて送信されるデータ項目PE
(x)MSG (y)のスロットのアドレスを指すようにする。
同様に、ある時点で、宛先プロセッシング・エレメント・アドレス生成セクショ
ン2310は、入出力オペレーションに参加している最高の指標をもつプロセッ
シング・エレメント11(i)またはスカシ・プロセッサ12のアドレスよりも
上になるように、宛先プロセッシング・エレメント・アドレスをインクリメント
する。
その時点で、宛先プロセッシング・エレメント・アドレス生成セクション231
Oは、宛先プロセッシング・エレメント・アドレスを、転送に参加しているプロ
セッシング・エレメントまたはスカシ・プロセッサの1つのアドレスである値に
訂正する。このオペレーションにおいて、宛先プロセッシング・エレメント・ア
ドレス生成セクション231Oは、インクリメントされた宛先プロセッシング・
エレメント・アドレスを、入出力オペレーションに参加しているプロセッシング
・エレメントの数であるNPHに相当する量だけ減少する。これにより、宛先プ
ロセッシング・エレメント・アドレスはこのオペレーション時に入出力オペレー
ションに参加しているプロセッシング・エレメントまたはスカシ・プロセッサを
正しく指すようになる。
以上述べたことを背景にして、以下では、第4A図および第4A図を参照して、
並列送信アドレス/オフセット・ジェネレータ2278(i)の構造とオペレー
ションについて説明する。初期状態では、ブロック2320に示している初期宛
先プロセッシング・エレメント・アドレスはマルチプレクサ2340経由で結合
され、ラッチ2341にラッチされている。さらに、宛先プロセッシング・エレ
メント・アドレス増分値は、宛先プロセッシング・エレメント・アドレス生成セ
クション231Oのラッチ2321にストアされている。
同様に、それぞれブロック2322と2324に示している初期オフセット・デ
ルタ値と初期オフセット・ベース値は、それぞれ0FFSET DELTA信号
および0FFSET BASE信号としてマルチプレクサ2342と2344経
由で結合されている。これらの信号はそれぞれラッチ2343と2345にラッ
チされている。また、これらの信号は同時に加算器2314に結合され、加算器
は、そのバイナリ・コード化値が0FFSET DELTA信号と0FFSET
BASE信号のバイナリ・コード化値の総和を表しているデルタ信号を加えた
0FFSET + DELオフセット信号を生成する。0FFSET +DEL
信号はラッチ2315にラッチされ、ラッチからDEST 0FFSET宛先オ
フセット信号が出力される。
同時に、オフセット・デルタ増分値とオフセット・ベース増分値は、それぞれオ
フセット・デルタ生成セクション2311とオフセット・ベース生成セクション
2312のレジスタ2323と2325にストアされる。ブロック2326に示
されている初期スロット値はマルチプレクサ2327経由で結合され、ラッチ2
347にラッチされ、スロット増分値はスロット・カウント・セクション231
3のレジスタ2327にストアされる。
さらに、その他の種々値も他のレジスタにストアされる。宛先プロセッシング・
エレメント・アドレス生成セクション2310はレジスタ2330と2331を
含んでいる。上述したように、宛先プロセッシング・エレメント・アドレス値を
生成するためにインクリメントするとき、ある時点で、インクリメントから得ら
れる値が、入出力オペレーションに参加しているプロセッシング・エレメント1
1(i)またはスカシ・プロセッサ12の範囲を超えたプロセッシング・エレメ
ント・アドレスを表している場合がある。このような状態は、レジスタ2330
に入っている値から検出することができる。
第4A図を参照して上述するように、宛先プロセッシング・エレメント・アドレ
ス値をインクリメントするとき、宛先プロセッシング・エレメント・アドレス生
成セクション2310は、以前に判断された宛先プロセッシング・エレメント・
アドレス値とレジスタ233oの内容とがどのような関係にあるかに応じて、レ
ジスタ2321の値とレジスタ2331の値のどちらかを選択する。
レジスタ2330の値は、次にインクリメントされると、入出力オペレーション
に参加しているものよりも先のプロセッシング・エレメント11(i)またはス
カシ・プロセッサ12を指すことになる個所まで、宛先プロセッシング・エレメ
ント・アドレス値がいつインクリメントされかを判断するために使用される。こ
の値は、(a)入出力オペレーションに参加している最後のプロセッシング・エ
レメント11(i)またはスカシ・プロセッサ12のアドレス(これは、最初の
プロセッシング・エレメント11(0)またはスカシ・プロセッサ12のアドレ
スに、入出力オペレーションに参加しているプロセッシング・エレメントまたは
スカシ・プロセッサの数”NPE”を加えたものである)から、(b)アドレス
がインクリメントされる量、つまり、アドレス増分値を差し引いたものである。
以前に判断された宛先プロセッシング・エレメント・アドレス値がレジスタ23
3゜にストアされた値以下であると宛先プロセッシング・エレメント・アドレス
生成セクション231oが判断したときは、宛先プロセッシング・エレメント・
アドレス値は、レジスタ2321に入っているアドレス増分値だけインクリメン
トされていれば、その許容範囲内のままになっている。その場合は、宛先プロセ
ッシング・エレメント・アドレス生成セクション231oはレジスタ2321の
値を用いてインクリメントを行う。
しかし、以前に判断された宛先プロセッシング・エレメント・アドレス値がレジ
スタ233oの値より大が等しいと宛先プロセッシング・エレメント・アドレス
生成セクション2310が判断し、宛先プロセッシング・エレメント・アドレス
値がアドレス増分値だけインクリメントされていれば、これはその許容範囲を超
えていることになる。その場合は、上述したように、インクリメントされた宛先
プロセッシング・エレメント・アドレス値は入出力オペレーションに参加してい
るプロセッシング・エレメントとスカシ・プロセッサの数”NPE”に対応する
値だけ減少される。レジスタ2331の内容は、値”NPE“だけ減少したアド
レス増分値に対応している。この値が以前に判断された宛先プロセッシング・エ
レメント・アドレス値に加えられると、その結果は、インクリメントされた宛先
プロセッシング・エレメント・アドレス値を値”NPE”だけ減少したのと同じ
になる。
同様に、オフセット・デルタ生成セクション2311は2つのアドレス2332
と2333を含んでいる。上述したように、オフセット・デルタ値は、ストライ
ビング・ファクタに関する範囲内で変化し、これらのレジスタの値は、オフセッ
ト・デルタ値をその範囲に制限するために使用される。第4A図を参照して下述
するように、オフセット・デルタ値をインクリメントするとき、オフセット・デ
ルタ生成セクション2311は、以前に判断されたオフセット・デルタ値とレジ
スタ2332の内容との間にどのような関係があるかに応じて、レジスタ232
3の値とレジスタ2333の値のどちらがを選択する。レジスタ2332の値は
、次にインクリメントされたとき、その許容範囲を越えたオフセット・デルタ値
、つまり、ストライビング・ファクタ”C”に等しいが、あるいは大きいオフセ
ット・デルタ値を表すことになる個所までにオフセット・デルタ値がいつインク
リメントされたかを判断するために使用される。この値は、(a)ストライビン
グ・ファクタ”C”から、(b)インクリメントされる量、つまり、オフセット
・デルタ増分値を差し引いた値である。以前に判断されたオフセット・デルタ値
がレジスタ2332にストアされた値以下であるとオフセット・デルタ生成セク
シゴン2311が判断したときは、オフセット・デルタ値は、レジスタ2323
のオフセット・デルタ増分値だけインクリメントされていれば、その許容範囲内
のままになっている。
その場合は、オフセット・デルタ生成セクション2311はレジスタ2323の
値を使用してインクリメントを行う。
しかし、以前に判断されたオフセット・デルタ値がレジスタ2332の値より大
か等しいとオフセット・デルタ生成セクション2311が判断し、デルタ・オフ
セット値がデルタ増分値だけインクリメントされていれば、その許容範囲を超え
ていることになる。その場合は、上述したように、インクリメントされたデルタ
・オフセット値はストライビング・ファクタ”C”だけ減少され、宛先プロセッ
シング・エレメント・アドレス生成セクション2310を制御するためにBUM
P DEST ADR3信号が肯定される。レジスタ2333の内容は、ストラ
イビング・ファクタ”C”だけ減少したデルタ増分値に対応している。この値が
以前に判断されたデルタ・オフセット値に追加されると、その結果は、インクリ
メントされたデルタ・オフセット値をストライビング・ファクタ“C”だけ減少
したのと同じになる。
オフセット・ベース生成セクション2312はレジスタ2334ももっており、
オフセット・ベース増分値にストライビング・ファクタ”C”を加えたものをス
トアしている。レジスタ2325の値は、以前に判断されたオフセット・ベース
値をオフセット・ベース増分値だけインクリメントすべきであるとスロット・カ
ウント・セクション2312が判断したとき使用される。他方、レジスタ233
4の値は、オフセット・ベース値をインクリメントするときに使用され、この値
は、上述したように、ストライビング・ファクタ”C”に対応する量だけされに
インクリメントされる。
最後に、スロット・カウント・セクション2313は2つのレジスタ2335と
2336を備えている。レジスタ2335は、次にインクリメントされたとき、
その許容範囲を超えたスロット指標値、つまり、入出力オペレーションに参加し
ているプロセッシング・エレメント11(i)またはスカシ・プロセッサ12の
数”NPE”にストライビング・ファクタ”C“を掛けたものであるフレーム内
のスロット数に等しいか、それより大きいスロット指標値を表すことになる個所
までスロット指標値がいつインクリメントされたかを判断するために使用される
値をストアしている。レジスタ2335の値は、数NPE”を掛けたストライビ
ング・ファクタ”C”からスロット増分値を差し引いたものである。レジスタ2
336の値は、スロット増分値からフレーム内のスロット数を差し引いたもので
ある。
第4B図を参照して下述するように、スロット・カウント値をインクリメントす
るとき、スロット・カウント・セクション2313は、以前に判断されたスロツ
ト・カウント値とレジスタ2335のないようとの間にどのような関係があるか
に応じて、レジスタ2327の値とレジスタ2336の値のどちらかの値を選択
する。レジスタ2335の値は、次にインクリメントされたとき、フレーム内の
スロット数より大きいスロット・オフセットを示すことになる個所までスロット
・カウント値がいつインクリメントされたかを判断するために使用される。
この値は、(a)入出力オペレーションに参加しているプロセッシング・エレメ
ント11(i)とスカシ・プロセッサ12の数”NPE”にストライビング・フ
ァクタ”C”を掛けたものであるフレーム内のスロット数から、(b)スロット
増分値を差し引いたものである。以前に判断されたスロット増分値がレジスタ2
335にストアされた値以下であるとスロット・カウント・セクション2313
が判断した場合は、スロット増分値は、レジスタ2327のスロット増分値だけ
インクリメントされていれば、その許容範囲内のままになっている。その場合は
、スロット・カウント・セクション2313はレジスタ2327の値を使用して
インクリメントを行う。
しかし、以前に判断されたスロット・カウント値がレジスタ2335の値より大
か等しいとスロット・カウント・セクション2313が判断し、スロット・カウ
ント値がスロット増分値だけインクリメントされていれば、現在のフレームの終
わりを越えたスロットを示すことになる。その場合は、上述したように、スロッ
ト・カウント・セクシゴン2313はBUMP 0FFSET BASE信号を
肯定して、オフセット・ベース・セクション2312がレジスタ2334の値を
使用してオフセット・ベース値のインクリメントを行えるようにする。さらに、
スロット・カウント・セクション2313は、その値がスロット増分値だけイン
クリメントされ、フレーム内のスロット数に対応する値だけ減少された新しいス
ロット・カウント値を生成する。レジスタ2331の内容は、フレーム内のスロ
ット数に対応する値だけ減少したスロット増分値に対応している。この値が以前
に判断されたスロット・カウント値に加えられると、その結果は、インクリメン
トされたスロット・カウント値を、フレーム内のスロット数に対応する値だけ減
少したのと同じになる。
各種のレジスタが上述したようにロードされ、人出カバファ・ノードによって生
成される初期入出力メツセージ・パケット2230の初期値をラッチ2341.
2343.2315.2345および2347にロードすることが可能になると
、各種のセクション2310.2311.2312および2313が一連の繰返
しを同時に実行し、人出力バッファ・ノードによって送信される後続のデータ項
目PE(x) MSG(y)の入出力メツセージ・パケット2230を生成する
ときに使用されるDEST PE ADR3信号とDEST 0FFSET信号
が生成されることになる。
第4A図に示すように、オフセット・デルタ生成セクション2311においては
、ラッチ2343からのLATOFFSET DELTAラッチ・オフセット・
デルタ信号(この時点では、初期オフセット・デルタ値に対応するバイナリ・コ
ード化値をもっている)は、加算器2351の一方の入力端子に入力される。加
算器2351のもう一方の入力端子には、マルチプレクサ2351からの5EL
OFFSET DELTAINCFACTOR選択オフセット・デルタ・インク
リメント・ファクタ信号が入力される。加算器2350はINCOFF DEL
インクリメント・オフセット・デルタ信号を生成し、この信号は0FFSET
DELTA信号としてラッチ2343の入力端子と加算器2341の一方の入力
端子に入力され、ラッチと加算器は、上述するように、オフセット・ベース生成
セクション2312によって繰返し時に生成された叶FSET BASE信号と
結合して、DEST 0FFSET宛先オフセット信号を生成する。加算器23
50からのINCOFF DEL信号は、その繰返しでインクリメントされたデ
ルタ・オフセット値を表している。
SEL 0FFSET DELTA INCFACTOR選択オフセット・デル
タ・インクリメント・ファクタ信号は、コンパレータ2352の制御を受けてマ
ルチプレクサ2351から与えられる。他方、コンパレータ2352はラッチ2
343からのLAT 0FFSET DELTA信号とレジスタ2332からの
信号を受信し、それに応答して、BUMP DEST ADRSバンブ宛先アド
レス信号を生成する。コンパレータ2352は、LATOFFSET DELT
A信号がレジスタ2332からの信号で表されたバイナリ・コード化値以下であ
ると判断すると、BUMP DEST ADR3信号を否定する。そのようなこ
とが起こると、LAT 0FFSET DELTA信号のバイナリ・コード化値
は、加算器2350によってレジスタ2323のオフセット・デルタ増分値だけ
インクリメントされていれば、オフセット・デルタ値の許容範囲内のままになっ
ている。従って、否定されたBUMP DEST ADR3信号により、マルチ
プレクサは、レジスタ2323からの信号を5ELOFF DELTA INC
FACTOR選択オフセット・デルタ・インクリメント・ファクタ信号として加
算器2350に入力する。加算器はINCOFF DELインクリメント・オフ
セット・デルタ信号を生成し、マルチプレクサ2342はこの信号を0FFSE
T DELTA信号としてラッチ2343と加算器2314の入力端子に入力す
る。
他方、コンパレータ2343は、LAT 0FFSET DELTA信号のバイ
ナリ・コード化値がレジスタ2332からの信号で現れた値より大か等しいと判
断すると、BUMP DESTADR3信号を肯定する。そのようなことが起こ
ると、LAT 0FFSET DELTA信号のバイナリ・コード化値は、加算
器2350によってレジスタ2323のオフセット・デルタ増分値だけインクリ
メントされていれば、オフセット・デルタ値の許容範囲を超えていることになる
。
従って、肯定されたBUMP DEST ADR3信号により、マルチプレクサ
はレジスタ2333がらの信号をSEL 0FFDELTA INCFACTO
R選択オフセット・デルタ・インクリメント・ダクタ信号として加算器235o
に入力する。上述したように、レジスタ2333からの信号のバイナリ・コード
化値はストライビング・ファクタ”C”だけ減少されたデルタ増分値であるので
、加算器がINC: 0FFDELインクリメント・オフセット・デルタ信号を
生成するとき、INCOFF DEL信号のバイナリ・コード化値は許容範囲内
になっている。マルチプレクサ2342はINCOFF DEL信号を0FFS
ET DELTA信号としてラッチ2343と加算器2314の入力端子に入力
する。
宛先プロセッシング・エレメント・アドレス生成セクション2310のオペレー
ションは、スロット・カウント・セクション2313のオペレーションと大体同
じである。宛先プロセッシング・エレメント・アドレス生成セクション2310
では、ラッチ2343からの宛先プロセッシング・エレメント・アドレス信号(
この時点では、初期宛先プロセッシング・エレメント・アドレス値に対応するバ
イナリ・コード化値をもっている)は加算器2352の一方の入力端子に入力さ
れる。加算器2352のもう一方の入力端子には、マルチプレクサ2353がら
のSEL PE ADRS INCRFACTOR選択プロセッシング・エレメ
ント・アドレス・インクリメント・ファクタ信号が入力される。加算器2352
はさらにキャリ入力端子”cl“をもち、これはBUMP DEST ADRS
バンブ宛先アドレス信号によって制御される。加算器2352はINCPE A
DRSインクリメント・プロセッシング・エレメント・アドレス信号を生成し、
この信号はラッチ2341の入力端子に入力される。加算器2352がらのIN
CPE ADR3信号はその繰返しでインクリメントされた宛先プロセッシング
・エレメント・アドレス値を表している。
SEL PE ADRS INCRFACTOR選択プロセッシング・エレメン
ト・アドレス・インクリメント・ファクタ信号は、コンパレータ2354とマル
チプレクサ2355の制御を受けてマルチプレクサ2353がら与えられる。他
方、コンパレータ2354ハ、ラッチ2341カラ(D DEST PE AD
RS宛先プロセッシング・エレメント・アドレス信号とレジスタ2330からの
信号を受信する。コンパレータ2354は2つの出力信号を出力する。1つはR
ST IF GT大ならばリセット信号であり、もう1つはRST IF GE
大または等しければリセット信号である。コンパレータ2354は、DEST
PE ADR3信号バイナリ・コード化値がレジスタ2330からの信号のバイ
ナリ・コード化値より大であると判断すると、R3T IF GT倍信号肯定す
る。他方、コンパレータは、DEST PE ADR5信号のバイナリ・コード
化値がレジスタ233oがらの信号のバイナリ・コード化値より大か等しいと判
断すると、R5T IF GE倍信号肯定する。従って、コンパレータ2354
は、DEST PEADR3信号のバイナリ・コード化値がレジスタ233oに
ストアされた値に対応していれば、R3T IF GE倍信号肯定し、RST
IF GT倍信号否定することになる。
マルチプレクサ2355は、BUMP DEST ADRSバンブ宛先アドレス
信号の制御の下で、R3T IF GEまたはR3TIF GT倍信号1つを選
択して、RST PE ADRSリセット・プロセッシング・エレメンロト・ア
ドレス信号として制御マルチプレクサ2353に結合する。オフセット・デルタ
生成セクション2311がBUMP DEST ADR3信号を肯定すると、マ
ルチプレクサ2355はR3T IF GT大ならリセット信号を、R3T P
E ADRS リセット・プロセッシング・エレメント・アドレス信号としてマ
ルチプレクサ2353に結合する。他方、オフセット・デルタ生成セクション2
311がBUMP DEST ADRS信号を否定すると、マルチプレクサ23
55はR3T IF GE大または等しければリセット信号をR3T PE A
DR3信号として結合する。
マルチプレクサ2355は、宛先プロセッシング・エレメント・アドレス生成セ
クション2310がBUMP DESTADRSバンブ宛先アドレス信号(この
信号は加算器2352のキャリ・イン入力端子C1に結合される)を使用して宛
先プロセッシング・エレメント・アドレス値をさらにインクリメントするとき、
宛先プロセッシング・エレメント・アドレス値の許容範囲を超えて値をインクリ
メントすることがないように配慮する。BU)+!P DESTADR3が否定
され、その結果、宛先プロセッシング・エレメント・アドレス値がそれ以上イン
クリメントされないと、マルチプレクサ2355はR5T IF GT大ならリ
セット信号をR3T PE ADRSリセット・プロセッシング・エレメント・
アドレス信号として結合する。この場合、DEST PE ADRS宛先プロセ
ッシング・エレメント・アドレス信号のバイナリ・コード化値がレジスタ233
0からの信号のバイナリ・コード化値より大か等しいとコンパレータ2355が
判断すると、R3T IF GT倍信号否定される。否定されたBUMP DE
ST ADR3信号により、マルチプレクサ2355は否定されたR3T IF
GT倍信号マルチプレクサ2353に結合し、否定されたR3T IFGT信
号により、マルチプレクサ2353は、アドレス増分値を表L ティ6 SEL
PE ADRS INCFACTOR選択プロセッシング・エレメント・アド
レス・インクリメント・ファクタ信号を、加算器2352のもう一方の入力端子
に結合スル。加算器2352ハ、DEST PE ADR3信号と5ELPE
ADRS INCFACTOR信号のバイナリ・コード化値の総和を表すINC
PEADRSインクリメント・プロセッシング・エレメント・アドレス信号を生
成し、マルチブレク”j’ 2340ハコ(7) INCPE ADR3信号ヲ
ラッチ2341ノ入力端子に結合する。
しかし、BUMP DEST ADR3信号が否定されている間に、DEST
PE ADR3信号のバイナリ・コード化値がレジスタ2330からの信号のバ
イナリ・コード化値より大であるとコンパレータ2355が判断すると、R3T
PE GT倍信号肯定される。その場合は、R3T PE ADR3信号も肯
定され、マルチプレクサ2353は値”NPE”だけ減少されタアトレス増分値
に対応す6SEL PE ADR3INCFACTOR選択プロセッシング・エ
レメント・アドレス・インクリメント・ファクタ信号を、加算器2352のもう
一方の入力端子に結合する。加算器2352は、DEST DE ADR3信号
とSEL PE ADR3INCFACTOR信号のバイナリ・コード化値の総
和を表すINC: PE ADRSインクリメント・プロセッシング・エレメン
ト・アドレス信号を生成する。
マルチプレクサ2340はINCPE ADR3信号をラッチ2341の入力端
子に結合する。
他方、BUMP DEST ADR3信号が肯定されると、加算器2352は、
そのバイナリ・コード化値が、DEST PE ADR3宛先プロセッシング・
エレメント・アドレス信号とSEL PE ADR3INCFACTOR選択プ
ロセッシング・エレメント・アドレス・インクリメント・ファクタのバイナリ・
コード化値の総和に対応するINCPE ADRSインクリメント・プロセッシ
ング・エレメント・アドレス信号を生成し、この信号は、BUMP DEST
ADR3信号が肯定された以降にさらにインクリメントされている。その場合は
、加算器2352がDEST PE ADR3信号をインクリメントして宛先プ
ロセッシング・エレメント・アドレスが入出力オペレーションに参加しているプ
ロセッシング・エレメント11(i)とスカラ・プロセッサ12のアドレスを越
えないようするために、BUMP DEST ADRS信号により、マルチプレ
クサ2335はR3T IF GEより大が等しければリセット信号をR3T
PE ADR3信号として結合する。
従って、DEST PE ADR3宛先プロセッシング・エレメント・アドレス
信号のバイナリ・コード化値がレジスタ2330からの信号のバイナリ・コード
化値以下であるとコンパレータ2355が判断すると、R3T IF GE倍信
号否定される。肯定されたBUMP DEST ADR3信号により、マルチプ
レクサ2355は否定されたR3T IF GE倍信号マルチプレクサ2353
に結合し、この信号により、マルチプレクサ2353はアドレス増分値を表すS
EL PE ADR3INCFACTOR選択プロセッシング・エレメント・ア
ドレス・インクリメント・ファクタ信号を加算器2352のもう一方の入力端子
に結合する。加算器2352は、DEST PE ADR3信号とSEL PE
ADR3IN(: FACTOR信号のバイナリ・コード化値の総和を表すI
NCPE ADRSインクリメント・プロセッシング・エレメント・アドレス信
号を、そのキャリ・イン入力端子”の”に入力された肯定BUMP DEST
ADR3信号と一緒に生成し、この信号により、マルチプレクサ2340はIN
CPE ADR3信号をラッチ2341の入力端子に結合する。
しかし、BUMP DEST ADR3信号が肯定されている間に、DEST
PE ADR3信号のバイナリ・コード化値がレジスタ2330からの信号のバ
イナリ・コード化値より大か等しいとコンパレータ2355が判断すると、R3
T IF GE倍信号肯定される。その場合は、R3T PE ADRS信号も
肯定され、この信号により、マルチプレクサ2353は、値”NPE”だけ減少
されたアドレス増分値に対応するSEL PE ADR3INCFACTOR選
択プロセッシング・エレメント・アドレス・インクリメント・ファクタ信号を加
算器2352の第2入力端子に結合する。加算器2352は、DEST PE
ADR5信号とSEL PE ADR3INCFACTOR信号のバイナリ・コ
ード化値の総和を表すINCPE ADRSインクリメント・プロセッシング・
エレメント・アドレス信号を、そのキャリ・イン入力端子”C2”に現れたBU
MPDEST ADRS信号と一緒に生成する。マルチプレクサ2340はIN
CPE ADR3信号をラッチ2341の入力端子に結合する。
第4B図に示すように、スロット・カウント・セクション2313では、LAT
5LOT INDEXラッチ・スロット指標信号(この時点では、ラッチ23
47からの初期スロット指標値に対応するバイナリ・コード化値をもっている)
は加算器2360の一方の入力端子に入力される。加算器2360のもう一方の
入力端子には、マルチプレクサ2361からのSEL 5LOT INDEX
INCFACTOR選択スロット指標イクリメント・ファクタ信号が入力される
。加算器2360はINC5LOT INDEXインクリメント・スロット指標
信号を生成し、マルチプレクサ2346はこの信号を5LOT INDEX信号
としてラッチ2343の入力端子に結合する。SEL 5LOT INDEX
INCFACTOR選択スロット指標インクリメント・ファクタ信号はコンパレ
ータ2362の制御の下でマルチプレクサ2361から与えられる。
他方、コンパレータ2362には、ラッチ2347がらのLAT 5LOT I
NDEX信号がレジスタ2335カらの信号と一緒に入力され、これを受けて、
BUMP 0FFSET BASEバンブ・オフセット・ベース信号が生成され
る。コンパレータ2362は、LATスロット指榎信号のバイナリ・コード化値
がレジスタ2335からの信号で表された値以下であると判断すると、BUMP
0FFSET BASE信号を否定する。そのようなことが起こると、LAT
5LOT INDEX信号は、加算器2360によってレジスタ2327のス
ロット増分値だけイクリメントされていれば、スロット指標値の許容範囲内のま
まになっている。従って否定されたBUMP 0FFSET BASE信号によ
り、マルチプレクサ2361はレジスタ2327からの信号をSEL 5LOT
INDEXINCFACTOR選択スロット指標インクリメント・ファクタ信
号として加算器2360に結合する。加算器はlNC3LOT INDEXイン
クリメント・スロット指標信号を生成し、マルチプレクサ2346はこの信号を
5LOT INDEX信号としてラッチ2347の入力端子に結合する。
他方、コンパレータ2362は、LAT 0FFSET DELTA信号のバイ
ナリ・コード化値がレジスタ2335がらの信号で表された値より大が等しいと
判断すると、BUMP 5LOTINDEX信号を肯定する。そのようなことが
起こると、LAT 5LOT INDEX信号のバイナリ・コード化値は、加算
器2360によってレジスタ2327のインクリメント・スロット指標値だけイ
クリメントされていれば、スロット指標値の許容範囲を超えていることになる。
従って、肯定されたBUMP 0FFSET BASE信号ニよす、マルーj−
プレクサ2361はレジスタ2336がらの信号をSEL 5LOTINDEX
INCFACTOR選択スロット指標インクリメント・ファクタ信号として加
算器236oに結合する。上述したように、レジスタ2336からの信号のバイ
ナリ・コード化値は、フレーム内のスロット数だけ減少されたスロット増分値に
対応しているので、加算器236oがlNC3LOT INDEXインクリメン
ト・スロット指標信号を生成するとき、INCスロット信号のバイナリ・コード
化値は許容範囲内にある。マルチプレクサ2346はlNC3LOT INDE
X信号を5LOT INDEX信号としてラッチ2347(7)入力端子に結合
する。
オフセット・ベース生成セクション2312では、ラッチ2345からノLAT
0FFSET BASEラッチ・オフセット・ベース信号(この時点では、初
期オフセット・ベース値に対応するバイナリ・コード化値をもっている)は加算
器2363の一方の入力端子に入力される。加算器2363の他方の入力端子に
は、マルチプレクサ2364がらノsEL OFF BASE INCFACT
OR選択オフセット・ベース・インクリメント・ファクタ信号が入力される。加
算器2363はINCOFF BASEインクリメント・オフセット・ベース信
号を生成し、マルチプレクサ2344はこの信号をオフセットベース信号として
ラッチ2345の入力端と加算器2314の一方の入力端子に結合する。上述し
t、:、 ヨウニ、加IE器2314ハoFFSET BASE + DELT
A 、t 7セツト・ベース・プラス・デルタ信号を生成し、そのバイナリ・コ
ード化値は0FFSET BASE信号と0FFSETDELTA信号のバイナ
リ・コード化値に対応しており、この信号はラッチ2315の入力端子に結合さ
れる。
SEL OFF BASE INCFACOTR選択オフセット・ベース・イン
クリメント・ファクタ信号は、コンパレータ2362から(7)BUMP 0F
FSET BASE信号の制御の下テマルチブレクサ2364によって与えられ
る。上述したように、コンパレータ2362は、LATスロット指標信号のバイ
ナリ・コード化値がレジスタ2335からの信号で表された値以下であると判断
すると、BUMP 0FFSET BASE信号を否定する。そのようなことが
起こると、 LAT 5LOTINDEX信号のバイナリ・コード化値は、加算
器236oによってレジスタ2327のスロット増分値だけインクリメントされ
ていれば、スロット指標値の許容範囲内のままになっている。その場合は、否定
されたBUMPOFFSET BASE信号により、マルチプレクサ2364は
、オフセット・ベース増分値を表しているレジスタ2325がらの信号を、SE
L OFF BASE INCFACTOR選択オフセット・ベース・インクリ
メント・ファクタ信号として加算器2363 ニ結合する。加算器2363はI
NCOFF BASEインクリメント・オフセット・ベース信号を生成し、マル
チプレクサ2346はこの信号を叶FSET BASE信号としてラッチ234
7と加算器2314の入力端子に結合する。
他方、コンパレータ2362は、LAT 0FFSET DELTA信号のバイ
ナリ・コード化値がレジスタ2335からの信号で表された値より大か等しいと
判断すると、BUMP 5LOTINDEX信号を肯定する。そのようなことが
起こると、LAT 5LOT INDEX信号のバイナリ・コード化値は、加算
器2363によってレジスタ2327のインクリメント・スロット指標値だけイ
ンクリメントされていれば、スロット指標値の許容範囲を超えていることになる
。
従って、肯定されたBUMP 0FFSET BASE信号により、マルチプレ
クサ2364はオフセット・ベース増分値にストライビング・ファクタ”C”を
加えたものを表しているレジスタ2334からの信号をSEL OFF BAS
E INCFACTOR選択オフセット・ベース・インクリメント・ファクタ信
号として換算器2363に結合する。その場合は、加算器2363は、そのバイ
ナリ・コード化値がオフセット・ベース増分値とストライビング・ファクタ“C
”だけインクリメントされたLAT 0FFSET BASE信号のバイナリ・
コード化値に対応しているINCOFF BASEインクリメント・オフセット
・ベース信号を生成する。
上述したように、並列送信アドレス/オフセット・ジェネレータ2278(i)
の各種セクション間2312.2313は上述したオペレーションを繰り返して
実行して、入出力メツセージ・パケット223oを生成するときに使用されるD
EST PE ADR3宛先プロセッシング・エレメント・アドレス信号とDE
ST 0FFSET宛先オフセット信号を生成する。各繰返し時には、人出カバ
ッファ2201 (i)から送信される人出カメラセージ・パケット2230は
、そのバッファ・メモリ2223(i)からの1つのデータ項目PE(x) M
sa(y)を含んでいる。人出カバッファ2201 (i)がデータ項目PE(
x) MSG(y)をすべて送信すると、入出力オペレーションを終わらせるこ
とができる。
以上の説明から理解されるように、上述した並列送信アドレス/オフセット・ジ
ェネレータ227g(i)は種々態様に変更することが可能である。例えば、セ
クション2310.2311.2312.2314別に別々の加算器およびコン
パレータを用意する代わりに、並列送信アドレス/オフセット・ジェネレータに
単一の加算器とコンパレータを設けて、これらのセクション間で共用させること
が可能である。そのような実施例では、加算器とコンパレータは別々のフェーズ
で使用され、各フェーズ期間に、宛先プロセッシング・エレメント・アドレス値
、オフセット・デルタ値、オフセット・ベース値およびスロット指標値を表す信
号が生成されることになる。その場合は、加算器とコンパレータは、宛先プロセ
ッシング・エレメント・アドレス値の前にオフセット・デルタ値を生成するため
に使用されることになる。宛先プロセッシング・エレメント・アドレス値を生成
するにはBUMP DEST ADRS信号が必要になるためである。さらに、
加算器とコンパレータは、宛先ベース値の前にスロット指標値を生成するために
使用される。オフセット・ベース値を生成するには、BUMP 0FFSET
BASE信号が必要になるためである。このような実施例は、並列送信アドレス
/オフセット・ジェネレータ227g (i)を構成する回路の物理的サイズを
縮小化する上で有用であるが、宛先プロセッシング・エレメント・アドレス値と
宛先オフセット値は、4フエーズ・シーケンスで判断されるので、その生成には
もっと時間がかかることはもちろんである。
さらに、以上の説明から理解されるように、宛先プロセッシング・エレメント・
アドレス値と宛先オフセット値は、適当にプログラムしたマイクロプロセッサを
用いて判断することも可能である。
本発明の特定の実施例に限定して説明してきたが、本発明を種々態様に変更およ
び改良することにより、本発明の利点の一部または全部を達成することが可能で
ある。従って、これらの変更および改良はすべて本発明の範囲に属するものであ
る。
入出力
メソセーノパケット2230
FIO,2
フロントページの続き
(72)発明者 イスマン、マーシャルアメリカ合衆国 02158 マサチュ
ーセッツ州 ニュートン ヴアリー スプリングロード 11
Claims (39)
- 1.ルーチング・ネットワークによって相互結合された複数のプロセッシング・ エレメントと入出力プロセッサを備えたコンピュータであって、A.前記ルーチ ング・ネットワークは前記プロセッシング・エレメントと前記入出力プロセッサ との間でメッセージを転送し、 B.該プロセッシング・エレメントは該ルーチン・ネットワーク経由でメッセー ジに入れて該入出力プロセッサ・エレメントから送られてきたデータに対して処 理オペレーションを実行し、処理したデータをメッセージに入れて該ルーチン・ ネットワーク経由で該入出力プロセッサヘ転送し、該プロセッシング・エレメン トは第1の選択された一連のリーフ・ノードとして結合されており、C.該入出 力プロセッサは該ルーチン・ネットワークの第2の選択された一連のリーフ・ノ ードとして結合されて、入出力オペレーションが行われているとき、プロセッシ ング・エレメントの少なくとも選択されたサブセットを構成する一連のプロセシ ング・エレメントヘ該ルーチン・ネットワーク経由で転送するためのメッセージ を生成するための複数の入出力バッファを有する ことを特徴とするコンピュータ。
- 2.前記入出力プロセッサはさらに、 入出力オペレーションが行われているときに、プロセッシング・エレメントの少 なくとも選択されたサブセットを構成する一連のプロセッシング・エレメントか ら前記ルーチング・ネットワーク経由でメッセージを受信することを特徴とする 請求の範囲第1項に記載のコンピュータ。
- 3.少なくとも1つの制御プロセッサと制御ネットワークをさらに備え、 該制御プロセッサは、前記プロセッシング・エレメントを制御するために該制御 ネットワーク経由で該プロセッシング・エレメントヘ転送するための処理制御メ ッセージを生成することを特徴とする請求の範囲第1項に記載のコンピュータ。
- 4.各々が前記プロセッシング・エレメントを制御するために前記制御ネットワ ーク経由で、該プロセッシング・エレメントの少なくとも選択されたサブセット ヘ転送する処理制御メッセージを生成する複数の制御プロセッサを備え、 該制御ネットワークは、各々が少なくとも1つの制御プロセッサと該プロセッシ ング・エレメントの選択されたものとの間で処理制御メッセージを転送すること を容易化する複数の区画に分割可能であることを特徴とする請求の範囲第3項に 記載のコンピュータ。
- 5.前記制御プロセッサはさらに入出力制御メッセージを生成し、 前記入出力プロセッサはさらに、該入出力制御メッセージを受信し、該メッセー ジに応答して入出力オペレーションを実行するように前記入出力バッファを制御 する共通コントロールを有する ことを特徴とする請求の範囲第3項に記載のコンピュータ。
- 6.選択されたサブセット内の各プロセッシング・エレメントはアドレスで識別 され、入出力オペレーションが行われているとき、前記ルーチンング・ネットワ ーク経由で受信したメッセージからデータをバッファリングするプロセッシング ・エレメント受信バッファを備えており、各プロセッシング・エレメントは、メ ッセージの中で宛先オフセット値で指定された該プロセッシング・エレメント受 信バッファ内のオフセットに、メッセージで受信したデータをバッファリングし 、各人出力バッファは、 A.各々がメッセージに入ってプロセッシング・エレメントヘ送信される複数の データ項目をバッファリングするための送信バッファと、B.宛先プロセッシン グ・エレメント・アドレス値と宛先オフセット値を繰返し生成するための宛先プ ロセッシング・エレメント・アドレスおよびオフセット・ジェネレータとを有す ることを特徴とする請求の範囲第5項に記載のコンピュータ。
- 7.各人出力バッファの送信バッファは一連のソース・オフセットに複数の記憶 ロケーションを含み、各記憶ロケーションはメッセージ内で使用されたデータ項 目をストアしており、該データ項目は該入出力バッファの送信バッファ内の記憶 ロケーションの連続するフレームを定義しており、該各フレームは、最初に、同 じソース・オフセットをもつ記憶ロケーション内の連続する入出力バッファの順 に置かれ、次に、連続するソース・オフセットをもつ各人出力バッファ内の記憶 ロケーションの順に置かれて、入出力オペレーションに参加している一連のプロ セッシング・エレメントによって受信されると、それぞれのプロセッシング・エ レメント受信バッファ内の同じ宛先オフセット値にストアされるデータ項目を含 むように編成されており、宛先プロセッシング・エレメント・アドレスおよびオ フセット・ジェネレータは、入出力バッファの数と入出力オペレーションに参加 しているプロセッシング・エレメントの数に応じて、宛先エレメント・アドレス 値と宛先オフセット値を繰返し生成することを特徴とする請求の範囲第6項に記 載のコンピュータ。
- 8.宛先プロセッシング・エレメント・アドレスおよびオフセット・ジェネレー タはさらに、初期の繰返し期間には、共に、入出力バッファの数と入出力オペレ ーションに参加しているプロセッシング・エレメントの数、および入出力オペレ ーションに参加している入出力バッファ間の入出力バッファの位置に関する初期 宛先プロセッシング・エレメント・アドレス値と初期宛先オフセットを生成し、 そのあとに続く繰返し期間には、宛先プロセッシング・エレメント・アドレスお よびオフセット・ジェネレータは、初期宛先プロセッシング・エレメント・アド レス値と初期宛先オフセット値に応じて、宛先プロセッシング・エレメント・ア ドレス値と宛先オフセット値を生成することを特徴とする請求の範囲第7項に記 載のコンピュータ。
- 9.前記宛先プロセッシング・エレメント・アドレスおよびオフセット・ジェネ レータはさらに、入出力オペレーションに参加している一連のプロセッシング・ エレメント内のプロセッシング・エレメントで事前に決められた1つを示してい るペース・プロセッシング・エレメント・アドレス値に応じて、前記宛先プロセ ッシング・エレメント・アドレス値を生成することを特徴とする請求の範囲第7 項に記載のコンピュータ。
- 10.前記宛先プロセッシング・エレメント・アドレスおよびオフセット・ジェ ネレータは、 A.連続する繰返し期間に、初期宛先プロセッシング・エレメント・アドレス値 、入出力バッファの数と入出力オペレーションに参加しているプロセッシング・ エレメントの数に応じて、宛先プロセッシング・エレメント・アドレス値を生成 するための宛先プロセッシング・エレメント・アドレス値ジェネレータであって 、ある繰返し期間に生成された前記宛先プロセッシング・エレメント・アドレス 値は、そのフレームを構成するデータ項目シーケンス内でその繰返し期間にメッ セージの中で使用されるデータ項目を識別しているものと、 B.連続する繰返し期間に、初期宛先オフセット値、入出力バッファと入出力オ ペレーションに参加しているプロセッシング・エレメントの数に応じて、宛先オ フセット値を生成するための宛先オフセット値ジェネレータであって、ある繰返 し期間に生成された宛先オフセット値は、転送すべきフレーム・シーケンス内で その繰返し期間にメッセージの中で使用されるデータ項目を含んでいるフレーム を識別しているものと を有することを特徴とする請求の範囲第7項に記載のコンピュータ。
- 11.前記宛先プロセッシング・エレメント・アドレス値ジェネレータは、 A.宛先プロセッシング・エレメント・アドレス値をストアするための宛先プロ セッシング・エレメント・アドレス値ストアと、 B.アドレス増分値をストアするためのアドレス増分値ストアと、 C.各繰返し期間に、前記宛先プロセッシング・エレメント・アドレス値ストア にストアされた宛先プロセッシング・エレメント・アドレス値とアドレス増分値 に応じて、インクリメントされた宛先プロセッシング・エレメント・アドレス値 を生成するための宛先アドレス値インクリメント回路であって、インクリメント された宛先プロセッシング・エレメント・アドレス値は次の繰返し期間に使用す るための宛先プロセッシング・エレメント・アドレス値として宛先プロセッシン グ・エレメント・アドレス値ストアにストアされるものと を有することを特徴とする請求の範囲第10項に記載のコンピュータ。
- 12.アドレス増分値ストアにストアされるアドレス増分値は、入出力オペレー ションに参加しているプロセッシング・エレメントの数と入出力バッファの数に 関するものであることを特徴とする請求の範囲第11項に記載のコンピュータ。
- 13.前記宛先プロセッシング・エレメント・アドレス値ジェネレータは、さら に、 共に、入出力バッファの数、入出力オペレーションに参加しているプロセッシン グ・エレメントの数、および入出力オペレーションに参加している入出力バッフ ァ間の入出力バッファの位置に関する初期宛先オフセット値を、宛先プロセッシ ング・エレメント・アドレス値にストアすることを可能にする宛先アドレス初期 設定回路を有することを特徴とする請求の範囲第11項に記載のコンピュータ。
- 14.前記宛先アドレス値イクリメント回路は、さらに、 インクリメントされる宛先プロセッシング・エレメント・アドレス値を、入出力 オペレーションに参加しているプロセッシング・エレメントのアドレス値に対応 するアドレス値範囲に制限するための宛先プロセッシング・エレメント・アドレ ス値範囲制限回路を有することを特徴とする請求の範囲第11項に記載のコンピ ュータ。
- 15.A.前記宛先プロセッシング・エレメント・アドレス値インクリメント回 路は、さらに、i.アドレス値範囲の上限に関する制限値をストアするための宛 先プロセッシング・エレメント・アドレス値範囲制限ストアと、 ii.アドレス・リセット値をストアするためのアドレス・リセット・ストアと を有し、 B.前記宛先プロセッシング・エレメント・アドレス値範囲制限回路は、 i.前記アドレス・インクリメント値ストアからのアドレス増分値または前記ア ドレス・リセット・ストアからのアドレス・リセット値を、選択制御信号に応答 して前記宛先アドレス値インクリメント回路に選択的に結合するためのセレクタ 回路と、 ii.前記宛先プロセッシング・エレメント・アドレス値ストアからの宛先プロ セッシング・エレメント・アドレス値および前記宛先プロセッシング・エレメン ト・アドレス値範囲制限ストアからの制限値に応答して前記選択制御信号を生成 するためのコンパレータであって、アドレス・リセット値と制限値は、前記宛先 アドレス値インクリメント回路によって生成された宛先プロセッシング・エレメ ント・アドレス値が前記アドレス値範囲内収まるように選択されるものとを有す る ことを特徴とする請求の範囲第14項に記載のコンピュータ。
- 16.前記宛先オフセット値ジェネレータは、A.オフセット増分値をストアす るためのオフセット増分値ストアと、 B.オフセット増分値をストアするためのオフセット増分値ストアと、 C.各繰返し期間に、前記宛先オフセット値ストアにストアされた宛先オフセッ ト値とオフセット増分値に応答して、インクリメントされた宛先オフセット値を 生成するための宛先オフセット値インクリメント回路であって、インクリメント された宛先オフセット値は、次の繰返し期間に使用するための宛先オフセット値 として宛先プロセッシング・エレメント・オフセット値ストアにストアされるも のと を有することを特徴とする請求の範囲第10項に記載のコンピュータ。
- 17.オフセット増分値ストアにストアされたオフセット増分値は、入出力オペ レーションに参加しているプロセッシング・エレメントの数と入出力バッファの 数に関係することを特徴とする請求の範囲第16項に記載のコンピュータ。
- 18.前記宛先オフセット値ジェネレータは、さらに、 宛先オフセット値ストアが、入出力オペレーションに参加しているプロセッシン グ・エレメントの数と入出力オペレーションに参加している入出力バッファ間の 入出力バッファの位置に関する初期宛先オフセット値をストアすることを可能に する宛先オフセット初期設定回路を含むことを特徴とする請求の範囲第16項に 記載のコンピュータ。
- 19.各フレームは、さらに一連のストライプを含むものと定義され、一連のス トライプは入出力オペレーションに参加している一連のプロセッシング・エレメ ントによって各々が受信されるデータ項目を含み、各ストライプは入出力オペレ ーションに参加している一連のプロセッシング・エレメントによって受信されて 、それぞれのプロセッシング・エレメント受信バッファ内に連続する宛先オフセ ット値でストアされる事前に決められた数のデータ項目を含み、前記宛先プロセ ッシング・エレメント・アドレス値ジェネレータは、さらに、各ストライプ内の データ項目の数に応じて、前記宛先プロセッシング・エレメント・アドレス値と 宛先オフセット値を生成することを特徴とする請求の範囲第7項に記載のコンピ ュータ。
- 20.宛先プロセッシング・エレメント・アドレスおよびオフセット・ジェネレ ータは、さらに、初期繰返し期間に、共に、入出力バッファの数、入出力オペレ ーションに参加しているプロセッシング・エレメントの数、入出力オペレーショ ンに参加している入出力バッファ間の入出力バッファの位置、および各ストライ プ内のデータ項目の数に関係する初期宛先プロセッシング・エレメント・アドレ ス値と初期宛先オフセット値を生成し、 宛先プロセッシング・エレメント・アドレスおよびオフセット・ジェネレータは 、そのあとに続く繰返し期間に、初期宛先プロセッシング・エレメント・アドレ ス値と初期宛先オフセット値に応答して宛先プロセッシング・エレメント・アド レス値と宛先オフセット値を生成する ことを特徴とする請求の範囲第19項に記載のコンピュータ。
- 21.前記宛先プロセッシング・エレメント・アドレスおよびオフセット・ジェ ネレータは、さらに、入出力オペレーションに参加している一連のプロセッシン グ・エレメント内のプロセッシング・エレメントの事前に決められた1つを識別 するベース・プロセッシング・エレメント・アドレス値に応答して前記宛先プロ セッシング・エレメント・アドレス値を生成することを特徴とする請求の範囲第 19項に記載のコンピュータ。
- 22.前記宛先プロセッシング・エレメント・アドレスおよびオフセット・ジェ ネレータは、 A.連続する繰返し期間に、初期宛先オフセット値、入出力バッファの数、入出 力オペレーションに参加するプロセッシング・エレメントの数、およびストライ プ内のデータ項目の数に応答して宛先オフセット値を生成するための宛先オフセ ット値ジェネレータであって、各繰返し期間の前記宛先宛先オフセット値はフレ ームと、そのストライプを構成するデータ項目シーケンス内でその繰返し期間に メッセージに入って使用されるデータ項目の位置とを示しており、宛先オフセッ ト値ジェネレータはさらに、選択された条件をもつ宛先アドレス制御信号を生成 するものと、 B.連続する繰返し期間に、初期宛先プロセッシング・エレメント・アドレス値 、入出力バッファの数、入出力オペレーションに参加しているプロセッシング・ エレメントの数、および宛先アドレス制御信号の条件に応答して宛先プロセッシ ング・エレメント・アドレス値を生成するための宛先プロセッシング・アドレス 値ジェネレータであって、各繰返し期間の宛先プロセッシング・エレメント・ア ドレス値は、フレームを構成するストライプ・シーケンス内でその繰返し期間に メッセージに入って使用されるデータ項目を収めているストライプを示している ものと を有することを特徴とする請求の範囲第19項に記載のコンピュータ。
- 23.前記宛先プロセッシング・エレメント・アドレス値ジェネレータは、 A.宛先プロセッシング・エレメント・アドレス値をストアするための宛先プロ セッシング・エレメント・アドレス値ストアと、 B.アドレス増分値をストアするためのアドレス増分値ストアと、 C.各繰返し期間に、前記宛先プロセッシング・エレメント・アドレス値ストア にストアされた宛先プロセッシング・エレメント・アドレス値、アドレス増分値 、および宛先アドレス制御信号の条件に応答して、インクリメントされた宛先プ ロセッシング・エレメント・アドレス値を生成するための宛先アドレス値インク リメント回路であって、インクリメントされた宛先プロセッシング・エレメント ・アドレス値は宛先プロセッシング・エレメント・アドレス値として宛先プロセ ッシング・エレメント・アドレス値ストアにストアされるものと を有することを特徴とする請求の範囲第22項に記載のコンピュータ。
- 24.アドレス増分値ストアにストアされたアドレス増分値は、入出力オペレー ションに参加しているプロセッシング・エレメントの数と入出力バッファの数に 関係するものであることを特徴とする請求の範囲第23項に記載のコンピュータ 。
- 25.前記宛先プロセッシング・エレメント・アドレス値ジェネレータは、さら に、 宛先プロセッシング・エレメント・アドレス値ストアが、共に、入出力バッファ の数、入出力オペレーションに参加しているプロセッシング・エレメント数、お よび入出力オペレーションに参加している入出力バッファ間の入出力バッファの 位置、およびストライプ内のデータ項目の数に関係する初期宛先オフセット値を ストアすることを可能にする宛先初期設定回路を含むことを特徴とする請求の範 囲第23項に記載のコンピュータ。
- 26.前記宛先アドレス値インクリメント回路は、さらに、 インクリメントされる宛先プロセッシング・エレメント・アドレス値を、入出力 オペレーションに参加しているプロセッシング・エレメントのアドレス値に対応 するアドレス値範囲に制限するための宛先プロセッシング・エレメント・アドレ ス値制限回路を有することを特徴とする請求の範囲第23項に記載のコンピュー タ。
- 27.A.前記宛先プロセッシング・エレメント・アドレス値インクリメント回 路は、さらに、i.アドレス値範囲の上限に関する制限値をストアするための宛 先プロセッシング・エレメント・アドレス値範囲制限ストアと、 ii.アドレス・リセット値をストアするためのアドレス・リセット・ストアと を有し、 B.前記宛先プロセッシング・エレメント・アドレス値範囲制限回路は、 i.前記アドレス・インクリメント値ストアからのアドレス増分値または前記ア ドレス・リセット・ストアからのアドレス・リセット値を、選択制御信号に応答 して前記宛先アドレス値インクリメント回路に選択的に結合するためのセレクタ 回路と、 ii.前記宛先プロセッシング・エレメント・アドレス値ストアからの宛先プロ セッシング・エレメント・アドレス値および前記宛先プロセッシング・エレメン ト・アドレス値範囲制限ストアからの制限値に応答して前記選択制御信号を生成 するためのコンパレータであって、アドレス・リセット値と制限値は、前記宛先 アドレス値インクリメント回路によって生成された宛先プロセッシング・エレメ ント・アドレス値が前記アドレス値範囲内収まるように選択されるものとを有す る ことを特徴とする請求の範囲第26項に記載のコンピュータ。
- 28.前記宛先オフセット値ジェネレータは、A.各繰返し期間に宛先ベース・ オフセット値を生成するための宛先オフセット・ベース値ジェネレータであって 、該宛先ペース・オフセット値はその繰返し期間にメッセージに入って使用され るデータ項目を含んでいるフレームを識別しているものと、 B.各繰返し期間に宛先デルタ・オフセット値を生成するための宛先オフセット ・デルタ・ジェネレータであって、宛先デルタ・オフセット値はそのストライプ を構成するデータ項目シーケンス内でその繰返し期間にメッセージに入って使用 されるデータ項目の位置を識別しているものと、C.前記宛先ペース・オフセッ ト値と前記宛先デルタ・オフセット値に応答して前記宛先オフセット値を生成す るための宛先オフセット結合値ジェネレータと を有することを特徴とする請求の範囲第22項に記載のコンピュータ。
- 29.前記宛先オフセット・ベース値ジェネレータは、A.宛先オフセット結合 値ジェネレータによって使用される宛先ベース・オフセット値をストアするため の宛先ペース・オフセット値ストアと、B.各繰返し期間に、前記宛先ベース・ オフセット値ストアにストアされた宛先ベース・オフセット値とベース・オフセ ット増分値に応答して、インクリメントされた宛先ベース・オフセット値を生成 するための宛先ベース・オフセット値インクリメント回路であって、インクリメ ントされた宛先ベース・オフセット値は次の繰返し期間に使用するための宛先オ フセット・ベース値として宛先ベース・オフセット値ストアにストアされるもの と、 C.ベース・オフセット増分値を得るためのベース・オフセット増分値回路であ って、 i.ベース増分値をストアするためのベース・オフセット・ベース増分値ストア と、 ii.ベース増分値とストライプ内のデータ項目の数を反映している拡張増分値 をストアするためのベース・オフセット拡張増分値ストアと、iii.スロット 信号に応答して、ベース増分値または拡張増分値のどちらかをベース・オフセッ ト増分値として選択的に結合するためのベース・オフセット増分値セレクタとを 含むものと、D.フレーム内のデータ項目シーケンス内で繰返し期間にメッセー ジに入って送信されるデータ項目の最新のカウントをとって、最新のカウントと フレーム内のデータ項目の数に応答してスロット・カウント信号を生成するため のスロット・カウント回路と を有することを特徴とする請求の範囲第28項に記載のコンピュータ。
- 30.前記宛先ベース・オフセット値ジェネレータは、さらに、 宛先ベース・オフセット値ストアが、入出力オペレーションに参加しているプロ セッシング・エレメントの数、入出力オペレーションに参加している入出力バッ ファ間の入出力バッファの位置、およびストライプ内のデータ項目の数に関する 初期宛先ベース・オフセット値をストアすることを可能にする宛先ベース・オフ セット初期設定回路を有することを特徴とする請求の範囲第29項に記載のコン ピュータ。
- 31.前記スロット・カウント回路は、A.スロット・カウント値をストアする ためのスロット・カウント・ストアと、 B.スロット・カウント増分値をストアするためのスロット・カウント増分値ス トアと、 C.各繰返し期間に、前記スロット・カウント・ストアにストアされたスロット ・カウント値とスロット・カウント増分値に応答して、インクリメントされたス ロット・カウント値を生成するためのスロット・カウント・インクリメント回路 であって、インクリメントされたスロット・カウント値は、次の繰返し期間に使 用されるスロット・カウント値としてスロット・カウント・ストアにストアされ るものと を有することを特徴とする請求の範囲第29項に記載のコンピュータ。
- 32.スロット・カウント増分値ストアにストアされたスロット・インクリメン ト値は、入出力オペレーションに参加するプロセッシング・エレメントの数と入 出力バッファの数およびストライプ内のデータ項目の数に関するものであること を特徴とする請求の範囲第31項に記載のコンピュータ。
- 33.前記スロット・カウント回路は、さらに、スロット・カウント・ストアが 、入出力オペレーションに参加しているプロセッシング・エレメントの数、入出 力オペレーションに参加している入出力バッファ間の入出力バッファの位置と、 ストライプ内のデータ項目の数に関する初期スロット・カウント値をストアする ことを可能にするスロット初期設定回路と を有することを特徴とする請求の範囲第31項に記載のコンピュータ。
- 34.前記スロット・カウント回路は、さらに、インクリメントされるスロット ・カウント値をフレーム内のデータ項目数に対応するスロット・カウント値範囲 に制限するためのスロット・カウント値範囲制限回路を有することを特徴とする 請求の範囲第31項に記載のコンピュータ。
- 35.前記宛先オフセット・デルタ・ジェネレータは、A.宛先オフセット結合 値ジェネレータによって使用される宛先デルタ・オフセット値をストアするため の宛先デルタ・オフセット値ストアと、B.各繰返し期間に、前記宛先デルタ・ オフセット値ストアにストアされた宛先デルタ・オフセット値およびデルタ・オ フセット増分値に応答して、インクリメントされた宛先デルタ・オフセット値を 生成するための宛先デルタ・オフセット値インクリメント回路であって、インク リメントされた宛先デルタ・オフセット値は次の繰返し期間に使用するための宛 先デルタ・オフセット値として宛先デルタ・オフセット値ストアにストアされる ものと、 C.ベース・オフセット増分値を得るためのデルタ・オフセット増分値回路であ って、 i.デルタ増分値をストアするためのデルタ・オフセット・ベース増分値ストア と、 ii.デルタ増分値とストライプ内のデータ項目の数を反映している減少された デルタ増分値をストアするためのデルタ・オフセット減少増分値ストアと、 iii.宛先デルタ・オフセット値とストライプ内のデータ項目の数に応答して 、デルタ増分値または減少デルタ増分値の1つをベース・オフセット増分値とし て選択的結合するためのデルタ・オフセット増分値セレクタとを含むものとを有 することを特徴とする請求の範囲第28項に記載のコンピュータ。
- 36.前記宛先デルタ・オフセット値ジェネレータは、さらに、 宛先デルタ・オフセット値ストアが、入出力オペレーションに参加している入出 力バッファ間の入出力バッファの位置とストライプ内のデータ項目の数に関する 初期宛先デルタ・オフセット値をストアすることを可能にする宛先デルタ・オフ セット初期設定回路を有することを特徴とする請求の範囲第35項に記載のコン ピュータ。
- 37.前記宛先デルタ・オフセット値ジェネレータは、さらに、 前記宛先アドレス制御信号を生成し、インクリメントされるデルタ・オフセット 値をストライプ内のデータ項目数に対応するデルタ・オフセット値範囲に限定す るための宛先デルタ・オフセット値範囲制限回路を有することを特徴とする請求 の範囲第35項に記載のコンピュータ。
- 38.A.データ・メッセージに入って受信したデータに関して処理されたデー タを生成するために処理制御メッセージに従って処理オペレーションを実行し、 該処理されたデータを収めているデータ・メッセージを生成するための複数のプ ロセッシング・エレメントと、 B.前記プロセッシング・エレメントによる処理を制御するための前記処理制御 メッセージを生成し、入出力制御メッセージを生成するための複数の制御プロセ ッサと、 C.前記制御プロセッサからの入出力制御メッセージに応答して、前記プロセッ シング・エレメントの少なくとも選択されたサブセットとの間でデータ・メッセ ージに入れてデータを転送するために入出力オペレーションを開始するための入 出力プロセッサと、 D.前記プロセッシング・エレメントと前記入出力プロセッサとの間でデータ・ メッセージを転送し、前記制御プロセッサと該入出力プロセッサとの間で入出力 制御メッセージを転送するためのルーチング・ネットワークと、 E.前記制御プロセッサと前記プロセッシング・エレメントとの間で前記処理制 御メッセージを転送するための制御ネットワークであって、各々が少なくとも1 つの制御プロセッサと該プロセッシング・エレメントの選択されたものとの間で 処理制御メッセージを転送することを容易にする複数の区画に分割可能であるも のと を備えたことを特徴とするコンピュータ。
- 39.前記ルーチング・ネットワークの一連のリーフ・ノードに結合されて、該 ルーチング・ネットワークの第2の一連のノードの1つに各々結合され、入出力 オペレーション期間にアドレスによって識別される複数のデータ受信側ヘ、該ル ーチン・ネットワーク経由で転送するメッセージを生成する複数の入出力バッフ ァを含む入出力プロセッサであって、 各人出力バッファは、 A.各々がメッセージ中のデータ受信側へメッセージに入れて送信される複数の データ項目をバッファリングするための送信バッファと、B.入出力オペレーシ ョンに参加している入出力バッファの数とデータ受信側の数に応答して宛先デー タ受信側アドレス値と宛先オフセット値を繰返し生成するための宛先データ受信 側アドレスおよびオフセット・ジェネレータと を有することを特徴とする入出力プロセッサ。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US746,038 | 1991-08-16 | ||
US07/746,038 US5361363A (en) | 1990-10-03 | 1991-08-16 | Input/output system for parallel computer for performing parallel file transfers between selected number of input/output devices and another selected number of processing nodes |
PCT/US1992/006848 WO1993004438A1 (en) | 1991-08-16 | 1992-08-13 | Input/output arrangement for massively parallel computer system |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH06509894A true JPH06509894A (ja) | 1994-11-02 |
Family
ID=24999241
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5504468A Pending JPH06509894A (ja) | 1991-08-16 | 1992-08-13 | 超並列コンピュータ・システムの入出力構成 |
Country Status (7)
Country | Link |
---|---|
US (1) | US5361363A (ja) |
EP (1) | EP0601029B1 (ja) |
JP (1) | JPH06509894A (ja) |
AU (1) | AU674832B2 (ja) |
CA (1) | CA2115738A1 (ja) |
DE (1) | DE69231497T2 (ja) |
WO (1) | WO1993004438A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009301101A (ja) * | 2008-06-10 | 2009-12-24 | Nec Corp | プロセッサ間通信システム、プロセッサ、プロセッサ間通信方法、および、通信方法 |
WO2012101833A1 (ja) * | 2011-01-30 | 2012-08-02 | 富士通株式会社 | 演算装置および演算方法 |
Families Citing this family (56)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2770603B2 (ja) * | 1991-03-14 | 1998-07-02 | 三菱電機株式会社 | 並列計算機 |
JPH06208460A (ja) * | 1993-01-11 | 1994-07-26 | Hitachi Ltd | マイクロプログラムメモリ制御方式 |
US5987622A (en) * | 1993-12-10 | 1999-11-16 | Tm Patents, Lp | Parallel computer system including parallel storage subsystem including facility for correction of data in the event of failure of a storage device in parallel storage subsystem |
US5590356A (en) * | 1994-08-23 | 1996-12-31 | Massachusetts Institute Of Technology | Mesh parallel computer architecture apparatus and associated methods |
US5781551A (en) * | 1994-09-15 | 1998-07-14 | Texas Instruments Incorporated | Computer communications system with tree architecture and communications method |
US5587997A (en) * | 1995-02-24 | 1996-12-24 | Hewlett-Packard Company | Method and apparatus for determining when all packets of a message have arrived |
US5745915A (en) * | 1995-03-17 | 1998-04-28 | Unisys Corporation | System for parallel reading and processing of a file |
DE19626287A1 (de) * | 1996-07-01 | 1997-02-13 | Abb Management Ag | Verfahren zum Betrieb eines Antriebssystems und Vorrichtung zur Durchführung des Verfahrens |
JPH10124366A (ja) * | 1996-10-18 | 1998-05-15 | Nec Corp | ファイルデータ格納機構の並列管理方式 |
US5915088A (en) * | 1996-12-05 | 1999-06-22 | Tandem Computers Incorporated | Interprocessor messaging system |
KR100207598B1 (ko) * | 1997-01-27 | 1999-07-15 | 윤종용 | 상호연결망으로서 파이브 채널을 사용한 클러스터시스템 |
US6266732B1 (en) * | 1998-05-29 | 2001-07-24 | 3Com Corporation | Interrupt events chaining |
US6356548B1 (en) | 1998-06-29 | 2002-03-12 | Cisco Technology, Inc. | Pooled receive and transmit queues to access a shared bus in a multi-port switch asic |
US6513108B1 (en) | 1998-06-29 | 2003-01-28 | Cisco Technology, Inc. | Programmable processing engine for efficiently processing transient data |
US6101599A (en) * | 1998-06-29 | 2000-08-08 | Cisco Technology, Inc. | System for context switching between processing elements in a pipeline of processing elements |
US6119215A (en) * | 1998-06-29 | 2000-09-12 | Cisco Technology, Inc. | Synchronization and control system for an arrayed processing engine |
US6195739B1 (en) | 1998-06-29 | 2001-02-27 | Cisco Technology, Inc. | Method and apparatus for passing data among processor complex stages of a pipelined processing engine |
US6836838B1 (en) | 1998-06-29 | 2004-12-28 | Cisco Technology, Inc. | Architecture for a processor complex of an arrayed pipelined processing engine |
US6728839B1 (en) | 1998-10-28 | 2004-04-27 | Cisco Technology, Inc. | Attribute based memory pre-fetching technique |
US6385747B1 (en) | 1998-12-14 | 2002-05-07 | Cisco Technology, Inc. | Testing of replicated components of electronic device |
US6173386B1 (en) | 1998-12-14 | 2001-01-09 | Cisco Technology, Inc. | Parallel processor with debug capability |
US6920562B1 (en) | 1998-12-18 | 2005-07-19 | Cisco Technology, Inc. | Tightly coupled software protocol decode with hardware data encryption |
US6618371B1 (en) | 1999-06-08 | 2003-09-09 | Cisco Technology, Inc. | Butterfly network with switches set for two node disjoint paths and method for forming the paths |
US6529983B1 (en) | 1999-11-03 | 2003-03-04 | Cisco Technology, Inc. | Group and virtual locking mechanism for inter processor synchronization |
US6681341B1 (en) | 1999-11-03 | 2004-01-20 | Cisco Technology, Inc. | Processor isolation method for integrated multi-processor systems |
US7266490B2 (en) * | 2000-12-28 | 2007-09-04 | Robert Marc Zeidman | Apparatus and method for connecting hardware to a circuit simulation |
US6892237B1 (en) | 2000-03-28 | 2005-05-10 | Cisco Technology, Inc. | Method and apparatus for high-speed parsing of network messages |
US8160863B2 (en) * | 2000-03-28 | 2012-04-17 | Ionipas Transfer Company, Llc | System and method for connecting a logic circuit simulation to a network |
US7849415B1 (en) * | 2000-04-20 | 2010-12-07 | Nokia Corporation | Communication terminal |
US6505269B1 (en) | 2000-05-16 | 2003-01-07 | Cisco Technology, Inc. | Dynamic addressing mapping to eliminate memory resource contention in a symmetric multiprocessor system |
US6967950B2 (en) * | 2000-08-11 | 2005-11-22 | Texas Instruments Incorporated | Pull transfers and transfer receipt confirmation in a datapipe routing bridge |
US6732253B1 (en) | 2000-11-13 | 2004-05-04 | Chipwrights Design, Inc. | Loop handling for single instruction multiple datapath processor architectures |
US6931518B1 (en) | 2000-11-28 | 2005-08-16 | Chipwrights Design, Inc. | Branching around conditional processing if states of all single instruction multiple datapaths are disabled and the computer program is non-deterministic |
US20070016396A9 (en) * | 2000-12-28 | 2007-01-18 | Zeidman Robert M | Apparatus and method for connecting a hardware emulator to a computer peripheral |
US7302548B1 (en) | 2002-06-18 | 2007-11-27 | Cisco Technology, Inc. | System and method for communicating in a multi-processor environment |
US7493607B2 (en) | 2002-07-09 | 2009-02-17 | Bluerisc Inc. | Statically speculative compilation and execution |
US20060001669A1 (en) * | 2002-12-02 | 2006-01-05 | Sehat Sutardja | Self-reparable semiconductor and method thereof |
US20050114850A1 (en) | 2003-10-29 | 2005-05-26 | Saurabh Chheda | Energy-focused re-compilation of executables and hardware mechanisms based on compiler-architecture interaction and compiler-inserted control |
US7996671B2 (en) | 2003-11-17 | 2011-08-09 | Bluerisc Inc. | Security of program executables and microprocessors based on compiler-architecture interaction |
US8607209B2 (en) | 2004-02-04 | 2013-12-10 | Bluerisc Inc. | Energy-focused compiler-assisted branch prediction |
EP1716685B1 (en) * | 2004-02-16 | 2007-08-15 | Telefonaktiebolaget LM Ericsson (publ) | Address management in environments based on mobile ip |
JP3835459B2 (ja) * | 2004-03-09 | 2006-10-18 | セイコーエプソン株式会社 | データ転送制御装置及び電子機器 |
US20070083574A1 (en) * | 2005-10-07 | 2007-04-12 | Oracle International Corporation | Replica database maintenance with parallel log file transfers |
CN100563203C (zh) * | 2005-11-11 | 2009-11-25 | 华为技术有限公司 | 通信网络中组播树叶子节点网元信号传送的方法 |
US20080126766A1 (en) | 2006-11-03 | 2008-05-29 | Saurabh Chheda | Securing microprocessors against information leakage and physical tampering |
JP4913685B2 (ja) * | 2007-07-04 | 2012-04-11 | 株式会社リコー | Simd型マイクロプロセッサおよびsimd型マイクロプロセッサの制御方法 |
US8755515B1 (en) | 2008-09-29 | 2014-06-17 | Wai Wu | Parallel signal processing system and method |
DE102009021136A1 (de) * | 2009-05-13 | 2010-12-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Regelvorrichtung |
JP5347772B2 (ja) * | 2009-07-01 | 2013-11-20 | 富士通株式会社 | 転送速度設定方法、データ転送装置及び情報処理システム |
US8571834B2 (en) * | 2010-01-08 | 2013-10-29 | International Business Machines Corporation | Opcode counting for performance measurement |
JP5501052B2 (ja) * | 2010-03-24 | 2014-05-21 | キヤノン株式会社 | 通信装置、通信装置の制御方法、プログラム |
US8589867B2 (en) | 2010-06-18 | 2013-11-19 | Microsoft Corporation | Compiler-generated invocation stubs for data parallel programming model |
US20110314256A1 (en) * | 2010-06-18 | 2011-12-22 | Microsoft Corporation | Data Parallel Programming Model |
US10437650B2 (en) * | 2014-06-19 | 2019-10-08 | Nec Corporation | Controlling execution of tasks in a series of operational processing by identifying processing units based on task command, task setting information, state of operational processing |
US11502934B2 (en) * | 2018-08-21 | 2022-11-15 | The George Washington Univesity | EZ-pass: an energy performance-efficient power-gating router architecture for scalable on-chip interconnect architecture |
US11314674B2 (en) | 2020-02-14 | 2022-04-26 | Google Llc | Direct memory access architecture with multi-level multi-striding |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0097351A3 (en) * | 1982-06-21 | 1986-02-26 | Nec Corporation | Router unit and routing network for determining an output port by detecting a part of an input packet |
US4598400A (en) * | 1983-05-31 | 1986-07-01 | Thinking Machines Corporation | Method and apparatus for routing message packets |
US4873626A (en) * | 1986-12-17 | 1989-10-10 | Massachusetts Institute Of Technology | Parallel processing system with processor array having memory system included in system memory |
US4910669A (en) * | 1987-04-03 | 1990-03-20 | At&T Bell Laboratories | Binary tree multiprocessor |
US5111389A (en) * | 1987-10-29 | 1992-05-05 | International Business Machines Corporation | Aperiodic mapping system using power-of-two stride access to interleaved devices |
-
1991
- 1991-08-16 US US07/746,038 patent/US5361363A/en not_active Expired - Lifetime
-
1992
- 1992-08-13 CA CA002115738A patent/CA2115738A1/en not_active Abandoned
- 1992-08-13 JP JP5504468A patent/JPH06509894A/ja active Pending
- 1992-08-13 EP EP92918507A patent/EP0601029B1/en not_active Expired - Lifetime
- 1992-08-13 WO PCT/US1992/006848 patent/WO1993004438A1/en active IP Right Grant
- 1992-08-13 DE DE69231497T patent/DE69231497T2/de not_active Expired - Fee Related
- 1992-08-13 AU AU24868/92A patent/AU674832B2/en not_active Ceased
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009301101A (ja) * | 2008-06-10 | 2009-12-24 | Nec Corp | プロセッサ間通信システム、プロセッサ、プロセッサ間通信方法、および、通信方法 |
WO2012101833A1 (ja) * | 2011-01-30 | 2012-08-02 | 富士通株式会社 | 演算装置および演算方法 |
Also Published As
Publication number | Publication date |
---|---|
US5361363A (en) | 1994-11-01 |
EP0601029A4 (en) | 1995-02-22 |
DE69231497D1 (de) | 2000-11-09 |
DE69231497T2 (de) | 2001-02-08 |
EP0601029B1 (en) | 2000-10-04 |
AU674832B2 (en) | 1997-01-16 |
WO1993004438A1 (en) | 1993-03-04 |
EP0601029A1 (en) | 1994-06-15 |
CA2115738A1 (en) | 1993-03-04 |
AU2486892A (en) | 1993-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH06509894A (ja) | 超並列コンピュータ・システムの入出力構成 | |
US5353412A (en) | Partition control circuit for separately controlling message sending of nodes of tree-shaped routing network to divide the network into a number of partitions | |
US11003604B2 (en) | Procedures for improving efficiency of an interconnect fabric on a system on chip | |
EP0829047B1 (en) | Barrier and eureka synchronization architecture for multiprocessors | |
US7650434B2 (en) | Global tree network for computing structures enabling global processing operations | |
US6047122A (en) | System for method for performing a context switch operation in a massively parallel computer system | |
CN1020972C (zh) | 超大规模计算机 | |
EP0325384B1 (en) | Data processing and communication | |
US8433816B2 (en) | Network topology for a scalable multiprocessor system | |
JPH0922404A (ja) | 同報通信プロセッサ命令を備えたアレイ・プロセッサ通信アーキテクチャ | |
US20220382707A1 (en) | Partitionable Networked Computer | |
Bolding | Chaotic routing: design and implementation of an adaptive multicomputer network router | |
US20200293478A1 (en) | Embedding Rings on a Toroid Computer Network | |
EP0199757B1 (en) | Instruction flow computer | |
EP0570952A2 (en) | Slide network for an array processor | |
WO2020193729A1 (en) | A Networked Computer | |
Heath et al. | Modeling, design, and performance analysis of a parallel hybrid data/command driven architecture system and its scalable dynamic load balancing circuit | |
CN111158636B (zh) | 可重构计算结构及计算处理阵列的路由寻址方法、装置 | |
Bronnenberg et al. | The architecture of DOOM | |
Shoemaker | An optimized hardware architecture and communication protocol for scheduled communication | |
WO1989001665A1 (en) | Hypercube topology for multiprocessor systems with added communication paths between nodes or substituted corner topologies | |
KR20220010747A (ko) | 다중 프로세서가 있는 컴퓨터에서의 통신 | |
Sridharan | A study of a reconfigurable interconnection network | |
Ashraf | Routing in multicomputer networks: A classification and comparison | |
Hall et al. | Hardware for fast global operations on multicomputers |