JPH05509184A

JPH05509184A - 並列プロセッサーアレイのための仮想処理アドレス・命令ジェネレーター

Info

Publication number: JPH05509184A
Application number: JP3510619A
Authority: JP
Inventors: ジャクソン、ジェームス、エイチ; リー、ミン―チィ
Original assignee: ウエーブトレーサー　インコーポレイテッド
Priority date: 1990-05-29
Filing date: 1991-05-14
Publication date: 1993-12-16
Also published as: EP0531431A4; EP0531431A1; WO1991019268A1; US5193202A; AU7981891A

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】６杵：並列プロセッサーアレイのための仮想処理アドレス・命令ジエネレーターヱ服り分野：本発明はコンピューターシステム、そしてより詳細には並列処理コンピューターシステムに関するものである。

及咀の背量：電場と磁場、流体の流れ５音波、熱の流れなどの自然現象の、ある与えられた時刻における状態は、３次元的、空間的に分布するデータとして、互いに直交する３つの座標軸の方向における空間的位置が指標をもって示されるところの、１つまたは１組の数によって表現される。場合によっては、さらに第４の次元として、「時間」も考慮しなければならない。これまで科学者やその他のコンビコーター・ユーザーは、ボワッノン方程式やマックスウェル方程式など、空間的に分布するデータにかかわる偏微分方程式を解こうとする場合に５十分なデータ処理能力を享受することができなかった。これは、従来技術によるプロセッサーシステムとプロセッサーアレイが、２次元構成に限定されていたことによるものである。

純粋に１次元アレイまたは２次元アレイを用いて行う、３次兄方程式を解くための従来技術による試みは、プロセッサーではなくメモリーに記憶させなければならない空間データの、第２または第３の次元への指標またはアドレスポインターを計算するために、大意の「プロセッサーオーバーヘッド」を必要とする処理システムを生み出した８たとえば伝統的なシングルプロセッサー型コンピューターの場合、Ｘ次元とＺ次元の指標を計算するには、最大で３回の乗算と２回の加算を実行しなければならない、２次元コンピューターを使った場合には、Ｘ軸とＹ軸は直接的にアクセスできるが、２ポインターはやはり計算しなければならず、そしてこの計算のために依然として最大で１回の乗算と加算が必要である。

３次元データを従来技術によって取り扱おうとする場合には、このほか、米国特許Ｎｏ、４．８１４．９７３で開示されているような相互結合配列もまた用いられる。この特許では、３次元プロセッサーアレイの挙動に似せてプロセッサーセル間でデータの切り替えを行うよう、ルータ−に命令を与えることができるようになっている。しかしながらルータ−は、データを各種プロセッサーの間で移動させるために、多量のプロセッサーオーバーヘットを必要とする。またこれに加えて、スイッチインク機能を遂行するための支援制御回路も必要である。システムスルーブツトまたは帯幅は、ルータ−オーバーヘッドによってかなり損なわれ、またシステムのコストと信顧性も、ルータ−と支援制御回路を含めなければならないために、やはり大きく損なわれる。

さらにまた、並列処理問題の多くば、プロセッサーアレイの利用可能なプロセッサーセル数を上回る数の問題ノードを必要とする。こうした状況においては、ある与えられたプロセッサーアレイに問題空間を合致させるための調整を、応用プログラマ−に行わせることは回避するのが望ましい。むしろ応用プログラマ−は５プロセツサーアレイのサイズの束縛から切り離し、問題空間のサイズのみを指定すればよいという状況にすべきである。さらにまた、プロセッサーアレイのサイズが異なる各種のプロセッサーシステム間での共用性を確保するために、プロセッサーアレイがどのようなサイズのものであっても５並列処理プログラムをランさせることが可能でなければならない。

元服の１豹：本発明は、問題空間のノード数より少ない数のプロセッサーセルを有していても差し支えない多次元プロセッサーアレイなどの並列処理アレイに、プロセッサー命令を生成するための、仮想処理アドレス・命令ジェネレーターを含む並列処理システムを提供するものである。

好ましい１つの実施例においては５上記処理システムは各プロセッサーセルのメモリーをいくつかの等しい部分に分割し、そしてこの分割された夫々に１つの問題空間を対応させる。つぎに命令ジェネレーターは、与えられた問題空間の各部分空間に対してｌ続きのプロセッサーセル命令を生じさせ、そしてこの命令シーケンスのそれぞれについて、該当するアドレス変更がアドレスジェネレーターによって与えられる。このような仕組みにより、該並列処理アレイは、プロセッサーアレイに存在するプロセッサーセル数より多い数の問題ノートを有する問題を、メモリースワツピング無しで解くことができる。

Ｘ血の説里・上記ならびに上記以外の本発明の特徴は５以下に述へる説明を添付図面を会計しつつ読み通すことにより、一層よく理解されるであろう。添付図面において、図１は、本発明にもとづく、コントロールプロセッサーと仮想処理アドレス・命令ジェネレーターを有する多次元並列処理システムとプロセッサーアレイの概要を示す。

図２は、本発明にもとづくアドレス・命令ジェネレーターの一層詳細なブロック図である。

図３は、図１に示すコントロールプロセッサーの一層詳細なブロック図である。

図４は、図２に示すオペランドアドレスジェネレーターの一層詳細なブロック図である。

図５は、本発明にもとづくマイクロコードメモリーアドレスジェネレーターと即値オペランドビットエクストラクターの一層詳細なブロック図である。

図６は、本発明にもとづく仮想処理アドレス・命令ジェネレーターのタイミング図である。

図７Ａと図７Ｂは、物理・仮想プロセッサーセルメモリーの分割を示す。

図８は、図２に示すアドレス再配置回路の一部分をなすアドレス再配置コントロールレジスターのブロック図である。

図９と図１０は、図２に示すアドレス再配置回路の追加回路にかかわる該略図である。

図１１Ａと図１１Ｂは、プロセッサー間通信命令の１例を示す、　また、図１２は５図２に示すナノ命令・テンプレートジェネレーター回路の一層詳細なブロック図である。

尺咀の１細ｌ説酉：図１は、複数のプロセッサーセルを有する、本発明にもとづく多次元プロセッサーシステムｌＯＯを示す、該プロセッサーシステムには、小型コンピューターシステムインターフェース（ＳＣ３Ｉ）１０６などのインターフェースによつてプロセッサーコントローラ１０４に接続されてコマンドプリプロセッサーとして機能するところの、適切な＠置型プロセッサー１０２が含まれる。好ましい実施例においては、このＨａ型プロセッサー１０２として、ＩＪｎｉｘ”オペレーティングシステムの制御のもとに動作する通常のコンピューターを用いる。かかる面直型プロセッサーの一例は、Ｓｕｎ　Ｍｉｃｒｏｓｙｓｔｅｍｓ社から人手することが可能な３　ｕ　ｎワークステーションである。前置型プロセッサー１０２には、通常のＣコンパイラ−と、Ｃ言語への並列処理拡大体を用いて書き込みがなされたプログラムをシステムがコンパイルし実行することを可能にする、＠記Ｃコンパイラーのためのブリプロセッサーが含まれる。

プロセッサーコントローラー１０４は、前置型プロセッサー１０２とプロセンサーアレイ１０８の間の中間処理機能を提供する。このプロセッサーコントローラー１．０４には、コントロールプロセッサープログラムメモリー１１２に記憶されたコントロールプロセッサープログラムの制御のもとに動作するコントロールプロセッサー１１０が含まれる。このような並列処理システムの一例は、いずれも本明細書で引用しているところの、同時継続米国特許Ｎｏ、０７１５３０゜０２７（名称”ＭＵＬＴＩ−ＤＩＭＥＮＳＴＯＮＡＬ　ＰＲＯＣＥＳＳＯＲＳＹＳＴＥＭ　ＡＮＤ　ＰＲＯＣＥＳＳＯＲＡＲＲＡＹ　ＷＩＴＨＭＡＳＳＩＶＥＬＹ　ＰＡＲＡＬＬＥＬ　ＩＮＰＩＪＴｌｏＵＴＰＵＴ”）および同Ｎｏ、０７１５２９．９６２　（名称”ＤＩＭＥＮＳＩＯＮＡＬＬＹ　ＲＥＣＯＮＦＩＧｔＪＲＡＢＬＥ　ＭＵＬＴＩ−ＤＩＭＥＮＳＩＯＮＡＬ　ＰＲＯＣＥＳＳＯＲＡＲＲＡＹ”）に開示されているとおりである。

部首型プロセッサー１０２はコントロールプロセッサー１１０と連絡し、選択されたコマンドに応答して該コントロールプロセッサーにコマンドを送り、かつまた該コントロールプロセッサーからのデータを読み取る。通常、各々のコマンドは、全数や乗数などのワード・オリエンテッド型の単項演算または２項演算を記述する。コントロールプロセッサー１．１０はかかるコマンドを同定し、そしてそれらをマクロ命令と呼ばれる１続きのワード・オリエンテッド型のコマンドとしてリフす−マットする。マクロ命令はアドレス・命令ジェネレーターに転送される。そしてこのアドレス・命令ジェネレーターは、シリアライザー内に配置されたレジスターを初期設定することにより、シリアライザー１２０と命名したもにになる。シリアライザー１２０はマイクロトート１２２の制御のもとで動作し、そして各々のワード・オリエンテッド型マクロ命令を５ナノ命令と呼ばれるｌ続きのビット・オリエンテッド型コマンドに変換する。このビット・オリエンテッド型コマンドは、それぞれ、メモリーアドレスビットとボントロールビットからなるプロセッサーセル命令である。該シリアライザーは、該シリアライザーが生成させるナノ命令の各シーケンスを、プロセッサーアレイ１０８の全てのプロセッサーに伝送する。ナノ命令メモリー１２４には、シリアライザー１２０がそれにアクセスしてプロセッサーアレイのためのナノ命令を形成するところの５ナノ命令テンプレートの表が含まれる。

コントロールプロセッサー１１０はシリアライザー１２０との間で直接的にデータの受渡しを行うが、一方、両方向エツジＰＩＦＯＬ２６を経由してプロセッサーアレイ１０８との間でもデータの受渡しを行う、同様にして、前置型プロセッサー１０２との間の通信は小型コンピューターシステムインターフェース（ＳＣ３Ｉ）１０６を介してなされる。コントロールプロセッサー１１０はプロセッサーアレイ１０８を初期設定するためのコマンドを受け取り、そしてプロセッサーアレイ、前置型プロセッサー、ならびに、標準およびオプションのスワツピングＲＡＭやオプションのＩ１０デバイスなどの周辺装置間の入出力転送を制御する。

シリアライザー１２０は、図２のブロック・ダイアグラムに一層詳細に示すとおりである０図においてシリアライザーはその入力信号をコントロールプロセッサー１．１０から受け取り、また、コントロールプロセッサー１１０はソノ入力信号を前置型プロセッサー１０２から受け取る。

ｍＷ型プロセッサー１０２は、問題空間次元１５０ならびに追加的な初期設定情報をコントロールプロセッサー１１０へ伝送することにより、システムを初期設定する。コントロールプロセッサー１１０は、シリアライザー１２０内にレジスターをロートして、各プロセッサーセルにともなう問題ノードの写像１５６をシリアライザーに記述することにより、この情報に応答する。アドレス再配置回路１６２は写像１５６を受け取り、そして、面直型プロセッサー１０２からの後続の情報を処理する間に、それを用いて、仮想アトレスヘース１６４と遠隔アトレスヘース１６５の値を生成させる。

つぎに前置型プロセッサー１０２は、コントロールプロセッサー１１０にコマンドを送ってシステムを制置し始める。このコマンドは操作符号１５４とオペランドデータ１５２からなる。オペランドビット・アドレスジェネレーター１６８は、オペランドアドレスデータ１５８をコントロールプロセッサー１１０から受け取り、そしてプロセッサーアレイによって処理されるべきオペラントビブトの仮想アドレスを、信号経路１７０を通じてナノ命令ジェネレーター１６６に提供する。ナノ命令ジェネレーター１６６の集計回路１７２は、仮想アドレス１７０の各々を、各プロセッサーセルにおいて現在のオペランドビットについて遂行されつつある操作に応じて、仮想アドレスペース１６４または遠隔アドレスペース１６５のいずれかで加算し、処理されるべきオペランドビットのブロセッガーセルメモリー物理アドレス１７４を形成する。

コントロールプロセッサーはまた、操作符号１５４とオペランドデータ１５２を復号してマイクロプログラム’＄制御信号１６０を生成させ、そしてそれをマイクロプログラム・コントロールユニット１７６へ送る。マイクロプログラム・コントロールユニット１７６は、これらの信号に応答してナノ命令テーブルアドレス１７８を発生し、そしてそれを用いてナノ命令メモリー１２４をアドレスし、ナノ命令テンプ１／−ト１８０を得、ついでそれをナノ命令ジェネレータ−１６６へ送る。マイクロプログラム・コントロールユニット１７６はまた、オペランドビットの７トレスジエネレーター１６８、アドレス再配置回路３６２．およびナノ命令ジェネレーター１６６を、それ自身の操作と同期させるための制御情報を生成する。ナノ命令ジェネレーター１６６は、仮想アドレスビット１６４または遠隔アドレスペース１６５と仮想ア１ζレス１７０の相としてそれが形成する各々の物理アドレス１７４を、対応するナノ命令テンプレート１８０のアドレスビットと加算し、それぞれのナノ命令１８２を生成する。それぞれのナノ命令１８２は、各プロセッサーセルのメモリーにおける１つのビットの物理アドレスと、各プロセッサーセルのそのビットについて遂行されるべき操作を記述する制御ビット、の両方を含む。ナノ命令ジェネレーター１６６は、それが生成させる各々のナノ命令１８２を、アレイの全てのプロセッサーセルへ流す。

ｔＦＪ型プロセッサー１０２は、ワード・オリエンテッド型コマンドをコントロールプロセッサーへ迭ることによって、コントロールプロセッサー１１０と連絡する。コントロールプロセッサー１１０はかかるコマンドを同定し、そしてそれらを１続きのマクロ命令としてリフオーマットする。かかるコントロールプロセッサー１１０の１例は、図３のブロック・ダイアグラムに一層詳細に示すとおりであるが５マイクロプロセッサ−１８０がこれに含まれる。このマイクロプロセッサ−１８０はＡＤＭ−２９０００プロセツサーであって、コントロールプロセッサープログラムＦＲＯＭとＲＡＭ１１２の制御のもとに動作する。コントロールプロセッサーのデータＲＡＭ１１４は、一時的データとプロセッサー変数記憶をマイクロプロセッサ−１８０に提供する。

ある与えられたユーザー・プログラムを、変更せずに各種サイズの１０セツサーアレイのランに使えるようにするためには、応用プログラマ−は、仮想処理のためのメモリーの割り付けを要求されてはならない。それゆえ、天際、応用プログラムは、ある与えられたプロセッサーアレイにおける物理プロセッサーセル数の束縛から切り離される。そのかわりに、応用プログラムは単に、希望する問題空間のＸ、Ｙおよび２次元のみを確定する。つぎにコントロールプロセッサーは、プロセッサーアレイのサイズを測定し、そして問題空間の与えられた次元とプロセッサーアレイの各エツジに沿ってのプロセッサーの数から、各物理プロセッサーに割り振られるべき１組の仮想プロセッサーを計算する。このｌ紐の仮想プロセッサーを、物理プロセッサーセルの領域と称する。これらの領域次元は、好ましい実施例におけるように多次元であっても差し支えなく、次によって得られる。

Ｘｔ　＝Ｘ／Ｓｘ　、Ｙｔ　＝Ｙ／ｓｙ−およびＺｔ＝Ｚ／ｓ。

ここにＸｔ、Ｙ？およびＺ、は各物理プロセッサーセルの領域の次元、Ｘ、Ｙおよび２は問題空間の次元、またＳＸ、ＳＦおよびＳ２は物理プロセッサーにおけるアレイの次元である。

シリアライザーは、それがコントロールプロセッサーから入手することが可能な未処理の入力を有するときは、それぞれのナノ命令サイクルに１回だけ、ブロセッサーアレイの各プロセッサーセルに、有用なナノ命令を流すべきである。

シリアライザーは、プロセッサーコントローラーから受け取った各マクロ命令に対して１つのナノ命令シーケンスを生成するだけでなく、また、必要に応じて各ナノ命令についてアドレスを変更したうえで、既にそわぞれの物理ブロセツｗ− セルにマツピングされている各仮想プロセッサーについてそのナノ命令シーケンスを反復しなければならない、アドレス・命令ジェネレーターはまた、２つの仮想プロセッサーが相互に通信し合わなければならないときは、複数の物理プロセッサーセルが関与する場合があることも考慮しなければならない。

したがって、コントロールブロセッ勺−から受け取るある与えられたマクロ命令に対応する各ナノ命令シーケンスを生成さゼるためには、本究明のアドレス・命令ジェネレーターは、それが生成させる各ナノ命令に含めるためのオペランドの物理アドレスを計算し、また、つぎのサイクルでどのマイクロコート命令を実行するか、したがってまた５とのナノ命令を生成させるかを決定するための条件を評価しなければならない。つぎにシリアライザーは、あるｌ一つの物理プロセッサーセルの領域にあるそれぞれの仮想プロセッサーについて、該当する変更を施したうえで、それが生成させる各ナノ命令シーケンスを反復しなければならない。

本発明のアドレス・命令ジェネレーター１２０は、ｄオペランドの場合について図４に示すような、５つのオペランドアドレスジェネレーターを有している。マクロ命令オペランドｄ、ｅおよびｆに対しては３つのアドレスユニットがあり、一方、一時的変数ｔおよびＵに対しては２つのアドレスユニットがある。それぞれのオペランドアドレスジェネレーター１６８には、２つの１６ビツト・ハイアドレスレジスター１８１と１８２．２つの１６ビツト・ローアトレスレジスター１ｇ３と１８４、および２つの１ビット初期設定フラグレジスター１８５と１８６が含まれる。これらのレジスターのうちの第１のレジスターはコントロールプロセッサーにより直接的にロートされる。一方、第２のレジスターはシリアライザーにより第１のレジスターからロートされ、これによりシリアライザーは、コントロールプロセッサーが新たなマクロ命令を提供しているあいだに、１つのマクロ命令を処理することができる。このほかに、３つのカウンターずなわち１６ビツト・ハイアドレスカウンター１８７．１６ビツト位置アドレスカウンター１８８、および１６ビツト・ローアトレスカウンター１８９が含まれる。

バイア［・レスレジスター１８１と１８２のそれぞれは、カウンター１８６と同じく、ある１つのオペランドの最上位ビット（ＭＳＢ）の仮想アドレスを含み、一方、ローアトレスレジスター１８３と１８４のそれぞれは、カウンター１８９と同じく、対応するオペランドの最丁位ビット（ＬＳＢ）の仮想アドレスを保持する。初期設定フラグ１８５と１８６は、それぞれ、当初にハイアドレスレジスターの内容がロートされるべき各ビット位置アドレスカウンター１８８に対して設定され、あるいは、当初そのビット位置アドレスカウンターにローアトカウンターの内容がロートされるへきであれば、クリアされる。ラン信号１９１　’；ｉシリアライザーがマイクロコードを実行しているときに設定され、そしてｃｉ　−ｄ　ｈ信号１９０は、ｄカウンター１８８をｄｈカウンター１８７からり− １・するマイクロ命令を実行しているときに設定される。

図４に示す５つのシリアライザーアドレスユニットのレジスターとカウンターに加えて、シリアライザーは、図５のレジスター２０２を経由してコントロールプロセッサーから情報を受け取る。マイクロプログラムアドレスレジスター２０３と２０４、およびマイクロプログラムアドレスカウンター２０６は、各シリアライザーサイクルの終端でロードされる。メモリーレジスター２０６はシリアライザーがマイクロコートの実行を開始するときにレジスター２０４からロードされ、そしてシリアライザーがランしているあいだは、マイクロプログラムによって生成させられるブランチアドレスからロードされる。各シリアライザーサイクルの終端でシリアライザーがマイクロプログラムメモリーアドレスレジスター２０６をロートするときは、シリアライザーはまた、アドレスレジスター２０６にロートされつつあるアドレスで、図１のコントロールプロセッサーデータメモリー１１４からデータワードを読み取る。このデータは、それぞれ６４ビツトワイドの前置オペランドレジスターＦＯおよびＦｌ（それぞれ２１０および２１２）に読み込まれる。ｆオペランドアドレスユニットからのｆビットアドレスカウンターのローオーダー６ビツト２１４は、６４：ｌマルチプレックサ−２１６を経由して、前置並列変数の現行ビット２１６となるように、Ｆルジスターに１つのビットを選択する。

オペランドアドレスユニット１６８のタイミングは図６に示す通りである。

ここにｎは、各物理プロセッサーセルの領域内における仮想プロセッサーの数である。シリアライザーはコントロールプロセンサーから受け取るそれぞれのマクロ命令に対して該当するマイクロコートをｎ（８１８］寅行し、それぞれの仮想プロセッサーについて１つづつパスを行う。符号１９２などで示した縦線はサイクル間【こ選んだ境界であって、この時点でシリアライザーのレジスターとカウンターにデータをロートすることができる、すなわちインクレメントが可能である。ノ＼ス１９３などの各仮想プロセッサーパスには１クロツクサイクル１９４が先行し、そしてこのクロックサイクルの間にシリアライザーは１つのデフォルト・ナノ命令を発生させ、そして次のパスのためのワーキングレジスターとカウンターを初期設定する。

コントロールプロセッサーは、オペランドアドレスユニットのシリアライザーレジスターの第１セットｄｈＯ，ｄｌｏおよびｄ　ｆ　Ｏに５シリアライザーがマクロ命令１−１（１９６）のための最初の仮想ブロモ・ソサーパス１９５を開始した時点から同じくシリアライザーがマクロ命令ｉ−１のための最後のパスを終了するｌクロックサイクル前の時点（１９７）までの間に、マクロ命令ｉのための該当する値をロードする。シリアライザーは、それが時点１９８で示すマクロ命令ｉ−１の最後の仮想プロセッサーパスを終了するときに、これらの値を、バイブラインレジスターの第２のセットｄｈ１．ｄｌｌおよびｄｆｌに複写する。

ついでシリアライザーは、マクロ命令ｉのための各仮想プロセッサーバスに先行する各サイクル１９９の終端において、ハイアドレスレジスターとローアトレスレジスター（ｄｈｌとｄｌｌ）から、３つのカウンターｄｈ１．ｄ、およびｄｌをロートする。各仮想プロセッサーバスの残りのす・イクルの間、シリアライザーは、マクロ命令のための選択されたマイクロコードシーケンスを実行しかつマイクロコートの指令に従って各仮想プロセッサーのためのアドレスカウンターを修正することにより、マクロ命令１のためのナノ命令シーケンスを発生させる。

パス１９３などの各仮想プロセッサーバスは、複数のサイクル２００からなせるように設計される。

シリアライザーは、各シリアライザークロックサイクル１９９の終端で、各オペランドアドレスユニットの３つのカウンター１８７〜１８９の内容を、インクレメントならびにディクレメントすることができる。ビット位置アドレスカウンター１８８などのカウンターをインクレメントならびにデイクレメントする能力は、１つのオペランドのすへてのビット位置を順々にアドレスするために必要である６コントロールプロセツサーから受け取ったマクロ命令の結果として実行されるシリアライザーマイクロコートは、カウンターがインクレメントされるべきかディクレメントされるべきかを指令する。

各物理プロセッサーのメモリーは、図７Ａのメモリーマツプ２２０に示すように区分される。このメモリーマツプには、プロセッサーアレイ内の物理プロセッサー位置を記述するフラグを有する物理フラグ・セグメント２２２と、一時メモリー記憶領域２２４が含まれる。残りのメモリーは、長さがそれぞれｖビットの、ｘｔｙｔｚ、個の等しい仮想プロセッサーメモリー領域２２６に区分される。

それぞれの物理プロセッサーセルは、各マクロ命令を、その領域にある各仮想プロセッサーごとに１回づつ、全部でｘ、　ｙｔｚ、回実行しなければならない。

図７Ｂのメモリーマツプ２３０は、長さＶビットの、１つの仮想プロセッサーメモリー２２６のメモリーマツピングを示す。マクロ命令間の、与えられたある１つの仮想プロセッサー２２６の状態は、全ての変数２３２の値、そのヒー１２３４とスタック２３６の状態、およびそのＳフラグ２３８の値によって記述される。

ナノ命令間の仮想プロセッサーの状態にはまた、マクロ命令を完成するのに必要な図７Ａの一時記憶領域２２４の値と、物理プロセッサーの各レジスターの状態が含まれる。

１つの仮想処理空間を設定するために、コントロールプロセッサーは、図８の４つのプロセッサーｘｏ、ｙＯ，ｓＯよびｚｏ　（２４０〜２４６）を以下のようにロートする。ただし、Ｖはｌ仮想プロセッサーのメモリーサイズである。

ｚ　Ｏ＝　Ｚ　ｔ　ＶＳ　Ｏ＝Ｖプロセラ号−アレイ内での１つのプロセッサーセルから別のプロセッサーセルへのデータの移動は、以下の構文に従って記述される。

ａ＝［ΔＸ：Δｙ：ΔＺ］１〕ただし、“ａ“は宛先プロセッサーセルのメモリー内の１つの場所であり、また ”ｂ”は原始プロセッサーセル内の１つの場所である。原始プロセッサーセルは、宛先プロセッサーセルａに対し７て座標ΔＸ、Δｙ、およびΔｌだけ隔った場所にある。

複数の仮想プロセッサーとの間でデータの移動をおこなうマクロ命令を処理するに先立ち、コントロールプロセッサーは、３つのレジスターｄｘｏ、ｄｙＯおよびｄ、ｚｏ（２４８〜２５２）を以下のようにロードする。

ｄｘｏ＝　（△ｘ−Ｘｔ　ｌΔＸ／Ｘ、１）ＹｔＺｔＶｄｙｏ＝　（Δｙ−ＹｔｌΔｙ／Ｙ、ｌ）Ｚ、ＶｄｚＯ＝　（Δｚ−Ｚ、ＩΔｚ／Ｚ、ｌンＶここにΔＸ、Δｙ、およびΔＺは、演算ａ＝［ΔＸ：　Δｙ：　Δｚ］ｂで示されるような、宛先仮想プロセッサーを基準にとったときの、原始仮想プロセッサーに対する符号付き仮想プロセッサー座標である０表示ｄｘｏ、ｄｙｅ、およびｄ　ｚ　Ｏは、距ｆｉｄｘ、ｄｙ、およびｄｚを該当する領域次元Ｘ、、Ｙｔ、おまび２、でそれぞれ除したときの残余をあられす。

図２のアドレス再配置回路１６２には再配置ベースジェネレーション回路が含まれ、そしてこの再配置ベースジェネレーション回路は仮想ベースジェネレーション回路と遠隔ベースジェネレーション回路からなる。図９の仮想ベースジェネＬ／−シ＊ン回路２６０には３一つのモジューロコンバレー９−２６２，２６４および２６６が含まれる。第１のモジューロカウンター２６２へのインフレメン１〜人力２６８は、仮想プロセッサーのメモリーサイズＶを含むように前に定義したＳＯレジスターの値である。各モジューロカウンターは、そのインクレメント人力およびリミット入力が各物理プロセッサーセルの領域次元ｘ、、ｙ、およびＺ、の関数として設定されるように、ステージされる。結果として得られる出力Ｘ、ＹおよびＺ　（２７０〜２７４）は、アッダー２７６によって加算され仮想へ一ス信号２７８が得られ、そしてそのあと、この仮想ベース信号は仮想アドレスに加算されて、アレイの全てのプロセッサーセルに物理アドレスを生成させる。

図１０の遠隔ベースジェネレーション回路２８０には３つのモジューロアッダ− ２８２，２８４および２８６が含まれ、そしてこれらが１つづつ、座標Ｘ。

ＹおよびＺに対応する。これらのモジューロアッダーはそれぞれ、総和出方とオーバフロー出力を生成させる。総和出力は次のいずれかに等しい、（ａ）ベース＋インクレメント〈リミットならば、ヘース＋インクレメント　（ｂ）ベース＋インクレメント≧リミットならば、ベース＋インクレメントーリミット、オーバーフロー信号は、ヘース＋インクレメント≧リミットならば正規出方に等ｊバ、へ−ス＋インクレメント〈リミットならばこの久方信号の補数に等しい。

インタープロセッサー通信マクロ命令を寅現するマイクロコードは、データをＸ、Ｙおよび２方向に移動させる物理プロセッサーの数をカウントするために、それぞれＦ、ＴおよびＵを使用する。各座標でデータを移動させなければならない物理プロセッサーの数を記述するため、シリアライザーは、Ｆ、ＴおよびＵオペランドについてオペランドアドレスユニットを以下のように初期設定する。

ｆｌＯ＝　ｔｌｏ＝ｕｉＯ＝１それぞれのオペランドアドレスレジスターの各々のハイアドレスカウンターは、その座標のモジューロアッダーがオーバフローしないときはいつでも、対応する座標の物理アレイを通してデータを移動させねばならない距離を記述するように設定する。関係する座標のためのモジューロアツダーがオーバフローしないときはいつでも、データは、もう１つの物理プロセッサーを通して移動する。データを正座標の方向に移動させる場合には、それぞれのアドレスユニットのビット位置アドレスカウンターは、ハイアドレスカウンターに初期設定し、そしてローアトレスカウンターにカウントダウンする。一方、データを負座標の方向に移動させる場合には、ビットアドレスカウンターは、ローアトレスカウンターに初期設定し、そしてハイアドレスカウンターにカウントダウンする。出力信号Ｘ＋ｄｘ、ｙ＋ｄｙ、およびｚ＋ｄｚ　（２８８〜２９２）は、アッダー２９４によって加算され、遠隔ベース信号２０６を生ずる。

各仮想処理バスの開始点において、図２のマイクロプログラム・コントロールユニット１７８は、オーバフロービットｘＯ，ｙＯおよびＺＯを、それぞれ、Ｆ、ＴおよびＵアドレスユニットのハイビット位置アドレスカウンター１８７（図４）に加算する。さらにまた、データを正の方向に移動させるべき各座標について、対応するオーバフロービットｘＯ，ｙＯおよび２０は図４の対応する位置アドレスカウンター１８８にも加算される。このようにしで、　Ｆ、　ＴおよびＩ− ）アドレスユニットの各々は、それぞれの仮想処理バスのあいだの物理プロセッサーセルの移動数をカウントするように、正しく初期設定される。

例として、領域次元４．１．１を有する物理プロセッサー３００〜３０６のための、ａ＝［−１１，０，０］　ｂの形の、プロセッサー間通信演算を図１１Ａおよび図１１Ｂに示す、仮想処理を開始させた結果として、コントロールプロセッサーは、各物理プロセッサーの領域次元を設定するため、以下に示すようにＳｏ、ｙＯおよび２０をすでにロードしている。ただし、■は各仮想プロセッサーに割り付けられたメモリービットの数である。

この例の場合には、Δｘ＝−ｉｉ、Δｙ：０．およびΔ２＝＝０である。

図ＩＢの表は、各仮想プロセッサーにおけるこの演算のための、キーレジスターと信号の値を示す。バスｌのあいだ、仮想ベースコンパレーター回路のＸレジスターはクリアーされており、したがってＯの仮想ベースを生成する。遠隔ベースジェネレーション回路のモジューロアッダー回路は、オーバフロー信号ｘＯを発生し、したがってｆおよびｆｈのレジスターに１が加算され、これにより原始物理プロセッサー（たとえば３００）が宛先物理プロセッサー（たとえば３０６ンから３プロセツサーだけ離れていることが示される。遠隔ベース（これは原始オペランドを再位置する）はＶである、一方、仮想ベース（これは宛先オペランドを再位置する）はＯである。これは、物理プロセッサー３００の領域内にある仮想プロセッサー３０８から、物理プロセッサー３０６の領域内にある仮想プロセッサー３１０へのデータ移動に対応する。第２の仮想処理バスのあいだに、ＸレジスターはＯからＶヘインクレメントされ、原始または遠隔ベースＯ１ならびに宛先または仮想ベースＶをもたらす。第４のバスではオーバフロービットＸＯは０になり、このためｆおよびｆｈのレジスターは、バスの開始点でインクレメントされない。つぎにデータは、２つの物理プロセッサーのみを通って、物理プロセッサー３０２から物理プロセッサー３０６へ、そしてまた物理プロセッサー３００から物理プロセッサー３０４へ移動する。

図２のナノ命令ジェネレーション回路１６６の詳細を図１２に示す、この回路は、５つのビット位置カウンター３２０〜３２８、仮想ベース２７８、遠隔ベース２９６、およびナノ命令メモリー１２４に記憶されたナノ命令の表の数値から、ナノ命令を発生させる。マイクロプログラムの制御のもとで、マクロ命令レジスター３３０にナノ命令インデックスビット３３２がロードされ、そしてこれらのナノ命令インデックスビットが、ナノ命令メモリー１２４内の該当するナノ命令テンプレートを指定する１つのナノ命令アドレス３３４を発生させる。マルチプレクサ−３３６は、信号３３８の制御のもとに、０、遠隔ベース２９６または仮想ベース２７８がアッダー３４２によって選択されたビットオペランドアドレス信号３４０に加算されるへきか否かを指令する。この結果としてアッダー３４２から得られる出力信号３４４は、オペランドデータの物理アドレスである。

この物理アドレスはアッダー３４６によってナノ命令に加算され、ナノ命令レジスター３４８に記憶され、そして次のシリアライザーサイクルの開始時にプロセッサーアレイの各プロセッサーセルに流される。

通常の技術的な熟達をもってなしつる本発明に対する変更および置換は、本発明ならびに以下添付する請求項の範囲内のものであると考える。

１豹問題空間のノート数より少ない数のプロセッサーセルを有していても差し支えない多次元プロセッサーアレイ（１０８）などの並列処理アレイにプロセッサー命令を生成するための、仮想処理アドレス・命令ジェネレーター（１２０）を含む並列処理システム（１００）、この並列処理システムは、各々の物理プロセッサーセルのメモリー（２３０）をいくつかの等しい部分に分割し、そしてこの分割された部分のそれぞれに問題空間の１つのノートが対応する。つぎに命令ジェネレーターは、与えられた問題空間のそれぞれのノードに対してｌ続きのプロセッサーセル命令を生成し、そしてこの命令シーケンスのそれぞれについて、該当するアドレス変更がアドレス再配置回路（１６６）によって与えられる。

国際調査報告

Claims

【特許請求の範囲】１．選択された１つの問題次元に含まれるノードの数より少ない数のプロセッサーセルを有するプロセッサーアレイのための、プロセッサーセル命令とそれに対応するプロセッサーセル物理メモリーアドレスを生成することを目的とした、仮想処理命令・アドレスジェネレーターを備えた、以下のものからなる並列処理システム：前もって決められた数の物理プロセッサーセルを有する１つのプロセッサーアレイ；解かれるべき１つの問題次元のサイズを構成する数の問題ノードを提供するための手段：問題ノード数を提供するための手段と前もって決められた数の物理プロセッサーセルに応答して、この前もって決められた数の物理プロセッサーセルの各々に伴うべき仮想プロセッサーの数を確定するための手段：前記の前もって決められた数の物理プロセッサーセルの各々に伴うべき仮想プロセッサーの数を確定するための手段に応答して、物理プロセッサーセルの各々に伴う各仮想プロセッサーのベースメモリーアドレスに対応する１つの物理プロセッサーセルメモリーアドレスを確定するための手段：１つまたは１つ以上のプロセッサーセル命令を提供するための手段：各オペランドを前記のプロセッサーセルのアレイによって処理するための、１つの仮想オペランドメモリーアドレスを提供するための手段：仮想オペランドメモリーアドレスを提供するための前記の手段と前記の仮想プロセッサーのベースメモリーアドレスに応答して、１つの対応する仮想プロセッサーベースメモリーアドレスで仮想オペランドメモリーアドレスを加算し、処理されるべきオペランドの１つの物理プロセッサーセルメモリーアドレスを生成するための手段：ならびに処理されるべきオペランドの物理アドレスを発生させるための前記の手段および１つまたは１つ以上のプロセッサーセル命令を提供するための前記の手段に応答して、プロセッサーアレイの各プロセッサーセルに流すべきアドレス再配置プロセッサーセル命令を発生させるための対応する１つの物理プロセッサーセルメモリーアドレスをもった１つのプロセッサーセル命令を生じさせるための手段２．請求項１のシステムにおいて、プロセッサーセルアレイに、多次元アレイを構成するように相互接続された複数のプロセッサーセルが含まれるもの３．請求項２のシステムにおいて、多次元アレイに１つの３次元アレイが含まれるもの４．請求項１のシステムにおいて、１つの問題次元のサイズを構成する問題ノード数を提供するための手段に、前置型プロセッサーが含まれるもの５．請求項１のシステムにおいて、各仮想プロセッサーのベースメモリーアドレスに対応する１つの物理プロセッサーセルメモリーアドレスを確定するための手段が、オペランドがそこから取られるべき原始仮想プロセッサーのベースメモリーアドレスと、オペランドがそこに記憶されるべき宛先仮想プロセッサーのベースメモリーアドレスを確定するもの６．請求項１のシステムにおいて、プロセッサーセル命令の各々に、少なくとも１つのプロセッサーセルアドレスセグメントと１つのプロセッサーセルコントロールセグメントが含まれるもの７．請求項１のシステムにおいて、対応する１つの物理プロセッサーセルメモリーアドレスをもった１つのプロセッサーセル命令を生じさせるための手段が、その物理プロセッサーセルメモリーアドレスを、１つの対応するプロセッサーセル命令のアドレスセグメントの値に加算するもの８．選択された１つの問題次元に含まれるノードの数より少ない数のプロセッサーセルを有する多次元プロセッサーアレイのための、プロセッサーセル命令とそれに対応するプロセッサーセル物理メモリーアドレスを生成することを目的とした、仮想処理命令・アドレスジェネレーターを備えた、以下のものからなる多次元並列処理システム：少なくとも１つの３次元アレイを形成するように相互接続された、前もって決められた数の物理プロセッサーセルを有する１つのプロセッサーアレイ：解かれるべき１つの問題次元のサイズを構成する数の問題ノードを提供するための手段：問題ノード数を提供するための手段と前もって決められた数の物理プロセッサーセルに応答して、この前もって決められた数の物理プロセッサーセルの各々に伴うべき仮想プロセッサーの数を確定するための手段：前記の前もって決められた数の物理プロセッサーセルの各々に伴うべき仮想プロセッサーの数を確定するための手段に応答して、物理プロセッサーセルの各々に伴う各仮想プロセッサーのベースメモリーアドレスに対応する１つの物理プロセッサーセルメモリーアドレスを確定するための手段：プロセッサーセル命令の各々に少なくとも１つのプロセッサーセルアドレスセグメントと１つのプロセッサーセルコントロールセグメントが含まれるような状態で、１つまたは１つ以上のプロセッサーセル命令を提供するための手段：各オペランドを前記のプロセッサーセルのアレイによって処理するための、１つの仮想オペランドメモリーアドレスを提供するための手段：仮想オペランドメモリーアドレスを提供するための前記の手段と前記の仮想プロセッサーのベースメモリーアドレスに応答して、１つの対応する仮想プロセッサーベースメモリーアドレスで仮想オペランドメモリーアドレスを加算し、処理されるべきオペランドの１つの物理プロセッサーセルメモリーアドレスを生成するための手段：ならびに処理されるべきオペランドの物理アドレスを発生させるための前記の手段および１つまたは１つ以上のプロセッサーセル命令を提供するための前記の手段に応答して、多次元プロセッサーアレイの各プロセッサーセルに流すべきアドレス再配置プロセッサーセル命令を発生させるための対応する１つの物理プロセッサーセルメモリーアドレスをもった前記のプロセッサーセルアドレスセグメントを加算するための手段。