JPH06236448A

JPH06236448A - アレイプロセッサ用の多重マスク

Info

Publication number: JPH06236448A
Application number: JP5312308A
Authority: JP
Inventors: James J Radigan; ジェームス・ジェイ・ラディガン; David A Schwartz; デイビッド・エー・シュワルツ
Original assignee: Hughes Aircraft Co
Current assignee: Raytheon Co
Priority date: 1992-12-11
Filing date: 1993-12-13
Publication date: 1994-08-23
Also published as: US5555428A; GB2273377A; GB9325170D0; DE4342250A1

Abstract

(57)【要約】【目的】本発明は、相互接続された多重処理素子を含
む単一命令多重デ−タ装置の多重条件の実行のためのマ
スク技術を提供することを目的とする。【構成】各処理素子10が、デ−タを蓄積するメモリ手
段と、計算および／または入力／出力動作を行う機能手
段16〜20と、それら機能手段16〜20に多重動作を通常同
時に行わせる命令を蓄積する多重動作命令レジスタ12
と、１以上つのマスクビットが機能手段と関連している
複数のマスクビットを蓄積するマスクレジスタ12と、メ
モリ手段中のデ−タの条件の関数としてマスクビットを
設定する手段とを具備し、マスクレジスタの文脈はある
動作が行われることを選択的に阻止することを特徴とす
る。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は通常アレイコンピュ−タ
用のマスク技術、特に多重命令レベルマスクを含むＳＩ
ＭＤコンピュ−タ用の微細粒のマスク技術に関する。

【０００２】

【従来の技術】典型的にコンピュ−タは単一の命令およ
び単一のデ−タ流（ＳＩＳＤ）で動作する単一プロセッ
サである。即ち、単一プロセッサコンピュ−タは個々の
クロックサイクルで有効なただ１セットのデ−タでプロ
グラム内の単一命令で動作する単一の処理素子を含む。
全ての処理素子が単一の命令と多重デ−タ流（ＳＩＭ
Ｄ）で動作するコンピュ−タ中に多重処理素子を含むこ
とがさらに技術で知られている。これらのタイプのＳＩ
ＭＤコンピュ−タまたはプロセッサでは異なったデ−タ
が通常各個々の処理素子に供給されるが、各処理素子は
同一のクロックサイクル期間中同一の命令シ−ケンスを
受信する。単一プロセッサにまさるＳＩＭＤコンピュ−
タの利点には制御ユニットの価格の低下と必要なプログ
ラムメモリの減少がある。

【０００３】ＳＩＭＤコンピュ−タでは他のタイプのコ
ンピュ−タと同様に、通常マスクと呼ばれている基本的
な概念は処理素子の個々の動作の条件的実施に必要とさ
れる。マスクは処理素子に供給された命令シ−ケンスの
異なった命令が分離した処理素子に供給される特定のデ
−タがシ−ケンス内の特定の命令の条件を満たす処理素
子にのみ設けられることを可能にする。処理素子に供給
される命令シ−ケンスのある命令から特定の処理素子を
マスクする異なった技術が知られている。マスクを使用
する現代のＳＩＭＤ装置の詳細な要約は文献（Horde,
R. Michael の“Parallel Supercomputing in SIMD Arc
hitectures ”、1990年、CRC Press 社、Boca Raton, F
L）に記載されている。さらに米国特許第4,907,148 号
明細書および同第5,045,995 号明細書もこれらのタイプ
のシステムのマスクに対する説明を与えている。

【０００４】

【発明が解決しようとする課題】前述したように、ＳＩ
ＭＤコンピュ−タの従来技術のマスクは、命令がデ−タ
に対して動作しないようにコンピュ−タの任意の数の処
理素子の命令をマスクすることができる。しかしながら
多数の命令フォ−マットは多重条件的実行または動作を
含む。これらの命令は通常非常に長い命令ワ−ド（ＶＬ
ＩＷ）と呼ばれる。それ故精巧なＳＩＭＤコンピュ−タ
は多重処理素子による並列からだけでなく、１命令当り
の多重動作による並列からも有益である。

【０００５】単一のプロセッサの単一の命令における多
重動作の選択的マスクを提供することが技術で知られて
いる。多重マスク技術の少なくとも１つの説明は文献
（Stevenによる“HARP：A Parallel Pipeline RISC Pro
cessor”、Microprocessors and Microsystems、13巻、
No.9、1989年11月、579 〜587 頁）に記載されている。
スティ−ブン氏は命令の条件的実行を制御するための試
験をするためのブ−ルレジスタを特定化する命令にフィ
−ルドを付加することにより全ての命令を調整する概念
と、条件の意味を制御するフィ−ルド、即ちブ−ルレジ
スタが真であれば実行し、またはブ−ルレジスタが偽で
あれば実行するフィ−ルドとを紹介している。常に真で
あり無調整動作を生じる特別のレジスタが設けられてい
る。しかしながらこの処理は単一のプロセッサに限定さ
れている。ＳＩＭＤ構造の多重マスクは従来技術で示さ
れているとは考えられない。

【０００６】従来技術の多重マスク技術は条件的サブル
−チン呼出しを支持するため多重処理素子の必要なマス
クを提供する能力がない。それ故、従来技術のマスク技
術は現在の編集技術および同一のハ−ドウェア価格によ
って実用的な処理能力を限定する。必要なのはＳＩＭＤ
コンピュ−タの単一命令内の個々の動作の多重条件的実
行のマスク能力のあるマスク技術である。それ故、本発
明の目的はＳＩＭＤコンピュ−タでこのようなマスク技
術を提供することである。

【０００７】

【課題を解決するための手段】本発明によって命令内の
特定の条件下で実行可能な複数の動作の多重マスクを提
供するためのＳＩＭＤプロセッサ用のマスク技術が提供
される。これを達成するために命令はマスクビットバン
クと呼ばれる登録内の特定位置をアドレスする各動作用
の一連のマスクビットを含む。

【０００８】非常に長い命令ワ−ド構造に基づく実行に
おける単一命令は１以上の数学的関数ユニットのような
多重機能／動作と、乗算器と、北／南Ｉ／０機能、東
／西Ｉ／０機能とを含む。命令のこれらの異なった各機
能は典型的に所望のマスクビットを登録するためのアド
レス位置を含む。従って単一の機械命令内の各異なった
機械動作はマスクレジスタの適切なセットから異なった
個々のマスクビットを選択し、従って条件制御のいくつ
かの異なった場合の同時的な実行を許容する。

【０００９】多重マスクへの同一の方法は単一の動作の
みを特定化する命令の場合にも適用される。これは分岐
の必要なしに行われるプロセッサ性能を低くする必要な
条件的分岐を有する動作を可能にする。多重マスクは並
列に実行される多重命令を結合する“超スカラ−”プロ
セッサにも適用され、非常に長い命令ワ−ド構造の場合
と類似した効果を生じる。

【００１０】多重マスクの存在で条件的サブル−チン呼
出しを支持するために、汎用エネ−ブルマスク文脈ビッ
トが組入れられる。ＳＩＭＤプロセッサでは、サブル−
チン呼出しがコ−ドの条件的ブロックにあるとき、所望
の動作はサブル−チンがコ−ドの包囲ブロックの状態が
真である処理素子のグル−プでのみ行われることであ
る。ＳＩＭＤ装置では全ての処理素子はサブル−チン呼
出しを動作する。それ故呼出しが行われたとき効果的に
マスクを剥離する処理素子でサブル−チン呼出しの効果
を選択的にディスエーブルにすることが必要である。こ
の状態は多重マスクが存在するときのみ生じる。単一マ
スク文脈ビットは各処理素子に組入れられる。マスク文
脈ビットは機械の特定の動作でマスク用に選択される全
てのビットとビット的にアンド処理される。それ故特定
の処理素子は処理呼出しの“文脈”に基づいてエネ−ブ
ルまたはディスエーブルにされることができる。

【００１１】本発明の付加的な目的と利点は添付図面を
伴って後述の説明と特許請求の範囲から明白になるであ
ろう。

【００１２】

【実施例】ＳＩＭＤコンピュ−タのマスクに関する好ま
しい実施例の以下の説明は本質的に例示にすぎず、本発
明またはその応用または使用を限定するものではない。
前述のようにＳＩＭＤ並列プロセッサの動作のマスクは
基本的な要求である。このマスクは条件がアレイ／ベク
トル比較から生じるコ−ドの条件的実行をＳＩＭＤプロ
セッサが処理する方法である。例えばＰ個の処理素子
（ＰＥ）を有する簡単なＳＩＭＤシステムを考慮する。
さらに１処理素子当り１の変数が存在するようにＳＩＭ
Ｄ変数を変数のアレイ／ベクトルとする。Ｘが負である
処理素子についてのみ動作を行うことを期待するＳＩＭ
Ｄ変数Ｘを与え、“Ｃ”の言語記号を使用して表記し、
／＊＊／は記述的な説明を表す。

【００１３】１）ＳＩＭＤフロ−トＸ；２）（Ｘ＜0.0 ）ならば｛３）／＊コ−ドの文節の基本的ブロック＊／４） … ５）｝条件的ＳＩＭＤ表示（Ｘ＜0.0 ）は表現が真である処理
素子では真であり、表現が偽である処理素子で同様に偽
である特別なＳＩＭＤブ−ル変数に評価する。処理素子
の活性なセットとして表現が真である場合プロセッサの
セットと呼んでいる。ハ−ドウェア構造ではマスクフラ
ッグが偽であるならば処理素子をディスエーブルにする
ために当業者に知られているように各処理素子において
ブ−ルマスクフラッグの使用により特定の条件を設け
る。従って全ての処理素子で前述の動作の“文節”を実
施するがマスクフラッグが真に設定されている処理素子
だけをエネ−ブルにする。

【００１４】以下のより複雑に作られた条件的支持シ−
ケンスを考察する。

【００１５】１）ＳＩＭＤフロ−トＸ，Ｙ，Ｚ；２）（Ｘ＜0.0 ）ならば｛３）／＊ここで（Ｘ＜0.0 ）＊／４）Ｘ＝Ｘ＊Ｙ；５）（Ｙ＝＝1.0 ）ならば｛６）／＊ここで（（Ｘ＜0.0 ）＆＆（Ｙ＝＝1.0 ）＊／７）Ｙ＝−Ｙ；８）｝または｛９）／＊ここで（（Ｘ＜0.0 ）＆＆（Ｙ！＝1.0 ）＊／１０）Ｙ＝2.0 ＊Ｙ，１１）｝１２）｝または｛１３）／＊（Ｘ＞＝0.0 ）＊／１４）Ｘ＝Ｚ；１５）｝この例ではライン２は特定のＳＩＭＤ条件を表し、ライ
ン３〜11はその条件の本体を表す。ライン２のＳＩＭＤ
条件は活性セットを（Ｘ＜0.0 ）である処理素子に対し
て設定する。。従ってライン２の条件の本体内のライン
５のＳＩＭＤ条件は活性セットにある処理素子でのみ評
価される。それ故ライン５の条件のライン６、７の文節
本体は条件表現（Ｘ＜0.0 ）および前述の（Ｙ＝＝1.0
）により生成されるセットの交差（論理的ＡＮＤ）で
ある活性セットを有する。

【００１６】図１は前述の命令コ−ドのシ−ケンスの活
性セットの物理的表示を与える。特に図１（ａ）〜
（ｅ）は方形構造（64処理素子）の処理素子のアレイを
示しており、影のボックスは特定の条件を満足する処理
素子を示している。典型的に各行の処理素子は処理素子
が東／西方向でデ−タを交換できるようにＩ／０チャン
ネルにより接続され、各列の処理素子は処理素子がデ−
タを北／南方向で交換できるようにＩ／０チャンネルに
より接続されている。図１（ａ）は前述の命令コ−ドシ
−ケンスのライン２の条件に関連する活性セットを示し
ている。換言すると影付のボックスは（Ｘ＜0.0 ）の必
要性を満たす処理素子を指示する。同様に図１（ｂ）は
命令コ−ドシ−ケンスが分離するならば即ち（Ｙ＝1.0
）ならば、命令コ−ドシ−ケンスのライン５の条件を
満たす処理素子の活性セットを示している。図１（ｃ）
はコ−ドの前述のシ−ケンスのライン５に関連する活性
セットを示しており、このように図１（ａ）および
（ｂ）の重複である。換言すれば図１（ｃ）の影付のボ
ックスは（Ｘ＜0.0 ）と（Ｙ＝1.0 ）の論理アンドであ
る。

【００１７】知られているようにＳＩＭＤプログラムは
“それから”と“または”を有するＳＩＭＤ条件が両者
の文節を実施しなければならない点で典型的な単一プロ
セッサプログラムから離れ、単一プロセッサでは条件文
節の１つのみが実施される。これは両者の文節が空のな
い活性セットを具備する事実によるものである。図１
（ｄ）は（Ｘ＜0.0 ）と（Ｙ！＝1.0 ）の論理アンドの
処理素子であるように示されている活性影領域を表して
いる。付加的に図１（ｅ）は（Ｘ≧0.0 ）の影付の活性
処理素子を表している。

【００１８】ＳＩＭＤマスクの基本的方法は簡単な処理
素子に対しては十分である。しかしながら機能的並列即
ち処理素子内の単一の命令における多重動作が存在する
ならばこの方法は不適切である。４つの機能ユニット：
１）乗算器、２）数学的論理ユニット（ＡＬＵ）；３）
北／南入力／出力（Ｉ／０）ユニット、４）東／西Ｉ
／０ユニットを有するＶＬＩＷが設けられている処理素
子の場合を考慮する。高速フ−リエ変換（ＦＥＴ）処理
装置のようなアルゴリズムでは、位置に基づいていくつ
かの処理素子がデ−タの部分的平面の順序に影響を与え
るために他の処理素子とのデ−タ変換（Ｉ／０）に参加
することを必要とする。同時に単一の命令制御下で、全
ての処理素子は算数的計算を行うが、別の独立したデ−
タ計算のためにデ−タ（Ｉ／０）を取出す。計算から分
離したＩ／０のマスクはこのＦＦＴの例で重要であり、
それは各処理素子のＩ／０により計算を最大に重複する
ことを可能にし、従って処理素子の複製による並列だけ
でなく、処理素子に与えられる命令のある部分を選択的
にマスクする能力による並列を開発する。このタイプの
条件では２つのＩ／０方向（東／西と北／南）が独立し
た仕事であり、従って非常に異なったマスクを必要とす
る。従って多くのアルゴリズムは多重マスク動作を支持
する機構があるとき重複されることができる分離した作
業を有する。本発明の好ましい実施例によると、微細
粒マスクは単一命令で乗算、ＡＬＵ動作、北／南Ｉ／
０動作、東／西Ｉ／０動作を別々にマスクするために
ＳＩＭＤプロセッサ中のＶＬＩＷタイプの処理素子に応
用可能にされている。本発明の好ましい実施例はＩ／０
動作のマスクと他の機能ユニット動作との区別をしな
い。単一のマイクロコ−ド命令での各機械動作は後述す
るようにマスクビットレジスタの８つのプログラマ可視
単一のビットレジスタ（ＭＢ₀−ＭＢ₁）の１つにより
マスクされる。これにより各マイクロ動作は条件的動作
であることが明白である。後述するように単一の機械命
令の各機械動作は異なった個々のマスクビットを選択す
る。マスク用の構成支持の概念はル−プ反復を横切る動
作の最適な重複を可能にし、実行能力のある編集タ−ゲ
ットを維持する。

【００１９】図２は個々の処理素子に対するマイクロコ
−ド命令フォ−マットのビット表示を示している。明白
なようにマイクロコ−ド命令の別々の各４つ（４）の機
能に関連する分離したマスクフィ−ルドが存在する。特
にビット０〜30は演算数がアドレス位置Ｌ、Ｒでレジス
タ中にあるＡＬＵ動作のビット表示を含み、結果はレジ
スタ中のアドレス位置Ｙに記憶される。動作はさらに４
ビットマスク位置（ビット21〜24）を含む。同様に乗算
動作命令はビット31〜61により表される。乗算動作も４
ビットマスク位置（ビット52〜55）を有し、３つのビッ
トはマスクビットのアドレスを特定し、残りのビットは
補足ビットである。さらに、４ビットマスク位置（ビッ
ト76〜79）を含む北／南動作が存在する。さらに４ビッ
トマスク位置（ビット99〜102 ）を含む東／西Ｉ／０
動作が存在する。

【００２０】マスクフィ−ルドは２つのフィ−ルド即
ち、反転マスク感知フィ−ルドとビットバンクアドレス
フィ−ルドに分解されることができる。反転マスクフィ
−ルドは単一のビットでありビットバンクアドレスフィ
−ルドはマスクビットフィ−ルドの３つの下位桁ビット
である。換言すると各マスクフィ−ルドの最後の３ビッ
トはビットバンク位置であり、８つの位置の１つであ
る。反転マスクビットは補足ビットである。

【００２１】図３を参照すると本発明の好ましい実施例
による部品を含んだ単一の処理素子10の１形態がブロッ
ク図で示されている。特に多重動作命令を蓄積するレジ
スタ12はそれを複数の機能ユニットを備えた処理ユニッ
ト14に供給する。前述したように機能ユニットは東／西
Ｉ／０ユニット16、北／南Ｉ／０ユニット18、乗算
ユニット20と演算的論理ユニット22とを含む。各機能ユ
ニットにより行われる動作は多重動作命令により決定さ
れる。各機能ユニットの動作は各機能ユニットにＡＮＤ
ゲ−ト24からの付加的な制御信号を与えることによりエ
ネ−ブルまたはディスエーブルにされる。ＡＮＤゲ−ト
24からの出力は選択マスクレジスタ26とマスク文脈レジ
スタ28の値の論理アンドである。マスクレジスタ26の所
望のビットは動作の所望のマスクを行うために特定の機
能ユニットに対して適切なマルチプレクサ30により選択
される。

【００２２】図４は好ましい実施例のマスク部分をより
詳細に示している。各４つの機能ユニットは動作をマス
クするためにそれ自身のエネ−ブル信号を必要とする。
エネ−ブル信号は８から１のマルチプレクサ32から決定
され、これは制御用に低い桁の３ビット（マスクビット
＜２…０＞）を使用し出力でエネ−ブル信号を生成す
る、。マルチプレクサ32への最初の入力はマスク文脈ビ
ットレジスタ28からのマスク文脈（ＭＣ）ビットと反転
制御ビット（マスクビット＜３＞）との排他的オアであ
る。１〜５の入力は反転制御ビットと排他的オア処理さ
れ、ＭＣビットとアンド処理される選択マスクビット
（ＭＢｊ、ここで１≦ｊ≦５）である。マルチプレクサ
32への６番目の入力はＭＢ６と反転制御ビットの排他的
オアであり、ＰＥ＿スカラ信号と論理積にされる。信号
ＰＥ＿スカラはアレイ中の単一のＰＥで１つのみであ
り、従ってスカラ処理を促進する。好ましい実施例では
ＰＥ＿スカラは北／西の大部分のＰＥにおいてただ１つ
である。マルチプレクサ32への７番目の入力はマスクビ
ット＜３＞の反転である。

【００２３】図５はＳＩＭＤプロセッサのＰＥのアレイ
の１つのＰＥ36の計算部分の基本的な部分を示してい
る。ＳＩＭＤプロセッサの計算部分の構造と動作は知ら
れているので、ここでは簡単に説明しておく。さらに詳
細は種々の文献（例えばPrzytula, K. Wojtek の“Medi
um Grain Parallel Architecture For Image and Signa
l Processing”、Parallel Archtectures And Algorith
ms For Image Understanding、1991年）に記載されてい
る。ＰＥ36は４つの書込み入力と６つの読取り出力を有
するレジスタファイル38を含む。レジスタファイル38と
の間で命令を送信および受信する部品は浮遊小数点乗算
器40（ＦＰＭＵＬＴＩ）と浮遊小数点算数的論理ユニ
ット42（ＦＰＡＬＵ）と北／南入力／出力ユニット
44と東／西入力出力ユニット46を含む。乗算器40および
ＡＬＵ42の両者はレジスタファイル38から最大２つの読
取りと１つの書取りを要求する。Ｉ／０ユニット44と46
はレジスタファイル38から最大１つの読取りと１つの書
取りを要求する。

【００２４】示されているように北／南入力／出力ユ
ニット44はレジスタファイル38から命令を受信し、この
命令を北／南入力／出力回路50に供給する北／南出力
レジスタ48を含み、北／南入力／出力回路50はこの北
／南方向でデ−タを伝送する。北／南入力／出力回路
50からの出力はデ−タをレジスタファイル38に書き込む
北／南入力レジスタ52に供給される。同様に東／西入
力／出力ユニット46は読取り命令をレジスタファイル38
から受信しその命令を東と西方向でデ−タを伝送するた
めの東／西入力／出力回路56に伝送する東／西出力レ
ジスタ54を含む。東／西入力レジスタ58はレジスタファ
イル38に書込まれる東／西入力／出力回路56から命令
を受信する。

【００２５】図６を参照すると、処理素子36はさらに出
力ＭＲを有する点線のボックスで示されているマスクレ
ジスタ60を含む。マスクレジスタ60はＭＢ₀−ＭＢ₇の
記号が付けられている８つのビットを有する機能ユニッ
トビットバンク62を含む。これらのビットは前述したよ
うに計算のためにマスクされたビットを表す。後述する
ように機能ユニットビットＭＢ₀は金属ワイヤによる真
のビットであり機能ユニットビットＦＢ₇は金属ワイヤ
による無条件ビットである。好ましい実施例ではスカラ
動作は最北西ＰＥで行われる。特別の目的のマスクビッ
トＭＢ６はスカラ処理を助長するため北西の大部分のＰ
Ｅに与えられる。北／西の大部分のＰＥスカラでは動作
はＭＢ₆を使用してマスクされる。換言すれば図２で前
述したように１動作当り４つのマスクビットを利用し、
ここでビットのうちの３つはレジスタ位置を限定し、４
番目のビットは補足ビットであり、８つのレジスタ位置
がアドレスされることを可能にする。

【００２６】マスクレジスタ60はさらに単一のマスク文
脈（ＭＣ）ビットを保持するマスク文脈レジスタ66と、
単一の全体的な応答フラッグ（ＧＲＦ）ビットを保持す
る全体的応答フラッグレジスタ68を含む。マスク文脈ビ
ットは詳細に後述するようにサブル−チン呼出しの期間
中、特定の処理素子をエネ−ブルするかまたはディスエ
ーブルにするように命令の特定の機械動作のマスク用に
選択されたビットとビット的にアンド処理される。後述
するように全体的な応答フラッグビットは処理素子が条
件的サブル−チンの規定に当てはまるかどうかを決定す
るため、ＰＥ36中の他の全ての処理素子の全体的な応答
フラッグと論理的にオア処理される。

【００２７】機能ユニットビットバンク62はデマルチプ
レクサ70により供給される。デマルチプレクサ70は金属
ワイヤの真のビットＭＢ₀とＭＢ₇を除いてビットバン
ク62の各ビットに結合される出力を有する。デマルチプ
レクサ70は排他的オアゲ−ト72から入力を得る。排他的
オアゲ−ト72は２つの入力を具備し、一方はマルチプレ
クサ74の出力からで他方は補数制御である。補数制御が
１であるとき、排他的オアゲ−ト72の出力はマルチプレ
クサ76からの出力の補数であり、そうでなければマルチ
プレクサ74出力の真の値が通過される。マルチプレクサ
76への５つの入力は機能ビットバンク62から、特にＭＢ
₁−ＭＢ₆からのビットからのものである。入力７、８
はＡ₀とＦ₀レジスタのゼロビットから来る。マルチプ
レクサ76の出力はまた１つの入力としてマルチプレクサ
78に供給される。マルチプレクサ78の他の入力は標準的
に真である。マルチプレクサ78の出力は入力として排他
的オアゲ−ト80へ供給される。排他的オアゲ−ト80の出
力は全体的応答フラッグレジスタ68とマスク文脈ビット
レジスタ66へ入力として供給される。

【００２８】マスクレジスタ60内で示される全てのビッ
トは本発明の好ましい実施例によるＳＩＭＤプロセッサ
の特別処理の現在のマスク文脈を形成する。この文脈は
保存されＰＥ36の動作中処理呼出しを横切って蓄積され
る。ＰＥ36では、このスタックは一般的目的のレジスタ
ファイル68へ保存（または同ファイバ68からの回復）に
より設けられる。換言すれば、マスクレジスタ60のビッ
トバンクの現在値はサブル−チン呼出し期間中スタック
に出力され、サブル−チン終了でビットバンクへ回復さ
れる。マスク文脈の管理は処理呼出しと復帰機構の一部
分である。

【００２９】マスク技術の特定の例示では、機能呼出し
（Ｘ＞0.0 ）が条件的“もしも−それから”表現が優勢
な以下のソ−スコ−ド例を考察する。

【００３０】１）ＳＩＭＤフロ−トＸ，Ｙ；２）（Ｘ＞0.0 ）ならば｛３）Ｙ＝ｆｏｏ（Ｘ）；４）｝マスク文脈レジスタ66中のマスク文脈ビットは現在の処
理マスク文脈を実行する。前述の例ではＸ値が0.0 より
も大きいことを処理素子が示すならば、処理素子の全て
の制御は前述したようにレジスタ68中の全体的な応答フ
ラッグビット手段によりｆｏｏ（）に移動される。しか
しながら条件（Ｘ＞0.0 ）がｆｏｏ（）´コ−ドの動作
に参加するために真である処理素子のみを希望する。マ
スクレジスタ66中のマスク文脈ビットは全体的な処理素
子を全体的にエネ−ブルまたはディスエーブルにする単
一ビットとして動作することによってこの概念を支持す
る。マスク文脈レジスタ62は全体的にエネ−ブルであ
り、全ての機械動作のマスクのために選択される全ての
ビットと絶対的にビット的にアンド処理されるためであ
る。機械動作のために選択された（ＭＢ₀−ＭＢ₅）の
マスク値に関係なくマスク文脈ビットを処理素子の論理
的に偽の値に設定することによって結果は常に偽であ
る。従ってマスク文脈ビットが論理的に偽である処理素
子は、他方の全てと同一の命令を受信しながら実際の実
施に参加する能力がない。同様のことがＳＣＭビットに
も当てはまる。

【００３１】ビットＭＢ₀は前述したように金属ワイヤ
である。従って構造言語の無条件動作は明白に（または
絶対的に）ＭＢ₀を特定化する。これはビットバンクの
再負荷のオ−バ−ヘッドを無条件コ−ドの真の値に減少
する。ビットＭＢ₇はＭＢ₀のように常に真である点で
特別の例外である。しかしながらビットＭＢ₇は金属ワ
イヤの無条件ビットであるので、マスク文脈レジスタ66
でマスク文脈ビットを無効にする。換言すればこれは全
体的に無条件である。これは中断処理装置またはＳＩＭ
Ｄアレイのスカラ処理のような特別の場合に生じるよう
にマスク文脈を変更する移動を処理することを必要とす
る。

【００３２】処理素子が初期化されるとき、マスク文脈
レジスタ66は真にセットされ、ビットバンク62の変形可
能なビットは論理的偽にクリアされる。さらにＧＲＦビ
ットは論理的偽にセットされる。サブル−チンが呼出さ
れるとき、マスクレジスタビットはマスクスタックに押
込まれる。同じクロックサイクル中に、マスク文脈ビッ
トはサブル−チン中の呼出しの文脈を制御する条件的マ
スクビット（またはその補足数）のコピ−で負荷され
る。さらに、ビットバンク62の変形可能なビットとＧＲ
Ｆビットは論理的偽にクリアされる。このスタックは呼
出し装置から前の状態を捕らえてマスク文脈ビットは呼
出されたサブル−チンのマスク文脈を設定する。過程が
サブル−チンから帰還するとき呼出し過程の文脈はスタ
ックフレ−ムから回復される。

【００３３】この過程の特定の命令シ−ケンスの例が以
下与えられている。後続する機械コ−ドは単一の機械サ
イクル中に生じた全ての機械動作を包含するため
“＃”、“；”疑似ｏｐｓを使用する。“／＊，＊／”
の対は顕著な説明を含む。“（ＭＢｉ）”表記は動作を
マスクする特定のビットバンクレジスタを示す。

【００３４】ｓｉｍｄ浮遊Ｘ，Ｙ；（Ｘ＞0.0 ）ならば｛Ｙ＝ｆｏｏ（Ｘ）；｝０）／＊Ｒ１：＝0.0 ，ＲＯ：＝Ｘ，Ｒ１＝Ｙ，Ｒ２：＝paraml＊／１）ＦＬＴＭＢ３，Ｒ１，Ｒ０２）ＭＯＶＥＲ２，Ｒ０；３）ＣＡＬＬｆｏｏ，ＭＢ３；４）ＮＯＰ；／＊または遅延１スロットで便利な命令＊／５）ＭＯＶＥ（ＭＢ３）Ｒ１，Ｒ２；６） … ７）ｆｏｏ：８） … ／＊ｆｏｏの本体＊／９）ＲＥＴ；１０）ＮＯＰ；１１）… ライン１で条件的表示（Ｘ＞0.0 ）を評価し、その結果
をビットバンクレジスタＭＢ₃に置く。この評価の実行
はビットバンクレジスタＭＢ₀によりマスクされ、常に
真である。ＦＬＴ（それより少ない浮遊小数点）比較命
令は２つのサイクルの潜在を有し、それ故完了するのを
待ちながらＸの値をパラメ−タ１，Ｒ２，（ライン２）
のスタックフレ−ムの位置に動かす。ライン３ではサブ
ル−チン呼出しをｆｏｏ（）にする。サブル−チン呼出
しは以下のような幾つかの動作を含む。

【００３５】ａ）Ｒ［ＳＰ−−］−ＭＲ（ここでＭＲ＝
ＧＲＦ｜ＭＣ｜ＭＢ）ｂ）（シ−ケンス“呼出し”ｏｐ）；サイクルｉｃ）ＭＣ−ＭＢ３ｄ）ＭＢ１…ＭＢ６−偽この処理過程はマスクレジスタを節約し、シ−ケンス装
置によりプログラム流を変更し、新しいマスクおよびフ
レ−ム文脈を設定する。“ＣＡＬＬ”命令のマスクの意
味は通常の場合と異なっている点を注意すべきである。
呼出しが無条件であるならば、特定のマスクレジスタビ
ットは呼出されたもののマスク文脈を設定する。

【００３６】スカラマスクビットバンクを再負荷する不
必要なオバ−ヘッドを阻止するために、特別な目的のマ
スクビットＭＢ₆が与えられる。これは他のマスクビッ
トと丁度同じように処理される。しかしながらこれはス
カラマスク文脈（ＳＭＣ）ビットと“アンド”処理さ
れ、これはスカラ処理を助長する北／西の大部分のＰＥ
を除いてあらゆるところでゼロである。ＳＣＭビットは
マスクレジスタのＭＣビットにより節約される。

【００３７】ライン９の帰還命令はマスクと文脈を回復
する。

【００３８】ａ）ＭＲ＿Ｒ［−−ＳＰ］ｂ）（シ−ケンス装置“帰還”ｏｐ）機能呼出しを横切るマスク構造を考慮することに加えて
別の条件内の入れ子の条件、即ち別の条件内の１つの条
件等の概念を支持しなければならない。通常ＳＩＭＤ機
械では条件の入れ子の深さは典型的に１または２の条件
的深さであり非常に小さい傾向がある。これは深い入れ
子がＳＩＭＤ条件的コ−ドを実行するＳＩＭＤ機械にお
ける非常に非効率な実行を生じるためである。しかしな
がらある状態ではより深い入れ子を処理する必要があ
る。さらにトレ−ススケジュ−ルは複数の有効な条件を
増加することができる。真および無条件のビット（ＭＢ
₀，ＭＢ₇）の必要性を伴って少なくともこれらの２つ
の要素の組合わせのために、８つのマスクビットの選択
はその中の５つが一般的目的ビット、１つがスカラ処理
用、２つが金属ワイヤビットに決定される。本発明の好
ましい実施例によると、機能ビットバンクとＩ／０ビッ
トバンクとの両者のビットバンクの最少の所望なビット
は４つの一般的目的ビット、１つの“真”のビット、１
つの“無条件”ビット、１つの“スカラ”ビットであ
り、総合的に７つのビットである。条件的入れ子が複数
のマスクビットを超過する場合には、ビットバンクを移
動命令により一般的目的のレジスタに送ることができる
ので性能の適切な劣化が存在する。

【００３９】この説明を考慮して例えば後述の入れ子の
ソ−スコ−ドを考察すると、後述のＳＣＡＰ構造コ−ドを考慮する。この例では各Ｍ
ＯＶＥは１クロックサイクルを必要とし、それぞれの比
較は２クロックサイクルを必要とし、各浮遊小数点動作
はレジスタからレジスタまでに４のクロックサイクルを
必要とし、それぞれのＩ／０動作は１サイクルを取る。

【００４０】１）命令 MOVE R5，9.0 ；２）命令 FLT MB1 ，R4，R5；／＊（Ｘ＜9.0 ）＊／３）命令 FADD(MB1) R0，R1，R2 ／＊Ａ＝Ｂ＋Ｃ＊／４）命令 GT(MB1) MB2 ，R1，R4 ／＊（Ａ＞Ｘ）＆＆（Ｘ＜ 9.0 ＊／＃ FMULT R6，R0，R0；Ｅ＝Ａ＊Ａ５）命令 FLE(MB1) MB3 ，R1，R4 ／＊（Ａ＜＝Ｘ）＆＆（Ｘ＜9.0 ）＊／ FMULT(MB1) R7，R5，R0；／＊Ｆ＝９＊Ａ＊／６）命令 FMULT(MB2) R2，R1，R3 ／＊Ｃ＝Ｂ＊Ｄ＊／＃ FADD(MB3) R2，R0，R4 ／＊Ｃ＝Ａ＋Ｘ＊／入れ子条件（Ａ＞Ｘ）は（Ｘ＜9.0 ）と（Ａ＞Ｘ）の論
理アンドである。これを達成する１つの方法はライン４
で示されている。コ−ドのこれらのラインではＭＢビッ
トは最初に偽にセットされる。（Ａ＞Ｘ）の比較は比較
（Ｘ＜9.0 ）で条件付けられる。従ってＭＢ₂は、ＭＢ
₁が真でありＡ＞Ｘでのみ真である。内部比較の結果に
対して１クロックサイクルが完了するのを待機した後、
“それから”と“それでなければ”を評価することがで
きる。最後の２つの動作は計算Ａにのみ依存することに
注意すべきである。従って内部条件によってその評価を
引出す。最後に“（ＭＢ₀）”によりマスクすることは
無条件動作であることに留意すべきである。構造言語中
で便宜上条件的特定のないことはＭＢ₀の欠点を適切な
ものとして示す。

【００４１】前述したようにＳＩＭＤコンピュ−タは条
件がベクトル／アレイ表示を含む条件動作を処理するた
めにプロセッサマスクを使用する。単一プロセッサは
“それから”文節或いは“または”文節のみを実行、一
方ＳＩＭＤプロセッサは両者の文節を実行するが文節の
条件が真でない処理素子をディスエーブルにする。これ
は素子Ｘ_i＜Ｙ_iで他の素子はＸｊ≧Ｙｊであるためで
ある。問題は多くの条件においてただ１つの文節だけが
条件が真の素子を含むことである。条件的説明の入れ子
の深さが増加すると真の素子を有しない文節の可能性が
増加する。このことはほとんどの条件が境界的条件のよ
うな例外的な状況を処理するために生じる。残念ながら
ＳＩＭＤ機械で真の素子のない文節をバイパスするため
減少段階と後続する試験を行う分離した試験をプログラ
マが明白にコ−ド化しなければ、全ての文節は典型的に
実行される。このため文節が処理素子のゼロでない活性
セットを有するか否かを試験するため簡単で絶対的なハ
−ドウェア機構を導入する。これはマスク機構の一部分
であり、ゼロ文節を効率的にスキップすることを可能に
し、プロセッサの性能を著しく改良する。これは全体的
な応答フラッグ（ＧＲＦ）と呼ばれる各処理素子からの
全体的なワイヤ−オア応答ラインを使用することにより
達成される。全体的な応答フラッグは全体的な応答フラ
ッグレジスタ68に蓄積される。比較または明白な移動の
結果が全体的な応答フラッグに書込まれることが可能な
機構が設けられる。例えば前述のコ−ドフレ−ムワ−ク
から再度書込まれた後述のコ−ドを考察する。

【００４２】１）命令 ILT(MB0) GRF ，MB1 ，R1，R2；／＊（Ｘ＜Ｙ）＊／２）命令 Ορ（MB1 ）／＊“それから”文節の本体＊／３ａ）命令 Ορ（MB1 ）；ｂ）＃ MOVE GRF ，−MB1 ；４）命令 Ορ（MB1 ）；５）命令 Ορ（MB1 ）；６ａ）命令 IF(-GRF) L1 ／＊無効の活性セットならば“それから”をスキップする＊／ｂ）命令 Ορ（MB1 ）；７）命令 Ορ（MB1 ）； … 20）命令 Ορ（MB1 ）； 21ａ）L1；命令 IF(-GRF) L2 ／＊無効の活性セットならば“または ” をスキップする＊／ｂ）＃ Ορ（MB1 ）； 22）命令 Ορ（MB1 ）；／＊遅延スロット＊／ 23）命令 Ορ（MB1 ）；／＊“または”文節の本体＊／ 24）命令 Ορ（MB1 ）； … 30）命令 Ορ（MB1 ）； 31） L2； … “ＩＦ”命令はシ−ケンス装置の条件的分岐である。
“−”は論理補数を示している。全体的な応答フラッグ
はマスク文脈ビットと明白にビット的にアンド処理され
る。これはアレイが全体的な制御装置により読み取られ
る可能な入力として与えられるワイヤ−オアへの各処理
素子により貢献される最終値を生成する。“それから”
文節の比較の結果と“または”文節の比較の補数との両
者を全体的にオア処理することが必要であることに注意
すべきである。これは全体的なオア（−ＧＲＦ）が−全
体的ＯＲ（ＧＲＦ）に等しくないためである。さらにＧ
ＲＦビットはＡＬＵ動作または動作命令のタ−ゲットで
もある。これは制御装置により読取られる値を設定する
ために絶対的に書込まれる。これは一般的ＳＩＭＤフィ
−ドバック機構を制御装置に提供する。

【００４３】前述の説明は単なる本発明の例示的な実施
例を説明したものである。このような説明、添付図面、
特許請求の範囲から請求の範囲に限定されている本発明
の技術的範囲を逸脱することなく種々の変形、応用が行
われることを当業者は理解するであろう。

【図面の簡単な説明】

【図１】活性および不活性な処理素子を典型化した処理
素子のアレイブロック形態で示した図。

【図２】ＳＩＭＤマイクロコ−ド命令のフォーマット。

【図３】本発明の１実施例による処理素子のアレイの１
つの処理素子の基本的な部品を示したブロック図。

【図４】図３の処理素子のアレイの処理素子のマスク部
分のブロック図。

【図５】本発明の１実施例によるＳＩＭＤコンピュ−タ
の処理素子の特定のコンピュ−タ構造の概略図。

【図６】本発明の１実施例によるＳＩＭＤコンピュ−タ
の処理素子の特定のコンピュ−タ構造の概略図。

フロントページの続き (72)発明者デイビッド・エー・シュワルツアメリカ合衆国、カリフォルニア州 93021、ムーアパーク、チャールズ・ストリート 609

Claims

【特許請求の範囲】

【請求項１】相互接続されている多重処理素子を含む
単一の命令多重デ−タ装置において、前記各処理素子
が、デ−タを蓄積するメモリ手段と、計算および／または入力／出力動作を行うための機能手
段と、前記機能手段が多重動作を通常同時に行わせる命令を蓄
積するための多重動作命令レジスタ手段と、少なくとも１つのマスクビットが機能手段と関連してい
る複数のマスクビットを蓄積するためのマスクレジスタ
手段と、前記メモリ手段中のデ−タの条件の関数としてマスクビ
ットを設定する手段とを具備し、前記マスクレジスタの
文脈はある動作が行われることを選択的に阻止すること
を特徴とする単一命令多重デ−タ装置。
【請求項２】マスクレジスタ手段がマスク文脈ビット
を含み、このマスク文脈ビットは機能手段と関連する少
なくとも１つのビットと選択的にビット的に論理的オア
処理される選択的なビットである請求項１記載の装置。
【請求項３】マスクレジスタ手段が複数の機能ユニッ
トビットを含む請求項１記載の装置。
【請求項４】マスクレジスタ手段の１ビットがが金属
ワイヤによる真のビットである請求項３記載の装置。
【請求項５】マスクレジスタ手段の１つのビットがマ
スク文脈ビットを無効にする金属ワイヤによる無条件ビ
ットである請求項２記載の装置。
【請求項６】マスクレジスタ手段が全体的な応答フラ
ッグビットを蓄積するための全体的な応答フラッグレジ
スタを含み、前記全体的な応答フラッグビットは処理素
子が特定の命令シ−ケンスの条件的必要性を満たすかど
うかを決定するため他の処理素子の各全体的な応答フラ
ッグビットと論理的にオア処理される請求項１記載の装
置。
【請求項７】マスクレジスタ手段が個々のマスクビッ
トの値を特定の命令シ−ケンスの開始時にスタック機構
に出力する手段と、スタック機構からの命令シ−ケンス
の終了でマスクビットを再び負荷するための手段とを含
む請求項１記載の装置。
【請求項８】マスクレジスタ手段が３つのビットアド
レス位置により選択的にアドレス可能な８つのビットを
含む請求項３記載の装置。
【請求項９】北／西の大部分の処理素子がスカラ処理
を助長する請求項１記載の装置。
【請求項１０】マスクレジスタ手段がスカラマスク文
脈ビットを含み、前記スカラマスク文脈ビットは北ー西
の大部分の処理素子でスカラ処理を助長するために北ー
西の大部分の素子を除いて各処理素子でゼロである請求
項９記載の装置。
【請求項１１】複数の処理素子を含む単一命令多重デ
−タ流プロセッサにおけるデ−タ処理方法において、少なくとも１つの命令が複数の異なった機械動作を含む
各処理素子への命令のセットを管理し、各処理素子へのデ−タの予め定められたセットを管理
し、命令のセット内の特定の条件的説明の要求を満足しない
単一命令内の各機械動作をマスクし、このマスク段階は
マスクビットレジスタのセットから特定のマスクビット
を選択する段階と、マスク文脈ビットと選択されたマス
クビットを論理的にアンド処理する段階とを具備し、前
記マスク文脈ビットは特定の条件的説明にしたがって設
定され、アンド処理段階の結果に依存して処理素子をエ
ネ−ブルまたはディスエーブルにする段階を有すること
を特徴とするデ−タ処理方法。
【請求項１２】マスクビットレジスタからマスクビッ
トを選択する段階がマスクビットを金属ワイヤによる真
のビットを含むマスクビットレジスタから選択される段
階を含む請求項１１記載の方法。
【請求項１３】マスクビットレジスタからマスクビッ
トを選択する段階がマスク文脈ビットを無効にする金属
ワイヤによる無条件ビットを含む請求項１１記載の方
法。
【請求項１４】処理素子が条件命令の条件的要求を満
たすか否かを決定するために他の処理素子からの全体的
な応答フラッグレジスタ中のビットにより全体的な応答
フラッグレジスタのビットを論理的にオア処理する段階
を具備する請求項１１記載の方法。
【請求項１５】マスクレジスタからマスクビットを選
択する段階が８ビットの能ビットバンクからマスクビッ
トを選択することを含む請求項１１記載の方法。
【請求項１６】スカラマスク文脈ビットにより特別目
的のマスク文脈ビットを論理的アンド処理する段階を具
備し、スカラマスク文脈ビットはスカラ処理を助長する
ために１つのＰＥにおいてのみ真である請求項１１記載
の方法。
【請求項１７】多重相互接続処理素子を含む単一命令
多重デ−タ装置において、前記各処理素子が、デ−タ蓄積用のメモリ手段と、計算動作と入力／出力動作を行う機能手段と、前記機能手段に通常同時に各動作をさせるために命令を
蓄積する多重動作命令レジスタ手段と、少なくとも１つのマスクビットが機能手段と関連し、さ
らにマスク文脈ビットを含み、このマスク文脈ビットが
少なくとも１つの機能マスクビットと選択的にビット的
に論理的アンド処理され、複数のマスクビットを蓄積す
るマスクレジスタ手段と、前記メモリ手段のデ−タの条件の関数としてマスクビッ
トをセットする手段とを具備し、前記マスクレジスタ手
段の文脈は選択的にある動作が動作されることを阻止す
ることを特徴とする単一命令多重デ−タ装置。
【請求項１８】機能手段と関連する両者のマスクビッ
トの１ビットが金属ワイヤによる真のビットである請求
項１７記載の装置。
【請求項１９】マスクレジスタ手段の１ビットがマス
ク文脈ビットを無効にする金属ワイヤによる無条件ビッ
トである請求項１７記載の装置。
【請求項２０】マスクレジスタ手段が全体的な応答フ
ラッグビットを蓄積する全体的な応答フラッグレジスタ
を含み、前記全体的な応答フラッグビットは処理素子が
特定の命令シ−ケンスの条件的要求を満たすか否かを決
定するために各処理素子の別の全体的応答フラッグビッ
トと論理的オア処理される請求項１７記載の装置。
【請求項２１】マスクレジスタ手段が各マスクビット
の値を特定の命令シ−ケンスの開始時にスタック機構に
出力する手段と、スタック機構から命令シ−ケンスの終
了でマスクビットを再度負荷する手段を具備している請
求項１７記載の装置。
【請求項２２】マスクレジスタ手段がスカラマスク文
脈ビットを蓄積するスカラマスク文脈ビットレジスタを
含み、スカラマスク文脈ビットはスカラ処理を助長する
ため北西の大部分の処理素子を除いてあらゆるところで
ゼロである請求項１７記載の装置。