JP2503164B2

JP2503164B2 - デ―タ処理システム

Info

Publication number: JP2503164B2
Application number: JP4182510A
Authority: JP
Inventors: リチャード、エドマンド、フライ; トロイ、ニール、ヒックス
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1991-08-26
Filing date: 1992-07-09
Publication date: 1996-06-05
Anticipated expiration: 2011-06-05
Also published as: EP0529913A3; EP0529913A2; JPH05233286A; US5363495A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、データ処理システム、
より詳細には、複数の実行ユニットを持つデータ処理シ
ステム内においてインストラクションをシーケンスの順
番を越えて並列に実行するデータ処理システム及びデー
タ処理方法に関する。

【０００２】

【従来の技術】データ処理システムは、歴史的に、イン
ストラクションが順番に実行されることを要求してき
た。データ処理システム内において、インストラクショ
ンをできる限り迅速に実行することは、勿論、有益なこ
とである。インストラクションの実行を速くするための
先行技術による一つの方法は、一つの実行ユニットを使
用し、スループットを上げる方法である。第二の方法
は、複数の実行ユニットを使用し、インストラクション
をできるだけ多く並列に実行する方法である。複数の実
行ユニット内でインストラクションを並列に実行する場
合、インストラクション間のデータの依存性を処理する
ための方法を提供することが必要である。

【０００３】非並列データ処理システム内において、デ
ータの依存性を扱うための一つの方法が『メインメモリ
への或はこれからのデータ伝送と重複するＣＰＵレジス
タからレジスタへのデータ伝送を持つデータ処理システ
ム（Data Processing Systemwith CPU Register to Reg
ister Data Transfers Overlapped with Data Transfer
to and from Main Storage）』と言う名称の合衆国特
許第４，６３０，１９５号において開示されている。こ
の方法は、あるインストラクションによって使用される
べきレジスタが保留状態のＩ／Ｏインストラクションの
対象であるか否かを決定するためにレジスタ上のタグを
使用する。そのレジスタが空いているときは、このイン
ストラクションはこのＩ／Ｏインストラクションが完結
することを待つことなく実行できる。但し、この方法
は、並列処理スキームを伴うことはない。

【０００４】並列データ処理システム内においてデータ
依存性を扱うための一つの方法はプログラムをデータフ
ローに従って表現する方法である。この方法の一例が、
ＩＥＥＥトランザクション・オン・コンピュータ（IEEE
Transactions on Computers）、Ｖｏｌ．Ｃ−２６、Ｎ
ｏ．２、１９７７年２月号、ページ１３８−１４６に掲
載の論文『データフロー多重プロセッサ（A Data Flow
Multiprocessor）』において開示されている。この方法
においては、インストラクションは個々が要求するオペ
ランドに従ってモジュールに分離される。あるインスト
ラクションが第二のインストラクションに依存する場合
は、これは第二のインストラクションと同一モジュール
内におかれる。個々のモジュールは自己完結型であり、
全てのデータ依存性が含まれているために副作用を生じ
ることはない。従って、複数のプロセッサが自由に複数
のモジュールを同時に実行することができる。この方法
の短所は、これが従来のシステムと全く異なるユニーク
なデータフロー言語を要求することである。

【０００５】並列データ処理システム内のインストラク
ションを扱うための第二の方法は、プロセッサを同期さ
せる方法である。ＩＢＭ技術小冊子（IBM Technical Di
sclosure Bulletin ）、Ｖｏｌ．３２、Ｎｏ．７、１９
８９年１２月号、ページ１０９−１１３に掲載の論文
『複数のプロセッサを同期するためのデバイス（Device
for Synchronizing Multiple Processors）』は複数の
プロセッサを同期するためのデバイスを開示する。この
デバイスはバリア（barrier ）同期能力、及び複数のプ
ロセスからの複数の要求を直列化する能力を持つ。バリ
ア同期は、シーケンスのインストラクション内の任意の
プロセスがこのバリアをパスする前に全てのプロセスが
到達しなければならないポイントである。直列化動作
は、複数の同時的な要求の個々に優先順位を示すために
固有の整数を割り当て、また個々のプロセスにシステム
資源の固有のセットを割り当てる動作である。この方法
は、あまりにも厳格すぎ、インストラクションがそれら
のもとの順番を越えて実行されることを許さないという
問題を持つ。

【０００６】『浮動小数点動作のための方法及び装置
（Method and Apparatus for Floating Point Operatio
n ）』という名称の合衆国特許第４，７６３，２９４号
は、インストラクションのタイプに応じて固定小数点プ
ロセッサと浮動小数点プロセッサを同期するための装置
を開示する。浮動小数点インストラクションはインター
ロックを要求する第一のグループのメンバーか或はイン
ターロックを要求しない第二のグループのメンバーかの
いずれかである。いずれの場合も、固定小数点ユニット
は浮動小数点インストラクションのディスパッチを制御
し、浮動小数点プロセッサがアイドル状態になるのを待
たなければならない。こうして、固定小数点プロセッサ
は、常に、それらインストラクションをそれらの元のシ
ーケンス順で見ている。

【０００７】『先行インストラクションと後続インスト
ラクションの間でオペランドデータを直接に伝送するた
めのパイプライン連結された並列データ処理装置（Pipe
lined Parallel Data Processing Apparatus for Direc
tly Transferring Operand Data between Preceding an
d Succeeding Instructions ）』という名称の合衆国特
許第４，９１６，６０６号はあるインストラクションが
前のインストラクションの結果を使用する場合を検出
し、データを直接に後続インストラクションに供給する
装置を開示する。これはデータ検索ステップを不要に
し、実行の速度を向上させるが、但し、並列処理インス
トラクションをシーケンスを越えて実行することは許さ
ない。

【０００８】『並列処理タイプの演算動作処理装置及び
この装置内で使用されるコンパイラ（Arithmetic Opera
tion Processing Apparatus of the Parallel Processi
ng Type and Compiler which is Used in this Appara
tus ）』という名称の合衆国特許第４，９５６，８００
号は実行シーケンス及び入／出力シーケンスを並列にて
実行することを可能にすることにより高速にて演算動作
プロセスを遂行するための装置を開示する。これは、実
行速度を向上させるが、これらインストラクションはこ
の場合もシーケンス順にて実行される。

【０００９】

【発明が解決しようとする課題】上に詳細に説明された
参照文献のいずれも一つの実行ユニットがその実行ユニ
ット内のインストラクションの正しい実行が第二の実行
ユニット内のインストラクションの実行の完了に依存す
る場合にのみ遅延されるような独立した複数の実行ユニ
ット内のインストラクションをシーケンス順を越えて並
列実行するメカニズムについては開示しない。

【課題を解決するための手段】上記課題を達成するため
本発明のデータ処理システムは、第１及び第２の実行ユ
ニットと、上記実行ユニットに接続されて、インストラ
クション実行のために上記実行ユニットにインストラク
ションのシーケンスからインストラクションを供給する
手段と、上記実行ユニットに接続されて、上記第１の実
行ユニット内の第１のインストラクションに、上記シー
ケンスにおいて上記第１のインストラクションに先行す
る上記第２の実行ユニット内のインストラクションのカ
ウントを関連付ける手段と、上記関連付ける手段に接続
されて、上記第１のインストラクションに関連するカウ
ントがゼロでなく、かつ、正しい結果を得るために上記
第２のインストラクションが上記第１のインストラクシ
ョンに優先して実行されなければならないとき、前記第
２の実行ユニット内の第２のインストラクションの実行
が完了するまで上記第１のインストラクションの実行を
遅延させる手段と、上記関連付ける手段に接続されて、
上記第１のインストラクションに関連するカウントが上
記第２のインストラクションに先行する上記第２の実行
ユニット内のインストラクションの数よりも少ないか又
は等しく、かつ、正しい結果を得るために上記第１のイ
ンストラクションが上記第２のインストラクションに優
先して実行されなければならないとき、上記第１のイン
ストラクションの実行が完了するまで上記第２のインス
トラクションの実行を遅延させる手段と、を備えること
を特徴とする。

【００１０】

【作用】本発明によると、各々がインストラクションを
格納及び実行するための独立した回路を含む複数の実行
ユニットを持つデータ処理システムが提供される。ま
た、シーケンスの複数のインストラクションからこれら
実行ユニットにインストラクションを供給するための回
路が提供されるが、ここでは、個々のインストラクショ
ンはこれら複数の実行ユニットの一つのみに提供され
る。このシステムは第一の実行ユニット内のインストラ
クションが正しい結果を得るために第二の実行ユニット
内のインストラクションの実行の前に実行を完了しなけ
ればならない場合を検出するための回路を含む。さら
に、この検出回路に応答して、第二の実行ユニット内の
インストラクションの実行を第一の実行ユニット内のイ
ンストラクションが実行を完了するまで遅延するための
回路が提供される。

【００１１】一つの好ましい実施例においては、これら
インストラクションがインストラクションの複数のクラ
スの一つに属し、個々の実行ユニットが一つのクラスの
インストラクションを実行するために専用化されるデー
タ処理システムが提供される。このシステムはさらに個
々のインストラクションのクラスを決定するための回路
及びあるクラスに属するインストラクションをそのクラ
スのインストラクションを実行するために専用化された
実行ユニットに提供するための回路を含む。さらに、第
一の実行ユニット内の個々のインストラクションと第二
の実行ユニット内の元のシーケンスにおいてこれに先行
するインストラクションの数とを関連付けるための回路
が提供される。最後に、（１）第一の実行ユニット内の
インストラクションの実行をそのインストラクションと
関連するカウントがゼロでなく、また正しい結果を得る
ために第二の実行ユニット内のそのインストラクション
に先行するインストラクションがそのインストラクショ
ンの前に実行されなければならないときにのみ遅延し、
（２）第二の実行ユニット内のインストラクションの実
行を第一の実行ユニット内のインストラクションと関連
するカウントが第二の実行ユニット内のこのインストラ
クションに先行する第二の実行ユニット内のインストラ
クションの数以下或はこれに等しく、また第一の実行ユ
ニット内のインストラクションが正しい結果を得るため
に第二の実行ユニット内のインストラクションの前に実
行されなければならないときにのみ遅延するための回路
が含まれる。

【００１２】

【実施例】本発明の特質であると信じられる新規の特徴
は特許請求の範囲に示される通りである。但し、本発明
自体、及び本発明のその他の特徴及び長所は、好ましい
実施例の以下の説明を図面を参照にしながら読むことで
一層理解できるものである。

【００１３】本発明においては、浮動小数点ユニット
（floating point unit ）内の別個の実行ユニット（ex
ecution unit）内でインストラクションを独立して実行
できる能力を持つデータ処理システムが提供される。結
果として、インストラクションをシーケンスに従わずに
実行することができる。これら複数の別個の実行ユニッ
トは、互いに、異なる実行ユニット内の二つのインスト
ラクションが片方のインストラクションの正しい結果が
他方のインストラクションの実行の完了に依存するため
にシーケンスに従って実行されなければならないような
ケースにおいてのみ待つ。

【００１４】図１は好ましい実施例によるデータ処理シ
ステムのブロック図である。このシステムは、メインメ
モリ（１０）、インストラクションユニット（１２）、
固定小数点ユニット（１４）、浮動小数点ユニット（１
６）、及びデータキャッシュ（１８）を含む。メインメ
モリはインストラクションユニットにメモリバス（２
０）によって接続される。インストラクションユニット
は固定小数点ユニット及び浮動小数点ユニットにインス
トラクションバス（２２）によって接続される。浮動小
数点ユニットと固定小数点ユニットはデータバス（２
４）によって相互接続され、またデータキャッシュにデ
ータバス（２４）によって接続される。固定小数点ユニ
ットは、メインメモリ及びデータキャッシュにデータア
ドレスバス（２６）によって接続される。データキャッ
シュはバス（２８）によってメインメモリに接続され
る。

【００１５】この好ましい実施例においては、インスト
ラクションユニットは、インストラクションのためのロ
ーカル高速メモリとして機能する。これは、メインメモ
リからインストラクションを取り、これらを固定小数点
ユニット及び浮動小数点ユニットにディスパッチする。
固定小数点ユニット及び浮動小数点ユニットはそれらの
夫々のインストラクションを同期的に実行する。浮動小
数点ユニット内には、先取りバッファ（３０）、演算イ
ンストラクション実行ユニット（５４）、及び格納イン
ストラクション実行ユニット（５６）が存在する。これ
ら要素の個々の機能については図２との関連で説明され
る。データを格納したい場合、或はメモリからロードし
たい場合、固定小数点ユニットはアドレスバス（２６）
上にアドレスを置く。データはデータバス（２４）上を
転送される。データキャッシュはデータに対するローカ
ル高速メモリとして機能し、バス（２８）上のメインメ
モリとインターフェースする。

【００１６】図２は図１の浮動小数点ユニット（１６）
のブロック図である。インストラクション先取りバッフ
ァ（３０）はインストラクションユニット（図１の１
２）によって送られたインストラクションバス（２２）
からのインストラクションを逐次的に格納する。インス
トラクション先取りバッファ（Instruction Prefetch B
uffer 、ＩＰＢ）はインストラクションを一度に４つ格
納するが、シーケンスの第一のインストラクションはＩ
ＰＢ１内に格納され、最後のインストラクションはＩＰ
Ｂ４内に格納される。演算インストラクション待ち行列
コントロール（３６）及び格納インストラクション待ち
行列コントロール（３８）は複数のＩＰＢからインスト
ラクションを選択し、これらを、それぞれ、バス（５
０）及び（５２）上の演算インストラクション実行ユニ
ット（５４）及び格納インストラクション実行ユニット
（５６）に与える。

【００１７】演算インストラクションが演算インストラ
クション実行ユニット内に入れられると、格納インスト
ラクションカウントコントロール（４０）は格納インス
トラクション実行ユニット内のこれに先行する格納イン
ストラクションの数をカウントする。格納インストラク
ションカウントコントロールは、次に、関連する格納イ
ンストラクションカウントフィールド（２４）をセット
する。格納インストラクションカウントコントロールに
よって数えられたカウントは“格納インストラクション
カウント（ｓｔｏｒｅｃｏｕｎｔ）”と呼ばれる。格
納インストラクションカウントフィールドは演算インス
トラクション実行ユニット内の個々の演算インストラク
ションと関連する格納インストラクションカウントを保
持するための一つの要素を持つ。一つの格納インストラ
クションが実行されると、格納インストラクションカウ
ントコントロールは格納インストラクションカウントフ
ィールド内の格納インストラクションカウントを１だけ
減分する。

【００１８】演算インストラクション実行ユニット（Ar
ithmetic Execution Unit 、ＡｒＥＵ）は、演算インス
トラクション待ち行列（３２）、演算インストラクショ
ン実行論理（４６）、及び演算インストラクション実行
決定コントロール（４２）を含む。同様に、格納インス
トラクション実行ユニット（Store Execution Unit、Ｓ
ｔＥＵ）は、格納インストラクション待ち行列（３
４）、格納インストラクション実行論理（４８）、及び
格納インストラクション実行決定コントロール（４４）
を含む。演算インストラクション待ち行列（Arithmetic
Instruction Queue、ＡＱ）及び格納インストラクショ
ン待ち行列（Store Instruction Queue 、ＳＱ）は、そ
れぞれ、ＡｒＥＵ５４及びＳｔＥＵ５６に供給されたイ
ンストラクションを格納する。演算インストラクション
実行論理（Arithmetic Execute Logic、ＡｒＥＬ）４６
及び格納インストラクション実行論理（Store Execute
Logic、ＳｔＥＬ）４８はこれらインストラクションを
実行する。演算インストラクション実行決定コントロー
ル（Arithmetic Execute Decision Control 、ＡｒＥＤ
Ｃ）４２及び格納インストラクション実行決定コントロ
ール（Store Execute Decision Control、ＳｔＥＤＣ）
４４は、ＡＱ３２及びＳＱ３４内のインストラクション
がいつ実行できるかを制御する機能を持つ。ＡｒＥＤＣ
４２はライン（５４）上に実行信号を供給し、ＳｔＥＤ
Ｃ４４はライン（５５）上に実行信号を供給する。イン
ストラクションは、ＡｒＥＬ４６及びＳｔＥＬ４８に、
それぞれ、バス（５３）及び（５６）を通じて送られ
る。

【００１９】ＡｒＥＤＣ４２及びＳｔＥＤＣ４４は、各
々、格納インストラクションカウントフィールド及びラ
イン（５７）及びライン（５８）によって示される２つ
のインストラクション待ち行列内のインストラクション
を参照して夫々の実行ユニット内のインストラクション
の実行を制御する。待ち行列の最も下の位置内のインス
トラクションから開始し、個々の決定コントロールは、
待ち行列の最も下の二つの位置内のインストラクション
の一つが実行できるか否かをチェックする。決定コント
ロールは、インストラクションの実行を、これが、この
インストラクションと他の実行ユニットの待ち行列内の
インストラクションの一つとの間に依存性が発見された
時にのみ遅延させなければならない。

【００２０】これら二つの決定コントロールはどのイン
ストラクションが依存する可能性を持つかを判定するた
めにＡＱ内の個々のインストラクションと関連する格納
インストラクションカウントを使用する。例えば、Ａｒ
ＥＤＣ４２は、インストラクションの格納インストラク
ションカウントがゼロの場合、このインストラクション
の前に格納インストラクションは存在せず、これが実行
できることを知る。但し、インストラクションの格納イ
ンストラクションカウントがゼロより大きな場合は、Ａ
ｒＥＤＣ４２はそのインストラクションがそれに先行す
るいずれかの格納インストラクションのターゲットの上
に書き込むか否かをチェックしなければならない。Ｓｔ
ＥＤＣ４４は演算インストラクションの格納インストラ
クションカウントがゼロでないときは、そのインストラ
クションの前に格納インストラクションが存在し、一つ
の格納インストラクションが実行できることを知る。他
方、演算インストラクションの格納インストラクション
カウントがゼロのときは、ＳｔＥＤＣ４４はその演算イ
ンストラクションがそれが実行を望む格納インストラク
ションのターゲットに書き込もうとしているか否かをチ
ェックしなければならない。そうでない場合は、この格
納インストラクションは実行できる。但し、その格納イ
ンストラクションが演算インストラクションのターゲッ
トに格納しようとしているときは、この格納インストラ
クションは演算インストラクションが実行されるのを待
たなければならない。

【００２１】図３は格納インストラクション実行決定コ
ントロール４４がいかにして格納インストラクション待
ち行列内のインストラクションをチェックするかのフロ
ーチャートである。この図面はＳＱ０内の格納インスト
ラクションのチェックの最初の数ステップを示す。最初
に、ステップ（１００）において、ＳｔＥＤＣ４４はＡ
Ｑ０内の演算インストラクションの格納インストラクシ
ョンカウントをチェックする。格納インストラクション
カウントがゼロでないときは、この格納インストラクシ
ョンがシーケンス内の最初となり、ＳｔＥＤＣ４４はス
テップ（１０２）に進み、この格納インストラクション
を実行する。格納インストラクションカウントがゼロの
ときは、演算インストラクションが最初となり、ＳｔＥ
ＤＣ４４はステップ（１０４）に進み、ＡＱ０演算イン
ストラクションのターゲットレジスタとＳＱ０格納イン
ストラクションのターゲットレジスタを比較する。ター
ゲットが一致するときは、この格納インストラクション
はステップ（１０６）において遅延される（図中に“保
持（Ｈｏｌｄ）”として示されている）。ターゲットが
一致しないときは、ＳｔＥＤＣ４４はステップ（１０
８）に進み、ＡＱ１内のインストラクションの格納イン
ストラクションカウントをチェックする。上と同様に、
格納インストラクションカウントがゼロでないときは、
この格納インストラクションが最初となり、ＳｔＥＤＣ
４４はステップ（１１０）においてこの格納インストラ
クションを実行することができる。ＡＱ１内のインスト
ラクションの格納インストラクションカウントがゼロの
ときは、格納インストラクション決定コントロールは、
ＡＱ１内の演算インストラクションのターゲットレジス
タがＳＱ０内の格納インストラクションのターゲットレ
ジスタと同一であるか否かチェックしなければならな
い。これらが同一であるときは、ＳｔＥＤＣ４４はステ
ップ（１１４）に進み、実行を遅延しなければならな
い。同一でないときは、ＳｔＥＤＣ４４はＡＱ２内の演
算インストラクションを実行する。このプロセスが演算
インストラクション待ち行列内の全てのインストラクシ
ョンがチェックされるまで継続される。格納インストラ
クションのターゲットレジスタがいずれのＡＱターゲッ
トレジスタとも一致しないときは、格納インストラクシ
ョンは、元のシーケンス内でそれが演算インストラクシ
ョンに続く場合でも、実行することができる。

【００２２】図４は格納インストラクション待ち行列内
の全てのインストラクションをチェックするための図３
の圧縮されたバージョンを示すフローチャートである。
図４において、変数“ｘ”は演算インストラクション待
ち行列内の位置を表わし、０から７までの値を持つ。変
数“ｎ”は格納インストラクション待ち行列内の位置を
表わし、これも、０から７までの値を持つ。ステップ
（１２０）の最初の反復において、ＳＱ０に対する
“ｎ”はゼロであり、ＡＱ０に対する“ｘ”はゼロであ
る。ステップ（１２０）において、ＳｔＥＤＣ４４はＡ
Ｑｘ内の演算インストラクションの格納インストラクシ
ョンカウントをそれが実行のためにチェックしている格
納インストラクションの位置に１を加えた数と比較す
る。例えば、ＳｔＥＤＣ４４がＳＱ１内の格納インスト
ラクションをチェックしている場合は、これはＡＱ内の
インストラクションの格納インストラクションカウント
を数“２”と比較する。格納インストラクションカウン
トがこれに等しいかこれ以上であるときは、この格納イ
ンストラクションは演算インストラクションの前に来
て、この格納インストラクションはステップ（１２２）
において実行することができる。格納インストラクショ
ンカウントがこれより小であるときは、演算インストラ
クションが最初に来て、ＳｔＥＤＣ４４はステップ（１
２４）に進む。ステップ（１２４）において、ＳｔＥＤ
Ｃ４４はこれら二つのインストラクションのターゲット
レジスタを比較する。これら二つのインストラクション
が同一のターゲットレジスタを持つときは、ＳｔＥＤＣ
４４はステップ（１２６）に進み、格納インストラクシ
ョンを遅延する。これらターゲットレジスタが等しくな
いときは、ＳｔＤＥＣはステップ（１２８）に進み、
“ｘ”を増分する。ＳｔＥＤＣ４４は、次にステップ
（１２０）へと進み、演算インストラクション待ち行列
内の次のインストラクションの処理を行なう。ＳｔＥＤ
Ｃ４４はＳＱ内の最初の二つの格納インストラクション
に対してこのプロセスを遂行し、実行可能である最初の
格納インストラクションを実行する。

【００２３】図５は演算インストラクション実行決定コ
ントロールが演算インストラクション待ち行列内のイン
ストラクションをいかにチェックするかについてのフロ
ーチャートである。この図面は、ＡＱ０内の演算インス
トラクションのチェックの最初の数ステップを示す。ス
テップ（２００）において、ＡｒＥＤＣ４２はＡＱ０内
のインストラクションの格納インストラクションカウン
トがゼロであるか否かチェックする。格納インストラク
ションカウントがゼロのときは、ＡｒＥＤＣ４２はステ
ップ（２０２）に進み、この演算インストラクションが
これに先行する格納インストラクションを持たないた
め、ＡＱ０内の演算インストラクションを実行する。格
納インストラクションカウントがゼロに等しくないとき
は、ＡｒＥＤＣ４２はステップ（２０４）に進む。この
演算インストラクションの前に格納インストラクション
が先行するために、ＡｒＥＤＣ４２はＡＱ０内の演算イ
ンストラクションのターゲットとＳＱ０内の格納インス
トラクションのターゲットを比較する。これにターゲッ
トが一致する場合は、ステップ（２０６）において、演
算インストラクションが遅延される。これらターゲット
が一致しないときは、ＡｒＥＤＣ４２はステップ（２０
８）に進み、ＡＱ０内のインストラクションの格納イン
ストラクションカウントが１に等しいか否かチェックす
る。１に等しいときは、ＡｒＥＤＣ４２は、この決定コ
ントロールがＳＱ０内の一つの先行する格納インストラ
クションを既にチェック済であるために、ステップ（２
１０）においてこの演算インストラクションを実行する
ことができる。格納インストラクションカウントが１に
等しくないときは、ＡｒＥＤＣ４２はステップ（２１
２）へと進む。ステップ（２１２）において、ＡｒＥＤ
Ｃ４２はＡＱ０内の演算インストラクションのターゲッ
トをＳＱ１内の格納インストラクションのターゲットと
比較する。これらターゲットが等しい場合は、ＡｒＥＤ
Ｃ４２は、ステップ（２１４）に進み、演算インストラ
クションを遅延する。これらターゲットが一致しないと
きは、ＡｒＥＤＣ４２はプロセスを継続する。演算イン
ストラクションのターゲットレジスタがＳＱターゲット
レジスタのいずれとも一致しないときは、この演算イン
ストラクションは、これが元のシーケンス内において格
納インストラクションに続く場合でも実行することがで
きる。

【００２４】図６は演算インストラクション待ち行列内
の全てのインストラクションをチェックするための図５
の圧縮バージョンのフローチャートを示す。図４に示さ
れるように、変数“ｘ”は演算インストラクション待ち
行列内の位置を表わし、０から７の値を取る。変数
“ｎ”は格納インストラクション待ち行列内の位置を表
わし、これも、０から７の値を取る。ステップ（２２
０）の最初の反復において、ＳＱ０に対する“ｎ”はゼ
ロであり、ＡＱ０に対する“ｘ”はゼロである。ステッ
プ（２２０）において、ＡｒＥＤＣ４２は、ＡＱｘ内の
演算インストラクションと関連する格納インストラクシ
ョンカウントを“ｎ＋１”と比較する。格納インストラ
クションカウントが“ｎ＋１”以上でないときは、この
格納インストラクションは演算インストラクションに続
き、この演算インストラクションはステップ（２２２）
において実行することができる。格納インストラクショ
ンカウントが“ｎ＋１”に等しいかこれ以上のときは、
ＡｒＥＤＣ４２は、この格納インストラクションが演算
インストラクションの前に来るためにステップ（２４
４）に進む。ステップ（２２４）において、ＡｒＥＤＣ
４２は演算インストラクションと格納インストラクショ
ンのターゲットレジスタを比較する。これら二つのター
ゲットが同一であるときは、ＡｒＥＤＣ４２はステップ
（２２６）に進み、演算インストラクションを格納イン
ストラクションが実行されるまで遅延する。これらター
ゲットが一致しないときは、ＡｒＥＤＣ４２はステップ
（２２８）に進み、“ｎ”を増分する。ＡｒＥＤＣ４２
はステップ（２２０）に戻り、次の格納インストラクシ
ョンに対してこれら全てのステップを再度実行する。Ａ
ｒＥＤＣ４２はＡＱ内の最初の二つの演算インストラク
ションに対してこのプロセスを遂行し、実行可能な最初
の演算インストラクションを実行する。

【００２５】図７は格納インストラクション実行ユニッ
ト内の格納インストラクションを遅延する一例としての
ブロック図を示す。インストラクションの流れは二つの
加算インストラクション及びこれに続く一つの格納イン
ストラクションである。第一の加算インストラクション
はそのターゲットとしてレジスタ２を持ち、第二の加算
インストラクションはそのターゲットとしてレジスタ４
を持ち、格納インストラクションはそのターゲット（或
はソース）としてレジスタ２を持つ。図７に示されるよ
うに、第一及び第二の加算インストラクションは演算イ
ンストラクション待ち行列内の二つの位置、つまり、位
置（６０）及び（６２）を占拠する。格納インストラク
ションは格納インストラクション待ち行列（７０）内の
最も下の位置を占拠する。演算インストラクションと関
連する格納インストラクションカウントはゼロであり、
格納インストラクションカウントフィールド内の位置
（８０）及び（８２）内に示される。加算インストラク
ションのゼロの格納インストラクションカウントはこれ
らの前に格納インストラクションが先行しないことを意
味する。インストラクションが逐次的に実行されること
を期待されるときは、両方の加算インストラクションが
格納インストラクションの前に実行される。加算インス
トラクションの前に格納インストラクションが実行され
るためには、これは、これら二つの加算インストラクシ
ョンのいずれかのターゲットと同一のターゲットレジス
タを持ってはならない。ＡＱの最も下の加算インストラ
クションのターゲットはレジスタ２であり、格納インス
トラクションのターゲットはレジスタ２であるため、こ
の格納インストラクションは最も下の加算インストラク
ションが実行されるまで待たなければならない。

【００２６】図８は格納インストラクション実行ユニッ
ト内の格納インストラクションが演算インストラクショ
ン実行ユニット内のもともとこの前に来るインストラク
ションの前に実行される一例を示す。示されるインスト
ラクションの流れは二つの加算インストラクションに続
く一つの格納インストラクションである。第一の加算イ
ンストラクションはそのターゲットとしてレジスタ２を
持ち、第二の加算インストラクションはそのターゲット
としてレジスタ４を持ち、格納インストラクションはそ
のターゲットとしてレジスタ３を持つ。これら二つの加
算インストラクションは演算インストラクション待ち行
列内の最も下の二つの位置を占拠し、格納インストラク
ションは格納インストラクション待ち行列内の最も下の
位置を占拠する。これは、格納インストラクションが二
つの加算インストラクションの一つ或は両方の前に実行
されるためには、これは、この二つの加算インストラク
ションの一つのターゲットと同一のターゲットレジスタ
を持ってはならないことを意味する。格納インストラク
ションとこの二つの加算インストラクションは同一のタ
ーゲットレジスタを持たないため、格納インストラクシ
ョンは二つの加算インストラクションの前に実行するこ
とができ、これは、元のシーケンスと異なる順番であ
る。

【００２７】図９は演算インストラクション実行ユニッ
ト内で加算インストラクションが先行する格納インスト
ラクションのために遅延される例を示す図である。これ
はまた一つの加算インストラクションが演算インストラ
クション実行ユニット内のもう一つの加算インストラク
ションと順番を変えて実行されるところを示す。図９の
インストラクションのシーケンスは一つの格納インスト
ラクションに続く二つの加算インストラクションであ
る。格納インストラクションはそのターゲットとしてレ
ジスタ２を持ち、第一の加算インストラクションはその
ターゲットとしてレジスタ２を持ち、第二の加算インス
トラクションはそのターゲットとしてレジスタ４を持
つ。これら二つの加算インストラクションは演算インス
トラクション待ち行列内の最も下の位置を占拠し、格納
インストラクションは格納インストラクション待ち行列
内の最も下の地位を占拠する。個々の演算インストラク
ションと関連する格納インストラクションカウントはこ
れらに先行する一つの格納インストラクションが存在す
るために１である。これら加算インストラクションのい
ずれかが実行されるためには、このターゲットを格納イ
ンストラクションのターゲットと比較しなければならな
い。ターゲットレジスタ２への加算インストラクション
は格納インストラクションと同一ターゲットを持つため
に、これは、遅延され、格納インストラクションが実行
されるのを待たなければならない。但し、第二の加算イ
ンストラクションと格納インストラクションとの間には
データの依存関係は存在せず、従って、第二の加算イン
ストラクションは実行することができる。従って、一つ
の加算インストラクションがもう一つの加算インストラ
クションとの順番を越えて実行でき、同様にこれに先行
する格納インストラクションとの順番を越えて実行でき
る。

【００２８】図１０は演算インストラクション実行ユニ
ット内の演算インストラクションがその前に来る格納イ
ンストラクション実行ユニット内の格納インストラクシ
ョンの前に実行される例を示す図である。このインスト
ラクションの流れは一つの格納インストラクションに続
く二つの加算インストラクションである。ターゲットレ
ジスタは、それぞれ、レジスタ２、レジスタ３、及びレ
ジスタ４である。個々の演算インストラクションに対す
る格納インストラクションカウントは、個々がそれに先
行する一つの格納インストラクションを持つために１で
ある。演算インストラクション待ち行列の最も下の加算
インストラクションは、このターゲットレジスタが３で
あり、格納インストラクション待ち行列内の格納インス
トラクションのターゲットレジスタが２であるために、
実行することができる。

【００２９】図１１は一つの格納インストラクションが
それに先行されるもう一つの格納インストラクションの
前に順番を越えて実行される一例のブロック図である。
このインストラクションの流れは、レジスタ２への加算
インストラクション、レジスタ４への加算インストラク
ション、レジスタ２の格納インストラクション、及びレ
ジスタ３の格納インストラクションである。これら二つ
の格納インストラクションは格納インストラクション待
ち行列内の最も下の位置を占拠し、これら二つの加算イ
ンストラクションは演算インストラクション待ち行列内
の最も下の位置を占拠する。元のインストラクションの
流れの中にこの演算インストラクションに先行する格納
インストラクションは存在しないので、個々の演算イン
ストラクションと関連する格納インストラクションカウ
ントはゼロである。格納インストラクション待ち行列の
最も下の所の格納インストラクションは、演算インスト
ラクション待ち行列の最も下の所の演算インストラクシ
ョンもターゲットレジスタ２を持つために実行すること
ができない。従って、格納インストラクションは加算イ
ンストラクションが実行されるまで遅延される。但し、
格納インストラクション待ち行列内の第二の位置の格納
インストラクションはターゲットが一致しないために実
行することができる。レジスタ３の格納インストラクシ
ョンは、レジスタ２への格納インストラクションの前に
実行することができる。こうして、一つの格納インスト
ラクションがもう一つの格納インストラクションの順番
を越えて実行でき、同様にそれに先行する演算インスト
ラクションの順番を越えて実行できる。

【００３０】当業者においては、この装置は、実行ユニ
ットがその待ち行列内のインストラクションを任意の順
番で実行でき、またもう一つの実行ユニット内のインス
トラクションの順番を越えてこれらを実行できるように
拡張可能なことが理解できるものである。遅延は、一つ
のユニット内で実行されるべきインストラクションがも
う一つのユニット内のインストラクションの実行を待た
なければならないときにのみ起こる。

【００３１】本発明が一例としての実施例との関連で説
明されたが、この説明は限定を意図するものではない。
一例として示される実施例の様々な修正、並びに本発明
の他の実施例が当業者においてはこの説明を見ると明ら
かとなるものである。従って、特許請求項は、これら修
正及びその他の実施例も本発明の真の範囲内に入るもの
としてカバーするものと見なされるべきである。

【００３２】

【発明の効果】以上説明したように本発明のデータ処理
システム及びデータ処理方法によれば、複数の実行ユニ
ット内でインストラクションを独立して実行できる能力
を持つデータ処理システムが提供される。また、インス
トラクションをシーケンスに従わずに実行することが可
能となる。

【図面の簡単な説明】

【図１】データ処理システムの一例としての要素を示す
ブロック図である。

【図２】一例としての浮動小数点ユニット及びその分離
した演算インストラクション及び格納インストラクショ
ン実行ユニットを示すブロック図である。

【図３】格納インストラクション実行ユニット内の待ち
行列の最も下の位置内のインストラクションの制御を示
すフローチャートである。

【図４】格納インストラクション実行ユニット内の待ち
行列内の全てのインストラクションの制御を示すフロー
チャートである。

【図５】演算インストラクション実行ユニット内の待ち
行列の最も下の位置内のインストラクションの制御を示
すフローチャートである。

【図６】演算インストラクション実行ユニット内の待ち
行列内の全てのインストラクションの制御を示すフロー
チャートである。

【図７】格納インストラクション実行ユニット内の待ち
行列の最も下の位置内の一つのインストラクションの遅
延例を示すブロック図である。

【図８】格納インストラクション実行ユニット内の待ち
行列の最も下の位置内の一つのインストラクションをシ
ーケンスを越えて実行する例を示すブロック図である。

【図９】演算インストラクション実行ユニット内の待ち
行列の最も下の位置内のインストラクションを遅延し、
演算インストラクション実行ユニット内の待ち行列の第
二の位置内のインストラクションをシーケンスを越えて
実行する例を示すブロック図である。

【図１０】演算インストラクション実行ユニット内の待
ち行列の最も下の位置内の一つのインストラクションを
シーケンスを越えて実行する例を示すブロック図であ
る。

【図１１】格納インストラクション実行ユニット内の待
ち行列の最も下の位置内のインストラクションを遅延
し、格納インストラクション実行ユニット内の待ち行列
の第二の位置内のインストラクションをシーケンスを越
えて実行する例を示すブロック図である。

【符号の説明】

１２インストラクションユニット１４固定小数点ユニット１６浮動小数点ユニット３０インストラクション先取バッファ３２演算インストラクション待ち行列３４格納インストラクション待ち行列４２演算インストラクション実行決定制御４４格納インストラクション実行決定制御４６演算インストラクション実行論理４８格納インストラクション実行論理

Claims

(57)【特許請求の範囲】

【請求項１】第１及び第２の実行ユニットと、前記実行ユニットに接続されて、インストラクション実
行のために前記実行ユニットにインストラクションのシ
ーケンスからインストラクションを供給する手段と、前記実行ユニットに接続されて、前記第１の実行ユニッ
ト内の第１のインストラクションに、前記シーケンスに
おいて前記第１のインストラクションに先行する前記第
２の実行ユニット内のインストラクションのカウントを
関連付ける手段と、前記関連付ける手段に接続されて、前記第１のインスト
ラクションに関連するカウントがゼロでなく、かつ、正
しい結果を得るために前記第２のインストラクションが
前記第１のインストラクションより前に実行されなけれ
ばならないとき、前記第２の実行ユニット内の第２のイ
ンストラクションの実行が完了するまで前記第１のイン
ストラクションの実行を遅延させる手段と、前記関連付ける手段に接続されて、前記第１のインスト
ラクションに関連するカウントが前記第２のインストラ
クションに先行する前記第２の実行ユニット内のインス
トラクションの数に等しいかまたはこれよりも少なく、
かつ、正しい結果を得るために前記第１のインストラク
ションが前記第２のインストラクションより前に実行さ
れなければならないとき、前記第１のインストラクショ
ンの実行が完了するまで前記第２のインストラクション
の実行を遅延させる手段と、を備えるデータ処理システム。
【請求項２】請求項１記載のデータ処理システムであっ
て、前記インストラクションの各々は、インストラクション
の複数のクラスのいずれか１つに属する、ことを特徴とするデータ処理システム。
【請求項３】請求項２記載のデータ処理システムであっ
て、前記実行ユニットの各々が前記インストラクションのク
ラスの１つの実行に専用化される、ことを特徴とするデータ処理システム。
【請求項４】請求項３記載のデータ処理システムであっ
て、前記インストラクションを供給する手段に接続されて、
前記インストラクションのシーケンスにおける各インス
トラクションのクラスを決定するための手段を、更に含
む、ことを特徴とするデータ処理システム。
【請求項５】請求項４記載のデータ処理システムであっ
て、前記インストラクションを供給する手段が、前記インス
トラクションのあるクラスの実行に専用化される前記実
行ユニットの１つに前記インストラクションの前記ある
クラスに属するインストラクションを排他的に供給する
手段を、更に含む、ことを特徴とするデータ処理システム。
【請求項６】請求項１記載のデータ処理システムであっ
て、インストラクションの第１のクラスが浮動小数点演算イ
ンストラクションであり、前記第１の演算ユニットが前
記インストラクションの第１のクラスを実行するために
専用化され、インストラクションの第２のクラスが浮動
小数点格納インストラクションであり、前記第２の実行
ユニットが前記インストラクションの第２のクラスを実
行するために専用化される、ことを特徴とするデータ処理システム。
【請求項７】インストラクション実行のために第１及び
第２の実行ユニットにインストラクションのシーケンス
からインストラクションを供給するステップと、前記第１の実行ユニット内の第１のインストラクション
に前記シーケンスにおいて前記第１のインストラクショ
ンに先行する前記第２の実行ユニット内のインストラク
ションのカウントを関連付けるステップと、前記第１のインストラクションに関連するカウントがゼ
ロでなく、かつ、正しい結果を得るために前記第２のイ
ンストラクションが前記第１のインストラクションより
前に実行されなければならないとき、前記第２の実行ユ
ニット内の第２のインストラクションの実行が完了する
まで前記第１のインストラクションの実行を遅延させる
ステップと、前記第１のインストラクションに関連するカウントが前
記第２のインストラクションに先行する前記第２の実行
ユニット内のインストラクションの数に等しいか又はこ
れより少なく、かつ、正しい結果を得るために前記第１
のインストラクションが前記第２のインストラクション
より前に実行されなければならないとき、前記第１のイ
ンストラクションの実行が完了するまで前記第２のイン
ストラクションの実行を遅延させるステップと、を備えるデータ処理システムにおける処理方法。
【請求項８】請求項７記載のデータ処理システムにおけ
る処理方法であって、前記インストラクションの各々は、インストラクション
の複数のクラスのいずれか１つに属する、ことを特徴とするデータ処理システムにおける処理方
法。
【請求項９】請求項８記載のデータ処理システムにおけ
る処理方法であって、前記実行ユニットの各々が前記インストラクションのク
ラスの１つの実行に専用化される、ことを特徴とするデータ処理システムにおける処理方
法。
【請求項１０】請求項９記載のデータ処理システムにお
ける処理方法であって、前記インストラクションのシーケンスにおける各インス
トラクションのクラスを決定するためのステップを、更
に含む、ことを特徴とするデータ処理システムにおける処理方
法。
【請求項１１】請求項１０記載のデータ処理システムに
おける処理方法であって、前記インストラクションを供給するステップが、前記実
行ユニットの１つにインストラクションのあるクラスに
属するインストラクションを排他的に供給するステップ
を、更に含む、ことを特徴とするデータ処理システムにおける処理方
法。
【請求項１２】請求項７記載のデータ処理システムにお
ける処理方法であって、インストラクションの第１のクラスが浮動小数点演算イ
ンストラクションであり、前記第１の演算ユニットが前
記インストラクションの第１のクラスを実行するために
専用化され、インストラクションの第２のクラスが浮動
小数点格納インストラクションであり、前記第２の実行
ユニットが前記インストラクションの第２のクラスを実
行するために専用化される、ことを特徴とするデータ処理システムにおける処理方
法。
【請求項１３】複数のインストラクションを格納するメ
モリ手段と、第１及び第２の実行ユニットと、前記実行ユニットに接
続されて、インストラクションを実行するために前記実
行ユニットにインストラクションのシーケンスからイン
ストラクションを供給する手段と、を含むプロセッサ手
段と、前記メモリ手段からインストラクションを取出し、前記
プロセッサ手段に送る手段と、前記実行ユニットに接続されて、前記第１の実行ユニッ
ト内の第１のインストラクションに、前記シーケンスに
おいて前記第１のインストラクションに先行する前記第
２の実行ユニット内のインストラクションのカウントを
関連付ける手段と、前記関連付ける手段に接続されて、前記第１のインスト
ラクションに関連するカウントがゼロでなく、かつ、正
しい結果を得るために前記第２のインストラクションが
前記第１のインストラクションより前に実行されなけれ
ばならないとき、前記第２の実行ユニット内の第２のイ
ンストラクションの実行が完了するまで前記第１のイン
ストラクションの実行を遅延させる手段と、前記関連付ける手段に接続されて、前記第１のインスト
ラクションに関連するカウントが前記第２のインストラ
クションに先行する前記第２の実行ユニット内のインス
トラクションの数に等しいか又はこれより少なく、か
つ、正しい結果を得るために前記第１のインストラクシ
ョンが前記第２のインストラクションより前に実行され
なければならないとき、前記第１のインストラクション
の実行が完了するまで前記第２のインストラクションの
実行を遅延させる手段と、を備えるデータ処理システム。
【請求項１４】請求項１３記載のデータ処理システムで
あって、前記インストラクションの各々は、インストラクション
の複数のクラスのいずれか１つに属する、ことを特徴とするデータ処理システム。
【請求項１５】請求項１４記載のデータ処理システムで
あって、前記実行ユニットの各々が前記インストラクションのク
ラスの１つの実行に専用化される、ことを特徴とするデータ処理システム。
【請求項１６】請求項１５記載のデータ処理システムで
あって、前記インストラクションを供給する手段に接続されて、
前記インストラクションのシーケンスにおける各インス
トラクションのクラスを決定するための手段を、更に含
む、ことを特徴とするデータ処理システム。
【請求項１７】請求項１６記載のデータ処理システムで
あって、前記インストラクションを供給する手段が、前記インス
トラクションのあるクラスの実行に専用化される前記実
行ユニットの１つに前記インストラクションの前記ある
クラスに属するインストラクションを排他的に供給する
手段を、更に含む、ことを特徴とするデータ処理システム。
【請求項１８】請求項１３記載のデータ処理システムで
あって、インストラクションの第１のクラスが浮動小数点演算イ
ンストラクションであり、前記第１の演算ユニットが前
記インストラクションの第１のクラスを実行するために
専用化され、インストラクションの第２のクラスが浮動
小数点格納インストラクションであり、前記第２の実行
ユニットが前記インストラクションの第２のクラスを実
行するために専用化される、ことを特徴とするデータ処理システム。