WO1999045463A1

WO1999045463A1 - Processeur de donnees

Info

Publication number: WO1999045463A1
Application number: PCT/JP1998/000885
Authority: WO
Inventors: Yoshio Miki
Original assignee: Hitachi, Ltd.
Priority date: 1998-03-04
Filing date: 1998-03-04
Publication date: 1999-09-10
Also published as: US6810474B1

Description

明細書

情報処理装置技術分野

' 本発明はプログラムされた命令語に従い所定の動作を行う情報処理装置に係り、特に命令語間に参照データの依存関係が存在する場合において、情報処理装置の処理時間を短縮する技術に関する。背景技術

マイクロプロセッサに代表される情報処理装置では、プログラムされた命令語によって指定される演算を実施することにより、所望の情報処理動作を実施する。命令語の読み込みならびに演算の実行は命令語の順序に従うのが原則であり、このことからプログラム上、先行する命令によって生成されるデータを参照しょうとする後続命令は、先行命令の実行終了を待たねばならない。これは、いわゆるデータ依存によって後続命令はどんなに速くとも先行命令を追い越すことができないという制限である。

情報処理装置の処理時間短縮化の観点からは、何らかの予測手段によつて先行命令の実行結果を予測し、その予測に基づいて後続命令の実行を開始しない限り上述の制限を越えた時間短縮は不可能である。この例に限らず、予測に基づいて命令実行する方式は投機的な実行、あるいは投機実行と呼ばれ、ここで述べたデータ依存関係のある命令の投機実行方式については次の技術が知られている。

まず、 "IBM Journal of R&D， Vol.37 No.4 July 1993年発行頁 547- 564 "および EICE Transaciton on Information and Sys terns, Vol. E79-D No. 11 November 1996年発行頁 1523 - 1532 " ( 以下「文献 1」という。）に開示されている技術は、情報処理装置外部のメモリから情報処理装置内部のレジスタへデータを読み込む口一ド命令に関して、ロードすべきデータが格納されているメモリ上のァドレス、すなわちロードアドレスを予測する。ロード命令にとって口一ドアドレスは実行に不可欠な参照情報であり、一般には口一ドアドレスそのもの、もしくは口一ドアドレス計算に必要な情報が先行命令によつて生成され、ロード命令がそれを参照するという関係にある。また、ロード命令の実行時間は一般に長く、少しでも早くロード命令の実行開始をすることが望ましい。文献 1 に開示されている技術では、ロード命令が情報処理装置に読み込まれた際にその口一ド命令の格納されているァドレスをキーとして、過去にその口一ド命令が使用した口一ドアドレスを検索可能なキヤッシュ的な記憶機構を設け、実際に口一ドアドレスを確定する先行命令の実行終了を待たずに、ロードアドレスを予測する。このロードアドレスに基づいてメモリからのロード動作は開始する。一方、当該予測に基づかないロードアドレス計算も並行して実行される。この 2系統による口一ドアドレス計算結果は照合され、一致した場合には予測に基づいてメモリからのロードを先行した分だけ全体の処理時間が短縮される。一致しない場合は本来のロード命令の実行時間となる。なお、ロード命令によって口一ドされるデータを参照する命令は投機的に実行されることなく、ロードアドレス予測の正当性が判定されるまで実行が待たされる。

文献 1 では予測する内容がロードアドレスに限定されており、ロードした結果を参照する命令等を投機的に実行する点については開示されていない。この点に関して、一般の命令についてその演算結果を予測し、その予測された演算結果を参照する後続命令を投機実行するように拡張された技力 '24th International Symposium on Computer Arch itecture ( ISCA) 1997年開催、会議録頁 194 - 205 "， " 29th Annual IEEE/ACM International Symposium on Microarchitecture ( M ICRO-29) 頁 226 - 237" (以下「文献 2」という。 ) 、特開昭 60 12983 9号公報（以下「文献 3」という。）、特開昭 62-84340号公報（以下「文献 4」という。）、特開平 187634号公報（以下「文献 5」という。 ) に示されている。文献 2乃至 5に開示されている技術はいずれも過去の命令実行結果を格納する記憶装置を情報処理内に設け、命令が情報処理装置内に読み込まれた際、あるいは実行されようとしたときに、過去の実行結果を今回の実行の予測として出力する。もし、後続命令にデータ依存関係がある場合には、この予測結果が出力された時点で投機的に実行が開始する。このように、データ依存関係のある命令は一つながりの命令系列として順に投機実行されていく。これらの技術では本来の命令実行結果と予測結果は全て照合され、もし一致しなかった場合には、不一致の発生した直後のデータ依存がある命令から再実行される。つまり、予測に基づいて投機的に実行された結果は全て破棄され、命令実行が再びやり直される。発明の開示

上述のように、上記文献 1乃至 5に開示されている実行結果を予測しデータ依存関係のある後続命令を投機実行する情報処理装置では、投機実行の際に演算器が使用され、もし予測がはずれた際には再度同じ演算器が使用される。従って、演算器の使用頻度が増大し、演算器の競合による処理時間低下をまねく危険性がある。この問題点については、上記文献 1乃至 5では検討されておらず、本願発明者の検討の結果、見出されたものである。

また、上記文献 1乃至 5に開示されている技術では、過去の演算結果を格納する記憶手段が必要である。その容量は命令に対応してその演算結果を格納することから、いわゆる命令キヤッシュ程度の規模を持つ記憶手段が必要であると想定される。一般的な情報処理装置の場合、命令キヤッシュゃデータキヤッシュを増設する方が処理時間短縮には効果的である。従って、面積の限られた装置内に、命令実行の予測に用いる記憶手段を設けるとしても、一般的には、命令キャッシュやデータキヤッシュの容量を確保することの方が優先されるため、命令実行の予測に用いる記憶手段は小規模なものにならざるを得ない。

そこで、本発明の第 1 の目的は、データ依存関係のある後続命令を投機的に実行する際に、本来の演算器を使用せず、演算器競合を回避することにある。

また、本発明の第 2の目的は、小規模な実行結果の記憶手段を用いても、高い予測正当率を確保する技術を提供することにある。

上記第 1 の目的は、次の手段により解決される。すなわち、過去の命令実行結果をそのままその命令の実行結果として出力する履歴演算器と、オペランドが過去の値と同一の命令を履歴演算器に発行する命令発行回路を設け、投機実行そのものを省略する。これにより演算器の競合を回避できる。

上記第 2の目的は、次の手段により解決される。すなわち、過去の演算結果を格納する履歴キヤッシュ内に予測正当率の低い命令の命令ァドレスを格納するガードキヤッシュを設け、カードキヤッシュに登録されているァドレスの命令が再び履歴キヤッシュに登録されることを抑止する。これにより履歴キヤッシュには予測正当率の高い命令が保持されこととなり、小規模な実行結果の記憶手段を用いても、高い予測正当率を確保することができる。図面の簡単な説明

第 1図は、本発明の実施の形態を示す情報処理装置である。

第 2図は、本発明による情報処理装置の動作を示すフローチヤ一卜である。

第 3図は、命令実行管理バッファの構成図である。

第 4図は、レジスタマップ回路の回路図である。

第 5図は、状態更新回路の回路図である。

第 6図は、命令発行回路の動作を示す説明図である。

第 7図は、命令発行回路の回路図である。

第 8図は、命令発行回路の回路図である。

第 9図は、命令書き込み回路の回路図である。

第 1 0図は、ァドレスデコーダの回路図である。

第 1 1図は、空きェントリ一管理回路の回路図である。

第 1 2図は、コンプリーション回路の回路図である。

第 1 3図は、 st回路の回路図である。

第 1 4図は、 resultセルの回路図である。

第 1 5図は、 RAI， RBI の回路図である。

第 1 6図は、命令バッファ部記憶素子の回路図である。

第 1 7図は、履歴キャッシュの回路図である。

第 1 8図は、命令フォーマツト図である。

第 1 9図は、実施形態の変形例における RAI， RB1 の回路図である。第 2 0図は、実施形態の変形例における命令実行管理バッファである。発明を実施するための最良の形態

まず、第 1 図を用いて本発明の一実施形態である情報処理装置を説明する。第 1 図は情報処理装置のブロック図である。情報処理装置を制御する命令語は命令キヤッシュ 107 によって、主記憶装置 108から読み込まれる。主記憶装置 108 は半導体メモリ等で構成され、命令語および命令実行に必要なデータが格納されている。命令キャッシュ 107の構造ならびに機能はマイクロプロセッサ等で一般に使用されている技術であり、本発明の内容と深く関連がないため詳細な説明は省略する。信号線 2 01 は命令キヤッシュが読み込むべき命令語のァドレスを主記憶装置に伝えるァドレス線であり、命令語は信号線 200を経由して命令キャッシュ 1 07内に格納される。この情報処理装置が実行する命令のァドレスはプログラムカウンタ 110 によって示される。この実施形態ではァドレスを 32 ビットで表し、 1命令語は 32 ビットを使用するものとする。命令語は主記憶装置 108 内で 4バイト（32 ビット）毎の境界に必ず整列されているとすると、 1命令語を指示すのには 30 ビット必要である。このことから、プログラムカウンタ 110 は 30 ビットのレジスタで実現される。プロダラムカウンタ 110の内容は毎クロックサイクル毎に命令ァドレス 202 として出力され、このアドレスに対応する命令語が命令キャッシュ 107の信号線 203へ出力される。プログラムカウンタ 110の値は通常加算器 130 によって + 1つづ更新される。ただし、 ALU 109 にて分岐命令が実行され、実行すべき命令のァドレスが変更される際には、セレクタ 114 によつて新しい命令のァドレスがプログラムカウンタ 110 に入る。

命令デコーダ 113 は信号線 203 に出力された命令語をデコードする。また、命令アドレス 202 はラッチ 112 によって、命令キヤッシュ 107 と命令デコーダ 113の処理時間相当分遅延され、命令命令実行管理バッフマ 115の入力となる。命令語は第 1 8図に示すように 32 ビッ卜で表現され、最初の oped フィールド 1801 は命令の種別を表し命令デコーダ 113 によつて使用する演算器を識別する ALU番号 204 にデコードされる。 RT フィールド 1802 は演算結果が格納されるレジスタの番号を表す。命令デコーダ 113 はフィールドの切り出しだけを行い、 RT番号 205 として出力する。また、 RA フィールド 1803および RBフィールド 1804は命令語による演算の入力値（オペランド）を持つレジスタ（オペランドレジスタ ) の番号である。命令デコーダ 113 は RTフィールド 1802 と同様にフィ —ルドの切り出しだけを行い、それぞれ RA番号 206 と RB番号 207 として出力する。 Xフィールド 1805 は命令の拡張のために用い、本実施の形態では利用しない。また命令デコーダ 113 は oped フィ一ルド 1801 によつて示される演算がロード命令であるときに長レイテンシ信号 208を論理値 ' Γ にセッ卜する。この長レイテンシ信号 208 は後に述べる命令実行管理バッファ 115 の動作において、演算結果に予測値を充てることを意味しており、この動作の対象となる命令を区別する信号である。したがつて、長レイテンシ信号 208が ' Γ にセッ卜されるのはロード命令による場合に限られず、他の命令によつても長レイテンシ信号 208が' Γ にセッ卜されるよう拡張することも可能である。

履歴キヤッシュ 111 は、命令ァドレスを入力とし、その命令の過去に実行された際の演算結果を出力するキヤッシュである。本発明において主要な役割を果たすものの一つである。詳細な構造は後に説明するが、命令アドレス 202の 32 ビットは上位より 0 - 31 のビッ卜アドレスが割り当てられており、この 20 ビットから 29 ビットまでの 10 ビットまでを用いて過去の演算結果が格納されたメモリを参照する。命令ァドレス 202 の 0 ビットから 19 ビットまでは履歴キヤッシュ 111 を参照する際のタグビットとして用いられ、履歴キャッシュ 111 内に格納されているデータの有効性判定に用いる。命令ァドレス 202 に該当する命令が命令キヤッシュ 111 に格納されていた場合には命令キヤッシュヒット信号 209 が論理値 ' Γ にセットされ、命令実行結果の予測値が実行結果予測 210 に出力される。履歴キャッシュ 111 の更新は次の通りである。 ALU 109で実行された命令のァドレスは実行終了命令ァドレス 212、実行結果は ALU-DA TA 211 として履歴キャッシュ 111 に入力される。後述する履歴キヤッシュ 111 内部での詳細な制御を除き、原則的に ALU 109 で計算された結果と命令ァドレスとの対応は全て履歴キャッシュ 111への登録対象になる。ただし、不変検出信号 213が論理値 ' Γをとるとき、命令実行は予測通り実行されたものとして、履歴キヤッシュ 111への登録は抑止される。実行結果比較ュニット 116 は命令の実行予測結果と実際の ALU 109 による実行結果とを比較する。命令の実行予測結果は履歴キャッシュ 111 から実行結果予測 210 として出力され、命令実行管理バッファ 115から終了予測 214 として出力される。着目している命令に関しては実行結果予測 210 と終了予測 214の値は同一内容である。一方、本来の命令実行終了結果は ALU- DATA 211 に出力され、実行結果比較ュニット 116 にて比較される。実行結果比較ユニット 116 は実質的に比較器のみから構成され、終了予測 214 と ALU- DATA 211 とが一致するときに不変検出信号 213 に論理値' Γを出力する。

ALU 109 と命令実行管理バッファ 115 との接続関係は次のとおりである。 226, 227 はそれぞれ発行される命令のオペランドレジスタ RA， RBの番号を示す信号、 228 は発行される命令が使用する演算器の種類を識別する信号、 229 は命令のタ一ゲットレジス夕 RTの番号を示す信号、 230 は命令実行が投機的に実行されることを示す信号、そして 231 は命令実行管理バッファ 115 内のどの命令が発行されたかを識別する ID信号である。

ΗΕϋ 117 は履歴評価ユニット（Histrical Evaluation Unit)を略して命名した演算ュニットであり、本発明独自のュニットである。機能は単に、命令の実行予測結果をそのまま演算結果として HEU- DATA 215 として出力するだけであり、後述するように他の入出力信号に関しても論理的な演算なしで、そのまま出力するだけである。

レジス夕ファイル 118 は 32 ビッ卜のレジスタを 3 2本備えている。 AL ϋ 109 からオペランドレジスタ番号がオペランド要求 119 として与えられ、該当するレジスタ番号のレジスタ内容をオペランドデータ 120 として返す。レジスタファイル 118の内容を更新するのは命令実行管理バッファ 115 である。命令実行管理バッファ 115 は命令デコーダ 113から命令が転送され（この転送を命令のディスパッチと呼ぶ）、命令の実行結果が完全に確定するまでの間（この確定をコンプリ一ションと呼ぶ）、後述する命令実行に関する全ての情報を管理する。コンプリーション可能な命令は、いずれかのレジスタに値を出力する訳であり、そのレジス夕番号がコンプリ一ションレジスタ番号 216 として、データがコンプリ —ションデータ 217 としてレジスタファイル 118 に出力される。

以上が本発明の実施形態の概略構成の説明である。

次に、第 2図のフローチヤ一トを用いて本実施形態の情報処理装置を動作面から説明する。

本実施形態の情報処理装置には大別して次の動作モ一ドが存在する。一つは、通常のプロセッサと同様にデータ依存関係のある先行命令の終了を待ち、その終了の後に後続命令を実行するモードである。このモ一ドを通常モードと呼ぶ。二つ目は命令実行結果を実行の予測結果と比較し、もし全てのオペランドが予測と同一（オペランドを生成する命令の実行結果が予測通り）である命令については、通常の演算器での演算を行わずに予測結果をあたかも演算結果であるとするモードである。この二番目のモードを不変伝播モードと定義する。つまり、全ての入力デ一夕が予測、すなわち過去の実行結果と同じであった場合には、いま着目している命令も過去と同じ結果を生成するはずであり、実質的な演算は省略可能であるという考えに基づく動作である。三つ目のモードは従来技術における実行結果予測の利用法と同様に、実行予測結果に基づいて後続命令を投機的に実行するモードである。これを投機実行モードと呼ぶ。不変伝播モードでも予測結果を利用するが、実際の実行結果と一致する保証がある点が投機実行モードと異なる点である。

以上、 3つのモードは第 1 図の命令実行管理バッファ 1 1 5 の機能として実現され、第 2図のフローチヤ一卜にしたがって情報処理装置全体の命令実行が制御される。まず、履歴キャッシュ 1 1 1 に命令アドレスが入力され、命令の実行予測結果が取り出される（ 2 0 0 1， 2 0 0 2 )。無論、履歴キヤッシュに当該命令ァドレスが登録されていない場合も存在するが、そのような場合には通常モードしかありえないため、それについての説明は省略する。命令は命令デコーダ 1 1 3でデコードされ、もしロード命令のように長いレイテンシを要する場合には投機実行モードを実行する（ 2 00 3 )。投機実行の利点は本来の命令実行終了を待たずに後続命令の実行が開始できることにあり、命令実行サイクル数、つまりレイテンシが長い命令でなければ投機実行の効果が少ない。そこで、 2 0 0 3 において、長レイテンシを要する命令であるか否かを判断し、長レイテンシの場合には投機実行モードを実行するように制御する。これにより、投機実行の効果の少ない短レイテンシ命令が投機的実行されることによる演算器の混雑が解消される。長レンテンシでない命令は必ず ALL) 109 にて実行され、その実行結果は実行結果比較ュニット 116で履歴キヤッシュ 111 の出力結果と照合される（ 2004 )。両者が一致しない場合には、実行結果の予測情報を活用することは不可能であり、後続命令はオペランドが計算済みになったことを検知して命令実行を開始する（2005 )。これが先に述ベた通常モードに相当する。第 2図のフローチヤ一卜上 2004の分岐に戻り、命令実行結果と予測結果が一致した時には、実行結果比較ュニット 1 16 から不変検出信号 213が出力され、命令実行管理バッファ 115 内で待機している後続命令に、演算結果と予測結果が一致していることが伝えられる。もし、待機している命令のオペランド全てが予測結果と同じである場合には、先に述べた原理により、その待機している命令の実行結果も予測と同じものになるはずである。具体的には待機していた命令は H EU 117 に転送され、予測結果をそのまま実行結果とする。この結果をさらに命令実行管理バッファ 115 内でオペランドとして待っている命令が存在する場合には、やはり HEU 117 に転送される。このように、一旦、実際の演算結果と予測結果が一致すると、その演算結果をオペランドとしている命令も予測通りの結果になる可能性があり、いずれかのオペランドが変化する命令に遭遇するまで、上記の連鎖反応的動作は継続可能である。この、一連の動作を不変伝播（ 2006 )と呼び、不変伝播によって HEU 117の機能だけで演算を実質的に完了することができる。不変伝播によってえられた実行結果（予測結果に等しい）は真の実行結果と等しいため、レジスタファイル 118 に反映することが可能である（2007)。長レイテンシ命令の場合には投機実行モードの動作が行われる（ 2003 )。投機実行モードでは予測による実行結果の正当性が確認される前に後続 W

12

命令の実行を開始する。つまり、長レイテンシ命令は命令実行管理バッファ 115から ALU 109 と HEU 117の両方に転送される（ 2009 )。このように命令実行管理バッファ 115から ALU 109あるいは HEU 117へ命令が転送されることを命令発行と呼ぶ。 HEU 117からは予測に基づく結果が実行結果であると、先の不変伝播と同様の経路で命令実行管理バッファ 115内で待機している命令に伝えられる。以降は先に述べた連鎖反応的不変伝播動作が繰り返される（ 2008 )。ただし、投機実行モードではたとえ不変伝播によって予測に基づく計算結果が求まろうとも、真の結果として考えることはできない。つまり、長レイテンシ命令は ALU 109 と HEU 117の両方に発行されている訳であるから、 ALU 109での実行が終了した時点で予測が正しかったか否かを判定することができる（2010)。この判定は実行結果比較ュニット 116にて実施される。もし、予測と真の実行結果が一致した場合には（2010)、投機的な不変伝播動作が全て正しかったことを意味し、当該、長レイテンシ命令と、不変伝播によって予測結果を実行結果とした命令は全て、コンプリーション可能となる（20 11)。さらに、予測と真の実行結果が不一致の場合には、データ依存関係のある全命令を ALU 109にて再実行する（2012)。

以上が、本実施形態における情報処理装置の通常モード、投機モード、不変伝播モードの動作説明である。本発明による情報処理装置では、過去の履歴に基づいて予測した値が正当な場合には、その値を参照する後続命令もまた、過去と同じ結果を出力するであろうという考えに基づき、本来使用すべき演算器を用いない不変伝播なる方法にて予測に基づく実行結果を求める。これにより、演算器の混雑が緩和される。

次に、上述の情報処理装置の動作を実現する各部詳細を説明する。

第 3図は命令実行管理バッファ 115の構成図である。命令バッファ部 3 00 は実行前の命令を待機させるためのバッファを構成している。命令バッファ部 300 は命令の構成情報を格納する以下のメモリ素子から成る。 R BI(301a， 301b， 301c， 301d)はオペランドレジスタ RBの値を生成する命令が格納されている、命令バッファ 300 内の位置情報を格納する。 RAK 302a, 302b, 302c, 302d) ii RBI と同じ物理的構成を持ち、オペランドレジスタ RA の値を生成する命令が格納されている、命令バッファ 300の位置情報（これを命令 10 と定義する）を格納する。 58(3033， 30313， 303(， 3 03d)は予測される実行結果を格納する。 RB( 304a, 304b.304c, 304d)はオペランドレジスタ RAのレジスタ番号を格納する。 RA(305a， 305 b， 305 c, 305 d)はオペランドレジスタ RBのレジスタ番号を格納する。 ALU#(30 6a, 306 b, 306 c, 306 d)は命令デコーダ 113でデコ一ドされた命令が使用する演算器を識別する番号を格納する。 st( 307a， 307b, 307c， 307d)は格納されている命令の状態を管理するために、状態に対応したフラダビッ卜を持つ。 result( 308a， 308b, 308c， 308d)は命令の実行結果が格納される。 TA( 309a， 309b， 309c， 309d)にはは命令のターゲットレジスタ番号が格納される。縦 1列の例えば RBI 301a, RAI 302a, ER 303a, RB 304a, RA 305a， ALU# 306a， st 307a, result 308a, TA 309aは一命令分を格納するのに用いられる。したがって、第 3図に示した例では 4 命令を命令バッファ部 300 に格納することができる。この格納可能な命令数は特に本発明で限定されるものではなく、任意の命令数に拡張可能である。

命令書き込み回路 310 は命令デコーダ 113および履歴キヤッシュ 111 から命令実行管理バッファ 115へ送られてきた ALL)番号 204， RT番号 20 5， RA番号 206， RB番号 207，予測結果 218を命令バッファ部 300 に書き込む。ここで、予測結果 218 は、第 1 図の履歴キヤッシュ 111 からの実行結果予測 210 とラッチ 112から出力される命令ァドレス 219を束ねた束線である。命令書き込みの際、命令書き込み回路 310は write- req信号を論理的' 1'にセッ卜し、書き込み要求があることをアドレスデコーダ 311 に伝える。また、 RBI(301a， 301b, 301c， 301d)および RAI( 302a， 3 02b， 302c， 302d)へ格納するデータを生成する。つまり、 RT番号 205， R A番号 206， RB番号 207は命令書き込み回路 310に入力されると同時にレジスタまぷ回路 312へも入力され、 RA番号、 BR番号で示されるレジス夕がどの先行命令によつて生成されるのかを命令 IDへの変換結果が Rai d 352, Rbid 353として命令書き込み回路 310へ返される。 RBI(301a， 301 b， 301c， 301d)および RAI(302a, 302b, 302c， 302d)に格納される命令 IDはこの Raid 352, Rbid 353である。命令バッファ部 300の空きを管理するのは、空きエントリ一管理回路 313である。空きエントリ一管理回路 313は全 st(307a, 307b， 307c, 307d )に示される格納している命令があるか否かの情報を基に、空いている命令バッファ部 300の位置情報を命令 ID 355 として出力する。

状態更新回路 314は HEU 117 と ALU 109から実行結果が返される毎に、 st(307a, 307b， 307c, 307d)で示されるコンプリーション可否情報を更新する。また、実行結果が返されるときには実行した命令の ID (命令バッファ部 300内の位置情報）が ΗΕϋ終了信号 220， ALU終了信号 221 として返され、全 RBI (301a， 301b， 301c， 301d)および RAI ( 302a, 302 b, 302c， 302d)に告知される。後述するように、 RBし RAI は告知された命令 IDがオペランドを生成する命令として待っていたものであれば、自己で管理しているオペランドの準備完了を示すフラグを更新する。

命令発行回路 315は全

a, 302b， 302c， 302d)の保持する状態を調べ、命令を実行するのに必要なオペランドが揃った命令を ALU 109または HEU 117へ転送する。

次に命令実行管理バッファ 115を構成する各部分の詳細を説明する。第 4図はレジスタマツプ回路 312の回路図である。レジスタマップ回路 312の基本動作は次の二つである。一つは命令実行によつて変更される RT番号 205の登録である。 Tawrite 356が論理値 ' Γに設定されるときは、新しい命令が命令実行管理バッファ 115 に登録されることを意味し、その命令によってターゲットレジスタ（RT)の内容が将来変化することになる。命令 ID 355は命令バッファ部 300内の空き領域を示しており、論理ゲ一ト 400， 401, 402は 3 ビット表現の命令 IDを 4 ビッ卜のいづれかが' Γ となるよう、デコードする。 4 ビッ卜にデコードする理由は命令バッファ部 300に 4命令格納可能であることに対応する。書き込み用クロックは論理ゲート 403， 404， 405， 406によって生成される。デコードされた命令 ID 450, 451， 452, 453のいずれか一つ力 Γであり、 RT番号 205はフリップフロップ 407， 408, 409， 410のいづれか一個所とフリップフロップ 411， 412， 413, 414のいづれか一個所に記録される。以上が RT番号の登録である。

レジスタマップ回路 312は他にオペランドレジスタ番号変換機能を持つ。オペランドレジスタ番号は RA番号 206および RB番号 207として入力される。仮に、 RA番号 206がフリップフロップ 408の保持している番号に一致しているとすると、その一致は比較器 416にて検出され、 RAhi t 351 に ' Γがセットされる。この検出信号はさらにセレクタ 424を制御し、 Raid 352に" 2"を出力する。これは、命令バッファ部 300内の位置関係として 2番めの命令が R A番号 206で示されたオペランドレジスタを書き換えるということを意味する。以上説明したフリップフロップ 408 と比較器 416 とセレクタ 424の関係は他のフリップフロップ、比較器、セレクタの組（ 407， 4i5， 423 )(409， 417, 425)(410, 418， 426)(411， 41 9， 427 )(412, 420， 428)(413， 421， 429)(414, 422， 430)にぉぃても同様である。したがって、入力されたオペランドレジスタ番号はそれを書き換える命令の命令 ID (命令バッファ部 300 の位置情報）に変換され、もし、上記の検索にて該当する情報がないときには RAhit 351, Rbhit 35 4 は' 0 ' になる。

第 5図は状態更新回路 314の回路図である。 HEU 117からは HEU終了信号 220 として命令 IDカ、 HEU-DATA 215 には実行結果としての予測値が、また HEU に発行された命令が投機的である場合には HEU投機実行信号 221 が返される。 ΗΕϋ終了信号 220 は論理ゲート 500, 501 によって、非 0であることがチヱックされる。これは HEU 117 からの信号が有効であることを意味する。論理ゲ一ト 501 の出力信号 550 は二つの用途に使用され、まず、ラッチ 502， 503， 504のクロックとなり、 ΗΕϋ 117からの信号をラッチする。また、予測に基づきオペランドが決定したことも意味する信号であるため、その決定根拠を知らせるために、全 RBI(301a， 3011：， 301 3011)ぉょび

， 30213， 302 302(1)へラッチ 502でラッチされている命令 ID 359 と共に配信される。 ΗΕϋ-DATA 215 は一旦ラッチ 503 にラッチされ、 result(308a， 308b， 308c， 308d)へ格納される。このとき、いずれの result に格納されるか識別するために、命令 ID 359 もあわせて束線 358 として配信される。 HEU投機実行信号 221 は終了結果が投機的予測に基づいていることを意味する。論理ゲート 505 は HEU投機実行信号 221 の否定と出力信号 550 の ANDを生成する。生成された信号はデマルチプレクサ 506 によって、命令 IDが示す位置の com plete可信号 357を ' Γ にセットする。

ALU 109から送られてくる ALU終了信号 223 は論理ゲート 507， 508 で非 0が検出され、出力信号 552が生成される。出力信号 552はラッチ 509, 510, 511， 512のクロックとなる。 ALU投機実行信号 224力 0'のとき（513)命令実行結果は予測的要素がなく、命令のコンプリ一トが可能である。この条件を論理ゲート 513にて判定し、デマルチプレクサ 514で分配する。論理ゲート 515 は ALUで終了した命令が投機実行でなく、過去の予測結果と一致しないとき、いわゆる普通に実行し、命令のコンプリ一卜が可能になったとして信号 555を生成する。信号 550， 553, 554, 5 55， 556はすべて ALU 109または ΗΕϋ 117で生成されたオペランドの生成要因を示しており、束線 359にまとめられ、 RBK301a， 301b， 30ic， 3 Old), RAI ( 302a， 302b， 302c， 302 d)内の状態フラグを変更するのに用いられる。

次に第 6図、第 7図、第 8図を用いて命令発行回路 315の動作と回路を説明する。第 6図は命令実行管理バッファ 115で待機中の命令の状態と命令発行回路 315の動作との関連を示す表である。表の中で" D確定" とは命令デコ一夕 113から命令実行管理バッファ 115へ命令をディスパツチする際に既にオペランドが確定していたことを表す。 "投機確定"とは自身を含むデータ依存関係のある先行命令のいずれかが、投機的に実行されたことを意味し、オペランドの内容が誤っている可能性を示している。 " 不変確定" とは ALUで実行した結果が予測結果と一致していた力、、もしくは HEUで予測値をそのまま実行結果として出力して、決定したオペランドであることを意味する。 " 通常確定" とは" D確定" ， " 投機確定" 、 " 不変確定" のいずれでもない手段でオペランドが確定した状態を意味する。一般的なプロセッサの実行ではオペランドはディスパッチ時に既に確定しているか（D確定）、先行命令が終了して確定するか（通常確定）であるから表の四隅の状態、すなわち、単に ALUへ命令発行する動作だけが行われる。投機実行可能な従来技術では表の" 投機のみ" の状態が付加されるが、本発明ではオペランド確定の条件に不変確定の状態を設けた点に特徴があり、これにより、 ALUを使用せずに代わりに HEUへ命令発行することで、 ALUの競合、混雑を回避できる。

第 7図は命令発行回路 315の回路図である。発行可能条件判定回路 70 0a， 700b， 700c， 700dはそれぞれ命令バッファ部 300において格納可能な 4命令に対応しており、内部回路としては同一であるため、 700aのみについて説明する。論理ゲ一卜 701， 702, 703は IRAから入力されるオペランドの確定条件（7513， 7523, 7533, 7543)と（75113， 75213， 75313， 754& ：)とから命令発行可能である条件を判定する。すなわち、二つのオペランドがいずれかの要因にて確定した場合に命令発行可能となる。但し、すでに発行済みの命令は再度発行できないため、 st(307a, 307b， 307c， 30 7d)の保持している発行済みフラグが' 0'であることが論理ゲート 704にて判定され、発行信号 780aが生成される。また、発行しょうとする命令が長レイテンシの命令である場合には、 ALU 109 と HEU 117の両方に発行するため、長レイテンシ信号 759から二重発行信号 779aが生成される, オペランドの決定要因の中に投機確定、不変確定が含まれている場合には論理ゲ一ト 705， 706, 707, 708にて投機実行信号 781aと不変実行信号 782aとが生成される。

この命令発行回路では複数の命令が発行可能であつたとしても 1命令だけを発行する。発行信号 780a， 780 b， 780c， 780dは論理ゲート 709, 7 10, 711によって優先順位付きの 3 ビット 778a, 778b， 778cにェンコ一ドされる。また、論理ゲ一ト 712， 713, 714, 715, 716， 717によって、 AL U 109 と HEU 117のどちらの演算器が使用されるかを識別する信号、 AL U選択 775 と HEU選択 776、および命令実行が投機的に行われることを示す投機状態信号 777 を生成する。発行された命令は命令バッファ 300 内での状態が変化するので、発行済みフラグをセットする信号 369を命令バッファ部 300に出力する。回路図は第 8図に続く。第 8図の選択回路 718 は発行すべき命令がどの命令かを示す信号 778a， 778b, 778c に基づき ALU# ( 759 c, 760, 761, 762 ), RA ( 763, 764, 765, 766 ), RB ( 767, 768, 769, 770 ), ER (771， 772， 773, 774)のそれぞれ四つから一つを選択し、さらに、 ALU選択信号 775, HEU選択信号 776 に基づいて発行先を決定する。

第 9図は命令書き込み回路 310 の回路図である。この回路は命令デコーダ 113からディスパッチされてきた命令に関する情報を命令バッファ部 300 に書き込むだけで、複雑な論理的機能を持たない。この実施形態ではターゲッ卜レジスタ番号 0以外の命令が有効である。この非 0条件を論理ゲ一ト 900が調べ、 Tawrite 356 と write- req 350を生成する _c この二信号は同一の信号である。他の信号もラッチ 901， 902， 903, 904， 905, 906, 907, 908, 909, 910, 911 に一旦ラッチされた後に命令バッファ部 300へ書き込むための信号として出力される。ただし、 RAI， RBI に書き込む数値は命令の情報としては与えられないため、 Raid 352, Rbid 353をそれぞれ命令が待機すべき命令 IDの情報として用いる。また、 RA hit 351 と Rbhit 354 はレジスタマップ回路 312 の検索において検索がヒットしたことを意味している。したがって、ヒットしなかった場合にはオペランドが既に確定していることになり、後述する RAI， RBI の D 確定フラグを ' Γにセッ卜する信号となる。このように、命令書き込み回 ¾ 310 ii st(307a, 307b, 307c, 307d)ci: RAl (302a, 302b, 302c, 302 d)， RBI (301a， 301b, 301c， 301d)の初期値を決定する。また、 st( 307a, 307b， 307c， 307d)n 内の長ティテンシ一フラグは信号 234が直接セットされる。回路図として示してはいないが、 st のフラグである、 isuue済み、コンプリート可は 0に RS使用中フラグは ' Γ に初期化する。また、 R AI, RB1 の投機確定フラグ、通常確定フラグ、不変確定フラグは' 0' に初期化する。

第 1 0図はアドレスデコーダ 311 の回路図である。空きエントリ一管理回路 313 は 3 ビットの束線で命令バッファ部 300 の書き込み可能な位置を示す。論理ゲ— ト 1000， 1001, 1002, 1003, 1004， 1005， 1006， 1007, 1008 はこの 3 ビッ卜の信号をデコードし、書き込み信号 1100, 1101， 11 02， 1103のいずれか一つが' 1' となるようにデコ一ドする。書き込み信号 1100〜1103 は紙面の都合上、束線 1104 にまとめて表記する。空きェントリ一管理回路 313の回路図は第 1 1 図に示されている。 st( 307a， 30 7b， 307c， 307d)内部の RS使用中フラグは信号 1106， 1107， 1108， 1109 として常に出力されている。これらの信号は束線 1105 として空きェントリー管理回路 313の入力となる。したがって、いずれかのフラグ力 0' になると命令 I Dを 3 ビッ卜にェンコ一ドしたかたちで出力する。命令バッファ部 300 に空きが無いときには命令 ID 355 は 0になる。

第 1 2図はコンプリーション回路 316 の回路図である。コンプリート決定回路 1200 は命令ノくッファき U 300の st( 307a， 307b， 307c， 307d)力、' 保持している状態情報（755， 756， 757， 758 )を入力し、この中でコンプリ一ト可フラグが' Γ となっている命令を選択する。このとき、複数のコンプリ一ト可フラグ力 Γ になっている可能性があるため、優先順位がつけられ、選択信号 1250, 1251, 1252, 1253のいずれか一つだけが' Γ になる。命令情報選択回路 1201 は命令バッファ部 300が保持している命令情報のなかで、ターゲットレジスタ（ 360, 361, 362, 363 ) と演算結果である result ( 364， 365, 366, 367 )を選択信号 1250， 1251 , 1252, 1253 に従つて選択する。選択結果はターゲットレジスタに関しては論理ゲ一ト 120 3 に集約されコンプリーションレジスタ番号 216 として出力される。演算結果については、論理ゲート 1204 に集約され、コンプリーションデータ 217 として出力される。命令バッファリセット回路 1202 はコンプリートした命令について、 st( 308a， 308b， 308c， 308d)に保持されている RS使用中フラグを' 0' にリセットするための信号 368を生成する。

第 1 3図は命令バッファ部 300 内の st(307a， 307b， 307c， 307d)の回路図である。構造的には 4命令分は同じ回路である。長レイテンシーフラグ保持回路 1300 は、待機している命令が長レイテンシー命令であること示す長レイテンシ一フラグを保持する。このフラグ情報は命令の属性であり、特に書き換えられないため、通常のラッチでこの情報を保持する。コンプリート可フラグ 1301 は状態更新回路 314 によって、命令のコンプリ一卜が可能になつた際に ' Γ にセッ卜される。初期値は命令書き込み回路 310 により ' 0' に設定され、 ' Γ は保持している値を信号線 357を使って強制的に書き換える。発行済みフラグ 1302 はコンプリート可フラグ 1301 と同じ回路で構成される。初期値は' 0'であり、命令発行回路 31 5 によって命令が発行されたときに ' Γがセットされる。また、命令の実行が終了したときには、状態更新回路 314 によって' 0' にリセッ卜される' これは、投機的に実行された命令は予測がはずれた際に再び命令発行されることがあるからである。 RS使用中フラグ 1303 は命令バッファ部のエントリ一が使用中であることを示す。命令がコンプリ一トすると' 0' にリセットされる。

第 1 4図は result( 308a， 308b， 308c， 308d)の回路図である。 4つの回路はァドレスデコーダ 1400が命令バッファ部 300 内の位置によって異なるだけで他は同じである。ここでは result 308aの例を示す。状態更新回路 314から送られる信号 358は演算結果が終了した命令の命令バッファ 300内での位置を表す命令 ID 1450 と命令の実行結果のデータである結果データ 1451から成る束線である。また、状態更新回路 314では A LU 109 t HEU 117からの最大 2命令が処理されることがあり（result への書き込みは必ず 1つ）、 ALUで終了した命令の命令 ID 1454 と ΗΕϋ 117で終了した命令の命令 ID 1455 さらにそれぞれからのデータ 1452, 1453が束線の構成要素となる。この実施形態における情報処理装置ではデータを 32 ビットで考える。 resultの役割はデータを保持するだけであり、アドレスデコ一タ 1400にて、 result 308aへの書き込み要求であることがデコードされると、書き込みクロック 1456が生成される。デ —タはセレクタ 1401で選択され、ラッチ 1402に格納される。

^ 1 5 ¾(i AI(302a, 302b, 302 c, 302d), RB 1(301 a, 301b, 301c, 30 Id)の回路図である。この 8個の回路はすべて同じであり、 RAI 302aを例にして説明する。 RAI 302aはオペランドとして終了を待っている命令 IDを保持するラッチ 1504 と D確定フラグ 1503，通常確定フラグ 1500，投機確定フラグ 1501，不変確定フラグ 1502 とから構成されている。状態更新回路 314は終了した命令の命令 IDを信号線 359に出力する。終了する命令は ALU 109によるものと HEU 117によるものの最大 2命令存在する。この命令 IDはラッチ 1504の内容と比較器 1505, 1506で比較され、一致した場合には通常確定フラグ 1500，投機確定フラグ 1501，不変確定フラグ 1502の書き込みトランジスタ 1507， 1508， 1509， 1511， 1512を開き、それぞれのフラグが保持している内容を状態更新回路から出力された内容に書き換える。

第 1 6図の回路図は丁八（3093, 30913， 309 309 ， [^(3053， 30513， 30 5 305 O， RB(304a， 304b， 304c， 304 n， ALU#(306a, 306b， 306c， 306d )， ER(303a. 303b， 303c， 303d)の回路図であり、 20個の回路は全て同じであるため、例として TA 309a を説明する。ターゲットレジスタ番号 9 50 は 5 ビッ卜で構成されており、書き込みの選択信号 1100が ' Γのときにラッチ 1600へレジスタ番号を取り込む。

以上説明した回路により、命令実行管理バッファ 115 はデータ依存関係のある後続命令を先行命令の終了まで待機させる。先行命令が終了すると、 ALU 109 は結果を命令実行管理バッファ 115へ送り、後続命令は必要なオペランドが全て揃った時点で、 ALU 109 または HEU 117へ発行される。この一連の動作において、 ALU 109 の実行結果が実行結果比較ユニット 116 で比較され、一致したときには、後続命令が HEU 117へ発行される。 HEU 117 は命令の過去の実行結果をそのまま結果として出力するだけの演算器であり、実質的な命令実行は省略される。この他に、 · ロード命令のように実行時間の長い命令は命令実行管理バッファ 115で先行命令の終了を待つことなく ALU と HEUの両方に発行される。 ΗΕϋ に命令が発行されると、後続命令も HEU にて実行され続ける。もし、ロード命令の ALU における実行結果が予測と一致した場合には、 HEUで実行された後続命令はすべてコンプリ一ト可能となる。一致しない場合には再度実行し直す。このように、過去の履歴に基づく予測がある命令に対して正当であった場合には、後続命令もまた、過去の履歴がそのまま実行結果になる可能性が高く、従来技術のように、ある命令の実行結果を予測した後、後続命令を ALUを使って投機的に実行することにより発生する ALUの混雑は緩和される。

次に履歴キヤッシュ 111 の回路を第 1 7図を使って説明する。命令ァドレス 202 は 32 ビッ卜で構成される。命令語は 4バイト境界に整列されていると 30 ビッ卜で 1 命令をァドレスすることができる。 0 ビットを最上位ビッ卜とすると、 0〜 19 ビットがタグ部分 1750、 20 - 29 ビッ卜力セットアドレス部分 1751 に分けられる。データメモリ 1700 は同時読み出し/書き込み可能な 2ポ一卜メモリであり、セットアドレス 1751 が入力されると、メモリに格納されている内容を実行予測結果 210 として出力する。タグメモリ 1701 もまた同時に読み出し/書き込み可能な 2ポ一トメモリである。タグ部 1702 にセットアドレス 1751 が入力されると、命令ァドレスの上位に相当するタグ情報が出力 1752 に現れる。タグ情報は比較器 1704で命令アドレスの上位と比較され、一致した場合には、タグー致信号 1753 が出力される。フラグ部 1703 はセットアドレス 1751 によって読み出されるタグ情報の有効性を示すビットが格納されている。ここでは論理値' Γが有効であり、先のタグ一致信号 1753 と読み出されたフラグ情報 1754が共に' Γであるとき、履歴キヤッシュヒット信号 20 9 が出力される。

以上が履歴キャッシュの読み出しに関する説明である。命令実行管理バッファ 115から命令発行の際に出力される命令実行結果予測信号 225 は命令ァドレス 212 と予測のデータ部である 214から構成されている。 A LU 109で終了した命令のァドレスは履歴キャッシュ 111 に実行終了の命令アドレス 212 として入力され、実行結果のデータは ALU-DATA 211 として入力される。命令ァドレスはキャッシュ読み出しのときと同様にタグ部 1755 とセットアドレス部 1756 とに分離される。実績管理メモリ 17 05 は実績記録部 1706 と夕グ管理部 1707 とから構成さる。実績記録部 1 706からはセットァドレス 1756 に対応する予測実績が数値として読み出され、比較器 1708で' 0'であるか否かが照合される。照合結果は低実績信号 1757 として出力される。一方、タグ管理部 1707からは命令アドレス上位が読み出され、比較器 1709 にて読み出した予測実績情報が命令ァドレス 212 に関するものであるかどうかが検証される。比較器 1709 の出力は実績あり信号 1758 として出力される。この 2信号が両方ともに ' Γ であるとき、 Guardキヤッシュ書き込み信号 1759 が生成される。

Guardキャッシュ 1709 はフルァソシァティブの連想メモリであり、命令アドレス 212が登録されているときには出力 1760 に ' Γがそうでないときには' 0'が出力される。また、 Guardキャッシュ書き込み信号 1759 力 Γのときには、命令アドレス 212を登録する。論理ゲ一ト 1710， 171 1 はデ一タメモリ 1700，タグメモリ 1702,実績管理メモリ 1705 に対する書き込み信号 1761 を生成する。書き込み信号 1761 力 1'のとき、デ一タメモリ 1700 には命令の実行結果である ALU-DATA 211 の内容が書き込まれ、タグメモリ 1701 にはメモリアドレスのタグ部 1755が書き込まれ、同時にフラグ部 1703 には ' Γが書き込まれる。実績管理メモリ 170 5の実績記録部 1706 は不変検出信号 213力 1'のときには保持されている値を +1 し、 ' 0'のときには一 1 された値を書き込む。タグ管理部 1707 には命令ァドレスのタグ部 1755が書き込まれる。 Guardキャッシュ 170 9 に命令アドレス 212が登録されているときには、出力 1760 に ' Γが出力されるので、データメモリ 1700，タグメモリ 1702，実績管理メモリ 17 05 に対する書き込み信号 1761 は' 0' となる。従って、 Guardキャッシュ 1709 にそのァドレスが登録されている命令の実行結果はデータメモリ 17 00 に書き込まれない。

以上述べた履歴キヤッシュ 111 を動作の観点から整理すると次のようになる。命令実行結果が ALUから返されたときに、その命令が履歴キヤッシュに既に登録されており、かつ予測実績が良くないとき（実績値が 0のとき）、その命令アドレスは Guardキャッシュに登録される。一旦、 Guardキャッシュに登録された命令ァドレスは再びデ一タメモリ 1700 に W

26

登録されることはない。また、履歴キャッシュに既に登録されており、かつ予測正当の実績が良い命令については、 Guardキャッシュに登録されていない限りデータメモリ 1700 の更新に使用される。当然、履歴キヤッシュに登録されていなかった命令の場合にはデータメモリ 1700 に登録される。このように、予測動作にとって不利益な命令を Guardキヤッシュ 1709 で管理することにより、より少ないキヤッシュ資源で高い予測正当率を得ることができる。

上述の実施形態では、ロード命令のように実行レイテンシが長い命令種に限って、予測に基づく投機実行をおこなう。しかし、命令デコードから命令実行終了までを命令のレイテンシと考えると、命令実行管理バッファ内で長く停留する可能性のある命令も予測に基づく投機実行对象とすることが望ましい。つまり、命令実行管理バッファ内で待機している命令には、すでに発行済みの命令の実行終了を待機している命令と、未だ発行されていない先行命令の発行および実行終了を待機している up 令とが存在する。後者の命令は実行されるまでに待機させられる時間が長いと考えられ、ここに述べる実施形態の変形例ではこの種の命令も予測に基づく投機実行の対象とする。具体的には、第 1 9図に示すように、命令発行回路 315 は発行する命令のターゲットレジスタ番号と発行される命令の命令バッファ部 300 内の位置情報である命令 IDを発行終了信号 370 として、状態更新回路 314 とレジスタマップ回路 312へ伝達する。状態更新回路 314 は発行された命令の命令 IDを RAI (302a， 302 b， 302c， 302d)と RBI(301a, 301b, 301c, 301d)全体に通告する。 RAI(302a， 302 b, 302c, 302d) i RBI(30ia， 301b, 301c， 301d)は第 2 0図に示すように第 1 5図に示した回路に先行命令が既に発行されたことを示す、発行5 済み状態保持回路 1503を追加することで実現できる。命令発行回路 315 は発行しょうとする命令の発行済み状態保持回路内容を調べ、 RAI， RBI が共に発行済みである場合を除いて、投機的に命令を発行する。また、命令によっては命令実行管理バッファに登録される前に先行命令が発行済みになつている場合がある。発行終了信号 370はレジスタマップ回路 3 12にも入力され、発行済み命令のターゲッ卜レジスタ番号が命令発行回路 315によって通告される。もし、命令実行管理バッファに登録しょうとする命令のオペランドレジスタに関して、その先行命令が既に発行済みの場合には RA発行済み信号 371， RB発行済み信号 372に ' Γが返される。先行命令がすでに発行済みの命令に関して、命令書き込み回路 310 は命令バッファ部 300に命令を書き込む際に、発行済み状態保持回路を' Γにセッ卜する。このように、予測に基づく投機実行の対象となる命令を命令実行管理バッファ内に停留する時間の長い命令とすることも可能である。

本発明によれば、過去の履歴に基づいて実行結果を予測し、実際の実行結果と一致したとき、後続の命令を ALUにて投機的に実行するのではなく、 HEUで処理する。これにより、従来技術において同じ ALUを用いて投機実行されていた後続命令により ALUが使用され、 ALU混雑によつて他の命令実行が阻害されることが防止できる。

さらに、履歴キャッシュ内に予測の正当率を管理する実績管理メモリと正当率の低い命令を記録する Guardキャッシュを設けることにより、予測正当率の低い命令によつて不当に履歴キヤッシュが使用されることを防止する。以上により、命令実行が先行命令の実行終了を待たずに実行でき、全体の処理時間が短縮される。

Claims

請求の範囲

1 . 命令を実行する演算器と、

上記命令の過去の実行結果を格納する格納装置と、

上記命令の上記演算器での実行結果と、格納されている上記命令の過去の実行結果との一致比較をする装置とを有する情報処理装置において、先行命令の上記演算器での命令実行結果と、上記格納装置に格納されている上記先行命令の過去の実行結果とがー致する場合に、上記先行命令とデータ依存関係のある後続命令を上記演算器で実行せずに、上記格納装置に格納されている上記後続命令の過去の実行結果を出力する装置を有することを特徴とする情報処理装置。

2 . 命令を実行する演算器と、

上記命令の過去の実行結果を格納する格納装置と、

上記命令の上記演算器での実行結果と、格納されている上記命令の過去の実行結果との一致比較をする装置とを有する情報処理装置において、先行命令が所定の命令であるか否かを判断する手段と、

上記先行命令が所定の命令である場合に、上記先行命令とデータ依存関係のある後続命令を上記演算器で実行せずに、上記格納装置に格納されている上記後続命令の過去の実行結果を出力する装置、

とを有することを特徴とする情報処理装置。

3 . 上記所定の命令は、その命令実行サイクル数に応じて決定されることを特徴とする特許請求の範囲第 2項に記載の情報処理装置。

4 . 命令を実行する演算器と、

上記命令の過去の実行結果を格納する格納装置と、

上記命令の上記演算器での実行結果と、格納されている上記命令の過去の実行結果との一致比較をする装置とを有する情報処理装置において、上記命令の上記演算器での実行結果と上記命令の過去の実行結果との一致頻度を記録する装置を有することを特徴とする情報処理装置。

5 . 上記一致頻度が基準値以下の命令の演算器での実行結果が上記格納装置に格納されることを禁止する装置とを有することを特徴とする特許請求の範囲第 4項に記載の情報処理装置。

6 . 命令を実行する演算器と、

上記命令の過去の実行結果を格納する第 1 の格納装置と、

上記命令の上記演算器での実行結果と、格納されている上記命令の過去の実行結果との一致比較をする装置とを有する情報処理装置において、上記命令の上記演算器での実行結果と上記命令の過去の実行結果との一致頻度を記録する装置と、

上記一致頻度が基準値以下の命令を格納する第 2の格納装置、とを有することを特徴とする情報処理装置。

7 . 上記第 2の格納装置に格納された命令の上記演算器での実行結果が上記第 1 の格納装置に書き込まれることを禁止する装置とを有することを特徴とする特許請求の範囲第 6項に記載の情報処理装置。

8 . 命令を実行する演算器と、

上記命令の過去の実行結果を格納する格納装置と、

格納された上記命令の過去の実行結果を出力する装置と、

実行待ちの上記命令を保持する装置と、

上記実行待ちの上記命令が上記保持装置に停留する時間の長短を判断する装置と、

上記演算器又は格納された上記命令の過去の実行結果を出力する装置の何れかに命令の発行をする装置、

とを有し、上記命令発行装置は、上記実行待ちの上記命令が上記保持装置に停留する時間の長い場合には、上記命令の過去の実行結果を出力する装置に命令を発行することを特徴とする情報処理装置。

9 . 上記実行待ちの上記命令が上記保持装置に停留する時間の長短を判断する装置は、上記実行待ちの上記命令に先行する命令が上記命令発効装置により発行されているか否かを判断する装置であることを特徴とする特許請求の範囲第 8項に記載の情報処理装置。