WO1999027439A1

WO1999027439A1 - Systeme informatique

Info

Publication number: WO1999027439A1
Application number: PCT/JP1998/005230
Authority: WO
Inventors: Hajime Seki
Original assignee: Hajime Seki
Priority date: 1997-11-20
Filing date: 1998-11-19
Publication date: 1999-06-03
Also published as: CA2310369A1; KR20010032275A; EP1035471A1; AU745449B2; CN1279782A; EA200000546A1; AU1174799A

Description

明細書計算機システム技術分野

本発明は、スタックマシンの機械語で記述されたプログラムを高速で処理する新規な構成の計算機システムに関するものである。背景技術

従来、スタックマシンにおいては、命令の実行は、基本的にプロダラム上の順序通り（ in-order ) に行われるものであった。すなわち、スタックマシンにおける演算命令は、オペランド 'スタックからソース'デ一タをポップし、演算を実行し、その演算結果をオペランド ' ·スタックにプッシュするというような動作を指示するものであるが、このような命令の連鎖として書かれたプログラムを逐次的に実行するのである。

このような従来のスタックマシンにおいては、命令をプログラム上の順序通り（ in-order ) に実行するので、制御構造が単純なもので済むという利点があるが、処理速度が制約を受けるという問題点があった。

そこで、スタックマシンの機械語で記述されたプログラムを out-of-orderで処理するような計算機方式が考案された。例えば、日本特公平 2— 2 6 0 0 8 2号、米国特許第 5 5 2 2 0 5 1号や、米国特許第 5 3 3 3 3 2 0号及ぴ米国特許第 5 7 6 5 0 1 4号におけるプロセッサ要素がある。これらの明細書に示されるプロセッサは、処理性能の向上という点で十分ではない上に、正確な例外処理を保証する上で問題があつた。

本発明は、上記問題点を解決するため創案されたものであり、正確な例外処理を保証しつつ、スタックマシンの機械語で記述されたプロダラムを out-of-order でより効率的に処理する計算機システムを提供することを目的としている。発明の開示

本発明による計算機システムは、データ 'キャッシュと、各々のェントリにデータが書き込まれるようになっている統合レジスタ 'ファイルと、各々のェントリに統合レジスタ.ファイルのェントリのァドレスが書き込まれるようになっているスタックの構成となっている前進ボインタ 'スタック及び完了ポインタ 'スタックと、各々のエントリに個々の命令の内容が書き込まれるようになつている F I F Oキューの構成となつている命令キューと、演算を実行するようになっている演算ュニッ卜と、デ—タ.キヤッシュ及び統合レジスタ 'ファイルにアクセスできるようになっているロード Zストァ'ュニッ卜とを具備する。

従来のスタックマシンにおいて、スタックが ...... , wordl, word2, word3, word4 (右端がスタックトップ）となっている状態は、本発明による計算機システムにおいて、ポインタ 'スタックが ......， < a > , 〈b〉 , < c > ,

〈d〉（右端がスタックトップ）で、エントリ 'アドレスが〈_a〉，〈b〉 , 〈c〉及び〈d〉である統合レジスタ.ファイルの各エントリに、それぞれ wordl, word2, word3 及び word4 が保持されている状態に対応する。

本発明の計算機システムにおいては、命令がデコードされるごとに、その命令の内容に応じて前進ボインタ ·スタック及び統合レジスタ ·ファィルを操作すると共にその命令の内容を命令キューに書き込むようになつている。この際、命令に含まれるオペランド'スタックに対するスタック操作が、前進ポインタ ·スタックに対して同様に適用される。ここで、 1語のデータのオペランド♦スタックへのプッシュ操作を、本発明の計算機システムにおいてエミュレートするには、割り付けられていない統合レジスタ 'ファイルの 1ェントリをそのデータを保持すべく割り付け、そのェントリのァドレスを前進ボインタ ·スタックにプッシュすればよい。

即ち、オペランド 'スタックに対するポップ操作を含む命令がデコ一ドされた場合には、ポップすべき語数と同じ数だけ統合レジスタ ·ファィルのェントリのァドレスを前進ポィンタ.スタックからポップする。オペランド 'スタックに対するプッシュ操作を含む命令がデコードされた場合には、プッシュすべき語数と同じ数だけ割り付けられていない統合レジスタ 'ファイルのェントリを割り付け、上記割り付けた統合レジスタ 'ファイルのェントリのァドレスを前進ポインタ.スタックにプッシュする。さらに、デコードされた命令の内容を、ポップ/プッシュ操作を伴う命令の場合にはポップ Zプッシュされる統合レジスタ ·ファイルのェントリのァドレスと共に、命令キューに書き込むようになっている。命令キューに保持されている未実行の命令は、データ駆動（各々の動作が、必要なすべてのソース 'データが揃い実行可能となった時点で実行されること）の原理に基づき out-of-order で処理されるようになっている。

例えば、命令キューにおいて、演算命令を書き込みの内容とし、必要なソース'データが全て統合レジスタ.ファイルに書き込み済みとなっているエントリがあり、演算ユニットが利用できる状態であれば、その演算の実行を開始する。演算の実行が正常に終了すれば、演算結果をデスティネーションである統合レジスタ 'ファイルのェントリに書き込む。命令キューの先頭のェントリにおいて保持されている命令の完了が可能である、あるいはそうなると、その命令キューの先頭のエントリの内容に基づき、保持されている命令がデコードされた際の前進ボインタ- スタックの動作を再現すベく完了ポインタ ·スタックを操作し、命令キユーからその先頭のェントリを除外し、ポップ操作によって完了ボインタ 'スタックにおけるァドレスの保持が無くなった統合レジスタ.フアイルのェントリの割り付けを解除するようになっている。図面の簡単な説明

第 1図は、本発明にかかる好ましい計算機システムの基本構成を示すブロック図、第 2図は、前進ポインタ ·スタック及び完了ポインタ ·スタックの構成を示す図、第 3図は、後述する本発明第 1実施例における統合レジスタ ·ファイルの各々のェントリの詳細な構成を示す図、第 4図は、命令キューの構成を示す図、第 5図は、命令キューの各々のェントリの詳細な構成を示す図、第 6図〜第 1 2図は、本発明第 1実施例における一動作例の、サイクル毎の前進ポインタ ·スタック、完了ポインタ · スタック、命令キュー及び統合レジスタ *ファイルの内容を具体的に示した説明図、第 1 3図は、本発明第 1実施例において、 1サイクル当り 3命令までデコードできるような構成をとる場合に、プログラムがどのように変換されるかを具体的に示す図表、第 1 4図は、後述する本発明第 2実施例における統合レジスタ 'ファイルの各々のェントリの詳細な構成を示す図、第 1 5図〜第 2 1図は、本発明第 2実施例における一動作例の、サイクル毎の前進ボインタ ·スタック、完了ボインタ 'スタック、命令キュ一及び統合レジスタ ·フアイルの内容を具体的に示した説明図である。発明を実施するための最良の形態

以下に、本発明にかかる好ましい計算機システムについて、図面を参照しながら説明する。なお、以下に述べる本発明による計算機 · の実施例は、 Java Virtual Machine (Java VM) で規定されるスタックマシンの基本的な命令をハードウエアで実行するものである。すなわち、データ語長を 32 ビットとして、これを単位に口一ド /ストァ及ぴ算術論理演算等の演算を行う。従って、例えば、倍長語の間での算術演算は、 2語づっ合せて 4語のソース'データをもとに 2語の演算結果を生ずる。従来のスタックマシンにおける、語の単位でデータがプッシュ/ポップされるようになつているスタックは、後述するボインタ.スタックと区別するために、以降では、ワード ·スタックと呼ぶことにする。

Java VM にはもともとハードウエアで実行することを想定していない複雑な命令が含まれるが、以下に述べる本発明による計算機システムの実施例は、次のような基本的な命令をハードウアで実行するものとする。

( a ) 即値データのオペランド'スタックへのプッシュ命令

bipush, sipush, aconst null, iconst ml, iconst <i>, fconst く f>， lconst〈1〉， dconstく d〉

( b ) 変数データのオペランド 'スタックへのロード命令

ldcl, ldc2， iload, iloadく n〉， fload, fload—く n〉， aload, aload— <n>, ldc2w, Iload, Iload— <n>， dload, dload <n>, iaload, laload, faload, daload, aaload, baload, caload, saload

( c ) オペランド 'スタック上のデータの変数へのストァ命令

istore, istore 、n>, fstore, fstore く n>, astore, astore—く n>， lstore, lstore <n>, dstore, dstore—く n>， iastore, lastore, fastore, dastore, aastore, bastore, castore, sastore

( d ) 演算命令

( d - 1 ) 算術演算命令 iadd, ladd, fadd, dadd, isub, Isub, fsub, dsub, imul, Imul, finul, dmul, idiv, Idiv, fdiv, ddiv, irem, lrem, frem, drem, ineg, lneg, fiieg, dneg

( d— 2 ) 論理演算命令

ishl, ishr, iushr, lshl, lshr, lushr, iand, land, ior, lor, ixor, lxor

( d— 3 ) 変換演算命令

i21, ilf, i2d, 12i, 12f， 12d, f2i, f21, fid, d2i, d21, d2f， int2byte, int2char, int2short

( d— 4 ) 比較演算命令

lcmp, fcmpl, fcmpg, dcmpl, dcmpg

( e ) オペランド 'スタックの操作命令

pop, pop2, dup, dup2, duo xl, dup2 xl, dup_x2, dup2 x2, swap

( f ) 分岐命令

ifeq, ifiiull, iflt, ifle, ifiie, ifiionnull, ifgt, ifge, ii icmpeq, if icmpne, if icmplt, if icmpgt, ii icmple, ii lcmpge, goto, goto w

以降、特にことわらない限り、「命令」とは上に挙げた命令のいずれかを意味するものとする。

以下に、オペランド 'スタックの操作命令の処理方法の異なる、第 1 及ぴ第 2の 2つの実施例について説明する。

まず、本発明第 1実施例の計算機システムについて説明する。

第 1図は計算機システムのプロック図であって、 1 0は命令キヤッシュ、 1 1はデータ'キャッシュ、 2 0は命令フェッチ 'ユニット、 2 1は命令デコード '設定ユニット、 3は前進ポインタ，スタック、 3 aは前進ポインタ 'スタック履歴ファイル、 4は完了ポインタ ·スタック、 5は命令キュ一、 6は統合レジスタ.ファイル、 7はフリー.リスト、 8 0及ぴ 8 1は各々演算ユニット 0及び 1、 8 2は分岐ユニット、 8 3はロード Zストア ·ユニットを表している。

次に、本発明第 1実施例の計算機システムの各構成要素ごとにその詳細な構成を説明する。

(A) 命令フユツチ.ュニット

命令フェッチ 'ユニットは、図示してないプログラムカウンタ（p_C レジスタ）を具備しており、命令キャッシュから命令をフェッチし、命令デコード '設定ユニットに渡す。分岐の予測や分岐の実行も担う。

(B) 命令デコード ·設定ユニット

命令デコード '設定ュニットは、命令フェッチ'ュニットから渡された命令のデコードを行い、命令に含まれる演算等がデータ駆動で実行されるように、後述する前進ポインタ 'スタック、命令キュ一及び統合レジスタ ·ファイル等を設定するための各種信号を発生する。

(C) ボインタ 'スタック

ポインタ ·スタックは、各々のェントリに統合レジスタ ·ファイルのェントリのァドレスが書き込まれるようになつているスタックの構成となつている。

従来のスタックマシンにおいて、ワード'スタックが ......， wordl, word2, word3, word4 (右端がスタックトップ）となっている状態は、本発明による計算機システムにおいて、ポインタ 'スタックが .....， <a ) ，

<b> , < c) , <d> (右端がスタックトップ）で、エントリ 'ァドレスカ〈a〉，〈b〉，〈c〉及び〈d〉である統合レジスタ 'ファイルの各ェントリに、それぞれ wordl, word2, word3 及び word4 が保持されている状態に対応する。

本発明の計算機システムは、前進ポインタ 'スタック（A P S ； Advanced Pointer Stack) と完了ポインタ 'スタック（CP S ; Completed Pointer Stack) の 2つのポィンタ 'スタックを具備する。

本発明の計算機システムにおいては、個々の命令がデコードされるごとに、前進ポインタ 'スタック（以下では A P Sで示す）及び統合レジスタ ·ファイルを操作すると共に命令の内容を命令キューに書き込むことにより、命令に含まれる演算等がデータ駆動で実行されるべく設定される。すなわち、前進ポインタ ·スタックはデコード '設定済みの全ての命令によるスタック操作を反映している。

他方、完了ポインタ 'スタック（以下では C P Sで示す）は、プログラム上の順番で完了済みの全ての命令によるスタック操作を反映するものである。本発明の計算機システムはデータ駆動の原理に基づく out-of-order実行を可能とするものである、完了ポインタ ·スタックは、正確な例外処理を保証するため、プログラムが in-order で実行された場合の状態を構成するために存在するものである。

ポインタ.スタック及び統合レジスタ 'ファイルのェントリ数は限られたものであるので、ワード'スタックが成長すると、ポインタ 'スタック及び統合レジスタ 'ファイルを用いてスタック ·トップ近傍の部分しか保持できない。本実施例の計算機システムにおいては、ワード'スタックの残りの部分はデータ'キャッシュに格納されるようになっている。そのため、各ボインタ 'スタックは循環型のバッファの構成となっており、プッシュ ·ポインタとボトム ·ボインタと呼ぶ 2つのレジスタが各々存在する。プッシュ 'ポインタは、統合レジスタ.ファイルのエントリのアドレスを保持する最上位のェントリの 1つ上を示す。ボトム'ポインタは、統合レジスタ 'ファイルのェントリのァドレスを保持する最下位のェントリを示す。ボトム'ボインタの値からプッシュ ·ボインタの値を引くことで、ポインタ ·スタックに何エントリの空きがあるかがわかる。初期状態においては、プッシュ ·ボインタ及ぴボトム 'ボインタの各々の値は共に 0となっている。

第 2図は、本実施例の計算機システムにおける各ポインタ 'スタックと各プッシュ 'ポインタ及ぴボトム 'ボインタの関係を示す説明図である。 2つのポィンタ 'スタック A P S 3及び C P S 4は同数のェントリを有し、各ポインタ'スタックで各々のエントリに下から順に 0、 1、 2、 · · · とアドレスが付けられているものとする。縦線が施されているェントリは統合レジスタ 'ファイルのェントリのァドレスを保持しているものとする。第 2図に示すように、プッシュ ·ポインタは、 A P S及ぴ C P Sの各々に対して設けられており、それぞれ PP— OF— APS 及ぴ PP— OF— CPS と名付けている。他方、ボトム'ポインタは 1つだけ設けられており、これが A P S及び C P Sで共用される。これを BP— OF— PS と名付けている。

A P Sと C P Sの間には、エントリの数だけ比較回路が設けられており、 A P S及び C P Sの同じエントリ ·アドレスにある（第 2図において水平に並ぶ）ェントリの間でその内容が比較されるようになっている。命令に含まれるオペランド'スタックに対する 1語分のプッシュ操作に対応して割り付けられる統合レジスタ.ファイルの 1エントリのアドレスを A P Sの PP— OF— APS で示されるェントリに書き込み、 PP OF APS の値に 1を加えるようになつている。逆に、命令に含まれるオペランド'スタックに対する 1語分のポップ操作に対応して、 PP OF APS の値から 1を引くようになつている。 C P Sと PP— OF_CPS に関しても同様である。

BP OF PS で示されるエントリの内容が A P Sと C P Sで一致する場合には、その 2つのボインタ ·スタックで一致する内容で示される統合レジスタ 'ファイルのェントリに書き込まれている 1語分のデータをデ一タ'キャッシュにストァ（Spill)することができる。その際、 BP_OF_PS の値に 1を加えるようになつている。逆に、データ ·キャッシュにストァ（Spill) したデータを統合レジスタ 'ファイルにロード（Fill) する場合には、最後にストア（Spill) した 1語分のデータに対し、フリー-リストに登録されている統合レジスタ ·ファイルの 1ェントリを割り付けてそのデータを書き込み、その統合レジスタ.ファイルのェントリのァドレスを A P S及ぴ C P Sの BP— OF_PS で示されるェントリの 1つ下に各々書き込み、 BP_OF— PSの値から 1を引くようになっている。

本実施例の計算機システムは、分岐予測に基づく投機的実行を可能にするために、前進ポインタ 'スタック履歴ファイル（以下では「A P S 履歴ファイル」と記す）を具備する。 A P S履歴ファイルの各々のェントリには、 A P Sの全ェントリ及ぴ PP— OF— APS の内容が書き込めるようになっている。

( D ) 統合レジスタ 'ファイル（C R F ； Consolidated Resister File) 統合レジスタ'ファイル（以下では C R Fで示す）は、従来のスタツクマシンにおけるヮード 'スタックの内容を、順序不同で保持するものである。

第 3図は、本第 1実施例における、 C R F 6の各々のエントリ 6 (i) の詳細な構成を示す説明図である。ここで、 iはエントリのアドレスである。 C R F 6の各々のエントリ 6 (i)はデータ ·フィールド 6 1 (i)、書込み完了フラグ（WC F， Write Completion Flag) フィールド 6 2 (i)、カラー（C， Colour) ブイ一ルド 6 3 (i)及びビジービット（B B ) フィールド 6 4 (i)から成っている。

実際の C R Fのハードウェア上の構成は、上述の各フィールド別に設けられたレジスタ ·ファイルの集合体である。

C R Fの各々のェントリのデータ'フィールドは、 1語分のデータが書き込まれる構成となっている。

C R Fの各々のエントリにおいて、 W C Fフィールドは、データ 'フィールドにデータの書き込みが完了していれば 1、完了していなければ 0が書き込まれているようになっている。 CRFの各々のエントリにおいて、 Cフィールドは、その C RFのェントリカ命令に含まれるプッシュ操作に対応して割り付けられたものであるのか、アンダ一フ口一回避のためのデータ.キヤッシュからの口一ド（Fill)の際に割り付けられたものであるのかの区別、前者の場合にはさらに分岐タグが書き込まれるようになつている。本実施例においては、後述するように、分岐タグは A P S履歴ファイルのエントリのアドレスと一定の関係にある。

CRFの各々のエントリにおいて、 B Bフィールドは、その C R Fのエントリがデータを保持すベく割り付けられている状態であれば 1、割り付けられていない状態であれば 0が書き込まれているようになっている。

(E) フリー'リスト（F L)

フリー ·リスト（以下では F Lで示す）は、フリーな、即ち、割り付けられていない（B Bフィールドが 0である） C R Fのエントリのアドレスを保持するためのメモリであり、本実施例においては、循環型の F I F Oキューの構成となっている。

初期状態においては、 C RFの全てのェントリのァドレスが F Lに登録されている。 C RFのフリーなェントリを割り付ける必要がある場合に、 F Lからフリーな C RFのエントリのアドレスが取り出される。逆に、 C R Fのあるエントリの割り付けが解除されれば、そのエントリのァドレスが F Lに登録されるようになっている。

( F ) 命令キュ一 1 Q ； Instruction Queue;

命令キュー（以下では I Qで示す）は、実行または完了を待っているデコ一ド'設定済の命令を保持するメモリであり、循環型の F I F Oキユーの構成となっている。

第 4図は、 I Qの構成を示す説明図である。第 4図において、 I Q 5 の各々のエントリは下から順に 0、 1、 2、 · · ·とアドレスが付けられているものとし、縦線が施されている I Q 5のエントリは、実行または完了を待っている命令を保持しているものとする。 I Qは、設定ポインタ /完了ボインタと名付けた二つのレジスタを具備する。設定ボインタは、次にデコード '設定される命令の内容を書き込むべきエントリを示す。完了ポインタは、次に完了されるべき命令のエントリを示す。完了ポィンタの値から設定ボインタの値を引くことで、 I Qに何ェントリの空きがあるかがわかる。初期状態においては、設定ポインタ及ぴ完了ポインタの値は共に 0となっている。

第 5図は、 I Q 5の各々のエントリ 5 (i)の詳細な構成を示す説明図である。ここで、 iはエントリのアドレスである。 I Q 5の各々のェントリ 5 (i)はオペレーション'フィールド 5 0 0 (i)、オペランド'フィ一ルド 5 0 1 (i)、第 1 ソース 'フィールド 5 1 0 (i)、第 1書込み完了フラグ（WC F 1 ) フィールド 5 1 1 (i)、第 2ソ一ス ·フィ一ルド 5 2 0 (i)、第 2書込み完了フラグ（W C F 2 ) フィールド 5 2 1 (i)、第 3ソース' フィールド 5 3 0 (i)、第 3書込み完了フラグ（W C F 3 ) フィールド 5 3 1 (i)、第 4ソース'フィ一ルド 5 4 0 (i)、第 4書込み完了フラグ（W C F 4 ) フィールド 5 4 1 (i)、第 1デスティネーシヨン'フィールド 5 5 (i)、第 2デスティネーション 'フィールド 5 6 (i)、分岐タグ（B T ) フィールド 5 7 (i)、及び実行状態（ S ； State) フィールド 5 8 (i)から成っている。

I Qの各々のェントリのオペレーシヨン 'ブイ一ルドはオペレーション-コ一ドが書き込まれる構成となっている。

I Qの各々のェントリのオペランド 'フィールドは、オペレーション. コードに続いてオペランドが示されるような命令の場合に、このオペランドが書き込まれるようになっている。 I Qの各々のェントリの第 1〜第 4ソース'フィールドの各々は、ソ一ス'データを保持すべく割り付けられている C R Fのェントリのアドレスが書き込まれるようになっている。オペランド 'スタックに対するポップ操作を含む命令の場合には、命令によりポップされるべきデータを保持すべく割り付けられている C R Fのエントリのアドレスが、ポップされる順に書き込まれるようになっている。

I Qの各々のェントリの第 1〜第 2デスティネーション'フィーノレドの各々は、命令のデコード '設定に伴い、新たに割り付けられる C R F のェントリのァドレスが書き込まれるようになっている。オペランド' スタックに対するプッシュ操作を含む命令の場合には、命令によりプッシュされるべきデータを保持すべく割り付けられる C R Fのェントリのァドレスが、プッシュされる順に書き込まれるようになつている。

I Qの各々のェントリにおいて、第 1〜第 4の各 W C Fフィールドは各々第 1〜第 4ソース ·フィ一ルドに対応して設けられている。 WC F 1フィールドは第 1ソース'フィールドに示される C R Fのェントリにデータの書き込みが完了していれば 1、完了していなければ 0が書き込まれているようになっている。第 2〜第 4の W C Fフィールド、ソース •フィールドに関しても同様である。

I Qは、各ェントリのソース'フィールドごとに比較回路を備えており、データの書き込みが行われる C R Fのエントリのアドレスを各ソース'ブイ一ルドの内容と比較して、一致するソ一ス 'フィールドに対応する WC Fフィールドに 1を立てるような機能を有する。

I Qの各々のエントリの B Tフィールドは、分岐予測に基づく投機的実行に係るもので、本実施例においては、後述するように、 B Tブイ一ルドに書き込まれる分岐タグは A P S履歴ファイルのェントリのァドレスと一定の関係にある。 I Qの各々のエントリにおいて、 Sフィールドは、そのエントリに書き込まれている命令の実行状態に応じて、未実行、実行済み、正常終了、例外事象発生等の情報が書き込まれているようになっている。

( G ) 演算ュニット

本実施例の計算機システムは、演算ユニット 0及び演算ユニット 1を具備しており、その各々は、 I Qより送られてくる算術論理演算、データ ·タイプの変換演算、比較演算等の演算命令を実行する機能を有し、互いに独立に並行して動作することができるようになっている。

本発明の計算機システムにおいては、各々の演算ュニットをパイプライン化したり、より多くの演算ユニットを具備したり、演算ユニットごとに実行する演算の種類を特定した構成とすることも可能である。

( H) 分岐ュニット

分岐ユニットは、 I Qより送られてくる条件分岐命令を処理し、分岐の有無を確定して、命令フェッチ 'ュニットに通知する機能を有する。

( I ) ロード/ストア 'ユニット（ L S U ； Load/Store Unit)

ロード/ストア 'ユニット（以下では L S Uで示す）は、アドレス計算を行う機能を有し、データ 'キヤッシュ及ぴ C R Fにアクセスすることができるようになっている。

L S Uは、最初の口一カル変数へのポィンタを保持する図示してないレジスタ（ vars レジスタ）を具備する。本実施例の計算機システムにおいては、最初のローカル変数の格納域はデータ'キヤッシュあるいは C R Fにあるが、 vars レジスタには、データ'キャッシュにおける相当するアドレス値が書き込まれているようになっている。すなわち、全てあるいは一部のロー力ル変数の実際の格納域が C R Fにある場合でも、各々のローカル変数に、全てのローカル変数をデータ'キャッシュにストァ（Spill) したと仮定した場合のデータ'キャッシュにおけるァドレス値を対応させることができるので、ロード Zストァ命令の処理において、 LSUは vars レジスタの値を用いてアドレス計算を行い、対象となるローカル変数の格納域がデ一タ'キャッシュか CRFかを判定し、その格納域にアクセスする。格納域が CRFにあると判定された場合には、アクセスすべき CRFのエントリのアドレスは AP Sから読み出される。

ロードストァ命令が命令デコード '設定ュニットでデコードされると、その内容が、命令キューに書き込まれると同時に、 LSUにも送られるようになっている。

LSUは、プログラム上の順番で、ロード/ストア命令を命令キューのェントリのァドレス、対象となる変数名及ぴデータと共に蓄える図示してないキューを具備する。このキューは連想機能を備えており、変数名を照合してデータ 'アクセスの依存性の検証を行うことにより、ロード命令の実行を out-of-order で行うことができるようになつている。本実施例の計算機システムにおいては、ローカル変数の格納域はデータ · キヤッシュあるいは C RFにあるが、上記キュ一にすでに同じ変数名の書き込みがあるローカル変数のロード命令の場合、変数データは上記キユーより読み出される。ストア命令の実行は、正確な例外処理を保証するために、後述するように、完了ステージにおいて in-orderで行われる。

LSUは、プログラム中に示されるロード Zストア命令を実行すると共に、オーバーフローアンダーフローの回避のため、 AP S、 C P S 及び C RFの空きに応じて、 C RFに保持されているスタックの最下位にあたるデータをデータ ·キヤッシュとの間で自動的にストァ（Spill)/ ロード（Fill)するようになっている。

本発明第 1実施例の計算機システムにおいては、 AP S、 CP S及ぴ C R Fのオーバーフロー/アンダーフローは以下に示すようなメカ二ズムにより回避される。

AP S、 C P Sあるいは CRFの空きが一定量以下になると、オーバーフ口一を回避するために以下のような制御動作が随時行われるようになっている。

すなわち、 AP Sが C RFのエントリのアドレスを一定量以上保持していない場合、あるいは、 BP— OF— PS で示されるエントリの内容が A P Sと CPSで一致しない場合、以上の条件が解消するまでの間、命令シ —ケンスの流れを停止するよう命令フェッチ.ュニットに信号が送られる。

逆に、 AP Sが CR Fのエントリのアドレスを一定量以上保持しており、 BP_OF— PS で示されるエントリの内容が AP Sと C P Sで一致する場合には、その 2つのポインタ 'スタックで一致する BP一 OF_PS で示されるェントリの内容で示される CRFのェントリに書き込まれている 1 語分のデ一タをデータ 'キャッシュにストア（Spill) し、 BP— OF— PS の値に 1を加える。さらに、上記 CRFのエントリの B Bフィールドを 0 に変更し、そのエントリのアドレスを F Lに登録する。

AP S、 C P S及ぴ CRFの空きがいずれも一定量以上になると、ァンダーフローを回避するために、最後にストア（Spill) した 1語分のデータをデータ ·キャッシュから取り出し、それに F Lに登録されているフリ一な C R Fの 1エントリを割り付け、そのデ一タ.フィ一ルドに書き込む。 WCF、 BBの各フィールドは 1 とする。さらに、その割り付けられた C R Fのェントリのァドレスを、 A P S及ぴ C P Sの BP— OF— PS で示されるェントリの 1つ下に各々書き込み、 BP— OF— PS の値から 1を引く。

また、 C R Fとデータ 'キヤッシュの間の Spill/Fill の動作を効率的に行うために、 L S Uがデータをいつたん蓄えるバッファを備え、この中に適当な語数のデータを溜めておくような構成とすることも可能である。

ついで、本発明第 1実施例の計算機システムの動作を説明する。

本実施例の計算機システムは命令を、 ①命令フェッチ、 ②命令デコード ' ·設定、 ③実行、 ④完了の 4ステージで処理する。当分の間、説明を簡単にするため、 1サイクルで 1つの命令をデコ一ド'設定 Z完了できるものとして、以下に各ステージごとに動作内容を説明する。

① 命令フェッチ 'ステージ

このステ一ジでは、命令フェッチ.ュニットが命令キヤッシュから命令を取り出すと共に、次にフェッチする命令のアドレスを決定する。次に命令をフェッチするのは通常次ァドレス値からであるが、フェッチした命令が無条件分岐命令であるか、条件分岐命令で分岐すると予測した場合、分岐予測が外れた場合、あるいは例外が発生した場合には、フエツチするァドレス値を変更する。

② 命令デコ一ド '設定ステージ

このステージでは、命令をデコードして、命令の内容に応じて前進ポインタ'スタック（A P S ) 及ぴ統合レジスタ 'ファイル（C R F ) を操作すると共に命令の内容を命令キュー（ I Q ) に書き込むことにより、命令に含まれる演算等がデータ駆動で実行されるべく設定する。以下に、設定動作を詳細に説明する。

本発明の計算機システムにおいては、従来のスタック 'マシンにおけるワード ·スタックのスタックトップ近傍がポインタ 'スタックと C R F によって再現されるが、命令に含まれるオペランド 'スタックに対するスタック操作が、 A P Sに対して同様に適用される。

1語のデータのオペランド'スタックへのプッシュ操作をエミュレー卜するには、 F Lに登録されているフリーな C R Fの 1ェントリをそのデータを保持すべく割り付け、そのェントリのァドレスを A P Sにプッシュすればよレ、。

オペランド.スタックの操作命令（j_ava VM における pop, pop2, dup, dup2, dup_xl, dup2_xl, dup_x2, dup2_x2, swap) の場合、基本的には、ォぺランド ' ·スタックに対して行うべき操作を A P Sに対して同様に行えばよい。本第 1実施例においては、スタック上でコピーを作成するようなオペランド 'スタックの操作命令（ Java VM における dup, dup2, dup_xl, dup2_xl, dup_x2, dup2_x2 ) の場合には、コピ一 'データを保持すべく F Lに登録されているフリーな C R Fのエントリを割り付け、そのェントリのァドレスを A P Sの適切なェントリに書き込むようになつている。

命令のデコード '設定に伴い新たに割り付けられる C R Fのェントリにおいては、 B Bフィールドに 1を立て、 Cフィールドには命令デコ一ド-設定ュニットから送られてくる分岐タグを書き込む。即値データのプッシュ命令の場合には、データがすでに得られているので、データ' ブイールドにそのデータを書き込み、 W C Fフィールドに 1を立てる。それ以外の場合には、データはデコード ' ·設定の時点では得られていないので、 WC Fフィールドを 0としておく。

デコードされた命令の内容をプログラム上の順番で I Qに保持しておくために、その命令の内容を I Qの設定ボインタで示されるェントリに書き込み、設定ポインタの値に 1を加える。すなわち、オペレーション 'フィールドにオペレーション'コードを書き込み、ォペレ一ション'コ

―ドに続いてオペランドが示されるような命令の場合には、オペランド 'フィールドにこのオペランドを書き込む。 B Tフィ一ルドには命令デコード'設定ユニットから送られてくる分岐タグを書き込む。 Sフィールドに関しては、無条件分岐命令、即値データのオペランド 'スタックへのプッシュ命令あるいはスタック上でコピーを作成することのないォぺランド'スタックの操作命令（Java VM における pop, pop2, swap) の場合は実行済みとし、その他の命令の場合は未実行としておく。

オペランド 'スタックに対するポップ操作を含む命令の場合には、ポップすべき語数と同じ数だけ A P Sからポップされる C R Fのェントリのアドレスを、その順で第 1〜第 4ソース ·フィールドに書き込む。この際、ェントリ 'ァドレスがポップされる C R Fのェントリの各々で W C Fフィールドを読み出し、 I Qの対応する W C Fフィ一ルドに送る。オペランド ' ·スタックに対するプッシュ操作を含む命令の場合には、プッシュすべき語数と同じ数だけ A P Sにプッシュされる C R Fのェントリのァドレスを、その順で第 1〜第 2デステイネ一ション'フィ一ルドに書き込む。

本第 1実施例においては、スタック上でコピーを作成するようなオペランド 'スタックの操作命令の場合には、コピ一元となるデータを保持すべく割り付けられている C R Fのェントリのアドレスをソース'フィールドに、コピー'データを保持すべく新たに割り付けられる C R Fのェントリのァドレスをデスティネ一ション 'フィールドに、一定の対応関係のもとに書き込む。

命令の種類に応じて、オペランド'スタックに対してポッププッシュすべき語数（オペランド 'スタックの操作命令の場合には、作成するコピーの語数）は決まっているので、オペレーション 'フィールドの内容によって、第 1〜第 4ソース 'フィールド、第 1〜第 4の W C Fフィールド及ぴ第 1〜第 2デスティネーション'フィールドのうちのいずれが有効であるかを知ることができる。

ロード/ストア命令の場合には、その内容を、 I Qに書き込むと同時に、その書き込みが行われる I Qのェントリのァドレスと共に L S Uに送る。

③ 実行ステージ

I Qに保持されている未実行の命令は、データ駆動で処理される。従つて、命令実行順序は out-of-orderになる。以下に、命令の種類ごとに、実行ステージにおける動作を説明する。

( a ) 即値データのオペランド 'スタックへのプッシュ命令

実行ステージにおける動作としては、何も行わない。

( b ) 変数データのオペランド 'スタックへのロード命令

I Qの、ロード命令を書き込みの内容とするエントリに関しては、同じ内容が命令デコード '設定ステージにおいて L S Uに送られている。

L S Uでは、送られてきた口一ド命令を out-of-order で処理するようになっている。

I Qにおいて、オペランド 'スタック上のデータをポップしてァドレス計算を行うようなロード命令（j_ava VMにおける ialoa4 laload, faload, daload, aaload, baload, caload, saload) を書き込みの内容とし、有効なソ一ス.フィールドに対応する W C Fフィールドが全て 1 となっている（ソ —ス 'データが全て C R Fに書き込み済みとなっている）エントリがあれば、そのェントリのァドレスと共に C R Fをアクセスして得られるソース 'データを L S Uに送る。 L S Uは送られてきたソース'データをもとにアドレス計算を行い、ロードの実行を試みる。

L S Uで変数データが得られると、デスティネーションである C R F のェントリのデータ 'フィールドに変数データを書き込み、 W C Fフィ一ルドを 1に変更する。その上、 I Qにおいて各ソース'フィールドで上記デスティネーションである C R Fのェントリのァドレスを照合し、一致するソース 'フィールドに対応する W C Fブイ一ルドを 1とする。この際、同じタイミングで命令が書き込まれる I Qのェントリにおいては、その書き込まれる内容と比較するようになっている。以上の動作が正常に終了すれば、そのロード命令を保持している I Qのェントリの S フィールドを正常終了に変更する。

( c) オペランド 'スタック上のデータの変数へのストァ命令

I Qにおいて、ストア命令を書き込みの内容とし、有効なソース'フィ一ルドに対応する WC Fフィ一ルドが全て 1 となっている（ソース' データが全て CRFに書き込み済みとなっている）エントリがあれば、そのェントリのアドレスと共に CRFをアクセスして得られるソース. データを L SUに送る。

オペランド 'スタック上のデータをポップしてァドレス計算を行うよつなストァ命令 (Java VM ίこおる lastore, lastore, fastore, dastore, aastore, bastore, castore, sastore) の場合、 L SUは送られてきたソース' データをもとにァドレス計算を行う。

以上の動作が正常に終了すれば、そのストァ命令を保持している I Q のェントリの Sフィ一ルドをストァ実行可能に変更する。

正確な例外処理を保証するために、実際のストァの実行は完了ステージにおいて行う。

( d) 演算命令

I Qにおいて、演算命令を書き込みの内容とし、有効なソース ·フィ —ルドに対応する WC Fフィールドが全て 1となっている（ソース'デ —タが全て CRFに書き込み済みとなっている）エントリがあり、利用可能な状態の演算ュニットがあれば、そのェントリの内容をそのェントリのァドレス及び C RFをアクセスして得られるソース'データと共に利用可能な演算ュニットに送り実行させる。

演算の実行が正常に終了すれば、デスティネーションである CRFのエントリのデータ'フィールドに演算結果を書き込み、 WC Fフィールドを 1に変更する。その上、 I Qにおける C R Fのエントリのアドレスの照合及ぴ WC Fブイ一ルドの変更を、上述のロード命令の場合と同様に行う。以上の動作が正常に終了すれば、その演算命令を保持している I Qのェントリの Sフィールドを正常終了に変更する。

(e) オペランド 'スタックの操作命令

スタック上でコピーを作成することのないオペランド'スタックの操作命令に関しては、実行ステージにおける動作としては、何も行わない。本第 1実施例においては、 I Qにおいて、スタック上でコピーを作成するようなオペランド 'スタックの操作命令を書き込みの内容とし、有効なソース'フィールドに対応する WC Fフィールドが全て 1となっている（ソース'データが全て C RFに書き込み済みとなっている）ェントリがあれば、その有効なソース ·フィールドに示される C RFのェントリからデータを読み出し、これを対応するデステイネ一ション'フィールドに示される C RFのェントリのデータ.フィールドに書き込み、 WC Fフィールドを 1に変更する。その上、 I Qにおける CRFのェントリのァドレスの照合及ぴ WC Fフィールドの変更を、上述の口一ド命令の場合と同様に行う。以上の動作が正常に終了すれば、そのオペランド.スタックの操作命令を保持している I Qのェントリの Sフィ一ルドを正常終了に変更する。

( f ) 分岐命令

無条件分岐命令に関しては、実行ステージにおける動作としては、何も行わない。

I Qにおいて、条件分岐命令を書き込みの内容とし、有効なソース- フィールドに対応する WCFフィールドが全て 1 となっている（ソース 'データが全て CRFに書き込み済みとなっている）ェントリがあれば、そのェントリの内容をそのェントリのァドレス及び C RFをアクセスして得られるソース ·データと共に分岐ュニットに送り実行させる。

分岐ュニットにおいて条件式の計算が正常に終了すれば、その結果を分岐先ァドレスと共に命令フェッチ'ュニットに通知する。以上の動作が正常に終了すれば、その条件分岐命令を保持している I Qのェントリの Sフィールドを正常終了に変更する。

以上のように、 I Qに保持されている未実行の命令は、実行可能となつたものから処理されるので、命令実行順序は out-of-order になる。また、演算ユニット 0， 1、分岐ユニット及びロードノストア.ユニットの各実行ュニットは互いに独立に並行して動作する。

ある命令の処理において例外事象が発生した場合には、その情報を、その命令を保持している I Qのェントリの Sフィールドに書き込むと共に、命令フェッチ'ュニットに例外べクタを通知する。

④ 完了ステージ

ある命令が完了できるためには、プログラム上の順番でその命令よりも前にある命令が全て完了していなくてはならない。

I Qの完了ポィンタで示されるェントリにおいて、 Sフィールドが実行済み/正常終了である、あるいはそうなると、そのエントリに書き込まれている命令の内容に基づいて C P S及び C R Fを操作し、完了ボインタの値に 1を加える。

C P Sは、命令がデコード '設定された際の A P Sの動作を再現すベく操作される。すなわち、ポップ Zプッシュ操作を含む命令の場合には、有効なソース 'ブイ一ルドの内容と同じものを順に c p sからポップし、有効なデスティネーション'フィ一ルドの内容を順に C P Sにプッシュする。スタック上でコピーを作成することのないオペランド 'スタックの操作命令の場合には、オペランド 'スタックに対して行うべき操作を C P Sに対して全く同様に行えばよレ、。本第 1実施例においては、スタック上でコピーを作成するようなオペランド 'スタックの操作命令の場合には、有効なソース'フィ一ルド及ぴ有効なデスティネーション'フィールドを参照して、その命令のデコード '設定の際に A P Sに対して行われた操作が C P Sにおいて再現される。

本第 1実施例においては、上述の C P Sに対する操作に伴い、ェントリ ·アドレスが C P Sからポップされる C R Fのェントリでは、 B Bフィ一ルドを 0に変更し、そのェントリ '了ドレスを F Lに登録する。

I Qの完了ボインタで示されるェントリにおいて、ストァ命令が書き込まれている場合には、 Sフィールドがストア実行可能である、あるいはそうなると、 L S Uに、上記ストア命令を保持している I Qのェントリのアドレスを示して、実際のストアの実行を依頼する。こうすれば、データが in-order でストアされることが保証できる。さらに、 C P S及び C R Fに対する操作を上と同様に行い、完了ボインタの値に 1を加える。

以上のように、完了ポインタの値に 1が加えられることによって、キユーから除外された I Qのェントリに保持されていた命令は、完了したことになる。その命令よりも前にデコード '設定された命令はすべて完了しているので、命令の完了は in-orderで行われることになる。

I Qの完了ポインタで示されるェントリにおいて、 Sフィールドが例外事象発生である、あるいはそうなった場合には、その時点における C P S及ぴ C R Fによって、プログラムが in-orderで実行された場合の例外発生時点の状態が構成されるので、正確な例外処理が可能である。例外事象の発生した命令以降にデコ一ド ' ·設定された命令を全てキャンセルするには、キャンセルされるべき命令が書き込まれている I Qのェントリの有効なデスティネーション，フィールドに示される C R Fのェントリの各々に対して、その B Bフィールドを◦に戻し、そのエントリ ' アドレスを F Lに登録することによって、割り付けを解除し、完了ボインタの値に 1を加えたものを設定ポインタに書き込むことによって、キヤンセルされるべき命令を保持している I Qのェントリを全てキューから除外すればよい。

以上が、本発明第 1実施例の計算機システムの動作についての全般的な説明であるが、ついで、具体的な動作例について説明する。

いま、本第 1実施例の計算機システムで、以下のようなプログラムを実行することを考えよう。

dload [A] (変数名 [A]に対応する倍精度浮動小数点データの口一ド） dload [B] (変数名 [B]に対応する倍精度浮動小数点データのロード） dadd (倍精度浮動小数点データ間の加算）

d2f (倍精度浮動小数点データの単精度浮動小数点データへの変

' 換）

fload [T] (変数名 [T]に対応する単精度浮動小数点データのロード） dup_xl (スタックトップの語のコピ一を作成し、先頭から 3語目に割り込ませる）

fdiv (単精度浮動小数点データ間の除算）

fsub (単精度浮動小数点データ間の減算）

fstore [X] (スタックトップにある単精度浮動小数点データの変数名

[X]に対応する格納域へのストア）

以上のプログラムは、 X=T- (A+B) /T の計算を行うものであるが、 A と Bのデータが倍精度で与えられ、この間の加算を倍精度のまま実行して、得られた加算データを単精度に変換して、以降は単精度で計算を行う、とレヽぅものである。

第 6図〜第 1 2図は、本第 1実施例の計算機システムにおいて、上記プログラムを処理する際の動作をサイクル毎に示した説明図であり、以下ではこの図をもとに詳細な動作を説明する。第 6図〜第 1 2図において、 CRF 6及び I Q 5の各エントリの構成は、それぞれ第 3図、第 5 図のものと同じである。第 6図〜第 1 2図で空白となっている箇所は、そのフィールドの内容に留意する必要が無いことを意味する。時系列で各構成要素の内容を示すために、各部の符号の後尾にハイフンと各サイクルに対応する数字を添えている。また、第 6図〜第 1 2図において、 AP S、 C P S、 I Q及ぴ CRFの各エントリは下から順に 0、 1、 2、〜のようにアドレスが付けられているものとする。

本動作例においては、説明を簡単にするため、変数データは全てデータ ·キヤッシュに格納され、 C R Fとデ一タ 'キヤッシュの間の Spill/Fill の動作は行わないものとする。従って、 BP_OF一 PSの値は終始 0である。また、本動作例においては、当初、 AP S、 C P S, I Q及び CRF は初期化されており、 F Lに CRFの全てのェントリのァドレスが順に〈0〉，〈1〉，〈2〉 , 〈3〉 ····と書き込まれていて、この順で取り出されるものとする。

以下に、各サイクルにおける動作を、（A) 命令デコード '設定、（B) 実行及ぴ（C) 完了の各ステージに分けて詳細に説明する。

(1 -A) 第 1サイクルの命令デコード '設定ステージ

命令 dload [A] のデコード '設定を行う。倍長語の変数データのオペランド'スタックへのロード命令であるので、 F Lに登録されているフリーな CRFの 2ェントリ 6 (0)、 6 (1)をそのデータを保持すべく割り付け、そのエントリのアドレス〈0〉，〈 1〉を AP Sにプッシュし、 AP Sは 3— 1のようになる。

CRFの 6 (0)、 6 (1)の各エントリにおいては、 BBフィールドに 1 を立て、 WC F及び Cの各フィールドには 0を書き込み、 CRFは 6— 1のようになる。ここで、本動作例においては、終始分岐タグとして命令デコード '設定ュニットから 0が送られてくるものとする。

設定ポインタの値は 0であるので、 I Qのエントリ 5 (0)に上記命令の内容を書き込み、 I Qは 5— 1のようになる。この際、 AP Sにプッシュされる C R Fのエントリのアドレス〈0〉，〈1〉を各々第 1、第 2デスティネーション ·フィールドに書き込んでいる。さらに、設定ポインタの値に 1を加え 1にする。ここで、本動作例においては、 I Qの Sフィールドには、命令が未実行であれば 0、実行済み正常終了あるいはストァ命令におけるストァ実行可能であれば 1が書き込まれるものとする。

I Qのェントリ 5 (0)に書き込まれるものと同じ上記命令の内容を、

I Qのェントリのアドレス 0と共に L S Uに送る。

(1 -B) 第 1サイクルの実行ステージ

当初の I Qにおいては、実行可能な命令が書き込まれているェントリは存在しないので、実行ステージの動作としては何も行われない。

( 1一 C) 第 1サイクルの完了ステージ

当初の I Qの完了ボインタが示すェントリ 5 (0)において、命令はまだ書き込まれていないため、完了ステージの動作としては何も行われなレ、。

(2 - A) 第 2サイクルの命令デコード '設定ステージ

命令 dload [B] のデコード '設定を行う。倍長語の変数データのオペランド'スタックへのロード命令であるので、 F Lに登録されているフリーな CRFの 2エントリ 6 (2)、 6 (3)をそのデータを保持すべく割り付け、そのエントリのアドレス〈2〉，〈3〉を AP Sにプッシュし、 AP Sは 3— 2のようになる。

〇尺の6 (2)、 6 (3)の各エントリにおいては、 BBフィールドに 1 を立て、 WC F及び Cの各フィールドには 0を書き込み、 CRFは 6— 2のようになる。

設定ポインタの値は 1であるので、 I Qのェントリ 5 (1)に上記命令の内容を書き込み、 I Qは 5— 2のようになる。この際、 AP Sにプッシュされる C R Fのエントリのアドレス〈2〉，〈3〉を各々第 1、第 2デスティネーション'フィ一ルドに書き込んでいる。さらに、設定ポインタの値に 1を加え 2にする。

I Qのエントリ 5 (1)に書き込まれるものと同じ上記命令の内容を、 I Qのェントリのァドレス 1と共に L SUに送る。

(2— B) 第 2サイクルの実行ステージ

L S Uは変数 Aのアクセスを開始する。レイテンシは 2サイクルであるとする。

(2 -C) 第 2サイクルの完了ステージ

5一 1の状態にある I Qの完了ボインタが示すェントリ 5 (0)において、 Sフィールドは 0であるので、完了ステージの動作としては何も行われない。

(3— A) 第 3サイクルの命令デコード '設定ステージ

命令 dadd のデコード '設定を行う。オペランド ·スタックから 4語のソース'データをポップして演算を行い、倍長語の演算結果をプッシュする演算命令であるので、 AP Sから〈0〉，〈1〉，〈2〉，〈3〉をポップし、 F Lに登録されているフリーな C RFの 2ェントリ 6 (4)、 6 (5) を演算結果を保持すべく割り付け、そのエントリのァドレス〈4〉，〈5〉を A P Sにプッシュし、 A P Sは 3— 3のようになる。

CRFの6 (4)、 6 (5)の各エントリにおいては、 BBフィールドに 1 を立て、 WC F及び Cの各フィ一ルドには 0を書き込む。

設定ポインタの値は 2であるので、 I Qのエントリ 5 (2)に上記命令の内容を書き込む。この際、 AP Sからポップされる CRFのエントリのアドレス〈0〉，〈1〉，〈2〉，〈3〉を各々第 1〜第 4ソース'フィ一ルドに、 AP Sにプッシュされる〈4〉，〈5〉を各々第 1、第 2デスティネーシヨン 'フィールドに書き込んでいる。また、 6— 2の状態にある CRFの 6 (0)、 6 (1)、 6 (2)、 6 (3)の各エントリで WC Fフィ —ルドを読み出し、それぞれ I Qの WC F 1〜4の各フィールドに送つている。さらに、設定ポインタの値に 1を加え 3にする。

(3— Β) 第 3サイクルの実行ステージ

L S Uは変数 Βのアクセスを開始する。レイテンシは 2サイクルであるとする。

L S Uから変数 Αのデータを構成する 2語 Α— 1、 A一 2 が送られてくるので、 C R Fのエントリ 6 (0)、 6 (1)のデータ.フィールドに各々書き込み、 WC Fフィールドを 1に変更する。その上、 I Qにおいて各ソ —ス'フィールドで C R Fのエントリのアドレス〈0〉，〈1〉を照合するが、この場合、同じタイミングで命令が書き込まれる I Qのエントリ 5 (2)の第1、第 2ソース 'フィールドで一致するので、同じエントリの WC F 1、 2の各フィールドを 1 とする。（WC F 3、 4の各フィ一ルドについては、（3— A) で説明したように 6— 2の状態にある CRF の対応するェントリの WCFフィ一ルドが読み出され送られてくるので、これが書き込まれる。）

以上のように I Qのェントリ 5 (0)に書き込まれた命令の実行が正常に終了するので、 5 (0)の Sフィールドを正常終了を意味する 1に変更する。

(3— C) 第 3サイクルの完了ステージ

5一 2の状態にある I Qの完了ボインタが示すェントリ 5 (0)において、 Sフィールドは 0であるので、完了ステージの動作としては何も行われない。 (4— A) 第 4サイクルの命令デコード '設定ステージ命令 d2f のデコード '設定を行う。オペランド 'スタックから 2語のソース ·データをポップして変換演算を行い、 1語の演算結果をプッシュする演算命令であるので、 AP Sから〈4〉，〈5〉をポップし、 F Lに登録されているフリーな CRFのェントリ 6 (6)を演算結果を保持すべく割り付け、そのェントリのァドレス〈6〉を AP Sにプッシュし、 AP Sは 3— 4のようになる。

C R Fのェントリ 6 (6)においては、 B Bフィールドに 1を立て、 W C F及び Cの各フィールドには 0を書き込む。

設定ポインタの値は 3であるので、 I Qのエントリ 5 (3)に上記命令の内容を書き込む。この際、 ΛΡ Sからポップされる CRFのエントリのアドレス〈4〉，〈5〉を各々第 1、第 2ソース.フィ一ルドに、 AP Sにプッシュされる〈6〉を第 1デスティネーション 'フィールドに書き込んでいる。また、 6— 3の状態にある CRFの 6 (4)、 6 (5)の各ェントリで WC Fフィールドを読み出し、それぞれ I Qの WC F 1、 2の各ブイ一ルドに送っている。さらに、設定ポインタの値に 1を加え 4にする。

(4-B) 第 4サイクルの実行ステージ

L SUから変数 Bのデータを構成する 2語 B— 1、 B— 2が送られてくるので、 C R Fのエントリ 6 (2)、 6 (3)のデータ.フィールドに各々書き込み、 WC Fフィールドを 1に変更する。その上、 I Qにおいて各ソース'フィールドで C R Fのエントリのアドレス〈2〉，〈3〉を照合する力この場合、 I Qのエントリ 5 (2)の第 3、第 4ソース 'フィールドで一致するので、同じェントリの WC F 3、 4の各フィ一ルドを 1とする。以上のように I Qのェントリ 5 (1)に書き込まれた命令の実行が正常に終了するので、 5 (1)の Sブイールドを正常終了を意味する 1に変更する。

(4— C) 第 4サイクルの完了ステージ

5 - 3の状態にある I Qの完了ボインタが示すェントリ 5 (0)において、 Sフィールドが 1 となったので、 5 (0)の内容に基づいて C P S (及び CRF) を操作する。すなわち、 I Qのエントリ 5 (0)のデスティネーシヨン'フィールドに書き込まれている〈0〉，〈1〉を C P Sにプッシュし、 CP Sは 4一 4のようになる。さらに、完了ポインタの値に 1 を加え 1 とし、これで、 5 (0)の命令は完了したことになる。

(5— A) 第 5サイクルの命令デコード '設定ステージ

命令 fload [T] のデコード '設定を行う。 1語の変数データのオペランド 'スタックへの口一ド命令であるので、 F Lに登録されているフリ —な C RFのェントリ 6 (7)をそのデータを保持すべく割り付け、そのエントリのアドレス〈7〉を A P Sにプッシュし、 AP Sは 3 _ 5のようになる。

C R Fのエントリ 6 (7)においては、 B Bフィールドに 1を立て、 W

CF及び Cの各フィールドには 0を書き込む。

設定ポインタの値は 4であるので、 I Qのエントリ 5 (4)に上記命令の内容を書き込む。この際、 AP Sにプッシュされる CRFのエントリのアドレス〈7〉を第 1デスティネーション 'フィールドに書き込んでいる。さらに、設定ポインタの値に 1を加え 5にする。

I Qのェントリ 5 (4)に書き込まれるものと同じ上記命令の内容を、 I Qのェントリのァドレス 4と共に L SUに送る。

(5-B) 第 5サイクルの実行ステージ

5— 4の状態にある I Qにおいて、演算命令が書き込まれているェントリ 5 (2)は WC Fフィールドが全て 1となっているので、このェントリ 5 (2)の内容をそのェントリのァドレス 2及び C RFの 6 (0)、 6 (1)、 6 (2)、 6 (3)の各ェントリに書き込まれているソ一ス'データと共に演算ュニット 0に送り演算を開始させる。この演算のレイテンシは 2サイクルであるとする。

( 5— C ) 第 5サイクルの完了ステージ

5一 4の状態にある I Qの完了ボインタが示すェントリ 5 ( 1)において、 Sフィールドが 1となったので、 5 (1)の内容に基づいて C P S (及び C R F ) を操作する。すなわち、 I Qのエントリ 5 (1)のデスティネ —シヨン 'フィールドに書き込まれている〈2〉 , 〈3〉を C P Sにプッシュし、 C P Sは 4一 5のようになる。さらに、完了ポインタの値に 1 を加え 2とし、これで、 5 (1)の命令は完了したことになる。

( 6— A) 第 6サイクルの命令デコード '設定ステージ

命令 dup— xl のデコード '設定を行う。命令 dup_xl は、ワード 'スタック力（右方向に成長するものとして） ....， wordl, word2のような状態であるとき、これを ....， word2, wordl, word2 と変えるような、スタック上で 1語のコピーを作成するオペランド 'スタックの操作命令であるので、 F Lに登録されているフリ一な C R Fのェントリ 6 (8)をコピ一'デ —タを保持すべく割り付け、 3— 5のように下から〈6〉，〈7〉となつている状態の A P Sを 3— 6のように〈8〉，〈6〉，〈7〉と変える。

C R Fのェントリ 6 (8)においては、 B Bフィールドに 1を立て、 W C F及ぴ Cの各フィールドには 0を書き込む。

設定ポインタの値は 5であるので、 I Qのェントリ 5 (5)に上記命令の内容を書き込む。この際、コピー元となるデータを保持すべく割り付けられている C R Fのエントリのアドレス〈7〉を第 1 ソース'フィ一ルドに、コピー'データを保持すベく新たに割り付けられる C R Fのェントリのアドレス〈8〉を第 1デスティネーション'フィ一ルドに書き込んでいる。また、 6 _ 5の状態にある C R Fのエントリ 6 (7)で W C Fフィールドを読み出し、 I Qの WC F 1フィールドに送っている。さらに、設定ポインタの値に 1を加え 6にする。

(6— B) 第 6サイクルの実行ステージ

L S Uは変数 Tのアクセスを開始する。レイテンシは 2サイクルであるとする。

演算ュニット 0で 5 (2)の演算命令の実行が正常に終了すれば、演算結果を構成する 2語（A+B)— 1、 (A+B)_2 が送られてくるので、 CRF のェントリ 6 (4)、 6 (5)のデータ.フィ一ルドに各々書き込み、 WC F フィールドを 1に変更する。その上、 I Qにおいて各ソース 'ブイ一ルドで C R Fのエントリのアドレス〈4〉，〈5〉を照合するが、この場合、 I Qのエントリ 5 (3)の第 1、第 2ソース'フィ一ルドで一致するので、同じエントリの WCF 1、 2の各フィールドを 1とする。

以上のように I Qのェントリ 5 (2)に書き込まれた命令の実行が正常に終了するので、 5 (2)の Sフィールドを正常終了を意味する 1に変更する。

(6 -C) 第 6サイクルの完了ステージ

5一 5の状態にある I Qの完了ボインタが示すェントリ 5 (2)において、 Sフィールドは 0であるので、完了ステージの動作としては何も行われない。

(7—A) 第 7サイクルの命令デコード '設定ステージ

命令 fdiv のデコード '設定を行う。オペランド 'スタックから 2語のソース 'データをポップして演算を行い、 1語の演算結果をプッシュする演算命令であるので、 AP Sから〈6〉，〈7〉をポップし、 F Lに登録されているフリーな CRFのェントリ 6 (9)を演算結果を保持すベく割り付け、そのエントリのアドレス〈9〉を A P Sにプッシュし、 A PSは 3— 7のようになる。 C RFのェントリ 6 (9)においては、 B Bフィ一ルドに 1を立て、 W C F及び Cの各フィールドには 0を書き込む。

設定ポインタの値は 6であるので、 I Qのエントリ 5 (6)に上記命令の内容を書き込む。この際、 AP Sからポップされる CRFのエントリのアドレス〈6〉 , 〈7〉を各々第 1、第 2ソース'フィールドに、 AP Sにプッシュされる〈9〉を第 1デスティネーション 'フィールドに書き込んでいる。また、 6— 6の状態にある CRFの 6 (6)、 6 (7)の各ェントリで WC Fフィールドを読み出し、それぞれ I Qの WCF 1、 2の各フィ一ルドに送っている。さらに、設定ポインタの値に 1を加え 7にする。

(7 -B) 第 7サイクルの実行ステージ

5— 6の状態にある I Qにおいて、演算命令が書き込まれているェントリ 5 (3)は有効な WC Fフィールドが全て 1 となっているので、このエントリ 5 (3)の内容をそのェントリのァドレス 3及ぴ CRFの 6 (4)、 6 (5)の各ェントリに書き込まれているソース 'データと共に演算ュニット 0に送り演算を開始させる。この演算のレイテンシは 2サイクルであるとする。

LSUから変数 Tのデータが送られてくるので、 CRFのェントリ 6 (7)のデータ'フィ一ルドに書き込み、 WCFフィ一ルドを 1に変更する。その上、 I Qにおいて各ソ一ス 'フィールドで C RFのエントリのアドレス〈7〉を照合するが、この場合、 I Qのエントリ 5 (5)の第 1 ソース，フィールド及ぴ同じタイミングで命令が書き込まれる 5 (6)の第 2ソ一ス'フィールドで一致するので、 5 (5)の WCF 1フィ一ルド及び 5 (6) の WCF 2フィールドを 1 とする。（5 (6)の WCF 1フィールドにつレヽては、（7— A) で説明したように 6— 6の状態にある C R Fのェントリ 6 (6)の WC Fフィールドが読み出され送られてくるので、これが書き込まれる。）

以上のように I Qのェントリ 5 (4)に書き込まれた命令の実行が正常に終了するので、 5 (4)の Sフィールドを正常終了を意味する 1に変更する。

(7 -C) 第 7サイクルの完了ステージ

5 - 6の状態にある I Qの完了ボインタが示すェントリ 5 (2)において、 Sフィールドが 1となったので、 5 (2)の内容に基づいて C P S及ぴ CRFを操作する。すなわち、 I Qのエントリ 5 (2)のソース'フィ一ノレドに書き込まれている〈0〉，〈1〉，〈2〉，〈3〉を CP Sからポップし、デスティネーション 'フィールドに書き込まれている〈4〉，〈5〉を C P Sにプッシュし、 C P Sは 4一 7のようになる。エントリ 'アドレスが C P Sからボップされる CRFの 6 (0)、 6 (1)、 6 (2)、 6 (3)の各エントリでは、 BBフィールドを 0に変更する。 CRFのエントリのアドレス〈0〉，〈1〉，〈2〉，〈3〉を F Lに登録する。さらに、完了ポインタの値に 1を加え 3とし、これで、 5 (2)の命令は完了したことになる。

(8-A) 第 8サイクルの命令デコード ·設定ステージ

命令 fsub のデコード '設定を行う。オペランド 'スタックから 2語のソース ·データをポップして演算を行い、 1語の演算結果をプッシュする演算命令であるので、 AP Sから〈8〉，〈9〉をポップし、 F Lに登録されているフリーな CRFのェントリ 6 (10)を演算結果を保持すベく割り付け、そのエントリのアドレス〈1 0〉を A P Sにプッシュし、 AP Sは 3— 8のようになる。

CRFのェントリ 6 (10)においては、 B Bフィ一'ルドに 1を立て、 W CF及び Cの各フィールドには 0を書き込む。

設定ポインタの値は 7であるので、 I Qのエントリ 5 (7)に上記命令の内容を書き込む。この際、 AP Sからポップされる CRFのエントリのアドレス〈8〉 , 〈9〉を各々第 1、第 2ソース.フィールドに、 AP Sにプッシュされる〈1 0〉を第 1デスティネーション 'フィールドに書き込んでいる。また、 6— 7の状態にある CRFの 6 (8)、 6 (9)の各エントリで WC Fフィールドを読み出し、それぞれ I Qの WC F 1、 2 の各フィールドに送っている。さらに、設定ポインタの値に 1を加え 8 にする。

(8— B) 第 8サイクルの実行ステージ

演算ュニット 0で 5 (3)の変換演算命令の実行が正常に終了すれば、 1語の演算結果（A+B) が送られてくるので、 CRFのエントリ 6 (6) のデータ.フィールドに書き込み、 WC Fフィールドを 1に変更する。その上、 I Qにおいて各ソース'フィールドで C RFのェントリのァドレス〈6〉を照合するが、この場合、 I Qのエントリ 5 (6)の第 1ソース'フィ一ルドで一致するので、同じエントリの WC F 1フィールドを 1とする。

以上のように I Qのェントリ 5 (3)に書き込まれた命令の実行が正常に終了するので、 5 (3)の Sフィールドを正常終了を意味する 1に変更する。

5— 7の状態にある I Qにおいて、スタック上でコピーを作成するようなオペランド 'スタックの操作命令が書き込まれているェントリ 5 (5) は有効な WC Fフィールドが 1となっているので、データのコピーを実行する。すなわち、 CRFのエントリ 6 (7)からデータを読み出し、これを C RFのェントリ 6 (8)のデータ 'フィールドに書き込み、 WC Fフィ一ルドを 1に変更する。その上、 I Qにおいて各ソース'フィールドで C R Fのエントリのアドレス〈8〉を照合するが、この場合、同じタィミングで命令が書き込まれる I Qのエントリ 5 (7)の第 1 ソース ·フィールドで一致するので、同じエントリの WC F 1フィ一ルドを 1とする。 (WC F 2フィールドについては、（8—A) で説明したように 6— 7 の状態にある CRFのェントリ 6 (9)の WC Fブイ一ルドが読み出され送られてくるので、これが書き込まれる。） I Qのエントリ 5 (5)の Sフィールドを正常終了を意味する 1に変更する。

(8 -C) 第 8サイクルの完了ステージ

5 - 7の状態にある I Qの完了ポィンタが示すェントリ 5 (3)において、 Sフィールドは 0であるので、完了ステージの動作としては何も行われない。

(9一 A) 第 9サイクルの命令デコード '設定ステージ

命令 fstore [X] のデコード '設定を行う。スタックトップにある 1語のデータのストア命令であるので、 AP Sから〈1 0〉をポップし、 A P Sは 3— 9のようになる。

設定ボインタの値は 8であるので、 I Qのェントリ 5 (8)に上記命令の内容を書き込む。この際、 AP Sからポップされる CRFのエントリのアドレス〈10〉を第 1 ソース'フィールドに書き込んでいる。また、 6 _ 8の状態にある C R Fのェントリ 6 (10)で WC Fフィールドを読み出し、 I Qの WC F 1ブイ一ルドに送っている。さらに、設定ポインタの値に 1を力 (1え 9にする。

I Qのェントリ 5 (8)に書き込まれるものと同じ上記命令の内容を、

I Qのェントリのァドレス 8と共にし SUに送る。

(9— B) 第 9サイクルの実行ステージ

5— 8の状態にある I Qにおいて、演算命令が書き込まれているェントリ 5 (6)は有効な WC Fブイ一ルドが全て 1 となっているので、このェントリ 5 (6)の内容をそのェントリのァドレス 6及び CRFの 6 (6)、 6 (7)の各ェントリに書き込まれているソース'データと共に演算ュニット 1に送り演算を開始させる。この演算のレイテンシは 1 0サイクルであるとする。

(9一 C) 第 9サイクルの完了ステージ

5 - 8の状態にある I Qの完了ボインタが示すェントリ 5 (3)において、 Sフィールドが 1となったので、 5 (3)の内容に基づいて C P S及び CRFを操作する。すなわち、 I Qのエントリ 5 (3)のソース'フィールドに書き込まれている〈4〉 , 〈5〉を C P Sからポップし、デステイネーシヨン'フィールドに書き込まれている〈6〉を C P Sにプッシュし、 C P Sは 4一 9のようになる。エントリ 'アドレスが C P からポップされる C R Fの 6 (4)、 6 (5)の各エントリでは、 B Bフィールドを 0に変更する。 C RFのエントリのアドレス〈4〉，〈5〉を F Lに登録する。さらに、完了ポインタの値に 1を加え 4とし、これで、 5 (3) の命令は完了したことになる。

(1 0— C) 第 1 0サイクルの完了ステージ

5 - 9の状態にある I Qの完了ボインタが示すェントリ 5 (4)において、 Sフィールドが 1であるので、 5 (4)の内容に基づいて C P S (及び CRF) を操作する。すなわち、 I Qのエントリ 5 (4)のデスティネーシヨン'フィールドに書き込まれている〈7〉を CP Sにプッシュし、 CP Sは 4— 1 0のようになる。さらに、完了ポインタの値に 1を加え 5とし、これで、 5 (4)の命令は完了したことになる。

(1 1一 C) 第 1 1サイクルの完了ステージ

5— 1 0の状態にある I Qの完了ポインタが示すェントリ 5 (5)において、 Sフィールドが 1であるので、 5 (5)の内容に基づいて C P S (及び CRF) を操作する。すなわち、（6— A) における A P Sの動作が再現され、 C P Sは 4— 1 1のようになる。さらに、完了ポインタの値に 1を加え 6とし、これで、 5 (5)の命令は完了したことになる。 (1 8— B) 第 1 8サイクルの実行ステージ

演算ュニット 1で 5 (6)の演算命令の実行が正常に終了すれば、 1語の演算結果（A+B)/T が送られてくるので、 CRFのエントリ 6 (9)のデータ'フィールドに書き込み、 WC Fフィールドを 1に変更する。その上、 I Qにおいて各ソース 'フィールドで CRFのエントリのァドレス〈9〉を照合するが、この場合、 I Qのエントリ 5 (7)の第 2ソース- フィールドで一致するので、同じエントリの WC F 2フィールドを 1とする。

以上のように I Qのェントリ 5 (6)に書き込まれた命令の実行が正常に終了するので、 5 (6)の Sフィールドを正常終了を意味する 1に変更する。

(1 9一 B) 第 1 9サイクルの実行ステージ

5一 1 8の状態にある I Qにおいて、演算命令が書き込まれているェントリ 5 (7)は有効な WC Fフィールドが全て 1 となっているので、このエントリ 5 (7)の内容をそのェントリのアドレス 7及び。 R Fの 6 (8)、 6 (9)の各ェントリに書き込まれているソース'データと共に演算ュニット 0に送り演算を開始させる。この演算のレイテンシは 2サイクルであるとする。

(1 9一 C) 第 1 9サイクルの完了ステージ

5— 1 8の状態にある I Qの完了ボインタが示すェントリ 5 (6)において、 Sフィールドが 1 となったので、 5 (6)の内容に基づいて C P S 及び CRFを操作する。すなわち、 I Qのエントリ 5 (6)のソース.フィ一ルドに書き込まれている〈6〉，〈7〉を C P Sからポップし、デスティネーシヨン'フィールドに書き込まれている〈9〉を C P Sにブッシュし、 C P Sは 4— 1 9のようになる。エントリ ·アドレスが C P S からポップされる CRFの 6 (6)、 6 (7)の各エントリでは、 BBブイ一ルドを 0に変更する。 C R Fのエントリのアドレス〈6〉，〈7〉を F Lに登録する。さらに、完了ポインタの値に 1を加え 7とし、これで、 5 (6)の命令は完了したことになる。

(20 -B) 第 20サイクルの実行ステージ

演算ユニット 0で 5 (7)の演算命令の実行が正常に終了すれば、 1語の演算結果 T-(A+B)/T が送られてくるので、 C R Fのエントリ 6 (10) のデータ'フィールドに書き込み、 WCFフィールドを 1に変更する。その上、 I Qにおいて各ソース 'ブイ一ノレドで CRFのェントリのァドレス〈1 0〉を照合するが、この場合、 I Qのエントリ 5 (8)の第 1 ソース'フィールドで一致するので、同じエントリの WC F 1フィールドを 1 とする。

以上のように I Qのェントリ 5 (7)に書き込まれた命令の実行が正常に終了するので、 5 (7)の Sフィールドを正常終了を意味する 1に変更する。

(21—B) 第 21サイクルの実行ステージ

5— 20の状態にある I Qにおいて、ストァ命令が書き込まれているエントリ 5 (8)は有効な WC Fフィールドが 1となっているので、 I Q のェントリのアドレス 8と共に C RFのェントリ 6 (10)に書き込まれているソース'データを L SUに送る。 5 (8)の Sフィールドをストァ実行可能を意味する 1に変更する。

(21 -C) 第 21サイクルの完了ステージ

5 - 20の状態にある I Qの完了ポィンタが示すェントリ 5 (7)において、 Sフィ一ルドが 1となったので、 5 (7)の内容に基づいて C P S 及ぴ CRFを操作する。すなわち、 I Qのェントリ 5 (7)のソース'フィ —ルドに書き込まれている〈8〉，〈9〉を C P Sからポップし、デスティネ一シヨン'フィールドに書き込まれている〈1 0〉を CP Sにプッシュし、 C P Sは 4— 2 1のようになる。エントリ ·アドレスが C P Sからポップされる CRFの 6 (8)、 6 (9)の各エントリでは、 BBブイ —ルドを 0に変更する。 C R Fのエントリのアドレス〈8〉，〈9〉を F Lに登録する。さらに、完了ボインタの値に 1を加え 8とし、これで、 5 (7)の命令は完了したことになる。

(22-C) 第 21サイクルの完了ステージ

5 - 21の状態にある I Qの完了ポィンタが示すェントリ 5 (8)においては、ストア命令が書き込まれており、 Sフィールドが 1となったので、 L S Uに I Qのエントリのアドレス 8を示して、データ'キヤッシュへのストアの実行を依頼する。さらに、 5 (8)の内容に基づいて C P S及び CRFを操作する。すなわち、 I Qのエントリ 5 (8)のソース'フィ一ルドに書き込まれている〈1 0〉を C P Sからポップし、 C P Sは 4一 22のようになる。エントリ .アドレスが C P Sからポップされる C R Fのエントリ 6 (10)では、 BBフィールドを 0に変更する。 CRF のエントリのアドレス〈1 0〉を F Lに登録する。さらに、完了ポインタの値に 1を加え 9とし、これで、 5 (8)の命令は完了したことになる。以上で、本第 1実施例の計算機システムにおいて X=T-(A+B)/T の計算が完了したことになる。

本発明の計算機システムにおいては、分岐予測に基づく投機的実行を実現することができる。 A PS履歴ファイルは、投機的実行を可能にするために具備されるものである。条件分岐命令がデコードされるごとに、 A P S履歴ファイルの 1 ェントリに A P Sの全ェントリ及び PP— OF— APS の内容を書き込むようになつている。以下に、本実施例の計算機システムにおいて、分岐予測に基づく投機的実行がどのように行われるかについて説明する。

前述のように、本実施例の計算機システムにおいては、命令デコード •設定ステージにおいて、命令をデコードして、命令の内容に応じて A ？及ぴじ！^ を操作すると共に、命令の内容を I Qに書き込むようになっている。初期状態から命令が流れ始め最初の条件分岐命令がデコ一ドされるまでの間、デコードされる命令に分岐タグとして 0を付し、この分岐タグ 0を、命令の内容が書き込まれる I Qのエントリの B Tフィ —ルド、及び、割り付けられる C R Fのエントリの Cフィールドに書き込む。

最初の条件分岐命令がデコードされ分岐予測が行われる際に、分岐時点の状態を保存するために、 A P Sの全ェントリ及び PP— OF— APS の内容を A P S履歴ファイルのアドレス 0のエントリに書き込む。上記の分岐予測に基づいた命令の流れにおいては、分岐タグとして 1を付し、 I

Q及ぴ C R Fの設定を行う。

2つ目の条件分岐命令がデコードされた時に、最初の条件分岐命令が未確定である場合、あるいは確定して予測が当たっていた場合には、 A P Sの全エントリ及び PP— OF— APS の内容を A P S履歴ファイルのアドレス 1のェントリに書き込む。 2段目の分岐予測に基づいた命令の流れにおいては、分岐タグとして 2を付し、 I Q及び C R Fの設定を行う。分岐予測が当たり続ければ以後同様に処理が進み、 A P S履歴フアイルへの書き込みはアドレス順に行われる。また、 A P S履歴ファイルのアドレス n のエントリに書き込みが行われてから次に書き込みが行われるまでの間にデコードされる命令には分岐タグとして n+1 を付すものとする。

分岐予測が外れた場合には、その条件分岐命令以降にデコ一ドされた命令に付された分岐タグをもとに、演算ユニット、分岐ユニット及び L S Uの各実行ユニットに送られた命令をキャンセルし、 C R Fにおいて Cフィ一ルドで分岐タグを照合してその一致するェントリの各々に対して、その B Bフィールドを 0に変更して、そのエントリのアドレスを F Lに登録し、 I Qの設定ポインタの値をその条件分岐命令が書き込まれているェントリの次のァドレスに書き換えることによって、その条件分岐命令以降にデコード ' ·設定された命令を無効とする。さらに、同じェントリ 'アドレスにある C P Sのェントリとその内容が一致しない A P Sの各ェントリ及び PP一 OF— APS に、その条件分岐命令がデコードされた際に A P S履歴ファイルに書き込まれた内容をコピーして、正しい位置の命令から処理を再開する。

以上のように、本発明の計算機システムにおいては、 A P S履歴ファィルを用いることによって、条件分岐命令がデコ一ドされ分岐予測が行われる各々の時点の状態を再構成することができるので、分岐予測に基づく投機的実行が可能である。

以上では、説明を簡単にするため、 1サイクルで同時にデコード '設定/完了できる命令は高々 1つまでとして説明してきた。本発明の計算機システムにおいては、同時に複数の命令をデコード '設定 Z完了できる構成とすることができる。すなわち、 F Lが F I F Oキューの構成となっていれば、割り付けのためにフリ一な C R Fのェントリのァドレスを F Lから取り出す順番は決まっており、各命令における何語ポップし何語プッシュするかというようなスタック操作の内容を把握して、同時に複数の命令をデコード ' ·設定することができる。また、命令の完了の動作においては、各命令における C P Sに対するスタック操作があらかじめ厳密に決められているので、より容易に複数命令の同時完了を実現することができる。

同時にデコード '設定 z完了できる命令の数を多くするほど、命令デコード '設定ユニットその他の制御回路が複雑になると共に、 I Qや C R Fを構成する各レジスタ 'ファイルのポ一トの数や I Qの各ェントリのソ一ス'フィールドごとに設けられる比較回路の数、演算ュニットの数、さらに構成要素間を結合するバスの数などの点で、より多量のハ一ドウユアが必要となる。

本発明の計算機システムにおいては、デコ一ド '設定を 2つのステージに分けて行うこととし、その前半のステージにおいて、同時にデコード '設定する複数の命令の内容を統合した形式に変換するような構成とすることも可能である。

たとえば、 1サイクル当り 3命令までデコード '設定できるような構成をとる場合、前述の X=T- (A+B) /T を計算するプログラムは第 1 3図の図表に示されるような内容に変換される。第 1 3図の図表の各段には、同時にデコード '設定される 3つの命令に基づく、 PP_OF— APS の増分、 A P Sの操作内容及び I Qの 3ェントリに書き込まれるべき設定内容を示している。ここでは、設定前の A P Sの内容を ..... s2, si, s0 (右端がスタックトップ）、 F I F Oキユーの構成となっているフリー.リストの内容を（取り出される順に） fl， β， β ..... として記述しており、デコ一ド '設定の後半のステージにおいて、それぞれ対応する C R Fのェントリ 'ァドレスが A P S Z I Qに書き込まれるようになつている。 PP_OF_APS の増分の欄で示されるように A P Sのスタックトツプの位置が移動するが、 A P Sの操作内容の欄では、この移動後のスタックトップの位置が右端に対応している。また、 WC'は「変化なし（No Change)」を意味する。ついで、本発明第 2実施例の計算機システムについて説明する。

第 2実施例は、オペランド 'スタックの操作命令の処理方法が、第 1 実施例と異なる。

第 2実施例の計算機システムは、第 1実施例とは、統合レジスタ-フアイル（CRF) 6のエントリの構成が異なるが、計算機システムの基本構成、及び、前進ポインタ 'スタック（AP S) 3、完了ポインタ'スタック（CP S) 4、命令キュー（ I Q) 5の構成は同様である。

第 1 4図は、本第 2実施例における、 CRF 6の各々のェントリ 6 (i) の詳細な構成を示す説明図である。ここで、 iはエントリのアドレスである。 CRF 6の各々のエントリ 6 (i)はデータ.フィールド 6 1 (i)、書込み完了フラグ（WC F， Write Completion Flag) フィールド 62 (i)、カラ一（C, Colour) フィールド 6 3 (i)、ビジ一ビット（BB) フィールド 64 (i)、及び参照数（N R, Number of Reference) フィールド 6 5 (i)から成っている。

C R Fの各々のエントリの、デ一タ'フィールド及び WC F、 C、 B Bの各フィールドは第 1実施例と同様である。

C R Fの各々のエントリにおいて、 NRフィ一ノレドは、その CRFのェントリのァドレスを保持している C P Sのェントリの数が書き込まれているようになつている。

すなわち、 C R Fとデータ.キャッシュの間の Spill/Fill の動作及び命令の完了に基づく CP Sに対する操作に伴い、 CRFの関係するェントリにおいて、そのェントリのァドレスを保持する C P Sのェントリの数の更新を行うようになっている。

第 2実施例においては、 C R Fからデータ ·キャッシュへの 1語のデ

—タのストア（Spill) は以下のように行われる。この場合、 BP— OF— PS で示されるェントリの内容が A P Sと C P Sで一致していなければならないが、その 2つのポインタ 'スタックで一致する BP— OF— PS で示されるェントリの内容で示される CRFのェントリに書き込まれている 1語分のデータをデータ'キャッシュにストア（Spill) し、 BP— OF— PS の値に 1を加える。さらに、上記 C R Fのエントリにおいて， NRフィールドの値から 1を引く。その結果、その値が 0になれば、その C R Fのェントリの B Bフィールドを 0に変更し、そのェントリのァドレスを F L に登録する。

逆に、データ'キヤッシュから C R Fへの 1語のデータの口一ド（Fill) は以下のように行われる。すなわち、最後にストア（Spill) した 1語分のデータをデータ ·キヤッシュから取り出し、それに F Lに登録されているフリーな C R Fの 1ェントリを割り付け、そのデータ'フィールドに書き込む。 W C F、 N R、 B Bの各フィールドは 1 とする。さらに、その割り付けられた C R Fのェントリのアドレスを、 A P S及ぴ C P S の BP— OF— PS に示されるエントリの 1つ下に各々書き込み、 BP— OF— PS の値から 1を引く。

命令の処理においても、本第 2実施例の計算機システムは第 1実施例と概ね同様であるが、以下に、各ステージごとに第 1実施例との相違を明確にすることにより、本第 2実施例の計算機システムの動作を説明する。

① 命令フェッチ 'ステージ

第 1実施例と同様。

② 命令デコード ·設定ステージ以下の点を除き、第 1実施例と同様。

·命令のデコード '設定に伴い新たに割り付けられる C R Fのエントリにおいて、 N Rフィールドに 0を書き込む。

•オペランド 'スタックの操作命令の場合、オペランド 'スタックに対して行うべき操作を A P Sに対して全く同様に行う。その命令の内容を I Qに書き込む際に、 Sフィールドは実行済みとする。また、スタック上でコピーを作成するようなオペランド 'スタックの操作命令（ Java VM における dup, dup2, dup_xl, dup2 xl, dup 及び dup2 x2 )の場合にも、 F Lに登録されているフリーな C R Fのェントリを新たに割り付けることはしないので、ソース'フィールド及びデステイネ一ション'フィ一ルドへの書き込みは必要ない。

③ 実行ステージ

以下の点を除き、第 1実施例と同様。

'オペランド '·スタックの操作命令に関しては、スタック上でコピ一を作成するような命令の場合も、実行ステージにおける動作としては、何も行わなレ、。

④ 完了ステージ

以下の点を除き、第 1実施例と同様。

•オペランド '·スタックの操作命令の完了においては、スタック上でコピ一を作成するような命令の場合も、オペランド 'スタックに対して行うべき操作を C P Sに対して全く同様に行う（命令がデコ一ド '設定された際の A P Sの動作を再現すべく C P Sが操作される、という観点からは第 1実施例と同様)。

•命令の完了に基づく C P Sに対する操作に伴い、関係する CRFのェントリの NRフィールドの値を増減させる。すなわち、エントリ 'アドレスが C P Sにプッシュされる C R Fのェントリでは NRフィールドの値を 0から 1に変更し、スタック上でコピ一を作成するようなオペランド 'スタックの操作命令の完了に伴いェントリ 'Ύドレスが C P S上でコピーされる C RFのェントリでは N Rフィ一ルドの値に 1を加え、ェントリ 'アドレスが C P Sからポップされる C RFのェントリでは N Rフィ一ルドの値から 1を引く。

•命令の完了に基づく C P Sに対する操作に伴い、エントリ 'ァドレスが C P Sからポップされる C R Fのエントリでは、 NRフィールドの値が 0になった場合にのみ、 B Bフィールドを 0に変更し、そのエントリ 'アドレスを F Lに登録する。

以上が、本第 2実施例の計算機システムの動作についての全般的な説明である。

第 1 5図〜第 2 1図は、本第 2実施例の計算機システムにおいて、前述の X=T- (A+B)/T の計算を行うプログラムを処理する際の動作をサイクル毎に示した説明図であり、図中 C R F 6及び I Q 5の各ェントリの構成は、それぞれ第 1 4図、第 5図のものと同じである。第 1 5図〜第 2 1図で空白となっている箇所は、そのフィールドの内容に留意する必要が無いことを意味する。時系列で各構成要素の内容を示すために、各部の符号の後尾にハイフンと各サイクルに対応する数字、及び、第 1実施例における動作例を示す第 6図〜第 1 2図における符号と区別するために文字 ' a 'を添えている。本発明の計算機システムは、上述の実施例に限られるものではなく、細部の構成の異なる様々な実施例が存在する。たとえば、次のようなものをあげることができる。

① I Qが各々のェントリにソース ·データも書き込まれるような構成となっており、 I Qにおいて、対応する WC Fフィールドに 1が立つのと同じタイミングでソース 'データを書き込むようにしたもの。

②各実行ュニットの入力段にリザべーション'ステ一ションを設けた構成とし、命令デコード'設定ステージにおいて、個々の命令の内容を I Qに書き込むと共にそれぞれ適切なリザべーション'ステーションへ送るようにしたもの（L S Uに関しては、リザべ一シヨン'ステーションと共にストァ'バッファを備えた構成としてもよい）。

③整数データ用 Z浮動小数点データ用、あるいは 32 ビット'データ用 / 64 ビット'データ用というようにデータ型別に C R F及びフリー ·リストを備え、さらに、それぞれに対応してひと揃いの実行ユニットを設けたもの。

これらの実施例の多くは、レジスタ 'ベースのスーパースカラ'ァ一キテクチヤにおいて同様な主旨のものを見出すことのできるものである。命令セットがスタック型の命令及びレジスタ型の命令を共に含むような、本発明に基づく計算機システムも実現可能である。すなわち、前進ポインタ'スタック及び完了ボインタ ·スタックに加えて、レジスタ番号にそれぞれ対応して設けられた各ェントリに統合レジスタ 'ファイルのエントリ 'ァドレスが書き込まれるようになっている前進レジスタ 'マツビング'テーブル及び完了レジスタ 'マツビング 'テーブルを具備する構成とし、スタック型の命令に関しては前進 Z完了ポインタ 'スタックを操作し、レジスタ型の命令に関しては前進/完了レジスタ 'マッピング' テーブルをアクセスするようにする。この場合、前進ポインタ 'スタツク履歴ファイルの代わりに、各々のェントリに前進ポインタ 'スタック及び前進レジスタ'マツビング'テーブル双方の内容が書き込まれるようになっている前進履歴ファイルを具備する必要がある。産業上の利用可能性

以上のように、本発明の計算機システムは、正確な例外処理を保証しつつ、スタックマシンの機械語で記述されたプログラムを out-of-order で処理するものであるが、複数の演算ュニットによる並列処理やそれらのパイプライン化によつて効率的な処理を行うことが可能であるという利点がある。

また、分岐予測に基づく投機的実行や、 1サイクル当り複数命令のデコード'設定 Z完了の可能な構成とすることにより、さらなる高速化が可能である。

Claims

請求の範囲 1. データ'キャッシュ（1 1 ) と

各々のェントリにデータが書き込まれるようになっている統合レジスタ 'ファイル（6) と

各々のエントリに上記統合レジスタ.ファイル（6) のエントリのァドレスが書き込まれるようになっているスタックの構成となっている前進ポインタ 'スタック（3) と

各々のェントリに個々の命令の内容が書き込まれるようになつている F I FO (First In First Out) キューの構成となっている命令キュー（5) と

演算を実行するようになっている演算ユニット（80， 8 1) と上記データ'キヤッシュ（1 1)及び上記統合レジスタ 'ファイル（6) にアクセスできるようになつている口一ドストァ.ュニット（83) とを具備し、

オペランド 'スタックに対するポップ操作を含む命令がデコ一ドされた場合には、ポップすべき語数と同じ数だけ上記統合レジスタ 'フアイノレ（6) のエントリのアドレスを上記前進ポインタ 'スタック（3) 力らポップし、

オペランド 'スタックに対するプッシュ操作を含む命令がデコ一ドされた場合には、プッシュすべき語数と同じ数だけ割り付けられていない上記統合レジスタ 'ファイル（6) のエントリを割り付け、上記割り付けた上記統合レジスタ 'ファイル（6) のエントリのアドレスを上記前進ポインタ 'スタック（3) にプッシュし、

デコードされた命令の内容を、ポップ Zプッシュ操作を伴う命令の場合にはポップ/プッシュされる上記統合レジスタ 'ファイル（6) のェントリのアドレスと共に、上記命令キュー（5 ) に書き込み、

上記命令キュー（5 ) に保持されている未実行の命令をデータ駆動の原理に基づき処理するようになっている、スタックマシンの機械語で記述されたプログラムを実行する計算機システム。

2 . 各々のエントリに上記統合レジスタ 'ファイル（6 ) のエントリのァドレスが書き込まれるようになつているスタックの構成となっている完了ポインタ 'スタック（4 ) を具備し、

上記命令キュ一（5 ) の先頭のエントリにおいて保持されている命令の完了が可能である、あるいはそうなると、上記命令キュ一（5 ) の上記先頭のエントリの内容に基づき、上記保持されている命令がデコードされた際の上記前進ポインタ 'スタック（3 ) の動作を再現すべく上記完了ポインタ 'スタック（4 ) を操作し、上記命令キュ一（5 ) から上記先頭のェントリを除外し、

ポップ操作によって上記完了ポインタ ·スタック（4 ) におけるアドレスの保持が無くなった上記統合レジスタ 'ファイル（6 ) のエントリの割り付けを解除するようになっている請求項 1記載の計算機システム。

3 . 割り付けられていない上記統合レジスタ 'ファイル（6 ) のェントリのァドレスを保持するフリー ·リストを具備し、

初期状態においては、上記統合レジスタ 'ファイル（6 の全てのェントリのァドレスが上記フリー 'リストに登録されており、

上記統合レジスタ 'ファイル（6 ) のエントリを割り付ける必要がある場合に、上記フリー ·リストカゝら割り付けられていない上記統合レジスタ 'ファイル（6 ) のエントリのアドレスを取り出し、

割り付けが解除された上記統合レジスタ ·ファイル（6 ) のエントリのァドレスを上記フリ一'リストに登録するようになっている請求項 2 記載の計算機システム。

4.上記前進ポインタ 'スタック（3)と上記完了ポインタ 'スタック（4) が循環型のバッファの構成となっており、

上記前進ポインタ 'スタック（3) 及び上記完了ポインタ ·スタック (4) で、上記統合レジスタ 'ファイル（6) のエントリのアドレスを保持する最下位のェントリの内容が一致する場合には、上記前進ボインタ 'スタック（3) 及び上記完了ポインタ 'スタック（4) において上記最下位のエントリにおける上記統合レジスタ .ファイル（6) のェントリのァドレスの保持を解除し、上記一致する内容で示される上記統合レジスタ 'ファイル（6) のエントリに書き込まれているデータを上記データ 'キャッシュ（ 1 1 ) にストア（Spill) することができるようになつており、

上記データ'キャッシュ（ 1 1 ) に最後にストア（Spill) したデータに対し、割り付けられていない上記統合レジスタ 'ファイル（6) の 1 エントリを割り付け、上記データを書き込み、上記前進ポインタ'スタック（3) 及ぴ上記完了ポインタ 'スタック（4) において、上記統合レジスタ 'ファイル（6) のエントリのアドレスを保持する最下位のェントリの 1つ下のェントリに上記データが書き込まれる上記統合レジスタ-ファイル（6) のエントリのアドレスを保持させることによって、上記最後にストア（Spill) したデータの上記統合レジスタ 'ファイル（6) へのロード（Fill) を行えるようになつている請求項 2記載の計算機システム。

5. 各々のエントリに上記前進ポインタ 'スタック（3) の内容が書き込まれるようになつている前進ポインタ ·スタック履歴ファイル（3 a) を具備し、

上記統合レジスタ 'ファイル（6) が各々のエントリに分岐タグも書き込まれるような構成となっており、

命令のデコードの際に、割り付けられる上記統合レジスタ 'ファイル ( 6 ) のエントリに分岐タグを書き込むようになっており、

条件分岐命令がデコードされるごとに、上記前進ボインタ ·スタック履歴ファイル（3 a ) の 1エントリに上記前進ポインタ 'スタック（3 ) の内容を書き込み、分岐タグを変更して、分岐予測に基づく投機的実行を行い、

分岐予測が外れた場合には、その条件分岐命令以降にデコードされた命令を無効にし、上記条件分岐命令以降にデコ一ドされた命令に付した分岐タグが書き込まれている上記統合レジスタ 'ファイル（6 ) のェントリの割り付けを解除し、上記条件分岐命令がデコードされた際に書き込みの行われた上記前進ポインタ ·スタック履歴ファイル（3 a ) のェントリの内容を、上記前進ポインタ 'スタック（3 ) にコピーして、正しい位置の命令から処理を再開することによって、

分岐予測に基づく投機的実行を行うようになっている請求項 2記載の計算機システム。

6 . 上記フリー 'リストが F I F Oキューの構成となっており、

同時に複数の命令をデコードし、上記前進ポインタ 'スタック（3 ) の操作、上記統合レジスタ 'ファイル（6 ) のエントリの割り付け及び上記命令キュー（5 ) の連続する複数のエントリへの命令の内容の書き込みを行う機能と、

同時に上記命令キュー（5 ) の連続する複数のエントリに書き込まれている内容に基づき、上記完了ポインタ 'スタック（4 ) の操作及び上記統合レジスタ 'ファイル（6 ) のエントリの割り付けの解除を行う機能を有する請求項 3記載の計算機、