JP2788605B2

JP2788605B2 - 計算機システム及び命令実行方法

Info

Publication number: JP2788605B2
Application number: JP6163633A
Authority: JP
Inventors: デービッド・スコット・レイ; ラリー・エドワード・サッチャー; ヘンリー・スタンレイ・ワレン、ジュニア
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1993-09-20
Filing date: 1994-07-15
Publication date: 1998-08-20
Anticipated expiration: 2013-08-20
Also published as: US5613080A; JPH07105002A; CN1047677C; CN1120195A; TW393622B; KR950009453A; DE69429226D1; KR0133238B1; EP0644482B1; DE69429226T2; ES2165375T3; CA2123442A1; BR9403516A; ATE209794T1; EP0644482A1

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、多重実行ユニットを持
つ処理システムにおける命令のタスク指名（dispatch）
に関するものである。特に、多重命令バッファを持つシ
ステムが提供される。ここで、命令は、依存、または独
立、または利用不可能な資源に依存、と定義される。こ
れらの命令は、それらの定義と他の命令との関係に依存
して、逐次に、あるいは並列に実行される。

【０００２】

【従来の技術】現在、多重実行ユニットを内蔵する処理
システムがあることが知られている。従来システムの大
多数は、加算、ストア、ロード、減算、乗算、分岐など
のような操作を実行するための多重特定目的実行ユニッ
トを含んでいる。命令依存性に関連した問題を解決する
ため、従来システムは対応する特定目的実行ユニットに
関連したバッファに特定命令を入れる。例えば、ロード
操作をロードユニットに関連したバッファに入れる、等
である。命令依存性があれば従来システムは最新の命令
を持っているだけである。最新の命令は前の命令の結果
に依存する。いったん前の命令が実行されると最新の依
存命令の特定の実行ユニットでの実行が許可される。従
来システムでは命令のシフトは様々な実行ユニットに関
連した様々なバッファの間で生起するが、このシフトは
命令の型とその型の命令を実行可能な特定の実行ユニッ
トとの関係に依存する。すなわちロード命令はロード実
行ユニットに関連したバッファにシフトされ得る。ま
た、これらの従来の技術である多重実行ユニットシステ
ムは、命令の順序を保持している本発明とは対称的に、
一般に乱れた順序で命令を実行する。

【０００３】米国特許第５１３３０７７号は多重相違実
行を示している。その中では、個々の実行が特定の型の
命令に対し責務を持っている。それ故、個々の命令は、
命令の型に基づいた実行ユニットの一つに関連した、特
定のバッファに記憶されなければならない。これらの命
令を別の実行ユニットに関連した別のバッファにシフト
することはできない。なぜならそれらの命令はある型の
実行ユニットに特有のものであるからである。したがっ
て、命令依存性が見つけられるとき、このシステムには
選ぶべきものがないが、保持している命令が依存する、
前の命令までの最新の依存する命令を保持することが実
行を完成させてきた。

【０００４】米国特許第４８３７６７８号は、命令を受
信し命令の型に基づいて命令をシフトするシフト回路を
含む命令順序器を含んだシステム、および命令間に依存
性を持たない命令を実行するためにどの実行ユニットが
要求されるか（第１１段、８〜１０行目）について論じ
ている。

【０００５】米国特許第４８４７７５５号は、実行順序
を解析し、実行順序に知識を加えた多数のプロセッサエ
レメントを持つ処理システムである。例えば、システム
は自然な一致性（独立命令）を探し、個々の命令に、論
理プロセッサと命令発生時間を含んだ知識を加える（第
１７段、５４〜６０行目）。そのシステムは本質的に命
令を並べ換える。論理資源ドライバがそれから（第１８
段、１０〜２５行目）選択された処理エレメントに個々
の命令を配送する。

【０００６】米国特許第５０７５８４０号は、順序が乱
れた命令を実行可能な多重プロセッサを持つシステムに
ついて論じている。このシステムは、特定の型の命令の
実行を、適した逐次的順序で実行することができるま
で、遅延する可能性を含んでいる。

【０００７】

【発明が解決しようとする課題】全ての命令の順序関係
を保持したまま多重実行ユニットを持つシステムで実行
する依存命令に関連した問題に対し、従来システムには
一般的な解決法を提供するものがないことが知られてい
る。多くの従来システムは、順序の乱れた命令を実行す
ることによって、処理システムの複雑さを増してしまう
複雑な分岐機構を要求する。したがって、命令の順序を
保持することによって、本発明はオーバーヘッドを減ら
し性能を最適化する。例えば、いつ分岐が生じるかを決
めておく。命令が解析され、他の命令との命令依存性だ
けに基づき実行ユニットの可能性には基づかずに実行さ
れる、多くの型の計算機を操作可能なプロセッサを持つ
ことは有利になる。

【０００８】

【課題を解決するための手段】従来技術とは対称的に、
本発明は、命令が復号ステージの間に解析され、これら
の命令が独立または依存または「利用不可能」と考えら
れるかどうかを決定するシステムを提供する。本発明の
目的のために、依存命令がすぐ前の命令に依存する命令
のみとして定義される。例えばレジスタのような、資源
における値の有効性に依存する命令は「利用不可能」と
定義され、ある場合には、それらの命令は本発明によっ
て独立として扱われ、並列（だが順序の乱れなし）にシ
フトされ得る。もちろん全くの独立命令は並列に実行さ
れる。

【０００９】概して言えば、個々の実行ユニットが関連
命令バッファを持つ、２重実行ユニット処理システムが
提供される。第１実行ユニット（ユニット０）は常に最
古の命令を含有し、第２ユニット（ユニット１）は最新
の命令を含有する。ロード、ストア、加算などのような
プロセッサ命令が命令キャッシュバッファからの命令バ
ッファ（０，１）のそれぞれに提供される。第１命令
（最古）をバッファ０に入れ、次の（第２）命令をバッ
ファ１に記憶する。命令が依存かどうか、命令が一度に
一つ実行されなければならないかどうか、あるいは命令
が独立かまたは「利用不可能」か、並列に実行すること
ができるか、を復号ステージの間に決定する。第２命令
が第１命令に依存するならば、（実行される第１命令に
続く）第２命令をバッファ１から第１命令バッファ０へ
横にシフトする。このシフトは全体的に第１命令に対す
る第２命令の依存性による。シフトされた命令はそれか
ら第１命令になり、新しい「第２」命令を第２命令バッ
ファに受信する。全ての命令は逐次的順序で実行される
ことに注意する。多数の逐次依存命令に出会ったなら実
行ユニット０のみによって逐次的に実行される。すなわ
ち２つの第１命令は、依存し合い、両方の命令バッファ
に入れられ、決定される。第２バッファの命令は第１に
依存するから、第１命令の実行に続いて、その命令を第
１命令バッファへシフトする。次の命令が第２命令バッ
ファ１に入れられ、それがまた依存性を持つなら、前の
命令を実行した後、第１バッファへシフトされる、など
である。次の命令が独立ならば、第１・第２実行ユニッ
トにおいて両者は並列に実行される。このように、プロ
セッサ命令が効率的に実行され、実行ユニットの可能性
ではなく、他との依存性に基づき逐次的に実行される。

【００１０】それ故、前の概要に従って、本発明の目
的、特徴、および利点が、付帯する図と共に記された請
求項と以下の記述から、技術上の熟練者に明らかになる
だろう。

【００１１】

【実施例】図１を参照しながら、本発明の多重実行プロ
セッサの中の様々な構成要素のハイレベルブロック図が
示される。１は命令バスＡ、Ｂ、Ｃ、Ｄから命令を受信
する命令バッファを表す。命令バッファ１は記憶装置
で、ハードウェアメモリのように、技術上よく知られた
ものである。レジスタファイル入力ラッチ１０は、シス
テムメモリ（図示なし）に接続されたデュアルポートデ
ータキャッシュユニット（図示なし）からデータを受信
する。２個を越える実行ユニットを持った処理システム
が考えられるが、本発明の実施例は２個の実行ユニット
を持ったプロセッサであることに注意されたい。復号制
御ユニット３および５（それぞれ実行ユニット０および
１に対応する）は命令バッファ１から受信した命令を解
釈するのに用いられる。復号ユニット３、５はロード、
ストア、加算、等の命令を認識できる。個々の復号ユニ
ット３、５はそれぞれ対応するレジスタファイル７、９
を持っている。レジスタファイルは、データキャッシュ
バス３６から直接にあるいは書き込みデータ線３５を通
して、入力ラッチ１０からデータを受信する。復号ユニ
ット３および５は、バッファ１から受信した命令に基づ
き、レジスタファイル７および９に読み込み・書き込み
制御信号を提供する。これらの制御信号は、データを、
入力ラッチ１０からレジスタファイル７、９へ書き込
み、レジスタファイル７、９から実行入力ラッチ１１へ
読み込むかどうかを決定する。したがって図１から、レ
ジスタファイル７は、４個のデータ語の入力レジスタか
らの書き込みと、３個のデータ語のそこからの実行ラッ
チ１１による読み込みを行わせることが明らかとなる。
レジスタファイル９は、４個のデータ語の入力レジスタ
ファイル１０からの書き込み、４語のそこからの実行ユ
ニットラッチ１１による読み込みを行わせる。

【００１２】本発明は復号制御ユニット３および５の中
に含むブール代数論理で装置化されることを注記する。
この論理は命令解釈の処理を装置化し、実行ユニット１
７および１９へ１命令をシフトするか、２命令をシフト
するかを決定する。図３および４のフローチャートに図
示されている本発明の論理の流れは、平均的な技術の一
つによって、本発明の復号ユニット３および５により装
置化されたハードウェア論理へ直ちに変換され得る。

【００１３】技術上の熟練者はまた、本発明がパイプラ
イン構造を持ったプロセッサであることを理解するだろ
う。このことは、様々なステージでデータがラッチされ
たり保持されることを意味する。このように、異なる命
令が処理システムへ同時に入力可能なように実行命令の
結果等を蓄える。したがって、プロセッサを通したデー
タの連続した流れが可能である。実行ユニット入力ラッ
チは、実際の実行ユニットへ入力されるデータより先
に、レジスタファイル７および９により与えられるデー
タを保持する。多重化器（図示なし）もまた実行ユニッ
ト入力ラッチ１１に含まれている。多重化器は、データ
が実行ユニットへ迂回できるデータキャッシュバス３６
から受信したデータ信号を組み合わせることができる。
レジスタファイル入力ラッチ１０はまた、データキャッ
シュユニットバス３６と書き込みバス３５からのデータ
の組み合わせを行うために、多重化器を含んでいること
を注記する。

【００１４】実行ユニット１７および１９は両方とも、
多数の命令を実行可能な全関数ユニットである。これら
のユニットは同一でもよいが、そのような制限は本発明
には要求されない。実施例では、ユニット１７および１
９は同一ではなく、２つの全関数実行ユニットで、それ
らは、二、三の特殊化された命令の特定の要求を取り扱
うための、わずかに異なる特徴を持っている。実行ユニ
ット１７は、加算関数を実行する２ポート加算器２１、
回転のような命令を実行するのに用いられる論理ユニッ
ト２３等を含んでいる。３ポート加算器２５は論理ユニ
ット２７と共に実行ユニット１９に含まれている。３ポ
ート加算器２５は、ロード、ストア、比較等を含む加算
型命令を実行するために要求されるサイクルの数に関し
て主要な節約を提供する。これは、命令が並列に実行さ
れ得るかどうかを決定するときに、本発明が全ての加算
型命令を独立命令として扱うことができることによる。
従来技術のシステムでは、加算型命令は依存と考えられ
る。すなわち第２命令は前の命令の完了まで待たなけれ
ばならない。例えば、命令（１）ＡＤＤＲ１，Ｒ２，
Ｒ３および（２）ＡＤＤＲ５，Ｒ１，Ｒ４は、レジス
タファイルＲ２およびＲ３の中の値を加算し、レジスタ
ファイルＲ１に新しい値を入れるのに、典型的に用いら
れる。次の命令は値がレジスタファイルＲ１に入れられ
るまで待たなければならない。なぜならこの値は、レジ
スタファイルＲ５に入れられた所望の結果の値を得るた
めに、レジスタファイルＲ４の値に加算されるからであ
る。所望の結果は実際はレジスタファイルＲ２、Ｒ３、
Ｒ４の値の和である。したがって、この操作を行うため
に、従来システムは２マシンサイクルを越える２個の命
令の実行を要求する。

【００１５】対称的に、本発明は、ＡＤＤ命令を独立と
して定義することを許し、それ故並列に実行される機構
を提供することによって、単一マシンサイクルで同じ操
作を行うことができる。前の例を用いて、命令ＡＤＤ
Ｒ１，Ｒ２，Ｒ３およびＡＤＤＲ５，Ｒ１，Ｒ４が復
号制御ユニット３および５によって復号されるとき、そ
れらの命令はＡｄｄＲ１，Ｒ２，Ｒ３およびＡｄｄ
Ｒ５，Ｒ２，Ｒ３，Ｒ４を意味すると解釈される。すな
わち依存命令は独立命令に合体される。そこでは、Ｒ２
およびＲ３の値は第２命令でＲ１の値に代入される。第
１加算命令ＡＤＤＲ１，Ｒ２，Ｒ３はそれでも実行さ
れなければならない。なぜならレジスタファイルＲ１に
入れられた値は次の加算命令（ＡＤＤＲ５，Ｒ１，Ｒ
４）以外の命令によって要求され得るからである。さら
に、３ポート加算器２５の存在によって、これらの命令
は両方とも同時に実行することができる。すなわち、Ａ
ＤＤＲ１，Ｒ２，Ｒ３が２ポート加算器２１で実行さ
れ、ＡＤＤＲ５，Ｒ２，Ｒ３，Ｒ４が３ポート加算器
２５で同時に実行される。このように、本発明は加算型
命令を他のどの命令も独立と定義することが可能であ
る。

【００１６】実行制御ユニット１３および１５もまた提
供され、それらは、それぞれ実行ユニット１７および１
９への制御信号の形式で、復号ユニット３、５からの復
号された命令を受信し、それらの命令を入力する。ユニ
ット１７および１９によるロードおよびストア命令の実
行の間、ストア命令に対するデータ値自体を計算するだ
けでなく、データを扱うために、有効なアドレス（すな
わちキャッシュのどこに参照データが位置するのか）が
加算器２１および２５によって計算される。有効なアド
レスはそれからデュアルポートデータアドレス翻訳論理
ユニット３３へ移される。ユニット３３は、実行ユニッ
トからの前に計算された有効なアドレスを物理的アドレ
スに翻訳する（すなわちメモリのどこに参照データが位
置するのか）。データはデータキャッシュからバス３６
で返され、レジスタファイル入力ラッチ１０に入力さ
れ、実行入力ラッチ１１へ迂回され得る（データキャッ
シュバス３６経由）。加算命令のような、プロセッサで
データを扱う他の型の命令に対し、実行ユニット１７、
１９からのデータ値がレジスタファイル入力ラッチ１０
に入力され、実行入力ラッチ１１へ迂回され得る（書き
込みバス３５経由）。

【００１７】図２は、図１に示された命令バッファ１の
より詳細な図である。命令バスＡ、Ｂ、Ｃ、およびＤ
は、命令キャッシュユニット等からバス８への命令を入
力する。バス８は直接実際の命令バッファ１４へ命令を
送信する。バッファ１４は高速入力、高速出力ハードウ
ェア記憶装置である。出力命令バッファ２および４は、
バス８から直接に、あるいはバッファ１４から、バス１
２経由で命令を受信する。命令バッファ２および４はそ
れぞれ実行ユニット１７、１９の一つと対応する。さら
に、バス６が提供される。バス６は命令をシフトさせる
か、あるいは出力バッファ２および４の間を転送させ
る。本発明の実施例は２個の全関数処理ユニットを含む
ので、命令はユニット１７、１９のどちらかによる実行
のために出力バッファ２および４の間をシフト可能であ
る。この可能性の意義は図３および図４と共に以下でも
っと十分に記述される。実行される命令はそのときバッ
ファ２および４から復号制御ユニット３および５への出
力である。

【００１８】図３および図４は本発明によって定義され
た命令の間の関係を示している。１つのカテゴリが、す
ぐ先の命令以外の、前の命令に依存する命令として定義
される。すなわち、ＬＯＡＤ命令によってメモリからロ
ードされた値は、後で数マシンサイクル実行される次の
命令によって利用され得る。例えば、次の命令が出会っ
たと仮定する。（１）ＬＯＡＤＲ１，Ｒ３１，Ｒ３０（２）ＡＤＤＲ４，Ｒ３，Ｒ２（３）ＡＤＤＲ５，Ｒ１，Ｒ２

【００１９】第１の命令（１）はレジスタファイルＲ１
の値をロードする。メモリでの有効なアドレスはＲ３１
とＲ３０を加算することによって計算される。「計算さ
れた」アドレスでのデータはＲ１にロードされる。次
に、命令（２）はレジスタファイルＲ３とＲ２の内容を
加算し、レジスタファイルＲ５に結果を入れる。したが
って、命令（３）が、利用不可能であり得る資源（レジ
スタファイルＲ１）の値に依存することが明らかとな
る。すなわちレジスタファイルＲ１にロードされる値は
多くのマシンサイクルがかかるシステムメモリからのも
のでなければならないかもしれない。

【００２０】本発明は、潜在的に利用不可能な資源（レ
ジスタファイル）に依存するということのために、すぐ
前の命令以外の、前の命令に依存する命令を「利用不可
能」と定義する。これらの「利用不可能」な命令が、ま
るでそれらが独立であるかのように、実行ユニット１７
および１９へ並列に動かされる。しかしながら、非常に
詳細に以下で論じるように、「利用不可能」な命令が依
存命令に先行するときや、これらの命令が逐次的に実行
しなければならないときのように、他に条件がある。依
存命令と共にこれらの「利用不可能」な命令は、それが
すぐ前の命令に基づこうと別の前の命令に基づこうと、
データ依存命令、すなわちある種のデータ依存性を持つ
命令と考えられる。

【００２１】それ故、本発明に従って、全ての命令は以
下のどれか一つにクラス分けされる。（１）独立、
（２）依存、あるいは（３）利用不可能。本発明は、こ
れらの命令のどの組み合わせを実行ユニット１７および
１９で同時に実行することができるか、および命令のう
ちのどれを逐次に実行しなければならないかを決定する
機構を提供する。命令バッファ０（参照番号２）に与え
られる第１命令およびバッファ１（参照番号４）への第
２命令の二つ一組にして、命令が命令ユニットバッファ
２および４に与えられる。このように、全ての命令を逐
次的順序で一度に一つ実行するか、最初の順序も維持し
て並列に実行するかのどちらかである。最古の命令は常
に命令バッファ２に入れられ、バッファ４の命令より先
に実行されると考えられるから、逐次的順序が保存され
る。前述のように、依存命令はすぐ前の命令に依存する
命令のみと定義し、３ポート加算器を用いた加算命令を
除いたものとする。その加算器は本発明の目的のために
独立と考えられる。独立命令はどんな結果、値、デー
タ、資源等を要求しないものと定義される。「利用不可
能」な命令は、すぐ前の命令以外の命令に依存するよう
に定義されたものである。

【００２２】上述のように、図３および図４は、より効
率的に２重実行ユニット１７および１９を利用するた
め、本発明に従って、前に定義された命令の実行を記述
するフローチャートである。初めに、上で示したように
定義される普通の命令を用いて、処理の一般的な記述
が、特定の例に従って表される。さらに、以下の記述は
２つの実行ユニットがある場合をカバーするが、異なる
数の実行ユニットを持つ処理システムが本発明によって
考えられることを理解されたい。

【００２３】ステップ１で、処理が始められ、ステップ
２は実行ユニット１７および１９が両方とも利用可能で
あるかどうかを決定する。もしそうでないなら、両方の
ユニットが利用可能になるまでシステムはステップ３で
保持される。いったんそれらのユニットが利用可能にな
れば、ステップ４は、命令系列（図２の命令バッファ２
および４からの）での第１命令および第２命令が両方と
も独立命令であるか両方とも依存命令であるかを決定す
る。第１命令および第２命令が両方とも独立なら、命令
は両方とも、ユニット３および５によって復号され、実
行ユニット１７および１９で同時に実行するため、マシ
ンへシフトされる（ステップ８）。第１命令および第２
命令が両方とも独立命令でないならば、この方法はステ
ップ５に進む。そこでは、第１命令および第２命令が両
方ともある理由で延期するかどうかを決定する。このこ
とは、レジスタの内容が必要であるが、まだ利用できな
いとき起こる。第１命令および第２命令が両方とも利用
不可能であるならば、（命令バッファあるいは復号で
の）命令の位置に関わらず、システムがこれらの命令が
アクセスできるようになるために必要とする「利用不可
能」な資源を待たなければならないから、命令は両方と
もステップ８でシフトされる。それ故、「利用不可能」
な命令は、新しい命令をバッファ２および４へ移して、
実行ユニット１７および１９へシフトされ得る。

【００２４】第１命令が利用不可能なレジスタファイル
の中身に依存し、第２命令が独立なら（ステップ６）、
これらの命令は両方ともステップ８で実行ユニットへシ
フトされる。この状況では、本発明は、２つの命令をシ
フトする。なぜなら「利用不可能」な命令が要求された
データのアクセスを待つために実行ユニット１７へ動か
され、独立命令が、「利用不可能」な命令が準備できる
まで実行ユニット１４で待つことができ、それから命令
は両方とも並列に実行されるからである。しかしなが
ら、第１命令が「利用不可能」でない、あるいは第２命
令が独立でないならば、本発明の命令実行法は、第１命
令が独立で第２命令が「利用不可能」であるかどうかを
決定するステップ７へ進む。ステップ７の状況では、た
った一つの命令がシフトされる。なぜなら命令バッファ
２へ利用不可能な命令を移す必要があり、利用不可能な
命令の次に来る命令が独立か利用不可能かのどちらかで
あるなら、２つの命令は次のマシンサイクルの間にシフ
トされ得る。また、本発明は全ての命令を順序正しく実
行するので、次の命令を受信する準備ができている命令
バッファ４を持つことが有利となる。すなわち、利用不
可能な命令を実行するまでシステムが待たなければなら
ないなら、バッファ２で待っている命令を持つことが最
も効率がよい。ここでその命令は実行するための次の命
令である。このように、後の命令が命令バッファ４へ移
動可能であり、それによってパイプラインの泡を避けて
いる。その資源が利用可能になった後で、マシンがバッ
ファ２へ利用不可能な命令を横にシフトしなければなら
ないなら、１サイクルが無駄になる。したがって、バッ
ファ４からバッファ２への利用不可能な命令のシフトの
後で、次に続く命令がバッファ４に配置可能であるか
ら、命令の連続した流れが確保される。

【００２５】ステップ７の条件が満たされるなら、その
方法はステップ１１へ続く。ステップ１１では、単一命
令が復号および実行のためマシンにシフトされる。１命
令のシフトはここでは実行ユニット１７への命令バッフ
ァでの命令のシフト、および命令バッファ２への命令バ
ッファ４での命令のシフトであると定義されることに注
意されたい。２命令のシフトは、バッファ２および４か
ら実行ユニット１７および１９への２つの命令の同時の
シフトを意味する。しかしながら、第１命令が独立でな
く、第２命令が「利用不可能」でないなら、ステップ９
は第１命令が独立で第２命令が依存であるかどうかを決
定する。もしそうであれば、処理はステップ１１へ続
く。ここでは独立命令をマシンへシフトし（バッファ２
から実行ユニット１７へ）、実行して、依存命令を命令
バッファ４から命令バッファ２へシフトする。依存命令
はいま、既に実行されていてもはや依存性を持つとは考
えられない命令に依存することに注意されたい。ステッ
プ１１の後で、処理はステップ２へ戻り、別の命令（第
２命令）がバス８またはバッファ１４により提供され、
これらの２つの命令がステップ２、４〜７、９および１
０の評価基準に従って考えられる。

【００２６】ステップ９で第１命令が独立でなく、第２
命令が依存でないと決定されたなら、ステップ１０は、
第１命令がマシンへ提供され、第２命令が第１命令出力
バッファへシフトされる（シフト１）かどうかを決定す
る。したがって、本発明の決定ブロック（ステップ４〜
１０）が、逐次的にも実行しながら、最大数の命令を並
列に実行するのを確実にするため、個々の型の定義され
た命令にどのように通信するかが明らかとなる。

【００２７】次に、典型的な命令系列が本発明の操作例
として用いられる。バスＡ、Ｂ、Ｃ、Ｄからバッファ１
に次の命令を受信したと仮定する。（１）ＬＯＡＤＲ１，Ｒ３１，Ｒ３０（２）ＬＯＡＤＲ２，Ｒ２９，Ｒ３０（３）ＡＤＤＲ２２，Ｒ２０，Ｒ２１（４）ＡＤＤＲ２４，Ｒ２２，Ｒ２３（５）ＡＤＤＲ３，Ｒ１，Ｒ２（６）ＬＯＡＤＲ６，Ｒ２，Ｒ２２（７）ＬＯＡＤＲ２５，Ｒ２８，Ｒ２９（８）ＡＤＤＲ８，Ｒ６，Ｒ７（９）ＬＯＡＤＲ９，Ｒ２７，Ｒ２８（１０）ＬＯＡＤＲ１０，Ｒ３１，Ｒ３０（１１）ＡＤＤＲ１１，Ｒ９，Ｒ３（１２）ＯＲＲ１１，Ｒ１１，Ｒ２０（１３）ＡＤＤＲ１３，Ｒ１１，Ｒ１２

【００２８】最初の２つの命令（１）および（２）はバ
ッファ２および４に入れられる。これらの命令は、それ
ぞれレジスタファイルＲ３１、Ｒ３０およびＲ２９、Ｒ
３０の値から計算されるアドレスに基づき、レジスタフ
ァイルＲ１およびＲ２の値をロードする。命令（１）お
よび（２）は、他のどの命令にも依存しないので、独立
であり、図３ａのステップ４に従って、両方とも実行ユ
ニット１７および１９へ同時にシフトされる（シフト
２）。命令（３）および（４）はそのときそれぞれバッ
ファ２および４に入れられる。命令（３）は加算命令
で、２つのレジスタファイルＲ２０、Ｒ２１の値を合計
し、レジスタファイルＲ２２に結果を入れる。命令
（４）は別の加算演算で、前の加算命令（３）の結果を
用いる。すなわちＲ２２の値がＲ２３の値に加算され、
結果がレジスタファイルＲ２４に入れられる。命令
（３）および（４）はレジスタファイルＲ２０、Ｒ２
１、およびＲ２３の値を加算する。本発明における３ポ
ート加算器２５の存在によって、これらの命令は独立で
あると考えられ、同時実行のために本発明によって実行
ユニット１７および１９へシフトされる（図３、ステッ
プ４）。

【００２９】命令（５）および（６）はそれからそれぞ
れバッファ２および４へ移される。命令（５）は加算命
令で、どちらも前の命令ではない命令（１）および
（２）に依存し、それ故、命令（５）は「利用不可能」
と考えられる。命令（６）は、有効なアドレスがレジス
タファイルＲ２およびＲ２２の値に依存するロード命令
である。これらの値は前の命令（５）の影響を受けな
い。しかしながら、Ｒ２は命令（ｌｏａｄＲ２）に依
存し、それ故、命令（６）もまた「利用不可能」と定義
される。本発明（図３のステップ５）に従って、２つの
「利用不可能」な命令を実行ユニット１７および１９へ
シフトする。ここで、それらのユニットは利用不可能な
データへのアクセスのために待っている。このことは、
次の２つの命令がバッファ２および４へ移されることを
許可する。

【００３０】命令（７）は、プロセッサの中でメモリか
らレジスタファイルＲ２５へ値をロードするロード命令
である。命令（７）は他のどの命令やレジスタとも独立
である。命令（８）はレジスタファイルＲ６、Ｒ７の値
を加算し、和をＲ８に入れる加算命令である。この命令
（８）は、命令（６）に依存しているから、「利用不可
能」である。第１命令が独立で第２命令が利用不可能で
あるこの場合、バッファ２の命令（７）のみが（実行ユ
ニット１７へ）シフトされるが、命令（８）はバッファ
４からバッファ２へ横に移される（図３、ステップ
７）。次の命令（９）はそれからバッファ４に入れら
れ、命令（８）および（９）が考えられる。命令（９）
は、プロセッサの中で値をメモリからレジスタファイル
Ｒ９へ入れ換え、独立と考えられるロード命令である。
それ故、利用不可能な命令（９）はバッファ２にあり、
独立命令（９）はバッファ１４にある。この場合、命令
（８）および（９）は両方とも、前の命令を実行すると
すぐに、実行ユニット１７および１９へ同時にシフトさ
れる（図３、ステップ６）。

【００３１】次の２つの命令（１０）および（１１）は
それぞれバッファ２および４へ提供される。命令（１
０）は独立命令で、そこでは処理システムの中で、メモ
リでの位置内容がレジスタファイルＲ１０へロードされ
る。命令（１１）は、（すぐ前の命令以外の）前の命令
の間に決定されるレジスタファイルＲ９の値に依存する
から、「利用不可能」である。第１命令（１０）が独立
で、第２命令（１１）が利用不可能である場合、第１命
令（１０）はバッファ２から実行ユニット１７へシフト
され、第２命令（１１）はバッファ４からバッファ２へ
シフトされる（図３、ステップ７）。

【００３２】命令（１２）はＯＲ命令で、２つのレジス
タファイルの内容について論理的な「ｏｒ」演算を行
う。この場合、２つのレジスタファイルはＲ１１および
Ｒ２０で、命令（１２）は結果をレジスタファイルＲ１
１に入れる。したがって、命令（１２）が、レジスタフ
ァイルＲ１１の値を決定する前の命令（１１）に依存す
ることが明らかとなる。したがって、バッファ２に利用
不可能な命令（１１）があり、バッファ４に依存命令
（１２）がある。この場合、単一命令（１１）が実行ユ
ニット１７へシフトされる（図４、ステップ１０）。命
令（１２）は実行１９へシフトできない。なぜならその
命令はＲ１１の値を必要とする。命令（１２）は、命令
（１１）に続いて実行されるため、バッファ２へシフト
される。命令（１３）は、レジスタファイルＲ１１およ
びＲ１２の内容を加算し、レジスタファイルＲ１３に和
を入れ、バッファ４へ移される。命令（１２）は、それ
が依存する命令（１１）を実行したから、いま独立と考
えられる。命令（１３）は、すぐ前の命令（１２）に依
存するから、依存性を持つ。したがって、バッファ２に
独立命令（１２）があり、バッファ４に依存命令（１
３）がある。この例では、独立命令（１２）が実行ユニ
ット１７へ移動され、依存命令（１３）がバッファ２へ
横にシフトされる（図４、ステップ９）。

【００３３】図５はマシンサイクル数での比較を提供す
る２つのタイミングダイヤグラムＡおよびＢを示してい
る。命令が独立なとき（ダイヤグラムＡ）および命令が
依存性を持つとき（ダイヤグラムＢ）には、ロード加算
命令を実行するためにマシンサイクルが要求される。

【００３４】ダイヤグラムＡに関しては、サイクル１に
おいて、命令バッファ２および４にロードおよび加算命
令がそれぞれ蓄えられ、両方の命令とも独立であるから
（図３、ステップ４）、それらは両方ともサイクル２の
間に実行のため実行ユニット１３および１５へシフトさ
れる。サイクル２の終わりにおいて、レジスタファイル
入力ラッチ１０へ加算命令からのデータがラッチされ
る。サイクル３の間にキャッシュからロード命令のため
のデータがアクセスされ、レジスタファイル入力ラッチ
１０へラッチされる。またサイクル３の間に、加算命令
のための制御信号がレジスタファイル７、９への書き込
みを生じさせる。サイクル４において、入力レジスタ１
０にあるキャッシュからのデータがレジスタファイル
７、９のレジスタ１１へ書き込まれる。

【００３５】ダイヤグラムＢは、命令バッファにある
（０および１にもある）同一の命令がサイクル１に位置
しているが、この場合、例えばＬＯＡＤＲ１とＡＤＤ
Ｒ１，Ｒ２，Ｒ３のように、加算命令がロード命令に
依存していることを示している。この場合、（図３のス
テップ９に従って）サイクル２の間に実行制御ユニット
へロード命令のみがシフトされる。またサイクル２の間
にも、命令バッファ４からバッファ２へ加算命令がシフ
トされる。この命令は、プロセッサ１９よりむしろプロ
セッサ１７による実行のために効果的にシフトされる。
この場合、ロードおよび加算命令はプロセッサ１７で順
番に実行されることに注意されたい。もちろん、サイク
ル２〜５の間にバス８またはバッファ１４からの付加的
な命令が命令バッファ４へ供給され、図３および図４の
処理に従って解析される。しかしながら、簡単のため、
これらの付加的な命令はダイヤグラムＡおよびＢには示
さない。サイクル３の間に、ロード命令はキャッシュに
アクセスさせ、要求されたデータを入力レジスタ１０へ
ロードさせて、実行ユニット入力ラッチ１１へ迂回させ
る。また、加算命令は実行制御１３へ移される。ここ
で、データは利用不可能であるからそれは止まる。サイ
クル４の間に加算命令が実行され、ロードデータと共に
レジスタファイル７、９が書き込まれる。最終的に、サ
イクル５の間にレジスタファイル７、９へ加算命令の結
果が書き込まれる。

【００３６】したがって、同一の依存命令より少ないサ
イクルで同一の独立命令は実行されることは明らかであ
る。ダイヤグラムＡおよびＢは明らかに独立命令が異な
った実行ユニットでどのように並列に実行され得るかを
示しているが、一方、依存命令は連続的に実行されなけ
ればならない。ダイヤグラムＡの加算命令は、その独立
性のため、ロード命令より先に実行される。しかしなが
ら、ダイヤグラムＢでは、加算は、そこでは依存性を持
つから、ロード命令の後で実行される。

【００３７】まとめとして、本発明の構成に関して以下
の事項を開示する。

【００３８】（１）第１及び第２の実行ユニットを含
んでいる計算機システムであって、命令を上記第１及び
第２の実行ユニットへ提供するための上記第１及び第２
の実行ユニットに関連した第１及び第２の命令バッファ
と、上記第１及び第２の命令バッファにある命令がデー
タ依存命令であるかどうかを解釈する手段と、上記第１
の実行ユニットへ上記データ依存命令を提供すると同時
に上記第２の実行ユニットへ他の命令を提供する手段と
を有する上記コンピュータ・システム。（２）上記提供手段が上記第２のバッファから上記第１
のバッファへ命令を移すための手段を含む上記（１）に
記載のシステム。（３）上記データ依存命令が依存命令および利用不可能
な命令を含み、他の命令が独立命令を含む上記（２）に
記載のシステム。（４）３つの異なる記憶位置に記憶される値の加算に用
いられる命令が独立命令と定義されるような３ポート加
算器をさらに含む上記（３）に記載のシステム。（５）上記第１及び第２の命令バッファからそれぞれの
第１及び第２の実行ユニットへ独立命令が並列にシフト
される上記（４）に記載のシステム。（６）第１及び第２命令バッファからそれぞれの第１及
び第２の実行ユニットへ利用不可能な命令が並列にシフ
トされる上記（５）に記載のシステム。（７）第１の命令バッファにある依存命令の一つが第１
の実行ユニットへシフトされ、第２の命令バッファにあ
る依存命令の一つが第１の命令バッファへ移される上記
（６）に記載のシステム。（８）第１の命令バッファにある利用不可能な命令の一
つと、第２の命令バッファにある独立命令の一つがそれ
ぞれ第１及び第２の実行ユニットへ並列にシフトされる
上記（７）に記載のシステム。（９）第１の命令バッファにある独立命令の一つが第１
の実行ユニットへシフトされ、第２の命令バッファにあ
る利用不可能な命令の一つが第１の命令バッファへ移さ
れる上記（８）に記載のシステム。（１０）第１の命令バッファにある独立命令の一つが第
１の実行ユニットへシフトされ、第２の命令バッファに
ある依存命令の一つが第１の命令バッファに移される上
記（９）に記載のシステム。（１１）第１及び第２の実行ユニットを含むコンピュー
タ・システムにおいて命令を実行する方法であって、命
令を上記第１及び第２の実行ユニットへ提供するための
上記第１及び第２の実行ユニットに関連した第１及び第
２の命令バッファを提供するステップと、上記第１及び
第２の命令バッファにある命令がデータ依存命令である
かどうかを解釈するステップと、上記第１の実行ユニッ
トへデータ依存命令を提供し、他の命令を上記第２の実
行ユニットへ同時に提供するステップとを有する上記方
法。（１２）上記提供するステップが上記第２のバッファか
ら第１のバッファへ命令を移すステップを含む上記（１
１）に記載の方法。（１３）データ依存命令が依存命令および利用不可能な
命令を含み、他の命令が独立命令を含む上記（１２）に
記載の方法。（１４）３つの異なる記憶位置に記憶された値の加算に
用いる命令が独立命令と定義される３ポート加算器を提
供するステップをさらに含む上記（１３）に記載の方
法。（１５）上記第１及び第２の命令バッファからそれぞれ
第１及び第２の実行ユニットへ独立命令を並列にシフト
するステップと、上記第１及び第２の命令バッファから
それぞれ第１及び第２の実行ユニットへ利用不可能な命
令を並列にシフトするステップとをさらに含む上記（１
４）に記載の方法。（１６）上記第１の命令バッファにある依存命令の一つ
を上記第１の実行ユニットへシフトするステップと、上
記第２の命令バッファにある依存命令の一つを上記第１
の実行ユニットへ移すステップとをさらに含む上記（１
５）に記載の方法。（１７）上記第１の命令バッファにある利用不可能な命
令の一つ、および上記第２の命令バッファにある独立命
令の一つを、それぞれの第１及び第２の実行ユニットへ
シフトするステップをさらに含む上記（１６）に記載の
方法。（１８）上記第１の命令バッファにある独立命令の一つ
を上記第１の実行ユニットへシフトするステップと、上
記第２の命令バッファにある利用不可能な命令の一つを
上記第１命令バッファへ移すステップとをさらに含む上
記（１７）に記載の方法。（１９）上記第１の命令バッファにある独立命令の一つ
を上記第１の実行ユニットへシフトするステップと、上
記第２の命令バッファにある依存命令の一つを上記第１
の命令バッファへ移すステップとをさらに含む上記（１
８）に記載の方法。（２０）上記第１の命令バッファへ移された上記第２の
命令バッファにある命令の後の、第２の命令バッファへ
単一の連続する命令を提供する手段と、上記第１及び第
２の命令バッファにある命令が上記第１及び第２の実行
ユニットへ並列にシフトされるとき、２つの連続する命
令を第１及び第２の命令バッファへそれぞれ提供する手
段とをさらに含む上記（１０）に記載のシステム。（２１）上記第１の命令バッファへ移された上記第２の
命令バッファにある命令の後の、単一の連続する命令を
第２の命令バッファへ提供するステップと、上記第１及
び第２の命令バッファにある命令が上記第１及び第２の
実行ユニットへ並列にシフトされるとき、２つの連続す
る命令を第１及び第２の命令バッファへそれぞれ提供す
るステップとをさらに含む上記（１９）に記載の方法。

【００３９】

【発明の効果】当業者には、本発明が、従来システムよ
り１サイクル当たりの命令を多く実行することによっ
て、プロセッサ性能を上げることがわかる。例えば、独
立、利用不可能、独立と定義された命令（Ｉ１，Ｕ，Ｉ
２）は従来の２重実行ユニットシステムへ提供され、Ｉ
１およびＵはユニット０および１へ提供される。資源が
利用可能になるとき、処理システムはＩ１を実行し、そ
のあと（ｎサイクル後）Ｕ命令を実行する。したがっ
て、Ｉ１を実行した後、本発明は、実行ユニット０へＵ
命令を移動し、実行ユニット１へＩ２をシフトする。資
源が利用可能になるとき、処理システムは（ｎサイクル
後に）ＵおよびＩ２の両方を実行する。もちろん、Ｉ２
は、独立であるから、Ｕと共に並列に実行することがで
きる。したがって、本発明はｎサイクルに３つの命令を
実行させることができる。前の例の中で、利用不可能な
命令Ｕ２がＵの次に来ると、他の利点もある。この場
合、逐次的で利用不可能な命令はよく同じ資源に依存す
ることがあり、いったん（ｎサイクル後に）それが利用
可能になれば両方とも実行できるから、ＵとＵ２の両方
が並列に実行できる高い確率がある。それ故、本発明は
再びｎサイクルで３つの命令を実行するが、従来システ
ムは、Ｕ２は実行のためにＵを待つから、２つを実行す
るに過ぎない。

【図面の簡単な説明】

【図１】本発明を利用可能な多重実行プロセッサの様々
な構成要素を示したブロック図である。

【図２】個々の実行ユニットに関連した命令バッファお
よび命令フローパスを図示した本発明の詳細図である。

【図３】第１命令および第２命令が様々な評価基準に基
づいて依存性を持つように示された、本発明の実施例を
図示した流れ図である。

【図４】第１命令および第２命令が様々な評価基準に基
づいて依存性を持つように示された、本発明の実施例を
図示した流れ図である。

【図５】独立命令および依存命令を実行するために本発
明が要求するマシンサイクルの数の例を示したタイミン
グ図である。

【符号の説明】

１命令バッファ２命令バッファ０３復号ユニット０制御４命令バッファ１５復号ユニット１制御６バス７レジスタファイル８バス９レジスタファイル１０レジスタファイル入力ラッチおよび多重化器１１実行ユニット入力ラッチおよび多重化器１２バス１３実行ユニット０制御１４命令バッファ１５実行ユニット１制御１７実行ユニット０１９実行ユニット１２１２ポート加算器２３論理ユニット２５３ポート加算器２７論理ユニット３３デュアルポートデータアドレス翻訳論理３５書き込みデータ線３６データキャッシュバス

───────────────────────────────────────────────────── フロントページの続き (72)発明者ラリー・エドワード・サッチャーアメリカ合衆国78759 テキサス州、オースチン、ディー・ケー・ランチ・ロード 11507 (72)発明者ヘンリー・スタンレイ・ワレン、ジュニアアメリカ合衆国10562 ニューヨーク州、オシニング、キッチャワン・ロード 879 (56)参考文献特開昭51−40043（ＪＰ，Ａ) 特開平３−214235（ＪＰ，Ａ) 特開平２−130634（ＪＰ，Ａ) 特開平５−127903（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁶，ＤＢ名) G06F 9/38

Claims

(57)【特許請求の範囲】

【請求項１】第１及び第２の実行ユニットを含んでいる
計算機システムであって、命令キャッシュから特定の順序で命令を受信し、上記第
１及び第２の実行ユニットのそれぞれに対応して上記命
令をそれらに供給する第１及び第２の命令バッファと、上記第１及び第２の命令バッファにある命令が独立命令
であるかどうかを解釈する手段と、上記第１及び第２の命令バッファ内の上記命令が独立命
令であると判断された場合に、上記第１の命令バッファ
内の上記命令及び上記第２の命令バッファ内の上記命令
をそれぞれ上記第１及び第２の実行ユニットに同時に供
給する手段と、上記第２の命令バッファ内の上記命令が上記第１の命令
バッファ内の上記命令に依存する場合に、上記第１の命
令バッファ内の上記命令を上記第１の実行ユニットに供
給し、さらに上記第２の命令バッファ内の上記命令を直
接上記第２の命令バッファから上記第１の命令バッファ
に、及び上記命令の他のものを上記命令キャッシュから
上記第２の命令バッファに同時に移動する手段と、を有し、上記命令の上記特定の順序は正しい順序で維持
されかつ実行される上記計算機システム。
【請求項２】３つの異なる記憶位置に記憶される３つの
値を同時に加算するために、かつ上記解釈手段によって
いかなる他の命令とも独立して実行される独立命令とし
て上記３つの値を加算する命令を指定されるようにする
ために使用される３ポート加算器をさらに含む請求項１
に記載のシステム。
【請求項３】上記解釈手段に含まれ、上記第１及び第２
の命令バッファからそれぞれの第１及び第２の実行ユニ
ットへ独立命令が並列にシフトされるようにする復号制
御回路を有する請求項２に記載のシステム。
【請求項４】上記復号制御回路が第１及び第２命令バッ
ファからそれぞれの第１及び第２の実行ユニットへ利用
不可能な命令が並列にシフトされるようにする請求項３
に記載のシステム。
【請求項５】上記復号制御回路が第１の命令バッファに
ある依存命令の一つが第１の実行ユニットへシフトさ
れ、第２の命令バッファにある依存命令の一つが第１の
命令バッファへ移されるようにする請求項４に記載のシ
ステム。
【請求項６】第１及び第２の実行ユニットを含んでいる
計算機システムにおいて命令を実行する方法であって、命令キャッシュから特定の順序で命令を受信し、上記第
１及び第２の実行ユニットのそれぞれに対応して上記命
令をそれらに供給する第１及び第２の命令バッファを提
供するステップと、復号制御回路によって上記第１及び第２の命令バッファ
にある命令が独立命令であるかどうかを解釈するステッ
プと、上記復号制御回路によって、上記第１及び第２の命令バ
ッファ内の上記命令が独立命令であると判断された場合
に、上記第１の命令バッファ内の上記命令及び上記第２
の命令バッファ内の上記命令をそれぞれ上記第１及び第
２の実行ユニットに同時に供給するステップと、上記復号制御回路によって、上記第２の命令バッファ内
の上記命令が上記第１の命令バッファ内の上記命令に依
存する場合に、上記第１の命令バッファ内の上記命令を
上記第１の実行ユニットに供給し、さらに上記第２の命
令バッファ内の上記命令を直接上記第２の命令バッファ
から上記第１の命令バッファに、及び上記命令の他のも
のを上記命令キャッシュから上記第２の命令バッファに
同時に移動するステップと、を有し、上記命令の上記特定の順序は正しい順序で維持
されかつ実行される上記方法。
【請求項７】上記移動するステップが上記第２のバッフ
ァから第１のバッファへ上記第１及び第２のバッファを
相互接続するバスを介して命令を移すステップを含む請
求項６に記載の方法。
【請求項８】３つの異なる記憶位置に記憶される３つの
値を同時に加算するために、かつ上記解釈手段によって
いかなる他の命令とも独立して実行される独立命令とし
て上記３つの値を加算する命令を指定されるようにする
ために使用される３ポート加算器を使用するステップを
さらに含む請求項７に記載の方法。
【請求項９】上記復号制御回路によって、上記第１及び
第２の命令バッファからそれぞれ第１及び第２の実行ユ
ニットへ独立命令を並列にシフトするステップと、上記復号制御回路によって、上記第１及び第２の命令バ
ッファからそれぞれ第１及び第２の実行ユニットへ利用
不可能な命令を並列にシフトするステップとをさらに含
む請求項８に記載の方法。
【請求項１０】上記復号制御回路によって、上記第１の
命令バッファにある依存命令の一つを上記第１の実行ユ
ニットへシフトするステップと、上記復号制御回路によって、上記第２の命令バッファに
ある依存命令の一つを上記第１の実行ユニットへ移すス
テップとをさらに含む請求項９に記載の方法。