JPH06208462A

JPH06208462A - パイプラインプロセッサ用のコストを基にしてヒューリスティックに命令をスケージューリングする方法および装置

Info

Publication number: JPH06208462A
Application number: JP4075608A
Authority: JP
Inventors: Gregory Tarsy; グレゴリー・ターシィ; Michael J Woodard; マイケル・ジェイ・ウッダード
Original assignee: Sun Microsystems Inc
Current assignee: Sun Microsystems Inc
Priority date: 1991-02-27
Filing date: 1992-02-27
Publication date: 1994-07-26
Anticipated expiration: 2013-02-25
Also published as: JP2720128B2; EP0501653A3; KR920016940A; DE69229365D1; EP0501653B1; DE69229365T2; US5202993A; KR970005456B1; EP0501653A2

Abstract

(57)【要約】【目的】符号の発生後に時間命令スケジューリングを
コンパイルするために、パイプラインプロセッサ用のコ
ストを基にしたヒューリスティック命令スケジューリン
グのための方法および装置を得ることである。【構成】この方法および装置は、現在の適当な全ての
自由命令の間の最低合計コストを基にして、命令ブロッ
クの命令を一度に一つずつスケジュールする。現在保持
の適切な各自由命令の合計コストは、複数のコストヒュ
ーリスティックの重みづけられた和を基にして計算され
る。好適な実施例で用いられるコストヒューリスティッ
クは資源依存性コストと、データ依存性コストと、依存
性待ち行列と、依存性サイクルコストと、浮動小数点比
コストと、記憶比コストと、浮動小数点待ち行列コスト
とを有する。また、好適な実施例においては、いくつか
のコストヒューリスティックがプロセッサモデルにより
モデル化される。その結果、命令ブロックの実行時間の
短縮による全体的な効果が向上させられる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、コンピュータ装置の分
野に関するものである。とくに、本発明はパイプライン
プロセッサ用のコストを基にしたヒューリスティック
（ｈｅｕｒｉｓｔｉｃ）命令スケジューリングに関する
ものである。

【０００２】

【従来の技術】命令スケジューリングというのは、基本
命令ブロックのための実行時間パイプラインインターロ
ックの数を大幅に減少させることにより、命令の基本ブ
ロックの実行速度を高くする技術のことである。一般
に、基本命令ブロックの実行におけるパイプラインイン
ターロックの数を減少するためには、エージェントおよ
びタイミングにより区別される下記の三つのやり方があ
る。ａ．実行中にハードウェアにより、ｂ．符号化中にプログラマにより、ｃ．コンパイル中にソフトウェアにより。

【０００３】ハードウェアによるやり方は、かなり効果
的ではあるが、費用がかかりすぎる。ハードウェアによ
るやり方は比較的小さい命令ブロックに限られる。ハー
ドウェアによる命令スケジューリングの詳細については
１９６４年秋期連合コンピュータ会議議事録（Ｐｒｏｃ
ｅｅｄｉｎｇＦａｌｌＪｏｉｎｔＣｏｍｐｕｔｅ
ｒＣｏｎｆｅｒｅｎｃｅ）第２部、６巻、１９６４、
３３〜４０ページ所載のソーントン（Ｔｈｏｒｎｔｏｎ
Ｊ．Ｅ．）の論文「コントロール・データ６６００に
おける並列動作（ＰａｒａｌｌＯｐｅｒａｔｉｉｏｎ
ｉｎｔｈｅＣｏｎｔｒｏｌＤａｔａ６６０
０）」、およびアイビーエム・ジャーナル・オブ・リサ
ーチ・アンド・ディベロップメント第１１巻、１号、１
９６７年１月号、２５〜３３ページ所載のトマスト（Ｔ
ｏｍａｓｕｔｏＲ．Ｍ．）の「多数の算術装置を利用
するための効率的なアルゴリズム（ＡｎＥｆｆｉｃｉ
ｅｎｔＡｌｇｏｒｉｔｈｍｆｏｒＥｘｐｌｏｉｔ
ｉｎｇＭｕｌｔｉｐｌｅＡｒｉｔｈｍｅｔｉｃＵｎ
ｉｔ）」を参照されたい。

【０００４】プログラマによるやり方は時間が非常にか
かり、かつ誤りを起こしやすいから、このやり方は一般
的に非実用的である。アセンブリ・プログラマのための
パイプラインインターロックを避けるための符号化指針
についての詳細は、１９８２年３月にカリホルニア州パ
ロ・アルト（ＰａｌｏＡｌｔｏ）において開催された
プログラミング言語およびオペレーティング・システム
のためのアーキテクチャ的サポートについてのシンポジ
ウム議事録（ＰｒｏｃｅｅｄｉｎｇｏｆｔｈｅＳ
ｙｍｐｏｓｉｕｍｏｎＡｒｃｈｉｔｅｃｈｔｕｒａ
ｌＳｕｐｐｏｒｔｆｏｒＰｒｏｇｒａｍｍｉｎｇ
ＬａｎｇｕａｇｅａｎｄＯｐｅｒａｔｉｎｇＳ
ｙｓｔｅｍ）１２〜１９ページ所載のライマーチック
（ＲｙｍａｒｃｚｙｋＪ．Ｗ．）の「パイプラインプ
ロセッサ用の符号化指針（ＣｏｄｉｎｇＧｕｉｄｅｌ
ｉｎｅｓｆｏｒＰｉｐｅｌｉｎｅｄＰｒｏｃｅｓ
ｓｏｒｓ）」を参照されたい。

【０００５】インターロックの検出および除去のため
の、とくにコンパイル時における、ソフトウェアのやり
方は、現在では最も実用的で効果的なやり方である。初
期の技術は、マイクロコードのスケジューリングおよび
短縮と、垂直マイクロ命令の正しい順序を水平マイクロ
命令のより短い順序へパッキングすることに集中する傾
向がある。他の技術は符号の発生中または発生後のスケ
ジューリングに集中した。現在まで、符号の発生後にお
けるヒューリスティック命令スケジューリングが他の技
術よりも効果的であることが経験的に証明されている。
種々の技術の考察に関しては、スタンフォード大学、コ
ンピュータ・システム研究所、技術レポート８３−２５
５（ＴｅｃｈｎｉｃａｌＲｅｐｏｒｔ，８３−２５５
ＣｏｍｐｕｔｅｒＳｙｓｔｅｍｓＬａｂ．，Ｓｔａ
ｎｆｏｒｄＵｎｉｖｅｒｓｉｔｙ）１９８３年１２月
号所載のグロス（Ｇｒｏｓｓ，Ｔ．Ｒ．）の論文「パイ
プライン・コンストレイントの符号最適化（Ｃｏｄｅ
ＯｐｔｉｍｉｚａｔｉｏｎｏｆＰｉｐｅｌｉｎｅＣ
ｏｎｓｔｒａｉｎｔ）」を参照されたい。

【０００６】グロスはその論文において、最悪の場合の
複雑さがｎⁿ である、デッドロックを避けるために先読
みを用いる発見的スケジューリング技術について述べて
いる。先読みの代わりに依存性グラフ表現および三つの
ヒューリスティックを用いることにより、ギボンズ（Ｇ
ｉｂｂｏｎｓ）およびマッチニック（Ｍｕｃｈｎｉｃ
ｋ）は最悪の場合の複雑さがｎ² と改善された（実際に
は直線的）ヒューリスティックスケジューリング技術を
開発した。候補命令（依存性のない命令）は対となって
分析される。ある候補命令が他の候補命令に対して区別
可能な違いを有するものとすると、重要さの順序に従っ
て調べられる三つのヒューリスティックの一つで、候補
命令がスケジュールされる。三つのヒューリスティック
というのは次の通りである。ａ．命令がそれのすぐ後の命令の任意のものでインター
ロックするか、ｂ．その命令のすぐ後の命令の数、ｃ．命令から依存性グラフの葉までの最も長い経路まで
の長さ。ギボンズおよびマッチニックの技術の詳細については、
１９８６年７月に開催されたコンパイラ構造についての
ＳＩＧＰＬＡＮ１９８６年シンポジウムの議事録（Ｓ
ｙｍｐｏｓｉｕｍｏｆｔｈｅＳＩＧＰＬＡＮ ’
８６ｓｙｍｐｏｓｉｕｍｏｎｃｏｍｐｉｌｅｒ
ｃｏｎｓｔｒｕｃｔｉｏｎ）所載のギボンズ（Ｇｉｂｂ
ｏｎｓＰ．Ｂ．）およびマッチニック（Ｍｕｃｈｎｉ
ｃｋＳ．Ｓ．）の論文「パイプラインアーキテクチャ
のための効率的な命令スケジューリング（Ｅｆｆｉｃｉ
ｅｎｔＩｎｓｔｒｕｃｔｉｏｎＳｃｈｅｄｕｌｉｎｇ
ｆｏｒａＰｉｐｅｌｉｎｅｄＡｒｃｈｉｔｅｃ
ｔｕｒｅ）」を参照されたい。

【０００７】ギボンズおよびマッチニックの技術、およ
びいくつかのヒューリスティックが付加されたそれの後
継技術には下記のような少なくとも二つの欠点があるこ
とが見出されている。ａ．第２のタイ・ブレーカーを除き、ヒューリスティッ
クの間に限られた相互作用がある、ｂ．僅かにより重要なヒューリスティックにおける小さ
な違いが僅かに重要性が低いヒューリスティックにおけ
る大きい違いよりまさることがある。

【０００８】

【発明が解決しようとする課題】本発明は従来の技術の
諸欠点を解消し、パイプラインプロセッサ用のコストを
基にしたヒューリスティック命令スケジューリングのた
めの改善した方法および装置を提供するものである。

【０００９】

【課題を解決するための手段】符号発生後の時間命令ス
ケジューリングをコンパイルすることに特に応用され
る、パイプラインプロセッサ用のコストを基にしたヒュ
ーリスティック命令スケジューリングのための方法およ
び装置について説明する。パイプラインプロセッサ用の
コストを基にした本発明のヒューリスティック命令スケ
ジューリング法は、スケジュールすべき複数の命令を含
む命令ブロックのための命令依存性グラフを構成する過
程と、前記命令依存性グラフを基にして前記命令のため
の自由命令リストを構築する過程と、前記自由命令の最
低合計コストを基にして前記自由命令の一つをスケジュ
ーリングする過程とを備え、前記合計コストを複数のコ
ストヒューリスティックを基にして前記各自由命令につ
いて計算する。また、ある自由命令がスケジュールされ
た後で自由命令リストはリフレッシュされ、リフレッシ
ュされたリストからの自由命令の別の一つがスケジュー
ルされる。命令ブロックの命令が全てスケジュールされ
るまでリフレッシュとスケジューリングは反復される。

【００１０】コストヒューリスティックは資源依存性コ
ストと、データ依存性コストと、依存性待ちコストと、
依存性サイクルコストと、浮動小数点比コストと、蓄積
比コストと、浮動小数点待ち行列コストとを含む。ま
た、コストヒューリスティックをプロセッサモデルによ
りモデル化でき、または重みづけでき、あるいはモデル
化と重みづけを行うことができる。パイプラインプロセ
ッサ用のコストを基にしたヒューリスティック命令スケ
ジューリングを行う本発明の装置は、駆動器手段と、こ
の駆動器手段により呼び出され、命令駆動器グラフを構
築するリスト構築手段と、前記駆動器手段により呼び出
され、自由命令リスト構築およびリフレッシュするリス
ト構築手段と、前記駆動器手段により呼び出され、自由
命令の一つをスケジューリングするスケジューリング手
段とを備える。また、本発明の好適な実施例は、コスト
ヒューリスティックをモデル化するためにスケジューリ
ング手段により呼び出されるプロセッサモデルを更に含
む。

【００１１】

【実施例】

表記法および用語以下に行う詳細な説明は、中央処理装置により実行され
るコンピュータメモリ内の手順で主として行う。それら
の手順についての説明は、データ処理技術の専門家が自
己の業績の内容を他の専門家へ最も効果的に伝えるため
に利用される手段である。ここでは手順を、希望の結果
へ導く自己矛盾のない一連のステップと解されたい。そ
れらのステップは物理量を物理的に処理するものであ
る。通常は、それらの量は、格納、転送、組合わせ、比
較およびその他の処理を行うことができる電気信号また
は磁気信号の形をとるが、必ずしもそうする必要はな
い。主として一般的に使用するという理由から、それら
の信号をビット、値、記号、文字、項、数等と呼ぶ方が
時には便利であることが判明している。しかし、それら
の用語および類似の用語の全ては適切な物理量に関係づ
けるべきであり、かつそれらの用語はそれらの量につけ
られる便利なレッテルであるにすぎないことを記憶して
おくべきである。更に、行われる処理は、加算または比
較のような用語でしばしば呼ばれる。それらの処理は人
により行われる精神活動に関連するものである。本発明
の部分を形成するここで説明する処理のいずれにもおけ
るほとんどの場合に、人のそのような能力は必要でな
く、望ましくない。操作は機械による操作である。本発
明の操作を行うために有用な装置には汎用デジタルコン
ピュータおよびその他の類似の装置が含まれる。。あら
ゆる場合に、コンピュータを動作させる方法と、処理方
法自体の違いを記憶しておくべきである。本発明は、電
気信号その他の（たとえば、機械的、化学的および物理
的）信号を処理して、他の希望の物理的信号を発生させ
るために、コンピュータを動作させる方法の過程に関す
るものである。本発明はそれらの操作を行う装置にも関
するものである。この装置は求められている目的のため
にとくに製作でき、あるいは、コンピュータに格納され
ているコンピュータプログラムにより選択的に起動また
は再構成される汎用コンピュータを含むことができる。
ここで示す手順は特定のコンピュータその他の装置に本
質的に関連するものではない。とくに、この明細書の記
載に従って書かれたプログラムに各種の汎用機を使用で
き、あるいは求められている方法を実施するために一層
実用化された装置を製作することが更に便利であること
が判明している。種々のそれらの機械のために求められ
る構造は以下の説明からわかるであろう。

【００１２】以下に、符号発生後に時間命令スケジュー
リングをコンパイルするためにとくに用いられる、パイ
プラインプロセッサ用のコストを基にしたヒューリステ
ィック命令スケジューリングのための方法および装置に
ついて説明する。本発明を完全に理解できるようにする
ために、以下の説明においては、層の厚さ等のような特
定の事項の詳細について数多く述べてある。しかし、そ
のような特定の詳細事項なしに本発明を実施できること
が当業者には明らかであろう。その他の場合には、本発
明を不必要に詳しく説明して本発明をあいまいにしない
ようにするために、周知の処理工程は説明しない。

【００１３】まず、パイプラインプロセッサ用のコスト
を基にしたヒューリスティック命令スケジューリングの
ための装置の好適な実施例を示すブロック図が示されて
いる図１を参照する。本発明の装置１０のこの好適な実
施例はＣＰＵ１１と、このＣＰＵにより実行される複数
の手順／モデル１２〜１８を含む主メモリ１９とを有す
る。主メモリ１９は、実行手順／モデル１２〜１８によ
りアクセスされる複数のデータ構造２２〜２８も有す
る。ＣＰＵ１１は主メモリ１９内の手順／モデル１２〜
１８を実行する。ＣＰＵ１１は実行される手順／モデル
１２〜１８のための命令ブロック２０を入力装置２１か
ら読出し、実行される手順／モデル１２〜１８により発
生された指示された命令ブロック３０を出力装置３１へ
書込むための入力／出力インターフェイスを有する。主
メモリ１９はＣＰＵ１１により実行される手順／モデル
１２〜１８と、実行する手順／モデル１２〜１８により
アクセスされるデータ構造２２〜２８とを記憶する。Ｃ
ＰＵ１１へ結合されている主メモリ１９は駆動器手順１
２と、この駆動器手順１２により呼び出される依存性グ
ラフ構築手順１３と、駆動器手順１２により呼び出され
るリスト構築手順１４と、駆動器手順１２により呼び出
されるスケジューリング手順１６と、このスケジューリ
ング手順１６により呼び出されるプロセッサモデル１８
とを有する。主メモリ１９は依存性グラフ２２と、自由
命令リスト２４と、重みテーブル２６と、コストテーブ
ル２８とを更に有する。

【００１４】駆動器手順１２はコストを基にしたヒュー
リスティック命令スケジューリングプロセスである。駆
動器手順１２は命令ブロック２０を入力として受けるイ
ンターフェイス（図示せず）を有する。命令ブロック２
０を入力として受けると、命令をスケジュールするため
に、駆動器手順１２は依存性グラフ構築手順１３と、リ
スト構築手順と、スケジューリング手順１６とを順次呼
び出す。依存性グラフ構築手順１３は、実行すべき複数
の命令２０を含む命令ブロックに対する命令依存性グラ
フを構築する。駆動器手順１２により呼び出される依存
性グラフ構築手順１３は命令ブロック２０を入力として
受ける。命令ブロックの一例を図２に示す。命令ブロッ
ク２０を入力として受けると、依存性グラフ構築手順１
３は受けた命令ブロック２０を後方へ走査することによ
り命令依存性グラフを構築する。依存性グラフ構築手順
１３が後方へ走査するにつれて、その依存性グラフ構築
手順は資源の各定義または使用に注目し、その後でそれ
に先行せねばならない定義または使用に注目する。注目
した定義および使用から、依存性グラフ構築手順１３は
命令依存性グラフ２２を構築する。命令依存性グラフの
例も図２に示されている。命令依存性グラフ１２を構築
した後で、依存性グラフ構築手順１３は駆動器手順１２
へ戻る。依存性グラフの構築についての詳細について
は、１９８６年７月に開催されたコンパイラ構造につい
てのシンポジウム議事録（Ｐｒｏｃｅｅｄｉｎｇｏｆ
ｔｈｅＳＩＧＰＬＡＮ ’８６ｓｙｍｐｏｓｉｕ
ｍｏｎｃｏｍｐｉｌｅｒｃｏｎｓｔｒｕｃｔｉｏ
ｎ）１２〜１３ページ所載のギボンス（Ｇｉｂｂｏｎｓ
Ｐ．Ｂ．）およびマッチニック（Ｍｕｃｈｎｉｃｋ
Ｓ．Ｓ．）の「パイプラインプロセッサ用の効率的な命
令スケジューリング（ＥｆｆｉｃｉｅｎｔＩｎｓｔｒ
ｕｃｔｉｏｎＳｃｈｅｄｕｌｉｎｇｆｏｒａＰｉ
ｐｅｌｉｎｅｄＡｒｃｈｉｔｅｃｔｕｒｅ）」を参照
されたい。

【００１５】なお図１では、リスト構築手順１４は命令
依存性グラフ２２を基にして自由命令リストを構築す
る。依存性グラフ構築手順１３から戻った後で、リスト
構築手順１４は駆動器手順１２により呼び出される。駆
動器手順１２により最初に呼び出された時に、リスト構
築手順１４は命令依存性グラフ１４をアクセスし、自由
命令リスト２４を構築する。リスト構築手順１４は命令
依存性グラフ２２を、命令依存性グラフ２２の根から始
まって、前方へ走査することにより自由命令リスト２４
を構築する。命令依存性グラフにおいてある命令の直前
の命令がスケジュールされたとすると、その命令は自由
である。最初の自由命令リストの例も図２に示されてい
る。自由命令リスト２４を構築した後で、リスト構築手
順１４は駆動器手順１２へ戻る。リスト構築手順１４は
自由命令リスト２４のリフレッシュも行う。スケジュー
リング手順１６から戻った後で、リスト構築手順１４は
駆動器手順１２により再び呼び出される。駆動器手順１
２により次に呼び出されると、リスト構築手順１４は、
スケジュールされた命令を削除し、スケジュールされた
命令のスケジューリングにより自由になりつつある以後
の命令を加えることにより自由命令リスト２４をリフレ
ッシュする。リスト構築手順１４は、最初の自由命令を
走査するのと同じやり方で以後の命令を走査する。自由
命令リスト２４をリフレッシュした後で、リスト構築手
順１４は前記のように駆動器手順１２へ再び戻る。自由
命令リスト２４が空になるまで、すなわち、全ての命令
がスケジュールされるもで自由命令リスト２４をリフレ
ッシュするために、リスト構築手順１４は、スケジュー
リング手順１６から戻るたびに駆動器手順１２により繰
り返し呼び出される。自由命令リストの構築およびリフ
レッシュの詳細については、１９８６年７月に開催され
た、コンパイラ構造についてのＳＩＧＰＬＡＮシンポジ
ウム議事録（ＰｒｏｃｅｅｄｉｎｇｏｆｔｈｅＳ
ＩＧＰＬＡＮ ’８６ｓｙｍｐｏｓｉｕｍｏｎｃ
ｏｍｐｉｌｅｒｃｏｎｓｔｒｕｃｔｉｏｎ）所載のギ
ボンス（ＧｉｂｂｏｎｓＰ．Ｂ．）およびマッチニッ
ク（ＭｕｃｈｎｉｃｋＳ．Ｓ．）の論文「パイプライ
ンプロセッサ用の効率的な命令スケジューリング（Ｅｆ
ｆｉｃｉｅｎｔＩｎｓｔｒｕｃｔｉｏｎＳｃｈｅｄｕ
ｌｉｎｇｆｏｒａＰｉｐｅｌｉｎｅｄＡｒｃｈ
ｉｔｅｃｔｕｒｅ）」を参照されたい。

【００１６】スケジューリング手順１６は自由命令をス
ケジューリングするためのものである。スケジューリン
グ手順１６は、リスト構築手順１４から戻るたびに、駆
動器手順１２により呼び出される。駆動器手順１２によ
り呼び出されると、スケジューリング手順１６は自由命
令リスト２４をアクセスし、自由命令の一つをスケジュ
ールする。自由命令の一つをスケジューリングした後
で、スケジューリング手順１６は駆動器手順１２へ戻
る。スケジューリング手順１６は自由命令リストの最低
合計コストを基にして自由命令の一つをスケジュールす
る。各自由命令の合計コストは複数のコストヒューリス
ティックの重みづけられた和を基にして計算される。重
みテーブル２６をアクセスすることにより重みは得られ
る。いくつかのコストヒューリスティックのコストはブ
ロックモデル１８を呼び出すことにより決定され、他の
ものは直接計算される。各スケジュールされた自由命令
の合計コストと、命令ブロックの合計コストはコストテ
ーブル２８に格納される。コストヒューリスティックと
プロセッサモデル１８については後で詳しく説明する。

【００１７】次に、スケジューリング手順の動作の流れ
を示すブロック図が示されている図３を参照する。駆動
器手順により呼び出されると、スケジューリング手順は
プロセッサモデルをリセットさせる（ブロック３４）。
プロセッサモデルをリセットした後で、スケジューリン
グ手順は自由命令リストにおける最初の自由命令に対し
て合計コストを計算する。スケジューリング手順は最低
合計コストを初期化し（ブロック３６）、各コストヒュ
ーリスティックに対するコストを計算し（ブロック３
８）、コストヒューリスティックの重みづけられた和を
基にして合計コストを計算する（ブロック４０）。自由
命令４０の合計コストを計算した後で、スケジューリン
グ手段は、計算された合計コストが現在の最低合計コス
トより低いかどうかを判定し、スケジューリング手順は
現在の選択された命令としてマークし（ブロック４
４）、現在の最低合計コストを新たに計算される合計コ
ストへセットする（ブロック４６）。

【００１８】計算された合計コストが現在の最低合計コ
ストより低くないと判定し、かつ現在の命令をマーク
し、現在の最低合計コストをセットした後で、分析すべ
き自由命令が自由命令リストにまだあるかどうかをスケ
ジューリング手順は判定する。分析すべき自由命令があ
るものとすると、スケジューリング手順はコストの計算
とコストの比較を上記のようにして行う。自由命令リス
トにおける全ての自由命令に対してコストの計算とコス
トの比較を行った後で、スケジューリング手順は現在の
選択された命令を順序づけられている命令リストに追加
する（ブロック５０）。また、スケジューリング手順は
プロセッサモデルとコストテーブルを更新させ（ブロッ
ク５２）、選択された命令をリスト構築手順５４へ戻
す。

【００１９】次に、本発明の装置の好適な実施例により
用いられるコストヒューリスティックを示すテーブルが
示されている図４を参照する。コストヒューリスティッ
クは資源依存性コスト６４と、依存性待ちコスト６６
と、依存サイクルコスト（ＤＣＣ）６８と、浮動小数点
比コスト（ＦＰＲＣ）７０と、記憶比コスト（ＳＲＣ）
７２と、浮動小数点待ちコスト行列コスト（ＦＰＱＣ）
７４とを有する。合計７６はそれらのコスト６２〜７４
の重みづけられた和である。資源依存性コスト６２は、
特定の自由命令をスケジューリングすることにより引き
起こされる利用できないプロセッサ資源による保持サイ
クルのコストを測定するためのものである。資源依存性
コスト６２は、完全記憶バッファ、またはビジー機能装
置のような利用できないプロセッサ資源による保持サイ
クルの数に等しい。資源依存性コスト６２はプロセッサ
モデルを質問することにより計算される。このコストヒ
ューリスティックは、最も少ない数の保持サイクルを行
わせる点において自由命令をスケジュールする傾向があ
ることがわかるであろう。

【００２０】データ依存性コスト６４は、特定の自由命
令をスケジューリングすることによりひき起こされるデ
ータ依存インターロックによる保持サイクルのコストを
測定するためのものである。データ依存性コスト６４
は、負荷使用インターロックのようなデータ依存インタ
ーロックと、マルチサイクル浮動小数点動作の後で値を
レジスタに記憶させることに関連する遅延とによる保持
サイクルの数に等しい。資源依存性コスト６２と同様
に、データ依存性コスト６４はプロセッサモデルを質問
することにより計算される。このコストヒューリスティ
ックは最少数の保持サイクルをさせる点において自由命
令をスケジュールする傾向もあることがわかるであろ
う。依存性待ちコスト６６は、特定の自由命令をスケジ
ューリングすることにより引き起こされる待ち行列にお
ける待ちによる余分のサイクルのコストを測定するため
のものである。依存性待ちコスト６６は、浮動小数点待
ち行列のような待ち行列において待つことによる余分の
サイクルの数に等しい。資源依存性コスト６２と同様
に、依存性待ちコスト６６はプロセッサモデルに質問す
ることにより計算される。このコストヒューリスティッ
クは最少数の余分の保持サイクルをさせる点において自
由命令をスケジュールする傾向があることがわかるであ
ろう。

【００２１】依存性サイクルコスト（ＤＣＣ）６８は、
特定の自由命令によりひき起こされる依存性サイクルの
相対的なコストを測定するためのものである。依存サイ
クルコスト（ＤＣＣ）６６は、自由命令の依存サイクル
と命令ブロック内の独立サイクルとの比の否定に等し
い、すなわち、ＤＣＣ＝ −ＤＣ／ｍａｘ（１，ＲＣ−ＤＣ）である。ここに、ＤＣは自由命令における依存サイクル
の数、ＲＣは命令ブロックの残りの命令に対して要求さ
れるサイクルの数である。このコストヒューリスティッ
クは、より少ない数の依存サイクルを有する自由命令に
対して、多い数の依存サイクルを有する命令をスケジュ
ールする傾向があることがわかるであろう。また、この
コストヒューリスティックは、命令ブロックの多くの命
令がスケジュールされるにつれて、より大きい重みを自
由命令の依存サイクルの数に割り当てることもわかるで
あろう。

【００２２】浮動小数点比コスト（ＦＰＲＣ）７０は、
特定の自由命令をスケジューリングすることによりひき
起こされる浮動小数点サイクルの相対的なコストを測定
するためのものである。浮動小数点比コスト（ＦＰＲ
Ｃ）７０は、残りの浮動小数点サイクルと残りの非浮動
小数点サイクルの比と、浮動小数点サイクルと非浮動小
数点サイクルの浮動小数点ターゲット比（ＦＰＴＲ）と
の差に等しい。すなわち、ＦＰＲＣ＝（ＲＦＰＣ／ＲＮＦＰＣ） − ＦＰＴ
Ｒここに、ＲＦＰＣは残りの浮動小数点サイクルの数、Ｒ
ＮＦＰＣは残りの非浮動小数点サイクルの数、ＦＰＴＲ
は浮動小数点ターゲット比である。

【００２３】浮動小数点ターゲット比（ＦＰＴＲ）は、
自由命令の１つをスケジューリングした後でダイナミッ
クに調整できる。このコストヒューリスティックは自由
浮動小数点命令を残りの命令ブロック全体にわたって一
様に分布させて、浮動小数点待ち行列の妨害を避ける傾
向があることがわかるであろう。記憶比コスト（ＳＲ
Ｃ）７２は特定の自由命令をスケジューリングすること
によりひき起こされる記憶サイクルの相対的なコストを
測定するためのものである。記憶比コスト（ＳＲＣ）７
２は、残りの記憶命令サイクルと残りの非記憶命令サイ
クルの比と、記憶命令サイクルと非記憶命令サイクルの
ターゲット比との差に等しい。すなわち、ＳＲＣ＝（ＲＳＩＣ／ＲＮＳＩＣ） − ＳＩＴＲここに、ＲＳＩＣは残りの浮動小数点サイクルの数、Ｒ
ＮＳＩＣは残りの非浮動小数点サイクルの数、ＳＩＴＲ
は浮動小数点ターゲット比である。

【００２４】浮動小数点ターゲット比（ＦＰＴＲ）と同
様に、記憶命令ターゲット比（ＳＩＴＲ）は、自由命令
の１つをスケジューリングした後でダイナミックに調整
することもできる。このコストヒューリスティックは記
憶命令を残りの命令ブロック全体にわたって一様に分布
させ、データバッファの記憶を妨害する傾向があること
がわかるであろう。浮動小数点待ち行列コスト（ＦＰＱ
Ｃ）７４は、特定の自由命令をスケジューリングするこ
とによりひき起こされる浮動小数点待ち行列スロットの
コストを測定するためのものである。非浮動小数点自由
命令に対する浮動小数点待ち行列コスト（ＦＰＱＣ）７
４は零に等しい。浮動小数点自由命令に対する浮動小数
点待ち行列コスト（ＦＰＱＣ）７４は、使用中の浮動小
数点待ち行列スロットの数と浮動小数点待ち行列スロッ
トの合計数との差に等しい。すなわち、ＦＰＱＣ＝ＦＳＩＵ − ＡＦＱＳここに、ＦＳＩＵは浮動小数点待ち行列に現在保持され
ている浮動小数点オペレーションの数、ＡＦＱＳは浮動
小数点オペレーションを保持するための浮動小数点待ち
行列におけるスロットの実際の数、である。このコスト
ヒューリスティックは、浮動小数点オペレーションを保
持するための浮動小数点待ち行列に使用されていないス
ロットがある時に、自由浮動小数点命令をスケジュール
する傾向があることがわかるであろう。

【００２５】合計コスト７６は、上記の全てのコストヒ
ューリスティックにおいて特定の自由命令ファクタリン
グをスケジューリングする合計コストを測定するための
ものである。合計コスト７６はコストヒューリスティッ
クの重みづけられた和に等しい。重みはコストヒューリ
スティックの相対的な重要性を反映する任意のやり方で
割当てることができる。

【００２６】次に、本発明の装置の好適な実施例のブロ
ック図が示されている図５を参照する。プロセッサモデ
ル１８は時間経過シミュレーション手順８２と、この時
間経過シミュレーション手順８２により呼び出される複
数の部品モデル８４〜９０と、対応する複数の部品テー
ブル９６、９８または部品待ち行列９８、または部品バ
ッファ１００を有する。時間経過シミュレーション手順
８２はクロックサイクルおよび命令実行をパイプライン
プロセッサにおいてシミュレートするためのものであ
る。時間経過シミュレーション手順８２は自由命令を入
力としてスケジューリング手順から受けるインターロッ
クを有する。スケジューリング手順から自由命令を受け
ると、時間経過シミュレーション手順８２は適切な部品
モデル８４〜９０に、特定の自由命令をスケジューリン
グするコストをシミュレートさせ、シミュレートされた
コストをスケジューリング手順へ戻す。時間経過シミュ
レーション手順８２は、種々の部品モデル８４〜９０を
初期化およびリセットするために、スケジューリング手
段から同じインターフェイスを介して、複数の信号も入
力として受ける。

【００２７】この好適な実施例においては、部品モデル
８４〜９０は資源モデル８４と、データ依存性モデル８
６と、浮動小数点装置モデル８８と、記憶バッファモデ
ル９０とを有する。部品テーブル／シミュレートされた
待ち行列／シミュレートされたバッファ９４〜１００は
少なくとも一つの資源テーブル９４と、少なくとも一つ
のデータ依存性テーブル９６と、少なくとも一つの浮動
小数点待ち行列９８と、少なくとも一つの記憶バッファ
１００とを有する。資源モデル８４は利用できないプロ
セッサ資源による保持サイクルをモデル化するためのも
のである。時間経過シミュレーション手順８２へ結合さ
れている資源モデル８４は自由命令を入力として受け
る。自由命令を受けると、資源モデル８４は、特定の自
由命令をスケジューリングすることにより、利用できな
いプロセッサ資源による保持サイクルのコストをシミュ
レートし、スケジューリング手順へ戻すために、そのシ
ミュレートされたコストを時間経過シミュレーション手
順８２へ戻す。資源モデル８４を初期化およびリセット
するために、スケジューリング手順８４は複数の信号も
時間経過シミュレーション手順８２から受ける。

【００２８】資源テーブル９４は種々のプロセッサ資源
情報を保持するためのものである。資源モデル８４へ結
合されている資源テーブル９４は資源モデル８４により
初期化され、更新され、アクセスされる。データ依存性
モデル８６は依存インターロックにより保持サイクルを
モデル化するためのものである。時間経過シミュレーシ
ョン手順８２へ結合されているデータ依存性モデル８６
は自由命令を入力として受ける。自由命令を受けると、
データ依存性モデル８６は、特定の自由命令をスケジュ
ーリングすることによりひき起こされるデータ依存イン
ターロックによる保持サイクルのコストをシミュレート
し、スケジューリング手順へ戻すために、そのシミュレ
ートされたコストを時間経過シミュレーション手順８２
へ戻す。データ依存性モデル８６を初期化およびリセッ
トするために、スケジューリング手順８４は複数の信号
も時間経過シミュレーション手順８２から受ける。

【００２９】データ依存性テーブル９６は種々の依存性
情報を保持するためのものである。データ依存性モデル
８６へ結合されているデータ依存性テーブル９６は依存
性モデル８６により初期化され、更新され、アクセスさ
れる。浮動小数点装置モデル８８は浮動小数点待ち行列
において費やされる待ちサイクルをモデル化するための
ものである。時間経過シミュレーション手順８２へ結合
されている浮動小数点装置モデル８８は自由命令を入力
として受ける。自由命令を受けると、浮動小数点装置モ
デル８８は、特定の自由命令をスケジューリングするこ
とによりひき起こされる浮動小数点待ち行列において費
やされる待ちサイクルのコストをシミュレートし、スケ
ジューリング手順へ戻すために、そのシミュレートされ
たコストを時間経過シミュレーション手順８２へ戻す。
浮動小数点装置モデル８８を初期化およびリセットする
ために、浮動小数点装置モデル８８は複数の信号も時間
経過シミュレーション手順８２から受ける。

【００３０】浮動小数点装置モデル９８はパイプライン
プロセッサにおいて浮動小数点待ち行列をシミュレート
するためのものである。浮動小数点装置モデル８８へ結
合されている浮動小数点待ち行列データ構造９８は浮動
小数点装置モデル８８により初期化され、更新され、ア
クセスされる。記憶バッファモデル９０は全記憶バッフ
ァによる保持サイクルをモデル化するためのものであ
る。時間経過シミュレーション手順８２へ結合されてい
る記憶バッファモデル９０は自由命令を入力として受け
る。自由命令を受けると、記憶バッファモデル９０は、
特定の自由命令をスケジューリングすることによりひき
起こされる全記憶バッファによる保持サイクルのコスト
をシミュレートし、スケジューリング手順へ戻すため
に、そのシミュレートされたコストを時間経過シミュレ
ーション手順８２へ戻す。記憶バッファモデル９０を初
期化およびリセットするために、記憶バッファモデル９
０は複数の信号も時間経過シミュレーション手順８２か
ら受ける。記憶バッファデータ構造１００はパイプライ
ンプロセッサにおける記憶バッファをシミュレートする
ためのものである。記憶バッファモデル９０へ結合され
ている記憶バッファデータ構造１００は記憶バッファモ
デル９０により初期化され、更新され、アクセスされ
る。

【図面の簡単な説明】

【図１】駆動器手順と、依存性グラフ構築手順と、自由
命令リスト構築手順と、命令スケジューリング手順と、
プロセッサモデルとを有する、本発明の装置の好適な実
施例を示すブロック図である。

【図２】命令ブロックの例と、本発明の装置の依存性グ
ラフ構築手順により構築された対応する命令依存性グラ
フの例と、本発明の装置のリスト構築手順により構築さ
れた対応する命令リストの例とを示すブロック図を示
す。

【図３】本発明の装置のスケジューリング手順の動作の
流れを示すブロック図を示す。

【図４】資源依存性コストと、データ依存性コストと、
依存性待ちコストと、依存性サイクルコストと、浮動小
数点比コストと、記憶比コストと、浮動小数点待ち行列
コストとを備え、本発明の装置の好適な実施例により用
いられるコストヒューリスティックのテーブルを示す。

【図５】時間経過シミュレーション手順と、複数の部品
モデルと、複数のテーブル／待ち行列／バッファとを有
し、本発明の装置の好適な実施例のプロセッサモデルを
示すブロック図を示す。

【符号の説明】

１１ＣＰＵ１９主メモリ２０入力装置３０出力装置

─────────────────────────────────────────────────────

【手続補正書】

【提出日】平成６年１月２８日

【手続補正１】

【補正対象書類名】明細書

【補正対象項目名】発明の名称

【補正方法】変更

【補正内容】

【発明の名称】パイプラインプロセッサ用のコストを
基にしてヒューリスティックに命令をスケージューリン
グする方法および装置

【手続補正２】

【補正対象書類名】明細書

【補正対象項目名】特許請求の範囲

【補正方法】変更

【補正内容】

【特許請求の範囲】

【手続補正３】

【補正対象書類名】明細書

【補正対象項目名】００１５

【補正方法】変更

【補正内容】

【００１５】なお図１では、リスト構築手順１４は命令
依存性グラフ２２を基にして自由命令リストを構築す
る。依存性グラフ構築手順１３から戻った後で、リスト
構築手順１４は駆動器手順１２により呼び出される。駆
動器手順１２により最初に呼び出された時に、リスト構
築手順１４は命令依存性グラフ２２をアクセスし、自由
命令リスト２４を構築する。リスト構築手順１４は命令
依存性グラフ２２を、命令依存性グラフ２２の根から始
まって、前方へ走査することにより自由命令リスト２４
を構築する。命令依存性グラフにおいてある命令の直前
の命令がスケジュールされたとすると、その命令は自由
である。最初の自由命令リストの例も図２に示されてい
る。自由命令リスト２４を構築した後で、リスト構築手
順１４は駆動器手順１２へ戻る。リスト構築手順１４は
自由命令リスト２４のリフレッシュを行う。スケジュー
リング手順１６から戻った後で、リスト構築手順１４は
駆動器手順１２により再び呼び出される。駆動器手順１
２により次に呼び出されると、リスト構築手順１４は、
スケジュールされた命令を削除し、スケジュールされた
命令のスケジューリングにより自由になりつつある以後
の命令を加えることにより自由命令リスト２４をリフレ
ッシュする。リスト構築手順１４は、最初の自由命令を
走査するのと同じやり方で以後の命令を走査する。自由
命令リスト２４をリフレッシュした後で、リスト構築手
順１４は前記のように駆動器手順１２へ再び戻る。自由
命令リスト２４が空になるまで、すなわち、全ての命令
がスケジュールされるまで自由命令リスト２４をリフレ
ッシュするために、リスト構築手順１４は、スケジュー
リング手順１６から戻るたびに駆動器手順１２により繰
り返し呼び出される。自由命令リストの構築およびリフ
レッシュの詳細については、１９８６年７月に開催され
た、コンパイラ構造についてのＳＩＧＰＬＡＮシンポジ
ウム議事録（ＰｒｏｃｅｅｄｉｎｇｏｆｔｈｅＳ
ＩＧＰＬＡＮ ’８６ｓｙｍｐｏｓｉｕｍｏｎｃ
ｏｍｐｉｌｅｒｃｏｎｓｔｒｕｃｔｉｏｎ）所載のギ
ボンス（ＧｉｂｂｏｎｓＰ．Ｂ．）およびマッチニッ
ク（ＭｕｃｈｎｉｃｋＳ．Ｓ．）の論文「パイプライ
ンプロセッサ用の効率的な命令スケジューリング（Ｅｆ
ｆｉｃｉｅｎｔＩｎｓｔｒｕｃｔｉｏｎＳｃｈｅｄｕ
ｌｉｎｇｆｏｒａＰｉｐｅｌｉｎｅｄＡｒｃｈｉ
ｔｅｃｔｕｒｅ）」を参照されたい。

【手続補正４】

【補正対象書類名】図面

【補正対象項目名】図４

【補正方法】変更

【補正内容】

【図４】

フロントページの続き (72)発明者マイケル・ジェイ・ウッダードアメリカ合衆国 94536 カリフォルニア州・フレモント・パセオパードレパークウェイ・38228

Claims

【特許請求の範囲】

【請求項１】スケジュールすべき複数の命令を含む命
令ブロックのための命令依存性グラフを構成する過程
と、前記命令依存性グラフを基にして前記命令のための自由
命令リストを構築する過程と、前記自由命令の最低合計コストを基にして前記自由命令
の一つをスケジューリングする過程と、を備え、前記合
計コストを複数のコスト発見を基にして前記各自由命令
について計算することを特徴とするパイプラインプロセ
ッサ用のコストを基にしたヒューリスティック命令をス
ケジューリングする方法。
【請求項２】スケジュールすべき複数の命令を含む命
令ブロックを受けるインターフェイスを含み、コストを
基にしたヒューリスティック命令スケジューリングを、
前記命令ブロックに対して駆動するための駆動器手段
と、この駆動器手段へ結合され、前記命令ブロックのための
命令依存性グラフを構築する依存性グラフ構築手段と、前記駆動器手段へ結合され、前記命令依存性グラフを基
にして、前記命令のための自由命令リストを構築するリ
スト構築手段と、前記駆動器手段へ結合され、前記自由命令の最低合計コ
ストを基にして前記自由命令の一つをスケジューリング
するスケジューリング手段と、を備え、前記合計コスト
は複数のコスト発見を基にして前記各自由命令に対して
計算されることを特徴とするパイプラインプロセッサ用
のコストを基にしたヒューリスティック命令スケジュー
リングを行う装置。