JPH1091455A

JPH1091455A - キャッシュ・ヒット／ミスにおける分岐

Info

Publication number: JPH1091455A
Application number: JP9053619A
Authority: JP
Inventors: Marshall Burton Charles Iii; チャールズ・マーシャル・バートン・サード; Kummer Dubei Puradeiipu; プラディープ・クマール・デュベイ; Hamubaato Moreno James; ジェイム・ハムバート・モレノ
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1996-03-14
Filing date: 1997-03-07
Publication date: 1998-04-10
Anticipated expiration: 2017-03-07
Also published as: US5761515A; JP3290372B2

Abstract

(57)【要約】（修正有）【課題】キャッシュ・ヒット及び、キャッシュ・ミスの
際、コンバイル時に最適化を図り、多数の記憶階層にわ
たり、命令及びデータの取出しを改善する。解消する。【解決手段】階層記憶を含み、記憶アクセス命令を含む
静的命令順序、及びそれぞれが記憶階層のあるレベルで
のヒット又はミスの一方を起こす記憶アクセス命令の実
行に依存して最適化された関連の記憶アクセス待ち時間
特定的コード順序を含むコンピュータ・システムにおい
て、命令及びデータを処理する場合、記憶アクセス命令
をデコードし、実行し、記憶アクセス命令の実行がヒッ
トを起こしたのかミスを起こしたのかを示す情報を格納
するステップに応答して、その情報がヒットを示すとき
にはキャッシュ・ヒット最適化コード順序に分岐し、そ
の情報がミスを示すときにはキャッシュ・ミス最適化コ
ード順序に分岐する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、コンピュータ処理
装置に関し、より詳細には、コンピュータ処理装置の階
層記憶からの命令およびデータの取り出しに関連する遅
延のコンパイラ支援容認（ｃｏｍｐｉｌｅｒ−ａｓｓｉ
ｓｔｅｄｔｏｌｅｒａｎｃｅ）に関する。

【０００２】

【従来の技術】プロセッサの性能は１年で約５０％向上
しているが、記憶アクセス時間は１年でわずか５〜１０
％しか改善されていない。その結果、プロセッサ・サイ
クルのキャッシュ・ミスの待ち時間が急激に増大してい
る。加えて、より高い程度の命令レベル並列性をサポー
トするのに要するデータ・バンド幅の増大により、キャ
ッシュ・ミス待ち時間は、プロセッサ全体の性能のより
大きな割合を占めようとしている。したがって、キャッ
シュ・ミス待ち時間を減らし、容認できるように種々の
試みが成されてきた。

【０００３】現在のマイクロプロセッサのいくつか、例
えばＩＢＭ社によって商標「POWERPC」の下で販売され
ているものや、Hewlett-Packard社によって商標「PA-RI
SC」の下で販売されているものは、キャッシュ・ブロッ
クの先取りに対するサポートを提供している。このサポ
ートは通常、識別されたラインをその最初の使用の前に
キャッシュの中に取り込もうとする（先取りしようとす
る）コンパイラ挿入タッチ命令の形態である。したがっ
て、データ・キャッシュのタッチ命令は、例外の場合に
誤り処理プログラムを呼び出させないことを除き、ロー
ド命令に類似している。このアプローチが、現在のプロ
セッサにおける比較的大きなキャッシュと相まって、キ
ャッシュ・ミスを減らすのに様々な程度に効果的であっ
た。それでもなお、多くの用途、特に大きなデータ・セ
ットを伴う商業的用途の場合に、キャッシュ・ミスが今
も浪費サイクルの大部分を占めている。先取りの潜在的
な性能の利点は、以下の要因のために限られている。ま
ず、キャッシュ・ミス待ち時間（プロセッサのクロック
サイクルとしての）が増すにつれ、先取りがますます困
難になり、より非効果的になる。先取りを開始するに
は、命令キャッシュおよび／またはデータ・キャッシュ
のラインに関するアドレスが、タッチを実行するのに十
分に早く利用できなければならないことに留意するこ
と。しかし、非常に早くに取り出されたラインは、その
置換アルゴリズムにより、ラインが使用される前にキャ
ッシュから放り出される可能性が高い。そのうえ、非常
に早い先取りはまた、プログラムの制御フローの不確実
性に遭遇する。その結果、キャッシュ・ミスを減らそう
とする最善の努力にもかかわらず、高性能プロセッサ
は、キャッシュ・ミス待ち時間を容認するように設計さ
れなければならない。これが、本発明が取り組もうとす
る他ならぬ問題である。従来技術では、この問題は以下
の二つの方法で扱われてきた。

【０００４】１．遅延スロットこのアプローチは、データのロードと使用との間に、ロ
ードされるデータから独立した命令を導入する。その結
果、ロードにおいて起こりうる遅延（キャッシュ・ミス
によるもの）を容認することができる。このような命令
の可用性が、このアプローチを使用してキャッシュ・ミ
ス待ち時間を容認することができる程度を決定する。こ
れを、図１の従来技術サンプル・コード順序に示す。こ
の図の命令Ｉがデータのロードを開始し、命令Ｉ＋ｍ＋
１がロードされたデータの使用を含む。間にある命令Ｉ
＋１およびＩ＋ｍは、命令Ｉにおけるロードから独立し
た命令を指す。これらの中間命令の実行されるセット
は、命令Ｉにおけるロードがキャッシュ・ヒットを有す
るのかキャッシュ・ミスを有するのかから独立している
ことに留意すること。したがって、実行されるセット
は、キャッシュ・ヒットおよびキャッシュ・ミスの両方
の場合に良好な性能が得られるようには独自に最適化す
ることができない。換言するならば、コンパイラが、キ
ャッシュ・ヒットおよびキャッシュ・ミスのいずれの場
合にも最適な性能を有する共通の静的順序を決定するこ
とができないならば、コンパイラは、キャッシュ・ヒッ
トまたはキャッシュ・ミスのどちらかだけに対して最適
化することを強要される。したがって、中間命令の実行
されるセットが命令Ｉにおけるロードがキャッシュ・ヒ
ットを有するのかキャッシュ・ミスを有するのかに依存
するような、命令およびデータを取り出す方法が求めら
れる。したがって、実行されるセットは、キャッシュ・
ヒットおよびキャッシュ・ミスのいずれの場合にも良好
な性能が得られるように最適化される。

【０００５】２．マルチスレッド処理このアプローチは、実行を異なる実行スレッドに切り換
えることによって待ち時間容認の問題に対処する。「ス
レッド」とは、一つの命令順序制御（一つのプログラム
・カウンタを暗示する）およびアーキテクチャ可視性の
機械状態（例えば設計されたレジスタ）の共用セットを
使用して実行できる一連の命令をいう。したがって、マ
ルチスレッド処理は、異なるスレッド間で文脈切り換え
を可能にするために多数のプログラム文脈をサポートす
る能力を必要とする。これはさらに、そのような独立し
たスレッドの検出を必要とし、それにはしばしばオペレ
ーティング・システムの関与が求められる。したがっ
て、一つのスレッド文脈においてキャッシュ・ミス待ち
時間を容認する、命令およびデータを取り出す方法が求
められる。本発明の実施態様は、一つのスレッドの文脈
における待ち時間容認を扱う。

【０００６】概して、従来技術のコンピュータ・システ
ムでは、コンパイラまたはアセンブリ言語プログラマに
よって生成される命令は通常、実行時の前に、命令記憶
に順番に記憶される。この順序を「静的順序」と呼ぶ。
「動的順序」は、コンピュータがこれらの命令を実行す
る順序である。動的順序は静的順序と同じでも同じでな
くてもよい。以下の論述において「コンパイル時」と
は、実行時前の処理の期間をいう。しかし、そのような
処理はコンパイラによって実行することが非常に一般的
であるが、他の手段、例えばアセンブリ・レベル・プロ
グラミングを代わりに利用してもよいことに留意するこ
と。

【０００７】本発明は、有利にも、記憶階層の多数のレ
ベルにかけて命令およびデータを取り出す改良された方
法を提供する。このような記憶階層は当該技術に周知で
あり、広く使用されていることに留意すること。通常、
そのような、例えばＭ個のレベルからなる記憶階層は、
最低レベル、例えばレベル１では最小（サイズの点で）
かつ最速（アクセス時間の点で）の記憶からなり、階層
の最高、すなわちＭ番目のレベルでの最大かつ最低速の
記憶へと進む。換言するならば、あるレベル、例えばＩ
での記憶は、次のレベルＩ＋１の記憶よりも小さく、か
つ高速である。また、レベルＭでは、いかなる項目（命
令またはデータ）も確かに可用性であるが、このレベル
でその項目にアクセスするにはもっとも長い時間を要す
ることに留意すること。他方、それよりも低いレベルの
記憶階層は通常、より高速のアクセスを有するが、その
項目がより低いレベルでミスしている確率がますます高
くなる。したがって、通常の記憶アクセスは、最低レベ
ルからのデータ項目（あるならば）を待つことから始ま
る。このレベルでミスした場合、次に高いレベルにアク
セスするためにはさらなる待機が必要である。換言する
ならば、最初にヒットするまで、アクセスは次々と高い
レベルで試みられる。これはさらに、その項目が最終的
に見つかるところの記憶レベルがどこであるかにより、
項目の取り出しに関連する命令の待ち時間（遅延）が広
く異なることを暗示する。例えば、レベル１記憶のアク
セス遅延は通常１プロセッサ・サイクルであるが、より
高レベルの記憶のアクセス遅延は、プロセッサ・サイク
ルの何十倍または何百倍にもなるおそれがある。レベル
１記憶は通常オン・チップであり、以下の論述において
しばしば「キャッシュ」と呼ぶ。

【０００８】命令待ち時間の知識（「待ち時間」とは、
命令の実行を完了するためのサイクル数をいう）は、例
えば、典型的なスーパスケーラ機およびスーパパイプラ
イン機におけるコード順序変更の際およびＶＬＩＷ（長
大命令語）機におけるスケジューリングの際に、多くの
コンパイル時最適化にとってきわめて重要である。スー
パスケーラ・マイクロプロセッサは当該技術に周知であ
る。例えば、Mike Johnsonによる「Superscalar Microp
rocessor Design」Prentice Hall（1991）を参照するこ
と。

【０００９】例えば、以下の表および添付の図面に示す
コード順序を考えてみる。表に示すサイクル数は、仮説
の目標スーパスケーラ・プロセッサの命令を完了するの
に予想されるサイクルを指す。このプロセッサは、整数
装置、ロード／ストア装置および分岐装置からなる。命
令は順番に出され、発される準備のできたソース・オペ
ランドを有しない最初の命令で発令が止められる。１サ
イクルで３個までの命令（整数１個、ロード／ストア１
個、そして分岐１個）を出すことができる。さらに、ロ
ード命令待ち時間が、キャッシュ・ヒットの際には２サ
イクルであり、キャッシュ・ミスの際には７サイクルで
あると仮定する。

【００１０】例えば、表１の最適化されていないコード
順序を考えてみる。これは、表に示すように、ラベルＬ
でのロード命令の場合にキャッシュ・ヒットを仮定する
と、１６サイクルを要する。キャッシュミスの場合に
は、順序は２１サイクルを要する。ラベルＫ１〜Ｋ６で
の命令の順序を「Ｋスレッド」と呼び、残りの命令を
「Ｕスレッド」と呼ぶことにする。

【００１１】

【表１】

【００１２】次に、以下の表２を考えてみる。この表
は、表１のＫスレッドおよびＵスレッドからの命令を交
互に配置するキャッシュ・ヒット最適化コード順序の例
を示す。２個のスレッドの適切な交互配置はしばしば、
リソースの競合の際に比較的重要でないスレッドよりも
優先順位を与えられるより重大な（全体の待ち時間がよ
り長い）スレッドを決定するため、命令待ち時間の知識
を必要とする。例えば、ラベルＫ２およびＵ１の命令は
いずれも第三のサイクルで一つの整数装置に発される準
備ができており、よってリソースの競合を暗示してい
る。ロード命令の場合にキャッシュ・ヒットを仮定し
て、コンパイラは、残りのＫスレッド（Ｋ２〜Ｋ６）
が、残りのＵスレッド（Ｕ１〜Ｕ３）よりも長い全体の
待ち時間を有するものと判断する。したがって、このリ
ソース競合の間、Ｋスレッドからの命令は、Ｕスレッド
からの命令よりも優先順位を与えられる。したがって、
ラベルＵ１の命令は、コンパイル時コード順序付けにお
いて、ラベルＫ２の命令の次になるように延期される。
同様に、ラベルＫ５およびＵ３の命令はいずれもサイク
ル８で一つの実行装置に発される準備ができている。残
りのＫスレッド（Ｋ５〜Ｋ６）の全待ち時間が残りのＵ
スレッド（Ｕ３）の全待ち時間よりも長いため、Ｋスレ
ッドは再び優先順位を与えられ、ラベルＵ３の命令はラ
ベルＫ５の命令の次になるように延期される。表に示す
ように得られたキャッシュ・ヒット最適化順序は、キャ
ッシュ・ヒットの際には１０サイクルしか要らないが、
キャッシュ・ミスの際には１４サイクルを要する。

【００１３】

【表２】

【００１４】あるいはまた、コンパイラは、ロード命令
の場合にキャッシュ・ミスを仮定して、以下の表３に示
すようなキャッシュ・ミス最適化順序を生成することも
できる。ここで、ラベルＵ１およびＵ５の命令がいずれ
も一つの整数装置に発される準備ができているとき、サ
イクル８においてリソース競合を考えてみる。残りのＵ
スレッド（Ｕ１〜Ｕ３）の待ち時間が残りのＫスレッド
（Ｋ５〜Ｋ６）の待ち時間よりも長いため、表２の場合
とは異なり、ＵスレッドがＫスレッドよりも優先順位を
与えられる。その結果、ラベルＫ５の命令はラベルＵ３
の命令の次になるように延期される。得られる順序は、
キャッシュ・ミスの際に実行するのに、表２の順序（１
４サイクル）よりも少ないサイクル（１２サイクル）し
か要らない。逆に、この順序は、キャッシュ・ヒットの
際には、表２のキャッシュ・ヒット最適化順序（１０サ
イクル）よりも長い時間（１２サイクル）を実行に要す
る。

【００１５】

【表３】

【００１６】従来技術の機械では、コンパイラは、ロー
ドが実行時でヒットすると演繹されるのかミスすると演
繹されるのかに依存して、二つの順序（表２の順序およ
び表３の順序）の一方を選択しなければならない。換言
するならば、二つの順序の一方だけが生成される。前記
のように、コンパイラが表２の順序を生成することを選
択するならば、性能は実行時の場合に最適未満となり、
それがロードの場合にキャッシュ・ミスを引き起こす。
逆に、コンパイラが表３の順序を生成することを選択す
るならば、性能は実行時の場合に最適未満となり、それ
がロードの場合にキャッシュ・ヒットを引き起こす。当
業者であれば、実行時に特定の項目が記憶階層のより低
い特定のレベルに存在するかどうかにかかわらず、コン
パイル時を正確に予測することが非常に困難であること
を認識するであろう。したがって、コンパイル時予測が
不正確である場合には、性能がさらに悪影響を受けるお
それがある。

【００１７】

【発明が解決しようとする課題】したがって、本発明の
目的は、記憶階層の多数のレベルにかけて命令およびデ
ータを取り出す改良された方法を提供することにある。

【００１８】本発明のさらなる目的は、記憶階層の異な
るレベルでヒットおよびミスのいずれの場合にも性能を
改善するコンパイル時最適化により、記憶階層の多数の
レベルにかけて命令およびデータを取り出す改良された
方法を提供することにある。本発明のさらなる目的およ
び利点は、以下の記述を考察することによって明白にな
り、また、一部にはその記述から明白であるか、また
は、本発明の実施によって学ぶことができる。

【００１９】

【課題を解決するための手段】本発明の目的にしたがっ
て課題を達成するために、本明細書に具現化し、記載す
る本発明のコンピュータ処理装置の態様は、異なる二つ
のコード順序、すなわち、一方はコンパイル時にキャッ
シュ・ヒットを仮定して最適化されたものと、もう一方
はコンパイル時にキャッシュ・ミスを仮定して最適化さ
れたものとの間で適切に動的な切り換えを行うことによ
り、キャッシュ・ミス待ち時間を容認する問題を解決す
る。

【００２０】階層記憶を有するコンピュータ・システム
における実行に対して最適化された記憶アクセス待ち時
間特定的コード順序を生成するための本発明のコンピュ
ータ・インプリメンテーション式方法の好ましい実施態
様は、静的コード順序において記憶アクセス命令を識別
するステップと、階層記憶のあるレベルでのヒットに対
して最適化された、記憶アクセス命令に関連する第一の
記憶アクセス待ち時間コード順序と、階層記憶のそのレ
ベルでのミスに対して最適化された、記憶アクセス命令
に関連する第二の記憶アクセス待ち時間コード順序とを
生成するステップと、記憶アクセス命令の実行がヒット
を起こしたときには第一の記憶アクセス待ち時間特定的
コード順序を実行し、記憶アクセス命令の実行がミスを
起こしたときには第二の記憶アクセス待ち時間特定的コ
ード順序を実行するための命令を挿入するステップとを
含む。

【００２１】階層記憶を含むコンピュータ・システムに
おいて命令およびデータを処理するための本発明のコン
パイル時最適化方法の好ましい実施態様は、記憶アクセ
ス命令を含む静的命令順序と、それぞれが階層記憶のあ
るレベルでのヒットまたはミスの一方を起こす記憶アク
セス命令の実行に依存して最適化された関連の記憶アク
セス待ち時間特定的コード順序を生成するステップと、
記憶アクセス命令をデコードし、実行し、記憶アクセス
命令の実行がヒットを起こしたのかミスを起こしたのか
を示す情報を格納するステップと、格納ステップに応答
して、その情報がヒットを示すときにはキャッシュ・ヒ
ット最適化コード順序に分岐し、その情報がミスを示す
ときにはキャッシュ・ミス最適化コード順序に分岐する
ステップとを含む。

【００２２】

【発明の実施の形態】本発明の実施態様は、「ブランチ
・オン・ミス（ミスならば分岐）命令」または「ＭＢＲ
ＡＮＣＨ命令」と呼ぶことができる新規な命令を提案す
る。この命令は、キャッシュ・ヒットがあるのかキャッ
シュ・ミスがあるのかに依存して、二つに一つのコード
順序に分岐する実行時能力を提供する。まず図２を参照
すると、このＭＢＲＡＮＣＨはラベルＸ１で「ｍｂｒａ
ｎｃｈｍ，１，ＫＫ２」と符号化されている。つま
り、記憶階層の１（レベル）でミス（ｍ）の場合にはラ
ベルＫＫ２に分岐せよ、ということである。これは、有
利にも、コンパイラが二つの順序、すなわち、一方がキ
ャッシュ・ヒットを仮定して最適化されたもの、もう一
方がキャッシュ・ミスを仮定して最適化されたものを生
成することを可能にする。キャッシュ・ヒット最適化順
序（表１ｂ）は、ブランチ・オン・ミス命令のフォール
スルー経路（ラベルＫ２→Ｋ６）で生成され、キャッシ
ュ・ミス最適化順序（表１ｃ）は、ブランチ・オン・ミ
ス命令の取り出し経路（ラベルＫＫ２→ＵＵ３）で生成
される。その結果、実行時性能は今やキャッシュ・ヒッ
トおよびキャッシュ・ミスの両方の際に最適であり、性
能はさらにキャッシュ・ヒットまたはキャッシュ・ミス
のコンパイル時予測の精度に感応しない。本発明のＭＢ
ＲＡＮＣＨ命令の意味の実施態様ならびにＭＢＲＡＮＣ
Ｈ命令を実行することができるコンピュータ処理システ
ムの動作を以下に説明する。既存の命令演算コードの未
使用のコードを例えば既存の条件付き分岐命令の可変要
素として使用して、この命令の関数を既存のアーキテク
チャで符号化することも可能であることに留意するこ
と。

【００２３】本発明の好ましい実施態様はまた、それぞ
れが「キャッシュ・レコード・レジスタ」と呼ばれる１
個以上のレジスタのセットを提案する。このようなレジ
スタそれぞれは、好ましくは１個以上のフィールドから
なり、各フィールドが、記憶階層の特定の独自レベルと
関連している。フィールドは、その関連のレベルの記憶
アクセスの状態を符号化する。フィールド値のデフォル
トまたは初期設定は、そのレベルでのヒットを示すこと
ができる。当業者であれば、機械アーキテクチャが１個
以上の既存の設計されたレジスタにおいて十分な予約ビ
ットを有する場合、そのような存在する予約ビットを使
用して、新たな明示的レジスタを機械アーキテクチャ状
態に加えることなく、キャッシュ・レコード・レジスタ
の関数を加えることができることを察知するであろう。
そうでなければ、十分に利用できるレジスタ・ビットを
持たない他の機械アーキテクチャの場合に、さらなるア
ーキテクチャ可視性のレジスタを加えて、キャッシュ・
レコード・レジスタ・セットの関数をサポートすること
もできる。

【００２４】ＭＢＲＡＮＣＨ命令の詳細な説明好ましい実施態様において、本発明のＭＢＲＡＮＣＨ命
令は、記憶階層の識別されたレベルでキャッシュ・ミス
があるならば、静的順序でＭＢＲＡＮＣＨ命令の直後に
ある順序を取り出し、実行する代わりに、識別された目
標アドレスに関連する命令順序を取り出し、実行するな
らば、性能がおそらくは改善するであろうというヒント
である。この命令は単にヒントであり、したがって、所
与の機械インプリメンテーションは、この命令を無視
し、その意味を無視し、キャッシュ・ヒットまたはキャ
ッシュ・ミスにかかわらず順番に取り出しを続けること
も自由である。したがって、プログラムの正当性は、こ
の命令の意味が遵守されるのか無視されのるかには依存
しない。むしろ、プログラム実行の性能は、潜在的に
は、この命令に関連する意味が遵守されるかどうかの関
数である。

【００２５】次に図３を参照すると、本発明のＭＢＲＡ
ＮＣＨ命令３００のフォーマットの実施態様が示され、
これは、ＭＢＲＡＮＣＨ演算コード・フィールド３０２
と、ミス識別フィールド３０４と、キャッシュ・レコー
ド・レジスタ・フィールド３０５と、アドレス・フィー
ルド３０６とを含む。アドレス・フィールド３０６は、
命令順序のアドレスを明瞭に識別する。ミス識別フィー
ルド３０４は、識別された命令アドレスに分岐するため
に命令取り出しおよび実行の変更が推奨される記憶アク
セス・レベルのミスまたはヒットを指定する。極端な場
合には、ミス識別フィールド３０４は、選択を何も提供
しなくてもよいく、ひいては、その意味は演算コード・
フィールド３０２によって暗示することができ、明示的
なミス識別フィールドの必要はないかもしれない。しか
し、一般的な場合には、ミス識別フィールド３０４は、
有利にも、ミス指定のためのいくつかの選択の一つを符
号化することができる。本発明の好ましい実施態様は、
ミス識別フィールド３０４を２個のサブフィールドに分
割する。ヒット／ミス・サブフィールド３０４１は、キ
ャッシュ・ミスまたはキャッシュ・ヒットのどちらの検
出をもって分岐をとるかを識別する。これはさらに、ヒ
ット／ミス検出保留のオプションを含むように拡張して
もよい。第二のサブフィールド、すなわち記憶レベル３
０４２は、ヒットまたはミスが検出される階層記憶レベ
ルを指定する。指定された記憶レベルが、インプリメン
テーションでサポートされている最高記憶レベルよりも
高いならば、アクセスは常にヒットであると仮定するこ
とができる。キャッシュ・レコード・レジスタ・フィー
ルド３０５は、識別された記憶ヒット／ミス状態を決定
するためにチェックすべきキャッシュ・レコード・レジ
スタ（以下に説明する）を指定する。キャッシュ・レコ
ード・レジスタが１個だけの場合、このフィールド３０
５は不要であることに留意すること。

【００２６】修飾記憶アクセス命令の詳細な説明１個以上の記憶アクセスを伴う命令を「記憶アクセス命
令」と呼ぶ。図４は、本発明の記憶アクセス命令４００
の修飾フォーマットを示す。図４に示すように、任意の
記憶アクセス命令の既存のフォーマット４０２は、１個
以上のキャッシュ・レコード・レジスタの識別を含むキ
ャッシュ・レコード・レジスタ・フィールド４０４を含
むように修飾することができる。ここでもまた、キャッ
シュ・レコード・レジスタが１個だけの場合、サブフィ
ールド４０４は不要であることに留意すること。そし
て、識別されたレジスタを実行時に使用して、関連の記
憶アクセスの状態を記録することができる。例えば、記
憶アクセス命令４００の実行の間、より低いレベル、例
えばレベル１およびレベル２でのミスは、これらレベル
１および２に関連するサブフィールドを、命令によって
識別されるレジスタ中に設定することによって記録する
ことができる。

【００２７】コンピュータ装置の詳細な説明図５は、本発明にしたがって命令およびデータを取り出
す改良された方法を実行する階層記憶の多数のレベルを
含むコンピュータ・システムのブロック図である。図示
するコンピュータ処理システムは、プロセッサ装置５０
０および関連の記憶装置１００を含む。記憶装置１００
は、プロセッサ装置５００で実行するためのプログラム
・データおよび命令を保持している。記憶装置は、階層
記憶の１個以上のレベル１００−１、１００−２、１０
０−ｉ、．．．１００−Ｍからなる（Ｍは最高レベル、
すなわち主記憶装置を表す）。最小（サイズの点で）か
つ最速（アクセス時間の点で）の記憶レベルが通常「キ
ャッシュ」と呼ばれ、プロセッサ５００中に、その最低
レベルであるＬＥＶＥＬ＿１（１００−１）で組み込ま
れている。記憶レベルは順次に直前の記憶レベルよりも
大きく、かつ遅くなる。換言するならば、あるレベル、
例えばｉの記憶は、次のレベルｉ＋１の記憶よりも小さ
く、かつ高速である。どの項目（命令またはデータ）も
最高レベル（主記憶装置）ＬＥＶＥＬ＿Ｍで利用できる
が、記憶装置の頻繁に使用される命令およびデータの部
分は通常、それぞれ命令キャッシュ装置１０１−１およ
びデータ・キャッシュ装置１０３−１に保持されてい
る。あるいはまた、命令キャッシュおよびデータ・キャ
ッシュを一つのキャッシュに統合することもできる。よ
り高いレベルの記憶装置もまた、命令記憶装置とデータ
記憶装置とに分割することもできるし、統合することも
できる。

【００２８】従来どおり、命令キャッシュ１０１−１お
よびデータ・キャッシュ１０３−１にそれぞれ格納され
た命令／データはラインまたはブロックに分割される。
命令取り出し装置１０４が命令キャッシュ１０１−１に
格納された命令の１個以上のブロックをデコード装置１
０８に取り込む。デコード装置１０８は、分岐ＭＢＲＡ
ＮＣＨ命令および条件レジスタ更新命令を実行するため
に分岐装置１１０に送り、他の順序どおり（非分岐）の
命令をディスパッチ実行装置１１２に送る。ディスパッ
チ実行装置１１２は、保留中の命令の間で依存性を解析
し、１個以上の機能装置における命令の実行をスケジュ
ーリングする。多様なインプリメンテーション・トレー
ドオフをもつこのようなディスパッチ実行装置１１２が
従来技術に周知である。例えば、Mike Johnsonによる
「Superscalar Microprocessor Design」Prentice Hall
（1991）を参照すること。インプリメンテーションの代
替えは、複雑な命令間依存性解析ハードウェアから、実
行時依存性解析を実施しない非常に簡単なディスパッチ
実行エンジンにまで及ぶ。後者の場合、多くのＶＬＩＷ
（長大命令語）機におけるように、依存性解析はもっぱ
らコンパイル時責任である。

【００２９】図６に示す好ましい実施態様では、ディス
パッチ実行装置１１２は、ディスパッチ装置１１３と、
複数の機能装置１１５−１．．．１１５−Ｋと、スケジ
ューラ１１６とからなる。ディスパッチ装置１１３は、
デコード装置１０８によって送られた命令の間で依存性
を解析し、これらの命令をスケジューラ１１６に送る。
スケジューラによって同サイクル中に受け取られるすべ
ての命令は、互いに独立しているとみなすことができ
る。このようなスケジューラ１１６もまた、スーパスケ
ーラ機の従来技術に周知である。そして、スケジューラ
１１６は命令を機能装置１１５に対してスケジューリン
グする。バンクは、１個以上の機能装置１１５−１〜１
１５−Ｋからなり、各装置が、いくつかまたはすべての
タイプの命令を実行することができる。機能装置１１５
は、データ取り出し装置１０６を介して入力ソース・オ
ペランドをレジスタ・ファイル１１８またはデータ・キ
ャッシュ１０３−１から受け、出力結果をそれらに書き
込む。図６に示す好ましい実施態様では、すべての機能
装置は同一であり、したがって、いかなる命令をも実行
することができる。あるいはまた、バンク中の機能装置
は非対称的であってもよい。ここでは、特定の機能装置
は、命令のサブセット、例えばロード／ストア命令また
は整数命令もしくは浮動小数点命令だけを実行すること
ができる。従来どおり、スケジューラは、そのような非
対称性を認知し、命令を適切にスケジューリングできな
ければならない。

【００３０】データ取り出し装置１０６は、データ・キ
ャッシュ１０３−１からディスパッチ実行装置１１２の
機能装置へのデータのブロックの取り込みを扱う。デー
タ・キャッシュ装置１０３−１は通常、命令によってソ
ース・オペランドとして使用されるデータ値と、実行さ
れた命令によって生成されるデータ値とを保管してい
る。

【００３１】プロセッサ装置５００はまた、レジスタの
セットを含むレジスタ・ファイル１１８を含む。レジス
タ・ファイル１１８は、命令を実行するためにディスパ
ッチ実行装置に関連する機能装置にオペランドを提供
し、また、実行の結果を受け取る。このレジスタ・セッ
トは、アーキテクチャ可視性のレジスタのセットと、ア
ーキテクチャ可視性のレジスタとにさらに分けられる。
「アーキテクチャ可視性のレジスタ」または「設計され
たレジスタ」とは、機械のアセンブリ・レベル・プログ
ラマ（またはコンパイラ）がアクセスすることができる
固定されたレジスタのセットをいう。このようなレジス
タ・ファイル１１６は従来技術に周知である。処理装置
はまた、アーキテクチャによって有効とみなされる順序
で命令を実行する責任を負う完了装置１２０を含む。デ
ィスパッチ実行装置１１２は、順序を無視して命令をデ
ィスパッチし、実行することもできるとしても、プロセ
ッサ装置５００は、アーキテクチャの制約に依存して、
命令を同じ順序で完了させてもよいし、そうしなくても
よい。

【００３２】分岐装置１１０は、分岐命令、すなわち、
機械の順序制御の流れを潜在的に変えることができる命
令の意味をインプリメントする責任を負う。分岐装置１
１０はまた、未解決の分岐を予測し、分岐解決ごとに各
予測の有効性を決定することもできる。分岐装置１１０
はまた、条件付き分岐命令の結果を評価するのに使用さ
れる条件レジスタ（ＣＲ）と、ディスパッチ実行装置１
１２によって実行される演算の結果にしたがって条件レ
ジスタを更新する論理とを含むことができる。

【００３３】本発明の実施態様によると、命令取り出し
装置は、命令キャッシュ装置１０１−１に格納されたＭ
ＢＲＡＮＣＨ命令（上述したもの）を取り出し、それを
デコード装置１０８に送る。デコード装置１０８は、Ｍ
ＢＲＡＮＣＨ命令を識別し、それを分岐装置１１０に送
る。ＭＢＲＡＮＣＨ命令に関連する条件の有効性を決定
するため、分岐装置１１０論理が、キャッシュ・レコー
ド・レジスタ管理装置１０２に対し、ＭＢＲＡＮＣＨ命
令コードのミス識別フィールド３０４で識別されたキャ
ッシュ・レコード・レジスタ・フィールド３０４３の値
に関して問い合わせる。この条件の有効性が逆に、分岐
をとるかどうかを決定する。キャッシュ・レコード・レ
ジスタ管理装置１０２は、キャッシュ・レコード・レジ
スタ・セット２００中の１個以上のキャッシュ・レコー
ド・レジスタ２００−１〜２００−Ｎに対する読み出し
または書き込みを管理する責任を負う。キャッシュ・レ
コード・レジスタ・セット２００は、主として、本発明
のＭＢＲＡＮＣＨ命令の意味をインプリメントする責任
を負う。キャッシュ・レコード・レジスタ・セット２０
０の各レジスタは、それぞれのサブフィールド２００−
１．１．．．２００−１．Ｍおよび２００−Ｎ．
１．．．２００−Ｎ．Ｍを含む。各サブフィールドは、
記憶階層１００の特定の記憶レベル１００−１．．．１
００−Ｍと一対一で関連していることができる。記憶ア
クセス命令の実行は、好ましくは、適切なキャッシュ・
レコード・レジスタのサブフィールドをデフォルト設定
に初期化することから始まる。命令実行が進むにつれ、
それは、記憶階層１００の種々のレベルでのヒットまた
はミスに依存して、キャッシュ・レコード・レジスタ・
フィールドのデフォルト設定を更新する結果をもたらす
ことができる。例えば、記憶階層のＬＥＶＥＬ＿１（１
００−１）およびＬＥＶＥＬ＿２（１００−２）でミス
したのち、ＬＥＶＥＬ＿３でヒットしたものを適切なキ
ャッシュ・レコード・レジスタ２００−１の対応するサ
ブフィールドに連続的に記録して、ＬＥＶＥＬ＿１およ
びＬＥＶＥＬ＿２に対応するサブフィールド２００−
１．１．．．２００−１．２を設定し、ＬＥＶＥＬ＿３
に相当するサブフィールド２００−１．３をリセットす
ることによって表示することができる。もう一つの実施
態様では、キャッシュ・レコード・レジスタ・セット２
００をレジスタ・ファイル１１６の一部にしてもよい。
その場合、レジスタ・ファイル１１６中の他のレジスタ
と同様に、キャッシュ・レコード・レジスタを、ＭＢＲ
ＡＮＣＨ命令および記憶アクセス命令それぞれの意味の
一部として読み出し、更新してもよい。さらに別の実施
態様では、キャッシュ・レコード・レジスタ・セット２
００を分岐装置１１０の一部にして、その中に含まれる
条件レジスタと同様に更新／管理してもよい。

【００３４】実行方法の詳細な説明図７は、図５に示すコンピュータ・システムを使用して
ＭＢＲＡＮＣＨ命令を処理する方法の態様を説明する流
れ図を示す。ステップ１０００で、コンパイル時に、コ
ンパイラが、上記のＭＢＲＡＮＣＨ命令を考慮せずに静
的な命令順序を生成する。説明を明確にするため、以下
の論述では、別段指定しない限り、キャッシュとはデー
タ・キャッシュ１０３−１のみを指す。しかし、以下に
説明する方法はまた、命令キャッシュ１０１−１のアク
セス性能を最適化する場合にも応用することができる。
ステップ１００２で、コンパイラは静的順序を解析し
て、キャッシュ・アクセス時間が最適化されたならば性
能が有意に強化される可能性のある特定の場所を識別す
る。これらの場所を「臨界ミスポイント」と呼ぶ。ステ
ップ１００４で、識別された臨界ミスポイントごとに、
コンパイラは、このデータ・アクセスから生じるおそれ
のあるキャッシュ・アクセス待ち時間のセットを考慮す
る。これらの可能なキャッシュ・アクセス待ち時間ごと
に、コンパイラは、相当する最適化されたコード順序を
生成する。

【００３５】「キャッシュ・アクセス待ち時間」とは、
キャッシュからデータを検索するのに要する時間をいう
ことに留意すること。キャッシュ・アクセス待ち時間
は、データが見いだされる記憶装置１００のレベル１０
０−１〜１００−Ｍの関数である。図５を参照しながら
先にアクセス処理を説明したところの実施態様を思い出
すこと。

【００３６】図７に戻ると、ステップ１００５で、臨界
ミスポイントに関する記憶アクセス命令を修飾して、関
連の記憶アクセスの結果を記録するために実行時に使用
することができるレジスタを識別する。そのような修飾
記憶命令を示す本発明の態様は、図４を参照しながら先
に記載したものである。ステップ１００６で、コンパイ
ラがＭＢＲＡＮＣＨ命令を挿入して、ステップ１００４
で生成された、関連の記憶アクセス命令の実行の際に階
層記憶の種々のレベルでのアクセス結果に対応する特定
の最適化コード順序に分岐する。ステップ１００８で、
実行時に、コンピュータ処理システムが、ステップ１０
０６で静的順序に挿入されたＭＢＲＡＮＣＨ命令を含む
コンパイルされた命令の静的順序を記憶１００にロード
する。記憶１００は、最低レベルの命令キャッシュ１０
１−１を含むマルチレベル階層１００−１〜１００−Ｍ
であることを思い出すこと。従来どおり、記憶１００の
より高いレベルで記憶された静的順序のサブ順序は、よ
り低いレベルに頻繁に転送され、最後には、実行される
ために最低レベルの命令キャッシュ１０１−１に転送さ
れる。ステップ１０１０で、命令取り出し装置１０４
が、命令キャッシュ１０１−１にアドレスすることによ
り、次の命令順序を命令キャッシュ１０１−１から取り
出す。その命令順序が命令キャッシュ１０１−１に見当
たらないならば、それは、上述したように、記憶階層１
００のより高いレベルから取り出される。命令取り出し
装置１０４によって取り出された命令順序は、デコード
装置１０８に転送される。ステップ１０１２で、デコー
ド装置１０８が１個以上の命令を同時にデコードする。
ＭＢＲＡＮＣＨ命令を含む、分岐命令としてデコードさ
れた命令または条件レジスタ更新を伴う命令は、分岐装
置１１０に送られる。ステップ１００５で修飾されたフ
ォーマット記憶アクセス命令を含む他の命令は、依存性
解析、ディスパッチおよび実行のためにディスパッチ実
行装置１１２に送られる。ステップ１０１４で、分岐装
置１１０が、本発明のＭＢＲＡＮＣＨ命令を含む、分岐
命令としてデコードされた命令または条件レジスタ更新
を伴う命令を処理する（ステップ１０１４のより詳細な
説明は図８に示す）。ステップ１０１６で、ディスパッ
チ実行装置１１２が、分岐命令および条件レジスタ更新
命令以外の、本発明の修飾フォーマット記憶アクセス命
令を含む命令を処理する（ステップ１０１６のより詳細
な説明は図９に示す）。最後に、ステップ１０１８で、
完了装置１１４が、上述したようなアーキテクチャによ
って有効であるとみなされる順序で命令実行を完了す
る。処理はステップ１０１０に戻って、次の命令順序を
命令キャッシュ１０１−１から取り出し、プログラム実
行の間、このような処理が繰り返される。

【００３７】ステップ１０１２で、デコード装置１０８
が１個以上の命令を同時にデコードすることを思い出す
こと。本発明のＭＢＲＡＮＣＨ命令を含む、デコードさ
れる分岐命令または条件レジスタ更新を伴う命令は、ス
テップ１０１４で処理されるために分岐装置１１０に送
られる。

【００３８】次に図８を参照して、図７の処理ステップ
１０１４の方法を説明する。ステップ１０１４１で、分
岐装置１１０が、デコード装置１０８から送られた命令
をデコードして、その命令がＣＲ命令、すなわち、条件
レジスタ・ビットの簡単な操作を伴う命令であるかどう
かを決定する。それがＣＲ命令であるならば、処理に影
響を加えないことが好ましく、したがって、ステップ１
０１４２で従来の方法で実施する。

【００３９】デコードされた命令がＣＲ命令ではないな
らば、ステップ１０１４３で、分岐装置１１０が、それ
がＭＢＲＡＮＣＨ命令であるかどうかを決定する。ＭＢ
ＲＡＮＣＨ命令がステップ１０１４３で識別されると、
ステップ１０１４４で、分岐のために比較すべき特定の
ミスビットを識別する。ＭＢＲＡＮＣＨ命令コードのキ
ャッシュ・レコード・レジスタ・サブフィールド３０５
を使用して、ミスビットを含むキャッシュ・レコード・
レジスタ・セット２００中の適切なレジスタを識別する
ことができる。記憶レベル・サブフィールド３０４２で
識別された記憶アクセス・レベルを使用して、特定のミ
スビットをさらに識別することができる。ステップ１０
１４５で、ＭＢＲＡＮＣＨ命令のヒット／ミス・サブフ
ィールド３０４１をデコードして、分岐がヒットで推奨
されるのかミスで推奨されるかを決定する。ステップ１
０１４６で、命令がブランチ・オン・ミスとしてデコー
ドされるならば、ステップ１０１４４で識別されたミス
ビットをセット状態または非セット状態として試験す
る。ミスビットがセット状態であって、所与の記憶レベ
ルでのミス（データは見つからず）を示すならば、流れ
制御はステップ１０１４９に移り、これが、アドレス・
サブフィールド３０６で指定された目標アドレスでの命
令に対する分岐をインプリメントする。ミスビットが非
セット状態であるならば、識別された目標アドレスに分
岐しないまま、ＭＢＲＡＮＣＨ命令処理は完了である。

【００４０】ステップ１０１４５で、命令がブランチ・
オン・ヒットとしてデコードされるならば、ステップ１
０１４７で、ステップ１０１４４で識別されたミスビッ
トをセット状態または非セット状態として試験する。ミ
スビットが非セット状態であって、適切な記憶レベルで
のヒット（データを発見）を示すならば、流れ制御はス
テップ１０１４９に移り、これが、アドレス・サブフィ
ールド３０６で指定された目標アドレスでの命令に対す
る分岐をインプリメントする。ステップ１０１４７で、
ミスビットがセット状態である（データは見つからず）
ならば、識別された目標アドレスに分岐しないまま、Ｍ
ＢＲＡＮＣＨ命令処理は完了である。

【００４１】ステップ１０１４３で、送られた命令がＭ
ＢＲＡＮＣＨ命令ではないとしてデコードされる（通常
の分岐命令を暗示する）ならば、ステップ１０１４８が
実行される。好ましくは、本発明は、非ＭＢＲＡＮＣＨ
分岐命令の処理には変更を加えない。したがって、その
ような命令はステップ１０１４８で従来の方法で処理さ
れる。

【００４２】再び図７を参照して、ステップ１０１６
で、ディスパッチ実行装置１１２が、本発明にしたがっ
て修飾されたフォーマット記憶アクセス命令４００を含
む命令を処理することを思い出すこと。

【００４３】次に図９を参照して、本発明にしたがっ
て、記録を伴うキャッシュ・アクセスを含む、図７の
「ディスパッチおよび実行」（ステップ１０１６）を実
施する方法を説明する。ステップ１０１６１で、従来ど
おり、ディスパッチ実行装置１１２が、デコード装置１
０８によって送られる命令に関して命令間依存性を解析
する。独立した命令は、実行のための機能装置における
スケジューリングのためにスケジューラ１１６にディス
パッチされる。ステップ１０１６２で、ディスパッチ実
行装置１１２が、命令実行がデータ・キャッシュ１０３
−１アクセスを伴うかどうかを決定する。データ・キャ
ッシュ・アクセスを伴うならば、ステップ１０１６３
で、キャッシュ・アクセスが記録を伴うべきかそうでは
ないかに関してさらに決定を下す。「記録を伴うキャッ
シュ・アクセス」とは、キャッシュ・アクセスの結果
（ヒットまたはミス）が後の処理のために格納されるこ
とをいう。図１０を参照して、本発明による記録を伴う
キャッシュ・アクセスの方法の詳細な実施態様を説明す
る。ステップ１０１６３にかかわる決定は、本発明によ
り、ステップ１００５の記憶アクセス命令のフォーマッ
ト修飾によって簡略化される。あるいはまた、すべての
記憶命令が記録を伴うキャッシュ・アクセスを要するも
のと仮定することもできる。

【００４４】図９に戻ると、ステップ１０１６３で、記
録を伴うデータ・キャッシュ・アクセスが指定される
と、ステップ１０１６４が実行される。ステップ１０１
６４で、修飾されたフォーマット記憶命令のサブフィー
ルド４０４をデコードすることにより、記録に関連する
キャッシュ・レコード・レジスタ４００を識別する。再
び、この特定の場合に、本発明の実施態様が１個のキャ
ッシュ・レジスタしか含まないとき、キャッシュ・レコ
ード・レジスタの明示的な識別が不要になることに留意
すること。次に、ステップ１０１６５で、識別されたキ
ャッシュ・レコード・レジスタをキャッシュ管理装置１
０２によってそのサブフィールドの適当なデフォルト設
定に初期化することができる。好ましくは、デフォルト
設定は、すべての記憶レベルでヒットを暗示する。ステ
ップ１０１６６で、データ・キャッシュにアクセスして
結果を記録する。ステップ１０１６３で、キャッシュ・
アクセスが記録を伴わないならば、従来のキャッシュ・
アクセスをステップ１０１６８で実行する。データ・キ
ャッシュ・アクセスがステップ１０１６８５または１０
１６６で完了したのち、ステップ１０１６７で命令を実
行し、従来どおりに完了させる。ステップ１０１６２
で、命令実行がデータ・キャッシュ・アクセスを要しな
いならば、ステップ１０１６７で、命令は、実行装置１
１２および完了装置１１４によって実行され、完了す
る。

【００４５】図９において、ステップ１０１６３で、デ
ータ・キャッシュ・アクセスがかかわるならば、キャッ
シュ・アクセスが記録を伴うべきかそうではないかに関
してさらなる決定が下されることを思い出すこと。「記
録を伴うキャッシュ・アクセス」とは、キャッシュ・ア
クセスの結果（ヒットまたはミス）が後の処理のために
格納されることをいう。また、キャッシュ・アクセスが
記録を伴うとき、ステップ１０１６４で、キャッシュ・
レコード・レジスタが好ましくはキャッシュ管理装置１
０２によって初期化されて、すべての記憶レベルでのヒ
ットを暗示することを思い出すこと。

【００４６】図１０は、マルチレベルのキャッシュ記憶
１００−１．．．１００−ｉ環境において記録を伴うキ
ャッシュ・アクセスを実施する図９のステップ１０１６
６を詳細に説明する。ステップ５００１で、記憶階層１
００中の最低レベル１００−１の記憶１００にアクセス
することにより、記録を伴うキャッシュ・アクセスが始
まる。キャッシュ・アクセスがヒットである（データを
発見）ならば、ステップ５００２を実行する。ステップ
５００２で、ステップ１０１６４で識別されたキャッシ
ュ・レコード・レジスタ中のＬＥＶＥＬ＿１に対応する
サブフィールドをリセットし、記録を伴うキャッシュ・
アクセス（ステップ１０１６６）が完了する。そうでな
ければ、アクセスはミスであり、ステップ５００３で、
先のステップ１０１６４で識別されたキャッシュ・レコ
ード・レジスタ中のＬＥＶＥＬ＿１に対応するサブフィ
ールドをセットする。ステップ５００１のアクセスがミ
スであるならば、記録を伴うキャッシュ・アクセスはス
テップ５００４に進む。ステップ５００４で、次の記憶
レベルが記憶階層の最高レベル（主記憶装置）、すなわ
ち１００−Ｍよりも低いかどうかをチェックする。ステ
ップ５００４で次の記憶レベルがＭ未満であると決定さ
れると、ステップ５００５で次の記憶レベルにアクセス
する。ステップ５００５でのアクセスがヒットであるな
らば、ステップ５００６で、先のステップ１０１６４で
識別されたキャッシュ・レコード中のこのレベルに対応
するサブフィールドをセットし、記録を伴うキャッシュ
・アクセス（ステップ１０１６６）が完了する。そうで
はなく、アクセスがミスであるならば、ステップ５００
７で、先のステップ１０１６４で識別されたキャッシュ
・レコード・レジスタ中のこのレベルに対応するサブフ
ィールドをセットし、上述したように、処理はステップ
５００４に戻る。ステップ５００４で、次の記憶レベル
がＭに等しいと決定されるならば、ステップ５００８
で、次の記憶レベル、すなわちＬＥＶＥＬ＿Ｍにアクセ
スする。これが記憶階層の最高レベルであるため、アク
セスはヒットであるはずと仮定され、記録を伴うキャッ
シュ・アクセス（ステップ１０１６６）が完了する。

【００４７】まとめとして、本発明の構成に関して以下
の事項を開示する。（１）階層記憶を有するコンピュータ・システムにおけ
る実行に対して最適化された記憶アクセス待ち時間コー
ド順序を生成するコンピュータ・インプリメンテーショ
ン式方法において、静的コード順序において記憶アクセ
ス命令を識別するステップと、前記階層記憶のあるレベ
ルでのヒットに対して最適化された、前記記憶アクセス
命令に関連する第一の記憶アクセス待ち時間コード順序
と、前記階層記憶の前記レベルでのミスに対して最適化
された、前記記憶アクセス命令に関連する第二の記憶ア
クセス待ち時間コード順序とを生成するステップと、前
記記憶アクセス命令の実行が前記ヒットを起こしたとき
には前記第一の記憶アクセス待ち時間コード順序を実行
し、前記記憶アクセス命令の実行が前記ミスを起こした
ときには前記第二の記憶アクセス待ち時間コード順序を
実行するための命令を挿入するステップと、を含むこと
を特徴とする方法。（２）前記階層記憶の別のレベルでのヒットに対して最
適化された、前記記憶アクセス命令に関連する第三の記
憶アクセス待ち時間コード順序と、前記階層記憶の前記
別のレベルでのミスに対して最適化された、前記記憶ア
クセス命令に関連する第四の記憶アクセス待ち時間コー
ド順序とを生成するステップと、前記記憶アクセス命令
の実行が前記別のレベルで前記ヒットを起こしたときに
は前記第三の記憶アクセス待ち時間コード順序を実行
し、前記記憶アクセス命令の実行が前記別のレベルで前
記ミスを起こしたときには前記第四の記憶アクセス待ち
時間コード順序を実行するためのもう一つの命令を挿入
するステップと、をさらに含む上記（１）記載のコンピ
ュータ・インプリメンテーション式方法。（３）前記識別ステップが、前記記憶アクセス命令を臨
界ミスポイントとして識別するステップをさらに含み、
前記生成ステップが、前記記憶アクセス命令を前記臨界
ミスポイントとして識別する前記ステップに応答する上
記（１）記載のコンピュータ・インプリメンテーション
式方法。（４）前記記憶アクセス命令を修飾して、前記記憶アク
セス命令の前記実行が前記ミスを起こしたかどうかを示
すためのミスビットを識別するステップをさらに含み、
前記実行命令が前記ミスビットに応答する上記（１）記
載のコンピュータ・インプリメンテーション式方法。（５）前記実行命令が、前記第一の記憶アクセス待ち時
間コード順序に分岐するためのブランチ・オン・ヒット
命令および前記第二の記憶アクセス待ち時間コード順序
に分岐するためのブランチ・オン・ミス命令の一方を含
む上記（１）記載のコンピュータ・インプリメンテーシ
ョン式方法。（６）前記コンピュータ・システムがコンパイラを含
み、前記方法ステップをコンパイル時で実施する上記
（１）記載のコンピュータ・インプリメンテーション式
方法。（７）階層記憶を含み、記憶アクセス命令を含む静的命
令順序と、それぞれが前記記憶階層のあるレベルでのヒ
ットまたはミスの一方を起こす前記記憶アクセス命令の
実行に依存して最適化された関連の記憶アクセス待ち時
間コード順序とを含むコンピュータ・システムにおいて
命令およびデータを処理するコンピュータ・インプリメ
ンテーション式方法において、前記記憶アクセス命令を
デコードし、実行し、前記記憶アクセス命令の前記実行
が前記ヒットを起こしたのか前記ミスを起こしたのかを
示す情報を格納するステップと、前記格納ステップに応
答して、前記情報が前記ヒットを示すときにはキャッシ
ュ・ヒット最適化コード順序に分岐し、前記情報が前記
ミスを示すときにはキャッシュ・ミス最適化コード順序
に分岐するステップと、を含むことを特徴とする方法。（８）前記記憶アクセス命令が、ロード命令、ストア命
令およびタッチ命令の一つである上記（７）記載の方
法。（９）前記格納ステップが、前記ヒットまたはミスに関
連する前記記憶のレベルを示す情報を格納するステップ
をさらに含み、前記分岐ステップが前記レベルに応答す
る上記（７）記載の方法。（１０）前記記憶アクセス命令を臨界ミスポイントとし
て識別する前記ステップをさらに含み、前記記憶アクセ
ス待ち時間コード順序が前記臨界ミスポイントと関連し
ている上記（７）記載の方法。（１１）前記記憶アクセス命令に関連する分岐命令を挿
入するステップと、前記分岐命令をデコードするステッ
プとをさらに含み、前記分岐ステップが、前記分岐命令
をデコードする前記ステップに応答する上記（７）記載
の方法。（１２）前記分岐命令が、前記分岐ステップが推奨され
る前記記憶のレベルを指定する上記（１１）記載の方
法。（１３）前記コンピュータ・システムがレジスタ・セッ
トを含み、各レジスタが複数のサブフィールドを含み、
各サブフィールドが前記マルチレベル・キャッシュ記憶
のあるレベルと関連している上記（７）記載の方法。（１４）情報を格納する前記ステップが、前記実行ステ
ップに応答して前記サブフィールドをデフォルト設定に
初期化するステップと、前記記憶の複数のレベルにアク
セスし、前記記憶の連続するレベルでの前記ヒットおよ
び前記ミスにしたがって前記情報を前記サブフィールド
に記録するステップとをさらに含み、前記分岐ステップ
が前記サブフィールドに記録された前記情報に応答する
上記（１３）記載の方法。（１５）所与のコンピュータ・システム・インプリメン
テーションにおいて前記分岐ステップが任意である上記
（７）記載の方法。（１６）一つの命令順序付け制御を使用して命令を実行
することができる上記（７）記載の方法。（１７）静的コード順序において記憶アクセス命令を識
別するステップと、階層記憶のあるレベルでのヒットに
対して最適化された、前記記憶アクセス命令に関連する
第一の記憶アクセス待ち時間コード順序と、前記階層記
憶の前記レベルでのミスに対して最適化された、前記記
憶アクセス命令に関連する第二の記憶アクセス待ち時間
コード順序とを生成するステップと、前記記憶アクセス
命令の実行が前記ヒットを起こしたときには前記第一の
記憶アクセス待ち時間コード順序を実行し、前記記憶ア
クセス命令の実行が前記ミスを起こしたときには前記第
二の記憶アクセス待ち時間コード順序を実行するための
命令を挿入するステップと、を含む、キャッシュ記憶を
含むコンピュータ・システムにおいて命令およびデータ
を取り出すコンパイル時最適化方法を実施するためにコ
ンピュータによって実行可能な命令のプログラムを具現
化するコンピュータ読み出し可能なプログラム記憶装
置。（１８）前記識別ステップが、前記記憶アクセス命令を
臨界ミスポイントとして識別するステップをさらに含
み、前記生成ステップが、前記記憶アクセス命令を前記
臨界ミスポイントとして識別する前記ステップに応答す
る、上記（１７）記載の方法ステップを実施するために
コンピュータによって実行可能な命令のプログラムを具
現化するコンピュータ読み出し可能なプログラム記憶装
置。（１９）前記記憶アクセス命令を修飾して、前記記憶ア
クセス命令の実行が前記ミスを起こしたかどうかを示す
ミスビットを識別するステップをさらに含み、前記実行
命令が前記ミスビットに応答する、上記（１７）記載の
方法ステップを実施するためにコンピュータによって実
行可能な命令のプログラムを具現化するコンピュータ読
み出し可能なプログラム記憶装置。（２０）前記階層記憶の別のレベルでのヒットに対して
最適化された、前記記憶アクセス命令に関連する第三の
記憶アクセス待ち時間コード順序と、前記階層記憶の前
記別のレベルでのミスに対して最適化された、前記記憶
アクセス命令に関連する第四の記憶アクセス待ち時間コ
ード順序とを生成するステップと、前記記憶アクセス命
令の実行が前記別のレベルで前記ヒットを起こしたとき
には前記第三の記憶アクセス待ち時間コード順序を実行
し、前記記憶アクセス命令の実行が前記別のレベルで前
記ミスを起こしたときには前記第四の記憶アクセス待ち
時間コード順序を実行するためのもう一つの命令を挿入
するステップと、をさらに含む、上記（１７）記載の方
法ステップを実施するためにコンピュータによって実行
可能な命令のプログラムを具現化するコンピュータ読み
出し可能なプログラム記憶装置。（２１）前記実行命令が、前記記憶の指定レベルでの前
記ヒットまたは前記ミスにしたがって前記記憶アクセス
待ち時間コード順序の一方に分岐するためのブランチ・
オン・ヒット命令およびブランチ・オン・ミス命令の一
方を含む、上記（２０）記載の方法ステップを実施する
ためにコンピュータによって実行可能な命令のプログラ
ムを具現化するコンピュータ読み出し可能なプログラム
記憶装置。（２２）前記記憶アクセス命令がロード命令、ストア命
令およびタッチ命令の一つである、上記（１７）記載の
方法ステップを実施するためにコンピュータによって実
行可能な命令のプログラムを具現化するコンピュータ読
み出し可能なプログラム記憶装置。（２３）記憶に格納された命令およびデータを取り出す
ためのコンピュータ・システムにおいて、前記命令が記
憶アクセス命令を含み、前記システムが階層記憶を含
み、記憶アクセス命令を含む静的命令順序と、それぞれ
が前記記憶階層のあるレベルでのヒットまたはミスの一
方を起こす前記記憶アクセス命令の実行に依存して最適
化された関連の記憶アクセス待ち時間コード順序を含
み、前記システムが、前記命令順序を取り出し、デコー
ドし、実行するための、前記記憶に結合されたプロセッ
サを含み、前記プロセッサが、前記記憶アクセス命令の
前記実行が前記ヒットを起こしたのか前記ミスを起こし
たのかを示す情報を格納するための手段と、前記格納手
段が前記ヒットを示したときにはヒット最適化コード順
序に分岐し、前記格納手段が前記ミスを示したときには
ミス最適化コード順序に分岐するための、前記記憶に結
合された分岐論理とを含むことを特徴とするシステム。（２４）前記記憶アクセス命令がロード命令、ストア命
令およびタッチ命令の一つである上記（２３）記載のシ
ステム。（２５）前記記憶アクセス命令が、前記レジスタを識別
するキャッシュ・レコード・レジスタ・フィールドを含
む上記（２３）記載のシステム。（２６）一つの命令順序付け制御を使用して前記命令を
実行することができる上記（２３）記載のシステム。（２７）所与のコンピュータ・システム・インプリメン
テーションにおいて前記分岐論理の実行が任意である上
記（２３）記載のシステム。（２８）前記格納手段が、前記ヒットまたはミスに関連
する前記記憶のレベルを示す情報を格納するための手段
をさらに含み、前記分岐論理が前記レベルに応答する上
記（２３）記載のシステム。（２９）前記階層記憶の別のレベルでのヒットに対して
最適化された、前記記憶アクセス命令に関連する第三の
記憶アクセス待ち時間コード順序と、前記階層記憶の前
記別のレベルでのミスに対して最適化された、前記記憶
アクセス命令に関連する第四の記憶アクセス待ち時間コ
ード順序とを生成するための前記コンパイラ手段と、前
記記憶アクセス命令の実行が前記別のレベルで前記ヒッ
トを起こしときには前記第三の記憶アクセス待ち時間コ
ード順序に分岐し、前記記憶アクセス命令の実行が前記
別のレベルで前記ミスを起こしときには前記第四の記憶
アクセス待ち時間コード順序に分岐するための前記分岐
論理とをさらに含む上記（２８）記載のシステム。（３０）前記コンパイラ手段が、前記記憶アクセス命令
を臨界ミスポイントとして識別するための手段をさらに
含み、前記記憶アクセス待ち時間コード順序が前記臨界
ミスポイントと関連している上記（２３）記載のシステ
ム。（３１）前記生成手段が、前記格納手段が前記ヒットを
示したときには前記ヒット最適化コード順序を指定し、
前記格納手段が前記ミスを示したときには前記ミス最適
化コード順序を指定するための分岐命令を挿入するため
の手段をさらに含み、前記分岐論理が前記分岐命令に応
答する上記（２３）記載のシステム。（３２）前記分岐命令が、前記分岐論理が応答する前記
記憶のレベルを指定する上記（３１）記載のシステム。（３３）前記コンピュータ・システムがレジスタ・セッ
トを含み、各レジスタが複数のサブフィールドを含み、
各サブフィールドが前記マルチレベル・キャッシュ記憶
のあるレベルと関連している上記（２３）記載のシステ
ム。（３４）情報を格納するための前記手段が、前記記憶の
複数のレベルにアクセスし、前記記憶の連続するレベル
での前記ヒットおよび前記ミスにしたがって前記情報を
前記サブフィールドに記録するためのキャッシュ・レコ
ード・レジスタ管理装置をさらに含み、前記分岐論理が
前記サブフィールドに記録された前記情報に応答する上
記（２３）記載のシステム。（３５）前記キャッシュ・レコード・レジスタ・セット
が、アーキテクチャ可視性のレジスタを含むレジスタ・
ファイルの一部である上記（２３）記載のシステム。

【図面の簡単な説明】

【図１】データのロードと使用との間に、キャッシュ・
ミスまたはキャッシュ・ヒットから独立した命令を導入
する従来技術の方法を示す図である。

【図２】キャッシュ・ヒットに対して最適化されたコー
ド順序と、キャッシュ・ミスに対して最適化されたコー
ド順序との間で動的に切り換えるための、本発明のＭＢ
ＲＡＮＣＨ命令の態様を含むプログラム順序を示す図で
ある。

【図３】本発明で提案されるＭＢＲＡＮＣＨ命令の態様
を示す図である。

【図４】本発明にしたがって修飾された記憶アクセス命
令の態様を示す図である。

【図５】本発明のコンピュータ・システムの態様を示す
ブロック図である。

【図６】図５に示すディスパッチ実行の態様を示すブロ
ック図である。

【図７】図５に示すコンピュータ・システムを使用す
る、提案した実行方法の態様を説明する流れ図である。

【図８】図７の「ＭＢＲＡＮＣＨおよび条件レジスタ
（ＣＲ）命令処理」ステップに関連するサブステップを
示す図である。

【図９】図７の「ディスパッチおよび実行」ステップに
関連するサブステップを示す図である。

【図１０】図９の「記録を伴うキャッシュ・アクセス」
ステップに関連するサブステップを示す図である。

【符号の説明】

１００記憶装置１０２キャッシュ・レコード管理装置１０４命令取り出し装置１０６データ取り出し装置１０８デコード装置１１０分岐装置１１２ディスパッチ実行装置１１３ディスパッチ装置１１５機能装置１１６スケジューラ１１８レジスタ・ファイル１２０完了装置２００キャッシュ・レコード・レジスタ・セット５００プロセッサ装置

───────────────────────────────────────────────────── フロントページの続き (72)発明者チャールズ・マーシャル・バートン・サードアメリカ合衆国07641、ニュージャージー州ハワースプロスペクトアベニュー 28 (72)発明者プラディープ・クマール・デュベイアメリカ合衆国10606、ニューヨーク州ホワイトプレインズマーティンアヴェニュー 25 アパートメント 1015 (72)発明者ジェイム・ハムバート・モレノアメリカ合衆国10530、ニューヨーク州ハーツデールホルムスアヴェニュー 205

Claims

【特許請求の範囲】

【請求項１】階層記憶を有するコンピュータ・システム
における実行に対して最適化された記憶アクセス待ち時
間コード順序を生成するコンピュータ・インプリメンテ
ーション式方法において、静的コード順序において記憶アクセス命令を識別するス
テップと、前記階層記憶のあるレベルでのヒットに対して最適化さ
れた、前記記憶アクセス命令に関連する第一の記憶アク
セス待ち時間コード順序と、前記階層記憶の前記レベル
でのミスに対して最適化された、前記記憶アクセス命令
に関連する第二の記憶アクセス待ち時間コード順序とを
生成するステップと、前記記憶アクセス命令の実行が前記ヒットを起こしたと
きには前記第一の記憶アクセス待ち時間コード順序を実
行し、前記記憶アクセス命令の実行が前記ミスを起こし
たときには前記第二の記憶アクセス待ち時間コード順序
を実行するための命令を挿入するステップと、を含むこ
とを特徴とする方法。
【請求項２】前記階層記憶の別のレベルでのヒットに対
して最適化された、前記記憶アクセス命令に関連する第
三の記憶アクセス待ち時間コード順序と、前記階層記憶
の前記別のレベルでのミスに対して最適化された、前記
記憶アクセス命令に関連する第四の記憶アクセス待ち時
間コード順序とを生成するステップと、前記記憶アクセス命令の実行が前記別のレベルで前記ヒ
ットを起こしたときには前記第三の記憶アクセス待ち時
間コード順序を実行し、前記記憶アクセス命令の実行が
前記別のレベルで前記ミスを起こしたときには前記第四
の記憶アクセス待ち時間コード順序を実行するためのも
う一つの命令を挿入するステップと、をさらに含む請求
項１記載のコンピュータ・インプリメンテーション式方
法。
【請求項３】前記識別ステップが、前記記憶アクセス命
令を臨界ミスポイントとして識別するステップをさらに
含み、前記生成ステップが、前記記憶アクセス命令を前
記臨界ミスポイントとして識別する前記ステップに応答
する請求項１記載のコンピュータ・インプリメンテーシ
ョン式方法。
【請求項４】前記記憶アクセス命令を修飾して、前記記
憶アクセス命令の前記実行が前記ミスを起こしたかどう
かを示すためのミスビットを識別するステップをさらに
含み、前記実行命令が前記ミスビットに応答する請求項
１記載のコンピュータ・インプリメンテーション式方
法。
【請求項５】前記実行命令が、前記第一の記憶アクセス
待ち時間コード順序に分岐するためのブランチ・オン・
ヒット命令および前記第二の記憶アクセス待ち時間コー
ド順序に分岐するためのブランチ・オン・ミス命令の一
方を含む請求項１記載のコンピュータ・インプリメンテ
ーション式方法。
【請求項６】前記コンピュータ・システムがコンパイラ
を含み、前記方法ステップをコンパイル時で実施する請
求項１記載のコンピュータ・インプリメンテーション式
方法。
【請求項７】階層記憶を含み、記憶アクセス命令を含む
静的命令順序と、それぞれが前記記憶階層のあるレベル
でのヒットまたはミスの一方を起こす前記記憶アクセス
命令の実行に依存して最適化された関連の記憶アクセス
待ち時間コード順序とを含むコンピュータ・システムに
おいて命令およびデータを処理するコンピュータ・イン
プリメンテーション式方法において、前記記憶アクセス命令をデコードし、実行し、前記記憶
アクセス命令の前記実行が前記ヒットを起こしたのか前
記ミスを起こしたのかを示す情報を格納するステップ
と、前記格納ステップに応答して、前記情報が前記ヒットを
示すときにはキャッシュ・ヒット最適化コード順序に分
岐し、前記情報が前記ミスを示すときにはキャッシュ・
ミス最適化コード順序に分岐するステップと、を含むこ
とを特徴とする方法。
【請求項８】前記記憶アクセス命令が、ロード命令、ス
トア命令およびタッチ命令の一つである請求項７記載の
方法。
【請求項９】前記格納ステップが、前記ヒットまたはミ
スに関連する前記記憶のレベルを示す情報を格納するス
テップをさらに含み、前記分岐ステップが前記レベルに
応答する請求項７記載の方法。
【請求項１０】前記記憶アクセス命令を臨界ミスポイン
トとして識別する前記ステップをさらに含み、前記記憶
アクセス待ち時間コード順序が前記臨界ミスポイントと
関連している請求項７記載の方法。
【請求項１１】前記記憶アクセス命令に関連する分岐命
令を挿入するステップと、前記分岐命令をデコードするステップとをさらに含み、
前記分岐ステップが、前記分岐命令をデコードする前記
ステップに応答する請求項７記載の方法。
【請求項１２】前記分岐命令が、前記分岐ステップが推
奨される前記記憶のレベルを指定する請求項１１記載の
方法。
【請求項１３】前記コンピュータ・システムがレジスタ
・セットを含み、各レジスタが複数のサブフィールドを
含み、各サブフィールドが前記マルチレベル・キャッシ
ュ記憶のあるレベルと関連している請求項７記載の方
法。
【請求項１４】情報を格納する前記ステップが、前記実行ステップに応答して前記サブフィールドをデフ
ォルト設定に初期化するステップと、前記記憶の複数のレベルにアクセスし、前記記憶の連続
するレベルでの前記ヒットおよび前記ミスにしたがって
前記情報を前記サブフィールドに記録するステップとを
さらに含み、前記分岐ステップが前記サブフィールドに
記録された前記情報に応答する請求項１３記載の方法。
【請求項１５】所与のコンピュータ・システム・インプ
リメンテーションにおいて前記分岐ステップが任意であ
る請求項７記載の方法。
【請求項１６】一つの命令順序付け制御を使用して命令
を実行することができる請求項７記載の方法。
【請求項１７】静的コード順序において記憶アクセス命
令を識別するステップと、階層記憶のあるレベルでのヒットに対して最適化され
た、前記記憶アクセス命令に関連する第一の記憶アクセ
ス待ち時間コード順序と、前記階層記憶の前記レベルで
のミスに対して最適化された、前記記憶アクセス命令に
関連する第二の記憶アクセス待ち時間コード順序とを生
成するステップと、前記記憶アクセス命令の実行が前記ヒットを起こしたと
きには前記第一の記憶アクセス待ち時間コード順序を実
行し、前記記憶アクセス命令の実行が前記ミスを起こし
たときには前記第二の記憶アクセス待ち時間コード順序
を実行するための命令を挿入するステップと、を含む、
キャッシュ記憶を含むコンピュータ・システムにおいて
命令およびデータを取り出すコンパイル時最適化方法を
実施するためにコンピュータによって実行可能な命令の
プログラムを具現化するコンピュータ読み出し可能なプ
ログラム記憶装置。
【請求項１８】前記識別ステップが、前記記憶アクセス
命令を臨界ミスポイントとして識別するステップをさら
に含み、前記生成ステップが、前記記憶アクセス命令を
前記臨界ミスポイントとして識別する前記ステップに応
答する、請求項１７記載の方法ステップを実施するため
にコンピュータによって実行可能な命令のプログラムを
具現化するコンピュータ読み出し可能なプログラム記憶
装置。
【請求項１９】前記記憶アクセス命令を修飾して、前記
記憶アクセス命令の実行が前記ミスを起こしたかどうか
を示すミスビットを識別するステップをさらに含み、前
記実行命令が前記ミスビットに応答する、請求項１７記
載の方法ステップを実施するためにコンピュータによっ
て実行可能な命令のプログラムを具現化するコンピュー
タ読み出し可能なプログラム記憶装置。
【請求項２０】前記階層記憶の別のレベルでのヒットに
対して最適化された、前記記憶アクセス命令に関連する
第三の記憶アクセス待ち時間コード順序と、前記階層記
憶の前記別のレベルでのミスに対して最適化された、前
記記憶アクセス命令に関連する第四の記憶アクセス待ち
時間コード順序とを生成するステップと、前記記憶アクセス命令の実行が前記別のレベルで前記ヒ
ットを起こしたときには前記第三の記憶アクセス待ち時
間コード順序を実行し、前記記憶アクセス命令の実行が
前記別のレベルで前記ミスを起こしたときには前記第四
の記憶アクセス待ち時間コード順序を実行するためのも
う一つの命令を挿入するステップと、をさらに含む、請
求項１７記載の方法ステップを実施するためにコンピュ
ータによって実行可能な命令のプログラムを具現化する
コンピュータ読み出し可能なプログラム記憶装置。
【請求項２１】前記実行命令が、前記記憶の指定レベル
での前記ヒットまたは前記ミスにしたがって前記記憶ア
クセス待ち時間コード順序の一方に分岐するためのブラ
ンチ・オン・ヒット命令およびブランチ・オン・ミス命
令の一方を含む、請求項２０記載の方法ステップを実施
するためにコンピュータによって実行可能な命令のプロ
グラムを具現化するコンピュータ読み出し可能なプログ
ラム記憶装置。
【請求項２２】前記記憶アクセス命令がロード命令、ス
トア命令およびタッチ命令の一つである、請求項１７記
載の方法ステップを実施するためにコンピュータによっ
て実行可能な命令のプログラムを具現化するコンピュー
タ読み出し可能なプログラム記憶装置。
【請求項２３】記憶に格納された命令およびデータを取
り出すためのコンピュータ・システムにおいて、前記命
令が記憶アクセス命令を含み、前記システムが階層記憶
を含み、記憶アクセス命令を含む静的命令順序と、それ
ぞれが前記記憶階層のあるレベルでのヒットまたはミス
の一方を起こす前記記憶アクセス命令の実行に依存して
最適化された関連の記憶アクセス待ち時間コード順序を
含み、前記システムが、前記命令順序を取り出し、デコードし、実行するため
の、前記記憶に結合されたプロセッサを含み、前記プロセッサが、前記記憶アクセス命令の前記実行が前記ヒットを起こし
たのか前記ミスを起こしたのかを示す情報を格納するた
めの手段と、前記格納手段が前記ヒットを示したときにはヒット最適
化コード順序に分岐し、前記格納手段が前記ミスを示し
たときにはミス最適化コード順序に分岐するための、前
記記憶に結合された分岐論理とを含むことを特徴とする
システム。
【請求項２４】前記記憶アクセス命令がロード命令、ス
トア命令およびタッチ命令の一つである請求項２３記載
のシステム。
【請求項２５】前記記憶アクセス命令が、前記レジスタ
を識別するキャッシュ・レコード・レジスタ・フィール
ドを含む請求項２３記載のシステム。
【請求項２６】一つの命令順序付け制御を使用して前記
命令を実行することができる請求項２３記載のシステ
ム。
【請求項２７】所与のコンピュータ・システム・インプ
リメンテーションにおいて前記分岐論理の実行が任意で
ある請求項２３記載のシステム。
【請求項２８】前記格納手段が、前記ヒットまたはミス
に関連する前記記憶のレベルを示す情報を格納するため
の手段をさらに含み、前記分岐論理が前記レベルに応答
する請求項２３記載のシステム。
【請求項２９】前記階層記憶の別のレベルでのヒットに
対して最適化された、前記記憶アクセス命令に関連する
第三の記憶アクセス待ち時間コード順序と、前記階層記
憶の前記別のレベルでのミスに対して最適化された、前
記記憶アクセス命令に関連する第四の記憶アクセス待ち
時間コード順序とを生成するための前記コンパイラ手段
と、前記記憶アクセス命令の実行が前記別のレベルで前記ヒ
ットを起こしときには前記第三の記憶アクセス待ち時間
コード順序に分岐し、前記記憶アクセス命令の実行が前
記別のレベルで前記ミスを起こしときには前記第四の記
憶アクセス待ち時間コード順序に分岐するための前記分
岐論理とをさらに含む請求項２８記載のシステム。
【請求項３０】前記コンパイラ手段が、前記記憶アクセ
ス命令を臨界ミスポイントとして識別するための手段を
さらに含み、前記記憶アクセス待ち時間コード順序が前
記臨界ミスポイントと関連している請求項２３記載のシ
ステム。
【請求項３１】前記生成手段が、前記格納手段が前記ヒ
ットを示したときには前記ヒット最適化コード順序を指
定し、前記格納手段が前記ミスを示したときには前記ミ
ス最適化コード順序を指定するための分岐命令を挿入す
るための手段をさらに含み、前記分岐論理が前記分岐命
令に応答する請求項２３記載のシステム。
【請求項３２】前記分岐命令が、前記分岐論理が応答す
る前記記憶のレベルを指定する請求項３１記載のシステ
ム。
【請求項３３】前記コンピュータ・システムがレジスタ
・セットを含み、各レジスタが複数のサブフィールドを
含み、各サブフィールドが前記マルチレベル・キャッシ
ュ記憶のあるレベルと関連している請求項２３記載のシ
ステム。
【請求項３４】情報を格納するための前記手段が、前記
記憶の複数のレベルにアクセスし、前記記憶の連続する
レベルでの前記ヒットおよび前記ミスにしたがって前記
情報を前記サブフィールドに記録するためのキャッシュ
・レコード・レジスタ管理装置をさらに含み、前記分岐
論理が前記サブフィールドに記録された前記情報に応答
する請求項２３記載のシステム。
【請求項３５】前記キャッシュ・レコード・レジスタ・
セットが、アーキテクチャ可視性のレジスタを含むレジ
スタ・ファイルの一部である請求項２３記載のシステ
ム。