JPH07253926A

JPH07253926A - キャッシュ・ミスによる時間ペナルティ減少方法

Info

Publication number: JPH07253926A
Application number: JP7014479A
Authority: JP
Inventors: Gordon Kurpanek; ゴードン・クーパネック; Eric Delano; エリック・デラノ; Michael A Buckley; マイケル・エイ・バックレー; William R Bryg; ウィリアム・アール・ブリグ
Original assignee: Hewlett Packard Co
Current assignee: HP Inc
Priority date: 1994-02-14
Filing date: 1995-01-31
Publication date: 1995-10-03
Anticipated expiration: 2020-02-09
Also published as: US5603004A; EP0667580A2; EP0667580A3; DE69518676T2; DE69518676D1; EP0667580B1; JP3618385B2

Abstract

(57)【要約】【目的】最小量のハードウェアの追加のみで、キャツ
シュ・スラッシング挙動を除去できるキャッシュ・ミス
による時間ペナルティ減少方法を提供する。【構成】第１のデータ・ラインを主記憶装置１１から
補助キャッシュ２３に転送する場合に、第１のデータ・
ラインの行先表示がデータ・キャッシュ１４の表示をし
ている場合には、第１のデータ・ラインをデータ・キャ
ッシュ１４に移動させる。また、第２のデータ・ライン
がデータ・キャッシュ１４の外に移動され、第２のデー
タ・ラインが汚染されている場合には、第２のデータ・
ラインを主記憶装置１１に戻し、第３のデータ・ライン
に対してプロセッサがアクセスを要求する場合には、第
３のデータ・ラインに対して並行して補助キャッシュ２
３とデータ・キャッシュ１４をプロセッサにより探索す
る。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、多重レベル・キャッシ
ュ装置におけるキャッシュ・ミスに起因する時間ペナル
ティを低減させるためのキャッシュ・ミスによる時間ペ
ナルティ減少方法に係わる。

【０００２】

【従来の技術】現在のコンピュータ装置の殆どは、中央
処理装置（以下、ＣＰＵという）と主記憶装置とを含
む。ＣＰＵが命令とオペランドとを復号し実行すること
が可能な速度は、命令とオペランドとが主記憶装置から
ＣＰＵに転送される上で可能な転送速度によって決ま
る。主記憶装置から命令とオペランドとをＣＰＵが受け
取るために要する時間を減少させるために、コンピュー
タ装置の多くは、ＣＰＵと主記憶装置との間にキャッシ
ュ・メモリを含む。

【０００３】キャッシュ・メモリは、ＣＰＵによって近
い将来に使用されると推測される主記憶装置内の内容の
一部分を一時的に保持するために使用される小型の高速
バッファ記憶装置である。キャッシュ・メモリの主要な
目的は、データ又は命令の取り出しのためのメモリ・ア
クセスを行うのに要する時間を短縮することである。キ
ャッシュ・メモリ内に存在する情報に対するアクセスに
要する時間は、主記憶装置内に存在する情報に対するア
クセスに要する時間よりも遥かに短い。従って、キャッ
シュ・メモリを有するＣＰＵでは、命令とオペランドと
の取出し及び／又は格納における待ち時間は著しく短く
て済む。

【０００４】キャッシュ・メモリは、１ワード以上のデ
ータを含む多数のブロックによって構成される。各ブロ
ックは、そのブロックが主記憶装置のどのブロックのコ
ピーであるかを一意的に同定するアドレス・タグに対応
付けられる。プロセッサがメモリ参照を行う度に、要求
されたデータのコピーがキャッシュ・メモリ内に存在す
るかどうかを調べるためにアドレス・タグ比較が行われ
る。要求されたメモリ・ブロックがキャッシュ・メモリ
内に存在しない場合には、その要求されたブロックが主
記憶装置から検索され、キャッシュ・メモリ内に格納さ
れ、プロセッサに供給される。

【０００５】主記憶装置からデータを検索するためにキ
ャッシュ・メモリを使用することに加えて、ＣＰＵは、
主記憶装置にデータを直接書き込む代わりにキャッシュ
・メモリ内にデータを書き込むことも可能である。プロ
セッサがキャッシュ・メモリにデータを書き込むことを
必要とする時には、キャッシュ・メモリは、データがそ
の中に書き込まれるべきデータ・ブロックがキャッシュ
・メモリ内に存在するかどうかを調べるために、アドレ
ス・タグの比較を行う。データ・ブロックが存在する場
合には、データがキャッシュ・メモリ内のそのデータ・
ブロック内に書き込まれる。多くの装置の場合には、そ
の後で、そのデータ・ブロックのためのデータ「汚染ビ
ット(dirty bit) 」が設定される。このダーティ・ビッ
トは、当該データ・ブロック内のデータが汚染されてい
る（即ち、変更されている）ということを示し、従っ
て、当該データ・ブロックがキャッシュ・メモリから削
除される前に、その変更されたデータが主記憶装置内に
書き込まれなければならない。データがその中に書き込
まれるはずのデータ・ブロックがキャッシュ・メモリ内
に存在しない時には、そのデータブロックがキャッシュ
・メモリ内に移動させられるか、データが主記憶装置内
に直接書き込まれなければならない。新たなデータがキ
ャッシュ・メモリ内に入れられる時に重ね書きされるか
又はキャッシュ・メモリからコピーされて移動させられ
るデータ・ブロックは、犠牲ブロック又は犠牲ラインと
呼ばれる。

【０００６】応用例によっては、第２のキャッシュ・メ
モリが、第１のキャッシュ・メモリと主記憶装置との間
に直列に付加される場合もある。第１のキャッシュ・メ
モリは、典型的には、第２のキャッシュ・メモリ内のデ
ータの部分セットを有する。同様に、第２のキャッシュ
・メモリは、典型的には、主記憶装置内のデータの部分
セットを有する。アクセスされるデータは、最初に、第
１のキャッシュ・メモリ内で探索される。第１のキャッ
シュ・メモリ内でミスがある場合には、そのアクセスさ
れたデータが第２のキャッシュ・メモリ内で探索され
る。第２のキャッシュ・メモリ（以下、キャッシュ・メ
モリを単に「キャッシュ」という）内でミスがある場合
には、そのアクセスされたデータが主記憶装置の外に移
動させられる。

【０００７】プロセッサ装置用の２レベル・キャッシュ
の一例では、第１レベルのキャッシュが第２レベルのキ
ャッシュの適正な部分セットである。この「適正な部分
セット」という術語は、第１レベルのキャッシュ内の全
項目が第２レベルのキャッシュ内にも存在するというこ
とを意味する。第２レベルのキャッシュは、第１レベル
のキャッシュ内に存在しない追加の項目を含む。第１レ
ベルのキャッシュは第２レベルのキャッシュよりも容量
が小さく、且つ第２レベルのキャッシュよりもプロセッ
サに近い位置にある。第１レベルのキャッシュは、第２
レベル・キャッシュよりも容量が小さく、且つ第２レベ
ル・キャッシュよりもプロセッサに近い位置にあり、更
には、その対応する第２レベルのキャッシュ又は記憶装
置のアクセス待ち時間よりも短いアクセス待ち時間を有
するので、一般的に性能の改善をもたらすことが可能で
ある。

【０００８】通常の動作では、何らかのメモリ参照を実
現するためには、幾つかの異なった動作が必要である。
メモリ参照は一般的にロード命令又は格納命令である。
先ず最初に、最も単純で最も高速度の形で、メモリ参照
が第１レベル・キャッシュ内でヒットすることが可能で
ある。「ヒット(hit) 」とは、「チェックされているキ
ャッシュ（第１レベル又は第２レベル）内に、所期メモ
リ・アドレスのためのデータが存在する場合」と定義さ
れる。「ミス」とは、「チェックされているキャッシュ
（第１レベル又は第２レベル）内に、所期メモリ・アド
レスのためのデータが存在しない場合」と定義される。
第１レベル・キャッシュでヒットがあった時には、サイ
クル・ペナルティはゼロであり、メモリ参照は処理ペナ
ルティなしに完了する。

【０００９】その次に最高速度の場合は、第２レベルの
キャッシュ内でヒットが生じる第１レベルのキャッシュ
・ミスである。これは、第２レベルのキャッシュから適
切な１６ビット量で単一の第１レベルのキャッシュを満
たすために一連の動作シーケンスが行われることを引き
起こす。その後で、データがプロセッサに送られるか、
格納が完了する。これは、中速度の動作であり、プロセ
ッサは、メモリ参照が完了されるのを待つ間、停止され
られる。

【００１０】最低速度の動作は、メモリ参照が第１レベ
ルのキャッシュと第２レベルのキャッシュの両方をミス
する場合である。この例では、主記憶装置から戻り、第
２レベルのキャッシュの中に当該ラインを移動させるた
めに、長い一連の動作シーケンスが開始させられる。こ
のデータが記憶装置から第２レベルのキャッシュにコピ
ーされる時には、第１レベルのキャッシュが再び参照さ
れ、この時には、第２レベルのキャッシュ内でヒットす
る第１レベルのキャッシュ・ミスによる。これは、第２
レベルのキャッシュ・ラインの当該部分が第１レベル・
キャッシュ内に書き込まれると、その後で、要求された
データがプロセッサに供給されるか、格納が完了され
る。

【００１１】典型的には、キャッシュ・メモリは直接マ
ッピング型である。即ち、キャッシュ内の１つ以上の項
目にアクセスするために索引が使用される。この場合、
マッチングが生じるかどうかを判定するために、その項
目のためのタグが、アドレスのタグ部分と比較される。

【００１２】多方向セット連想キャッシュの場合には、
複数のデータ・ランダム・アクセス・メモリ（以下、Ｒ
ＡＭという）に同時にアクセスするために、単一の索引
が使用される。データＲＡＭは、１つ以上の物理ＲＡＭ
集積回路によって実現されることが可能である。１つの
セットは、単一のキャッシュ索引によってアドレス指定
されるライン全ての集まりである。単一のキャッシュ索
引によってアドレス指定されるデータＲＡＭの数は、キ
ャッシュの方向数を表す。例えば、１つのキャッシュに
おいて２つのデータＲＡＭからデータをアクセスするた
めに単一のキャッシュ索引が使用される場合には、その
キャッシュは２方向セット連想キャッシュである。同様
に、１つのキャッシュにおいて４つのデータＲＡＭから
データをアクセスするために単一のキャッシュ索引が使
用される場合には、そのキャッシュは４方向セット連想
キャッシュである。

【００１３】多方向アクセスが行われる場合には、各デ
ータＲＡＭ毎にタグ比較が行われる。タグ比較が所期の
データ・ブロックが特定のデータＲＡＭ内に存在するこ
とを示す時には、その特定のデータＲＡＭからのデータ
に基づいて／によって、その動作が行われる。

【００１４】完全連想キャッシュの場合には、索引は使
用されない。完全連想キャッシュに対してアクセスが行
われる時には、完全連想キャッシュ内の各キャッシュ・
ラインに対してタグ比較が行われる。所期データ・ライ
ンがそのキャッシュ内に存在することをタグ比較が示す
時には、その特定のデータ・ラインからのデータに基づ
いて／によって、その動作が行われる。

【００１５】キャッシュ装置の全般的な説明に関して
は、例えばDavid A. Patterson, JohnL. Hennessy, Com
puter Architecture A Quatitative Approach, Morgan
Kauffman Publishers, Inc., San Maeto, California,
１９９０（１９９０年、カリフォルニア州、サン・メイ
ト、「モルガン・カフマン出版株式会社」発行、「ダビ
ッド・エイ・パターソン」、「ジョン・エル・ヘネシ
イ」共著、「容量処理方法に関するコンピュータ構
造」）のページ４０４〜４２３、ページ４５４〜４６４
を参照されたい。

【００１６】

【発明が解決しようとする課題】従来技術の装置の１つ
では、完全連想犠牲キャッシュが、より大容量の直接マ
ッピング・キャッシュから犠牲ラインを受け取る。直接
マッピング・キャッシュ内でミスがある時には、完全連
想犠牲キャッシュが、完全連想キャッシュ内に発見され
る場合が時としてある。Norman P. Jouppi, Improving
Direct-Mapped Cache Performance by the Addition of
a Small Fully-Associative Cache and Prefetch Buff
ers, Proceedings１７th ISCA,Ｍａｙ１９９０｛１９
９０年５月、第１７回議事録の「ノーマン・ピィ・ジュ
ピィ」による「小容量完全連想キャッシュと、先取りバ
ッファの追加による改善直線マッピング・キャツシュ性
能」のページ３６４〜３７３seattle,WA（シアトル，ダ
フリュウ・エイ）｝を参照されたい。

【００１７】

【課題を解決するための手段】本発明の好適な実施例で
は、キャッシュ装置が、主記憶装置内に格納されプロセ
ッサによって使用されるデータをバッファリングする。
このキャッシュ装置は、第１のキャッシュと、第２のキ
ャッシュと、第１の転送手段と、第２の転送手段と、第
３の転送手段と、アクセス手段とを含む。第１のキャッ
シュは完全連想型である。第２のキャッシュは直接マッ
ピング型である。第１の転送手段は、主記憶装置から第
１のキャッシュにデータ・ラインを転送する。第２の転
送手段は、第１のキャッシュから第２のキャッシュにデ
ータ・ラインを転送する。第３の転送手段は第２のキャ
ッシュから主記憶装置にデータ・ラインを転送する。第
１のキャッシュからデータ・ラインのアクセスと、第２
のキャッシュからのデータ・ラインのアクセスとが、並
行して行われる。

【００１８】本発明の好適な実施例では、第２のキャッ
シュ内に索引を生成するためにハッシュ関数が使用され
る。その索引によってアクセスされるデータ・ラインの
ためのタグが、第２のキャッシュ内でヒットがあったか
どうかを判定するために、所期データ・ラインのための
タグと比較される。

【００１９】第１のキャッシュに対するデータ・アクセ
ス１回毎に、ヒットがあるかどうかを判定するために、
第１のキャッシュ内の全データ・ラインのためのタグが
チェックされる。内容参照可能メモリが第１のキャッシ
ュのためのタグを記憶する。データ・ラインが、先入れ
先出し（以下、ＦＩＦＯという）記憶装置の形の第１の
キャッシュによって格納される。

【００２０】更に、この好適な実施例では、データ・ラ
インが第１のキャッシュの外に移動させられる時のデー
タ・ラインのための行先を示す表示が、第１のキャッシ
ュ内の各データ・ラインと共に格納される。この表示
は、データ・ラインが第２のキャッシュ・ラインに移動
させられるのか又は主記憶装置に移動させられるかを表
示する。

【００２１】更に、この好ましい実施例では、データが
第１のキャッシュ内に先取りされるためのメモリ空間を
与えるために、予め決められた数より多くのデータ・ラ
インを第１のキャッシュが含む時に、データ・ラインが
１度に２つずつ第１のキャッシュの外に移動させられ
る。これら２つのデータ・ラインが第２のキャッシュ内
の同一の記憶場所にマッピングされる時には、これら２
つのデータ・ラインのどちらか一方が主記憶装置に移動
させられる。

【００２２】例えば、特定のタイプのデータ・アクセス
の場合には、プロセッサは、キャッシュ・ミスがある場
合に使用されることになっている、又は、「ヒット」デ
ータ・ラインのための参照ビットがゼロにセットされ
る、第１のキャッシュ内のデータ・ライン上でヒットが
ある場合に使用されることになっている、先取りアドレ
スを生成する。先取りアドレスのためのデータ・ライン
が既に第１と第２のキャッシュ内に存在する時には、更
に動作を行う必要はない。先取りアドレスのためのデー
タ・ラインが既に第１と第２のキャッシュ内に存在しな
い時には、先取りアドレスのためのデータ・ラインが先
取りされる。先取りデータ・ラインのための参照ビット
がクリアされ（即ち、ゼロにセットされ）、先取りデー
タ・ラインが参照されなかったことを表示する。「未参
照(unreferenced)」という印を付けられている第１のキ
ャッシュ内のデータ・ラインにおいてキャッシュ・ヒッ
トがある場合には、参照ビットが、そのデータ・ライン
の参照が現時点で完了したということを表示する「１」
にセットされる。この好適な実施例では、「未参照」と
いう印を付けられている第１のキャッシュ内のデータ・
ライン上においてキャッシュ・ヒットがあり、かつ先取
りアドレスが生成され終わっている時には、その先取り
アドレスのためのデータ・ラインがキャッシュの一方の
中に存在しない場合に、その先取りアドレスのためのデ
ータ・ラインが主記憶装置から先取りされ、第１のキャ
ッシュの中に入れられる。先取りデータ・ラインのため
の参照ビットがクリアされ、先取りデータ・ラインが参
照されなかったことを表示する。

【００２３】本発明の好適な実施例は、最少量のハード
ウェアの追加だけによって、直接マッピング型キャッシ
ュに典型的に関連したスラッシング挙動を取り除く。

【００２４】

【実施例】図１は、コンピュータ装置の単純化したブロ
ック線図である。プロセッサ１２と主記憶装置１１とが
バス１０に接続された形で示されている。プロセッサ１
２は、命令キャッシュ１３とデータ・キャッシュ１４と
を使用する。命令キャッシュ１３は、プロセッサ１２用
の命令をスタティック・ランダム・アクセス記憶装置
（以下、ＳＲＡＭという）内に格納する。データ・キャ
ッシュ１４は、プロセッサ１２用のデータをＳＲＡＭ内
に格納する。

【００２５】図２は、プロセッサ１２の単純化したブロ
ック線図を示す。プロセッサ１２は、バス・インターフ
ェース論理回路２６と、命令キャッシュ・インターフェ
ース論理回路２４と、データ・キャッシュ論理回路２５
と、論理演算装置（ＡＬＵ）２２と、アドレス変換バッ
ファ（以下、ＴＬＢという）２１と、補助キャッシュ２
３とを含む形で示されている。装置のバス・インターフ
ェース論理回路２６は、装置のバス１０に対するインタ
ーフェースをプロセッサ１２に与える。命令キャッシュ
・インターフェース論理回路２４は、命令キャッシュ１
３に対するインターフェースをプロセッサ１２に与え
る。データ・キャッシュ論理回路２５は、データ・キャ
ッシュ１４に対するインターフェースをプロセッサ１２
に与える。後で更に詳細に説明するように、補助キャッ
シュ２３は、論理演算装置２２に対してデータを与える
ためにデータ・キャッシュ１４と並列に使用される。ア
ドレス変換バッファ２１は、補助キャッシュ２３内に格
納されたデータとデータ・キャッシュ１４内に格納され
たデータとに対してアクセスするために使用されるキャ
ッシュ・タグを生成するために、仮想アドレスを実アド
レスにマッピングするために使用される。

【００２６】図３は、データ・キャッシュ装置のための
構成を示す。この好適な実施例では、補助キャッシュ２
３は、６４個の完全連想３２バイト・キャッシュ・ライ
ンから成る。補助キャッシュ２３は、アドレスの一部分
が項目タグ各々と一致させられることを可能にする内容
参照可能メモリ（以下、ＣＡＭという）内にタグを格納
する。この好適な実施例では、データ・キャッシュ１４
は直接マッピングされ、１メガバイトまでのデータ（３
２Ｋ３２バイト・キャッシュ・ライン）から成る。

【００２７】各キャッシュ・アクセス毎に、データ・キ
ャッシュ１４と補助キャッシュ２３との両方が並行して
アクセスされる。（図２に示される）ＴＬＢ２１からア
クセスされる実アドレスが、アクセスのための補助キャ
ッシュ・アクセス・タグを補助キャッシュ２３内に生成
するために使用される。補助キャッシュ・アクセス・タ
グが、補助キャッシュ２３内のいずれかのデータ・ライ
ンのためのタグと一致する場合には、データ・ライン３
６上にヒットが発生させられる。ヒットは、補助キャッ
シュから「ヒット」データを選択しそのヒット・データ
をデータ・パス３３上に位置させるように、セレクタ３
７に信号を送る。

【００２８】補助キャッシュ２３へのアクセスと同時
に、索引１３が、データ・キャッシュ１４内の単一のデ
ータ・ラインにアクセスするために使用される。この好
適な実施例では、その索引は、アクセスされた記憶場所
のための仮想アドレスの一部分をハッシュすることによ
って導き出されたハッシュ値から構成される。データ・
キャッシュ１４内の索引を付けられた記憶場所のための
アドレス・タグが、データライン３１上に位置したアク
セス記憶場所の実アドレスの一部分と比較される。この
比較は、比較論理回路３５によって表される。補助キャ
ッシュ２３又はデータ・キャッシュ１４からのヒットが
ある場合には、論理回路３４がヒット・データ・ライン
３２上にヒット信号を生成する。

【００２９】補助キャッシュ２３とデータ・キャッシュ
１４との両方からのヒットがある場合には、新たなデー
タ・ラインが主記憶装置１１から先取りされる。データ
・ラインは、ＦＩＦＯの順序で補助キャッシュ２３から
出し入れされる。主記憶装置１１から要求される全デー
タ・ラインは、補助キャッシュ２３内に移動させられ
る。データ・ラインが補助キャッシュ２３の外に移動さ
せられることになっている時には、そのデータ・ライン
はデータ・キャッシュ１４に入れられるか又は主記憶装
置１１に戻される。補助キャッシュ２３からのデータ・
ラインをデータ・キャッシュ１４内に移動させるか又は
主記憶装置１１に戻すかの決定は、補助キャッシュ２３
内のデータ・ラインと共に格納された割り当てビットの
値によって決まる。割り当てビットの値は、そのデータ
・ラインが補助ビット２３の中に移されることを生じさ
せた命令と、その命令が、キャッシュ・ヒット副命令欄
(cache hit sub-operation field) において指定された
「非割当て」キャッシュ・ヒットを有したかどうかとい
うことに基づいて決定される。例えば、この好適な実施
例では、短い変位ロード及び格納と索引付きロード及び
格納とが、キャッシュ・ヒット副命令欄を有する。

【００３０】「非割当て」キャッシュ・ヒットを伴うロ
ード命令又は格納命令がそのキャッシュをミスする場合
には、アクセスされたデータ・ラインといずれかの先取
りされたデータ・ラインとの両方が補助キャッシュ２３
内に入れられ、その割当てビットがクリアされ（即ち、
ゼロにセットされ）、「非割当て」を表示する。これに
加えて、指定された「非割当て」キャッシュ・ヒットを
伴うデータ・アクセスが、参照ビットがクリアされる
（下記参照）補助キャッシュ２３内のデータ・ライン上
でのヒットに結果し、従って（後で更に詳細に説明する
ように）先取りを生じさせる場合には、その好ましいデ
ータ・ラインが、補助キャッシュ２３内に入れられ、そ
の割当てビットがクリアされ（即ち、ゼロにセットさ
れ）、「非割当て」を表示する。他の全てのデータ・ラ
インは補助キャッシュ２３に入れられ、その割当てビッ
トが「１」にセットされ、「割当て」を表示する。

【００３１】補助キャッシュ２３内のデータ・ラインが
置換されることになっている時には、そのデータ・ライ
ンがデータ・キャッシュ１４と（汚染ビットの場合に）
主記憶装置１１とのどちらに移されなければならないか
を決定するために、割当てビットがチェックされる。そ
のデータ・ラインのための割当てビットが１にセットさ
れる場合には、そのデータ・ラインはデータ・キャッシ
ュ１４に移される。そのデータ・ラインのための割当て
ビットが０にセットされる場合には、そのデータ・ライ
ンが汚染されている（即ち、補助キャッシュ内に入れら
れてから変更が加えられている）ならば、そのデータ・
ラインが主記憶装置１１に移される。そのデータ・ライ
ンが汚染されていない場合には、そのデータラインは、
主記憶装置１１に再び書き込まれることなしに、廃棄さ
れる。

【００３２】例えば、補助キャッシュ２３内のデータ・
ラインは、そのデータが長時間に亙って使用されること
が無いと推測され且つそのデータの同一データ・ライン
内の他のデータが近い将来に使用されると推測される時
に、「非割当て」と印付けされる。キャッシュ・ヒット
のための更に別の情報は、「可変的取出しを伴うキャッ
シュ・メモリと置換スキーマ(Cache Memory with Varia
ble Fetch and Replacement Schemes)」に関してWillia
m R. Bryg （ウィリアム・アール・ブリッグ他に対して
与えられた米国特許第４，９２８，２３９号に説明され
ている。データ・キャッシュ１４内のデータ・ラインが
置換されることになっている時には、そのデータ・ライ
ンがデータ・キャッシュ１４と主記憶装置１１とのどち
らに移動させられなければならないかを決定するため
に、割当てビットがチェックされる。

【００３３】データ・ラインをデータ・キャッシュ１４
内に移動させる前にデータ・ラインを補助キャッシュ２
３内に移動させることが、直接マッピング・キャッシュ
に典型的に関連したスラッシング挙動を取り除く。例え
ば、ベクトル計算では、ｉ＝０〜Ｎの場合に次（１）式
のようでる。

【００３４】

【数１】

【００３５】要素Ａ［ｉ］、Ｂ［ｉ］、Ｃ［ｉ］、Ｄ
［ｉ］が同一のキャッシュ索引にマッピングされる場合
には、直接マッピングされたキャッシュだけが上記計算
の各要素に対してスラッシングを与えるだけだろう。こ
れは、このループの８回の反復において３２回のキャッ
シュミスを生じさせるだろう。しかし、補助キャッシュ
の場合には、各データラインが、他を移動させずにその
キャッシュシステム内に移される。順次３２ビットデー
タ要素であると仮定すると、そのループの８回の反復
は、最初の４つのキャッシュ・ミスだけしか引き起こさ
ない。より大きなキャッシュでもこのタイプのキャッシ
ュ・スラッシングを低減させることがないということに
留意されたい。最新のコンパイラは、スラッシングを低
減又は除去するためにデータ構造を再位置合せすること
が可能であることが多いが、適正な最適化を可能にする
ために十分なコンパイル時間情報が、アプリケーション
において常に得られることが可能であるわけではない。
補助キャッシュ２３は、最小限度のハードウェアしか必
要とせずに、コンパイラによる最適化なしにキャッシュ
・スラッシングを除去するという点で優れている。

【００３６】補助キャッシュ２３内の項目は、循環ＦＩ
ＦＯ待ち行列の形に順序付けられる。キャッシュ・ミス
又は先取りのために主記憶装置１１から要求される新た
なデータラインが、上記待ち行列の最上部に置かれ、古
い項目が上記待ち行列の最下部の外に移動させられる。
ＦＩＦＯ待ち行列内のデータ・ラインに対する消去又は
排除が、待ち行列が循環するにつれて取り除かれるバブ
ル（空白スロット）を生じさせる。３／４満杯ＦＩＦＯ
( a three quater full FIFO)を維持するための試みが
行われる。従って、典型的なミス待ち時間下で隠される
可能性がある幾つかのデータ・ラインが、ＦＩＦ０が４
８個未満の項目しか含まなくなるまで、ミスの間に補助
キャッシュ２３の外に移動させられる。この好適な実施
例では、各ミス毎に、待ち時間が、２つのデータ・ライ
ンが補助キャッシュ２３の外に移動させられることを可
能にする。

【００３７】この好適な実施例では、先取りデータ・ラ
イン用のメモリ空間を確保するように補助キャッシュ２
３の外にデータ・ラインを移動させるために、追加のマ
シン・サイクルを必要とせずに補助キャッシュ２３の中
に先取りデータのためのメモリ空間を実現にするために
は、補助キャッシュ２３が３／４満杯以下であることが
最適である。

【００３８】例えば、この好適な実施例では、後で更に
説明するように、データ・ラインが主記憶装置１１から
補助キャッシュ２３の中に先取りされることが可能であ
る。補助キャッシュ２３が満杯であり、且つ、補助キャ
ッシュ２３内に格納されなければならない先取りデータ
・ラインがある場合には、１つのデータ・ラインが補助
キャッシュ２３の外に移動させられる。しかし、補助キ
ャッシュ２３が完全に満杯ではない時には、データ・ラ
インが移動させられる必要はない。先取りデータのため
のメモリ空間を事前に作るために、ミスが発生し且つ補
助キャッシュ２３が３／４満杯以上である（即ち、全て
のバブルを含むＦＩＦＯの初めと終わりとの間に４８個
以上の項目が存在する）時には、２つのデータ・ライン
が補助キャッシュ２３の外に移動させられる。

【００３９】これに加えて、後で更に説明するように、
先取りデータがキャッシュ・ミス時に補助キャッシュ２
３内に移されることが可能である。例えば、キャッシュ
・ミス時に、プロセッサが、その次のデータ・ラインが
既に補助キャッシュ２３内に存在するかどうかを確かめ
るためにチェックを行う。そうでない場合には、プロセ
ッサが、ミスがあるデータ・ラインを先取りし、更に
は、その次のデータ・ラインを先取りする。

【００４０】この好ましい実施例では、キャッシュ・ミ
スが、単一のデータ・ラインが主記憶装置１１から先取
りされることを要求し（即ち、第２のデータ・ラインの
先取りがなく）、且つ、補助キャッシュ２３が３／４満
杯以上である場合には、２つのデータ・ラインが補助キ
ャッシュ２３の外に移動させられる。これらのデータラ
インはミス待ち時間の間に外に移動させられることが可
能であり、一方、プロセッサ１２が機能停止させられ、
データが主記憶装置１１から戻されるのを待機する。メ
モリ空間を作るためにデータ・ラインが外に移動させら
れる必要がないので、プロセッサが機能停止を回避する
が故に、後続の先取りヒットが有利である。

【００４１】データ・ラインが、次の例外を除いて、Ｆ
ＩＦＯ順にデータ・キャッシュに移される。２つのデー
タ・ラインがミス時に補助キャッシュ２３の外に移動さ
せられ、且つ、これらのデータ・ラインの両方がデータ
・キャッシュ１４内の同一の索引にマッピングされる場
合には、その第１のデータ・ラインがデータ・キャッシ
ュ１４に移され、第２のデータ・ラインが主記憶装置１
１に戻される。

【００４２】図４は、補助キャッシュ２３の単純化した
ブロック線図を示す。データ・ラインを格納するために
ＳＲＡＭ４３が使用される。ＳＲＡＭ４３内に格納され
たデータ・ラインのためのタグを格納するために、ＣＡ
Ｍ４１が使用される。ビット・メモリ４２は、様々なキ
ャッシュ制御ビットを格納するために使用される。各デ
ータ・ラインと共に格納されるキャッシュ制御ビット
は、上記の（カラム４６によって表される）割当てビッ
トと、下記の（カラム４７で表される）参照ビットとを
含む。補助キャッシュ２３からの特定のデータ・ライン
をデータ・キャッシュ１４と主記憶装置１１のどちらに
移動させるかの決定は、その特定のデータ・ラインのた
めの格納された割当てビットの値に依存する。ＦＩＦＯ
ポインタ４４は、ＦＩＦＯメモリとしてのＳＲＡＭの使
用を容易にするために、ＳＲＡＭ４３中の最初の項目の
位置と最後の項目の位置とを表示する。補助キャッシュ
がアクセスされ、キャッシュ・ミスがあることをＣＡＭ
４１が検出する時に、選択論理回路４５がデータ・パス
３３に適正なデータ・ラインを与える。

【００４３】この好ましい実施例では、データ・キャッ
シュ１４と補助キャッシュ２３とに対するアクセスがそ
の両方のキャッシュにおけるミスに起因する場合には、
プロセッサ１２が主記憶装置１１からの「ミス・データ
・ラインを要求する。そのミスデータ・ラインが主記憶
装置１１から補助キャッシュ２３内に移動させられる時
に、そのデータ・ラインのためのカラム４７内の参照
（Ｒ）ビットがセットされ、そのデータ・ラインが参照
されたことを表示する。

【００４４】これに加えて、特定のタイプのデータ・ア
クセスの場合には、キャッシュ・ミスがある時に使用さ
れる、又は、「ヒット」データ・ラインのための参照ビ
ットがゼロにセットされる補助キャッシュ１４内のデー
タ・ライン上でヒットがある時に使用される先取りアド
レスを、プロセッサ１２が生成する。一般的に、プロセ
ッサ１２によって生成される先取りアドレスは、アクセ
スされたデータ・ラインの次に続くデータ・ラインであ
る。

【００４５】キャッシュ・ミス時には、先取りアドレス
のためのデータ・ラインが既にデータ・キャッシュ１４
又は補助キャッシュ２３の内に存在するならば、更に別
の動作が行われる必要がない。先取りアドレスのための
データ・ラインが未だデータ・キャッシュ１４又は補助
キャッシュ２３の内に存在しないならば、その先取りア
ドレスのためのデータ・ラインが先取りされる。先取り
されたデータ・ラインが主記憶装置１１から補助キャッ
シュ２３の中に移される時に、その新たなデータ・ライ
ンのためのカラム４７内の参照（Ｒ）ビットがクリアさ
れ、その先取りデータ・ラインが参照されなかったこと
を表示する。

【００４６】この好適な実施例では、「未参照」と印付
けされている（即ち、その項目のためのカラム４７内の
参照ビットがクリアされている）補助キャッシュ２３内
のデータ・ライン上にキャッシュ・ヒットがあり、且
つ、プロセッサ１２が先取りアドレスを生成する時に、
プロセッサ１２が、そのデータ・ラインのためのカラム
４７内の参照ビットをセットし、そのデータ・ラインが
現時点で参照済みであるということを表示する。これに
加えて、プロセッサ１２は、先取りアドレスのためのデ
ータ・ラインが既にデータ・キャッシュ１４又は補助キ
ャッシュ２３の内に存在するかどうかをチェックする。
そうでない場合には、先取りアドレスのためのデータ・
ラインが先取りされる。先取りデータ・ラインが主記憶
装置１１から補助キャッシュ２３の中に移される時に、
その新たなデータ・ラインのためのカラム４７内の参照
（Ｒ）ビットがクリアされ、その先取りデータ・ライン
が参照されなかったことを表示する。

【００４７】データ・ラインは、主記憶装置１１からバ
ス１０を経由してプロセッサ１２に転送される。この好
適な実施例では、バス１０は６４ビット幅であり、各デ
ータ・ラインは２５６ビット幅である。従って、プロセ
ッサ１２に転送されるべき全データ・ライン１つ当たり
４つのバス・サイクルが必要である。プロセッサ実行時
間に対する影響を最小限にするために、バス１０を経由
したデータ転送が完了するまで各データ・ラインがムー
ブ・イン・バッファ４８内で併合される。そのデータ・
ライン全体がムーブ・イン・バッファ４８に転送され終
わると、そのデータ・ラインが単一のサイクルでＳＲＡ
Ｍ４３内に書き込まれる。従って、補助キャッシュ２３
は、より大きい割合の時間に亙ってプロセッサ１２にと
って使用可能である。

【００４８】上記の説明は、本発明の方法の単なる一例
と実施例とを開示し説明するものである。当業者には理
解されるように、本発明は、本発明の思想又は本質的特
徴とから逸脱することなく、他の特定の形態で具体化さ
れることが可能である。従って、本発明のこの開示内容
は、特許請求の範囲で請求される本発明の範囲を非限定
的に例示するものであることが意図されている。

【００４９】以上、本発明の各実施例について詳述した
が、ここで各実施例の理解を容易にするために、各実施
例ごとに要約して以下に列挙する。

【００５０】１．コンピュータ装置における、主記憶
装置内に格納され、かつプロセッサによって利用される
データをバッファリングするための方法であって、
（ａ）．データ・ラインを前記主記憶装置から第１のキ
ャッシュに転送する工程であって、前記データ・ライン
が前記第１のキャッシュの外に移動させられる時の前記
データ・ラインの行先を表示するための表示を前記デー
タ・ライン各々と共に前記第１のキャッシュ内に格納
し、前記表示は前記データ・ラインが第２のキャッシュ
に送られるのかどうか又は前記主記憶装置に戻されるの
かどうかを表示する前記工程と、（ｂ）．第１のデータ
ラインが前記第１のキャッシュの外に移動させられ、か
つ前記表示は前記第１のデータ・ラインが前記第２のキ
ャッシュに送られなければならないことを表示する時
に、前記第１のデータ・ラインを前記第２のキャッシュ
に移動させる工程と、（ｃ）．第２のデータ・ラインが
前記第２のキャッシュの外に移動させられ、かつ、汚染
されている時に、前記第２のデータ・ラインを前記主記
憶装置に戻す工程と、（ｄ）．前記プロセッサが第３の
データ・ラインに対するアクセスを要求する時に、前記
第３のデータ・ラインに対して平行して前記第１のキャ
ッシュと前記第２のキャッシュとを探索する工程と、を
含むキャッシュ・ミスによる時間ペナルティ減少方法で
ある。

【００５１】２．前記工程（ｄ）が、（ｄ．１）．前
記第２のキャッシュの中に索引を生成する副次的工程
と、（ｄ．２）．前記第２のキャッシュ内の第４のデー
タ・ラインにアクセスするために前記索引を使用する副
次的工程と、（ｄ．３）．前記第４のデータ・ラインが
前記第３のデータ・ラインであるかどうかを決定するた
めに、前記第４のデータ・ラインのためのタグを前記第
３のデータ・ラインのためのタグと比較する副次的工程
と、（ｄ．４）．前記第１のキャッシュ内のデータ・ラ
インのいずれかが前記第３のデータ・ラインであるかど
うかを決定するために、前記第１のキャッシュ内に格納
された個々のデータ・ラインのためのタグをチェックす
る副次的工程と、を含み、前記副次的工程（ｄ．４）が
前記副次的工程（ｄ．１）から前記副次的工程（ｄ．
３）までと共に並行して行われる上記１に記載のキャッ
シュ・ミスによる時間ペナルティ減少方法である。

【００５２】３．前記工程（ｂ）において、前記第１
のデータ・ラインが前記第１のキャッシュの外に移動さ
せられる時に前記第１のデータ・ラインが前記第１のキ
ャッシュ内の他のデータ・ラインのいずれよりも長く前
記第１のキャッシュ内に存在しているように、前記第１
のキャッシュ内のデータ・ラインが先入れ先出しの形で
処理される上記１に記載のキャッシュ・ミスによる時間
ペナルティ減少方法である。

【００５３】４．前記工程（ｂ）が、所定数よりも多
いデータラインを前記第１のキャッシュが含む時に、追
加のデータラインを前記第１のデータ・ラインと共に前
記第１のキャッシュから移動させる副次的工程を含む上
記１に記載のキャッシュ・ミスによる時間ペナルティ減
少方法である。

【００５４】５．前記工程（ｂ．１）において、上記
追加のデータ・ラインは、前記第１のデータ・ラインが
マッピングされる前記第２のキャッシュ内の記憶場所と
同一の前記第２のキャッシュ内の記憶場所にマッピング
される時に、前記第２のデータ・ラインを前記主記憶装
置に移動させる上記４に記載のキャッシュ・ミスによる
時間ペナルティ減少方法である。

【００５５】６．前記方法が更に、（ｅ）．前記工程
（ｄ）において、前記第３のデータ・ラインが前記第１
のキャッシュ内に存在せずかつ前記第２のキャッシュ内
に存在しない時に、前記主記憶装置から前記第１のキャ
ッシュに前記第３のデータ・ラインを転送する工程を含
み、この工程が更に、（ｉ）．前記第１のキャッシュ内
で、前記第３のデータ・ラインを「参照済」として印付
けする副次的工程と、（ｉｉ）．前記主記憶装置から前
記第１のキャッシュに第４のデータ・ラインを先取りす
る副次的工程と、（ｉｉｉ）．前記第１のキャッシュ内
で、前記第４のデータ・ラインを「未参照」として印付
けする副次的工程と、を含む上記１に記載のキャッシュ
・ミスによる時間ペナルティ減少方法である。

【００５６】７．前記工程（ｅ）が更に、（ｉｖ）．
前記プロセッサが前記第４のデータ・ラインに対するア
クセスを要求する時に、前記第１のキャッシュ内で、前
記第４のデータ・ラインを「参照済」として印付けし、
前記主記憶装置から前記第１のキャッシュに第５のデー
タ・ラインを先取りし、前記第１のキャッシュ内で、前
記第５のデータ・ラインを「未参照」として印付けする
副次的工程と、を含む上記６に記載のキャッシュ・ミス
による時間ペナルティ減少方法である。

【００５７】８．主記憶装置内に格納されプロセッサ
によって利用されるデータをバッファリングするために
キャッシュ・ミスによる時間ペナルティ減少方法に適用
されるキャッシュシ装置であって、データ・ラインを格
納するためのデータ・ラインメモリと、前記データ・ラ
イン・メモリ内に格納されたデータ・ラインがその第１
のキャッシュの外に移動させられる時に前記データ・ラ
インの行先を表示する表示を前記データ・ライン各々と
共に格納するための格納手段とを含む、第１のキャッシ
ュと、第２のキャッシュと、前記主記憶装置から前記第
１のキャッシュにデータ・ラインを転送するために、前
記第１のキャッシュと前記主記憶装置とに結合した第１
の転送手段と、前記第１のキャッシュの外に移動させら
れるいずれの第１のデータ・ラインのための行先も前記
格納手段内に格納された前記第１のデータ・ラインのた
めの表示の値に依存している、前記第１のキャッシュか
ら前記第２のキャッシュと前記第１のキャッシュから前
記主記憶装置とにデータ・ラインを転送するために、前
記第１のキャッシュと前記第２のキャッシュと前記主記
憶装置とに結合した第２の転送手段と、前記第２のキャ
ッシュから前記主記憶装置にデータ・ラインを転送する
ために、前記第２のキャッシュと前記主記憶装置とに結
合した第３の転送手段と、前記第１のキャッシュと前記
第２のキャッシュとに対して並行してアクセスするため
のアクセス手段と、を含む前記キャッシュ・ミスによる
時間ペナルティ減少方法に適用されるキャッシュ装置で
ある。

【００５８】９．前記アクセス手段が、前記第２のキ
ャッシュ内に索引を生成するために、前記第２のキャッ
シュに結合された索引生成手段と、前記索引生成手段に
よって生成された索引によってアクセスされたデータ・
ラインのためのタグを所期データ・ラインのためのタグ
と比較するために、前記第２のキャッシュに結合した比
較手段と、前記第１のキャッシュ内のデータ・ラインの
いずれかが前記所期データ・ラインであるかどうかを決
定するために、前記第１のキャッシュに結合した連想型
比較手段と、を含む上記８に記載のキャッシュ・ミスに
よる時間ペナルティ減少方法に適用されるキャッシュ装
置である。

【００５９】１０．前記データ・ライン・メモリが先
入れ先出し記憶装置である上記８に記載のキャッシュ・
ミスによる時間ペナルティ減少方法に適用されるキャッ
シュ装置である。

【００６０】１１．前記第２の転送手段は、前記第１
のキャッシュが予め決められた数より多い数のデータ・
ラインを含む時に１度に２つのデータ・ラインを前記第
１のキャッシュの外に移動させる上記８に記載のキャッ
シュ・ミスによる時間ペナルティ減少方法に適用される
キャッシュ装置である。

【００６１】１２．前記第２の転送手段が、前記第２
のキャッシュ内の同一の記憶場所にマッピングされた２
つのデータ・ラインを前記第１のキャッシュの外に移動
させる時に、前記第２の転送手段が前記２つのデータ・
ラインのどちらか一方を前記主記憶装置に移動させる上
記１１に記載のキャッシュ・ミスによる時間ペナルティ
減少方法に適用されるキャッシュ装置である。

【００６２】１３．主記憶装置内に格納され、かつプ
ロセッサによって利用されるデータをバッファリングす
るためにキャッシュ・ミスによる時間ペナルティ減少方
法に適用されるキャッシュ装置であって、完全連想型の
第１のキャッシュと、直接マッピング型の第２のキャッ
シュと、前記主記憶装置から前記第１のキャッシュにデ
ータ・ラインを転送するための、前記第１のキャッシュ
と前記主記憶装置とに結合した第１の転送手段と、前記
第１のキャッシュから前記第２のキャッシュにデータ・
ラインを転送するための、前記第２のキャッシュと前記
主記憶装置とに結合された第２の転送手段と、前記第２
のキャッシュから前記主記憶装置にデータ・ラインを転
送するための、前記第２のキャッシュと前記主記憶装置
とに結合した第３の転送手段と、前記第１のキャッシュ
と前記第２のキャッシュとに対して並行してアクセスす
るためのアクセス手段と、を含むキャッシュ・ミスによ
る時間ペナルティ減少方法に適用されるキャッシュ装置
である。

【００６３】１４．前記アクセス手段は、前記第２の
キャッシュ内に索引を生成するために、前記第２のキャ
ッシュに結合した索引生成手段と、前記索引生成手段に
よって生成された前記索引によってアクセスされるデー
タ・ラインのためのタグを所期データ・ラインのための
タグと比較するために、前記第２のキャッシュに結合し
た比較手段と、前記第１のデータ・キャッシュ内のデー
タ・ラインのいずれかが前記所期データラインであるか
どうかを決定するために、前記第１のキャッシュに結合
した連想型比較手段と、とを含む上記１３に記載のキャ
ッシュ・ミスによる時間ペナルティ減少方法に適用され
るキャッシュ装置である。

【００６４】１５．前記第１のキャッシュが、データ
・ラインを格納するためのデータ・ライン・メモリと、
前記データ・ライン・メモリ内に格納されたデータ・ラ
インのためのタグを格納するための内容参照可能メモリ
と、を含む上記１３に記載のキャッシュ・ミスによる時
間ペナルティ減少方法に適用されるキャッシュ装置であ
る。

【００６５】１６．前記データ・ラインメモリが先入
れ先出しメモリである上記１５に記載のキャッシュ・ミ
スによる時間ペナルティ減少方法に適用されるキャッシ
ュ装置である。

【００６６】１７．前記第１のキャッシュは更に、前
記第１のキャッシュからデータ・ラインを外に移動させ
る時の前記データ・ラインの行先を表示する表示を前記
データ・ラインメモリ内に格納された前記データ・ライ
ン各々と共に格納するための格納手段を含む上記１５に
記載のキャッシュ・ミスによる時間ペナルティ減少方法
に適用されるキャッシュ装置である。

【００６７】１８．前記第２の転送手段は、前記第１
のキャッシュが所定数より多い数のデータ・ラインを含
む時に１度に１つ以上のデータ・ラインを前記第１のキ
ャッシュの外に移動させる上記１３に記載のキャッシュ
・ミスによる時間ペナルティ減少方法に適用されるキャ
ッシュ装置である。

【００６８】１９．前記第２の転送手段は、前記第２
のキャッシュ内の同一の記憶場所にマッピングされた２
つのデータ・ラインを前記第１のキャッシュの外に移動
させる時に、前記第２の転送手段が前記２つのデータ・
ラインのどちらか一方を前記主記憶装置に移動させる上
記１８に記載のキャッシュ・ミスによる時間ペナルティ
減少方法に適用されるキャッシュ装置である。

【００６９】２０．前記第１のキャッシュが更に、前
記データ・ライン各々が参照済みであることを表示する
表示を前記データ・ライン・メモリ内に格納された前記
データ・ライン各々と共に格納するための格納手段を含
む上記１３に記載のキャッシュ・ミスによる時間ペナル
ティ減少方法に適用されるキャッシュ装置である。

【００７０】２１．前記第１の転送手段は更に、第１
のデータ・ラインに対する参照の結果として前記第１の
キャッシュ内に前記第１のデータ・ラインが入れられる
時に前記第１のデータ・ラインを前記第１のキャッシュ
内で「参照済」と印付けし、かつ先取りの結果として前
記第１のキャッシュ内に第２のデータ・ラインが入れら
れる時に前記第２のデータ・ラインを前記第１のキャッ
シュ内で「未参照」として印付けするためのものである
上記２０に記載のキャッシュ・ミスによる時間ペナルテ
ィ減少方法に適用されるキャッシュ装置である。

【００７１】２２．前記アクセス手段は更に、前記第
２のデータ・ラインが参照される時に前記第２のデータ
・ラインを前記第１のキャッシュ内で「参照済」として
印付けするためのものである上記２１に記載のキャッシ
ュ・ミスによる時間ペナルティ減少方法に適用されるキ
ャッシュ装置である。

【００７２】２３．コンピュータ装置における、主記
憶装置内に格納されプロセッサによって利用されるキャ
ッシュ・ミスによる時間ペナルティ減少方法に適用され
るデータをバッファリングするための方法であって、
（ａ）．前記主記憶装置から第１のキャッシュにデータ
・ラインを転送する工程と、（ｂ）．第１のデータ・ラ
インが前記第１のキャッシュの外に移動させられる時
に、前記第１のデータ・ラインを第２のキャッシュに移
動させる工程と、（ｃ）．第２のデータ・ラインが前記
第２のキャッシュの外に移動させられかつ汚染されてい
る時に、前記第２のデータ・ラインを前記主記憶装置に
戻す工程と、（ｄ）．前記プロセッサが第３のデータ・
ラインに対するアクセスを要求する時に、前記第３のデ
ータ・ラインを求めて前記第１のキャッシュと前記第２
のキャッシュとに対して並行して探索を行う工程と、を
含むキャッシュ・ミスによる時間ペナルティ減少方法に
適用されるデータをバッファリングするための方法であ
る。

【００７３】２４．前記工程（ｄ）が更に、（ｄ．
１）．前記第２のキャッシュの中に索引を生成する副次
的工程と、（ｄ．２）．前記第２のキャッシュ内の第４
のデータ・ラインにアクセスするために前記索引を使用
する副次的工程と、（ｄ．３）．前記第４のデータ・ラ
インが前記第３のデータ・ラインであるかどうかを決定
するために、前記第４のデータ・ラインのためのタグを
前記第３のデータ・ラインのためのタグと比較する副次
的工程と、（ｄ．４）．前記第１のキャッシュ内のデー
タ・ラインのいずれかが前記第３のデータ・ラインであ
るかどうかを決定するために、前記第１のキャッシュ内
に格納された個々のデータ・ラインのためのタグをチェ
ックする副次的工程と、を含み、前記副次的工程（ｄ．
４）が前記副次的工程（ｄ．１）から前記副次的工程
（ｄ．３）までと共に並行して行われる２３項に記載の
キャッシュ・ミスによる時間ペナルティ減少方法に適用
されるデータをバッファリングするための方法である。

【００７４】２５．前記工程（ｂ）において、前記第
１のデータ・ラインが前記第１のキャッシュの外に移動
させられる時に前記第１のデータ・ラインが前記第１の
キャッシュ内の他のデータ・ラインのいずれよりも長く
前記第１のキャッシュ内に存在しているように、前記第
１のキャッシュが先入れ先出しの形で処理される上記２
３に記載のキャッシュ・ミスによる時間ペナルティ減少
方法に適用されるデータをバッファリングするための方
法である。

【００７５】２６．前記工程（ｂ）が、所定数よりも
多いデータ・ラインを前記第１のキャッシュが含む時
に、追加のデータ・ラインを前記第１のデータ・ライン
と共に移前記第１のキャッシュから移動させる副次的工
程を含む上記２３に記載のキャッシュ・ミスによる時間
ペナルティ減少方法に適用されるデータをバッファリン
グするための方法である。

【００７６】２７．前記副次的工程（ｂ．１）は、上
記追加のデータ・ラインが、前記第１のデータ・ライン
がマッピングされる前記第２のキャッシュ内の記憶場所
と同一の前記第２のキャッシュ内の記憶場所にマッピン
グされる時に、前記第１のデータ・ラインを前記主記憶
装置に移動させることを含む上記２６に記載のキャッシ
ュ・ミスによる時間ペナルティ減少方法に適用されるデ
ータをバッファリングするための方法である。

【００７７】２８．前記データをバッファリングする
ための方法が更に、（ｅ）．前記工程（ｄ）において前
記第３のデータ・ラインが前記第１のキャッシュ内に存
在せずかつ前記第２のキャッシュ内に存在しない時に、
前記主記憶装置から前記第１のキャッシュに前記第３の
データ・ラインを転送する工程を含み、この工程が更
に、（ｉ）．前記第１のキャッシュ内で、前記第３のデ
ータ・ラインを「参照済」として印付けする副次的工程
と、（ｉｉ）．前記主記憶装置から前記第１のキャッシ
ュに第４のデータ・ラインを先取りする副次的工程と、
（ｉｉｉ）．前記第１のキャッシュ内で、前記第４のデ
ータ・ラインを「未参照」として印付けする副次的工程
と、を含む上記２３に記載のキャッシュ・ミスによる時
間ペナルティ減少方法に適用されるデータをバッファリ
ングする方法である。

【００７８】２９．前記工程（ｅ）が更に、（ｉ
ｖ）．前記プロセッサが前記第４のデータ・ラインに対
するアクセスを要求する時に、前記第１のキャッシュ内
で、前記第４のデータ・ラインを「参照済」として印付
けし、前記主記憶装置から前記第１のキャッシュに第５
のデータラインを先取りし、前記第１のキャッシュ内
で、前記第５のデータラインを「未参照」として印付け
する副次的工程を含む上記２８に記載のキャッシュ・ミ
スによる時間ペナルティ減少方法に適用されるデータを
バッファリングする方法である。

【００７９】

【発明の効果】以上のように、本発明によれば、データ
・ラインを主記憶装置から第１のキャッシュの外に移動
させる時にデータ・ラインの行先表示をデータ・ライン
のそれぞれとともに第１のキャッシュ内に格納し、この
表示はデータ・ラインが第２のキャッシュに送られるの
か、主記憶装置に戻されるのかを表示し、第１のデータ
・ラインを第１のキャッシュの外に移動させる時に第１
のデータ・ラインの行先表示が第１のデータ・ラインを
第２のキャッシュに送らなければならない表示をしてい
ると、第１のデータ・ラインを第２のキャッシュに移動
させ、第２のデータ・ラインが第２のキャッシュの外に
移動され、汚染されると第２のデータ・ラインを主記憶
装置に戻し、プロセッサが第３のデータ・ラインに対す
るアクセスを要求すると、第３のデータ・ラインに対し
て並行して第１と第２のキャッシュを探索するようにし
たので、最小量のハードウェアの追加のみで直接マッピ
ング型キャッシュにコンパイラによる最適化なしにキャ
ッシュ・スラッシングを取り除くことができる。

【図面の簡単な説明】

【図１】本発明の好適な実施例による命令キャッシュと
データ・キャッシュとを有するコンピュータ装置の単純
化したブロック図である。

【図２】本発明の好適な実施例による図１に示したプロ
セッサの単純化したブロック図である。

【図３】本発明の好適な実施例による、図１に示したコ
ンピュータ装置のためのキャッシュシ装置の単純化した
ブロック図である。

【図４】本発明の好適な実施例による、図２に示したプ
ロセッサ内の補助キャッシュの単純化したブロック図で
ある。

【符号の説明】

１０バス１１主記憶装置１２プロセッサ１３命令キャッシュ１４データ・キャッシュ２１アドレス変換バッファ２２論理演算装置２３補助キャッシュ２４命令キャッシュ・インターフェース論理回路２５データ・キャッシュ・インターフェース論理回路２６装置のバス・インターフェース論理回路３２ピット・データ・ライン３３データ・バス３４論理回路３５比較論理回路３６データ・ライン３７セレクタ４１内容参照可能メモリ４２ビット・メモリ４３スタティツク・ランダム・アクセス記憶装置４４ＦＩＦＯポインタ４５選択論理回路４６，４７カラム４８ムーブ・イン・バッファ

───────────────────────────────────────────────────── フロントページの続き (72)発明者マイケル・エイ・バックレーアメリカ合衆国コロラド州ウィンドソアーコットンウッド・ドライヴ 1109 (72)発明者ウィリアム・アール・ブリグアメリカ合衆国カリフォルニア州サラトガペレゴ・ウェイ 18630

Claims

【特許請求の範囲】

【請求項１】コンピュータ装置における、主記憶装置
内に格納され、かつプロセッサによって利用されるデー
タをバッファリングするための方法であって、（ａ）．データ・ラインを前記主記憶装置から第１のキ
ャッシュに転送する工程であって、前記データ・ライン
が前記第１のキャッシュの外に移動させられる時の前記
データ・ラインの行先を表示するための表示を前記デー
タ・ライン各々と共に前記第１のキャッシュ内に格納
し、前記表示は前記データ・ラインが第２のキャッシュ
に送られるのかどうか又は前記主記憶装置に戻されるの
かどうかを表示する前記工程と、（ｂ）．第１のデータラインが前記第１のキャッシュの
外に移動させられ、かつ前記表示は前記第１のデータ・
ラインが前記第２のキャッシュに送られなければならな
いことを表示する時に、前記第１のデータ・ラインを前
記第２のキャッシュに移動させる工程と、（ｃ）．第２のデータ・ラインが前記第２のキャッシュ
の外に移動させられ、かつ、汚染されている時に、前記
第２のデータ・ラインを前記主記憶装置に戻す工程と、（ｄ）．前記プロセッサが第３のデータ・ラインに対す
るアクセスを要求する時に、前記第３のデータ・ライン
に対して平行して前記第１のキャッシュと前記第２のキ
ャッシュとを探索する工程と、を含むキャッシュ・ミス
による時間ペナルティ減少方法。