JPH0371248A

JPH0371248A - 処理装置においてキヤツシユミス発生時の時間遅れを最少にする方法および装置

Info

Publication number: JPH0371248A
Application number: JP2175486A
Authority: JP
Inventors: Kenneth Okin; ケネス・オキン
Original assignee: Sun Microsystems Inc
Current assignee: Sun Microsystems Inc
Priority date: 1989-08-03
Filing date: 1990-07-04
Publication date: 1991-03-27
Also published as: US5361337A; AU638232B2; AU5067290A; GB2234613B; GB2234613A; HK36894A; GB9004703D0

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明はコンピュータにおいて記憶装置を管理する方法
および装置に関するものである。更に詳しくいえば、本
発明は、キャッシュミスを生じた時に状態素子のコンテ
キストを非常に高速で常に切換える方法および装置に関
するものである。

〔従来の技術〕

高速の中央処理装置用に、主コンピユータ記憶装置に加
えてキャッシュメモリを用いることはごく普通のことで
ある。キャッシュメモリというのは、主コンピユータ記
憶装置よシ小型であるが極めて高速で、処理装置と主記
憶装置の間に設けられる記憶装置である。ソフトウェア
プログラムの実行中に、キャッシュメモリは最も頻繁に
利用される命令訃よびデータを格納する。記憶装置から
情報をアクセスすることを処理装置が必要とする時は、
処理装置は主コンピユータ記憶装置をアクセスするよう
先に筐ずキャッシュメモリを調べる。

キャッシュメモリ内の命令管たはデータを処理装置がみ
つけることができない時はキャッシュミスが生じ、よシ
遅い主記憶装置をアクセスする必要がある。したがって
、キャッシュメモリはプロセッサの平均メモリアクセス
時間を短縮する。

命令の流れというのは、加算または除算のような与えら
れた処理を行うためにプロセッサによシ実行される一連
の命令である。今日筐で、プロセッサは、命令の流れに
おいてキャッシュミスに出会った時に、次の２つの動作
のいずれか１つをとる。（１）主記憶装置に対する命令
またはデータの終了まで何もしないで待つ、（２）命令
の流れの中の指令されていない他の命令を実行する。そ
れら２つのやシ方は、そのために処理装置の物理的な寸
法（不動産）を大きく増大させず、キャッシュミスによ
ってプロセッサの平均命令サイクルを長くしない限シ、
受は容れることができる。キャッシュメモリの典型的な
容量は３２に〜ＩＭバイトであって、プロセッサチップ
またはプロセッサボードに大きな場所を占めない。

〔発８Ａが解決しようとするル１１題〕しかし、プロセ
ッサが高速になるにつれて、キャッシュミス発生時にこ
うむる不利益が大きくなる。キャッシュミス発生時にこ
うむる不利益は、キャッシュミス発生時に主メモリから
必要な情報を検索するために要する時間の長さを指す。

１秒間に４０００万種類の命令を実行できる（　４０Ｍ
ＩＰＳ）典型的な４０ＭＨｚマイクロプロセッサにおい
てハ、アらゆるキャッシュミスによシこうむる不利益は
２０クロツクサイクルである。キャッシュメモリのキャ
ッシュミス発生率を１％、超高速プロセッサの１命令当
シの実行時間ｔ−１クロツクサイクルと仮定すると、そ
れらのプロセッサの命令塵すの平均クロックサイクル数
は、キャッシュミスの不利益のために１．０ではなくて
０．０１（２０）　＋０．９９（１）−１，１９である
。したがって、プロセッサは４０／１．１９冨３３．６
ＭＩＰＳの性能しか発揮できない。

高速プロセッサの命令およびメモリ動作をパイプライ、
ン構成とすることは全く一般的なことである。パイプラ
インというのは多数のタスクを同じクロックサイクルで
同時に実行できるプロセッサの能力のことである。高速
プロセッサの元の処理速度をキャッシュミスが低下させ
るのと全く同様に、キャッシュミスはプロセッサのパイ
プラインにおける障害ともなる。

高速プロセッサの速度に対するキャッシュミスの不利益
とパイプラインの障害との、悪影響のために、プロセッ
サの物理的寸法をできるだけ小さくするという従来の関
心は二義的なものにされていた。この二律背反的な問題
は、プロセッサの速度の劇的な上昇とパイプライン処理
の普及からみで避けることができない。

〔課題を解決するための手段〕

後で詳しく説明するように、キャッシュミスの発生時に
、超高速プロセッサの状態素子のコンテキストを切換え
る方法と装置を本発明は提供するものである。本発明は
、キャッシュミス発生時に第１の処理の状態を保持し、
第２の処理を１クロツクサイクル内にプロセッサが第２
の処理を実行できるようにするものである。第２の処理
が別のキャッシュミスに遭遇すると、必要なデータが主
記憶装置から検索されているならば、プロセッサは第１
の処理の実行を終了するために１クロックサイクル以内
に戻る。他の場合にはプロセッサは第３の処理を開始で
きる。状態を複製される処理の数を大きな数ｎにするこ
とは容易である。

本発明は、キャッシュミス発生時に超高速プロセッサの
状態素子のコンテキストを１クロックサイクル以内に切
換えるための方法と装置を提供するものである。今日ま
では、プロセッサがキャッシュミスに遭遇した時には、
プロセッサは何もしないか、順序を無して命令を実行す
るかであった。

プロセッサの速度が高くなるにつれて、キャッシュミス
によう受ける不利益が大きくなる。プロセッサの状態素
子のコピーを多数有し、それらのコピーをマルチプレク
サへ結合することによシ、プロセッサは現在のコンテキ
ストを保持し、新し−命令の実行を１クロックサイクル
以内に始めることができるようにするものである。ここ
に開示する本発明は、主記憶装置のアクセス時間が１５
プロセツサクロツクサイクルをこえる超高速プロセッサ
の平均命令サイクルを非常に短縮するためにとくに有用
である。

この明細書では、キャッシュミス発生時に［高速プロセ
ッサ状態素子のコンテキストを切換よる方法と装置を開
示する。本発明を完全に理解できるようにするために、
以下の説明においては、特定装置、信号およびデータ構
造等のような特定の事項の詳細について数多く述べであ
る。しかし、そのような特定の詳細事項なしに本発明を
実施できることが当業者には明らかであろう。その他の
場合には、本発明を不必要に詳しく説明して本発明をあ
いまいにしないようにするために、周知の回路、装置、
データ構造は説明しない。

〔実施例〕

第１図はプロセッサの概念的なブロック図である。レジ
スタファイル１が組合わせ論理回路３とレジスタ５へ結
合される。組合わせ論理回路３とレジスタ５はレジスタ
ファイル１からの命令を復号するためのものである。次
に、復号された命令は実行のために組合わせ論理回路Ｔ
とレジスタ９へ送られる。その後で、実行された命令の
結果が通信バスまたは命令バス８に書かれる。

第１Ｂ図はプロセッサの状態素子と無状態素子の概念的
なブロック図である。状態素子２は命令バス４ｆｔ介し
てパイプライン６へ結合される。状態素子のことを、本
発明ではプロセッサチップ上のフリップフロップおよび
レジスタを指すものとする。それらの７リツプフロツプ
やレジスタは特定のプロセスの状態を示す２進情報を貯
える。それらの状態素子はレジスタファイル、状態ピッ
ト、条件コード、プリフェッチされた命令で典型的に構
成される。他方、パイプライン６は無状態である、すな
わち、プロセスの実行中に保持しておく必要があるプロ
セス状態を示す情報をパイプラインは保持しない。はと
んどの高速プロセッサは少なくとも５段のパイプライン
を有する。パイプラインはフェッチ命令、復号命令、実
行のための待ち行列命令、実行命令、および命令の書込
み結果を含む。これ以上の詳細についてはマノ・エム・
モリス（Ｍａｎｏ＋Ｍ、Ｍｏｒｒｉｓ　）著「コンピュ
ータ・システム・アーキテクチャ（Ｃｏｍｐｕｔｅｒ　
ＳｙｓｔｅｍＡｒｃｈｉｔｅｃｔｕｒｅ）　２版、２２
章（プレンティス−ホール（Ｐｒｅｎｔｌｃｅ　−Ｈａ
ｌｌ））を参照されたい。

第２図は、パイプラインへ供給する２つのプロセスの状
態の典型的なブロック図を示す。ｎ個のプロセスが１つ
のパイプラインへ供給できること、およびプロセス同士
が供給し合えることがわかるであろう。本発明の目的は
、パイプラインを最大限に利用することによシプロセッ
サの速度を最高にすることである。したがって、キャッ
シュミス２＞Ｅ起ルトハイプラインを１つのプロセスか
う別ノプロセスへ切換える。い筐の例では、キャッシュ
ミス発生時にパイプライン６がプロセス８を実行してい
たとすると、キャッシュミス発生前のプロセス８の内容
すなわち状態を保持しながら、パイプライン６は１クロ
ックサイクル以内にプロセス１０の実行へ切換えられる
。プロセス８が主記憶装置から必要なデータを検索する
前にプロセス１゜がキャッシュミスに遭遇したとすると
、パイプライン６は１クロックサイクル以内に別のプロ
セスへ切換わる。この構造にょシ、複数のプロセス１１
のコンテキストを保存できる。

第３図はプロセッサ１３の種々の状態素子１３の詳細と
、それの実行装置の略図を示す。プリフェッチされた待
ち行列１２が記憶装置からの命令をプリフェッチし、復
号する。簡単な命令に対しては、プリフェッチされた待
ち行列は実行マイクロ命令をマイクロ命令バス１６を介
して実行装置１４へ送る。よう複雑な命令の場合には、
プリフェッチされた待ち行列１２はマイクロプログラム
の流れを開始して、マイクロプログラムシーケンサ１８
へ信号をバス１６を介して送る。アドレス翻訳器２２が
、全てのメモリ翻訳のために仮想アドレス−物理的アド
レスの翻訳を行うことによう、効率の良いオンチップメ
モリ管理を行う。キャッシュミスが起ると、プリフェッ
チされた待ち行列１２はマイクロ命令をバス１６を介し
てアドレス翻訳器２２へ送シ、次のプロセスのアドレス
を記憶装置から７エツチする。最後に、バス制御論理２
６がバスプロトコルを管理し、割込みや初期化のような
事象を認識する。

次に第３図を参照する。この図の左下隅に超高速プロセ
ッサの典型的な実行装置の詳しい略図が示されている。

書込み一読出しバッファ３０がレジスタファイル３２へ
結合される。算術論理シフト器（ＡＬＳＵ）３６が複数
のマルチプレクサ３４を介してレジスタファイル３２へ
更に結合される。

ＡＬＳＵ３６の出力は、結果バス４０へ送られる前に、
条件コードおよびその他のレジスタ３８に格納される。

本発明の原理に従って、プロセッサの各状態素子の状態
フリップフロップが二重に設けられる。

すべての二重の７リツプフロツプはマルチプレクサ２９
に結合される。したがって、第４図は、プロセッサ１３
の実行装置１４に適用された本発明を示すものである。

マルチプレクサ２９がｎ個の書込み一読出しパンツ２３
０〜３０’へ結合される。それらの書込み一読出しバッ
ファはマルチプレクサ３１を介して複数のレジスタファ
イル３２〜３２’へ結合される。データが複数のレジス
タファイル３２〜３２′からＡＬＳＵ３６へ流れる前に
、それらのデータはマルチプレクサ３３．３３’および
３４の間でチャネルに分けられる。複数の条件コードと
その他のレジスタ３８〜３８’にデータが記録される前
に、ＡＬＳＵ　３６はマルチプレクサ３７へ再び結合さ
れる。複数の状態フリップフロップの前のマルチプレク
サは、キャッシュミスが生じた時に第１のプロセスのコ
ンテキストを保持するように機能することに注目された
い。パイプラインは、更に遊びや遅れを生ずることなし
に、１クロツクサイクル以内に別のプロセスを実行でき
る。第２のプロセスが別のキャッシュミスに遭遇したと
すると、必要なデータが主記憶装置から検索されている
ならば、プロセッサは１クロツクサイクル以内に戻って
実行を終了できる。必要なデータが検索されていなけれ
ば、プロセッサは第３のプロセスを実行できる。状態が
複製されるｎ個のプロセッサを容易に節約できることが
わかる。

４０ＭＩＰＳの性能の典型的なプロセッサへ本発明を応
用し、キャッシュミス率が１％であシ、ｌ命令当りエク
ロツクサイクルであると仮定すると、あらゆるキャッシ
ュミスによる不利益は１クロツクサイクルというように
低い。プロセッサの命令当シのクロックサイクルの平均
数は０．０１（２）十０．９９（１）＝１．０１である
。したがって、プロセッサの性能は４０／１．０１　＝
３９．６ＭＩＰＳ　　である。これから、本発明によう
高速プロセッサが提供できる速度のほとんどをユーザー
が利用できることがわかる。

システムに対するメモリサイクル時間が１５プロセツサ
サイクルをこえる時に本発明は実用的である。本発明を
第１図乃至第４図を参照して説明したが、それらの図は
説明のためだけのものであって、本発明の教示を組込む
ために各種の高速プロセッサを設計できることがわかる
であろう。

【図面の簡単な説明】

第１Ａ図はプロセッサの概念的なブロック図、第１Ｂ図
はプロセッサの状態素子および無状態素子の概念的なブ
ロック図、第２図はＮ個のプロセッサのブロック図、第
３図は超高速プロセッサの状態素子の詳細説明図、第４
図は本発明の教示を利用している超高速プロセッサの実
行装置を示す。１・・・・レジスタファイル、２・・・・状態素子、３
，７・・・・組合わせ論理回路、５，９・・・・レジス
タ、８・・・・通信バス、６・・・ｅパイプライン、１
３・・・・プロセッサ、１４・・・・実行装置、１８・
・・・マイクロプログラムシーケンサ、２２・・・・ア
ドレス翻訳器、２６・・・・バス制御論理、３ａ・・・
・書込み一読出しバッファ、３６・・・・算術論理シフ
ト器。

Claims

【特許請求の範囲】

（１）複数の処理の状態素子と、パイプラインと、命令
およびデータバスと、キャッシュメモリと、主メモリと
を備える処理装置においてキャッシュミス発生時の時間
遅れを最少にする方法において、前記処理装置の前記パ
イプラインへ結合されているマルチプレクサへおのおの
結合される、前記処理装置の前記状態素子を二重にする
過程と、前記処理装置の前記状態素子のコンテキストを
記憶する過程と、キャッシュミスが生じた時に前記パイプラインにおける
第１の処理の実行を停止する過程と、命令の実行を前記
パイプライン内の複数の処理の１つへ切換える過程と、を備えることを特徴とする処理装置においてキャッシュ
ミス発生時の時間遅れを最少にする方法。
（２）複数の処理の状態素子と、パイプラインと、命令
およびデータバスと、キャッシュメモリと、主メモリと
を含む装置におけるキャッシュミス発生時にプロセッサ
の時間遅れを最少にする装置において、前記処理装置の複数の状態素子で構成され、前記パイプ
ライン内の複数の処理の内容を記憶するための二重にす
る手段と、キャッシュミス発生時に前記パイプラインにおける第１
の処理の命令の実行を停止させる停止手段と、前記二重にする手段へ結合される複数のマルチプレクサ
で形成され、前記パイプラインにおける前記第１の処理
から複数の処理の１つへ命令の実行を切換える切換え手
段と、を備えることを特徴とする処理装置においてキャッシュ
ミス発生時の時間遅れを最少にする装置。