WO1995016959A1

WO1995016959A1 - Dispositif et procede de synchronisation des systemes a antememoire de donnees a plusieurs niveaux

Info

Publication number: WO1995016959A1
Application number: PCT/JP1994/002111
Authority: WO
Inventors: Joseph P. Bratt; John Brennan; Peter Yan-Tek Hsu; William A. Huffman; Joseph T. Scanlon; Steve Ciavaglia
Original assignee: Silicon Graphics Inc.; Kabushiki Kaisha Toshiba
Priority date: 1993-12-15
Filing date: 1994-12-15
Publication date: 1995-06-22
Also published as: HK1018166A1; CN1117767A; DE69434728D1; TW367441B; US5632025A; EP0684561A1; EP0684561A4; CN1054223C; DE69434728T2; EP0684561B1; SG75776A1; JP2631037B2; KR960701403A; US5572704A; KR0182344B1

Description

明細書スプリットレベルのデータキャッシュシステムにおける同期性のためのシステムとその方法技術分野

本発明はスプリットレベルのキヤッシュ装置を含むコンピューターシステムにおけるデータキヤッシュの同期性に関する。

背景技術

現代のコンビューターシステムは大きさ及び速度の異なる様々な記憶装置から成る記憶階層を含んでいる。かかる記憶装置には、例えば、小容量ながら高速のキヤッシュメモリ一や、'大容量ではあるが低速の主記憶装置がめる。

データはキャッシュメモリーかあるいは主記憶装置の中に見い出される。更に、（中央処理装置や入出力装置等の）複数の装置が、キャッシュメモリー及び主記憶装置の中に含まれるデータにアクセスし、更新する。このように、いつでも、データはキャッシュメモリー及びもしくは主記憶装置において一致しないか、あるいは古くなっている力、もしれない。

これはキャッシュメモリ一における同期性（ c 0 h e r e n c y ) の問題である。キャッシュの同期性の問題は、特に複数のプロセッサーが各々 1 つかそれ以上のキャッシュを含み、全てのキャッシュ間に同期性が要求されるマノレチプロセッサー · コンピューターシステムにおいて増大する。

キヤッシュの同期性を維持するシステム及びその方法は公知であり、 John L . Hennessy and David A. Patter sonの Computer Architecture - A Quantitative A p r oa ch ( コンピューターアーキテクチャー：定量的アブローチリ ( Morgan Kauf mann Publishers, Inc. San Mateo, California , U.S.A. , 1 9 9 0 年）等のように、一般に利用できる文献に記載されており、参照のためここに引用する。これら従来からのシステム及び方法はほとんどのコンピューターシステムに存在するキヤッシュの同期性の問題を解消するのに充分である。

しかしながら、新しいコンピューターァーキテクチャ一は'新型キヤッシュの同期性の問題を生じること力ある。これらのキヤッシュの同期性の問題は、検出することはもちろん、 'その解析及び解決は困難であった。従来のキャッシュの同期性技術はこれらの新型キヤッシュの同期性問題を解消するには適切でないこともあろう。

このように、スブリットレベルのキヤッシュ配列を持つコンピューターシステムに存在するキヤッシュの同期性に関する問題.を解決するためのシステム及び方法が求められている。

そこで、本発明の目的は、それぞれ少なくとも 1 つのキヤッシュを有する複数の処理装置から成るコンビューターシステムにおいて、キヤッシュメモリ一アクセス命令の実行を制御するための制御システム及び方法を提供することにある。

発明の開示

本発明によれば、マルチプロセッサ一キヤッシュの同期性はコンビユーターシステムの中で維持される。コンビューターシステムの少なくとも 1 つの処理装置が、第 2 レベルのキヤッシュに連結される第 1 レベルのキヤッシユカ、ら成るスプリットレベルのキヤッシュ配列を含む処理装置であって、整数記憶命令がデータを第 1 レベルのキヤッシュと第 2 レベルのキヤッシュに記憶することを可能にする。第 1 レべノレのキャッシュはバイト書き込み可能であり、第 2 レベルのキヤッシュはヮード書き込み可能である。

本発明の制御システムは第 2 レベルのキヤッシュのノ、' イブラインを監視して、フォースドアトミック（ F A ) 命令が第 2 レベルのキヤッシュパイプラインにあるか否かを判別する。 F A命令は第 1 レベルのキャッシュにおける記憶割当てを求める整数記憶命令であり、それはヮ一ドの整数倍以外の長さのデータが第 1 レベルのキヤッシュに記憶されることを可能にする。 F A命令実行中に、 1 つかそれ以上のバイトカ第 1 レベルのキヤッシュから読み込まれ、ヮ一ド長データが第 2 レベルのキヤッシュに書き込まれるように、 F A命令の書き込みデータに沿つて第 2 レべノレのキャッシュに書き込まれる。 F A 命令が第 2 レベルのキヤッシュパイプラインにあると判別された場合、制御システムは F A命令が第 2 レベルのキヤッシュパイブラインを出るまで、：第 2 レベルのキャッシュに対する介入を遅らせる。これは結果的に、キヤッシュメモリーアクセス命令の操作によって書き込まれるデータが F A 命令の操作によって破壊されないように、かかる介入の発生に責任があるキヤッシュメモリ — アクセス命令の実行を遅らせる。

更に、制御システムは第 2 レベルのキヤッシュを監視して、ポッシブルミス（ P M ) 命令が第 2 レベルのキヤッシュパイブラインにあるか否かを判別する。 P M命令は第 2 レベルのキヤッシュの中に記憶割当てを求めるが、第 1 レベルのキヤッシュには記憶割当てを求めないキヤッシュメモリーアクセス命令である。

P M命令が第 2 レベルのキヤッシュパイプラインの中にあると判別された場合、制御システムは F A 命令が第 2 レべノレのキヤッシュパイブラインに入らないようにする。この方法で、第 2 レベルのキャッシュに対する介入の実行が防止されないが、コンピューターシステムの処理装置間のデッドロックが防止されるように、介入が第 2 レベルのキヤッシュのために処理される間に、第 2 レベルのキヤッシュにおける命令が保留される可能性がある

更に制御システムは、整数記憶操作の書き込みデータが含まれる整列したバイ卜の整数倍のワードが第 1 レべルのキヤッシュにのみ独占されているか否かを判別する整列したヮードが第 1 レベルのキヤッシュにのみ独占的でないと判断した場合、制御システムは整数記憶操作が第 2 レベルのキヤッシュパイブラインに入らないようにし、整列したワードが第 1 レベルのキャッシュに独占されるようにキャッシュミス · フィル操作を開始する。図面の簡単な説明

図 1 は、本発明のコンピューターシステムのブロック線図である。

図 2 は、整数記憶操作がスプリツトレベルのキヤッシュ配列を持つコンピュータ一システムにおいてどのように実行されるかを示す図である。

図 3 は、スブリツトレベルのキャッシュ配列を持つコンピューターシステムの構造及び操作上の特徴の故にデ一夕が失われるシナリオを描いた図である。

図 4 は、' 本発明の好適な実施例による制御システムの操作を描ぐフローチヤ一トである。

図 5 は、本発明の好適な実施例による制御システムの操作を描くフローチヤ一トである。

発明を実施するための最良の形態

以下、本発明の好ましい実施例を添付の図面を参照しながら詳細に説明する。なお、図面において、同じ参照符号は同じか又は機能的に類似するエレメントを示す。 1 . ハードウユアを取り巻く環境

図 1 は、本発明が好適に動作することのできるコンビユーターシステム 1 0 1 の部分的ブロック図である。なお、当業者なら認識できるように、コンピューターシステム 1 0 1 は図 1 に示したもの以外の構成部材を含む。

コンビユーターシステム 1 0 1 はノくス 1 2 6 に接続される処理装置 1 0 2 を有する。処理装置 1 0 2 は R I S C (Reduced Instruction Set Computer) 、縮小命令セットコンビユーター）プロセッサ一であることが好ましいが、その代わりに別のタイプのコンピューターァーキテクチャ一を持つプロセッサ一であってもよい。 R I S C コンピュータープロセッサ一については参照のため引用する以下の文献に記載されている。すなわち、 G. Kane and J . Hemrich, MIPS RISC Architecture (Prentice Hall , Englewood Cliffs , New Jersey, U.S.A. , 1992 ) ； Mike Johnson , Superscalar Microprocessor Design (Prentice Hall , Englewood Cliffs, New Jersey, U.S. A . , 1991) ；及び Stephen B . Furber , VLSI RISC Archit ecture and Organization (Marcel Dekker , Inc. , New York , New York, U.S.A. , 1989 )に言己載されている。

処理装置 1 0 2 は、整数操作を実行するための整数機能単位（ I U ：明快には図 1 に図示されていない）、及び浮動小数点操作を実行するための浮動小数点機能単位 ( F P U ：明快には図 1 に図示されていない）等の複数の機能単位（ F U ： functional unit) 1 0 4 を含む。

処理装置 1 0 2 は、データキャッシュ 1 0 8 のような第 1 レべノレのキヤッシュと、グローバノレキヤッシュ 1 1 2 のような第 2 レベルのキャッシュから成るスプリットレベルのキャッシュ配列を含む。一般的に、データキヤッシュ 1 0 8 はグローノくノレキャッシュ 1 1 2 より小さい (データキャッシュ 1 0 8 の好ましい大きさは 1 6 キロノィトであり、グロ一ノくルキヤッシュ 1 1 2 の好ましい大きさは 1 6 メガノくイトである）。データキャッシュ 1 0 8 にはグローバノレキヤッシュ 1 1 2 に記憶されるデー夕のサブセットが入っている。通常データキャッシュ 1 0 8 はグローバルキヤッシュ 1 1 2 より操作が高速である

データキャッシュ 1 0 8 は処理装置 1 0 2 において I U と同じコンビユーターチップ上に形成されることが好ましい（従って、データキャッシュ 1 0 8 は「オンチップキヤッシュ」とも呼ばれる）。グローバルキヤッシュ 1 1 2 は処理装置 1 0 2 において機能単位 1 0 4 の外部にあることが好ましい（従って、グロ一ノノレキャッシュ 1 1 2 は「オフチップキャッシュ」とも呼ばれる）。整数データはデータキヤッシュ 1 0 8 の中にある。浮動小数点データはグローバルキャッシュ 1 1 2 の中にある。更にグローバルキャッシュ 1 1 2 は整数データ用の第 2 レベルの記憶単位でもある。整数記憶操作は整数デ一夕がデータキヤッシュ 1 0 8 とグローバルキヤッシュ 1 1 2 の両方に記憶されるようにする。浮動小数点記憶操作はデータキャッシュ 1 0 8 を迂回して、浮動小数点データがグローバノレキャッシュ 1 1 2 に記憶されるようにする。

好ましくは、データキャッシュ 1 0 8 は非ワード書き込みを支持する。データキヤッシュ 1 0 8 は異なる非ヮ - ド書き込み長の書き込みを支持してもよいが、好ましくはデータキャッシュ 1 0 8 はバイト書き込みを支持する。つまり、データは 1 、°ケッ卜でデータキヤッシュ 1 0 8 に書き込むことができる。換言すれば、データキャッシュ 1 0 8 は好ましくはバイ卜書き込み可能である。グローバノレキャッシュ 1 1 2 は卜書き込みを支持しない。その代わりに、グローバルキャッシュ 1 1 2 はワード書き込みを支持し、その場合ワードは 4 バイトであることが好ましい。換言すれば、グロ一バノレキャシュ 1 1 2 はヮード書き込み可能である。

バイト書き込みではなく、ワード書き込みを支持す έ ことにより、より少ない R A Μ ( ランダムアクセスメ -モリー）を使用してグローバルキャッシュ 1 1 2 を実行することが可能であり、それにより処理装置 1 0 2 の費用を削減する。ワード書き込みを支えるよりバイト書き込みを支える場合に、パリティ一の度合いが大きくなるので、事実その通りである。例えば、ワード力 3 2 ビットであり、グロ一ノレキャッシュ 1 1 2 が 4 ビッ卜の書き込み幅を持つ R A Mを用いて実行される場合、バイト書き込みが支持される時に各 2 データ R A M毎に 1 パリティ一の R A Mが必要となる。これに対して、ワード書き込みが支持される時は、各 8 データ R A M毎に 1 パリティ一の R A Mが必要となる。

上述したように、整数記憶操作により整数データがデ一夕キャッシュ 1 0 8 とグローバノレキャッシュ 1 1 2 の両方に記憶されるようになる。更に上述のように、データキャッシュ 1 0 8 はバイト書き込みを支持し、グロ一バルキヤッシュ 1 1 2 はヮ一ド書き込みを支持する。

図 2 はグロルキャッシュ 1 1 2 に対して 1 トの整数記憶操作が実行される様子を図示している。図 2 においてデータキヤッシュ 1 0 8 は複数の列から成るものとして概念的に描かれており、各列が整列した 4 バ卜のデータワードを含んでいる。

1 バイトの整数記憶操作の操作中に、 1 バイト（これは整数記憶操作の「書き込みデタ」を表す）がデータキャッシュ 1 0 8 の 1 つの列に書き込まれる。更に、この列の他の 3 バイトカデータキヤッシュ 1 0 8 から読み込まれ、これら 3 バイトが整数記憶操作のバイト（つまり、書き込みデータ）と適切に結合されて、データヮードを形成する。このヮードはその後グロ一バルキヤッシュ 1 1 2 に記憶される。

データキヤッシュ 1 0 8 及びグローバルキヤッシュ 1 1 2 へのデータ記憶はパイプライン化される。データキャッシュ 1 0 8 及びグ.口一ノくルキャッシュ 1 1 2 に関連するデータ記憶パイプライン（データキヤッシュパィプラインは図 1 において 1 0 6 で示され、グローバルキヤッシュパイブラインは図 1 において 1 1 0 で示される）は、グローバルキャッシュ 1 1 2 に対する浮動小数点ミスが実現される前に、データキヤッシュ 1 0 8 に対する整数記憶が実行されるようになっている。このように、データキャッシュ 1 0 8 に対する記憶を実行した後、またグローバルキャッシュ 1 1 2 に対する（浮動小数点ミスの実現を含む）浮動小数点の記憶を完了する前に、整数記憶命令を「取り消し」することはできない。

スプリットレベルのキャッシュ配列は、更に、「スプリットレベルキヤッシュ」と題した米国特許出願において論じられている。

再び図 1 において、コンピュータ一システム 1 0 1 は、処理装置 1 1 4 のようなバス 1 2 6 に接続される付加的な処理装置を含む。これらのバス 1 2 6 に接続される付加的な処理装置（処理装置 1 1 4 ）は、スプリツトレベルのキヤッシュ配列を持っていてもよいし、あるいは他のタイプのキヤッシュ配列（かかるキヤッシュ配列は整数データと浮動小数点データの両方を記憶できなければならない）であってもよい。説明のために、処理装置 1 0 2 を第 1 の処理装置 1 0 2 と呼び、処理装置 1 1 4 を第 2 の処理装置 1 1 4 と呼ぶこともある。

コンビュ一ターシステム 1 0 1 はマルチプロセッサ一データの同期性を維持する。つまり、バス 1 2 6 に接続される処理装置間に分配され、記憶される整数及び浮動小数点のデータの同期性はコンビユーターシステム 1 0 1 によって維持される。コンピュータ一システム 1 0 1 はこのデータ同期性を維持するためにキヤッシュ同期性メカニズム（図示せず）を含む。

キヤッシュ同期性のためのシステム及び方法は公知であり、上記において引用した Computer Architecture A Quantitative Approach ( コンピューターァーキテクチヤー、定量的アプローチ）等の、多くの一般に利用できる文献に記載されている。かかる公知のキヤッシュ同期性技術はコンビユーターシステム 1 0 1 のキヤッシュ同期性メ力二ズムの多くの局面を実行するために使用することができる。

本発明者はコンビユーターシステム 1 0 1 の特別な構造上及び操作上の特徴、特に上述のスブリットレベルキャッシュ配列に起因する、コンピュータ一システム 1 0 1 におけるキヤッシュ同期性に関連する問題を特定しきた。更に発明者はこれらのキャッシュ同期性に関連-する問題に対する解決策を発展させてきた。これらのキヤッシュ同期性に関連する問題は今まで特定されたことはなく、従って今までに解決されてもいない。

本発明者により特定されたキヤッシュ同期性に関連する問題、及び本発明者が発展させたこれらの問題に対する解決法について以下に詳細に論じる。

2 . 0 データロスの問題

コンピュータ一システム 1 0 1 の特別な構造上及び操作上の特徴の結果として、 1 つのプロセッサ一によりキャッシュに記憶されたデータが他のプロセッサーの操作により破壊される可能性がある。特に、このデータロスの問題はコンピューターシステム 1 0 1 の次の特徴によるものである。すなわち、（ 1 ) スプリットレベルのキャッシュ配列、（ 2 ) データキャッシュ 1 0 8 とグロ一バルキャッシュ 1 1 2 の書き込み度合いの違い（つまり、データキヤッシュ 1 0 8 はバイト書き込みを支持する一方、グロ一バルキャッシュ 1 1 2 はワード書き込みを支持する）、（ 3 ) コンピュータ一システム 1 0 1 のマルチプロセッサ一の同期性要件、及び（ 4 ) データキヤッシュ 1 0 8 に対する整数記憶がグロ一バルキャッシュ 1 1 2 に対する浮動点ミスの実現の前に実行されるという図 3 はこのデータロスの問題が発生するシナリオを描いており、第 1 の処理装覃 1 0 2 におけるグローノルキャッシュ 1 1 2 の選択された内容と、バス 1 2 6 に接続される（図 1 に示されていない）別の処理装置のキヤッシユカ 4 つの異なる時間 t 0 、 t 1 、 t 2 、 t 3 ( これらの時間は必ずしもお互いに等間隔でなくてもよい）で示されている。この別の処理装置のキャッシュはバイト書き込みを支持するものとする。

時間 t 0 において、第 1 の処理装置 1 0 2 にあるグロ一ノルキャッシュ 1 1 2 はノ《イト値 A 、 B 、 C 、 D を持つ整列した 4 バイトヮード 3 0 2 を記憶する。このヮ一ドの独占的コビ一（つまり、コンピュータ一システム 1 0 1 における唯一有効なコピー）が第 1 の処理装置 1 0 2 のグローバルキャッシュ 1 1 2 に入っていると仮定する。従って、このワード 3 0 2 は図 3 に示した他の処理装置のキヤッシュにおいては利用できない。

時間 0 と t 1 の間の任意の時に、第 1 の処理装置 1 0 2 の機能単位 1 0 4 が、第 1 の処理装置 1 0 2 のデータキャッシュ 1 0 8 及びグローバルキャッシュ 1 1 2 に記憶されたデータワード 3 0 2 に対して、バイト " Y " を書き込むように整数記憶命令を発する。この整数記憶命令の処理は第 1 のプロセッサ一 1 0 2 のデータキヤッシュ 1 0 8 力、らバイト A、 C、 D を読み込ませ、整数記憶命令に関連してバイト " Y " と適切に結合させる。

更に時間 t 0 と t 1 の間に、他の処理装置内の機能単位がバイト " X " をデータワード 3 0 2 に書き込むよう記憶'命令を発する。しかしな力ら、. デ一ダワード 3 0 2 は他の処理装置のキヤッシュにおいて有効ではなく、独占されていないので、キヤッシュミスメッセージが他の処理装置により発せられる。すなわち、コンピュータ一システム 1 0 1 においては、データが独占的である場合にのみキヤッシュのデータに書き込みができる。

キヤッシュミスメッセージの結果として、デ一タワード 3 0 2 の独占的コピーが第 1 の処理装置 1 0 2 から他の処理装置に伝えられる。それで、他の処理装置における記憶命令が完了し、バイト " X " がデータワード 3 0 2 のノィ卜の 1 つに記憶される。これらの動作は、図 3 に示すように、時間 t 1 までに完了する。時間 t 1 と t 2 の間の任意の時に、結合されたバイト A、 Y、 C、 D が第 1 の処理装置 1 0 2 のデータキヤッシュ 1 0 8 に書き込まれる用意が整う。しかしな力ら、データヮード 3 0 2 は第 1 の処理装置 1 0 2 のデ一タキャッシュ 1 0 8 において有効ではなく、独占されていないので、キヤッシュミスメッセージが第 1 の処理装置 1 0 2 により発せられる。キャッシュミスメッセージの結果、データワード 3 0 2 の独占的コピーが他の処理装置から第 1 の処理装置 1 0 2 へと伝えられる。図 3 に示すように、これらの動作は時間 t 2 までに完了する。

時間 2 と t 3 の間の任意の時に、第 1 の処理装置 1 0 2 においてペンディングになっている整数記憶命令が完了し、ノイト A、 Y、 C、 D がデータワード 3 0 2 に記憶される。他の処理装置によりデータヮード 3 0 2 に書き込まれたバイト " X " は、第 1 の処理装置 1 0 2 の操作により破壊されていることに注意すべきである。このように、コンピューターシステム 1 0 1 の特別な構造上及び操作上の特徴の結果、 1 つのプロセッサ一によりキヤッシュに記憶されたデータは別のプロセッサーの操作により破壊される。

コンピュータ一システム 1 0 1 の詳細かつ包括的な分折の結果、本発明者によりデータロスの問題が特定され、理解された。データロスの問題は特定するのが難しく、ましてや組み合わされて問題を作り出す（上述の）要素の多重性及び複雑さを考えれば、理解し解決するのはなおさら困難である。

3 . 0 本発明によるデータロス問題の解決

データロスの問題を解決するために本発明者が開発した解決法について以下に論じる。

データロスの問題は、データロスの問題を引き起こすかもしれないキヤッシュメモリーアクセス命令が最小単位的に（ a t o m i c a 1 l y ) 実行されることを確実にすることによって解決される。特に、データロス問題を引き起こすかもしれないキヤッシュメモリーアクセス命令が、データキャッシュ 1 0 8 内の（ 3 バイ卜の）読み込みの開始からグローバルキャッシュ 1 1 2 内の（ 4 バイトの）書き込み完了に至るまで最小単位的に実行される。換言すれば、データロスの問題を引き起こす力、もしれないキヤッシュメモリーアクセス命令力グロ一バルキャッシュ 1 1 2 のノ、' イブライン 1 1 0 に入る点力、ら、命令力グローバルキヤッシュ 1 1 2 のパイプラインを出る点まで、最小単位的に実行される。かかる命令の最小単位的実行中は、介入は許されない。

当業者に公知のように、介入はプロセッサ一 Xのために実行され、プロセッサ一 Yのキヤッシユカ、らデータを読み込むことを含み、かかるデータはプロセッサーのキヤッシュを更新するために用いられる。介入はコンビユーターシステムにおけるキヤッシュ間の同期性を維持するために必要である。

例えば、図 3 に示したシナリオを考えてみょう。上述 ― i s ―

したように、時間 0 において、第 1 の処理装置 1 0 2 内のグローバルキャッシュ 1 1 2 はノ《イト値 A、 B、 C、 D を持つ整列した 4 バイトヮ一ド 3 0 2 の独占的コピー ( e c 1 u s i v e c o p y ) を言己憶する。 1 の処理装置 1 0 2 において機能単位 1 0 4 の 1 つにより時間 t 0 と t 1 の間に発せられる整数記憶命令は、データキャッシュ 1 0 8 からノイト A、 C、 D のメモリー読み込みを開始させる。

本発明によれば、この時点で、整数記憶命令はグロ一バルキャッシュ i 1 2 に対する介入が阻止される最小単位的実行部分に入っている。従って、他の処理装置は、第 1 の処理装置 ' 1 0 2 においてペンディングになっている整数記憶命令が完了するまで（つまり、バイ A、 Y、 C、 D がグローバルキャッシュ 1 1 2 に記憶されるまで）、データワード 3 0 2 を修正する機会を持たない。

この第 1 の処理装置 1 0 2 においてペンディングになつている整数記憶命令が完了した後、データワード 3 0 2 の独占的コピーが他の処理装置に伝えられる。つまり、ペンディングになっている記憶命令が完了し、グロ一ノルキャッシュ 1 1 2 のパイプラインを出た後、グローバノレキヤッシュ 1 1 2 に対する介入が許される。その後、データワード 3 0 2 がバイト A、 Y、 X、 D を含むように、バイト " X " がデータワード 3 0 2 に書き込まれる。

従って、本発明の操作により、 1 つのプロセッサー (つまり、図 3 の例において他のプロセッサー）によりキヤッシュに記憶されたデータは、別のプロセッサー (つまり、図 3 の例において第 1 の処理装置 1 0 2 ) の操作によって破壊されない。

上述したように、本発明はデータロスの問題を引き起こすかもしれないキヤッシュメモリ一アクセス命令が最小単位的に実行されることを確実にすることによって、データロスの問題を解決する。これらの命令は、上述したように最小単位的に実行されるように強制されるので、フォースドアトミック（ F A ： forced atomic) 命令と呼ばれる。

データロスの問題の解決策の一部として、発明者は F A命令を整数記憶命令（つまり、整列したワードブロック以外のものを記憶するデータキヤッシュ 1 0 8 とグロ一ノくルキヤッシュ 1 1 2 の両方にデータを記憶することを求めるキヤッシュメモリ一アクセス命令）を含むものとして特定した。好ましい態様では、グローバルキヤッシュ 1 1 2 のデータ記憶幅は 4 バイトであり、 F A命令は整列した 4 バイトのブ口ック以外のものを記憶するか、あるいは整列した 4 バイ卜の倍数以外のものを記憶する整数記憶命令である。かかる命令はデータキャッシュ 1 0 8 における記憶割当てを要求し、データキャッシュ 1 0 8 力バイトを検索するためにアクセスし、 4 バイ卜の記憶をグロ一バルキャッシュ 1 1 2 に書き込むことを要求する。

データロスの問題のこの解決法について以下により詳細 3冊しる

4 . 0 デッドロックの問題

上述したように、データロスの問題は F A命令を特定し、 F A命令を最小単位的に実行することにより.解決される。しかしながら、下記に述べるように、 F A命令の最小単位的実行は新しい問題を生み出し、それはコンビユーターシステム 1 0 1 における処理装置のデッドロックの可能性を含んでいる。

デッドロックの問題には 2 つの局面があり、それらはポテンシャノレミス命令によるデッドロックと、フォースドアトミック命令を実行する時にデータの独占性に対する要求によるデッドロックである。デッドロックの問題の.これらの局面について、以下に説明する。

4 . 1 ポテンシャノレミス命令によるデッドロック

デッドロックを生じさせる F A命令の実行を含むシナリオについて、図 1 に関連して説明する。

時間 t 0 において、浮動書き込み命令が第 1 の処理装置 1 0 2 において開始されると仮定する。同様に、浮動書き込み命令が第 2 の処理装置 1 1 4 においても開始されると仮定する。上述したように、浮動書き込み命令はデータキャッシュ 1 0 8 、 1 2 0 を迂回して、グローノルキャッシュ 1 1 2 、 1 2 4 に直接進む。

時間 t 1 において、ペンディングになっている浮動書き込み命令が第 1 の処理装置 1. 0 2 において完了しておらず、 F A整数書き込み命令が第 1 の処理装置 1 0 2 において開始されていると仮定する。第 1 の処理装置 1 0 2 における F A整数書き込み命令の処理中に、データキャッシュ 1 0 8 の読み込み操作が開始されて、適切な 3 バイトを検索し、グローバルキャッシュ 1 1 2 に対して来るべき 4 バイトの書き込みを行う。このように、これら 3 バイトを含む（更に、 F A整数書き込み命令の書き込みデータを含む）整列した 4 バイトワードに関して、グローバルキャッシュ 1 1 2 における介入が阻止される。

更に、時間 t 1 において、第 2 の処理装置 1 1 4 においてペンディングになっている浮動書き込み命令が完了しておらず、 F A整数書き込み命令が第 2 の処理装置 1 1 4 において開 ½されていると仮定する。第 2 の処理装置 1 1 4 における F A整数書き込み命令の処理中に、デ一夕キャッシュ 1 2 0 の読み込み操作が開始されて、適切な 3 バイトを検索し、グロ一バルキヤッシュ 1 2 4 に対して来るべき 4 バイ卜の書き込みを行う。このように、これら 3 バイトを含む（更に、 F A整数書き込み命令の書き込みデータを含む）整列した 4 バイトワードに関して、グローバルキヤッシュ 1 2 4 における介入が阻止される。

時間 t 2 において、第 1 の処理装置 1 0 2 においてべンディングになっている浮動書き込み命令のために、キャッシュミスが実現されると仮定する。つまり、浮動書き込み命令により修正されるべきデータは第 1 の処理装置 1 0 2 のグロ一ノルキヤッシュ 1 1 2 において有効ではなく、独占的ではない。更に、このデータは第 2 の処理装置 1 1 4 のグロ一ノルキヤッシュ 1 2 4 において有効であり、独占されていると仮定する。このように、第 1 の処理装置 1 0 2 においてペンディングになっている浮動書き込み命令を完了するために、第 2 の処理装置 1 1 4 のグロ一ノくルキヤッシュ 1 2 4 における介入が求められる。しかしながら、この介入は第 2 の処理装置 1 1 4 におけるペンディング中の F A整数書き込み命令の最小単位的実行のために阻止されている。

更に、時間 2 において、第 2 の処理装置 1 1 4 においてペンディングになっている浮動書き込み命令のために、キャッシュミスが実現されると仮定する。つまり、浮動書き込み命令により修正されるべきデータは第 2 の処理装置 1 1 4 のグロ一ノくルキヤッシュ 1 2 4 において有効ではなく、独占的ではない。更に、このデータは第 1 の処理装置 1 0 2 のグローバルキヤッシュ 1 1 2 において有効で'あり、独占されていると仮定する。このように、第 2 の処理装置 1 1 4 においてペンディングになつている浮動書き込み命令を完了するために、第 1 の処理装置 1 0 2 のグローノくルヰャッシュ 1 1 2 における介入が求められる。しかしながら、この介入は第 1 の処理装置 1 0 2 におけるペンディング中の F A整数書き込み命令の最小単位的実行のために阻止されている。

このように、第 1 の処理装置 1 0 2 は封鎖され、第 2 の処理装置 1 1 4 からのデータに頼り、第 2 の処理装置 1 1 4 は封鎖され、第 1 の処理装置 1 0 2 からのデータに頼る。しかしながら、第 1 の処理装置 1 0 2 からのデ一夕は第 1 の処理装置 1 0 2 の封鎖が解けるまでは利用できない。同様に、第 2 の処理装置 1 1 4 からのデータは第 2 の処理装置 1 1 4 の封鎖が解けるまでは利用できない。従って、第 1 の処理装置 1 0 2 と第 2 の処理装置 1 1 4 との間にはデッドロック状態が存在する。

4 . 2 本発明によるデッドロックの問題（ポテンシャルミス命令）の解決法

このデッドロックの問題を解決するために発明者達が開発した解決法について説明する。

発明者により特定されたように、このデッドロックの問題に関して関係のあるキヤッシュメモリーアクセス命令には 2 つのカテゴリーがある。第 1 の命令カテゴリ一' はデータロスの問題をじるかもしれないキヤッシュメモリーアクセス命令を含む。これらの命令はフォースドァトミック（ F A ) 命令と呼ばれ、上記において限定し説明した。

第 2 の命令カテゴリ一はデータキャッシュ 1 0 8 、 1 2 0 における記憶割当てを要求せず（つまり、デ一タキャッシュ 1 0 8 、 1 2 0 にデータを記憶せず）、直接グ口一ノくノレキャッシュ 1 1 2 、 1 2 4 にアクセスするキヤッシュメモリーアクセス命令を含む。これらはデ一タキャッシュ 1 0 8 、 1 2 0 に記憶割当てを求める F A命令とは異なる。 - 1 — グロノレキャッシュ 1 1 2 1 2 4 のパイブラインにおいて F A命令がグローバルキヤッシュミスを発生させることはできない（し力、し、以下のセクションにおげるこの話題に関する論議を参照のこと）。 F A命令はデ — タキャッシュ 1 0 8 1 2 0 において記憶割当てを求めるので、またデータキャッシュ 1 0 8 1 2 0 が各々グロ一ノレキャッシュ 1 1 2 1 2 4 において記憶されるデータの適切なサブセットを記憶するので、事実その通りである。

対照的に、第 2 の命令カテゴリ一の命令はデータキヤッシュ 1 0 8 1 2 0 に記憶割当てを求めないので、グローバルキャッシュミスを発生させることができる。従つて、第 2 の命令カテゴリーの命令はポテンシャノレミス ( P M ) 命令と呼ばれる o

実際には、第 1 の命令カテゴリーもしくは第 2 の命令カテゴリ一に属さないキヤッシュメモリ一アクセス命令を含む第 3 の命令カテゴリ一がある。第 3 の命令カテゴリーの命令は第 1 の命令カテゴリーの命令もしくは第 2 の命令カテゴリ一の命令と同グループにすることができる。かかるグル一ビングは例えば、性能を高めるために行われる。第 3 の命令カテゴリーの命令ほデッドロックの問題の解決には関連しないので、これ以上論じることはしない。

—旦 F A及び P M命令カテゴリーを特定すると、発明者はデッドロックの問題を完全に分析し、デッドロックの問題を解決するための手順を発明することができた。特に、発明者はデッドロックの問題が、ポテンシヤノレミス命令の後フォースドアトミック命令が続く場合にのみ潜在的に発生すると断定した。より詳細には、処理装置 1 0 2 に関して説明すると、発明者はデッドロックの問題が、 P M命令が既にグロ一ノくルキヤッシュ 1 1 2 のノィプラインにある場合に、 F A命令力グローバルキヤッシュ 1 1 2 のパイブラインに入ることが許された場合にのみ潜在的に発生すると断定した。

上述のシナリオにおいて、例えば、時間 0 において開始された浮動書き込み命令が P M命令を表す。時間 1 で開始された整数書き込み命令が F A命令を表す。

このように、本発明によれば、デッドロックの問題は、 P M命令がグロ一ノくルキヤッシュ 1 1 2 のパィプラインに既に存在しない場合にのみ、 F A命令がグロ一バルキャッシュ 1 1 2 のパイプラインに入ることを許すことによって、避—けることができる。 P M命令がグロ一バルキャッシュ 1 1 2 のパイブラインにまだ存在する場合は、 F A命令を遅らせる。

デッドロックの問題（つまり、部分的にポテンシャルミス命令による）に対するこの解決法についてより詳細に説明する。

4 . 3 フォースドアトミック命令を実行する時に、デ一夕の独占性に対する要求に起因するデッドロック

上記ではポテンシヤノレミス命令の実行によるデッドロック問題について説明したが、以下にはフォースドアトミック命令を実行する際にデータの独占性を要求することに起因するデッドロックの問題について説明する。このデッドロックの問題はポテンシヤノレミスデッドロックの問題に類似している。

上述したように、処理装置 1 0 2 に関して説明すると、グローバノレキャッシュ 1 1 2 がデータの独占的コピーを記憶している場合にのみ（つまり、グローバルキヤッシュ 1 1 2 がデータの有効なコピーを記憶している場合にのみ）、グローバルキャッシュ 1 1 2 にデータを書き込むことができる。浮動小数点書き込みがグ口一バルキヤッシュ 1 1 2 に対して行われ、問題のデータの独占的コピ一がグローノルキヤッシュ 1 1 2 に記憶されていない場合、キャッシュミス · フィル操作（つまり介入）を実行しなければならない。

コンピューターシステム 1 0 1 において、第 1 の処理装置 1 0 2 において行われる 1 バイ卜の F A整数書き込み操作は、データキャッシュ 1 0 8 とグローバルキヤッシュ 1 1 2 に対する書き込みを行わせる。本発明によれば、データキャッシュ 1 0 8 に対する書き込みに関連して、問題のデータバイト（つまり、整数書き込み操作により修正されるデータキヤッシュ 1 0 8 におけるバイト）は、データキャッシュ 1 0 8 において独占されるキヤッシュブロックにあること力求められる。そうでなければ、整数書き込み操作の処理を進行させることが許されない。キヤッシュブ口ック幅は本発明の範囲及び精神から逸脱することなく、他の値であってもよいが、キャッシュブロック幅は 1 2 8 ノくィトであることが好ましい。

発明者は、（問題のデータバイトが含まれる）整列した 4 ノくィトワードの他の 3 バイトと共に、問題のデータノくィ卜がデータキヤッシュ 1 0 8 において独占されるキャッシュブ口ックの中にある場合にのみ、整数書き込み操作力グロ一ノくルキャッシュ 1 1 2 のノ、。イブラインに入ることが許されるべきであると断定した。そうでなければデッドロックが発生するかもしれない。

これらの 4 バイ卜がデータキャッシュ 1 0 8 において独占されない場合にも、. 整数書き込み操作がグローバルキヤッシュ 1 1 2 のパイブラインに入ることが許されるシナリオを考えてみょう .₀ このシナリオでは、これら 4 ノくィトが更にグローバノレキャッシュ 1 1 2 においても独占されないと仮定する。整数読み込み操作がグロ一バルキヤッシュ 1 1 2 のパイプラインの端に到達した時、キャッシュミス · フィノレ操作（つまり介入）が発生する。

従って、このシナリオでは、 F A命令はグローノノレキャッシュ 1 1 2 においてミスを発生させるので、ポテンシャルミス命令の性質を含む。その結果として、 F A命令はグローバルキャッシュ 1 1 2 に対する介入を阻止し、別の処理装置からの独占性に頼ることができるので、デッドロックの可能性が存在する。

4 . 4 本発明によるデッドロックの問題（データ独占性要件）に対する解決法

本発明によれば、このデッドロックの問題はデータキャッシュ 1 0 8 における記憶に関して独占的配置を求めることにより解決される。特に、問題の整列した 4 バイトヮードが含まれるキャッシュブロックが、データキヤッシュ 1 0 8 において独占される場合にのみ、 F A整数書き込み操作がデータキヤッシュ 1 0 8 において実行される。そうでなければ、キャッシュミス · フィル操作が発生する。このキャッシュミス · フィル操作が発せられる時には、 F A整数書き込み命令はグローバルキヤッシュ 1 1 2 に対するノ、。イブラインの中にはないこと、そしてこのキヤッシュミス · フィル操作は最小単位的に行われないことに注目すべきである。このようにして、デヅドロックの危険が回避される。

デッドロックの問題（つまり独占性要件に起因する）に対するこの解決法について以下に詳細に説明する。 5 . 0 解決法及び解決法の実行のまとめ

上述したように、コンビュ一ターシステム 1 0 1 の特別な構造上及び操作上の特徴が、多くのキヤッシュ同期性に関連する問題を引き起こしてきた。発明者はこれらの問題を特定し、これらの問題を除去するためのシステム及び方法を開発した。本質的に、本発明のシステム及び方法は、以下の 3 つのルールを実行することにより、キャッシュメモリーアクセス命令の実行を制御する（説明を簡潔にするため、処理装置 1 0 2 に関してこれらのルールを説明する）。

( 1 ) (データワードを修正するために動作する） F A命令がグローバノレキャッシュ 1 1 2 のパイブラインにある場合、 F A命令が完了してグローバルキャッシュ 1 1 2 のノ、 °ィプラインを出るまでは、データヮ一ドに関する（つまり、データワードを参照する）グローバルキヤッシュ 1 1 2 に対する介入を遅らせる。あるいは、 F A 命令がグローノ《ノレキャッシュ 1 1 2 のパイブラインにある場合、 F A命令が完了してグロ一バルキヤッシ.ュ 1 1 2 のパイプラインを出るまでは、全グローバルキヤッシュ 1 1 2 に対する介入を遅らせる。

( 2 ) P M命令がグロ一ノルキャッシュ 1 1 2 のノィプラインにある場合、 F A命令はグローバルキヤッシュ 1 1 2 のパイプラインに入ることが許されない。かかる F A命令は遅延される（つまり、それらは阻止され、後の時藺に再度開始される）。

( 3 ) F A 命令に関連する整列したワードがデータキャッシュ 1 0 8 において独占されない場合、 F A命令はグローバノレキャッシュ 1 1 2 に対するノイブラインに入ることが許されず、非最小単位的キャッシュミス · フィルが発生する。

ルール（ 1 ) はデータロスの問題を解決する。ノレール ( 2 ) はデッドロックの問題（ポテンシャノレミス）を解決する。ノレール（ 3 ) はデッドロックの問題（データ独占性の要件）を解決する。本発明は更に次の 4 番目のルールを含む。すなわち、グローバルキャッシュ 1 1 2 において介入がペンディングになっている場合、 F A命令はグローバルキヤッシュ 1 1 2 のパイプラインに入ることが許されない。その代わりに、 F A命令はペンディングになっている介入の全てが完了するまで遅延される。

この 4 番目のルールは上述した問題を解決するために使用するのではない。むしろ、この 4 番目のルールは性能を向上させることを目的とするものである。 4 番目のルールは介入が F A命令によって永久に阻止されることはなく、その代わりに処理される機会が与えられることを保証する。

ルーノレ（ 1 ) 、（ 2 ) 、（ 4 ) はグローバルキヤッシュ 1 1 2 のパイブラインに入る各々の命令に F A ビットと P M ビットを追加することにより実行することが好ましい。命令がフォースドア卜ミック命令であれば、その F A ビットを 1 に設定することが好ましく、そうでなければ 0 に設定する。同様に、命令がポテンシャルミス命令であれば、その P M ビットを 1 に設定することが好ましく、そうでなければ 0 に設定する。

制御システム 1 5 0 は命令がグロ一バルキャッシュ 1 1 2 のパイプラインに入る時にそれらを監視することが好ましい（制御システム 1 5 0 と処理装置 1 0 2 のエレメント間の制御線は明瞭にするために図示していない）。制御システム 1 5 0 の操作について図 4 に示したフローチヤ一トを参照して説明する。

制御システム 1 5 0 がグ口一《ノレキヤッシュィブラインに 1 に設定された F A ビットを伴う命令を検出すれば（ステップ 4 0 4 で示す）、制御システム 1 5 0 はグローバルキヤッシュ 1 1 2 の中の適切なデータ（つまり、注目の整列した 4 ビットワード）に対する介入を阻止する（ステップ 4 0 6 で示す）。これで第 1 のルールが実行される。

同様に、制御システム 1 5 0 がグロ一バルキャッシュ 1 1 2 に対して介入がペンディングになっていると判断すれば（ステップ 4 1 2 で示す）、制御システム 1 5 0 は F A命令がグ b—ノくルキヤッシュ 1 1 2 のパイプラインに入ることを防止する（ステップ 4 1 0 で示す）。制御システム 1 5 0 は介入の未決に関する知識を持ったコンピューターシステム 1 0 1 の他の構成部材と接触していると仮定する。これで第 4 のルールが実行される。

制御システム 1 5 0 力《グローバノレキヤッシュパィブラインに 1 に設定された P M ビットを伴う命令を検出すれば（ステップ 4 0 8 で示す）、制御システム 1 5 0 は F A命令がグローバノレキヤッシュパイプラインに入ることを防止する（ステップ 4 1 0 で示す）。これで第 2 のルールが実行される。

ルーノレ（ 3 ) はデータキャッシュ 1 0 8 において各々のキャッシュブロック（これは 1 2 8 バイト幅であることが好ましい）に W (書き込み可能）ビットを追加することによって実行することが好ましい。キャッシュプロックがデータキャッシュ 1 0 8 に独占されていれば、デ一夕キャッシュ 1 0 8 の中のキャッシュブロックと関連する W ビットが 1 に設定されることが好ましい。そうでなければ 0 に設定する。制御システム 1 5 0 の更なる動作について、図 5 に示したフローチャートを参照して説明する。

制御システム 1 5 0 はデータキャッシュ 1 0 8 において処理される整数記憶命令（つまり、データキャッシュ 1 0 8 のパイプラインにおいて処理される整数記憶命令）を監視する。 F A 命令と関連する整列した 4 バイトヮ一ドが、データキャッシュ 1 0 8 にお-いて独占されるキヤッシュブロックにある場合（キャッシュブロックと関連する W ビットにより示されるように；このテストはステップ 5 0 4 で表す）、 F A 命令はグローバルキヤッシュ 1 1 2 のパイプラインに入ることを許され、ここで説明する制御シーステム 1 5 0 の他の処理に賦される（これはステップ 5 1 0 で表す）。

F A 命令と関連する整列した 4 バイトヮードがデータキャッシュ 1 0 8 において独占されないキヤッシュブ口ックの中にあれば（このテストはステップ 5 0 4 で表す） F A 命令はグロ一ノレキャッシュ 1 1 2 の 'ィプラインに入ることを許されず（ステップ 5 0 6 で表す）、キャッシュミス · フィルメッセージ力グロ一バノレキヤッシュ 1 1 2 に送られる（ステップ 5 0 8 で表す）。制御システム 1 5 0 は上述したように操作するハードウェアステートマシンとして実装されることが好ましく、特に上述した 4 ルールに従って実装されることが好ましい。あるいは、制御システム 1 5 0 はソフトウェアに従つて動作するプロセッサーとして実装される。

制御システム 1 5 0 はデータキヤッシュ 1 0 8 を含む整数機能単位（ I U ) の一部として、（スプリットレべルのキャッシュ配列を持つ）処理装置の各々に実装されることが好ましい。あるいは、制御システム 1 5 0 は機能単位 1 0 4 の外部にある構成部材として、（スブリツトレベルのキヤッシュ配列を持つ）処理装置の各々に実装される。あるいは、制御システム 1 5 0 はスプリットレベルのキヤッシュ配列を含むコンビューターシステム 1 0 1 の処理装置の各々に分散される多重ステートマシンとして実装される。

制御システム 1 5 0 はハードウエア開発者が開発できるようにする適当なコンノ、。イラ一システムと、ソフトゥエアにおけるプロトタイブハードウヱァ回路を使用して開発されることが好ましい。かかるコンパイラーシステムにおいて、ハードウェア構成部材の機能性は翻訳言語を使用して表すことができる。かかるコンパイラーシステムは論理を立証するために使用でき、制御信号及び関連するランダム論理のタイミングと世代を限定する際の助けとなる。かかるコンパイラーの 1 つは力リフオノレニァサンホセの Cadence Design Systems , Inc. (こよる Ve r i l ogコンノヽ。ィラ一である。

本発明の実施に関する詳細は本明細書における説明に基づけば、当業者にとって自明であろう。

上記において本発明の様々な態様を説明してきたが、それらは例として挙げたものであり制限的なものではないことを理解すべきである。

このように、本発明によれば、データロスやデッド口ックを惹起することなく、スプリツトレべノレのキヤッシュ配列をもつコンピューターシステムに存在するキヤッシュの同期性に関する問題を解決することができる。

Claims

請求の範囲

1 . 各々が少なくとも 1 つのキヤッシュを有する複数の処理装置から成るコンピューターシステムにおいてデ一夕ロスを防止する方法において、マルチプロセッサ一キヤッシュの同期性がコンビユーターシステムの中で維持され、少なくとも 1 つの処理装置が、第 2 レベルのキャッシュに連結される第 1 レベルのキヤッシユカ、ら成るスプリットレベルのキャッシュ配列を含み、整数記憶命令がデータを第 1 レベルのキヤッシュと第 2 レベルのキャッシュに記憶することを可能にし、第 1 レベルのキヤッシュはバイ卜書き込み可能であり、第 2 レベルのキヤッシュはヮード書き込み可能である方法であって、該方法は、

( a ) 第 2 レベルのキヤッシュのパイブラインを監視して、フォースドアトミック（ F A ) 命令が第 2 レベルのキヤッシ―ュパイブラインにあるか否かを判別するステッブを含み、 F A命令は第 1 レベルのキャッシュにおける記憶割当てを求める整数記憶命令であり、それはヮードの整数倍以外の長さのデータが第 1 レベルのキヤッシュに記憶されることを可能にし、 F A命令実行中に、 1 つかそれ以上のバイ卜が第 1 レベルのキャッシュから読み込まれ、ヮード長データが第 2 レベルのキヤッシュに書き込まれるように、 F A命令の書き込みデータに沿つて第 2 レベルのキヤッシュに書き込まれ、 ( b ) F A命令が第 2 レベルのキヤッシュパイブラインにあると判別された場合、 F A命令が第 2 レベルのキャッシュノ《イブラインを出るまで、第 2 レべノレのキヤッシュに対する介入を遅らせ、それによつてキヤッシュメモリーアクセス命令の操作によって書き込まれるデータが F A命令の操作によって破壊されないように、かかる介入の原因となったキヤッシュメモリ一アクセス命令の実行を遅らせるステップを含むことを特徵とするコンビユーターシステムにおいてデータロスを防止する方法。

2 . ( c ) 第 2 レベルのキャッシュに対する介入がベンディングになっているか否かを判別するステップと、

( d ) 第 2 レベルのキヤッシュに対する介入がペンディングになっている場合、第 2 レベルのキャッシュに対する介入実行が第 2 レベルのキヤッシュパイブラインにおける F A命令の存在によりいつまでも遅らされること力ないように、 ' F A 命令力第 2 レベルのキヤッシュノィプラインに入ることを防止するステップとを更に含むことを特徵とする請求の範囲第 1 項に記載の方法。

3 . 前記ステップ（ a ) は、

命令が F A命令であるか否かを識別する第 2 レベルのキヤッシュパイプライン標識に入る命令と関連させるステツプと、

第 2 レベルのキヤッシュにある命令の前記標識を分析し、 F A命令が第 2 レベルのキヤッシュパイブラインにあるか否かを判別するステップとを含むことを特徴とする請求の範囲第 1 項に記載の方法。

4 . 前記標識が第 2 レベルのキャッシュパイブラインに入る各々の命令に関連するフォースドアトミック（ F A ) ビットから成り、 F A ビットは F A命令用の第 1 の値に設定され、また非 F A命令用の第 2 の値に設定されることを特徴とする請求の範囲第 3 項に記載の方法。

5 . 前記ステップ（ b ) において、第 2 レベルのキヤッシュの中で F A命令の書き込みデータが入っている整列したマルチバイ卜ワードにアクセスする介入を、 F A 命令が第 2 レベルのキヤッシュパイブラインを出るまで遅らせる請求の範囲第 1 項に記載の方法。

6 . 各々が少なくとも 1 つのキャッシュを有する複数の処理装置から成るコンピューターシステムにおいて処理装置間のデッドロックを防止する方法において、マルチプロセッサーキヤッシュの同期性がコンピュータ一システムの中で維持され、少なくとも 1 つの処理装置が、第 2 レベルのキヤッシュに連結される第 1 レベルのキヤッシュから成るスプリットレベルのキヤッシュ配列を含み、第 1 レベルのキヤッシュはバイ卜書き込み可能であり、第 2 レベルのキャッシュはワード書き込み可能である方法であって、該方法は、

( a ) 第 2 レベルのキャッシュのパイプラインを監視して、ポッシブルミス（ P M ) 命令が第 2 レベルのキヤッシュパイブラインにあるか否かを判別するステッブを含み、この P M命令は第 2 レベルのキヤッシュの中に記憶割当てを求めるが、第 1 レベルのキャッシュには記憶割当てを求めないキヤッシュメモリ一アクセス命令でありヽ

( b ) コンピューターシステムの処理装置間のデッドロックが防止されるように、介入が第 2 レベルキヤッシュのために処理される間、第 2 レベルのキャッシュにおける命令が保留される可能性がある間は、第 2 レベルのキヤッシュに対する介入の実行が妨げられないように、 P M命令が第 2 レベルのキヤッシュパイブラインの中にあると判別された場合、フォースドアトミック（ F A ) 命令が第 2 レベルのキヤッシュパイプラインに入らないようにし、 F A命令はデータを第 1 レベルのキヤッシュ第 2 レベルのキャッシュの両方に記憶することを可能にするキャッシュメモリ一アクセス命令であって、第 1 レベルのキヤッシュに.記憶されるデータはヮードの整数倍以外の長さのデータであり、第 2 レベルのキャッシュに対する介入は、 F A命令が第 2 レベルのキヤッシュパイブラインの中にある間は許可されないステップを含むことを特徴とするコンビューターシステムにおいて処理装置間のデッドロックを防止する方法。

7 . 前記ステップ（ a ) は、

命令が P M命令であるか否かを識別する第 2 レベルのキヤッシュパイプライン標識に入る命令と関連させるステツフと、

第 2 レベルのキヤッシュにある命令の前記標識を分析し、 P M命令が第 2 レベルのキヤッシュノイブラインにあるか否かを判別するステップとを含むことを特徴とする請求の範囲第 6 項に記載の方法。

8 . 前記標識が第 2 レベルのキヤッシュパイブラインに入る各々の命令に関連するポテンシャルミス（ P M ) ビッ卜から成り、 P M ビットは P M命令用の第 1 の値に設定され、また非 P M命令用の第 2 の値に設定されることを特徴とする請求の範囲第 7 項に記載の方法。

9 . 各々が少なくとも 1 つのキャッシュを有する複数の処理装置から成るコンピューターシステムにおいてキャッシュメモリ一アクセス命令の実行を制御する方法において、マルチプロセッサ一キヤッシュの同期性力コンピューターシステムの中で維持ざれ、少なくとも l の処理装置が、第 2 レベルのキヤッシュに連結される第 1 レべノレのキヤッシュから成るスプリットレべノレのキヤッシュ配列を含み'、第 1 レべノレのキャッシュはバイ卜書き込み可能であり、第 2 レベルのキヤッシュはヮード書き込み可能であり、スプリツトレベルのキャッシュ配列はデータを第 1 レベルのキヤッシュと第 2 レベルのキヤッシュの両方に記憶させるようにする整数記憶操作を支持し、整数記憶操作の実行中に、 1 つかそれ以上のバイトが第 1 レベルのキヤッシユカ、ら読み込まれ、ヮード長デ — 夕が整数記憶操作の結果として第 2 レベルのキヤッシュに書き込まれるように、整数記憶操作の書き込みデ一夕に沿って第 2 レベルのキヤッシュに書き込まれ、かかる整数記憶操作の実行は最小単位的（ a t o m i c a 1 1 y ) に行われるようにした方法であって、該方法は、

( a ) 整数記憶操作の書き込みデータが入っている整列したマルチバイトヮ一ドが第 1 レベルのキヤッシュにのみ存在するか否かを判別するステップと、

( b ) 整列したヮードが第 1 レベルのキヤッシュにのみ独占的でないと判別された場合、整数記憶操作が第 2 レベルのキヤッシュのパイプラインに入ることを防止し、キヤッシュミス · フィル操作を開始させて整列ヮ一ドが第 1 レベルのキヤッシュにのみ存在するようにさせるステツプとを含むことを特徵とするコンビユーターシステムにおいてキヤッシュメモリ ^ " アクセス命令の実行を制御する方法。

1 0 . 前記ステップ（ a ) は、

整列ヮ一ドが第 1 レベルのキヤッシュにのみ存在するか否かを識別する第 1 レベルキヤッシュ標識にある整列したマルチバイトヮードと関連し、標識は第 1 レベルのキヤッシュに記憶されるステップと、

第 1 レベルキヤッシュに記憶された前記標識を分析して、整数記憶操作の書き込みデータが入っている整列したマルチバイトヮードが第 1 レべノレキャッシュにのみ存在するか否かを判別するステップとを含むことを特徴とする請求の範囲第 9 項に記載の方法。

1 1 . 前記標識が各々第 1 レベルキャッシュにおいて整列したマルチバイトヮ一ドと関連する書き込み可能 ( W ) ビッ卜から成り、 W ビットは第 1 レベルキヤッシュにおいて独占される整列ヮ一ド用の第 1 の値に設定され、第 1 レベルキヤッシュにおいて独占されない整列ヮ一ド用の第 2 の値に設定されることを特徴とする請求の範囲第 1 0 項に記載の方法。

1 2 . 各々が少なくとも 1 つのキャッシュを有する複数の処理装置から成るコンピューターシステムにおいてキヤッシュメモリーアクセス命令の実行を制御する方法において、マルチプロセッサ一キヤッシュの同期性がコンビューターシステムの中で維持され、少なくとも 1 つの処理装置が、第 2 レベルのキャッシュに連結される第 1 レべノレのキヤッシユカ、ら成るスブリットレべノレのキヤッシュ配列を含み、整数記憶命令がデータを第 1 レベルのキヤッシュと第 2 レベルのキヤッシュに記憶することを可能にし、第 1 レベルのキャッシュはノくィ卜書き込-み可能であり、第 2 レベルのキヤッシュはヮード書き込み可能である方法であって、該方法は、

( a ) 第 2 レベルのキヤッシュパイプラインを監視して、フォースドアトミック（ F A ) 命令が第 2 レベルのキヤッシュパイプラインにあるか否かを判別するステツプを含み、この F A命令は第 1 レベルのキャッシュにおける記憶割当てを求める整数記憶命令であり、それはヮ ― ドマルチプル以外の長さのデータが第 1 レベルのキヤッシュに記憶されることを可能にし、 F A命令実行中に、 1 つかそれ以上のバイ卜が第 1 レべノレのキヤッシュから読み込まれ、ヮード長データが第 2 レベルのキヤッシュに書き込まれるように、 F A 命令の書き込みデータに沿つて第 2 レベルのキヤッシュに書き込まれ、

( b ) 第 2 レベルのキヤッシュのパイプラインを監視して、ポッシブルミス（ P M ) 命令が第 2 レベルのキヤッシュパイプラインにあるか否かを判別するステップを含み、この P M命令は第 2 レベルのキヤッシュの中に記憶割当てを求めるが、第 1 レベルのキャッシュには記憶割当てを求めないキヤッシュメモリ一アクセス命令であり、

( c ) P M命令が第 2 レベルのキヤッシュパイプラインの中にあると判別された場合、 F A 命令が第 2 レベルのキヤッシュパイプラインに入ることを防止するステツブと、

( d ) F A 命令が第 2 レベルのキヤッシュパイプラインにあると判別された場合、 F A 命令が第 2 レベルのキャッシュパイプラインを出るまで、第 2 レベルキヤッシュに対する介入を遅らせるステップとを含むことを特徴とするコンピュータ一システムにおいてキヤッシュメモリ一アクセス命令の実行を制御する方法。

1 3 . ( e ) 第 2 レベルのキャッシュに対する介入力ペンディングになっているか否かを判別しするステップと、

( f ) 第 2 レベルのキヤッシュに対する介入がペンディングになっている場合、第 2 レベルのキヤッシュに対する介入実行が第 2 レベルのキヤッシュパイブラインにおける F A命令の存在によりいつまでも遅らされることがないように、 F A命令が第 2 レベルのキヤッシュパイプラインに入ることを防止するステップとを更に含む請求の範囲第 1 2 項に記載の方法。

1 4 . ( e ) 整数記憶操作の書き込みデータが入っている整列したマルチバイトヮードが第 1 レベルのキヤッシュにのみ存在するか否かを判別するステップと、

( f ) 整列したワードが第 1 レベルのキャッシュにのみ独占的でないと判別された場合、整数記憶動作が第 2 レベルのキヤッシュパイブラインに入ることを防止し、キヤッシュミス · フィル操作を開始させて整列ヮードが第 1 レベルのキヤッシュにのみ存在するようにするステップ'とを更に含む請求の範囲第 1 2 項に記載の方法。

1 5 . 各々が少なくとも 1 つのキャッシュを有する複数の処理装置から成るコンビユーターシステムにおいてキヤッシュメモリーアクセス命令の実行を制御するための制御システムにおいて、マルチプロセッサ一キヤッシュの同期性がコンピューターシステムの中で維持され、少なくとも 1 つの処理装置が、第 2 レベルのキャッシュに連結される第 1 レベルのキヤッシュから成るスプリットレベルのキヤッシュ配列を含み、整数記憶命令がデータを第 1 レべノレのキヤッシュと第 2 レべノレのキヤッシュの両方に記憶することを可能にし、第 1 レベルのキヤッシュはバイト書き込み可能であり、第 2 レベルのキヤッシュはワード書き込み可能であり、該制御システムは、第 2 レベルキャッシュのパイプラインを監視して、フオースドアトミック（ F A ) 命令が第 2 レベルのキヤッシュパイブラインにあるか否かを判別する手段を含み、この F A命令は第 1 レベルのキヤッシュにおける記憶割当てを求める整数記憶命令であり、それはワードの整数倍以外の長さのデータが第 1 レベルのキヤッシュに記憶されることを可能にし、 F A命令実行中に、 1 つかそれ以上のバイ卜が第 1 レベルのキャッシュから読み込まれ、ヮード長データが第 2 レベルのキヤッシュに書き込まれるように、 F A命令の書き込みデータに沿って第 2 レべルのキヤッシュに書き込まれ、

第 2 レベルのキヤッシュパイプラインを監視して、. ポッシブノレミス（ P M ) 命令が第 2 レベルのキャッシュノ、' ィプラインにあるか否かを判別する手段を含み、この P M命令は第 2 レベルのキヤッシュの中に記憶割当てを求めるが、第 1 レベルのキャッシュには記憶割当てを求めないキヤッシュメモリーアクセス命令であり、

P M命令が第 2 レベルのキヤッシュノ、'イブラインの中にあると判別された場合、 F A命令が第 2 レベルのキヤッシュパイブラインに入ることを防止する手段と、

F A命令が第 2 レベルのキヤッシュパイプラインにあると判別された場合、 F A命令が第 2 レベルのキヤッシュノイブラインを出るまで、第 2 レベルキヤッシュに対する介入を遅らせる手段とを含むことを特徴とする制御システム。

1 6 . 第 2 レベルのキャッシュに対する介入がペンディングになっているか否かを判別する手段と、

第 2 レベルのキヤッシュに対する介入がベンディングになっていると判別された場合、第 2 レベルのキヤッシュに対する介入実行が第 2 レベルのキヤッシュパイブラィンにおける F A命令の存在によりいつまでも遅らされることがないように、 F A命令が第 2 レベルのキヤッシュパイプラインに入ることを防止する手段とを更に含むことを特徴とする請求の範囲第 1 5 項に記載の制御システム。

1 7 . 整数記憶操作の.書き込みデータが入っている整列したマノレチノくィトヮードが第 1 レべノレのキヤッシュにのみ存在するか否かを判別する手段と、

整列したヮ一ドが第 1 レベルのキヤッシュにのみ独占的でないと判別された場合、整数記憶操作が第 2 レべルのキヤッシュのパイプラインに入ることを防止し、キヤッシュミス · フィル操作を開始させて整列ヮードが第 1 レベルのキヤッシュにのみ存在するようにさせる手段とを含むことを特徴とする請求の範囲第 1 5 項に記載の制御システム。