JPH09511088A - マルチプロセッサ・システムのための高可用性のエラー自己回復共用キャッシュ - Google Patents

マルチプロセッサ・システムのための高可用性のエラー自己回復共用キャッシュ

Info

Publication number
JPH09511088A
JPH09511088A JP8531418A JP53141896A JPH09511088A JP H09511088 A JPH09511088 A JP H09511088A JP 8531418 A JP8531418 A JP 8531418A JP 53141896 A JP53141896 A JP 53141896A JP H09511088 A JPH09511088 A JP H09511088A
Authority
JP
Japan
Prior art keywords
cache
shared cache
shared
error
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8531418A
Other languages
English (en)
Inventor
デートリング、ゲルハルド
ヨルグ ゲツァラフ、クラウス
ヴィレ、ウド
レップラ、ベルン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH09511088A publication Critical patent/JPH09511088A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1405Saving, restoring, recovering or retrying at machine instruction level
    • G06F11/141Saving, restoring, recovering or retrying at machine instruction level for bus or memory accesses

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Memory System Of A Hierarchy Structure (AREA)

Abstract

(57)【要約】 密結合されたマルチプロセッサ・システムにおける高可用性の共用キャッシュはその関連したキャッシュ・ディレクトリ又はその共用キャッシュそのものにおけるエラーに対するエラー自己回復機構を与える。自己回復は、そのキャッシュの合同クラスにおけるエラーがエラー・ステータス・レジスタによって表された後、有効ビットを"0"にリセットすること及びパリティ・ビットを正しい値にセットすることによって、共用キャッシュ・ディレクトリ手段におけるそのアクセスされた合同クラスのすべてのエントリを無効にすることにより達成され、メイン・メモリに対するデータのリクエストは取り消されない。キャッシュされたデータにおける複数のビット障害は一致した列における有効ビットを"0"にセットすることによって回復される。プロセッサは、そのデータに対するリクエストを再発生する。それはそのプロセッサの専用キャッシュ及び共用キャッシュにロードされる。他のプロセッサによるこのデータに対する更なるリクエストは共用キャッシュによって処理される。

Description

【発明の詳細な説明】 マルチプロセッサ・システムのための高可用性のエラー自己回復共用キャッシュ 本発明は、密結合マルチプロセッサ・システムにおける高可用性の共用キャッ シュ・メモリに関するものであり、詳しく云えば、共用キャッシュのためのエラ ー自己回復機構に関するものである。 複数の密結合処理装置を持ったコンピュータ・システムにおける共用キャッシ ュ・メモリ・バッファの使用が従来技術において知られている。そのようなコン ピュータ・システムの例示的方法が第1図に示される。本願では、複数の処理装 置P1乃至Pn、共用キャッシュ・メモリ、及びメイン・メモリが共通のシステ ム・バスによって相互接続される。それらの処理装置は、更に、それらの処理装 置に関連付けられた、いわゆる第2レベル・キャッシュ・メモリより成る。メイ ン・メモリのアービトレーションはアービタによって得られる。その共用キャッ シュは、セット・アソシアティブ・キャッシュ・ディレクトリによって管理され る。 マルチプロセッサ・システムにおいて使用するための対応する共用キャッシュ ・メモリはヨーロッパ特許出願392184号に開示されている。このキャッシ ュ・メモリによるシ ステムのパフォーマンスの改良は次の事項によって達成される。 1.共用メモリに対するメモリ・アクセス時間の減少; 2.マルチプロセッサ相互接続ネットワークを介して経路指定されるべき共用メ モリ参照の待ち時間の減少; 3.メモリ・アクセス・タイムを減少させることによるマルチプロセッサ相互接 続ネットワークのスループットの増加; 4.共用キャッシュ・メモリ相互間のキャッシュ・コヒーレンスの必要性の回避 ; 更に、ヨーロッパ特許出願637799号は、マルチプロセッサ・システムの ための高パフォーマンス共用キャッシュに関するものであり、それは、処理装置 によってそのキャッシュをアクセスする場合に最大の並行性を与えること、各マ シン・サイクルにおいて1つのプロセッサ・リクエストをサービスすること、シ ステム応答時間を減少させること、及びシステム・スループットを増加させるこ との限りにおいて、そのマルチプロセッサ・システムをサポートする。そこに開 示された共用キャッシュは、パイプライン・キャッシュ・オペレーション、即ち 、ロード及びストアの更なるパフォーマンス最適化技法、及びバースト・モード ・データ・アクセスを使用する。組込みパイプライン・ステージを含むことによ って、そのキャッシュは、マシン・サイクル毎に1つのリクエストを任意の処理 エレメントからサービスすることを可能 にされる。これは、システム応答時間の減少及びスループットに貢献する。詳し く云えば、データのうちの或部分がキャッシュの論理回路によって保持され、一 方、システム・バス幅に対応する他の部分がリクエスト・エレメント、例えば、 プロセッサ又は記憶装置に1サイクルで転送される。データのうちの保持された 部分は次のマシン・サイクルにおいて転送可能である。 更に、ヨーロッパ特許出願348628号は、各プロセッサ中のレベル1のキ ャッシュ、各プロセッサによって共用される共用レベル2のキャッシュ・メモリ 、及びレベル3の記憶装置と呼ばれる1つのメイン・メモリより成るマルチプロ セッサ・システム設計に関するものである。レベル2キャッシュは、本来、直列 式である。これを通して、プロセッサ・リクエストは、リクエスト・ソース、L 2キャッシュ・リクエスト優先順位アルゴリズム、及びそのリクエスト・ソース を制御するために使用されるステータス情報に区分け可能である。データがL2 キャッシュにおいて更新される時、他のL1キャッシュは、それらのコピーが無 効にされるまで、修正されたデータを見てはならない。これによって記憶装置の データの整合性が達成される。 データの整合性を維持するための概念は、North-Holland社のMicroprocessing and Microprogramming誌32(1991)215-220におけるG.Doettlingによる「ストア ・イン・キャッシュ概念によるマルチプロセッサ・システムにおけるデー タ整合性(Data Consistency in a Multi-processor System with Store-In Cach e Concept)」という表題の記事から知られている。この記事は、各プロセッサに おける組み込まれたキャッシュによって、マルチプロセッサ・システムにおいて データ整合性を維持するという問題を扱っている。如何なる環境の下でもデータ の保全性を得るために、共通のシステム資源が使用される。更に詳しく云えば、 マルチプロセッサ・キャッシュ構造において使用するための、いわゆるMESI プロトコルがそこでは開示される。それは、とりわけ、キャッシュに記憶された ラインの状態を表すための有効ビット及び多重コピー・ビットを与える。 従って、共用キャッシュ・メモリは、付加された処理装置の間で共用されるデ ータへのアクセスに対して大きなパフォーマンスの改良を与える。それは、それ らのアクセスがメモリ待ち時間を含まないため、及びその共用キャッシュが共用 データを直ちには与えないためである。 例えば、処理装置がそれの専用L2キャッシュでは得られないラインをリクエ ストする場合、この「不在ラインのリクエスト」は、共用キャッシュ及びメイン ・メモリに並行して経路指定される。共用キャッシュがそのリクエストされたデ ータを与えることができる場合、メイン・メモリへのリクエスタは取り消される であろう。メイン・メモリは、共用キャッシュ・ディレクトリにおいて一致が得 られなかった場合にのみデータを与える。メイン・メモリによって与えられたデ ータは、共用キャッシュに及び専用キャッシュにも同様にロードされる。他の処 理装置によるこのキャッシュ・ラインへの更なるアクセスは共用キャッシュによ って再び処理され、上記のようにシステム全体のパフォーマンスを改良する。 それらのシステムのパフォーマンスは、その共用キャッシュのサイズを拡張す ることによって更に改良することができるが、それによって、データ・エラーの 重要性も増加するであろう。従って、本発明の目的は、マルチプロセッサ・シス テムにおける可用性を改良された共用キャッシュを提供することにある。これは 、システム・パフォーマンス及びシステム全体の可用性にとって極めて重要なこ とである。 その本発明の目的は、エラー自己回復機構によって高い可用性を与える共用キ ャッシュ・メモリの改良された設計によって解決される。これらの特徴は請求の 範囲の独立項において示される。 ストア・スルー・キャッシュでもよいこの共用キャッシュを内蔵することはシ ステムのパフォーマンスを改良するが、システムの信頼性を全く低下させるもの ではない。これは、管理装置における間欠的な障害及びキャッシュされたデータ そのものにおけるソフト・ビット障害から回復する、共用キャッシュ用の提案さ れたエラー自己回復法によって達成される。 更に、顧客のデータの喪夫はなく、しかも、エラー診断コードもエラー回復コ ードも必要ないので、システムのパフォ ーマンスは全く影響されない。 その提案されたエラー回復機構は、何らかの診断コード・サポートを持ったキ ャッシュ・ディレクトリにおけるハード・エラーから回復するように拡張可能で ある。しかし、顧客のデータの喪失はなく、パフォーマンスの低下は無視し得る ものである。 その提案されたエラー回復法のないシステムでは、それの管理装置及びキャッ シュされたデータにおけるあらゆる種類のエラーが、多岐にわたる診断及び回復 コードを必要とする壊滅的なシステム・エラーを生じさせる。しかし、その方法 によって、共用キャッシュは、ユーザにシステム問題発生を表示することなく、 及び更に重要なことには、データの如何なる喪失もなく、それの管理装置におけ る及びキャッシュされたデータにおける間欠的な障害からそれ自身で回復するこ とができる。 以下で、図面を参照して、本発明の好適な実施例を更に詳細に説明することに する。 第1図は、共用キャッシュを持った従来技術のマルチプロセッサ・システムの 概略表示である。 第2図は、本発明による共用キャッシュ編成及びデータ・フローを示すブロッ ク図である。 第3図乃至第5図は共用キャッシュによって処理されるラインフェッチ・リク エスト、共用キャッシュ・ディレクトリ におけるパリティ・エラーによるラインフェッチ・リクエスト、及び共用キャッ シュ・データにおける訂正不可能なエラーによるラインフェッチ・リクエストを 説明するタイミング図である。 A.共用キャッシュの管理装置におけるエラーからの自己回復 第2図に示された共用キャッシュ・メモリは4ウェイ・アソシアティブであり 、異なるキャッシュ・ラインA−Dを表す列0−列3より成る。本発明は共用キ ャッシュの列の番号に拘束されないこと、即ち、共用キャッシュは,n=8、1 6、等の場合のn−ウェイ・アソシアティブでよいことが注目される。このキャ ッシュの水平行は、それぞれ、キャッシュされたデータに対する、いわゆる合同 クラス、又はアドレス・クラスを定義する。プロセッサによって利用されるべき 読み出されたデータは、単一ビットのエラーを訂正し及び複数ビットのエラー( データにおける訂正不可能なエラー)を検出する、その共用キャッシュ・メモリ の下にあるエラー訂正機構(ECC)を通る。共用キャッシュは、その記憶され たデータにLRUアルゴリズムを適用するセット・アソシアティブ・キャッシュ ・ディレクトリによって管理される。このアルゴリズムは、すべてのエントリが 合同クラス内で占有される場合に置換されるべき共用キャッシュ・エントリを定 義する。 各ラインのステータスは、有効ビット(V)及び多重コピー・ビット(MC) によってキャッシュ・ディレクトリに記録される。有効ビットは、それが"1"に セットされる場合、対応するキャッシュ・ラインが実際のデータ、即ち、有効な データを含むことを表す。MCビットは、それが"1"にセットされる場合、対応 するキャッシュ・ラインが少なくとも2つのプロセッサの間で共用されることを 表す。変更ビットは、そのプロセッサに関連する専用キャッシュが変更されたラ インのデータ保全性を保つので実施されない。 共用キャッシュのキャッシュ・ディレクトリは、そのディレクトリの各エント リに対するパリティ・ビットを与える。そのパリティ・ビットは、合同クラスの すべてのエントリにおける各サーチ・アクセス時に正しいパリティに関して並行 して調べられる。 キャッシュ・ディレクトリがサーチされるサイクルにおいて合同クラスの任意 のエントリにおけるパリティ・エラーが検出される場合、一致が見つかったかど うかに関係なく(エラーの場合にそれに依存し得ないので)、次のようなエラー 自己回復機構が呼び出される。 1.共用キャッシュはエラー事象をエラー・ステータス・レジスタに記録する。 2.アクセスされた合同クラスのキャッシュ・ディレクトリにおけるすべてのエ ントリが、Vビットを"0"にリセットすることによって及びパリティ・ビットを 正しい値に セットすることによって無効にされる。 3.リクエストしたプロセッサによってメイン・メモリに配送されるデータに対 するリクエストは取り消されない。従って、メイン・メモリはリクエストされた データを供給するであろう。 4.メイン・メモリによって供給されたデータは、共用キャッシュに及びそのプ ロセッサの専用キャッシュにロードされる。 5.リクエストされたデータがプロセッサ及び共用キャッシュによって受領され た後、両方とも有効ビットを"1"にセットすることによってそれらのキャッシュ ・ディレクトリにおけるこのラインを有効にする。 6.他のプロセッサによるこのデータへの更なるアクセスは、或種の間欠的障害 によってパリティ・エラーが生じた場合、共用キャッシュによって処理されるで あろう。 サーチされた合同クラスのLRUビットにおいてパリティ・エラーが見つかっ た場合、或いは複数の列に影響する障害によって生じた一致を複数の合同クラス が表す場合、同じ機構が適応する。 管理装置のキャッシュ・ディレクトリにおけるハード障害を回避するために、 エラー・ステータス情報はそのエラーのライン・アドレス及び合同クラスを含ま なければならない。この情報は、診断コードによって周期的に、例えば、リクエ ストしたプロセッサがアイドリング状態にある時に読み出さ れなければならない。同じライン・アドレスでもって又は同じ合同クラスにおい て頻繁にエラーが見つかる場合、この情報はその一致するキャッシュ・ディレク トリ・エントリを取り除くために使用可能である。これにより、個別のアレイに おけるキャッシュ・ディレクトリ・エントリ毎に削除ビットが必要である。削除 ビットがセットされる場合、一致するキャッシュ・ディレクトリ・エントリが無 効にされ、それ以上使用されないであろう。 従って、提案された方法の場合、キャッシュ・ディレクトリにおける間欠的な エラーは如何なる診断コードもなしに回復可能である。それは、如何なるデータ の喪失もなしに及びパフォーマンスへの影響もなしに動作し続けるので、システ ムの可用性及び信頼性を改善する。キャッシュ・ディレクトリにおけるハード・ エラーは、削除ビットによってキャッシュ・ライン毎に回避可能であり、そのよ うなラインを無効にさせる。 B.共用キャッシュのデータ・ビットにおけるエラーからの自己回復 大型キャッシュの問題の1つは、例えば、宇宙線によるソフト・ビット障害で ある。そのようなエラー状態から回復するために、従来技術の共用キャッシュ・ メモリは、シングル・ビット・エラー訂正及びダブル・ヒットエラー検出(訂正 不可能なエラー)法を実施する。シングル・ビット・エラーの訂正はシステムに 影響を与えないけれども、ダブル・ビッ ト・エラーは強力な診断コードのサポートを必要とし、それによって、システム ・パフォーマンス及び可用性に影響を与える。 その提案された自己回復法は、ダブル・ビット・エラーの場合でもこの欠点を 回避する。 1.共用キャッシュはエラー事象をエラー・ステータス・レジスタに記録する。 2.エラーのラインは、キャッシュ・ディレクトリにおける対応するVビットを "0"にセットすることによって無効にされる。 3.共用キャッシュは、リクエストされたデータが供給され得ないことを、リク エストしたプロセッサに知らせる。 4.そのプロセッサはデータに対するリクエストを再び発生する。 5.共用キャッシュはそれのVビットをオフにされているので、そのリクエスト はメイン・メモリによって処理される。 6.メイン・メモリによって与えられたデータは、共用キャッシュに、及びその プロセッサの専用第2レベル・キャッシュにロードされる。 7.そのリクエストされたデータがプロセッサ及び共用キャッシュによって受領 された後、その両方とも、対応するVビットを"1"にセットすることによって、 それらのキャッシュ・ディレクトリにおけるこのラインを有効にす る。 8.訂正不可能なエラーが間欠的な問題によって生じた場合、共用キャッシュに おけるこの再ロードされたデータへの他のプロセッサによる更なるアクセスが失 敗することはないであろう。 この自己回復機構は、共用キャッシュにおける訂正不可能なビット障害から回 復するために診断コードが実行される必要がないので、システム・パフォーマン スを低下させない。更に、訂正不可能なエラーからのこのエラー回復は、非常に 信頼性のあるシステムを得るためのキーである如何なる顧客のデータの喪失もな しに働く。 第3図には、本発明による共用キャッシュによって処理されるラインフェッチ ・リクエストがタイミング図によって示される。第1サイクルでは、システム・ バスを介して共用キャッシュに接続された処理装置の1つが1つのラインに対す るリクエストを配送し、このリクエストを共用キャッシュ及びメイン・メモリに 送る。これにより、このラインは共用キャッシュにおいて既に使用可能であると 仮定され、従って、共用キャッシュ・ディレクトリにおいて遂行されるサーチは 一致を生じる。従って、ラインフェッチ・リクエストは共用キャッシュによって 処理可能であり、同じサイクルで、そのリクエストされたデータの第1ブロック がシステム・バス上に与えられる。次に続くサイクルにおいて、データに対する メモリ・リクエストは、共用キャッシュ・ディレクトリにお けるその一致のために取り消される(第3図の"*"参照)。 第4図には、共用キャッシュ・ディレクトリ又はLRUロジックにおけるパリ ティ・エラーの場合のラインフェッチが生じるもう1つの例によって、共用キャ ッシュの機能が示される。第1サイクルにおいて、ラインフェッチ・リクエスト が共用キャッシュ及びメイン・メモリに送られる。リクエストされたラインはキ ャッシュ・ディレクトリにおいて見つかるが、パリティ・チェックがそのアドレ スされた合同クラスにおいて検出される。従って、次のサイクルにおいて、デー タに対するメモリ・リクエストは、共用キャッシュ・ディレクトリ又はLRUに おけるパリティ・チェックのためには取り消されない(第4図における"*"及び 破線参照)。取消の代わりに、同じサイクルにおいて、そのアドレスされた合同 クラスにおけるすべてのキャッシュ・ディレクトリ・エントリがその対応する有 効ビットを"0"にセットすることによって無効にされる。数サイクルの後、メイ ン・メモリは、処理装置によるラインフェッチ・リクエストを処理する(第4図 の"**"参照)。この場合、データ・ブロック0−Nが共用キャッシュ及びリク エストした処理装置と関連の専用キャッシュに並行してロードされる。最後のデ ータ・ブロックNが共用キャッシュに転送されたサイクルにおいて、このライン は、共用キャッシュ・ディレクトリの対応するエントリにおける有効ビットを" 1"にセットすることによって共用キャッシュにおいて有効にされる。 もう1つの例として、共用キャッシュ・データにおける訂正不可能なエラーに よるラインフェッチ・リクエストが第5図に示される。データ転送は、第3図に 従って開始されたものと仮定する。データ・ブロック1−Nの1つ、例えば、デ ータ・ブロック2に対して、訂正不可能なエラーが検出され、それが処理装置に 信号される(第5図の"*"参照)。共用キャッシュはそれのディレクトリにおけ る対応する有効ビットを"0"にリセットする(無効にする)。 「PUへの訂正不可能なエラー」信号によって表されたその訂正不可能なエラ ーのために、プロセッサは、再びデータに対するそれのラインフェッチ・リクエ ストを再発生する。それは、共用キャッシュが前にそのデータのコピーを無効に したので、メイン・メモリによっては処理されない(第5図の"**"参照)。共 用キャッシュは、無効にするために「ディレクトリにおけるミス」を検出する。 メイン・メモリはプロセッサのラインフェッチ・リクエストを処理する(第5 図の"***"参照)データ・ブロック0・・・Nがメイン・メモリからそのリク エストしたプロセッサに転送される時、共用キャッシュは並行してロードされる 。最後のデータ・ブロックNが受領される時、共用キャッシュは、対応する有効 ビットを"1"にセットすることによってそのデータのコピーを有効にする。 この方法によって、障害が宇宙線のような間欠的な問題に よって生じた場合、そのデータのコピーをリフレッシュし、再生不可能なエラー を除去する。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ヴィレ、ウド ドイツ国ホルツゲルリンゲン、ヴェンゲル トステイク 47 (72)発明者 レップラ、ベルン ドイツ国エーニンゲン、ケーニングシュト ラーセ 93

Claims (1)

  1. 【特許請求の範囲】 1.少なくとも2つの処理装置を有するマルチプロセッサ・システムにおいて、 前記処理装置によって利用されるべき合同クラスとして情報を記憶するための高 可用性の共用キャッシュにして、 前記マルチプロセッサ・システムは、 各処理装置と関連付けられ、該処理装置によって利用されるべき情報を記憶す るためのキャッシュ手段と、 アービトレーション手段によって管理され、前記処理装置によって利用される べき情報を記憶するためのメイン・メモリ手段と、 前記処理装置、前記共用キャッシュ、及び前記メイン・メモリ手段の間で情報 を転送するためのバス手段と、 前記共用キャッシュに記憶されたすべての情報のエントリ、前記共用キャッシ ュに記憶された情報のステータスに対する有効ビット、及び前記共用キャッシュ におけるエラーを表すためのパリティ・ビットを含み、前記共用キャッシュを管 理するための共用キャッシュ・ディレクトリ手段と、 前記共用キャッシュによって与えられるエラー事象を記録するためのエラー・ ステータス・レジスタ手段と、 を含み、 情報に対するリクエストが前記共用キャッシュ及び前記メイン・メモリ手段に 並行して送られ、前記エラー・ステータ ス・レジスタ手段が前記共用キャッシュ・ディレクトリ手段における合同クラス の何れかのエントリのエラーを表す場合、前記有効ビットを"0"にリセットする ことによって及び前記パリティ・ビットを正しい値にセットすることによって前 記共用キャッシュ・ディレクトリ手段におけるアクセスされた合同クラスのエン トリをすべて無効にすることにより前記共用キャッシュの自己回復が達成される こと、及び 前記メイン・メモリ手段に対する情報のリクエストは取り消されないこと を特徴とする共用キャッシュ。 2.各処理装置と関連付けられた前記キャッシュ手段は有効ビット、多重コピー ・ビット、及び変更ビットを与え、前記共用キャッシュ・ディレクトリ手段はそ こに記憶された情報のステータスに対して多重コピー・ビットを与えることを特 徴とする請求の範囲第1項に記載の共用キャッシュ。 3.前記メイン・メモリ手段によって与えられた情報は前記共用キャッシュと前 記処理装置と関連付けられたキャッシュ手段とに並行してロードされることを特 徴とする請求の範囲第1項及び第2項の1つに記載の共用キャッシュ。 4.前記リクエストされた情報が前記リクエストした処理装置及び前記共用キャ ッシュによって受領された後、その両方が有効ビットを"1"にセットすることに よってそれらのキャッシュ・ディレクトリにおける対応するエントリを有効にす ることを特徴とする請求の範囲第3項に記載の共用キャッシ ュ。 5.エラーが表示された複数の合同クラスに対して、対応する有効ビットが"0" にセットされることを特徴とする請求の範囲第1項乃至第4項の1つに記載の共 用キャッシュ。 6.エラーのエントリが頻繁に見つかる場合、共用キャッシュ・ディレクトリ手 段の対応するエントリが削除ビットをセットすることによって取り消されること を特徴とする請求の範囲第1項乃至第5項の1つに記載の共用キャッシュ。 7.少なくとも2つの処理装置を有するマルチプロセッサ・システムにおいて、 前記処理装置によって利用されるべき情報を合同クラスとして記憶するための高 可用性の共用キャッシュにして、 前記マルチプロセッサ・システムは 各処理装置と関連付けられ、該処理装置によって利用されるべき情報を記憶す るためのキャッシュ手段と、 アービトレーション手段によって管理され、前記処理装置によって利用される べき情報を記憶するためのメイン・メモリ手段と、 前記処理装置、前記共用キャッシュ、及び前記メイン・メモリ手段の間で情報 を転送するためのバス手段と、 前記共用キャッシュに記憶されたすべての情報のエントリ、前記共用キャッシ ュに記憶された情報のステータスに対する有効ビット、及び前記共用キャッシュ におけるエラーを表すためのパリティ・ビットを含み、前記共用キャッシュを管 理 するための共用キャッシュ・ディレクトリ手段と、 前記共用キャッシュによって与えられるエラー事象を記録するためのエラー・ ステータス・レジスタ手段と、 を含み、 情報に対するリクエストが前記共用キャッシュ及び前記メイン・メモリ手段に 並行して送られ、前記エラー修正ビットによって表された前記共用キャッシュそ のものにおける複数のビット障害の場合、前記共用キャッシュの自己回復が前記 有効ビットを"0"にリセットすることによって及び前記情報を与えることができ ないことをリクエストした処理装置に知らせることによって前記共用キャッシュ ・ディレクトリ手段における対応する合同クラスの一致エントリを無効にするこ とにより達成され、それによって、前記処理装置は再び情報に対するリクエスト を発生すること及び前記リクエストは前記メイン・メモリ手段によって処理され ること、 を特徴とする共用キャッシュ。 8.各処理装置と関連付けられた前記キャッシュ手段は有効ビット、多重コピー ・ヒット、及び変更ビットを与え、前記共用キャッシュ・ディレクトリ手段はそ こに記憶された情報のステータスに対する多重コピー・ビットを与えることを特 徴とする請求の範囲第7項に記載の共用キャッシュ。 9.前記メイン・メモリ手段によって与えられた情報は前記共用キャッシュと前 記処理装置と関連付けられたキャッシュ手段とに並行してロードされることを特 徴とする請求の範囲 第7項及び第8項の1つに記載の共用キャッシュ。 10.前記リクエストされた情報が前記リクエストした処理装置及び前記共用キ ャッシュによって受領された後、その両方が有効ビットを"1"にセットすること によってそれらのキャッシュ・ディレクトリにおける対応するエントリを有効に することを特徴とする請求の範囲第7項乃至第9項の1つに記載の共用キャッシ ュ。 11.エラー自己回復機構を有し、請求の範囲第1項乃至第10項の1つに記載 されたエラー自己回復機構を有する高可用性の共用キャッシュ・メモリを含むマ ルチプロセッサ・コンピュータ・システム。
JP8531418A 1995-04-18 1995-04-18 マルチプロセッサ・システムのための高可用性のエラー自己回復共用キャッシュ Pending JPH09511088A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP1995/001453 WO1996033459A1 (en) 1995-04-18 1995-04-18 High available error self-recovering shared cache for multiprocessor systems

Publications (1)

Publication Number Publication Date
JPH09511088A true JPH09511088A (ja) 1997-11-04

Family

ID=8165994

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8531418A Pending JPH09511088A (ja) 1995-04-18 1995-04-18 マルチプロセッサ・システムのための高可用性のエラー自己回復共用キャッシュ

Country Status (4)

Country Link
US (1) US6014756A (ja)
EP (1) EP0787323A1 (ja)
JP (1) JPH09511088A (ja)
WO (1) WO1996033459A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012083992A (ja) * 2010-10-13 2012-04-26 Nec Computertechno Ltd データ障害処理装置、及びデータ障害処理方法

Families Citing this family (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6415167B1 (en) * 2000-05-02 2002-07-02 Instrumentation Metrics, Inc. Fiber optic probe placement guide
US7383069B2 (en) * 1997-08-14 2008-06-03 Sensys Medical, Inc. Method of sample control and calibration adjustment for use with a noninvasive analyzer
US6381674B2 (en) * 1997-09-30 2002-04-30 Lsi Logic Corporation Method and apparatus for providing centralized intelligent cache between multiple data controlling elements
US6480975B1 (en) * 1998-02-17 2002-11-12 International Business Machines Corporation ECC mechanism for set associative cache array
US6332181B1 (en) * 1998-05-04 2001-12-18 International Business Machines Corporation Recovery mechanism for L1 data cache parity errors
US6233680B1 (en) * 1998-10-02 2001-05-15 International Business Machines Corporation Method and system for boot-time deconfiguration of a processor in a symmetrical multi-processing system
US6401172B1 (en) * 1998-12-18 2002-06-04 Intel Corp. Recycle mechanism for a processing agent
US6594785B1 (en) * 2000-04-28 2003-07-15 Unisys Corporation System and method for fault handling and recovery in a multi-processing system having hardware resources shared between multiple partitions
US20060211931A1 (en) * 2000-05-02 2006-09-21 Blank Thomas B Noninvasive analyzer sample probe interface method and apparatus
US7606608B2 (en) * 2000-05-02 2009-10-20 Sensys Medical, Inc. Optical sampling interface system for in-vivo measurement of tissue
US20070179367A1 (en) * 2000-05-02 2007-08-02 Ruchti Timothy L Method and Apparatus for Noninvasively Estimating a Property of an Animal Body Analyte from Spectral Data
US7519406B2 (en) * 2004-04-28 2009-04-14 Sensys Medical, Inc. Noninvasive analyzer sample probe interface method and apparatus
US6862659B1 (en) * 2001-01-04 2005-03-01 Emc Corporation Utilizing disk cache as part of distributed cache
US6950978B2 (en) * 2001-03-29 2005-09-27 International Business Machines Corporation Method and apparatus for parity error recovery
US20030131277A1 (en) * 2002-01-09 2003-07-10 Taylor Richard D. Soft error recovery in microprocessor cache memories
US20050187439A1 (en) * 2003-03-07 2005-08-25 Blank Thomas B. Sampling interface system for in-vivo estimation of tissue analyte concentration
US20050054908A1 (en) * 2003-03-07 2005-03-10 Blank Thomas B. Photostimulation method and apparatus in combination with glucose determination
US8504128B2 (en) * 2002-03-08 2013-08-06 Glt Acquisition Corp. Method and apparatus for coupling a channeled sample probe to tissue
EP1499231A4 (en) * 2002-03-08 2007-09-26 Sensys Medical Inc COMPACT DEVICE FOR NONINVASIVE MEASUREMENT OF GLUCOSE BY NEAR-INFRARED SPECTROSCOPY
US20070149868A1 (en) * 2002-03-08 2007-06-28 Blank Thomas B Method and Apparatus for Photostimulation Enhanced Analyte Property Estimation
US7697966B2 (en) * 2002-03-08 2010-04-13 Sensys Medical, Inc. Noninvasive targeting system method and apparatus
US8718738B2 (en) * 2002-03-08 2014-05-06 Glt Acquisition Corp. Method and apparatus for coupling a sample probe with a sample site
US20050159656A1 (en) * 2003-03-07 2005-07-21 Hockersmith Linda J. Method and apparatus for presentation of noninvasive glucose concentration information
KR100515059B1 (ko) * 2003-07-22 2005-09-14 삼성전자주식회사 멀티프로세서 시스템 및 멀티프로세서 시스템의 캐쉬일관성 유지 방법
US7870342B2 (en) * 2003-07-24 2011-01-11 Marvell International Ltd. Line cache controller with lookahead
KR100739676B1 (ko) * 2003-07-31 2007-07-13 삼성전자주식회사 그래픽 데이터를 포함하는 정보저장매체, 그 처리장치 및처리방법
US20070234300A1 (en) * 2003-09-18 2007-10-04 Leake David W Method and Apparatus for Performing State-Table Driven Regression Testing
US7353433B2 (en) * 2003-12-08 2008-04-01 Intel Corporation Poisoned error signaling for proactive OS recovery
GB2409301B (en) * 2003-12-18 2006-12-06 Advanced Risc Mach Ltd Error correction within a cache memory
US20080033275A1 (en) * 2004-04-28 2008-02-07 Blank Thomas B Method and Apparatus for Sample Probe Movement Control
US8868147B2 (en) 2004-04-28 2014-10-21 Glt Acquisition Corp. Method and apparatus for controlling positioning of a noninvasive analyzer sample probe
US7353445B1 (en) * 2004-12-10 2008-04-01 Sun Microsystems, Inc. Cache error handling in a multithreaded/multi-core processor
US20060217602A1 (en) * 2005-03-04 2006-09-28 Alan Abul-Haj Method and apparatus for noninvasive targeting
US7437597B1 (en) * 2005-05-18 2008-10-14 Azul Systems, Inc. Write-back cache with different ECC codings for clean and dirty lines with refetching of uncorrectable clean lines
US20070022250A1 (en) * 2005-07-19 2007-01-25 International Business Machines Corporation System and method of responding to a cache read error with a temporary cache directory column delete
US20070044003A1 (en) * 2005-08-04 2007-02-22 Jack Doweck Method and apparatus of detecting and correcting soft error
US7996585B2 (en) * 2005-09-09 2011-08-09 International Business Machines Corporation Method and system for state tracking and recovery in multiprocessing computing systems
US7457985B2 (en) * 2005-09-09 2008-11-25 International Business Machines Corporation Method to detect errors in computer systems by using state tracking
US20070083867A1 (en) * 2005-09-09 2007-04-12 International Business Machines Corporation Method and system to recover from control block hangs in a heterogenous multiprocessor environment
US7502957B2 (en) * 2005-09-09 2009-03-10 International Business Machines Corporation Method and system to execute recovery in non-homogeneous multi processor environments
US7818609B2 (en) * 2006-11-27 2010-10-19 Emc Corporation Methods and systems for managing corrupted meta-data in a computer system or network
US20090019306A1 (en) * 2007-07-11 2009-01-15 Herbert Hum Protecting tag information in a multi-level cache hierarchy
US20090036759A1 (en) * 2007-08-01 2009-02-05 Ault Timothy E Collapsible noninvasive analyzer method and apparatus
US7992059B2 (en) 2007-09-11 2011-08-02 International Business Machines Corporation System and method for testing a large memory area during processor design verification and validation
US8099559B2 (en) * 2007-09-11 2012-01-17 International Business Machines Corporation System and method for generating fast instruction and data interrupts for processor design verification and validation
US8006221B2 (en) * 2007-09-11 2011-08-23 International Business Machines Corporation System and method for testing multiple processor modes for processor design verification and validation
US8019566B2 (en) * 2007-09-11 2011-09-13 International Business Machines Corporation System and method for efficiently testing cache congruence classes during processor design verification and validation
US7797650B2 (en) 2007-09-11 2010-09-14 International Business Machines Corporation System and method for testing SLB and TLB cells during processor design verification and validation
US20090070570A1 (en) * 2007-09-11 2009-03-12 Shubhodeep Roy Choudhury System and Method for Efficiently Handling Interrupts
US8977820B2 (en) * 2007-12-21 2015-03-10 Arm Limited Handling of hard errors in a cache of a data processing apparatus
JP5161696B2 (ja) * 2008-08-07 2013-03-13 株式会社日立製作所 仮想計算機システムおよび仮想計算機システムにおけるエラー回復方法ならびに仮想計算機制御プログラム
US8095831B2 (en) * 2008-11-18 2012-01-10 Freescale Semiconductor, Inc. Programmable error actions for a cache in a data processing system
US7987407B2 (en) * 2009-08-20 2011-07-26 Arm Limited Handling of hard errors in a cache of a data processing apparatus
US8190951B2 (en) * 2009-08-20 2012-05-29 Arm Limited Handling of errors in a data processing apparatus having a cache storage and a replicated address storage
US9170947B2 (en) 2011-12-29 2015-10-27 Intel Corporation Recovering from data errors using implicit redundancy
US9230037B2 (en) 2013-01-16 2016-01-05 Sap Se Identifying and resolving cache poisoning
US9535787B2 (en) * 2015-02-12 2017-01-03 International Business Machines Corporation Dynamic cache row fail accumulation due to catastrophic failure

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4084236A (en) * 1977-02-18 1978-04-11 Honeywell Information Systems Inc. Error detection and correction capability for a memory system
EP0348628A3 (en) * 1988-06-28 1991-01-02 International Business Machines Corporation Cache storage system
US5408651A (en) * 1993-09-27 1995-04-18 Bull Hn Information Systems Inc. Store "undo" for cache store error recovery
US5584013A (en) * 1994-12-09 1996-12-10 International Business Machines Corporation Hierarchical cache arrangement wherein the replacement of an LRU entry in a second level cache is prevented when the cache entry is the only inclusive entry in the first level cache
US5680577A (en) * 1995-04-27 1997-10-21 International Business Machines Corporation Method and system for processing multiple requests for data residing at the same memory address
US5740353A (en) * 1995-12-14 1998-04-14 International Business Machines Corporation Method and apparatus for creating a multiprocessor verification environment

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012083992A (ja) * 2010-10-13 2012-04-26 Nec Computertechno Ltd データ障害処理装置、及びデータ障害処理方法

Also Published As

Publication number Publication date
WO1996033459A1 (en) 1996-10-24
EP0787323A1 (en) 1997-08-06
US6014756A (en) 2000-01-11

Similar Documents

Publication Publication Date Title
JPH09511088A (ja) マルチプロセッサ・システムのための高可用性のエラー自己回復共用キャッシュ
US11693791B2 (en) Victim cache that supports draining write-miss entries
US6564306B2 (en) Apparatus and method for performing speculative cache directory tag updates
US8782348B2 (en) Microprocessor cache line evict array
EP0828217B1 (en) Cache flush apparatus and computer system having the same
US6981104B2 (en) Method for conducting checkpointing within a writeback cache
US7055003B2 (en) Data cache scrub mechanism for large L2/L3 data cache structures
US5996048A (en) Inclusion vector architecture for a level two cache
JP3067112B2 (ja) 遅延プッシュをコピー・バック・データ・キャッシュに再ロードする方法
US8190951B2 (en) Handling of errors in a data processing apparatus having a cache storage and a replicated address storage
US5913021A (en) Memory state recovering apparatus
JPH11506852A (ja) 多数のバスマスタと共用レベル2キャッシュとを備える多レベルキャッシュシステムでのキャッシュスヌーピングオーバーヘッドの低減
US5850534A (en) Method and apparatus for reducing cache snooping overhead in a multilevel cache system
US6950906B2 (en) System for and method of operating a cache
US7707463B2 (en) Implementing directory organization to selectively optimize performance or reliability
US6178484B1 (en) DCBST with ICBI mechanism to maintain coherency of bifurcated data and instruction caches
KR100297914B1 (ko) 스누핑장치를위한다중캐쉬디렉토리
WO2005121970A1 (en) Title: system and method for canceling write back operation during simultaneous snoop push or snoop kill operation in write back caches
US5920891A (en) Architecture and method for controlling a cache memory
JP3129224B2 (ja) キャッシュメモリ装置
US7055002B2 (en) Integrated purge store mechanism to flush L2/L3 cache structure for improved reliabity and serviceability
JPH02184946A (ja) キヤツシユ・バイパス装置
US7069391B1 (en) Method for improved first level cache coherency
JP3716190B2 (ja) キャッシュメモリにおけるデータアレイの訂正不能障害救済方式
JP2000339218A (ja) キャッシュメモリの障害処理装置、キャッシュメモリの障害処理方法、マルチプロセッサシステム