JPH07248970A - キャッシュメモリ装置 - Google Patents

キャッシュメモリ装置

Info

Publication number
JPH07248970A
JPH07248970A JP6037027A JP3702794A JPH07248970A JP H07248970 A JPH07248970 A JP H07248970A JP 6037027 A JP6037027 A JP 6037027A JP 3702794 A JP3702794 A JP 3702794A JP H07248970 A JPH07248970 A JP H07248970A
Authority
JP
Japan
Prior art keywords
way
error
parity
cache memory
memory device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6037027A
Other languages
English (en)
Other versions
JP3160144B2 (ja
Inventor
Katsunori Takeshita
克典 竹下
Yuji Kamisaka
裕士 神阪
Kazuyasu Nonomura
一泰 野々村
Kiminari Ogura
仁成 小椋
Toru Watabe
徹 渡部
Takumi Takeno
巧 竹野
Shinya Kato
慎哉 加藤
Chiyonsuwannapaisaan Poonshiyai
ポーンシャイ・チョンスワンナパイサーン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP03702794A priority Critical patent/JP3160144B2/ja
Publication of JPH07248970A publication Critical patent/JPH07248970A/ja
Application granted granted Critical
Publication of JP3160144B2 publication Critical patent/JP3160144B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)
  • Memory System Of A Hierarchy Structure (AREA)
  • Detection And Correction Of Errors (AREA)

Abstract

(57)【要約】 【目的】 キャッシュメモリ装置の性能を維持しなが
ら、パリティエラーの復帰処理を行う。 【構成】 各ウェイ101のキャッシュメモリ102と
タグメモリ103とが、パリティコードを含んだデータ
およびアドレス情報を格納しているキャッシュメモリ装
置において、各ウェイ101は、データとパリティコー
ドとからエラーを検出するパリティチェック手段111
と、アドレス情報とパリティコードとからエラーを検出
するパリティチェック手段112と、パリティチェック
手段111,112によるパリティエラーの検出に応じ
て、検索手段104による検索結果としてミスヒットを
示すヒット信号を生成するヒット信号制御手段113と
を備えた構成であり、各ウェイ101のパリティチェッ
ク手段111,112による検出結果に応じて、所定の
復帰処理を行う復帰処理手段120を備える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、キャッシュメモリから
の読出エラーをパリティビットによって検出するキャッ
シュメモリ装置に関する。
【0002】情報処理装置の普及に伴って、より一層の
高速化が要望されており、これに応じて、キャッシュメ
モリ装置を備えて、データのアクセスの高速化を図った
システムが増えている。
【0003】一方、情報処理装置による処理量が増大し
ていることから、情報処理装置の信頼性の向上も重要視
されており、軽度の障害の際には、システムを停止せず
に連続して運用したいという要望もある。
【0004】また、情報処理装置には、更に多機能化や
小型化も要望されており、これに伴って、キャッシュメ
モリ装置などのメモリ素子として、集積度の高い集積回
路が頻繁に利用されるようになっている。
【0005】ところで、集積度の高い集積回路において
は、その回路の構成部品が非常に微細であるために、回
路そのものの断線などの固定故障であるハードエラーの
他に、ソフトエラーと呼ばれる障害が発生することが知
られている。
【0006】このソフトエラーは、メモリ素子などの集
積回路を封入したパッケージ材料に含まれる極く微量の
放射線源からの放射線により、ランダムにビットが反転
する現象であり、再度正しいデータを書き込むことによ
り、復帰させることができる。しかし、その原因(放射
性原子の崩壊現象)から推測できるように、ソフトエラ
ーには再現性がなく、どのセルにソフトエラーが発生す
るかを予測することは不可能である。したがって、ハー
ドエラーに対する障害対策とは異なる障害対策を施すこ
とが必要である。
【0007】
【従来の技術】図5に、従来のキャッシュメモリ装置の
構成例を示す。図5において、各ウェイ101のキャッ
シュメモリ201は、主記憶装置内のデータの一部をそ
の物理アドレスの下位部分に対応するエントリに格納し
ており、プロセッサ210によって指定される物理アド
レスを受けて、その下位部分に対応するエントリ内のデ
ータを出力する構成となっている。また、各ウェイ10
1のタグメモリ202は、対応するキャッシュメモリ2
01の各エントリに格納されたデータの物理アドレスの
上位部分を対応するエントリに格納しており、物理アド
レスの入力に応じて、該当するエントリ内のアドレスを
出力する構成となっている。
【0008】このタグメモリ202から出力されたアド
レスは、対応する比較器203によって、物理アドレス
の該当部分と照合され、この照合結果がヒット信号とし
てキャッシュ制御部204に送出される。
【0009】図5において、キャッシュ制御部204
は、物理アドレスとタグメモリ202内のアドレスとが
一致した旨を示すヒット信号に応じて、キャッシュメモ
リ201からのデータを有効とする。一方、一致しない
旨を示すヒット信号に応じて、キャッシュ制御部204
は、プロセッサ210にミスヒットを通知するととも
に、該当するエントリの書換えを行う。
【0010】ここで、キャッシュメモリ201およびタ
グメモリ202内に格納されるデータおよびアドレスに
は、そのデータあるいはアドレスに対応するパリティビ
ットが付されており、上述したヒット判定処理と並行し
て、パリティチェック部205d,205aにより、デ
ータおよびアドレスの正当性がチェックされている。
【0011】従来は、このパリティチェック部205
d,205aによって検出される読出エラーは、全てメ
モリ素子の不良によるハードエラーであるとして、パリ
ティエラーが検出された場合には、その旨がキャッシュ
制御部204を介してプロセッサ210に通知され、こ
れに応じて、プロセッサ210がシステムを停止させて
いた。
【0012】また、キャッシュメモリ201が複数のウ
ェイ101を備えている場合には、パリティエラーが検
出されたエントリを含むウェイ101だけを切り離し
て、残りのウェイ101だけで運用を続けるシステムも
ある。
【0013】一方、パリティエラーを上述したソフトエ
ラーであると判断し、キャッシュメモリ201の内容を
一旦書き直してから、再度、キャッシュメモリ201か
らの読出処理を行う構成のシステムも提案されている。
【0014】
【発明が解決しようとする課題】ところで、パリティエ
ラーを発生される原因としては、ハードエラーとソフト
エラーとの2通りが考えられる。
【0015】しかしながら、上述した従来技術において
は、パリティエラーの原因をハードエラーあるいはソフ
トエラーのいずれか一方であるとして、その一方に適合
した障害対策を行っている。
【0016】前者の場合は、ソフトエラーによってパリ
ティエラーが発生した場合にも、システムが停止させら
れたり、キャッシュメモリのウェイが切り離されたりす
る。つまり、この技術を適用した場合には、ソフトエラ
ーが一時的なエラーであるにもかかわらず、永久的なハ
ードエラーと見なしてしまうことにより、不必要にシス
テムの運用効率を低下させてしまう。
【0017】一方、後者の場合は、ハードエラーによっ
てパリティエラーが発生した場合も、キャッシュメモリ
を書き直して読出処理をリトライするので、無限に読出
処理を繰り返してしまったり、リトライの不成功に応じ
て結局はシステムが停止させられたりして、システムの
運用効率が低下してしまう。
【0018】このようなシステムの運用効率の低下を防
ぐための技法として、特開平5−100953号『キャ
ッシュメモリ制御方式』が提案されている。この技法
は、プロセッサから物理アドレスとともに対応するパリ
ティコードの入力を受けて、タグメモリ内のアドレスお
よびパリティコードと物理アドレスの該当部分およびパ
リティコードとを照合した結果をヒット信号とするもの
である。したがって、タグメモリ内のアドレスが、パリ
ティコードも含めて物理アドレスと一致した場合にキャ
ッシュヒットとされ、他の場合はミスヒットとされるの
で、パリティエラーが発生した場合でも単なるミスヒッ
トとして扱われる。
【0019】この技法を適用した場合には、パリティエ
ラーが発生してもシステムの運用を継続することができ
るから、システムの運用効率が低下することはない。し
かしながら、パリティエラーの原因が判別されていない
ので、根本的な障害対策を行うことができない。
【0020】また、同様の技法として、特開平5−18
9312号公報『キャッシュメモリ制御方式』が提案さ
れている。この技法は、上述した特開平5−10095
3号の技法と同様に、パリティエラーをミスヒットとし
て扱うとともに、物理アドレスの一部とタグメモリ内の
アドレスの一部が一致しているにもかかわらず、パリテ
ィコードが不一致となったときに、プログラムの実行を
停止してロギング情報を作成することにより、利用者に
パリティエラーに関する情報を提供するものである。
【0021】この場合は、タグメモリにハードエラーが
発生した可能性が極めて高い場合にはロギング情報が提
供されるが、キャッシュメモリからの読出エラーは全く
チェックされていないので、キャッシュメモリにおいて
発生したパリティエラーに関しては情報が得られない。
更に、プロセッサに誤ったデータが渡される可能性もあ
る。
【0022】本発明は、システムの運用効率の低下を防
ぐとともに、読出エラーの原因に応じて適切な対策を行
うキャッシュメモリ装置を提供することを目的とする。
【0023】
【課題を解決するための手段】請求項1の発明は、少な
くとも1つのウェイ101から構成され、各ウェイ10
1は、主記憶装置内のデータの一部と対応するパリティ
コードとを格納するキャッシュメモリ102と、キャッ
シュメモリ102に格納されたデータの格納場所に関す
るアドレス情報とこの情報に対応するパリティコードと
を格納するタグメモリ103と、プロセッサからの指定
される物理アドレスに対応するアドレス情報をタグメモ
リ103から検索する検索手段104とを備え、各ウェ
イ101の検索手段104による検索結果を示すヒット
信号に応じて、該当するウェイに対するアクセスを制御
するキャッシュ制御手段105を備えたキャッシュメモ
リ装置において、各ウェイ101は、キャッシュメモリ
102から出力されるデータとパリティコードとから、
パリティエラーを検出するパリティチェック手段111
と、タグメモリ103から検索されたアドレス情報とパ
リティコードとから、パリティエラーを検出するパリテ
ィチェック手段112と、パリティチェック手段11
1,112の少なくとも一方によるパリティエラーの検
出に応じて、検索手段104による検索結果としてミス
ヒットを示すヒット信号を生成し、キャッシュ制御手段
105に送出するヒット信号制御手段113とを備えた
構成であり、各ウェイ101のパリティチェック手段1
11,112の少なくとも一方による検出結果を受け取
って、該当するウェイ101に対して所定の復帰処理を
行う復帰処理手段120を備えたことを特徴とする。
【0024】請求項2の発明は、請求項1に記載のキャ
ッシュメモリ装置において、復帰処理手段120は、各
ウェイ101に対応して、該当するパリティチェック手
段111,112の少なくとも一方による検出結果を保
持する保持手段121を備え、少なくとも1つのウェイ
101のいずれかに対するアクセス処理の終了後に、検
出結果に応じて、該当するキャッシュメモリ102およ
びタグメモリ103の全てのエントリをクリアする旨を
キャッシュ制御手段105に指示する構成であることを
特徴とする。
【0025】請求項3の発明は、請求項1に記載のキャ
ッシュメモリ装置において、復帰処理手段120は、各
ウェイ101のパリティチェック手段111,112に
よる検出結果に基づいて、各ウェイにおけるパリティエ
ラーの発生回数をエラー情報として蓄積する蓄積手段1
22と、エラー情報で示されたエラー発生回数の大小に
応じて、復帰処理を選択する選択手段123と、選択手
段123からの指示に応じて、パリティエラーが発生し
たウェイ101のキャッシュメモリ102およびタグメ
モリ103の全てのエントリをクリアする旨をキャッシ
ュ制御手段105に指示する初期化手段124と、選択
手段123からの指示に応じて、パリティエラーが発生
したウェイ101のヒット信号制御手段113に、該当
するウェイ101の切り離しを指示する切り離し信号を
送出する切り離し制御手段124とを備えた構成であ
り、各ヒット信号制御手段113は、切り離し信号の入
力に応じて、以降はヒットを示すヒット信号を抑止し
て、対応する検索手段104による検索結果にかかわら
ず、ミスヒットを示すヒット信号を出力する構成である
ことを特徴とする。
【0026】請求項4の発明は、請求項3に記載のキャ
ッシュメモリ装置において、蓄積手段121は、エラー
発生回数とともにエラーが発生した時刻に関する時刻情
報を蓄積する構成であり、復帰処理手段120は、切り
離し信号によって切り離しが指示されたウェイ101に
対応するエラー情報を定期的に参照し、時刻情報に応じ
て、初期化手段124に該当するウェイ101の初期化
処理を指示するとともに、切り離し信号を解除する旨の
解除信号を該当するヒット信号制御手段113に送出す
る切り離し解除手段126を備えた構成であり、各ヒッ
ト信号制御手段113は、解除信号の入力に応じて、ヒ
ット信号の抑止を解除する構成であることを特徴とす
る。
【0027】
【作用】本発明は、各ウェイ101のキャッシュメモリ
102およびタグメモリ103からデータおよびデータ
のアドレスを読みだした際に、パリティチェック手段1
11,112によるパリティエラーの検出結果に応じ
て、検索手段104によるヒット判定を抑止するもので
ある。これにより、キャッシュ制御手段105は、パリ
ティエラーをミスヒットと同等に扱うことができ、パリ
ティエラーが発生してもキャッシュメモリ装置の運用を
継続することが可能となるから、キャッシュメモリの性
能の不必要な低下を避けることができる。
【0028】また、各ウェイ101のパリティチェック
手段111,112は、復帰処理手段120に送出され
ており、この復帰処理手段120により、パリティエラ
ーの検出結果に応じて所定の復帰処理を行うことができ
る。
【0029】更に、請求項2の発明は、各ウェイ101
に対応するエラー情報を蓄積手段121に蓄積するの
で、アクセスの終了後に、復帰処理部120が、この蓄
積手段121を参照することにより、エラーの発生を知
って復帰処理を行うことができる。また、パリティエラ
ーが発生したウェイ101の全てのエントリを初期化す
ることにより、このウェイ101内に発生した全てのソ
フトエラーを解消することができる。
【0030】これにより、プロセッサの動作を停止させ
ることなく、ソフトエラーに適した復帰処理を行うこと
ができるから、コンピュータシステムの運用効率を維持
しながら、適切な復帰処理を行うことができる。この場
合は、復帰したウェイ101は他のウェイ101と同様
に動作するから、キャッシュメモリ装置の性能を十分に
活用することができる。
【0031】また、請求項3の発明は、パリティチェッ
ク手段111,112による検出結果に基づいて、各ウ
ェイ101ごとにパリティエラーの発生回数を蓄積手段
122に蓄積し、選択手段123がこのエラー発生回数
に応じて、初期化手段124あるいは切り離し制御手段
125を起動するものである。
【0032】したがって、エラー発生回数がある値を超
えるまでは、初期化手段124によって該当するウェイ
101の初期化を行い、ある値以上となったときに、切
り離し制御手段125が送出する切り離し信号によっ
て、該当するヒット信号制御手段113の動作を制御し
て、該当するウェイを切り離すことができる。
【0033】ここで、パリティエラーの原因がハードエ
ラーであった場合には、初期化処理によってはパリティ
エラーが解消されないから、同一のエントリをアクセス
するたびにパリティエラーが蓄積する。したがって、上
述したようにして、エラー発生回数に応じて、復帰処理
を選択することにより、キャッシュメモリ装置の性能を
可能な限り維持しながら、パリティエラーの原因に応じ
て適切な対策を施すことが可能である。
【0034】更に、請求項4の発明は、エラー情報にエ
ラー発生時刻を含めておき、切り離し解除手段126が
定期的に動作することにより、最後にエラーが発生して
から一定時間以上が経過しているウェイ101を初期化
した上で復帰させることができる。このように、時間の
経過を考慮して復帰処理を行うことにより、ソフトエラ
ーが解消して正常に動作可能となったウェイ101を漏
れなく稼働状態とすることができる
【0035】
【実施例】以下、図面に基づいて本発明の実施例につい
て詳細に説明する。図2は、本発明のキャッシュメモリ
装置の実施例構成図を示す。
【0036】図2において、本発明のキャッシュメモリ
装置は、図5に示した従来のキャッシュメモリ装置の各
ウェイ101に、オアゲート221,アンドゲート22
2,エラーレジスタ223およびモードレジスタ224
を付加した構成となっている。
【0037】ここで、図2において、キャッシュメモリ
201とタグメモリ202とは、キャッシュメモリ10
2とタグメモリ103に相当するとともに、検索手段1
04の機能の一部を分担しており、比較器203によ
り、検索手段104の機能の他の部分が果たされてい
る。
【0038】このキャッシュメモリ装置において、パリ
ティチェック手段111,112に相当する2つのパリ
ティチェック部205d,205aによるチェック結果
は、オアゲート221を介してアンドゲート222に反
転入力されており、比較器203の出力およびモードレ
ジスタ224の内容との論理積をヒット信号として、キ
ャッシュ制御手段105に相当するキャッシュ制御部2
04に送出する構成となっている。
【0039】上述したオアゲート221の出力は、保持
手段121に相当するエラーレジスタ223によって保
持され、後述する割り込み処理に供される。また、図2
において、プロセッサ210は、割込処理部211と復
帰処理部212とを備えて構成されており、メモリ23
0の固定領域には、エラー情報領域231が確保されて
いる。
【0040】この割込処理部211は、キャッシュメモ
リ201へのアクセスを指示するマクロ命令の終了後
に、各ウェイ101のエラーレジスタ223を参照して
エラーに関する情報を収集するとともに、得られたエラ
ー情報に基づいて、後述する復帰処理を行う構成となっ
ている。例えば、割込処理部211は、エラー情報とし
て、パリティエラーの発生回数と発生時刻とを収集し、
各ウェイ101に対応してエラー情報領域231に格納
すればよい。
【0041】また、復帰処理部212は、オペレーティ
ングシステムによる割込処理の際に、エラー情報領域2
31内のエラー情報に応じて、後述するウェイの復帰処
理を行う構成となっている。
【0042】なお、上述した割込処理部211および復
帰処理部212は、実際には、プロセッサ210がメモ
リ230内の該当するマイクロプログラムを実行するこ
とによって実現されている。
【0043】以下、本発明のキャッシュメモリ装置の動
作について説明する。例えば、システムの起動時など
に、プロセッサ210は、各ウェイ101のモードレジ
スタ224に初期値として論理“1”を設定する。
【0044】この場合は、アンドゲート222により、
比較器203の出力とオアゲート221の出力とに応じ
てヒット信号が生成される。したがって、タグメモリ2
02内のアドレスと物理アドレスの該当部分とが一致
し、かつ、パリティエラーが発生していない場合に、キ
ャッシュヒットを示すヒット信号がキャッシュ制御部2
04に送出され、他の場合にはミスヒットを示すヒット
信号が送出される。
【0045】すなわち、比較器203による照合結果が
アドレスの一致を示している場合でも、パリティチェッ
ク部205d,205aによってパリティエラーが検出
されていれば、ミスヒットを示すヒット信号が送出され
る。
【0046】このように、オアゲート221とアンドゲ
ート222とにより、ヒット信号制御手段113の機能
が実現され、パリティエラーの発生に応じてヒット信号
を抑止し、ミスヒットとして扱うことができる。
【0047】これにより、パリティエラーの発生に応じ
てシステムを停止することなく、連続して運用すること
ができるから、システムの運用効率を不必要に低下させ
ることを防ぐことができる。
【0048】更に、図2に示したように、オアゲート2
21の出力はエラーレジスタ223に保持されているか
ら、パリティチェック部205d,205aの少なくと
も一方でパリティエラーが検出された場合には、マクロ
命令の終了後に、割込処理部211が動作して、このエ
ラーレジスタ223の内容を参照することにより、パリ
ティエラーの発生を知ることができる。
【0049】このように、請求項2で述べた構成を適用
したことにより、キャッシュメモリ装置に対するアクセ
スを正常に終了させたあとに、パリティエラーの発生に
応じた復帰処理を行うことが可能となり、システムの運
用を単に維持するだけでなく、適切な復帰処理を行うこ
とが可能となる。
【0050】図3に、割込処理部の動作を表す流れ図を
示す。割込処理部211は、まず、各ウェイ101のエ
ラーレジスタ223の内容を参照してパリティエラーが
発生したウェイ101の有無を判定する(ステップ30
1)。
【0051】ステップ301において、パリティエラー
が発生したウェイ101がないと判定した場合は、ステ
ップ301の否定判定として直ちに割込処理を終了す
る。一方、ステップ301の肯定判定の場合は、パリテ
ィエラーが発生したウェイ101のそれぞれについて、
ステップ302〜ステップ306に述べるエラー情報の
収集処理および復帰処理を行う。
【0052】まず、エラー情報領域231内の該当する
ウェイ101に対応するエラー発生回数をそれぞれイン
クリメントし(ステップ302)、更に、該当するエラ
ー発生時刻を現在時刻にそれぞれ書き換える(ステップ
303)。
【0053】次に、エラー情報領域231の各ウェイ1
01に対応するエラー発生回数をそれぞれ所定の閾値Th
と比較し、エラー発生回数が所定の閾値Thを超えている
か否かを判定する(ステップ304)。
【0054】このステップ304における否定判定の場
合は、割込処理部211は、パリティエラーの原因はソ
フトエラーであると仮定して、該当するウェイ101の
すべてのエントリのクリアをキャッシュ制御部204に
指示して(ステップ305)、復帰処理を行い、割込処
理を終了する。
【0055】これにより、該当するウェイ101のすべ
てのエントリに対する次のアクセスはミスヒットとな
る。これに伴って、下位の階層の記憶装置(例えば、主
記憶装置)から得られる正しいデータおよびアドレスが
新たに各エントリに格納され、全てのエントリが初期化
される。したがって、パリティエラーの原因がソフトエ
ラーである場合には、上述した初期化処理によって正常
な状態に復帰するから、以降は、これらのウェイ101
も含めて正常に動作する。
【0056】一方、ステップ304における肯定判定の
場合は、割込処理部211は、該当するウェイ101に
ハードエラーが発生した可能性が高いと判断して、対応
するモードレジスタ224に論理“0”を設定すること
により、復帰処理を行い(ステップ306)、割込処理
を終了する。これにより、ヒット信号制御手段113の
アンドゲート223に切り離し信号として論理“0”が
入力されるから、以後は、該当するウェイ101の比較
器203による比較結果にかかわらず、アンドゲート2
22の出力は、常にミスヒットを示す論理“0”とな
る。すなわち、このウェイ101は事実上は切り離さ
れ、残りのウェイ101だけで運用が継続される。
【0057】このように、マクロ命令の終了に応じて、
割込処理部211が動作することにより、システムの運
用を継続しながらエラー情報をエラー情報領域231に
蓄積していき、エラー発生回数の値に応じた復帰処理を
行うことができる。すなわち、この割込処理部211に
より、請求項3で述べた選択手段123,初期化手段1
24および切り離し制御手段125の機能を実現し、エ
ラー情報領域231により、蓄積手段122の機能を実
現することができる。
【0058】ここで、パリティエラーの原因がソフトエ
ラーである場合は、上述したステップ305の処理によ
って全エントリを初期化したことにより、そのウェイ1
01を構成するメモリ素子において発生した全てのソフ
トエラーが解消されるので、以後に、そのウェイ101
において再びパリティエラーが発生する確率は低い。一
方、原因がハードエラーであった場合には、ステップ3
05の処理にかかわらず、同一のエントリへのアクセス
に応じて、繰り返しパリティエラーが発生するから、エ
ラー回数が所定の閾値Thを超えたときには、その原因が
ハードエラーである可能性が極めて高いと言える。
【0059】したがって、上述したように、エラー発生
回数に応じてステップ305あるいはステップ306の
処理を行うことによって、パリティエラーの原因に応じ
て適切な復帰処理を行うことが可能である。
【0060】この場合は、パリティエラーの原因がハー
ドエラーである可能性が極めて高い場合にのみ該当する
ウェイ101が切り離されるから、キャッシュメモリの
性能を可能な限り維持することができる。
【0061】ところで、上述したようにソフトエラーは
ランダムな現象によって引き起こされるから、上述した
割込処理において、ステップ304における肯定判定と
なった場合でも、パリティエラーの原因がソフトエラー
である可能性はある。
【0062】このようにハードエラーがないにもかかわ
らず切り離されたウェイの復帰を図るために、復帰処理
部212は後述する復帰処理を行う。図4に、復帰処理
部の動作を表す流れ図を示す。
【0063】復帰処理部212は、まず、各ウェイ10
1のモードレジスタ224を参照し、論理“0”が設定
されているウェイ101を検出する(ステップ40
1)。次に、復帰処理部212は、エラー情報領域23
1を参照して、検出されたウェイ101に対応して保持
されたエラー発生時刻を読み出し、エラー発生時刻と現
在の時刻との差Tdをそれぞれ算出する(ステップ40
2)。
【0064】ステップ402で得られた差Tdが、所定の
閾値Ti以下である場合は、ステップ403における否定
判定として、そのまま処理を終了する。一方、ステップ
403における肯定判定の場合は、該当するウェイ10
1のすべてのエントリをクリアし(ステップ404)、
このウェイ101のモードレジスタ224に論理“1”
をセットして(ステップ405)、処理を終了すればよ
い。
【0065】これにより、アンドゲート222により、
比較器203とパリティチェック部205d,205a
との出力に対応して変化するヒット信号が得られるか
ら、該当するウェイ101が切り離された状態は解除さ
れる。
【0066】このように、復帰処理部212が動作する
ことにより、請求項4で述べた切り離し解除手段126
の機能を実現し、時間の経過に応じて切り離し信号を解
除して、一旦切り離したウェイ101を一定時間後に復
帰させることができる。
【0067】ここで、この復帰処理部212によって復
帰させたウェイ101にハードエラーがあれば、割込処
理部211による割込処理によって再び切り離される
が、他のウェイ101はそのまま動作しつづけるから、
キャッシュメモリ装置の性能は復帰前と同じである。
【0068】一方、該当するウェイ101におけるパリ
ティエラーの原因がソフトエラーであった場合には、一
定時間の経過とステップ405における初期化処理とに
よって、ソフトエラーが完全に解消されているから、こ
のウェイ101は他のウェイ101とともに正常に動作
し続ける。この場合は、該当するウェイ101の復帰に
よって、キャッシュメモリ装置の性能を復帰前よりも向
上させることができる。
【0069】したがって、上述したようにして、一旦切
り離されたウェイを復帰させることにより、ソフトエラ
ーによって一時的に切り離されたウェイを含めて、正常
に動作可能な全てのウェイを稼働状態とすることができ
るから、キャッシュメモリ装置の性能を最大限に活用す
ることができる。
【0070】また、上述した復帰処理において、エラー
情報領域231に保持された各ウェイ101に対応する
エラー発生時刻と現在の時刻との差を求め、この時刻の
差が例えば24時間以上であった場合に、該当するウェ
イ101のエラー発生回数を初期値『0』にリセットす
る手順を追加してもよい。
【0071】このように、一定時間(例えば24時間)
ごとに、エラー発生回数をリセットすることにより、コ
ンピュータシステムの連続運用によるエラー発生回数の
蓄積を防ぐことができる。この場合に、上述した割込処
理のステップ304で用いる閾値Thとして、ソフトエラ
ーのみが発生した場合に、24時間で蓄積する読出エラ
ーの期待値に相当する値を設定すれば、上述した割込処
理によって、ほぼ確実にパリティエラーの原因がハード
エラーかソフトエラーかを判別することができるから、
ハードエラーが発生したウェイ101のみを切り離すこ
とができる。
【0072】更に、上述したエラー発生時刻のほかに、
各ウェイ101が切り離された時刻(以下切り離し時刻
と称する)をエラー情報領域231に保持しておく構成
としてもよい。
【0073】この場合は、例えば、上述した復帰処理部
212が、ステップ405においてウェイ101を復帰
させるときに、エラー情報領域231に該当するウェイ
101の切り離し時刻として、エラー発生時刻を格納す
ればよい。
【0074】この切り離し時刻は、各ウェイ101の切
り離しに関する履歴情報であり、この履歴情報によって
頻繁に切り離されているウェイ101が示される。した
がって、切り離し時刻を記録することにより、キャッシ
ュメモリ装置の保守作業において重要な情報を操作者に
提供することが可能となり、キャッシュメモリ装置の信
頼性の向上を図ることができる。
【0075】
【発明の効果】以上説明したように本発明は、パリティ
エラーが発生したときに、ミスヒットの場合と同様に扱
いながら、パリティエラーの発生に関する情報を各ウェ
イごとに収集し、収集した情報に応じた復帰処理を行う
ことにより、システムの運用を維持しながら、パリティ
エラーの原因に応じて適切な復帰処理を行うことができ
る。これにより、キャッシュメモリ装置の不必要な性能
低下を防ぐとともに、キャッシュメモリ装置の信頼性の
向上を図ることができる。
【図面の簡単な説明】
【図1】本発明のキャッシュメモリ装置の原理ブロック
図である。
【図2】本発明のキャッシュメモリ装置の実施例構成図
である。
【図3】割込処理部の動作を表す流れ図である。
【図4】復帰処理部の動作を表す流れ図である。
【図5】従来のキャッシュメモリ装置の構成例を示す図
である。
【符号の説明】
101 ウェイ 102 キャッシュメモリ 103 タグメモリ 104 検索手段 105 キャッシュ制御手段 111,112 パリティチェック手段 113 ヒット信号制御手段 120 復帰処理手段 121 保持手段 122 蓄積手段 123 選択手段 124 初期化手段 125 切り離し制御手段 126 切り離し解除手段 201 キャッシュメモリ 202 タグメモリ 203 比較器 204 キャッシュ制御部 205 パリティチェック部 210 プロセッサ 211 割込処理部 212 復帰処理部 221 オアゲート 222 アンドゲート 223 エラーレジスタ 224 モードレジスタ 230 メモリ 231 エラー情報領域
───────────────────────────────────────────────────── フロントページの続き (72)発明者 小椋 仁成 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (72)発明者 渡部 徹 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (72)発明者 竹野 巧 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (72)発明者 加藤 慎哉 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (72)発明者 ポーンシャイ・チョンスワンナパイサーン 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 少なくとも1つのウェイ(101)から
    構成され、各ウェイ(101)は、主記憶装置内のデー
    タの一部と対応するパリティコードとを格納するキャッ
    シュメモリ(102)と、キャッシュメモリ(102)
    に格納されたデータの格納場所に関するアドレス情報と
    この情報に対応するパリティコードとを格納するタグメ
    モリ(103)と、プロセッサからの指定される物理ア
    ドレスに対応するアドレス情報を前記タグメモリ(10
    3)から検索する検索手段(104)とを備え、各ウェ
    イ(101)の検索手段(104)による検索結果を示
    すヒット信号に応じて、該当するウェイ(101)に対
    するアクセスを制御するキャッシュ制御手段(105)
    を備えたキャッシュメモリ装置において、 前記各ウェイ(101)は、 前記キャッシュメモリ(102)から出力されるデータ
    とパリティコードとから、パリティエラーを検出するパ
    リティチェック手段(111)と、 前記タグメモリ(103)から検索されたアドレス情報
    とパリティコードとから、パリティエラーを検出するパ
    リティチェック手段(112)と、 前記パリティチェック手段(111,112)の少なく
    とも一方によるパリティエラーの検出に応じて、前記検
    索手段(104)による検索結果としてミスヒットを示
    すヒット信号を生成し、前記キャッシュ制御手段(10
    5)に送出するヒット信号制御手段(113)とを備え
    た構成であり、 前記各ウェイ(101)のパリティチェック手段(11
    1,112)の少なくとも一方による検出結果を受け取
    って、該当するウェイ(101)に対して所定の復帰処
    理を行う復帰処理手段(120)を備えたことを特徴と
    するキャッシュメモリ装置。
  2. 【請求項2】 請求項1に記載のキャッシュメモリ装置
    において、 復帰処理手段(120)は、 各ウェイ(101)に対応して、該当するパリティチェ
    ック手段(111,112)の少なくとも一方による検
    出結果を保持する保持手段(121)を備え、 少なくとも1つのウェイ(101)のいずれかに対する
    アクセス処理の終了後に、前記検出結果に応じて、該当
    するキャッシュメモリ(102)およびタグメモリ(1
    03)の全てのエントリをクリアする旨をキャッシュ制
    御手段(105)に指示する構成であることを特徴とす
    るキャッシュメモリ装置。
  3. 【請求項3】 請求項1に記載のキャッシュメモリ装置
    において、 復帰処理手段(120)は、 各ウェイ(101)のパリティチェック手段(111,
    112)による検出結果に基づいて、各ウェイにおける
    パリティエラーの発生回数をエラー情報として蓄積する
    蓄積手段(122)と、 前記エラー情報で示されたエラー発生回数の大小に応じ
    て、復帰処理を選択する選択手段(123)と、 前記選択手段(123)からの指示に応じて、パリティ
    エラーが発生したウェイ(101)のキャッシュメモリ
    (102)およびタグメモリ(103)の全てのエント
    リをクリアする旨をキャッシュ制御手段(105)に指
    示する初期化手段(124)と、 前記選択手段(123)からの指示に応じて、パリティ
    エラーが発生したウェイ(101)のヒット信号制御手
    段(113)に、該当するウェイ(101)の切り離し
    を指示する切り離し信号を送出する切り離し制御手段
    (124)とを備えた構成であり、 前記各ヒット信号制御手段(113)は、切り離し信号
    の入力に応じて、以降はヒットを示すヒット信号を抑止
    して、対応する検索手段(104)による検索結果にか
    かわらず、ミスヒットを示すヒット信号を出力する構成
    であることを特徴とするキャッシュメモリ装置。
  4. 【請求項4】 請求項3に記載のキャッシュメモリ装置
    において、 蓄積手段(121)は、エラー発生回数とともにエラー
    が発生した時刻に関する時刻情報を蓄積する構成であ
    り、 復帰処理手段(120)は、切り離し信号によって切り
    離しが指示されたウェイ(101)に対応するエラー情
    報を定期的に参照し、前記時刻情報に応じて、初期化手
    段(124)に該当するウェイ(101)の初期化処理
    を指示するとともに、前記切り離し信号を解除する旨の
    解除信号を該当するヒット信号制御手段(113)に送
    出する切り離し解除手段(126)を備えた構成であ
    り、 前記各ヒット信号制御手段(113)は、前記解除信号
    の入力に応じて、ヒット信号の抑止を解除する構成であ
    ることを特徴とするキャッシュメモリ装置。
JP03702794A 1994-03-08 1994-03-08 キャッシュメモリ装置 Expired - Fee Related JP3160144B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03702794A JP3160144B2 (ja) 1994-03-08 1994-03-08 キャッシュメモリ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03702794A JP3160144B2 (ja) 1994-03-08 1994-03-08 キャッシュメモリ装置

Publications (2)

Publication Number Publication Date
JPH07248970A true JPH07248970A (ja) 1995-09-26
JP3160144B2 JP3160144B2 (ja) 2001-04-23

Family

ID=12486168

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03702794A Expired - Fee Related JP3160144B2 (ja) 1994-03-08 1994-03-08 キャッシュメモリ装置

Country Status (1)

Country Link
JP (1) JP3160144B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6546501B1 (en) 1999-09-08 2003-04-08 Fujitsu Limited Cache memory apparatus and computer readable recording medium on which a program for controlling a cache memory is recorded
US6708294B1 (en) 1999-09-08 2004-03-16 Fujitsu Limited Cache memory apparatus and computer readable recording medium on which a program for controlling a cache memory is recorded
US7716416B2 (en) 2003-07-29 2010-05-11 Fujitsu Limited Analysis for a multiple tag hit in a content addressable memory (CAM)
JP2013120426A (ja) * 2011-12-06 2013-06-17 Hitachi Ltd ソフトエラー耐性調整機能を備えた電子システム装置及びソフトエラー耐性調整方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6546501B1 (en) 1999-09-08 2003-04-08 Fujitsu Limited Cache memory apparatus and computer readable recording medium on which a program for controlling a cache memory is recorded
US6708294B1 (en) 1999-09-08 2004-03-16 Fujitsu Limited Cache memory apparatus and computer readable recording medium on which a program for controlling a cache memory is recorded
US7716416B2 (en) 2003-07-29 2010-05-11 Fujitsu Limited Analysis for a multiple tag hit in a content addressable memory (CAM)
JP2013120426A (ja) * 2011-12-06 2013-06-17 Hitachi Ltd ソフトエラー耐性調整機能を備えた電子システム装置及びソフトエラー耐性調整方法

Also Published As

Publication number Publication date
JP3160144B2 (ja) 2001-04-23

Similar Documents

Publication Publication Date Title
EP0608344B1 (en) System for backing-up data for rollback
TWI236620B (en) On-die mechanism for high-reliability processor
EP0505706B1 (en) Alternate processor continuation of the task of a failed processor
US8677189B2 (en) Recovering from stack corruption faults in embedded software systems
US7734949B2 (en) Information error recovery apparatus and methods
US7085886B2 (en) Autonomic power loss recovery for a multi-cluster storage sub-system
JP4395425B2 (ja) 破損データ値を処理するためのデータ処理装置と方法
US20050188249A1 (en) Error correction within a cache memory
US8190973B2 (en) Apparatus and method for error correction of data values in a storage device
US7380169B2 (en) Converting merge buffer system-kill errors to process-kill errors
WO2009141752A2 (en) Resilient data storage in the presence of replication faults and rolling disasters
EP0762282A1 (en) Atomic update of EDC protected data
US8301992B2 (en) System and apparatus for error-correcting register files
US20030131277A1 (en) Soft error recovery in microprocessor cache memories
JP4917604B2 (ja) 記憶装置構成およびその駆動方法
JP5451087B2 (ja) 障害処理装置および方法
US7590801B1 (en) Identifying suspect disks
JPH07248970A (ja) キャッシュメモリ装置
JP2018010495A (ja) 情報処理装置、情報処理プログラムおよび情報処理システム
EP0125797B1 (en) Interrupt signal handling apparatus
JP3070453B2 (ja) 計算機システムのメモリ障害回復方法および回復システム
US20100169572A1 (en) Data storage method, apparatus and system for interrupted write recovery
JPH08137764A (ja) 記憶装置のソフトエラー回復方法と固定障害検出方法
KR102411938B1 (ko) 위성 시스템에서 메모리를 관리하기 위한 장치 및 방법
JPS5862900A (ja) メモリの単一ビツトエラ−処理方式

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010130

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080216

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090216

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090216

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100216

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110216

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110216

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120216

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees