JP3070453B2 - 計算機システムのメモリ障害回復方法および回復システム - Google Patents

計算機システムのメモリ障害回復方法および回復システム

Info

Publication number
JP3070453B2
JP3070453B2 JP7241329A JP24132995A JP3070453B2 JP 3070453 B2 JP3070453 B2 JP 3070453B2 JP 7241329 A JP7241329 A JP 7241329A JP 24132995 A JP24132995 A JP 24132995A JP 3070453 B2 JP3070453 B2 JP 3070453B2
Authority
JP
Japan
Prior art keywords
memory
data
update
cache
storage device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP7241329A
Other languages
English (en)
Other versions
JPH0981464A (ja
Inventor
敏行 大津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP7241329A priority Critical patent/JP3070453B2/ja
Publication of JPH0981464A publication Critical patent/JPH0981464A/ja
Application granted granted Critical
Publication of JP3070453B2 publication Critical patent/JP3070453B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【発明の属する技術分野】本発明は、仮想記憶方式を採
用する計算機システムのメモリ障害回復方法および回復
システムに関する。
【0001】
【従来の技術】昭57−133596号公報には、計算
機システムでメモリを更新する際に、キャッシュにデー
タを書き込み、該データと、該データにより作成された
誤り訂正コードをメモリに書き込み、直ちに該データと
該誤り訂正コードをメモリから読み出して検査し、訂正
不能誤りを検出した場合には、該データを有するキャッ
シュエントリを解放しないようにすることで、以降、該
データへのアクセスは、障害となったメモリをアクセス
することなく、すべてキャッシュとの間で実行されるこ
とにより訂正不能誤りに対する障害回復を行う方式につ
いて記載されている。
【0002】また、特開平5−181755号公報に
は、実記憶空間すなわちメモリをページ単位に2重化す
ることにより、いずれか一方のページでメモリ障害が検
出された場合、新たに正常なページを確保し、障害とな
らなかったページの内容を複写することにより、メモリ
障害に対する十分な信頼性を確保する仮想記憶方式につ
いて記載されている。
【0003】
【発明が解決しようとする課題】昭57−133596
号公報は、メモリ更新時、キャッシュにデータを書き込
み、該データと該データにより作成された誤り訂正コー
ドをメモリに書き込むが、この際、一旦メモリに書き込
んだデータとその誤り訂正コードを再度読み込み、メモ
リ障害の有無をチェックしなければならず、処理時間が
かかるという問題点がある。
【0004】また、一度は読み込みに成功したデータ
が、キャッシュが無効化された後で、再度メモリから読
み込もうとした際に、メモリ障害が検出される可能性が
あり、この場合には、メモリ障害の回復を行うことがで
きないという問題点がある。
【0005】また、メモリ障害が複数の箇所で発生した
場合、その分のキャッシュエントリがメモリの代わりに
使われてしまうため、正常なメモリに対するアクセスに
利用するためのキャッシュ容量が減少し、計算機システ
ムのメモリアクセス性能が極端に低下してしまうという
問題点がある。
【0006】また、特開平5−181755号公報は、
メモリをページ単位に2重化する必要があるため、2重
化したページに対しては2倍のメモリを必要とするとい
う問題点がある。
【0007】また、メモリ更新処理時、2重化された両
方のページの更新を同期を取って行う必要があり、メモ
リ更新の処理時間がかかるという問題点がある。
【0008】本発明の目的は、メモリに障害が発生して
も、計算機システムの運用を継続することができるよう
にすることにある。
【0009】本発明の他の目的は、メモリに障害が発生
し、メモリ上のデータが喪失した場合に、障害が発生し
ていない通常時の性能を低下させずに、該データを復旧
することにある。
【0010】さらに本発明の他の目的は、メモリに障害
が発生し、メモリ上のデータが喪失した場合に、メモリ
の障害箇所を閉塞して、該データを復旧することにあ
る。
【0011】さらにまた本発明の他の目的は、メモリに
障害が発生し、メモリ上のデータが喪失した場合に、メ
モリの障害箇所を閉塞してメモリ容量が減少する以外
に、計算機システムに影響を及ぼすことなく、該データ
を復旧することにある。
【0012】
【0013】
【課題を解決するための手段】 本発明の第1の計算機シ
ステムのメモリ障害回復方法は、仮想記憶方式を採用
し、CPU、メモリ、キャッシュメモリ、および2次記
憶装置をシステムバスで接続し、前記CPUが前記キャ
ッシュメモリのデータを更新し、該更新データを前記シ
ステムバスを介して前記メモリに書き出す際に、同様に
該更新データを前記システムバスを介して格納するメモ
リ更新トレースキャッシュを備えた計算機システムにお
いて、障害が発生した前記メモリのページを閉塞し、閉
塞したページの内、更新データを2次記憶装置に未出力
のページのデータを前記メモリ更新トレースキャッシュ
から取り出して前記2次記憶装置へ出力し、その後、該
データを該メモリ更新トレースキャッシュから削除する
ことを特徴とする。
【0014】本発明の第2の計算機システムのメモリ障
害回復方法は、仮想記憶方式を採用し、CPU、メモ
リ、キャッシュメモリ、および2次記憶装置をシステム
バスで接続し、前記CPUが前記キャッシュメモリのデ
ータを更新し、該更新データを前記システムバスを介し
て前記メモリに書き出す際に、同様に該更新データを前
記システムバスを介して格納するメモリ更新トレースキ
ャッシュを備えた計算機システムにおいて、前記メモリ
更新トレースキャッシュの使用容量を監視し、予め設定
した値以上に該メモリ更新トレースキャッシュの使用率
が高くなった場合、前記メモリ上の前記更新データを有
するページの内、未だ前記2次記憶装置へ該更新データ
を出力していないページを取得し、該ページの該更新デ
ータを前記メモリ更新トレースキャッシュから取り出し
て該2次記憶装置へ出力し、その後、該更新データを該
メモリ更新トレースキャッシュから削除することを特徴
とする。
【0015】
【0016】本発明の第1の計算機システムのメモリ障
害回復システムは、仮想記憶方式を採用し、CPU、メ
モリ、キャッシュメモリ、および2次記憶装置をシステ
ムバスで接続して構成される計算機システムにおいて、
前記CPUが前記キャッシュメモリのデータを更新し、
該更新データを前記システムバスを介して前記メモリに
書き出す際に、同様に該更新データを前記システムバス
を介して格納するメモリ更新トレースキャッシュと、指
定されたページのデータを前記メモリ更新トレースキャ
ッシュから取り出し、該メモリ更新トレースキャッシュ
から削除するトレースキャッシュフラッシュ手段と、障
害が発生した前記メモリのページを閉塞するメモリ部分
閉塞手段と、前記メモリ部分閉塞手段が閉塞したページ
の内、更新データを2次記憶装置に未出力のページのデ
ータを前記トレースキャッシュフラッシュ手段により前
記メモリ更新トレースキャッシュから取り出し、前記2
次記憶装置へ出力する更新イメージ出力手段とから構成
されている。
【0017】本発明の第2の計算機システムのメモリ障
害回復システムは、仮想記憶方式を採用し、CPU、メ
モリ、キャッシュメモリ、および2次記憶装置をシステ
ムバスで接続して構成される計算機システムにおいて、
前記CPUが前記キャッシュメモリのデータを更新し、
該更新データを前記システムバスを介して前記メモリに
書き出す際に、同様に該更新データを前記システムバス
を介して格納するメモリ更新トレースキャッシュと、指
定されたページのデータを前記メモリ更新トレースキャ
ッシュから取り出し、該メモリ更新トレースキャッシュ
から削除するトレースキャッシュフラッシュ手段と、前
記メモリ上の前記更新データを有するページの内、未だ
前記2次記憶装置へ該更新データを出力していないペー
ジを取得し、前記トレースキャッシュフラッシュ手段に
より該ページの該更新データを前記メモリ更新トレース
キャッシュから取り出し、該2次記憶装置へ出力する更
新イメージ出力手段と、前記メモリ更新トレースキャッ
シュの使用容量を監視し、予め設定した値以上に該メモ
リ更新トレースキャッシュの使用率が高くなった場合、
前記更新イメージ出力手段により前記メモリ上の前記更
新データを有するページの内、未だ前記2次記憶装置へ
該更新データを出力していないページの該更新データを
該2次記憶装置へ出力するメモリ掃き出し契機検出手段
とから構成されている。
【0018】本発明の第3の計算機システムのメモリ障
害回復システムは、仮想記憶方式を採用し、CPU、メ
モリ、キャッシュメモリ、および2次記憶装置をシステ
ムバスで接続して構成される計算機システムにおいて、
前記CPUが前記キャッシュメモリのデータを更新し、
該更新データを前記システムバスを介して前記メモリに
書き出す際に、同様に該更新データを前記システムバス
を介して格納するメモリ更新トレースキャッシュと、指
定されたページのデータを前記メモリ更新トレースキャ
ッシュから取り出し、該メモリ更新トレースキャッシュ
から削除するトレースキャッシュフラッシュ手段と、指
定されたページのデータを前記トレースキャッシュフラ
ッシュ手段により前記メモリ更新トレースキャッシュか
ら取り出す更新イメージ出力手段と、前記メモリ上で更
新されたページのデータを、前記更新イメージ出力手段
により前記メモリ更新トレースキャッシュから取り出し
て前記2次記憶装置に出力する仮想記憶手段とから構成
されている。
【0019】本発明の第4の計算機システムのメモリ障
害回復システムは、仮想記憶方式を採用し、CPU、メ
モリ、キャッシュメモリ、および2次記憶装置をシステ
ムバスで接続して構成される計算機システムにおいて、
前記CPUが前記キャッシュメモリのデータを更新し、
該更新データを前記システムバスを介して前記メモリに
書き出す際に、同様に該更新データを前記システムバス
を介して格納するメモリ更新トレースキャッシュと、指
定されたページのデータを前記メモリ更新トレースキャ
ッシュから取り出し、該メモリ更新トレースキャッシュ
から削除するトレースキャッシュフラッシュ手段と、前
記データを前記2次記憶装置に出力する仮想記憶手段
と、前記メモリの障害を検出するメモリ障害検出手段
と、前記メモリ障害検出手段により障害が検出された前
記メモリのページを閉塞し、該ページのデータが2次記
憶装置に出力済みか否かを判定するメモリ部分閉塞手段
と、前記メモリ部分閉塞手段が、障害が検出されたペー
ジのデータが2次記憶装置に未出力であると判定した場
合、該ページのデータを前記トレースキャッシュフラッ
シュ手段により前記メモリ更新トレースキャッシュから
取り出し、前記仮想記憶手段により前記2次記憶装置へ
出力する更新イメージ出力手段とから構成されている。
【0020】本発明の第5の計算機システムのメモリ障
害回復システムは、仮想記憶方式を採用し、CPU、メ
モリ、キャッシュメモリ、および2次記憶装置をシステ
ムバスで接続して構成される計算機システムにおいて、
前記CPUが前記キャッシュメモリのデータを更新し、
該更新データを前記システムバスを介して前記メモリに
書き出す際に、同様に該更新データを前記システムバス
を介して格納するメモリ更新トレースキャッシュと、指
定されたページのデータを前記メモリ更新トレースキャ
ッシュから取り出し、該メモリ更新トレースキャッシュ
から削除するトレースキャッシュフラッシュ手段と、前
記メモリ上の前記更新データを有するページの内、未だ
前記2次記憶装置へ該更新データを出力していないペー
ジを取得するとともに、該更新データを該2次記憶装置
に出力する仮想記憶手段と、前記仮想記憶手段により前
記メモリ上の前記更新データを有するページの内、未だ
前記2次記憶装置へ該更新データを出力していないペー
ジを取得し、前記トレースキャッシュフラッシュ手段に
より該ページの該更新データを前記メモリ更新トレース
キャッシュから取り出し、前記仮想記憶手段により該2
次記憶装置へ出力する更新イメージ出力手段と、前記メ
モリ更新トレースキャッシュの使用容量を監視し、予め
設定した値以上に該メモリ更新トレースキャッシュの使
用率が高くなった場合、前記更新イメージ出力手段によ
り前記メモリ上の前記更新データを有するページの内、
未だ前記2次記憶装置へ該更新データを出力していない
ページの該更新データを該2次記憶装置へ出力するメモ
リ掃き出し契機検出手段とから構成されている。
【0021】
【発明の実施の形態】以下、本発明の一実施例につい
て、図を参照しながら詳細に説明する。
【0022】図1を参照すると、本発明の一実施例であ
る計算機システムのメモリ障害回復システムは、計算機
システム14と、CPU1と、プログラムおよびデータ
を格納するメモリ2と、2次記憶装置3と、2次記憶装
置3をアクセスするための入出力装置4と、CPU1が
メモリ2とのデータアクセスを高速に行うためのキャッ
シュメモリ5と、メモリ更新トレースキャッシュ6と、
各々の装置を接続するシステムバス7と、メモリ障害検
出手段8と、メモリ部分閉塞手段9と、仮想記憶手段1
0と、トレースキャッシュフラッシュ手段11と、更新
イメージ出力手段12と、メモリ掃き出し契機検出手段
13とから構成されている。
【0023】以下に図2を参照して、メモリ障害検出手
段8の動作を説明する。
【0024】メモリ障害検出手段8は、メモリ2の障害
を検出すると、メモリ部分閉塞手段9を起動し(ステッ
プ201)、メモリ2上の障害となった部分のプログラ
ム又はデータ(以下、単にデータと表す)が、2次記憶
装置3に出力済みのデータであるか否かを判定し(ステ
ップ202)、すでに2次記憶装置3に出力済みのデー
タであると判定した場合(以下、2次記憶装置更新済み
データと表す)、メモリ障害検出手段8は動作を完了す
る。
【0025】メモリ障害検出手段8は、ステップ202
において、未だ2次記憶装置3への出力が行われていな
いデータであると判定した場合(以下、2次記憶装置未
更新データと表す)は、メモリ2上の障害となった部分
のアドレスをパラメータとして、更新イメージ出力手段
12を障害モードで起動し、動作を完了する(ステップ
203)。
【0026】以下に図3を参照して、メモリ部分閉塞手
段9の動作を説明する。
【0027】メモリ部分閉塞手段9は、メモリ障害検出
手段8により起動され、仮想記憶手段10により、障害
部分の閉塞、すなわちメモリ2の障害部分をアクセス禁
止状態にし(ステップ301)、さらに仮想記憶手段1
0により、メモリ2の障害部分に属するデータが2次記
憶装置未更新データかどうかを確認した後、結果を起動
元のメモリ障害検出手段8に返却し、動作を完了する
(ステップ302)。
【0028】以下に図4を参照して、更新イメージ出力
手段12の動作を説明する。
【0029】更新イメージ出力手段12は、メモリ障害
検出手段8から、メモリ2上の障害となった部分のアド
レスをパラメータとして障害モードで起動され、また仮
想記憶手段10からは、メモリ2上の掃き出し対象とな
った部分のアドレスをパラメータとし、通常モードで起
動される。
【0030】また、メモリ掃き出し契機検出手段13か
ら、パラメータなしの通常モードで起動される。
【0031】更新イメージ出力手段12は、パラメータ
の指定有りで起動されたか、指定無しで起動されたかを
判定し(ステップ401)、パラメータ指定無しで起動
された場合には、仮想記憶手段10を用いてメモリ上の
2次記憶装置未更新データのアドレスを取得する(ステ
ップ402)。
【0032】更新イメージ出力手段12は、パラメータ
の指定有りで起動された場合には、パラメータとして受
け取ったアドレスをパラメータとして、トレースキャッ
シュフラッシュ手段11を起動し、ステップ402終了
後には、メモリ上の2次記憶装置未更新データのアドレ
スをパラメータとしてトレースキャッシュフラッシュ手
段11を起動する(ステップ403)。
【0033】次に更新イメージ出力手段12は、仮想記
憶手段10によりトレースキャッシュフラッシュ手段1
1から得たデータを入出力装置4を介して2次記憶装置
3に出力する(ステップ404)。
【0034】さらに更新イメージ出力手段12は、自身
が障害モードで起動されたか否かを判定し(ステップ4
05)、障害モードで起動されたと判定した場合には、
そのまま処理を完了する。
【0035】更新イメージ出力手段12は、ステップ4
05において、障害モードではなく、通常モードで起動
されたと判定した場合には、仮想記憶手段10により、
2次記憶装置3に出力したデータに対応するメモリ2上
のデータを2次記憶装置更新済みデータとし、処理を完
了する(ステップ406)。
【0036】以下に図5を参照して、トレースキャッシ
ュフラッシュ手段11の動作を説明する。
【0037】トレースキャッシュフラッシュ手段11
は、更新イメージ出力手段12よりパラメータとして渡
されたアドレスに対応するデータをメモリ更新トレース
キャッシュ6より取得し(ステップ501)、該取得し
たデータをメモリ更新トレースキャッシュ6から削除
し、該取得したデータを更新イメージ出力手段12に返
却し、処理を完了する(ステップ502)。
【0038】以下に図6を参照して、メモリ掃き出し契
機検出手段13の動作を説明する。
【0039】メモリ掃き出し契機検出手段13は、メモ
リ更新トレースキャッシュ6に空きが無くなった場合
に、メモリ更新トレースキャッシュ6から起動され、更
新イメージ出力手段12を通常モードで起動し(ステッ
プ601)、メモリ更新トレースキャッシュ6の使用率
が80%以下かどうかを判定し(ステップ602)、使
用率が80%より大きい場合にはステップ601に戻
り、80%以下の場合には処理を完了する。
【0040】以下に図7、図8を参照して、仮想記憶手
段10が、メモリ部分閉塞手段9によって指定されたメ
モリ2の障害部分に属するデータが2次記憶装置未更新
データかどうかを判断するために用いるメモリ更新フラ
グ701と、該メモリ更新フラグ701のセット/リセ
ット動作について説明する。
【0041】一般的に仮想記憶手段は、磁気ディスク等
の2次記憶装置をメモリの延長として利用する機能であ
り、本発明においても、この点に関しては同様である。
この仮想記憶手段には、メモリとメモリの延長として利
用する磁気ディスク等の2次記憶装置とを管理する単位
が存在する。この管理単位が何であるかは、仮想記憶手
段の実現方式に依存し、固定長のページを単位にする場
合や、論理的な塊であるセグメントを単位とする場合等
が一般的であるが、本発明では、特にこの管理単位を限
定しない。ただし、この管理単位が、メモリ障害時の閉
塞の単位であり、かつ障害データが2次記憶装置3へ出
力済みかどうかを判定する単位である。障害データが2
次記憶装置3へ出力済みかどうかの判定は、仮想記憶の
管理単位ごとに存在するメモリ更新フラグ701によっ
て行われる。
【0042】図7は、管理単位を固定長のページとした
場合のメモリ更新フラグ701の定義の例である。メモ
リ更新フラグ701は、メモリ2上のページに対して1
対1で対応しており、メモリ更新フラグ701の値が0
の場合は、対応するページが更新されていないことを示
し、1の場合は、対応するページが更新されたことを示
す。
【0043】仮想記憶手段10は、メモリ更新命令が実
行されると(ステップ801)、更新箇所のページに対
応するメモリ更新フラグ701に1をセットする(ステ
ップ802)。
【0044】仮想記憶手段10は、メモリ2上のページ
に対する2次記憶装置3への出力要求を受けると(ステ
ップ803)、該ページのメモリ更新フラグ701が0
か1かを判定し(ステップ804)、メモリ更新フラグ
701が1の場合には、該ページを2次記憶装置3に出
力して、さらにメモリ更新フラグ701に0をセットす
る(ステップ805)。メモリ更新フラグ701が0の
場合には、該ページをメモリ上、未使用状態にする(ス
テップ806)。
【0045】このように、障害が発生したページに対応
するメモリ更新フラグ701をチェックすることで、該
障害が発生したページのデータの2次記憶装置3への書
き出しが完了しているか否かを判定することができる。
【0046】以下に本発明の一実施例である計算機シス
テムのメモリ障害回復システムについて、図1〜図8を
参照して説明する。
【0047】CPU1は、キャッシュメモリ5を介して
メモリ2上のプログラムおよびデータをアクセスしなが
らプログラムの実行を行う。
【0048】CPU1が、キャッシュメモリ5の更新を
行うと、その更新データはシステムバス7を経由して、
メモリ2に反映されると同時に、同じくシステムバス7
を経由して、メモリ更新トレースキャッシュ6に反映さ
れる。
【0049】この際、仮想記憶手段10は、メモリ2上
の更新データが反映されたページに対応するメモリ更新
フラグ701に1をセットする。この時のデータの状態
が2次記憶装置未更新データである。さらに仮想記憶手
段10は、メモリの負荷状態に従って、メモリ2上の更
新データが反映されたページのアドレスをパラメータと
して通常モードで更新イメージ出力手段12を起動す
る。
【0050】更新イメージ出力手段12は、仮想記憶手
段10に起動されると、パラメータで指定されたアドレ
スをパラメータとしてトレースキャッシュフラッシュ手
段11を起動し、メモリ更新トレースキャッシュ6の該
当アドレスのデータ、すなわち更新データを取り出すと
ともに、その更新データをメモリ更新トレースキャッシ
ュ6から削除する。
【0051】更新イメージ出力手段12は、トレースキ
ャッシュフラッシュ手段11によりメモリ更新トレース
キャッシュ6から取り出した更新データを、仮想記憶手
段10により、入出力装置4を介して2次記憶装置3に
出力する。
【0052】以上の処理により、メモリ2上のデータ
は、そのデータが、2次記憶装置未更新データであった
場合は、そのコピーが2次記憶装置3にはなく、メモリ
更新トレースキャッシュ6にのみ存在し、データが2次
記憶装置更新済みデータであった場合には、そのコピー
が2次記憶装置3にのみ存在し、メモリ更新トレースキ
ャッシュ6には存在しないように制御される。
【0053】この処理は、メモリ2の更新とメモリ更新
トレースキャッシュ6の更新が並行に動作するため、メ
モリ更新トレースキャッシュ6を持たない計算機システ
ムと比較しても性能がほとんど低下することがない。
【0054】運用中にメモリ2に障害が発生し、障害が
発生したページのデータが破壊されてしまった場合に
は、メモリ障害検出手段8が、該障害を検出し、障害の
発生したページのアドレスをパラメータとしてメモリ部
分閉塞手段9を起動する。
【0055】メモリ部分閉塞手段9は、メモリ障害検出
手段8からパラメータとして障害ページのアドレスを渡
されて起動されると、仮想記憶手段10により、該障害
ページに対応するメモリ更新フラグ701をチェック
し、該障害ページが2次記憶装置未更新データである
か、2次記憶装置更新済みデータであるかを起動元のメ
モリ障害検出手段8に返却する。
【0056】さらにメモリ部分閉塞手段9は、仮想記憶
手段10により、メモリ2の障害ページを以降アクセス
できないように閉塞する。
【0057】メモリ障害検出手段8は、メモリ部分閉塞
手段9から返却された障害ページの状態が、2次記憶更
新済みデータであった場合には、そのまま処理を完了す
るが、2次記憶装置未更新データであった場合には、更
新イメージ出力手段12を、障害データのアドレスをパ
ラメータとして、障害モードで起動し、処理を完了す
る。
【0058】メモリ障害検出手段8から、障害ページの
アドレスをパラメータとして、障害モードで起動された
更新イメージ出力手段12は、パラメータとして受け取
った障害ページのアドレスをパラメータとして、トレー
スキャッシュフラッシュ手段11を起動し、メモリ更新
トレースキャッシュ6から、指定したアドレスに対応す
るデータ、すなわち、メモリ障害によりメモリ2上から
消失したデータのコピーを取得するとともに、メモリ更
新トレースキャッシュ6から、該データを削除する。
【0059】更新イメージ出力手段12は、トレースキ
ャッシュフラッシュ手段11から得たメモリ2上から消
失したデータのコピーを、仮想記憶手段10により入出
力装置4を介し、2次記憶装置3に出力する。
【0060】さらに更新イメージ出力手段12は、メモ
リ2上の障害ページに対応するメモリ更新フラグ701
をリセットして、該ページのデータを2次記憶装置更新
済みデータとし、処理を完了する。
【0061】以降、障害となったメモリ上のデータへの
アクセスは、通常ミッシングページとして処理され、2
次記憶装置から正常なメモリに読み出されて処理され
る。
【0062】以上により、本発明の一実施例である計算
機システムのメモリ障害回復システムの処理が完了す
る。
【0063】本発明の一実施例である計算機システムの
メモリ障害回復システムは、メモリ2でメモリ障害が発
生し、障害箇所のデータが失われてしまっても、メモリ
更新トレースキャッシュ6上に保持されているデータの
コピーを2次記憶装置3に出力することで、該障害デー
タを完全に復旧することができる効果を有している。
【0064】
【発明の効果】以上説明したように、本発明の計算機シ
ステムのメモリ障害回復方法および回復システムは、メ
モリに障害が発生し、メモリ上のデータが喪失した場合
に、メモリの障害箇所を閉塞してメモリ容量が減少する
以外に、計算機システムに影響を及ぼすことなく、障害
が発生していない通常時の性能を低下させずに、該デー
タを復旧することができ、計算機システムの運用を継続
することができるようにすることができる効果を有して
いる。
【図面の簡単な説明】
【図1】本発明の一実施例を示すブロック図である。
【図2】本発明の一実施例におけるメモリ障害検出手段
8の処理を示す流れ図である。
【図3】本発明の一実施例におけるメモリ部分閉塞手段
9の処理を示す流れ図である。
【図4】本発明の一実施例における更新イメージ出力手
段12の処理を示す流れ図である。
【図5】本発明の一実施例におけるトレースキャッシュ
フラッシュ手段11の処理を示す流れ図である。
【図6】本発明の一実施例におけるメモリ掃き出し契機
検出手段13の処理を示す流れ図である。
【図7】本発明の一実施例におけるメモリ更新フラグ7
01の内容を示す図である。
【図8】本発明の一実施例における仮想記憶手段10に
よるメモリ更新フラグ701のセット/リセット処理を
示す流れ図である。
【符号の説明】
1 CPU 2 メモリ 3 2次記憶装置 4 入出力装置 5 キャッシュメモリ 6 メモリ更新トレースキャッシュ 7 システムバス 8 メモリ障害検出手段 9 メモリ部分閉塞手段 10 仮想記憶手段 11 トレースキャッシュフラッシュ手段 12 更新イメージ出力手段 13 メモリ掃き出し契機検出手段 14 計算機システム 701 メモリ更新フラグ

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】 仮想記憶方式を採用し、CPU、メモ
    リ、キャッシュメモリ、および2次記憶装置をシステム
    バスで接続し、前記CPUが前記キャッシュメモリのデ
    ータを更新し、該更新データを前記システムバスを介し
    て前記メモリに書き出す際に、同様に該更新データを前
    記システムバスを介して格納するメモリ更新トレースキ
    ャッシュを備えた計算機システムにおいて、 障害が発生した前記メモリのページを閉塞し、閉塞した
    ページの内、更新データを2次記憶装置に未出力のペー
    ジのデータを前記メモリ更新トレースキャッシュから取
    り出して前記2次記憶装置へ出力し、その後、該データ
    を該メモリ更新トレースキャッシュから削除することを
    特徴とする計算機システムのメモリ障害回復方法。
  2. 【請求項2】 仮想記憶方式を採用し、CPU、メモ
    リ、キャッシュメモリ、および2次記憶装置をシステム
    バスで接続し、前記CPUが前記キャッシュメモリのデ
    ータを更新し、該更新データを前記システムバスを介し
    て前記メモリに書き出す際に、同様に該更新データを前
    記システムバスを介して格納するメモリ更新トレースキ
    ャッシュを備えた計算機システムにおいて、 前記メモリ更新トレースキャッシュの使用容量を監視
    し、予め設定した値以上に該メモリ更新トレースキャッ
    シュの使用率が高くなった場合、前記メモリ上の前記更
    新データを有するページの内、未だ前記2次記憶装置へ
    該更新データを出力していないページを取得し、該ペー
    ジの該更新データを前記メモリ更新トレースキャッシュ
    から取り出して該2次記憶装置へ出力し、その後、該更
    新データを該メモリ更新トレースキャッシュから削除す
    ることを特徴とする計算機システムのメモリ障害回復方
    法。
  3. 【請求項3】 仮想記憶方式を採用し、CPU、メモ
    リ、キャッシュメモリ、および2次記憶装置をシステム
    バスで接続して構成される計算機システムにおいて、 前記CPUが前記キャッシュメモリのデータを更新し、
    該更新データを前記システムバスを介して前記メモリに
    書き出す際に、同様に該更新データを前記システムバス
    を介して格納するメモリ更新トレースキャッシュと、 指定されたページのデータを前記メモリ更新トレースキ
    ャッシュから取り出し、該メモリ更新トレースキャッシ
    ュから削除するトレースキャッシュフラッシュ手段と、 障害が発生した前記メモリのページを閉塞するメモリ部
    分閉塞手段と、 前記メモリ部分閉塞手段が閉塞したページの内、更新デ
    ータを2次記憶装置に未出力のページのデータを前記ト
    レースキャッシュフラッシュ手段により前記メモリ更新
    トレースキャッシュから取り出し、前記2次記憶装置へ
    出力する更新イメージ出力手段と を備えたことを特徴と
    する計算機システムのメモリ障害回復システム。
  4. 【請求項4】 仮想記憶方式を採用し、CPU、メモ
    リ、キャッシュメモリ、および2次記憶装置をシステム
    バスで接続して構成される計算機システムにおいて、 前記CPUが前記キャッシュメモリのデータを更新し、
    該更新データを前記システムバスを介して前記メモリに
    書き出す際に、同様に該更新データを前記システムバス
    を介して格納するメモリ更新トレースキャッシュと、 指定されたページのデータを前記メモリ更新トレースキ
    ャッシュから取り出し、該メモリ更新トレースキャッシ
    ュから削除するトレースキャッシュフラッシュ手段と、 前記メモリ上の前記更新データを有するページの内、未
    だ前記2次記憶装置へ該更新データを出力していないペ
    ージを取得し、前記トレースキャッシュフラッシュ手段
    により該ページの該更新データを前記メモリ更新トレー
    スキャッシュから取り出し、該2次記憶装置へ出力する
    更新イメージ出力手段と、 前記メモリ更新トレースキャッシュの使用容量を監視
    し、予め設定した値以上に該メモリ更新トレースキャッ
    シュの使用率が高くなった場合、前記更新イメージ出力
    手段により前記メモリ上の前記更新データを有するペー
    ジの内、未だ前記2次記憶装置へ該更新データを出力し
    ていないページの該更新データを該2次記憶装置へ出力
    するメモリ掃き出し契機検出手段と を備えたことを特徴
    とする計算機システムのメモリ障害回復システム。
  5. 【請求項5】 仮想記憶方式を採用し、CPU、メモ
    リ、キャッシュメモリ 、および2次記憶装置をシステム
    バスで接続して構成される計算機システムにおいて、 前記CPUが前記キャッシュメモリのデータを更新し、
    該更新データを前記システムバスを介して前記メモリに
    書き出す際に、同様に該更新データを前記システムバス
    を介して格納するメモリ更新トレースキャッシュと、 指定されたページのデータを前記メモリ更新トレースキ
    ャッシュから取り出し、該メモリ更新トレースキャッシ
    ュから削除するトレースキャッシュフラッシュ手段と、 指定されたページのデータを前記トレースキャッシュフ
    ラッシュ手段により前記メモリ更新トレースキャッシュ
    から取り出す更新イメージ出力手段と、 前記メモリ上で更新されたページのデータを、前記更新
    イメージ出力手段により前記メモリ更新トレースキャッ
    シュから取り出して前記2次記憶装置に出力する仮想記
    憶手段と を備えたことを特徴とする計算機システムのメ
    モリ障害回復システム。
  6. 【請求項6】 仮想記憶方式を採用し、CPU、メモ
    リ、キャッシュメモリ、および2次記憶装置をシステム
    バスで接続して構成される計算機システムにおいて、 前記CPUが前記キャッシュメモリのデータを更新し、
    該更新データを前記システムバスを介して前記メモリに
    書き出す際に、同様に該更新データを前記システムバス
    を介して格納するメモリ更新トレースキャッシュと、 指定されたページのデータを前記メモリ更新トレースキ
    ャッシュから取り出し、該メモリ更新トレースキャッシ
    ュから削除するトレースキャッシュフラッシュ手段と、 前記データを前記2次記憶装置に出力する仮想記憶手段
    と、 前記メモリの障害を検出するメモリ障害検出手段と、 前記メモリ障害検出手段により障害が検出された前記メ
    モリのページを閉塞し、該ページのデータが2次記憶装
    置に出力済みか否かを判定するメモリ部分閉塞手段と、 前記メモリ部分閉塞手段が、障害が検出されたページの
    データが2次記憶装置 に未出力であると判定した場合、
    該ページのデータを前記トレースキャッシュフラッシュ
    手段により前記メモリ更新トレースキャッシュから取り
    出し、前記仮想記憶手段により前記2次記憶装置へ出力
    する更新イメージ出力手段と を備えたことを特徴とする
    計算機システムのメモリ障害回復システム。
  7. 【請求項7】 仮想記憶方式を採用し、CPU、メモ
    リ、キャッシュメモリ、および2次記憶装置をシステム
    バスで接続して構成される計算機システムにおいて、 前記CPUが前記キャッシュメモリのデータを更新し、
    該更新データを前記システムバスを介して前記メモリに
    書き出す際に、同様に該更新データを前記システムバス
    を介して格納するメモリ更新トレースキャッシュと、 指定されたページのデータを前記メモリ更新トレースキ
    ャッシュから取り出し、該メモリ更新トレースキャッシ
    ュから削除するトレースキャッシュフラッシュ手段と、 前記メモリ上の前記更新データを有するページの内、未
    だ前記2次記憶装置へ該更新データを出力していないペ
    ージを取得するとともに、該更新データを該2次記憶装
    置に出力する仮想記憶手段と、 前記仮想記憶手段により前記メモリ上の前記更新データ
    を有するページの内、未だ前記2次記憶装置へ該更新デ
    ータを出力していないページを取得し、前記トレースキ
    ャッシュフラッシュ手段により該ページの該更新データ
    を前記メモリ更新トレースキャッシュから取り出し、前
    記仮想記憶手段により該2次記憶装置へ出力する更新イ
    メージ出力手段と、 前記メモリ更新トレースキャッシュの使用容量を監視
    し、予め設定した値以上に該メモリ更新トレースキャッ
    シュの使用率が高くなった場合、前記更新イメージ出力
    手段により前記メモリ上の前記更新データを有するペー
    ジの内、未だ前記2次記憶装置へ該更新データを出力し
    ていないページの該更新データを該2次記憶装置へ出力
    するメモリ掃き出し契機検出手段と を備えたことを特徴
    とする計算機システムのメモリ障害回復システム。
JP7241329A 1995-09-20 1995-09-20 計算機システムのメモリ障害回復方法および回復システム Expired - Fee Related JP3070453B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7241329A JP3070453B2 (ja) 1995-09-20 1995-09-20 計算機システムのメモリ障害回復方法および回復システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7241329A JP3070453B2 (ja) 1995-09-20 1995-09-20 計算機システムのメモリ障害回復方法および回復システム

Publications (2)

Publication Number Publication Date
JPH0981464A JPH0981464A (ja) 1997-03-28
JP3070453B2 true JP3070453B2 (ja) 2000-07-31

Family

ID=17072683

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7241329A Expired - Fee Related JP3070453B2 (ja) 1995-09-20 1995-09-20 計算機システムのメモリ障害回復方法および回復システム

Country Status (1)

Country Link
JP (1) JP3070453B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230060741A (ko) 2021-10-28 2023-05-08 정정모 환경미화원용 청소비 세트

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100755700B1 (ko) 2005-12-27 2007-09-05 삼성전자주식회사 비휘발성 메모리가 캐쉬로 사용되는 저장 장치 및 그 관리방법
JP4911198B2 (ja) 2009-06-03 2012-04-04 富士通株式会社 ストレージ制御装置、ストレージシステムおよびストレージ制御方法
JP4877396B2 (ja) * 2010-01-20 2012-02-15 日本電気株式会社 メモリ障害処理システム、および、メモリ障害処理方法
IL208641A0 (en) * 2010-10-12 2010-12-30 Eci Telecom Ltd Method for accelerating start up of a computerized system
EP3249537B1 (en) 2013-06-12 2019-02-27 NIKE Innovate C.V. Method for wearable device assembly with ability to mitigate date loss due to component failure
JP7207960B2 (ja) * 2018-11-09 2023-01-18 ファナック株式会社 監視装置及び監視方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230060741A (ko) 2021-10-28 2023-05-08 정정모 환경미화원용 청소비 세트

Also Published As

Publication number Publication date
JPH0981464A (ja) 1997-03-28

Similar Documents

Publication Publication Date Title
EP0566966B1 (en) Method and system for incremental backup copying of data
US7085955B2 (en) Checkpointing with a write back controller
KR100204027B1 (ko) 이중면 비휘발성 메모리를 이용한 데이타베이스 회복 장치 및 그 방법
US7433898B1 (en) Methods and apparatus for shared storage journaling
US7231544B2 (en) Restoring data from point-in-time representations of the data
JP4073464B2 (ja) リード・バッファを用いたフォールト・トレラント・コンピュータ・システム用主メモリ・システムおよびチェックポインティング・プロトコル
US7853825B2 (en) Methods and apparatus for recovering from fatal errors in a system
US6738863B2 (en) Method for rebuilding meta-data in a data storage system and a data storage system
US7840768B2 (en) Memory-controller-embedded apparatus and procedure for achieving system-directed checkpointing without operating-system kernel support
US7293146B1 (en) Method and apparatus for restoring a corrupted data volume
US5684944A (en) Atomic update of EDC protected data
US7418624B2 (en) Hot standby system
JP3070453B2 (ja) 計算機システムのメモリ障害回復方法および回復システム
US20220374310A1 (en) Write request completion notification in response to partial hardening of write data
JP2000293391A (ja) 大規模メモリシステム管理方法および装置
JP2001109635A (ja) 障害対処方法及びコンピュータシステム読み取り可能な記録媒体
USRE45632E1 (en) Memory-controller-embedded apparatus and procedure for achieving system-directed checkpointing without operating-system kernel support
JPH03265951A (ja) 故障回復型計算機
US20240070264A1 (en) Data storage device performing data protection and host device supporting a data protection function using a program context
KR20020047601A (ko) 주기억장치 상주형 데이터베이스 시스템에서 로그 처리를하지 않는 백업/회복 장치 및 그 방법
JP3555847B2 (ja) キャッシュメモリの障害処理装置、キャッシュメモリの障害処理方法、マルチプロセッサシステム
JP3450132B2 (ja) キャッシュ制御回路
JPH09212400A (ja) 耐故障性を備えたファイルシステム
JPH05216854A (ja) ホストコンピュータ装置
JPH10240620A (ja) コンピュータシステムおよび同システムにおけるチェックポイントイメージ保存方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000425

LAPS Cancellation because of no payment of annual fees