JPS6118786B2 - - Google Patents

Info

Publication number
JPS6118786B2
JPS6118786B2 JP53126211A JP12621178A JPS6118786B2 JP S6118786 B2 JPS6118786 B2 JP S6118786B2 JP 53126211 A JP53126211 A JP 53126211A JP 12621178 A JP12621178 A JP 12621178A JP S6118786 B2 JPS6118786 B2 JP S6118786B2
Authority
JP
Japan
Prior art keywords
computer
recovery
file
systems
abnormality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP53126211A
Other languages
English (en)
Other versions
JPS5553765A (en
Inventor
Toshio Hiraishi
Mitsuo Kawaji
Toshio Usui
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP12621178A priority Critical patent/JPS5553765A/ja
Publication of JPS5553765A publication Critical patent/JPS5553765A/ja
Publication of JPS6118786B2 publication Critical patent/JPS6118786B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 本発明は、マルチ計算機システムにおけるシス
テムダウン時におけるフアイル情報の乱れを他系
システムより自動的に回復する方法に関する。
従来のフアイルリカバリー処理では、マルチシ
ステムにおいても、フアイルの回復作業は自シス
テムにて行ない、自システムが死から生になつた
時点でフアイルの回復を行なつていた。この方式
では、システム間にて共用するフアイルを更新中
に、あるシステムがダウンした場合、このフアイ
ルは、そのシステムが生の状態になる迄回復作業
が行なわれず、他システムにて不合理な情報を使
用してしまい、全システムのダウンの原因となつ
てしまうことがあつた。
本発明の目的は、システム停止を他系が検知す
ると、直ちにダウンしたシステムになりかわりフ
アイルの回復作業を行ない、システム間共用フア
イルのデータの不合理をなくし、全システムのダ
ウンに至らせしめなくすることにある。
本発明は、フアイルリカバリー用情報をシステ
ム間にてアクセス可能な外部グローバルメモリに
常時スタツクしておき、システム間の相互監視に
て異常を検知したシステムではその情報により、
フアイルを回復するようにしたことに特徴があ
る。
マルチ計算機システムにおいては、通常システ
ム間共用フアイルを持つている。このフアイルの
用途は色々あるが、多くはシステム間におけるデ
ータの受け渡し、又は、システム状態表示用に利
用されている。システム間共用フアイルとは、フ
アイルのイメージは1ケ所で、複数のシステムか
ら同じ方法で同じ情報を同じ条件にてアクセス可
能なフアイルのことである。
第1図は、システム共用フアイルの図であり、
CPU―A,B,C,どの系からも読み書き可能
であることを示している。
従来のフアイルリカバリー処理では、システム
ダウンとなつた場合には、リカバリープログラム
自身も実行不可能であり、自システムが再び立上
がる迄フアイルの回復は行なわれないままであつ
た。従つて、システム間共用フアイルに関して
は、半ばあきらめていたのが現状である。
リカバリー処理とは、第2図に示す様に、ある
アプリケーシヨンプログラムの処理(ブロツクA
〜D)で更新される各情報の更新前の情報を、あ
る特別の保存バツフアに発生順に記録しておき、
リカバリー要求のあつたプログラムに対して記録
順の逆順に処理し、順次データを回復していく処
理(プログラム)のことである。
ここで共用フアイルのメインテナンス中のシス
テムダウンによるフアイル破壊例を図により説明
する。第4図は、あるKEY情報により複数レコ
ードにわたつてデータが作成されている図であ
る。レコード構成は、KEY情報を先頭に以下、
固有情報をnケース持ち、最後にチエイニングア
ドレス部3をもつた一般的なフアイル構成であ
る。第3図は、第4図で示すレコードアドレス2
0を削除する時のフアイル更新処理のフローチヤ
ートである。例えば、第2図のブロツクE,Fの
処理途中にて障害が発生した場合、ブロツクE迄
の処理が行なわれている為、レコードアドレス2
0が削除され、第5図に示す様にチエイニングが
切れてしまい、データ50,70の情報がなくな
つてしまい、尚かつ、レコードアドレス1が示す
レコードアドレスの情報もない状態となる。この
様なフアイル状態の時に他システムより本フアイ
ル情報を使用すると、他システムも次々とエラー
が発生し、システムダウンとなつてしまう。
本発明は、以上述べてきた不具合を解決すべ
く、次の2項目を実施することにより実現され
る。
1つは、従来より行なつているリカバリー用デ
ータの保存エリアを、今迄のシステム専用エリア
に持つことを止め、システム間にて自由にアクセ
ス可能な外部グローバルメモリ60に記録してい
く(61,62,63)。外部グローバルメモリ
は、CPUダウンとなつても全く影響を受けない
メモリで、電源もCPUとは別になつている。リ
カバリー用データを、このエリアに記録すること
により、どのシステムからでも容易にリカバリー
可能となる(第6図)。
もう1つは、お互いのシステム間にて常時監視
を行ない、監視先システムが正常であるかどうか
を調べる。監視先CPUはシステムが立上がつた
時に決まつており、第7図の様に、CPU―Bは
CPU―Aにて監視となる様にループ状になつて
いる。第8図は、CPU―Bがシステムダウンと
なり、CPU―AにてはCPU―Cと相互監視を行
なつている図である。
この様に相互監視は、システムがダウンとなる
毎に監視のループは小さくなつていき、システム
が再立上げとなると、ループに組み入れられる様
に構成する。
相互監視とは、あらかじめ定められたCPUに
対し、応答要求の割込みをかけ、その応答が規定
時間内に返つてくるか否かを監視する機能のこと
である。
第9図は、相互監視の概略図である。
相互監視処理は、周期タイマーにより起動され
ることにより、定期的に監視を行なつている。監
視プログラムは、相手系よりの応答時間間隔を必
要とする為、CPU内に持つている診断タイマー
にある時間をセツトし、監視先CPUに対し応答
要求の割込みをかける。正常であれば直ちに診断
タイマーをリセツトし、次の診断タイミング迄待
つわけであるが、この応答要求に対する正常な応
答が得られない場合(監視先CPUがダウン状
態)には、診断タイマーのタイムアツプによるレ
ベル0割込みが発生する。このレベル0の割込み
を第10図の如く、割込み要因の分析を行ない、
どのシステムのリカバリーを実行すべきかの判断
を行ない、自系のリカバリープログラムに連絡
(起動)する。リカバリープログラムは、システ
ムダウンとなつた系の外部グローバルメモリに記
録されている情報から、順次リカバリーを行なつ
ていく。この時に、リカバリーリンケージテーブ
ル上にあるリカバリー処理中マークを立てる。
又、リカバリー完了時点にても、リカバリー完了
マークを立てる。これはシステムダウンとなつた
系が再び立上がつたときに、二重にリカバリーさ
れるのを防止する為である。立上がつたシステム
においては、リカバリー処理中マークが立つてい
る場合には、リカバリー完了マークが立つ迄待つ
様にし(第11図)、リカバリー完了マークが立
つた時に初めて、ダウンしたシステムが立上がる
ことになる。
71はリカバリー処理中マーク、72はリカバ
リー完了マークである。
リカバリーリンケージテーブル上に何もない状
態のときには、従来通り、自系にてリカバリーを
行なう。これは1台にて稼動する場合に必要であ
る。
本処理方式により、マルチシステムにおけるシ
ステム共用フアイルの破壊による全システムダウ
ンの防止が可能となる。
本発明によれば、システム共用フアイルのリカ
バリーも可能である為、フアイル処理を含めたマ
ルチシステムが、自由に構成できる効果がある。
【図面の簡単な説明】
第1図はシステム間共用フアイルの概念図であ
り、第2図はフアイルリカバリー方式の図、第3
図から第5図迄はフアイル破壊例の説明図で、第
6図はリカバリー用データを外部グローバルメモ
リに記録している図、第7図、第8図は相互監視
を行なつている図、第9図は相互監視の概略図で
あり、第10図は相互監視エラーを検知した
CPUの要因判断のフロー、第11図はシステム
が再び立上がる際のフローチヤートである。 1…KEY部、2…固有情報部、3…チエイニ
ング部。

Claims (1)

  1. 【特許請求の範囲】 1 共有メモリを有するマルチ計算機システムに
    おいて、 該マルチ計算機を構成する各々の計算機のアプ
    リケーシヨンプログラムの実行処理により該各々
    の計算機に関する情報が更新されるとき該更新前
    の情報を更新発生順に保存しておくリカバリー用
    データ記憶域を該共有メモリに設けて各々の計算
    機について記憶し 該各々の計算機はあらかじめ定められた他の計
    算機の正常異常を監視し、 該監視により他の計算機の異常を検知したとき
    は該マルチ計算機システムから当該異常が検知さ
    れた計算機を除く他の計算機でマルチ計算機シス
    テムを構成し、 該他の計算機の異常を検知した計算機は該共有
    メモリ内の該他の計算機のリカバリー用データ記
    憶域のデータを用いて該他の計算機のフアイルデ
    ータを回復すること、 を特徴とするマルチ計算
    機システムにおけるフアイルリカバリー方法。
JP12621178A 1978-10-16 1978-10-16 File recovery method for multi-computer system Granted JPS5553765A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP12621178A JPS5553765A (en) 1978-10-16 1978-10-16 File recovery method for multi-computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP12621178A JPS5553765A (en) 1978-10-16 1978-10-16 File recovery method for multi-computer system

Publications (2)

Publication Number Publication Date
JPS5553765A JPS5553765A (en) 1980-04-19
JPS6118786B2 true JPS6118786B2 (ja) 1986-05-14

Family

ID=14929467

Family Applications (1)

Application Number Title Priority Date Filing Date
JP12621178A Granted JPS5553765A (en) 1978-10-16 1978-10-16 File recovery method for multi-computer system

Country Status (1)

Country Link
JP (1) JPS5553765A (ja)

Also Published As

Publication number Publication date
JPS5553765A (en) 1980-04-19

Similar Documents

Publication Publication Date Title
US7472139B2 (en) Database recovery method applying update journal and database log
JP2548480B2 (ja) アレイディスク装置のディスク装置診断方法
US7152184B2 (en) Storage device, backup method and computer program code of this storage device
JP5947327B2 (ja) 複数の格納媒体デバイスについてのファイルシステムバックアップのためのデバイス、格納媒体および方法
JP3481737B2 (ja) ダンプ採取装置およびダンプ採取方法
US20080114932A1 (en) Method, apparatus, and system for controlling data storage
JPS5913783B2 (ja) 2重化フアイル方式
JP4327503B2 (ja) ハードディスクの制御方法及び制御装置
JPS6118786B2 (ja)
JP4947062B2 (ja) 記憶装置、記録復旧方法、記録復旧プログラム
JPS63140352A (ja) オンライン・システムのデ−タ・ベ−ス記憶装置
JPH04369735A (ja) 計算機システムのバックアップ方式
JPS5944694B2 (ja) 磁気テ−プ制御方式
JPH0869593A (ja) プラント性能監視システム
JPS6383843A (ja) トレ−ス情報の収集方式
JP3189804B2 (ja) データバックアップ方法および装置
JPS62284440A (ja) 端末装置のソフトウエア資源保守方式
JP3191282B2 (ja) 障害情報データ収集方式
JP2844361B2 (ja) 異常回復処理方式
JP4878113B2 (ja) Dasd故障時のリンクライブラリの復旧方法、及びプログラム
JPS6398764A (ja) マルチ計算機システムにおけるフアイルリカバリ方式
JP2656499B2 (ja) 計算機システム
JP3003035B2 (ja) バックアップデータ管理方法
JPH0588988A (ja) デイスクアレイ装置及びデータの復元方法
JP2938088B2 (ja) 共有ファイルの障害回復方式