JPS597982B2 - 計算機システムのシステム障害時の再開始方式 - Google Patents

計算機システムのシステム障害時の再開始方式

Info

Publication number
JPS597982B2
JPS597982B2 JP53029953A JP2995378A JPS597982B2 JP S597982 B2 JPS597982 B2 JP S597982B2 JP 53029953 A JP53029953 A JP 53029953A JP 2995378 A JP2995378 A JP 2995378A JP S597982 B2 JPS597982 B2 JP S597982B2
Authority
JP
Japan
Prior art keywords
restart
failure
peripheral device
steps
satisfied
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP53029953A
Other languages
English (en)
Other versions
JPS54122947A (en
Inventor
康浩 森内
正博 倉田
肇 内藤
一良 俣野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Hitachi Ltd
NEC Corp
Nippon Telegraph and Telephone Corp
Original Assignee
Fujitsu Ltd
Hitachi Ltd
Nippon Telegraph and Telephone Corp
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd, Hitachi Ltd, Nippon Telegraph and Telephone Corp, Nippon Electric Co Ltd filed Critical Fujitsu Ltd
Priority to JP53029953A priority Critical patent/JPS597982B2/ja
Publication of JPS54122947A publication Critical patent/JPS54122947A/ja
Publication of JPS597982B2 publication Critical patent/JPS597982B2/ja
Expired legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)

Description

【発明の詳細な説明】 本発明は、計算機システムのシステム障害時における再
開始方式に関するものである。
一般に計算機システムでは、ハードウェアおよびソフト
ウェアの障害に対し、再実行・再試行による障害の回復
、冗長化による予備切換、罹障部位のみの部分閉塞等の
手段により、可用性の向上をはかつている。
しかし、全ての障害について対策を講じることは、経済
的にも技術的にも困難であり、重度のシステム障害は、
システム・ダウンすなわち本体系装置の停止の扱いとさ
れている。従来のシステムではシステム・ダウンした後
、システムが再開始されるためには、システム運用者が
、システム・ダウン状態であることを察知すること、シ
ステム再開始のためのハードウェア/ソフトウェア条件
を満足していることを判断すること、本体系装置を再構
成し初期化すること、装置番号の設定やボタンの押下な
どの操作により、ハードウエアのIPL機能を使つてシ
ステム開始プログラムを起動すること、当該プログラム
ヘコンソール装置を介して制御情報の受け渡しを行なう
ことなどの手順が必要であつた。また、この場合、シス
テム・ダウン時とシステム開始プログラム走行時との間
に時間的連続性がなく、主記憶装置上の内容の正当性が
保証されないため、当該プログラムではこれ等の情報を
2次記憶装置より再設定する必要があつた。このように
従来の再開始方式ではシステム運用者の操作・判断の手
順が介入するため、また2次記憶装置に対する入出力処
理が頻繁に行なわれるために、システム・ダウンからシ
ステム再開始完了までに時間を要すること、システム運
用者に負担がかかること、およびシステム運用者による
運転操作ミスの可能性があることなどの欠点があつた。
本発明の目的は、前記の如き従来の問題点を除去するも
のであり、システム・ダウンからシステム再開始終了ま
での時間の短縮、システム運用者の負担の軽減、および
誤操作の防止という効果を有するシステム障害時の再開
始方式を提供することである。
本発明の特徴は、従来「システム運用者+ハードウエア
のIPL機構」で実現していたシステム再開始の手順を
全て自動化したことにより再開始処理の高速化をはかつ
ていることである。
次に本発明の実施例につき図面を用いて詳細に説明する
第1図aおよびbはシステム障害発生時のシステム再開
始方式を説明するための図である。
1Aおよび1Bは論理装置を示し、2A,2Bおよび2
Cは主記憶装置、3Aおよび3Bは転送制御装置、4は
周辺装置をそれぞれ示している。
また5は論理装置間の信号線を、6〜11は論理装置と
主記憶装置間の信号線を、12〜17は主記憶装置と転
送制御装置間の信号線を、18〜21は論理装置と転送
制御装置間の信号線を、また22および23は転送制御
装置と周辺装置間の信号線をそれぞれ示している。周辺
装置4には、2次記憶装置や多数の各種入出力装置を含
んでいる。第1図aはシステム障害遭遇以前のシステム
構成を表わしており、論理装置が2台のマルチプロセツ
サ・システムの場合である。第1図bは、前述の構成に
おいて論理装置1Bの永久障害に対して本発明の再開始
方式を適用した結果のシステム構成の一例を表わしてい
る。システム生成時のパラメータとして、自動再開始不
可の指定がある場合、または、自動再開始のハードウエ
ア条件として論理装置2台以上の指定がある場合では、
第1図bのシステム構成とはならず、システム停止とな
る。次に全体的動作を第2図により説明する。ステツプ
25は再開始処理高速化のために障害発生以前に行なわ
れる事前処理を示す。まず一般ジヨブの処理に先立つて
主記憶情報が第1図に示す周辺装置4内の2次記憶装置
40に退避される。これは障害により無効となる主記憶
装置上の内容を迅速に復旧する意味で、2次記憶装置4
0にその写を取つておくものである。退避される情報は
処理が再開始できるに必要な一部の情報でよく、例えば
制御プログラムと該制御プログラム用のデータ(制御デ
ータ)とである。さらに再開始起動処理時に使う条件(
詳細後述)が設定され、主記憶装置上のプリフイツクス
・エリアに格納される。この条件は2つの主記憶装置に
格納しておくことによつて、障害時にもその内容が保障
されるようにするのが望ましい。第1図bの例では論理
装置1Bに永久障害が発生したケースを取り上げており
、26で示すようにハードウエア障害に応答して、ステ
ツプ27へ進む。
ステツプ27では、障害情報を分析し、障害種別、障害
装置番号の情報を障害識別メツセージとして組立て、主
記憶装置のプリフイツクス・エリアに格納する。ステツ
プ28ではこれに応じて罹障装置への信号線を切離し、
正常装置によるシステムの再構成を行なう。第1図bの
例では論理装置が1台のシステムとして再構成される。
第1図において周辺装置4は一つのプロツクとして示さ
れるが、入出力装置の1台に障害が発生した場合は該当
する1台の入出力装置が切離される。システムの再構成
が行なわれると、ステツプ29にて再構成後の構成で予
め設定されている自動再開始処理の前提となる最小構成
が確保されているかを判断する。この自動再開始処理の
前提となる最小構成とは、例えば正常な論理装置が1台
以上存在すること、正常な主記憶装置が2台以上存在す
ること、正常な転送制御装置が1台以上存在すること、
そしてシステム再開始処理自身で使用する入出力装置に
対して入出力動作が可能であることである。これが満足
されないとステツプ39に進み、システム停止となる。
一方、30で示すごとくソフトウエア障害の発生に際し
ては、ステツプ31で障害種別、障害検出個所を示すメ
ツセージを作成して主記憶装置のプリフイツクス・エリ
アに格納し、ステツプ32に進む。
ステツプ32では、システム生成時に設定された定数表
(ステツプ25で述べた条件)を参照して、本システム
カ相動再開始の適用をする指定があるか否かの確認を行
なう。
自動再開始を適用すると不都合の生ずるシステムでは、
自動再開始の適用をする旨の指定がなく、ステツプ39
へ進む。ステツプ33では、システム生成時に設定され
た定数表を参照して、本システムとしての自動再開始の
ためのハードウエア装配台数が確保されているか判断す
る。ステツプ29は再開始処理の最小構成を判断するも
ので、従つて例えば正常な論理装置が1台存在すれば満
足されたのに対し、ステツプ33では装置台数の指定機
能により、例えば高トラヒツクなマルチプロセツサ・シ
ステム(少なくとも正常な論理装置が2台必要)におけ
る論理装置の障害の場合、論理装置をフオールバツクさ
せた構成での自動再開始を抑止するものである。この場
合、ステツプ39へ進み、手動により、より構成の大き
い予備系への切換えを行なつて処理能力を確保するとい
う運用が可能となる。ステツプ29,32および33に
おける各条件が満足されていることが確認された場合、
ステツプ34へ進む。ステツプ34では、システム障害
の原因種別等、ステツプ27および31で組立てたメツ
セージおよび2次記憶装置40および2次記憶装置41
への使用可能なアクセスパス情報などを主記憶装置の所
定のエリアに移し、再開始プログラムへの引継ぎ制御情
報を格納する。次にステツプ35では、障害発生前に起
動した入出力動作要求が保留されている場合、それらを
初期化しておくため、ハードウエアに対するクリア・オ
ペレーシヨンを用いて入出力動作の未同期事象の解消を
はかる。
続いてステツプ36で再開始を行なうためのプログラム
(再開始プログラム)を2次記憶装置41より主記憶装
置へロードし、該再開始プログラムを起動する。
起動された再開始プログラムは、ステツプ34で格納さ
れた引継ぎ制御情報より2次記憶装置40への使用可能
なアクセス・パスを得て、主記憶情報の回復を行なう。
ステツプ38では、ステツプ27および31で作成した
メツセージを含む上述の引継ぎ情報などから障害メツセ
ージ得、これをシステム運用者用コンソールへ出力して
自動再開始処理を終了する。
本発明の特徴となる動作は、ステツプ28からステツプ
36までの、従来オペレータの介入を必要としていた手
順を自動化したこと、およびステツプ32,33により
、自動再開始処理の起動条件をシステムごとに設定可能
としたことである。さらにはステツプ25および37を
再開始処理と連動させることにより、再開始処理の高速
化をはかることも可能になる。またステツプ27,31
でメツセージを作成し、これを再開始プログラムへ引継
げば、システム障害前後での情報の引継ぎも可能となる
。以上説明したように、本発明により次のような効果が
得られる。
1.システム運用者の手動操作を、全てソフトウエアで
自動的に行なうため、処理が迅速に行なわれる。
2.システム運用者の判断動作を、予め定められた条件
にしたがつて自動的に行なうため、誤操作が防止できる
3.システム障害発生から再開始プログラム終了まで、
全てソフトウエアの制御の下に行なわれるため、フアイ
ル状態の把握が可能となり、システム障害前後での情報
の引継ぎが可能となる。
4.1,2によりシステム運用者の負担が軽減できる。
5.1,2,3により、システム障害発生から再開始終
了までの時間の短縮が可能となり、可能性が向上する。
【図面の簡単な説明】
第1図は、本発明の再開始方式の対象となるシステム構
成例を示すプロツク図、第2図は、本発明の動作を示す
流れ図である。 1Aおよび1B・・・・・・論理装置、2A,2Bおよ
び2C・・・・・・主記憶装置、3Aおよび3B・・・
・・・転送制御装置、4・・・・・・周辺装置、5・・
・・・・論理装置間の信号線、6〜11・・・・・・論
理装置と主記障装置間の信号線、12〜17・・・・・
・主記憶装置と転送制御装置間の信号線、8〜21・・
・・・・論理装置と転送制御装置間の信号線、22およ
び23・・・・・・転送制御装置と周辺装置間の信号線
、40および41・・・・・・2次記憶装置。

Claims (1)

  1. 【特許請求の範囲】 1 障害発生に応答してシステムの再構成を行なう第1
    ステップと、該再構成に応じて自動再開始に必要な最小
    システム構成が確保され、かつシステム生成時に定めら
    れたハードウェア条件およびソフトウェア条件が満足さ
    れているかを確認する第2ステップと、該第2ステップ
    で満足されていることが確認された後、周辺装置に対す
    る未同期事象を解消する第3ステップと、該第3ステッ
    プ後、再開始プログラムを起動して再開始を行なう第4
    ステップとからなることを特徴とする計算機システムの
    システム障害時の再開始方式。 2 障害発生に応答してシステムの再構成を行なう第1
    ステップと、該再構成に応じて自動再開始に必要な最小
    システム構成が確保され、かつシステム生成時に定めら
    れたハードウェア条件およびソフトウェア条件が満足さ
    れているかを確認する第2ステップと、該第2ステップ
    で満足されていることが確認された後、周辺装置に対す
    る未同期事象を解消する第3ステップと、該第3ステッ
    プ後、再開始プログラムを起動して再開始を行なう第4
    ステップとからなり、さらに上記ステップに加えて、上
    記障害発生前に主記憶情報を退避するステップと、上記
    第4ステップに続いて上記主記憶情報を回復するステッ
    プとを有することを特徴とする計算機システムのシステ
    ム障害時の再開始方式。
JP53029953A 1978-03-17 1978-03-17 計算機システムのシステム障害時の再開始方式 Expired JPS597982B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP53029953A JPS597982B2 (ja) 1978-03-17 1978-03-17 計算機システムのシステム障害時の再開始方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP53029953A JPS597982B2 (ja) 1978-03-17 1978-03-17 計算機システムのシステム障害時の再開始方式

Publications (2)

Publication Number Publication Date
JPS54122947A JPS54122947A (en) 1979-09-22
JPS597982B2 true JPS597982B2 (ja) 1984-02-22

Family

ID=12290341

Family Applications (1)

Application Number Title Priority Date Filing Date
JP53029953A Expired JPS597982B2 (ja) 1978-03-17 1978-03-17 計算機システムのシステム障害時の再開始方式

Country Status (1)

Country Link
JP (1) JPS597982B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58134344A (ja) * 1982-02-05 1983-08-10 Mitsubishi Electric Corp 計算機系の縮退運転装置
JPS59111539A (ja) * 1982-12-17 1984-06-27 Fujitsu Ltd 電子計算機システム
GB0314623D0 (en) * 2003-06-23 2003-07-30 Symbian Ltd A portable computing device with a non-volatile memory drive

Also Published As

Publication number Publication date
JPS54122947A (en) 1979-09-22

Similar Documents

Publication Publication Date Title
KR920003497B1 (ko) 억세스 손실 처리용 시스템 및 그 보호방법
US6622263B1 (en) Method and apparatus for achieving system-directed checkpointing without specialized hardware assistance
JP3481737B2 (ja) ダンプ採取装置およびダンプ採取方法
JP2005242404A (ja) コンピュータシステムの系切替方法
JPS597982B2 (ja) 計算機システムのシステム障害時の再開始方式
JP3022768B2 (ja) 仮想計算機システム
JP2002049509A (ja) データ処理システム
JP3335779B2 (ja) プラント性能監視システム
JPH04369735A (ja) 計算機システムのバックアップ方式
JPH07282022A (ja) マルチプロセッサシステム
JPS5929890B2 (ja) 予備切替制御方式
JP2872008B2 (ja) コンピュータシステムおよびそのシステム縮退運転実現方法
JPS59180897A (ja) バツテリバツクアツプメモリの二重化方式
JPH0277943A (ja) システムリカバリ方法
JPH07271611A (ja) プロセス自動再起動処理方式
JPS62212865A (ja) マルチプロセツサ制御方式
JP2528882B2 (ja) メモリ障害時のフォ−ルバック運用方式
JP2795246B2 (ja) メモリ二重化システムにおける割り込み処理時の障害リカバリ装置
JPS6242252A (ja) 通信制御装置切替方式
JP2530900B2 (ja) ロ―ディング装置
CN117785568A (zh) 一种双主双机热备方法及装置
JPH0119180B2 (ja)
JPH0727484B2 (ja) 計算機システムのデータ保存方法
JPH0287794A (ja) 電子交換システムの保守用プロセッサ
JPH04330531A (ja) チェックポイント処理方式