JPH03242739A - 障害解析情報収集方式 - Google Patents

障害解析情報収集方式

Info

Publication number
JPH03242739A
JPH03242739A JP2038294A JP3829490A JPH03242739A JP H03242739 A JPH03242739 A JP H03242739A JP 2038294 A JP2038294 A JP 2038294A JP 3829490 A JP3829490 A JP 3829490A JP H03242739 A JPH03242739 A JP H03242739A
Authority
JP
Japan
Prior art keywords
abnormality
specific address
information
analysis information
failure analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2038294A
Other languages
English (en)
Inventor
Yoshiyo Kawaguchi
河口 佳代
Toshiaki Miyake
三宅 敏章
Kazuto Nishihara
西原 一人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2038294A priority Critical patent/JPH03242739A/ja
Publication of JPH03242739A publication Critical patent/JPH03242739A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、システムプログラムの実行時に、情報処理シ
ステムの異常を検出した場合に、障害解析に必要となる
情報処理システム内の情報を収集する障害解析情報収集
方式に関する。
(従来の技術) 従来、この種の障害解析情報収集方式を第2図及び第3
図を用いて説明する。
第2図は情報処理システムの一例を示す構成図、第3図
は従来の動作説明のためのフローチャートである。
第2図において、1はコンピュータ、2及び3は夫々コ
ンピュータ1を構成する中央処理装置(以下、CPUと
いう。)及び主記憶装置(以下、MEMと略称する。)
、4はCPU2に接続された操作盤である。CPU2は
通信制御部5と基本部6とバス制御部7と状況記憶機構
8などから構成される。ここで、MEM3とCPU2内
の基本部6及び状況記憶機構8は、バス9で接続されて
いる。入出力装置としては、フロッピーデイスフ(FD
D)10.ディスク11.タイプライタ12及びプリン
タ13が用いられているが、これらのフロッピーディス
ク10.ディスク11゜タイプライタ12及びプリンタ
13は、CPtJ2内のバス制御部7に接続されている
このような構成の下に、動作について第3図を用いて説
明する。
プログラムがオペレーティングシステム(O3と略称す
る。)の実行中に異常検出した場合又は異常終了した場
合、CPU2は停止状態となり、デイスプレィに異常検
出の表示がなされる。従って、オペレータがデイスプレ
ィの表示により異常検出を知ると、オペレータは、障害
解析に必要となる情報処理システム内の情報収集とその
障害の解析を行なうべく次の処理を行なう。
即ち、オペレータは、操作盤4の“READY”キーの
押し下げ(ステップSl)、“5TART”キーの押し
下げ(ステップS2)を行なう。これらのキーの押し下
げにより、CPU2はMEM3における状況記憶機構8
の該当番地に異常があるか否かをチェックし、異常がな
ければ状況記憶機構8を動作させることにより、CPU
2のもっている情報(汎用レジスタの内容、制御レジス
タの内容、固定領域(システムエリア)の内容)をME
M3へ記憶させる。次に、CPU2は、レジデントダン
ブユーティリティに従ってMEM3に格納されている内
容を全てそっくりディスク11にローディングしく記憶
させ)(ステップS3)、これが終わるとCPU・ホー
ルト()IALT:停止)命令をシステムに出す(ステ
ップS4)。その後、オペレータがタイプライタ12で
コマンド入力を行なうことにより、CPU2はレジデン
トダンプファイル編集/出力ユーティリティに従って動
作する。即ち、CPU2は、ディスク11のレジデント
ダンプファイルの編集を行なった上で、プリンタ13を
通して出力する(ステップS5)。オペレータは、プリ
ンタ13にてプリントアウトされた情報をみて、何番地
のデータが抜けている、あるいは、誤っているとかチェ
ックすることにより、障害の解析を行なっていた。この
場合、MEM3の特定アドレス(状況記憶機構8の該当
番地)に無関係の障害情報、即ち業務障害情報やO8障
害情報(後述する第1図の業務手段20による異常検出
やスーパバイザ実行手段41による異常検出が行なわれ
た場合の障害情報に相当するもの。)がディスク11に
収集され、障害解析が行なわれることになる。
(発明が解決しようとする課題) しかしながら、上述した従来の障害解析情報収集方式で
は、デイスプレィに異常検出表示がなされ、オペレータ
が障害解析に必要な情報を収集する場合において、ME
M3の一部が破壊されてしまい、更に、状況記憶機構8
の該当番地の記憶内容に異常があったりすると、状況記
憶機構8の該当番地が判からなくなってしまい、状況記
憶機構8を利用することができなくなり、このためCP
U2の内容をMEM3に格納することができない。また
、その後のレジデントダンブユーティリティの利用もで
きないことになり、障害解析に必要な情報(障害解析情
報という。)も取得できないことになる。
このように、MEM3の一部が破壊されてしまうと、レ
ジデントダンブユーティリティを利用することができず
、オペレータは、ディスク11から障害解析に必要な情
報が得られない場合がある。
また、CPU2がレジデントダンブユーティリティに従
い、MEM3の全内容をディスク11にローディングし
終わる(移し終わる)と、CPU・ホールト(停止)と
なってしまうので、システム復旧のためには、オペレー
タが介入してシステムの再立ち上げを行なわなければな
らなかった。
そこで、本発明の目的は、障害が発生した場合に、障害
解析情報を自動的に確実に取得できるようにすると共に
、障害発生後のシステムの自動復旧の実現を図れるよう
にした、障害解析情報収集方式を提供することにある。
(課題を解決するための手段) 本発明は、情報処理システムの異常を検出した場合に、
障害解析に必要となる情報処理システム内の情報を収集
する障害解析情報収集方式において、主記憶装置の特定
アドレスをチェックし異常の有無を検出する特定アドレ
ス監視手段と、この特定アドレス監視手段による前記主
記憶装置の特定アドレスに対する異常検出や前記特定ア
ドレス監視手段以外の手段による情報処理システムに対
する異常検出に基づいて障害解析に必要となる情報処理
システム内の情報を収集する障害解析情報収集手段と、
この障害解析情報収集手段による障害解析情報の収集後
、前記情報処理システムの自動再立ち上げを行なう自動
再立ち上げ手段とを備えてなるものである。
(作用) 特定アドレス監視手段により主記憶装置の特定アドレス
における異常が検出された場合や特定アドレス監視手段
以外の手段による情報処理システムの異常が検出された
場合(業務手段により異常(業務障害)か検出された場
合やスーパバイザ実行手段により異常(O3障害)が検
出された場合)、障害解析情報収集手段により障害の解
析に必要となるシステム内の情報を確実に収集し、この
収集した障害解析情報を用いて障害の解析を行なうこと
ができる。更に、障害解析情報収集手段による障害解析
情報の収集後、自動再立ち上げ手段により情報処理シス
テムの再立ち上げを行なうことができる。
(実施例) 次に本発明の実施例につき、図面を用いて説明する。
第1図は、本発明による障害解析情報収集方式の一実施
例を示すブロック図であって、第2図のMEM3の内部
構成を示したものである。
従って、本発明の情報処理システムは、第2図において
、MEM3を、第1図に示す如き内部構成のMEM3’
 に置き換えたものである。
第1図において、MEM3’は、業務障害(業務処理シ
ステムにおける異常)に対する異常検出やスーパバイザ
コール(O3のスーパバイザに対する処理依頼)も行な
う業務手段20と、オートレジデント処理実行部30と
○S40とから構成されている。
また、オートレジデント処理実行部30は、業務手段2
0のスーパバイザコールする時に特定アドレスの監視を
行なう特定アドレス監視手段31と、業務手段20から
の異常検出や特定アドレス監視手段31による特定アド
レスの異常検出や○S40のスーパバイザ実行手段41
による異常検出に基づき動作する状況記憶実行手段32
と、MEM3’の内容を外部のディスク11へ移し変え
る(ローディングする)レジデントダンプ実行手段33
と、システムクローズ実行手段34と、初期値の設定を
行なう自動I P L (InitialProgra
mming Loading)実行手段35とから構成
される。ここに、本発明の障害解析情報収集手段は状況
記憶実行手段32とレジデントダンプ実行手段33とか
ら構成される。また本発明の自動再立ち上げ手段はシス
テムクローズ実行手段34と自動IPL実行手段35と
から構成される。
また、○S40は、スーパバイザ実行手段41を有し、
このスーパバイザ実行手段41は、特定アドレス監視手
段31からMEM3’の特定アドレスに異常がない旨の
通知を受けたとき、スーパバイザの実行をし、異常検出
(O3の障害)がなされると、状況記憶実行手段32へ
異常である旨通知を行ない、また正常であると業務手段
20へ正常である旨通知する。
次に動作について説明する。
業務手段20は、外部からトランザクションにより動作
させられ、業務手段20が情報処理システムにおける異
常(業務障害)を検出した場合、オートレジデント処理
実行部30の状況記憶実行手段32の後述する処理を行
なう。また、業務手段20でO8のスーパバイザに処理
依頼(スーパバイザコール)するときは、その処理依頼
毎に特定アドレス監視手段31により、MEM3’の特
定アドレスの内容(第2図の状況記憶機構8の該当番地
等)のチェックを行ない、異常時には状況記憶実行手段
32の後述の処理を行なう。また、0340のスーパバ
イザ実行手段41で異常検出した際に、状況記憶実行手
段32の後述の処理を行なう。
以上によりオートレジデント処理実行部3oによる後述
のオートレジデント処理が実行される。
次にオートレジデント処理について述べる。
先ず、業務手段20がO3のスーパバイザをスーパバイ
ザコールする。その時、特定アドレス監視手段31によ
る処理が第4図のフローに従い実行され、特定アドレス
監視手段20はMEM3′の特定アドレスに対して異常
の有無をチェックする。
なお、第4図は特定アドレス監視手段31の処理フロー
チャートである。特定アドレス監視手段31は、特定ア
ドレス監視データの内容により、MEM3’の特定アド
レスのデータをチェックする(第4図のステップ511
)。なお、特定アドレス監視データは、図示の如くデー
タの終わりを示すストッパーを持つ監視データポインタ
のテーブルと、監視データポインタの指す監視アドレス
、監視語数、比較データのテーブルである。これらのテ
ーブルは、システム生成時に夫々のシステム毎に任意に
設定される。次に、MEM3’の特定アドレスのデータ
チェックにより、異常が検出されない(正常である)と
きは、スーパバイザ実行手段41へ移行し、異常が検出
された場合には、状況記憶実行手段32へ移行する(第
4図のステップ512)。
スーパバイザ実行手段41にて異常が検出された場合(
O8の障害が検出された場合)には、状況記憶実行手段
32による実行に移行し、また異常が検出されない(正
常である)場合には、業務手段20へその旨通知する。
業務手段20は、業務手段20による異常検出(業務障
害)がなく、特定アドレス監視手段31によるMEM3
’の特定アドレスの異常検出がなく、スーパバイザ実行
手段41による異常検出(O3の障害)がない場合には
、業務手段20は、業務を続行する。
次に状況記憶実行手段32の動作(処理)について第5
図を用いて説明する。なお、第5図は、状況記憶実行手
段32による処理のフローチャートである。業務手段2
0や特定アドレス監視手段31やスーパバイザ実行手段
41により異常検出があると、操作盤4の“READY
”キー及び“RESE丁”キーの入力が自動的になされ
る。これにより、CPU2は状況記憶実行手段32に基
づき強制的に状況記憶機構8を動作させて、従来通りC
PU2内の汎用レジスタや制御レジスタの内容をMEM
3’ にそっくり移し変え(ステップS31.332)
、更にCPU2内のメモリの固定領域(システムエリア
)の内容をMEM3’に移し変える(ステップ533)
状況記憶実行手段32に基づく処理の終了後、CPU2
はレジデントダンプ実行手段33に基づく処理により、
MEM3’の全内容をバス制御部7を介してディスク1
1に格納する。
次にシステムクローズ実行手段34による処理について
、第6図を用いて説明する。なお、第6図はシステムク
ローズ実行手段34による処理フローチャートである。
CPU2は、システムクローズ実行手段34に基づき業
務手段20による実行中の業務の終了(ステップ541
)、回線のクローズ(ステップ542)、起動中タスク
の終了(ステップ543)等を行なう。
次に、自動I P L (Initial Progr
ammingLoad ing)実行手段35によって
初期値の設定を行ない、情報処理システムを再開する。
以上の説明から判かるように、CPU2は、特定アドレ
ス監視手段31に基づく処理によりMEM3’の特定ア
ドレスの内容を監視し、異常が検出されたとき(障害時
)、また業務手段20による異常検出があったときやス
ーパバイザ実行手段41による異常検出があったとき、
本発明の障害解析情報収集手段としての、状況記憶実行
手段32及びレジデントダンプ実行手段33に基づき、
外部のディスク11に障害解析に必要な情報を、オペレ
ータが介入しなくても収集することができる。そしてそ
の収集した障害解析情報をプリンタ13にて出力し、そ
れを用いて障害解析を行なうことができる。更に、CP
U2は、本発明のシステム自動再立ち上げ手段としての
、システムクローズ実行手段34及び自動IPL実行手
段35を用いて、システムの復旧処理(再立ち上げ処理
)を、オペレータの介入なくして行なうことができる。
本発明は本実施例に限定されることなく、本発明の要旨
を逸脱しない範囲で種々の応用及び変形が考えられる。
(発明の効果) 上述したように本発明による障害解析情報収集方式を用
いれば、情報処理システムにおける異常が発生した場合
、例えばMEMの特定アドレスに異常があり、CPUの
状況記憶機構を動作させられない場合でも、障害解析情
報収集手段により状況記憶機構を動作させて、障害解析
に必要となる情報処理システム内の情報をオペレータの
操作なくして収集することができ、その収集した障害解
析情報を用いて障害解析を行なうことができると共に、
自動再立ち上げ手段により情報処理システムの再立ち上
げを、オペレータの介入なくして行なうことかできるな
どの効果を奏する。
【図面の簡単な説明】
第1図は本発明による障害解析情報収集方式の一実施例
を示す要部ブロック図、第2図は情報処理システムの一
例を示すブロック図、第3図は従来処理のフローチャー
ト、第4図は第1図の特定アドレス監視手段による処理
フローチャート、第5図は第1図の状況記憶実行手段に
よる処理フローチャート、第6図は第1図のシステムク
ローズ実行手段による処理フローチャートである。 1・・・コンピュータ、 2・・・中央処理装置(CPU)、 3′・・・主記憶装置(MEM) 、4・・・操作盤、
8・・・状況記憶機構、11・・・ディスク、20・・
・業務手段、 30・・・オートレジデント処理実行部、31・・・特
定アドレス監視手段、 32・・・状況記憶実行手段、 33・・・レジデントダンプ実行手段、34・・・シス
テムクローズ実行手段、35・・・自動IPL実行手段
、 40・・・オペレーティングシステム、41・・・スー
パバイザ実行手段。 本発明の実施例の要部ブロック図 第  l  図 従来処理のフローチャート 第3図 状況記憶実行手段のフローチャート 第5図

Claims (1)

  1. 【特許請求の範囲】 情報処理システムの異常を検出した場合に、障害解析に
    必要となる情報処理システム内の情報を収集する障害解
    析情報収集方式において、 主記憶装置の特定アドレスをチェックし異常の有無を検
    出する特定アドレス監視手段と、 この特定アドレス監視手段による前記主記憶装置の特定
    アドレスに対する異常検出や前記特定アドレス監視手段
    以外の手段による情報処理システムに対する異常検出に
    基づいて障害解析に必要となる情報処理システム内の情
    報を収集する障害解析情報収集手段と、 この障害解析情報収集手段による障害解析情報の収集後
    、前記情報処理システムの自動再立ち上げを行なう自動
    再立ち上げ手段とを備えたことを特徴とする障害解析情
    報収集方式。
JP2038294A 1990-02-21 1990-02-21 障害解析情報収集方式 Pending JPH03242739A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2038294A JPH03242739A (ja) 1990-02-21 1990-02-21 障害解析情報収集方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2038294A JPH03242739A (ja) 1990-02-21 1990-02-21 障害解析情報収集方式

Publications (1)

Publication Number Publication Date
JPH03242739A true JPH03242739A (ja) 1991-10-29

Family

ID=12521293

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2038294A Pending JPH03242739A (ja) 1990-02-21 1990-02-21 障害解析情報収集方式

Country Status (1)

Country Link
JP (1) JPH03242739A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08221302A (ja) * 1995-02-17 1996-08-30 Nec Commun Syst Ltd 障害情報収集装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08221302A (ja) * 1995-02-17 1996-08-30 Nec Commun Syst Ltd 障害情報収集装置

Similar Documents

Publication Publication Date Title
US5948112A (en) Method and apparatus for recovering from software faults
CN100432949C (zh) 在计算机上当软件崩溃时保存用户数据的方法及装置
US10545807B2 (en) Method and system for acquiring parameter sets at a preset time interval and matching parameters to obtain a fault scenario type
JP3481737B2 (ja) ダンプ採取装置およびダンプ採取方法
EP3591485B1 (en) Method and device for monitoring for equipment failure
JPS6363933B2 (ja)
JPH08227368A (ja) ジョブ再実行方式
JPS6375963A (ja) システム回復方式
JPH02294739A (ja) 障害検出方式
JPH03242739A (ja) 障害解析情報収集方式
JPH11120154A (ja) コンピュータシステムにおけるアクセス制御装置および方法
JP2716537B2 (ja) 複合システムにおけるダウン監視処理方式
JPH10260870A (ja) システム起動/終了制御装置
JPH10228395A (ja) 制御用コントローラの異常診断装置
KR100257162B1 (ko) 이중화 시스템에서 상대 시스템의 감시방법 및 장치
Krogh et al. Typical Troubles and Solutions
JP3340284B2 (ja) 冗長システム
JPS6155748A (ja) 電子計算機システム
JPS6162942A (ja) 情報処理装置の検査方式
JP2896206B2 (ja) 多重化メモリ装置のオンライン診断方式
JPH076103A (ja) 入出力チャネルの障害処理システム
JPH04223534A (ja) 情報処理システム
JP2835896B2 (ja) テストプログラムの実行制御方式
JPH0395634A (ja) 計算機システム再起動制御方式
JPH03156646A (ja) 障害情報の出力方式