JPS63293644A - オンライン自動回復システム - Google Patents

オンライン自動回復システム

Info

Publication number
JPS63293644A
JPS63293644A JP62128101A JP12810187A JPS63293644A JP S63293644 A JPS63293644 A JP S63293644A JP 62128101 A JP62128101 A JP 62128101A JP 12810187 A JP12810187 A JP 12810187A JP S63293644 A JPS63293644 A JP S63293644A
Authority
JP
Japan
Prior art keywords
ipl
automatic recovery
dump data
automatic
dump
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62128101A
Other languages
English (en)
Inventor
Katsuaki Tanioka
谷岡 克昭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP62128101A priority Critical patent/JPS63293644A/ja
Publication of JPS63293644A publication Critical patent/JPS63293644A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は上位局と接続された端末装置の自動回復システ
ムに関し、特に自動機等の金融オンライン端末の高信頼
性を維持するのに好適なオンライン自動回復システムに
関する。
〔従来の技術〕
オンラインシステムにおける端末装置のシステム停止障
害を考慮した保守性、可用性(availabilit
y)向上手段として、従来、下記の如き手段が提案され
ている。
(1)メモリダンプデータを取得する方式(2)自動再
立上げ(自動IPL)を行う方式上記(1)を提案して
いる例としては、特開昭57−69352号、同60−
142437号、同61−32149および同60−2
18141号が挙げられる。このうち、前王者は上記メ
モリダンプデータを端末装置内の外部記憶装置に取得す
るものであり、最後者は回線を経てホスト側に取得する
ものである。
また、上記(2)を提案している例としては、特開昭5
7−69352号、同60−73753号、同60−2
43747号、同60−129850号および同60−
214052号が挙げられる。
このうち、前王者は端末装置自身の指示によるものであ
り、後二者はホストからの指示によるものである。
なお、上記(1)は保守性の向上に、また、(2)は可
用性の向上に極めて有効である。
〔発明が解決しようとする問題点〕
ところで、上記従来技術においては、下記の点について
の配慮がなされておらず、今後、ネットワーク化が進む
中での端末接続台数の増大、無人化・自動機化の要求に
対応した、ホスト集中型の遠隔保守性をも考慮した場合
、問題となる。
(i)前記(1)を提案している先行技術囲者は、最後
者の特開昭60−218141号を除いて、いずれも、
端末装置内にメモリダンプデータを取得することまでし
か考慮しておらず、今後想定される状況には不充分と言
わなければならない。
(n)また、上述の特開昭60−218141号に関し
ては、端末装置からメモリダンプデータをホストに送信
するようにしているが、上記データの送信を端末装置が
回復する前に実施しているため、メモリダンプデータが
大量になると、端末装置の回復時間を極度に遅延させる
という新たな問題を生ずる危険がある。更に、同一要因
によるシステム停止障害時の大量ダンプデータを何度も
ホストに送信するような場合には、無駄であるという問
題もある。
上記問題(i)に対しては、取得したメモリダンプデー
タをホストに送信する機構を設けることが考えられる。
また、問題(n)に対しては、メモリダンプデータのホ
ストへの送信に続けて、前記自動IPLを行うと同時に
、ホストに送信するダンプデータを厳選した少量のもの
にすることが考えられる。このために、メモリダンプす
る機構に、従来のメモリイメージまるまるの大量ダンプ
取得に加えて、厳選した重要な部分のみの少量ダンプ(
以下、「スナップダンプ」という)取得を行う機能を追
加し、ホスト送信時には、このスナップダンプデータの
みを送信するようにすれば良い。
しかし、これを実際に採用した場合には、新たな問題が
発生する。それは、IPL後にスナップダンプデータを
ホストに送信するのは良いが、これが通常のIPL後な
のか、システム停止障害発生による自動IPL後なのか
を区別できないと、−停システム停止障害が発生すると
、以降IPL毎にスナップダンプデータ送信が発生する
という問題である。
本発明は上記事情に鑑みてなされたもので、その目的と
するところは、上述の如き諸問題を解消し、保守性およ
び可用性の優れた。オンライン自動回復システムを提供
することにある。
〔問題点を解決するための手段〕
本発明の上記目的は、中央処理装置と回線を介して接続
された複数の端末制御装置、および、各端末制御装置に
接続された複数の各種金融端末とを有するオンラインシ
ステムにおいて、前記端末装置がメモリダンプデータを
格納する外部記憶装置を有し、システム停止障害等の発
生時、解析に必要となる代表的な情報である前記スナッ
プダンプデータと、メモリダンプデータとを分けて取得
後、自動IPLへ移行する自動回復移行部と、自動IP
Lか通常IPLかを記憶するIPL種別記憶部と、自動
IPL後、前記スナップダンプデータを上位装置へ送信
する自動回復通知部とを設けたことを特徴とするオンラ
イン自動回復システムによって達成される。
〔作用〕
本発明によれば、端末装置においてシステム停止障害が
発生すると、まず、自動回復移行部が障害解析に必要な
メモリダンプデータおよびスナップダンプデータを端末
装置内ファイルに取得後、IPL種別記憶部に自動IP
Lの旨を記憶し、工PLに移行する。端末装置の再IP
Lが終了すると、IPL種別記憶部には、自動IPLで
あることが記憶されているので、ホストへのスナップダ
ンプデータ送信を行う0通常のIPL時には、IPL種
別記憶部を判定し、ホストにスナップダンプデータを送
信しないようにする。
これにより、保守性は良いが可用性に欠ける点があった
り、可用性は良いが保守性に欠ける点があったりするこ
とはなくなる。また、同一要因によるシステム停止障害
時の大量ダンプデータ重複送信による無駄を最低限に抑
えることになる。
〔実施例〕
以下、本発明の実施例を図面に基づいて詳細に説明する
。なお、以下に示す実施例では、中央処理装置(ホスト
)と回線を介して接続された複数の端末制御装置、およ
び、各端末制御装置に接続された複数の各種金融端末と
から成る金融オンラインシステムにおいて、端末制御装
置に本発明を適用した場合を示すものである。
第1図は、本金融オンラインシステムのうち、自動回復
に着目した中央処理装置と端末制御装置のブロック図で
あり、10はIPLに移行するための自動回復移行部、
11はダンプ情報を格納するダンプファイル、llaは
スナップダンプデータ1.11bはメモリダンプデータ
、12は電源投入による工PLなのか(この場合、値(
00)、、)、システム停止後自動回復によるIPLな
のか(値(01)xs)を示すIPL種別記憶部、13
a、13bはオンライン制御部、14は自動回復情、・
報編集部、15a、15bは通信制御機構、16は端末
制御装置からの自動回復情報を受けて解析する自動回復
情報解析部を示している。
第2図は、データ構成を示す図である。(a)は上記ダ
ンプファイル11の構成を示すものであり、スナップダ
ンプデータllaは、主記憶装置上、最も障害解析に必
要と思われる情報を収集したもので、256〜512B
程度の容量を有し、メモリダンプデータllbは、主記
憶装置上、特に厳選はしないが、制御テーブル等、障害
解析に必要と思われる情報全般を収集したもので、51
2〜IMB程度の容量となっている。これらの情報の取
得範囲は、パラメータにより可変である。
第2図(b)は、スナップダンプデータllaの構成例
を示すものである。システム停止コード、システム停止
詳細コードは、障害の要因を示すコードであり、システ
ム停止カウンタ、システム連続停止カウンタは、システ
ム停止障害の発生回数を示すものである。特に、システ
ム連続停止カウンタは、当該停止コードのシステム停止
が連続して発生した回数を示すものである。システム停
止時のスタック情報、システム制御テーブルのスナップ
およびハードステータスは、システム停止時の代表的な
内部状態である。特に、スタック情報はシステム停止発
生までのプログラムの流れを追跡する際、有効な情報と
なる。
第2図(Q)は、中央処理装置に報告する自動回復情報
メツセージの構成を示し、自動回復情報であることを示
すヘッダ部と、スナップダンプデータllaを含むデー
タ部から成っている。
第3図は、自動回復情報送信に至る動作フローを示すも
のである。また、第4図、第5図は、本発明を活用した
、より実運用に近い形態でのシステム構築例を示すもの
であり、第4図は、自動回復情報メツセージ20を中央
処理装置に送信した後に、より詳細な障害解析を進める
ために、中央処理装置から端末制御装置内メモリダンプ
データ11bを吸上げる際のシーケンスを示し、第5図
は、第4図のシーケンス上のメツセージ構成を示すもの
である。
以下、上述の如く構成された本実施例の動作を説明する
。なお、以下の説明は、第3図を基に、第1図、第2図
を参照して、端末制御装置から自動回復情報を中央処理
装置に報告する過程を1通常の場合とシステム停止障害
が発生した場合に分けて説明(説明I)した後、次に、
実運用レベルでのメモリダンプデータ吸上げについて、
第4図を基に、第5図を参照して説明(説明■)する。
〈説明■〉 まず、端末制御装置を電源オン(POW  ON)する
と、IPL種別記憶部12に(00)、、をセットしく
ステップ301)、IPLを始める(同302)。端末
制御装置のプログラムロードを完了すると1通信制御機
構15a、15b間で、リンクが確立される(同303
)、リンク確立後は、オンライン制御部13a、13b
間でメツセージレベルでの初期設定、いわゆる、オンラ
イン確立が図られる(同304)。オンライン確立後、
IPL種別記憶部12の内容を判定する(同305)と
、(00)0.なので通常のオンライン業務を開始する
(同308)。
上述の如く1通常は、自動回復情報メツセージ20は送
信しない。
一方、オンライン業務中にシステム停止障害が発生する
と、自動回復移行部10は、主記憶装置上からスナップ
ダンプデータllaおよびメモリダンプデータllbを
収集し、ダンプファイル11に格納(同309)後、I
PL種別記憶部12に(Ol)、Sをセットし、IPL
に移行する。IPL移行後は、通常立上げと同様に、I
PL(同302) 、リンク確立(同303)およびオ
ンライン確立(同304)が図られる。
オンライン確立後、IPL種別記憶部12を判定(同3
05)すると、今度は(Ol)、Sなので、自動回復情
報編集部14が動作する。自動回復情報編集部14は、
ダンプファイル11内のスナップダンプデータllaを
リードし、自動回復情報メツセージ20を編集後、オン
ライン制御部13b2通信制御機構15bを経て中央処
理装置に送信しく同306)、通常のオンライン業務を
再開す゛る(同308)。
自動回復情報メツセージ20が中央処理装置の通信制御
機構15aを経て自動回復情報解析部16に達すると、
自動回復情報解析部16は、自動回復情報そのもの、ま
たは、解析結果のコンソール表示。
ファイルロギング、プリンタ印字等(同307)を行う
以上が、システム停止障害発生からシステム再立上げ、
および、自動回復情報メツセージ送信に至る動作の流れ
である。
く説明■〉 自動回復情報メツセージ20を受けたが中央処理装置が
コンソール等にその旨を表示すると、オペレータ(障害
監視員、プログラムでも可能)は、障害内容に応じてフ
ァイルダンプ要求メツセージ40を当該端末制御装置宛
てに送信する。このとき。
ファイルダンプ要求メツセージ40中のファイル番号は
、システムで規定したダンプファイルの該当番号を指定
する。
端末制御装置は、ファイルダンプ要求メツセージ40を
受取ると、ダンプファイル11から所定のレコードをリ
ードし、ファイルダンプ情報メツセージ41を編集して
中央処理装置へ送信する0回線手順上、一度に送信でき
ない場合は、分割して送信する。中央処理装置は、ファ
イルダンプ情報メツセージ41を受取ると、ファイルに
ロギングする。
もちろん、これをコンソール表示等しても良い。
上記実施例によれば、下記の効果が得られる。
(1)端末装置においてシステム停止障害が発生した場
合、障害解析に必要な情報を取得後、直ちに自動IPL
を行い1回復後はホストに上記取得した情報送信を行う
ので、保守性を低下させることなく、可用性の高いオン
ラインシステムになる。
(2)ホストに送信する障害情報は、少量のスナップダ
ンプデータで済むため、不必要なダンプデータを、やみ
くもに送信するという無駄を抑止することができる。
(3)自動回復した端末装置から送信される少量のスナ
ップダンプデータを基に障害を解析し、原因が判明すれ
ばそれで良いし、判明しなければ既に自動回復している
端末装置に対してホストからメモリダンプデータをゆっ
くり吸上げて、障害解析を続ければ良い。本方式により
、より実用的な。
遠隔保守に適したシステムになる。
上記実施例は、−例として示したものであり、本発明は
これに限定されるべきものではない。
〔発明の効果〕
以上詳細に述べた如く、本発明によれば、中央処理装置
と回線を介して接続された複数の端末制御装置、および
、各端末制御装置に接続された複数の各種金融端末とを
有するオンラインシステムにおいて、前記端末装置がメ
モリダンプデータを格納する外部記憶装置を有し、シス
テム停止障害等の発生時、解析に必要となる代表的な情
報である前記スナップダンプデータと、メモリダンプデ
ータとを分けて取得後、自動IPLへ移行する自動回復
移行部と、自動IPLか通常IPLかを記憶するIPL
種別記憶部と、自動IPL後、前記スナップダンプデー
タを上位装置へ送信する自動回復通知部とを設けたので
、保守性および可用性の優れた、オンライン自動回復シ
ステムを実現できるという顕著な効果を奏するものであ
る。
【図面の簡単な説明】
第1図は本発明の一実施例を示す金融オンラインシステ
ムの要部ブロック図、第2図はデータ構成を示す図、第
3図は自動回復情報送信に至る動作を示すフローチャー
ト、第4図はより実運用に近い形態でのシステム構築例
における動作フローチャート、第5図は第4図のシーケ
ンス上のメツセージ構成を示す図である。 10:自動回復移行部、11:ダンプファイル、IIa
ニスナツプダンプデータ、11b:メモリダンプデータ
、12:IPL種別記憶部、13a 、 13b :オ
ンライン制御部、14:自動回復情報編集部、15a。 15b:通信制御機構、16:自動回復情報解析部、2
0:自動回復情報メツセージ、40:ファイルダンプ要
求メツセージ、41:ファイルダンプ情報メツセージ。 第   1   図 中央処理装置     端末制御装置 筒   2   図 (a) 主記憶装置 第   2   図 (c) 第   3   図 第   4   図

Claims (1)

    【特許請求の範囲】
  1. 1、中央処理装置と回線を介して接続された複数の端末
    制御装置、および、各端末制御装置に接続された複数の
    各種金融端末とを有するオンラインシステムにおいて、
    前記端末装置がメモリダンプデータを格納する外部記憶
    装置を有し、システム停止障害等の発生時、解析に必要
    となる代表的な情報(スナップダンプデータ)と、メモ
    リダンプデータとを分けて取得後、自動IPLへ移行す
    る自動回復移行部と、自動IPLか通常IPLかを記憶
    するIPL種別記憶部と、自動IPL後、前記スナップ
    ダンプデータを上位装置へ送信する自動回復通知部とを
    設けたことを特徴とするオンライン自動回復システム。
JP62128101A 1987-05-27 1987-05-27 オンライン自動回復システム Pending JPS63293644A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62128101A JPS63293644A (ja) 1987-05-27 1987-05-27 オンライン自動回復システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62128101A JPS63293644A (ja) 1987-05-27 1987-05-27 オンライン自動回復システム

Publications (1)

Publication Number Publication Date
JPS63293644A true JPS63293644A (ja) 1988-11-30

Family

ID=14976418

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62128101A Pending JPS63293644A (ja) 1987-05-27 1987-05-27 オンライン自動回復システム

Country Status (1)

Country Link
JP (1) JPS63293644A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011113473A (ja) * 2009-11-30 2011-06-09 Hitachi Omron Terminal Solutions Corp 取引処理システム及びその情報収集方法
JP2020086950A (ja) * 2018-11-26 2020-06-04 株式会社リコー 情報処理装置、情報処理装置のダンプ管理方法、及び、情報処理装置のダンプ管理プログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58144263A (ja) * 1982-02-22 1983-08-27 Hitachi Ltd 分散処理システムの障害処理方式
JPS59190763A (ja) * 1983-04-13 1984-10-29 Fujitsu Ltd デ−タ転送方式

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58144263A (ja) * 1982-02-22 1983-08-27 Hitachi Ltd 分散処理システムの障害処理方式
JPS59190763A (ja) * 1983-04-13 1984-10-29 Fujitsu Ltd デ−タ転送方式

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011113473A (ja) * 2009-11-30 2011-06-09 Hitachi Omron Terminal Solutions Corp 取引処理システム及びその情報収集方法
JP2020086950A (ja) * 2018-11-26 2020-06-04 株式会社リコー 情報処理装置、情報処理装置のダンプ管理方法、及び、情報処理装置のダンプ管理プログラム

Similar Documents

Publication Publication Date Title
US7016957B2 (en) Distributed data processing system and error analysis information saving method appropriate therefor
EP0409604A2 (en) Processing method by which continuous operation of communication control program is obtained
US20240184675A1 (en) Data synchronization method for host machine and backup machine of station application server
JPS63293644A (ja) オンライン自動回復システム
JP3687565B2 (ja) ログデータ保存方式、ログデータ保存方法およびログデータ保存用プログラム
JP3691272B2 (ja) 分散処理システムおよび障害解析情報の保存方法
JPH036748A (ja) オンライン端末装置
JPS6330651B2 (ja)
JPH1188471A (ja) 試験方法及び試験装置
JP3412725B2 (ja) 分散システムのリモートメンテナンス装置
JP3328474B2 (ja) ネットワーク監視制御装置
JPH10222324A (ja) ネットワークシステム
JPS58136168A (ja) 自己管理機能を備えたフアクシミリ装置
JPH0291735A (ja) リモート障害保守管理システム
CN111385361B (zh) 验布机通信方法、装置、电子设备及存储介质
CN110955556B (zh) 数据库恢复方法及装置、存储介质、数据库系统
JP3346424B2 (ja) 動作監視機能付き端末装置
JPS6322499B2 (ja)
JPS58144263A (ja) 分散処理システムの障害処理方式
KR100235570B1 (ko) 2이상의 주전산기를 병립 연결한 시스템의 클러스터 관리 마스터 시스템의 클러스터 관리방법
JPH0561800A (ja) 障害解析方法
JPH01115244A (ja) 回線ロギング自動停止制御方式
JP2000357130A (ja) 周辺制御処理装置、障害解析情報保持方式及び障害解析情報保持方法
CN114218050A (zh) 一种云平台故障处理方法及装置
CN117806903A (zh) 远程复制监控方法、装置、电子设备和存储介质