JPS61202236A - マルチシステムの自動障害復旧方式 - Google Patents
マルチシステムの自動障害復旧方式Info
- Publication number
- JPS61202236A JPS61202236A JP60043094A JP4309485A JPS61202236A JP S61202236 A JPS61202236 A JP S61202236A JP 60043094 A JP60043094 A JP 60043094A JP 4309485 A JP4309485 A JP 4309485A JP S61202236 A JPS61202236 A JP S61202236A
- Authority
- JP
- Japan
- Prior art keywords
- main system
- ipl
- program
- subsystem
- external memory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Retry When Errors Occur (AREA)
- Multi Processors (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔概 要〕
本発明はそれぞれ処理装置(CPU)と内部メモリを有
するメインシステムとサブシステムより成るマルチシス
テムにおいて、メインシステムとサブシステム間のコマ
ンドと通知に対し応答を出力する手段を設け、該応答が
ないことにより相手システムの障害を検知し、その時の
状態をセーブするとともに自動的に初期プログラムロー
ディングを再度行ない障害を復旧するようにしたもので
ある。
するメインシステムとサブシステムより成るマルチシス
テムにおいて、メインシステムとサブシステム間のコマ
ンドと通知に対し応答を出力する手段を設け、該応答が
ないことにより相手システムの障害を検知し、その時の
状態をセーブするとともに自動的に初期プログラムロー
ディングを再度行ない障害を復旧するようにしたもので
ある。
本発明はメインシステムとサブシステムよυ成るマルチ
システムにおける自動障害復旧方式に関するものである
。
システムにおける自動障害復旧方式に関するものである
。
インシステム、サブシステムの何れもCPUと内部メモ
リを有する。すなわち、メインシステム1にはCPU
11の制御下に内部メモリとして固定プログラム格納用
のリードオンリメモリ(ROM)12とデータ格納用の
ランダムアクセスメモリ(RAM)13を有し、さらに
可変プログラムファイル用の外部メモリ14が設けられ
る。サブシステム2には同様にCPU 21の制御下に
内部メモリとしてROM22とRAM23が設けられ、
0PU21は0PU11のコマンドの制御を受ける。な
お各システム内の入出力装置の動作制御系については本
発明に直接関係がないので省略しである。
リを有する。すなわち、メインシステム1にはCPU
11の制御下に内部メモリとして固定プログラム格納用
のリードオンリメモリ(ROM)12とデータ格納用の
ランダムアクセスメモリ(RAM)13を有し、さらに
可変プログラムファイル用の外部メモリ14が設けられ
る。サブシステム2には同様にCPU 21の制御下に
内部メモリとしてROM22とRAM23が設けられ、
0PU21は0PU11のコマンドの制御を受ける。な
お各システム内の入出力装置の動作制御系については本
発明に直接関係がないので省略しである。
このようなマルチシステムにおいて、初期プログラムロ
ーディング(IPL)を行なうには、電源投入により、
メインシステムlOR0M12に起動がかか、り、I’
LOM12がディスクまたは70ツビイデイスクよ構成
る外部メモリ14上のIPLプログラムを凡人M13正
に読込む。すなわち自システムで動作するプログラム群
人を外部メそす14のファイル人からRAM 15に移
し、初期化処理が行なわれる。
ーディング(IPL)を行なうには、電源投入により、
メインシステムlOR0M12に起動がかか、り、I’
LOM12がディスクまたは70ツビイデイスクよ構成
る外部メモリ14上のIPLプログラムを凡人M13正
に読込む。すなわち自システムで動作するプログラム群
人を外部メそす14のファイル人からRAM 15に移
し、初期化処理が行なわれる。
この処理によυ今度はサブシステム2のIPLを行なう
。サブシステム2のIPLはメインシステム1OIPL
プ胃グラムがサブシステム2のROM 22に起動をか
け、メインシステム1のIPLプログラムがサブシステ
ム2で動作するプログラム群Bを外部メモリ14からメ
インシステム1のRAM13上に読込み、それをサブシ
ステム2の几0M22を通じて、サブシステム2のRA
M 25上に転送し制御を移す。サブシステム2のプロ
グラム群Bの初期化処理が終了すると、メインシステム
1への通知が行なわれ、システムは動作可能の状態(シ
ステムレディ)となる。、 〔発明が解決しようとする問題点〕 上記マルチシステム動作中に障害が発生し、システムダ
ウンすると、両システムのその時点の状態を示すメモリ
の内容を自動的またはオペレータの手動により外部メモ
リ14のファイルCヘセーブした後、システムを動作可
能状態にするためには、オペレータが介入し電源を切断
後再び投入するか、リセットキー押下により前述のシス
テムIPLを行なわなければならなかった。
。サブシステム2のIPLはメインシステム1OIPL
プ胃グラムがサブシステム2のROM 22に起動をか
け、メインシステム1のIPLプログラムがサブシステ
ム2で動作するプログラム群Bを外部メモリ14からメ
インシステム1のRAM13上に読込み、それをサブシ
ステム2の几0M22を通じて、サブシステム2のRA
M 25上に転送し制御を移す。サブシステム2のプロ
グラム群Bの初期化処理が終了すると、メインシステム
1への通知が行なわれ、システムは動作可能の状態(シ
ステムレディ)となる。、 〔発明が解決しようとする問題点〕 上記マルチシステム動作中に障害が発生し、システムダ
ウンすると、両システムのその時点の状態を示すメモリ
の内容を自動的またはオペレータの手動により外部メモ
リ14のファイルCヘセーブした後、システムを動作可
能状態にするためには、オペレータが介入し電源を切断
後再び投入するか、リセットキー押下により前述のシス
テムIPLを行なわなければならなかった。
従って、無人運転等のシステムでオペレータの介入がで
きない状態に訃ける障害対処には大きな困難があった。
きない状態に訃ける障害対処には大きな困難があった。
本発明の目的紘、マルチシステムにおける障害時にその
障害発生を検知して状態を外部メモリにセーブしてシス
テムを自動的に再IPL してシステムを動作可能状態
とする自動障害復旧方式を提供することにある。
障害発生を検知して状態を外部メモリにセーブしてシス
テムを自動的に再IPL してシステムを動作可能状態
とする自動障害復旧方式を提供することにある。
前記目的を達成するため、本発明の自動障害復旧方式は
メインシステムとサブシステムよ構成るマルチシステム
において、メインシステムからサブシステムへのコマン
ドおよびサブシステムからメインシステムへの通知に対
し応答を出力する手段を設け、該応答がないことによ)
相手システムの障害を検知しその時の状態をメインシス
テムを介し外部メモリにセーブした後、自動的に初期プ
ログラムローディングを再度行なうようにしたものであ
る。
メインシステムとサブシステムよ構成るマルチシステム
において、メインシステムからサブシステムへのコマン
ドおよびサブシステムからメインシステムへの通知に対
し応答を出力する手段を設け、該応答がないことによ)
相手システムの障害を検知しその時の状態をメインシス
テムを介し外部メモリにセーブした後、自動的に初期プ
ログラムローディングを再度行なうようにしたものであ
る。
上記構成により、サブシステムに障害が発生した場合に
は通常のようにメインシステムにシステムダウンの通知
を行ない、またはメインシステムからのコマンドに対す
る応答がないことを検知した場合には自動的にその時の
状態を外部メモリにセーブするとともに再IPLをかけ
る。また、メインシステムに障害が発生した場合、また
はサブシステムからの通知に対する応答がないことを検
知しサブシステムからメインシステムに対し緊急割込み
(NMI)のあった場合には、自動的にその時の状態を
外部メモリにセーブするとともに再IPLJ−かける。
は通常のようにメインシステムにシステムダウンの通知
を行ない、またはメインシステムからのコマンドに対す
る応答がないことを検知した場合には自動的にその時の
状態を外部メモリにセーブするとともに再IPLをかけ
る。また、メインシステムに障害が発生した場合、また
はサブシステムからの通知に対する応答がないことを検
知しサブシステムからメインシステムに対し緊急割込み
(NMI)のあった場合には、自動的にその時の状態を
外部メモリにセーブするとともに再IPLJ−かける。
このようにしていずれのシステムに障害が発生してもオ
ペレータを介在させることなく自動的に障害復旧を行な
うことができるものである。
ペレータを介在させることなく自動的に障害復旧を行な
うことができるものである。
第1図は本発明の実施例の構成説明図である。
同図において、本発明の要部となる構成は、メインシス
テム1からサブシステム2へのコマンド■に対し応答■
′を返し、これをタイマにより検知する検出器(DT)
11−2を設け、応答がなかった場合の情報をOPU
11に送る。また、サブシステム2からメインシステム
1への通知■に対しても応答σを返し、これをタイマに
より検知する検出器(DT)21−1を設け、同様に応
答がなかった場合の情報をCPU 21に送る。なおサ
ブシステム2からはシステムダウンの通知■をメインシ
ステム1に送る場合もある。
テム1からサブシステム2へのコマンド■に対し応答■
′を返し、これをタイマにより検知する検出器(DT)
11−2を設け、応答がなかった場合の情報をOPU
11に送る。また、サブシステム2からメインシステム
1への通知■に対しても応答σを返し、これをタイマに
より検知する検出器(DT)21−1を設け、同様に応
答がなかった場合の情報をCPU 21に送る。なおサ
ブシステム2からはシステムダウンの通知■をメインシ
ステム1に送る場合もある。
いま、サブシステムに障害発生した場合、上記メインシ
ステム1からのコマンド■に対する応答■′が検出器(
DT)11−2でタイムアウトになシ検出されない場合
、またはダウン通知■があった場合にはメインシステム
1の0PU11はROM12内の再IPLプログラム1
2−1に制御を移す。この再IPLプログラム12−1
は現在のメイン、サブ両システムのメモリの内容を外部
メモリ14ヘセーブし、同じROM12内のIPLプロ
グラムへ制御を移し、第2図で説明した手順に従い、シ
ステムIPLを行ない、システム動作可能(システムレ
ディ)状態とする。
ステム1からのコマンド■に対する応答■′が検出器(
DT)11−2でタイムアウトになシ検出されない場合
、またはダウン通知■があった場合にはメインシステム
1の0PU11はROM12内の再IPLプログラム1
2−1に制御を移す。この再IPLプログラム12−1
は現在のメイン、サブ両システムのメモリの内容を外部
メモリ14ヘセーブし、同じROM12内のIPLプロ
グラムへ制御を移し、第2図で説明した手順に従い、シ
ステムIPLを行ない、システム動作可能(システムレ
ディ)状態とする。
次にメインシステムに障害発生した場合、上記ザブシス
テム2からメインシステム1への通知■に対する応答■
が検出器(])T)21−1でタイムアウトになシ検出
されない場合には、サブシステム2はメインシステム1
の障害(いわゆるダンマリ)を検出し、信号によりメイ
ンシステム1の0PU11内の緊急割込み(NMI)を
発生させるノー−ドウエア(NMI)11−1に割込み
をかける。これによfi、ROM12内の再IPLプロ
グラム12−1へ制御を移す。
テム2からメインシステム1への通知■に対する応答■
が検出器(])T)21−1でタイムアウトになシ検出
されない場合には、サブシステム2はメインシステム1
の障害(いわゆるダンマリ)を検出し、信号によりメイ
ンシステム1の0PU11内の緊急割込み(NMI)を
発生させるノー−ドウエア(NMI)11−1に割込み
をかける。これによfi、ROM12内の再IPLプロ
グラム12−1へ制御を移す。
またメインシステム1がシステムダウンした時には自動
的にROM12内の再IPLプログラム12−1へ制御
を移す。
的にROM12内の再IPLプログラム12−1へ制御
を移す。
この再IPLプログラム12−1は前述と同様に現在の
メイン、サブ両システムのメモリの内容を外部メモリ1
4ヘセーブし、同じROM12内のIPLプログラムへ
制御を移し、前述の手順に従いシステムIPL ’?i
−行ない、システム動作可能(システム・レディ)状態
となる。
メイン、サブ両システムのメモリの内容を外部メモリ1
4ヘセーブし、同じROM12内のIPLプログラムへ
制御を移し、前述の手順に従いシステムIPL ’?i
−行ない、システム動作可能(システム・レディ)状態
となる。
以上説明したように、本発明によれば、障害発生から復
旧までの前述の手順によりステム動作可能となるまでを
オペレータの介在なしに自動的に行なうことができるか
ら、無人運転等に最適である。
旧までの前述の手順によりステム動作可能となるまでを
オペレータの介在なしに自動的に行なうことができるか
ら、無人運転等に最適である。
この方法によれば障害検出の時点における障害情報を外
部メモリにセーブしておシ、その出力はシステム運用と
非同期で行なうことができる。また、サブシステム側か
らメインシステムの障害(ダンマリ)を検出して障害復
旧できることも従来できなかった手順であシ、大きな利
点である。
部メモリにセーブしておシ、その出力はシステム運用と
非同期で行なうことができる。また、サブシステム側か
らメインシステムの障害(ダンマリ)を検出して障害復
旧できることも従来できなかった手順であシ、大きな利
点である。
第1図は本発明の実施例の構成説明図、第2図は従来例
の構成説明図であフ、図中、1はメインシステム、2は
サブシステム、11.21は処理装置(CPU)、12
.22はROM、 13.23はR,AM、 14は外
部メモリ、11−1はNMI発生ハードウェア、12−
1は再IPLプログラムを示す。
の構成説明図であフ、図中、1はメインシステム、2は
サブシステム、11.21は処理装置(CPU)、12
.22はROM、 13.23はR,AM、 14は外
部メモリ、11−1はNMI発生ハードウェア、12−
1は再IPLプログラムを示す。
Claims (1)
- それぞれ処理装置(CPU)と内部メモリを有するメイ
ンシステムとサブシステムより成り、起動時メインシス
テムに接続された外部メモリより初期プログラムを読出
しメインシステムの内部メモリにローディングし、この
プログラムに基づきサブシステムの内部メモリにローデ
ィングして動作を実行するマルチシステムにおいて、メ
インシステムからサブシステムへのコマンドおよびサブ
システムからメインシステムへの通知に対し応答を出力
する手段を設け、該応答がないことにより相手システム
の障害を検知しその時の状態をメインシステムを介して
外部メモリにセーブするとともに、自動的に初期プログ
ラムローディングを再度行なうことを特徴とするマルチ
システムの自動障害復旧方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60043094A JPS61202236A (ja) | 1985-03-05 | 1985-03-05 | マルチシステムの自動障害復旧方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60043094A JPS61202236A (ja) | 1985-03-05 | 1985-03-05 | マルチシステムの自動障害復旧方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS61202236A true JPS61202236A (ja) | 1986-09-08 |
Family
ID=12654247
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60043094A Pending JPS61202236A (ja) | 1985-03-05 | 1985-03-05 | マルチシステムの自動障害復旧方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61202236A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008212580A (ja) * | 2007-03-08 | 2008-09-18 | Yoshio Watanabe | 取手収納袋 |
JP2009173323A (ja) * | 2008-01-28 | 2009-08-06 | Yoshio Watanabe | 滑穴閉じ袋 |
-
1985
- 1985-03-05 JP JP60043094A patent/JPS61202236A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008212580A (ja) * | 2007-03-08 | 2008-09-18 | Yoshio Watanabe | 取手収納袋 |
JP2009173323A (ja) * | 2008-01-28 | 2009-08-06 | Yoshio Watanabe | 滑穴閉じ袋 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5134712A (en) | System for recovering failure of online control program with another current online control program acting for failed online control program | |
JPS61202236A (ja) | マルチシステムの自動障害復旧方式 | |
JPS6146543A (ja) | 転送装置の障害処理方式 | |
JPS6214859B2 (ja) | ||
JPH01166161A (ja) | マルチプロセッサシステムの相互監視方式 | |
JPH0244436A (ja) | 情報処理監視システム | |
JPH0118460B2 (ja) | ||
JPH04305758A (ja) | 情報処理装置 | |
JPH07200334A (ja) | 二重化同期運転方式 | |
JPH02114364A (ja) | マルチプロセッサシステム | |
JPS59221702A (ja) | デジタル式制御装置 | |
JPH03252748A (ja) | 監視機能付きリモート出力方式 | |
JPS622334B2 (ja) | ||
JP2775865B2 (ja) | 周辺制御装置の障害解析情報収集方式 | |
JPH0229815A (ja) | 初期化制御方式 | |
JPS6243408Y2 (ja) | ||
JPS61253551A (ja) | マルチプロセツサシステムの立ち上げ方式 | |
JPS6343560Y2 (ja) | ||
JPS62194547A (ja) | 緊急動作装置 | |
JPH0458058B2 (ja) | ||
JPH01116739A (ja) | Cpuの監視装置 | |
JPH05233576A (ja) | 二重システム | |
JPS62180454A (ja) | 通信システムの障害情報収集方法 | |
JPS63279337A (ja) | 情報処理システムのスト−ル監視方式 | |
JPS6318229B2 (ja) |