JPH01234966A - 多重化コンピュータシステムにおける障害検出方式 - Google Patents
多重化コンピュータシステムにおける障害検出方式Info
- Publication number
- JPH01234966A JPH01234966A JP63060235A JP6023588A JPH01234966A JP H01234966 A JPH01234966 A JP H01234966A JP 63060235 A JP63060235 A JP 63060235A JP 6023588 A JP6023588 A JP 6023588A JP H01234966 A JPH01234966 A JP H01234966A
- Authority
- JP
- Japan
- Prior art keywords
- abnormality
- time
- computer system
- computer
- irq
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005856 abnormality Effects 0.000 claims abstract description 23
- 238000012544 monitoring process Methods 0.000 claims abstract description 16
- 238000001514 detection method Methods 0.000 claims abstract description 13
- 238000004891 communication Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 abstract description 4
- 230000002159 abnormal effect Effects 0.000 abstract 1
- 238000003745 diagnosis Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000007796 conventional method Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000034 method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Landscapes
- Multi Processors (AREA)
- Hardware Redundancy (AREA)
- Debugging And Monitoring (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔概 要〕
多重化コンピュータシステムにおける相互監視による障
害検出方式に関し、 互に相手側の異常を監視することにより障害検出時のジ
ョブの引継ぎを迅速かつ円滑に行なうことを目的とし、 現用系および予備系のコンピュータシステムにより構成
される多重化コンピュータシステムの障害検出方式にお
いて、現用系のコンピュータと予備系のコンピュータの
割込み手段を接続する通信パスと、予備系のコンピュー
タと現用系のコンピュータの割込み手段を接続する通信
パスとを備え、双方のシステムは、正常時にあっては、
互に相手側に対し常に割込み要求を発して前記割込み要
求により自系の時間監視手段を更新し、異常時にあって
は、前記割込み要求の停止を前記時間監視手段により検
知してタイムアウト通知を自系のコンピユータに送出し
、相手側の異常を検出するように構成する。
害検出方式に関し、 互に相手側の異常を監視することにより障害検出時のジ
ョブの引継ぎを迅速かつ円滑に行なうことを目的とし、 現用系および予備系のコンピュータシステムにより構成
される多重化コンピュータシステムの障害検出方式にお
いて、現用系のコンピュータと予備系のコンピュータの
割込み手段を接続する通信パスと、予備系のコンピュー
タと現用系のコンピュータの割込み手段を接続する通信
パスとを備え、双方のシステムは、正常時にあっては、
互に相手側に対し常に割込み要求を発して前記割込み要
求により自系の時間監視手段を更新し、異常時にあって
は、前記割込み要求の停止を前記時間監視手段により検
知してタイムアウト通知を自系のコンピユータに送出し
、相手側の異常を検出するように構成する。
本発明は多重化コンピュータシステムにおける障害検出
方式に関し、特にコンピュータシステム間の相互関し及
び診断を行ない異常検出を行なう障害検出方式に関する
。
方式に関し、特にコンピュータシステム間の相互関し及
び診断を行ない異常検出を行なう障害検出方式に関する
。
第3図は従来の障害検出方式の構成図の一例である。図
に示すように、コンピュータCPU 1およびCPU
2により構成される2重化システムにおいて、CPU
lとCPU 2の間は、例えば通信路としてR3232
C等を用いた相互のシステム診断のための通信パスAが
設けられ、一定時間毎に相互診断を行なっている。この
場合、例えばCPII 1を現在業務を実行している現
用系とすると、CPU 2は待機もしくは従業務を実行
する予備系となる。相互診断は例えばCPU 1から自
系が正常であることおよび相手が正常か否かの情報を相
手側に送出し、一定時間経過後までに相手側から応答が
なければ、自系は他系が異常であると認識してシステム
の切り離し等の対策を行う。これらの診断はCPU 2
からCPU 1へも同様に双方向に行なわれる。
に示すように、コンピュータCPU 1およびCPU
2により構成される2重化システムにおいて、CPU
lとCPU 2の間は、例えば通信路としてR3232
C等を用いた相互のシステム診断のための通信パスAが
設けられ、一定時間毎に相互診断を行なっている。この
場合、例えばCPII 1を現在業務を実行している現
用系とすると、CPU 2は待機もしくは従業務を実行
する予備系となる。相互診断は例えばCPU 1から自
系が正常であることおよび相手が正常か否かの情報を相
手側に送出し、一定時間経過後までに相手側から応答が
なければ、自系は他系が異常であると認識してシステム
の切り離し等の対策を行う。これらの診断はCPU 2
からCPU 1へも同様に双方向に行なわれる。
上述した従来方式では、まず、比較的多くの情報を通信
する一方、相手からの応答をも監視しなければならず、
診断のためにCPUの負荷が増大するという問題を生じ
ている。即ち、前述の如く一方を主系、他方を従系とす
ると、主系側は実際のジョブの実行に加えて相互診断も
行なうことになりその分だけジョブ処理が遅れることに
なる。
する一方、相手からの応答をも監視しなければならず、
診断のためにCPUの負荷が増大するという問題を生じ
ている。即ち、前述の如く一方を主系、他方を従系とす
ると、主系側は実際のジョブの実行に加えて相互診断も
行なうことになりその分だけジョブ処理が遅れることに
なる。
さらに、一定時間経過後のタイムアウトを検出するため
にその時間分だけ待たないと異常検出できないという時
間的なロスもある。
にその時間分だけ待たないと異常検出できないという時
間的なロスもある。
本発明の目的は、多重化コンピュータシステムにおける
障害検出方式において、互に相手側の異常を検出してジ
ョブの引継ぎを円滑に行なうようにし、相互診断時にお
けるCPUの負荷の軽減を図り、かつ障害検出に要する
時間の短縮を図ることを目的とする。
障害検出方式において、互に相手側の異常を検出してジ
ョブの引継ぎを円滑に行なうようにし、相互診断時にお
けるCPUの負荷の軽減を図り、かつ障害検出に要する
時間の短縮を図ることを目的とする。
第1図は本発明に係る障害検出方式の原理構成図である
。本図では、現用系のコンピュータシステムDPIと予
備系のコンピュータシステムDP2からなる2重化シス
テムについて示す。
。本図では、現用系のコンピュータシステムDPIと予
備系のコンピュータシステムDP2からなる2重化シス
テムについて示す。
図に示すように、本発明は、現用系および予備系のコン
ピュータシステムにより構成される多重化コンピュータ
システムの障害検出方式において、現用系のコンピュー
タ(CPU 1 )と予備系のコンピュータ(CPU
2 ’)の割込み手段(22)を接続する通信パス(L
、)と、 予備系のコンピュータ(CPU 2 )と現用系のコン
ピュータ(CPU 1 ’)の割込み手段(21)を接
続する通信パス(Lx)とを備え、 双方のシステムは、正常時にあっては、互に相手側に対
し常に割込み要求(IRQ)を発して前記割込み要求(
IRQ)により自系の時間監視手段(11,12)を更
新し、異常時にあっては、前記割込み要求(IRQ)の
停止を前記時間監視手段(11,12)により検知して
タイムアウト通知(T)を自系のコンピュータに送出し
、相手側の異常を検出するようにしたことを特徴とする
。
ピュータシステムにより構成される多重化コンピュータ
システムの障害検出方式において、現用系のコンピュー
タ(CPU 1 )と予備系のコンピュータ(CPU
2 ’)の割込み手段(22)を接続する通信パス(L
、)と、 予備系のコンピュータ(CPU 2 )と現用系のコン
ピュータ(CPU 1 ’)の割込み手段(21)を接
続する通信パス(Lx)とを備え、 双方のシステムは、正常時にあっては、互に相手側に対
し常に割込み要求(IRQ)を発して前記割込み要求(
IRQ)により自系の時間監視手段(11,12)を更
新し、異常時にあっては、前記割込み要求(IRQ)の
停止を前記時間監視手段(11,12)により検知して
タイムアウト通知(T)を自系のコンピュータに送出し
、相手側の異常を検出するようにしたことを特徴とする
。
〔作 用]
本発明の障害検出方式では、自系の状態を他系が監視す
ることにあり、そのため、DPIのCPU 1は一定周
期毎にDP2に対して通信パスL1を介して割込み要求
を発生している。割込み要求を受けた割込み手段22は
自系のCPU 2を介して時間監視手段12を起動する
。正常動作時では割込み要求は常時送られるため時間監
視手段12はその度にリセットされ再起動する。CPU
l側がハードウェア又はソフトウェアの異常により一
定周期毎の割込み要求を発生しなくなると時間監視手段
12は他系のタイムアウト通知を自系のCPU 12に
通知し、相手側の異常を知る。CPU 2はcpu i
のタイムアウト通知により、CPt11で進行していた
ジョブを引き継いで実行する。従来、時間監視手段は、
自系のソフトウェア異常等により処理が実行されないと
きにこの状態を検出するために使用されていたが、本発
明では相手側の異常を検出するので、自系の異常検出手
段として使用しなくともシステムの動作に支障は生じな
い。
ることにあり、そのため、DPIのCPU 1は一定周
期毎にDP2に対して通信パスL1を介して割込み要求
を発生している。割込み要求を受けた割込み手段22は
自系のCPU 2を介して時間監視手段12を起動する
。正常動作時では割込み要求は常時送られるため時間監
視手段12はその度にリセットされ再起動する。CPU
l側がハードウェア又はソフトウェアの異常により一
定周期毎の割込み要求を発生しなくなると時間監視手段
12は他系のタイムアウト通知を自系のCPU 12に
通知し、相手側の異常を知る。CPU 2はcpu i
のタイムアウト通知により、CPt11で進行していた
ジョブを引き継いで実行する。従来、時間監視手段は、
自系のソフトウェア異常等により処理が実行されないと
きにこの状態を検出するために使用されていたが、本発
明では相手側の異常を検出するので、自系の異常検出手
段として使用しなくともシステムの動作に支障は生じな
い。
第2図は本発明に係る障害検出方式の一実施例構成図で
ある。図において、ウオッチドックタイマ110および
120は時間監視手段の機能を有し、起動した時刻より
カウントダウンし、一定時間後にリセットされないとタ
イムアウトを自系CPUに通知する。割込み受付回路2
10および220は他系CPUからの割込み要求IRQ
を常時受付け、正常時にはウオッチドックタイマを常時
リセットしており、異常時にはその変化により他系の異
常を自系CPUに通知する。ウオッチドックタイマおよ
び割込み受付回路はいずれもシステムDPIおよびDP
2内に予め用意されている装置を利用する。
ある。図において、ウオッチドックタイマ110および
120は時間監視手段の機能を有し、起動した時刻より
カウントダウンし、一定時間後にリセットされないとタ
イムアウトを自系CPUに通知する。割込み受付回路2
10および220は他系CPUからの割込み要求IRQ
を常時受付け、正常時にはウオッチドックタイマを常時
リセットしており、異常時にはその変化により他系の異
常を自系CPUに通知する。ウオッチドックタイマおよ
び割込み受付回路はいずれもシステムDPIおよびDP
2内に予め用意されている装置を利用する。
このように、現用系および予備系のシステムは共に一定
周期毎に相手系に対して割込み要求IRQを発生し、割
込み要求IRQは所定のプログラムにより発生される。
周期毎に相手系に対して割込み要求IRQを発生し、割
込み要求IRQは所定のプログラムにより発生される。
割込み受付回路は割込み要求IRQをCPUに通知し、
CPUはウオッチドックタイマを起動(T1)する。
CPUはウオッチドックタイマを起動(T1)する。
システムDPI(又はDP2)に異常が発生し割込み要
求IRQが停止するとシステムDP2(又はDPI)の
ウオッチドックタイマがタイムアウトをCPUに通知(
T2)する。この通知によりシステムは相手系の異常を
検出し、実行中のジョブの引継ぎを行なう。このように
、システム間−で相互に監視し合うことにより異常を検
出することができ迅速な対応が可能となる。
求IRQが停止するとシステムDP2(又はDPI)の
ウオッチドックタイマがタイムアウトをCPUに通知(
T2)する。この通知によりシステムは相手系の異常を
検出し、実行中のジョブの引継ぎを行なう。このように
、システム間−で相互に監視し合うことにより異常を検
出することができ迅速な対応が可能となる。
〔発明の効果]
以上説明したように、本発明によれば、2重化コンピュ
ータシステムにおいて、相手側に常時割込み要求を発し
、異常時に割込み要求を受けなくなると相手側の異常を
認識しジョブの引継ぎを行なうので迅速な処理が可能と
なる。
ータシステムにおいて、相手側に常時割込み要求を発し
、異常時に割込み要求を受けなくなると相手側の異常を
認識しジョブの引継ぎを行なうので迅速な処理が可能と
なる。
第1図は本発明の原理構成図、
第2図は本発明の一実施例構成図、および第3図は従来
の構成図である。 (符号の説明) 110、120・・・・・・・・・ウオッチドックタイ
マ、210、220・・・・・・・・・割込み受付回路
、cpu i、 CPU2・・・コンピュータ、L+、
Lz・・・・・・通信パス。
の構成図である。 (符号の説明) 110、120・・・・・・・・・ウオッチドックタイ
マ、210、220・・・・・・・・・割込み受付回路
、cpu i、 CPU2・・・コンピュータ、L+、
Lz・・・・・・通信パス。
Claims (1)
- 【特許請求の範囲】 1、現用系および予備系のコンピュータシステムにより
構成される多重化コンピュータシステムの障害検出方式
において、 現用系のコンピュータ(CPU1)と予備系のコンピュ
ータ(CPU2)の割込み手段(22)を接続する通信
パス(L_1)と、 予備系のコンピュータ(CPU2)と現用系のコンピュ
ータ(CPU1)の割込み手段(21)を接続する通信
パス(L_2)とを備え、 双方のシステムは、正常時にあっては、互に相手側に対
し常に割込み要求(IRQ)を発して前記割込み要求(
IRQ)により自系の時間監視手段(11、12)を更
新し、異常時にあっては、前記割込み要求(IRQ)の
停止を前記時間監視手段(11、12)により検知して
タイムアウト通知(T)を自系のコンピュータに送出し
、相手側の異常を検出するようにしたことを特徴とする
障害検出方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63060235A JPH01234966A (ja) | 1988-03-16 | 1988-03-16 | 多重化コンピュータシステムにおける障害検出方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63060235A JPH01234966A (ja) | 1988-03-16 | 1988-03-16 | 多重化コンピュータシステムにおける障害検出方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH01234966A true JPH01234966A (ja) | 1989-09-20 |
Family
ID=13136307
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63060235A Pending JPH01234966A (ja) | 1988-03-16 | 1988-03-16 | 多重化コンピュータシステムにおける障害検出方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH01234966A (ja) |
-
1988
- 1988-03-16 JP JP63060235A patent/JPH01234966A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH01234966A (ja) | 多重化コンピュータシステムにおける障害検出方式 | |
JPH10116261A (ja) | 並列計算機システムのチェックポイントリスタート方法 | |
JP2578985B2 (ja) | 二重化制御装置 | |
JPH01217666A (ja) | マルチプロセッサシステムの障害検出方式 | |
JPH0644093A (ja) | 二重化装置切替方式 | |
JPH0736721A (ja) | 多重化コンピュータシステムの制御方式 | |
JP2998804B2 (ja) | マルチマイクロプロセッサシステム | |
JPH03266131A (ja) | 多重化システムの無応答判定方式 | |
JP2003256399A (ja) | ホットスタンバイシステム切り替え制御方式 | |
JPH05224964A (ja) | バス異常通知方式 | |
JP2744113B2 (ja) | 計算機システム | |
JPH01166161A (ja) | マルチプロセッサシステムの相互監視方式 | |
JPH01169545A (ja) | 多重化コンピュータシステムにおける障害検出方式 | |
JPS60134942A (ja) | 異常状態におけるバツクアツプシステム | |
JPS6123246A (ja) | マルチプロセツサシステムの監視方式 | |
JPS62190536A (ja) | 冗長構成制御方式 | |
JPS63279646A (ja) | 網管理装置の自動再開処理方式 | |
JPH02310755A (ja) | ヘルスチェック方式 | |
JPH03278238A (ja) | 相互ホットスタンドバイシステム | |
JPH0449402A (ja) | プログラマブルコントローラの二重化システム | |
JPH11184814A (ja) | 端末切替装置 | |
JPH10143393A (ja) | 診断処理装置 | |
JPH01163859A (ja) | チャネル障害回復制御装置 | |
JPH0588926A (ja) | 監視制御系の自動切替回路 | |
JPH03111962A (ja) | マルチプロセッサ・システム |