JPH08249212A - 多重化されたコンピュータシステムにおける障害監視方法 - Google Patents

多重化されたコンピュータシステムにおける障害監視方法

Info

Publication number
JPH08249212A
JPH08249212A JP7079391A JP7939195A JPH08249212A JP H08249212 A JPH08249212 A JP H08249212A JP 7079391 A JP7079391 A JP 7079391A JP 7939195 A JP7939195 A JP 7939195A JP H08249212 A JPH08249212 A JP H08249212A
Authority
JP
Japan
Prior art keywords
fault
failure
emergency
monitoring system
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7079391A
Other languages
English (en)
Inventor
Takanobu Nakamura
隆信 中村
Yoko Yamada
陽子 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
INTEC KK
Original Assignee
INTEC KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by INTEC KK filed Critical INTEC KK
Priority to JP7079391A priority Critical patent/JPH08249212A/ja
Publication of JPH08249212A publication Critical patent/JPH08249212A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 多重化されたコンピュータシステムの信頼性
を向上させること。 【構成】 多重化のために用意されている複数のコンピ
ュータ装置(40、50)間において相互に作動状態を
チェックし、その結果を監視システム装置(10)に定
期的に通知するようにした多重化されたコンピュータシ
ステム(1)における障害監視方法において、障害検出
部(42、52)で重度の障害の発生が確認された場合
には、当該障害の内容を緊急通信部(45、55)によ
り緊急障害監視システム装置(20)に即座に通報す
る。 【効果】 重度の障害の発生を早期に検知でき、故障し
た装置の早期復旧が可能となり、バックアップが不可能
な状態で多重化コンピュータ装置が動作する時間を短縮
させることができ、多重化システムとしての信頼性をよ
り一層向上させることができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、多重化されたコンピュ
ータシステムにおける障害監視方法に関する。
【0002】
【従来の技術】例えば多重化サーバ方式で動作する通信
型カラオケシステムの如く多重化されたコンピュータシ
ステムの障害監視は、多重化によってもたらされる信頼
性を考慮して、その作動状態を1日1回程度の通信によ
り所定の監視システム装置へ通知している。これは、片
方のサーバがシステムダウンした場合のように緊急性の
高い障害が発生した場合も同様である。
【0003】
【発明が解決しようとする課題】しかし、多重化された
コンピュータシステムであっても、一方のシステムが障
害を起こした状態でのシステム全体への影響を考慮した
場合、残りのシステムのみに頼って運用している時間の
短縮及び障害を起こしたシステムの修理、復旧を可及的
速やかに図ることが必要となってきている。このため、
従来から採用されてきている定期通信による通常、緊急
を問わないシステム稼動情報の一括通知方式ではこれに
対応することができないという問題が生じている。
【0004】本発明の目的は、したがって、多重化され
たコンピュータシステムにおいて発生した重度の障害を
監視システム装置へ即座に通知することにより、残りの
コンピュータ装置によって稼動している時間を短縮する
と共に、故障したコンピュータ装置の早期復旧を図るこ
とができるようにした、多重化されたコンピュータシス
テムにおける障害監視方法を提供することにある。
【0005】
【課題を解決するための手段】上記課題を解決するため
の本発明の特徴は、多重化のために用意されている複数
のコンピュータ装置間において相互に作動状態をチェッ
クし、その結果を監視システム装置に定期的に通知する
ようにした多重化されたコンピュータシステムにおける
障害監視方法において、上記チェックによって予め定め
られている重度の障害の発生が確認された場合には、当
該障害の内容を所定の監視システム装置に即座に通報す
るようにした点にある。
【0006】定期的に通知を行う監視システム装置と、
重度の障害の発生時にその旨を通知する監視システム装
置とが同じであってもよいが、別の監視システム装置と
することもできる。また、重度の障害の内容は、そのコ
ンピュータシステムの目的等を考慮して予め適宜に定め
ておくことができる。
【0007】多重化されたコンピュータ装置間の相互チ
ェックは、例えば現用と予備の各コンピュータ装置間で
通信を行ない、相手側コンピュータ装置の作動状況を確
認することにより実行する構成でもよい。この場合、例
えば、ある一定期間以上相手側コンピュータ装置からの
通信が途絶えた場合に、即時通報を必要とする緊急度の
高い重度の障害が相手側コンピュータ装置に発生したと
判断する構成としてもよい。
【0008】相手側コンピュータ装置に何らかの重度な
障害が発生したことを確認したコンピュータ装置が、専
用回線又は公衆回線等の適宜の通信回線手段を用いてそ
の障害に関する情報を所定の監視システム装置に即座に
通知する構成とすることができる。
【0009】
【作用】複数のコンピュータ装置を用いて構成された多
重化システムにおいて、コンピュータ装置間の相互チェ
ックにより障害の発生が確認された場合、その障害が予
め定められた重度の障害であるときにはその障害内容が
即座に所定の監視システム装置に通知される。それ以外
の障害については所定の定期的通知において予め定めら
れた監視システム装置に通知される。
【0010】
【実施例】以下、図面を参照して本発明の一実施例につ
き詳細に説明する。
【0011】図1は、多重化されたコンピュータシステ
ムにおける障害監視を本発明の方法により行うように構
成された障害監視システムのシステム構成を示す図であ
る。ここに示された障害監視システム100は、複数の
多重化コンピュータ装置1、2、・・・、Nにおいて生
じた障害を、その障害の程度に応じて、障害監視システ
ム装置10又は緊急障害監視システム装置20に対して
公衆回線網30を介して通知することができるようにし
たシステムである。本実施例においては、多重化コンピ
ュータ装置1、2、・・・、Nは、それぞれ2台のコン
ピュータ装置で相互にバックアップし合うように構成さ
れた多重化システムとなっている。
【0012】図2を参照すると、多重化コンピュータ装
置1は、相互にバックアップし合うように組み合わされ
た同一構成の第1コンピュータ装置40と第2コンピュ
ータ装置50とを備えて成っている。第1コンピュータ
装置40において、41は中央演算処理部、42は第1
及び第2コンピュータ装置40、50の稼動状況を監視
し第1コンピュータ装置40において障害が発生してい
るか否かを検出すると共に第2コンピュータ装置50に
障害が発生しているか否かをも検出するための障害検出
部である。43は障害検出部42でいずれかのコンピュ
ータ装置に障害が発生したことが検出された場合その検
出された障害の内容を記録するための障害記録ファイル
である。
【0013】44は定常通信部であり、中央演算処理部
41の制御により所定時刻、例えば1日のうちの決めら
れたある時刻に第1及び第2コンピュータ装置40、5
0の稼動状況を示す稼動データ及びその時までに障害記
録ファイル43に蓄積された障害状況に関する障害デー
タを第1定常通信信号SS1として出力する。定常通信
部44はこの所定の時刻に公衆回線網30を介して障害
監視システム装置10と接続され、第1定常通信信号S
S1は障害監視システム装置10に送られる。
【0014】第1コンピュータ装置40或いは第2コン
ピュータ装置50に生じた障害が定常通信部44による
定時の通知によって通知されていたのでは適切な対応を
とることができないレベルの障害、すなわち重度の障害
であると中央演算処理部41において判断された場合、
この障害状況を即座に緊急障害監視システム装置20へ
通報するため、第1コンピュータ装置40には定常通信
部44とは別に緊急通信部45が設けられている。
【0015】その時発生した障害が重度の障害であると
中央演算処理部41において判断された場合、緊急通信
部45はそのオートダイヤル機能によって、公衆回線網
30を介して緊急障害監視システム装置20と接続され
ると共に、障害検出部42によって障害記録ファイル4
3に記録されたその重度の障害の内容を示す緊急障害デ
ータが第1緊急通信信号US1として出力され、これに
より第1緊急通信信号US1が緊急障害監視システム装
置20に送られる。
【0016】次に、第2コンピュータ装置50について
説明すると、51は中央演算処理部、52は障害検出
部、53は障害記録ファイル、54は定常通信部、55
は緊急通信部である。これらは第1コンピュータ装置4
0において符号41〜45で示されている各部に対応し
ており、それらと同等の機能を果たすように構成されて
いるので、それぞれについての詳しい説明は省略する。
【0017】定常通信部54は所定時刻に第2コンピュ
ータ装置50の稼動状況を示す稼動データ及びその時ま
でに障害記録ファイル53に蓄積された障害状況に関す
る障害データを第2定常通信信号SS2として出力し、
第2定常通信信号SS2は障害監視システム装置10に
送られる。
【0018】一方、重度の障害が発生したことが障害検
出部52によって検出されると、緊急通信部55からそ
の障害内容を示す第2緊急通信信号US2が出され、第
2緊急通信信号US2は緊急障害監視システム装置20
に送られる。
【0019】図3には第1及び第2緊急通信信号US
1、US2のデータフォーマットの一例が示されてい
る。このデータフォーマットは一例であり、その内容等
は適宜に定めることができる。
【0020】多重化コンピュータ装置1に障害が発生し
た場合、その障害内容を緊急通信部45又は55によっ
て緊急障害監視システム装置20に通報すべきか否かの
判断基準は各コンピュータ装置において適宜に定めるこ
とができ、本実施例では以下の基準によって定められて
いる。
【0021】すなわち、本実施例の場合における重度の
障害とは、現地での緊急対応が必要な障害であり、具体
的には、相手側コンピュータ装置の機能の完全又は一部
停止状態が生じた場合、又は自コンピュータ装置の機能
の一部停止状態が生じた場合である。なお、このような
重度の障害が生じた場合、本実施例では、定常通信部4
4、45の定時通報機能によってもその障害内容が障害
監視システム装置10に通知される構成となっている。
【0022】また、定常通信部44、54の定時通報機
能によって通知すればよい障害は現地での緊急対応が不
要な障害であり、例えば、コンピュータでのサービスに
影響のない障害である。
【0023】以上、多重化コンピュータ装置1の構成に
ついて詳しく説明したが、その他の多重化コンピュータ
装置2、・・・、Nも全く同様の構成であり、第1及び
第2定常通信信号SS1、SS2と第1及び第2緊急通
信信号US1、US2が同様にして出力されるので、そ
れらの説明は省略する。
【0024】次に、図4を参照して障害監視システム装
置10の構成について説明する。障害監視システム装置
10は、多重化コンピュータ装置1乃至Nからの第1及
び第2定常通信信号SS1、SS2を受信するための障
害通知受信部11を有し、通知のあった障害の内容が障
害データファイル12内に書き込まれて蓄積されると共
に、その発生した障害内容を示す受信データに基づいて
障害内容検索部13において検索が行われ、その受信デ
ータによって示される障害内容を示すデータが出力され
る。この検索結果を示す出力は障害内容表示部14に送
られ、ここでその障害内容が表示される。この結果、障
害監視システム装置10のオペレータはどのコンピュー
タ装置でどのような内容の障害が生じたのかを知ること
ができ、これに対し適切な処置を適宜に採ることができ
る。
【0025】図5には、緊急障害監視システム装置20
のシステム構成図が示されている。緊急障害監視システ
ム装置20は、各コンピュータ装置から送られてくる第
1及び第2緊急通信信号US1、US2を受信する障害
通知受信部21を有し、受信された障害データの障害内
容は障害データファイル22内に蓄積される。この受信
された障害データはまた、障害対応データベースファイ
ル23と接続されている障害復旧方法表示部24にも入
力されており、ここで、その障害データにより示される
障害内容に対する障害復旧方法が障害対応データベース
ファイル23を用いて検索される。この検索により得ら
れた障害復旧方法が、障害復旧方法表示部24の図示し
ない表示装置上に表示される。
【0026】さらに、受信された障害データは障害内容
表示/警報出力部25にも入力され、ここで、その障害
の内容が表示されると共に障害が発生した旨の警報が出
力される。障害内容表示は図示しない表示装置によって
表示される構成であり、警報出力はこの表示装置に適宜
の視覚情報として表示されるほか、別途設けたランプ、
ブザーによる警報を出力する構成となっている。
【0027】したがって、緊急障害監視システム装置2
0のオペレータは、重度の障害が発生した事実、その障
害内容、及びその障害の復旧方法を直ちに把握すること
ができ、発生した障害に対し迅速、且つ適切に対応する
ことが可能である。この結果、各多重化コンピュータ装
置において片方のコンピュータ装置がシステムダウンし
た場合の如く致命的な障害が発生した場合、緊急通信部
45又は55からその障害内容が即座に緊急障害監視シ
ステム装置20に通知されるので、定期的な通報による
障害通知を行う従来システムに比べ、ダウンしたコンピ
ュータ装置の早期復旧が可能となり、1つのコンピュー
タ装置のみに頼って動作している時間を短縮することが
でき、システムの信頼性が著しく改善される。
【0028】図2に示した第1コンピュータ装置40に
おける障害検出部42、定常通信部44及び緊急通信部
45の各機能は、図示しないメモリに予め格納されてい
る所定の障害通知処理プログラムが中央演算処理部41
において実行されることにより実現される構成となって
いる。
【0029】図6は、この障害通知処理プログラム60
を示すフローチャートであり、このフローチャートを参
照して第1コンピュータ装置40における障害通知処理
動作について詳しく説明する。
【0030】障害通知処理プログラム60の実行が開始
されると、ステップ61で障害の発生を検知したか否か
が判別され、障害の発生が検知された場合にはステップ
62に入り、ここで、発生した障害の内容が障害記録フ
ァイル43に書き込まれる。しかる後、ステップ63に
入り、その障害のレベルが重度のレベルか否かが判別さ
れる。
【0031】ステップ63の判別結果がYESの場合に
はステップ64に入り、ここで、発生した障害の内容を
緊急障害監視システム装置20に通知するための緊急通
信処理が実行され、ステップ61に戻る。
【0032】ステップ63の判別結果がNOの場合には
ステップ65に入り、ここで、障害監視システム装置1
0に対して通報を行うための通報時刻であるか否かが判
別される。通報時刻であると判別されるとステップ66
に進み、ここで、重度の障害ではないとステップ63で
判別された障害内容を示すデータ及び第1コンピュータ
装置40の稼動状況に関するデータを障害監視システム
装置10に定時通報するための定常通信処理が実行され
る。ステップ66の実行が終了するとステップ61に戻
る。ステップ65で通報時刻でないと判別されると、ス
テップ66が実行されることなくステップ61に戻る。
【0033】なお、ステップ61の判別結果がNOとな
った場合にはステップ63に入る。この場合はステップ
63の判別結果はNOとなりステップ65に進むことに
なる。以後の動作は上述の通りである。
【0034】図5に示した緊急障害監視システム装置2
0もまたコンピュータシステムとして構成されており、
そこに示された各機能は、図示しないそのコンピュータ
システムのメモリに予め格納されている緊急障害処理プ
ログラムが実行されることにより実現される構成となっ
ている。
【0035】図7の緊急障害処理プログラム70を示す
フローチャートを参照して、緊急障害監視システム装置
20の動作について説明する。緊急障害処理プログラム
70の実行が開始されるとステップ71に入り、いずれ
かの緊急通信信号が受信されたか否かが判別される。緊
急通信信号が受信されていないと再びステップ71が実
行される。そして緊急通信信号が受信されるとステップ
71の判別結果がYESとなり、ステップ72に入る。
【0036】ステップ72では、受信された緊急通信信
号により示される障害の内容が障害データファイル22
に書き込まれ、次のステップ73で障害の発生したこと
をオペレータに知らせるため警報を出力すると共に、そ
の障害の内容を表示する。
【0037】しかる後、ステップ74に進み、ここで、
障害対応データベースファイル23を用いて、その発生
した障害に対処するための障害復旧方法を検索し、検索
の結果得られた障害復旧方法を表示し、ステップ71に
戻る。
【0038】以上、本発明の一実施例につき説明した
が、本発明の方法は、種々の多重化コンピュータシステ
ム、例えば多重化サーバ方式の通信型カラオケシステ
ム、多重化サーバ方式のケーブルテレビジョンシステム
等において発生した障害を監視するために広く適用する
ことができる。
【0039】
【発明の効果】本発明によれば、多重化されたコンピュ
ータ装置においていずれかのコンピュータ装置がシステ
ムダウン等の致命的な障害を発生した場合、このような
障害の発生を即座に所定の監視システム装置に通報する
ようにしたので、重度の障害の発生を早期に検知でき、
故障した装置の早期復旧が可能となる。したがってバッ
クアップが不可能な状態で多重化コンピュータ装置が動
作する時間を短縮させることができ、多重化システムと
しての信頼性をより一層向上させることができる。
【図面の簡単な説明】
【図1】本発明の方法により障害監視を行うようにした
多重化されたコンピュータシステムのための障害監視シ
ステムの一実施例を示す構成図。
【図2】図1に示した多重化コンピュータ装置のシステ
ム構成図。
【図3】各多重化コンピュータ装置から出力される緊急
通信信号のデータフォーマットを示す図。
【図4】図1に示した障害監視システム装置のシステム
構成図。
【図5】図1に示した緊急障害監視システム装置のシス
テム構成図。
【図6】図2に示す多重化コンピュータ装置を構成する
各コンピュータ装置において実行される障害通知処理プ
ログラムを示すフローチャート。
【図7】図5に示す緊急障害監視システム装置において
実行される緊急障害処理プログラムを示すフローチャー
ト。
【符号の説明】
1乃至N 多重化コンピュータ装置 10 障害監視システム装置 20 緊急障害監視システム装置 30 公衆回線網 40 第1コンピュータ装置 42、52 障害検出部 44、54 定常通信部 45、55 緊急通信部 50 第2コンピュータ装置 100 障害監視システム SS1 第1定常通信信号 US1 第1緊急通信信号 SS2 第2定常通信信号 US2 第2緊急通信信号

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 多重化のために用意されている複数のコ
    ンピュータ装置間において相互に作動状態をチェック
    し、その結果を監視システム装置に定期的に通知するよ
    うにした多重化されたコンピュータシステムにおける障
    害監視方法において、前記チェックによって予め定めら
    れている重度の障害の発生が確認された場合には、当該
    障害の内容を所定の監視システム装置に即座に通報する
    ようにしたことを特徴とする多重化されたコンピュータ
    システムにおける障害監視方法。
JP7079391A 1995-03-13 1995-03-13 多重化されたコンピュータシステムにおける障害監視方法 Pending JPH08249212A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7079391A JPH08249212A (ja) 1995-03-13 1995-03-13 多重化されたコンピュータシステムにおける障害監視方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7079391A JPH08249212A (ja) 1995-03-13 1995-03-13 多重化されたコンピュータシステムにおける障害監視方法

Publications (1)

Publication Number Publication Date
JPH08249212A true JPH08249212A (ja) 1996-09-27

Family

ID=13688572

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7079391A Pending JPH08249212A (ja) 1995-03-13 1995-03-13 多重化されたコンピュータシステムにおける障害監視方法

Country Status (1)

Country Link
JP (1) JPH08249212A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008152552A (ja) * 2006-12-18 2008-07-03 Hitachi Ltd 計算機システム及び障害情報管理方法
JP2012234483A (ja) * 2011-05-09 2012-11-29 Canon Inc 情報処理装置、その制御方法、および制御プログラム
JP2013084121A (ja) * 2011-10-11 2013-05-09 Hitachi Ltd 多重系制御装置
JP2015106226A (ja) * 2013-11-29 2015-06-08 三菱電機株式会社 二重化システム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008152552A (ja) * 2006-12-18 2008-07-03 Hitachi Ltd 計算機システム及び障害情報管理方法
JP2012234483A (ja) * 2011-05-09 2012-11-29 Canon Inc 情報処理装置、その制御方法、および制御プログラム
US9075752B2 (en) 2011-05-09 2015-07-07 Canon Kabushiki Kaisha Information processing apparatus that detects startup error, method of controlling the same, and storage medium
JP2013084121A (ja) * 2011-10-11 2013-05-09 Hitachi Ltd 多重系制御装置
JP2015106226A (ja) * 2013-11-29 2015-06-08 三菱電機株式会社 二重化システム

Similar Documents

Publication Publication Date Title
US6862688B2 (en) Fault handling system and fault handling method
US5487148A (en) Method and apparatus for detecting faults in a computer network
CN114490565A (zh) 数据库故障处理方法和装置
JP5322581B2 (ja) 駅務システム
JPH08249212A (ja) 多重化されたコンピュータシステムにおける障害監視方法
JP2001092688A (ja) 故障管理装置
JP2888283B2 (ja) 全2重データ通信装置および全2重データ伝送システム
JP3280703B2 (ja) プラント監視方法及びプラント監視システム
JP3248483B2 (ja) アラーム処理装置
JPH10283015A (ja) プラント監視制御システム
JPH06175887A (ja) 障害監視/通知方式
JPH0955735A (ja) 通信網故障診断システムおよび通信網故障診断方法
KR100319934B1 (ko) 엘리베이터의 원격 고장 검출 시스템 및 그의 제어 방법
KR970006944B1 (ko) 전전자 교환기의 하드디스크 시험방법 및 장치
JP2000181761A (ja) 端末監視システム及び方法
JP3133704B2 (ja) 装置の組み込み方式
JP2000293407A (ja) 監視制御装置及びcpu監視方法並びにプログラム記録媒体
JPH10228313A (ja) 監視装置
JPH09218835A (ja) リモート保守方式
JPH0477617A (ja) センサ二重化監視システム
JPH08278823A (ja) 電源制御方式
JPH06266581A (ja) 遠隔保守障害監視方式
JPH08191298A (ja) バックアップ中の回線状態表示方法
JP2013156730A (ja) 障害情報処理装置、障害情報処理方法、および障害情報処理プログラム
JPH08314741A (ja) 障害情報管理方法