JP2002288050A - コンピュータシステム状態監視制御方式 - Google Patents

コンピュータシステム状態監視制御方式

Info

Publication number
JP2002288050A
JP2002288050A JP2001084304A JP2001084304A JP2002288050A JP 2002288050 A JP2002288050 A JP 2002288050A JP 2001084304 A JP2001084304 A JP 2001084304A JP 2001084304 A JP2001084304 A JP 2001084304A JP 2002288050 A JP2002288050 A JP 2002288050A
Authority
JP
Japan
Prior art keywords
computer
status
input
monitoring
computers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001084304A
Other languages
English (en)
Inventor
Eikichi Ota
栄吉 大田
Masataka Ishimaru
誠孝 石丸
Shinji Saito
真司 斉藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2001084304A priority Critical patent/JP2002288050A/ja
Publication of JP2002288050A publication Critical patent/JP2002288050A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】本発明はコンピュータシステム状態監視制御方
式に関し,複数のコンピュータと複数の入出力機器が回
線で接続されたシステムにおいて,多少の障害ならシス
テムダウンさせることなく業務プログラムの処理を可能
とすることを目的とする。 【解決手段】各コンピュータは,他のコンピュータとの
間で状態信号を転送するコンピュータ間接続インタフェ
ースに接続されたコンピュータ間接続インタフェース部
と,複数の入出力機器との間で信号を送受信するための
回線と接続する回線インタフェース部とを備える。コン
ピュータ間接続インタフェース部を介して他のコンピュ
ータとの間で通信状態の通知を相互に行うことによりコ
ンピュータの状態監視を相互に行って得られた状態を保
持する相互監視部と,回線インタフェース部を介して複
数の入出力機器に対して状態を確認する指示を発生し
て,各入出力機器の状態を取得する構成監視部を備える
よう構成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は高い信頼度の運用が
要求される業務を実行するコンピュータシステムにおけ
る状態監視制御方式に関する。
【0002】従来から,防災,防衛,通信システム,エ
ネルギー等のライフライン等の業務処理を行うシステム
は高い信頼度の運用が要求され,緊急時にも実行処理を
ダウンさせずに,できるだけ業務運用を継続可能にする
ことが要求されている。
【0003】
【従来の技術】従来のシステム状態を監視して対処する
方法の例として,次の,のような方法がある。
【0004】システムについて異常監視を行って,異
常を検出すると保守者に対し警報を発生する。この場
合,異常の警報が発生したことを検出すると保守者(ユ
ーザ)が再起動をかけ,業務を再開する方法がある。こ
の方法は,偶発的に発生して再現性のない異常に対して
は再起動により正常に動作する場合があるが,そうでな
い障害の場合には異常の状態は解消しない。
【0005】予め冗長構成として複数系統の装置を設
け,一方を現用系,他方を予備系として運用して,現用
系に異常が発生すると,その異常検出出力に応じて保守
者が手動で,または自動的に現用系を切り離して予備系
で運用するよう切り替える方法がある。
【0006】
【発明が解決しようとする課題】防災,防衛,通信シス
テム,エネルギー等の業務処理を行うシステムの場合
は,目的としている業務処理において,緊迫している災
害時の処理や,情報が集中するアクセス頻度の高い時に
処理する場合は,システム停止は致命的であり,何とし
ても業務を遂行しなければならないが,待機系の組み込
み処理に業務プログラムを実行するためのソフトウェア
を含むシステムに組み込むための複雑な制御が必要であ
り,業務処理を中断する時間が長くなって影響が大きい
という問題がある。
【0007】同様にシステム構成機器の軽微な障害や,
一部の機器の障害に対しても上記従来技術で対処するた
め同様な問題があった。
【0008】そして,目的としている業務処理,例えば
緊迫している災害時における処理や,情報が集中するア
クセス頻度の高い時に実行されている処理において,シ
ステム停止が発生することは致命的であり,何としても
復旧処理に敏速な対処をしなければならない。
【0009】本発明は複数のコンピュータを備え,複数
の入出力機器とネットワークで接続されてシステムを停
止することができない重要な業務処理を行うシステムに
おいて,多少の障害時ならシステムダウンさせることな
く業務プログラムの処理を可能とするコンピュータシス
テム状態監視制御方式を提供することを目的とする。
【0010】
【課題を解決するための手段】図1は本発明の原理構成
を示す。図中,1−1〜1−3はそれぞれが業務処理を
行うコンピュータであり,CPUやメモリを備え,各コ
ンピュータは業務処理のプログラムをそれぞれにインス
トールされ,どのコンピュータでも他のコンピュータの
業務を実行可能になっており,システムの維持管理を行
うための10〜15の各部を備える。10はシステム全
体を監視してシステムの再構成の制御を行う制御監視
部,11はコンピュータの状態を確認すると共に入出力
機器の状態を監視してテーブルに設定する構成監視部,
12は自コンピュータ及び他コンピュータの状態を相互
に通知して監視する相互監視部,13は監視により得ら
れた複数のコンピュータ及び入出力機器の状態が設定さ
れるテーブル,14は複数の各コンピュータと複数の入
出力機器との間で回線を介して状態監視を行うための回
線インタフェース部,15は複数のコンピュータの間で
相互に状態を通知するためのコンピュータ間接続インタ
フェース部,16はハードディスク等の記憶装置,17
は各々のコンピュータの会話型コンソールである。2は
各コンピュータと複数の入出力機器を接続する回線(例
えば,LAN)である。3は複数のコンピュータを相互
に接続し,状態信号を相互に通知するための専用のコン
ピュータ間接続インタフェース(例えば,シリアルまた
はパラレルの信号線)である。4は複数のコンピュータ
の状態を表示して保守者等に知らせるためのシステム状
態監視表示装置,5〜7はそれぞれ異なる種類の入出力
機器であり,例えば,5−1〜5−3はプリンタ,6−
1〜6−3は画像入出力系,7−1〜7−3は他の入出
力機器である。なお,コンピュータ1−1〜1−3をマ
スタ機器,入出力機器5〜7をスレーブ機器と呼ぶ場合
がある。
【0011】複数のコンピュータはそれぞれ,相互監視
部12の制御により自コンピュータの状態を検出すると
コンピュータ間接続インタフェース部15からコンピュ
ータ間接続インタフェース3を介して,他のコンピュー
タに対して検出した状態を通知すると共に,他のコンピ
ュータの状態を取得する。相互監視部12で得た自コン
ピュータ及び他のコンピュータの状態は,構成監視部1
1に供給され,構成監視部11は各コンピュータの状態
をテーブル13に設定すると共に,回線インタフェース
部14を介して各入出力機器5〜7の状態を問い合わせ
る。この問い合わせに対し指定された入出力機器5〜7
が機器の状態を応答することで構成監視部11は各入出
力機器の状態を取得し,テーブル13に各機器の状態を
設定する。この問い合わせは一定周期毎に行われる。制
御監視部10はテーブル13の設定状態から正常か異常
かを判別し,異常がある場合は,コンピュータ1または
入出力機器5〜7の何れの異常であるのか判別し,異常
の機種や規模に対応して正常な装置により代替するよ
う,障害の状況に対応した各レベルのシステム構成を表
す再構築パターンを多数用意しておき,状況に応じて一
つの再構築パターンを選択してシステム構成を変更する
制御を行う。
【0012】
【発明の実施の形態】上記図1の原理構成に示す相互監
視部12,構成監視部11及び制御監視部10の各部は
プログラムにより実現され,これらの処理フローを図
2,図3,図5に示し,以下に説明する。
【0013】図2は相互監視の処理フローであり,各コ
ンピュータにおいて実行される。最初に自コンピュータ
状態を監視(自己診断)し,動作状態か,ダウン状態か
を判別し,動作状態の場合は使用中(システム構成に組
み込まれてビジー状態)か,空き(システム構成に組み
込まれてないが使用可能状態)かを把握する(図2のS
1)。次に判別した自コンピュータの状態を他の各コン
ピュータへコンピュータ間接続インタフェース(図1の
15,具体的には,パラレルまたはシリアルのデータ転
送バス)を介して通知する(図2のS2)。続いて,こ
のコンピュータ間接続インタフェース15を介して他コ
ンピュータの状態を取得する(図2のS3)。続いて,
自コンピュータの状態を判別し,正常動作中か確認し
(図2のS4),正常動作中であればコンピュータ状態
フラグを「正常」に設定し(同S5),他コンピュータ
へこの状態を通知し(同S6),通常処理(上記S1以
下のチェック)を継続する(同S7)。上記S4におい
て自コンピュータが異常状態であることが確認される
と,コンピュータ状態フラグを「異常」に設定し(図2
のS8),他コンピュータへその状態を通知する(同S
9)。なお,こうして通知された状態は,他のコンピュ
ータの構成監視のフローにおいてテーブルに設定され
る。続いて,継続処理が可能か判別し(図2のS1
0),可能なら処理を継続し,継続処理不可の場合は,
後述する制御監視の処理フロー(図5)に移行する。
【0014】図3は構成監視の処理フローである。最初
に各コンピュータのフラグを確認する(図3のS1)。
各コンピュータの状態は上記図2の相互監視の処理フロ
ー(図2のS5,S6,S8,S9)でフラグまたは通
知により取得されている。フラグにより確認した各コン
ピュータの状態をテーブル(図1の13)に設定する
(図3のS2)。次にコンピュータ(自コンピュータ)
のフラグが正常状態か判別し(図3のS3),正常状態
であれば,各入出力状態(I/O状態)を確認する命令
を発生し(同S4),処理が不可の場合は後述する図5
に示す制御監視の処理フローが実行される。これによ
り,回線インタフェース部14(図1)を介して各入出
力機器5〜7(図1)の各機器毎のそれぞれに対して順
に状態確認のコマンドが出される。各入出力機器からの
返答と状態信号を受け取ることにより,各入出力機器の
状態を取得すると(図3のS5),全入出力機器(I/
O)について取得した状態をテーブルに設定する(同S
6)。続いて,テーブルを参照して,正常状態かを判断
して正常構成が可能か判別し(図3のS7),正常なら
上記S1の処理に戻り,異常な場合は後述する制御監視
の処理フロー(図5)が実行される。
【0015】上記図3の構成監視の処理フローにより作
成されたテーブルの例を図4に示す。図4の例では,マ
スタ機器として3台のコンピュータ(CPUで表し,図
1の1−1〜1−3)の状態を表すフラグと,スレーブ
機器として各種別の入出力機器(I/O,図1の5−1
〜5−3,6−1〜6−3,…)の状態を表すフラグが
設定されている。マスタ機器及びスレーブ機器のフラグ
の状態は,「動作」(動作中状態)か「ダウン」(使用
不可能で修復処理待ちの状態)かの何れかを表す情報
と,「使用」(使用中状態で接続中(ビジー状態))か
「空き」(使用可能な状態(接続可能状態))かの何れ
かを表す情報とが含まれる。
【0016】図5は制御監視の処理フローである。この
処理では,監視状態を調べる(図5のS1)。これは上
記のテーブル(図4)を識別することにより行われる。
これにより正常動作中か判別し(図5のS2),コンピ
ュータと入出力機器の中で業務処理に必要な機器が正常
動作中であれば,通常処理を継続するが(同S3),正
常でない場合は,その装置に対して使用可能な予備機が
あるか判別する(同S4)。この判別はテーブルのフラ
グを見て判別し,予備機がある場合は,予備機への切替
えを行い(図5のS5),業務処理続行が可能か判別し
(同S6),可能な場合は構成変更表示と変更したこと
を表すメッセージをコンソール(図1の17)に出力表
示しシステム状態監視表示が状態表示装置(図1の4)
に表示され,処理を継続して実行する。もし,予備機が
無い場合は,予め設定された再構築パターンの中から,
異常な状態の機器のパターンに対応した最適なパターン
により再構成を行う。図6はこの実施例の再構築パター
ンの例を示す。この再構築パターンの例では,入出力機
器(I/O)の使用できる種類に対応してレベル1〜レ
ベル3に対応した3つのパターン〜がある。
【0017】図5の処理では,予備機が無いと,レベル
1(図6ののパターン)の構成が可能か判断し(図5
のS8),可能な場合はレベル1のパターンで再構成の
設定を行い(同S9),上記のS6,S7が実行され
る。レベル1の構成が可能でない場合(レベル1のパタ
ーンに必要な入出力機器が使用不能の場合),レベル2
(図6ののパターン)の構成が可能か判別し(同S1
0),可能なら再構成の設定を行い(同S11),S
6,S7が実行される。レベル2の構成が可能でない
と,レベル3(図6ののパターン)の構成が可能か判
別し(同S12),可能なら再構成の設定を行い(同S
13),S6,S7が実行される。レベル3の構成が可
能でない場合,操作者に対して警告(ブザー)またはメ
ッセージ(文字を赤表示点滅等)により知らせる(図5
のS14)。この後,操作上の不具合は操作者の再指定
により解決させ,最悪の場合でも障害機材の修理を行い
(図5のS15),障害が復旧した場合は(図5のS1
6),システム構成へ組み込みを行う。また,上記S6
において業務処理続行が不可能と判別された場合も,上
記S14,S15の処理が実行される。
【0018】(付記1) 回線で接続された複数コンピ
ュータと複数の入出力機器とで構成されるシステムにお
いて,各コンピュータは,他のコンピュータとの間で状
態信号を転送するコンピュータ間接続インタフェースに
接続されたコンピュータ間接続インタフェース部と,複
数の入出力機器との間で信号を送受信するための回線イ
ンタフェース部とを備え,前記コンピュータ間接続イン
タフェース部を介して他のコンピュータとの間で通信状
態の通知を相互に行うことによりコンピュータの状態監
視を相互に行って得られた状態を保持する相互監視部
と,前記回線インタフェース部を介して複数の入出力機
器に対して状態を確認する指示を発生して,各入出力機
器の状態を取得する構成監視部を備えることを特徴とす
るコンピュータシステム状態監視制御方式。
【0019】(付記2) 付記1において,前記構成監
視部は,取得した各入出力機器の状態と,前記相互監視
部で取得した各コンピュータの状態とをテーブルに設定
することを特徴とするコンピュータシステム状態監視制
御方式。
【0020】(付記3) 付記2において,各コンピュ
ータは,前記テーブルの内容を識別してコンピュータ及
び入出力機器が正常動作中であるかを判別し,異常な状
態を検出すると予備機への切替えを行い,予備機が存在
しない場合は,縮小構成による業務処理を行うようコン
ピュータと入出力機器の構成を設定する制御監視部を備
えることを特徴とするコンピュータシステム状態監視制
御方式。
【0021】(付記4) 付記3において,前記制御監
視部は,予め障害に応じて正常なコンピュータまたは入
出力機器による代替構成から,最小限度の業務遂行する
構成までの複数のレベルに対応したシステム構成のパタ
ーンを登録設定し,状態に対応して業務処理を最終まで
遂行するようシステム構成のパターンを選択して設定す
ることを特徴とするコンピュータシステム状態監視制御
方式。
【0022】
【発明の効果】本発明によれば,複数のコンピュータと
入出力機器とで構成されて各種の業務処理を行うシステ
ムにおいて,コンピュータ相互の稼働状況を容易に且つ
正確に監視することが可能となり,入出力機器の監視を
含めシステム全体の管理が可能となり,多少の障害時な
らシステムをダウンさせることなく業務プログラムの処
理を遂行することができる。また,どうしても,必要機
器構成が不可能な場合は,最小限の構成でできる限りの
処理を行うことにより,著しくシステムの信頼度を向上
させることができる。
【図面の簡単な説明】
【図1】本発明の原理構成を示す図である。
【図2】相互監視の処理フローを示す図である。
【図3】構成監視の処理フローを示す図である。
【図4】構成監視の処理フローにより作成されたテーブ
ルの例を示す図である。
【図5】制御監視の処理のフローを示す図である。
【図6】再構築パターンの例を示す図である。
【符号の説明】
1−1〜1−3 コンピュータ 10 制御監視部 11 構成監視部 12 相互監視部 13 テーブル 14 回線インタフェース部 15 コンピュータ間接続インタフェース部 16 記憶装置 17 コンソール 2 回線 3 コンピュータ間接続インタフェース 4 システム状態監視表示装置 5〜7 入出力機器
フロントページの続き (72)発明者 斉藤 真司 神奈川県川崎市中原区上小田中4丁目1番 1号 株式会社富士通ディフェンスシステ ムエンジニアリング内 Fターム(参考) 5B089 GA21 GB02 JA35 JB15 JB17 KA12 KB04 MC08

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 回線で接続された複数コンピュータと複
    数の入出力機器とで構成されるシステムにおいて,各コ
    ンピュータは,他のコンピュータとの間で状態信号を転
    送するコンピュータ間接続インタフェースに接続された
    コンピュータ間接続インタフェース部と,複数の入出力
    機器との間で信号を送受信するための回線インタフェー
    ス部とを備え,前記コンピュータ間接続インタフェース
    部を介して他のコンピュータとの間で通信状態の通知を
    相互に行うことによりコンピュータの状態監視を相互に
    行って得られた状態を保持する相互監視部と,前記回線
    インタフェース部を介して複数の入出力機器に対して状
    態を確認する指示を発生して,各入出力機器の状態を取
    得する構成監視部を備えることを特徴とするコンピュー
    タシステム状態監視制御方式。
  2. 【請求項2】 請求項1において,前記構成監視部は,
    取得した各入出力機器の状態と,前記相互監視部で取得
    した各コンピュータの状態とをテーブルに設定すること
    を特徴とするコンピュータシステム状態監視制御方式。
  3. 【請求項3】 請求項2において,各コンピュータは,
    前記テーブルの内容を識別してコンピュータ及び入出力
    機器が正常動作中であるかを判別し,異常な状態を検出
    すると予備機への切替えを行い,予備機が存在しない場
    合は,縮小構成による業務処理を行うようコンピュータ
    と入出力機器の構成を設定する制御監視部を備えること
    を特徴とするコンピュータシステム状態監視制御方式。
JP2001084304A 2001-03-23 2001-03-23 コンピュータシステム状態監視制御方式 Pending JP2002288050A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001084304A JP2002288050A (ja) 2001-03-23 2001-03-23 コンピュータシステム状態監視制御方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001084304A JP2002288050A (ja) 2001-03-23 2001-03-23 コンピュータシステム状態監視制御方式

Publications (1)

Publication Number Publication Date
JP2002288050A true JP2002288050A (ja) 2002-10-04

Family

ID=18939995

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001084304A Pending JP2002288050A (ja) 2001-03-23 2001-03-23 コンピュータシステム状態監視制御方式

Country Status (1)

Country Link
JP (1) JP2002288050A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7589624B2 (en) 2004-10-29 2009-09-15 Nec Corporation Component unit monitoring system and component unit monitoring method

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11220466A (ja) * 1998-01-30 1999-08-10 Fujitsu Ltd ノード代理システム、ノード監視システム、それらの方法、及び記録媒体

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11220466A (ja) * 1998-01-30 1999-08-10 Fujitsu Ltd ノード代理システム、ノード監視システム、それらの方法、及び記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7589624B2 (en) 2004-10-29 2009-09-15 Nec Corporation Component unit monitoring system and component unit monitoring method

Similar Documents

Publication Publication Date Title
US7093013B1 (en) High availability system for network elements
KR20040047209A (ko) 네트워크 상의 컴퓨터 시스템의 자동 복구 방법 및 이를구현하기 위한 컴퓨터 시스템의 자동 복구 시스템
JPH11203157A (ja) 冗長装置
JPH09251443A (ja) 情報処理システムのプロセッサ障害回復処理方法
JP2001092688A (ja) 故障管理装置
JP2002288050A (ja) コンピュータシステム状態監視制御方式
JP3158517B2 (ja) 障害検出方式
JP3325785B2 (ja) 計算機の故障検出・回復方式
JP3208885B2 (ja) 障害監視システム
JP3248483B2 (ja) アラーム処理装置
JP3343618B2 (ja) 端末無中断オンラインシステム
JPH1097317A (ja) 監視画面表示装置
JPH0934852A (ja) クラスタシステム
CN114442786B (zh) 一种电源故障告警及恢复方法、装置及存储介质
JPH06259276A (ja) 多重化装置
JPH08249212A (ja) 多重化されたコンピュータシステムにおける障害監視方法
KR100235570B1 (ko) 2이상의 주전산기를 병립 연결한 시스템의 클러스터 관리 마스터 시스템의 클러스터 관리방법
KR940002271B1 (ko) 전후단 분리 구조 시스템의 장애 자동 감시 방법
JPS60144842A (ja) 他系中央処理装置の異常判定方式
JP2006146685A (ja) マルチノードシステム及び障害復旧方法
JP2699664B2 (ja) コンピュータシステム
JP2699904B2 (ja) ネットワークシステム
JPH05165798A (ja) 2系列システムの系管理方式
JP2022185768A (ja) 情報処理装置及び復旧方法
JPH08147255A (ja) 障害監視方式

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100126

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100601