JPH1131136A - 分散処理システムの異常監視方式 - Google Patents

分散処理システムの異常監視方式

Info

Publication number
JPH1131136A
JPH1131136A JP9185626A JP18562697A JPH1131136A JP H1131136 A JPH1131136 A JP H1131136A JP 9185626 A JP9185626 A JP 9185626A JP 18562697 A JP18562697 A JP 18562697A JP H1131136 A JPH1131136 A JP H1131136A
Authority
JP
Japan
Prior art keywords
node
abnormality
monitoring
monitored
diagnosis information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9185626A
Other languages
English (en)
Inventor
Tetsuya Abe
哲也 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Original Assignee
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meidensha Corp, Meidensha Electric Manufacturing Co Ltd filed Critical Meidensha Corp
Priority to JP9185626A priority Critical patent/JPH1131136A/ja
Publication of JPH1131136A publication Critical patent/JPH1131136A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】 【課題】 複数のコンピュータがネットワーク接続さ
れ、各コンピュータをノードとしてその異常を監視する
のに、ノードの追加・変更が難しくなるし、ノード別の
適確な監視ができない。 【解決手段】 各ノード1〜Nは、自身のノードIDを
持ち、かつ監視対象とするノードのIDを登録してお
く。監視対象となる各ノードは監視内容をノード別に任
意に設定した異常診断情報を全ノードに周期的に送信
し、監視対象ノードのIDを登録したノードが異常診断
情報から当該ノードの異常状態を監視する。異常診断情
報は、ノードIDの他に、監視対象ノード側で任意にセ
ットしたノード名称と異常診断情報の時間監視のための
送信周期及び監視内容になる異常内容とする。さらに、
異常判定規定値や異常状態フラグを含め、ノード毎に詳
細な異常監視をする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、イーサネット等に
より複数コンピュータがネットワーク接続された分散処
理システムに係り、特にノードの異常監視方式に関す
る。
【0002】
【従来の技術】この種の従来の異常監視方式は、ネット
ワークソフトウェアで用意する異常監視方式と、システ
ム固有の監視装置による異常監視方式がある。
【0003】前者の方式は、ネットワーク上のコンピュ
ータ(ノード)からネットワーク毎に定められた周期で
情報を送出し、その情報が途絶えたことにより当該ノー
ドの異常を検出する。後者の方式は、ネットワーク上に
システム監視用装置を用意し、その装置に対して正常/
異常コードを通知することにより、システムを構成する
ノードの状態を監視する。
【0004】
【発明が解決しようとする課題】従来のソフトウェアに
よる異常監視方式は、ネットワークで一律の周期で監視
するため、ノード毎の重要度やレスポンスを加味した適
確な監視ができない。また、ネットワーク通信が不可能
となるまで異常を認識できない。例えば、あるノードの
表示や入力等の他機能の異常が検出できない。
【0005】従来のシステム固有の異常監視方式は、ネ
ットワーク上にノードが追加される毎に、監視装置に対
して監視対象の追加を行うことを必要とする。この追加
には、装置名称、異常コード、異常名称、監視周期など
を設定するため、その管理が繁雑になる。さらに、異常
項目が追加された場合には当該ノードのみでなく、監視
装置への異常コード、異常名称の追加を必要とする。ま
た、監視装置自体の異常を考慮したバックアップ装置が
必要となる。
【0006】本発明の目的は、専用の監視装置を不要に
しながらノードの追加・変更を容易にし、ノード毎に詳
細で適確な監視ができる分散処理システムの異常監視方
式を提供することにある。
【0007】
【課題を解決するための手段】本発明は、専用の監視装
置を設ける事なくネットワーク接続される各ノードが相
互に異常監視を行い、しかも監視対象ノードはそのID
を監視ノード側に個別に登録し、監視内容は監視対象ノ
ード側が異常診断情報として送信するようにしたもの
で、以下の方式を特徴とする。
【0008】複数のコンピュータがネットワーク接続さ
れ、各コンピュータをノードとしてその異常を監視する
分散処理システムにおいて、各ノードは自身のノードI
Dを持ち、かつ監視対象とするノードのIDを登録して
おき、監視対象となる各ノードは監視内容をノード別に
任意に設定した異常診断情報を全ノードに周期的に送信
し、監視対象ノードのIDを登録したノードが前記異常
診断情報から当該ノードの異常状態を監視することを特
徴とする。
【0009】また、前記異常診断情報は、システムで取
り決めたノードIDと、監視対象ノード側で任意にセッ
トしたノード名称と異常診断情報の時間監視のための送
信周期及び監視内容になる異常内容としたことを特徴と
する。
【0010】また、前記異常診断情報は、前記送信周期
を監視対象ノード側で負荷の重要度に合わせて任意にセ
ットする異常判定規定値を追加し、この規定値に従って
監視ノード側で時間監視することを特徴とする。
【0011】また、前記異常診断情報は、監視対象ノー
ド側で前記異常内容を任意に重み別けした異常状態フラ
グを追加し、このフラグの受信で監視ノード側で異常発
生/復帰の状態監視をすることを特徴とする。
【0012】
【発明の実施の形態】図1は、本発明の実施形態を示す
分散処理システムの構成図である。ネットワークで接続
された各ノード1、2、…、Nは、それぞれ自身のノー
ドIDを持つ他に、当該ノードが監視対象とするノード
IDを登録しておく。この登録は、ネットワーク上の全
てのノードを登録することなく、個別に又はグループ毎
に登録する。図示の例では、ノード1はそれが監視対象
とするノードを2と6としている。
【0013】次に、各ノードは、監視内容を任意に設定
した異常診断情報を全ノードに対して一斉に周期的に送
信する。この異常診断情報を受信したノードは、個別に
システム内のノードの異常状態を監視する。
【0014】上記の異常診断情報は、図2に送信データ
構造の各例を示す。同図の(a)に示す異常診断情報で
は、送信データは、ノードIDとノード名称と送信周期
と異常内容名称の各項目を持つ。このうち、ノードID
は、システムで取り決めた数値。ノード名称は、送信ノ
ード側で任意にセットするコード。送信周期は、送信ノ
ード側で任意にセットする数値。異常内容は、送信ノー
ド側で任意にセットするコードであり、異常発生時のみ
セットする。
【0015】異常診断情報を受信した各ノードは、登録
された監視対象ノードからの異常診断情報のみについて
の監視処理を行う。このうち、第1の監視処理は、送信
ノード側でセットしたノード名称を初回受信時のみセー
ブする。これにより、監視ノード側はノードIDを登録
するのみで、そのノード名称を設定する必要がなくな
る。また、監視対象ノードの追加には監視対象ノードの
IDの登録のみで済む。
【0016】第2の監視処理は、監視対象ノードから受
信した異常内容をセーブし、当該監視対象ノードの状態
として表示する。これにより、監視ノード側は、監視対
象ノードの異常表示に関するメッセージをあらかじめ設
定する必要がなくなる。
【0017】第3の監視処理は、監視対象ノードからの
異常診断情報の受信時間による異常監視を行う。この監
視のためには、各ノードには監視タイマを設け、この監
視タイマの値を送信周期のn倍にセットしておき、この
セット時間内に監視対象ノードから異常診断情報を受信
したときに監視タイマをリセット(キャンセル)し、セ
ット時間を越えても監視対象ノードから異常診断情報を
受信しないときに当該監視対象ノードの装置停止と判断
する。
【0018】この監視タイマによる監視では、監視対象
ノードが送信周期を送信することから、監視ノード側は
監視対象ノード毎の性能に合わせた監視が可能になる
し、監視対象ノード側で監視周期を設定できる。
【0019】図2の(b)に示す異常診断情報では、
(a)の項目の他に、異常判定規定値を追加している。
この異常判定規定値は、監視ノード側が監視タイマの値
を送信周期のn倍に設定するのに変えて、数値nを監視
対象ノード側で任意にセットして送信する。
【0020】この異常判定規定値を監視対象ノード側で
セットして送信することにより、監視対象ノード側でそ
の負荷重要度に合わせた詳細な異常監視を可能にする。
例えば、監視対象ノードA,B,Cが下記表のように送
信周期と異常判定規定値を設定するとき、ノードA,B
は60秒で異常を検出し、ノードCは300秒で異常を
検出する設定になる。また、送信周期からノードAは異
常復帰後10秒で正常を認識でき、ノードB,Cでは3
0秒で認識できる。
【0021】
【表1】
【0022】図2の(c)に示す異常診断情報では、
(b)の項目の他に、監視対象ノード側で任意にセット
する異常状態フラグを追加している。このフラグは、異
常の軽重の重み別けとすることも含む。
【0023】異常状態フラグを受信した監視ノード側で
は、正常時のフラグをセーブしておき、この後の異常発
生によるフラグの変化検出により同時に受信する異常内
容を表示するアラーム処理を可能にする。
【0024】このように、監視対象ノードが異常状態フ
ラグを送信することにより、監視ノード側で異常発生/
復帰の変化を監視できる。また、装置停止以外の異常状
態を監視できる。また、異常状態フラグを送信しない場
合では発生中の異常のみを異常内容に編集するが、異常
状態フラグも送信することで固定のコードになり、当該
情報の編集が容易となる。
【0025】
【発明の効果】以上のとおり、本発明によれば、専用の
監視装置を設ける事なくネットワーク接続される各ノー
ドが相互に異常監視を行い、しかも監視対象ノードはそ
のIDを監視ノード側に個別に登録し、監視内容は監視
対象ノード側が異常診断情報として送信するようにした
ため、専用の監視装置を不要にしながらノードの追加・
変更を容易にし、ノード毎に詳細で適確な監視ができる
効果がある。
【図面の簡単な説明】
【図1】本発明の実施形態を示す分散処理システムの構
成図。
【図2】実施形態における異常診断情報の送信データ構
造。
【符号の説明】
1〜N…ノード

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 複数のコンピュータがネットワーク接続
    され、各コンピュータをノードとしてその異常を監視す
    る分散処理システムにおいて、 各ノードは自身のノードIDを持ち、かつ監視対象とす
    るノードのIDを登録しておき、監視対象となる各ノー
    ドは監視内容をノード別に任意に設定した異常診断情報
    を全ノードに周期的に送信し、監視対象ノードのIDを
    登録したノードが前記異常診断情報から当該ノードの異
    常状態を監視することを特徴とする分散処理システムの
    異常監視方式。
  2. 【請求項2】 前記異常診断情報は、システムで取り決
    めたノードIDと、監視対象ノード側で任意にセットし
    たノード名称と異常診断情報の時間監視のための送信周
    期及び監視内容になる異常内容としたことを特徴とする
    請求項1に記載の分散処理システムの異常監視方式。
  3. 【請求項3】 前記異常診断情報は、前記送信周期を監
    視対象ノード側で負荷の重要度に合わせて任意にセット
    する異常判定規定値を追加し、この規定値に従って監視
    ノード側で時間監視することを特徴とする請求項2に記
    載の分散処理システムの異常監視方式。
  4. 【請求項4】 前記異常診断情報は、監視対象ノード側
    で前記異常内容を任意に重み別けした異常状態フラグを
    追加し、このフラグの受信で監視ノード側で異常発生/
    復帰の状態監視をすることを特徴とする請求項2又は3
    に記載の分散処理システムの異常監視方式。
JP9185626A 1997-07-11 1997-07-11 分散処理システムの異常監視方式 Pending JPH1131136A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9185626A JPH1131136A (ja) 1997-07-11 1997-07-11 分散処理システムの異常監視方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9185626A JPH1131136A (ja) 1997-07-11 1997-07-11 分散処理システムの異常監視方式

Publications (1)

Publication Number Publication Date
JPH1131136A true JPH1131136A (ja) 1999-02-02

Family

ID=16174086

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9185626A Pending JPH1131136A (ja) 1997-07-11 1997-07-11 分散処理システムの異常監視方式

Country Status (1)

Country Link
JP (1) JPH1131136A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010257113A (ja) * 2009-04-23 2010-11-11 Nec System Technologies Ltd 監視システム、監視方法、及びプログラム
JP2013041484A (ja) * 2011-08-18 2013-02-28 Mitsubishi Electric Corp プログラム監視システム
JP2013178850A (ja) * 2013-06-21 2013-09-09 Nec System Technologies Ltd 監視システム、監視方法、及びプログラム
US8914488B2 (en) 2011-04-28 2014-12-16 International Business Machines Corporation Method and system for monitoring a monitoring-target process

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010257113A (ja) * 2009-04-23 2010-11-11 Nec System Technologies Ltd 監視システム、監視方法、及びプログラム
US8914488B2 (en) 2011-04-28 2014-12-16 International Business Machines Corporation Method and system for monitoring a monitoring-target process
US10068015B2 (en) 2011-04-28 2018-09-04 International Business Machines Corporation Monitoring a monitoring-target process
JP2013041484A (ja) * 2011-08-18 2013-02-28 Mitsubishi Electric Corp プログラム監視システム
JP2013178850A (ja) * 2013-06-21 2013-09-09 Nec System Technologies Ltd 監視システム、監視方法、及びプログラム

Similar Documents

Publication Publication Date Title
US7281172B2 (en) Fault information collection program and apparatus
US6526442B1 (en) Programmable operational system for managing devices participating in a network
JPH08242229A (ja) ネットワーク監視における状態整合処理システム
JP4725724B2 (ja) クラスタ障害推定システム
US5640513A (en) Notification of disconnected service machines that have stopped running
JPH1131136A (ja) 分散処理システムの異常監視方式
CN108681499B (zh) 运维监控方法、装置与计算机可读存储介质
KR20130080720A (ko) 통신망에서 노드 감시 방법 및 시스템
JPH06175944A (ja) ネットワーク監視方法
JP4034436B2 (ja) クライアント・サーバシステム及びクライアント稼働監視方法
CN109920130B (zh) 监控方法、装置,电子设备及计算机可读存储介质
CN113965447A (zh) 一种在线云诊断方法、装置、系统、设备及存储介质
JP3190880B2 (ja) スタンバイシステム、スタンバイ方法、および記録媒体
JP3446447B2 (ja) 分散処理システムのメッセージ処理方法
JP3147037B2 (ja) ネットワーク監視装置
JP2969762B2 (ja) 監視方式
JPS609246A (ja) デ−タ回線網監視方式
JP2000031988A (ja) ノード状態管理システム
JPS634366A (ja) 複合計算機の相互監視装置
JPH10150493A (ja) ネットワーク監視方式
JP2699904B2 (ja) ネットワークシステム
KR20000041926A (ko) 아이피씨 시스템에서 특정 프로세서에 대한 재시동장치 및방법
JP2001005795A (ja) 分散システムにおける異常検出方法
JPH08265320A (ja) ネットワークシステム障害検出処理回路
JPH087726B2 (ja) ヘルスチェック方式