JPH03232352A - ネットワークシステムの集中統合監視方式 - Google Patents

ネットワークシステムの集中統合監視方式

Info

Publication number
JPH03232352A
JPH03232352A JP2086636A JP8663690A JPH03232352A JP H03232352 A JPH03232352 A JP H03232352A JP 2086636 A JP2086636 A JP 2086636A JP 8663690 A JP8663690 A JP 8663690A JP H03232352 A JPH03232352 A JP H03232352A
Authority
JP
Japan
Prior art keywords
monitoring system
failure
child
parent
notification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2086636A
Other languages
English (en)
Inventor
Shigeko Ihara
井原 慈子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2086636A priority Critical patent/JPH03232352A/ja
Publication of JPH03232352A publication Critical patent/JPH03232352A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)
  • Monitoring And Testing Of Exchanges (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はネットワークシステムに備えられた監視対象装
置の障害監視に利用する。本発明は多量に障害が通知さ
れたときに、必要とする障害通知が廃棄されることを防
止できるネットワークシステムの集中統合監視方式に関
する。
〔概要〕
本発明は複数種の監視対象装置を備え、これらの監視対
象装置を種別に複数の子監視システムが監視し、さらに
この複数の子監視システムをひとつの親監視システムが
同時に集中して監視するネ7 +−ワークシステムの集
中統合監視方式において、親監視システムからの通知受
信応答を監視し、各子監視システムから自システムに属
する監視対象装置に障害が発生したことが通知され親監
視システムが単位時間に受け取れる障害通知件数の限界
を超えているときには通知を停止させ、一定時間応答が
こないときには自発的に障害通知を中断させ、さらに監
視タイマの設定値にレベルを設定することにより、 必要とされる障害通知が廃棄され、もしくは不要な障害
の間に埋もれてしまうことを防止し、親監視システムの
性能が限界に達する前に処理負担を減らして必要な障害
通知の廃棄が起こらないようにし、さらに上位レベルの
監視対象装置の障害が原因で下位レベルの子監視システ
ムの通知が発生しても上位レベルの障害通知がより親監
視システムに到達しやすくなるようにしたものである。
〔従来の技術〕
従来は、親監視システムは、子監視システムからの障害
通知を全て受け取りその後に対応する処理を行っていた
また、ネットワークの特性上、上位レベルの監視対象装
置の障害のために下位レベルの監視対象装置でも障害と
認識し、一つの上位子監視システムからの障害通知と同
時にその監視対象装置に多重されているすべての下位子
監視システムから障害が通知されるが、親監視システム
の1秒間に受け取れる障害通知件数の限界に達する前に
親監視システムはより下位な子監視システムからの障害
通知を停止させていた。
〔発明が解決しようとする問題点〕
上述したように従来はネットワークの特性から、上位レ
ベルの監視対象装置の障害により下位1ノベルの監視対
象装置も障害と認識され、一つの上位子監視システムか
らの障害通知と同時にその監視対象装置に多重化されて
いるすべての下位子監視システムから障害が通知されて
しまい、また、親監視システムの単位時間に受け取れる
障害通知件数の限界によっては親監視システム内と子監
視システム内で障害通知が廃棄されていた。
また親監視システムが子監視システムに対して停止要求
を出してし)る間も、子監視システムが停止要求を実行
するまで障害通知は送信され続け、その処理を親監視シ
ステムが行わなければならず、その間に親監視システム
の処理能力が限界に達した場合、障害通知は廃棄されて
いた。
本発明はこのような問題を解決するもので、必要とされ
る障害通知が廃棄されることを防止することができる監
視方式を提供することを目的とする。
〔問題点を解決するための手段〕
本発明の第一は、ひとつの親監視システムが複数の子監
視システムを監視し、この複数の子監視システムそれぞ
れが複数の監視対象装置を監視し、さらに前記複数の子
監視システムそれぞれに属するひとつまたはそれ以上の
前記監視対象装置が相互に接続され、前記複数の子監視
システムに、自システムが監視する前記監視対象装置に
障害が発生したとき、前記親監視システムにその障害を
通知する手段を備えたネットワークシステムの集中統合
監視方式において、前記親監視システムに、単位時間に
受け取れる障害通知件数の限界に達する以前に前記複数
の子監視システムに対し障害通知の停止を指示する手段
を備え、前記複数の子監視システムに、前記親監視シス
テムから障害通知停止の指示を受けたときは前記監視対
象装置の障害を前記親監視システムに通知することを停
止し、障害通知再開要求を受けたときは障害通知を再開
する手段を備えたことを特徴とする。
本発明の第二は、ひとつの親監視システムが複数の子監
視システムを監視し、この複数の子監視システムそれぞ
れが複数の監視対象装置を監視し、さらに前記複数の子
監視システムそれぞれに属するひとつまたはそれ以上の
前記監視対象装置が相互に接続され、前記複数の子監視
システムに、自システムが監視する前記監視対象装置に
障害が発生したとき、前記親監視システムにその障害を
通知する手段を備えたネットワークシステムの集中統合
監視方式において、前記親監視システムに、単位時間に
受け取れる障害通知件数の限界に達する以前に前記複数
の子監視システムに対し障害通知の停止を指示する手段
と、障害通知を受けたときにその応答を前記複数の子監
視システムに送出する手段とを備え、前記複数の子監視
システムに、前記親監視システムから障害通知停止の指
示を受けたときは前記監視対象装置の障害を前記親監視
システムに通知することを停止し、障害通知再開要求を
受けたときは障害通知を再開する手段と、前記親監視シ
ステムからの受信応答時間を監視タイマにより監視する
とともに、各子監視システムから多量の障害通知が発生
したときに自発的に障害通知を一時中断する手段とを備
えたことを特徴とする。
〔作用〕
親監視システムが複数の子監視システムから、自システ
ムに属する監視対象装置に障害が発生したことを通知さ
れたときに、単位時間(例えば1秒間)に受け取ること
のできる障害通知件数の限界値に達する以前に障害の通
知を停止させる。また、親監視システムからの通知受信
応答を監視し、一定時間応答がこないときに自発的に障
害通知を中断させる。
これにより、上位レベルの監視対象装置の障害のために
下位レベルの監視対象装置までが障害とみなされること
を防止し、また親監視システムが単位時間に受け取るこ
とができる障害通知の限界を越えたことにより親監視シ
ステムと子監視システム内で本来必要とされる障害通知
が廃棄されてしまうことを防ぐことができる。さらに、
親監視システムの性能が限界に達する前に処理負担を減
らして必要て障害通知の廃棄が起こらないようにするこ
とができ、上位レベルの監視対象装置の障害が原因で下
位レベルの子監視システムの通知が発生しても上位レベ
ルの障害通知を親監視システムにより到達しやすくする
ことが可能となる。
〔実施例〕
次に、本発明実施例を図面に基づいて説明する。
第1図は本発明実施例の構成を示すブロック図である。
く第一実施例) 本発明第一実施例は、ひとつの親監視システム10が複
数の子監視システム20−1.20−2.20−3を監
視し、この複数の子監視システム20−1.20−2.
20−3それぞれが複数の監視対象装置3〇−1〜30
−10.31−1〜31−4.32−1および32−2
を監視し、さらに子監視システム2O−L20−2.2
0−3それぞれに属する監視対象装置3〇−1〜30−
10.31−1〜3i4.32−’1および32−2が
相互に接続される。
すなわち、監視対象装置30−1〜30−3が監視対象
装置31−1に接続され、監視対象装置30−4および
30−5が監視対象装置31−2に接続され、監視対象
装置31−1および31−2が監視対象装置32−1に
接続される。
さらに、監視対象装置32−1と32−2が対向して接
続され、監視対象装置32−2が監視対象装置31−3
.31−4に分散され、監視対象装置31−3が監視対
象装置30−6および30−8に分散され、監視対象装
置31−4が監視対象装置30−9.30−10に分散
され、最終的に監視対象装置30−1と30−6.30
−2と30−10.30−3と30−7.30−4と3
0−8.30−5と30−9が接続される。
子監視システム20−1は監視対象装置30−1〜30
−10を、子監視システム20−2は監視対象装置31
−1〜31−4を、また子監視システム20−3は監視
対象装置32−1および32−2を集中監視し、親監視
システム10は子監視システム20−1.202.20
−3のすべてを監視する。
親監視システム10には、単位時間(1秒間)に受け取
れる障害通知件数の限界に達する以前に複数の子監視シ
ステム20−1,20−2.20−3に対し障害通知の
停止を指示する手段を備え、複数の子監視システム2[
−L 20−2.20−3には、自システムに属する監
視対象装置30−1〜30−10.31−1〜31−4
.32−1および32−2に障害が発生したとき親監視
システム10にその障害を通知する手段と、障害通知停
止中の指示を受けているときに監視対象装置30−1〜
30−10.31−1〜31−4.32−1および32
−2の障害を親監視システムIOに通知することを停止
し、障害通知再開要求を受けたときに障害通知を再開す
る手段とを備える。
次に、このように構成された本発明実施例の動作につい
て説明する。
監視対象装置31−1〜31−4は監視対象装置3〇−
1〜30−10よりも上位にあるように階層的に多重化
されているため上位レベルに障害が発生した場合に下位
レベルに障害が波及する。
例えば、監視対象装置31−1に障害が発生した場合、
子監視システム20−2からその障害が親監視システム
10に通知されるとともに、監視対象装置31−1にて
多重化されている監視対象装置30−1〜30−3.3
0−6.30−7.30−10すべての障害として子監
視システム20−1から親監視システム10に障害が通
知される。
このとき、親監視システム10は、第2図のフローチャ
ートに示すように、単位時間(1秒間)に受け取れる障
害通知件数の限界に達する以前に下位の子監視システム
、例えば20−1に対して障害通知の停止を指示する。
ここで、性能限界をX件/秒としたとき、限界値よりも
小さいY件/秒、および復旧認識2件(Z<Y<X)を
設定する。事象が発生し、それが障害通知の場合(Sl
l)、その受信頻度がY件/秒を越えた(S12)  
とき、現在通知されている状態になっている中での最下
位レベルの子監視システムに対して障害通知停止要求を
する( S 13)。
その後、受信した障害通知を解析する(S14)。
また、受信傾度がZ件/秒よりも小さくなった( S 
L?)  とき、現在通知停止中の中での最上位レベル
の子監視システムに通知再開要求を行う(S18)。一
定時間障害通知が無い場合(S15) にも現在停止中
の中での最上位レベルの子監視システムに通知再開要求
を行う(S 16)。
次に、第3図に示すフローチャートに従って子監視シス
テム20−1.20−2.20−3の動作を説明する。
事象が発生し、それが]鷹害発生の場合(321)、現
在、親監視システム10に対しての障害通知が停止中で
あるか否かが判断され(S 22)、停止中でないとき
には親監視システム10に障害を通知する( S 23
)。また、事象が障害通知停止要求であるとき(S24
) 、通知停止中の状態に遷移しく525) 、今後障
害が発生しても(S21)、親監視システム10に(S
 22)通知しない。さらに、障害通知再開要求が到来
した場合(S24) 、通知可能状態に遷移しく826
)、以後障害が発生したとき(321)には親監視シス
テム10に通知する(S23)。
(第二実施例) 本発明第二実施例は、第1図に示す第一実施例と同様の
構成に加えて、親監視システム10に、障害通知を受け
たときにその応答を複数の子監視システム20−1.2
0−2.20−3に送出する手段を備え、複数の子監視
システム20−1.20−2.20−3に、親監視シス
テム10からの受信応答時間を監視タイマにより監視す
るとともに、各子監視システム20−1.2Q−2,2
0−3から多量の障害通知が発生したときに自発的に障
害通知を一時中断する手段を備えるっ 次に、このように構成された本発明第二実施例の動イ乍
について説明する。第4図は本発明第二実施例の親監視
システムIOの動作の流れを示すフローチャートである
親監視ンステムlOの前述した第一実施例との相違は、
障害通知を受信したとき(331) 、受信応答の送信
を子監視システム2O−L20.−2.20−3に対し
て行う処理(S 32)が追加されたところにある。
まず、全体の流れについて説明する。1秒間に受け取れ
る性能を越える前により下位の子監視システム、例えば
、子監視システム20−1に対して障害通知の停止を指
示する。性能限界をX件/秒としたとき、限界値よりも
小さい停止限界Y件/秒、および復旧認識(再開限界)
Z件/秒(Z<Y<X)を設定する。
事象が発生し、それが障害通知の場合(331)、まず
、受信したことを子監視システム20−1.20−2.
20−3に対して通知する受信応答を送信しく532)
 、その受信難度がY件/秒を越えた(S33)とき、
現在通知される状態になっている中での最下位レベルの
子監視システム20−1.20−2.20−3に対して
障害通知停止要求をする(、 S 34)。
その後、受信した障害通知を解析する(335)。
また、受信難度がZ件/秒よりも小さくなったとき(3
38) 、現在通知停止中の中での最上位レベルの子監
視システム2O−L20−2.20−3に通知再開要求
を行う(539)。一定時間障害通知が無い場合(S 
36)にも現在停止中のなかでの最上位レベルの子監視
システム20−1.20−2.20−3に通知再開要求
を行う(S 37)。
次に、第5図に示すフローチャートに従って本発明実施
例の子監視システムの動作について説明する。
事象が発生し、それが障害発生の場合(S 41)現在
、親監視システム10に対しての障害通知が停止または
中断中(親監視システム10からの要求による停止中、
または自発的中断中)でないとき(S42)、親監視シ
ステム10に障害通知をしく S 43)受信応答の監
視タイマを起動する(344)。
また、障害通知が停止または中断中(、S 42)で、
それが自発的中断であるときは(348) 、復旧時に
(S51)再度転送する(354)ための発生したデー
タとして保存する( S 59)。
事象が受信応答であるとき(S45) 、すでに自発的
な中断中でなければ(S46) 、受信応答監視タイマ
をリセットする( S 47)。事象発生が受信応答タ
イムアウトのときは(S48) 、自発的に通知中断中
にしく549) 、自発的中断の回復監視タイマを起動
する( S 50)  ことにより、今後障害が発生し
ても(341)親監視システム10に通知しない(S 
42)。事象発生が自発的中断回復タイムアウトである
とき(551) 、親監視システム10からの停止要求
中でなければ(352) 、通知可能状態に遷移しく3
53) 、中断していた障害の続きの通知を再開する(
S54)。
第5図に示すS55〜S57は、藁3図に示すS24、
S25.326で説明した第一実施例の方式と同じであ
り、事象発生が障害通知停止要求であるとき(S55)
 、通知停止中の状態に遷移しく556) 、今後障害
が発生しても(341) 、親監視システム10に通知
しない(S 42)。さらに、障害通知再開要求が到来
した場合(S55) 、通知可能状態に遷移しく557
) 、今後障害が発生したとき(S 41)、親監視シ
ステム10に通知する( S 43)。
受信応答監視タイムアウト値、および自発的中断回復タ
イムアウト値は子監視システム20−1.20−2.2
0−3ごとに設定可能であり、受信応答監視タイムアウ
ト値はより上位レベルな子監視システム2O−L20−
2.20−3はど長く設定し、自発的中断回復タイムア
ウト値はより上位レベルな子監視システム20−1.2
0−2.20−3はど短く設定する。
親監視システム10からの停止要求中に発生した障害は
廃棄されるが(S58) 、自発的な中断中に発生した
障害は保存しく359) 、復旧時に中断していたとこ
ろから再開通知する(554)。
口発明の効果〕 以上説明したように本発明によれば、親監視システムの
性能限界に達する前に、より下位レベルの子監視システ
ムから障害通知を停止させることにより、必要な障害通
知が廃棄されないようにすることができ、上位レベルの
監視対象装置の障害が原因で発生した下位レベルの子監
視/ステムの通知が廃棄されるために重要な障害が多数
の不要な障害の間に埋もれてしまうことを防止すること
ができる。
また、子監視システムにおいて親監視システムからの通
知受信応答を監視し、一定時間応答がこないときに自発
的に障害通知を中断させることにより、親監視システム
の性能が限界に達する前に処理負担を減らして必要な障
害通知の廃棄が起こらないようにすることができ、さら
に、監視タイマの設定値にレベルを設定することにより
、上位レベルの監視対象装置の障害が原因で下位のレベ
ルの子監視システムの通知が発生しても、上位のレベル
の障害通知がより親監視システムに到達しやすくなるよ
うにすることができるなどの効果がある。
【図面の簡単な説明】
第1図は本発明実施例の構成を示すブロック図。 第2図は本発明第一実施例の親監視システムの動作の流
れを示すフローチャート。 第3図は本発明第一実施例の子監視システムの動作の流
れを示すフローチャート。 第4図は本発明第二実施例の親監視システムの動作の流
れを示すフローチャート。 第5図は本発明第二実施例の子監視システムの動作の流
れを示すフローチャート。 10・・・親監視システム、20−1〜20−3・・・
子監視システム、30−1〜30−10.31−1〜3
1−4.32−1.32−2・・・監視対象装置。

Claims (1)

  1. 【特許請求の範囲】 1、ひとつの親監視システムが複数の子監視システムを
    監視し、この複数の子監視システムそれぞれが複数の監
    視対象装置を監視し、 さらに前記複数の子監視システムそれぞれに属するひと
    つまたはそれ以上の前記監視対象装置が相互に接続され
    、 前記複数の子監視システムに、自システムが監視する前
    記監視対象装置に障害が発生したとき、前記親監視シス
    テムにその障害を通知する手段を備えたネットワークシ
    ステムの集中統合監視方式において、 前記親監視システムに、単位時間に受け取れる障害通知
    件数の限界に達する以前に前記複数の子監視システムに
    対し障害通知の停止を指示する手段を備え、 前記複数の子監視システムに、前記親監視システムから
    障害通知停止の指示を受けたときは前記監視対象装置の
    障害を前記親監視システムに通知することを停止し、障
    害通知再開要求を受けたときは障害通知を再開する手段
    を備えた ことを特徴とするネットワークシステムの集中統合監視
    方式。 2、ひとつの親監視システムが複数の子監視システムを
    監視し、この複数の子監視システムそれぞれが複数の監
    視対象装置を監視し、 さらに前記複数の子監視システムそれぞれに属するひと
    つまたはそれ以上の前記監視対象装置が相互に接続され
    、 前記複数の子監視システムに、自システムが監視する前
    記監視対象装置に障害が発生したとき、前記親監視シス
    テムにその障害を通知する手段を備えたネットワークシ
    ステムの集中統合監視方式において、 前記親監視システムに、 単位時間に受け取れる障害通知件数の限界に達する以前
    に前記複数の子監視システムに対し障害通知の停止を指
    示する手段と、 障害通知を受けたときにその応答を前記複数の子監視シ
    ステムに送出する手段と を備え、 前記複数の子監視システムに、 前記親監視システムから障害通知停止の指示を受けたと
    きは前記監視対象装置の障害を前記親監視システムに通
    知することを停止し、障害通知再開要求を受けたときは
    障害通知を再開する手段と、前記親監視システムからの
    受信応答時間を監視タイマにより監視するとともに、各
    子監視システムから多量の障害通知が発生したときに自
    発的に障害通知を一時中断する手段と を備えたことを特徴とするネットワークシステムの集中
    統合監視方式。
JP2086636A 1989-12-15 1990-03-31 ネットワークシステムの集中統合監視方式 Pending JPH03232352A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2086636A JPH03232352A (ja) 1989-12-15 1990-03-31 ネットワークシステムの集中統合監視方式

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP32533689 1989-12-15
JP1-325336 1989-12-15
JP2086636A JPH03232352A (ja) 1989-12-15 1990-03-31 ネットワークシステムの集中統合監視方式

Publications (1)

Publication Number Publication Date
JPH03232352A true JPH03232352A (ja) 1991-10-16

Family

ID=26427744

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2086636A Pending JPH03232352A (ja) 1989-12-15 1990-03-31 ネットワークシステムの集中統合監視方式

Country Status (1)

Country Link
JP (1) JPH03232352A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6125104A (en) * 1996-08-26 2000-09-26 Nec Corporation Network node for switching quality detector to incoming signal specified by request message from adjacent node
JP2011014073A (ja) * 2009-07-06 2011-01-20 Nec Computertechno Ltd ログ管理システム、ログ管理方法、ログ収集部及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6125104A (en) * 1996-08-26 2000-09-26 Nec Corporation Network node for switching quality detector to incoming signal specified by request message from adjacent node
JP2011014073A (ja) * 2009-07-06 2011-01-20 Nec Computertechno Ltd ログ管理システム、ログ管理方法、ログ収集部及びプログラム

Similar Documents

Publication Publication Date Title
US5781770A (en) Method and controller for controlling shutdown of a processing unit
US20080301489A1 (en) Multi-agent hot-standby system and failover method for the same
CA2124772C (en) Processor shelf controller
US6327675B1 (en) Fault tolerant system and method
EP1592173B1 (en) Protection switching methods and systems for electronic devices
JPH03232352A (ja) ネットワークシステムの集中統合監視方式
JPS6354846A (ja) 負荷分散通信制御装置
JPH03194601A (ja) 協調分散制御システム
JPH05191388A (ja) 通信処理システム
JP3442055B2 (ja) 移動通信制御装置およびその制御方法
JPH07182297A (ja) サーバクライアント型ネットワークシステム
JP2889888B2 (ja) 通信処理装置
JP3342253B2 (ja) 分散ノードシステムの障害回復方法
JPH04274646A (ja) ステータス通知方式
JP2758706B2 (ja) 切断要因通知方式
JPS63308646A (ja) デ−タ処理装置における負荷状態検出方式
JPH02105648A (ja) 障害検出回線切換方式
JPS6322675B2 (ja)
JPS6285374A (ja) バス結合装置
JPH02310755A (ja) ヘルスチェック方式
JPH08293882A (ja) 通信装置
JPH0420057A (ja) 網制御装置の障害検出システム
JPH08317054A (ja) 自動初期プログラムロード方式
JPS6288449A (ja) 遠方監視方式
JPH0468457A (ja) ネットワーク管理システムのマネージャ装置