JP2003006004A - 障害発生通知抑止装置および障害発生通知抑止方法 - Google Patents

障害発生通知抑止装置および障害発生通知抑止方法

Info

Publication number
JP2003006004A
JP2003006004A JP2001191532A JP2001191532A JP2003006004A JP 2003006004 A JP2003006004 A JP 2003006004A JP 2001191532 A JP2001191532 A JP 2001191532A JP 2001191532 A JP2001191532 A JP 2001191532A JP 2003006004 A JP2003006004 A JP 2003006004A
Authority
JP
Japan
Prior art keywords
message
failure
merge
output
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001191532A
Other languages
English (en)
Inventor
Takahiko Yamazaki
高日子 山崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2001191532A priority Critical patent/JP2003006004A/ja
Priority to PCT/JP2002/005894 priority patent/WO2003001379A1/ja
Priority to CNA028127811A priority patent/CN1524220A/zh
Publication of JP2003006004A publication Critical patent/JP2003006004A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/076Error or fault detection not based on redundancy by exceeding limits by exceeding a count or rate limit, e.g. word- or bit count limit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0748Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a remote unit communicating with a single-box computer node experiencing an error/fault
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/08Indicating faults in circuits or apparatus
    • H04M3/10Providing fault- or trouble-signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)
  • Monitoring And Testing Of Exchanges (AREA)

Abstract

(57)【要約】 【課題】 ネットワークのトラヒック量を軽減すること
が可能な障害発生通知抑止装置を得ること。 【解決手段】 本発明の障害発生通知抑止装置は、監視
対象装置の障害を検出して障害メッセージ出力要求を出
力する複数の障害処理部1と、障害メッセージ出力要求
を一括して受信するメッセージ受付部2と、同一障害メ
ッセージ出力要求の発生回数が特定時間内において所定
回数に達したかどうかをカウントするメッセージカウン
ト部3と、受け取ったすべての障害メッセージ出力要求
を格納するメッセージ格納部4と、同一障害メッセージ
のマージに必要なパラメータを一括して管理するシステ
ムパラメータ管理部6と、前記カウント結果および前記
パラメータに基づいて所定数の同一障害メッセージ同士
をマージし、監視制御装置に対してマージメッセージを
出力する障害メッセージ出力制御部5と、を備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、監視対象装置にお
いて障害が発生した場合に、監視制御装置に対して障害
メッセージ(TRAP)を通知する障害発生通知抑止装
置に関するものであり、特に、ネットワーク上に流れる
障害メッセージのトラフィック量を軽減するための機構
を備えた障害発生通知抑止装置および障害発生通知抑止
方法に関するものである。
【0002】
【従来の技術】以下、従来の障害発生通知抑止装置につ
いて説明する。たとえば、監視対象装置の特定部分に重
大な障害が発生すると、その障害は周辺部分に波及し、
その後、波及した障害を原因とする障害メッセージ通知
(TRAP)が次々に発行される。また、障害発生時に
は、その障害発生箇所において短時間内に障害および復
旧の状態変化を繰り返し、多数の同一メッセージが発行
されてしまうことが多い。これらのような場合には、監
視制御システムが過負荷となり、結局、監視対象装置の
制御が不能となることがある。
【0003】上記のような過負荷対策を行った従来の障
害発生通知抑止装置としては、たとえば、特開平11−
120036号公報に記載の「障害メッセージ出力制御
システム」がある。ここでは、障害メッセージが多発し
た場合、当該メッセージをリアルタイムに出力するので
はなく、発生した障害メッセージのバッファリングを行
い、所定の情報に基づいて抽出された障害メッセージを
出力する。
【0004】図14は、上記公報記載の従来の障害発生
通知抑止装置の構成を示す図である。図14において、
101は複数の障害処理部であり、102はメッセージ
受付部であり、103はメッセージバッファ管理部であ
り、104はシステムパラメータ管理部であり、105
は障害メッセージ出力制御部である。上記障害発生通知
抑止装置では、障害の発生を検出した障害処理部101
が、監視対象装置の各部分の障害メッセージをメッセー
ジ受付部102に対して通知する。メッセージ受付部1
02では、受け取ったすべての障害メッセージを一旦メ
ッセージバッファ管理部103に書き込む。そして、障
害メッセージ出力制御部105では、システムパラメー
タ管理部104が管理する障害メッセージの出力を抑止
するためのパラメータに基づいて抽出された障害メッセ
ージについて出力を抑止する。たとえば、故障部分に応
じて優先レベルを設け、レベルの低い障害メッセージを
抽出する。
【0005】このように、従来の障害発生通知抑止装置
では、優先レベルの低い障害メッセージを抽出すること
により、「二次的な障害を通知する障害メッセージの抑
止」、という目的を実現している。
【0006】
【発明が解決しようとする課題】しかしながら、上記、
従来の障害発生通知抑止装置においては、優先レベルに
より抑止すべき障害メッセージを抽出しているため、障
害発生時に多く見られる「短期間に発生する同一障害メ
ッセージ」によって、すなわち、同一の優先レベルの障
害メッセージが繰り返し発生する場合に、トラフィック
量が増大する、という問題があった。
【0007】また、上記のように、繰り返し発生する障
害メッセージの出力を抑止できないため、障害メッセー
ジを受信する監視制御装置が過負荷となり、結局、監視
対象装置の制御が不能になる、という問題があった。
【0008】本発明は、上記に鑑みてなされたものであ
って、たとえば、複数の同一障害メッセージが短時間に
発生した場合であっても、監視対象装置および監視制御
装置間におけるネットワークのトラヒック量を軽減し、
さらに、監視制御装置の負荷を大幅に軽減することが可
能な障害発生通知抑止装置および障害発生通知抑止方法
を得ることを目的とする。
【0009】
【課題を解決するための手段】上述した課題を解決し、
目的を達成するために、本発明にかかる障害発生通知抑
止装置にあっては、監視対象装置の障害により監視制御
装置に対して障害メッセージを通知する場合に、ネット
ワークで頻発する障害メッセージの出力を抑止する構成
を備え、たとえば、内蔵された監視対象装置の各部分の
障害を検出して生成した障害メッセージ出力要求と、外
部の監視対象装置から受け取った障害メッセージ出力要
求と、の少なくともいずれか一方の障害メッセージ出力
要求を一括して受信するメッセージ受付手段(後述する
実施の形態の障害処理部1およびメッセージ受付部2に
相当)と、同一障害メッセージ出力要求の発生回数が特
定時間内において所定回数に達したかどうかをカウント
するメッセージカウント手段(メッセージカウント部3
に相当)と、受け取ったすべての障害メッセージ出力要
求を格納するメッセージ格納手段(メッセージ格納部4
に相当)と、同一障害メッセージのマージに必要なパラ
メータを一括して管理するシステムパラメータ管理手段
(システムパラメータ管理部6に相当)と、前記カウン
ト結果および前記パラメータに基づいて所定数の同一障
害メッセージ同士をマージし、監視制御装置に対してマ
ージ後のメッセージを出力する障害メッセージ出力制御
手段(障害メッセージ出力制御部5に相当)と、を備え
ることを特徴とする。
【0010】つぎの発明にかかる障害発生通知抑止方法
にあっては、マージ開始時刻から予め規定しておいた最
大カウント時間までの間、同一の識別番号をもつ障害メ
ッセージ出力要求の発生回数をカウントする発生回数カ
ウントステップと、前記マージ開始時刻から最大カウン
ト時間までの間に、同一障害メッセージ出力要求の発生
回数が予め規定しておいた設定最大発生数に達した場合
に、所定数の同一障害メッセージ同士をマージし、マー
ジ後のメッセージを監視制御装置に対して出力するマー
ジメッセージ出力ステップと、を含むことを特徴とす
る。
【0011】つぎの発明にかかる障害発生通知抑止方法
において、前記マージメッセージ出力ステップにあって
は、同一障害メッセージ出力要求の発生回数が設定最大
発生数に達しない状態で、最大カウント時間を経過した
場合、現在の状態におけるマージ後のメッセージを監視
制御装置に対して出力することを特徴とする。
【0012】つぎの発明にかかる障害発生通知抑止方法
において、前記マージメッセージ出力ステップにあって
は、同一障害メッセージ出力要求の発生回数が予め規定
しておいた設定最大発生数に達するまで、通常の障害メ
ッセージを出力する通常モードで動作し、設定最大発生
数に達した時点から、マージ後のメッセージを出力する
抑止モードに移行することを特徴とする。
【0013】つぎの発明にかかる障害発生通知抑止方法
において、前記マージメッセージ出力ステップにあって
は、抑止モードで動作中に、同一障害メッセージ出力要
求の発生回数が予め規定しておいた設定最大発生数を超
えない状態で、最大カウント時間を超えた場合、通常モ
ードに移行することを特徴とする。
【0014】つぎの発明にかかる障害発生通知抑止方法
において、前記発生回数カウントステップにあっては、
同一の識別番号および同一の詳細付加情報をもつ障害メ
ッセージ出力要求の発生回数をカウントすることを特徴
とする。
【0015】つぎの発明にかかる障害発生通知抑止方法
において、前記マージメッセージ出力ステップにあって
は、所定の基準で障害メッセージ出力要求を関連付けて
分類し、特定の障害メッセージの出力が抑止された場
合、それに関連付けられた障害メッセージの出力をも抑
止することを特徴とする。
【0016】
【発明の実施の形態】以下に、本発明にかかる障害発生
通知抑止装置および障害発生通知抑止方法の実施の形態
を図面に基づいて詳細に説明する。なお、この実施の形
態によりこの発明が限定されるものではない。
【0017】実施の形態1.図1は、本発明にかかる障
害発生通知抑止装置の構成を示す図である。図1におい
て、1は監視対象装置の各部分の障害を検出して障害処
理を行う複数の障害処理部であり、2は障害処理部1か
ら出力される障害メッセージ出力要求を一括して受信す
るメッセージ受付部であり、3は一定時間内の障害メッ
セージ出力要求の発生数をメッセージ毎にカウントする
メッセージカウント部であり、4はすべての障害メッセ
ージ出力要求を格納するメッセージ格納部であり、5は
メッセージカウント部3による計測結果に基づいてメッ
セージ格納部4内の同一識別番号を有する障害メッセー
ジ同士をマージして監視制御装置に対してマージメッセ
ージを出力する障害メッセージ出力制御部であり、6は
障害メッセージのマージに必要な複数のパラメータを一
括して管理するシステムパラメータ管理部である。
【0018】なお、本実施の形態においては、説明の便
宜上、複数の障害処理部1が障害発生通知抑止装置に内
蔵されている場合について説明するが、これに限らず、
たとえば、障害発生通知抑止装置外部の障害処理部から
障害メッセージ出力要求を受け取る構成としてもよい。
【0019】また、図2は、メッセージカウント部3内
のメッセージカウントテーブルを示す図である。このメ
ッセージカウントテーブルには、予め静的な情報とし
て、1メッセージにつき1行分ずつ、メッセージ識別番
号15と緊急種別(Major/Minor)16が割り付けられ
ている。なお、17は発生カウント数を示し、18はマ
ージビットを示し、19はマージ開始時刻を示す。運用
時、このメッセージカウントテーブルは、システムパラ
メータ管理部6にて管理され、予め設定された最大カウ
ント時間,設定最大発生数などのパラメータにしたがっ
て書き込みが行われる。
【0020】また、図3は、障害メッセージ出力制御部
5が出力するマージメッセージの構成を示す図である。
このマージメッセージは、マージメッセージのために割
り当てられるメッセージ識別番号21と、被マージメッ
セージ識別番号22と、マージされたメッセージ個数
(=発生カウント数23)と、マージ開始時刻24と、
マージ終了時刻25で構成される。
【0021】ここで、上記のように構成された障害発生
通知抑止装置の動作(実施の形態1の障害発生通知抑止
方法)について説明する。図4および図5は、障害発生
通知抑止装置の動作を示すフローチャートである。な
お、図示はしていないが、マージビット18がOFFの
場合、障害メッセ−ジ出力制御部5では、通常モードと
して、障害メッセージ出力要求が届くたびに通常の障害
メッセージを送出する。
【0022】メッセージカウント部3では、メッセージ
カウントテーブル内のマージ開始時刻19から最大カウ
ント時間までの間(図4、ステップS1,No)、メッ
セージ受付部2に障害メッセージ出力要求が届くたびに
(ステップS5,Yes)、テーブル内の該当するメッ
セージ識別番号15に対応する発生カウント数17をイ
ンクリメントする(ステップS7)。このとき、メッセ
ージ受付部2では、受け取った障害メッセージ出力要求
を、メッセージ格納部4に対して、障害メッセージ履歴
として格納する(ステップS6)。図6は、障害メッセ
ージ履歴の構成を示す図である。図6において、31は
メッセージ識別番号であり、32は発生時刻であり、3
3は詳細付加情報である。
【0023】その後、メッセージカウント部3では、障
害メッセージ出力要求の発生カウント数17が設定最大
発生数を超え(ステップS8,Yes)、かつテーブル
内のマージビット18がOFFの場合(ステップS9,
No)、すなわち、通常モードで動作している場合、当
該障害メッセージ出力要求に該当するマージビット18
をONに設定し(ステップS11)、マージメッセージ
を出力する抑止モードに移行する。
【0024】マージビット18がONになると、メッセ
ージカウント部3では、上記障害メッセージ出力要求に
対応する、発生カウント数17およびマージ開始時刻1
9をリセットし、カウントを再開する(ステップS1
2)。
【0025】その後、最大カウント時間までの間、マー
ジビット18はONの状態(抑止モード)が保持され、
障害メッセージ出力制御部5では、発生カウント数17
が設定最大発生数を超える度に(ステップS8,Ye
s)、障害メッセージとしてマージメッセージを監視制
御装置に対して出力する(ステップS10)。そして、
メッセージカウント部3では、マージメッセージが出力
される度に、発生カウント数17およびマージ開始時刻
19をリセットする(ステップS12)。
【0026】一方、発生カウント数17が設定最大発生
数を超えない状態で(ステップS8,No)、または、
障害メッセージ出力要求が発生していない状態で(ステ
ップS5,No)、最大カウント時間を超え(ステップ
S1,Yes)、かつマージビット18がON(抑止モ
ード)の場合(ステップS2,Yes)、障害メッセー
ジ出力制御部5では、現在の状態におけるマージメッセ
ージを監視制御装置に対して出力する(ステップS
3)。そして、メッセージカウント部3では、マージビ
ット18をOFFに設定し(ステップS4)、通常モー
ドに移行後、発生カウント数17およびマージ開始時刻
19をリセットする(ステップS12)。
【0027】また、発生カウント数17が設定最大発生
数を超えない状態で(ステップS8,No)、または、
障害メッセージ出力要求が発生していない状態で(ステ
ップS5,No)、最大カウント時間を超え(ステップ
S1,Yes)、かつマージビット18がOFF(通常
モード)の場合(ステップS2,No)、メッセージカ
ウント部3では、その都度、発生カウント数17および
マージ開始時刻19をリセットする(ステップS1
2)。
【0028】上記処理において、障害メッセージ出力制
御部5では、メッセージカウントテーブル内のマージビ
ット18がONとなった時点で、すなわち、通常モード
から抑止モードに移行した段階で、障害メッセージの出
力を抑止する。
【0029】また、障害メッセージ出力制御部5では、
マージメッセージ識別番号(メッセージ識別番号2
1),被マージメッセージ識別番号(被マージメッセー
ジ識別番号22),発生カウント数(発生カウント数2
3),マージ開始時刻(マージ開始時刻24),マージ
終了時刻(マージ終了時刻25)、を所定の領域に書き
込んだマージメッセージを、監視制御装置に対して出力
する(ステップS13〜S17)。
【0030】上記障害発生通知抑止方法を実行すること
により、マージメッセージを受け取った監視制御装置
(図示せず)側では、オペレータが、当該マージメッセ
ージ中のマージ開始時刻24とマージ終了時刻25まで
の間に、被マージメッセージ識別番号22に相当する障
害メッセージ出力要求が発生カウント数23分だけ発生
したことを知る。また、マージされた障害メッセージに
ついてさらに詳細な情報を得たい場合には、オペレータ
が、当該マージメッセージの輻輳が去ってから改めて、
マージ開始時刻24とマージ終了時刻25との間におけ
る障害メッセージ履歴(図6参照)を検索する。
【0031】以上、本実施の形態においては、たとえ
ば、複数の同一障害メッセージが短時間に発生した場合
であっても、メッセージカウントテーブル内の情報に基
づいて、すなわち、同一障害メッセージの発生回数が特
定時間内において所定回数に達した段階で、複数の同一
障害メッセージをマージしたマージメッセージを出力す
ることとした。これにより、監視対象装置および監視制
御装置間におけるネットワークのトラヒック量を大幅に
軽減することができる。また、トラヒック量の軽減によ
り、監視制御装置の負荷を大幅に軽減することもでき
る。
【0032】また、本実施の形態においては、同一障害
メッセージの発生回数が特定時間内において所定回数に
達していない場合であっても、特定時間が経過した段階
で、現時点における全同一障害メッセージをマージした
マージメッセージを自律的に出力することとした。これ
により、同一障害メッセージの発生回数が所定回数に達
するのを待ってマージメッセージが出力されないような
事態、を避けることができる。
【0033】実施の形態2.図7は、システムパラメー
タ管理部6に設けられた詳細付加情報チェックフラグ
((a)参照)と、障害メッセージ出力要求(被マージ
メッセージ、(b)参照)と、実施の形態2のメッセー
ジカウントテーブル((c)参照)を示す図である。図
7において、41は詳細付加情報チェックフラグであ
り、42はメッセージ識別番号であり、43は発生時刻
であり、44は詳細付加情報であり、45は障害付加情
報パターンである。また、図8は、障害メッセージ出力
制御部5が出力する実施の形態2のマージメッセージの
構成を示す図であり、46は詳細付加情報である。な
お、障害発生通知抑止装置の構成については、前述の実
施の形態1と同様であるためその説明を省略する。
【0034】ここで、本実施の形態の障害発生通知抑止
装置の動作(実施の形態2の障害発生通知抑止方法)に
ついて説明する。図9および図10は、障害発生通知抑
止装置の動作を示すフローチャートである。ここでは、
前述の実施の形態1と異なる動作についてのみ説明す
る。
【0035】メッセージカウント部3では、メッセージ
カウントテーブル内のマージ開始時刻19から最大カウ
ント時間までの間(図4、ステップS1,No)、メッ
セージ受付部2に障害メッセージ出力要求が届くたびに
(ステップS5,Yes)、テーブル内の該当するメッ
セージ識別番号15に対応する発生カウント数17をイ
ンクリメントする(ステップS7)。このとき、実施の
形態2では、詳細付加情報チェックフラグ41がONの
場合、該当するメッセージカウントテーブルの行を以下
のようにして決定し、発生カウント数17を設定する。
【0036】まず、メッセージカウント部3では、障害
メッセージ出力要求のメッセージ識別番号42および詳
細付加情報44群をエンコードし(ステップS21)、
そのエンコード結果に基づいて、メッセージカウントテ
ーブルのメッセージ識別番号15および詳細付加情報パ
ターン45に一致する行を検索する(ステップS2
2)。その結果、たとえば、一致する行が存在しなけれ
ば(ステップS23,No)、メッセージ識別番号42
に対応する行を一行分追加し(ステップS25)、発生
カウント数17のカウント値を‘1’にセットする(ス
テップS26)。
【0037】一方、上記ステップ22および23におけ
る検索処理の結果、メッセージカウントテーブルのメッ
セージ識別番号15および詳細付加情報パターン45に
一致する行が存在した場合(ステップS23,Ye
s)、メッセージカウント部3では、その行の発生カウ
ント数17のカウント値をインクリメントする(ステッ
プS24)。
【0038】図7の例では、メッセージ識別番号<50
>の障害メッセージ出力要求の詳細付加情報44が3つ
あり、それぞれ値が<5>,<3>,<2>であるた
め、エンコードを実施すると<532>となる。これに
対し、メッセージカウントテーブルにおけるメッセージ
識別番号<50>の詳細付加情報パターン45は、<2
41>であり、両者は一致しない。そこで、本実施の形
態では、メッセージ識別番号<50>の行を一行分追加
し、その行の詳細付加情報パターン45に<532>を
書き込み、さらに、発生カウント数17に‘1’を書き
込む。
【0039】また、障害メッセージ出力制御部5では、
マージメッセージ識別番号(メッセージ識別番号2
1),被マージメッセージ識別番号(被マージメッセー
ジ識別番号22),障害メッセージ出力要求の詳細付加
情報44群と一致する詳細付加情報パターン(詳細付加
情報46),発生カウント数(発生カウント数23),
マージ開始時刻(マージ開始時刻24),マージ終了時
刻(マージ終了時刻25)、を所定の領域に書き込んだ
マージメッセージを、監視制御装置に対して出力する
(ステップS31〜S36)。
【0040】なお、詳細付加情報チェックフラグ41が
OFFの場合の動作については、実施の形態1と同様で
ある。
【0041】このように、本実施の形態においては、さ
らに、詳細付加情報46群を含めたマージメッセージを
監視制御装置に対して出力することとした。これによ
り、個々の同一障害メッセージ出力要求に含まれる発生
時刻43を知る必要がない限り、障害メッセージ履歴の
内容を問い合わせる必要がなくなるため、結果としてネ
ットワークの負荷をさらに軽減することができる。
【0042】実施の形態3.図11は、システムパラメ
ータ管理部6に設けられた下位メッセージ抑止フラグ
((a)参照)と、実施の形態3のメッセージカウント
テーブル((b)参照)を示す図である。図11におい
て、51は下位メッセージ抑止フラグであり、52は抑
止ビットである。また、図12は、システムパラメータ
管理部6に設けられたメッセージ階層構造テーブルを示
す図である。図12において、53は上位メッセージ識
別番号であり、54は下位メッセージ識別番号である。
なお、障害発生通知抑止装置の構成については、前述の
実施の形態1と同様であるためその説明を省略する。ま
た、本実施の形態においては、障害発生通知抑止装置の
動作を、説明の便宜上、実施の形態1の応用例として説
明するが、これに限らず、実施の形態2においても同様
に適応可能である。
【0043】本実施の形態では、上位メッセージ識別番
号53に定義された上位メッセージと、それに対応する
下位メッセージ識別番号54に定義された下位メッセー
ジと、を同一行に割り当てる。対応付けの例として、上
位メッセージには、緊急種別においてメジャーと定義さ
れたメッセージを割り当て、対応させる下位メッセージ
には、緊急種別においてマイナーと定義されたメッセー
ジで、かつ装置構成上上位メッセージと同一もしくは従
属的な部分から検出されたメッセージを割り当てる。な
お、装置構成によらず、オペレータの判断で自由に対応
付けを行うこともできる。また、下位メッセージを複数
の上位メッセージに対応付けることもできる。
【0044】ここで、本実施の形態の障害発生通知抑止
装置の動作(障害発生通知抑止方法)について説明す
る。図13は、障害発生通知抑止装置の動作(実施の形
態3の障害発生通知抑止方法)を示すフローチャートで
ある。ここでは、前述の実施の形態1と異なる動作につ
いてのみ説明する。
【0045】図4のステップS11の処理において、マ
ージビットをONに設定後(ステップS41)、システ
ムパラメータ管理部6では、メッセージ階層構造テーブ
ル内の上位メッセージ識別番号53を検索し(ステップ
S42)、障害メッセージ出力要求のメッセージ識別番
号に一致するものがあれば、対応する下位メッセージ識
別番号54を抽出する(ステップS43)。そして、メ
ッセージカウントテーブルにおいて当該メッセージ識別
番号に対応する行の抑止ビット52に‘1’(ON)を
設定する(ステップS44)。
【0046】以降、抑止ビット52に‘1’が設定され
たメッセージ識別番号をもつ障害メッセージ出力要求
が、障害処理部1からメッセージ受付部2に到着した場
合、障害メッセージ出力制御部5では、その障害メッセ
ージの出力を抑止する。
【0047】図12の例では、メッセージ階層構造テー
ブルにおいて、上位メッセージ識別番号<50>に従属
する下位メッセージ識別番号が<51>と<52>であ
る。したがって、本実施の形態では、メッセージカウン
トテーブルにおける上位メッセージ識別番号<50>の
行のマージビット18に‘1’が設定された場合、対応
する下位のメッセージ識別番号<51>と<52>の抑
止ビット60に‘1’が設定され、その障害メッセージ
の出力が抑止される。
【0048】なお、上記説明では、緊急種別に応じて、
特定の障害メッセージに関連付けられた障害メッセージ
の出力を抑止しているが、緊急度に限らず、たとえば、
障害の重大さやオペレータが規定した所定の基準に応じ
て、特定の障害メッセージに関連付けられた障害メッセ
ージの出力を抑止することとしてもよい。具体的にいう
と、プリンタを対象装置とした場合、「電源が投入され
ていない」といった重大な障害メッセージを上位メッセ
ージとし、「ランプがつかない」,「紙づまりの発生」
といった軽微な障害メッセージを下位メッセージとし、
上位メッセージの抑止に併せてこれらの下位メッセージ
を抑止する。
【0049】このように、本実施の形態においては、軽
微な障害である下位メッセージの出力を抑止することと
したため、結果として、ネットワークの負荷をさらに軽
減することができる。
【0050】
【発明の効果】以上、説明したとおり、本発明によれ
ば、同一障害メッセージ出力要求の発生回数が特定時間
内において所定回数に達したかどうかをカウントし、前
記カウント結果、および同一障害メッセージのマージに
必要なパラメータに基づいて、所定数の同一障害メッセ
ージ同士をマージし、監視制御装置に対してマージ後の
メッセージを出力する構成とした。これにより、監視対
象装置および監視制御装置間におけるネットワークのト
ラヒック量を大幅に軽減することができる、という効果
を奏する。また、トラヒック量の軽減により、監視制御
装置の負荷を大幅に軽減することもできる、という効果
を奏する。
【0051】つぎの発明によれば、複数の同一障害メッ
セージが短時間に発生した場合であっても、同一障害メ
ッセージ出力要求の発生回数が特定時間内において所定
回数に達した段階で、複数の同一障害メッセージをマー
ジしたマージメッセージを出力することとした。これに
より、監視対象装置および監視制御装置間におけるネッ
トワークのトラヒック量を大幅に軽減することができ
る、という効果を奏する。また、トラヒック量の軽減に
より、監視制御装置の負荷を大幅に軽減することもでき
る、という効果を奏する。
【0052】つぎの発明によれば、同一障害メッセージ
の発生回数が特定時間内において所定回数に達していな
い場合であっても、特定時間が経過した段階で、現時点
における全同一障害メッセージをマージしたマージメッ
セージを自律的に出力することとした。これにより、同
一障害メッセージ出力要求の発生回数が所定回数に達す
るのを待ってマージメッセージが出力されないような事
態、を避けることができる、という効果を奏する。
【0053】つぎの発明によれば、通常モードで動作中
に、同一障害メッセージ出力要求の発生回数が予め規定
しておいた設定最大発生数に達した時点で、抑止モード
に移行する。これにより、自律的に通常モードから抑止
モードへ動作モードを移行することができる。
【0054】つぎの発明によれば、抑止モードで動作中
に、同一障害メッセージ出力要求の発生回数が予め規定
しておいた設定最大発生数を超えない状態で、最大カウ
ント時間を超えた場合に、通常モードに移行する。これ
により、自律的に抑止モードから通常モードへ動作モー
ドを移行することができる。
【0055】つぎの発明によれば、さらに、詳細付加情
報を含めたマージメッセージを監視制御装置に対して出
力することとした。これにより、個々の同一障害メッセ
ージ出力要求に含まれる発生時刻を知る必要がない限
り、障害メッセージ履歴の内容を問い合わせる必要がな
くなるため、結果としてネットワークの負荷をさらに軽
減することができる、という効果を奏する。
【0056】つぎの発明によれば、特定の障害メッセー
ジに関連付けられた障害メッセージの出力を抑止するこ
ととしたため、結果として、ネットワークの負荷をさら
に軽減することができる、という効果を奏する。
【図面の簡単な説明】
【図1】 本発明にかかる障害発生通知抑止装置の構成
を示す図である。
【図2】 実施の形態1のメッセージカウントテーブル
を示す図である。
【図3】 障害メッセージ出力制御部が出力するマージ
メッセージの構成を示す図である。
【図4】 実施の形態1の障害発生通知抑止方法を示す
フローチャートである。
【図5】 実施の形態1の障害発生通知抑止方法を示す
フローチャートである。
【図6】 障害メッセージ履歴の構成を示す図である。
【図7】 詳細付加情報チェックフラグと障害メッセー
ジ出力要求と実施の形態2のメッセージカウントテーブ
ルを示す図である。
【図8】 実施の形態2のマージメッセージの構成を示
す図である。
【図9】 実施の形態2の障害発生通知抑止方法を示す
フローチャートである。
【図10】 実施の形態2の障害発生通知抑止方法を示
すフローチャートである。
【図11】 下位メッセージ抑止フラグと実施の形態3
のメッセージカウントテーブルを示す図である。
【図12】 システムパラメータ管理部に設けられたメ
ッセージ階層構造テーブルを示す図である。
【図13】 実施の形態3の障害発生通知抑止方法を示
すフローチャートである。
【図14】 従来の障害発生通知抑止装置の構成を示す
図である。
【符号の説明】
1 障害処理部、2 メッセージ受付部、3 メッセー
ジカウント部、4 メッセージ格納部、5 障害メッセ
ージ出力制御部、6 システムパラメータ管理部。

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 監視対象装置の障害により監視制御装置
    に対して障害メッセージを通知する場合に、ネットワー
    クで頻発する障害メッセージの出力を抑止する障害発生
    通知抑止装置において、 内蔵された監視対象装置の各部分の障害を検出して生成
    した障害メッセージ出力要求と、外部の監視対象装置か
    ら受け取った障害メッセージ出力要求と、の少なくとも
    いずれか一方の障害メッセージ出力要求を一括して受信
    するメッセージ受付手段と、 同一障害メッセージ出力要求の発生回数が特定時間内に
    おいて所定回数に達したかどうかをカウントするメッセ
    ージカウント手段と、 受け取ったすべての障害メッセージ出力要求を格納する
    メッセージ格納手段と、 同一障害メッセージのマージに必要なパラメータを一括
    して管理するシステムパラメータ管理手段と、 前記カウント結果および前記パラメータに基づいて所定
    数の同一障害メッセージ同士をマージし、監視制御装置
    に対してマージ後のメッセージを出力する障害メッセー
    ジ出力制御手段と、 を備えることを特徴とする障害発生通知抑止装置。
  2. 【請求項2】 監視対象装置の障害により監視制御装置
    に対して障害メッセージを通知する場合に、ネットワー
    クで頻発する障害メッセージの出力を抑止させる障害発
    生通知抑止方法において、 マージ開始時刻から予め規定しておいた最大カウント時
    間までの間、同一の識別番号をもつ障害メッセージ出力
    要求の発生回数をカウントする発生回数カウントステッ
    プと、 前記マージ開始時刻から最大カウント時間までの間に、
    同一障害メッセージ出力要求の発生回数が予め規定して
    おいた設定最大発生数に達した場合に、所定数の同一障
    害メッセージ同士をマージし、マージ後のメッセージを
    監視制御装置に対して出力するマージメッセージ出力ス
    テップと、 を含むことを特徴とする障害発生通知抑止方法。
  3. 【請求項3】 前記マージメッセージ出力ステップにあ
    っては、 同一障害メッセージ出力要求の発生回数が設定最大発生
    数に達しない状態で、最大カウント時間を経過した場
    合、現在の状態におけるマージ後のメッセージを監視制
    御装置に対して出力することを特徴とする請求項2に記
    載の障害発生通知抑止方法。
  4. 【請求項4】 前記マージメッセージ出力ステップにあ
    っては、 同一障害メッセージ出力要求の発生回数が予め規定して
    おいた設定最大発生数に達するまで、通常の障害メッセ
    ージを出力する通常モードで動作し、 設定最大発生数に達した時点から、マージ後のメッセー
    ジを出力する抑止モードに移行することを特徴とする請
    求項2または3に記載の障害発生通知抑止方法。
  5. 【請求項5】 前記マージメッセージ出力ステップにあ
    っては、 抑止モードで動作中に、同一障害メッセージ出力要求の
    発生回数が予め規定しておいた設定最大発生数を超えな
    い状態で、最大カウント時間を超えた場合、通常モード
    に移行することを特徴とする請求項4に記載の障害発生
    通知抑止方法。
  6. 【請求項6】 前記発生回数カウントステップにあって
    は、 同一の識別番号および同一の詳細付加情報をもつ障害メ
    ッセージ出力要求の発生回数をカウントすることを特徴
    とする請求項2〜5のいずれか一つに記載の障害発生通
    知抑止方法。
  7. 【請求項7】 前記マージメッセージ出力ステップにあ
    っては、 所定の基準で障害メッセージ出力要求を関連付けて分類
    し、 特定の障害メッセージの出力が抑止された場合、それに
    関連付けられた障害メッセージの出力をも抑止すること
    を特徴とする請求項2〜6のいずれか一つに記載の障害
    発生通知抑止方法。
JP2001191532A 2001-06-25 2001-06-25 障害発生通知抑止装置および障害発生通知抑止方法 Pending JP2003006004A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2001191532A JP2003006004A (ja) 2001-06-25 2001-06-25 障害発生通知抑止装置および障害発生通知抑止方法
PCT/JP2002/005894 WO2003001379A1 (fr) 2001-06-25 2002-06-13 Dispositif et procede de suppression de notification de derangement
CNA028127811A CN1524220A (zh) 2001-06-25 2002-06-13 发生故障通知抑制设备和发生故障通知抑制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001191532A JP2003006004A (ja) 2001-06-25 2001-06-25 障害発生通知抑止装置および障害発生通知抑止方法

Publications (1)

Publication Number Publication Date
JP2003006004A true JP2003006004A (ja) 2003-01-10

Family

ID=19030141

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001191532A Pending JP2003006004A (ja) 2001-06-25 2001-06-25 障害発生通知抑止装置および障害発生通知抑止方法

Country Status (3)

Country Link
JP (1) JP2003006004A (ja)
CN (1) CN1524220A (ja)
WO (1) WO2003001379A1 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100643080B1 (ko) 2005-07-22 2006-11-10 삼성전자주식회사 비정상적인 호처리 차단 방법
JP2007080035A (ja) * 2005-09-15 2007-03-29 Fujitsu Support & Service Kk 障害通報の通知方法およびシステム
JP2010282521A (ja) * 2009-06-08 2010-12-16 Hitachi Electronics Service Co Ltd 障害監視装置
JP2011159141A (ja) * 2010-02-02 2011-08-18 Ricoh Co Ltd 組み込み装置と組み込み装置の異常表示方法とプログラム
JP2013008162A (ja) * 2011-06-23 2013-01-10 Fujitsu Ltd 監視装置、監視方法、および監視プログラム
JP2014112432A (ja) * 2014-03-04 2014-06-19 Gree Inc メッセージ処理システム
JP2015125496A (ja) * 2013-12-25 2015-07-06 株式会社東芝 監視制御装置、及び監視制御システム
CN105553735A (zh) * 2015-12-24 2016-05-04 迈普通信技术股份有限公司 一种堆叠系统故障处理方法、设备及堆叠系统
JP2016139308A (ja) * 2015-01-28 2016-08-04 株式会社日立ソリューションズ 監視サーバ、事象監視システム及び事象監視方法
WO2020050206A1 (ja) * 2018-09-03 2020-03-12 パナソニック株式会社 ログ出力装置、ログ出力方法およびログ出力システム

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4555713B2 (ja) * 2005-03-17 2010-10-06 富士通株式会社 エラー通知方法及び情報処理装置
CN100421384C (zh) * 2005-04-08 2008-09-24 华为技术有限公司 屏蔽处理瞬断通知事件的方法
CN105184446B (zh) * 2015-08-11 2019-04-30 国网四川省电力公司 一种电力自动化系统实时告警数据折叠展示方法
CN110878692B (zh) * 2018-09-05 2023-10-27 北京国双科技有限公司 故障报警方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2973939B2 (ja) * 1996-08-14 1999-11-08 日本電気株式会社 ネットワーク管理システム
JPH10207746A (ja) * 1997-01-17 1998-08-07 Nec Eng Ltd 障害情報収集システム
JP3523979B2 (ja) * 1997-03-21 2004-04-26 三菱電機株式会社 障害トレース方法
JPH11120036A (ja) * 1997-10-20 1999-04-30 Fujitsu Ltd 障害メッセージ出力制御システム
JPH11242619A (ja) * 1998-02-26 1999-09-07 Toshiba Corp メッセージログ機能付き計算機及び記録媒体
JP3415552B2 (ja) * 2000-03-27 2003-06-09 日本電気通信システム株式会社 障害通知方式

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100643080B1 (ko) 2005-07-22 2006-11-10 삼성전자주식회사 비정상적인 호처리 차단 방법
JP2007080035A (ja) * 2005-09-15 2007-03-29 Fujitsu Support & Service Kk 障害通報の通知方法およびシステム
JP4679314B2 (ja) * 2005-09-15 2011-04-27 株式会社富士通エフサス 障害通報の通知方法およびシステム
JP2010282521A (ja) * 2009-06-08 2010-12-16 Hitachi Electronics Service Co Ltd 障害監視装置
JP2011159141A (ja) * 2010-02-02 2011-08-18 Ricoh Co Ltd 組み込み装置と組み込み装置の異常表示方法とプログラム
JP2013008162A (ja) * 2011-06-23 2013-01-10 Fujitsu Ltd 監視装置、監視方法、および監視プログラム
JP2015125496A (ja) * 2013-12-25 2015-07-06 株式会社東芝 監視制御装置、及び監視制御システム
JP2014112432A (ja) * 2014-03-04 2014-06-19 Gree Inc メッセージ処理システム
JP2016139308A (ja) * 2015-01-28 2016-08-04 株式会社日立ソリューションズ 監視サーバ、事象監視システム及び事象監視方法
CN105553735A (zh) * 2015-12-24 2016-05-04 迈普通信技术股份有限公司 一种堆叠系统故障处理方法、设备及堆叠系统
WO2020050206A1 (ja) * 2018-09-03 2020-03-12 パナソニック株式会社 ログ出力装置、ログ出力方法およびログ出力システム
JP2020038439A (ja) * 2018-09-03 2020-03-12 パナソニック株式会社 ログ出力装置、ログ出力方法およびログ出力システム
US11394736B2 (en) 2018-09-03 2022-07-19 Panasonic Holdings Corporation Log output device, log output method and log output system
JP7156869B2 (ja) 2018-09-03 2022-10-19 パナソニックホールディングス株式会社 ログ出力装置、ログ出力方法およびログ出力システム

Also Published As

Publication number Publication date
WO2003001379A1 (fr) 2003-01-03
CN1524220A (zh) 2004-08-25

Similar Documents

Publication Publication Date Title
JP2003006004A (ja) 障害発生通知抑止装置および障害発生通知抑止方法
US6826268B2 (en) Method for overload control in a telecommunications network and apparatus therefor
US8977886B2 (en) Method and apparatus for rapid disaster recovery preparation in a cloud network
CN100448201C (zh) 网络管理器snmp陷阱抑制
US20070222576A1 (en) Method and apparatus for dynamically prioritize network faults based on real-time service degradation
JP4679314B2 (ja) 障害通報の通知方法およびシステム
US20190245735A1 (en) Server apparatus, cluster system, cluster control method and program
JP4573582B2 (ja) ネットワーク管理システム内で事象ヒステリシスを提供するシステムと方法
CN113364618A (zh) 基于惩罚系数规则的电网监控系统主从设备防误切换方法
CN110730087A (zh) 一种告警风暴的处理方法及装置
JP4864026B2 (ja) リンク帯域増設量算出方法とシステムおよびプログラム
WO2015027716A1 (en) Status management of a port of a switch in a software-defined network
WO2019187207A1 (ja) 運用管理装置、方法及び非一時的なコンピュータ可読媒体
CN115174356B (zh) 一种集群告警上报方法、装置、设备及介质
CN111200520A (zh) 网络监控方法、服务器和计算机可读存储介质
JP6474962B2 (ja) 情報処理装置、情報処理装置における障害検知方法、および情報処理装置における障害検知プログラム
EP2678977B1 (en) System and method for error reporting in a network
JPH1028151A (ja) ネットワーク負荷適応型イベント報告装置
WO2023273839A1 (zh) 应用网络对象风险的路由控制操作方法
CN115499370B (zh) 信令网链路故障处理方法、装置及计算机可读存储介质
KR100788122B1 (ko) 아이피기반 음성인식 서버의 백업 시스템 및 그 운용방법
JP5654401B2 (ja) 電話システムにおける発着信動作監視システム
KR100741219B1 (ko) 이동통신 시스템의 동일 장애 처리 방법
JP5694216B2 (ja) 監視制御システムおよび監視制御装置並びにポーリング制御方法
CN114095506A (zh) 一种呼叫中心服务器集群管理方法、服务器及系统