JPH05143377A - アラーム通知方式 - Google Patents

アラーム通知方式

Info

Publication number
JPH05143377A
JPH05143377A JP3301629A JP30162991A JPH05143377A JP H05143377 A JPH05143377 A JP H05143377A JP 3301629 A JP3301629 A JP 3301629A JP 30162991 A JP30162991 A JP 30162991A JP H05143377 A JPH05143377 A JP H05143377A
Authority
JP
Japan
Prior art keywords
counter
function
manager
agent
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3301629A
Other languages
English (en)
Inventor
Hideki Mizuguchi
英樹 水口
Kazuyuki Nishikawa
和幸 西川
Reiji Hanawa
礼司 塙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Computer Electronics Co Ltd
Hitachi Ltd
Original Assignee
Hitachi Computer Electronics Co Ltd
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Computer Electronics Co Ltd, Hitachi Ltd filed Critical Hitachi Computer Electronics Co Ltd
Priority to JP3301629A priority Critical patent/JPH05143377A/ja
Publication of JPH05143377A publication Critical patent/JPH05143377A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)
  • Retry When Errors Occur (AREA)

Abstract

(57)【要約】 【目的】ネットワークの障害管理で、マネージャ機能か
らエージェント機能へ回復可能障害に関するしきい値情
報を転送し、エージェント機能からマネージャ機能へ自
律的に、予防保守実施の判断をするためのアラーム通知
を行う。 【構成】表示/入力装置2より回復可能障害に関するし
きい値情報を入力し、MS(メモリ)16に格納する。回
復可能障害が発生するとMS(メモリ)16内のカウンタ
を更新(+1)し、しきい値と等しい場合マネージャ1に
アラーム通知を行う。システム停止/立ちあげ処理で
は、MS(メモリ)16内のしきい値情報とカウンタ情報
は、各々の記録ファイル14と15に格納・保持・読み
だしを行う。新たなしきい値情報を任意に入力し、MS
(メモリ)16内のしきい値情報と入れ替える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、マネージャ機能とエー
ジェント機能から構成されるネットワーク管理システム
で、エージェント機能がマネージャ機能に障害発生を報
告するアラーム通知方式に関する。
【0002】
【従来の技術】マネージャ機能とエージェント機能から
構成されるネットワーク管理システムにおいては、エー
ジェント側で発生した障害をマネージャ機能に報告する
手段としてアラーム通知機能とマネージャからの要求に
より障害情報を送信する機能がある。
【0003】エージェント側で発生する障害には、回線
制御機構等の障害のようにマネージャ側に報告不可能な
ものを除けば、即座に報告すべき重大なものと、回復処
理あるいは再試行等の結果障害回復するような軽度なも
の、乃至は警告的なものがある。
【0004】重大障害については、即座に報告する必要
があることから、障害情報をアラーム情報に変換して、
リアルタイムにマネージャ側に通知し、マネージャ側で
は障害監視端末等へ画面表示して障害切分けに活用して
いる。
【0005】しかし、本発明に関わる、軽度な、あるい
は警告的な障害については、最終的に重大障害になる兆
候を示していることから、エージェント側では障害種別
毎にカウンタをもうけ、当該障害発生の都度、該当する
カウンタを更新し、発生回数を管理している。そして、
任意の時点で、マネージャ機能からエージェント機能に
対して、エージェント側で管理しているカウンタ情報を
送信依頼し、マネージャ側では収集したカウンタ情報を
調査してエージェント側システムの予防保守に活用して
いる。
【0006】以上述べたように、本発明に関わる、従来
方式では、一般にシステムの保守運用で決められている
障害発生監視期間によっては、上記カウンタ値が異常な
値になっているにもかかわらず、マネージャ側で検知で
きなかったために予防保守できずに重大障害になるとい
う危険性がある。また、予防保守の規定値に達していな
いカウンタ情報も含めて、管理しているカウンタ情報を
マネージャ側に送信するために、回線利用率がオンライ
ン業務に影響を及ぼす危険性ももっている。
【0007】下記に関連特許を示す。
【0008】特開57−19853、特開62−846
36、特開63−280537
【0009】
【発明が解決しようとしている課題】上記したように従
来は、エージェント側で発生した軽度な、あるいは警告
的な障害については、マネージャ側からの情報収集処理
を通してしか障害発生の状況を認識できなかったため
に、システムの保守運用で決められている障害発生監視
期間によっては早期対策すべき障害発生内容を見逃して
しまう、という問題があった。
【0010】また、エージェント側で管理している全て
のカウンタ情報をマネージャ側に送信するために、トラ
フィック量によっては、その送信で占有する回線利用率
がシステムのオンライン業務に支障をきたす、という問
題があった。
【0011】さらに、エージェント側装置の予防保守を
行う場合の障害発生回数については、装置の導入時、安
定稼動時、耐用年数間際では、その規定値をマネージャ
側から任意に再設定できる必要がある。従来の方式では
それらができなかった、という問題があった。
【0012】
【課題を解決するための手段】この発明は、エージェン
ト側での軽度な、あるいは警告的な障害発生回数を監視
するための障害発生カウンタ更新処理部と、エージェン
ト側装置の予防保守を行う場合のしきい値となる障害発
生規定回数をマネージャ側から送信する機構と、送信さ
れたしきい値をエージェント側で保持しておくための機
構を設けておき、障害発生によるカウンタ更新の都度、
カウンタの内容としきい値を比較し、カウンタの内容が
しきい値に達したときにはエージェント機能からマネー
ジャ機能に対して、その事象発生を報告(アラーム通知)
する。
【0013】
【作用】マネージャ側からしきい値の送信がなされるま
での間は、初期値としてエージェント側で一律の規定値
を設けておけばよい。
【0014】マネージャ側からしきい値の送信がなされ
たときには、メモリ上に格納されているしきい値情報を
送信されたものと入れ替える。
【0015】システム停止の際には、メモリ上に格納さ
れているしきい値情報及びカウンタ情報を外部記憶装置
内に記録(保持)しておき、システム起動時に外部記憶装
置から読出してメモリ上に格納して、その後のカウンタ
の内容としきい値との比較処理で活用する。
【0016】
【実施例】以下本発明の実施例を図面によって詳述す
る。
【0017】図1は本発明の一実施例を模式的に示した
図であり、図2は回復・再試行処理の結果、回復成功し
た障害の発生回数を記録しておくためのカウンタ情報と
カウンタ情報に対応する予防保守を行う場合の障害発生
回数の規定値を格納するしきい値情報を示した図であ
る。
【0018】マネージャ1に接続されている表示/入力
装置2より図2に示すようなカウンタ情報に対応するし
きい値情報を人手入力する。入力されたしきい値情報
は、しきい値情報作成処理部4によりエージェント6へ
の送信データ形式に変換されて、通信制御部5を通じて
エージェント6へ転送される。エージェント6へ送信さ
れた前記送信データは通信制御部7を通じてしきい値制
御部8に渡され、前記送信データから前記しきい値情報
を取り出しMS(メモリ)16に格納される。
【0019】一方、障害が発生すると障害検知機構13
に通知され、回復・再試行処理部12で前記障害の回復
処理または再試行処理が実行される。その結果、前記障
害が回復すればカウンタ制御部11に制御を移行し、M
S(メモリ)16に格納されている図2に示す前記障害に
対応するカウンタを更新(+1)する。
【0020】そして、カウンタ値−しきい値比較処理部
10において、更新された前記カウンタの内容と前記カ
ウンタに対応するMS(メモリ)16上に格納されている
前記しきい値を比較して、前記カウンタの内容が前記し
きい値と等しいか大きい場合、アラーム通知作成処理部
9でアラーム通知情報を作成し、通信制御部7を通じて
マネージャ1に前記アラーム通知情報が転送され、アラ
ーム通知がなされる。
【0021】通信制御部7を通じて転送された前記アラ
ーム通知情報は、アラーム通知受信処理部3を通じて表
示/入力装置2に表示され、エージェント6において予
防保守すべき障害兆候が発生したことをシステム管理者
等に知らせる。
【0022】また、エージェント6のシステム停止処理
において、MS(メモリ)16上に格納されている前記し
きい値情報と前記カウンタ情報については、各々しきい
値情報記録ファイル14とカウンタ情報記録ファイル1
5に格納・保持しておくことにより、システム停止まで
に有効であったしきい値情報及びシステム停止までに発
生した前記障害の発生件数を保持しておくことができ
る。
【0023】また、エージェント6のシステム立ちあげ
処理においては、しきい値情報記録ファイル14とカウ
ンタ情報記録ファイル15に格納・保持されている前記
しきい値情報と前記カウンタ情報を読みだし、MS(メ
モリ)16上に格納しておくことにより、システム停止
後からの前記アラーム通知処理が継続して行われること
になる。
【0024】さらに、前記しきい値情報の変更が必要に
なった場合においては、マネージャ1に接続されている
表示/入力装置2より新たなしきい値情報を任意に人手
入力する。入力された新たなしきい値情報は、しきい値
情報作成処理部4によりエージェント6への送信データ
形式に変換されて、通信制御部5を通じてエージェント
6へ転送される。エージェント6へ送信された前記送信
データは通信制御部7を通じてしきい値制御部8に渡さ
れ、前記送信データから新たなしきい値情報を取り出し
MS(メモリ)16に格納されているしきい値情報と入れ
替える。
【0025】
【発明の効果】以上詳細に説明したように、本発明によ
ればエージェント側で発生する軽度な、あるいは警告的
な障害について、マネージャ側から予防保守すべき規定
障害発生回数を任意に設定し、エージェント側ではその
規定値に障害発生回数が達した場合、マネージャ側にア
ラーム通知を行うことにより、早期対策すべき障害発生
内容を見逃してしまうこともなくなり、またエージェン
ト側で管理している全てのカウンタ情報をマネージャ側
に送信するトラフィック量もシステムのオンライン業務
に支障をきたす、という問題も解決される。
【0026】さらに、エージェント側での装置の導入
時、安定稼動時、耐用年数間際において、その予防保守
すべき障害発生規定値をマネージャ側から任意に再設定
できることから、より柔軟な保守運用が行えるという効
果がある。
【図面の簡単な説明】
【図1】本発明の一実施例を模式的に示した図である。
【図2】回復・再試行処理の結果、回復成功した障害の
発生回数を記録しておくためのカウンタ情報とカウンタ
情報に対応する予防保守を行う場合の障害発生回数の規
定値を格納するしきい値情報を示した図である。
【符号の説明】
1・・・マネージャ(機能) 2・・・表示/入力装置 3・・・アラーム通知受信処理部 4・・・しきい値情報作成処理部 5・・・通信制御部 6・・・エージェント(機能) 7・・・通信制御部 8・・・しきい値制御部 9・・・アラーム通知作成処理部 10・・・カウンタ値−しきい値比較処理部 11・・・カウンタ制御部 12・・・回復・再試行処理部 13・・・障害検知機構 14・・・しきい値情報記録ファイル 15・・・カウンタ情報記録ファイル 16・・・MS(メモリ) 17・・・通信回線
───────────────────────────────────────────────────── フロントページの続き (72)発明者 西川 和幸 神奈川県秦野市堀山下1番地株式会社日立 製作所神奈川工場内 (72)発明者 塙 礼司 神奈川県秦野市堀山下1番地株式会社日立 製作所神奈川工場内

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】コンピュータ・ネットワーク・システム
    で、マネージャ機能とエージェント機能から構成される
    ネットワーク管理システムの障害管理機能において、エ
    ージェント機能が存在するネットワーク資源内に障害が
    発生した場合、当該障害の回復処理及び当該障害発生時
    に実行していた処理の再試行を実行する処理部と、回復
    及び再試行成功時に当該障害発生回数を更新・格納する
    処理部及びカウンタ部とをもうけ、前記カウンタ値があ
    る規定回数(しきい値)に達するとマネージャ機能に障害
    発生を報告するとともに前記カウンタ値を0クリアする
    ことを特徴とするアラーム通知方式。
  2. 【請求項2】請求項1において、前記各障害に関するし
    きい値をメモリ上に格納・外部記憶装置内に保持する手
    段と、前記カウンタ情報をメモリ上に格納・外部記憶装
    置内に保持する手段とをもうけ、前記カウンタ値が対応
    するしきい値に達するとマネージャ機能に障害発生を報
    告するとともに前記カウンタ値を0クリアすることを特
    徴とするアラーム通知方式。
  3. 【請求項3】請求項1において、マネージャ機能からエ
    ージェント機能に対して、前記しきい値を送信する手段
    をもうけ、前記カウンタ値が対応するしきい値に達する
    と、エージェント機能からマネージャ機能に障害発生を
    報告するとともに前記カウンタ値を0クリアすることを
    特徴とするアラーム通知方式。
JP3301629A 1991-11-18 1991-11-18 アラーム通知方式 Pending JPH05143377A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3301629A JPH05143377A (ja) 1991-11-18 1991-11-18 アラーム通知方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3301629A JPH05143377A (ja) 1991-11-18 1991-11-18 アラーム通知方式

Publications (1)

Publication Number Publication Date
JPH05143377A true JPH05143377A (ja) 1993-06-11

Family

ID=17899249

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3301629A Pending JPH05143377A (ja) 1991-11-18 1991-11-18 アラーム通知方式

Country Status (1)

Country Link
JP (1) JPH05143377A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006352831A (ja) * 2005-05-20 2006-12-28 Alaxala Networks Corp ネットワーク制御装置およびその制御方法
US7305587B2 (en) 2003-02-27 2007-12-04 Denso Corporation Electronic control unit for monitoring a microcomputer
US7444400B2 (en) 2000-09-12 2008-10-28 Canon Kabushiki Kaisha Remote site management system
JP2011035932A (ja) * 2005-05-20 2011-02-17 Alaxala Networks Corp ネットワーク制御装置およびその制御方法
EP2799992A2 (en) 2013-04-30 2014-11-05 Fujitsu Limited Storage system, control apparatus, control program, and control method
DE102016001621A1 (de) 2015-02-19 2016-08-25 Fanuc Corporation Ausfallvorhersagesystem für eine Steuerung
US10462628B2 (en) 2013-08-22 2019-10-29 Nec Corporation Network information collection and analysis of a plurality of mobile networks

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7444400B2 (en) 2000-09-12 2008-10-28 Canon Kabushiki Kaisha Remote site management system
US7305587B2 (en) 2003-02-27 2007-12-04 Denso Corporation Electronic control unit for monitoring a microcomputer
JP2006352831A (ja) * 2005-05-20 2006-12-28 Alaxala Networks Corp ネットワーク制御装置およびその制御方法
JP2011035932A (ja) * 2005-05-20 2011-02-17 Alaxala Networks Corp ネットワーク制御装置およびその制御方法
EP2799992A2 (en) 2013-04-30 2014-11-05 Fujitsu Limited Storage system, control apparatus, control program, and control method
US9483371B2 (en) 2013-04-30 2016-11-01 Fujitsu Limited Storage system, control apparatus, computer product, and control method
US10462628B2 (en) 2013-08-22 2019-10-29 Nec Corporation Network information collection and analysis of a plurality of mobile networks
US10715981B2 (en) 2013-08-22 2020-07-14 Nec Corporation Network information collection and analysis of a plurality of mobile networks
DE102016001621A1 (de) 2015-02-19 2016-08-25 Fanuc Corporation Ausfallvorhersagesystem für eine Steuerung
US9891975B2 (en) 2015-02-19 2018-02-13 Fanuc Corporation Failure prediction system of controller

Similar Documents

Publication Publication Date Title
CN107515796B (zh) 一种设备异常监控处理方法及装置
CN100370756C (zh) 系统的复位处理方法及装置
CN113434327A (zh) 一种故障处理系统、方法、设备和存储介质
US6970167B1 (en) Multi-level management system for monitoring communication apparatuses
JPH05143377A (ja) アラーム通知方式
CN109614297A (zh) 数据保护方法、装置、设备、系统及计算机可读存储介质
CN101677278A (zh) 网络信息系统可用性的监控方法及系统
CN101854263B (zh) 网络拓扑的分析处理方法、系统和管理服务器
EP0607660B1 (en) Data processing system
CN105763371B (zh) 一种告警处理方法及装置
JPH06175887A (ja) 障害監視/通知方式
JP2007013928A (ja) 遠隔障害監視装置及び遠隔障害監視方法
JP2014164628A (ja) 情報処理装置、情報処理方法および情報処理プログラム並びに統合監視サーバ及び監視システム
JP3368311B2 (ja) 設備故障通報装置
JPH06324916A (ja) 障害情報ロギング方式
CN110519558A (zh) 视频数据的处理方法及其主板管理控制器
JP2007272328A (ja) コンピュータ・システム
JP7208939B2 (ja) メッセージ監視サーバ、メッセージ監視方法及びメッセージ監視プログラム
JP2003067049A (ja) 監視装置
KR100282550B1 (ko) 교환망관리 시스템에서의 이벤트 티켓 관리 장치 및 그 방법
EP1103893A2 (de) Verfahren und Fernüberwachungssystem zur Fernüberwachung von Datenverarbeitungsanlagen
KR100206472B1 (ko) 전전자교환기에서 시스템 장애관리 및 복구방법
JPS6322499B2 (ja)
JPH0764825A (ja) オンライン障害資料自動採取システム
JP2630255B2 (ja) ネットワーク障害表示復旧方式