JP2011142390A - 監視システムおよび障害通信機器判定方法 - Google Patents

監視システムおよび障害通信機器判定方法 Download PDF

Info

Publication number
JP2011142390A
JP2011142390A JP2010000618A JP2010000618A JP2011142390A JP 2011142390 A JP2011142390 A JP 2011142390A JP 2010000618 A JP2010000618 A JP 2010000618A JP 2010000618 A JP2010000618 A JP 2010000618A JP 2011142390 A JP2011142390 A JP 2011142390A
Authority
JP
Japan
Prior art keywords
monitoring
connection
communication device
failure
faulty
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010000618A
Other languages
English (en)
Inventor
Hiroshi Hosokawa
博 細川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2010000618A priority Critical patent/JP2011142390A/ja
Publication of JP2011142390A publication Critical patent/JP2011142390A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】障害時人による障害部位の切分け時間を短縮するために、監視サーバ側で障害機器のみを障害であると表示させる方法を提供する。
【解決手段】障害検知時、Ping監視部110は障害を検知した機器名を接続構成チェック部210へ送信する。接続構成チェック部210では、どの接続で障害を検知しているか接続構成管理DB220内に保有する接続機器管理テーブル240を参照し、障害が発生している接続を抽出する。抽出した結果、障害が発生している接続がある場合、接続構成管理DB220内に保有する監視機器からの距離テーブル230を参照し、障害を検知している接続のうち、監視サーバからの距離が最小の機器を抽出する。その後、監視サーバからの距離が最小の機器を障害機器としてPing監視部110に障害部位の表示許可を出す。
【選択図】図1

Description

本発明は、監視システムおよび障害通信機器判定方法に係り、特に通信機器の障害部位切分けを迅速化する監視システムおよび障害通信機器判定方法に関する。
近年、通信機器を導入し拠点間の通信を行う個人、企業が増加し、通信機器をPing監視するシステムが実用化されている。この種の通信機器を監視するシステムは、特許文献1に記載されているように障害機器から報告する障害内容に障害ランクを設定する方法がある。
特開平7−147574号公報
従来、Ping監視する監視サーバと監視される通信機器があるシステムにおいて、監視サーバは、どの通信機器とどの通信機器が接続しているかとの情報を持っていない。このため、障害が発生すると障害通信機器の配下に接続する通信機器まで障害と判断される。この結果、障害通信機器以外の通信機器も監視サーバに障害通信機器と表示される。膨大な障害通信機器に対して、人による障害通信機器の切分け調査が必要となり、障害部位に切分けに時間を要していた。
上述した課題は、複数の通信機器をPing監視する監視サーバと、通信機器相互の接続関係を保持する接続構成管理部とからなる監視システムにおいて、監視サーバで通信機器の障害を検出したとき、接続構成管理部は、障害を検出した通信機器の組を検索し、組に含まれる第1の通信機器と監視サーバとの距離から、第1の通信機器に含まれる障害発生通信機器を特定する監視システムにより、達成できる。
本発明によれば、障害が発生している通信機器のみを障害通信機器として監視サーバ上に表示することができ、人による障害機器の切分け調査の時間を抑制できる。
監視システムと被監視対象機器の構成を説明するハードウェアブロック図である。 距離テーブルを説明する図である。 接続機器管理テーブルを説明する図である。 監視システムの処理動作を説明するフローチャートである。
以下、本発明の実施の形態について、実施例を用い図面を参照しながら詳細に説明する。なお、実質同一部位には同じ参照番号を振り、説明は繰り返さない。
最初に、図1を参照して、監視システム500と被監視対象機器300の構成を説明する。図1において、監視システム500は、監視サーバ100と接続構成管理サーバ200とから構成される。監視サーバ100は、Ping監視部110と、障害機器表示部120とから構成される。接続構成管理サーバ200は、接続構成チェック部210と、接続構成管理データベース220とから構成される。
監視サーバ100には、監視対象機器300−Aが直接接続される。監視対象機器300−Aには、監視対象機器300−Bと、監視対象機器300−Cが接続される。監視対象機器300−Bには、監視対象機器300−Dと、監視対象機器300−Eが接続される。監視対象機器300−Cには、監視対象機器300−Fと、監視対象機器300−Gと、監視対象機器300−Hが接続される。
監視サーバ100は、定期的に全ての監視対象機器300にPingを送信する。監視サーバ100は、監視対象機器からの応答を1秒ないし10秒待ち、応答がない監視対象機器300に障害があると判定する。
ここで、監視対象機器300は、ルータ、スイッチ等全てのIPアドレスを有する機器である。
なお、図1には、監視対象機器は8台しか表示されていないが、実際にはこれ以上の監視対象機器が監視サーバ100に結ばれている。その規模は、数千にもおよぶ。接続構成管理DB220は、距離テーブル230と、接続機器管理テーブル240とを保持する。また、接続構成管理サーバ200は、監視サーバ100の内部にモジュールとして設けられてもよい。
図2を参照して、距離テーブル230を説明する。図2において、距離テーブル230は、監視サーバ100からの接続距離を登録したテーブルである。距離テーブル230は、機器名231と距離232とから構成される。機器名231は、監視対象機器300−i(i=A〜M)のiである。距離232は、監視サーバ100からのホップ数である。したがって、距離232が、「1」の機器名231は、監視対象機器300−Aである。距離232が、「2」の機器名231は、監視対象機器300−B、300−Cである。距離232が、「3」の機器名231は、監視対象機器300−D〜300−Hである。
図3を参照して、接続機器管理テーブル240を説明する。接続機器管理テーブル240は、監視対象機器間の接続を登録したテーブルである。監視サーバ100で障害を検知した際、接続構成管理サーバ200は、どの接続で障害が発生したか、障害が発生した接続のある監視対象機器のうちどの監視対象機器が監視サーバ10からの接続距離が小さいかのチェックを行なう。接続機器管理テーブル240は、接続番号241と、機器名242と、機器名243とから構成されている。接続番号241は、接続のIDである。機器名242と機器名243は、接続のある監視対象機器300−i(i=A〜M)のiである。接続機器管理テーブル240には、図1の監視対象機器300間の7件の接続を記載している。
次に、図4を参照して、障害検知時の監視システム500の処理を説明する。図4において、障害検知時、Ping監視部110は、障害を検知した監視対象機器名のリストを接続構成チェック部210へ送信する(S11)。接続構成チェック部210は、どの接続で障害を検知しているか接続構成管理DB220内に保有する接続機器管理テーブル240を参照し、障害が発生している接続を抽出する(S12)。接続構成チェック部210は、接続機器管理テーブル240に障害を検知している接続番号241があるか判定する(S13)。
判定した結果、障害が発生している接続がない場合(NO)、接続構成チェック部210は、Ping監視部110に障害部位の表示依頼を発行する(S16)。Ping監視部110は、障害機器表示部120に表示依頼を発行する(S17)。障害機器表示部120は、障害を発生した監視対象機器名等を表示して(S18)、終了する。
ステップ13において、障害が発生している接続がある場合、接続構成管理DB220内に保有する監視機器からの距離テーブル230を参照し、障害を検知している監視対象機器のうち、監視サーバからの距離が最小の監視対象機器を抽出して(S14)、ステップ16に遷移する。
なお、ステップ18において、表示するのは、ステップ13でYESのとき、障害を発生した監視対象機器名である。一方、ステップ13でNOのとき、エラーメッセージである。
本実施例によれば、人による障害部位の切分け時間がかかることを防止できる。特に障害機器以外の監視対象機器が障害であると表示させることを防止することをできるので障害発生時の人による切分け時間をなくすことができる。
100…監視サーバ、110…Ping監視部、120…障害部表示部、200…接続構成管理サーバ、210…接続構成チェック部、220…接続構成管理DB、230…距離テーブル、240…接続機器管理テーブル、300…監視対象機器、500…監視システム。

Claims (3)

  1. 複数の通信機器をPing監視する監視サーバと、前記通信機器相互の接続関係を保持する接続構成管理部とからなる監視システムにおいて、
    前記監視サーバで前記通信機器の障害を検出したとき、前記接続構成管理部は、障害を検出した通信機器の組を検索し、前記組に含まれる第1の通信機器と前記監視サーバとの距離から、前記第1の通信機器に含まれる障害発生通信機器を特定する監視システム。
  2. 請求項1に記載の監視システムであって、
    前記接続構成管理部は、前記監視サーバと前記通信機器とを距離を記録する距離テーブルと、前記通信機器間の接続関係を記録する接続機器テーブルとを保持することを特徴とする監視システム。
  3. 複数の通信機器にPingを送信するステップと、
    複数の前記通信機器からの応答を待つステップと、
    応答のない通信機器の組を検索するステップと、
    検索された通信機器の組から最も距離の短い通信機器を判定するステップと、
    前記最も距離の短い通信機器を表示するステップと、からなる障害通信機器判定方法。
JP2010000618A 2010-01-05 2010-01-05 監視システムおよび障害通信機器判定方法 Pending JP2011142390A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010000618A JP2011142390A (ja) 2010-01-05 2010-01-05 監視システムおよび障害通信機器判定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010000618A JP2011142390A (ja) 2010-01-05 2010-01-05 監視システムおよび障害通信機器判定方法

Publications (1)

Publication Number Publication Date
JP2011142390A true JP2011142390A (ja) 2011-07-21

Family

ID=44457967

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010000618A Pending JP2011142390A (ja) 2010-01-05 2010-01-05 監視システムおよび障害通信機器判定方法

Country Status (1)

Country Link
JP (1) JP2011142390A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014068283A (ja) * 2012-09-27 2014-04-17 Nippon Telegr & Teleph Corp <Ntt> ネットワーク障害検出システムおよびネットワーク障害検出装置
JP2014216681A (ja) * 2013-04-22 2014-11-17 エヌ・ティ・ティ・コミュニケーションズ株式会社 ネットワークシステムおよびネットワークシステムのネットワーク機器保守方法
KR20190096203A (ko) * 2018-02-08 2019-08-19 한국도로공사 Its 현장장비의 원격제어 관리시스템

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014068283A (ja) * 2012-09-27 2014-04-17 Nippon Telegr & Teleph Corp <Ntt> ネットワーク障害検出システムおよびネットワーク障害検出装置
JP2014216681A (ja) * 2013-04-22 2014-11-17 エヌ・ティ・ティ・コミュニケーションズ株式会社 ネットワークシステムおよびネットワークシステムのネットワーク機器保守方法
KR20190096203A (ko) * 2018-02-08 2019-08-19 한국도로공사 Its 현장장비의 원격제어 관리시스템
KR102051316B1 (ko) 2018-02-08 2019-12-03 한국도로공사 Its 현장장비의 원격제어 관리시스템

Similar Documents

Publication Publication Date Title
KR20180079395A (ko) 알람 정보 처리 방법 및 장치, 시스템, 및 컴퓨터 저장 매체
JP2008217735A (ja) 障害解析システム、方法、及び、プログラム
CN108052408A (zh) 基于告警信息内容的告警工单快速提交方法及系统
US8051202B2 (en) Method and apparatus for providing alarm correlation for a gateway router
JP2011142390A (ja) 監視システムおよび障害通信機器判定方法
JP2011254320A (ja) ネットワーク障害分析処理装置
JP6438875B2 (ja) ネットワーク監視装置およびネットワーク監視方法
CN115102838B (zh) 服务器宕机风险的应急处理方法和装置、电子设备
JP6060123B2 (ja) 影響範囲特定装置、影響範囲特定方法、及びプログラム
JP6513001B2 (ja) 故障検知装置、故障検知方法、及びプログラム
JP5978965B2 (ja) ネットワーク運用支援システム及び不具合部位判定方法
CN108023783A (zh) 网络设备监控系统及方法
JP2009182934A (ja) 障害監視装置及び障害監視方法並びにそのためのプログラム
JP4437416B2 (ja) ネットワーク保守システム
JP2011170458A (ja) 監視システムおよび監視方法
JP2012129664A (ja) ネットワーク通信状態監視装置
JP5777076B1 (ja) 検査装置及びその制御プログラム
JP2005202446A (ja) 障害監視復旧支援装置
JP6443909B2 (ja) 障害検出装置、障害検出システム、障害検出方法、および、プログラム
CN112235148B (zh) Vlan配置检测方法、装置、电子设备及存储介质
JP2013156789A (ja) 障害監視方法および障害監視プログラム
JP2012118800A (ja) 運用管理障害対応システム及び運用管理障害対応方法
CN115801550A (zh) 一种web应用服务节点的隔离方法及装置
JP3941942B2 (ja) メッセージ相関システム、メッセージ相関方法
JP2016100816A (ja) 仮想ネットワーク管理装置及び方法