JP5155986B2 - 監視システム、監視方法、監視用プログラム - Google Patents

監視システム、監視方法、監視用プログラム Download PDF

Info

Publication number
JP5155986B2
JP5155986B2 JP2009251084A JP2009251084A JP5155986B2 JP 5155986 B2 JP5155986 B2 JP 5155986B2 JP 2009251084 A JP2009251084 A JP 2009251084A JP 2009251084 A JP2009251084 A JP 2009251084A JP 5155986 B2 JP5155986 B2 JP 5155986B2
Authority
JP
Japan
Prior art keywords
communication
information
status
state
communication device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009251084A
Other languages
English (en)
Other versions
JP2011097466A (ja
Inventor
裕宣 神野
靖男 武
隆明 川上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
NTT Docomo Inc
Original Assignee
Fujitsu Ltd
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd, NTT Docomo Inc filed Critical Fujitsu Ltd
Priority to JP2009251084A priority Critical patent/JP5155986B2/ja
Publication of JP2011097466A publication Critical patent/JP2011097466A/ja
Application granted granted Critical
Publication of JP5155986B2 publication Critical patent/JP5155986B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は監視システム、監視方法、監視用プログラムに関連し、特に通信ネットワークの通信装置における装置故障や通信障害などを検出する監視システム、監視方法、監視用プログラムに関する。
従来の監視システムは、図15に示すような構成で、通信装置の障害を検知する際にはTelnetやSNMP、syslogといったプロトコルを用い、監視対象となる通信機器から通知される情報および該当機器への定期的な機器状態の問い合わせを実施した結果を収集・表示し、保守要員はその情報に基づいて障害解析および障害復旧を実施していた。
図15の監視システム110は、保守ネットワーク121を介して通信装置131,132,133,134,135を含む通信ネットワーク130と接続されている。また、この通信ネットワーク130を通して、ユーザ通信装置162,262,163,164が接続されている。
通信装置131,132,133,134,135は、監視システム110の監視対象装置であり、例えば、ルータからなる。
これらの通信装置131,132,133,134,135は、状態の通知を要求する保守信号に応じて自己の状態を示す応答信号を返信する。
しかし、通信装置内におけるバグや障害検知部およびメインプロセッサ部の故障等に起因する障害(以下、サイレント障害)が発生した場合には、通信装置自身が障害を認識できず、従って、警報も発報されず監視システムでの障害検知が不可能となる。この種の障害はその発生が認識され難いため、障害復旧が遅延し、時として大規模障害として多くの通信ネットワーク利用ユーザに影響を及ぼしてしまうおそれがある。
このような問題に対処すべく、サイレント障害を事前に検知する手段として、擬似的なユーザ呼を通信ネットワークに送信し、その疎通結果から障害が発生しているかどうかを判断する疎通監視システムがある。
図16は、通信ネットワークにおける一般的な疎通監視システムを表す図である。
図16において、疎通監視システム160は、保守ネットワーク122,123を介して通信装置131,132,133,134,135を含む通信ネットワーク130と接続されている。また、この通信ネットワーク130を通して、、擬似ユーザ通信装置141,142,143,144が接続されている。
この種の疎通監視システムが開示された特許文献も既に存在している(例えば、特許文献1参照)。
またこのような疎通状況の試験に用いる疎通試験装置も既に提案されている(例えば、特許文献2参照)。
特開2002−125257号公報 特許第3297235号公報
疎通監視システムでは、通常、ユーザ呼を擬似したデータを生成する擬似ユーザ通信装置を監視対象の通信ネットワークに接続し、各擬似ユーザ通信装置間で通信を実施する。
その結果、通信が異常となった場合にはアラーム(警報)を挙げる。しかし、この疎通監視システムでは各擬似ユーザ通信装置間における通信異常は検知できるが、その異常が何に起因するものであるか判断できない。
そのため、サイレント障害だけではなく、従来の監視システムで検知可能な障害に起因する疎通異常でも警報が発生してしまい、保守要員は従来の監視システムでの警報発生状況と疎通監視システムでの警報発生状況の両者を確認し、総合判断を下す必要がある。
また、その際に疎通異常となった擬似ユーザ通信装置間での通信がどのような経路を通ったか、また、その疎通異常に関係しそうな通信装置および警報は何があるのかを保守要員が判断する必要がある。
そのため、既述の従来の監視システムによってサイレント障害を発見するには高度な技能を持った熟達した保守要員が多くの時間をかけて探索することが必要となる。
本発明は上述した従来技術の問題点を解決するためになされたものであり、その目的は、監視対象装置への定期的な装置状態問い合わせや同装置から送信される情報に基づく障害情報に加え、従来の監視システムでは明示的な障害状況として把握できなかったサイレント障害の情報を共通的に管理および操作し、保守要員のスキルに関わらず、より簡易なオペレーションで信頼性の高い障害監視を実現するシステムを提供することである。
上記課題を解決するために、ここに、以下に列記する技術を提案する。
(1)通信ネットワークを構成する監視対象通信装置のサイレント障害の発生状態を含む状態を監視する監視システムであって、
前記監視対象通信装置からその通信装置の状態を表す装置状態情報を取得する装置状態情報取得手段と、
前記監視対象通信装置に関するネットワーク構成情報および通信経路情報を含む通信状態情報を取得するネットワーク情報管理手段と、
前記通信ネットワーク内に流れるユーザデータを模した擬似ユーザデータを生成し、前記監視対象通信装置とは別の通信装置である疑似ユーザ通信装置との間で、該生成した擬似ユーザデータを送受信する擬似ユーザデータ送受信手段と、
前記擬似ユーザデータ送受信手段による擬似ユーザデータの送受信の状況に関する擬似ユーザデータ送受信状況情報を収集する擬似ユーザデータ送受信状況情報収集手段と、
前記擬似ユーザデータ送受信状況情報収集手段が収集した擬似ユーザデータ送受信状況情報に基づいて疎通状況を表す疎通状況情報を集計する疎通状況情報集計手段と、
前記疎通状況情報集計手段が集計した疎通状況情報と、前記ネットワーク情報管理手段が取得した通信状態情報とに基づいて、通信異常が発生している通信装置および障害箇所を特定した結果である疎通障害情報を保持する疎通障害判定処理手段と、
前記装置状態情報取得手段が取得した装置状態情報と、前記疎通障害判定処理手段が保持した疎通障害情報とに基づいて、前記監視対象通信装置の状態を表すための状態表示データを生成する状態表示データ生成手段と、
を具備し、
前記状態表示データ生成手段は、
少なくとも、前記監視対象通信装置が前記疎通障害情報に基づく疎通異常状態である場合には、その前記監視対象通信装置が前記装置状態情報に基づく正常状態であっても、
そのまま前記監視対象通信装置が正常状態である旨の状態表示データを生成せずに、前記監視対象通信装置が前記サイレント障害の発生状態である旨を含む状態表示データを生成することを特徴とする監視システム
上記(1)の監視システムは、通信ネットワークを構成する監視対象通信装置のサイレント障害の発生状態を含む状態を監視する。
そのネットワーク情報管理手段は、前記監視対象通信装置からその通信装置の状態を表す装置状態情報を取得する。
また、そのネットワーク情報管理手段は、前記監視対象通信装置に関するネットワーク構成情報および通信経路情報を含む通信状態情報を取得する。
更にその、擬似ユーザデータ送受信手段は、前記通信ネットワーク内に流れるユーザデータを模した擬似ユーザデータを生成し、前記監視対象通信装置とは別の通信装置である疑似ユーザ通信装置との間で、生成した擬似ユーザデータを送受信する。
更にまた、その擬似ユーザデータ送受信状況情報収集手段は、前記擬似ユーザデータ送受信手段による擬似ユーザデータの送受信の状況に関する擬似ユーザデータ送受信状況情報を収集する。
また、その疎通状況情報集計手段は、前記擬似ユーザデータ送受信状況情報収集手段が収集した擬似ユーザデータ送受信状況情報に基づいて疎通状況を表す疎通状況情報を集計する。
また、その疎通障害判定処理手段は、前記疎通状況情報集計手段が集計した疎通状況情報と、前記ネットワーク情報管理手段が取得した通信状態情報とに基づいて、通信異常が発生している通信装置および障害箇所を特定した結果である疎通障害情報を保持する。
そして、その状態表示データ生成手段は、前記装置状態情報取得手段が取得した装置状態情報前記疎通障害判定処理手段が保持した疎通障害情報とに基づいて、前記監視対象通信装置の状態を表すための状態表示データを生成する。
なお、上記の状態表示データ生成手段は、少なくとも、前記監視対象通信装置が前記疎通障害情報に基づく疎通異常状態である場合には、その前記監視対象通信装置が前記装置状態情報に基づく正常状態であっても、そのまま前記監視対象通信装置が正常状態である旨の状態表示データを生成せずに、前記監視対象通信装置が前記サイレント障害の発生状態である旨を含む状態表示データを生成する。
(2)前記通信ネットワークにおける各通信装置のネットワーク構成情報および通信経路情報の取得について、通信装置間でやり取りするデータを取得し、その内容を解析する手段を具備することを特徴とする(1)の監視システム。
上記(2)の監視システムでは、(1)の監視システムにおいて特に、前記通信ネットワークにおける各通信装置のネットワーク構成情報および通信経路情報の取得について、通信装置間でやり取りするデータを取得し、その内容を解析する。
(3)前記状態表示データ生成手段は、予め定められた前記通信ネットワークにおける各通信装置のネットワーク構成情報および通信経路情報を用いて前記状態表示データを生成するようになされていることを特徴とする(1)の監視システム。
上記(3)の監視システムでは、(1)の監視システムにおいて特に、前記状態表示データ生成手段は、予め定められた前記通信ネットワークにおける各通信装置のネットワーク構成情報および通信経路情報を用いて前記状態表示データを生成する。
(4)通信ネットワークを構成する監視対象通信装置のサイレント障害の発生状態を含む状態を監視する監視方法であって、
前記監視対象通信装置からその通信装置の状態を表す装置状態情報を取得する装置状態情報取得ステップと、
前記監視対象通信装置に関するネットワーク構成情報および通信経路情報を含む通信状態情報を取得するネットワーク情報管理ステップと、
前記通信ネットワーク内に流れるユーザデータを模した擬似ユーザデータを生成し、前記監視対象通信装置とは別の通信装置である疑似ユーザ通信装置との間で、該生成した擬似ユーザデータを送受信する擬似ユーザデータ送受信ステップと、
前記擬似ユーザデータ送受信手段による擬似ユーザデータの送受信の状況に関する擬似ユーザデータ送受信状況情報を収集する擬似ユーザデータ送受信状況情報収集ステップと、
前記擬似ユーザデータ送受信状況情報収集手段が収集した擬似ユーザデータ送受信状況情報に基づいて疎通状況を表す疎通状況情報を集計する疎通状況情報集計ステップと、
前記疎通状況情報集計手段が集計した疎通状況情報と、前記ネットワーク情報管理手段が取得した通信状態情報とに基づいて、通信異常が発生している通信装置および障害箇所を特定した結果である疎通障害情報を保持する疎通障害判定処理ステップと、
前記装置状態情報取得ステップで取得した装置状態情報と、前記疎通障害判定処理ステップで保持した疎通障害情報とに基づいて、前記監視対象通信装置の状態を表すための状態表示データを生成する状態表示データ生成ステップと、
を含み、
前記状態表示データ生成ステップでは、
少なくとも、前記監視対象通信装置が前記疎通障害情報に基づく疎通異常状態である場合には、その前記監視対象通信装置が前記装置状態情報に基づく正常状態であっても、
そのまま前記監視対象通信装置が正常状態である旨の状態表示データを生成せずに、前記監視対象通信装置が前記サイレント障害の発生状態である旨を含む状態表示データを生成することを特徴とする監視方法
(5)コンピュータに通信ネットワークを構成する監視対象通信装置のサイレント障害の発生状態を含む状態を監視する監視手順を実行させるための監視用プログラムであって、
前記監視対象通信装置からその通信装置の状態を表す装置状態情報を取得する装置状態情報取得手順と、
前記監視対象通信装置に関するネットワーク構成情報および通信経路情報を含む通信状態情報を取得するネットワーク情報管理手順と、
前記通信ネットワーク内に流れるユーザデータを模した擬似ユーザデータを生成し、前記監視対象通信装置とは別の通信装置である疑似ユーザ通信装置との間で、該生成した擬似ユーザデータを送受信する擬似ユーザデータ送受信手順と、
前記擬似ユーザデータ送受信手段による擬似ユーザデータの送受信の状況に関する擬似ユーザデータ送受信状況情報を収集する擬似ユーザデータ送受信状況情報収集手順と、
前記擬似ユーザデータ送受信状況情報収集手段が収集した擬似ユーザデータ送受信状況情報に基づいて疎通状況を表す疎通状況情報を集計する疎通状況情報集計手順と、
前記疎通状況情報集計手段が集計した疎通状況情報と、前記ネットワーク情報管理手段が取得した通信状態情報とに基づいて、通信異常が発生している通信装置および障害箇所を特定した結果である疎通障害情報を保持する疎通障害判定処理手順と、
前記装置状態情報取得手順で取得した装置状態情報と、前記疎通障害判定処理手順で保持した疎通障害情報とに基づいて、前記監視対象通信装置の状態を表すための状態表示データを生成する状態表示データ生成手順と、
の各手順をコンピュータに実行させ、
前記状態表示データ生成手順では、
少なくとも、前記監視対象通信装置が前記疎通障害情報に基づく疎通異常状態である場合には、その前記監視対象通信装置が前記装置状態情報に基づく正常状態であっても、
そのまま前記監視対象通信装置が正常状態である旨の状態表示データを生成せずに、前記監視対象通信装置が前記サイレント障害の発生状態である旨を含む状態表示データを生成することを特徴とする監視用プログラム
監視対象装置への定期的な装置状態問い合わせや同装置から送信される情報に基づく障害情報に加え、従来の監視システムでは明示的な障害状況として把握できなかったサイレント障害の情報を共通的に管理および操作できるため、保守要員のスキルに関わらず、より簡易なオペレーションで信頼性の高い障害監視を実現するシステムが構築可能となる。
本発明の実施形態による監視システムの構成例を示すブロック図である。 図1における擬似ユーザ通信装置の構成例を示すブロック図である。 図1における監視システムの構成例を示すブロック図である。 図3における装置状態データ管理部の構成例を示すブロック図である。 図3におけるネットワークデータ管理部の構成例を示すブロック図である。 図3における擬似ユーザ通信データ管理部の構成例を示すブロック図である。 図6における疎通確認結果データ生成管理部の構成例を示すブロック図である。 図3における警報データ管理部の構成例を示すブロック図である。 図2中の擬似ユーザ通信装置における、定期的な擬似ユーザ通信処理の内容を示すシーケンス図である。 図4中の装置状態データ管理部における、定期的な装置状態取得処理の内容を示すシーケンス図である。 図6中の擬似ユーザ通信データ管理部における、定期的な疎通障害箇所データ生成処理の内容を示すシーケンス図である。 図8中の警報管理部における、監視対象装置への定期的な装置状態問い合わせや同装置から送信される情報に基づく障害情報と、サイレント障害情報とを加味した警報表示処理の内容を示すシーケンス図である。 図12中の警報データ生成ロジックを示すフローチャート図である。 図12中の警報データ生成における警報決定表である。 通信ネットワークにおける一般的な監視システムを示した図である。 通信ネットワークにおける一般的な疎通監視システムを示した図である。
以下、本発明の実施の形態を、図面を参照して説明する。なお、以下の説明において参照する各図では、他の図と同等部分は同一符号によって示されている。
本実施の形態は、本発明に係る通信システム、監視システム、並びに通信方法、監視方法を大規模ネットワークにおける通信装置の故障やトラフィック量の増減を監視する場合について適応したものである。
まず、本実施の形態に係るネットワークシステムの構成を説明する。
(ネットワークシステムの構成例)
図1は、ネットワークシステムの構成を示すブロック図である。
監視システム110は、図1に示すように、保守ネットワーク121(122,123)を介して通信装置131,132,133,134,135を含む通信ネットワーク130と接続されている。また、この通信ネットワーク130を通して、擬似ユーザ通信装置141,142,143,144が通信可能に接続されている。
通信装置131,132,133,134,135は、監視システム110の監視対象装置であり、例えば、ルータからなる。
これらの通信装置131,132,133,134,135は、状態の通知を要求する保守信号に応じて自己の状態を示す応答信号を返信する。
この応答信号には、自己の状態として、例えば、正常状態、故障状態およびトラフィック量が含まれる。
(擬似ユーザ通信装置の構成例)
次に、擬似ユーザ通信装置141の構成を説明する。
図2は、擬似ユーザ通信装置141の構成を示す機能ブロック図である。図2および既述の図1を対照して容易に理解されるとおり、擬似ユーザ通信装置141は監視システム110および通信装置131と図示のように接続されている。
擬似ユーザ通信装置141は、図2に示すように、通信処理を実施する擬似ユーザ通信処理部141−1と、擬似ユーザ通信装置間での通信の成否や通信に要した時間などの通信結果情報を生成し、管理する擬似ユーザ通信装置データ管理部141−2とを有して構成されている。
擬似ユーザ通信処理部141−1はユーザ呼を擬似したデータを、予め決められた対向する擬似ユーザ通信装置(142,143,144)に対し定期的に送信し、且つ、対向する擬似ユーザ通信装置(142,143,144)からのデータを受信する。
擬似ユーザ通信装置データ管理部141−2は、擬似ユーザ通信処理部141−1が受信したデータに基づいて、擬似ユーザ通信装置間での通信の成否や通信における遅延、データ転送ロス、ゆらぎなどの通信結果情報を生成する。
そして、該生成した通信結果情報を各擬似ユーザ通信装置間毎に各受信時間単位でのデータとして監視システム110に送信する。
以上に説明した擬似ユーザ通信装置141の構成は、図1における各擬似ユーザ通信装置142,143,144について同様である。
(監視システムの構成例)
次に、監視システム110の構成を説明する。
図3は、監視システム110の構成を示す機能ブロック図である。図3および既述の図1を対照して容易に理解されるとおり、監視システム110は通信装置131(132,133,134,135)および擬似ユーザ通信装置141(142,143,144)と図示のように接続されている。
監視システム110は、図3に示すように、通信装置131(132,133,134,135)の状態に関するデータ(装置状態情報)を収集する装置状態データ管理部111と、擬似ユーザ通信装置141(142,143,144)の保持するデータを収集する擬似ユーザ通信データ管理部112と、通信装置間の接続情報を保持するネットワークデータ管理部113を有する。そして、さらに、装置状態データ管理部111および擬似ユーザ通信データ管理部112のデータに基づいて通信装置131(132,133,134,135)の状態を管理者に通知する警報データ管理部114を有している。
以上に説明した監視システム110(その警報データ管理部114)には、監視端末115が接続されている。
図4は、図3における装置状態データ管理部111の構成を示す機能ブロック図である。図4および既述の図3を対照して容易に理解されるとおり、装置状態データ管理部111は通信装置131(132,133,134,135)および警報データ管理部114と図示のように接続されている。
装置状態データ管理部111は、図4に示すように、通信装置131から装置状態を収集する装置状態取得通信処理部111−1と、この装置状態取得通信処理部111−1が収集したデータをまとめ、各通信装置毎に各時間単位での装置状態データを生成する装置状態データ生成管理部111−2とを有して構成されている。
(ネットワークデータ管理部の構成例)
図5は、図3におけるネットワークデータ管理部113の構成を示す機能ブロック図である。図5および既述の図3を対照して容易に理解されるとおり、ネットワークデータ管理部113は通信装置131(132,133,134,135)および擬似ユーザ通信データ管理部112と図示のように接続されている。。
ネットワークデータ管理部113は、図5に示すように、通信装置131からネットワークに関する情報を取得するネットワークデータ取得通信処理部113−1と、このネットワークデータ取得通信処理部113−1が取得したデータに基づいて当該ネットワークの状態を表すネットワークデータを生成してこのネットワークデータを擬似ユーザ通信データ管理部112に供給する装置状態データ生成管理部113−2とを有して構成されている。
(擬似ユーザ通信データ管理部の構成例)
図6は、図3における擬似ユーザ通信データ管理部112の構成を示す機能ブロック図である。図6および既述の図3を対照して容易に理解されるとおり、擬似ユーザ通信データ管理部112は擬似ユーザ通信装置141(142,143,144)、ネットワークデータ管理部113、および、警報データ管理部114と図示のように接続されている。
擬似ユーザ通信データ管理部112は、図6に示すように、擬似ユーザ通信装置141(142,143,144)から擬似ユーザ通信の通信結果情報を収集する擬似ユーザ通信装置データ取得通信処理部112−1を有する。更にまた、この擬似ユーザ通信装置データ取得通信処理部112−1で収集した通信結果情報とネットワークデータ管理部113の保持する通信装置間の接続情報に基づいて、通信異常が発生している通信装置や障害箇所を特定し、その特定した結果を保持する疎通確認結果データ生成管理部112−2とを有している。
(疎通確認結果データ生成管理部の構成例)
図7は図6の擬似ユーザ通信データ管理部112内の疎通確認結果データ生成管理部112−2の構成を示す機能ブロック図である。図7および既述の図6を対照して容易に理解されるとおり、疎通確認結果データ生成管理部112−2は擬似ユーザ通信装置データ取得通信処理部112−1、ネットワークデータ管理部113、および、警報データ管理部114と図示のように接続されている。
疎通確認結果データ生成管理部112−2は、図7に示すように、擬似ユーザ通信装置データ取得通信処理部112−1で収集した通信結果情報を収集、加工する疎通データ集計処理部112−21を有する。更にまた、この疎通データ集計処理部112−21で加工したデータとネットワークデータ管理部113の保持する通信装置間の接続情報に基づいて、通信異常が発生している通信装置や障害箇所を特定し、その特定した結果を保持する疎通障害判定処理部112−22とを有して構成されている。
上述のように、本発明の実施の形態では、監視対象ネットワークにおける各通信装置のネットワーク構成情報および通信経路情報の取得について、通信装置間でやり取りするデータを取得し、その内容を解析する手段を具備している。このような構成によれば、監視対象ネットワークにおける各通信装置のネットワーク構成情報および通信経路情報の取得による通信装置への負荷を軽減でき、また、通信装置での問い合わせ処理ではネットワーク構成情報および通信経路情報が取得できない場合でも情報取得が可能となる。
(警報データ管理部の構成例)
次に、警報データ管理部114の構成を説明する。
図8は、警報データ管理部114の構成を示す機能ブロック図である。図8および既述の図3を対照して容易に理解されるとおり、警報データ管理部114は装置状態データ管理部111および擬似ユーザ通信データ管理部112ならびに監視端末115と図示のように接続されている。
警報データ管理部114は、図9に示すように、装置状態データ管理部111からの全監視対象装置の装置状態データと、擬似ユーザ通信データ管理部112からの擬似ユーザ通信装置間の通信結果に基づく障害発生装置データおよび障害発生箇所データとから、真に発生している障害発生装置および障害発生箇所を特定し、その結果に基づく警報は生成する警報データ加工部114−1を有する。更にまた、警報データ加工部114−1で生成された警報データを監視端末115に表示するための監視端末表示データを生成する表示データ管理部114−2とを有して構成されている。
なお、上述のような監視システム110、および、擬似ユーザ通信装置141(142,143,144)は、CPU(Central Processing Unit)、記憶装置、通信インタフェースなどを含む周知のサーバ装置などを用いて実現すればよい。その場合、それぞれを構成する各部の機能は、CPUがソフトウェアやファームウェアを実行することによって実現される。また、監視システム110は、機能部単位に異なるハードウェアに実装される構成を採ってもよいし、或いは、同一ハードウェア上に実装される構成を採ってもよい。
(動作例)
次に、本実施の形態の動作を説明する。
(擬似ユーザ通信処理)
図9は、擬似ユーザ通信装置141による、擬似ユーザ通信装置間での擬似ユーザ通信処理の内容を示すシーケンス図である。
図9において、擬似ユーザ通信装置141(図1、図2)の擬似ユーザ通信処理部141−1は、擬似ユーザ通信処理の登録時に予め設定された周期(例えば、1分)に基づき、擬似ユーザデータを、通信装置131を含む通信ネットワークを経由して対向する擬似ユーザ通信装置に送信する(ステップS901)。
このステップS901では、例えば、RTP(Real-Time Transport Protocol)パケットが通信装置131に送信される。
次いで、擬似ユーザ通信装置141(その擬似ユーザ通信処理部141−1)は、対向する擬似ユーザ通信装置(142,143,144)からの擬似ユーザデータを、通信装置131を含む通信ネットワークを経由して受信する(ステップS902)。
擬似ユーザ通信処理部141−1は受信したすべての対向擬似ユーザ通信装置からの通信結果データを、擬似ユーザ通信装置データ管理部141−2に送信する(ステップS903)。
擬似ユーザ通信装置データ管理部141−2は、送信された通信結果データを集計し、対向擬似ユーザ通信装置間での疎通確認結果データを生成する(ステップS904)。
その後、擬似ユーザ通信装置データ管理部は生成した集計データを監視システム110に各時間単位でのデータ(例えば、1分単位でのデータ)として送信する(ステップS905)。
次に、装置状態データ管理部111(図3、図4)における装置状態データ取得処理の内容を示すシーケンスを図10に示す。
(装置状態データ取得処理)
図10において、装置状態取得通信処理部111−1は、装置状態データ取得処理の登録時に予め設定された周期(例えば、5分)に基づき、監視対象である通信装置131に装置状態取得要求を送信する(ステップS1001)。
このステップS1001では、例えば、SNMP(Simple Network Management Protocol)によるGETが、通信装置131へ定期的に送信される。
状態取得要求を受信した通信装置131は状態取得応答(即ち、RESPONSE)として、装置状態を、装置状態取得通信処理部111−1に送信する(ステップS1002)。
また、通信装置131の障害発生時に通信装置131が自発的に、障害情報および装置状態を、装置状態取得通信処理部111−1へ送信する場合もある(ステップS1003)。
このステップS1003では、例えば、SNMP-TRAP(状況通知用のレポート。ここでは障害情報通知)が装置状態取得通信処理部111−1へ送信される。
装置状態取得通信処理部111−1は、ステップS1003で受信した装置状態データおよび障害データを、装置状態データ生成管理部111−2に送信する(ステップS1004)。
装置状態データ生成管理部111−2は、ステップS1004で送信された装置状態データおよび障害データを集計し、各通信装置単位での発生障害データを生成する(ステップS1005)。
その後、装置状態データ生成管理部111−2は生成した装置状態データを警報データ管理部114(その装置状態データベース114a)に送信する(ステップS1006)。
(疎通異常特定処理)
次に、擬似ユーザ通信装置データ管理部112(図6)における疎通異常特定処理の内容を示すシーケンスを図11に示す。
図11において、擬似ユーザ通信装置データ取得通信処理部112−1は、すべての擬似ユーザ通信装置141,142,143,144より、各擬似ユーザ通信装置が生成した擬似ユーザ通信装置間通信データを受信(図11では「集計データ送信」と表記)する(ステップS1101)。
擬似ユーザ通信装置データ取得通信処理部112−1は、受信した擬似ユーザ通信装置間通信データを、疎通データ集計処理部112−21(図7)に送信する(ステップS1102)。
疎通データ集計処理部112−21は、ステップS1102で送信された擬似ユーザ通信装置間通信データを受けて集計し、各時間における全擬似ユーザ装置間での疎通結果データを生成する(ステップS1103)。
疎通障害判定処理部112−22(図7)は、ステップS1103で生成された疎通結果データを受信する(ステップS1103)。疎通障害判定処理部112−22はまた、ネットワークデータ管理部113(図3、図5)より取得した(ステップS1105)通信ネットワークにおける経路を表す通信経路情報もしくは各通信装置のネットワーク構成情報等の通信状態情報に基づいて、疎通障害が発生している箇所を特定し(ステップS1106)、その結果を警報データ管理部114へ送信する(ステップS1107)。
(警報データ生成処理)
次に、本発明の監視システムの要素としての状態表示データ生成手段に該当する警報データ管理部114(図3、図8)における警報データ生成処理の手順を図12のシーケンス図に示す。
図12において、警報データ加工部114−1は、擬似ユーザ通信データ管理部112から疎通障害データおよび発生箇所データを受信し(ステップS1201)、更に、装置状態データ管理部111(その装置状態データベース111a)から装置状態データを受信する(ステップS1202)。
警報データ加工部114−1では、ステップS1201およびステップS1202で受信した両者のデータを加味し、真に監視端末115へ表示すべき警報を決定し、警報データを生成する(ステップS1203)。尚、ステップS1203での警報データの生成手順については、図面を参照して後述する。
その後、警報データ加工部114−1は生成した警報データを表示データ管理部114−2に送信する(ステップS1204)。
表示データ管理部114−2は監視端末115に表示するための表示データを生成し(ステップS1205)、監視端末115へ表示データを送信する(ステップS1206)。
一方、警報データ加工部114−1は、ステップS1204に次いで、既述の所定周期に合わせたタイミングで、装置状態データ管理部111に装置状態の情報を再度要求する(ステップS1207)。
ステップS1207の要求を受信した装置状態データ管理部111は、通信装置131との間で装置情報取得処理を実行する(ステップS1208)。
装置状態データ管理部111は、ステップS1208で取得した装置情報を警報データ加工部114−1に転送する(ステップS1209)。
警報データ加工部114−1はステップS1209で受けた装置情報に基づいて、ステップS1203におけると同様に、真に監視端末115へ表示すべき警報を決定し、警報データを生成する(ステップS1210)。
その後、警報データ加工部114−1は生成した警報データを表示データ管理部114−2に送信する(ステップS1211)。
表示データ管理部114−2は監視端末115に表示するための表示データを生成し(ステップS1212)、監視端末115へ表示データを送信する(ステップS1213)。
(警報データの生成および障害情報の表示手順)
図13は、図12のシーケンス図中ステップS1203での警報データの生成、および、障害情報の表示手順を表すフローチャートである。
疎通障害箇所を検知し(ステップS1301)、該疎通障害箇所を検知した装置(例えば通信装置の何れか)および該当部位の状態を確認する(ステップS1302)。
次いで、上記の装置およびその該当部位の状態を確認した結果が「正常」か「障害発生中」かを弁別する(ステップS1303)。
ステップS1303で、「正常」と弁別したときには、疎通障害情報をサイレント障害である旨の情報として保守要員に通知し、該当する装置について、再度、状態検出処理を実行する(ステップS1304)。
次いで、ステップS1304における上記の装置およびその該当部位に関する再度の状態確認の結果が「正常」か「障害発生中」かを弁別する(ステップS1305)。
ステップS1305で「障害発生中」と弁別したときには、障害発生中の障害情報による部位と同一部位で一定時間内に発生した疎通障害情報を、同一の原因によるものであると見做して、保守要員に対する通知済みのサイレント障害情報を表示から削除する(ステップS1306)。
一方、ステップS1303で「正常」と弁別した場合には疎通障害情報を保守要員に通知しない処理を実行して(ステップS1307)、終了する。
また、ステップS1305で「正常」と弁別した場合には、そのまま処理を終了する。
上記フローチャートにおけるように、装置状態および該当部位の状態確認結果が「正常」となった場合においては、図12のステップS1207以降に示すように、通信装置131について装置状態を再取得し(ステップS1207、ステップS1208、ステップS1209)、警報データを生成する(ステップS1210)。
以上の処理を経ることによって、監視端末115において、重複なく、真に発生している警報を確認できる。
また、上記フローチャートから顧慮すれば、状態表示データ生成手段(警報データ管理部114)は、予め定められた通信ネットワークにおける各通信装置のネットワーク構成情報および通信経路情報を用いて状態表示データを生成するようになされているといえる。
図14に、図12中の警報データ生成における、取得した情報とこれに対応する警報(障害表示画面の表示)との関係を示す。
なお、本発明は、システム、方法またはコンピュータプログラムとして具体化することができる。例えば、監視システム110の各部の機能を監視用プログラムとして実現することもできる。したがって、本発明の一部またはすべては、ハードウェアまたはソフトウェア(ファームウェア、常駐ソフトウェア、マイクロコード、ステートマシン、ゲートアレイ等を含む)に組み入れることができる。さらに、本発明は、コンピュータによって使用可能な、またはコンピュータ可読の記憶媒体上のコンピュータプログラム製品の形態をとることができ、この媒体には、コンピュータによって使用可能な、またはコンピュータ可読のプログラムコードが組み入れられる。本明細書のコンテキストでは、コンピュータによって使用可能な、またはコンピュータ可読の媒体は、命令実行システム、装置若しくはデバイスによって、またはそれらとともに使用されるプログラムを、収録する、記憶する、通信する、伝搬する、または搬送することのできる、任意の媒体とすることができる。
本発明は、通信装置の監視システムとして用いることにより、通信サービスに多大な影響を及ぼすサイレント障害に対する保守要員の対応が迅速化し、高品質な通信サービスの実現が可能となる。
101………………………………監視システム
110………………………………監視システム
111………………………………装置状態データ管理部
111−1…………………………装置状態取得通信処理部
111−2…………………………装置状態データ生成管理部
112………………………………擬似ユーザ通信データ管理部
112−1…………………………擬似ユーザ通信装置データ取得通信処理部
112−2…………………………疎通確認結果データ生成管理部
112−21………………………疎通データ集計処理部
112−22………………………疎通障害判定処理部
113………………………………ネットワークデータ管理部
113−1…………………………ネットワークデータ取得通信処理部
113−2…………………………ネットワークデータ生成管理部
114………………………………警報データ管理部
114−1…………………………警報データ加工部
114−2…………………………表示データ管理部
115………………………………監視端末
130………………………………通信ネットワーク
131〜134……………………通信装置(監視対象装置)
141〜144……………………擬似ユーザ通信装置
141−1…………………………擬似ユーザ通信処理部
141−2…………………………擬似ユーザ通信装置データ管理部
151〜154……………………ユーザ通信装置
160………………………………疎通監視システム

Claims (5)

  1. 通信ネットワークを構成する監視対象通信装置のサイレント障害の発生状態を含む状態を監視する監視システムであって、
    前記監視対象通信装置からその通信装置の状態を表す装置状態情報を取得する装置状態情報取得手段と、
    前記監視対象通信装置に関するネットワーク構成情報および通信経路情報を含む通信状態情報を取得するネットワーク情報管理手段と、
    前記通信ネットワーク内に流れるユーザデータを模した擬似ユーザデータを生成し、前記監視対象通信装置とは別の通信装置である疑似ユーザ通信装置との間で、生成した擬似ユーザデータを送受信する擬似ユーザデータ送受信手段と、
    前記擬似ユーザデータ送受信手段による擬似ユーザデータの送受信の状況に関する擬似ユーザデータ送受信状況情報を収集する擬似ユーザデータ送受信状況情報収集手段と、
    前記擬似ユーザデータ送受信状況情報収集手段が収集した擬似ユーザデータ送受信状況情報に基づいて疎通状況を表す疎通状況情報を集計する疎通状況情報集計手段と、
    前記疎通状況情報集計手段が集計した疎通状況情報と、前記ネットワーク情報管理手段が取得した通信状態情報とに基づいて、通信異常が発生している通信装置および障害箇所を特定した結果である疎通障害情報を保持する疎通障害判定処理手段と、
    前記装置状態情報取得手段が取得した装置状態情報前記疎通障害判定処理手段が保持した疎通障害情報とに基づいて、前記監視対象通信装置の状態を表すための状態表示データを生成する状態表示データ生成手段と、
    を具備し、
    前記状態表示データ生成手段は、
    少なくとも、前記監視対象通信装置が前記疎通障害情報に基づく疎通異常状態である場合には、その前記監視対象通信装置が前記装置状態情報に基づく正常状態であっても、
    そのまま前記監視対象通信装置が正常状態である旨の状態表示データを生成せずに、前記監視対象通信装置が前記サイレント障害の発生状態である旨を含む状態表示データを生成することを特徴とする監視システム。
  2. 前記通信ネットワークにおける各通信装置のネットワーク構成情報および通信経路情報の取得について、通信装置間でやり取りするデータを取得し、その内容を解析する手段を具備することを特徴とする請求項1記載の監視システム。
  3. 前記状態表示データ生成手段は、予め定められた前記通信ネットワークにおける各通信装置のネットワーク構成情報および通信経路情報を用いて前記状態表示データを生成するようになされていることを特徴とする請求項1記載の監視システム。
  4. 通信ネットワークを構成する監視対象通信装置のサイレント障害の発生状態を含む状態を監視する監視方法であって、
    前記監視対象通信装置からその通信装置の状態を表す装置状態情報を取得する装置状態情報取得ステップと、
    前記監視対象通信装置に関するネットワーク構成情報および通信経路情報を含む通信状態情報を取得するネットワーク情報管理ステップと、
    前記通信ネットワーク内に流れるユーザデータを模した擬似ユーザデータを生成し、前記監視対象通信装置とは別の通信装置である疑似ユーザ通信装置との間で、生成した擬似ユーザデータを送受信する擬似ユーザデータ送受信ステップと、
    前記擬似ユーザデータ送受信手段による擬似ユーザデータの送受信の状況に関する擬似ユーザデータ送受信状況情報を収集する擬似ユーザデータ送受信状況情報収集ステップと、
    前記擬似ユーザデータ送受信状況情報収集手段が収集した擬似ユーザデータ送受信状況情報に基づいて疎通状況を表す疎通状況情報を集計する疎通状況情報集計ステップと、
    前記疎通状況情報集計手段が集計した疎通状況情報と、前記ネットワーク情報管理手段が取得した通信状態情報とに基づいて、通信異常が発生している通信装置および障害箇所を特定した結果である疎通障害情報を保持する疎通障害判定処理ステップと、
    前記装置状態情報取得ステップで取得した装置状態情報前記疎通障害判定処理ステップで保持した疎通障害情報とに基づいて、前記監視対象通信装置の状態を表すための状態表示データを生成する状態表示データ生成ステップと、
    を含み、
    前記状態表示データ生成ステップでは、
    少なくとも、前記監視対象通信装置が前記疎通障害情報に基づく疎通異常状態である場合には、その前記監視対象通信装置が前記装置状態情報に基づく正常状態であっても、
    そのまま前記監視対象通信装置が正常状態である旨の状態表示データを生成せずに、前記監視対象通信装置が前記サイレント障害の発生状態である旨を含む状態表示データを生成することを特徴とする監視方法。
  5. コンピュータに通信ネットワークを構成する監視対象通信装置のサイレント障害の発生状態を含む状態を監視する監視手順を実行させるための監視用プログラムであって、
    前記監視対象通信装置からその通信装置の状態を表す装置状態情報を取得する装置状態情報取得手順と、
    前記監視対象通信装置に関するネットワーク構成情報および通信経路情報を含む通信状態情報を取得するネットワーク情報管理手順と、
    前記通信ネットワーク内に流れるユーザデータを模した擬似ユーザデータを生成し、前記監視対象通信装置とは別の通信装置である疑似ユーザ通信装置との間で、生成した擬似ユーザデータを送受信する擬似ユーザデータ送受信手順と、
    前記擬似ユーザデータ送受信手段による擬似ユーザデータの送受信の状況に関する擬似ユーザデータ送受信状況情報を収集する擬似ユーザデータ送受信状況情報収集手順と、
    前記擬似ユーザデータ送受信状況情報収集手段が収集した擬似ユーザデータ送受信状況情報に基づいて疎通状況を表す疎通状況情報を集計する疎通状況情報集計手順と、
    前記疎通状況情報集計手段が集計した疎通状況情報と、前記ネットワーク情報管理手段が取得した通信状態情報とに基づいて、通信異常が発生している通信装置および障害箇所を特定した結果である疎通障害情報を保持する疎通障害判定処理手順と、
    前記装置状態情報取得手順で取得した装置状態情報前記疎通障害判定処理手順で保持した疎通障害情報とに基づいて、前記監視対象通信装置の状態を表すための状態表示データを生成する状態表示データ生成手順と、
    の各手順をコンピュータに実行させ
    前記状態表示データ生成手順では、
    少なくとも、前記監視対象通信装置が前記疎通障害情報に基づく疎通異常状態である場合には、その前記監視対象通信装置が前記装置状態情報に基づく正常状態であっても、
    そのまま前記監視対象通信装置が正常状態である旨の状態表示データを生成せずに、前記監視対象通信装置が前記サイレント障害の発生状態である旨を含む状態表示データを生成することを特徴とする監視用プログラム。
JP2009251084A 2009-10-30 2009-10-30 監視システム、監視方法、監視用プログラム Expired - Fee Related JP5155986B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009251084A JP5155986B2 (ja) 2009-10-30 2009-10-30 監視システム、監視方法、監視用プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009251084A JP5155986B2 (ja) 2009-10-30 2009-10-30 監視システム、監視方法、監視用プログラム

Publications (2)

Publication Number Publication Date
JP2011097466A JP2011097466A (ja) 2011-05-12
JP5155986B2 true JP5155986B2 (ja) 2013-03-06

Family

ID=44113886

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009251084A Expired - Fee Related JP5155986B2 (ja) 2009-10-30 2009-10-30 監視システム、監視方法、監視用プログラム

Country Status (1)

Country Link
JP (1) JP5155986B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5981298B2 (ja) * 2012-10-19 2016-08-31 日本電信電話株式会社 通信設備管理システム、通信設備管理方法、通信設備管理装置および通信設備管理プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10257129A (ja) * 1997-03-13 1998-09-25 Hitachi Ltd 伝送装置の試験方法
JP2002064490A (ja) * 2000-08-16 2002-02-28 Nippon Telegr & Teleph Corp <Ntt> 故障部位切り分け方法
JP4567363B2 (ja) * 2004-04-09 2010-10-20 エヌ・ティ・ティ・コミュニケーションズ株式会社 回線帯域判定システム、回線帯域判定方法及びプログラム
JP4485344B2 (ja) * 2004-12-27 2010-06-23 株式会社日立製作所 サーバ装置、障害経路診断方法、および障害経路診断プログラム
JP4519061B2 (ja) * 2005-11-18 2010-08-04 富士通株式会社 故障検出システム及びその故障検出装置及びマネージャ装置及びセンタ装置
JP2008005040A (ja) * 2006-06-20 2008-01-10 Aruze Corp 保守システム、並びに監視装置

Also Published As

Publication number Publication date
JP2011097466A (ja) 2011-05-12

Similar Documents

Publication Publication Date Title
US9893963B2 (en) Dynamic baseline determination for distributed transaction
US9965758B2 (en) Troubleshooting transactions in a network environment
JP6097889B2 (ja) 監視システム、監視装置、および検査装置
US20060026467A1 (en) Method and apparatus for automatically discovering of application errors as a predictive metric for the functional health of enterprise applications
JP2022500963A (ja) ネットワークのセキュリティモニタリング方法、ネットワークのセキュリティモニタリング装置及びシステム
US10230611B2 (en) Dynamic baseline determination for distributed business transaction
CN105045700A (zh) 一种实时监控应用系统用户体验指标的方法
CN104219091A (zh) 一种网络运行故障检测系统及其方法
JP2011210064A (ja) ログ情報収集システム、装置、方法及びプログラム
KR102148346B1 (ko) 서비스 장애 진단 장치 및 고객 단말
US9760874B2 (en) Transaction tracing in a network environment
US10049403B2 (en) Transaction identification in a network environment
CN111800354A (zh) 消息处理方法及装置、消息处理设备及存储介质
US9461879B2 (en) Apparatus and method for system error monitoring
CN105530137B (zh) 流量数据分析方法及流量数据分析系统
CN105187554A (zh) 服务器性能监控方法及系统
US20170012814A1 (en) System Resiliency Tracing
US20210266238A1 (en) Operation device and operation method
CN111082998A (zh) 一种运维监控校园汇聚层的架构系统
CN103731315A (zh) 一种服务器故障检测方法
JP5155986B2 (ja) 監視システム、監視方法、監視用プログラム
CN103297480A (zh) 一种应用服务自动检测系统和方法
CN112835780B (zh) 一种业务检测方法及装置
CN103067901B (zh) 一种计费预警方法及系统
JP2011028490A (ja) システム監視装置、システム監視方法、及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110408

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120308

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121127

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121207

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151214

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5155986

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151214

Year of fee payment: 3

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D04

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees