JP6226463B2 - ネットワーク管理システム、ネットワーク装置および制御装置 - Google Patents

ネットワーク管理システム、ネットワーク装置および制御装置 Download PDF

Info

Publication number
JP6226463B2
JP6226463B2 JP2013204772A JP2013204772A JP6226463B2 JP 6226463 B2 JP6226463 B2 JP 6226463B2 JP 2013204772 A JP2013204772 A JP 2013204772A JP 2013204772 A JP2013204772 A JP 2013204772A JP 6226463 B2 JP6226463 B2 JP 6226463B2
Authority
JP
Japan
Prior art keywords
network
failure
quality information
rule
network device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013204772A
Other languages
English (en)
Other versions
JP2015070528A (ja
Inventor
雅典 宮澤
雅典 宮澤
林 通秋
通秋 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2013204772A priority Critical patent/JP6226463B2/ja
Publication of JP2015070528A publication Critical patent/JP2015070528A/ja
Application granted granted Critical
Publication of JP6226463B2 publication Critical patent/JP6226463B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、ネットワークの障害予兆機能を分散化する技術に関する。
従来から、ネットワークの障害を予兆する技術が提案されている。図7は、従来の障害予兆監視システムの概略構成を示す図である。ネットワーク装置から、SNMP、CSV、Syslog等のデータを「データ収集部」で集約し、「データ加工部」でそれらのデータを特定のフォーマットに加工し、「履歴データベース(DB)」に格納する。「障害予兆分析部」では、データベースに格納されているデータに基づいて、各品質データの関連性をモデル化し、その変動の傾向をモニタリングすることによって、障害の予兆監視を行なっている。
また、例えば、特許文献1記載の技術では、監視対象システムの性能を表す時系列データを、一定周期で抽出して過去の時系列データとして格納する。時系列データが、設定された数値や変化のパターンを表す特徴データ等を含む選定条件に適合すると、過去のメタデータとして時系列データと関連付けて格納する。また、リアルタイムの時系列データについて選定条件に適合すると、リアルタイムのメタデータを生成する。リアルタイムのメタデータと過去のメタデータとを照合し、予め設定された一致度が得られると、メタデータに関連付けられた過去の時系列データを参照して設定された時系列データの今後の変化を検出し、出力する。この構成により、特許文献1記載の技術では、監視対象の時系列データの値が異常を表す閾値を超えることを検出することなく、障害の予兆を検出する。
特開2009−289221号公報
しかしながら、従来の技術では、監視対象となるネットワーク装置の数が多くなると、「データ収集部」や「データ加工部」の処理が過大となる問題がある。特許文献1記載の技術においても、管理対象となる数が増加すると、処理が多くなり、システムの拡張が不可欠となり、コストが増大してしまう。また、検出精度が劣化してしまう。今後、クラウドなどの仮想化を考慮した場合、障害の監視対象機器が増加する傾向にあり、既存の技術だけでは対応しきれないことが予想される。
本発明は、このような事情に鑑みてなされたものであり、各ネットワーク装置に障害予兆機能を分散化することによって、処理負荷を軽減すると共に予兆精度を高く維持することができるネットワーク管理システム、ネットワーク装置および制御装置を提供することを目的とする。
(1)上記の目的を達成するために、本発明は、以下のような手段を講じた。すなわち、本発明のネットワーク管理システムは、複数のネットワーク装置および制御装置で構成され、ネットワークの障害を予兆するネットワーク管理システムであって、前記制御装置は、前記ネットワークの構成情報に基づいて、前記ネットワーク装置毎に障害予兆ルールを作成し、前記作成したネットワーク装置毎の障害予兆ルールを前記各ネットワーク装置に通知し、前記各ネットワーク装置は、前記障害予兆ルールおよび自装置の品質情報に基づいて障害予兆分析を行ない、障害の予兆が認められた場合は、障害の予兆を通知することを特徴とする。
このように、制御装置において、ネットワークの構成情報に基づいて、ネットワーク装置毎に障害予兆ルールを作成し、作成したネットワーク装置毎の障害予兆ルールを各ネットワーク装置に通知し、各ネットワーク装置は、障害予兆ルールおよび自装置の品質情報に基づいて障害予兆分析を行ない、障害の予兆が認められた場合は、障害の予兆を通知するので、各ネットワーク装置に障害予兆機能を分散化することが可能となる。これにより、処理負荷を軽減すると共に予兆精度を高く維持することが可能となる。
(2)また、本発明のネットワーク管理システムにおいて、前記各ネットワーク装置は、自装置の品質情報を収集し、一定の周期で前記収集した品質情報の平均値を算出し、前記制御装置に送信する高速データ処理部と、前記障害予兆ルールと前記品質情報とを対比し、前記品質情報が前記障害予兆ルールから逸脱した場合は、障害の予兆を通知する障害予兆分析部と、ネットワークの構成管理データを含み、他のネットワーク装置との間で共有する構成管理データベースと、を備えることを特徴とする。
この構成により、障害予兆機能を分散化することが可能となる。
(3)また、本発明のネットワーク管理システムにおいて、前記制御装置は、前記各ネットワーク装置から送信され、一定の周期で算出された品質情報の平均値を格納するデータ蓄積部と、前記ネットワークの構成情報および前記データ蓄積部に格納されている各ネットワーク装置の品質情報に基づいて、前記ネットワーク装置毎に障害予兆ルールを作成し、前記作成したネットワーク装置毎の障害予兆ルールを前記各ネットワーク装置に通知するルール設計部と、を備えることを特徴とする。
この構成により、各ネットワーク装置に障害予兆機能を分散化することが可能となる。これにより、処理負荷を軽減すると共に予兆精度を高く維持することが可能となる。
(4)また、本発明のネットワーク装置は、複数のネットワーク装置および制御装置で構成され、ネットワークの障害を予兆するネットワーク管理システムに適用されるネットワーク装置であって、自装置の品質情報を収集し、一定の周期で前記収集した品質情報の平均値を算出し、前記制御装置に送信する高速データ処理部と、障害予兆ルールと前記品質情報とを対比し、前記品質情報が前記障害予兆ルールから逸脱した場合は、障害の予兆を通知する障害予兆分析部と、ネットワークの構成管理データを含み、他のネットワーク装置との間で共有する構成管理データベースと、を備えることを特徴とする。
この構成により、障害予兆機能を分散化することが可能となる。
(5)また、本発明の制御装置は、複数のネットワーク装置および制御装置で構成され、ネットワークの障害を予兆するネットワーク管理システムに適用される制御装置であって、前記各ネットワーク装置から送信され、一定の周期で算出された品質情報の平均値を格納するデータ蓄積部と、前記ネットワークの構成情報および前記データ蓄積部に格納されている各ネットワーク装置の品質情報に基づいて、前記ネットワーク装置毎に障害予兆ルールを作成し、前記作成したネットワーク装置毎の障害予兆ルールを前記各ネットワーク装置に通知するルール設計部と、を備えることを特徴とする。
この構成により、各ネットワーク装置に障害予兆機能を分散化することが可能となる。これにより、処理負荷を軽減すると共に予兆精度を高く維持することが可能となる。
本発明によれば、各ネットワーク装置に障害予兆機能を分散化することが可能となる。これにより、処理負荷を軽減すると共に予兆精度を高く維持することが可能となる。
本実施形態に係るネットワーク管理システムの概略構成を示すブロック図である。 本実施形態に係るネットワーク管理システムの動作を示すフローチャートである。 データ蓄積部のデータ構造を示す図である。 障害予兆情報ベクトルの例を示す図である。 自己組織化マップの概要を示す図である。 本発明の実施例を示す図である。 従来の障害予兆監視システムの概略構成を示す図である。
図1は、本実施形態に係るネットワーク管理システムの概略構成を示すブロック図である。このネットワーク管理システムは、制御装置1と、複数のネットワーク(NW)装置13a〜13cから構成されている。便宜上、図1では3つのネットワーク装置を記載してあるが、実際は、多数のネットワーク装置が想定される。
制御装置1は、各ネットワーク装置13a〜13cから、一定の周期、例えば、10分毎に、性能情報を受信する。性能情報は、例えば、CPUの稼働率、メモリの使用率、トラヒック量などが該当する。制御装置1は、受信した性能情報を、データ蓄積部3に格納する。
ルール設計部5は、データ蓄積部3に蓄積されたデータおよびネットワーク構成情報に基づいて、ネットワーク装置毎に障害予兆ルールを作成する。作成した各障害予兆ルールを、ルール送信部7を介して、各ネットワーク装置に送信する。
各ネットワーク装置13a〜13cは、同一の構成を有する。ここでは、ネットワーク装置13aについて説明する高速データ処理部17aは、自装置から取得できる品質情報を、リアルタイムに収集する。一定の周期で収集した品質情報の平均値を算出し、制御装置1のデータ蓄積部3に送信する。また、取得した品質情報を障害予兆分析部15aに送信する。
障害予兆分析部15aは、制御装置1のルール設計部5が作成した障害予兆ルールと、高速データ処理部17aから取得した品質情報とを対比する。もし、品質情報が障害予兆ルールから逸脱した場合は、管理装置20へアラートを送信する。共有データベース9は、複数のネットワーク装置13a〜13cで構成管理データ(装置構成情報、ネットワークトポロジ情報など)を共有管理する。
図2は、本実施形態に係るネットワーク管理システムの動作を示すフローチャートである。まず、各ネットワーク装置13a〜13cの高速データ処理部17a〜17cが、自装置で取得できる品質情報を収集する(ステップS1)。ここでは、例えば、自装置のCPUの稼働率、メモリの使用率、通信インタフェース毎の帯域などを収集する。次に、高速データ処理部17a〜17cは、取得したデータ毎に予め決められた時間(例えば、X分)の平均値を算出する(ステップS2)。次に、高速データ処理部17a〜17cは、算出した平均値を、制御装置1のデータ蓄積部3に定期的に送信し、データ蓄積部3は、各ネットワーク装置13a〜13cから送信された平均値を保存する(ステップS3)。データ蓄積部3では、例えば、図3に示すようなデータ構造を有する。
次に、制御装置1のルール設計部5は、データ蓄積部3に蓄積されているデータに基づいて、ネットワーク装置13a〜13毎に障害予兆ルールを作成する(ステップS4)。また、データ蓄積部3にはすべてのネットワークの値が格納されているため、共有データベース(構成管理)に格納されているネットワーク構成情報に基づいて、関連性のあるネットワーク装置のデータのみを抽出して障害予兆ルールを作成する。次に、ルール設計部5は、作成した障害予兆ルールを、ルール送信部7を介して、各ネットワーク装置13a〜13に送信する(ステップS5)。
各ネットワーク装置13a〜13は、それぞれ、制御装置1から取得した障害予兆ルールを、障害予兆分析部15a〜15cに設定する(ステップS6)。障害予兆分析部15a〜15cは、設定された障害予兆ルールを読み出し(ステップS7)、障害予兆ルールに基づいて、取得した品質情報を分析する(ステップS8)。この分析により、異常があるかどうかを判断し(ステップS9)、異常がある場合は、管理装置へ警報を送信し(ステップS10)、ステップS1に遷移する。一方、ステップS9において、異常が無い場合は、そのままステップS1へ遷移する。
次に、ルール設計部5について説明する。ルール設計部5は、ネットワーク構成情報に基づいて、関連するネットワーク装置の品質情報を、クラスタリング型推定アルゴリズム(自己組織化マップ)を用いて障害予兆ルールを作成する。自己組織化マップの入力情報は、図4に示されるように、各ネットワーク装置から入手可能な品質情報、例えば、CPU稼働率、メモリ使用率、帯域使用率、温度(気温)などである。
図5は、自己組織化マップの概要を示す図である。この自己組織化マップは、左上が異常であり、右下が正常であることを示している。また、図5には、障害予兆情報ベクトル207−1A〜Cを示している。ルール設計部5は、データ蓄積部3が持っている全ネットワークの品質情報に基づいて、障害予兆情報ベクトルを定期的(例えば、10分おき、1時間おき)にクラスタリングアルゴリズム(自己組織化マップ)に入力し、各ネットワーク装置13a〜13cの品質状態に類似する障害予兆情報ベクトルをマッピングする。これにより、ネットワーク全体のネットワーク装置の品質情報の類似度をグループ化することができる。このように、障害予兆情報ベクトルを2次元空間上にマッピングすることによって、似た特徴のデータをそれぞれ近接した場所にマッピングすることができ、また、異なる特徴のデータをそれぞれ遠隔した場所にマッピングすることができる。
ルール設計部5は、分類された各ネットワーク装置13a〜13cのマップ情報(位相マップ:Topographic Map)と、各ネットワーク装置13a〜13cが位置しているベクトル情報を各ネットワーク装置13a〜13cに送信する。
各ネットワーク装置13a〜13cの障害予兆分析部15a〜15cは、品質情報に基づいて、リアルタイムにそのベクトル位置から逸脱しないかどうかを監視する。もし、逸脱した場合は、障害の傾向があるとみなし、管理装置20へ情報を送信する。
なお、本実施形態では、判断の結果を「異常があるまたは無い」で表わしたが、本発明は、これに限定されず、複数の段階に分けて異常の存在を表わすことも可能である。
図6は、本発明の実施例を示す図である。この実施例は、予兆監視機能を装置個別に配備した分散管理アーキテクチャである。制御装置101のAPI107は、各ネットワーク装置103−1〜103−4から取得したデータに基づいて、動的に監視ルール(障害予兆ルール)を作成する。各ネットワーク装置103−1〜103−4は、制御装置101で作成されたルールに基づいて、分散化した予兆監視機能を発揮する。各ネットワーク装置103−1〜103−4は、それぞれ、共有API109、予兆監視機能111、構成管理(共有DB)113を備えており、配下のネットワーク105との間で、分散予兆監視を行なう。
以上説明したように、本実施形態によれば、各ネットワーク装置に障害予兆機能を分散化し、することが可能となる。これにより、処理負荷を軽減すると共に予兆精度を高く維持することが可能となる。
1 制御装置
3 データ蓄積部
5 ルール設計部
7 ルール送信部
9 共有データベース(構成管理)
13a〜13c ネットワーク装置
15a〜15c 障害予兆分析部
17a〜17c 高速データ処理部
20 管理装置

Claims (4)

  1. 複数のネットワーク装置および制御装置で構成され、ネットワークの障害を予兆するネットワーク管理システムであって、
    前記制御装置は、前記各ネットワーク装置から送信され、一定の周期で算出された品質情報の平均値を格納するデータ蓄積部と、前記ネットワークの構成情報および前記データ蓄積部に格納されている各ネットワーク装置の品質情報に基づいて前記各ネットワーク装置の品質情報の類似度をグループ化したクラスタリングマップを作成し、前記クラスタリングマップ上で近接した場所にマッピングされたネットワーク装置のデータのみを抽出して、前記ネットワーク装置毎に障害予兆ルールを作成し、前記作成したネットワーク装置毎の障害予兆ルールを前記各ネットワーク装置に通知するルール設計部と、を備え、
    前記各ネットワーク装置は、前記障害予兆ルールおよび自装置の品質情報に基づいて障害予兆分析を行ない、障害の予兆が認められた場合は、障害の予兆を通知することを特徴とするネットワーク管理システム。
  2. 前記各ネットワーク装置は、
    自装置の品質情報を収集し、一定の周期で前記収集した品質情報の平均値を算出し、前記制御装置に送信する高速データ処理部と、
    前記障害予兆ルールと前記品質情報とをリアルタイムに対比し、前記品質情報が前記障害予兆ルールから逸脱した場合は、障害の予兆を通知する障害予兆分析部と、
    ネットワークの構成管理データを含み、他のネットワーク装置との間で共有する構成管理データベースと、を備えることを特徴とする請求項1記載のネットワーク管理システム。
  3. 複数のネットワーク装置および制御装置で構成され、ネットワークの障害を予兆するネットワーク管理システムに適用されるネットワーク装置であって、
    自装置の品質情報を収集し、一定の周期で前記収集した品質情報の平均値を算出し、前記制御装置に送信する高速データ処理部と、
    前記制御装置によりネットワーク装置毎に作成され、位相マップのマップ情報を含む障害予兆ルールと前記品質情報とをリアルタイムに対比し、前記品質情報が前記障害予兆ルールから逸脱した場合は、障害の予兆を通知する障害予兆分析部と、
    ネットワークの構成管理データを含み、他のネットワーク装置との間で共有する構成管理データベースと、を備えることを特徴とするネットワーク装置。
  4. 複数のネットワーク装置および制御装置で構成され、ネットワークの障害を予兆するネットワーク管理システムに適用される制御装置であって、
    前記各ネットワーク装置から送信され、一定の周期で算出された品質情報の平均値を格納するデータ蓄積部と、
    前記ネットワークの構成情報および前記データ蓄積部に格納されている各ネットワーク装置の品質情報に基づいて前記各ネットワーク装置の品質情報の類似度をグループ化したクラスタリングマップを作成し、前記クラスタリングマップ上で近接した場所にマッピングされたネットワーク装置のデータのみを抽出して、前記ネットワーク装置毎に障害予兆ルールを作成し、前記作成したネットワーク装置毎の障害予兆ルールを前記各ネットワーク装置に通知するルール設計部と、を備えることを特徴とする制御装置。
JP2013204772A 2013-09-30 2013-09-30 ネットワーク管理システム、ネットワーク装置および制御装置 Active JP6226463B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013204772A JP6226463B2 (ja) 2013-09-30 2013-09-30 ネットワーク管理システム、ネットワーク装置および制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013204772A JP6226463B2 (ja) 2013-09-30 2013-09-30 ネットワーク管理システム、ネットワーク装置および制御装置

Publications (2)

Publication Number Publication Date
JP2015070528A JP2015070528A (ja) 2015-04-13
JP6226463B2 true JP6226463B2 (ja) 2017-11-08

Family

ID=52836796

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013204772A Active JP6226463B2 (ja) 2013-09-30 2013-09-30 ネットワーク管理システム、ネットワーク装置および制御装置

Country Status (1)

Country Link
JP (1) JP6226463B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102162660B1 (ko) * 2019-05-10 2020-10-07 (주)유미테크 빅데이터기반 네트워크 품질관리 시스템

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6500663B2 (ja) * 2015-07-16 2019-04-17 株式会社リコー 情報処理システム、情報処理装置、プログラム及び故障予測ロジック組込方法
JP6440203B2 (ja) 2015-09-02 2018-12-19 Kddi株式会社 ネットワーク監視システム、ネットワーク監視方法およびプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002319941A (ja) * 2001-04-23 2002-10-31 Hitachi Ltd ネットワーク障害判定方法及びその装置
JP4248278B2 (ja) * 2003-03-19 2009-04-02 株式会社日立情報システムズ マネージャ・エージェント型の監視システム及びその監視方法
CA2444834A1 (en) * 2003-10-10 2005-04-10 N-Able Technologies Inc. Multi-network monitoring architecture
JP4886460B2 (ja) * 2006-10-12 2012-02-29 パナソニック電工Sunx株式会社 異常監視装置
JP2011114822A (ja) * 2009-11-30 2011-06-09 Mitsubishi Electric Corp ネットワーク管理装置およびネットワーク管理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102162660B1 (ko) * 2019-05-10 2020-10-07 (주)유미테크 빅데이터기반 네트워크 품질관리 시스템

Also Published As

Publication number Publication date
JP2015070528A (ja) 2015-04-13

Similar Documents

Publication Publication Date Title
CN107925612B (zh) 网络监视系统、网络监视方法和计算机可读介质
JP6847591B2 (ja) 異常検知システム、モデル生成装置、異常検知装置、異常検知方法、モデル生成プログラム、および、異常検知プログラム
US10346756B2 (en) Machine discovery and rapid agglomeration of similar states
US11422595B2 (en) Method and system for supervising a health of a server infrastructure
US20200034730A1 (en) Machine Discovery of Aberrant Operating States
JP5277667B2 (ja) 障害分析システム、障害分析方法、障害分析サーバおよび障害分析プログラム
WO2015030804A1 (en) Identifying anomalous behavior of a monitored entity
JP6210867B2 (ja) データ関連性解析システムおよびデータ管理装置
CN109408386B (zh) 一种软件老化流式监测系统及其监测方法
KR20170078252A (ko) 시계열의 데이터를 모니터링 하는 방법 및 그 장치
US10591970B2 (en) Industrial asset management systems and methods thereof
KR20170084445A (ko) 시계열 데이터를 이용한 이상 감지 방법 및 그 장치
JP6183449B2 (ja) システム分析装置、及び、システム分析方法
JP6226463B2 (ja) ネットワーク管理システム、ネットワーク装置および制御装置
US20190265088A1 (en) System analysis method, system analysis apparatus, and program
JP6176390B2 (ja) 情報処理装置、解析方法、及び、プログラム記録媒体
EP2958023B1 (en) System analysis device and system analysis method
JP2016146020A (ja) データ分析システム及び分析方法
JP6068296B2 (ja) 制御装置、計算資源管理方法及び計算資源管理プログラム
Nisha et al. Robust estimation of incorrect data using relative correlation clustering technique in wireless sensor networks
WO2015174063A1 (ja) 情報処理装置、分析方法、及び、記録媒体
JP6627258B2 (ja) システムモデル生成支援装置、システムモデル生成支援方法、及び、プログラム
JP2012037991A (ja) 予測装置、予測システム及びプログラム
CN105072161A (zh) 一种基于云计算的应用程序管理系统
CN109670551A (zh) 工程机械设备的故障预测方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160222

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161220

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170206

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170801

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170829

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171006

R150 Certificate of patent or registration of utility model

Ref document number: 6226463

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150