JP2011114822A - ネットワーク管理装置およびネットワーク管理方法 - Google Patents

ネットワーク管理装置およびネットワーク管理方法 Download PDF

Info

Publication number
JP2011114822A
JP2011114822A JP2009272104A JP2009272104A JP2011114822A JP 2011114822 A JP2011114822 A JP 2011114822A JP 2009272104 A JP2009272104 A JP 2009272104A JP 2009272104 A JP2009272104 A JP 2009272104A JP 2011114822 A JP2011114822 A JP 2011114822A
Authority
JP
Japan
Prior art keywords
threshold value
usage rate
cpu usage
threshold
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009272104A
Other languages
English (en)
Inventor
Yoshinori Takada
佳典 高田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2009272104A priority Critical patent/JP2011114822A/ja
Publication of JP2011114822A publication Critical patent/JP2011114822A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

【課題】通信ネットワークを構成している各機器の状態を高精度に監視するネットワーク管理装置を得ること。
【解決手段】通信ネットワークを構成している各機器の状態を監視するネットワーク管理装置であって、管理対象装置の各々から動作状態情報を収集するMIB情報収集部14と、過去に収集された動作状態情報と監視対象機器の各々の性能情報とに基づいて、最新の動作状態情報を評価するためのしきい値を決定するしきい値決定部13と、決定されたしきい値を用いて、最新の動作状態情報を評価するしきい値超過判定部12と、を備える。
【選択図】図1

Description

本発明は、通信ネットワークを構成している各機器の状態を監視するネットワーク管理装置およびネットワーク管理方法に関する。
ネットワーク監視システムにおいて、監視対象のネットワークの動作状況の傾向分析や障害解析を行うためには、監視対象ネットワークを構成するネットワーク機器から、定期的に性能情報を収集し、当該性能情報の値に着目してネットワークの状態を推測する手法が一般的に使用されている。
このようなネットワーク監視システムでは、取得した性能情報に対して、現在の状態が通常状態と異常状態のどちらにあるのかを判断する為の「しきい値」を設けて、当該しきい値との比較を行うことにより状態の管理を行っている。
しきい値と性能情報の比較方法としては、大小だけでなくこれらの値の距離により、しきい値に近い領域(危険域)にある場合に、監視の頻度を高くして当該性能情報の変化を詳細に監視し、また危険域から遠い場合には、監視の頻度を低くしてネットワーク内の監視トラヒック用の負荷を軽減する方法が知られている(下記特許文献1参照)。
上記のような、しきい値を用いてネットワークの状態を監視する監視システムおいて、各性能情報に対するしきい値の決定は、元々はネットワーク構成やネットワークに収容するユーザ数等の状況から、熟練した運用者が経験に基づいて行ってきており、個別のしきい値を決定する包括的な解決方法は存在しなかった。
下記特許文献2には、このようなしきい値決定の問題を解決する手法、具体的には、情報処理装置などの障害を監視する監視装置が、監視対象装置が正常な時のシステム性能値に基づいて正常/異常の判定しきい値を決定する方法が記載されている。さらに詳しく書くと、下記特許文献2には、システム性能の問題が発生しているか否かの判定結果と業務サービスの問題が発生しているか否かの判定結果とが異なる場合を排除してアラートを適切に行うことが可能な監視装置が記載されており、この監視装置では、システム性能のアラート判定および業務サービスメトリックのアラート判定の双方が正常となる割合と、これらのアラート判定の双方が異常となる割合とに基づいて、各アラート判定で使用するしきい値の生成,更新を行うことにより、各アラート判定結果が異なってしまうのを防止している(アラートを適切に通知できるようにしている)。
特許第4089427号公報 特開2008−171104号公報
上記従来の監視装置では、監視対象機器が全て同一の場合を想定しており、1種類の監視対象機器の性能情報からしきい値の決定などを行っている。すなわち、従来は、各監視対象機器の間に性能差が存在しない条件下において、しきい値を適切に決定する為の手法の検討が行われていた。しかしながら、ネットワーク機器の監視においては、多くの場合、監視対象のネットワークは異なる種類のネットワーク装置(性能がそれぞれ異なるネットワーク装置)により構成されており、異なる種類のネットワーク機器に対して、それぞれの機種別にしきい値を適切に決定する方法はこれまで存在しなかった。
ネットワーク装置の監視においては、装置の種別やソフトウェアのバージョンが異なる場合には、装置のアーキテクチャが異なる可能性が高く、同一のしきい値を異なる装置に対して適用することは監視の精度を低下させる要因となる。
本発明は、上記に鑑みてなされたものであって、通信ネットワークを構成している各機器の状態を高精度に監視するネットワーク管理装置およびネットワーク管理方法を得ることを目的とする。
上述した課題を解決し、目的を達成するために、本発明は、通信ネットワークを構成している各機器の状態を監視するネットワーク管理装置であって、監視対象機器の各々から動作状態情報を収集する情報収集手段と、前記情報収集手段で過去に収集された動作状態情報と、監視対象機器の各々の性能情報とに基づいて、前記情報収集手段で収集された最新の動作状態情報を評価するためのしきい値を決定するしきい値決定手段と、前記しきい値決定手段で決定されたしきい値を用いて、前記最新の動作状態情報を評価するしきい値判定手段と、を備えることを特徴とする。
本発明によれば、各監視対象機器から収集した動作状態情報の解析結果に基づいて、同じ性能の監視対象機器のグループ毎に異なるしきい値を決定することが可能となり、障害発生を高精度に予測することができる、という効果を奏する。
図1は、本発明にかかるネットワーク管理装置の構成例を示す図である。 図2は、実施の形態1のMIB情報の管理方法の一例を示す図である。 図3は、実施の形態1のネットワーク構成情報の管理方法の一例を示す図である。 図4は、実施の形態1のしきい値情報の管理方法の一例を示す図である。 図5は、実施の形態1のしきい値決定部が受信パケット数しきい値を決定の際に使用する情報の管理方法の一例を示す図である。 図6は、実施の形態2のMIB情報の管理方法の一例を示す図である。 図7は、実施の形態2のしきい値情報の管理方法の一例を示す図である。 図8は、実施の形態2のしきい値決定部が受信パケット数しきい値およびCPU使用率しきい値を決定の際に使用する情報の管理方法の一例を示す図である。 図9は、実施の形態3のしきい値情報の管理方法の一例を示す図である。 図10は、実施の形態4のMIB情報の管理方法の一例を示す図である。 図11は、実施の形態4のしきい値情報の管理方法の一例を示す図である。 図12は、実施の形態5のしきい値情報の管理方法の一例を示す図である。
以下に、本発明にかかるネットワーク管理装置およびネットワーク管理方法の実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。
実施の形態1.
図1は、本発明にかかるネットワーク管理装置の構成例を示す図である。図示したように、ネットワーク管理装置1は、しきい値超過通知部11、しきい値超過判定部12、しきい値決定部13、MIB情報収集部14、ネットワーク構成格納部15、しきい値格納部16およびMIB情報格納部17を備えている。なお、図1には、管理対象装置#1,#2,…も併せて記載している。
しきい値超過通知部11は、しきい値超過判定部12が、MIB情報収集部14で収集されたMIB(Management Information Base)情報が比較対象のしきい値を超えたことを検出した場合、その旨をネットワーク管理者に通知する。なお、MIB情報の詳細については別途説明する。しきい値超過判定部12は、MIB情報収集部14で収集されたMIB情報を、しきい値格納部16で保持されているしきい値の中の比較対象しきい値と比較する。しきい値決定部13は、MIB情報格納部17に格納されたMIBとネットワーク構成格納部15に格納されたネットワーク構成情報とに基づいて、MIB情報収集部14で収集されたMIB情報を評価するためのしきい値を決定する。MIB情報収集部14は、たとえばSNMP(Simple Network Management Protocol)を用いて、各管理対象装置から、動作状態を示す各種情報を含んだMIB情報を収集する。
ネットワーク構成格納部15は、管理対象のネットワークの構成についての情報であるネットワーク構成情報を格納する。しきい値格納部16は、しきい値決定部13で決定されたしきい値を格納する。MIB情報格納部17は、MIB情報収集部14で収集されたMIB情報を格納する。
図2は、本実施の形態のMIB情報格納部17におけるMIB情報の管理方法の一例を示す図である。本実施の形態のMIB情報格納部17は、MIB情報収集部14が監視対象の各装置から取得したMIB情報を受け取る。そして、図2に示したように、受け取ったMIB情報を、MIB種別100および装置ID104で分類して格納する。具体的には、MIB種別100がパケットロス101,受信パケット数102のMIB情報の値を、装置IDごとに格納する。また、MIB情報は最新の情報だけではなく、過去に取得したMIB情報についても保持している。図2は、MIB情報収集部14がMIB情報を5分ごとに収集し(時刻103の項目参照)、収集したMIB情報に含まれるパケットロス数の情報および受信パケット数の情報がMIB情報格納部17に格納された場合の例を示している。
図3は、本実施の形態のネットワーク構成格納部15におけるネットワーク構成情報の管理方法の一例を示す図である。図示したように、本実施の形態のネットワーク構成格納部15は、管理対象の各装置を識別する装置ID200と、その製造元201、型番202および現在実装されているオペレーションシステム(OS)のバージョン203とを対応付けて保持している。ネットワーク構成情報は、各管理対象装置を同一種類の機種ごと(同一性能の装置ごと)に分類するための情報であり、製造元、型およびOSのバージョンが同一の装置同士は、同一種別(同じ性能の装置)として扱われる。
図4は、本実施の形態のしきい値格納部16におけるしきい値情報の管理方法の一例を示す図である。図示したように、しきい値格納部16は、装置種別300毎に、受信パケット数しきい値304を管理する。具体的には、製造元301、型番302およびOSのバージョン303ごとにそれぞれ決定されたしきい値(受信パケット数しきい値304)を保持している。
つづいて、本実施の形態のネットワーク管理装置の全体動作を説明する。
本実施の形態のネットワーク管理装置1において、MIB情報収集部14(情報収集手段に相当)は、ネットワーク上の各管理対象装置(管理対象装置#1,#2,…)から、管理対象装置の動作状態を示す情報であるMIB情報を定期的に収集し、収集したMIB情報をMIB情報格納部17に格納する。またこのとき、MIB情報を収集した旨をしきい値超過判定部12およびしきい値決定部13に通知する。なお、収集したMIB情報をしきい値超過判定部12に対して直接通知するようにしてもよい。
しきい値超過判定部12(しきい値判定手段に相当)は、MIB情報収集部14から上記通知を受けた場合、MIB情報格納部17に格納されているMIB情報のうちの最新のMIB情報それぞれ(各管理対象装置の受信パケット数)と、しきい値格納部16に格納されている装置種別300毎のしきい値304とを比較し、しきい値を超過しているMIB情報が存在していれば、しきい値超過が発生したことを管理者に通知するように、しきい値超過通知部11に指示を出す。なお、MIB情報がMIB情報収集部14から直接通知されるように実装した場合は、上述したMIB情報格納部17に格納されている最新のMIB情報についてのしきい値判定を実施するのではなく、MIB情報収集部14から通知されたMIB情報についてのしきい値判定を実施する。しきい値超過通知部11は、しきい値超過の発生を通知するように指示された場合、しきい値超過が発生した旨を管理者に通知する。管理者への通知は、たとえば表示部(図示せず)にその旨を示す文字列を表示する。これにより、管理者は管理対象装置の動作状況を知ることが可能となり、パケットロスが発生している、または発生する可能性が高いと認識できる。
一方、しきい値決定部13(しきい値決定手段に相当)は、MIB情報収集部14から上記通知(MIB情報を収集した旨の通知)を受けた場合、MIB情報格納部17に格納されたMIB情報と、ネットワーク構成格納部15に格納されたネットワーク構成情報とを用いて、管理対象装置毎(装置種別毎)にパケットロスが発生するかどうかの判定条件となる受信パケット数のしきい値を決定する。なお、ここではMIB情報収集部14から通知があるごとにしきい値を決定するものとしているが、しきい値の決定タイミングは任意であり、たとえば、n回(所定回数)通知を受けるごとに決定するようにしてもよい。また、通知タイミングに基づいたタイミング(通知タイミングに同期したタイミング)で決定するのではなく、他の条件に基づいたタイミングで決定するようにしてもよい。たとえば、一定時間周期で決定する、ネットワーク管理者からの指示を受けた場合に決定する、などとしてもよい。以下、しきい値の決定方法について説明する。
図5は、本実施の形態のしきい値決定部13が上記受信パケット数のしきい値を決定の際に使用する「しきい値決定用一時データ展開領域」における情報の管理方法の一例を示す図である。このしきい値決定用一時データ展開領域は、しきい値決定部13の内部で確保される領域である。しきい値決定用一時データ展開領域には、装置種別401毎に、「パケットロスあり」,「パケットロスなし」の障害状態402に応じて、障害状態を検出した場合の受信パケット数405が、装置ID403と時刻404と共に格納されている。
しきい値決定部13は、しきい値を決定する際、MIB情報格納部17に格納されたMIB情報(図2参照)およびネットワーク構成格納部15に格納されたネットワーク構成情報(図3参照)を取得し、それらをしきい値決定用一時データ展開領域(図5参照)に展開する。MIB情報の中のパケットロス数がインクリメントされている場合(前回のしきい値決定動作時から増加している場合)には、パケットロスが発生したと判断して「パケットロスあり」としてデータを生成し、そのタイミングでの受信パケット数の増加量(前回収集したMIB情報に含まれる受信パケット数からの増加量)を計算し、計算結果を受信パケット数405として格納する。このとき、パケットロスが発生した装置ID403と時刻404についても併せて格納する。そして、しきい値決定部13は、しきい値決定用一時データ展開領域で確保した最大数となるまで「パケットロスあり」に対応した受信パケット数405、および「パケットロスなし」に対応した受信パケット数405を展開するか、あるいはMIB情報格納部17に格納されている全てのMIB情報を展開すると、しきい値決定用一時データ展開領域に展開した各情報を用いて、各装置種別401に対応した受信パケット数405のしきい値を決定する。
しきい値の決定は、たとえば、障害状態402が「パケットロスあり」である情報のうち、受信パケット数405が最小となる受信パケット数をしきい値として選択する。また、障害状態402が「パケットロスあり」である情報の受信パケット数405の算術平均値と「パケットロスなし」である情報の受信パケット数405の算術平均値をそれぞれ求め、それらの中点をしきい値として選択してもよいし、障害状態402が「パケットロスあり」である情報と、「パケットロスなし」である情報の2つのグループに対して、マハラノビス距離における中点を算出しそれをしきい値として選択するようにしてもよい(ただし、「パケットロスあり」の場合と「パケットロスなし」の場合が混在している場合に限る)。
なお、上記のしきい値決定方法を組み合わせてもよい。すなわち、障害状態402が「パケットロスあり」である情報のみが存在する場合は、受信パケット数405が最小となる受信パケット数をしきい値として選択し、また「パケットロスなし」である情報のみが存在する場合は、受信パケット数405が最大となる受信パケット数をしきい値として選択し、さらに、「パケットロスあり」である情報と「パケットロスなし」である情報が混在する場合には、「パケットロスあり」である情報の受信パケット数405の算術平均値と「パケットロスなし」である情報の受信パケット数405の算術平均値の中点をしきい値とする、または、「パケットロスあり」である情報と「パケットロスなし」である情報の2つのグループについてのマハラノビス距離の中点をしきい値とするようにしてもよい。
このように、本実施の形態のネットワーク管理装置は、各監視対象機器(管理対象装置)から定期的にMIB情報を収集し、それらの解析結果に基づいて、監視対象機器の種類(装置種別やソフトウェアのバージョン)ごとにパケットロスが発生したかどうかを判定するためのしきい値を決定することとした。また、監視対象機器に対応するしきい値を用いて受信パケット数のしきい値超過発生を監視することとした。これにより、障害発生(パケットロス発生)の有無を判断するためのしきい値を監視対象機器ごとに個別に決定することができ、障害発生を高精度に予測することができる。
なお、しきい値決定部13がしきい値を決定する動作としきい値超過判定部12によるしきい値判定動作を並行して(独立して)行うように構成した場合の例について示したが、MIB情報収集部14でMIB情報が収集された後に、まず、しきい値決定部13がしきい値を決定し、その後、決定されたしきい値を用いてしきい値超過判定部12がしきい値判定を行うように構成してもよい。これにより、さらに高精度な状態監視動作を実現できる。
また、MIB情報収集部14がMIB情報を収集するごとにしきい値決定部13がしきい値を決定するのではなく、MIB情報を所定回数収集するごとにしきい値を決定するようにしてもよい。これにより処理負荷の増加量を抑えつつ管理対象装置の種類に応じたしきい値での監視動作を実現できる。
また、しきい値超過判定部12は、MIB情報収集部14がMIB情報を収集するごとにしきい値判定を行うのではなく、任意のタイミングで、その時点で最新の受信パケット数情報に対するしきい値判定を行うようにしてもよい。
実施の形態2.
つづいて、実施の形態2のネットワーク管理装置について説明する。実施の形態1のネットワーク管理装置では、ある期間における受信パケット数とパケットロスの発生状況に基づいて、現在の障害発生(パケットロス発生)の有無を判断することとしていたが、本実施の形態のネットワーク管理装置では、上記の情報に加えて、さらに、CPUの使用率も使用して障害発生の有無を判断する。なお、本実施の形態のネットワーク管理装置の構成は、実施の形態1のネットワーク管理装置と同一である(図1参照)。本実施の形態では、実施の形態1のネットワーク管理装置と異なる部分を中心に説明を行う。
図6は、本実施の形態のMIB情報格納部17に格納されたMIB情報の一例を示す図であり、実施の形態1のMIB情報(図2参照)に対してCPU使用率の情報(CPU使用率105)が追加されたものである。本実施の形態のネットワーク管理装置において、MIB情報収集部14は、実施の形態1と同様に、各管理対象装置から定期的にMIB情報を収集してMIB情報格納部17に格納するとともに、MIB情報を収集した旨をしきい値超過判定部12およびしきい値決定部13に通知する。
図7は、本実施の形態のしきい値格納部16におけるしきい値情報の管理方法の一例を示す図であり、実施の形態1のしきい値情報(図4参照)に対してCPU使用率についてのしきい値(CPU使用率しきい値305)が追加されたものである。本実施の形態のネットワーク管理装置のしきい値超過判定部12では、図7に示した受信パケット数しきい値304およびCPU使用率しきい値305を用いてしきい値判定を行う。
図8は、本実施の形態のしきい値決定部13が上記受信パケット数しきい値304およびCPU使用率しきい値305を決定の際に使用する「しきい値決定用一時データ展開領域」における情報の管理方法の一例を示す図である。これは、実施の形態1におけるしきい値決定で使用していた情報(図5参照)に対してCPU使用率の情報(CPU使用率406)が追加されたものである。しきい値決定部13は、しきい値を決定する際、まず、図6に示したMIB情報をMIB情報格納部17から取得し、また、ネットワーク構成情報をネットワーク構成格納部15から取得する。なお、ネットワーク構成情報は、実施の形態1で示したものと同一である(図3参照)。次に、しきい値決定部13は、取得したMIB情報とネットワーク構成情報を、しきい値決定用一時データ展開領域に展開する。そして、展開が完了すると、しきい値決定用一時データ展開領域に格納された情報に基づいて、受信パケットしきい値およびCPU使用率しきい値を決定する。
しきい値決定部13は、受信パケットしきい値およびCPU使用率しきい値を個別に決定する。受信パケットしきい値は、実施の形態1と同じ手法にて決定する。また、CPU使用率しきい値についても、同様の手法にて決定する。具体的には、障害状態402が「パケットロスあり」となっているもののうち、CPU使用率406が最小となるCPU使用率をしきい値として選択する。または、障害状態402が「パケットロスあり」である情報のCPU使用率406の算術平均値と「パケットロスなし」である情報のCPU使用率406の算術平均値をそれぞれ求め、それらの中点をしきい値として選択する。または、障害状態402が「パケットロスあり」となっている情報と、「パケットロスなし」となっている情報の2つのグループ(CPU使用率のグループ)に対して、マハラノビス距離における中点を算出しそれをしきい値として選択する。なお、しきい値の決定方法をこれらに限定するものではない。
しきい値超過判定部12は、MIB情報を収集した旨をMIB情報収集部14から通知された場合、MIB情報に含まれている受信パケット数およびCPU使用率についてのしきい値判定を行い、これらのうちの一方でもしきい値を超過している場合、その旨を通知するようにしきい値超過通知部11に対して指示を出す。しきい値超過通知部11は、しきい値超過判定部12からの指示に従い、ネットワーク管理者に通知を行う。なお、一方のみがしきい値を超過した場合であっても、受信パケット数とCPU使用率の双方について、同時に通知を行うこととする。
このように、本実施の形態のネットワーク管理装置では、各管理対象装置の受信パケット数およびCPU使用率を監視することとし、また、監視動作で使用するしきい値を、管理対象装置の機種(装置種別やソフトウェアのバージョン)ごとに決定することとした。これにより、実施の形態1の場合と比較してさらに高精度な障害発生予測が可能となる。
実施の形態3.
本実施の形態では、実施の形態2のネットワーク管理装置の変形例を示す。具体的には、しきい値決定部13がしきい値を決定する動作の変形例について説明する。本実施の形態のネットワーク管理装置の構成は、実施の形態1と同様である(図1参照)。実施の形態2のネットワーク管理装置では、受信パケット数およびCPU使用率を個別に評価することとして、これらを評価するための受信パケット数しきい値およびCPU使用率しきい値をそれぞれ決定するようにしていたが、本実施の形態では、受信パケット数およびCPU使用率の双方を用いて、管理対象装置の動作状態を総合的に評価する。
図9は、本実施の形態のしきい値格納部16におけるしきい値情報の管理方法の一例を示す図であり、実施の形態2のしきい値情報(図7参照)内の受信パケット数しきい値304およびCPU使用率しきい値305を、受信パケット数用係数306、CPU使用率用係数307および定数項308に置き換えたものである。
本実施の形態のしきい値決定部13は、しきい値を決定する際、上述した実施の形態2と同様に、MIB情報とネットワーク構成情報を、図8に示したしきい値決定用一時データ展開領域に展開する。そして、本実施の形態では、装置種別ごとに、各領域に格納された情報を、「パケットロスあり」の情報と「パケットロスなし」情報の2つのグループに分け、これらのグループに対して線形判別分析を実施して、それぞれのグループを分離するための線形判別関数(受信パケット数とCPU使用率のペアを、パケットロスありのグループとパケットロスなしのグループに分類するための関数)を求める。次に、装置種別ごとに求めた線形判別関数のそれぞれに含まれる、受信パケット数用の係数、CPU使用率用の係数および定数項を、しきい値格納部16に格納する。これにより、図8に示したしきい値情報が生成される。
しきい値超過判定部12は、MIB情報を収集した旨をMIB情報収集部14から通知された場合、MIB情報に含まれている受信パケット数とCPU使用率のペアを、しきい値格納部16に格納されたしきい値情報(図8参照)を用いて評価する。具体的には、受信パケット数およびCPU使用率と、しきい値情報に含まれる受信パケット数用係数、CPU使用率用係数および定数項とを上記線形判別関数に当てはめ、その結果得られた値から、当該受信パケット数およびCPU使用率のペアが、上記2つのグループのどちらに属するのかを判断する。そして、評価対象の受信パケット数とCPU使用率のペアが「パケットロスあり」のグループに属すると判断した場合には、その旨を通知するようにしきい値超過通知部11に対して指示を出す。しきい値超過通知部11は、しきい値超過判定部12からの指示に従い、ネットワーク管理者に通知を行う。
このように、本実施の形態のネットワーク管理装置では、各管理対象装置の受信パケット数およびCPU使用率を監視することとし、また、受信パケット数とCPU使用率の双方を同時に用いて監視対象機器の動作状態を評価するためのしきい値(線形判別関数)を、管理対象装置の機種(装置種別やソフトウェアのバージョン)ごとに決定することとした。この場合にも、実施の形態2と同様に、高精度な障害発生予測が可能となる。
実施の形態4.
つづいて、実施の形態4のネットワーク管理装置について説明する。実施の形態2,3のネットワーク管理装置では、ある期間における受信パケット数、CPU使用率およびパケットロスの発生状況に基づき、障害発生(パケットロス発生)の有無を判断することとしていたが、本実施の形態のネットワーク管理装置では、上記の情報に加えて、さらに、空きメモリ量も使用して障害発生の有無を判断する。なお、本実施の形態のネットワーク管理装置の構成は、実施の形態1のネットワーク管理装置と同一である(図1参照)。本実施の形態では、実施の形態1〜3で説明したネットワーク管理装置と異なる部分を中心に説明を行う。
図10は、本実施の形態のMIB情報格納部17におけるMIB情報の管理方法の一例を示す図であり、実施の形態2のMIB情報(図6参照)に対して空きメモリ量の情報(空きメモリ量106)が追加されたものである。本実施の形態のネットワーク管理装置において、MIB情報収集部14は、実施の形態1〜3と同様に、各管理対象装置から定期的にMIB情報を収集してMIB情報格納部17に格納するとともに、MIB情報を収集した旨をしきい値超過判定部12およびしきい値決定部13に通知する。
図11は、本実施の形態のしきい値格納部16におけるしきい値情報の管理方法の一例を示す図であり、実施の形態2のしきい値情報(図7参照)に対して空きメモリ量についてのしきい値(空きメモリ用しきい値309)が追加されたものである。本実施の形態のネットワーク管理装置のしきい値超過判定部12では、図11に示した受信パケット数しきい値304、CPU使用率しきい値305および空きメモリ量しきい値309を用いてしきい値判定を行う。
しきい値決定部13は、受信パケットしきい値、CPU使用率しきい値および空きメモリ量しきい値を個別に決定する。受信パケットしきい値およびCPU使用率しきい値は、実施の形態2と同じ手法にて決定する。また、空きメモリ量しきい値についても、受信パケットしきい値,CPU使用率しきい値と同様の手法にて決定する。
しきい値超過判定部12は、MIB情報を収集した旨をMIB情報収集部14から通知された場合、MIB情報に含まれている受信パケット数、CPU使用率および空きメモリ量についてのしきい値判定を行い、これらのうちの一つでもしきい値を超過している場合、その旨を通知するようにしきい値超過通知部11に対して指示を出す。しきい値超過通知部11は、しきい値超過判定部12からの指示に従い、ネットワーク管理者に通知を行う。なお、上記の3つの情報のうち1つまたは2つのみがしきい値を超過した場合であっても、受信パケット数、CPU使用率および空きメモリ量の全てについて、同時に通知を行うこととする。
このように、本実施の形態のネットワーク管理装置では、各管理対象装置の受信パケット数、CPU使用率および空きメモリ量を監視することとし、また、監視動作で使用するしきい値を、管理対象装置の機種(装置種別やソフトウェアのバージョン)ごとに決定することとした。これにより、実施の形態2の場合と比較してさらに高精度な障害発生予測が可能となる。
実施の形態5.
本実施の形態では、実施の形態4のネットワーク管理装置の変形例を示す。具体的には、しきい値決定部13がしきい値を決定する動作の変形例について説明する。本実施の形態のネットワーク管理装置の構成は、実施の形態1と同様である(図1参照)。実施の形態4のネットワーク管理装置では、受信パケット数、CPU使用率および空きメモリ量を個別に評価することとして、これらを評価するためのしきい値(受信パケット数しきい値,CPU使用率しきい値,空きメモリ量しきい値)をそれぞれ決定するようにしていたが、本実施の形態では、受信パケット数、CPU使用率および空きメモリ量の全てを用いて、管理対象装置の動作状態を総合的に評価する。
図12は、本実施の形態のしきい値格納部16におけるしきい値情報の管理方法の一例を示す図であり、実施の形態4のしきい値情報(図11参照)内の受信パケット数しきい値304、CPU使用率しきい値305および空きメモリ量しきい値309を、受信パケット数用係数306、CPU使用率用係数307、空きメモリ量用係数310および定数項308に置き換えたものである。
本実施の形態のしきい値決定部13は、しきい値を決定する際、上述した実施の形態4と同様に、MIB情報とネットワーク構成情報を、しきい値決定用一時データ展開領域に展開する。そして、本実施の形態では、装置種別ごとに、各領域に格納された情報を、「パケットロスあり」の情報と「パケットロスなし」情報の2つのグループに分け、これらのグループに対して線形判別分析を実施して、それぞれのグループを分離するための線形判別関数(受信パケット数、CPU使用率および空きメモリ量の組を、パケットロスありのグループとパケットロスなしのグループに分類するための関数)を求める。次に、装置種別ごとに求めた線形判別関数のそれぞれに含まれる、受信パケット数用の係数、CPU使用率用の係数、空きメモリ量用の係数および定数項を、しきい値格納部16に格納する。これにより、図12に示したしきい値情報が生成される。
しきい値超過判定部12は、MIB情報を収集した旨をMIB情報収集部14から通知された場合、MIB情報に含まれている受信パケット数、CPU使用率および空きメモリ量の組を、しきい値格納部16に格納されたしきい値情報(図12参照)を用いて評価する。具体的には、受信パケット数、CPU使用率および空きメモリ量と、しきい値情報に含まれる受信パケット数用係数、CPU使用率用係数、空きメモリ量用係数および定数項とを上記線形判別関数に当てはめ、その結果得られた値から、当該受信パケット数、CPU使用率および空きメモリ量の組が、上記2つのグループのどちらに属するのかを判断する。そして、評価対象の受信パケット数、CPU使用率および空きメモリ量の組が「パケットロスあり」のグループに属すると判断した場合には、その旨を通知するようにしきい値超過通知部11に対して指示を出す。しきい値超過通知部11は、しきい値超過判定部12からの指示に従い、ネットワーク管理者に通知を行う。
このように、本実施の形態のネットワーク管理装置では、各管理対象装置の受信パケット数、CPU使用率および空きメモリ量を監視することとし、また、受信パケット数、CPU使用率および空きメモリ量の全てを同時に用いて監視対象機器の動作状態を評価するためのしきい値(線形判別関数)を、管理対象装置の機種(装置種別やソフトウェアのバージョン)ごとに決定することとした。この場合にも、実施の形態4と同様に、高精度な障害発生予測が可能となる。
なお、上記の各実施の形態では、既存のプロトコル(SNMP)を利用して各管理対象装置からMIB情報を収集し、このMIB情報に含まれる情報の一部(受信パケット数,パケットロス数,CPU使用率,空きメモリ量)を利用して管理対象装置の動作状態を判断する場合について説明したが、動作状態の判断に利用する情報の収集はSNMPを利用した方法以外の方法で取得してもよい。
以上のように、本発明にかかるネットワーク管理装置は、通信ネットワークを構成している各機器の動作状況の監視に有用であり、特に、性能が異なる複数種類の機器により構成された通信ネットワークを監視するための装置に適している。
1 ネットワーク管理装置
11 しきい値超過通知部
12 しきい値超過判定部
13 しきい値決定部
14 MIB情報収集部
15 ネットワーク構成格納部
16 しきい値格納部
17 MIB情報格納部

Claims (18)

  1. 通信ネットワークを構成している各機器の状態を監視するネットワーク管理装置であって、
    監視対象機器の各々から動作状態情報を収集する情報収集手段と、
    前記情報収集手段で過去に収集された動作状態情報と、監視対象機器の各々の性能情報とに基づいて、前記情報収集手段で収集された最新の動作状態情報を評価するためのしきい値を決定するしきい値決定手段と、
    前記しきい値決定手段で決定されたしきい値を用いて、前記最新の動作状態情報を評価するしきい値判定手段と、
    を備えることを特徴とするネットワーク管理装置。
  2. 前記しきい値決定手段は、前記情報収集手段により動作状態情報が新たに収集されるごとに、当該新たに収集された動作状態情報および前記情報収集手段で過去に収集された動作状態情報を、前記性能情報に基づいて分類し、分類後の動作状態情報に基づいて、同一性能の監視対象機器から収集した各動作状態情報を評価するためのしきい値を、同一性能の監視対象機器のグループごとに決定する
    ことを特徴とする請求項1に記載のネットワーク管理装置。
  3. 前記しきい値決定手段は、前記動作状態情報に含まれる情報のうち、パケットロスの発生数および受信パケット数を用いて前記しきい値を決定する
    ことを特徴とする請求項1または2に記載のネットワーク管理装置。
  4. 前記しきい値決定手段は、前記動作状態情報に含まれる情報のうち、パケットロスの発生数、受信パケット数およびCPU使用率を用いて前記しきい値を決定する
    ことを特徴とする請求項1または2に記載のネットワーク管理装置。
  5. 前記しきい値決定手段は、前記受信パケット数を評価するためのパケット数しきい値、および前記CPU使用率を評価するためのCPU使用率しきい値を決定し、
    前記しきい値判定手段は、前記パケット数しきい値および前記CPU使用率しきい値を用いて、前記受信パケット数および前記CPU使用率を個別に評価する
    ことを特徴とする請求項4に記載のネットワーク管理装置。
  6. 前記しきい値決定手段は、前記受信パケット数および前記CPU使用率に対して線形判別分析を実行することにより、前記受信パケット数および前記CPU使用率のペアを評価するための線形判別関数を前記しきい値として生成し、
    前記しきい値判定手段は、前記線形判別関数を使用して前記受信パケット数および前記CPU使用率のペアを評価する
    ことを特徴とする請求項4に記載のネットワーク管理装置。
  7. 前記しきい値決定手段は、前記動作状態情報に含まれる情報のうち、パケットロスの発生数、受信パケット数、CPU使用率および空きメモリ量を用いて前記しきい値を決定する
    ことを特徴とする請求項1または2に記載のネットワーク管理装置。
  8. 前記しきい値決定手段は、前記受信パケット数を評価するためのパケット数しきい値、前記CPU使用率を評価するためのCPU使用率しきい値、および前記空きメモリ量を評価するための空きメモリ量しきい値を決定し、
    前記しきい値判定手段は、前記パケット数しきい値、前記CPU使用率しきい値および前記空きメモリ量しきい値を用いて、前記受信パケット数、前記CPU使用率および前記空きメモリ量を個別に評価する
    ことを特徴とする請求項7に記載のネットワーク管理装置。
  9. 前記しきい値決定手段は、前記受信パケット数、前記CPU使用率および前記空きメモリ量に対して線形判別分析を実行することにより、前記受信パケット数、前記CPU使用率および前記空きメモリ量の組を評価するための線形判別関数を前記しきい値として生成し、
    前記しきい値判定手段は、前記線形判別関数を使用して前記受信パケット数、前記CPU使用率および前記空きメモリ量の組を評価する
    ことを特徴とする請求項7に記載のネットワーク管理装置。
  10. 通信ネットワークの管理装置が、当該通信ネットワークを構成している各機器の状態を監視するためのネットワーク管理方法であって、
    監視対象機器の各々から動作状態情報を収集する情報収集ステップと、
    前記情報収集ステップで過去に収集した動作状態情報と、監視対象機器の各々の性能情報とに基づいて、前記情報収集ステップで収集した最新の動作状態情報を評価するためのしきい値を決定するしきい値決定ステップと、
    前記しきい値決定ステップで決定したしきい値を用いて、前記最新の動作状態情報を評価するしきい値判定ステップと、
    を含むことを特徴とするネットワーク管理方法。
  11. 前記しきい値決定ステップでは、前記情報収集ステップで動作状態情報を新たに収集するごとに、当該新たに収集した動作状態情報および前記情報収集ステップで過去に収集した動作状態情報を、前記性能情報に基づいて分類し、分類後の動作状態情報に基づいて、同一性能の監視対象機器から収集した各動作状態情報を評価するためのしきい値を、同一性能の監視対象機器のグループごとに決定する
    ことを特徴とする請求項10に記載のネットワーク管理方法。
  12. 前記しきい値決定ステップでは、前記動作状態情報に含まれる情報のうち、パケットロスの発生数および受信パケット数を用いて前記しきい値を決定する
    ことを特徴とする請求項10または11に記載のネットワーク管理方法。
  13. 前記しきい値決定ステップでは、前記動作状態情報に含まれる情報のうち、パケットロスの発生数、受信パケット数およびCPU使用率を用いて前記しきい値を決定する
    ことを特徴とする請求項10または11に記載のネットワーク管理方法。
  14. 前記しきい値決定ステップでは、前記受信パケット数を評価するためのパケット数しきい値、および前記CPU使用率を評価するためのCPU使用率しきい値を決定し、
    前記しきい値判定ステップでは、前記パケット数しきい値および前記CPU使用率しきい値を用いて、前記受信パケット数および前記CPU使用率を個別に評価する
    ことを特徴とする請求項13記載のネットワーク管理方法。
  15. 前記しきい値決定ステップでは、前記受信パケット数および前記CPU使用率に対して線形判別分析を実行することにより、前記受信パケット数および前記CPU使用率のペアを評価するための線形判別関数を前記しきい値として生成し、
    前記しきい値判定ステップでは、前記線形判別関数を使用して前記受信パケット数および前記CPU使用率のペアを評価する
    ことを特徴とする請求項13に記載のネットワーク管理方法。
  16. 前記しきい値決定ステップでは、前記動作状態情報に含まれる情報のうち、パケットロスの発生数、受信パケット数、CPU使用率および空きメモリ量を用いて前記しきい値を決定する
    ことを特徴とする請求項10または11に記載のネットワーク管理方法。
  17. 前記しきい値決定ステップでは、前記受信パケット数を評価するためのパケット数しきい値、前記CPU使用率を評価するためのCPU使用率しきい値、および前記空きメモリ量を評価するための空きメモリ量しきい値を決定し、
    前記しきい値判定ステップでは、前記パケット数しきい値、前記CPU使用率しきい値および前記空きメモリ量しきい値を用いて、前記受信パケット数、前記CPU使用率および前記空きメモリ量を個別に評価する
    ことを特徴とする請求項16に記載のネットワーク管理方法。
  18. 前記しきい値決定ステップでは、前記受信パケット数、前記CPU使用率および前記空きメモリ量に対して線形判別分析を実行することにより、前記受信パケット数、前記CPU使用率および前記空きメモリ量の組を評価するための線形判別関数を前記しきい値として生成し、
    前記しきい値判定ステップでは、前記線形判別関数を使用して前記受信パケット数、前記CPU使用率および前記空きメモリ量の組を評価する
    ことを特徴とする請求項16に記載のネットワーク管理方法。
JP2009272104A 2009-11-30 2009-11-30 ネットワーク管理装置およびネットワーク管理方法 Pending JP2011114822A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009272104A JP2011114822A (ja) 2009-11-30 2009-11-30 ネットワーク管理装置およびネットワーク管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009272104A JP2011114822A (ja) 2009-11-30 2009-11-30 ネットワーク管理装置およびネットワーク管理方法

Publications (1)

Publication Number Publication Date
JP2011114822A true JP2011114822A (ja) 2011-06-09

Family

ID=44236795

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009272104A Pending JP2011114822A (ja) 2009-11-30 2009-11-30 ネットワーク管理装置およびネットワーク管理方法

Country Status (1)

Country Link
JP (1) JP2011114822A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015070528A (ja) * 2013-09-30 2015-04-13 Kddi株式会社 ネットワーク管理システム、ネットワーク装置および制御装置
JPWO2021241086A1 (ja) * 2020-05-29 2021-12-02
JP7400565B2 (ja) 2020-03-17 2023-12-19 日本電気株式会社 管理装置、ネットワークシステム、管理方法、およびプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015070528A (ja) * 2013-09-30 2015-04-13 Kddi株式会社 ネットワーク管理システム、ネットワーク装置および制御装置
JP7400565B2 (ja) 2020-03-17 2023-12-19 日本電気株式会社 管理装置、ネットワークシステム、管理方法、およびプログラム
JPWO2021241086A1 (ja) * 2020-05-29 2021-12-02
JP7382503B2 (ja) 2020-05-29 2023-11-16 富士フイルム株式会社 感活性光線性又は感放射線性樹脂組成物、パターン形成方法、レジスト膜、電子デバイスの製造方法、化合物、化合物の製造方法

Similar Documents

Publication Publication Date Title
US11637740B2 (en) Intelligent anomaly detection and root cause analysis in mobile networks
US9952921B2 (en) System and method for detecting and predicting anomalies based on analysis of time-series data
US7504936B2 (en) Method and apparatus for dynamically prioritize network faults based on real-time service degradation
JP5418250B2 (ja) 異常検出装置、プログラム、及び異常検出方法
CN104126285A (zh) 用于在云网络中进行快速灾难恢复准备的方法和设备
JP5612696B2 (ja) 通信ネットワーク内のサービス品質結果の特定及びアクセスのためのネットワーク管理システム及び方法
CN103392176B (zh) 用于预测网络事件泛滥的装置和方法
US11050609B2 (en) Technique for reporting and processing alarm conditions occurring in a communication network
JP4412031B2 (ja) ネットワーク監視システム及びその方法、プログラム
US20160283307A1 (en) Monitoring system, monitoring device, and test device
JP2010186310A (ja) 運用管理装置および運用管理方法ならびにそのプログラム
US20070168505A1 (en) Performance monitoring in a network
CN116389304B (zh) 基于sg-tms的网络运行状态趋势分析系统
JP2010134862A (ja) ログ分析システム、方法、及び、プログラム
JP2010141655A (ja) ネットワーク監視装置
JP2011114822A (ja) ネットワーク管理装置およびネットワーク管理方法
JP4952437B2 (ja) ネットワーク監視装置、ネットワーク監視システム
JP2009253403A (ja) ログレベル収集装置およびログレベル収集方法
US20210135924A1 (en) Network monitoring system and method, and non-transitory computer readable medium storing program
JP2009187230A (ja) サーバの監視装置
WO2016127622A1 (zh) 一种业务劣化监测方法和装置
JP5874234B2 (ja) 機器管理装置、機器管理方法および機器管理プログラム
JP2013200899A (ja) 運用管理装置および運用管理方法
JP2014010538A (ja) 運用管理装置、運用管理システム及び運用管理方法
CN116114220A (zh) 管理平面中的安全管理服务