JP2016225806A - ネットワーク装置、リソース監視方法およびプログラム - Google Patents

ネットワーク装置、リソース監視方法およびプログラム Download PDF

Info

Publication number
JP2016225806A
JP2016225806A JP2015110136A JP2015110136A JP2016225806A JP 2016225806 A JP2016225806 A JP 2016225806A JP 2015110136 A JP2015110136 A JP 2015110136A JP 2015110136 A JP2015110136 A JP 2015110136A JP 2016225806 A JP2016225806 A JP 2016225806A
Authority
JP
Japan
Prior art keywords
state value
state
change
value
writing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015110136A
Other languages
English (en)
Other versions
JP6507858B2 (ja
Inventor
平野 直樹
Naoki Hirano
直樹 平野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2015110136A priority Critical patent/JP6507858B2/ja
Publication of JP2016225806A publication Critical patent/JP2016225806A/ja
Application granted granted Critical
Publication of JP6507858B2 publication Critical patent/JP6507858B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

【課題】 監視周期の途中で発生する、頻度の高い状態値変化における監視対象の最重要変化値を確実に検出する。
【解決手段】 状態値書込部には管理対象リソースにおける状態変化に対応する第1の状態値が書き込まれ、監視対象として所定のタイミングで参照される。状態変化検知手段は、管理対象リソースにおける状態変化の発生を検知し、該検知した変化に対応する第2の状態値を出力する。状態値比較手段は、状態変化検知手段が第2の状態値を出力すると、第1の状態値を読み出し、第1の状態値と第2の状態値を比較し、第2の状態値が、管理対象リソースにおいて第1の状態値よりも重要度が高い状態変化を示す場合、状態値書込部の第1の状態値を第2の状態値で書き換える。状態変化検知手段は、状態値書込部が参照される所定のタイミングの間に少なくとも2回の管理対象リソースにおける状態変化の発生を検知する。
【選択図】 図1

Description

本発明は、ネットワーク装置、リソース監視方法およびプログラムに関し、特に、監視対象のリソースに対して定期的に状態監視を行うネットワーク装置、リソース監視方法およびプログラムに関する。
ネットワーク装置の監視には、SNMP(Simple Network Management Protocol)が最も普及しており、SNMPを使用して、監視装置からネットワークに接続されている監視対象装置をネットワーク経由で監視を行う。SNMPは、IETF(Internet Engineering Task Force)が策定したRFC(Request For Comments)1157で提唱されているネットワーク監視プロトコルである。SNMPは、ネットワーク装置やサーバなどの状態監視、リソース監視、パフォーマンス監視、トラフィック監視等に使われる。
SNMPでは、監視対象装置にSNMPエージェント機能、監視装置にSNMPマネージャ機能をインストールする。監視対象装置のSNMPエージェントは、装置の状態情報を、監視する情報の集合であるMIB(Management Information Base:管理情報ベース)により「オブジェクト(Object)」と呼ばれる単位で管理している。オブジェクトにはそれぞれ「オブジェクトID(OID)」という識別子が割り当てられる。そして、SNMPエージェントは、このMIBの内容に基づいて現在の装置の状態を判断する。MIBで管理・監視する項目の例としては、トラフィック総バイト数、CPU(Central Processing Unit)負荷、メモリの使用量、プロセスの状態、構成装置の障害等々がある。
SNMPマネージャは、SNMPで規定されているコマンドを用いて、OIDを指定してSNMPエージェントのMIBの情報を要求することができる。これをSNMP要求と称し、このSNMP要求に対してSNMPエージェントがMIBの情報をSNMPマネージャに返送することをSNMP応答と称する。
また、SNMPエージェントは、定期ポーリングにより装置内の状態変化を検出し、SNMPで規定されているコマンド(Trap)を用いて自発的に自装置の状態をSNMPマネージャに通知することができる。したがって、ネットワーク装置にて故障などが発生して管理情報に変化があった場合、SNMPエージェントはTrapによりその故障情報をSNMPマネージャに通知する。
このようなSNMPを用いたネットワーク機器の監視システムが特許文献1乃至特許文献3に開示されている。
特許文献1は、監視対象機器の変化の情報を取得するためのSNMP(MIBアクセス)通信が増大することを防ぐ技術を開示している。特許文献1が開示する技術は、MIBをグループ分けしてそのグループに対応する拡張MIBを設け、MIBの変化に対して、その属するグループの拡張MIBを更新するようにしている。そして、管理ステーションは、所定の周期で拡張MIBの値を取得し、取得した値が以前に取得した値と一致していない拡張MIBから、そのグループ内のMIBの値を取得する構成としている。
特許文献2は、IP(Internet Protocol)ネットワーク接続機能を有さない被管理対象デバイスを、SNMPにより管理する管理システムを低コストで提供する技術を開示する。特許文献2が開示する技術は、外部の環境を示すデータをセンサから入力してMIBオブジェクトに対応付けて格納するMIB格納部を有する半導体回路デバイスと、該半導体回路デバイスと通信する管理装置とで構成される。管理装置は、半導体回路デバイスに対応付けて、半導体回路デバイスの使用者の連絡先情報を格納し、半導体回路デバイスから取得したデータが予め設定された条件を満たす場合に、連絡先を取り出して、その使用者に通知するように構成している。
特許文献3は、ポーリング周期よりも短い間隔で複数の状態変化が発生する状況下においても、管理対象リソースの状態変化を漏れなく通知することができるネットワーク装置に関する技術を開示する。特許文献3が開示するネットワーク装置は、状態値の新たな書込みを識別して、その新たな状態値を読み込む状態読み込み部と、該読み込まれた状態値をTrapにより管理システムに通知する状態通知部で構成される。状態読み込み部は、管理システムから指示されたポーリング周期毎に、状態履歴テーブルに格納されている書込み履歴とMIBに格納されている読み込み履歴を比較して、状態値の新たな書込みがあるか否かを確認している。そして、新たな書込みがあれば、状態履歴テーブルから新たな状態値を読み込む。
特開2002-297468号公報 特開2004-038402号公報 特開2014-178842号公報
SNMPマネージャからSNMPエージェントへのSNMP要求やSNMPエージェントが実行する定期ポーリングの周期よりも、管理対象リソースの状態変化が多い場合には、正確な状態を読み出すことができなくなるという課題がある。
例えば、SNMPエージェントが管理対象オブジェクトに対して定期ポーリングを行って、その状態応答を受け取った後、次の定期ポーリングが行われるまでの間に、該管理オブジェクトの値が、0→1→2→1と変化したものとする。次の定期ポーリングでは、そのときの状態の値である1が通知されることになり、SNMPエージェントは、状態変化の途中の重要値である2が発生したことを検出することができない。
この課題を解決するための最も簡単な改善策の1つとしては、ポーリング周期を短くすることが考えられる。しかし、通常の監視装置や監視対象装置においては、多種のアプリケーションが稼働しており、ポーリング周期を短くしてCPUの負荷を上げると、その他のアプリケーションの稼働にも影響を与える可能性があるので、得策ではない。
特許文献3では、この課題を解決するために、監視対象装置内のオブジェクト値が変化するたびに変化したすべての値を格納し、其の値をポーリングで取得するという手法を取っている。この方法であれば、CPUリソースに負担をかけることなく、正しい値を取得することは可能ではある。しかし、管理値の変化頻度は予測できないため、変化値を格納するためのバッファを充分大きく具備する必要があり、これは省資源化の観点において有効ではない。
特許文献1は、グループ内のMIBの変化を、拡張MIBを代表してポーリングすることで、多数のMIBに対するSNMP通信が増大することを防ぐ技術であり、発生頻度が多い状態値の変化に対応するものではない。
また、特許文献2は、IPネットワーク接続機能を有さない被管理対象デバイスを、SNMPにより管理する管理システムを低コストで提供する技術であり、発生頻度が多い状態値の変化に対応するものではない。
本発明は、監視周期の途中で発生する、頻度の高い状態値変化における監視対象の最重要変化値を確実に検出することができるネットワーク装置、リソース監視方法およびプログラムを提供する。
上記の目的を実現するために、本発明の一形態であるネットワーク装置は、管理対象リソースにおける状態変化に対応し、監視対象として所定のタイミングで参照される第1の状態値が書き込まれる状態値書込部と、前記管理対象リソースにおける状態変化の発生を検知し、該検知した変化に対応する第2の状態値を出力する状態変化検知手段と、前記状態変化検知手段が前記第2の状態値を出力すると、前記状態値書込部に書き込まれている前記第1の状態値を読み出し、前記第1の状態値と前記第2の状態値を比較し、前記第2の状態値が、前記管理対象リソースにおいて前記第1の状態値よりも重要度が高い状態変化を示す場合、前記第1の状態値を前記第2の状態値で書き換える状態値比較手段と、を含み、前記状態変化検知手段は、前記状態値書込部が参照される前記所定のタイミングの間に少なくとも2回の前記管理対象リソースにおける状態変化の発生を検知することを特徴とする。
また、本発明の他の形態であるリソース監視方法は、管理対象リソースにおける状態変化に対応する状態値を、監視対象として所定のタイミングで参照される第1の状態値として状態値書込部に書込み、前記管理対象リソースにおける状態変化の発生を検知し、該検知した変化に対応する第2の状態値を出力し、前記第2の状態値が出力されると、前記状態値書込部に書き込まれている前記第1の状態値を読み出して、前記第1の状態値と前記第2の状態値を比較し、前記第2の状態値が、前記管理対象リソースにおいて前記第1の状態値よりも重要度が高い状態変化を示す場合、前記第1の状態値を前記第2の状態値で書き換え、前記管理対象リソースにおける状態変化の発生は、前記状態値書込部が参照される前記所定のタイミングの間に少なくとも2回検知されることを特徴とする。
更に、本発明の別の形態であるプログラムは、コンピュータを、管理対象リソースにおける状態変化に対応し、監視対象として所定のタイミングで参照される第1の状態値を状態値書込部に書き込む状態値書込機能手段と、前記管理対象リソースにおける状態変化の発生を検知し、該検知した変化に対応する第2の状態値を出力する状態変化検知機能手段と、前記状態変化検知機能手段が前記第2の状態値を出力すると、前記状態値書込部に書き込まれている前記第1の状態値を読み出し、前記第1の状態値と前記第2の状態値を比較し、前記第2の状態値が、前記管理対象リソースにおいて前記第1の状態値よりも重要度が高い状態変化を示す場合、前記第1の状態値を前記第2の状態値で書き換える状態値比較機能手段として機能させ、前記状態変化検知機能手段は、前記状態値書込部が参照される前記所定のタイミングの間に少なくとも2回の前記管理対象リソースにおける状態変化の発生を検知するプログラムであることを特徴とする。
本発明は、監視周期の途中で発生する、頻度の高い状態値変化における監視対象の最重要変化値を確実に検出することができる。
本発明の第1の実施形態のネットワーク装置の構成を示すブロック図である。 本発明の第1の実施形態のリソース監視方法の動作を示すフロー図である。 本発明の第1の実施形態のネットワーク装置のハードウェアの構成を示すブロック図である。 本発明の第1の実施形態のプログラムが実現する機能手段の構成を示すブロック図である。 本発明の第2の実施形態のネットワーク装置の構成を示すブロック図である。 本発明の第2の実施形態のネットワーク装置の動作を示すフロー図である。 本発明の第2の実施形態のネットワーク装置の変形例の動作を示すフロー図である。 本発明の第2の実施形態のネットワーク装置のSNMP要求の場合の動作例を示すシーケンス図である。 本発明の第2の実施形態のネットワーク装置のTrapの場合の動作例を示すシーケンス図である。
本発明を実施するための形態について図面を参照して説明する。
尚、実施の形態は例示であり、開示の装置及びシステムは、以下の実施の形態の構成には限定されない。

(第1の実施形態)
本発明の第1の実施形態のネットワーク装置の構成を説明する。
図1は、本発明の第1の実施形態のネットワーク装置の構成を示すブロック図である。
第1の実施形態のネットワーク装置10は、状態値書込部101、状態値比較手段102および状態変化検知手段103を含む構成になっている。
状態値書込部101は、管理対象リソースにおける状態変化に対応し、監視対象として所定のタイミングで参照される第1の状態値が書き込まれる。
状態変化検知手段103は、管理対象リソースにおける状態変化の発生を検知し、該検知した変化に対応する第2の状態値を出力する。
状態値比較手段102は、状態変化検知手段103が第2の状態値を出力すると、状態値書込部101に書き込まれている第1の状態値を読み出し、第1の状態値と第2の状態値を比較する。そして、状態値比較手段102は、第2の状態値が、管理対象リソースにおいて第1の状態値よりも重要度が高い状態変化を示す場合、第1の状態値を第2の状態値で書き換える。
なお、状態変化検知手段103は、状態値書込部101が参照される所定のタイミングの間に少なくとも2回の管理対象リソースにおける状態変化の発生を検知する。
本発明の第1の実施形態のリソース監視方法の動作を説明する。
図2は、本発明の第1の実施形態のリソース監視方法の動作を示すフロー図である。
管理対象リソースにおける状態変化に対応する状態値を、監視対象として所定のタイミングで参照される第1の状態値として状態値書込部に書込む(S101)。
管理対象リソースにおける状態変化の発生を検知し、該検知した変化に対応する第2の状態値を出力する(S102)。
第2の状態値が出力されると、状態値書込部に書き込まれている第1の状態値を読み出して、第1の状態値と第2の状態値を比較する(S103)。
第2の状態値が、その管理対象リソースにおいて第1の状態値よりも重要度が高い状態変化を示す場合、第1の状態値を該第2の状態値で書き換える(S104)。
なお、ステップS102の管理対象リソースにおける状態変化の発生は、状態値書込部が参照される所定のタイミングの間に少なくとも2回検知される(S105)。
第1の実施形態のネットワーク装置を実現するハードウェアについて説明する。
図3は、本発明の第1の実施形態のネットワーク装置のハードウェアの構成を示すブロック図である。
図3を参照すると、ネットワーク装置11は、一般的なコンピュータ装置と同様のハードウェア構成によって実現することができ、次の構成を備える。
ハードウェア構成として、制御部であるCPU(Central Processing Unit)111、主記憶部112、補助記憶部113を含む。主記憶部112は、RAM(Random Access Memory)等で構成され、補助記憶部113は、磁気ディスク、半導体メモリ等の不揮発メモリから構成されるハードディスク装置を含む。
また、ハードウェア構成として、ネットワークを介して外部との通信を行う通信制御部114、マン・マシン・インタフェースとしての表示部115や入力部116、上記各構成要素を相互に接続するシステムバス117等を含む。
本実施形態のネットワーク装置11は、その動作を、ネットワーク装置11の内部に各機能を実現するプログラムを組み込んだLSI(Large Scale Integration)等のハードウェア部品からなる回路部品を実装して実現してもよい。また、本実施形態のネットワーク装置11は、各構成要素の各機能を提供するプログラムを、コンピュータ処理装置上のCPU111で実行することにより、ソフトウェア的に実現してもよい。
すなわち、CPU111は、補助記憶部113に格納されているプログラムを、主記憶部112にロードして実行し、あるいは補助記憶部113上で直接実行し、ネットワーク装置11の動作を制御することにより、各機能をソフトウェア的に実現する。
本発明の第1の実施形態のプログラムが実現する機能手段の構成を図4に示す。
図4は、本発明の第1の実施形態のプログラムが実現する機能手段の構成を示すブロック図である。
本実施形態のプログラムは、コンピュータを、状態値書込機能手段122、状態値比較機能手段123および状態変化検知機能手段124として機能させる。状態値書込部121は、図3における補助記憶部113の所定のエリアに設けられている。
状態値書込機能手段122は、管理対象リソースにおける状態変化に対応し、監視対象として所定のタイミングで参照される第1の状態値を、状態値書込部に書き込む機能を有する。
状態変化検知機能手段124は、管理対象リソースにおける状態変化の発生を検知し、該検知した変化に対応する第2の状態値を出力する機能を有する。
状態値比較機能手段123は、状態変化検知機能手段124が第2の状態値を出力すると、状態値書込部121に書き込まれている第1の状態値を読み出し、第1の状態値と第2の状態値を比較する。そして、第2の状態値が、管理対象リソースにおいて第1の状態値よりも重要度が高い状態変化を示す場合、第1の状態値を第2の状態値で書き換える機能を有する。
なお、状態変化検知機能手段124は、状態値書込部が参照される所定のタイミングの間に少なくとも2回の管理対象リソースにおける状態変化の発生を検知する。
このように、本実施形態では、管理対象リソースの状態変化を検知し、その状態変化に対応する状態値(第2の状態値)が出力されると、その時点で状態値書込部に書き込まれている状態値(第1の状態値)との重要度を比較する。重要度の比較結果に基づき、重要度がより高い状態値が第1の状態値として書き換えられてゆく。つまり、本実施形態によれば、状態値書込部に書き込まれている状態値は、所定のタイミングで監視データとして参照されるが、参照される所定のタイミングの間に多数の状態変化が発生したとしても全ての状態値を格納しておく必要はない。
そのため、検知した全ての状態値を記録することなく、重要度がより高い状態値だけを更新して格納することにより、小さなサイズのバッファ構成であっても監視データとしての重要な状態変化を見逃すことがない。
例えば、状態値が大きい方が異常の状態が高く、監視レベルが高いと仮定した場合、最初に検知された状態変化の状態値が1、次が状態値3、そしてその次に状態値2と変化したときに、途中の状態の状態値3が確実に記録される。
以上に説明したように、本実施形態では、監視周期の途中で発生する、頻度の高い状態値変化における監視対象の最重要変化値を確実に検出することができる。

(第2の実施形態)
次に、本発明の第2の実施形態を説明する。
図5は、本発明の第2の実施形態のネットワーク装置の構成を示すブロック図である。
第2の実施形態のネットワーク装置20は、IPネットワーク40を介して監視装置30と接続され、監視装置30による監視対象装置となっている。
監視装置30には、ネットワーク監視プロトコルを実現するソフトウェアであるSNMPマネージャ31がインストールされている。また、監視装置30の監視対象装置であるネットワーク装置20には、SNMPエージェント21のソフトウェアがインストールされている。
ネットワーク装置20は、装置の状態情報に関する管理情報データベースであるMIB22を備え、管理対象リソース24ごとに管理対象オブジェクト23を管理している。SNMPエージェント21は、MIB22の内容を周期的に参照して、管理対象オブジェクト23に関する現在の装置の状態を判断する。
管理対象オブジェクト23は、状態値書込部231を具備しており、管理対象オブジェクト23として関連付けられている管理対象リソース24の状態を保持している。状態値書込部231に保持される管理対象リソース24の状態は、第1の実施形態における第1の状態値に相当し、監視対象として周期的に参照される。
管理対象リソース24は、状態変化検知部241と状態値比較部242を具備している。状態変化検知部241は当該リソースの状態変化を検知し、状態値比較部242は状態値書込部231に既に書きこまれている当該リソースの状態と状態変化検知部241で検知された状態変化に対応する状態値とを比較する機能を持つ。状態変化検知部241は第1の実施形態における状態変化検知手段103に相当し、状態値比較部242は第1の実施形態における状態値比較手段102に相当する。そして、状態変化検知部241で検知された状態変化に対応する状態値は、第1の実施形態における第2の状態値に相当する。
ネットワーク装置20は、図3を参照して説明したようなハードウェア構成のサーバ装置であってよい。
SNMPエージェント21、管理対象オブジェクト23、状態値書込部231、管理対象リソース24、状態変化検知部241および状態値比較部242は、各機能のプログラムがCPUで実行されることで、ソフトウェア的に実現してもよい。また、SNMPエージェント21、管理対象オブジェクト23、状態値書込部231、管理対象リソース24、状態変化検知部241および状態値比較部242をハードウェア的に実現してもよい。例えば、SNMPエージェント21、管理対象オブジェクト23、管理対象リソース24、状態変化検知部241および状態値比較部242は、各機能を実現するプログラムを組み込んだマイコン、そして、状態値書込部231はメモリで実現できる。
次に、本実施形態のネットワーク装置20の動作を図6乃至図9を参照して説明する。なお、ネットワーク装置20が図6乃至図9のように動作することで第2の実施形態のリソース監視方法が実現される。また、関連する機能構成については図5に示した参照符号を付して説明する。
図6は、第2の実施形態のネットワーク装置20の動作を示すフロー図である。
管理対象オブジェクト23として関連付けられている管理対象リソース24の状態変化に対応する状態値が第1の状態値として状態値書込部231に書き込まれている(S201)。状態値書込部231に書き込まれている第1の状態値は、監視情報としてSNMPエージェント21が周期的に参照する。例えば、管理対象リソース24の状態が正常であることを示す値0が第1の状態値の初期値として書き込まれていてもよい。
管理対象リソース24における状態変化の発生が検知されていないかの確認が行われる(S202)。これは、状態変化検知部241が実行する機能である。
状態変化の発生が検知されると(S202、Yes)、その発生した状態変化に対応する状態値である第2の状態値が、状態変化検知部241から出力される(S203)。
この第2の状態値は、状態値比較部242が受信し、状態値比較部242において第1の状態値と第2の状態値の比較処理が行われる。つまり、第1の状態値が状態値書込部231から読み出され、状態変化検知部241から出力された第2の状態値と、それぞれの状態値が示す監視情報としての重要度が比較される(S204)。
そして、第2の状態値が第1の状態値よりも重要度が大であるか否かが判定される(S205)。
例えば、軽度の異常状態を示す値が1、中程度の異常状態を示す値が2、重度の異常状態を示す値が3であるとする。このような状態変化と重要度の対応は管理対象リソース24ごとに予め設定されているものとする。
状態値書込部231から読み出された第1の状態値が初期値0で、状態変化検知部241から出力された第2の状態値が2であれば、第2の状態値のほうが重要度大であると判定される(S205、Yes)。
このとき、状態値書込部231に書き込まれている第1の状態値(0)は、第2の状態値(2)で書き換えられる(S206)。
外部からの指示またはそれ以外の要因による終了指示が無い限り(S208、No)、ステップS202の処理に戻る。
その後、ステップS202で異常状態が軽減された状態変化が検知され、ステップS203で第2の状態値(1)が出力されたとする。
このとき、ステップS204の処理では、状態値書込部231に書き込まれている第1の状態値(2)が読み出され、検知された第2の状態値(1)と重要度が比較される。
そして、ステップS205の判定では、第2の状態値は第1の状態値よりも重要度大ではないと判定される(S205、No)。
このように、状態値書込部231に書き込まれている第1の状態値の重要度が大の場合には、検知された第2の状態値は破棄される(S207)。
また、その後のステップS202で、重度の異常状態の発生に起因する状態変化が検知され、ステップS203で第2の状態値(3)が出力されたとする。
このとき、ステップS204の処理では、状態値書込部231に書き込まれている第1の状態値(2)が読み出され、検知された第2の状態値(3)と重要度が比較される。
そして、ステップS205の判定では、第2の状態値のほうが第1の状態値よりも重要度大であると判定される(S205、Yes)。
このとき、状態値書込部231に書き込まれている第1の状態値(2)は、第2の状態値(3)で書き換えられる(S206)。
このように、管理対象リソースの状態変化に対応する第2の状態値が出力されると、その時点で状態値書込部231に書き込まれている第1の状態値との重要度が比較され、重要度がより高い状態値が第1の状態値として書き換えられてゆく。
そのため、参照される周期の間に多数の状態変化が発生したとしても全ての状態値を格納しておく必要はなく、重要度がより高い状態値だけを更新して格納することにより、監視データとしての重要な状態変化を見逃すことがない。なお、上述したステップS204乃至S207は、状態値比較部242により実行される。
次に、図7を参照して、本実施形態のネットワーク装置の変形例の動作を説明する。
図7は、本発明の第2の実施形態のネットワーク装置20の変形例の動作を示すフロー図である。
管理対象オブジェクト23として関連付けられている管理対象リソース24の状態変化に対応する状態値が第1の状態値および第3の状態値として状態値書込部231に書き込まれている(S211)。
状態値書込部231に書き込まれている第1の状態値および第3の状態値は、監視情報としてSNMPエージェント21が周期的に参照する。第1の状態値は管理対象リソース24に発生した重要度に応じた状態変化を示す値で、第3の状態値は管理対象リソース24で発生した時間的に最も新しい状態変化に対応する値である。時間的に最も新しい状態変化を直近の時間に発生した状態変化とも称する。初期値としては、例えば、第1の状態値および第3の状態値のいずれも管理対象リソース24の状態が正常であることを示す値0が書き込まれていてもよい。
管理対象リソース24における状態変化の発生が検知されていないかの確認が行われる(S212)。これは、状態変化検知部241が実行する機能である。
状態変化の発生が検知されると(S212、Yes)、その発生した状態変化に対応する状態値である第2の状態値が、状態変化検知部241から出力される(S213)。
この第2の状態値は、状態値比較部242が受信し、状態値比較部242において第1の状態値と第2の状態値の比較処理が行われる。つまり、第1の状態値が状態値書込部231から読み出され、状態変化検知部241から出力された第2の状態値と、それぞれの状態値が示す監視情報としての重要度が比較される(S214)。
そして、第2の状態値が第1の状態値よりも重要度が大であるか否かが判定される(S215)。
例えば、図6の場合と同様に、軽度の異常状態を示す値が1、中程度の異常状態を示す値が2、重度の異常状態を示す値が3であるとする。このような状態変化と重要度の対応は管理対象リソース24ごとに予め設定されているものとする。
状態値書込部231から読み出された第1の状態値が初期値0で、状態変化検知部241から出力された第2の状態値が2であれば、第2の状態値のほうが重要度大であると判定される(S215、Yes)。
このとき、状態値書込部231に書き込まれている第1の状態値(0)および第3の状態値(0)は、それぞれが第2の状態値(2)で書き換えられる(S216)。つまり、ステップS216の処理により、第1の状態値(2)および第3の状態値(2)となる。
外部からの指示またはそれ以外の要因による終了指示が無い限り(S218、No)、ステップS212の処理に戻る。
その後、ステップS212で異常状態が軽減された状態変化が検知され、ステップS213で第2の状態値(1)が出力されたとする。
このとき、ステップS214の処理では、状態値書込部231に書き込まれている第1の状態値(2)が読み出され、検知された第2の状態値(1)と重要度が比較される。
そして、ステップS215の判定では、第2の状態値は第1の状態値よりも重要度大ではないと判定される(S215、No)。
このように、状態値書込部231に書き込まれている第1の状態値の重要度が大の場合には、第1の状態値はそのまま維持される。そして、ステップS213で出力された第2の状態値が直近の時間に検知された状態値として、この第2の状態値で状態値書込部231の第3の状態値を書き換える(S217)。つまり、ステップS217の処理により、第1の状態値(2)および第3の状態値(1)となる。
また、その後のステップS212で、重度の異常状態の発生に起因する状態変化が検知され、ステップS213で第2の状態値(3)が出力されたとする。
このとき、ステップS214の処理では、状態値書込部231に書き込まれている第1の状態値(2)が読み出され、検知された第2の状態値(3)と重要度が比較される。
そして、ステップS215の判定では、第2の状態値のほうが第1の状態値よりも重要度大であると判定される(S215、Yes)。
このとき、状態値書込部231に書き込まれている第1の状態値(2)および第3の状態値(1)は、それぞれが第2の状態値(3)で書き換えられる(S216)。つまり、このときのステップS216の処理により、第1の状態値(3)および第3の状態値(3)となる。
このように、管理対象リソースの状態変化に対応する第2の状態値が出力されると、その時点で状態値書込部231に書き込まれている第1の状態値との重要度が比較され、重要度がより高い状態値が第1の状態値として書き換えられてゆく。また、第3の状態値は管理対象リソース24における直近の時間に発生した状態変化に対応する値として、状態変化検知部241が第2の状態値を出力する毎に書き換えられる。
そのため、参照される周期の間に多数の状態変化が発生したとしても全ての状態値を格納しておく必要はなく、重要度がより高い状態値だけを更新して格納することにより、監視データとしての重要な状態変化を見逃すことがない。また、第3の状態値は、第2の状態値を出力する毎に書き換えられるので、監視周期の直近の時間に発生した状態変化も見逃すことなく監視することができる。なお、上述したステップS214乃至S217は、状態値比較部242により実行される。
次に、監視装置30における監視の観点から、各装置間での処理動作の流れを説明する。
図8は、第2の実施形態のネットワーク装置20のSNMP要求の場合の動作例を示すシーケンス図である。
前提として、管理対象リソース24の状態値の重要度は状態値A<B<Cであり、且つ、既に状態値Bが、前述した第1の状態値として、状態値書込部231に書き込まれているものとする。そして、SNMPマネージャ31からのSNMP要求やSNMPエージェント21から状態値書込部231への定期ポーリングの間に、状態変化検知部241が状態変化を3回検知したものとする。
まず、監視装置30のSNMPマネージャ31から監視対象装置であるネットワーク装置20のSNMPエージェント21に対して、対象オブジェクトの監視情報を収集するためにSNMP要求が出される。
SNMPエージェント21は、SNMP要求に応答するために、指定された対象オブジェクトの監視情報を状態値書込部231から読み出す。この処理が、状態要求と状態応答で、状態値書込部231からはそのときに書き込まれている第1の状態値である状態値BがSNMPエージェント21に通知される。
SNMPエージェント21は、読み出した状態値BをSNMP応答としてSNMPマネージャ31に返送する(S301)。
一方、SNMPエージェント21による定期ポーリングが行われると、該定期ポーリングに対する状態応答として、状態値書込部231はそのときに書き込まれている状態値BをSNMPエージェント21に返送する(S302)。
この定期ポーリングが終わり、次の定期ポーリングが行われるまでの間に、状態変化が3回検知される。
最初の状態変化検出(S303)では、前述した第2の状態値として状態値Aが状態変化検知部241から出力される。状態値比較部242は、状態値書込部231に対して第1の状態値の読み出しを要求して状態値Bを取得する。そして、状態値比較部242は、第1の状態値である状態値Bと第2の状態値である状態値Aの重要度を比較する。比較の結果、第1の状態値である状態値Bの方が重要度大なので、第2の状態値である状態値Aは破棄される。
2回目の状態変化検出(S304)では、第2の状態値として状態値Cが状態変化検知部241から出力される。状態値比較部242は、状態値書込部231に対して第1の状態値の読み出しを要求して状態値Bを取得する。そして、状態値比較部242は、第1の状態値である状態値Bと第2の状態値である状態値Cの重要度を比較する。比較の結果、第2の状態値である状態値Cの方が重要度大なので、状態値書込部231に書き込まれている第1の状態値は、第2の状態値である状態値Cで書き換えられる。
3回目の状態変化検出(S305)では、第2の状態値として状態値Aが状態変化検知部241から出力される。状態値比較部242は、状態値書込部231に対して第1の状態値の読み出しを要求して状態値Cを取得する。そして、状態値比較部242は、第1の状態値である状態値Bと第2の状態値である状態値Aの重要度を比較する。比較の結果、第1の状態値である状態値Cの方が重要度大なので、第2の状態値である状態値Aは破棄される。
このような複数回の状態変化の検出処理が行われた後、SNMPエージェント21による次の周期の定期ポーリングが行われると、状態値書込部231はそのときに書き込まれている状態値CをSNMPエージェント21に返送する(S306)。
そして、SNMPマネージャ31から再度のSNMP要求が出されたとき、SNMPエージェント21は、状態値書込部231にそのときに書き込まれている状態値Cを取得してSNMPマネージャ31に通知する(S307)。
このように、SNMP要求や定期ポーリングの間に、A→C→Aと複数回の状態変化の検出があった場合でも、途中で検出した最も重要度が大の監視情報Cが漏れることなく監視装置30に通知される。
また、図7を参照して説明した変形例のような、直近の時間に発生した状態変化に対応する第3の状態値を導入した場合には、ステップS305で検出された状態値Aが第3の状態値として状態値書込部231に書き込まれる。つまり、第3の状態値はA→C→Aというように、検出された状態変化に対応する第2の状態値が出力されるたびに更新される。第3の状態値を導入することにより、監視周期の途中で検出された最も重要度が大の監視情報が通知されると同時に、現時点での状態を示す監視情報も通知することができる。
続いて、図9を参照してTrapの場合の動作例を説明する。
図9は、第2の実施形態のネットワーク装置のTrapの場合の動作例を示すシーケンス図である。
Trapは、SNMPエージェント21が自発的に自装置の状態をSNMPマネージャ31に通知する際に使用するコマンドである。ネットワーク装置の管理情報に所定の閾値を超える重要度の変化があった場合、SNMPエージェント21はTrapによりその変化情報をSNMPマネージャ31に通知する。
図8の場合の前提と同じく、管理対象リソース24の状態値の重要度は状態値A<B<Cであり、且つ、既に状態値Bが、第1の状態値として状態値書込部231に書き込まれているものとする。そして、SNMPエージェント21から状態値書込部231への定期ポーリングの間に、状態変化検知部241が状態変化を3回検知したものとする。そして、状態値Cを検出した場合がTrapを送出する条件になっているものとする。
まず、SNMPエージェント21による定期ポーリングが行われると、該定期ポーリングに対する状態応答として、状態値書込部231はそのときに書き込まれている状態値BをSNMPエージェント21に返送する(S311)。
この定期ポーリングが終わり、次の定期ポーリングが行われるまでの間に、状態変化が3回検知される。
最初の状態変化検出(S312)では、第2の状態値として状態値Aが状態変化検知部241から出力される。状態値比較部242は、状態値書込部231に対して第1の状態値の読み出しを要求して状態値Bを取得する。そして、状態値比較部242は、第1の状態値である状態値Bと第2の状態値である状態値Aの重要度を比較する。比較の結果、第1の状態値である状態値Bの方が重要度大なので、第2の状態値である状態値Aは破棄される。
2回目の状態変化検出(S313)では、第2の状態値として状態値Cが状態変化検知部241から出力される。状態値比較部242は、状態値書込部231に対して第1の状態値の読み出しを要求して状態値Bを取得する。そして、状態値比較部242は、第1の状態値である状態値Bと第2の状態値である状態値Cの重要度を比較する。比較の結果、第2の状態値である状態値Cの方が重要度大なので、状態値書込部231に書き込まれている第1の状態値は、第2の状態値である状態値Cで書き換えられる。
3回目の状態変化検出(S314)では、第2の状態値として状態値Aが状態変化検知部241から出力される。状態値比較部242は、状態値書込部231に対して第1の状態値の読み出しを要求して状態値Cを取得する。そして、状態値比較部242は、第1の状態値である状態値Cと第2の状態値である状態値Aの重要度を比較する。比較の結果、第1の状態値である状態値Cの方が重要度大なので、第2の状態値である状態値Aは破棄される。
このような複数回の状態変化の検出処理が行われた後、SNMPエージェント21による次の周期の定期ポーリングが行われると、状態値書込部231はそのときに書き込まれている状態値CをSNMPエージェント21に返送する(S315)。
そして、SNMPエージェント21は、取得した状態値CがTrapの送信条件であることを判定すると、この状態値CをSNMPマネージャ31にTrapにより通知する(S316)。
このように、定期ポーリングの間に、A→C→Aと複数回の状態変化の検出があった場合でも、監視周期の途中で検出した最も重要度が大の監視情報CがTrapにより監視装置30に通知される。
また、図7を参照して説明した変形例のような、直近の時間に発生した状態変化に対応する第3の状態値を導入してもかまわない。この場合は、ステップS314で検出された状態値Aが第3の状態値として状態値書込部231に書き込まれる。つまり、第3の状態値はA→C→Aというように、検出された状態変化に対応する第2の状態値が出力されるたびに更新される。第3の状態値を導入することにより、現時点での状態を示す監視情報を含めて、監視周期の途中で検出された最も重要度が大の監視情報を通知することができる。
このように、本実施形態では、管理対象リソースの状態変化を検知し、その状態変化に対応する状態値(第2の状態値)が出力されると、その時点で状態値書込部に書き込まれている状態値(第1の状態値)との重要度を比較する。重要度の比較結果に基づき、重要度がより高い状態値が第1の状態値として書き換えられてゆく。つまり、本実施形態によれば、状態値書込部に書き込まれている状態値は、SNMPエージェントから周期的に監視データとして参照されるが、参照される周期の間に多数の状態変化が発生したとしても全ての状態値を格納しておく必要はない。
そのため、検知した全ての状態値を記録することなく、重要度がより高い状態値だけを更新して格納することにより、小さなサイズのバッファ構成であっても監視データとしての重要な状態変化はSNMPマネージャに確実に通知される。
さらに、第3の状態値を導入すれば、第3の状態値は管理対象リソースにおける直近の時間に発生した状態変化に対応する値として、状態変化検知部が第2の状態値を出力する毎に書き換えられる。そのため、監視周期の直近の時間に発生した状態変化も見逃すことなく監視することができる。
以上に説明したように、本実施形態では、SNMPエージェントの監視周期の途中で発生する、頻度の高い状態値変化における監視対象の最重要変化値を確実にSNMPマネージャに通知することができる。
10、11、20 ネットワーク装置
21 SNMPエージェント
22 MIB
23 管理対象オブジェクト
24 管理対象リソース
30 監視装置
31 SNMPマネージャ
40 IPネットワーク
101、121、231 状態値書込部
102 状態値比較手段
103 状態変化検知手段
111 CPU
112 主記憶部
113 補助記憶部
114 通信制御部
115 表示部
116 入力部
122 状態値書込機能手段
123 状態値比較機能手段
124 状態変化検知機能手段
241 状態変化検知部
242 状態値比較部

Claims (10)

  1. 管理対象リソースにおける状態変化に対応し、監視対象として所定のタイミングで参照される第1の状態値が書き込まれる状態値書込部と、
    前記管理対象リソースにおける状態変化の発生を検知し、該検知した変化に対応する第2の状態値を出力する状態変化検知手段と、
    前記状態変化検知手段が前記第2の状態値を出力すると、前記状態値書込部に書き込まれている前記第1の状態値を読み出し、前記第1の状態値と前記第2の状態値を比較し、前記第2の状態値が、前記管理対象リソースにおいて前記第1の状態値よりも重要度が高い状態変化を示す場合、前記第1の状態値を前記第2の状態値で書き換える状態値比較手段と
    を備え、
    前記状態変化検知手段は、前記状態値書込部が参照される前記所定のタイミングの間に少なくとも2回の前記管理対象リソースにおける状態変化の発生を検知することを特徴とするネットワーク装置。
  2. 前記状態値書込部には、管理対象リソースにおける直近の時間に発生した状態変化に対応する第3の状態値が更に書き込まれ、前記状態値比較手段は、前記状態変化検知手段が前記第2の状態値を出力する毎に、前記第3の状態値を直近の時間に出力された前記第2の状態値で書き換えることを特徴とする請求項1に記載のネットワーク装置。
  3. SNMP(Simple Network Management Protocol)エージェント手段を更に備え、
    前記SNMPエージェント手段は、周期的に前記状態値書込部を参照し、前記第1の状態値が所定の閾値を超えた場合に、SNMPマネージャ手段を備えた監視装置に該第1の状態値をTrap通知することを特徴とする請求項1または請求項2に記載のネットワーク装置。
  4. 前記SNMPエージェント手段は、SNMPマネージャ手段を備えた前記監視装置が指示するSNMP要求に対して、周期的に前記状態値書込部を参照し、該状態値書込部に書き込まれている状態値を前記監視装置にSNMP応答通知することを特徴とする請求項3に記載のネットワーク装置。
  5. 管理対象リソースにおける状態変化に対応する状態値を、監視対象として所定のタイミングで参照される第1の状態値として状態値書込部に書込み、
    前記管理対象リソースにおける状態変化の発生を検知し、該検知した変化に対応する第2の状態値を出力し、
    前記第2の状態値が出力されると、前記状態値書込部に書き込まれている前記第1の状態値を読み出して、前記第1の状態値と前記第2の状態値を比較し、
    前記第2の状態値が、前記管理対象リソースにおいて前記第1の状態値よりも重要度が高い状態変化を示す場合、前記第1の状態値を前記第2の状態値で書き換え、
    前記管理対象リソースにおける状態変化の発生は、前記状態値書込部が参照される前記所定のタイミングの間に少なくとも2回検知されることを特徴とするリソース監視方法。
  6. 管理対象リソースにおける直近の時間に発生した状態変化に対応する第3の状態値を前記状態値書込部に更に書き込み、
    前記第2の状態値を出力する毎に、前記第3の状態値を直近の時間に出力された前記第2の状態値で書き換えることを特徴とする請求項5に記載のリソース監視方法。
  7. SNMP(Simple Network Management Protocol)エージェント手段が周期的に前記状態値書込部を参照し、
    前記第1の状態値が所定の閾値を超えた場合に、SNMPマネージャ手段を備えた監視装置に該第1の状態値をTrap通知する
    ことを特徴とする請求項5または請求項6に記載のリソース監視方法。
  8. 前記SNMPエージェント手段が、SNMPマネージャ手段を備えた前記監視装置が指示するSNMP要求に対して、周期的に前記状態値書込部を参照し、
    該状態値書込部に書き込まれている状態値を前記監視装置にSNMP応答通知する
    ことを特徴とする請求項7に記載のリソース監視方法。
  9. コンピュータを、
    管理対象リソースにおける状態変化に対応し、監視対象として所定のタイミングで参照される第1の状態値を状態値書込部に書き込む状態値書込機能手段と、
    前記管理対象リソースにおける状態変化の発生を検知し、該検知した変化に対応する第2の状態値を出力する状態変化検知機能手段と、
    前記状態変化検知機能手段が前記第2の状態値を出力すると、前記状態値書込部に書き込まれている前記第1の状態値を読み出し、前記第1の状態値と前記第2の状態値を比較し、前記第2の状態値が、前記管理対象リソースにおいて前記第1の状態値よりも重要度が高い状態変化を示す場合、前記第1の状態値を前記第2の状態値で書き換える状態値比較機能手段
    として機能させ、
    前記状態変化検知機能手段は、前記状態値書込部が参照される前記所定のタイミングの間に少なくとも2回の前記管理対象リソースにおける状態変化の発生を検知することを特徴とするプログラム。
  10. 前記状態値書込部には、管理対象リソースにおける直近の時間に発生した状態変化に対応する第3の状態値が更に書き込まれ、前記状態値比較機能手段は、前記状態変化検知機能手段が前記第2の状態値を出力する毎に、前記第3の状態値を直近の時間に出力された前記第2の状態値で書き換えることを特徴とする請求項9に記載のプログラム。
JP2015110136A 2015-05-29 2015-05-29 ネットワーク装置、リソース監視方法およびプログラム Active JP6507858B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015110136A JP6507858B2 (ja) 2015-05-29 2015-05-29 ネットワーク装置、リソース監視方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015110136A JP6507858B2 (ja) 2015-05-29 2015-05-29 ネットワーク装置、リソース監視方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2016225806A true JP2016225806A (ja) 2016-12-28
JP6507858B2 JP6507858B2 (ja) 2019-05-08

Family

ID=57748043

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015110136A Active JP6507858B2 (ja) 2015-05-29 2015-05-29 ネットワーク装置、リソース監視方法およびプログラム

Country Status (1)

Country Link
JP (1) JP6507858B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020120737A1 (en) * 2001-02-27 2002-08-29 Martin Hamish Donald Stuart Network management apparatus and method for processing events associated with device reboot
JP2010205234A (ja) * 2009-03-06 2010-09-16 Nec Corp 監視システム、ネットワーク機器、監視情報提供方法およびプログラム
JP2014178842A (ja) * 2013-03-14 2014-09-25 Mitsubishi Electric Corp ネットワーク装置及び状態変化通知方法
JP2015230674A (ja) * 2014-06-06 2015-12-21 日本電気株式会社 管理対象装置、管理装置及びネットワーク管理システム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020120737A1 (en) * 2001-02-27 2002-08-29 Martin Hamish Donald Stuart Network management apparatus and method for processing events associated with device reboot
JP2010205234A (ja) * 2009-03-06 2010-09-16 Nec Corp 監視システム、ネットワーク機器、監視情報提供方法およびプログラム
JP2014178842A (ja) * 2013-03-14 2014-09-25 Mitsubishi Electric Corp ネットワーク装置及び状態変化通知方法
JP2015230674A (ja) * 2014-06-06 2015-12-21 日本電気株式会社 管理対象装置、管理装置及びネットワーク管理システム

Also Published As

Publication number Publication date
JP6507858B2 (ja) 2019-05-08

Similar Documents

Publication Publication Date Title
JP6160064B2 (ja) 適用判定プログラム、障害検出装置および適用判定方法
CN110830283B (zh) 故障检测方法、装置、设备和系统
US10936386B2 (en) Method, device and computer program product for monitoring access request
JP4811830B1 (ja) コンピュータリソース制御システム
JP2012521607A (ja) 分散アプリケーションの監視
CN112468361A (zh) 一种网络连接状态监控方法、装置及电子设备和存储介质
CN113724100B (zh) 一种分布式集群的电网监控告警消息处理方法
US10664335B2 (en) System and method for maintaining the health of a machine
CN109766198B (zh) 流式处理方法、装置、设备及计算机可读存储介质
CN109474470A (zh) 一种自监控方法和装置
WO2022033586A1 (zh) 一种消息发送方法及装置
CN112860504A (zh) 监控方法及装置、计算机存储介质、电子设备
US10282245B1 (en) Root cause detection and monitoring for storage systems
CN112559565A (zh) 一种异常检测方法、系统及装置
US10223189B1 (en) Root cause detection and monitoring for storage systems
CN115687026A (zh) 多节点服务器故障预警方法、装置、设备及介质
JP6507858B2 (ja) ネットワーク装置、リソース監視方法およびプログラム
JP2012247937A (ja) 情報処理装置、ログ記憶制御プログラムおよびログ記憶制御方法
US10268375B2 (en) Methods for proactive prediction of disk failure in the disk maintenance pipeline and devices thereof
TWI469573B (zh) 系統錯誤處理方法與使用其之伺服器系統
JP2016057658A (ja) 障害情報管理システムおよび障害情報管理方法
CN114296979A (zh) 一种检测物联网设备异常状态的方法及装置
US9898357B1 (en) Root cause detection and monitoring for storage systems
CN110955579A (zh) 一种基于Ambari的大数据平台的监测方法
CN110879774B (zh) 一种网元性能数据告警方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180413

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190228

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190305

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190318

R150 Certificate of patent or registration of utility model

Ref document number: 6507858

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150