JP6418377B2 - 管理対象装置、管理装置及びネットワーク管理システム - Google Patents

管理対象装置、管理装置及びネットワーク管理システム Download PDF

Info

Publication number
JP6418377B2
JP6418377B2 JP2014117746A JP2014117746A JP6418377B2 JP 6418377 B2 JP6418377 B2 JP 6418377B2 JP 2014117746 A JP2014117746 A JP 2014117746A JP 2014117746 A JP2014117746 A JP 2014117746A JP 6418377 B2 JP6418377 B2 JP 6418377B2
Authority
JP
Japan
Prior art keywords
trap
management
transmission
information
snmp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014117746A
Other languages
English (en)
Other versions
JP2015230674A (ja
Inventor
昇輝 林
昇輝 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2014117746A priority Critical patent/JP6418377B2/ja
Publication of JP2015230674A publication Critical patent/JP2015230674A/ja
Application granted granted Critical
Publication of JP6418377B2 publication Critical patent/JP6418377B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、ネットワークに接続された通信機器をネットワーク経由で監視、制御する技術に関する。
ネットワークに接続された通信機器をネットワーク経由で監視、制御するための通信プロトコルとしてSNMP(Simple Network Management Protocol)がある。SNMPでは、管理する側の装置をSNMPマネージャと呼び、管理される側の装置をSNMPエージェントと呼ぶ。SNMPマネージャは例えばLinux(登録商標)サーバ、Microsoft Windows(登録商標)サーバ等のサーバに実装される。SNMPエージェントは同様にサーバに実装され、更に、ルータ、スイッチ等のネットワーク機器等にも実装される。
SNMPエージェントを実装した機器において状態に変化が発生すると、SNMPエージェントはSNMPマネージャに対し、その変化に関するメッセージを自発的に送信する。このメッセージをトラップと呼ぶ。トラップには、障害の発生を通知するもの、障害からの復旧を通知するもの、その他様々な状態変化の発生を通知するもの等がある。
トラップの送信に関する発明が特許文献1に記載されている。同文献に記載の通信装置は、管理装置へのトラップの送信状況を表すトラップ送信状況情報と、トラップの種別とに応じて管理装置へのトラップの送信を停止する。
特開2014−78115号公報
特許文献1によれば、管理対象装置及び管理装置の現在の負荷状態を考慮せずにトラップ送信を行う。このため、管理対象装置及び管理装置に現に高い負荷がかかっている状態であってもトラップ送信を行う。その結果、高負荷状態にある装置に更に負荷が追加されるので、その装置で実行中の他の処理に影響を及ぼす恐れがある。
また、特許文献1によれば、管理装置や管理対象装置において、実行すれば高い負荷状態になることが事前に予想できる処理や、実行する際に他の処理の実行を極力控えるべき処理をこれから実行するといった状況にあっても、そうした状況を考慮することなく、トラップ送信を行う。
本発明はこのような状況に鑑みてなされたものであり、本発明が解決しようとする課題は、管理対象装置及び管理装置の処理負荷が高い状況にあるとき、或いは、更に処理負荷が発生するのを回避したい状況にあるときに、緊急性の低いトラップの送信を抑止するネットワーク管理システムと、そうしたネットワーク管理システムを実現する管理装置、管理対象装置を提供することである。
上述の課題を解決するため、本発明は、その一態様として、管理装置とネットワークを介して接続され、自装置の状態に係る情報である管理情報を、ネットワークを介して管理装置に送信するための手段を備え、管理装置または自装置の現在の状態または動作の予定を監視して、管理装置または自装置が現に高負荷状態にあること、または、予定された動作を開始することを検出するための監視手段を備え、管理情報は、少なくとも管理装置に通知する緊急性に基づいて複数の種別に分類され、監視手段による検出結果に応じて、予め定められた種別の管理情報の管理装置への送信を抑止する処理である、送信抑止処理を実行する管理対象装置を提供する。
また、本発明は、他の一態様として、コンピュータを管理対象装置として機能させるためのプログラムであって、管理装置とネットワークを介して接続され、自装置の状態に係る情報であり、少なくとも管理装置に通知する緊急性に基づいて複数の種別に分類される情報である管理情報を、ネットワークを介して管理装置に送信するための手段、管理装置または自装置の現在の状態または動作の予定を監視して、管理装置または自装置が現に高負荷状態にあること、または、予定された動作を開始することを検出するための監視手段、監視手段による検出結果に応じて、予め定められた種別の管理情報の管理装置への送信を抑止する処理である、送信抑止処理を実行する手段として、コンピュータを機能させるプログラムを提供する。
また、本発明は、他の一態様として、管理対象装置とネットワークを介して接続されて、管理対象装置の状態に係る情報である管理情報を、ネットワークを介して受信するための手段を備え、自管理装置の現在の状態または動作の予定を監視して、自管理装置が現に高負荷状態にあること、または、予定された動作を開始することを検出する監視手段を備え、管理情報は、少なくとも管理装置に通知する緊急性に基づいて複数の種別に分類され、予め定められた種別の管理情報の管理装置への送信を抑止する処理である、送信抑止処理を管理対象装置に実行させるために、監視手段による検出結果を管理対象装置に送信する手段を備える管理装置を提供する。
また、本発明は、他の一態様として、管理装置と、管理装置とネットワークを介して接続されて、管理装置による管理の対象となる管理対象装置とを備え、管理対象装置の状態に係る情報である管理情報を、管理対象装置から管理装置にネットワークを介して送信し、管理装置または管理対象装置の現在の状態または動作の予定を監視して、管理装置または管理対象装置が現に高負荷状態にあること、または、予定された動作を開始することを検出する監視手段を備え、管理情報は、少なくとも管理装置に通知する緊急性に基づいて複数の種別に分類され、監視手段による検出結果に応じて、予め定められた種別の管理情報の管理装置への送信を抑止する処理である、送信抑止処理を管理対象装置は実行するネットワーク管理システムを提供する。
本発明によれば、管理情報を緊急性の有無により分類し、管理対象装置或いは管理装置の処理負荷が高い或いは高くなることが予想される状況では、管理対象装置は緊急性の低い管理情報を管理装置に送信するのを抑止する。このため、管理対象装置、或いは、管理装置の処理負荷が高いとき、或いは、高くなることが予想される状況にあるとき、緊急性の低い管理情報を転送するために処理負荷が発生するのを回避することができる。
本発明の一実施の形態であるネットワーク管理システム1の構成と、SNMPエージェント2の構成を説明するためのブロック図である。 SNMPマネージャ3の構成を説明するためのブロック図である。 トラップ管理部23の動作を説明するためのフローチャートである。 トラップ管理部23によるトラップ送信イベント処理を説明するためのフローチャートである。 トラップ管理部23による障害発生トラップ送信処理を説明するためのフローチャートである。 トラップ管理部23による情報トラップ送信処理を説明するためのフローチャートである。 トラップ管理部23による障害復旧トラップ送信処理を説明するためのフローチャートである。 トラップ管理部23によるタイムアウトイベント処理を説明するためのフローチャートである。 トラップ管理部23によるタイムアウトイベント処理を説明するためのフローチャートである。 設定ファイル(xxxxx.ini)91の一例である。 トラップログファイル(trap.log)92の一例である。 トラップ送信結果ファイル(trap_result.log)93の一例である。 ダイジェストトラップ94の一例である。 SNMPマネージャi(iは1≦i≦mの自然数)のタイムアウトイベント表95の例である。 SNMPマネージャを2機としたネットワーク管理システム1の一動作例における、SNMPエージェント2からのトラップ送信頻度の時間変化を示すグラフである。 SNMPマネージャを2機としたネットワーク管理システム1の一動作例における、SNMPマネージャ3−1の動作状態の遷移について説明するための図である。 SNMPマネージャを2機としたネットワーク管理システム1の一動作例における、SNMPマネージャ3−2の動作状態の遷移について説明するための図である。 抑止トラップ一覧99の一例を示す図である。 障害状態一覧100の一例を示す図である。 トラップID個別情報一覧101の一例を示す図である。 SNMPエージェント2のMIB102の一例を示す図である。 SNMPエージェント2の閾値更新通知103を構成する要素について説明するための図である。 トラップ管理部23による閾値更新イベント処理について説明するためのフローチャートである。 図23の閾値更新イベント処理のステップS104-5について更に説明するためのフローチャートである。
本発明の一実施の形態であるネットワーク管理システム1について説明する。図1を参照すると、ネットワーク管理システム1は、SNMP(Simple Network Management Protocol)エージェント2、SNMPマネージャ3−1、3−2、…、3m(mは自然数)を備える。SNMPエージェント2は、インターネット、LAN(Local Area Network)等のデータ通信ネットワークを介して、SNMPマネージャ3−1、3−2、…、3mのそれぞれとデータ通信可能に接続されている。
(SNMPエージェントの構成)
SNMPエージェント2は、機能部21−1、21−2、…、21−n(nは自然数)、タイマ通知部22、トラップ管理部23、トラップ送信部24、FTP(File Transfer Protocol)サーバ25、SNMPデーモン26、SNMPエージェント状態監視部27、記憶装置28を備える。
機能部21−1、21−2、…、21−nは、トラップ送信が必要になると、トラップ送信通知をトラップ管理部23に通知する。
タイマ通知部22は、トラップ送信頻度監視間隔Tに設定された間隔ごとに、トラップ管理部23に、タイムアウト通知を通知する。トラップ送信頻度監視間隔Tは後述する設定ファイル91に設定される。
トラップ管理部23は、トラップ送信通知とタイムアウト通知を受けて、トラップ送信通知をトラップ送信部24に通知する。トラップ送信通知やタイムアウト通知を受けた際のトラップ管理部23の処理フローについては後述する。
トラップ送信部24は、トラップ送信通知を受けとると、SNMPマネージャ3−1、3−2、…、3m宛てにトラップを送信し、後述するトラップ送信結果ファイル93に送信結果を書き込む。
FTPサーバ25は、後述するトラップログファイル92、トラップ送信結果ファイル93を、SNMPマネージャ3−1、3−2、…、3mに送信する。
SNMPデーモン26は、SNMPマネージャ3−1、3−2、…、3mから送信されるMIB get及びMIB setを受け付ける。MIB(Management Information Base)は、SNMPで管理されるネットワーク機器が、自分の状態を外部に知らせるために公開する管理情報である。MIB getはSNMPマネージャ3−1、3−2、…、3mがSNMPエージェント2に対して管理情報MIBの送信を要求するコマンドである。MIB setはSNMPマネージャ3−1、3−2、…、3mがSNMPエージェント2に対して管理情報MIBとして指定した値の設定を要求するコマンドである。
SNMPマネージャ3−1、3−2、…、3mにおいて、例えばバッチ処理の実行や終了等により負荷の遷移が生じた場合、或いは、例えばスケジューリングされたバッチ処理等により負荷の遷移が予想される場合、或いは、例えばバッチ処理を実行中のため新たな負荷の発生を極力回避したい状況にある場合等に、該当するSNMPマネージャは、トラップ送信イベント発生率の閾値の更新を指示するMIB setをSNMPエージェント2に送信する。SNMPデーモン26はこうしたMIB setを受信する。MIB setを受信したSNMPデーモン26は閾値更新通知をトラップ管理部23に送信する。トラップ送信イベント発生率の閾値に関するMIBについては後述する。
SNMPエージェント状態監視部27は、SNMPエージェント2が、バッチ処理の実行や終了等によって負荷の遷移が発生した場合、或いは、例えばスケジューリングされたバッチ処理等により負荷の遷移が予想される場合、或いは、例えばバッチ処理を実行中のため新たな負荷の発生を極力回避したい状況にある場合等に、閾値更新通知をトラップ管理部23に送信する。閾値更新通知はトラップ送信イベント発生率の閾値の更新をSNMPエージェント2に指示する。
負荷の遷移の検出は、例えば、SNMPエージェント状態監視部27がトラップ管理部23として動作するCPU(Central Processing Unit)のCPU使用率を測定し、予め定めたCPU使用率の閾値と比較して、CPU使用率がその閾値を超えたとき、処理負荷が高いと検出することが考えられる。逆に、処理負荷が高い状態から通常の状態に遷移したことは、測定したCPU使用率がその閾値よりも低くなったとき、処理負荷が通常に戻ったと検出することが考えられる。CPU使用率の代わりにメモリ使用率を用いる場合も同様である。
スケジューリングされた処理の実行を事前に検出することは、例えば、バッチ処理等の実行開始時刻が記述されたスケジューラの設定ファイルを記憶装置28に格納しておき、SNMPエージェント状態監視部27がその設定ファイルを参照して、そこに記述された実行開始時刻と現在時刻とを比較することにより、検出することが考えられる。
記憶装置28は、後述する設定ファイル91、トラップログファイル92、トラップ送信結果ファイル93、タイムアウトイベント表95、抑止トラップ一覧99、障害状態一覧100、トラップID個別情報一覧101、SNMPエージェント2のMIB(Management Information Base)102等を格納する記憶装置である。記憶装置28は単体の記憶装置により構成されてもよいし、複数の記憶装置により構成されてもよい。また、ここではSNMPエージェント2が備える記憶装置として説明するが、SNMPエージェント2からアクセス可能なネットワーク上の記憶装置であってもよい。
(SNMPマネージャの構成)
次に、SNMPマネージャ3−1、3−2、…、3mについて図2を参照して説明する。これらのSNMPマネージャは基本的に同じ構成を有する。ここでは、代表してSNMPマネージャ3−1を挙げて説明する。
SNMPマネージャ3−1は、MIB操作部3−1−1、トラップ受信部3−1−2、FTPクライアント3−1−3、トラップ解析部3−1−4、SNMPマネージャ状態監視部3−1−5、画面表示部3−1−6を備える。
MIB操作部3−1−1は、SNMPマネージャ状態監視部3−1−5から閾値更新通知を受け、SNMPエージェント2に対してMIB setを送信する。また、SNMPエージェント2の状態監視のため、MIB get を行うことにより管理情報MIBをSNMPエージェント2から取得する。
トラップ受信部3−1−2は、SNMPエージェント2のトラップ送信部24から送信されたトラップを受信し、トラップ解析部3−1−4にトラップ解析要求を送信する。トラップ解析要求は、受信したトラップの情報をトラップ解析部3−1−4に通知すると共に、トラップ解析部3−1−4に対し、その情報に基づいて解析を行う旨の指示をするものである。
FTPクライアント3−1−3は、SNMPマネージャ3−1がダイジェストトラップを受け取ったときや、トラップ抜けを検知したときに、SNMPエージェント2からトラップログファイル92、トラップ送信結果ファイル93を取得するために用いる。トラップ抜けは、SNMPエージェント2にて各トラップに設定されたシーケンス番号が連続しているかどうかのチェックを、SNMPマネージャ3−1にて行うことによって確認する。
トラップ解析部3−1−4は、トラップ受信部3−1−2から受けたトラップ解析要求を解析し、画面表示部3−1−6に画面表示要求を送信する。また、FTPクライアント3−1−3に対して送信要求を行う。送信要求は、トラップログファイル92またはトラップ送信結果ファイル93の送信をSNMPエージェント2に対して要求するものである。
SNMPマネージャ状態監視部3−1−5はSNMPマネージャ3−1を監視する。SNMPマネージャ3−1において、バッチ処理の実行や終了等による負荷の遷移が発生した場合、或いは、例えばスケジューリングされたバッチ処理等により負荷の遷移が予想される場合、或いは、例えばバッチ処理を実行中のため新たな負荷の発生を極力回避したい状況にある場合等に、SNMPマネージャ状態監視部3−1−5は閾値更新通知をMIB操作部3−1−1に送信する。閾値更新通知はトラップ送信イベント発生率の閾値の更新をSNMPエージェント2に指示する。
画面表示部3−1−6は、トラップ解析部3−1−4からの画面表示要求に応じて、トラップ解析部3−1−4での解析結果を表示する。
(トラップ管理部12の処理フロー)
トラップ管理部23の動作について図3を参照して説明する。SNMPマネージャトラップ頻発フラグf1〜fmを初期化してオフにする。個別トラップ頻発フラグftrapIDを初期化してオフにする。トラップ抑止間隔数現在値K1〜Kmを初期化してゼロにする(ステップS21)。トラップ管理部23がイベント通知を受信(ステップS22)し、そのイベント通知がタイムアウト通知の場合(ステップS23でYES)、トラップ管理部23はタイムアウトイベント処理を行う(ステップS24)。イベント通知がトラップ送信通知の場合(ステップS25でYES)、トラップ送信イベント処理を行う(ステップS26)。イベント通知が閾値更新通知の場合(ステップS27でYES)、閾値更新イベント処理を行う(ステップS28)。タイムアウトイベント処理、トラップ送信イベント処理、閾値更新イベント処理についてはそれぞれ後述する。
(トラップ送信イベント処理)
図3ステップS26のトラップ送信イベント処理について図4を参照して説明する。トラップ管理部23はトラップIDに基づいてトラップの種別を判定する(ステップS32)。
ネットワーク管理システム1では、トラップを緊急性の高いものと低いものに分類し、緊急性の高いトラップについてはSNMPエージェント2/SNMPマネージャ3−1〜3−mの処理負荷に関わらず、即座にSNMPエージェント2からSNMPマネージャ3−1〜3−mに送信する。一方、緊急性の低いトラップについてはSNMPエージェント2/SNMPマネージャ3−1〜3−mの処理負荷が高い場合には送信を抑止する。これにより、SNMPエージェント2/SNMPマネージャ3−1〜3−mの処理負荷が高いときに、緊急性の低いトラップを送信することによって、SNMPエージェント2/SNMPマネージャ3−1〜3−mの処理負荷を更に高くしてしまうのを回避する。
このような考え方の元、ネットワーク管理システム1では、トラップを3つの分類、即ち、障害発生トラップ、障害復旧トラップ、情報トラップのいずれかに分類する。障害発生トラップは、SNMPエージェント2で障害が発生したことをSNMPマネージャ3−1〜3−mに通知するためのトラップである。障害復旧トラップは、SNMPエージェント2で発生した障害が復旧したことをSNMPマネージャ3−1〜3−mに通知するためのトラップである。障害発生トラップ、障害復旧トラップは、いずれも、緊急性が高いトラップとして位置付けられている。一方、情報トラップは、障害発生トラップ、障害復旧トラップ以外のトラップであり、緊急性の低いトラップとして位置付けられている。
トラップの種別が障害発生トラップの場合、トラップ管理部23は障害発生トラップ送信処理を行う(ステップS33)。トラップの種別が情報トラップの場合、トラップ管理部23は情報トラップ送信処理を行う(ステップS34)。トラップの種別が障害復旧トラップの場合、トラップ管理部23は障害復旧トラップ送信処理を行う(ステップS35)。それぞれの処理が終了すると、トラップ管理部23は、トラップのシーケンス番号現在値に1を加算する(ステップS36)。
シーケンス番号とは、トラップ管理部23がトラップ送信部24に対してトラップの送信を指示する際、トラップ毎に付与する番号であり、1トラップを送信するごとに1つずつ加算していく番号である。ステップS36で1を加算されたシーケンス番号は、次にトラップ送信部24が送出するトラップに付与される。その結果、トラップ送信部24が送出するトラップには、そのトラップを送出した順序に応じたシーケンス番号が付与される。トラップのSNMPメッセージフォーマットにおいてシーケンス番号を格納するためのフィールドを新たに定義してもよいし、既存のフィールド或いはその一部を流用することとしてもよい。
次に、障害発生トラップ送信処理、情報トラップ送信処理、障害復旧トラップ送信処理の詳細について続いて説明する。
(障害発生トラップ送信処理)
図4ステップS33の障害発生トラップ送信処理について図5を参照して説明する。トラップ管理部23は、記憶装置28に格納されている障害状態一覧100の障害状態欄に、シーケンス番号の記載があるか否かをレコード毎に判定する(ステップS41)。障害状態一覧100は、障害発生トラップのトラップID、障害復旧トラップのトラップID、障害発生トラップのシーケンス番号をフィールドとするテーブルである。
シーケンス番号の記載がある場合(41の判定がYESの場合)は、障害が過去に発生し復旧していない状態で、再度、障害発生を通知するTrapの送信処理が行われていることを示す。このとき、トラップID個別情報一覧101の重複トラップ抑止フラグをチェックする(ステップS43)。
重複トラップ抑止フラグがOffのときはトラップ送信処理を続行する。重複トラップ抑止フラグがOnのときは、トラップ送信を抑止するので、抑止トラップ一覧99のALL SNMPマネージャの欄に、抑止するTrapのシーケンス番号を記載する(ステップS46)。
障害状態一覧100の障害状態欄に、シーケンス番号の記載がない場合(ステップS41の判定がNOの場合)は、新たに障害が発生したことを意味するので、障害状態一覧100の障害状態欄に、シーケンス番号を記載する(ステップS42)。次に、トラップ送信処理を続行し、トラップID個別情報一覧101のトラップ送信頻度を1加算する(ステップS44)。
次に、トラップID個別情報一覧101の個別トラップ頻発フラグをチェックする(ステップS45)。個別トラップ頻発フラグがOffのときはSNMPマネージャ3−1〜3−mに対するトラップ送信通知をトラップ送信部24に通知する(ステップS47、S48)。
ステップS45の判定において個別トラップ頻発フラグがOnのときは、抑止トラップ一覧99のALL SNMPマネージャの欄に、抑止するトラップのシーケンス番号を記載する(ステップS46)。
ステップS46、S48の後、トラップ情報をトラップログファイル(Trap.log)に書き出す(ステップS49)。
(情報トラップ送信処理)
図4ステップS34の情報トラップ送信処理について図6を参照して説明する。まず、トラップID個別情報一覧101のトラップ送信頻度を1加算する(ステップS51)。次に、SNMPマネージャの数mだけ、トラップ頻発フラグfiの値の判定を行う(ステップS53)。
ステップS53でトラップ頻発フラグfiがOnの場合、そのSNMPマネージャに対するトラップ送信を抑止する。また、抑止トラップ一覧99の該当するSNMPマネージャの欄に、抑止したトラップのシーケンス番号を記載する(ステップS55)。
ステップS53でトラップ頻発フラグfiの値の判定がOffの場合、トラップID個別情報一覧101の個別トラップ頻発フラグをチェックする(ステップS54)。
個別トラップ頻発フラグがOffの場合、SNMPマネージャ3−1〜3−mに対するトラップ送信通知をトラップ送信部24に通知する(ステップS56)。
個別トラップ頻発フラグがOnの場合、抑止トラップ一覧99で、該当するSNMPマネージャの欄に、抑止するトラップのシーケンス番号を記載する(ステップS55)。
ステップS55、S56の後、トラップ情報をトラップログファイル (Trap.log) に書き出す処理を行う(ステップS57)。
(障害復旧トラップ送信処理)
図4ステップS35の障害復旧トラップ送信処理について図7を参照して説明する。
トラップ管理部23は、記憶装置28から障害状態一覧100を読み出して、障害状態一覧100の障害状態欄に、復旧可能なシーケンス番号の記載があるかどうかを判定する(ステップS61)。
復旧可能とは、その障害復旧トラップのトラップIDが障害状態一覧100の障害復旧トラップのトラップID欄に記載されており、かつ、障害状態欄に、シーケンス番号が記載されていることを示す。
障害状態一覧100の障害復旧欄には、1つの障害について、つまり、1つの障害発生トラップのトラップIDに対応して、複数の障害復旧トラップのトラップIDが示されている場合がある。これは、1つの障害発生に対して複数の復旧方法があること、言い換えると、記載されたどれか1つの障害復旧トラップの送信処理(ステップS35)内でのシーケンス番号削除の処理(ステップS62)で復旧することを示す。或いは、発生した1つの障害を復旧するためには、複数種類の障害復旧トラップの送信処理(ステップS35)を全て行う必要があることを示す。
複数種類全ての障害復旧トラップの送信処理を行うと障害が復旧する場合、全ての障害復旧トラップ送信処理(ステップS35)が行われるタイミング、即ち、最後の障害復旧トラップのトラップ送信処理(ステップS35)内でのシーケンス番号削除の処理(ステップS62)が行われたタイミングで、障害復旧となる。このため、それ以前の障害復旧トラップのトラップ送信処理のタイミングでは、復旧可能なシーケンス番号の記載なしの処理ルートで処理を行う。
また、1つの障害復旧トラップIDで、複数の障害を解除するケースもあるので、復旧可能なシーケンス番号の記載があるかどうかの判定(ステップS61)は、障害状態一覧100の障害状態欄に、どれか1種類の障害でも、復旧可能なシーケンス番号の記載があるかどうかを意味する。
復旧可能なシーケンス番号の記載がない場合(ステップS61の判定がNOの場合)は、トラップID個別情報一覧101の重複トラップ抑止フラグをチェックする(ステップS63)。重複トラップ抑止フラグがOffのときはトラップ送信処理を続行する。重複トラップ抑止フラグOnのときは、トラップ送信を抑止するので、抑止トラップ一覧99のALL SNMPマネージャの欄に、抑止するトラップのシーケンス番号を記載する(ステップS66)。
復旧可能なシーケンス番号の記載がある場合(ステップS61の判定がYESの場合)は、障害が過去に発生し復旧していない状態で、障害復旧を通知するトラップの送信処理が行われていることを示す。このとき、障害が復旧したことを意味するので、障害状態一覧100のうち、復旧させる障害全てについて、障害状態欄のシーケンス番号を削除する(ステップS62)。
次に、トラップ送信処理を続行し、トラップID個別情報一覧101のトラップ送信頻度を1加算(ステップS64)して、トラップID個別情報一覧101の個別トラップ頻発フラグをチェックする(ステップS65)。
個別トラップ頻発フラグがOffの場合、SNMPマネージャ3−1〜3−mに対するトラップ送信通知をトラップ送信部24に通知する(ステップS67、S68)。個別トラップ頻発フラグがOnの場合、抑止トラップ一覧99のALL SNMPマネージャの欄に、抑止するトラップのシーケンス番号を記載する(ステップS66)。
ステップS66、S68の後、トラップ情報をトラップログファイル(Trap.log)に書き出す。
(タイムアウトイベント処理)
図3ステップS24のタイムアウトイベント処理について図8、図9を参照して説明する。
最初に、トラップ送信が抑止された最後のシーケンス番号である、抑止シーケンス番号最終値を、記憶装置28の抑止トラップ一覧99に記載する(ステップS71)。次に、トラップID個別情報一覧101に記載された全てのトラップIDについて、個別トラップ頻発フラグ f TrapID の更新処理を行う。(ステップS72)。
個別トラップ頻発フラグ f TrapID の更新処理では、それぞれのトラップIDについて、トラップ送信頻度監視間隔Tあたりのトラップ送信頻度(トラップ個別情報一覧101に記載された情報)を、1分間あたりのトラップの発生頻度P TrapIDに変換したものと、トラップ送信通知の発生率の閾値(トラップ個別情報一覧101に記載された情報)を比較する(ステップS74)。
閾値を超えた場合は、個別トラップ頻発フラグ f TrapIDをOnにする(ステップS76)。閾値を超えていない場合は、個別トラップ頻発フラグ f TrapIDをOffにする(ステップS75)。閾値が”-”の場合は処理を行わない。この場合、個別トラップ頻発フラグ f TrapID は初期値であるOffのままとする。
個別トラップ頻発フラグ f TrapID の更新処理が終わると、SNMPマネージャ3−i(iは1≦i≦mの自然数)のそれぞれについてタイムアウトイベント処理を行う(ステップS77、S78)。ステップS78は、図14に記載のSNMPマネージャiのタイムアウトイベント表95に従って処理を行う。この処理では、SNMPマネージャごとのトラップ送信イベント発生率の閾値を、越えているかどうかを示す、SNMPマネージャトラップ頻発フラグfi の値の更新を行う。
図9のステップS81からS84はダイジェストトラップ送信に関連した処理である。なお、ダイジェストトラップに記載する内容は、抑止トラップ一覧99に記載されている情報である。抑止トラップ一覧99に、抑止されたトラップのシーケンス番号の記載があるかどうかを判定する(ステップS81)。記載がない場合は、ダイジェストトラップの送信は行わない。記載がある場合は、抑止トラップ一覧99の内容を元にダイジェストトラップの内容を整形する(ステップS82)。即ち、抑止トラップ一覧99から所定の一部情報を抽出し、抽出した情報に基づくトラップとして、ダイジェストトラップを生成する。
ステップS83、S84では、全てのSNMPマネージャへのダイジェストトラップを送信するために、トラップ送信通知をトラップ送信部24に通知する。ステップS84にてダイジェストトラップのトラップ送信通知が終わったら、トラップID個別情報一覧101と抑止トラップ一覧99の更新処理を行う(ステップS85)。具体的には、トラップID個別情報一覧101のトラップ送信通知実行回数をクリアする。また、抑止トラップ一覧99のシーケンス番号記載をクリアする。更に、抑止シーケンス番号開始値に、抑止シーケンス番号最終値に1加算した値を代入する。
(設定ファイル91)
図10の設定ファイル(xxxxx.ini) 91の内容の例を参照して、設定ファイル91について説明する。設定ファイル91は記憶装置28に格納されている。
トラップ送信頻度監視間隔Tは、タイマ通知部22がタイムアウト通知を送信する間隔を示す。
SNMPエージェント2は、SNMPエージェント2の処理負荷に応じて各SNMPマネージャに情報トラップに送信する。情報トラップの送信の要否を判定する際、トラップ管理部23は、<SNMPエージェント>の欄、[トラップ送信イベント発生率の閾値]の欄に記載の閾値V_conf_agentを用いて判定を行う。SNMPマネージャ毎の判定、及び、全SNMPマネージャについての一律の判定の両方に閾値V_conf_agentを用いる。SNMPエージェントの閾値とSNMPマネージャごとの閾値の両方を比較して、値の小さい方を閾値として採用する。
<SNMPマネージャ No.1>、…、<SNMPマネージャ No.m>は、それぞれ、SNMPマネージャ3−1、…、3−mに対応する設定情報である。本明細書では、SNMPマネージャ3−1、…、3−mを、それぞれ、SNMPマネージャ1、2、…、mと記載する場合もある。それぞれ、[トラップ送信先IPアドレス]、[トラップ送信イベント発生率の閾値]、[トラップ送信抑止時間]の欄を有する。
[トラップ送信先IPアドレス]の欄に記載の11.11.11.11,…,mm.mm.mm.mmは、それぞれ、SNMPマネージャ3−1〜3−mのIPアドレスである。
[トラップ送信イベント発生率の閾値]の欄に記載のV_conf_1〜V_conf_mは、それぞれ、情報トラップ抑止を行うかどうかを決めるための閾値である。この閾値はSNMPマネージャごとに個別に設定される。実際に情報トラップ抑止を行うかどうかは、このSNMPマネージャごとの閾値と、SNMPエージェントの閾値を比較して、より小さい値の方を閾値として採用することで、判定する。
[トラップ送信抑止時間]欄に記載のN1×T〜Nm×Tは、それぞれ、SNMPマネージャ3−1〜3−m宛の情報トラップの送信を抑止する時間の長さを表す。iを1≦i≦mの自然数とすると、Ni×Tとは、SNMPマネージャ3−i宛の全種別のトラップの送信頻度が、閾値の判定値V_iを超えたときに、SNMPマネージャ3−i宛の情報トラップの送信を抑止する時間の長さである。
ここで、閾値の判定値V_iの値としては、設定ファイル91に記載した2つの閾値、V_conf_iとV_conf_agentのうち小さい方の値を初期値として用いる。つまり、SNMPマネージャ毎に定められた閾値V_conf_iと、全SNMPマネージャに対して一律に定められた閾値V_conf_agentのうち、小さい方を初期値として用いる。その後、図24に示すトラップ管理部23での閾値更新イベント処理フローその2のステップS105内の処理により、閾値の判定値V_iを更新する。
トラップ抑止時間N1×T〜Nm×Tを経過しても全トラップのトラップ送信頻度が閾値の判定値V_1〜V_mを越えている場合は、さらに、トラップ抑止時間N1×T〜Nm×Tの間、情報トラップの抑止を行う。
[トラップID]欄は、トラップの識別子であり、SNMPマネージャに通知したい障害発生の種類、情報の種類、障害復旧の種類を示す。
[種別]欄は、トラップを障害発生トラップ、情報トラップ、障害復旧トラップのいずれかに分類したときに当てはまる分類を示す。
[トラップ送信通知の発生率の閾値]欄は、それぞれのトラップIDごとに、トラップ送信頻度監視間隔Tで、トラップ送信処理が何回発生するかを監視し、トラップ送信処理の発生率が高い場合は、そのトラップIDについて、トラップ送信を抑止するために設定されている。”-”の場合は、トラップ送信の抑止はしない。
[重複トラップ抑止フラグ]欄は、そのトラップIDが重複して発生したときに、抑止を行うかどうかを示す。例えば、障害発生トラップであるトラップID10000が10回連続で発生し、その間に、トラップID10000の障害を復旧させるトラップであるトラップID70000が一度も発生していなかったとする。この場合、重複トラップ抑止フラグをOnにすると、トラップID10000の1回目の発生では、トラップ送信処理を行い、2回目以降の発生、即ち、残り9回の発生ではトラップ送信処理を行わない。
[障害復旧トラップID]欄は、障害状態について、どの障害復旧トラップIDの発生で復旧するかを示す。1つの障害(障害発生トラップのトラップID)について、複数の障害復旧トラップのトラップIDが示されていることがあるが、これは、1つの障害発生に対して、複数の復旧方法があること、つまり、記載されたどれか1つの障害復旧トラップの送信処理(ステップS35)におけるシーケンス番号削除の処理(ステップS62)で復旧することを示す。或いは、数種類の障害復旧トラップの送信処理(ステップS35)を全て行うことで障害が復旧することを示す。数種類全ての障害復旧トラップの送信処理を行うと障害が復旧する場合、全ての障害復旧トラップ送信処理(ステップS35)が行われるタイミング、即ち、最後の障害復旧トラップのトラップ送信処理(ステップS35)において、シーケンス番号削除の処理(ステップS62)が行われたタイミングで、障害復旧となる。
(トラップログファイル92)
図11に示したトラップログファイル(Trap.log)92の例を参照して、トラップログファイル92について説明する。トラップログファイル92は記憶装置82に格納されている。
トラップログファイル92は、各トラップのログ情報を記載したファイルである。この例では、シーケンス番号(sequence number)1、2、…、100、…、150のトラップの送信が記録されている。
図11において、シーケンス番号100は、個別トラップ頻発フラグにより、全てのSNMPマネージャへのトラップ送信が抑止されたトラップである。また、シーケンス番号150は、SNMPマネージャトラップ頻発フラグfiにより、SNMPマネージャ 22.22.22.22へのトラップ送信が抑止されたトラップである。
(トラップ送信結果ファイル93)
図12に示した例を参照して、トラップ送信結果ファイル(trap_result.log)93について説明する。トラップ送信結果ファイル93は記憶装置28に格納される。
トラップ送信結果ファイル93は、各トラップの送信の成否を記録するファイルである。この例では、シーケンス番号1(sequence number:1)のトラップに関して、SNMPマネージャ11.11.11.11, 22.22.22.22, …, mm.mm.mm.mmへの送信に成功したこと(transmission result: OK)が記録されている。また、シーケンス番号2のトラップに関して、SNMPマネージャ11.11.11.11への送信に成功した一方、SNMPマネージャ22.22.22.22への送信に失敗したこと(transmission result: NG (link down))が記録されている。
トラップログファイル92とトラップ送信結果ファイル93を分けている理由は、SNMPエージェント2の処理が重くなって、トラップ送信部24でトラップ送信するのに時間がかかり、トラップ送信通知を保持しておくキューがあふれる場合や、トラップ送信用のポートがリンクダウンしている場合などに、トラップ送信部24がトラップ送信しなかったことを確認するためである。本来送るはずだったトラップ情報のみを記載したトラップログファイル(Trap.log)92と、トラップ送信部の成否を記載したトラップ送信結果ファイル(Trap_result.log)93の両方を比較することにより、どのSNMPマネージャにどんなトラップを送信したのか把握することができる。
(ダイジェストトラップ94)
図13の例に基づいて、ダイジェストトラップ94について説明する。
ダイジェストトラップ94は、障害発生トラップ、情報トラップ、障害復旧トラップの送信が抑止されたたときに、SNMPエージェント2のトラップ送信部24からSNMPマネージャ3−1〜3−mのトラップ受信部3−1−2、…、3−m−2に送信される。
ダイジェストトラップ94には、トラップ抑止により送信されなかったトラップのシーケンス番号が記載されている。一方で、トラップログファイル92には、シーケンス番号とトラップの中身の対応関係が記載されている。このため、SNMPマネージャ3−1〜3−mの保守者は、トラップ受信部3−1−2、…、3−m−2経由で受信したダイジェストトラップ94と、FTPクライアント3−1−3、…、3−m−3経由で取得したトラップログファイル92とを照合することにより、抑止されたトラップの中身を確認することができる。
図13の例では、送信頻度監視間隔Tの間に、SNMPエージェント2がシーケンス番号100〜200の一部送信を抑止したこと(Some traps out of seq 100-200 are not sent)、送信抑止したシーケンス番号は100,101,105,106,…であること(ALL: 100,101,105,106,…)、IPアドレス22.22.22.22のSNMPマネージャに対し、シーケンス番号150-200の送信を抑止したこと(22.22.22.22: 150-200)が記載されている。なお、シーケンス番号106の後を、「…」としているのは、ダイジェストトラップの中身として…が記載されるということではなく、例として記載したため、106以降の番号の記載を省略しただけである。
(タイムアウトイベント表95)
図14は、SNMPマネージャiのタイムアウトイベント表95である。これは、図8の処理フロー内の、「SNMPマネージャi のタイムアウトイベント処理を行う」(ステップS78)で参照される。
(トラップ数グラフ例96)
図15のトラップ数グラフ例96は、1機のSNMPエージェント2と、2機のSNMPマネージャ3−1、3−2からなるネットワーク管理システム1における、トラップ送信頻度(単位時間当たりのトラップ数)の時間変化の一例を表したグラフである。トラップ送信頻度監視間隔T=10(秒)、SNMPマネージャの総数n=2、SNMPマネージャ3−1のトラップ送信抑止時間N1×T、SNMPマネージャ3−2のトラップ送信抑止時間N2×Tである。
トラップ送信頻度監視間隔Tごとに直前の区間における送信頻度を調べて、閾値との比較を行う。送信頻度が閾値を超える場合には、その時点で、全トラップのトラップ送信頻度が閾値を超えたと判断する。トラップ抑止は、その時刻から、トラップ抑止時間N1×TまたはN2×Tの間、トラップ頻発フラグf1またはf2をonにすることで行われる。
(SNMPマネージャ1の状態例97)
図16は、1機のSNMPエージェント2と、2機のSNMPマネージャ3−1、3−2からなるネットワーク管理システム1における、SNMPマネージャ3−1の状態の例を示している。また、図17は、そのネットワーク管理システム1における、SNMPマネージャ3−2の状態の例を示している。いずれの場合も、トラップ送信頻度監視間隔T=10(秒)、SNMPマネージャの総数n=2、SNMPマネージャ3−1のトラップ送信抑止時間の係数N1=2、SNMPマネージャ3−2のトラップ送信抑止時間の係数N2=3とする。
(抑止トラップ一覧99)
図18の例に基づいて抑止トラップ一覧99について説明する。抑止トラップ一覧99は記憶装置28に格納される。トラップ管理部23は、トラップ送信頻度監視間隔Tごとに、抑止トラップ一覧99に格納された値をクリアして更新する。
抑止シーケンス番号開始値は、ある監視周期の周期内で、最初に出力されたトラップのシーケンス番号を示す。
抑止シーケンス番号最終値は、ある監視周期の周期内で、最後に出力されたトラップのシーケンス番号を示す。
ALL SNMPマネージャの欄は、ある監視周期の周期内において、トラップID個別情報一覧101の個別トラップ頻発フラグがOnであることにより抑止されたトラップのシーケンス番号を示す。
SNMPマネージャの欄(「SNMPマネージャ11.11.11.11」、「SNMPマネージャ22.22.22.22」、…、「SNMPマネージャmm.mm.mm.mm」)は、それぞれ、ある監視周期の周期内において、対応するSNMPマネージャを宛先とする情報トラップのうち、送信が抑制されたもののシーケンス番号を示す。SNMPマネージャ3−i(iは1≦i≦mの自然数)を宛先とする情報トラップの送信は、SNMPマネージャトラップ頻発フラグfiがOnであることにより抑止される。SNMPマネージャトラップ頻発フラグfiは、SNMPマネージャ3−iのトラップ送信イベント発生率の閾値を、越えているかどうかを示すフラグである。
(障害状態一覧100)
図19の例に基づいて障害状態一覧100について説明する。
トラップ管理部23は、設定ファイル91の中から、[種別]が1(障害発生)であるトラップIDを取得して、障害状態一覧100のある行の障害発生の欄に予め格納する。同様に、そのトラップIDの[障害復旧トラップID]に記載のトラップIDを取得して、障害状態一覧100の同じ行の障害復旧の欄に予め格納する。これにより、障害状態一覧100は、障害発生トラップのトラップIDと、その障害から復旧するために必要な障害復旧トラップのトラップIDとを互いに関連付けて一覧として記憶する。
障害状態一覧100の右端にある障害状態の欄は、障害が現に発生しているか否かを示す。同じ行の障害発生欄のトラップIDが示す障害が現に発生している場合、トラップ管理部23は、障害状態一覧100の障害発生欄に、最初に発生した障害発生トラップのシーケンス番号を記載する。同じトラップIDの障害発生トラップが複数回発生し、その障害に対応する障害復旧トラップが発生していない場合、最初に発生した障害発生トラップのシーケンス番号が記載されたままとなる。その障害に対する障害復旧トラップが発生した場合、トラップ管理部23は、障害発生欄からシーケンス番号を削除する。このような動作により、障害状態一覧100の障害発生欄を参照すると、現に発生中の障害の有無と、そのトラップID、その障害からの復旧に必要な障害復旧トラップのトラップIDを取得することができる。
障害状態一覧100の障害復旧欄では、1つの障害(障害発生トラップのトラップID)について、複数の障害復旧トラップのトラップIDが示されていることがある。これは、ひとつには、1つの障害発生に対して複数の復旧方法が存在する場合があるからである。この場合、記載されたどれか1つの障害復旧トラップの送信処理(ステップS35)内でのシーケンス番号削除の処理(ステップS62)で復旧する。また、ひとつには、数種類の障害復旧トラップの送信処理(ステップS35)を全て行うことで障害が復旧する場合があるからである。
(TrapID個別情報一覧101)
図18は、トラップID個別情報一覧101である。トラップID欄、種別欄、トラップ送信通知の発生率の閾値欄、重複トラップ抑止フラグ欄は、設定ファイル(xxxxx.ini)91から取得される。トラップ送信通知の発生率の閾値、重複トラップ抑止フラグの説明は図9設定ファイル(xxxxx.ini)91の説明を参考のこと。
図20の例を参照してトラップID個別情報一覧101について説明する。トラップID個別情報一覧101には、左の欄から順に、トラップID欄、種別欄、トラップ送信通知の発生率の閾値欄、重複トラップ抑止フラグ欄、トラップ送信頻度欄、個別トラップ頻発フラグ欄がある。
これらの欄のうち、トラップID欄、種別欄、トラップ送信通知の発生率の閾値欄、重複トラップ抑止フラグ欄の値については、トラップ管理部23が設定ファイル91から取得した値を予め格納する。設定ファイル91の[トラップID]欄ごとの値を[障害復旧トラップID]の値を除いて、同じ行の対応する欄に格納する。
一方、トラップ送信頻度欄には、あるトラップ送信頻度監視周期の周期内に、そのトラップIDのトラップ送信処理(ステップS33またはS34またはS35)が発生した回数をトラップ管理部23が格納する。尚、トラップ管理部23は、トラップ送信頻度監視間隔Tごとのタイムアウト処理により、トラップ送信頻度欄の値をクリアする。
また、個別トラップ頻発フラグ欄には、トラップIDごとに、1つ前のトラップ送信頻度監視周期でのトラップ送信頻度が、トラップ送信通知の発生率の閾値を越えていたかどうかを示すフラグをトラップ管理部23が格納する。閾値を超えていた場合、トラップ管理部23は個別トラップ頻発フラグをOnにし、閾値以下の場合、トラップ管理部23は個別トラップ頻発フラグをOffにする。
(MIB)
図21の例に基づいてSNMPエージェント2のMIB102について説明する。MIB102は、トラップ送信イベント発生率の閾値に関するMIB(Management Information Base)であり、閾値更新関連MIBとも呼ぶものとする。閾値更新関連MIBは記憶装置28に格納される。
MIB102は、SNMPマネージャ3−1〜3−mのMIB操作部3−1−1〜3−m−1のそれぞれから、SNMPエージェント2のSNMPデーモン26に対して、MIB setによって通知される、トラップ送信イベント発生率の閾値を、SNMPマネージャごとに保持する。
SNMPマネージャ3−1〜3−mのそれぞれにおいて、SNMPマネージャ状態監視部3−i−5は、SNMPマネージャ3−iの状態を監視し、処理負荷が高負荷から低負荷へ、或いは逆に、低負荷から高負荷へ遷移すると、MIB操作部3−i−1を介して、SNMPエージェント2にMIB setを送信する。iは1≦i≦mの自然数である。このMIB setは、トラップ送信イベント発生率の更新をSNMPエージェント2に対して指示するためのものである。
SNMPエージェント2では、このMIB setを受信すると、SNMPデーモン26はトラップ管理部23に閾値更新通知を送信する。この閾値更新通知に基づいて、トラップ管理部23は、記憶装置28のMIB102に保持されている、トラップ送信イベント発生率の閾値を更新する。
尚、SNMPエージェント2は、MIB102の他にもMIBを保持してよい。
(閾値更新通知)
図22を参照して閾値更新通知の構成について説明する。SNMPエージェント2において、トラップ管理部23は、閾値更新通知に応じて、フラグV_flag_info及び閾値V_change_infoを更新する。閾値更新通知は、対象、フラグ、閾値の3つの要素を備える。閾値更新通知は、SNMPエージェント状態監視部27に由来するものと、SNMPマネージャ状態監視部3−i−5に由来するものがある。どちらの由来であっても3つの要素を備える点では同じだが、各要素の値に違いがある。
SNMPエージェント状態監視部27に由来する閾値更新通知は、SNMPエージェント状態監視部27により生成され、トラップ管理部23に直接通知される。このときの閾値更新通知では、対象はSNMPエージェントであり、フラグはV_flag_info_agentであり、閾値はV_change_info_agentである。
SNMPマネージャ状態監視部3−i−5に由来する閾値更新通知は、SNMPマネージャ状態監視部3−i−5からの指示により、MIB操作部3−i−1がSNMPコマンドMIB setとしてSNMPデーモン26に通知される。このMIB setに応じて、SNMPデーモン26は、対象はSNMPマネージャiであり、フラグはV_flag_info_iであり、閾値はV_change_info_iである閾値更新通知をトラップ管理部23に通知する。
(閾値更新イベント処理フロー)
図23を参照してトラップ管理部23での閾値更新イベント処理フローについて説明する。この処理は図3のステップS28に対応する。
まず最初に、閾値更新通知の要素「対象」を参照して、その閾値更新通知の対象がSNMPエージェント2か、SNMPマネージャiなのかを判定する(ステップS104-1)。
ステップS104-1にて対象がSNMPエージェント2であると判定した場合、閾値更新通知内のフラグV_flag_info_agentを、V_flag_agentに代入する。また、閾値更新通知内の閾値V_change_info_agentを、V_change_agentに代入する(ステップS104-2)。変数V_flag_agent、V_change_agentについては後述する。この後、SNMPマネージャ3−1〜3−mに対する閾値判定値 V_1〜V_mを設定する(ステップS104-4、S104-5)。ステップS104-5については後述する。
ステップS104-2にて登場した変数について説明する。
V_flag_agentはフラグであり、設定ファイル91の閾値(V_conf_agent)、及び、閾値更新通知内の閾値(V_change_info_agent)のどちらをSNMPエージェントの閾値として用いるのかを指定する。SNMPエージェントについての前回の閾値更新通知のフラグV_flag_info_agentをこの変数に保存しておく。SNMPエージェント2を起動する時にoffで初期化される。
V_change_agentは閾値である。SNMPマネージャ3−1〜3−mの閾値判定値V_1〜 V_mを設定する際、SNMPエージェント2の閾値として、SNMPマネージャ3−iの閾値と比較される。
一方、ステップS104-1にて対象がSNMPマネージャiであると判定した場合、閾値更新通知内のフラグV_flag_info_iをV_flag_iに代入する。また、閾値更新通知内の閾値V_change_info_iをV_change_iに代入する(ステップ104-3)。変数V_flag_i、V_change_iについては後述する。その後、SNMPマネージャ3−iに対する閾値判定値V_iを設定する(ステップS104-5)。
V_flag_iはフラグであり、設定ファイル91の閾値(V_conf_i)、及び、更新通知内の閾値(V_change_info_i)のどちらをSNMPマネージャ3−iの閾値として用いるのかを指定する。SNMPマネージャ3−iについての前回の閾値更新通知のフラグV_flag_info_iをこの変数に保存しておく。SNMPエージェント2を起動する時にoffで初期化される。
V_change_iは閾値である。SNMPマネージャ3−iの閾値V_iの設定をする際、SNMPマネージャ3−iの閾値として、SNMPエージェントの閾値と比較される。
(閾値更新イベント処理フロー ステップS104-5)
図24を参照して、ステップS104-5について更に説明する。
V_flag_agent=onかつV_flag_i=onのとき(ステップS105-1)、V_change_agentとV_change_iのうち、小さいものをV_iに設定する(ステップS105-2)。
V_flag_agent=onかつV_flag_i=offのとき(ステップS 105-3)、V_change_agentとV_conf_iのうち、小さいものをV_iに設定する(ステップS 105-4)。
V_flag_agent=offかつV_flag_i=onのとき(ステップS 105-5)、V_conf_agentとV_change_iのうち、小さいものをV_iに設定する(ステップS 105-6)。
V_flag_agent=offかつV_flag_i=offのとき(ステップS 105-7)、V_conf_agentとV_conf_iのうち、小さいものをV_iに設定する(ステップS 105-8)。
(SNMPエージェント2の処理負荷の遷移に応じたネットワーク管理システム1の動作)
ネットワーク管理システム1の動作について説明する。まず、SNMPエージェント2の処理負荷の遷移に応じた動作について説明する。
SNMPエージェント2を起動した時、トラップ管理部23は、SNMPマネージャ3−iに対するトラップ送信イベント発生率の閾値判定値V_iを次のように定める。即ち、設定ファイル91に記載されている2つの閾値、V_conf_iとV_conf_agentとを比較して、小さい方を閾値判定値V_iの初期値とする。
SNMPエージェント状態監視部27は、SNMPエージェント2の処理負荷を監視している。処理負荷とは、例えば、トラップ管理部23がCPU(Central Processing Unit)であるときのCPU使用率や、そのCPUが利用するメインメモリのメモリ使用率である。
SNMPエージェント2がパーソナルコンピュータ、ワークステーション等のコンピュータであり、CPUが例えばトラップ管理部23として機能する場合、CPUはトラップ管理部23として動作するだけではなく、他の様々なプログラム、例えば各種のサーバプログラム、クライアントプログラムを実行する手段としても動作する。同様に、SNMPマネージャ3−i(iは1≦i≦mの任意の自然数)がコンピュータであり、そのCPUが例えばトラップ解析部3−i−4、SNMPマネージャ状態監視部3−i−5として動作する場合、こうした処理と共に、他のプログラムを実行する手段としても動作する。処理負荷の大きいプログラムを実行する際には、CPU使用率、メモリ使用率は大きくなる。
また、指定したプログラムを指定した時刻に開始する、所謂スケジューラに一乃至複数のプログラムを登録して、SNMPエージェント2、SNMPマネージャ3−iとして動作するコンピュータに実行させる場合がある。例えば、データバックアップ、各種の更新プログラムやデータの定期的なダウンロード、OS(Operating System)や各種プログラムのアップデート等を、深夜等の他の利用がない時間帯に一括して実行する、バッチ処理を指定時刻に実行する場合がある。このような処理を実行するとき、スケジュールした処理すべてを所望の時間内に完了するために、緊急性の低い処理の実行を避けて、コンピュータリソースを登録処理にできるだけ集中させようとする要望がある。
こうした要望をかなえるため、ネットワーク管理システム1では、SNMPエージェント2、SNMPマネージャ3−1〜3mにおける現在の処理負荷と、予定されている処理の有無をSNMPエージェント状態監視部27、SNMPマネージャ状態監視部3−1−5〜3−m−5に実行させて、現在の処理負荷が予め定められた処理負荷よりも大きいとき、或いは、他の処理の実行をできるだけ回避しつつ目的の処理を実行したい時間帯になる直前になると、これらの状態監視部は、閾値更新通知をトラップ管理部23に通知する。
トラップ管理部23は、SNMPエージェント3−1〜3−mに対する情報トラップ抑止の閾値判定値V_1〜V_mを、次の4種類の変数に基づいて決定する。
・SNMPエージェント状態監視部27から受信した閾値更新通知の閾値V_change_info_agnet
・SNMPマネージャ3−1〜3−mのフラグV_flag_1〜V_flag_m(設定ファイルの閾値を使うか、SNMPマネージャから通知された閾値を使うか判定する際に参照するフラグ)
・SNMPマネージャから通知された閾値V_change_1〜V_change_n
・設定ファイルに記載された閾値V_conf_1〜V_conf_n
V_flag_1〜V_flag_mがOnであるSNMPマネージャについては、トラップ管理部23は、そのSNMPマネージャの閾値としてそのSNMPマネージャから通知された閾値V_change_1〜V_change_nを、V_change_info_agnetと比較し、小さい方を 、情報トラップ抑止の閾値判定値V_1〜V_nに設定する。
V_flag_1〜V_flag_mがOffとなっているSNMPマネージャは、SNMPマネージャの閾値として、設定ファイルに記載された閾値V_conf_1〜V_conf_mをV_change_info_agnetと比較し、小さい方を、情報トラップ抑止の閾値判定値V_1〜V_mに設定する。
トラップ管理部23は、閾値判定値V_1〜V_mの更新をおこなった後、次のタイムアウトイベント処理で、トラップ送信頻度が、閾値判定値V_1〜V_mを超えているかどうかを判定する。トラップ送信頻度が閾値判定値を超えていた場合、トラップ管理部23は、以後の情報トラップの送信を抑止する。障害発生トラップ、障害復旧トラップの送信はそのまま行う。
SNMPエージェント状態監視部27は、予定したバッチ処理の完了や、高負荷な処理の終了等により、SNMPエージェント2の処理負荷が小さくなったことを検出すると、フラグV_flag_info_agentの値がOffになっている閾値更新通知をトラップ管理部23に送付する。これを受けて、トラップ管理部23は、SNMPエージェント2の閾値を、デフォルトの値(設定ファイルの値)に戻し、情報トラップを含むすべてのトラップを通常通りに送信する。
(SNMPマネージャ3−1〜3−mの処理負荷の遷移に応じた動作)
次に、SNMPマネージャ3−1〜3−mの処理負荷の遷移に応じたネットワーク管理システム1の動作について説明する。ここでは、SNMPマネージャ3−1にて処理負荷の遷移が発生したものとして説明する。
SNMPマネージャ状態監視部3−1−5が、SNMPマネージャ3−1によるバッチ処理の開始時、または、SNMPマネージャ3−1のCPU使用率(例えば、SNMPマネージャ状態監視部3−1−5、トラップ解析部3−1−4として機能するCPUの使用率)が高いと判断したとき、メモリ使用率が高い(例えば、SNMPマネージャ状態監視部3−1−5、トラップ解析部3−1−4として機能するCPUがアクセスするメモリの使用率)と判断したときに、閾値更新通知をMIB操作部3−1−1に通知する。閾値更新通知にはフラグ(On)と閾値を設定しておく。
MIB操作部3−1−1は、SNMPコマンドMIB setにより、閾値更新通知に設定されたフラグ、閾値をSNMPエージェント2に通知する。
SNMPエージェント2では、SNMPデーモン26がMIB setに応じて図21に図示したような閾値更新関連MIBを更新する。これを受けて、SNMPデーモン26はトラップ管理部23に閾値更新通知を送る。
このときの閾値更新通知の要素は、対象がSNMPマネージャ1であり、フラグはOn(V_flag_info_1 の値がOn)であり、閾値はV_change_info_1である。トラップ管理部23は、SNMPマネージャ3−1に対する情報トラップ抑止の閾値判定値V_1を、以下4つを元に決定する。
・SNMPデーモン26から受信した閾値更新通知の閾値V_change_info_1
・SNMPエージェント2のフラグV_flag_agent(設定ファイル91の閾値を使うか、SNMPエージェント状態監視部27から通知された閾値を使うか判定するもの)
・SNMPエージェント状態監視部27から通知された閾値V_change_agent
・設定ファイル91に記載された閾値 V_conf_agent
V_flag_agentがOnとなっている場合、SNMPエージェント状態監視部27から通知された閾値V_change_agentをV_change_info_1と比較し、小さい方を、情報トラップ抑止の閾値判定値V_1に設定する。
V_flag_info_agentがOffとなっている場合、設定ファイル91に記載された閾値V_conf_agentをV_change_info_1と比較し、小さい方を、情報トラップ抑止の閾値判定値V_1に設定する。
トラップ管理部23は、閾値判定値V_1の更新を行った後、次のタイムアウトイベント処理で、トラップ送信頻度が、閾値判定値V_1を超えているかどうかを判定する。トラップ送信頻度が閾値判定値を超えていた場合、トラップ管理部23は、情報トラップの送信を抑止する。障害発生トラップ、障害復旧トラップの送信はそのまま行う。
SNMPマネージャ3−1が、予定したバッチ処理を完了したり、高負荷処理を終了したことをSNMPマネージャ状態監視部3−1−5が検出すると、SNMPマネージャ状態監視部3−1−5は、フラグの値をOffにした閾値更新通知をMIB操作部3−1−1に送付する。これを受けて、MIB操作部3−1−1は、SNMPエージェント2の閾値更新関連MIBの更新を指示するためのMIB setをSNMPデーモン26に送信する。これを受けて、SNMPデーモン26はフラグの値をOffにした閾値更新通知をトラップ管理部23に通知する。トラップ管理部23は、閾値更新通知に応じてフラグをOffにする。
(ネットワーク管理システム1の動作状態と各種ファイル等の値の例)
あるトラップ送信周期の間に、シーケンス番号100〜200番のトラップの送信通知の処理が、トラップ管理部23で行われたとする。シーケンス番号100,101,105,106,…は、個別トラップ頻発フラグにより、全てのSNMPマネージャ3−1〜3−mへのトラップ送信が抑止されたトラップとする。シーケンス番号150〜200は、SNMPマネージャトラップ頻発フラグfiにより、SNMPマネージャ3−2(IPアドレス22.22.22.22)へのトラップ送信が抑止されたトラップとする。なお、シーケンス番号106の後を、「…」としているのは、106以降の番号の記載を省略したものである。
設定ファイル91(xxxxx.ini)の値はこのときのものである。
トラップログファイル92(Trap.log)の値はこのときのものである。
トラップ送信結果ファイル93(Trap_result.log)の値はこのときのものである。ステップS71において、抑止シーケンス番号最終値を取得し、抑止トラップ一覧に記載し、抑止シーケンス番号最終値として200を記載してから、ステップS85において、抑止シーケンス番号開始値を取得し、抑止トラップ一覧に記載するまでの間の状態を示している。
ダイジェストトラップ94の値はこのときのものである。ステップS71において、抑止シーケンス番号最終値を取得し、抑止トラップ一覧に記載し、抑止シーケンス番号最終値として200を記載した後、ステップS84の処理によって送信されるダイジェストトラップの内容を示している。
抑止トラップ一覧99の値はこのときのものである。シーケンス番号106の後を、「…」としているのは、抑止トラップ一覧の中身として「…」が記載されるということではなく、例として記載したため、106以降の番号の記載を省略しただけである。
障害状態一覧100の値はこのときのものである。トラップID:10001 の障害がシーケンス番号10のトラップで発生し、未復旧である状態を示している。トラップID:10000の障害と、トラップID:10002の障害は復旧していることを示している。トラップID個別情報一覧101の値はこのときのものである。
(全トラップのトラップ送信頻度が閾値を超えたときの情報トラップの送信抑止)
ネットワーク管理システム1において、全トラップのトラップ送信頻度が閾値を超えたときの、情報トラップの送信の抑止と、ダイジェストトラップの送信について、図15、図16、図17を参照して説明する。
トラップ送信頻度監視間隔Tはタイマ通知部22がタイムアウト通知を送信する間隔であり、ここではT=10(秒)とする。mはSNMPマネージャの総数を表し、ここではm=2とする。N1はSNMPマネージャ3−1宛の情報トラップの送信を抑止する時間の長さを求めるための係数であり、ここではN1=2とする。N2はSNMPマネージャ3−2宛の情報トラップの送信を抑止する時間の長さを求めるための係数であり、ここではN2=3とする。Pはトラップ送信頻度を表す。尚、どの時間帯でも障害発生トラップ、障害復旧トラップの送信は抑止されない。
時刻0〜10はP<V_1<V_2である。SNMPエージェント2は、SNMPマネージャ3−1、SNMPマネージャ3−2のどちらにも情報トラップを送信している。
時刻10では、SNMPマネージャ3−1は状態Vであり、SNMPマネージャ3−2は状態Vである。
時刻10〜20は、直前の10秒間(時刻0〜10)がP<V_1<V_2だったので、SNMPエージェント2は、SNMPマネージャ3−1、3−2の両方に情報トラップを送信する。
時刻20では、SNMPマネージャ3−1は状態Vから状態VIIに移行し、SNMPマネージャ3−2は状態Vから状態VIIに移行する。
時刻20〜30は、直前の10秒間(時刻10〜20)がV_1<V_2<Pだったので、SNMPエージェント2は、SNMPマネージャ3−1、3−2のどちらにも情報トラップを送信しない(送信を抑止する)。
時刻30では、SNMPマネージャ3−1は状態VIIから状態IIIに移行し、SNMPマネージャ3−2は状態VIIから状態IIIに移行する。直前の10秒間でトラップ抑止されていたので、SNMPエージェント2はSNMPマネージャ3−1、3−2の両方にダイジェストトラップを送信する。
時刻30〜40は、直前の10秒間(時刻20〜30)がV_1<V_2<Pだったので、SNMPエージェント2は、SNMPマネージャ3−1、3−2のどちらにも情報トラップを送信しない(送信を抑止する)。
時刻40では、SNMPマネージャ3−1は状態IIIから状態IVに移行し、SNMPマネージャ3−2は状態IIIから状態IIに移行する。直前の10秒間でトラップ抑止されていたので、SNMPエージェント2はSNMPマネージャ3−1、3−2の両方にダイジェストトラップを送信する。
時刻40〜50は、直前の10秒間(時刻30〜40)がV_1<P<V_2 だったので、SNMPエージェント2は、SNMPマネージャ3−1には情報トラップを送信しない。他方、SNMPマネージャ3−2には情報トラップを送信する。
時刻50では、SNMPマネージャ3−1は状態IVから状態Iに移行し、SNMPマネージャ3−2は状態IIから状態Vに移行する。直前の10秒間でトラップ抑止されていたので、ダイジェストトラップが送信される。
時刻50〜60は、直前の10秒間(時刻40〜50)がP<V_1<V_2だったので、SNMPマネージャ3−1、SNMPマネージャ3−2の両方に対して情報トラップが出力される。また、時刻50までは、V_agentはV_1<V_2<V_agentの関係だったが、時刻50〜60の間に、V_agentの値がそれまでのV_1, V_2よりも低い値に変化し、それに伴って、V_1,V_2は、V_agentと同じ値に変化した。
時刻60では、SNMPマネージャ3−1は状態Iから状態Vに移行し、SNMPマネージャ3−2は状態Vから状態Vに移行する。
時刻60〜70は、直前の10秒間(時刻50〜60)がP<V_1<V_2だったので、SNMPマネージャ3−1、3−2の両方に情報トラップが出力される。
時刻70では、SNMPマネージャ3−1は状態Vから状態VIIに移行し、SNMPマネージャ3−2は状態Vから状態VIIに移行する。
時刻70〜80は、直前の10秒間(時刻60〜70)がV_1=V_2<Pだったので、SNMPマネージャ3−1、3−2のどちらにも情報トラップは出力されない。
時刻80では、SNMPマネージャ3−1は状態VIIから状態IIIに移行し、SNMPマネージャ3−2は状態VIIから状態IIIに移行する。直前の10秒間でトラップ抑止されていたので、ダイジェストトラップが送信される。
時刻80〜90は、直前の10秒間(時刻70〜80)がV_1=V_2<Pだったので、SNMPマネージャ3−1、3−2のどちらにも情報トラップは出力されない。
時刻90では、SNMPマネージャ3−1は状態IIIから状態IVに移行し、SNMPマネージャ3−2は状態IIIから状態IIIに移行する。直前の10秒間でトラップ抑止されていたので、ダイジェストトラップが送信される。
時刻90〜100は、直前の10秒間(時刻80〜90)がV_1=V_2<Pだったので、SNMPマネージャ3−1、3−2のどちらにも情報トラップは出力されない。
時刻100では、SNMPマネージャ3−1は状態IVから状態IIIに移行し、SNMPマネージャ3−2は状態IIIから状態IVに移行する。直前の10秒間でトラップ抑止されていたので、ダイジェストトラップが送信される。
時刻100〜110は、直前の10秒間(時刻90〜100)がV_1=V_2<Pだったので、SNMPマネージャ3−1、3−2には情報トラップは出力されない。
時刻110では、SNMPマネージャ3−1は状態IIIから状態IVに移行し、SNMPマネージャ3−2は状態IVから状態IIIに移行する。直前の10秒間でトラップ抑止されていたので、ダイジェストトラップが送信される。
時刻110〜120は、直前の10秒間(時刻100〜110)がV_1=V_2<Pだったので、SNMPマネージャ3−1、3−2には情報トラップは出力されない。
時刻120では、SNMPマネージャ3−1は状態IVから状態IIIに移行し、SNMPマネージャ3−2は状態IIIから状態IIIに移行する。前の10秒間でトラップ抑止されていたので、ダイジェストトラップが送信される。
時刻120〜130は、前の10秒間(時刻110〜120)がV_1=V_2<Pだったので、SNMPマネージャ3−1、3−2には情報トラップは出力されない。
以上、本発明を実施の形態に即して説明したが、本発明はこれに限定されるものではない。
例えば、上述の実施の形態では、トラップログファイル92やトラップ送信結果ファイル93を転送する際に、FTPを用いたが、本発明はこれに限定されるものではなく、例えば、電子メールを用いて転送してもよいし、HTTPを用いて転送してもよい。
また、上述のネットワーク管理システム1では、トラップ管理部23からトラップ送信部24へのトラップ送信通知は、SNMPマネージャ1つに1トラップを送るごとに発生しているが、本発明はこれに限定されるものではなく、トラップ送信通知の数を減らすため、トラップ管理部23が、1つのトラップ送信通知内に、複数のトラップ送信先SNMPマネージャを設定することとしてもよい。
(ネットワーク管理システム1の効果)
ネットワーク管理システム1によれば次のような効果がある。
第1の効果として、障害状態を、障害発生トラップ、障害復旧トラップで対応付けてSNMPマネージャが管理できる。
第2の効果として、障害の発生、復旧状態をSNMPエージェントが管理することで、すでに障害発生している障害について、重複して障害発生のトラップを出力することを避けることと、すでに障害復旧している障害について、重複して障害復旧のトラップを出力することを避けることで、SNMPエージェント、SNMPマネージャ双方の処理負荷を削減することである。
第3の効果は 障害の発生と復旧、すなわち障害発生トラップと障害復旧トラップの送信が断続的に続く場合や、特定の情報トラップの送信が断続的に続く場合、TrapID単位でトラップ送信の頻度をSNMPエージェントが管理し、抑止することでSNMPエージェント、SNMPマネージャ双方の処理負荷を削減することである。なお、特定の障害発生トラップあるいは障害復旧トラップの送信を抑止する場合は、その障害の発生、復旧の対応付けはできなくなる。
第4の効果はトラップが頻出する場合、トラップ管理部12でトラップ送信を抑止しているので、SNMPエージェント1とSNMPマネージャ1〜nとの間のネットワーク機器が中継するトラップの量が大幅に減り、ネットワーク機器の負荷が低減できることである。
第5の効果はトラップが頻出し、抑止される場合、全てのSNMPエージェントにダイジェストトラップを送信しているので、SNMPマネージャ1〜n全てが、SNMPエージェント1がトラップ抑止していることを確認できることである。
第6の効果は、本来トラップはUDPで到達性が保証されないがトラップ情報をトラップログファイル92、送信結果をトラップ送信結果ファイル93に保存し、それらのファイルをSNMPマネージャ1〜nが取得し確認しているので、内容を確認できることである。
第7の効果は、本来トラップで順序性が保証されないが、トラップにシーケンス番号を付与していることで、順序性を保証していることである。
第8の効果は、SNMPエージェント1が高負荷の場合(トラップ送信処理に時間がかかり、トラップ送信部13が、処理しきれないトラップ送信通知をためるキューがあふれて、あふれたトラップ送信処理を破棄してしまう場合)でも、全てのトラップ情報を、トラップログファイル92(送信していないトラップを含む全てのトラップ情報)、トラップ送信結果ファイル93(実際にトラップ送信されたかどうかを表す)から確認できることである。これは、特に、トラップ抑止するためのトラップ送信率閾値が大きすぎる値でトラップ抑止機能が働かない場合に、効果を発揮する。
第9の効果は、SNMPマネージャ個々に、全トラップ送信頻度の閾値を設定し、SNMPマネージャの性能に見合った情報トラップの抑止ができることである。
第10の効果は、TrapID個々に、トラップ送信頻度の閾値や、閾値越えの際のトラップ抑止の可否を設定できることである。
上記の実施形態の一部又は全部は以下の付記のようにも記載されうるが、これらに限定されるものではない。
(付記1)
管理装置とネットワークを介して接続され、自装置の状態に係る情報である管理情報を、ネットワークを介して管理装置に送信するための手段を備え、
管理装置または自装置の現在の状態または動作の予定を監視して、管理装置または自装置が現に高負荷状態にあること、または、予定された動作を開始することを検出するための監視手段を備え、
管理情報は、少なくとも管理装置に通知する緊急性に基づいて複数の種別に分類され、
監視手段による検出結果に応じて、予め定められた種別の管理情報の管理装置への送信を抑止する処理である、送信抑止処理を実行する
管理対象装置。
(付記2)
管理情報は、自装置における障害の発生に係る障害発生通知、自装置における障害からの復旧に係る障害復旧通知、並びに、障害発生情報及び障害復旧情報のいずれにも当てはまらない情報通知に少なくとも分類され、
送信抑止処理において、監視手段による検出結果にかかわらず障害発生通知及び障害復旧通知を管理装置に送信する一方、監視手段による検出結果に応じて情報通知の管理装置への送信を抑止する
付記1に記載の管理対象装置。
(付記3)
管理装置を対象とする監視手段による検出結果に応じた閾値を受信するための手段を備え、
送信抑止処理において、受信した閾値と、単位時間当たりの管理情報の送信回数とに基づいて、予め定められた種別の管理情報の管理装置への送信を抑止する
付記1及び付記2のいずれかに記載の管理対象装置。
(付記4)
自らを対象とする監視手段をそれぞれが備える複数の管理装置から、それぞれの監視手段による検出結果を受信するための手段を備え、
管理装置毎に送信抑止処理を実行する
付記1乃至付記3のいずれかに記載の管理対象装置。
(付記5)
送信抑止処理によって送信を抑止した管理情報の少なくとも一部を記録する送信抑止情報格納手段を備える
付記1乃至付記4のいずれかに記載の管理対象装置。
(付記6)
送信抑止情報格納手段に格納された情報の少なくとも一部を抽出し、管理情報を生成して、管理装置に送信する
付記5に記載の管理対象装置。
(付記7)
管理情報は互いに識別可能な識別子を有し、
管理情報の識別子毎に送信抑止処理を実行する
付記1乃至付記6のいずれかに記載の管理対象装置。
(付記8)
コンピュータを管理対象装置として機能させるためのプログラムであって、
管理装置とネットワークを介して接続され、自装置の状態に係る情報であり、少なくとも管理装置に通知する緊急性に基づいて複数の種別に分類される情報である管理情報を、ネットワークを介して管理装置に送信するための手段、
管理装置または自装置の現在の状態または動作の予定を監視して、管理装置または自装置が現に高負荷状態にあること、または、予定された動作を開始することを検出するための監視手段、
監視手段による検出結果に応じて、予め定められた種別の管理情報の管理装置への送信を抑止する処理である、送信抑止処理を実行する手段
として、コンピュータを機能させるプログラム。
(付記9)
管理情報は、自装置における障害の発生に係る障害発生通知、自装置における障害からの復旧に係る障害復旧通知、並びに、障害発生情報及び障害復旧情報のいずれにも当てはまらない情報通知に少なくとも分類され、
送信抑止処理において、監視手段による検出結果にかかわらず障害発生通知及び障害復旧通知を管理装置に送信する一方、監視手段による検出結果に応じて情報通知の管理装置への送信を抑止する
付記8に記載のプログラム。
(付記10)
更に、管理装置を対象とする監視手段による検出結果に応じた閾値を受信するための手段としてコンピュータを機能させ、
送信抑止処理において、受信した閾値と、単位時間当たりの管理情報の送信回数とに基づいて、予め定められた種別の管理情報の管理装置への送信を抑止する
付記8及び付記9のいずれかに記載のプログラム。
(付記11)
更に、自らを対象とする監視手段をそれぞれが備える複数の管理装置から、それぞれの監視手段による検出結果を受信するための手段としてコンピュータを機能させ、
管理装置毎に送信抑止処理を実行する
付記8乃至付記10のいずれかに記載のプログラム。
(付記12)
更に、送信抑止処理によって送信を抑止した管理情報の少なくとも一部を記録する送信抑止情報格納手段としてコンピュータを機能させる
付記8乃至付記11のいずれかに記載のプログラム。
(付記13)
送信抑止情報格納手段に格納された情報の少なくとも一部を抽出し、管理情報を生成して、管理装置に送信するようにコンピュータを機能させる付記12に記載のプログラム。
(付記14)
管理情報は互いに識別可能な識別子を有し、
管理情報の識別子毎に送信抑止処理を実行する
付記8乃至付記13のいずれかに記載のプログラム。
(付記15)
管理対象装置とネットワークを介して接続されて、管理対象装置の状態に係る情報である管理情報を、ネットワークを介して受信するための手段を備え、
自管理装置の現在の状態または動作の予定を監視して、自管理装置が現に高負荷状態にあること、または、予定された動作を開始することを検出する監視手段を備え、
管理情報は、少なくとも管理装置に通知する緊急性に基づいて複数の種別に分類され、
予め定められた種別の管理情報の管理装置への送信を抑止する処理である、送信抑止処理を管理対象装置に実行させるために、監視手段による検出結果を管理対象装置に送信する手段を備える
管理装置。
(付記16)
管理情報は、管理対象装置における障害の発生に係る障害発生通知、管理対象装置における障害からの復旧に係る障害復旧通知、並びに、障害発生情報及び障害復旧情報のいずれにも当てはまらない情報通知に少なくとも分類され、
送信抑止処理を実行する管理対象装置から、監視手段による検出結果にかかわらず障害発生通知及び障害復旧通知を受信する一方、監視手段による検出結果に応じて情報通知を受信する
付記15に記載の管理装置。
(付記17)
管理対象装置での送信抑止処理において、単位時間当たりの管理情報の送信回数と閾値とに基づいて、予め定められた種別の管理情報の管理装置への送信を抑止させるため、監視手段での検出結果に応じて管理対象装置に閾値を送信する手段を備える付記15及び付記16のいずれかに記載の管理装置。
(付記18)
管理対象装置が送信抑止処理によって送信を抑止した管理情報の少なくとも一部を含む管理情報を受信するための手段を備える付記15乃至付記17のいずれかに記載の管理装置。
(付記19)
管理情報は互いに識別可能な識別子を有し、
管理対象装置は管理情報の識別子毎に送信抑止処理を実行する
付記15乃至付記18のいずれかに記載の管理装置。
(付記20)
コンピュータを管理装置として機能させるためのプログラムであって、
管理対象装置とネットワークを介して接続されて、管理対象装置の状態に係る情報であり、少なくとも管理装置に通知する緊急性に基づいて複数の種別に分類される管理情報を、ネットワークを介して受信するための手段、
自管理装置の現在の状態または動作の予定を監視して、自管理装置が現に高負荷状態にあること、または、予定された動作を開始することを検出する監視手段、及び、
予め定められた種別の管理情報の管理装置への送信を抑止する処理である、送信抑止処理を管理対象装置に実行させるために、監視手段による検出結果を管理対象装置に送信する手段
としてコンピュータを機能させるプログラム。
(付記21)
管理情報は、管理対象装置における障害の発生に係る障害発生通知、管理対象装置における障害からの復旧に係る障害復旧通知、並びに、障害発生情報及び障害復旧情報のいずれにも当てはまらない情報通知に少なくとも分類され、
送信抑止処理を実行する管理対象装置から、監視手段による検出結果にかかわらず障害発生通知及び障害復旧通知を受信する一方、監視手段による検出結果に応じて情報通知を受信する
付記20に記載のプログラム。
(付記22)
管理対象装置での送信抑止処理において、単位時間当たりの管理情報の送信回数と閾値とに基づいて、予め定められた種別の管理情報の管理装置への送信を抑止させるため、監視手段での検出結果に応じて管理対象装置に閾値を送信する手段を備える付記20及び付記21のいずれかに記載のプログラム。
(付記23)
管理対象装置が送信抑止処理によって送信を抑止した管理情報の少なくとも一部を含む管理情報を受信するための手段を備える付記20乃至付記22のいずれかに記載のプログラム。
(付記24)
管理情報は互いに識別可能な識別子を有し、
管理対象装置は管理情報の識別子毎に送信抑止処理を実行する
付記20乃至付記23のいずれかに記載のプログラム。
(付記25)
管理装置と、管理装置とネットワークを介して接続されて、管理装置による管理の対象となる管理対象装置とを備え、
管理対象装置の状態に係る情報である管理情報を、管理対象装置から管理装置にネットワークを介して送信し、
管理装置または管理対象装置の現在の状態または動作の予定を監視して、管理装置または管理対象装置が現に高負荷状態にあること、または、予定された動作を開始することを検出する監視手段を備え、
管理情報は、少なくとも管理装置に通知する緊急性に基づいて複数の種別に分類され、
監視手段による検出結果に応じて、予め定められた種別の管理情報の管理装置への送信を抑止する処理である、送信抑止処理を管理対象装置は実行する
ネットワーク管理システム。
(付記26)
管理情報は、管理対象装置における障害の発生に係る障害発生通知、管理対象装置における障害からの復旧に係る障害復旧通知、並びに、障害発生情報及び障害復旧情報のいずれにも当てはまらない情報通知に少なくとも分類され、
送信抑止処理において、管理対象装置は、監視手段による検出結果にかかわらず障害発生通知及び障害復旧通知を管理装置に送信する一方、監視手段による検出結果に応じて情報通知の管理装置への送信を抑止する
付記25に記載のネットワーク管理システム。
(付記27)
監視手段は検出結果に応じて管理対象装置に閾値を通知し、
送信抑止処理において、管理対象装置は、通知された閾値と、単位時間当たりの管理情報の送信回数とに基づいて、予め定められた種別の管理情報の管理装置への送信を抑止する
付記25及び付記26のいずれかに記載のネットワーク管理システム。
(付記28)
複数の管理装置を備え、
複数の管理装置はそれぞれ自身を対象とする監視手段を備え、監視手段はそれぞれの検出結果を管理対象装置に通知し、
管理対象装置は管理装置毎に送信抑止処理を実行する
付記25乃至付記27のいずれかに記載のネットワーク管理システム。
(付記29)
送信抑止処理によって送信を抑止した管理情報の少なくとも一部を記録する送信抑止情報格納手段を備える
付記25乃至付記28のいずれかに記載のネットワーク管理システム。
(付記30)
管理対象装置は、送信抑止情報格納手段に格納された情報の少なくとも一部を抽出して管理情報を生成して、管理装置に送信する
付記29に記載のネットワーク管理システム。
(付記31)
管理情報は互いに識別可能な識別子を有し、
管理対象装置は管理情報の識別子毎に送信抑止処理を実行する
付記25乃至付記30のいずれかに記載のネットワーク管理システム。
(付記32)
ネットワークを介して互いに接続された管理装置と、管理装置による管理の対象となる管理対象装置とを備えるネットワーク管理システムにおける管理方法であって、
少なくとも管理装置に通知する緊急性に基づいて、管理情報を複数の種別に分類する段階、
管理装置または管理対象装置の現在の状態または動作の予定を監視して、管理装置または管理対象装置が現に高負荷状態にあること、または、予定された動作を開始することを検出する段階、及び、
検出結果に応じて、予め定められた種別の管理情報の管理装置への送信を抑止する処理である、送信抑止処理を管理対象装置が実行する段階
を含む管理方法。
(付記33)
管理情報は、管理対象装置における障害の発生に係る障害発生通知、管理対象装置における障害からの復旧に係る障害復旧通知、並びに、障害発生情報及び障害復旧情報のいずれにも当てはまらない情報通知に少なくとも分類され、
送信抑止処理において、管理対象装置は、監視手段による検出結果にかかわらず障害発生通知及び障害復旧通知を管理装置に送信する一方、監視手段による検出結果に応じて情報通知の管理装置への送信を抑止する
付記32に記載の管理方法。
(付記34)
検出結果に応じて管理対象装置に閾値を通知する段階を更に含み、
送信抑止処理において、管理対象装置は、通知された閾値と、単位時間当たりの管理情報の送信回数とに基づいて、予め定められた種別の管理情報の管理装置への送信を抑止する
付記32及び付記33のいずれかに記載の管理方法。
(付記35)
複数の管理装置はそれぞれ、自装置を対象として行った監視による検出結果を管理対象装置に通知し、
管理対象装置は管理装置毎に送信抑止処理を実行する
付記32乃至付記34のいずれかに記載の管理方法。
(付記36)
送信抑止処理によって送信を抑止した管理情報の少なくとも一部を記録する段階を更に含む
付記32乃至付記35のいずれかに記載の管理方法。
(付記37)
管理対象装置は、送信抑止処理によって送信を抑止した管理情報の記録から、少なくとも一部を抽出し、管理情報を生成して、管理装置に送信する段階を含む付記36に記載の管理方法。
(付記38)
管理情報は互いに識別可能な識別子を有し、
管理対象装置は管理情報の識別子毎に送信抑止処理を実行する
付記32乃至付記37のいずれかに記載の管理方法。
1 ネットワーク管理システム
2 SNMP(Simple Network Management Protocol)エージェント
3−1、3−2、…、3m SNMPマネージャ(mは自然数)
21−1、…、21−n 機能部(nは自然数)
22 タイマ通知部
23 トラップ管理部
24 トラップ送信部
25 FTPサーバ
26 SNMPデーモン
27 SNMPエージェント状態監視部
28 記憶装置
3−1−1、…、3−m−1 MIB操作部
3−1−2、…、3−m−2 トラップ受信部
3−1−3、…、3−m−3 FTPクライアント
3−1−4 トラップ解析部
3−1−5 SNMPマネージャ状態監視部
3−1−6 画面表示部
91 設定ファイル
92 トラップログファイル
93 トラップ送信結果ファイル
94 ダイジェストトラップ
95 SNMPマネージャiのタイムアウトイベント表
99 抑止トラップ一覧
100 障害状態一覧
101 トラップID個別情報一覧

Claims (9)

  1. 管理装置とネットワークを介して接続され、自装置の状態に係る情報である管理情報を、ネットワークを介して管理装置に送信するための手段を備え、
    装置の現在の負荷状態または動作の予定を監視して、自装置が現に高負荷状態にあること、または、予定された動作を開始することを検出するための監視手段を備え、
    管理情報は、少なくとも管理装置に通知する緊急性に基づいて複数の種別に分類され、
    監視手段による検出結果に応じて、予め定められた種別の管理情報の管理装置への送信を抑止する処理である、送信抑止処理を実行する
    管理対象装置。
  2. 管理情報は、自装置における障害の発生に係る障害発生通知、自装置における障害からの復旧に係る障害復旧通知、並びに、障害発生情報及び障害復旧情報のいずれにも当てはまらない情報通知に少なくとも分類され、
    送信抑止処理において、監視手段による検出結果にかかわらず障害発生通知及び障害復旧通知を管理装置に送信する一方、監視手段による検出結果に応じて情報通知の管理装置への送信を抑止する
    請求項1に記載の管理対象装置。
  3. 管理装置を対象とする監視手段による検出結果に応じた閾値を受信するための手段を備え、
    送信抑止処理において、受信した閾値と、単位時間当たりの管理情報の送信回数とに基づいて、予め定められた種別の管理情報の管理装置への送信を抑止する
    請求項1及び請求項2のいずれかに記載の管理対象装置。
  4. 自らを対象とする監視手段をそれぞれが備える複数の管理装置から、それぞれの監視手段による検出結果を受信するための手段を備え、
    管理装置毎に送信抑止処理を実行する
    請求項1乃至請求項3のいずれかに記載の管理対象装置。
  5. 送信抑止処理によって送信を抑止した管理情報の少なくとも一部を記録する送信抑止情報格納手段を備える
    請求項1乃至請求項4のいずれかに記載の管理対象装置。
  6. 送信抑止情報格納手段に格納された情報の少なくとも一部を抽出し、管理情報を生成して、管理装置に送信する
    請求項5に記載の管理対象装置。
  7. 管理情報は互いに識別可能な識別子を有し、
    管理情報の識別子毎に送信抑止処理を実行する
    請求項1乃至請求項6のいずれかに記載の管理対象装置。
  8. コンピュータを管理対象装置として機能させるためのプログラムであって、
    管理装置とネットワークを介して接続され、自装置の状態に係る情報であり、少なくとも管理装置に通知する緊急性に基づいて複数の種別に分類される情報である管理情報を、ネットワークを介して管理装置に送信するための手段、
    装置の現在の負荷状態または動作の予定を監視して、自装置が現に高負荷状態にあること、または、予定された動作を開始することを検出するための監視手段、
    監視手段による検出結果に応じて、予め定められた種別の管理情報の管理装置への送信を抑止する処理である、送信抑止処理を実行する手段
    として、コンピュータを機能させるプログラム。
  9. 管理装置と、管理装置とネットワークを介して接続されて、管理装置による管理の対象となる管理対象装置とを備え、
    管理対象装置の状態に係る情報である管理情報を、管理対象装置から管理装置にネットワークを介して送信し、
    理対象装置の現在の負荷状態または動作の予定を監視して、管理対象装置が現に高負荷状態にあること、または、予定された動作を開始することを検出する監視手段を備え、
    管理情報は、少なくとも管理装置に通知する緊急性に基づいて複数の種別に分類され、
    監視手段による検出結果に応じて、予め定められた種別の管理情報の管理装置への送信を抑止する処理である、送信抑止処理を管理対象装置は実行する
    ネットワーク管理システム。
JP2014117746A 2014-06-06 2014-06-06 管理対象装置、管理装置及びネットワーク管理システム Active JP6418377B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014117746A JP6418377B2 (ja) 2014-06-06 2014-06-06 管理対象装置、管理装置及びネットワーク管理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014117746A JP6418377B2 (ja) 2014-06-06 2014-06-06 管理対象装置、管理装置及びネットワーク管理システム

Publications (2)

Publication Number Publication Date
JP2015230674A JP2015230674A (ja) 2015-12-21
JP6418377B2 true JP6418377B2 (ja) 2018-11-07

Family

ID=54887394

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014117746A Active JP6418377B2 (ja) 2014-06-06 2014-06-06 管理対象装置、管理装置及びネットワーク管理システム

Country Status (1)

Country Link
JP (1) JP6418377B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6515573B2 (ja) * 2015-02-20 2019-05-22 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP6507858B2 (ja) * 2015-05-29 2019-05-08 日本電気株式会社 ネットワーク装置、リソース監視方法およびプログラム
JP6760895B2 (ja) * 2017-07-12 2020-09-23 日本電信電話株式会社 ネットワーク計測システム、および、ネットワーク計測方法
JP7139642B2 (ja) * 2018-03-23 2022-09-21 日本電気株式会社 情報処理装置、情報処理方法及びプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008149455A1 (ja) * 2007-06-08 2008-12-11 Fujitsu Limited マネジャ、エージェント及びシステム並びに送信制御方法
JP2014078115A (ja) * 2012-10-10 2014-05-01 Nec Corp 通信装置

Also Published As

Publication number Publication date
JP2015230674A (ja) 2015-12-21

Similar Documents

Publication Publication Date Title
CN109240765B (zh) 服务资源的熔断方法、装置、设备及计算机可读存储介质
US7702667B2 (en) Methods and systems for validating accessibility and currency of replicated data
US20160011925A1 (en) Annotation of network activity through different phases of execution
US7593351B1 (en) Method and system for collecting and consolidating network traffic information
US20120144021A1 (en) Administering Event Reporting Rules In A Distributed Processing System
US20160013990A1 (en) Network traffic management using heat maps with actual and planned /estimated metrics
JP6418377B2 (ja) 管理対象装置、管理装置及びネットワーク管理システム
US7430688B2 (en) Network monitoring method and apparatus
CN111953566B (zh) 一种基于分布式故障监控的方法和虚拟机高可用系统
CN110445697B (zh) 视频大数据云平台设备接入服务方法
CN111565135A (zh) 监控服务器运行的方法、监控服务器和存储介质
CN111327685A (zh) 分布式存储系统数据处理方法、装置及设备和存储介质
CN111966466A (zh) 一种容器管理方法、设备以及介质
CN113489149B (zh) 基于实时状态感知的电网监控系统业务主节点选取方法
US10122602B1 (en) Distributed system infrastructure testing
JP2005301436A (ja) クラスタシステムおよびクラスタシステムにおける障害回復方法
JP6421516B2 (ja) サーバ装置、冗長構成サーバシステム、情報引継プログラム及び情報引継方法
US9443196B1 (en) Method and apparatus for problem analysis using a causal map
CN111309456B (zh) 一种任务执行方法及系统
JP2008244902A (ja) 障害復旧装置、障害復旧方法、及び障害復旧システム
CN113824595B (zh) 链路切换控制方法、装置和网关设备
WO2011161835A1 (ja) 原因分析構成変更のための方法および装置
JP2007034416A (ja) ログデータを管理する情報処理システム、ログデータ管理方法およびプログラム
JP2007272328A (ja) コンピュータ・システム
CN114816866A (zh) 故障处理方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20151222

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170516

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180404

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180604

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180912

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180925

R150 Certificate of patent or registration of utility model

Ref document number: 6418377

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150