JP6011203B2 - 性能情報の収集管理機能を含む管理装置 - Google Patents

性能情報の収集管理機能を含む管理装置 Download PDF

Info

Publication number
JP6011203B2
JP6011203B2 JP2012212235A JP2012212235A JP6011203B2 JP 6011203 B2 JP6011203 B2 JP 6011203B2 JP 2012212235 A JP2012212235 A JP 2012212235A JP 2012212235 A JP2012212235 A JP 2012212235A JP 6011203 B2 JP6011203 B2 JP 6011203B2
Authority
JP
Japan
Prior art keywords
performance information
collection
snmp
wireless device
response
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012212235A
Other languages
English (en)
Other versions
JP2014067232A (ja
Inventor
大輔 能登
大輔 能登
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2012212235A priority Critical patent/JP6011203B2/ja
Publication of JP2014067232A publication Critical patent/JP2014067232A/ja
Application granted granted Critical
Publication of JP6011203B2 publication Critical patent/JP6011203B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)

Description

本発明は、性能情報の収集管理機能を含む管理装置に関する。
ネットワーク管理装置であるEMS(Element Management System)サーバは、プロト
コルSNMP(Simple Network Management Protocol)を使用し、DCN(データ通信網:Data Communication Network)回線経由で管理対象装置の複数の網構成装置から性能情報などの各種情報を収集する。SNMPはコネクションレスプロトコルであるため、DCN経路上でパケットロスが生じることを前提にして、一般的には再送処理で対処している。
EMSサーバは、管理対象装置の複数の網構成装置から性能情報を予め定められた周期で収集する必要があり、DCN帯域幅、再送タイマ時間、及びパケットロスト率で決められた周期(例えば、15分)内に、全ての管理対象装置からの収集処理が完了するようにスケジューリングしている。
複数の網構成装置を含むネットワークが無線ネットワークであるときは、DCN回線を通して無線通信されるため、伝送品質を常に良好に維持することが困難であり、DCN回線の切断状態に起因して網構成装置の監視状態が非監視となる事象が多く発生する。
DCN回線の切断状態が発生した場合、発生箇所以後の経路に存在する全ての網構成装置が非監視となる。EMSサーバは、監視状態が非監視となった網構成装置に関しては、予め定められた周期内に性能情報の収集ができないため、DCN回線の復旧後に、性能情報が収集できなかった期間の再収集を実施することになる。
特開2000−201156号公報 特開平6−276203号公報
しかし、EMSサーバで監視する網構成装置の数が増加傾向にある近年では、再収集処理において全ての網構成装置についての性能情報を予め定められた期間(時間)内に収集できない問題がある。
課題は、ネットワーク回線の切断状態に起因して網構成装置の監視状態が非監視となる事象が多く発生する状況においても、的確な性能情報の再収集処理を可能にする技術を提供することにある。
上記課題を解決するために、複数の網構成装置の性能情報を予め定められた周期で収集し管理する管理装置は、前記網構成装置の性能情報に関する応答のパケットロスト率、収集した性能情報の項目数と全収集項目数との比率、及び再収集可能残時間の内の少なくとも1つのパラメタに基づいて優先度を算出し、算出した優先度に応じて、性能情報を再収集するための優先順位を設定する、性能情報収集プロセスを実行するように構成されるプロセッサを備える。
開示した管理装置によれば、ネットワーク回線の切断状態が発生したときに収集できなかった性能情報の再収集を優先度に応じて実施することができる。
他の課題、特徴及び利点は、図面及び特許請求の範囲とともに取り上げられる際に、以下に記載される発明を実施するための形態を読むことにより明らかになるであろう。
一実施の形態の監視システムの構成を示す。 一実施の形態の監視システムにおけるEMSサーバの構成を示すブロック図。 一実施の形態の監視システムにおける無線装置の構成を示すブロック図。 回線断警報受信時のシーケンスを示す。 回線断警報受信時のテーブルの内容を示す。 現状のヘルスチェック処理のシーケンスを示す。 ヘルスチェック処理時のテーブルの内容を示す。 現状の性能情報の再収集処理を説明するための図。 性能情報の収集処理のシーケンスを示す。 現状の性能情報の再収集処理のシーケンスを示す。 ヘルスチェック処理のシーケンスを示す。 ヘルスチェック処理時のテーブルの内容を示す。 再収集処理の優先度設定を説明するための図。 優先度設定を考慮した性能情報の再収集処理のシーケンスを示す。
以下、添付図面を参照して、さらに詳細に説明する。図面には好ましい実施形態が示されている。しかし、多くの異なる形態で実施されることが可能であり、本明細書に記載される実施形態に限定されない。
[システム構成]
一実施の形態におけるシステム構成を示す図1を参照すると、無線ネットワーク監視システムSYSは、EMS(Element Management System)サーバ1及びEMSクライアン
ト2を備える。
EMSサーバ1は、レイヤ2(L2)ネットワークである監視ネットワーク3に有線接続され、この監視ネットワーク3を通して、網構成装置としての複数の無線装置4(A〜I)を含むDCN(データ通信網:Data Communication Network)を管理する管理装置である。また、監視ネットワーク3に有線接続されているEMSクライアント2は、オペレータ端末であり、EMSサーバ1から警報情報及び性能情報を読み出すなど、必要によりEMSサーバ1と連携する。
複数の無線装置4(A〜I)は、各通信局に配置された伝送装置であり、ここでは無線ネットワークのDCNを構成し、所定の無線装置4と無線接続または有線接続されている。ここで、有線接続は、図1中、実線で示す有線回線による接続形態であり、無線接続は、図1中、点線で示す無線回線による接続形態である。
図1に示すように、全ての無線装置4(A〜I)が監視ネットワーク3に直接に有線接続しているのではなく、監視ネットワーク3に直接に有線接続されているいくつかの無線装置4(A,H)を中継することにより接続している。
このため、EMSサーバ1は、中継区間でDCN回線の切断(以下、単に回線断と記載することもある)が発生すると、発生箇所以降の無線装置4(例えば、D,E)について監視状態が非監視となってしまう。この結果、EMSサーバ1は、後に詳述するように、非監視装置の無線装置4(D,E)に対する性能情報(PM)の収集処理に失敗し、収集に失敗した性能情報については、DCN回線が正常復旧した後に再収集を行うことになる。
なお、DCN回線の切断とは、外部環境の影響などに起因して、無線装置4(C)及び無線装置4(D)間の通信が正常に行えないために、回線の切断と判定される状態を含んでいる。
[EMSサーバ構成]
図2を参照すると、管理装置としてのEMSサーバ1は、サーバコンピュータであり、ハードウェア構成として、次の要素を含んでいる。つまり、プロセッサとしてのCPU(Central Processing Unit)と、作業用メモリとしてのRAM(Random Access Memory)
と、立ち上げのためのブートプログラムを格納したROM(Read Only Memory)とを備える。
また、EMSサーバ1は、OS(Operating System)、各種アプリケーションプログラム、及び各種情報(データを含む)を書換え可能に格納する不揮発性のフラッシュメモリと、通信インタフェースなどとを備える。これらのハードウェア構成は、当業者が容易に理解でき、実施可能であるので、ここでは図示を省略している。
後に詳述する性能情報の収集管理機能を論理的に実現するには、EMSサーバ1において、フラッシュメモリに制御プログラムをアプリケーションプログラムとしてインストールしておく。そして、EMSサーバ1における自律的起動、または無線装置4からの通知などを契機に、CPUがこの制御プログラムをRAMに展開して実行する。
更に詳述すると、EMSサーバ1には、性能情報収集プロセス11、ヘルスチェックプロセス12、及びSNMP送受信プロセス13が処理の分割の単位として存在する。また、EMSサーバ1は、警報管理テーブル14、性能情報収集管理テーブル15、収集失敗(NG)管理テーブル16、装置管理テーブル17、及び通信管理テーブル18を記憶部として含み、これらのテーブルには各種データが格納されている。
SNMP送受信プロセス13は、ヘルスチェックプロセス12または性能情報収集プロセス11から無線装置4に対するパケット形態のSNMP要求メッセージとしてのSNMP GET REQUESTを送信し、無線装置4からのパケット形態のSNMP応答メッセージとしてのSNMP GET RESPONSEをそれぞれのプロセスへ報告するプロセスである。
ヘルスチェックプロセス12は、装置管理テーブル17に登録されている全ての無線装置4について、SNMP送受信プロセス13を介してSNMP GET REQUESTを送信することにより、監視状態(監視または非監視)を確認するプロセスである。監視状態を確認するために送信したSNMP GET REQUESTに対し、SNMP GET RESPONSEの応答がない場合は、ヘルスチェックプロセス12は通信管理テーブル18に再計算したパケットロスト率を登録する。また、ヘルスチェックプロセス12は、無線装置4からのDCN回線切断警報を受信した場合に、装置管理テーブル17において該当の無線装置4の監視状態を非監視に更新する処理を実施する。
性能情報収集プロセス11は、装置管理テーブル17、性能情報収集管理テーブル15、及び収集NG管理テーブル16から収集対象の性能情報を取得し、無線装置4に格納されている性能情報を取得する。性能情報収集処理によって実施している性能情報の再収集処理については、再収集優先度設定処理110が、収集NG管理テーブル16及び装置管理テーブル17の格納データに基づいて算出した再収集可能残時間、通信管理テーブル18からのSNMP応答のロスト率(パケットロスト率)、更に装置管理テーブル17及び性能情報収集管理テーブル15の格納データに基づいて算出した収集性能情報の項目数と全収集項目数との比率を考慮し、的確な再収集処理を行う。
[無線装置構成]
図3を参照すると、網構成装置としての複数の無線装置4(A〜I)は、ハードウェア構成として、次の要素を含んでいる。つまり、プロセッサとしてのCPUと、作業用メモリとしてのRAMと、立ち上げのためのブートプログラムを格納したROMとを備える。
また、無線装置4は、OS、各種アプリケーションプログラム、及び各種情報(データを含む)を書換え可能に格納する不揮発性のフラッシュメモリと、通信インタフェースなどとを備える。これらのハードウェア構成は、当業者が容易に理解でき、実施可能であるので、ここでは図示を省略している。
EMSサーバ1との連携により性能情報の収集管理機能を論理的に実現するには、無線装置4において、フラッシュメモリに制御プログラムをアプリケーションプログラムとしてインストールしておく。そして、EMSサーバ1からの要求、または他の無線装置4からの要求または通知などを契機に、CPUがこの制御プログラムをRAMに展開して実行する。
更に詳述すると、各無線装置4には、DCN監視プロセス40、SNMP送受信プロセス41、及び性能情報管理プロセス42が処理の分割の単位として存在する。また、各無線装置4は、性能情報を格納している性能情報格納テーブル43と、管理情報の標準MIB(Management Information Base)データを格納している標準MIBデータベース(M
IB−DB)44を記憶部として含む。性能情報格納テーブル43には、性能情報として、取得時刻毎に測定種別のモニタータイプ(例えば、送信電力レベル、受信電力レベルなどの品質指標)及び測定値が格納されている。
DCN監視プロセス40は、配下の無線装置4とヘルスチェックを予め定められた周期で自律的に実施することにより、DCN回線の正常性を確認するプロセスである。
SNMP送受信プロセス41は、EMSサーバ1からのSNMP GET REQUESTを受信し、標準MIBデータや、性能情報をSNMP GET RESPONSEとして報告するプロセスである。
性能情報管理プロセス42は、性能情報格納テーブル43から性能情報を取得し、SNMP送受信プロセス41を通じてEMSサーバ1に送信するプロセスである。
[動作]
次に、一実施の形態の監視システムSYSにおける動作例について関連図を併せ参照して説明する。なお、各処理の差異を明確にするために、現状の処理についても説明する。
(回線断の警報受信処理)
図1中の複数の無線装置4(A〜I)における無線装置4(C)のDCN監視プロセス40は、配下の無線装置4(D)のDCN監視プロセス40とヘルスチェックを周期的に
実施することにより、DCN回線の正常性を確認する。
図4における回線断の警報受信処理のシーケンスに示すように、無線装置4(C)及び無線装置4(D)間のDCN回線が切断した場合、無線装置4(C)では、ヘルスチェックの応答が無線装置4(D)からないため、DCN監視プロセス40により応答タイムアウトを検出する。
これにより、無線装置4(C)のDCN監視プロセス40は、DCN回線切断警報をSNMP送受信プロセス41に出力する。そして、無線装置4(C)のSNMP送受信プロセス41は、EMSサーバ1に対して、DCN回線切断警報をパケット形態のSNMP通告メッセージとしてのSNMP Trapにて通知する。
EMSサーバ1においては、SNMP Trapを受信したときを契機に、SNMP送受信プロセス13が無線装置4(C)からのDCN回線切断警報を検出し、ヘルスチェックプロセス12を起動する。ヘルスチェックプロセス12は、警報管理テーブル14に警報情報を登録する。
ここで、警報管理テーブル14に登録される警報情報は、図5に例示するように、発生時刻:2011/11/01 10:00:00、検出装置:装置C(無線装置4(C))、発生箇所:装置C〜D間(無線装置4(C)〜無線装置4(D)間)、及び警報種別:DCN回線切断を含んでいる。
さらに、ヘルスチェックプロセス12は、受信した警報情報がDCN回線切断の場合は、装置管理テーブル17から回線断を検出した無線装置4(C)に接続されている配下の装置情報(装置リスト)を取得するために、装置管理テーブル17を検索し、該当の無線装置4(D,E)の監視状態を非監視に変更(更新)する。
ここで、装置管理テーブル17に登録される装置情報は、図5に例示するように、装置名、DCN接続元、装置種別(タイプ1,2は保有する性能情報の差異を示す)、性能情報保持期間(ここでは、時間)、監視状態(監視または非監視)、及びIPアドレスを含んでいる。
(ヘルスチェック処理(1))
図6における現状のヘルスチェック処理のシーケンスに示すように、EMSサーバ1のヘルスチェックプロセス12は、装置管理テーブル17に登録されている装置リストを取得し、SNMP送受信プロセス13を介して全ての登録装置である無線装置4に対し、ヘルスチェックとして管理情報の標準MIBデータを要求するためにSNMP GET REQUEST(単に、SNMP GETと記載することもある)を送信させる。
正常シーケンスでは、SNMP GET REQUESTを受信した無線装置4は、MIB−DB44から標準MIBデータを取得し、SNMP GET RESPONSEによりEMSサーバ1に応答する。
EMSサーバ1におけるSNMP送受信プロセス13がMIBデータを受信すると、SNMP送受信プロセス13はヘルスチェックプロセス12に該当の無線装置4との通信可能状態を示す応答ありを出力する。
これにより、ヘルスチェックプロセス12は、装置管理テーブル17における該当無線装置4の監視状態が非監視の場合は、監視状態を監視に更新する(図7参照)。
一方、異常シーケンスでは、EMSサーバ1のヘルスチェックプロセス12は、SNMP送受信プロセス13を介して全ての登録装置である無線装置4に対し、ヘルスチェックとして標準MIBデータを要求するためにSNMP GET REQUESTを送信させる。
しかし、このSNMP GET REQUESTはパケットロスのために無線装置4で受信されず、無線装置4からの応答がないので、EMSサーバ1におけるSNMP送受信プロセス13でタイムアウトが発生する。
SNMP送受信プロセス13がヘルスチェックプロセス12にタイムアウトを通知すると、ヘルスチェックプロセス12は、再度、SNMP送受信プロセス13にヘルスチェックとしてSNMP GET REQUESTを送信させる。
SNMP送受信プロセス13は、無線装置4からの応答なしによるタイムアウトを検出した場合、ヘルスチェックプロセス12にタイムアウトを再度通知する。
これにより、ヘルスチェックプロセス12は、装置管理テーブル17における該当の無線装置4の監視状態を非監視に更新する(図7参照)。
(性能情報の再収集処理(1))
EMSサーバ1は、装置管理テーブル17に登録している全ての無線装置4の監視状態を管理する。性能情報の収集処理では、この監視状態をチェックすることで、性能情報が収集できない非監視となっている無線装置4については、性能情報の収集を実施せず、収集失敗(NG)と判断する。
また、無線装置4の監視状態が監視となっているが、無線装置4から性能情報の応答がなく、タイムアウトした場合にも収集NGと判断する。収集NGと判断した性能情報は、いずれも次の周期以降に再収集を実施することになる。
図8に示す現状の性能情報の再収集処理を参照すると、性能情報の収集は、例えば、15分周期で、監視状態が監視となっている全ての無線装置4に対して実施する。図8の例では、周期#1の開始時刻00:00の直後に無線装置4(C)及び無線装置4(D)間に回線断が発生したため(図8中の丸数字1)、無線装置4(D)及び無線装置4(E)の監視状態が非監視となる。
このため、無線装置4(D)及び無線装置4(E)について、周期#1で収集すべき性能情報の収集は行わずに収集NGという結果となり(図8中の丸数字2)、監視状態が非監視から監視に復旧したときに再収集を行うために、収集NG管理テーブル16に収集対象情報(NGリスト)を性能情報識別子(PM−ID)毎に登録する(図8中の丸数字3)。
周期#2開始前に、無線装置4(C)及び無線装置4(D)間の回線断が復旧し、無線装置4(D)及び無線装置4(E)の監視状態が監視に更新される(図8中の丸数字4)。
このため、周期#2では、周期#2で収集すべき性能情報の収集(現周期での収集)が完了したのち、収集NG管理テーブル16に格納されている無線装置4(D)及び無線装置4(E)についての性能情報の再収集を実施する(図8中の丸数字5)。
再収集に成功した場合は、収集NG管理テーブル16から削除し、再収集でも失敗した
場合は、更に次の周期において再収集を行うために、収集NG管理テーブル16からの削除は行わない(図8中の丸数字6)。
ここで、性能情報識別子(PM−ID)はリソース軸及び時間軸についてスレッド分割された個々に対応している。EMSサーバ1においては、実行の脈絡であるスレッド(thread of execution)の複数個を同時に並列実行する。
また、図8中の性能情報収集管理テーブル15及び収集NG管理テーブル16において、収集種別のモニター1,2,3は、収集対象の性能情報の種別を示し、無線装置4における性能情報格納テーブル43に格納されている性能情報のモニタータイプ(測定種別)に対応している。
図9Aは現周期での現状の性能情報の収集処理のシーケンス示している。図9Aを参照すると、EMSサーバ1における性能情報収集プロセス11は、装置管理テーブル17から装置情報(装置リスト)を取得後、監視状態が非監視となっている無線装置4について収集した性能情報を収集NG管理テーブル16に登録するために、性能情報収集管理テーブル15から該当情報を取得する。
この後、性能情報収集プロセス11は、監視状態が監視となっている無線装置4について、性能情報収集管理テーブル15から収集対象の性能情報を取得し、SNMP送受信プロセス13に性能情報の取得を依頼する。
性能情報の取得を依頼されたSNMP送受信プロセス13は、無線装置4に対してSNMP GET REQUESTを送信する。
SNMP GET REQUESTを受信した無線装置4におけるSNMP送受信プロセス41は、性能情報管理プロセス42を介して性能情報格納テーブル43から性能情報を取得し、SNMP GET RESPONSEによりEMSサーバ1に送信する。
無線装置4から正常に性能情報の応答がSNMP GET RESPONSEによりSNMP送受信プロセス13に通知された場合(正常収集シーケンス)、性能情報収集プロセス11は応答データとしての性能情報に基づいて、性能情報収集管理テーブル15に性能情報を格納する。
一方、無線装置4から性能情報の応答が通知されず、SNMP送受信プロセス13がタイムアウトを検出した場合(異常収集シーケンス)、性能情報収集プロセス11は再度SNMP送受信プロセス13を介して無線装置4に対し、SNMP GET REQUESTを送信させる。
しかし、SNMP送受信プロセス13は、依然として応答が無線装置4から通知されずにタイムアウトを検出した場合は、収集NG管理テーブル16に収集NGとなったNGリストを登録する。
上述した性能情報収集処理は、監視状態が監視となっている全ての無線装置4について繰り返して実施される。
図9Bは、図9Aに示す性能情報の収集処理完了後に続けて実施される処理で、現周期の以前に失敗した性能情報についての現状の再収集処理のシーケンスを示している。
図9Bを参照すると、図9Aに示す性能情報収集処理(現周期での収集処理)が完了し
た後、性能情報収集プロセス11は、収集NG管理テーブル16から監視状態が監視である無線装置4における現周期以前に失敗した性能情報を取得する。
性能情報収集プロセス11は、取得した性能情報に基づき、無線装置4から性能情報を収集するために、SNMP送受信プロセス13に性能情報取得を依頼する。これにより、SNMP送受信プロセス13は無線装置4に対してSNMP GET REQUESTを送信する。
SNMP GET REQUESTを受信した無線装置4におけるSNMP送受信プロセス41は、性能情報管理プロセス42を介して性能情報格納テーブル43から性能情報を取得し、SNMP GET RESPONSEによりEMSサーバ1に送信する。
無線装置4から正常に性能情報の応答がSNMP GET RESPONSEにより通知され、SNMP送受信プロセス13が受信した場合(正常収集シーケンス)、性能情報収集プロセス11は応答データの性能情報に基づいて性能情報収集管理テーブル15に性能情報を格納し、収集NG管理テーブル16から成功したNGリストを削除する。
一方、無線装置4から性能情報の応答がSNMP GET RESPONSEにより通知されず、SNMP送受信プロセス13がタイムアウトを検出した場合(異常収集シーケンス)、SNMP送受信プロセス13は性能情報収集プロセス11にタイムアウトを通知する。
タイムアウトを通知された性能情報収集プロセス11は、再度、SNMP送受信プロセス13に性能情報の取得を依頼する。
SNMP送受信プロセス13は、再度、無線装置4に対してSNMP GET REQUESTを送信し、依然として応答がSNMP GET RESPONSEにより通知されずにタイムアウトを検出した場合、なにも処理せずに、次の無線装置4について性能情報の収集を実施する。
上述した性能情報の再収集処理は、収集NG管理テーブル16から取得した収集NGリスト分、繰り返して実施される。ただし、15分の周期を超えた場合は、繰り返し処理を中断して終了する。
その後、性能情報収集プロセス11は、性能情報の再収集が不可となったNGリストを収集NG管理テーブル16から削除する。
性能情報の収集可否については、収集NG管理テーブル16の収集失敗時刻と現時刻との差分が装置管理テーブル17の性能情報保持期間を超過している場合、収集不可と判断する。このように、性能情報保持期間を超過している場合などにおいて、性能情報が収集不可となる事象の発生を抑制する必要がある。
(ヘルスチェック処理(2))
上述したように、EMSサーバ1におけるヘルスチェックプロセス12には、DCN回線切断の警報受信処理と、ヘルスチェック処理との2つの処理が存在する。ここで、DCN回線切断の警報受信処理については、図4及び図5を参照して説明した内容と同じである。
図10におけるヘルスチェック処理のシーケンスに示すように、上述した性能情報の収集不可事象の発生を抑制ために、EMSサーバ1のヘルスチェックプロセス12は、装置
管理テーブル17に登録されている装置情報(装置リスト)を取得し、SNMP送受信プロセス13を介して全ての登録装置である無線装置4に対し、ヘルスチェックとして管理情報の標準MIBデータを要求するためにSNMP GET REQUESTを送信させる。
正常シーケンスでは、SNMP GET REQUESTを受信した無線装置4のSNMP送受信プロセス41は、MIB−DB44から標準MIBデータを取得し、SNMP
GET RESPONSEによりEMSサーバ1に応答する。
EMSサーバ1におけるSNMP送受信プロセス13がMIBデータを受信すると、SNMP送受信プロセス13はヘルスチェックプロセス12に該当の無線装置4との通信可能状態を示す応答ありを出力する。
これにより、ヘルスチェックプロセス12は、装置管理テーブル17における該当無線装置4の監視状態が非監視の場合は、監視状態を監視に更新する(図7参照)。
一方、異常シーケンスでは、EMSサーバ1のヘルスチェックプロセス12は、SNMP送受信プロセス13を介して全ての登録装置である無線装置4に対し、ヘルスチェックとして標準MIBデータを要求するためにSNMP GET REQUESTを送信させる。
しかし、このSNMP GET REQUESTはパケットロスのために無線装置4で受信されず、無線装置4からの応答がないので、EMSサーバ1におけるSNMP送受信プロセス13でタイムアウトが発生する。
SNMP送受信プロセス13が、ヘルスチェックプロセス12にタイムアウトを通知すると、ヘルスチェックプロセス12は、エラーカウントをカウントアップし、再計算したSNMP応答(SNMP GET RESPONSE)のロスト率(パケットロスト率)に通信管理テーブル18の該当の無線装置4の値を更新する(図11参照)。
更新後にヘルスチェックプロセス12は、再度、SNMP送受信プロセス13にヘルスチェックとしてSNMP GET REQUESTを送信させる。
SNMP送受信プロセス13は、無線装置4からの応答なしによるタイムアウトを検出した場合、ヘルスチェックプロセス12にタイムアウトを再度通知する。
タイムアウトを再度通知されたヘルスチェックプロセス12は、エラーカウントを更にカウントアップし、再計算したSNMP応答のロスト率に通信管理テーブル18の該当の無線装置4の値を更新する(図11参照)。
さらに、ヘルスチェックプロセス12は、装置管理テーブル17における該当の無線装置4の監視状態を非監視に更新する(図7参照)。
(優先度設定)
性能情報収集プロセス11内の再収集優先度設定処理110により、EMSサーバ1が保持する3つのパラメタ、つまり再収集可能残時間T、収集した性能情報の項目数と全収集項目数との比率N、及びSNMP応答(SNMP GET RESPONSE)のロスト率(パケットロスト率)Lを使用し、性能情報の再収集処理の適正な優先度(優先順位)が設定される。
図12を参照して、性能情報の再収集処理の優先順位設定について詳述する。
(a)再収集可能残時間Tについては、装置管理テーブル17内の性能情報保持期間と、収集NG管理テーブル16内の収集失敗時刻とから残時間(ここでは、分)を算出する。
(b)収集した性能情報の項目数と全収集項目数との比率Nについては、性能情報収集管理テーブル15内の収集種別に基づいて、装置単位での収集項目数をカウントする。また、装置管理テーブル17内の性能測定数(最大数)に基づいて、該当の無線装置4の最大収集項目数を取得し、収集項目数の割合を算出する。
(c)通信管理テーブル18に格納されるSNMP応答のロスト率Lについては、SNMP通信での1時間当たりのSNMP応答のタイムアウト回数をカウント(エラーカウント)し、パケットロスト率を計算しておく。
(d)上記3つのパラメタに基づいて、計算式:(1/T)×N×Lにより、適正な優先度を算出する。しかし、これら3つのパラメタの内の少なくとも1つのパラメタに基づいて算出してもよい。この計算式から理解できるように、再収集可能残時間Tが短いほど、再収集の優先順位は高くなる。ただし、再収集可能残時間Tが0となったものについては、収集NG管理テーブル16から削除されるため、対象外とする。上記計算式により求められた優先度の値の大きいものほど、再収集の優先順位は高いと認識される。図12の例示では、無線装置4(D)対応の性能情報識別子(PM−ID)12についての第1番目の優先度の値に基づいて、再収集処理の第1番目の優先順位が設定されている。
上述した再収集優先度設定処理110による性能情報の再収集処理の優先度設定に基づいて、図12に例示するように、無線装置4(D)及び無線装置4(E)対応の性能情報識別子(PM−ID)12,32,199などが再収集処理の対象として設定される。
図12中の性能情報収集管理テーブル15及び収集NG管理テーブル16において、収集種別のモニター1,2,3は、収集対象の性能情報の種別を示し、無線装置4における性能情報格納テーブル43に格納されている性能情報のモニタータイプ(測定種別)に対応している。
また、性能情報識別子(PM−ID)はリソース軸及び時間軸についてスレッド分割された個々に対応している。EMSサーバ1においては、実行の脈絡であるスレッドの複数個を同時に並列実行する。
(優先度設定を考慮した性能情報の再収集処理)
ヘルスチェックプロセス12によって設定される装置管理テーブル17の監視状態をチェックし、状態が監視となっている無線装置4について性能情報を収集する。
上述した優先度設定を考慮した性能情報の再収集処理について説明する。図13は、図9Aに示す性能情報の収集処理完了後に続けて実施される処理で、現周期の以前に収集に失敗した性能情報についての再収集処理シーケンスを示している。
図13を参照すると、図9Aを参照して説明した現周期の性能情報収集処理が完了した後は、性能情報収集プロセス11は、監視状態が監視である無線装置4における現周期以前に収集に失敗した収集対象情報(NGリスト)を収集NG管理テーブル16から取得する。
さらに、性能情報収集プロセス11は、優先度設定を考慮した性能情報の再収集処理を行うために、再収集可能残時間T、収集した性能情報の項目数と全収集項目数との比率N、及びSNMP応答のロスト率Lを算出または取得する。
つまり、性能情報収集プロセス11は、収集NG管理テーブル16からの取得したNGリストと、優先度設定処理結果とに基づき、該当の無線装置4から性能情報を収集するためにSNMP送受信プロセス13にSNMP GET REQUESTを送信させる。
SNMP GET REQUESTを受信した無線装置4におけるSNMP送受信プロセス41は、性能情報管理プロセス42を介して性能情報格納テーブル43から性能情報を取得し、SNMP GET RESPONSEによりEMSサーバ1に送信する。
無線装置4から正常に性能情報の応答がSNMP GET RESPONSEにより通知され、SNMP送受信プロセス13が受信した場合(正常収集シーケンス)、性能情報収集プロセス11は応答データの性能情報に基づいて性能情報収集管理テーブル15に性能情報を格納し、収集NG管理テーブル16から成功したNGリストを削除する。
なお、同様に、該当の無線装置4から性能情報の応答がSNMP GET RESPONSEにより通知されず、SNMP送受信プロセス13がタイムアウトを検出した場合(異常収集シーケンス)、SNMP送受信プロセス13は性能情報収集プロセス11にタイムアウトを通知する。
タイムアウトを通知された性能情報収集プロセス11は、再度、SNMP送受信プロセス13に性能情報の取得を依頼する。
SNMP送受信プロセス13は、再度、無線装置4に対してSNMP GET REQUESTを送信し、依然として応答がSNMP GET RESPONSEにより通知されずにタイムアウトを検出した場合、なにも処理せずに、次の無線装置4について性能情報の収集を実施する。
上述した性能情報の再収集処理は、収集NG管理テーブル16から取得した収集NGリスト分、繰り返して実施される。ただし、15分の周期を超えた場合は、繰り返し処理を中断して終了する。
その後、性能情報収集プロセス11は、性能情報の再収集が不可となった収集リストを収集NG管理テーブル16から削除する。
[一実施の形態の効果]
上述した一実施の形態の監視システムによれば、回線切断状態が多発する無線ネットワークにおいて、発生時に収集できなかった性能情報の再収集を適正な優先度に応じて実施することができる。
[変形例]
上述した一実施の形態における処理はコンピュータで実行可能なプログラムとして提供され、CD−ROMやフレキシブルディスクなどの非一時的コンピュータ可読記録媒体、さらには通信回線を経て提供可能である。
また、上述した一実施の形態における各処理はその任意の複数または全てを選択し組合せて実施することもできる。
SYS 監視システム
1 EMSサーバ
2 EMSクライアント
3 監視ネットワーク
4 無線装置(A〜I)
11 性能情報収集プロセス
12 ヘルスチェックプロセス
13 SNMP送受信プロセス
14 警報管理テーブル
15 性能情報収集管理テーブル
16 収集NG管理テーブル
17 装置管理テーブル
18 通信管理テーブル
110 再収集優先度設定処理

Claims (4)

  1. 複数の網構成装置の性能情報を予め定められた周期で収集し管理する管理装置であって、
    前記網構成装置の性能情報に関する応答のパケットロスト率L、収集した性能情報の項目数と全収集項目数との比率N、及び再収集可能残時間Tの全てのパラメタに基づいて優先度を算出し、
    算出した優先度に応じて、性能情報を再収集するための優先順位を設定する、
    性能情報収集プロセスを実行するように構成されるプロセッサ、
    を備える管理装置。
  2. 前記応答のパケットロスト率L、前記比率N、及び前記再収集可能残時間Tの全てのパラメタに基づいて優先度を算出するときの計算式は、(1/T)×N×Lである
    請求項1記載の管理装置。
  3. 前記応答のパケットロスト率Lは、特定の通信での予め定められた時間当たりの応答のタイムアウト回数をカウントして求められ、
    前記比率Nは、前記網構成装置毎の収集項目数及び性能測定数に基づく、最大収集項目数と収集項目数との割合から求められ、
    前記再収集可能残時間Tは、性能情報保持期間及び収集失敗時刻から求められる、
    請求項1または2記載の管理装置。
  4. 複数の網構成装置の性能情報を予め定められた周期で収集し管理する管理装置により実行されるプログラムであって、
    前記管理装置のプロセッサに、
    前記網構成装置の性能情報に関する応答のパケットロスト率、収集した性能情報の項目数と全収集項目数との比率、及び再収集可能残時間の全てのパラメタに基づいて優先度を算出し、
    算出した優先度に応じて、性能情報を再収集するための優先順位を設定する、
    性能情報収集プロセスを実行させるプログラム。
JP2012212235A 2012-09-26 2012-09-26 性能情報の収集管理機能を含む管理装置 Expired - Fee Related JP6011203B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012212235A JP6011203B2 (ja) 2012-09-26 2012-09-26 性能情報の収集管理機能を含む管理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012212235A JP6011203B2 (ja) 2012-09-26 2012-09-26 性能情報の収集管理機能を含む管理装置

Publications (2)

Publication Number Publication Date
JP2014067232A JP2014067232A (ja) 2014-04-17
JP6011203B2 true JP6011203B2 (ja) 2016-10-19

Family

ID=50743567

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012212235A Expired - Fee Related JP6011203B2 (ja) 2012-09-26 2012-09-26 性能情報の収集管理機能を含む管理装置

Country Status (1)

Country Link
JP (1) JP6011203B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6561444B2 (ja) * 2014-09-24 2019-08-21 富士ゼロックス株式会社 情報処理装置、情報処理システム及びプログラム
JP7139268B2 (ja) * 2019-03-14 2022-09-20 アラクサラネットワークス株式会社 ネットワーク統計情報の収集装置、通信システム、及び統計情報の収集方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3346312B2 (ja) * 1999-01-08 2002-11-18 日本電気株式会社 ネットワーク管理システム
JP2005018120A (ja) * 2003-06-23 2005-01-20 Hitachi Software Eng Co Ltd ネットワーク管理システムにおける機器情報の収集方法
JP2007241518A (ja) * 2006-03-07 2007-09-20 Nec Corp ネットワーク管理システム、snmpマネージャ、snmpエージェント、状態同期方法及びプログラム
JP2008059114A (ja) * 2006-08-30 2008-03-13 Fujitsu Ltd Snmpを利用した自動ネットワーク監視システム
JP4805081B2 (ja) * 2006-09-29 2011-11-02 富士通株式会社 無線中継装置、無線中継方法および無線中継プログラム
JP5229007B2 (ja) * 2009-03-06 2013-07-03 日本電気株式会社 監視システム、ネットワーク機器、監視情報提供方法およびプログラム

Also Published As

Publication number Publication date
JP2014067232A (ja) 2014-04-17

Similar Documents

Publication Publication Date Title
US12052150B2 (en) Monitoring wireless access point events
RU2641706C1 (ru) Способ обработки отказа сетевой службы, система управления службами и модуль управления системой
CN1672362B (zh) 用于故障测量的方法和装置
US9319284B2 (en) Operation delay monitoring method, operation management apparatus, and operation management program
US20160191357A1 (en) Systems and methods for mapping and visualizing a wireless mesh network
CN110830283B (zh) 故障检测方法、装置、设备和系统
CN108418710B (zh) 一种分布式监控系统、方法及装置
US11334468B2 (en) Checking a correct operation of an application in a cloud environment
WO2017206678A1 (zh) 信息的获取方法及装置
CN106487612A (zh) 一种服务器节点监控方法、监控服务器及系统
US20110122761A1 (en) KPI Driven High Availability Method and apparatus for UMTS radio access networks
JP6011203B2 (ja) 性能情報の収集管理機能を含む管理装置
JP4919935B2 (ja) 警備システム
US11153769B2 (en) Network fault discovery
JP6222759B2 (ja) 障害通知装置、障害通知方法及びプログラム
WO2016101474A1 (zh) 配置数据的监控方法、装置及其系统
JP6488600B2 (ja) 情報処理システム、プログラム及び情報処理装置
JP2015082131A (ja) 監視システム、監視方法、監視プログラム及び監視装置
AU2014200806B1 (en) Adaptive fault diagnosis
US20190158602A1 (en) Data collecting system based on distributed architecture and operation method thereof
JP6073211B2 (ja) サーバ監視方法およびサーバ監視システム
CN116112398B (zh) 链路抖动的抑制方法、装置、存储介质及电子设备
JP6920835B2 (ja) 設備監視装置
JP5824957B2 (ja) 無線通信システム、監視装置及び障害検知方法
CN104426923A (zh) 数据同步方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150604

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160308

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160414

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160823

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160905

R150 Certificate of patent or registration of utility model

Ref document number: 6011203

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees