JP5696029B2 - 通信システム及び通信システムでの統計情報管理方法 - Google Patents

通信システム及び通信システムでの統計情報管理方法 Download PDF

Info

Publication number
JP5696029B2
JP5696029B2 JP2011270393A JP2011270393A JP5696029B2 JP 5696029 B2 JP5696029 B2 JP 5696029B2 JP 2011270393 A JP2011270393 A JP 2011270393A JP 2011270393 A JP2011270393 A JP 2011270393A JP 5696029 B2 JP5696029 B2 JP 5696029B2
Authority
JP
Japan
Prior art keywords
statistical information
communication
communication device
network monitoring
collection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011270393A
Other languages
English (en)
Other versions
JP2013123114A (ja
Inventor
糧輔 倉田
糧輔 倉田
友秀 武田
友秀 武田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2011270393A priority Critical patent/JP5696029B2/ja
Publication of JP2013123114A publication Critical patent/JP2013123114A/ja
Application granted granted Critical
Publication of JP5696029B2 publication Critical patent/JP5696029B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、通信装置より統計情報を常時収集し、これを管理する網監視装置を備える通信システム、及び、この通信システムでの統計情報管理方法に関するものである。
近年、スマートフォンやモバイルデータ通信によるトラフィックの大幅な増加に対応するため、通信事業者が「WiFiスポット」や「Femtoセル基地局」、「WiFiモバイルルータ」などの小型の通信基地局装置を大規模に導入、運営するようになってきている。例えば、鉄道などの車両内にでさえ、データ通信量の増大化に対応しようとする要請から、3G回線のオフロード施策として、WiFiアクセスポイントの設置などが進んできている。光アクセスサービスも普及が進み、光アクセス回線の終端装置も、高機能化、高付加価値サービスへの対応の促進の対象になっている。さらには、電力メータ等も通信機器としての機能を搭載し、スマートグリッド等の新サービスを支える基盤となる計画も進んでいる。
即ち、これらの「CPE(Customer Premises Equipment)」、「Femto Cell基地局」、「HEMS(Home Energy Management System)」、「WiMAX-WiFi中継Router」、「車両搭載の無線リピータ」といったような、比較的低信頼・小型の通信装置からなるインフラの重要性が、今後ますます増大していくものと予想される。
これらの低信頼・小型の通信機器は、従来の伝送装置や交換機といった、高信頼且つ大規模、高可用性の通信インフラと異なる、以下のような特性を持っている。
第1に装置単体は小型小容量であるが、通信ネットワークのシステム当りでの、通信装置数は非常に多く、通信装置が数万〜数百万に達する場合もある。
第2に、通信事業者や通信装置の設置者の都合により、ユーザによる通信装置の使用が停止されてしまうことが頻繁に発生し、ネットワーク管理者が全ての通信装置の状況を把握・管理できるわけではない。
一方、これらの低信頼・小型の通信機器からなるインフラを運用する通信事業者のニーズとして、従来型の高信頼・高可用性機器で実現していたのと同等の、保守・管理機能を確立することが期待される。そのための一環として、トラフィック量や回線品質等の統計情報の常時収集機能が通信装置に求められる。
低信頼・小型の通信装置への適用を考慮した統計情報の収集プロトコルとしてのTR-069において統計情報の収集機能が定義されている(下記先行技術文献)。そこには、通信装置から網監視装置へ、周期的に統計情報を自律送信し、送信完了時にその通知を網監視装置に送信する動作が規定されており、網監視装置はこの通知を確認することで、統計情報取得の成否を判定する。
TR-069CPE WAN Management Protocol v1.1 Version: Issue 1 Amendment Version Date:December 2007
TR-069などにおいて規定されている統計情報の収集方式では、通信装置は、データ転送処理の完了後に、「完了通知」を網監視装置宛に発出する。これは、通信装置から網監視装置への統計情報の転送処理だけでは、網監視装置は正しく統計情報が転送されたかどうかを、確認する「手段」と「契機」を持たないためである。
詳しくは、通信装置は所定の時刻になると、統計情報の収集及び収集後の統計情報の転送処理を開始し、次いで、統計情報の転送が正常に終了すると、通信装置は網監視装置に完了通知を”正常終了”として送信し、さらに、網監視装置は、完了通知が”正常終了”であった場合は、統計情報の転送が正常終了したと判定し、処理を終了するという流れで、通信装置と網監視装置との間の処理が進行する。
一方、通信装置が停止していた場合は、統計情報の転送が起こらず、したがって、データ転送の「完了通知」も発出されないことになるが、それでも、網監視装置からみれば、統計情報の転送処理に異常があり、統計情報の送信が無く、完了通知も来ないのか、そうではなくて、例えば、通信装置のユーザや設置者が電源を切っており、統計情報の転送処理も動作していないだけなのかを、区別することができない。
このために、従来では、網監視装置は、完了通知が来ないことを一律に、エラーと判定せざるを得ず、保守員に通信装置の電源断を原因とするケースも含めて全て保守要請をしてしまい、必要が無い多くの保守稼働負荷を累積させていた。
網監視装置は、統計情報の収集動作の過程で、統計情報の収集インターバル毎に、システムに存在する多くの通信装置から送信完了通知を受信する。数十万〜数百万台規模の通信装置が存在する通信システムにおいては、網監視装置側が膨大な量の通知を定期的に受けることになる。したがって、完了通知が来ない、という事象は深刻なほど大きな数となる。
一方、完了通知が来ないことを、異常事象でないとして、保守員に伝達されないとすると、通信装置の統計情報転送機能が異常状態にあるケースにも拘わらず、これが放置されるという、所謂、サイレント障害の温床になってしまう。
このような問題は、電源断が頻繁に発生する低信頼・小型の通信装置で一層顕著であり、この種の通信装置を膨大に抱えた通信インフラの運営事業者にとってみれば、通信装置から統計情報を定期的に収集して、これを分析して、障害解析や通信システムの効率的な運営や増強計画に役立てようとする際には大きな障害となる。
そこで、本発明は、電源断が頻繁に発生することが避けられない低信頼・小型の通信装置を多数備えた通信システムであっても、実質的に、統計情報の収集、そして、網監視装置への収集した統計情報の転送機能に異常がある通信装置を、他の通信装置から迅速かつ確実に区別して、前者の通信装置に対して速やかに保守対応を可能とする通信システム、そして、通信システムでの統計情報収集管理方法を提供することを目的とするものである。
前記目的を達成するために、本発明は、複数の通信装置が中継回線を介して接続する網監視装置を備える通信システムであって、前記複数の通信装置の夫々は、通信装置や回線品質に関する各種統計情報を収集し、収集した統計情報を前記網監視装置に送信し、前記網監視装置は、前記複数の通信装置夫々についての前記統計情報の収集履歴を記憶する第1のメモリと、前記複数の通信装置夫々との通信履歴を記憶する第2のメモリと、プロセッサと、を備え、前記プロセッサは、前記通信履歴に記憶された最終アクセス日時と予め定めた回数分の統計情報収集周期を含む収集期間の前記統計情報の収集履歴とに基づいて前記複数の通信装置の中で前記統計情報を前記網監視装置に送信することについて障害がある通信装置を特定し、特定結果を出力するように構成されている、ことを特徴とするものである。
本発明によれば、前記通信履歴と前記統計情報の収集履歴とを比較し、その比較結果に基づいて前記複数の通信装置の中で前記統計情報を前記網監視装置に送信することについて障害がある通信装置を判定しているために、網監視装置は、通信装置が起動しているにも拘らず統計情報を収集できない通信装置を特定することができる。
本発明によれば、電源断が頻繁に発生することが避けられない低信頼・小型の通信装置を多数備えた通信システムであっても、実質的に、統計情報の収集、そして、網監視装置への収集した統計情報の転送機能に異常がある通信装置を、他の通信装置から迅速かつ確実に区別して、前者の通信装置に対して速やかに保守対応を可能とする通信システム、そして、通信システムでの統計情報収集管理方法を提供することができる。
図1は、通信システムのネットワーク構成を示すブロック図である。 図2は、網監視装置と通信装置のシステム構成のブロック図である。 図3は、網監視装置のサーバのハードウェアブロック図である。 図4は通信管理テーブルの一例である。 図5は、統計情報収集管理テーブルの一例である。 図6は、図2の統計情報収集管理部106の動作を示すフローチャートである。 図7は、図6の統計情報収集異常判定処理804の第1の形態を示すフローチャートである。 図8は、図7のフローチャートの実行過程で作成される統計情報収集正常性判定テーブルの一例である。 図9は、図6の統計情報収集異常判定処理804の第2の形態を示すフローチャートである。 図10は、図97のフローチャートの実行過程で作成される統計情報収集正常性判定テーブルの一例である。
次に、本発明に係る通信システムの実施形態について説明する。図1は、通信システムのネットワーク構成を示すブロック図である。複数の小型通信装置108が、広域LAN等からなる中継回線210を介して、網監視装置101に接続されている。網監視装置101には監視クライアント201が接続している。
図2は、網監視装置101と通信装置108のシステム構成のブロック図である。多数の通信装置108からなる通信装置群を監視する網監視装置101には、網監視サーバプログラム102がインストールされている。網監視サーバプログラム102は、個々の通信装置に対する制御プロトコル終端用の網監視サーバ通信プロトコル部104を機能させている。
網監視サーバプログラム102は、網監視サーバ通信プロトコル部104を介して、通信装置108と制御データの送受信113を行うことにより通信装置108を監視している。網監視サーバプログラム102は、通信機毎の通信履歴をストレージ105の通信情報管理データベースに記録すると共に、図示しないデータベースサーバを介して、通信装置の稼働情報(例えば、最終アクセス日時等)を含む通信管理テーブル103を受領する。最終アクセス日時とは、網監視サーバプログラム102が通信装置108から受けた最新の制御用通信の「応答」もしくは網監視サーバプログラム102が通信装置108から受領した最新の制御通信の「通知」の日時をいう。
網監視サーバ通信プロトコル部104と、通信装置108との間では、snmpやTL1、SOAPなどの各種通信プロトコルによって、定期的な死活監視用のメッセージ通信の送受信や、保守コマンドなどによる設定要求、その応答、及び、障害や状態変化時に行う通信装置108から網監視装置101への通知など、様々な制御データ/制御メッセージの通信が行われる。網監視サーバプログラム102は、制御データ/制御メッセージの通信履歴から、通信装置108の通信機能の稼働状態を監視すると共に、後述の統計情報の収集履歴に基づいて通信装置108の統計情報収集機能の稼働状態を監視する。
通信装置108が、snmp等に基づく制御データの通信113を介して網監視装101に登録されると、網監視サーバプログラム102は、登録日時をストレージ105に記録する。
通信装置108は、網監視装置101とのデータ送受信と装置内の制御を行う「エージェントプログラム109」を常駐させ、さらに、エージェントプログラム109は、既述の網監視装置101に対する通信プロトコルの終端となるエージェント通信プロトコル部110を動作させている。
通信装置108が統計情報を定期的・周期的に収集して、網監視装置101に送信するために、通信装置108は、統計情報の収集を行う統計情報収集プログラム111を稼働させている。統計情報収集プログラム111は、収集した統計情報112を定期的にファイルやデータベースなどのバルク形式として網監視装置101の統計情報プログラムに出力する(114)。統計情報プログラムは受信した統計情報をストレージ105に蓄積する。
通信装置108は、統計情報112を、網監視装置101に送信する際、fftp、http、SOAPなどのプロトコルを利用し、網監視サーバ通信プロトコル部104を経由させないようにしている。
網監視サーバプログラム102は、通信装置108の統計情報収集機能の稼働状態を監視するために、統計情報収集管理部106を稼働させる。統計情報収集管理部106は、周期的に動作を行い、図3において後述する、データベースサーバを介して、統計情報収集管理テーブル107を作成する。統計情報収集管理部106は、通信管理テーブル103及び統計情報収集管理テーブル107に基づいて、後述のフローチャートを実行し、複数の通信装置群の中から、統計情報を正しく送信できない通信装置を抽出し、その中で、実質的に統計情報の収集機能に異常を来している通信装置を特定し、保守員にこの特定情報を通知する。
統計情報とは、例えば、単位時間当たりの、ビットレート、パケット数、(エラー)フレーム数、そして、ユーザ数である。「実質的に統計情報の収集機能に異常をきたしている通信装置」とは、電源がオン状態であって、網監視装置101との間で制御通が可能なものの、統計情報を網監視装置101が受信できないものをいう。この原因として、例えば、通信装置108内のハードウェア異常、網監視装置101への統計情報の転送のための設定の誤りがある。これに対して、「統計情報の収集機能に実質的な異常がない通信装置」とは、電源がオフされていて、統計情報を送信できないにすぎない通信装置をいう。
図3は、網監視装置101のデータベースサーバ300のハードウェアブロック図である。網監視装置101は、統計情報の収集管理機能及び通信装置との制御通信管理機能を実行するプロセッサ(CPU)301と、網監視サーバプログラム102と統計情報収集プログラムと、これらプログラムの実行に必要な制御データとが格納された補助記憶装置(HDD)307と、補助記憶装置307から、これらプログラムと制御データとを取り込んで、プロセッサ301に利用させる主記憶装置306と、網監視クライアント201からの入力データの入力部304と網監視クライアント201に対する出力データの出力装置306と、入力装置304と出力部305に対するI/Oインターフェース302と、通信装置108との通信のためのネットワークカード302と、以上の各ブロックを互いに接続するバス308と、を備えている。
図3では、網監視装置101が、統計情報を受付けるftp/httpサーバと、制御通信であるTL1/snmpを終端させる網監視サーバと、を網監視サーバとして、同一計算機ハードウェアに実装したものとして説明したが、これらサーバを別の計算機ハードウェアに実装させるようにしてもよい。
図4は通信管理テーブル103の一例である。このテーブルには、通信装置の識別欄401と、既述の最終アクセス日時と、統計情報収集機能実行有無設定欄403と、通信装置の登録日時欄404と、がある。統計情報収集機能実行有無設定欄403において、[Enable]とは、統計情報を収集して網監視装置101に送信されるべき通信装置であることを示している。
図5は、統計情報収集管理テーブル107の一例を示す。同テーブルには、通信装置の識別欄501と、統計情報の収集周期毎での統計情報の有無を記載した欄503と、統計情報が存在する最終(最新)の収集周期(最終統計情報日時)の欄502とが存在する。
図5は、[○]が付された統計情報収集周期で何らかの統計情報が通信装置108から網監視装置101に到達したことを示している。統計情報収集周期とは、図5の例では、3時間である。3時間毎に通信装置の統計情報収集プログラム111は統計情報の収集とその網監視装置101への送信を行う。[○]が付されていない統計情報収集周期では統計情報が網監視装置101に到達されていないことを示している。
次に、統計情報収集管理部106の動作を図6に示すフローチャートに基づいて説明する。なお、このフローチャートは、網監視サーバプログラム102を実行するプロセッサ301によって実行される。
統計情報収集管理部106は、タイマ割り込みなどによって、周期的に起動し(802)、通信管理テーブル103から、判定対象となる通信装置を1台選択し(803)し、統計情報収集異常判定処理を実行する(804)。この統計情報収集異常判定処理の詳細については、後に説明する。
次いで、この統計情報収集異常判定処理の応答値に異常があるか否かを判定する(805)。応答値が、「異常あり」であった場合(ステップ805:Yes)には、保守者に異常を通知する必要がある。既に、保守者に「統計情報収集異常」が発出され通知済みかどうかを判定し(806)し、未通知であれば「統計情報収集異常」の発生通知を保守者に通知する(807)。逆に、「統計情報収集異常判定処理」の応答値が、「異常なし」であった場合(ステップ805:No)には、該当通信装置の統計情報収集状態は「正常」であるため、該当通信装置について「統計情報収集異常」が発出されているかどうかを判定し(808)、発出されている状態であれば「統計情報収集異常」の回復通知を保守者に通知する(809)。通信管理テーブル103の監視対象の全通史装置について判定が終了するまで、既述のステップを繰り返す(810)。なお、図6の801はフローチャートの開始端を示し、811はフローチャートの終了端を示す。
次に、統計情報収集異常判定処理804の第1の形態を図7のフローチャートに基づいて説明する。統計情報収集管理部106は、統計データ収集管理テーブル107(図5)にアクセスし、統計情報収集正常性の判定対象の該当通信装置(図5の501)について、過去N回分(Nは正の整数)の統計情報収集周期を含む期間「t1からt2」に該当する期間の、統計情報が何個取得済みになっているかを確認する(902)。
統計情報収集管理部106は、「t1からt2」の統計情報の収集期間から、通信装置108が起動してエージェントプログラム109がエージェント通信プロトコル部110を介して網監視装置101と通信可能になってから、統計情報収集プログラム111が統計情報112を生成しさらにこれを網監視装置のストレージ105に十分転送完了するだけの所要時間、を差し引いた、オフセット時刻として「t1’からt2’」の時刻範囲を決定する。なお、時刻範囲の開始、終了それぞれでの「t1からt1’」、「t2からt2’」のオフセット時間長は、予め固定の値が与えられているものとする。
次に、「t1からt2」の間に、取得済み統計情報数が0個であるか否かを判定し(903)、0個であった場合、該当通信装置108と網監視サーバ通信プロトコル部104との通信状況を確認するため、通信制御テーブル103にアクセスし、該当通信装置の最終アクセス日時402を取得する(904)。取得した最終アクセス日時が、前述の「t1’からt2’」の時刻範囲にあるかどうかを確認し(905)、t1’からt2’に該当した場合は、「該当通信装置は正しく起動されているが、統計情報は送られていない状態」、即ち、「統計情報が取れているはずであるが、採れていない状態」を検知したものとして、対象通信装置で統計情報収集異常ありと判定する(906)。
一方、統計情報数(主として、統計情報のファイル数)が一つ以上である場合(903:No)、又は、最終アクセス時刻がt1’からt2’(905:No)の場合、統計情報収集管理部106は「対象通信装置は正しく起動されていないため(電源断)、統計情報は送られていない」として、対象通信装置に統計情報収集異常はないと、判定する(907)。なお、図7の901はフローチャートの開始端を示し、908はフローチャートの終了端を示す。
統計情報収集管理部106は、図7のフローチャートを実行する過程で、図8に示す統計情報収集正常性判定テーブルを作成して、このテーブルを利用して統計情報収集状態の判定を行い、判定結果をこのテーブルに登録する。図8の判定テーブルは、判定対象通信装置の識別欄601と、既述の最終アクセス日時の欄602と、統計情報収集機能実行有無設定の欄603と、通信装置の登録日時の欄604と、統計情報収集管理部106による確認動作周期での統計情報数の欄605、統計情報収集状態の欄606を有する。
図8の判定テーブルは、統計情報収集周期を3時間、前記オフセット時間長を1時間、統計情報収集管理部106による確認動作の起動周期が24時間(N=8)であり、確認動作が2011/9/2 00:30に起動した場合を示している。統計情報収集管理部106は毎日00:30に起動し、その時点で収集可能な最新統計情報収集周期である[21:00〜24:00]を含む過去8周期に対応する[00:00〜24:00]の統計情報の収集個数605を、装置毎に集計する。この例ではオフセット時刻は[00:00〜23:00]である。
統計情報収集管理部106は、装置1〜3に対して、期間内における統計情報数が8(605)であり、0個ではないため、統計情報収集異常なし(図7のステップ907)と判定する。統計情報収集管理部106は、装置4に対しては、期間内の統計情報の収集個数が0個であるため、該当通信装置の最終アクセス日時(602)を確認する。最終アクセス日時[2011/9/1 15:15]がオフセット時刻範囲内にあるため、統計情報収集管理部106は、通信装置4を起動しているにも拘わらず、統計情報を送信できないものとして、統計情報収集異常あり、と判定する(図7のステップ906)。
装置5では、収集期間の統計情報の収集個数が0であるため、統計情報収集管理部106が最終アクセス時刻(602)を確認することは、通信装置4と同じであるが、通信装置5の最終アクセス日時は「2011/9/1 23:43」であり、オフセット時刻範囲に当てはまらない。即ち、統計情報収集管理部106は、「2011/9/1 23:43」の近傍の時刻に通信装置が起動されたばかりであり、起動後最初の統計情報が網監視装置101に到着していないだけだとして、通信装置を統計情報収集異常なしと判定する(図7のステップ906)。
装置6では、収集期間の収集個数が0であるため、統計情報収集管理部106が最終アクセス時刻(602)を確認することは、通信装置5と同じである。そして、最終アクセス時刻は「2011/8/31 16:14」であり、オフセット時刻範囲に含まれない。そこで、統計情報収集管理部106は、通信装置6を、「2011/9/1 00:00〜24:00」には統計情報の送信がないが、これは単に通信装置が停止していた(電源断)に過ぎず、統計情報の送信自体に障害はないとして、通信装置を統計情報収集異常なし、と判定する(図7のステップ907)。
なお、既述のように、図8の判定テーブルでは、各通信装置について、統計情報の収集機能の有効・無効設定のレコード(603)が含まれているため、統計情報収集管理部106は、当該レコードがEnableである通信装置についてのみ、統計情報収集の可否判定を行うようにしてもよい。
次に、統計情報収集異常判定処理804の第2の形態を図9のフローチャートに基づいて説明する。統計情報収集管理部106は、統計情報収集管理テーブル107(図5)を参照して、統計情報収集正常性の判定対象の該当通信装置(501)毎について、最終統計情報日時の欄(502)をチェックする(1002)。この欄にデータの登録がある場合(ステップ1003:No)には、登録データを「最終統計情報日時」とし、登録が無い場合には(ステップ1003:Yes)、通信管理テーブル103(図4)を参照して、同一の通信装置の登録日時(404)を「最終統計情報日時」とする(1004)。
図10は、統計情報収集異常判定処理の第2の形態に係る判定テーブルの例である。統計情報収集管理部106は、通信管理テーブル103(図4)から、各通信装置(401)について、最終アクセス日時(402)、装置登録日時(404)を読み込んで、図10の判定テーブルの装置毎(701)の欄(702)、(703)に登録する。さらに、統計情報収集管理テーブル107(図5)の最終統計情報日時を、図10の判定テーブルの欄704に登録する。装置5について、統計情報収集管理テーブル107(図5)によれば、最終統計情報日時が記録されていないために、装置登録日時がそのまま記録される。
次に、統計情報収集管理部106は、各通信装置について、「最終アクセス日時」から「最終統計情報時刻」を引いた時間差を求め、判定テーブル(図10)に登録する。次いで、各装置についての時間差が予め指定された時刻差に関する閾値を超えているか否かを判定する(1006)。この時間差が閾値を越えている場合には、判定テーブル10のエラーカウント(706)に1を加算する(1007)。閾値を越えていない場合には、エラーカウントをリセットして(1010)、該当通信装置ではデータ収集異常はないと判定する(1011)。
次に、統計情報収集管理部106は、各通信装置について、図10の判定テーブルを参照して、エラーカウントの値が、予め設定されていたエラーカウント閾値を超えているかどうかを判定する(1008)、超えていた場合には対象の通信装置で統計情報収集異常ありと判定する(1009)。エラーカウント閾値を越えていない場合、対象の通信装置で統計情報収集異常なしと判定する(1011)。
図10に示す判定テーブルは、統計情報収集管理部106による統計情報収集周期を3時間とし、確認動作周期を12時間毎(判定時刻: 00:30,12:30)とし、時刻差の異常判定閾値を12時間として、エラーカウント閾値を「2」として、確認処理を2011/9/2 00:30に起動させたことを例としたものである。
装置1について、2011/9/2 00:30における「最終アクセス日時」から「最終統計情報日時」までの時間差が00:20であり、時刻差の異常判定閾値である12[h]を下回っているため、統計情報収集管理部106は、装置1を統計情報収集に異常なしと判定する。同様に、装置2、装置3を異常なしと判定する。
装置4について、2011/9/2 00:30における時刻差が24:15であり、時刻差の異常判定閾値である12[h]を上回っているため、エラーカウントを1加算すると、この時点でエラーカウントが閾値である2に達するため、統計情報収集管理部106は、装置4を「統計情報収集異常あり」と判定する。
装置5について、2011/9/2 00:30における時刻差が36:43と、時刻差の異常判定閾値である12[h]を上回っているため、統計情報収集管理部106は装置4の場合と同様に、エラーカウントを1加算するが、この時点でのエラーカウントが1であり、閾値である2に達していないため、「統計情報収集異常なし」と判定する。したがって、通信装置を網監視装置に登録後、暫くしてから電源を入れた場合、このような通信装置を統計情報収集異常と誤って判定しないようにしている。そして、その後の確認動作タイミングで実質的な統計情報の収集異常が装置5にあると、エラーカウント値が2となるため、初めて、統計情報収集異常と判定される。
装置6については、2011/9/2 00:30における時刻差が01:14であり、時刻差の異常判定閾値である12[h]を下回っているため、装置6を異常なしと判定する。
なお、図8の判定テーブルでは、統計情報収集周期を3時間、前記オフセット時間長を1時時、統計情報収集管理部106による確認動作の起動周期が24時間(N=8)としたが、これらは適宜変更できる。例えば、起動周期を短縮すると、通信装置に対する障害判定までの早さは上がるものの、障害と擬似判定される通信装置の数が増える。一方、起動周期を長くすると、通信装置に対する障害判定を下すまでの期間が長くなり過ぎ、復旧保守動作を行うまでに、多くの統計データが失われるおそれがある。起動周期としての前記Nは3〜10程度が好適である。
さらに、図10の判定テーブルでは、時間差の異常判定閾値を12時間とし、エラーカウントの閾値を2としたが、適宜変更可能である。
101 網監視装置
102 網監視サーバプログラム
104 網監視サーバ通信プロトコル部
105 ストレージ
106 統計情報収集管理部
108 通信装置
109 エージェントプログラム
111 統計情報収集プログラム
112 統計情報

Claims (9)

  1. 複数の通信装置が中継回線を介して接続する網監視装置を備える通信システムであって、
    前記複数の通信装置の夫々は、通信装置や回線品質に関する各種統計情報を収集し、収集した統計情報を前記網監視装置に送信し、
    前記網監視装置は、前記複数の通信装置夫々についての前記統計情報の収集履歴を記憶する第1のメモリと、前記複数の通信装置夫々との通信履歴を記憶する第2のメモリと、プロセッサと、を備え、
    前記プロセッサは、前記通信履歴に記憶された最終アクセス日時と予め定めた回数分の統計情報収集周期を含む収集期間の前記統計情報の収集履歴とに基づいて前記複数の通信装置の中で前記統計情報を前記網監視装置に送信することについて障害がある通信装置を特定し、特定結果を出力するように構成されている、通信システム。
  2. 前記プロセッサは、前記複数の通信装置の夫々について、
    前記予め定めた回数分の統計情報収集周期を含む統計情報の収集期間を設定し、
    前記統計情報の収集履歴と前記収集期間とに基づいて、当該収集期間内に前記統計情報が存在していないか否かの第1判定を実行し、
    前記最新のアクセス日時が前記収集期間に含まれるか否かの第2判定を実行し、
    前記第1判定及び前記第2判定が肯定される通信装置を前記障害がある通信装置として特定する、請求項1記載の通信システム。
  3. 前記第1判定及び前記第2判定の少なくとも一方が否定される通信装置を、前記障害がない通信装置として特定する、請求項2記載の通信システム。
  4. 前記プロセッサは、前記複数の通信装置の夫々について、
    前記統計情報の収集履歴から最新の統計情報の収集日時を取得し、
    前記最新のアクセス日時と前記最新の統計情報の収集日時との差分を求め、
    当該差分と閾値とを比較し、
    当該比較結果に基づいて、前記特定を行う、請求項記載の通信システム。
  5. 前記プロセッサは、前記複数の通信装置の夫々について、
    エラーカウントを設定し、
    前記差分が前記閾値を越えると判定すると前記エラーカウントをインクリメントし、
    前記差分が前記閾値以下と判定すると前記エラーカウントをリセットし、
    前記差分と前記閾値との比較の後、前記エラーカウントと第2の閾値とを比較し、
    前記エラーカウント前記第2の閾値との比較結果に基づいて前記特定を行う、請求項記載の通信システム。
  6. 前記プロセッサは、前記エラーカウントが前記第2閾値以上であると判定される通信装置を前記障害がある通信装置として特定する、請求項5記載の通信システム。
  7. 前記プロセッサは、前記統計情報の収集履歴から、前記統計情報が存在しないと判定した通信装置について、当該通信装置の前記網監視装置への登録日を前記最新の統計情報の収集日時として設定する、請求項記載の通信システム。
  8. 前記プロセッサは、電源が投入された通信装置について、前記通信装置の前記網監視装置への登録日を前記最新の統計情報の収集日時として設定し、前記差分が前記閾値を越えると判定した後、前記エラーカウントが前記第2閾値以下と判定することにより、当該通信装置を前記障害がない通信装置として特定する、請求項記載の通信システム。
  9. 複数の通信装置が中継回線を介して接続する網監視装置を備える通信システムでの統計情報管理方法であって、
    前記複数の通信装置の夫々は、通信装置や回線品質に関する各種統計情報を収集し、収集した統計情報を前記網監視装置に送信し、
    前記網監視装置は、前記複数の通信装置夫々についての前記統計情報の収集履歴と前記複数の通信装置夫々との通信履歴とを記憶し、前記通信履歴に記憶された最終アクセス日時と予め定めた回数分の統計情報収集周期を含む収集期間の前記統計情報の収集履歴とに基づいて前記複数の通信装置の中で前記統計情報を送信することについて障害がある通信装置を特定し、特定結果を出力する、通信システムでの統計情報管理方法。
JP2011270393A 2011-12-09 2011-12-09 通信システム及び通信システムでの統計情報管理方法 Active JP5696029B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011270393A JP5696029B2 (ja) 2011-12-09 2011-12-09 通信システム及び通信システムでの統計情報管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011270393A JP5696029B2 (ja) 2011-12-09 2011-12-09 通信システム及び通信システムでの統計情報管理方法

Publications (2)

Publication Number Publication Date
JP2013123114A JP2013123114A (ja) 2013-06-20
JP5696029B2 true JP5696029B2 (ja) 2015-04-08

Family

ID=48774861

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011270393A Active JP5696029B2 (ja) 2011-12-09 2011-12-09 通信システム及び通信システムでの統計情報管理方法

Country Status (1)

Country Link
JP (1) JP5696029B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07170261A (ja) * 1993-09-20 1995-07-04 Hitachi Ltd ネットワーク装置及びネットワーク監視システム
US8140614B2 (en) * 2005-06-02 2012-03-20 International Business Machines Corporation Distributed computing environment with remote data collection management
JP2008172592A (ja) * 2007-01-12 2008-07-24 Hitachi Ltd クラスタシステム、コンピュータおよびその異常検出方法
JP5042095B2 (ja) * 2008-03-24 2012-10-03 三菱電機株式会社 通信装置および障害監視方法

Also Published As

Publication number Publication date
JP2013123114A (ja) 2013-06-20

Similar Documents

Publication Publication Date Title
CN107547589B (zh) 一种数据采集处理方法以及装置
EP2563062B1 (en) Long connection management apparatus and link resource management method for long connection communication
CN110830283B (zh) 故障检测方法、装置、设备和系统
EP3101872B1 (en) Load balancing server for forwarding prioritized traffic from and to one or more prioritized auto-configuration servers
CN103166773A (zh) 监测服务器运行状态的方法与系统
WO2011143899A1 (zh) 一种移动通讯数据的采集方法和装置
US7804775B2 (en) Apparatus and computer program for identifying selected applications utilizing a single existing available bit in frame headers
GB2593527A (en) Network monitoring system and method
CN110705893A (zh) 一种业务节点管理方法、装置、设备以及存储介质
JP2013222313A (ja) 障害連絡効率化システム
EP2953295B1 (en) Automatic delta event synchronization in multiple manager-agent environments
JP4901796B2 (ja) ログレベル収集装置およびログレベル収集方法
CN100413248C (zh) 一种基于流量进行计费的改进方法和系统
KR20200007912A (ko) 데이터 트래픽을 모니터링하기 위한 방법, 장치 및 시스템
WO2012071810A1 (zh) 网管性能非粒度数据快速存储的方法及装置
JP5696029B2 (ja) 通信システム及び通信システムでの統計情報管理方法
JP2009187230A (ja) サーバの監視装置
GB2593529A (en) Network monitoring system and method
CN105592485A (zh) 一种基于snmp网管协议实时采集并处理消息的方法
JP2004062441A (ja) サービス管理システム、サービス管理方法、サーバ管理装置、通信端末及びサーバ装置
WO2014169547A1 (zh) 对终端外设的操作的处理方法及装置
JP5140692B2 (ja) ポーリング伝送システム、ポーリング伝送方法、および、ポーリング伝送プログラム
CN113965447B (zh) 一种在线云诊断方法、装置、系统、设备及存储介质
CN101917699A (zh) 基于用户的随机上报信令跟踪方法和装置
KR100612254B1 (ko) Snmp를 사용하는 네트워크 관리 시스템의 통계 데이터관리 방법 및 그 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131108

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140520

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140624

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140813

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150209

R150 Certificate of patent or registration of utility model

Ref document number: 5696029

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150