JP4255366B2 - ネットワーク監視プログラム、ネットワーク監視方法、およびネットワーク監視装置 - Google Patents
ネットワーク監視プログラム、ネットワーク監視方法、およびネットワーク監視装置 Download PDFInfo
- Publication number
- JP4255366B2 JP4255366B2 JP2003399937A JP2003399937A JP4255366B2 JP 4255366 B2 JP4255366 B2 JP 4255366B2 JP 2003399937 A JP2003399937 A JP 2003399937A JP 2003399937 A JP2003399937 A JP 2003399937A JP 4255366 B2 JP4255366 B2 JP 4255366B2
- Authority
- JP
- Japan
- Prior art keywords
- network
- failure
- application
- connection
- monitoring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0677—Localisation of faults
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0823—Errors, e.g. transmission errors
- H04L43/0829—Packet loss
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0852—Delays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/10—Active monitoring, e.g. heartbeat, ping or trace-route
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/18—Protocol analysers
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Monitoring And Testing Of Transmission In General (AREA)
- Debugging And Monitoring (AREA)
- Computer And Data Communications (AREA)
Description
本発明の第4の態様では上記課題を解決するために、ネットワーク上の障害発生箇所を検出するためのネットワーク監視装置において、前記ネットワーク上で障害の発生原因となり得る要素が予め分類され、分類された要素に対して、前記ネットワークを介した通信の異常を示す事象が対応付けられた障害箇所判定テーブルを記憶する記憶手段と、前記ネットワーク上の他の機器との間の通信状況を監視する通信状況監視手段と、前記通信状況監視手段で検出された通信内容から異常を示す事象を検出する異常検出手段と、前記障害箇所判定テーブルを参照し、前記異常検出手段で検出された事象の発生原因となる要素を判定する障害箇所判定手段と、障害箇所判定手段での判定結果を示す障害情報を出力する障害情報出力手段と、を有することを特徴とするネットワーク監視装置が提供される。
まず、実施の形態に適用される発明の概要について説明し、その後、実施の形態の具体的な内容を説明する。
このようなネットワーク監視プログラムによれば、通信状況監視手段1eにより、ネットワーク上の他の機器との間の通信状況が監視される。そして、異常検出手段1fにより、通信状況監視手段1eで検出された通信内容から異常を示す事象が検出される。すると、障害箇所判定手段1gにより、異常検出手段1fで検出された事象の発生原因となる要素が判定される。そして、障害情報出力手段1hにより、障害箇所判定手段1gでの判定結果を示す障害情報8が出力される。
図4は、Webサーバのソフトウェア構成例を示す図である。図4において、ネットワーク監視部100a,100bがネットワーク監視機能を司っている。
図5は、ネットワーク監視部の機能を示すブロック図である。カーネル側のネットワーク監視部100aは、パケット解析部120とコネクション監視部130とを有する。
コネクション監視部130は、パケット解析部120から渡された解析結果に基づいて、コネクションの状態を監視し、コネクションの異常等を検出する。コネクションの監視には、コネクション毎のコネクションテーブル140,140a,140b,・・・が利用される。コネクションテーブル140,140a,140b,・・・には、現在のコネクションの状態やエラー等の発生状況が記録される。
図6は、障害発生箇所のハードウェア的な区分けを示す図である。障害発生箇所を示す領域は、自装置11、隣接伝送路12、非隣接伝送路13、および相手装置14に分けられる。自装置11での障害とは、Webサーバ100自身の装置内で発生した障害であるが、通信インタフェース106a,106b,106c,106dで発生した障害は除く。隣接伝送路12で発生した障害とは、通信インタフェース106a,106b,106c,106dからSW443,444との間の通信機能で発生した障害である。非隣接伝送路13で発生した障害とは、SW443,444と通信相手の装置(たとえば、DBサーバ240)との間の通信機能で発生した障害である。相手装置14で発生した障害とは、通信相手の装置(たとえば、DBサーバ240)で発生した障害である。
図7は、障害発生箇所のソフトウェア的な区分けを示す図である。図7の例では、Webサーバ100において、Webサーバ機能21に加えてDBサーバ機能22が実装されている場合を想定している。ここで、伝送路31,32を介して受け取ったパケットは、レイヤ3(ネットワーク層)の通信機能23とレイヤ4(トランスポート層)の通信機能24を介してWebサーバ機能21やDBサーバ機能22に渡される。
障害発生機能分類テーブル152には、障害の検知条件と、その障害のソフトウェア的な発生箇所を示す情報とが登録されている。具体的には、障害発生機能分類テーブル152には、検知条件の欄と障害発生機能の欄とが設けられている。各欄の横方向に並べられた情報同士が互いに関連づけられている。
通常、Webサーバ100からAPサーバ220への再送が発生していても異常が発生していないと考えられている。しかし、Webサーバ100からAPサーバ220へのパケットの再送が発生しているということは、伝送路またはサーバでパケットが失われたことを意味している。この頻度が高くなると重大なトラブルに発展してしまう。たとえば、Webサーバ100からAPサーバ220へ頻繁に再送パケットが送られていれば、APサーバ220でCPU等の能力不足などが発生し始めている場合が考えられる。このようなトラブルの予兆を検出して障害情報として管理者に通知すれば、重大なトラブルが発生する前に対処が可能となる。
図10は、ネットワーク監視処理手順を示すフローチャートである。以下、図10に示す処理をステップ番号に沿って説明する。なお、以下の処理は、他の装置との間の通信が行われる毎に実行される。
[ステップS13]パケット解析部120は、抽出したヘッダ情報を解析する。この処理の詳細は後述する。
図11は、ヘッダ情報解析処理の手順を示すフローチャートである。以下、図11に示す処理をステップ番号に沿って説明する。
図12は、コネクション上での通信例を示す図である。図12は、Webサーバ100に実装されたネットワーク監視機能によって、APサーバ220との間で確立したコネクションを監視した場合の例を示している。ここで、Webサーバ100のIPアドレスは「192.168.10.10」であり、Webサーバとして機能を提供するアプリケーションのポート番号は「80」である。また、APサーバ220のIPアドレスは「192.168.10.20」であり、処理機能を提供するアプリケーションのポート番号は「10000」である。
自側IPは、自分のIPアドレスである。図14の例では、IPアドレスは「192.168.10.10」である。
相手側IPは、通信相手側の装置のIPアドレスである。図14の例では、相手側のIPアドレスは「192.168.10.20」である。
重複受信カウンタは、同一パケットを重複して受け取った回数である。図14の例では、パケットの重複受信は発生していない。
応答遅延カウンタは、自装置においてパケットを受信してから通信相手に応答を返すまでの時間が基準値を超えてしまった回数である。自装置の処理負荷が過大である場合に、応答の遅延が発生する。そのために応答遅延の発生回数をカウントすることで、自装置の処理負荷の増大による障害の発生を検知できる。図14の例では、応答遅延は発生していない。
パケット数カウンタは、送受信したパケットの総数を示すカウンタである。図14の例では、パケット数カウンタの値は「0」である。
シーケンス番号予測の欄には、相手装置に対して次に送信されるパケットのシーケンス番号の予測値が設定される。前回送信されたパケットのシーケンス番号にデータ長を加えた値がシーケンス番号の予測値となる。次に送信されたパケットのシーケンス番号がシーケンス番号予測値より小さければ、パケットの再送が行われたことが分かる。
シーケンス番号予測の欄には、相手装置から次に受信するパケットのシーケンス番号の予測値が設定される。前回受信したパケットのシーケンス番号にデータ長を加えた値がシーケンス番号の予測値となる。次に受信したパケットのシーケンス番号がシーケンス番号予測値より小さければ、パケットの重複受信であることが分かる。
図17は、送信監視テーブルと受信監視テーブルとの状態遷移を示す第1の図である。
図18は、送信監視テーブルと受信監視テーブルとの状態遷移を示す第2の図である。
状態ST5は、図12に示すパケット45の送信直後(時間6.0)の状態である。Webサーバ100がパケット45を送信すると、コネクション監視部130が送信側のシーケンス番号を予測し、送信監視テーブル142を更新する。
[ステップS31]障害判定部160は、コネクション情報を解析する。この処理の詳細は後述する。
図20は、コネクション情報解析処理の手順を示すフローチャートである。以下、図20に示す処理をステップ番号に沿って説明する。
[ステップS42]障害判定部160は異常箇所推定テーブル170を生成し、集計結果をコード化する(以下、コード化された情報をステータスコードと呼ぶ)。
[ステップS44]障害判定部160は、トラブル事象DB150内に該当するトラブル事象を検出し、トラブル箇所や原因を判断する。
図22は、ステータスコードの例を示す図である。この例では、再送、重複受信、パケットロスト、送信側応答遅延、および受信側応答遅延に対応するステータスコード171が設定されている。ステータスコードの値は、以下の意味を有している。
0:コネクションでトラフィック無し
1:正常コネクション有り
2:特定IPアドレスで異常イベント有り(正常コネクション無し)
3:特定IPアドレスで異常イベント有り(正常コネクション有り)
4:複数IPアドレスで異常イベント有り(正常コネクション無し)
5:複数IPアドレスで異常イベント有り(正常コネクション有り)
障害判定部160は、ステータスコード171に基づいて異常の発生数を認識し、トラブル事象DB150より該当する検知条件を検索する。そして、検出された検知条件に基づいて、今回発生した現象の障害発生箇所を判定する。
以上のような障害箇所の判定が各サーバ上で行われ、障害情報が生成される。各サーバで生成された障害情報110は、管理サーバ300で収集される。収集される障害情報110には、ステータスコード(マージ処理で生成したもの)やエラーメッセージ(マージ処理で推定した結果(異常発生箇所・原因の推定結果))が含まれる。管理サーバ300は、収集した障害情報に基づいて、ネットワーク内での障害箇所をより正確に特定する。
[ステップS51]管理サーバ300は、他のサーバのネットワーク監視機能から、異常ログが送られるのを待機する。
構成情報表示部61には、ネットワーク内のノードの配置と接続関係とが表示されている。図24の例では、異常を検出したサーバが強調表示されている。これにより、管理者による障害箇所の確認が容易となる。
以上説明したように、本実施の形態によれば、各サーバにおいてネットワーク上の障害箇所を判定することができる。しかも、ハードウェア的な障害箇所と、ソフトウェア的な障害箇所との判定が可能である。これにより、ネットワーク管理者の経験に頼らずに、迅速に障害箇所を特定することができる。
図26は、アプリケーションがサーバの場合のコネクション管理テーブルのデータ構造例を示す図である。このコネクション管理テーブル141aの内容は、図14に示したコネクション管理テーブル141とほぼ同じであるが、相手側IPと相手側Portの内容が異なっている。
コンピュータを、
前記ネットワーク上で障害の発生原因となり得る要素が予め分類され、分類された要素に対して、前記ネットワークを介した通信の異常を示す事象が対応付けられた障害箇所判定テーブルを記憶する記憶手段、
前記ネットワーク上の他の機器との間の通信状況を監視する通信状況監視手段、
前記通信状況監視手段で検出された通信内容から異常を示す事象を検出する異常検出手段、
前記障害箇所判定テーブルを参照し、前記異常検出手段で検出された事象の発生原因となる要素を判定する障害箇所判定手段、
前記障害箇所判定手段での判定結果を示す障害情報を出力する障害情報出力手段、
として機能させることを特徴とするネットワーク監視プログラム。
前記通信状況監視手段は、アプリケーション間のコネクションと装置間のコネクションとの確立の有無を監視することを特徴とする付記8記載のネットワーク監視プログラム。
前記通信状況監視手段は、前記トランスポート層でのコネクションと前記ネットワーク層でのコネクションとの確立の有無を監視することを特徴とする付記8記載のネットワーク監視プログラム。
(付記13) ネットワーク上の障害発生箇所を検出するためのネットワーク監視プログラムにおいて、
コンピュータを、
前記ネットワーク上で障害の発生原因となり得る要素が予め分類され、分類された要素に対して、前記ネットワークを介した通信の異常を示す事象が対応付けられた障害箇所判定テーブルを記憶する記憶手段と、前記ネットワーク上の他の機器との間の通信状況を監視する通信状況監視手段と、前記通信状況監視手段で検出された通信内容から異常を示す事象を検出する異常検出手段と、前記障害箇所判定テーブルを参照し、前記異常検出手段で検出された事象の発生原因となる要素を判定する障害箇所判定手段と、前記障害箇所判定手段での判定結果を示す障害情報を出力する障害情報出力手段と、を有する前記ネットワーク上の複数の装置から前記障害情報を収集する障害情報収集手段、
前記障害情報収集手段が前記複数の装置から収集した前記障害情報に共通する要素を、前記ネットワーク上での障害発生箇所と判断する障害発生箇所絞り込み手段、
として機能させることを特徴とするネットワーク監視プログラム。
通信状況監視手段が、前記ネットワーク上の他の機器との間の通信状況を監視し、
異常検出手段が、前記通信状況監視手段で検出された通信内容から異常を示す事象を検出し、
障害箇所判定手段が、前記ネットワーク上で障害の発生原因となり得る要素が予め分類され、分類された要素に対して、前記ネットワークを介した通信の異常を示す事象が対応付けられた障害箇所判定テーブルを参照し、前記異常検出手段で検出された事象の発生原因となる要素を判定し、
障害情報出力手段が、障害箇所判定手段での判定結果を示す障害情報を出力する、
ことを特徴とするネットワーク監視方法。
前記ネットワーク上で障害の発生原因となり得る要素が予め分類され、分類された要素に対して、前記ネットワークを介した通信の異常を示す事象が対応付けられた障害箇所判定テーブルを記憶する記憶手段と、
前記ネットワーク上の他の機器との間の通信状況を監視する通信状況監視手段と、
前記通信状況監視手段で検出された通信内容から異常を示す事象を検出する異常検出手段と、
前記障害箇所判定テーブルを参照し、前記異常検出手段で検出された事象の発生原因となる要素を判定する障害箇所判定手段と、
前記障害箇所判定手段での判定結果を示す障害情報を出力する障害情報出力手段と、
を有することを特徴とするネットワーク監視装置。
コンピュータを、
前記ネットワーク上で障害の発生原因となり得る要素が予め分類され、分類された要素に対して、前記ネットワークを介した通信の異常を示す事象が対応付けられた障害箇所判定テーブルを記憶する記憶手段、
前記ネットワーク上の他の機器との間の通信状況を監視する通信状況監視手段、
前記通信状況監視手段で検出された通信内容から異常を示す事象を検出する異常検出手段、
前記障害箇所判定テーブルを参照し、前記異常検出手段で検出された事象の発生原因となる要素を判定する障害箇所判定手段、
前記障害箇所判定手段での判定結果を示す障害情報を出力する障害情報出力手段、
として機能させることを特徴とするネットワーク監視プログラムを記録したコンピュータ読み取り可能な記録媒体。
1a アプリケーション
1b 通信手段
1c 通信インタフェース
1d 記憶手段
1da 障害箇所判定テーブル
1e 通信状況監視手段
1f 異常検出手段
1g 障害箇所判定手段
1h 障害情報出力手段
2 スイッチ(SW)
3 ネットワーク
4 相手装置
5 隣接伝送路
6 非隣接伝送路
7 パケット
8 障害情報
Claims (10)
- ネットワーク上の障害発生箇所を検出するためのネットワーク監視プログラムにおいて、
コンピュータを、
前記ネットワーク上で障害の発生原因となり得る要素が予め分類され、分類された要素に対して、通信状況に応じて変動する所定のパラメータの値が基準値を超えることが、前記ネットワークを介した通信の異常を示す事象として対応付けられた障害箇所判定テーブルを記憶する記憶手段、
前記コンピュータ上で動作するアプリケーションと前記コンピュータの通信インタフェースとの間で受け渡されるパケットを解析することで前記ネットワーク上の他の装置との間の通信状況を監視して前記所定のパラメータの値を取得すると共に、受け渡されるパケットから同期要求パケットを抽出し、当該同期要求パケットが当該アプリケーションに対して送信されたものか、当該アプリケーションから送信されたものかによって、当該アプリケーションがサーバかクライアントかを判断し、当該アプリケーションがサーバかクライアントかに応じて、前記障害箇所判定テーブルに設定されている前記基準値を変更する通信状況監視手段、
前記通信状況監視手段で取得された前記所定のパラメータの値が前記基準値を超えた場合に、異常を示す事象が発生したことを検出する異常検出手段、
前記障害箇所判定テーブルを参照し、前記異常検出手段で検出された事象の発生原因となる要素を判定する障害箇所判定手段、
前記障害箇所判定手段での判定結果を示す障害情報を出力する障害情報出力手段、
として機能させることを特徴とするネットワーク監視プログラム。 - 前記障害箇所判定テーブルには、前記アプリケーションからの応答遅延時間が基準値を超えることが、前記ネットワークを介した通信の異常を示す事象として設定されており、
前記通信状況監視手段は、前記アプリケーションがサーバであれば、当該アプリケーションがクライアントの場合よりも前記応答遅延時間の基準値を短い値にすることを特徴とする請求項1記載のネットワーク監視プログラム。 - 前記障害箇所判定テーブルでは、前記ネットワークに接続された機器が前記要素として定義されており、前記コンピュータ自身を示す自装置、前記コンピュータに隣接する伝送路を示す隣接伝送路、前記隣接伝送路以外の伝送路を示す非隣接伝送路、通信相手を示す相手装置に分類されていることを特徴とする請求項1記載のネットワーク監視プログラム。
- ネットワーク上の障害発生箇所を検出するためのネットワーク監視プログラムにおいて、
コンピュータを、
前記ネットワーク上で障害の発生原因となり得る要素が予め分類され、分類された要素に対して、前記ネットワークを介したコネクションを用いた通信の異常を示す事象が対応付けられた障害箇所判定テーブルを記憶する記憶手段、
前記コンピュータ上で動作するアプリケーションと前記コンピュータの通信インタフェースとの間で受け渡されるパケットを解析することで前記ネットワーク上の他の装置との間のコネクションを用いた通信状況を監視すると共に、受け渡されるパケットから同期要求パケットを抽出し、当該同期要求パケットが当該アプリケーションに対して送信されたものか、当該アプリケーションから送信されたものかによって、当該アプリケーションがサーバかクライアントかを判断し、当該アプリケーションがサーバであれば、全ての前記他の装置との間のコネクションの状態をまとめて1つのコネクション管理テーブルで管理し、当該アプリケーションがクライアントであれば、複数の前記他の装置それぞれとの間のコネクションの状態を個別のコネクション管理テーブルで管理する通信状況監視手段、
前記通信状況監視手段が有する前記コネクション管理テーブルに示されるコネクションの状態に基づいて異常を示す事象を検出する異常検出手段、
前記障害箇所判定テーブルを参照し、前記異常検出手段で検出された事象の発生原因となる要素を判定する障害箇所判定手段、
前記障害箇所判定手段での判定結果を示す障害情報を出力する障害情報出力手段、
として機能させることを特徴とするネットワーク監視プログラム。 - 前記障害箇所判定テーブルでは、前記要素として前記他の装置上で動作する他のアプリケーションが定義されており、当該要素としての当該他のアプリケーションに対して、当該他のアプリケーションが動作する当該他の装置に対してコネクションが確立するが、当該他のアプリケーションに対してコネクションが確立できないという事象が対応付けられており、
前記通信状況監視手段は、アプリケーション間のコネクションと装置間のコネクションとの確立の有無を監視することを特徴とする請求項4記載のネットワーク監視プログラム。 - 前記障害箇所判定テーブルでは、前記要素としてネットワーク監視機能が定義されており、前記ネットワーク監視機能に対して、トランスポート層でのコネクションが確立されているにもかかわらずネットワーク層での異常が検出されたという事象が対応付けられており、
前記通信状況監視手段は、前記トランスポート層でのコネクションと前記ネットワーク層でのコネクションとの確立の有無を監視することを特徴とする請求項4記載のネットワーク監視プログラム。 - ネットワーク上の障害発生箇所をコンピュータで検出するためのネットワーク監視方法において、
前記コンピュータが、
前記ネットワーク上で障害の発生原因となり得る要素が予め分類され、分類された要素に対して、通信状況に応じて変動する所定のパラメータの値が基準値を超えることが、前記ネットワークを介した通信の異常を示す事象として対応付けられた障害箇所判定テーブルを記憶手段で記憶し、
前記コンピュータ上で動作するアプリケーションと前記コンピュータの通信インタフェースとの間で受け渡されるパケットを解析することで前記ネットワーク上の他の装置との間の通信状況を監視して前記所定のパラメータの値を取得すると共に、受け渡されるパケットから同期要求パケットを抽出し、当該同期要求パケットが当該アプリケーションに対して送信されたものか、当該アプリケーションから送信されたものかによって、当該アプリケーションがサーバかクライアントかを判断し、当該アプリケーションがサーバかクライアントかに応じて、前記障害箇所判定テーブルに設定されている前記基準値を変更し、
取得された前記所定のパラメータの値が前記基準値を超えた場合に、異常を示す事象が発生したことを検出し、
前記障害箇所判定テーブルを参照し、検出された事象の発生原因となる要素を判定し、
判定結果を示す障害情報を出力する、
ことを特徴とするネットワーク監視方法。 - ネットワーク上の障害発生箇所をコンピュータで検出するためのネットワーク監視方法において、
前記コンピュータが、
前記ネットワーク上で障害の発生原因となり得る要素が予め分類され、分類された要素に対して、前記ネットワークを介したコネクションを用いた通信の異常を示す事象が対応付けられた障害箇所判定テーブルを記憶手段で記憶し、
前記コンピュータ上で動作するアプリケーションと前記コンピュータの通信インタフェースとの間で受け渡されるパケットを解析することで前記ネットワーク上の他の装置との間のコネクションを用いた通信状況を監視すると共に、受け渡されるパケットから同期要求パケットを抽出し、当該同期要求パケットが当該アプリケーションに対して送信されたものか、当該アプリケーションから送信されたものかによって、当該アプリケーションがサーバかクライアントかを判断し、当該アプリケーションがサーバであれば、全ての前記他の装置との間のコネクションの状態をまとめて1つのコネクション管理テーブルで管理し、当該アプリケーションがクライアントであれば、複数の前記他の装置それぞれとの間のコネクションの状態を個別のコネクション管理テーブルで管理し、
前記コネクション管理テーブルに示されるコネクションの状態に基づいて異常を示す事象を検出し、
前記障害箇所判定テーブルを参照し、検出された事象の発生原因となる要素を判定し、
判定結果を示す障害情報を出力する、
ことを特徴とするネットワーク監視方法。 - ネットワーク上の障害発生箇所を検出するためのネットワーク監視装置において、
前記ネットワーク上で障害の発生原因となり得る要素が予め分類され、分類された要素に対して、通信状況に応じて変動する所定のパラメータの値が基準値を超えることが、前記ネットワークを介した通信の異常を示す事象として対応付けられた障害箇所判定テーブルを記憶する記憶手段と、
前記ネットワーク監視装置上で動作するアプリケーションと前記コンピュータの通信インタフェースとの間で受け渡されるパケットを解析することで前記ネットワーク上の他の装置との間の通信状況を監視して前記所定のパラメータの値を取得すると共に、受け渡されるパケットから同期要求パケットを抽出し、当該同期要求パケットが当該アプリケーションに対して送信されたものか、当該アプリケーションから送信されたものかによって、当該アプリケーションがサーバかクライアントかを判断し、当該アプリケーションがサーバかクライアントかに応じて、前記障害箇所判定テーブルに設定されている前記基準値を変更する通信状況監視手段と、
前記通信状況監視手段で取得された前記所定のパラメータの値が前記基準値を超えた場合に、異常を示す事象が発生したことを検出する異常検出手段と、
前記障害箇所判定テーブルを参照し、前記異常検出手段で検出された事象の発生原因となる要素を判定する障害箇所判定手段と、
前記障害箇所判定手段での判定結果を示す障害情報を出力する障害情報出力手段と、
を有することを特徴とするネットワーク監視装置。 - ネットワーク上の障害発生箇所を検出するためのネットワーク監視装置において、
前記ネットワーク上で障害の発生原因となり得る要素が予め分類され、分類された要素に対して、前記ネットワークを介したコネクションを用いた通信の異常を示す事象が対応付けられた障害箇所判定テーブルを記憶する記憶手段と、
前記ネットワーク監視装置上で動作するアプリケーションと前記コンピュータの通信インタフェースとの間で受け渡されるパケットを解析することで前記ネットワーク上の他の装置との間のコネクションを用いた通信状況を監視すると共に、受け渡されるパケットから同期要求パケットを抽出し、当該同期要求パケットが当該アプリケーションに対して送信されたものか、当該アプリケーションから送信されたものかによって、当該アプリケーションがサーバかクライアントかを判断し、当該アプリケーションがサーバであれば、全ての前記他の装置との間のコネクションの状態をまとめて1つのコネクション管理テーブルで管理し、当該アプリケーションがクライアントであれば、複数の前記他の装置それぞれとの間のコネクションの状態を個別のコネクション管理テーブルで管理する通信状況監視手段と、
前記通信状況監視手段が有する前記コネクション管理テーブルに示されるコネクションの状態に基づいて異常を示す事象を検出する異常検出手段と、
前記障害箇所判定テーブルを参照し、前記異常検出手段で検出された事象の発生原因となる要素を判定する障害箇所判定手段と、
前記障害箇所判定手段での判定結果を示す障害情報を出力する障害情報出力手段と、
を有することを特徴とするネットワーク監視装置。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003399937A JP4255366B2 (ja) | 2003-11-28 | 2003-11-28 | ネットワーク監視プログラム、ネットワーク監視方法、およびネットワーク監視装置 |
| US10/834,461 US7266758B2 (en) | 2003-11-28 | 2004-04-29 | Network monitoring program, network monitoring method, and network monitoring apparatus |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003399937A JP4255366B2 (ja) | 2003-11-28 | 2003-11-28 | ネットワーク監視プログラム、ネットワーク監視方法、およびネットワーク監視装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2005167347A JP2005167347A (ja) | 2005-06-23 |
| JP4255366B2 true JP4255366B2 (ja) | 2009-04-15 |
Family
ID=34696775
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2003399937A Expired - Fee Related JP4255366B2 (ja) | 2003-11-28 | 2003-11-28 | ネットワーク監視プログラム、ネットワーク監視方法、およびネットワーク監視装置 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US7266758B2 (ja) |
| JP (1) | JP4255366B2 (ja) |
Families Citing this family (64)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7321560B2 (en) * | 2003-09-02 | 2008-01-22 | Kddi Corporation | Method for detecting failure location of network in the Internet |
| JP2006031335A (ja) * | 2004-07-15 | 2006-02-02 | Hitachi Ltd | 情報処理システム及び方法 |
| US7719965B2 (en) * | 2004-08-25 | 2010-05-18 | Agilent Technologies, Inc. | Methods and systems for coordinated monitoring of network transmission events |
| GB2425680B (en) * | 2005-04-27 | 2009-05-20 | Hewlett Packard Development Co | Network analysis |
| JP4612525B2 (ja) * | 2005-10-25 | 2011-01-12 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | ネットワーク障害部位特定装置および方法 |
| US7570580B1 (en) * | 2005-12-02 | 2009-08-04 | At&T Corp. | Automatic problem isolation for multi-layer network failures |
| JP4559974B2 (ja) * | 2006-01-16 | 2010-10-13 | 三菱電機株式会社 | 管理装置及び管理方法及びプログラム |
| JP4594258B2 (ja) * | 2006-03-10 | 2010-12-08 | 富士通株式会社 | システム分析装置およびシステム分析方法 |
| US20070234118A1 (en) * | 2006-03-30 | 2007-10-04 | Sardella Steven D | Managing communications paths |
| JP4570582B2 (ja) * | 2006-03-31 | 2010-10-27 | 富士通株式会社 | ネットワーク監視プログラム、ネットワーク監視方法、およびネットワーク監視装置 |
| JP4939102B2 (ja) * | 2006-04-21 | 2012-05-23 | 株式会社日立製作所 | ネットワークブート計算機システムの高信頼化方法 |
| US20070293232A1 (en) * | 2006-06-20 | 2007-12-20 | Aruze Corp. | Wireless communication failure monitoring system and monitoring device |
| US7613949B1 (en) * | 2006-06-30 | 2009-11-03 | Boone Lewis A | Fault isolation system and method |
| JP4126707B2 (ja) | 2006-07-28 | 2008-07-30 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 情報システムの状態を解析する技術 |
| JP4842738B2 (ja) * | 2006-09-01 | 2011-12-21 | 株式会社日立システムズ | 障害管理支援システム及びその情報管理方法 |
| JP2008085916A (ja) * | 2006-09-28 | 2008-04-10 | Toshiba Corp | 通信システムの主装置及びこの主装置で使用される登録方法 |
| JP2008217735A (ja) * | 2007-03-08 | 2008-09-18 | Nec Corp | 障害解析システム、方法、及び、プログラム |
| JP2008310628A (ja) * | 2007-06-15 | 2008-12-25 | Toppan Printing Co Ltd | 障害監視装置 |
| JP4946824B2 (ja) * | 2007-11-26 | 2012-06-06 | 富士通株式会社 | 監視装置 |
| US8793362B2 (en) * | 2007-11-29 | 2014-07-29 | Barclays Capital Inc. | Communications enterprise server monitor |
| US8086905B2 (en) | 2008-05-27 | 2011-12-27 | Hitachi, Ltd. | Method of collecting information in system network |
| US8406748B2 (en) | 2009-01-28 | 2013-03-26 | Headwater Partners I Llc | Adaptive ambient services |
| US8391834B2 (en) | 2009-01-28 | 2013-03-05 | Headwater Partners I Llc | Security techniques for device assisted services |
| US8275830B2 (en) | 2009-01-28 | 2012-09-25 | Headwater Partners I Llc | Device assisted CDR creation, aggregation, mediation and billing |
| US8448015B2 (en) * | 2008-06-17 | 2013-05-21 | My Computer Works, Inc. | Remote computer diagnostic system and method |
| JP5161736B2 (ja) | 2008-11-18 | 2013-03-13 | 株式会社東芝 | 障害診断プログラム、方法、および通信装置 |
| US10484858B2 (en) | 2009-01-28 | 2019-11-19 | Headwater Research Llc | Enhanced roaming services and converged carrier networks with device assisted services and a proxy |
| JP5225473B2 (ja) * | 2009-12-09 | 2013-07-03 | 株式会社東芝 | 通信装置及び通信システム |
| JP5488002B2 (ja) | 2010-01-28 | 2014-05-14 | 富士通株式会社 | 事例データ生成プログラム、方法及び装置 |
| US8868029B2 (en) | 2010-01-29 | 2014-10-21 | Alcatel Lucent | Method and apparatus for managing mobile resource usage |
| US8767584B2 (en) * | 2010-01-29 | 2014-07-01 | Alcatel Lucent | Method and apparatus for analyzing mobile services delivery |
| JP5549304B2 (ja) * | 2010-03-23 | 2014-07-16 | 富士通株式会社 | 判定装置、判定方法および判定プログラム |
| JP5625940B2 (ja) | 2011-01-19 | 2014-11-19 | 富士通株式会社 | 監視プログラム、監視装置、及び監視方法 |
| JP5229696B2 (ja) * | 2011-03-04 | 2013-07-03 | 日本電気株式会社 | 情報処理システム、情報処理装置、その制御方法、及びその制御プログラム、通信環境監視復旧方法 |
| US9009220B2 (en) * | 2011-10-14 | 2015-04-14 | Mimecast North America Inc. | Analyzing stored electronic communications |
| WO2013103387A1 (en) | 2012-01-06 | 2013-07-11 | Siemens Enterprise Communications Gmbh & Co. Kg | Method for optimizing network performance after a temporary loss of connection |
| JP5884569B2 (ja) * | 2012-03-14 | 2016-03-15 | 日本電気株式会社 | 通信機器およびその障害の検出方法 |
| CN103378982A (zh) * | 2012-04-17 | 2013-10-30 | 深圳市腾讯计算机系统有限公司 | 互联网业务运行监测方法和系统 |
| CN103001822B (zh) * | 2012-08-29 | 2016-07-06 | 五八同城信息技术有限公司 | 网络异常的处理方法及装置 |
| JP6047410B2 (ja) * | 2013-01-25 | 2016-12-21 | 株式会社Nttドコモ | 試験装置 |
| US9323627B1 (en) * | 2014-04-29 | 2016-04-26 | Juniper Networks, Inc. | System, method, and apparatus for detecting fault conditions experienced by remote physical ports |
| US10135704B2 (en) * | 2014-06-20 | 2018-11-20 | Microsoft Technology Licensing, Llc | Identification of candidate problem network entities |
| US9749422B2 (en) | 2014-12-05 | 2017-08-29 | Unify Gmbh & Co. Kg | Method and system for telecommunication device monitoring |
| EP3242422B1 (en) * | 2014-12-30 | 2023-07-05 | Solid, Inc. | Monitoring apparatus of distributed antenna system |
| US9652361B2 (en) | 2015-03-03 | 2017-05-16 | International Business Machines Corporation | Targeted multi-tiered software stack serviceability |
| JP6221123B2 (ja) * | 2015-06-15 | 2017-11-01 | 3plex株式会社 | 防犯カメラヘルスチェック |
| DE102015010706B4 (de) | 2015-08-14 | 2017-10-05 | Unify Gmbh & Co. Kg | Verfahren, Vorrichtung und System für ein Verfahren zum Einschalten einer Überwachung von Überwachungsobjekten in einer Computer-Implementierten Telekommunikationsumgebung |
| CN107294799B (zh) * | 2016-03-31 | 2020-09-01 | 阿里巴巴集团控股有限公司 | 一种分布式系统中节点的处理方法和装置 |
| US10257750B2 (en) * | 2016-11-15 | 2019-04-09 | Mist Systems, Inc. | Methods and apparatus for capturing and/or using packets to facilitate fault detection |
| JP6754338B2 (ja) * | 2017-08-10 | 2020-09-09 | 日本電信電話株式会社 | 障害解析支援装置、障害解析支援方法および障害解析支援プログラム |
| JP6977522B2 (ja) * | 2017-12-07 | 2021-12-08 | オムロン株式会社 | 制御システム、情報処理装置、異常要因推定プログラム |
| US10523549B1 (en) * | 2019-06-02 | 2019-12-31 | Cybertoka Ltd | Method and system for detecting and classifying networked devices |
| US11151150B2 (en) | 2019-09-13 | 2021-10-19 | Salesforce.Com, Inc. | Adjustable connection pool mechanism |
| CN112583623B (zh) * | 2019-09-30 | 2023-02-07 | 中兴通讯股份有限公司 | 过滤信息配置方法及系统 |
| US11636067B2 (en) * | 2019-10-04 | 2023-04-25 | Salesforce.Com, Inc. | Performance measurement mechanism |
| US11165857B2 (en) | 2019-10-23 | 2021-11-02 | Salesforce.Com, Inc. | Connection pool anomaly detection mechanism |
| US11991038B2 (en) * | 2020-02-26 | 2024-05-21 | Nippon Telegraph And Telephone Corporation | Damaged part identifying apparatus, method and program |
| JP7322806B2 (ja) * | 2020-05-15 | 2023-08-08 | トヨタ自動車株式会社 | 車両用異常検出装置 |
| JP7574934B2 (ja) * | 2021-07-05 | 2024-10-29 | 日本電信電話株式会社 | 障害推定装置、方法およびプログラム |
| US12185135B2 (en) * | 2021-12-17 | 2024-12-31 | Rakuten Mobile, Inc. | Physical network function device access control |
| JP7741014B2 (ja) * | 2022-03-10 | 2025-09-17 | 株式会社日立ハイテク | 分散システムおよび分散システムを構成する分散装置 |
| CN115580527A (zh) * | 2022-09-30 | 2023-01-06 | 深圳拓邦股份有限公司 | 一种网络通讯故障排查方法、装置、设备及存储介质 |
| CN118118318A (zh) * | 2023-08-11 | 2024-05-31 | 华为技术有限公司 | 故障检测方法、系统、装置及存储介质 |
| CN119134334B (zh) * | 2024-11-08 | 2025-02-18 | 广东电网有限责任公司中山供电局 | 继电保护装置的维修处理方法、装置、电子设备 |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| FR2461261A1 (fr) * | 1979-07-11 | 1981-01-30 | Cit Alcatel | Dispositif de controle de bon fonctionnement d'un equipement electronique |
| US5303112A (en) * | 1990-10-26 | 1994-04-12 | S & C Electric Company | Fault detection method and apparatus |
| US6324161B1 (en) * | 1997-08-27 | 2001-11-27 | Alcatel Usa Sourcing, L.P. | Multiple network configuration with local and remote network redundancy by dual media redirect |
| JP2002099469A (ja) | 2000-09-25 | 2002-04-05 | Hitachi Ltd | ネットワークシステム性能診断方法及びその装置 |
-
2003
- 2003-11-28 JP JP2003399937A patent/JP4255366B2/ja not_active Expired - Fee Related
-
2004
- 2004-04-29 US US10/834,461 patent/US7266758B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2005167347A (ja) | 2005-06-23 |
| US7266758B2 (en) | 2007-09-04 |
| US20050144505A1 (en) | 2005-06-30 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4255366B2 (ja) | ネットワーク監視プログラム、ネットワーク監視方法、およびネットワーク監視装置 | |
| US20070177523A1 (en) | System and method for network monitoring | |
| JP3983138B2 (ja) | 障害情報収集プログラムおよび障害情報収集装置 | |
| US7213179B2 (en) | Automated and embedded software reliability measurement and classification in network elements | |
| JP3556842B2 (ja) | ネットワーク監視機構、ネットワーク監視装置およびネットワーク管理方法 | |
| US7010718B2 (en) | Method and system for supporting network system troubleshooting | |
| JP4576249B2 (ja) | ネットワーク管理装置及び方法 | |
| US20100080129A1 (en) | Network troubleshooting using path topology | |
| US20080114581A1 (en) | Root cause analysis approach with candidate elimination using network virtualization | |
| US20090070463A1 (en) | Preliminary Classification of Events to Facilitate Cause-Based Analysis | |
| JP4412031B2 (ja) | ネットワーク監視システム及びその方法、プログラム | |
| EP1703671B1 (en) | Device and method for network monitoring | |
| US7593351B1 (en) | Method and system for collecting and consolidating network traffic information | |
| JP5342082B1 (ja) | ネットワーク障害解析システムおよびネットワーク障害解析プログラム | |
| CN118550752A (zh) | 一种云平台故障检测及运维系统、方法、设备及存储介质 | |
| JP4464256B2 (ja) | ネットワーク上位監視装置 | |
| JP4570582B2 (ja) | ネットワーク監視プログラム、ネットワーク監視方法、およびネットワーク監視装置 | |
| KR100964392B1 (ko) | 망 관리에서의 장애 관리 시스템 및 그 방법 | |
| CN120811865A (zh) | 一种基于多维协议诊断的地震网络通信故障定位方法 | |
| US12143286B2 (en) | Network monitoring device, network monitoring method, and network monitoring program | |
| KR100887874B1 (ko) | 인터넷 망의 장애 관리 시스템 및 그 방법 | |
| JP2001244946A (ja) | ネットワーク監視装置 | |
| CN115242820B (zh) | 一种集群节点故障处理方法、装置、设备及介质 | |
| US20060039288A1 (en) | Network status monitoring and warning method | |
| KR20040028400A (ko) | 매트로 이더넷망의 장애처리 장치 및 그 방법 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051222 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071108 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071120 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080121 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080527 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080725 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090127 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090127 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120206 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130206 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140206 Year of fee payment: 5 |
|
| LAPS | Cancellation because of no payment of annual fees |