JP2006065619A - ネットワークアプリケーション障害原因切り分け装置及び該障害原因切り分けプログラム - Google Patents

ネットワークアプリケーション障害原因切り分け装置及び該障害原因切り分けプログラム Download PDF

Info

Publication number
JP2006065619A
JP2006065619A JP2004248204A JP2004248204A JP2006065619A JP 2006065619 A JP2006065619 A JP 2006065619A JP 2004248204 A JP2004248204 A JP 2004248204A JP 2004248204 A JP2004248204 A JP 2004248204A JP 2006065619 A JP2006065619 A JP 2006065619A
Authority
JP
Japan
Prior art keywords
network
processing time
server
data
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004248204A
Other languages
English (en)
Other versions
JP3933655B2 (ja
Inventor
Hideyuki Kamemoto
秀幸 亀元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Information Systems Ltd
Original Assignee
Hitachi Information Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Information Systems Ltd filed Critical Hitachi Information Systems Ltd
Priority to JP2004248204A priority Critical patent/JP3933655B2/ja
Publication of JP2006065619A publication Critical patent/JP2006065619A/ja
Application granted granted Critical
Publication of JP3933655B2 publication Critical patent/JP3933655B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

【課題】 ネットワークアプリケーションで障害が発生した場合に、品質障害の原因が、サーバなのかネットワークなのかを正確に切り分けること。
【解決手段】 クライアント111〜113とアプリケーションサーバ101とでやり取りされるパケットデータをネットワークアプリケーション障害原因切り分け装置103で常時取得し、この取得したパケットデータの内容を事前に定義した情報に基づきネットワーク処理時間とサーバ処理時間とを判断し、切り分けを行った情報を蓄積しておき、一定間隔で監視センタ131へ送信するもの。
【選択図】 図1

Description

本発明は、ネットワークを利用するアプリケーションの品質障害(レスポンス遅延)が発生した場合に、原因を切り分けるための障害原因切り分け装置及び該障害原因切り分けプログラムに関するものである。
従来の技術では、ネットワークを利用するアプリケーションの品質障害を監視するため、主に、次の方法が用いられている。
(1)専用装置を設置し、アプリケーションレベルのトラフィック量やTCPヘッダ情報を監視することで、品質劣化の原因を特定する方法(特許文献1)。
(2)アプリケーションの品質情報やネットワーク内のトラフィック量、プロトコル毎のトラフィック量等を収集し、収集した情報全てから、品質劣化の原因を特定する方法(特許文献2)。
(3)専用装置を設置し、一般的に使わるTCPプロトコルの受渡しを分析することで、サーバ内遅延とネットワーク内遅延を切り分ける方法。前記分析方法は、クライアントからリクエストがあってから、サーバが最初のパケットを返すまでの時間をサーバ内処理時間とし、それ以外はネットワーク内の処理時間とする方法であって、TCPの接続から切断までを1トランザクションとして監視し、情報蓄積する。代表的な製品には、 Packeteer社のPacket Shaper(Packeteer社の登録商標)という製品がある。
特開2002−164890号公報 特開2003−218868号公報
一般的にアプリケーションの品質劣化が発生した場合、第1ステップとして、原因がサーバなのかネットワークなのかを切り分け、次に第2ステップとして、サーバであれば、サーバ内のリソースや処理内容といった詳細を調べ、ネットワークであれば、トラフィックや機器のリソース状況を調べる、といった手順を踏む。しかし、この第1ステップでの切り分けが難しく、上記のようないくつかの方法が考案されているが、従来の技術では、次の問題点がある。
(1)特許文献1記載の方法では、その専用装置を設置した個所によるネットワークの状況しかわからないため、問題がサーバなのかネットワークなのかを切り分けるためには、経由するネットワーク全てに専用装置を設置しなければならず、構成が複雑になるだけでなく、投資が大きくなるという問題がある。また、TCPのヘッダ情報の分析にしても、主にウィンドウサイズだけで判断するため、例えばサーバ内の処理遅延による品質劣化の場合、ウィンドウサイズには影響がないため、問題を検出することができなくなってしまう。
(2)前記方法は、ネットワーク内のトラフィックの情報を元に監視を行うため、品質劣化が、監視対象となっているネットワーク以外で発生すると原因の切り分けができない。
(3)前記方法は、クライアントがリクエストを出した後、次にサーバが出すパケットが処理結果のデータである場合は、その間をサーバ内の処理時間とし、それ以外をネットワーク内の処理時間として区別することができる。しかし、アプリケーションによっては、クライアントのリクエストを受取ると、サーバがまずはその要求を受け取った確認パケットを送信するものもある。このようなアプリケーションでは、その間をサーバ内処理時間としてしまうため、正確な値を測定することができない。または、接続が継続するようなアプリケーションでは、正確なトランザクション毎のレスポンス時間を測定することができない。
このように従来技術によるネットワークシステムの監視方法では、アプリケーションの品質障害の原因が、サーバなのかネットワークなのかを正確に切り分けることが困難であると言う不具合があった。
本発明の目的は、アプリケーションの品質障害の原因が、サーバなのかネットワークなのかを正確に切り分けることができる監視装置及び該障害原因切り分けプログラムを提供することである。
前記目的を達成するために本発明は、ネットワークアプリケーションサーバとクライアントの間で受渡しされるパケットデータの障害原因の切り分けを行う障害原因切り分け装置において、ネットワークアプリケーションサーバとクライアントの間で受渡しされるパケットデータを取得し記憶する記憶手段と、該記憶されたパケットデータからネットワーク処理時間を定義するための区間及びサーバ処理時間を定義するための区間を設定させる定義情報設定手段と、該記憶手段に記憶されたパケットデータを基に前記定義情報設定手段により設定した定義情報に基づいてサーバの処理時間とネットワークの処理時間に切り分ける切り分け手段とを備えることを第1の特徴とし、この障害原因切り分け装置において、前記ネットワークアプリケーションサーバとクライアントの間で受渡しされるパケットデータを取得し記憶する記憶手段により記憶されたパケットデータに基づき、ネットワークアプリケーションサーバとクライアントで受け渡しされるパケットデータの動作フローを事前に表示する表示手段と、該表示手段により表示された画面からネットワーク処理時間を定義するための区間およびサーバ処理時間を定義するための区間を設定させる設定手段とを備えることを第2の特徴とする。
更に本発明は、ネットワークアプリケーションサーバとクライアントの間で受渡しされるパケットデータの障害原因の切り分けを行う障害原因切り分けプログラムにおいて、ネットワークアプリケーションサーバとクライアントの間で受渡しされるパケットデータを取得し記憶する記憶機能と、該記憶されたパケットデータからネットワーク処理時間を定義するための区間及びサーバ処理時間を定義するための区間を設定させる定義情報設定機能と、該記憶機能により記憶されたパケットデータを基に前記定義情報設定機能により設定した定義情報に基づいてサーバの処理時間とネットワークの処理時間に切り分ける切り分け機能とを実現させることを第3の特徴とし、この障害原因切り分けプログラムにおいて、前記ネットワークアプリケーションサーバとクライアントの間で受渡しされるパケットデータを取得し記憶する記憶手段により記憶されたパケットデータに基づき、ネットワークアプリケーションサーバとクライアントで受け渡しされるパケットデータの動作フローを事前に表示する表示機能と、該表示機能により表示された画面からネットワーク処理時間を定義するための区間およびサーバ処理時間を定義するための区間を設定させる設定機能とを実現させることを第4の特徴とする。
本発明を適用すると、ネットワークアプリケーション障害原因切り分け装置及びプログラムが、ネットワーク内を流れるデータをパケットレベルの動作で分析し、ネットワーク処理時間とサーバ処理時間とに切り分けることにより、ネットワークアプリケーションで障害が発生した場合、その障害の原因がサーバなのかネットワークなのかを正確に切り分けることが可能となり、障害発生時に迅速な対応をはかることができ、その結果としてシステムを利用するユーザに高品質なサービスを提供することができる。
以下、図面を参照して本発明を詳細に説明する。図1は、本発明の実施形態の一例を示すネットワークアプリケーション障害原因切り分け装置を適用したネットワークシステムの全体構成図であり、図2は前記ネットワークアプリケーション障害原因切り分け装置103の各機能を示すブロック図である。
<システムの全体構成>
図1に示すネットワークシステムは、クライアントからの要求に応じて処理を行うアプリケーションサーバ101と、該アプリケーションサーバ101に対してネッッワーク141を介して各種アプリケーションの実行要求をする複数のクライアント111〜113と、ネットワークアプリケーション障害原因切り分け装置から切り分け結果を取得し監視を行う監視センタ131と、前記アプリケーションサーバ101と前記クライアント111〜113間のアプリケーションデータ/プログラム等の転送情報をパケット単位で収集し、サーバの処理時間とネットワークの処理時間に切り分けるネットワークアプリケーション障害原因切り分け装置103とから構成される。
<ネットワークアプリケーション障害原因切り分け装置の構成>
前記本実施形態の特徴であるネットワークアプリケーション障害原因切り分け装置103は、図2に示す如く、サーバの処理時間とネットワークの処理時間に切り分ける際の定義をさせる分析方法設定機能202と、アプリケーションサーバ101とクライアント111〜113の間の転送情報をパケット単位で収集するトラフィックキャプチャ機能206と、前記キャプチャ機能により収集されたパケット単位の転送情報を前記分析方法設定機能202により定義された情報に基づき、サーバの処理時間とネットワークの処理時間に切り分ける品質分析機能204と、該品質分析機能204の処理結果を監視センタ131への送信や他システムから品質情報収集のリクエストがきた場合等に、必要な情報の送信を行う品質情報送信機能205と、品質分析機能が分析した分析結果の品質情報が格納されている品質情報DB212と、、トラフィックキャプチャ機能が取得したパケット情報を保存するキャプチャデータDB213と、PCに付随するネットワークカード207と、ネットワークケーブル208と、前記トラフィックキャプチャ機能206、品質分析機能204および品質情報送信機能204を制御する制御機能203と、分析方法設定機能202で設定された情報を記憶する分析方法設定情報データベース(DB)211とを備える。
<ネットワークアプリケーション障害原因切り分け装置の扱うデータ説明>
図4は、ネットワークアプリケーション障害原因切り分け装置103が扱うデータテーブルの例を示す図であり、これらデータテーブルは、機器テーブル401、データIndexテーブル402、データ格納テーブル403とを含み、いずれもキャプチャデータDB213内にあり、ネットワーク内を流れるパケットを取得し、保存しておくキャブチャデータに関する情報である。
前記機器テーブル401は、機器情報を保存しておくためのテーブルであり、図4(a)の如く、テーブル内の行をユニークに識別するための機器Indexと機器を一意に識別するためのアドレス情報が保存されている。なお、アドレス情報には、IPアドレス等が一例として挙げられる。
データIndexテーブル402は、取得したデータを識別するためのデータIndexテーブルであり、図4(b)に示す如く、データ格納テーブル403とリンクするデータIndexと、送受信を行った機器の機器Indexと、データをキャプチャした時のms単位までの日時が保存されている。
データ格納テーブル403は、取得したデータを保存しておくためのデータ格納テーブルであり、図4(c)に示す如く、Index以外は、レイヤを4つに分け、それぞれ保存している。図示の例として、レイヤ1=DLC、レイヤ2=IP(Internet Protocol)、レイヤ3=TCP(Transmission Control Protocol)、レイヤ4=アプリケーションデータとしているが、レイヤ数および各レイヤに保存する情報についてはこれらに限定するものではない。
機器テーブル411、分析機器対応テーブル412、分析内容設定テーブル413、設定内容とテーブル内容との対応表414、品質分析間隔テーブル415、品質情報送信間隔テーブル416およびトラヒックキャプチャ時間テーブル417は、いずれも分析方法設定情報DB211内にあり、取得したデータからレスポンスを算出する際に、キーとなる情報の定義をはじめ、ネットワークアプリケーション障害原因切り分け装置の各機能の制御に関する情報である。
機器テーブル411は、分析を行うマシンのアドレス情報を登録した機器テーブルであり、図5(a)に示す如く、テーブル内の行をユニークに識別するための機器Indexと機器を一意に識別するためのアドレス情報が保存されている。なお、機器テーブル401と同じデータが格納され常に整合性が保たれている。ここでは、機器テーブル401と機器テーブル411は、同期を取りながら別々に保持しているが、どちらか一方に併合しても構わない。
分析機器対応テーブル412は、分析を行うマシンの対応関係を関連付けした分析機器対応テーブルであり、図5(b)に示す如く、どのマシン同士の通信に対して分析を行うかが設定されている。ここで、値0は全ての機器という意味を持ち、例では、機器1と他の全ての機器、機器2と他の全ての機器に対する通信の分析を行う設定となっていることを意味する。
分析内容テーブル413は、分析を行うデータの内容を定義した分析内容設定テーブルであり、図5(c)に示す如く、Index以外に開始・終了を意味する開始・終了フラグと、分析するためのキーワードが設定されている分析内容と、複数キーワードを設定する場合に必用な関連分析内容Indexと関連条件とがある。前記分析内容には、開始フラグ(0)が設定されている条件に当てはまるデータから終了フラグ(1)が設定されている条件に当てはまるデータまでを分析時間(主にサーバ内処理時間)として算出する。条件としては、複数条件を設定でき、例では、分析内容Indexの1、2が開始の複数条件としてand条件で設定されているため、これら両方の条件に当てはまるデータが開始データとなる。and以外には、orの設定が行え、この場合は、どちらかの条件に当てはまるデータが分析対象のデータとなる。
これら設定内容とテーブル内容との対応表414は、後述の図8における定義変更項目504から設定を行った設定内容を分析内容設定テーブル413へ格納する際に参照される定義変更項目504の各内容と分析内容設定テーブルに格納されるデータの対応表である。
図3及び図8の例では、簡略に設定内容を記述しているが、それぞれの時間を計測するための判断の基準となるパケットの内部データ情報を設定する必要がある。図3及び図8では、全体レスポンスをTCPフローとして定義しているが、これは一般的なTCPのフローに順ずるという意味であり、TCPのコネクション確立から切断までの処理を全体時間として計算するということになる。
図3及び図8では、サーバ処理時間をResponseData1 − RequestDataとして定義している。ここで、 ResponseData1とRequestDataを識別するための情報が必要になる。設定時にその設定を行うが、ここでは、ResponseData1は、TCPの上位レイヤの12、13バイト目のデータで判断(設定)している。またRequestDataに関しては、TCPのPushフラグの状態とTCPの上位レイヤの1バイト目のデータで判断(設定)している。
図3及び図8では、ネットワーク処理時間をAR−SRと定義している。ここで、全体レスポンスがTCPフローに順ずるという設定のため、ネットワーク処理時間もTCPフローに準じ、TCPのコネクション切断までを全体時間として、該全体時間からサーバ処理時間を引いた値をネットワークの処理時間として算出する。
品質分析間隔テーブル415は、図6(b)の如く、分析機器対応テーブル412の分析情報Indexをキーとして、特定の通信機器間のキャプチャデータを分析内容設定テーブル413の定義をもとにネットワーク処理時間とサーバ処理時間に切り分ける動作間隔の情報を格納している。図示の例では、分析情報Index1は5分と設定しているため、機器テーブル411と分析機器対応テーブル412から、機器1とその他全ての機器間でキャプチャされるデータのネットワーク処理時間とサーバ処理時間の切り分け動作が5分毎、機器2とその他全ての機器間でキャプチャされるデータのネットワーク処理時間とサーバ処理時間の切り分け動作は3分毎に行われることを意味している。
品質情報送信間隔テーブル416は、図6(c)の如く、分析機器対応テーブル412の分析情報Indexをキーとして、ネットワーク処理時間とサーバ処理時間に切り分けた結果を監視装置へ送信する間隔に関する情報を格納している。図示の例では、分析情報Index1は60分と設定しているため、機器テーブル411と分析機器対応テーブル412から、機器1とその他全ての機器間のネットワーク処理時間とサーバ処理時間の切り分けた結果が60分毎、機器2とその他全ての機器間のネットワーク処理時間とサーバ処理時間の切り分けた結果は30分毎に送信される。この品質情報送信間隔が0に設定されている場合は、監視装置への送信を行わない。但し、ネットワークアプリケーション障害原因切り分け装置は、これらテーブルで定義されている内容や算出結果を保持し、監視装置からのデータ取得要求に答えて、結果を送る機能を持つ。この結果の送受信には、SNMPを利用することができる。つまり、ネットワークアプリケーション障害原因切り分け装置は、SNMPエージェントとして動作することが可能で、定義内容や算出結果をMIBとして保持することができる。
トラヒックキャプチャ時間テーブル417は、図6(d)の如く、分析機器対応テーブル412の分析情報Indexをキーとして、特定の通信機器間を流れるデータを取得する開始時間と終了時間の情報を格納している。図示の例では、分析情報Index1は、開始時刻が8:00、終了時刻が19:30となっているので機器テーブル411と分析機器対応テーブル412から、機器1とその他全ての機器間でやり取りされるデータの取得を8:00に開始し、終了時刻の19:30までデータの取得をし続ける。
これら機器テーブル421および分析結果テーブル422は、いずれも品質情報DB212にあり、品質分析機能204によりネットワーク処理時間とサーバ処理時間に切り分けられた結果に関する情報である。
機器テーブル421は、図7(a)に示す如く、機器情報を保存しておくためのテーブルである。これは、分析方法設定情報の機器テーブル411と共有しても構わない。分析結果テーブル422は、図7(b)に示す如く、分析結果を保存しておくテーブルの構成例である。全体のレスポンス時間と分析方法設定情報で設定されている指定範囲での時間とを別々のレコードで保存している。
<システム全体の動作説明>
次に、図3のネットワークアプリケーションの動作フローと図1のネットワークシステム構成図をもとにネットワークシステム全体の動作をデータの流れを中心に説明する。
図3は、クライアント(111〜113)がアプリケーションサーバ101にあるネットワークアプリケーションへ処理を要求してから処理結果が返ってくるまでのやり取りされるデータの流れをフローとして表したものであり、図5に示したAP動作フロー502と同一なものである。
図中の符号T1からT7までのパケットのやり取りまでがTCPセッションの確立を表しており以下の通りである。なお、この手順は、「3Wayハンドシェイク」という一般的なセッション確立手段である。
[1]1−T3:クライアントからサーバにTCP同期要求パケット(SYN)を送信
[2]T3−T5:サーバから同期要求の確認応答パケット(SYN ACK)を送信
[3]T5−T7:クライアントから確認応答パケット(ACK)を送信
セッションが確立されたことを確認すると、クライアントは処理要求(RequestData)をサーバに向けて送信する(T8−T10)。処理要求を受けたサーバは、処理を開始すると共に処理要求を受け付けた旨の確認応答(ACK)をクライアントへ送信する(T10−T12)。クライアントから要求された処理が終了したら、サーバはクライアントに対して処理結果(ResponseData1〜ResponseData n)を送信する(T13−T15、T16−T18、T19−T21)。ここで、複数の送信が行われているのは、一度に送信できるデータ容量に制限があるので、処理結果を前記制限内の容量に分割して送信しているためであり、サーバ処理自体は最初の処理結果(ResponseData1)の送信時点で終了している。よって、サーバ処理時間はT14の時間からT9の時間を引くことで求めることができる。サーバから処理結果を受取ったクライアントは、受け取りの確認応答(ACK)をサーバへ送信する(T22−T24)。
次に、目的の処理結果を受取ったクライアントは、TCPコネクション切断要求パケット(FIN)をサーバへ送信する(T25−T27)。前記切断要求を受取ったサーバは、切断要求の確認応答パケット(FIN ACK)を送信し(T27−T29)、該応答を受取ったクライアントは、その旨の確認応答(ACK)パケットを送信し(T29−T31)、コネクションの切断が完了する。
ここでネットワークアプリケーション障害原因切り分け装置103は、上述のようにクライアントとネットワークアプリケーションサーバとで受渡しされるパケットデータ151を取得するとともに、該パケットデータの取得した時間を関連付けて記録する。そして、予め管理者により定義された分析方法設定情報に基づき前記パケットデータの受渡しをサーバの処理時間とネットワークの処理時間に切り分けた上で該分析結果を蓄積する。蓄積された前記分析結果は、管理者の設定した一定間隔で監視センタ131へ送信される。
監視センタ131では、ネットワークアプリケーション障害原因切り分け装置103から送信された前記分析結果を受信し、図8の分析結果表示画面例511に示した一例のようにグラフ化するなどして、表示画面装置に表示する。
<ネットワークアプリケーション障害原因切り分け装置の動作説明>
次に、図9乃至図13の動作フローをもとに図2に示す各機能の動作を説明する。図9は分析方法設定機能の動作を示すフローであり、この処理手順は、分析方法設定機能202により図8に示すGUI等501を監視センタ131等にある表示装置上に表示し(S601)、次に監視対象機器を選択する項目に該対象機器が選択されているかを確認し(S602)、選択されていなければ選択を促すメッセージを表示し(S603)、選択されていた場合は、機器テーブル411を参照し、機器インデックスを分析機器対応テーブル412へ格納し(S604)、選択機器間で受渡しされるデータを取得するために制御機能203へ指示をだす(S605)。なお、ここでは対象機器をプルダウンメニューより入力する形式としているが、画面上にネットワーク構成図を表示して該ネットワーク構成図上に配置した機器を示すアイコン等をクリックすることで選択できるようにしても良い。
次に、本処理は、前記制御機能より前記選択機器間の取得データを受取った後、表示装置上に前記選択機器間のデータの受渡しをAP動作フロー502へ表示し(S606)、最後に該動作フローをもとに定義項目504を用いてサーバ処理時間とネットワーク処理時間を設定する。その際、これら決定されたサーバ処理時間とネットワーク処理時間項目は、設定内容とテーブル内容との対応表414を用いて変換され(S607)、分析内容設定テーブル413に格納される(S608)。
なお、図8の定義変更項目504では、簡略に設定内容を記述しているが、それぞれの時間を計測するための判断の基準となるパケットの内部データ情報を設定する必要がある。また、動作フロー502では、全体レスポンスをTCPフローとして定義している。これは、一般的なTCPのフローに準ずるという意味であり、TCPのコネクション確立から切断までの処理を全体時間として計算するということになる。
定義変更項目504は、サーバ処理時間をResponseData1 − RequestDataとして定義している。ここで、ResponseData1とRequestDataを識別するための情報が必要になる。設定時にその設定を行うが、テーブル413または414では、ResponseData1は、TCPの上位レイヤの12、13バイト目のデータで判断(設定)している。また、RequestDataに関しては、TCPのPushフラグの状態とTCPの上位レイヤの1バイト目のデータで判断(設定)している。
定義変更項目504は、ネットワーク処理時間を、AR − SRと定義している。ここで、全体レスポンスがTCPフローに準ずるという設定のため、ネットワーク処理時間もTCPフローに準じ、TCPのコネクション断までを全体時間として、ネットワークの処理時間を算出する。
また、その他の設定項目として、制御項目505に示すように品質分析間隔、品質情報送信、トラヒックキャプチャ時間等があり、適宜選択された制御項目は、品質分析間隔テーブル415、品質情報送信間隔テーブル416、トラヒックキャプチャ時間テーブル417へ格納される(S609)。
次に制御機能203は、図13に示す如く、上述のように分析方法設定機能202より選択された特定機器間を流れるデータの取得依頼があった場合(S1001)、トラヒックキャプチャ機能206へデータを取得するよう指示を出し(S1007)、前記キャプチャ機能が採取したデータをキャプチャデータDB213から取得し(S1008)、分析方法設定機能202へ渡す(S1009)。次に、分析方法設定情報DB211を確認し(S1002)、新たな設定項目を読み込み(S1003)、各機能へ指示を出す。
例えば、トラヒックキャプチャ機能に対しては、分析機器対応テーブル412より、設定された取得データをユニークに特定する分析情報Indexを用いてトラヒックキャプチャ時間テーブル417に設定された開始時刻と終了時刻データを読み込み、このデータをもとにトラヒックキャプチャ機能206へパケットデータの読み込み開始時刻と終了時刻の指示をだす(S1004)。
品質分析機能に対しては、分析機器対応テーブル412より、設定された取得データをユニークに特定する分析情報Indexを用いて品質分析間隔テーブル415に設定された分析実行間隔データを読み込み、このデータをもとに品質分析機能204へ分析間隔の指示をだす(S1005)。
品質情報送信機能に対しては、分析機器対応テーブル412より、設定された取得データをユニークに特定する分析情報Indexを用いて品質情報送信間隔テーブル416に設定された品質情報送信間隔データを読み込み、このデータをもとに品質情報送信機能205へ分析間隔の指示をだす(S1006)。
品質分析機能204は、図10に示す如く、制御機能203より分析方法設定情報DB211に格納させたデータに基づいた制御情報を受取る(S701)。次にキャプチャデータDB213からキャプチャデータを読み込んでくる(S703)。前記制御情報に基づきキャプチャデータから全体の処理時間と指定された範囲の処理時間を切り分けし(S704)、該分析結果を品質情報DB212へ格納する(S705)。
次に、品質情報送信機能205は、図12に示す如く、制御機能203より分析方法設定情報DB211に格納させたデータに基づいた制御情報を受取り(S901)、制御機能203から指示があった場合(S902)、前記制御機能から受取る指示(制御情報)に基づき品質情報DB212から分析結果を読み込み(S903)、監視センタ131等へ送信する(S904)。具体的には、分析機器対応テーブル412の情報を受取り、分析結果テーブル422から該当するレコードのデータを抽出し品質情報送信間隔テーブル416で指定された間隔で送信する。
なお、この分析結果の送信については、分析方法設定情報に定めた一定の間隔で送信することとしているが、監視センタ131等から適宜要求を出し、該要求に基づいて送信するようにしても良い。
送信されたデータを受信した監視センタ131等にある表示端末では、受信データをグラフ化して表示し、閾値を予め定めておくことで該閾値を超えた場合にアラームを発するように構成することで、障害発生時の切り分けだけでなく障害発生検出装置としても機能させることができる。
次に、トラヒックキャプチャ機能206は、図11に示す如く、制御機能203より分析方法設定情報DB211に格納させたデータに基づいた制御情報を受取り(S801)、制御機能203から指示があった場合(S802)、前記制御機能から受取った指示(制御情報)に基づき、ネットワーク上に流れるデータから特定機器間のデータを取得し(S803)、キャプチャデータDB213へ格納する(S804)。具体的には、分析機器対応テーブル412より通信機器Index1及びIndex2を受取ることでデータIndexテーブル402の送信元機器Indexと送信先Indexに機器Indexを、データキャプチャ日及びデータキャプチャ時刻にデータをキャプチャした日付および時刻を書き込むと共に、キャプチャした実データが格納されるデータ格納テーブル403にデータIndexテーブル402のデータIndexをキーとして、各レイヤにデータを格納するという動作になる。
このように図8は、制御機能203の動作設定を行う際の分析機能設定機能202におけるGUIの一例であり、社内インフラ管理者等のネットワークアプリケーション障害原因切り分け装置103を操作する者が、図8に示したGUIより分析方法設定機能202を使用し、制御機能203をどのように動作させるかの動作を設定する。
画面左のAP動作フロー502は、本システムのトラヒックキャプチャ機能206により読み込まれたパケットデータをもとに作成されたネットワークアプリケーションの動作フローであり、右上の定義変更項目504は、ネットワーク処理とサーバ処理の定義を行う項目である。本例ではプルダウンメニュー形式で設定できるようにしているが、画面左のフローを直接クリックして選択できるようにしても良い。
更に画面右下の制御項目505は、制御機能203が品質分析機能204/品質情報送信機能205/トラヒックキャプチャ機能206を制御する際に、どのように制御させるかを管理者が事前に定義する際に使用する項目である。尚、本画面にて設定された分析方法設定機能202および制御機能203に関する設定情報は分析方法設定情報211に格納される。
以上、詳述したように、本実施形態によるネットワークアプリケーション障害原因切り分け装置及びプログラムは、ネットワークアプリケーションで障害が発生した場合、その障害の原因がサーバなのかネットワークなのかを切り分ける際にネットワーク内を流れるデータをパケットレベルで設定・分析することによって、ネットワークアプリケーションの障害原因がサーバで発生しているのかネットワークで発生しているのかを正確に切り分けることができる。
本発明は、次の方法で使用することが考えられる。
使用者:社内インフラ管理者、アウトソーシング企業の顧客インフラ運用担当者
使用方法:
[1]社内システムの品質監視
[2]ISP(Internet・Service・Provider)によるWebアプリケーションの品質監視
[3]MSP(management Service Provider)による顧客システムの品質監視
ネットワークアプリケーション障害原因切り分け装置を設置した場合の監視システム構成例図。 ネットワークアプリケーション障害原因切り分け装置の構成図。 アプリケーションの動作フローの例図。 ネットワークアプリケーション障害原因切り分け装置が使用する各テーブル(キャプチャデータ)構成図。 ネットワークアプリケーション障害原因切り分け装置が使用する各テーブル(分析方法設定情報)の構成図。 ネットワークアプリケーション障害原因切り分け装置が使用する各テーブル(キャプチャデータ)の構成図。 ネットワークアプリケーション障害原因切り分け装置が使用する各テーブル(分析結果)の構成図。 分析方法設定機能の画面(GUI)例図。 分析方法設定機能の動作を示すフローチャート図。 品質分析機能の動作を示すフローチャート図。 トラヒックキャプチャ機能の動作を示すフローチャート図。 品質情報送信機能の動作を示すフローチャート図。 制御機能の動作を示すフローチャート図。
符号の説明
101:サーバ郡、102:スイッチングネットワーク、103:ネットワークアプリケーション障害原因切り分け装置、111〜113:クライアント拠点、121〜125、131:監視センタ、141:Network、151:パケット動作、152:監視情報の流れ、201:ネットワークアプリケーション障害原因切り分け装置、202:分析方法設定機能、203:制御機能、204:品質分析機能、205:品質情報送信機能、206:トラフィックキャプチャ機能、207:ネットワークカード、208:ネットワークケーブル、211:分析方法設定情報DB、212:品質情報DB、213:キャプチャデータDB、301:アプリケーションの動作フロー、401:機器テーブル、402:データIndexテーブル、403:データ格納テーブル、411:機器テーブル、412:分析機器対応テーブル、413:分析内容設定テーブル、414:設定内容とテーブル内容との対応表、415:品質分析間隔テーブル、416:品質情報送信間隔テーブル、417:トラヒックキャプチャ時間テーブル、421:機器テーブル、422:分析結果テーブル、501:画面表示例、502:ネットワーク動作フロー、503:機器指定項目、504:切り分け定義設定項目、505:制御設定項目、511:分析結果表示画面例。

Claims (4)

  1. ネットワークアプリケーションサーバとクライアントの間で受渡しされるパケットデータの障害原因の切り分けを行う障害原因切り分け装置であって、ネットワークアプリケーションサーバとクライアントの間で受渡しされるパケットデータを取得し記憶する記憶手段と、該記憶されたパケットデータからネットワーク処理時間を定義するための区間及びサーバ処理時間を定義するための区間を設定させる定義情報設定手段と、該記憶手段に記憶されたパケットデータを基に前記定義情報設定手段により設定した定義情報に基づいてサーバの処理時間とネットワークの処理時間に切り分ける切り分け手段とを備えることを特徴とするネットワークアプリケーションの障害原因切り分け装置。
  2. 前記ネットワークアプリケーションサーバとクライアントの間で受渡しされるパケットデータを取得し記憶する記憶手段により記憶されたパケットデータに基づき、ネットワークアプリケーションサーバとクライアントで受け渡しされるパケットデータの動作フローを事前に表示する表示手段と、該表示手段により表示された画面からネットワーク処理時間を定義するための区間およびサーバ処理時間を定義するための区間を設定させる設定手段とを備えることを特徴とする請求項1記載のネットワークアプリケーションの障害原因切り分け装置。
  3. ネットワークアプリケーションサーバとクライアントの間で受渡しされるパケットデータの障害原因の切り分けを行う障害原因切り分けプログラムであって、ネットワークアプリケーションサーバとクライアントの間で受渡しされるパケットデータを取得し記憶する記憶機能と、該記憶されたパケットデータからネットワーク処理時間を定義するための区間及びサーバ処理時間を定義するための区間を設定させる定義情報設定機能と、該記憶機能により記憶されたパケットデータを基に前記定義情報設定機能により設定した定義情報に基づいてサーバの処理時間とネットワークの処理時間に切り分ける切り分け機能とを実現させることを特徴とするネットワークアプリケーションの障害原因切り分けプログラム。
  4. 前記ネットワークアプリケーションサーバとクライアントの間で受渡しされるパケットデータを取得し記憶する記憶手段により記憶されたパケットデータに基づき、ネットワークアプリケーションサーバとクライアントで受け渡しされるパケットデータの動作フローを事前に表示する表示機能と、該表示機能により表示された画面からネットワーク処理時間を定義するための区間およびサーバ処理時間を定義するための区間を設定させる設定機能とを実現させることを特徴とする請求項1記載のネットワークアプリケーションの障害原因切り分けプログラム。

JP2004248204A 2004-08-27 2004-08-27 ネットワークアプリケーション障害原因切り分け装置及び該障害原因切り分けプログラム Expired - Fee Related JP3933655B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004248204A JP3933655B2 (ja) 2004-08-27 2004-08-27 ネットワークアプリケーション障害原因切り分け装置及び該障害原因切り分けプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004248204A JP3933655B2 (ja) 2004-08-27 2004-08-27 ネットワークアプリケーション障害原因切り分け装置及び該障害原因切り分けプログラム

Publications (2)

Publication Number Publication Date
JP2006065619A true JP2006065619A (ja) 2006-03-09
JP3933655B2 JP3933655B2 (ja) 2007-06-20

Family

ID=36112064

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004248204A Expired - Fee Related JP3933655B2 (ja) 2004-08-27 2004-08-27 ネットワークアプリケーション障害原因切り分け装置及び該障害原因切り分けプログラム

Country Status (1)

Country Link
JP (1) JP3933655B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008242685A (ja) * 2007-03-27 2008-10-09 Nec Corp フェイルオーバ方法、クラスタシステム、情報処理装置、プログラム
JP2009171009A (ja) * 2008-01-11 2009-07-30 Fujitsu Ltd ネットワーク障害検出プログラム、ネットワーク障害検出装置、およびネットワーク障害検出方法
JP2009199556A (ja) * 2008-02-25 2009-09-03 Nec Corp 通信監視装置、通信監視方法、コンピュータプログラム、そのシステム
US8472332B2 (en) 2009-02-04 2013-06-25 Oki Electric Industry Co., Ltd. Apparatus for detecting quality deterioration of a telecommunications network by discriminating periodic faults
JP2014072781A (ja) * 2012-09-28 2014-04-21 Fujitsu Fsas Inc 判定装置、判定方法および判定プログラム
US8826274B2 (en) 2010-06-11 2014-09-02 Hitachi, Ltd. Virtual machine system, networking device and monitoring method of virtual machine system
JP2018113599A (ja) * 2017-01-12 2018-07-19 日本電気株式会社 通信処理システム、通信監視装置、通信監視方法及び通信監視プログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008242685A (ja) * 2007-03-27 2008-10-09 Nec Corp フェイルオーバ方法、クラスタシステム、情報処理装置、プログラム
JP2009171009A (ja) * 2008-01-11 2009-07-30 Fujitsu Ltd ネットワーク障害検出プログラム、ネットワーク障害検出装置、およびネットワーク障害検出方法
JP2009199556A (ja) * 2008-02-25 2009-09-03 Nec Corp 通信監視装置、通信監視方法、コンピュータプログラム、そのシステム
US8472332B2 (en) 2009-02-04 2013-06-25 Oki Electric Industry Co., Ltd. Apparatus for detecting quality deterioration of a telecommunications network by discriminating periodic faults
US8826274B2 (en) 2010-06-11 2014-09-02 Hitachi, Ltd. Virtual machine system, networking device and monitoring method of virtual machine system
JP2014072781A (ja) * 2012-09-28 2014-04-21 Fujitsu Fsas Inc 判定装置、判定方法および判定プログラム
JP2018113599A (ja) * 2017-01-12 2018-07-19 日本電気株式会社 通信処理システム、通信監視装置、通信監視方法及び通信監視プログラム

Also Published As

Publication number Publication date
JP3933655B2 (ja) 2007-06-20

Similar Documents

Publication Publication Date Title
Dimopoulos et al. Measuring video QoE from encrypted traffic
KR100814546B1 (ko) 통신 데이터를 수집하여 분석하는 장치 및 방법
US6363477B1 (en) Method for analyzing network application flows in an encrypted environment
EP0996254B1 (en) A method for quantifying communication performance
EP0994602B1 (en) Computer system and network performance monitoring
JP5873188B2 (ja) モバイル端末のインターネットアクセスサービスの品質を監視するための方法、デバイス、およびシステム
CN101933290B (zh) 基于流信息对网络设备上的acl进行配置的方法
EP2563062B1 (en) Long connection management apparatus and link resource management method for long connection communication
EP1367771B1 (en) Passive network monitoring system
US7091846B2 (en) Methods and apparatus for handling information regarding an alarm for a communication network
EP3849136A1 (en) Service quality monitoring method, apparatus, and system
CN106411629B (zh) 一种用于监控cdn节点的状态的方法和设备
JP2001356972A (ja) ネットワーク監視システム及びネットワーク監視方法
CN107800565A (zh) 巡检方法、装置、系统、计算机设备和存储介质
CN111327478A (zh) 网络测量方法和装置、设备及存储介质
CN107426007A (zh) 用于跟踪网络交换机中的网络装置信息的方法及系统
JP2008283621A (ja) ネットワーク輻輳状況監視装置、ネットワーク輻輳状況監視方法及びプログラム
EP2586158A1 (en) Apparatus and method for monitoring of connectivity services
CN107635003A (zh) 系统日志的管理方法、装置及系统
JP2022106771A (ja) データ処理方法、サーバ、およびデータ収集デバイス
CN112491719A (zh) 网络节点的选择方法、设备及存储介质
JP3933655B2 (ja) ネットワークアプリケーション障害原因切り分け装置及び該障害原因切り分けプログラム
WO2017023266A1 (en) Application centric network experience monitoring
JP4167876B2 (ja) ネットワーク計測設定装置
CN110727564A (zh) 服务器性能压力测试的测试数据实时监控方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061212

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070206

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070306

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070313

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100330

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110330

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110330

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120330

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130330

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130330

Year of fee payment: 6

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130330

Year of fee payment: 6

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140330

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees