JP6139428B2 - 障害解析装置及び障害解析システム - Google Patents

障害解析装置及び障害解析システム Download PDF

Info

Publication number
JP6139428B2
JP6139428B2 JP2014022338A JP2014022338A JP6139428B2 JP 6139428 B2 JP6139428 B2 JP 6139428B2 JP 2014022338 A JP2014022338 A JP 2014022338A JP 2014022338 A JP2014022338 A JP 2014022338A JP 6139428 B2 JP6139428 B2 JP 6139428B2
Authority
JP
Japan
Prior art keywords
route
packet
information
path
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014022338A
Other languages
English (en)
Other versions
JP2015149660A (ja
Inventor
浩二 森本
浩二 森本
高木 伸郎
伸郎 高木
柳本 清
清 柳本
土井 俊介
俊介 土井
弘高 松岡
弘高 松岡
拓也 白髭
拓也 白髭
徳嗣 森田
徳嗣 森田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone West Corp
Original Assignee
Nippon Telegraph and Telephone West Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone West Corp filed Critical Nippon Telegraph and Telephone West Corp
Priority to JP2014022338A priority Critical patent/JP6139428B2/ja
Publication of JP2015149660A publication Critical patent/JP2015149660A/ja
Application granted granted Critical
Publication of JP6139428B2 publication Critical patent/JP6139428B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、ネットワーク障害を解析する技術に関する。
IPマルチキャストによる映像配信サービスが広く普及している。ネットワークを用いたサービスで障害が発生した場合、素早く故障箇所を特定して対処することが求められる。故障箇所を推定する方法として、例えば特許文献1には、ネットワーク構成を示すテンプレートを記憶しておき、パケットを取得してパケットが疎通した経路を推定し、パケットの疎通の有無をネットワークの経路毎に出力する技術が開示されている。
また、ネットワーク下流における品質測定プローブの測定結果をもとに故障箇所を推定する方法がある。以下、具体例を用いて説明する。図30に示すネットワークでは、IPマルチキャストを用いて、映像配信サーバ4から映像信号が宅内装置6A〜6Cそれぞれに配信されている。このネットワークのルータ5C,5F間、ルータ5D,5G間、およびルータ5E,5H間で映像パケットをキャプチャして品質を監視しているとする。ルータ5C,5F間は正常で、ルータ5D,5G間、ルータ5E,5H間で異常が検出された場合、映像配信サーバ4からルータ5D,5G間、ルータ5E,5H間への配信経路で共通する経路であって、映像配信サーバ4からルータ5C,5F間への配信経路を含まない経路であるルータ5C−ルータ5Dの区間が故障位置であると推定される。
特開2011−19001号公報
上記で説明したネットワーク下流における品質測定プローブの測定結果をもとに故障箇所を推定する方法では経路情報が必要となる。従来は、経路情報を経路が変更される都度更新することができず、動的に経路が変化するネットワークでは、異常を検出した時点で経路情報を取得する必要があった。
しかしながら、異常を検出した時点で経路情報を取得すると、ネットワーク故障によって経路が切り替わった場合、新しい経路情報に基づき、誤って故障位置を推定するという問題があった。以下、具体例を用いて説明する。図31は、ルータ5C,5D間で故障が発生し、映像配信サーバ4から宅内装置6B,6Cへの配信経路がルータ5Bへ迂回する経路となったとき状態である。このときに故障位置を推定すると、映像配信サーバ4からルータ5D,5G間、ルータ5E,5H間への配信経路で共通する経路であって、映像配信サーバ4からルータ5C,5F間への配信経路を含まない経路は、ルータ5C−ルータ5B−ルータ5Dの区間となり、故障箇所を誤って判定してしまう。
また、宅内装置からの配信停止要求により正常に配信停止した場合、ユーザの操作による正常な状態であるのに通信断を検出し、異常が発生したと判定してしまうという問題があった。
本発明は、上記に鑑みてなされたものであり、ネットワークの故障箇所をより正確に推定することを目的とする。
第1の本発明に係る障害解析装置は、IPマルチキャストで送信されるコンテンツを運ぶパケットをキャプチャして品質を解析する複数のパケット解析装置から品質情報と前記パケットが転送される経路が変更されたことを示す経路変更通知を受信してネットワーク上の故障位置を推定する障害解析装置であって、ネットワーク上を流れる信号の経路を示す経路情報の履歴を前世代経路として蓄積する蓄積手段と、経路が変更されたことを示す経路変更通知を受信したときに、現在の経路情報を前世代経路として前記蓄積手段に保存し、現在の経路情報を更新する経路情報更新手段と、品質情報を受信し、当該品質情報が異常を示すものである場合は、異常が発生した時点の経路情報を前記蓄積手段に蓄積された前記前世代経路の中から検索し、検索した前記前世代経路を用いて前記異常の原因となった故障位置を推定する故障位置推定手段と、を有することを特徴とする。
第2の本発明に係る障害解析システムは、IPマルチキャストで送信されるコンテンツを運ぶパケットが転送されるネットワーク上の故障位置を推定する障害解析システムであって、前記ネットワークからパケットをキャプチャして解析する複数のパケット解析装置と前記パケット解析装置から品質情報と前記パケットが転送される経路が変更されたことを示す経路変更通知を受信してネットワーク上の故障位置を推定する障害解析装置を備え、前記パケット解析装置は、前記ネットワークからパケットを取得する取得手段と、前記取得手段が取得したパケットから品質を解析し、品質情報を前記障害解析装置へ送信する品質解析手段と、前記取得手段が取得したパケットから前記経路の変更を検出し、前記経路変更通知を前記障害解析装置へ送信する経路変更判定手段と、を有し、前記障害解析装置は、ネットワーク上を流れる信号の経路を示す経路情報の履歴を前世代経路として蓄積する蓄積手段と、前記経路変更通知を受信したときに、現在の経路情報を前世代経路として前記蓄積手段に保存し、現在の経路情報を更新する経路情報更新手段と、前記品質情報を受信し、当該品質情報が異常を示すものである場合は、異常が発生した時点の経路情報を前記蓄積手段に蓄積された前記前世代経路の中から検索し、検索した前記前世代経路を用いて前記異常の原因となった故障位置を推定する故障位置推定手段と、を有することを特徴とする。
上記障害解析システムにおいて、 前記経路変更判定手段は、新たなコンテンツを運ぶパケットを検出したとき、コンテンツの配信を停止するパケットを検出したとき、パケットのTTLの値が変化したときのいずれかのときに、前記経路変更通知を送信すること を特徴とする。
本発明によれば、ネットワークの故障箇所をより正確に推定することができる。
本実施の形態における障害解析装置とパケット解析装置で構成される障害解析システムを含む全体構成図である。 本実施の形態における障害解析装置の構成を示す機能ブロック図である。 上記障害解析装置の蓄積部が保持する各情報の例を示す図である。 本実施の形態におけるパケット解析装置の構成を示す機能ブロック図である。 上記パケット解析装置の蓄積部が保持するTTLの例を示す。 本実施の形態における障害解析システムがパケットをキャプチャして品質を解析する処理の流れを示すシーケンス図である。 本実施の形態における障害解析装置による品質情報を確認して故障位置を特定する処理の流れを示すフローチャートである。 本実施の形態における障害解析システムが経路の変更を検出したときの処理の流れを示すシーケンス図である。 本実施の形態におけるパケット解析装置が経路の変更を検出するときの処理の流れを示すフローチャートである。 本実施の形態におけるパケット解析装置が配信停止要求を受信したときの処理の流れを示すフローチャートである。 本実施の形態における障害解析装置が経路変更通知を受信したときの処理の流れを示すフローチャートである。 経路によってパケット解析装置が受信するパケットのTTLを異ならせたネットワークを説明する図である。 具体例の説明で用いるネットワークの構成を示す図である。 図13の状態においてパケット解析装置が保持するTTLの値を示す図である。 図13の状態において障害解析装置が保持するデータの例を示す図である。 図13の状態に加えて、新たなチャンネルが配信されたときの様子を示す図である。 図16の状態においてパケット解析装置が保持するTTLの値を示す図である。 図16の状態において障害解析装置が保持するデータの例を示す図である。 図16の状態に加えて、さらに新たなチャンネルが配信されたときの様子を示す図である。 図19の状態においてパケット解析装置が保持するTTLの値を示す図である。 図19の状態において障害解析装置が保持するデータの例を示す図である。 図19に状態において、チャンネルの配信が停止されたときの様子を示す図である。 図22の状態においてパケット解析装置が保持するTTLの値を示す図である。 図22の状態において障害解析装置が保持するデータの例を示す図である。 図22の状態において、リンクダウンが発生し、経路が切り替わったときの様子を示す図である。 図22の状態においてパケット解析装置が保持するTTLの値を示す図である。 図25の状態において、パケット解析装置から経路変更通知を受信したときの現在経路と前世代経路の例を示す図である。 図25の状態において、さらに別のパケット解析装置から経路変更通知を受信したときの現在経路の例を示す図である。 図25の状態において障害解析装置が保持するデータの例を示す図である。 ネットワーク上で映像信号が配信されている様子を示す図である。 図30のネットワークにおいて障害が発生し、経路が切り替わった様子を示す図である。
以下、本発明の実施の形態について図面を用いて説明する。
図1は、本実施の形態における障害解析装置とパケット解析装置で構成される障害解析システムを含む全体構成図である。同図に示す障害解析装置1は、PIM−SSMを用いたIPマルチキャストネットワークにおける映像配信サービスを監視して、故障位置を特定する装置である。同図の映像配信サービスでは、PIM−SSMによってマルチキャストルートが作成され、映像配信にはRTPが利用されている。パケット解析装置2A〜2Cは、RTPのシーケンス番号をもとにパケットロスを検出する。パケットが一定時間流れなければ品質異常と判断する。
映像信号は、映像配信サーバ4から監視対象ネットワーク100のルータ5A〜5Hを介して宅内装置6A〜6Cへ送信される。図1では、映像配信サーバ4から配信元のIPアドレスがS1で宛先マルチキャストのアドレスがG1の映像信号(以下、チャンネル(S1,G1)と表記する)が宅内装置6A〜6Cへ配信されている様子を示している。
パケット解析装置2A〜2Cは、映像信号を運ぶパケットをキャプチャして各映像信号の映像品質を解析し、品質情報を障害解析装置1へ送信する。また、パケット解析装置2A〜2Cは、映像信号が転送される経路の変化を検出し、経路変更通知を障害解析装置1へ送信する。図1では、パケット解析装置2A〜2Cのそれぞれは、ルータ5C,5F間、ルータ5D,5G間、およびルータ5E,5H間のリンクにおいてパケットをキャプチャしている。
障害解析装置1は、パケット解析装置2A〜2Cから受信した品質情報が異常を示すものである場合は、異常が発生した時点の経路情報を用いて故障位置を特定する。また、パケット解析装置2A〜2Cから経路変更通知を受信した場合は、経路情報取得装置3を用いて新たな経路情報を取得して保持する経路情報を更新する。経路情報を更新する際には、古い経路情報を前世代の経路情報として蓄積する。
次に、障害解析装置1およびパケット解析装置2A〜2Cについて説明する。
図2は、本実施の形態における障害解析装置1の構成を示す機能ブロック図である。同図に示す障害解析装置1は、受信部11、経路情報更新部12、品質判定部13、障害位置推定部14、および蓄積部15を備える。
受信部11は、パケット解析装置2A〜2Cそれぞれから経路変更通知、品質情報を受信する。
経路情報更新部12は、受信部11が経路変更通知を受信したときに、経路情報取得装置3を用いて新たな経路情報を取得し、蓄積部15に蓄積されている現在の経路情報を前世代の経路情報として蓄積するとともに、新たな経路情報を現在の経路情報に反映させる。
品質判定部13は、受信部11が受信した品質情報を蓄積部15に保存し、品質情報が異常を示すものである場合は障害位置推定部14に通知する。
障害位置推定部14は、品質情報が異常を示した時点の経路情報を蓄積部15から読み出し、異常が発生した故障位置を特定する。
蓄積部15は、現在の経路情報を保持する現在経路、過去の経路情報を保持する前世代経路、パケット解析装置2A〜2Cを配置した位置を示すリンク情報、および各パケット解析装置2A〜2Cから取得した品質状況を保持する。
図3は、蓄積部15が保持する各情報の例を示す図である。
図3(a)に示す現在経路は、チャンネル、タイムスタンプ、および経路を保持する。チャンネルは、監視対象の映像信号を示す情報であり、ここでは送信元アドレスS1と送信先アドレスG1の組で(S1,G1)と示している。タイムスタンプは経路が更新された時を示す情報であり、映像信号のパケットのRTPヘッダ部分に記載されたRTPタイムスタンプを用いる。経路は、チャンネルの項目で示された映像信号のパケットの経路を示す情報であり、通過するルータの識別子を並べて示している。例えば、図1の経路1は[S1,5A,5C,5F]と記載されており、映像配信サーバ4(IPアドレスはS1)から送信されたパケットがルータ5A,ルータ5C,ルータ5Fを経由することを示している。図1ではチャンネル(S1,G1)が配信される経路は3つ存在するので、図3(a)の現在経路には3つの経路1〜3の情報が記載されている。
図3(b)に示す前世代経路は過去の経路情報であり、現在経路と同じ項目の情報を保持している。図3(b)の例では、タイムスタンプが50のときに更新された経路情報を保持している。図3(b)のタイムスタンプが50のときの経路情報と図3(a)のタイムスタンプが100のときの現在経路とを比べると、図3(a)は経路3の情報が存在する点で異なるので、タイムスタンプが100のときに経路3が新たに追加されたことが分かる。
図3(c)に示すリンク情報はパケット解析装置2A〜2Cを配置した位置を示す情報であり、監視対象リンク、接続ルータ1,2の情報を保持する。図3(c)に示す情報から、パケット解析装置2A〜2Cは、ルータ5C,5F間のリンク1、ルータ5D,5G間のリンク2、ルータ5E,5H間のリンク3のそれぞれに接続されていることが分かる。なお、リンク情報はネットワーク管理者が予め入力しておく。
図3(d)に示す品質状況はパケット解析装置2A〜2Cから受信した品質情報であり、監視対象のチャンネル、リンク、および品質の情報を保持する。
続いて、パケット解析装置について説明する。
図4は、本実施の形態におけるパケット解析装置2の構成を示す機能ブロック図である。同図に示すパケット解析装置2は、パケット取得部21、経路変更判定部22、品質通知部23、および蓄積部24を備える。
パケット取得部21は、パケット解析装置2が接続されたリンクからTAPなどで映像信号のパケットをコピーしてキャプチャし、蓄積部24に格納する。
経路変更判定部22は、パケット取得部21がキャプチャしたパケットから経路の変更を検出し、障害解析装置1へ通知する。本実施の形態では、(1)新しいチャンネルのパケットを検出したとき、(2)配信停止要求(PIM−pruneパケット)を検出したとき、(3)パケットのIPヘッダのTTLの変化を検出したとき、の3つのタイミングで経路の変更を検出する。パケット解析装置2が接続されたリンクに新たなチャンネルの映像信号を流す経路が追加されたときに、新しいチャンネルのパケットが検出される。パケット解析装置2が接続されたリンクを流れるチャンネルの経路が削除されるときに、配信停止要求が検出される。監視対象ネットワーク100内のリンクで障害が発生して経路が変更されたときに、パケットのIPヘッダのTTLの変化が検出される。
品質通知部23は、蓄積部24に蓄積されたパケットを解析してチャンネル毎にパケットロス等の品質に関わるパケットの挙動を監視し、定期的(例えば5分毎)に障害解析装置1へチャンネル毎の品質情報を通知する。
蓄積部24は、パケット取得部21がキャプチャしたパケットおよびチャンネル毎にパケットのTTLの値を保持する。経路変更判定部22は、蓄積部24に蓄積されたTTLの値とパケット取得部21がキャプチャしたパケットのTTLの値を比較して経路の変更を検出する。
図5に、蓄積部24が保持するTTLの例を示す。図5(a)〜(c)は、図1のパケット解析装置2A〜2Cそれぞれの蓄積部24に蓄積されたTTLの値を示している。図1の映像配信サーバ4がTTLの初期値を64としてパケットを送出しているとする。パケット解析装置2Aでキャプチャされるパケットは、ルータ5Aとルータ5Cから送出される度に1ずつ減算されてTTLの値が62となる。パケット解析装置2Bでキャプチャされるパケットは、さらにルータ5Dで1減算されてTTLの値が61となる。パケット解析装置2Cでキャプチャされるパケットは、さらにルータ5Eで1減算されてTTLの値が60となる。なお、TTLの変化と経路の変更についての詳細は後述する。
次に、本実施の形態における障害解析システムの動作について説明する。
図6は、本実施の形態における障害解析システムがパケットをキャプチャして品質を解析する処理の流れを示すシーケンス図である。ここでは経路の変更が検出されない場合の処理の流れを示している。
パケット解析装置2A〜2Cは、監視対象ネットワーク100の所定のリンクからパケットをキャプチャすると(ステップS11)、キャプチャしたパケットを解析する(ステップS12)。以降、パケットのキャプチャと解析が繰り返し行われる(ステップS13〜S16)。
パケット解析装置2A〜2Cは、定期的に品質情報を障害解析装置1へ送信する(ステップS17)。品質情報には、チャンネルの情報、パケットをキャプチャしたリンクの識別子、および品質が含まれる。
障害解析装置1は、品質情報を受信して確認する(ステップS18)。受信した品質情報が異常となっている場合、障害解析装置1は故障位置を特定する処理を行う。
図7は、障害解析装置1による品質情報を確認して故障位置を特定する処理の流れを示すフローチャートである。図7の処理は、図6のステップS18で行う処理である。
障害解析装置1が品質情報を受信すると(ステップS21)、品質情報を蓄積部15に格納し、品質情報に記載された品質が異常であるか否か判定する(ステップS22)。異常がない場合は(ステップS22のNO)、処理を終了する。
異常がある場合(ステップS22のYES)、その異常が継続中であるか否か判定する(ステップS23)。品質情報に記載された品質が異常の場合、パケット解析装置2A〜2Cは異常が継続しているか否かの情報、異常が回復している場合は回復時のタイムスタンプを送信しているので、パケット解析装置2A〜2Cから受信した情報に基づいて異常が継続中であるか否かを判定する。
異常が継続している場合(ステップS23のYES)、障害解析装置1は、現在経路の情報を用いて故障位置を特定する(ステップS24)。
異常が回復している場合(ステップS23のNO)、異常が回復したときのタイムスタンプよりも小さいタイムスタンプを持つ前世代経路のうち最も新しい前世代経路を用いて故障位置を特定する(ステップS25)。
なお、ステップS24,S25を実行する際には、全てのパケット解析装置2A〜2Cから送信される品質情報が揃うのを待ってから故障位置を特定する。
続いて、経路の変更を検出したときの動作について説明する。
図8は、本実施の形態における障害解析システムが経路の変更を検出したときの処理の流れを示すシーケンス図である。
パケット解析装置2A〜2Cがパケットをキャプチャし(ステップS31)、パケットを解析した結果、経路の変更が検出されると(ステップS32)、経路変更通知を障害解析装置1へ送信する(ステップS33)。前述したように、新しいチャンネルのパケットを検出したとき、配信停止要求を検出したとき、パケットのIPヘッダのTTLの変化を検出したときに、経路が変更されたとして経路変更通知を障害解析装置1へ送信する。
障害解析装置1は、経路変更通知を受信すると、経路情報取得要求を経路情報取得装置3へ送信し(ステップS34)、経路情報取得装置3は監視対象ネットワーク100に対して経路情報取得要求を送信し(ステップS35)、監視対象ネットワーク100から経路情報を取得して(ステップS36)、経路情報を障害解析装置1へ送信する(ステップS37)。なお、配信停止要求を検出したときは、経路情報を監視対象ネットワーク100から取得しなくても経路情報を更新することができるので、ステップS34〜S37の処理を行わない。
障害解析装置1は、現在経路を前世代経路に保存し、新たな経路情報で現在経路を更新する(ステップS38)。
図9は、パケット解析装置2A〜2Cが経路の変更を検出するときの処理の流れを示すフローチャートである。
パケット解析装置2A〜2Cは、パケットを受信すると(ステップS41)、そのパケットは品質監視中のチャンネルのパケットであるか否かを判定する(ステップS42)。
品質監視中のチャンネルでない場合(ステップS42のNO)、そのチャンネルの品質監視を開始し(ステップS43)、新たな経路が作成された旨の経路変更通知を障害解析装置1へ送信する(ステップS44)。この経路変更通知には、チャンネルの情報、新たなチャンネルの最初に受信したパケットのタイムスタンプ、およびパケットをキャプチャしたリンク情報を含む。
一方、品質監視中のチャンネルであった場合(ステップS42のYES)、受信したパケットのTTLの値と蓄積部24に格納したTTLの値とを比較してTTLが変化しているか否か判定し(ステップS45)、TTLが変化していない場合は(ステップS45のNO)、処理を終了する。
TTLが変化した場合(ステップS45のYES)、監視対象ネットワーク100内の経路が変更された旨の経路変更通知を障害解析装置1へ送信する(ステップS46)。この経路変更通知には、チャンネルの情報、TTLが変化したパケットのタイムスタンプ、およびパケットをキャプチャしたリンク情報を含む。
図10は、パケット解析装置2A〜2Cが配信停止要求を受信したときの処理の流れを示すフローチャートである。
パケット解析装置2A〜2Cは、配信停止要求を受信すると(ステップS51)、その配信停止要求で停止されるチャンネルが品質監視中であるか否かを調べる(ステップS52)。品質監視中のチャンネルでない場合は(ステップS52のNO)、処理を終了する。
品質監視中のチャンネルの場合(ステップS52のYES)、品質監視を停止し(ステップS53)、経路が削除される旨の経路変更通知を障害解析装置1へ送信する(ステップS54)。この経路変更通知には、チャンネルの情報、最後に受信したパケットのタイムスタンプ、およびパケットをキャプチャしたリンク情報を含む。
図11は、障害解析装置1が経路変更通知を受信したときの処理の流れを示すフローチャートである。
障害解析装置1が経路変更通知を受信すると(ステップS61)、経路変更のトリガーが配信停止要求であるか否か判定する(ステップS62)。配信停止要求でない場合(ステップS62のNO)、経路情報取得装置3を用いて監視対象ネットワーク100から経路情報を取得する(ステップS63)。経路変更のトリガーが配信停止要求の場合は(ステップS62のYES)、経路情報を監視対象ネットワーク100から取得する必要はないのでステップS63の処理を行わない。
続いて、経路変更通知とともに受信したタイムスタンプと現在経路のタイムスタンプを比較し、現在経路を前世代経路に保存する必要があるか否か判定する(ステップS64)。経路変更通知のタイムスタンプと現在経路のタイムスタンプが異なる場合は前世代経路として保存する必要があり(ステップS64のYES)、現在経路を前世代経路に保存する(ステップS65)。タイムスタンプが同じである場合は(ステップS64のNO)、すでに別のパケット解析装置2A〜2Cから受信した経路変更通知により前世代経路を保存しているので現在経路を前世代経路に保存するステップS65の処理は行わない。
そして、現在経路を新たな経路情報で更新する(ステップS66)。経路の追加、変更の場合は、ステップS63で取得した経路情報を蓄積部15の現在経路に反映し、経路の削除の場合は、現在経路から該当する経路情報を削除する。
次に、監視対象ネットワーク100におけるTTLの減算処理について説明する。
TTLの値は、通常、ルータを経由する度に1ずつ減算される。経路が変更された場合、経路毎に経由するルータの数が異なるときはパケット解析装置2A〜2CでキャプチャするパケットのTTLの値は経路により異なるものとなる。しかしながら、図12で示す監視対象ネットワーク100において、映像配信サーバ4−ルータ5A−ルータ5C−ルータ5D−ルータ5E−ルータ5Hの経路と、映像配信サーバ4−ルータ5A−ルータ5C−ルータ5B−ルータ5E−ルータ5Hの経路の両方の経路は、経由するルータの数が同じで、通常のルータの設定ではTTLの値が同一となり、TTLの変化に基づいて経路の変更を検出することができない。
そこで、監視対象ネットワーク100内の一部のルータに、送信先のルータによって減算するTTLの量を変更する設定を行っておく。図12の例では、ルータ5Cについて、ルータ5Dに向けてパケットを転送するときはTTLの値を1減算し、ルータ5Bに向けてパケットを転送するときはTTLの値を10減算するように設定する。この設定により、ルータ5Dを経由してパケット解析装置2CでキャプチャされるパケットのTTLの値は60、ルータ5Bを経由してパケット解析装置2CでキャプチャされるパケットのTTLの値は51となり、TTLの値が経路により異なるものとなる。
以上説明したように、本実施の形態によれば、障害解析装置1が経路情報の過去の履歴を前世代経路として保持しておき、パケット解析装置2A〜2Cからネットワークの異常が通知されたときに、異常が発生した時点の経路情報を用いて故障箇所を特定することにより、ネットワークの故障箇所をより正確に推定することができる。
本実施の形態によれば、経路によってパケット解析装置2A〜2CでキャプチャされるパケットのTTLの値が異なるように監視対象ネットワーク100を設定しておき、パケット解析装置2A〜2CでキャプチャしたパケットのTTLの値が変化したときに経路変更通知を障害解析装置1へ送信し、障害解析装置1が保持する現在経路を前世代経路として格納するとともに、現在経路を更新することで、監視対象ネットワーク100の変化に応じて経路情報の履歴を保持することができる。
本実施の形態によれば、パケット解析装置2A〜2Cが配信停止要求を受信したときに該当するチャンネルの監視を停止することで、ユーザ操作による正常な通信断を異常として検出することがなくなる。
[具体例]
次に、本実施の形態における障害解析システムの動作を具体例を用いて説明する。
<ネットワークの構成と保持するデータの説明>
まず、具体例の説明で用いるネットワークの構成と障害解析装置およびパケット解析装置が保持するデータについて説明する。
図13は、具体例の説明で用いるネットワークの構成とそのネットワークを流れる映像信号を示す図である。同図に示すネットワークでは、映像配信サーバS1からはチャンネル(S1,G1)がルータR1〜R9を介して各宅内装置6A〜6Cに配信されており、映像配信サーバS2からはチャンネル(S2,G3)がルータR5,R8,R9を介して宅内装置6Cに配信されている。
図示していないが、パケット解析装置2A〜2Cのそれぞれは、ルータR3,R4間のリンク1、ルータR6,R7間のリンク2、およびルータR8,R9間のリンク3に配置される。リンク1,2に配置されたパケット解析装置2A,2Bはチャンネル(S1,G1)を監視し、リンク3に配置されたパケット解析装置2Cはチャンネル(S1,G1)とチャンネル(S2,G3)を監視している。チャンネル(S1,G1)、チャンネル(S2,G3)のパケットは、映像配信サーバS1,S2からTTLの初期値の値を100として送信される。チャンネル(S1,G1)のパケットは、リンク1〜3を流れるまでに3つのルータを経由しているので、リンク1〜3でキャプチャされるパケットのTTLの値は97となる。また、チャンネル(S2,G3)のパケットは、リンク3を流れるまでに2つのルータR5,R8を経由しているのでリンク3でキャプチャされるパケットのTTLの値は98となる。図14(a)〜(c)に、パケット解析装置2A〜2Cが保持するTTLの値を示す。図14(c)に示すように、パケット解析装置2Cはチャンネル(S1,G1)とチャンネル(S2,G3)を監視しているので2つのチャンネルのパケットのTTLの値を保持している。
図15は、図13の状態において障害解析装置1が保持するデータの例を示す図である。
図15(a)の現在経路には、チャンネル(S1,G1)とチャンネル(S2,G3)の経路情報が蓄積される。チャンネル(S1,G1)は3箇所の宅内装置6A〜6Cに配信されているので3つの経路情報が記載される。チャンネル(S2,G3)は宅内装置6Cのみに配信されているので1つの経路情報が記載される。なお、同図の経路情報では、映像配信サーバ、ルータを符号のみで示している。例えば、チャンネル(S1,G1)の経路1は[S1,R1,R2,R3,R4]であるが、これは、チャンネル(S1,G1)のパケットが映像配信サーバS1からルータR1,R2,R3,R4を順に経由して宅内装置6Aに配信されることを示している。
図15(b)の前世代経路は、タイムスタンプが80と90のときのチャンネル(S1,G1)の経路を保持している。図15(b)の前世代経路では、チャンネル(S1,G1)について、タイムスタンプが80のときに[S1,R1,R2,R3,R4]の経路1が追加され、タイムスタンプが90のときに[S1,R1,R5,R6,R7]の経路2が追加されたことが分かる。
図15(c)のリンク情報は、パケット解析装置2A〜2CがルータR3,R4間のリンク1、ルータR6,R7間のリンク2、およびルータR8,R9間のリンク3に配置されていることを示している。
図15(d)の品質状況には、チャンネル(S1,G1)とチャンネル(S2,G3)について、各リンク1〜3における品質が蓄積される。パケット解析装置2A〜2Cが定期的に送信する品質情報によってこの品質状況のデータが更新される。
<新たな経路の追加>
続いて、新たな経路が追加されたときの障害解析システムの動作について説明する。
図16は、図13の状態に加えて、新たにチャンネル(S1,G2)が宅内装置6Aに配信されたときの様子を示す図である。宅内装置6Aから映像配信サーバS1にチャンネル(S1,G2)の配信開始要求が送信され、新たなチャンネル(S1,G2)が宅内装置6Aに配信されると、新たなチャンネル(S1,G2)のパケットが映像配信サーバS1からルータR1,R2,R3,R4を順に経由して宅内装置6Aに転送される。以下、障害解析システムの動作について具体的に説明する。
パケット解析装置2Aが新たなチャンネル(S1,G2)のパケットを検出すると、チャンネル(S1,G2)を監視対象とするとともに、チャンネル(S1,G2)のパケットのTTLの値を格納する。チャンネル(S1,G2)のパケットは、映像配信サーバS1からTTLの値を100として送信されて、ルータR1,R2,R3を経由してリンク1上でキャプチャされるのでTTLの値は97となる。図17(a)に示すように、チャンネル(S1,G2)のパケットのTTLの値として97が保持される。
また、パケット解析装置2Aは、新たに検出したチャンネル(S1,G2)の識別子、最初に受信した新たなチャンネル(S1,G2)のパケットのタイムスタンプ、およびリンク1の識別子を含む経路変更通知を障害解析装置1へ送信する。ここではタイムスタンプは500であったとする。
障害解析装置1が経路変更通知を受信すると、映像配信サーバS1から送信されてリンク1を通過するパケットの経路情報[S1,R1,R2,R3,R4]を経路情報取得装置3から取得し、図18(a)に示すように、タイムスタンプを500として、チャンネル(S1,G2)の経路情報を現在経路に追加する。なお、チャンネル(S1,G2)は新たに配信されるチャンネルであるので、前世代経路に蓄積する経路情報は存在しない。
パケット解析装置2Aは、チャンネル(S1,G1)とチャンネル(S1,G2)を監視対象とするので、チャンネル(S1,G1)とチャンネル(S1,G2)のそれぞれについて品質情報を定期的に障害解析装置1へ送信する。
障害解析装置1は品質情報を受信すると、図18(d)に示すように、リンク1で新たに監視対象となったチャンネル(S1,G2)の品質情報を保持するレコードを追加する。
<新たな経路の追加2>
続いて、別の具体例を用いて新たな経路が追加されたときの障害解析システムの動作について説明する。
図19は、図16の状態に加えて、新たにチャンネル(S1,G2)が宅内装置6Bに配信されたときの様子を示す図である。宅内装置6Bから映像配信サーバS1にチャンネル(S1,G2)の配信開始要求が送信され、チャンネル(S1,G2)が宅内装置6Bに配信されると、チャンネル(S1,G2)のパケットが映像配信サーバS1からルータR1,R5,R6,R7を順に経由して宅内装置6Bに転送される。以下、障害解析システムの動作について具体的に説明する。
パケット解析装置2Bがチャンネル(S1,G2)のパケットを検出すると、チャンネル(S1,G2)を監視対象とするとともに、チャンネル(S1,G2)のパケットのTTLの値を格納する。図20(b)に示すように、チャンネル(S1,G2)のパケットのTTLの値として97が保持される。
また、パケット解析装置2Bは、新たに検出したチャンネル(S1,G2)の識別子、最初に受信した新たなチャンネル(S1,G2)のパケットのタイムスタンプ、およびリンク1の識別子を含む経路変更通知を障害解析装置1へ送信する。ここではタイムスタンプは550であったとする。
障害解析装置1が経路変更通知を受信すると、チャンネル(S1,G2)の現在経路のタイムスタンプは500で、受信した経路変更通知に記載されたタイムスタンプ(=550)よりも古いので、図21(b)に示すように、チャンネル(S1,G2)のタイムスタンプが500の現在経路を前世代経路に保存する。
そして、映像配信サーバS1から送信されてリンク2を通過するパケットの経路情報[S1,R1,R5,R6,R7]を経路情報取得装置3から取得し、図21(a)に示すように、チャンネル(S1,G2)の経路2に取得した経路情報を追加するとともに、タイムスタンプを550に更新する。
パケット解析装置2Bは、チャンネル(S1,G1)とチャンネル(S1,G2)を監視対象とするので、チャンネル(S1,G1)とチャンネル(S1,G2)のそれぞれについて品質情報を定期的に障害解析装置1へ送信する。
障害解析装置1は品質情報を受信すると、図21(d)に示すように、リンク2で新たに監視対象となったチャンネル(S1,G2)の品質情報を保持するレコードを追加する。
<経路の削除>
続いて、経路が削除されたときの障害解析システムの動作について説明する。
図22は、図19の状態において、宅内装置6Bがチャンネル(S1,G2)の配信停止要求を送信し、チャンネル(S1,G2)の宅内装置6Bへの配信が停止されたときの様子を示す図である。ユーザ操作によりチャンネル(S1,G2)の配信停止が指示されると、宅内装置6Bから映像配信サーバS1にチャンネル(S1,G2)の配信停止要求が送信される。以下、障害解析システムの動作について具体的に説明する。
パケット解析装置2Bが、宅内装置6Bから映像配信サーバS1へ送信されたチャンネル(S1,G2)の配信停止要求を検出すると、チャンネル(S1,G2)を監視対象から外す。図23(b)に示すように、保持していたチャンネル(S1,G2)のパケットのTTLの値を削除する。
また、パケット解析装置2Bは、チャンネル(S1,G2)の経路が削除される旨の経路変更通知を障害解析装置1へ送信する。この経路変更通知には、最後に受信したチャンネル(S1,G2)のパケットのタイムスタンプを記載する。ここではタイムスタンプは700であったとする。
障害解析装置1が経路変更通知を受信すると、チャンネル(S1,G2)の現在経路のタイムスタンプは550で、受信した経路変更通知に記載されたタイムスタンプ(=700)よりも古いので、図24(b)に示すように、チャンネル(S1,G2)のタイムスタンプが550の現在経路を前世代経路に保存する。
そして、現在経路からリンク2を含む経路2[S1,R1,R5,R6,R7]を削除するとともに、タイムスタンプを700に更新する。
また、図24(d)に示すように、品質状況からチャンネル(S1,G2)のリンク2の品質情報を保持するレコードを削除する。
パケット解析装置2Bは、チャンネル(S1,G1)のみを監視対象とするので、チャンネル(S1,G1)の品質情報を定期的に障害解析装置1へ送信する。
<経路の変更>
続いて、経路が変更されたときの障害解析システムの動作について説明する。
図25は、図22の状態において、ルータR1とルータR5の間でリンクダウンが発生し、チャンネル(S1,G1)の宅内装置6B,6Cへの配信経路がルータR2へ迂回する経路となったときの様子を示す図である。ルータR1とルータR5の間でリンクダウンが発生し、しばらくして経路が切り替わり、チャンネル(S1,G1)の宅内装置6B,6Cへの配信経路が変更されると、図26(b),(c)に示すように、リンク2,3におけるチャンネル(S1,G1)のパケットのTTLの値が97から96に変化する。以下、障害解析システムの動作について具体的に説明する。
パケット解析装置2B,2Cは、チャンネル(S1,G1)のパケットのTTLの値の変化を検出すると、チャンネル(S1,G1)の経路が変更された旨の経路変更通知を障害解析装置1へそれぞれ送信する。この経路変更通知には、TTLの値が変化したパケットのタイムスタンプを記載する。ここではタイムスタンプは900であったとする。なお、障害解析装置1がどちらの経路変更通知を先に受信するかはその時の状況によって変化するので、ここでは障害解析装置1がパケット解析装置2Bの送信した経路変更通知を先に受信した場合について説明する。
障害解析装置1がパケット解析装置2Bから経路変更通知を受信すると、チャンネル(S1,G1)の現在経路のタイムスタンプは100で、受信した経路変更通知に記載されたタイムスタンプ(=900)よりも古いので、図27(b)に示すように、チャンネル(S1,G1)のタイムスタンプが100の現在経路を前世代経路に保存する。
そして、映像配信サーバS1から送信されてリンク2を通過するパケットの新たな経路情報[S1,R1,R2,R5,R6,R7]を経路情報取得装置3から取得し、図27(a)に示すように、チャンネル(S1,G1)の経路2の経路情報を更新するとともに、タイムスタンプを900に更新する。
続いて、障害解析装置1がパケット解析装置2Cから経路変更通知を受信すると、チャンネル(S1,G1)の現在経路のタイムスタンプは900で、受信した経路変更通知に記載されたタイムスタンプ(=900)と同じであるので、前世代経路は更新しない。
そして、映像配信サーバS1から送信されてリンク3を通過するパケットの新たな経路情報[S1,R1,R2,R5,R8,R9]を経路情報取得装置3から取得し、図28(a)に示すように、チャンネル(S1,G1)の経路3の経路情報を更新する。図29に、経路が変更された後に障害解析装置1が保持するデータの例を示す。
パケット解析装置2B,2Cは、定期的に品質情報を送信するが、経路切替のタイミングでチャンネル(S1,G1)は一時的に中断していたため、品質不良と通知される。
パケット解析装置2Bは、チャンネル(S1,G1)の品質が不良であったこと、現在は品質が回復していること、および回復時のタイムスタンプを含む品質情報を障害解析装置1へ送信する。回復時のタイムスタンプは900となる。
障害解析装置1は、パケット解析装置2Bから品質情報を受信して品質状況に反映する。受信した品質情報が良好でないので、障害解析装置1は故障位置の推定処理を行うが、他のパケット解析装置2A,2Cからの品質情報の通知を待ってから処理を開始する。
パケット解析装置2Cも、チャンネル(S1,G1)の品質が不良であったこと、現在は品質が回復していること、および回復時のタイムスタンプを含む品質情報を障害解析装置1へ送信する。
障害解析装置1は、パケット解析装置2Cから品質情報を受信して品質状況に反映する。以上の処理により、図29(d)に示すように、品質状況が更新される。
<故障位置推定処理>
続いて、障害解析装置による故障位置の推定処理について説明する。障害解析装置1は、図29に示したデータを保持しているとする。
障害解析装置1は、品質が良好でないチャンネル(S1,G1)の品質は回復しているので、チャンネル(S1,G1)の前世代経路のなかから、回復時のタイムスタンプ(=900)よりも前で最新の経路情報を探す。図29(b)の例では、タイムスタンプが100の経路が該当する。
チャンネル(S1,G1)のリンク2,3を経由する経路で異常が検出されたので、上記で選択した前世代経路のうちリンク2,3を経路として含む経路2[S1,R1,R5,R6,R7]、経路3[S1,R1,R5,R8,R9]で共通する部分が故障被疑範囲となる。つまり、映像配信サーバS1−ルータR1−ルータR5が故障被疑範囲となる。
チャンネル(S1,G1)のリンク1を経由する経路では異常が発生していないので、上記で選択した前世代経路のうちリンク1を経路として含む経路1[S1,R1,R2,R3,R4]と共通する部分は故障被疑範囲から除外する。つまり、映像配信サーバS1−ルータR1を故障被疑範囲から除外する。
その結果、ルータR1−ルータR5が故障位置として推定される。
1…障害解析装置
11…受信部
12…経路情報更新部
13…品質判定部
14…障害位置推定部
15…蓄積部
2,2A〜2C…パケット解析装置
21…パケット取得部
22…経路変更判定部
23…品質通知部
24…蓄積部
3…経路情報取得装置
4,S1,S2…映像配信サーバ
5A〜5H,R1〜R9…ルータ
6A〜6C…宅内装置
100…監視対象ネットワーク

Claims (3)

  1. IPマルチキャストで送信されるコンテンツを運ぶパケットをキャプチャして品質を解析する複数のパケット解析装置から品質情報と前記パケットが転送される経路が変更されたことを示す経路変更通知を受信してネットワーク上の故障位置を推定する障害解析装置であって、
    ネットワーク上を流れる信号の経路を示す経路情報の履歴を前世代経路として蓄積する蓄積手段と、
    経路が変更されたことを示す経路変更通知を受信したときに、現在の経路情報を前世代経路として前記蓄積手段に保存し、現在の経路情報を更新する経路情報更新手段と、
    品質情報を受信し、当該品質情報が異常を示すものである場合は、異常が発生した時点の経路情報を前記蓄積手段に蓄積された前記前世代経路の中から検索し、検索した前記前世代経路を用いて前記異常の原因となった故障位置を推定する故障位置推定手段と、
    を有することを特徴とする障害解析装置。
  2. IPマルチキャストで送信されるコンテンツを運ぶパケットが転送されるネットワーク上の故障位置を推定する障害解析システムであって、
    前記ネットワークからパケットをキャプチャして解析する複数のパケット解析装置と前記パケット解析装置から品質情報と前記パケットが転送される経路が変更されたことを示す経路変更通知を受信してネットワーク上の故障位置を推定する障害解析装置を備え、
    前記パケット解析装置は、
    前記ネットワークからパケットを取得する取得手段と、
    前記取得手段が取得したパケットから品質を解析し、品質情報を前記障害解析装置へ送信する品質解析手段と、
    前記取得手段が取得したパケットから前記経路の変更を検出し、前記経路変更通知を前記障害解析装置へ送信する経路変更判定手段と、を有し、
    前記障害解析装置は、
    ネットワーク上を流れる信号の経路を示す経路情報の履歴を前世代経路として蓄積する蓄積手段と、
    前記経路変更通知を受信したときに、現在の経路情報を前世代経路として前記蓄積手段に保存し、現在の経路情報を更新する経路情報更新手段と、
    前記品質情報を受信し、当該品質情報が異常を示すものである場合は、異常が発生した時点の経路情報を前記蓄積手段に蓄積された前記前世代経路の中から検索し、検索した前記前世代経路を用いて前記異常の原因となった故障位置を推定する故障位置推定手段と、を有すること
    を特徴とする障害解析システム。
  3. 前記経路変更判定手段は、新たなコンテンツを運ぶパケットを検出したとき、コンテンツの配信を停止するパケットを検出したとき、パケットのTTLの値が変化したときのいずれかのときに、前記経路変更通知を送信することを特徴とする請求項2記載の障害解析システム。
JP2014022338A 2014-02-07 2014-02-07 障害解析装置及び障害解析システム Active JP6139428B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014022338A JP6139428B2 (ja) 2014-02-07 2014-02-07 障害解析装置及び障害解析システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014022338A JP6139428B2 (ja) 2014-02-07 2014-02-07 障害解析装置及び障害解析システム

Publications (2)

Publication Number Publication Date
JP2015149660A JP2015149660A (ja) 2015-08-20
JP6139428B2 true JP6139428B2 (ja) 2017-05-31

Family

ID=53892710

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014022338A Active JP6139428B2 (ja) 2014-02-07 2014-02-07 障害解析装置及び障害解析システム

Country Status (1)

Country Link
JP (1) JP6139428B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3087827B2 (ja) * 1996-07-31 2000-09-11 日本電気株式会社 ファブリック障害検出方法及び装置
JP2000209271A (ja) * 1999-01-18 2000-07-28 Nec Corp ル―タ装置
JP4912435B2 (ja) * 2009-07-07 2012-04-11 日本電信電話株式会社 Ipネットワークの故障箇所の可視化装置、ipネットワークの故障箇所の可視化方法、ipネットワークの故障箇所の可視化プログラム
JP2013058818A (ja) * 2011-09-06 2013-03-28 Fujitsu Ltd 監視補助装置、監視補助方法および監視補助プログラム

Also Published As

Publication number Publication date
JP2015149660A (ja) 2015-08-20

Similar Documents

Publication Publication Date Title
US8036121B2 (en) Method of estimating quality degradation on network in communication network system
US8274911B2 (en) Network monitoring system and path extracting method
EP2081321A2 (en) Sampling apparatus distinguishing a failure in a network even by using a single sampling and a method therefor
JP5530864B2 (ja) ネットワークシステム、管理サーバ、及び、管理方法
CN105049299A (zh) 时延状态信息的检测方法及装置、网络架构
CN112311580B (zh) 报文传输路径确定方法、装置及系统、计算机存储介质
JP5884892B2 (ja) ネットワークシステム、コントローラ、及び負荷分散方法
JPWO2013046496A1 (ja) 通信システム、送信装置、通信装置、障害通知方法、及びプログラム
KR20130135999A (ko) Iptv 고장 위치를 결정하는 방법, 장치, 및 시스템
JP2005285040A (ja) ネットワーク監視システム及びその方法、プログラム
JP4687590B2 (ja) 情報配信システム及び障害判定方法
JP4798495B2 (ja) 映像配信品質測定システム、装置および方法
WO2012070274A1 (ja) 通信システムおよびネットワーク障害検出方法
JP4169725B2 (ja) パケット廃棄箇所探索方法及び装置
JP6139428B2 (ja) 障害解析装置及び障害解析システム
US8948033B2 (en) Communication system, communication apparatus, and ring network monitoring method
JPWO2010106651A1 (ja) 経路解析装置
JP6378653B2 (ja) サービス影響原因推定装置、サービス影響原因推定プログラム、及びサービス影響原因推定方法
KR101831165B1 (ko) Ntp 서버와 ntp 클라이언트 간 시각 동기 상태의 실시간 모니터링 및 분석 장치
CN115550223A (zh) 业务流丢包定位系统、方法以及存储介质
JP5274494B2 (ja) 経路制御プロトコルに基づいて障害リンクを検出する方法、ノード装置及びプログラム
JP2008125035A (ja) ネットワーク品質試験システム
JP2016127391A (ja) ネットワーク監視システム及び方法
US20230246928A1 (en) Performance measurement in a packet switched communication network
JP4277067B2 (ja) ネットワーク計測情報収集方法、サーバ装置及びノード装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160229

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170306

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170425

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170427

R150 Certificate of patent or registration of utility model

Ref document number: 6139428

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250