JP5042095B2 - 通信装置および障害監視方法 - Google Patents

通信装置および障害監視方法 Download PDF

Info

Publication number
JP5042095B2
JP5042095B2 JP2008076463A JP2008076463A JP5042095B2 JP 5042095 B2 JP5042095 B2 JP 5042095B2 JP 2008076463 A JP2008076463 A JP 2008076463A JP 2008076463 A JP2008076463 A JP 2008076463A JP 5042095 B2 JP5042095 B2 JP 5042095B2
Authority
JP
Japan
Prior art keywords
packet
monitoring
failure
monitoring target
transmission
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008076463A
Other languages
English (en)
Other versions
JP2009232263A (ja
Inventor
泰孝 斎藤
肇 平井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2008076463A priority Critical patent/JP5042095B2/ja
Publication of JP2009232263A publication Critical patent/JP2009232263A/ja
Application granted granted Critical
Publication of JP5042095B2 publication Critical patent/JP5042095B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、ネットワークの障害監視を行う通信装置、および障害監視方法に関する。
従来、パケット通信装置が通信相手装置との間で障害が発生していないかを監視および検出する方法として、通常の送受信で使用するユーザパケットとは別に、監視用パケットを使用して障害監視を行う方法がある。具体的には、監視を行う装置は、監視対象の通信相手装置に対して監視用パケットを送信し、そのパケットに対する応答が無い場合、通信相手装置との間で障害が発生していると判断する。障害監視用のパケットとしては、ICMP(Internet Control Message Protocol)のpingなどを使う方式が一般的である。上記に示すような障害監視方法が特許文献1および非特許文献1に開示されている。
特開平7−264233号公報 The Internet Society著 「RFC2328 (OSPF Version 2)」 1998年
しかしながら、上記従来技術では、発生から短時間で障害を検出しようとする場合、監視用パケットの送信間隔を短くする必要がある。この場合、監視用パケットの増加によって、ネットワーク内のトラヒック量も増加するため、ユーザパケットの通信に遅延などの不具合が生じる、という問題があった。
また、ネットワークが輻輳状態にあると、ユーザパケットと同様、監視用パケットが廃棄されてしまう場合がある。この場合、監視対象装置からの応答が無いため、障害が発生していると誤検出をする可能性がある、という問題があった。
本発明は、上記に鑑みてなされたものであって、ネットワークの障害監視を行う場合に、監視用パケットの使用を減らしつつ、ネットワークの障害を確実に検出可能な通信装置および障害監視方法を得ることを目的とする。
上述した課題を解決し、目的を達成するために、本発明にかかる通信装置は、ネットワークの障害を監視する通信装置であって、ユーザパケットの送受信を行うパケット処理手段と、監視対象装置からの監視用パケットを受信し、監視対象装置へのユーザパケットの送信間隔が規定値よりも長く送信回数が十分でないと判断した場合に監視用パケットを送信する監視用パケット送受信機能、および、監視対象装置との間のパケット送受信の頻度に基づいてネットワークの障害を検出する障害検出機能、を有する障害監視手段と、を備えることを特徴とする。
この発明によれば、監視用パケットの使用を減らしつつ、ネットワークの障害を確実に検出することができる、という効果を奏する。
以下に、本発明にかかる通信装置および障害監視方法の実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。
実施の形態1.
図1は、本発明にかかる通信装置(パケット通信装置)の構成例を示す図である。このパケット通信装置は、障害監視装置1を備え、ネットワークの障害監視を行う。また、この障害監視装置1は、下位レイヤ処理部2、パケット処理部3、上位レイヤ処理部4、障害監視用テーブル部5および障害監視部6を備えている。
下位レイヤ処理部2は、ネットワークとのインタフェースであり、受信パケットを識別して各部へ転送する。パケット処理部3は、ユーザパケットの処理(たとえば、IPヘッダの解析、付与等)を行う。上位レイヤ処理部4は、アプリケーションなどの上位機能に対しての処理を行う。障害監視用テーブル部5は、パケットの送受信時間等の障害検出に必要な情報を記録する。障害監視部6は、テーブル監視部7と監視用パケット処理部8を備え、障害監視に関する制御を行う。また、テーブル監視部7は、障害監視用テーブル部5を定期的に監視し、監視用パケットの生成を要求する。監視用パケット処理部8は、受信した監視用パケットの処理や、監視用パケットの生成および送信に関する処理を行う。
ここで、パケットを受信または送信した場合の動作について説明する。下位レイヤ処理部2は、ネットワークからパケットを受信すると、パケットの種類を判断し、ユーザパケットの場合はパケット処理部3に、監視用パケットの場合は障害監視部6に、それぞれ転送する。パケット処理部3および障害監視部6は、それぞれパケット処理を行い、障害監視用テーブル部5内における受信に関係する情報を更新する。
また、ユーザパケットを送信する場合、パケット処理部3は、障害監視用テーブル部5にアクセスし、受信フラグを有意にするかどうかを判断する。そして、パケット処理部3および下位レイヤ処理部2において所定の送信処理を行い、ネットワークに送信する。このとき、障害監視用テーブル部5内における送信に関係する情報を更新する。
また、障害監視部6は、上記のパケット送受信の処理と並行して障害監視用テーブル部5に定期的にアクセスし、記録されている情報から、監視用パケットを送信するか、障害が発生していないか、等の判断を行う。
図2は、障害監視用テーブル部5の構成例を示す図である。障害監視用テーブル部5に記録する情報は、通信の相手先である監視対象装置のアドレスと、自装置から監視対象装置へパケットを送信したときの最新の送信時刻と、自装置が監視対象装置からのパケットを受信したときの最新の受信時刻と、自装置から監視対象装置へ送信したパケットを監視対象装置が受信したことを示す受信フラグが有意なパケットを受信したときの最新の受信時刻、の項目である。パケット処理部3または障害監視部6は、障害監視用テーブル部5にアクセスして情報の更新や障害監視をする場合、監視対象装置のアドレスで必要な情報を検索する。なお、記録されるパケットの送信時刻や受信時刻は、ユーザパケットの送受信に限らず、監視用パケットの送受信も含むものである。
つづいて、本実施の形態の障害監視装置の動作を図面に基づいて説明する。最初に、ユーザパケットを送信する場合について説明する。図3は、ユーザパケット送信時の動作を示すフローチャートである。パケット処理部3は、送信するパケットのヘッダの受信フラグを決定するため、障害監視用テーブル部5にアクセスしてパケットを送信する監視対象装置の宛先アドレスで検索し、送信時刻と受信時刻を取得する(ステップS1)。つぎに、取得した送信時刻と受信時刻を比較する(ステップS2)。たとえば、受信時刻の方が現在時刻に近い場合は(ステップS2:Yes)、監視対象装置へ前回のパケットを送信してから現在までに、監視対象装置からパケットを受信したことを表しているため、送信するパケットのヘッダの受信フラグを「1」(有意)として送信する(ステップS3)。一方、送信時刻の方が現在時刻に近い場合は(ステップS2:No)、監視対象装置へ前回のパケットを送信してから現在までに、監視対象装置からパケットを受信していないことを表しているため、送信するパケットのヘッダの受信フラグを「0」(無為)として送信する(ステップS4)。このとき、いずれの場合においても、現在時刻をパケットの送信時刻として、障害監視用テーブル部5の情報を更新する(ステップS5)。
つぎに、ユーザパケットを受信した場合について説明する。図4は、ユーザパケット受信時の動作を示すフローチャートである。ユーザパケットを受信した場合、パケット処理部3は、障害監視用テーブル部5にアクセスしてパケット送信元の監視対象装置のアドレスで検索し(ステップS11)、受信時刻の情報を現在時刻で更新する(ステップS12)。そして、監視対象装置から受信したパケットの受信フラグが有意か否か判断する(ステップS13)。たとえば、受信フラグが「1」(有意)の場合は(ステップS13:Yes)、監視対象装置が、前回のパケット送信から今回のパケット送信までの間に、障害監視装置1からパケットを受信していることを表しているため、受信フラグON受信時刻も現在時刻で更新する(ステップS14)。一方、受信フラグが「0」(無為)の場合は(ステップS13:No)、監視対象装置が、前回のパケット送信から今回のパケット送信までの間に、障害監視装置1からパケットを受信していないことを表しているため、この場合は受信フラグON受信時刻を更新せずに処理を終了する。
なお、図3および図4の処理において、パケット処理部3が障害監視用テーブル部5にアクセスするのは、監視対象装置とのパケット送受信の場合のみである。監視対象外の装置とのパケット送受信では、障害監視用テーブル部5にアクセスしない。
つぎに、監視用パケットを送信する場合について説明する。図5は、監視用パケット送信時の動作を示すフローチャートである。障害監視部6は、上記のパケット送受信処理の間も並行して、障害監視用テーブル5を監視対象装置の宛先アドレスで定期的に検索し、記録されている情報を取得する(ステップS21)。そして、取得した監視対象装置の送信時刻と現在時刻の差分が、予め設定した送信間隔以上になっているかを判定する(ステップS22)。たとえば、設定した送信間隔未満の場合は(ステップS22:No)、パケットの送信が十分に(多く)行われていると判断して処理を終了する。一方、設定した送信間隔以上の場合は(ステップS22:Yes)、パケットの送信間隔が長い(送信が少ない)として監視用パケットを送信する(ステップS23〜S26)。上記監視用パケットの送信処理(ステップS23〜S26)は、障害監視部6による処理であること以外、図3のステップS2〜S5と同一である。
なお、予め設定する送信間隔については、小さく設定するほど、設定した送信間隔以上になる頻度が多くなる。その結果、監視用パケットを送信する頻度も多くなる。
つぎに、障害検出の処理について説明する。図6は、障害を検出する処理を示すフローチャートである。監視用パケット送信時の処理と同様、障害監視部6は、上記パケットの送受信の処理の間も並行して、障害監視用テーブル5を監視対象装置の宛先アドレスで定期的に検索し、記録されている情報を取得する(ステップS31)。また、取得した監視対象装置の受信時刻と現在時刻の差分が、予め設定した第一の障害検出保護時間以上になっているか判定する(ステップS32)。たとえば、第一の障害検出保護時間以上になっている場合は(ステップS32:Yes)、監視対象装置からのパケットの受信間隔が開いているので、少なくとも監視対象装置から自装置1への間で障害が発生していると判断する(ステップS35)。一方、第一の障害検出保護時間未満の場合は(ステップS32:No)、パケットの受信が十分に(多く)行われているので、さらに、受信フラグON受信時刻と現在時刻の差分が、予め設定した第二の障害検出保護時間(≧第一の障害検出保護時間)以上になっているか判定する(ステップS33)。たとえば、第二の障害検出保護時間未満の場合は(ステップS33:No)、監視対象装置も自装置1からのパケットを受信しており、障害は発生していないので、処理を終了する。また、第二の障害検出保護時間以上の場合は(ステップS33:Yes)、監視対象装置が前回送信から今回送信までの間に自装置1からのパケットを受信していないので、自装置1から監視対象装置への間で障害が発生していると判断する(ステップS34)。
なお、予め設定する保護時間については、小さく設定するほど、短い時間で保護時間以上になる。その結果、障害が発生していると判断する時間が短くなる。
以上説明したように、本実施の形態によれば、ユーザパケットの送受信の頻度に基づき、たとえば、送受信が十分に多く行われている場合は、監視用パケットを使用することなく、ユーザパケットの送受信によってネットワークの障害監視を行うこととした。これにより、ネットワーク内のトラヒック量を増加させることなくネットワークの障害を確実に検出することができる。
また、本実施の形態によれば、ユーザパケット送受信の頻度が少なくなり、パケットの送受信間隔が予め設定した値以上になった場合に、監視用パケットを送信することとした。これにより、監視用パケットの使用を減らすことができる。また、監視用パケットの使用を減らした場合であっても、ユーザパケットも監視のために利用するため、ネットワークの障害を短時間で検出することができる。
実施の形態2.
実施の形態1では、障害監視装置による障害監視方法について説明した。本実施の形態では、冗長構成のパスを持ったネットワークの障害監視について説明する。
図7は、冗長構成のパスを持ったネットワークの構成例を示す図である。詳細には、現用パスで障害が発生した場合に予備パスに切り替えることが可能な障害監視装置1aを備えたパケット通信装置100、を構成要素とするネットワークを示している。
図8は、実施の形態2の障害監視装置1aの構成例を示す図である。本実施の形態の障害監視装置1aは、実施の形態1の障害監視装置1の構成に加えて、パス管理部11をさらに備えている。パス管理部11は、現用パスおよび予備パスの管理を行い、障害が発生した場合に冗長切り替えを行う。なお、前述した実施の形態1と同様の構成については、同一の符号を付してその説明を省略する。
つづいて、本実施の形態の障害監視装置の動作について説明する。基本的な動作は実施の形態1と同様である。本実施の形態では、監視用パケットの送信間隔、障害検出保護時間について、現用パス用,予備パス用の2種類のパラメータ(送信間隔、障害検出保護時間)を使用する。また、パラメータは、現用パス用,予備パス用で異なる値に設定することができる。たとえば、予備パス用のパラメータを現用パス用よりも大きく設定した場合、予備パスでは監視用パケットの送信を少なくすることができ、また、障害発生と判断する機会を減らすことができる。このため、障害検出の判断をする場合、障害監視部6は、現用パス用または予備パス用のどちらのパラメータを使用するかについて、パス管理部11からの情報を用いて判断する。
以上説明したように、本実施の形態によれば、現用パス用,予備パス用で2種類のパラメータを使用し、たとえば、予備パス用のパラメータの設定値を大きく設定することで、予備パスに対して監視用パケットの送信を少なくし、また、障害発生と判断する機会を減らすこととした。これにより、ネットワーク内のトラヒック量を増加させることなく障害監視を行うことができる。
実施の形態3.
実施の形態1および2における障害監視方法では、全ての監視対象装置について、同じパラメータ(送信間隔、障害検出保護時間)で障害の検出をしていた。本実施の形態では、さらに、監視対象装置とのトラヒック量を障害の判断要素として追加して、監視対象装置によって異なるパラメータを使用する方法について説明する。ここでは、前述した実施の形態1および2と異なる処理について説明する。
図9は、実施の形態3の障害監視装置1bの構成例を示す図である。本実施の形態の障害監視装置1bは、実施の形態1の構成に加えて、トラヒック測定部21をさらに備えている。トラヒック測定部21は、ユーザパケットのトラヒック量を測定する。また、障害監視用テーブル部5を、障害監視用テーブル部5bに置き換えている。なお、前述した実施の形態1と同様の構成については、同一の符号を付してその説明を省略する。
図10は、障害監視用テーブル部5bの構成例を示す図である。本実施の形態では、実施の形態1の障害監視用テーブル部5(図2参照)に、ユーザパケット送信トラヒック量およびユーザパケット受信トラック量の項目を追加した。なお、前述した実施の形態1と同一の項目については、説明を省略する。
つづいて、本実施の形態の障害監視装置の動作について説明する。基本的な処理は実施の形態1の場合と同様である。本実施の形態では、トラヒック測定部21が、障害監視用テーブル部5bにアクセスし、測定したトラヒック量を、ユーザパケット送信トラヒック量およびユーザパケット受信トラヒック量の項目に記録し更新する。
ここで、ユーザパケット送受信のトラヒック量が少ない監視対象装置については、トラヒック量が多い監視対象装置と比較して、障害検出時間が長くなっても、障害発生による不具合の影響が少ないと考えられる。すなわち、ユーザパケットの送受信トラヒック量に応じて、障害検出のパラメータの設定値を変化させることで、障害監視部6は、トラヒック量の少ない監視対象装置に対する監視用パケットの送信を少なくすることができ、また、障害発生と判断する機会を減らすことができる。
パラメータの設定値の変化のさせ方としては、たとえば、トラヒック量にしきい値をいくつか設けて、その区間によって、基準となるパラメータの2倍,4倍…とするようなやり方が考えられる。
以上説明したように、本実施の形態によれば、ユーザパケットのトラヒック量に応じてパラメータの設定値を変化させ、たとえば、トラヒック量が少ない監視対象装置の送信間隔や障害検出保護時間等を大きく設定することで、監視用パケットの送信を少なくし、また、障害発生と判断する機会を減らすこととした。これにより、ネットワーク内のトラヒック量を増加させることなく障害監視を行うことができる。
なお、本実施の形態では、ユーザパケットのトラヒック量に応じてパラメータの設定を変化させたが、これに限らず、ある特定のトラヒック量の場合に、特定のパラメータに設定することも可能である。また、上記では、単純にユーザパケットのトラヒック量を元にパラメータを変えることとしたが、セッション数やフロー数等を元にパラメータを変化させることも可能である。
実施の形態4.
実施の形態2では、冗長構成を持ったネットワークの障害監視について説明した。本実施の形態では、経路が一部重複したネットワークの障害監視について説明する。ここでは、前述した実施の形態1〜3と異なる処理について説明する。
図11は、経路が一部重複したネットワークの構成例を示す図である。図11では、障害監視装置を備えたパケット通信装置4台(100a〜100d)からなり、パケット通信装置100aと他のパケット通信装置(100b,100c,100d)との間の経路が一部重複している。
図12は、実施の形態4の障害監視装置1cの構成例を示す図である。本実施の形態の障害監視装置1cは、実施の形態1の構成に加えて、パス管理部31およびパス管理テーブル部32をさらに備えている。パス管理部31は、監視対象装置までの経路を管理する。パス管理テーブル部32は、パスの情報を保持する。なお、前述した実施の形態1と同様の構成については、同一の符号を付してその説明を省略する。
つづいて、本実施の形態の障害監視装置の動作について説明する。各監視対象装置と自装置の間の経路は、図11に示すように一部重複している場合がある。このような場合、重複区間での障害発生は他の経路の障害監視で検出できるため、以下の方法によって監視用パケットのトラヒック量を削減する。
たとえば、パケット通信装置100aが他の装置の障害監視をする場合、パケット通信装置100aは、パケット通信装置100bに対する監視を、通常のパラメータ(送信間隔、障害検出保護時間)で行う。一方、パケット通信装置100c,100dに対する監視については、パス管理部31がパス管理テーブル部32の情報を確認することにより、パケット通信装置100bとの間の経路と重複する区間があることを認識することができるので、パケット通信装置100aは、パケット通信装置100bに対する障害監視よりも大きい値のパラメータを設定する。また、重複区間が多いほど、パラメータに設定する値を大きくする。本実施の形態では、パス管理部31の処理によって、パケット通信装置100cの方がパケット通信装置100dよりも重複区間が多いことが認識できるので、パケット通信装置100cを監視するためのパラメータの設定値をパケット通信装置100dよりも大きくする。
ここで、パケット通信装置100aとパケット通信装置100bとの間で障害が検出された場合は、パケット通信装置100c、またはパケット通信装置100cおよびパケット通信装置100d、との間でも同様に障害が検出される可能性がある。この場合、重複区間での障害か否かを切り分けるため、パケット通信装置100c,パケット通信装置100dでは、障害監視部6が、設定した送信間隔を待たずに監視用パケットを送信し、通信ができる状態かを確認する。なお、通信経路を求める方法は“Trace route”などの一般的な機能を使用することを想定している。
以上説明したように、本実施の形態によれば、経路の重複した監視対象装置を監視する場合、パラメータとして設定された送信間隔や障害検出保護時間を大きく設定することで、さらに、監視用パケットの送信を少なくし、また、障害発生と判断する機会を減らすこととした。これにより、ネットワーク内のトラヒック量を増加させることなく障害監視を行うことができる。
また、本実施の形態によれば、各監視対象装置との間の経路の重複を考慮することにより、各装置での障害検出の結果を複合的に利用することができ、特に、重複区間での障害かどうかを特定することにより、障害が発生した区間を絞り込むことができる。
実施の形態5.
実施の形態1〜4では、監視対象装置とパケットの送受信ができない場合を障害として検出していた。しかしながら、アプリケーションによっては、輻輳等でパケット送受信の遅延時間が大きくなると、通信として成立しないものもある。本実施の形態では、パケット送受信の遅延時間を考慮し、遅延時間が予め設定したしきい値以上の場合を障害として検出する。
図13は、実施の形態5の障害監視装置1dの構成例を示す図である。本実施の形態の障害監視装置1dは、実施の形態1の構成に加えて、時刻同期部41をさらに備えている。時刻同期部41は、基準となる時刻に装置内部の時刻を合わせる機能を有する。また、障害監視用テーブル部5を、障害監視用テーブル部5dに置き換えている。なお、前述した実施の形態1と同様の構成については、同一の符号を付してその説明を省略する。
図14は、障害管理用テーブル部5dの構成例を示す図である。ここでは、実施の形態1の障害監視用テーブル部5(図2参照)に、遅延状態の項目を追加した。なお、前述した実施の形態1と同一の項目についてはその説明を省略する。
つづいて、本実施の形態の障害監視装置の動作について説明する。図15は、遅延による障害を検出する動作を示すフローチャートである。なお、その他の動作は実施の形態1〜4と同じであるためその説明を省略する。
たとえば、障害監視装置1dがパケットを受信すると、パケット処理部3または障害監視部6は、パケットの遅延状態フラグの値をチェックする(ステップS41)。たとえば、遅延状態フラグが「1」(遅延大)の場合(ステップS41:No)、自装置から監視対象装置の間で障害が発生していると判断する(ステップS42)。一方、遅延状態フラグが「0」(遅延小)の場合(ステップS41:Yes)、またはステップS42の処理を実行後、さらに、パケット処理部3または障害監視部6は、現在時刻とパケットのヘッダにある送信時刻との差分から遅延時間を計算し(ステップS43)、予め設定したしきい値を超えているかどうかを判断する(ステップS44)。たとえば、予め設定したしきい値を超えている場合は(ステップS44:Yes)、障害監視用テーブル部5dの遅延状態に「1」(遅延大)を記録し(ステップS45)、また、監視対象装置から自装置の間で障害が発生していると判断する(ステップS47)。一方、設定したしきい値を超えていない場合は(ステップS44:No)、障害監視用テーブル部5dの遅延状態に「0」(遅延小)を記録する(ステップS46)。
なお、パケットを送信する場合、パケット処理部3または障害監視部6は、障害管理用テーブル部5dにアクセスして監視先アドレス(この場合、パケットの送信先のアドレス)で検索し、記録されている遅延状態を、遅延状態フラグとして送信するパケットのヘッダに書き込む。また、パケットの送信時刻として、現在時刻もあわせてヘッダに書き込む。パケットのヘッダに書き込む時刻は、時刻同期部41によって監視対象装置との間で時刻の整合が取れているため、監視対象装置がパケットを受信したとき、現在時刻との差分を正確に計算することができる。
以上説明したように、本実施の形態によれば、監視対象装置と自装置間のパケット送受信において、予め設定したしきい値以上の遅延が生じた場合、障害として検出できるようにした。これにより、パケット送受信の遅延時間に基づく、ユーザパケットによる障害監視が可能となる。
また、本実施の形態によれば、遅延を障害として検出できるようにしたので、遅延時間が増大すると通信が成立しないアプリケーションであっても、ユーザパケットによる障害監視を行うことができる。
実施の形態6.
実施の形態1〜4では、パケット通信の有無で障害発生の判断をしていたため、障害監視装置(自装置)と監視対象装置との間で判断の違いが生じることはなかった。しかしながら、実施の形態5では、パケットを受信した障害監視装置が、遅延時間を計算し、その計算結果と予め設定したしきい値とを比較することにより障害の発生を判断している。本実施の形態では、パケットを送信した障害監視装置が、送信したパケットの遅延時間が障害にあたるかどうかを判断する方法について説明する。
図16は、障害監視用テーブル部の構成例を示す図である。実施の形態5では遅延状態の項目を追加していたが、これを削除して、本実施の形態では、代わりに遅延に関する統計情報の項目を追加した。なお、前述した実施の形態1と同一の項目についてはその説明を省略する。
つづいて、本実施の形態の障害監視装置の動作について説明する。本実施の形態では、障害監視装置(パケット送信元)からパケットを受信した監視対象装置が、遅延時間を計算する(計算方法は実施の形態5と同じ)が、遅延時間を計算した監視対象装置において遅延時間としきい値との比較は行わない(障害の発生を判断しない)。その後、監視対象装置は、遅延時間の平均値,ばらつき,最大値,最小値のうちの少なくともいずれか一つの統計情報、および自装置にて計算した遅延時間をヘッダに書き込んだパケットを、障害監視装置に対して送信(返信)する。そして、パケット送信元の障害監視装置では、ヘッダに書き込まれた統計情報および遅延時間に基づき、この遅延が障害のレベルか否か判断する。判断の方法としては、たとえば、統計情報の最大値または平均値に所定の係数を乗じた値を、遅延時間と比較するためのしきい値とするような方法が考えられる。たとえば、障害監視装置において監視対象装置で計算した遅延時間を障害ではないと判断した場合には、障害監視装置は、障害に対応した処理を行う必要がなく、また、監視用パケットを使用する機会が減ることになる。
以上説明したように、本実施の形態によれば、障害監視装置から監視対象装置へのパケット送信で遅延が生じた場合に、障害監視装置で障害発生を判断できるようにした。これにより、パケット送受信の遅延時間に基づく、ユーザパケットによる障害監視が可能となる。また、本実施の形態によれば、遅延を障害として検出できるようにしたので、遅延時間が増大すると通信が成立しないアプリケーションであっても、ユーザパケットによる障害監視を行うことができる。
以上のように、本発明にかかる通信装置は、ネットワークの障害監視を行う場合に有用であり、特に、ネットワーク内のトラヒックを増加させることなく障害監視を行う通信装置に適している。
本発明にかかる通信装置の構成例を示す図である。 障害監視用テーブル部の構成例を示す図である。 ユーザパケット送信時の動作を示すフローチャートである。 ユーザパケット受信時の動作を示すフローチャートである。 監視用パケット送信時の動作を示すフローチャートである。 障害を検出する処理を示すフローチャートである。 冗長構成のパスを持ったネットワークの構成例を示す図である。 実施の形態2の障害監視装置の構成例を示す図である。 実施の形態3の障害監視装置の構成例を示す図である。 障害監視用テーブル部の構成例を示す図である。 経路が一部重複したネットワークの構成例を示す図である。 実施の形態4の障害監視装置の構成例を示す図である。 実施の形態5の障害監視装置の構成例を示す図である。 障害管理用テーブル部の構成例を示す図である。 遅延による障害を検出する動作を示すフローチャートである。 障害監視用テーブル部の構成例を示す図である。
符号の説明
1,1a,1b,1c,1d 障害監視装置
2 下位レイヤ処理部
3 パケット処理部
4 上位レイヤ手段部
5,5b,5d 障害監視用テーブル部
6 障害監視部
7 テーブル監視
8 監視用パケット処理部
11 パス管理部
21 トラヒック測定部
31 パス管理部
32 パス管理テーブル部
41 時刻同期部
100,100a,100b,100c,100d パケット通信装置

Claims (6)

  1. ネットワークの障害を監視する通信装置であって、
    ユーザパケットの送受信を行うパケット処理手段と、
    監視対象装置からの監視用パケットを受信し、監視対象装置へのユーザパケットの送信間隔が規定値よりも長く送信回数が十分でないと判断した場合に監視用パケットを送信する監視用パケット送受信機能、および、監視対象装置との間のパケット送受信の頻度に基づいてネットワークの障害を検出する障害検出機能、を有し、前記監視対象装置との間のパケット送受信の頻度を示すパラメータを、パケットの受信間隔とし、当該受信間隔が特定の保護時間よりも長い場合にネットワークに障害が発生していると判断する障害監視手段と、
    監視対象装置との間の現用通信経路および予備通信経路の管理を行い、障害が発生した場合に通信経路の切り替えを行うパス管理手段と、
    を備え
    前記パス管理手段は、現用通信経路および予備通信経路の障害検出用に個別の前記送信間隔の規定値および前記特定の保護時間を用いることとし、予備通信経路障害検出用の送信間隔の規定値および特定の保護時間の値を、現用パス障害検出用の値よりも大きく設定する、
    ことを特徴とする通信装置。
  2. ユーザパケットのトラヒック量を測定するトラヒック測定手段、
    をさらに備え、
    前記トラヒック測定手段は、トラヒック量が少ないほど、送信間隔の規定値および特定の保護時間の値をより大きく設定することを特徴とする請求項に記載の通信装置。
  3. 複数の監視対象装置との間の通信経路が一部で重複する場合、前記障害監視手段は、前記複数の監視対象装置のうちの特定の監視対象装置については現状の送信間隔の規定値および特定の保護時間の値に基づく処理を行い、残りの監視対象装置については送信間隔の規定値および特定の保護時間の値をより大きく設定して処理を行うことを特徴とする請求項またはに記載の通信装置。
  4. 前記障害監視手段は、さらに、監視対象装置との間のパケットの送受信にかかる遅延時間を求め、当該遅延時間がしきい値を超える場合に、当該監視対象装置と自装置との間の通信経路で障害が発生していると判断することを特徴とする請求項1、2または3に記載の通信装置。
  5. 前記障害監視手段は、さらに、監視対象装置が計算したパケットの送受信にかかる遅延時間、および当該遅延時間の統計に基づく遅延時間の平均値、ばらつき、最大値、最小値の少なくともいずれか一つの統計情報、が含まれたパケットを、当該監視対象装置から受信し、受信パケットに含まれた遅延時間および統計情報に基づき、当該監視対象装置と自装置との間の通信経路の障害発生を判断することを特徴とする請求項のいずれか一つに記載の通信装置。
  6. ユーザパケットの送受信を行うパケット送受信ステップと、
    監視対象装置からの監視用パケットを受信する処理、および監視対象装置へのユーザパケットの送信間隔が規定値よりも長く送信回数が十分でないと判断した場合に監視用パケットを送信する処理、を行う監視用パケット送受信ステップと、
    監視対象装置との間のパケット送受信の頻度に基づいてネットワークの障害を検出する障害検出ステップと、
    監視対象装置との間の現用通信経路および予備通信経路の管理を行い、障害が発生した場合に通信経路の切り替えを行うパス管理ステップと、
    を含み、
    前記障害検出ステップでは、監視対象装置との間のパケット送受信の頻度を示すパラメータを、パケットの受信間隔とし、当該受信間隔が特定の保護時間よりも長い場合にネットワークに障害が発生していると判断し、
    前記パス管理ステップでは、現用通信経路および予備通信経路の障害検出用に個別の前記送信間隔の規定値および前記特定の保護時間を用いることとし、予備通信経路障害検出用の送信間隔の規定値および特定の保護時間の値を、現用パス障害検出用の値よりも大きく設定する、
    ことを特徴とする障害監視方法。
JP2008076463A 2008-03-24 2008-03-24 通信装置および障害監視方法 Active JP5042095B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008076463A JP5042095B2 (ja) 2008-03-24 2008-03-24 通信装置および障害監視方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008076463A JP5042095B2 (ja) 2008-03-24 2008-03-24 通信装置および障害監視方法

Publications (2)

Publication Number Publication Date
JP2009232263A JP2009232263A (ja) 2009-10-08
JP5042095B2 true JP5042095B2 (ja) 2012-10-03

Family

ID=41247134

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008076463A Active JP5042095B2 (ja) 2008-03-24 2008-03-24 通信装置および障害監視方法

Country Status (1)

Country Link
JP (1) JP5042095B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5585437B2 (ja) * 2010-12-27 2014-09-10 三菱電機株式会社 ネットワーク管理装置、ネットワーク管理システム、および、ネットワーク管理方法
JP5696029B2 (ja) * 2011-12-09 2015-04-08 株式会社日立製作所 通信システム及び通信システムでの統計情報管理方法
JP2014147066A (ja) * 2013-01-25 2014-08-14 Alexeo Corp データネットワーク通信において冗長性を提供する方法およびシステム
CN105703967B (zh) * 2014-11-27 2020-02-14 中兴通讯股份有限公司 一种检测标签交换路径连通性的方法及装置
CN114422379B (zh) * 2022-01-20 2023-02-28 昕锐至成(江苏)光电科技有限公司 一种多平台设备无线组网的分析方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2933020B2 (ja) * 1996-08-20 1999-08-09 日本電気株式会社 コンティニュイティチェックセル監視回路
JP2000078159A (ja) * 1998-09-02 2000-03-14 Nec Corp Vp切替装置及びそれに用いるコネクション監視方法並びにその制御プログラムを記録した記録媒体

Also Published As

Publication number Publication date
JP2009232263A (ja) 2009-10-08

Similar Documents

Publication Publication Date Title
US11575559B1 (en) Monitoring and detecting causes of failures of network paths
JP4639207B2 (ja) ネットワークシステム、ノード装置及び管理サーバ
US10349297B2 (en) Quality of user experience analysis
US8661295B1 (en) Monitoring and detecting causes of failures of network paths
EP2222027B1 (en) A method for transmitting bfd message, a method and device for detecting link failure
US10952091B2 (en) Quality of user experience analysis
JP5042095B2 (ja) 通信装置および障害監視方法
CN106603261B (zh) 热备份方法、第一主用设备、备用设备和通信系统
CN111295865B (zh) 获得局域网诊断测试结果
JP2007180891A (ja) 通信装置及びそれに用いるパケット送信制御方法並びにそのプログラム
WO2017036165A1 (zh) 链路故障检测方法及装置
US11652682B2 (en) Operations management apparatus, operations management system, and operations management method
JP2014033242A (ja) 通信システムおよびネットワーク障害検出方法
JP2006013809A (ja) パケット廃棄箇所探索方法及び装置
EP3158685B1 (en) Identification of candidate problem network entities
JP2005130121A (ja) ネットワーク管理装置、ネットワーク管理方法、ネットワーク管理プログラム
JP5677524B2 (ja) 通信制御装置、通信制御システム及び通信制御方法
JP5953101B2 (ja) 通信システム、ルータ、通信方法および制御プログラム
CN106789639B (zh) 一种报文处理方法和装置
US7898949B2 (en) Brownout detection
JP7280998B2 (ja) 通信経路制御システム
US8873376B2 (en) Method of obtaining information representative of an availability, a device for obtaining information, and a corresponding computer program
WO2021234900A1 (ja) 測定装置、測定システム、測定方法、および、測定プログラム
JP5537692B1 (ja) 品質劣化原因推定装置、品質劣化原因推定方法、品質劣化原因推定プログラム
JP5201021B2 (ja) ネットワーク輻輳監視システム及びネットワーク輻輳監視方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101216

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120410

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120528

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120612

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120710

R150 Certificate of patent or registration of utility model

Ref document number: 5042095

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150720

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250