JP2012080426A - 通信装置、通信システム、通信方法、および通信プログラム - Google Patents
通信装置、通信システム、通信方法、および通信プログラム Download PDFInfo
- Publication number
- JP2012080426A JP2012080426A JP2010225320A JP2010225320A JP2012080426A JP 2012080426 A JP2012080426 A JP 2012080426A JP 2010225320 A JP2010225320 A JP 2010225320A JP 2010225320 A JP2010225320 A JP 2010225320A JP 2012080426 A JP2012080426 A JP 2012080426A
- Authority
- JP
- Japan
- Prior art keywords
- monitoring
- response
- unit
- failure
- monitoring packet
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】
通信装置内のデバイスで起きている間欠的な障害(サイレント障害)を、同一装置内で検知する。
【解決手段】
本発明による通信装置は、制御部と、処理部とを備え、前記制御部は、前記処理部に対して監視パケットを送信する監視パケット送信部と、前記監視パケットに対する応答を受信する監視パケット応答受信部と、前記監視パケット応答受信部が前記監視パケットに対する応答エラーを検知し、前記監視周期内に検知した前記応答エラーの数が閾値以上である場合に、前記処理部で障害が発生していることを検知する障害検知部と、を備え、前記処理部は、前記監視パケットを受信した場合に、前記制御部に対して応答を返す監視パケット応答部を備えることを特徴とする。
【選択図】 図1
通信装置内のデバイスで起きている間欠的な障害(サイレント障害)を、同一装置内で検知する。
【解決手段】
本発明による通信装置は、制御部と、処理部とを備え、前記制御部は、前記処理部に対して監視パケットを送信する監視パケット送信部と、前記監視パケットに対する応答を受信する監視パケット応答受信部と、前記監視パケット応答受信部が前記監視パケットに対する応答エラーを検知し、前記監視周期内に検知した前記応答エラーの数が閾値以上である場合に、前記処理部で障害が発生していることを検知する障害検知部と、を備え、前記処理部は、前記監視パケットを受信した場合に、前記制御部に対して応答を返す監視パケット応答部を備えることを特徴とする。
【選択図】 図1
Description
本発明は、ヘルスチェック(死活監視)を行う通信装置、通信システム、通信方法、および通信プログラムに関する。
近年、ネットワークの普及と、それに伴うネットワークを介したサービスの増加により、通信装置や情報端末等のノードを常時稼動させることが多くなってきている。これに伴い、ネットワーク上のノードが正常に稼動しているかどうかを調べるための、ヘルスチェック(死活監視)が重要になっている。
ヘルスチェックに関連する技術の一例としては、例えば特許文献1に開示されている技術が挙げられる。より具体的には、MGC(Media Gateway Controller)がMG(Media Gateway)群に対して、ネットワークを介してヘルスチェック信号を送信するという技術が開示されている。
ここで、特許文献1のように、ネットワークを介して、ノードのヘルスチェックを行う場合には、ノード自体の障害検出ができなくとも、該当するノードに接続するリンクの状態が監視できれば良い。しかしながら、ルータやスイッチといった通信装置内に使用されているプロセッサ等のデバイスの稼動確認を通信装置内でヘルスチェックを行う場合には、リンクの監視を行うことはできないため、デバイス自体の障害を検出する必要が生じる。
一般的な単一の通信装置内のヘルスチェックの方法について、図9と図10を用いて説明する。図9は、通信装置1000の構成を示している。通信装置1000は、制御部(CPU:Central Processing Unit)1100、パケット転送処理部1200、暗号化/複合化処理部1300から構成される。
図10は、制御部1100から、ヘルスチェック信号をネットワークプロセッサ1201、セキュリティプロセッサ1301に送信する場合の動作例を示している。ヘルスチェック結果がエラー、未到達、またはタイムアウトのいずれかの状態(以降、エラーまたはNGと呼称する)である場合、制御部1100は、一定時間の間、あるいは一定回数に到達するまで、ヘルスチェック信号を送り続ける。図10の例では、ヘルスチェック信号を60回送り、結果がすべてNGであった場合に、ネットワークプロセッサ1201またはセキュリティプロセッサ1301に障害が発生しているものと判断する。その後、制御部1100は、障害を検知した場合、障害箇所のリセットを行う。
しかしながら、上述の技術では、図9のセキュリティプロセッサ1301のように、複数コア(マルチコア)を搭載しているデバイスの一部に間欠的な障害が発生した場合、その障害を検知することができない。このような障害は、一般的にサイレント障害と呼ばれている。
図9のセキュリティプロセッサ1301は、4つのコアを搭載し、これらをラウンドロビン方式で使用しているものとする。4つのコアのうちの1つでサイレント障害が発生した場合の動作例について、図11を参照して説明する。
上述の通り、制御部1100が障害を検知するためには、ヘルスチェックの結果が60回連続でNGとなる必要がある。しかしながら、セキュリティプロセッサ1301には間欠的に障害が発生しているために、図11の例では、ヘルスチェックの結果が2回以上連続してNGとなることがない。従って、上述の技術では、セキュリティプロセッサ1301でサイレント障害が発生していたとしても、検知することができなかった。
本発明の目的は、上述した課題を解決することが可能な、通信装置、通信システム、通信方法、および通信プログラムを提供することにある。
本発明による通信装置は、制御部と、処理部とを備え、前記制御部は、前記処理部に対して監視パケットを送信する監視パケット送信部と、前記監視パケットに対する応答を受信する監視パケット応答受信部と、前記監視パケット応答受信部が前記監視パケットに対する応答エラーを検知し、前記監視周期内に検知した前記応答エラーの数が閾値以上である場合に、前記処理部で障害が発生していることを検知する障害検知部と、を備え、前記処理部は、前記監視パケットを受信した場合に、前記制御部に対して応答を返す監視パケット応答部を備えることを特徴とする。
本発明による通信システムは、制御部と、処理部と、を備える通信装置と、前記通信装置の障害状況を監視する監視装置とを備え、前記制御部は、前記処理部に対して監視パケットを送信する監視パケット送信部と、前記監視パケットに対する応答を受信する監視パケット応答受信部と、前記監視パケット応答受信部が前記監視パケットに対する応答エラーを検知し、前記監視周期内に検知した前記応答エラーの数が閾値以上である場合に、前記処理部で障害が発生していることを検知する障害検知部と、前記障害検知部が、障害が発生していることを検知した場合に、前記処理部で障害が発生した旨を前記監視装置に対して通知する通知部と、を備え、前記処理部は、前記監視パケットを受信した場合に、前記制御部に対して応答を返す監視パケット応答部を備えることを特徴とする。
本発明による通信方法は、監視パケットを処理部に対して送信する監視パケット送信ステップと、前記監視パケットに対する応答を受信する監視パケット応答受信ステップと、前記監視パケットに対する応答エラーを検知し、前記監視周期内に検知した前記応答エラーの数が閾値以上である場合に、前記処理部で障害が発生していることを検知する障害検知ステップと、を含むことを特徴とする。
本発明による通信プログラムは、監視パケットを処理部に対して送信する監視パケット送信処理と、前記監視パケットに対する応答を受信する監視パケット応答受信処理と、前記監視パケットに対する応答エラーを検知し、前記監視周期内に検知した前記応答エラーの数が閾値以上である場合に、前記処理部で障害が発生していることを検知する障害検知処理と、をコンピュータに実行させることを特徴とする。
通信装置内のデバイスで起きている間欠的な障害(サイレント障害)を、同一装置内で検知することが可能となる。
以下、本発明の実施形態について、図面を参照しながら詳細に説明する。
<第1の実施形態>
まず、本発明の第1の実施形態について説明する。
まず、本発明の第1の実施形態について説明する。
(構成)
図1は、第1の実施形態による通信装置100の構成を示している。通信装置100は、制御部110、処理部120を備えている。制御部110は、監視パケット送信部111、監視パケット応答受信部112、障害検知部113を備えている。処理部120は、監視パケット応答部121を備えている。
図1は、第1の実施形態による通信装置100の構成を示している。通信装置100は、制御部110、処理部120を備えている。制御部110は、監視パケット送信部111、監視パケット応答受信部112、障害検知部113を備えている。処理部120は、監視パケット応答部121を備えている。
(動作)
第1の実施形態による動作について、図2を用いて説明する。まず、監視パケット送信部111は、処理部120に対して監視パケットを送信する(ステップS1)。
第1の実施形態による動作について、図2を用いて説明する。まず、監視パケット送信部111は、処理部120に対して監視パケットを送信する(ステップS1)。
続いて、処理部120が監視パケットを受信した場合には、監視パケット応答部121が応答を送信し、監視パケット応答受信部112が受信する(ステップS2)。もしくは、監視パケット応答受信部112は、応答エラーを検知する(ステップS2)。
以上のステップS1とステップS2の動作を、監視周期が経過するまで繰り返す(ステップS3)。
監視周期が経過した場合(ステップS3:YES)、障害検知部113は、監視周期内(ステップS1〜S3)に検知した応答エラー数と閾値とを比較する(ステップS4)。
応答エラー数が閾値未満である場合には、処理を終了する(ステップS4:NO)。
応答エラー数が閾値以上である場合には、障害検知部113は、処理部120に障害が発生していることを検知して、処理を終了する(ステップS5)。
(効果)
上記の通り、第1の実施形態によれば、障害検知部113が、監視周期内に検知した応答エラー数と閾値とを比較する。この動作により、通信装置100内の処理部120で間欠的な障害(サイレント障害)が起こっている場合であっても、通信装置100内に設けられた制御部110で検知することが可能となる。
上記の通り、第1の実施形態によれば、障害検知部113が、監視周期内に検知した応答エラー数と閾値とを比較する。この動作により、通信装置100内の処理部120で間欠的な障害(サイレント障害)が起こっている場合であっても、通信装置100内に設けられた制御部110で検知することが可能となる。
<第2の実施形態>
次に、本発明による第2の実施形態について説明する。
次に、本発明による第2の実施形態について説明する。
(概要)
まず、第2の実施形態の概要について、図3を用いて説明する。
まず、第2の実施形態の概要について、図3を用いて説明する。
本実施形態では、制御部と処理部との間でヘルスチェックを行う。このヘルスチェックは、監視周期を定めた上で行われる(1)。
制御部は、ヘルスチェックを行い、監視周期内に検知されたNG(応答エラー)数が指定回数(閾値)以上となる場合に、障害を検知する(2)。制御部は、障害を検出したあと、ネットワークを監視する機能(図では非表示)に、障害を検出した旨の通知を行っても良い。通知の例としては、例えば、装置のイベントログや、SNMP(Simple Network Management Protocol)におけるTRAP通知を用いることが挙げられる。
図3の例では、監視周期をヘルスチェック送信数4回と定めている。なお、監視周期はヘルスチェックの送信回数に限られるものではなく、一定時間(例えば60秒)を監視周期として設定しても良い。また、図3の例において、監視周期内に検知されたNG数の閾値として、2回が設定されている。さらに、NG数が閾値を上回った監視周期の数が3回を超えた場合、つまり障害が3回以上発生したと検知された場合には、処理部のリセットを行う。
いくつかの監視周期を例に挙げて、より具体的に説明する。まず、第1の監視周期においては、NG数は1回であり、閾値未満であるため、障害は検出されない。次に、第2の監視周期においては、NG数は3回であるため、障害が検出される。以降、この動作を繰り返し、第6の監視周期で障害が検出されると、障害検出回数が3回に到達する。従って、第6の監視周期の終了後、監視対象としていた処理部を復旧するためリセットする。
以上の動作により、制御部は、処理部で発生している間欠的なサイレント障害を検知することが可能となる。
以降、第2の実施形態について、より具体的に説明する。
(構成)
図4は、第2の実施形態による通信装置200の構成を示している。図4によれば、通信装置200は、制御部210と、処理部220を備えている。
図4は、第2の実施形態による通信装置200の構成を示している。図4によれば、通信装置200は、制御部210と、処理部220を備えている。
さらに、制御部210は、ヘルスチェックパケット送信部211、ヘルスチェック応答受信部212、障害検知部213、通知部214を備えている。
処理部220は、ヘルスチェックパケット受信部221、ヘルスチェック応答送信部222、プロセッサ223を備えている。
また、プロセッサ223は、コア223−1、コア223−2、コア223−3を搭載し、マルチコアプロセッサとして動作する。図4の例では、コア数が3個の場合を示しているが、3個未満でも、4個以上であっても同様に動作する。
(動作)
第2の実施形態の動作について、図5を用いて説明する。まず、ヘルスチェックパケット送信部211は、処理部220に対して、ヘルスチェックパケットを送信する(ステップS11)。このヘルスチェックパケットには、例えばping相当のUDP(User Datagram Protocol)パケットを用いることが考えられる。
第2の実施形態の動作について、図5を用いて説明する。まず、ヘルスチェックパケット送信部211は、処理部220に対して、ヘルスチェックパケットを送信する(ステップS11)。このヘルスチェックパケットには、例えばping相当のUDP(User Datagram Protocol)パケットを用いることが考えられる。
続いて、ヘルスチェックパケット受信部221がヘルスチェックパケットを受信した場合には、プロセッサ223に転送し、プロセッサ223は、ヘルスチェックパケットを受信する。プロセッサ223のコアのうち、ヘルスチェックパケット受信時に稼動しているコアが正常に稼動している場合には、応答をヘルスチェック応答送信部222に送信する。その後、ヘルスチェック応答送信部222は、応答を制御部210内のヘルスチェック応答受信部212に送信する。続いて、ヘルスチェック応答受信部212は、応答を受信する(ステップS12)。
もしくは、ヘルスチェック応答受信部212は、ヘルスチェックパケットの送信から一定時間内に応答を受信しない場合には、応答エラー(NG)を検知する(ステップS12)。
以上のステップS11とステップS12の動作を、監視周期が経過するまで繰り返す(ステップS13)。上述の通り、監視周期の例としては、例えば、ヘルスチェックパケットの送信回数や、一定時間を設定することが考えられる。
監視周期が経過した場合(ステップS13:YES)、障害検知部213は、監視周期内(ステップS11〜S13)に検知したNG数と閾値とを比較する(ステップS14)。
NG数が閾値未満である場合には、処理を終了する(ステップS14:NO)。
NG数が閾値以上である場合には、障害検知部213は、処理部220に障害が発生していることを検知して、処理を終了する(ステップS15)。
ステップS14で用いる閾値は、任意に定められる値である。任意の数値を用いることも可能であるが、監視周期をヘルスチェックパケットの送信回数に設定している場合には、監視周期の50%以上、というように割合を設定しても良い。
また、上述の通り、制御部210は、ステップS14で障害を検知した回数が閾値以上になった場合には、処理部220を復旧する構成をとることも可能である。
図6を用いて、より具体的に説明する。障害検知部213が障害を検出した回数が閾値以上となった場合、通知部214は、通信装置200を監視する機能(図には非表示)に、障害が検知された旨の通知を行う(ステップS16)。
ここで、通信装置200を監視する機能としては、例えば、図7に示すように、通信装置200の外部にある監視装置300に設けられることが考えられる。この場合、監視装置300は、通信装置200と同一のラック内に設けられていても良く、またネットワークを経由して通信装置200と接続する構成でも良い。また、図8に示すように、通信装置200の内部に、監視部230として設けられる構成も考えられる。
ステップS16の後、監視装置300または監視部230が障害箇所の復旧を行うかどうかの選択を行う(ステップS17)。復旧しない場合には、処理を終了する(ステップS17:NO)。復旧する場合(ステップS17:YES)には、復旧処理を行う(ステップS18)。
ステップS18の復旧処理としては、障害箇所のリセット(再起動)を行うことが考えられる。また、冗長性を持たせたシステム構成をとっている場合には、障害箇所の系切り替えを実施して、復旧を試みることもできる。
(効果)
上記の通り、第2の実施形態によれば、障害検知部213が、監視周期内に検知したNG(応答エラー)数と閾値とを比較する。この動作により、通信装置200内の処理部220で間欠的な障害(サイレント障害)が起こっている場合であっても、通信装置200内に設けられた制御部210で検知することが可能となる。
上記の通り、第2の実施形態によれば、障害検知部213が、監視周期内に検知したNG(応答エラー)数と閾値とを比較する。この動作により、通信装置200内の処理部220で間欠的な障害(サイレント障害)が起こっている場合であっても、通信装置200内に設けられた制御部210で検知することが可能となる。
また、検知した障害を監視側に通知することで、障害箇所の切り分けや、系の切り替えといった対策を行うことができる。これにより、通信装置の信頼性および保守性を向上することが可能である。
上記の実施形態の一部または全部は、以下の付記のようにも記載され得るが、以下には限られない。
(付記1)
制御部と、処理部とを備え、
前記制御部は、
前記処理部に対して監視パケットを送信する監視パケット送信部と、
前記監視パケットに対する応答を受信する監視パケット応答受信部と、
前記監視パケット応答受信部が前記監視パケットに対する応答エラーを検知し、前記監視周期内に検知した前記応答エラーの数が閾値以上である場合に、前記処理部で障害が発生していることを検知する障害検知部と、を備え、
前記処理部は、
前記監視パケットを受信した場合に、前記制御部に対して応答を返す監視パケット応答部
を備えることを特徴とする通信装置。
制御部と、処理部とを備え、
前記制御部は、
前記処理部に対して監視パケットを送信する監視パケット送信部と、
前記監視パケットに対する応答を受信する監視パケット応答受信部と、
前記監視パケット応答受信部が前記監視パケットに対する応答エラーを検知し、前記監視周期内に検知した前記応答エラーの数が閾値以上である場合に、前記処理部で障害が発生していることを検知する障害検知部と、を備え、
前記処理部は、
前記監視パケットを受信した場合に、前記制御部に対して応答を返す監視パケット応答部
を備えることを特徴とする通信装置。
(付記2)
前記通信装置は、さらに、
前記通信装置の障害状況を監視する監視部を備え、
前記制御部は、さらに、
前記障害検知部が、障害が発生していることを検知した場合に、前記処理部で障害が発生した旨を前記監視部に対して通知する通知部と、
を備えることを特徴とする付記1に記載の通信装置。
前記通信装置は、さらに、
前記通信装置の障害状況を監視する監視部を備え、
前記制御部は、さらに、
前記障害検知部が、障害が発生していることを検知した場合に、前記処理部で障害が発生した旨を前記監視部に対して通知する通知部と、
を備えることを特徴とする付記1に記載の通信装置。
(付記3)
前記通知部は、前記障害検知部が、障害が発生していることを検知した場合に、前記処理部の復旧を行うかどうかを前記監視部に対して問い合わせることを特徴とする付記1または2に記載の通信装置。
前記通知部は、前記障害検知部が、障害が発生していることを検知した場合に、前記処理部の復旧を行うかどうかを前記監視部に対して問い合わせることを特徴とする付記1または2に記載の通信装置。
(付記4)
前記制御部は、前記監視部から前記処理部の復旧要求を受けた場合に、前記処理部の復旧を行うことを特徴とする付記2または3に記載の通信装置。
前記制御部は、前記監視部から前記処理部の復旧要求を受けた場合に、前記処理部の復旧を行うことを特徴とする付記2または3に記載の通信装置。
(付記5)
前記監視パケット応答受信部は、前記監視パケットに対する応答を一定時間受信しない場合に前記応答エラーを検知することを特徴とする付記1から4のいずれか1つに記載の通信装置。
前記監視パケット応答受信部は、前記監視パケットに対する応答を一定時間受信しない場合に前記応答エラーを検知することを特徴とする付記1から4のいずれか1つに記載の通信装置。
(付記6)
制御部と、処理部とを備える通信装置と、
前記通信装置の障害状況を監視する監視装置と、を備え、
前記制御部は、
前記処理部に対して監視パケットを送信する監視パケット送信部と、
前記監視パケットに対する応答を受信する監視パケット応答受信部と、
前記監視パケット応答受信部が前記監視パケットに対する応答エラーを検知し、前記監視周期内に検知した前記応答エラーの数が閾値以上である場合に、前記処理部で障害が発生していることを検知する障害検知部と、
前記障害検知部が、障害が発生していることを検知した場合に、前記処理部で障害が発生した旨を前記監視装置に対して通知する通知部と、
を備え、
前記処理部は、
前記監視パケットを受信した場合に、前記制御部に対して応答を返す監視パケット応答部
を備えることを特徴とする通信システム。
制御部と、処理部とを備える通信装置と、
前記通信装置の障害状況を監視する監視装置と、を備え、
前記制御部は、
前記処理部に対して監視パケットを送信する監視パケット送信部と、
前記監視パケットに対する応答を受信する監視パケット応答受信部と、
前記監視パケット応答受信部が前記監視パケットに対する応答エラーを検知し、前記監視周期内に検知した前記応答エラーの数が閾値以上である場合に、前記処理部で障害が発生していることを検知する障害検知部と、
前記障害検知部が、障害が発生していることを検知した場合に、前記処理部で障害が発生した旨を前記監視装置に対して通知する通知部と、
を備え、
前記処理部は、
前記監視パケットを受信した場合に、前記制御部に対して応答を返す監視パケット応答部
を備えることを特徴とする通信システム。
(付記7)
前記通知部は、前記障害検知部が、障害が発生していることを検知した場合に、前記処理部の復旧を行うかどうかを前記監視装置に対して問い合わせることを特徴とする付記6に記載の通信システム。
前記通知部は、前記障害検知部が、障害が発生していることを検知した場合に、前記処理部の復旧を行うかどうかを前記監視装置に対して問い合わせることを特徴とする付記6に記載の通信システム。
(付記8)
前記制御部は、前記監視装置から前記処理部の復旧要求を受けた場合に、前記処理部の復旧を行うことを特徴とする付記6または7に記載の通信システム。
前記制御部は、前記監視装置から前記処理部の復旧要求を受けた場合に、前記処理部の復旧を行うことを特徴とする付記6または7に記載の通信システム。
(付記9)
前記監視パケット応答受信部は、前記監視パケットに対する応答を一定時間受信しない場合に前記応答エラーを検知することを特徴とする付記6から8のいずれか1つに記載の通信システム。
前記監視パケット応答受信部は、前記監視パケットに対する応答を一定時間受信しない場合に前記応答エラーを検知することを特徴とする付記6から8のいずれか1つに記載の通信システム。
(付記10)
監視パケットを処理部に対して送信する監視パケット送信ステップと、
前記監視パケットに対する応答を受信する監視パケット応答受信ステップと、
前記監視パケットに対する応答エラーを検知し、前記監視周期内に検知した前記応答エラーの数が閾値以上である場合に、前記処理部で障害が発生していることを検知する障害検知ステップと、
を含むことを特徴とする通信方法。
監視パケットを処理部に対して送信する監視パケット送信ステップと、
前記監視パケットに対する応答を受信する監視パケット応答受信ステップと、
前記監視パケットに対する応答エラーを検知し、前記監視周期内に検知した前記応答エラーの数が閾値以上である場合に、前記処理部で障害が発生していることを検知する障害検知ステップと、
を含むことを特徴とする通信方法。
(付記11)
前記通信方法は、さらに、
前記障害検知ステップで、障害が発生していることを検知した場合に、前記処理部で障害が発生した旨を前記通信装置の通信状況を監視する監視部に通知する通知ステップを含むことを特徴とする付記10に記載の通信方法。
前記通信方法は、さらに、
前記障害検知ステップで、障害が発生していることを検知した場合に、前記処理部で障害が発生した旨を前記通信装置の通信状況を監視する監視部に通知する通知ステップを含むことを特徴とする付記10に記載の通信方法。
(付記12)
前記通信方法は、さらに、
前記障害検知部で、障害が発生していることを検知した場合に、前記処理部の復旧を行うかどうかを前記監視部に対して問い合わせるステップを含むことを特徴とする付記10または11に記載の通信方法。
前記通信方法は、さらに、
前記障害検知部で、障害が発生していることを検知した場合に、前記処理部の復旧を行うかどうかを前記監視部に対して問い合わせるステップを含むことを特徴とする付記10または11に記載の通信方法。
(付記13)
前記通信方法は、さらに、
前記監視部から前記処理部の復旧要求を受けた場合に、前記処理部の復旧を行う復旧ステップを含むことを特徴とする付記11または12に記載の通信方法。
前記通信方法は、さらに、
前記監視部から前記処理部の復旧要求を受けた場合に、前記処理部の復旧を行う復旧ステップを含むことを特徴とする付記11または12に記載の通信方法。
(付記14)
前記通信方法は、さらに、
前記監視パケットに対する応答を一定時間受信しない場合に前記応答エラーを検知する応答エラー検知ステップを含むことを特徴とする付記10から13のいずれか1つに記載の通信方法。
前記通信方法は、さらに、
前記監視パケットに対する応答を一定時間受信しない場合に前記応答エラーを検知する応答エラー検知ステップを含むことを特徴とする付記10から13のいずれか1つに記載の通信方法。
(付記15)
監視パケットを処理部に対して送信する監視パケット送信処理と、
前記監視パケットに対する応答を受信する監視パケット応答受信処理と、
前記監視パケットに対する応答エラーを検知し、前記監視周期内に検知した前記応答エラーの数が閾値以上である場合に、前記処理部で障害が発生していることを検知する障害検知処理と、
を含むことを特徴とする通信プログラム。
監視パケットを処理部に対して送信する監視パケット送信処理と、
前記監視パケットに対する応答を受信する監視パケット応答受信処理と、
前記監視パケットに対する応答エラーを検知し、前記監視周期内に検知した前記応答エラーの数が閾値以上である場合に、前記処理部で障害が発生していることを検知する障害検知処理と、
を含むことを特徴とする通信プログラム。
(付記16)
前記通信プログラムは、さらに、
前記障害検知処理で、障害が発生していることを検知した場合に、前記処理部で障害が発生した旨を前記通信装置の通信状況を監視する監視部に通知する通知処理を含むことを特徴とする付記15に記載の通信プログラム。
前記通信プログラムは、さらに、
前記障害検知処理で、障害が発生していることを検知した場合に、前記処理部で障害が発生した旨を前記通信装置の通信状況を監視する監視部に通知する通知処理を含むことを特徴とする付記15に記載の通信プログラム。
(付記17)
前記通信プログラムは、さらに、
前記障害検知部で、障害が発生していることを検知した場合に、前記処理部の復旧を行うかどうかを前記監視部に対して問い合わせる処理を含むことを特徴とする付記15または16に記載の通信プログラム。
前記通信プログラムは、さらに、
前記障害検知部で、障害が発生していることを検知した場合に、前記処理部の復旧を行うかどうかを前記監視部に対して問い合わせる処理を含むことを特徴とする付記15または16に記載の通信プログラム。
(付記18)
前記通信プログラムは、さらに、
前記監視部から前記処理部の復旧要求を受けた場合に、前記処理部の復旧を行う復旧処理を含むことを特徴とする付記16または17に記載の通信プログラム。
前記通信プログラムは、さらに、
前記監視部から前記処理部の復旧要求を受けた場合に、前記処理部の復旧を行う復旧処理を含むことを特徴とする付記16または17に記載の通信プログラム。
(付記19)
前記通信プログラムは、さらに、
前記監視パケットに対する応答を一定時間受信しない場合に前記応答エラーを検知する応答エラー検知処理を含むことを特徴とする付記15から18のいずれか1つに記載の通信プログラム。
前記通信プログラムは、さらに、
前記監視パケットに対する応答を一定時間受信しない場合に前記応答エラーを検知する応答エラー検知処理を含むことを特徴とする付記15から18のいずれか1つに記載の通信プログラム。
100、200 通信装置
110、210 制御部
111 監視パケット送信部
112 監視パケット応答受信部
113、213 障害検知部
120、220 処理部
121 監視パケット応答部
211 ヘルスチェックパケット送信部
212 ヘルスチェック応答受信部
214 通知部
221 ヘルスチェックパケット受信部
222 ヘルスチェック応答送信部
223 プロセッサ
223−1、223−2、223−3 コア
230 監視部
300 監視装置
110、210 制御部
111 監視パケット送信部
112 監視パケット応答受信部
113、213 障害検知部
120、220 処理部
121 監視パケット応答部
211 ヘルスチェックパケット送信部
212 ヘルスチェック応答受信部
214 通知部
221 ヘルスチェックパケット受信部
222 ヘルスチェック応答送信部
223 プロセッサ
223−1、223−2、223−3 コア
230 監視部
300 監視装置
Claims (10)
- 制御部と、処理部とを備え、
前記制御部は、
前記処理部に対して監視パケットを送信する監視パケット送信部と、
前記監視パケットに対する応答を受信する監視パケット応答受信部と、
前記監視パケット応答受信部が前記監視パケットに対する応答エラーを検知し、前記監視周期内に検知した前記応答エラーの数が閾値以上である場合に、前記処理部で障害が発生していることを検知する障害検知部と、を備え、
前記処理部は、
前記監視パケットを受信した場合に、前記制御部に対して応答を返す監視パケット応答部
を備えることを特徴とする通信装置。 - 前記通信装置は、さらに、
前記通信装置の障害状況を監視する監視部を備え、
前記制御部は、さらに、
前記障害検知部が、障害が発生していることを検知した場合に、前記処理部で障害が発生した旨を前記監視部に対して通知する通知部と、
を備えることを特徴とする請求項1に記載の通信装置。 - 前記通知部は、前記障害検知部が、障害が発生していることを検知した場合に、前記処理部の復旧を行うかどうかを前記監視部に対して問い合わせることを特徴とする請求項1または2に記載の通信装置。
- 前記制御部は、前記監視部から前記処理部の復旧要求を受けた場合に、前記処理部の復旧を行うことを特徴とする請求項2または3に記載の通信装置。
- 前記監視パケット応答受信部は、前記監視パケットに対する応答を一定時間受信しない場合に前記応答エラーを検知することを特徴とする請求項1から4のいずれか1つに記載の通信装置。
- 制御部と、処理部とを備える通信装置と、
前記通信装置の障害状況を監視する監視装置と、を備え、
前記制御部は、
前記処理部に対して監視パケットを送信する監視パケット送信部と、
前記監視パケットに対する応答を受信する監視パケット応答受信部と、
前記監視パケット応答受信部が前記監視パケットに対する応答エラーを検知し、前記監視周期内に検知した前記応答エラーの数が閾値以上である場合に、前記処理部で障害が発生していることを検知する障害検知部と、
前記障害検知部が、障害が発生していることを検知した場合に、前記処理部で障害が発生した旨を前記監視装置に対して通知する通知部と、
を備え、
前記処理部は、
前記監視パケットを受信した場合に、前記制御部に対して応答を返す監視パケット応答部
を備えることを特徴とする通信システム。 - 前記通知部は、前記障害検知部が、障害が発生していることを検知した場合に、前記処理部の復旧を行うかどうかを前記監視装置に対して問い合わせることを特徴とする請求項6に記載の通信システム。
- 前記制御部は、前記監視装置から前記処理部の復旧要求を受けた場合に、前記処理部の復旧を行うことを特徴とする請求項6または7に記載の通信システム。
- 監視パケットを処理部に対して送信する監視パケット送信ステップと、
前記監視パケットに対する応答を受信する監視パケット応答受信ステップと、
前記監視パケットに対する応答エラーを検知し、前記監視周期内に検知した前記応答エラーの数が閾値以上である場合に、前記処理部で障害が発生していることを検知する障害検知ステップと、
を含むことを特徴とする通信方法。 - 監視パケットを処理部に対して送信する監視パケット送信処理と、
前記監視パケットに対する応答を受信する監視パケット応答受信処理と、
前記監視パケットに対する応答エラーを検知し、前記監視周期内に検知した前記応答エラーの数が閾値以上である場合に、前記処理部で障害が発生していることを検知する障害検知処理と、
をコンピュータに実行させることを特徴とする通信プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010225320A JP2012080426A (ja) | 2010-10-05 | 2010-10-05 | 通信装置、通信システム、通信方法、および通信プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010225320A JP2012080426A (ja) | 2010-10-05 | 2010-10-05 | 通信装置、通信システム、通信方法、および通信プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012080426A true JP2012080426A (ja) | 2012-04-19 |
Family
ID=46240129
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010225320A Pending JP2012080426A (ja) | 2010-10-05 | 2010-10-05 | 通信装置、通信システム、通信方法、および通信プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012080426A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015043479A (ja) * | 2013-08-26 | 2015-03-05 | アラクサラネットワークス株式会社 | ネットワーク装置及びプロセッサの監視方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09298556A (ja) * | 1996-05-08 | 1997-11-18 | Nec Corp | 音声蓄積再生サービス装置 |
JP2003186703A (ja) * | 2001-12-18 | 2003-07-04 | Nec Corp | ヘルスチエック方式 |
JP2008104108A (ja) * | 2006-10-20 | 2008-05-01 | Fujitsu Ltd | 中継装置および障害監視方法 |
JP2008172592A (ja) * | 2007-01-12 | 2008-07-24 | Hitachi Ltd | クラスタシステム、コンピュータおよびその異常検出方法 |
-
2010
- 2010-10-05 JP JP2010225320A patent/JP2012080426A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09298556A (ja) * | 1996-05-08 | 1997-11-18 | Nec Corp | 音声蓄積再生サービス装置 |
JP2003186703A (ja) * | 2001-12-18 | 2003-07-04 | Nec Corp | ヘルスチエック方式 |
JP2008104108A (ja) * | 2006-10-20 | 2008-05-01 | Fujitsu Ltd | 中継装置および障害監視方法 |
JP2008172592A (ja) * | 2007-01-12 | 2008-07-24 | Hitachi Ltd | クラスタシステム、コンピュータおよびその異常検出方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015043479A (ja) * | 2013-08-26 | 2015-03-05 | アラクサラネットワークス株式会社 | ネットワーク装置及びプロセッサの監視方法 |
US9323596B2 (en) | 2013-08-26 | 2016-04-26 | Alaxala Networks Corporation | Network apparatus and method of monitoring processor |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7234402B2 (ja) | 車両通信のためのセカンダリリンクモニタリング方法、車両通信端末、電子機器及びコンピュータプログラム | |
US20090310483A1 (en) | Network device and link switching method | |
CN111490903B (zh) | 一种网络数据采集处理方法和装置 | |
JP2008172592A (ja) | クラスタシステム、コンピュータおよびその異常検出方法 | |
JP2006229399A (ja) | 通信システム、中継ノード及びそれらに用いる通信方法並びにそのプログラム | |
US20230199534A1 (en) | Service producer health-check | |
JP2012080426A (ja) | 通信装置、通信システム、通信方法、および通信プログラム | |
WO2012070274A1 (ja) | 通信システムおよびネットワーク障害検出方法 | |
JP4102060B2 (ja) | データ受信装置 | |
JP5558436B2 (ja) | ネットワークシステムおよびネットワーク故障回避方法 | |
JP4692419B2 (ja) | ネットワーク装置及びそれに用いる冗長切替え方法並びにそのプログラム | |
JP2006325118A (ja) | 監視データ収集システム | |
JP4710719B2 (ja) | 通信異常時の再送装置 | |
JP2006319683A (ja) | ネットワークシステム監視方式およびネットワークシステム監視装置 | |
JP6403210B2 (ja) | 通信制御装置、通信制御プログラム及びpppセッションの復旧方法 | |
WO2014010021A1 (ja) | 情報処理装置、情報処理システム、情報処理装置制御方法及び情報処理装置制御プログラム | |
JP2013121095A (ja) | 通信装置 | |
JP2008219359A (ja) | ネットワーク監視システム | |
JP7120678B1 (ja) | 通信処理装置、通信処理システム、障害通知方法及び障害通知プログラム | |
JP5475706B2 (ja) | 監視装置、通信装置および網監視方法 | |
WO2023185214A1 (zh) | 网络切换方法、节点、电子设备和可读存储介质 | |
JP2012104869A (ja) | ネットワークシステム | |
KR20100080267A (ko) | 기지국, 기지국의 링크 장애 처리 장치 및 방법 | |
JP5459094B2 (ja) | リンクアグリゲーション通信装置 | |
JP2005109679A (ja) | パス故障検出方法および検出装置、ならびにそのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130919 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140404 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140415 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20141224 |