JP2009205364A - 死活監視方法、被監視装置、監視装置、死活監視プログラム - Google Patents

死活監視方法、被監視装置、監視装置、死活監視プログラム Download PDF

Info

Publication number
JP2009205364A
JP2009205364A JP2008046096A JP2008046096A JP2009205364A JP 2009205364 A JP2009205364 A JP 2009205364A JP 2008046096 A JP2008046096 A JP 2008046096A JP 2008046096 A JP2008046096 A JP 2008046096A JP 2009205364 A JP2009205364 A JP 2009205364A
Authority
JP
Japan
Prior art keywords
monitored device
monitored
monitoring
transmission interval
confirmation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008046096A
Other languages
English (en)
Inventor
Hiroshi Son
弘 孫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2008046096A priority Critical patent/JP2009205364A/ja
Publication of JP2009205364A publication Critical patent/JP2009205364A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】パケット流量を抑えながら、監視対象装置の死活状態の精度の高い判断を可能にする。
【解決手段】監視対象サーバ10は、その状態を示す状態通知パケットを定期的に監視装置20に送信する。管理サーバ10は、状態通知パケットがこなくなったことを検出すると、状態通知パケットがこなくなった監視対象サーバ以外の他監視対象サーバからの状態通知パケットが受信できていれば、監視対象サーバ10のネットワーク構成情報から、管理サーバ20から、状態通知パケットがこなくなった監視対象サーバ10までの複数の通信ルートを抽出し、該複数の通信ルートを利用して状態通知パケットがこなくなった監視対象サーバ10の死活状態を確認する。
【選択図】図1

Description

本発明は、複数の被監視装置と、少なくとも1つ監視装置がネットワークに接続された監視システムに関し、特に被監視装置の死活監視方法に関する。
システムの高可用性(HA)を求めるために、システムにあるサーバの稼動状態を監視し、サーバダウンを発生した時すばやくその状態を検出する手段は欠かせない。また、ポリシーベースのシステム自律運用では、サーバダウンの検出をトリガーとし、復旧アクションや、業務移行などのアクションを自動的に実行される場合も少なくない。サーバ死活監視でサーバ状態を誤判断した時、システムの誤動作誘発する恐れもあるので、サーバ死活監視の精度も求められている。
現在使われているサーバ死活監視方式では、精度の低いプロトコルが多く採用されている。このため、通信パケットのロストによるサーバ死活状態を誤判断する場合がある。
特許文献1に記載の発明では、予め設定された順序で被監視端末の間で監視パケットを巡回させ、各被監視端末の状態を収集する。収集してきた情報から、障害が発生していると判断した場合、監視パケットを逆順序で巡回させ、再度各被監視端末の状態を収集する。正方向/逆方向で収集してきた情報を比較することで、通信ネットワーク上の障害箇所を高精度に特定することができ、また、被監視端末の障害であるか、または通信回線上の障害であるかの特定を高精度に行うことができる技術を提供されている。しかし、この技術は端末状態を確実に確認するために、監視パケットを正方向/逆方向で通信ネットワーク上の各被監視端末の間で巡回させる必要があるので、被監視端末の台数が多い場合、被監視端末の状態を判断するための情報収集は長時間がかかる可能性がある。また、一つの被監視端末の状態を確認するために、通信ネットワークに接続されている全ての端末に処理してもらい、全ての端末に負荷をかけるというデメリットもあると思われる。
特開2006-332787号公報
本発明の目的は、パケット流量を抑えながら、監視対象装置の死活状態の精度の高い判断が可能な死活監視方法、被監視装置、監視装置、死活監視プログラムを提供することにある。
被監視装置は、その状態を示す状態通知パケットを定期的に監視装置に送信する。監視装置は、状態通知パケットがこなくなったことを検出すると、状態通知パケットがこなくなった被監視装置以外の他被監視装置からの状態通知パケットが受信できていれば、被監視装置のネットワーク構成情報から、監視装置から、状態通知パケットがこなくなった被監視装置までの複数の通信ルートを抽出し、該複数の通信ルートを利用して状態通知パケットがこなくなった被監視装置の死活状態を確認する。
被監視装置から監視装置へ状態通知パケット送信することにより、監視装置から被監視装置に確認パケットを送信し、被監視装置からの応答パケットを確認する死活状態監視方式よりも通信パケット流量が少なくなる。また、監視対象サーバから状態通知パケットが来なくなった場合、複数の通信ルートを経由して監視対象サーバの死活状態を確認することで、精度の高い死活監視が可能となる。
次に、本発明の実施の形態について図面を参照して詳細に説明する。
図1は本発明の一実施形態の死活監視方法が適用された監視システムの構成を示す図である。
図1に示すように、本実施形態の監視システムは、被監視装置である複数の監視対象サーバ10−1、10−2、・・・、10−n(以下、まとめて「監視対象サーバ10」と称す)と、監視装置である管理サーバ20を有し、これらはネットワーク30に接続している。
管理サーバ20は通信部21と状態通知受信部22と送信間隔設定・状態確認部23とルート抽出部24と監視対象情報記憶部25と制御・判定部26を有している。通信部21は監視対象サーバ10と通信を行う。状態通知受信部22は監視対象サーバ10からの定期的な状態通知パケットを受信する状態通知パケットの送信間隔の設定と、監視対象サーバ10の死活状態の判定を行う。ルート抽出部24は、監視対象サーバ10の死活状態を確認するために、必要な通信ルート情報を抽出する。監視対象情報記憶部25は、監視対象サーバ10のネットワーク構成情報、死活監視状態等の監視対象情報を保存する。制御・判定部26は、監視対象サーバ10から状態通知パケットがこなくなった時、送信間隔設定・状態確認部23に監視対象サーバ状態確認要求を発行し、送信間隔設定・状態確認部23から返してきた結果より監視対象サーバの死活状態を判定する。
監視対象サーバ10は監視対象サーバ情報記憶部11と定期通知部12と要求処理部13と代理確認部14と通信部15を有している。監視対象サーバ情報記憶部11は状態通知パケットの送信間隔等の情報を保存する。定期通知部12は、管理サーバ20へ自ネットワーク情報と死活状態を定期的に通知する。要求処理部13は、管理サーバ20からの送信間隔設定要求と、自サーバまたは他サーバの死活状態確認要求を処理する。代理確認部14は要求処理部13から指示を受け、他サーバの死活状態を確認する。通信部15は管理サーバ20との通信を行う。なお、監視対象サーバ10の本来の機能は本発明とは無関係のため、図示されていない。
図2に示すように、監視対象情報記憶部25に記憶される監視対象情報は、監視対象サーバ番号と、監視対象サーバIPと、状態通知パケットの送信間隔と、監視対象サーバの状態(ステータス)(稼働中、ダウン)と、NIC(Network Interface Card)数と、NICテーブルを含む。NICテーブルはNIC番号とIPとSubnetマスクからなる。
図3に示すように、監視対象サーバ情報記憶部11に記憶される監視対象サーバ情報は状態通知パケットの送信間隔と、監視対象サーバIPと、NIC数と、NICテーブルを含む。NICテーブルはNIC番号とIPとSubnetマスクからなる。
次に、本実施形態の監視システムの動作を説明する。
管理サーバ20が監視対象サーバ10の死活状態を監視する前に、監視対象サーバ10に監視対象サーバ情報の登録がまず必要になる。監視対象サーバ10が必要な最小限の登録情報として、監視対象サーバ10の、管理サーバ20と通信可能、管理サーバ20使用IPアドレスが必要になる。監視対象サーバ情報の登録方法として、手動で監視対象サーバを登録する方法、監視対象サーバ10から確認パケットをブロードキャストでネットワーク30に送信し、監視対象サーバ10からの応答パケットを確認することで監視対象サーバを登録する方法、SLP(Service Location Protocol)プロトコルを利用して監視対象サーバを登録する方法など、いくつかの方法があるが、ここではどの方法を使用するかは問わないものとする。監視対象サーバ10が登録され、管理サーバ20使用のIPアドレスを監視対象サーバIP情報として管理対象情報記憶部25に登録する。
次に、監視対象サーバ10の動作について説明する。まず、定期通知部12について説明する。定期通知部12は監視対象サーバ情報記憶部11に保存されている送信間隔を使用して、監視対象サーバ10に、状態通知パケットを定期的に送信する。通信パケット流量を抑えるため、状態通知パケットの定期的な送信はUDP(User Datagram Protocol)などの信頼性の低いプロトコルを使用する。監視対象サーバ情報記憶部11の送信間隔には、最初はデフォールトの送信間隔情報が設定されている。管理サーバ20の送信間隔設定・状態確認部23から送信間隔設定要求があると、監視対象サーバ10の要求処理部13で該要求を受け、監視対象サーバ10からの送信間隔情報を監視サーバ情報記憶部11に保存する。定期通知部12は監視対象サーバ10のネットワーク構成情報(ネットワーク接続情報)を管理サーバ20の監視対象情報記憶部25から取得し、監視対象サーバ情報記憶部11に保存する。監視対象サーバ10のネットワーク構成情報を取得する時、変更があるかをチェックする。監視対象サーバ10のネットワーク構成情報は、監視対象サーバ10の定期通知部12がOS(Operating System)から取得して状態通知パケットに含めて管理サーバ20に送信し、管理サーバ20の状態通知受信部22で受信し、状態通知パケットから取得して制御判定部26経由で監視対象情報記憶部25に保存したものである。定期通知部12はネットワーク構成情報およびネットワーク情報の変更の有無を示す情報を、状態通知パケットに含めて送信する。
次に、図4を参照して、監視対象サーバ10の要求処理部13と代理確認部14の動作について説明する。要求処理部13は管理サーバ20の送信間隔設定・状態確認部23からの要求を受け、処理する。処理する要求は、状態通知パケット送信間隔設定要求と監視対象サーバ死活状態確認要求の二種類である。さらに、監視対象サーバ死活状態確認要求は自サーバ死活状態確認要求と他監視対象サーバ死活状態確認要求の二種類がある。要求処理部13は動作を開始したら、管理サーバ20からの要求を待つ(ステップ101)。送信間隔設定・状態確認部23から要求がきたら(ステップ102)、まず要求内容を確認する(ステップ103)。状態通知パケット送信間隔設定要求と自サーバ死活状態確認要求の場合は、該要求を要求処理部13で処理する。状態通知パケット送信間隔設定要求から送信間隔を取得し、監視対象サーバ情報記憶部11に保存し(ステップ104)、設定成功の結果を、通信部15を経て管理サーバ20の送信間隔設定・状態確認部23に返送する(ステップ105、112)。自サーバ死活状態確認要求の場合は、「稼働中」という確認結果を、通信部15を経て管理サーバ20の間隔設定・状態確認部23に返送する(ステップ106、112)。他サーバ死活状態確認要求の場合は、代理確認部14に要求を渡して、代理確認部14で他監視対象サーバの死活状態を確認してもらう。代理確認部14では、まず他サーバ死活状態確認要求から確認方式(独自方式またはPING方式)を取得する(ステップ107)。代理確認部14は確認方式を確認する(ステップ108)。独自方式の場合、管理サーバ20の送信間隔設定・状態確認部23から監視対象サーバ10の要求処理部13に要求を発行するように、代理確認部14から、管理サーバ20の代替として、管理サーバ20の送信間隔設定・状態確認部23が確認したい他監視対象サーバ10の要求処理部13に自サーバ死活状態確認要求を発行する(ステップ109)。PING方式の場合、指定されている他監視対象サーバのIPアドレスにICMPパケットを送信し、ICMP応答の有無から他監視対象サーバの死活状態を確認する(ステップ110)。PING方式がサポートするのは、例えば図5の場合、管理サーバ20が管理LANに接続しているNIC11、NIC21を利用している場合でも、監視対象サーバ10の代理確認部14は業務LAN(NIC12、NIC22で接続)を経由して、PING方式を利用して、他監視対象サーバの死活状態を確認することができる。ステップ109、110の後、確認結果を、通信部15を経て管理サーバ20の間隔設定・状態確認部23に返送する(ステップ111、112)。代理確認部14は、例えばTCP(Transmission Control Protocol)のような、信頼性の高いプロトコルを利用して監視対象サーバ10の死活状態を確認することで、死活状態の信頼性の高い判断が可能となる。
続いて、管理サーバ20の動作について説明する。最初監視対象サーバ10の状態通知パケット送信間隔を設定する必要がある場合、図6で示す処理フローで設定したい監視対象サーバ20へ送信間隔の設定を行う。制御・判定部26は監視対象情報記録部25から監視対象サーバのIPと送信間隔を取得し、状態通知パケット送信間隔設定要求を作り(ステップ201)、これを監視対象サーバ20に送信するように送信間隔設定・状態確認部23に渡す。制御・判定部26は送信間隔設定・状態確認部23から設定結果を入手し(ステップ202)、設定結果を確認する(ステップ203)。もし送信間隔の設定が失敗した場合、設定失敗の監視対象サーバ死活状態確認要求を送信間隔設定・状態確認部23に渡して、確認してもらう(ステップ204)。送信間隔設定・状態確認部23から死活状態確認結果を入手し(ステップ205)、確認する(ステップ206)。送信間隔設定が失敗した監視対象サーバ10が稼働中であれば、再度送信間隔設定の処理を行う。監視対象サーバの状態を「ダウン」と判断した場合、状態確認結果を監視対象情報記憶部25に記録する(ステップ208)。ステップ203で、送信間隔の設定が成功の場合、監視対象サーバ10の状態が稼働中と判断し(ステップ207)、状態確認結果を監視対象情報記憶部25に記録する(ステップ208)。
通常、監視対象サーバ10と管理サーバ20間の通信が正しく行われている場合、管理サーバ20の状態通知受信部22と制御・判定部26が動作する。制御・判定部26は、監視対象情報記録部25に登録されている監視対象サーバの情報を状態通知受信部22に渡す。状態通知受信部22は監視対象サーバ10の定期通知部12から状態通知パケットを受信し、状態通知パケットにある、監視対象サーバネットワーク構成情報の変更の有無を示す情報を確認する。変更があった場合、制御・判定部26に通知し、制御・判定部26を経由して、監視対象情報記録部25に新しいネットワーク構成情報を保存する。また、状態通知受信部22は各監視対象サーバからの状態通知パケットの受信時刻も記録し、更新していく。制御・判定部26は状態通知受信部22が記録および更新する各監視対象サーバ状態通知パケットの受信時刻を確認し、該監視対象サーバ20の送信間隔と比較することで、監視対象サーバからの状態通知パケットを受信できなくなることを検出することが可能となる。監視対象サーバ10からの状態通知パケットが受信できなくなった場合、制御・判定部26はまず他監視対象サーバの死活状態を確認し、他監視対象サーバから通知パケットを受信できていれば、監視対象サーバのネットワーク接続の問題を排除する。そして、状態通知パケットを受信できなくなった監視対象のサーバ死活状態確認要求を送信間隔設定・状態確認部23に渡して、確認してもらう。監視対象サーバの状態を「ダウン」と判断した場合、状態確認結果「ダウン」を監視対象情報記録部25に記録する。また、状態がダウンとなっている監視対象サーバから通知パケット受信があった場合、監視対象サーバの状態が回復と判断し、監視対象情報記録部25に記録している該監視監視対象サーバの状態を「回復」に更新する。
次に、送信間隔設定・状態確認部23の動作を、図7により説明する。送信間隔設定・状態確認部23は制御・判定部26から送信間隔設定要求と状態確認要求を受けて、該要求を処理する。送信間隔設定要求と状態確認要求の処理には、共通の流れとして、監視対象サーバ10への要求パケットを作成し、監視対象サーバ10の要求処理部13へ要求を送信し、要求処理部13から処理結果を受信し、制御・判定部26へ結果を返却することが含まれる。状態確認要求の処理を詳細に説明する。制御・判定部26から状態確認要求を受信したら、送信間隔設定・状態確認部23はまずルート抽出部24に、確認対象の監視対象サーバ10への通信ルートの抽出要求を発行し(ステップ302)、通信ルートリストを取得する(ステップ303)。通信ルートには確認送信先IPと確認方式が含まれている。通信ルートリストから通信ルートを取得し、確認方式を決定し(ステップ304)、確認方式により、要求パケットを作成する(ステップ305)。直接、対象管理サーバ10の要求処理部13へ確認する場合、自状態確認要求となり、他監視対象サーバ10経由で対象管理サーバ10の要求処理部13へ確認する場合、他監視対象サーバ経由独自方式確認要求となり、他監視対象サーバ経由で、監視対象サーバの他ネットワークI/FにICMP応答で確認する場合、他監視対象サーバ経由PING方式確認要求となり、要求パケットを作成する(ステップ306、307、308)。この要求パケットは、死活状態を確認する監視対象サーバを特定する情報(自監視対象サーバの状態を確認するのか、他監視対象サーバの状態を確認するのか)、死活状態の確認方式を指定する情報を含む。送信間隔設定・状態確認部23は監視対象サーバ10の要求処理部13へ要求パケットを送信し(ステップ309)、要求処理部13から処理結果を受信する(ステップ310)。処理結果から状態確認の結果を判別する(ステップ311、312)。失敗した場合は、次の通信ルートがあるかを確認する(ステップ313)。通信ルートがある場合、またルートを分析し、要求パケットを作成して状態確認を行う(ステップ304〜312)。通信ルートリストにある全ての通信ルートを試みて、失敗となる場合、結果を「失敗」として制御・判定部26に返却する(ステップ314)。送信間隔設定要求の場合、監視対象サーバ10の要求処理部13に対する送信間隔設定要求を作成する(ステップ315)。
次に、ルート抽出部24の処理を詳細に説明する。ルート抽出部24は状態を確認する監視対象サーバのIPアドレスを渡され、その監視対象サーバまで三種類の通信ルートを抽出する。一つは基本的なルートとして、監視対象サーバに直接にアクセスするルートであり、自監視対象サーバ自方式という。そして、他監視対象サーバ経由で確認するルートが二種類ある。一つは他監視対象サーバ経由で、状態を確認する監視対象サーバの要求処理部13にアクセスするルートであり、他監視対象サーバ経由自方式という。もう一つは他監視対象サーバ経由で、状態を確認する監視対象サーバにICMP応答確認できるルートであり、他監視対象サーバ経由PING方式という。続いて、他監視対象サーバ経由での確認ルートの抽出方法を説明する。まず、監視対象情報(図2)の「ステータス」が「稼働中」となっている監視対象サーバのIPとSubnetマスク(図2)を確認し、同じSubnetとなっている他監視対象サーバを他監視対象サーバ経由自方式ルートとして抽出する。登録されている監視対象サーバの台数およびネットワーク構成により、抽出した同じSubnetにいる他監視対象サーバ数が多い場合があるので、抽出するルート数の最大値を指定することも考えられる。次に、状態確認の目標サーバが複数のNICを持つ場合、状態確認の目標監視対象サーバと同じSubnetとなっている他監視対象サーバのIP以外のネットワークI/FのIPとSubnetマスクを確認し、状態確認ターゲット監視対象サーバIP以外のNICと同じSubnetとなっている他監視対象サーバを他監視対象サーバ経由PING方式ルートとして抽出する。前記と同じで、抽出したルート数の最大値を指定することも考えられる。ルート抽出部24はこれら抽出した三種類の通信ルートを送信間隔設定・状態確認部23に返却する。
本実施形態によれば、監視対象サーバ10と管理サーバ20に信頼性の高いプロトコルを使用する通信処理モジュール(送信間隔設定・状態確認部23、要求処理部13)を持ち、三つの確認方式(自監視対象サーバ自方式、他監視対象サーバ経由自方式、他監視対象サーバ経由PING方式)を使用して、監視対象サーバ10の死活状態を高精度で確認することが可能となる。
なお、監視対象サーバおよび管理サーバの上記の機能は、その機能を実現するためのプログラムを、コンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータに読み込ませ、実行するものであってもよい。コンピュータ読み取り可能な記録媒体とは、フレキシブルディスク、光磁気ディスク、CD−ROM等の記録媒体、コンピュータシステムに内蔵されるハードディスク装置等の記憶装置を指す。さらに、コンピュータ読み取り可能な記録媒体は、インターネットを介してプログラムを送信する場合のように、短時間、動的にプログラムを保持するもの(伝送媒体もしくは伝送波)、その場合のサーバとなるコンピュータ内の揮発性メモリのように、一定時間プログラムを保持しているものを含む。
本発明は、ポリシーベースのシステム自律運用で、サーバダウンの検出をトリガーとし、復旧アクションや、業務移行などのアクションを自動的に実行される運用など精度の高いサーバ死活監視を求める場面に適用できる。
本発明の一実施形態の死活監視方法が適用された監視システムの構成を示す図である。 監視対象情報記憶部に記憶される監視対象情報を示す図である。 監視対象サーバ情報記憶部に記憶される被監視対象サーバ情報を示す図である。 監視対象サーバの要求処理部と代理確認部の動作を示すフローチャートである。 監視対象サーバが、管理LANに接続しているNICを利用する場合のPING方式の説明図である。 管理サーバで行われる、監視対象サーバの状態通知パケット送信間隔の設定動作を示すフローチャートである。 管理サーバの送信間隔設定・状態確認部の動作を示すフローチャートである。
符号の説明
10−1〜10−n 監視対象サーバ
11 監視対象サーバ情報記憶部
12 定期通知部
13 要求処理部
14 代理確認部
15 通信部
20 管理サーバ
21 通信部
22 状態通知受信部
23 送信間隔・状態確認部
24 ルート抽出部
25 監視対象情報記憶部
26 制御・判定部
30 ネットワーク
101〜112、201〜208、301〜315 ステップ

Claims (17)

  1. 複数の被監視装置と、少なくとも1つ監視装置がネットワークに接続された監視システムにおいて、
    前記被監視装置は、その状態を示す状態通知パケットを定期的に前記監視装置に送信し、前記監視装置は、前記状態通知パケットがこなくなったことを検出すると、前記状態通知パケットがこなくなった被監視装置以外の他被監視装置からの状態通知パケットが受信できていれば、被監視装置のネットワーク構成情報から、前記監視装置から、状態通知パケットがこなくなった被監視装置までの複数の通信ルートを抽出し、該複数の通信ルートを利用して状態通知パケットがこなくなった被監視装置の死活状態を確認する、
    被監視装置の死活状態監視方法。
  2. 前記通信ルートが、該状態確認対象の被監視装置に直接アクセスするルート、他被監視装置経由で該状態確認対象の被監視装置にアクセスするルート、他被監視装置経由で該状態確認対象の被監視装置にICMP応答確認できるルート、の3種類を含む、請求項1に記載の、被監視装置の死活状態監視方法。
  3. 前記被監視装置は、前記監視装置から自被監視装置の死活状態確認要求を受け取ると、稼働中という確認結果を前記監視装置に返送し、該要求が他被監視装置の死活状態確認要求であれば、確認方法が独自方式の場合、該他被監視装置に、自被監視装置状態確認要求を発行し、応答を確認し、確認方法がPING方式の場合、該他被監視装置のIPアドレスにICMPパケットを送信し、ICMP応答の有無から該他被監視装置の死活状態を確認し、いずれの方式でも確認結果を前記監視装置に返送する、請求項2に記載の、被監視装置の死活状態監視方法。
  4. 前記被監視装置は、前記監視装置から、状態通知パケット送信間隔の設定要求を受け取ると、前記監視装置からの送信間隔の情報を被監視装置情報記憶手段に保存し、設定成功を前記監視装置に返送する、請求項1から3のいずれかに記載の、被監視装置の死活状態監視方法。
  5. 前記監視装置は前記各被監視装置に対し前記状態通知パケットの送信間隔の設定を要求し、前記送信間隔の設定結果を入手し、送信間隔の設定に成功したと判断すると、当該被監視装置の状態を稼働中と判断し、送信間隔の設定に失敗したと判断すると、送信間隔の設定失敗の被監視装置の死活状態確認を行い、死活状態確認結果により、送信間隔の設定が失敗した被監視装置が稼働中であれば、前記状態通知パケットの送信間隔の設定を再度要求し、送信間隔の設定が失敗した被監視装置がダウンであればその旨を前記監視対象情報記憶手段に記録する、請求項4に記載の、被監視装置の死活状態監視方法。
  6. 複数の被監視装置と、少なくとも1つ監視装置がネットワークに接続された監視システムにおける被監視装置であって、
    監視装置および他の被監視装置との通信を行う通信手段と、
    当該被監視装置から監視装置に定期的に送信される状態通知パケットの送信間隔と、当該被監視装置のネットワーク構成情報を保存する被監視装置情報記憶手段と、
    当該被監視装置のネットワーク構成情報を取得し、前記被監視装置情報記憶手段に保存し、前記ネットワーク構成情報および該情報の変更の有無を示す情報を前記状態通知パケットに含めて、前記被監視装置情報記憶手段に記憶されている送信間隔で前記監視装置に送信する定期通信手段と、
    他被監視装置の死活状態を確認する代理確認手段と、
    前記監視装置から、自被監視装置の死活状態確認要求を受けると、稼働中という確認結果を前記監視装置に返送し、該要求が他被監視装置の死活状態確認要求であれば、前記代理確認手段に、該他被監視装置の死活状態を確認してもらい、確認結果を前記監視装置に返送する要求処理手段と
    を有する被監視装置。
  7. 前記要求処理手段は、前記監視装置から、送信間隔設定要求を受けると、前記監視装置からの送信間隔の情報を前記被監視装置情報記憶手段に保存し、設定成功を前記監視装置に返送する、請求項6に記載の被監視装置。
  8. 前記代理確認手段は、確認方法が独自方式であれば、該他被監視装置の要求処理手段に、自被監視装置状態確認要求を発行し、応答を確認し、確認方法がPING方式であれば、該他被監視装置のIPアドレスにICMPパケットを送信し、ICMP応答の有無から該他被監視装置の死活状態を確認し、いずれの方式でも確認結果を前記要求処理手段に返送する、請求項6または7に記載の被監視装置。
    被監視装置。
  9. 複数の被監視装置と、少なくとも1つ監視装置がネットワークに接続された監視システムにおける監視装置であって、
    前記各被監視装置と通信する通信手段と、
    前記各被監視装置から、定期的に送信される状態通知パケットを受信する状態通知受信手段と、
    前記被監視装置のネットワーク構成情報、死活状態を保存する監視対象情報記憶手段と、
    前記被監視装置の死活状態を確認するために、必要な通信ルートの情報を抽出するルート抽出手段と、
    前記被監視装置の死活状態の確認要求を受けると、前記ルート抽出手段に、確認対象の被監視装置への通信ルートの抽出要求を発行し、通信ルートリストを取得し、該通信ルートリストから通信ルートを取得し、通信ルートにある確認方式に応じて要求パケットを作成、送信し、結果を受信、解析し、確認要求の要求元に返却する送信間隔設定・死活状態判定手段と、
    前記被監視装置から前記状態通知パケットがこなくなったことを検出すると、当該被監視装置の死活状態を確認し、他被監視装置からの状態通知パケットが受信できていれば、状態通知パケットを受信できなくなった当該被監視装置の死活状態の確認を前記送信間隔設定・死活状態判定手段に要求し、前記送信間隔設定・死活状態判定手段から返ってきた結果により、当該被監視装置の死活状態をダウンと判断した場合、その旨を前記監視対象情報記憶手段に記録し、状態通知パケットを受信できなくなった当該被監視装置からその後通知パケットの受信があった場合、前記監視対象情報記憶手段に記録されている、当該被監視装置の状態を更新する制御・判定手段と、
    を有する監視装置。
  10. 前記送信間隔設定・死活状態判定手段は、前記各被監視装置に対し前記状態通知パケットの送信間隔の設定を要求し、前記制御・判定手段は、前記送信間隔の設定結果を入手し、送信間隔の設定に成功したと判断すると、当該被監視装置の状態を稼働中と判断し、その旨を前記監視対象情報記憶手段に記録し、送信間隔の設定に失敗したと判断すると、送信間隔の設定失敗の被監視装置の死活状態確認を前記送信間隔設定・死活状態判定手段に要求し、前記送信間隔設定・死活状態判定手段からの死活状態確認結果により、送信間隔の設定が失敗した被監視装置が稼働中であれば、前記送信間隔設定・死活状態判定手段により前記状態通知パケットの送信間隔の設定を再度要求し、送信間隔の設定が失敗した被監視装置がダウンであればその旨を前記監視対象情報記憶手段に記録する、請求項9に記載の監視装置。
  11. 前記ルート抽出手段は、前記送信間隔設定・死活状態判定手段から状態確認対象の被監視装置のIPアドレスを渡され、該状態確認対象の被監視装置に直接アクセスするルート、他被監視装置経由で該状態確認対象の被監視装置にアクセスするルート、他被監視装置経由で該状態確認対象の被監視装置にICMP応答確認できるルート、の3種類のルートを抽出し、前記通信ルートリストとして、前記送信間隔設定・死活状態判定手段に渡す、請求項9または10に記載の監視装置。
  12. 複数の被監視装置と、少なくとも1つ監視装置がネットワークに接続された監視システムにおける被監視装置に搭載されるプログラムであって、
    監視装置および他の被監視装置との通信を行う通信手順と、
    当該被監視装置のネットワーク構成情報を取得し、被監視装置情報記憶手段に保存し、前記ネットワーク構成情報および該情報の変更の有無を示す情報を前記状態通知パケットに含めて、前記被監視装置情報記憶手段に記憶されている送信間隔で前記監視装置に送信する定期通信手順と、
    他被監視装置の死活状態を確認する代理確認手順と、
    前記監視装置から、自被監視装置の死活状態確認要求を受けると、稼働中という確認結果を前記監視装置に返送し、該要求が他被監視装置の死活状態確認要求であれば、前記代理確認手順に、該他被監視装置の死活状態を確認してもらい、確認結果を前記監視装置に返送する要求処理手順と
    をコンピュータに実行させる死活監視プログラム。
  13. 前記要求処理手順は、前記監視装置から、送信間隔設定要求を受けると、前記監視装置からの送信間隔の情報を前記被監視装置情報記憶手段に保存し、設定成功を前記監視装置に返送する、請求項12に記載の死活監視プログラム。
  14. 前記代理確認手順は、確認方法が独自方式であれば、該他被監視装置の要求処理手順に、自被監視装置状態確認要求を発行し、応答を確認し、確認方法がPING方式であれば、該他被監視装置のIPアドレスにICMPパケットを送信し、ICMP応答の有無から該他被監視装置の死活状態を確認し、いずれの方式でも確認結果を前記要求処理手順に返送する、請求項12または13に記載の死活監視プログラム。
    被監視装置。
  15. 複数の被監視装置と、少なくとも1つ監視装置がネットワークに接続された監視システムにおける監視装置に搭載されるプログラムであって、
    前記各被監視装置と通信する通信手順と、
    前記各被監視装置から、定期的に送信される状態通知パケットを受信する状態通知受信手順と、
    前記被監視装置の死活状態を確認するために、必要な通信ルートの情報を抽出するルート抽出手順と、
    前記被監視装置の死活状態の確認要求を受けると、前記ルート抽出手順に、確認対象の被監視装置への通信ルートの抽出要求を発行し、通信ルートリストを取得し、該通信ルートリストから通信ルートを取得し、通信ルートにある確認方式に応じて要求パケットを作成、送信し、結果を受信、解析し、確認要求の要求元に返却する送信間隔設定・死活状態判定手順と、
    前記被監視装置から前記状態通知パケットがこなくなったことを検出すると、当該被監視装置の死活状態を確認し、他被監視装置からの状態通知パケットが受信できていれば、状態通知パケットを受信できなくなった当該被監視装置の死活状態の確認を前記送信間隔設定・死活状態判定手順に要求し、前記送信間隔設定・死活状態判定手順から返ってきた結果により、当該被監視装置の死活状態をダウンと判断した場合、その旨を監視対象情報記憶手段に記録し、状態通知パケットを受信できなくなった当該被監視装置からその後通知パケットの受信があった場合、前記監視対象情報記憶手段に記録されている、当該被監視装置の状態を更新する制御・判定手順と、
    をコンピュータに実行させるための死活監視プログラム。
  16. 前記送信間隔設定・死活状態判定手順は、前記各被監視装置に対し前記状態通知パケットの送信間隔の設定を要求し、前記制御・判定手順は、前記送信間隔の設定結果を入手し、送信間隔の設定に成功したと判断すると、当該被監視装置の状態を稼働中と判断し、その旨を前記監視対象情報記憶手段に記録し、送信間隔の設定に失敗したと判断すると、送信間隔の設定失敗の被監視装置の死活状態確認を前記送信間隔設定・死活状態判定手順に要求し、前記送信間隔設定・死活状態判定手順からの死活状態確認結果により、送信間隔の設定が失敗した被監視装置が稼働中であれば、前記送信間隔設定・死活状態判定手順により前記状態通知パケットの送信間隔の設定を再度要求し、送信間隔の設定が失敗した被監視装置がダウンであればその旨を前記監視対象情報記憶手段に記録する、請求項15に記載の死活監視プログラム。
  17. 前記ルート抽出手順は、前記送信間隔設定・死活状態判定手順から状態確認対象の被監視装置のIPアドレスを渡され、該状態確認対象の被監視装置に直接アクセスするルート、他被監視装置経由で該状態確認対象の被監視装置にアクセスルート、他被監視装置経由で該状態確認対象の被監視装置にICMP応答確認できるルート、の3種類のルートを抽出し、前記通信ルートリストとして、前記送信間隔設定・死活状態判定手順に渡す、請求項15または16に記載の死活監視プログラム。
JP2008046096A 2008-02-27 2008-02-27 死活監視方法、被監視装置、監視装置、死活監視プログラム Pending JP2009205364A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008046096A JP2009205364A (ja) 2008-02-27 2008-02-27 死活監視方法、被監視装置、監視装置、死活監視プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008046096A JP2009205364A (ja) 2008-02-27 2008-02-27 死活監視方法、被監視装置、監視装置、死活監視プログラム

Publications (1)

Publication Number Publication Date
JP2009205364A true JP2009205364A (ja) 2009-09-10

Family

ID=41147565

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008046096A Pending JP2009205364A (ja) 2008-02-27 2008-02-27 死活監視方法、被監視装置、監視装置、死活監視プログラム

Country Status (1)

Country Link
JP (1) JP2009205364A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012038257A (ja) * 2010-08-11 2012-02-23 Nec Corp Os動作状態確認システム、確認対象装置、os動作状態確認装置、os動作状態確認方法およびプログラム
JP2012221175A (ja) * 2011-04-07 2012-11-12 Fujitsu Ltd 仮想マシン環境におけるネットワーク障害検知方法、装置、およびプログラム
WO2013111240A1 (ja) * 2012-01-25 2013-08-01 株式会社 東芝 二重化制御システムおよびその制御方法
JP2014135591A (ja) * 2013-01-09 2014-07-24 Fujitsu Telecom Networks Ltd ネットワーク監視システム
JP2016158231A (ja) * 2015-02-25 2016-09-01 廣達電腦股▲ふん▼有限公司 アウトオブバンドネットワークポート状態検出用の方法、設備、及びコンピュータ読み取り可能な記録媒体
US9934114B2 (en) 2013-09-26 2018-04-03 Mistubishi Electric Corporation Communication system, standby device, communication method, and standby program

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012038257A (ja) * 2010-08-11 2012-02-23 Nec Corp Os動作状態確認システム、確認対象装置、os動作状態確認装置、os動作状態確認方法およびプログラム
JP2012221175A (ja) * 2011-04-07 2012-11-12 Fujitsu Ltd 仮想マシン環境におけるネットワーク障害検知方法、装置、およびプログラム
WO2013111240A1 (ja) * 2012-01-25 2013-08-01 株式会社 東芝 二重化制御システムおよびその制御方法
JP2013152631A (ja) * 2012-01-25 2013-08-08 Toshiba Corp 二重化制御システムおよびその制御方法
JP2014135591A (ja) * 2013-01-09 2014-07-24 Fujitsu Telecom Networks Ltd ネットワーク監視システム
US9934114B2 (en) 2013-09-26 2018-04-03 Mistubishi Electric Corporation Communication system, standby device, communication method, and standby program
JP2016158231A (ja) * 2015-02-25 2016-09-01 廣達電腦股▲ふん▼有限公司 アウトオブバンドネットワークポート状態検出用の方法、設備、及びコンピュータ読み取り可能な記録媒体

Similar Documents

Publication Publication Date Title
US9313088B2 (en) Network system and network managing method
US9832082B2 (en) Monitoring wireless access point events
US9219640B2 (en) Performing failover in a redundancy group
US7936743B2 (en) Method and system for determining a path between two points of an IP network over which datagrams are transmitted
US7832010B2 (en) Unauthorized access program monitoring method, unauthorized access program detecting apparatus, and unauthorized access program control apparatus
US20110093612A1 (en) Device, method and computer readable medium for bgp route monitoring
JP4195480B2 (ja) コンピュータ端末がネットワークに接続して通信することを管理・制御するための装置および方法。
US10680893B2 (en) Communication device, system, and method
JP2009205364A (ja) 死活監視方法、被監視装置、監視装置、死活監視プログラム
US11201792B2 (en) Management system and control method
US11909606B2 (en) Systems and methods for determining flow and path analytics of an application of a network using sampled packet inspection
JP5617304B2 (ja) スイッチング装置、情報処理装置および障害通知制御プログラム
US8948020B2 (en) Detecting and isolating dropped or out-of-order packets in communication networks
JPWO2015098589A1 (ja) クラスタシステム、サーバ装置、クラスタシステムの管理方法、及びプログラム。
JP2008225911A (ja) Itリソース構成の変更検知方法
JP4570582B2 (ja) ネットワーク監視プログラム、ネットワーク監視方法、およびネットワーク監視装置
JP5925287B1 (ja) 情報処理装置、方法およびプログラム
CN109710423B (zh) 一种用于虚拟机间通信的方法及设备
JP2007267099A (ja) 基地局管理装置及び基地局管理方法
US11375441B2 (en) Systems and methods for connecting wireless clients to preferred edge devices in active-active deployments
KR102156600B1 (ko) 네트워크에서 수집된 패킷과 엔드포인트 컴퓨팅 장치의 프로세스 간의 연관관계를 생성하는 시스템 및 방법
JP6179981B2 (ja) 情報処理システム、情報処理装置、情報処理方法及びプログラム
US20100312866A1 (en) Redundancy pair detecting method, communication device and recording medium for recording redundancy pair detection program
JP2009098985A (ja) セッション管理方法、通信システムおよび通信装置
JP2010004449A (ja) 通信システム及びクライアント装置及びサーバ装置