JP4790579B2 - プロセスの監視装置及び監視方法 - Google Patents

プロセスの監視装置及び監視方法 Download PDF

Info

Publication number
JP4790579B2
JP4790579B2 JP2006333598A JP2006333598A JP4790579B2 JP 4790579 B2 JP4790579 B2 JP 4790579B2 JP 2006333598 A JP2006333598 A JP 2006333598A JP 2006333598 A JP2006333598 A JP 2006333598A JP 4790579 B2 JP4790579 B2 JP 4790579B2
Authority
JP
Japan
Prior art keywords
address
information processing
information
monitoring
network address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006333598A
Other languages
English (en)
Other versions
JP2008146397A (ja
Inventor
ミン グイエン ダン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2006333598A priority Critical patent/JP4790579B2/ja
Publication of JP2008146397A publication Critical patent/JP2008146397A/ja
Application granted granted Critical
Publication of JP4790579B2 publication Critical patent/JP4790579B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Description

本発明は、プロセスの監視装置及び監視方法に関する。
複数のコンピュータが協働して情報処理を行う方式としてクラスタリングやユーティリティコンピューティング、グリッドコンピューティングなどが知られている。これらの方式による情報処理を行うコンピュータシステムにおいて、所定のプロセスが実行されているかどうかを監視したいというニーズがある。例えば、特許文献1では、多ノードクラスタにおいて、各ノード(コンピュータ)において常時起動しているチェックプロセスが、クラスタグループの変動を確認するシステムが開示されている。
特開2003−345620号公報
しかしながら、特許文献1に記載のシステムでは、監視対象となる全てのサーバから確認結果が監視サーバに送信されるので、監視対象となるサーバの台数が多い場合には、確認結果の送受信に負荷がかかってしまう。
本発明は、このような背景を鑑みてなされたものであり、効率的にプロセスを監視することのできる監視装置及び監視方法を提供することを目的とする。
上記課題を解決するための本発明の主たる発明は、通信可能に接続される複数の情報処理装置のそれぞれに第1のネットワークアドレスが設定され、前記情報処理装置のうちの1つに更に第2のネットワークアドレスが設定される情報処理システムにおいて、前記第2のネットワークアドレスが設定される前記情報処理装置において実行されるプロセスの実行状態を監視する装置であって、監視対象となる前記プロセスを示すプロセスID及び前記プロセスに対応する前記第2のネットワークアドレスを記憶する監視情報記憶部と、前記第1のネットワークアドレスを用いて、前記第2のネットワークアドレスが設定されているかどうかを問い合わせる問合わせ要求を前記情報処理装置に送信する問合わせ要求送信部と、前記問合わせ要求に対する応答を受信する応答受信部と、前記応答に基づいて、前記第2のネットワークアドレスが設定されている前記情報処理装置に設定されている前記第1のネットワークアドレスをプロセス実行アドレスとして特定するアドレス特定部と、前記プロセスIDと前記特定した前記プロセス実行アドレスとを対応づけて記憶するプロセス情報記憶部と、監視対象となる前記プロセスを示す前記プロセスIDに対応する前記プロセス実行アドレスを読み出し、読み出した前記プロセス実行アドレスを宛先として、前記プロセスの実行状態を取得するためのプロセス情報取得要求を送信するプロセス監視部と、を備えることとする。
本発明の監視装置によれば、監視対象となるプロセスに対応する第2のネットワークアドレスが設定されている情報処理装置を特定し、特定した情報処理装置に対してプロセス情報取得要求を送信することができる。したがって、複数の情報処理装置の全てに対してプロセス情報取得要求を送信する必要がないので、プロセスの実行状態を把握するために必要な情報の収集に係る通信負荷を低減し、効率的にプロセスを監視することができる。
本発明によれば、効率的にプロセスを監視することができる。
==システム構成==
以下、本発明の一実施形態に係る情報処理システムについて説明する。図1は、本実施形態に係る情報処理システムの全体構成を示す図である。同図に示すように、本実施形態の情報処理システムは、クライアント装置10、情報処理サーバ20、プロセス監視装置30、及び管理者端末40を含んで構成されている。
クライアント装置10、2台の情報処理サーバ20、プロセス監視装置30、及び管理者端末40はそれぞれ通信ネットワーク50を介して互いに通信可能に接続されている。通信ネットワーク50は、例えば、イーサネット(登録商標)や公衆電話回線網などにより構築される、インターネットやLAN(Local Area Network)などである。本実施形態では、通信ネットワーク50ではTCP/IPにより通信が行われるものとし、クライアント装置10、情報処理サーバ20、プロセス監視装置30、及び管理者端末40にはそれぞれ固有のIPアドレス(以下、実IPアドレスという。本発明の第1のネットワークアドレスに対応する。)が設定されている。
情報処理サーバ20(本発明の情報処理装置に該当する。)は、クライアント装置10からの情報処理要求に応じて情報処理サービスを提供するコンピュータである。情報処理サーバ20としては、例えば、パーソナルコンピュータやワークステーションなどを採用することができる。情報処理サーバ20は、各種のアプリケーションプログラムを実行することにより、各種の情報処理サービスを提供する。アプリケーションプログラムを実行することにより行われる処理はプロセスとも呼ばれる。2台の情報処理サーバ20はクラスタを構成し、アプリケーションプログラム毎に付与される所定のIPアドレス(以下、仮想IPアドレスという。本発明の第2のネットワークアドレスに該当する。)に対する情報処理要求に応じて情報処理を行うプロセスが実行される。仮想IPアドレスは、情報処理サーバ20の何れか一方に設定される。仮想IPアドレスが設定された情報処理サーバ20に障害が発生した場合には、他方の情報処理サーバ20に仮想IPアドレスが再設定され、続いて故障の発生した情報処理サーバ20で実行されていたプロセスが、他方の情報処理サーバ20に引き継がれる、いわゆるフェールオーバが行われる。なお、2台の情報処理サーバ20により構成されるクラスタは、一般的な方法により実現される。
クライアント装置10は、情報処理サーバ20が提供する情報処理サービスを利用するユーザが操作するコンピュータである。クライアント装置10は、仮想IPアドレスを宛先として情報処理要求を送信する。これにより、ユーザ側ではプロセスが実行されている情報処理サーバ20を意識することなく、クライアント装置10は、クラスタを構成する情報処理サーバ20群に対して通信を行うことが可能となる。
==プロセス監視装置30のハードウェア構成==
図2は、プロセス監視装置30のハードウェア構成を示す図である。同図に示すように、プロセス監視装置30は、CPU301,メモリ302、ディスクインタフェース303、通信インタフェース304を備えている。
ディスクインタフェース303は、ハードディスクドライブ305と接続するためのインタフェースである。ディスクインタフェース303は、例えば、SCSIアダプタやファイバーチャネルアダプタなどである。
ハードディスクドライブ305は、プログラムやデータを記憶する記録媒体である。ハードディスクドライブ305には、監視プロセス管理プログラム311、IPアドレス検出プログラム312、プロセス監視プログラム313が記憶されている。ハードディスクドライブ305に記憶されている各プログラムやデータは、ディスクインタフェース303を介してメモリ302に読み出される。
CPU301は、ハードディスクドライブ305に記憶されているプログラムをメモリ302に読み出して実行することにより各種の機能を実現する。通信インタフェース304は、通信ネットワーク50に接続するためのインタフェースである。通信インタフェース304は、例えば、イーサネット(登録商標)に接続するためのアダプタや、公衆電話回線網に接続するためのモデムである。
==プロセス監視装置30のソフトウェア構成==
図3は、プロセス監視装置30のソフトウェア構成を示す図である。同図に示すように、プロセス監視装置30は、監視プロセス登録要求受信部321、監視プロセス削除要求受信部322、監視プロセス管理部323、実IPアドレス検出部324、プロセス情報取得部325、サーバデータベース351、監視プロセスデータベース352を備えている。
なお、監視プロセス登録要求受信部321、監視プロセス削除要求受信部322、及び監視プロセス管理部323はそれぞれ、プロセス監視装置30のCPU301が、ハードディスクドライブ305に記憶されている監視プロセス管理プログラム311をメモリ302に読み出して実行することにより実現される。
実IPアドレス検出部324は、CPU301がハードディスクドライブ305に記憶されているIPアドレス検出プログラム312をメモリ302に読み出して実行することにより実現される。
プロセス情報取得部325は、CPU301がハードディスクドライブ305に記憶されているプロセス監視プログラム313をメモリ302に読み出して実行することにより実現される。
サーバデータベース351及び監視プロセスデータベース352は、メモリ302やハードディスクドライブ305が提供する記憶領域として実現される。
なお、監視プロセス登録要求受信部321、監視プロセス削除要求受信部322、監視プロセス管理部323、実IPアドレス検出部324及びプロセス情報取得部325は、集積回路化したハードウェアにより実現するようにすることもできる。
サーバデータベース351は、各情報処理サーバ20の実IPアドレスを記憶する。サーバデータベース351の構成例を図4に示す。同図の例では、2台の情報処理サーバ20にはそれぞれ「10.0.0.1」及び「10.0.0.2」のIPアドレスが割り当てられていることを示している。なお、サーバデータベース351は、管理者端末40において管理者により作成されたレコードを管理者端末40から受信して記憶するようにしてもよいし、通信ネットワーク50に対して、実IPアドレスを問い合わせるブロードキャストメッセージを送出し、上記のメッセージに対する応答を受信して記憶するようにしてもよい。
監視プロセスデータベース352(本発明の、プロセス情報記憶部に該当する。)は、監視対象となるプロセスに関する情報(以下、監視プロセス情報という。)を記憶する。監視プロセスデータベース352の構成例を図5に示す。同図に示すように、監視プロセスデータベース352に記憶される監視プロセス情報には、プロセス名欄3521、仮想IPアドレス欄3522、実IPアドレス欄3523、ステータス欄3524、及び更新日時欄3525が含まれている。
プロセス名欄3521には、プロセスを特定するための情報(以下、プロセス名という。本発明のプロセスIDに該当する。)が設定される。なお、本実施形態では、情報処理サーバ20において実行されるアプリケーションプログラムの名称が設定されるものとする。
仮想IPアドレス欄3522には、プロセスに対応する仮想IPアドレスが設定される。実IPアドレス欄3523には、仮想IPアドレスが設定されている情報処理サーバ20に固有の実IPアドレス(本発明のプロセス実行アドレスに該当する。)が設定される。なお、仮想IPアドレスが情報処理サーバ20の何れにも設定されていない場合、例えば、フェールオーバにより仮想IPアドレスの設定処理が行われている場合や、特定のプロセスに係る情報処理サーバ20における情報処理サービスの提供が終了した場合などには、実IPアドレス欄3523には値が設定されない(「−」が設定される。)。
ステータス欄3524には、プロセスの実行状態を示す情報(以下、ステータス情報という。)が設定される。ステータス情報としては、「起動中」及び「停止中」がある。なお、後述するプロセスの実行状態の取得処理中には、ステータス欄3524に「検索中」が設定されることもある。
監視プロセス登録要求受信部321は、管理者端末40から送信される、監視対象のプロセスを登録するためのコマンド(以下、監視プロセス登録要求という。)を受信する。監視プロセス登録要求には、監視対象とするプロセスを示すプロセス名と仮想IPアドレスとが設定される。
監視プロセス削除要求受信部322は、管理者端末40から送信される、プロセスを監視対象から外すためのコマンド(以下、監視プロセス削除要求という。)を受信する。監視プロセス削除要求には、監視対象から外すプロセスを示すプロセス名と仮想IPアドレスとが設定される。
監視プロセス管理部323は、監視プロセス情報の管理を行う。監視プロセス管理部323は、監視プロセス登録要求に応じて後述する監視プロセス情報の登録処理を行い、監視プロセス削除要求に応じて後述する監視プロセス情報の削除処理を行う。
実IPアドレス検出部324は、仮想IPアドレスが設定されている情報処理サーバ20の実IPアドレスを検出する。本実施形態において、実IPアドレス検出部324は、SNMP(Simple Network Management Protocol)を利用して実IPアドレスを検出する。実IPアドレス検出部324は、IPアドレスを取得するための「ipAddrEntry(1.3.6.1.2.1.4.20.1)」をオブジェクトID(OID)として指定したSNMPのリクエスト(以下、IPアドレス取得要求という。本発明のSNMPコマンドに該当する。)を情報処理サーバ20に送信し、情報処理サーバ20から応答されるMIB(Management Information Base)形式で記述された情報処理サーバ20の状態に関する情報(以下、MIB情報という。)を受信する。IPアドレス取得要求への応答としてのMIB情報には、情報処理サーバ20に設定されている1つ以上のIPアドレスのリストが含まれている。実IPアドレス検出部324は、このリストに仮想IPアドレスが含まれているかどうかにより、仮想IPアドレスが情報処理サーバ20に設定されているかどうかを判断する。なお、実IPアドレス検出部324による実IPアドレスの検出処理の詳細については後述する。
プロセス情報取得部325は、情報処理サーバ20から、プロセスの実行状態に関する情報(以下、プロセス情報という。)を取得する。本実施形態において、プロセス情報取得部325は、SNMPを利用してプロセス情報を取得する。プロセス情報取得部325は、実行中のプロセスの状態に関する情報を取得するための「prTable(1.3.6.1.4.1.2021.2)」をOIDとして指定したSNMPのリクエスト(以下、プロセス情報取得要求という。)を情報処理サーバ20に送信し、情報処理サーバ20から応答されるMIB情報を受信する。プロセス情報取得要求への応答としてのMIB情報には、情報処理サーバ20において実行されているプロセスの状態に関する情報が含まれている。本実施形態では簡単のため、MIB情報には、情報処理サーバ20において実行されているプロセスを示すプロセス名のリストが含まれている。プロセス情報取得部325は、このリストに、監視対象となっているプロセスを示すプロセス名が含まれているかどうかにより、監視対象のプロセスが情報処理サーバ20において実行中であるかどうかを判定する。プロセス情報取得部325は、判定結果に応じて、監視プロセス情報データベース252に記憶されている監視プロセス情報のステータス欄3524を更新する。
==処理==
以下、本実施形態のプロセス監視装置30により行われる処理の詳細について説明する。まず、監視プロセス情報の登録処理及び削除処理について説明する。図6は、監視プロセス情報の登録処理の流れを示す図である。なお、図6に示す監視プロセス情報の登録処理は、プロセス監視装置30が管理者端末40から監視プロセス登録要求を受信する度に実行される。
プロセス監視装置30は、監視プロセス登録要求に設定されているプロセス名及び仮想IPアドレスを取得し(S601)、取得したプロセス名及び仮想IPアドレスに対応する監視プロセス情報が監視プロセスデータベース352に登録されているかどうかを判定し(S602)、上記の監視プロセス情報が登録されていない場合(S602:NO)、プロセス名、仮想IPアドレス、「−」、「停止中」及び現在の日時を含む監視プロセス情報を生成し(S603)、生成した管理プロセス情報を監視プロセスデータベース352に登録する(S604)。プロセス監視装置30は、上記の仮想IPアドレスが設定されている情報処理サーバ20の実IPアドレスの検出処理を行う(S605)。
仮想IPアドレスに対応する実IPアドレスの検出処理の流れを図7に示す。
プロセス監視装置30は、検出結果となる実IPアドレスに「−」を設定し(S621)、サーバデータベース351に記憶されているIPアドレス(以下、宛先アドレスという。)のそれぞれについて以下の処理を行う。
プロセス監視装置30は、宛先アドレスにIPアドレス取得要求を送信する(S622)。プロセス監視装置30は、IPアドレス取得要求に応じて情報処理サーバ20から応答されるMIB情報を受信し、受信したMIB情報からIPアドレスのリストを抽出する(S623)。プロセス監視装置30は、抽出したリストに仮想IPアドレスが含まれている場合には(S624:YES)、宛先アドレスを実IPアドレスとし(S625)、含まれていない場合には(S624:NO)、次の宛先アドレスについて(S622)からの処理を繰り返す。
プロセス監視装置30は、監視プロセスデータベース352に登録されている監視プロセス情報のうち、仮想IPアドレスに対応するものの実IPアドレス欄3523に、実IPアドレスを設定する(S626)。
以上のようにして、仮想IPアドレスに対応する実IPアドレスが取得され、仮想IPアドレスに対応する監視プロセス情報の実IPアドレス欄3523が更新される。なお、何れの情報処理サーバ20にも仮想IPアドレスが設定されていない場合には、監視プロセス情報の実IPアドレス欄3523には「−」が設定されることになる。
図8は、監視プロセス情報の削除処理の流れを示す図である。図8に示す監視プロセス情報の削除処理は、プロセス監視装置30が管理者端末40から監視プロセス情報削除要求を受信する度に実行される。
プロセス監視装置30は、監視プロセス削除要求に設定されているプロセス名及び仮想IPアドレスを取得し(S641)、取得したプロセス名及び仮想IPアドレスに対応する監視プロセス情報が監視プロセスデータベース352に登録されているかどうかを判定する(S642)。上記監視プロセス情報が登録されている場合(S642:YES)、プロセス監視装置30は、その監視プロセス情報を監視プロセスデータベース352から削除する(S643)。
==プロセスの監視処理==
次に、プロセス監視装置30によるプロセスの監視処理について説明する。図9は、プロセス監視装置30によるプロセスの監視処理全体の流れを示す図である。
プロセス監視装置30は、監視プロセスデータベース352に登録されている各監視プロセス情報について以下の処理を繰り返す。
プロセス監視装置30は、監視プロセス情報の実IPアドレス欄3523に有効なIPアドレスが設定されている場合(S701:NO)、後述するプロセス情報の取得処理を行う(S702)。
一方、監視プロセス情報の実IPアドレス欄3523に「−」が設定されている場合には(S701:YES)、上述の図7に示す処理により、監視プロセス情報の仮想IPアドレス欄3522に設定されている仮想IPアドレスに対応する実IPアドレスの検出処理を行う(S703)。実IPアドレスの検出処理により監視プロセス情報の実IPアドレス欄3523に有効な実IPアドレスが設定された場合には(S704:NO)、(S702)に進み、プロセス監視装置30は、後述のプロセス情報の取得処理を行う。
一方、上記の実IPアドレスの検出処理を行っても監視プロセス情報の実IPアドレス欄3523に「−」が設定されている場合には(S704:YES)、プロセス監視装置30は、監視プロセス情報のステータス欄3524には「停止中」を設定する(S705)。
プロセス監視装置30は、以上の処理を行った後、監視プロセス情報の更新日時欄3525に現在の日時を設定する(S706)。
図10は、プロセス情報の取得処理の流れを示す図である。
プロセス監視装置30は、監視プロセス情報の実IPアドレス欄3523に設定されている実IPアドレスを宛先としてプロセス情報取得要求を送信する(S721)。
プロセス監視装置30は、プロセス情報取得要求に応じて情報処理サーバ20から送信されるMIB情報を受信し、受信したMIB情報から、プロセス名のリストを抽出する(S722)。プロセス監視装置30は、抽出したリストに、監視プロセス情報のプロセス名欄3521に設定されているプロセス名が含まれている場合には(S723)、監視プロセス情報のステータス欄3524に「起動中」を設定する(S724)。
一方、MIB情報から抽出したリストにプロセス名が含まれていない場合(S723:NO)、プロセス監視装置30は、監視プロセス情報のステータス欄3524に「検索中」を設定して(S725)、更新日時欄3525には現在の日時を設定する(S726)。プロセス監視装置30は、上述の図7に示す処理により、監視プロセス情報の仮想IPアドレス欄3522に設定されている仮想IPアドレスに対応する実IPアドレスの検出処理を行う(S727)。
プロセス監視装置30は、実IPアドレスの検出処理を行った後、監視プロセス情報の実IPアドレス欄3523に「−」が設定されている場合には(S728:YES)、(S732)に進み、監視プロセス情報のステータス欄3524に「停止中」を設定する。
一方、実IPアドレスの検出処理により監視プロセス情報の実IPアドレス欄3523に有効な実IPアドレスが設定されている場合(S728:NO)、プロセス監視装置30は、その実IPアドレスを宛先としてプロセス情報取得要求を送信する(S729)。プロセス監視装置30は、プロセス情報取得要求に応じて情報処理サーバ20から送信されるMIB情報を受信し、受信したMIB情報に含まれているプロセス名のリストを抽出する(S730)。プロセス監視装置30は、抽出したリストに、監視プロセス情報のプロセス名欄3521に設定されているプロセス名が含まれている場合には(S731:YES)、(S724)に進んで、監視プロセス情報のステータス欄3524に「起動中」を設定する(S732)。
以上のようにして、プロセス監視装置30は、監視対象となる各プロセスについて、情報処理サーバ20から実行状態を取得し、監視プロセス情報を更新する。
本実施形態のプロセス監視装置30によれば、監視対象となるプロセスに対応する仮想IPアドレスが設定されている情報処理サーバ20の実IPアドレスを、プロセス毎に記憶しておき、プロセス情報取得要求の宛先として、情報処理サーバ20の実IPアドレスを用いることができる。
プロセス情報取得要求の宛先を仮想IPアドレスとすることも可能であるが、この場合、例えばフェールオーバ中など、どの情報処理サーバ20にも仮想IPアドレスが割り当てられていないときには、プロセス情報取得要求は何れの情報処理サーバ20にも届かないことになる。図11は、フェールオーバが行われる場合の情報処理システムの状態を説明するためのフロー図である。情報処理サーバA(20)に仮想IPアドレス「10.0.0.1」が設定され(S801)、情報処理サーバA(20)においてプロセス「A」が実行されていたとする(S802)。この場合に、情報処理サーバA(20)に故障が発生すると(S803)、情報処理サーバB(20)が、情報処理サーバA(20)の故障を検出し(S804)、情報処理サーバB(20)に「10.0.0.1」の仮想IPアドレスが設定されて(S805)、情報処理サーバB(20)においてプロセス「A」が実行される(S806)。
ここで、情報処理サーバA(20)に故障が発生した時点(S803)から、情報処理サーバBに仮想IPアドレスが設定される時点(S805)までの期間は、仮想IPアドレスはどの情報処理サーバ20にも設定されていない状態となる。したがって、この期間内には、仮想IPアドレスを宛先としたメッセージは何れの情報処理サーバ20にも到達しないことになる。この場合に、仮想IPアドレスを宛先としてプロセス情報取得要求を送信するようにすると、プロセス監視装置30は、プロセス情報を取得することができない。しかしながら、本実施形態のプロセス監視装置30によれば、プロセス情報取得要求の宛先は、情報処理サーバ20に固有の実IPアドレスであるので、上記の期間内であっても、プロセス情報取得要求が情報処理サーバ20に届くようにすることができる。またこれにより、プロセス情報取得要求が届かなかったことをもって、情報処理サーバ20に障害が発生していることを検出することもできる。
また、図11の例において、情報処理サーバB(20)に仮想IPアドレスが引き継がれた時点(S805)から、情報処理サーバB(20)にプロセス「A」が引き継がれた時点(S806)までの期間には、プロセス「A」は何れの情報処理サーバ20においても実行されていないことになる。したがって、各情報処理サーバ20に対してプロセス情報取得要求を送信してプロセス「A」が実行される情報処理サーバ20を特定しようとしても、上記の期間には、どの情報処理サーバ20においてプロセス「A」が実行されるべきであるかを特定することができない。しかしながら、本実施形態のプロセス監視装置30によれば、プロセス情報取得要求の宛先は、監視対象となるプロセスに対応する仮想IPアドレスに対応する実IPアドレスであるため、監視対象となるプロセスが実行されるべき情報処理サーバ20は、この実IPアドレスが設定されている情報処理サーバ20である。よって、管理者は、監視対象のプロセスが実行されるべき情報処理サーバ20において、そのプロセスが実行されているかどうかを確認することができる。
また、仮想IPアドレスの設定される情報処理サーバ20が変更された場合には、プロセス監視装置30や通信ネットワーク50に接続されているルータなどにおいてルーティングテーブルの書き換えが行われるが、本実施形態のプロセス監視装置30は、仮想IPアドレスに係るルーティングテーブルの書き換えが行われている間にも、実IPアドレスを宛先としてプロセス情報取得要求を送信することができる。よって、プロセス情報を取得することができない時間を短縮することができる。
また、本実施形態のプロセス監視装置30によれば、仮想IPアドレスが何れの情報処理サーバ20に設定されているかを、一般的なSNMPのリクエストを用いて調べることにより、監視対象となるプロセスが何れの情報処理サーバ20において実行されているかを検出することができる。したがって、クラスタを構成する情報処理サーバ20に、例えば、プロセスの実行状況を報告するエージェントのように、特殊なアプリケーションプログラムをインストールすることなく、監視対象となるプロセスが実行される情報処理サーバ20を特定することができる。
また、本実施形態のプロセス監視装置30によれば、情報処理サーバ20に設定されているIPアドレスを問い合わせるIPアドレス取得要求を用いて、その情報処理サーバ20において、監視対象となるプロセスが実行される情報処理サーバ20を特定することができる。一般に、情報処理サーバ20において実行されているプロセスの数は数十〜数百程度であり、情報処理サーバ20に設定されているIPアドレスの数は数個である。したがって、全情報処理サーバ20に対してはIPアドレス取得要求を送信し、仮想IPアドレスが設定されている情報処理サーバ20に対してのみ、プロセス情報取得要求を送信するようにすることができる。これにより、情報処理サーバ20からの応答に係る通信負荷を低減することができる。
なお、本実施形態の情報処理システムでは、2台の情報処理サーバ20によりクラスタが構成されるものとしたが、これに限らず、3台以上の情報処理サーバ20によりクラスタが構成されるようにしてもよい。また、各情報処理サーバ20が異なるネットワークセグメントに設置されるようにしてもよい。異なるネットワークセグメントに設置される4台の情報処理サーバ20によりクラスタが構成される場合の情報処理システムの一例を図12に示す。同図の例では、異なるネットワークセグメントに設置されたA〜Dの4台の情報処理サーバ20がルータ21を介してクラスタを構成するものとする。この場合でも、プロセス監視装置30は、各情報処理サーバ20に固有の実IPアドレスを宛先としてプロセス情報取得要求を送信することができる。
また、本実施形態の情報処理システムでは、情報処理サーバ20によりクラスタが構成されるものとしたが、これに限らず、グリッドコンピューティングやユーティリティコンピューティングのように、必要に応じてプロセスを実行する情報処理サーバ20が変化するような情報処理システムに応用することができる。
以上、本実施形態について説明したが、上記実施形態は本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。本発明は、その趣旨を逸脱することなく、変更、改良され得ると共に、本発明にはその等価物も含まれる。
本実施形態に係る情報処理システムの全体構成を示す図である。 プロセス監視装置30のハードウェア構成を示す図である。 プロセス監視装置30のソフトウェア構成を示す図である。 サーバデータベース351の構成例を示す図である。 監視プロセスデータベース352の構成例を示す図である。 監視プロセス情報の登録処理の流れを示す図である。 仮想IPアドレスに対応する実IPアドレスの検出処理の流れを示す図である。 監視プロセス情報の削除処理の流れを示す図である。 プロセスの監視処理全体の流れを示す図である。 プロセス情報の取得処理の流れを示す図である。 フェールオーバが行われる場合の情報処理システムの状態を説明するためのフロー図である。 異なるネットワークセグメントに設置される4台の情報処理サーバ20によりクラスタが構成される場合の情報処理システムの一例を示す図である。
符号の説明
10 クライアント装置
20 情報処理サーバ
30 プロセス監視装置
40 管理者端末
50 通信ネットワーク
301 CPU
302 メモリ
303 ディスクインタフェース
304 通信インタフェース
305 ハードディスクドライブ
311 監視プロセス管理プログラム
312 IPアドレス検出プログラム
313 プロセス監視プログラム
321 監視プロセス登録要求受信部
322 監視プロセス削除要求受信部
323 監視プロセス管理部
324 実IPアドレス検出部
325 プロセス情報取得部
351 サーバデータベース
352 監視プロセスデータベース
3521 プロセス名欄
3522 仮想IPアドレス欄
3523 実IPアドレス欄
3524 ステータス欄
3525 更新日時欄

Claims (5)

  1. 通信可能に接続される複数の情報処理装置のそれぞれに第1のネットワークアドレスが設定され、前記情報処理装置のうちの1つに更に第2のネットワークアドレスが設定される情報処理システムにおいて、前記第2のネットワークアドレスが設定される前記情報処理装置において実行されるプロセスの実行状態を監視する装置であって、
    監視対象となる前記プロセスを示すプロセスID及び前記プロセスに対応する前記第2のネットワークアドレスを記憶する監視情報記憶部と、
    前記第1のネットワークアドレスを用いて、前記第2のネットワークアドレスが設定されているかどうかを問い合わせる問合わせ要求を前記情報処理装置に送信する問合わせ要求送信部と、
    前記問合わせ要求に対する応答を受信する応答受信部と、
    前記応答に基づいて、前記第2のネットワークアドレスが設定されている前記情報処理装置に設定されている前記第1のネットワークアドレスをプロセス実行アドレスとして特定するアドレス特定部と、
    前記プロセスIDと前記特定した前記プロセス実行アドレスとを対応づけて記憶するプロセス情報記憶部と、
    監視対象となる前記プロセスを示す前記プロセスIDに対応する前記プロセス実行アドレスを読み出し、読み出した前記プロセス実行アドレスを宛先として、前記プロセスの実行状態を取得するためのプロセス情報取得要求を送信するプロセス監視部と、
    を備えることを特徴とする監視装置。
  2. 請求項1に記載の監視装置であって、
    前記問合わせ要求送信部は、前記各情報処理装置に、前記第1のネットワークアドレスを用いて、各前記情報処理装置に設定されている前記第1又は第2のネットワークアドレスを問い合わせるSNMPコマンドを送信し、
    前記アドレス特定部は、各前記情報処理装置からの前記応答のそれぞれについて、前記第2のネットワークアドレスが含まれているかどうかを判定し、前記第2のネットワークアドレスが含まれている前記応答を送信してきた前記情報処理装置の前記第1のネットワークアドレスを前記プロセス実行アドレスとして特定すること、
    を特徴とする監視装置。
  3. 請求項1に記載の監視装置であって、
    前記プロセス情報取得要求に応じて、前記情報処理装置において実行されている前記プロセスの実行状態を含むプロセス情報を、前記情報処理装置から受信するプロセス情報受信部と、
    前記プロセス情報に基づいて、前記プロセスが実行されているかどうかを判定するプロセス実行判定部と、を備え、
    前記プロセスが実行されていないと判定された場合、
    前記問合わせ要求送信部は、再度前記第1のネットワークアドレスを用いて前記問合わせ要求を送信し、
    前記アドレス特定部は、前記問合わせ要求に対する応答に基づいて前記プロセス実行アドレスを特定し、特定した前記プロセス実行アドレスを前記プロセスIDに対応付けて前記プロセス情報記憶部に記憶すること、
    を特徴とする監視装置。
  4. 請求項3に記載の監視装置であって、
    前記プロセスIDに対応付けて、前記プロセスが実行されているかどうかを示すステータス情報を記憶するプロセス情報記憶部と、
    前記アドレス特定部が、再度の前記問合わせ要求に対する応答に基づいて前記プロセス実行アドレスを特定することができない場合、前記プロセスを示す前記プロセスIDに対応する前記プロセス情報記憶部の前記ステータス情報を、前記プロセスが実行されていないことを示す内容に更新するプロセス情報更新部と、
    を備えることを特徴とする監視装置。
  5. 通信可能に接続される複数の情報処理装置のそれぞれに第1のネットワークアドレスが設定され、前記情報処理装置のうちの1つに更に第2のネットワークアドレスが設定される情報処理システムにおいて、前記第2のネットワークアドレスが設定される前記情報処理装置において実行されるプロセスの実行状態を監視する方法であって、
    コンピュータが、
    監視対象となる前記プロセスを示すプロセスID及び前記プロセスに対応する前記第2のネットワークアドレスを記憶し、
    前記第1のネットワークアドレスを用いて、前記第2のネットワークアドレスが設定されているかどうかを問い合わせる問合わせ要求を前記情報処理装置に送信し、
    前記問合わせ要求に対する応答を受信し、
    前記応答に基づいて、前記第2のネットワークアドレスが設定されている前記情報処理装置に設定されている前記第1のネットワークアドレスをプロセス実行アドレスとして特定し、
    前記プロセスIDと前記特定した前記プロセス実行アドレスとを対応づけて記憶し、
    監視対象となる前記プロセスを示す前記プロセスIDに対応する前記プロセス実行アドレスを読み出し、読み出した前記プロセス実行アドレスを宛先として、前記プロセスの実行状態を取得するためのプロセス情報取得要求を送信すること、
    を特徴とする監視方法。
JP2006333598A 2006-12-11 2006-12-11 プロセスの監視装置及び監視方法 Expired - Fee Related JP4790579B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006333598A JP4790579B2 (ja) 2006-12-11 2006-12-11 プロセスの監視装置及び監視方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006333598A JP4790579B2 (ja) 2006-12-11 2006-12-11 プロセスの監視装置及び監視方法

Publications (2)

Publication Number Publication Date
JP2008146397A JP2008146397A (ja) 2008-06-26
JP4790579B2 true JP4790579B2 (ja) 2011-10-12

Family

ID=39606505

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006333598A Expired - Fee Related JP4790579B2 (ja) 2006-12-11 2006-12-11 プロセスの監視装置及び監視方法

Country Status (1)

Country Link
JP (1) JP4790579B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013012225A (ja) * 2012-08-30 2013-01-17 Hitachi Ltd 名称特定プログラム、構成管理サーバおよび情報処理システム
KR101526472B1 (ko) * 2014-04-09 2015-06-09 유넷시스템주식회사 정보 대행 처리 장치

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000222246A (ja) * 1999-02-03 2000-08-11 Oki Electric Ind Co Ltd ネットワーク監視方法
JP2003140925A (ja) * 2001-11-05 2003-05-16 Mitsubishi Materials Corp タスク監視システム及び方法
JP2003345620A (ja) * 2002-05-24 2003-12-05 Hitachi Software Eng Co Ltd 多ノードクラスタシステムのプロセス監視方法
JP4491195B2 (ja) * 2003-02-17 2010-06-30 日本電気株式会社 情報処理装置間を移動するオブジェクトの追従監視システム

Also Published As

Publication number Publication date
JP2008146397A (ja) 2008-06-26

Similar Documents

Publication Publication Date Title
JP4647234B2 (ja) ネットワーク装置をディスカバリするための方法および装置
TWI282228B (en) Method and apparatus for autonomic failover
US7743274B2 (en) Administering correlated error logs in a computer system
US9800653B2 (en) Measuring responsiveness of a load balancing system
US20030158933A1 (en) Failover clustering based on input/output processors
US11463303B2 (en) Determining the health of other nodes in a same cluster based on physical link information
US20030037177A1 (en) Multiple device management method and system
US20040049553A1 (en) Information processing system having data migration device
JP2021141582A (ja) 障害回復方法および障害回復装置、ならびに記憶媒体
JP2013162200A (ja) 情報処理システム、情報処理装置およびプログラム
CN110535692A (zh) 故障处理方法、装置、计算机设备、存储介质及存储系统
JP5617304B2 (ja) スイッチング装置、情報処理装置および障害通知制御プログラム
CN106506490A (zh) 一种分布式计算控制方法以及分布式计算系统
JP2016103784A (ja) 監視装置、監視プログラムおよび監視方法
JP2016536920A (ja) ネットワークパフォーマンス監視のための機器および方法
JP2010245710A (ja) ネットワーク管理装置及び通信システム及びネットワーク管理方法及びプログラム
WO2013171865A1 (ja) 管理方法及び管理システム
JP5686027B2 (ja) 仮想マシン環境におけるネットワーク障害検知方法、装置、およびプログラム
JP4790579B2 (ja) プロセスの監視装置及び監視方法
CN114553867A (zh) 一种云原生的跨云网络监控方法、装置及存储介质
JP2005148895A (ja) 遠隔監視システム、電子機器の遠隔監視方法、下位監視装置、機器監視情報の通知方法、上位監視装置、保守データの通信方法、プログラム及び記録媒体
JP2008077293A (ja) ネットワーク監視装置
JP2003015973A (ja) ネットワークデバイス管理装置、管理方法及び管理プログラム
JP3570300B2 (ja) 障害管理方式および方法
JP4589939B2 (ja) 接続情報管理方法及び装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081217

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101020

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110719

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110720

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140729

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees