JP2012234336A - 監視対象プロセスを実行する装置及び方法 - Google Patents

監視対象プロセスを実行する装置及び方法 Download PDF

Info

Publication number
JP2012234336A
JP2012234336A JP2011102129A JP2011102129A JP2012234336A JP 2012234336 A JP2012234336 A JP 2012234336A JP 2011102129 A JP2011102129 A JP 2011102129A JP 2011102129 A JP2011102129 A JP 2011102129A JP 2012234336 A JP2012234336 A JP 2012234336A
Authority
JP
Japan
Prior art keywords
monitoring
monitored
unit
setting information
target process
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011102129A
Other languages
English (en)
Other versions
JP5579650B2 (ja
Inventor
Junichi Fujino
淳一 藤野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2011102129A priority Critical patent/JP5579650B2/ja
Priority to US13/419,971 priority patent/US8914488B2/en
Publication of JP2012234336A publication Critical patent/JP2012234336A/ja
Application granted granted Critical
Publication of JP5579650B2 publication Critical patent/JP5579650B2/ja
Priority to US14/513,424 priority patent/US10068015B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0715Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a system implementing multitasking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0748Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a remote unit communicating with a single-box computer node experiencing an error/fault
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0775Content or structure details of the error report, e.g. specific table structure, specific error fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3017Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is implementing multitasking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/403Arrangements for multi-party communication, e.g. for conferences
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】被監視サーバで実行される監視対象プロセスの監視条件を監視サーバ側で登録する作業を不要にする。
【解決手段】被監視サーバ10a,10b,10cの各々では、プロセス起動停止プロシージャ12が、監視対象プロセス11の起動後にその監視条件を監視条件レジストリ14に登録し、監視対象プロセス11の停止前にその監視条件を監視条件レジストリ14から削除する。また、監視エージェント15は、監視条件レジストリ14内の監視条件に稼動状況取得メソッド16があればこれを用いて監視対象プロセス11を監視し、その状態が直近稼動状況リスト18における状態から遷移した場合、監視条件レジストリ14内の監視条件に自動実行アクション17があればこれを実行し、状態遷移情報を監視サーバ30に通知する。すると、監視サーバ30では、監視制御部31が、状態遷移情報を監視コンソール50に出力する。
【選択図】図1

Description

本発明は、監視装置により監視される複数の被監視装置のうちの1つの被監視装置で監視装置による監視の対象である監視対象プロセスを実行する装置及び方法に関する。
分散系サーバシステムの可用性を監視するために、各サーバ上で稼動するプロセスの稼動状況の監視が行われる。
ここで、従来の監視方法としては、以下の技術が知られている(例えば、特許文献1〜4参照)。
特許文献1の技術では、監視するプログラム名称、プログラムを構成する全て又は一部のプロセス名称、プロセス名称ごとのプロセス数のしきい値をプログラム監視条件として設定し、プロセスの稼動情報を取得し、プロセス稼動情報とプログラム監視条件からプログラムの稼動状態を判定し、判定結果を出力する。
特許文献2の技術では、監視対象機器の状態を監視する監視システムにおいて、監視対象機器と、この監視対象機器のデータを収集し蓄積する上位機器と、監視対象機器からデータを取得する監視エージェント機能と汎用の通信プロトコルを用いて監視エージェント機能からデータを取得して上位機器の送信する監視サーバ機能とを有する監視装置とを設ける。
特許文献3の技術では、各ノードが自身のノードIDを持ち、かつ監視対象とするノードのIDを登録しておき、監視対象となる各ノードが監視内容をノード別に任意に設定した異常診断情報を全ノードに周期的に送信し、監視対象ノードのIDを登録したノードが異常診断情報からそのノードの異常状態を監視する。
特許文献4の技術では、監視対象にするAP毎の、そのAPに対して行う監視処理の種別を示す監視カテゴリ、監視パラメータ及び監視パラメータの正常条件を含む変換辞書と、監視対象にするAPそれぞれの重要度及び各重要度のAPに対して行う監視処理の種別を示す監視カテゴリが記述されたポリシー記述とを登録しておき、変換辞書の内の、ポリシーエージェントが備えているAPに対応する変換辞書から、ポリシー記述を満たす監視カテゴリと監視パラメータと正常条件との組をルールとして取り出す。
特開2001−117789号公報 特開2003−70081号公報 特開平11−31136号公報 特開2007−249739号公報
しかしながら、従来の監視方法には、以下のような課題が存在する。
第一に、監視に関する動作の内容を示す設定情報(以下、「監視設定情報」という)を定義する作業が煩雑であるという課題である。
監視装置により監視される被監視装置が多い環境や、被監視装置上で稼動する監視対象となるプロセス(以下、「監視対象プロセス」という)が被監視装置ごとに多種多様である環境では、特に個々の被監視装置の所轄担当が複数部門に亘る場合等に、監視設定情報を漏れなく調査、文書化、定義し、かつ維持、反映し続けることは、複数の被監視装置の統合監視を実施する監視装置側の担当者に多大な作業負荷と困難さを強いることになる。また、被監視装置側の担当者にも、監視装置側の担当者との頻繁な調整や連絡を強いることになる。つまり、監視装置側の担当者、被監視装置側の担当者の双方の工数及び負荷を増大させ、結果として、監視の漏れや監視での誤検知を招く要因ともなる。
第二に、サービスライフサイクルと監視設定情報変更作業とを同期させることが難しいという課題である。
被監視装置で提供するサービスの追加、変更、削除に伴い、そのサービスを直接支える被監視装置上のデータやプロセスも当然変更される。このとき、そのプロセスが監視対象であれば、統合監視を実施する監視装置側でも同期して監視設定情報の変更作業や監視に関する文書の更新作業が必要となる。これらの作業は、サービスの追加、変更、削除の都度必要となり、それが度重なる場合、運用保守作業の負荷が増大する。また、被監視装置側と監視装置側とで変更のタイミングがずれた場合、監視の漏れや監視での誤検知が発生する。
第三に、監視対象プロセスの稼動状況を取得するために用いる情報等が固定されているという課題である。
監視対象プロセスによって、その稼動状況を取得するために用いる最適な情報、例えば、その稼動状況を取得するための最適な方法が異なることがある。特定のミドルウェアプロセスの稼動状況を確認するための専用コマンドが提供されており、その専用コマンドを利用して監視する方が監視精度が高いと考えられる場合等である。しかしながら、従来の監視方法では、監視対象プロセスによって稼動状況の取得方法を変えることはできないため、専用コマンドを利用したい場合は個別の監視機能を追加実装していく必要がある。また、従来の監視方法では、監視対象プロセスによって、その稼動状況に異常を検知した場合に実行すべき動作や通知すべき内容を変えることもできない。
本発明の目的は、被監視装置で実行される監視対象プロセスに関する監視設定情報を監視装置側で登録する作業を不要にすることにある。
本発明の他の目的は、被監視装置で実行される監視対象プロセスに関する監視設定情報に変更が生じた場合において、監視装置側で監視設定情報を変更する作業を不要にすることにある。
本発明の更に他の目的は、監視対象プロセスの稼動状況を取得するために用いる情報又は監視対象プロセスの稼動状況に異常を検知した場合に実行すべき動作や通知すべき内容を、被監視装置側で監視対象プロセスごとに任意に定義又は変更可能とすることにある。
かかる目的のもと、本発明は、監視装置により監視される複数の被監視装置のうちの1つの被監視装置で監視装置による監視の対象である監視対象プロセスを実行する装置であって、監視対象プロセスを起動するプロセス起動部と、プロセス起動部により監視対象プロセスが起動された後に、監視対象プロセスの監視において参照される監視に関する動作の内容を示す情報であってその1つの被監視装置側で設定された情報である監視設定情報を、複数の被監視装置に共通の形式で登録する登録部と、監視対象プロセスを停止するプロセス停止部と、プロセス停止部により監視対象プロセスが停止されるのに先立ち、登録部により登録された監視設定情報を削除する削除部とを含む、装置を提供する。
ここで、この装置において、監視設定情報は、監視対象プロセスの稼動状況を取得するために用いる情報を含むものであってもよいし、監視対象プロセスの稼動状況に異常を検知した場合に実行すべき動作を示す情報を更に含むものであってもよいし、監視対象プロセスの稼動状況に異常を検知した場合に通知すべき内容を示す情報を更に含むものであってもよい。
また、この装置において、登録部は、監視装置により制御され1つの被監視装置で動作することにより監視対象プロセスを監視する監視エージェントにより参照される監視設定情報をその1つの被監視装置内の記憶部に登録するものであってもよいし、監視設定情報を監視装置に送信することにより監視設定情報を監視装置内の記憶部に登録するものであってもよい。
また、本発明は、複数の被監視装置を監視する監視装置と、複数の被監視装置のうちの1つであって監視装置による監視の対象である監視対象プロセスを実行する被監視装置とを含むシステムであって、被監視装置は、監視対象プロセスを起動するプロセス起動部と、プロセス起動部により監視対象プロセスが起動された後に、監視対象プロセスの監視に関する動作の内容を示す情報であって自装置側で設定された情報である監視設定情報を、複数の被監視装置に共通の形式で自装置内の記憶部に登録する登録部と、監視対象プロセスを停止するプロセス停止部と、プロセス停止部により監視対象プロセスが停止されるのに先立ち、監視設定情報を記憶部から削除する削除部と、記憶部に登録された監視設定情報を参照することにより監視対象プロセスを監視する監視エージェントを実行する監視エージェント実行部とを含み、監視装置は、監視対象プロセスの監視の指示を受け付ける受付部と、受付部による指示の受け付けに応じて、監視エージェント実行部による監視エージェントの実行を制御する制御部と、監視エージェントによる監視の結果を監視エージェント実行部から取得する取得部と、取得部により取得された結果を出力する出力部と含む、システムも提供する。
また、本発明は、複数の被監視装置を監視する監視装置と、複数の被監視装置のうちの1つであって監視装置による監視の対象である監視対象プロセスを実行する被監視装置とを含むシステムであって、被監視装置は、監視対象プロセスを起動するプロセス起動部と、プロセス起動部により監視対象プロセスが起動された後に、監視対象プロセスの監視に関する動作の内容を示す情報であって自装置側で設定された情報である監視設定情報の登録の指示を監視装置に送信する登録指示送信部と、監視対象プロセスを停止するプロセス停止部と、プロセス停止部により監視対象プロセスが停止されるのに先立ち、登録指示送信部により登録の指示が送信された監視設定情報の削除の指示を監視装置に送信する削除指示送信部とを含み、監視装置は、登録指示送信部により送信された指示に応じて、監視設定情報を、複数の被監視装置に共通の形式で自装置内の記憶部に登録する登録部と、削除指示送信部により送信された指示に応じて、監視設定情報を記憶部から削除する削除部と、監視対象プロセスの監視の指示を受け付ける受付部と、受付部による指示の受け付けに応じて、記憶部に登録された監視設定情報を参照することにより監視対象プロセスを監視する監視部と、監視部による監視の結果を出力する出力部と含む、システムも提供する。
更に、本発明は、監視装置により監視される複数の被監視装置のうちの1つの被監視装置で監視装置による監視の対象である監視対象プロセスを実行する方法であって、監視対象プロセスを起動するステップと、監視対象プロセスが起動された後に、監視対象プロセスの監視において参照される監視に関する動作の内容を示す情報であってその1つの被監視装置側で設定された情報である監視設定情報を、複数の被監視装置に共通の形式で登録するステップと、登録された監視設定情報を削除するステップと、監視設定情報が削除された後に、監視対象プロセスを停止するステップとを含む、方法も提供する。
更にまた、本発明は、監視装置により監視される複数の被監視装置のうちの1つの被監視装置で監視装置による監視の対象である監視対象プロセスを実行する装置としてコンピュータを機能させるプログラムであって、コンピュータを、監視対象プロセスを起動するプロセス起動部と、プロセス起動部により監視対象プロセスが起動された後に、監視対象プロセスの監視において参照される監視に関する動作の内容を示す情報であってその1つの被監視装置側で設定された情報である監視設定情報を、複数の被監視装置に共通の形式で登録する登録部と、監視対象プロセスを停止するプロセス停止部と、プロセス停止部により監視対象プロセスが停止されるのに先立ち、登録部により登録された監視設定情報を削除する削除部として機能させる、プログラムも提供する。
本発明によれば、被監視装置で実行される監視対象プロセスに関する監視設定情報を監視装置側で登録する作業が不要になる。
本発明の第1の実施の形態における監視システムの構成例を示したブロック図である。 本発明の第1の実施の形態におけるプロセス起動停止プロシージャのプロセス起動時の動作例を示したフローチャートである。 本発明の第1の実施の形態におけるプロセス起動停止プロシージャのプロセス停止時の動作例を示したフローチャートである。 本発明の第1の実施の形態における監視エージェントの動作例を示したフローチャートである。 本発明の第1の実施の形態における監視エージェントの動作例を示したフローチャートである。 本発明の第1の実施の形態で監視条件レジストリに登録される監視条件レコードの一例を示した図である。 本発明の第2の実施の形態における監視システムの構成例を示したブロック図である。 本発明の実施の形態を適用可能なコンピュータのハードウェア構成を示した図である。
以下、添付図面を参照して、本発明の実施の形態について詳細に説明する。
[第1の実施の形態]
図1は、第1の実施の形態における監視システムの構成例を示したブロック図である。
図示するように、監視システムは、被監視サーバ10a,10b,10cと、監視サーバ30とが、ネットワーク80を介して接続されることにより構成される。また、監視サーバ30には、監視コンソール50が接続されている。尚、図では、被監視サーバ10a,10b,10cを示したが、これらを区別する必要がない場合は、被監視サーバ10と称することもある。また、図には、3つの被監視サーバ10を示したが、被監視サーバ10の数はこれに限らず、2つであってもよいし、4つ以上であってもよい。
被監視サーバ10は、監視サーバ30による監視の対象となるサーバコンピュータであり、被監視装置の一例である。被監視サーバ10は、監視対象プロセス11と、プロセス起動停止プロシージャ12と、OSブートプロシージャ13と、監視条件レジストリ14と、監視エージェント15と、稼動状況取得メソッド16と、自動実行アクション17と、直近稼動状況リスト18とを含む。
監視対象プロセス11は、監視サーバ30によって稼動状況が監視されるプロセスである。
プロセス起動停止プロシージャ12は、監視対象プロセス11の起動及び停止を制御するプロシージャである。プロセス起動停止プロシージャ12は、監視対象プロセス11の起動時にその監視を行う際の条件(以下、「監視条件」という)を含む監視条件レコードを監視条件レジストリ14に書き込む。また、監視対象プロセス11の停止時にその監視条件を含む監視条件レコードを監視条件レジストリ14から削除する。即ち、このプロセス起動停止プロシージャ12が実行されることにより、被監視サーバ10内には、監視対象プロセス11を起動するプロセス起動部21、監視対象プロセス11を停止するプロセス停止部22、監視条件レジストリ14に監視条件レコードを登録する登録部の一例としての監視条件登録部23、監視条件レジストリ14から監視条件レコードを削除する削除部の一例としての監視条件削除部24が実現される。
OSブートプロシージャ13は、被監視サーバ10のOS(Operating System)を起動するプロシージャである。OSブートプロシージャ13は、OSの起動時、つまり、監視エージェント15及びあらゆる監視対象プロセス11の起動処理が開始される前に、監視条件レジストリ14を初期化する。但し、監視条件レジストリ14に書き込まれた監視条件レコードのうちプロセス起動停止プロシージャ12によって動的に登録された監視条件レコード以外の静的に定義された監視条件レコードは初期化しない。また、OSブートプロシージャ13は、OSの起動時にプロセス起動停止プロシージャ12を実行することもある。
監視条件レジストリ14は、監視条件レコードを保持する記憶部の一例としてのファイル又はデータベースである。監視条件レコードには、プロセスラベル、プロセス名、プロセス実行ユーザ名、プロセスID、親プロセスID、プロセスインスタンス数上限、プロセスインスタンス数下限、稼動状況取得メソッド、自動実行アクション、通知イベント仕様、非監視時間帯スケジュール等の監視設定情報の一例としての監視条件が含まれる。
ここで、プロセスラベルは、プロセス起動停止プロシージャ12ごとに与えられた被監視サーバ10上でユニークな名前であり、監視条件レコードのレコードキーとなる項目である。
プロセス名は、プロセスの実行時に実際に動作しているプログラムの名前であり、パス名及び引数を含む。
プロセス実行ユーザ名は、プロセスを実行したユーザの名前である。ここでは、ユーザの名前を、ユーザを識別可能なあらゆる情報を含む概念として用いている。
プロセスIDは、プロセスの起動時に割り振られたプロセスを識別する識別子であり、親プロセスIDは、親プロセスの起動時に割り振られた親プロセスを識別する識別子である。
プロセスインスタンス数上限は、同時に実行可能なプロセスインスタンスの数の上限値であり、プロセスインスタンス数下限は、同時に実行可能なプロセスインスタンスの数の下限値である。
稼動状況取得メソッドは、プロセスの稼動状況を取得するために用いるコマンド等である。プロセスの稼動状況を取得するために用いる情報であればコマンド等以外でもよいが、以下では、コマンド等を例にとって説明する。
自動実行アクションは、プロセスの稼動状況の異常の検知時に監視エージェント15が自動的に実行すべきアクションであり、プロセスの再起動、異常検知の通知等がある。
通知イベント仕様は、プロセスの稼動状況の異常の検知時に監視エージェント15が通知すべき内容であり、イベント重要度、メッセージテキスト等がある。
非監視時間帯スケジュールは、プロセスの監視を監視エージェント15に実行させない時間帯を示すスケジュール情報である。プロセス起動停止プロシージャ12からその起動時に監視条件レコードを動的に書き込ませることができない監視対象プロセスの場合、その監視条件レコードを静的に監視条件レジストリ14に登録可能にしているので、この静的に登録された監視条件レコードに基づく監視及び非監視の制御を、この非監視時間帯スケジュールにより行う。
監視エージェント15は、監視サーバ30から導入され、その稼動が監視サーバ30によって管理、制御されるエージェントプログラムである。監視エージェント15は、一定時間のサイクルで、監視条件レジストリ14に保持されている監視条件に従い、監視対象プロセス11を決定し、その稼動状況を監視する。その際、稼動状況取得メソッドが定義されているプロセスの稼動状況は、そのメソッドを用いて監視するが、稼動状況取得メソッドが定義されていないプロセスの稼動状況は、デフォルトのコマンド又はAPI(Application Program Interface)を用いて監視する。そして、監視エージェント15は、監視で判明した稼動状況と直近稼動状況リスト18にある稼動状況とを比較し、直近の監視サイクルからの状態遷移の有無を判別する。状態遷移を検知した場合、それを直近稼動状況リスト18に反映すると共に監視サーバ30に通知する。また、このとき、監視条件レジストリ14に異常検知時の自動実行アクションが定義されていれば、監視エージェント15は、それを実行する。更に、監視条件レジストリ14に通知イベント仕様として通知するイベントの内容やフォーマットが定義されていれば、監視エージェント15は、それに従って通知を行う。尚、監視エージェント15は、監視エージェント実行部の一例としてのプログラム実行部(図示せず)により実行される。
稼動状況取得メソッド16は、プロセスの稼動状況を取得するために用いるコマンド等のデータであり、例えば磁気ディスク装置90g(図8参照)に記憶されている。
自動実行アクション17は、プロセスの再起動や電子メールでの障害通知を行うコマンド等のデータであり、例えば磁気ディスク装置90g(図8参照)に記憶されている。
直近稼動状況リスト18は、監視エージェント15が直近の監視サイクルで得た監視対象プロセスの状態(正常又は異常)を保持するリストである。直近稼動状況リスト18は、磁気ディスク装置90g(図8参照)に記憶されたファイル内又はメインメモリ90c(図8参照)の監視エージェント15が参照可能な領域内に保持され、監視エージェント15の起動時に初期化される。
監視サーバ30は、被監視サーバ10a,10b,10cの統合監視を実施するサーバコンピュータであり、監視装置の一例である。監視サーバ30は、監視制御部31を含む。
監視制御部31は、被監視サーバ10で稼動する監視エージェント15とネットワーク80を介して接続し、監視エージェント15の動作を制御する。より詳細には、監視制御部31は、監視対象プロセス11を監視する指示(以下、「監視指示」という)が監視コンソール50から入力されるとこれを受け付ける受付部の一例としての監視指示受付部41、監視指示を監視エージェント15に送信する制御部の一例としての監視指示送信部42を備える。また、監視対象プロセス11に状態遷移イベントが発生したことを示す情報(以下、「状態遷移情報」)を監視エージェント15から受信する取得部の一例としての状態遷移受信部43、状態遷移情報を監視コンソール50に出力する出力部の一例としての状態遷移出力部44を備える。
次に、第1の実施の形態における監視システムの動作について詳細に説明する。
まず、プロセス起動停止プロシージャ12の動作について説明する。
図2は、プロセス起動停止プロシージャ12が監視対象プロセス11を起動するときの動作例を示したフローチャートである。OSブートプロシージャ13がOSブート時に監視対象プロセス11の起動指示を行った場合や、ユーザが任意の時点で監視対象プロセス11の起動指示を行った場合等に、この動作は開始する。
動作を開始すると、プロセス起動部21が、監視対象プロセス11が既に起動済みであるかどうかを判定する(ステップ101)。尚、この判定は、プロセス起動停止プロシージャ12が保持するプロセスラベルに対応するプロセスが稼動中のプロセスの中にあるかどうかを調べることにより行うとよい。
監視対象プロセス11が既に起動済みであると判定されれば、プロセス起動部21が、その旨を監視サーバ30へ通知すると共に被監視サーバ10内にロギングして(ステップ109)、処理を終了する。
一方、監視対象プロセス11がまだ起動されていないと判定されれば、監視条件削除部24が、監視条件レジストリ14をプロセスラベルをキーに検索し(ステップ102)、監視対象プロセス11の監視条件レコードが登録されているかどうかを判定する(ステップ103)。監視対象プロセス11の監視条件レコードが登録されていないと判定されれば、そのままステップ105へ進む。監視対象プロセス11の監視条件レコードが登録されていると判定されれば、監視条件削除部24が、そのレコードを削除して(ステップ104)、ステップ105へ進む。例えば、前回の監視対象プロセス11の起動時に異常終了したような場合にこのような事態が生ずるが、今回の監視を正常に行うためにこの前回の起動時の情報は削除しておく。
その後、プロセス起動部21が、監視対象プロセス11を起動するコマンドを実行し(ステップ105)、監視対象プロセス11の起動が成功したかどうかを判定する(ステップ106)。
監視対象プロセス11の起動が成功しなかったと判定されれば、プロセス起動部21が、その旨を監視サーバ30へ通知すると共に被監視サーバ10内にロギングして(ステップ109)、処理を終了する。
一方、監視対象プロセス11の起動が成功したと判定されれば、監視条件登録部23が、監視条件を取得する(ステップ107)。ここで、監視条件のうち、プロセスラベルは、プロセス起動停止プロシージャ12が保持する情報から取得し、プロセスID、親プロセスIDはOSから取得する。また、プロセス実行ユーザ名、プロセスインスタンス数上限、プロセスインスタンス数下限、稼動状況取得メソッド、自動実行アクション、通知イベント仕様は、被監視サーバ10のユーザがプロセス起動停止プロシージャ12を起動する際に引数として指定した情報や、被監視サーバ10のユーザが監視対象プロセス11に関連付けて予め設定した情報等から取得するとよい。或いは、被監視サーバ10のユーザがプロセス起動停止プロシージャ12内にコードとして記述しておいてもよい。これにより、監視条件登録部23が、監視条件を含む監視条件レコードを監視条件レジストリ14に登録する(ステップ108)。即ち、この動作例では、監視対象プロセス11の起動が完了するまで監視条件レジストリ14への監視条件レコードの登録を行わないようにすることで、監視対象プロセス11の起動前に監視対象プロセス11が稼動していないことを異常であると誤検知してしまうリスクを抑えている。そして、監視条件登録部23が、監視条件レコードを登録した旨を監視サーバ30へ通知すると共に被監視サーバ10内にロギングして(ステップ109)、処理を終了する。
尚、この動作例では、監視対象プロセス11が既に起動している場合、監視対象プロセス11の起動に失敗した場合、監視条件レジストリ14への監視条件レコードの登録が成功した場合に、ステップ109でその旨の通知及びロギングの処理を行っているが、監視条件レジストリ14への監視条件レコードの登録又は監視条件レジストリ14からの監視条件レコードの削除が失敗した場合に、ステップ109でその旨の通知及びロギングの処理を行ってもよい。
また、テスト時等に監視対象とせずにプロセスを起動できるように、起動指示のオプションにて、監視条件レジストリ14に監視条件レコードを登録しないことを指定可能としてもよい。この場合、プロセス起動停止プロシージャ12は、ステップ107、108の処理をスキップすることになる。
図3は、プロセス起動停止プロシージャ12が監視対象プロセス11を停止するときのプロセス起動停止プロシージャ12の動作例を示したフローチャートである。ユーザが任意の時点で監視対象プロセス11の停止指示を行った場合等に、この動作は開始する。
動作を開始すると、監視条件削除部24が、監視条件レジストリ14をプロセスラベルをキーに検索し(ステップ121)、監視対象プロセス11の監視条件レコードが登録されているかどうかを判定する(ステップ122)。監視対象プロセス11の監視条件レコードが登録されていないと判定されれば、そのままステップ124へ進む。監視対象プロセス11の監視条件レコードが登録されていると判定されれば、監視条件削除部24が、そのレコードを削除して(ステップ123)、ステップ124へ進む。
その後、プロセス停止部22が、監視対象プロセス11が稼動中であるかどうかを判定する(ステップ124)。尚、この判定は、プロセス起動停止プロシージャ12が保持するプロセスラベルに対応するプロセスが稼動中のプロセスの中にあるかどうかを調べることにより行うとよい。
監視対象プロセス11が稼動中でないと判定されれば、プロセス停止部22が、その旨を監視サーバ30へ通知すると共に被監視サーバ10内にロギングして(ステップ126)、処理を終了する。
一方、監視対象プロセス11が稼動中であると判定されれば、プロセス停止部22が、監視対象プロセス11を停止するコマンドを実行する(ステップ125)。即ち、この動作例では、監視条件レジストリ14から監視条件レコードを削除した後に監視対象プロセス11を停止することで、監視対象プロセス11の停止後に監視対象プロセス11が稼動していないことを異常であると誤検知してしまうリスクを抑えている。そして、プロセス停止部22が、監視対象プロセス11が停止した旨を監視サーバ30へ通知すると共に被監視サーバ10内にロギングして(ステップ126)、処理を終了する。
次に、監視エージェント15の動作について説明する。
図4及び図5は、監視エージェント15が監視対象プロセス11を監視するときの動作例を示したフローチャートである。監視サーバ30の監視指示受付部41が監視コンソール50からの監視指示を受け付けることにより、監視サーバ30の監視指示送信部42が監視エージェント15に監視指示を送信した場合に、この動作は開始する。
図4に示すように、監視エージェント15は、動作を開始すると、まず、直近稼動状況リスト18を初期化する(ステップ141)。尚、この直近稼動状況リスト18の初期化は、直近稼動状況リスト18がファイルとして磁気ディスク装置90g(図8参照)に記憶されている場合に行えばよく、直近稼動状況リスト18がメインメモリ90c(図8参照)に記憶されている場合には行わなくてもよい。
そして、監視エージェント15は、監視条件レジストリ14を検索し(ステップ142)、監視条件レジストリ14内に未処理の監視条件レコードがあるかどうかを判定する(ステップ143)。
後述するように監視条件レジストリ14内の監視条件レコードが全て処理され、未処理の監視条件レコードがないと判定されれば、監視エージェント15は、直近稼動状況リスト18から不要なエントリを削除する(ステップ144)。ここで、不要なエントリとは、例えば、後述する処理で監視条件レジストリ14内に対応する監視条件レコードがなかったエントリである。図5のステップ161で直近稼動状況リスト18のエントリを参照したときに参照済みフラグをそのエントリに対して記録しておき、最終的に参照済みフラグが記録されていないエントリを、監視条件レジストリ14内に対応する監視条件レコードがなかったエントリとすればよい。その後、監視エージェント15は、予め設定された時間だけ待機し(ステップ145)、ステップ142に戻る。
また、ステップ143で未処理の監視条件レコードがあると判定されれば、監視エージェント15は、監視条件レジストリ14内に非監視時間帯スケジュールが定義されており、かつ現在時刻が非監視時間帯スケジュールで示される時間帯内であるかどうかを判定する(ステップ146)。
非監視時間帯スケジュールが定義されており、かつ現在時刻が非監視時間帯スケジュールで示される時間帯内であると判定されれば、この監視条件レコードに基づく監視は行わないので、監視エージェント15は、以降の処理をスキップしてステップ143に戻り、次の監視条件レコードを処理する。
一方、非監視時間帯スケジュールが定義されていないと判定された場合、又は、非監視時間帯スケジュールが定義されていても現在時刻が非監視時間帯スケジュールで示される時間帯内でないと判定された場合は、監視エージェント15は、監視条件レコードに稼動状況取得メソッドが定義されているかどうかを判定する(ステップ147)。
監視条件レコードに稼動状況取得メソッドが定義されていると判定されれば、監視エージェント15は、そのメソッドを実行し(ステップ148)、そのメソッドの戻り値から監視対象プロセス11の稼動状況を把握する(ステップ149)。
一方、監視条件レコードに稼動状況取得メソッドが定義されていないと判定されれば、監視エージェント15は、OSが提供する機能(psコマンド等のコマンド又はAPI)を用いて稼動中のプロセスの一覧を表示し、その中からプロセスラベルに基づいて監視対象プロセス11を選択する(ステップ150)。そして、監視対象プロセス11の状態が、監視条件レコードに定義された判別条件を満たすかどうかを検査することにより、監視対象プロセス11の稼動状況を把握する(ステップ151)。
その後、図5に示すように、監視エージェント15は、直近稼動状況リスト18の監視条件レコードに対応するエントリを参照する(ステップ161)。
そして、監視エージェント15は、ステップ149又はステップ151で把握した監視対象プロセス11の稼動状況と、直近稼動状況リスト18のそのエントリに登録された監視対象プロセス11の稼動状況とを比較し、これらの稼動状況が異なっているか、つまり、稼動状況に状態遷移が起きたかどうかを判定する(ステップ162)。
稼動状況に状態遷移が起きていないと判定されれば、以降の処理をスキップして図4のステップ143に戻り、次の監視条件レコードを処理する。
一方、稼動状況に状態遷移が起きたと判定されれば、監視エージェント15は、それが正常から異常への状態遷移であるかどうかを判定する(ステップ163)。
正常から異常への状態遷移でないと判定された場合、つまり、異常であった稼動状況が正常に復帰した場合は、そのままステップ166へ進む。
一方、正常から異常への状態遷移であると判定された場合、つまり、異常を検知した場合、監視エージェント15は、監視条件レコードに自動実行アクションが定義されているかどうかを判定する(ステップ164)。自動実行アクションが定義されていないと判定されれば、そのままステップ166へ進むが、自動実行アクションが定義されていると判定されれば、それを実行して(ステップ165)、ステップ166へ進む。
その後、監視エージェント15は、監視対象プロセス11について状態遷移イベントが発生したことを示す状態遷移情報を監視サーバ30の状態遷移受信部43へ通知すると共に被監視サーバ10内にロギングする(ステップ166)。ここで、通知イベント仕様としてイベント重要度やメッセージテキスト等が監視条件レコードに定義されている場合には、このイベント重要度やメッセージテキスト等を含む状態遷移情報を通知するとよい。また、状態遷移情報には、自動実行アクションを実行したことを示す情報を含めてもよい。これにより、監視サーバ30では、状態遷移受信部43が状態遷移情報を受信し、状態遷移出力部44が状態遷移情報を監視コンソール50に出力し、監視コンソール50には、状態遷移情報に含まれるイベント重要度やメッセージテキスト等が表示される。そして、監視エージェント15は、図4のステップ149又はステップ151で把握された監視対象プロセス11の稼動状況で、直近稼動状況リスト18に登録された監視対象プロセス11の稼動状況を置き換え(ステップ167)、ステップ143に戻る。
ここで、監視条件レジストリ14に登録される監視条件レコードについて具体的に説明する。
図6は、このような監視条件レコードの一例を示した図である。
図示するように、監視条件レコードは、プロセスラベル、プロセス名、プロセス実行ユーザ名、プロセスインスタンス数上限、プロセスインスタンス数下限、稼動状況取得メソッド、自動実行アクション、通知イベント仕様、非監視時間帯スケジュールを監視条件として含むが、各監視条件については既に説明したので、ここでの説明は省略する。尚、監視条件にはプロセスID及び親プロセスIDも含まれるが、ここでは省略している。
まず、1行目の監視条件レコードについて説明する。
1行目の監視条件レコードは、プロセスラベルを「RDBMS」とする監視条件レコードである。尚、この監視条件レコードは、プロセス起動停止プロシージャ12により動的に登録され、削除されることを想定している。
この監視条件レコードでは、稼動状況取得メソッドとして専用コマンドが定義されているので、稼動状況は図4のステップ148、149で把握される。従って、図4のステップ151で用いるプロセス名、プロセスインスタンス数等の判別条件は設定されていない。
また、この監視条件レコードでは、異常検知時の自動実行アクションとして、リスタートコマンドが定義されているので、図5のステップ165では監視対象プロセス11のリスタートが行われる。
更に、この監視条件レコードでは、異常検知時の通知イベント仕様として、イベント重要度「FATAL」と、緊急連絡先を含むメッセージテキストとが定義されているので、図5のステップ166ではこれらの情報を含む状態遷移情報が通知される。
次に、2行目の監視条件レコードについて説明する。
2行目の監視条件レコードは、プロセスラベルを「WebServer」とする監視条件レコードである。尚、この監視条件レコードも、プロセス起動停止プロシージャ12により動的に登録され、削除されることを想定している。
この監視条件レコードでは、稼動状況取得メソッドが定義されていないので、稼動状況は図4のステップ150、151で把握される。従って、プロセス名「httpd」、プロセスインスタンス数上限「100」、プロセスインスタンス数下限「20」が判別条件として設定されている。即ち、図4のステップ151では、「httpd」という名前のプロセスが、上限100、下限20の範疇のインスタンス数で稼働中であれば、正常と判定し、そうでなければ、異常と判定する。
また、この監視条件レコードでは、異常検知時の自動実行アクションとして、電子メールの送信が定義されているので、図5のステップ165では電子メールが送信される。
更に、この監視条件レコードでは、異常検知時の通知イベント仕様として、イベント重要度「CRITICAL」とメッセージテキストとが定義されているので、図5のステップ166ではこれらの情報を含む状態遷移情報が通知される。
次に、3行目の監視条件レコードについて説明する。
3行目の監視条件レコードは、プロセスラベルを「APPL」とする監視条件レコードである。尚、この監視条件レコードは、静的に定義されたものであることを想定している。
この監視条件レコードでは、稼動状況取得メソッドが定義されていないので、稼動状況は図4のステップ150、151で把握される。従って、プロセス名「program_A」、プロセス実行ユーザ名「userA」、プロセスインスタンス数上限「1」、プロセスインスタンス数下限「1」が判別条件として設定されている。即ち、図4のステップ151では、ユーザ「userA」が実行した「program_A」という名前のプロセスが1個だけ稼働中であれば、正常と判定し、そうでなければ、異常と判定する。
また、この監視条件レコードでは、異常検知時の自動実行アクションが定義されていないので、図5のステップ164の判定はNoとなり、ステップ165はスキップされる。
更に、この監視条件レコードでは、異常検知時の通知イベント仕様が定義されていないので、図5のステップ166ではデフォルトの設定で状態遷移情報が通知される。
更にまた、この監視条件レコードは、静的に定義されたものであることから、非監視時間帯スケジュールとして、「Sunday 22:00−23:00」が定義されている。従って、現在時刻が日曜日の22時から23時までの時刻であれば、図4のステップ146の判定はYesとなり、ステップ147〜151及び図5の処理はスキップされる。
[第2の実施の形態]
図7は、第2の実施の形態における監視システムの構成例を示したブロック図である。
図示するように、第2の実施の形態においても、第1の実施の形態と同様、監視システムは、被監視サーバ10a,10b,10cと、監視サーバ30とが、ネットワーク80を介して接続されることにより構成されており、監視サーバ30には、監視コンソール50が接続されている。尚、第2の実施の形態でも、被監視サーバ10a,10b,10cを区別する必要がない場合は、被監視サーバ10と称することがあるものとし、被監視サーバ10の数は3つに限らないものとする。
被監視サーバ10は、監視サーバ30による監視の対象となるサーバコンピュータであり、被監視装置の一例である。被監視サーバ10は、監視対象プロセス11と、プロセス起動停止プロシージャ12と、OSブートプロシージャ13と、稼動状況取得メソッド16とを含む。
監視対象プロセス11は、監視サーバ30によって稼動状況が監視されるプロセスである。
プロセス起動停止プロシージャ12は、監視対象プロセス11の起動及び停止を制御するプロシージャである。プロセス起動停止プロシージャ12は、監視対象プロセス11の起動時にその監視条件を含む監視条件レコードの登録を監視サーバ30に指示する。また、監視対象プロセス11の停止時にその監視条件を含む監視条件レコードの削除を監視サーバ30に指示する。即ち、このプロセス起動停止プロシージャ12が実行されることにより、被監視サーバ10内には、監視対象プロセス11を起動するプロセス起動部21、監視対象プロセス11を停止するプロセス停止部22、監視サーバ30に監視条件レコードの登録を指示する登録部、登録指示送信部の一例としての監視条件登録指示部25、監視サーバ30に監視条件レコードの削除を指示する削除部、削除指示送信部の一例としての監視条件削除指示部26が実現される。
OSブートプロシージャ13は、被監視サーバ10のOSを起動するプロシージャである。OSブートプロシージャ13は、OSの起動時、つまり、あらゆる監視対象プロセス11の起動処理が開始される前に、被監視サーバ10に関する監視条件レコードの初期化を監視サーバ30に指示する。但し、監視条件レコードのうちプロセス起動停止プロシージャ12からの指示によって動的に登録された監視条件レコード以外の静的に定義された監視条件レコードは初期化しない。また、OSブートプロシージャ13は、OSの起動時にプロセス起動停止プロシージャ12を実行することもある。
稼動状況取得メソッド16は、プロセスの稼動状況を取得するために用いるコマンド等のデータであり、例えば磁気ディスク装置90g(図8参照)に記憶されている。尚、後述するように自動実行アクション37は第1の実施の形態と異なり監視サーバ30で保持されるのに対し、この稼動状況取得メソッド16は第1の実施の形態と同じく被監視サーバ10で保持されることとしたのは、稼動状況取得メソッド16が監視対象プロセス11に依存するものだからであるが、稼動状況取得メソッド16が監視サーバ30で保持されることとしてもよい。
監視サーバ30は、被監視サーバ10a,10b,10cの統合監視を実施するサーバコンピュータであり、監視装置の一例である。監視サーバ30は、監視制御部31と、監視条件レジストリ34と、自動実行アクション37と、直近稼動状況リスト38とを含む。
監視制御部31は、被監視サーバ10で稼動する監視対象プロセス11の監視を制御する。また、監視制御部31は、OSブートプロシージャ13及びプロセス起動停止プロシージャ12からの指示に応じて、監視条件レジストリ34を更新する。より詳細には、監視制御部31は、監視対象プロセス11を監視する指示(以下、「監視指示」という)が監視コンソール50から入力されるとこれを受け付ける受付部の一例としての監視指示受付部41、監視対象プロセス11に状態遷移イベントが発生したことを示す情報(状態遷移情報)を監視コンソール50に出力する出力部の一例としての状態遷移出力部44を備える。また、OSブートプロシージャ13から監視条件レコードの初期化が指示されると監視条件レジストリ34内の被監視サーバ10に関する監視条件レコードを初期化する監視条件初期化部45、プロセス起動停止プロシージャ12から監視条件の登録が指示されると監視条件レジストリ34に監視条件レコードを登録する登録部の一例としての監視条件登録部46、プロセス起動停止プロシージャ12から監視条件の削除が指示されると監視条件レコードを監視条件レジストリ34から削除する削除部の一例としての監視条件削除部47を備える。更に、第1の実施の形態の監視エージェント15と同様の監視対象プロセス11の監視をリモートから行う監視部の一例としてのリモート監視部48を備える。
監視条件レジストリ34は、監視条件レコードを保持する記憶部の一例としてのファイル又はデータベースである。監視条件レコードには、サーバ名、プロセスラベル、プロセス名、プロセス実行ユーザ名、プロセスID、親プロセスID、プロセスインスタンス数上限、プロセスインスタンス数下限、稼動状況取得メソッド、自動実行アクション、通知イベント仕様、非監視時間帯スケジュール等の監視設定情報の一例としての監視条件が含まれる。即ち、監視条件レジストリ34は被監視サーバ10a,10b,10cに関する監視条件レコードを含むので、監視条件には、第1の実施の形態で示した情報に加え、サーバ名を含めている。サーバ名以外の監視条件については第1の実施の形態で説明したので、ここでの説明は省略する。
自動実行アクション37は、プロセスの再起動や電子メールでの障害通知を行うコマンド等のデータであり、例えば磁気ディスク装置90g(図8参照)に記憶されている。
直近稼動状況リスト38は、監視制御部31のリモート監視部48が直近の監視サイクルで得た監視対象プロセスの状態(正常又は異常)を保持するリストである。直近稼動状況リスト38は、磁気ディスク装置90g(図8参照)に記憶されたファイル内又はメインメモリ90c(図8参照)のリモート監視部48が参照可能な領域内に保持され、リモート監視部48の起動時に初期化される。
以上をまとめると、第1の実施の形態の監視システムと第2の実施の形態の監視システムとの主な違いは以下の点である。
第一に、第1の実施の形態では、監視エージェント15が被監視サーバ10上で稼動していたが、第2の実施の形態では、監視エージェントが被監視サーバ10上で稼動する必要はなく、監視対象プロセス11を監視サーバ30からリモートで監視する方式(エージェントレス監視方式)にも対応している点である。
第二に、第1の実施の形態では、監視条件レジストリ14及び直近稼動状況リスト18が被監視サーバ10上で分散管理され、その内容はその被監視サーバ10に関するもののみとなっていたが、第2の実施の形態では、監視条件レジストリ34及び直近稼動状況リスト38が監視サーバ30上で集中管理され、その内容は複数の被監視サーバ10に関するものとなっている点である。
第三に、第1の実施の形態では、監視条件レジストリ14及び直近稼動状況リスト18が被監視サーバ10上で更新されるが、第2の実施の形態では、監視条件レジストリ34及び直近稼動状況リスト38が、被監視サーバ10からのイベント通知をトリガーとして、監視サーバ30上で一元的に更新される点である。ここで、トリガーとなるイベント通知は、OSブートプロシージャ13、プロセス起動停止プロシージャ12から行われる。尚、被監視サーバ10は、イベント通知をネットワーク80経由で行うので、到達確認機能及び再送機能を有することが望ましい。
次に、第2の実施の形態における監視システムの動作について詳細に説明する。
まず、プロセス起動停止プロシージャ12の動作について説明する。
プロセス起動停止プロシージャ12が監視対象プロセス11を起動するときの動作は、図2のフローチャートに示した動作とほぼ同様であるが、第2の実施の形態では、監視条件レジストリ34が監視サーバ30上に存在するので、プロセス起動停止プロシージャ12がネットワーク80経由で監視条件レジストリ34にアクセスする。
具体的には、図2のステップ102、103において、被監視サーバ10の監視条件削除指示部26が、監視条件レジストリ34をプロセスラベルをキーに検索して監視対象プロセス11の監視条件レコードが登録されているかどうかを判定するよう指示し、監視サーバ30の監視条件削除部47が、監視条件レジストリ34をプロセスラベルをキーに検索して監視条件レジストリ34に監視対象プロセス11の監視条件レコードが登録されているかどうかを判定する。
また、図2のステップ104において、被監視サーバ10の監視条件削除指示部26が、監視条件レジストリ34から監視対象プロセス11の監視条件レコードを削除するよう指示し、監視サーバ30の監視条件削除部47が、監視条件レジストリ34から監視対象プロセス11の監視条件レコードを削除する。
更に、図2のステップ108において、被監視サーバ10の監視条件登録指示部25が、監視条件を含む監視条件レコードを監視条件レジストリ34に登録するよう指示し、監視サーバ30の監視条件登録部46が、監視条件を含む監視条件レコードを監視条件レジストリ34に登録する。
プロセス起動停止プロシージャ12が監視対象プロセス11を停止するときの動作は、図3のフローチャートに示した動作とほぼ同様であるが、第2の実施の形態では、監視条件レジストリ34が監視サーバ30上に存在するので、プロセス起動停止プロシージャ12がネットワーク80経由で監視条件レジストリ34にアクセスする。
具体的には、図3のステップ121、122において、被監視サーバ10の監視条件削除指示部26が、監視条件レジストリ34をプロセスラベルをキーに検索して監視対象プロセス11の監視条件レコードが登録されているかどうかを判定するよう指示し、監視サーバ30の監視条件削除部47が、監視条件レジストリ34をプロセスラベルをキーに検索して監視対象プロセス11の監視条件レコードが登録されているかどうかを判定する。
また、図3のステップ123において、被監視サーバ10の監視条件削除指示部26が、監視条件レジストリ34から監視対象プロセス11の監視条件レコードを削除するよう指示し、監視サーバ30の監視条件削除部47が、監視条件レジストリ34から監視対象プロセス11の監視条件レコードを削除する。
次に、監視サーバ30のリモート監視部48の動作について説明する。
監視サーバ30のリモート監視部48の動作は、図4及び図5のフローチャートに示した監視エージェント15の動作とほぼ同様であるが、第2の実施の形態では、監視条件レコードの登録や削除を監視サーバ30側で行い、監視対象プロセス11の監視やその際に用いる稼動状況取得メソッド16の呼び出しをネットワーク80経由で行う。
具体的には、図4のステップ141〜144、146、147において、リモート監視部48が、監視サーバ30にある監視条件レジストリ34又は直近稼動状況リスト38の参照、更新を行う。
また、図4のステップ148において、リモート監視部48が、被監視サーバ10から稼動状況取得メソッド16を呼び出して実行する。
更に、図4のステップ150において、リモート監視部48が、OSが提供する機能を用いて被監視サーバ10で稼動中のプロセスの情報をネットワーク80経由で取得してその一覧を表示し、その中からプロセスラベルに基づいて監視対象プロセス11を選択する。
また、図5のステップ161〜165、167において、リモート監視部48が、監視サーバ30にある監視条件レジストリ34、自動実行アクション37又は直近稼動状況リスト38の参照、更新を行う。
更に、図5のステップ166において、リモート監視部48が、監視対象プロセス11について状態遷移イベントが発生したことを示す状態遷移情報を監視サーバ30の状態遷移出力部44へ通知すると共に監視サーバ30内にロギングする。これにより、状態遷移出力部44が状態遷移情報を監視コンソール50に出力し、監視コンソール50には、状態遷移情報に含まれるイベント重要度やメッセージテキスト等が表示される。
以上述べたように、本実施の形態では、監視対象プロセス11の側で、自らに対する監視条件(プロセス名、プロセス実行ユーザ名、プロセスインスタンス数上限、プロセスインスタンス数下限、稼動状況取得メソッド、自動実行アクション、通知イベント仕様等)を定められたインターフェースで登録するようにし、監視エージェント15等が、登録された監視条件に基づく監視を随時自動実行する構成を採用した。
このような構成により、以下のようなメリットを享受できる。
第一に、従来のように監視サーバ30の側で事前に、被監視サーバ10ごとの監視対象プロセス11とその監視条件を個別に調査、集計、文書化し、設定、管理する必要がなくなる。
第二に、新たなサービス実装までのフェーズ途中でそのサービスを構成するプロセスの監視条件に変更が生じたとしても、監視サーバ30の担当者側のチームと被監視サーバ10の担当者側のチームとの間での連絡、調整が不要となる。
第三に、プロセスごとに最適な稼動状況取得メソッド、自動実行アクション、通知イベント仕様を、監視対象プロセス11の側で任意に指定し、定義することが可能となり、かつ監視サーバ30の側の設定に影響を与えずにそれらが任意のタイミングで変更可能となる。
また、本実施の形態によってもたらされる効果には、以下の点もある。
・従来の一般的な分散系監視システム構成(マネージャ・エージェント構成)内に容易に組み込み可能である点。
・監視対象プロセスそのものに対する実装上の制約や要請がなく、汎用性が高い点。
・プロセス起動停止プロシージャ12さえ修正可能であれば、監視対象プロセス11そのものの改変は不要であるため、既存提供サービスへの影響がなく、移行が容易である点。
・クラウド環境のような動的プロビジョニングが頻繁に行われる変更の多い環境や仮想化されたサーバ環境における監視ソリューションとして特に有効と考えられる点。
最後に、本実施の形態を適用するのに好適なコンピュータのハードウェア構成について説明する。図8は、このようなコンピュータのハードウェア構成の一例を示した図である。図示するように、コンピュータは、演算手段であるCPU(Central Processing Unit)90aと、M/B(マザーボード)チップセット90bを介してCPU90aに接続されたメインメモリ90cと、同じくM/Bチップセット90bを介してCPU90aに接続された表示機構90dとを備える。また、M/Bチップセット90bには、ブリッジ回路90eを介して、ネットワークインターフェイス90fと、磁気ディスク装置(HDD)90gと、音声機構90hと、キーボード/マウス90iと、フレキシブルディスクドライブ90jとが接続されている。
尚、図8において、各構成要素は、バスを介して接続される。例えば、CPU90aとM/Bチップセット90bの間や、M/Bチップセット90bとメインメモリ90cの間は、CPUバスを介して接続される。また、M/Bチップセット90bと表示機構90dとの間は、AGP(Accelerated Graphics Port)を介して接続されてもよいが、表示機構90dがPCI Express対応のビデオカードを含む場合、M/Bチップセット90bとこのビデオカードの間は、PCI Express(PCIe)バスを介して接続される。また、ブリッジ回路90eと接続する場合、ネットワークインターフェイス90fについては、例えば、PCI Expressを用いることができる。また、磁気ディスク装置90gについては、例えば、シリアルATA(AT Attachment)、パラレル転送のATA、PCI(Peripheral Components Interconnect)を用いることができる。更に、キーボード/マウス90i、及び、フレキシブルディスクドライブ90jについては、USB(Universal Serial Bus)を用いることができる。
ここで、本発明は、全てハードウェアで実現してもよいし、全てソフトウェアで実現してもよい。また、ハードウェア及びソフトウェアの両方により実現することも可能である。また、本発明は、コンピュータ、データ処理システム、コンピュータプログラムとして実現することができる。このコンピュータプログラムは、コンピュータにより読取り可能な媒体に記憶され、提供され得る。ここで、媒体としては、電子的、磁気的、光学的、電磁的、赤外線又は半導体システム(装置又は機器)、或いは、伝搬媒体が考えられる。また、コンピュータにより読取り可能な媒体としては、半導体、ソリッドステート記憶装置、磁気テープ、取り外し可能なコンピュータディスケット、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、リジッド磁気ディスク、及び光ディスクが例示される。現時点における光ディスクの例には、コンパクトディスク−リードオンリーメモリ(CD−ROM)、コンパクトディスク−リード/ライト(CD−R/W)及びDVDが含まれる。
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態には限定されない。本発明の精神及び範囲から逸脱することなく様々に変更したり代替態様を採用したりすることが可能なことは、当業者に明らかである。
10…被監視サーバ、11…監視対象プロセス、12…プロセス起動停止プロシージャ、13…OSブートプロシージャ、14,34…監視条件レジストリ、15…監視エージェント、16…稼動状況取得メソッド、17,37…自動実行アクション、18,38…直近稼動状況リスト、30…監視サーバ、31…監視制御部、50…監視コンソール、80…ネットワーク

Claims (10)

  1. 監視装置により監視される複数の被監視装置のうちの1つの被監視装置で当該監視装置による監視の対象である監視対象プロセスを実行する装置であって、
    前記監視対象プロセスを起動するプロセス起動部と、
    前記プロセス起動部により前記監視対象プロセスが起動された後に、当該監視対象プロセスの監視において参照される当該監視に関する動作の内容を示す情報であって前記1つの被監視装置側で設定された情報である監視設定情報を、前記複数の被監視装置に共通の形式で登録する登録部と、
    前記監視対象プロセスを停止するプロセス停止部と、
    前記プロセス停止部により前記監視対象プロセスが停止されるのに先立ち、前記登録部により登録された前記監視設定情報を削除する削除部と
    を含む、装置。
  2. 前記監視設定情報は、前記監視対象プロセスの稼動状況を取得するために用いる情報を含む、請求項1の装置。
  3. 前記監視設定情報は、前記監視対象プロセスの稼動状況に異常を検知した場合に実行すべき動作を示す情報を含む、請求項1又は請求項2の装置。
  4. 前記監視設定情報は、前記監視対象プロセスの稼動状況に異常を検知した場合に通知すべき内容を示す情報を含む、請求項1乃至請求項3の何れかの装置。
  5. 前記登録部は、前記監視装置により制御され前記1つの被監視装置で動作することにより前記監視対象プロセスを監視する監視エージェントにより参照される前記監視設定情報を、当該1つの被監視装置内の記憶部に登録する、請求項1乃至請求項4の何れかの装置。
  6. 前記登録部は、前記監視設定情報を前記監視装置に送信することにより、当該監視設定情報を当該監視装置内の記憶部に登録する、請求項1乃至請求項4の何れかの装置。
  7. 複数の被監視装置を監視する監視装置と、当該複数の被監視装置のうちの1つであって当該監視装置による監視の対象である監視対象プロセスを実行する被監視装置とを含むシステムであって、
    前記被監視装置は、
    前記監視対象プロセスを起動するプロセス起動部と、
    前記プロセス起動部により前記監視対象プロセスが起動された後に、当該監視対象プロセスの監視に関する動作の内容を示す情報であって自装置側で設定された情報である監視設定情報を、前記複数の被監視装置に共通の形式で自装置内の記憶部に登録する登録部と、
    前記監視対象プロセスを停止するプロセス停止部と、
    前記プロセス停止部により前記監視対象プロセスが停止されるのに先立ち、前記監視設定情報を前記記憶部から削除する削除部と、
    前記記憶部に登録された前記監視設定情報を参照することにより前記監視対象プロセスを監視する監視エージェントを実行する監視エージェント実行部と
    を含み、
    前記監視装置は、
    前記監視対象プロセスの監視の指示を受け付ける受付部と、
    前記受付部による前記指示の受け付けに応じて、前記監視エージェント実行部による前記監視エージェントの実行を制御する制御部と、
    前記監視エージェントによる監視の結果を前記監視エージェント実行部から取得する取得部と、
    前記取得部により取得された前記結果を出力する出力部と
    含む、システム。
  8. 複数の被監視装置を監視する監視装置と、当該複数の被監視装置のうちの1つであって当該監視装置による監視の対象である監視対象プロセスを実行する被監視装置とを含むシステムであって、
    前記被監視装置は、
    前記監視対象プロセスを起動するプロセス起動部と、
    前記プロセス起動部により前記監視対象プロセスが起動された後に、当該監視対象プロセスの監視に関する動作の内容を示す情報であって自装置側で設定された情報である監視設定情報の登録の指示を前記監視装置に送信する登録指示送信部と、
    前記監視対象プロセスを停止するプロセス停止部と、
    前記プロセス停止部により前記監視対象プロセスが停止されるのに先立ち、前記登録指示送信部により登録の指示が送信された前記監視設定情報の削除の指示を前記監視装置に送信する削除指示送信部と
    を含み、
    前記監視装置は、
    前記登録指示送信部により送信された前記指示に応じて、前記監視設定情報を、前記複数の被監視装置に共通の形式で自装置内の記憶部に登録する登録部と、
    前記削除指示送信部により送信された前記指示に応じて、前記監視設定情報を前記記憶部から削除する削除部と、
    前記監視対象プロセスの監視の指示を受け付ける受付部と、
    前記受付部による前記指示の受け付けに応じて、前記記憶部に登録された前記監視設定情報を参照することにより前記監視対象プロセスを監視する監視部と、
    前記監視部による監視の結果を出力する出力部と
    含む、システム。
  9. 監視装置により監視される複数の被監視装置のうちの1つの被監視装置で当該監視装置による監視の対象である監視対象プロセスを実行する方法であって、
    前記監視対象プロセスを起動するステップと、
    前記監視対象プロセスが起動された後に、当該監視対象プロセスの監視において参照される当該監視に関する動作の内容を示す情報であって前記1つの被監視装置側で設定された情報である監視設定情報を、前記複数の被監視装置に共通の形式で登録するステップと、
    登録された前記監視設定情報を削除するステップと、
    前記監視設定情報が削除された後に、前記監視対象プロセスを停止するステップと
    を含む、方法。
  10. 監視装置により監視される複数の被監視装置のうちの1つの被監視装置で当該監視装置による監視の対象である監視対象プロセスを実行する装置としてコンピュータを機能させるプログラムであって、
    前記コンピュータを、
    前記監視対象プロセスを起動するプロセス起動部と、
    前記プロセス起動部により前記監視対象プロセスが起動された後に、当該監視対象プロセスの監視において参照される当該監視に関する動作の内容を示す情報であって前記1つの被監視装置側で設定された情報である監視設定情報を、前記複数の被監視装置に共通の形式で登録する登録部と、
    前記監視対象プロセスを停止するプロセス停止部と、
    前記プロセス停止部により前記監視対象プロセスが停止されるのに先立ち、前記登録部により登録された前記監視設定情報を削除する削除部と
    して機能させる、プログラム。
JP2011102129A 2011-04-28 2011-04-28 監視対象プロセスを実行する装置及び方法 Expired - Fee Related JP5579650B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2011102129A JP5579650B2 (ja) 2011-04-28 2011-04-28 監視対象プロセスを実行する装置及び方法
US13/419,971 US8914488B2 (en) 2011-04-28 2012-03-14 Method and system for monitoring a monitoring-target process
US14/513,424 US10068015B2 (en) 2011-04-28 2014-10-14 Monitoring a monitoring-target process

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011102129A JP5579650B2 (ja) 2011-04-28 2011-04-28 監視対象プロセスを実行する装置及び方法

Publications (2)

Publication Number Publication Date
JP2012234336A true JP2012234336A (ja) 2012-11-29
JP5579650B2 JP5579650B2 (ja) 2014-08-27

Family

ID=47068838

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011102129A Expired - Fee Related JP5579650B2 (ja) 2011-04-28 2011-04-28 監視対象プロセスを実行する装置及び方法

Country Status (2)

Country Link
US (2) US8914488B2 (ja)
JP (1) JP5579650B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015148843A (ja) * 2014-02-04 2015-08-20 西日本電信電話株式会社 仮想マシン管理システム、仮想マシン管理方法、環境管理サーバ及びプログラム
JP2017107358A (ja) * 2015-12-09 2017-06-15 セイコーエプソン株式会社 制御装置、制御装置の制御方法、サーバー、及び、ネットワークシステム
JP2018503203A (ja) * 2014-12-16 2018-02-01 エントイット ソフトウェア エルエルシーEntit Software Llc 許容可能なアクティビティルールに基づく許容可能なアクティビティの決定
JP2018097624A (ja) * 2016-12-14 2018-06-21 キャッツ株式会社 機器、管理サーバ、情報収集システム及び情報収集方法

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5579650B2 (ja) 2011-04-28 2014-08-27 インターナショナル・ビジネス・マシーンズ・コーポレーション 監視対象プロセスを実行する装置及び方法
US8606973B1 (en) * 2012-07-05 2013-12-10 International Business Machines Corporation Managing monitored conditions in adaptors in a multi-adaptor system
JP2014048782A (ja) * 2012-08-30 2014-03-17 Fujitsu Ltd 情報処理装置、及び情報処理装置の障害処理方法
US10185582B2 (en) * 2012-11-28 2019-01-22 Red Hat Israel, Ltd. Monitoring the progress of the processes executing in a virtualization environment
CN204889142U (zh) * 2015-09-01 2015-12-23 浙江永强集团股份有限公司 一种太阳能多功能桌
JP7036106B2 (ja) * 2017-02-22 2022-03-15 日本電気株式会社 情報処理装置、情報処理システム、監視方法、及び、プログラム
JP6730235B2 (ja) * 2017-08-31 2020-07-29 株式会社日立製作所 アプリケーション稼働監視装置および監視方法
KR102481797B1 (ko) 2017-11-09 2022-12-28 삼성전자주식회사 서버, 전자장치 및 그의 제어방법
JP7456485B2 (ja) * 2020-02-21 2024-03-27 日本電信電話株式会社 観測効率化装置、観測効率化方法及びプログラム
CN111651323A (zh) * 2020-05-29 2020-09-11 山东中创软件商用中间件股份有限公司 一种应用软件的监控方法、装置及设备
CN112187570A (zh) * 2020-09-15 2021-01-05 中信银行股份有限公司 一种风险侦测方法、装置、电子设备和可读存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05257757A (ja) * 1992-01-31 1993-10-08 Nec Corp 性能情報モニタリング方式
JPH0612288A (ja) * 1992-06-29 1994-01-21 Hitachi Ltd 情報処理システム及びその監視方法
JP2005251048A (ja) * 2004-03-08 2005-09-15 Hitachi Ltd システムモニタリング方法
JP2006344025A (ja) * 2005-06-09 2006-12-21 Hitachi Ltd 稼動性能データ取得方法、性能監視サーバ、業務サーバ、計算機及びコンピューティングシステム
JP2009199213A (ja) * 2008-02-20 2009-09-03 Nec Corp プロセス監視方法、情報処理装置、及びプログラム
JP2009251890A (ja) * 2008-04-04 2009-10-29 Nec Corp サーバ監視システム及びサーバ監視方法
JP2010211319A (ja) * 2009-03-06 2010-09-24 Ntt Facilities Inc 監視システム、マネージャ装置、エージェント装置、マネージャプログラム、エージェントプログラムおよび監視方法

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1131136A (ja) 1997-07-11 1999-02-02 Meidensha Corp 分散処理システムの異常監視方式
JP3494562B2 (ja) * 1997-10-15 2004-02-09 株式会社東芝 ネットワーク管理システム
US7688952B2 (en) * 1997-11-03 2010-03-30 Light Elliott D System and method for obtaining equipment status data over a network
JP2001117789A (ja) 1999-10-22 2001-04-27 Hitachi Ltd プログラム稼動監視方法
US6983317B1 (en) * 2000-02-28 2006-01-03 Microsoft Corporation Enterprise management system
US6877107B2 (en) * 2001-07-05 2005-04-05 Softwired Ag Method for ensuring operation during node failures and network partitions in a clustered message passing server
JP2003070081A (ja) 2001-08-29 2003-03-07 Yokogawa Electric Corp 監視システム
JP4039195B2 (ja) * 2001-12-27 2008-01-30 富士ゼロックス株式会社 ネットワークシステム
JP2005099976A (ja) 2003-09-24 2005-04-14 Hitachi Ltd 構成・性能情報取得方法
JP4363166B2 (ja) * 2003-11-20 2009-11-11 日本電気株式会社 コミュニケーションサービス提供システム、サーバ、サービス提供方法およびサービス提供プログラム
US7493344B2 (en) * 2005-04-01 2009-02-17 Schlumberger Technology Corporation Method and system for dynamic data merge in databases
JP4570527B2 (ja) * 2005-07-20 2010-10-27 富士通株式会社 システム性能監視プログラム及びシステム性能監視方法
JP4600324B2 (ja) 2006-03-17 2010-12-15 日本電気株式会社 ポリシー管理システム、ポリシーマネージャ、ポリシーエージェント、ルール生成方法及びプログラム
US8146100B2 (en) * 2006-03-21 2012-03-27 Sap Ag System and method for event-based information flow in software development processes
US7805510B2 (en) * 2006-05-11 2010-09-28 Computer Associates Think, Inc. Hierarchy for characterizing interactions with an application
JP4896593B2 (ja) 2006-06-05 2012-03-14 株式会社日立製作所 性能監視方法、計算機及び計算機システム
WO2008105028A1 (ja) * 2007-02-28 2008-09-04 Sony Computer Entertainment Inc. 分散処理方法、分散処理システム、サーバ、そのプログラム、コンピュータおよびそのプログラム
JP2008217464A (ja) 2007-03-05 2008-09-18 Oki Electric Ind Co Ltd 自動取引システム
JP2009282601A (ja) 2008-05-20 2009-12-03 Nec System Technologies Ltd 動作監視プログラム、監視システム、および、監視方法
JP5418051B2 (ja) * 2008-09-08 2014-02-19 株式会社リコー ワークフロー管理システム
JP5157778B2 (ja) * 2008-09-18 2013-03-06 富士通株式会社 監視装置、監視方法及びコンピュータプログラム
JP4966942B2 (ja) * 2008-10-01 2012-07-04 株式会社日立製作所 仮想pc管理方法、仮想pc管理システム、および仮想pc管理プログラム
JP2010278936A (ja) 2009-06-01 2010-12-09 Fujitsu Ltd ネットワーク監視方法および装置
JP5579650B2 (ja) 2011-04-28 2014-08-27 インターナショナル・ビジネス・マシーンズ・コーポレーション 監視対象プロセスを実行する装置及び方法
US9560091B2 (en) * 2012-09-17 2017-01-31 Accenture Global Services Limited Action oriented social collaboration system

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05257757A (ja) * 1992-01-31 1993-10-08 Nec Corp 性能情報モニタリング方式
JPH0612288A (ja) * 1992-06-29 1994-01-21 Hitachi Ltd 情報処理システム及びその監視方法
JP2005251048A (ja) * 2004-03-08 2005-09-15 Hitachi Ltd システムモニタリング方法
JP2006344025A (ja) * 2005-06-09 2006-12-21 Hitachi Ltd 稼動性能データ取得方法、性能監視サーバ、業務サーバ、計算機及びコンピューティングシステム
JP2009199213A (ja) * 2008-02-20 2009-09-03 Nec Corp プロセス監視方法、情報処理装置、及びプログラム
JP2009251890A (ja) * 2008-04-04 2009-10-29 Nec Corp サーバ監視システム及びサーバ監視方法
JP2010211319A (ja) * 2009-03-06 2010-09-24 Ntt Facilities Inc 監視システム、マネージャ装置、エージェント装置、マネージャプログラム、エージェントプログラムおよび監視方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015148843A (ja) * 2014-02-04 2015-08-20 西日本電信電話株式会社 仮想マシン管理システム、仮想マシン管理方法、環境管理サーバ及びプログラム
JP2018503203A (ja) * 2014-12-16 2018-02-01 エントイット ソフトウェア エルエルシーEntit Software Llc 許容可能なアクティビティルールに基づく許容可能なアクティビティの決定
US10318728B2 (en) 2014-12-16 2019-06-11 Entit Software Llc Determining permissible activity based on permissible activity rules
JP2017107358A (ja) * 2015-12-09 2017-06-15 セイコーエプソン株式会社 制御装置、制御装置の制御方法、サーバー、及び、ネットワークシステム
JP2018097624A (ja) * 2016-12-14 2018-06-21 キャッツ株式会社 機器、管理サーバ、情報収集システム及び情報収集方法

Also Published As

Publication number Publication date
US20150032773A1 (en) 2015-01-29
US10068015B2 (en) 2018-09-04
US20120278478A1 (en) 2012-11-01
JP5579650B2 (ja) 2014-08-27
US8914488B2 (en) 2014-12-16

Similar Documents

Publication Publication Date Title
JP5579650B2 (ja) 監視対象プロセスを実行する装置及び方法
US10838905B2 (en) Managing a peripheral component interface express device hotplug
US10140115B2 (en) Applying update to snapshots of virtual machine
US9489230B1 (en) Handling of virtual machine migration while performing clustering operations
JP4887150B2 (ja) コプロセッサを監視及びリセットするための方法及び装置
US7856639B2 (en) Monitoring and controlling applications executing in a computing node
US11157373B2 (en) Prioritized transfer of failure event log data
EP2518627B1 (en) Partial fault processing method in computer system
US20130305084A1 (en) Server control automation
US8266301B2 (en) Deployment of asynchronous agentless agent functionality in clustered environments
WO2018095107A1 (zh) 一种bios程序的异常处理方法及装置
US20110209148A1 (en) Information processing device, virtual machine connection method, program, and recording medium
US11768672B1 (en) Systems and methods for user-controlled deployment of software updates
WO2016000298A1 (zh) 一种系统异常的捕获方法、主系统、影子系统及智能设备
US7392149B2 (en) Automatic software testing
US9032014B2 (en) Diagnostics agents for managed computing solutions hosted in adaptive environments
US10817400B2 (en) Management apparatus and management method
US20160266951A1 (en) Diagnostic collector for hadoop
JP2019168845A (ja) 情報処理装置とその制御方法
CN107851033B (zh) 减轻远程存储装置的间歇不可用性对虚拟机的影响
JP2021064414A (ja) システム
US20210004316A1 (en) Information processing device, information processing method, and computer readable medium
JP2021043855A (ja) 監視システム、監視SaaS提供装置、管理装置、及びプログラム
JP2006268277A (ja) アプリケーションプログラムの復旧方式
JP2008503132A (ja) アプリケーション管理用システム及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140110

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140528

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140624

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20140624

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140709

R150 Certificate of patent or registration of utility model

Ref document number: 5579650

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees