JP2009230522A - System monitoring device and program - Google Patents
System monitoring device and program Download PDFInfo
- Publication number
- JP2009230522A JP2009230522A JP2008076016A JP2008076016A JP2009230522A JP 2009230522 A JP2009230522 A JP 2009230522A JP 2008076016 A JP2008076016 A JP 2008076016A JP 2008076016 A JP2008076016 A JP 2008076016A JP 2009230522 A JP2009230522 A JP 2009230522A
- Authority
- JP
- Japan
- Prior art keywords
- monitoring
- diagnostic
- failure
- analysis
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
Description
本発明は、システム監視装置およびプログラムに関し、特に、コンピュータシステムの状態を監視するシステム監視装置およびプログラムに関する。 The present invention relates to a system monitoring apparatus and program, and more particularly, to a system monitoring apparatus and program for monitoring the state of a computer system.
従来、例えばサーバ装置など、通信回線を通じて接続されたコンピュータシステム(以下、監視対象システムとも称する。)の状態を監視するシステム監視装置(以下、監視装置とも称する。)が知られている。 2. Description of the Related Art Conventionally, a system monitoring device (hereinafter also referred to as a monitoring device) that monitors the state of a computer system (hereinafter also referred to as a monitoring target system) connected via a communication line, such as a server device, is known.
従来の監視装置は、例えば、監視対象システム上で定期的に動作する障害検知プログラムが監視対象システムの障害を検知した場合に、障害の発生を示す障害情報を監視対象システムから受信する。そして、監視装置は、監視装置上で動作する監視プログラムにより、監視装置のモニタ、警報ランプなどの通知手段を介して障害情報を通知する。 For example, when a failure detection program that periodically operates on a monitoring target system detects a failure of the monitoring target system, the conventional monitoring device receives failure information indicating the occurrence of the failure from the monitoring target system. Then, the monitoring device notifies the failure information through a notification unit such as a monitor of the monitoring device or an alarm lamp by a monitoring program operating on the monitoring device.
また、従来の他の監視装置は、監視装置上で動作する監視プログラムにより、例えば、監視対象システムに定期的に死活確認要求を送信する。そして、監視装置は、監視対象システムからの応答状況が異常となった場合に、監視対象システムに障害が発生したものとみなし、通知手段を介して障害情報を通知する。 In addition, another conventional monitoring apparatus periodically transmits a life / death confirmation request to, for example, a monitoring target system by a monitoring program operating on the monitoring apparatus. Then, when the response status from the monitored system becomes abnormal, the monitoring device regards that the failure has occurred in the monitored system, and notifies the failure information via the notification means.
しかしながら、従来の監視装置は、監視対象システム上で動作する障害検知プログラムに設定された所定の監視項目のみに関して、障害の発生を検知するものである。ここで、障害検知プログラムに設定される監視項目は、一般に、監視対象システムのシステム構成などに応じて異なる。 However, the conventional monitoring device detects the occurrence of a failure only with respect to a predetermined monitoring item set in a failure detection program that operates on the monitored system. Here, the monitoring items set in the failure detection program generally differ depending on the system configuration of the monitoring target system.
このため、多数の監視対象システムを管理する際には、監視項目の設定作業が煩雑となり、また、設定ミスが生じてしまう場合があった。また、監視項目の更新に際しても、監視対象システム毎に設定が必要となるので、監視項目の更新作業が煩雑となる場合があった。このため、システム監視の効率性を向上することができないという問題があった。 For this reason, when managing a large number of monitoring target systems, the setting work of monitoring items becomes complicated, and a setting error may occur. Also, when updating the monitoring item, since setting is required for each monitoring target system, the monitoring item updating operation may be complicated. For this reason, there was a problem that the efficiency of system monitoring could not be improved.
さらに、監視項目毎の単純な条件判断に基づいて障害の発生を検知するので、特定または不特定の監視対象システムに関する障害履歴などを用いて、効率的なシステム監視を実現することができないという問題があった。 Furthermore, since the occurrence of a failure is detected based on simple condition judgment for each monitoring item, there is a problem that efficient system monitoring cannot be realized by using a failure history related to a specific or unspecified monitored system. was there.
本発明は上記問題点に鑑みてなされたものであり、その目的は、システム監視の効率性を向上可能な、新規かつ改良された、システム監視装置およびプログラムを提供することにある。 The present invention has been made in view of the above problems, and an object thereof is to provide a new and improved system monitoring apparatus and program capable of improving the efficiency of system monitoring.
上記課題を解決するために、本発明の第1の観点によれば、コンピュータシステムの状態を監視するシステム監視装置において、コンピュータシステムから解析対象データを定期的に取得するデータ取得部と、所定の監視項目に基づいて解析対象データを解析する解析処理部と、解析処理の結果および所定の診断基準に基づいてコンピュータシステムの状態を診断する診断処理部と、診断処理の結果に基づいてコンピュータシステムの状態に障害が確認された場合に、障害の発生を示す障害情報を通知する障害情報通知部と、を備えたシステム監視装置が提供される。 In order to solve the above-described problem, according to a first aspect of the present invention, in a system monitoring apparatus that monitors the state of a computer system, a data acquisition unit that periodically acquires analysis target data from the computer system; An analysis processing unit for analyzing data to be analyzed based on monitoring items, a diagnosis processing unit for diagnosing the state of the computer system based on the results of the analysis processing and predetermined diagnostic criteria, and a computer system based on the results of the diagnostic processing There is provided a system monitoring apparatus including a failure information notification unit that notifies failure information indicating the occurrence of a failure when a failure is confirmed in the state.
かかる構成によれば、システム監視装置(以下、監視装置とも称する。)が所定の監視項目に基づいて解析対象データを解析し、コンピュータシステム(以下、監視対象システムとも称する。)の状態を診断して障害情報を通知するので、監視対象システム毎に監視項目を設定する必要がない。これにより、多数の監視対象システムを管理する際でも、監視項目の設定作業を効率的に行うことができ、設定ミスの発生を容易に防止することができる。 According to this configuration, the system monitoring device (hereinafter also referred to as a monitoring device) analyzes the analysis target data based on a predetermined monitoring item, and diagnoses the state of the computer system (hereinafter also referred to as the monitoring target system). Therefore, it is not necessary to set monitoring items for each monitored system. Thereby, even when managing a large number of monitoring target systems, the setting work of monitoring items can be performed efficiently, and the occurrence of setting errors can be easily prevented.
また、上記所定の診断基準を記憶する診断基準記憶部をさらに備えてもよい。これにより、監視装置は、診断基準記憶部に記憶されている所定の診断基準に基づいて監視対象システムの状態を診断するので、特定または不特定の監視対象システムに関する障害履歴などを診断基準記憶部に記憶することで、効率的なシステム監視を実現することができる。 Moreover, you may further provide the diagnostic reference | standard memory | storage part which memorize | stores the said predetermined diagnostic reference | standard. As a result, the monitoring device diagnoses the state of the monitored system based on the predetermined diagnostic criteria stored in the diagnostic criteria storage unit. By storing them in the system, efficient system monitoring can be realized.
また、上記所定の監視項目を更新するための監視項目更新部をさらに備えてもよい。これにより、監視装置は、所定の監視項目を更新可能であるので、監視対象システム毎に監視項目を更新する必要がなく、監視項目の更新作業を効率的に行うことができる。 Moreover, you may further provide the monitoring item update part for updating the said predetermined monitoring item. Thereby, since the monitoring apparatus can update a predetermined monitoring item, it is not necessary to update the monitoring item for each monitoring target system, and the updating operation of the monitoring item can be performed efficiently.
また、上記診断基準記憶部に記憶されている所定の診断基準を更新するための診断基準更新部をさらに備えてもよい。これにより、監視装置は、所定の診断基準を更新可能であるので、更新された診断基準に基づいて監視対象システムの状態を診断することで、さらに効率的なシステム監視を実現することができる。 Further, a diagnostic standard update unit for updating a predetermined diagnostic standard stored in the diagnostic standard storage unit may be further provided. Thereby, since the monitoring apparatus can update a predetermined diagnostic criterion, more efficient system monitoring can be realized by diagnosing the state of the monitoring target system based on the updated diagnostic criterion.
上記課題を解決するために、本発明の第2の観点によれば、前述した第1の観点に係る監視装置としてコンピュータを機能させるためのプログラムが提供される。 In order to solve the above problems, according to a second aspect of the present invention, there is provided a program for causing a computer to function as the monitoring apparatus according to the first aspect described above.
本発明によれば、システム監視の効率性を向上可能な、システム監視装置およびプログラムを提供することができる。 ADVANTAGE OF THE INVENTION According to this invention, the system monitoring apparatus and program which can improve the efficiency of system monitoring can be provided.
以下に、添付した図面を参照しながら、本発明の好適な実施形態について詳細に説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。 Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. In the present specification and drawings, components having substantially the same functional configuration are denoted by the same reference numerals, and redundant description is omitted.
図1は、本発明の一実施形態に係る監視装置を含む監視システムの全体構成を示す説明図である。図1に示すように、監視システムは、監視装置100と、監視装置100に通信回線20を通じて接続された少なくとも1つの監視対象システム10a、10b、10c(以下、監視対象システム10として総称する。)とを含む。
FIG. 1 is an explanatory diagram showing the overall configuration of a monitoring system including a monitoring device according to an embodiment of the present invention. As shown in FIG. 1, the monitoring system includes a
監視装置100は、解析機能を有する監視用のコンピュータシステムであり、監視対象システム10は、各種のシステム構成を有する、例えばサーバ装置などのコンピュータシステムである。
The
監視装置100は、監視対象システム10から解析対象データを定期的に取得し、所定の監視項目に基づいて解析対象データを解析し、解析処理の結果および所定の診断基準に基づいて監視対象システム10の状態を診断し、必要に応じて障害情報を通知する。
The
監視装置100は、監視対象システム10上で動作するデータ取得プログラムから、スケジューリング機能などを利用して定期的に解析対象データを取得する。ここで、解析対象データとは、監視対象システム10の構成情報、設定情報、ログ情報、コマンド出力情報など、監視対象システム10の構成および動作状況などを診断するために用いられる情報である。解析対象データは、必要に応じて、監視対象システム10のオペレーティングシステム(OS)および解析対象データのデータ形式に関する情報を含む。解析対象データは、データファイルとして一括または複数のブロック単位で取得される。
The
(監視装置100の構成)
以下では、図2〜図4を参照しながら監視装置100の構成について説明する。図2は、監視装置100の構成を示す説明図である。監視装置100は、データ取得部102、監視項目記憶部104、監視項目更新部106、解析処理部108、診断基準記憶部110、診断基準更新部112、診断処理部114、障害情報通知部116、入出力部118、記憶部120、および制御部122を含む。以下では、監視装置100の各構成要素について説明する。
(Configuration of the monitoring device 100)
Below, the structure of the
(データ取得部102)
データ取得部102は、監視対象システム10から通信回線20を通じて解析対象データを定期的に取得する。取得された解析対象データは、記憶部120に一時的に記憶され、解析処理に際して解析処理部108に出力される。
(Data acquisition unit 102)
The
図3は、解析対象データの一例を示す説明図である。図3に示す解析対象データは、監視対象システム10のディスク状態およびリソース状態などを表示するためのコマンド出力結果152である。コマンド出力結果152は、「ディスク基本情報」(製造元、製造番号、記憶容量、動作状態)、「ソフトウェアミラー情報」(ミラー元ディスク、ミラー先ディスク、同期状態)、「リソース使用状況」(メモリ使用率、CPU使用率)などを示す文字列形式の情報である。
FIG. 3 is an explanatory diagram illustrating an example of analysis target data. The analysis target data shown in FIG. 3 is a
(監視項目記憶部104)
監視項目記憶部104は、解析処理の対象となる所定の監視項目を記憶し、解析処理に際して解析処理部108に提供する。監視項目記憶部104は、複数のOSに適合する監視項目を記憶し、監視対象システム10のOSに応じて、適切な監視項目を解析処理部108に提供してもよい。
(Monitoring item storage unit 104)
The monitoring
なお、監視項目は、例えば、論理ディスク情報、ネットワーク情報、クラスタ情報、外部ストレージ情報、OS構成情報、プロセス情報、メモリ情報、時刻同期の状態、ファイルシステム情報、バックアップ情報などの情報を大項目として含む。そして、例えば、論理ディスク情報に関しては、ボリューム名、使用量、ミラーの数/状態などの情報を小項目として含む。 The monitoring items include, for example, information such as logical disk information, network information, cluster information, external storage information, OS configuration information, process information, memory information, time synchronization status, file system information, and backup information as major items. Including. For example, regarding the logical disk information, information such as a volume name, a usage amount, and the number / status of mirrors is included as small items.
(監視項目更新部106)
監視項目更新部106は、監視項目の更新情報を取得し、更新情報に基づいて監視項目記憶部104に記憶されている監視項目を更新する。更新情報は、監視装置100の運用者により更新されてもよく、通信回線20を通じて接続された更新サーバなどにより自動更新されてもよい。更新情報は、更新情報の適用対象となるOSのOS情報に関する情報を含んでもよい。
(Monitoring item update unit 106)
The monitoring
(解析処理部108)
解析処理部108は、所定の監視項目に基づいて解析対象データを解析する。図3に示すように、解析対象データは、システムユーザには理解可能であるが、監視装置100には直接的に理解不能であり、または理解困難な形式の情報を含んでいる。このため、解析処理部108は、解析対象データを解析し、診断処理に利用可能な情報を監視項目記憶部104から提供される監視項目に基づいて、解析対象データから抽出する。抽出された情報は、解析処理の結果として診断処理部114に出力される。
(Analysis processing unit 108)
The
解析処理部108は、例えば、図3に示す解析対象データから、監視項目「ソフトウェアミラー情報」に関して、「ミラー元ディスク:A」、「ミラー先ディスク:B」および「同期状態:同期失敗」という情報を抽出し、解析処理の結果として診断処理部114に出力する。また、監視項目「リソース使用状況」に関して、「メモリ使用率:90%」および「CPU使用率:95%」という情報を抽出し、解析処理の結果として診断処理部114に出力する。
For example, the
解析処理部108は、複数のOSおよび/またはデータ形式に適合する解析処理ルーチンを有し、解析対象システムのOSおよび/または解析対象データのデータ形式に応じて、適切な解析処理ルーチンを選択してもよい。
The
(診断基準記憶部110)
診断基準記憶部110は、診断処理に用いられる所定の診断基準を記憶するナレッジデータベースとして機能する。診断基準は、解析処理の結果に基づいて、監視対象システム10の構成および動作状況などを診断する際に、診断の基準として用いられる情報である。診断基準記憶部110は、新たに採用された診断基準を蓄積するとともに、診断基準更新部112により最新の診断基準を記憶するように更新されている。
(Diagnostic criteria storage unit 110)
The diagnostic
診断基準は、例えば、システムの状態を判定するために参照可能な定性的な情報(例えば、コマンド出力結果中の「正常」、「異常」などの出力結果)、定量的な情報(例えば、所定のパラメータの閾値など)などを含む。診断基準は、例えば、監視システムの適用対象となる各種監視対象システム10のシステム仕様、各種コマンド出力結果の様式、特定または不特定の監視対象システム10に関する障害履歴などに基づいて作成される。特に、診断基準としての障害履歴をシステム障害の予測、システム障害の発生予防に利用することで、効率的なシステム監視を実現することができる。 The diagnostic criteria are, for example, qualitative information (for example, output results such as “normal” and “abnormal” in the command output result) that can be referred to in order to determine the state of the system, and quantitative information (for example, predetermined Parameter thresholds, etc.). The diagnostic criteria are created based on, for example, system specifications of various monitoring target systems 10 to which the monitoring system is applied, various command output result formats, failure histories related to specific or non-specific monitoring target systems 10, and the like. In particular, efficient system monitoring can be realized by using a failure history as a diagnostic criterion for prediction of system failure and prevention of occurrence of system failure.
(診断基準更新部112)
診断基準更新部112は、診断基準の更新情報を取得し、更新情報に基づいて診断基準記憶部110に記憶されている所定の診断基準を更新する。更新情報は、監視項目更新部106と同様に、監視装置100の運用者により更新されてもよく、通信回線20を通じて接続された更新サーバなどにより自動更新されてもよい。更新情報は、更新情報の適用対象となるOSのOS情報、解析対象データの形式に関する情報を含んでもよい。
(Diagnostic criteria update unit 112)
The diagnostic
(診断処理部114)
診断処理部114は、解析処理の結果および所定の診断基準に基づいて監視対象システム10の構成および動作状況など、監視対象システム10の状態を診断する。診断処理に用いられる所定の診断基準は、診断基準記憶部110に記憶されており、診断処理に際して診断基準記憶部110に提供される。診断処理部114は、監視対象システム10の状態を診断し、診断処理の結果を障害情報通知部116に通知する。
(Diagnosis processing unit 114)
The
診断処理部114は、例えば、監視項目「ソフトウェアミラー情報」に関する解析処理の結果に基づいて、ディスクAとディスクBとの間でミラー同期が取られていない旨を診断し、診断処理の結果として障害情報通知部116に出力する。また、診断処理部114は、監視項目「リソース使用状況」に関する解析処理の結果に基づいて、メモリ使用率およびCPU使用率が所定の閾値を超えていることから、使用可能なメモリが不足している旨、および、システム暴走の危険性がある旨を診断し、診断処理の結果として障害情報通知部116に出力する。
For example, the
診断基準記憶部110は、解析処理部108と同様に、複数のOSおよび/またはデータ形式に適合する診断基準を有し、解析対象システムのOSおよび/または解析対象データのデータ形式に応じて、適切な診断基準を診断処理部114に提供してもよい。
Similar to the
診断処理部114は、診断処理の結果として、システム障害の障害レベル、放置時に発生しうる現象、対処方法などの診断レポートを作成し、障害情報の一部として障害情報通知部116に出力してもよい。障害レベルは、例えば、「正常」、「注意(診断処理の結果に基づいて対応要否の判断を要する状態)」、「警告(即時対応を要する状態)」など、システム障害の重要度を示す情報である。放置時に発生しうる現象は、システム障害を放置していた場合の影響を示す情報である。対処方法は、対処可能なアクションアイテムの情報である。
As a result of the diagnosis processing, the
(障害情報通知部116)
障害情報通知部116は、診断処理の結果に基づいて監視対象システム10の状態を確認し、障害が確認された場合には、障害状態を示す障害情報を通知する。障害情報は、監視装置100のモニタ、プリンタ、監視装置100に接続された操作端末、または監視パネルなどに出力される。
(Failure information notification unit 116)
The failure
図4は、障害情報の一例を示す説明図である。図4に示す障害情報154は、ソフトウェアミラーの同期障害を通知するものであり、診断レポートを含んでいる。障害情報154は、診断処理の結果、および診断レポートに含まれる、(1)障害レベル、(2)放置時に発生しうる現象、(3)対処方法の項目からなる。
FIG. 4 is an explanatory diagram illustrating an example of failure information. The
図4によれば、診断処理の結果として、ミラーの同期障害が発生している旨が通知されている。また、(1)障害レベルとして、システム障害の重要度が高いと診断され、「警告」レベルが通知されている。(2)放置時に発生しうる現象として、正常なディスクが故障した場合にOS起動が正常に行われなくなる虞がある旨が通知されている。(3)対処方法として、ディスクの交換、ミラーを再同期するためのコマンドの実行が通知されている。 According to FIG. 4, as a result of the diagnostic processing, it is notified that a mirror synchronization failure has occurred. Further, (1) as the failure level, it is diagnosed that the importance of the system failure is high, and the “warning” level is notified. (2) As a phenomenon that may occur when left unattended, there is a notice that there is a possibility that the OS startup may not be performed normally when a normal disk fails. (3) As a coping method, the exchange of the disk and the execution of the command for resynchronizing the mirror are notified.
(その他の構成要素)
入出力部118は、キーボード、モニタ、プリンタなどの入出力デバイスによる入出力処理などを実現する。記憶部120は、解析対象データ、解析処理の結果、診断処理の結果、監視装置100の動作に必要となる各種情報などを記憶する。制御部122は、前述した他の構成要素を制御することで、監視装置100全体の動作を制御する。
(Other components)
The input /
以上、監視装置100の構成について説明した。なお、データ取得部102、監視項目更新部106、解析処理部108、診断基準更新部112、診断処理部114、障害情報通知部116、および制御部122の各構成要素は、各構成要素の機能を実行するソフトウェアプログラムを記憶部120にインストールして実現されてもよく、専用のハードウェアにより実現されてもよい。また、ソフトウェアプログラムは、コンピュータ読取可能な記憶媒体に記憶され、必要に応じて読出されて実行されてもよく、通信回線20を通じて提供されてもよい。また、監視項目記憶部104、診断基準記憶部110、および記憶部120は、例えば、半導体メモリ、光ディスク、磁気ディスクなどの各種記憶媒体として構成されてもよい。
The configuration of the
(監視装置100の動作)
以下では、図5を参照しながら、監視装置100の動作について説明する。図5は、監視装置100の動作方法を示すフロー図である。
(Operation of the monitoring device 100)
Hereinafter, the operation of the
監視項目更新部106は、監視項目の更新情報を取得したか否かを判定し(ステップS102)、更新情報を取得した場合には、監視項目記憶部104に記憶されている監視項目を更新する(S104)。ここで、監視項目の更新情報は、更新情報の適用対象となるOSのOS情報に関する情報などを含んでもよい。これにより、監視装置100の側で所定の監視項目を更新可能であるので、監視対象システム10毎に監視項目を更新する必要がなく、監視項目の更新作業を効率的に行うことができる。
The monitoring
診断基準更新部112は、診断基準の更新情報を取得したか否かを判定し(S106)、更新情報を取得した場合には、診断基準記憶部110に記憶されている診断基準を更新する(S108)。ここで、診断基準の更新情報は、更新情報の適用対象となるOSのOS情報、解析対象データの形式に関する情報などを含んでもよい。これにより、監視装置100の側で所定の診断基準を更新可能であるので、更新された診断基準に基づいて監視対象システム10の状態を診断することで、効率的なシステム監視を実現することができる。
The diagnostic
制御部122は、監視対象システム10からの解析対象データの受信の有無を確認する(S110)。制御部122は、解析対象データの受信が確認された場合には、S112以降の処理を実行し、確認されない場合には、確認処理を継続する。
The
データ取得部102は、監視対象システム10上で動作するデータ取得プログラムから解析対象データを定期的に取得する(S112)。解析対象データは、監視対象システム10の識別情報、OS情報、解析対象データのデータ形式に関する情報などを含んでもよい。
The
データ取得部102は、解析対象データを解析処理部108に出力する(S114)。ここで、データ取得部102は、解析対象データを記憶部120に一時的に記憶してもよい。特に、解析対象データをブロック単位で取得する場合には、データ取得部102は、解析処理の実行に必要となる全ての解析対象データを取得するまで、解析対象データを記憶部120に一時的に記憶する。
The
解析処理部108は、監視項目記憶部104に記憶されている所定の監視項目を参照する(S116)。ここで、解析処理部108は、監視対象システム10のOS情報および/または解析対象データのデータ形式に適合する監視項目を参照してもよい。
The
解析処理部108は、監視項目に基づいて解析対象データを解析する(S118)。ここで、解析処理に先立って、解析処理部108は、監視対象システム10のOS情報および/または解析対象データのデータ形式に適合する解析処理ルーチンを選択してもよい。
The
解析処理部108は、解析処理の結果を診断処理部114に出力する(S120)。ここで、解析処理部108は、解析処理の結果を記憶部120に一時的に記憶してもよい。
The
診断処理部114は、診断基準記憶部110に記憶されている所定の診断基準を参照する(S122)。ここで、診断処理部114は、監視対象システム10のOS情報および/または解析対象データのデータ形式に適合する診断基準を参照してもよい。これにより、診断基準記憶部110に記憶されている所定の診断基準に基づいて監視対象システム10の状態を診断するので、特定または不特定の監視対象システム10に関する障害履歴などを診断基準記憶部110に記憶することで、効率的なシステム監視を実現することができる。
The
診断処理部114は、解析処理の結果および所定の診断基準に基づいて監視対象システム10の状態を診断する(S124)。ここで、診断処理部114は、診断処理の結果として、診断レポートを作成してもよい。
The
診断処理部114は、診断処理の結果を障害情報通知部116に出力する(S126)。ここで、診断処理部114は、診断レポートを診断処理の結果の一部として障害情報通知部116に出力してもよい。また、診断処理部114は、診断処理の結果を記憶部120に一時的に記憶してもよい。
The
障害情報通知部116は、診断処理の結果に基づいて監視対象システム10の状態に障害が確認されたか否かを判定し(S128)、確認された場合には、システム障害の発生を示す障害情報を通知し(S130)、確認されなかった場合には、処理S102に復帰する。
The failure
以上説明したように、本実施形態に係る監視装置100によれば、監視装置100が所定の監視項目に基づいて解析対象データを解析し、監視対象システム10の状態を診断して障害情報を通知するので、監視対象システム10毎に監視項目を設定する必要がない。これにより、多数の監視対象システム10を管理する際でも、監視項目の設定作業を効率的に行うことができ、設定ミスの発生を容易に防止することができる。よって、本実施形態に係る監視装置100によれば、システム監視の効率性を向上させることができる。
As described above, according to the
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明は係る例に限定されない。当業者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。 As mentioned above, although preferred embodiment of this invention was described referring an accompanying drawing, this invention is not limited to the example which concerns. It is obvious for those skilled in the art that various changes or modifications can be conceived within the scope of the technical idea described in the claims. It is understood that it belongs to.
例えば、上記実施形態の説明では、監視装置100が診断基準記憶部110を備え、診断基準記憶部110に記憶されている所定の診断基準に基づいて、診断処理部114が診断処理を行う場合について説明した。しかし、本実施形態は、監視装置100が診断基準記憶部110を備えない場合についても適用可能であり、この場合、監視装置100は、記憶部120に記憶されている所定の診断基準に基づいて診断処理を行うことができる。
For example, in the description of the above embodiment, the
10 監視対象システム
100 システム監視装置
102 データ取得部
108 解析処理部
114 診断処理部
116 障害情報通知部
110 診断基準記憶部
104 監視項目更新部
112 診断基準更新部
DESCRIPTION OF SYMBOLS 10
Claims (5)
前記コンピュータシステムから解析対象データを定期的に取得するデータ取得部と、
所定の監視項目に基づいて前記解析対象データを解析する解析処理部と、
解析処理の結果および所定の診断基準に基づいて前記コンピュータシステムの状態を診断する診断処理部と、
診断処理の結果に基づいて前記コンピュータシステムの状態に障害が確認された場合に、障害の発生を示す障害情報を通知する障害情報通知部と、
を備えたシステム監視装置。 In a system monitoring device for monitoring the state of a computer system,
A data acquisition unit for periodically acquiring data to be analyzed from the computer system;
An analysis processing unit that analyzes the analysis target data based on a predetermined monitoring item;
A diagnostic processing unit for diagnosing the state of the computer system based on the result of analysis processing and a predetermined diagnostic criterion;
A failure information notification unit for notifying failure information indicating the occurrence of a failure when a failure is confirmed in the state of the computer system based on a result of diagnostic processing;
System monitoring device with
前記コンピュータシステムから解析対象データを定期的に取得するデータ取得手段、
所定の監視項目に基づいて前記解析対象データを解析する解析処理手段、
解析処理の結果および所定の診断基準に基づいて前記コンピュータシステムの状態を診断する診断処理手段、
診断処理の結果に基づいて前記コンピュータシステムの状態に障害が確認された場合に、障害の発生を示す障害情報を通知する障害情報通知手段、
として機能させるためのプログラム。 In a program applied to a system monitoring apparatus for monitoring the state of a computer system,
Data acquisition means for periodically acquiring data to be analyzed from the computer system;
Analysis processing means for analyzing the analysis object data based on a predetermined monitoring item;
Diagnostic processing means for diagnosing the state of the computer system based on the result of analysis processing and a predetermined diagnostic criterion;
Failure information notifying means for notifying failure information indicating the occurrence of a failure when a failure is confirmed in the state of the computer system based on a result of diagnostic processing;
Program to function as.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008076016A JP2009230522A (en) | 2008-03-24 | 2008-03-24 | System monitoring device and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008076016A JP2009230522A (en) | 2008-03-24 | 2008-03-24 | System monitoring device and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009230522A true JP2009230522A (en) | 2009-10-08 |
Family
ID=41245825
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008076016A Withdrawn JP2009230522A (en) | 2008-03-24 | 2008-03-24 | System monitoring device and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009230522A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012023171A1 (en) * | 2010-08-16 | 2012-02-23 | 富士通株式会社 | Information processing apparatus, remote maintenance method, and program |
-
2008
- 2008-03-24 JP JP2008076016A patent/JP2009230522A/en not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012023171A1 (en) * | 2010-08-16 | 2012-02-23 | 富士通株式会社 | Information processing apparatus, remote maintenance method, and program |
JP5354107B2 (en) * | 2010-08-16 | 2013-11-27 | 富士通株式会社 | Information processing apparatus, remote maintenance method, and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8799709B2 (en) | Snapshot management method, snapshot management apparatus, and computer-readable, non-transitory medium | |
US9459948B2 (en) | Auxiliary method, apparatus and system for diagnosing failure of virtual machine | |
WO2009110111A1 (en) | Server device, method of detecting failure of server device, and program of detecting failure of server device | |
US8914488B2 (en) | Method and system for monitoring a monitoring-target process | |
US20140122931A1 (en) | Performing diagnostic tests in a data center | |
US11157373B2 (en) | Prioritized transfer of failure event log data | |
EP3591485B1 (en) | Method and device for monitoring for equipment failure | |
US10275330B2 (en) | Computer readable non-transitory recording medium storing pseudo failure generation program, generation method, and generation apparatus | |
JPWO2012046293A1 (en) | Fault monitoring apparatus, fault monitoring method and program | |
JP7387469B2 (en) | Communication equipment, monitoring server and log collection method | |
US9021078B2 (en) | Management method and management system | |
JP6558037B2 (en) | Operation management program, operation management method, and operation management apparatus | |
JP5282569B2 (en) | Management device, management system, management method, and management program | |
US20120210176A1 (en) | Method for controlling information processing apparatus and information processing apparatus | |
JP6504610B2 (en) | Processing device, method and program | |
JP6880961B2 (en) | Information processing device and log recording method | |
JP6317074B2 (en) | Failure notification device, failure notification program, and failure notification method | |
JP2022052504A (en) | Bmc, server system, device stabilization determination method, and program | |
CN111897626A (en) | Cloud computing scene-oriented virtual machine high-reliability system and implementation method | |
JP2009230522A (en) | System monitoring device and program | |
KR101783201B1 (en) | System and method for managing servers totally | |
JP2009026182A (en) | Program execution system and execution device | |
JP2001331330A (en) | Process abnormality detection and restoration system | |
US7409605B2 (en) | Storage system | |
JP2009048291A (en) | System analysis device and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20110607 |