JP2011034319A - Terminal operation state monitoring system, terminal operation state monitoring method, and terminal operation state monitoring program - Google Patents
Terminal operation state monitoring system, terminal operation state monitoring method, and terminal operation state monitoring program Download PDFInfo
- Publication number
- JP2011034319A JP2011034319A JP2009179597A JP2009179597A JP2011034319A JP 2011034319 A JP2011034319 A JP 2011034319A JP 2009179597 A JP2009179597 A JP 2009179597A JP 2009179597 A JP2009179597 A JP 2009179597A JP 2011034319 A JP2011034319 A JP 2011034319A
- Authority
- JP
- Japan
- Prior art keywords
- operation state
- monitoring
- information
- hardware
- software
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Abstract
Description
本発明は、コンピュータ端末における動作状態を監視し、その動作異常を検出するシステムに関する。 The present invention relates to a system for monitoring an operation state in a computer terminal and detecting an operation abnormality thereof.
コンピュータ端末であるサーバ内の音、におい、重さなどのハードウェアにかかる監視要素(以下「ハードウェア監視要素」という)の動作状態を、サーバ内に予め設置されたセンサ機器を利用して監視する監視システムが開示されている(特許文献1および2)。
また、サーバにおけるCPU(Central Processing Unit)の使用率、メモリ使用率、ディスクアクセス率、ディスク使用率、ファンの回転数などの、予め設定されたプログラムを実行することにより動作状態を示す情報を取得可能な監視要素(以下「ソフトウェア監視要素」という)の動作状態を取得し、この情報に基づきコンピュータ端末の動作状態を監視するシステムが開示されている。
Monitors the operating status of hardware monitoring elements (hereinafter referred to as “hardware monitoring elements”) such as sound, smell, and weight within the server, which is a computer terminal, using sensor devices installed in the server in advance. A monitoring system is disclosed (Patent Documents 1 and 2).
Also, information indicating the operating status is obtained by executing preset programs such as CPU (Central Processing Unit) usage rate, memory usage rate, disk access rate, disk usage rate, and fan speed in the server. A system is disclosed that acquires the operating state of possible monitoring elements (hereinafter referred to as “software monitoring elements”) and monitors the operating state of a computer terminal based on this information.
しかしながら、上記ハードウェア監視要素およびソフトウェア監視要素それぞれを単一の監視要素として監視するシステムでは、監視要素間の相関動作により生じる動作異常状態とは異なる、想定外の動作異常が検知できないといった不都合があった。また、コンピュータ端末(サーバ)における動作状態は正常な状態であるにも拘らず動作異常が誤検知されてしまう不都合が生じ得る。 However, in the system that monitors each of the hardware monitoring element and the software monitoring element as a single monitoring element, there is a disadvantage that an unexpected operation abnormality cannot be detected, which is different from an operation abnormality state caused by a correlation operation between the monitoring elements. there were. Moreover, although the operation state in the computer terminal (server) is a normal state, there may be a problem that an operation abnormality is erroneously detected.
これに対する関連技術として、例えば、コンピュータ端末にHDD(ハード・ディスク・ドライブ)のアクセス音とこのディスクに格納されたデータに対するアクセス率(ディスクアクセス率)それぞれを監視し、検出されたアクセス音とアクセス率に基づいて動作異常を検出するシステムが開示されている(特許文献3)。 As a related technology, for example, a computer terminal monitors the access sound of an HDD (hard disk drive) and the access rate (disk access rate) for data stored on the disk, and detects the detected access sound and access. A system for detecting an abnormal operation based on a rate is disclosed (Patent Document 3).
また、コンピュータ端末におけるハードウェアの各種状態を予め設定されたソフトウェアモジュールを実行することにより、ハードウェアの故障、またはソフトウェアの誤動作及び実行違反を検出すると共に、コンピュータ端末における動作に支障をきたしたときに自動的にコンピュータ端末を再起動しエラー処理を行い、更にはシステム差異起動を行ったことを予め設定された宛先へとSMTPまたはSNMPにより通知するシステムが開示されている(特許文献4)。 In addition, when a software module in which various hardware states in the computer terminal are set in advance is executed, a hardware failure or a malfunction of the software and an execution violation are detected, and an operation in the computer terminal is hindered. A system is disclosed that automatically restarts a computer terminal to perform error processing, and further notifies the destination set in advance by SMTP or SNMP (Patent Document 4).
しかしながら、上記特許文献1および2に開示された関連技術では、コンピュータ端末のハードウェアにかかる監視要素(ハードウェア監視要素:例えば、音、におい、重さなど)、または、コンピュータ端末内における、ソフトウェア実行によりその動作状態を検知できる監視要素(ソフトウェア監視要素)それぞれを単一の監視対象として、その動作異常を検出する設定である。 However, in the related techniques disclosed in Patent Documents 1 and 2, a monitoring element (hardware monitoring element: for example, sound, smell, weight, etc.) related to the hardware of the computer terminal, or software in the computer terminal Each monitoring element (software monitoring element) that can detect its operation state by execution is set as a single monitoring target, and its operation abnormality is detected.
このため、例えばサーバのCPUなどの処理負荷が一時的に高くなった場合など、例えば、サーバの処理負荷が小さいという正常な状態にあるにもかかわらず、ハードウェア監視要素としてのアクセス音が予め設定された値より大きい状態を動作異常として検出する設定である場合には、上記正常な状態を異常状態として検出してしまう不都合がある。
また、アクセス率だけを監視している場合も、検知されたアクセス率が一定値より大きい状態(または小さい状態)を動作異常状態として検出する設定であるため、サーバ全体の処理動作状態は正常な状態であるにも拘らず、その動作状態が動作異常として検出されてしまうといった不都合が生じ得る。
For this reason, for example, when the processing load of the CPU of the server becomes temporarily high, for example, the access sound as the hardware monitoring element is preliminarily obtained in spite of the normal state that the processing load of the server is small. If the setting is such that a state larger than the set value is detected as an abnormal operation, there is a disadvantage that the normal state is detected as an abnormal state.
Even when only the access rate is monitored, the processing operation status of the entire server is normal because the detected access rate is set to detect a state where the detected access rate is larger (or smaller) as an abnormal operation state. In spite of the state, there may be a disadvantage that the operation state is detected as an operation abnormality.
また、上記特許文献3に開示された関連技術では、ハードウェアにかかる故障またはソフトウェアの誤動作などをそれぞれ検出するため、監視要素の動作状態の相関関係から予め想定される動作異常以外の動作異常が生じた場合には、その動作異常を検出することができず、誤検知が生じてしまう不都合がある。
更に、上記特許文献4に開示された関連技術では、例えば、コンピュータ端末におけるCPUなどの一部ハードウェアの処理負荷が一時的に高くなった場合に、例えば、アクセス音が予め設定された値より大きい状態が検出される。この場合、コンピュータ端末全体の処理動作状態は正常な状態であるにも拘らず、動作異常の検出が行われてしまうといった不都合が生じ得る。
Further, in the related art disclosed in the above-mentioned patent document 3, in order to detect a hardware failure or a software malfunction, etc., there is an operation abnormality other than the operation abnormality assumed in advance from the correlation of the operation states of the monitoring elements. If it occurs, there is an inconvenience that the operation abnormality cannot be detected and erroneous detection occurs.
Further, in the related art disclosed in Patent Document 4, for example, when the processing load of some hardware such as a CPU in a computer terminal temporarily increases, for example, the access sound is higher than a preset value. A large condition is detected. In this case, although the processing operation state of the entire computer terminal is in a normal state, an inconvenience that an operation abnormality is detected may occur.
[発明の目的]
本発明は、上記関連技術の有する不都合を改善し、コンピュータ端末での処理動作における動作異常を高精度に検知し得る端末動作状態監視システムを提供することを、その目的とする。
[Object of invention]
An object of the present invention is to provide a terminal operation state monitoring system that improves the disadvantages of the related art and can detect an operation abnormality in a processing operation at a computer terminal with high accuracy.
上記目的を達成するために、本発明に係る端末動作状態監視システムは、コンピュータ端末に含まれる予め設定された監視対象部の動作状態を示すハードウェア動作状態情報を予め設定されたセンサ部により取得するハードウェア動作状態監視部と、前記監視対象部の動作状態を示すと共に予め設定されたプログラムの実行処理により検知可能なソフトウェア動作状態情報を取得するソフトウェア動作状態監視部と、前記ハードウェアおよびソフトウェア動作状態情報に基づき検出された前記監視対象部の動作異常を予め設定された動作状態表示部に通知する動作異常通知部とを備えた端末動作監視システムであって、前記ハードウェアおよびソフトウェア動作状態情報間における動作状態変化を示す相関関係を動作状態関係情報として予め記憶する関係情報データベースと、前記取得された前記ハードウェアおよびソフトウェア動作状態情報から動作状態の変化の仕方に相関関係のある前記ハードウェアおよびソフトウェア動作状態情報を抽出する相関状態情報抽出部と、前記抽出されたハードウェアおよびソフトウェア動作状態情報の相関関係と前記動作状態関係情報とが異なるか否かを比較判定することにより前記監視対象部における動作異常を検出する相関動作異常判定手段とを備えた構成をとっている。 In order to achieve the above object, a terminal operation state monitoring system according to the present invention acquires hardware operation state information indicating an operation state of a preset monitoring target part included in a computer terminal by a preset sensor unit. A hardware operation state monitoring unit, a software operation state monitoring unit that indicates an operation state of the monitoring target unit and acquires software operation state information that can be detected by executing a preset program, and the hardware and software A terminal operation monitoring system comprising: an operation abnormality notification unit that notifies an operation state display unit that is set in advance of an operation abnormality of the monitoring target unit detected based on operation state information, the hardware and software operation state Correlation indicating changes in operating state between pieces of information is previously stored as operating state relationship information. A correlation state information extraction unit that extracts the hardware and software operation state information correlated with the manner of change of the operation state from the acquired hardware and software operation state information; Correlated operation abnormality determining means for detecting an operation abnormality in the monitoring target unit by comparing whether or not the correlation between the extracted hardware and software operation state information is different from the operation state relationship information is provided. It has a configuration.
また、本発明にかかる端末動作状態監視方法は、コンピュータ端末に含まれる予め設定された監視対象部の動作状態を示すハードウェア動作状態情報を予め設定されたセンサ部により取得するハードウェア動作状態監視部と、前記監視対象部の動作状態を示すと共に予め設定されたプログラムの実行処理により検知可能なソフトウェア動作状態情報を取得するソフトウェア動作状態監視部と、前記ハードウェアおよびソフトウェア動作状態情報間の動作状態変化関係として予め設定された動作関係情報を記憶する関係情報データベースとを備えた端末動作監視システムにあって、前記監視対象部の動作異常を検出する端末動作監視方法であって、前記ハードウェアおよびソフトウェア監視要素情報を取得し、当該ハードウェアおよびソフトウェア動作状態情報それぞれから動作状態の変化の仕方に相関関係のあるハードウェアおよびソフトウェア動作状態情報を抽出し、抽出された前記ハードウェアおよびソフトウェア動作状態情報の相関関係と予め設定された前記動作状態関係情報とが異なるか否かの判定を行い、前記相関関係が前記動作状態関係情報と異なる場合に予め設定された動作状態表示部に対し前記監視対象部の動作状態を動作異常として通知することを特徴としている。 The terminal operation state monitoring method according to the present invention is a hardware operation state monitor that acquires hardware operation state information indicating an operation state of a preset monitoring target unit included in a computer terminal by a preset sensor unit. An operation state between the hardware and the software operation state information, and a software operation state monitoring unit that obtains software operation state information that can be detected by execution processing of a preset program and that indicates an operation state of the monitoring target unit A terminal operation monitoring system comprising a relation information database for storing operation relation information set in advance as a state change relation, the terminal operation monitoring method for detecting an operation abnormality of the monitoring target unit, the hardware Software monitoring element information, and the hardware and software A) hardware and software operation state information correlated with the operation state change method from each operation state information, and the correlation between the extracted hardware and software operation state information and the preset operation state It is determined whether or not the relationship information is different, and when the correlation is different from the operation state relationship information, the operation state of the monitoring target unit is notified to the preset operation state display unit as an operation abnormality. It is characterized by.
又、本発明にかかる端末動作状態監視プログラムは、コンピュータ端末に含まれる予め設定された監視対象部の動作状態を示すハードウェア動作状態情報を予め設定されたセンサ部により取得するハードウェア動作状態監視部と、前記監視対象部の動作状態を示すと共に予め設定されたプログラムの実行処理により検知可能なソフトウェア動作状態情報を取得するソフトウェア動作状態監視部と、前記ハードウェアおよびソフトウェア動作状態情報間の動作状態変化関係として予め設定された動作関係情報を記憶する関係情報データベースとを備えた端末動作監視システムにあって、前記監視対象部の動作異常を検出するための端末動作監視プログラムであって、前記ハードウェアおよびソフトウェア監視要素情報を取得し、当該ハードウェアおよびソフトウェア動作状態情報それぞれから動作状態の変化の仕方に相関関係のあるハードウェアおよびソフトウェア動作状態情報を抽出する相関状態情報抽出機能と、抽出された前記ハードウェアおよびソフトウェア動作状態情報の相関関係と予め設定された前記動作状態関係情報とが異なるか否かの判定を行う相関動作異常判定機能と、前記相関関係が前記動作状態関係情報と異なる場合に予め設定された動作状態表示部に対し前記監視対象部の動作状態を動作異常として通知する処理を行う動作異常通知機能とを予め設定されたコンピュータに実行させることを特徴としている。 The terminal operation state monitoring program according to the present invention is a hardware operation state monitor that obtains hardware operation state information indicating an operation state of a preset monitoring target unit included in a computer terminal by a preset sensor unit. An operation state between the hardware and the software operation state information, and a software operation state monitoring unit that obtains software operation state information that can be detected by execution processing of a preset program and that indicates an operation state of the monitoring target unit A terminal operation monitoring system comprising a relation information database for storing operation relation information set in advance as a state change relation, the terminal operation monitoring program for detecting an operation abnormality of the monitoring target unit, Obtain hardware and software monitoring element information and And a correlation state information extraction function for extracting hardware and software operation state information correlated with the manner of change of the operation state from each of the software operation state information, and a correlation between the extracted hardware and software operation state information Correlation operation abnormality determination function for determining whether or not the operation state relationship information set in advance is different from the operation state display unit set in advance when the correlation is different from the operation state relationship information An operation abnormality notification function for performing a process of notifying the operation state of the monitoring target unit as an operation abnormality is executed by a computer set in advance.
本発明は、以上のように構成され機能するので、これによると、コンピュータ端末に備えられ、動作状態の変化に相関関係を有したハードウェア監視対象部とソフトウェア監視対象部と抽出する手段と、動作状態の相関変化の関係性を示す動作状態関係情報に基づき抽出された監視対象部での相関関係のない動作状態変化を検知する手段とを備えたことにより、コンピュータ端末における動作異常を高精度に検知することを可能とした端末動作状態監視システムを提供することができる。 Since the present invention is configured and functions as described above, according to this, the hardware monitoring target unit and the software monitoring target unit that are provided in the computer terminal and have a correlation with the change in the operation state, It is equipped with a means for detecting an uncorrelated operating state change in the monitored part extracted based on the operating state relationship information indicating the correlation of the operating state correlation change, thereby accurately detecting an abnormal operation in the computer terminal. Therefore, it is possible to provide a terminal operation state monitoring system that can be detected in a short time.
[実施形態]
次に、本発明の実施形態について、その基本的構成内容を説明する。
[Embodiment]
Next, the basic configuration content of the embodiment of the present invention will be described.
本実施形態である端末動作状態監視システムは、図1に示すように、コンピュータ端末としてのサーバ10と、サーバ10における動作状態を監視する監視装置20と、サーバ10および監視装置20により通知されたサーバ10の動作状態を示す情報を取得して、サーバ10における監視要素が動作異常であるか否かの判定を行う判定通信装置30と、動作異常の判定用の情報(判断基準情報)を予め記憶してこの情報を判断通信装置30に対して提供するデータベース40と、判断通信装置30に接続して設けられサーバ10の動作異常に係る情報を取得し表示する監視端末50を備えている。
As shown in FIG. 1, the terminal operation state monitoring system according to the present embodiment is notified by the
また、上記端末動作状態監視システムは、サーバ10と同等の内部構成を有するコンピュータ端末であるサーバ15と、監視装置20と同等の内部構成を有しサーバ15の動作状態を監視する監視装置25とが判断通信装置30に接続され、判定通信装置30は、サーバ15および監視装置25より通知されたサーバ15の動作状態を示す情報に基づき、サーバ10における動作異常の有無の判定を行う構成となっている。
The terminal operation state monitoring system includes a
尚、本実施形態では、各サーバ(10および15)の動作状態を監視する監視装置(20および25)がそれぞれのサーバに対応して設置された構成となっているが、1台の監視装置により異なる複数のサーバの動作状態を監視する構成としてもよい。また、3台以上のサーバまたは監視装置が判断通信装置30に接続して設けられた構成であってもよい。
In this embodiment, the monitoring devices (20 and 25) for monitoring the operating state of each server (10 and 15) are installed corresponding to each server, but one monitoring device is provided. The operation status of a plurality of different servers may be monitored. Alternatively, a configuration in which three or more servers or monitoring devices are connected to the
以下、これを詳説する。
サーバ10、15はそれぞれ、CPU(Central Processing Unit)、メモリ、HDD(Hard Disk Drive:以下「Disk」という)、冷却用ファンなどを備え、上記CPUが予め設定されたプログラムに基づき処理を実行する一般のコンピュータ端末(端末コンピュータ)である。
This will be described in detail below.
Each of the
以下では、サーバ10および15の構成としてサーバ10について説明するが、サーバ15も同等の機能内容を備えた構成であるものとする。
サーバ10は、その内部に監視装置20に備えられたセンサ群21の一構成内容としてのセンシング部が設置されている。
このセンシング部は、具体的には、サーバ10内部の音(Diskにおけるアクセス音など)、におい、ネットワークアクセスランプの色、ディスクドライブの重さ、サーバ10の筐体内の大きさ(高さ、長さ、幅)、筐体内の温度にかかる情報などを検知するためのセンサ機器であるものとする。
Hereinafter, the
The
Specifically, the sensing unit is configured such that the sound inside the server 10 (such as an access sound in the disk), smell, color of the network access lamp, the weight of the disk drive, and the size (height, length) of the
また、サーバ10は、サーバ10内におけるCPU、メモリ、Disk、冷却用ファンなどの予め設定されたソフトウェア監視要素の動作状態を監視する監視ソフトウェア部11を備えている。
監視ソフトウェア部11は、サーバ10に予め設定されたOS(オペレーティング・システム)やアプリケーションの一部の機能として提供されたプログラムに基づきCPUで実行処理される特定のコマンドやAPI(Application Program Interface)により実現されるものとする。
また、監視ソフトウェア部11は、例えば、サーバ10におけるCPU使用率、メモリ使用率、Diskアクセス率、Disk使用率、ファンの回転数等の情報をソフトウェア監視要素情報として取得するソフトウェア監視要素情報取得機能を有する。
The
The
Also, the
更に、監視ソフトウェア部11は、このソフトウェア監視要素情報取得機能を実行することにより取得したソフトウェア監視要素情報を、判断通信装置30に送信するソフトウェア監視要素送信機能を備えている。
Further, the
監視装置20は、図2に示すように、サーバ10における予め設定された監視要素の動作状態を取得するセンサ群21と、センサ群21により取得された情報を判断通信装置30に送信するセンサ情報送信部を備えている。
As shown in FIG. 2, the
センサ群21は、上述のように、サーバ10内部に予め設置され、サーバ10内部の音(Diskにおけるアクセス音など)、におい、ネットワークアクセスランプの点灯色(点灯回数)、ディスクドライブの重さ、サーバ10の筐体内の大きさ(高さ、長さ、幅)、筐体内の温度にかかる情報などを検知するためのセンサ機器としてのセンシング部と、このセンシング部を介して検知されたセンサ検知情報をハードウェア監視要素情報として取得する検知情報取得部(ハードウェア監視要素情報取得部)を備えている。
As described above, the
センシング部は、例えば、Diskにおけるアクセス音を検知する音センサ(アクセス音検知センサ)、サーバ10筐体内やCPUのにおいを検知するにおいセンサ、サーバ10に予め設定された警告ランプやデータアクセスランプの点灯色(点灯回数)を検知する色検知センサなどを含み構成されるものとする。
尚、上記ネットアクセスランプは、サーバ10からインターネットやLAN(Local Area Network)などへの通信アクセス、データ通信があった場合などに点灯する。また、一定時間あたりの点灯回数を取得する設定であってもよい。
The sensing unit includes, for example, a sound sensor (access sound detection sensor) that detects an access sound in the disk, an odor sensor that detects an odor of the
The network access lamp is lit when there is communication access or data communication from the
また、センシング部は、サーバ10に予め設定されたDVDドライブなどのディスクドライブの重さを検知する重さ測定センサ、サーバ10筐体内の大きさ(高さ、長さ、幅)を検知するサイズセンサ、サーバ10筐体内の温度やCPUの温度を検知する温度センサなどを含み構成されるものとする。
上記重さ測定センサにより、DVDドライブにDVDなどのメディアがセットされた状態であるか否かを検知することができる。
In addition, the sensing unit is a weight measurement sensor that detects the weight of a disk drive such as a DVD drive set in advance in the
The weight measurement sensor can detect whether or not a medium such as a DVD is set in the DVD drive.
監視装置20の検知情報取得部(ハードウェア監視要素情報取得部)は、センシング部により検知され通信回線を介して取得した、サーバ10における予め設定された監視要素(以下「ハードウェア監視要素」という)の動作状態を示す情報(以下「ハードウェア監視要素情報」という)を記憶保持するセンサ検知情報保持手段を備えている。
A detection information acquisition unit (hardware monitoring element information acquisition unit) of the
ここで、上記ハードウェア監視要素情報としては、サーバ10におけるDiskのアクセス音、CPUのにおい、アクセスランプの点灯色、アクセスランプの一定時間における点滅回数、ディスクドライブの重さ、サーバ内部のサイズ、CPUの温度などを示す。
監視装置20の通信手段は、センサ検知情報保持手段に保持されたハードウェア監視要素情報を、判断通信装置30に送信する情報送信機能を備えている。
尚、本実施形態では、監視装置20について説明しているが、監視装置25においても監視装置20と同等の構成を有するものとする。
Here, the hardware monitoring element information includes the disk access sound in the
The communication unit of the
In the present embodiment, the
判断通信装置30は、図3に示すように、監視装置20から送り込まれた、ハードウェア監視要素のセンサ検知情報と、サーバ10の監視ソフトウェア11から送り込まれたソフトウェア監視要素情報を取得し一時的に保持する監視要素情報保持手段302を備えている。
また、判断通信装置30は、取得したハードウェア監視要素情報およびソフトウェア監視要素情報を、予め設定されたアルゴリズムに基づき数値化する処理を行う数値変換手段303を有する。
また、数値変換手段303は、数値化された値に基づきハードウェア監視要素情報およびソフトウェア監視要素情報それぞれから、値の変化の仕方、つまり動作状態の変化の仕方に相関関係のある情報(監視要素情報)を選択抽出する(相関状態情報抽出部)。
尚、上記ハードウェア監視要素情報およびソフトウェア監視要素情報はそれぞれ、一定期間内で予め設定された複数回数分取得されるものとする。これにより、判断通信装置30は、ハードウェア監視要素情報およびソフトウェア監視要素情報それぞれの値の変化の仕方に基づき相関関係の有無を判断する。
As shown in FIG. 3, the
In addition, the
In addition, the numerical value conversion means 303 obtains information (monitoring element) that correlates with how the value changes, that is, how the operating state changes, from each of the hardware monitoring element information and the software monitoring element information based on the digitized value. Information) is selected and extracted (correlation state information extraction unit).
It is assumed that the hardware monitoring element information and the software monitoring element information are acquired for a predetermined number of times within a certain period. As a result, the
また、判断通信装置30は、監視要素情報保持手段に保持された監視要素情報に基づきデータベース40に記憶された判断基準情報(条件情報)を参照して、サーバ10における各ハードウェア監視要素と各ソフトウェア監視要素とにおける動作状態が動作異常であるか否かを判定する動作状態判定手段301とを備えている。
ここで、動作状態判定手段301は、サーバ10の各ハードウェア監視要素および各ソフトウェア監視要素の動作状態が正常、通常動作異常、または異常動作異常の何れの状態であるかを判定するものとする。
Further, the
Here, the operation
また、判断通信装置30は、監視装置20から送り込まれたハードウェア監視要素情報およびサーバ10から送り込まれたソフトウェア監視要素情報を予め設定された数値範囲の値に変換する数値変換手段303を備えている。
更に、判断通信装置30は、数値化されたハードウェアおよびソフトウェア監視要素情報の組み合わせにより、サーバ10における上記ハードウェア監視要素およびソフトウェア監視要素に動作異常があるか否かを判定する動作異常判定手段を備えている。
In addition, the
Furthermore, the
また、判断通信装置30は、動作異常があると判定されたハードウェアおよびソフトウェア監視要素の動作状態を示す情報を、監視端末50に対して送信する状態通知手段304を備えている。
更に、判断通信装置30は、データベース40内にサーバ10における動作異常を回避し正常状態に戻すための手順や動作指示を示す動作異常対処情報が予め設定されている場合に、この動作異常対処情報(以下「対処情報」という)をサーバ10に送信する対処情報送信手段を有した構成であってもよい。このとき、サーバ10は、この対処情報に基づく処理を実行することにより、動作異常に対する対処処理を行い、動作異常状態を正常な動作状態に戻すことができる。
In addition, the
Further, the
ここで、判断通信装置30の動作状態判定手段301が、サーバ10におけるハードウェアおよびソフトウェア監視要素の動作状態が動作異常を生じているか否かを判定する動作状態判定について説明する。
Here, the operation state determination in which the operation
具体的には、監視装置20が音センサにより検知されたサーバ10のHDDにおけるアクセス音の状態を示すハードウェア監視要素情報と、監視ソフトウェア部11により検知されるサーバ10のHDDにおけるDiskアクセス率を示すソフトウェア監視要素情報とを組合わせた動作状態判定について示す。
Specifically, the hardware monitoring element information indicating the state of access sound in the HDD of the
動作状態判定手段301は、上述のように、取得されたハードウェア監視要素情報とソフトウェア監視要素情報からデータベース40に予め設定された判断基準情報に基づき、サーバ10における各監視要素の動作状態が正常、動作異常(通常動作異常、または異常動作異常)の何れの状態にあるかを判定する。
As described above, the operation
[通常動作異常判定]
データベース40には、予め判断基準情報として動作異常状態を示す数値範囲が格納されているものとする。
このため、動作状態判定手段301は、例えば、アクセス音(A)およびDiskアクセス率(B)の数値化した監視要素情報が、判断基準情報で設定された一定の数値範囲内の数値である場合や当該数値範囲に達した場合(例えば、0<A50且つ0<B<50)に、サーバ10におけるHDDの動作状態を「通常動作異常」として判定する。
[Normal operation abnormality judgment]
It is assumed that a numerical range indicating an abnormal operation state is stored in advance in the
For this reason, the operation
また、動作状態判定手段301は、上述のように、3つ以上の監視要素情報を組み合わせた動作状態判定を行う設定としてもよい。例えば、組み合わせる監視要素としてDiskアクセスランプの点灯状態や点灯回数(C)も追加することにより異常状態の判断の精度を高めることができる。
In addition, as described above, the operation
例えば、監視要素情報がA,B,Cである場合、動作状態判定手段301は、判断基準情報で設定された一定の数値範囲(例えば、100<A且つ100<B且つ70<C<100)に含まれる場合を「通常動作異常」と判定する。
これにより、サーバ10のHDDにおけるアクセス音が一定の値(数値範囲)に至るまで大きくになり、且つDiskアクセス率も一定の値まで上昇し、更には、Diskアクセスランプにおける一定時間あたりの点灯回数が予め設定された値以上になった場合、動作状態判定手段301は、監視要素間の相関は維持されているが、検出される数値が設定された数値範囲以上(または以下)であるため、通常動作異常として動作異常の発生を監視端末50に通知する。
For example, when the monitoring element information is A, B, and C, the operation
As a result, the access sound in the HDD of the
更に、判断通信装置30は、ハードウェア監視要素およびソフトウェア監視要素から相関関係にある監視要素をそれぞれ抽出すると共に、抽出した監視要素にかかる監視要素情報を組合わせた動作状態の判定を行う相関監視要素抽出判定機能を備えている。
また、本実施形態では、2つの監視要素(アクセス音とDiskアクセス率)を組合わせて行う動作状態判定について説明しているが、3つ以上の監視要素を組み合わせた動作状態の判定を行う設定であってもよい。
Further, the
In the present embodiment, the operation state determination performed by combining two monitoring elements (access sound and disk access rate) is described. However, the setting for determining the operation state combining three or more monitoring elements is described. It may be.
[異常動作異常判定]
ところで、アクセス音およびDiskアクセス率のうち、一方の検知された値が上昇した場合、他方の検知された値も上昇する。つまり、音センサにより検知されたアクセス音の検知値が大きくなった場合には、Diskアクセス率の値も大きくなり、検知されたアクセス音が小さくなった場合はDiskアクセス率も低下する。
[Abnormal operation abnormality judgment]
By the way, when one detected value rises among the access sound and the disk access rate, the other detected value also rises. That is, when the detection value of the access sound detected by the sound sensor increases, the value of the disk access rate also increases, and when the detected access sound decreases, the disk access rate also decreases.
ここで、データベース40は、アクセス音とDiskアクセス率のように、相関関係のある異なる複数の監視要素を相関監視要素として設定する(相関監視要素設定手段)。
更に、データベース40には、異なる複数の(例えば2つの)監視要素情報(ここでは、アクセス音とDiskアクセス率)の相関関係の内容(例えば、「一方の検知された値が上昇した場合、他方の検知された値も上昇する」)が判断基準情報として記憶されているものとする。
Here, the
Further, the
動作状態判定手段301は、取得した異なる複数の監視要素情報(アクセス音(A)およびDiskアクセス率(B))に示される相互の動作状態変化(内容)の関係が、上記判断基準情報に示された関係(相関関係)と合致するか否かの判定を行う。
ここで、動作状態判定手段301は、アクセス音は大きくなるが、Diskアクセス率は小さいまま、といった動作変化や、アクセス音は小さいが、Diskアクセス率は大きいまま、といった動作変化内容である監視要素情報を取得した場合、この監視要素情報に示される動作状態変化は、上記判断基準情報に示された相関関係とは異なる動作状態変化であるため、動作状態判定手段301は、取得した監視要素情報について、上記通常動作異常とは異なる動作異常を示す「異常動作異常」と判定する。
The operation
Here, the operation state determination means 301 is a monitoring element which is an operation change such as an increase in access sound but a low disk access rate, or an operation change content such as a low access sound but a high disk access rate. When the information is acquired, the operation state change indicated in the monitoring element information is an operation state change different from the correlation indicated in the determination criterion information. Is determined as “abnormal operation abnormality” indicating an operation abnormality different from the normal operation abnormality.
また、このとき、動作状態判定手段301は、Diskアクセス率、アクセス音にかかるHDDまたはメモリなどに、異常動作異常が生じたものと判定し、監視端末50に通知する。
At this time, the operation
以上のように、異なる監視要素(例えば、アクセス音およびDiskアクセス率)が相互に相関関係のある動作変化を行っており、且つ、両監視要素(または3以上の監視要素全て)の動作状態を示す値が予め設定された一定の値に達した場合、動作状態判定手段301は、サーバ10における監視要素に、通常想定可能な動作異常を示す「通常動作異常」が生じているものと判定する。
このとき、動作状態判定手段301は、検出された値と組み合わせる監視要素とに基づき、サーバ10におけるどの監視要素に動作異常が発生しているかを特定する設定としてもよい。
As described above, different monitoring elements (for example, the access sound and the disk access rate) have undergone mutually correlated operation changes, and the operating states of both monitoring elements (or all three or more monitoring elements) are changed. When the indicated value reaches a predetermined constant value, the operation
At this time, the operation
一方、異なる監視要素(例えば、アクセス音およびDiskアクセス率)の動作変化の仕方が予め設定された相関関係とは異なる動作変化である場合、動作状態判定手段301は、サーバ10における監視要素に、通常想定することが困難な動作異常である異常動作異常が生じていると判定する。
On the other hand, when the operation change method of different monitoring elements (for example, access sound and disk access rate) is an operation change different from the preset correlation, the operation
尚、判断通信装置30の状態通知手段304は、サーバ10におけるハードウェアおよびソフトウェア監視要素における動作状態が「異常動作異常」にあると判定した場合にのみ、動作異常の内容を監視端末50に対して送信する設定としてもよい。
It should be noted that the status notification means 304 of the
これにより、異なる監視要素それぞれの動作変化の仕方に相関関係がある場合には、動作異常(通常動作異常)は監視端末50には通知されない。このため、例えば、サーバ10における処理動作は正常状態であるにもかかわらず動作異常の発生が通知されてしまうといった状況の発生を有効に軽減することができる。
Thereby, when there is a correlation in the way of changing the operation of each of the different monitoring elements, the abnormal operation (normal operation abnormality) is not notified to the
データベース40は、上述のように、判断通信装置30がサーバ10の動作異常状態を判定するための基準情報である判断基準情報を記憶する判断基準情報記憶部を有し、この判断基準情報として、監視要素情報の組み合わせ、数値化された監視要素情報の数値範囲が示されているものとする。
As described above, the
また、データベース40は、上述のように、相関関係のある異なる複数の監視要素情報を相関監視要素として設定する相関監視要素設定手段を備えている。
更に、データベース40は、異常状態時のサーバ10における動作事象の内容、動作異常の内容を示す事象情報、異常状態が発生した原因を示す異常発生原因情報、および発生した異常状態を回避するための操作手順などを示す対処情報が予め格納された設定であってもよい。
Further, as described above, the
Furthermore, the
ここで、データベース40が記憶している判断基準情報について具体的に説明する。ここでは、判断基準情報として、検知される値の変化の仕方に相関関係を有するA(アクセス音)、B(ディスクアクセス率)、C(ディスクアクセスランプの点灯回数)の組合わせを示す。ここでは、A、B、Cは相関監視要素であるものとする。
Here, the criteria information stored in the
尚、上記A,B,およびCの検知された値について、相関関係のない数値変化が検知された場合、判断通信装置30は、サーバ10の監視要素において異常動作異常が発生したものと判定し、監視端末50に通知する。
In addition, regarding the detected values of the above A, B, and C, when a numerical change having no correlation is detected, the
また、判断基準情報には、異なる複数の(例えば2つの)監視要素情報の相関関係の内容(例えば、「一方の検知された値が下降した場合、他方の検知された値も下降する」)が含まれていてもよい。 In addition, in the criterion information, the contents of the correlation between a plurality of different (for example, two) pieces of monitoring element information (for example, “when one detected value falls, the other detected value also falls”). May be included.
上記判断基準情報には、「0<A<50かつ0<B<50」、「0<A<50かつ0<C<30」、「0<A<50且つ30≦C<50」、「100<A且つ(100<B、または70<C<100)」などの異常状態時(通常動作異常)を示す数値範囲が登録されている。
判断通信装置30は、数値化された監視要素情報A、B、およびCの数値がこの数値範囲に含まれているか否かの判定を行う。
The above criteria information includes “0 <A <50 and 0 <B <50”, “0 <A <50 and 0 <C <30”, “0 <A <50 and 30 ≦ C <50”, “ A numerical range indicating an abnormal state (normal operation abnormality) such as “100 <A and (100 <B or 70 <C <100)” is registered.
The
ここで、判断通信装置30は、数値化された監視要素情報AおよびB、または、AおよびCが、上記数値範囲に含まれているか否かの判定を行う。数値化した監視要素情報AおよびB、または、AおよびCが、上記数値は範囲に含まれる場合は、これをサーバ10の監視要素が異常状態にあると判定し、監視要素の組み合わせ内容(例えばAおよびC)に基づきサーバ10における動作異常状態にある監視要素を特定し、通常動作異常として、監視端末50に通知する。
Here, the
尚、データベース40には、監視要素の組み合わせ内容(例えばAおよびC)に基づきサーバ10における動作異常状態の監視要素を特定し、これをリスト化した動作異常監視要素リストが設定された構成であってもよい。
これにより、判断通信装置30は、動作異常状態にある監視要素を監視端末50に対して迅速に通知することができる。
Note that the
Thereby, the
監視端末50は、例えば、オペレータ(管理者)により操作される端末コンピュータであって、判断通信装置30から送り込まれたサーバ(10、15)の動作状態が表示される動作状態表示手段(ディスプレイ)を備えている。
The
また、監視端末50は、判断通信装置30に対して、サーバ10における動作異常を回避し正常状態に戻すための予め設定された手順や動作指示を示す動作異常対処情報(対処情報)を送信する対処情報通知手段を備えている。
尚、上記対処情報は、判断通信装置30から送り込まれた動作状態情報それぞれに応じて設定されたものであってよい。また、対処情報は、判断通信装置30から送り込まれた動作状態情報それぞれに応じて監視端末50のオペレータが設定したものであってもよい。
In addition, the monitoring
Note that the handling information may be set according to each of the operation state information sent from the
このとき、判断通信装置30が監視端末50から送られた対処情報をサーバ10に通知することにより、サーバ10は、この対処情報に基づく実行処理を行えるものとする。これにより、サーバ10は、当該サーバ10に発生した動作異常に対する対処処理を行うことができ、発生している動作異常状態を正常な動作状態に戻すことができる。
At this time, the
本実施形態は、以下に示すように、判断通信装置30が、ハードウェア監視要素情報とソフトウェア監視要素情報とを組合せた動作異常判定を行う設定であってもよい。
In the present embodiment, as described below, the
例えば、サーバ10に設定された温度センサにより検知されたサーバ10のCPUの温度(ハードウェア監視要素情報)と、監視ソフトウェア11により検知されたCPU使用率(ソフトウェア監視要素情報)、およびファン回転数(ソフトウェア監視要素情報)は、相関関係を有するので、これらを組み合わせた動作異常判定を行うことができる。
ここでは、判断通信装置30が、ハードウェア監視要素およびソフトウェア監視要素から相関関係にある監視要素として、CPUの温度、CPU使用率、およびファン回転数を抽出し、上記アクセス音とDiskアクセス率の場合と同様にして、数値化された監視要素情報(CPUの温度、CPU使用率、およびファン回転数)を組合わせた動作状態の判定を行う(相関監視要素抽出判定機能)。
For example, the CPU temperature (hardware monitoring element information) detected by the temperature sensor set in the
Here, the
尚、サーバ10のCPU使用率は、監視ソフトウェア11がサーバ10のOSにより提供されている「sarコマンド」を実行することにより取得される。
また、サーバ10のファン回転数は、監視ソフトウェア11がサーバ10のOSより提供されているAPIを使用して取得される。
The CPU usage rate of the
Further, the fan rotation speed of the
また、CPU使用率とファン回転数は、CPU使用率が高くなった場合にはファン回転数も上がるという相関関係を有しているため、データベース40は、CPU使用率およびファン回転数(共にソフトウェア監視要素情報)を相関監視要素として設定してもよい。
Further, since the CPU usage rate and the fan rotation speed have a correlation that the fan rotation speed increases when the CPU usage rate increases, the
ここで、判断通信装置30の動作状態判定手段301は、例えば、CPU使用率が予め設定された一定値より低いのにも関わらず、サーバの温度が一定値よりも高い状態(状態変化)が検知された場合、または、CPU使用率が予め設定された一定値より低いのにも関わらず、ファン回転数が一定値よりも高い状態(状態変化)が検知された場合に、データベース40に格納された判断基準情報に示された相関関係とは異なる動作状態変化、つまり異常動作異常の状態であると判定する。
Here, the operation
このとき、判断通信装置30の状態通知手段は、サーバ10のCPU、ファンなどに異常動作異常が生じたものと判定し、これを監視端末50に通知する。
At this time, the state notification means of the
また、例えば、サーバ10に設定された重さセンサにより検知されたサーバ10のDVDドライブの重さ(ハードウェア監視要素情報)と、監視ソフトウェア11により検知されたDiskアクセス率(ソフトウェア監視要素情報)は、相関関係を有するので、これらを組み合わせた動作異常判定を行うことができる。
Further, for example, the weight of the DVD drive of the server 10 (hardware monitoring element information) detected by the weight sensor set in the
ここでは、判断通信装置30が、ハードウェア監視要素およびソフトウェア監視要素から相関関係にある監視要素として、DVDドライブの重さおよびDiskアクセス率をそれぞれ抽出し、上記アクセス音とDiskアクセス率の場合と同様にして、これらの監視要素情報を組合わせた動作状態の判定を行う(相関監視要素抽出判定機能)。
動作状態判定手段301は、例えば、DVDドライブにDVDやCDなどのメディアがセットされていない状態で(重さセンサにより検知)、サーバ10のDVD装置に対するDiskアクセス率が高い状態を検知した場合に、状態通知手段が、検知内容を監視端末50に通知する。
Here, the
For example, the operation
更に、例えば、サーバ10に設定された色センサにより検知されたサーバ10のネットワークカードのネットワークアクセスランプの点灯回数(点灯色の変更回数:ハードウェア監視要素情報)と、監視ソフトウェア11により検知されたネットワーク負荷率(ソフトウェア監視要素情報)とは、相関関係を有するので、これらを組み合わせた動作異常判定を行うことができる。
ここでは、判断通信装置30が、ハードウェア監視要素およびソフトウェア監視要素から相関関係にある監視要素として、ネットワークアクセスランプとネットワーク負荷率を抽出し、上記アクセス音とDiskアクセス率の場合と同様にして、これらの監視要素情報を組合わせた動作状態の判定を行う(相関監視要素抽出判定機能)。
Further, for example, the number of lighting of the network access lamp of the network card of the
Here, the
尚、サーバ10におけるネットワーク負荷率は、監視ソフトウェア11がサーバ10のOSにより提供されている「netstatコマンド」を実行することにより取得される。
The network load factor in the
ここで、判断通信装置30の動作状態判定手段301は、例えば、ネットワーク負荷率が予め設定された一定値より低いのにも関わらず、ネットワークアクセスランプの点灯回数が一定値よりも高い状態(状態変化)が検知された場合、または、ネットワーク負荷率が予め設定された一定値より低いのにも関わらず、ネットワークアクセスランプの点灯回数が一定値よりも高い状態(状態変化)が検知された場合に、データベース40に格納された判断基準情報に示された相関関係とは異なる動作状態変化、つまり異常動作異常の状態であると判定する。
Here, the operation
このとき、判断通信装置30の状態通知手段は、サーバ10におけるネットワークアクセスランプ、またはネットワーク通信装置などに異常動作異常が生じたものと判定し、これを監視端末50に通知する。
At this time, the state notification means of the
尚、本実施形態では、上述のように、ハードウェア監視要素として、サーバ10の動作音、サーバ10内のにおい、ランプの色、DVDドライブの重さ、サーバ10の筐体の大きさ(高さ、長さ、幅)、サーバ10内のCPUの温度などを、予め設定されたセンサ機器により測定し取得する場合について記載しているが、サーバ10における上記以外の監視要素で、他のセンサ機器により、動作にかかる情報が取得可能な監視要素が設定された構成であってもよい。
In the present embodiment, as described above, as the hardware monitoring element, the operating sound of the
また、本実施形態ではソフトウェア監視要素として、CPU使用率、メモリ使用率、Diskアクセス率、Disk使用率、ファンの回転数などを監視ソフトウェア11がプログラム実行処理により取得する場合について記載しているが、サーバ10における上記以外の監視要素で、プログラム実行処理により動作にかかる情報が取得可能な監視要素が設定された構成であってもよい。
In this embodiment, the case where the
更に、ハードウェア監視要素とソフトウェア監視要素として、上記以外の監視要素が設定された構成であってもよく、それらの組み合わせを設定することが可能であるものとする。
また、設定されたハードウェア監視要素およびソフトウェア監視要素に応じて、データベース40に登録されている判断基準情報における、動作異常状態を示すハードウェア監視要素およびソフトウェア監視要素情報の値を組み合わせた値範囲が設定されるものとする。
Furthermore, a configuration in which monitoring elements other than those described above may be set as the hardware monitoring elements and software monitoring elements, and a combination thereof can be set.
Further, in accordance with the set hardware monitoring element and software monitoring element, the value range in which the values of the hardware monitoring element and software monitoring element information indicating the abnormal operation state in the criterion information registered in the
[実施形態の動作説明]
次に、本実施形態の動作について、その概略を説明する。
まず、判断通信装置30が、監視装置20から検知されたハードウェアおよびソフトウェア監視要素情報を取得すると共に、これら監視要素情報から動作状態の変化の仕方に相関関係のあるハードウェアおよびソフトウェア動作状態情報を抽出する(相関状態情報抽出工程)。
次いで、判断通信装置30は、抽出されたハードウェアおよびソフトウェア動作状態情報の相関関係と予めデータベース40に設定された動作状態関係情報とが異なるか否かの判定を行い(相関動作異常判定工程)、
前記相関関係が前記動作状態関係情報と異なる場合に予め設定された動作状態表示部に対し前記監視対象部の動作状態を動作異常として通知する処理を行う(動作異常通知工程)。
[Description of Operation of Embodiment]
Next, an outline of the operation of this embodiment will be described.
First, the
Next, the
When the correlation is different from the operation state relationship information, a process of notifying the operation state display unit set in advance as the operation state of the monitoring target unit as an operation abnormality is performed (operation abnormality notification step).
ここで、上記相関状態情報抽出工程、相関動作異常判定工程、および動作異常通知工程については、その実行内容をプログラム化し、コンピュータに実行させるように構成してもよい。 Here, regarding the correlation state information extraction step, the correlation operation abnormality determination step, and the operation abnormality notification step, the execution contents may be programmed and executed by a computer.
次に、本実施形態にかかる上記端末動作監視システムの動作について、図2のフローチャートに基づいて説明する。 Next, the operation of the terminal operation monitoring system according to the present embodiment will be described based on the flowchart of FIG.
まず、センサ群21におけるサーバ10内部に設定されたセンシング部211を介してサーバ10のHDD(Disk)におけるアクセス音をサーバ10のハードウェア監視要素情報として取得し、監視装置20の検知情報取得部212(ハードウェア監視要素情報取得部)が、このハードウェア監視要素情報を保持する。
尚、このアクセス音は、データアクセスにかかるアームの動作音の音量や動作音の回数などを示すものとする。
First, the access sound in the HDD (Disk) of the
The access sound indicates the arm operation sound volume and the number of operation sounds for data access.
また、検知情報取得部212は、サーバ10筐体内のにおい、ネットワークアクセスランプの点灯色(点灯回数)、ディスクドライブの重さ、サーバ10筐体内の大きさ(高さ、長さ、幅)、筐体内の温度にかかる情報などをハードウェア監視要素情報として検知しているものとする。
In addition, the detection information acquisition unit 212 includes an odor in the
また、サーバ10の監視ソフトウェア部11は、サーバ10におけるDiskアクセス率をソフトウェア監視要素情報として取得する
このとき、監視ソフトウェア部11は、CPU使用率、メモリ使用率、Disk使用率、ファンの回転数等の情報(ソフトウェア監視要素情報)も取得する。
In addition, the
次いで、監視装置20の通信手段213は、センサ検知情報保持手段に保持されたハードウェア監視要素情報を判断通信装置30に対して送信し(ハードウェア情報送信機能)、監視ソフトウェア部11は、取得したソフトウェア監視要素情報を判断通信装置30に送信する(ソフトウェア監視要素送信機能)。
これにより、判断通信装置30は、サーバ10におけるハードウェアおよびソフトウェア監視要素情報を取得し、一時的に記憶保持する(ステップS101)。
Next, the communication unit 213 of the
Thereby, the
次いで、判断通信装置30は、取得したハードウェア監視要素情報およびソフトウェア監視要素情報を、予め設定されたアルゴリズムに基づき数値化する処理を行う。
ここで、判断通信装置30の数値変換手段303が、数値化された値に基づきハードウェア監視要素情報およびソフトウェア監視要素情報それぞれから、値の変化の仕方、つまり動作状態の変化の仕方に相関関係のある情報(監視要素情報)を抽出する(ステップS102:相関状態情報抽出部)。
Next, the
Here, the numerical value conversion means 303 of the
ここでは、相関関係のある動作状態情報として、アクセス音およびDiskアクセス率を抽出した場合について説明する。 Here, a case where an access sound and a disk access rate are extracted as correlated operation state information will be described.
次いで、判断通信装置30の動作異常判定手段は、数値化されたハードウェア監視要素情報およびソフトウェア監視要素情報(アクセス音およびDiskアクセス率)に基づき、データベース40に予め記憶された判断基準情報(条件情報)と比較参照する(ステップS103)。
尚、このアクセス音およびDiskアクセス率は、一定期間内で予め設定された複数回数分取得されており、判断通信装置30は、アクセス音およびDiskアクセス率それぞれの値の変化および推移に基づき上記比較参照を行うものとする。
Next, the operation abnormality determination unit of the
The access sound and the disk access rate are acquired for a predetermined number of times within a predetermined period, and the
ここで、判断通信装置30の動作状態判定手段301が、サーバ10におけるハードウェアおよびソフトウェア監視要素の動作状態が動作異常を生じているか否かの判定を行う(ステップS104:動作状態判定工程)。
Here, the operation
この動作状態判定工程では、サーバ10のHDDにおけるアクセス音(ハードウェア監視要素情報)およびDiskアクセス率(ソフトウェア監視要素情報)の動作状態変化と、データベース40の判断基準情報とを比較することにより動作状態判定を行う。
ここで、動作状態判定手段301は、データベース40に予め設定されたアクセス音およびDiskアクセス率にかかる判断基準情報を参照し、ハードウェア監視要素情報(アクセス音)とソフトウェア監視要素情報(Diskアクセス率)に基づきサーバ10における監視要素(ここではHDD)の動作状態が正常、動作異常(通常動作異常、または異常動作異常)の何れの状態にあるかを判定する。
In this operation state determination step, the operation state change of the access sound (hardware monitoring element information) and the disk access rate (software monitoring element information) in the HDD of the
Here, the operation
動作状態判定手段301は、具体的には、取得した監視要素情報(アクセス音およびDiskアクセス率)が示す相互の動作状態変化の関係が、上記判断基準情報に示された相関関係と異なる(YES)か否か(NO)の判定を行う(ステップS104)。
Specifically, the operation
このとき、動作状態判定手段301は、取得したアクセス音の動作状態変化とDiskアクセス率の動作状態変化とが上記判断基準情報に示された相関関係とは異なる関係である場合、取得した監視要素情報(アクセス音、Diskアクセス率)について、通常の動作異常とは異なる動作異常である、異常動作異常と判定する(YES:ステップS104)。
At this time, if the operation state change of the acquired access sound and the operation state change of the disk access rate are different from the correlation shown in the determination criterion information, the operation
次いで、に異常動作異常が生じたものと判定し、判断通信装置30の状態通知手段が、サーバ10のHDDにおける動作異常の発生、およびその内容を、監視端末50に対して通知する(ステップS106)。
Next, it is determined that an abnormal operation abnormality has occurred, and the state notification means of the
一方、動作状態判定手段は、取得したアクセス音の動作状態変化とDiskアクセス率の動作状態変化とが上記判断基準情報に示された相関関係と合致する場合(NO:ステップS104)、サーバ10のHDDの動作状態が正常状態であるか通常動作異常であるかの判定を行う(ステップS105)。
ここで、監視要素情報である数値化されたアクセス音(A)およびDiskアクセス率(B)が、判断基準情報で設定された一定の数値範囲内の数値である場合や、この数値範囲に達した場合(例えば、0<A50且つ0<B<50)に、サーバ10におけるHDDの動作状態を通常動作異常として判定する(YES:ステップS105)。
On the other hand, when the operation state change of the acquired access sound and the operation state change of the disk access rate match the correlation shown in the above-described determination criterion information (NO: Step S104), It is determined whether the operation state of the HDD is normal or abnormal (step S105).
Here, when the digitized access sound (A) and the disk access rate (B), which are the monitoring element information, are values within a certain numerical range set in the criterion information, or reach this numerical range. In the case (for example, 0 <A50 and 0 <B <50), the HDD operation state in the
ここで、判断通信装置30の検出されたHDDの動作異常(通常動作異常)の内容を監視端末50に対して通知する(ステップS106)。
尚、判断通信装置30は、サーバ10におけるHDDの動作状態を通常動作異常として判定された場合には、監視端末50に対する上記動作異常(通常動作異常)内容の通知を行なわない設定としてもよい。
Here, the monitoring
The
これにより、サーバ10の処理動作が正常であるにも拘らず、監視端末50側が動作異常が発生した状態と誤検知してしまうのを抑制することができ、更には、通常と違う異常状態(異常動作異常)を監視端末50で正確に把握することができる。
Thereby, although the processing operation of the
また、監視要素情報である数値化されたアクセス音(A)およびDiskアクセス率(B)が、判断基準情報で設定された一定の数値範囲とは異なる場合(つまり数値範囲外である場合)は、サーバ10におけるHDDの動作状態を正常動作状態として判定する(ステップS101へ)。
In addition, when the digitized access sound (A) and the disk access rate (B) that are the monitoring element information are different from the certain numerical range set in the criterion information (that is, outside the numerical range) The operation state of the HDD in the
監視端末50は通知された動作異常を、予め設定された表示手段に出力表示すると共に、この動作異常(HDD動作異常)を回避し正常状態に戻すための予め設定された手順や動作指示を示す動作異常対処情報(対処情報)を判断通信装置30に対して送信し、HDD動作異常を回復する設定としてもよい(ステップS107)。
The
尚、上記対処情報は、判断通信装置30から送り込まれた動作状態情報それぞれに応じて設定されたものであってよい。また、対処情報は、判断通信装置30から送り込まれた動作状態情報それぞれに応じて監視端末50のオペレータが設定したものであってもよい。
Note that the handling information may be set according to each of the operation state information sent from the
このとき、判断通信装置30が監視端末50から送られた対処情報をサーバ10に通知することにより、サーバ10は、この対処情報に基づく実行処理を行えるものとする。これにより、サーバ10は、当該サーバ10に発生した動作異常に対する対処処理を行うことができ、発生している動作異常状態を正常な動作状態に戻すことができる。
At this time, the
以上に示すように、本実施形態では、例えば、サーバ10のハードウェアにかかる監視要素とソフトウェアを利用して取得される監視要素情報を統合的に監視することにより、通常想定される動作異常とは異なる動作異常状態(異常動作異常)を高精度で検知し、この動作異常を、遠隔地に通信回線を介して接続された監視端末(管理者)50に対して通知することができる。
これにより、管理者は、サーバ異常やサーバ異常前の異変に気づき、適切な対処をすることが可能となる。
As described above, in this embodiment, for example, by monitoring the monitoring element information related to the hardware of the
As a result, the administrator becomes aware of the server abnormality or the abnormality before the server abnormality and can take appropriate measures.
本発明は、データベースセンターなどの大量のサーバを一元管理しているシステムなどに対して有用に適用することができる。 The present invention can be usefully applied to a system that centrally manages a large number of servers such as a database center.
10、15 サーバ
11、16 監視ソフトウェア
20、25 センサ群
30 判断通信装置
40 データベース
50 監視端末
10, 15
Claims (5)
前記ハードウェアおよびソフトウェア動作状態情報間における動作状態変化を示す相関関係を動作状態関係情報として予め記憶する関係情報データベースと、
前記取得された前記ハードウェアおよびソフトウェア動作状態情報から動作状態の変化の仕方に相関関係のある前記ハードウェアおよびソフトウェア動作状態情報を抽出する相関状態情報抽出部と、
前記抽出されたハードウェアおよびソフトウェア動作状態情報の相関関係と前記動作状態関係情報とが異なるか否かを比較判定することにより前記監視対象部における動作異常を検出する相関動作異常判定手段とを備えたことを特徴とする端末動作監視システム。 A hardware operation state monitoring unit that acquires hardware operation state information indicating an operation state of a preset monitoring target unit included in the computer terminal by a preset sensor unit, and an operation state of the monitoring target unit A software operation state monitoring unit that acquires software operation state information that can be detected by execution processing of a preset program, and an operation abnormality of the monitoring target unit that is detected based on the hardware and software operation state information is set in advance. A terminal operation monitoring system comprising an operation abnormality notification unit for notifying the operation state display unit,
A relationship information database that stores in advance a correlation indicating an operation state change between the hardware and software operation state information as operation state relationship information;
A correlation state information extraction unit that extracts the hardware and software operation state information correlated with the manner of change of the operation state from the acquired hardware and software operation state information;
Correlation operation abnormality determining means for detecting an operation abnormality in the monitoring target unit by comparing and determining whether or not the correlation between the extracted hardware and software operation state information differs from the operation state relationship information. A terminal operation monitoring system characterized by that.
前記監視対象部は、前記センサ部により動作状態を示すハードウェア動作状態情報が取得可能なハードウェア監視対象部と前記予め設定されたプログラムの実行処理により前記ソフトウェア動作状態情報を取得することが可能なソフトウェア監視対象部とを含むことを特徴とする端末動作監視システム。 The terminal operation monitoring system according to claim 1,
The monitoring target unit can acquire the software operation state information by a hardware monitoring target unit capable of acquiring hardware operation state information indicating an operation state by the sensor unit and execution processing of the preset program. A terminal operation monitoring system comprising: a software monitoring target unit.
前記動作状態表示部は、前記前記監視対象部における動作異常が検出された場合に、当該動作異常の回避用に予め設定された動作異常解決手順情報を前記コンピュータ端末に対して送信する動作異常回避手順通知機能を備え、
前記コンピュータ端末は、前記動作異常解決手順情報に基づき前記監視対象部における動作異常の解決手順実行を行う動作異常解決実行手段を備えたことを特徴とする端末動作監視システム。 The terminal operation monitoring system according to claim 1,
The operation state display unit, when an operation abnormality is detected in the monitoring target unit, transmits operation abnormality solution procedure information set in advance for avoiding the operation abnormality to the operation terminal. It has a procedure notification function,
The terminal operation monitoring system characterized in that the computer terminal comprises operation abnormality solution executing means for executing an operation error solution procedure in the monitoring target unit based on the operation error solution procedure information.
前記ハードウェアおよびソフトウェア監視要素情報を取得し、当該ハードウェアおよびソフトウェア動作状態情報それぞれから動作状態の変化の仕方に相関関係のあるハードウェアおよびソフトウェア動作状態情報を抽出し、
抽出された前記ハードウェアおよびソフトウェア動作状態情報の相関関係と予め設定された前記動作状態関係情報とが異なるか否かの判定を行い、
前記相関関係が前記動作状態関係情報と異なる場合に予め設定された動作状態表示部に対し前記監視対象部の動作状態を動作異常として通知することを特徴とする端末動作監視方法。 A hardware operation state monitoring unit that acquires hardware operation state information indicating an operation state of a preset monitoring target unit included in the computer terminal by a preset sensor unit, and an operation state of the monitoring target unit A software operation state monitoring unit that acquires software operation state information that can be detected by execution processing of a preset program, and stores operation relationship information that is set in advance as an operation state change relationship between the hardware and software operation state information A terminal operation monitoring system comprising a relational information database to detect an operation abnormality of the monitoring target unit,
Obtaining the hardware and software monitoring element information, extracting hardware and software operating state information correlated with how the operating state changes from the hardware and software operating state information,
It is determined whether the correlation between the extracted hardware and software operation state information is different from the preset operation state relationship information,
A terminal operation monitoring method comprising: notifying an operation state of the monitoring target unit as an operation abnormality to a preset operation state display unit when the correlation is different from the operation state relationship information.
前記ハードウェアおよびソフトウェア監視要素情報を取得し、当該ハードウェアおよびソフトウェア動作状態情報それぞれから動作状態の変化の仕方に相関関係のあるハードウェアおよびソフトウェア動作状態情報を抽出する相関状態情報抽出機能と、
抽出された前記ハードウェアおよびソフトウェア動作状態情報の相関関係と予め設定された前記動作状態関係情報とが異なるか否かの判定を行う相関動作異常判定機能と、
前記相関関係が前記動作状態関係情報と異なる場合に予め設定された動作状態表示部に対し前記監視対象部の動作状態を動作異常として通知する処理を行う動作異常通知機能とを予め設定されたコンピュータに実行させることを特徴とする端末動作監視プログラム。 A hardware operation state monitoring unit that acquires hardware operation state information indicating an operation state of a preset monitoring target unit included in the computer terminal by a preset sensor unit, and an operation state of the monitoring target unit A software operation state monitoring unit that acquires software operation state information that can be detected by execution processing of a preset program, and stores operation relationship information that is set in advance as an operation state change relationship between the hardware and software operation state information A terminal operation monitoring system comprising a relational information database to detect an operation abnormality of the monitoring target unit,
A correlation state information extraction function for acquiring the hardware and software monitoring element information, and extracting hardware and software operation state information correlated with how to change the operation state from each of the hardware and software operation state information;
A correlation operation abnormality determination function for determining whether or not the correlation between the extracted hardware and software operation state information differs from the preset operation state relationship information;
A computer in which an operation abnormality notification function for performing a process of notifying the operation state of the monitoring target unit as an operation abnormality to a preset operation state display unit when the correlation is different from the operation state relation information is set in advance A terminal operation monitoring program that is executed by a computer.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009179597A JP2011034319A (en) | 2009-07-31 | 2009-07-31 | Terminal operation state monitoring system, terminal operation state monitoring method, and terminal operation state monitoring program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009179597A JP2011034319A (en) | 2009-07-31 | 2009-07-31 | Terminal operation state monitoring system, terminal operation state monitoring method, and terminal operation state monitoring program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011034319A true JP2011034319A (en) | 2011-02-17 |
Family
ID=43763331
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009179597A Withdrawn JP2011034319A (en) | 2009-07-31 | 2009-07-31 | Terminal operation state monitoring system, terminal operation state monitoring method, and terminal operation state monitoring program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011034319A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111190758A (en) * | 2019-12-19 | 2020-05-22 | 江苏新质信息科技有限公司 | Method for realizing equipment state self-recovery based on combination of FPGA (field programmable Gate array) calculation rule and RPC (remote procedure call) monitoring |
-
2009
- 2009-07-31 JP JP2009179597A patent/JP2011034319A/en not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111190758A (en) * | 2019-12-19 | 2020-05-22 | 江苏新质信息科技有限公司 | Method for realizing equipment state self-recovery based on combination of FPGA (field programmable Gate array) calculation rule and RPC (remote procedure call) monitoring |
CN111190758B (en) * | 2019-12-19 | 2022-01-14 | 江苏新质信息科技有限公司 | Method for realizing equipment state self-recovery based on combination of FPGA (field programmable Gate array) calculation rule and RPC (remote procedure call) monitoring |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5571847B2 (en) | Anomaly detection system that detects anomalies in multiple control systems | |
US9760468B2 (en) | Methods and arrangements to collect data | |
JP4573179B2 (en) | Performance load abnormality detection system, performance load abnormality detection method, and program | |
JP6585482B2 (en) | Device diagnostic apparatus and system and method | |
JP2008527554A5 (en) | ||
US20080270851A1 (en) | Method and system for managing apparatus performance | |
WO2013069138A1 (en) | Operation information prediction computer, operation information prediction method and program | |
US20120136970A1 (en) | Computer system and method for managing computer device | |
JP5933386B2 (en) | Data management apparatus and program | |
JPWO2012046293A1 (en) | Fault monitoring apparatus, fault monitoring method and program | |
WO2018085320A1 (en) | Content-aware anomaly detection and diagnosis | |
JP2008090504A (en) | Computer maintenance support system and analysis server | |
WO2016159039A1 (en) | Relay device and program | |
JP2014021577A (en) | Apparatus, system, method, and program for failure prediction | |
JP2012080181A (en) | Method and program for fault information management | |
JP2006268515A (en) | Pci card trouble management system | |
JP2011034319A (en) | Terminal operation state monitoring system, terminal operation state monitoring method, and terminal operation state monitoring program | |
US7085681B1 (en) | Symbiotic interrupt/polling approach for monitoring physical sensors | |
US20150149827A1 (en) | Identifying a change to indicate a degradation within a computing device | |
JP2010134525A (en) | Failure monitor, failure-monitoring method and failure monitoring program for electronic device | |
JP2004253035A (en) | Disk drive quality monitor system, method and program | |
JP4937194B2 (en) | System, method, and program for estimating when application is unresponsive | |
JP2018191217A (en) | Data monitoring apparatus, data monitoring method, and data monitoring program | |
JP5958987B2 (en) | Information processing device, failure diagnosis control device, failure determination method, failure determination program | |
EP2698716A2 (en) | Failure detecting device, failure detecting method, and failure detecting program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20121002 |