JP2009258955A - Monitoring device, monitoring system, monitoring method, and monitoring program - Google Patents

Monitoring device, monitoring system, monitoring method, and monitoring program Download PDF

Info

Publication number
JP2009258955A
JP2009258955A JP2008106589A JP2008106589A JP2009258955A JP 2009258955 A JP2009258955 A JP 2009258955A JP 2008106589 A JP2008106589 A JP 2008106589A JP 2008106589 A JP2008106589 A JP 2008106589A JP 2009258955 A JP2009258955 A JP 2009258955A
Authority
JP
Japan
Prior art keywords
monitoring
abnormality
monitoring result
threshold
failure message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008106589A
Other languages
Japanese (ja)
Inventor
Shin Sugimoto
新 杉本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solution Innovators Ltd
Original Assignee
NEC Software Chubu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Software Chubu Ltd filed Critical NEC Software Chubu Ltd
Priority to JP2008106589A priority Critical patent/JP2009258955A/en
Publication of JP2009258955A publication Critical patent/JP2009258955A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a monitoring device for suppressing a monitoring device from notifying a failure message when abnormality is occurred in a monitoring object, and abnormality is momentary abnormality, and for quickly notifying the failure message when the abnormality is not momentary abnormality. <P>SOLUTION: This monitoring device includes: an abnormality detection part for detecting the abnormality of a monitoring object; a momentary abnormality determination part for determining whether or not the abnormality of the monitoring object is momentary abnormality based on the monitoring result value of the monitoring object until abnormality is detected; and a failure message notification part for notifying the failure message when the abnormality of the monitoring object is not momentary abnormality. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明は監視装置、監視システム、監視方法、及び監視プログラムに関し、特に、監視対象の異常が瞬間的な異常か否かを判断する監視装置、監視システム、監視方法、及び監視プログラムに関する。   The present invention relates to a monitoring device, a monitoring system, a monitoring method, and a monitoring program, and more particularly to a monitoring device, a monitoring system, a monitoring method, and a monitoring program that determine whether an abnormality of a monitoring target is an instantaneous abnormality.

運用監視システムの重要な機能のひとつとして、監視装置が監視対象の異常を検知した際に管理者に障害メッセージを通知する機能がある。ここで、監視装置が検出した異常の内、監視装置がメッセージの通知を必要とする場合としない場合がある。例えば、アプリケーションが処理を行うことで発生するCPU(Central Processing Unit)への負荷が長時間に亘り高い場合は運用に影響を与える可能性があり、監視装置は管理者に通知する必要がある。しかし、瞬間的な高負荷の場合は運用へ与える影響はほとんどなく、監視装置が障害メッセージを通知することで、逆に管理者に余計な作業が発生する可能性がある。   One of the important functions of the operation monitoring system is a function for notifying the administrator of a failure message when the monitoring device detects an abnormality to be monitored. Here, among the abnormalities detected by the monitoring device, the monitoring device may or may not require message notification. For example, when a load on a CPU (Central Processing Unit) generated by processing by an application is high for a long time, the operation may be affected, and the monitoring device needs to notify the administrator. However, in the case of a momentary high load, there is almost no influence on the operation, and if the monitoring device notifies a failure message, there is a possibility that an extra work may occur for the administrator.

ここで、監視システムの一例が特許文献1に記載されている。特許文献1の監視装置は、例えば、CPUの高負荷を示すメッセージを受信すると初回はそれを提示せず、同じメッセージを7回受信するまでメッセージを提示せず抑止する。監視装置が、最初のメッセージを受信してから560秒が経過するまでに同じメッセージを8回受信すると、監視装置は、そのメッセージをオペレータに提示するとともに連続抑止機能を解除する。   Here, an example of a monitoring system is described in Patent Document 1. For example, when the monitoring device of Patent Document 1 receives a message indicating a high load on the CPU, it does not present it for the first time and suppresses it without presenting the message until the same message is received seven times. When the monitoring device receives the same message eight times after 560 seconds elapses after receiving the first message, the monitoring device presents the message to the operator and cancels the continuous inhibition function.

特開2006−252460号公報(段落番号0030)JP 2006-252460 A (paragraph number 0030)

しかしながら、上述の特許文献1の監視装置では、瞬間的な高負荷ではなくオペレータに速やかにメッセージを提示できるときであっても、メッセージを提示しないという問題点があった。例えば、CPUの負荷が徐々に上昇し所定の閾値を超過した場合、CPUに瞬間的に高い負荷がかかっているわけではないので、監視装置がオペレータに速やかにメッセージを通知することが望ましい。しかしながらこのような場合でも、特許文献1の監視装置は最初のメッセージを受信してから560秒が経過するまでに同じメッセージを8回受信するまでメッセージをオペレータに通知できない。   However, the above-described monitoring apparatus disclosed in Patent Document 1 has a problem that a message is not presented even when a message can be promptly presented to an operator instead of an instantaneous high load. For example, when the load on the CPU gradually increases and exceeds a predetermined threshold value, it is desirable that the monitoring device immediately notifies the operator of the message because the CPU is not instantaneously loaded with a high load. However, even in such a case, the monitoring device of Patent Document 1 cannot notify the operator of the message until the same message is received eight times until 560 seconds elapse after receiving the first message.

本発明の目的は、上記課題を解決する監視装置、監視システム、監視方法、及び監視プログラムを提供することにある。   The objective of this invention is providing the monitoring apparatus, the monitoring system, the monitoring method, and the monitoring program which solve the said subject.

本発明の監視装置は、監視対象の異常を検出する異常検出部と、異常が検出されるまでの監視対象の監視結果値を基に、監視対象の異常が瞬間的な異常か否かを判断する瞬間的異常判断部と、監視対象の異常が瞬間的な異常ではなかった場合に、障害メッセージを通知する障害メッセージ通知部とを含む。   The monitoring apparatus of the present invention determines whether or not the abnormality of the monitoring target is a momentary abnormality based on the abnormality detection unit that detects the abnormality of the monitoring target and the monitoring result value of the monitoring target until the abnormality is detected And a failure message notifying unit for notifying a failure message when the monitored abnormality is not a momentary abnormality.

本発明の監視システムは、監視対象の異常を検出する異常検出部と、異常が検出されるまでの監視対象の監視結果値を基に、監視対象の異常が瞬間的な異常か否かを判断する瞬間的異常判断部と、監視対象の異常が瞬間的な異常ではなかった場合に、障害メッセージを通知する障害メッセージ通知部とを含む監視装置と、監視装置が監視する監視対象とを含む。   The monitoring system of the present invention determines whether or not the abnormality of the monitoring target is an instantaneous abnormality based on the abnormality detection unit that detects the abnormality of the monitoring target and the monitoring result value of the monitoring target until the abnormality is detected And a monitoring device including a failure message notification unit that notifies a failure message when the abnormality of the monitoring target is not a momentary abnormality, and a monitoring target monitored by the monitoring device.

本発明の監視方法は、監視対象の異常を検出し、異常が検出されるまでの監視対象の監視結果値を基に、監視対象の異常が瞬間的な異常か否かを判断し、監視対象の異常が瞬間的な異常ではなかった場合に、障害メッセージを通知する。   The monitoring method of the present invention detects an abnormality of a monitoring target, determines whether the monitoring target abnormality is a momentary abnormality based on the monitoring result value of the monitoring target until the abnormality is detected, and When the abnormality is not a momentary abnormality, a failure message is notified.

本発明のプログラムは、コンピュータに、監視対象の異常を検出する異常検出手段と、異常が検出されるまでの監視対象の監視結果値を基に、監視対象の異常が瞬間的な異常か否かを判断する瞬間的異常判断手段と、監視対象の異常が瞬間的な異常ではなかった場合に、障害メッセージを通知する障害メッセージ通知手段として機能させる。   The program of the present invention is based on the abnormality detection means for detecting the abnormality of the monitoring target in the computer and the monitoring result value of the monitoring target until the abnormality is detected. And a failure message notification means for notifying a failure message when the monitored abnormality is not a momentary abnormality.

本発明は、監視対象に異常が発生しその異常が瞬間的な異常であった場合に、監視装置が障害メッセージを通知することを抑止しつつ、異常が瞬間的な異常ではなかった場合に、監視装置が速やかに障害メッセージを通知することができる、という効果を有する。   In the present invention, when an abnormality occurs in the monitoring target and the abnormality is a momentary abnormality, the monitoring device is prevented from notifying a failure message, and when the abnormality is not a momentary abnormality, There is an effect that the monitoring device can promptly notify the failure message.

まず、本発明の概要について説明する。図1は、本発明の監視システム100の概要構成を示す図である。   First, an outline of the present invention will be described. FIG. 1 is a diagram showing a schematic configuration of a monitoring system 100 of the present invention.

本発明の監視システム100は、監視装置010と、監視対象020とを含む。   The monitoring system 100 of the present invention includes a monitoring device 010 and a monitoring target 020.

監視装置010は、異常検出部012と、瞬間的異常判断部014と、障害メッセージ通知部015とを含む。異常検出部012は、監視対象020の異常を検出する。瞬間的異常判断部014は、異常が検出されるまでの監視対象020の監視結果値を基に、監視対象020の異常が瞬間的な異常か否かを判断する。障害メッセージ通知部015は、監視対象020の異常が瞬間的な異常ではなかった場合に、障害メッセージを通知する。   Monitoring device 010 includes an abnormality detection unit 012, an instantaneous abnormality determination unit 014, and a failure message notification unit 015. The abnormality detection unit 012 detects an abnormality of the monitoring target 020. The instantaneous abnormality determination unit 014 determines whether the abnormality of the monitoring target 020 is an instantaneous abnormality based on the monitoring result value of the monitoring target 020 until the abnormality is detected. The failure message notification unit 015 notifies a failure message when the abnormality of the monitoring target 020 is not a momentary abnormality.

本発明の監視システム100は、以下の効果を有する。即ち、監視対象020に異常が発生しその異常が瞬間的な異常であった場合に、監視装置010が障害メッセージを通知することを抑止することができる。一方、異常が瞬間的な異常ではなかった場合に、監視装置010が速やかに障害メッセージを通知することができる。   The monitoring system 100 of the present invention has the following effects. That is, when an abnormality occurs in the monitoring target 020 and the abnormality is a momentary abnormality, the monitoring apparatus 010 can be prevented from reporting a failure message. On the other hand, when the abnormality is not a momentary abnormality, the monitoring device 010 can promptly notify a failure message.

その理由は、本発明の監視装置010は、異常が検出されるまでの監視対象020の監視結果値を基に、監視対象020の瞬間的な異常を検出する瞬間的異常判断部014を含むためである。   The reason is that the monitoring apparatus 010 of the present invention includes an instantaneous abnormality determination unit 014 that detects an instantaneous abnormality of the monitoring target 020 based on the monitoring result value of the monitoring target 020 until the abnormality is detected. It is.

次に、本発明の実施の形態について図面を参照して詳細に説明する。図2は、本発明の実施の形態における監視システム100の構成を示す図である。   Next, embodiments of the present invention will be described in detail with reference to the drawings. FIG. 2 is a diagram showing a configuration of the monitoring system 100 according to the embodiment of the present invention.

本発明の実施の形態における監視システム100は、監視装置010と、監視対象020とを含む。   The monitoring system 100 according to the embodiment of the present invention includes a monitoring device 010 and a monitoring target 020.

監視装置010は、サーバなどの情報処理装置であり、プログラム制御で動作するCPU(Central Processing Unit)を含み、CPUがプログラム記憶媒体に記憶されたプログラムを実行することにより各種機能を実現する。監視装置010は、所定の監視間隔で監視対象020に監視結果値の出力を命令し、監視対象020から監視結果値を入力する。監視装置010は、実績テーブル書き込み部011と、異常検出部012と、実績テーブル読み出し部013と、瞬間的異常判断部014と、障害メッセージ通知部015と、記憶部016とを含む。   The monitoring device 010 is an information processing device such as a server, and includes a CPU (Central Processing Unit) that operates under program control. The monitoring device 010 implements various functions by executing a program stored in a program storage medium. The monitoring device 010 instructs the monitoring target 020 to output a monitoring result value at a predetermined monitoring interval, and inputs the monitoring result value from the monitoring target 020. The monitoring device 010 includes a result table writing unit 011, an abnormality detection unit 012, a result table reading unit 013, an instantaneous abnormality determination unit 014, a failure message notification unit 015, and a storage unit 016.

実績テーブル書き込み部011は、監視時間、監視間隔、監視結果値を記憶部016に含まれる実績テーブルに書き込む。   The record table writing unit 011 writes the monitoring time, the monitoring interval, and the monitoring result value in the record table included in the storage unit 016.

異常検出部012は、監視結果値が監視結果閾値を超過したか判断する。   The abnormality detection unit 012 determines whether the monitoring result value exceeds the monitoring result threshold value.

実績テーブル読み出し部013は、監視結果値が監視結果閾値を超過した場合、適用回数分の監視結果が存在するか判断する。適用回数とは、後述の瞬間的異常判断部014が利用する、今回の監視結果値より前の直近の監視結果値の数である。監視装置010の操作者が予め記憶部016に適用回数を格納する。そして、実績テーブル読み出し部013は、適用回数分の監視結果値を記憶部016の実績テーブルから読み出す。   When the monitoring result value exceeds the monitoring result threshold, the result table reading unit 013 determines whether there are monitoring results corresponding to the number of times of application. The application count is the number of the latest monitoring result values before the current monitoring result value, which is used by the instantaneous abnormality determination unit 014 described later. The operator of the monitoring device 010 stores the application count in the storage unit 016 in advance. Then, the result table reading unit 013 reads the monitoring result values corresponding to the number of application times from the result table of the storage unit 016.

瞬間的異常判断部014は、監視結果値の増加度を算出する。又、瞬間的異常判断部014は、監視結果値の増加度が増加度閾値を超過したか否かを判断する。   The instantaneous abnormality determination unit 014 calculates the degree of increase in the monitoring result value. Also, the instantaneous abnormality determination unit 014 determines whether or not the increase degree of the monitoring result value exceeds the increase degree threshold value.

障害メッセージ通知部015は、適用回数分の監視結果値が存在しなかった場合、又は、監視結果値の増加度が増加度閾値を超過しなかった場合、障害メッセージを通知する。   The failure message notification unit 015 notifies a failure message when there are no monitoring result values corresponding to the number of times of application or when the increase degree of the monitoring result value does not exceed the increase threshold.

監視対象020は、例えば、サーバなどの監視対象装置である。監視対象020は、監視装置010からの監視結果値の出力命令を受けると、監視装置010に監視結果値を出力する。   The monitoring target 020 is a monitoring target device such as a server, for example. Upon receiving the monitoring result value output command from the monitoring device 010, the monitoring target 020 outputs the monitoring result value to the monitoring device 010.

図3は、本発明の実施の形態における実績テーブルの例を示す図である。実績テーブルは、監視時間、監視間隔、監視結果値を含む。記憶部016が実績テーブルを含み、実績テーブル書き込み部011が監視間隔ごとに各値を実績テーブルに書込む。図3(a)と図3(b)の具体的な値の例の内容については、後述する。   FIG. 3 is a diagram showing an example of a performance table in the embodiment of the present invention. The actual result table includes a monitoring time, a monitoring interval, and a monitoring result value. The storage unit 016 includes an actual result table, and the actual result table writing unit 011 writes each value into the actual result table at every monitoring interval. The contents of specific value examples in FIGS. 3A and 3B will be described later.

図4は、本発明の実施の形態における記憶部016に予め登録される値の例を示した図である。   FIG. 4 is a diagram illustrating an example of values registered in advance in the storage unit 016 according to the embodiment of the present invention.

図4(a)は、監視間隔の値の例である。   FIG. 4A shows an example of the monitoring interval value.

図4(b)は、適用回数の値の例である。実績テーブル読み出し部013は、記憶部016から監視結果値を読み出すが、監視結果値の内、この適用回数の値に示された数の直近の監視結果値を読み出す。   FIG. 4B is an example of the value of the number of times of application. The result table reading unit 013 reads the monitoring result value from the storage unit 016, and reads the latest monitoring result value of the number indicated in the value of the number of application times among the monitoring result values.

図4(c)は、監視結果閾値と増加度閾値の例である。監視結果閾値は、異常検出部012が監視対象020の異常を検出するため、監視結果値との比較に用いられる閾値である。増加度閾値は、瞬間的異常判断部014が瞬間的異常を検出するために監視結果値の増加度との比較に用いる閾値である。   FIG. 4C is an example of the monitoring result threshold value and the increase degree threshold value. The monitoring result threshold value is a threshold value used for comparison with the monitoring result value because the abnormality detection unit 012 detects an abnormality of the monitoring target 020. The increase degree threshold is a threshold used by the instantaneous abnormality determination unit 014 for comparison with the increase degree of the monitoring result value in order to detect an instantaneous abnormality.

図5は、本発明の実施の形態における監視装置010の動作を示すフローチャートである。監視装置010が運用を開始する前に、操作者が予め図4(a)(b)(c)に示す監視間隔、適用回数、監視結果閾値、増加度閾値を記憶部016に格納する。監視装置010は、運用開始と共に記憶部016に格納された監視間隔ごとに監視結果値を監視対象020から入力する。そして、監視装置010は、次に示すフローチャートに示した動作を開始する。   FIG. 5 is a flowchart showing the operation of the monitoring apparatus 010 in the embodiment of the present invention. Before the monitoring device 010 starts operation, the operator stores the monitoring interval, the number of times of application, the monitoring result threshold value, and the increase threshold value shown in FIGS. 4A, 4B, and 4C in the storage unit 016 in advance. The monitoring apparatus 010 inputs a monitoring result value from the monitoring target 020 for each monitoring interval stored in the storage unit 016 when the operation starts. And the monitoring apparatus 010 starts the operation | movement shown to the following flowchart.

まず、実績テーブル書き込み部011が、監視時間、監視間隔、監視結果値を実績テーブルに書き込む(S101)。   First, the performance table writing unit 011 writes the monitoring time, the monitoring interval, and the monitoring result value in the performance table (S101).

次に、異常検出部012が、監視結果値が監視結果閾値を超過したか否かを判断する(S102)。即ち、異常検出部012は、図3に示す監視結果値と図4(c)に示す監視結果閾値とを比較し、監視結果値が監視結果閾値を超過したか否かを判断する。監視結果値が監視結果閾値を超過していない場合(S102,No)、本発明の実施の形態は、今回の監視タイミングにおける監視装置010の動作を終了する。   Next, the abnormality detection unit 012 determines whether or not the monitoring result value exceeds the monitoring result threshold (S102). That is, the abnormality detection unit 012 compares the monitoring result value shown in FIG. 3 with the monitoring result threshold value shown in FIG. 4C, and determines whether or not the monitoring result value exceeds the monitoring result threshold value. When the monitoring result value does not exceed the monitoring result threshold value (S102, No), the embodiment of the present invention ends the operation of the monitoring device 010 at the current monitoring timing.

監視結果値が監視結果閾値を超過していた場合(S102,Yes)、実績テーブル読み出し部013が、適用回数分の監視結果値が存在するか否かを判断する(S103)。   When the monitoring result value exceeds the monitoring result threshold (S102, Yes), the result table reading unit 013 determines whether there are monitoring result values for the number of application times (S103).

適用回数分の監視結果値が存在した場合(S103,Yes)、実績テーブル読み出し部013が、適用回数分の監視結果値を読み出す(S104)。即ち、実績テーブル読み出し部013は、図4(b)に示す適用回数分(3回分)であり、図3に示す直近の監視結果値(例、100%を上限とするCPU使用率)を読み出す。例えば、図3(a)に示す例では、実績テーブル読み出し部013は、監視結果値(「50」「60」「70」)を読み出す。図3(b)に示す例では、実績テーブル読み出し部013は、監視結果値(「20」「20」「20」)を読み出す。   When there are monitoring result values for the number of application times (S103, Yes), the result table reading unit 013 reads the monitoring result values for the number of application times (S104). That is, the result table reading unit 013 reads the latest monitoring result value (for example, the CPU usage rate with an upper limit of 100%) shown in FIG. 3 for the number of times of application (3 times) shown in FIG. . For example, in the example shown in FIG. 3A, the record table reading unit 013 reads the monitoring result values (“50”, “60”, “70”). In the example shown in FIG. 3B, the record table reading unit 013 reads the monitoring result values (“20”, “20”, “20”).

次に、瞬間的異常判断部014が、監視結果値の増加度を算出する(S105)。即ち、瞬間的異常判断部014は、監視結果値の内、適用回数分の直近の監視結果値それぞれと今回の監視結果値との差分を算出する。   Next, the instantaneous abnormality determination unit 014 calculates the increase degree of the monitoring result value (S105). That is, the instantaneous abnormality determination unit 014 calculates a difference between each of the latest monitoring result values corresponding to the number of application and the current monitoring result value among the monitoring result values.

図3(a)に示す例では、瞬間的異常判断部014は、適用回数分(3回分)の直近の監視結果値それぞれ(「50」「60」「70」)と今回の監視結果値「85」との差分(「35」「25」「15」)を算出する。   In the example illustrated in FIG. 3A, the instantaneous abnormality determination unit 014 has the latest monitoring result values (“50”, “60”, “70”) corresponding to the number of application times (three times) and the current monitoring result value “ The difference from “85” (“35” “25” “15”) is calculated.

図3(b)に示す例では、瞬間的異常判断部014は、適用回数分(3回分)の直近の監視結果値それぞれ(「20」「20」「20」)と今回の監視結果値「85」との差分(「65」「65」「65」)を算出する。   In the example illustrated in FIG. 3B, the instantaneous abnormality determination unit 014 has the latest monitoring result values (“20”, “20”, “20”) corresponding to the number of times of application (three times) and the current monitoring result value “ The difference from “85” (“65” “65” “65”) is calculated.

次に、瞬間的異常判断部014が、監視結果値の増加度が増加度閾値を超過したか否かを判断する(S106)。即ち、瞬間的異常判断部014は、適用回数分の直近の監視結果値それぞれと今回の監視結果値との差分の内、いずれか一つでも図4(c)に示す監視結果値の増加度に対する閾値(増加度閾値)を超過したか判断する。   Next, the instantaneous abnormality determination unit 014 determines whether or not the increase degree of the monitoring result value exceeds the increase degree threshold value (S106). That is, the instantaneous abnormality determination unit 014 increases the degree of increase in the monitoring result value shown in FIG. 4C among any one of the differences between the latest monitoring result values corresponding to the number of application times and the current monitoring result value. It is determined whether or not a threshold value (increase degree threshold value) is exceeded.

図3(a)に示す例では、S105で算出した差分(増加度)は、「35」「25」「15」であるので、いずれも図4(c)に示す増加度閾値「60」よりも小さい。そのため、監視結果値の増加度が増加度閾値を超過していない。図3(a)に示す例では、S105で算出した差分(増加度)は、「65」「65」「65」であるので、いずれも図4(c)に示す増加度閾値(「60」)よりも大きい。そのため、監視結果値の増加度が増加度閾値を超過している。このように、瞬間的異常判断部014は、実績テーブル(異常が検出されるまでの監視対象020の監視結果値)を基に、監視結果値の増加度が増加度閾値を超過したか(瞬間的な異常であるか)判断する。   In the example shown in FIG. 3A, the difference (increase degree) calculated in S105 is “35”, “25”, and “15”, so that both of them are higher than the increase degree threshold value “60” shown in FIG. Is also small. Therefore, the increase degree of the monitoring result value does not exceed the increase degree threshold value. In the example shown in FIG. 3A, the difference (increase) calculated in S105 is “65”, “65”, and “65”, and therefore, the increase threshold (“60”) shown in FIG. Bigger than). Therefore, the increase degree of the monitoring result value exceeds the increase degree threshold value. As described above, the instantaneous abnormality determination unit 014 determines whether the increase degree of the monitoring result value exceeds the increase degree threshold based on the result table (the monitoring result value of the monitoring target 020 until the abnormality is detected). To determine if it is a normal abnormality).

監視結果値の増加度が増加度閾値を超過した場合(S106,Yes)、本発明の実施の形態は、今回の監視タイミングにおける監視装置010の動作を終了する。   When the degree of increase in the monitoring result value exceeds the degree of increase threshold (S106, Yes), the embodiment of the present invention ends the operation of the monitoring device 010 at the current monitoring timing.

適用回数分の監視結果値が存在しなかった場合(S103,No)、又は、監視結果値の増加度が増加度閾値を超過していなかった場合(S106,No)、監視装置010は、障害メッセージを通知する(S107)。例えば、監視装置010は、障害が発生したことを監視装置010のディスプレイ(図示せず)に表示する。   When there are no monitoring result values corresponding to the number of times of application (S103, No), or when the increase degree of the monitoring result value does not exceed the increase degree threshold (S106, No), the monitoring device 010 is in trouble. A message is notified (S107). For example, the monitoring device 010 displays that a failure has occurred on a display (not shown) of the monitoring device 010.

本発明の実施の形態は、監視対象020に異常が発生し(監視結果値が監視結果閾値を超過し)たけれども、その異常が瞬間的な異常であった場合に、監視装置010が障害メッセージを通知することを抑止することができる。一方、異常が瞬間的な異常ではなかった場合に、監視装置010が速やかに障害メッセージを通知することができる。   In the embodiment of the present invention, when an abnormality occurs in the monitoring target 020 (the monitoring result value exceeds the monitoring result threshold), but the abnormality is an instantaneous abnormality, the monitoring apparatus 010 displays a failure message. Can be prevented from being notified. On the other hand, when the abnormality is not a momentary abnormality, the monitoring device 010 can promptly notify a failure message.

その理由は、監視装置010が、異常が検出されるまでの監視対象020の監視結果値を基に、監視対象020の瞬間的な異常を検出する瞬間的異常判断部014を含むためである。   This is because the monitoring apparatus 010 includes an instantaneous abnormality determination unit 014 that detects an instantaneous abnormality of the monitoring target 020 based on the monitoring result value of the monitoring target 020 until the abnormality is detected.

具体的には、瞬間的異常判断部014は、監視結果値の増加度と増加度閾値とを比較し瞬間的な異常であるか否かを判断し、瞬間的な異常である場合、障害メッセージの通知を抑制する。このとき、瞬間的異常判断部014は、異常が検出されるまでの監視対象020の監視結果値を基に、瞬間的な異常であるか判断する。即ち、瞬間的異常判断部014は、実績テーブルに既に格納されている監視結果値を用いて判断している。   Specifically, the instantaneous abnormality determination unit 014 compares the increase degree of the monitoring result value with the increase degree threshold to determine whether or not there is an instantaneous abnormality. Suppress notifications. At this time, the instantaneous abnormality determination unit 014 determines whether the abnormality is instantaneous based on the monitoring result value of the monitoring target 020 until the abnormality is detected. That is, the instantaneous abnormality determination unit 014 makes a determination using the monitoring result value already stored in the result table.

特許文献1(特開2006−252460号公報)に記載された監視装置は、CPUの高負荷の増加度ではなくCPUの高負荷を示すメッセージを8回受信するか否かを基に判断している。又、特許文献1に記載された監視装置は、初回のCPUの高負荷を示すメッセージ受信後に受信するメッセージを用いて判断しているため、速やかに瞬間的な異常であるか否かを判断できない。   The monitoring device described in Patent Document 1 (Japanese Patent Application Laid-Open No. 2006-252460) makes a judgment based on whether or not a message indicating a high CPU load is received eight times instead of an increase degree of the high CPU load. Yes. In addition, since the monitoring device described in Patent Document 1 makes a determination using a message received after receiving a message indicating a high CPU load for the first time, it cannot immediately determine whether or not there is an instantaneous abnormality. .

次に、本発明の実施の形態の変形例を示す。   Next, a modification of the embodiment of the present invention will be shown.

図5に示したS106の処理では、瞬間的異常判断部014は、適用回数分の直近の監視結果値それぞれと今回の監視結果値との差分(増加度)の内、いずれか一つでも図4(c)に示す増加度閾値を超過したか判断した。これに代えて、変形例は、瞬間的異常判断部014が、特定の数の、或いは、全ての差分(増加度)が増加度閾値を超過したか判断する、としてもよい。   In the process of S106 illustrated in FIG. 5, the instantaneous abnormality determination unit 014 may display any one of the differences (increases) between the latest monitoring result values corresponding to the number of application times and the current monitoring result value. It was determined whether the increase threshold shown in 4 (c) was exceeded. Instead of this, the instantaneous abnormality determination unit 014 may determine whether a specific number or all of the differences (increases) exceed the increase threshold.

又、変形例は、図5に示したS105,106の処理に代えて、図6に示すS205,206の処理を採用してもよい。即ち、変形例は、瞬間的異常判断部014が、監視結果値の平均を算出する(S205)、即ち、適用回数分の監視結果値から監視結果値の平均を算出する。そして、変形例は、瞬間的異常判断部014が、監視結果値の平均が平均閾値を超過したか否かを判断(S206)してもよい。この場合、操作者は、図4(c)に示した増加度閾値に代えて平均閾値を予め記憶部016に格納する。そして、変形例では、監視結果値の平均が平均閾値を超過していなかった場合ではなく、監視結果値の平均が平均閾値を超過していた場合(S206,Yes)に、障害メッセージ通知部015が障害メッセージを通知する(S207)。   Further, in the modified example, the processes of S205 and 206 shown in FIG. 6 may be adopted instead of the processes of S105 and 106 shown in FIG. That is, in the modification, the instantaneous abnormality determination unit 014 calculates the average of the monitoring result values (S205), that is, calculates the average of the monitoring result values from the monitoring result values for the number of times of application. In the modification, the instantaneous abnormality determination unit 014 may determine whether or not the average of the monitoring result values exceeds the average threshold (S206). In this case, the operator stores the average threshold value in advance in the storage unit 016 instead of the increase degree threshold value shown in FIG. In the modification, the failure message notification unit 015 is not used when the average of the monitoring result values does not exceed the average threshold but when the average of the monitoring result values exceeds the average threshold (S206, Yes). Notifies the failure message (S207).

又、変形例は、図5に示したS105,106の処理に代えて、図7に示すS305,306の処理を採用してもよい。即ち、変形例は、瞬間的異常判断部014が、適用回数分の監視結果値から監視結果値の合計を算出する(S305)、即ち、適用回数分の監視結果値から監視結果値の合計を算出する。そして、変形例は、瞬間的異常判断部014が、監視結果値の合計が合計閾値を超過したか否かを判断(S306)してもよい。この場合、操作者は、図4(c)に示した増加度閾値に代えて合計閾値を予め記憶部016に格納する。そして、変形例では、監視結果値の合計が合計閾値を超過していなかった場合ではなく、監視結果値の平均が平均閾値を超過していた場合(S306,Yes)に、障害メッセージ通知部015が障害メッセージを通知する(S307)。   Further, in the modified example, the processing of S305 and 306 shown in FIG. 7 may be adopted instead of the processing of S105 and 106 shown in FIG. That is, in the modification, the instantaneous abnormality determination unit 014 calculates the sum of the monitoring result values from the monitoring result values for the number of application times (S305), that is, calculates the sum of the monitoring result values from the monitoring result values for the number of application times. calculate. In the modification, the instantaneous abnormality determination unit 014 may determine whether or not the sum of the monitoring result values exceeds the total threshold value (S306). In this case, the operator stores the total threshold value in advance in the storage unit 016 instead of the increase degree threshold value shown in FIG. In the modification, the failure message notification unit 015 is not when the total of the monitoring result values does not exceed the total threshold value but when the average of the monitoring result values exceeds the average threshold value (S306, Yes). Notifies the failure message (S307).

図6、図7に示した変形例における瞬間的異常判断部014も、異常が検出されるまでの監視対象020の監視結果値を基に、監視対象020異常が瞬間的な異常であるか否かを判断できる。   The instantaneous abnormality determination unit 014 in the modification shown in FIGS. 6 and 7 also determines whether the monitoring target 020 abnormality is an instantaneous abnormality based on the monitoring result value of the monitoring target 020 until the abnormality is detected. Can be determined.

本発明の監視システム100の概要構成を示す図である。1 is a diagram showing a schematic configuration of a monitoring system 100 of the present invention. 本発明の実施の形態における監視システム100の構成を示す図である。It is a figure which shows the structure of the monitoring system 100 in embodiment of this invention. 本発明の実施の形態における実績テーブルの例を示す図である。It is a figure which shows the example of the performance table in embodiment of this invention. 本発明の実施の形態における記憶部016に予め登録される値の例を示した図である。It is the figure which showed the example of the value previously registered into the memory | storage part 016 in embodiment of this invention. 本発明の実施の形態における監視装置010の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the monitoring apparatus 010 in embodiment of this invention. 本発明の実施の形態における監視装置010の動作の変形例を示すフローチャートである。It is a flowchart which shows the modification of operation | movement of the monitoring apparatus 010 in embodiment of this invention. 本発明の実施の形態における監視装置010の動作の変形例を示すフローチャートである。It is a flowchart which shows the modification of operation | movement of the monitoring apparatus 010 in embodiment of this invention.

符号の説明Explanation of symbols

010 監視装置
011 実績テーブル書き込み部
012 異常検出部
013 実績テーブル読み出し部
014 瞬間的異常判断部
015 障害メッセージ通知部
016 記憶部
020 監視対象
100 監視システム
010 Monitoring device 011 Performance table writing unit 012 Abnormality detection unit 013 Performance table reading unit 014 Instantaneous abnormality determination unit 015 Fault message notification unit 016 Storage unit 020 Monitoring target 100 Monitoring system

Claims (12)

監視対象の異常を検出する異常検出部と、
異常が検出されるまでの前記監視対象の監視結果値を基に、前記監視対象の異常が瞬間的な異常か否かを判断する瞬間的異常判断部と、
前記監視対象の異常が瞬間的な異常ではなかった場合に、障害メッセージを通知する障害メッセージ通知部と
を含む監視装置。
An anomaly detector that detects an anomaly of the monitoring target;
Based on the monitoring result value of the monitoring target until an abnormality is detected, an instantaneous abnormality determination unit that determines whether the abnormality of the monitoring target is an instantaneous abnormality; and
And a failure message notification unit that notifies a failure message when the abnormality to be monitored is not a momentary abnormality.
前記異常検出部は、前記監視対象の監視結果値が監視結果値に対する閾値(監視結果閾値)を超過したことを検出し、
前記瞬間的異常判断部は、前記監視結果値が瞬間的に監視結果値に対する閾値を超過したか否かを判断し、
前記障害メッセージ通知部は、前記監視結果値が瞬間的に監視結果値に対する閾値を超過していなかった場合に障害メッセージを通知する
請求項1に記載の監視装置。
The abnormality detection unit detects that a monitoring result value of the monitoring target exceeds a threshold value (monitoring result threshold value) for the monitoring result value;
The instantaneous abnormality determination unit determines whether the monitoring result value instantaneously exceeds a threshold value for the monitoring result value;
The monitoring apparatus according to claim 1, wherein the failure message notification unit notifies a failure message when the monitoring result value does not instantaneously exceed a threshold for the monitoring result value.
前記瞬間的異常判断部は、監視結果値の増加度が、監視結果値の増加度に対する閾値(増加度閾値)を超過していなかった場合に、障害メッセージを通知する
請求項2に記載の監視装置。
The monitoring according to claim 2, wherein the instantaneous abnormality determination unit notifies a failure message when the degree of increase in the monitoring result value does not exceed a threshold (increase degree threshold) for the degree of increase in the monitoring result value. apparatus.
前記瞬間的異常判断部は、監視結果値の平均が、監視結果値の平均に対する閾値(平均閾値)を超過した場合に、障害メッセージを通知する
請求項2に記載の監視装置。
The monitoring apparatus according to claim 2, wherein the instantaneous abnormality determination unit notifies a failure message when an average of monitoring result values exceeds a threshold (average threshold) with respect to an average of monitoring result values.
前記瞬間的異常判断部は、監視結果値の合計が、監視結果値の合計に対する閾値(合計閾値)を超過した場合に、障害メッセージを通知する
請求項2に記載の監視装置。
The monitoring apparatus according to claim 2, wherein the instantaneous abnormality determination unit notifies a failure message when the sum of the monitoring result values exceeds a threshold value (total threshold value) for the sum of the monitoring result values.
監視対象の異常を検出する異常検出部と、
異常が検出されるまでの前記監視対象の監視結果値を基に、前記監視対象の異常が瞬間的な異常か否かを判断する瞬間的異常判断部と、
前記監視対象の異常が瞬間的な異常ではなかった場合に、障害メッセージを通知する障害メッセージ通知部と
を含む監視装置と、
監視装置が監視する前記監視対象と
を含む監視システム。
An anomaly detector that detects an anomaly of the monitoring target;
Based on the monitoring result value of the monitoring target until an abnormality is detected, an instantaneous abnormality determination unit that determines whether the abnormality of the monitoring target is an instantaneous abnormality; and
A monitoring device including a failure message notification unit for notifying a failure message when the abnormality to be monitored is not a momentary abnormality;
A monitoring system including the monitoring target monitored by a monitoring device.
監視対象の異常を検出し、
異常が検出されるまでの前記監視対象の監視結果値を基に、前記監視対象の異常が瞬間的な異常か否かを判断し、
前記監視対象の異常が瞬間的な異常ではなかった場合に、障害メッセージを通知する
監視方法。
Detect an abnormality in the monitoring target,
Based on the monitoring result value of the monitoring target until an abnormality is detected, determine whether the monitoring target abnormality is a momentary abnormality,
A monitoring method for notifying a failure message when the abnormality to be monitored is not a momentary abnormality.
前記監視対象の監視結果値が監視結果値に対する閾値(監視結果閾値)を超過したことを検出し、
前記監視結果値が瞬間的に監視結果値に対する閾値を超過したか否かを判断し、
前記監視結果値が瞬間的に監視結果値に対する閾値を超過していなかった場合に障害メッセージを通知する
請求項7に記載の監視方法。
Detecting that the monitoring result value of the monitoring target exceeds a threshold value (monitoring result threshold value) for the monitoring result value;
Determining whether the monitoring result value instantaneously exceeds a threshold value for the monitoring result value;
The monitoring method according to claim 7, wherein a failure message is notified when the monitoring result value does not instantaneously exceed a threshold for the monitoring result value.
監視結果値の増加度が、監視結果値の増加度に対する閾値(増加度閾値)を超過していなかった場合に、障害メッセージを通知する
請求項8に記載の監視方法。
The monitoring method according to claim 8, wherein a failure message is notified when the degree of increase in the monitoring result value does not exceed a threshold (increase degree threshold) for the degree of increase in the monitoring result value.
監視結果値の平均が、監視結果値の平均に対する閾値(平均閾値)を超過した場合に、障害メッセージを通知する
請求項8に記載の監視方法。
The monitoring method according to claim 8, wherein a failure message is notified when an average of monitoring result values exceeds a threshold (average threshold) with respect to an average of monitoring result values.
監視結果値の合計が、監視結果値の合計に対する閾値(合計閾値)を超過した場合に、障害メッセージを通知する
請求項8に記載の監視方法。
The monitoring method according to claim 8, wherein a failure message is notified when a total of the monitoring result values exceeds a threshold (total threshold) with respect to the total of the monitoring result values.
コンピュータに、
監視対象の異常を検出する異常検出手段と、
異常が検出されるまでの前記監視対象の監視結果値を基に、前記監視対象の異常が瞬間的な異常か否かを判断する瞬間的異常判断手段と、
前記監視対象の異常が瞬間的な異常ではなかった場合に、障害メッセージを通知する障害メッセージ通知手段
として機能させるためのプログラム。
On the computer,
An anomaly detection means for detecting an anomaly of the monitoring target;
Based on the monitoring result value of the monitoring target until an abnormality is detected, an instantaneous abnormality determining means for determining whether the monitoring target abnormality is an instantaneous abnormality;
A program for functioning as a failure message notification means for notifying a failure message when the monitored abnormality is not a momentary abnormality.
JP2008106589A 2008-04-16 2008-04-16 Monitoring device, monitoring system, monitoring method, and monitoring program Pending JP2009258955A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008106589A JP2009258955A (en) 2008-04-16 2008-04-16 Monitoring device, monitoring system, monitoring method, and monitoring program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008106589A JP2009258955A (en) 2008-04-16 2008-04-16 Monitoring device, monitoring system, monitoring method, and monitoring program

Publications (1)

Publication Number Publication Date
JP2009258955A true JP2009258955A (en) 2009-11-05

Family

ID=41386299

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008106589A Pending JP2009258955A (en) 2008-04-16 2008-04-16 Monitoring device, monitoring system, monitoring method, and monitoring program

Country Status (1)

Country Link
JP (1) JP2009258955A (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006024017A (en) * 2004-07-08 2006-01-26 Internatl Business Mach Corp <Ibm> System, method and program for predicting capacity of computer resource
JP2008003945A (en) * 2006-06-23 2008-01-10 Toshiba Corp Monitoring control system, and computer management method and program therefor

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006024017A (en) * 2004-07-08 2006-01-26 Internatl Business Mach Corp <Ibm> System, method and program for predicting capacity of computer resource
JP2008003945A (en) * 2006-06-23 2008-01-10 Toshiba Corp Monitoring control system, and computer management method and program therefor

Similar Documents

Publication Publication Date Title
US9720761B2 (en) System fault detection and processing method, device, and computer readable storage medium
US8190396B2 (en) Failure diagnosis system for cooling fans, a failure diagnosis device for cooling fans, a failure diagnosis method for cooling fans, a computer readable medium therefor and a cooling device
JP5476238B2 (en) Semiconductor device
JP2010186310A (en) Operation management apparatus, operation management method and program thereof
KR102400419B1 (en) State-Based Operation of Multidimensional Imaging Sensors and Imaging Systems Containing Multidimensional Imaging Sensors
JP2014182561A (en) Computer system, process and method for monitoring thread
JP2010271993A (en) Interrupt processing apparatus and method
JP4378386B2 (en) Cache way degeneration monitoring device, cache way degeneration monitoring method, and cache way degeneration monitoring program
JP2009258955A (en) Monitoring device, monitoring system, monitoring method, and monitoring program
JP2006221484A (en) Temperature anomaly monitoring method for computer
JP2009205208A (en) Operation management device, method and program
JP2007028118A (en) Failure judging method of node device
JP5459431B2 (en) Operation management apparatus and operation management method
JP5613570B2 (en) Batch job delay warning automatic alert system, automatic alert method, and program therefor
JP2019159475A (en) Failure detection device and failure analysis method
JP2009064673A (en) Fuel cell power generation system, and recovery process method of fuel cell power generation system
JP2006285321A (en) Safe instrumentation system
JP2004302847A (en) Method for monitoring operation of cpu
JP2012058812A (en) Trend data management device and trend data management method
US20150346065A1 (en) Limit based threshold estimation for prognostics and health management
JP2010003132A (en) Information processor, and fault detection method of input/output device thereof, and program thereof
JP7414313B1 (en) Remote power control device, remote power control method, and remote power control program
CN108733539B (en) Method, device and system for stopping OSD service and readable storage medium
JP6959287B2 (en) Monitoring device, monitoring system and monitoring method
JP7127616B2 (en) Information processing device, alarm management system, and alarm management method

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110120

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20110712

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110830

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111018

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111108

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120228