JP2012212243A - Monitoring device and monitoring method - Google Patents

Monitoring device and monitoring method Download PDF

Info

Publication number
JP2012212243A
JP2012212243A JP2011076641A JP2011076641A JP2012212243A JP 2012212243 A JP2012212243 A JP 2012212243A JP 2011076641 A JP2011076641 A JP 2011076641A JP 2011076641 A JP2011076641 A JP 2011076641A JP 2012212243 A JP2012212243 A JP 2012212243A
Authority
JP
Japan
Prior art keywords
image data
noise
failure
monitored device
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011076641A
Other languages
Japanese (ja)
Other versions
JP5683354B2 (en
Inventor
Masanori Ito
雅典 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Data Group Corp
Original Assignee
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Corp filed Critical NTT Data Corp
Priority to JP2011076641A priority Critical patent/JP5683354B2/en
Publication of JP2012212243A publication Critical patent/JP2012212243A/en
Application granted granted Critical
Publication of JP5683354B2 publication Critical patent/JP5683354B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a monitoring device capable of appropriately detecting a state that a monitored device is down, and a monitoring method.SOLUTION: A monitoring device comprises: a noise removal part 225 that determines whether or not input image data input from a monitored device 100 is consistent with predetermined noise image data which means image data at the time of nonfailure, and that, when determining that the input image data is consistent with the noise image data, removes the noise image data from the input image data; a failure detection part 240 that determines whether or not the image data after removing the noise is consistent with failure image data which means predetermined image data of the monitored device at the time of failure, and that, when determining that the image data after removing the noise is consistent with the failure image data, determines that the monitored device is in a failure state; and a failure recovery procedure execution part 250 that, when the monitored device is determined to be in the failure state, executes predetermined failure recovery procedures with respect to the monitored device.

Description

本発明は、監視装置、及び監視方法に関する。   The present invention relates to a monitoring device and a monitoring method.

サーバなどの被監視装置のダウンを監視する監視装置は、ネットワークの疎通を確認するプロトコルであるICMP(Internet Control Message Protocol;インターネット制御通知プロトコル)等による生存確認の問い合わせ処理をポーリング(polling)処理によって、被監視装置に対して定期的に行う。そして、監視装置は、被監視装置からの生存確認に対する応答によって、被監視装置の生存状況を判断していた(ポーリング方式)。
また、被監視装置は、主体的に監視装置に対して、予め定められた時間間隔毎に、ネットワークを監視するためのSNMP(Simple Network Management Protocol;シンプル ネットワーク マネージメント プロトコル)によるトラップを発生する等により、生存確認を通知する。そして、監視装置は、この被監視装置からの生存確認を受け取ることにより、被監視装置の生存状況を判断していた(生存通知方式)。
A monitoring device that monitors the down of a monitored device such as a server uses a polling process to perform an inquiry process of survival confirmation by ICMP (Internet Control Message Protocol) that is a protocol for confirming network communication. , Periodically for the monitored device. The monitoring device determines the survival status of the monitored device based on the response to the survival confirmation from the monitored device (polling method).
In addition, the monitored device proactively generates a trap by SNMP (Simple Network Management Protocol) for monitoring the network at predetermined time intervals with respect to the monitoring device. , Notify survival confirmation. Then, the monitoring device receives the survival confirmation from the monitored device to determine the survival status of the monitored device (survival notification method).

しかしながら、このような ポーリング方式や 生存通知方式では、被監視装置がダウンしていることを検知する確度を上げるために、生存確認する間隔を短くする必要がある。生存確認する間隔を短くすることのトレードオフとして、被監視装置への負荷が増加したり、誤検出のリスクが高まるデメリットもある。
このため、監視装置として、被監視装置が連続的に出力する信号、例えばコンソール画面へのビデオ出力信号の変化を監視し、被監視装置がダウンする時に特有の画像パターンを検出するものがある。被監視装置がダウンする時に特有の画像パターンとは、例えば、被監視装置がダウンして電源リセットし、その後、画面がブラックアウトし、次に被監視装置のベンダのロゴが表示され、その後、BIOS(Basic Input Output System)画面の表示などが行われる画像パターンである。あるいは、OS(Operating System)のパニック時に表示されるstack trace等の表示と、画面更新停止等の画面パターンである。そして、監視装置は、このような画像パターンにより被監視装置のダウンを検出した場合、被監視装置の管理者に、障害への解決手順などの障害報告を送信していた(例えば、特許文献1参照)。
However, in such a polling method or alive notification method, it is necessary to shorten the alive check interval in order to increase the accuracy of detecting that the monitored device is down. As a trade-off for shortening the survival confirmation interval, there are disadvantages in that the load on the monitored device increases and the risk of false detection increases.
For this reason, some monitoring devices monitor a change in a signal continuously output by the monitored device, for example, a video output signal to a console screen, and detect a specific image pattern when the monitored device goes down. The image pattern unique when the monitored device goes down is, for example, the monitored device goes down and power is reset, then the screen is blacked out, then the monitored device vendor's logo is displayed, and then This is an image pattern in which a BIOS (Basic Input Output System) screen is displayed. Or, it is a display pattern such as a stack trace displayed at the time of OS (Operating System) panic, and a screen pattern such as a screen update stop. When the monitoring apparatus detects that the monitored apparatus is down using such an image pattern, the monitoring apparatus transmits a failure report such as a procedure for solving the failure to the administrator of the monitored apparatus (for example, Patent Document 1). reference).

特開2006−65659号公報JP 2006-65659 A

ところで、被監視装置のスクリーンセーバーの画像データは、ダウンした時に特有のパターンに似た画像パターンを有しているものもある。
しかしながら、特許文献1に記載の技術では、スクリーンセーバーの画像データの場合、監視装置は、被監視装置がダウンした状態の画像データとして検出してしまう場合がある。このような場合、監視装置は、正常動作している被監視装置に対して再起動等の修復処理を行ってしまうなどの誤動作をする可能性があった。
By the way, the image data of the screen saver of the monitored apparatus may have an image pattern similar to a specific pattern when it is down.
However, in the technique described in Patent Document 1, in the case of screen saver image data, the monitoring device may detect it as image data in a state where the monitored device is down. In such a case, there is a possibility that the monitoring apparatus may malfunction such as performing a repair process such as restarting the monitored apparatus that is operating normally.

本発明は、上記の問題点に鑑みてなされたものであって、被監視装置のダウン状態を適切に検出することができる監視装置、及び監視方法を提供することを目的としている。   The present invention has been made in view of the above-described problems, and an object thereof is to provide a monitoring device and a monitoring method that can appropriately detect a down state of a monitored device.

上記目的を達成するため、本発明に係る監視装置は、被監視装置から入力された入力画像データが、予め定められている非障害時の画像データであるノイズ画像データと一致するか否かを判別し、前記入力画像データが前記ノイズ画像データと一致すると判別した場合、前記入力画像データから前記ノイズ画像データを除去するノイズ除去部と、前記ノイズ除去部が出力する前記ノイズ画像データが除去された画像データであるノイズ除去された画像データが、予め定められている前記被監視装置の障害時の画像データである障害画像データと一致するか否かを判別し、前記ノイズ除去された画像データが前記障害画像データと一致すると判別した場合、前記被監視装置に障害が発生していると判別する障害検出部と、前記障害検出部により前記被監視装置に障害が発生していると判別された場合、予め定められている前記被監視装置の障害復旧手順を実行する障害復旧手順実行部と、を備えることを特徴としている。   In order to achieve the above object, the monitoring apparatus according to the present invention determines whether or not the input image data input from the monitored apparatus matches noise image data that is predetermined non-failure image data. If it is determined that the input image data matches the noise image data, a noise removing unit that removes the noise image data from the input image data, and the noise image data output by the noise removing unit are removed. It is determined whether the noise-removed image data that is the image data matches failure image data that is predetermined image data at the time of failure of the monitored device, and the noise-removed image data Is determined to match the failure image data, a failure detection unit that determines that a failure has occurred in the monitored device, and the failure detection unit If serial is determined that failure to monitored devices has occurred, is characterized by comprising a fault recovery procedure execution unit for executing a disaster recovery procedure of the monitored device are predetermined, the.

また、本発明に係る監視装置において、前記ノイズ画像データと、前記ノイズ画像データの属性を示す情報として前記ノイズ画像データが起動されているOSを示す情報とが関連づけられて格納されているノイズパターンのデータベースを備え、前記ノイズ除去部は、前記入力画像データと一致する前記ノイズ画像データが、前記ノイズパターンのデータベースに格納されているか否かを判別し、前記入力画像データと一致する前記ノイズ画像データが前記ノイズパターンのデータベースに格納されていた場合、前記ノイズ画像データと関連づけられて格納されている前記属性を示す情報としての前記被監視装置で起動されているOSを示す情報と、前記被監視装置で起動されているOSの属性とが一致するか否かを判別し、前記格納されている前記被監視装置で起動されているOSの属性と、前記被監視装置で起動されているOSの属性とが一致する場合、前記入力画像データが前記ノイズ画像データと一致すると判別し、前記入力画像データが前記ノイズ画像データと一致する場合、前記入力画像データから前記ノイズ画像データを除去するようにしてもよい。   In the monitoring apparatus according to the present invention, the noise pattern is stored in association with the noise image data and information indicating an OS in which the noise image data is activated as information indicating the attribute of the noise image data. The noise removing unit determines whether the noise image data that matches the input image data is stored in the noise pattern database, and the noise image that matches the input image data. When the data is stored in the noise pattern database, the information indicating the OS activated in the monitored device as the information indicating the attribute stored in association with the noise image data; It is determined whether or not the attribute of the OS running on the monitoring device matches, and the stored If the attribute of the OS activated on the monitored device matches the attribute of the OS activated on the monitored device, it is determined that the input image data matches the noise image data, and the input When the image data matches the noise image data, the noise image data may be removed from the input image data.

また、本発明に係る監視装置において、前記ノイズ除去部は、前記入力画像データが前記ノイズ画像データではないと判別した場合、予め定められている第1の期間以上、前記入力画像データが変化するか否かを判別し、前記予め設定されている期間以上、前記入力画像データが変化しないと判別した場合、前記入力画像データから前記ノイズ画像データを除去するようにしてもよい。   In the monitoring device according to the present invention, when the noise removal unit determines that the input image data is not the noise image data, the input image data changes for a predetermined first period or more. The noise image data may be removed from the input image data when it is determined that the input image data does not change for the preset period or longer.

また、本発明に係る監視装置において、前記障害検出部は、前記ノイズ除去部が出力する前記ノイズ除去された画像データが、前記障害画像データであると判別された場合、前記被監視装置に対してポーリング処理を行い、前記被監視装置から前記ポーリング処理に対する応答が無い場合に前記被監視装置に障害が発生していると判別するようにしてもよい。   Further, in the monitoring device according to the present invention, the failure detection unit, when it is determined that the noise-removed image data output from the noise removal unit is the failure image data, the failure detection unit The polling process may be performed, and it may be determined that a failure has occurred in the monitored apparatus when there is no response to the polling process from the monitored apparatus.

また、本発明に係る監視装置において、前記ノイズ除去部は、前記入力画像データが、前記ノイズ画像データと一致するか否かを判別する前に、前記入力画像データが、予め定められている第2の期間以上、連続して黒画像の画像データであるか否かを判別し、前記入力画像データが、予め定められている第2の期間以上、連続して黒画像の画像データであると判別した場合、前記入力画像データが、前記ノイズ画像データであるか否かの判別を開始するようにしてもよい。   In the monitoring apparatus according to the present invention, the noise removal unit may determine whether the input image data is predetermined before determining whether the input image data matches the noise image data. It is determined whether or not the image data is black image continuously for a period of 2 or more, and the input image data is image data of black image continuously for a predetermined second period or more. If it is determined, it may be determined whether or not the input image data is the noise image data.

また、本発明に係る監視装置において、前記ノイズ除去部は、前記入力画像データを、ネットワークを介して前記被監視装置から取得するようにしてもよい。   In the monitoring device according to the present invention, the noise removing unit may acquire the input image data from the monitored device via a network.

また、本発明に係る監視装置において、前記障害検出部により前記ノイズ除去された画像データが前記障害画像データであると判別された場合、前記前記ノイズ除去された画像データを非障害時の画像データとして前記ノイズパターンのデータベースに学習させるノイズパターン学習部を備えるようにしてもよい。   In the monitoring apparatus according to the present invention, when the failure detection unit determines that the noise-removed image data is the failure image data, the noise-removed image data is used as non-failure image data. As an alternative, a noise pattern learning unit may be provided which causes the noise pattern database to learn.

上記目的を達成するため、本発明に係る監視方法は、ノイズ除去部が、被監視装置から入力された入力画像データが、予め定められている非障害時の画像データであるノイズ画像データと一致するか否かを判別し、前記入力画像データが前記ノイズ画像データと一致すると判別した場合、前記入力画像データから前記ノイズ画像データを除去するノイズ除去工程と、障害検出部が、前記ノイズ除去部が出力する前記ノイズ画像データが除去された画像データであるノイズ除去された画像データが、予め定められている前記被監視装置の障害時の画像データである障害画像データと一致するか否かを判別し、前記ノイズ除去された画像データが前記障害画像データと一致すると判別した場合、前記被監視装置に障害が発生していると判別する障害検出工程と、障害復旧手順実行部が、前記障害検出部により前記被監視装置に障害が発生していると判別された場合、予め定められている前記被監視装置の障害復旧手順を実行する障害復旧手順実行工程と、を含むことを特徴としている。   In order to achieve the above object, according to the monitoring method of the present invention, the noise removing unit matches the input image data input from the monitored device with the noise image data that is predetermined non-failure image data. A noise removal step of removing the noise image data from the input image data, and a failure detection unit when the input image data is determined to match the noise image data. Whether or not the noise-removed image data that is the image data from which the noise image data is output matches the predetermined failure image data that is the image data at the time of failure of the monitored device A failure to determine that a failure has occurred in the monitored device when it is determined that the noise-removed image data matches the failure image data. A failure for executing a predetermined failure recovery procedure for the monitored device when the failure detecting unit determines that the failure has occurred in the monitored device by the detection step and the failure recovery procedure executing unit; A recovery procedure execution step.

本発明によれば、監視装置のノイズ除去部が、被監視装置が出力する画像データから非障害時の画像データを除去し、障害検出部が、被監視装置が出力する画像データから非障害時の画像データを除去した画像データに基づき障害を検出する。そして、障害が検出された場合、障害復旧手順実行部が、被監視装置に対して障害復旧処理を行うようにしたので、被監視装置のダウン状態を適切に検出することができる。   According to the present invention, the noise removal unit of the monitoring device removes non-failure image data from the image data output by the monitored device, and the failure detection unit detects non-failure from the image data output by the monitored device. The fault is detected based on the image data from which the image data is removed. When a failure is detected, the failure recovery procedure execution unit performs the failure recovery process on the monitored device, so that the down state of the monitored device can be detected appropriately.

第1実施形態に係る監視システム1の概略構成図である。1 is a schematic configuration diagram of a monitoring system 1 according to a first embodiment. 同実施形態に係るノイズパターンDB230に格納されているデータの一例を説明する図である。It is a figure explaining an example of the data stored in noise pattern DB230 concerning the embodiment. 同実施形態に係るパニックパターンDB245に格納されているデータの一例を説明する図である。It is a figure explaining an example of the data stored in panic pattern DB245 concerning the embodiment. 同実施形態に係るノイズパターンの除去と、パニック時の処理のフローチャートである。6 is a flowchart of noise pattern removal and panic processing according to the embodiment. 第2実施形態に係る監視システム1aの概略構成図である。It is a schematic block diagram of the monitoring system 1a which concerns on 2nd Embodiment. 同実施形態に係るノイズパターンの除去と、パニック時の処理のフローチャートである。6 is a flowchart of noise pattern removal and panic processing according to the embodiment. 第3実施形態に係る監視システム1bの概略構成図である。It is a schematic block diagram of the monitoring system 1b which concerns on 3rd Embodiment. 同実施形態に係る被監視装置100の物理レイヤ400の構成の一例を説明する図である。It is a figure explaining an example of a structure of the physical layer 400 of the to-be-monitored apparatus 100 concerning the embodiment.

以下、図面を用いて、本発明の実施形態について説明する。なお、本発明は係る実施形態に限定されず、その技術思想の範囲内で種々の変更が可能である。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. In addition, this invention is not limited to the embodiment which concerns, A various change is possible within the range of the technical thought.

[第1の実施形態]
図1は、本実施形態に係る監視システム1の概略構成図である。
図1に示すように、監視システム1は、被監視装置100、監視装置200により構成されている。被監視装置100は、通信部110、ビデオ出力部120、キーボード信号入力部130、制御部140、電源部150を備えている。監視装置200は、ビデオ信号入力部205、画像取得部210、ノイズ除去部225、ノイズパターンDB230、障害検出部240、パニックパターンDB245、障害復旧手順実行部250、障害復旧手順DB255、通信部260、被監視装置属性DB280を備えている。
[First Embodiment]
FIG. 1 is a schematic configuration diagram of a monitoring system 1 according to the present embodiment.
As shown in FIG. 1, the monitoring system 1 includes a monitored device 100 and a monitoring device 200. The monitored device 100 includes a communication unit 110, a video output unit 120, a keyboard signal input unit 130, a control unit 140, and a power supply unit 150. The monitoring apparatus 200 includes a video signal input unit 205, an image acquisition unit 210, a noise removal unit 225, a noise pattern DB 230, a failure detection unit 240, a panic pattern DB 245, a failure recovery procedure execution unit 250, a failure recovery procedure DB 255, a communication unit 260, A monitored device attribute DB 280 is provided.

まず、被監視装置100について説明する。被監視装置100は、例えばサーバである。
通信部110は、ネットワーク・カードやネットワーク・コネクタなどであり、例えばLAN端子を有している。通信部110は、ネットワーク20を介してLANケーブル30で監視装置200と接続されている。通信部110は、制御部140が出力する情報を、ネットワーク20を介して監視装置200に送信する。通信部110は、監視装置200から送信された情報を、ネットワーク20を介して受信し、受信した情報を制御部140に出力する。
First, the monitored apparatus 100 will be described. The monitored device 100 is a server, for example.
The communication unit 110 is a network card, a network connector, or the like, and has a LAN terminal, for example. The communication unit 110 is connected to the monitoring device 200 via the network 20 via the LAN cable 30. The communication unit 110 transmits information output from the control unit 140 to the monitoring device 200 via the network 20. The communication unit 110 receives the information transmitted from the monitoring device 200 via the network 20 and outputs the received information to the control unit 140.

ビデオ出力部120は、例えばVGA出力端子を有している。ビデオ出力部120は、制御部140が出力するビデオ信号を出力する。   The video output unit 120 has, for example, a VGA output terminal. The video output unit 120 outputs a video signal output from the control unit 140.

キーボード信号入力部130は、図示しないキーボードやマウスなどの入力装置からの入力信号が入力される端子を備えている。キーボード信号入力部130は、キーボードやマウスなどの入力装置から入力された信号を制御部140に出力する。   The keyboard signal input unit 130 includes a terminal to which an input signal from an input device such as a keyboard or a mouse (not shown) is input. The keyboard signal input unit 130 outputs a signal input from an input device such as a keyboard or a mouse to the control unit 140.

制御部140は、図示しないCPU(Central Processing Unit;中央演算装置)、RAM(Random Access Memory)、ROM(Read Only Memory)、HDD(Hard Disk Drive)などを備える。制御部140は、図示しないHDDに保持されているOS(Operating System)を読み出し、読み出したOSにより生成された画像データをビデオ出力部120に出力する。また、制御部140は、キーボード信号入力部130が出力する入力信号に基づき、OSやHDDに保持されているアプリケーションの処理を行う。   The control unit 140 includes a CPU (Central Processing Unit), a RAM (Random Access Memory), a ROM (Read Only Memory), a HDD (Hard Disk Drive), and the like (not shown). The control unit 140 reads an OS (Operating System) held in an HDD (not shown), and outputs image data generated by the read OS to the video output unit 120. In addition, the control unit 140 performs processing of applications held in the OS and HDD based on the input signal output from the keyboard signal input unit 130.

電源部150は、外部から入力された電力を被監視装置100の各機能部に供給する。   The power supply unit 150 supplies power input from the outside to each functional unit of the monitored device 100.

次に、監視装置200について説明する。監視装置200は、被監視装置100の動作状態を監視する。そして、監視装置200は、被監視装置がダウン状態やパニック状態にあると検査された場合、後述するように故障復旧処理や被監視装置の管理者にメール等で通知する。
ビデオ信号入力部205は、被監視装置100が出力するビデオ信号が入力され、入力されたビデオ信号を画像取得部210に出力する。なお、被監視装置100のビデオ出力部120と、監視装置200のビデオ信号入力部205とは、ビデオケーブル10で接続されている。
Next, the monitoring apparatus 200 will be described. The monitoring device 200 monitors the operation state of the monitored device 100. When the monitored device is inspected to be in the down state or the panic state, the monitoring device 200 notifies the administrator of the monitored device or the monitored device by e-mail or the like as will be described later.
The video signal input unit 205 receives a video signal output from the monitored device 100 and outputs the input video signal to the image acquisition unit 210. The video output unit 120 of the monitored apparatus 100 and the video signal input unit 205 of the monitoring apparatus 200 are connected by a video cable 10.

画像取得部210は、ビデオ信号入力部205が出力するビデオ信号を取得し、取得したビデオ信号の入力画像データをノイズ除去部225に出力する。   The image acquisition unit 210 acquires the video signal output from the video signal input unit 205 and outputs input image data of the acquired video signal to the noise removal unit 225.

ノイズパターンDB(データベース)230には、例えば、OS毎に各種のスクリーンセーバーによるダウン時の画像パターンを模した画像データや、スクリーンセーバーによるパニック時に表示される画像パターンが、静止画形式または動画形式で格納されている。なお、スクリーンセーバーによるダウン時やパニック時の画像パターンを模した画像データとは、例えば、被監視装置100で動作しているOSまたは被監視装置100で動作しているOSと異なるOSのダウン時やパニック時に表示される画像を模した画像が表示されるスクリーンセーバーの画像データである。これらのスクリーンセーバーは、被監視装置100の管理者がインストールした場合や、OSが標準で備えている場合などがある。なお、スクリーンセーバーによるダウン時やパニック時に表示される画像に似せた特有の画像データを、ノイズパターンという。なお、ノイズパターンDB230に格納されるデータは、予め監視装置200の管理者等により、各種の被監視装置100を接続して取得したノイズパターンに該当する画像データが格納されるようにしてもよい。   In the noise pattern DB (database) 230, for example, image data imitating an image pattern at the time of down by various screen savers for each OS, and an image pattern displayed at the time of panic by the screen saver are stored in a still image format or a video format. Has been. Note that the image data simulating the image pattern at the time of down or panic by the screen saver is, for example, an OS operating on the monitored device 100 or an OS different from the OS operating on the monitored device 100 or This is image data of a screen saver on which an image simulating an image displayed at the time of panic is displayed. These screen savers may be installed by the administrator of the monitored apparatus 100 or may be provided by the OS as standard. Note that unique image data that resembles an image displayed when a screen saver is down or panicked is called a noise pattern. Note that the data stored in the noise pattern DB 230 may store image data corresponding to noise patterns obtained by connecting various types of monitored devices 100 in advance by an administrator of the monitoring device 200 or the like. .

図2は、本実施形態に係るノイズパターンDB230に格納されているデータの一例を説明する図である。図2に示すように、ノイズパターンDB230には、項目番号、画像データ、画像データ形式、画像データ表示継続時間、OS種別の項目が関連付けられて格納されている。
項目の項目番号のデータ形式は、整数であり、例えば、通し番号である。項目番号は、ノイズパターンDB230への格納は任意である。
項目の画像データは、スクリーンセーバーによるダウン時やパニック時に表示される画像に似せた特有の画像データ(偽異常画像、または、ノイズ画像データともいう)であり、例えば、静止画データまたは動画データである。また、画像データのデータ形式は、バイナリデータである。画像データのノイズパターンDB230への格納は必須である。
項目の画像データ形式は、例えば、ビットマップ、JPEG(Joint Photographic Experts Group)、MPEG(Moving Picture Expert Group)などである。画像データ形式のデータ形式は、整数、または、文字列である。画像データ形式は、例えば、ビットマップが1、JPEGが2のように予め各形式と整数を対応付けて格納されていてもよい。また、画像データ形式は、例えば拡張子により判別できるため、ノイズパターンDB230への任意である。
項目の画像データ表示継続時間は、ダウン時やパニック時に表示される画像に似せた特有の画像データが表示される期間である。画像データ表示継続時間のデータ形式は、整数である。画像データ表示継続時間の単位は、例えば、秒である。画像データ表示継続時間のノイズパターンDB230への格納は必須である。
項目のOS種別は、スクリーンセーバーが用いられているOSの種別である。OS種別のデータ形式は、文字列であり、例えばOSのバージョンを含むOS名で、OS1、OS2などである。OS種別ノイズパターンDB230への格納は必須である。
FIG. 2 is a diagram for explaining an example of data stored in the noise pattern DB 230 according to the present embodiment. As shown in FIG. 2, the noise pattern DB 230 stores items of item number, image data, image data format, image data display duration, and OS type in association with each other.
The data format of the item number of the item is an integer, for example, a serial number. The item number can be arbitrarily stored in the noise pattern DB 230.
The image data of the item is unique image data (also referred to as false abnormal image or noise image data) resembling an image displayed when a screen saver is downed or panicked, for example, still image data or moving image data. . The data format of the image data is binary data. Storage of image data in the noise pattern DB 230 is essential.
The image data format of the item is, for example, bitmap, JPEG (Joint Photographic Experts Group), MPEG (Moving Picture Expert Group), or the like. The data format of the image data format is an integer or a character string. The image data format may be stored in advance by associating each format with an integer such that the bitmap is 1 and JPEG is 2, for example. Further, the image data format can be discriminated by, for example, an extension, and therefore is arbitrary for the noise pattern DB 230.
The image data display continuation time of the item is a period in which specific image data resembling an image displayed at the time of down or panic is displayed. The data format of the image data display duration is an integer. The unit of the image data display continuation time is, for example, second. Storage of the image data display duration in the noise pattern DB 230 is essential.
The item OS type is the type of OS in which the screen saver is used. The data format of the OS type is a character string, for example, an OS name including the OS version, such as OS1 and OS2. Storage in the OS type noise pattern DB 230 is essential.

被監視装置属性DB(データベース)280には、被監視装置100の識別IDと、被監視装置100で起動されているOSの属性(バージョンを含む)が、予め関連づけられて格納されている。   In the monitored device attribute DB (database) 280, the identification ID of the monitored device 100 and the attributes (including version) of the OS activated on the monitored device 100 are stored in association with each other.

ノイズ除去部225は、画像取得部210が出力する入力画像データが、ノイズパターンDB230に格納されている画像データと一致するか否かを判別する。入力画像データが、ノイズパターンDB230に格納されている画像データと一致する場合、ノイズ除去部225は、さらに、ノイズパターンDB230に格納されている画像データの属性が、被監視装置属性DB(データベース)280から読み出した監視装置100で起動されているOSの種別と一致するか否かを判別する。
画像データの属性とは、ノイズパターンDB230に画像データと関連付けられて記憶されているOSの種別である。すなわち、ノイズ除去部225は、入力画像データが、ノイズパターンDB230に格納されて、さらに属性が被監視装置100のOSの種別と一致する場合、被監視装置100が出力した画像データをスクリーンセーバーの画像データであると判断する。ノイズ除去部225は、属性が一致しない場合、予め定めた期間(第1の期間)、検出した画像データが持続するか否かを判別する。予め定められた期間以内に画像データが切り替わった場合、入力画像データをスクリーンセーバーの画像データであると判別する。ノイズ除去部225は、画像データがスクリーンセーバーの画像データであると判別した場合、その画像データをノイズパターンとして除去する。すなわち、入力画像データは、被監視装置100がダウン状態になった場合やパニック状態になった場合の画像パターンに似せたスクリーンセーバーの画像データである。このため、ノイズ除去部225は、この画像データをノイズパターンとして除去し、障害検出部240にノイズ除去した画像データを出力する。
一方、ノイズ除去部225は、入力画像データが、ノイズパターンDB230に格納されていなかった場合、入力画像データをそのまま障害検出部240に出力する。
The noise removal unit 225 determines whether or not the input image data output from the image acquisition unit 210 matches the image data stored in the noise pattern DB 230. When the input image data matches the image data stored in the noise pattern DB 230, the noise removing unit 225 further determines that the attribute of the image data stored in the noise pattern DB 230 is the monitored device attribute DB (database). It is determined whether or not the OS type activated by the monitoring apparatus 100 read from 280 matches the OS type.
The attribute of image data is the type of OS stored in the noise pattern DB 230 in association with the image data. That is, when the input image data is stored in the noise pattern DB 230 and the attribute matches the OS type of the monitored device 100, the noise removing unit 225 uses the image data output by the monitored device 100 as the screen saver image. Judge as data. If the attributes do not match, the noise removing unit 225 determines whether or not the detected image data is maintained for a predetermined period (first period). When the image data is switched within a predetermined period, it is determined that the input image data is screen saver image data. When it is determined that the image data is screen saver image data, the noise removal unit 225 removes the image data as a noise pattern. That is, the input image data is image data of a screen saver that resembles an image pattern when the monitored device 100 is in a down state or a panic state. For this reason, the noise removing unit 225 removes the image data as a noise pattern and outputs the noise-removed image data to the failure detecting unit 240.
On the other hand, when the input image data is not stored in the noise pattern DB 230, the noise removal unit 225 outputs the input image data to the failure detection unit 240 as it is.

パニックパターンDB(データベース)245には、OS種別、障害時の画像データである障害画像データ、障害名などが関連付けられて格納されている。なお、パニックパターンDB245に格納されるデータは、予め監視装置200の管理者等により、各種の被監視装置100を接続して取得した障害時に該当する画像データが格納されるようにしてもよい。
図3は、本実施形態に係るパニックパターンDB245に格納されているデータの一例を説明する図である。図3に示すように、パニックパターンDB245には、OS種別、障害時の画像データ、障害名が関連づけられて格納されている。画像データは、静止画形式または動画形式の画像データである。
The panic pattern DB (database) 245 stores an OS type, failure image data that is image data at the time of failure, a failure name, and the like in association with each other. The data stored in the panic pattern DB 245 may store image data corresponding to a failure acquired by connecting various types of monitored devices 100 in advance by an administrator of the monitoring device 200 or the like.
FIG. 3 is a diagram illustrating an example of data stored in the panic pattern DB 245 according to the present embodiment. As shown in FIG. 3, the panic pattern DB 245 stores an OS type, image data at the time of failure, and a failure name in association with each other. The image data is still image format or moving image format image data.

障害検出部240には、ノイズ除去部225が出力するノイズ除去された画像データが入力される。障害検出部240は、入力されたノイズ除去された画像データが、パニックパターンDB245に格納されている画像データと一致するか否かを判別する。障害検出部240は、ノイズ除去された画像データがパニックパターンDB245に格納されていると判別された場合、被監視装置100がダウン状態またはパニック状態になっていると判断する。障害検出部240は、パニックパターンDB245に格納されている画像データに関連付けられて格納されている被監視装置100の状態を示す情報を読み出し、読み出した被監視装置100の障害状態を示す情報を障害復旧手順実行部250に出力する。なお、画像データに関連付けられて格納されている被監視装置100の状態を示す情報とは、例えば、画像データがダウン時の画像データであればダウン状態、画像データがパニック時の画像データであればパニック状態、などのように、画像データ毎の被監視装置100の障害状態である。   The failure detection unit 240 receives the image data from which noise has been removed, which is output from the noise removal unit 225. The failure detection unit 240 determines whether or not the input noise-removed image data matches the image data stored in the panic pattern DB 245. When it is determined that the image data from which noise has been removed is stored in the panic pattern DB 245, the failure detection unit 240 determines that the monitored device 100 is in a down state or a panic state. The failure detection unit 240 reads information indicating the state of the monitored device 100 stored in association with the image data stored in the panic pattern DB 245, and sets the read information indicating the failure state of the monitored device 100 as a failure. The data is output to the recovery procedure execution unit 250. Note that the information indicating the state of the monitored device 100 stored in association with the image data may be, for example, the down state if the image data is image data when the image data is down, or the image data when the image data is panic. This is a failure state of the monitored apparatus 100 for each image data, such as a panic state.

障害復旧手順実行部250は、障害検出部240が出力する被監視装置100の障害状態を示す情報に基づき、障害復旧手順DB255から故障復旧手順を読み出す。障害復旧手順実行部250は、読み出した故障復旧手順に従って、被監視装置100に対して故障復旧処理を行う。なお、故障復旧手順とは、後述するように、例えば、被監視装置100に対してポーリングを行い、あるいは、被監視装置100の管理者にメールで通知するなどの処理手順である。   The failure recovery procedure execution unit 250 reads the failure recovery procedure from the failure recovery procedure DB 255 based on the information indicating the failure state of the monitored device 100 output from the failure detection unit 240. The failure recovery procedure execution unit 250 performs failure recovery processing on the monitored device 100 according to the read failure recovery procedure. The failure recovery procedure is a processing procedure such as polling the monitored apparatus 100 or notifying the administrator of the monitored apparatus 100 by e-mail, as will be described later.

障害復旧手順DB255には、予め監視装置200の管理者により、被監視装置100の障害状況に応じた故障復旧手順が、OS毎、障害毎に格納されている。   In the failure recovery procedure DB 255, a failure recovery procedure according to the failure status of the monitored device 100 is stored in advance for each OS and for each failure by the administrator of the monitoring device 200.

通信部260は、ネットワーク・カードやネットワーク・コネクタなどであり、例えばLAN端子を有している。通信部260は、ネットワーク20を介して被監視装置100と接続されている。通信部260は、障害復旧手順実行部250が出力する故障復旧処理を示す情報を、ネットワーク20を介して被監視装置100に送信する。また、通信部260は、被監視装置100から送信された情報を、ネットワーク20を介して受信し、受信した情報を障害復旧手順実行部250に出力する。   The communication unit 260 is a network card, a network connector, or the like, and has a LAN terminal, for example. The communication unit 260 is connected to the monitored device 100 via the network 20. The communication unit 260 transmits information indicating the failure recovery process output from the failure recovery procedure execution unit 250 to the monitored apparatus 100 via the network 20. Further, the communication unit 260 receives information transmitted from the monitored device 100 via the network 20 and outputs the received information to the failure recovery procedure execution unit 250.

次に、ノイズパターンの除去と、パニック時の処理の一例について、図4を用いて説明する。図4は、本実施形態に係るノイズパターンの除去と、パニック時の処理のフローチャートである。   Next, an example of noise pattern removal and panic processing will be described with reference to FIG. FIG. 4 is a flowchart of noise pattern removal and panic processing according to this embodiment.

(ステップS1)
監視装置200の画像取得部210は、ビデオ信号入力部205を介して、被監視装置100が出力する画像データを受信する。ステップS1終了後、ステップS2に進む。
(ステップS2)
次に、画像取得部210は、画像データを1フレーム分、受信し、受信した1フレーム分の入力画像データを、順次、ノイズ除去部225に出力する。ステップS2終了後、ステップS3に進む。
(Step S1)
The image acquisition unit 210 of the monitoring device 200 receives image data output from the monitored device 100 via the video signal input unit 205. After step S1, the process proceeds to step S2.
(Step S2)
Next, the image acquisition unit 210 receives image data for one frame, and sequentially outputs the received input image data for one frame to the noise removal unit 225. After step S2, the process proceeds to step S3.

(ステップS3)
次に、ノイズ除去部225は、パターン検出部215が出力する入力画像データが、イズパターンDB230に格納されている画像データと一致するか否かを判別する。すなわち、ノイズ除去部225は、被監視装置100がダウン状態になった場合やパニック状態になった場合に出力する特有の画像パターンと一致するか否かを判別する。ステップS3終了後、ステップS4に進む。
(Step S3)
Next, the noise removal unit 225 determines whether the input image data output from the pattern detection unit 215 matches the image data stored in the is pattern DB 230. That is, the noise removal unit 225 determines whether or not the monitored image 100 matches the specific image pattern that is output when the monitored device 100 is in a down state or a panic state. After step S3 ends, the process proceeds to step S4.

(ステップS4)
入力画像データがノイズパターンDB230に格納されている画像データと一致すると判別された場合(ステップS4;Yes)、ステップS5に進む。この場合、入力画像データがノイズパターンDB230に格納されている画像データと一致すると判別されたため、入力画像データは、ダウン状態やパニック状態の画像データではなく、スクリーンセーバーの画像データ(ノイズパターン)である可能性がある。
入力画像データがノイズパターンDB230に格納されている画像データと一致しないと判別された場合(ステップS4;No)、ステップS8に進む。この場合、入力画像データがノイズパターンDB230に格納されている画像データと一致しないと判別されたため、入力画像データは、ノイズ画像データではない可能性がある。
(Step S4)
When it is determined that the input image data matches the image data stored in the noise pattern DB 230 (step S4; Yes), the process proceeds to step S5. In this case, since it is determined that the input image data matches the image data stored in the noise pattern DB 230, the input image data is not the image data in the down state or the panic state, but the screen saver image data (noise pattern). there is a possibility.
If it is determined that the input image data does not match the image data stored in the noise pattern DB 230 (step S4; No), the process proceeds to step S8. In this case, since it is determined that the input image data does not match the image data stored in the noise pattern DB 230, the input image data may not be noise image data.

(ステップS5)
次に、ノイズ除去部225は、画像データと関連付けられてノイズパターンDB230に格納されている画像データのOSの属性を読み出す。また、ノイズ除去部225は、被監視装置100の識別IDと関連付けられて被監視装置属性DB280に格納されている監視装置100のOSの属性を読み出す。
次に、ノイズ除去部225は、読み出した画像データのOSの属性と、被監視装置100で起動しているOSとが一致するか再判別する。例えば、ノイズ除去部225が検出した画像データのOSの属性をノイズパターンDB230から読み出したところ、該当する画像データの属性情報がOS2であり、被監視装置属性DB280に格納されている被監視装置100のOSの属性がOS2であった場合、OSの属性が一致するため、入力画像データを正常動作によるスクリーンセーバーの画像データが動作していると判断する。このため、ノイズ除去部225は、入力画像データをノイズパターンと判別してノイズ画像データを除去する。ノイズパターン除去後、ステップS1に戻る。
一方、ノイズパターンDB230から読み出した画像データのOSの属性と、被監視装置100で起動しているOSとが一致しない場合、ステップS6に進む。この場合、ノイズパターンDB230から読み出した画像データのOSの属性と、被監視装置100で起動しているOSとが一致しないため、ノイズ画像データではない(即ち実際のサーバ障害を示す画像である)可能性が高い。
(Step S5)
Next, the noise removing unit 225 reads the OS attribute of the image data associated with the image data and stored in the noise pattern DB 230. In addition, the noise removing unit 225 reads the OS attribute of the monitoring device 100 that is associated with the identification ID of the monitored device 100 and stored in the monitored device attribute DB 280.
Next, the noise removing unit 225 determines again whether the OS attribute of the read image data matches the OS running on the monitored apparatus 100. For example, when the OS attribute of the image data detected by the noise removing unit 225 is read from the noise pattern DB 230, the attribute information of the corresponding image data is OS 2, and the monitored device 100 stored in the monitored device attribute DB 280. If the OS attribute is OS2, since the OS attributes match, it is determined that the screen saver image data by normal operation is operating on the input image data. For this reason, the noise removing unit 225 determines that the input image data is a noise pattern and removes the noise image data. After removing the noise pattern, the process returns to step S1.
On the other hand, if the OS attribute of the image data read from the noise pattern DB 230 does not match the OS running on the monitored device 100, the process proceeds to step S6. In this case, since the OS attribute of the image data read from the noise pattern DB 230 does not match the OS running on the monitored device 100, it is not noise image data (that is, an image indicating an actual server failure). Probability is high.

(ステップS6)
ノイズ除去部225は、入力画像データがノイズパターンDB230に格納されている画像データと一致し且つOSの属性が一致しない場合、予め定めた期間、画像パターンの確認を続ける。この理由は、入力画像データが、被監視装置100で起動しているOSのダウン状態やパニック状態に似せたスクリーンセーバーであるか否かを再判別するためである。ステップS6終了後、ステップS7に進む。
(Step S6)
When the input image data matches the image data stored in the noise pattern DB 230 and the OS attribute does not match, the noise removing unit 225 continues to check the image pattern for a predetermined period. The reason for this is to determine again whether or not the input image data is a screen saver that resembles the down state or panic state of the OS running on the monitored device 100. After step S6 ends, the process proceeds to step S7.

(ステップS7)
スクリーンセーバーの場合、周期的に画像データが変化しながら繰り返される。このため、画像データが変化した場合、ノイズ除去部225は、画像データがスクリーンセーバーの画像データであると判断し(ステップS7;No)、ステップS1に戻る。
一方、予め定めた期間が過ぎても、画像データが変化しない場合(ステップS7;Yes)、被監視装置100がダウン状態かパニック状態になっている可能性が高いため、ノイズ除去部225は、ノイズ除去された画像データを 障害検出部240に出力し、ステップS8に進む。すなわち、ノイズ除去部225は、被監視装置100が出力した入力画像データから、ノイズパターンの画像データ及びノイズパターンの可能性がある画像データを除去し、ノイズパターン除去後のノイズ除去された画像データを障害検出部240に出力する。
(Step S7)
In the case of a screen saver, the image data is repeated while changing periodically. For this reason, when image data changes, the noise removal part 225 judges that image data is image data of a screen saver (step S7; No), and returns to step S1.
On the other hand, if the image data does not change even after the predetermined period has elapsed (step S7; Yes), the monitored device 100 is likely to be in a down state or a panic state. The noise-removed image data is output to the failure detection unit 240, and the process proceeds to step S8. That is, the noise removal unit 225 removes noise pattern image data and image data that may be a noise pattern from the input image data output by the monitored apparatus 100, and the noise-removed image data after the noise pattern removal. Is output to the failure detection unit 240.

(ステップS8)
次に、障害検出部240は、ノイズ除去部225が出力するノイズ除去された画像データを、パニックパターンDB245に格納されている画像データと一致するか否かを判別する。ノイズ除去された画像データがパニックパターンDB245に格納されている画像データと一致すると判別された場合、障害検出部240は、一致した画像データに基づき、被監視装置100がダウン状態かパニック状態であると判断する。すなわち、ノイズ除去された画像データが、ダウン状態の画像データと一致した場合、障害検出部240は、被監視装置100がダウン状態であると判別する。あるいは、ノイズ除去された画像データが、パニック状態の画像データと一致した場合、障害検出部240は、被監視装置100がパニック状態であると判別する。
次に、障害検出部240は、パニックパターンDB245に格納されている画像データに関連付けられて格納されている被監視装置100の状態を示す情報を読み出し、読み出した被監視装置100の障害状態を示す情報を障害復旧手順実行部250に出力する。被監視装置100の障害状態を示す情報とは、被監視装置100がダウン状態を示す情報、または、被監視装置100がパニック状態を示す情報である。ステップS8終了後、ステップS9に進む。
(Step S8)
Next, the failure detection unit 240 determines whether the noise-removed image data output from the noise removal unit 225 matches the image data stored in the panic pattern DB 245. When it is determined that the noise-removed image data matches the image data stored in the panic pattern DB 245, the failure detection unit 240 determines whether the monitored apparatus 100 is in a down state or a panic state based on the matched image data. Judge. That is, when the image data from which noise has been removed matches the image data in the down state, the failure detection unit 240 determines that the monitored device 100 is in the down state. Alternatively, when the image data from which noise is removed matches the image data in the panic state, the failure detection unit 240 determines that the monitored device 100 is in the panic state.
Next, the failure detection unit 240 reads information indicating the state of the monitored device 100 stored in association with the image data stored in the panic pattern DB 245, and indicates the read failure state of the monitored device 100. Information is output to the failure recovery procedure execution unit 250. The information indicating the failure state of the monitored device 100 is information indicating that the monitored device 100 is in a down state or information indicating that the monitored device 100 is in a panic state. After step S8 ends, the process proceeds to step S9.

(ステップS9)
次に、障害復旧手順実行部250は、障害検出部240が出力する被監視装置100の障害状態を示す情報に基づき、障害復旧手順DB255から故障復旧手順を読み出す。例えば、障害検出部240が出力する被監視装置100がダウン状態を示す情報の場合、障害復旧手順実行部250は、被監視装置100がダウン状態の障害復旧手順を障害復旧手順DB255から読み出す。あるいは、障害検出部240が出力する被監視装置100がパニック状態を示す情報の場合、障害復旧手順実行部250は、被監視装置100がパニック状態の障害復旧手順を障害復旧手順DB255から読み出す。
次に、障害検出部240は、読み出した故障復旧手順に従って、被監視装置100に対して故障復旧処理を行う。
障害復旧手順実行部250は、読み出した故障復旧手順に従って、被監視装置100の通信部110に対して、例えば、ICMP(Internet Control Message Protocol;インターネット制御通知プロトコル)による生存確認のポーリング処理を、通信部260を介して行う。ポーリング処理とは、例えばping信号などを送信することである。
被監視装置100から生存確認のポーリング処理への応答があった場合、障害復旧手順実行部250は、例えば、被監視装置100のビデオ信号出力部120が故障している可能性があることを示す情報を、被監視装置100の管理者に通信部260を介してメール等で通知する。被監視装置100から生存確認のポーリング処理への応答がなかった場合、障害復旧手順実行部250は、被監視装置100がダウン状態またはパニック状態にあると判断し、判断結果を被監視装置100の管理者に通信部260を介してメール等で通知する。
(Step S9)
Next, the failure recovery procedure execution unit 250 reads the failure recovery procedure from the failure recovery procedure DB 255 based on the information indicating the failure state of the monitored device 100 output from the failure detection unit 240. For example, when the monitored device 100 output from the failure detection unit 240 is information indicating a down state, the failure recovery procedure execution unit 250 reads a failure recovery procedure in which the monitored device 100 is down from the failure recovery procedure DB 255. Alternatively, when the monitored device 100 output from the failure detection unit 240 is information indicating a panic state, the failure recovery procedure execution unit 250 reads a failure recovery procedure in which the monitored device 100 is in a panic state from the failure recovery procedure DB 255.
Next, the failure detection unit 240 performs failure recovery processing on the monitored device 100 according to the read failure recovery procedure.
The failure recovery procedure execution unit 250 communicates, with the communication unit 110 of the monitored apparatus 100, for example, an alive confirmation polling process by ICMP (Internet Control Message Protocol) according to the read failure recovery procedure. This is performed via the unit 260. The polling process is, for example, transmitting a ping signal or the like.
When there is a response from the monitored device 100 to the polling process for confirmation of survival, the failure recovery procedure execution unit 250 indicates that the video signal output unit 120 of the monitored device 100 may be broken, for example. Information is notified to the administrator of the monitored apparatus 100 by mail or the like via the communication unit 260. If there is no response from the monitored device 100 to the polling process for existence confirmation, the failure recovery procedure execution unit 250 determines that the monitored device 100 is in a down state or a panic state, and determines the determination result of the monitored device 100. The administrator is notified by e-mail or the like via the communication unit 260.

以上のように、監視装置200のノイズ除去部225は、取得した入力画像データからダウン状態やパニック状態の画像データに似せたスクリーンセーバーによるノイズパターンを検出して除去する。そして、障害復旧手順実行部250は、ノイズ除去された画像データに基づき、被監視装置100に障害が生じているか判別し、障害が生じている場合に故障復旧手順を実行する。さらに、障害復旧手順実行部250は、被監視装置100の通信部110に対してポーリング処理を行うことで、被監視装置100のビデオ信号出力部120の故障なのか、ダウン状態またはパニック状態なのかを判断する。
この結果、ダウン時やパニック時の画像データに似せたスクリーンセーバーが稼働した場合でも、監視装置200は、被監視装置100が正常に動作していると判別でき、被監視装置100に対して誤って故障復旧処理を行うことを防ぐことができる。また、監視装置200は、被監視装置100が、ダウン状態やパニック状態にあることを適切に検出でき、検出した場合に適切に故障復旧処理を行うことができる。
As described above, the noise removing unit 225 of the monitoring device 200 detects and removes a noise pattern by a screen saver that is similar to image data in a down state or a panic state from the acquired input image data. Then, the failure recovery procedure execution unit 250 determines whether a failure has occurred in the monitored apparatus 100 based on the image data from which noise has been removed, and executes the failure recovery procedure when a failure has occurred. Further, the failure recovery procedure execution unit 250 performs a polling process on the communication unit 110 of the monitored device 100 to determine whether the video signal output unit 120 of the monitored device 100 is in failure, in a down state or in a panic state. Judging.
As a result, even when a screen saver resembling image data at the time of down or panic is activated, the monitoring apparatus 200 can determine that the monitored apparatus 100 is operating normally, and erroneously detects the monitored apparatus 100. It is possible to prevent failure recovery processing. In addition, the monitoring device 200 can appropriately detect that the monitored device 100 is in a down state or a panic state, and can appropriately perform failure recovery processing when detected.

なお、本実施形態では、ステップS5で、ノイズ除去部225が、被監視装置100で起動しているOSと、画像データのOS種別との属性チェックする例を説明したが、ステップS5の属性チェックは行わなくてもよい。この場合、ステップS4でYesの場合、そのままステップS6に進み、予め定めた期間が経過したか否かの判別(ステップS7)により、スクリーンセーバー動作か否かを判別するようにしてもよい。   In this embodiment, the example in which the noise removing unit 225 performs the attribute check between the OS activated in the monitored apparatus 100 and the OS type of the image data in step S5 has been described. Is not necessary. In this case, if Yes in step S4, the process proceeds to step S6 as it is, and whether or not the screen saver operation is performed may be determined by determining whether or not a predetermined period has elapsed (step S7).

また、被監視装置100が出力する画像データが、例えば、刻々と変化するカウンタ値を含むようなパニック状態に似せた画像データのスクリーンセーバーの場合、このカウンタ値が変化する動画形式の画像データをノイズパターンDB230に格納させておき、ノイズ除去部225が、入力画像データと比較して判別するようにしてもよい。このようなスクリーンセーバーの場合、例えば、カウンタ値の前に固定のプレフィックス文字列が含まれている。このため、ノイズ除去部225は、入力画像データから、このカウンタ値の前に含まれる固定のプレフィックス文字列の部分を抽出し、抽出した画像データがノイズパターンDB230に格納されているか否かを判別してノイズ除去するようにしてもよい。   In addition, when the image data output from the monitored device 100 is, for example, a screen saver of image data resembling a panic state that includes a counter value that changes every moment, the moving image format image data that changes the counter value is converted into noise. It may be stored in the pattern DB 230 and the noise removing unit 225 may make a determination by comparing with the input image data. In the case of such a screen saver, for example, a fixed prefix character string is included before the counter value. For this reason, the noise removing unit 225 extracts a portion of the fixed prefix character string included before the counter value from the input image data, and determines whether or not the extracted image data is stored in the noise pattern DB 230. Then, noise may be removed.

また、被監視装置100の識別IDは、例えば、予め本実施形態に係る監視システム1を構築する場合に、例えば、入力画像データに重畳された被監視装置100の識別IDを取得し、取得した識別IDに基づき、被監視装置属性DB280から被監視装置100で起動されているOSの属性を読み出すようにしてもよい。この場合、被監視装置100の制御部140は、被監視装置100の識別IDをビデオ信号に重畳して、ビデオ信号出力部120から出力する。または、監視装置200は、被監視装置100の識別IDを、例えば通信部260経由で取得するようにしてもよい。被監視装置100の識別IDは、例えば、被監視装置100の製造番号や、ネットワークのIP(Internet Protocol)アドレスや、MAC(Media Access Control)アドレスであってもよい。   The identification ID of the monitored device 100 is acquired by, for example, acquiring the identification ID of the monitored device 100 superimposed on the input image data, for example, when the monitoring system 1 according to the present embodiment is constructed in advance. Based on the identification ID, the attribute of the OS activated on the monitored device 100 may be read from the monitored device attribute DB 280. In this case, the control unit 140 of the monitored device 100 superimposes the identification ID of the monitored device 100 on the video signal and outputs it from the video signal output unit 120. Alternatively, the monitoring device 200 may acquire the identification ID of the monitored device 100 via the communication unit 260, for example. The identification ID of the monitored device 100 may be, for example, a manufacturing number of the monitored device 100, a network IP (Internet Protocol) address, or a MAC (Media Access Control) address.

[第2実施形態]
図5は、本実施形態に係る監視システム1aの構成図である。
図5に示すように、監視システム1aは、被監視装置100a、監視装置200a、電源制御部300により構成されている。被監視装置100aは、通信部110、ビデオ出力部120、キーボード信号入力部130a、制御部140、電源部150を備えている。監視装置200aは、ビデオ信号入力部205、画像取得部210a、パターン検出部215,計時部220、ノイズ除去部225、ノイズパターンDB230、ノイズパターン学習部235、障害検出部240a、パニックパターンDB245、障害復旧手順実行部250a、障害復旧手順DB255、通信部260a、被監視装置属性DB280を備えている。第1実施形態と同じ機能部は、同じ符号を用いて説明を省略する。
[Second Embodiment]
FIG. 5 is a configuration diagram of the monitoring system 1a according to the present embodiment.
As shown in FIG. 5, the monitoring system 1a includes a monitored device 100a, a monitoring device 200a, and a power supply control unit 300. The monitored device 100a includes a communication unit 110, a video output unit 120, a keyboard signal input unit 130a, a control unit 140, and a power supply unit 150. The monitoring device 200a includes a video signal input unit 205, an image acquisition unit 210a, a pattern detection unit 215, a timing unit 220, a noise removal unit 225, a noise pattern DB 230, a noise pattern learning unit 235, a failure detection unit 240a, a panic pattern DB 245, a failure. A recovery procedure execution unit 250a, a failure recovery procedure DB 255, a communication unit 260a, and a monitored device attribute DB 280 are provided. The same functional units as those in the first embodiment are denoted by the same reference numerals and description thereof is omitted.

まず、被監視装置100aについて説明する。
キーボード信号入力部130aは、図示しないキーボードやマウスなどの入力装置からの入力信号、および、監視装置200aからの入力信号が入力される端子を備えている。キーボード信号入力部130aは、キーボードやマウスなどの入力装置、および、監視装置200aから入力された信号を制御部140に出力する。
First, the monitored device 100a will be described.
The keyboard signal input unit 130a includes a terminal to which an input signal from an input device such as a keyboard or a mouse (not shown) and an input signal from the monitoring device 200a are input. The keyboard signal input unit 130 a outputs a signal input from an input device such as a keyboard or a mouse and the monitoring device 200 a to the control unit 140.

電源部150は、電源制御蔵置300から入力された電力を被監視装置100の各機能部に供給する。   The power supply unit 150 supplies the power input from the power supply control storage 300 to each function unit of the monitored device 100.

次に、監視装置200について説明する。   Next, the monitoring apparatus 200 will be described.

画像取得部210aは、ビデオ信号入力部205、または、通信部260が出力するビデオ信号を取得し、取得したビデオ信号の入力画像データをパターン検出部215に出力する。   The image acquisition unit 210 a acquires a video signal output from the video signal input unit 205 or the communication unit 260, and outputs input image data of the acquired video signal to the pattern detection unit 215.

計時部220は、時間を示す情報を生成し、生成した時間を示す情報をパターン検出部215に出力する。   The timing unit 220 generates information indicating the time, and outputs the information indicating the generated time to the pattern detection unit 215.

パターン検出部215は、画像取得部210が出力する入力画像データの中から公知の画像認識により、計時部220が出力する時間を示す情報に基づき、予め定められた期間(第2の期間)、黒信号が連続するブラックアウト状態を検出する。パターン検出部215は、例えば、画像認識の手法として、パターンマッチング手法などを用いる。
予め定められた期間、黒信号が連続するブラックアウト状態を検出する理由は、一般的なスクリーンセーバーの場合、一度、表示が黒になった後(この状態をブラックアウトという)、スクリーンセーバーの画像データが出力される。したがって、パターン検出部215は、スクリーンセーバーの動作が開始したことを検出するため、このブラックアウトを検出する。パターン検出部215は、ブラックアウトを検出した場合、ノイズ除去部225にブラックアウト検出後の入力画像データを順次、フレーム毎に出力する。
The pattern detection unit 215 has a predetermined period (second period) based on information indicating the time output from the time measuring unit 220 by known image recognition from the input image data output from the image acquisition unit 210. A blackout state in which black signals are continuous is detected. The pattern detection unit 215 uses, for example, a pattern matching method as an image recognition method.
The reason for detecting a blackout state in which a black signal continues for a predetermined period is that, in the case of a general screen saver, after the display turns black once (this state is called blackout), the image data of the screen saver is Is output. Therefore, the pattern detection unit 215 detects this blackout in order to detect that the operation of the screen saver has started. When detecting the blackout, the pattern detection unit 215 sequentially outputs the input image data after the blackout detection to the noise removal unit 225 for each frame.

障害検出部240aには、ノイズ除去部225が出力するノイズ除去された画像データが入力される。障害検出部240は、入力されたノイズ除去された画像データが、パニックパターンDB245に格納されている画像データと一致するか否かを判別する。障害検出部240aは、ノイズ除去された画像データがパニックパターンDB245に格納されている画像データと一致すると判別された場合、被監視装置100がダウン状態またはパニック状態になっていると判断する。障害検出部240は、パニックパターンDB245に格納されている画像データに関連付けられて格納されている被監視装置100の状態を示す情報を読み出し、読み出した被監視装置100の障害状態を示す情報を障害復旧手順実行部250に出力する。
また、障害検出部240aは、ノイズ除去された画像データがパニックパターンDB245に格納されている画像データと一致しない判別された場合、ノイズパターンDB230に格納されていない新たなノイズパターンの画像であるため、ノイズ除去された画像データをノイズパターン学習部235に出力する。
The failure detection unit 240a receives the noise-removed image data output from the noise removal unit 225. The failure detection unit 240 determines whether or not the input noise-removed image data matches the image data stored in the panic pattern DB 245. When it is determined that the noise-removed image data matches the image data stored in the panic pattern DB 245, the failure detection unit 240a determines that the monitored device 100 is in the down state or the panic state. The failure detection unit 240 reads information indicating the state of the monitored device 100 stored in association with the image data stored in the panic pattern DB 245, and sets the read information indicating the failure state of the monitored device 100 as a failure. The data is output to the recovery procedure execution unit 250.
Further, when it is determined that the image data from which noise has been removed does not match the image data stored in the panic pattern DB 245, the failure detection unit 240a is a new noise pattern image that is not stored in the noise pattern DB 230. The image data from which noise has been removed is output to the noise pattern learning unit 235.

ノイズパターン学習部235は、障害検出部240aが出力する画像データを学習してノイズパターンDB230に学習させる。   The noise pattern learning unit 235 learns the image data output from the failure detection unit 240a and causes the noise pattern DB 230 to learn.

障害復旧手順実行部250aは、障害検出部240が出力する被監視装置100の障害状態を示す情報に基づき、障害復旧手順DB255から故障復旧手順を読み出す。障害復旧手順実行部250aは、読み出した故障復旧手順に従って、電源制御装置300、および、被監視装置100に対して故障復旧処理を行う。   The failure recovery procedure execution unit 250a reads the failure recovery procedure from the failure recovery procedure DB 255 based on the information indicating the failure state of the monitored device 100 output from the failure detection unit 240. The failure recovery procedure execution unit 250a performs failure recovery processing on the power supply control device 300 and the monitored device 100 according to the read failure recovery procedure.

通信部260aは、ネットワーク20を介して被監視装置100と接続されている。通信部260aは、障害復旧手順実行部250が出力する故障復旧処理を示す情報を、ネットワーク20を介して被監視装置100に送信する。また、通信部260aは、被監視装置100から送信された情報を、ネットワーク20を介して受信し、受信した情報が画像データの場合、受信した画像データを画像取得部210aに出力する。   The communication unit 260 a is connected to the monitored device 100 via the network 20. The communication unit 260 a transmits information indicating the failure recovery process output from the failure recovery procedure execution unit 250 to the monitored device 100 via the network 20. The communication unit 260a receives information transmitted from the monitored device 100 via the network 20, and outputs the received image data to the image acquisition unit 210a when the received information is image data.

電源制御装置300は、外部からの電力を被監視装置100に供給する装置である。電源制御装置300は、監視装置200からの制御により、被監視装置100に供給する電圧を停止、または供給開始するように制御する。   The power supply control device 300 is a device that supplies external power to the monitored device 100. The power supply control apparatus 300 controls the voltage supplied to the monitored apparatus 100 to be stopped or to be started by the control from the monitoring apparatus 200.

次に、ノイズパターンの除去と、パニック時の処理の一例について、図6を用いて説明する。図6は、本実施形態に係るノイズパターンの除去と、パニック時の処理のフローチャートである。   Next, an example of noise pattern removal and panic processing will be described with reference to FIG. FIG. 6 is a flowchart of noise pattern removal and panic processing according to the present embodiment.

(ステップS101、S102)
ステップS101とS102は、第1実施形態のステップS1、S2と同様に行う。ステップS102終了後、ステップS103に進む。
(Steps S101 and S102)
Steps S101 and S102 are performed in the same manner as steps S1 and S2 of the first embodiment. After step S102, the process proceeds to step S103.

(ステップS103)
次に、パターン検出部215は、計時部220が出力する時間を示す情報に基づき、予め定めた期間以上、画像取得部210aが出力する入力画像データがブラックアウトしたか否かを公知の画像認識により検出する。この処理の理由は、一般的なスクリーンセーバーの場合、入力画像データが、一度ブラックアウトした後、スクリーンセーバーが起動されるためである。ブラックアウトを検出した場合、パターン検出部215は、入力された入力画像データをノイズ除去部225に出力する。ステップS103終了後、ステップS104に進む。
(Step S103)
Next, the pattern detection unit 215 performs known image recognition based on the information indicating the time output from the time measuring unit 220 to determine whether or not the input image data output from the image acquisition unit 210a has been blacked out for a predetermined period or longer. To detect. The reason for this processing is that, in the case of a general screen saver, the screen saver is activated after the input image data is blacked out once. When blackout is detected, the pattern detection unit 215 outputs the input image data that has been input to the noise removal unit 225. After step S103 ends, the process proceeds to step S104.

(ステップS104〜S108)
ステップS104〜S108は、ステップS3〜S7と同様に行う。
(Steps S104 to S108)
Steps S104 to S108 are performed in the same manner as steps S3 to S7.

(ステップS109)
次に、障害検出部240aは、ノイズ除去部225が出力するノイズ除去された画像データを、パニックパターンDB245に格納されている画像データと一致するか否かを判別する。ステップS109終了後、ステップS110に進む。
(Step S109)
Next, the failure detection unit 240a determines whether or not the noise-removed image data output from the noise removal unit 225 matches the image data stored in the panic pattern DB 245. After step S109 ends, the process proceeds to step S110.

(ステップS110)
入力画像データがパニックパターンDB245に格納されている画像データと一致すると判別された場合(ステップS110;Yes)、ステップS112に進む。この場合、障害検出部240aは、一致した画像データに基づき、被監視装置100aがダウン状態かパニック状態であると判断する。
入力画像データがパニックパターンDB245に格納されている画像データと一致しないと判別された場合(ステップS110;No)、ステップS111に進む。この場合、入力画像データがパニックパターンDB245に格納されている画像データと一致しないと判別されたため、障害検出部240aは、被監視装置100aが正常動作状態であると判別する。次に、障害検出部240aは、入力画像データが、ノイズパターンDB230に、まだ格納されていないと判別する。
(Step S110)
When it is determined that the input image data matches the image data stored in the panic pattern DB 245 (step S110; Yes), the process proceeds to step S112. In this case, the failure detection unit 240a determines that the monitored device 100a is in a down state or a panic state based on the matched image data.
If it is determined that the input image data does not match the image data stored in the panic pattern DB 245 (step S110; No), the process proceeds to step S111. In this case, since it is determined that the input image data does not match the image data stored in the panic pattern DB 245, the failure detection unit 240a determines that the monitored device 100a is in a normal operation state. Next, the failure detection unit 240a determines that the input image data is not yet stored in the noise pattern DB 230.

(ステップS111)
入力画像データがノイズパターンDB230に格納されている画像データと一致しないと判別された場合(ステップS110;No)、障害検出部240aは、ノイズ除去された画像データをノイズパターン学習部235に出力する。
次に、ノイズパターン学習部235は、障害検出部240aが出力するノイズ除去された画像データをノイズパターンDB230に学習させる。ステップS111終了後、ステップS101に戻る。
(Step S111)
When it is determined that the input image data does not match the image data stored in the noise pattern DB 230 (step S110; No), the failure detection unit 240a outputs the image data from which noise has been removed to the noise pattern learning unit 235. .
Next, the noise pattern learning unit 235 causes the noise pattern DB 230 to learn the noise-removed image data output from the failure detection unit 240a. After step S111 is completed, the process returns to step S101.

(ステップS112)
ノイズ除去された画像データがパニックパターンDB245に格納されている画像データと一致すると判別された場合(ステップS110;Yes)、障害検出部240aは、一致した画像データに基づき、被監視装置100aがダウン状態かパニック状態であると判断する。
次に、障害検出部240aは、パニックパターンDB245に格納されている画像データに関連付けられて格納されている被監視装置100aの状態を示す情報を読み出し、読み出した被監視装置100aの障害状態を示す情報を障害復旧手順実行部250aに出力する。
(Step S112)
When it is determined that the noise-removed image data matches the image data stored in the panic pattern DB 245 (step S110; Yes), the failure detection unit 240a causes the monitored device 100a to be down based on the matched image data. Judged to be in a state or panic state.
Next, the failure detection unit 240a reads information indicating the state of the monitored device 100a stored in association with the image data stored in the panic pattern DB 245, and indicates the read failure state of the monitored device 100a. The information is output to the failure recovery procedure execution unit 250a.

次に、障害復旧手順実行部250aは、障害検出部240aが出力する被監視装置100aの障害状態を示す情報に基づき、障害復旧手順DB255から故障復旧手順を読み出す。障害検出部240は、読み出した故障復旧手順に従って、被監視装置100に対して故障復旧処理を行う。例えば、障害復旧手順実行部250aは、ソフトウェア・リセットのキーの組み合わせ以外のいずれかのキーが押された状態を示す信号を生成し、または、マウスを動かした状態を示す信号を生成する。そして、障害復旧手順実行部250aは、生成したいずれかのキーが押された状態を示す信号、または、マウスを動かした状態を示す信号を、被監視装置100aのキーボード信号入力部130aに送信し、画像データが変化するか否かを確認する。このような処理を行っても、画像データが変化しない場合、障害復旧手順実行部250aは、さらに以下の処理を行う。   Next, the failure recovery procedure execution unit 250a reads the failure recovery procedure from the failure recovery procedure DB 255 based on the information indicating the failure state of the monitored device 100a output from the failure detection unit 240a. The failure detection unit 240 performs failure recovery processing on the monitored device 100 according to the read failure recovery procedure. For example, the failure recovery procedure execution unit 250a generates a signal indicating a state where any key other than the software reset key combination is pressed or generates a signal indicating a state where the mouse is moved. Then, the failure recovery procedure execution unit 250a transmits a signal indicating that one of the generated keys has been pressed or a signal indicating the state of moving the mouse to the keyboard signal input unit 130a of the monitored device 100a. Whether or not the image data changes is confirmed. If the image data does not change after such processing, the failure recovery procedure execution unit 250a further performs the following processing.

障害復旧手順実行部250aは、被監視装置100aのキーボード信号入力部130aに、例えばソフトウェア・リセットのキーの組み合わせ信号を送信する。なお、ソフトウェア・リセットのキーの組み合わせ信号とは、例えば、Ctrl(コントロール)キーとAltキーとDeleteキーを同時に押した場合の信号である。
次に、障害復旧手順実行部250aは、予め定められた時間後、例えば、被監視装置100aの通信部110に対してポーリング処理を行い、ソフトウェア・リセット処理が実行できたか否かを確認する。被監視装置100aから応答が無い場合、障害復旧手順実行部250aは、再度、被監視装置100aのキーボード信号入力部130aに、例えばソフトウェア・リセットのキーの組み合わせ信号を送信する。なお、予め定められた時間とは、被監視装置100aに対してソフトウェア・リセット処理を行わせ、再起動するまでの時間以上の時間であり、例えば120秒である。
また、被監視装置100aのキーボード信号入力部130へソフトウェア・リセットのキーの組み合わせ信号を送信する前に、障害復旧手順実行部250aは、被監視装置100aの管理者に対して、被監視装置100を再起動することを示す情報を、ネットワーク20を介してメール等で送信する。そして、管理者から了解を得た後に、障害復旧手順実行部250aは、被監視装置100aのキーボード信号入力部130aに、ソフトウェア・リセットのキーの組み合わせ信号を送信するようにしてもよい。
The failure recovery procedure execution unit 250a transmits, for example, a software reset key combination signal to the keyboard signal input unit 130a of the monitored device 100a. Note that the software reset key combination signal is, for example, a signal when the Ctrl (control) key, the Alt key, and the Delete key are pressed simultaneously.
Next, after a predetermined time, the failure recovery procedure execution unit 250a performs, for example, a polling process on the communication unit 110 of the monitored apparatus 100a to check whether the software reset process has been executed. When there is no response from the monitored device 100a, the failure recovery procedure execution unit 250a transmits again, for example, a software reset key combination signal to the keyboard signal input unit 130a of the monitored device 100a. The predetermined time is a time equal to or longer than the time until the monitored device 100a performs software reset processing and restarts, for example, 120 seconds.
In addition, before transmitting the software reset key combination signal to the keyboard signal input unit 130 of the monitored device 100a, the failure recovery procedure execution unit 250a sends the monitored device 100 to the administrator of the monitored device 100a. Is transmitted via the network 20 by e-mail or the like. Then, after obtaining approval from the administrator, the failure recovery procedure execution unit 250a may transmit a software reset key combination signal to the keyboard signal input unit 130a of the monitored device 100a.

このように被監視装置100aのキーボード信号入力部130へソフトウェア・リセットを行っても被監視装置100aを再起動できない場合、あるいは、ソフトウェア・リセットを行わずに障害復旧手順実行部250aは、以下のような処理を行う。
障害復旧手順実行部250aは、電源制御装置300に対して被監視装置100aへの電力の供給を停止する指示を送信する。この結果、被監視装置100aには、電源制御装置300から電力が供給されなくなる。そして、被監視装置100aは、強制的にシャットダウンする。
次に、障害復旧手順実行部250aは、予め定められた時間後、電源制御装置300に対して被監視装置100aへの電力の供給を開始する指示を送信する。この結果、被監視装置100aは、電力が供給再開されたことにより再起動される。なお、予め定められた時間とは、被監視装置100aへの電力の供給を停止した後、例えば被監視装置100aのHDDの回転が停止した後、起動しても支障が無い時間であり、例えば120秒である。
また、電源制御装置300に対して被監視装置100aへの電力の供給を停止する指示を送信する前に、障害復旧手順実行部250aは、被監視装置100aの管理者に対して、被監視装置100aを再起動することを示す情報を、ネットワーク20を介してメール等で送信する。そして、管理者から了解を得た後に、障害復旧手順実行部250aは、電源制御装置300に対して被監視装置100aへの通電を停止する指示を送信するようにしてもよい。
As described above, when the monitored device 100a cannot be restarted even if the software reset is performed on the keyboard signal input unit 130 of the monitored device 100a, or the failure recovery procedure executing unit 250a does not perform the software reset, Perform the following process.
The failure recovery procedure execution unit 250a transmits an instruction to stop the supply of power to the monitored device 100a to the power supply control device 300. As a result, power is not supplied from the power supply control device 300 to the monitored device 100a. Then, the monitored device 100a is forcibly shut down.
Next, the failure recovery procedure execution unit 250a transmits an instruction to start power supply to the monitored device 100a to the power supply control device 300 after a predetermined time. As a result, the monitored device 100a is restarted when power supply is resumed. Note that the predetermined time is a time when there is no problem even if the HDD is started after the rotation of the HDD of the monitored device 100a is stopped after the supply of power to the monitored device 100a is stopped. 120 seconds.
In addition, before transmitting an instruction to stop the supply of power to the monitored device 100a to the power supply control device 300, the failure recovery procedure execution unit 250a notifies the administrator of the monitored device 100a to the monitored device. Information indicating that the computer 100a is to be restarted is transmitted via the network 20 by e-mail or the like. Then, after obtaining approval from the administrator, the failure recovery procedure execution unit 250a may transmit an instruction to stop energization of the monitored device 100a to the power supply control device 300.

以上のように、故障復旧手順として、まず、監視装置200aは、被監視装置100aにソフトウェア・リセットのキーの組み合わせ以外のいずれかのキーが押された状態を示す信号、または、マウスを動かした状態を示す信号を送信する。これにより、被監視装置100aからの入力画像データがスクリーンセーバーによる画像データの場合、これらの処理により、画像データが変化する。この処理により、被監視装置100aの画像データは、スクリーンセーバーの画像データから、通常動作時の画像データに復帰する。この結果、監視装置200aは、被監視装置100aの状態を適切に監視できる。
また、上述の処理を行っても入力画像データが変化しない場合、監視装置200aは、被監視装置100aにソフトウェア・リセットのキーの組み合わせ信号を送信して、被監視装置100aに対してソフトウェア・リセットを行う。この結果、監視装置200aは、被監視装置100aを適切に故障復旧させることができる。
また、被監視装置100aに対してソフトウェア・リセットを行っても被監視装置100aが再起動しない場合、監視装置200aは、電源制御装置300に対して、被監視装置100aへの電力の供給を停止する指示を送信する。そして、電力の供給を停止する指示を送信後、予め定めた時間後に、監視装置200aは、被監視装置100aへの電源供給を再開して再起動するようにした。この結果、監視装置200aは、被監視装置100aを適切に故障復旧させることができる。
As described above, as a failure recovery procedure, first, the monitoring apparatus 200a moves the signal indicating that any key other than the software reset key combination is pressed on the monitored apparatus 100a or the mouse. A signal indicating the state is transmitted. Thereby, when the input image data from the monitored apparatus 100a is image data by the screen saver, the image data is changed by these processes. By this processing, the image data of the monitored device 100a is restored from the image data of the screen saver to the image data during the normal operation. As a result, the monitoring apparatus 200a can appropriately monitor the state of the monitored apparatus 100a.
If the input image data does not change even after the above processing is performed, the monitoring apparatus 200a transmits a software reset key combination signal to the monitored apparatus 100a and performs a software reset to the monitored apparatus 100a. I do. As a result, the monitoring device 200a can properly recover the failure of the monitored device 100a.
In addition, if the monitored device 100a does not restart even if a software reset is performed on the monitored device 100a, the monitoring device 200a stops supplying power to the monitored device 100a to the power supply control device 300. Send instructions to do. And after transmitting the instruction | indication which stops supply of electric power, after the predetermined time, the monitoring apparatus 200a restarted by restarting the power supply to the to-be-monitored apparatus 100a. As a result, the monitoring device 200a can properly recover the failure of the monitored device 100a.

また、本実施形態では、ステップS111で、ノイズパターン学習部235が、画像データをノイズパターンDB230に学習させる例を説明したが、画像データ、画像データ形式、画像データ表示計測時間、OS種別などを関連づけて、ノイズパターンDB230に学習させるようにしてもよい。   In the present embodiment, the example in which the noise pattern learning unit 235 causes the noise pattern DB 230 to learn the image data in step S111 has been described. However, the image data, the image data format, the image data display measurement time, the OS type, and the like are described. In association therewith, the noise pattern DB 230 may be made to learn.

また、本実施形態では、監視装置200aが、被監視装置100aのビデオ信号出力部120が出力する画像データを取得する例を説明した。画像の取得は、被監視装置100aの他の出力部からでもよく、例えば、通信部110のLAN(Local Area Network)端子経由で取得してもよい。この場合、被監視装置100aの制御部140は、画像データを、通信部110を介して、ネットワーク20に送信する。そして、監視装置200aの通信部260aは、被監視装置100aから送信された画像データを、ネットワーク20を介して受信し、受信した画像データを画像取得部210aに出力する。あるいは、被監視装置100aの制御部140は、画像データを図示しないUSB(Universal Serial Bus)端子を介して、ネットワーク20に送信する。そして、監視装置200aの通信部260aは、被監視装置100aから送信された画像データを、ネットワーク20を介して受信し、受信した画像データを画像取得部210aに出力する。   In the present embodiment, the example in which the monitoring device 200a acquires the image data output from the video signal output unit 120 of the monitored device 100a has been described. The image may be acquired from another output unit of the monitored apparatus 100a. For example, the image may be acquired via a LAN (Local Area Network) terminal of the communication unit 110. In this case, the control unit 140 of the monitored apparatus 100a transmits the image data to the network 20 via the communication unit 110. Then, the communication unit 260a of the monitoring device 200a receives the image data transmitted from the monitored device 100a via the network 20, and outputs the received image data to the image acquisition unit 210a. Alternatively, the control unit 140 of the monitored apparatus 100a transmits image data to the network 20 via a USB (Universal Serial Bus) terminal (not shown). Then, the communication unit 260a of the monitoring device 200a receives the image data transmitted from the monitored device 100a via the network 20, and outputs the received image data to the image acquisition unit 210a.

また、本実施形態では、障害復旧手順実行部250aが、まず被監視装置100aにいずれかのキーが押された状態を示す信号、または、マウスを動かした状態を示す信号を送信して、被監視装置100aがダウン状態またはパニック状態になっているか再判断する例を説明した。しかしながら、被監視装置100aがダウン状態またはパニック状態になっているかの再判別は、これに限られない
例えば、障害復旧手順実行部250aは、第1実施形態と同様に、被監視装置100aの通信部110へポーリング処理を行っても被監視装置100aから応答が無い場合、障害復旧手順実行部250aは、被監視装置100aのキーボード信号入力部130aに、例えばソフトウェア・リセットのキーの組み合わせ信号を送信するようにしてもよい。
In this embodiment, the failure recovery procedure execution unit 250a first transmits a signal indicating that any key has been pressed to the monitored apparatus 100a or a signal indicating the state in which the mouse is moved. An example has been described in which it is determined again whether the monitoring device 100a is in a down state or a panic state. However, the re-determination of whether the monitored device 100a is in the down state or the panic state is not limited to this. For example, the failure recovery procedure execution unit 250a communicates with the monitored device 100a as in the first embodiment. If there is no response from the monitored device 100a even after performing the polling process to the unit 110, the failure recovery procedure execution unit 250a transmits, for example, a software reset key combination signal to the keyboard signal input unit 130a of the monitored device 100a. You may make it do.

[第3実施形態]
次に、本実施形態について、図1と図7を用いて説明する。なお、図5の構成を用いても同様の効果が得られる。
本実施形態は、被監視装置100bのホストOS上で、複数の仮想マシン(Virtual Machine)が動作している。なお、仮想マシンとは、OSが動作する実際のコンピュータを仮想的に構築したものである。これにより、1台のコンピュータを仮想マシンに分割することで、複数のOSを並列に実行させることができる。
[Third Embodiment]
Next, this embodiment will be described with reference to FIGS. 1 and 7. The same effect can be obtained by using the configuration of FIG.
In this embodiment, a plurality of virtual machines (Virtual Machines) are operating on the host OS of the monitored apparatus 100b. Note that a virtual machine is a virtual computer constructed of an actual computer on which the OS operates. Thus, a plurality of OSs can be executed in parallel by dividing one computer into virtual machines.

図7は、本実施形態に係る監視システム1bの概略構成図である。
図7に示すように、監視システム1bは、被監視装置100b、監視装置200bにより構成されている。被監視装置100bは、通信部110、ビデオ出力部120−1〜120−n、キーボード信号入力部130、制御部140b、電源部150を備えている。監視装置200bは、ビデオ信号入力部205−1〜205−n、画像取得部210b、ノイズ除去部225、ノイズパターンDB230、障害検出部240、パニックパターンDB245、障害復旧手順実行部250、障害復旧手順DB255、通信部260、被監視装置属性DB280bを備えている。
FIG. 7 is a schematic configuration diagram of the monitoring system 1b according to the present embodiment.
As shown in FIG. 7, the monitoring system 1b includes a monitored device 100b and a monitoring device 200b. The monitored device 100b includes a communication unit 110, video output units 120-1 to 120-n, a keyboard signal input unit 130, a control unit 140b, and a power supply unit 150. The monitoring device 200b includes a video signal input unit 205-1 to 205-n, an image acquisition unit 210b, a noise removal unit 225, a noise pattern DB 230, a failure detection unit 240, a panic pattern DB 245, a failure recovery procedure execution unit 250, and a failure recovery procedure. DB255, the communication part 260, and the to-be-monitored apparatus attribute DB280b are provided.

被監視装置100bの制御部140bは、仮想マシンのOSにより生成された画像データをビデオ出力部120−1〜120−nに出力する。
このように、複数のビデオ信号出力部を有する理由120−1〜120−nは、仮想マシンの中には、ホストOSの全画面を使って動作するものもあるからである。このような場合、被監視装置100bから出力される画像データは、一般的には被監視装置100bに接続されている図示しない表示装置に表示されている仮想マシンVMの画像データのみで、他の仮想マシンのVMはバックグランドで動作し、画像データが図示しない表示装置に表示されていない。すなわち、ビデオ出力部が1つのみの場合、図示しない表示装置に表示されている画像データのみが、監視装置200bに出力されることになる。このため、被監視装置100bは、複数のビデオ出力部120−1〜120−nを備えることが好ましい。
The control unit 140b of the monitored apparatus 100b outputs image data generated by the OS of the virtual machine to the video output units 120-1 to 120-n.
As described above, the reason for having a plurality of video signal output units 120-1 to 120-n is that some virtual machines operate using the entire screen of the host OS. In such a case, the image data output from the monitored device 100b is generally only the image data of the virtual machine VM 1 displayed on a display device (not shown) connected to the monitored device 100b. The VM 2 of the virtual machine operates in the background, and image data is not displayed on a display device (not shown). That is, when there is only one video output unit, only image data displayed on a display device (not shown) is output to the monitoring device 200b. For this reason, it is preferable that the monitored apparatus 100b includes a plurality of video output units 120-1 to 120-n.

監視装置200bのビデオ信号入力部205−1〜205−nは、被監視装置100bが出力するビデオ信号が各々入力され、入力されたビデオ信号を画像取得部210bに出力する。なお、被監視装置100bのビデオ出力部120−1と監視装置200のビデオ信号入力部205−1とは、ビデオケーブル10−1で接続されている。同様に、被監視装置100bのビデオ出力部120−nと監視装置200のビデオ信号入力部205−nとは、ビデオケーブル10−nで接続されている。   The video signal input units 205-1 to 205-n of the monitoring device 200b each receive the video signal output from the monitored device 100b, and output the input video signal to the image acquisition unit 210b. The video output unit 120-1 of the monitored apparatus 100b and the video signal input unit 205-1 of the monitoring apparatus 200 are connected by a video cable 10-1. Similarly, the video output unit 120-n of the monitored apparatus 100b and the video signal input unit 205-n of the monitoring apparatus 200 are connected by a video cable 10-n.

画像取得部210bは、ビデオ信号入力部205−1〜205−nが出力するビデオ信号を取得し、取得したビデオ信号の入力画像データをノイズ除去部225に出力する。
被監視装置属性DB280bには、被監視装置100の識別IDと、被監視装置100bで起動されているOSの属性(バージョンを含む)が、予め関連づけられて格納されている。また、被監視装置属性DB280bには、被監視装置100bで起動されている仮想マシン毎の識別IDと、仮想マシン毎のOSの属性が関連づけられて格納されている。
The image acquisition unit 210b acquires video signals output from the video signal input units 205-1 to 205-n, and outputs input image data of the acquired video signals to the noise removal unit 225.
In the monitored device attribute DB 280b, the identification ID of the monitored device 100 and the attributes (including the version) of the OS activated on the monitored device 100b are stored in association with each other. The monitored device attribute DB 280b stores an identification ID for each virtual machine activated in the monitored device 100b and an OS attribute for each virtual machine in association with each other.

図8は、本実施形態に係る被監視装置100bの物理レイヤ400の構成の一例を説明する図である。図8に示すように、被監視装置100bの物理レイヤ400は、下層レイヤ450、上層レイヤ410により構成されている。
下層レイヤ450は、ホストOSの動作しているレイヤである。
上層レイヤ410は、アプリケーションのレイヤであり、本実施形態では、ホストOS上で、複数の仮想マシンVM(420−1)〜VM(420−n)が動作している。このような仮想マシンにおいては、被監視装置100bは、複数のビデオ信号出力部120−1〜120−nを備えている。例えば、被監視装置100bは、仮想マシンVM(420−1)の画像データをビデオ信号出力部120−1から出力し、仮想マシンVM(420−n)の画像データをビデオ信号出力部120−nから出力する。あるいは、被監視装置100bは、図示しない複数の通信部110−1〜110−nを備えている。被監視装置100bは、仮想マシンVM(420−1)の画像データを図示しない通信部110−1から出力し、仮想マシンVM(420−n)の画像データを図示しない通信部110−nから出力する。
複数の仮想マシンVM(420−1)〜VM(420−n)が動作している場合、どの仮想マシンからの出力かを見分けるため、各仮想マシンVM(420−1)〜VM(420−n)の出力に識別IDを設ける。例えば、仮想マシンVM(420−1)に対する識別IDはV、仮想マシンVM(420−2)に対する識別IDはVである。
FIG. 8 is a diagram illustrating an example of the configuration of the physical layer 400 of the monitored apparatus 100b according to the present embodiment. As illustrated in FIG. 8, the physical layer 400 of the monitored apparatus 100 b includes a lower layer 450 and an upper layer 410.
The lower layer 450 is a layer in which the host OS is operating.
The upper layer 410 is an application layer. In this embodiment, a plurality of virtual machines VM 1 (420-1) to VM n (420-n) are operating on the host OS. In such a virtual machine, the monitored apparatus 100b includes a plurality of video signal output units 120-1 to 120-n. For example, the monitored apparatus 100b outputs image data of the virtual machine VM 1 (420-1) from the video signal output unit 120-1, and outputs image data of the virtual machine VM n (420-n) to the video signal output unit 120. Output from -n. Alternatively, the monitored device 100b includes a plurality of communication units 110-1 to 110-n (not shown). The monitored device 100b outputs the image data of the virtual machine VM 1 (420-1) from the communication unit 110-1 (not shown), and the image data of the virtual machine VM n (420-n) is not shown. Output from.
When a plurality of virtual machines VM 1 (420-1) to VM n (420-n) are operating, each virtual machine VM 1 (420-1) to VM n is identified in order to identify which virtual machine the output is from. An identification ID is provided in the output of (420-n). For example, the identification ID to the virtual machine VM 1 (420-1) is V 1, the identification ID to the virtual machine VM 2 (420-2) is V 2.

例えば、被管理装置100上で、2つの仮想マシンVM(420−1)と仮想マシンVM(420−2)が動作しているとして、説明を行う。
被監視装置100のビデオ信号出力部120は、仮想マシンVM(420−1)と仮想マシンVM(420−2)との画像データに識別IDを付けて、監視装置200に出力する。
管理装置200の画像取得部210は、被監視装置100の仮想マシンVM(420−1)と仮想マシンVM(420−2)との各識別IDを含む画像データが入力される。
監視装置200のパターン検出部215、ノイズ除去部225、および、障害検出部240等は、図4のフローチャートと同様に、各仮想マシンに障害が生じていないか監視する。
For example, description will be made assuming that two virtual machines VM 1 (420-1) and virtual machine VM 2 (420-2) are operating on the managed device 100.
The video signal output unit 120 of the monitored apparatus 100 attaches an identification ID to the image data of the virtual machine VM 1 (420-1) and the virtual machine VM 2 (420-2) and outputs the image data to the monitoring apparatus 200.
The image acquisition unit 210 of the management apparatus 200 receives image data including identification IDs of the virtual machine VM 1 (420-1) and the virtual machine VM 2 (420-2) of the monitored apparatus 100.
The pattern detection unit 215, the noise removal unit 225, the failure detection unit 240, and the like of the monitoring device 200 monitor whether a failure has occurred in each virtual machine, as in the flowchart of FIG.

図4のステップS5において、ノイズ除去部225は、ノイズパターンDB230から読み出した画像データのOSの属性と、被監視装置属性DB280bから読み出した仮想マシンで起動しているOSの属性とが一致するか再判別する。ノイズパターンDB230から読み出した画像データのOSの属性と、仮想マシンで起動しているOSとが一致する場合、ノイズ除去部225は、入力画像データをノイズパターンと判別してノイズ画像データを除去する。ノイズパターン除去後、ステップS1に戻る。
一方、ノイズパターンDB230から読み出した画像データのOSの属性と、仮想マシンで起動しているOSとが一致しない場合、ステップS6に進む。
そして、図4のステップS8で、画像データがパニックパターンDB245に格納されている画像データと一致した場合、障害検出部240は、画像データに付けられている識別IDにより、どの仮想マシンに障害が生じているかを判別する。例えば仮想装置VMに障害が生じている場合、障害検出部240は、例えば、通信部260を介して、被監視装置100に、仮想装置VMに対して再起動を行う指示を送信する。あるいは、障害検出部240は、仮想装置VMに障害が生じていることを示す情報を、被監視装置100の管理者に送信する。
In step S5 of FIG. 4, the noise removal unit 225 determines whether the OS attribute of the image data read from the noise pattern DB 230 matches the OS attribute of the OS running on the virtual machine read from the monitored device attribute DB 280b. Determine again. When the OS attribute of the image data read from the noise pattern DB 230 matches the OS running on the virtual machine, the noise removal unit 225 determines that the input image data is a noise pattern and removes the noise image data. . After removing the noise pattern, the process returns to step S1.
On the other hand, if the OS attribute of the image data read from the noise pattern DB 230 does not match the OS running on the virtual machine, the process proceeds to step S6.
If the image data matches the image data stored in the panic pattern DB 245 in step S8 of FIG. 4, the failure detection unit 240 determines which virtual machine has a failure based on the identification ID attached to the image data. Determine if it has occurred. For example, when a failure has occurred in the virtual device VM 1 , the failure detection unit 240 transmits an instruction to restart the virtual device VM 1 to the monitored device 100 via the communication unit 260, for example. Alternatively, the failure detection unit 240 transmits information indicating that a failure has occurred in the virtual device VM 1 to the administrator of the monitored device 100.

なお、本実施形態では、画像データに付けられた識別IDを用いて、仮想マシンを識別する例を説明したが、識別は識別IDを使用しなくても良い。この場合、ホストOS上で動作している仮想マシンのOSの種類やバージョン特有の画像データを正常動作時に監視装置200bの画像取得部210bが検出する。そして、検出した結果に基づき、障害検出部240が、仮想マシンを識別するようにしてもよい。   In this embodiment, the example in which the virtual machine is identified using the identification ID attached to the image data has been described. However, the identification ID may not be used for identification. In this case, the image acquisition unit 210b of the monitoring apparatus 200b detects image data specific to the type and version of the virtual machine operating on the host OS during normal operation. Then, based on the detected result, the failure detection unit 240 may identify the virtual machine.

本実施形態では、被監視装置100が複数のビデオ信号出力部を備える例を説明したが、ビデオ信号出力部は、1つでもよい。この場合、被監視装置100は、仮想マシンVMとVMとの画像データに識別子を付けて、例えば時分割して交互に送信する。
そして、監視装置200bのビデオ信号入力部205bは、このように送信された画像データを取得し、取得した画像データを用いて、各仮想マシンに障害が生じていないかを検出するようにしてもよい。
In the present embodiment, an example in which the monitored apparatus 100 includes a plurality of video signal output units has been described. However, the number of video signal output units may be one. In this case, the monitored apparatus 100 attaches identifiers to the image data of the virtual machines VM 1 and VM 2 and transmits them alternately, for example, in a time division manner.
Then, the video signal input unit 205b of the monitoring device 200b acquires the image data transmitted in this way, and detects whether a failure has occurred in each virtual machine using the acquired image data. Good.

なお、本実施形態では、被監視装置100、100a、および100bが1台の例を説明したが、被監視装置は複数であってもよい。この場合、監視装置200、200aは、複数の被監視装置が出力する画像データを時分割で受信するか、あるいは、図7に示した監視装置200bのように複数のビデオ信号入力部を備えるようにしてもよい。   In the present embodiment, an example in which the monitored devices 100, 100a, and 100b are one has been described, but there may be a plurality of monitored devices. In this case, the monitoring devices 200 and 200a receive the image data output from the plurality of monitored devices in a time-sharing manner, or include a plurality of video signal input units like the monitoring device 200b shown in FIG. It may be.

なお、上述した実施形態における図1、図5および図7の監視装置200、200a、および、200bの一部をコンピュータで実現するようにしても良い。その場合、この制御機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピュータシステム」とは、監視装置200に内蔵されたコンピュータシステムであって、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
また、上述した実施形態における監視装置、200a、および、200bの一部、または全部を、LSI(Large Scale Integration)等の集積回路として実現しても良い。また、監視装置200の各機能ブロックは個別にプロセッサ化してもよいし、一部、または全部を集積してプロセッサ化しても良い。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現しても良い。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いても良い。
In addition, you may make it implement | achieve a part of monitoring apparatus 200, 200a and 200b of FIG.1, FIG.5 and FIG.7 in embodiment mentioned above with a computer. In that case, the program for realizing the control function may be recorded on a computer-readable recording medium, and the program recorded on the recording medium may be read by a computer system and executed. Here, the “computer system” is a computer system built in the monitoring apparatus 200 and includes an OS and hardware such as peripheral devices. The “computer-readable recording medium” refers to a storage device such as a flexible medium, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Furthermore, the “computer-readable recording medium” is a medium that dynamically holds a program for a short time, such as a communication line when transmitting a program via a network such as the Internet or a communication line such as a telephone line, In such a case, a volatile memory inside a computer system serving as a server or a client may be included and a program that holds a program for a certain period of time. The program may be a program for realizing a part of the functions described above, and may be a program capable of realizing the functions described above in combination with a program already recorded in a computer system.
Moreover, you may implement | achieve part or all of the monitoring apparatus 200a in the embodiment mentioned above, and 200b as integrated circuits, such as LSI (Large Scale Integration). Each functional block of the monitoring device 200 may be individually made into a processor, or a part or all of them may be integrated into a processor. Further, the method of circuit integration is not limited to LSI, and may be realized by a dedicated circuit or a general-purpose processor. Further, in the case where an integrated circuit technology that replaces LSI appears due to progress in semiconductor technology, an integrated circuit based on the technology may be used.

1、1a、1b・・・監視システム1、100・・・被監視装置、
10・・・ビデオケーブル、20・・・ネットワーク、30・・・LANケーブル、
110・・・通信部、120・・・ビデオ信号出力部、
130・・・キーボード信号入力部、140・・・制御部、150・・・電源部、
200・・・監視装置、205・・・ビデオ信号入力部、210・・・画像取得部、
215・・・パターン検出部、220・・・計時部、225・・・ノイズ除去部、
230・・・ノイズパターンDB、235・・・ノイズパターン学習部、
240・・・障害検出部、245・・・パニックパターンDB、
250・・・障害復旧手順実行部、255・・・障害復旧手順DB、260・・・通信部
280・・・被監視装置属性DB
1, 1a, 1b ... monitoring system 1, 100 ... monitored device,
10 ... video cable, 20 ... network, 30 ... LAN cable,
110 ... communication unit, 120 ... video signal output unit,
130 ... Keyboard signal input unit, 140 ... Control unit, 150 ... Power supply unit,
200 ... monitoring device, 205 ... video signal input unit, 210 ... image acquisition unit,
215 ... Pattern detection unit, 220 ... Timekeeping unit, 225 ... Noise removal unit,
230 ... Noise pattern DB, 235 ... Noise pattern learning unit,
240 ... failure detection unit, 245 ... panic pattern DB,
250 ... Failure recovery procedure execution unit, 255 ... Failure recovery procedure DB, 260 ... Communication unit 280 ... Monitored device attribute DB

Claims (8)

被監視装置から入力された入力画像データが、予め定められている非障害時の画像データであるノイズ画像データと一致するか否かを判別し、前記入力画像データが前記ノイズ画像データと一致すると判別した場合、前記入力画像データから前記ノイズ画像データを除去するノイズ除去部と、
前記ノイズ除去部が出力する前記ノイズ画像データが除去された画像データであるノイズ除去された画像データが、予め定められている前記被監視装置の障害時の画像データである障害画像データと一致するか否かを判別し、前記ノイズ除去された画像データが前記障害画像データと一致すると判別した場合、前記被監視装置に障害が発生していると判別する障害検出部と、
前記障害検出部により前記被監視装置に障害が発生していると判別された場合、予め定められている前記被監視装置の障害復旧手順を実行する障害復旧手順実行部と、
を備えることを特徴とする監視装置。
It is determined whether or not the input image data input from the monitored device matches noise image data that is predetermined non-failure image data, and the input image data matches the noise image data If determined, a noise removing unit that removes the noise image data from the input image data;
The noise-removed image data that is the image data from which the noise image data output by the noise removing unit is removed matches the failure image data that is predetermined image data at the time of failure of the monitored device. A failure detection unit that determines that a failure has occurred in the monitored device when it is determined that the noise-removed image data matches the failure image data;
A failure recovery procedure execution unit that executes a predetermined failure recovery procedure of the monitored device when the failure detection unit determines that a failure has occurred in the monitored device;
A monitoring device comprising:
前記ノイズ画像データと、前記ノイズ画像データの属性を示す情報として前記ノイズ画像データが起動されているOSを示す情報とが関連づけられて格納されているノイズパターンのデータベース
を備え、
前記ノイズ除去部は、
前記入力画像データと一致する前記ノイズ画像データが、前記ノイズパターンのデータベースに格納されているか否かを判別し、
前記入力画像データと一致する前記ノイズ画像データが前記ノイズパターンのデータベースに格納されていた場合、前記ノイズ画像データと関連づけられて格納されている前記属性を示す情報としての前記被監視装置で起動されているOSを示す情報と、前記被監視装置で起動されているOSの属性とが一致するか否かを判別し、
前記格納されている前記被監視装置で起動されているOSの属性と、前記被監視装置で起動されているOSの属性とが一致する場合、前記入力画像データが前記ノイズ画像データと一致すると判別し、前記入力画像データが前記ノイズ画像データと一致する場合、前記入力画像データから前記ノイズ画像データを除去する
ことを特徴とする請求項1に記載の監視装置。
A noise pattern database in which the noise image data is stored in association with information indicating an OS in which the noise image data is activated as information indicating the attribute of the noise image data;
The noise removing unit
Determining whether the noise image data matching the input image data is stored in the noise pattern database;
When the noise image data that matches the input image data is stored in the noise pattern database, it is activated by the monitored device as information indicating the attribute stored in association with the noise image data. Determining whether or not the information indicating the operating OS matches the attribute of the OS activated on the monitored device;
When the stored attribute of the OS activated on the monitored apparatus matches the attribute of the OS activated on the monitored apparatus, it is determined that the input image data matches the noise image data. The monitoring apparatus according to claim 1, wherein when the input image data matches the noise image data, the noise image data is removed from the input image data.
前記ノイズ除去部は、
前記入力画像データが前記ノイズ画像データではないと判別した場合、予め定められている第1の期間以上、前記入力画像データが変化するか否かを判別し、前記予め設定されている期間以上、前記入力画像データが変化しないと判別した場合、前記入力画像データから前記ノイズ画像データを除去する
ことを特徴とする請求項1または請求項2に記載の監視装置。
The noise removing unit
When it is determined that the input image data is not the noise image data, it is determined whether or not the input image data is changed for a predetermined first period or more, and for a predetermined period or more, The monitoring apparatus according to claim 1, wherein when it is determined that the input image data does not change, the noise image data is removed from the input image data.
前記障害検出部は、
前記ノイズ除去部が出力する前記ノイズ除去された画像データが、前記障害画像データであると判別された場合、前記被監視装置に対してポーリング処理を行い、前記被監視装置から前記ポーリング処理に対する応答が無い場合に前記被監視装置に障害が発生していると判別する
ことを特徴とする請求項1から請求項3のいずれか1項に記載の監視装置。
The failure detection unit
When it is determined that the noise-removed image data output from the noise removing unit is the failure image data, a polling process is performed on the monitored apparatus, and a response from the monitored apparatus to the polling process is performed. The monitoring apparatus according to claim 1, wherein when there is no error, it is determined that a failure has occurred in the monitored apparatus.
前記ノイズ除去部は、
前記入力画像データが、前記ノイズ画像データと一致するか否かを判別する前に、
前記入力画像データが、予め定められている第2の期間以上、連続して黒画像の画像データであるか否かを判別し、
前記入力画像データが、予め定められている第2の期間以上、連続して黒画像の画像データであると判別した場合、前記入力画像データが、前記ノイズ画像データであるか否かの判別を開始する
ことを特徴とする請求項1から請求項4のいずれか1項に記載の監視装置。
The noise removing unit
Before determining whether the input image data matches the noise image data,
It is determined whether or not the input image data is image data of a black image continuously for a predetermined second period or longer,
When it is determined that the input image data is continuously black image data for a predetermined second period or longer, it is determined whether or not the input image data is the noise image data. The monitoring apparatus according to claim 1, wherein the monitoring apparatus starts.
前記ノイズ除去部は、
前記入力画像データを、ネットワークを介して前記被監視装置から取得する
ことを特徴とする請求項1から請求項5のいずれか1項に記載の監視装置。
The noise removing unit
The monitoring apparatus according to any one of claims 1 to 5, wherein the input image data is acquired from the monitored apparatus via a network.
前記障害検出部により前記ノイズ除去された画像データが前記障害画像データであると判別された場合、前記前記ノイズ除去された画像データを非障害時の画像データとして前記ノイズパターンのデータベースに学習させるノイズパターン学習部
を備えることを特徴とする請求項2に記載の監視装置。
Noise that causes the noise pattern database to learn the noise-removed image data as non-failure image data when the failure detection unit determines that the noise-removed image data is the failure image data. The monitoring apparatus according to claim 2, further comprising a pattern learning unit.
ノイズ除去部が、被監視装置から入力された入力画像データが、予め定められている非障害時の画像データであるノイズ画像データと一致するか否かを判別し、前記入力画像データが前記ノイズ画像データと一致すると判別した場合、前記入力画像データから前記ノイズ画像データを除去するノイズ除去工程と、
障害検出部が、前記ノイズ除去部が出力する前記ノイズ画像データが除去された画像データであるノイズ除去された画像データが、予め定められている前記被監視装置の障害時の画像データである障害画像データと一致するか否かを判別し、前記ノイズ除去された画像データが前記障害画像データと一致すると判別した場合、前記被監視装置に障害が発生していると判別する障害検出工程と、
障害復旧手順実行部が、前記障害検出部により前記被監視装置に障害が発生していると判別された場合、予め定められている前記被監視装置の障害復旧手順を実行する障害復旧手順実行工程と、
を含むことを特徴とする監視方法。
The noise removing unit determines whether or not the input image data input from the monitored apparatus matches noise image data that is predetermined non-failure image data, and the input image data is the noise If it is determined that the image data matches, a noise removal step of removing the noise image data from the input image data;
The failure in which the failure detection unit is the image data from which the noise image data output from the noise removal unit is removed and the noise-removed image data is predetermined image data at the time of failure of the monitored device Determining whether or not the image data matches, and when determining that the noise-removed image data matches the failure image data, a failure detection step of determining that a failure has occurred in the monitored device;
A failure recovery procedure execution step for executing a predetermined failure recovery procedure for the monitored device when the failure detection unit determines that the failure has occurred in the monitored device. When,
The monitoring method characterized by including.
JP2011076641A 2011-03-30 2011-03-30 Monitoring device and monitoring method Active JP5683354B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011076641A JP5683354B2 (en) 2011-03-30 2011-03-30 Monitoring device and monitoring method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011076641A JP5683354B2 (en) 2011-03-30 2011-03-30 Monitoring device and monitoring method

Publications (2)

Publication Number Publication Date
JP2012212243A true JP2012212243A (en) 2012-11-01
JP5683354B2 JP5683354B2 (en) 2015-03-11

Family

ID=47266152

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011076641A Active JP5683354B2 (en) 2011-03-30 2011-03-30 Monitoring device and monitoring method

Country Status (1)

Country Link
JP (1) JP5683354B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015155940A (en) * 2014-02-20 2015-08-27 株式会社リコー Image display device and image display method
JP2022172604A (en) * 2021-05-06 2022-11-17 楽天グループ株式会社 Access method, communication system, and program

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0816121A (en) * 1994-06-30 1996-01-19 Canon Inc Display control device and method
JPH08286954A (en) * 1995-04-19 1996-11-01 Oki Electric Ind Co Ltd Network management system
JPH11175180A (en) * 1997-12-12 1999-07-02 Nec Corp Server group display and monitoring device
JP2003162429A (en) * 2001-11-26 2003-06-06 Nec Fielding Ltd Apparatus, system and method for failure analysis by image information transmission, and program
JP2004295387A (en) * 2003-03-26 2004-10-21 Sharp Corp Inspection device and inspection method
JP2005250658A (en) * 2004-03-02 2005-09-15 Nec Corp Method for specifying system and server monitoring system
JP2006065659A (en) * 2004-08-27 2006-03-09 Fujitsu Ltd Computer operation recording program, computer operation solving program, computer, management apparatus, and method
JP2006309535A (en) * 2005-04-28 2006-11-09 Matsushita Electric Ind Co Ltd Mobile site monitoring system
JP2009093466A (en) * 2007-10-10 2009-04-30 Nec Corp Management system, monitoring server, manager server, monitoring method and monitoring program
JP2009140268A (en) * 2007-12-07 2009-06-25 Fujitsu Ltd Program, apparatus and method for automatically processing subsequent processing
JP2011039807A (en) * 2009-08-12 2011-02-24 Nec Corp Failure cause notification device, failure cause notification system, failure cause notification method and failure cause notification program
JP2011044074A (en) * 2009-08-24 2011-03-03 Nippon Telegr & Teleph Corp <Ntt> Application status recognition method, apparatus and program

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0816121A (en) * 1994-06-30 1996-01-19 Canon Inc Display control device and method
JPH08286954A (en) * 1995-04-19 1996-11-01 Oki Electric Ind Co Ltd Network management system
JPH11175180A (en) * 1997-12-12 1999-07-02 Nec Corp Server group display and monitoring device
JP2003162429A (en) * 2001-11-26 2003-06-06 Nec Fielding Ltd Apparatus, system and method for failure analysis by image information transmission, and program
JP2004295387A (en) * 2003-03-26 2004-10-21 Sharp Corp Inspection device and inspection method
JP2005250658A (en) * 2004-03-02 2005-09-15 Nec Corp Method for specifying system and server monitoring system
JP2006065659A (en) * 2004-08-27 2006-03-09 Fujitsu Ltd Computer operation recording program, computer operation solving program, computer, management apparatus, and method
JP2006309535A (en) * 2005-04-28 2006-11-09 Matsushita Electric Ind Co Ltd Mobile site monitoring system
JP2009093466A (en) * 2007-10-10 2009-04-30 Nec Corp Management system, monitoring server, manager server, monitoring method and monitoring program
JP2009140268A (en) * 2007-12-07 2009-06-25 Fujitsu Ltd Program, apparatus and method for automatically processing subsequent processing
JP2011039807A (en) * 2009-08-12 2011-02-24 Nec Corp Failure cause notification device, failure cause notification system, failure cause notification method and failure cause notification program
JP2011044074A (en) * 2009-08-24 2011-03-03 Nippon Telegr & Teleph Corp <Ntt> Application status recognition method, apparatus and program

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6014052626; Richard Thurston/藤原聡美、福岡洋一: 'MS、「ブルースクリーン」を模倣するジョークソフトを自社サイトで提供' CNET Japan , 20061117, p.1, 朝日インタラクティブ株式会社 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015155940A (en) * 2014-02-20 2015-08-27 株式会社リコー Image display device and image display method
JP2022172604A (en) * 2021-05-06 2022-11-17 楽天グループ株式会社 Access method, communication system, and program
JP7216767B2 (en) 2021-05-06 2023-02-01 楽天グループ株式会社 Access method, communication system and program

Also Published As

Publication number Publication date
JP5683354B2 (en) 2015-03-11

Similar Documents

Publication Publication Date Title
US20190332453A1 (en) Fault processing method, related apparatus, and computer
CN101809540B (en) Network context triggers for activating virtualized computer applications
CN106293979B (en) Method and apparatus of the detection procedure without response
JP5579650B2 (en) Apparatus and method for executing monitored process
TWI632462B (en) Switching device and method for detecting i2c bus
WO2018095107A1 (en) Bios program abnormal processing method and apparatus
US20080270827A1 (en) Recovering diagnostic data after out-of-band data capture failure
JP2014130585A (en) Firmware upgrade error detection and automatic rollback
JP6354901B2 (en) Virtual machine failure detection and recovery management system
CN116107819A (en) Server start-up fault detection system, method, device and medium
KR20040047209A (en) Method for automatically recovering computer system in network and recovering system for realizing the same
US20170132102A1 (en) Computer readable non-transitory recording medium storing pseudo failure generation program, generation method, and generation apparatus
US20150074808A1 (en) Rootkit Detection in a Computer Network
JP5683354B2 (en) Monitoring device and monitoring method
US11922199B2 (en) Associating security tags to continuous data protection checkpoints/snapshots/point-in-time images
CN106406963B (en) Initialization method and device of Linux system
CN112069032A (en) Availability detection method, system and related device for virtual machine
JP2013109722A (en) Computer, computer system and failure information management method
JP6222759B2 (en) Failure notification device, failure notification method and program
WO2024119787A1 (en) Method and apparatus for amd server system installation power-off processing, device and medium
CN104657166B (en) server system and node replacement method
CN115562900B (en) AMD server system installation power-off processing method, device, equipment and medium
CN116701055A (en) Fault isolation method, device, equipment and medium of server
TWI518519B (en) Server system and node replacement method
CN109412888B (en) Virtual switch monitoring method and device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130328

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20130515

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130816

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140131

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140314

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140507

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140707

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141216

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150113

R150 Certificate of patent or registration of utility model

Ref document number: 5683354

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250