JP2010198410A - Server failure prediction system - Google Patents

Server failure prediction system Download PDF

Info

Publication number
JP2010198410A
JP2010198410A JP2009043520A JP2009043520A JP2010198410A JP 2010198410 A JP2010198410 A JP 2010198410A JP 2009043520 A JP2009043520 A JP 2009043520A JP 2009043520 A JP2009043520 A JP 2009043520A JP 2010198410 A JP2010198410 A JP 2010198410A
Authority
JP
Japan
Prior art keywords
server
time
log
maintenance
possibility
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009043520A
Other languages
Japanese (ja)
Inventor
Nobukazu Shinomiya
伸和 篠宮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Computertechno Ltd
Original Assignee
NEC Computertechno Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Computertechno Ltd filed Critical NEC Computertechno Ltd
Priority to JP2009043520A priority Critical patent/JP2010198410A/en
Publication of JP2010198410A publication Critical patent/JP2010198410A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To prevent a failure of a server in advance by preliminarily predicting the possibility of abnormal conditions in the server. <P>SOLUTION: The server records a log, including a time when an event occurs and the contents of the event, into a log area in time series. A maintenance server monitors a log area and collects a first log, including a time when the power supply of the server is turned on, and a second log, including a time when the server becomes usable. The maintenance server calculates a time being a difference between the first log and the second log, as a time after the power supply of the server is turned on before the server becomes usable. The maintenance server notifies, when the time is equal to or more than a setting time, a maintenance person of the possibility of the abnormal conditions in the server. In a server failure prediction system, in consideration of a state of deterioration due to the fact that the server is used for a long time, and the possibility of the abnormal conditions in the server is predicted in advance. Accordingly, the failure of the server can be prevented in advance by notifying the maintenance person of the possibility of the abnormal conditions in the server. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明は、サーバを監視して故障を予測するサーバ故障予測システムに関する。   The present invention relates to a server failure prediction system that monitors a server and predicts a failure.

図1は、一般的なシステムの構成を示している。そのサーバ故障予測システムは、サーバ110と保守サーバ120とを具備している。保守サーバ120は、サーバ110に接続されている。サーバ110は、記憶装置112を備えている。記憶装置112には、ログエリア113が設けられている。   FIG. 1 shows a general system configuration. The server failure prediction system includes a server 110 and a maintenance server 120. The maintenance server 120 is connected to the server 110. The server 110 includes a storage device 112. The storage device 112 is provided with a log area 113.

サーバ110は、イベントが発生したときの時刻とそのイベントの内容とを含むログ113−1、113−2、…を時系列で記憶装置112のログエリア113に記録する。保守サーバ120は、ログエリア113を監視して、イベントの内容にエラーを表すログが存在するものとする。そのエラーとしては、デバイスの電圧異常や温度以上などが挙げられる。この場合、サーバ110の異常を保守員に通知する。   The server 110 records logs 113-1, 113-2,... Including the time when the event occurred and the contents of the event in the log area 113 of the storage device 112 in time series. The maintenance server 120 monitors the log area 113 and assumes that there is a log indicating an error in the event content. Examples of the error include device voltage abnormality and temperature. In this case, the maintenance staff is notified of the abnormality of the server 110.

従来では、単一のイベントに対してサーバ110が異常であるか否かを判断している。即ち、異常があるときだけ保守員に通知している。このため、エラーが起きたときに保守員が初めて保守作業を行う。保守作業では、デバイスの交換や修理を行う。サーバに異常がある可能性があることを事前に予測して、サーバの故障を予防することが望まれる。   Conventionally, it is determined whether or not the server 110 is abnormal for a single event. That is, the maintenance staff is notified only when there is an abnormality. For this reason, when an error occurs, maintenance personnel perform maintenance work for the first time. In maintenance work, devices are replaced or repaired. It is desirable to prevent a server failure by predicting in advance that there may be an abnormality in the server.

故障の予測や装置の監視に関する文献を紹介する。   Introduces literature on failure prediction and device monitoring.

特開2001−312375号公報には、外部記憶装置の故障予測システムが記載されている。外部記憶装置の故障予測システムは、外部記憶装置と、この外部記憶装置を使用する顧客用コンピュータと、この顧客用コンピュータに通信回線網を介して接続されたサービス提供者用コンピュータとを備えている。顧客用コンピュータは、外部記憶装置の使用状況に関する検査データを取得し、この検査データを通信回線網を介してサービス提供者用コンピュータへ送信する。サービス提供者用コンピュータは、検査データに基づき外部記憶装置の故障予測を行ない、その結果を通信回線網を介して顧客用コンピュータへ送信することを特徴としている。   Japanese Patent Application Laid-Open No. 2001-31375 describes a failure prediction system for an external storage device. A failure prediction system for an external storage device includes an external storage device, a customer computer using the external storage device, and a service provider computer connected to the customer computer via a communication network. . The customer computer acquires inspection data relating to the usage status of the external storage device, and transmits the inspection data to the service provider computer via the communication network. The service provider computer predicts a failure of the external storage device based on the inspection data, and transmits the result to the customer computer via the communication network.

特開2004−213621号公報には、リモート監視システムが記載されている。リモート監視システムは、被監視システムの正常/異常を含む事象情報を受信し、受信した事象情報を含む電子メールをネットワーク経路によって定期または不定期に通報する第1の手段と、第1の手段による電子メールを受信することで被監視システムとネットワーク経路の状態とを併せて監視する第2の手段と、を備えることを特徴としている。   Japanese Patent Laid-Open No. 2004-213621 describes a remote monitoring system. The remote monitoring system receives event information including normality / abnormality of the monitored system, and reports the e-mail including the received event information periodically or irregularly via a network path, and the first means And a second means for monitoring the monitored system and the state of the network path together by receiving an electronic mail.

特開2002−259130号公報には、情報処理システムが記載されている。情報処理システムは、オペレーティングシステムを起動する手段と、オペレーティングシステムの起動完了を検出する手段と、オペレーティングシステムを起動するための起動信号が発生されてからの経過時間を計時し、起動信号が発生されてから所定の経過時間内にオペレーティングシステムの起動完了が検出されたか否かに基づいて、オペレーティングシステムの起動対象となるブートデバイスの切り換えを制御する手段とを具備することを特徴としている。   Japanese Patent Laid-Open No. 2002-259130 describes an information processing system. The information processing system measures the elapsed time since the start of the operating system, the means for detecting the completion of the start of the operating system, and the start signal for starting the operating system, and the start signal is generated And a means for controlling switching of a boot device to be activated by the operating system based on whether or not the activation completion of the operating system is detected within a predetermined elapsed time.

特開2006−236524号公報には、画像処理装置が記載されている。画像処理装置は、画像処理装置のプログラムや画像データを記憶でき、内部に駆動機構を有する磁気記憶手段と、画像処理装置の制御を行う制御手段とを有している。制御手段は、磁気記憶手段の故障診断情報を取得するため磁気記憶手段へコマンドを送信し、取得した故障診断情報をもとに磁気記憶手段の内部駆動機構の故障予測を行うことを特徴としている。   Japanese Patent Application Laid-Open No. 2006-236524 describes an image processing apparatus. The image processing apparatus includes a magnetic storage unit that can store a program and image data of the image processing apparatus and has a drive mechanism therein, and a control unit that controls the image processing apparatus. The control means is characterized by transmitting a command to the magnetic storage means in order to acquire failure diagnosis information of the magnetic storage means, and performing failure prediction of the internal drive mechanism of the magnetic storage means based on the acquired failure diagnosis information. .

特開2001−312375号公報JP 2001-31375 A 特開2004−213621号公報JP 2004-213621 A 特開2002−259130号公報JP 2002-259130 A 特開2006−236524号公報JP 2006-236524 A

本発明の目的は、サーバに異常がある可能性があることを事前に予測して、サーバの故障を予防することができるサーバ故障予測システムを提供することにある。   An object of the present invention is to provide a server failure prediction system capable of preventing a server failure by predicting in advance that there may be an abnormality in the server.

本発明のサーバ故障予測システムは、サーバと、サーバに接続された保守サーバとを具備している。サーバは、記憶装置を備え、イベントが発生したときの時刻とそのイベントの内容とを含むログを時系列で記憶装置のログエリアに記録する。保守サーバは、監視部と、算出部と、通知部とを備えている。監視部は、ログエリアを監視して、サーバの電源がオンしたときの時刻を含む第1ログと、サーバが利用可能になったときの時刻を含む第2ログとを収集する。算出部は、サーバの電源がオンしてからサーバが利用可能になるまでの時間として、第1ログの時刻と第2ログとの差分である第1時間を算出する。通知部は、第1時間が第1設定時間以上である場合、サーバに異常がある可能性があることを保守員に通知する。   The server failure prediction system of the present invention includes a server and a maintenance server connected to the server. The server includes a storage device, and records a log including the time when the event occurs and the contents of the event in a time series in the log area of the storage device. The maintenance server includes a monitoring unit, a calculation unit, and a notification unit. The monitoring unit monitors the log area and collects a first log including a time when the server is turned on and a second log including a time when the server becomes available. The calculation unit calculates a first time, which is a difference between the time of the first log and the second log, as the time from when the server is turned on until the server becomes available. When the first time is equal to or longer than the first set time, the notification unit notifies the maintenance staff that there is a possibility that the server has an abnormality.

本発明のサーバ故障予測システムでは、保守サーバは、サーバの電源がオンしてからサーバが利用可能になるまでの時間が設定時間以上であるか否かを判断することにより、サーバに異常がある可能性があるか否かを事前に予測している。即ち、サーバが長く使われることによる劣化具合(ハードディスクのシーク時間の劣化や、熱によるデバイスの応答時間の劣化などに起因する、サーバのトータル起動時間の劣化)を考慮して、サーバに異常がある可能性があることを事前に予測している。従って、サーバに異常がある可能性があることを保守員に通知することにより、サーバの故障を予防することができる。   In the server failure prediction system of the present invention, the maintenance server has an abnormality in the server by determining whether the time from when the server is turned on until the server becomes available is longer than a set time. Predict whether or not there is a possibility. In other words, taking into account the deterioration caused by the server being used for a long time (degradation of the total startup time of the server due to deterioration of the seek time of the hard disk or deterioration of the response time of the device due to heat, etc.) Predicting that there is a possibility. Therefore, it is possible to prevent a server failure by notifying maintenance personnel that there is a possibility that the server has an abnormality.

図1は、一般的なシステムの構成を示している。FIG. 1 shows a general system configuration. 図2は、本発明の実施形態によるサーバ故障予測システムの構成を示している。FIG. 2 shows the configuration of the server failure prediction system according to the embodiment of the present invention. 図3は、本発明の実施形態によるサーバ故障予測システムの動作を示すフローチャートである。FIG. 3 is a flowchart showing the operation of the server failure prediction system according to the embodiment of the present invention. 図4は、本発明の実施形態によるサーバ故障予測システムの動作を説明するための図である。FIG. 4 is a diagram for explaining the operation of the server failure prediction system according to the embodiment of the present invention.

以下に添付図面を参照して、本発明の実施形態によるサーバ故障予測システムについて詳細に説明する。   Hereinafter, a server failure prediction system according to an embodiment of the present invention will be described in detail with reference to the accompanying drawings.

図2は、本発明の実施形態によるサーバ故障予測システムの構成を示している。本発明の実施形態によるサーバ故障予測システムは、サーバ10と保守サーバ20とを具備している。保守サーバ20は、サーバ10に接続されている。   FIG. 2 shows the configuration of the server failure prediction system according to the embodiment of the present invention. The server failure prediction system according to the embodiment of the present invention includes a server 10 and a maintenance server 20. The maintenance server 20 is connected to the server 10.

サーバ10は、コンピュータであり、CPU(Central Processing Unit)11と記憶装置12と複数のデバイスとを備えている。複数のデバイスとしては、ハードディスクなどのメモリや、チップセットなどが挙げられる。   The server 10 is a computer, and includes a CPU (Central Processing Unit) 11, a storage device 12, and a plurality of devices. Examples of the plurality of devices include a memory such as a hard disk and a chip set.

記憶装置12には、サーバ10に実行させるためのコンピュータプログラムが記憶されたエリアと、ログエリア13とが設けられている。CPU11は、起動時などに記憶装置12からコンピュータプログラムを読み取って実行する。   The storage device 12 is provided with an area for storing a computer program to be executed by the server 10 and a log area 13. The CPU 11 reads and executes a computer program from the storage device 12 at the time of startup or the like.

保守サーバ20は、コンピュータであり、CPU21と記憶装置22と表示装置27とスピーカ28とを備えている。   The maintenance server 20 is a computer, and includes a CPU 21, a storage device 22, a display device 27, and a speaker 28.

記憶装置22には、CPU21が実行するためのコンピュータプログラム23が記憶されたエリアが設けられている。CPU21は、起動時などに記憶装置22からコンピュータプログラム23を読み取って実行する。   The storage device 22 is provided with an area in which a computer program 23 to be executed by the CPU 21 is stored. The CPU 21 reads and executes the computer program 23 from the storage device 22 at the time of startup or the like.

そのコンピュータプログラム23は、監視部24、算出部25、通知部26を含んでいる。   The computer program 23 includes a monitoring unit 24, a calculation unit 25, and a notification unit 26.

図3は、本発明の実施形態によるサーバ故障予測システムの動作を示すフローチャートである。   FIG. 3 is a flowchart showing the operation of the server failure prediction system according to the embodiment of the present invention.

まず、サーバ10の動作について説明する。   First, the operation of the server 10 will be described.

CPU11は、利用者がサーバ10の電源をオンしたときに、サーバ10を起動する(ステップS1)。   The CPU 11 starts up the server 10 when the user turns on the power of the server 10 (step S1).

CPU11は、イベントが発生したときの時刻とそのイベントの内容とを含むログ13−1、13−2、…を時系列で記憶装置12のログエリア13に記録する(ステップS2)。   The CPU 11 records the logs 13-1, 13-2,... Including the time when the event occurs and the contents of the event in the log area 13 of the storage device 12 in time series (step S2).

CPU11は、利用者がサーバ10の起動を終了する指示が行われない場合(ステップS3−NO)、ステップS2を実行し、利用者がサーバ10の起動を終了する指示を行った場合、サーバ10の起動を終了する(ステップS3−YES)。   When the user does not give an instruction to end the startup of the server 10 (step S3-NO), the CPU 11 executes step S2, and when the user gives an instruction to end the startup of the server 10, the server 10 Is finished (step S3-YES).

次に、保守サーバ20の動作について説明する。   Next, the operation of the maintenance server 20 will be described.

ここで、保守サーバ20は、前述の保守サーバ120の動作(以下、エラー処理と称する)に加えて、次の動作(以下、予測処理と称する)を実行する。   Here, in addition to the operation of the maintenance server 120 described above (hereinafter referred to as error processing), the maintenance server 20 executes the following operation (hereinafter referred to as prediction processing).

エラー処理において、監視部24は、ログエリア13を監視して、イベントの内容にエラーを表すログが存在するものとする。そのエラーとしては、デバイスの電圧異常や温度以上などが挙げられる。この場合、通知部26は、サーバ10の異常を保守員に通知する。   In the error processing, the monitoring unit 24 monitors the log area 13 and it is assumed that there is a log indicating an error in the event content. Examples of the error include device voltage abnormality and temperature. In this case, the notification unit 26 notifies the maintenance staff of the abnormality of the server 10.

予測処理について説明する。   The prediction process will be described.

監視部24は、ログエリア13を監視して、図2に示されるように、利用者によりサーバ10の電源がオンしたときの時刻を含む第1ログ(以下、電源オンログ13−1と称する)と、サーバ10が利用可能になったときの時刻を含む第2ログ(以下、起動完了ログ13−jと称する)とを収集する(ステップS11)。   The monitoring unit 24 monitors the log area 13 and, as shown in FIG. 2, the first log including the time when the power of the server 10 is turned on by the user (hereinafter referred to as the power-on log 13-1). And a second log including the time when the server 10 becomes available (hereinafter referred to as a start completion log 13-j) (step S11).

算出部25は、サーバ10の電源がオンしてからサーバ10が利用可能になるまでの時間(特定イベントが所要する時間)として、電源オンログ13−1の時刻と起動完了ログ13−jとの差分である第1時間Δt(以下、時間Δt1と称する)を算出する(ステップS12)。   The calculation unit 25 calculates the time between the power-on log 13-1 and the start completion log 13-j as the time from when the power of the server 10 is turned on until the server 10 becomes available (time required for the specific event). A first time Δt (hereinafter referred to as time Δt1), which is a difference, is calculated (step S12).

通知部26は、時間Δt1と予め定められた第1設定時間t(以下、設定時間t1と称する)とを比較する(ステップS13)。   The notification unit 26 compares the time Δt1 with a predetermined first set time t (hereinafter referred to as set time t1) (step S13).

そこで、時間Δt1が設定時間t1未満である場合(ステップS13−NO)、保守サーバ10はステップS11を実行する。   Therefore, when the time Δt1 is less than the set time t1 (step S13—NO), the maintenance server 10 executes step S11.

一方、時間Δt1が設定時間t1以上である場合(ステップS13−YES)、通知部26は、サーバ10に異常がある可能性があることを文字により表示装置27に表示し、それをスピーカ28から音により出力して、保守員に通知する(ステップS14)。   On the other hand, when the time Δt1 is equal to or longer than the set time t1 (step S13—YES), the notification unit 26 displays on the display device 27 by text that there is a possibility that the server 10 is abnormal, and this is displayed from the speaker 28. The sound is output and notified to maintenance personnel (step S14).

保守サーバ10は、保守員に1度通知したら予測処理を終了する仕様である場合、ステップS14を実行した後、予測処理を終了する。又は、保守サーバ10は、保守員に1度通知しても更にサーバ10の異常を検出する仕様である場合、ステップS11を実行する(図示しない)。   When the maintenance server 10 has a specification that ends the prediction process once notified to the maintenance staff, the maintenance server 10 ends the prediction process after executing step S14. Alternatively, the maintenance server 10 executes step S <b> 11 (not shown) when the specification is such that the abnormality of the server 10 is further detected even if the maintenance staff is notified once.

このように、本発明の実施形態によるサーバ故障予測システムでは、保守サーバ20は、サーバ10の電源がオンしてからサーバ10が利用可能になるまでの時間Δt1が設定時間t1以上であるか否かを判断することにより、サーバ10に異常がある可能性があるか否かを事前に予測している。即ち、サーバ10が長く使われることによる劣化具合(ハードディスクのシーク時間の劣化や、熱によるデバイスの応答時間の劣化などに起因する、サーバ10のトータル起動時間の劣化)を考慮して、サーバ10に異常がある可能性があることを事前に予測している。従って、サーバ10に異常がある可能性があることを保守員に通知することにより、サーバ10の故障を予防することができる。   Thus, in the server failure prediction system according to the embodiment of the present invention, the maintenance server 20 determines whether or not the time Δt1 from when the server 10 is powered on until the server 10 becomes available is equal to or longer than the set time t1. It is predicted in advance whether or not there is a possibility that the server 10 has an abnormality. That is, the server 10 is considered in consideration of the deterioration due to the server 10 being used for a long time (deterioration of the total startup time of the server 10 due to deterioration of the seek time of the hard disk or the response time of the device due to heat). It is predicted in advance that there may be an abnormality. Therefore, it is possible to prevent a failure of the server 10 by notifying maintenance personnel that there is a possibility that the server 10 has an abnormality.

ここで、保守サーバ20は、複数のデバイスのうちの特定デバイスについて、以下の動作を実行する。   Here, the maintenance server 20 performs the following operation on a specific device among the plurality of devices.

監視部24は、ログエリア13を監視して、図4に示されるように、特定デバイスが起動したときの時刻を含む第3ログ(以下、起動開始ログ13−xと称する)と、特定デバイスが利用可能になったときの時刻を含む第4ログ(以下、起動完了ログ13−yと称する)とを収集する(ステップS11)。   The monitoring unit 24 monitors the log area 13 and, as shown in FIG. 4, a third log including the time when the specific device is activated (hereinafter referred to as activation start log 13-x), the specific device A fourth log (hereinafter referred to as a start completion log 13-y) including the time when becomes available is collected (step S11).

算出部25は、特定デバイスが起動してから利用可能になるまでの時間(特定イベントが所要する時間)として、起動開始ログ13−xの時刻と起動完了ログ13−yとの差分である第2時間Δt(以下、時間Δt2と称する)を算出する(ステップS12)。   The calculation unit 25 is the difference between the time of the start start log 13-x and the start completion log 13-y as the time from when the specific device starts up until it becomes usable (the time required for the specific event). 2 hours Δt (hereinafter referred to as time Δt2) is calculated (step S12).

保守サーバ20の通知部26は、時間Δt2と予め定められた第2設定時間t(以下、設定時間t2と称する)とを比較する(ステップS13)。   The notification unit 26 of the maintenance server 20 compares the time Δt2 with a predetermined second set time t (hereinafter referred to as set time t2) (step S13).

そこで、時間Δt2が設定時間t2未満である場合(ステップS13−NO)、保守サーバ10はステップS11を実行する。   Therefore, when the time Δt2 is less than the set time t2 (step S13—NO), the maintenance server 10 executes step S11.

一方、時間Δt2が設定時間t2以上である場合(ステップS13−YES)、通知部26は、サーバ10に異常がある可能性として、特定デバイスに異常がある可能性があることを文字により表示装置27に表示し、それをスピーカ28から音により出力して、保守員に通知する(ステップS14)。   On the other hand, when the time Δt2 is equal to or longer than the set time t2 (step S13—YES), the notification unit 26 uses a character display to indicate that there is a possibility that the specific device has an abnormality as a possibility that the server 10 has an abnormality. 27, which is output by sound from the speaker 28 and notified to maintenance personnel (step S14).

保守サーバ10は、保守員に1度通知したら予測処理を終了する仕様である場合、ステップS14を実行した後、予測処理を終了する。又は、保守サーバ10は、保守員に1度通知しても更にサーバ10の異常を検出する仕様である場合、ステップS11を実行する(図示しない)。   When the maintenance server 10 has a specification that ends the prediction process once notified to the maintenance staff, the maintenance server 10 ends the prediction process after executing step S14. Alternatively, the maintenance server 10 executes step S <b> 11 (not shown) when the specification is such that the abnormality of the server 10 is further detected even if the maintenance staff is notified once.

このように、本発明の実施形態によるサーバ故障予測システムでは、特定デバイスが起動してから利用可能になるまでの時間Δt2が設定時間t2以上であるか否かを判断することにより、特定デバイスに異常がある可能性があるか否かを事前に予測している。従って、特定デバイスに異常がある可能性があることを保守員に通知することにより、サーバ10の故障を予防することができる。   As described above, in the server failure prediction system according to the embodiment of the present invention, it is determined whether or not the time Δt2 from when the specific device is activated until it becomes available is greater than or equal to the set time t2. Predict whether there is a possibility of abnormality. Therefore, it is possible to prevent a failure of the server 10 by notifying maintenance personnel that there is a possibility that the specific device has an abnormality.

10 サーバ、
11 CPU、
12 記憶装置、
13 ログエリア、
13−1、13−2、13−j、13−x、13−y ログ、
20 保守サーバ、
21 CPU、
22 記憶装置、
23 コンピュータプログラム、
24 監視部、
25 算出部、
26 通知部、
27 表示装置、
28 スピーカ、
110 サーバ、
112 記憶装置、
113 ログエリア、
113−1、113−2 ログ、
120 保守サーバ、
10 servers,
11 CPU,
12 storage devices,
13 Log area,
13-1, 13-2, 13-j, 13-x, 13-y log,
20 maintenance server,
21 CPU,
22 storage devices,
23 computer program,
24 monitoring unit,
25 calculation unit,
26 Notification section,
27 display device,
28 speakers,
110 servers,
112 storage device,
113 log area,
113-1, 113-2 logs,
120 maintenance server,

Claims (13)

記憶装置を備え、イベントが発生したときの時刻とそのイベントの内容とを含むログを時系列で前記記憶装置のログエリアに記録するサーバと、
前記サーバに接続された保守サーバと
を具備し、
前記保守サーバは、
前記ログエリアを監視して、前記サーバの電源がオンしたときの時刻を含む第1ログと、前記サーバが利用可能になったときの時刻を含む第2ログとを収集する監視部と、
前記サーバの電源がオンしてから前記サーバが利用可能になるまでの時間として、前記第1ログの時刻と前記第2ログとの差分である第1時間を算出する算出部と、
前記第1時間が第1設定時間以上である場合、前記サーバに異常がある可能性があることを保守員に通知する通知部と
を備えるサーバ故障予測システム。
A server comprising a storage device, and recording a log including the time when the event occurred and the contents of the event in a time series in the log area of the storage device;
A maintenance server connected to the server,
The maintenance server
A monitoring unit that monitors the log area and collects a first log including a time when the server is powered on and a second log including a time when the server is available;
A calculation unit that calculates a first time that is a difference between the time of the first log and the second log as a time from when the server is turned on until the server becomes available;
A server failure prediction system comprising: a notification unit that notifies a maintenance person that there is a possibility of an abnormality in the server when the first time is equal to or longer than a first set time.
前記サーバは、複数のデバイスを更に備え、
前記監視部は、前記ログエリアを監視して、前記複数のデバイスのうちの特定デバイスが起動したときの時刻を含む第3ログと、前記特定デバイスが利用可能になったときの時刻を含む第4ログとを収集し、
前記算出部は、前記特定デバイスが起動してから利用可能になるまでの時間として、前記第3ログの時刻と前記第4ログとの差分である第2時間を算出し、
前記通知部は、前記第2時間が第2設定時間以上である場合、前記サーバに異常がある可能性として、前記特定デバイスに異常がある可能性があることを保守員に通知する
請求項1に記載のサーバ故障予測システム。
The server further comprises a plurality of devices,
The monitoring unit monitors the log area, and includes a third log including a time when a specific device of the plurality of devices is activated, and a time including a time when the specific device is available. 4 logs and collect
The calculation unit calculates a second time, which is a difference between the time of the third log and the fourth log, as the time from when the specific device is activated until it becomes usable,
The notifying unit notifies a maintenance person that there is a possibility that the specific device may be abnormal as a possibility that the server has an abnormality when the second time is equal to or longer than a second set time. Server failure prediction system described in 1.
前記保守サーバは、
表示装置
を更に備え、
前記通知部は、前記サーバに異常がある可能性があることを文字により前記表示装置に表示して、保守員に通知する
請求項1又は2に記載のサーバ故障予測システム。
The maintenance server
A display device;
3. The server failure prediction system according to claim 1, wherein the notification unit displays on the display device by characters that there is a possibility of abnormality in the server, and notifies a maintenance staff.
前記保守サーバは、
スピーカ
を更に備え、
前記通知部は、前記サーバに異常がある可能性があることを前記スピーカから音により出力して、保守員に通知する
請求項1〜3のいずれかに記載のサーバ故障予測システム。
The maintenance server
A speaker,
The server failure prediction system according to any one of claims 1 to 3, wherein the notification unit outputs a sound from the speaker that there is a possibility that the server is abnormal, and notifies a maintenance staff.
イベントが発生したときの時刻とそのイベントの内容とを含むログを時系列で自己のログエリアに記録するサーバに接続された保守サーバであって、
前記ログエリアを監視して、前記サーバの電源がオンしたときの時刻を含む第1ログと、前記サーバが利用可能になったときの時刻を含む第2ログとを収集する監視部と、
前記サーバの電源がオンしてから前記サーバが利用可能になるまでの時間として、前記第1ログの時刻と前記第2ログとの差分である第1時間を算出する算出部と、
前記第1時間が第1設定時間以上である場合、前記サーバに異常がある可能性があることを保守員に通知する通知部と
を具備する保守サーバ。
A maintenance server connected to a server that records a time series of logs including the time when an event occurs and the contents of the event in its own log area,
A monitoring unit that monitors the log area and collects a first log including a time when the server is powered on and a second log including a time when the server is available;
A calculation unit that calculates a first time that is a difference between the time of the first log and the second log as a time from when the server is turned on until the server becomes available;
A maintenance server comprising: a notification unit for notifying maintenance personnel that there is a possibility of an abnormality in the server when the first time is equal to or longer than a first set time.
前記監視部は、前記ログエリアを監視して、前記サーバの複数のデバイスのうちの特定デバイスが起動したときの時刻を含む第3ログと、前記特定デバイスが利用可能になったときの時刻を含む第4ログとを収集し、
前記算出部は、前記特定デバイスが起動してから利用可能になるまでの時間として、前記第3ログの時刻と前記第4ログとの差分である第2時間を算出し、
前記通知部は、前記第2時間が第2設定時間以上である場合、前記サーバに異常がある可能性として、前記特定デバイスに異常がある可能性があることを保守員に通知する
請求項5に記載の保守サーバ。
The monitoring unit monitors the log area, and includes a third log including a time when a specific device of a plurality of devices of the server is activated, and a time when the specific device becomes available. 4th log including
The calculation unit calculates a second time, which is a difference between the time of the third log and the fourth log, as the time from when the specific device is activated until it becomes usable,
The notifying unit notifies maintenance personnel that there is a possibility that the specific device is abnormal as a possibility that the server has an abnormality when the second time is equal to or longer than a second set time. The maintenance server described in.
表示装置
を更に具備し、
前記通知部は、前記サーバに異常がある可能性があることを文字により前記表示装置に表示して、保守員に通知する
請求項5又は6に記載の保守サーバ。
A display device;
The maintenance server according to claim 5 or 6, wherein the notification unit displays on the display device by text that there is a possibility that the server has an abnormality, and notifies a maintenance staff.
スピーカ
を更に具備し、
前記通知部は、前記サーバに異常がある可能性があることを前記スピーカから音により出力して、保守員に通知する
請求項5〜7のいずれかに記載の保守サーバ。
A speaker,
The maintenance server according to any one of claims 5 to 7, wherein the notification unit outputs a sound from the speaker that there is a possibility of an abnormality in the server, and notifies a maintenance staff.
イベントが発生したときの時刻とそのイベントの内容とを含むログを時系列で自己のログエリアに記録するサーバに接続されたコンピュータを用いる方法であって、
前記ログエリアを監視して、前記サーバの電源がオンしたときの時刻を含む第1ログと、前記サーバが利用可能になったときの時刻を含む第2ログとを収集するステップと、
前記サーバの電源がオンしてから前記サーバが利用可能になるまでの時間として、前記第1ログの時刻と前記第2ログとの差分である第1時間を算出するステップと、
前記第1時間が第1設定時間以上である場合、前記サーバに異常がある可能性があることを保守員に通知するステップと
を具備するサーバ故障予測方法。
A method of using a computer connected to a server that records a log including a time when an event occurs and contents of the event in a time series in its own log area,
Monitoring the log area and collecting a first log including a time when the server is powered on and a second log including a time when the server is available;
Calculating a first time, which is a difference between the time of the first log and the second log, as a time from when the server is turned on until the server becomes available;
A server failure prediction method comprising: notifying maintenance personnel that the server may be abnormal when the first time is equal to or longer than a first set time.
前記ログエリアを監視して、前記サーバの複数のデバイスのうちの特定デバイスが起動したときの時刻を含む第3ログと、前記特定デバイスが利用可能になったときの時刻を含む第4ログとを収集するステップと、
前記特定デバイスが起動してから利用可能になるまでの時間として、前記第3ログの時刻と前記第4ログとの差分である第2時間を算出するステップと、
前記第2時間が第2設定時間以上である場合、前記サーバに異常がある可能性として、前記特定デバイスに異常がある可能性があることを保守員に通知するステップと
を更に具備する請求項9に記載のサーバ故障予測方法。
A third log including a time when a specific device of a plurality of devices of the server is activated by monitoring the log area; and a fourth log including a time when the specific device becomes available; Collecting steps,
Calculating a second time, which is a difference between the time of the third log and the fourth log, as the time from when the specific device is activated until it becomes available;
And a step of notifying a maintenance staff that there is a possibility that the specific device has an abnormality as a possibility that the server has an abnormality when the second time is equal to or longer than a second set time. 9. The server failure prediction method according to 9.
前記保守員に通知するステップは、
前記サーバに異常がある可能性があることを文字により前記表示装置に表示して、保守員に通知する
請求項9又は10に記載のサーバ故障予測方法。
The step of notifying the maintenance staff includes:
The server failure prediction method according to claim 9 or 10, wherein a message indicating that there is a possibility of an abnormality in the server is displayed on the display device and notified to maintenance personnel.
前記保守員に通知するステップは、
前記サーバに異常がある可能性があることを前記スピーカから音により出力して、保守員に通知する
請求項9〜11のいずれかに記載のサーバ故障予測方法。
The step of notifying the maintenance staff includes:
The server failure prediction method according to any one of claims 9 to 11, wherein the server is output by sound from the speaker that there is a possibility of abnormality in the server, and is notified to maintenance personnel.
請求項9〜12のいずれかに記載のサーバ故障予測方法を前記コンピュータに実行させるコンピュータプログラム。   The computer program which makes the said computer perform the server failure prediction method in any one of Claims 9-12.
JP2009043520A 2009-02-26 2009-02-26 Server failure prediction system Pending JP2010198410A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009043520A JP2010198410A (en) 2009-02-26 2009-02-26 Server failure prediction system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009043520A JP2010198410A (en) 2009-02-26 2009-02-26 Server failure prediction system

Publications (1)

Publication Number Publication Date
JP2010198410A true JP2010198410A (en) 2010-09-09

Family

ID=42823056

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009043520A Pending JP2010198410A (en) 2009-02-26 2009-02-26 Server failure prediction system

Country Status (1)

Country Link
JP (1) JP2010198410A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013073326A (en) * 2011-09-27 2013-04-22 Nec Corp Management server, abnormality prediction system, abnormality prediction method, and abnormality prediction program
CN106294076A (en) * 2016-08-24 2017-01-04 浪潮(北京)电子信息产业有限公司 A kind of server relevant fault Forecasting Methodology and system thereof
CN115296986A (en) * 2022-06-27 2022-11-04 青岛海尔科技有限公司 Event recording method and device, storage medium and electronic device

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02249041A (en) * 1989-03-22 1990-10-04 Fujitsu Ltd Log data identification system
JPH10171546A (en) * 1996-12-12 1998-06-26 Omron Corp Activation monitoring device

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02249041A (en) * 1989-03-22 1990-10-04 Fujitsu Ltd Log data identification system
JPH10171546A (en) * 1996-12-12 1998-06-26 Omron Corp Activation monitoring device

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013073326A (en) * 2011-09-27 2013-04-22 Nec Corp Management server, abnormality prediction system, abnormality prediction method, and abnormality prediction program
CN106294076A (en) * 2016-08-24 2017-01-04 浪潮(北京)电子信息产业有限公司 A kind of server relevant fault Forecasting Methodology and system thereof
CN106294076B (en) * 2016-08-24 2019-03-15 浪潮(北京)电子信息产业有限公司 A kind of server relevant fault prediction technique and its system
CN115296986A (en) * 2022-06-27 2022-11-04 青岛海尔科技有限公司 Event recording method and device, storage medium and electronic device
CN115296986B (en) * 2022-06-27 2024-03-22 青岛海尔科技有限公司 Event recording method and device, storage medium and electronic device

Similar Documents

Publication Publication Date Title
AU2012221821B2 (en) Network event management
JP4667962B2 (en) Fault monitoring apparatus and method
WO2012046293A1 (en) Fault monitoring device, fault monitoring method and program
JP2012069032A (en) Information processor
US20200033928A1 (en) Method of periodically recording for events
JP2017091077A (en) Pseudo-fault generation program, generation method, and generator
JP6205945B2 (en) Transmission apparatus, transmission apparatus control method, and transmission apparatus control program
JP4648961B2 (en) Apparatus maintenance system, method, and information processing apparatus
JP2010198410A (en) Server failure prediction system
JP4842738B2 (en) Fault management support system and information management method thereof
TW201516672A (en) System and method of monitoring a server
JP2006268208A (en) Failure diagnosing circuit, information processor equipped with the same, failure diagnosing system, and failure diagnosing program
JP2016095610A (en) Failure warning system and failure warning method
JP5322581B2 (en) Station service system
JP2012128573A (en) Duplex system and building management system using the same
JP2010147804A (en) Transmitting apparatus, and unit mounted on the same
JP2014002660A (en) Maintenance component production management device and maintenance component production management method
US20190164576A1 (en) Maintenance methods of digital signage and troubleshooting and warning methods, digital signage playing systems and players thereof
JP2010134525A (en) Failure monitor, failure-monitoring method and failure monitoring program for electronic device
JP2010066801A (en) Log recording system, module monitoring means, trace log managing means, recording method, program, and storage medium
JP2010003132A (en) Information processor, and fault detection method of input/output device thereof, and program thereof
JP2004272325A (en) Method and system for predicting fault of external storage device
KR20090052418A (en) Apparatus having function for managing restart information
JP2006268281A (en) Abnormality detection system in disconnecting power source input
JP5504950B2 (en) Server system fault monitoring apparatus, server system, and server system fault monitoring method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130722

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130724

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20131113