JP6095557B2 - 機器状態判定装置及びプログラム - Google Patents

機器状態判定装置及びプログラム Download PDF

Info

Publication number
JP6095557B2
JP6095557B2 JP2013255237A JP2013255237A JP6095557B2 JP 6095557 B2 JP6095557 B2 JP 6095557B2 JP 2013255237 A JP2013255237 A JP 2013255237A JP 2013255237 A JP2013255237 A JP 2013255237A JP 6095557 B2 JP6095557 B2 JP 6095557B2
Authority
JP
Japan
Prior art keywords
load
information
state
determination
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013255237A
Other languages
English (en)
Other versions
JP2015114770A (ja
Inventor
康次 長谷川
康次 長谷川
上野 一巳
一巳 上野
敢 江間
敢 江間
英一 為岡
英一 為岡
仁 川▲崎▼
仁 川▲崎▼
朋興 浮穴
朋興 浮穴
大樹 増田
大樹 増田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Mitsubishi Electric Building Techno Service Co Ltd
Original Assignee
Mitsubishi Electric Corp
Mitsubishi Electric Building Techno Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp, Mitsubishi Electric Building Techno Service Co Ltd filed Critical Mitsubishi Electric Corp
Priority to JP2013255237A priority Critical patent/JP6095557B2/ja
Publication of JP2015114770A publication Critical patent/JP2015114770A/ja
Application granted granted Critical
Publication of JP6095557B2 publication Critical patent/JP6095557B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Description

本発明は、機器状態判定装置及びプログラムに関する。
機器の保守サービスにおいて、機器やシステムの異常を検出するために、機器の負荷情報(例えば、CPU使用率、メモリ使用量、I/Oアクセス数など)を監視し、過去のデータと現在のデータとの比較結果に基づき異常かどうかを判断することが行われている。従来では、過去の負荷データと現在の負荷データとの比較結果に負荷変動の周期性を判断材料に加えて機器の異常の判断を行う技術が提案されている(例えば、特許文献1)。
ところで、近年では、INTEL SPEEDSTEP(登録商標)やAMD POWERNOW!(登録商標)などのようにCPU周波数を動的に変化させる機能を有するCPUが提供されている。これらのCPUは、温度が上昇した際にはCPUの周波数を低下させて、マザーボード上の部品への負荷を抑えるように作用する。
特許第4892367号明細書 特許第4819014号明細書 特許第211658号明細書 特開2011−34319号公報
従来では、前述したCPUなどのようにハードウェアが持つ機能が作用したことによって負荷変動が生じた場合、すなわち周期性のない要因によって負荷変動が生じた場合でも異常と判定してしまうおそれがあった。
本発明は、機器の状態が異常と判定された場合に、その異常という判定結果の妥当性を当該機器のハードウェアの状態を示す情報を参照して検証することで誤判定の軽減を図ることを目的とする。
本発明に係る機器状態判定装置は、監視対象の機器にかかる負荷の状態を示す負荷状態情報を生成する生成手段と、前記生成手段により生成された負荷状態情報に基づき前記機器の状態を判定する判定手段と、前記判定手段により前記機器の状態が異常と判定された場合、前記機器のハードウェアの状態を示すハードウェア情報に基づき前記生成手段により生成された負荷状態情報を補正する補正手段と、前記補正手段により補正された負荷状態情報に基づき前記機器の状態の再判定を行い、その再判定により前記機器の状態は正常と判断した場合、前記判定手段による異常判定を破棄する再判定手段と、を有するものである。
また、前記補正手段は、前記機器が取りうる状態と当該状態であるときに前記機器が発揮しうる処理性能を示す処理性能データとの対応関係を示すハードウェア仕様情報を参照することで、前記ハードウェア情報が示す前記機器の状態に対応する処理性能データを取得し、その取得した処理性能データで負荷状態情報を補正するものである。
また、前記機器の環境に関する情報を前記ハードウェア情報に変換する変換手段を有し、前記補正手段は、前記変換手段により変換されたハードウェア情報に基づき前記生成手段により生成された負荷状態情報を補正するものである。
また、前記機器の設置場所と、当該設置場所が前記機器に与える負荷を示す負荷指標データと、が対応付けされた設置場所情報を取得する設置場所情報取得手段を有し、前記再判定手段は、前記補正手段により補正された負荷状態情報と閾値との比較結果に応じて前記機器の状態を再判定する場合、前記設置場所情報を参照することにより前記機器の設置場所に応じて前記閾値を設定するものである。
また、前記機器に対して発生しうるイベントと、当該イベントが前記機器に与える負荷を示す負荷指標データと、が対応付けされたイベント負荷情報を取得するイベント負荷情報取得手段と、前記機器に対して発生するイベントを検知する検知手段と、を有し、前記補正手段は、前記検知手段により検知されたイベントに対応した負荷指標データに基づき前記生成手段により生成された負荷状態情報を補正するものである。
また、前記再判定手段により前記機器の状態が正常と判断された場合、前記判定手段により前記機器の状態が異常と判定された要因又は当該要因により前記機器の状態を異常としないための対処方法の少なくとも一方のメッセージを出力する出力手段を有するものである。
また、前記出力手段は、更に機器の設置場所に応じて設定されたメッセージを出力するものである。
また、前記生成手段により生成された負荷状態情報が、前記機器にかかる負荷を示す負荷データと前記機器にかかる負荷のモデルデータとの関係を示す情報である場合において、前記再判定手段により前記機器の状態が正常と判断された場合に前記負荷データを当該負荷データが得られたときの前記機器の動作モードに対する前記モデルデータとして生成するモデルデータ生成手段を有するものである。
本発明に係るプログラムは、コンピュータを、監視対象の機器にかかる負荷の状態を示す負荷状態情報を生成する生成手段、前記生成手段により生成された負荷状態情報に基づき前記機器の状態を判定する判定手段、前記判定手段により前記機器の状態が異常と判定された場合、前記機器のハードウェアの状態を示すハードウェア情報に基づき前記生成手段により生成された負荷状態情報を補正する補正手段、前記補正手段により補正された負荷状態情報に基づき前記機器の状態の再判定を行い、その再判定により前記機器の状態は正常と判断した場合、前記判定手段による異常判定を破棄する再判定手段、として機能させるためのものである。
本発明によれば、機器の状態が異常と判定された場合に、その異常という判定結果の妥当性を当該機器のハードウェアの状態を示す情報を参照に検証することで誤判定の軽減を図ることができる。
また、機器の環境に関する情報からでも、異常という判定結果の妥当性を検証することができる。
また、機器の設置場所を参照することにより、異常という判定結果の妥当性の検証をより厳しく行うことができる。
また、機器に対するイベントを参照することにより、異常という判定結果の妥当性をより正確に検証することができる。
また、機器の状態が異常という判定が誤判定であることが検証された場合、その誤判定された要因及び当該要因により機器の状態を異常としないための対処方法の少なくとも一方のメッセージを出力することができる。
また、設置場所によって要因の深刻度を判断し、その深刻度に応じた対処方法を提示することができる。
また、誤判定されたときの負荷データを誤判定されたときの機器の動作モードに対するモデルデータとして利用するようフィードバックすることで、誤判定を抑制することができる。
本発明に係る機器状態判定装置の実施の形態1を示したブロック構成図である。 実施の形態1における機器状態判定装置のハードウェア構成図である。 実施の形態1におけるハードウェア仕様情報記憶部に記憶されたハードウェア仕様情報のデータ構成例を示した図である。 実施の形態1におけるモデル情報記憶部に記憶されたモデル情報のデータ構成例を示した図である。 実施の形態1における機器状態判定処理を示すフローチャートである。 実施の形態1における負荷変動データ補正処理を示すフローチャートである。 実施の形態1における機器状態再判定処理を示すフローチャートである。 実施の形態1におけるハードウェア情報記憶部に蓄積されたハードウェア情報のデータ構成例を示した図である。 実施の形態1における負荷情報生成部により生成される負荷情報のデータ構成例を示した図である。 実施の形態1における照合部により生成される負荷変動情報のデータ構成例を示した図である。 実施の形態1におけるフィルタ部により補正された負荷変動情報のデータ構成例を示した図である。 実施の形態2における機器状態判定装置を示したブロック構成図である。 実施の形態2における変換テーブルのデータ構成例を示した図である。 実施の形態2における機器状態判定処理を示すフローチャートである。 実施の形態2における環境情報変換処理を示すフローチャートである。 実施の形態2における環境情報のデータ構成例を示した図である。 実施の形態2における変換部出力情報のデータ構成例を示した図である。 実施の形態3における機器状態判定装置を示したブロック構成図である。 実施の形態3における設置場所情報記憶部に記憶された設置場所情報のデータ構成例を示した図である。 実施の形態3における機器状態再判定処理を示すフローチャートである。 実施の形態4における機器状態判定装置を示したブロック構成図である。 実施の形態4におけるイベント負荷情報記憶部に記憶されたイベント負荷情報のデータ構成例を示した図である。 実施の形態4におけるモデル情報記憶部に記憶されたモデル情報のデータ構成例を示した図である。 実施の形態4における機器状態判定処理を示すフローチャートである。 実施の形態4における負荷変動データ補正処理を示すフローチャートである。 実施の形態4におけるイベント情報記憶部に蓄積されるイベント情報のデータ構成例を示した図である。 実施の形態4における照合部により生成される負荷変動情報のデータ構成例を示した図である。 実施の形態4におけるフィルタ部により補正された負荷変動情報のデータ構成例を示した図である。 実施の形態5における機器状態判定装置を示したブロック構成図である。 実施の形態5におけるメッセージ情報記憶部に記憶されたメッセージ情報のデータ構成例を示した図である。 実施の形態5におけるハードウェア仕様情報記憶部に記憶されたハードウェア仕様情報のデータ構成例を示した図である。 実施の形態5における変換テーブルのデータ構成例を示した図である。 実施の形態5における機器状態判定処理を示すフローチャートである。 実施の形態5における負荷変動データ補正処理を示すフローチャートである。 実施の形態5における照合部により生成される負荷変動情報のデータ構成例を示した図である。 実施の形態5における環境情報のデータ構成例を示した図である。 実施の形態5における変換部出力情報のデータ構成例を示した図である。 実施の形態5におけるフィルタ部により補正された負荷変動情報のデータ構成例を示した図である。 実施の形態6における機器状態判定装置を示したブロック構成図である。 実施の形態6におけるメッセージ情報記憶部に記憶されたメッセージ情報のデータ構成例を示した図である。 実施の形態7における機器状態判定装置を示したブロック構成図である。 実施の形態7における機器状態判定処理を示すフローチャートである。 実施の形態7においてモデル情報更新部により生成されたPOWERSAVEモードにおけるモデル情報のデータ構成例を示した図である。
以下、図面に基づいて、本発明の好適な実施の形態について説明する。
実施の形態1.
図1は、本発明に係る機器状態判定装置の実施の形態1を示したブロック構成図である。図1には、機器1、モデル情報記憶部2、ハードウェア(H/W)情報記憶部3及び機器状態判定装置10が示されている。機器1は、機器状態判定装置10により状態が監視される機器であり、本実施の形態では、監視対象の機器1として、ビルに設置されるCPU、HDD等が搭載されたパーソナルコンピュータ(以下、「PC」)を想定している。モデル情報記憶部2及びハードウェア情報記憶部3は、それぞれモデル情報及びハードウェア情報が記憶された記憶手段であり、HDDが搭載された記憶装置で実現される。
図2は、本実施の形態における機器状態判定装置10を形成するコンピュータのハードウェア構成図である。本実施の形態において機器状態判定装置10を形成するコンピュータは、従前から存在する汎用的なハードウェア構成で実現できる。すなわち、コンピュータは、図2に示したようにCPU21、ROM22、RAM23、ハードディスクドライブ(HDD)24を接続したHDDコントローラ25、入力手段として設けられたマウス26とキーボード27、及び表示装置として設けられたディスプレイ28をそれぞれ接続する入出力コントローラ29、通信手段として設けられたネットワークコントローラ30を内部バス31に接続して構成される。
図1に戻り、本実施の形態における機器状態判定装置10は、負荷情報生成部11、照合部12、フィルタ部13及び表示部14を有している。負荷情報生成部11は、機器1から負荷データを取得し、機器1にかかる負荷を示す負荷情報を生成する。照合部12は、生成手段として設けられ、監視対象の機器にかかる負荷の状態を示す負荷状態情報として負荷変動情報を生成する。より詳細には、負荷情報生成部11より生成された負荷情報をモデル情報と比較することで負荷モデルに対する機器1にかかる負荷の変動を示す負荷変動データを含む負荷変動情報を生成する。照合部12は、また判定手段として設けられ、生成した負荷状態情報に基づき機器1の状態(正常/異常)を判定する。
フィルタ部13は、本実施の形態において特徴的な構成要素であり、照合部12により機器1の状態が異常と判定された場合に、その判定結果の妥当性を、機器1のハードウェア情報や環境情報等負荷データとは異なる機器1のハードウェアの状態を示す情報を参照に検証する。フィルタ部13は、補正演算部131、ハードウェア(H/W)仕様情報記憶部132及び判断部133を有している。補正演算部131は、補正手段として設けられ、照合部12により機器1の状態が異常と判定された場合、ハードウェア情報記憶部3に蓄積されたハードウェア情報及びハードウェア仕様情報記憶部132に設定されたハードウェア仕様情報に基づき照合部12により生成された負荷変動情報を補正する。判断部133は、再判定手段として設けられ、補正演算部131により生成された補正後の負荷変動情報に基づき機器1の状態の正常/異常を再判定する。この再判定により機器1の状態は異常ではなく正常と判断した場合、照合部12による機器1の状態が異常という判定結果を破棄し、機器1の状態は正常と判定する。
図3は、本実施の形態におけるハードウェア仕様情報記憶部132に予め設定登録されたハードウェア仕様情報のデータ構成例を示した図である。ハードウェア仕様情報には、機器1が取りうる状態と当該状態であるときに機器1が発揮しうる処理性能を示す処理性能データとの対応関係を示すハードウェアの仕様に関する情報が設定される。本実施の形態では、機器1が取りうる状態としてCPUの温度が用いられ、各CPU温度(の範囲)のときのCPUの処理性能が対応付けして設定される。CPU処理性能は、CPUの通常動作時(CPUモードがSTANDARD)に対する処理性能の比率が設定される。例えば、50度未満の場合は通常動作時に比して1.2倍なので処理効率が良いことがわかる。本実施の形態では、更に各CPU温度に対応させて、CPUモード及びCPUクロック数が設定される。本実施の形態では、CPU温度をハードウェアの状態を示す情報として用いて説明するので、CPUに関する情報がハードウェア情報に設定されているが、HDD24等他のハードウェアの状態を示す情報をハードウェア情報として用いる場合は、その情報がハードウェア仕様情報記憶部132に設定登録される。なお、本実施の形態では、ハードウェア仕様情報記憶部132をフィルタ部13に設けたが、フィルタ部13の外、例えば機器状態判定装置10や機器状態判定装置10とは別個の記憶装置として設けてもよい。
表示部14は、機器状態判定装置10による機器1の状態の異常という判定結果を少なくともディスプレイ28に表示する。
機器状態判定装置10における負荷情報生成部11、照合部12、補正演算部131、判断部133及び表示部14は、機器状態判定装置10を形成するコンピュータと、コンピュータに搭載されたCPUで動作するプログラムとの協調動作により実現される。また、ハードウェア仕様情報記憶部132は、機器状態判定装置10に搭載されたHDD24にて実現される。あるいは、RAM23又は外部にある記憶手段をネットワーク経由で利用してもよい。
図4は、本実施の形態におけるモデル情報記憶部2に予め設定登録されているモデル情報のデータ構成例を示した図である。モデル情報は、過去の実績データ等を参照に生成され、機器1にかかる理想的な負荷の状況を表す負荷モデルとして設定される。モデル情報には、機器1が動作していた各日時に対応させて、データ種別と当該データ種別においてモデルとなる負荷モデルデータとが対応付けして設定される。図4には、CPU負荷率(CPU使用率、CPUload)が負荷を表すデータの種別として設定されている例が示されている。
本実施の形態において用いるその他の情報に関しては、生成されたり利用される段階で説明することにする。
また、本実施の形態では、図1に示したように、モデル情報記憶部2及びハードウェア情報記憶部3を機器状態判定装置10の外部装置として構成したが、少なくとも一方を機器状態判定装置10の内部に設けるように構成してもよい。機器状態判定装置10の内部に設ける場合、それはハードウェア仕様情報記憶部132と同様にHDD24、RAM23あるいは外部にある記憶手段をネットワーク経由で利用してもよい。
また、本実施の形態で用いるプログラムは、通信手段により提供することはもちろん、CD−ROMやDVD−ROM等のコンピュータ読み取り可能な記録媒体に格納して提供することも可能である。通信手段や記録媒体から提供されたプログラムはコンピュータにインストールされ、コンピュータのCPU21がプログラムを順次実行することで各種処理が実現される。
次に、本実施の形態における機器状態判定処理について図5乃至図7に示したフローチャートを用いて説明する。本実施の形態では、機器1において検出されたCPU温度をハードウェアの状態を示すハードウェア情報として用いる場合を例にして説明する。機器状態判定処理は、リアルタイム(1秒毎)に実行するようにしてもよいし、ハードウェア情報及び負荷データを記憶手段に記憶しておき、追って実行するようにしてもよい。
監視対象の機器1からは、少なくとも動作中には負荷を示す負荷データ及びハードウェア情報が定期的に出力されている。このうちハードウェア情報は、ハードウェア情報記憶部3に定周期的に蓄積される。本実施の形態では、CPUの負荷率及び温度を1秒毎に計測し記憶するようにしているので、ハードウェア情報は、1秒毎という定周期にてハードウェア情報記憶部3に蓄積される。なお、この定周期に合わせて負荷データのみならず、モデル情報も1秒単位にデータが設定されている。
図8は、本実施の形態におけるハードウェア情報記憶部3に蓄積されるハードウェア情報のデータ構成例を示す図である。ハードウェア情報は、ハードウェア情報が計測された日時に、計測されたハードウェア情報の種別及びその計測されたデータ値が対応付けて生成される。本実施の形態では、前述したようにCPU温度(CPUtemp)というデータ種別のハードウェアの状態を示すデータが計測される。なお、本実施の形態では、CPU温度をハードウェア情報として用いる場合を例にして説明するので、図8にはハードウェア情報としてCPU温度しか示していないが、湿度等他の種別のハードウェア情報も含めてもよい。
機器1の監視期間内に、負荷情報生成部11は、機器1の負荷を示す負荷データを1秒毎という定周期的にて取得する。そして、負荷情報生成部11は、取得した負荷データに基づき負荷情報を生成する(ステップ101)。負荷情報生成部11により生成される負荷情報のデータ構成例を図9に示す。負荷情報は、負荷データが取得された日時に、取得した負荷データの種別及びその負荷データを対応付けて生成される。本実施の形態における負荷情報生成部11は、負荷データとしてCPU負荷率(CPUload)を取得する。
続いて、照合部12は、データ種別であるCPU負荷率に対応するモデル情報をモデル情報記憶部2から取得し(ステップ102)、負荷情報生成部11により生成された負荷情報とモデル情報とから負荷変動情報を生成する(ステップ103)。本実施の形態では、負荷情報に含まれる負荷データからモデル情報の負荷モデルデータを除算することで負荷変動データを算出する。例えば、8時の負荷データは80%、対応する同じ8時の負荷モデルデータは50%なので、8時の負荷変動データは80÷50=1.6と算出される。このように算出することで得られた負荷変動データを含む負荷変動情報の例を図10に示す。図10には、日時に対応させて、データ種別と負荷変動データが対応付けされた負荷変動情報が示されている。
ところで、本実施の形態では、機器1の状態を判定するために閾値を用いる。本実施の形態では、1.0という値の閾値を用いることにする。ここで、閾値を超える負荷変動データが1つも算出されなかった場合、照合部12は、機器1の状態は異常ではないと判定し(ステップ104でN)、処理は終了する。なお、この場合、表示部14に正常(Regularity)という判定結果を表示させてもよい。一方、図10に例示したように、閾値を超える負荷変動データが少なくとも1つ算出されると、照合部12は、機器1の状態は異常(Anomaly)と判定する。異常と判定された場合(ステップ104でY)、フィルタ部13は、以下の処理を実行する。
まず、フィルタ部13における補正演算部131は、対応するデータ種別のハードウェア情報、この例の場合、CPU温度をハードウェア情報記憶部3から取得する(ステップ105)。更に、取得したハードウェア情報に対応するハードウェア仕様情報、この例の場合、CPUに関する仕様情報をハードウェア仕様情報記憶部132から取得する(ステップ106)。そして、図6に示した負荷変動データ補正処理を実行する(ステップ107)。
補正演算部131は、1行分の日時の負荷変動データを取得する(ステップ1071)。続いて、補正演算部131は、ハードウェア情報に含まれるデータ値(CPU温度)を参照し、このCPU温度に対応するCPU処理性能データをハードウェア仕様情報から取得する(ステップ1072)。図8に示したハードウェア情報を参照すると、1行分、例えば、8時のCPU温度は95度であるが、図4に示したハードウェア仕様情報を参照すると95度に対応するCPUの処理性能は、CPU温度が90−110度でCPUモードが“POWERSAVE”のときの0.5である。よって、補正演算部131は、8時の負荷変動データ“1.6”をCPUの処理性能データ“0.5”で乗算することで補正する(ステップ1073)。補正の結果、8時の負荷変動データは、図11に示したように0.8と算出される。
以上のステップ1071〜1073の処理を、全ての日時に対応する負荷変動データに対して繰り返し行うことで(ステップ1074でN)、全ての負荷変動データをCPUの処理性能データに基づき補正する。この結果、図11に示した補正後の負荷変動情報が得られる。全ての負荷変動データに対する補正が終了すると(ステップ1074でY)、負荷変動データ補正処理は終了する。
以上のように負荷変動データ補正処理が終了すると、判断部133は、図7に示した機器状態再判定処理を実行する(ステップ108)。
判断部133は、1行分の日時の補正後の負荷変動情報に含まれる負荷変動データを取得すると(ステップ1081)、取得した負荷変動データを閾値と比較する。そして、負荷変動データが閾値より大きい場合(ステップ1082でY)、その時点で機器1の状態は異常と判断する(ステップ1083)。すなわち、閾値より大きい負荷変動データが1つでも存在した場合、判断部133は、照合部12による異常という判定結果は妥当と判断し、その判定結果を維持することになる。
一方、負荷変動データが閾値以下であった場合(ステップ1082でN)、全ての負荷変動データに対して閾値との比較を繰り返し行うことで(ステップ1084でN)、機器1の状態の正常/異常の判断を行う。そして、閾値より大きい負荷変動データが1つも存在しなかった場合(ステップ1084でY)、判断部133は、照合部12による異常という判定結果を破棄し、正常と判断する(ステップ1085)。例えば、1.6であった8時の負荷変動データは、補正により0.8となり閾値1より小さくなったので、8時の機器1の状態は正常と判断される。
以上のようにして、判断部133による機器状態再判定処理が終了した結果、機器1の状態が異常と判定されていれば(ステップ109でY)、表示部14は、機器1の状態は異常である旨を表示することによって、機器1の異常(Anomaly)をユーザに知らせる(ステップ110)。一方、機器1の状態が正常と判定されていれば(ステップ109でN)、処理は終了する。なお、この場合、表示部14に機器1の状態は正常(Regularity)である旨を表示させるようにしてもよい。
本実施の形態によれば、以上のように現在の負荷データの過去の負荷データ(負荷モデルデータ)に対する変動量が大きいことでいったん異常と判定された場合でも、ハードウェアの状態を示す情報、上記例ではCPU温度に対応したCPU処理性能に基づき負荷変動データを補正することによって機器1の状態の判定を再度試みるようにした。このような照合部12による異常判定の妥当性を検証する再判定を行った結果、機器1の状態は正常であると判断した場合、照合部12により異常という判定結果を破棄し、機器1の状態は正常と判定し直すことになる。この結果、本実施の形態によれば、機器1の状態をより精度良く判定することができる。
なお、本実施の形態では、ハードウェア情報として機器1のCPUの温度を用いる場合を例にして説明したが、例えばCPUの電圧、HDDエラー数等他のハードウェア情報、あるいは複数のハードウェア情報を組み合わせて機器1の状態を判定するようにしてもよい。
また、本実施の形態における負荷情報生成部11は、機器1から負荷データを直接取得するように説明したが、負荷データをハードウェア情報のようにいったん記憶手段に格納し、その記憶手段から読み出すことで取得するように構成してもよい。負荷情報には、CPUの負荷に関する情報を例示的に用いたが、これに代えて、あるいは同時にI/O、メモリ、プロセス等の負荷情報を利用するようにしてもよい。
また、本実施の形態では、負荷データとハードウェア情報の利用先が異なることから、機器1から出力される負荷データ及びハードウェア情報を別個に取り扱うようにしたが、負荷データ及びハードウェア情報をまとめて記憶手段に記憶し、このうち負荷データは負荷情報生成部11により、ハードウェア情報は補正演算部131により参照させるようにしてもよい。更に、負荷データ及びハードウェア情報を照合部12等他の手段からでも参照可能なように構成してもよい。
また、本実施の形態では、機器1の状態を判定するための機器状態判定装置10を機器1とは別個に設けたが、機器1の内部に設けるように構成してもよい。
また、本実施の形態における照合部12は、負荷データを負荷モデルデータで除算することで負荷変動データを算出するようにしたが、パターンマッチング、量子化、丸めた後の比較等従前から用いられている照合方式を利用して機器1の状態を判定してもよい。
前述した構成及び処理の変形例は、本実施の形態に限るものではなく、以降に説明する各実施の形態にも適用してもよい。
実施の形態2.
図12は、本発明に係る機器状態判定装置の実施の形態2を示したブロック構成図である。実施の形態1と同じ構成要素には同じ符号を付け、説明を適宜省略する。本実施の形態における機器状態判定装置10は、実施の形態1において用いたハードウェア情報の代わりに、センサ手段による計測値を含む機器1の環境情報を用いて機器1の状態を判定することを特徴とする。図12には、センサ手段としての温度センサ4と、温度センサ4による計測値を含む環境情報が蓄積される環境情報記憶部5が示されている。更に、本実施の形態におけるフィルタ部13は、実施の形態1に加えて変換テーブル134及び変換部135を有している。変換部135は、変換手段として設けられ、変換テーブル134を用いて機器1の環境に関する環境情報をハードウェア情報に変換する。
図13は、本実施の形態における変換テーブル134のデータ構成例を示した図である。図13に示した変換テーブル134には、環境情報であるCPUの周囲温度にハードウェア情報であるCPU温度が対応付けされて設定される。図13に例示した設定例によると、CPUの周囲温度が30度を超え40度以下の場合のCPU温度は100度と推測される。なお、本実施の形態では、CPUの周囲温度を環境情報として用いるので、CPUの周囲温度をCPU温度に変換するための変換テーブルしか図示していないが、他のデータ種別の環境情報に対しても予め用意されている。
温度センサ4は、マザーボード上のCPU周辺の温度(室温)を計測するためにCPUの直近に配設するのが好ましい。温度センサ4の取付位置によって変換テーブルへの設定値を調整すればよい。
次に、本実施の形態における機器状態判定処理について図14及び図15に示したフローチャートを用いて説明する。機器状態判定処理に含まれる負荷変動データ補正処理及び機器状態再判定処理は、実施の形態1と同じでよい。なお、実施の形態1と同じ処理には同じステップ番号を付け説明を適宜省略する。本実施の形態では、温度センサ4により計測されたCPUの周囲温度を環境情報として用いる場合を例にして説明する。
監視対象の機器1からは、少なくとも動作中には負荷を示す情報が定期的に出力されている。また、温度センサ4は、計測したCPUの周囲温度を出力する。環境情報記憶部5には、温度センサ4から出力されたCPUの周囲温度が定周期的に蓄積される。本実施の形態では、実施の形態1と同様に1秒毎という定周期にて環境情報記憶部5に蓄積される。この環境情報記憶部5に蓄積される環境情報のデータ構成例を図16に示す。環境情報は、環境情報が計測された日時に、計測された環境情報の種別及びその計測されたデータ値が対応付けて生成される。本実施の形態では、前述したようにCPUの周囲温度(AMBIENTtemp)というデータ種別のデータが計測される。
機器1の監視期間内に、負荷情報生成部11は、取得した負荷データに基づき図9に例示したような負荷情報を生成する(ステップ101)。続いて、照合部12は、データ種別であるCPU使用率に対応するモデル情報をモデル情報記憶部2から取得して(ステップ102)、図10に示した負荷変動情報を生成する(ステップ103)。
図10に例示したように、閾値を超える負荷変動データが少なくとも1つ算出されると、照合部12は、当該機器1の状態は異常(Anomaly)と判定する。異常と判定された場合(ステップ104でY)、フィルタ部13は、以下の処理を実行する。
まず、フィルタ部13における変換部135は、対応する環境情報、この例の場合、CPUの周囲温度を環境情報記憶部5から取得する(ステップ201)。更に、取得した環境情報に対応する変換テーブル、この例の場合、周囲温度に関する変換テーブル134を取得する(ステップ202)。そして、次に示す環境情報をCPU温度に変換する環境情報変換処理を実行する(ステップ107)。環境情報変換処理は、図15に示したように処理される。
変換部135は、1行分の日時の環境情報を取得する(ステップ2031)。続いて、変換部135は、ステップ202において取得された変換テーブルを参照して、取得した周囲温度に対応するCPUの温度を得る。例えば、8時であれば、CPUの周囲温度40度を取得することになるので、40度の周囲温度に対応するCPUの温度は100度と変換される。そして、変換部135は、変換対象とした日時に対応させて、変換したデータ種別及びそのデータ値を対応付けして出力情報を生成する(ステップ2032)。以上のステップ2031〜2032の処理を、全ての環境情報に対して繰り返し行うことで(ステップ2033でN)、全ての環境情報、この例の場合CPUの周囲温度をCPU温度に変換する。全ての環境情報に対する変換が終了すると(ステップ2033でY)、環境情報変換処理は終了する。
この環境情報変換処理が実行された結果、得られた変換部出力情報の例を図17に示す。変換部出力情報のデータ構成例を参照すると明らかなように、実施の形態1におけるハードウェア情報と同じデータ構成である。すなわち、実施の形態1において用いたハードウェア情報に代えて変換部出力情報を用い、実施の形態1において説明した補正演算部131及び判断部133が行うステップ106〜109を実行することで、ステップ104において機器1の状態が異常と判定された場合に、その判定結果の妥当性を再度確認すべく再判定を実施し、その再判定により機器1の状態が正常と判断された場合には、異常という最初の判定結果を破棄することになる。
なお、本実施の形態では、前述したように実施の形態1とは異なりハードウェア情報に基づき機器1の判定を行わないが、機器1の判定の際にハードウェア仕様情報に含まれるハードウェアの仕様情報を用いるので、環境情報変換処理では、環境情報をハードウェア情報のデータ種別の1つであるCPU温度に変換するようにした。仮に、CPUの電圧等他のハードウェア情報に基づき機器1の判定を行うのであれば、環境情報変換処理では、環境情報をCPUの電圧等他のハードウェア情報に変換することになる。
また、本実施の形態では、環境情報として温度センサ4により計測されたCPUの周囲温度を用いる場合を例にして説明したが、例えばほこりっぽさ等他の環境情報、あるいは複数の環境情報を組み合わせて機器1の状態を判定するようにしてもよい。温度と同様に、湿度も高ければCPUの処理性能は低下すると考えられる。また、ほこりっぽさは、所定体積当たりの粉塵量にて数値化可能であるが、粉塵量が高いと機器1のファンにほこりが付着している量が多いと考えられ、そしてファンへの付着量が多いとCPUの温度上昇を効果的に防止できない、すなわちCPUの温度が上昇していて処理性能を低下させていると考えられる。
実施の形態3.
図18は、本発明に係る機器状態判定装置の実施の形態3を示したブロック構成図である。実施の形態1と同じ構成要素には同じ符号を付け、説明を適宜省略する。本実施の形態における機器状態判定装置10は、実施の形態1において用いた構成に、設置場所情報設定部6及び設置場所情報記憶部136を追加した構成を有している。設置場所情報設定部6は、ユーザ(工事担当者等)により入力指定された設置場所情報を設置場所情報記憶部136に設定登録する。
図19は、本実施の形態における設置場所情報記憶部136に記憶された設置場所情報のデータ構成例を示した図である。設置場所情報は、機器1の設置場所の特徴を示す情報と、当該設置場所が機器1に与える負荷を示す負荷指標データと、が対応付けされて設定される。機器1の設置場所の特徴を示す情報としては、機器1に負荷をかける可能性のある設置場所を特定する情報が予め設定されている。本実施の形態では、負荷指標データとしてフラグ値を設定するようにしている。すなわち、機器1の設置場所が、その場所に実際に設置されている場合はフラグ値として1をセットし、設置されていない場合はフラグ値として0をセットする。なお、本実施の形態では、設置場所情報記憶部136をフィルタ部13に設けたが、フィルタ部13の外、例えば機器状態判定装置10や機器状態判定装置10とは別個の記憶装置として設けてもよい。
ユーザは、後述する機器状態判定処理が実施される前にマウス26やキーボード27等の入力手段を用いて設置場所情報を予め入力し、設置場所情報設定部6は、ユーザにより入力された設置場所情報を受け取ると、これを設置場所情報記憶部136に登録する。
次に、本実施の形態における機器状態判定処理について説明する。なお、本実施の形態における機器状態判定処理及びこの機器状態判定処理に含まれる負荷変動データ補正処理は、実施の形態1で用いた図5、6と同じでよく、図20に示した機器状態再判定処理が異なってくる。また、図20において実施の形態1と同じ処理には同じステップ番号を付け説明を適宜省略する。
実施の形態1において説明したように、機器1の負荷データ(CPUの温度)から生成した負荷変動情報を参照することで機器1が異常と判定されると(ステップ104でY)、照合部12により生成された負荷変動データは図6に示した負荷変動データ補正処理により補正される(ステップ107)。そして、補正後の負荷変動データに基づき、照合部12により異常と判定された機器1の状態の妥当性が機器状態再判定処理において検証される(ステップ108)。以下、本実施の形態における機器状態再判定処理を図20を用いて説明する。
実施の形態1において説明したように、機器1の状態を判定する際、ステップ1082において補正後の負荷変動データを予め設定された閾値と比較する。本実施の形態では、この閾値を設置場所情報に基づき補正することを特徴としている。すなわち、判断部133は、設置場所情報記憶部136に登録されている全ての設置場所情報を取得する(ステップ1381)。そして、設置場所情報に設定されている設置場所、図19に示した設定例によると、まず「壁隣接(吸気面)」のフラグがセットされている場合(ステップ1382でY)、CPUに関する現在の閾値に0.9を乗算して補正する(ステップ1383)。次の設置場所情報に対しても同様に、「壁隣接(排気面)」のフラグがセットされている場合(ステップ1384でY)、CPUに関する現在の閾値に0.9を乗算して補正する(ステップ1385)。続いて、「床直置き」のフラグがセットされている場合(ステップ1386でY)、HDDに関する現在の閾値に0.9を乗算して補正する(ステップ1387)。
以上のようにして閾値を補正した後、実施の形態1と同様に負荷変動データを補正後の閾値と比較することで照合部12による判定結果の妥当性を再判定する(ステップ1081〜1085)。
ところで、本実施の形態では、設置場所情報に「壁隣接(吸気面)」、「壁隣接(排気面)」及び「床直置き」という3種類の設置場所を例示した。本実施の形態において機器1として例示しているPCを壁に隣接して設置した場合、PCの吸気面が壁に隣接させて設置されていると、隣接させないで設置している場合に比して吸気機能が低下すると考えられる。吸気機能が低下すると、CPUの温度が上昇しやすくなると推測される。従って、図20を用いて説明した機器状態再判定処理のように、現在の閾値に1未満の値を乗算することによって閾値を下げ、厳しい判断がされるようにした。この結果、照合部12による異常という判定結果が破棄されにくくなる。PCの排気面が壁に隣接させて設置されている場合も同じ理由で、現在の閾値に1未満の値を乗算することで閾値を補正するようにした。また、PCを床に直に置いていると、PCに振動が伝わりやすくなる。つまり、HDDのエラー発生回数が床に直に置かない場合と比して多くなると推測される。従って、図20を用いて説明した機器状態再判定処理のように、現在のHDDに関する閾値に1未満の値を乗算することによって閾値を下げ、厳しい判断がされるようにした。この結果、照合部12による異常という判定結果が破棄されにくくなる。なお、本実施の形態では、ハードウェア情報としてCPU温度を用いているので、ステップ1387において再設定したHDDの閾値は使用されない。従って、図20に示した機器状態再判定処理では、ハードウェア情報を参照してステップ1082において用いる閾値のみを補正するようにしてもよい。
なお、本実施の形態では、3種類の設置場所に基づき各閾値を下方修正するようにしたが、これは一例であって他の設置場所、より多くの設置場所に基づき補正を行うようにしてもよい。また、下方修正するための0.9倍という乗算値もこれに限定する必要はなく誤判定の発生頻度等を参照して調整すればよい。また、乗算値は設置場所毎に異なる値を設定してもよい。
また、本実施の形態では、負荷指標データとしてフラグ値を用いたので、フラグのセット/クリアによって、別途乗算値(0.9)を設定したが、負荷指標データに乗算値を設定し、閾値に負荷指標データを乗算して閾値を変更するようにしてもよい。また、本実施の形態では、設置場所情報に該当する度に閾値1が0.9、0.81と小さくなるように乗算という演算にて再設定するようにしたが、閾値を固定値として設定するようにしてもよい。
また、本実施の形態では、閾値を下げ厳しい判断がされるような例を示したが、必ずしも閾値を下げることに限らず、設置場所に応じて閾値に1より大きい値を乗算して、判断を緩くしてもよい。例えば、常時冷房されている部屋に設置されている場合は閾値を上げるなどである。
また、本実施の形態では、ユーザが設置場所に対するフラグ情報を手入力し、その入力された情報に基づいて設置場所情報を設定する場合を想定したが、近接センサを用いて壁との距離を計測したり、機器1の設置場所を撮影してその撮影画像を分析したりして設置場所を自動判定しフラグ情報を自動的に設定するようにしてもよい。
実施の形態4.
図21は、本発明に係る機器状態判定装置の実施の形態4を示したブロック構成図である。実施の形態1と同じ構成要素には同じ符号を付け、説明を適宜省略する。本実施の形態における機器状態判定装置10は、実施の形態1において用いたハードウェア情報記憶部3及びハードウェア仕様情報記憶部132に代えてイベント情報記憶部8及びイベント負荷情報記憶部137を設け、更にイベント検知部7を追加した構成を有している。イベント検知部7は、検知手段として設けられ、機器1に対して発生するイベントを検知する。本実施の形態におけるイベント検知部7は、各種センサ等により実現され、機器1において発生したイベントを検知すると、その発生したイベントに関するイベント情報をイベント情報記憶部8に蓄積する。
図22は、本実施の形態におけるイベント負荷情報記憶部137に予め設定登録されているイベント負荷情報のデータ構成例を示した図である。イベント負荷情報には、機器1に対して発生しうるイベントと、当該イベントが機器1に与える負荷を示す負荷指標データと、が対応付けされて設定される。本実施の形態におけるイベント負荷情報は、図22に示したように、各イベントを識別するイベント識別情報であるイベントIDに、当該イベントのイベント名と、負荷指標データとして当該イベントの発生によりCPU及びIOの各処理性能の低下する程度を占める割合(CPU処理性能係数及びIO処理性能係数)とが対応付けして設定される。
図23は、本実施の形態におけるモデル情報記憶部2に予め設定登録されているモデル情報のデータ構成例を示した図である。本実施の形態におけるモデル情報は、基本的には実施の形態1と同じであるが、実施の形態1では、1種類の種別(図3の例ではCPU負荷率)のデータのみが設定登録されているのに対し、本実施の形態では、CPU負荷率及びIO負荷率という2種類の種別のモデルデータが設定される。
次に、本実施の形態における機器状態判定処理について図24及び図25に示したフローチャートを用いて説明する。機器状態再判定処理は、図7に示した実施の形態1における処理と同じでよい。なお、実施の形態1と同じ処理には同じステップ番号を付け、説明を適宜省略する。
イベント検知部7は、機器1の動作状態を常時監視しており、機器1においてイベント負荷情報に登録されている何らかのイベントが発生すると、その発生したイベント及び発生日時を組にしてイベント情報記憶部8に登録する。
実施の形態1と同様に、照合部12は、負荷情報生成部11により生成された負荷情報とモデル情報と負荷変動情報を生成する(ステップ101〜103)。ただ、本実施の形態の場合、CPU負荷率に加えIO負荷率の負荷変動データを含む負荷変動情報を生成することになる。この処理により生成された負荷変動情報の例を図27に示す。
照合部12は、生成した負荷変動情報から機器1の状態が異常と判定した場合(ステップ104でY)、フィルタ部13における補正演算部131は、イベント情報をイベント情報記憶部8から取得し(ステップ401)、更に、取得したイベント情報に対応するイベント負荷情報をイベント負荷情報記憶部137から取得する(ステップ402)。そして、図25に示した負荷変動データ補正処理を実行する(ステップ403)。
補正演算部131は、まず1行分の負荷変動データを取得する(ステップ4031)。例えば、8時における機器1の状態を判定する場合、イベント情報を参照すると停電が発生しているので、停電発生時の負荷変動データとしてCPU負荷率(1.6)とIO負荷率(2.33)を取得する。続いて、補正演算部131は、発生したイベント、すなわち停電に対応するCPU処理性能係数(0.625)とIO処理性能係数(0.71)をイベント負荷情報から取得する(ステップ4032)。そして、取得したCPU処理性能係数及びIO処理性能係数を対応する負荷変動データにそれぞれ乗算して補正する(ステップ4033)。具体的には、図28に示したように、CPUに関しては、CPU処理性能係数(0.625)にCPU負荷率(1.6)を乗算することで負荷変動データを1.0と補正する。IOに関しては、IO処理性能係数(0.71)にIO負荷率(2.33)を乗算することで負荷変動データを1.65と補正する。
以上のステップ4031〜4033の処理を、全てのCPU及びIOの各負荷変動データに対して繰り返し行うことで(ステップ4034でN)、補正演算部131は、全ての負荷変動データをCPU処理性能係数及びIO処理性能係数に基づき補正する。この結果、図28に示した補正後の負荷変動情報が得られる。全ての負荷変動データに対する補正が終了すると(ステップ4034でY)、負荷変動データ補正処理は終了する。
以上のように負荷変動データ補正処理が終了すると、続いて機器状態再判定処理を実行することで、照合部12による機器1の状態の判定結果の検証を行うが(ステップ108)、この処理以降の処理は実施の形態1と同じでよいので説明を省略する。
実施の形態5.
上記実施の形態1〜4では、フィルタ部13における判断部133が、照合部12による機器1の異常という判定結果が妥当であると判断した場合に、表示部14が誤判定の旨のメッセージを表示するに留まり、誤判定であったと判断した場合には基本的には何も出力しなかった。本実施の形態では、誤判定という判断した要因及び対処方法という誤判定と判断したことに関連する情報をメッセージとして出力するようにしたことを特徴としている。
図29は、本発明に係る機器状態判定装置の実施の形態5を示したブロック構成図である。本実施の形態のブロック構成は、実施の形態1及び実施の形態2に示した構成に、メッセージ情報記憶部138及びフィルタ部13の補正演算部131にメッセージ選択部1311を追加した構成を有している。
図30は、本実施の形態におけるメッセージ情報記憶部138に予め設定登録されたメッセージ情報のデータ構成例を示した図である。メッセージ情報には、各メッセージを識別する識別情報であるメッセージIDに、条件、要因説明及び対処方法という各情報が対応付けして設定される。条件には、異常という誤判定がされたことにより当該メッセージを出力させるための条件となる1又は複数の条件フラグが設定される。要因説明には、当該条件に合致した要因、換言すると照合部12により機器1の状態が異常と判定された要因が説明されたメッセージが設定される。対処方法には、当該要因により前記機器の状態を異常としないための対処方法が説明されたメッセージが設定される。
メッセージ選択部1311は、照合部12による機器1の異常という判定が誤判定であった場合に、メッセージ情報記憶部138に設定されているメッセージ情報の中から、その誤った判定結果が得られた要因及び当該要因に対応する対処方法をそれぞれ説明したメッセージを選択する。
図31は、本実施の形態におけるハードウェア仕様情報記憶部132に予め設定登録されたハードウェア仕様情報のデータ構成例を示した図である。実施の形態1では、CPU温度をハードウェア仕様情報に含めていたが、本実施の形態では、更にHDD4のエラー率をハードウェア仕様情報として用いている。更に、各レコードに対応させて負荷フラグを設定した。負荷フラグは、機器1の稼動状態から機器1かかっている負荷を特定するためのフラグ情報である。例えば、図31に示した設定例によると、CPUの温度が90度以上110度未満の場合、CPUの温度によって機器1に負荷がかかっていると判断できるので、負荷フラグとしてCPU温度を示す“CPUtemp”というフラグ値が設定される。また、HDDのエラー率が10%以上の場合はHDDの処理性能が低下していると判断できるので、負荷フラグとしてHDDエラー率示す“HDDerrorrate”いうフラグ値が設定される。
図32は、本実施の形態における変換テーブル134のデータ構成例を示した図である。本実施の形態では、実施の形態2と異なり、粉塵率を用いた場合を例示している。すなわち、センサ手段により検出された機器1近傍の粉塵率が高いほどファンの性能が低下するためCPUの温度が上昇していると推測できるため、図32に示したように粉塵率とCPU温度とを対応付けた。図32に例示した設定例によると、粉塵率が40%を超え80%以下の場合のCPU温度は100度と推測される。
次に、本実施の形態における機器状態判定処理について図33及び図34に示したフローチャートを用いて説明する。機器状態再判定処理は、図7に示した実施の形態1における処理と同じでよい。なお、実施の形態1,2と同じ処理には同じステップ番号を付け、説明を適宜省略する。
本実施の形態における機器状態判定処理は、基本的に実施の形態1と実施の形態2における処理内容を組み合わせている。その結果、照合部12は、図35に示したように負荷変動情報を生成する(ステップ103)。更に、本実施の形態の場合、負荷情報生成部11により生成された負荷情報がモデル情報より大きい日時(例えば8時30分00秒)における負荷変動データ、すなわち1.0より大きい負荷変動データの場合、当該日時におけるCPU負荷が大きいことを示す“CPUload”というフラグを条件フラグとして設定する。
この例のように閾値(1.0)を超える負荷変動データが算出されることで照合部12が当該機器1の状態は異常と判定すると(ステップ104でY)、フィルタ部13は、以下の処理を実行する。
まず、実施の形態2において説明したように、変換部135は、取得された環境情報を変換テーブル134を用いてCPU温度に変換して変換部出力情報を生成する(ステップ201〜203)。図35及び図32の設定例によると、例えば、機器1の周辺で検出された8時30分00秒の粉塵率は50%なので、図32に示した変換テーブル134を用いることで粉塵率50%に対応するCPU温度として100度を得る。このようにして、変換部135は、実施の形態2と同様に図37に例示したように変換部出力情報を生成する。更に、本実施の形態の場合、100度というCPUの処理性能を低下させる要因として粉塵率が高いことが推測されるので、変換部135は、図15に示したステップ2032における処理において、該当する日時(8時30分00秒)に対し、粉塵率が高いことを示す“DUSTamount”というフラグを条件フラグとして設定する。
続いて、実施の形態1において説明したように、補正演算部131は、取得されたハードウェア情報に基づき負荷変動データ補正処理を実行する(ステップ107)。更に、本実施の形態においては、図34に示したように、照合部12による負荷変動情報の生成処理(ステップ103)において設定された条件フラグ及び変換部135による環境情報の変換処理(ステップ203)において設定された条件フラグをそれぞれ取得し、対応する日時の負荷変動情報に対応付ける(ステップ1075)。この本実施の形態における負荷変動データ補正処理に生成された補正後の負荷変動情報を図38に示す。例えば、8時30分00秒に対し、負荷変動情報の生成処理では、条件フラグ“CPUload”が、環境情報の変換処理では、条件フラグ“DUSTamount”が、それぞれ設定されたので、図38に示したように、8時30分00秒の負荷変動情報には、条件フラグとして“CPUload及び“DUSTamount”が設定されている。
更に、補正演算部131におけるメッセージ選択部1311は、補正後の負荷変動情報に設定された条件フラグを取得し、その条件フラグをメッセージ情報記憶部138に登録されている各メッセージ情報の条件と照合することで、表示すべきメッセージを特定し、そのメッセージIDを取得する(ステップ1076)。
判断部133は、実施の形態1において説明したように補正後の負荷変動情報に含まれる負荷変動データと閾値とを比較して機器1の状態の再判定を行う(ステップ109)。そして、機器1の状態が異常であれば、判断部133は、その旨を表示部14に表示させることによって、機器1の異常(Anomaly)をユーザに知らせる(ステップ110)。
一方、異常という機器1の状態が破壊され正常と判定された場合(ステップ109でN)、本実施の形態において出力手段として設けられた表示部14は、メッセージ選択部1311により選択されたメッセージを表示する(ステップ501)。表示部14は、メッセージ選択部1311により取得されたメッセージIDを取得し、メッセージ情報記憶部138からメッセージを直接読み出してもよいし、メッセージIDに基づきメッセージを読み出した補正演算部131又は判断部133から当該メッセージを取得して表示するようにしてもよい。
なお、負荷変動情報(補正前)及び変換部出力情報に条件フラグが設定される日時は一瞬ではなく、同じ条件フラグがある程度の時間の範囲をもつものと考えられる。つまり、ステップ1076では、同じメッセージIDが連続して繰り返し取得されることになるので、このような場合、メッセージを表示する際には、当該メッセージの要因が発生した日時(時間の範囲)と共に表示するようにしてもよい。
また、本実施の形態では、誤判定した要因及びその対処方法を組にして表示するようにしたが、少なくとも一方を表示するようにしてもよい。
実施の形態6.
上記実施の形態5では、機器1が異常と判定された後に再判定によりその判定が誤判定と判断した場合、その要因及び対処方法をメッセージにて出力するようにした。本実施の形態では、実施の形態3において利用した設置場所情報を利用して設置場所に応じてメッセージを設定することで、対処方法をより詳細に具体的な内容にしたことを特徴としている。
図39は、本発明に係る機器状態判定装置の実施の形態6を示したブロック構成図である。実施の形態5と同じ構成要素には同じ符号を付け、説明を適宜省略する。本実施の形態における機器状態判定装置10は、実施の形態5において用いた構成に、実施の形態3において用いた設置場所情報設定部6及び設置場所情報記憶部136を追加した構成を有している。
図40は、本実施の形態におけるメッセージ情報記憶部138に予め設定登録されたメッセージ情報のデータ構成例を示した図である。メッセージ情報のデータ構成は、実施の形態5と同じでよいが、メッセージIDが3,4のメッセージ情報に例示したように、本実施の形態における条件の中に、“Direct−floor”や“!Direct−floor”のように機器1の設置場所を示すフラグ情報が更に設定可能である。なお、“Direct−floor”は、床直置きを示すフラグ値であり、“!Direct−floor”は、机上など床直置きでないことを示すフラグ値である。
本実施の形態における機器状態判定処理は、実施の形態5とほぼ同様で、メッセージ選択部1311がメッセージを選択する際に設置場所情報を参照する点が異なるだけである。
すなわち、補正演算部131におけるメッセージ選択部1311は、図34に示したステップ1076において、補正後の負荷変動情報に設定された条件フラグを取得すると共に、設置場所情報を参照して、機器1の設置場所を取得する。そして、取得した条件フラグ及び設置場所を、メッセージ情報記憶部138に登録されている各メッセージ情報の条件と照合することで、表示すべきメッセージを特定し、そのメッセージIDを取得する。
図40に例示したメッセージ情報の設定例によると、例えばCPU負荷が高く、かつ粉塵率が高い場合において、機器1が床に直接設置されている場合にはメッセージIDが4のメッセージ情報が選択される。CPU負荷が高く、かつ粉塵率が高い要因については、機器1の設置場所に依存せずに同じであるが、対処方法は設置場所によって異なってくることがわかる。
本実施の形態によれば、設置場所によって要因の深刻度を判断し、その深刻度に応じた対処方法を提示することができる。
実施の形態7.
図41は、本発明に係る機器状態判定装置の実施の形態7を示したブロック構成図である。実施の形態1と同じ構成要素には同じ符号を付け、説明を適宜省略する。本実施の形態における機器状態判定装置10は、実施の形態1において用いた構成に、モデル情報生成部15を追加した構成を有している。本実施の形態における照合部12は、負荷データを負荷モデルデータで除算して負荷変動情報を生成している。このように、負荷変動情報は、負荷データと負荷モデルデータとの関係を示す情報であるともいえるが、本実施の形態においてモデルデータ生成手段として設けられたモデル情報生成部15は、判断部133により機器1の状態が正常と判断された場合、負荷変動情報の生成に用いられた負荷データを、当該負荷データが得られたときの機器1の動作モードに対する負荷モデルデータとして生成する。ここでいう機器1の動作モードというのは、機器1にかかっている負荷に応じた機器1の動作モードのことである。図3に示したハードウェア仕様情報によると、CPUの場合はCPUモードが機器1の動作モードに相当する。
ところで、照合部12における機器1の状態の判定結果は、負荷情報生成部により生成された負荷情報と比較されるモデル情報の設定内容(設置値)に依存することになるが、誤判定と再判定される場合が多いということは、モデル情報に要因がある可能性がある。
そこで、本実施の形態では、照合部12による判定結果が誤判定と判断されたときの負荷情報をモデル情報にフィードバックすることで、照合部12による誤判定を抑制するようにしたことを特徴としている。
次に、本実施の形態における機器状態判定処理について図42に示したフローチャートを用いて説明する。負荷変動データ補正処理及び機器状態再判定処理は実施の形態1と同じでよい。なお、実施の形態1と同じ処理には同じステップ番号を付け説明を適宜省略する。
実施の形態1においては、図3に示したモデル情報を用いた。本実施の形態では、図3に示したモデル情報は、CPUモードが標準(STANDARD)のときのモデル情報であり、初期データとして取り扱う。そして、図9に例示した負荷情報が負荷情報生成部11により生成され、モデル情報の初期データを用いた照合部12による機器1の状態の判定結果が異常の場合(ステップ104でY)、フィルタ部13における補正演算部131は、ハードウェア情報を参照して負荷変動情報を補正する(ステップ107)。このとき、図4及び図9それぞれ例示したハードウェア仕様情報及びハードウェア情報の設定内容を参照すると、このCPUの温度(95度,90度)におけるCPUモードは、POWERSAVEモードであることがわかる。この場合において、フィルタ部13における判断部133が、その照合部12による判定結果が誤判定と判断した場合(ステップ109でN)、モデル情報生成部15は、図9に示した負荷情報を、CPUモードがPOWERSAVEモードであるときのモデル情報として生成し、モデル情報記憶部2に登録する(ステップ701)。この登録されたモデル情報の例を図43に示す。
このように誤判定したときの負荷データを利用してモデル情報にフィードバックを行う。つまり、本実施の形態においては、CPUモードに対応させてモデル情報を生成することになる。
ところで、モデル情報は、照合部12によって参照されるが、照合部12が負荷変動情報を生成する際に、どのモデル情報を利用するか、換言すると、CPUが現在のどのCPUモードで動作しているのかということを知る必要はある。これは、照合部12がハードウェア情報記憶部3及びハードウェア仕様情報記憶部132を参照して自らCPUモードを特定するようにしてもよいし、ハードウェア情報記憶部3及びハードウェア仕様情報記憶部132を参照するフィルタ部13に問い合わせてCPUモードを特定するようにしてもよい。
以上説明した各実施の形態においては、それぞれ特徴的な構成を説明したが、これらの構成を適宜組み合わせて用いてもよい。
1 機器、2 モデル情報記憶部、3 ハードウェア情報記憶部、4 温度センサ、5 環境情報記憶部、6 設置場所情報設定部、7 イベント検知部、8 イベント情報記憶部、10 機器状態判定装置、11 負荷情報生成部、12 照合部、13 フィルタ部、14 表示部、15 モデル情報生成部、21 CPU、22 ROM、23 RAM、24 ハードディスクドライブ(HDD)、25 HDDコントローラ、26 マウス、27 キーボード、28 ディスプレイ、29 入出力コントローラ、30 ネットワークコントローラ、31 内部バス、131 補正演算部、132 ハードウェア仕様情報記憶部、133 判断部、134 変換テーブル、135 変換部、136 設置場所情報記憶部、137 イベント負荷情報記憶部、138 メッセージ情報記憶部。

Claims (9)

  1. 監視対象の機器にかかる負荷の状態を示す負荷状態情報を生成する生成手段と、
    前記生成手段により生成された負荷状態情報に基づき前記機器の状態を判定する判定手段と、
    前記判定手段により前記機器の状態が異常と判定された場合、前記機器のハードウェアの状態を示すハードウェア情報に基づき前記生成手段により生成された負荷状態情報を補正する補正手段と、
    前記補正手段により補正された負荷状態情報に基づき前記機器の状態の再判定を行い、その再判定により前記機器の状態は正常と判断した場合、前記判定手段による異常判定を破棄する再判定手段と、
    を有することを特徴とする機器状態判定装置。
  2. 前記補正手段は、前記機器が取りうる状態と当該状態であるときに前記機器が発揮しうる処理性能を示す処理性能データとの対応関係を示すハードウェア仕様情報を参照することで、前記ハードウェア情報が示す前記機器の状態に対応する処理性能データを取得し、その取得した処理性能データで負荷状態情報を補正することを特徴とする請求項1に記載の機器状態判定装置。
  3. 前記機器の環境に関する情報を前記ハードウェア情報に変換する変換手段を有し、
    前記補正手段は、前記変換手段により変換されたハードウェア情報に基づき前記生成手段により生成された負荷状態情報を補正することを特徴とする請求項1に記載の機器状態判定装置。
  4. 前記機器の設置場所と、当該設置場所が前記機器に与える負荷を示す負荷指標データと、が対応付けされた設置場所情報を取得する設置場所情報取得手段を有し、
    前記再判定手段は、前記補正手段により補正された負荷状態情報と閾値との比較結果に応じて前記機器の状態を再判定する場合、前記設置場所情報を参照することにより前記機器の設置場所に応じて前記閾値を設定することを特徴とする請求項1に記載の機器状態判定装置。
  5. 前記機器に対して発生しうるイベントと、当該イベントが前記機器に与える負荷を示す負荷指標データと、が対応付けされたイベント負荷情報を取得するイベント負荷情報取得手段と、
    前記機器に対して発生するイベントを検知する検知手段と、
    を有し、
    前記補正手段は、前記検知手段により検知されたイベントに対応した負荷指標データに基づき前記生成手段により生成された負荷状態情報を補正することを特徴とする請求項1に記載の機器状態判定装置。
  6. 前記再判定手段により前記機器の状態が正常と判断された場合、前記判定手段により前記機器の状態が異常と判定された要因又は当該要因により前記機器の状態を異常としないための対処方法の少なくとも一方のメッセージを出力する出力手段を有することを特徴とする請求項1に記載の機器状態判定装置。
  7. 前記出力手段は、更に機器の設置場所に応じて設定されたメッセージを出力することを特徴とする請求項に記載の機器状態判定装置。
  8. 前記生成手段により生成された負荷状態情報が、前記機器にかかる負荷を示す負荷データと前記機器にかかる負荷のモデルデータとの関係を示す情報である場合において、前記再判定手段により前記機器の状態が正常と判断された場合に前記負荷データを当該負荷データが得られたときの前記機器の動作モードに対する前記モデルデータとして生成するモデルデータ生成手段を有することを特徴とする請求項1に記載の機器状態判定装置。
  9. コンピュータを、
    監視対象の機器にかかる負荷の状態を示す負荷状態情報を生成する生成手段、
    前記生成手段により生成された負荷状態情報に基づき前記機器の状態を判定する判定手段、
    前記判定手段により前記機器の状態が異常と判定された場合、前記機器のハードウェアの状態を示すハードウェア情報に基づき前記生成手段により生成された負荷状態情報を補正する補正手段、
    前記補正手段により補正された負荷状態情報に基づき前記機器の状態の再判定を行い、その再判定により前記機器の状態は正常と判断した場合、前記判定手段による異常判定を破棄する再判定手段、
    として機能させるためのプログラム。
JP2013255237A 2013-12-10 2013-12-10 機器状態判定装置及びプログラム Expired - Fee Related JP6095557B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013255237A JP6095557B2 (ja) 2013-12-10 2013-12-10 機器状態判定装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013255237A JP6095557B2 (ja) 2013-12-10 2013-12-10 機器状態判定装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2015114770A JP2015114770A (ja) 2015-06-22
JP6095557B2 true JP6095557B2 (ja) 2017-03-15

Family

ID=53528541

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013255237A Expired - Fee Related JP6095557B2 (ja) 2013-12-10 2013-12-10 機器状態判定装置及びプログラム

Country Status (1)

Country Link
JP (1) JP6095557B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4761229B2 (ja) * 2008-02-26 2011-08-31 日本電気株式会社 運用管理装置、運用管理方法ならびにプログラム
JP5446667B2 (ja) * 2009-09-28 2014-03-19 日本電気株式会社 仮想計算機管理システム,仮想計算機管理方法及びプログラム
JP5418250B2 (ja) * 2010-01-26 2014-02-19 富士通株式会社 異常検出装置、プログラム、及び異常検出方法

Also Published As

Publication number Publication date
JP2015114770A (ja) 2015-06-22

Similar Documents

Publication Publication Date Title
CN107636619B (zh) 信息处理装置、信息处理系统、信息处理方法及记录介质
JP6394726B2 (ja) 運用管理装置、運用管理方法、及びプログラム
JP5621937B2 (ja) 運用管理装置、運用管理方法、及びプログラム
JPWO2016147656A1 (ja) 情報処理装置、情報処理方法、及び、記録媒体
JP6219865B2 (ja) 制御装置の故障予測システム
US20170277232A1 (en) Information processing apparatus, method for detecting air intake fault, and storage medium
JP7167992B2 (ja) ラベル修正装置
JP5656723B2 (ja) メンタルヘルス管理支援システム及びメンタルヘルス管理支援方法
JP6095557B2 (ja) 機器状態判定装置及びプログラム
JP2015185120A (ja) 情報処理装置、情報処理方法、およびプログラム
US11322014B2 (en) Notification device, notification method, and program
JP6381498B2 (ja) 計量メータの状態変化検出装置及びプログラム
US20150256421A1 (en) Information processing method and information processing apparatus
JP5910033B2 (ja) 電圧監視装置および電圧監視方法
JP6381282B2 (ja) 異常検出装置及びプログラム
US8924180B2 (en) Maintenance system and maintenance method
JP6107250B2 (ja) 障害予測システム、障害予測装置、及び障害予測プログラム
JP6782260B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP5958987B2 (ja) 情報処理装置、故障診断制御装置、故障判定方法、故障判定プログラム
JP6858019B2 (ja) 機器状態監視システム
JP5497610B2 (ja) 電子機器及び内部時計のクロック周波数補正方法
US12130035B2 (en) Server and information providing system
JP6993082B2 (ja) 判定装置
US20220341616A1 (en) Server and information providing system
CN117785607A (zh) 服务器故障预测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151007

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160708

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160712

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160908

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170214

R150 Certificate of patent or registration of utility model

Ref document number: 6095557

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees