以下、図面を参照して一実施の形態を説明する。ただし、以下に示す実施形態はあくまでも例示に過ぎず、実施形態で明示しない種々の変形例や技術の適用を排除する意図はない。すなわち、本実施形態を、その趣旨を逸脱しない範囲で種々変形して実施することができる。
また、各図は、図中に示す構成要素のみを備えるという趣旨ではなく、他の機能等を含むことができる。
以下、図中において、同一の各符号は同様の部分を示しているので、その説明は省略する。
〔A〕第1実施形態の一例
〔A−1〕システム構成例
図1は、第1実施形態の一例としての情報処理システム100の構成を模式的に示すブロック図である。
情報処理システム100は、監視対象サーバ1,管理サーバ/モバイル端末2及び管理端末3を備える。
管理サーバ/モバイル端末2は、Simple Network Management Protocol(SNMP)やメール等を用いて、Local Area Network(LAN)により監視対象サーバ1と接続されてよい。管理サーバ/モバイル端末2は、リモートで監視対象サーバ1を監視することができる。また、情報処理システム100において複数の監視対象サーバ1が備えられる場合には、管理サーバ/モバイル端末2は、複数の監視対象サーバ1を一括して監視することができる。本実施形態において、管理サーバ/モバイル端末2は、監視対象サーバ1において検出された防塵ベゼル16(図2を用いて後述)の目詰まりの通知を受信し、Customer Engineer(CE)4(図5等を用いて後述)等のユーザに対して防塵ベゼル16の目詰まりを知らせる。
管理端末3は、Hypertext Transfer Protocol(HTTP)を用いて、LANにより監視対象サーバ1と接続されてよい。管理端末3は、監視対象サーバ1と一対一の関係で接続されており、監視対象サーバ1における種々の測定結果をモニタ可能である。また、本実施形態において、管理端末3は、監視対象サーバ1において検出された防塵ベゼル16(図2を用いて後述)の目詰まりの通知を受信し、CE4(図5等を用いて後述)等のユーザに対して防塵ベゼル16の目詰まりを知らせる。
監視対象サーバ1は、Baseboard Management Controller(BMC)11を備える。BMC11は、図3等を用いて後述するように、防塵ベゼル16における目詰まりを検出する。
図2は、図1に示した情報処理システム100における監視対象サーバ1のハードウェア構成を模式的に示すブロック図である。
監視対象サーバ1は、システムボード10,複数(図示する例では、6つ)の冷却ファン(FAN)14,風量センサ15及びベゼル16(「防塵ベゼル」や「フロントベゼル」と称してもよい。)を備える。なお、図2において、符号「1000」は、監視対象サーバ1の筐体を示す。
冷却ファン14は、筐体1000内の熱を冷却するために、気流を発生させる。
風量センサ15は、冷却ファン14によって発生された気流における風量のうち、防塵ベゼル16を透過する気流の風量を計測する。
防塵ベゼル16は、表面がフィルタ状であり、監視対象サーバ1の筐体1000の正面において、筐体1000から取り外し可能に取り付けられている。防塵ベゼル16において塵や埃等による目詰まり等の異常が発生した場合には、ユーザによって新しい防塵ベゼル16に交換されてよい。
システムボード10は、BMC11,Central Processing Unit(CPU)12及びチップセット13を備える。
チップセット13は、監視対象サーバ1において種々の機能を実現するための複数の集積回路の組み合わせである。チップセット13は、Low Pin Count(LPC)バスによってBMC11に接続されるとともに、Direct Media Interface(DMI)によってCPU12に接続されてよい。
CPU12は、プロセッサの一例である。CPU12は、例示的に、監視対象サーバ1において種々の制御や演算を行なう処理装置であり、例えばチップセット13内のメモリ(不図示)に格納されたOperating System(OS)やプログラムを実行することにより、種々の機能を実現する。
BMC11は、監視対象サーバ1の防塵ベゼル16付近に設置された風量センサ15による風量を監視するとともに、CPU12の温度を監視する。CPU12は、Inter-Integrated Circuit(I2C)によって、CPU12,各冷却ファン14及び風量センサ15に接続されてよい。
図3は、図2に示した監視対象サーバ1の機能構成を模式的に示す図である。
BMC11は、例示的に、制御判定部111,測定部112,記憶部113,通知部114及びInterface(I/F)処理部115として機能する。
制御判定部111は、Intelligent Platform Management Bus(IPMB)インタフェースにより取得したCPU12の温度や風量センサ15によって取得された風量等の情報の比較及び判断を実施すると共に、冷却ファン14の制御を行なう。
別言すれば、制御判定部111は、キャリブレーション値DB101(図4の(1)等を用いて後述)と測定値DB102(図4の(2)等を用いて後述)とを比較して、防塵ベゼル16における目詰まり等の異常を判定する判定部の一例である。なお、制御判定部111における処理の詳細は、図4等を用いて後述する。
測定部112は、I2Cインタフェースを介して、風量センサ15を用いた筐体1000内の風量の測定を行なうと共に、CPU12の温度の測定を行なう。
別言すれば、測定部112は、CPU12の温度と、防塵ベゼル16を透過する気流の風量との関係を、測定値DB102として測定する。
記憶部113は、図4を用いて後述するように、キャリブレーション値DB101,測定値DB102,キャリブレーション用パラメータDB103及びユーザ設定パラメータDB104に関する情報を記憶する記憶領域を有する。
別言すれば、記憶部113は、CPU12の温度と冷却ファン14によって発生される気流の風量とを対応付けて登録するキャリブレーション値DB101を記憶する記憶領域を有する。
通知部114は、制御判定部111によって防塵ベゼル16に目詰まり等の異常が発生していると判定された場合に、I/F処理部115を介して異常の発生をユーザに通知する。
I/F処理部115は、BMC11と他の装置との間の通信を制御する。
図4の(1)は、キャリブレーション値DB101を示すテーブルである。
キャリブレーション値DB101は、比較情報の一例であり、CPU12の温度と、冷却ファン14によって発生される気流の風量とを対応付けて登録される。キャリブレーション値DB101には、キャリブレーション番号,CPU温度,風量及び近似処理フラグが登録される。図示するように、キャリブレーション値DB101における各値は、初期状態において全て“0”であってよい。
キャリブレーション番号は、CPU温度と風量との各組み合わせを特定するための番号である。キャリブレーション番号には、#1〜#N(Nは2以上の自然数)の値が登録されてよい。
CPU温度には、CPU12がとり得る温度が登録され、単位は例えば℃であってよい。
風量には、対応するCPU温度が測定されている場合において冷却ファン14によって発生される気流の風量の予測値が登録され、単位は例えば立方フィート毎分(CFM)である。
CPU温度と風量との関係は、過去の実測値に基づいて登録されてよい。ただし、過去に実測されていないCPU温度に対する風量がキャリブレーション値DB101に登録される場合には、近似値フラグに“1”が設定される。
図4の(2)は、測定値DB102を示すテーブルである。
測定値DB102は、CPU12の温度と、防塵ベゼル16を透過する気流の風量との関係を保持する。測定値DB102には、測定番号,CPU温度,風量及び判定結果が登録される。図示するように、測定値DB102における各値は、初期状態において全て“0”であってよい。
測定番号は、CPU温度と風量との各組み合わせを特定するための番号である。測定番号には、#1〜#M(Mは2以上の自然数)の値が登録されてよい。
CPU温度には、測定部112によって測定されたCPU12の温度が登録され、単位は例えば℃であってよい。
風量には、対応するCPU温度が測定されている場合において風量センサ15を用いて測定された風量が登録され、単位は例えば立方フィート毎分(CFM)である。
判定結果には、測定値DB102におけるCPU温度と風量との組み合わせが、キャリブレーション値DB101におけるCPU温度と風量との組み合わせと一致する場合に、“OK”が登録される。一方、判定結果には、測定値DB102におけるCPU温度と風量との組み合わせが、キャリブレーション値DB101におけるCPU温度と風量との組み合わせと一致しない場合に、“NG”が登録される。
制御判定部111は、測定値DB102におけるCPU12の温度が、キャリブレーション値DB101におけるCPU12の温度と一致しない場合に、キャリブレーション値DB101に登録された風量の近似値を算出してよい。そして、制御判定部111は、算出した近似値と測定された風量とを比較して、防塵ベゼル16における異常を判定してよい。
また、制御判定部111は、記憶部113に対して、測定値DB102におけるCPU12の温度における風量として、算出された近似値を、キャリブレーション値DB101に追加して記憶させてよい。
更に、制御判定部111は、キャリブレーション値DB101と測定値DB102との値が一致する回数が、キャリブレーション値DB101と測定値DB102との値が一致しない回数以下である場合に、防塵ベゼル16が異常であると判定してよい。
図4の(3)は、キャリブレーション用パラメータDB103を示すテーブルである。
キャリブレーション用パラメータDB103は、キャリブレーション値DB101に追加で登録したCPU温度を保持する。図示するように、キャリブレーション用パラメータDB103における各値は、初期状態において全て“0”であってよい。
追加パラメータ番号は、追加されたCPU温度を特定するための番号である。追加パラメータ番号には、#1〜#M(Mは2以上の自然数)の値が登録されてよい。
CPU温度には、キャリブレーション値DB101に新たに登録されるCPU12の温度が登録され、単位は例えば℃であってよい。
図4の(4)は、ユーザ設定パラメータDB104を示すテーブルである。
ユーザ設定パラメータDB104は、ユーザによって設定される種々の値を保持する。
温度刻み値は、キャリブレーション値DB101に登録されるCPU温度の間隔を示す。
実測値の重み付けは、第1の重み付け値の一例であり、測定値DB102におけるCPU12の温度が、キャリブレーション値DB101におけるCPU12の温度と一致する場合において使用される値である。
近似値の重み付けは、第2の重み付け値の一例であり、測定値DB102におけるCPU12の温度が、キャリブレーション値DB101におけるCPU12の温度と一致しない場合において使用される値である。
インターンバル時間は、防塵ベゼル16における目詰まり検出処理を実施する間隔を示す。
記憶部113は、測定値DB102におけるCPU12の温度がキャリブレーション値DB101に登録されたCPU12の温度と一致する場合についての実測値の重み付けを記憶する記憶領域を有する。また、記憶部113は、測定値DB102におけるCPU12の温度がキャリブレーション値DB101に登録されたCPU12の温度と一致しない場合についての近似値の重み付けを記憶する記憶領域を有する。そして、制御判定部111は、キャリブレーション値DB101と測定値DB102との値が一致する回数に実測値の重み付け又は近似値の重み付けを乗じた値が、キャリブレーション値DB101と測定値DB102との値が一致しない回数に実測値の重み付け又は近似値の重み付けを乗じた値以下である場合に、防塵ベゼル16が異常であると判定してよい。
〔A−2〕動作例
図2に示した監視対象サーバ1における防塵ベゼル16の目詰まり検出処理を、図10〜図14に示すテーブルを参照しながら、図5〜図9に示すシーケンス図(ステップS1〜S37)に従って説明する。なお、図5にはステップS1〜S8における処理を示し、図6にはステップS9〜S15における処理を示し、図7にはステップS16〜S23における処理を示し、図8にはステップS24〜S30における処理を示し、図9にはステップS31〜S37における処理を示す。
図10は、図4に示したユーザ設定パラメータDB104における登録内容の具体例を示すテーブルである。図11の(1)は図4に示したキャリブレーション値DB101におけるCPU温度の登録例を示すテーブルであり、図11の(2)は図4に示したキャリブレーション値DB101におけるCPU温度及び風量の登録例を示すテーブルである。図12は図4に示した測定値DB102とキャリブレーション値DB101とにおける第1の比較例を示すテーブルであり、図13は図4に示した測定値DB102とキャリブレーション値DB101とにおける第2の比較例を示すテーブルである。図14は図4に示したキャリブレーション用パラメータDB103における登録内容の具体例を示すテーブルである。
図5に示すように、CE4は、監視対象サーバ1の筐体1000に対して、防塵ベゼル16を装着する(図5のステップS1)。
CE4は、監視対象サーバ1の筐体1000において、システムの電源投入(ON)を行なう(図5のステップS2)。
制御判定部111は、図4の(1)及び(2)においてそれぞれ示したように、記憶部113におけるキャリブレーション値DB101及び測定値DB102を初期化する(図5のステップS3)。
制御判定部111は、図4の(3)において示したように、記憶部113におけるキャリブレーション用パラメータDB103を初期化する(図5のステップS4)。
制御判定部111は、図4の(4)において示したように、記憶部113におけるユーザ設定パラメータDB104を初期化する(図5のステップS5)。
制御判定部111は、ユーザ設定パラメータDB104における各種パラメータを設定する(図5のステップS6)。
図10に示す例では、ユーザ設定パラメータDB104において、温度刻み値が“0.5”に設定され、実測値の重み付けが“5”に設定され、近似値の重み付けが“1”に設定され、インターバル時間が“7200秒”に設定されている。
実測値の重み付けを“5”とする場合には、近似値の重み付けは温度刻み値の粒度に応じて“1”〜“4”の値が設定されてよい。
インターバル時間が“7200秒”の場合は、2時間に1回の間隔で、1日12回、防塵ベゼル16の目詰まり検出処理が実施される。例えば、1日12回の目詰まり検出処理のうち半数以上において防塵ベゼル16における目詰まりが発生していないと判定された場合には、所定時間、目詰まり検出処理を実行しなくてもよい。これにより、監視対象サーバ1における負荷を低減できる。
制御判定部111は、記憶部113から、DBの設定完了通知を受信する(図5のステップS7)。
制御判定部111は、キャリブレーション値の設定処理を開始する(図5のステップS8)。
図6に示すように、制御判定部111は、記憶部113において、複数のCPU温度をキャリブレーション値DB101に設定する(図6のステップS9)。
図11の(1)に示す例では、キャリブレーション値DB101には、キャリブレーション番号“#1”〜“#100”が設定されている。そして、キャリブレーション値DB101には、各キャリブレーション番号について、図10に示したユーザ設定パラメータDB104における温度刻み値の“0.5℃”間隔で、CPU温度“40.0℃”〜“90.0℃”が設定されている。
制御判定部111は、記憶部113におけるキャリブレーション値DB101に対して、各CPU温度についてのパラメータ値を問い合わせる(図6のステップS10)。
制御判定部111は、記憶部113におけるキャリブレーション値DB101から、パラメータ値を入手する(図6のステップS11)。
制御判定部111は、冷却ファン14の制御を実施する(図6のステップS12)。
制御判定部111は、変数k(kは0以上且つn以下の自然数)がキャリブレーション値DB101に登録されているキャリブレーション値の数nに達したかを判定する(図6のステップS13)。
変数kがキャリブレーション値の数nに達していな場合には(図6のステップS13のNoルート参照)、CPU温度毎に測定された流量をキャリブレーション値DB101に設定する(図6のステップS14)。そして、制御判定部111は変数kを“1”インクリメントして、処理は図6のステップS13へ戻る。
図11の(2)に示す例では、キャリブレーション値DB101には、キャリブレーション番号及びCPU温度の値に加えて、風量の値が登録される。例えば、キャリブレーション番号“#1”でありCPU温度が“40.0℃”の場合は風量“0.05CFM”が登録され、キャリブレーション番号“#41”でありCPU温度が“60.0℃”の場合は風量“0.11CFM”が登録されている。
一方、変数kがキャリブレーション値の数nに達した場合には(図6のステップS13のYesルート参照)、制御判定部111は、キャリブレーション値DB101におけるキャリブレーション値の設定を終了する(図6のステップS15)。
図7に示すように、制御判定部111は、現在の測定回数jを“0”に初期化する(図7のステップS16)。
制御判定部111は、測定部112に対して、CPU温度及び風量の測定処理を依頼する(図7のステップS17)。
測定部112は、CPU温度及び風量を測定する(図7のステップS18)。
測定部112は、測定回数jが測定回数の最大値mに達したかを判定する(図7のステップS19)。
測定回数jが測定回数の最大値mに達した場合には(図7のステップS19のYesルート参照)、処理は図8のステップS28へ進む。
一方、測定回数jが測定回数の最大値mに達していない場合には(図7のステップS19のNoルート参照)、測定部112は測定したCPU温度及び風量を記憶部113における測定値DB102に格納する(図7のステップS20)。
測定部112は、制御判定部111に対して、測定実施を通知する(図7のステップS21)。そして、処理は図7のステップS19へ戻る。
制御判定部111は、測定部112からの測定実施の通知を受け取ると、記憶部113における測定値DB102に問い合わせる(図7のステップS22)。
制御判定部111は、記憶部113における測定値DB102から測定値を入手する(図7のステップS23)。
図8に示すように、制御判定部111は、測定値DB102におけるCPU温度と一致するCPU温度がキャリブレーション値DB101において存在するかを判定する(図8のステップS24)。
一致するCPU温度がある場合には(図8のステップS24のYesルート参照)、処理は図8のステップS26へ進む。
一方、一致するCPU温度がない場合には(図8のステップS24のNoルート参照)、制御判定部111は、風量の近似値及びCPU温度をキャリブレーション値DB101に設定する(図8のステップS25)。
制御判定部111は、キャリブレーション値DB101における風量と測定値DB102における風量との比較処理を実施する(図8のステップS26)。そして、処理は図7のステップS17へ戻る。
図12の(1)に示す例において、測定値DB102では、測定番号“#1”でありCPU温度“60.0℃”である場合に、風量は“0.15CFM”である(符号A1参照)。一方、図12の(2)に示す例において、キャリブレーション値DB101では、測定番号“#41”でありCPU温度“60.0℃”である場合に、風量は“0.11CFM”である(符号A2参照)。このように、同一のCPU温度において測定値DB102の風量とキャリブレーション値DB101の風量とが一致しないため、測定値DB102の測定番号“#1”における判定結果には“NG”が登録される。
図13の(1)に示す例において、測定値DB102では、測定番号“#2”のCPU温度は“69.7℃”である(符号B1参照)。一方、図11の(2)に示した例において、キャリブレーション値DB101では、CPU温度が“69.7℃”の場合のキャリブレーション値は存在しなかった。そこで、図13の(2)に示すように、キャリブレーション番号“#61”において、CPU温度“69.7℃”である場合の風量の近似値“0.13CFM”が登録される(符号B2参照)。また、キャリブレーション番号“#61”は近似処理によって追加されたキャリブレーション値であるため、近似処理フラグに“1”が設定されている。更に、図11の(2)におけるキャリブレーション番号“#61”〜“#100”は、図13の(2)に示す例においてキャリブレーション番号“#62”〜“#101”に更新される。
また、図13の(1)及び(2)に示す例では、同一のCPU温度において測定値DB102の風量とキャリブレーション値DB101の風量とが一致するため、測定値DB102の測定番号“#2”における判定結果には“OK”が登録される。
なお、図8のステップS26における風量比較処理の詳細は、図15におけるフローチャートを用いて後述する。
制御判定部111は、記憶部113における測定値DB102に、風量比較処理における判定結果を格納する(図8のステップS27)。
測定部112は、制御判定部111に対して、測定終了を通知する(図8のステップS28)。
制御判定部111は、測定部112からの測定終了の通知を受け取ると、記憶部113における測定値DB102に問い合わせる(図8のステップS29)。
制御判定部111は、記憶部113における測定値DB102から判定結果を入手する(図8のステップS30)。
図9に示すように、制御判定部111は、防塵ベゼル16の交換が必要であるかを、図8のステップS26に示した風量比較処理の結果に基づき、総合的に判定する(図9のステップS31)。なお、図9のステップS31におけるベゼル交換要否判定の詳細は、図16のフローチャートを用いて後述する。
防塵ベゼル16の交換が不要である場合には(図9のステップS31のNoルート参照)、処理は図7のステップS16へ戻る。
一方、防塵ベゼル16の交換が必要である場合には(図9のステップS31のYesルート参照)、制御判定部111は、通知部114に対して、防塵ベゼル16における塵や埃等の堆積を通知する(図9のステップS32)。
通知部114は、I/F処理部115を介して、CE4に防塵ベゼル16における塵や埃の堆積を通知する。そして、CE4は、防塵ベゼル16における塵や埃の堆積通知を受け取る(図9のステップS33)。
CE4は、監視対象サーバ1の筐体1000において、システム電源切断(OFF)の操作を行なう(図9のステップS34)。
CE4は、監視対象サーバ1の筐体1000において、防塵ベゼル16を交換する(図9のステップS35)。
CE4は、監視対象サーバ1の筐体1000において、システム電源投入(ON)の操作を行なう(図9のステップS36)。
制御判定部111は、記憶部113において、キャリブレーション用パラメータDB103を初期化し、風量の近似値が算出されたCPU温度についての風量の実測値を、キャリブレーション値DB101におけるパラメータ値として設定する(図9のステップS37)。そして、処理は図6のステップS10へ戻る。
図14に示す例において、キャリブレーション用パラメータDB103には、追加パラメータ番号“#1”において、CPU温度“69.7℃”が登録されている。そこで、キャリブレーション値DB101には、CPU温度“69.7℃”における風量の実測値がパラメータ値として追加される。
次に、図8のステップS26に示した風量比較処理の詳細を、図15の(1)及び(2)に示すフローチャート(ステップS261〜S263及びS266〜S269)に従って説明する。
図15の(1)は、キャリブレーション値DB101におけるCPU温度と測定値DB102におけるCPU温度とが一致する場合における風量比較処理の詳細(ステップS261〜S263)を示す。また、図15の(2)は、キャリブレーション値DB101におけるCPU温度と測定値DB102におけるCPU温度とが一致しない場合における風量比較処理の詳細(ステップS266〜S269)を示す。
図15の(1)に示すように、制御判定部111は、キャリブレーション値DB101における風量(A)と測定値DB102における風量(B)とを比較する(図15の(1)のステップS261)。
キャリブレーション値DB101における風量(A)と測定値DB102における風量(B)とが等しい場合には(図15の(1)の“(A)=(B)”ルート参照)、処理は図15の(1)のステップS262へ進む。すなわち、制御判定部111は、記憶部113において、測定値DB102の判定結果に“OK”判定を登録する(図15の(1)のステップS262)。そして、風量比較処理は終了する。
一方、キャリブレーション値DB101における風量(A)が測定値DB102における風量(B)未満である場合には(図15の(1)の“(A)<(B)”ルート参照)、処理は図15の(1)のステップS263へ進む。すなわち、制御判定部111は、記憶部113において、測定値DB102の判定結果に“NG”判定を登録する(図15の(1)のステップS263)。そして、風量比較処理は終了する。
図15の(2)に示すように、制御判定部111は、キャリブレーション値DB101における各キャリブレーション値を線形近似し、測定されたCPU温度に対応する近似風量を算出する(図15の(2)のステップS266)。
制御判定部111は、近似風量(A)と測定値DB102における風量(B)とを比較する(図15の(2)のステップS267)。
近似風量(A)と測定値DB102における風量(B)とが等しい場合には(図15の(2)の“(A)=(B)”ルート参照)、処理は図15の(2)のステップS268へ進む。すなわち、制御判定部111は、記憶部113において、測定値DB102の判定結果に“OK”判定を登録する(図15の(2)のステップS268)。そして、風量比較処理は終了する。
一方、近似風量(A)が測定値DB102における風量(B)未満である場合には(図15の(2)の“(A)<(B)”ルート参照)、処理は図15の(2)のステップS269へ進む。すなわち、制御判定部111は、記憶部113において、測定値DB102の判定結果に“NG”判定を登録する(図15の(2)のステップS269)。そして、風量比較処理は終了する。
次に、図9のステップS31に示したベゼル交換要否判定の詳細を、図16に示すテーブル及びフローチャート(符号C1〜C4及びS311〜S313)に従って説明する。
符号C1で示すテーブルにおいては、判定番号と判定結果と重み付けスコアとが対応付けられている。例えば、判定番号“#1”における判定結果は“OK”で重み付けスコアは“5”であり、判定番号“#2”における判定結果は“NG”で重み付けスコアは“1”である。図10におけるユーザ設定パラメータDB104に示したように、重み付けスコア“5”は実測値の重み付けであり、重み付けスコア“1”は近似値の重み付けであってよい。
符号C2で示すように、制御判定部111は、判定結果と重み付けスコアとの対応付けに基づき、OK判定及びNG判定の総スコアを算出する。
符号C3で示すように、OK判定及びNG判定の総スコアは、例えば、次式によって求められる。
OK判定の総スコア=重み付けスコアα×スコアαのOK数+重み付けスコアβ×スコアβのOK数
NG判定の総スコア=重み付けスコアα×スコアαのNG数+重み付けスコアβ×スコアβのNG数
例えば、重み付けスコアαは実測値の重み付けであってよく、重み付けスコアβは近似値の重み付けであってよい。なお、重み付けスコアが3つ以上存在する場合には、OK判定の総スコアにおいて、3つ目以降の重み付けスコアと当該スコアのOK数との積が更に足し合わされてよい。また、重み付けスコアが3つ以上存在する場合には、NG判定の総スコアにおいても、3つ目以降の重み付けスコアと当該スコアのNG数との積が更に足し合わされてよい。
符号C1に示したテーブルを符号C3に示す数式に適用すると、OK判定及びNG判定の総スコアは、次式のように算出される。
OK判定の総スコア=5×2+1×1=11
NG判定の総スコア=5×1+1×1=6
そして、符号C4に示すように、制御判定部111は、算出したOK判定及びNG判定の総スコアに基づき、最終判定を実施する。
すなわち、制御判定部111は、OK判定の総スコア(A)とNG判定の総スコア(B)とを比較する(ステップS311)。
OK判定の総スコア(A)がNG判定の総スコア(B)よりも大きい場合には(ステップS311の“(A)>(B)”ルート参照)、制御判定部111は、防塵ベゼル16の交換は不要であると判定する(ステップS312)。そして、ベゼル交換要否判定は終了する。
一方、OK判定の総スコア(A)がNG判定の総スコア(B)以下の場合には(ステップS311の“(A)≦(B)”ルート参照)、制御判定部111は、防塵ベゼル16の交換は必要であると判定する(ステップS313)。そして、ベゼル交換要否判定は終了する。
〔A−3〕効果
上述した第1実施形態の一例における監視対象サーバ1によれば、例えば、以下の作用効果を奏することができる。
記憶部113は、CPU12の温度と、冷却ファン14によって発生される気流の風量との予測される関係を、キャリブレーション値DB101として記憶する。測定部112は、CPU12の温度と、防塵ベゼル16を透過する気流の風量との関係を、測定値DB102として測定する。制御判定部111は、キャリブレーション値DB101と測定値DB102とを比較して、防塵ベゼル16における異常を判定する。
これにより、防塵ベゼル16における異常の判定を正確に行なうことができる。具体的には、監視対象サーバ1のCPU12の温度を一定に保たなくても(別言すれば、監視対象サーバ1の状態によらず)、防塵ベゼル16に対する塵や埃の堆積により目詰まりを検出できる。
制御判定部111は、測定値DB102におけるCPU12の温度が、キャリブレーション値DB101におけるCPU12の温度と一致しない場合に、キャリブレーション値DB101における風量の近似値を算出する。そして、制御判定部111は、算出した当該近似値と測定された風量とを比較して、防塵ベゼル16における異常を判定する。
これにより、測定されたCPU温度がキャリブレーション値DB101に登録されていない場合においても、測定された風量が適切であるかを判定することができる。
記憶部113は、測定値DB102におけるCPU12の温度と、制御判定部111によって算出された近似値との関係を、キャリブレーション値DB101に追加して記憶する。
これにより、次回の測定において該当するCPU温度に対応する風量の近似値の算出を省略でき、防塵ベゼル16の目詰まり検出処理の速度を向上できる。
制御判定部111は、キャリブレーション値DB101と測定値DB102とが一致する回数が、キャリブレーション値DB101と測定値DB102とが一致しない回数以下である場合に、防塵ベゼル16が異常であると判定する。
これにより、複数回の風量の比較によって防塵ベゼル16おける目詰まりの発生を検出するため、検出精度を向上することができる。
記憶部113は、測定値DB102におけるCPU12の温度がキャリブレーション値DB101におけるCPU12の温度と一致する場合についての実測値の重み付けを記憶する。また、記憶部113は、測定値DB102におけるCPU12の温度がキャリブレーション値DB101におけるCPU12の温度と一致しない場合についての近似値の重み付けを記憶する。制御判定部111は、キャリブレーション値DB101と測定値DB102とが一致する回数に実測値又は近似値の重み付けを乗じた値が、キャリブレーション値DB101と測定値DB102とが一致しない回数に実測値又は近似値の重み付けを乗じた値以下である場合に、防塵ベゼル16が異常であると判定する。
これにより、風量の実測値に基づいた防塵ベゼル16の状態についての判定結果と、風量の近似値に基づいた防塵ベゼル16の状態についての判定結果とに対して、それぞれ異なる重み付け値を適用して、防塵ベゼル16の交換要否を総合的に判定できる。よって、防塵ベゼル16おける目詰まりの発生の検出精度を向上できる。
〔B〕第2実施形態の一例
〔B−1〕システム構成例
1サイクルのスコアリングによる総合判定により、埃未検出と判定され、且つ、埃検知のスコアリングと埃未検知のスコアリングとが接近している場合(別言すれば、間もなく埃検知と判断されるタイミング)がある。上述した第1実施形態の一例では、このような場合において、途中で埃検知と判断できるタイミングがあったとしても、次のサイクルで1サイクル所定回数分の測定処理を行なわなければならず、埃検知をタイムリーに判定できない可能性がある。
また、上述した第1実施形態の一例では、監視対象サーバ1のパワーONの際にキャリブレーション処理を実施後、当該監視対象サーバ1の周辺環境が変化していないことを想定している。そのため、キャリブレーション処理後に、ユーザが意図せずに監視対象サーバ1の周辺環境が変化すると、埃を測定するための基準も変化するため、適切に埃を検知できなくなる可能性がある。
ラック構成等の複数の監視対象サーバ1が備えられる環境において上述した実施形態の一例における技術を適用する場合には、サーバルーム内に設置されたシステムFANが制御されたり、ラック内の監視対象サーバ1の挿抜が行なわれたりすることがある。このような場合には、監視対象サーバ1の周辺環境が変化するため、適切に埃を検知できない可能性がある。
更に、埃の測定の際に他の保守作業が並行して行なわれる場合には、防塵ベゼル16の交換のタイミングと他の保守作業のタイミングとが相違すると、保守作業全体として効率的なオペレーションを行なえない可能性がある。
図17は、第2実施形態の一例としての情報処理システム200の構成を模式的に示すブロック図である。
情報処理システム200においては、上述した第1実施形態の一例と同様の構成を有する複数の監視対象サーバ1がサーバラック2000に搭載される。監視対象サーバ1のBMC11は、監視対象サーバ1の防塵ベゼル16(図2を用いて前述)の近傍に設置された風量センサ15(図2を用いて前述)による風量と、温度センサ(不図示)によるCPU温度とを監視する。
BMC10は、図3を用いて前述したように、例示的に、制御判定部111,測定部112,記憶部113,通知部114及びI/F処理部115として機能する。
本第2実施形態の一例において、制御判定部111は、比較により一致する回数に第1又は第2の重み付け値を乗じた値が、比較により一致しない回数に第1又は第2の重み付け値と第3の重み付け値とを乗じた値以下である場合に、防塵ベゼル16が異常であると判定する。なお、第1の重み付け値は実測値の重み付けであり、第2の重み付け値は近似値の重み付けであり、第3の重み付け値は保守作業要因の重み付けであってよい。第1〜第3の重み付け値を用いた防塵ベゼル16の交換の要否判定の詳細については、図30等を用いて後述する。
制御判定部111は、直近に所定回数行なった比較について、比較により一致する回数が、比較により一致しない回数以下である場合に、防塵ベゼル16が異常であると判定する。
制御判定部111は、キャリブレーション値DB101(図19等を用いて後述)において記憶されている風量と測定部112によって測定された風量との差分の変化割合が許容範囲を超えている場合に、周囲環境の変化を検出する。なお、周囲環境の変化を検出処理の詳細については、図29等を用いて後述する。
記憶部113は、監視対象サーバ1において保守作業が実施される場合についての保守作業要因の重み付け(別言すれば、第3の重み付け値)を記憶領域に記憶する。また、記憶部113は、監視対象サーバ1の周囲環境の変化が検出された場合に、記憶領域において記憶しているキャリブレーション値DB101を更新する。
情報処理システム200において、管理サーバ/モバイル端末2aは、上述した第1実施形態の一例における管理サーバ/モバイル端末2の構成に加えて、監視対象サーバ1を監視するための運用管理Software(SW)21がインストールされる。なお、以下において、管理サーバ/モバイル端末2aは、単に、管理サーバ2aと称する。
監視対象サーバ1及び管理サーバ2aは、LANスイッチ5を介して管理端末3と接続されてよい。
図18は、図17に示した管理サーバ2aの機能構成を模式的に示す図である。
管理サーバ2aには、運用管理SW21がダウンロードされる。運用管理SW21は、機器情報管理部211,モニタリング部212及びI/F処理部213として機能する。
機器情報管理部211は、監視対象サーバ1等における管理対象機器情報(例えば、モデル名やシリアル番号,Internet Protocol(IP)アドレス)の登録及び管理を行なう。
モニタリング部212は、各種イベントの監視を行なう。各種イベントは、例えば、各機器から通知されるSNMPトラップと、各機器のステータス変更通知と、各機器から取得する吸気温度,CPU使用率及び消費電力等のチェックとである。
I/F処理部213は、LANを用いて、監視対象サーバ1や管理端末3との通信を行なう。
図19の(1)は、キャリブレーション値DB101を示すテーブルである。
キャリブレーション値DB101は、比較情報の一例であり、CPU12の温度と、冷却ファン14によって発生される気流の風量とを対応付けて登録される。キャリブレーション値DB101には、上述した第1実施形態の一例と同様に、キャリブレーション番号,CPU温度D1(a),風量D2(a)及び近似処理フラグD3(a)が登録される。図示するように、キャリブレーション値DB101における各値は、初期状態において全て“0”であってよい。
図19の(2)は、測定値DB102aを示すテーブルである。
測定値DB102aは、CPU12の温度と、防塵ベゼル16を透過する気流の風量との関係を保持する。測定値DB102aには、上述した第1実施形態の一例の測定値DB102における測定番号,CPU温度D1(b),風量D2(b)及び判定結果D4(b)に加えて、保守作業要因D3(b)が登録される。図示するように、測定値DB102aにおける各値は、初期状態において全て“0”であってよい。
保守作業要因D3(b)には、監視対象サーバ1のハードウェア故障等の保守作業を必要とする事象が発生した場合に“1”に設定される。
図19の(3)は、キャリブレーション用パラメータDB103を示すテーブルである。
キャリブレーション用パラメータDB103は、上述した第1実施形態の一例と同様に、キャリブレーション値DB101に追加で登録したCPU温度D1(c)を保持する。図示するように、キャリブレーション用パラメータDB103における各値は、初期状態において全て“0”であってよい。
図19の(4)は、ユーザ設定パラメータDB104aを示すテーブルである。
ユーザ設定パラメータDB104aは、ユーザによって設定される種々の値を保持する。ユーザ設定パラメータDB104aには、上述した第1実施形態の一例におけるユーザ設定パラメータDB104と同様に、温度刻み値D1(d),実測値の重み付けD2(d),近似値の重み付けD3(d)及びインターバル時間D5(d)が登録される。また、ユーザ設定パラメータDB104aには、上述した第1実施形態の一例におけるユーザ設定パラメータDB104の各値に加えて、保守作業要因の重み付けD4(d),差分の許容範囲D6(d)及び差分変化割合の許容範囲D7(d)が登録される。図示するように、ユーザ設定パラメータDB104aにおける各値は、初期状態において全て“0”であってよい。
保守作業要因の重み付けD4(d)は、第3の重み付け値の一例であり、保守作業を必要とする事象が発生していて、測定値DB102aにおいて保守作業要因D3(b)の値が“1”に設定されている場合において使用される値である。
差分の許容範囲D6(d)は、キャリブレーション値DB101における風量D2(a)と、測定値DB102aにおける風量D2(b)とにおける、差分の許容範囲を示す。
差分変化割合の許容範囲D7(d)は、キャリブレーション値DB101における風量D2(a)と、測定値DB102aにおける風量D2(b)とにおける、前回測定時と今回測定時との差分の変化割合の許容範囲を示す。
図20は、図17に示した監視対象サーバ1における差分DB105を示すテーブルである。
差分DB105は、キャリブレーション値と測定値との間の差分を示す。差分DB105には、測定番号,CPU温度D1(e),差分D2(e)及び差分の変化割合D3(e)が登録される。図示するように、差分DB105における各値は、初期状態において全て“0”であってよい。
測定番号は、キャリブレーション値と測定値との各組み合わせを特定するための番号である。測定番号には、#1〜#M(Mは2以上の自然数)の値が登録されてよい。
CPU温度D1(e)には、測定値DB102aに登録されているCPU12の温度が登録され、単位は例えば℃であってよい。
差分D2(e)には、キャリブレーション値DB101の風量D2(a)と、測定値DB102aの風量D2(b)との差分の割合が登録され、単位は例えば%であってよい。
差分の変化割合D3(e)には、キャリブレーション値DB101の風量D2(a)と、測定値DB102aの風量D2(b)との前回測定時からの差分の変化割合が登録され、単位は例えば%であってよい。
〔B−2〕動作例
上述した第2実施形態の一例の監視対象サーバ1における防塵ベゼル16(図2を参照)の目詰まり検出処理を、図21〜図28に示すシーケンス図(ステップS41〜S87)に従って説明する。なお、図21にはステップS41〜S49における処理を示し、図22にはステップS50〜S53における処理を示し、図23にはステップS54〜S59における処理を示し、図24にはステップS60〜S66における処理を示す。また、図25にはステップS67〜S70における処理を示し、図26にはステップS71〜S74における処理を示し、図27にはステップS75〜S82における処理を示し、図28にはステップS83〜S87における処理を示す。
図21に示すように、CE4は、監視対象サーバ1の筐体1000に対して、防塵ベゼル16を装着する(図21のステップS41)。
CE42は、監視対象サーバ1の筐体1000において、システムの電源投入(ON)を行なう(図21のステップS42)。
ここで、CE4は、監視対象サーバ1の周辺環境を変化させる(図21のステップS43)。
これにより、管理サーバ2aの運用管理SW21における機器情報管理部211は、サーバラック2000内のサーバ搭載情報を更新する(図21のステップS44)。
機器情報管理部211は、監視対象サーバ1に対して、再キャリブレーションを依頼する(図21のステップS45)。なお、再キャリブレーションの依頼は、管理サーバ2aの運用管理SW21におけるI/F処理部213と、監視対象サーバ1のBMC10におけるI/F処理部115とを介して、BMC10の制御判定部111に対して発行される。
制御判定部111は、図19の(1)及び(2)においてそれぞれ示したように、記憶部113におけるキャリブレーション値DB101及び測定値DB102aを初期化する(図21のステップS46)。
例えば、測定値DB102aにおいては、1日につき12回分の測定処理が可能なように設定されてよい。
制御判定部111は、図19の(3)において示したように、記憶部113におけるキャリブレーション用パラメータDB103を初期化する(図21のステップS47)。
例えば、キャリブレーション用パラメータDB103には、IPMBインタフェース機能を介し、キャリブレーションの温度刻み値D1(d)に基づく各監視対象サーバ1のCPU温度D1(c)が例えば40.0, 40.5, …, 89.5, 90.0℃に設定されてよい。温度の刻み幅D1(d)は、MBC10の測定可能な単位で任意の値とし、温度の上下限値(例えば室温〜90.0℃)については、実装するCPU12(図2を用いて前述)の仕様により、一意に決定されてよい。
制御判定部111は、図19の(4)において示したように、記憶部113におけるユーザ設定パラメータDB104aを初期化する(図21のステップS48)。
例えば、ユーザ設定パラメータDB104aにおいて、温度刻み値D1(d)が“0.5”に設定され、実測値の重み付けD2(d)が“5”に設定され、近似値の重み付けD3(d)が“1”に設定され、保守作業要因の重み付けD4(d)が“4”に設定され、インターバル時間が“2時間”に設定されてよい。
制御判定部111は、キャリブレーション値DB101における風量D2(a)と測定値DB102aにおける風量D2(b)との差分を算出して、記憶部113に格納する(図21のステップS49)。
図22に示すように、記憶部113は、CE4からの入力に基づき、ユーザ設定パラメータDB104aにおける各種パラメータの設定を受け付ける(図22のステップS50)。
制御判定部111は、記憶部113から、DBの設定完了通知を受信する(図22のステップS51)。
制御判定部111は、キャリブレーション値の設定処理を開始する(図22のステップS52)。
制御判定部111は、記憶部113において、CPU温度D1(c)をFAN制御のパラメータとして、キャリブレーション用パラメータDB103に複数設定する(図22のステップS53)。
図23に示すように、制御判定部111は、記憶部113におけるキャリブレーション用パラメータDB103に対して、各CPU温度D1(c)についてのパラメータ値を問い合わせる(図23のステップS54)。
制御判定部111は、記憶部113におけるキャリブレーション用パラメータDB103から、パラメータ値を入手する(図23のステップS55)。
制御判定部111は、冷却ファン14の制御(FAN制御)を実施する(図23のステップS56)。
制御判定部111は、変数k(kは0以上且つn以下の自然数)がキャリブレーション用パラメータDB103に登録されているパラメータ値の数nに達したかを判定する(図23のステップS57)。
変数kがキャリブレーション値の数nに達していな場合には(図23のステップS57のNoルート参照)、CPU温度D1(a)毎に測定された風量D2(a)がキャリブレーション値DB101に設定する(図23のステップS58)。そして、制御判定部111は変数kを“1”インクリメントして、処理は図23のステップS57へ戻る。
キャリブレーション用パラメータDB103のCPU温度(例えば、40.0, 40.5, …, 89.5, 90.0℃)に基づき、BMC10のIPBMインタフェースを介して、各CPU温度D1(a)におけるキャリブレーションが実施される。そして、CPU温度D1(a)毎の風量D2(a)(例えば、CPU温度60.0℃に対して風量値0.11(m3/min))がキャリブレーション値DB101に設定される。
一方、変数kがキャリブレーション値の数nに達した場合には(図23のステップS57のYesルート参照)、制御判定部111は、キャリブレーション値DB101におけるキャリブレーション値の設定を終了する(図23のステップS59)。
ここで、図24に示すように、BMC10の通知部114は、保守作業を必要とする事象の発生を管理サーバ2aに対して通知する(図24のステップS60)。なお、管理サーバ2aに対する通知は、BMC10のI/F処理部115と運用管理SW21のI/F処理部213とを介して、運用管理SW21のモニタリング部212に対して行なわれる。
運用管理SW21のモニタリング部212は、保守作業を必要とする事象の発生をCE4に対して通知する(図24のステップS61)。
一方、BMC10の記憶部113は、通知部114による通知に基づき、測定値DB102に保守作業要因D3(b)を設定する(図24のステップS62)。
制御判定部111は、測定部112に対して、CPU温度D1(b)及び風量D2(b)の測定処理を依頼する(図24のステップS63)。測定処理の依頼は、ユーザ設定パラメータDB104aのインターバル時間D5(d)に基づいて行なわれる。
測定部112は、CPU温度及び風量を測定する(図24のステップS64)。CPU温度及び風量の測定は、IPMBインタフェース機能を用いて実行されてよい。
測定部112は、CPU温度D1(b)を測定値DB102aに格納する(図24のステップS65)。
測定部112は、制御判定部111に対して、測定実施を通知する(図24のステップS66)。
図25に示すように、制御判定部111は、記憶部113に対して、測定値DB102aにおける測定値を問い合わせる(図25のステップS67)。
制御判定部111は、記憶部113から測定値を入手する(図25のステップS68)。
制御判定部111は、測定値DB102aのCPU温度D1(b)と一致するキャリブレーション値DB101のCPU温度D1(a)が存在するかを判定する(図25のステップS69)。
一致するCPU温度がある場合には(図25のステップS69のYesルート参照)、処理は図26のステップS71へ進む。
一方、一致するCPU温度がない場合には(図25のステップS69のNoルート参照)、制御判定部111は、風量の近似値及びCPU温度をキャリブレーション値DB101に設定する(図25のステップS70)。
図26に示すように、制御判定部111は、測定値DB102aにおける風量D2(b)がキャリブレーション値DB101における風量D2(a)よりも大きいかを判定する(図26のステップS71)。
測定値の風量D2(b)がキャリブレーション値の風量D2(a)よりも大きい場合には(図26のステップS71のYesルート参照)、処理は図21のステップS46へ戻って再キャリブレーションが実施される。
例えば、測定したCPU温度が60.0℃で、測定した風量D2(b)が0.17m3/minであるのに対し、キャリブレーション値の風量D2(a)が0.15m3/minである場合について検討する。この場合には、BMC−CPU機能を介して風量D2(b)と風量D2(a)とが比較され、風量D2(b)が風量D2(a)よりも大きいため、周辺環境が変化したと判断される。そして、監視対象サーバ1の埃検知処理が終了され、再キャリブレーションが実施される。
一方、測定値の風量D2(b)がキャリブレーション値の風量D2(a)以下である場合には(図26のステップS71のNoルート参照)、記憶部113は、測定値の風量D2(b)とキャリブレーション値の風量D2(a)との差分D2(e)を差分DB105に格納する(図26のステップS72)。
例えば、測定したCPU温度が60.0℃で、測定した風量D2(b)が0.15m3/minであるのに対し、キャリブレーション値の風量D2(a)が0.15m3/minである場合について検討する。この場合には、BMC−CPU機能を介して風量D2(b)と風量D2(a)とが比較され、風量D2(b)が風量D2(a)と一致するため、周辺環境が変化していないと判断される。そして、監視対象サーバ1の埃検知処理が継続される。
また、例えば、測定したCPU温度が60.0℃で、測定した風量D2(b)が0.13m3/minであるのに対し、キャリブレーション値の風量D2(a)が0.15m3/minである場合について検討する。この場合には、BMC−CPU機能を介して風量D2(b)と風量D2(a)とが比較され、風量D2(b)が風量D2(a)よりも小さいため、周辺環境が変化していないと判断される。そして、監視対象サーバ1の埃検知処理が継続されると共に、前回測定時と今回測定時とにおける風量の測定値とキャリブレーション値との差分の変化量D3(e)(例えば、10%)が差分DB105に格納される。
なお、サーバラック2000内の監視対象サーバ1の挿抜が行なわれる場合には、図21のステップS41〜S43に示したように、管理サーバ2aからイベントが受信される。そして、監視対象サーバ1の埃検知処理が終了され、再キャリブレーションが実施される。
記憶部113は、差分の変化割合D3(e)を差分DB105に格納する(図26のステップS73)。
制御判定部111は、差分DB105における差分の変化割合D3(e)がユーザ設定パラメータDB104aにおける差分変化割合の許容範囲D7(d)内であるかを判定する(図26のステップS74)。
差分の変化割合D3(e)が差分変化割合の許容範囲D7(d)内でない場合には(図26のステップS74のNoルート参照)、処理は図21のステップS46へ戻って再キャリブレーションが実施される。
例えば、前回測定した風量の測定値とキャリブレーション値との差分が10%であり、今回測定した風量の測定値とキャリブレーション値との差分が20%であり、差分の変化割合の許容範囲D7(d)が5%である場合について検討する。この場合には、前回測定と今回測定との差分の変化量(20-10=10%)が差分の変化割合の許容範囲D7(d)である5%を超えるため、監視対象サーバ1の埃検知処理が終了され、再キャリブレーションが実施される。
一方、差分の変化割合D3(e)が差分変化割合の許容範囲D7(d)内である場合には(図26のステップS74のYesルート参照)、処理は図27のステップS75へ進む。
例えば、前回測定した風量の測定値とキャリブレーション値との差分が10%であり、今回測定した風量の測定値とキャリブレーション値との差分が20%であり、差分の変化割合の許容範囲D7(d)が20%である場合について検討する。この場合には、前回測定と今回測定との差分の変化量(20-10=10%)が差分の変化割合の許容範囲D7(d)である20%以下であるため、監視対象サーバ1の埃検知処理が継続される。
また、例えば、前回測定した風量の測定値とキャリブレーション値との差分が10%であり、今回測定した風量の測定値とキャリブレーション値との差分が20%であり、差分の変化割合の許容範囲D7(d)が10%である場合について検討する。この場合には、前回測定と今回測定との差分の変化量(20-10=10%)が差分の変化割合の許容範囲D7(d)である10%以下であるため、監視対象サーバ1の埃検知処理が継続される。
図27に示すように、制御判定部111は、キャリブレーション値DB101における風量と測定値DB102における風量との比較処理を実施する(図27のステップS75)。なお、風量比較処理の詳細については、図29を用いて後述する。
測定部112は、測定値DB102aに判定結果D4(b)を格納する(図27のステップS76)。
制御判定部111は、現在の測定回数jが所定の測定回数m未満であるかを判定する(図27のステップS77)。
現在の測定回数jが所定の測定回数m未満である場合には(図27のステップS77のYesルート参照)、処理は図24のステップS63へ戻り、CPU温度及び風量の測定が繰り返される。すなわち、所定の測定回数m(例えば、1日につき12回)、測定処理及び風量比較処理が繰り返し実施される。
一方、現在の測定回数jが所定の測定回数m以上である場合には(図27のステップS77のNoルート参照)、制御判定部111は、測定値DB102aに測定値を問い合わせる(図27のステップS78)。
制御判定部111は、測定値DB102aにおける直近m回分の判定結果D4(b)を入手する(図27のステップS79)。
制御判定部111は、判定結果D4(b)を集約して、総合的に防塵ベゼル16(図2を用いて前述)の交換が必要であるかを判定する(図27のステップS80)。なお、ベゼル交換要否判定の詳細については、図30を用いて後述する。
防塵ベゼル16の交換が不要である場合には(図27のステップS80のNoルート参照)、処理は図24のステップS63へ戻り、CPU温度及び風量の測定が繰り返される。
一方、防塵ベゼル16の交換が必要である場合には(図27のステップS80のYesルート参照)、制御判定部111は、管理サーバ2aに対して、埃の堆積を通知する(図27のステップS81)。埃の堆積の通知は、BMC10の通知部114及びI/F処理部115と運用管理SW21のI/F処理部213とを介して、運用管理SW21のモニタリング部212に対して行なわれる。
運用管理SW21のモニタリング部212は、埃の堆積通知を受信し(図27のステップS82)、埃の堆積通知の受信をCE4へ知らせる。
図28に示すように、CE4は、監視対象サーバ1の筐体1000において、システム電源切断(OFF)の操作を行なう(図28のステップS83)。
CE4は、監視対象サーバ1の筐体1000において、防塵ベゼル16を交換する(図28のステップS84)。
CE4は、防塵ベゼル16の交換以外の監視対象サーバ1の保守作業を実施する(図28のステップS85)。
CE4は、監視対象サーバ1の筐体1000において、システム電源投入(ON)の操作を行なう(図28のステップS86)。
制御判定部111は、記憶部113において、キャリブレーション用パラメータDB103を初期化し、風量の近似値が算出されたCPU温度D1(a)についての風量D2(a)の実測値を、キャリブレーション値DB101におけるパラメータ値として設定する(図28のステップS87)。そして、処理は図23のステップS54へ戻る。
次に、図27のステップS75に示した風量比較処理の詳細を、図29に示すフローチャート(ステップS751〜S753)に従って説明する。
制御判定部111は、キャリブレーションの風量と測定値の風量との差分D2(e)が許容範囲D6(d)内であるかを判定する(ステップS751)。
差分D2(e)が許容範囲D6(d)内である場合には(ステップS751のYesルート参照)、制御判定部111は、記憶部113において、測定値DB102aの判定結果に“OK”判定を登録する(ステップS752)。そして、風量比較処理は終了する。
例えば、測定した風量D2(b)が0.14m3/minであるのに対し、キャリブレーション値の風量D2(a)が0.15m3/minであり、差分の許容範囲D6(d)が10%である場合について検討する。この場合には、実測値とキャリブレーション値との差分D2(e)=(0.15-0.14)/0.15=6.7%が差分の許容範囲D6(d)である10%以下であるため、防塵ベゼル16に埃が堆積していないと判定される。
一方、差分D2(e)が許容範囲D6(d)内でない場合には(ステップS751のNoルート参照)、制御判定部111は、記憶部113において、測定値DB102aの判定結果に“NG”判定を登録する(ステップS753)。そして、風量比較処理は終了する。
例えば、測定した風量D2(b)が0.14m3/minであるのに対し、キャリブレーション値の風量D2(a)が0.15m3/minであり、差分の許容範囲D6(d)が5%である場合について検討する。この場合には、実測値とキャリブレーション値との差分D2(e)=(0.15-0.14)/0.15=6.7%が差分の許容範囲D6(d)である5%を超えているため、防塵ベゼル16に埃が堆積していると判定される。
次に、図27のステップS80に示したベゼル交換要否判定の詳細を、図30に示すテーブル及びフローチャート(符号D1〜D4及びS801〜S803)に従って説明する。
符号D1で示すテーブルにおいては、判定番号と判定結果と保守作業要因の重み付けと重み付けスコアとが対応付けられている。例えば、判定番号“#1”における判定結果は“OK”で重み付けスコアは“5”であり、判定番号“#2”における判定結果は“NG”で重み付けスコアは“1”であり、判定番号“#6”における判定結果は“NG”で保守作業要因の重み付けは“2”である。なお、重み付けスコア“5”は実測値の重み付けであり、重み付けスコア“1”は近似値の重み付けであってよい。
符号D2で示すように、制御判定部111は、判定結果と保守作業要因の重み付けと重み付けスコアとの対応付けに基づき、OK判定及びNG判定の総スコアを算出する。
符号D3で示すように、OK判定及びNG判定の総スコアは、例えば、次式によって求められる。
OK判定の総スコア=重み付けスコアα×スコアαのOK数+重み付けスコアβ×スコアβのOK数+・・・
NG判定の総スコア=重み付けスコアα×スコアαのNG数+重み付けスコアβ×スコアβのNG数+・・・+重み付けスコアγ×スコアγのNG数×保守作業要因の重み付け
例えば、重み付けスコアα及びγは実測値の重み付けであってよく、重み付けスコアβは近似値の重み付けであってよい。
符号D1に示したテーブルを符号D3に示す数式に適用すると、OK判定及びNG判定の総スコアは、次式のように算出される。
OK判定の総スコア=5×2+1×1=11
NG判定の総スコア=5×1+1×1+2×5×1=16
そして、符号D4に示すように、制御判定部111は、算出したOK判定及びNG判定の総スコアに基づき、最終判定を実施する。
すなわち、制御判定部111は、OK判定の総スコア(A)とNG判定の総スコア(B)とを比較する(ステップS801)。
OK判定の総スコア(A)がNG判定の総スコア(B)よりも大きい場合には(ステップS801の“(A)>(B)”ルート参照)、制御判定部111は、防塵ベゼル16の交換は不要であると判定する(ステップS802)。そして、ベゼル交換要否判定は終了する。
一方、OK判定の総スコア(A)がNG判定の総スコア(B)以下の場合には(ステップS801の“(A)≦(B)”ルート参照)、制御判定部111は、防塵ベゼル16の交換は必要であると判定する(ステップS803)。そして、ベゼル交換要否判定は終了する。
なお、所定の測定回数(例えば、1日につき12回)の判定結果のうち、半数以上の判定結果が同一判定で連続する場合には、連続する判定結果に基づいてベゼル交換の要否が決定されてもよい。
〔B−3〕効果
上述した第2実施形態の一例における監視対象サーバ1によれば、例えば、以下の作用効果を奏することができる。
記憶部113は、監視対象サーバ1において保守作業が実施される場合についての保守作業要因の重み付け(別言すれば、第3の重み付け値)を記憶領域に記憶する。制御判定部111は、比較により一致する回数に第1又は第2の重み付け値を乗じた値が、比較により一致しない回数に第1又は第2の重み付け値と第3の重み付け値とを乗じた値以下である場合に、防塵ベゼル16が異常であると判定する。なお、第1の重み付け値は実測値の重み付けであり、第2の重み付け値は近似値の重み付けであってよい。
これにより、防塵ベゼル16に若干の目詰まり等が発生していて短期間での防塵ベゼル16の交換が予測される場合に、監視対象サーバ1の保守作業のタイミングで防塵ベゼル16の交換を同時に実施できるため、作業効率を向上できる。
制御判定部111は、直近に所定回数行なった比較について、比較により一致する回数が、比較により一致しない回数以下である場合に、防塵ベゼル16が異常であると判定する。
これにより、風量の測定及び比較を実施するタイミング毎に防塵ベゼル16の交換の要否判定を行なえるため、防塵ベゼル16の異常を早期に検知することができる。
記憶部113は、監視対象サーバ1の周囲環境の変化が検出された場合に、記憶領域において記憶しているキャリブレーション値DB101を更新する。
これにより、監視対象サーバ1の周囲環境が変化する際に自動で再キャリブレーションが実施できるため、防塵ベゼル16の交換の要否判定における誤判定を防止できる。
制御判定部111は、キャリブレーション値DB101において記憶されている風量と測定部112によって測定された風量との差分の変化割合が許容範囲を超えている場合に、周囲環境の変化を検出する。
これにより、管理サーバ2aにおいて監視対象サーバ1の周囲環境の変化を検出できない場合においても、監視対象サーバ1において自律的に周囲環境の変化を検出できる。
〔C〕その他
開示の技術は上述した実施形態に限定されるものではなく、本実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。本実施形態の各構成及び各処理は、必要に応じて取捨選択することができ、あるいは適宜組み合わせてもよい。
上述した実施形態の一例においては、監視対象サーバ1に取り付けられている防塵ベゼル16における目詰まりを検出することとしていたが、これに限定されるものではない。上述した防塵ベゼル16の目詰まり検出処理は、防塵ベゼル16が取り付けられる種々の機器に適用することができる。
また、上述した実施形態の一例においては、BMC11において防塵ベゼル16の目詰まり検出処理を実施することとしていたが、これに限定されるものではない。例えば、CPU12の温度測定以外の各処理は、CPU12における機能によって実現されてもよい。
〔D〕付記
以上の実施形態に関し、さらに以下の付記を開示する。
(付記1)
プロセッサと、当該プロセッサを冷却する冷却ファンと、筐体内への異物の侵入を防ぐ防塵ベゼルと、を有する情報処理装置であって、
前記プロセッサの温度と前記冷却ファンによって発生される気流の風量とを対応付けて登録する比較情報を記憶する記憶領域を有する記憶部と、
前記プロセッサの温度と、前記防塵ベゼルを透過する気流の風量とを、測定する測定部と、
前記比較情報の風量と前記測定部による測定結果の風量とを比較して、前記防塵ベゼルにおける異常を判定する判定部と、
を備える、情報処理装置。
(付記2)
前記判定部は、前記測定結果における前記プロセッサの温度が、前記比較情報に登録された前記プロセッサの温度と一致しない場合に、前記比較情報に登録された風量の近似値を算出し、算出した当該近似値と測定された風量とを比較して、前記異常を判定する、
付記1に記載の情報処理装置。
(付記3)
前記判定部は、前記測定結果における前記プロセッサの温度に対応する風量として、前記算出された前記近似値を、前記比較情報に登録する、
付記2に記載の情報処理装置。
(付記4)
前記判定部は、前記比較により一致する回数が、前記比較により一致しない回数以下である場合に、前記防塵ベゼルが異常であると判定する、
付記1〜3のいずれか1項に記載の情報処理装置。
(付記5)
前記記憶部は、前記測定結果における前記プロセッサの温度が前記比較情報に登録された前記プロセッサの温度と一致する場合についての第1の重み付け値と、前記測定結果における前記プロセッサの温度が前記比較情報に登録された前記プロセッサの温度と一致しない場合についての第2の重み付け値とを、前記憶領域において記憶し、
前記判定部は、前記比較により一致する回数に前記第1又は第2の重み付け値を乗じた値が、前記比較により一致しない回数に前記第1又は第2の重み付け値を乗じた値以下である場合に、前記防塵ベゼルが異常であると判定する、
付記4に記載の情報処理装置。
(付記6)
前記記憶部は、当該情報処理装置において保守作業が実施される場合についての第3の重み付け値を前記記憶領域に記憶し、
前記判定部は、前記比較により一致する回数に前記第1又は第2の重み付け値を乗じた値が、前記比較により一致しない回数に前記第1又は第2の重み付け値と前記第3の重み付け値とを乗じた値以下である場合に、前記防塵ベゼルが異常であると判定する、
付記5に記載の情報処理装置。
(付記7)
前記判定部は、直近に所定回数行なった前記比較について、前記比較により一致する回数が、前記比較により一致しない回数以下である場合に、前記防塵ベゼルが異常であると判定する、
付記4〜6のいずれか1項に記載の情報処理装置。
(付記8)
前記記憶部は、当該情報処理装置の周囲環境の変化が検出された場合に、前記記憶領域において記憶している前記比較情報を更新する、
付記1〜7のいずれか1項に記載の情報処理装置。
(付記9)
前記判定部は、前記比較情報において記憶されている風量と前記測定部によって測定された風量との差分の変化割合が許容範囲を超えている場合に、前記周囲環境の変化を検出する、
付記8に記載の情報処理装置。
(付記10)
コンピュータに、
プロセッサの温度と前記プロセッサを冷却する冷却ファンによって発生される気流の風量とを対応付けて登録する比較情報を記憶領域に記憶し、
前記プロセッサの温度と、筐体内への異物の侵入を防ぐ防塵ベゼルを透過する気流の風量とを、測定し、
前記比較情報の風量と前記測定による測定結果の風量とを比較して、前記防塵ベゼルにおける異常を判定する、
処理を実行させる、プログラム。
(付記11)
前記測定結果における前記プロセッサの温度が、前記比較情報に登録された前記プロセッサの温度と一致しない場合に、前記比較情報に登録された風量の近似値を算出し、算出した当該近似値と測定された風量とを比較して、前記異常を判定する、
処理を前記コンピュータに実行させる、付記10に記載のプログラム。
(付記12)
前記測定結果における前記プロセッサの温度に対応する風量として、前記算出された前記近似値を、前記比較情報に登録する、
処理を前記コンピュータに実行させる、付記11に記載のプログラム。
(付記13)
前記比較により一致する回数が、前記比較により一致しない回数以下である場合に、前記防塵ベゼルが異常であると判定する、
処理を前記コンピュータに実行させる、付記10〜12のいずれか1項に記載のプログラム。
(付記14)
前記測定結果における前記プロセッサの温度が前記比較情報に登録された前記プロセッサの温度と一致する場合についての第1の重み付け値と、前記測定結果における前記プロセッサの温度が前記比較情報に登録された前記プロセッサの温度と一致しない場合についての第2の重み付け値とを、前記憶領域において記憶し、
前記比較により一致する回数に前記第1又は第2の重み付け値を乗じた値が、前記比較により一致しない回数に前記第1又は第2の重み付け値を乗じた値以下である場合に、前記防塵ベゼルが異常であると判定する、
処理を前記コンピュータに実行させる、付記13に記載のプログラム。
(付記15)
当該情報処理装置において保守作業が実施される場合についての第3の重み付け値を前記記憶領域に記憶させ、
前記比較により一致する回数に前記第1又は第2の重み付け値を乗じた値が、前記比較により一致しない回数に前記第1又は第2の重み付け値と前記第3の重み付け値とを乗じた値以下である場合に、前記防塵ベゼルが異常であると判定する、
処理を前記コンピュータに実行させる、付記14に記載のプログラム。
(付記16)
プロセッサの温度と前記プロセッサを冷却する冷却ファンによって発生される気流の風量とを対応付けて登録する比較情報を記憶領域に記憶し、
前記プロセッサの温度と、筐体内への異物の侵入を防ぐ防塵ベゼルを透過する気流の風量とを、測定し、
前記比較情報の風量と前記測定による測定結果の風量とを比較して、前記防塵ベゼルにおける異常を判定する、
情報処理方法。
(付記17)
前記測定結果における前記プロセッサの温度が、前記比較情報に登録された前記プロセッサの温度と一致しない場合に、前記比較情報に登録された風量の近似値を算出し、算出した当該近似値と測定された風量とを比較して、前記異常を判定する、
付記16に記載の情報処理方法。
(付記18)
前記測定結果における前記プロセッサの温度に対応する風量として、前記算出された前記近似値を、前記比較情報に登録する、
付記17に記載の情報処理方法。
(付記19)
前記比較により一致する回数が、前記比較により一致しない回数以下である場合に、前記防塵ベゼルが異常であると判定する、
付記16〜18のいずれか1項に記載の情報処理方法。
(付記20)
前記測定結果における前記プロセッサの温度が前記比較情報に登録された前記プロセッサの温度と一致する場合についての第1の重み付け値と、前記測定結果における前記プロセッサの温度が前記比較情報に登録された前記プロセッサの温度と一致しない場合についての第2の重み付け値とを、前記憶領域において記憶し、
前記比較により一致する回数に前記第1又は第2の重み付け値を乗じた値が、前記比較により一致しない回数に前記第1又は第2の重み付け値を乗じた値以下である場合に、前記防塵ベゼルが異常であると判定する、
付記19に記載の情報処理方法。