JP5660179B1 - 管理制御システム、サーバシステム、管理制御方法及び管理制御プログラム - Google Patents

管理制御システム、サーバシステム、管理制御方法及び管理制御プログラム Download PDF

Info

Publication number
JP5660179B1
JP5660179B1 JP2013190150A JP2013190150A JP5660179B1 JP 5660179 B1 JP5660179 B1 JP 5660179B1 JP 2013190150 A JP2013190150 A JP 2013190150A JP 2013190150 A JP2013190150 A JP 2013190150A JP 5660179 B1 JP5660179 B1 JP 5660179B1
Authority
JP
Japan
Prior art keywords
fan
rotation speed
error occurrence
occurrence frequency
drive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013190150A
Other languages
English (en)
Other versions
JP2015056196A (ja
Inventor
孝行 城風
孝行 城風
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2013190150A priority Critical patent/JP5660179B1/ja
Priority to US14/484,310 priority patent/US9857852B2/en
Application granted granted Critical
Publication of JP5660179B1 publication Critical patent/JP5660179B1/ja
Publication of JP2015056196A publication Critical patent/JP2015056196A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • G06F1/206Cooling means comprising thermal management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/004Error avoidance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3034Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a storage system, e.g. DASD based or network based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Cooling Or The Like Of Electrical Apparatus (AREA)

Abstract

【課題】データベース化した情報を用いてドライブのエラー発生頻度が高いファン回転数を避けるようにファンの回転数を制御する管理制御システムを提供する。【解決手段】ドライブ及びファンを管理・制御する管理制御システムであって、ドライブのエラー発生数とファンの回転数とを取得してエラー発生頻度を算出し、エラー発生頻度を基に回避すべきファンの回転数である回避回転数を算出するエラー発生頻度算出手段と、回避回転数を格納する記憶手段と、ファンの回転数と筐体内部の現在の雰囲気温度とを取得し、雰囲気温度に応じて記憶手段に格納された回避回転数を含まない回転数領域でファンの回転数を制御するファン回転数制御手段と、を備える管理制御システムとする。【選択図】 図2

Description

本発明は、管理制御システム及び管理制御方法に関する。特に、サーバの内部に設けられたドライブとファンとの共振を防止することによって、ドライブのエラーの発生を抑止することが可能となる管理制御システム、管理制御方法及び管理制御プログラムに関する。
近年、サーバの高密度化が進み、限りあるスペースにCPU/メモリ/HDDなどの部品をできる限り多く実装させて高性能化・大容量化を図っている(CPU:Central Processing Unit、HDD:Hard Disk Drive)。
また、サーバの高密度化によって、CPUやHDDからの発熱を効率的に逃がすことが難しくなっている。近年のサーバでは、一般的に、CPU/メモリ/HDD等を搭載する他、発熱する部品を冷却する必要性からファンを搭載する。そのため、サーバ内部において、ファンを有効的に配置して、発熱源となるCPUやHDDなどを効率的に冷却することが求められている。
また、サーバの高密度化に付随して、振動の発生源となるファンとHDD等のドライブとを同時に高密度実装する必要性が生じている。そのため、ドライブとファンとの間での共振が増え、振動に弱いドライブの障害発生率が高くなる可能性がある。
特許文献1には、ファンにより発生する振動によって光ディスクが共振することがない光ディスク装置について開示されている。特許文献1の光ディスク装置では、ファンの回転数に対応する基本周波数の整数倍の値が光ディスクの固有振動数から外れるように、ファンの回転数を制御する制御手段を備えている。
特開2004−39140号公報
高密度化されたサーバでは、ファンから発生する振動と振動に弱いHDDとの間で共振が起き、HDDでエラーが多発する可能性がある。その結果、最悪の場合は、HDDの故障によるシステムダウンが引き起こされる可能性がある。サーバ稼動時においては、ファンとHDDとの共振を抑えることが望ましいが、実際には、サーバ毎にHW構成や搭載HDDの回転数などが違うことによって共振するポイントが異なってくる(HW:Hardware)。そのため、一般的な高密度化されたサーバでは、ファンとHDDとの共振に起因するHDD障害をピンポイントで抑制する対策を取ることが難しいという問題がある。
特許文献1の光ディスク装置によれば、ファンにより発生する振動の周波数が光ディスクの固有振動数に一致することはなく、光ディスクが共振することを防止することができる。しかしながら、筐体の経年変化などに付随して変動する光ディスク装置全体を考慮した共振については対応しきれないという問題点がある。
本発明は、ドライブのエラー発生頻度が高いファン回転数を実測してデータベース化し、データベース化した情報を用いてドライブのエラー発生頻度が高いファン回転数を避けるようにファンの回転数を制御する管理制御システムを提供することを目的とする。
本発明の管理制御システムは、ドライブ及びファンを管理・制御する管理制御システムであって、ドライブのエラー発生数とファンの回転数とを取得してエラー発生頻度を算出し、エラー発生頻度を基に回避すべきファンの回転数である回避回転数を算出するエラー発生頻度算出手段と、回避回転数を格納する記憶手段と、ファンの回転数と筐体内部の現在の雰囲気温度とを取得し、雰囲気温度に応じて記憶手段に格納された回避回転数を含まない回転数領域でファンの回転数を制御するファン回転数制御手段と、を備える。
本発明のサーバシステムは、ドライブ及びファンを管理・制御する管理制御システムを備えるサーバシステムであって、ドライブのエラー発生数とファンの回転数とを取得してエラー発生頻度を算出し、エラー発生頻度を基に回避すべきファンの回転数である回避回転数を算出するエラー発生頻度算出手段と、回避回転数を格納する記憶手段と、ファンの回転数と筐体内部の現在の雰囲気温度とを取得し、雰囲気温度に応じて記憶手段に格納された回避回転数を含まない回転数領域でファンの回転数を制御するファン回転数制御手段と、を備える。
本発明の管理制御方法は、ドライブ及びファンを管理・制御する管理制御方法であって、ドライブのエラー発生数とファンの回転数とを取得してエラー発生頻度を算出し、エラー発生頻度を基に回避すべきファンの回転数である回避回転数を算出し、回避回転数をデータベースに格納し、ファンの回転数と筐体内部の現在の雰囲気温度とを取得し、雰囲気温度に応じて記憶手段に格納された回避回転数を含まない回転数領域でファンの回転数を制御する。
本発明の管理制御プログラムは、ドライブ及びファンを管理・制御する管理制御プログラムであって、ドライブのエラー発生数とファンの回転数とを取得してエラー発生頻度を算出し、エラー発生頻度を基に回避すべきファンの回転数である回避回転数を算出する処理と、回避回転数をデータベースに格納する処理と、ファンの回転数と筐体内部の現在の雰囲気温度とを取得し、雰囲気温度に応じて記憶手段に格納された回避回転数を含まない回転数領域でファンの回転数を制御する処理と、をコンピュータに実行させる。
本発明によれば、データベース化した情報を用いてドライブのエラー発生頻度が高いファン回転数を避けるようにファンの回転数を制御することによって、ドライブのエラー発生を防止する管理制御システムを提供することが可能になる。
本発明の実施形態に係るサーバシステムの機能ブロック図である。 本発明の実施形態に係る管理制御システムの機能ブロック図である。 本発明の実施形態に係る管理制御システムのエラー発生頻度算出手段の機能ブロック図である。 ファン回転数とエラー発生頻度との関係の一例を示すグラフである。 本発明の実施形態に係る管理制御システムのファン回転数制御手段の機能ブロック図である。 本発明の実施形態に係る管理制御システムのエラー発生頻度算出手段の動作を示すフローチャートである。 本発明の実施形態に係る管理制御システムのファン回転数制御手段の動作を示すフローチャートである。 本発明の実施形態に係るサーバシステムのハードウェア構成の概念図である。 本発明の実施形態に係る実施例1のサーバシステムの機能ブロック図である。 本発明の実施形態に係る実施例1のサービスプロセッサの機能ブロック図である。 本発明の実施形態に係る実施例2のサーバシステムの機能ブロック図である。 本発明の実施形態に係る実施例2の管理制御装置の機能ブロック図である。
以下に、本発明を実施するための形態について図面を用いて説明する。ただし、以下に述べる実施形態には、本発明を実施するために技術的に好ましい限定がされているが、発明の範囲を以下に限定するものではない。
(実施形態)
図1は、本発明の実施形態に係る管理制御システム10を含むサーバシステム1の機能ブロック図である。
本発明の実施形態に係るサーバシステム1は、管理制御システム10と、ドライブ11と、ファン12と、ドライブ制御装置13と、温度センサ14と、を含む。サーバシステム1は、一般的なサーバ(ストレージを含む)としての機能を備えるとともに、以下の実施形態で説明していく特徴を備えている。
(管理制御システム)
管理制御システム10は、ドライブ11の情報を取得する。また、管理制御システム10は、取得した情報を基にファン12を駆動制御するためのファン制御信号をファン12に出力する。管理制御システム10は、例えばCPUやメモリ、入出力装置、補助記憶装置を有するコンピュータなどの情報処理装置で実現することができる。また、管理制御システム10は、例えばCPUやメモリ、入出力装置、補助記憶装置を有するサーバ装置において実行されるプログラムとして実現されてもよい。
管理制御システム10は、バス等を通じて、定期的にファン12のファン回転数や、HDDなどのドライブ11のドライブ情報を取得することができる(HDD:Hard Disk Drive)。
例えば、ドライブ11がHDDである場合、S.M.A.R.T.情報がドライブ情報に相当する(S.M.A.R.T:Self−Monitoring, Analysis and Reporting Technology)。また、例えば管理制御システム10がサービスプロセッサとして構成される場合、管理制御システム10は、I2Cと呼ばれるバス等を通じてファン12と接続される(I2C:Inter−Integrated Circuit)。
管理制御システム10は、サーバシステム1を構成する複数のドライブ11及び複数のファン12を個別に制御することができる。以下において、ドライブ11やファン12の数について言及していない場合は、複数のドライブ11及びファン12を対象とする。
(ドライブ)
ドライブ11は、サーバシステム1を構成する外部記憶装置であり、例えばHDDなどの磁気ディスクドライブ、CDやDVDなどの光ディスクドライブを例として挙げることができる。ドライブ11は、特定の回転数で駆動され、ファン12などの回転体を持つ物理装置と共振する可能性を有する。
また、ドライブ11がHDDである場合、一般に、HDD内部にはS.M.A.R.T.機能が搭載されている。S.M.A.R.T.機能は、HDD障害を早期段階で発見すること、HDDの故障を予測することを目的としており、複数の検査項目からなる。特に、本実施形態に係る管理制御システム10では、エラー率検知(Seek Error Rate)、データ書き込み中振動(Vibration During Write)、データ読み込み中振動(Vibration During Read)などの検査項目をモニターする。ただし、管理制御システム10では、S.M.A.R.T.に含まれるその他の検査項目についてモニターしてもよい。
(ファン)
ファン12は、ドライブ11などの発熱する電子部品及びその周辺の雰囲気を冷却するための送風装置である。ファン12は、羽根などを回転させることによって送風するため、ドライブ11などの特定の回転数で駆動される装置と共振する可能性を有する。
ファン12としては、例えば遠心送風機や軸流送風機、斜流送風機、横断流送風機などの形式を持つものを用いることができる。なお、ファン12は、前述の形式に限らず、前述の形式には当てはまらない形式のファンを用いてもよい。また、冷却装置を含むファン12自体であってもよい。
ドライブ制御装置13は、ドライブ11を駆動するとともに、ドライブ11の情報を管理制御システム10に提供する。
ドライブ11がHDDである場合、ドライブ制御装置12は、例えばRAIDコントローラなどで実現することができる(RAID:Redundant Arrays of Inexpensive Disks、又は Redundant Arrays of Independent Disks)。ドライブ11がHDDである場合、ドライブ制御装置12は、HDDのS.M.A.R.T情報を取得し、取得したS.M.A.R.T情報を管理制御システム10に出力する。
また、本実施形態に係るサーバシステム1は、ドライブ11などの発熱する電子部品の周辺の雰囲気温度を取得するための温度センサ14を含むことが好ましい。なお、何らかの手段によって測温対象となる雰囲気の温度情報を取得することができさえすれば、温度センサ14をサーバシステム1の構成として含まなくてもよい。
温度センサ14は、管理制御システム10が制御するファン12の送風によって温度調整される位置の温度が測定できるように設置される。温度センサ14は、図1のように単一であってもよいし、各ドライブ11に対応するように複数設置してもよい。温度センサ14は、特定箇所の温度情報を管理制御システム10に出力する。
温度センサ14は、例えば単一又はいくつかのドライブ11周辺の雰囲気温度を取得するように設置すればよく、全てのドライブ11を含むサーバシステム内部の雰囲気温度を取得するように設置してもよい。
温度センサ14としては、例えば、熱電対や抵抗温度センサのように温度測定する環境に直接設置するものであってもよいし、赤外線センサのように温度測定箇所から離れた位置に設置するものであってもよい。例えば、温度センサ14が2次元の温度分布情報を取得できれば、管理制御システム10が2次元の温度分布情報を基にして複数のファン12を個別に制御するようにしてもよい。温度センサ14が2次元の温度分布情報を取得できれば、複数のファン12によってそれぞれの冷却対象箇所を効率的に空冷することができる。
次に、本実施形態に係る管理制御システムの具体的な構成について詳細に説明する。
図2のように、管理制御システム10は、エラー発生頻度算出手段20と、記憶手段30と、ファン回転数制御手段40と、を備える。
記憶手段30は、サーバシステム1の内部に構成された記憶装置であり、メモリなどの記憶装置やHDDなどの補助記憶装置などで実現され、データベースを構成する。
(エラー発生頻度算出手段)
図3に示したように、エラー発生頻度算出手段20は、回転数/ドライブ情報取得部21と、演算部24と、判定部29と、を有する。エラー発生頻度算出手段20は、エラー発生頻度が高いファン回転数を記録する。以下において、「ファン回転数」を単に「回転数」とも記載することもある。
回転数/ドライブ情報取得部21は、ドライブ11のドライブ情報を取得するとともに、ファン12のファン回転数情報(現在の回転数)を取得する。回転数/ドライブ情報取得部21は、図3に示すように、ドライブ情報取得手段21と、ファン回転数取得部23と、タイミング制御部24と、を含む。
ドライブ情報取得手段21及びファン回転数取得部23は、例えばデータを入出力する入出力機能や通信機能を有し、タイミング制御部24の指定するタイミングに従ってデータの授受を実行する。タイミング制御部24は、例えば自身が発信回路を有し、その発振回路によってデータ入出力のタイミングを制御してもよいし、外部から取得したクロックを利用して所定のタイミングでデータ入出力を制御してもよい。
ドライブ情報取得部22は、現在のドライブ11のドライブ情報を取得する。ドライブ11がHDDの場合、ドライブ情報取得部22は、S.M.A.R.T.情報の検査項目のいずれかをドライブ情報として取得する。ドライブ情報取得部22は、S.M.A.R.T.情報として、エラー発生に関するドライブ情報を主に取得する。
ドライブ情報取得部22は、取得したドライブ情報のうちを、エラー発生頻度に関する情報をエラー発生数計測部26に出力する。
ファン回転数取得部23は、現在のファン12のファン回転数(現在の回転数)を取得する。ファン回転数取得部23は、取得したファン回転数を平均ファン回転数検証部27に出力する。
タイミング制御部24は、ドライブ情報取得部22及びファン回転数取得部23の情報取得のタイミングを制御する。タイミング制御部24は、定期的に、特定のポーリング期間内においてドライブ情報及びファン回転数情報を取得するように、ドライブ情報取得部22及びファン回転数取得部23を制御する。
なお、タイミング制御部24は、ドライブ情報取得部22及びファン回転数取得部23の情報取得のタイミングを同期させてもよいし、それぞれ個別に設定した取得時間で情報取得するように制御してもよい。
なお、タイミング制御部24は、エラー発生頻度算出部28においてファン回転数とエラー発生頻度との対応関係が得られるように、ドライブ情報取得部22及びファン回転数取得部23が情報を取得したときの時間情報を管理することが好ましい。
演算部24は、ポーリング期間内におけるファン12の平均ファン回転数(平均回転数とも記載)を計算するとともに、ドライブ11のエラー発生数を計測し、あるファン回転数(平均ファン回転数)における単位時間当たりのエラー発生数を示すエラー発生頻度を算出する。演算部24は、図3に示すように、エラー発生数計測部26と、平均ファン回転数検証部27と、エラー発生頻度算出部28と、を含む。演算部24は、例えばCPUなどの演算機能を有する装置で実現される。
エラー発生数計測部26は、ドライブ情報取得部22から取得したドライブ情報を用いて、特定のポーリング期間内におけるエラーを積算してエラー発生数を計測する。エラー発生数計測部26は、積算したエラー発生数をエラー発生頻度算出部28に出力する。
平均ファン回転数検証部27は、ファン回転数取得部23から取得したファン12のファン回転数から、特定のポーリング期間内における平均ファン回転数を計算する。平均ファン回転数は、ファン回転数の総和をポーリングしている時間で割ることによって求められる。平均ファン回転数検証部27は、計算した平均ファン回転数をエラー発生頻度算出部28に出力する。
エラー発生頻度算出部28は、エラー発生数計測部26から取得したエラー発生数と、平均ファン回転数検証部27から取得した平均ファン回転数とを関連付けて、あるファン回転数における単位時間当たりのエラー発生数を示すエラー発生頻度を計算する。具体的には、エラー発生頻度算出部28は、ポーリング期間内のエラー発生数と平均ファン回転数とを連動させるように、「該ファン回転数下での単位時間当たりのエラー発生数」を示すエラー発生頻度を算出する。
エラー発生頻度算出部28は、「ファン回転数とエラー発生頻度とのペア」を判定部29に出力する。
判定部29は、エラー発生頻度算出部28から「ファン回転数とエラー発生頻度とのペア」を取得し、エラー発生頻度が任意の閾値を超える場合、そのファン回転数を回避回転数として記憶手段30に格納する。すなわち、判定部29は、ドライブ11に障害を与えうるエラー発生頻度を示す回避回転数を記憶装置30に格納し、データベース化する。判定部29は、例えばCPUなどが有する機能の一部を利用するなどして実現される。
判定部29は、図4に示すような、ファン12のファン回転数とドライブ11のエラー発生頻度との関係を表すグラフ情報の基となる数値情報を、記憶装置30に格納するようにしてもよい。図4のグラフの例には、R1及びR2において極端にエラー発生頻度が大きくなっており(閾値を超える)、R1及びR2が回避回転数に相当することを示す。なお、実際には、回避回転数前後の回転数においても、他のファン回転数と比較するとエラー発生頻度は大きくなる。そのため、回避回転数を頂点としたピークを基準とした回転数範囲を回避回転数帯として設定してもよい。
記憶手段30に値を記録するにあたっては、共振によって突出したファン回転数のみを回避回転数として収集することが重要であり、偏差を基準にする方法が考えられる。
例えば、判定部29は、各ファン回転数(帯)のエラー発生頻度の平均と標準偏差を求め、各ファン回転数(帯)におけるエラー発生頻度の偏差値を求める。そして、判定部29は、例えば偏差値70以上となったファン回転数(帯)をデータベースに登録する。統計が正規分布に従うならば、偏差値70の場合、記憶手段30に格納されるファン回転数(帯)は、全体の0.275%となる。なお、エラー発生数の閾値となる偏差値は70に限らず、任意の値に設定できる。また、記憶手段30に格納するファン回転数(帯)の決定方法は、ここで示した方法に限定するわけではない。
(ファン回転数制御手段)
図5に示したように、ファン回転数制御手段40は、回転数/温度取得部41と、検証部44と、判断部47と、ファン回転数制御部48と、を有する。ファン回転数制御手段40は、ファン回転数を制御する。
回転数/温度取得部41は、現在のファン12のファン回転数と、ファン12の冷却対象となる空間の雰囲気温度と、を取得する。回転数/温度取得部41は、図5のように、雰囲気温度取得部42と、ファン回転数取得部43と、を含む。雰囲気温度取得部42及びファン回転数取得部43は、例えばデータの入出力機能や通信機能を有する装置で実現される。
雰囲気温度取得部42は、温度センサ14によって測定された現在の雰囲気温度を取得する。雰囲気温度取得部42は、取得した雰囲気温度を、ファン回転数検証部46と、温度変化検証部46と、に出力する。
ファン回転数取得部43は、ファン11の現在のファン回転数を取得する。ファン回転数取得部43は、取得したファン回転数を判断部47に出力する。
検証部44は、現在の雰囲気温度に最適なファン回転数(最適ファン回転数)を検証するとともに、雰囲気温度の変化情報を検証する。検証部44は、温度変化検証部45と、ファン回転数検証部46と、を含む。温度変化検証部45及びファン回転数検証部46は、例えばCPUの演算機能によって実現される。
温度変化検証部45は、判断部47からの要求に応じて、今回測定した雰囲気温度と前回測定した雰囲気温度とを比較し、雰囲気温度の変化情報を検証する。温度変化検証部45は、判断部47からの要求に応じて、雰囲気温度の変化情報を判断部47に出力する。
例えば、今回の雰囲気温度が前回よりも高くなった場合、温度変化検証部45は、雰囲気温度の変化情報をフラグ情報として記録しておくとよい。
ファン回転数検証部46は、雰囲気温度取得部42から取得した雰囲気温度を基に、その雰囲気温度において最適なファン回転数(「最適ファン回転数」又は「最適回転数」)を検証する。ファン回転数検証部46は、導出した最適ファン回転数を判断部47に出力する。
例えば、ファン回転数検証部46は、雰囲気温度が温度閾値よりも高い場合はファン回転数を上げ、低い場合はファン回転数を下げるような制御につながる計算結果を導く計算式を用いればよい。また、例えば、ファン回転数検証部46は、雰囲気温度に対応する最適ファン回転数をテーブルなどの形でROMなどの記憶手段に保持しておき、そのテーブルを参照して最適ファン回転数を導き出してもよい。
判断部47は、ファン回転数検証部46が算出した最適ファン回転数と一致する回避回転数が記憶装置30に格納されているか否かを判断する。そのため、判断部47は、最適ファン回転数と一致する回避回転数が記憶装置30に格納されているか否かを検証する。
また、判断部47は、回避回転数が記憶装置30に格納されている場合、ファン回転数制御部46に対してファン回転数の制御情報を出力する。
判断部47は、例えばCPUの演算機能・制御機能を利用したプログラムによって実現される。
判断部47は、最適ファン回転数と一致する回避回転数が記憶装置30に格納されていない場合、ファン回転数制御部46に対して、ファン回転数を最適ファン回転数に設定するように指示する。
また、判断部47は、最適ファン回転数と一致する回避回転数が記憶装置30に格納されている場合、温度変化検証部45に対して雰囲気温度の変化情報を要求する。
判断部47は、温度変化検証部45から取得した雰囲気温度の変化情報を参照し、ファン回転数制御部46に対して指示を出す。
雰囲気温度が上昇している場合、判断部47は、ファン回転数制御部46に対して、ファン回転数が最適ファン回転数よりも大きくなる制御をするように指示する。また、雰囲気温度が上昇していない場合、判断部47は、ファン回転数制御部46に対して、ファン回転数を維持するように指示する。
ファン回転数制御部46は、判断部47からの指示に応じて、ファン12の回転数を制御するファン制御信号をファン12に対して送信する。ファン回転数制御部46は、例えば温度情報に応じてファン回転数を制御するプログラムによって実現される。
以上が、本発明の実施形態に係る管理制御システム及びサーバシステムの構成に関する説明である。なお、上述の構成は一例であって、本発明の範囲を限定するものではなく、上述の構成に種々の変更・追加をなしたものも本発明の範囲に含む。
(動作)
次に、図6及び図7のフローチャートを参照して、本発明の実施形態に係る管理制御システム10の動作について説明する。以下においては、エラー発生頻度が高いファン回転数の算出工程(算出工程)と、ファン回転数の制御工程(制御工程)と、を分けて説明する。
(算出工程)
図6は、本発明の実施形態に係る管理制御システム10のエラー発生頻度算出手段20の動作を示すフローチャートである。図6は、図3に示したエラー発生頻度算出手段20が実行する算出工程を示す。
まず、図6において、エラー発生頻度算出手段20の回転数/ドライブ情報取得部21は、ドライブ11のドライブ情報を取得し、ファン12のファン回転数情報を取得する(ステップS21)。
ステップS21の工程においては、ドライブ情報取得部22がドライブ11のドライブ情報を取得するとともに、ファン回転数取得部23がファン12のファン回転数情報を取得する。なお、ドライブ情報とファン回転数情報を取得するタイミングは、タイミング制御部24によって決定される。
次に、演算部24は、ドライブ11のエラー発生数を計測するとともに、ポーリング期間内におけるファン12の平均ファン回転数を計算し、平均ファン回転数における単位時間当たりのエラー発生数を示すエラー発生頻度を算出する(ステップS22)。
ステップS22の工程においては、エラー発生数計測部26によってドライブ11のエラー発生数を計測するとともに、平均ファン回転数検証部27によってポーリング期間内におけるファン12の平均ファン回転数を計算する。さらに、ステップS22の工程においては、エラー発生頻度算出部28によって、平均ファン回転数における単位時間当たりのエラー発生数を示すエラー発生頻度を算出する。
次に、判定部29は、演算部24によって算出されたエラー発生頻度が、設定された閾値よりも大きいか否かを判定する(ステップS23)。
エラー発生頻度が設定された閾値よりも大きい場合(ステップS23でYes)、判定部29は、エラー発生頻度が大きいと判定されたファン回転数(平均ファン回転数)を、回避回転数として記憶手段に格納する(ステップS24)。
以上が、エラー発生頻度算出手段20による算出工程についての説明である。次に、ファン回転数制御手段40による制御工程について説明する。
(制御工程)
図7は、本発明の実施形態に係る管理制御システム10のファン回転数制御手段30の動作を示すフローチャートである。図7は、図5に示したファン回転数制御手段30が実行する制御工程を示す。
まず、図7において、回転数/温度取得部41は、ファン11の現在のファン回転数と、ファン11が冷却対象とする部品周辺の雰囲気温度と、を取得し、その雰囲気温度における最適ファン回転数を算出する(ステップS41)。
ステップS41においては、雰囲気温度取得部42が雰囲気温度を取得し、ファン回転数取得部43がファン11のファン回転数を取得する。そして、ファン回転数検証部46が最適ファン回転数を検証する。
次に、判断部47は、現在のファン回転数がエラー発生頻度の大きいファン回転数(回避回転数)として、記憶手段30に格納されているか否かを確認する(ステップS42)。
現在のファン回転数が回避回転数として記憶手段30に格納されていない場合(ステップS42においてNo)、判断部47は、ファン回転数検証部46から取得した現在の雰囲気温度における最適ファン回転数でファン11を制御するように、ファン回転数制御部48に対して指示する。
ファン回転数制御部48は、現在の雰囲気温度における最適ファン回転数となるように、ファン11を制御する(ステップS43)。
また、現在のファン回転数が回避回転数として記憶手段30に格納されている場合(ステップS42においてYes)、判断部47は、温度変化検証部45から雰囲気温度の変化情報を取得し、現在の雰囲気温度が前回測定した雰囲気温度よりも高いか否かを確認する(ステップS44)。
現在の雰囲気温度が前回測定した雰囲気温度よりも高くない(低い)場合(ステップS44でNo)、判断部47は、現在のファン回転数でファン11を制御し続けるように、ファン回転数制御部48に対して指示する。
ファン回転数制御部48は、現在のファン回転数を維持するようにファン11を制御する(ステップS45)。
また、現在の雰囲気温度が前回測定した雰囲気温度よりも高い)場合(ステップS44でYes)、判断部47は、現在の雰囲気温度における最適ファン回転数よりもファン回転数を上げるようにファン回転数制御部48に対して指示する。
ファン回転数制御部48は、現在の雰囲気温度における最適ファン回転数よりもファン11のファン回転数を上げるようにファン11を制御する(ステップS46)。
なお、ステップS44でYesの場合、ステップS46の制御の後に、ステップS42に戻って、ファン11の変更後のファン回転数が記憶装置30に記録されているか否かを確認する。
以上が、ファン回転数制御手段40による制御工程についての説明である。
上述の記憶工程及び制御工程を含む本実施形態に係る管理制御システムにおける管理制御方法は、一例であって、本発明の範囲を限定するものではなく、上述の工程に種々の変更・追加をなしたものも本発明の範囲に含む。
(サーバシステム)
本発明の実施形態に係るサーバシステム1は、HDDやファン等が搭載されたサーバによって実現される。図8には、HDDなどのドライブ11やファン12、筐体15を含むサーバ2の概念図を示した。なお、図8においては、サーバ2の内部構成を示すために、筐体上側の一部を切り取ったように図示している。また、サーバ2は、本発明の実施形態に関わる箇所以外は一般的なサーバ構成を持つが、図3においては、実際のサーバにおいて必要となる入出力手段や通信手段などは省略している。
図8のサーバ2は、CPU(図示しない)、メモリ(図示しない)、複数のHDDなどのドライブ11といった部品の他に、部品を冷却するためのファン12を内蔵している。また、近年では、サーバ2内部の部品を管理する目的で、管理制御システム10としてのサービスプロセッサ(図8には図示しない)が内蔵されている。なお、サービスプロセッサは、BMCとも呼ばれる(BMC:Base Management Controller)。サービスプロセッサは、逐一、各部品の状態を監視している。
サーバ2に内蔵されたファン12は、筐体15内部を冷却するために、冷却対象となる空間の雰囲気温度を制御できるように配置される。
部品が高密度に配置されたサーバ2の筐体内部においては、ドライブ11とファン12とが近接するように配置される場合がある。そのため、ドライブ11に含まれるディスクの回転数と、ファン12に含まれる回転体の回転数とが共振する条件であると、ドライブ11の書き込み・読み込み等において、エラーが発生することが想定される。
ドライブ11とファン12とをできる限り離して配置することによって、ドライブ11とファン12との共振をある程度は避けることはできる。しかしながら、複数のドライブ11及びファン12を含むサーバ2では、いずれかのファン12の回転数をドライブ11の共振条件からずらしたとしても、別のドライブ11と共振してしまうようなことも想定される。
また、筐体15などを含めた共振条件を考慮すると、固定された固有振動数条件によってファン12のファン回転数を制御したとしても、共振条件が経時変化していくにつれて、より共振しやすいような条件に制御してしまう可能性もある。そのため、本発明の実施形態に係るサーバシステム1のように、リアルタイムでのドライブ情報・ファン回転数情報によって、継時変化に対しても逐一対応できるサーバを構築することが好ましい。
以上のように、本発明の実施形態においては、サーバに搭載されたドライブのドライブ情報及びファン回転数を定期的に収集し、ドライブのエラーが発生しやすいファン回転数を割り出してデータベース化する。本発明の実施形態においては、データベース化されたファン回転数を回避するようにファンを制御するため、サーバ運用を継続しているうちに変動するドライブとファンとの共振条件の変化に対応できる。そのため、ファンとドライブの共振による振動起因によるドライブの故障を抑制することができ、ドライブの故障率を低下させ、サーバシステムの可用性を向上させることができる。
また、通常、ドライブのエラー発生数が増加するにしたがって、ドライブ内部ではリトライする動作が増え結果として処理性能が下がる結果となる。しかしながら、本発明の実施形態によれば、このようなドライブのエラー発生数を抑えることができるため、ドライバの性能低下抑止がもたらされる。
本発明の実施形態に係る管理制御システムによって実現される管理制御方法が、構成・動作に変更を加えた別のシステムで用いられたとしても、その管理制御方法は本発明の範囲に含まれる。また、本発明の実施形態に係る管理制御方法をコンピュータに実行させる管理制御プログラムも本発明の範囲に含まれる。
次に、実施例を挙げて、本発明の実施形態に係る管理制御システム10について具体的に説明する。以下の実施例については、ドライブ11をHDDや光ディスクに具体化した例である。特に、本発明の実施形態に係る管理制御システム10は、ドライブ11としてHDDを用いた場合に好適である。
また、ドライブ11を具体化したとしても、ファン12の構成や動作には変更を行う必要がない。そのため、以下の実施例では、エラー発生頻度算出手段20(図3)及び算出工程の動作(図6)について、それぞれのドライブ11に対応させて変更させた例を示す。
(実施例1)
図9は、実施例1に係るサービスプロセッサ101を含むサーバシステム5の機能構成を示すブロック図である。サーバシステム5は、サービスプロセッサ101と、少なくとも一つのHDD111と、少なくとも一つのファン121と、RAIDコントローラ131と、温度センサ141と、を備える。
サービスプロセッサ101は管理制御システム10に、HDD111はドライブ11に、ファン121はファン12に、RAIDコントローラ131はドライブ制御装置13に、温度センサ141は温度センサ14に相当する。特に断りのない限り、サーバシステム5の各構成要素は、図3に示したエラー発生頻度算出手段20が有する機能を有するものとする。
サービスプロセッサ101は、I2Cと呼ばれるバス等を通じてファン121と接続される(I2C:Inter−Integrated Circuit)。また、サービスプロセッサ101は、RAIDコントローラ131を通じてHDD11と接続される。
(サービスプロセッサ)
図10は、実施例1に係るエラー発生頻度生成装置120の機能構成を示す概念図である。エラー発生頻度生成装置120は、一般的なサービスプロセッサの構成・機能を有するとともに、本発明の実施形態に係るエラー発生頻度算出手段20(図3)を実現する装置である。
エラー発生頻度生成装置120は、回転数/S.M.A.R.T.情報取得部211と、演算部251と、判定部291と、を有する。回転数/S.M.A.R.T.情報取得部211は回転数/ドライブ情報取得部21に、演算部251は演算部25に、判定部291は判定部29に相当する。エラー発生頻度が大きいファン回転数については、回避回転数として内部データベース301(以下、内部DB301と記載)に格納する(DB:Database)。
また、回転数/S.M.A.R.T.情報取得部211は、S.M.A.R.T.情報取得部221と、ファン回転数取得部231とタイミング取得部241と、を含む。S.M.A.R.T.情報取得部221はドライブ情報取得部22に、ファン回転数取得部231はファン回転数取得部23に、タイミング制御部241はタイミング制御部24に相当する。
演算部251は、エラー発生数計測部261と、平均ファン回転数計算部271と、エラー発生頻度算出部281と、を有する。エラー発生数計測部261はエラー発生数計測部26に、平均ファン回転数計算部271は平均ファン回転数計算部27に、エラー発生頻度算出部281はエラー発生頻度算出部28に相当する。
エラー発生頻度生成装置120において、S.M.A.R.T.情報取得部221及び回転数/S.M.A.R.T.情報取得部211以外の構成要素については、図3のエラー発生頻度算出手段20と同じ構成であるため、説明は省略する。また、S.M.A.R.T.情報取得部221及び回転数/S.M.A.R.T.情報取得部211の動作についても、それぞれドライブ情報取得部22及び回転数/ドライブ情報取得部21の動作と同様であるため、詳細な説明は省略し、概略のみを説明する。
実施例1では、S.M.A.R.T.情報として、エラー率検知(Seek Error Rate)、データ書き込み中振動(Vibration During Write)、データ読み込み中振動(Vibration During Read)を用いる。
サービスプロセッサ101は、定期的にHDD111のS.M.A.R.T情報とファン121のファン回転数情報を収集する。そしてポーリング期間内のエラー発生数と平均ファン回転数の連動性、すなわち該ファン回転数下での単位時間当たりのエラー発生頻度を計算する。
このとき、図4のグラフに示すように、HDDとファンが共振している回転数(帯)では、他のファン回転数帯に比べてエラー発生頻度が高くなる(閾値を超える)。そのため、サービスプロセッサ101は、そのファン回転数をサービスプロセッサ101が持っている内部DB301に記録する。以後このような動作を常時行うことによって、データを内部DB301に蓄積していく。
内部DB301には、共振によって突出した値のみを拾うことが重要であり、例えば、偏差を基準にする方法を適用することができる。
各ファン回転数(帯)のエラー発生回数から、エラー発生するファン回転数(帯)の平均と標準偏差を求め、各ファン回転数(帯)のエラー発生回数に対する偏差値を求める。そして、例えば偏差値が70以上となったファン回転数(帯)を内部DB301に格納する。統計が正規分布に従うならば、内部DB301に格納されるファン回転数(帯)は、発生したエラー全体のうち0.275%が格納されることになる。
そして、サービスプロセッサ101は、回避回転数を内部DB301に蓄積するとともに、内部DB301に蓄積された回避回転数を参照し、ファン121が回避回転数で稼働し続けないようにファン121を制御する。
例えば、最適ファン回転数が徐々に上がってきている場合(温度上昇局面)、回避回転数に到達しそうになったら、一気に回転数を上げることによって、ファン121による冷却性を犠牲にせずに共振を防ぐことができる。逆に、最適なファン回転数が徐々に下がってきている場合(温度下降局面)では、エラー発生率が高い回転数に到達することを避けるため、現状のファン回転数を維持する制御を行う。
以上の実施例1のサービスプロセッサにおいては、サーバに搭載されたHDDのS.M.A.R.T.情報及びファン回転数を定期的に収集し、HDDのエラーが発生しやすいファン回転数を割り出してデータベース化する。本発明の実施形態においては、データベース化されたファン回転数を回避するようにファンを制御するため、サーバ運用を継続しているうちに変動するHDDとファンとの共振条件の変化に対応できる。そのため、ファンとHDDの共振による振動起因によるHDDの故障を抑制することができ、HDDの故障率を低下させ、サーバの可用性を向上させることができる。
また、通常、HDDのエラー発生数が増加するにしたがって、HDD内部ではリトライする動作が増え結果として処理性能が下がる結果となる。しかしながら、本発明の実施形態によれば、このようなHDDのエラー発生数を抑えることができるため、HDDの性能低下抑止がもたらされる。
(実施例2)
次に、実施例1のHDD111の替わりにCDやDVDなどの光ディスクドライブ112を用いた実施例2について説明する(CD:Compact Disc、DVD:Digital Versatile Disc)。なお、実施例1及び2の構成は、併存させてもよい。
図10は、実施例2に係る管理制御システム102を含むサーバシステム7の機能構成を示すブロック図である。サーバシステム7は、管理制御システム102と、少なくとも一つの光ディスクドライブ112と、少なくとも一つのファン122と、光ディスクドライブコントローラ132と、温度センサ142と、を備える。
管理制御システム102は管理制御システム10に、光ディスクドライブ112はドライブ11に、ファン122はファン12に、光ディスクドライブコントローラ132はドライブ制御装置13に、温度センサ142は温度センサ14に相当する。特に断りのない限り、サーバシステム7の各構成要素は、図3に示したエラー発生頻度算出手段20が有する機能を有するものとする。
管理制御システム102は、バス等を通じてファン122と接続される。また、管理制御システム102は、光ディスクドライブコントローラ132を通じて光ディスクドライブ112と接続される。
(管理制御システム)
図12は、実施例2に係る管理制御システム102に含まれるエラー発生頻度生成装置220の機能構成を示す概念図である。エラー発生頻度生成装置220は、本発明の実施形態に係るエラー発生頻度算出手段20(図3)を実現する装置である。
エラー発生頻度生成装置220は、回転数/光ディスクドライブ情報取得部222と、演算部252と、判定部292と、を有する。回転数/光ディスクドライブ情報取得部222は回転数/ドライブ情報取得部21に、演算部252は演算部25に、判定部292は判定部29に相当する。エラー発生頻度が大きいファン回転数については、回避回転数として内部データベース302(以下、内部DB302と記載)に格納する。
また、回転数/光ディスクドライブ情報取得部222は、光ディスクドライブ情報取得部222と、ファン回転数取得部232とタイミング取得部242と、を含む。光ディスクドライブ情報取得部222はドライブ情報取得部22に、ファン回転数取得部232はファン回転数取得部23に、タイミング制御部242はタイミング制御部24に相当する。
演算部252は、エラー発生数計測部262と、平均ファン回転数計算部272と、エラー発生頻度算出部282と、を有する。エラー発生数計測部262はエラー発生数計測部26に、平均ファン回転数計算部272は平均ファン回転数計算部27に、エラー発生頻度算出部282はエラー発生頻度算出部28に相当する。
エラー発生頻度生成装置220において、光ディスクドライブ情報取得部222及び回転数/光ディスクドライブ情報取得部212以外の構成要素については、図3のエラー発生頻度算出手段20と同じ構成であるため、説明は省略する。また、光ディスクドライブ情報取得部222及び回転数/光ディスクドライブ情報取得部212の動作についても、それぞれドライブ情報取得部22及び回転数/ドライブ情報取得部21の動作と同様であるため、詳細な説明は省略し、概略のみを説明する。
管理制御システム102は、定期的に光ディスクドライブ112のドライブ情報とファン122のファン回転数情報を収集する。そしてポーリング期間内のエラー発生数と平均ファン回転数の連動性、すなわち該ファン回転数下での単位時間当たりのエラー発生頻度を計算する。管理制御システム102は、そのファン回転数を回避回転数として管理制御システム102が持っている内部DB302に記録する。内部DB302へのデータ蓄積については、実施例1と同様である。
そして、管理制御システム102は、回避回転数を内部DB302に蓄積するとともに、内部DB302に蓄積された回避回転数を参照し、ファン122が回避回転数で稼働し続けないようにファン122を制御する。ファン122の制御方法については、実施例1と同様である。
以上の実施例2においては、サーバに搭載された光ディスクドライブの故障率を低下させてサーバの可用性を向上することができるとともに、光ディスクドライブの性能低下を抑止することができる。
以上、実施形態及び実施例を参照して本発明を説明してきたが、本発明は上記実施形態及び実施例に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
1 サーバシステム
2 サーバ
10 管理制御システム
11 ドライブ
12 ファン
13 ドライブ制御装置
14 温度センサ
15 筐体
20 エラー発生頻度算出手段
21 回転数/ドライブ情報取得部
22 ドライブ情報取得部
23 ファン回転数取得部
24 タイミング制御部
25 演算部
26 エラー発生数計測部
27 平均ファン回転数検証部
28 エラー発生頻度算出部
29 判定部
30 記憶手段
40 ファン回転数制御手段
41 回転数/温度取得部
42 雰囲気温度取得部
43 ファン回転数取得部
44 検証部
45 温度変化検証部
46 ファン回転数検証部
47 判断部
48 ファン回転数制御部

Claims (10)

  1. ドライブ及びファンを管理・制御する管理制御システムであって、
    前記ドライブのエラー発生数と前記ファンの回転数とを取得してエラー発生頻度を算出し、前記エラー発生頻度を基に回避すべき前記ファンの回転数である回避回転数を算出するエラー発生頻度算出手段と、
    前記回避回転数を格納する記憶手段と、
    前記ファンの回転数と筐体内部の現在の雰囲気温度とを取得し、前記雰囲気温度に応じて前記記憶手段に格納された前記回避回転数を含まない回転数領域で前記ファンの回転数を制御するファン回転数制御手段と、を備えることを特徴とする管理制御システム。
  2. 前記エラー発生頻度算出手段は、
    ポーリング期間内における前記ドライブのエラー発生数と前記ファンの回転数とを定期的に取得し、単位時間当たりの前記エラー発生数である前記エラー発生頻度とともに前記ポーリング期間中における前記ファンの回転数の平均値である平均回転数を算出し、前記エラー発生頻度と前記平均回転数とを対応させて、設定された閾値を超える前記エラー発生頻度を示す前記平均回転数を前記回避回転数として算出することを特徴とする請求項1に記載の管理制御システム。
  3. 前記ファン回転数制御手段は、
    前記ファンの現在の回転数が前記回避回転数を含む回避すべき回転数帯に含まれる場合、
    前記現在の雰囲気温度が直前の雰囲気温度と比較して高ければ、前記回避すべき回転数帯に含まれないように前記ファンの回転数を上げるように制御し、
    前記現在の雰囲気温度が前記直前の雰囲気温度と比較して低ければ、前記現在の回転数を維持するように前記ファンの回転数を制御し、
    前記現在の回転数が前記回避すべき回転数帯に含まれない場合、
    前記現在の雰囲気温度において最適な回転数になるように前記ファンの回転数を制御することを特徴とする請求項1又は2に記載の管理制御システム。
  4. 前記エラー発生頻度算出手段は、
    前記エラー発生数と前記ファンの回転数とを取得する回転数/ドライブ情報取得手段と、
    前記エラー発生数及び前記ファンの回転数を基に、前記エラー発生頻度及び前記平均回転数を算出する演算手段と、
    前記エラー発生頻度と前記平均回転数とを対応させて、前記エラー発生頻度が前記閾値を超えた場合の前記平均回転数を前記回避回転数として判定する判定手段と、を有し、
    前記ファン回転数制御手段は、
    前記ファンの現在の回転数と前記筐体内部の現在の雰囲気温度とを取得する回転数/温度取得手段と、
    前記雰囲気温度の変化を検証するとともに、前記現在の雰囲気温度における前記ファンの最適な回転数を検証する検証手段と、
    前記現在の回転数における前記ファンの最適な回転数が前記記憶手段に含まれるか否かを確認し、前記雰囲気温度に応じて前記ファンの回転数を設定する判断手段と、
    前記判断手段の設定に応じて前記ファンの回転数を制御するファン回転数制御手段と、を有することを特徴とする請求項に記載の管理制御システム。
  5. 前記判定手段は、
    前記エラー発生頻度の偏差値が前記閾値を超える前記ファンの回転数を前記回避回転数として前記記憶手段に格納することを特徴とする請求項に記載の管理制御システム。
  6. 前記ドライブはハードディスクドライブであって、
    前記エラー発生頻度算出手段は、
    前記ハードディスクドライブのS.M.R.A.T.情報の検査項目のうち、エラー率検知(Seek Error Rate)、データ書き込み中振動(Vibration During Write)、データ読み込み中振動(Vibration During Read)を利用して前記エラー発生数を取得することを特徴とする請求項1乃至5のいずれか一項に記載の管理制御システム。
  7. 前記ドライブとして光ディスクを含むことを特徴とする請求項1乃至6のいずれか一項に記載の管理制御システム。
  8. ドライブ及びファンを管理・制御するサービスプロセッサを備えるサーバシステムであって、
    前記ドライブのエラー発生数と前記ファンの回転数とを取得してエラー発生頻度を算出し、前記エラー発生頻度を基に回避すべき前記ファンの回転数である回避回転数を算出するエラー発生頻度算出手段と、
    前記回避回転数を格納する記憶手段と、
    前記ファンの回転数と筐体内部の現在の雰囲気温度とを取得し、前記雰囲気温度に応じて前記記憶手段に格納された前記回避回転数を含まない回転数領域で前記ファンの回転数を制御するファン回転数制御手段と、を備えることを特徴とするサーバシステム。
  9. ドライブ及びファンを管理・制御する管理制御方法であって、
    前記ドライブのエラー発生数と前記ファンの回転数とを取得してエラー発生頻度を算出し、前記エラー発生頻度を基に回避すべき前記ファンの回転数である回避回転数を算出し、
    前記回避回転数をデータベースに格納し、
    前記ファンの回転数と筐体内部の現在の雰囲気温度とを取得し、前記雰囲気温度に応じて前記データベースに格納された前記回避回転数を含まない回転数領域で前記ファンの回転数を制御することを特徴とする管理制御方法。
  10. ドライブ及びファンを管理・制御する管理制御プログラムであって、
    前記ドライブのエラー発生数と前記ファンの回転数とを取得してエラー発生頻度を算出し、前記エラー発生頻度を基に回避すべき前記ファンの回転数である回避回転数を算出する処理と、
    前記回避回転数をデータベースに格納する処理と、
    前記ファンの回転数と筐体内部の現在の雰囲気温度とを取得し、前記雰囲気温度に応じて前記データベースに格納された前記回避回転数を含まない回転数領域で前記ファンの回転数を制御する処理と、をコンピュータに実行させることを特徴とする管理制御プログラム。
JP2013190150A 2013-09-13 2013-09-13 管理制御システム、サーバシステム、管理制御方法及び管理制御プログラム Active JP5660179B1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013190150A JP5660179B1 (ja) 2013-09-13 2013-09-13 管理制御システム、サーバシステム、管理制御方法及び管理制御プログラム
US14/484,310 US9857852B2 (en) 2013-09-13 2014-09-12 Management control system, server system, management control method, and program recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013190150A JP5660179B1 (ja) 2013-09-13 2013-09-13 管理制御システム、サーバシステム、管理制御方法及び管理制御プログラム

Publications (2)

Publication Number Publication Date
JP5660179B1 true JP5660179B1 (ja) 2015-01-28
JP2015056196A JP2015056196A (ja) 2015-03-23

Family

ID=52437504

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013190150A Active JP5660179B1 (ja) 2013-09-13 2013-09-13 管理制御システム、サーバシステム、管理制御方法及び管理制御プログラム

Country Status (2)

Country Link
US (1) US9857852B2 (ja)
JP (1) JP5660179B1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6079578B2 (ja) * 2013-11-19 2017-02-15 富士通株式会社 ストレージ制御装置、ストレージ制御プログラム、およびストレージ制御方法
JP6464979B2 (ja) * 2015-10-05 2019-02-06 富士通株式会社 回転制御方法、回転制御プログラム、及び情報処理装置
CN106194807B (zh) * 2016-07-06 2018-12-14 联想(北京)有限公司 一种调整风扇转速的方法及电子设备
JP2018018226A (ja) * 2016-07-26 2018-02-01 富士通株式会社 制御方法、制御プログラム及び情報処理装置
US10565046B2 (en) * 2016-09-01 2020-02-18 Intel Corporation Fault detection using data distribution characteristics
US10448438B2 (en) * 2016-09-22 2019-10-15 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Wireless communication between a management controller and one or more drives
US11129308B1 (en) * 2020-04-10 2021-09-21 Ablecom Technology Inc. Server with a vibration sensing function
CN113359963A (zh) * 2021-04-29 2021-09-07 山东英信计算机技术有限公司 一种监控风扇老化的方法、装置、设备及可读介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090067080A1 (en) * 2007-09-07 2009-03-12 Sun Microsystems, Inc. Selectively mitigating multiple vibration sources in a computer system
JP2011066522A (ja) * 2009-09-15 2011-03-31 Oki Networks Co Ltd 監視システム及びプログラム
JP2011165241A (ja) * 2010-02-05 2011-08-25 Nec Corp ファン冷却装置
JP2011170518A (ja) * 2010-02-17 2011-09-01 Nec Corp 状態監視装置及び方法
JP2012048653A (ja) * 2010-08-30 2012-03-08 Nec Computertechno Ltd 電子機器
JP2012059312A (ja) * 2010-09-08 2012-03-22 Traffic Shimu:Kk データ記録装置の耐振動性能測定装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4183985B2 (ja) 2002-07-04 2008-11-19 シャープ株式会社 光ディスク装置
US8000839B2 (en) * 2008-02-04 2011-08-16 Oracle America, Inc. Method and apparatus for actively canceling vibrations in a computer system
US8504209B2 (en) * 2008-07-29 2013-08-06 Oracle America, Inc. Controlling a device that generates vibrations in a computer system
US7920974B2 (en) * 2009-02-23 2011-04-05 Oracle America, Inc. Generating a vibration profile for a rotating cooling device in a computer system
US9036291B1 (en) * 2014-08-22 2015-05-19 Dell Products, Lp Systems and methods for asynchronous-frequency tracking of disk drive rotational vibration (RV) performance with position error signal (PES)

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090067080A1 (en) * 2007-09-07 2009-03-12 Sun Microsystems, Inc. Selectively mitigating multiple vibration sources in a computer system
JP2011066522A (ja) * 2009-09-15 2011-03-31 Oki Networks Co Ltd 監視システム及びプログラム
JP2011165241A (ja) * 2010-02-05 2011-08-25 Nec Corp ファン冷却装置
JP2011170518A (ja) * 2010-02-17 2011-09-01 Nec Corp 状態監視装置及び方法
JP2012048653A (ja) * 2010-08-30 2012-03-08 Nec Computertechno Ltd 電子機器
JP2012059312A (ja) * 2010-09-08 2012-03-22 Traffic Shimu:Kk データ記録装置の耐振動性能測定装置

Also Published As

Publication number Publication date
US9857852B2 (en) 2018-01-02
JP2015056196A (ja) 2015-03-23
US20150081132A1 (en) 2015-03-19

Similar Documents

Publication Publication Date Title
JP5660179B1 (ja) 管理制御システム、サーバシステム、管理制御方法及び管理制御プログラム
US8504209B2 (en) Controlling a device that generates vibrations in a computer system
US8108697B2 (en) Controlling the power utilization of a computer system by adjusting a cooling fan speed
EP2326893B1 (en) Monitoring the health of a cryocooler
US9099136B2 (en) Method and system for hard disk drive throughput optimization using position error signaling
US20220187821A1 (en) Estimating the remaining useful life for cooling fans based on a wear-out index analysis
US8467279B2 (en) Magnetic and optical rotating storage systems with audio monitoring
KR20070094427A (ko) 팬의 기류 발생 능력의 열화를 검출하는 능력을 구비한 장치, 냉각 기능 감시 장치 및 팬 열화 모니터링 프로그램 기억 매체
CN113179665A (zh) 使用基于纠错的度量来识别性能不佳的数据存储设备
US8467912B2 (en) Controlling a cooling fan for a storage array
US20110093132A1 (en) Platform-independent thermal management of components in electronic devices
US9384077B2 (en) Storage control apparatus and method for controlling storage apparatus
US7508614B1 (en) Data storage drive having movement sensors
US10754400B2 (en) Control method for data storage system, data storage module, and computer program product
US9651320B2 (en) ICT equipment
JP2011209146A (ja) 電子機器、異常判定プログラム及び異常判定方法
JP6885626B2 (ja) サーバ装置、制御方法及びプログラム
JP2006252608A (ja) 光ディスク装置の冷却装置および光ディスク装置
US11449374B2 (en) Method and apparatus for proactively countering the effects of storage device failure
JP6536062B2 (ja) 騒音低減装置、電子機器、騒音低減方法、および、騒音低減プログラム
CN114816937A (zh) 一种保护服务器部件的方法、装置、设备及可读介质
JP2017079086A (ja) スロット診断プログラム、スロット診断装置およびスロット診断方法

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141104

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141117

R150 Certificate of patent or registration of utility model

Ref document number: 5660179

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350