JP6277912B2 - 電子機器の温度管理システム、温度管理方法、および温度管理プログラム - Google Patents

電子機器の温度管理システム、温度管理方法、および温度管理プログラム Download PDF

Info

Publication number
JP6277912B2
JP6277912B2 JP2014174425A JP2014174425A JP6277912B2 JP 6277912 B2 JP6277912 B2 JP 6277912B2 JP 2014174425 A JP2014174425 A JP 2014174425A JP 2014174425 A JP2014174425 A JP 2014174425A JP 6277912 B2 JP6277912 B2 JP 6277912B2
Authority
JP
Japan
Prior art keywords
temperature
power consumption
intake air
electronic device
air temperature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014174425A
Other languages
English (en)
Other versions
JP2016051213A (ja
Inventor
雅俊 小川
雅俊 小川
児玉 宏喜
宏喜 児玉
浩史 遠藤
浩史 遠藤
裕幸 福田
裕幸 福田
近藤 正雄
正雄 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2014174425A priority Critical patent/JP6277912B2/ja
Priority to US14/808,499 priority patent/US10061365B2/en
Publication of JP2016051213A publication Critical patent/JP2016051213A/ja
Application granted granted Critical
Publication of JP6277912B2 publication Critical patent/JP6277912B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • G06F1/206Cooling means comprising thermal management
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/20Modifications to facilitate cooling, ventilating, or heating
    • H05K7/20709Modifications to facilitate cooling, ventilating, or heating for server racks or cabinets; for data centers, e.g. 19-inch computer racks
    • H05K7/20718Forced ventilation of a gaseous coolant
    • H05K7/20736Forced ventilation of a gaseous coolant within cabinets for removing heat from server blades
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/20Modifications to facilitate cooling, ventilating, or heating
    • H05K7/20709Modifications to facilitate cooling, ventilating, or heating for server racks or cabinets; for data centers, e.g. 19-inch computer racks
    • H05K7/20836Thermal management, e.g. server temperature control
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Thermal Sciences (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • Feedback Control In General (AREA)
  • Cooling Or The Like Of Electrical Apparatus (AREA)
  • Manufacturing & Machinery (AREA)
  • Automation & Control Theory (AREA)

Description

本発明は、電子機器の温度管理システム、温度管理方法、および温度管理プログラムに関する。
高度情報化社会の到来にともなって計算機で多量のデータが扱われるようになり、データセンタ等の施設において同一室内に多数の計算機を設置して一括管理するケースが増えている。例えば、データセンタの計算機室に多数のラック(サーバラック)を設置して、各ラックにそれぞれ複数の計算機(サーバ)を収納する。計算機の稼動状態に応じて各計算機にジョブを有機的に配分し、大量のジョブを効率的に処理している。
計算機は稼働にともなって多量の熱を発生する。計算機内の温度が高くなると誤動作や故障の原因となるため、冷却ファンを使用してラック内に冷気を取り込み、計算機内で発生した熱をラックの外に排出している。計算機の発熱体(CPU等)の温度を目標値以下にするために、PID(Proportional-Integral-Derivative)制御等を用いて冷却ファンの回転数をフィードバック制御している。
他方、将来にわたる操作量を最適化するための制御方法として、モデル予測制御がある。モデル予測制御は、予測モデルを用いて一定の予測区間の被制御量(たとえばCPU温度)の変化を予測し、被制御量が望ましい形で目標値に到達するように操作量を決定する方法である。制御サイクルごとに評価関数に基づいて操作量を評価し、評価値が最も高い操作量を求めることで走査量が決定される。
予測モデルとは制御対象の動的特性を再現するモデルであり、動的特性とは制御対象に入力される操作量と制御対象から出力される被制御量の時系列変化の関係である。モデル予測制御では、予測モデルによる動的特性の再現性の精度がその制御性能に大きく影響を与える。モデル予測制御で用いられる予測モデルとして非線形モデルを用いる解法も提案されている。しかし、非線形モデルでは予測モデルが大規模あるいは複雑な場合に最適な操作量の解を導出することができない、あるいは計算処理が制御時間内に完了しないといった問題がある。そのため、一般的には線形の予測モデルが用いられており、線形モデルを用いたときのモデル予測制御の解法も確立されている。
特開2012−251770号公報
線形の予測モデルを用いて、モデル予測制御によって送風量等を制御して発熱体の温度を管理する場合、すべての動作領域の特性を精度よく再現することが難しいことがある。電子機器の吸気温度や使用率(稼働率)等の条件によって、冷却ファンの風量に対するCPU温度の応答特性が大きく変化するからである。すなわち、実際の計算機の動作条件が予測モデルが表現する動作条件から離れた場合に制御性能が低下することがあり、状況によって制御性能にばらつきが生じる。
そこで、電子機器の動作条件が変化した場合にも制御性能の低下を抑制することのできる温度制御技術を提供することを課題とする。
ひとつの態様では、温度管理システムは、
電子機器の発熱体の温度、前記電子機器の消費電力、および前記電子機器の吸気温度を検出する検出部と、
前記電子機器を冷却する冷却装置と、
前記発熱体の温度が目標値に近づくように前記冷却装置の操作量を制御する制御部と、
を有し、
前記制御部は、
前記電子機器の前記消費電力と前記吸気温度の取り得る動作領域を複数の動作範囲に分割し、分割された前記動作範囲ごとに前記冷却装置の前記操作量を制御する複数のコントローラと、
前記複数のコントローラに対応して前記動作範囲ごとに構築され、前記動作範囲の前記消費電力と前記吸気温度の条件下で前記発熱体の将来の温度を予測する複数の予測モデルと、
前記複数の予測モデルのうち前記電子機器の現在の動作条件に最も近い動作範囲で構築された予測モデルを用いるコントローラを選択するコントローラ切替部と、
を有し、
前記コントローラ切替部は、前記検出部で検出された現在の消費電力と現在の吸気温度とを要素とする第1のベクトルと、前記各予測モデルを構築したときの条件である前記消費電力と前記吸気温度とを要素とする第2のベクトルとの間のベクトル間距離を算出し、前記ベクトル間距離が最短となる予測モデルに対応する前記コントローラを選択し、
前記選択されたコントローラは、対応する予測モデルを用いて前記発熱体の将来の温度を予測し、前記予測された温度に基づいて前記冷却装置の操作量を決定する。
電子機器の動作条件が変化した場合でも、電子機器の温度制御における制御性能の低下を抑制することができる。
線形の予測モデルによる計算結果の一例を示す図である。 線形の予測モデルを用いてモデル予測制御する場合に生じる問題点を説明する図である。 電子機器の取り得る動作範囲を複数の領域に分割する例を示す図である。 実施形態の温度制御システムが適用されるデータセンタの一例を示す図である。 実施形態の温度制御システムの構成例を示す図である。 温度制御システムの制御部の構成例を示す図である。 図6の制御部における切替制御部の構成例を示す図である。 実施形態の温度制御方法のフローチャートである。 実施形態の制御結果を示す図である。 実施形態の温度制御による消費電力量を従来法と比較して示す図である。 実施形態の温度制御による効果を示す図である。
第1の実施形態
図1及び図2は、一般的なモデル予測制御に生じる技術課題を説明する図である。たとえば伝達関数(動的モデル)を用いて将来の予測区間の被制御量であるCPU温度の変化を予測し、予測結果に基づいて、望ましい制御結果をもたらす操作量であるファンの吹き出し量(送風量)を設定する。図1の例では、予測モデルに基づいて計算されたCPU温度(破線)と、実際のCPU温度(実線)とがほぼ一致し、予測モデルはCPUの温度変化をよく表現している。このときの計算機の動作条件は、たとえば、吸気温度が20℃、CPU使用率50%であったとする。
発明者らは、計算機の動作条件の範囲によっては、用いられている予測モデルが常に最適なモデルになるとは限らないことを見出した。図2に示すように、計算機のCPU使用率の条件と吸気温度の条件が変わることによって、CPU温度の応答特性が大きく異なる。
図2で、CPU使用率50%、吸気温度20℃の動作条件(1)では、CPU温度とファン風量の動的特性が図1で説明した予測モデルが計算したCPU温度とファン風量の動的特性と同様の特性であることを示している。しかし、CPU使用率50%、吸気温度が30℃の動作条件(2)では、ファン風量とCPU温度の動的特性は、図1で説明した予測モデルが計算したCPU温度とファン風量の動的特性と異なる。CPU使用率100%、吸気温度が30℃の動作条件(3)やCPU使用率100%、吸気温度が20℃の動作条件(4)でも、ファン風量とCPU温度の動的特性は、図1で説明した予測モデルが計算したCPU温度とファン風量の動的特性と大きく異なる。
発明者らは、利用するモデルが表現できる動作条件(図2の例では動作条件(1))と、実際の電子機器の動作条件の距離が近いときは予測モデルの再現性が高く、その制御性能も高く、遠いときは予測モデルの再現性が低く、その制御性能も低くなるという知見に基づいて、以下の解決法に思い至った。
計算機の動作領域を複数の動作範囲に分割し、それぞれの動作範囲に対応して異なる予測モデルを備えたコントローラを複数用意し、現在の動作条件(環境条件)に近い予測モデルによるコントローラを適応的に選択して切り替える。
予測モデルの選択は、計算機の現在の消費電力と現在の吸気温度を要素とする第1のベクトルと、各予測モデルを構築したときの条件である消費電力と吸気温度を要素とする第2のベクトルの間のベクトル間距離が最も短くなる予測モデルを選択する。これにより、動作条件の変化による制御性能のばらつきを抑制し、CPU温度のオーバーシュートを低減する。
図3は、計算機の動作領域を複数の動作範囲に分割する例を示す図である。動作範囲は均等に4つに分割してもよいし、図3のように均等に16の動作範囲に分割してもよい。また、均等に動作範囲を分割するのではなく、無作為に設定した動作条件下の実験データからそれぞれ予測モデルを構築し、その動作条件下の近傍範囲を各動作範囲として分割することもできる。このとき、動作範囲内における複数の予測モデルの動作条件の分布ばらつきによって分割される各近傍範囲(各動作範囲)も変化し、各動作範囲の大きさも一律に同じではない。CPU使用率は計算機の消費電力と相関関係にあるため、CPU使用率を消費電力に置き換えてもよい。
図4は、実施形態の温度制御システムが適用されるデータセンタの一例を示す模式図である。図4(A)は上面図、図4(B)は側面図である。実施形態では、外気を利用して計算機(サーバ)を冷却するモジュラー型データセンタを例として用いる。
図4に示すモジュラー型データセンタは、直方体形状のコンテナ(筐体)10と、コンテナ10内に配置された冷却ファンユニット12と、複数のラック13とを有する。各ラック13には、複数の計算機14が収納されている。
コンテナ10の相互に対向する2つの面のうちの一方には吸気口11aが設けられ、他方には排気口11bが設けられている。また、冷却ファンユニット12とラック13との間の空間の上には、仕切り板15が配置されている。
冷却ファンユニット12には複数の冷却ファン12aが設けられている。図示はしないが、吸気口11aと排気口11bには、雨水の侵入を防ぐ雨水侵入防止板や虫等の侵入を防ぐ防虫網が設けられていてもよい。
コンテナ10内の空間は、冷却ファンユニット12、ラック13、及び仕切り板15によって、外気導入部21と、コールドアイル22と、ホットアイル23と、暖気循環路24に分割されている。外気導入部21は吸気口11aと冷却ファンユニット12との間の空間であり、コールドアイル22は冷却ファンユニット12とラック13との間の空間であり、ホットアイル23はラック13と排気口11bとの間の空間である。
ラック13は、コールドアイル22側の面が吸気面、ホットアイル23側の面が排気面となるように配置される。
暖気循環路24は、ラック13と仕切り板15の上方の空間であり、ホットアイル23と外気導入部21との間を連絡している。暖気循環路24には、ラックから排気された暖気の循環量を調整するためのダンパー17が設けられている。
このようなモジュラー型データセンタにおいて、冷却ファンユニット12の冷却ファン12aが回転し、吸気口11aを介して外気導入部21に外気が導入される。図示はしないが、外気導入部21に、外気温が高いときに水の気化熱を利用して導入された外気の温度を下げる気化式冷却装置を設置してもよい。外気導入部21内に導入されたエアーは、冷却ファンユニット12を介してコールドアイル22に移動し、更にラック13の吸気面からラック13内に入って各計算機14を冷却する。
計算機14を冷却することにより温度が上昇したエアー(暖気)は、ラック13の排気面からホットアイル23に排出され、排気口11bから屋外に排出される。外気温が高いときにはダンパー17を閉状態とし、ホットアイル23から外気導入部21に暖気が移動しないようにする。外気温が更に高いときには気化式冷却装置に水を供給し、気化式冷却装置を介して外気導入部21内に外気を導入する。外気が気化式冷却装置を通過する際に水が気化して気化熱を奪うため、外気導入部21には外気温よりも低温のエアーが導入される。
一方、外気温が低く、ラック13内に導入されるエアーの温度が予め設定された許容下限温度よりも低くなるおそれがあるときにはダンパー17を開状態とする。これにより、ホットアイル23から暖気循環路24を介して外気導入部21に暖気の一部が戻り、ラック13内に導入されるエアーの温度が上昇する。
図5は、電子機器の温度制御システム1の構成を表すブロック図である。電子機器の温度制御システム1は、制御部30、目標値設定部31、CPU温度検出部32、冷却ファンユニット12、吸気温度検出部33、計算機電力検出部34、及び制御パラメータ設定部35を含んでいる。計算機14は電子機器14の一例であり、CPU14aは発熱体の一例である。
制御部30は、冷却ファンユニット12の各冷却ファン12aの回転数を制御する。制御部30は、たとえばマイクロコンピュータ、FPGA(Field-Programmable Gate Array)、及びプログラマブルロジックコントローラ(PLC)としてハードウェアとして構成することができる。あるいは、プログラムとして準備し、汎用コンピュータに前記プログラムをロードしてソフトウェア的に構成することもできる。
目標値設定部31は、CPU温度の目標値を設定する。CPU温度検出部32は、たとえばCPU14aと同一チップ内に搭載される温度センサである。検出されたCPU温度は、計算機14内に設けられた図示しない通信器を介して、制御部30に伝送される。CPU温度検出部32としての温度センサは、CPU14aと同一チップ内に配置する替わりに、CPU14aのパッケージに密着して配置されてもよい。
冷却ファンユニット12は、CPU14aを含む各計算機14を冷却する冷却装置である。冷却装置は、冷却ファン12aのほかに、冷却ファン12aと気化式冷却装置の組み合わせや、冷却ファン12aとエアコンを用いて構成することもできる。
吸気温度検出部33は、計算機14が吸入する空気の温度を測定する。計算機消費電力検出部34は、計算機14の電源コンセントが接続された電源タップから計算機の消費電力値を検出する。上述のように、計算機14の消費電力は、計算機14の稼働率と相関関係がある。
制御パラメータ設定部35は、制御部30で用いられる制御パラメータを設定する。制御部30と各計算機14との間の信号の送受信は、たとえばUDP(User Datagram Protocol)通信を介して行うが、UDP通信に限定するものではない。
図6は、制御部30の機能ブロック図である。制御部30は、CPU温度収集部42、計算機消費電力収集部36、最高温度演算部37、平均温度演算部38、最高消費電力演算部39、重みつきベクトル間距離演算部40、切替制御部41、及び操作量記憶部43を有する。
CPU温度収集部42は、CPU温度検出部32で測定されたCPU温度を収集する。計算機消費電力収集部36は、計算機消費電力検出部34で測定された計算機消費電力を収集する。最高温度演算部37は、CPU温度収集部42が収集したCPU温度のうち最も高い水準にある最高CPU温度を特定し、出力する。
各計算機14で許容する上限温度が異なる場合は、最高温度演算部37で基準化を行ってもよい。基準化にはいくつかの方法が考えられる。たとえば、計算機φの基準化した温度ynor(φ)は、計算機φの上限温度ylim(φ)と計算機φの最小温度ymin(φ)とによって、式(1)のように基準化することができる。
Figure 0006277912
式(1)の意味は、上限温度ylim(φ)までの到達率に対して100を乗算したものであり、その最も高い水準にある最高CPU温度ycpu_maxは、式(2)で求められる。
Figure 0006277912
他の基準化の方法として、計算機φの現在のCPU温度ycur(φ)と上限温度ylim(φ)の偏差の最大値に100を加算した式(3)を100℃以下となるように制御する方法がある。
Figure 0006277912
平均温度演算部38は、吸気温度検出部33で複数箇所の吸気温度を測定している場合に吸気温度を収集し、それらの平均値を計算して出力する。
最高消費電力演算部39は、計算機消費電力検出部34が収集した消費電力のうち最も高い水準にある最高消費電力を特定し、出力する。
重みつきベクトル間距離演算部40は、平均温度演算部38が出力した現在の吸気温度と、最高消費電力演算部39が出力した現在の計算機消費電力とを要素とするベクトルと、切替制御部41が有する各予測モデルの吸気温度と計算機消費電力の条件値を要素とするベクトルの間の重みつきベクトル間距離を計算し、出力する。重みつきベクトル間距離の算出方法については、後述する。
切替制御部41は、消費電力と吸気温度を条件とする計算機14の動作領域を複数の動作範囲に分割し、分割した動作範囲ごとに将来のCPU温度を推定する予測モデルを構築する。切替制御部41は、各予測モデルに対応して配置される複数のコントローラの中から、最適な予測モデル、すなわち、重みつきベクトル間距離が最も短くなる予測モデルを有するコントローラを選択して切り替える。各コントローラは、予測されるCPU温度が許容範囲に収まるように冷却ファン12aを制御する。
操作量記憶部43は、各コントローラ52がCPU温度の予測値に基づいて決定した冷却ファン12aの操作量を記憶する。
図7は、切替制御部41の機能ブロック図である。切替制御部41は、分割された動作範囲1〜Nに対応するコントローラ52−1〜52−N(適宜、「コントローラ52」と総称する)と、コントローラ52−1〜52−Nの間を切り替えるコントローラ切替部51を有する。コントローラ切替部51は、重みつきベクトル間距離演算部40が求めた距離に基づいて、最も距離の短い条件値のCPU温度予測モデル53を特定し、そのCPU温度予測モデル53を備えたコントローラ52に切り替えを行う。ここで、最も距離の短い条件値のCPU温度予測モデル53が複数存在する場合に備えて、コントローラには優先順位を定義する。最も距離の短い条件値のCPU温度予測モデル53が複数存在する場合に、最も距離の短い条件値のCPU温度予測モデル53を備えたコントローラ52から優先順位の高い1つのコントローラを選定し、切り替える。
各コントローラ52は、それが用いるCPU温度予測モデル53と、補正部54と、評価関数55と、最適化部56を有し、CPU温度予測モデル53を用いて計算された将来のCPU温度変化に基づいて、冷却ファン12aの操作量を計算する。
CPU予測モデル53は、最高温度演算部37の出力、平均温度演算部38の出力、最高消費電力演算部39の出力、および操作量記憶部43から取得した過去の冷却ファン12aの操作量と現在の冷却ファン12aの操作量から、CPU温度の予測値を算出する。補正部54は、算出された予測値を補正する。
評価関数55は、補正部54で補正されたCPU温度の予測値と、目標値設定部31で設定された目標値との偏差を重み付けしてコストを算出する。最適化部56は、現在から将来に向かう一定の予測区間について、予め設定された制約条件を満たし、かつ算出されたコスト(評価値)を最小とするように現在の冷却ファン12aの操作量を演算する。制約条件については後述する。最適化部56は、最適化問題を解く計算部であり、必ずしも図7のように動作範囲ごと(コントローラ52ごと)に分ける必要はなく、複数のコントローラ52の間で共通化してもよい。
図8は、実施形態の温度制御方法のフローチャートである。制御部30は、一定時間毎(例えば1秒毎)に図8の処理フローを実行する。
ステップS11で、制御部30は、CPU温度検出部32から各計算機14の現在のCPU温度を、吸気温度検出部33から現在の吸気温度を、計算機消費電力検出部34から計算機14の現在の消費電力を取得する。
ステップS12で、制御部30は、目標値設定部31で設定されたCPUの温度目標値と、制御パラメータ設定部35で設定された各種パラメータを取得する。各種パラメータは、コスト関数の目標値に近づける重みの目標値追従パラメータ、コスト関数の操作量の大きさを0に近づける重みの操作量低減パラメータ、および、コスト関数の操作量の変動幅を小さくする重みの操作量変動幅パラメータを含む。ステップS11とS12の実施は順不同である。
ステップS13で、制御部30の最高温度演算部37にて、CPU温度収集部42が収集した各計算機14のCPU温度のうち最も高い水準にあるCPU温度を特定し、出力する。複数の計算機14間で許容される上限温度が異なる場合は、式(1)及び(2)による基準化や、式(3)による基準化によりCPU温度を基準化してから、その最大値を用いる。
ステップS14で、制御部30の最高消費電力演算部39にて、計算機消費電力収集部36が収集した各計算機14の消費電力のうち最も高い水準にある消費電力を特定し、出力するとともに、平均温度演算部38にて、各測定点での吸入空気温度の平均値を出力する。ステップS13とS14の実施は順不同である。
ステップS15で、制御部30の重みつきベクトル間距離演算部40にて、重みつきのベクトル間距離を計算する。具体的には、式(4)により、最高消費電力演算部39が出力した計算機消費電力の現在値v1_cを第1要素、平均温度演算部38が出力した現在の吸気温度v2_cを第2要素とするベクトルvcと、切替制御部41が有する予測モデルの集合における予測モデルρの計算機消費電力v1_mを第1要素、吸気温度v2_mを第2要素とするベクトルvmの重みつきユークリッドノルムdy(k,ρ)を計算し、出力する。
Figure 0006277912
ここで、w1は計算機消費電力(第1要素)に対する重み係数であり、w2は吸気温度(第2要素)に対する重み係数である。kは制御周期のサイクル数、ρは切替制御部41が有する予測モデルの集合における予測モデルのインデックス(要素番号)である。
1とw2はCPU温度に対する吸気温度や計算機消費電力の寄与率によって決める。寄与率は、CPU温度と計算機消費電力の相関係数の絶対値及びCPU温度と吸気温度の相関係数の絶対値、あるいはt検定によって求まるF値を用いることができる。相関係数を用いる場合は、たとえばCPU温度と吸気温度の相関係数の絶対値が0.5であれば、w1を0.5とし、CPU温度と計算機消費電力の相関係数の絶対値が0.9であれば、w2を0.9に設定する。
制御部30は、切替制御部41が有するすべての予測モデルについて重みつきベクトル間距離dy(k,ρ)を計算する。
ステップS16で、切替制御部41が有する予測モデルρの中で最も距離の短くなる予測モデルρminを式(5)により特定し、ρminを備えたコントローラ52を選択して切り替える。最も距離の短くなる予測モデルρminが複数存在する場合は、ρminを備えたコントローラ52について、あらかじめ定義した優先順位の高いものを選択して切り替える。
Figure 0006277912
ステップS17で、制御部30で選択されたコントローラ52のCPU温度予測モデル53にて、操作量である冷却ファン回転数u(k)からCPU温度を予測するモデルを準備する。モデルは式(6)で表現される。
Figure 0006277912
ここで、y(k+1)は1周期先の将来のCPU温度である。
実施形態では、式(7)、(8)で表される状態空間モデルを用いる。
Figure 0006277912
ここで、x(k)はk時点における状態変数とよばれ、n次元ベクトルである。Aはn×nの行列、Buはn次元ベクトル、Cはn次元ベクトルである。A、Bu、およびCは、事前に行った実験データよりシステム同定によって求まる。システム同定の手法としては、予測誤差法や部分空間同定法などがある。また、A、Bu、およびCは、CPU温度の動的特性を表現する物理モデルの微分方程式が導出できる場合は、微分方程式の線形化(テーラー展開)を行うことで導出することもできる。nはモデルの次数ndとむだ時間dtで決まり、n=nd+dtである。実施形態では、dtは冷却ファン12aのむだ時間であり、dtを12秒とする。一例として状態空間モデルを用いているが、モデルの表現方法は重回帰式モデルであってもよい。
選択されたコントローラ52の補正部54は、式(9)により実測値と予測値の差を補正する。
Figure 0006277912
ここで、
Figure 0006277912
は、式(7)と式(8)に基づき、k時点までの利用可能情報に基づいてk+1時点を予測したCPU温度の予測値、yreal(k)は1周期前の過去の実測値、y(k|k-1)は1周期前の過去の予測値である。
選択されたコントローラ52の最適化部56は、現在から将来の一定時間にわたる予測区間Pについて、制約条件を満足し、かつ評価関数55を最小にする現在の操作量を計算する。ここでは、説明を分かりやすくするため、操作量u(k-dt)のむだ時間dtの標記を省略する。将来区間の操作量は操作量の変化量Δuによって1周期先を
Figure 0006277912
と表現できる。iは予測区間Pの時刻を表現するインデックスである。予測区間の予測値yを評価するために、予測モデル53の式(7)と式(8)と、補正部54の式(9)にインデックスiを追加すると、式(11)〜(13)で表される。
Figure 0006277912
式(11)〜(13)を用いて、制約条件を満たし、かつコスト関数Jを最小とする操作量の変化量Δuを計算する。
制約条件は、たとえば式(14)で表される。
Figure 0006277912
コスト関数Jは式(15)で表される。
Figure 0006277912
制約条件を満たし、かつ式(15)のコスト関数Jを最小にする操作量の変化量Δuの入力列は、式(16)で表現される。
Figure 0006277912
ここで、Pは将来の一定時間にわたる予測区間(予測ホライズン)、mは操作量の変化を考慮する区間(制御ホライズン)であり、P≧mとする。実施形態ではPを100、mを1に設定する。Q、RΔu、Ruは重み行列である。
式(15)の第一項は、制御量yを目標値設定部31で設定した目標値rに近づける操作である。Qは制御量を目標値に近づける操作の重みであり、制御パラメータ設定部35で設定した目標値追従パラメータである。第二項は、操作量の変化量Δuを0に近づける操作である。RΔuは操作量の変化量をゼロに近づける操作の重みであり、制御パラメータ設定部35で設定した操作量低減パラメータである。重みRΔuが小さいと変化量Δuは大きく、重みRΔuが大きいと変化量Δuは小さくなる。第三項は、操作量を目標操作量utargetに近づける操作であり、実施形態ではutargetは0とする。Ruは操作量を目標操作量に近づける操作の重みであり、制御パラメータ設定部35で設定した操作量変動幅パラメータである。
式(16)により求まった最適入力列{Δuopt(k|k), …, Δuopt(m-1+k|k)}の先頭要素Δuopt(k|k)を抽出して、現在の操作量u(k)を式(17)から計算する。
Figure 0006277912
コスト関数Jを最小にする最適化ソルバーは、遺伝的アルゴリズム(GA:Genetic Algorithm)や粒子群最適化(PSO:Particle Swarm Optimization)などの近似解を探索するメタヒューリスティックな数値解法を用いることもできるが、実施形態では、2次計画問題を解くための逐次2次計画法(SQPP:Sequential Quadratic Programming)を用いる。
切り替えられたコントローラが計算した式(17)の現在の操作量u(k)を、すべてのコントローラ52が備える予測モデルに相当する式(7)と式(8)における式(7)に代入し、さらに式(8)を計算して、各コントローラ52が備える予測モデルの状態量x(k+1)と予測値
Figure 0006277912
を更新する。
このように、実施形態では、計算機の消費電力と吸気温度を要素とする現在値のベクトルと、予測モデルの条件値である消費電力と吸気温度を要素とするベクトルの間の重みつけベクトル間距離に基づいて現在の動作条件に最も近い予測モデルを備えたコントローラを選定する。予測モデルを備えたコントローラを適応的に切り替えることによって、単一の線形の予測モデルでは良好に再現できない動作範囲においても、制御性能を低下させることなく冷却ファンを制御して、計算機の温度管理をすることができる。
図9は、実施形態の手法による制御結果を示す図である。図9(A)は、分割された動作範囲を代表する条件に対応する予測モデルの例を示す。図9(B)は各予測モデルを備えたコントローラの例を示す。図9(C)は、実施形態の方法で選択された最適な予測モデルのコントローラ1により制御されたCPU温度を、現在の動作条件と異なる動作範囲の予測モデルを備えるコントローラ2〜4による温度制御と比較して示す図である。
動作範囲として、吸気温度の動作範囲を2つに分けて、それぞれを20℃と30℃の2つの代表条件で表現し、計算機消費電力の動作範囲を2つに分けて、200Wと320Wの2つの代表条件で表現し、4つの予測モデルを作成する。
(1) 吸気温度20℃と計算機消費電力200Wの条件での予測モデルNo.1
(2) 吸気温度30℃と計算機消費電力320Wの条件での予測モデルNo.2
(3) 吸気温度30℃と計算機消費電力200Wの条件での予測モデルNo.3
(4) 吸気温度20℃と計算機消費電力320Wの条件での予測モデルNo.4
予測モデルNo.1を備えたコントローラをコントローラNo.1、予測モデルNo.2を備えたコントローラをコントローラNo.2、予測モデルNo.3を備えたコントローラをコントローラNo.3、予測モデルNo.4を備えたコントローラをコントローラNo.4とする。
計算機の動作条件を吸気温度20℃、計算機消費電力200Wとして、上記4つのコントローラによって制御を行う。計算機消費電力とCPU温度の相関係数が0.9、吸気温度とCPU温度の相関係数が0.5なので、式(4)における計算機消費電力(ベクトルの第1要素)に対する重み係数w1を0.9、吸気温度(ベクトルの第2要素)に対する重み係数w2を0.5に設定する。また、CPU温度の目標値を68℃に設定する。
実施形態の方法を用いて、各検出部からの吸気温度と計算機消費電力の現在値を要素とするベクトルと、各コントローラが保有する予測モデルNo.1〜No.4の条件値を要素とするベクトルの間の重みつきベクトル間距離を計算した結果、モデルNo.1が選定された。
図9(B)において、モデルNo.1を備えたコントローラNo.1によって制御されたCPU温度の変化を破線で示す。選択されたコントローラNo.1では、現在の条件と予測モデルの条件が一致しているため、CPU温度をオーバーシュートさせることなく、高応答で制御できている。すなわち、CPU温度を過剰に上昇させることなく、温度管理がなされている。これに対して、コントローラNo.2から4では、予測モデルが表現する動作条件が現在の条件から離れているため、オーバーシュートしている。
実施形態では重みつきベクトル間距離を用いているため、現在の吸気温度が25℃、計算機消費電力260Wなど、分割した動作範囲の境界にある条件であっても、重み係数を導入した式(4)から一意にコントローラを決定することができる。
図10と図11は、実施形態の方法による冷却ファン12aの消費電力の節減効果を、従来方法と比較して示す図である。計算機14のCPU温度が68℃を超えないように制御する場合を例にとる。
CPU温度が目標値を超えないように、オーバーシュート分をあらかじめ考慮して目標値を低めに設定する。実施形態の温度管理方法では、図10(A)に示すようにオーバーシュートがほとんどないため、目標値を67.95℃に設定すればよい。すなわち、冷却量が少なくなるため、冷却ファン12aの送風量を小さくすることができる。このときの冷却ファン12aの消費電力量は978Whである。
他方、動作条件が実際の動作条件と異なる予測モデルを有するコントローラNo.4で冷却ファン12aを制御すると、オーバーシュートを加味して目標値を67.5℃に設定する必要がある。計算機14に対する冷却量が多くなり、冷却ファン12aの消費電力量は1046Whとなる。
上記の比較結果を、図11にまとめる。実施形態では、現在の計算機の動作条件に最も近い条件の予測モデルのコンピュータを選択することで、約6.5%の電力を削減することができる。従来法では、オーバーシュートを考慮して目標温度あらかじめ低めに設定していたことに対し、実施形態の方法では、目標値をCPUの許容上限温度の近傍に設定することができるため、冷却ファン12aの消費電力を低減することができる。
実施形態の電子機器の温度管理をコンピュータプログラムによって実現してもよい。この場合、制御コンピュータに以下の手順を実行させるプログラムをインストールする。
(a) 検出部によって検出された電子機器の発熱体の温度、前記電子機器の消費電力、および前記電子機器の吸気温度を収集する処理;
(b) 前記電子機器の前記消費電力と前記吸気温度の取り得る動作領域を複数の動作範囲に分割し、分割された前記動作範囲ごとに前記冷却装置の前記操作量を制御する複数のコントローラを設定する処理;
(c) 前記複数のコントローラに対応して、前記動作範囲ごとに、当該動作範囲の前記消費電力と前記吸気温度の条件下で前記発熱体の将来の温度を予測する複数の予測モデルを構築する処理;
(d) 前記複数の予測モデルのうち前記電子機器の現在の動作条件に最も近い動作範囲で構築された予測モデルを用いるコントローラに切り替える処理であって、現在の消費電力と現在の吸気温度を要素とする第1のベクトルと、前記各予測モデルを構築したときの条件である前記消費電力と前記吸気温度とを要素とする第2のベクトルとの間のベクトル間距離を算出し、前記ベクトル間距離が最短となる予測モデルに対応する前記コントローラに切り替える処理;および、
(e) 前記切り替えられたコントローラによって前記発熱体の将来の温度を予測し、前記予測された温度に基づいて前記冷却装置の操作量を決定する処理。
この温度管理プログラムを用いることで、電子機器の動作条件が変化する環境においても、制御性能の低下を抑制することができる。電子機器の温度制御時にオーバーシュートを抑制しつつ、CPU温度を目標温度またはその近傍に制御することができる。また、温度制御に用いる冷却装置の消費電力を低減することができる。
1 温度管理システム
12 冷却ファンユニット
14 計算機(電子機器)
14a CPU(発熱体)
30 制御部
32 CPU温度検出部
33 吸気温度検出部
34 計算機消費電力検出部
35 制御パラメータ設定部
40重みつきベクトル間距離演算部
41 切り替え制御部
51 コントローラ切替部
52−1〜52−N コントローラ
53 CPU温度予測モデル
54 補正部
55 評価関数
56 最適化部

Claims (7)

  1. 電子機器の発熱体の温度、前記電子機器の消費電力、および前記電子機器の吸気温度を検出する検出部と、
    前記電子機器を冷却する冷却装置と、
    前記発熱体の温度が目標値に近づくように前記冷却装置の操作量を制御する制御部と、
    を有し、
    前記制御部は、
    前記電子機器の前記消費電力と前記吸気温度の取り得る動作領域を複数の動作範囲に分割し、分割された前記動作範囲ごとに前記冷却装置の前記操作量を制御する複数のコントローラと、
    前記複数のコントローラに対応して前記動作範囲ごとに構築され、前記動作範囲の前記消費電力と前記吸気温度の条件下で前記発熱体の将来の温度を予測する複数の予測モデルと、
    前記複数の予測モデルのうち前記電子機器の現在の動作条件に最も近い前記消費電力と前記吸気温度の条件下で構築された予測モデルを用いるコントローラを選択するコントローラ切替部と、
    を有し、
    前記コントローラ切替部は、前記検出部で検出された現在の消費電力と現在の吸気温度とを要素とする第1のベクトルと、前記各予測モデルを構築したときの条件である前記消費電力と前記吸気温度とを要素とする第2のベクトルとの間のベクトル間距離を算出し、前記ベクトル間距離が最短となる予測モデルに対応する前記コントローラを選択し、
    前記選択されたコントローラは、対応する予測モデルを用いて前記発熱体の将来の温度を予測し、前記予測された温度に基づいて前記冷却装置の操作量を決定する、
    ことを特徴とする電子機器の温度管理システム。
  2. 前記コントローラ切替部は、前記消費電力に対する第1重み係数と、前記吸気温度に対する第2重み係数を用いて、重みつきユークリッドノルムとして前記ベクトル間距離を算出することを特徴とする請求項1に記載の電子機器の温度管理システム。
  3. 前記第1重み係数は、前記発熱体の温度に対する前記消費電力の寄与度に基づいて決定され、前記第2重み係数は、前記発熱体の温度に対する前記吸気温度の寄与度に基づいて決定されることを特徴とする請求項2に記載の電子機器の温度管理システム。
  4. 前記冷却装置が複数の前記電子機器を冷却する場合であって、複数の前記電子機器が異なる許容上限温度を有する場合に、前記制御部は、前記検出部によって検出された複数の発熱体の現在の温度を基準化して、基準化された前記発熱体の温度の中の最大温度を前記発熱体の温度として用いることを特徴とする請求項1〜3のいずれか1項に記載の電子機器の温度管理システム。
  5. 前記冷却装置は冷却ファンであり、選択された前記コントローラは、前記発熱体の温度が目標値に近づくように前記冷却ファンの回転数または送風量を制御することを特徴とする請求項1〜4のいずれか1項に記載の電子機器の温度管理システム。
  6. 電子機器の発熱体の温度、前記電子機器の消費電力、および前記電子機器の吸気温度を検出する工程と、
    前記発熱体の温度が目標値に近づくように前記発熱体を冷却する冷却装置の操作量を制御する工程と、
    を有し、
    前記制御する工程は、
    前記電子機器の前記消費電力と前記吸気温度の取り得る動作領域を複数の動作範囲に分割し、
    分割された前記動作範囲ごとに前記冷却装置の前記操作量を制御する複数のコントローラを設定し、
    前記複数のコントローラに対応して、前記動作範囲ごとに、当該動作範囲の前記消費電力と前記吸気温度の条件下で前記発熱体の将来の温度を予測する複数の予測モデルを構築し、
    検出された現在の消費電力と現在の吸気温度を要素とする第1のベクトルと、前記各予測モデルを構築したときの条件である前記消費電力と前記吸気温度とを要素とする第2のベクトルとの間のベクトル間距離を算出し、
    前記複数のコントローラの中から、前記ベクトル間距離が最短となる予測モデルに対応する前記コントローラを選択し、
    前記選択されたコントローラによって前記発熱体の将来の温度を予測し、前記予測された温度に基づいて前記冷却装置の操作量を決定する、
    ことを特徴とする電子機器の温度管理方法。
  7. 以下の処理をコンピュータに実行させる温度管理プログラム:
    検出部によって検出された電子機器の発熱体の温度、前記電子機器の消費電力、および前記電子機器の吸気温度を収集する処理;
    前記電子機器の前記消費電力と前記吸気温度の取り得る動作領域を複数の動作範囲に分割し、分割された前記動作範囲ごとに冷却装置の操作量を制御する複数のコントローラを設定する処理;
    前記複数のコントローラに対応して、前記動作範囲ごとに、当該動作範囲の前記消費電力と前記吸気温度の条件下で前記発熱体の将来の温度を予測する複数の予測モデルを構築する処理;
    前記複数の予測モデルのうち前記電子機器の現在の動作条件に最も近い動作範囲で構築された予測モデルを用いるコントローラに切り替える処理であって、現在の消費電力と現在の吸気温度を要素とする第1のベクトルと、前記各予測モデルを構築したときの条件である前記消費電力と前記吸気温度とを要素とする第2のベクトルとの間のベクトル間距離を算出し、前記ベクトル間距離が最短となる予測モデルに対応する前記コントローラに切り替える処理;および、
    前記切り替えられたコントローラによって前記発熱体の将来の温度を予測し、前記予測された温度に基づいて前記冷却装置の前記操作量を決定する処理。
JP2014174425A 2014-08-28 2014-08-28 電子機器の温度管理システム、温度管理方法、および温度管理プログラム Active JP6277912B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014174425A JP6277912B2 (ja) 2014-08-28 2014-08-28 電子機器の温度管理システム、温度管理方法、および温度管理プログラム
US14/808,499 US10061365B2 (en) 2014-08-28 2015-07-24 Temperature prediction system using prediction models, temperature prediction method using prediction models, and non-transitory computer readable recording medium having therein program for temperature prediction using prediction models

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014174425A JP6277912B2 (ja) 2014-08-28 2014-08-28 電子機器の温度管理システム、温度管理方法、および温度管理プログラム

Publications (2)

Publication Number Publication Date
JP2016051213A JP2016051213A (ja) 2016-04-11
JP6277912B2 true JP6277912B2 (ja) 2018-02-14

Family

ID=55402388

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014174425A Active JP6277912B2 (ja) 2014-08-28 2014-08-28 電子機器の温度管理システム、温度管理方法、および温度管理プログラム

Country Status (2)

Country Link
US (1) US10061365B2 (ja)
JP (1) JP6277912B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9820409B1 (en) * 2015-09-28 2017-11-14 Amazon Technologies, Inc. Rack cooling system
US11076509B2 (en) 2017-01-24 2021-07-27 The Research Foundation for the State University Control systems and prediction methods for it cooling performance in containment
KR102123178B1 (ko) * 2018-01-24 2020-06-16 고려대학교 산학협력단 기계학습 알고리즘 기반 cpu 온도 예측 방법 및 장치
US11635739B1 (en) 2020-04-30 2023-04-25 Marvell Asia Pte Ltd System and method to manage power to a desired power profile
US11340673B1 (en) * 2020-04-30 2022-05-24 Marvell Asia Pte Ltd System and method to manage power throttling
US11526143B2 (en) * 2020-05-27 2022-12-13 Cisco Technology, Inc. Method and apparatus for protection of network device during increase in environmental contamination
CN113052399A (zh) * 2021-04-21 2021-06-29 浙江中控技术股份有限公司 温度监控系统、方法、装置、存储介质及电子设备

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7885795B2 (en) * 2005-05-02 2011-02-08 American Power Conversion Corporation Methods and systems for managing facility power and cooling
US8374730B2 (en) * 2005-08-25 2013-02-12 Apple Inc. Methods and apparatuses for dynamic thermal control
JP4804490B2 (ja) * 2008-02-18 2011-11-02 富士通株式会社 情報処理装置、情報処理方法、情報処理プログラム
US8224488B2 (en) * 2009-01-15 2012-07-17 Dell Products L.P. System and method for temperature management of a data center
JP5197675B2 (ja) 2010-05-14 2013-05-15 株式会社東芝 空調システム
JP5601891B2 (ja) * 2010-06-09 2014-10-08 株式会社Nttファシリティーズ 空調システムの運転制御方法
US8594856B2 (en) * 2011-02-15 2013-11-26 Nuvoton Technology Corporation Processor cooling by temperature range and multiple algorithm fan speed control
EP2820488B1 (en) * 2012-03-02 2019-09-04 Vigilent Corporation Multi-dimensional optimization for controlling environmental maintenance modules
JP5439562B2 (ja) 2012-08-23 2014-03-12 株式会社東芝 空調システム
EP2916083B1 (en) * 2012-11-02 2017-12-27 Fujitsu Limited Modular data center and control method therefor
US9541971B2 (en) * 2013-06-28 2017-01-10 International Business Machines Corporation Multiple level computer system temperature management for cooling fan control

Also Published As

Publication number Publication date
US10061365B2 (en) 2018-08-28
JP2016051213A (ja) 2016-04-11
US20160062340A1 (en) 2016-03-03

Similar Documents

Publication Publication Date Title
JP6277912B2 (ja) 電子機器の温度管理システム、温度管理方法、および温度管理プログラム
JP5994927B2 (ja) 温度管理システム
Spielberg et al. Toward self‐driving processes: A deep reinforcement learning approach to control
JP6514242B2 (ja) 環境維持システムの制御方法、環境維持システム及びプログラム
JP5975105B2 (ja) 温度管理システム
Lucia et al. Predictive control, embedded cyberphysical systems and systems of systems–A perspective
JP6313217B2 (ja) Hvacユニットの気温制御
US9857779B2 (en) Multi-dimensional optimization for controlling environmental maintenance modules
US11879656B2 (en) Initialization of radial base function neural network nodes for reinforcement learning incremental control system
JP6277776B2 (ja) 空調制御システム及び空調制御方法
US11514358B2 (en) Automatic control artificial intelligence device and method for updating a control function
GB2598681A (en) Scheduled thermal control system
JP6277777B2 (ja) 空調制御システム及び空調制御方法
JP5467929B2 (ja) 関数生成装置、及び関数生成方法
US10228668B2 (en) Management of airflow provisioning to meet a cooling influence redundancy level
JP7088323B2 (ja) サーバラック、制御装置、冷却方法、及びプログラム
Paccagnan et al. On the range of feasible power trajectories for a population of thermostatically controlled loads
WO2015059710A2 (en) System and method for monitoring and controlling thermal condition of a data center in real-time
Grosswindhager et al. Fuzzy predictive control of district heating network
WO2018122635A1 (en) Method and system for regulating temperature of data center
Kumar et al. Data center air handling unit fan speed optimization using machine learning techniques
Abdrakhmanov et al. Intelligent Fuzzy-PID Temperature Control System for Ensuring Comfortable Microclimate in an Intelligent Building.
Roy et al. GA and Lyapunov theory-based hybrid adaptive fuzzy controller for non-linear systems
Ogutu et al. Performance Improvement of a Chicken Chicks’ Banda Using Neuro-Fuzzy Logic Controller

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170511

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171024

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180101

R150 Certificate of patent or registration of utility model

Ref document number: 6277912

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150