JP6349982B2

JP6349982B2 - 情報処理装置、情報処理装置の制御方法および情報処理装置の制御プログラム

Info

Publication number: JP6349982B2
Application number: JP2014117834A
Authority: JP
Inventors: 潤平久保田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2014-06-06
Filing date: 2014-06-06
Publication date: 2018-07-04
Anticipated expiration: 2034-06-06
Also published as: US20150355643A1; US10203670B2; JP2015230686A

Description

本発明は、情報処理装置、情報処理装置の制御方法および情報処理装置の制御プログラムに関する。

近時、ＣＰＵ（Central Processing Unit）等の演算処理装置の処理能力が増大するのに伴い、演算処理装置の発熱量が増加する傾向にある。演算処理装置の発熱による温度の上昇を抑えるために、演算処理装置に向けて冷風が供給され、あるいは、演算処理装置に接触された供給路に冷却液が循環される。

例えば、複数の演算処理装置の温度および消費電力等の情報に基づいて、各演算処理装置にジョブを割り当てた場合の演算処理装置の温度変化を予測することで、演算処理装置の能力が低下することを抑止する手法が提案されている（例えば、特許文献１参照）。

複数の情報処理装置それぞれの消費電力および情報処理装置の冷却用の電力等を含めた電力効率を求め、電力効率が高い情報処理装置に優先的にジョブを割り当てる手法が提案されている（例えば、特許文献２参照）。

プロセッサチップにおける複数の位置での温度の変化を推定し、所定の閾値より高いと推定される温度が生じる位置に冷却能力を振り向ける手法が提案されている（例えば、特許文献３参照）。

演算処理装置を冷却する冷却液の温度を計測し、演算処理装置の動作と冷却液を冷却する冷凍機の動作とを冷却液の温度に応じて制御し、冷却液の温度を設定温度に迅速に到達させる手法が提案されている（例えば、特許文献４参照）。

複数の演算処理装置の温度を温度センサにより計測し、計測された温度の分布に基づいて、周囲温度の低い順番にジョブを投入する演算処理装置を決定する手法が提案されている（例えば、特許文献５参照）。

演算処理装置の温度と演算処理装置に供給される冷風の風量とに基づいて、演算処理装置の消費電力を算出し、消費電力が小さい演算処理装置から順にジョブを投入する手法が提案されている（例えば、特許文献６参照）。

特開２００８−２４２６１６号公報国際公開第２０１０／０５０２４９号特表第２００８−５０７７４４号公報特開平２−２７５２７５号公報特開２００４−１２６９６８号公報特開２０１１−１８１３１号公報

例えば、複数の演算処理装置が冷却液の供給路上に順に配置される場合、供給路を流れる冷却液の温度は、演算処理装置が発生する熱を吸収して徐々に上昇する。冷却液による演算処理装置の冷却能力は、冷却液の温度が低いほど高い。このため、冷却液が流入される側の供給路に配置された演算処理装置を冷却する冷却液の冷却能力は、冷却液が流出される供給路に配置された演算処理装置を冷却する冷却液の冷却能力より高い。しかしながら、供給路を流れる冷却液の冷却能力に応じて演算処理装置を割り当てるジョブを決定する手法は提案されていない。演算処理装置が発生する熱のうち冷却液により吸収されない熱は、演算処理装置を含む情報処理装置が配置される部屋に設置された空調装置等により取り除かれるため、冷却液により吸収されない熱の増加は、空調装置等の消費電力の増加につながる。

本件開示の情報処理装置、情報処理装置の制御方法および情報処理装置の制御プログラムは、冷却液による情報処理装置の冷却効率を向上することで、情報処理装置が設置される部屋を冷却する空調装置の消費電力を抑制することを目的とする。

一つの観点によれば、情報処理装置は、ジョブをそれぞれ実行する複数の演算処理装置と、複数の演算処理装置がそれぞれ発生する熱を吸収する冷媒が流れる供給路と、冷媒を出力する出口を介して、供給路に冷媒を循環させる循環装置と、ジョブを複数の演算処理装置に割り当てる場合、複数の演算処理装置のうちジョブを実行していない演算処理装置であるジョブ未実行演算処理装置があるとき、供給路において対応する位置が出口側に位置するジョブ未実行演算処理装置からジョブを割り当てるジョブ割当装置とを有する。

別の観点によれば、情報処理装置は、ジョブをそれぞれ実行する複数の演算処理装置と、複数の演算処理装置のうち所定数の演算処理装置がそれぞれ発生する熱を吸収する冷媒が流れる複数の供給路と、複数の供給路に冷媒をそれぞれ循環させる循環装置と、複数の供給路のそれぞれにおいて冷媒を循環装置に戻す入口側に配置され、冷媒の温度を計測する複数の温度センサと、ジョブを複数の演算処理装置に割り当てる場合、複数の演算処理装置のうちジョブを実行していない演算処理装置であるジョブ未実行演算処理装置があるとき、他の供給路を流れる冷媒の温度よりも温度の低い冷媒が流れる供給路に対応するジョブ未実行演算処理装置からジョブを割り当てるジョブ割当装置とを有する。

さらなる別の観点によれば、情報処理装置は、通信経路を介して互いに接続され、ジョブをそれぞれ実行する複数の演算処理装置と、複数の演算処理装置のうち所定数の演算処理装置がそれぞれ発生する熱を吸収する冷媒が流れる複数の供給路と、複数の供給路に冷媒をそれぞれ循環させる循環装置と、複数の供給路のそれぞれにおいて冷媒を循環装置に戻す入口側に配置され、冷媒の温度を計測する複数の温度センサと、複数の演算処理装置のうちジョブを実行していない２以上の所定数の演算処理装置であるジョブ未実行演算処理装置群にジョブを割り当てる場合、通信性能が他のジョブ未実行演算処理装置群の通信性能より高いジョブ未実行演算処理装置群にジョブを割り当てるジョブ割当装置と、を有し、前記ジョブ割当装置は、通信性能が他のジョブ未実行演算処理装置群の通信性能より高い複数の前記ジョブ未実行演算処理装置群の通信性能が同じ場合、通信性能が同じジョブ未実行演算処理装置群毎に、演算処理装置にそれぞれ対応する供給路を流れる冷媒の温度の合計を求め、温度の合計が他のジョブ未実行演算処理装置群の温度の合計より低いジョブ未実行演算処理装置群にジョブを割り当てる。

別の観点によれば、ジョブをそれぞれ実行する複数の演算処理装置と、複数の演算処理装置がそれぞれ発生する熱を吸収する冷媒が流れる供給路と、冷媒を出力する出口を介して、供給路に冷媒を循環させる循環装置と、ジョブを複数の演算処理装置に割り当てるジョブ割当装置とを有する情報処理装置の制御方法は、ジョブ割当装置が、複数の演算処理装置のうちジョブを実行していない演算処理装置であるジョブ未実行演算処理装置を検出し、ジョブ未実行演算処理装置がある場合、供給路において対応する位置が出口側に位置するジョブ未実行演算処理装置からジョブを割り当てる。

さらなる別の観点によれば、ジョブをそれぞれ実行する複数の演算処理装置と、複数の演算処理装置がそれぞれ発生する熱を吸収する冷媒が流れる供給路と、冷媒を出力する出口を介して、供給路に冷媒を循環させる循環装置と、ジョブを複数の演算処理装置に割り当てるジョブ割当装置とを有する情報処理装置の制御プログラムは、ジョブ割当装置に、複数の演算処理装置のうちジョブを実行していない演算処理装置であるジョブ未実行演算処理装置を検出させ、ジョブ未実行演算処理装置がある場合、供給路において対応する位置が出口側に位置するジョブ未実行演算処理装置からジョブを割り当てさせる。

本件開示の情報処理装置、情報処理装置の制御方法および情報処理装置の制御プログラムは、冷却液による情報処理装置の冷却効率を向上することで、情報処理装置が設置される部屋を冷却する空調装置の消費電力を抑制できる。

情報処理装置、情報処理装置の制御方法および情報処理装置の制御プログラムの一実施形態を示す図である。図１に示すＲＯＭおよびＲＡＭに格納される情報の例を示す図である。図１に示すＣＰＵと供給路との接触部分の構造の例を示す図である。図１に示すジョブ割当装置がＣＰＵに投入するジョブの例を示す図である。図１に示すジョブ割当装置がジョブの投入時に実行する処理の例を示す図である。図１に示すジョブ割当装置がジョブの終了時に実行する処理の例を示す図である。情報処理装置、情報処理装置の制御方法および情報処理装置の制御プログラムの別の実施形態を示す図である。図７に示すＲＡＭに格納される情報の例を示す図である。図７に示すジョブ割当装置がジョブの投入時に実行する処理の例を示す図である。情報処理装置、情報処理装置の制御方法および情報処理装置の制御プログラムの別の実施形態を示す図である。図１０に示すＲＯＭおよびＲＡＭに格納される情報の例を示す図である。図１０に示すジョブ割当装置がジョブの投入時に実行する処理の例を示す図である。情報処理装置の別の実施形態におけるＲＯＭおよびＲＡＭに格納される情報の例を示す図である。図１３に示すＲＯＭおよびＲＡＭを有する情報処理装置のジョブ割当装置がジョブの投入時に実行する処理の例を示す図である。情報処理装置の別の実施形態におけるジョブ割当装置がジョブの投入時に実行する処理の例を示す図である。情報処理装置、情報処理装置の制御方法および情報処理装置の制御プログラムの別の実施形態を示す図である。図１６に示すＲＡＭに割り当てられるテーブルに格納される情報の例を示す図である。図１６に示すＲＯＭおよびＲＡＭに割り当てられる情報の例を示す図である。図１６に示すジョブ割当装置がジョブの投入時に実行する処理の例を示す図である。

以下、図面を用いて実施形態が説明される。

図１は、情報処理装置、情報処理装置の制御方法および情報処理装置の制御プログラムの一実施形態を示す。図１に示す情報処理装置ＩＰＥは、ジョブ割当装置１０と、ジョブ割当装置１０に接続されたＲＯＭ（Read Only Memory）２０およびＲＡＭ（Random Access Memory）３０とを有する。また、情報処理装置ＩＰＥは、複数のＣＰＵ（Central Processing Unit；ＣＰＵ１、ＣＰＵ２、ＣＰＵ３、ＣＰＵ４）と、ＣＰＵ１−ＣＰＵ４のそれぞれに接続されたメモリＭＥＭとを有する。ＣＰＵは、ジョブを実行する演算処理装置の一例である。例えば、各メモリＭＥＭは、ＣＰＵが実行するプログラムおよびＣＰＵが実行するジョブで扱うデータ等を記憶する。例えば、ＣＰＵ１−ＣＰＵ４は、互いに同じ仕様（品種、クロック周波数、電源電圧等）で動作し、共通のジョブを実行する場合のＣＰＵ１−ＣＰＵ４の発熱量はほぼ同じである。なお、情報処理装置ＩＰＥが有するＣＰＵの数は、４つに限定されない。

さらに、情報処理装置ＩＰＥは、冷却液の循環装置４０と、循環装置４０とＣＰＵ１−ＣＰＵ４との間に接続され冷却液が流れる供給路５０とを有する。冷却液は、ＣＰＵが発生する熱を吸収する冷媒の一例である。なお、供給路５０には、冷却液の代わりに冷却ガス等の気体が流れてもよい。なお、供給路５０は、ＣＰＵ１−ＣＰＵ４の各々に接触される。供給路５０に示す網掛けは、冷却液を示す。各ＣＰＵと供給路５０との接触部分の構造の例は、図３に示される。

例えば、循環装置４０は、供給路５０に冷却液を送出するポンプＰと、ＣＰＵ１−ＣＰＵ４が発生する熱を吸収した冷却液を冷却する熱交換器ＨＥとを有する。ポンプＰから出力される冷却液は、循環装置４０の出口ＯＵＴから供給路５０に出力され、ＣＰＵ１−ＣＰＵ４をこの順で冷却し、循環装置４０の入口ＩＮに戻される。例えば、ＣＰＵ１の供給路５０上での位置は、ＣＰＵ２−ＣＰＵ４に比べて出口ＯＵＴに近く、ＣＰＵ２の供給路５０上での位置は、ＣＰＵ３−ＣＰＵ４に比べて出口ＯＵＴに近く、ＣＰＵ３の供給路５０上での位置は、ＣＰＵ４に比べて出口ＯＵＴに近い。入口ＩＮに戻された冷却液は、熱交換器ＨＥで熱交換された後、ポンプＰの駆動力により再び出口ＯＵＴから出力される。図１では、循環装置４０を介して環状に接続された供給路５０内における冷却液の流れの方向を矢印で示す。

循環装置４０と、供給路５０と、供給路５０を流れる冷却液とは、ＣＰＵ１−ＣＰＵ４を冷却する冷却系である。例えば、情報処理装置ＩＰＥは、空調装置により冷却可能な部屋に設置される。なお、冷却液を循環させることなく供給路５０に供給する供給装置が、循環装置４０の代わりに設けられてもよい。この場合、冷却液の供給装置は、熱交換器ＨＥを持たない。

ＲＯＭ２０は、ジョブ割当装置１０が実行するプログラムＰＧＭと、ＣＰＵ１−ＣＰＵ４の供給路５０上での配置の順序を示す情報が格納されたテーブルＴＢＬ２とを格納する領域を有する。ＲＡＭ３０は、ＲＯＭ２０から転送されるプログラムＰＧＭを格納する領域と、テーブルＴＢＬ３とを格納する領域を有する。テーブルＴＢＬ３には、ＲＯＭ２０から転送されるテーブルＴＢＬ２に含まれる情報と、ＣＰＵ１−ＣＰＵ４の稼働状況を示す情報とが格納される。プログラムＰＧＭは、ジョブ割当装置１０により実行され、ＣＰＵ１−ＣＰＵ４が実行するジョブをＣＰＵ１−ＣＰＵ４に割り当てる情報処理装置ＩＰＥの制御プログラムの一例である。例えば、ＲＯＭ２０からＲＡＭ３０へのプログラムＰＧＭとテーブルＴＢＬ２に格納された情報との転送は、情報処理装置ＩＰＥの電源の投入時に実行される。

例えば、ジョブ割当装置１０は、ネットワークＮＷを介してＣＰＵ１−ＣＰＵ４に接続される。ネットワークＮＷは、通信経路の一例である。ジョブ割当装置１０は、ＲＡＭ３０に格納されたプログラムＰＧＭを実行するプロセッサＰＲＯＣを有し、プロセッサＰＲＯＣの動作により、ジョブをＣＰＵに割り当て、ネットワークＮＷを介して割り当てたジョブをＣＰＵのいずれかに投入する。この際、ジョブ割当装置１０は、テーブルＴＢＬ３に格納された情報を参照し、ジョブを割り当てるＣＰＵを決定する。ジョブ割当装置１０がジョブをＣＰＵに割り当てる制御は、図４および図５で説明される。例えば、ジョブは、情報処理装置ＩＰＥを使用するユーザ装置等の上位装置から供給される。

図２は、図１に示すＲＯＭ２０およびＲＡＭ３０に格納される情報の例を示す。

ＲＯＭ２０に割り当てられるテーブルＴＢＬ２は、ＣＰＵ１−ＣＰＵ４の供給路５０上での位置を示す情報である搭載位置を格納する領域を有する。例えば、”搭載位置”の領域には、循環装置４０における冷却液を出力する出口ＯＵＴに近い順序を示す番号が格納される。図２に示す例では、他のＣＰＵ２−ＣＰＵ４に比べて出口ＯＵＴに近いＣＰＵ１に対応する”搭載位置”の領域に”１”が格納される。また、他のＣＰＵ１−ＣＰＵ３に比べて出口ＯＵＴに遠いＣＰＵ４に対応する”搭載位置”の領域に”４”が格納される。

ＲＡＭ３０に割り当てられるテーブルＴＢＬ３は、テーブルＴＢＬ２から転送される”搭載位置”の情報を格納する領域と、ＣＰＵ１−ＣＰＵ４の稼働状態を示す情報が格納される領域とを有する。図１で説明したように、”搭載位置”の情報は、情報処理装置ＩＰＥの電源の投入時にテーブルＴＢＬ２からテーブルＴＢＬ３に転送される。

”稼働状態”の領域は、ジョブ割当装置１０がＣＰＵ１−ＣＰＵ４にジョブを投入するときに”稼働”を示す状態に設定され、ジョブの終了時に”未稼働”を示す状態に設定される。図２では、”未稼働”に設定された領域は網掛けで示される。なお、”稼働状態”の領域には、例えば、”稼働”を示す”１”または”未稼働”を示す”０”が格納されてもよい。

図３は、図１に示すＣＰＵ（ＣＰＵ１−ＣＰＵ４）と供給路５０との接触部分の構造を示す。例えば、供給路５０は、サーマルシートまたはグリス等の熱伝導性を有する部材６０を介してＣＰＵの表面と接触する平坦状の拡張部５５を有する。例えば、拡張部５５は、クーリングプレートまたは水冷ジャケットと称される。ＣＰＵ１−ＣＰＵ４に接触する拡張部５５は、互いに同じ形状を有しており、ＣＰＵ１−ＣＰＵ４との接触面積は互いに等しい。供給路５０において、拡張部５５を除く部分は、例えば管形状を有し、管形状の部分の内径は位置によらず一定である。例えば、ＣＰＵは、プリント基板７０上にはんだ付けされる。図３において、冷却液が流れる方向は矢印で示される。なお、拡張部５５は、部材６０を介することなく、ＣＰＵに直接接触されてもよい。

循環装置４０の出口ＯＵＴから供給路５０に出力され拡張部５５に流れ込んだ冷却液は、熱伝導性を有する部材６０を介してＣＰＵが発生する熱を吸収する。熱の吸収により温度が上昇した冷却液は、拡張部５５から出力され、循環装置４０の入口ＩＮに向けて流れる。

例えば、循環装置４０が出力する冷却液の単位時間当たりの流量は一定であり、供給路５０の管形状の部分を流れる冷却液の流速は一定である。このため、ＣＰＵ１−ＣＰＵ４に接触する各拡張部５５を流れる冷却液の温度が同じ場合、ＣＰＵ１−ＣＰＵ４が発生する熱量のうち冷却液に吸収される熱量は互いに同じであり、冷却液によるＣＰＵ１−ＣＰＵ４の冷却効率は、互いに同じである。

温度が均一の平板上を流れる液体が層流の場合、レイノルズ数Ｒｅを”ｕｌ／ν”、プラントル数Ｐｒをν／αとすると、式（１）の関係が知られている。
Ｑ＝０．６６４Ｒｅ^１／２Ｐｒ^１／３（λ／ｌ）（Ｔｓ−Ｔｆ）Ｓ …（１）
レイノルズ数Ｒｅにおいて、ｕは冷却液の流速、ｌはスケール長、νは冷却液の動粘性係数である。例えば、スケール長ｌは、拡張部５５等においてＣＰＵと接触する部分を流路の長さに換算した値である。プラントル数Ｐｒにおいて、αは温度伝導率である。λ、ν、αは、物質固有の値であり、若干の温度依存性を持つ。式（１）において、ＱはＣＰＵが発生する熱量のうち冷却液により吸収される吸熱量、λは液体の熱伝導率、ＴｓはＣＰＵの温度、Ｔｆは液体の温度、Ｓは液体が流れる拡張部５５等とＣＰＵとの接触面積である。

ＣＰＵの温度Ｔｓが所定の温度を超えると、ＣＰＵは正常に動作することが困難になる。式（１）より、ＣＰＵの温度Ｔｓを所定の温度以下に保つために許容される吸熱量Ｑは、冷却液の液温Ｔｆの上昇とともに減少する。

ＣＰＵ１と接触する拡張部５５から出力される冷却液は、ＣＰＵ２と接触する拡張部５５に流れ込み、ＣＰＵ２と接触する拡張部５５から出力される冷却液は、ＣＰＵ３と接触する拡張部５５に流れ込む。このため、ＣＰＵ１と接触する拡張部５５に流れ込む冷却液の温度Ｔｆは、ＣＰＵ２と接触する拡張部５５に流れ込む冷却液の温度Ｔｆより低い。ＣＰＵ２と接触する拡張部５５に流れ込む冷却液の温度Ｔｆは、ＣＰＵ３と接触する拡張部５５に流れ込む冷却液の温度Ｔｆより低い。このため、共通の供給路５０に接触するＣＰＵ１−ＣＰＵ４の各々に許容される発熱量Ｑは、循環装置４０の出口ＯＵＴに近いＣＰＵほど大きい。換言すれば、循環装置４０の出口ＯＵＴに近い拡張部５５ほど、ＣＰＵを冷却する能力が高い。したがって、図２に示すテーブルＴＢＬ３の”搭載位置”に格納された値は、数字が小さい程、ＣＰＵを冷却する能力が高いことを示す。すなわち、図１に示すＣＰＵの冷却構造では、ＣＰＵ１を冷却する能力は、ＣＰＵ２を冷却する能力より高く、ＣＰＵ２を冷却する能力は、ＣＰＵ３を冷却する能力より高く、ＣＰＵ３を冷却する能力は、ＣＰＵ４を冷却する能力より高い。

図４は、図１に示すジョブ割当装置１０がＣＰＵに投入するジョブの例を示す。図４に示す例では、ジョブ割当装置１０は、１０個のジョブＪ１−Ｊ１０をＣＰＵ１−ＣＰＵ４のいずれかに割り当て、割り当てたジョブを投入する。図４の下側に示すテーブルＴＢＬ３（図１）の”稼働状態”の領域は、”０”が”未稼働”を示し、”１”が”稼働”を示す。図４では、テーブルＴＢＬ３における”１”（すなわち、”稼働”）を示す”稼働状態”の領域は、網掛けで示される。”未稼働”のＣＰＵは、ジョブを実行していないジョブ未実行演算処理装置の一例である。

まず、ジョブが投入されない初期状態において、テーブルＴＢＬ３の”稼働状態”の領域は、全て”未稼働”（すなわち、”０”）に設定される。ジョブ割当装置１０は、ジョブＪ１の投入の指示を上位装置から受ける。ジョブ割当装置１０は、テーブルＴＢＬ３を参照し、”未稼働”のＣＰＵ１−ＣＰＵ４のうち、”搭載位置”の値が最も小さいＣＰＵ１にジョブＪ１を割り当て、割り当てたジョブを投入する（図４（ａ））。

次に、ジョブ割当装置１０は、ジョブＪ２の投入の指示を上位装置から受ける。ジョブ割当装置１０は、テーブルＴＢＬ３を参照し、”未稼働”のＣＰＵ２−ＣＰＵ４のうち、”搭載位置”の値が最も小さいＣＰＵ２にジョブＪ２を割り当て、割り当てたジョブを投入する（図４（ｂ））。

次に、ジョブ割当装置１０は、ジョブＪ３の投入の指示を上位装置から受ける。ジョブＪ３の投入の指示を受けた時点で、ＣＰＵ１は、ジョブＪ１の実行を完了し、ＣＰＵ１に対応する”稼働状態”の領域は、”０”に設定されている（図４（ｃ））。ジョブ割当装置１０は、テーブルＴＢＬ３を参照し、”未稼働”のＣＰＵ１、ＣＰＵ３、ＣＰＵ４のうち、”搭載位置”の値が最も小さいＣＰＵ１にジョブＪ３を割り当て、割り当てたジョブを投入する（図４（ｄ））。

次に、ジョブ割当装置１０は、ジョブＪ４の投入の指示を上位装置から受ける。ジョブ割当装置１０は、テーブルＴＢＬ３を参照し、”未稼働”のＣＰＵ３、ＣＰＵ４のうち、”搭載位置”の値が最も小さいＣＰＵ３にジョブＪ４を割り当て、割り当てたジョブを投入する（図４（ｅ））。次に、ジョブ割当装置１０は、ジョブＪ５の投入の指示を上位装置から受ける。ジョブ割当装置１０は、テーブルＴＢＬ３を参照し、”未稼働”のＣＰＵがＣＰＵ４のため、ＣＰＵ４にジョブＪ５を割り当て、割り当てたジョブを投入する（図４（ｆ））。なお、”未稼働”のＣＰＵがない場合、ジョブ割当装置１０は、ジョブの投入を待機する処理を実行する。

この後、ジョブ割当装置１０は、ジョブＪ６、Ｊ７、Ｊ８、Ｊ９、Ｊ１０の投入の指示を上位装置から受ける毎に、テーブルＴＢＬ３を参照する。そして、ジョブ割当装置１０は、”未稼働”のＣＰＵのうち、”搭載位置”の値が最も小さいＣＰＵにジョブＪ６、Ｊ７、Ｊ８、Ｊ９、Ｊ１０を割り当てる。図４に網掛けで示されるように、冷却能力が高い拡張部５５(図３）に接触するＣＰＵによるジョブの実行頻度は、冷却能力が低い拡張部５５に接触するＣＰＵによるジョブの実行頻度よりも高くなる。

これにより、例えば、ジョブがＣＰＵ１−ＣＰＵ４にランダムに割り当てられる場合に比べて、ＣＰＵ１−ＣＰＵ４で発生する熱を効率的に冷却液に吸収させることができる。したがって、ジョブがＣＰＵ１−ＣＰＵ４にランダムに割り当てられる場合に比べて、情報処理装置ＩＰＥが設置される部屋にＣＰＵ１−ＣＰＵ４から放出される熱量を削減することができる。この結果、情報処理装置ＩＰＥが設置される部屋を冷却する空調装置で消費される電力を抑制することができる。

また、図１に示す情報処理装置ＩＰＥでは、温度が許容値を超えたＣＰＵは、動作が困難になるため、各ＣＰＵ１−ＣＰＵ４のいずれか１つの温度が許容値を超えた場合、情報処理装置ＩＰＥは、ジョブの実行を継続することが困難になる。この実施形態では、冷却能力が低い拡張部５５に接触するＣＰＵによるジョブの実行頻度は、冷却能力が高い拡張部５５に接触するＣＰＵによるジョブの実行頻度に比べて低くなる。このため、冷却能力が低い拡張部５５に接触するＣＰＵの温度が許容値を超える可能性を低くすることができる。すなわち、ＣＰＵ１−ＣＰＵ４の温度が許容値を超えることにより、情報処理装置ＩＰＥに障害が発生することを抑止することができる。

図５は、図１に示すジョブ割当装置１０がジョブの投入時に実行する処理の例を示す。図５に示すフローは、ジョブ割当装置１０がプログラムＰＧＭを実行することで処理される。すなわち、図５は、情報処理装置ＩＰＥの制御方法および情報処理装置ＩＰＥの制御プログラムの例を示す。図５に示すフローは、上位装置から受けるジョブの投入の指示に基づき開始される。

まず、ステップＳ１０２において、上位装置からジョブの投入の指示を受けたジョブ割当装置１０は、テーブルＴＢＬ３を参照して、未稼働のＣＰＵを検索する。例えば、図２に示すテーブルＴＢＬ３では、ＣＰＵ３、ＣＰＵ４が未稼働であることが検索される。次に、ステップＳ１０４において、ジョブ割当装置１０は、未稼働のＣＰＵがあるか否かを判定する。未稼働のＣＰＵがある場合、処理はステップＳ１２２に移行され、未稼働のＣＰＵがない場合、処理はステップＳ１５０に移行される。

ステップＳ１２２において、ジョブ割当装置１０は、テーブルＴＢＬ３を参照して、未稼働のＣＰＵに対応する”搭載位置”の情報を読み出し、最も値が小さい”搭載位置”に対応するＣＰＵにジョブを割り当てる。すなわち、ジョブ割当装置１０は、ジョブを実行していないＣＰＵがあるとき、出口ＯＵＴ側に位置するＣＰＵからジョブを割り当てる。例えば、図２に示すテーブルＴＢＬ３では、ジョブはＣＰＵ３に割り当てられる。次に、ステップＳ１４０において、ジョブ割当装置１０は、ステップＳ１２２で割り当てたジョブをＣＰＵに投入する。

次に、ステップＳ１４２において、ジョブ割当装置１０は、テーブルＴＢＬ３において、ジョブを投入したＣＰＵに対応する”稼働状態”の領域を、”稼働”（すなわち、”１”）に設定し、処理を終了する。例えば、図２に示すテーブルＴＢＬ３では、ジョブが投入されたＣＰＵ３に対応する”稼働状態”の情報が、”未稼働”から”稼働”に変更される。一方、未稼働のＣＰＵがない場合、ステップＳ１５０において、ジョブ割当装置１０は、ジョブの投入を待機する処理を実行し、処理を終了する。

図６は、図１に示すジョブ割当装置１０がジョブの終了時に実行する処理の例を示す。図６に示すフローは、ジョブ割当装置１０がプログラムＰＧＭを実行することで処理される。すなわち、図６は、情報処理装置ＩＰＥの制御方法および情報処理装置ＩＰＥの制御プログラムの例を示す。図６に示すフローは、ＣＰＵが実行しているジョブの終了に基づき開始される。

まず、ステップＳ１６２において、ジョブ割当装置１０は、テーブルＴＢＬ３において、ジョブが終了したＣＰＵに対応する”稼働状態”の領域を”未稼働”（すなわち、”０”）に設定する。次に、ステップＳ１６４において、ジョブ割当装置１０は、図５に示すステップＳ１５０で待機させたジョブがあるか否かを判定する。待機中のジョブがある場合、処理は図５のステップＳ１０２に移行され、ＣＰＵのいずれかにジョブが投入される。待機中のジョブがない場合、処理は終了する。なお、図６のステップＳ１６４に示す処理は、図９に示すステップＳ２５０、図１２、図１４および図１５に示すステップＳ３５０、および図１９に示すステップＳ４５０で待機させたジョブがある場合にも実行される。

以上、図１から図６に示した実施形態では、ジョブ割当装置１０は、未稼働のＣＰＵの供給路５０上での位置に基づいてＣＰＵにジョブを割り当てるため、従来に比べてＣＰＵが発生する熱を効率的に冷却液に吸収させることができる。この結果、情報処理装置ＩＰＥが設置される部屋を冷却する空調装置の消費電力を抑制することができ、情報処理装置ＩＰＥの稼働により消費される電力を抑制することができる。また、ジョブ割当装置１０は、冷却効率に基づきＣＰＵにジョブを割り当てるため、ＣＰＵの過熱により情報処理装置ＩＰＥに障害が発生することを抑止することができる。

図７は、情報処理装置、情報処理装置の制御方法および情報処理装置の制御プログラムの別の実施形態を示す。図１から図６に示す実施形態で説明した要素と同一または同様の要素については、同一の符号を付し、これ等については、詳細な説明は省略する。図１に示す情報処理装置ＩＰＥａは、図１に示すジョブ割当装置１０の代わりにジョブ割当装置１０Ａを有する。

ＲＯＭ２０には、図１に示すプログラムＰＧＭの代わりにプログラムＰＧＭａが格納され、図１に示すテーブルＴＢＬ２は割り当てられない。ＲＡＭ３０には、図１に示すプログラムＰＧＭの代わりにプログラムＰＧＭａが格納され、図１に示すテーブルＴＢＬ３の代わりにテーブルＴＢＬ３ａが割り当てられる。テーブルＴＢＬ３ａに格納される情報の例は、図８に示される。また、情報処理装置ＩＰＥａは、複数のＣＰＵ（ＣＰＵ１、ＣＰＵ２、ＣＰＵ３）と、ＣＰＵ１−ＣＰＵ３のそれぞれに接続されたメモリＭＥＭとを有する。

例えば、ＲＡＭ３０に格納されるプログラムＰＧＭａは、情報処理装置ＩＰＥａの電源の投入時にＲＯＭ２０から転送される。ＲＯＭ２０からＲＡＭ３０に転送されたプログラムＰＧＭａは、ジョブ割当装置１０Ａにより実行される。プログラムＰＧＭａは、ＣＰＵ１−ＣＰＵ３にジョブを割り当てる情報処理装置ＩＰＥａの制御プログラムの一例である。

さらに、情報処理装置ＩＰＥａは、ＣＰＵ１−ＣＰＵ３のそれぞれに対応して、冷却液の循環装置４１、４２、４３と、冷却液が流れる供給路５１、５２、５３と、温度センサＴＳ（ＴＳ１、ＴＳ２、ＴＳ３）とを有する。すなわち、ＣＰＵ１−ＣＰＵ３の各々は、互いに独立して動作する循環装置４１、４２、４３により供給路５１、５２、５３に循環される冷却液により冷却される。なお、ＣＰＵの数、供給路５１、５２、５３の数は、３個に限定されない。また、情報処理装置ＩＰＥａに設けられる循環装置４１、４２、４３の数は３個に限定されず、例えば、１つの循環装置が、３つの供給路５１、５２、５３のそれぞれに冷却液を供給してもよい。

循環装置４１と供給路５１と供給路５１を流れる冷却液とは、ＣＰＵ１を冷却する冷却系である。循環装置４２と供給路５２と供給路５２を流れる冷却液とは、ＣＰＵ２を冷却する冷却系である。循環装置４３と供給路５３と供給路５３を流れる冷却液とは、ＣＰＵ３を冷却する冷却系である。

例えば、循環装置４１、４２、４３は、図１に示す循環装置４０と同一または同様の装置である。ＣＰＵ１と供給路５１との接触部分の構造、ＣＰＵ２と供給路５２との接触部分の構造、およびＣＰＵ３と供給路５３との接触部分の構造は、図３に示す構造と同一または同様である。

温度センサＴＳ１、ＴＳ２、ＴＳ３は、循環装置４１、４２、４３の入口ＩＮのそれぞれに戻る冷却液の温度を計測する。すなわち、温度センサＴＳ１、ＴＳ２、ＴＳ３は、ＣＰＵ１、ＣＰＵ２、ＣＰＵ３が発生する熱を吸収することにより温度が上昇した冷却液の温度を計測する。温度センサＴＳ１、ＴＳ２、ＴＳ３は、ネットワークＮＷを介してジョブ割当装置１０に接続される。ジョブ割当装置１０は、温度センサＴＳ１、ＴＳ２、ＴＳ３が計測した冷却液の温度を監視し、冷却液の温度が低い冷却系ほど、ＣＰＵを冷却する能力が高いと判断する。

なお、ＣＰＵ１と入口ＩＮとの間の供給路５１を流れる冷却液の温度は、ほぼ一定である。同様に、ＣＰＵ２と入口ＩＮとの間の供給路５２を流れる冷却液の温度は、ほぼ一定であり、ＣＰＵ３と入口ＩＮとの間の供給路５３を流れる冷却液の温度は、ほぼ一定である。このため、温度センサＴＳ１、ＴＳ２、ＴＳ３のそれぞれは、ＣＰＵ１、ＣＰＵ２、ＣＰＵ３のそれぞれと入口ＩＮとの間の任意の位置に配置されてもよい。あるいは、温度センサＴＳ１、ＴＳ２、ＴＳ３のそれぞれは、循環装置４１、４２、４３のそれぞれの内部に配置されてもよい。

図８は、図７に示すＲＡＭ３０に格納される情報の例を示す。図２と同一または同様の要素については、詳細な説明は省略する。ＲＡＭ３０に割り当てられるテーブルＴＢＬ３ａは、ＣＰＵ１−ＣＰＵ３の稼働状態を示す情報が格納される領域と、ＣＰＵ１−ＣＰＵ３に接続される供給路５１、５２、５３を流れる冷却液の温度を相対的に示す”液温情報”が格納される領域とを有する。”稼働状態”の領域には、図２と同様に、”稼働”または”未稼働”を示す情報が格納される。

例えば、”液温情報”の領域には、温度センサＴＳ１、ＴＳ２、ＴＳ３で計測された冷却液の温度に基づき、温度が低い順序を示す番号が格納される。図８に示す例では、ＣＰＵ１を冷却する冷却液の温度は、ＣＰＵ２、ＣＰＵ３を冷却する冷却液のそれぞれの温度より低く、ＣＰＵ３を冷却する冷却液の温度は、ＣＰＵ２を冷却する冷却液の温度より低い。

ＣＰＵ１−ＣＰＵ３は、互いに独立した供給路５１、５２、５３を流れる冷却液により冷却される。このため、冷却液の温度は、例えば、稼働頻度が他のＣＰＵの稼働頻度より高いＣＰＵほど高くなりやすく、あるいは、実行するジョブが他のＣＰＵが実行するジョブより複雑なＣＰＵほど高くなりやすい。

例えば、図７に示すジョブ割当装置１０Ａは、ジョブの投入頻度より高い所定の頻度で、温度センサＴＳ１、ＴＳ２、ＴＳ３が計測する冷却液の温度を取得し、取得した温度に基づき、”液温情報”の領域に相対的な温度を示す番号を格納する。

図９は、図７に示すジョブ割当装置１０Ａがジョブの投入時に実行する処理の例を示す。図５と同一または同様の処理については、詳細な説明は省略する。図９に示すフローは、ジョブ割当装置１０ＡがプログラムＰＧＭａを実行することで処理される。すなわち、図９は、情報処理装置ＩＰＥａの制御方法および情報処理装置ＩＰＥａの制御プログラムの例を示す。

ステップＳ２０２、Ｓ２０４、Ｓ２４０、Ｓ２４２、Ｓ２５０の処理は、図５に示すステップＳ１０２、Ｓ１０４、Ｓ１４０、Ｓ１４２、Ｓ１５０の処理と同一または同様である。図９に示す処理は、上位装置から受けるジョブの投入の指示に基づき開始され、あるいは、図６で説明した処理と同様に、ステップＳ２５０で待機させたジョブがある場合に開始される。

ジョブの投入時に未稼働のＣＰＵがある場合、ステップＳ２０６において、ジョブ割当装置１０Ａは、図８に示すテーブルＴＢＬ３ａを参照し、未稼働のＣＰＵを含む冷却系を流れる冷却液の温度を示す情報を取得する。例えば、図８に示すテーブルＴＢＬ３ａでは、ジョブ割当装置１０Ａは、ＣＰＵ１、ＣＰＵ２、ＣＰＵ３のそれぞれに対応する液温情報として、”１”、”３”、”２”を取得する。

次に、ステップＳ２２０において、ジョブ割当装置１０Ａは、ステップＳ２０６で取得した情報に基づいて、冷却液の温度が最も低い冷却系に接続されたＣＰＵにジョブを割り当てる。例えば、図８に示すテーブルＴＢＬ３ａでは、ジョブ割当装置１０Ａは、液温情報に格納された数値が最も小さい冷却系に接続されたＣＰＵ１にジョブを割り当てることを決定する。そして、図５と同様に、ステップＳ２４０において、ジョブ割当装置１０Ａは、ＣＰＵにジョブを投入する。

以上、図７から図９に示す実施形態では、複数の供給路５１、５２、５３を流れる冷却液のそれぞれによりＣＰＵを冷却する場合、ジョブ割当装置１０Ａは、冷却液の温度に応じて、ジョブを割り当てるＣＰＵを決定する。これにより、図１から図６に示す実施形態と同様に、情報処理装置ＩＰＥａの稼働により消費される電力を抑制することができ、ＣＰＵの過熱により情報処理装置ＩＰＥａに障害が発生することを抑止することができる。

図１０は、情報処理装置、情報処理装置の制御方法および情報処理装置の制御プログラムの別の実施形態を示す。図１から図９に示す実施形態で説明した要素と同一または同様の要素については、同一の符号を付し、これ等については、詳細な説明は省略する。図１０に示す情報処理装置ＩＰＥｂは、図７に示すジョブ割当装置１０Ａの代わりに、ジョブ割当装置１０Ｂを有する。

ＲＯＭ２０には、図１に示すプログラムＰＧＭの代わりにプログラムＰＧＭｂが格納され、図１に示すテーブルＴＢＬ２の代わりにテーブルＴＢＬ２ｂが割り当てられる。ＲＡＭ３０には、図１に示すプログラムＰＧＭの代わりにプログラムＰＧＭｂが格納され、図１に示すテーブルＴＢＬ３の代わりにテーブルＴＢＬ３ｂが割り当てられる。テーブルＴＢＬ２ｂ、ＴＢＬ３ｂの例は、図１１に示される。例えば、ＲＡＭ３０に格納されるプログラムＰＧＭｂは、情報処理装置ＩＰＥｂの電源の投入時にＲＯＭ２０から転送される。

また、情報処理装置ＩＰＥｂは、供給路５１、５２、５３の各々に接触された複数のＣＰＵ（ＣＰＵ１１−ＣＰＵ１４、ＣＰＵ２１−ＣＰＵ２４、ＣＰＵ３１−ＣＰＵ３４）を有する。各ＣＰＵは、メモリＭＥＭに接続される。図１０に示す情報処理装置ＩＰＥｂの冷却系の構成は、図７に示す冷却系の各々に複数のＣＰＵを接触させたことを除き、図７と同様である。なお、各供給路５１、５２、５３が冷却するＣＰＵの数は、４個に限定されない。また、各供給路５１、５２、５３が冷却するＣＰＵの数は、互いに相違してもよい。

ＲＯＭ２０からＲＡＭ３０に転送されたプログラムＰＧＭｂは、ジョブ割当装置１０Ｂにより実行される。プログラムＰＧＭｂは、ＣＰＵ１１−ＣＰＵ１４、ＣＰＵ２１−ＣＰＵ２４、ＣＰＵ３１−ＣＰＵ３４にジョブを割り当てる情報処理装置ＩＰＥｂの制御プログラムの一例である。

図１１は、図１０に示すＲＯＭ２０およびＲＡＭ３０に格納される情報の例を示す。図２および図８と同一または同様の要素については、詳細な説明は省略する。

ＲＯＭ２０に割り当てられるテーブルＴＢＬ２ｂは、冷却系（すなわち、供給路５１、５２、５３）毎に、ＣＰＵの供給路５１（または５２、５３）上での位置を示す情報（搭載位置）を格納する領域を有する。

ＲＡＭ３０に割り当てられるテーブルＴＢＬ３ｂは、”搭載位置”の情報を格納する領域と、各ＣＰＵの稼働状態を示す情報が格納される領域と、各冷却系を流れる冷却液の温度を相対的に示す”液温情報”が格納される領域とを有する。”搭載位置”の情報は、例えば、情報処理装置ＩＰＥｂの電源の投入時に、テーブルＴＢＬ２ｂからテーブルＴＢＬ３ｂに転送される。

図１２は、図１０に示すジョブ割当装置１０Ｂがジョブの投入時に実行する処理の例を示す。図５および図９と同一または同様の処理については、詳細な説明は省略する。図１２に示すフローは、ジョブ割当装置１０ＢがプログラムＰＧＭｂを実行することで処理される。すなわち、図１２は、情報処理装置ＩＰＥｂの制御方法および情報処理装置ＩＰＥｂの制御プログラムの例を示す。

ステップＳ３０２、Ｓ３０４、Ｓ３０６、Ｓ３４０、Ｓ３４２、Ｓ３５０の処理は、図９に示すステップＳ２０２、Ｓ２０４、Ｓ２０６、Ｓ２４０、Ｓ２４２、Ｓ２５０の処理と同一または同様である。図１２に示す処理は、上位装置から受けるジョブの投入の指示に基づき開始され、あるいは、図６で説明した処理と同様に、ステップＳ３５０で待機させたジョブがある場合に開始される。

ジョブの投入時に未稼働のＣＰＵがある場合、ステップＳ３０６において、ジョブ割当装置１０Ｂは、図１１に示すテーブルＴＢＬ３ｂを参照し、未稼働のＣＰＵを含む冷却系を流れる冷却液の温度を示す情報を取得する。例えば、図１１に示すテーブルＴＢＬ３ｂでは、ジョブ割当装置１０Ｂは、ＣＰＵ１、ＣＰＵ２、ＣＰＵ３のそれぞれに対応する液温情報として、”２”、”３”、”１”を取得する。

次に、ステップＳ３２１において、ジョブ割当装置１０Ｂは、ステップＳ３０６で取得した情報に基づいて、冷却液の温度が他の冷却系の冷却液の温度より低い冷却系を選択する。

次に、ステップＳ３２２において、ジョブ割当装置１０Ｂは、図５に示すステップＳ１２２と同様に、テーブルＴＢＬ３ｂを参照して、未稼働のＣＰＵに対応する”搭載位置”の情報を読み出す。例えば、図１１に示すテーブルＴＢＬ３ｂでは、ジョブ割当装置１０Ｂは、液温情報が”１”である冷却系に接続されたＣＰＵ３１−ＣＰＵ３４のうち、未稼働のＣＰＵ３２、ＣＰＵ３４の”搭載位置”の情報を読み出す。そして、ジョブ割当装置１０Ｂは、”搭載位置”に格納された値が最も小さいＣＰＵにジョブを割り当てる。例えば、図１１に示すテーブルＴＢＬ３ｂでは、ジョブ割当装置１０Ｂは、ＣＰＵ３２、ＣＰＵ３４のうち、”搭載位置”に格納された値が小さいＣＰＵ３２にジョブを割り当てる。次に、ステップＳ３４０において、ジョブ割当装置１０Ａは、ステップＳ３２２で割り当てたジョブをＣＰＵに投入する。

以上、図１０から図１２に示す実施形態では、供給路５１−５３を流れる各冷却液により複数のＣＰＵを冷却する場合、ジョブ割当装置１０Ｂは、冷却液の温度と、未稼働のＣＰＵの供給路５１−５３上での位置とに応じて、ＣＰＵにジョブを割り当てる。これにより、図１から図９に示す実施形態と同様に、情報処理装置ＩＰＥｂの稼働により消費される電力を抑制することができ、ＣＰＵの過熱により情報処理装置ＩＰＥｂに障害が発生することを抑止することができる。

図１３は、情報処理装置の別の実施形態におけるＲＯＭ２０およびＲＡＭ３０に格納される情報の例を示す。図１３に示す実施形態における情報処理装置の構成は、ＲＯＭ２０およびＲＡＭ３０に格納される情報が異なることを除き、図１０に示す情報処理装置ＩＰＥｂと同様である。

ＲＯＭ２０には、図１１に示すプログラムＰＧＭｂの代わりにプログラムＰＧＭｄが格納される。ＲＯＭ２０に割り当てられるテーブルＴＢＬ２ｂに格納される情報は、図１１に示すテーブルＴＢＬ２ｂに格納される情報と同じである。ＲＡＭ３０には、図１１に示すプログラムＰＧＭｂの代わりにプログラムＰＧＭｄが格納され、図１１に示すテーブルＴＢＬ３ｂの代わりにテーブルＴＢＬ３ｄが割り当てられる。例えば、ＲＡＭ３０に格納されるプログラムＰＧＭｄは、情報処理装置ＩＰＥｂの電源の投入時にＲＯＭ２０から転送される。ＲＯＭ２０からＲＡＭ３０に転送されたプログラムＰＧＭｄは、図１０に示すジョブ割当装置１０Ｂにより実行される。プログラムＰＧＭｄは、ＣＰＵ１１−ＣＰＵ１４、ＣＰＵ２１−ＣＰＵ２４、ＣＰＵ３１−ＣＰＵ３４にジョブを割り当てる情報処理装置ＩＰＥｂの制御プログラムの一例である。

ＲＡＭ３０に割り当てられるテーブルＴＢＬ３ｄは、温度センサＴＳ１、ＴＳ２、ＴＳ３が計測した冷却液の温度を示す情報が、”液温情報”の領域に格納されることを除き、図１１に示すテーブルＴＢＬ３ｂと同様である。例えば、ＲＡＭ３０に格納される”搭載位置”の情報は、情報処理装置ＩＰＥｂの電源の投入時にＲＯＭ２０のテーブル２ｂから転送される。

図１４は、図１３に示すＲＯＭ２０およびＲＡＭ３０を有する情報処理装置のジョブ割当装置がジョブの投入時に実行する処理の例を示す。図１４において、図５、図９および図１２と同一または同様の処理については、詳細な説明は省略する。例えば、図１４に示すフローは、図１０に示す情報処理装置ＩＰＥｂのジョブ割当装置１０Ｂがプログラムを実行することで処理される。すなわち、図１４は、情報処理装置ＩＰＥｂの制御方法および情報処理装置ＩＰＥｂの制御プログラムの例を示す。

図１４に示すフローは、ステップＳ３０６、Ｓ３２１の間にステップＳ３０８が追加されることを除き、図１２に示すフローと同様である。例えば、図１３に示すテーブルＴＢＬ３ｄでは、ジョブ割当装置１０Ｂは、ステップＳ３０６において、３つの冷却系の冷却液の温度を示す液温情報として、”３２℃”、”３７℃”、”２８℃”を取得する。

ステップＳ３０８では、ジョブ割当装置１０Ｂは、未稼働のＣＰＵを含む冷却系において、テーブルＴＢＬ３ｄに格納された冷却液の温度を示す”液温情報”が閾値以下か否かを判定する。例えば、閾値は３５℃（摂氏３５度）である。なお、閾値は、ＣＰＵに許容される最大温度および循環装置４１、４２、４３の冷却能力等に応じて決められ、３５℃に限定されない。例えば、図１３に示すテーブルＴＢＬ３ｄでは、ジョブ割当装置１０Ｂは、未稼働のＣＰＵが接続された３つの冷却系の液温情報が示す液温と閾値とを比較する。液温が閾値以下である”３２℃”、”２８℃”の冷却系があるため、ジョブ割当装置１０Ｂは、ステップＳ３２１以下の処理を実行する。

これに対して、ジョブ割当装置１０Ｂは、全ての冷却系の液温が閾値を超えている場合、処理をステップＳ３５０に移行する。これにより、閾値を超えた冷却液の温度が、ジョブの投入によりさらに上昇することを抑止することができる。この結果、ＣＰＵの過熱により情報処理装置ＩＰＥｂに障害が発生することを抑止することができる。なお、冷却液の温度が閾値以下の冷却系が１つの場合、ステップＳ３２１の処理は省略されてもよい。また、ジョブ割当装置１０Ｂは、冷却系のいずれかの液温が閾値を超える場合、処理をステップＳ２５０に移行してもよい。

なお、ステップＳ３０８は、図９に示すステップＳ２０６とＳ２２０との間に追加されてもよい。この場合、図８に示すテーブルＴＢＬ３ａは、”液温情報”として、温度センサＴＳ１、ＴＳ２、ＴＳ３が計測した冷却液の温度を示す情報を記憶する。

以上、図１３から図１４に示す実施形態では、図１０から図１２に示す実施形態と同様に、情報処理装置ＩＰＥｂの稼働により、情報処理装置ＩＰＥｂが設置される部屋を冷却する空調装置で消費される電力を抑制することができる。さらに、図１３から図１４に示す実施形態では、冷却液の温度が閾値を超える場合、ジョブの投入は抑制されるため、閾値を超えた冷却液の温度が、ジョブの投入によりさらに上昇することを抑止することができる。すなわち、冷却液の温度を直接監視してジョブの投入を制御することで、ＣＰＵの過熱により情報処理装置ＩＰＥｂに障害が発生することを抑止することができる。

図１５は、情報処理装置の別の実施形態におけるジョブ割当装置がジョブの投入時に実行する処理の例を示す。図１５において、図５、図９、図１２および図１４と同一または同様の処理については、詳細な説明は省略する。

図１５に示す処理を実行するジョブ割当装置を有する情報処理装置の構成は、ＲＯＭ２０およびＲＡＭ３０に格納されるプログラムが異なることを除き、図１０に示す情報処理装置ＩＰＥｂと同様である。すなわち、図１５は、情報処理装置ＩＰＥｂの制御方法および情報処理装置ＩＰＥｂの制御プログラムの例を示す。

図１５に示すフローは、ステップＳ３２２、Ｓ３４０の間にステップＳ３３０、Ｓ３３２が追加されることを除き、図１４に示すフローと同様である。ステップＳ３３０では、ジョブ割当装置１０Ｂは、ジョブの投入により変化するＣＰＵの発熱量の変化を予測し、発熱量の変化による冷却液の温度の変化を予測する。

例えば、ジョブ割当装置１０Ｂは、ＲＡＭ３０に保持された過去に投入したジョブによるＣＰＵの発熱量の変化を示す情報に基づき、ＣＰＵの発熱量の変化を予測する。例えば、ＣＰＵの発熱量は、ジョブの実行によりＣＰＵが消費する電力量に基づき算出される。また、ジョブ割当装置１０Ｂは、ＲＡＭ３０に保持された過去に投入したジョブによる冷却液の温度の変化を示す情報に基づき、冷却液の温度の変化を予測する。

次に、ステップＳ３３２において、ジョブ割当装置１０Ｂは、予測したジョブ投入後の冷却液の温度が、閾値（例えば、３５℃（摂氏３５度））以下の場合、ステップＳ３４０においてジョブを投入する。ジョブ割当装置１０Ｂは、予測したジョブ投入後の冷却液の温度が閾値を超える場合、ジョブの投入を抑制し、ステップＳ３５０の待機処理を実行する。

過去に投入したジョブによるＣＰＵの発熱量の変化および冷却液の温度の変化に基づき、ジョブの投入による冷却液の温度の変化を予測することで、ジョブの投入により冷却液の温度が閾値を超えることを抑止することができる。これにより、ステップＳ３０８の処理と同様に、ＣＰＵの過熱により情報処理装置ＩＰＥｂに障害が発生することを抑止することができる。なお、冷却液の温度の変化の予測が、実際の冷却液の温度の変化とほぼ一致する場合、ステップＳ３０８の判定は、省略してもよい。また、ステップＳ３３０、Ｓ３３２は、図９に示すステップＳ２２０とＳ２４０との間に追加されてもよい。この場合、図８に示すテーブルＴＢＬ３ａは、”液温情報”として、温度センサＴＳ１、ＴＳ２、ＴＳ３が計測した冷却液の温度を示す情報を記憶する。

以上、図１５に示す実施形態では、図１０から図１２に示す実施形態と同様に、情報処理装置ＩＰＥｂの稼働により消費される電力を抑制することができる。また、図１３から図１４に示す実施形態と同様に、ＣＰＵの過熱により情報処理装置ＩＰＥｂに障害が発生することを抑止することができる。

図１６は、情報処理装置、情報処理装置の制御方法および情報処理装置の制御プログラムの別の実施形態を示す。図１から図１５に示す実施形態で説明した要素と同一または同様の要素については、同一の符号を付し、これ等については、詳細な説明は省略する。図１６に示す情報処理装置ＩＰＥｅは、図１０に示すジョブ割当装置１０Ｂの代わりに、ジョブ割当装置１０Ｅを有する。ジョブ割当装置１０Ｅは、１つのジョブを複数のＣＰＵに割り当てる機能を有する。すなわち、１つのジョブは、複数のＣＰＵを占有する。例えば、情報処理装置ＩＰＥｅは、ジョブ割当装置１０Ｂの代わりにジョブ割当装置１０Ｅを有することと、ＲＯＭ２０およびＲＡＭ２０に格納される情報が異なることを除き、図１０に示す情報処理装置ＩＰＥｂと同様である。

ＲＯＭ２０には、図１０に示すプログラムＰＧＭｂの代わりにプログラムＰＧＭｅが格納され、図１に示すテーブルＴＢＬ２ｂの代わりにテーブルＴＢＬ２ｆが割り当てられる。ＲＡＭ３０には、図１０に示すプログラムＰＧＭｂの代わりにプログラムＰＧＭｅが格納され、図１に示すテーブルＴＢＬ３ｂの代わりにテーブルＴＢＬ３ｅ、ＴＢＬ３ｆが割り当てられる。テーブルＴＢＬ３ｅの例は、図１７に示され、テーブルＴＢＬ２ｆ、ＴＢＬ３ｆの例は、図１８に示される。

例えば、ＲＡＭ３０に格納されるプログラムＰＧＭｅは、情報処理装置ＩＰＥｅの電源の投入時にＲＯＭ２０から転送される。ＲＯＭ２０からＲＡＭ３０に転送されたプログラムＰＧＭｅは、ジョブ割当装置１０Ｅにより実行される。プログラムＰＧＭｅは、ＣＰＵ１１−ＣＰＵ１４、ＣＰＵ２１−ＣＰＵ２４、ＣＰＵ３１−ＣＰＵ３４に投入するジョブを割り当てる情報処理装置ＩＰＥｅの制御プログラムの一例である。例えば、ＲＯＭ２０からＲＡＭ３０へのプログラムＰＧＭｅの転送は、情報処理装置ＩＰＥｅの電源の投入時に実行される。

図１７は、図１６に示すＲＡＭ３０に割り当てられるテーブルＴＢＬ３ｅに格納される情報の例を示す。図１３と同一または同様の要素については、詳細な説明は省略する。図１７の左側には、テーブルＴＢＬ３ｅに格納される情報の一例が示され、図１７の右側には、テーブルＴＢＬ３ｅに格納される情報の他の例が示される。

テーブルＴＢＬ３ｅは、各ＣＰＵの稼働状態を示す情報が格納される領域と、各冷却系を流れる冷却液の温度を示す”液温情報”が格納される領域とを有する。すなわち、テーブルＴＢＬ３ｅは、”搭載位置”を示す情報を格納する領域を持たないことを除き、図１３に示すテーブルＴＢＬ３ｄと同様である。図１７の左側のテーブルＴＢＬ３ｅは、ＣＰＵ１３、ＣＰＵ２２、ＣＰＵ３２が未稼働である例を示し、図１７の右側のテーブルＴＢＬ３ｅは、ＣＰＵ１３、ＣＰＵ２２、ＣＰＵ３１が未稼働である例を示す。

図１８は、図１６に示すＲＯＭ２０およびＲＡＭ３０に割り当てられるテーブルＴＢＬ２ｆ、ＴＢＬ３ｆに格納される情報の例を示す。例えば、テーブルＴＢＬ２ｆの情報は、情報処理装置ＩＰＥｅの電源の投入時に、テーブルＴＢＬ３ｆに転送される。テーブルＴＢＬ２ｆ、ＴＢＬ３ｆに格納される情報は、互いに同じであるため、以下では、テーブルＴＢＬ２ｆについて説明される。なお、図１８のテーブルＴＢＬ２ｆ、ＴＢＬ３ｆ内に示す太線の四角および太線の円は、図１９に示すフローの説明に用いるために付しており、テーブルＴＢＬ２ｆ、ＴＢＬ３ｆに格納される情報ではない。

テーブルＴＢＬ２ｆは、情報処理装置ＩＰＥｅに搭載される２つのＣＰＵ間で情報の通信する場合の通信性能を示す情報を格納する領域を有する。ＣＰＵ間での情報の通信は、ネットワークＮＷを介して実行されてもよく、ネットワークＮＷ以外の通信経路を介して互いに接続されてもよい。

図１８に示す例では、テーブルＴＢＬ２ｆには、数値で示される通信性能が格納される。各数値は、ＣＰＵのいずれかが情報を送信してから、ＣＰＵの他のいずれかが情報を受信するまでの時間（レイテンシ）を示す。このため、通信性能は、値が小さいほど高く、値が大きいほど低い。なお、テーブルＴＢＬ２ｆに格納される通信性能を示す情報は、ＣＰＵのいずれかが情報を送信してから、ＣＰＵの他のいずれかが情報を受信するまでのクロックサイクル数でもよい。

なお、情報処理装置ＩＰＥｅは、ＣＰＵとメモリＭＥＭとを含む複数のノード（情報処理装置）がスイッチを介してメッシュ接続またはトーラス接続され、並列計算機システムとして動作してもよい。この場合、２つのノード間での通信は、所定数のスイッチを介して実行される。

図１６に示すジョブ割当装置１０Ｅは、例えば、１つのジョブを２つのＣＰＵに実行させるため、テーブルＴＢＬ２ｆには、２つのＣＰＵ間の通信性能を示す情報が格納される。例えば、ジョブ割当装置１０Ｅが、１つのジョブを３つのＣＰＵに実行させる場合、テーブルＴＢＬ２ｆには、３つのＣＰＵ間の通信性能を示す情報が格納される。ジョブ割当装置１０Ｅが、１つのジョブを４つのＣＰＵに実行させる場合、テーブルＴＢＬ２ｆには、４つのＣＰＵ間の通信性能を示す情報が格納される。あるいは、ジョブを実行させるＣＰＵの数がジョブのサイズに応じて変更される場合、テーブルＴＢＬ２ｆには、２つのＣＰＵ間、３つのＣＰＵ間、および４つのＣＰＵ間のそれぞれの通信性能を示す情報が格納されてもよい。

図１９は、図１６に示すジョブ割当装置１０Ｅがジョブの投入時に実行する処理の例を示す。図１９において、図５と同一または同様の処理については、詳細な説明は省略する。例えば、図１９に示すフローは、図１６に示す情報処理装置ＩＰＥｅのジョブ割当装置１０ＥがプログラムＰＧＭｅを実行することで処理される。すなわち、図１９は、情報処理装置ＩＰＥｅの制御方法および情報処理装置ＩＰＥｅの制御プログラムの例を示す。

ステップＳ４０２、Ｓ４４０、Ｓ４４２、Ｓ４５０の処理は、図５に示すステップＳ１０２、Ｓ１４０、Ｓ１４２、Ｓ１５０の処理と同一または同様である。図１９に示す処理は、上位装置から受けるジョブの投入の指示に基づき開始され、あるいは、図６で説明した処理と同様に、ステップＳ４５０で待機させたジョブがある場合に開始される。

まず、ステップＳ４０２において、上位装置からジョブの投入の指示を受けたジョブ割当装置１０Ｅは、図１７に示すテーブルＴＢＬ３ｅを参照して、未稼働のＣＰＵを検索する。次に、ステップＳ４１０において、ジョブ割当装置１０Ｅは、未稼働のＣＰＵの数が、ジョブを投入するＣＰＵの数以上か否かを判定する。すなわち、ジョブ割当装置１０Ｅは、ジョブが投入可能か否かを判定する。例えば、この実施形態では、図１８に示すテーブルＴＢＬ３ｆが使用されるため、ジョブ割当装置１０Ｅは、未稼働のＣＰＵの数が”２”以上であるか否かを判定する。例えば、図１７に示すテーブルＴＢＬ３ｅ（左側、右側とも）では、未稼働のＣＰＵの数は、”３”である。

未稼働のＣＰＵの数が、ジョブを投入するＣＰＵの数以上の場合、処理はステップＳ４１２に移行され、未稼働のＣＰＵの数が、ジョブを投入するＣＰＵの数に満たない場合、処理はステップＳ４５０に移行される。ステップＳ４５０では、図５に示すステップＳ１５０と同様に、ジョブ割当装置１０Ｅは、ジョブの投入を待機する処理を実行し、処理を終了する。図１７に示すテーブルＴＢＬ３ｅでは、未稼働のＣＰＵの数（すなわち、”３”）は、ジョブを投入するＣＰＵの数（すなわち、”２”）以上であるため、処理はステップＳ４１２に移行される。

ステップＳ４１２において、ジョブ割当装置１０Ｅは、図１８に示すテーブルＴＢＬ３ｆを参照し、未稼働の２つのＣＰＵ間での通信性能を示す情報を取得する。例えば、未稼働のＣＰＵが図１７の左側に示すテーブルＴＢＬ３ｅにより示される場合、ジョブ割当装置１０Ｅは、図１８に円で囲った通信性能を示す情報を取得する。未稼働のＣＰＵが図１７の右側に示すテーブルＴＢＬ３ｅにより示される場合、ジョブ割当装置１０Ｅは、図１８に四角で囲った通信性能を示す情報を取得する。

次に、ステップＳ４１４において、ジョブ割当装置１０Ｅは、未稼働の２つのＣＰＵ間のそれぞれにおける通信性能のうち、他より通信性能が高いＣＰＵの組み合わせを検索する。未稼働の２つのＣＰＵは、ジョブを実行していないジョブ未実行演算処理装置群の一例である。例えば、ステップＳ４１２においてジョブ割当装置１０Ｅが、図１８に円で囲った通信性能を示す情報を取得した場合、３つの円で示される３つの組み合わせのうち、通信性能が最も高い（すなわち”４”）ＣＰＵ２２とＣＰＵ３２の組み合わせが選択される。また、ステップＳ４１２においてジョブ割当装置１０Ｅが、図１８に四角で囲った通信性能を示す情報を取得した場合、３つの四角で示される３つの組み合わせのうち、通信性能が最も高い（すなわち”５”）２つの組み合わせが選択される。すなわち、ＣＰＵ１３とＣＰＵ２２の組み合わせと、ＣＰＵ２２とＣＰＵ３２の組み合わせとが選択される。

次に、ステップＳ４１６において、ジョブ割当装置１０Ｅは、通信性能が他より高い組み合わせが複数あるか否かを判定する。例えば、図１８に円で示すように、通信性能が他より高い組み合わせが１つの場合（ＣＰＵ２２とＣＰＵ３２の組み合わせ）、処理はステップＳ４４０に移行される。一方、図１８に四角で示すように、通信性能が他より高い組み合わせが複数ある場合（ＣＰＵ１３とＣＰＵ２２の組み合わせと、ＣＰＵ２２とＣＰＵ３２の組み合わせ）、処理はステップＳ４１８に移行される。

ステップＳ４１８において、ジョブ割当装置１０Ｅは、図１７に示すテーブルＴＢＬ３ｅの参照結果に基づき、ステップＳ４１４で検索された複数の組み合わせの各々において、未稼働のＣＰＵのそれぞれを含む冷却系の液温情報を加算する。例えば、図１７の右側に示すテーブルＴＢＬ３ｅに格納された情報に基づき、ジョブ割当装置１０Ｅが図１８に四角で囲った通信性能を示す情報を取得したとする。すなわち、ジョブ割当装置１０Ｅは、ステップＳ４１４において、通信性能を示す情報が”５”であるＣＰＵ１３、ＣＰＵ２２の組み合わせと、ＣＰＵ２２、ＣＰＵ３１の組み合わせとを選択する。この場合、ジョブ割当装置１０Ｅは、ＣＰＵ１３を含む冷却系の液温（３２℃）とＣＰＵ２２を含む冷却系の液温（３０℃）を加算し、”６２℃”を得る。また、ジョブ割当装置１０Ｅは、ＣＰＵ２２を含む冷却系の液温（３０℃）とＣＰＵ３１を含む冷却系の液温（２８℃）を加算し、”５８℃”を得る。

次に、ステップＳ４２０において、ジョブ割当装置１０Ｅは、ステップＳ４１８で加算した液温情報が示す液温の合計が、他の液温の合計より小さい組み合わせ選択する。例えば、図１７の右側に示すテーブルＴＢＬ３ｅに格納された情報に基づき、ジョブ割当装置１０Ｅが図１８に四角で囲った通信性能を示す情報を取得した場合、液温の合計が小さいＣＰＵ２２、ＣＰＵ３１の組み合わせが選択される。すなわち、ジョブ割当装置１０Ｅは、液温の合計が、他の液温の合計より小さいＣＰＵ２２、ＣＰＵ３１の組み合わせにジョブを割り当てる。そして、ステップＳ４４０において、ジョブ割当装置１０Ｅは、選択した組み合わせの２つのＣＰＵにジョブを投入する。

以上、図１６から図１９に示す実施形態では、ジョブ割当装置１０Ｅは、ジョブを実行させる複数のＣＰＵ間の通信性能に応じてジョブを投入するＣＰＵの組み合わせの候補を検索する。そして、ジョブ割当装置１０Ｅは、検索したＣＰＵの組み合わせの候補毎に冷却液の温度の合計を求め、温度の合計値が低い候補にジョブを投入する。これにより、１つのジョブを複数のＣＰＵに実行させる場合にも、情報処理装置ＩＰＥｅの稼働により消費される電力を抑制することができ、ＣＰＵの過熱により情報処理装置ＩＰＥｅに障害が発生することを抑止することができる。

以上の詳細な説明により、実施形態の特徴点および利点は明らかになるであろう。これは、特許請求の範囲がその精神および権利範囲を逸脱しない範囲で前述のような実施形態の特徴点および利点にまで及ぶことを意図するものである。また、当該技術分野において通常の知識を有する者であれば、あらゆる改良および変更に容易に想到できるはずである。したがって、発明性を有する実施形態の範囲を前述したものに限定する意図はなく、実施形態に開示された範囲に含まれる適当な改良物および均等物に拠ることも可能である。

１０、１０Ａ、１０Ｂ、１０Ｅ…ジョブ割当装置；２０…ＲＯＭ；３０…ＲＡＭ；４０、４１、４２、４３…循環装置；５０、５１、５２，５３…供給路；６０…部材；７０…プリント基板；ＨＥ…熱交換器；ＩＮ…入口；ＮＷ…ネットワーク；ＯＵＴ…出口；Ｐ…ポンプ；ＰＧＭ、ＰＧＭａ、ＰＧＭｂ、ＰＧＭｄ、ＰＧＭｅ…プログラム；ＰＲＯＣ…プロセッサ；ＩＰＥ、ＩＰＥａ、ＩＰＥｂ、ＩＰＥｅ…情報処理装置；ＴＢＬ２、ＴＢＬ２ｂ、ＴＢＬ２ｆ、ＴＢＬ３、ＴＢＬ３ａ、ＴＢＬ３ｂ、ＴＢＬ３ｄ、ＴＢＬ３ｅ、ＴＢＬ３ｆ…テーブル；ＴＳ１−ＴＳ３…温度センサ

Claims

ジョブをそれぞれ実行する複数の演算処理装置と、
前記複数の演算処理装置がそれぞれ発生する熱を吸収する冷媒が流れる供給路と、
冷媒を出力する出口を介して、前記供給路に冷媒を循環させる循環装置と、
ジョブを前記複数の演算処理装置に割り当てる場合、前記複数の演算処理装置のうちジョブを実行していない演算処理装置であるジョブ未実行演算処理装置があるとき、前記供給路において対応する位置が前記出口側に位置するジョブ未実行演算処理装置からジョブを割り当てるジョブ割当装置とを有することを特徴とする情報処理装置。
ジョブをそれぞれ実行する複数の演算処理装置と、
前記複数の演算処理装置のうち所定数の演算処理装置がそれぞれ発生する熱を吸収する冷媒が流れる複数の供給路と、
前記複数の供給路に冷媒をそれぞれ循環させる循環装置と、
前記複数の供給路のそれぞれにおいて冷媒を前記循環装置に戻す入口側に配置され、冷媒の温度を計測する複数の温度センサと、
ジョブを前記複数の演算処理装置に割り当てる場合、前記複数の演算処理装置のうちジョブを実行していない演算処理装置であるジョブ未実行演算処理装置があるとき、他の供給路を流れる冷媒の温度よりも温度の低い冷媒が流れる供給路に対応するジョブ未実行演算処理装置からジョブを割り当てるジョブ割当装置とを有することを特徴とする情報処理装置。
前記ジョブ割当装置は、他の供給路を流れる冷媒の温度よりも温度の低い冷媒が流れる供給路に対応する複数の前記ジョブ未実行演算処理装置のうち、前記供給路において対応する位置が、前記循環装置において冷媒を出力する出口側に位置するジョブ未実行演算処理装置からジョブを割り当てることを特徴とする請求項２記載の情報処理装置。
前記ジョブ割当装置は、閾値より高い温度の冷媒が流れる供給路に対応するジョブ未実行演算処理装置への割り当てたジョブの投入を待機することを特徴とする請求項２または請求項３記載の情報処理装置。
さらに、前記ジョブ割当装置は、割り当てたジョブを前記ジョブ未実行演算処理装置に実行させることにより冷媒の温度が前記閾値より高くなると予測される場合、割り当てたジョブの前記ジョブ未実行演算処理装置への投入を待機することを特徴とする請求項４記載の情報処理装置。
通信経路を介して互いに接続され、ジョブをそれぞれ実行する複数の演算処理装置と、前記複数の演算処理装置のうち所定数の演算処理装置がそれぞれ発生する熱を吸収する冷媒が流れる複数の供給路と、
前記複数の供給路に冷媒をそれぞれ循環させる循環装置と、
前記複数の供給路のそれぞれにおいて冷媒を前記循環装置に戻す入口側に配置され、冷媒の温度を計測する複数の温度センサと、
前記複数の演算処理装置のうちジョブを実行していない２以上の所定数の演算処理装置であるジョブ未実行演算処理装置群にジョブを割り当てる場合、通信性能が他のジョブ未実行演算処理装置群の通信性能より高いジョブ未実行演算処理装置群にジョブを割り当てるジョブ割当装置と、を有し、
前記ジョブ割当装置は、通信性能が他のジョブ未実行演算処理装置群の通信性能より高い複数の前記ジョブ未実行演算処理装置群の通信性能が同じ場合、通信性能が同じジョブ未実行演算処理装置群毎に、演算処理装置にそれぞれ対応する供給路を流れる冷媒の温度の合計を求め、温度の合計が他のジョブ未実行演算処理装置群の温度の合計より低いジョブ未実行演算処理装置群にジョブを割り当てることを特徴とする情報処理装置。
ジョブをそれぞれ実行する複数の演算処理装置と、前記複数の演算処理装置がそれぞれ発生する熱を吸収する冷媒が流れる供給路と、冷媒を出力する出口を介して、前記供給路に冷媒を循環させる循環装置と、ジョブを前記複数の演算処理装置に割り当てるジョブ割当装置とを有する情報処理装置の制御方法において、
前記ジョブ割当装置が、
前記複数の演算処理装置のうちジョブを実行していない演算処理装置であるジョブ未実行演算処理装置を検出し、
ジョブ未実行演算処理装置がある場合、前記供給路において対応する位置が前記出口側に位置するジョブ未実行演算処理装置からジョブを割り当てることを特徴とする情報処理装置の制御方法。
ジョブをそれぞれ実行する複数の演算処理装置と、前記複数の演算処理装置がそれぞれ発生する熱を吸収する冷媒が流れる供給路と、冷媒を出力する出口を介して、前記供給路に冷媒を循環させる循環装置と、ジョブを前記複数の演算処理装置に割り当てるジョブ割当装置とを有する情報処理装置の制御プログラムにおいて、
前記ジョブ割当装置に、
前記複数の演算処理装置のうちジョブを実行していない演算処理装置であるジョブ未実行演算処理装置を検出させ、
ジョブ未実行演算処理装置がある場合、前記供給路において対応する位置が前記出口側に位置するジョブ未実行演算処理装置からジョブを割り当てさせることを特徴とする情報処理装置の制御プログラム。