近年の情報通信の急速な発展、さらに放送と通信の融合時代に向けて情報処理装置が爆発的に増加すると予想されている。一方で地球温暖化の防止に向けて二酸化炭素を削減するため、情報処理装置の消費電力を大幅に削減する必要に迫られている。特にバックエンドで情報処理基盤を担うデータセンタでは、情報処理装置群が消費する電力に加え、その給電や冷却を行なう設備が消費する電力も大きな割合を占めており、装置群と設備を合わせた総合的な電力の削減が重要な課題となっている。
データセンタの省電力化に向けて、サーバ、ストレージ、ネットワークなどの情報処理装置、給電設備、冷却設備、システム運用管理において、それぞれの取り組みが始まっている。情報処理装置では、低電力デバイス/回路による消費電力当たり性能の向上や、作業負荷に応じた動作/待機ステート切替による省電力機能の採用が進められている。給電設備では変圧器、無停電電源装置、配電盤、分電器などから装置群の電源に至る給電系統の損失低減や変換効率向上、冷却設備では空調機自身の運転効率向上や給排気口の気流設計の最適化、さらに局所冷却や液冷の導入が始まっている。運用管理では、稼動情報監視、ジョブスケジューリング、さらに仮想化による装置群の運用効率改善やコンソリデーションが主要な対策に挙がっている。
給電設備や冷却設備は一般に装置群の最大定格電力に基づいて設計されているが、運用時の設備の効率や電力は、設備に対する装置群の電力の分布や変動に大きく依存している。例えば、電源変換効率は電力負荷に依存するため、装置の動作電力と給電系統によって給電損失が異なってくる。また、空調機の効率は装置の電力すなわち発熱、空調機と装置間の位置関係や距離、温度、風量、風向などに依存するため、装置の電力と配置によって冷却電力が大きく影響を受ける。
今後、データセンタの仮想化による運用管理が伸展し、省電力化のためにコンソリデーションやライブマイグレーションが活用されると予想されるため、設備に対する装置群の電力分布の偏在化や時間変動を十分考慮し、装置群と設備の総電力を削減する対策が必要になってくる。従来、サーバやコンピュータなどの装置群と冷却装置や空調設備に関する温度や電力の運用管理方法として幾つかの公知例が知られているが、上述した総合的な省電力化という意味においては局所的または逐次的な対策に留まっている。
こうした中、例えば、特許文献1では、並列計算機のうち温度の低い計算機へジョブを割り当てることにより計算機の温度上昇を抑えているが、データセンタのように多様な情報処理装置が混在する場合には温度が低い装置が省電力になるとは限らない。また、ジョブの移動前後で計算機の消費電力を見積もっているので、移動元と移動先に関わる電力が下がるものの、並列計算機全体に対しては局所的な省電力化に過ぎない。消費電力の見積りには計算機毎に付随する冷却装置の電力も含まれているが、空調設備や計算機などの配置に対する考慮がなされておらず、ジョブの割当てによっては計算機と冷却装置の電力が下がっても空調電力が上がって両者の総電力が増えるということも起こり得る。
特許文献2では、過熱コンピュータから非過熱コンピュータへソフトウェアを移動させ分散させているが、温度の低いコンピュータが必ずしも電力が低いとは限らない上、特定のコンピュータへソフトウェアを集約させ他のコンピュータを待機または休止させる方がコンピュータ群全体では省電力になる場合がある。また、ソフトウェアの移動前後でコンピュータ電力と空調電力の変動を比較しているが、比較対象が抽出した過熱と非過熱のコンピュータに限られており、コンピュータ群と空調設備を合わせた総電力を考慮している訳ではない。
特許文献3では、サーバと空調の電力が最低となる履歴プロファイルに基づいてリクエストされた作業負荷をサーバへ割り当てているので、履歴の範囲内にある新しいリクエストに対してはサーバ群と空調設備を合わせた電力を低減できるが、適合する履歴が無い場合や既に割り当てられた作業負荷が大きく変動する場合には対応できないか、履歴の蓄積に応じて逐次的にしか改善されない。また、履歴プロファイルにはサーバの位置が含まれているものの、空調電力をサーバ入排気温や電力計から求めており、サーバと空調設備との位置関係が考慮されておらず、履歴に現れる範囲内の位置にあるサーバへ作業負荷を割り当てることがサーバ群と空調設備の総電力を最小にするとは限らない。
特許文献4では、理想的な温度分布に近付くように近接したサーバ間で電力予算を貸し借りするので、サーバ群全体の合計電力が低減される訳ではない。また、温度の平準化を目的として巨視的にはサーバ群に電力を分散させているので、サーバのコンソリデーションによる省電力化とは相容れない。電力配分を行なうためにサーバの地理的位置や排気温度、空調の給気温度を参照しているが、空調設備の電力や配置を考慮しておらず、空調電力の低減に寄与していない。サーバに指定される電力ステートは待機モード(待機電力)と最大動作モード(最大電力)であり、作業負荷に応じた電力の変動は考慮されておらず、サーバ自身の省電力機能が活用されていない。
以上述べたように、従来技術は情報処理装置群と空調設備の電力を局所的または逐次的に低減するに過ぎないという問題がある。そこで、本発明の目的の一つは、装置群の電力分布や変動と設備との相互配置を総合的に考慮することにより、装置群と設備を合わせた総電力を削減し、データセンタに代表される情報処理システムの省電力運用を実現することにある。概念的に言えば、装置群のみの省電力化にとっては或る装置になるべく作業負荷を集約して割り当て、他の装置は休止または停止させる方が良く、設備のみの省電力化にとっては運転効率が高くなる配置で装置群の電力をなるべく分散させる方が良い。このため、本発明は、装置群と設備の相反する要求を満たすように装置群へ作業負荷を適度に集約かつ分散させて割り当て、装置群と設備の総電力が最小になるように最適化する運用管理方法ならびに運用管理装置を提供する。本発明の前記ならびにそれ以外の目的と新規な特徴は、本明細書の記述および添付図面から明らかになるであろう。
本発明の代表的実施の形態の特徴は、情報処理装置群の位置及び稼動情報と設備の位置及び環境情報から成る配置情報を有し、稼動情報に基づいて装置群の作業負荷に対する消費電力を求める手段と、配置情報に基づいて装置群の消費電力に対する設備の給電損失または冷却電力を求める手段を備えることにより、装置群と設備の総電力が最小になるように作業負荷を割り当てることにある。
装置群の位置と稼動情報は、特許文献2のように過熱/非過熱装置を抽出するのではなく、装置群全体に亘って装置の位置と作業負荷を把握するように収集する。稼動情報は或る装置から他の装置へ作業負荷を移動した場合に消費電力を算出するのに十分な情報とし、必要に応じて装置の仕様情報や構成情報も含まれる。設備の位置と環境情報は、給電設備であれば変圧器から装置電源に至る給電系統の給電損失を、冷却設備であれば外気から空気や冷媒を介して装置すなわち熱源に至る熱交換サイクルと冷却電力を把握するように収集する。環境情報は、設備の内蔵センサまたは外部センサに加えて、必要に応じて装置の稼動情報からも入手する。
装置電力を求める手段では、特許文献1のような温度情報や特許文献3のような履歴対照からではなく、特許文献4のように最大動作/待機ステートの固定電力と異なり、特許文献2のように装置対象を過熱/非過熱装置に限らず、稼動情報により装置群全体に亘って作業負荷の多寡に応じて変動する電力を求める。設備電力を求める手段では、特許文献2のような温度分布や特許文献3のような履歴対照からではなく、特許文献1のように装置に含まれる冷却装置の電力ではなく、装置群と設備の相互配置情報から装置群の電力分布や変動に応じた設備全体の電力を求める。装置群へ作業負荷を割り当てる手段では、特許文献1のような温度の低い装置、特許文献2のような非過熱装置、特許文献3のような履歴に残る装置、特許文献4のような地理的位置が近接した装置に対象を限らず、装置群全体を対象として求めた最適解に基づいて作業負荷を割り当てる。
本発明の代表的実施の形態の別の特徴は、装置群の位置及び稼動情報と設備の位置及び環境情報から成る配置情報を監視し、現在または予定の作業負荷に基づいて装置群へ仮作業負荷を割り当てる手段と、稼動情報に基づいて装置群の仮作業負荷に対する仮消費電力を求める手段と、配置情報と仮消費電力に基づいて設備の仮給電損失または仮冷却電力を求める手段を備えることにより、装置群の仮消費電力と設備の仮給電損失または仮冷却電力との総和を最小にする仮作業負荷割当ての最適解を求めることにある。
装置群への作業負荷割当てには多数の組合せが存在するが、仮作業負荷を割り当てて装置群と設備を合わせた総電力を最小にする解を探索することにより、最適解を効率良く見つけ出し、これを踏まえて装置群へ実作業負荷を割り当てる。仮作業負荷の割当ては、現在の作業負荷だけでなく、予定または予測される作業負荷を含めて行なえる。解の探索においては、装置の動作温度条件や許容負荷条件、給電設備の配電盤やラック電源の許容電力条件、冷却設備の冷却能力や熱溜りを避けるための区画許容電力条件などの制約条件を考慮することが可能である。
さらに別の特徴は、装置群と設備が設置される空間における、装置群の位置座標及び稼動情報と設備の位置座標及び給電または冷却に関する環境情報をマッピングした配置情報を有することにある。実空間における装置群や設備の稼動状況や配置状態を仮想空間上に再現することにより、装置群の作業負荷割当てや設備の運転シミュレーションを共通の仮想空間に対して統一的に行ない、装置群と設備が緊密に連携した運用管理を実施する。また、仮想空間を可視化することにより、装置群と設備の稼動監視、業務運用、障害検知、資産管理、電力管理などを一括して効率良く行なえる。
さらに別の特徴は、装置の仕様情報、構成情報、測定情報、稼動情報または稼動履歴に基づいて、装置の作業負荷に対して消費電力を算出する装置電力関数を備えることにより、作業負荷の割当て、変更、移動などに応じて装置電力を簡便に求めることにある。例えば、装置iの装置電力関数pDi(i=1,2,…)は、作業負荷j(j=1,2,…)を表わす変数集合をljk(k=1,2,…)として数1のように表わせる。
装置群への作業負荷割当てが変更される場合には装置間で変数集合を置換し、一つの装置に作業負荷を重複して割り当てる場合には変数集合間で演算を行なうことにより、重複した作業負荷に応じた電力を求める。作業負荷が有る場合(装置が動作)には装置電力関数pDiを多変数の線形関数または非線形関数とし、作業負荷が無い場合(装置が休止または停止)には電力値を与える不連続関数とする。装置電力関数pDiは変数に対する数表の戻り値または補間でも良い。
例えば装置電力関数pDiとして、装置の仕様情報や構成情報から最大定格電力が分かれば装置のON/OFFに対応する階段関数、最大電力と待機電力が分かれば傾きと切片で表わされる一次関数、稼動情報として複数の動作ステートと待機ステート、休止ステート、または停止ステートが分かれば条件付き関数集合、装置の消費電力を監視可能ならば稼動履歴データをフィッティングした二次関数など、得られる情報や必要な計算精度に応じて適宜採択する。簡便のため、変数集合ljを電力に影響する主要因子に集約しても良い。例えば主要因子は、サーバ装置ならプロセッサの最大性能、使用率、動作ステート(周波数、電圧)など、ストレージ装置なら起動ディスク数、アクセスパターン、アクセス時間など、ネットワーク装置なら転送スループット、スイッチ頻度などである。
さらに別の特徴は、装置の消費電力と位置及び設備の環境情報と位置に対して設備の給電損失または冷却電力を算出する設備電力関数を備えることにより、作業負荷割当てによる装置の電力分布に応じて設備電力を簡便に求めることにある。例えば、給電損失関数pSと冷却電力関数pCは、装置iの電力をpDi、位置をxi(xi,yi,zi)、設備ι(ι=1,2,…)の環境情報をει、位置をχι(xι,yι,zι)として数2、数3のように表わせる。
給電損失関数pSは、装置の位置と給電設備の環境情報と位置に基づいて、変圧器、無停電電源、配電盤、分電器などから装置電源に至る給電系統を求め、給電系統に沿って装置電力すなわち電力負荷に対する電源効率や配電損失などを計算し、給電設備全体の給電損失を算出する。冷却電力関数pCは、装置の位置及び電力(熱源分布)と冷却設備の環境情報と位置に基づいて、装置群が置かれた室内の熱流体シミュレーションと、室内冷却機から冷凍機、冷却塔などの室外機に至る冷却系統の熱交換シミュレーションを行ない、冷却設備全体の冷却電力を算出する。
装置の位置xiには、三次元位置座標の他、装置が搭載されているラックの二次元位置とラック高さ方向の番号、装置が載っているフロアタイルの二次元位置とタイルからの高さ、など三次元位置を同定できる表現を代用できる。給電設備の環境情報ειには、電源や配電器や配線の電力負荷特性、各機器やラックで監視している入出力電力、などがある。冷却設備の環境情報ειには、空気や冷媒の温湿度、流量、流速、流向、装置の動作温度、ラックや給排気口の入排気温、室内機や室外機の給排温や流量、外気の温湿度、各機器の熱負荷特性、などがある。設備の位置情報χιには、三次元位置に加えて、各機器の接続先と相互距離などのトポロジー的な接続情報も含まれて良い。
さらに別の特徴は、装置電力関数と設備電力関数の総和を目的関数として、装置群へ作業負荷を割り当てる組合せ最適化問題を定義することにより、目的関数を最小化する最適解または最適解近傍の実行可能な近似解を求めることにある。例えば、装置群と設備の総電力を示す目的関数Pは、数1の装置電力関数pDi、数2及び数3の設備電力関数pS、pCを用いて数4のように表わせる。
装置電力pDiは装置iに対する作業負荷jの割当てに依存する関数pDi(lj)であり、装置電力pDiに依存する設備電力pS、pCはpDi(lj)(i,j=1,2,…)を変数として関数pS(pDi(lj))、pC(pDi(lj))のように表わせる(pSとpCは装置の位置xi、設備の環境情報ει、位置χιの関数でもあるが簡略に表わす)。したがって、目的関数Pが装置iに対する作業負荷jの割当てに依存することにより、装置群と設備の総電力を削減する問題を、作業負荷割当ての組合せの中から目的関数Pを最小化する解を探索するという最適化問題に帰することができる。n台の装置群に重複を許してm個の作業負荷を割り当てる組合せの数Nは、数5のように表わせる。
この組合せ最適化問題を解くにあたって、nやmが小さい場合や作業負荷割当てを行なう時間間隔が十分長い場合には解空間の全探索により最適解を求められるが、そうでない場合には効率的に解を探索する近似解法を用いる。近似解法として、局所探索法、山登り法、焼きなまし法、タブー探索法など一般に良く知られているメタヒューリスティックアルゴリズムの他、今回の問題に特化して装置群の性能/電力指標や設備の特性を活用したアルゴリズムを適用して良い。
さらに別の特徴は、装置群の電力と位置及び設備の環境情報と位置に対する設備電力関数を、装置毎に必要な設備電力を表わす要素関数に近似的に分解することにより、組合せ最適化問題を簡便に解くことにある。装置電力関数と設備要素関数の和を装置関数として装置毎に定義するので、作業負荷割当てに対して目的関数の値を短時間に算出できる。例えば、装置iに対する給電損失と冷却電力の要素関数pSiとpCiは、数6、数7のように表わせる(pSiとpCiは設備の環境情報ει、位置χιの関数でもあるが簡略に表わす)。
設備電力関数pS、pCは数2、数3のように装置群と設備の全体に対する関数であるが、装置群の電力分布や設備の環境情報と位置が大幅に変動しない場合または極端に偏らない場合などでは、相互作用や非線形作用を近似して装置毎の設備要素関数pSi、pCiに分けて考えることができる。または、比較的近傍に在る装置間の相互作用を繰り込むように設備要素関数を修正しても良い。装置関数piは設備要素関数pSi、pCiと装置電力関数pDiの和であり、数8のように表わせる。目的関数Pは装置群全体に亘る装置関数piの総和であり、数9のように表わせる。
数4と数9の目的関数Pを比較すると、数4では装置群の電力分布全体に対して設備電力pS、pCを求める必要があるが、数9では装置毎に分けて装置関数piを求めれば良いので、作業負荷割当てに対する目的関数Pの計算が容易になり、解の探索を効率良く行なえる。また、装置関数piの具体的な表式を得れば、作業負荷を優先的に割り当てるべき装置の指標として変数の係数や式の微分などを活用して、最適解の近傍に解空間を絞り込める。
さらに別の特徴は、装置群の許容負荷条件と前記設備の許容電力条件を制約条件として装置群へ作業負荷を割り当てる組合せ最適化問題を解くことにより、組合せの中から実行可能な解を抽出し、効率的に解を求めることにある。合わせて、制約条件を守ることにより、装置群や設備の性能を効率よく発揮させ、電力超過や温度上昇による障害を防いで信頼性を向上させる。
装置の最大性能や最大リソースを超える作業負荷を割り当てれば、作業負荷に対する処理時間が延びて電力量(電力×時間)が増加する。このため、作業負荷の変動に対する余裕も考慮して装置の許容負荷条件を設ける。また、装置電力関数において作業負荷を表わす変数集合ljには主に電力に影響を及ぼす因子が選ばれるが、電力に余り影響しない因子であっても装置の性能やリソースにとって重要な場合がある。例えば、装置のメモリ容量、ディスク容量、I/Oスループット容量などである。このような因子に関しては、装置電力関数とは別に作業負荷割当ての可否判定を行なうための許容負荷条件とする。
給電設備では給電系統によって電源、配電盤、配電器などの定格電力があり、これを上限とする許容電力条件を守る必要がある。この条件に外れる場合は、その給電系統に繋がる装置群の作業負荷を軽減する、または装置群の電力を制限する必要がある。冷却設備では空調機、局所冷却装置、液冷装置、冷凍機、冷却塔などの定格処理能力があり、この能力以下に装置電力を抑える必要がある。また、冷却設備では、装置を動作温度範囲内に保ち、過剰な発熱集中を避けて冷却効率を上げるため、装置群が配置される空間の領域、区画、ラック列などに対して許容電力条件を設けて良い。
さらに別の特徴は、装置群への作業負荷割当て問題を解いて求められた最適解または近似解と配置情報に基づいて、装置群の位置に対する消費電力すなわち電力分布を得て給電設備または冷却設備を制御することにある。これにより、設備の運転効率を向上させ、さらに給電損失や冷却電力を抑制することができる。例えば、給電設備では出力電力に応じて並列接続された機器の稼働台数を変えることにより給電効率が向上し、冷却設備では発熱分布に応じて空気や冷媒の供給温度、給排気口やファンの風量や風向、冷凍機や冷却塔の温度や流量などを調節することにより冷却効率が向上する。
さらに別の特徴は、装置群へ作業負荷を割り当てる手段として、仮想化環境、ジョブスケジューラ、SANブート環境、稼動管理を活用することにある。これらの手段は、作業負荷割当ての契機や周期、作業負荷の移動に伴うオーバーヘッドやタイムロス、作業負荷の変動や生滅、装置の作業負荷のリンク、取得可能な装置の稼動情報、既設または新設のシステムへの導入容易さ、システムのセキュリティや信頼性、などを考慮して選択され、並列的または階層的に混在しても良い。仮想化環境では物理装置群への仮想装置の配置、ジョブスケジューラでは装置群へのジョブの配置、SANブート環境では起動する装置群の配置、稼動管理では稼動、休止または停止する装置群の配置により、装置群へ作業負荷を割り当てる。
さらに別の特徴は、装置群への作業負荷割当ての変更を反映して、装置群と設備の総電力を低減するように装置群を稼動させることにある。サーバ装置では、アプリケーション、仮想マシン、ジョブなど、作業負荷を与えるソフトウェアを移動する。ストレージ装置ではアクセス頻度の高いデータを移動またはコピーすることにより、移動先に作業負荷が移動する。ネットワーク装置ではネットワーク接続構成を変更することにより、運用ノードが移り変わる。
本願において開示される発明のうち代表的なものによって得られる効果を簡単に説明すれば、例えばデータセンタなどのような情報処理システムにおいて、情報処理装置群と設備を連携させた運用管理により装置群と設備を合わせた総消費電力を削減できる。
以下、本発明の実施の形態を図面に基づいて詳細に説明する。実施の形態を説明するための全図において、同一の部材には原則として同一の符号を付し、その繰り返しの説明は省略する。また、以下の実施の形態においては便宜上その必要があるときは、複数のセクションまたは実施の形態に分割して説明するが、特に明示した場合を除き、それらはお互いに無関係なものではなく、一方は他方の一部または全部の変形例、詳細、補足説明等の関係にある。
また、以下の実施の形態において、要素の数等(個数、数値、量、範囲等を含む)に言及する場合、特に明示した場合および原理的に明らかに特定の数に限定される場合等を除き、その特定の数に限定されるものではなく、特定の数以上でも以下でも良い。さらに、以下の実施の形態において、その構成要素(要素ステップ等も含む)は、特に明示した場合および原理的に明らかに必須であると考えられる場合等を除き、必ずしも必須のものではないことは言うまでもない。同様に、以下の実施の形態において、構成要素等の形状、位置関係等に言及するときは、特に明示した場合および原理的に明らかにそうでないと考えられる場合等を除き、実質的にその形状等に近似または類似するもの等を含むものとする。このことは、上記数値および範囲についても同様である。
(実施の形態1)
図1は、本発明による実施の形態1の情報処理システムの運用管理装置および運用管理方法を示す構成図である。情報処理システム10は、情報処理装置201〜20n、装置群201〜20nへ給電する給電設備401〜40u、装置群201〜20nを冷却する冷却設備501〜50v、装置群201〜20nと設備401〜40u、501〜50vを管理する運用管理装置60から成る。
装置群201〜20nには作業負荷301〜30mが割り当てられる。作業負荷301〜30mは、図1に示す一例のように、装置に対して単独の作業負荷が割り当てられる場合(装置20n−1と負荷30m−2)、複数の作業負荷が割り当てられる場合(装置201と負荷301〜302、装置203と負荷303〜305、装置20nと負荷30m−1〜30m)、作業負荷が割り当てられない場合(装置202)がある。
運用管理装置60は装置群201〜20nと設備401〜40u、501〜50vに接続し、装置群201〜20nの位置と稼動情報61及び設備401〜40u、501〜50vの位置と環境情報62から成る配置情報を有し、装置群201〜20nの消費電力を求める手段63と、給電設備401〜40uの給電損失と冷却設備501〜50vの冷却電力を求める手段64と、装置群201〜20nへの作業負荷301〜30mの割当てを求める手段65を備える。運用管理装置60は、例えば、コンピュータシステムを用いたプログラム処理によって実現される。
実施の形態1の運用管理方法では、運用管理装置60が装置群201〜20nと設備401〜40u、501〜50vと通信することにより装置群201〜20nの稼動情報と設備401〜40u、501〜50vの環境情報を収集し、配置情報61と62を取得する。運用管理装置60は、手段63により装置群201〜20nの稼動情報61に基づいて作業負荷301〜30mに対する装置群201〜20nの消費電力を求め、手段64により装置群201〜20nの位置と手段63から求めた消費電力及び設備401〜40u、501〜50vの位置と環境情報62に基づいて給電設備401〜40uの給電損失と冷却設備501〜50vの冷却電力を求め、手段63と64に基づいて装置群201〜20nと設備401〜40u、501〜50vの総消費電力を低減するように装置群201〜20nへの作業負荷301〜30mの割当てを求める。
配置情報61に含まれる装置群201〜20nの位置情報は、各装置の位置座標または位置を同定する識別データから成り、必要に応じて装置間の接続構成データを含む。装置群201〜20nの稼動情報は作業負荷量を示すデータと消費電力を示すデータなどから成り、例えば性能、リソース使用率、動作/休止ステート、定格電力または測定電力、動作温度などから成る。作業負荷量データは装置間で置換できる汎用的な計量であり、特定の装置、作業負荷、装置と作業負荷の関係に依らない。消費電力データは作業負荷量に対する装置の消費電力特性を直接的または間接的に表わす数値、数式または数表であり、各装置に依存する。
配置情報62に含まれる設備401〜40u、501〜50vの位置情報は、各設備の位置座標または位置を同定する識別データと、設備間の接続構成データから成る。設備401〜40u、501〜50vの環境情報は、設備の稼動データと動作特性データ、周辺環境の監視データなどから成り、例えば電力、温度、湿度、流量、流向、定格出力や定格性能などから成る。動作特性データは、給電設備なら電力負荷に対する給電損失特性、冷却設備なら熱負荷に対する消費電力特性を表わす数値、数式または数表である。なお、装置群201〜20nの稼動情報と設備401〜40u、501〜50vの環境情報は、例えば装置の温度データ設備の電力データのように互いに補完し合える。
装置群201〜20nの消費電力を求める手段63では、一つの方法として、与えられる作業負荷量をその都度既知の数値データと照合し、補間や統計処理などにより消費電力を計算する。別の方法としては、予め作業負荷量に対する装置電力の関係を、作業負荷量を変数として定式化する、または作業負荷量を引数として数表からの戻り値を出力するルーチンにする。前者の方法は装置群201〜20nの稼動情報の蓄積に伴って照合と計算に時間を要するが、計算精度が向上する。後者の方法は、稼動情報の蓄積に伴って関係式や数表を補正することにより、精度を上げつつ時間を抑えられるうえ、作業負荷量と装置電力の関係を見通し良く把握できる。
設備401〜40u、501〜50vの消費電力を求める手段64では、一つの方法として、配置情報61における装置群201〜20nの位置と手段63により得られる装置群201〜20nの消費電力、配置情報62における設備401〜40u、501〜50vの位置と環境情報に基づいて、その都度シミュレーションを行なって給電損失や冷却電力を算出する。別の方法として、予め想定条件で詳細シミュレーションを行ない、線形近似することにより各装置の位置と電力に対する設備の要素電力の関係を数式、数表または簡易シミュレータとして求めておく。前者の方法は計算時間が許容されれば高い精度を得られる。後者の方法は、予め詳細シミュレーションを済ませることにより、想定条件の範囲内で精度を保証しつつ計算時間を短縮できる。
装置群201〜20nへの作業負荷301〜30mの割当てを求める手段65には幾つかの方法がある。一つの方法は、装置群への作業負荷割当ての組合せに対して手段63と64により装置群の電力と設備の電力をその都度計算し、組合せ同士の計算結果を比較して総電力を最小にする割当て解を選択する。別の方法は、手段63で予め得られた作業負荷量に対する装置電力の関係と、手段64で予め得られた装置群の電力分布に対する設備要素電力の関係から、作業負荷割当てにおける優先順位指標を導出し、この指標に沿って装置群へ作業負荷を割り当てる。前者の方法は組合せが少ない場合に総電力を最小にする最適解を求めるのに適し、後者の方法は組合せが多い場合に最適解または近似解を高速に求めるのに適する。後者の方法では、解の精度と計算時間に応じて、一旦得られた割当て解に対して装置群の電力分布を計算し、これに対する設備要素電力の関係を求め直し、その関係を使って指標を導出して再度作業負荷割当てを求め、前後の割当て解が所定条件内に収束するまで繰り返しても良い。
実施の形態1に示す情報処理システム10の運用管理方法によれば、装置群201〜20nの位置と稼動情報61及び設備401〜40u、501〜50vの位置と環境情報62から成る配置情報を有することにより、装置群201〜20nに対して作業負荷301〜30mを割り当てる最良解を得て、装置群201〜20nの消費電力と設備401〜40u、501〜50vの給電損失または冷却電力を合わせた総消費電力を削減できる効果がある。また、所望の契機や計画、新規作業負荷の投入、既存作業負荷の終了などに応じて装置群201〜20nへの作業負荷割当てを更新することにより、情報処理システム10の省電力運用を実現できる。
情報処理システム10としてデータセンタやコンピュータルームが代表的であるが、産業設備、商業設備、通信設備、交通機関などの業務運用システムにも応用できる。また、既設システムの運用管理だけでなく、システムの新設、増設、移設、改修などの設計/診断ツールとしても有用である。複数の施設や場所にまたがるシステムであっても遠隔管理を行なえば本実施の形態を適用できる。
情報処理装置201〜20nにはサーバ装置、ストレージ装置、ネットワーク装置などがあり、サーバ装置には汎用サーバ、専用サーバ、メインフレーム、並列コンピュータ、スーパーコンピュータ、組込みコンピュータ、パーソナルコンピュータなど、ストレージ装置には磁気ディスク、固体ディスク、光ディスク、テープなど、ネットワーク装置にはルータ、スイッチ、ハブなど、さらに周辺装置としてプリンタ、複写機、モデム、ディスプレイなども含まれる。また、本実施の形態は動作/待機/休止/停止ステートのデマンドベーススイッチング機能、いわゆる省電力モードを有する装置にも適用できる。例えばサーバではDBS、ストレージではMAID、ネットワークではポート電源制御などが該当する。ハードウェア形態はブレード型、ラックマウント型、タワー型、専用筺体型に限らず、多様に適用できる。
作業負荷301〜30mとは、サーバ装置ならアプリケーション、ストレージ装置ならアクセスデータ、ネットワーク装置なら転送データなどを指す。作業負荷量データには、サーバ装置なら性能、リソース使用率、動作/休止ステートなど、ストレージ装置なら起動ディスク数、アクセスパターン、アクセス時間など、ネットワーク装置なら転送パケット数、スイッチ頻度などがある。また、作業負荷のタイプとして、固定/浮動小数点演算、トランザクション処理、データベース処理、技術計算、データの形式や粒度、保証帯域などを区別して装置の消費電力特性を考慮することも可能である。
給電設備401〜40uには変圧器、無停電電源装置、配電盤、分電器、装置が搭載されるラックの電源などがあり、電力センサ、電流/電圧センサ、漏電センサなども含まれ、場合によって給電源の発電所、送電設備、変電設備、給電先の装置の電源も対象になる。冷却設備501〜50vには空調機、冷凍機、冷却塔、給排気口、ファン、ダクト、冷媒配管などがあり、室内外に配置される温度センサ、湿度センサ、流量/流向センサなども含まれ、場合によって液冷装置、ラック列やラック前面/背面の局所冷却装置、装置の冷却装置も対象になる。
運用管理装置60には、情報処理装置群201〜20nと設備401〜40u、501〜50vの共通マネージャサーバを設ける、または両者のマネージャサーバを連携する形態があり、マネージャ機能を装置201〜20nの一部に担わせても良い。本実施の形態による運用管理方法は、ミドルウェア、アプリケーション、組込み制御ソフトウェア、ファームウェアなどのソフトウェアとして実装でき、例えば最適化問題を解くエンジンをハードウェアとして実装することも可能である。マネージャが装置の稼動情報や設備の環境情報を取得するため、各装置や各設備にエージェント、サービスプロセッサ、インターフェースなどを設けるが、装置群や設備が自律分散システムを構築しても良い。なお、本実施の形態における装置群と設備の総電力を削減する効果は、装置群の位置及び稼動情報と設備の位置及び環境情報を示す配置情報と、装置群の消費電力を求める手段と、設備の消費電力を求める手段と、装置群への作業負荷割当てを求める手段によって発揮されるのであって、実施の形態1や図1に示す装置自体や計算手順などにより限定されない。
(実施の形態2)
図2は本発明による実施の形態2の情報処理システムの運用管理装置および運用管理方法を示す構成図である。情報処理システム110は、情報処理装置1201〜120n、装置群1201〜120nへ給電する給電設備1401〜140u、装置群1201〜120nを冷却する冷却設備1501〜150v、装置群1201〜120nと設備1401〜140u、1501〜150vを管理する運用管理装置1601、1602から成り、装置群1201〜120nには作業負荷1301〜130mが割り当てられる。
運用管理装置1601は装置群1201〜120nに接続され、装置群1201〜120nの稼動情報を監視し、装置群1201〜120nの位置と稼動情報から成る配置情報161を有し、装置群1201〜120nの消費電力を求める手段163と、装置群1201〜120nへの仮作業負荷1301〜130mの割当てを求める手段165と、装置群1201〜120nへ実作業負荷1301〜130mを割り当てる手段168を備える。運用管理装置1602は設備1401〜140u、1501〜150vに接続され、設備1401〜140u、1501〜150vの環境情報を監視し、設備1401〜140u、1501〜150vの位置と環境情報から成る配置情報162を有し、給電設備1401〜140uの給電損失と冷却設備1501〜150vの冷却電力を求める手段164と、設備1401〜140u、1501〜150vへ運転指示を与える手段169を備える。
実施の形態2の運用管理方法では、装置側の運用管理装置1601と設備側の運用管理装置1602が連携することにより、運用管理装置1601と1602の間で必要なデータを交換する。運用管理装置1601では、手段163により装置群1201〜120nの稼動情報161に基づいて作業負荷に対する装置群1201〜120nの消費電力の関係を求める。運用管理装置1602では、手段164により運用管理装置1602が得る設備1401〜140u、1501〜150vの配置情報162に基づいて、運用管理装置1601から得られる装置群1201〜120nの位置と消費電力に対する給電設備1401〜140uの給電損失と冷却設備1501〜150vの冷却電力の関係を求める。
さらに運用管理装置1601では、手段163における作業負荷に対する装置電力の関係と手段164における装置電力分布に対する設備電力の関係に基づいて、装置群1201〜120nまたは設備1401〜140u、1501〜150vの制約条件166と作業負荷1301〜130mに対する運用ポリシー167に適合しつつ、手段165により装置群1201〜120nと設備1401〜140u、1501〜150vの総消費電力を最小化するように装置群1201〜120nへの仮作業負荷の割当て解を導出する。この結果を受けて、運用管理装置1601は手段168により適切な契機において装置群1201〜120nへ実作業負荷を割り当て、運用管理装置1602は手段169により装置群1201〜120nの電力分布と配置情報162を踏まえて設備1401〜140u、1501〜150vへ運転指示を与える。
実施の形態2に示す情報処理システム110の運用管理方法によれば、装置群1201〜120nへの仮作業負荷の割当て解を求める手段165では、仮作業負荷として現在の作業負荷1301〜130mと共に予定または予測される作業負荷も算入でき、制約条件166や運用ポリシー167に対して現在からの時間推移を含めて見通し良く判断でき、実作業負荷割当てにおける最適解からの乖離、条件違反による障害、煩雑な修正によるオーバーヘッドなどを避けられる。また、手段165の仮作業負荷割当てと手段168の実作業負荷割当てを分けることにより、作業負荷の見通しと共に割当て解の導出に要する時間も考慮し、手段168において割当て変更を実行する契機と手段169において設備1401〜140u、1501〜150vへ運転指示を行なう契機を適切に設定することが可能になる。
制約条件166には、装置1201〜120nの動作温度、最大作業負荷、作業負荷の変動に対する余裕度などを考慮した許容負荷条件、給電設備1401〜140uの定格電力、電源効率などを考慮した許容電力条件、冷却設備1501〜150vの定格能力、流量/流向などを考慮した区画や近傍装置間の許容電力条件などがある。運用ポリシー167に記述される内容には、作業負荷の優先度、実行契機、処理時間、スケジュール、作業負荷に対する装置1201〜120nのリソース配分、サービスレベル、電力コストなどがある。手段165において装置群1201〜120nへ仮作業負荷を割り当てる段階で、先に制約条件166と運用ポリシー167を与えることにより、一旦割当て解を求めてから制約条件166と運用ポリシー167を検証するよりも後戻りを無くせるうえ、仮作業負荷割当ての組合せの中から候補を絞り込めるので効率良く解を求められる。また、制約条件166により装置群1201〜120nや設備1401〜140u、1501〜150vの不具合や障害を回避でき、運用ポリシー167により省電力化と共にサービスを向上させる高度な運用管理を実現できる。
なお、実施の形態2では装置側の運用管理装置1601と設備側の運用管理装置1602を設けることにより、両者の計算処理を分けて複雑化を避けつつ、両者間のインターフェースを介して緊密に連携動作を行なわせている。両者を別々のマネージャサーバに実装すれば分散処理により高速化を図れるが、十分な計算性能があれば共通のマネージャサーバに実装しても良い。また、実施の形態2では装置群1201〜120nの電力分布を踏まえて設備1401〜140u、1501〜150vへ先行的に運転指示を行なえるので、従来のように受動的に設備を制御する場合に比べて過剰な余裕を持たせる必要がなくなり、無駄を省いて効率的な運転を行なえる。
(実施の形態3)
図3は本発明による実施の形態3の情報処理システムの運用管理方法における配置情報を示すレイアウト図であり、例えば実施の形態1や実施の形態2に示すような運用管理装置の表示画面の一例を示す。情報処理システム210は、情報処理装置群と、これらが搭載されるラック列2201〜22010、変圧器240と無停電電源装置241と配電盤2421〜2424から成る給電設備、冷却塔250と冷凍機251と空調機2521〜2526とグリル253から成る冷却設備から構成される。
給電設備は、変圧器240から無停電電源装置241と配電盤2421〜2424を介してラック列2201〜22010へ給電し、さらにラック列の配電ユニットから情報処理装置へ給電する。冷却設備は床下空調を行ない、空調機2521〜2526がグリル253(多数あるが一つの符号で代表)から冷気を供給して装置群の発熱による温気を吸い込み、空調機2521〜2526と冷凍機251と冷却塔250が互いに熱交換を行ない、冷却塔250が外気へ放熱する。
実施の形態3によるレイアウトは、装置群の位置座標と稼動情報及び設備の位置座標と環境情報をマッピングした配置情報であり、装置群と設備が設置される実空間情報を運用管理装置における仮想空間上に再現して可視化したものである。配置情報は、室内における装置の配置(図3は全体図のため未表示)、ラック列2201〜22010や配電盤2421〜2424や空調機2521〜2526やグリル253などの配置に加えて、室外に在る変圧器240と無停電電源装置241から室内に在る配電盤2421〜2424とラック列2201〜22010に至る給電系統の接続構成と、室外に在る冷却塔250と冷凍機251と空調機2521〜2526から成る熱交換系統の接続構成も表わす。
実施の形態3では、表示画面上のボタン260〜263、270〜275、280、281をクリックすることにより多様な表示を行なえる。作業負荷表示ボタン260では装置群の作業負荷分布を表示できる。レイアウトの全体表示ではラック列2201〜22010毎に、拡大表示では装置毎に、サーバ、ストレージ、ネットワークなどの装置の種類と作業負荷量の多寡を画像の色と濃淡により表示し、装置にマウスを合わせればポップアップ表示により作業負荷の詳細データを表示する。ポップアップ表示には、マウスまたはキーボードの操作に応じて、装置の仕様情報、構成情報、資産情報などを表示できる。
同様に、電力表示ボタン261ではラック列2201〜22010毎や装置毎の消費電力分布を表示すると共に、変圧器240と無停電電源装置241と配電盤2421〜2424の出力電力または給電損失と、冷却塔250と冷凍機251と空調機2521〜2526の電力を表示し、合わせて装置群と設備の総電力を数値で表示する。温度表示ボタン262では室内に散在するセンサの温度分布と共に、装置の動作温度、ラック列2201〜22010の入排気温、空調機2521〜2526の給排気温、グリル253の給気温、冷却塔250や冷凍機251の冷媒の給排温、外気温を表示する。障害表示ボタン263では、装置群または設備の故障と共に、装置の動作温度条件や許容負荷条件、装置や設備の許容電力条件などに対する警報とその内容を表示する。
図3はxy平面で見たレイアウト図であるが、ボタン270〜275により平面を変えて表示できる。ボタン270はxy平面表示を指定し、ボタン271はxy平面をz軸全体に亘って表示するか、xy平面を特定のz座標を指定して切り出すかを選択する。ボタン272〜275も同様である。xy平面のボタン270、yz平面のボタン272、zx平面のボタン274を切り替えることにより、三次元空間の情報を表示できる。ボタン280と281はそれぞれ拡大表示と縮小表示であり、前者では装置や設備の詳細状況を表示し、後者では全体状況を表示できる。また、全体を俯瞰的に把握する必要に応じて三次元表示を行なわせても良い。
実施の形態3による配置情報によれば、装置群と設備が設置される実空間における装置群の稼動状況や設備の環境情報を一括して可視化して把握でき、配置情報に基づいて実施の形態1や実施の形態2において説明したような装置群の作業負荷割当てや設備の運転指示を統一的且つ緊密に連携できる。装置群と設備を合わせた総消費電力を削減する省電力運用だけではなく、装置群と設備の稼動監視、電力管理、業務運用、障害検知、資産管理などを一括して取り扱えるので、運用管理者の業務効率を向上できる。また、現行システムにおける装置群と設備双方の効率、リスク、コストを診断できるので、システムの移設、増設、改修、更新などの計画立案や工事に役立てることができる。
(実施の形態4)
図4は本発明による実施の形態4の情報処理システムの運用管理方法における情報処理装置群の稼動情報を示す数表であり、情報処理装置がサーバである場合の一例を示す。サーバの稼動情報は、仕様情報300、構成情報310、稼動情報(または測定情報、稼動履歴)320を含む。例えば実施の形態1や実施の形態2に示すような運用管理装置が装置毎の仕様情報300と構成情報310と稼動情報320を有し、同一のデータファイル、または互いに関連付けた異なるデータファイルとして管理する。なお、仕様情報300と構成情報310と稼動情報320の項目、順序、組合せなどは必要に応じて改変できる。
仕様情報300は、装置管理番号、装置管理者、装置呼称、装置品名、装置型番、装置性能a、装置性能b、装置性能c、定格電力(最大)、定格電力(待機)、定格温度(最大)、定格温度(最小)などを含む。構成情報310は、CPU型番、CPU最大周波数、CPU搭載数、メモリ型番、メモリ容量、メモリ搭載数、チップセット型番、ディスク型番、ディスク容量、ディスク搭載数、I/O転送速度、I/O本数などを含む。稼動情報320は、装置位置座標、作業負荷タイプ、装置/CPUステート、CPU動作周波数、CPU使用率、CPU動作温度、メモリ使用率、ディスク転送速度、I/O転送速度、装置動作電力、装置入気温度、装置排気温度などを含む。
実施の形態4では、仕様情報300と構成情報310と稼動情報320により数1に示すような装置電力関数を導出する。例えば簡便な導出方法では、装置iの装置電力関数pDi(i=1,2,…)は、仕様情報300の定格電力(最大)をpmaxi、定格電力(最小)をpidlei、構成情報310のCPU最大周波数をfmax、稼動情報320のCPU動作周波数をfi、CPU使用率をαiと置き、fi/fmax・αiを作業負荷量として数10のように表わせる。複数のCPUが有る場合またはCPUに複数のコアが有る場合などでは簡便のためfiとαiの平均値を取れば良い。
作業負荷が無い場合や割り当てられていない場合、装置iの装置電力関数pDiは、例えばCPU使用率αi=0%と想定して数10よりpDi=pidleiとする。稼動情報320の装置/CPUステートとしてスリープ状態または休止状態を有する場合は、CPU使用率αi=0%において各ステートに対応する電力pDiを定義すれば良い。また、現在、装置iにて作業負荷fi/fmax・αiを行っているものとして、それを装置jへ移動した場合の装置電力を見積もる場合には、仕様情報300の装置性能aをγa、装置性能bをγb、装置性能cをγc、稼動情報320の作業負荷タイプをw(w=a,b,c)として数11のように置換し、それを装置jの装置電力関数pDjへ代入すれば良い。
もし置換後の作業負荷量γwi/γwj・fi/fmax・αiが100%を超える場合には、移動先の装置jの電力pDj=pmaxjと置き、作業負荷の処理時間が超えた分に相当して延びる(電力量が増す)と考えれば良い。なお、特に限定はされないが、作業負荷タイプとは、例えば、固定小数点演算処理、浮動小数点演算処理、メモリ読書き処理等のように単純にCPU周波数ではなくハードウェアアーキテクチャに依存してその処理能力が大きく変化し得るような処理内容を区別するためのものである。また、装置性能γwは、特に限定はされないが、この作業負荷タイプ毎のベンチマークスコアなどである。
既存の測定情報または稼動履歴として稼動情報320の装置動作電力が得られる場合には、作業負荷量fi/fmax・αiと装置動作電力pmeasiのデータから装置電力関数pDiの近似式を求められる。図5はこれらのデータをプロットした一例であり、近似した装置電力関数pDiを示すグラフである。関数pDiは一次関数の傾きをaDi、切片をbDiとして数12のように表わせる。図5の例では実線が近似関数を示し、aDi=1.3175、bDi=152.16である。
装置iが省電力機能として作業負荷に応じて複数の動作ステート(CPU動作周波数、CPUコア電圧)のデマンドベーススイッチングを行なう場合には、装置電力pDiが階段状に変化する。この場合には、各動作ステートと作業負荷量範囲に対して数10や数12のような一次関数をそれぞれ定義し、装置電力関数pDiを関数集合で表わせる。別の簡便な方法として、階段状の装置電力関数pDiを一つの二次関数で近似することも可能である。図6は3つのステートのデマンドベーススイッチングにおける作業負荷量fi/fmax・αiと装置動作電力pmeasiのデータをプロットした一例であり、二次で近似した装置電力関数pDiを示すグラフである。関数pDiは二次の項の係数をaDi、一次の項の係数をbDi、定数項をcDiとして数13のように表わせる。図6の例では破線が階段状の一次関数、実線が近似した二次関数を示し、aDi=0.0134、bDi=0.7297、cDi=103.16である。
装置iの装置動作電力pmeasiを直接取得できず、熱抵抗と熱時定数が分かる場合には、稼動情報320の入気温度と排気温度から動作電力pmeasiを間接的に導出できる。動作電力pmeasiは、熱抵抗をRthi、熱時定数をτthi、入気温度をTini、排気温度をToutiとして数14のように表わせる。動作電力の変化に比べて温度は熱時定数を持ってゆっくり変化するので、温度変化の傾きを考慮して補正する。
装置動作電力pmeasiが間接的に分かれば、作業負荷量のfi/fmax・αiの測定と合わせて数12や数13のような装置電力関数pDiを導出できる。また、熱抵抗Rthiと熱時定数τthiが初めに不明であっても、定格電力(最大)pmaxiまたは定格電力(最小)pidleiが既知であれば、入気温度Tini及び排気温度Toutiの測定データや温度変化の傾きデータから熱抵抗Rthiや熱時定数τthiを算出できる。
実施の形態4による装置電力関数によれば、簡便に作業負荷に対する装置群の消費電力を求めることができ、作業負荷量と装置電力の関係を見通し良く把握して装置群に対する作業負荷割当てを効率良く行なえる。また、装置の稼動情報が全て得られなくても数10や数14のように一部のデータから装置電力関数を導出でき、測定情報や稼動履歴が得られれば数12や数13のように実測に即した装置電力関数を導出でき、さらに測定情報や稼動履歴が蓄積されれば近似精度を向上できる。
実施の形態4ではサーバ装置を一例としたが、ストレージ装置やネットワーク装置であっても同様に装置の稼動情報から装置電力関数を導出できる。実施の形態4では作業負荷量を表わす主要変数としてCPU最大周波数、CPU動作周波数、CPU使用率を用いたが、ストレージ装置であれば起動ディスク数、アクセスパターン、アクセス時間など、ネットワーク装置なら転送パケット数、スイッチ頻度などを用いて良い。
(実施の形態5)
図7は本発明による実施の形態5の情報処理システムの運用管理方法における設備電力関数の説明図であり、実施の形態3の情報処理システム210を例としたものである。例えば装置i221iがラック列2207に位置する場合、給電設備は矢印243に示すように変圧器240から無停電電源装置241と配電盤2423を経て装置iに給電する。装置i221iが消費した電力は顕熱に変わって空気を温める。冷却設備では、冷気が空調機2521〜2526から床下、グリル(図7では見易さのため床のタイルやグリルを省略)を経て装置i221iへ供給され、装置i221iによる温気が矢印2541〜2546に示すように空調機2521〜2526へ戻り、空調機2521〜2526の吸い取った熱が冷凍機251と冷却塔250を経て外気へ放出される。
装置iと同様に装置群全体に亘って位置座標と装置電力または装置電力関数が分かれば、給電設備の給電損失と冷却設備の冷却電力を計算できる。例えば実施の形態4のように、稼動情報320から装置群の位置座標を得て、数10、数12または数13のような装置電力関数を得れば、装置群全体の電力分布を求めることができ、これらを入力として数2や数3に示すような設備電力関数pS、pCにより設備電力を計算できる。設備電力関数pS、pCの計算には、設備の位置座標、接続構成、動作特性などの環境情報を予め入力しておいたシミュレータを用いて良い。
さらに設備電力を簡便に求めるためには、所定条件の範囲内で線形近似を行なうことにより、設備電力関数pS、pCを数6や数7に示すような設備要素関数pSi、pCiに分解する。設備電力関数pS、pCは、装置毎の要素関数pSi、pCiの装置群全体に亘る線形和になる。装置iの給電設備の要素関数pSiは、矢印243に示す給電系統に沿って予めシミュレーションを行なうことにより求める。冷却設備の要素関数pCiは、矢印2541〜2546に示すように装置iが空調機2521〜2526に与える熱負荷の影響を考慮して、予めシミュレーションを行なって求める。シミュレーションでは、装置iの電力を振りながら給電/冷却設備電力の感度係数を算出する。単純化した場合には、設備要素関数pSi、pCiを一次関数、傾きをaSi、aCi、切片をbSi、bCiとして数15、数16のように表わせる。
設備要素関数pSi、pCiが求まれば、装置電力関数pDiとの和を取って数8のような装置関数piを導出できる。装置関数piは、装置毎に掛かる装置電力と設備電力を表わす。例えば実施の形態4で説明した数12に示す装置電力関数pDiを用いると、装置関数piを数17のように表わせる。装置関数piの傾きaiと切片biを新たに定義する。装置群と設備の総消費電力Pは装置群全体に亘る装置関数piの総和であり、数9を数18のように書き直せる。
数18を見れば明らかなように、装置群への作業負荷(ここではfi/fmax・αi)の割当てを最適化することにより、装置群と設備の総電力Pを最小化できる。すなわち、目的関数Pを最小化するように、装置群への作業負荷を割り当てる組合せ最適化問題を解けば良い。装置が多い場合には組合せの数が数5に示すように膨大になるため、組合せの全探索を行なうことは非現実的である。実施の形態5では適切な近似を行なうことにより、数18の目的関数Pを一次関数の線形和にしたので、装置関数piの傾きaiと切片biを指標として効率良く最適解を発見できる。
(実施の形態6)
図8は本発明による実施の形態6の情報処理システムの運用管理装置および運用管理方法を示す構成図である。情報処理システム410は、物理サーバ4201〜420n、サーバ群4201〜420nへ給電する給電設備4401〜440u、サーバ群4201〜420nを冷却する冷却設備4501〜450v、サーバ群4201〜420nと設備4401〜440u、4501〜450vを管理する運用管理装置460から成り、仮想化環境を構成する。物理サーバ4201〜420nにはハイパーバイザ4211〜421nを介して仮想マシン4301〜430mが配置され、その上でOS4311〜431mと作業負荷であるアプリケーション4321〜432mが動作する。運用管理装置460では、物理サーバ4201〜420nと仮想マシン4301〜430mを管理する仮想化マネージャ462と、設備4401〜440u、4501〜450vを管理する設備マネージャ463と、サーバ群4201〜420nと設備4401〜440u、4501〜450vの総消費電力を削減する運用管理マネージャ461が連携して動作する。
実施の形態6では、仮想化マネージャ462がハイパーバイザ4211〜421nを介して、物理サーバ4201〜420nに対する仮想マシン4301〜430mの割当てや、仮想マシン4301〜430mに対するリソース配分(CPU、メモリ容量などのリソース割当て)を管理し、仮想マシン4301〜430mと物理サーバ4201〜420nの稼動情報(例えば物理サーバのCPU使用率、メモリ使用容量、ディスク転送速度、ネットワーク転送速度など、仮想マシンのCPU使用率、メモリ使用率、ディスク転送速度、ネットワーク転送速度など)を取得する。この稼動情報に基づいて運用管理マネージャ461がアプリケーションすなわち作業負荷4321〜432mを見積もり、作業負荷に対する物理サーバ4201〜420nの電力の関係を導出する。例えば1つの物理サーバに対して複数の仮想マシンがある場合、仮想化自体のオーバーヘッドが小さいとすれば、複数の仮想マシンの稼働率または稼動量の和が物理サーバの稼動率または稼動量になると考えて良い。例えば物理サーバに計8コアのCPUがあり、仮想マシンAに2コア、仮想マシンBに6コアが配分されている場合を想定すると、仮想マシンAのCPU使用率の4分の1倍と仮想マシンBのCPU使用率の4分の3倍との和が物理サーバのCPU使用率に相当するとして、装置電力関数を数10、数12または数13のように表わせる。
設備マネージャ463は設備4401〜440u、4501〜450vの位置と環境情報を取得し、物理サーバ4201〜420nの電力分布に対する設備電力の関係を導出する。運用管理マネージャ461は、作業負荷に対する物理サーバ電力の関係と物理サーバ群の電力分布に対する設備電力の関係に基づいて、物理サーバに対する作業負荷割当ての最適解を出す。この解に従って、仮想化マネージャ462はアプリケーション4321〜432mが載る仮想マシン4301〜430mを物理サーバ4201〜420nへ割り当てる。図8では矢印433に示すように、アプリケーション4322を仮想マシン4302と共に物理サーバ4202から4201へ移動する一例を示す。
実施の形態6によれば、仮想化環境のライブマイグレーション機能を活用することにより、アプリケーション4321〜432mを、稼動させたまま物理サーバ4201〜420nの間で移行でき、サーバ群と設備の総電力を最小化する作業負荷割当てを簡便に実行でき、作業負荷の移動に伴うオーバーヘッドやタイムロスを抑えて情報処理システムの省電力化を実現できる。実施の形態6はサーバ装置の例であるが、ストレージ装置やネットワーク装置の仮想化環境でも同様の省電力運用を実現できる。なお、実施の形態6では運用管理マネージャ461と仮想化マネージャ462と設備マネージャ463が相互に連携する方法を採ったが、インターフェースやソフトウェア規模などに応じて一方を他方へ組み込んでも良い。
(実施の形態7)
図9は本発明による実施の形態7の情報処理システムの運用管理装置および運用管理方法を示す構成図である。情報処理システム510は、サーバ5201〜520n、ストレージ5701〜570r、これらの給電と冷却を行なう給電設備5401〜540uと冷却設備5501〜550v、これら装置群と設備全体を管理する運用管理装置560から成り、SAN(ストレージエリアネットワーク)環境を構成する。サーバ5201〜520nでは、OS5211〜521nの上で作業負荷であるアプリケーション5301〜530mが動作する。運用管理装置560では、サーバ群5201〜520nとストレージ5701〜570rから成るSANを管理するSANマネージャ562と、設備5401〜540u、5501〜550vを管理する設備マネージャ563と、サーバ群5201〜520nとストレージ5701〜570rと設備5401〜540u、5501〜550vの総消費電力を削減する運用管理マネージャ561が連携動作する。
実施の形態7では、SANマネージャ562がサーバ5201〜520nの稼動監視と管理を行ない、運用管理マネージャ561がアプリケーションすなわち作業負荷5301〜530mに対するサーバ5201〜520nの電力を評価する。設備マネージャ563は設備5401〜540u、5501〜550vの位置と環境情報に基づいて、サーバ5201〜520nの電力分布に対する設備電力を求める。運用管理マネージャ561は、サーバ電力分布と設備電力の関係に基づいて、サーバ群と設備の総電力を最小化するように作業負荷割当てを求める。この解に従って、SANマネージャ562は現行のアプリケーション5301〜530mを一旦中断してストレージ5701〜570rへ引き上げ、割当ての有るサーバ5201〜520nをSANブートにより起動してアプリケーション5301〜530mを続行する。サーバ5201〜520nのうち割当ての無いサーバは停止して電源を落とす。なお、作業負荷割当ての実行ではアプリケーション5301〜530mの起動/中断/停止契機を十分考慮する。
実施の形態7によれば、SANブート機能を利用することにより、サーバ群と設備の総電力を最小化する省電力運用を実施できる。実施の形態6のような仮想化環境が整っていない場合や既存のシステムには本実施の形態を導入し易いという利点がある。また、サーバ群と設備だけではなくストレージ5701〜570rと合わせて運用することにより、さらに省電力化を図れる。
(実施の形態8)
図10は本発明による実施の形態8の情報処理システムの運用管理装置および運用管理方法を示す構成図である。情報処理システム610は、サーバ6201〜620n、ストレージ6701〜670r、ネットワーク6801〜680s、これらの給電と冷却を行なう給電設備6401〜640uと冷却設備6501〜650v、装置群と設備を統合的に管理する運用管理装置660から成り、統合管理環境を構成する。サーバ6201〜620nでは、OS6211〜621nの上で作業負荷であるアプリケーション6301〜630mと統合管理エージェント6221〜622nが動作する。運用管理装置660では、サーバ6201〜620nとストレージ6701〜670rとネットワーク6801〜680sを統合管理するマネージャ662と、設備6401〜640u、6501〜650vを管理する設備マネージャ663と、装置群6201〜620n、6701〜670r、6801〜680sと設備6401〜640u、6501〜650vの総電力を削減する電力マネージャ661が相互に連携する。
実施の形態8では、統合管理マネージャ662がエージェント6221〜622nを介してサーバ6201〜620nの稼動管理や業務運用を行ない、電力マネージャ661がアプリケーション6301〜630mに対するサーバ6201〜620nの電力を見積もり、設備マネージャ663が設備6401〜640u、6501〜650vの電力を見積もる。電力マネージャ661は設備マネージャ663と連携して作業負荷割当てを求め、これに基づいて統合管理マネージャ662がサーバ6201〜620nの稼動/停止を行なってアプリケーション6301〜630mを動作させるサーバを切り替える。ジョブスケジューリングでは、サーバ6201〜620nに対してジョブ(アプリケーション)6301〜630mを投入する配置により作業負荷割当てを行なえる。
ストレージ6701〜670r、ネットワーク6801〜680sに関してもサーバ6201〜620nの運用管理と同様に行なえる。図11はストレージ、図12はネットワークの一例を示す説明図である。図11ではストレージ装置6711、6712がディスクアレイ672から成り、データ6731〜6733を保存する。矢印674に示すように、作業負荷であるアクセス頻度の高いデータ6732をストレージ装置6712から6711へ移動またはコピーすることにより、所望の作業負荷割当てを行なえる。図12ではネットワーク装置6811〜6813にサーバ装置6231〜6234などが接続され、矢印682に示すようにサーバ装置6233に対する接続をネットワーク装置6813から6812へ切り替えることにより作業負荷を移動する。作業負荷割当てを変更した後、ストレージ装置6711、6712やネットワーク装置6811〜6813は自身の省電力機能を働かせ、電源を制御する。なお、作業負荷の移動ではストレージ、ネットワーク共に処理時間や処理に伴う電力などのオーバーヘッドやリスクを十分考慮することが肝要である。
実施の形態8によれば、稼動管理やジョブスケジューリングによりサーバ/ストレージ/ネットワーク装置群を統合管理すると共に、全装置群と設備の総消費電力を最小化できる。統合管理マネージャ662が有するポリシー運用、資産管理、障害監視、電源管理、統合コンソールなどの機能と電力マネージャ661の省電力機能を組み合せることにより、さらに高度且つ自在なシステム運用を実現できる。なお、電力マネージャ661や設備マネージャ663は統合管理マネージャ662の一部またはサブシステムとして実装することも可能である。
以上、本実施の形態による情報処理システムの運用管理装置および運用管理方法によって得られる主要な効果を挙げると以下のようになる。
上述した各実施の形態の手段によれば、情報処理装置群と設備を連携させた運用管理により装置群と設備を合わせた総消費電力を削減できるので、データセンタなどのような情報処理システムの省電力運用を実現でき、運用コストを削減すると共に過剰な設備投資を抑制できる効果があり、地球温暖化の防止と二酸化炭素の削減にも寄与できる。
なお、上述した各実施の形態の手段は装置群と設備の電力に着目しているが、装置群の作業負荷、稼動情報、設備の環境情報に関する時間平均や時間積分などを取り入れることにより、作業負荷の処理時間を考慮した最適化を容易に行なうことができ、装置群と設備の電力量(電力×時間=エネルギー)を削減することも可能である。また、装置群への作業負荷割当てでは、電力や電力量に加えて、作業負荷の処理優先度、計画やイベントなどによる実行契機、送電系統や課金制度に応じた電力コストなども考慮することにより、さらに有益性と利便性を高めたポリシー運用として応用することができる。
本実施の形態は情報処理システム自身の自律的な省電力運用管理方法として好適であるが、本実施の形態によって得られる作業負荷割当ての解や装置群と設備の個別電力や総電力の結果は、既設システムにおける省エネルギー診断と改善、新設システムの設計や建設、装置や設備の増設、移設、改修、更新における計画や調整、将来の情報処理予測に対するリスク把握やコスト算出、人手による稼動管理やシナリオ策定においても有用な運用管理指針を与える。
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。