WO2022050197A1

WO2022050197A1 - コンピュータシステムおよびコンピュータプログラム

Info

Publication number: WO2022050197A1
Application number: PCT/JP2021/031592
Authority: WO
Inventors: 亮太壬生
Original assignee: 楽天モバイル株式会社
Priority date: 2020-09-03
Filing date: 2021-08-27
Publication date: 2022-03-10
Also published as: US20230058193A1; JP2023159472A

Abstract

コンピュータシステム１０は、クラスタ管理装置１４とサーバ１６とを備える。クラスタ管理装置１４のＶＭ管理部２４は、サーバ１６におけるワークロード（例えばＶＭ（Virtual Machine）３２）の実行を管理する。クラスタ管理装置１４のサーバ管理部２６は、サーバ１６におけるワークロード（例えばＶＭ３２）の実行態様の変化に応じて、サーバ１６におけるＣＰＵ３０の電力モードを変更する。

Description

コンピュータシステムおよびコンピュータプログラム

　本開示は、コンピュータシステムおよびコンピュータプログラムに関する。

　多数の汎用サーバを予めデータセンタ等に設置しておき、必要が生じた際に、仮想マシンソフトウェアを汎用サーバに投入して、汎用サーバに特定の機能を発揮させる仮想化技術が知られている。

特開２０２０－０２７５３０号公報

　データセンタ等に事前設置される汎用サーバ群は、仮想マシンソフトウェアの投入を待つ状態においても仮想マシンソフトウェア実行時と同程度の電力が供給されているため、電力消費量が大きいという問題があった。

　本開示はこうした課題に鑑みてなされたものであり、１つの目的は、仮想化された環境においてワークロードを実行するコンピュータの電力消費を抑制する技術を提供することにある。

　上記課題を解決するために、本発明のある態様のコンピュータシステムは、サーバにおけるワークロードの実行を管理する管理部と、サーバにおけるワークロードの実行態様の変化に応じて、サーバにおけるＣＰＵの電力モードを変更する制御部と、を備える。

　本開示の別の態様は、コンピュータプログラムである。このコンピュータプログラムは、サーバにおけるワークロードの実行を管理する機能と、サーバにおけるワークロードの実行態様の変化に応じて、サーバにおけるＣＰＵの電力モードを変更する機能と、をコンピュータに実現させる。

　なお、以上の構成要素の任意の組合せ、本開示の表現を、装置、方法、コンピュータプログラムを読み取り可能に記録した記録媒体などの間で変換したものもまた、本開示の態様として有効である。

　本開示によれば、仮想化された環境においてワークロードを実行するコンピュータの電力消費を抑制することができる。

第１実施例のコンピュータシステムの構成を示す図である。第１実施例のコンピュータシステムの動作を示すフローチャートである。第１実施例のコンピュータシステムの動作を示すフローチャートである。第２実施例のコンピュータシステムの構成を示す図である。第３実施例のコンピュータシステムの構成を示す図である。第３実施例のコンピュータシステムの動作を示すフローチャートである。図７（ａ）と図７（ｂ）は、複数台のサーバの動作状態の例を示す図である。第３実施例のコンピュータシステムの動作を示すフローチャートである。

　仮想化技術を利用して、情報システムの稼動に必要なサーバをはじめとした機材やネットワークなどのインフラを、インターネット上のサービスとして提供するＩａａＳ（Infrastructure as a Service）が普及してきている。ＩａａＳでは、多数の汎用サーバ（物理サーバ）を予めデータセンタ等に設置しておき、ユーザの要求に応じて、仮想マシンソフトウェア（以下「ＶＭ」とも呼ぶ。）を汎用サーバ（物理サーバ）に実行させることで、ユーザの要求に整合する仮想サーバを提供する。

　以下の実施例では、ＩａａＳを提供するコンピュータシステムにおいて、物理サーバにＶＭを配置する際に当該物理サーバのＣＰＵ（Central Processing Unit）の電力モードを変更し、具体的には、ＣＰＵのスリープ設定を変更する技術を提案する。実施例のコンピュータシステムによると、仮想化された環境においてオンデマンドでＶＭを実行するコンピュータの電力消費を抑制することができる。

　以下の実施例では、物理サーバに仮想化ソフトウェア「ＯｐｅｎＳｔａｃｋ」が導入され、物理サーバ上で１つ以上のＶＭが実行される。変形例として、物理サーバにコンテナエンジン「Ｄｏｃｋｅｒ」が導入され、物理サーバ上で１つ以上のコンテナ（「Ｐｏｄ」とも呼ばれる）が実行される構成でもよい。ＶＭとコンテナ（Ｐｏｄ）は、総称して「ワークロード」とも呼ばれる。

　（第１実施例）
　図１は、第１実施例のコンピュータシステム１０の構成を示す。コンピュータシステム１０は、データ処理システムともいえ、依頼者装置１２、クラスタ管理装置１４、複数台のサーバ（サーバ１６ａ、サーバ１６ｂ、サーバ１６ｃ・・・）を備える。以下、複数台のサーバ（サーバ１６ａ、サーバ１６ｂ、サーバ１６ｃ・・・）を総称して「サーバ１６」とも呼ぶ。クラスタ管理装置１４とサーバ１６は、データセンタに設置され、データセンタのＬＡＮで接続されてもよい。また、１つのデータセンタに、数十台から数百台のサーバ１６が設置されてもよい。また、依頼者装置１２とクラスタ管理装置１４は、インターネットを介して接続されてもよい。

　図１は、クラスタ管理装置１４およびサーバ１６の機能ブロックを示すブロック図を含む。本明細書のブロック図で示す複数の機能ブロックは、ハードウェア的には、回路ブロック、メモリ、その他のＬＳＩで構成することができ、ソフトウェア的には、メモリにロードされたプログラムをＣＰＵが実行すること等により実現される。したがって、これらの機能ブロックがハードウェアのみ、ソフトウェアのみ、またはそれらの組合せによっていろいろな形で実現できることは当業者には理解されるところであり、いずれかに限定されるものではない。

　サーバ１６は、コンピュートノードとも呼ばれる情報処理装置である。サーバ１６は、ＶＭを実行するための各種リソース（ＣＰＵ、メモリ、ストレージ等）を提供する物理サーバである。サーバ１６は、ＣＰＵ３０、ＶＭ３２、ＶＭ制御部３４、ＣＰＵ制御部３６を備える。

　ＶＭ制御部３４とＣＰＵ制御部３６は、コンピュータプログラムとして実装されてもよく、そのコンピュータプログラムがサーバ１６のストレージ（不図示）に記憶されてもよい。ＣＰＵ３０は、そのコンピュータプログラムをメインメモリ（不図示）に読み出して実行することにより、ＶＭ制御部３４とＣＰＵ制御部３６の機能を発揮してもよい。

　ＶＭ制御部３４は、サーバ１６におけるＶＭ３２の実行を制御する。具体的には、ＶＭ制御部３４は、クラスタ管理装置１４からの指示にしたがって、ＣＰＵ３０にＶＭ３２のプログラムを実行させることにより仮想サーバを実現させる。実施例では、ＶＭ３２のプログラムは、クラスタ管理装置１４から提供される。ＶＭ制御部３４は、ＯｐｅｎＳｔａｃｋの機能を利用して実現されてもよい。

　ＣＰＵ制御部３６は、サーバ１６におけるＣＰＵ３０の電力モードを制御する。実施例のＣＰＵ制御部３６は、公知のＢＭＣ（Baseboard Management Controller）の機能を含み、ＩＰＭＩ（Intelligent Platform Management Interface）を介して、リモートからＣＰＵ３０の電力モードの変更の要求を受け付ける。

　実施例では、ＣＰＵ制御部３６は、クラスタ管理装置１４からの指示にしたがって、ＣＰＵ３０の電力モードを、（１）ＣＰＵがスリープ状態に移行しない電力モードであり、言い換えれば、ＣＰＵがスリープ状態に移行することが禁止された電力モード（以下「Ｃ６ディセーブル」とも呼ぶ。）に移行させる。また、ＣＰＵ制御部３６は、クラスタ管理装置１４からの指示にしたがって、ＣＰＵ３０の電力モードを、（２）ＣＰＵがスリープ状態に移行することが許可された電力モードであり、例えば、ＶＭ等のタスクを実行しない場合にＣＰＵがスリープ状態となる電力モード（以下「Ｃ６イネーブル」とも呼ぶ。）に移行させる。

　「Ｃ６」は、ＣＰＵ３０の電力モードを示すＣステートにおいて最も深いスリープ状態であり、ＣＰＵ３０の消費電力が最も小さくなる。また、「Ｃ６」から稼働状態「Ｃ０」への復帰は、他のＣステートからの復帰と比べて長い時間を要するが、それでも１秒未満である。本実施例では、ＶＭを実行中でないサーバ１６のＣＰＵ３０をＣ６のスリープ状態とする。なお、ＶＭを実行中でないサーバ１６におけるＣＰＵ３０のスリープ態様（Ｃステート）はＣ６に限られない。消費電力とＣ０への復帰時間とを比較考量し、適切なスリープ態様が開発者により決定されればよい。

　実施例では、ＶＭ３２により実現される仮想サーバは、電気通信事業者の業務に関するアプリケーションを実行する。このアプリケーションは、例えば、第５世代移動通信システム（５Ｇ）のＲＡＮ（Radio Access Network）のアプリケーション（ｖＣＵ、ｖＤＵ等）であってもよく、５Ｇのコアネットワークシステムのアプリケーション（ＡＭＦ、ＳＭＦ等）であってもよい。電気通信事業者の業務アプリケーションは、リアルタイム処理（言い換えれば超低遅延処理）が求められるため、ＶＭ３２は、ＣＰＵがスリープ状態に移行しない電力モード（Ｃ６ディセーブル）のサーバ１６で実行されるべきものである。

　依頼者装置１２は、ＶＭ（言い換えれば仮想サーバ）の作成または削除を依頼する情報処理装置である。依頼者装置１２は、人が操作する装置（ＰＣ等）であってもよく、ＥＭＳ（Element Management System）等、人を介さず自動的なデータ処理を実行するシステム・装置であってもよい。依頼者装置１２は、ＶＭ作成要求またはＶＭ削除要求をクラスタ管理装置１４へ送信する。ＶＭ作成要求は、新規のＶＭに割り当てるＣＰＵ、メモリ、ストレージそれぞれのリソース量や、ＯＳの種類等を指定する情報を含んでもよい。ＶＭ削除要求は、削除対象のＶＭの識別情報を含んでもよい。

　クラスタ管理装置１４は、複数台のサーバ１６（「クラスタ」とも呼ばれる）を管理する情報処理装置である。図１では、クラスタ管理装置１４を１つ描いているが、クラスタ管理装置１４は、複数台の装置により冗長化されてもよい。クラスタ管理装置１４は、ＶＭＤＢ２０、物理サーバＤＢ２２、ＶＭ管理部２４、サーバ管理部２６を備える。

　ＶＭＤＢ２０は、サーバ１６でＶＭを実行するためのＶＭのイメージデータ（プログラム）を記憶する。また、ＶＭＤＢ２０は、サーバ１６の識別情報と、そのサーバ１６で実行中のＶＭの識別情報とを対応付けて記憶する。言い換えれば、ＶＭＤＢ２０は、複数台のサーバ１６のそれぞれで実行中のＶＭに関する情報（ＶＭのＩＤ等）を記憶する。

　また、ＶＭＤＢ２０は、複数台のサーバ１６の中からＶＭを実行させるサーバ１６を決定するために必要なデータを記憶する。例えば、ＶＭＤＢ２０は、各サーバ１６のハードウェアリソース（ＣＰＵ、メモリ、ストレージ等）の空き容量を記憶してもよい。ＶＭＤＢ２０は、ＯｐｅｎＳｔａｃｋの機能を利用して実現されてもよい。

　物理サーバＤＢ２２は、複数台のサーバ１６それぞれの識別情報と、各サーバ１６との通信に必要なデータを記憶する。例えば、物理サーバＤＢ２２は、複数台のサーバ１６それぞれの（１）ホスト名、（２）ＩＰアドレス、（３）ＩＰＭＩを介して各サーバ１６のＢＭＣ（ＣＰＵ制御部３６）にアクセスするために必要な情報を記憶してもよい。

　また、物理サーバＤＢ２２は、複数台のサーバ１６それぞれの動作状態を記憶し、言い換えれば、各サーバ１６が複数の動作状態のうちいずれであるかを示すデータを記憶する。複数の動作状態は、（１）稼働状態、（２）スタンバイ状態、（３）電源オフ状態を含む。（１）稼働状態は、電力が供給されており（電源オン状態）、かつ、ＣＰＵがスリープ状態に移行しない電力モード（Ｃ６ディセーブル）に設定された動作状態である。（２）スタンバイ状態は、電力が供給されており（電源オン状態）、かつ、ＣＰＵがスリープ状態に移行可能な電力モード（Ｃ６イネーブル）に設定された動作状態である。（３）電源オフ状態は、電力供給が停止された状態であり、電源切断状態とも言える。

　ＶＭ管理部２４とサーバ管理部２６は、コンピュータプログラムとして実装されてもよく、そのコンピュータプログラムがクラスタ管理装置１４のストレージ（不図示）に記憶されてもよい。クラスタ管理装置１４のＣＰＵは、そのコンピュータプログラムをメインメモリ（不図示）に読み出して実行することにより、ＶＭ管理部２４とサーバ管理部２６の機能を発揮してもよい。

　ＶＭ管理部２４は、複数台のサーバ１６のそれぞれにおけるＶＭの実行を管理する。ＶＭ管理部２４は、ＯｐｅｎＳｔａｃｋの機能を利用して実現されてもよい。ＶＭ管理部２４は、依頼者装置１２から送信されたＶＭ作成要求を受け付けると、ＶＭ作成要求が示すハードウェアリソース量と、ＶＭＤＢ２０に記憶された各サーバ１６でのＶＭ実行状況および空きリソース量とに応じて、複数台のサーバ１６の中からＶＭを実行させるサーバ１６（以下「対象サーバ」とも呼ぶ。）を決定する。ＶＭ管理部２４は、対象サーバのＶＭ制御部３４に、ＶＭ作成要求に対応するＶＭのイメージデータを送信し、対象サーバにおけるＶＭの実行を開始させる。

　サーバ管理部２６は、サーバ１６におけるＶＭの実行態様の変化に応じて、サーバ１６におけるＣＰＵの電力モードを変更する。第１実施例では、サーバ管理部２６は、管理対象の複数台のサーバ１６の中の少なくとも１台のサーバ１６におけるＶＭの実行態様が変化することに応じて、複数台のサーバ１６の中の少なくとも１台のサーバ１６におけるＣＰＵの電力モードを変更する。

　また、サーバ管理部２６は、ＶＭ管理部２４が或るサーバ１６でのＶＭの実行を決定した場合、上記或るサーバ１６におけるＣＰＵの電力モードを、ＣＰＵがスリープ状態に移行しない電力モード（Ｃ６ディセーブル）に移行させる。サーバ管理部２６は、ＩＰＭＩを介して各サーバ１６のＢＭＣ（ＣＰＵ制御部３６）にアクセスすることにより、各サーバ１６におけるＣＰＵの電力モードを変更してもよい。

　第１実施例のコンピュータシステム１０の動作を説明する。ここでは、複数台のサーバ１６それぞれの動作状態は、稼働状態とスタンバイ状態のいずれかに設定される。また、ＶＭを実行中でないサーバ１６の動作状態は、スタンバイ状態に設定される。

　図２は、第１実施例のコンピュータシステム１０の動作を示すフローチャートである。同図は、新たなＶＭ作成時、言い換えれば、新たな仮想サーバ作成時の動作を示している。依頼者装置１２は、ＶＭ作成要求をクラスタ管理装置１４へ送信する。クラスタ管理装置１４のＶＭ管理部２４は、依頼者装置１２から送信されたＶＭ作成要求を受け付けると（Ｓ１０のＹ）、ＶＭ作成要求に適合する新規ＶＭを実行するサーバ１６（「対象サーバ」と呼ぶ。）を決定する（Ｓ１２）。ＶＭ管理部２４は、対象サーバの識別情報（例えばホスト名等）をサーバ管理部２６に通知する。

　サーバ管理部２６は、物理サーバＤＢ２２を参照して、ＶＭ管理部２４から通知された対象サーバがスタンバイ状態か否かを確認する。対象サーバがスタンバイ状態であれば（Ｓ１４のＹ）、サーバ管理部２６は、対象サーバのＣＰＵ制御部３６と連携して、対象サーバのＣＰＵの電力モードをＣ６ディセーブルに設定する（Ｓ１６）。言い換えれば、サーバ管理部２６は、対象サーバの動作状態をスタンバイ状態から稼働状態へ移行させる。対象サーバが稼働状態であれば（Ｓ１４のＮ）、Ｓ１６の処理をスキップする。サーバ管理部２６は、対象サーバが稼働状態である旨をＶＭ管理部２４へ通知する。

　ＶＭ管理部２４は、対象サーバのＶＭ制御部３４と連携して、対象サーバにおいてＶＭの実行を開始させる（Ｓ１８）。ＶＭ管理部２４は、対象サーバにおいて新規ＶＭが実行されることをＶＭＤＢ２０に記録する。ＶＭ作成要求を受け付けなければ（Ｓ１０のＮ）、Ｓ１２以降の処理をスキップする。クラスタ管理装置１４は、図２に示す一連の処理を繰り返し実行する。

　図３も、第１実施例のコンピュータシステム１０の動作を示すフローチャートである。同図は、既存のＶＭ削除時、言い換えれば、既存の仮想サーバ削除時の動作を示している。依頼者装置１２は、ＶＭ削除要求をクラスタ管理装置１４へ送信する。クラスタ管理装置１４のＶＭ管理部２４は、依頼者装置１２から送信されたＶＭ削除要求を受け付けると（Ｓ２０のＹ）、ＶＭＤＢ２０を参照して、ＶＭ削除要求で指定されたＶＭ（「対象ＶＭ」と呼ぶ。）を実行しているサーバ１６（「対象サーバ」と呼ぶ。）を識別する（Ｓ２２）。ＶＭ管理部２４は、対象サーバのＶＭ制御部３４と連携して、対象サーバにおける対象ＶＭの実行を終了させる（Ｓ２４）。

　ＶＭ管理部２４は、対象サーバから対象ＶＭが削除されたことをＶＭＤＢ２０に記録し、言い換えれば、ＶＭＤＢ２０における対象サーバと対象ＶＭとの対応付けを削除する。ＶＭ管理部２４は、対象サーバから対象ＶＭを削除した旨をサーバ管理部２６へ通知する。サーバ管理部２６は、ＶＭＤＢ２０を参照して、対象サーバにおいて実行中のＶＭ数を計数する。対象サーバにおいて実行中のＶＭ数が０になった場合（Ｓ２６のＹ）、サーバ管理部２６は、対象サーバのＣＰＵの電力モードをＣ６イネーブルに設定する（Ｓ２８）。言い換えれば、サーバ管理部２６は、対象サーバの動作状態を稼働状態からスタンバイ状態へ移行させる。

　対象サーバにおいて１つ以上のＶＭが実行中であれば（Ｓ２６のＮ）、Ｓ２８をスキップする。ＶＭ削除要求を受け付けなければ（Ｓ２０のＮ）、Ｓ２２以降の処理をスキップする。クラスタ管理装置１４は、図３に示す一連の処理を繰り返し実行する。

　第１実施例のコンピュータシステム１０によると、クラスタを構成するサーバ１６におけるＶＭの実行態様、言い換えれば、仮想サーバの提供状況に応じて、サーバ１６におけるＣＰＵの電力モードを変更する。これにより、仮想化された環境においてオンデマンドでＶＭを実行するサーバ１６の電力消費を抑制することができる。また、コンピュータシステム１０によると、ＶＭを実行するサーバ１６の電力モードをＣＰＵがスリープ状態に移行しない電力モード（Ｃ６ディセーブル）に設定する。これにより、リアルタイム（言い換えれば超低遅延）でのアプリケーション処理に適した仮想サーバを実現することができる。

　本発明者による実験では、ＣＰＵの電力モードをＣ６ディセーブルに設定したサーバ１６（ＶＭ未割当）の消費電力が２３４Ｗであるのに対し、ＣＰＵの電力モードをＣ６イネーブルに設定したサーバ１６（ＶＭ未割当）の消費電力は１４０Ｗであった。すなわち、ＶＭを未割当のサーバ１６においてＣＰＵの電力モードをＣ６イネーブルとすることで消費電力を４１％削減できることが確かめられた。データセンタには、数十台から数百台のサーバ１６が設置されることがあるが、例えば、１００台のサーバ１６がＣ６イネーブルとなる場合、９４００Ｗの電力消費を抑制することができる。

　なお、サーバ１６が電源オフ状態から稼働状態へ移行するには数分～１０分程度要するが、スタンバイ状態（Ｃ６イネーブル）から稼働状態（Ｃ６ディセーブル）へ移行は、既述したように１秒未満である。第１実施例では、ＶＭを未実行のサーバ１６をスタンバイ状態で待機させることにより、ＶＭを未実行のサーバ１６における消費電力を抑制しつつ、ＶＭ実行開始までの時間を短くすることができる。

　（第２実施例）
　本実施例に関して、第１実施例と相違する点を中心に以下説明し、共通する点の説明を適宜省略する。本実施例の構成要素のうち第１実施例の構成要素と同一または対応する構成要素には同一の符号を付して説明する。

　図４は、第２実施例のコンピュータシステム１０の構成を示す。第２実施例のサーバ１６のＶＭ制御部３４は、第１実施例のＶＭ制御部３４の機能に加えて、第１実施例のクラスタ管理装置１４のサーバ管理部２６の機能を備える。

　例えば、サーバ１６のＶＭ制御部３４は、クラスタ管理装置１４からの指示にしたがって、ＣＰＵ３０にＶＭ３２のプログラムを実行させるとともに、ＣＰＵ制御部３６と連携して、サーバ１６におけるＶＭ実行態様の変化に応じて、サーバ１６におけるＣＰＵ３０の電力モードを変更する。また、ＶＭ制御部３４は、自機がスタンバイ状態であるときにＶＭ実行指示を受け付けると、ＣＰＵ制御部３６と連携して、自機のＣＰＵ３０の電力モードをＣ６イネーブルからＣ６ディセーブルに移行させる。

　第２実施例のコンピュータシステム１０においても、第１実施例のコンピュータシステム１０と同様の効果を奏する。なお、第２実施例では、サーバ１６のＶＭ制御部３４が第１実施例のクラスタ管理装置１４のサーバ管理部２６の機能を備えたが、変形例として、サーバ１６のＣＰＵ制御部３６が第１実施例のクラスタ管理装置１４のサーバ管理部２６の機能を備えてもよい。

　（第３実施例）
　本実施例に関して、第１実施例と相違する点を中心に以下説明し、共通する点の説明を適宜省略する。本実施例の構成要素のうち第１実施例の構成要素と同一または対応する構成要素には同一の符号を付して説明する。

　図５は、第３実施例のコンピュータシステム１０の構成を示す。第３実施例のサーバ１６は、図１に示した第１実施例のサーバ１６の機能ブロックに加えて、電源制御部３８を備える。電源制御部３８は、サーバ１６への電力供給有無（すなわち電源のオン／オフ）を制御する。第３実施例において、複数台のサーバ１６それぞれの動作状態は、（１）稼働状態、（２）スタンバイ状態、（３）電源オフ状態のいずれかに制御される。

　なお、第３実施例の電源制御部３８は、ＢＭＣの機能を含むこととする。クラスタ管理装置１４のサーバ管理部２６は、ＩＰＭＩを介してサーバ１６の電源制御部３８にアクセスし、サーバ１６への電力供給有無（すなわち電源のオン／オフ）をリモートから制御することとする。

　第３実施例のコンピュータシステム１０は、コンピュータシステム１０の管理者により操作される管理者端末１８を備える。管理者端末１８は、管理者により予め定められたスタンバイサーバ比率の値をクラスタ管理装置１４へ送信する。スタンバイサーバ比率は、複数台のサーバ１６（クラスタにおけるサーバ１６の総数）に占めるスタンバイ状態のサーバ１６のあるべき割合である。実施例ではスタンバイサーバ比率を３０％とするが、スタンバイサーバ比率は３０％とは異なる値でもよい。スタンバイサーバ比率は、管理者の知見やコンピュータシステム１０を用いた実験に基づいて適切な値に決定されてよい。

　クラスタ管理装置１４のサーバ管理部２６は、管理者端末１８から送信されたスタンバイサーバ比率を記憶する。サーバ管理部２６は、複数台のサーバ１６の中の少なくとも１台のサーバ１６におけるＶＭの実行態様が変化することと、予め記憶するスタンバイサーバ比率とに応じて、複数台のサーバ１６の中の少なくとも１台のサーバにおけるＣＰＵの電力モードを変更する。

　ここで、複数のサーバ１６が、スタンバイ状態の第１サーバと、電源オフ状態（電力供給停止状態）の第２サーバとを含み、クラスタ管理装置１４のＶＭ管理部２４が、第１サーバでのＶＭの実行を決定したこととする。この場合、クラスタ管理装置１４のサーバ管理部２６は、第１サーバにおけるＣＰＵの電力モードを、ＣＰＵがスリープ状態に移行しない電力モード（Ｃ６ディセーブル）に移行させ、言い換えれば、第１サーバを稼働状態に移行させる。ＶＭ管理部２４は、第１サーバにおいてＶＭを実行させる。サーバ管理部２６は、スタンバイサーバ比率に応じて、第２サーバをスタンバイ状態に移行させる。

　また、ＶＭ管理部２４が或るサーバ１６におけるＶＭの実行を終了させ、上記或るサーバ１６で実行されるＶＭが無くなったこととする。この場合、サーバ管理部２６は、スタンバイサーバ比率に応じて、上記或るサーバ１６をスタンバイ状態と電源オフ状態のいずれかに移行させる。サーバ管理部２６は、管理者により定められたスタンバイサーバ比率を維持するように、ＶＭ未実行のサーバ１６の動作状態をスタンバイ状態と電源オフ状態のいずれかに制御する。スタンバイサーバ比率を維持するとは、サーバ１６の総数に占めるスタンバイ状態のサーバ１６の実際の比率と、スタンバイサーバ比率との乖離が所定の閾値内（例えば±５％の範囲内）になることでもよい。

　第３実施例のコンピュータシステム１０の動作を説明する。
　図６は、第３実施例のコンピュータシステム１０の動作を示すフローチャートである。同図のＳ３０～Ｓ３８の処理は、第１実施例で説明した図２のＳ１０～Ｓ１８の処理と同じであるため説明を省略する。なお、Ｓ１２において、クラスタ管理装置１４のＶＭ管理部２４は、稼働状態またはスタンバイ状態のサーバ１６の中から、新規ＶＭを実行する対象サーバを決定する。ここでのスタンバイサーバ比率は３０％とする。

　対象サーバに新規ＶＭを実行させた後、クラスタ管理装置１４のサーバ管理部２６は、物理サーバＤＢ２２を参照して、管理対象のサーバ１６の総数に占めるスタンバイ状態のサーバ１６の実際の比率が、スタンバイサーバ比率に整合するか否かを確認する。スタンバイサーバ比率に不整合の場合（典型的には実際の比率がスタンバイサーバ比率を閾値を超えて下回る場合であり、例えば実際の比率が２５％未満の場合）（Ｓ４０のＮ）、サーバ管理部２６は、電源オフ状態のサーバ１６をスタンバイ状態に移行させる（Ｓ４２）。
管理対象のサーバ１６の総数に占めるスタンバイ状態のサーバ１６の実際の比率が、スタンバイサーバ比率に整合する場合（例えば実際の比率が２５％～３５％の場合）（Ｓ４０のＹ）、Ｓ４２をスキップする。

　Ｓ４２において、具体的には、サーバ管理部２６は、電源オフ状態のサーバ１６の電源制御部３８と連携して、当該サーバ１６の電源をオンする（電力供給状態に移行させる）。また、サーバ管理部２６は、当該サーバ１６のＣＰＵ制御部３６と連携して、当該サーバ１６のＣＰＵをＣ６イネーブルに設定する。

　図７（ａ）と図７（ｂ）は、複数台のサーバの動作状態の例を示す。この例では、クラスタとして１０台のサーバ４０（サーバ４０ａ～サーバ４０ｊ）が設置されている。サーバ４０は、図５のサーバ１６に対応する。図７（ａ）の状態でクラスタ管理装置１４のＶＭ管理部２４が、サーバ４０ｄにおける新規ＶＭの実行を決定すると、クラスタ管理装置１４のサーバ管理部２６は、サーバ４０ｄをスタンバイ状態から稼働状態に移行させる。その結果、１０台のサーバ４０の中でスタンバイ状態のサーバ４０は２台（サーバ４０ｅ、サーバ４０ｆ）となり、スタンバイサーバ比率に不整合となる。

　そこで、図７（ｂ）に示すように、サーバ管理部２６は、電源オフ状態のサーバ４０の中から１台のサーバ４０（ここではサーバ４０ｇ）を選択し、サーバ４０ｇを電源オフ状態からスタンバイ状態に移行させる。この結果、１０台のサーバ４０の中でスタンバイ状態のサーバ４０は３台（サーバ４０ｅ、サーバ４０ｆ、サーバ４０ｇ）となり、スタンバイサーバ比率に整合する状態が維持される。

　図８も、第３実施例のコンピュータシステム１０の動作を示すフローチャートである。同図のＳ５０～Ｓ５４の処理は、第１実施例で説明した図３のＳ２０～Ｓ２４の処理と同じであるため説明を省略する。

　ＶＭが削除された対象サーバにおいて実行中のＶＭ数が０になった場合（Ｓ５６のＹ）、クラスタ管理装置１４のサーバ管理部２６は、対象サーバの電源をオフした場合にスタンバイサーバ比率に整合するか否かを判定する。整合する場合（Ｓ５８のＹ）、サーバ管理部２６は、対象サーバの電源制御部３８と連携して、対象サーバの電源をオフする（電力供給停止状態に移行させる）（Ｓ６０）。

　対象サーバの電源をオフした場合にスタンバイサーバ比率に不整合となる場合（Ｓ５８のＮ）、サーバ管理部２６は、対象サーバの電源オン状態を維持しつつ、対象サーバのＣＰＵ制御部３６と連携して、対象サーバのＣＰＵの電力モードをＣ６イネーブルに設定する（Ｓ６２）。すなわち、対象サーバを稼働状態からスタンバイ状態へ移行させる。対象サーバにおいて１つ以上のＶＭが実行中であれば（Ｓ５６のＮ）、Ｓ５８～Ｓ６２の処理をスキップする。

　例えば、図７（ｂ）に示す複数台のサーバ４０の動作状態において、サーバ４０ｄからＶＭが削除されたとする。このとき、サーバ管理部２６は、サーバ４０ｄの電源をオフすると、１０台のサーバ４０の中でスタンバイ状態のサーバ４０は３台（サーバ４０ｅ、サーバ４０ｆ、サーバ４０ｇ）となるため、スタンバイサーバ比率に整合すると判定する。サーバ管理部２６は、サーバ４０ｄの電源をオフすることにより、サーバ４０ｄを稼働状態から電源オフ状態に直接移行させる。

　第３実施例のコンピュータシステム１０によると、ＶＭを未実行のサーバ（コンピュートノード）の一部が電源オフ状態となることを許容することにより、サーバ群全体での電力消費を一層抑制することができる。また、スタンバイサーバ比率に基づいて、スタンバイ状態のサーバ台数を一定程度維持することにより、多くの新規ＶＭを起動すべき場合でも、短時間で（例えば数秒のオーダで）それらの新規ＶＭを起動することができる。

　以上、本開示を第１実施例～第３実施例をもとに説明した。これらの実施例は例示であり、各構成要素あるいは各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本開示の技術の範囲にあることは当業者に理解されるところである。

　第１実施例～第３実施例に関する変形例を説明する。サーバ１６のＶＭ制御部３４とＣＰＵ制御部３６の機能は、ＶＭ（もしくはコンテナ）の機能として実行されてもよい。ここでは、ＶＭ制御部３４とＣＰＵ制御部３６の機能を実行するＶＭを「基本ＶＭ」と呼び、依頼者装置１２からのＶＭ作成要求に応じて作成されるＶＭを「サービスＶＭ」と呼ぶ。クラスタ管理装置１４のサーバ管理部２６は、サーバ１６でのＶＭ実行数を計数する場合、サーバ１６で実行中のＶＭの中から基本ＶＭを除いたサービスＶＭの個数を計数してもよく、言い換えれば、基本ＶＭを計数対象から除外してもよい。

　第３実施例に関する変形例を説明する。クラスタ管理装置１４のサーバ管理部２６は、複数台のサーバ１６のうち少なくとも１台のサーバ１６の動作モード（言い換えればＣＰＵの電力モード）を変更した結果、管理者により定められたスタンバイサーバ比率を維持できない場合、管理者端末１８へアラート情報を送信してもよい。例えば、サーバ１６の総数に占めるスタンバイ状態のサーバ１６の実際の比率が、スタンバイサーバ比率を閾値を超えて下回った場合、サーバ管理部２６は、その旨を示すアラート情報を管理者端末１８へ送信してもよい。これにより、データセンタにおける機器の構成管理を支援することができ、例えば、サーバ１６の増設等の判断を支援することができる。

　上述した実施例および変形例の任意の組み合わせもまた本開示の実施の形態として有用である。組み合わせによって生じる新たな実施の形態は、組み合わされる実施例および変形例それぞれの効果をあわせもつ。

　また、請求項に記載の各構成要件が果たすべき機能は、実施例および変形例において示された各構成要素の単体もしくはそれらの連携によって実現されることも当業者には理解されるところである。例えば、請求項に記載の管理部は、各実施例に記載した、クラスタ管理装置１４のＶＭ管理部２４とサーバ１６のＶＭ制御部３４のいずれか一方により実現されてもよく、または両者が連携することにより実現されてもよい。また、請求項に記載の制御部は、各実施例に記載した、クラスタ管理装置１４のサーバ管理部２６とサーバ１６のＣＰＵ制御部３６のいずれか一方により実現されてもよく、または両者が連携することにより実現されてもよい。すなわち、請求項に記載の管理部と制御部のそれぞれは、コンピュータシステム１０に含まれるいずれかのコンピュータで実現されてもよく、複数台のコンピュータが連携することにより実現されてもよい。

　本開示の技術は、ワークロードの実行を管理するコンピュータシステムに適用することができる。

　１０　コンピュータシステム、　１４　クラスタ管理装置、　１６　サーバ、　２４　ＶＭ管理部、　２６　サーバ管理部、　３０　ＣＰＵ、　３４　ＶＭ制御部、　３６　ＣＰＵ制御部、　３８　電源制御部。

Claims

　サーバにおけるワークロードの実行を管理する管理部と、
　前記サーバにおけるワークロードの実行態様の変化に応じて、前記サーバにおけるＣＰＵの電力モードを変更する制御部と、
　を備えることを特徴とするコンピュータシステム。
　前記ワークロードは、ＣＰＵがスリープ状態に移行しない電力モードのサーバにおいて実行されるべきものであり、
　前記制御部は、前記管理部が或るサーバでのワークロードの実行を決定した場合、前記或るサーバにおけるＣＰＵの電力モードを、ＣＰＵがスリープ状態に移行しない電力モードに移行させる、請求項１に記載のコンピュータシステム。
　前記管理部は、複数台のサーバのそれぞれにおけるワークロードの実行を管理し、
　前記制御部は、電力が供給されているがＣＰＵがスリープ状態であるスタンバイ状態のサーバについて、前記複数台のサーバに占めるスタンバイ状態のサーバのあるべき割合を示すスタンバイサーバ比率を記憶し、
　前記制御部は、前記複数台のサーバの中の少なくとも１台のサーバにおけるワークロードの実行態様が変化することと前記スタンバイサーバ比率とに応じて、前記複数台のサーバの中の少なくとも１台のサーバにおけるＣＰＵの電力モードを変更する、請求項１または２に記載のコンピュータシステム。
　前記複数台のサーバが、スタンバイ状態の第１サーバと、電力供給停止状態の第２サーバとを含み、前記管理部が、前記第１サーバでのワークロードの実行を決定した場合、
　前記制御部は、前記第１サーバにおけるＣＰＵの電力モードを、ＣＰＵがスリープ状態に移行しない電力モードに移行させ、
　前記管理部は、前記第１サーバにおいてワークロードを実行させ、
　前記制御部は、前記スタンバイサーバ比率に応じて、前記第２サーバをスタンバイ状態に移行させる、請求項３に記載のコンピュータシステム。
　前記管理部が或るサーバにおけるワークロードの実行を終了させ、前記或るサーバで実行されるワークロードがなくなった場合、前記制御部は、前記スタンバイサーバ比率に応じて、前記或るサーバをスタンバイ状態と電力供給停止状態のいずれかに移行させる、請求項３または４に記載のコンピュータシステム。
　前記ワークロードは、仮想化ソフトウェア上で動作する仮想マシンソフトウェアまたはコンテナである、請求項１から５のいずれかに記載のコンピュータシステム。
　サーバにおけるワークロードの実行を管理する機能と、
　前記サーバにおけるワークロードの実行態様の変化に応じて、前記サーバにおけるＣＰＵの電力モードを変更する機能と、
　をコンピュータに実現させるためのコンピュータプログラム。