JP2021182224A

JP2021182224A - ジョブスケジューリングプログラム、情報処理装置およびジョブスケジューリング方法

Info

Publication number: JP2021182224A
Application number: JP2020087048A
Authority: JP
Inventors: 成人鈴木; Shigeto Suzuki
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2020-05-18
Filing date: 2020-05-18
Publication date: 2021-11-25
Also published as: US20210359514A1

Abstract

【課題】システムの電力効率を向上させる。【解決手段】実行中の第１ジョブ２を含む１以上の第２ジョブそれぞれの現在以降の第２期間における推定消費電力の合計が、所定の第１電力を超えないよう１以上の第２ジョブを計算ノード１ａ，１ｂ，１ｃ，・・・に割り当てるスケジューリングが行われる。情報処理装置１０は、第１ジョブ２の現在以前の第１期間における消費電力を、第１期間より前の情報に基づいて予測した第１予測消費電力を算出する。次に情報処理装置１０は、第１ジョブ２の第１期間における消費電力と第１予測消費電力との誤差が閾値未満の場合、第１ジョブ２の第２期間における推定消費電力を第２期間に第１ジョブ２が実行された場合の消費電力を予測した第２予測消費電力に決定する。また情報処理装置１０は、誤差が閾値以上の場合、第１ジョブの第２期間における推定消費電力を所定の第２電力に決定する。【選択図】図１

Description

本発明は、ジョブスケジューリングプログラム、情報処理装置およびジョブスケジューリング方法に関する。

ＨＰＣ（High Performance Computing）システムなどの大規模なコンピュータシステム（以下、単にシステムと呼ぶこともある）では大量の電力を消費する。そのためシステムを安定して稼働させるには、システムの適切な消費電力管理が重要となる。

またシステム全体で使用可能な電力の上限が定められていることがある。この場合、システム全体で使用可能な電力を超えないようにするため、システムで実行されているジョブごとの消費電力に基づいて、ジョブスケジューリングが実行される。

消費電力に基づくジョブスケジューリングに関する技術として、例えばノード内のアプリケーションのフェーズのシーケンスを決定するステップを含む動的電力ステアリングを提供する、動的時間的電力ステアリングのためのシステムが提案されている。また単位時間内の消費電力量が予め規定した消費電力量を超える場合には他のプロセスを選択して実行させる電子計算機も提案されている。またデマンドレスポンス信号に対して精度の高い運転スケジュールを作成可能にするエネルギー管理サーバも提案されている。

特表２０１８−５０３１８４号公報特開平０７−１６８７２６号公報特開２０１５−０１２７８３号公報

スケジューリングの際のジョブの推定消費電力としては、例えばジョブを実行する計算ノードの消費電力の上限とすることが考えられる。すると、ジョブの実際の消費電力は使用する計算ノードの消費電力の上限を超えないため、システム全体の実際の消費電力はシステム全体で使用可能な電力を超えない。しかしながら、ジョブの実際の消費電力と使用する計算ノードの消費電力の上限との差が大きいと、システムの電力効率が低下する。

１つの側面では、本件は、システムの電力効率を向上させることを目的とする。

１つの案では、以下の処理をコンピュータに実行させるジョブスケジューリングプログラムが提供される。
まずコンピュータは、実行中の第１ジョブの現在以前の第１期間における消費電力を、第１期間より前の情報に基づいて予測した第１予測消費電力を算出する。次にコンピュータは、第１ジョブの第１期間における消費電力と第１予測消費電力との誤差が閾値未満の場合、複数の計算ノードへ割り当てられる第１ジョブを含む１以上の第２ジョブそれぞれの現在以降の第２期間における推定消費電力の合計が、所定の第１電力を超えないよう１以上の第２ジョブを複数の計算ノードに割り当てるスケジューリングの際の、第１ジョブの第２期間における推定消費電力を、第２期間に第１ジョブが実行された場合の消費電力を予測した第２予測消費電力に決定する。またコンピュータは、誤差が閾値以上の場合、スケジューリングの際の、第１ジョブの第２期間における推定消費電力を所定の第２電力に決定する。

１態様によれば、システムの電力効率を向上させることができる。

第１の実施の形態に係るジョブスケジューリング方法の一例を示す図である。第２の実施の形態のシステム構成例を示す図である。ＨＰＣ運用管理サーバのハードウェアの一構成例を示す図である。ＲＮＮについて説明する図である。ＨＰＣ運用管理サーバの機能を示すブロック図である。データベースに格納される情報の一例を示す図である。ジョブ情報の一例を示す図である。ジョブ消費電力情報の一例を示す図である。サンプルデータの一例を示す図である。実行中のジョブの消費電力予測に用いられる学習結果情報の一例を示す図である。実行前のジョブの消費電力予測に用いられる学習結果情報の一例を示す図である。類似ジョブ情報の一例を示す図である。判定情報の一例を示す図である。推定結果情報の一例を示す図である。実行前のジョブの推定消費電力の特定方法の一例を示す図である。優先度を示すキューの生成方法の一例を示す図である。実行中のジョブの推定消費電力の特定方法の一例を示す図である。データセットの生成例（参考例）を示す図である。データセットの第１の生成例を示す図である。データセットの第２の生成例を示す図である。データセットの第３の生成例を示す図である。予測モデル生成処理の概要を示す図である。予測モデルの一例を示す図である。判定情報生成処理の手順の一例を示すフローチャートである。予測モデル生成処理の手順の一例を示すフローチャートである。実行前電力推定処理の手順の一例を示すフローチャートである。実行割合調整処理の手順の一例を示すフローチャートである。実行中電力推定処理の手順の一例を示すフローチャートである。ジョブスケジューリング処理の手順の一例を示すフローチャートである。スケジューリング方法の比較例を示す図である。

以下、本実施の形態について図面を参照して説明する。なお各実施の形態は、矛盾のない範囲で複数の実施の形態を組み合わせて実施することができる。
〔第１の実施の形態〕
まず第１の実施の形態について説明する。

図１は、第１の実施の形態に係るジョブスケジューリング方法の一例を示す図である。図１には、ジョブスケジューリング方法を実施する情報処理装置１０が示されている。情報処理装置１０は、例えばジョブスケジューリング方法の処理手順が記述されたジョブスケジューリングプログラムを実行することにより、ジョブスケジューリング方法を実施することができる。

情報処理装置１０は、例えばＨＰＣシステム１に接続されている。ＨＰＣシステム１は、計算ノード１ａ，１ｂ，１ｃ，・・・を有する。ＨＰＣシステム１は、第１ジョブ２を実行中である。このとき計算ノード１ａ，１ｂ，１ｃ，・・・のうち、１以上の第１計算ノードが第１ジョブ２に割り当てられている。情報処理装置１０は、計算ノード１ａ，１ｂ，１ｃ，・・・へ割り当てられる、第１ジョブ２を含む１以上の第２ジョブについてスケジューリングを行う。情報処理装置１０は、ジョブスケジューリング方法を実現するために、記憶部１１と処理部１２とを有する。記憶部１１は、例えば情報処理装置１０が有するメモリ、またはストレージ装置である。処理部１２は、例えば情報処理装置１０が有するプロセッサ、または演算回路である。

記憶部１１は、判定情報１１ａを記憶する。判定情報１１ａは、実行が終了した第４ジョブ３ａ，３ｂ，・・・それぞれの消費電力を第４ジョブ３ａ，３ｂ，・・・のうちの他のジョブを用いて予測した場合の、予測に用いられたジョブとのパラメータの一致状況に対する第２予測成功確率を示す。例えば判定情報１１ａは、ジョブ名、ユーザ名およびグループ名の項目が「ＴＲＵＥ」であり、第２予測成功確率の項目が「９５％」であるレコードを含む。この場合判定情報１１ａは、第４ジョブ３ａ，３ｂ，・・・それぞれの消費電力を、第４ジョブ３ａ，３ｂ，・・・のうちのジョブ名、ユーザ名およびグループ名が一致するジョブで予測した場合に、予測が成功する確率が９５％であったことを示す。

さらに記憶部１１は、実行前のジョブ、実行中のジョブおよび実行が終了したジョブに関するジョブ情報を記憶する。ジョブ情報には、例えばジョブ実行時のパラメータの情報が含まれる。また実行中のジョブのジョブ情報には、現在までのジョブの消費電力の時系列変化が含まれる。また実行が終了したジョブのジョブ情報には、実行開始から実行終了までのジョブの消費電力の時系列変化が含まれる。

処理部１２は、実行中の第１ジョブ２と実行前の第３ジョブ４との推定消費電力を決定する。第１ジョブ２の推定消費電力の決定では、まず処理部１２は、第１ジョブ２の現在以前の第１期間における消費電力を、第１期間より前の情報に基づいて予測した第１予測消費電力を算出する。例えば処理部１２は、第１ジョブ２が実行を開始してから第１期間開始までの第１ジョブ２の消費電力の時間変化に基づいて、第１期間における第１ジョブ２の消費電力の時間変化を第１予測消費電力として算出する。処理部１２は、例えば予測対象期間までの消費電力の時系列変化を入力とし、予測対象期間における消費電力の時系列変化を出力とする学習済みのＲＮＮ（Recurrent Neural Network）を用いて第１予測消費電力を算出する。

次に処理部１２は、第１ジョブ２の第１期間における消費電力と第１予測消費電力との誤差が閾値未満であるか否かを判定する。例えば処理部１２は、第１期間の各測定点において第１ジョブ２の消費電力と第１予測電力との誤差が閾値未満の場合、第１ジョブ２の第１期間における消費電力と第１予測消費電力との誤差が閾値未満であると判定する。第１ジョブ２の第１期間における消費電力と第１予測消費電力との誤差が閾値未満の場合、処理部１２は、現在以降の第２期間に第１ジョブ２が実行された場合の消費電力を予測した第２予測消費電力を算出する。

例えば処理部１２は、第１ジョブ２が実行を開始してから第２期間開始までの消費電力の時間変化に基づいて、第２期間における第１ジョブ２の消費電力の時間変化を予測した第２予測消費電力を算出する。そして処理部１２は、スケジューリングの際の、第１ジョブ２の第２期間における推定消費電力を第２予測消費電力に決定する。なお処理部１２は、第２期間における第１ジョブ２の消費電力の時間変化の予測より所定の割合だけ大きいものを第２予測消費電力として算出してもよい。

第１ジョブ２の第１期間における消費電力と第１予測消費電力との誤差が閾値以上の場合、処理部１２は、スケジューリングの際の、第１ジョブの第２期間における推定消費電力を所定の第２電力に決定する。第２電力は、例えば１以上の第１計算ノードそれぞれのノードごとの定格消費電力の合計に基づいて決定される。

第３ジョブ４の推定消費電力の決定では、まず処理部１２は、第３ジョブ４を計算ノード１ａ，１ｂ，１ｃ，・・・のうちの１以上の第２計算ノードに割り当てた場合の第２期間における消費電力の第１予測成功確率を算出する。例えば処理部１２は、第３ジョブ４の消費電力を予測するための第４ジョブ３ａ，３ｂ，・・・のうちの第５ジョブを特定する。第５ジョブは、例えば第４ジョブ３ａ，３ｂ，・・・のうち、所定の計算式で計算される第３ジョブ４との類似度が最も高い所定数のジョブのうちの１つである。そして処理部１２は、判定情報１１ａに基づいて特定される、第３ジョブ４と第５ジョブとのパラメータの一致状況に対応する第２予測成功確率を第１予測成功確率として算出する。

次に処理部１２は、第１予測成功確率が所定値以上であるか否かを判定する。第１予測成功確率が所定値以上の場合、処理部１２は、第２期間に第３ジョブ４が実行された場合の消費電力を予測した第３予測消費電力を算出する。例えば処理部１２は、第５ジョブが過去に実行された際の消費電力に基づいて、第２期間に第３ジョブ４が実行された場合の消費電力を予測した第３予測消費電力を算出する。処理部１２は、例えば第５ジョブが過去に実行された際の開始から第２期間の長さまでの消費電力の時系列変化を所定の割合だけ大きくしたものを、第３予測消費電力とする。そして処理部１２は、スケジューリングの際の、第３ジョブ４の第２期間における推定消費電力を第３予測消費電力に決定する。第１予測成功確率が所定値未満の場合、処理部１２は、スケジューリングの際の、第３ジョブ４の第２期間における推定消費電力を、１以上の第２計算ノードの定格消費電力の合計に基づいて決定される第３電力に決定する。

そして処理部１２は、第１ジョブ２と第３ジョブ４との推定消費電力に基づいてスケジューリングを行う。スケジューリングでは、処理部１２は、１以上の第２ジョブそれぞれの第２期間における推定消費電力の合計が、所定の第１電力を超えないよう１以上の第２ジョブを計算ノード１ａ，１ｂ，１ｃ，・・・に割り当てる。第１電力は、例えば計算ノード１ａ，１ｂ，１ｃ，・・・全体の定格消費電力に基づいて決定される。

一例として、ＨＰＣシステム１では、第１ジョブ２以外のジョブは実行されていないものとし、実行前のジョブのうち第３ジョブ４が計算ノード１ａ，１ｂ，１ｃ，・・・に割り当てられる優先度が最も高いものとする。すると処理部１２は、第１ジョブ２の第２期間における推定消費電力と第３ジョブ４の第２期間における推定消費電力とを算出する。第１ジョブ２の第２期間における推定消費電力と第３ジョブ４の第２期間における推定消費電力との合計が第１電力以下の場合、処理部１２は、第３ジョブ４を１以上の第２計算ノードに割り当てる。また第１ジョブ２の第２期間における推定消費電力と第３ジョブ４の第２期間における推定消費電力との合計が第１電力を超える場合、処理部１２は、第３ジョブ４を計算ノードに割り当てない。

このような情報処理装置１０によれば、処理部１２は、第１ジョブ２の第１期間における第１予測消費電力を算出し、第１予測消費電力と第１ジョブの第１期間における消費電力との誤差に応じてスケジューリングにおける第１ジョブ２の推定消費電力を決定する。処理部１２は、誤差が閾値未満の場合第１ジョブ２の推定消費電力を第２予測消費電力に決定し、誤差が閾値以上の場合第１ジョブ２の推定消費電力を所定の第２電力に決定する。

ここで所定の電力を超えないようにするスケジューリングでは、各ジョブの消費電力は高めに推定される（例えば、使用する計算ノードの定格消費電力の合計と推定される）ことが多い。これに対して情報処理装置１０は、消費電力の予測が成功する可能性が高いジョブについては、推定消費電力を予測の消費電力に決定する。これにより情報処理装置１０は、第１電力を超えないようにするスケジューリングにおいて、多くのジョブが計算ノードに割り当てられるようにし、ＨＰＣシステム１の電力効率を向上させることができる。

なお第１電力は、計算ノード１ａ，１ｂ，１ｃ，・・・全体の定格消費電力に基づいて決定される。これにより情報処理装置１０は、ＨＰＣシステム１の消費電力の上限を超えないようにするスケジューリングにおいて、ＨＰＣシステム１の電力効率を向上させることができる。

また第２電力は、１以上の第１計算ノードそれぞれのノードごとの定格消費電力の合計に基づいて決定される。これにより情報処理装置１０は、予測が成功する可能性が高くないジョブについては、実際の消費電力よりも高い電力を推定消費電力とすることができる。

また処理部１２は、第３ジョブ４を実行した場合の第２期間における消費電力の第１予測成功確率を算出し、第１予測成功確率に応じてスケジューリングにおける第３ジョブ４の推定消費電力を決定する。処理部１２は、第１予測成功確率が所定値以上の場合第３ジョブ４の推定消費電力を第３予測消費電力に決定し、第１予測成功確率が所定値未満の場合第３ジョブ４の推定消費電力を所定の第３電力に決定する。これにより情報処理装置１０は、実行前のジョブについても、消費電力の予測が成功する可能性が高いジョブについては、推定消費電力を予測の消費電力とすることができる。

また処理部１２は、それまでの第１ジョブ２の消費電力の時間変化に基づいて、第１予測消費電力と第２予測消費電力とを算出する。これにより第１ジョブ２の実行が進むにつれて予測に使用されるデータ数が増加する。よって情報処理装置１０は、ジョブの実行時間が増加するほどジョブの消費電力の予測精度を向上させることができる。

また処理部１２は、判定情報１１ａと第４ジョブ３ａ，３ｂ，・・・のうちの第５ジョブとに基づいて、第３ジョブ４の消費電力を予測する。これにより情報処理装置１０は、実行前のジョブの消費電力を精度良く予測できる。

なお処理部１２は、複数の第３ジョブ４それぞれのスケジューリングの際の計算ノード１ａ，１ｂ，１ｃ，・・・に割り当てられる優先度を決定してもよい。例えば処理部１２は、複数の第３ジョブ４のうち、第１予測成功確率が所定値以上となる第３ジョブ４の複数の計算ノードの使用量と複数の第３ジョブ４のうち、第１予測成功確率が所定値未満となる第３ジョブ４の複数の計算ノードの使用量との比率を算出する。そして処理部１２は、算出された比率に基づいて、複数の第３ジョブ４それぞれの優先度を決定してもよい。これにより情報処理装置１０は、予測が成功する可能性が高いジョブと予測が成功する可能性が高くないジョブとを一定の比率でＨＰＣシステム１に実行させることができる。

〔第２の実施の形態〕
次に第２の実施の形態について説明する。第２の実施の形態は、ジョブの消費電力を動的に予測し、予測したジョブの消費電力に基づいてスケジューリングをするものである。

図２は、第２の実施の形態のシステム構成例を示す図である。ＨＰＣシステム３０は、複数の計算ノード３１，３２，・・・を有している。計算ノード３１，３２，・・・は、投入されたジョブを実行するコンピュータである。

ＨＰＣシステム３０内の計算ノード３１，３２，・・・は、ＨＰＣ運用管理サーバ１００に接続されている。ＨＰＣ運用管理サーバ１００は、ＨＰＣシステム３０の運用管理を行うコンピュータである。例えばＨＰＣ運用管理サーバ１００は、ジョブ実行時の計算ノード３１，３２，・・・の消費電力の時系列変化を監視する。またＨＰＣ運用管理サーバ１００は、実行待ちのジョブと実行中のジョブとについて、ジョブの電力消費パターンを予測し、ＨＰＣシステム３０全体の定格消費電力を超えないように、ジョブスケジューリングを行う。そしてＨＰＣ運用管理サーバ１００は、作成したジョブの実行スケジュールに従って、計算ノード３１，３２，・・・にジョブの実行を指示する。

ＨＰＣ運用管理サーバ１００は、ネットワーク２０を介して端末装置４１，４２，・・・に接続されている。端末装置４１，４２，・・・は、ＨＰＣシステム３０によるジョブの実行を希望するユーザが使用するコンピュータである。端末装置４１，４２，・・・は、ユーザの入力に基づいてＨＰＣシステム３０に実行させるジョブの内容を示すジョブ情報を生成し、生成したジョブ情報を含むジョブ投入要求を、ＨＰＣ運用管理サーバ１００に送信する。ジョブ情報は、ジョブで使用するアプリケーションプログラム名などのステイタス情報を含む。

図３は、ＨＰＣ運用管理サーバのハードウェアの一構成例を示す図である。ＨＰＣ運用管理サーバ１００は、プロセッサ１０１によって装置全体が制御されている。プロセッサ１０１には、バス１０９を介してメモリ１０２と複数の周辺機器が接続されている。プロセッサ１０１は、マルチプロセッサであってもよい。プロセッサ１０１は、例えばＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro Processing Unit）、またはＤＳＰ（Digital Signal Processor）である。プロセッサ１０１がプログラムを実行することで実現する機能の少なくとも一部を、ＡＳＩＣ（Application Specific Integrated Circuit）、ＰＬＤ（Programmable Logic Device）などの電子回路で実現してもよい。

メモリ１０２は、ＨＰＣ運用管理サーバ１００の主記憶装置として使用される。メモリ１０２には、プロセッサ１０１に実行させるＯＳ（Operating System）のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、メモリ１０２には、プロセッサ１０１による処理に利用する各種データが格納される。メモリ１０２としては、例えばＲＡＭ（Random Access Memory）などの揮発性の半導体記憶装置が使用される。

バス１０９に接続されている周辺機器としては、ストレージ装置１０３、グラフィック処理装置１０４、入力インタフェース１０５、光学ドライブ装置１０６、機器接続インタフェース１０７およびネットワークインタフェース１０８がある。

ストレージ装置１０３は、内蔵した記録媒体に対して、電気的または磁気的にデータの書き込みおよび読み出しを行う。ストレージ装置１０３は、コンピュータの補助記憶装置として使用される。ストレージ装置１０３には、ＯＳのプログラム、アプリケーションプログラム、および各種データが格納される。なお、ストレージ装置１０３としては、例えばＨＤＤ（Hard Disk Drive）やＳＳＤ（Solid State Drive）を使用することができる。

グラフィック処理装置１０４には、モニタ２１が接続されている。グラフィック処理装置１０４は、プロセッサ１０１からの命令に従って、画像をモニタ２１の画面に表示させる。モニタ２１としては、有機ＥＬ（Electro Luminescence）を用いた表示装置や液晶表示装置などがある。

入力インタフェース１０５には、キーボード２２とマウス２３とが接続されている。入力インタフェース１０５は、キーボード２２やマウス２３から送られてくる信号をプロセッサ１０１に送信する。なお、マウス２３は、ポインティングデバイスの一例であり、他のポインティングデバイスを使用することもできる。他のポインティングデバイスとしては、タッチパネル、タブレット、タッチパッド、トラックボールなどがある。

光学ドライブ装置１０６は、レーザ光などを利用して、光ディスク２４に記録されたデータの読み取りを行う。光ディスク２４は、光の反射によって読み取り可能なようにデータが記録された可搬型の記録媒体である。光ディスク２４には、ＤＶＤ（Digital Versatile Disc）、ＤＶＤ−ＲＡＭ、ＣＤ−ＲＯＭ（Compact Disc Read Only Memory）、ＣＤ−Ｒ（Recordable）／ＲＷ（ReWritable）などがある。

機器接続インタフェース１０７は、ＨＰＣ運用管理サーバ１００に周辺機器を接続するための通信インタフェースである。例えば機器接続インタフェース１０７には、メモリ装置２５やメモリリーダライタ２６を接続することができる。メモリ装置２５は、機器接続インタフェース１０７との通信機能を搭載した記録媒体である。メモリリーダライタ２６は、メモリカード２７へのデータの書き込み、またはメモリカード２７からのデータの読み出しを行う装置である。メモリカード２７は、カード型の記録媒体である。

ネットワークインタフェース１０８は、ネットワーク２０に接続されている。ネットワークインタフェース１０８は、ネットワーク２０を介して、他のコンピュータまたは通信機器との間でデータの送受信を行う。

ＨＰＣ運用管理サーバ１００は、以上のようなハードウェア構成によって、第２の実施の形態の処理機能を実現することができる。なお、計算ノード３１，３２，・・・および端末装置４１，４２，・・・も、図３に示したＨＰＣ運用管理サーバ１００と同様のハードウェアにより実現することができる。また第１の実施の形態に示した情報処理装置１０も、図３に示したＨＰＣ運用管理サーバ１００と同様のハードウェアにより実現することができる。

ＨＰＣ運用管理サーバ１００は、例えばコンピュータ読み取り可能な記録媒体に記録されたプログラムを実行することにより、第２の実施の形態の処理機能を実現する。ＨＰＣ運用管理サーバ１００に実行させる処理内容を記述したプログラムは、様々な記録媒体に記録しておくことができる。例えば、ＨＰＣ運用管理サーバ１００に実行させるプログラムをストレージ装置１０３に格納しておくことができる。プロセッサ１０１は、ストレージ装置１０３内のプログラムの少なくとも一部をメモリ１０２にロードし、プログラムを実行する。またＨＰＣ運用管理サーバ１００に実行させるプログラムを、光ディスク２４、メモリ装置２５、メモリカード２７などの可搬型記録媒体に記録しておくこともできる。可搬型記録媒体に格納されたプログラムは、例えばプロセッサ１０１からの制御により、ストレージ装置１０３にインストールされた後、実行可能となる。またプロセッサ１０１が、可搬型記録媒体から直接プログラムを読み出して実行することも可能である。

図２に示すシステムにおいて、ＨＰＣ運用管理サーバ１００は、ＨＰＣシステム３０の適切な電力管理を行う。例えばＨＰＣ運用管理サーバ１００は、ＨＰＣシステム３０の消費電力の上限（ＨＰＣシステム３０全体の定格消費電力）を超えないように、ＨＰＣシステム３０が実行するジョブのスケジューリングを行う。なお計算ノード３１，３２，・・・それぞれにも定格消費電力があり、第２の実施の形態では全計算ノードの定格消費電力の合計は、ＨＰＣシステム３０全体の定格消費電力より大きいものとする。また計算ノード３１，３２，・・・それぞれの定格消費電力は同じであるものとする。

ここで、ＨＰＣシステム３０の定格消費電力を超えないようなスケジューリングとしては、各ジョブの消費電力をジョブを実行する計算ノードの定格消費電力の合計（ジョブの最大消費電力）と推定してスケジューリングする方法が考えられる。すると、ジョブの実際の消費電力は使用する計算ノードの定格消費電力を超えないため、ＨＰＣシステム３０全体の実際の消費電力はＨＰＣシステム３０の定格消費電力を超えない。しかしながら、ジョブの実際の消費電力とジョブの最大消費電力との差が大きいと、ＨＰＣシステム３０の電力効率は低下する。

そこでＨＰＣ運用管理サーバ１００は、実行前または実行中のジョブの今後の消費電力の時系列変化を予測可能か判定し、電力の時系列変化を予測可能なジョブについては予測した電力の時系列変化に基づいてスケジューリングを行う。なお消費電力の時系列変化は、例えば電力波形で表される。以下では、新規投入ジョブが実行されたときの電力波形と実行中のジョブの今後の電力波形との予測方法について説明する。

新規投入ジョブが実行されたときの電力波形の予測では、例えばＨＰＣ運用管理サーバ１００は、実行済みのジョブのうちの新規投入ジョブに類似するジョブの電力波形の中から、新規投入ジョブの電力波形の予測とするものを決定する。そのために、ＨＰＣ運用管理サーバ１００は、まず例えば新規投入ジョブに類似するジョブを特定する。ジョブ間の類似度は、ジョブの実行要求を入力したユーザのユーザＩＤ、ジョブの種別、ジョブ実行時の並列度（何台の計算ノードで並列実行させるか）などの、ジョブのステイタスを示す情報（以下、ジョブステイタス情報と呼ぶ）の類似度で表すことができる。

各ジョブのジョブステイタス情報は、ジョブのステイタスに関する項目の項目名とその項目の値との組を複数含む文書である。文書間の類似度の算出に利用可能な技術として、潜在的ディリクレ配分法（ＬＤＡ：Latent Dirichlet Allocation）推定モデルがある。例えばＨＰＣ運用管理サーバ１００は、ＬＤＡ推定モデルを用いて、各ジョブのジョブステイタス情報に表されるトピック分布を算出し、ジョブ間のトピック分布の類似度をジョブの類似度とする。

ＬＤＡ推定モデルは、トピックモデルの一種である。トピックモデルは、文書が複数の潜在的なトピックから確率的に生成される（文書内の各単語はあるトピックが持つ確率分布に従って出現する）と仮定したモデルである。ＬＤＡ推定モデルを用いると、分析対象となる文書データの集合から、各文書に表されているトピックの混合比率を推定することができる。

各文書のトピック分布の生成には、多項分布の共役事前分布であるディリクレ分布（dirichlet distribution）が利用される。なお、ディリクレ分布は、以下の式で表される。

式（１）は、パラメータであるベクトルαの元で、ベクトルｘが生じる確率を示している。Γはガンマ関数である。ベクトルｘは、確率変数を示す実数ベクトルである。Ｋはトピック数である。ｋはトピックのインデックスである。

ＨＰＣ運用管理サーバ１００は、トレーニングデータセットであるジョブステイタス情報群から、各文章（ジョブステイタス情報）にどんな単語が出現するかをそれぞれ調べる。そしてＨＰＣ運用管理サーバ１００は、同じ文章内にどの単語が多く出現するかカウントすることで、同じ文章内に出現する確率が高い単語をグルーピングし、これをトピックとする。

具体的には、ＨＰＣ運用管理サーバ１００は、各文書および各単語について以下の式（２）により、確率を計算する。

Ｎは文書集合の全単語数である。Ｖは全語彙数（全文書集合に含まれる単語の種類数）である。ｄは文書のインデックスである。ｎは単語のインデックスである。ｖは語彙のインデックスである。ｗはある１つの単語である。ｚはある１つのトピックである。バックスラッシュは、集合からの差を示す。βは、単語分布のパラメータである。式（２）は、文書ｄにおける単語ｗ_d,nについてのトピックｚ_d,nのサンプリング式である。

ＨＰＣ運用管理サーバ１００は、式（２）で得られる確率が高い（例えば所定値以上の）単語の組み合わせをトピックとする。すなわちＨＰＣ運用管理サーバ１００は、ＬＤＡ推定モデルを用いた学習の結果、トピックに属する単語の集合を得る。

ＨＰＣ運用管理サーバ１００は、各ジョブのジョブステイタス情報に含まれる単語が属するトピックに基づいて、ジョブステイタス情報のトピック分布を計算する。ＨＰＣ運用管理サーバ１００は、各ジョブのジョブステイタス情報に基づいて生成されたトピック分布をジョブ間で比較して、ジョブ間の類似度を算出することができる。

例えばＨＰＣ運用管理サーバ１００は、新規投入ジョブに類似するジョブを、トピック分布の類似度によって推定する。例えばＨＰＣ運用管理サーバ１００は、トピック分布間のコサイン類似度を計算することで、ジョブの類似度を算出する。

ＨＰＣ運用管理サーバ１００は、ジョブごとにトピック分布を算出する。トピック分布は、トピックのインデックスを要素番号とし、文書（ジョブステイタス情報）内での該当トピックの出現頻度の値を要素とするベクトルで表すことができる。ＨＰＣ運用管理サーバ１００は、新規投入ジョブのトピック分布を示すベクトルと、実行が終了しているジョブのトピック分布を示すベクトルとのコサイン類似度を算出し、ジョブ間の類似度とする。これにより、比較対象のジョブそれぞれのトピック分布に共通のトピックが多く含まれるほど、類似度が高くなる。

なおＨＰＣ運用管理サーバ１００は、新規投入ジョブのトピック分布に含まれる各トピックと、実行が終了しているジョブのトピック分布に含まれる各トピックとの類似度を算出し、トピック間の類似度に基づいて、ジョブ分布間の類似度を算出してもよい。例えばＨＰＣ運用管理サーバ１００は、比較対象のトピック分布それぞれに含まれるトピック間の類似度の合計を、トピック分布の類似度とする。

ＨＰＣ運用管理サーバ１００は、トピック間の類似度Ｓ_kk'を、例えばベクトル空間法で計測することができる。ベクトル空間法は、語彙空間Ｖにおけるトピックごとの語彙の出現頻度ベクトルの余弦で定義される。ｋ番目のトピックとｋ’番目のトピック間の類似度を式で表すと、以下の式で表される。

ｎ_kは、ｋ番目のトピックの出現頻度ベクトルである。ｎ_k'は、ｋ’番目のトピックの出現頻度ベクトルｎ_kである。
このように、ＬＤＡ推定モデルを用いて各ジョブのトピック分布を計算し、トピック分布間の類似度によって、ジョブの類似度を算出することができる。そして、ＨＰＣ運用管理サーバ１００は、すでに実行が終了しているジョブのうち、新規投入ジョブに類似する所定数のジョブの電力波形を、新規投入ジョブの予測の電力波形の候補とすることができる。

実行中のジョブの今後の電力波形の予測では、例えばＲＮＮによって学習した予測モデルが利用される。
図４は、ＲＮＮについて説明する図である。ＲＮＮ３００は、ニューラルネットワークの一種であり、時系列データの学習に用いられる。ＲＮＮでは、時刻ｔの隠れ層の内容が、次の時刻ｔ＋１の入力として扱われる。ＲＮＮ３００には、ＬＳＴＭ（Long Short-Term Memory Networks）やＧＲＵ（Gated Recurrent Unit）がある。

ＬＳＴＭは、ゲートのメカニズムを導入することで、遠い過去のことまで覚えておくことができる。そのため、過去の情報まで参考にしないと予測できないような問題には、ＬＳＴＭが有用となる。ＧＲＵは、ＬＳＴＭを改良したものである。ＧＲＵは、ＬＳＴＭの構造をシンプルにしたもので、忘却ゲートと入力ゲートを単一の更新ゲート３０１として組み合わせている。

更新ゲート３０１には、どの程度の過去に遡って情報を利用するのかを設定することができる。ＲＮＮ３００において、どの程度の過去に遡って情報を利用するのかは、遅れ時間として設定される。遅れ時間は、予測対象の測定点に対してどこまで過去の情報を使用して学習／予測を行うかを決定するハイパパラメータである。

ＲＮＮ３００によりジョブの消費電力の時系列変化を予測する場合、既に実行が終了しているジョブの消費電力の測定結果を用いて予測モデルを作成することができる。ＨＰＣ運用管理サーバ１００は、ジョブ実行開始からの経過時間の区間ごとにモデルを作成する。そしてＨＰＣ運用管理サーバ１００は、実行中のジョブの予測対象区間に対応するモデルにジョブの実行開始から予測対象区間までの電力波形を入力し、予測対象区間での電力波形を予測する。

以下、ＨＰＣ運用管理サーバ１００によるＨＰＣシステム３０のジョブスケジューリング方法について詳細に説明する。
図５は、ＨＰＣ運用管理サーバの機能を示すブロック図である。ＨＰＣ運用管理サーバ１００は、ＤＢ１１０、タイマ部１２１、メトリクス収集部１２２、サンプル作成部１２３、学習部１２４、予測値計算部１２５、および予測結果補正部１２６を有する。またＨＰＣ運用管理サーバ１００は、ＤＢ１３０、タイマ部１４１、情報取得部１４２、割合調整部１４３、ジョブスケジューリング部１４４、および制御指示部１４５を有する。

ＤＢ１３０は、実行するジョブのステイタスを示すジョブステイタス情報や、実行したジョブの消費電力の時系列変化を示すジョブ消費電力情報を記憶する。
タイマ部１４１は、ＨＰＣシステム３０からジョブごとの消費電力情報を収集するタイミングとスケジューリングに用いるキューを生成するタイミングとを管理する。例えばタイマ部１４１は、一定の時間間隔で、ジョブ消費電力情報の収集を情報取得部１４２に指示する。またタイマ部１４１は、一定の時間間隔で、スケジューリングで用いるキューの生成を割合調整部１４３に指示する。

情報取得部１４２は、タイマ部１４１からの指示に応じて、ＨＰＣシステム３０から、ＨＰＣシステム３０で実行中または実行が終了したジョブの時系列電力データを取得する。情報取得部１４２は、取得した消費電力情報を、ＤＢ１３０に格納する。

なおＨＰＣシステム３０は、ジョブごとに電力を測定する機能を備えている。例えばＨＰＣシステム３０内の各計算ノード３１，３２，・・・は、消費電力を計測する機器を備えており、ジョブを実行していない状態での消費電力と、ジョブを実行中の消費電力との差を、そのジョブの消費電力とすることができる。また計算ノード３１，３２，・・・は、温度センサなどの情報を元にジョブの消費電力を予測してもよい。例えば計算ノード３１，３２，・・・は、ＣＰＵ温度とシステムボード（ＳＢ）排気温度とを、温度センサによって収集する。計算ノード３１，３２，・・・は、収集した温度データに基づいて、まずＣＰＵ温度変化（Ｔ_cpu）とＳＢ排気温度変化（Ｔ_air）とを計算する。

ＣＰＵ温度変化（Ｔ_cpu）は、以下の式で算出できる。
ＣＰＵ温度変化（Ｔ_cpu）＝ＣＰＵ温度−水冷入力温度・・・（４）
またＳＢの排気温度変化（Ｔ_air）は、以下の式で算出できる。
ＳＢ排気温度変化（Ｔ_air）＝ＳＢ排気温度−ラック吸気温度・・・（５）
計算ノード３１，３２，・・・は、ＣＰＵの消費電力をＣＰＵ温度変化から算出する（例えばＣＰＵの消費電力＝１．０２・Ｔ_cpu）。また計算ノード３１，３２，・・・は、メモリの消費電力をＳＢ排気温度から算出する（例えばメモリの消費電力＝０．２５４・Ｔ_air）。さらに計算ノード３１，３２，・・・は、インターコネクトコントローラ（ＩＣＣ）の消費電力は一定値であるものとする（例えばＩＣＣの消費電力＝８．３６）。そして計算ノード３１，３２，・・・は、以下の式によりジョブの電力Ｐを予測する。
Ｐ＝１．０２・Ｔ_cpu＋０．２５４・Ｔ_air＋８．３６・・・（６）
割合調整部１４３は、実行前のジョブの実行される優先度を示すキューを生成する。例えば割合調整部１４３は、消費電力の予測が成功する確率が高いジョブと消費電力の予測が成功する確率が高くないジョブとを分類する。そして割合調整部１４３は、消費電力の予測が成功する確率が高いジョブの計算ノードの使用量（例えば、要求ノード数×最大実行時間）と消費電力の予測が成功する確率が高くないジョブの計算ノードの使用量との比率が一定になるようキューにジョブを投入する。

ジョブスケジューリング部１４４は、ジョブの実行が開始または終了するタイミングで、割合調整部１４３が生成したキューに投入されているジョブをスケジューリングする。例えばジョブスケジューリング部１４４は、キューに投入されているジョブを優先度順に選択し、選択したジョブについて次の処理を実行する。ジョブスケジューリング部１４４は、実行中のすべてのジョブの今後の推定消費電力とキューから選択されたジョブの今後の推定消費電力との合計を算出する。そしてジョブスケジューリング部１４４は、算出した推定消費電力の合計がＨＰＣシステム３０全体の定格消費電力未満の場合、キューから選択されたジョブをスケジューリングする。制御指示部１４５は、ジョブスケジューリング部１４４によるジョブの実行スケジュールに従って、ＨＰＣシステム３０にジョブの実行を指示する。

ＤＢ１１０は、ジョブごとの電力消費パターンの予測に使用する情報を記憶する。タイマ部１２１は、実行済みのジョブの時系列電力データの取得タイミングを管理する。例えばタイマ部１２１は、一定の時間間隔で、ＤＢ１３０からの情報収集を、メトリクス収集部１２２に指示する。またタイマ部１２１は、ジョブの実行が開始されると、一定間隔で該当ジョブの消費電力の予測を予測値計算部１２５に指示する。

メトリクス収集部１２２は、タイマ部１２１の指示に応じて、ＤＢ１３０から情報を収集する。例えばメトリクス収集部１２２は、実行待ちのジョブおよび実行が終了したジョブのジョブステイタス情報と、実行が終了したジョブの電力消費パターンを示す時系列電力データとを、ＤＢ１３０から取得する。メトリクス収集部１２２は、取得した情報をＤＢ１１０に格納する。

サンプル作成部１２３は、ＤＢ１１０に格納された時系列電力データに基づいて、消費電力を推定するための予測モデルの生成に使用するサンプルデータを作成する。例えばサンプル作成部１２３は、ジョブの実行開始からの経過時間を分割して得られる複数の時間帯それぞれを予測対象期間として、予測対象期間ごとの学習用のデータセットを作成する。そしてサンプル作成部１２３は、作成したデータセットの集合を、サンプルデータとしてＤＢ１１０に格納する。

学習部１２４は、実行前のジョブの消費電力を推定するための情報と実行中のジョブの消費電力を推定するための情報とを生成する。学習部１２４は、実行前のジョブの消費電力を推定するための情報として、過去に実行された類似するジョブで実行前のジョブの消費電力を予測したときの予測成功確率を示す判定情報を生成する。まず学習部１２４は、ジョブ情報に基づいて、ＬＤＡ推定モデルを生成する。例えば学習部１２４は、複数のジョブのジョブステイタス情報に含まれる単語を解析し、トピックごとのグループに単語を分類する。学習部１２４は、学習結果をＤＢ１１０に格納する。

次に学習部１２４は、過去に実行されたジョブそれぞれの消費電力を、過去に実行された他のジョブのうち、ＬＤＡ推定モデルによって特定される最も類似するジョブの消費電力で予測可能であるか否かを判定する。そして学習部１２４は、予測に用いられたジョブとのパラメータの一致状況に対する予測成功確率を示す判定情報を生成し、生成した判定情報をＤＢ１１０に格納する。

学習部１２４は、実行中のジョブの消費電力を推定するための情報として、ニューラルネットワークを用いて、ジョブの過去の消費電力情報から、以後の消費電力を予測する予測モデルを生成する。学習部１２４は、例えば予測対象期間ごとに、該当期間のデータセットを用いて、ＲＮＮにより予測モデルを生成する。

予測値計算部１２５は、タイマ部１２１により指示されたタイミングで、予測モデルを用いて、実行中のジョブの以後の消費電力の時系列変化を予測する。例えば予測値計算部１２５は、消費電力予測対象のジョブが属するグループの、現在のジョブの実行時間に応じた期間の予測モデルを用いて、消費電力を予測する。

予測結果補正部１２６は、実行前のジョブの推定消費電力と実行中のジョブの推定消費電力とを決定する。実行前のジョブの推定消費電力の決定では、予測結果補正部１２６は、ＬＤＡ推定モデルを用いて、過去に実行されたジョブの中から予測対象のジョブに類似する所定数のジョブを特定する。予測結果補正部１２６は、特定した所定数のジョブそれぞれの予測対象のジョブとのパラメータの一致状況と判定情報とに基づいて、特定した所定数のジョブそれぞれの消費電力による予測対象のジョブの電力の予測成功確率を特定する。そして予測結果補正部１２６は、予測成功確率が所定値（例えば、９５％）以上となるジョブの消費電力を予測対象のジョブの推定消費電力に決定する。予測結果補正部１２６は、予測成功確率が所定値以上となるジョブがない場合、予測対象のジョブを実行する計算ノードの定格消費電力の合計（ジョブの最大消費電力）を予測対象のジョブの推定消費電力に決定する。

実行中のジョブの推定消費電力の決定では、予測結果補正部１２６は、予測値計算部１２５が現在以前の期間の予測モデルを用いて予測した該当期間の消費電力と、実際の該当期間の消費電力との誤差を算出する。誤差が閾値未満の場合、予測結果補正部１２６は、予測値計算部１２５が予測した、予測対象のジョブの以後の消費電力を予測対象のジョブの推定消費電力に決定する。誤差が閾値以上の場合、予測結果補正部１２６は、予測対象のジョブの最大消費電力を予測対象のジョブの推定消費電力に決定する。

なお、図５に示した各要素間を接続する線は通信経路の一部を示すものであり、図示した通信経路以外の通信経路も設定可能である。また、図５に示した各要素の機能は、例えば、その要素に対応するプログラムモジュールをコンピュータに実行させることで実現することができる。

図６は、データベースに格納される情報の一例を示す図である。図６の例では、ＤＢ１１０には、ジョブ情報１１１、ジョブ消費電力情報１１２、サンプルデータ１１３、学習結果情報１１４，１１５、類似ジョブ情報１１６、判定情報１１７および推定結果情報１１８が格納されている。

ジョブ情報１１１は、ジョブごとのジョブ名などのジョブステイタス情報である。ジョブ消費電力情報１１２は、実行中または実行が終了したジョブの時系列の消費電力に関する情報である。サンプルデータ１１３は、ジョブ消費電力情報１１２から抽出された、予測対象期間ごとの予測モデルの生成に用いる時系列電力データである。学習結果情報１１４は、予測モデルの学習結果を示す情報である。学習結果情報１１５は、ＬＤＡによる学習結果を示す情報である。類似ジョブ情報１１６は、実行前のジョブに類似するジョブを示す情報である。判定情報１１７は、実行前のジョブの消費電力予測の成功確率を特定するために用いる情報である。推定結果情報１１８は、実行前または実行中のジョブの以後の所定期間における消費電力の推定結果を示す情報である。

図７は、ジョブ情報の一例を示す図である。ジョブ情報１１１には、例えばジョブごとのジョブステイタス情報１１１ａ，１１１ｂ，・・・が含まれている。ジョブステイタス情報１１１ａ，１１１ｂ，・・・には、ジョブＩＤ、ジョブの名称、アプリケーションの名称、ジョブの実行を要求しているユーザのユーザ名、該当ユーザが属するグループのグループＩＤなど、ジョブの実行に関連する各種情報が含まれる。

図８は、ジョブ消費電力情報の一例を示す図である。ジョブ消費電力情報１１２は、例えばジョブの実行開始からの経過時間を行のラベルに設定し、ジョブ名を列のラベルに設定したデータテーブルである。行と列の交わる位置に、列に示されるジョブを実行したときの、実行開始から行に示される時間だけ経過した時点での、予測用類似ジョブの消費電力が設定されている。なお、図８の例では、経過時間に、その経過時間に対応する測定点の番号が示されている。

図９は、サンプルデータの一例を示す図である。サンプルデータ１１３には、複数のデータセット１１３ａ，１１３ｂ，・・・が含まれる。例えばサンプル作成部１２３は、ジョブの実行開始からの経過時間を分割して得られる期間について、時間が早い順に「Ｉｎｔｅｒｖａｌ０」、「Ｉｎｔｅｒｖａｌ１」、「Ｉｎｔｅｒｖａｌ２」、・・・との識別子を付与するものとする。このとき「Ｉｎｔｅｒｖａｌ０」の期間は、その期間以前の時系列電力データが存在しないため予測対象期間からは除外される。そのためサンプル作成部１２３は、「Ｉｎｔｅｒｖａｌ１」以降の期間を、予測対象期間とする。そしてサンプル作成部１２３は、予測対象期間ごとのデータセット１１３ａ，１１３ｂ，・・・を作成する。

例えばデータセット１１３ａには、「Ｉｎｔｅｒｖａｌ１」の予測対象期間の予測モデルの生成に利用する時系列電力データが含まれる。データセット１１３ａには、実行済みのジョブのジョブ名とそのジョブのジョブ番号との組に対応付けて、予測用類似ジョブの時系列電力データが設定されている。時系列電力データの欄には、電力の測定点の番号に対応付けて、その測定点で測定した電力値が設定されている。

データセット１１３ａに含まれる時系列電力データは、問題データと答えデータとに分かれる。問題データには、データセット１１３ａの予測対象期間より前に測定された電力値が含まれる。答えデータには、データセット１１３ａの予測対象期間内に測定された電力値が含まれる。

データセット１１３ａと同様に、他のデータセット１１３ｂ，・・・にも、それぞれの予測対象期間の予測モデルの生成に利用する時系列電力データが含まれる。
図１０は、実行中のジョブの消費電力予測に用いられる学習結果情報の一例を示す図である。学習結果情報１１４には、例えばグループごとの予測モデル１１４ａ，１１４ｂ，・・・が含まれている。例えば予測モデル１１４ａは、単位時間（５分）間隔に設定された予測点における１点先（５分先）〜６点先それぞれの消費電力を予測するニューラルネットワーク（例えばＲＮＮ）の予測モデルである。ニューラルネットワークにおける学習とは、ニューロンに相当するユニットに入力するデータに対する重みの適切な値を求めることである。学習結果には、例えばＲＮＮの構造と学習された重み値とが設定される。

図１１は、実行前のジョブの消費電力予測に用いられる学習結果情報の一例を示す図である。学習結果情報１１５は、ＬＤＡ推定モデルによる学習結果である。学習結果情報１１５には、トピックを示すトピック番号に対応付けて、そのトピックに属する単語が登録されている。

図１２は、類似ジョブ情報の一例を示す図である。例えば類似ジョブ情報１１６には、学習結果情報１１５に基づいて判定された、実行前のジョブそれぞれに対する類似ジョブリスト１１６ａ，１１６ｂ，・・・が含まれる。類似ジョブリスト１１６ａ，１１６ｂ，・・・には、ＬＤＡ推定モデルの学習結果情報１１５に基づいて判定された、実行前のジョブに類似する所定数のジョブのジョブＩＤが示される。

図１３は、判定情報の一例を示す図である。判定情報１１７には、複数のパラメータそれぞれが一致するか否か（パラメータの一致状況）が設定されている。複数のパラメータとしては、例えばジョブ名、ユーザ名、グループ名、アプリ名、要求ノード数および最大実行時間がある。図１３の例ではパラメータが一致する場合は「ＴＲＵＥ」、パラメータが一致しない場合は「ＦＡＬＳＥ」が設定されている。また判定情報１１７には、消費電力予測の予測対象のジョブと予測に用いられるジョブとのパラメータ一致状況に対する、消費電力予測の成功確率がパーセント単位で設定される。

図１４は、推定結果情報の一例を示す図である。推定結果情報１１８には、実行前または実行中のジョブごとの推定消費電力データ１１８ａ，１１８ｂ，・・・が含まれている。推定消費電力データ１１８ａ，１１８ｂ，・・・それぞれには、例えばジョブＩＤ、基準時刻、および基準時刻からの経過時間ごとの推定消費電力が設定されている。

推定消費電力データ１１８ａ，１１８ｂ，・・・のうち、実行前のジョブに関する推定消費電力データには、実行開始からの経過時間ごとの予測の消費電力が設定されている。そのため、実行前のジョブに関する推定消費電力データの基準時刻の欄には、基準時刻が実行開始時刻であることを示す情報（例えば、空欄）が設定される。また推定消費電力データ１１８ａ，１１８ｂ，・・・のうち、実行中のジョブに関する推定消費電力データの基準時刻の欄には、消費電力の予測処理が実行された時刻が設定される。

次に、予測結果補正部１２６による実行前のジョブの推定消費電力の特定方法について説明する。
図１５は、実行前のジョブの推定消費電力の特定方法の一例を示す図である。予測結果補正部１２６は、実行前ジョブ５１ａが投入されたときに、実行前ジョブ５１ａのジョブステイタス情報に基づいて、実行前ジョブ５１ａの推定消費電力を決定する。

まず予測結果補正部１２６は、実行前ジョブ５１ａのジョブステイタス情報のトピック分布と実行済みのジョブそれぞれのジョブステイタス情報のトピック分布との類似度を計算する。予測結果補正部１２６は、算出した類似度が高い順に所定数のジョブを実行前ジョブ５１ａについての類似ジョブリスト（例えば、類似ジョブリスト１１６ａ）に登録する。

次に予測結果補正部１２６は、実行前ジョブ５１ａと類似ジョブリスト１１６ａに登録されたジョブそれぞれとのパラメータの一致状況を特定する。例えば予測結果補正部１２６は、実行前ジョブ５１ａと類似ジョブリスト１１６ａに登録されたジョブそれぞれとで、ジョブステイタス情報に設定されたジョブ名、ユーザ名、グループ名、アプリ名、要求ノード数および最大実行時間が一致するか否かを確認する。予測結果補正部１２６は、特定したパラメータの一致状況に基づいて、類似ジョブリスト１１６ａに登録されたジョブに、実行前ジョブ５１ａの電力の予測成功確率が９５％以上となるジョブ（予測用類似ジョブ）があるか否かを判定する。例えば予測結果補正部１２６は、判定情報１１７を参照し、類似ジョブリスト１１６ａに登録された各ジョブについての実行前ジョブ５１ａとのパラメータの一致状況に対応する予測成功確率を特定する。

そして予測結果補正部１２６は、予測用類似ジョブがあると判定した場合、予測用類似ジョブの電力波形である類似ジョブ電力波形５２を、実行前ジョブ５１ａに対応する推定消費電力データ（例えば、推定消費電力データ１１８ａ）に格納する。また予測結果補正部１２６は、予測用類似ジョブがないと判定した場合、電力が一定値（実行前ジョブ５１ａの最大消費電力）の電力波形５３を推定消費電力データ１１８ａに格納する。

このように予測結果補正部１２６は、実行前ジョブ５１ａの消費電力の予測成功確率が高い場合、予測消費電力を実行前ジョブ５１ａの推定消費電力に決定し、予測成功確率が高くない場合、最大消費電力を実行前ジョブ５１ａの推定消費電力に決定する。

次に、割合調整部１４３による優先度を示すキューの生成方法について説明する。
図１６は、優先度を示すキューの生成方法の一例を示す図である。割合調整部１４３は、実行前ジョブ５１ａ，５１ｂ，・・・の消費電力の予測成功確率に基づいて、実行前ジョブ５１ａ，５１ｂ，・・・の実行される優先度を示す実行用キュー５６を生成する。

割合調整部１４３は、実行前ジョブ５１ａ，５１ｂ，・・・を予測成功確率が高いジョブと予測成功確率が高くないジョブとに分類する。例えば割合調整部１４３は、実行前ジョブ５１ａ，５１ｂ，・・・のうち、予測成功確率が９５％以上となるジョブ（つまり、予測用類似ジョブがあるジョブ）を分類用キュー５４に投入する。また割合調整部１４３は、実行前ジョブ５１ａ，５１ｂ，・・・のうち、予測成功確率が９５％未満となるジョブ（つまり、予測用類似ジョブがないジョブ）を分類用キュー５５に投入する。なお図１６の例では、分類用キュー５４，５５の横の長さは、投入されているジョブの計算ノードの使用量（例えば、要求ノード数×最大実行時間）の合計を示す。

ここで、例えば分類用キュー５４に入ったジョブの「最大実行時間×要求ノード数」の合計：分類用キュー５５に入ったジョブの「最大実行時間×要求ノード数」の合計が、Ｙ１：Ｙ２であったとする。すると割合調整部１４３は、分類用キュー５４から「最大実行時間×要求ノード数」の合計がＹ１×所定値Ｚになるようにジョブを取り出し、取り出したジョブを実行用キュー５６に投入する。また割合調整部１４３は、分類用キュー５５から「最大実行時間×要求ノード数」の合計がＹ２×所定値Ｚになるようにジョブを取り出し、取り出したジョブを実行用キュー５６に投入する。割合調整部１４３は、分類用キュー５４，５５に入ったジョブが無くなるまで、分類用キュー５４，５５から実行用キュー５６へ上記の比率でジョブの投入を行う。

このようにして実行用キュー５６が生成される。なお実行用キュー５６に入ったジョブは、先頭から順に１，２，３，・・・と優先度が設定される。また実行用キュー５６に入ったジョブは、先頭に近いほど優先してスケジューリングされる（つまり、優先度が高い）。このような実行用キュー５６に従ってスケジューリングされることで、予測成功確率が高いジョブと予測成功確率が高くないジョブとが一定の比率で実行されるようになる。

次に、予測結果補正部１２６による実行中のジョブの推定消費電力の特定方法について説明する。
図１７は、実行中のジョブの推定消費電力の特定方法の一例を示す図である。予測結果補正部１２６は、一定の時間間隔で、実行中のジョブの実行中電力波形６１に基づいて、実行中のジョブの推定消費電力を決定する。

まず予測結果補正部１２６は、実行中のジョブの過去の期間の消費電力の予測と実測との誤差を算出する。例えば予測結果補正部１２６は、予測値計算部１２５に、実行中電力波形６１に示される所定時間前（例えば、３０分前）までの消費電力の時系列変化に基づいて、所定時間前から現在までの消費電力の時系列変化を予測させる。そして予測結果補正部１２６は、所定時間前から現在までの消費電力の時系列変化の予測と実行中電力波形６１に示される所定時間前から現在までの消費電力の時系列変化との誤差を算出する。

そして予測結果補正部１２６は、実行中のジョブの過去の期間の消費電力の予測と実測との誤差が実行中のジョブの最大消費電力の１０％未満であると判定した場合、予測値計算部１２５に、現在以降の所定の期間の予測消費電力波形６２を算出させる。予測結果補正部１２６は、実行中のジョブに対応する推定消費電力データ（例えば、推定消費電力データ１１８ｂ）に予測消費電力波形６２を格納する。また予測結果補正部１２６は、誤差が実行中のジョブの最大消費電力の１０％以上であると判定した場合、電力が一定値（実行中のジョブの最大消費電力）の電力波形６３を推定消費電力データ１１８ｂに格納する。

このように予測結果補正部１２６は、実行中のジョブの過去の期間の消費電力を予測できた場合、今後の予測消費電力を今後の推定消費電力に決定し、過去の期間の消費電力を予測できなかった場合、最大消費電力を今後の推定消費電力に決定する。

次に実行中のジョブの消費電力の予測に用いる予測モデルの生成方法について説明する。まず実行中のジョブの消費電力を予測する予測モデルを生成するためのデータセットの生成方法について詳細に説明する。

予測対象期間の電力を予測する学習としては、過去に実行されたすべてのジョブの時系列の電力情報を基に予測モデルを生成することが考えられる。しかし、予測対象期間以前に実行が終了してしまうジョブの時系列電力データは、その予測対象期間の予測モデルの生成に役立たない可能性がある。例えばジョブの実行開始からの経過時間が１２０分〜１５０分の期間の電力を推定するための予測モデルの生成に、実行開始から３０分未満で実行が終了するジョブの時系列電力データは有効ではない。そこで例えば、サンプル作成部１２３は、予測モデルの生成に利用する時系列電力データを、予測対象期間まで実行が継続していたジョブの時系列電力データに限定することができる。

図１８は、データセットの生成例（参考例）を示す図である。図１８の例では、ジョブ消費電力情報１１２に基づいて、「Ｉｎｔｅｒｖａｌ２」の予測対象期間に対応するデータセット３３３が生成されている。

図１８のジョブ消費電力情報１１２では、各ジョブの実行時に測定された電力値が「０」以外の値の場合、該当する測定点の欄に「ｘ」が示されている。またジョブ消費電力情報１１２では、各ジョブの実行終了後の各測定点の欄に「０」が示されている。

図１８からも分かるように、実行時間の長さはジョブごとに異なる。そのため予測モデルの生成に利用する時系列電力データを、予測対象期間まで実行が継続していたジョブの時系列電力データに限定すると、データセットに含まれる電力値の数は、ジョブの実行開始からの予測対象期間までの時間が長くなるほど少なくなる。

例えば「Ｉｎｔｅｒｖａｌ２」の予測対象期間のデータセット３３３は、例えば以下の手順で作成することができる。
図１８の例では「ＪＯＢＡ／Ｂ／Ｃ／Ｄ／Ｅ」は「Ｉｎｔｅｒｖａｌ２」の前にジョブが終了している。これらのジョブは「Ｉｎｔｅｒｖａｌ２」の期間は実行されておらず、これらのジョブの時系列電力データは、「Ｉｎｔｅｒｖａｌ２」の期間中に継続して実行されているジョブの消費電力の予測には、あまり有用ではないと考えることもできる。そのためサンプル作成部１２３は、これらのジョブの電力の測定値は、「Ｉｎｔｅｒｖａｌ２」の予測モデル生成用のデータセット３３３から除外することも可能である。

ただし、実行されるジョブには、「ＪＯＢＦ」のように「Ｉｎｔｅｒｖａｌ２」の期間の開始直後（測定点「１１」経過後、測定点「１２」到達前）に完了しているジョブもある。この「ＪＯＢＦ」と同種のジョブの消費電力を正しく予測するには、データセット３３３内に、「ＪＯＢＦ」と同程度の実行時間で終了するジョブの時系列電力データが多く含まれていることが望ましい。ところが、図１８の例では「Ｉｎｔｅｒｖａｌ２」の期間内に終了しているジョブの時系列電力データが少ない。そのため、データセット３３３を用いて生成した予測モデルでは、「Ｉｎｔｅｒｖａｌ２」の期間内にジョブが終了し、消費電力が「０」となるようなジョブの消費電力の時系列変化を正しく予測することが難しい。

そこでサンプル作成部１２３は、予測対象期間までの所定期間内に終了しているジョブの時系列電力データをデータセットに追加する。例えばサンプル作成部１２３は、「Ｉｎｔｅｒｖａｌｉ」（ｉは１以上の整数）の消費電力の予測に使用するデータセットに、ジョブの終了が測定点「６ｉ−５」以降であるジョブの時系列電力データを含める。以下、図１９〜図２１を参照して、予測対象期間までの所定期間内に終了しているジョブの時系列電力データをデータセットに含む場合の、データセットの生成例について説明する。

図１９は、データセットの第１の生成例を示す図である。図１９の例では、ジョブ消費電力情報１１２に基づいて、「Ｉｎｔｅｒｖａｌ１」（ｉ＝１）の予測対象期間に対応するデータセット１１３ａが生成されている。この場合、サンプル作成部１２３は、測定点「１」（６×１−５）以降に終了するジョブの時系列電力データを、データセット１１３ａに含める。このうち、測定点「０〜５」の電力値が問題データであり、測定点「６〜１１」の電力値が答えデータである。

図２０は、データセットの第２の生成例を示す図である。図２０の例では、ジョブ消費電力情報１１２に基づいて、「Ｉｎｔｅｒｖａｌ２」（ｉ＝２）の予測対象期間に対応するデータセット１１３ｂが生成されている。この場合、サンプル作成部１２３は、測定点「７」（６×２−５）以降に終了するジョブの時系列電力データを、データセット１１３ｂに含める。このうち、測定点「０〜１１」の電力値が問題データであり、測定点「１２〜１７」の電力値が答えデータである。

図２１は、データセットの第３の生成例を示す図である。図２１の例では、ジョブ消費電力情報１１２に基づいて、「Ｉｎｔｅｒｖａｌ３」（ｉ＝３）の予測対象期間に対応するデータセット１１３ｃが生成されている。この場合、サンプル作成部１２３は、測定点「１３」（６×３−５）以降に終了するジョブの時系列電力データを、データセット１１３ｃに含める。このうち、測定点「０〜１７」の電力値が問題データであり、測定点「１８〜２３」の電力値が答えデータである。

サンプル作成部１２３は、図１９〜図２１に示したデータセット１１３ａ，１１３ｂ，１１３ｃと同様に、以降の予測対象期間についてのデータセットを生成する。そしてサンプル作成部１２３は、生成したすべてのデータセットの集合を、サンプルデータ１１３としてＤＢ１１０に格納する。その後、所定のタイミングで、学習部１２４が、サンプルデータ１１３に基づいて、予測対象期間ごとの予測モデルを生成する。

図２２は、予測モデル生成処理の概要を示す図である。例えば学習部１２４は、データセット１１３ａに含まれるジョブごとの時系列電力データ７１，７２，・・・に基づいてＲＮＮによる学習を行い、「Ｉｎｔｅｒｖａｌ１」の予測対象期間の予測用の予測モデル１１４ａを生成する。また学習部１２４は、データセット１１３ｂに含まれるジョブごとの時系列電力データ８１，８２，・・・に基づいてＲＮＮによる学習を行い、「Ｉｎｔｅｒｖａｌ２」の予測対象期間の予測用の予測モデル１１４ｂを生成する。以後同様に、学習部１２４は、他の予測対象期間についても、その予測対象期間のデータセットに基づいてＲＮＮによる学習を行い、その予測対象期間の予測モデルを生成する。

図２３は、予測モデルの一例を示す図である。図２３の例では、１点先から６点先の測定点それぞれの電力を予測する予測モデル１１４ａが示されている。学習部１２４は、実行済みのジョブの時系列電力データを含むデータセット１１３ａを読み込みながら、問題データに基づいて予測対象期間内の消費電力をＲＮＮにより予測する。そして学習部１２４は、予測値と答えデータとの誤差を求め、誤差を減らすような重み値のパラメータを学習する。例えば学習部１２４は、ＢＰＴＴ（Back-Propagation Through Time）アルゴリズムで実測値と予測値との誤差を学習する。ＢＰＴＴは、ニューラルネットワークの重みの時間方向の誤差逆伝播を行うものである。

予測値計算部１２５は、実行中のジョブの消費電力の実測値を取得したとき、図２３に示すような予測モデル１１４ａにより、以後の複数の測定点における予測用類似ジョブの消費電力を予測できる。

次に判定情報の生成処理の手順について説明する。
図２４は、判定情報生成処理の手順の一例を示すフローチャートである。以下、図２４に示す処理をステップ番号に沿って説明する。

［ステップＳ１０１］学習部１２４は、実行済みの各ジョブについてジョブステイタス情報内の出現単語を抽出し、ＬＤＡ推定モデルを用いて単語をトピックに分類する。すなわち学習部１２４は、前述の式（２）を用いて、共通のジョブステイタス情報に出現する確率の高い単語同士を同じグループにグルーピングし、生成されたグループをトピックとする。学習部１２４は、生成したトピックと各トピックに属する単語のリストとを示す学習結果情報１１５をＤＢ１１０に格納する。

［ステップＳ１０２］学習部１２４は、実行済みのジョブを１つ選択する。
［ステップＳ１０３］学習部１２４は、ステップＳ１０２で選択したジョブ（選択ジョブ）との類似度が最も高いジョブを実行済みのジョブの中から特定する。例えば学習部１２４は、学習結果情報１１５に基づいて、実行済みのすべてのジョブのジョブステイタス情報に含まれるトピック分布を算出する。学習部１２４は、算出したトピック分布に基づいて、選択ジョブのトピック分布と、実行済みの他のジョブのトピック分布との類似度を計算する。そして学習部１２４は、算出した類似度が最も高いジョブを特定する。

［ステップＳ１０４］学習部１２４は、選択ジョブとステップＳ１０３で特定したジョブ（特定ジョブ）とのパラメータの一致状況を特定する。例えば学習部１２４は、選択ジョブおよび特定ジョブそれぞれに対応するジョブステイタス情報を取得する。そして学習部１２４は、選択ジョブと特定ジョブとのジョブステイタス情報を参照し、選択ジョブと特定ジョブとでジョブ名、ユーザ名、グループ名、アプリ名、要求ノード数および最大実行時間それぞれが一致するか否かを特定する。

［ステップＳ１０５］学習部１２４は、特定ジョブの消費電力で選択ジョブの消費電力が予測可能か否かを判定する。例えば学習部１２４は、ジョブ消費電力情報１１２を参照し、特定ジョブの消費電力と選択ジョブの消費電力との各測定点での誤差の二乗の平均が所定値以下の場合、特定ジョブの消費電力で選択ジョブの消費電力が予測可能と判定する。学習部１２４は、特定ジョブの消費電力で選択ジョブの消費電力が予測可能と判定した場合、処理をステップＳ１０６に進める。また学習部１２４は、特定ジョブの消費電力で選択ジョブの消費電力が予測不可能と判定した場合、処理をステップＳ１０７に進める。

［ステップＳ１０６］学習部１２４は、ステップＳ１０４で特定したパラメータの一致状況についての成功数と判定数とに１を加算する（成功数＝成功数＋１、判定数＝判定数＋１）。そして処理がステップＳ１０８に進む。

［ステップＳ１０７］学習部１２４は、ステップＳ１０４で特定したパラメータの一致状況についての判定数に１を加算する（判定数＝判定数＋１）。
［ステップＳ１０８］学習部１２４は、実行済みのジョブをすべて選択したか否かを判定する。学習部１２４は、実行済みのジョブをすべて選択したと判定した場合、処理をステップＳ１０９に進める。また学習部１２４は、未選択の実行済みのジョブが残っていると判定した場合、処理をステップＳ１０２に進める。

［ステップＳ１０９］学習部１２４は、パラメータの一致状況ごとに予測成功確率（成功数／判定数）を算出する。そして学習部１２４は、各パラメータの一致状況に対する予測成功確率を示す判定情報１１７を生成し、生成した判定情報１１７をＤＢ１１０に格納する。

このようにして、判定情報１１７が生成される。そして予測結果補正部１２６により、判定情報１１７を用いて、実行前のジョブの消費電力の時系列変化の予測成功確率が特定される。

次に予測モデルの生成処理の手順について具体的に説明する。
図２５は、予測モデル生成処理の手順の一例を示すフローチャートである。以下、図２５に示す処理をステップ番号に沿って説明する。なお予測モデル生成処理は、例えばタイマ部１２１から所定時間間隔で出力される指示に応じて実行される。なお、以下の説明では、ジョブの実行時間の最大値は２４時間であり、予測対象期間の時間幅は３０分であるものとする。この場合、「Ｉｎｔｅｒｖａｌｉ」のｉの上限は「４７」となる。

［ステップＳ１１１］メトリクス収集部１２２は、ＤＢ１３０から、ジョブごとの時系列電力データを取得する。メトリクス収集部１２２は、取得した時系列電力データを、ジョブ消費電力情報１１２としてＤＢ１１０に格納する。この際、メトリクス収集部１２２は、ジョブ実行期間の最大値までの測定点のうち、計測されていない測定点の電力値はすべて「０」とする。

［ステップＳ１１２］サンプル作成部１２３は、変数ｉに初期値「１」を設定する。
［ステップＳ１１３］サンプル作成部１２３は、ＤＢ１１０内のジョブ消費電力情報１１２から、実行終了までの測定点「６ｉ−５」以上のジョブの時系列電力データを抽出する。

［ステップＳ１１４］サンプル作成部１２３は、ステップＳ１１３で抽出した時系列電力データに基づいて、「Ｉｎｔｅｒｖａｌｉ」の予測対象期間（測定点「６ｉ〜６ｉ＋５」）を予測するモデルを作るための、学習用のデータセットを作成する。例えばサンプル作成部１２３は、測定点「０〜６ｉ−１」の電力値を問題データとし、測定点「６ｉ〜６ｉ＋５」の電力値を答えデータとするデータセットを生成する。サンプル作成部１２３は、生成したデータセットをＤＢ１１０に格納する。

［ステップＳ１１５］学習部１２４は、ステップＳ１１４で作成したデータセットを用いて、ＲＮＮにより「Ｉｎｔｅｒｖａｌｉ」の予測対象期間の予測モデルを学習する。学習部１２４は、学習した予測モデルをＤＢ１１０に格納する。

［ステップＳ１１６］サンプル作成部１２３は、変数ｉに１を加算する（ｉ＝ｉ＋１）。
［ステップＳ１１７］サンプル作成部１２３は、ｉの値が上限（例えば「４７」）を超えたか否かを判定する。サンプル作成部１２３は、ｉの値が上限を超えた場合、処理を終了する。またサンプル作成部１２３は、ｉの値が上限を超えていなければ、処理をステップＳ１１３に進める。

このようにして、予測対象期間ごとの予測モデルが生成される。そして予測値計算部１２５により、予測モデルを用いて、実行中のジョブの以後の所定期間（例えば３０分）の消費電力の時系列変化の予測値が計算される。

次に実行前のジョブの電力推定処理の手順について具体的に説明する。
図２６は、実行前電力推定処理の手順の一例を示すフローチャートである。以下、図２６に示す処理をステップ番号に沿って説明する。なお実行前電力推定処理は、例えば新しくジョブが投入されたときに実行される。

［ステップＳ１２１］予測結果補正部１２６は、新しく投入されたジョブ（新規投入ジョブ）のジョブステイタス情報を取得する。
［ステップＳ１２２］予測結果補正部１２６は、学習結果情報１１５に基づいて、新規投入ジョブのジョブステイタス情報に含まれるトピック分布を算出する。

［ステップＳ１２３］予測結果補正部１２６は、新規投入ジョブとの類似度が高い所定数のジョブを実行済みのジョブの中から特定する。例えば予測結果補正部１２６は、ステップＳ１２２で算出したトピック分布に基づいて、実行済みのジョブのトピック分布との類似度を計算する。予測結果補正部１２６は、算出した類似度が高い順に所定数のジョブを特定する。そして予測結果補正部１２６は、特定した所定数のジョブのジョブＩＤを登録した類似ジョブリスト（例えば、類似ジョブリスト１１６ａ）をＤＢ１１０に格納する。

［ステップＳ１２４］予測結果補正部１２６は、新規投入ジョブとステップＳ１２３で特定されたジョブ（類似ジョブ）とのパラメータの一致状況を特定する。例えば予測結果補正部１２６は、類似ジョブリスト１１６ａに登録された類似ジョブに対応するジョブステイタス情報を取得する。そして予測結果補正部１２６は、新規投入ジョブと類似ジョブとのジョブステイタス情報を参照し、新規投入ジョブと類似ジョブとでジョブ名、ユーザ名、グループ名、アプリ名、要求ノード数および最大実行時間それぞれが一致するか否かを特定する。

［ステップＳ１２５］予測結果補正部１２６は、新規投入ジョブの電力の予測成功確率が９５％以上となる類似ジョブがあるか否かを判定する。例えば予測結果補正部１２６は、判定情報１１７を参照し、各類似ジョブについての新規投入ジョブとのパラメータの一致状況に対応する予測成功確率を特定する。そして予測結果補正部１２６は、特定した予測成功確率が９５％以上となる類似ジョブがあったか否かを判定する。予測結果補正部１２６は、新規投入ジョブの電力の予測成功確率が９５％以上となる類似ジョブがあると判定した場合、処理をステップＳ１２６に進める。また予測結果補正部１２６は、新規投入ジョブの電力の予測成功確率が９５％以上となる類似ジョブがないと判定した場合、処理をステップＳ１２８に進める。

［ステップＳ１２６］予測結果補正部１２６は、新規投入ジョブの電力の予測成功確率が９５％以上となる類似ジョブ（予測用類似ジョブ）の電力の１１０％が新規投入ジョブの最大消費電力未満であるか否かを判定する。例えば予測結果補正部１２６は、ジョブ消費電力情報１１２に示される予測用類似ジョブの各測定点での電力の１１０％が、新規投入ジョブの要求ノード数×１ノードの定格消費電力未満であるか否かを判定する。なお予測結果補正部１２６は、新規投入ジョブの電力の予測成功確率が９５％以上となる複数の類似ジョブがある場合、予測成功確率が９５％以上となる複数の類似ジョブのうち、新規投入ジョブとの類似度が最も大きいものを予測用類似ジョブとする。

予測結果補正部１２６は、予測用類似ジョブの電力の１１０％が新規投入ジョブの最大消費電力未満であると判定した場合、処理をステップＳ１２７に進める。また予測結果補正部１２６は、予測用類似ジョブの電力の１１０％が新規投入ジョブの最大消費電力以上であると判定した場合、処理をステップＳ１２８に進める。

［ステップＳ１２７］予測結果補正部１２６は、予測用類似ジョブの電力の１１０％を新規投入ジョブの推定消費電力とする。例えば予測結果補正部１２６は、新規投入ジョブに対応する推定消費電力データ（例えば、推定消費電力データ１１８ａ）を生成する。予測結果補正部１２６は、推定消費電力データ１１８ａのジョブＩＤの欄に新規投入ジョブのジョブＩＤを設定し、基準時刻の欄を空欄に設定する。また予測結果補正部１２６は、推定消費電力データ１１８ａの消費電力の欄に、ジョブ消費電力情報１１２に示される予測用類似ジョブの各測定点での電力の１１０％を設定する。そして予測結果補正部１２６は、推定消費電力データ１１８ａをＤＢ１１０に格納する。そして処理が終了する。

［ステップＳ１２８］予測結果補正部１２６は、新規投入ジョブの最大消費電力を新規投入ジョブの推定消費電力とする。例えば予測結果補正部１２６は、推定消費電力データ１１８ａのジョブＩＤの欄に新規投入ジョブのジョブＩＤを設定し、基準時刻の欄を空欄に設定する。また予測結果補正部１２６は、推定消費電力データ１１８ａの消費電力の欄に、新規投入ジョブの要求ノード数×１ノードの定格消費電力を設定する。そして予測結果補正部１２６は、推定消費電力データ１１８ａをＤＢ１１０に格納する。

このようにして、新規投入ジョブのスケジューリングにおける推定消費電力を示す推定消費電力データ１１８ａが生成される。予測結果補正部１２６は、判定情報１１７に基づいて、新規投入ジョブの電力を予測用類似ジョブの電力で予測した場合の予測成功確率が所定値（９５％）以上か否かを判定する。予測成功確率が所定値以上の場合、予測結果補正部１２６は、予測用類似ジョブの電力を新規投入ジョブのスケジューリングにおける推定消費電力とする。これにより新規投入ジョブのスケジューリングにおける推定消費電力は小さくなる。ジョブのスケジューリングにおける推定消費電力が小さくなると、ＨＰＣシステム３０で実行されるジョブの数が増加する。よってＨＰＣシステム３０の電力効率が向上する。

また予測成功確率が所定値未満の場合、予測結果補正部１２６は、新規投入ジョブの最大消費電力を新規投入ジョブのスケジューリングにおける推定消費電力とする。すると、新規投入ジョブの電力予測が困難である場合でも、新規投入ジョブが実行された場合の実際の電力より大きい推定消費電力を設定できるようになる。これによりＨＰＣシステム３０全体の定格消費電力を超えないようなスケジューリングができる。

次にジョブの実行割合調整処理の手順について具体的に説明する。
図２７は、実行割合調整処理の手順の一例を示すフローチャートである。以下、図２７に示す処理をステップ番号に沿って説明する。なお実行割合調整処理は、例えばタイマ部１４１から所定時間間隔で出力される指示に応じて実行される。

［ステップＳ１３１］割合調整部１４３は、実行前のジョブのうち予測成功確率９５％以上のジョブを分類用キュー５４に投入し、実行前のジョブのうち予測成功確率９５％未満のジョブを分類用キュー５５に投入する。

［ステップＳ１３２］割合調整部１４３は、分類用キュー５４，５５それぞれに入ったジョブの「最大実行時間×要求ノード数」の合計を算出する。
［ステップＳ１３３］割合調整部１４３は、分類用キュー５４，５５に入ったジョブの「最大実行時間×要求ノード数」の合計の比率に基づいて、分類用キュー５４，５５それぞれから実行用キュー５６にジョブを投入する。例えば分類用キュー５４に入ったジョブの「最大実行時間×要求ノード数」の合計：分類用キュー５５に入ったジョブの「最大実行時間×要求ノード数」の合計が、Ｙ１：Ｙ２であったとする。割合調整部１４３は、分類用キュー５４から「最大実行時間×要求ノード数」の合計がＹ１×所定値Ｚになるようにジョブを取り出し、取り出したジョブを実行用キュー５６に投入する。また割合調整部１４３は、分類用キュー５５から「最大実行時間×要求ノード数」の合計がＹ２×所定値Ｚになるようにジョブを取り出し、取り出したジョブを実行用キュー５６に投入する。

［ステップＳ１３４］割合調整部１４３は、分類用キュー５４，５５に入ったすべてのジョブを実行用キュー５６に投入したか否かを判定する。割合調整部１４３は、分類用キュー５４，５５に入ったすべてのジョブを実行用キュー５６に投入したと判定した場合、処理を終了する。また割合調整部１４３は、分類用キュー５４，５５に入ったすべてのジョブを実行用キュー５６に投入していないと判定した場合、処理をステップＳ１３３に進める。

このように割合調整部１４３は、実行前のジョブを予測成功確率に応じて、分類用キュー５４，５５に投入する。そして割合調整部１４３は、分類用キュー５４，５５それぞれに入ったジョブの「最大実行時間×要求ノード数」（つまり、計算ノード３１，３２，・・・の使用量）の比率に応じて、分類用キュー５４，５５に入ったジョブを実行用キュー５６に投入する。これにより、予測成功確率が高いジョブと予測成功確率が高くないジョブとが一定の比率でスケジューリングされるようになる。ここで予測成功確率が高いジョブの推定消費電力には予測消費電力が用いられ、予測成功確率が高くないジョブの推定消費電力にはジョブの最大消費電力が用いられる。ジョブの最大消費電力は予測消費電力より大きいため、予測成功確率が高くないジョブの実行比率が偏るとＨＰＣシステム３０で実行できるジョブの数が少なくなる。そこで割合調整部１４３は、予測成功確率が高いジョブと予測成功確率が高くないジョブとが一定の比率でスケジューリングされるようにすることで、ＨＰＣシステム３０で実行されるジョブの数を増加させる。これにより、ＨＰＣシステム３０の電力効率を向上する。

次に実行中のジョブの電力推定処理の手順について具体的に説明する。
図２８は、実行中電力推定処理の手順の一例を示すフローチャートである。以下、図２８に示す処理をステップ番号に沿って説明する。なお実行中電力推定処理は、例えば新しくジョブが実行されたときに、ジョブごとに実行される。

［ステップＳ１４１］予測値計算部１２５は、新たに実行が開始されたジョブを推定対象ジョブとする。そして予測値計算部１２５は、推定対象ジョブの実行開始から３０分待機する。待機時間の３０分は、例えばタイマ部１２１で測定される。この場合、予測値計算部１２５は、タイマ部１２１からの３０分経過の通知を受けて、次のステップＳ１４２に処理を進める。

［ステップＳ１４２］予測値計算部１２５は、推定対象ジョブが終了したか否かを判断する。例えば予測値計算部１２５は、推定対象ジョブの消費電力が「０」になった場合、そのジョブが終了したと判断することができる。予測値計算部１２５は、推定対象ジョブが終了した場合、処理を終了する。また予測値計算部１２５は、推定対象ジョブが終了していなければ、処理をステップＳ１４３に進める。

［ステップＳ１４３］メトリクス収集部１２２は、ＤＢ１３０から、推定対象ジョブの時系列電力データを取得する。そしてメトリクス収集部１２２は、取得した時系列電力データをＤＢ１１０に格納する。この際、メトリクス収集部１２２は、電力情報がない期間（現在からジョブ実行最大長まで）の測定点には、すべて電力値「０」を設定する。またメトリクス収集部１２２は、ジョブがすでに完了した場合も、ジョブ終了後のジョブ実行最大長までの測定点には、すべて電力値「０」を設定する。

［ステップＳ１４４］予測値計算部１２５は、１つ前の期間の予測消費電力を算出する。例えば推定対象ジョブの実行開始から３０ｉ分経過していた場合、予測値計算部１２５は、「Ｉｎｔｅｒｖａｌ（ｉ−１）」を予測対象期間とする。そして予測値計算部１２５は、予測対象期間用の予測モデルにより、３０分前から現在までの推定対象ジョブの一定時間間隔の測定点（例えば５分間隔の６点）の消費電力を予測する。例えば予測値計算部１２５は、推定対象ジョブの時系列電力データに示される測定点「０〜６（ｉ−１）−１」の電力値に基づいて、測定点「６（ｉ−１）〜６（ｉ−１）＋５」の６点の消費電力を予測する。

なおｉ＝１の場合、予測モデルを用いた３０分前から現在までの予測対象ジョブの消費電力予測ができないため、予測値計算部１２５は、過去に実行されたジョブに基づいて、３０分前から現在までの予測対象ジョブの消費電力を予測してもよい。例えば予測値計算部１２５は、図２６に示した実行前電力推定処理で推定対象ジョブの電力推定に用いられた予測用類似ジョブの実行開始から実行開始後３０分までの電力を、推定対象ジョブの予測消費電力とする。

［ステップＳ１４５］予測結果補正部１２６は、ステップＳ１４４で算出した１つ前の期間の予測消費電力と実際の消費電力（実測消費電力）との誤差が推定対象ジョブの最大消費電力の１０％未満であるか否かを判定する。例えば予測結果補正部１２６は、３０分前から現在までの推定対象ジョブの一定時間間隔のすべての測定点において、予測消費電力と実測消費電力との誤差が推定対象ジョブの要求ノード数×１ノードの定格消費電力未満であるか否かを判定する。予測結果補正部１２６は、１つ前の期間の予測消費電力と実測消費電力との誤差が推定対象ジョブの最大消費電力の１０％未満であると判定した場合、処理をステップＳ１４６に進める。また予測結果補正部１２６は、１つ前の期間の予測消費電力と実測消費電力との誤差が推定対象ジョブの最大消費電力の１０％以上であると判定した場合、処理をステップＳ１４９に進める。

［ステップＳ１４６］予測値計算部１２５は、次の期間の予測消費電力を算出する。例えば推定対象ジョブの実行開始から３０ｉ分経過していた場合、予測値計算部１２５は、「Ｉｎｔｅｒｖａｌｉ」を予測対象期間とする。そして予測値計算部１２５は、予測対象期間用の予測モデルにより、現在から３０分後までの推定対象ジョブの一定時間間隔の測定点の消費電力を予測する。例えば予測値計算部１２５は、推定対象ジョブの時系列電力データに示される測定点「０〜６ｉ−１」の電力値に基づいて、測定点「６ｉ〜６ｉ＋５」の６点の消費電力を予測する。

［ステップＳ１４７］予測結果補正部１２６は、ステップＳ１４６で算出した次の期間の予測消費電力の１１０％が推定対象ジョブの最大消費電力未満であるか否かを判定する。例えば予測結果補正部１２６は、測定点「６ｉ〜６ｉ＋５」の予測消費電力の１１０％が、推定対象ジョブの要求ノード数×１ノードの定格消費電力未満であるか否かを判定する。予測結果補正部１２６は、次の期間の予測消費電力の１１０％が推定対象ジョブの最大消費電力未満であると判定した場合、処理をステップＳ１４８に進める。また予測結果補正部１２６は、次の期間の予測消費電力の１１０％が推定対象ジョブの最大消費電力以上であると判定した場合、処理をステップＳ１４９に進める。

［ステップＳ１４８］予測結果補正部１２６は、ステップＳ１４６で算出した次の期間の予測消費電力の１１０％を推定対象ジョブの次の期間の推定消費電力とする。例えば予測結果補正部１２６は、推定対象ジョブに対応する推定消費電力データ（例えば、推定消費電力データ１１８ｂ）の基準時刻の欄に現在の時刻を設定する。また予測結果補正部１２６は、推定消費電力データ１１８ｂの消費電力の欄に、５分後から３０分後の５分間隔の経過時間それぞれに対応付けて、測定点「６ｉ〜６ｉ＋５」それぞれの予測消費電力の１１０％を設定する。そして処理がステップＳ１４１に進む。

［ステップＳ１４９］予測結果補正部１２６は、推定対象ジョブの最大消費電力を推定対象ジョブの次の期間の推定消費電力とする。例えば予測結果補正部１２６は、推定消費電力データ１１８ｂの基準時刻の欄に現在の時刻を設定する。また予測結果補正部１２６は、推定消費電力データ１１８ｂの消費電力の欄に、５分後から３０分後の５分間隔の経過時間それぞれに対応付けて、推定対象ジョブの要求ノード数×１ノードの定格消費電力を設定する。そして処理がステップＳ１４１に進む。

このようにして、実行中のジョブのスケジューリングにおける電力が推定される。予測結果補正部１２６は、１つ前の期間の推定対象ジョブの予測消費電力と実測消費電力との誤差が所定値未満であるか否かを判定する。誤差が閾値未満の場合、推定対象ジョブの今後の消費電力も予測できる可能性が高い。そこで予測結果補正部１２６は、次の期間の推定対象ジョブの予測消費電力を、推定対象ジョブのスケジューリングにおける推定消費電力とする。これにより推定対象ジョブのスケジューリングにおける推定消費電力は小さくなり、ＨＰＣシステム３０で実行されるジョブの数が増加する。よってＨＰＣシステム３０の電力効率が向上する。

また誤差が閾値未満の場合、推定対象ジョブの今後の消費電力を予測できる可能性が低い。そこで予測結果補正部１２６は、推定対象ジョブの最大消費電力を推定対象ジョブのスケジューリングにおける推定消費電力とする。すると、推定対象ジョブの電力予測が困難である場合でも、実際の電力より大きい推定消費電力を設定できるようになる。これによりＨＰＣシステム３０全体の定格消費電力を超えないようなスケジューリングができる。

なお予測値計算部１２５は、実行開始から予測対象期間までの消費電力に基づいて予測消費電力を算出する。そのため予測に用いられるデータは、実行が進むにつれて増えていくため、予測精度も実行が進むにつれて向上する。よって予測結果補正部１２６は、推定対象ジョブの実行が進むにつれて推定消費電力を低く抑えやすくなる。

次にジョブスケジューリング処理の手順について具体的に説明する。
図２９は、ジョブスケジューリング処理の手順の一例を示すフローチャートである。以下、図２９に示す処理をステップ番号に沿って説明する。なおジョブスケジューリング処理は、例えばジョブの実行が開始されたときまたは終了したときに実行される。

［ステップＳ１５１］ジョブスケジューリング部１４４は、ジョブの実行状況をロードする。例えばジョブスケジューリング部１４４は、ＤＢ１１０に記憶されたＨＰＣ３０が実行前のジョブおよび実行中のジョブの情報を割合調整部１４３を介して取得する。またジョブスケジューリング部１４４は、割合調整部１４３が生成した実行用キュー５６を取得する。

［ステップＳ１５２］ジョブスケジューリング部１４４は、変数Ｘに初期値「１」を設定する。
［ステップＳ１５３］ジョブスケジューリング部１４４は、実行用キュー５６に入っている優先度Ｘのジョブを実行する空ノードがあるか否かを判定する。例えばジョブスケジューリング部１４４は、ジョブステイタス情報を参照し、優先度Ｘのジョブ、実行中のすべてのジョブおよびスケジューリング済みのすべてのジョブそれぞれの要求ノード数を特定する。ジョブスケジューリング部１４４は、優先度Ｘのジョブ、実行中のすべてのジョブおよびスケジューリング済みのすべてのジョブの要求ノード数の合計が、ＨＰＣシステム３０の計算ノードの数以下の場合、優先度Ｘのジョブを実行する空ノードがあると判定する。

ジョブスケジューリング部１４４は、優先度Ｘのジョブを実行する空ノードがあると判定した場合、処理をステップＳ１５４に進める。またジョブスケジューリング部１４４は、優先度Ｘのジョブを実行する空ノードがないと判定した場合、処理をステップＳ１５６に進める。

［ステップＳ１５４］ジョブスケジューリング部１４４は、優先度Ｘのジョブをスケジューリングした場合の推定消費電力の合計がＨＰＣシステム３０全体の定格消費電力より小さいか否かを判定する。例えばジョブスケジューリング部１４４は、推定消費電力データを参照し、優先度Ｘのジョブ、実行中のすべてのジョブおよびスケジューリング済みのすべてのジョブそれぞれの現在以降の電力波形を取得する。ジョブスケジューリング部１４４は、取得した電力波形を積算した電力波形がＨＰＣシステム３０全体の定格消費電力以上となる時間がない場合、推定消費電力の合計がＨＰＣシステム３０全体の定格消費電力より小さいと判定する。

ジョブスケジューリング部１４４は、推定消費電力の合計がＨＰＣシステム３０全体の定格消費電力より小さいと判定した場合、処理をステップＳ１５５に進める。またジョブスケジューリング部１４４は、推定消費電力の合計がＨＰＣシステム３０全体の定格消費電力以上と判定した場合、処理をステップＳ１５６に進める。

［ステップＳ１５５］ジョブスケジューリング部１４４は、優先度Ｘのジョブをスケジューリングする。
［ステップＳ１５６］ジョブスケジューリング部１４４は、変数Ｘが実行用キュー５６に入っている待ちジョブ数と等しいか否かを判定する。ジョブスケジューリング部１４４は、変数Ｘが待ちジョブ数と等しい場合、処理をステップＳ１５８に進める。ジョブスケジューリング部１４４は、変数Ｘが待ちジョブ数と等しくない場合、処理をステップＳ１５７に進める。

［ステップＳ１５７］ジョブスケジューリング部１４４は、変数Ｘに１を加算する（Ｘ＝Ｘ＋１）。そして処理がステップＳ１５３に進む。
［ステップＳ１５８］制御指示部１４５は、スケジュールに従ってＨＰＣシステム３０にジョブの実行を指示する。

このようにしてＨＰＣシステム３０全体の定格消費電力を超えないようにスケジューリングが行われる。次に、上記のスケジューリング方法とＨＰＣシステム３０全体の定格消費電力を超えないように、ＨＰＣシステム３０にジョブを実行させる他の技術であるＰｏｗｅｒ−Ｃａｐｐｉｎｇとを比較する。

図３０は、スケジューリング方法の比較例を示す図である。Ｐｏｗｅｒ−Ｃａｐｐｉｎｇを用いてジョブを実行した結果である実行結果９０ａと、ＨＰＣシステム３０全体の定格消費電力を超えないようにスケジューリングして、ジョブを実行した結果である実行結果９０ｂとを比較する。

Ｐｏｗｅｒ−Ｃａｐｐｉｎｇは、ノード毎に電力制約をすることによって、ＨＰＣシステム３０全体の消費電力がＰｏｗｅｒ−Ｃａｐｐｉｎｇ値（例えば、ＨＰＣシステム３０全体の定格消費電力）を超過しないように制御するものである。ＨＰＣシステム３０にＰｏｗｅｒ−Ｃａｐｐｉｎｇを用いた実行結果９０ａでは、ＨＰＣシステム３０は、前半にジョブＡとジョブＢとジョブＣとを実行し、後半にジョブＤとジョブＥとを実行している。ここでＨＰＣシステム３０は、Ｐｏｗｅｒ−ＣａｐｐｉｎｇによってジョブＡ、ジョブＢおよびジョブＣそれぞれを実行するための消費電力を制限することで、ＨＰＣシステム３０全体の定格消費電力を超過しないようにジョブを実行している。そのため実行結果９０ａでは、ジョブ（例えば、ジョブＣ）の実行時間が長くなっている。

ＨＰＣシステム３０全体の定格消費電力を超えないようにスケジューリングした実行結果９０ｂでは、ＨＰＣシステム３０は、前半にジョブＡとジョブＢとを実行し、後半にジョブＣとジョブＤとジョブＥとを実行している。これにより実行結果９０ｂでは、ＨＰＣシステム３０は、各ジョブを実行するための消費電力を制限することなく、ＨＰＣシステム３０全体の定格消費電力を超過しないようにジョブを実行できる。

このように、第２の実施の形態に示すジョブスケジューリングによって、ＨＰＣシステム３０全体のターンアラウンドタイム（ＴＡＴ）を短縮することができる。
以上、実施の形態を例示したが、実施の形態で示した各部の構成は同様の機能を有する他のものに置換することができる。また、他の任意の構成物や工程が付加されてもよい。さらに、前述した実施の形態のうちの任意の２以上の構成（特徴）を組み合わせたものであってもよい。

１ＨＰＣシステム
１ａ，１ｂ，１ｃ，・・・計算ノード
２第１ジョブ
３ａ，３ｂ，・・・第４ジョブ
４第３ジョブ
１０情報処理装置
１１記憶部
１１ａ判定情報
１２処理部

Claims

コンピュータに、
実行中の第１ジョブの現在以前の第１期間における消費電力を、前記第１期間より前の情報に基づいて予測した第１予測消費電力を算出し、
前記第１ジョブの前記第１期間における消費電力と前記第１予測消費電力との誤差が閾値未満の場合、複数の計算ノードへ割り当てられる前記第１ジョブを含む１以上の第２ジョブそれぞれの現在以降の第２期間における推定消費電力の合計が、所定の第１電力を超えないよう前記１以上の第２ジョブを前記複数の計算ノードに割り当てるスケジューリングの際の、前記第１ジョブの前記第２期間における推定消費電力を、前記第２期間に前記第１ジョブが実行された場合の消費電力を予測した第２予測消費電力に決定し、
前記誤差が閾値以上の場合、前記スケジューリングの際の、前記第１ジョブの前記第２期間における推定消費電力を所定の第２電力に決定する、
処理を実行させるジョブスケジューリングプログラム。
前記第１電力は、前記複数の計算ノード全体の定格消費電力に基づいて決定される、
請求項１記載のジョブスケジューリングプログラム。
前記第２電力は、前記複数の計算ノードのうち前記第１ジョブに割り当てられた１以上の第１計算ノードそれぞれのノードごとの定格消費電力の合計に基づいて決定される、
請求項１または２記載のジョブスケジューリングプログラム。
前記第１予測消費電力の算出では、前記第１ジョブが実行を開始してから前記第１期間開始までの前記第１ジョブの消費電力の時間変化に基づいて、前記第１期間における前記第１ジョブの消費電力の時間変化を前記第１予測消費電力として算出し、
前記誤差が閾値未満の場合の前記第１ジョブの前記第２期間における推定消費電力の決定では、前記第１ジョブが実行を開始してから前記第２期間開始までの消費電力の時間変化に基づいて、前記第２期間における前記第１ジョブの消費電力の時間変化を予測した前記第２予測消費電力を前記第１ジョブの前記第２期間における推定消費電力に決定する、
請求項１ないし３のいずれかに記載のジョブスケジューリングプログラム。
前記コンピュータにさらに、実行前の第３ジョブを前記複数の計算ノードのうちの１以上の第２計算ノードに割り当てた場合の前記第２期間における消費電力の第１予測成功確率を算出し、
前記第１予測成功確率が所定値以上の場合、前記スケジューリングの際の、前記第３ジョブの前記第２期間における推定消費電力を、前記第２期間に前記第３ジョブが実行された場合の消費電力を予測した第３予測消費電力に決定し、
前記第１予測成功確率が所定値未満の場合、前記スケジューリングの際の、前記第３ジョブの前記第２期間における推定消費電力を、前記１以上の第２計算ノードの定格消費電力の合計に基づいて決定される第３電力に決定させる、
請求項１ないし４のいずれかに記載のジョブスケジューリングプログラム。
前記コンピュータにさらに、複数の前記第３ジョブのうち、前記第１予測成功確率が所定値以上となる前記第３ジョブの前記複数の計算ノードの使用量と複数の前記第３ジョブのうち、前記第１予測成功確率が所定値未満となる前記第３ジョブの前記複数の計算ノードの使用量との比率に基づいて、複数の前記第３ジョブそれぞれの前記スケジューリングの際の前記複数の計算ノードに割り当てられる優先度を決定させる、
請求項５記載のジョブスケジューリングプログラム。
前記第１予測成功確率の算出では、実行が終了した複数の第４ジョブそれぞれの消費電力を前記複数の第４ジョブのうちの他のジョブを用いて予測した場合の、予測に用いられたジョブとのパラメータの一致状況に対する第２予測成功確率を示す判定情報に基づいて特定される、前記第３ジョブと前記複数の第４ジョブのうちの第５ジョブとのパラメータの一致状況に対応する前記第２予測成功確率を前記第１予測成功確率として算出し、
前記第１予測成功確率が所定値以上の場合の前記第３ジョブの前記第２期間における推定消費電力の決定では、前記第５ジョブが過去に実行された際の消費電力に基づいて前記第２期間に前記第３ジョブが実行された場合の消費電力を予測した前記第３予測消費電力を前記第３ジョブの前記第２期間における推定消費電力に決定する、
請求項５または６記載のジョブスケジューリングプログラム。
実行中の第１ジョブの現在以前の第１期間における消費電力を、前記第１期間より前の情報に基づいて予測した第１予測消費電力を算出し、前記第１ジョブの前記第１期間における消費電力と前記第１予測消費電力との誤差が閾値未満の場合、複数の計算ノードへ割り当てられる前記第１ジョブを含む１以上の第２ジョブそれぞれの現在以降の第２期間における推定消費電力の合計が、所定の第１電力を超えないよう前記１以上の第２ジョブを前記複数の計算ノードに割り当てるスケジューリングの際の、前記第１ジョブの前記第２期間における推定消費電力を、前記第２期間に前記第１ジョブが実行された場合の消費電力を予測した第２予測消費電力に決定し、前記誤差が閾値以上の場合、前記スケジューリングの際の、前記第１ジョブの前記第２期間における推定消費電力を所定の第２電力に決定する処理部、
を有する情報処理装置。
コンピュータが、
実行中の第１ジョブの現在以前の第１期間における消費電力を、前記第１期間より前の情報に基づいて予測した第１予測消費電力を算出し、
前記第１ジョブの前記第１期間における消費電力と前記第１予測消費電力との誤差が閾値未満の場合、複数の計算ノードへ割り当てられる前記第１ジョブを含む１以上の第２ジョブそれぞれの現在以降の第２期間における推定消費電力の合計が、所定の第１電力を超えないよう前記１以上の第２ジョブを前記複数の計算ノードに割り当てるスケジューリングの際の、前記第１ジョブの前記第２期間における推定消費電力を、前記第２期間に前記第１ジョブが実行された場合の消費電力を予測した第２予測消費電力に決定し、
前記誤差が閾値以上の場合、前記スケジューリングの際の、前記第１ジョブの前記第２期間における推定消費電力を所定の第２電力に決定する、
ジョブスケジューリング方法。