JP2015118705A - コンピュータ・システムにおいてジョブを実行する方法、資源マネージャおよび高性能コンピュータ・システム - Google Patents
コンピュータ・システムにおいてジョブを実行する方法、資源マネージャおよび高性能コンピュータ・システム Download PDFInfo
- Publication number
- JP2015118705A JP2015118705A JP2014249650A JP2014249650A JP2015118705A JP 2015118705 A JP2015118705 A JP 2015118705A JP 2014249650 A JP2014249650 A JP 2014249650A JP 2014249650 A JP2014249650 A JP 2014249650A JP 2015118705 A JP2015118705 A JP 2015118705A
- Authority
- JP
- Japan
- Prior art keywords
- job
- execution
- computer system
- configuration
- resource manager
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5094—Allocation of resources, e.g. of the central processing unit [CPU] where the allocation takes into account power or heat criteria
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3409—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/302—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3409—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
- G06F11/3428—Benchmarking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/40—Transformation of program code
- G06F8/41—Compilation
- G06F8/44—Encoding
- G06F8/443—Optimisation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02B—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO BUILDINGS, e.g. HOUSING, HOUSE APPLIANCES OR RELATED END-USER APPLICATIONS
- Y02B70/00—Technologies for an efficient end-user side electric power management and consumption
- Y02B70/10—Technologies improving the efficiency by using switched-mode power supplies [SMPS], i.e. efficient power electronics conversion e.g. power factor correction or reduction of losses in power supplies or efficient standby modes
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
【解決手段】複数の異なる許容される構成を有するコンピュータ・システムにおいてジョブを実行する方法であって:ジョブを受領する段階と;前記ジョブの一つまたは複数の代表的なサンプルを同定する段階と;実験フェーズにおいて前記一つまたは複数の代表的なサンプルを実行する段階であって、当該または各代表的なサンプルは、前記コンピュータ・クラスターのそれぞれの異なる許容される構成を用いて実行される、段階と;前記一つまたは複数の代表的なサンプルの実行中に各構成における実行速度および使用されるエネルギーを含む実行データを収集する段階と;実行速度およびエネルギー使用を考慮に入れて前記ジョブについての好適な構成を選択する段階と;完了フェーズにおいて、前記ジョブの残りを前記好適な構成を用いて実行する段階とを含む、方法。
【選択図】図2
Description
上記で論じたように、資源マネージャは、アプリケーションの外からは、エネルギー効率のために最適な設定が何であるかを知ることができない。他方、ひとたび構成オプションのセットが選ばれたら、アプリケーションのその実行のエネルギー性能特性は本質的には決定される。
・資源マネージャが、実行すべきジョブを受け取る。このジョブは一つまたは複数のアプリケーションを初期化ファイルとともに有する。
・資源マネージャは後述する技法の一つを使って好適なプローブを同定する。プローブとは、全体的なジョブのエネルギー使用特性を表わす、全体的なジョブの小さなセクションである。よって、ここでは、プローブは代表的なサンプルとも称される。
・資源マネージャは、許容される構成のそれぞれと取り合わせたプローブのそれぞれを実行し、提出されたジョブの残りの部分のために使用すべき最良の構成を決定する。
以下の諸セクションは、種々の状況において使用されうる代表的なサンプルおよびその同定法のさらなる詳細を与える。
HPCジョブは、同じ実行可能形式を異なる入力値をもって実行させる、大きな諸グループにおいて提出されることができる。これを行なう理由は、可能な解の範囲を調査することである。すなわち、天気予報では入力条件の小さな変化に対する感度を試験し、工学では一組のパラメータの最適な組み合わせを見出す。これらのグループまたは「サブジョブ・アレイ」においては、同じ実行可能形式が、ほとんど同一の初期値を用いて多数回実行される。したがって、アルゴリズム選択および問題サイズが同じとなるので、アレイ内で提出されるすべてのサブジョブについての実行特性は非常に似通っているであろうと安全に想定できる。結果として、各メンバー・ジョブの実行時間は非常に似通っているであろう。サブジョブ・アレイが合理的な数、たとえば50ないし100のメンバーをもつ場合、資源マネージャは、その特定の実行可能形式および構成についての最適な設定を見出すために、アレイのメンバーのいくつかの実験的な実行を使うことができる。すなわち、メンバー・ジョブの最初の若干数(プローブ)について設定を変えて、最もエネルギー効率のよい構成を見出し、その構成を残っているメンバー・ジョブすべてに適用することができる。
いくつかのHPCジョブは二つのアプリケーションを一緒に結合し、一方の出力が他方の入力になる。これらはしばしば、結合されたアプリケーションの実行が交互に起こる逐次反復式または時間進行(time marching)方式の一部として結合される。すなわち、AおよびBと称される二つの結合されたアプリケーションが与えられるとき、結合されたジョブの実行は、これら二つのアプリケーションの、たとえば順序ABABABABA……での繰り返される実行に関わる。ひとたび資源マネージャが、提出されたジョブが結合されたアプリケーションに関わることを検出したら、実験的な実行が、結合されたアプリケーションのメンバーについての最適なシステム構成を決定することが可能である(よって、Aの実行およびBの実行がプローブとなる)。アプリケーションAおよびBが異なり、よって各アプリケーションの異なる設定が最適実行のために必要とされることがありうることを注意しておく。しかしながら、結合されたアプリケーションは固定した問題を解くので、問題サイズおよびアルゴリズム選択のような性能に関する特性の多くは一定のままであり、よって初期の実験の結果は有効なままである。ただし、場合によっては、結合されたアプリケーションの一方または両方が実行を通じて発達するにつれ、(モデル化されるシステムの物理的な属性とともに)性能特性が変化する。これは、資源マネージャが実行を通じて実行時間およびエネルギー使用をモニタリングする必要があり、メンバー・アプリケーションのいずれかが(初期の実験フェーズの間に得られる)期待される値から逸脱する場合には、資源マネージャが実験フェーズを再実行して現在の最良の値のセットを決定する必要があることを意味する。
ほとんどすべてのHPCアプリケーションはよく定義された巡回的な性質をもつ。(たとえば時間を通じて)多数のステップのそれぞれについて同じ(または同様の)計算を繰り返したり、あるいはより高い精度に結果を洗練させながら一連の計算を繰り返したりするのである。
・サイクルの開始および終了のプログラマーまたはユーザーによる同定。それが資源マネージャに送り返される。
・MPI通信プリミティブのようなライブラリによって提供される方法への呼び出しの反復されるシーケンスから、資源マネージャが推定する。(たとえば、グローバルな待ちまたはグローバルな総和がサイクルの終わりにしばしば現われる。)
・あるサイクル中に種々の資源が使われるにつれて変化する、アプリケーションの電力使用プロファイルを解析することによって、資源マネージャが推定する。(たとえば、サイクルは、ネットワーク電力使用を増加させる通信フェーズを含むことがある。)
・サイクルの間に変化する資源の使用レベルから、資源マネージャが推定する。たとえば、サイクルの結果が不揮発性記憶に保存される際、I/Oが増加する一方、CPU使用が減少することがある。
ユーザーは、メイン実行可能形式と同じエネルギー使用特性をもつことが保証される、メイン・アプリケーションの一つまたは複数の短い、低資源使用の「プローブ」バージョンを供給することによって、資源マネージャが効率的な実験フェーズを実行することを助けることができる。たとえば、供給されるプローブ実行可能形式は、少数のサイクルを走らせるよう構成されることができる。資源マネージャは、これらのプローブを使って、メイン・アプリケーションを実行する前に、最適な構成を見出すことができる。
図7は、資源マネージャ(501)がHPCコンピュータ(502)に資源を割り当てることを担う例示的なシステム構成を示している。資源マネージャは、タスク(ジョブの一部)をHPC資源に割り当てることができ、またCPUの電圧および周波数のような、資源の動作の諸側面を制御することもできる(503)。資源マネージャのうち関心対象となる部分は、ジョブをコンピューティング資源に割り当て、コンピューティング資源の構成を設定するコントロール(504)と、代表的なサンプルの実行中の各構成における実行速度および使用されるエネルギーを含む実行データを収集するモニタ(506)と、本発明の主たる新たなコンポーネントであるエネルギー最適化器(509)とである。資源についての一般的なデータ(505)が、資源要求(508)とともにコントロールに入力される。エネルギー最適化器(509)は、部分511として示されているジョブの代表的なサンプルを同定し、HPC資源の、エネルギー使用に関係する許容される構成(510)を記憶する。
現代の高性能コンピュータ(HPC)システムおよび他のコンピュータ・システムは大量のエネルギーを使うが、コストおよび社会的責任の理由から、使用エネルギーを減らす必要がある。HPCクラスターのコンポーネント・コンピュータはそのエネルギー消費を減らす能力をもつが、それは全部ではないがいくつかの型のジョブについては低下した性能という代償を伴う。HPCクラスター資源マネージャは、エネルギー保存モードで実行されるときに性能を失わない(または受け容れ可能な性能損失をもつ)ようなジョブを同定することができれば、性能を維持しつつ、エネルギーを節約できる。発明実施形態は、資源マネージャがあらゆる提出されるジョブの短いセクション(プローブ)を可能な諸構成に対して試験し、特定のジョブについて最適な構成を選択することを提案することによって、好適なジョブを同定する。HPCおよび他のコンピュータ・システム・ジョブは規則的な実行パターンをもち、よってプローブが存在する。発明実施形態は、いくつかの異なるプローブ型を同定する。
(付記1)
複数の異なる許容されるハードウェア構成を有するコンピュータ・システムにおいてジョブを実行する方法であって、当該方法は:
実行のために提出されたジョブを受領する段階と;
前記ジョブの一つまたは複数の代表的なサンプルを同定する段階であって、当該または各代表的なサンプルは前記ジョブの一部である、段階と;
前記ジョブが部分的に実行される実験フェーズおよび前記ジョブの残りが実行される完了フェーズの二つのフェーズにおいて前記ジョブを実行する段階とを含み、
前記実験フェーズでは、当該または各代表的なサンプルは、前記コンピュータ・システムのそれぞれの異なる許容されるハードウェア構成を用いて実行され;
前記一つまたは複数の代表的なサンプルの実行中に各ハードウェア構成における実行速度および使用されるエネルギーを含む実行データが収集され、実行速度およびエネルギー使用を考慮に入れて前記ジョブについての好適なハードウェア構成が選択され;
前記完了フェーズでは、前記ジョブの残りが前記好適なハードウェア構成を用いて実行される、
方法。
(付記2)
前記ジョブが、同じ実行可能形式の、異なる入力をもつサブジョブ・アレイの形で受領され、前記一つまたは複数の代表的なサンプルは、前記サブジョブ・アレイのあるセレクションのみとして同定される、付記1記載の方法。
(付記3)
前記ジョブが、反復する入れ替わるサブジョブのリンクされたシーケンスの形で受領され、各サブジョブは二回以上現われ、前記代表的なサンプルは前記シーケンス中の最初のいくつかのサブジョブである、付記1記載の方法。
(付記4)
各サブジョブはアプリケーションであり、各アプリケーションについて一つで、二つ以上の好適なハードウェア構成が選択される、付記3記載の方法。
(付記5)
前記ジョブが巡回的であり、前記ジョブ内で諸サイクルが認識され、前記ジョブの一つまたは複数のサイクルが、当該または各代表的なサンプルとして同定される、付記1記載の方法。
(付記6)
代表的なサンプルが、前記ジョブ内の事前同定を調べることによって同定され、これが成功しない場合には、前記ジョブ記述言語をパースし、それでも成功しない場合には実行中の同定を試みる、付記5記載の方法。
(付記7)
前記ジョブが、メイン・ジョブと、該メイン・ジョブに対応するエネルギー使用特性をもつ該メイン・ジョブの一つまたは複数のプローブ・バージョンの形のサブジョブとを含み;該サブジョブが、前記実験フェーズにおいて実行される前記一つまたは複数の代表的なサンプルとして同定され、前記メイン・ジョブは前記完了フェーズにおいて実行される、付記1記載の方法。
(付記8)
前記コンピュータ・システムの各ハードウェア構成が異なるエネルギー使用特性をもち、計算性能に対して異なる影響をもち、好適なハードウェア構成は、実行を完了するための最低のエネルギー使用および受け容れ可能な時間をもつハードウェア構成である、付記1ないし7のうちいずれか一項記載の方法。
(付記9)
前記異なるハードウェア構成は、前記コンピュータ・システムにおける、適用される電圧、サイクル周波数、アクティブ化されるコンピューティング資源の量のうち一つまたは複数における変化を含む、付記1ないし8のうちいずれか一項記載の方法。
(付記10)
前記ジョブが受領されるときに、ジョブ言語がパースされて、前記記述ジョブ言語から前記一つまたは複数の代表的なサンプルを同定する、または、前記実験フェーズの前に、前記一つまたは複数の代表的なサンプルを同定するために使用されるデフォルト・ハードウェア構成フェーズにおいてジョブ実行が始まる、付記1ないし9のうちいずれか一項記載の方法。
(付記11)
当該または各代表的なサンプルがジョブ全体の3%以下、好ましくは1%以下をなす、付記1ないし10のうちいずれか一項記載の方法。
(付記12)
前記実験フェーズおよび前記完了フェーズは、ジョブが提出されるたびに実行され、好ましくは、さらに、前記完了フェーズの間にその後の実行データを収集し、その後の実行データが前記好適なハードウェア構成がもはや適切でないことを示す場合には前記実験フェーズまたは適応された実験フェーズに戻ることを含む、付記1ないし11のうちいずれか一項記載の方法。
(付記13)
前記実験フェーズが、前記ハードウェア構成の全部が試験され終わるまでまたは好適なハードウェア構成が見出されるまで継続する、付記1ないし12のうちいずれか一項記載の方法。
(付記14)
前記コンピュータ・システムはコンピュータ・クラスターを含み、前記ジョブは、いくつかのタスクに分割される少なくとも一つのアプリケーションからなり、それらのタスクは資源マネージャによって前記コンピュータ・クラスターのノードに割り当てられる、付記1ないし13のうちいずれか一項記載の方法。
(付記15)
実行のために提出されたコンピューティング・ジョブを実行するようコンピュータ・システムにおいてコンピューティング資源を管理する資源マネージャであって、当該資源マネージャは:
資源にジョブを割り当て、前記コンピュータ・システムの異なるハードウェア構成を生成するよう前記コンピュータ・システムの動作を制御するよう構成された制御モジュールであって、前記制御モジュールはまた、前記ジョブが部分的に実行される実験フェーズおよび前記ジョブの残りが実行される完了フェーズの二つのフェーズにおいて前記ジョブの実行を許容するよう構成されている、制御モジュールと;
前記ジョブの一つまたは複数の代表的なサンプルを同定し、前記コンピュータ・システムの前記異なるハードウェア構成を記憶し、前記実験フェーズにおいて前記一つまたは複数の代表的なサンプルの実行を許容するよう、前記制御モジュールに、前記ジョブを前記コンピュータ・システム内の諸資源に割り当てるよう要求するよう構成されたエネルギー最適化器であって、当該または各代表的なサンプルは前記ジョブの一部であり、当該または各代表的なサンプルは前記コンピュータ・システムの各異なるハードウェア構成をもって実行される、エネルギー最適化器と;
前記一つまたは複数の代表的なサンプルの実行中の各ハードウェア構成における実行速度および使用されるエネルギーを含む実行データを収集するよう構成されているモニタリング・モジュールとを有しており、
前記エネルギー最適化器は、実行速度およびエネルギー使用を考慮に入れて前記ジョブについての好適なハードウェア構成を選択し、前記制御モジュールに、前記アプリケーションの残りを、前記好適なハードウェア構成をもって前記完了フェーズにおいて実行するよう要求するよう構成されている、
資源マネージャ。
(付記16)
相互接続によって一緒に結合されてクラスターを形成するノードと、付記15記載の資源マネージャとを有する高性能コンピュータ(HPC)・システム。
101 全構成が試験済み?
102 次の構成でジョブを実行
103 実行統計を記録
104 最良の構成を選択
105 残りのジョブを実行
200 結合ジョブを受領
201 AおよびBについて全構成が試験済み?
202 次の構成でA、Bを実行
203 実行統計を記録
204 A、Bについて最良の構成を選択
205 シミュレーションの次のステップを実行(A,B,…)
206 実行時間およびエネルギーを記録
207 実行時間、エネルギーが不変?
208 構成を再試験
300 ジョブを受領
301 サイクルを同定
302 サイクルについて全構成が試験済み?
303 あるサイクルにわたりある構成で実行
304 実行統計を記録
305 最良の構成を選択
306 シミュレーションの残りを実行
307 サイクル実行時間およびエネルギーを記録
308 実行時間、エネルギーが不変?
309 構成を再試験
400 ジョブを受領
401 プローブを抽出
402 全プローブについて全構成が試験済み?
403 プローブをある構成で実行
404 実行統計を記録
405 最良の構成を選択
406 ジョブを実行
501 資源マネージャ
502 ノード
505 資源についての一般的データ
510 エネルギー節減のための許容される構成
501 資源マネージャ
509 エネルギー最適化器
506 モニタ
504 コントロール
503 タスク割り当て、システム設定
502 HPC資源
511 代表的なサンプル
508 資源要求
507 ジョブ指定
S10 ジョブの代表的なサンプルを同定
S20 各代表的なサンプルを異なる各構成で実行
S30 実行データを収集
S40 構成を選択
S50 ジョブの残りを実行
S60 代表的なサンプル(例:ジョブ・アレイまたはサイクルまたはプローブ・バージョン)が事前同定されているか?
S70 ジョブ記述言語を解析
S80 代表的なサンプル(例:サイクルまたは入れ替わり現われるサブジョブまたはサブジョブのアレイ)が同定されているか?
S90 デフォルト構成でジョブを実行開始
S100 代表的なサンプルが実行から同定される
S110 デフォルト構成で実行を継続
S120 実験フェーズおよび完了フェーズの方法論を使って実行
Claims (16)
- 複数の異なる許容されるハードウェア構成を有するコンピュータ・システムにおいてジョブを実行する方法であって、当該方法は:
実行のために提出されたジョブを受領する段階と;
前記ジョブの一つまたは複数の代表的なサンプルを同定する段階であって、当該または各代表的なサンプルは前記ジョブの一部である、段階と;
前記ジョブが部分的に実行される実験フェーズおよび前記ジョブの残りが実行される完了フェーズの二つのフェーズにおいて前記ジョブを実行する段階とを含み、
前記実験フェーズでは、当該または各代表的なサンプルは、前記コンピュータ・システムのそれぞれの異なる許容されるハードウェア構成を用いて実行され;
前記一つまたは複数の代表的なサンプルの実行中に各ハードウェア構成における実行速度および使用されるエネルギーを含む実行データが収集され、実行速度およびエネルギー使用を考慮に入れて前記ジョブについての好適なハードウェア構成が選択され;
前記完了フェーズでは、前記ジョブの残りが前記好適なハードウェア構成を用いて実行される、
方法。 - 前記ジョブが、同じ実行可能形式の、異なる入力をもつサブジョブ・アレイの形で受領され、前記一つまたは複数の代表的なサンプルは、前記サブジョブ・アレイのあるセレクションのみとして同定される、請求項1記載の方法。
- 前記ジョブが、反復する入れ替わるサブジョブのリンクされたシーケンスの形で受領され、各サブジョブは二回以上現われ、前記代表的なサンプルは前記シーケンス中の最初のいくつかのサブジョブである、請求項1記載の方法。
- 各サブジョブはアプリケーションであり、各アプリケーションについて一つで、二つ以上の好適なハードウェア構成が選択される、請求項3記載の方法。
- 前記ジョブが巡回的であり、前記ジョブ内で諸サイクルが認識され、前記ジョブの一つまたは複数のサイクルが、当該または各代表的なサンプルとして同定される、請求項1記載の方法。
- 代表的なサンプルが、前記ジョブ内の事前同定を調べることによって同定され、これが成功しない場合には、前記ジョブ記述言語をパースし、それでも成功しない場合には実行中の同定を試みる、請求項5記載の方法。
- 前記ジョブが、メイン・ジョブと、該メイン・ジョブに対応するエネルギー使用特性をもつ該メイン・ジョブの一つまたは複数のプローブ・バージョンの形のサブジョブとを含み;該サブジョブが、前記実験フェーズにおいて実行される前記一つまたは複数の代表的なサンプルとして同定され、前記メイン・ジョブは前記完了フェーズにおいて実行される、請求項1記載の方法。
- 前記コンピュータ・システムの各ハードウェア構成が異なるエネルギー使用特性をもち、計算性能に対して異なる影響をもち、好適なハードウェア構成は、実行を完了するための最低のエネルギー使用および受け容れ可能な時間をもつハードウェア構成である、請求項1ないし7のうちいずれか一項記載の方法。
- 前記異なるハードウェア構成は、前記コンピュータ・システムにおける、適用される電圧、サイクル周波数、アクティブ化されるコンピューティング資源の量のうち一つまたは複数における変化を含む、請求項1ないし8のうちいずれか一項記載の方法。
- 前記ジョブが受領されるときに、ジョブ言語がパースされて、前記記述ジョブ言語から前記一つまたは複数の代表的なサンプルを同定する、または、前記実験フェーズの前に、前記一つまたは複数の代表的なサンプルを同定するために使用されるデフォルト・ハードウェア構成フェーズにおいてジョブ実行が始まる、請求項1ないし9のうちいずれか一項記載の方法。
- 当該または各代表的なサンプルがジョブ全体の3%以下、好ましくは1%以下をなす、請求項1ないし10のうちいずれか一項記載の方法。
- 前記実験フェーズおよび前記完了フェーズは、ジョブが提出されるたびに実行され、好ましくは、さらに、前記完了フェーズの間にその後の実行データを収集し、その後の実行データが前記好適なハードウェア構成がもはや適切でないことを示す場合には前記実験フェーズまたは適応された実験フェーズに戻ることを含む、請求項1ないし11のうちいずれか一項記載の方法。
- 前記実験フェーズが、前記ハードウェア構成の全部が試験され終わるまでまたは好適なハードウェア構成が見出されるまで継続する、請求項1ないし12のうちいずれか一項記載の方法。
- 前記コンピュータ・システムはコンピュータ・クラスターを含み、前記ジョブは、いくつかのタスクに分割される少なくとも一つのアプリケーションからなり、それらのタスクは資源マネージャによって前記コンピュータ・クラスターのノードに割り当てられる、請求項1ないし13のうちいずれか一項記載の方法。
- 実行のために提出されたコンピューティング・ジョブを実行するようコンピュータ・システムにおいてコンピューティング資源を管理する資源マネージャであって、当該資源マネージャは:
資源にジョブを割り当て、前記コンピュータ・システムの異なるハードウェア構成を生成するよう前記コンピュータ・システムの動作を制御するよう構成された制御モジュールであって、前記制御モジュールはまた、前記ジョブが部分的に実行される実験フェーズおよび前記ジョブの残りが実行される完了フェーズの二つのフェーズにおいて前記ジョブの実行を許容するよう構成されている、制御モジュールと;
前記ジョブの一つまたは複数の代表的なサンプルを同定し、前記コンピュータ・システムの前記異なるハードウェア構成を記憶し、前記実験フェーズにおいて前記一つまたは複数の代表的なサンプルの実行を許容するよう、前記制御モジュールに、前記ジョブを前記コンピュータ・システム内の諸資源に割り当てるよう要求するよう構成されたエネルギー最適化器であって、当該または各代表的なサンプルは前記ジョブの一部であり、当該または各代表的なサンプルは前記コンピュータ・システムの各異なるハードウェア構成をもって実行される、エネルギー最適化器と;
前記一つまたは複数の代表的なサンプルの実行中の各ハードウェア構成における実行速度および使用されるエネルギーを含む実行データを収集するよう構成されているモニタリング・モジュールとを有しており、
前記エネルギー最適化器は、実行速度およびエネルギー使用を考慮に入れて前記ジョブについての好適なハードウェア構成を選択し、前記制御モジュールに、前記アプリケーションの残りを、前記好適なハードウェア構成をもって前記完了フェーズにおいて実行するよう要求するよう構成されている、
資源マネージャ。 - 相互接続によって一緒に結合されてクラスターを形成するノードと、請求項15記載の資源マネージャとを有する高性能コンピュータ(HPC)・システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP13197559.1 | 2013-12-16 | ||
EP13197559.1A EP2884391B1 (en) | 2013-12-16 | 2013-12-16 | A method of executing a job in a computer system, a resource manager and a high performance computer system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015118705A true JP2015118705A (ja) | 2015-06-25 |
JP6409543B2 JP6409543B2 (ja) | 2018-10-24 |
Family
ID=49841515
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014249650A Active JP6409543B2 (ja) | 2013-12-16 | 2014-12-10 | コンピュータ・システムにおいてジョブを実行する方法、資源マネージャおよび高性能コンピュータ・システム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9870274B2 (ja) |
EP (1) | EP2884391B1 (ja) |
JP (1) | JP6409543B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10402227B1 (en) * | 2016-08-31 | 2019-09-03 | Amazon Technologies, Inc. | Task-level optimization with compute environments |
JP6792159B2 (ja) * | 2017-01-25 | 2020-11-25 | 富士通株式会社 | 並列処理パラメータ決定プログラム、並列処理パラメータ決定方法、および並列処理管理装置 |
US11132681B2 (en) | 2018-07-06 | 2021-09-28 | At&T Intellectual Property I, L.P. | Services for entity trust conveyances |
US10802872B2 (en) * | 2018-09-12 | 2020-10-13 | At&T Intellectual Property I, L.P. | Task delegation and cooperation for automated assistants |
US11481186B2 (en) | 2018-10-25 | 2022-10-25 | At&T Intellectual Property I, L.P. | Automated assistant context and protocol |
US10515005B1 (en) * | 2018-12-20 | 2019-12-24 | Atlassian Pty Ltd | Systems and methods for testing source code |
US11256547B2 (en) | 2019-05-31 | 2022-02-22 | Altair Engineering, Inc. | Efficient allocation of cloud computing resources to job requests |
US11765039B2 (en) * | 2020-08-13 | 2023-09-19 | Grass Valley Canada | System and method for optimizing deployment of a processing function in a media production workflow |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005208922A (ja) * | 2004-01-22 | 2005-08-04 | Nippon Telegr & Teleph Corp <Ntt> | グリッドシステムにおけるジョブ割付方法、グリッド仲介装置及びリソース計算機 |
US20070143765A1 (en) * | 2005-12-21 | 2007-06-21 | International Business Machines Corporation | Method and system for scheduling of jobs |
JP2007272653A (ja) * | 2006-03-31 | 2007-10-18 | Nec Corp | ジョブスケジューリング装置およびジョブスケジューリング方法 |
US20090106008A1 (en) * | 2007-10-18 | 2009-04-23 | Michael John Branson | Performance sampling in distributed systems |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050125701A1 (en) | 2003-12-03 | 2005-06-09 | International Business Machines Corporation | Method and system for energy management via energy-aware process scheduling |
US8555283B2 (en) | 2007-10-12 | 2013-10-08 | Oracle America, Inc. | Temperature-aware and energy-aware scheduling in a computer system |
US8612984B2 (en) | 2010-04-28 | 2013-12-17 | International Business Machines Corporation | Energy-aware job scheduling for cluster environments |
US9495139B2 (en) * | 2011-04-11 | 2016-11-15 | University Of Florida Research Foundation, Inc. | Elastic computing |
US8689220B2 (en) | 2011-11-30 | 2014-04-01 | International Business Machines Corporation | Job scheduling to balance energy consumption and schedule performance |
US9953054B2 (en) * | 2013-04-22 | 2018-04-24 | Salesforce.Com, Inc. | Systems and methods for implementing and maintaining sampled tables in a database system |
US9529641B2 (en) | 2013-08-26 | 2016-12-27 | Cisco Technology, Inc. | Data center thermal model |
-
2013
- 2013-12-16 EP EP13197559.1A patent/EP2884391B1/en active Active
-
2014
- 2014-12-10 JP JP2014249650A patent/JP6409543B2/ja active Active
- 2014-12-10 US US14/565,815 patent/US9870274B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005208922A (ja) * | 2004-01-22 | 2005-08-04 | Nippon Telegr & Teleph Corp <Ntt> | グリッドシステムにおけるジョブ割付方法、グリッド仲介装置及びリソース計算機 |
US20070143765A1 (en) * | 2005-12-21 | 2007-06-21 | International Business Machines Corporation | Method and system for scheduling of jobs |
JP2007272653A (ja) * | 2006-03-31 | 2007-10-18 | Nec Corp | ジョブスケジューリング装置およびジョブスケジューリング方法 |
US20090106008A1 (en) * | 2007-10-18 | 2009-04-23 | Michael John Branson | Performance sampling in distributed systems |
Non-Patent Citations (4)
Title |
---|
ANANTA TIWARI ET AL.: "Auto-tuning for Energy Usage in Scientific Applications", PROCEEDINGS OF EUROPEAN CONFERENCE ON PARALLEL PROCESSING 2011 (EURO-PAR 2011) : PARALLEL PROCESSIN, JPN6018025323, 2011, pages all 10 pages * |
ANANTA TIWARI, JEFFREY K. HOLLINGSWORTH: "Online Adaptive Code Generation and Tuning", PROCEEDINGS OF 2011 IEEE INTERNATIONAL PARALLEL & DISTRIBUTED PROCESSING SYMPOSIUM, JPN6018025321, 16 May 2011 (2011-05-16), pages Pages:879-892 * |
I-HSIN CHUNG, JEFFREY K. HOLLINGSWORTH: "A Case Study Using Automatic Performance Tuning for Large-Scale Scientific Programs", PROCEEDINGS OF 15TH IEEE INTERNATIONAL CONFERENCE ON HIGH PERFORMANCE DISTRIBUTED COMPUTING, JPN6018025320, 19 June 2006 (2006-06-19), pages Pages:45-56 * |
SEBASTIAN GOTZ ET AL.: "Architecture and Mechanisms of Energy Auto-Tuning", SUSTAINABLE ICTS AND MANAGEMENT SYSTEMS FOR GREEN COMPUTING, JPN6018025322, 2012 * |
Also Published As
Publication number | Publication date |
---|---|
EP2884391A1 (en) | 2015-06-17 |
US9870274B2 (en) | 2018-01-16 |
EP2884391B1 (en) | 2017-08-30 |
JP6409543B2 (ja) | 2018-10-24 |
US20150169383A1 (en) | 2015-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6409543B2 (ja) | コンピュータ・システムにおいてジョブを実行する方法、資源マネージャおよび高性能コンピュータ・システム | |
Ananthanarayanan et al. | Effective straggler mitigation: Attack of the clones | |
Cheng et al. | Improving performance of heterogeneous mapreduce clusters with adaptive task tuning | |
US10423451B2 (en) | Opportunistically scheduling and adjusting time slices | |
Sarood et al. | Maximizing throughput of overprovisioned hpc data centers under a strict power budget | |
JP6219512B2 (ja) | 仮想ハドゥープマネジャ | |
EP2259184B1 (en) | Multi-core scheduling for parallel queries | |
Soualhia et al. | Task scheduling in big data platforms: a systematic literature review | |
CN108701060A (zh) | 用于计算系统自动调整的方法 | |
Cheng et al. | Towards energy efficiency in heterogeneous hadoop clusters by adaptive task assignment | |
Wang et al. | eSplash: Efficient speculation in large scale heterogeneous computing systems | |
Huang et al. | Novel heuristic speculative execution strategies in heterogeneous distributed environments | |
US9614728B2 (en) | Identifying network communication patterns | |
Yu et al. | System-wide trade-off modeling of performance, power, and resilience on petascale systems | |
JP6477260B2 (ja) | アプリケーションを実行する方法及びリソースマネジャ | |
da Rosa Righi et al. | Joint‐analysis of performance and energy consumption when enabling cloud elasticity for synchronous HPC applications | |
Wang et al. | A model driven approach towards improving the performance of apache spark applications | |
US9052952B1 (en) | Adaptive backup model for optimizing backup performance | |
Liu et al. | A case of system-wide power management for scientific applications | |
Wang et al. | A dynamic resource allocation framework for apache spark applications | |
Ngoko et al. | Reducing the number of comatose servers: automatic tuning as an opportunistic cloud-service | |
US20230004440A1 (en) | Allocating of computing resources for applications | |
Elahi et al. | A generic execution management framework for scientific applications | |
Le Merrer et al. | Application-aware adaptive partitioning for graph processing systems | |
Xhafa Xhafa | A hyper-heuristic for adaptive scheduling in computational grids |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170804 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180515 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180710 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180817 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180828 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180910 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6409543 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |