JP2015049562A - 情報処理システム、ジョブ管理装置、ジョブ管理装置の制御プログラム、及び、情報処理システムの制御方法 - Google Patents

情報処理システム、ジョブ管理装置、ジョブ管理装置の制御プログラム、及び、情報処理システムの制御方法 Download PDF

Info

Publication number
JP2015049562A
JP2015049562A JP2013179088A JP2013179088A JP2015049562A JP 2015049562 A JP2015049562 A JP 2015049562A JP 2013179088 A JP2013179088 A JP 2013179088A JP 2013179088 A JP2013179088 A JP 2013179088A JP 2015049562 A JP2015049562 A JP 2015049562A
Authority
JP
Japan
Prior art keywords
job
value
executed
power
schedule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013179088A
Other languages
English (en)
Other versions
JP6201530B2 (ja
Inventor
二三雄 山崎
Fumio Yamazaki
二三雄 山崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2013179088A priority Critical patent/JP6201530B2/ja
Priority to EP14178973.5A priority patent/EP2843547A3/en
Priority to US14/449,188 priority patent/US9286107B2/en
Publication of JP2015049562A publication Critical patent/JP2015049562A/ja
Application granted granted Critical
Publication of JP6201530B2 publication Critical patent/JP6201530B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • G06F9/4893Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues taking into account power or heat criteria
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5094Allocation of resources, e.g. of the central processing unit [CPU] where the allocation takes into account power or heat criteria
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/48Indexing scheme relating to G06F9/48
    • G06F2209/483Multiproc
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5019Workload prediction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/504Resource capping
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Power Sources (AREA)

Abstract

【課題】最大使用電力の制限範囲におけるジョブの実行を効率的に管理する情報処理システム、ジョブ管理装置、ジョブ管理装置の制御プログラム、及び、情報処理システムの制御方法を提供することにある。
【解決手段】ジョブをそれぞれ実行する複数の計算ノードと、前記ジョブの管理を行うジョブ管理ノードとを有する情報処理システムにおいて、前記ジョブ管理ノードは、スケジュール対象ジョブとジョブ識別情報とが一致する実行済みジョブ、または、前記スケジュール対象ジョブと使用計算ノード数が一致、または、前記スケジュール対象ジョブとの使用計算ノード数の差が所定の範囲内にある実行済みジョブを実行した計算ノードが使用した最大使用電力値を、前記スケジュール対象ジョブの予測最大使用電力値として取得する取得部と、前記スケジュール対象ジョブの予測最大使用電力値の合計が、時刻に応じて設定される制限電力値を超えないように、前記スケジュール対象ジョブをスケジュールするスケジュール部を有する。
【選択図】図10

Description

本発明は、情報処理システム、ジョブ管理装置、ジョブ管理装置の制御プログラム、及び、情報処理システムの制御方法に関する。
近年のスーパーコンピュータのような大規模なコンピュータシステムでは、従来よりも多量のジョブが管理され、実行される。このようなコンピュータシステムは、例えば、管理ノードと複数の計算ノードとを有する。管理ノードは、例えば、ジョブのスケジュールを作成し、各計算ノードにジョブの実行を指示する。また、各計算ノードはジョブを実行する(例えば、特許文献1)。
また、2011年3月の東日本大震災の影響によって電力の供給力が減少したことに伴い、大口需要者に対して、電気事業法第27条に基づいた電力使用制限が実施されるようになった。これにより、例えば、電力需要が増加する夏期の時間帯において、使用電力の15%の削減が実施される。また、大口需要者は、法律による電力使用制限とは別に、時間を区切ってシステムを停止するなどの対応によって、管内における電力使用量を抑えている。
電力使用量を考慮する場合、環境保護の観点で合計使用量を抑える取組みと、供給量が減少したことに対応して、瞬間の最大使用電力を使用制限の範囲に抑える取組みとがある。前者の取組みとして、低消費電力を実現するための計算機システムや制御方式が検討される。また、後者の取組みとして、例えば、大規模なコンピュータシステムにおいて、最大使用電力を意識した運用が求められる。例えば、システム内の一部のハードウェア(計算ノード、周辺装置)の電源の手作業による遮断制御によって、大規模なコンピュータシステムにおける最大使用電力の制限が行われる。
特開2012-73690号公報
しかしながら、一部のハードウェアの電源遮断制御によると、大まかな見積りに基づくことにより、最大使用電力の制限値と、コンピュータシステムの使用電力値との差異が大きくなり易い。また、一部のハードウェアが使用できなくなることに伴い計算資源が不足することによって、実行できないジョブが生じる。このように、最大使用電力を制限値に抑えながら、効率的にジョブを実行することができていなかった。また、ハードウェアの電源の遮断制御処理には、人的コストが生じる。
1つの側面では、本発明は、最大使用電力の制限範囲におけるジョブの実行を効率的に管理する情報処理システム、ジョブ管理装置、ジョブ管理装置の制御プログラム、及び、情報処理システムの制御方法を提供することを目的とする。
第1の側面は、ジョブをそれぞれ実行する複数の計算ノードと、前記ジョブの管理を行うジョブ管理ノードとを有する情報処理システムにおいて、前記ジョブ管理ノードは、スケジュール対象ジョブとジョブ識別情報とが一致する実行済みジョブ、または、前記スケジュール対象ジョブと使用計算ノード数が一致、または、前記スケジュール対象ジョブとの使用計算ノード数の差が所定の範囲内にある実行済みジョブを実行した計算ノードが使用した最大使用電力値を、前記スケジュール対象ジョブの予測最大使用電力値として取得する取得部と、前記スケジュール対象ジョブの予測最大使用電力値の合計が、時刻に応じて設定される制限電力値を超えないように、前記スケジュール対象ジョブをスケジュールするスケジュール部を有する。
第1の側面によれば、最大使用電力の制限範囲におけるジョブの実行が効率的に管理される。
本実施の形態例における情報処理システムの構成を説明する図である。 図1の情報システムにおけるジョブ管理ノードの構成の一例を説明する図である。 本実施の形態例におけるジョブ管理ノードのブロック図の一例を示す図である。 ジョブの登録情報の一例について説明する図である。 スケジュール対象となるジョブの一例について説明する図である。 ジョブの基本的なスケジュール処理について説明する図である。 1日における使用制限電力値について説明する図である。 本実施の形態例におけるスケジュール処理の概要について説明する図である。 ジョブ管理ノードの全体の処理の概要について時系列に説明する図である。 ジョブのスケジュール処理を説明するフローチャート図である。 ジョブの実行制御処理について説明するフローチャート図である。 実行中ジョブの電力値監視処理について説明するフローチャート図である。 実行調整処理(図12のS48)について説明するフローチャート図である。 具体的における使用制限電力値の変移について説明する図である。 具体例におけるジョブA〜Eについて説明する図である。 スケジュール処理を説明する第1の図である。 スケジュール処理を説明する第2の図である。 スケジュール処理を説明する第3の図である。 使用制限電力値とジョブ管理処理が行われた場合の使用電力値とを例示する図である。
以下、図面にしたがって本発明の実施の形態について説明する。ただし、本発明の技術的範囲はこれらの実施の形態に限定されず、特許請求の範囲に記載された事項とその均等物まで及ぶものである。
[情報処理システム]
図1は、本実施の形態例における情報処理システムの構成を説明する図である。本実施の形態例における情報処理システムは、例えば、ジョブ管理ノード10、複数の計算ノード20、ログインノード30、ストレージSTを有する。 ジョブ管理ノード10は、複数の計算ノード20に接続されると共に、ログインノード30に接続される。ログインノード30は、例えば、インターネットを介して接続されるユーザの端末装置40から、実行対象のジョブの登録を受け付ける。ジョブ管理ノード10は、ログインノード30から、登録されたジョブの情報を取得し、ジョブのスケジュールを生成する。また、ジョブ管理ノード10は、生成したスケジュールに基づいて、ジョブのプログラムや入力情報等をストレージSTから読み出し、計算ノード20にジョブの実行を指示する。各計算ノード20は、ジョブ管理ノード10からの指示に基づいて、ジョブを実行する。
[ジョブ管理ノード10の構成]
図2は、図1の情報システムにおけるジョブ管理ノード10の構成の一例を説明する図である。図2のジョブ管理ノード10は、例えば、入力装置11、表示装置12、通信インタフェース13、プロセッサ14、記憶媒体15、メモリ16を有する。各部は、バス17を介して互いに接続される。入力装置11は、例えば、キーボードやマウス等を示し、表示装置12は、例えば、ディスプレイ等の表示画面を示す。また、ジョブ管理ノード10は、通信インタフェース13を介して、複数の計算ノード20やログインノード30との通信を行う。メモリ16には、本実施の形態例におけるジョブ管理プログラムPRが記憶される。ジョブ管理プログラムPRは、プロセッサ14と協働して、本実施の形態例におけるジョブの管理処理を実現する。
[ジョブ管理ノード10のブロック図]
図3は、本実施の形態例におけるジョブ管理ノード10のブロック図の一例を示す図である。本実施の形態例におけるジョブ管理ノード10は、例えば、ジョブマネージャ12とジョブスケジューラ11と資源管理部18とを有する。例えば、ジョブスケジューラ11は、ジョブの管理を行うと共に、ジョブのスケジュールを生成する。ジョブスケジューラ11は、例えば、ジョブ選択部13、ジョブ割り当て部14、ジョブ実行制御部15を有する。
ジョブスケジューラ11のジョブ選択部13は、スケジュール対象の複数のジョブから、優先度の高い順にジョブを選択し、ジョブの情報をジョブ割り当て部14に渡す。ジョブの情報については、後述する。また、ジョブ選択部13は、選択したジョブの情報をジョブマネージャ12に出力し、ジョブの最大使用電力の予測値(以下、予測最大使用電力値と称する)を取得する。ジョブの最大使用電力とは、当該ジョブの実行に使用される電力値の最大値を示す。なお、取得された予測最大使用電力値についても、ジョブ割り当て部14に出力される。
ジョブ割り当て部14は、ジョブ選択部13から出力された情報に基づいて、ジョブのスケジュールを生成する。具体的に、ジョブ割り当て部14は、ジョブが使用する数(以下、使用計算ノード数)の計算ノード20を確保可能な時間帯であって、ジョブの予測される実行時間(以下、予測実行時間)に対応する時間帯に対してジョブを割り当てることによりスケジュールを行う。また、本実施の形態例において、ジョブ割り当て部14は、ジョブの予測最大使用電力値の合計が、使用制限電力値を超えないようにスケジュールを行う。使用制限電力値は、時刻に対応して設定される。
ジョブ実行制御部15は、ジョブの割り当て部によって生成されたスケジュールに基づいて、実行開始時刻に達するジョブを、資源管理部18を介して、ジョブの使用計算ノード数に対応する数のジョブ実行部(計算ノード)20に転送する。また、各ジョブ実行部20は、使用電力計測部21と接続され、使用電力計測部21によって計測された、ジョブの現在の使用電力値を取得する。また、ジョブ実行部20は、ジョブの終了時に、当該ジョブの使用電力値の最大値をジョブ実行制御部15に出力する。ジョブの使用電力値の最大値は、ジョブ実行制御部15によって、ジョブマネージャ12の使用電力記憶部17に記憶される。
また、図3のジョブマネージャ12は、例えば、ジョブスケジューラ11の管理、及び、ジョブの使用電力値の管理を行う。ジョブマネージャ12は、例えば、ジョブ実行制御部15、使用電力予測部16、使用電力記憶部17を有する。
使用電力記憶部17には、各実行済みジョブの情報が記憶される。具体的に、使用電力記憶部17には、例えば、実行済みジョブが使用した計算ノード数の実績、実行時間の実績、ジョブを実行した計算ノード20が使用した最大使用電力値の実績が記憶される。使用電力予測部16は、使用電力記憶部17を参照し、ジョブ選択部13から出力されたジョブの情報に基づいて、当該ジョブの予測最大使用電力値を取得する。また、ジョブマネージャ12のジョブ実行制御部15は、資源管理部18を介して、実行中ジョブの使用電力値を監視すると共に、実行済みのジョブの情報を使用電力記憶部17に記憶する。
次に、ジョブの情報について説明する。ジョブの情報は、例えば、ジョブの投入時にユーザによって登録される(以下、登録情報と称する)。
[ジョブの登録情報]
図4は、ジョブの登録情報の一例について説明する図である。図4の表H1では、ジョブの登録情報の一部として、ジョブ識別情報、ジョブ種別、使用計算ノード数、プロセス数、予測I/O量、予測実行時間が例示される。ただし、ジョブの登録情報は、この例に限定されるものではない。
ジョブ識別情報とは、例えば、ジョブの名前を示す。ジョブ種別とは、例えば、逐次ジョブ、または、並列ジョブを示す。逐次ジョブとは、例えば、計算ノード20間において独立して実行されるジョブを示す。また、並列ジョブとは、例えば、複数の計算ノード20間で連携して実行されるジョブを示す。使用計算ノード数は、ジョブの実行に使用される計算ノード20の数を示す。プロセス数は、ジョブの実行によって生成されるプロセスの予測数を示す。また、予測I/O量は、ジョブ内で行われるファイルシステムへのI/Oの予測量を示す。予測実行時間は、ジョブの実行開始から終了までにかかる予測時間を示す。
また、図4の表H2は、ジョブの登録情報の具体例を示す。表H2によると、ジョブAのジョブ種別は逐次ジョブであって、使用計算ノード数は8台である。また、ジョブAのプロセス数は16であり、予測I/O量は30である。また、ジョブAの予測実行時間は5hである。即ち、ジョブAは、実行開始から5時間後に終了することが予測される。同様にして、他のジョブについても、ジョブの投入時に、図4の表H2に示すような登録情報がユーザによって入力される。
続いて、ジョブの基本のスケジュール処理について説明する。ここで、スケジュール対象となるジョブの一例について説明する。
図5は、本実施の形態例において、スケジュール対象となるジョブの一例について説明する図である。この例では、5つのジョブA〜Eが投入される。また、図5において、各ジョブA〜Eの登録情報の一部が例示される。また、この例において、ジョブA〜Eの順にジョブが投入され、ジョブの投入順に優先度が設定される。このため、ジョブAの優先度が最も高く、次にジョブBの優先度が高い。
図5の例において、具体的に、各ジョブの使用計算ノード数は、ジョブA:8台、ジョブB:3台、ジョブC:20台、ジョブD:12台、ジョブE:32台である。また、ジョブA〜Eの予定実行時間は、ジョブA:5h、ジョブB:4h、ジョブC:10h、ジョブD:1h、ジョブE:6hである。予測最大使用電力値については、後述する。なお、図5の例では、ジョブの投入順に優先度が設定されるが、この例に限定されるものではない。各ジョブの優先度は、ユーザによって任意に入力されてもよい。
[スケジュール処理]
図6は、ジョブの基本的なスケジュール処理について説明する図である。図6において、縦軸は計算ノード数、横軸は時間を示す。この例において、情報処理システムが有する計算ノード20の数は、例えば、32台である。このため、各時間帯で割り当てられる使用計算ノード数の合計が32台を超えないようにスケジュールが生成される。
具体的に、スケジュール処理では、例えば、優先度の高いジョブから順に、ジョブの使用計算ノード数に対応する数の計算ノード20が現在時刻から近い時間帯に割り当てられることによってスケジュールが行われる。まず、最も優先度の高いジョブAjaがスケジュール対象とされる。そこで、使用計算ノード数が8台であって、予測実行時間が5時間であるジョブAjaが、現在時刻から5時間の時間帯にスケジュールされる。これにより、現在時刻から5時間の時間帯において、8台の計算ノード20がジョブAjaのために使用される。
続いて、次に優先度の高いジョブBjbがスケジュール対象とされる。そして、使用計算ノード数が3台であって、予測実行時間が4時間であるジョブBjbが、現在時刻から4時間の時間帯にスケジュールされる。これにより、現在時刻から4時間の時間帯において、11(=8+3)台の計算ノード20がジョブAja、ジョブBjbのために確保される。また、4時間後と5時間後との間の時間帯において、8台の計算ノード20がジョブAjaのために確保される。
続いて、使用計算ノード数が20台であって、予測実行時間が10時間であるジョブCjcが、現在時刻から10時間の時間帯にスケジュールされる。これにより、現在時刻から4時間の時間帯において、31(=8+3+20)台の計算ノード20がジョブAja〜Cjcのために確保される。同様にして、4時間後と5時間後との間の時間帯において、28(=8+20)台の計算ノード20がジョブAja、Cjcのために、5時間後と10時間後との間の時間帯において、20台の計算ノード20がジョブCjcのために確保される。これらの時間帯において、割り当てられた計算ノード20の数の合計は、本実施の形態例における情報処理システムが有する計算ノード20の数(32台)に収まっている。
次に、使用計算ノード数が12台であって、予測実行時間が1時間であるジョブDjdがスケジュール対象とされる。ただし、ジョブDjdが現在時刻から1時間の時間帯にスケジュールされると、現在時刻から1時間の時間帯において割り当てられた計算ノード20の数の合計は、43(=8+3+20+12)台となる。これは、本実施の形態例における情報処理システムが有する計算ノード20の数(32台)を超える。そこで、ジョブDjdは、割り当てられる計算ノード20の合計が32台を超えないように未来の時間帯にシフトされ、ジョブAjaの終了後の時刻から1時間の時間帯にスケジュールされる。このとき、ジョブAjaの終了後の時刻から1時間の時間帯には、ジョブCjc、Djdがスケジュールされ、当該時間帯において割り当てられた計算ノード数の合計(32台=20+12)は32台に収まる。
また、使用計算ノード数が32台であって、予測実行時間が6時間であるジョブEjeについても、割り当てられる計算ノード20の合計が32台を超えないように、ジョブCjcの終了後の時刻から6時間の時間帯にスケジュールされる。このように、優先度の高いジョブによって計算ノード20が確保されたことにより、現在時刻において計算ノード数が確保できないジョブ(この例では、ジョブDjd、ジョブEje)については、未来の時間帯にスケジュールされる。
続いて、使用制限電力値について説明する。使用制限電力値は、使用可能な電力値の上限値を示す。また、使用制限電力値は、例えば、時刻に対応して設定される。
[使用制限電力値]
図7は、1日における使用制限電力値について説明する図である。図7において、縦軸は電力値を示し、横軸は時間を示す。また、線x11は使用電力値の実績を示し、点線x12は使用制限電力値を示す。
図7の使用制限電力値の例によると、10時〜17時のような日中の時間帯において、使用制限電力値x12が抑えられる。そこで、例えば、10時〜17時における電力使用値を抑えるために、10時前に、システムの一部のハードウェア(計算ノード20、周辺装置)の電源が遮断制御される。そして、17時を過ぎると、電源遮断制御されたハードウェアの電源投入制御が行われる。このような電源制御の結果、10時前を示す時間t1において使用電力値の実績x11が減少すると共に、17時過ぎを示す時間t2において使用電力値の実績x11が上昇している。
しかしながら、システムの一部のハードウェアの電源制御によって使用電力値を抑制する場合、大まかな見積りに基づくと共に、使用制限電力値x12の範囲内に確実に使用電力値x11を収めるために、より多くのハードウェアに対して電源制御が行われる。これにより、使用電力値の実績x11と、使用制限電力値x12との差異y1が大きくなり易い。また、一部の計算ノード20の電源が遮断制御されることにより計算ノード20が不足し、実行できないジョブが生じてしまう。
そこで、本実施の形態例における情報処理システムにおけるジョブ管理ノード10は、スケジュール対象ジョブとジョブ識別情報が一致する実行済みジョブ、または、スケジュール対象ジョブと使用計算ノード数が一致、または、スケジュール対象ジョブとの使用計算ノード数の差が所定の範囲内にある実行済みジョブを実行した計算ノード20が使用した最大使用電力値を、スケジュール対象ジョブの予測最大使用電力値として取得する。そして、ジョブ管理ノード10は、スケジュール対象ジョブの予測最大使用電力値の合計が、時刻に応じて設定される制限電力値を超えないように、スケジュール対象ジョブをスケジュールする。
このように、本実施の形態例におけるジョブ管理ノード10は、ジョブの登録情報と、実行済みジョブの実績情報とに基づいて、スケジュール対象のジョブの予測最大使用電力値を取得する。そして、ジョブ管理ノード10は、各ジョブの予測最大使用電力値に基づくことにより、ジョブによって使用される電力値のピークが、予め、使用制限電力値に収まるようにジョブのスケジュールを生成することができる。これにより、本実施の形態例における情報処理システムは、時刻に応じて設定される使用制限電力値に合わせて、柔軟に、ジョブをスケジュールすることができる。即ち、情報処理システムは、電力使用制限量の範囲内において実行可能なジョブを効率よく実行させることができる。
ここで、まず、ジョブの予測最大使用電力値の取得処理の詳細について説明する。ここでは、予測最大使用電力値の取得処理の2つの事例について説明する。
[予測最大使用電力値の取得処理]
まず、第1の例について説明する。ジョブが使用する電力値は、例えば、ジョブの使用計算ノード数、プロセス数、I/O量に応じて変動する。そこで、第1の例において、ジョブ管理ノード10の使用電力予測部16は、スケジュール対象のジョブの使用計算ノード数、プロセス数、予測I/O量に基づいて、ジョブの予測最大使用電力値を取得する。より具体的に、使用電力予測部16は、スケジュール対象のジョブ(例えば、ジョブA)の使用計算ノード数、プロセス数、予測I/O量と、使用計算ノード数の実績、プロセス数の実績、I/O量の実績とが一致する実行済みジョブの最大使用電力値の実績を、スケジュール対象の予測最大使用電力値として取得する。これにより、使用電力予測部16は、ジョブAの予測最大使用電力値(この例では、20kW)を取得する。
または、使用電力予測部16は、スケジュール対象のジョブの使用計算ノード数、プロセス数、予測I/O量と、使用計算ノード数の実績、プロセス数の実績、I/O量の実績との差が所定の範囲内にある実行済みジョブの最大使用電力値の実績を、スケジュール対象の予測最大使用電力値として取得する。
例えば、使用電力予測部16は、スケジュール対象のジョブとの使用計算ノード数、プロセス数、予測I/O量の差分値が所定の値範囲に収まる実行済みジョブの最大使用電力値の実績を、スケジュール対象の予測最大使用電力値として取得する。所定の値範囲は、例えば、使用計算ノード数、プロセス数、予測I/O量それぞれについて設定される。なお、所定の値範囲は、計算ノードのスペック、及び、使用計算ノード数、プロセス数、予測I/O量の値のばらつき等に応じて異なるため、例えば、実験値に基づいて予め設定される。所定の値の範囲が適切な値に設定されることにより、使用電力予測部16は、より高精度に、予測最大使用電力値を取得することができる。
または、例えば、使用電力予測部16は、スケジュール対象のジョブとの使用計算ノード数、プロセス数、予測I/O量の差分値の割合が所定の範囲内に収まる実行済みジョブの最大使用電力値の実績を、スケジュール対象の予測最大使用電力値として取得する。例えば、スケジュール対象のジョブの使用計算ノード数が50台であって、実行済みジョブの使用計算ノード数の実績値が60台である場合を例示する。この場合、差分値の割合は、20%(=10(差分値)/50(使用計算ノード数)×100)となる。使用電力予測部16は、プロセス数、予測I/O量についても、同様にして、差分値の割合を算出する。そして、使用電力予測部16は、それぞれの差分値の割合が所定の範囲内に収まる実行済みジョブの最大使用電力値の実績を、スケジュール対象の予測最大使用電力値として取得する。
なお、差分値の割合の所定の範囲も、計算ノードのスペック、及び、使用計算ノード数、プロセス数、予測I/O量の値のばらつき等に応じて異なるため、例えば、実験値に基づいて予め設定される。
このように、使用電力予測部16は、スケジュール対象ジョブの一部の登録情報と、実際に実行されたジョブの登録情報の実績値とが一致またはその差が所定の範囲内の実行済みジョブの最大使用電力値の実績値を、スケジュール対象ジョブの予測最大使用電力値として取得する。これにより、使用電力予測部16は、ジョブの登録や最大使用電力値の実績値に基づいて、精度の高いスケジュール対象ジョブの予測最大使用電力値を取得することができる。
なお、使用計算ノード数、プロセス数、予測I/O量のうち、ジョブが使用する電力値に対して、使用計算ノード数の影響が最も大きい。そこで、使用電力予測部16は、スケジュール対象のジョブ(例えば、ジョブA)と使用計算ノード数が一致する、または、使用計算ノード数との差が所定の範囲内である実行済みジョブの最大使用電力値の実績を、スケジュール対象の予測最大使用電力値として取得してもよい。または、使用電力予測部16は、スケジュール対象のジョブの使用計算ノード数に加えて、プロセス数、予測I/O量のいずれかに基づいて、予測最大使用電力値を取得してもよい。
次に、第2の例について説明する。例えば、ジョブ名(ジョブ識別情報)が一致する2つのジョブの処理内容は類似する可能性が高いことにより、使用最大電力値についても近似する値になることが想定される。そこで、第2の例において、ジョブ管理ノード10の使用電力予測部16は、スケジュール対象のジョブのジョブ識別情報に基づいて、ジョブの予測最大使用電力値を取得する。より具体的に、使用電力予測部16は、スケジュール対象のジョブ(例えば、ジョブA)のジョブ識別情報が一致する実行済みジョブの最大使用電力値の実績を、スケジュール対象の予測最大使用電力値として取得する。これにより、使用電力予測部16は、ジョブの予測最大使用電力値を取得することができる。
または、使用電力予測部16は、ジョブ識別情報に加えて、ジョブ種別が一致する実行済みジョブの最大使用電力値の実績を、スケジュール対象の予測最大使用電力値として取得してもよい。ジョブ種別とは、例えば、図4で例示した逐次ジョブまたは並列ジョブ等の種別や、ジョブの処理内容に応じて任意に区分されるグループ等を示す。使用電力予測部16は、ジョブ識別情報とジョブ種別とに基づくことにより、処理内容を同一とするジョブをより高精度に判別し、より精度の高い予測最大使用電力値を取得することができる。
このように、ジョブそれぞれについて、予測最大使用電力値が取得される。続いて、本実施の形態例におけるスケジュール処理の概要について説明する。
[本実施の形態例におけるスケジュール処理の概要]
図8は、本実施の形態例におけるスケジュール処理の概要について説明する図である。図8において、左側の縦軸は計算ノード数を、右側の縦軸は電力値を示し、横軸は時間を示す。また、点線x22は使用制限電力値を示す。また、この例において、図6の例と同様に、ジョブAja〜Ejeのスケジュールが生成される。
本実施の形態例において、ジョブ管理ノード10は、ジョブが使用する計算ノード20の数の合計が、情報処理システムが有する計算ノード20の数(32台)に収まり、ジョブの予測最大使用電力値の合計が使用制限電力値x22に収まるように、スケジュールを生成する。そこで、ジョブ管理ノード10は、まず、ジョブAjaの予測最大使用電力値(20kW)を取得し、ジョブAjaを現在時刻から5時間の時間帯にスケジュールする。これにより、現在時刻から5時間の時間帯において、8台の計算ノード20がジョブAjaに割り当てられ、予測最大使用電力値の合計は20kWとなる。また、図6の例と同様にして、ジョブBjb、ジョブCjcがスケジュールされる。
ただし、ジョブDjdについて、図6の例と同様に、ジョブAjaの終了後の時刻から1時間の時間帯にスケジュールされると、時間帯e1におけるジョブ(ジョブCjc、ジョブDjd)の予測最大使用電力値の合計が使用制限電力値x22を超えてしまう。このため、ジョブ管理ノード10は、時間帯e1におけるジョブの予測最大使用電力値の合計が使用制限電力値x22に収まるように、ジョブDjdをスケジュールする時間帯を後ろの時間帯にシフトさせる。これにより、ジョブDjdは、ジョブAjaの終了後の時刻から1時間の時間帯にスケジュールされ、時間帯e1におけるジョブ(ジョブCjc)の予測最大使用電力値の合計は使用制限電力値x22に収まる。
同様にして、図6のスケジュールに基づくと時間帯e2におけるジョブの予測最大使用電力値の合計が使用制限電力値x22を超える。なお、ジョブEjeの予測最大使用電力値は、単独で、時間帯e2における使用制限電力値x22を超える。このため、ジョブ管理ノード10は、ジョブEjeを、使用制限電力値x22がジョブEjeの予測最大使用電力値を超える時間帯にスケジュールする。このように、本実施の形態例におけるジョブ管理ノード10は、各ジョブの予測最大使用電力値に基づいて、各時間帯におけるジョブの予測最大使用電力値の合計が使用制限電力値x22に収まるように、各ジョブAja〜Ejeをスケジュールすることができる。
続いて、本実施の形態例におけるジョブ管理ノード10の各処理の詳細について説明する前に、ジョブ管理ノード10の全体の処理について、時系列に説明する。
[ジョブ管理ノード10の処理の概要]
図9は、本実施の形態例におけるジョブ管理ノード10の全体の処理の概要について時系列に説明する図である。初めに、ログインノード30においてユーザによってジョブが投入されると、ログインノード30は、ジョブマネージャ12に対してジョブの登録情報を出力する(g1)。ジョブの登録情報は、例えば、ユーザによって入力される。続いて、ジョブの投入に応答して、ジョブ管理ノード10のジョブマネージャ12は、ジョブの予測最大使用電力値を取得する(S1)。ジョブの予測最大使用電力値を取得すると、ジョブマネージャ12は、ジョブスケジューラ11にジョブの登録情報を出力する(g2)。次に、ジョブスケジューラ11は、ジョブの登録情報に基づいて、ジョブのスケジュールを生成する(S2)。
そして、ジョブスケジューラ11は、スケジュールされたジョブの実行開始時刻を監視し(S3)、開始可能なジョブの実行依頼をジョブマネージャ12に出力する(g3)。ジョブマネージャ12は、ジョブの実行依頼に応答して、資源管理部18にジョブの実行依頼を出力する(g4)。そして、資源管理部18は、ジョブの使用計算ノード数に対応する数の計算ノード20にジョブの実行を指示する(g5-1〜n)。続いて、計算ノード20は、資源管理部18からのジョブの実行依頼に応答して、ジョブを実行する(S4)。
また、計算ノード20でジョブが実行されている間、ジョブマネージャ12は、定期的に、実行中ジョブの使用電力値の監視処理を行う(S5)。具体的に、ジョブマネージャ12は、実行中ジョブの使用電力値の取得指示を、資源管理部18に出力する(g6)。これに応答して、資源管理部18は、各計算ノード20から実行中ジョブが使用する電力値を取得し(g7-1〜n、g8-1〜n)、ジョブマネージャ12に出力する(g9)。そして、ジョブマネージャ12は、取得した実行中ジョブの使用電力値の合計が使用制限電力値を超える場合に、必要に応じて実行中ジョブの実行調整を行う(S6)。実行調整の処理の詳細については、後述する。
そして、計算ノード20において実行中のジョブが終了すると、資源管理部18は、ジョブの終了通知とジョブの使用最大電力値とを取得する(g10-1〜n)。続いて、資源管理部18は、ジョブの終了通知とジョブの使用最大電力値とをジョブマネージャ12に出力し(g11)、ジョブマネージャ12は、ジョブの使用最大電力値を、使用電力記憶部17に記憶する(S7)。また、ジョブマネージャ12は、ジョブの終了通知をジョブスケジューラ11に出力する(g12)。ジョブスケジューラ11は、ジョブの終了通知に応答して、ジョブの登録情報のクリア処理を行う(S8)。
図9に示したような流れで、ジョブの投入から実行制御までの一連の処理が行われる。続いて、ジョブ管理ノード10における各処理の詳細について、フローチャート図に基づいて説明する。初めに、ジョブ管理ノード10のジョブスケジューラ11のスケジュール処理について説明する。
[フローチャート:スケジュール処理]
図10は、ジョブのスケジュール処理を説明するフローチャート図である。ジョブ割り当て部14は、初めに、生成済みのスケジュール情報をクリアする(S11)。続いて、ジョブ割り当て部14は、実行中ジョブを優先度の順に整列する(S12)。
実行中ジョブがある場合(S13のYES)、ジョブ割り当て部14は、実行中ジョブから、優先度の高い順にジョブを1つ選択する(S14)。次に、ジョブ割り当て部14は、選択した実行中ジョブが実行される予定の時間帯に、当該実行中ジョブの使用計算ノード数を割り当てる(S15)。また、ジョブ割り当て部14は、割り当て済みの実行中ジョブの予測最大使用電力値の合計に、選択した実行中ジョブの予測最大使用電力値を加算する(S16)。続いて、ジョブ割り当て部14は、次に優先度の高い実行中ジョブについて、工程S14〜S16の処理を行う。
一方、全ての実行中ジョブを割り当てた場合(S13のNO)、または、実行中ジョブがない場合(S13のNO)、ジョブ割り当て部14は、未実行ジョブを優先度の順に整列する(S17)。未実行ジョブがある場合(S18のYES)、ジョブ割り当て部14は、未実行ジョブから、優先度の高い順にジョブを1つ選択する(S19)。続いて、ジョブ割り当て部14は、選択した未実行ジョブの使用計算ノード数を確保可能な時間帯を検索し、当該使用計算ノード数を仮割り当てする(S20)。
続いて、ジョブ割り当て部14は、割り当て済みのジョブの予測最大使用電力値の合計に、選択した未実行ジョブの予測最大使用電力値を加算する(S21)。そして、ジョブ割り当て部14は、選択した未実行ジョブを仮割り当てした時間帯において、予測最大使用電力値の合計が使用制限電力値を超えるか否かを判定する(S22)。使用制限電力値を超える場合(S22のNO)、ジョブ割り当て部14は、選択した未実行ジョブの使用計算ノード数を確保可能な別の時間帯を検索し、仮割り当てし(S20)、工程S21〜工程S22の処理を行う。一方、使用制限電力値を超えない場合(S22のYES)、ジョブ割り当て部14は、選択した未実行ジョブの使用計算ノード数を仮割り当てした時間帯に正式に割り当て、ジョブ実行制御部15にキューイングする(S23)。
続いて、ジョブ割り当て部14は、次に優先度の高い未実行ジョブについて、工程S19〜S23の処理を行う。全ての未実行ジョブについて割り当て処理を行うと、ジョブ割り当て部14はスケジュール処理を終了する。
続いて、ジョブ管理ノード10のジョブ実行制御処理について説明する。
[フローチャート:ジョブの実行制御処理]
図11は、ジョブの実行制御処理について説明するフローチャート図である。ジョブ管理ノード10のジョブ実行制御部15は、ジョブ割り当て部14によってキューイングされた未実行ジョブを実行開始時刻順にソートする(S31)。続いて、ジョブ実行制御部15は、現在、開始が必要なジョブがあるか否かを判定する(S32)。開始が必要なジョブがある場合(S32のYES)、ジョブ実行制御部15は、ジョブをキューから取り出し、割り当てた数の計算ノード20のジョブ実行部20に対してジョブの実行を指示する(S33)。
一方、開始が必要なジョブがない場合(S32のNO)、ジョブ実行制御部15は、ジョブ割り当て部14から新たにキューイングされたジョブがあるか否かを判定する(S34)。新たにキューイングされたジョブがある場合(S34のYES)、ジョブ実行制御部15は、工程S31の処理に戻る。一方、新たにキューイングされたジョブがない場合(S34のNO)、ジョブ実行制御部15は、新たにジョブがキューイングされるまで待機する(S35)。そして、新たにジョブがキューイングされた場合、ジョブ実行制御部15は、工程S31の処理に戻る。
続いて、ジョブ管理ノード10のジョブマネージャ12における実行中ジョブの使用電力値の監視処理について説明する。
[フローチャート:実行中ジョブの電力値監視処理]
図12は、実行中ジョブの電力値監視処理について説明するフローチャート図である。ジョブマネージャ12のジョブ実行制御部15は、実行中ジョブを実行開始時間順にソートして、先頭のジョブを選択する(S41)。ジョブ実行制御部15は、選択した実行中ジョブが使用する現在の電力値を取得する(S42)。具体的に、ジョブ実行制御部15は、実行中ジョブを実行する計算ノード20が使用電力計測部21から取得した使用電力値に基づいて、実行中ジョブの使用電力値を取得する。続いて、ジョブ実行制御部15は、取得した実行中ジョブの電力値が、予測最大使用電力値を超えるか否かを判定する(S43)。
選択したジョブの使用電力値が予測最大使用電力値を超える場合(S43のYES)、ジョブ実行制御部15は、選択した実行中ジョブを電力値超過ジョブとして記憶する(S44)。一方、選択したジョブの使用電力値が予測最大使用電力値を超えない場合(S43のNO)、ジョブ実行制御部15は、次の実行中ジョブがあるか否かを判定する(S45)。次の実行中ジョブがある場合(S45のYES)、ジョブ実行制御部15は、次の実行中ジョブについて工程S42〜S44の処理を行う。
一方、次の実行中ジョブがない場合(S45のNO)、続いて、ジョブ実行制御部15は、電力値超過ジョブが検出されたか否かを判定する(S46)。電力値超過ジョブが検出されなかった場合(S46のNO)、ジョブ実行制御部15は、実行中ジョブの電力値監視処理を終了する。一方、電力値超過ジョブが検出された場合(S46のYES)、ジョブ実行制御部15は、全ての実行中ジョブの使用電力値の合計が使用制限電力値に基づく閾値を超えるか否かを判定する(S47)。使用制限電力値に基づく閾値とは、例えば、使用制限電力値の90%の値を示す。または、ジョブ実行制御部15は、工程S47において、全ての実行中ジョブの使用電力値の合計が使用制限電力値を超えるか否かを判定してもよい。
使用制限電力値に基づく閾値を超える場合(S47のYES)、ジョブ実行制御部15は、実行中ジョブの実行調整処理を行う(S48)。また、使用制限電力値の閾値を超えない場合(S47のNO)、ジョブ実行制御部15は、実行中ジョブの実行調整処理を行わない。続いて、ジョブ実行制御部15は、電力値超過ジョブの情報のクリア処理を行う(S49)。
このように、本実施の形態例におけるジョブ管理ノード10は、電力値超過ジョブが検出された場合であっても、全ての実行中ジョブの使用電力値の合計が使用制限電力値、または、使用制限電力値に基づく閾値を超えない場合は、実行中ジョブの実行調整処理を行わない。これにより、ジョブ管理ノード10は、実行中ジョブの予測最大使用電力値が実際の最大使用電力値を超える場合であっても、実行中ジョブに対する実行調整処理を抑えることができる。
続いて、図12のフローチャート図における実行中ジョブの実行調整処理(S48)について説明する。
[フローチャート:実行調整処理]
図13は、実行調整処理(図12のS48)について説明するフローチャート図である。ジョブ実行制御部15は、電力値が予測最大使用電力値を超える電力値超過ジョブの処理を、例えばX秒、一時的に停止させた後(S51)、処理を再開させる(S52)。値Xは、例えば、実験値に基づいて予め設定される。続いて、ジョブ実行制御部15は、再び、実行中ジョブの使用電力値の合計が使用制限電力値に基づく閾値(または、使用制限電力値)を超えるか否かを判定する(S53)。使用制限電力値に基づく閾値を超えない場合(S53のNO)、ジョブ実行制御部15は、実行調整処理を終了する。
一方、使用制限電力値に基づく閾値を超える場合(S53のYES)、ジョブ実行制御部15は、リトライカウントをインクリメントする(S54)。続いて、ジョブ実行制御部15は、リトライカウントが基準値を超えるか否かを判定する(S55)。基準値を超えない場合(S55のNO)、ジョブ実行制御部15は、電力値超過ジョブに対して、再び、工程S51〜S54の処理を行う。一方、リトライカウントが基準値を超える場合(S55のYES)、即ち、基準値に対応する回数、電力値超過ジョブを一時的に停止させても、実行中ジョブの使用電力値の合計が使用制限電力値に基づく閾値を超える場合、ジョブ実行制御部15は、電力値超過ジョブの実行処理を終了させる(S56)。続いて、ジョブ実行制御部15は、ジョブ割り当て部14に、電力値超過ジョブの予測最大使用電力値が超過していることを通知し、電力値超過ジョブの再スケジュールを指示する(S57)。これにより、ジョブ割り当て部14は、例えば、電力値超過ジョブの終了部分から後の処理を対象として、再スケジュールする。
ジョブ管理ノード10は、本実施の形態例において、スケジュール対象ジョブのジョブ識別情報が一致する実行済みジョブ、または、スケジュール対象ジョブの使用計算ノード数が一致または差が所定の範囲内の実行済みジョブを実行した計算ノード20が使用した最大使用電力値を、予測最大使用電力値として取得する。このため、スケジュール対象ジョブの取得した予測最大使用電力値が、実際にジョブを実行した場合の使用電力値(実測使用電力値)を超える場合が生じる。即ち、ジョブの最大使用電力値の見積りに誤りが生じる場合がある。
そこで、図12、図13のように、本実施の形態例におけるジョブ管理ノード10は、実行中ジョブが使用する電力値を監視し、使用する電力値の合計が使用制限電力値、または、使用制限電力値に基づく閾値を超える場合に、実行中ジョブの実行調整を行う。これにより、ジョブ管理ノード10は、ジョブの予測最大使用電力値が、実際にジョブを実行した場合における最大使用電力値を超えた場合であっても、実行中ジョブのジョブの最大使用電力値の合計を使用制限電力値に収めることができる。
なお、図13の例において、ジョブ管理ノード10は、電力値超過ジョブに対して、一時的な停止制御や終了制御を行うことによって、使用電力値を抑制する。ただし、この例に限定されるものではない。ジョブ管理ノード10は、電力値超過ジョブ以外の実行中ジョブ、例えば、優先度の低いジョブや使用電力値の高いジョブに対して、一時的な停止制御や終了制御を行うことによって、使用電力値を抑制してもよい。
続いて、図10〜図13に基づいて説明してきた、本実施の形態例におけるジョブ管理ノード10の処理を具体例に基づいて説明する。まず、初めに、具体例における使用制限電力値について説明する。
[具体例:使用制限電力値]
図14は、具体的における使用制限電力値の変移について説明する図である。図14によると、具体例における平日の0:00−6:59における使用制限電力値は100kWである。また、平日の07:00−10:59における使用制限電力値は80kWである。同様にして、11:00−14:59における使用制限電力値は60kW、15:00−18:59における使用制限電力値は80kW、19:00−23:59における使用制限電力値は100kWである。
このように、図14の具体例において、例えば、昼間の時間帯(例えば、07:00〜18:59)における使用制限電力値が低く抑えられている。このため、多量の電力を使用するジョブは、例えば、夜間(例えば、19:00〜6:59)の時間帯に実行される。なお、図14の例では、使用制限電力値は、平日と土日に区分して設定される。しかしながら、この例に限定されるものではなく、使用制限電力値は全ての日に対して一律に設定されてもよいし、曜日毎に設定されてもよい。
[具体例:スケジュール処理]
図15は、具体例におけるジョブAja〜Ejeについて説明する図である。具体例では、ジョブAja〜Cjcが実行中の状態で、新たにジョブDjd、ジョブEjeが投入され、ジョブのスケジュール処理が行われる場合を例示する。図15の(A)に示すとおり、初め、投入ジョブの列に、優先度の順にジョブが整列される。この例において、ジョブAja〜Ejeの順に優先度が高い。また、図15の(B)は、計算ノード20の使用状態を示す資源マップm10である。この例において、情報処理システムが有する計算ノード20の数は、32台である。このため、資源マップm10は、計算ノード20の数に対応して32台の枠を有し、各枠には計算ノード20を使用中のジョブ名が示される。
ジョブAja〜Ejeの登録情報は、図5で例示したとおりである。即ち、各ジョブの使用計算ノード数は、ジョブAja:8台、ジョブBjb:3台、ジョブCjc:20台、ジョブDjd:12台、ジョブEje:32台である。このため、図15の(B)において、実行中ジョブAja〜Cjcに対応して、32台の計算ノード20のうち、31(=8+3+20)台の計算ノード20が使用中であることが示される。また、図5によると、各ジョブの予定実行時間は、ジョブAja:5h、ジョブBjb:4h、ジョブCjc:10h、ジョブDjd:1h、ジョブEje:6hである。また、各ジョブの予測最大使用電力値は、ジョブAja:20kW、ジョブBjb:10kW、ジョブCjc:50kW、ジョブDjd:40kW、ジョブEje:100kWである。
図16は、スケジュール処理を説明する第1の図である。前述したとおり、投入ジョブAja〜Ejeのうち、ジョブAja〜Cjcは実行中のジョブである。そこで、ジョブ割り当て部14は、スケジュール情報をクリアし(図10のS11)、実行中ジョブの列に、実行中ジョブをジョブAja〜ジョブCjcの順に並べる(S12)。そして、ジョブ割り当て部14は、優先度の最も高いジョブAjaを、実行中の時間帯06:00〜11:00に割り当てる(S13のYES、S14、S15)。同様にして、ジョブ割り当て部14は、次に優先度が高い実行中ジョブBjbを、実行中の時間帯06:00〜10:00に割り当てる(S13のYES、S14、S15)。同様にして、ジョブ割り当て部14は、次に優先度が高い実行中ジョブCjcを、実行中の時間帯06:00〜16:00に割り当てる(S13のYES、S14、S15)。
このようにして、初めに、実行中ジョブAja〜Cjcについて、割り当て処理が行われる。このとき、ジョブAja〜Cjcが実行される06:00〜10:00(資源マップm11)における合計予測最大使用電力値は80kwとなる。また、ジョブAja、Cjcが実行される10:00〜11:00(資源マップm12)における合計予測最大使用電力値は70kw、ジョブCjcのみが実行される11:00〜16:00(資源マップm13)における合計予測最大使用電力値は50kwとなる。この状態において、各時間帯における合計予測最大使用電力値は、使用制限電力値内に収まっている。
図17は、スケジュール処理を説明する第2の図である。続いて、ジョブ割り当て部14は、未実行ジョブDjd、Ejeを優先度の順に並べ(図10のS17)、優先度の最も高いジョブDjdを選択する(S18のYES、S19)。ジョブDjdの使用計算ノード数は12台であって、予測実行時間は1時間、予測最大使用電力値は40kWである。そして、ジョブ割り当て部14は、未実行ジョブDjdについて、12台の使用ノードを割り当て可能であって、予測実行時間に対応する時間帯11:00〜12:00に仮割り当てする(S20)。続いて、ジョブ割り当て部14は、時間帯11:00〜12:00に割り当て済みの実行中ジョブCjcの予測最大使用電力値50kWに、ジョブDjdの予測最大使用電力値40kWを加算して合計予測最大使用電力値(90kW=50+40)を算出する(S21)。このとき、時間帯11:00〜12:00(資源マップm23)における合計予測最大使用電力値90kwは、使用制限電力値60kwを上回る(S22のNO)。
そこで、ジョブ割り当て部14は、未実行ジョブDjdの割り当て処理を繰り返し(S20〜S22)、最終的に、未実行ジョブDjdについて、12台の使用ノードを割り当て可能であって、予測実行時間に対応する時間帯16:00〜17:00に正式に割り当てる(S23)。このとき、時間帯16:00〜17:00(資源マップm24)における合計予測最大使用電力値40kWは、使用制限電力値80kWに収まる(S22のYES)。これにより、未実行ジョブDjdが、投入ジョブの列から実行待ちジョブの列に移動される。
図18は、スケジュール処理を説明する第3の図である。続いて、未実行ジョブEjeを選択する(S18のYES、S19)。ジョブEjeの使用計算ノード数は32台であって、予測実行時間は6時間、予測最大使用電力値は100kWである。ジョブ割り当て部14は、未実行ジョブEjeについて、32台の使用ノードを割り当て可能であって、予測実行時間に対応する時間帯17:00〜18:00に仮割り当てする(S20)。ただし、時間帯17:00〜18:00における合計予測最大使用電力値100kwは、使用制限電力値80kwを上回る(S22のNO)。そこで、ジョブ割り当て部14は、未実行ジョブEjeの割り当て処理を繰り返し(S20〜S22)、最終的に、未実行ジョブEjeを時間帯19:00〜23:00に正式に割り当てる(S23)。このとき、時間帯19:00〜23:00(資源マップm36)における合計予測最大使用電力値100kWは、使用制限電力値100kWに収まる(S22のYES)。これにより未実行ジョブEjeが、投入ジョブの列から実行待ちジョブの列に移動される。
このように、図15〜図18で説明してきたとおり、新たに投入された未実行ジョブDjd、Ejeのスケジュールが行われる。また、生成されたスケジュールにおけるいずれの時間帯においても、合計予測最大使用電力値は、使用制限電力値に収まる。なお、本実施の形態例において、ジョブが優先度を有する場合を例示したが、この例に限定されるものではない。ジョブは優先度を有していなくてもよい。例えば、ジョブ管理ノード10は、使用計算ノード数の多いジョブから順次、スケジュールを行う。この場合においても、ジョブ管理ノード10は、各時間帯におけるジョブの予測最大使用電力値の合計が使用制限電力値に収まるようにジョブのスケジュールを行うことによって、電力使用制限量の範囲内で、柔軟に、ジョブをスケジュールすることができる。
図19は、使用制限電力値x32と、本実施の形態例におけるジョブ管理処理が行われた場合の使用電力値x31とを例示する図である。図19において、縦軸は電力値を示し、横軸は時間を示す。図19によると、例えば、使用制限電力値x32が抑制される時間帯e3における使用電力値の実績x31と、使用制限電力値x32との差異が小さく抑えられている。また、他の時間帯についても、使用電力値の実績x31と使用制限電力値x32との差異を小さく抑えることが可能になる。
このように、本実施の形態例におけるジョブ管理ノード10は、ジョブのスケジュール生成時に、ジョブの予測最大使用電力値を取得し、各時間帯におけるジョブの予測最大使用電力値の合計が使用制限電力値x32に収まるか否かを逐一判定しながら、ジョブをスケジュールする。これにより、ジョブ管理ノード10は、ジョブの使用電力値の合計が使用制限電力値x32を超えないようなスケジュールを生成することができる。即ち、ジョブ管理ノード10は、使用制限電力値x32を超えない範囲内において、効率的にジョブを実行させることができる。
以上のように、本実施の形態例における情報処理システムのジョブ管理ノード10は、スケジュール対象ジョブとジョブ識別情報が一致する実行済みジョブ、または、スケジュール対象ジョブと使用計算ノード数が一致、または、スケジュール対象ジョブとの使用計算ノード数の差が所定の範囲内にある実行済みジョブを実行した計算ノードが使用した最大使用電力値を、スケジュール対象ジョブの予測最大使用電力値として取得する取得部を有する。また、ジョブ管理ノード10は、スケジュール対象ジョブの予測最大使用電力値の合計が、時刻に応じて設定される制限電力値を超えないように、スケジュール対象ジョブをスケジュールするスケジュール部と、を有する。
このように、本実施の形態例におけるジョブ管理ノード10は、使用計算ノード数またはジョブ識別情報が一致、または、使用計算ノード数の差が所定の範囲内である実行済みジョブの使用最大電力値の実績に基づいて、スケジュール対象のジョブの予測最大使用電力値を取得することができる。即ち、ジョブ管理ノード10は、ジョブの使用計算ノード数やジョブ識別情報を利用することによって、ジョブのスケジュール時に、ジョブの最大使用電力値を見積もることができる。そして、ジョブ管理ノード10は、スケジュール対象のジョブの予測最大使用電力値を利用して、各時間帯におけるジョブの最大使用電力値の合計が、予め、使用制限電力値に収まるように、スケジュールを生成することができる。
これにより、本実施の形態例におけるジョブ管理ノード10は、時刻に応じて設定される使用制限電力値に合わせて、柔軟に、ジョブをスケジュールすることができる。このため、ジョブ管理ノード10は、電力使用制限量の範囲内で実行可能なジョブを効率よく実行させることができる。さらに、ジョブ管理ノード10は、スケジュール対象ジョブの使用計算ノード数と、実際に実行されたジョブの使用計算ノードの実績数とが一致または、その差が所定の範囲内である実行済みジョブの実績の使用電力値の最大値を、スケジュール対象ジョブの予測最大使用電力値として取得する。これにより、ジョブ管理ノード10は、使用計算ノード数や使用電力値の実績値に基づくことにより、より高精度に、スケジュール対象ジョブの予測最大使用電力値を取得することができる。
また、本実施の形態例におけるジョブ管理ノード10において、スケジュール対象ジョブは、さらに、スケジュール対象ジョブのプロセス数、予測データ入出力量のいずれかまたは両方を含む。そして、ジョブ管理ノード10の取得部は、スケジュール対象ジョブの使用計算ノード数に加えて、プロセス数、予測データ入出力量のいずれかまたは両方が一致、または、プロセス数、予測データ入出力量のいずれかまたは両方の差が所定の範囲内にある実行済みジョブを実行した計算ノードが使用した最大使用電力値を、スケジュール対象ジョブの予測最大使用電力値として取得する。
これにより、ジョブ管理ノード10は、使用計算ノード数に加えて、プロセス数、予測データ入出力量のいずれかまたは両方が一致または差が所定の範囲内にある実行済みジョブの実績の使用電力値の最大値に基づいて、スケジュール対象のジョブの予測最大使用電力値を取得することができる。ジョブが使用する電力値は、使用計算ノード数に加えて、プロセス数、予測データ入出力量に応じて変動する。このため、ジョブ管理ノード10は、複数の情報に基づくことにより、より高精度にスケジュール対象のジョブの予測最大使用電力値を取得することができる。
また、本実施の形態例におけるジョブ管理ノード10は、スケジュール対象ジョブは、さらに、スケジュール対象ジョブのジョブ種別を含む。そして、ジョブ管理ノード10の取得部は、ジョブ識別情報とジョブ種別とが一致する実行済みジョブを実行した計算ノードが使用した最大使用電力値を、スケジュール対象ジョブの予測最大使用電力値として取得する。
これにより、ジョブ管理ノード10は、ジョブ識別情報に加えて、ジョブ種別が一致する実行済みジョブの実績の使用電力値の最大値に基づいて、スケジュール対象のジョブの予測最大使用電力値を取得することができる。ジョブ識別情報とジョブ種別が一致するジョブの処理は類似していることが想定されるため、ジョブの電力値についても差が小さいことが想定される。このため、ジョブ管理ノード10は、複数の情報に基づくことにより、より高精度にスケジュール対象のジョブの予測最大使用電力値を取得することができる。
前述したように、本実施の形態例におけるジョブ管理ノード10は、スケジュール対象ジョブのジョブ識別情報が一致、または、スケジュール対象ジョブの使用計算ノード数が一致または使用計算ノード数の差が所定の範囲内にある実行済みジョブを実行した計算ノード20が使用した最大使用電力値を、予測最大使用電力値として取得する。このため、スケジュール対象ジョブの取得した予測最大使用電力値が、実際にジョブを実行した場合の使用電力値(実測使用電力値)を超える場合が生じる。
そこで、本実施の形態例におけるジョブ管理ノード10は、さらに、各計算ノードが実行しているジョブである実行中ジョブの実測使用電力値を取得して、実行中ジョブの実測使用電力値の合計が使用制限電力値を超える場合、実行中ジョブの実行を制御する実行制御部と、を有する。これにより、ジョブ管理ノード10は、ジョブの予測最大使用電力値が実測使用電力値を超える場合であっても、即ち、ジョブの最大使用電力値の見積りに誤りが生じた場合であっても、実行中ジョブの最大使用電力値の合計を使用制限電力値に収めることができる。
また、本実施の形態例におけるジョブ管理ノード10の前記実行制御部は、実行中ジョブの実測使用電力値の合計が制限電力値を超える場合、実行中ジョブのうち実測使用電力値が前記予測最大使用電力値を超える電力値超過ジョブを所定の時間停止させる。ジョブ管理ノード10は、最大使用電力値の見積りに誤りがあった電力値超過ジョブの処理を一時的に停止させることによって、使用電力値を抑制することができる。このため、ジョブ管理ノード10は、ジョブの最大使用電力値の見積りに誤りが生じた場合であっても、実行中ジョブの最大使用電力値の合計を使用制限電力値に収めることができる。
また、本実施の形態例におけるジョブ管理ノード10の実行制御部は、電力値超過ジョブの所定の時間の停止を基準回数行っても、実行中ジョブの実測使用電力値の合計が制限電力値を超える場合、電力値超過ジョブを終了させる。これにより、ジョブ管理ノード10は、電力値超過ジョブの処理を基準回数、一時的に停止させてもジョブの最大使用電力値の合計が使用制限電力値に収まらない場合に、電力値超過ジョブの処理を終了させることによって、使用電力値を抑制することができる。このため、ジョブ管理ノード10は、ジョブの最大使用電力値の見積りに誤りが生じた場合であっても、実行中ジョブの最大使用電力値の合計を使用制限電力値に収めることができる。
以上の実施の形態をまとめると、次の付記のとおりである。
(付記1)
ジョブをそれぞれ実行する複数の計算ノードと、前記ジョブの管理を行うジョブ管理ノードとを有する情報処理システムにおいて、
前記ジョブ管理ノードは、
スケジュール対象ジョブとジョブ識別情報とが一致する実行済みジョブ、または、前記スケジュール対象ジョブと使用計算ノード数が一致、または、前記スケジュール対象ジョブとの使用計算ノード数の差が所定の範囲内にある実行済みジョブを実行した計算ノードが使用した最大使用電力値を、前記スケジュール対象ジョブの予測最大使用電力値として取得する取得部と、
前記スケジュール対象ジョブの予測最大使用電力値の合計が、時刻に応じて設定される制限電力値を超えないように、前記スケジュール対象ジョブをスケジュールするスケジュール部を有する情報処理システム。
(付記2)
付記1において、
前記ジョブ管理ノードはさらに、
各計算ノードが実行しているジョブである実行中ジョブの実測使用電力値を取得して、前記実行中ジョブの実測使用電力値の合計が前記制限電力値を超える場合、前記実行中ジョブの実行を制御する実行制御部と、を有する情報処理システム。
(付記3)
付記1または2において、
前記スケジュール対象ジョブはさらに、
前記スケジュール対象ジョブのプロセス数、予測データ入出力量のいずれかまたは両方を含み、
前記取得部は、
前記スケジュール対象ジョブの使用計算ノード数に加えて、前記プロセス数、前記予測データ入出力量のいずれかまたは両方が一致、または、前記プロセス数、前記予測データ入出力量のいずれかまたは両方の差が所定の範囲内にある実行済みジョブを実行した計算ノードが使用した最大使用電力値を、前記スケジュール対象ジョブの予測最大使用電力値として取得する情報処理システム。
(付記4)
付記1または2において、
前記スケジュール対象ジョブはさらに、
前記スケジュール対象ジョブのジョブ種別を含み、
前記取得部は、
前記ジョブ識別情報と前記ジョブ種別とが一致する実行済みジョブを実行した計算ノードが使用した最大使用電力値を、前記スケジュール対象ジョブの予測最大使用電力値として取得する情報処理システム。
(付記5)
付記2において、
前記実行制御部は、
前記実行中ジョブの実測使用電力値の合計が前記制限電力値を超える場合、前記実行中ジョブのうち実測使用電力値が前記予測最大使用電力値を超える電力値超過ジョブを所定の時間停止させる情報処理システム。
(付記6)
付記5において、
前記実行制御部は、
前記電力値超過ジョブの前記所定の時間の停止を基準回数行っても、前記実行中ジョブの実測使用電力値の合計が前記制限電力値を超える場合、前記電力値超過ジョブを終了させる情報処理システム。
(付記7)
付記1乃至6のいずれかにおいて、
前記スケジュール対象ジョブは優先度を含み、
前記スケジュール部は、
複数の前記スケジュール対象ジョブのうち、前記優先度の高いスケジュール対象ジョブを優先的に、当該スケジュール対象ジョブの予測実行時間を満たす直近の時間帯にスケジュールする情報処理システム。
(付記8)
複数の計算ノードが実行するジョブの管理を行うジョブ管理装置において、
スケジュール対象ジョブとジョブ識別情報とが一致する実行済みジョブ、または、前記スケジュール対象ジョブと使用計算ノード数が一致、または、前記スケジュール対象ジョブとの使用計算ノード数の差が所定の範囲内にある実行済みジョブを実行した計算ノードが使用した最大使用電力値を、前記スケジュール対象ジョブの予測最大使用電力値として取得する取得部と、
前記スケジュール対象ジョブの予測最大使用電力値の合計が、時刻に応じて設定される制限電力値を超えないように、前記スケジュール対象ジョブをスケジュールするスケジュール部を有するジョブ管理装置。
(付記9)
複数の計算ノードが実行するジョブの管理を行うジョブ管理装置の制御プログラムにおいて、
スケジュール対象ジョブとジョブ識別情報とが一致する実行済みジョブ、または、前記スケジュール対象ジョブと使用計算ノード数が一致、または、前記スケジュール対象ジョブとの使用計算ノード数の差が所定の範囲内にある実行済みジョブを実行した計算ノードが使用した最大使用電力値を、前記ジョブ管理装置が有する取得部に、前記スケジュール対象ジョブの予測最大使用電力値として取得させ、
前記スケジュール対象ジョブの予測最大使用電力値の合計が、時刻に応じて設定される制限電力値を超えないように、前記ジョブ管理装置が有するスケジュール部に、前記スケジュール対象ジョブをスケジュールさせるジョブ管理装置の制御プログラム。
(付記10)
ジョブをそれぞれ実行する複数の計算ノードと、前記ジョブの管理を行うジョブ管理ノードとを有する情報処理システムの制御方法において、
スケジュール対象ジョブとジョブ識別情報とが一致する実行済みジョブ、または、前記スケジュール対象ジョブと使用計算ノード数が一致、または、前記スケジュール対象ジョブとの使用計算ノード数の差が所定の範囲内にある実行済みジョブを実行した計算ノードが使用した最大使用電力値を、前記ジョブ管理ノードが有する取得部が、前記スケジュール対象ジョブの予測最大使用電力値として取得し、
前記スケジュール対象ジョブの予測最大使用電力値の合計が、時刻に応じて設定される制限電力値を超えないように、前記ジョブ管理ノードが有するスケジュール部が、前記スケジュール対象ジョブをスケジュールする情報処理システムの制御方法。
10:ジョブ管理ノード、20:計算ノード、30:ログインノード、ST:ストレージ、11:入力装置、12:表示装置、13:通信インタフェース、14:プロセッサ、15:記憶媒体、16:メモリ

Claims (9)

  1. ジョブをそれぞれ実行する複数の計算ノードと、前記ジョブの管理を行うジョブ管理ノードとを有する情報処理システムにおいて、
    前記ジョブ管理ノードは、
    スケジュール対象ジョブとジョブ識別情報とが一致する実行済みジョブ、または、前記スケジュール対象ジョブと使用計算ノード数が一致、または、前記スケジュール対象ジョブとの使用計算ノード数の差が所定の範囲内にある実行済みジョブを実行した計算ノードが使用した最大使用電力値を、前記スケジュール対象ジョブの予測最大使用電力値として取得する取得部と、
    前記スケジュール対象ジョブの予測最大使用電力値の合計が、時刻に応じて設定される制限電力値を超えないように、前記スケジュール対象ジョブをスケジュールするスケジュール部を有する情報処理システム。
  2. 請求項1において、
    前記ジョブ管理ノードはさらに、
    各計算ノードが実行しているジョブである実行中ジョブの実測使用電力値を取得して、前記実行中ジョブの実測使用電力値の合計が前記制限電力値を超える場合、前記実行中ジョブの実行を制御する実行制御部と、を有する情報処理システム。
  3. 請求項1または2において、
    前記スケジュール対象ジョブはさらに、
    前記スケジュール対象ジョブのプロセス数、予測データ入出力量のいずれかまたは両方を含み、
    前記取得部は、
    前記スケジュール対象ジョブの使用計算ノード数に加えて、前記プロセス数、前記予測データ入出力量のいずれかまたは両方が一致、または、前記プロセス数、前記予測データ入出力量のいずれかまたは両方の差が所定の範囲内にある実行済みジョブを実行した計算ノードが使用した最大使用電力値を、前記スケジュール対象ジョブの予測最大使用電力値として取得する情報処理システム。
  4. 請求項1または2において、
    前記スケジュール対象ジョブはさらに、
    前記スケジュール対象ジョブのジョブ種別を含み、
    前記取得部は、
    前記ジョブ識別情報と前記ジョブ種別とが一致する実行済みジョブを実行した計算ノードが使用した最大使用電力値を、前記スケジュール対象ジョブの予測最大使用電力値として取得する情報処理システム。
  5. 請求項2において、
    前記実行制御部は、
    前記実行中ジョブの実測使用電力値の合計が前記制限電力値を超える場合、前記実行中ジョブのうち実測使用電力値が前記予測最大使用電力値を超える電力値超過ジョブを所定の時間停止させる情報処理システム。
  6. 請求項5において、
    前記実行制御部は、
    前記電力値超過ジョブの前記所定の時間の停止を基準回数行っても、前記実行中ジョブの実測使用電力値の合計が前記制限電力値を超える場合、前記電力値超過ジョブを終了させる情報処理システム。
  7. 複数の計算ノードが実行するジョブの管理を行うジョブ管理装置において、
    スケジュール対象ジョブとジョブ識別情報とが一致する実行済みジョブ、または、前記スケジュール対象ジョブと使用計算ノード数が一致、または、前記スケジュール対象ジョブとの使用計算ノード数の差が所定の範囲内にある実行済みジョブを実行した計算ノードが使用した最大使用電力値を、前記スケジュール対象ジョブの予測最大使用電力値として取得する取得部と、
    前記スケジュール対象ジョブの予測最大使用電力値の合計が、時刻に応じて設定される制限電力値を超えないように、前記スケジュール対象ジョブをスケジュールするスケジュール部を有するジョブ管理装置。
  8. 複数の計算ノードが実行するジョブの管理を行うジョブ管理装置の制御プログラムにおいて、
    スケジュール対象ジョブとジョブ識別情報とが一致する実行済みジョブ、または、前記スケジュール対象ジョブと使用計算ノード数が一致、または、前記スケジュール対象ジョブとの使用計算ノード数の差が所定の範囲内にある実行済みジョブを実行した計算ノードが使用した最大使用電力値を、前記ジョブ管理装置が有する取得部に、前記スケジュール対象ジョブの予測最大使用電力値として取得させ、
    前記スケジュール対象ジョブの予測最大使用電力値の合計が、時刻に応じて設定される制限電力値を超えないように、前記ジョブ管理装置が有するスケジュール部に、前記スケジュール対象ジョブをスケジュールさせるジョブ管理装置の制御プログラム。
  9. ジョブをそれぞれ実行する複数の計算ノードと、前記ジョブの管理を行うジョブ管理ノードとを有する情報処理システムの制御方法において、
    スケジュール対象ジョブとジョブ識別情報とが一致する実行済みジョブ、または、前記スケジュール対象ジョブと使用計算ノード数が一致、または、前記スケジュール対象ジョブとの使用計算ノード数の差が所定の範囲内にある実行済みジョブを実行した計算ノードが使用した最大使用電力値を、前記ジョブ管理ノードが有する取得部が、前記スケジュール対象ジョブの予測最大使用電力値として取得し、
    前記スケジュール対象ジョブの予測最大使用電力値の合計が、時刻に応じて設定される制限電力値を超えないように、前記ジョブ管理ノードが有するスケジュール部が、前記スケジュール対象ジョブをスケジュールする情報処理システムの制御方法。
JP2013179088A 2013-08-30 2013-08-30 情報処理システム、ジョブ管理装置、ジョブ管理装置の制御プログラム、及び、情報処理システムの制御方法 Active JP6201530B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013179088A JP6201530B2 (ja) 2013-08-30 2013-08-30 情報処理システム、ジョブ管理装置、ジョブ管理装置の制御プログラム、及び、情報処理システムの制御方法
EP14178973.5A EP2843547A3 (en) 2013-08-30 2014-07-29 Information processing system, job management apparatus, recording medium, and method
US14/449,188 US9286107B2 (en) 2013-08-30 2014-08-01 Information processing system for scheduling jobs, job management apparatus for scheduling jobs, program for scheduling jobs, and method for scheduling jobs

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013179088A JP6201530B2 (ja) 2013-08-30 2013-08-30 情報処理システム、ジョブ管理装置、ジョブ管理装置の制御プログラム、及び、情報処理システムの制御方法

Publications (2)

Publication Number Publication Date
JP2015049562A true JP2015049562A (ja) 2015-03-16
JP6201530B2 JP6201530B2 (ja) 2017-09-27

Family

ID=51359261

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013179088A Active JP6201530B2 (ja) 2013-08-30 2013-08-30 情報処理システム、ジョブ管理装置、ジョブ管理装置の制御プログラム、及び、情報処理システムの制御方法

Country Status (3)

Country Link
US (1) US9286107B2 (ja)
EP (1) EP2843547A3 (ja)
JP (1) JP6201530B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017530449A (ja) * 2014-08-22 2017-10-12 インテル コーポレイション 分散コンピュータシステムへの電力割り振りに変更がある場合に中断され得るジョブ及び中断され得ないジョブを管理するための方法並びに装置
JP2018084907A (ja) * 2016-11-22 2018-05-31 富士通株式会社 ジョブ消費電力推定プログラム、並列処理装置およびジョブ消費電力推定方法
JP2019148901A (ja) * 2018-02-26 2019-09-05 富士通株式会社 情報処理装置、電力管理方法及び電力管理プログラム
JP2020135714A (ja) * 2019-02-25 2020-08-31 富士通株式会社 電力推定プログラム、電力推定装置及び電力推定方法

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9703638B2 (en) * 2013-12-27 2017-07-11 Oracle International Corporation System and method for supporting asynchronous invocation in a distributed data grid
US10503230B2 (en) * 2015-11-25 2019-12-10 Electronics And Telecommunications Research Institute Method and apparatus for power scheduling
JP2019087113A (ja) * 2017-11-09 2019-06-06 富士通株式会社 制御装置、制御方法及び制御プログラム
US11287872B2 (en) * 2020-02-04 2022-03-29 Qualcomm Incorporated Multi-thread power limiting via shared limit
JP2021182224A (ja) * 2020-05-18 2021-11-25 富士通株式会社 ジョブスケジューリングプログラム、情報処理装置およびジョブスケジューリング方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006268324A (ja) * 2005-03-23 2006-10-05 Canon Inc 画像形成システム
JP2008242614A (ja) * 2007-03-26 2008-10-09 Nec Corp ジョブスケジューリング装置及びジョブスケジューリング方法
JP2013066141A (ja) * 2011-08-31 2013-04-11 Canon Inc 管理装置及びその制御方法、並びにプログラム

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6763519B1 (en) * 1999-05-05 2004-07-13 Sychron Inc. Multiprogrammed multiprocessor system with lobally controlled communication and signature controlled scheduling
US8020186B1 (en) * 1999-10-13 2011-09-13 Starz Entertainment, Llc Methods and systems for distributing on-demand programming
US7065764B1 (en) * 2001-07-20 2006-06-20 Netrendered, Inc. Dynamically allocated cluster system
US7444637B2 (en) * 2003-02-18 2008-10-28 Microsoft Corporation Systems and methods for scheduling coprocessor resources in a computing system
EP2341432A1 (en) * 2004-03-13 2011-07-06 Adaptive Computing Enterprises, Inc. System and method of co-allocating a reservation spanning different compute resources types
US8224639B2 (en) 2004-03-29 2012-07-17 Sony Computer Entertainment Inc. Methods and apparatus for achieving thermal management using processing task scheduling
US7712100B2 (en) * 2004-09-14 2010-05-04 International Business Machines Corporation Determining a capacity of a grid environment to handle a required workload for a virtual grid job request
US20060112388A1 (en) * 2004-11-22 2006-05-25 Masaaki Taniguchi Method for dynamic scheduling in a distributed environment
JP2007334497A (ja) 2006-06-13 2007-12-27 Renesas Technology Corp 情報処理装置の省電力化方法、プログラム、およびプログラム実行システム
JP2008257578A (ja) 2007-04-06 2008-10-23 Toshiba Corp 情報処理装置、スケジューラおよび情報処理置のスケジュール制御方法
US10339227B1 (en) * 2007-06-08 2019-07-02 Google Llc Data center design
US8291421B2 (en) * 2008-11-19 2012-10-16 Sharp Laboratories Of America, Inc. Idle task monitor
US8875142B2 (en) * 2009-02-11 2014-10-28 Hewlett-Packard Development Company, L.P. Job scheduling on a multiprocessing system based on reliability and performance rankings of processors and weighted effect of detected errors
US8365175B2 (en) * 2009-03-10 2013-01-29 International Business Machines Corporation Power management using dynamic application scheduling
US8438570B2 (en) * 2010-07-31 2013-05-07 International Business Machines Corporation Resource allocator with knowledge-based optimization
US8640137B1 (en) * 2010-08-30 2014-01-28 Adobe Systems Incorporated Methods and apparatus for resource management in cluster computing
JP5605131B2 (ja) 2010-09-28 2014-10-15 富士通株式会社 ジョブスケジューリングプログラム,方法,および装置
US8689220B2 (en) * 2011-11-30 2014-04-01 International Business Machines Corporation Job scheduling to balance energy consumption and schedule performance

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006268324A (ja) * 2005-03-23 2006-10-05 Canon Inc 画像形成システム
JP2008242614A (ja) * 2007-03-26 2008-10-09 Nec Corp ジョブスケジューリング装置及びジョブスケジューリング方法
JP2013066141A (ja) * 2011-08-31 2013-04-11 Canon Inc 管理装置及びその制御方法、並びにプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017530449A (ja) * 2014-08-22 2017-10-12 インテル コーポレイション 分散コンピュータシステムへの電力割り振りに変更がある場合に中断され得るジョブ及び中断され得ないジョブを管理するための方法並びに装置
JP2018084907A (ja) * 2016-11-22 2018-05-31 富士通株式会社 ジョブ消費電力推定プログラム、並列処理装置およびジョブ消費電力推定方法
JP2019148901A (ja) * 2018-02-26 2019-09-05 富士通株式会社 情報処理装置、電力管理方法及び電力管理プログラム
JP2020135714A (ja) * 2019-02-25 2020-08-31 富士通株式会社 電力推定プログラム、電力推定装置及び電力推定方法
US11048448B2 (en) 2019-02-25 2021-06-29 Fujitsu Limited Information processing apparatus and power estimation method
JP7181464B2 (ja) 2019-02-25 2022-12-01 富士通株式会社 電力推定プログラム、電力推定装置及び電力推定方法

Also Published As

Publication number Publication date
JP6201530B2 (ja) 2017-09-27
US20150067693A1 (en) 2015-03-05
US9286107B2 (en) 2016-03-15
EP2843547A3 (en) 2016-06-01
EP2843547A2 (en) 2015-03-04

Similar Documents

Publication Publication Date Title
JP6201530B2 (ja) 情報処理システム、ジョブ管理装置、ジョブ管理装置の制御プログラム、及び、情報処理システムの制御方法
US11582166B2 (en) Systems and methods for provision of a guaranteed batch
JP6386165B2 (ja) 分散コンピュータシステムへの電力割り振りに変更がある場合に中断され得るジョブ及び中断され得ないジョブを管理するための方法並びに装置
JP6799947B2 (ja) スライディングタイムウィンドウを用いてタスクをスケジュール設定するためのシステムおよび方法
US8832703B2 (en) Dynamically changing job allocation priority based on a restoration rate for each user and time frame
EP3920490B1 (en) Adaptive resource allocation method and apparatus
CN106775932B (zh) 一种云计算系统中随机事件触发的实时工作流调度方法
CN110599148B (zh) 集群数据处理方法、装置、计算机集群及可读存储介质
CN112801331B (zh) 利用虚拟容量和优选位置实时调度进行计算负载的整形
US20140137122A1 (en) Modified backfill scheduler and a method employing frequency control to reduce peak cluster power requirements
US8539495B2 (en) Recording medium storing therein a dynamic job scheduling program, job scheduling apparatus, and job scheduling method
US20180101404A1 (en) Resource and latency estimation-based scheduling
JP5462529B2 (ja) タスク割当装置、および、タスク割当方法
CN107291557B (zh) 一种业务处理方法和装置
CN110196773B (zh) 统一调度计算资源的多时间尺度安全校核系统及方法
US9195515B1 (en) Method and system for process load balancing
JP2016071841A (ja) ジョブ管理装置、ジョブ管理システム、ジョブ管理方法、及びプログラム
KR101349603B1 (ko) 실시간 시스템에서 소프트웨어 업데이트 방법 및 이를 위한 장치
JP6439559B2 (ja) 計算機システム、計算機、ジョブ実行時刻予測方法及びジョブ実行時刻予測プログラム
CN109189581B (zh) 一种作业调度方法和装置
Ogawa et al. Cloud bursting approach based on predicting requests for business-critical web systems
WO2013175540A1 (ja) 情報処理システム
JP6056624B2 (ja) 電力管理方法、電力管理プログラム及び電力管理システム
JP2015095132A (ja) 情報処理システム、情報処理システムの制御方法及び管理装置の制御プログラム
EP2595057B1 (en) Modified backfill scheduler and a method employing frequency control to reduce peak cluster power requirements

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160510

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170328

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170331

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170522

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170801

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170814

R150 Certificate of patent or registration of utility model

Ref document number: 6201530

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150