JP5684629B2 - ジョブ管理システム及びジョブ管理方法 - Google Patents

ジョブ管理システム及びジョブ管理方法 Download PDF

Info

Publication number
JP5684629B2
JP5684629B2 JP2011078932A JP2011078932A JP5684629B2 JP 5684629 B2 JP5684629 B2 JP 5684629B2 JP 2011078932 A JP2011078932 A JP 2011078932A JP 2011078932 A JP2011078932 A JP 2011078932A JP 5684629 B2 JP5684629 B2 JP 5684629B2
Authority
JP
Japan
Prior art keywords
job
node
nodes
assignment target
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011078932A
Other languages
English (en)
Other versions
JP2012215933A (ja
Inventor
葵 川原
葵 川原
宏宇 史
宏宇 史
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
NEC Solutions Innovators Ltd
Original Assignee
NEC Corp
NEC Solutions Innovators Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, NEC Solutions Innovators Ltd filed Critical NEC Corp
Priority to JP2011078932A priority Critical patent/JP5684629B2/ja
Publication of JP2012215933A publication Critical patent/JP2012215933A/ja
Application granted granted Critical
Publication of JP5684629B2 publication Critical patent/JP5684629B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、ジョブ管理システム及びジョブ管理方法に関し、特に、バックフィルスケジューラを使用するジョブ管理システム及びそのジョブ管理方法に関する。
従来、HPC(High Performance Computing)分野を中心に利用されるバッチ処理システムにおいて、多数のノードを接続したクラスタシステム、及びバックフィル型スケジューリングを用いるジョブスケジューラ(以降、「バックフィルスケジューラ」と称する)が利用されている。バックフィルスケジューラとは、クラスタシステムに接続されているノード等のリソースを現在から未来に渡って管理し、ジョブに対してリソースを占有して使用可能な時間枠を割り当てることを特徴とした、ジョブ管理システムのジョブスケジューリング機能である。
ここで、バックフィルスケジューラの特徴であるスケジューラマップについて、図1を参照して説明する。スケジューラマップとは、ジョブが使用するノードと実行する時刻についての情報とを保持するマップである。投入されたジョブは、図1(a)に示すように、まず、キューに繋がれ、優先度が設定される。バックフィルスケジューラは、図1(b)に示すように、キュー内の優先順位の高いジョブからスケジューラマップ上の未使用空間にジョブを配置し(以降、「アサイン」と称する)、時間経過とともに予定されたジョブを実行する。
図1(b)に示すスケジューラマップは、ジョブA〜Eがアサインされた状態を示す。この時の未使用空間は、Node0の斜線部(1),(3)、及びNode1の斜線部(2)である。バックフィルスケジューラは、ユーザが指定したジョブFの使用ノード数や予定実行時間等の情報を元に、ジョブFを実行するのに十分な空きがある未使用空間を探す。この場合は、未使用空間である、Node0の斜線部(3)とNode1の斜線部(2)にジョブFをアサインする。
初期のクラスタシステムにおけるジョブ管理システムでは、ジョブを規模(使用ノード数)ごとにクラス分けし、クラスに対応するキューを設定し、それぞれのキューには、規模に応じて専用のノードを割り当てる。よって、利用者がジョブの規模にあったキューにジョブを投入すると、バックフィルスケジューラは、投入されたジョブをそのキューに割り当てられたクラス用のノードに配置して実行する。このような運用では、投入されるジョブの規模に偏りがあると、一部のキューに割り当てられたノードばかりが使用され、残りのノードは未使用となり、クラスタシステム全体の使用率が低くなってしまうという問題があった。また、キューごとにノード数が固定であるため、運用状況に応じてノードの割り当て数を変更することが困難であった。
そのため、上記の問題を解決するために、現在、全ノードを共有する方式が取られるようになった。この方式では、キューはジョブの規模(使用ノード数)ごとに設定されていても、ノードはキュー間で共有しているため、空いているノードを柔軟に選択できる。バックフィルスケジューラは、ジョブが要求するリソース条件に対して最適な未使用空間を必要ノード数選択し、ジョブをアサインする。ただし、クラスタシステムの使用率を高くするためには、なるべく未使用空間ができないようにスケジューリングすることが求められる。
特開2005−310139号公報 特開2009−026636号公報
しかし、全ノードを共有する方式では、下記課題を有している。
すなわち、一つ目の課題は、スケジューラマップ上の未使用空間の分断(断片化)である。従来の全ノードを共有する方式は、規模の不均一なジョブを、共有されたノードにアサインするため、リソースの空き状況のみを基準にして未使用空間を割り当てるものであり、この方式では未使用空間を分断するようなアサインをしてしまう可能性がある。例えば、HPC分野では実行時間が長時間に及ぶジョブが多い傾向にあるため、時間が短い未使用空間は使われないまま残り、クラスタシステム全体の使用率低下を招く原因になる(図2参照)。
二つ目の課題は、先行ジョブの終了時刻不均一による後続ジョブの実行待ちである。ユーザが宣言するジョブの予定実行時間は長めに設定されていることが多く、ジョブが実行時間より早く終了することがある。このような時、通常は後続のジョブを予定実行開始時刻から早めて実行する。しかし、複数のノードで実行する場合、使用予定のノードが別のジョブによって使用されていると該当ノードが空くまで後続ジョブは実行を待たされることになる。そのため、ジョブが早期に終了したノードは、その間、アイドリング状態となる。HPC分野では、多数のノードを使用するジョブが多いため、上記のような状態はクラスタシステム全体の使用率低下を招く原因になる(図3参照)。
従来技術を参照すると、例えば、特許文献1では、メッシュ構造に相互接続されたクラスタシステムにおいて、クラスタの接続状況を考慮してジョブにノードを割り当てる方法が開示されている。特許文献1に記載の発明は、ジョブ投入時点の未使用ノードのネットワーク接続状態等を考慮して、ジョブの規模に合うノード数を自動的に割り当てることを可能としている。しかし、ノード割り当ての基準は、ノード自体の性能(演算速度、信頼度等)であり、時系列でジョブ間の関係を考慮したものではないため、特許文献1に記載の発明では、前述した課題を解決することはできない。
また、特許文献2では、プログラム構造やI/Oによるジョブの実行待ち、ユーザの使用CPU数の過大申告によるCPUの遊休による無駄を解消するためのスケジューリング方法が開示されている。特許文献2に記載の発明は、スケジューラマップ上の先行ジョブが占有するCPUを使っていない間に限り、後続ジョブが借りて実行することを可能としている。しかし、前述した課題は単一ノードの使用状況に限らず発生するため、特許文献2に記載の発明では、前述した課題を解決することはできない。
さらに、類似の技術として、時間と空間について制御を行うスケジューリング方式の「時空間分割スケジューリング」が知られている。これは、共有するノードの負荷状況を考慮して各ノードに複数のジョブを割当て、ラウンドロビンによる時分割でノードに割り当てたジョブを実行する方式である。しかし、バックフィルスケジューラとは設計思想がそもそも異なるため、クラスタシステムのジョブ管理には使用できない。
そこで、本発明は、かかる事情に鑑み、バックフィルスケジューラにおいて、未使用空間の分断と先行ジョブの予定終了時刻の不均一によるジョブの実行待ちを回避し、クラスタシステムの使用率を向上させることができる新しいジョブ管理システム及びジョブ管理方法を提供することを目的とする。
本発明によるジョブ管理システムは、多数のノードを共有するクラスタシステムにおいて、バックフィルスケジューラを使用するジョブ管理システムであって、投入されたジョブを前記多数のノードから選択し、且つ、時間に応じて割り当てて管理するスケジューラマップから、アサイン対象ジョブが要求するリソースを満たす未使用空間を検索する検索手段と、前記検索した未使用空間に基づいて、ジョブを実行開始する時刻を決定する決定手段と、前記時刻にジョブを割り当て可能な少なくとも1以上の候補ノードから、該各候補ノードの前方ジョブの空き時間長、前方ジョブの使用ノード数、及び前方ジョブの最大ノード間距離の情報を備えるノードリストを作成する作成手段と、前記アサイン対象ジョブの実行予定ノードを選択するためのポリシーによって、前記ノードリストを前記アサイン対象ジョブの実行予定ノードを選択する優先度順にソートするノード優先順位決定手段と、を備える。
本発明によるジョブ管理方法は、多数のノードを共有するクラスタシステムにおいて、バックフィルスケジューラを使用するジョブ管理方法であって、投入されたジョブを前記多数のノードから選択し、且つ、時間に応じて割り当てて管理するスケジューラマップから、アサイン対象ジョブが要求するリソースを満たす未使用空間を検索する段階と、前記検索した未使用空間に基づいて、ジョブを実行開始する時刻を決定する段階と、前記時刻にジョブを割り当て可能な少なくとも1以上の候補ノードから、該各候補ノードの前方ジョブの空き時間長、前方ジョブの使用ノード数、及び前方ジョブの最大ノード間距離の情報を備えるノードリストを作成する段階と、前記アサイン対象ジョブの実行予定ノードを選択するためのポリシーによって、前記ノードリストを前記アサイン対象ジョブの実行予定ノードを選択する優先度順にソートする段階と、を備える。
以上のように構成された本発明のジョブ管理システム等によれば、バックフィルスケジューラ上において小さな未使用空間が減少し、マルチノードジョブを含むより多くのジョブがアサインされやすくなるため、クラスタシステムの使用率を向上させることができる。
スケジューラマップについて説明するための図である。 従来のバックフィルスケジューラマップを示す図である。 従来のバックフィルスケジューラマップを示す図である。 本実施形態のジョブ管理システムの概略構成を示す図である。 本実施形態の前方検査ポリシーを適用した場合のスケジューラマップを示す図である。 本実施形態のジョブ管理方法の処理内容を示すフローチャートである。 本実施形態のジョブ管理方法の処理内容を示すフローチャートである。 本実施形態のジョブ管理方法を説明するためのノードリスト、スケジューラマップ、及びネットワーク構成を示す図である。 本実施形態のジョブ管理方法を用いた例を説明するためのノードリスト、スケジューラマップ、及びネットワーク構成を示す図である。
本発明は、バックフィルスケジューラにおいて、ジョブ投入時にジョブをアサインする空間を選択するためのポリシーを提供する。このポリシーにより、従来技術の課題である未使用空間の分断と先行ジョブの予定終了時刻の不均一によるノードの実行待ち(遊休時間発生)を回避し、クラスタシステムの使用率を向上させるものである。
以下、本発明を実施するための好適な実施形態を、図面を参照しながら説明する。図4は、本実施形態におけるジョブ管理を行うクラスタシステム(ジョブ管理システム)1の概略構成を示す。
ジョブ管理システム1は、多数のノードを共有するクラスタシステムにおける、バックフィルスケジューラを使用するものであり、図4に示すように、ジョブアサイン部10と情報管理部20とを含んで構成される。バックフィルスケジューラは、投入されたジョブ(以下、「アサイン対象ジョブ」と称する)が要求するリソースを満たす未使用空間をスケジューラマップ上から検索し、最も早く実行を開始できる空間を割り当てる機能を有する。この最も早く実行を開始できる時刻を、本実施形態では、予定実行開始時刻という。予定実行開始時刻からジョブを割り当てることができる未使用空間は、1通り以上のノードの組み合わせになる可能性があるため、候補の中から使用するノードを選択するために、後述するポリシーを適用する。なお、ジョブ管理システム1は、ハードウェアとして、例えば、CPU、CPUにバス結合されたROM、RAM、記憶部、入力部、表示部、および入出力インタフェースなど、通常のコンピュータ装置と同様のハードウェアを備えることができる。また、物理的には、専用化したシステム、あるいは汎用の情報処理装置のいずれであってもよい。
ジョブアサイン部10は、投入されたジョブを現在から未来に渡るノード空間にアサインするものであり、空き情報検索手段11、予定実行開始時刻決定手段12、及び実行予定ノード選択部13を含み、実行予定ノード選択部13は、更に、ノード優先順位決定手段14及びノード選択手段15を含む。
空き情報検索手段(検索手段)11は、アサイン対象ジョブが実行可能なリソースを備える未使用空間を検索する機能を有する。
予定実行開始時刻決定手段(決定手段)12は、検索によって得られた未使用空間情報に基づいて、アサイン対象ジョブを最も早く実行開始できる時刻を決定する機能を有する。
実行予定ノード選択部13は、上記実行開始できる時刻にジョブを割り当て可能な少なくとも1以上の候補ノードから、該各候補ノードの前方ジョブの空き時間長、前方ジョブの使用ノード数、及び前方ジョブの最大ノード間距離の情報を備えるノードリストを作成する作成手段として機能する。また、実行予定ノード選択部13は、ノード優先順位決定手段14によってノードに優先順位をつけ、ノード選択手段15によって優先順位に従い、使用するノードを決定する。
ノード優先順位決定手段14は、1つ以上のポリシーを有しており、本実施形態の前方検査ポリシー16は、そのうちの一つである。なお、前方検査ポリシー16については、後述する。
情報管理部20は、ジョブやクラスタシステムに関する情報を管理するものであり、情報更新手段21、ジョブ情報(データベース)22、及びノードの構成を保持するトポロジ情報(データベース)23を含む。
情報更新手段21は、アサインが確定したジョブの情報をジョブ情報22に格納する。
ジョブ情報22は、アサイン済みのジョブに関する情報を保持するものであり、トポロジ情報23は、ノードの構成を保持するものである。ここで、本実施形態では、前方ジョブの最大ノード間距離のコストを「ルータを経由する回数」と定義する。すなわち、トポロジ情報23は、コストを算出するため、ノードの構成が保持される。
ここで、本実施形態の前方検査ポリシー16について説明する。前方検査ポリシー16は、まず、前方空き時間長が昇順になるようにソートする。次に、同じ前方空き時間長を持つノードごとに、アサイン対象ジョブの使用ノード数を基準に、「前方ジョブの使用ノード数とノード数が同一」、「前方ジョブの使用ノード数がアサイン対象ジョブの使用ノード数よりも多く、数が近い」、「前方ジョブの使用ノード数がアサイン対象ジョブの使用ノード数よりも少なく、数が近い」という順に未使用空間情報をソートする。最後に、前方ジョブの使用ノード数が同じノードごとに、最大ノード間距離を昇順に未使用空間情報をソートする。このリストの上位から、アサイン対象ジョブが使用するノード数分、ノードを選択する。この操作により、前方ジョブとの空き時間が少なく、使用ノード数がアサイン対象ジョブと同じか、より多いジョブに割り当てられていて、ノード間の距離も近いノードを選ぶことが可能になる。すなわち、前方ジョブとの空き時間が少ないということは、長い未使用空間を中央で分断していないということであり、また、使用ノード数が同じということは前方ジョブが早期終了したときに後続ジョブの予定実行開始時刻を繰り上げて実行ができるということである。ノード間距離が近いノードを優先して選択することで、通信による待ち時間を減らし、より早くジョブの実行を終えることができる。
図2のスケジューラマップのジョブを、前方検査ポリシー16を使用してアサインした場合のスケジューラマップを図5に示す。ジョブCがジョブAのノードにアサインされ、ジョブGが未使用空間を分断しないなどの改善を得ることができる。その結果、図2に示す場合では(前方検査ポリシー不適用)、ジョブHはジョブFの後ろにアサインされていたが、図5に示す場合では(前方検査ポリシー適用)、ジョブHはジョブFの前にアサインすることが可能となる。
ここで、ノード障害時の対応としては、アサインをキャンセルされたジョブ(以下、「被障害ジョブ」と称する)を元々の予定実行開始時刻近くの未使用空間に再割り当てする運用方法がある。しかし、本実施形態の前方検査ポリシーを使用すれば、スケジューラマップの前方が隙間無く埋められているために、被障害ジョブを再割当てすることが難しくなる。そのため、なるべく早い時刻に再割り当て可能なように、ノード障害時用の優先度を設定することもできる。具体的には、被障害ジョブであることがわかるように識別子を用意し、被障害ジョブの優先度を新たに投入されたジョブよりも高くすることで、被障害ジョブを、未割り当てのジョブの中で最も早く実行開始できるようにしてもよい。
次に、図4,図6〜図8を参照して、本実施形態の動作処理について詳細に説明する。なお、以下では、図4に示すジョブアサイン部10と情報管理部20とがクラスタシステムに1つずつあり、該クラスタシステムのジョブ管理を行うものとする。
まず、ジョブアサイン部10の動作処理を、図6に示すフローチャートを参照しながら説明する。
空き情報検索手段11は、各ノードについて、ユーザが指定した予定実行時間以上の空きがあり、且つ、最も早く実行可能な未使用空間を検索する(ステップS101)。ユーザは、ジョブを投入する際に、使用するノード数やメモリ量、予定実行時間を指定する。
未使用空間があるか否かを判定し(ステップS102)、未使用空間がないと判定した場合(ステップS102:No)、処理を終了する。投入されたジョブは次回の未使用空間検索が行われるまで待ち状態になる。
一方、未使用空間があると判定した場合(ステップS102:Yes)、予定実行開始時刻決定手段12は、使用するノード数や予定実行時間などの条件を満たし、且つ、最も早くジョブを実行開始できる時刻を予定実行開始時刻として決定する(ステップS103)。
実行予定ノード選択部13は、予定実行開始時刻にジョブを割り当てることができるノードについて、ジョブ情報22とトポロジ情報23を参照して、「前方空き時間長、前方ジョブのノード数、前方ジョブの最大ノード間距離」等の情報を備えたノードリストを作成する(ステップS104)。
ノード優先順位決定手段14は、ユーザが指定した使用ノード数以上に、該当するノードがあった場合、実行予定ノードを選択するためのポリシー適用と判定し(ステップS105:Yes)、使用するノードを選択するために1つ以上のポリシーを適用する(ステップS106)。
ノード選択手段15は、適用したポリシーによって優先度順にソートされたノードリストを元に、ユーザによって指定された使用ノード数分を選択し、ジョブをアサインする(ステップS107)。
情報更新手段21は、アサインしたジョブについて、情報管理部20のジョブ情報22を更新する(ステップS108)。
一方、ポリシー適用と判定しない場合(ステップS105:No)、ノード選択手段15は、検索した空き情報に基づいて実行予定のノードを選択し(ステップS109)、情報更新手段21は、実行予定時間と実行予定のノードを更新する(ステップS108)。
以上により、ジョブアサイン部10の動作処理を終了する。
次に、図7及び図8を参照して、本実施形態における、2ノードを使用するジョブXを割り当てるときの前方検査ポリシー16の動作説明をする。なお、以下では、3台ずつのノードを接続したクラスタをさらに上位で接続した計6台からなる構成を想定する場合を例にとって説明する。
ここで、図8に示すネットワーク構成は、ノード間の接続関係を示し、現在時刻で処理しているジョブA,B,C,Dを示す。また、図8のスケジューラマップは、ジョブ管理システムのアサイン状況を示す。さらに、図8の表1〜表3は、ジョブアサイン部10が作成したノードリストに対して、前方検査ポリシー16を適用していく過程を示すものである。
図7に示すように、まず、前方検査ポリシー16は、各ノードにおいて前方空き時間長の順序に従い、ノードリストをソートする(ステップS201)。図8に示す場合においては、ソートした結果、表1に示すノードリストから、表2に示すノードリストになる。
次に、前方検査ポリシー16は、同じ前方空き時間長のノードごとに、前方のジョブが使用するノード数についてソートする(ステップS202)。具体的には、ソートの順番は、アサイン対象ジョブが使用するノード数を基準に、前方ジョブの使用ノード数が「ノード数が同一、より多いが数が近い、より少ないが数が近い」の順序である。図8に示す場合においては、前方空き時間長が「0」のノードを使用するジョブは全て2つのノードを使用するため、ソートした結果は変わらない。
次いで、前方検査ポリシー16は、同じ前方空き時間長、使用ノード数を持つノードごとに、前方ジョブが使用するノード群の最大ノード間距離順になるようにソートする(ステップS203)。図8に示すように、想定するクラスタシステムにおいて、ジョブBが使用するノードは、同じクラスタに接続されているため、最大ノード間距離は0、ジョブAの最大ノード間距離は2となる。したがって、ソートした結果、表2に示すノードリストから、表3に示すノードリストになる。
ジョブアサイン部10は、他に適用するポリシーが登録されていなければ、上記ソートした結果(図8に示す表3)に従い、ジョブXがNode3とNode4に割り当てられる。
なお、アサイン後に使用予定のノードが障害のため停止した場合は、障害ノードにアサインされていたジョブをすべて解除し、再度ジョブアサインを行うことができる。また、解除時に、各ジョブ情報の被障害識別子に障害にあったことを記録することで、再アサイン時に障害発生後に投入されたジョブよりも優先的に未使用空間を割り当てることもできる。
以上のような本実施形態のバックフィルスケジューラを使用するジョブ管理方法では、以下の効果を奏する。
第1の効果は、クラスタシステムの使用率を向上させることである。その理由は、小さな未使用空間が減少し、マルチノードジョブを含む、より多くのジョブがアサインされやすくなるためであり、且つ、実行中ジョブが予定より早期に終了した場合に直後にアサインされているジョブが即時に実行され、システムのアイドリング時間を減少させることができるためである。
第2の効果は、ジョブのターンアラウンドタイム(TAT)を短縮できることである。その理由は、大きい未使用空間にジョブがアサインされやすくなることでジョブが早期に実行されることや、ノード間距離が近いノードを使用することで通信時間を抑えることが、TATの短縮に繋がるためである。
第3の効果は、ジョブの投入数が少ない場合にノードの省電力運転をしやすくなることである。その理由は、ノードの未使用時間を分断しないようにジョブをアサインするため、未使用時間が長時間になりやすく、その間、電源を切るなどの運用が可能になる。通常、起動・終了処理はその処理時間が長くかかるため、未使用時間が短く頻繁にジョブを実行するような場合には、電源を切ることは出来ないからである。
<他の実施形態>
以下、上述の本実施形態で示した前方検査ポリシー16の処理において、前方ジョブが使用するノード群の最大ノード間距離を、ノードの電力供給経路に置き換えた場合を例にとって説明する。この場合、優先する電力供給の経路を使用するノードを使うことになるため、アサインされているジョブが少ない場合は、同じ電力供給の経路(配電盤等)を使うノードをまとめて電源を切ることが可能になり、省電力を優先する運用に使用できる。
図9は、ノード0〜2が繋がる経路(配電盤1)の優先度が高い場合のジョブ投入を示した図である。ノードリストを前方空き時間長、前方ジョブのノード数、電力供給経路の優先順でソートした結果、ジョブXはNode1,2にアサインされる。Node3〜5は未使用になった区間であるため、電源を切ることができる。
<変形例>
以上のように本発明の好適な実施形態について説明したが、本発明は、以上の実施形態に限定されるべきものではなく、特許請求の範囲に表現された思想および範囲を逸脱することなく、種々の変形、追加、および省略が当業者によって可能である。
例えば、上記各実施形態では、ジョブアサイン部10及び情報管理部20において、それぞれの処理機能を有する各手段等が備えられている構成を説明したが、本発明はこれに限られず、例えば、各手段が通信可能に接続されたネットワーク上に又は他の装置に備えて構成することもできる。
さらに、上記各実施形態では、ジョブアサイン部10及び情報管理部20には、用途に応じた各手段がそれぞれ備えられているが、これら各手段は、そのいくつかを一纏めにして構成されていてもよいし、一つの部をさらに複数の部に分割して構成されていてもよい。
上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)多数のノードを共有するクラスタシステムにおいて、バックフィルスケジューラを使用するジョブ管理方法であって、投入されたジョブを前記多数のノードから選択し、且つ、時間に応じて割り当てて管理するスケジューラマップから、アサイン対象ジョブが要求するリソースを満たす未使用空間を検索する段階と、前記検索した未使用空間に基づいて、ジョブを実行開始する時刻を決定する段階と、前記時刻にジョブを割り当て可能な少なくとも1以上の候補ノードから、該各候補ノードの前方ジョブの空き時間長、前方ジョブの使用ノード数、及び前方ジョブの最大ノード間距離の情報を備えるノードリストを作成する段階と、前記アサイン対象ジョブの実行予定ノードを選択するためのポリシーによって、前記ノードリストを前記アサイン対象ジョブの実行予定ノードを選択する優先度順にソートする段階と、を備えるジョブ管理方法。
(付記2)前記ポリシーは、前記候補ノードを前記前方空き時間長の昇順に前記ノードリストをソートし、前記前方空き時間長の昇順にソート後、前記候補ノードを、前記アサイン対象ジョブが使用するノード数を基準にして、前記前方ジョブの使用ノード数とノード数が同一、前記前方ジョブの使用ノード数がアサイン対象ジョブの使用ノード数よりも多く数が近い、及び前記前方ジョブの使用ノード数がアサイン対象ジョブの使用ノード数よりも少なく数が近い、順序に前記ノードリストをソートし、前記候補ノードを前記前方ジョブの最大ノード間距離の昇順に前記ノードリストをソートする、付記1に記載のジョブ管理方法。
(付記3)前記アサイン対象ジョブの実行予定ノードを選択する優先度順にソートされた前記ノードリストを元に、実行予定のノード数分を選択して前記アサイン対象ジョブをアサインする段階を更に備える、付記1又は付記2に記載のジョブ管理方法。
(付記4)多数のノードを共有するクラスタシステムにおいて、バックフィルスケジューラを使用するジョブ管理システムであって、投入されたジョブを前記多数のノードから選択し、且つ、時間に応じて割り当てて管理するスケジューラマップから、アサイン対象ジョブが要求するリソースを満たす未使用空間を検索する検索手段と、前記検索した未使用空間に基づいて、ジョブを実行開始する時刻を決定する決定手段と、前記時刻にジョブを割り当て可能な少なくとも1以上の候補ノードから、該各候補ノードの前方ジョブの空き時間長、前方ジョブの使用ノード数、及び前方ジョブの最大ノード間距離の情報を備えるノードリストを作成する作成手段と、前記アサイン対象ジョブの実行予定ノードを選択するためのポリシーによって、前記ノードリストを前記アサイン対象ジョブの実行予定ノードを選択する優先度順にソートするノード優先順位決定手段と、を備えるジョブ管理システム。
本発明は、多数のノードを共有し、バックフィルスケジューラによってジョブ管理を行うクラスタシステムにおいて、クラスタシステムの高使用率を実現するジョブのアサイン方法に適用できる。
1…ジョブ管理システム、10…ジョブアサイン部、11…空き情報検索手段、12…予定実行開始時刻決定手段、13…実行予定ノード選択部、14…ノード優先順位決定手段、15…ノード選択手段、16…前方検査ポリシー。

Claims (4)

  1. CPU及びメモリを備える情報処理装置によって実行されるジョブ管理方法であって、
    ノードを特定する軸と時刻を特定する軸の2軸によって規定される空間に割り当てられたジョブの情報を保持するスケジューラマップから、アサイン対象ジョブが要求する予定実行時間以上に対応する、各ノードの未使用空間を検索する段階と、
    前記検索した未使用空間において、前記アサイン対象ジョブが要求するノード数及び予定実行時間の条件を満たし、且つ、最も早く前記アサイン対象ジョブを実行開始できる時刻を、予定実行開始時刻として決定する段階と、
    前記スケジューラマップを参照して、前記予定実行開始時刻が未使用空間となっている少なくとも1以上の候補ノードを選択し、前記選択した候補ノードについて、該各候補ノードの前方ジョブの空き時間長、及び前方ジョブの使用ノード数の情報を少なくとも備えるノードリストを作成する段階と、
    前記アサイン対象ジョブの実行予定ノードを選択するためのポリシーによって、前記ノードリストを前記アサイン対象ジョブの実行予定ノードを選択する優先度順にソートする段階と、
    前記優先度順にソートされた前記ノードリストを元に、前記アサイン対象ジョブが要求するノード数分のノードを選択し、前記選択したノードの前記予定実行開始時刻を含む前記検索した未使用空間に前記アサイン対象ジョブを割り当てる段階と、
    を備えるジョブ管理方法。
  2. 前記ポリシーは、
    前記候補ノードを前記前方ジョブの空き時間長の昇順に前記ノードリストをソートし、
    記前方空き時間長の昇順にソート後、前記候補ノードを、前記アサイン対象ジョブが使用するノード数を基準にして、前記前方ジョブの使用ノード数とノード数が同一、前記前方ジョブの使用ノード数がアサイン対象ジョブの使用ノード数よりも多く数が近い、及び前記前方ジョブの使用ノード数がアサイン対象ジョブの使用ノード数よりも少なく数が近い、順序に前記ノードリストをソートし、
    前記候補ノードを前記前方ジョブの最大ノード間距離の昇順に前記ノードリストをソートする、請求項1に記載のジョブ管理方法。
  3. 前記ノードリストを作成する段階は、前記スケジューラマップ及びノードの構成を保持するトポロジ情報データベースを参照して、前記選択した候補ノードについて、該各候補ノードの前方ジョブの空き時間長、前方ジョブの使用ノード数、及び前方ジョブの最大ノード間距離の情報を少なくとも備えるノードリストを作成する段階を含む、請求項1又は2記載のジョブ管理方法。
  4. ノードを特定する軸と時刻を特定する軸の2軸によって規定される空間に割り当てられたジョブの情報を保持するスケジューラマップから、アサイン対象ジョブが要求する予定実行時間以上に対応する、各ノードの未使用空間を検索する検索手段と、
    前記検索した未使用空間において、前記アサイン対象ジョブが要求するノード数及び予定実行時間の条件を満たし、且つ、最も早く前記アサイン対象ジョブを実行開始できる時刻を、予定実行開始時刻として決定する決定手段と、
    前記スケジューラマップを参照して、前記予定実行開始時刻が未使用空間となっている少なくとも1以上の候補ノードを選択し、前記選択した候補ノードについて、該各候補ノードの前方ジョブの空き時間長、及び前方ジョブの使用ノード数の情報を少なくとも備えるノードリストを作成する作成手段と、
    前記アサイン対象ジョブの実行予定ノードを選択するためのポリシーによって、前記ノードリストを前記アサイン対象ジョブの実行予定ノードを選択する優先度順にソートするノード優先順位決定手段と、
    前記優先度順にソートされた前記ノードリストを元に、前記アサイン対象ジョブが要求するノード数分のノードを選択し、前記選択したノードの前記予定実行開始時刻を含む前記検索した未使用空間に前記アサイン対象ジョブを割り当てる手段と、
    を備えるジョブ管理システム。
JP2011078932A 2011-03-31 2011-03-31 ジョブ管理システム及びジョブ管理方法 Active JP5684629B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011078932A JP5684629B2 (ja) 2011-03-31 2011-03-31 ジョブ管理システム及びジョブ管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011078932A JP5684629B2 (ja) 2011-03-31 2011-03-31 ジョブ管理システム及びジョブ管理方法

Publications (2)

Publication Number Publication Date
JP2012215933A JP2012215933A (ja) 2012-11-08
JP5684629B2 true JP5684629B2 (ja) 2015-03-18

Family

ID=47268669

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011078932A Active JP5684629B2 (ja) 2011-03-31 2011-03-31 ジョブ管理システム及びジョブ管理方法

Country Status (1)

Country Link
JP (1) JP5684629B2 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6118175B2 (ja) * 2013-05-24 2017-04-19 株式会社Nttドコモ 通信システム及び通信処理方法
JP2015001828A (ja) * 2013-06-14 2015-01-05 富士通株式会社 割当プログラム、割当装置および割当方法
JP6349837B2 (ja) * 2014-03-25 2018-07-04 日本電気株式会社 スケジューラ装置及びそのスケジューリング方法、演算処理システム、並びにコンピュータ・プログラム
JP6364880B2 (ja) * 2014-03-31 2018-08-01 富士通株式会社 並列計算機システム,ジョブ管理装置の制御プログラム,及び並列計算機システムの制御方法
JP6369257B2 (ja) * 2014-09-19 2018-08-08 富士通株式会社 情報処理システム、情報処理システムの制御方法、管理装置、及び制御プログラム
JP6446989B2 (ja) 2014-10-16 2019-01-09 富士通株式会社 計算機システム,処理方法及びジョブ処理プログラム
JP6428380B2 (ja) * 2015-03-02 2018-11-28 富士通株式会社 並列計算システム、ジョブ管理装置、ジョブ管理プログラム、およびジョブ管理方法
JP6540107B2 (ja) 2015-03-09 2019-07-10 富士通株式会社 並列演算装置、並列演算システム、およびジョブ制御プログラム
JP6515708B2 (ja) 2015-07-06 2019-05-22 富士通株式会社 情報処理装置、並列計算機システム、ジョブスケジュール設定プログラムおよびジョブスケジュール設定方法
JP2019522281A (ja) * 2016-06-16 2019-08-08 ブル・エス・アー・エス コンピュータクラスタにおける電力供給を管理する方法
JP6683046B2 (ja) * 2016-07-13 2020-04-15 富士通株式会社 並列処理装置、ジョブ管理方法、およびジョブ管理プログラム
JP6796040B2 (ja) * 2017-08-29 2020-12-02 日立オートモティブシステムズ株式会社 アクセス制御装置
JP2019087113A (ja) * 2017-11-09 2019-06-06 富士通株式会社 制御装置、制御方法及び制御プログラム
CN112948111B (zh) * 2021-02-26 2023-07-14 北京奇艺世纪科技有限公司 一种任务分配方法、装置、设备及计算机可读介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07141305A (ja) * 1993-11-16 1995-06-02 Hitachi Ltd 並列計算機の実行制御方法
JP2001022601A (ja) * 1999-07-12 2001-01-26 Hitachi Ltd ジョブ実行制御方法及び並列計算機システム
US7433931B2 (en) * 2004-11-17 2008-10-07 Raytheon Company Scheduling in a high-performance computing (HPC) system
WO2006087713A2 (en) * 2005-02-16 2006-08-24 Yissum Research Development Company Of The Hebrew University Of Jerusalem System and method for backfilling with system-generated predictions rather than user runtime estimates
JP5614318B2 (ja) * 2011-02-15 2014-10-29 富士通株式会社 スケジューリングプログラム,方法および装置

Also Published As

Publication number Publication date
JP2012215933A (ja) 2012-11-08

Similar Documents

Publication Publication Date Title
JP5684629B2 (ja) ジョブ管理システム及びジョブ管理方法
JP3658420B2 (ja) 分散処理システム
US20190324819A1 (en) Distributed-system task assignment method and apparatus
CN110297699B (zh) 调度方法、调度器、存储介质及系统
US8719834B2 (en) Information processing system, method, program and integrated circuit for maintaining balance of processing loads with respect to real-time tasks
JP4387174B2 (ja) 複数の優先順位グループに関連付けられたプロセスを複数のリソース間に分散する方法
US9256471B2 (en) Task scheduling method for priority-based real-time operating system in multicore environment
KR101733117B1 (ko) 멀티코어 시스템의 태스크 분배 방법 및 장치
WO2024021489A1 (zh) 一种任务调度方法、装置及Kubernetes调度器
US7920282B2 (en) Job preempt set generation for resource management
KR101770191B1 (ko) 자원 할당 방법 및 그 장치
JPH0816410A (ja) スケジュール制御装置とその方法
JP6010975B2 (ja) ジョブ管理装置、ジョブ管理方法、及びプログラム
JP2008226023A (ja) ジョブ割当装置、及びジョブ割当方法
JP2012094136A (ja) セル生産方式における適応型ロットサイズ決定のためのシステムおよび方法
CN116010064A (zh) Dag作业调度和集群管理的方法、系统及装置
WO2020108337A1 (zh) 一种cpu资源调度方法及电子设备
CN110048966B (zh) 基于截止时间的最小化系统开销的Coflow调度方法
CN116610422A (zh) 一种任务调度方法、装置和系统
CN117608760A (zh) 应用于Kubernetes的云上应用混合部署方法
JP5577745B2 (ja) クラスタシステム、プロセス配置方法、及びプログラム
CN115361349B (zh) 资源使用方法和装置
JP5983623B2 (ja) タスク配置装置及びタスク配置方法
JPH08152903A (ja) マルチプロセッサシステム
JP6540107B2 (ja) 並列演算装置、並列演算システム、およびジョブ制御プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140210

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20140617

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141003

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141007

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141127

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150115

R150 Certificate of patent or registration of utility model

Ref document number: 5684629

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150