JP2012173753A - Job scheduling system, job scheduling method and program - Google Patents
Job scheduling system, job scheduling method and program Download PDFInfo
- Publication number
- JP2012173753A JP2012173753A JP2011031758A JP2011031758A JP2012173753A JP 2012173753 A JP2012173753 A JP 2012173753A JP 2011031758 A JP2011031758 A JP 2011031758A JP 2011031758 A JP2011031758 A JP 2011031758A JP 2012173753 A JP2012173753 A JP 2012173753A
- Authority
- JP
- Japan
- Prior art keywords
- job
- delay
- scheduler map
- execution
- assignment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Stored Programmes (AREA)
Abstract
Description
本発明は、ジョブスケジューリングシステムに関する。 The present invention relates to a job scheduling system.
複数の計算ノードで構成されるクラスタリングシステムにおいて、バックフィル型スケジューリングを用いるジョブスケジューラ(以下、「バックフィルスケジューラ」という)が利用されている。バックフィルスケジューラは、システムの計算リソースと時間を軸にした二次元マップ(以下、「スケジューラマップ」という)を使用して、ジョブの予定実行時刻を管理しながら、ジョブが要求するリソースを割り当てる(以下、「アサインする」という)スケジューラである。スケジューラマップによるジョブスケジューリングシステムは、HPC(High Performance Computing)分野を中心に利用されている。 In a clustering system composed of a plurality of computing nodes, a job scheduler using backfill type scheduling (hereinafter referred to as “backfill scheduler”) is used. The backfill scheduler uses a two-dimensional map (hereinafter referred to as a “scheduler map”) centered on the calculation resources and time of the system to allocate the resources required by the job while managing the scheduled execution time of the job ( Hereinafter, the scheduler is referred to as “assign”. A job scheduling system based on a scheduler map is used mainly in the field of HPC (High Performance Computing).
従来のスケジューラマップによるジョブスケジューリングシステムでは、システムの計算リソースの使用が少ない少規模ジョブに、システムの計算リソースを多用する大規模ジョブが追い越され続けることにより、長期間、大規模ジョブの実行が開始されない課題があった。図1は、従来のスケジューラマップによるジョブスケジューリングシステムの課題を説明するための図である。図1のスケジューラマップ101は、縦軸に計算ノード数、横軸に時間がとられている。スケジューラマップ101では、現在時刻からマップ終端までの時間の間に、処理が開始するジョブに対して、計算ノード1〜4で実行するジョブを予約することができる。図1の例では、アサイン待ちジョブ102として、ジョブ7〜10がある状態が示されている。この例では、システムの計算リソースの使用が少ない少規模ジョブ8、9に、システムの計算リソースを多用する大規模ジョブ7が追い越されることにより、長期間、大規模ジョブ7の実行が開始されない状態が示されている。
In a conventional job scheduling system using a scheduler map, a large-scale job that uses a large amount of the system's computational resources continues to be overtaken by a small-scale job that uses a small amount of the system's computational resources. There was a problem that was not. FIG. 1 is a diagram for explaining a problem of a job scheduling system based on a conventional scheduler map. In the
従来のスケジューラマップ101によるジョブスケジューリングシステムは、図1で説明した課題を解決するために、追い越し禁止機能が実装されている。図2は、従来のスケジューラマップ101によるジョブスケジューリングシステムの追い越し禁止機能を説明するための図である。追い越し禁止機能とは、一般に、一定時間アサインできなかったジョブが存在する場合には、後続のジョブを追い越し禁止にすることで該当ジョブのアサインを優先させる機能である。図2の例では、アサイン待ちジョブ102として、ジョブ7〜10がある状態が示されている。この例では、一定時間アサインできなかったジョブ7が存在するため、後続のジョブ8、9、10が、ジョブ7に対して追い越し禁止に設定されている。しかし、追い越し禁止機能を有効にすると、小規模ジョブがスケジューラマップ101にアサイン出来ず、計算ノードに空き領域が増え、システム稼働率が低下することがある。図2の例では、追い越し禁止機能を有効にしたため、計算ノード3の空き領域が増えている。
The conventional job scheduling system based on the
これまでのHPC分野におけるクラスタリングシステムでは、規模(使用計算ノード数、CPU数)毎にクラス分けし、クラス毎に使用する計算リソースを分ける運用が主流であった。このような運用では、大規模ジョブと小規模ジョブでクラスが異なるため、リソースが競合することはなかった。しかし、近年は、クラスタリングシステムの全リソースを共有して管理する方法が主流となってきており、大規模ジョブと小規模ジョブでリソースの競合による問題が発生するようになってきた。そのため、大規模ジョブと小規模ジョブが混合していても、効率よくジョブをアサインすることにより、クラスタリングシステムの稼動率の低下を抑えるジョブスケジューリングシステムが求められている。 Conventional clustering systems in the HPC field have been mainly operated by classifying each size (number of calculation nodes used, number of CPUs) and dividing calculation resources used for each class. In such an operation, since the class is different between a large-scale job and a small-scale job, there is no resource contention. However, in recent years, a method of sharing and managing all resources of the clustering system has become mainstream, and problems due to resource competition have occurred between large-scale jobs and small-scale jobs. Therefore, there is a need for a job scheduling system that suppresses a reduction in the operating rate of the clustering system by efficiently assigning jobs even when large-scale jobs and small-scale jobs are mixed.
本発明の分野に関する文献公知発明としては、特開2001−22601号公報(特許文献1)がある。特開2001−22601号公報では、ジョブのスケジューリングに関する技術として、複数の実行待ちジョブのうち、先頭に実行要求が発行されたジョブに対して、優先的にスケジュールを行うジョブ実行制御方法及び並列計算機システムに関する技術が開示されている。 Japanese Patent Laid-Open No. 2001-22601 (Patent Document 1) is known as a document known invention in the field of the present invention. In Japanese Patent Laid-Open No. 2001-22601, as a technique related to job scheduling, a job execution control method and a parallel computer that preferentially schedule a job whose execution request is issued at the head of a plurality of jobs waiting to be executed Techniques related to the system are disclosed.
本発明の目的は、大規模ジョブの実行開始を遅延させない範囲で、可能な限り小規模ジョブの実行を先行させることにより、システムの稼働率を向上させるジョブスケジューリングシステムを提供することにある。 An object of the present invention is to provide a job scheduling system that improves the operating rate of a system by preceding execution of a small-scale job as much as possible without delaying the start of execution of the large-scale job.
本発明のジョブスケジューリングシステムは、スケジューラマップを保存するスケジューラマップ保存部と、スケジューラマップにアサインするジョブを、バックフィル型スケジューリングにより選択するアサイン対象ジョブ選択部と、スケジューラマップの空き領域を検索する空き情報検索部と、遅延禁止ジョブを追い越しても、遅延禁止ジョブのジョブ実行開始時刻を遅延させない追越可能ジョブを判別する追越可能判別部と、追越可能ジョブの実行予定時刻を決定する実行予定時刻決定部と、追越可能ジョブの実行予定計算ノードを選択する実行予定計算ノード選択部とを備える。 A job scheduling system according to the present invention includes a scheduler map storage unit that stores a scheduler map, an assignment target job selection unit that selects a job to be assigned to the scheduler map by backfill scheduling, and a space for searching for an empty area of the scheduler map. Information search unit, passable discriminating unit that discriminates a passable job that does not delay the job execution start time of a delay-prohibited job even if it overtakes a delay-prohibited job, and execution that determines the scheduled execution time of the passable job A scheduled time determination unit; and an execution schedule calculation node selection unit that selects an execution schedule calculation node of the passable job.
本発明のジョブスケジューリング方法は、ジョブスケジューリングシステムにより実施されるジョブスケジューリング方法である。スケジューラマップ保存部が、スケジューラマップを保存するステップと、アサイン対象ジョブ選択部が、スケジューラマップにアサインするジョブを、バックフィル型スケジューリングにより選択するステップと、アサイン対象ジョブ選択部が、選択するステップにより選択したジョブが、遅延禁止ジョブである場合には、選択したジョブを特別アサイン領域に割り当てるステップと、空き情報検索部が、スケジューラマップの空き領域を検索するステップと、追越可能判別部が、遅延禁止ジョブを追い越しても、遅延禁止ジョブのジョブ実行開始時刻を遅延させない追越可能ジョブを判断するステップと、実行予定時刻決定部が、追越可能ジョブの実行予定時刻を決定するステップと、実行予定計算ノード選択部が、追越可能ジョブの実行予定計算ノードを選択するステップとを含む。 The job scheduling method of the present invention is a job scheduling method implemented by a job scheduling system. The scheduler map storing unit stores the scheduler map, the assignment target job selecting unit selects a job to be assigned to the scheduler map by backfill scheduling, and the assignment target job selecting unit selects the job If the selected job is a delay-prohibited job, a step of assigning the selected job to the special assignment area, a step of searching for a free area of the scheduler map, and a passable discriminating unit, A step of determining a passable job that does not delay the job execution start time of the delay-prohibited job even if it overtakes the delay-prohibited job, and a step of determining a scheduled execution time of the passable job, The scheduled execution node selection unit will execute the job that can be overtaken. And a step of selecting a schedule compute nodes.
本発明によれば、大規模ジョブの実行開始を遅延させない範囲で、可能な限り小規模ジョブの実行を先行させることにより、システムの稼働率を向上させるジョブスケジューリングシステムを提供することができる。 According to the present invention, it is possible to provide a job scheduling system that improves the operating rate of a system by preceding execution of a small-scale job as much as possible without delaying the start of execution of the large-scale job.
(第1実施形態)
添付図面を参照して、本発明の第1実施形態によるジョブスケジューリングシステム100を以下に説明する。
(First embodiment)
A
[構成の説明]
はじめに、本実施形態におけるジョブスケジューリングシステム100の機能構成の説明を行う。図3は、本発明の第1実施形態におけるジョブスケジューリングシステム100のブロック図である。
[Description of configuration]
First, the functional configuration of the
ジョブスケジューリングシステム100は、アサイン対象ジョブ選択部10、スケジューラマップ保存部20及びジョブアサイン部30を備える。
The
アサイン対象ジョブ選択部10は、遅延禁止ジョブ判別部11及び特別アサイン領域確保部12を備え、アサイン待ちジョブ22から、スケジューラマップ21にアサインするジョブを選択する。図4は、本発明の第1実施形態におけるジョブスケジューリングシステム100のスケジューラマップ21を説明するための図である。図4のスケジューラマップ21は、縦軸に計算ノード数、横軸に時間がとられている。スケジューラマップ21では、現在時刻からマップ終端までの時間の間に、処理が開始するジョブに対して、計算ノード1〜4で実行するジョブを予約することができる。図4のスケジューラマップ21は、特別アサイン領域23を備えている点が、図1及び図2のスケジューラマップ101とは異なる。特別アサイン領域23については後述する。遅延禁止ジョブ判別部11は、アサイン待ちジョブ22の対象ジョブが、ジョブ実行開始時刻の遅延が禁止されたジョブとなっているかを判別する。遅延禁止ジョブ判別部11は、対象ジョブのジョブ実行開始時刻の遅延が禁止されており、特別アサイン領域23が、まだスケジューラマップ21に確保されていない場合に、特別アサイン領域確保部12の処理を呼び出す。特別アサイン領域確保部12は、ジョブ実行開始時刻の遅延が禁止となったジョブをアサインするための特別アサイン領域23を、スケジューラマップ21に確保する。
The assignment target
スケジューラマップ保存部20は、スケジューラマップ21の情報を保存する。スケジューラマップ21の情報には、ジョブが使用する計算リソース、ジョブの実行開始時刻及びジョブの実行所要時間等が含まれる。
The scheduler
ジョブアサイン部30は、空き領域情報検索部31、実行予定時刻決定部32、追越可能判別部33及び実行予定計算ノード選択部34を備え、スケジューラマップ21にジョブをアサインする。空き領域情報検索部31は、スケジューラマップ21の空き領域(アサイン可能なリソースの場所)を検索する。実行予定時刻決定部32は、アサイン待ちジョブ22のジョブの実行予定時刻を決定する。追越可能判別部33は、特別アサイン領域に割り当てられたジョブを追い越しても、特別アサイン領域に割り当てられたジョブのジョブ実行開始時刻を遅延させないジョブ(以下、「特別アサイン領域23にオーバーラップしないジョブ」という)を判断する。追越可能判別部33は、特別アサイン領域23にオーバーラップしないジョブについては、特別アサイン領域23に割り当てたジョブを追い越してアサインすることを許可する。実行予定計算ノード選択部34は、実行予定時刻が決定したジョブのアサイン領域を、スケジューラマップ21に確保する。
The
次に、本実施形態におけるジョブスケジューリングシステム100のハードウェア構成の説明を行う。図5は、本発明の第1実施形態におけるジョブスケジューリングシステム100のハードウェア構成図である。
Next, the hardware configuration of the
本実施形態のジョブスケジューリングシステム100は、図5のようなクラスタリングシステム50において、計算ノード1〜4を管理する管理ノード5において実施される。なお、図5のクラスタリングシステム50の計算ノードの数は4つであるが、計算ノードの数は4つに限られない。管理ノード5におけるジョブスケジューリングシステム100は、メモリ8に展開されるジョブスケジューリングプログラム9が、CPU6により実行されることにより実現される。ジョブスケジューリングプログラム9は、HDD(Hard Disk Drive)等の補助記憶装置7に格納されている。
The
[動作方法の説明]
次に、本実施形態におけるジョブスケジューリングシステム100において、ジョブスケジューリング方法の説明を行う。図6は、本発明の第1実施形態におけるジョブスケジューリングシステム100のジョブスケジューリング方法のフローチャートである。
[Description of operation method]
Next, a job scheduling method in the
(ステップS1)
アサイン対象ジョブ選択部10は、アサイン待ちジョブ22から、アサイン対象のジョブを選択する。
(Step S1)
The assignment target
(ステップS2)
遅延禁止ジョブ判別部11は、ステップS1で選択したジョブが、実行開始遅延禁止ジョブであるかどうかを判別する。遅延禁止ジョブ判別部11は、実行開始遅延禁止ジョブである場合には、ステップS3に進み、実行開始遅延禁止ジョブでない場合には、ステップS6に進む。
(Step S2)
The delay prohibition
実行開始遅延禁止ジョブの判別方法の例としては、アサイン待ちジョブ22に長期間滞留するジョブを割り当てる方法が考えられる。図4の例では、ジョブ7のようにリソースを多用するジョブは、スケジューラマップ21に割り当てることができずに、アサイン待ちジョブ22として滞留することが多い。そのため、このようなジョブを、優先度が高いジョブであると考え、実行開始遅延禁止ジョブとする方法が考えられる。
As an example of a method for determining an execution start delay prohibition job, a method of assigning a job that stays for a long time to the
(ステップS3)
遅延禁止ジョブ判別部11は、特別アサイン領域23がスケジューラマップ21に確保されているか確認する。遅延禁止ジョブ判別部11は、特別アサイン領域23が確保されている場合には、ステップS5に進み、特別アサイン領域23が確保されていない場合には、ステップS4に進む。
(Step S3)
The delay prohibition
(ステップS4)
特別アサイン領域確保部12は、特別アサイン領域23をスケジューラマップ21のマップ終端に確保する。特別アサイン領域23は、他のジョブによる追い越しによって、ジョブ開始時刻を遅延させないジョブのみをアサインできる領域であり、スケジューラマップ21の終端部に無条件に領域を確保する(既に割当済みの他のジョブと重なっても良い)。特別アサイン領域23は、時間の経過に連動してスケジューラマップ21上を移動することはなく、常にスケジューラマップ終端部に存在する(特別アサイン領域23上に重なっているジョブについては、時間の経過と共に現在時刻の方向に移動する)。特別アサイン領域23には、実行開始遅延禁止ジョブ以外のジョブをアサインすることは禁止されるため、時間が経過すると特別アサイン領域は必ず空き領域となり、追い越し禁止となったジョブをアサインすることができる。これによって、実行開始遅延禁止ジョブの実行開始時間が保証される。
(Step S4)
The special assignment
(ステップS5)
特別アサイン領域確保部12は、実行開始遅延禁止ジョブとみなされたアサイン対象のジョブを特別アサイン領域23に割り当て、アサイン対象ジョブのスケジューリング処理を終了する。
(Step S5)
The special assignment
(ステップS6)
空き領域情報検索部31は、アサイン対象のジョブを割り当てることができるスケジューラマップ21の空き領域を検索する。
(Step S6)
The free area
(ステップS7)
追越可能判別部33は、アサイン対象のジョブが、実行開始遅延禁止ジョブの実行開始時刻を遅延させないかどうかを判別する。アサイン対象ジョブが、特別アサイン領域23にオーバーラップせずに(重ならずに)アサイン可能であれば、実行開始遅延禁止ジョブへの影響がないため、実行開始遅延禁止ジョブの追い越しが可能であると判別する。
(Step S7)
The overtaking
(ステップS8)
実行予定時刻決定部32は、アサイン対象のジョブの実行予定時刻を決定する。
(Step S8)
The scheduled execution
(ステップS9)
実行予定計算ノード選択部34は、スケジューラマップ21上に、アサイン対象のジョブに対するアサイン領域を確保し、アサイン対象のジョブが使用する計算ノードを決定する。
(Step S9)
The execution schedule calculation
図4の例では、ジョブ9が、実行開始遅延禁止ジョブ7を追い越して、スケジューラマップ21上にアサインされ、時刻の経過により、特別アサイン領域23が空いた際に、実行開始遅延禁止ジョブ7が割り当てられる例が示されている。
In the example of FIG. 4, when the
本実施形態によれば、従来の追い越し禁止機能が有効にされたジョブスケジューリングシステムでは、追い越しが禁止される小規模ジョブ(図4の例ではジョブ9)がスケジューラマップ21上にアサインされる。そのため、スケジューラマップ21上の空き領域が減少し、クラスタリングシステム50の稼働率は向上する。
According to the present embodiment, in the conventional job scheduling system in which the overtaking prohibition function is enabled, a small-scale job (
また、特別アサイン領域23を確保後は、実行開始遅延禁止ジョブ以外のジョブは、特別アサイン領域23にアサインすることができないため、時間が経過すると、特別アサイン領域にオーバーラップされているジョブはなくなる。そのため、特別アサイン領域23は追い越し禁止となった大規模ジョブ(図4の例ではジョブ7)がアサインされることになる。これにより、実行開始遅延禁止となった大規模ジョブの実行開始時刻が保障される。
In addition, after securing the special assignment area 23, jobs other than execution start delay prohibition jobs cannot be assigned to the special assignment area 23. Therefore, when time elapses, no jobs are overlapped with the special assignment area. . Therefore, the special assignment area 23 is assigned with a large-scale job (
(第2実施形態)
添付図面を参照して、本発明の第2実施形態によるジョブスケジューリングシステム100を以下に説明する。
(Second Embodiment)
A
[構成の説明]
はじめに、本実施形態におけるジョブスケジューリングシステム100の機能構成の説明を行う。図7は、本発明の第2実施形態におけるジョブスケジューリングシステム100のブロック図である。図7のブロック図は、図3のブロック図に対して、ジョブアサイン部30に、特別アサイン領域移動部35が追加されている以外は、図3と同様である。そのため、特別アサイン領域移動部35以外の説明については省略する。
[Description of configuration]
First, the functional configuration of the
特別アサイン領域移動手段35は、特別アサイン領域確保部12で確保した特別アサイン領域23を移動させる。本発明の第1実施形態では、特別アサイン領域23を固定していたが、第2実施形態では、特別アサイン領域23を移動可能としている点が、第1実施形態とは異なる。
The special assignment area moving means 35 moves the special assignment area 23 secured by the special assignment
[動作方法の説明]
次に、本実施形態におけるジョブスケジューリングシステム100において、ジョブスケジューリング方法の説明を行う。図8は、本発明の第2実施形態におけるジョブスケジューリングシステム100のジョブスケジューリング方法のフローチャートである。ステップS1〜ステップS7までの動作方法については、本発明の第1実施形態と同様であるため、ステップS8以降の動作方法について説明する。
[Description of operation method]
Next, a job scheduling method in the
(ステップS1)〜(ステップS7)
本発明の第1実施形態と同様の動作方法である。
(Step S1) to (Step S7)
The operation method is the same as that of the first embodiment of the present invention.
(ステップS8)
追越可能判別部33は、アサイン対象のジョブが、スケジューラマップ21の空き領域にアサイン可能かを判別する際に、特別アサイン領域移動部35の処理を呼び出す。特別アサイン領域移動部35は、後続ジョブを最もスケジューラマップ21の空き領域が少ない状態でアサインできるようにするため、スケジューラマップ21の終端に確保している特別アサイン領域23を移動(未来の時間へスライド)させる。図9は、本発明の第2実施形態におけるジョブスケジューリングシステム100のスケジューラマップ21を説明するための図である。図9の例では、ジョブ8を計算ノード3へアサインし、ジョブ9を計算ノード1へアサインしたときに、最もスケジューラマップ21の空き領域が少なくなる。そのため、特別アサイン領域移動部35は、特別アサイン領域23を、ジョブ9をアサインする予定領域の後方まで移動する。なお、特別アサイン領域23は追い越し禁止となった大規模ジョブの実行開始を優先するため、マップ終端の時刻から、一定時間内(以下、「limit」という)までしか移動できないようにする。特別アサイン領域23は、特別アサイン領域移動手段35によって移動されると、移動した位置からスケジューラマップ21の終端までの間は時間の経過と共に、現在時刻方向に移動する。特別アサイン領域23が、スケジューラマップ21の終端部に到達すると、特別アサイン領域23は移動を停止する。特別アサイン領域23の移動可能な幅であるlimitは、コンフィグパラメータとして設定することで、どこまで遅延してもよいかを、ジョブスケジューリングシステム100の運用で制御することが可能となる(パラメータlimitを0に設定すれば、第1実施形態と同様の動作となる)。
(Step S8)
The overtaking
(ステップS9)
実行予定時刻決定部32は、アサイン対象のジョブの実行予定時刻を決定する。
(Step S9)
The scheduled execution
(ステップS10)
実行予定計算ノード選択部34は、スケジューラマップ21上に、アサイン対象のジョブに対するアサイン領域を確保し、アサイン対象のジョブが使用する計算ノードを決定する。
(Step S10)
The execution schedule calculation
本実施形態によれば、特別アサイン領域23を可動式にすることにより、本発明の第1実施形態では、実行開始遅延禁止ジョブを同時に追い越すことができなかった複数の小規模ジョブ(図9の例ではジョブ8及びジョブ9)を、スケジューラマップ21上にアサインすることができる。そのため、スケジューラマップ21上の空き領域を第1実施形態よりも有効に利用することが可能になり、クラスタリングシステム50の稼働率が向上する。
According to this embodiment, by making the special assignment area 23 movable, in the first embodiment of the present invention, a plurality of small jobs (in FIG. In the example,
以上、本発明の実施の形態が添付の図面を参照することにより説明された。但し、本発明は、上述の実施の形態に限定されず、要旨を逸脱しない範囲で当業者により適宜変更され得る。 The embodiments of the present invention have been described above with reference to the accompanying drawings. However, the present invention is not limited to the above-described embodiments, and can be appropriately changed by those skilled in the art without departing from the scope of the invention.
1〜4 計算ノード
5 管理ノード
6 CPU(Central Processing Unit)
7 補助記憶装置
8 メモリ
9 ジョブスケジューリングプログラム
10 アサイン対象ジョブ選択部
11 遅延禁止ジョブ判別部
12 特別アサイン領域確保部
20 スケジューラマップ保存部
21 スケジューラマップ
22 アサイン待ちジョブ
30 ジョブアサイン部
31 空き領域情報検索部
32 実行予定時刻決定部
33 追越可能判別部
34 実行予定計算ノード選択部
35 特別アサイン領域移動部
50 クラスタリングシステム
100 ジョブスケジューリングシステム
101 従来技術のスケジューラマップ
102 アサイン待ちジョブ
1-4
7
Claims (7)
スケジューラマップにアサインするジョブを、バックフィル型スケジューリングにより選択するアサイン対象ジョブ選択部と、ここで、前記アサイン対象ジョブ選択部は、選択した前記ジョブが、前記遅延禁止ジョブである場合には、前記選択したジョブを前記特別アサイン領域に割り当て、
前記スケジューラマップの空き領域を検索する空き情報検索部と、
前記遅延禁止ジョブを追い越しても、前記遅延禁止ジョブの前記ジョブ実行開始時刻を遅延させない追越可能ジョブを判別する追越可能判別部と、
前記追越可能ジョブの実行予定時刻を決定する実行予定時刻決定部と、
前記追越可能ジョブの実行予定計算ノードを選択する実行予定計算ノード選択部と
を備えるジョブスケジューリングシステム。 A scheduler map storage unit for storing a scheduler map, wherein the scheduler map includes a special assignment area to which a delay prohibition job in which a delay in job execution start time is prohibited is provided at the end of the scheduler map;
An assignment target job selection unit that selects a job to be assigned to the scheduler map by backfill type scheduling, and the assignment target job selection unit, when the selected job is the delay prohibition job, Assign the selected job to the special assignment area,
A free information search unit for searching for a free area of the scheduler map;
An overtaking possible determination unit that determines an overtaking possible job that does not delay the job execution start time of the delay prohibited job even after overtaking the delay prohibited job;
A scheduled execution time determination unit that determines a scheduled execution time of the overtaking job;
A job scheduling system comprising: an execution schedule calculation node selection unit that selects an execution schedule calculation node of the passable job.
請求項1に記載のジョブスケジューリングシステム。 The job scheduling system according to claim 1, wherein the assignment target job selection unit determines whether the assignment target job is the delay-prohibited job, as the job with the longest assignment waiting time.
請求項1又は2に記載のジョブスケジューリングシステム。 The job scheduling system according to claim 1, wherein the position of the special assignment area can be moved on the scheduler map within a predetermined time determined by a configuration parameter.
アサイン対象ジョブ選択部が、スケジューラマップにアサインするジョブを、バックフィル型スケジューリングにより選択するステップと、
前記アサイン対象ジョブ選択部が、前記選択するステップにより選択した前記ジョブが、前記遅延禁止ジョブである場合には、前記選択したジョブを前記特別アサイン領域に割り当てるステップと、
空き情報検索部が、前記スケジューラマップの空き領域を検索するステップと、
追越可能判別部が、前記遅延禁止ジョブを追い越しても、前記遅延禁止ジョブの前記ジョブ実行開始時刻を遅延させない追越可能ジョブを判別するステップと、
実行予定時刻決定部が、前記追越可能ジョブの実行予定時刻を決定するステップと、
実行予定計算ノード選択部が、前記追越可能ジョブの実行予定計算ノードを選択するステップと
を含むジョブスケジューリング方法。 A scheduler map storage unit storing the scheduler map, wherein the scheduler map includes a special assignment area to which a delay prohibition job in which a delay in job execution start time is prohibited is allocated at the end of the scheduler map; ,
The assignment target job selection unit selects a job to be assigned to the scheduler map by backfill scheduling, and
Assigning the selected job to the special assignment area when the job selected by the assigning job selection unit is the delay prohibition job;
A step of searching for a free area of the scheduler map, a free information search unit;
A step of determining a passable job that does not delay the job execution start time of the delay-prohibited job even if the passable determination unit passes the delay-prohibited job;
A scheduled execution time determining unit determining a scheduled execution time of the passable job;
A job scheduling method comprising: a scheduled execution calculation node selection unit selecting an execution scheduled calculation node of the passable job.
アサイン対象の前記ジョブが、前記遅延禁止ジョブであるかどうかを、アサイン待ち時間が最も長い前記ジョブに決定するステップ
を含む請求項4に記載のジョブスケジューリング方法。 The step of assigning the selected job to the special assignment area includes:
The job scheduling method according to claim 4, further comprising: determining whether the job to be assigned is the delay-prohibited job as the job having the longest assignment waiting time.
前記特別アサイン領域の位置を、コンフィグパラメータで定めた一定時間を限度として、前記スケジューラマップ上で移動させるステップ
を含む請求項4又は5に記載のジョブスケジューリング方法。 The job scheduling method includes:
The job scheduling method according to claim 4, further comprising a step of moving the position of the special assignment area on the scheduler map for a fixed time determined by a configuration parameter.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011031758A JP5676297B2 (en) | 2011-02-17 | 2011-02-17 | Job scheduling system, job scheduling method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011031758A JP5676297B2 (en) | 2011-02-17 | 2011-02-17 | Job scheduling system, job scheduling method and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012173753A true JP2012173753A (en) | 2012-09-10 |
JP5676297B2 JP5676297B2 (en) | 2015-02-25 |
Family
ID=46976642
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011031758A Active JP5676297B2 (en) | 2011-02-17 | 2011-02-17 | Job scheduling system, job scheduling method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5676297B2 (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015194923A (en) * | 2014-03-31 | 2015-11-05 | 富士通株式会社 | Parallel computer system, control program of job management apparatus and control method of parallel computer system |
JP2016167121A (en) * | 2015-03-09 | 2016-09-15 | 富士通株式会社 | Parallel calculation unit, parallel calculation system and job control program |
EP3079111A1 (en) | 2015-04-08 | 2016-10-12 | Fujitsu Limited | System, method and device for job scheduling |
EP3115895A1 (en) | 2015-07-06 | 2017-01-11 | Fujitsu Limited | Information processing apparatus, parallel computer system, job schedule setting program, and job schedule setting method |
CN110298031A (en) * | 2019-05-28 | 2019-10-01 | 北京百度网讯科技有限公司 | A kind of Directory Service system and model version consistency allocator |
EP3751417A1 (en) | 2019-06-11 | 2020-12-16 | Fujitsu Limited | Parallel processing apparatus, job management program, and job management method |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07141305A (en) * | 1993-11-16 | 1995-06-02 | Hitachi Ltd | Control method for execution of parallel computer |
-
2011
- 2011-02-17 JP JP2011031758A patent/JP5676297B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07141305A (en) * | 1993-11-16 | 1995-06-02 | Hitachi Ltd | Control method for execution of parallel computer |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015194923A (en) * | 2014-03-31 | 2015-11-05 | 富士通株式会社 | Parallel computer system, control program of job management apparatus and control method of parallel computer system |
JP2016167121A (en) * | 2015-03-09 | 2016-09-15 | 富士通株式会社 | Parallel calculation unit, parallel calculation system and job control program |
EP3079111A1 (en) | 2015-04-08 | 2016-10-12 | Fujitsu Limited | System, method and device for job scheduling |
EP3115895A1 (en) | 2015-07-06 | 2017-01-11 | Fujitsu Limited | Information processing apparatus, parallel computer system, job schedule setting program, and job schedule setting method |
US10185591B2 (en) | 2015-07-06 | 2019-01-22 | Fujitsu Limited | Information processing apparatus scheduling job start time |
CN110298031A (en) * | 2019-05-28 | 2019-10-01 | 北京百度网讯科技有限公司 | A kind of Directory Service system and model version consistency allocator |
EP3751417A1 (en) | 2019-06-11 | 2020-12-16 | Fujitsu Limited | Parallel processing apparatus, job management program, and job management method |
JP2020201741A (en) * | 2019-06-11 | 2020-12-17 | 富士通株式会社 | Parallel processor, job management program, and job management method |
JP7238616B2 (en) | 2019-06-11 | 2023-03-14 | 富士通株式会社 | Parallel processing device, job management program, and job management method |
US11693668B2 (en) | 2019-06-11 | 2023-07-04 | Fujitsu Limited | Parallel processing apparatus, storage medium, and job management method |
Also Published As
Publication number | Publication date |
---|---|
JP5676297B2 (en) | 2015-02-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10936359B2 (en) | Task resource scheduling method and apparatus | |
JP5676297B2 (en) | Job scheduling system, job scheduling method and program | |
US20150309842A1 (en) | Core Resource Allocation Method and Apparatus, and Many-Core System | |
US9256471B2 (en) | Task scheduling method for priority-based real-time operating system in multicore environment | |
RU2510527C2 (en) | Scheduling collections in scheduler | |
KR101622168B1 (en) | Realtime scheduling method and central processing unit based on the same | |
JP6364880B2 (en) | Parallel computer system, control program for job management apparatus, and control method for parallel computer system | |
US20090019449A1 (en) | Load balancing method and apparatus in symmetric multi-processor system | |
KR102585591B1 (en) | Slo-aware artificial intelligence inference scheduler for heterogeneous processors in edge platforms | |
Lim et al. | Zico: Efficient {GPU} memory sharing for concurrent {DNN} training | |
JP6515708B2 (en) | Information processing apparatus, parallel computer system, job schedule setting program, and job schedule setting method | |
CN110990154B (en) | Big data application optimization method, device and storage medium | |
US9612867B2 (en) | Apparatus and method for data partition and allocation in heterogeneous multi-processor environment | |
JP2011059777A (en) | Task scheduling method and multi-core system | |
US9047138B2 (en) | Apparatus and method for thread scheduling and lock acquisition order control based on deterministic progress index | |
JP5605131B2 (en) | Job scheduling program, method, and apparatus | |
US20160357600A1 (en) | Hand-off scheduling | |
Ling et al. | Blastnet: Exploiting duo-blocks for cross-processor real-time dnn inference | |
US20170052891A1 (en) | Multi-core processor system and method for managing a shared cache in the multi-core processor system | |
CN105389204A (en) | Multiple-resource partial order scheduling policy | |
CN117251275B (en) | Multi-application asynchronous I/O request scheduling method, system, equipment and medium | |
US10394615B2 (en) | Information processing apparatus and job management method | |
KR102224844B1 (en) | Method and apparatus for selecting a preemption technique | |
CN112346836A (en) | Method and device for preempting shared computing resource, user equipment and storage medium | |
CN115904744A (en) | Thread locking method and device, electronic equipment and computer readable medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140115 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20140613 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140723 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140731 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140929 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141202 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141225 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5676297 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |