JP6303584B2 - データ処理装置、計算機システム、データ処理方法およびデータ処理プログラム - Google Patents

データ処理装置、計算機システム、データ処理方法およびデータ処理プログラム Download PDF

Info

Publication number
JP6303584B2
JP6303584B2 JP2014031596A JP2014031596A JP6303584B2 JP 6303584 B2 JP6303584 B2 JP 6303584B2 JP 2014031596 A JP2014031596 A JP 2014031596A JP 2014031596 A JP2014031596 A JP 2014031596A JP 6303584 B2 JP6303584 B2 JP 6303584B2
Authority
JP
Japan
Prior art keywords
transfer
band
file
bandwidth
staging
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014031596A
Other languages
English (en)
Other versions
JP2015156185A (ja
Inventor
壮司 大坂
壮司 大坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2014031596A priority Critical patent/JP6303584B2/ja
Publication of JP2015156185A publication Critical patent/JP2015156185A/ja
Application granted granted Critical
Publication of JP6303584B2 publication Critical patent/JP6303584B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明はクラスタシステムにおいてジョブスケジューリングを行うデータ処理装置、計算機システム、データ処理方法及びデータ処理プログラムに関する。
一般的なHPCクラスタシステムにおけるジョブスケジューリングでは、非同期でファイルステージング処理を行うことによって、ジョブの予定実行開始時刻までに転送が完了していた(HPC:High−Performance Computing)。現在では、システムやジョブが大規模化(スケールアップ)することによってファイルステージング処理が遅れると、ジョブの再スケジューリングが起こる問題が顕在化するようになった。
一般的なファイルステージング処理では、図12に示したように、ジョブを開始する前に必要なジョブファイルを転送する処理(以下、ステージインと呼ぶ)とジョブの実行を非同期で実行している。そのため、ジョブ1の開始予定までにジョブ1のステージインが終了しないとジョブ1の開始実行が遅れることになる。また、一般的には、図13に示したように、ファイルステージング処理を転送処理の本数(ランリミット)による制限のみで管理している。図13のような転送処理の本数による制限のみでステージング処理を管理する場合、転送帯域の確保については考慮されていない。
特許文献1には、プレステージング処理方法の一例が開示されている。
特許文献1のプレステージング処理方法は、以下の三つのステップを含む。第一のステップは、投入されたジョブと同時にプレステージング処理を行うべきジョブの数であるジョブ数を求めるステップである。第二のステップは、プレステージング処理を行うべきジョブの入力データが格納されている二次記憶装置のデータ転送速度及びジョブ数に基づいて実行データ転送速度を求めるステップである。第三のステップは、入力データの量を実効データ転送速度で割った実効データ転送時間を、ジョブの開始予定時刻から引いた時刻をジョブのプレステージング開始時刻とするステップである。
特許文献1のプレステージング処理方法によれば、同時にプレステージングを行うべきジョブ数を考慮して最適な時刻に近いプレステージング開始時刻を決定することができる。その結果、ジョブの実効性能及び計算機システムの全体の性能を向上させることができる。特に、特許文献1の第4実施例では、プレステージング実行時のデータ転送経路を予約により確保しているので、プレステージング時のデータ転送速度が予約データ転送速度として保障される。
特開平6−75785号公報
一般的なファイルステージング処理では、複数のジョブが投入されていると転送が並列に行われる。そのため、小さいジョブが多量に投入されると、大量の転送を必要とするジョブの転送速度が遅くなり転送完了が遅延するという問題点があった。なぜならば、ファイルステージング処理を転送処理の本数による制限のみで管理しており、大量のジョブを処理するシステムでは、並列実行することにより転送帯域が確保できず、転送速度が低下する場合があったためである。
特許文献1のファイルステージング処理では、ファイルステージング処理において、従十分な帯域が確保されないという問題点があった。なぜならば、特許文献1のファイルステージング処理では、プレステージング実行時のデータ転送経路を予約により確保する際に、ジョブによって占有される帯域を考慮していないためである。
本発明の目的は、上述した課題を解決するデータ処理装置を提供することにある。
本発明のデータ処理装置は、ローカルファイルシステムとグローバルファイルシステムとの間でジョブファイルの転送を実行するファイルステージング処理に使用する帯域であるステージング帯域を決定する決定手段と、帯域と時間とを2つの軸とする2次元マップである帯域スケジューラマップに基づいて帯域の使用予定時間を管理する管理手段と、帯域スケジューラマップに基づいて帯域を制御する制御手段とを備える。
本発明の計算機システムは、複数の計算機ノードと、複数の計算機ノードが実行するジョブをジョブファイルとして格納するグローバルファイルシステムと、グローバルファイルシステムと計算機ノードとの間でジョブを実行できる形でジョブファイルを一時保存するローカルファイルシステムと、ローカルファイルシステムとグローバルファイルシステムとの間でジョブファイルの転送を実行するファイルステージング処理に使用する帯域であるステージング帯域を決定する決定手段と、帯域と時間とを2つの軸とする2次元マップである帯域スケジューラマップに基づいて帯域の使用予定時間を管理する管理手段と、帯域スケジューラマップに基づいてステージング帯域を制御する制御手段とを備えるデータ処理装置とを備える。
本発明のデータ処理方法においては、ローカルファイルシステムとグローバルファイルシステムとの間でジョブファイルの転送を実行するファイルステージング処理に使用する帯域であるステージング帯域を決定し、帯域と時間とを2つの軸とする2次元マップである帯域スケジューラマップに基づいて帯域の使用予定時間を管理し、帯域スケジューラマップに基づいてステージング帯域を制御する。
本発明のデータ処理プログラムは、ローカルファイルシステムとグローバルファイルシステムとの間でジョブファイルの転送を実行するファイルステージング処理に使用する帯域であるステージング帯域を決定する処理と、帯域と時間とを2つの軸とする2次元マップである帯域スケジューラマップに基づいて帯域の使用予定時間を管理する処理と、帯域スケジューラマップに基づいてステージング帯域を制御する処理とをコンピュータに実行させる。
本発明によれば、ファイルステージング処理に使用する帯域を事前に確保し、デッドラインまでに処理が完了することを保証することによって、ジョブ実行開始の遅れを防止するデータ処理装置を提供することができる。
本発明の概要に係るデータ処理装置の機能構成を示すブロック図である。 本発明の第1の実施形態に係るデータ処理装置の機能構成を示すブロック図である。 本発明の第1の実施形態に係るデータ処理装置で決定する帯域クラス設定情報の一例を示す表である。 本発明の第1の実施形態に係るデータ処理装置の動作を説明するためのフローチャートである。 本発明の第1の実施形態に係るデータ処理装置の動作を説明するためのシークエンス図である。 本発明の第1の実施形態に係るデータ処理装置において使用する帯域スケジューラマップの一例である。 本発明の第2の実施形態に係るデータ処理装置の機能構成を示すブロック図である。 本発明の第2の実施形態に係るデータ処理装置の動作を説明するためのフローチャートである。 本発明の第3の実施形態に係るデータ処理装置の機能構成を示すブロック図である。 本発明の第3の実施形態に係るデータ処理装置の動作を説明するためのフローチャートである。 本発明の実施形態に係るデータ処理装置を含む計算機システムの構成を示す概念図である。 一般的なファイルステージング処理の一例を説明するための図である。 一般的なファイルステージング処理におけるジョブ割り当ての一例を説明するための図である。
以下に、本発明を実施するための形態について図面を用いて説明する。ただし、以下に述べる実施形態には、本発明を実施するために技術的に好ましい限定がされているが、発明の範囲を以下に限定するものではない。
図1は、本発明の概要に関するデータ処理装置1の概念図である。データ処理装置1は、決定手段2と、管理手段3と、制御手段4とを備える。
決定手段2は、ローカルファイルシステムとグローバルファイルシステムとの間でジョブファイルの転送を実行するファイルステージング処理に使用する帯域であるステージング帯域を決定する。管理手段3は、帯域と時間とを2つの軸とする帯域スケジューラマップによって帯域の使用予定時間を管理する。制御手段4は、帯域スケジューラマップに基づいてステージング帯域を制御する。
本実施形態で扱う帯域は、ネットワークを介してローカルファイルシステムとグローバルファイルシステムとの間のジョブファイルの転送を行う場合、ネットワーク上の帯域(ネットワーク帯域)を意味する。また、ローカルファイルシステムとグローバルファイルシステムとの間のジョブファイルの転送を装置内部で行う場合、本実施形態で扱う帯域は装置内部の通信路上の帯域を意味する。
帯域スケジューラマップは、データ処理装置1の起動時にメモリ上に作成される。データ処理装置1は、起動時に現在使用しているジョブの帯域情報等を収集して帯域スケジューラマップを作成し、起動後はジョブ転送が行われる際に帯域スケジューラマップにデータを追加していく。なお、帯域スケジューラマップは、メモリ上ではなく、ローカルファイル上にマップデータとして持たせてもよい。
データ処理装置1は、例えば、演算機能・制御機能・記憶機能を有するコンピュータやサーバなどの情報処理装置として実現できる。決定手段2は、情報処理装置が有する中央演算処理装置(プロセッサ)の演算機能によって実現できる。管理手段3は、情報処理装置が有する主記憶装置やレジスタなどの記憶装置によって実現できる。ただし、レジスタを用いる構成とするならば、管理手段3を中央演算処理装置によって実現することもできる。制御手段4は、情報処理装置が有する中央演算処理装置の制御機能によって実現できる。なお、データ処理装置1の備える各機能構成については、ここであげたハードウェア構成以外の構成によって実現してもよい。
本発明の概要に関するデータ処理装置1の詳細については、以下の具体的な実施形態を用いて説明していく。
(第1の実施形態)
(構成)
次に、図2を用いて、本発明の第1の実施形態に係るデータ処理装置1(スケジューラとも呼ぶ)の機能構成について詳細に説明する。
ジョブスケジューリングを行うデータ処理装置1は、ジョブアサイン手段10と、ファイルステージングアサイン手段20と、帯域スケジューラマップ管理手段30と、帯域制御手段40とを備える。図2において、ジョブアサイン手段10およびファイルステージング処理手段20は決定手段2(図1)を構成する。また、帯域スケジューラマップ管理手段30は管理手段3(図1)を構成し、帯域制御手段40は制御手段4を構成する。
(ジョブアサイン手段)
ジョブアサイン手段10は、ジョブの実行開始時間を決定する。
ジョブアサイン手段10は、予定実行時刻決定手段11を備える。予定実行時刻決定手段11はジョブの実行開始時刻を決定する。
(ファイルステージングアサイン手段)
ファイルステージングアサイン手段20は、ファイルステージング処理の転送時間と帯域を決定する。
ファイルステージングアサイン手段20は、予定転送終了時刻決定手段21と、帯域クラス決定手段22と、予定転送開始時刻決定手段23と、転送予定量取得手段24と、転送速度決定手段25と、帯域アサイン確保手段26とを有する。
予定転送終了時刻決定手段21は、予定実行時刻決定手段11から通知を受けて、ジョブの予定実行時刻から予定転送終了時刻を決定する。
帯域クラス決定手段22は、ジョブの実行ノード数(大/中/小)とファイルステージング処理の種類(ステージイン/ステージアウト)から、ファイルステージング処理に割り当てられた帯域全体の中で使用する帯域クラスを決定する。
図3は、帯域クラス決定手段22による帯域クラスの割り当ての決定例である。図3において、デフォルトで与えられた帯域は、ステージング用のクラスSに55%、計算用のクラスJに45%という割合でクラスを割り当てられる。また、クラスSは、ステージインのためのクラスIに35%、ステージアウトのためのクラスOに20%という割合でクラスを割り当てられる。さらに、ジョブの実行ノード数(大/中/小)に応じて、クラスIには、クラスA、クラスBおよびクラスCが割り当てられ、クラスOには、クラスD、クラスEおよびクラスFが割り当てられる。
図3において、クラスAが確保している帯域が不足した場合、上位クラスであるクラスI内で帯域を借りるように動的制御することができる。また、帯域を借りない設定(帯域を固定)も可能である。
予定転送開始時刻決定手段23は、ファイルステージング処理に使用する帯域(以下、ステージング帯域)を確保できる転送開始時刻を決定する。
転送予定量取得手段24は、ファイルステージング処理を行うファイルの転送量(サイズ)を取得する。
転送速度決定手段25は、ファイルステージング処理の転送時間と転送量から転送速度を決定する。なお、転送速度決定手段25によって決定された転送速度がステージング帯域に相当する。
帯域アサイン確保手段26は、ファイルステージング処理に必要な領域を転送予定情報記憶手段32として確保する。
(帯域スケジューラマップ管理手段)
帯域スケジューラマップ管理手段30は、帯域と時間を軸にした二次元マップ(以降、帯域スケジューラマップ)により、帯域の使用予定時間を管理する。帯域スケジューラマップは、データ処理装置1の起動時に作成される。帯域スケジューラマップは、ファイルステージング処理において複数のジョブのそれぞれが占有する帯域を第1の軸とし、複数のジョブのそれぞれが帯域を占有する時間を第2の軸とする。なお、帯域スケジューラマップは、帯域スケジューラマップ管理手段30に格納されていてもよく、帯域スケジューラマップ管理手段30とは異なるメモリ上の領域に展開されていてもよい。
帯域スケジューラマップ管理手段30は、帯域クラス設定情報記憶手段31と、転送予定情報記憶手段32とを有する。
帯域クラス設定情報記憶手段31は、帯域クラスが使用可能な全出力帯域における帯域比率情報をもつ帯域クラス設定情報を格納する。すなわち、帯域クラス設定情報は、ファイルステージング処理で使用される帯域に割り当てられた帯域クラスの帯域比率情報をもつ。
転送予定情報記憶手段32は、ファイルステージング処理の予定転送終了時刻、転送予定量、転送実績量をもつ転送予定情報を格納する。
(帯域制御手段)
帯域制御手段40は、ファイルステージング処理において、帯域スケジューラマップに従ってステージング帯域を制御する。
帯域制御手段40は、ステージング帯域設定手段41を有する。ステージング帯域設定手段41は、ファイルステージング処理で使用されている帯域を設定・変更する。
(動作)
次に、図4〜図6を参照して本発明の第1の実施形態に係るデータ処理装置1の動作について詳細に説明する。図4は本発明の第1の実施形態に係るデータ処理装置1の動作を説明するためのフローチャートである。図5は、図4のフローチャートを動作主体となる構成要素を明確に示すとともに、構成要素間のデータのやり取りを明確にするためのシークエンス図である。図6は、本発明の実施形態に係るデータ処理装置1の帯域スケジューラマップ管理手段30によって管理される帯域スケジューラマップの一例である。
ここで示す本実施形態の一例においては、ジョブ1、ジョブ2およびジョブ3が転送予定情報記憶手段32にファイルステージング用の領域を確保しており、ジョブ4はまだ領域を確保していない例について説明する。なお、ジョブ1、ジョブ2、ジョブ3およびジョブ4は大規模ジョブであるとともにステージインであり、同一の帯域クラスのジョブである。
まず、ジョブアサイン手段10の予定実行時刻決定手段11は、ジョブ4の予定実行時刻を決定する(ステップS1)。
予定実行時刻決定手段11によってジョブ4の予定実行時刻が決定すると、ファイルステージングアサイン手段20における処理に移行する。
予定転送終了時刻決定手段21は、ジョブ4の予定実行時刻からファイルステージング処理の予定終了時刻(デッドライン)を決定する(ステップS2)。そして、予定転送終了時刻決定手段21は、帯域クラス決定手段22を呼び出す。
帯域クラス決定手段22は、帯域クラス設定情報記憶手段31に格納された帯域クラス設定情報を参照し、ジョブの規模とファイルステージング処理の種類から、使用する帯域クラスを決定する(ステップS3)。そして、帯域クラス決定手段22は、予定転送開始時刻決定手段23を呼び出す。
図6の例では、ジョブの規模は大規模に決定され、ファイルステージング処理の種類はステージインに決定され、使用する帯域クラスはClass Aに決定される。
予定転送開始時刻決定手段23は、転送予定量取得手段24を呼び出して転送量を確認し、帯域クラスの転送予定情報記憶手段32を参照して予定転送開始時刻を決定する(ステップS4)。そして、予定転送開始時刻決定手段23は、転送速度決定手段25を呼び出す。
なお、転送時間を計算する際には、転送処理が確実に終わることを保証するために予定転送終了時刻から予定転送開始時刻を引いた時間に係数(0.8〜0.9)をかけた時間とする。また、係数は転送量やジョブの優先度によって変更可能なパラメータとする。
転送速度決定手段25は、転送量と転送時間から転送速度を計算する(ステップS5)。そして、転送速度決定手段25は、ステージング帯域を確保するために帯域アサイン確保手段26を呼び出す。
ここで、帯域の空き容量が十分であるか否かによって異なるステップを経る(ステップS6)。
転送予定情報記憶手段32にファイルステージング用の領域を確保できない場合(ステップS6でNo)、帯域アサイン確保手段26は、ジョブアサイン手段10にジョブ4を再スケジューリングするように要求する(ステップS7)。帯域アサイン確保手段26による再スケジューリングの要求が出た場合は、図4のステップS1に処理が戻る。
また、転送予定情報記憶手段32にファイルステージング用の領域を確保できた場合は(ステップS6でYes)、ステップS8に進む。
領域を確保できた場合(ステップS6でYes)、帯域アサイン確保手段26は、転送予定情報記憶手段32にファイルステージング用の領域を確保するとともに、ファイルステージング用の領域をステージング帯域設定手段41に通知する(ステップS8)。
ここで、帯域の幅を変更(拡大・縮小)するか否かによって、異なるステップに進む(ステップS9)。
帯域の幅を変更する場合(ステップS9でYes)、ステージング帯域設定手段41は、帯域アサイン確保手段26による通知に応じて、外部の帯域制御装置に帯域幅の変更を指示する(ステップS10)。なお、帯域の幅を変更しない場合(ステップS9でNo)、図4のフローは終了となる。
図4のステップS6やステップS9に関して、帯域不足を解消する具体的な方法については、後述の実施形態において説明する。
以上のように、本発明の第1の実施形態に係るデータ処理装置は、ファイルステージング処理の完了時刻を担保するため、ネットワーク全体の総出力帯域からステージング帯域を必要な時間だけ予め確保するスケジューリングを行う。
また、本発明の第1の実施形態に係るデータ処理装置は、帯域スケジューラマップにより帯域の使用予定時間を管理する。
本発明の第1の実施形態に係るデータ処理装置は、ジョブの実行開始前と実行完了後に、ファイルステージング処理を行うファイル転送量と転送予定時間から転送速度を計算する。そして、本発明の第1の実施形態に係るデータ処理装置は、帯域スケジューラマップにファイルステージング処理用の領域を確保することによって、予定完了時刻までに転送を行うことを保証する。
すなわち、本実施形態に係るデータ処理装置によれば、ファイルステージング処理に使用する帯域を事前に確保し、デッドラインまでに処理が完了することを保証することによって、ジョブ実行開始の遅れを防止することが可能となる。
(第2の実施形態)
次に、本発明の第2の実施形態に係るデータ処理装置5(データ処理装置)の構成について図7を参照して詳細に説明する。
(構成)
第2の実施形態に係るデータ処理装置5(図7)の構成は、ファイルステージング処理において現時点の転送量(実績)を帯域スケジューラマップに反映する転送実績反映手段50が追加されている点が、第1の実施形態に係るデータ処理装置1(図2)とは異なる。図7において、ジョブアサイン手段10、ファイルステージング処理手段20および転送実績反映手段50、は決定手段2(図1)を構成する。また、帯域スケジューラマップ管理手段30は管理手段3(図1)に相当し、帯域制御手段40は制御手段4に相当する。
転送実績反映手段50は、転送実績量取得手段51と転送実績量登録手段52とを備える。
転送実績取得手段51は、外部の帯域制御装置から転送実績量を取得し、取得した転送実績量を転送実績量登録手段52に通知する。
転送実績量登録手段52は、転送予定情報記憶手段32に転送実績量を登録し、転送予定量を更新する。
(動作)
第2の実施形態に係るデータ処理装置5の動作は、図8のステップS207以降が、第1の実施形態に係るデータ処理装置1の動作とは異なる。帯域アサイン確保手段26によって領域が確保できなかった場合(ステップS206でNo)、図8のように、帯域スケジューラマップを最適化(実績反映)することによって空き領域を増やす。なお、図8のステップS201〜S206は、図4のステップS1〜S6と同じであるため、説明は省略する。
(帯域スケジューラマップの最適化)
帯域スケジューラマップの最適化を行うためには、転送実績取得手段51を呼び出す。転送実績取得手段51は、ファイルステージング処理中の転送実績情報を収集し、収集した転送実績情報を転送実績登録手段52に通知する(ステップS207)。
転送実績登録手段52は、転送予定情報記憶手段32に転送実績量を登録し、転送予定量から転送実績量を減算して更新する(ステップS208)。
転送実績登録手段52は、転送予定情報記憶手段32に転送予定情報を登録後、帯域アサイン確保手段26に転送予定情報を通知する(ステップS209)。
以上のステップS207〜S209が、帯域スケジュールマップの最適化処理になる。
ここで、帯域スケジュールマップが最適化されると、帯域の空き容量が十分にあるか否かによって異なるステップをたどる(ステップS210)。
帯域の空き容量が十分にない場合(ステップS210でNo)、帯域アサイン確保手段26は、ジョブアサイン手段10にジョブ4を再スケジューリングするように要求する(ステップS211)。
そして、帯域の空き容量が十分にある場合(ステップS210でYes)、帯域アサイン確保手段26は、転送予定情報記憶手段32にファイルステージング用の領域を確保する(ステップS212)。このとき、帯域アサイン確保手段26は、ファイルステージング用の領域をステージング帯域設定手段41に通知する。
なお、図8のステップS211およびS212は、図4のステップS9およびS10と同じであるため、説明は省略する。
以上のように、第2の実施形態においては、転送予定情報に転送実績を反映させて帯域スケジューラマップを最適化することによって、帯域スケジューラマップの空き領域を増やす。第1の実施形態と比べると、第2の実施形態によれば、ファイルステージング処理で使用する帯域を確保できる確率が向上し、ジョブの再スケジューリングを削減する効果を得ることができる。
(第3の実施形態)
次に、本発明の第3の実施形態に係るデータ処理装置6(データ処理装置)の構成について図11を参照して詳細に説明する。
第3の実施形態に係るデータ処理装置6(図9)の構成は、帯域制御手段40に帯域クラス設定手段42と余剰帯域検索手段43が追加されている点で、第1の実施形態に係るデータ処理装置1(図2)とは異なる。図9において、ジョブアサイン手段10およびファイルステージング処理手段20は決定手段2(図1)を構成する。また、帯域スケジューラマップ管理手段30は管理手段3(図1)に相当し、帯域制御手段40は制御手段4(図1)に相当する。
帯域クラス設定手段42は、帯域クラスごとに設定している帯域比率を設定・変更する。
余剰帯域検索手段43は、転送予定情報記憶手段32に格納された転送予定情報から帯域クラスの余剰領域を検索する。
(動作)
第3の実施形態に係るデータ処理装置6の動作は、図10のステップS307以降が、第1の実施形態に係るデータ処理装置1の動作とは異なる。帯域アサイン確保手段26によって領域が確保できなかった場合(ステップS306でNo)、図10のように、帯域クラスの使用帯域比率を変更することによって空き領域を増やす。なお、図10のステップS301〜S306は、図4のステップS1〜S6と同じであるため、説明は省略する。
(帯域クラス内の帯域借用)
帯域クラス内の帯域借用を行うためには、余剰帯域検索手段43を呼び出す。
余剰帯域検索手段43は、転送予定情報記憶手段32から帯域スケジューラマップ領域の余剰領域を検索し、帯域クラスの使用帯域比率を変更可能かチェックする(ステップS307)。
ここで、帯域クラスの使用帯域比率を変更可能であるか否かによって、異なるフローをたどる(ステップS308)。
使用帯域比率変更が可能である場合(ステップS308でYes)、帯域クラス設定手段42を呼出し、帯域クラス設定情報記憶手段31の帯域比率を変更する(ステップS309)。なお、使用帯域比率変更が可能ではない場合(ステップS308でNo)、帯域アサイン確保手段26は、ジョブアサイン手段10にジョブ4を再スケジューリングするように要求する(ステップS310)。
ステップS309で帯域クラスの使用帯域比率が変更されると、帯域アサイン確保手段26は、転送予定情報記憶手段32にファイルステージング用の領域を確保し、ファイルステージング用の領域をステージング帯域設定手段41に通知する(ステップS311)。
なお、図10のステップS312およびS313は、図4のステップS9およびS10と同じであるため、説明は省略する。
以上のように、第3の実施形態においては、帯域クラスの使用比率を拡張することにより、帯域スケジューラマップの空き領域を増やす。第1の実施形態と比べると、第3の実施形態によれば、ファイルステージング処理で使用する帯域を確保できる確率が向上し、ジョブの再スケジューリングを低減する効果がある。
以上の本実施形態に係るデータ処理装置による動作は、上述のデータ処理装置とは異なる構成をもつ装置によって実現されても、本実施形態の方法を適用している限りは本発明の範囲に含まれる。また、本実施形態に係るデータ処理方法をコンピュータに実行させるデータ処理プログラムも本発明の範囲に含まれる。さらに、本実施形態に係るデータ処理プログラムを記録させたプログラム記録媒体も本発明に含まれるものである。
(計算機システム)
図11は、本発明の実施形態に係るデータ処理装置を含む計算機システム(クラスタシステム100)の一例の概念図である。
クラスタシステム100は、複数の計算ノード101を備え、ジョブが実行する際に使用するファイルシステム(ローカルファイルシステム102)とユーザ・データを格納するファイルシステム(グローバルファイルシステム103)が階層構造となっている。
ローカルファイルシステム102は、計算機ノード101が高速にアクセスできる一時保存領域として機能する。ローカルファイルシステム102は、各計算ノード101を収容する計算ラック内の入出力専用ノードを介して各計算機ノード101と接続される。
グローバルファイルシステム103とローカルファイルシステム102との間は、図示しないネットワークによって接続されている。ローカルファイルシステム102は、ファイルステージング機能によってジョブファイルをグローバルファイルシステム103との間で転送し合う。ローカルファイルシステム102上には、実行中または実行待ちのジョブファイルが一時的に格納されることになる。
一般に、ファイルステージング機能は、ジョブを運営するソフトウェアと連携して動作し、ジョブ開始までにジョブファイルをステージインして、ジョブ開始後にジョブファイルをステージアウトする処理がシステムによって自動的に実現される。
グローバルファイルシステム103は、ユーザファイルを保存するための共用保存領域として機能する。グローバルファイルシステム103は、例えば、計算ラックの外部に配置されたストレージシステムとして実現できる。
クラスタシステム100においてジョブを実行するためには、グローバルファイルシステム103からローカルファイルシステム102にジョブファイルを転送しておく必要がある。
各計算機ノード101は、設定されたジョブの実行開始時刻に基づき、ローカルファイルシステム102からジョブファイルを取り出してジョブを実行する。
以上、実施形態を参照して本発明を説明してきたが、本発明は上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
1、5、6 データ処理装置
10 ジョブアサイン手段
11 予定実行時刻決定手段
20 ファイルステージングアサイン手段
21 予定転送終了時刻決定手段
22 帯域クラス決定手段
23 予定転送開始時刻決定手段
24 転送予定量取得手段
25 転送速度決定手段
26 帯域アサイン確保手段
30 帯域スケジューラマップ管理手段
31 帯域クラス設定情報記憶手段
32 転送予定情報記憶手段
40 帯域制御手段
41 ステージング帯域設定手段
42 帯域クラス設定手段
43 余剰帯域検索手段
50 転送実績反映手段
51 転送実績取得手段
52 転送実績登録手段
100 クラスタシステム
101 計算機ノード
102 ローカルファイルシステム
103 グローバルファイルシステム

Claims (10)

  1. ローカルファイルシステムとグローバルファイルシステムとの間でジョブファイルの転送を実行するファイルステージング処理に使用する帯域であるステージング帯域を決定する決定手段と、
    帯域と時間とを2つの軸とする2次元マップである帯域スケジューラマップに基づいて帯域の使用予定時間を管理する管理手段と、
    前記帯域スケジューラマップに基づいて帯域を制御する制御手段とを備え
    前記管理手段は、
    前記ファイルステージング処理で使用する帯域に割り当てられた複数の帯域クラスの帯域比率情報をもつ帯域クラス設定情報を格納する帯域クラス設定情報記憶手段と、
    前記ファイルステージング処理における予定転送終了時刻、ジョブファイルの転送予定量および転送実績量を含む転送予定情報を格納する転送予定情報記憶手段とを有し、
    前記決定手段は、
    ジョブの実行開始時刻を決定し、
    前記実行開始時刻から予定転送終了時刻を決定し、
    前記ジョブの実行ノード数と前記ファイルステージング処理の種類から使用する前記帯域クラスを決定し、
    前記ステージング帯域を確保できる予定転送開始時刻を決定し、
    前記転送予定情報記憶手段から前記転送予定量を取得し、
    ジョブファイルの転送時間と転送量から転送速度を決定し、
    前記ファイルステージング処理に必要な領域を前記転送予定情報記憶手段に確保し、
    前記制御手段は、
    前記帯域スケジューラマップに従って前記ファイルステージング処理で使用している帯域を設定・変更するデータ処理装置。
  2. 前記管理手段は、
    前記ファイルステージング処理において複数の前記ジョブのそれぞれが占有する帯域と、前記複数のジョブのそれぞれが帯域を占有する時間とを対応させた前記帯域スケジューラマップによって帯域の前記使用予定時間を管理する請求項1に記載のデータ処理装置。
  3. 前記決定手段は、
    前記ジョブの前記実行開始時刻を決定するジョブアサイン手段と、
    前記ファイルステージング処理における前記ジョブファイルの転送時間および前記ステージング帯域を決定するファイルステージングアサイン手段とを備え、
    前記管理手段は、
    前記帯域スケジューラマップによって帯域の前記使用予定時間を管理する帯域スケジューラマップ管理手段を備え、
    前記制御手段は、
    前記帯域スケジューラマップに従って前記ステージング帯域を制御する帯域制御手段を備える請求項1に記載のデータ処理装置。
  4. ローカルファイルシステムとグローバルファイルシステムとの間でジョブファイルの転送を実行するファイルステージング処理に使用する帯域であるステージング帯域を決定する決定手段と、
    帯域と時間とを2つの軸とする2次元マップである帯域スケジューラマップに基づいて帯域の使用予定時間を管理する管理手段と、
    前記帯域スケジューラマップに基づいて帯域を制御する制御手段とを備え、
    前記決定手段は、
    ジョブの実行開始時刻を決定するジョブアサイン手段と、
    前記ファイルステージング処理におけるジョブファイルの転送時間および前記ステージング帯域を決定するファイルステージングアサイン手段とを備え、
    前記管理手段は、
    前記帯域スケジューラマップによって帯域の使用予定時間を管理する帯域スケジューラマップ管理手段を備え、
    前記制御手段は、
    前記帯域スケジューラマップに従って前記ステージング帯域を制御する帯域制御手段を備え、
    前記ジョブアサイン手段は、
    前記ジョブの前記実行開始時刻を決定する予定実行時刻決定手段を有し、
    前記帯域スケジューラマップ管理手段は、
    前記ファイルステージング処理で使用する帯域に割り当てられた複数の帯域クラスの帯域比率情報をもつ帯域クラス設定情報を格納する帯域クラス設定情報記憶手段と、
    前記ファイルステージング処理における予定転送終了時刻、ジョブファイルの転送予定量および転送実績量を含む転送予定情報を格納する転送予定情報記憶手段とを有し、
    前記ファイルステージングアサイン手段は、
    前記予定実行時刻決定手段からの通知を受けて前記実行開始時刻から前記予定転送終了時刻を決定する予定転送終了時刻決定手段と、
    前記ジョブの実行ノード数と前記ファイルステージング処理の種類から使用する前記帯域クラスを決定する帯域クラス決定手段と、
    前記ステージング帯域を確保できる予定転送開始時刻を決定する予定転送開始時刻決定手段と、
    前記転送予定情報記憶手段から前記転送予定量を取得する転送予定量取得手段と、
    ジョブファイルの転送時間と転送量から転送速度を決定する転送速度決定手段と、
    前記ファイルステージング処理に必要な領域を前記転送予定情報記憶手段に確保する帯域アサイン確保手段とを有し、
    前記帯域制御手段は、
    前記ファイルステージング処理で使用している帯域を設定・変更するステージング帯域設定手段を有するデータ処理装置。
  5. 前記ファイルステージング処理における前記転送実績量を前記帯域スケジューラマップに反映する転送実績反映手段を備える請求項4に記載のデータ処理装置。
  6. 前記転送実績反映手段は、
    外部の帯域制御装置から前記転送実績量を取得する転送実績取得手段と、
    前記転送実績取得手段によって取得された前記転送実績量を前記転送予定情報記憶手段に登録する転送実績量登録手段とを有する請求項5に記載のデータ処理装置。
  7. 前記帯域制御手段は、
    前記帯域クラスごとに設定されている帯域比率を設定・変更する帯域クラス設定手段と、
    前記転送予定情報記憶手段に格納された前記転送予定情報から前記帯域クラスの余剰領域を検索する余剰帯域検索手段とを有する請求項4乃至6のいずれか一項に記載のデータ処理装置。
  8. 複数の計算機ノードと、
    前記複数の計算機ノードが実行するジョブをジョブファイルとして格納するグローバルファイルシステムと、
    前記グローバルファイルシステムと前記計算機ノードとの間で前記ジョブを実行できる形で前記ジョブファイルを一時保存するローカルファイルシステムと、
    前記ローカルファイルシステムと前記グローバルファイルシステムとの間で前記ジョブファイルの転送を実行するファイルステージング処理に使用する帯域であるステージング帯域を決定する決定手段と、帯域と時間とを2つの軸とする2次元マップである帯域スケジューラマップに基づいて帯域の使用予定時間を管理する管理手段と、前記帯域スケジューラマップに基づいて前記ステージング帯域を制御する制御手段とを備えるデータ処理装置とを備え
    前記管理手段は、
    前記ファイルステージング処理で使用する帯域に割り当てられた複数の帯域クラスの帯域比率情報をもつ帯域クラス設定情報を格納する帯域クラス設定情報記憶手段と、
    前記ファイルステージング処理における予定転送終了時刻、前記ジョブファイルの転送予定量および転送実績量を含む転送予定情報を格納する転送予定情報記憶手段とを有し、
    前記決定手段は、
    前記ジョブの実行開始時刻を決定し、
    前記実行開始時刻から予定転送終了時刻を決定し、
    前記ジョブの実行ノード数と前記ファイルステージング処理の種類から使用する前記帯域クラスを決定し、
    前記ステージング帯域を確保できる予定転送開始時刻を決定し、
    前記転送予定情報記憶手段から前記転送予定量を取得し、
    ジョブファイルの転送時間と転送量から転送速度を決定し、
    前記ファイルステージング処理に必要な領域を前記転送予定情報記憶手段に確保し、
    前記制御手段は、
    前記帯域スケジューラマップに従って前記ファイルステージング処理で使用している帯域を設定・変更する計算機システム。
  9. コンピュータが、
    ローカルファイルシステムとグローバルファイルシステムとの間でジョブファイルの転送を実行するファイルステージング処理に使用する帯域であるステージング帯域を決定し、
    帯域と時間とを2つの軸とする2次元マップである帯域スケジューラマップに基づいて帯域の使用予定時間を管理し、
    前記帯域スケジューラマップに基づいて前記ステージング帯域を制御するデータ処理方法であって、
    前記ファイルステージング処理で使用する帯域に割り当てられた複数の帯域クラスの帯域比率情報をもつ帯域クラス設定情報を帯域クラス設定情報記憶手段に格納し、
    前記ファイルステージング処理における予定転送終了時刻、ジョブファイルの転送予定量および転送実績量を含む転送予定情報を転送予定情報記憶手段に格納し、
    ジョブの実行開始時刻を決定し、
    前記実行開始時刻から予定転送終了時刻を決定し、
    前記ジョブの実行ノード数と前記ファイルステージング処理の種類から使用する前記帯域クラスを決定し、
    前記ステージング帯域を確保できる予定転送開始時刻を決定し、
    前記転送予定情報記憶手段から前記転送予定量を取得し、
    ジョブファイルの転送時間と転送量から転送速度を決定し、
    前記ファイルステージング処理に必要な領域を前記転送予定情報記憶手段に確保し、
    前記帯域スケジューラマップに従って前記ファイルステージング処理で使用している帯域を設定・変更するデータ処理方法。
  10. ローカルファイルシステムとグローバルファイルシステムとの間でジョブファイルの転送を実行するファイルステージング処理に使用する帯域であるステージング帯域を決定する処理と、
    帯域と時間とを2つの軸とする2次元マップである帯域スケジューラマップに基づいて帯域の使用予定時間を管理する処理と、
    前記帯域スケジューラマップに基づいて前記ステージング帯域を制御する処理とをコンピュータに実行させるデータ処理プログラムであって、
    前記ファイルステージング処理で使用する帯域に割り当てられた複数の帯域クラスの帯域比率情報をもつ帯域クラス設定情報を帯域クラス設定情報記憶手段に格納する処理と、
    前記ファイルステージング処理における予定転送終了時刻、ジョブファイルの転送予定量および転送実績量を含む転送予定情報を転送予定情報記憶手段に格納する処理と、
    ジョブの実行開始時刻を決定する処理と、
    前記実行開始時刻から予定転送終了時刻を決定する処理と、
    前記ジョブの実行ノード数と前記ファイルステージング処理の種類から使用する前記帯域クラスを決定する処理と、
    前記ステージング帯域を確保できる予定転送開始時刻を決定する処理と、
    前記転送予定情報記憶手段から前記転送予定量を取得する処理と、
    ジョブファイルの転送時間と転送量から転送速度を決定する処理と、
    前記ファイルステージング処理に必要な領域を前記転送予定情報記憶手段に確保する処理と、
    前記帯域スケジューラマップに従って前記ファイルステージング処理で使用している帯域を設定・変更する処理とを含むデータ処理プログラム
JP2014031596A 2014-02-21 2014-02-21 データ処理装置、計算機システム、データ処理方法およびデータ処理プログラム Active JP6303584B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014031596A JP6303584B2 (ja) 2014-02-21 2014-02-21 データ処理装置、計算機システム、データ処理方法およびデータ処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014031596A JP6303584B2 (ja) 2014-02-21 2014-02-21 データ処理装置、計算機システム、データ処理方法およびデータ処理プログラム

Publications (2)

Publication Number Publication Date
JP2015156185A JP2015156185A (ja) 2015-08-27
JP6303584B2 true JP6303584B2 (ja) 2018-04-04

Family

ID=54775448

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014031596A Active JP6303584B2 (ja) 2014-02-21 2014-02-21 データ処理装置、計算機システム、データ処理方法およびデータ処理プログラム

Country Status (1)

Country Link
JP (1) JP6303584B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0675785A (ja) * 1992-06-29 1994-03-18 Fujitsu Ltd プレステージング処理方法、バッファ管理方法及びファイルシステム
JP3951949B2 (ja) * 2003-03-31 2007-08-01 日本電気株式会社 分散型資源管理システムおよび分散型資源管理方法並びにプログラム
JP5081498B2 (ja) * 2007-05-24 2012-11-28 株式会社日立製作所 計算機システム、および、その制御方法

Also Published As

Publication number Publication date
JP2015156185A (ja) 2015-08-27

Similar Documents

Publication Publication Date Title
JP6897574B2 (ja) アクセラレータ制御装置、アクセラレータ制御方法およびプログラム
US10055252B2 (en) Apparatus, system and method for estimating data transfer periods for job scheduling in parallel computing
JP6254949B2 (ja) 仮想マシンプールにおけるリソースの価格設定
Bicer et al. Time and cost sensitive data-intensive computing on hybrid clouds
US9639576B2 (en) Database management system, computer, and database management method
US8549526B2 (en) Access control apparatus and access control method
JP5533315B2 (ja) 情報処理システム、管理装置、処理要求装置及びプログラム
JP7050957B2 (ja) タスクスケジューリング
US20200201763A1 (en) Memory hierarchy-aware processing
JP6885193B2 (ja) 並列処理装置、ジョブ管理方法、およびジョブ管理プログラム
JP2008152470A (ja) データ処理システム及び半導体集積回路
JP5614318B2 (ja) スケジューリングプログラム,方法および装置
CN110023904A (zh) 双模式本地数据存储
CN111352735A (zh) 数据加速方法、装置、存储介质及设备
US20120185672A1 (en) Local-only synchronizing operations
CN112019577A (zh) 专属云存储实现方法、装置、计算设备及计算机存储介质
Czarnul A model, design, and implementation of an efficient multithreaded workflow execution engine with data streaming, caching, and storage constraints
JP6303584B2 (ja) データ処理装置、計算機システム、データ処理方法およびデータ処理プログラム
WO2017018978A1 (en) Scheduling jobs in a computing cluster
JP2016114967A (ja) キャッシュ装置、キャッシュシステム、キャッシュ方法、及びキャッシュプログラム
US10824640B1 (en) Framework for scheduling concurrent replication cycles
JP6349837B2 (ja) スケジューラ装置及びそのスケジューリング方法、演算処理システム、並びにコンピュータ・プログラム
CN108228323A (zh) 基于数据本地性的Hadoop任务调度方法及装置
JP6836536B2 (ja) ストレージシステム及びio処理の制御方法
US20230010895A1 (en) Information processing apparatus, information processing method, and computer-readable recording medium storing information processing program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170116

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171205

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180219

R150 Certificate of patent or registration of utility model

Ref document number: 6303584

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150