WO2016079802A1

WO2016079802A1 - バッチ処理システムおよびその制御方法

Info

Publication number: WO2016079802A1
Application number: PCT/JP2014/080487
Authority: WO
Inventors: 大介飯塚; 裕工藤
Original assignee: 株式会社日立製作所
Priority date: 2014-11-18
Filing date: 2014-11-18
Publication date: 2016-05-26

Abstract

　バッチ処理システムにおいて、バッチ処理のための複数の計算機リソースと、前記バッチ処理の実行トレース情報に基づき、前記バッチ処理内のループ処理を特定し、前記バッチ処理は前記複数の計算機リソースにおいて並列処理可能であるか否かを判定する解析部と、前記特定したループ処理に基づき、前記並列処理により短縮できる実行推定時間を計算し、バッチ処理全体の実行時間を推定する並列実行スケジュール推定部とを備える。

Description

バッチ処理システムおよびその制御方法

　本発明は、バッチ処理システムおよびその制御方法に関するものである。

　バッチ処理は、計算機にデータが入力されて、何らかの計算処理を施して出力する処理である。企業においては、資材発注や会計処理等といった企業業務や、新技術に対する数値シミュレーション等を行うために用いられる。

　バッチ処理は長時間かかるものがある。例えば日本の銀行での振込処理は数時間かかる。このような振込処理は一般的に夜間に行なわれる。翌日の銀行業務開始時刻までに振込処理が完了していなければ、口座情報に不整合が起きてしまう。そのためバッチ処理は終了時刻を厳守するデッドライン保証が重要となる。デッドラインを保証するには、まずバッチ処理の開始前に、処理時間がどの程度かかりそうか見積もる事が重要となる。処理時間を見積もった結果が、デッドラインを保証できそうにない場合に、事前に何らかの対策を行う必要があると判明するからである。

　例えば、特許文献１では、データサイズと計算機単体の処理性能を元に、バッチ処理時間を見積もる技術が提示されている。

特開２００４－００５２８８号公報

　特許文献１を用いた見積もりにより、デッドライン保証できそうにないと判定した場合には、対策として、何らかの技術で処理を高速化しバッチ処理時間を短縮する事が考えられる。しかしながら、特許文献１では、そのような短時間化する技術については言及していない。また、バッチ処理では、昔作られたプログラムをそのまま使い続けるケースが多い。そのため、プログラムの作成者が異動するなどにより、バッチ処理に対して、どのようなファイルやDB等の入出力があるのか不明な場合がある。特許文献１では入出力ファイルが予め与えられている必要があるため、バッチ処理の入出力の特定が困難な場合、特許文献１ではバッチ処理時間を見積もることもできない。

　本発明は、バッチ処理時間を短縮し、短縮したバッチ処理時間を見積もることを目的とする。

　本発明に係る代表的なバッチ処理システムは、バッチ処理システムにおいて、バッチ処理のための複数の計算機リソースと、前記バッチ処理の実行トレース情報に基づき、前記バッチ処理内のループ処理を特定し、前記バッチ処理は前記複数の計算機リソースにおいて並列処理可能であるか否かを判定する解析部と、前記特定したループ処理に基づき、前記並列処理により短縮できる実行推定時間を計算し、バッチ処理全体の実行時間を推定する並列実行スケジュール推定部とを備えたことを特徴とする。

　本発明によれば、バッチ処理時間を短縮し、短縮したバッチ処理時間を見積もることができる。

情報処理システムの全体構成の例を示す図である。管理サーバの構成の例を示す図である。ジョブネット一覧の例を示す図である。ジョブ一覧の例を示す図である。ジョブネットの処理構造の例を示す図である。ジョブ内部処理の例を示す図である。ジョブの並列化前の例を示す図である。ジョブの並列化後の例を示す図である。ジョブの実行トレースの例を示す図である。ジョブの実行トレースを取得する処理の例を示す図である。ジョブ解析結果一覧の例を示す図である。ジョブファイル入出力一覧の例を示す図である。ジョブ解析処理の例を示す図である。開始入力ファイル一覧の例を示す図である。ジョブ実行時間推定式一覧の例を示す図である。ジョブ実行時間推定式算出処理の例を示す図である。ジョブ実行時刻推定結果一覧の例を示す図である。ジョブネット並列実行処理の例を示す図である。ジョブネット並列実行スケジュール推定処理の例を示す図である。動作ホスト決定処理の例を示す図である。並列時のジョブ実行時間表示の例を示す図である。

　以下、本発明の実施の形態について図面を参照しながら説明する。図１は、情報処理システム構成の例を表す図である。情報処理システムは、管理サーバ１０１、操作端末１１８、サーバ装置１０３、ファイルサーバ装置１０４、ストレージ装置１０５を備える。

　管理サーバ１０１、操作端末１１８、サーバ装置１０３、ファイルサーバ装置１０４、ストレージ装置１０５は、リンク１０２ａ～１０２ｄを介してサーバ用ネットワーク１０６に接続される。サーバ装置１０３、ファイルサーバ装置１０４、ストレージ装置１０５は、リンク１０２ｅ～１０２ｆを介してストレージ用ネットワーク１０７に接続される。リンク１０２ａ～１０２ｆは、有線または無線の接続回線であり、１つ以上のサブネットワークや、ＶＰＮ（仮想プライベートネットワーク）、ＶＬＡＮ（仮想ローカルエリアネットワーク）、ファイバチャネルゾーン、ＳｅｒｉａｌＡＴＡバス、ＳＣＳＩバスを含んでいても良い。

　管理サーバ１０１、操作端末１１８、サーバ装置１０３、ファイルサーバ装置１０４、ストレージ装置１０５は、それぞれ異なるプロトコルで、サーバ用ネットワーク１０６ないしストレージ用ネットワーク１０７に接続されていても良い。サーバ用ネットワーク１０６、ストレージ用ネットワーク１０７が、それぞれ複数存在しても良い。サーバ用ネットワーク１０６とストレージ用ネットワーク１０７が同一であっても良い。

　サーバ装置１０３内には、仮想マシン１０８が稼働しており、サーバ用ネットワーク１０６に、有線または無線で接続されている。仮想マシン１０８には、ジョブプログラム１０９、トレース取得プログラム１１０、分割プログラム１１１、結合プログラム１１２が格納されている。ジョブプログラム１０９、トレース取得プログラム１１０、分割プログラム１１１、結合プログラム１１２は、それぞれ複数個が例示されているが、それぞれ０個または１個であっても良い。ジョブプログラム１０９、トレース取得プログラム１１０、分割プログラム１１１、結合プログラム１１２は、サーバ用ネットワーク１０６を介して、管理サーバ１０１から転送されて、仮想マシン１０８上に格納されても良い。

　サーバ装置１０３または仮想マシン１０８は、ストレージ装置１０５とリンク１０２ｆで直接に接続されていても良い。サーバ装置１０３または仮想マシン１０８内に、ストレージ装置１０５が含まれていても良い。サーバ装置１０３、ファイルサーバ装置１０４、ストレージ装置１０５内に、ジョブプログラム１０９、トレース取得プログラム１１０、分割プログラム１１１、結合プログラム１１２が格納されていても良い。

　仮想マシン１０８上で、ジョブプログラム１０９が動作することで、バッチ処理が実現される。なお、同一のサーバ装置１０３上の仮想マシン１０８は、複数のジョブネットにより共用される。各テナント（顧客企業などの依頼主）はそれぞれ異なるジョブネットを所有するため、一つのサーバ装置１０３上では、マルチテナント環境でジョブが動作することになる。

　ファイルサーバ装置１０４内に、ストレージ装置１０５が含まれていても良い。ストレージ装置１０５内には、開始入力ファイル４０１、中間ファイル４０２、結果出力ファイル４０３が含まれる。開始入力ファイル４０１、中間ファイル４０２、結果出力ファイル４０３は、それぞれ複数個が例示されているが、それぞれ０個または１個であっても良い。サーバ装置１０３、仮想マシン１０８、ファイルサーバ装置１０４に、開始入力ファイル４０１、中間ファイル４０２、結果出力ファイル４０３が格納されていても良い。

　サーバ装置１０３、ファイルサーバ装置１０４、ストレージ装置１０５は、それぞれ複数台が例示されているが、それぞれ０台または１台となっていても良い。管理サーバ１０１、操作端末１１８は、それぞれ１台が例示されているが、それぞれ０台または複数台となっていても良い。管理サーバ１０１、操作端末１１８、サーバ装置１０３、ファイルサーバ装置１０４、ストレージ装置１０５は、仮想マシンによって構成されていても良い。また、管理サーバ１０１、操作端末１１８、サーバ装置１０３、ファイルサーバ装置１０４、ストレージ装置１０５は、そのどれか２つ以上が、同一の筐体ないし同一の仮想マシンとなっていても良い。

　図１では、一台のサーバ装置１０３のホスト名としてhyper1、一台の仮想マシン１０８のホスト名としてvm1、一台のファイルサーバ装置１０４のホスト名としてnas1、一台のストレージ装置１０５のホスト名としてstorage1が例示されている。これらの装置は、これら以外のホスト名となっていても良い。

　管理サーバ１０１は、実行トレース取得部１２０、ジョブ解析部１２１、実行時間推定式算出部１２２、並列実行スケジュール推定部１２３、動作ホスト決定部１２４、ジョブネット並列化実行部１２５を備える。なお、複数の管理サーバ１０１が存在し、実行トレース取得部１２０、ジョブ解析部１２１、実行時間推定式算出部１２２、並列実行スケジュール推定部１２３、動作ホスト決定部１２４、ジョブネット並列化実行部１２５のうちの少なくとも一つ以上が、それぞれ異なる管理サーバ１０１上で動作していても良い。

　また、実行トレース取得部１２０、ジョブ解析部１２１、実行時間推定式算出部１２２、並列実行スケジュール推定部１２３、動作ホスト決定部１２４、ジョブネット並列化実行部１２５のうち、少なくとも１つ以上が存在しなくても良い。管理サーバ１０１については後記にて詳しく説明する。管理サーバ１０１には、記憶装置１０７が接続されている。記憶装置１０７には、一つ以上の実行トレース２３０が格納されている。なお、管理サーバ１０１に複数の記憶装置１０７が格納されていても良い。また、実行トレースが複数の記憶装置１０７に分散して格納されていても良い。

　操作端末１１８は、ジョブ実行時間表示部１１９を備える。なお、操作端末１１８が、管理サーバ１０１と同一であっても良い。

　図２は、管理サーバ１０１の構成の例を表す図である。管理サーバ１０１はプロセッサ２００、主記憶２０１、入力デバイス２０３、出力デバイス２０４、外部記憶装置インターフェース２０５、通信インターフェース２０６を備え、それらが、相互に通信できるように、バス２０８で接続されている。主記憶２０１に格納された、実行トレース取得プログラム、ジョブ解析プログラム、実行時間推定式算出プログラム、並列実行スケジュール推定プログラム、動作ホスト決定プログラム、ジョブネット並列化実行プログラムなど各種プログラム２０２をプロセッサ２００が実行することで、実行トレース取得部１２０、ジョブ解析部１２１、実行時間推定式算出部１２２、並列実行スケジュール推定部１２３、動作ホスト決定部１２４、ジョブネット並列化実行部１２５となり、各部の各処理を行う。

　なお、実行トレース取得プログラム、ジョブ解析プログラム、実行時間推定式算出プログラム、並列実行スケジュール推定プログラム、動作ホスト決定プログラム、ジョブネット並列化実行プログラムのうち、少なくとも１つ以上が存在しなくても良い。

　各種プログラム２０２をプロセッサ２００で実行する代わりに、実行トレース取得部１２０、ジョブ解析部１２１、実行時間推定式算出部１２２、並列実行スケジュール推定部１２３、動作ホスト決定部１２４、ジョブネット並列化実行部１２５を、各処理を行う専用のハードウェアでそれぞれ実現してもよい。以下、説明を簡単にするため、主記憶２０１上にある各種プログラム２０２をプロセッサ２００が実行することで実現される各処理部を、各処理の主体として説明する。

　外部記憶装置インターフェース２０５は記憶装置１０７に接続される。記憶装置１０７は管理サーバ１０１の外部に備わっていても良く、管理サーバ１０１の内部に備わっていても良い。記憶装置１０７は、ジョブネット一覧２１０、ジョブ一覧２２０、実行トレース一覧２３０、ジョブ解析結果一覧２４０、ジョブ入出力ファイル一覧２５０、開始入力ファイル一覧２６０、ジョブ実行時間推定式一覧２７０、ジョブ実行時刻推定結果一覧２８０など各種情報２０７を保持する。

　ジョブネット一覧２１０、ジョブ一覧２２０、実行トレース一覧２３０、ジョブ解析結果一覧２４０、ジョブ入出力ファイル一覧２５０、開始入力ファイル一覧２６０、ジョブ実行時間推定式一覧２７０、ジョブ実行時刻推定結果一覧２８０のうち、少なくとも１つ以上が存在しなくても良い。記憶装置１０７が保持する各種情報２０７のうち、１つ以上の情報が主記憶２０１に格納されていても良い。各種情報２０７については、図３以降を用いて詳しく説明する。

　通信インターフェース２０６は、サーバ用ネットワーク１０６に接続されている。通信インターフェース２０６と外部記憶装置インターフェース２０５は同一のインターフェースとなっていても良い。入力デバイス２０３の例は、キーボードやポインタデバイス、タッチパネル等であるが、これら以外のデバイスであってもよい。また、出力デバイス２０４の例は、ディスプレイやプリンタ等であるが、これら以外のデバイスであってもよい。

　また、入力デバイス２０３及び出力デバイス２０４（以下、入出力デバイスと総称する）の代替としてシリアルインターフェース又はイーサーネット（登録商標）インターフェースを管理サーバ１０１は備え、ディスプレイ、キーボード、又はポインタデバイスを有する表示用計算機がそのインターフェースに接続されてもよい。そして、そのインターフェースは、出力用情報（表示用情報）を表示用計算機に送信したり、入力情報を表示用計算機から受信し、表示用計算機が出力用情報を表示したり、入力を受け付けることによって、入出力デバイスでの入力及び出力を代替してもよい。
　サーバ装置１０３、ファイルサーバ装置１０４、ストレージ装置１０５、操作端末１１８についても、管理サーバ１０１と同様に、プロセッサ２００、主記憶２０１、入力デバイス２０３、出力デバイス２０４、外部記憶装置インターフェース２０５、通信インターフェース２０６を備え、それらが相互に通信できるようにバス２０８で接続されている。サーバ装置１０３、ファイルサーバ装置１０４、ストレージ装置１０５、操作端末１１８が、これ以外の構造をしていても良い。特に、サーバ装置１０３は複数のプロセッサを備えても良い。

　サーバ装置１０３は、一つのプロセッサ２００を備え、複数の仮想マシン１０８が一つのプロセッサ２００で実行されても良いし、複数のプロセッサ２００を備え、一つの仮想マシン１０８が一つのプロセッサ２００で実行されることにより複数の仮想マシン１０８が実行されても良い。さらに、複数のプロセッサ２００の一部または全てで複数の仮想マシン１０８が実行されても良い。なお、ここでプロセッサはプロセッサのコアと読み替えて、複数のコアが使用されても良い。

　図３は、ジョブネット一覧２１０の例を示す図である。ジョブネット一覧２１０は表形式となっており、一つ以上の行から成る。全ての行は４つの列を含んでいる。ここで４つの列とは、ジョブネット名２１１、実行スケジュール２１２、デッドライン２１３、テナント２１４である。ジョブネット一覧２１０の各行は、これ以外の不図示の列を含んでいても良いし、幾つかの列が存在しなくても良い。ジョブネット一覧２１０に格納された情報は、システム管理者などにより手作業で作成されても良く、あるいは何らかのツールやユーティリティを用いて作成されても良い。

　ジョブネット一覧２１０には、サーバ装置１０３、または仮想マシン１０８上で動作させるジョブネットの情報が格納されている。このジョブネットを動作させることで、バッチ処理が実現される。ジョブネット名２１１はジョブネットの名称である。実行スケジュール２１２は、ジョブネットを実行開始する時刻である。デッドライン２１３は、ジョブネットが当該時刻までに終了させなければならない期限である。テナント２１４は、ジョブネットの所有者である。

　図４は、ジョブ一覧２２０の例を示す図である。ジョブ一覧２２０は表形式となっており、一つ以上の行から成る。全ての行は６つの列を含んでいる。ここで６つの列とは、ジョブネット名２２１、ジョブ名２２２、先行ジョブ２２３、後続ジョブ２２４、実行可ホスト２２５、コマンドライン２２６である。ジョブ一覧２２０の各行は、これ以外の不図示の列を含んでいても良いし、幾つかの列が存在しなくても良い。ジョブ一覧２２０に格納された情報は、システム管理者などにより手作業で作成されても良く、あるいは何らかのツールやユーティリティを用いて作成されても良い。

　ジョブ一覧２２０には、ジョブネット一覧２１０に格納されている各ジョブネットに対して、ジョブネットを構成するジョブに関する情報が格納されている。各ジョブネットは、一つ以上のジョブから成る。各ジョブは、サーバ装置１０３、または仮想マシン１０８上でジョブプログラム１０９を動作させることで、実行される。ジョブ同士には実行順序関係がある。

　ジョブネット名２２１は、ジョブネット一覧２１０のジョブネット名２１１と関連を持つ。ジョブ名２２２は、ジョブの名称である。先行ジョブ２２３は、ジョブ名２２２に設定されたジョブを実行する前に実行完了すべきジョブを示す。先行ジョブ２２３は、ジョブ名２２２と関連を持つ。先行ジョブ２２３に複数のジョブが記録されている時は、それらジョブが全て実行完了してから、ジョブ名２２２に設定されたジョブが実行される。

　後続ジョブ２２４は、ジョブ名２２２に設定されたジョブが実行完了した後に、実行開始すべきジョブを示す。後続ジョブ２２４は、ジョブ名２２２と関連を持つ。後続ジョブ２２４に複数のジョブが記録されている時は、ジョブ名２２２に設定された自身のジョブが実行完了した際に、後続ジョブ２２４に記録されたジョブを実行開始する。

　実行可ホスト２２５は、ジョブ名２２２に設定されたジョブを実行させることができるサーバ装置１０３、または仮想マシン１０８である。なお、すべてのジョブがどのサーバ装置１０３、または仮想マシン１０８でも実行可能な環境であれば、実行可ホスト２２５は、実行させることができる台数であっても良い。実行可ホスト２２５は、システム管理者などにより手作業で設定されても良いし、過去の実行履歴などに基づいて設定されても良い。

　コマンドライン２２６は、ジョブ名２２２に設定されたジョブをサーバ装置１０３、または仮想マシン１０８上で実行させる際のコマンドラインである。このコマンドラインにより、ジョブプログラム１０９を起動する事で、ジョブが実行される。コマンドラインからジョブプログラム１０９を直接呼び出す代わりに、shやbat等のスクリプトを呼び出し、そのスクリプト内からジョブプログラム１０９を呼ぶことでジョブを実行しても良い。

　図５は、ジョブネットの処理構造の例を示す図である。ここではジョブ一覧２２０で示されるジョブネットのうち、ジョブネットjn1の構造を示している。ジョブネット４００(jn1)は、ジョブ４１１（j1）、ジョブ４１２（j2）、ジョブ４１３（j3）、ジョブ４１４（j4）から成る。各ジョブ同士には、先行ジョブ２２３、後続ジョブ２２４で指定された実行順序関係がある。ここでは破線矢印４３０ａ～４３０ｄが実行順序を示している。各ジョブが実行されるホストを、ジョブ４１１～４１４の下にホスト４２０ａ～４２０ｄが示している。

　ジョブは一般的に、一つ以上のファイルを入力し、一つ以上のファイルを出力する。ジョブへの入力ファイルのうち、他ジョブが出力しないファイルの事を開始入力ファイルと呼ぶ。ジョブが出力し他ジョブの入力として使われないファイルを結果出力ファイルと呼ぶ。それ以外のファイルを中間ファイルと呼ぶ。また、ジョブ同士でのファイルの入出力関係は、ファイル入力４３１ａ～４３１ｅの矢印、ファイル出力４３２ａ～４３２ｅの矢印で示されている。

　図５の例では、開始入力ファイル４０１が入力され、結果出力ファイル４０３が出力される。その中で例えばジョブ４１２は、破線矢印４３０ａで示されるように先行ジョブのジョブ４１１の後でホスト４２０ｂすなわちvm1で実行される。この実行のためジョブ４１２は、ファイル出力４３２ａとファイル入力４３１ｂで示されるようにジョブ４１１の出力する中間ファイル４０２a（中間ファイル１）を入力とする。そして、ジョブ４１２は、ファイル出力４３２ｃで示されるように中間ファイル４０２c（中間ファイル３）を出力する。その後、破線矢印４３０ｃで示される後続ジョブのジョブ４１４が中間ファイル４０２を、ファイル入力４３１ｄで示されるように入力する。

　なお、ファイルを入力するだけのジョブや、出力するだけのジョブもあり得る。また、環境チェックなどファイルを一切入出力しないジョブもあり得る。ジョブは、ファイルの代わりにデータベースやＬＤＡＰを使用しても良く、あるいはHTTPやFTP等の通信を介して情報を取得、または格納しても良い。

　図６は、ジョブを処理するために実行される、ジョブプログラム１０９実行時の処理フローの例を示す図である。ここでは、並列実行が可能となるジョブプログラム１０９の処理を示す。ジョブプログラム１０９が実行されると、前処理１００１、ループ処理１００２、後処理１００３の順に実行される。ループ処理１００２は、入力ファイルを全て読み終える(読み込みサイズがEOF：End of Fileになる)までの間（ステップ１０１０）、入力ファイルから１レコード読み(ステップ１０１１)、出力を計算し（ステップ１０１２）、出力ファイルに出力し（ステップ１０１３）、ステップ１０１０に戻る(ステップ１０１４）処理である。

　ステップ１０１１では、改行で区切られた情報、一定サイズ毎の情報、またはファイル中に指定されたサイズの情報が１レコードである。ジョブプログラム１０９での処理がこのような処理フローになっていれば、入力ファイルを分割し、分割したファイルのそれぞれを入力として複数の仮想マシン１０８でジョブを実行させ、出力されたファイルを結合して一つの出力ファイルにすることで、ジョブを並列実行しジョブ実行時間を短縮できる。ジョブプログラム１０９がこのように並列実行可であることを、後述する図９で示すジョブの実行トレースを元に、この並列実行可否を判定することが、本実施の形態での特徴の一つとなる。

　図７Ａ、７Ｂは、ジョブ並列化による処理の変化の例を示す図である。ここでは図５中のジョブ４１２（j2）を並列化する場合について例示し、図５と同様の書式で並列化前後のジョブの構造を示している。ジョブは丸印で、ジョブの下にある四角はジョブを実行するホストを示している。破線矢印でジョブ同士の実行順序を、ファイル入力の矢印、ファイル出力の矢印でジョブに対するファイルの入出力関係を示している。

　図７Ａが並列化前のジョブ４１２であり、図７Ｂが並列化後のジョブ群である。並列化後のジョブ群は、入力ファイルを分割する処理と、分割したファイルを並列実行する処理、並列実行で出力された複数ファイルを結合し一つの出力ファイルとする結合処理から成る。

　分割処理では、ジョブ４１２への入力となる中間ファイル４０２aを、分割ジョブ４１５で読み込み、中間ファイル４０２ａの内容を複数に分割して分割入力ファイル４０５ａ、４０５ｂとしてファイル出力する。ここでは並列度が２、つまりジョブを２つ並列実行させるため、分割入力ファイル４０５a、４０５bに２分割している。分割ジョブ４１５では、分割プログラム１１１を実行してファイルを分割する。

　分割処理では、可能な限りレコード数またはサイズが均等になるように分割する。例えば、分割ジョブ４１５は、中間ファイル４０２ａを先頭から入力しながら分割入力ファイル４０５ａへ出力し、中間ファイル４０２ａのサイズの１／２を超えたレコード境界まで入力すると、出力先を分割入力ファイル４０５ｂへ切替えて、中間ファイル４０２ａを継続して入力しながら分割入力ファイル４０５ｂへ出力する。

　並列処理では、分割処理で分割された分割入力ファイル４０５ａ、４０５ｂをファイル入力４３１ｇ、４３１ｈとして、ホスト４２０ｈのvm1とホスト４２０ｉのvm2という異なるホスト上で同一のジョブ４１２を実行する。各ジョブ４１２はそれぞれ異なる出力ファイルにファイル出力４３２ｉ、４３２ｊする。ここで出力ファイルは出力ファイル４０６a、４０６bになる。結合処理では、出力ファイル４０６a、４０６bを結合ジョブ４１６により結合して、一つの中間ファイル４０２ｃを作る。

　例えば、結合ジョブ４１６は、出力ファイル４０６ａを先頭から入力しながら中間ファイル４０２ｃへ出力し、出力ファイル４０６ａをすべて入力し終えると、出力ファイル４０６ｂへ入力を切替えて、出力ファイル４０６ｂを入力しながら中間ファイル４０２ｃへ継続して出力する。結合ジョブ４１６は、結合プログラム１１２を実行してファイルを結合する。なお、各ジョブは破線矢印４３０ｇ、４３０ｈ、４３０ｉ、４３０ｊにしたがった順序で実行される。

　並列度をnとして、図６での前処理１００１にかかる時間をB、ループ処理１００２にかかる時間をL、後処理１００３かかる時間をA、図７の分割処理にかかる時間をD、結合処理にかかる時間をCとすると、並列実行後の処理時間Tは、おおよそ
　T = D + B + L÷n + A + C
の式で求められる。分割処理、結合処理による時間的オーバーヘッドよりも、並列処理による時間短縮が大きければ、単体ホストでジョブを実行するよりも処理時間が短縮できる。

　図８は、実行トレース一覧２３０に含まれる実行トレースの例を示す図である。実行トレース一覧２３０は、一つ以上の実行トレースファイル２３１から成る。トレース取得プログラム１１０を介して、ジョブプログラム１０９が実行されると、ジョブプログラム１０９での実行内容がログとして取得できる。このログをファイルとして保存したものが、実行トレースファイル２３１である。トレース取得プログラム１１０の例としては、Linux（登録商標）でのstraceやltraceがある。straceでは、システムコール呼び出しの内容をログとして出力する。ltraceでは、libc等のライブラリに含まれる関数の呼び出し内容をログとして出力する。

　Linux以外のUnix（登録商標）に対しては動的ライブラリ(.so)呼び出しを、Windows（登録商標）ではdll呼び出しを、それぞれフックすることで、同様の情報を取得できる。ここでは実行トレースファイル２３１として、Linuxのstraceの出力内容をファイル形式で例示する。実行トレースファイル２３１のサイズは一般的に大きいため、図中で内容を一部省略してある。各行はシステムコール呼び出し時の情報を示す。実行トレースファイル２３１は、 XML、JSONや表、メモリ上の構造体イメージなどで表現されていても良い。

　実行トレースファイル２３１は複数行から成る。各行は、時刻２３２、システムコール名２３３、引数２３４、戻り値２３５、システムコール処理時間２３６から成る。実行トレースファイル２３１に、時刻２３２、システムコール名２３３、引数２３４、戻り値２３５、処理時間２３６のうち、幾つかの情報が無くても良いし、これ以外の情報が含まれていても良い。なお、行番号２３７は各行を説明するための番号である。

　時刻２３２は、システムコール呼び出し時の時刻である。システムコール名２３３は、呼び出されたシステムコールの名称である。引数２３４は、システムコール呼び出し時に渡した引数である。引数は入力の場合もあるし、出力の場合もある。戻り値２３５は、システムコール呼び出しの戻り値である。戻り値の意味はシステムコールによって異なる。処理時間２３６は、当該システムコールを呼び出してから帰って来るまでの時間である。

　openシステムコールでは、引数２３４から読み書きするファイルのファイル名が得られ、戻り値２３５からファイルハンドルが得られる。readやwrite等のファイル入出力システムコールの戻り値２３５は、そのシステムコールで読み書きしたファイルサイズとなる。そのため、ファイルを開いてから閉じるまでのファイルサイズを合算することで、ファイル入出力サイズを求める。また、処理時間２３６を合算することでファイル入出力時間を求める事ができる。ファイル入出力サイズをファイル入出力時間から、I/O速度を求める事ができる。これらの内容を、後述する図１１のジョブファイル入出力一覧に記録する。

　ここでは、図８の実行トレースファイル２３１の内容を元に、ジョブプログラム１０９が図６のようなジョブ内部処理となっているか否かと、図６での前処理１００１にかかる時間、ループ処理１００２にかかる時間、後処理１００３かかる時間、図７の分割処理にかかる時間、結合処理にかかる時間を求める処理を簡単に説明する。実際の具体的な処理は図１２を用いて改めて説明する。

　１行目は、ジョブプログラム１０９を実行する事を示している。ここではジョブプログラム１０９としてcalcincomeを実行している。２行目は読み込みファイル/etc/settingを開き、３、４行目は読み込み、５行目はファイルを閉じることを示す。２行目の戻り値はファイルハンドルを示す。３、４行目の戻り値２３５が、それぞれの処理で読み込んだファイルサイズとなる。ファイル/etc/settingを読む処理は、後述するファイル/work/item.csvを読む処理よりも読み込みサイズが小さい。そのため、このファイルはジョブの入力ファイルとはみなさない。典型的には、ファイルのパス名に/etc/を含むので、この処理は設定ファイルを読み込む処理と推定できる。

　６行目が、書き込みファイル/log/exec.logを開く処理である。９行目、１６行目はファイルに書き込む処理を示す。後述するファイル/nas/iiconme.csvに出力する処理よりも、書き込みサイズが小さい。また、ファイルのパス名がlogを含み、ファイルの拡張子もlogなので、このファイルはジョブの出力ファイルとはみなさない。典型的には、このファイルはジョブの動作を記録するログファイル出力であると推定できる。

　７行目は、読み込みファイル/work/item.csv を開く処理である。１０、１１、１３、１５行目はファイルから読み込み、１７行目でファイルを閉じる処理を示す。１５行目で戻り値が０になっているのは、ファイルの終了（EOF、End of File)まで読んだからである。８行目は、書き込みファイル/nas/iincome.csv を開く処理である。１２、１４、１８行目はファイルに出力し、１９行目はファイルを閉じる処理を示す。２０行目は処理の終了を示す。

　最も大きな読み込みファイルは、７行目で開いているファイル/work/item.csvである。１５行目でEOFが出ていることからわかるように、このファイルは最後まで読み込まれている。また、最も大きな書き込みファイルは、８行目で開いているファイル/nas/income.csvである。よって、これらのファイルがジョブに対する入力ファイルと出力ファイルであるとみなされる。

　ファイル/work/item.csvを読む処理は１０行目から１５行目までで、ファイル/nas/iincome.csvに書き込む処理は１２行目から１８行目までである。よって、これらの集合和をとった１０行目から１８行目までを、図６でのループ処理１００２とみなすことができる。それより前の1行目から９行目までが前処理１００１、１９行目から２０行目までを後処理１００３とみなすことができる。あるいは、入力ファイルを開く７行目から、出力ファイルを閉じる１９行目までをループ処理１００２とみなすこともできる。各行の時刻２３２の差から、前処理、ループ処理、後処理にかかる時間を求めることができる。

　Windowsで実行トレースを取得した場合、CreateFile APIでファイルを開き、ReadFileでファイルを読み、WriteFileでファイル出力し、CloseHandleでファイルを閉じる。これらの情報を元にトレースファイルの内容は解析できる。

　図９は、実行トレース取得部１２０での処理の例を示す図である。実行トレースファイル２３１を出力する処理である。図９の処理は、処理順序が図示と異なっていても良いし、これ以外の不図示の処理を含んでいても良いし、幾つかの処理が存在しなくても良い。実行トレース取得部１２０は、まずジョブ定義にトレース取得処理を挿入する(ステップ１１０１）。例えば、ジョブ一覧２２０のコマンドライン２２６のコマンドを、トレース取得プログラム１１０を介して実行するように修正する。

　次に、実行トレース取得部１２０はジョブネットを実行開始する(ステップ１１０２）。これにより、ジョブの依存関係に従って、仮想マシン１０８上でジョブが実行される。同時に、トレース情報が仮想マシン１０８上のファイルに出力される。最後に、実行トレース取得部１２０は、出力されたトレース情報を取得し、実行トレース一覧２３０に格納する(ステップ１１０３）。この処理により、実行されるジョブプログラム１０９に対する実行トレースが取得される。

　なお、実行トレースファイル２３１は、例えばジョブ４１２（j2）のみが実行されて、取得されても良い。また、一般に、バッチ処理が使い始められた時期には、バッチ処理の対象となるファイルは小さいため、そのような小さなファイルを対象として実行された結果の実行トレースファイル２３１が取得されても良い。

　図１０は、ジョブ解析結果一覧２４０の例を示す図である。ジョブ解析結果一覧２４０には、実行トレースファイル２３１の内容を解析した結果が格納される。ジョブ解析結果一覧２４０は表形式となっており、一つ以上の行から成る。全ての行は７つの列を含んでいる。ここで７つの列とは、実行ＩＤ２４１、ジョブネット名２４２、ジョブ名２４３、処理時間２４４、並列可２４５、前・後処理時間２４６、ループ処理時間２４７である。ジョブ解析結果一覧２４０の各行は、これ以外の不図示の列を含んでいても良いし、幾つかの列が存在しなくても良い。ジョブ解析結果一覧２４０に格納された情報は、システム管理者などにより手作業で作成されても良く、あるいは何らかのツールやユーティリティを用いて作成されても良い。

　実行ＩＤ２４１は、ジョブネットの実行を識別する識別子である。ジョブネット名２４２は、ジョブネットの名称であり、ジョブネット名２１１と関連する。ジョブ名２４３は、ジョブの名称であり、ジョブ名２２２と関連する。処理時間２４４は、ジョブの開始から終了までの時間である。

　並列可２４５は、ジョブ名２４３で示されるジョブのジョブプログラム１０９が並列実行可能か否かを示す情報である。前・後処理時間２４６は、前処理１００１と後処理１００３にかかる時間を推定したものである。ループ処理時間２４７は、ループ処理１００２にかかる時間を推定したものである。

　図１１は、ジョブファイル入出力一覧２５０の例を示す図である。ジョブファイル入出力一覧２５０には、実行トレースファイル２３１の内容を解析した結果、ジョブで入出力されるファイルと、それらファイルのサイズ、入出力時間等が格納される。ジョブファイル入出力一覧２５０は表形式となっており、一つ以上の行から成る。全ての行は９つの列を含んでいる。ここで９つの列とは、実行ＩＤ２５１、ジョブネット名２５２、ジョブ名２５３、入出力２５４、ファイル名２５５、ファイルサイズ２５６、入出力時間２５７、Ｉ／Ｏ速度２５８、分割・結合時間２５９から成る。ジョブファイル入出力一覧２５０の各行は、これ以外の不図示の列を含んでいても良いし、幾つかの列が存在しなくても良い。
ジョブファイル入出力一覧２５０に格納された情報は、システム管理者などによりが手作業で作成されても良く、あるいは何らかのツールやユーティリティを用いて作成されても良い。

　実行ＩＤ２５１は、ジョブネットの実行を識別する識別子であり、実行ＩＤ２４１と関連を持つ。ジョブネット名２５２は、ジョブネットの名称であり、ジョブネット名２１１と関連する。ジョブ名２５３は、ジョブの名称であり、ジョブ名２２２と関連する。入出力２５４は、ファイル名２５５で示されるファイルがジョブへの入力なのか、出力なのかを示す。

　ファイル名２５５は、ジョブ名２５３で示されるジョブが入出力するファイルのファイル名を示す。ファイル名２５５で示されるファイルに関して、ファイルサイズ２５６は、ファイルのサイズを示し、入出力時間２５７は、ファイルの入力または出力にかかった時間を示し、Ｉ／Ｏ速度２５８は、ファイルの入力または出力した際のＩ／Ｏ速度を示す。Ｉ／Ｏ速度２５８は、ファイルサイズ２５６を入出力時間２５７で割ったものに等しい。

　分割・結合時間２５９は、ファイルが入力だった場合は分割、出力だった場合は結合するのにかかる時間を推定したものである。例えばジョブ４１２のファイル/work/item.csvのように入出力２５４が入力のときは、分割処理の入力時間がジョブ４１２の入力時間と同じであり、分割処理の出力ファイルサイズがジョブ４１２の入力ファイルサイズと同じであり、分割処理の出力速度はジョブ４１２の出力速度と同じであると仮定する。これにより、入出力時間２５７の入力時間２００秒に、ファイル/work/item.csvのファイルサイズ２５６の１０．０ＧＢを、同じジョブすなわちジョブ４１２で出力となるファイル/nas/income.csvのＩ／Ｏ速度２５８の０．０４ＧＢ／秒で割った値を加えて、４５０秒が得られる。

　また、ジョブ４１２のファイル/nas/income.csvのように入出力２５４が出力のときは、結合処理の出力時間がジョブ４１２の出力時間と同じであり、結合処理の入力ファイルサイズがジョブ４１２の出力ファイルサイズと同じであり、結合処理の入力速度がジョブ４１２の入力速度と同じであると仮定する。これにより、入出力時間２５７の出力時間１２５秒に、ファイル/nas/income.csvのファイルサイズ２５６の５．０ＧＢを、同じジョブすなわちジョブ４１２で入力となるファイル/work/item.csvのＩ／Ｏ速度２５８の０．０５ＧＢ／秒で割った値を加えて、２２５秒が得られる。

　図１２は、ジョブ解析部１２１での処理の例を示す図である。図１２の処理は、処理順序が図示と異なっていても良いし、これ以外の不図示の処理を含んでいても良いし、幾つかの処理が存在しなくても良い。この処理は、実行トレースファイル２３１から、ジョブ解析結果一覧２４０とジョブファイル入出力一覧２５０を作る処理である。ジョブネット名と実行トレースファイル２３１の情報を入力して、ジョブ解析部１２１は動作を開始する。

　ジョブ解析部１２１は、ジョブネットを構成する全てのジョブをジョブ一覧２２０から求め、ステップ１２０２から１２１５1215までを繰り返す（ステップ１２０１、１２１６）。繰り返し処理の最初では、実行トレースファイル２３１を読み込む(ステップ１２０２）。そして、トレース取得処理のオーバーヘッドを補正する（ステップ１２０３）。トレースを取得するとジョブの処理時間が余計にかかるので、そのオーバーヘッドの分だけ、トレース中の時刻２３２や、処理時間２３６を修正する。例えば処理オーバーハッドが１０％のときは、開始時刻を起点として、時刻２３２を全体的に１０％早くなるように修正する。

　ジョブ解析部１２１は、ジョブの処理時間を取得・保存する（ステップ１２０４）。すなわち、トレース中の時刻２３２のうち、開始時刻と終了時刻の差を求め、処理時間２４４に格納する。ジョブ解析部１２１は、入出力ファイル候補を抽出する（ステップ１２０５）。ファイルのパス名から、ログファイル（ファイルの拡張子が.logである、パス名にlogを含む、など）や設定ファイル（ファイルの拡張子が.cnfである、パス名にetcを含む、など）を除外することで入出力ファイル候補を抽出しても良い。ジョブ解析部１２１は、ファイルサイズ、入出力時間、Ｉ／Ｏ速度を計算する（ステップ１２０６）。これは、図８を用いて説明したように計算し、計算した値をファイルサイズ２５６、入出力時間２５７、Ｉ／Ｏ速度２５８に記録する。

　続いて、ジョブ解析部１２１は、入力ファイルを推定する（ステップ１２０７）。トレース中で読み込みサイズが最大となるファイルを入力ファイルと推定する。最大だけではなく、ある程度以上のサイズ（例えば１００ＭＢ以上）を読み込んでいるファイルすべてを入力ファイルとみなしても良い。そして、出力ファイルを推定する（ステップ１２０８）。トレース中で書き込みサイズが最大となるファイルを出力ファイルと推定する。最大だけではなく、ある程度以上のサイズ（例えば１００ＭＢ以上）を書きこんでいるファイルすべてを出力ファイルとみなしても良い。

　ジョブ解析部１２１は、入力ファイルを最後まで逐次的に読み込んでいるかチェックする（ステップ１２０９）。これは、システムコールがreadのみで、seekをしていないこと、且つ最後のreadの戻り値が0、つまりEOF(End of File)まで読んでいるかをチェックする。ステップ１２０９で条件が真ならばステップ１２１０に進み、条件が偽ならばステップ１２１１へ進む。これは、ジョブプログラム１０９での処理中に、ループ処理１００２が含まれるかをチェックしている。複数の入力ファイルがある場合は、それらの全てで条件を満たすか否かをチェックする。

　ジョブ解析部１２１は、入力ファイルの最も早い時刻の読み込みより後で、出力ファイルの出力を開始しているかチェックする（ステップ１２１０）。これは、入力ファイルの情報を元に、出力ファイルの内容を作成しているかチェックすることになる。ステップ１２１０の条件が真ならばステップ１２１２に進み、条件が偽ならばステップ１２１１へ進む。ステップ１２１１でジョブ解析部１２１は、並列可２７４にＮを格納し、ステップ１２１６へ進み、ステップ１２１２で並列可２７４にＹを格納する。

　ステップ１２１２に続いて、ジョブ解析部１２１は、前処理、ループ処理、後処理箇所を推定する（ステップ１２１３）。これは、図８を用いて説明したように、入力ファイルの読み込み箇所と、出力ファイルの出力箇所を元に推定する。続いて、前処理、ループ処理、後処理の時間を計算し記録する（ステップ１２１４）。これは、実行トレースファイル２３１中から、ステップ１２１３で求めた前処理、ループ処理、後処理箇所の開始・終了処理の時刻２３２を使用して求める。続いて、入力ファイルの分割時間、出力ファイルの結合時間を推定し、分割・結合時間２５９に記録する（ステップ１２１５）。これは、ジョブファイル入出力一覧２５０の分割・結合時間２５９に関する説明でしたように求める。

　図１３は、開始入力ファイル一覧２６０の例を示す図である。開始入力ファイル一覧２６０は、ジョブファイル入出力一覧２５０の情報を元に求められる。あるジョブネットに属するジョブのうち、入力ファイルが他のジョブで出力されたファイルでないものを求められる。そのファイルが開始入力ファイルとなる。開始入力ファイル一覧２６０は表形式となっており、一つ以上の行から成る。全ての行は３つの列を含んでいる。

　ここで３つの列は、ジョブネット名２６１、開始入力ファイル２６２、サイズ変数２６３から成る。開始入力ファイル一覧２６０の各行は、これ以外の不図示の列を含んでいても良いし、幾つかの列が存在しなくても良い。開始入力ファイル一覧２６０に格納された情報は、システム管理者などにより手作業で作成されても良く、あるいは何らかのツールやユーティリティを用いて作成されても良い。

　ジョブネット名２６１は、ジョブネットの名称であり、ジョブネット名２１１やジョブネット名２５２と関連する。開始入力ファイル名２６２は、ジョブネットの入力となるファイルのファイル名である。前述したように、あるジョブネットに属するジョブのうち、入力ファイルが他のジョブで出力されたファイルでないものを求められ、そのファイルが開始入力ファイルとなる。サイズ変数２６３は、開始入力ファイルのサイズを格納するための変数の名称である。この変数は、後述するジョブ実行時間推定式一覧２７０で使われる。

　図１４はジョブ実行時間推定式一覧２７０の例を示す図である。ジョブ実行時間推定式一覧２７０は、ジョブ解析結果一覧２４０と開始入力ファイル一覧２６０の情報を元に、開始入力ファイルのサイズによって、ジョブネットを構成する各ジョブがどの程度の時間で処理を完了するか推定するための式が格納されている。ジョブ実行時間推定式２７０は表形式となっており、一つ以上の行から成る。全ての行は７つの列を含んでいる。

　ここで７つの列は、ジョブネット名２７１、ジョブ名２７２、処理時間２７３、並列可２７４、前・後処理時間２７５、ループ処理時間２７６、ファイル分割・結合時間２７７から成る。ジョブ実行時間推定式２７０の各行は、これ以外の不図示の列を含んでいても良いし、幾つかの列が存在しなくても良い。ジョブ実行時間推定式２７０に格納された情報は、システム管理者などにより手作業で作成されても良く、あるいは何らかのツールやユーティリティを用いて作成されても良い。

　ジョブネット名２７１は、ジョブネットの名称であり、ジョブネット名２４２やジョブネット名２５２と相関する。ジョブ名２７２は、ジョブの名称であり、ジョブ名２４３やジョブ名２５３と相関する。処理時間２７３、前・後処理時間２４６、ループ処理時間２７６、ファイル分割・結合時間２７７は、同一ジョブの実行トレースをそれぞれ含む複数の実行トレースファイル２３１からそれぞれ計算された複数の時間、すなわち実行ＩＤ２４１、２５１のＩＤの異なる同一ジョブに関する時間を解析することにより、求められる。

　処理時間２７３は、開始入力ファイルのサイズと、処理時間２４４との相関を、回帰分析等で求め、その計算式が格納されている。後で具体的に説明する。並列可２７４は、並列化２４５と同じ情報が格納されている。前・後処理時間２７５は、前・後処理時間２４６の平均等で求め、その値が格納されている。ループ処理時間２７６は、開始入力ファイルのサイズと、ループ処理時間２４７との相関を、回帰分析等で求め、その計算式が格納されている。

　ファイル分割・結合時間２７７は、開始入力ファイルのサイズと、分割・結合時間２５９との相関を、回帰分析等で求め、その計算式が格納されている。分割・結合時間２５９には、入力ファイルの分割時間、または出力ファイルの結合時間のいずれかが格納されているのに対して、ファイル分割・結合時間２７７は、ジョブの入力ファイルの分割時間と、出力ファイルの結合時間の合算に対する相関が格納されている。

　図１５は、実行時間推定式算出部１２２での処理の例を示す図である。図１５の処理は、処理順序が図示と異なっていても良いし、これ以外の不図示の処理を含んでいても良いし、幾つかの処理が存在しなくても良い。この処理は、ジョブ解析結果一覧２４０、ジョブファイル入出力一覧２５０、開始入力ファイル一覧２６０の情報を元に、開始入力ファイルのサイズによって、ジョブネットを構成する各ジョブがどの程度の時間で処理を完了するか推定した式を求め、ジョブ実行時間推定式一覧２７０に格納する処理である。

　ジョブネット名が入力されて動作が開始され、実行時間推定式算出部１２２は、ジョブネットの入力ファイルを特定する(ステップ１３０１）。これは、ジョブファイル入出力一覧２５０の情報を元に求める。あるジョブネットに属するジョブのうち、入力ファイルが他のジョブで出力されたファイルでないものを求める。そのファイルが開始入力ファイルとなる。サイズ変数２６３に任意の変数名を付与した上で、これら情報を開始入力ファイル一覧２６０に格納する。続いて、ジョブネットを構成する全てのジョブをジョブ一覧２２０から求め、ステップ１３０３から１３０８までを繰り返す（ステップ１３０２、１３０９）。

　実行時間推定式算出部１２２は、ジョブ処理時間式を推定する(ステップ１３０３）。これは、過去のジョブ解析結果一覧２４０に対して、開始入力ファイル一覧２６０で示される開始入力ファイル名２６２と同一のファイル名を、ファイル名２５５に有する行のファイルサイズ２５６をジョブファイル入出力一覧２５０から求める。そして、その行の実行ＩＤ２５１と相関を実行ＩＤ２４１に持つジョブをジョブ解析結果一覧２４０から求め、その処理時間２４４を取得する。これにより、実行ＩＤ２４１、２５１を基準にしてファイルサイズ２５６と処理時間２４４の組が複数取得される。取得したファイルサイズ２５６と、ジョブの処理時間２４４との相関を回帰分析等で求め、開始入力ファイルのサイズを変数（サイズ変数２６３）とする計算式を処理時間２７３に格納する。

　実行時間推定式算出部１２２は、並列可２４５を調べる（ステップ１３０４）。Ｙであればステップ１３０５に、Ｎであればステップ１３０８に進む。ステップ１３０５では、前・後処理時間を推定する。これは、開始入力ファイルのサイズには依存しないので、過去のジョブ解析結果一覧２４０に対して、前・後処理時間２４６を取得する。取得した前・後処理時間２４６の平均等で求め、その時間を前・後処理時間２７５に格納する。

　実行時間推定式算出部１２２は、ループ処理時間式を推定する(ステップ１３０６）。これは、ステップ１３０３と同様の処理であり、過去のジョブ解析結果一覧２４０に対して、開始入力ファイルのファイルサイズ２５６をジョブファイル入出力一覧２５０から求め、その実行ＩＤ２５１と相関を持つジョブをジョブ解析結果一覧２４０から求め、そのループ処理時間２４７を取得する。取得したファイルサイズ２５６と、ループ処理時間２４７との相関を回帰分析等で求め、その計算式をループ処理時間２７６に格納する。

　実行時間推定式算出部１２２は、ファイル分割・結合時間を推定する(ステップ１３０７）。これは、ステップ１３０３と同様の処理であり、過去のジョブ解析結果一覧２４０に対して、開始入力ファイルのファイルサイズ２５６をジョブファイル入出力一覧２５０から求め、その分割・結合時間２５９を求める。通常、一つのジョブには一つ以上の入力ファイルと一つ以上の出力ファイルがあるため、分割・結合時間２５９の複数の時間が一つのジョブに必要であるので、それらを合計した時間を求める。ファイルサイズ２５６と、前記合計した時間との相関を回帰分析等で求め、その計算式をファイル分割・結合時間２７７に格納する。続いて、ステップ１３０４で調べた並列可２４５の情報を、並列可２７４に格納する（ステップ１３０８）。

　図１６は、ジョブ実行時刻推定結果一覧２８０の例を示す図である。ジョブ実行時刻推定結果一覧２８０は、ジョブネット一覧２１０、ジョブ実行時間推定式一覧２７０、開始入力ファイル一覧２６０、入力ファイルのサイズとジョブの並列度を元に、一部のジョブを並列実行した際の、各ジョブの処理時間を推定した結果である。ジョブ実行時刻推定結果一覧２８０は表形式となっており、一つ以上の行から成る。全ての行は９つの列を含んでいる。

　ここで９つの列とは、パターンＩＤ２８１、ジョブネット名２８２、ジョブ名２８３、並列度２８４、推定実行時間２８５、推定開始時刻２８６、推定終了時刻２８７、実行ホスト２８８、確定２８９から成る。ジョブ実行時刻推定結果一覧２８０の各行は、これ以外の不図示の列を含んでいても良いし、幾つかの列が存在しなくても良い。ジョブ実行時刻推定結果一覧２８０に格納された情報は、システム管理者などにより手作業で作成されても良く、あるいは何らかのツールやユーティリティを用いて作成されても良い。

　パターンＩＤ２８１は、あるジョブネットに対して、どのジョブをどの並列度で実行するかと組み合わせ（パターン）を識別する識別子である。図１６を例に説明すると、パターンID=p3ではジョブj2を3並列で実行し、パターンID=p4ではジョブj2を4並列で実行、パターンID=p5ではジョブj2を4並列かつジョブj3を2並列で実行する。ジョブネット名２８２は、ジョブネットの名称であり、ジョブネット名２１１、ジョブネット名２２１、ジョブネット名２４２、ジョブネット名２５２、ジョブネット名２６１、ジョブネット名２７１と相関する。

　ジョブ名２８３は、ジョブの名称であり、ジョブ名２２２、ジョブ名２４３、ジョブ名２５３、ジョブ名２７２と相関する。並列度２８４は、ジョブを幾つの並列度で実行するかが格納されている。推定実行時間２８５は、推定した当該ジョブの実行時間が格納されている。これは、入力ファイルのサイズを開始入力ファイルのサイズ変数として、前・後処理時間２７５＋ファイル分割・結合時間２７７＋ループ処理時間２７６÷並列度で求める。推定開始時刻２８６は、推定した当該ジョブの開始時刻が格納されている。先行ジョブ２２３よりジョブの依存関係を求め、先行ジョブのうち最も遅い推定終了時刻２８７を、このジョブの推定開始時刻２８６とする。

　推定終了時刻２８７は、推定した当該ジョブの終了時刻が格納されている。推定開始時刻２８６に推定実行時間２８５を加えて求める。実行ホスト２８８は、ジョブを実行する仮想マシン１０８のホスト名が格納されている。並列度２８３の数だけホスト名が格納される。仮想マシン１０８の代わりに、サーバ装置１０３のホスト名を格納しても良い。確定２８９は、この推定したジョブ実行時刻で実際にジョブを実行する場合はＹ、そうでない場合はＮが格納されている。

　図１７は、並列実行スケジュール推定部１２３、ジョブ実行時間表示部１１９、ジョブネット並列化実行部１２５での処理の例を示す図である。図１７の処理は、処理順序が図示と異なっていても良いし、これ以外の不図示の処理を含んでいても良いし、幾つかの処理が存在しなくても良い。

　この処理では、ジョブネット一覧２１０、ジョブ実行時間推定結果一覧２８０、開始入力ファイル一覧２６０、入力ファイルのサイズをもとに、ジョブの並列度を幾つかのパターン分だけ変化させた際の、各ジョブの処理時間を見積もり、見積もり結果を画面表示する。見積もり結果の並列度パターンの中から一つを選ぶ入力を受け付けて、その選ばれた並列度パターンに従ってジョブを並列実行する。

　並列実行スケジュール推定部１２３は、まずジョブの並列度パターンを作成する（ステップ１４０１）。ジョブ実行時間推定式一覧２７０の並列化２７４がＹとなるジョブに対して、パターンの組み合わせを作成する。それぞれのジョブについて、１から、実行可ホスト２２５で指定されたホストの数までの整数値パターンを作成し、それを並列度の候補とする。複数のジョブが並列化可能なときは、並列度の候補を組み合わせてパターンを作成する。

　ジョブネットjn1を例に説明する。図１４のジョブ実行時間推定式一覧２７０によれば、ジョブj2とj3が並列化可能である。また、図４のジョブ一覧２２０によれば、ジョブj2の実行可能ホスト数は4、ジョブj3の実行可ホスト数は2である。この場合、ジョブj2の並列度をa、ジョブj3の並列度をbとし、その組み合わせパターンを[a、b]の形式で表すと、全部で[1、1][2、1][3、1][4、1][1、2][2、2][3、2][4、2]の8個の並列度パターンとなる。それぞれの並列度パターンに、パターンＩＤ２８１としてユニークな識別子を付ける。

　次に、各並列度パターンのそれぞれについて、ステップ１４０３を実行する（ステップ１４０２、ステップ１４０４）。並列度パターンを全部処理するとステップ１４０５に進む。ステップ１４０３では、それぞれの並列度パターンに対して、ジョブを並列実行した際のスケジュールを推定する。これについては図１８を用いて後で詳細を説明する。

　次に、ジョブ実行時間表示部１１９は、ステップ１４０３で推定された並列実行スケジュールを画面に表示し、どの並列度パターンでジョブを実行するのか入力を受け付ける（ステップ１４０５）。表示画面については図２０を用いて後で説明する。ステップ１４０５で入力されたスケジュールを確定させる(ステップ１４０６）。当該ジョブネットで推定したスケジュールに対して、ジョブ実行時刻推定結果一覧２８０で、入力された並列度パターンに対応するものについては確定２８９をＹに、それ以外についてはＮに設定する。

　最後に、ジョブネット並列化実行部１２５は、ジョブネットの開始時刻が来たときに、ステップ１４０５で選ばれた並列度パターンに従ってジョブネットを実行する（ステップ１４０７）。

　図１８は、並列実行スケジュール推定部１２３での処理の例を示す図である。図１８の処理は、処理順序が図示と異なっていても良いし、これ以外の不図示の処理を含んでいても良いし、幾つかの処理が存在しなくても良い。

　この処理は、図１７のステップ１４０３から呼び出され、ジョブネット名とパターンＩＤ、並列度パターン、開始入力ファイルのサイズを入力される。そして、並列度パターンに従って、開始入力ファイル一覧２６０、入力ファイルのサイズ、ジョブ実行時刻推定結果一覧２８０から各ジョブを逐次実行または並列実行した際の処理時間を推定し、ジョブネット一覧２１０から取得したジョブ同士の依存関係を元に、開始時刻と終了時刻を推定する。

　並列実行スケジュール推定部１２３は、入力されたジョブネット名で示されたジョブネットに属するジョブのそれぞれについて、ステップ１５０２から１５０７までを処理する（ステップ１５０１、ステップ１５０８）。この際に、ジョブ一覧２２０からジョブの依存関係を取得し、早く実行されるジョブから順に処理していく。

　ステップ１５０２で、並列実行スケジュール推定部１２３は、ジョブの開始時刻を推定する。そのために、ジョブ一覧２２０中の先行ジョブ２２３で指定されたジョブを取得する。例えばジョブj1のように先行ジョブが無い場合は、ジョブネット一覧２１０から実行スケジュール２１２を取り出し、ステップ１５０２が実行されている現在の時刻に対して次回の実行時刻を求め、それが当該ジョブの開始時刻と推定される。

　先行ジョブ２２３がある場合は、それら先行ジョブについてジョブ実行時刻推定結果一覧２８０の推定終了時刻２８７を取得し、取得した中で最も遅い推定終了時刻がこのジョブの推定開始時刻となる。このようにして推定した開始時刻は、推定開始時刻２８６に格納されるとともに、パターンＩＤ２８１、ジョブネット名２８２、ジョブ名２８３、並列度２８４もそれぞれ格納される。

　次に、並列実行スケジュール推定部１２３は、並列化２７４を参照して、当該ジョブが並列可であるか判定する（ステップ１５０３）。並列可であればステップ１５０４へ進み、そうでなければステップ１５０５へ進む。ステップ１５０４では、入力された並列度パターンの並列度に従ってジョブを逐次または並列実行する際の処理時間を推定する。推定される処理時間は、開始入力ファイルのサイズを変数として、
　ファイル分割・結合時間２７７＋前・後処理時間２７５＋ループ処理時間２７６÷並列度
の式から求められる。推定した処理時間を、推定実行時間２８５に格納する。その後、ステップ１５０６へ進む。

　ステップ１５０５は、並列スケジュール推定部１２３は、開始入力ファイルのサイズを変数として、処理時間２７３を計算してジョブの処理時間を推定する。推定した処理時間を、推定実行時間２８５に格納する。その後、ステップ１５０６へ進む。ステップ１５０６では、ジョブの終了時刻を推定する。これは、ステップ１５０２で求めた開始時刻と、ステップ１５０４または１５０５で求めたジョブ実行推定時間を加算して、ジョブの終了時刻を推定する。推定した終了時刻を、推定終了時刻２８７に格納する。

　次に、動作ホストが決定される（ステップ１５０７）。この処理は図１９を用いて後で詳細を説明する。最後に、ジョブネットの処理時間を推定する（ステップ１５０９）。これはステップ１５０２から１５０７の間で処理したジョブのうち、最も早い開始時刻と、最も遅い終了時刻から求められる。また、最も遅い終了時刻はジョブネットの終了時刻である。そして、ジョブネットの終了時刻のデッドライン２１３からの超過分も求める。

　図１９は、動作ホスト決定部１２４での処理の例を示す図である。図１９の処理は、処理順序が図示と異なっていても良いし、これ以外の不図示の処理を含んでいても良いし、幾つかの処理が存在しなくても良い。この処理では、ジョブの推定開始時刻、推定終了時刻、動作ホスト名一覧を入力として動作する。これらの情報を元に、どの仮想マシン１０８でジョブを動作させれば良いかを求める。その結果、他のジョブネットの実行が遅延する場合は、その遅延時間も求める。

　動作ホスト決定部１２４は、まず空ホストを検索する（ステップ１６０１）。これは、実行可ホスト２２５で指定されたホストのうち、ジョブの推定開始時刻から推定終了開始時刻までの間に、他ジョブを実行していないホストを求める。そのようなホストがあれば、それらホストの中から一つを選んで実行ホスト２８８に格納し（ステップ１６０４）、処理を終了する。そのようなホストが無いときはステップ１６０３へ進む。

　ステップ１６０３では、実行時刻の重なるジョブ群を取得する。これは、ジョブ実行時刻推定結果一覧２８０の確定２８９がＹとなるジョブの中で、推定開始時刻２８５と推定終了時刻２８６を参照し、与えられたジョブの開始時刻と終了時刻が重なるジョブ群を取得する。このジョブ群をYとする。

　続いて、動作ホスト決定部１２４は、ジョブ群Yに含まれるジョブのそれぞれについて、推定開始時刻２８６を、入力されたジョブの推定終了時刻に遅らせたときの、ジョブネットの余裕時間を求める（ステップ１６０５）。余裕時間とは、ジョブネットのデッドライン２１３から、ジョブネットの推定終了時刻を引いたものである。ジョブ群Yに含まれるジョブが属するジョブネットの推定終了時刻は、図１８のステップ１５０９で既に求められている。

　動作ホスト決定部１２４は、ジョブ群Yの中で余裕時間が最大となるジョブxを選ぶ（ステップ１６０６）。このようにジョブxを選ぶ代わりに、余裕時間が０以上となる中で最小となるジョブを選んでも良いし、ジョブネット内の他のジョブによりジョブネットの推定終了時刻が決まるため、余裕時間がかわらないジョブを選んでも良い。前者の選択はリソース利用率が向上でき、後者の選択は当該ジョブがクリティカルパスとならないため、他のジョブネットに一切影響を与える事なく入力ジョブを並列実行できることになる。

　次に、ステップ１６０６で選んだジョブの開始時刻を遅延させ、その後続ジョブの実行スケジュールを修正したものをジョブ実行時刻推定結果一覧２８０に格納する（ステップ１６０７）。そして、入力ジョブの実行ホスト２８８へ、ジョブxを実行するはずであったホストを格納して（ステップ１６０８）、処理を終了する。

　なお、マルチテナント環境において、ジョブネット一覧２１０が各テナントのランクに関する情報をさらに有し、動作ホスト決定部１２４はランクに関する情報も使用して動作ホストを決定しても良い。例えば、ステップ１６０６において、それぞれが最大とみなせる程、余裕時間の非常に大きなジョブが複数存在する等、複数のジョブが選択可能な場合に、ランクの低いテナントの所有するジョブネットに属するジョブを選択しても良い。また、ステップ１６０５～１６０６において、余裕時間とは関係なく、ジョブ群Yの中で、ランクの低いテナントの所有するジョブネットに属するジョブを選択してもよい。

　図２０は、並列時のジョブ実行時間表示画面５００の例を示す図である。並列時のジョブ実行時間表示画面５００は、ジョブを並列実行した際のジョブネットの実行時間や終了時刻、デッドラインに対する余裕時間の変化を図示する。また、ジョブを並列実行した結果、他ジョブネットの推定終了時刻が遅延した場合のデッドラインに対する余裕時間等を図示する。ジョブ実行時間表示画面５００は、操作端末１１８の出力デバイスや、管理サーバ１０１の出力デバイス２０４に表示される。これ以外の装置場所に、ジョブ実行時間表示画面５００は表示されても良い。

　ジョブ実行時間表示画面５００は、ジョブネット名５０１、開始入力ファイル名５０２、サイズ５０３、サイズ増減ボタン５０４、ジョブネット実行時間表５１０、ＯＫボタン５２０から成る。ジョブネット実行時間表５１０は表形式であり、選択５１１、パターン５１２、並列度５１３、ジョブネット実行時間５１４、ジョブネット終了時刻５１５、ジョブ実行スケジュール５１６、遅らせるジョブネットとデッドラインまでの余裕時間５１７から成る。

　ジョブネット実行時間表５１０には、これ以外の行または例表示されていても良いし、幾つかの行または列が存在しなくても良い。ジョブネット実行時間表５１０は、表形式以外の表示方式、例えばリスト形式や文字列形式で表示されていても良い。ジョブネット実行時間表５１０の内容は、ジョブ実行時刻推定結果一覧２８０と、ステップ１６０７で遅延させたジョブが属するジョブネットの情報を元に、ジョブ実行時間表示部１１９が作成する。ジョブネット中のジョブを並列実行させるパターン毎に内容を表示する。

　ジョブネット名５０１は、この画面に表示されているジョブネットの名称である。
開始入力ファイル名５０２は、ジョブネットを実行開始する際の開始入力ファイルの名前である。サイズ５０３は、開始入力ファイルのサイズである。画面が最初に表示されたときには、実際に入力される開始入力ファイルのサイズを表示する。サイズ増減ボタン５０４は、サイズ５０３の値を調整するボタンである。上下のボタンを押すことにより、サイズ５０３の値が増減できる。増減させた場合は、図１７の処理が実行されてジョブ実行スケジュールを求められ、ジョブネット実行時間表５１０が表示し直される。

　選択５１１は、どのパターンを選択するのかを表す選択肢である。パターン５１２は、並列度パターンを示し、ジョブ実行時刻推定結果一覧２８０のパターンＩＤ２８１の情報を表示する。並列度５１３は、あるジョブを並列実行する際の並列度を示す。ここでは、どの仮想マシン１０８上でジョブを並列実行するかのホスト名も表示している。ホスト名がクリックされることで、他の仮想マシン１０８上でジョブを動作させるように、仮想マシン１０８が修正可能であっても良い。

　ジョブネット実行時間５１４は、ステップ１５０９で求めたジョブネットの推定実行時間を表示する。ここでは時分秒の表示以外に、秒でも表示している。ジョブネット終了時刻５１５は、ステップ１５０９で求めたジョブネットの推定終了時刻を表示する。ここでは終了時刻以外に、デッドラインに対してどれだけ超過しているか、またはどれだけ余裕があるかを表示している。

　ジョブ実行スケジュール５１６は、ジョブを並列実行した結果、ジョブネットがどのように実行されるかを時間軸で表示するものである。ここではデッドライン５１８も表示することで、デッドラインを超えているか、余裕時間がどの程度あるのかがわかるように表示する。また、並列実行するジョブの処理時間表示を、並列度の分だけ縦に分割表示することで、どのジョブをどの並列度で実行するのかがわかるように表示する。同様に、横に３つ、または５つに分割して、ファイル分割・結合時間２７７や、前・後処理時間２７５を表示しても良い。

　遅らせるジョブネット５１７は、このパターンを選んだ際に実行が遅れるジョブネットを表示している。そのジョブネットのデッドラインに対する余裕時間がどの程度変化するかも表示している。ＯＫボタン５２０が押されると、選択５１１で選択されたスケジュールでジョブネットを実行するようスケジュールし、画面を閉じる。

　以上で説明したように、バッチ処理のプログラムを解析できない場合であっても、バッチ処理の実行結果から並列処理の可能性を判定できる。そして、バッチ処理の既存のプログラムを変更することなく、並列処理が可能になる。また、バッチ処理の一部を並列処理した際の処理時間を実際のサーバ装置の動作に即して推定することができ、デッドラインに対する余裕時間も提示できる。また、並列実行する事で、他のジョブネットの実行に発生する遅延が許容範囲かどうかも提示できる。

１０１　管理サーバ
１０３　サーバ装置
１０４　ファイルサーバ装置
１０５　ストレージ装置
１０８　仮想マシン
１２０　実行トレース取得部
１２１　ジョブ解析部
１２２　実行時間推定式算出部
１２３　並列実行スケジュール推定部
１２４　動作ホスト決定部
１２５　ジョブネット並列化実行部
２１０　ジョブネット一覧
２２０　ジョブ一覧
２３０　実行トレース一覧
２４０　ジョブ解析結果一覧
２５０　ジョブファイル入出力一覧
２６０　開始入力ファイル一覧
２７０　ジョブ実行時間推定式一覧
２８０　ジョブ実行時刻推定結果一覧

Claims

　バッチ処理システムにおいて、
　バッチ処理のための複数の計算機リソースと、
　前記バッチ処理の実行トレース情報に基づき、前記バッチ処理内のループ処理を特定し、前記バッチ処理は前記複数の計算機リソースにおいて並列処理可能であるか否かを判定する解析部と、
　前記特定したループ処理に基づき、前記並列処理により短縮できる実行推定時間を計算し、バッチ処理全体の実行時間を推定する並列実行スケジュール推定部と
を備えたことを特徴とするバッチ処理システム。
　前記解析部が並列処理可能であると判定した場合、前記バッチ処理を前記複数の計算機リソースにおいて並列処理する並列化実行部
をさらに備えたことを特徴とする請求項１に記載のバッチ処理システム。
　前記解析部は、
　前記実行トレース情報に含まれるファイルの入力と出力に記録されたファイルのサイズに基づき、バッチ処理の対象となる入力ファイルと出力ファイルを特定し、
　前記入力ファイルを逐次的に入力し、且つ前記入力ファイルの入力の後に前記出力ファイルの出力が含まれる場合、前記入力ファイルの最初の入力から前記出力ファイルの最後の出力までを前記ループ処理であると判定して、前記バッチ処理に含まれる前記ループ処理は並列処理可能であると判定し、
　前記ループ処理より前の処理を前処理であると判定し、前記ループ処理より後の処理を後処理であると判定すること
を特徴とする請求項２に記載のバッチ処理システム。
　前記解析部は、
　前記実行トレース情報に含まれるファイルの入力と出力に関して記録されたファイルのパス名あるいはファイル名の拡張子に基づき、バッチ処理の対象となる入力ファイルと出力ファイルを特定し、
　前記入力ファイルを逐次的に入力し、且つ前記入力ファイルの入力の後に前記出力ファイルの出力が含まれる場合、前記入力ファイルの最初の入力から前記出力ファイルの最後の出力までをループ処理であると判定して、前記バッチ処理に含まれる前記ループ処理は並列処理可能であると判定し、
　前記ループ処理より前の処理を前処理であると判定し、前記ループ処理より後の処理を後処理であると判定すること
を特徴とする請求項２に記載のバッチ処理システム。
　前記解析部は、
　前記実行トレース情報に含まれる実行時刻の情報に基づき、前記ループ処理と前記前処理と前記後処理それぞれの処理時間を計算し、
　前記入力ファイルのサイズに基づき、前記入力ファイルの分割時間を計算し、
　前記出力ファイルのサイズに基づき、前記出力ファイルの結合時間を計算すること
を特徴とする請求項３に記載のバッチ処理システム。
　前記バッチ処理システムは、さらに実行時間推定式算出部を備え、
　前記実行時間推定式算出部は、
　前記ループ処理の計算された処理時間と、前記入力ファイルに関連するファイルのサイズとを複数取得して、前記ループ処理の処理時間の第一の計算式を生成し、
　前記前処理の計算された処理時間と、前記後処理の計算された処理時間とを複数取得して、前記前処理と前記後処理の合計処理時間を生成し、
　前記分割時間および結合時間の合計と、前記入力ファイルに関連するファイルのサイズとを複数取得して、前記分割時間および結合時間の合計の第二の計算式を生成すること
を特徴とする請求項５に記載のバッチ処理システム。
　前記並列実行スケジュール推定部は、
　前記バッチ処理が並列処理可能であると判定された場合、前記第一の計算式を用いて計算した処理時間を、並列度で除算し、前記第二の計算式を用いて計算した処理時間を加算し、前記合計処理時間を加算することにより、実行推定時間を計算し、
　前記実行推定時間に基づき、前記バッチ処理全体の終了時刻を計算すること
を特徴とする請求項６に記載のバッチ処理システム。
　前記バッチ処理システムは、さらに動作リソース決定部を備え、
　前記動作リソース決定部は、
　前記計算機リソースを共用する他の複数のバッチ処理の中で、バッチ処理が終了しなければならないデッドラインに対して、終了時刻の最も早いバッチ処理を選択し、
　前記選択されたバッチ処理の開始時刻を遅らせること
を特徴とする請求項７に記載のバッチ処理システム。
　前記バッチ処理システムは、さらに動作リソース決定部を備え、
　前記動作リソース決定部は、
　前記バッチ処理の依頼主のランクに関する情報を取得し、
　前記計算機リソースを共用する他の複数のバッチ処理の中で、前記ランクの最も低い依頼主のバッチ処理を選択し、
　前記選択されたバッチ処理の開始時刻を遅らせること
を特徴とする請求項７に記載のバッチ処理システム。
　前記バッチ処理システムは、さらに実行時間表示部を備え、
　前記実行時間表示部は、前記並列度と前記終了時刻と前記デッドラインを表示すること
を特徴とする請求項８に記載のバッチ処理システム。
　前記並列実行スケジュール推定部は、
　前記並列度として複数の異なる並列度を生成し、
　前記実行時間表示部は、
　前記複数の異なる並列度と、前記複数の異なる並列度に応じた終了時刻とをそれぞれ表示し、前記デッドラインを表示すること
を特徴とする請求項８に記載のバッチ処理システム。
　前記並列化実行部は、
　前記入力ファイルを前記並列度にしたがって分割させ、
　前記バッチ処理を前記並列度にしたがって並列処理させ、
　前記並列度にしたがって並列処理されたバッチ処理の出力ファイルを結合させること
を特徴とする請求項７に記載のバッチ処理システム。
　バッチ処理のための複数の計算機リソースを有するバッチ処理システムの制御方法において、
　前記バッチ処理の実行トレース情報に基づき、前記バッチ処理内のループ処理を特定し、前記バッチ処理は前記複数の計算機リソースにおいて並列処理可能であるか否かを判定する解析ステップと、
　前記特定したループ処理に基づき、前記並列処理により短縮できる実行推定時間を計算し、バッチ処理全体の実行時間を推定する並列実行スケジュール推定ステップと
を有することを特徴とするバッチ処理システムの制御方法。
　前記解析ステップで並列処理可能であると判定した場合、前記バッチ処理を前記複数の計算機リソースにおいて並列処理する並列実行ステップ
をさらに有することを特徴とする請求項１３に記載のバッチ処理システムの制御方法。
　前記解析ステップは、
　前記実行トレース情報に含まれるファイルの入力と出力に記録されたファイルのサイズに基づき、バッチ処理の対象となる入力ファイルと出力ファイルを特定するステップと、
　前記入力ファイルを逐次的に入力し、且つ前記入力ファイルの入力の後に前記出力ファイルの出力が含まれる場合、前記入力ファイルの最初の入力から前記出力ファイルの最後の出力までをループ処理であると判定して、前記バッチ処理に含まれる前記ループ処理は並列処理可能であると判定するステップと、
　前記ループ処理より前の処理を前処理であると判定し、前記ループ処理より後の処理を後処理であると判定するステップと
を有することを特徴とする請求項１４に記載のバッチ処理システムの制御方法。