JP2009217587A - バッチ処理装置及び方法 - Google Patents

バッチ処理装置及び方法 Download PDF

Info

Publication number
JP2009217587A
JP2009217587A JP2008061060A JP2008061060A JP2009217587A JP 2009217587 A JP2009217587 A JP 2009217587A JP 2008061060 A JP2008061060 A JP 2008061060A JP 2008061060 A JP2008061060 A JP 2008061060A JP 2009217587 A JP2009217587 A JP 2009217587A
Authority
JP
Japan
Prior art keywords
job
volume
failure
batch processing
resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008061060A
Other languages
English (en)
Inventor
Masaaki Hosouchi
昌明 細内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2008061060A priority Critical patent/JP2009217587A/ja
Priority to US12/081,563 priority patent/US20090235126A1/en
Publication of JP2009217587A publication Critical patent/JP2009217587A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0727Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system

Abstract

【課題】障害が発生したときのバッチジョブ運用を省力化し得るバッチ処理装置及び方法を提案する。
【解決手段】所定の資源を利用するバッチ処理を実行するバッチ処理装置及び方法において、バッチ処理のうちの次に実行するジョブが利用する資源を特定すると共に、当該資源に障害が発生しているか否かを判定し、当該資源に障害が発生していると判定したときには、当該障害に関する障害情報をユーザに提示し、ユーザからの応答を得るまで当該ジョブの実行を延期するようにした。
【選択図】図11

Description

本発明は、バッチ処理装置及び方法に関し、例えばストレージ装置内の資源を利用するバッチ処理を実行する計算機に適用して好適なものである。
データを一定期間あるいは一定量まとめてから一括して処理を行うバッチ処理システムにおいて、バッチ処理の単位であるジョブ内でアプリケーションプログラムが使用(入出力)するファイルを記述したジョブ定義ファイルを解釈実行するバッチ処理システムが例えば、下記特許文献1に開示されている。また、下記特許文献2には、同じ故障要因で故障し、その故障要因が復旧された複数のジョブに対して一括して動作を再開させる技術が開示されている。
従来のバッチ処理システムでは、ジョブで使用するファイルが格納されたストレージ装置内の論理ボリューム(以下、これを単にボリュームと呼ぶ)や、ボリュームとアプリケーションプログラムが動作している計算機間のパス(通信路)に障害が発生した場合においても、事前にスケジュールされたジョブは実行されていた。
しかしながら、かかるジョブが障害が発生した論理ボリュームに格納されているファイルを使用する場合、そのジョブは異常終了する。このためユーザは、異常終了の要因がボリュームやパスの障害であることを、ジョブ出力結果や障害ログなどから判別し、障害回復後にジョブを再スケジュールする必要があった。
特開2007−41720号公報 特開2005−222105号公報
上述のように従来のバッチ処理システムでは、障害が発生した場合であっても事前にスケジュールされたジョブが実行され、障害ボリュームに格納されたファイルを使用しようとした時点で当該ジョブが異常終了してしまう。このため、ユーザは、いちいち異常終了要因を特定し、異常個所を修復するなどの処理を行なった後に、ジョブを再スケジュールしなければならず、ユーザに余分な作業を強いる問題があった。
本発明は以上の点を考慮してなされたもので、障害が発生したときのバッチジョブ運用を省力化し得るバッチ処理装置及び方法を提案しようとするものである。
かかる課題を解決するため本発明においては、バッチ処理のうちの次に実行するジョブが利用する資源に障害が発生しているか否かを判定し、障害が発生していると判定したときには、当該障害に関する障害情報をユーザに提示し、ユーザからの応答を得るまで当該ジョブの実行を延期するようにした。
すなわち本発明においては、バッチ処理装置において、プログラムが格納された主記憶装置と、前記主記憶装置に格納された前記プログラムに従って所定の資源を利用するバッチ処理を実行するプロセッサとを備え、前記プロセッサは、前記バッチ処理のうちの次に実行するジョブが利用する前記資源を特定すると共に、当該資源に障害が発生しているか否かを判定し、当該資源に障害が発生していると判定したときには、当該障害に関する障害情報をユーザに提示し、ユーザからの応答を得るまで当該ジョブの実行を延期することを特徴とする。
また本発明においては、所定の資源を利用するバッチ処理を実行するバッチ処理方法において、前記バッチ処理のうちの次に実行するジョブが利用する前記資源を特定すると共に、当該資源に障害が発生しているか否かを判定する第1のステップと、当該資源に障害が発生していると判定したときには、当該障害に関する障害情報をユーザに提示し、ユーザからの応答を得るまで当該ジョブの実行を延期する第2のステップとを備えることを特徴とする。
さらに本発明においては、プログラムにおいて、所定の資源を利用するバッチ処理を実行するバッチ処理のうちの次に実行するジョブが利用する前記資源を特定すると共に、当該資源に障害が発生しているか否かを判定する第1のステップと、当該資源に障害が発生していると判定したときには、当該障害に関する障害情報をユーザに提示し、ユーザからの応答を得るまで当該ジョブの実行を延期する第2のステップとを備えることを特徴とする処理をコンピュータに実行させるようにした。
本発明によれば、スケジュールされたジョブが利用する資源に対する資源の障害情報をユーザに提示し、応答を求めるため、これらの情報を元にジョブが実行される前に対象を絞り込んで障害の有無を確認することが可能となるであり、ストレージに障害が発生したときのバッチジョブ運用を省力化することができる。
以下図面について、本発明の一実施の形態を詳述する。
(1)本実施の形態による計算機システムの構成
図1において、1は全体として本実施の形態による計算機システムを示す。この計算機システム1は、バッチ処理を実行する計算機2と、計算機2に対して記憶領域を提供するストレージ装置3とを備えて構成される。計算機2及びストレージ装置3は、例えばSAN(Storage Area Network)、LAN(Local Area Network)、WAN(Wide Area Network)、インターネット、専用回線又は公衆回線などからなる通信ネットワーク4を介して接続されている。
計算機2は、主記憶装置10、CPU(Central Processing Unit)11及び入出力インターフェース12を備える。主記憶装置10は、半導体メモリ等で構成される。そしてこの主記憶装置10には、ジョブ管理プログラム20、ストレージ管理プログラム21及びオペレーティングシステム22などの命令コードと、これらジョブ管理プログラム20、ストレージ管理プログラム21及びオペレーティングシステム22が参照する各種テーブル23〜28とが格納される。
CPU11は、計算機2全体の動作制御を司るプロセッサであり、主記憶装置10に格納されたジョブ管理プログラム20、ストレージ管理プログラム21及びオペレーティングシステム22の命令コードをロードして解釈実行する。なお、以下においては、各種処理の処理主体を「プログラム」として説明するが、実際上は、そのプログラムに基づいてCPU11がその処理を実行することは、言うまでもない。
入出力インターフェース12は、通信ネットワーク4を介してストレージ装置3にアクセスするためのインターフェースであり、例えばホストバスアダプタから構成される。
計算機2には、計算機2内のプログラムからのメッセージを表示し、メッセージに対するユーザの応答を受け付けて計算機2に転送するコンソール5が接続される。コンソール5は、例えばパーソナルコンピュータから構成される。
ストレージ装置3は、ストレージ部30及びコントローラ部31から構成される。ストレージ部30は、それぞれ物理的な記憶領域を提供する1又は複数のディスクドライブを備える。1又は複数のディスクドライブが提供する記憶領域上に1又は複数の論理的なボリュームVOLが定義される。そしてユーザにより作成されたジョブ定義ファイル32や、計算機2上のアプリケーションプログラムが使用するファイル33などがこのボリュームVOLに格納される。またコントローラ部31は、計算機2からの入出力要求に応じて、ストレージ部30に対するジョブ定義ファイル32やプログラムが使用するファイル33の入出力制御を行う。
なお、本計算機システム1の場合、計算機2やストレージ装置3に搭載されたコピー機能により、計算機2がファイル32を読み書きするボリュームVOLの複製をストレージ装置3内に作成することができる。この場合、コピー元のボリュームVOLの更新内容は、同期又は非同期にコピー先のボリュームVOLに差分反映され、これによりコピー元のボリュームVOL及びコピー先のボリュームVOLの内容が常に同一の状態に維持される。以下においては、コピー元のボリュームVOLを正ボリュームPVOL、コピー先のボリュームVOLを副ボリュームVOLと呼び、正ボリュームPVOL及びその副ボリュームVOLの組をボリュームペアと呼ぶものとする。
図2は、ジョブ定義ファイル32の記述例を示す。ジョブ定義ファイル32は、計算機2上のアプリケーションプログラムが実行するジョブの内容を規定したファイルであり、例えば計算機2を用いてユーザにより予め作成され、ストレージ装置3内の所定のボリュームVOLに格納される。
図2において、先頭行はジョブ定義文を表す。「JOB ID=」に続く「JOBa」はジョブを一意に識別するジョブIDを示す。2行目は、そのジョブを実行するアプリケーションプログラムが使用するファイル33のファイル定義文を表す。「DD NAME=」に続く「FILE1」が、そのファイル33を識別するためのファイル識別名を示し、「FILE=」に続く「/dirA/file1」がファイル33のパス名を示す。このファイル定義文における「DELETE=YES」は、ジョブ終了後にそのファイル33を削除することを表す。また図2には表記されていないが、ジョブ定義ファイル21には、そのジョブを実行すべき計算機2上のアプリケーションプログラムの識別情報等も記述される。
(2)計算機におけるバッチ処理機能
次に、かかる計算機システム1の計算機2に搭載された障害対処機能について説明する。本実施の形態による計算機2には、ストレージ装置3の所定ボリュームVOLに格納された複数のジョブ定義ファイル32に従って、各ジョブ定義ファイル32においてそれぞれ定義されたジョブを順次連続して実行するバッチ処理機能が搭載されている。
この場合において、計算機2は、バッチ処理時、ジョブを実行する前に、当該ジョブが使用するボリュームVOLや当該ボリュームVOL及び計算機2間のパスに障害又は障害発生のおそれがあるか否かをチェックし、障害又は障害発生のおそれがあるときには、ユーザからの許可があるまで当該ジョブの実行を延期する点を特徴の1つとしている。
このようなバッチ処理を実行するための手段として、計算機2の主記憶装置10には、ジョブファイル管理テーブル23、ジョブボリューム管理テーブル24、ボリュームペア管理テーブル25、ボリューム管理テーブル26、ボリュームパス管理テーブル27及びパス管理テーブル28が格納されている。
ジョブファイル管理テーブル23は、ジョブ定義ファイル32に定義されたジョブをジョブ管理プログラム20が管理するためのテーブルであり、図3に示すように、パス名欄23A、ボリュームID欄23B、ジョブID欄23C、ファイル識別名欄23D及び削除対象情報欄23Eから構成される。
そしてジョブID欄23Cには、ジョブ定義ファイル32において定義されたジョブの識別子(以下、これをジョブIDと呼ぶ)が格納され、ファイル識別名欄23Dには、そのジョブで使用するファイル33の識別子(以下、これをファイル識別名と呼ぶ)が格納される。
またパス名欄23Aには、計算機2からかかるファイル33へのパスのパス名が格納され、ボリュームID欄23Bには、そのファイル33が格納されたストレージ装置3内のボリュームVOLの識別子(以下、これをボリュームIDと呼ぶ)が格納される。ボリュームIDとしては、例えば「hda」などのデバイス名や、4桁16進数のデバイスIDが適用される。
さらに削除対象情報欄23Eには、対応するジョブの終了後に当該ジョブで使用したファイル33を削除するか否かを判別するための情報(以下、これを削除対象情報と呼ぶ)が格納される。例えばファイル定義文において、「DELETE=YES」との記述がある場合には、「YES」という削除対象情報が削除対象情報欄に格納される。また削除対象情報欄23Eには、対応するジョブの終了時にボリューム異常などの要因により削除できなかった場合に、「FAILED」という削除対象情報が格納される。これ以外の場合には、削除対象情報欄23Eに削除対象情報は格納されない。
またジョブボリューム管理テーブル24は、バッチ処理のジョブが利用するボリュームVOLをジョブ管理プログラム20が管理するためのテーブルであり、図4に示すように、ボリュームID欄24A、マウントポイントパス欄24B、チェック要因情報欄24C、障害フラグ欄24D及び副ボリューム欄24Eから構成される。
そしてボリュームID欄24Aには、ジョブファイル管理テーブル23にボリュームIDが登録された各ボリュームVOLの当該ボリュームIDがそれぞれ格納される。またマウントポイントパス欄24Bには、対応するボリュームVOLがマウントされたディレクトリ(マウントポイント)のパス名が格納される。マウントポイントパス欄24Bに格納されたパス名にボリュームVOL内のパス名を連結した文字列がファイル33のパス名となる。
チェック要因情報欄24Cには、対応するボリュームVOLを利用したジョブが異常終了したときに、そのジョブのジョブIDが格納される。また障害フラグ欄24Dには、対応するボリュームVOLに障害が発生しているか否かを表すフラグ(以下、これを障害フラグと呼ぶ)が格納される。後述のように、チェック要因情報欄24CにジョブIDが格納されている場合、対応するボリュームVOLに障害が発生しているか否かがチェックされ、このチェックの結果、当該ボリュームVOLに障害が発生していることが検出された場合には障害フラグが「ON」に設定される。障害フラグが「OFF」の場合は、対応するボリュームVOLに障害が発生していないか、又は当該ボリュームVOLに障害が発生しているか否かをチェックしていない状態であることを示す。
さらに副ボリュームID欄24Eには、対応するボリュームVOLの副ボリュームSVOL(複製)が存在する場合に、その副ボリュームSVOLのボリュームIDが格納される。従って、対応するボリュームVOLの副ボリュームSVOLが存在しないときには、そのエントリの副ボリュームID欄24Eには何も格納されない。
一方、ボリュームペア管理テーブル25は、ストレージ管理プログラム21がストレージ装置3内のボリュームペアを管理するためのテーブルであり、図5に示すように、正ボリュームID欄25A及び副ボリュームID欄25Bから構成される。そして正ボリュームID欄25A及び副ボリュームID欄25Bには、ストレージ装置4内に設定された各ボリュームペアの正ボリュームPVOL又は副ボリュームSVOLのボリュームIDがそれぞれ格納される。
またボリューム管理テーブル26は、ストレージ管理プログラム21がボリュームVOLの障害を管理するためのテーブルであり、図6に示すように、ボリュームID欄26A及び障害フラグ欄26Bから構成される。そしてボリュームID欄26Aには、ストレージ装置3内に設定された各ボリュームVOLのボリュームIDがそれぞれ格納され、障害フラグ欄26Bには、対応するボリュームVOLに障害が発生しているか否かを表すボリューム障害フラグが格納される。この場合、ボリューム障害フラグは、対応するボリュームVOLに障害が生じている場合には「ON」、当該ボリュームVOLに障害が生じていない場合には「OFF」に設定される。
ボリュームパス管理テーブル27は、計算機2から各ボリュームVOLへのパスをストレージ管理プログラム21が管理するためのテーブルであり、図7に示すように、ボリュームID欄27A及びパスID欄27Bから構成される。そしてボリュームID欄27Aには、対応するボリュームVOLのボリュームIDが格納され、パスID欄27Bには、そのボリュームVOLへのパスのパスIDが格納される。パスIDは、例えば計算機2の入出力インターフェース12(図1)の識別子と、ストレージ装置3の受信ポートの識別子とを組み合わせて生成される。
さらにパス管理テーブル28は、計算機2及びボリュームVOL間のパス障害をストレージ管理プログラム21が管理するためのテーブルであり、図8に示すように、パスID欄28A及び障害フラグ欄28Bから構成される。そしてパスID欄28Aには、対応するパスのパスIDが格納され、障害フラグ欄28Bには、そのパスに障害が発生しているか否かを表すパス障害フラグが格納される。パス障害フラグは、対応するパスに障害が生じているときには「ON」、障害が生じていないときには「OFF」が設定される。
図9は、ジョブ管理プログラム20によるジョブ実行処理の処理手順を示している。ジョブ管理プログラム20は、バッチ処理時、まず、次に実行しようとするジョブのジョブ定義ファイル32をストレージ装置3から読み出す。そしてジョブ管理プログラム20は、読み出したジョブ定義ファイル32を解析し、ジョブ定義文のIDオペランドからジョブIDを、NAMEオペランドから環境変数名を、FILEオペランドからファイル33のパス名を、DELETEオペランドから削除の有無をそれぞれ抽出する。そのジョブ定義ファイル32に複数のジョブ定義文が存在するときには、各ジョブ定義文について同様の処理を行なう(SP1)。
次いでジョブ管理プログラム20は、そのジョブ定義ファイル32の1つのジョブ定義文に対してジョブファイル管理テーブル23の新規エントリを1つ割り当て、ステップSP1においてそのジョブ定義ファイル32から抽出したそのジョブ定義文に関するパス名、ジョブID及びファイルIDをその新規エントリのパス名欄23A、ジョブID欄23C及びファイル識別名欄23Dにそれぞれ格納する。またジョブ管理プログラム20は、そのジョブ定義文においてDELETEオペランドが存在する場合には、「YES」という削除対象情報をその新規エントリの削除対象情報欄23Eに格納する(SP2)。
続いてジョブ管理プログラム20は、そのジョブで使用するファイル33が格納されたボリュームVOLのボリュームIDを求め、そのボリュームIDをジョブファイル管理テーブル23及び必要に応じてジョブボリューム管理テーブル24に格納する(SP3)。
具体的に、ジョブ管理プログラム20は、例えばstat()関数を発行し、ジョブファイル管理テーブル23におけるそのジョブに割り当てられた新規エントリのパス名欄23Aに格納されたパス名に対応するデバイスID(ボリュームID)を問い合わせる。あるいは、マウントされるボリュームVOLのファイルシステム情報が記述されているファイル(fstab)を読み込む。そしてジョブ管理プログラム20は、上述のようにして得られたボリュームIDをジョブファイル管理テーブル23のかかる新規エントリのボリュームID欄23Bに格納する。
またジョブ管理プログラム20は、そのとき取得したボリュームIDがジョブボリューム管理テーブル24に登録されていないときには、そのボリュームIDのボリュームVOLにジョブボリューム管理テーブル24の新規エントリを1つ割り当て、そのエントリのボリュームID欄24Aに当該ボリュームIDを格納すると共に、そのボリュームIDのボリュームVOLがマウントされたマウントポイントまでのパス名を当該新規エントリのマウントポイントパス欄24Bに格納する。
なお、ジョブ管理プログラム20は、そのとき対象としているジョブ定義ファイル32に複数のジョブ定義文が記述されているときには、ステップSP2及びステップSP3の処理をジョブ定義文ごとに実行する。
次いで、ジョブ管理プログラム20は、そのジョブ定義ファイル32において定義されたジョブで利用するボリュームVOL(つまり、そのジョブで使用するファイル33が格納されたボリュームVOL)や、当該ボリュームVOL及び計算機2間のパスに障害があるか否かをチックするボリューム障害チェック処理を実行する(SP4)。このボリューム障害チェック処理の具体的な処理内容については、後述する。
続いてジョブ管理プログラム20は、ジョブファイル管理テーブル23のエントリのうち、そのジョブ定義ファイル32において定義されたジョブのジョブIDがジョブID欄23Cに格納されたすべてのエントリについて、パス名欄23Aに格納されたパス名を、ファイル識別名欄23Dに格納されたファイル識別名(環境変数)に変更する(SP5)。
この後ジョブ管理プログラム20は、ジョブ定義ファイル32を参照してそのジョブを実行すべきアプリケーションプログラムを起動し、そのジョブが終了するのを待ち受ける(SP6)。そしてジョブ管理プログラム20は、やがてそのジョブが終了すると、当該ジョブが異常終了したか否かを判断する(SP7)。そしてジョブ管理プログラム20は、この判断において否定結果を得るとステップSP10に進む。
これに対して、かかる判断において肯定結果を得た場合、ジョブが異常終了した要因としてボリューム障害やパス障害が考えられるため、そのジョブで利用するボリュームVOLや当該ボリュームVOLへのパスを、次のジョブを実行する前にチェックしておく必要がある。
そこで、このときジョブ管理プログラム20は、その異常終了したジョブで利用したボリュームVOLのボリュームIDをジョブファイル管理テーブル23から読み出し、ジョブボリューム管理テーブル24のエントリのうち、そのボリュームIDがボリュームID欄24Aに格納されたエントリのチェック要因情報欄24Cにそのとき異常終了したジョブのジョブIDを格納する(SP8)。
またジョブ管理プログラム20は、異常終了したジョブのジョブIDと、当該ジョブで利用したボリュームVOLのボリュームIDとなどを障害情報としてコンソール5(図1)に送信する(SP9)。かくしてコンソール5は、この障害情報に基づいて所定の障害通知画面を表示し、ユーザにチェックを促す。
続いてジョブ管理プログラム20は、そのとき実行したジョブで使用したファイル33について削除すべき設定(「DELETE=YES」)がなされているときには、そのファイル33を削除する(SP10,SP11)。具体的にジョブ管理プログラム20は、ジョブファイル管理テーブル23のエントリのうち、そのとき実行したジョブのジョブIDがジョブID欄23Cに格納され、かつ削除対象情報欄23Eに「YES」が格納されたエントリがあるか否かを判断する(SP10)。そしてジョブ管理プログラム20は、この判断において否定結果を得るとステップSP14に進み、これに対して肯定結果を得ると、そのジョブで利用したボリュームVOLから対応するファイル33を削除する(SP11)。
次いでジョブ管理プログラム20は、そのとき実行したジョブが異常終了し、かつステップSP11におけるファイル33の削除処理も失敗したか否かを判断したか否かを判断する(SP12)。そしてジョブ管理プログラム20は、この判断において肯定結果を得た場合には、そのファイル33をボリューム障害の回復後に削除するため、ジョブファイル管理テーブル23の対応するエントリの削除対象情報欄23Eに格納された削除対象情報を「FAILED」に変更する(SP13)。
これに対してジョブ管理プログラム20は、ステップSP12の判断において否定結果を得た場合には、ジョブファイル管理テーブル23のそのエントリはもはや不要であることから、当該ジョブファイル管理テーブル23のエントリのうち、ジョブID欄23Cに格納されたジョブIDがステップSP6において実行したジョブのジョブIDと一致し、かつ削除対象情報欄23Eに「FAILED」という削除対象情報が格納されていないエントリをすべて解放(ジョブファイル管理テーブル23から削除)する(SP14)。
そしてジョブ管理プログラム20は、この後、そのとき対象としていたジョブ定義ファイル32に関するジョブ実行処理を終了し、他のジョブ定義ファイル32があるときには、すべてのジョブ定義ファイル32について同様の処理(SP1〜SP14)を繰り返す。
図10に、上述のジョブ実行処理のステップSP9においてジョブ管理プログラム20からの障害情報に基づいてコンソール5が表示する障害通知画面の構成例を示す。この図10に示す障害通知画面40では、ジョブが異常終了した旨のメッセージと、異常終了したジョブのジョブIDと、当該ジョブで利用したボリュームVOLのボリュームIDとが表示される。かくして、ユーザは、この障害通知画面40にボリュームIDが表示されたボリュームVOL(図10では「hda1」)に障害が発生しているか否かを調査し、障害が発生していると認められた場合にはACTION欄40Aに「Y」、認められなかった場合には「N」を入力するようにする。そしてかかるACTION欄40Aに「Y」を入力した場合、その旨が計算機2のジョブ管理プログラム20に通知される。
なお、かかる通知を受けたジョブ管理プログラム20が、ジョブボリューム管理テーブル24の対応するエントリ(かかるACTION欄40Aに「Y」が入力された行に記載されたボリュームIDがボリュームID欄24Aに格納されたエントリ)の障害フラグ欄24Dに格納された障害フラグを「ON」に設定すると共に、当該エントリのチェック要因情報欄24Cに格納されているジョブIDを消去するようにしても良い。
また、かかる障害通知画面40への入力のかわりに、障害が発生したボリュームVOLのボリュームIDをオペランドに指定したコマンドをユーザに入力させ、このコマンドに基づいてジョブ管理プログラム20が、ジョブボリューム管理テーブル24の対応するエントリの障害フラグ欄24Dに格納された障害フラグを「ON」に設定するようにしても良い。
さらにオペレーティングシステム22(図1)が出力するストレージ障害メッセージをジョブ管理プログラム20などが監視し、ジョブボリューム管理テーブル24のエントリのうち、ストレージ障害メッセージに含まれるボリュームIDがボリュームID欄24Aに格納されたエントリの障害フラグ欄24Dの障害フラグを「ON」に変更するようにしても良い。
さらにストレージ管理プログラム21が、障害が発生したボリュームVOLのボリュームIDをジョブ管理プログラム20に通知し、この通知を受けたジョブ管理プログラム20が、ジョブボリューム管理テーブル24のエントリのうち、通知されたボリュームIDがボリュームID欄24Aに格納されたエントリの障害フラグ欄24Dの障害フラグを「ON」に変更するようにしても良い。
図11は、図9について上述したジョブ実行処理のステップSP4においてジョブ管理プログラム20が実行するボリューム障害チェック処理の具体的な処理内容を示している。
ジョブ管理プログラム20は、ジョブ実行処理のステップSP9に進むと、このボリューム障害チェック処理を開始し、まず、異常終了したジョブが利用したボリュームVOLなど、障害の可能性があるボリュームVOLについて障害の有無を検証する(SP20〜SP23)。
具体的にジョブ管理プログラム20は、ジョブボリューム管理テーブル24の各エントリをチェックして、チェック要因情報欄24Cにチェック要因情報(対応するジョブのジョブID)が設定されているエントリがあるか否かを判断する(SP20)。
そしてジョブ管理プログラム20は、この判断において否定結果を得るとステップSP24に進み、これに対して肯定結果を得ると、チェック要因情報欄24Cにチェック要因情報が格納された各エントリについて、そのボリュームID欄24Aに格納されたボリュームIDのボリュームVOLに障害が発生したか否かの障害情報と、そのボリュームVOLの副ボリュームSVOLが存在するか否かの複製情報との送信を、当該ボリュームIDを指定してストレージ管理プログラム21(図1)に要求する(SP21)。
なおステップSP21のかわりに、ジョブ管理プログラム20が、ジョブボリューム管理テーブル24の対応するエントリのマウントポイントパス欄24Bに格納されたパス名が示すディレクトリや、その配下のファイル33にアクセスして障害の有無を確かめるようにしても良い。またジョブ管理プログラム20が、オペレーティングシステム22に対してジョブボリューム管理テーブル24の対応するエントリのボリュームID欄24Aに格納されたボリュームIDを送信することによって、対応するボリュームVOLの障害情報を入手するようにしても良い。さらにジョブ管理プログラム20が、ステップSP20を行わずに、そのとき実行しようとするジョブが利用するすべてのボリュームVOLに対してステップSP21の処理を行うようにしても良い。
そしてジョブ管理プログラム20は、ステップSP21の要求に応じてストレージ管理プログラム21から送信されてきたかかるボリュームVOLの障害情報に基づいて、当該ボリュームVOLに障害が生じているか否かを判断する(SP22)。そしてジョブ管理プログラム20は、この判断において否定結果を得るとステップSP24に進み、これに対して肯定結果を得ると、ジョブボリューム管理テーブル24の対応するエントリの障害フラグ欄24Dに格納された障害フラグを「ON」に設定する(SP23)。
なお、ジョブ管理プログラム20が、ステップSP20〜ステップSP23の処理を行わずに、ステップSP24において、ジョブボリューム管理テーブル24に、障害フラグ欄24Dに格納された障害フラグが「ON」であるエントリも、またチェック要因情報欄24Cにチェック要因情報が格納されたエントリも存在しないときに、このボリューム障害チェック処理を終了するようにしても良い。この場合、障害の可能性があるボリュームVOLが含まれているときにはユーザに応答を求めるため、障害の有無の判断をストレージ管理プログラム21の代わりにユーザが行うことになる。
続いてジョブ管理プログラム20は、次に実行しようとしているジョブが利用するボリュームVOLに障害が発生しているか否かを判断する(SP24)。すなわち、ジョブ管理プログラム20は、ジョブファイル管理テーブル23のエントリのうち、ジョブID欄23Cに格納されたジョブIDが、そのとき対象としているジョブ定義ファイル32において定義されたジョブのジョブIDと一致するすべてのエントリを検出し、それらエントリのボリュームID欄23Bにそれぞれ格納されているボリュームIDを検出する。そしてジョブ管理プログラム20は、ジョブボリューム管理テーブル24のエントリの中に、このようにして検出したボリュームIDがボリュームID欄24Aに格納され、かつ障害フラグ欄24Dに格納された障害フラグが「ON」に設定されたエントリが存在するか否かを判断する。
この判断において否定結果を得ることは、そのとき対象としているジョブ定義ファイル32において定義されたジョブが利用するボリュームVOLに障害が発生していないことを意味する。かくして、このときジョブ管理プログラム20は、このボリューム障害チェック処理を終了して図9について上述したジョブ実行処理に戻る。
これに対して、かかる判断において肯定結果を得ることは、そのとき対象としているジョブ定義ファイル32において定義されたジョブが利用するボリュームVOLに障害が発生していることを意味する。かくして、このときジョブ管理プログラム20は、このボリュームVOLに副ボリュームSVOLが存在するか否かを、ステップSP21の要求に応じてストレージ管理プログラム21から送信されてきた複製情報に基づいて判断する(SP25)。
そしてジョブ管理プログラム20は、この判断において肯定結果を得ると、かかるジョブで使用するボリュームVOLを、そのボリュームVOLの副ボリュームSVOLに切り替える(SP26〜SP28)。
具体的にジョブ管理プログラム20は、ステップSP25において検出した副ボリュームSVOLをマウントする(SP26)。またジョブ管理プログラム20は、その副ボリュームSVOLをジョブボリューム管理テーブル24に登録する(SP27)。より詳細には、ジョブ管理プログラム20は、ジョブボリューム管理テーブル24に新規エントリを割り当て、その新規エントリのボリュームID欄24Aに当該副ボリュームSVOLのボリュームIDを格納すると共に、その新規エントリのマウントポイントパス欄24Bに当該副ボリュームSVOLのマウント先のディレクトリのパス名を格納する。
さらにジョブ管理プログラム20は、ジョブファイル管理テーブル23のエントリのうち、ステップSP26においてジョブボリューム管理テーブル24に登録した副ボリュームSVOLの正ボリューム(つまり元々ジョブが使用する予定であったボリュームVOL)のボリュームIDがボリュームID欄23Bに格納されたすべてのエントリについて、パス名欄23Aに格納されたパス名のうち、対応する副ボリュームSVOLのマウント先のパスと一致する先頭部分を、副ボリュームSVOLのマウントポイントパスに置換する(SP28)。
続いてジョブ管理プログラム20は、障害が発生したボリュームVOLに残っている消去対象のファイル33を消去すると共に、ジョブファイル管理テーブル23(図3)の削除対象情報欄23Eに「FAILED」という削除対象情報が格納されたエントリに対応するファイル33を消去する(SP31)。
具体的にジョブ管理プログラム20は、ジョブボリューム管理テーブル24のエントリのうち、ステップSP26〜ステップSP28において副ボリュームSVOLに切り替えられたボリュームVOLに対応するエントリのチェック要因情報欄24Cに格納されたチェック要因情報を消去すると共に、当該エントリの障害フラグ欄24Dに格納された障害フラグを「OFF」に変更する。またジョブ管理プログラム20は、ジョブファイル管理テーブル23のエントリのうち、かかる障害が発生したボリュームVOLのボリュームIDがボリュームID欄23Bに格納され、かつ削除対象情報欄23Eに「YES」が格納されたエントリが存在するときには、そのエントリのパス名欄23Aに格納されたパス名が示すファイル33を、かかる障害が発生したボリュームVOLから削除する。次いでジョブ管理プログラム20は、ジョブファイル管理テーブル23からそのエントリを削除する。またジョブ管理プログラム20は、上記処理と併せて、ジョブファイル管理テーブル23上の削除対象情報欄23Eに「FAILED」という削除対象情報が格納されたエントリを消去すると共に、当該エントリと対応するファイルを対応するボリュームVOLから削除する。そしてジョブ管理プログラム20は、この後、図9について上述したジョブ実行処理に戻る。
一方、ジョブ管理プログラム20は、ステップSP25の判断において否定結果を得ると、そのとき対象としているジョブ定義ファイル32において定義されたジョブのジョブIDと、そのジョブ定義ファイル32において定義されている当該ジョブで利用するボリュームVOLのボリュームIDと、ジョブボリューム管理テーブル24の当該ボリュームVOLと対応するエントリのチェック要因情報欄24Cに格納された異常終了したジョブのジョブ名とを含む障害情報をコンソール5(図1)に通知する(SP29)。
かくしてコンソール5は、この障害情報に基づいて、図12に示すように、次に実行しようとするジョブが利用するボリュームVOLに障害が発生しているおそれがあるため当該ジョブの実行を中断した旨のメッセージと、実行を中断したジョブのジョブIDと、そのジョブが利用するボリュームVOLのボリュームIDと、そのボリュームVOLを使用して異常終了したジョブのジョブIDとが表示された障害通知画面41を表示する。かくしてユーザは、この障害通知画面41内のACTION欄41Aにそのとき対象としているジョブを実行すべきことを意味する「Y」又は当該ジョブの実行を中止すべきことを意味する「N」を入力することによって、かかるジョブを実行すべきか又は中止すべきかを選択することができる。
ただし、「ジョブを実行する」という選択肢を選択するに際しては、かかる障害が発生しているボリュームVOLを障害から回復させるための回復作業(例えば対応するディスクドライブの交換作業等)を行なう必要がある。これは、かかる回復作業を行なわなければ、かかるジョブも異常終了することになるからである。
そしてコンソール5は、かかる障害情報画面41のACTION欄41Aに「Y」又は「N」が入力されると、「Y」及び「N」のいずれが選択されたかをジョブ管理プログラム20に通知する。
ジョブ管理プログラム20は、かかる通知を受信すると、この通知に基づいて、そのとき対象としているジョブを中止すべきか否かを判断し(SP30)、肯定結果を得ると、図9について上述したジョブ実行処理に戻って当該ジョブ実行処理のステップSP14に進む。
これに対してジョブ管理プログラム20は、かかる判断において否定結果を得ると、上述と同様にしてステップSP31の処理を実行し、この後かかるジョブ実行処理に戻る。
なお上述のボリューム障害チェック処理において、ジョブ管理プログラム20が、ステップSP21でストレージ管理プログラム21から複製情報を取得し、ステップSP26で副ボリュームSVOLをマウントする代わりに、ユーザが副ボリュームSVOLをマウントして、正ボリュームPVOL(つまりその副ボリュームSVOLに切り替えられる前の障害が発生したボリュームVOL)のマウントポイントパスのパス名と副ボリュームSVOLのマウントポイントパスのパス名とをコマンドによりジョブ管理プログラム20に通知し、ステップSP27の処理を事前に行うようにしても良い。
次に、かかるボリューム障害チェック処理(図11)のステップSP21において、ジョブ管理プログラム20からボリュームVOLの障害情報及び複製情報の送信要求を受けたストレージ管理プログラム21が実行する障害複製情報送信処理の処理内容を図13に示す。
ストレージ管理プログラム21は、ジョブ管理プログラム20からボリュームVOLの障害情報及び複製情報を送信すべき旨の要求が与えられると、この障害複製情報送信処理を開始し、まず、そのとき対象とするボリュームVOLのボリュームIDと、正ボリュームID欄25Aに格納されたボリュームIDとが一致するエントリをボリュームペア管理テーブル25上で検索する。そしてストレージ管理プログラム21は、この検索によりボリュームIDが一致するエントリを検出すると、そのエントリの副ボリュームSVOLのボリュームIDをジョブ管理プログラム20に送信する。(SP40)。なおストレージ管理プログラム21は、予めストレージ装置4内に設定された各ボリュームペアの正ボリュームPVOLのボリュームID及び副ボリュームSVOLのボリュームIDをストレージ装置4から取得し、取得した情報に基づいてこのボリュームペア管理テーブル25を作成する。
次いでストレージ管理プログラム21は、かかる問合せ対象のボリュームVOLのボリュームIDと、ボリュームID欄26Aに格納されたボリュームIDとが一致するエントリをボリューム管理テーブル26上で検索する。そしてストレージ管理プログラム21は、この検索によりボリュームIDが一致するエントリを検出すると、そのエントリの障害フラグ欄26Bに格納されたボリューム障害フラグの内容(「ON」又は「OFF」)をジョブ管理プログラム20に送信する(SP41)。なおストレージ管理プログラム21は、ステップSP41の前又は一定時間ごとにストレージ装置4又は計算機2のオペレーティングシステム22(図1)に対してボリューム障害の有無を問い合わせ、得られたボリューム障害情報に基づいてボリューム管理テーブル26の対応するボリューム障害フラグを必要に応じて更新する。
続いてストレージ管理プログラム21は、かかる問合せ対象のボリュームVOLのボリュームIDと、ボリュームID欄27Aに格納されたボリュームIDとが一致するエントリをボリュームパス管理テーブル27上で検索する。そしてストレージ管理プログラム21は、この検索によりボリュームIDが一致するエントリを検出すると、そのエントリのパスID欄27Bに格納された対応するパスのパスIDを取得する(SP42)。
またストレージ管理プログラム21は、上述のようにして得られたパスIDと、パスID欄28Aに格納されたパスIDが一致するエントリをパス管理テーブル28上で検索し、当該検索により検出したエントリのパス障害フラグ欄28Bに格納されたパス障害フラグの内容(「ON」又は「OFF」)をジョブ管理プログラム20に送信する(SP43)。そしてストレージ管理プログラム21は、この後、この障害複製情報送信処理を終了する。なおストレージ管理プログラム21は、ステップSP41の前又は一定時間ごとにストレージ装置3又は計算機2のオペレーティングシステム22に各パスIDが示すパス(通信経路)についての障害の有無を問い合わせ、得られたパス障害情報に基づいてパス管理テーブル28のパス障害フラグ欄28Bを必要に応じて更新する。
(3)本実施の形態の効果
以上のように本計算機システム1では、バッチ処理において、ジョブを実行する前に、当該ジョブが利用するボリュームVOLや当該ボリュームVOL及び計算機2間のパスに障害又は障害発生のおそれがあるか否かをチェックし、障害又は障害発生のおそれがあるときには、ユーザにその旨を通知してユーザからの許可があるまで後続するジョブの実行を延期するため、異常終了したジョブの異常終了要因をユーザが容易に特定することができる。かくするにつきジョブが異常終了した場合においても、ユーザが異常終了要因を特定し、再スケジュールするという作業を省くことができ、かくしてバッチジョブ運用を省力化し得る計算機システムを実現することができる。
(4)他の実施の形態
なお上述の実施の形態においては、本発明を図1のように構成された計算機システム1の計算機1に適用するようにした場合について述べたが、本発明はこれに限らず、要は、バッチ処理を行ない得るようになされたこの他種々の情報処理装置に広く適用することができる。
また上述の実施の形態においては、バッチ処理の次のジョブを実行する前にそのジョブが利用するボリュームVOLや、計算機2及び当該ボリュームVOL間のパスについての障害の有無をチェックするようにした場合について述べたが、本発明はこれに限らず、ボリュームVOL及びパス以外の次のジョブが利用する他の資源についても障害の有無をチェックするようにしても良い。
さらに上述の実施の形態においては、障害通知画面40,41を図10や図12のように構成するようにした場合について述べたが、本発明はこれに限らず、この他種々の構成を広く適用することができる。
本発明は、バッチ処理機能が搭載された種々の情報処理装置に広く適用することができる。
本実施の形態による計算機システムの全体構成を示すブロック図である。 ジョブ定義ファイルの記述例を示す概念図である。 ジョブファイル管理テーブルの構成例を示す概念図である。 ジョブボリューム管理テーブルの構成例を示す概念図である。 ボリュームペア管理テーブルの構成例を示す概念図である。 ボリューム管理テーブルの構成例を示す概念図である。 ボリュームパス管理テーブルの構成例を示す概念図である。 パス管理テーブルの構成例を示す概念図である。 ジョブ実行処理の処理手順を示すフローチャートである。 障害通知画面の表示例を示す略線図である。 ボリューム障害チェック処理の処理手順を示すフローチャートである。 障害通知画面の表示例を示す略線図である。 障害複製情報送信処理の処理手順を示すフローチャートである。
符号の説明
1……計算機システム、2……計算機、3……ストレージ装置、5……コンソール、10……主記憶装置、11……CPU、20……ジョブ管理プログラム、21……ストレージ管理プログラム、23……ジョブファイル管理テーブル、24……ジョブボリューム管理テーブル、25……ボリュームペア管理テーブル、26……ボリューム管理テーブル、27……ボリュームパス管理テーブル、28……パス管理テーブル、30……ストレージ部、31……コントローラ部、32……ジョブ定義ファイル、33……ファイル、VOL……ボリューム、PVOL……正ボリューム、SVOL……副ボリューム、40,41……障害通知画面。

Claims (11)

  1. プログラムが格納された主記憶装置と、
    前記主記憶装置に格納された前記プログラムに従って所定の資源を利用するバッチ処理を実行するプロセッサと
    を備え、
    前記プロセッサは、
    前記バッチ処理のうちの次に実行するジョブが利用する前記資源を特定すると共に、当該資源に障害が発生しているか否かを判定し、
    当該資源に障害が発生していると判定したときには、当該障害に関する障害情報をユーザに提示し、ユーザからの応答を得るまで当該ジョブの実行を延期する
    ことを特徴とするバッチ処理装置。
  2. 前記資源は、ストレージ装置内に設けられた論理ボリュームである
    ことを特徴とする請求項1に記載のバッチ処理装置。
  3. 前記資源は、さらに前記ボリュームまでのパスを含む
    ことを特徴とする請求項2に記載のバッチ処理装置。
  4. 前記プロセッサは、
    次に実行する前記ジョブが使用する前記資源が、前記バッチ処理のうちの既に実行済みのジョブのうち、異常終了したジョブが使用した資源であるか否かに基づいて、次に実行する前記ジョブが使用する前記資源に障害が発生しているか否かを判定する
    ことを特徴とする請求項1に記載のバッチ処理装置。
  5. 障害が発生した前記論理ボリュームの複製が存在するときには、前記ジョブの実行を延期することなく、当該ジョブが利用する前記論理ボリュームを当該複製に切り替えて当該ジョブを実行する
    ことを特徴とする請求項2に記載のバッチ処理装置。
  6. 所定の資源を利用するバッチ処理を実行するバッチ処理方法において、
    前記バッチ処理のうちの次に実行するジョブが利用する前記資源を特定すると共に、当該資源に障害が発生しているか否かを判定する第1のステップと、
    当該資源に障害が発生していると判定したときには、当該障害に関する障害情報をユーザに提示し、ユーザからの応答を得るまで当該ジョブの実行を延期する第2のステップと
    を備えることを特徴とするバッチ処理方法。
  7. 前記資源は、ストレージ装置内に設けられた論理ボリュームである
    ことを特徴とする請求項6に記載のバッチ処理方法。
  8. 前記資源は、さらに前記ボリュームまでのパスを含む
    ことを特徴とする請求項7に記載のバッチ処理方法。
  9. 前記第1のステップでは、
    次に実行する前記ジョブが使用する前記資源が、前記バッチ処理のうちの既に実行済みのジョブのうち、異常終了したジョブが使用した資源であるか否かに基づいて、次に実行する前記ジョブが使用する前記資源に障害が発生しているか否かを判定する
    ことを特徴とする請求項6に記載のバッチ処理方法。
  10. 前記第2のステップでは、
    障害が発生した前記論理ボリュームの複製が存在するときには、前記ジョブの実行を延期することなく、当該ジョブが利用する前記論理ボリュームを当該複製に切り替えて当該ジョブを実行する
    ことを特徴とする請求項7に記載のバッチ処理方法。
  11. 所定の資源を利用するバッチ処理を実行するバッチ処理のうちの次に実行するジョブが利用する前記資源を特定すると共に、当該資源に障害が発生しているか否かを判定する第1のステップと、
    当該資源に障害が発生していると判定したときには、当該障害に関する障害情報をユーザに提示し、ユーザからの応答を得るまで当該ジョブの実行を延期する第2のステップと
    を備えることを特徴とする処理をコンピュータに実行させるプログラム。
JP2008061060A 2008-03-11 2008-03-11 バッチ処理装置及び方法 Pending JP2009217587A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008061060A JP2009217587A (ja) 2008-03-11 2008-03-11 バッチ処理装置及び方法
US12/081,563 US20090235126A1 (en) 2008-03-11 2008-04-17 Batch processing apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008061060A JP2009217587A (ja) 2008-03-11 2008-03-11 バッチ処理装置及び方法

Publications (1)

Publication Number Publication Date
JP2009217587A true JP2009217587A (ja) 2009-09-24

Family

ID=41064316

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008061060A Pending JP2009217587A (ja) 2008-03-11 2008-03-11 バッチ処理装置及び方法

Country Status (2)

Country Link
US (1) US20090235126A1 (ja)
JP (1) JP2009217587A (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5473267B2 (ja) * 2008-07-14 2014-04-16 キヤノン株式会社 ワークフロー実行システム及びワークフロー実行方法
JP5279516B2 (ja) * 2009-01-09 2013-09-04 キヤノン株式会社 情報処理装置、表示制御方法及びプログラム
US9213576B2 (en) * 2014-01-31 2015-12-15 Google Inc. Efficient resource utilization in data centers
US20170068686A1 (en) * 2015-09-07 2017-03-09 Jacob Broido Accessing a block based volume as a file based volume
US10037242B2 (en) * 2016-06-22 2018-07-31 Microsoft Technology Licensing, Llc Failure detection in a processing system
US11860723B2 (en) * 2021-12-28 2024-01-02 Capital One Services, Llc Systems and methods for parallelizing sequential processing requests using predicted correction data

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6708226B2 (en) * 1994-02-28 2004-03-16 At&T Wireless Services, Inc. Multithreaded batch processing system
KR100272256B1 (ko) * 1997-10-31 2001-03-02 윤종용 반도체장비와호스트컴퓨터의동시제어방법
US6857082B1 (en) * 2000-11-21 2005-02-15 Unisys Corporation Method for providing a transition from one server to another server clustered together
US6871299B2 (en) * 2001-02-05 2005-03-22 Fisher-Rosemount Systems, Inc. Hierarchical failure management for process control systems
US20030149747A1 (en) * 2002-02-01 2003-08-07 Xerox Corporation Method and apparatus for modeling print jobs
US7369912B2 (en) * 2003-05-29 2008-05-06 Fisher-Rosemount Systems, Inc. Batch execution engine with independent batch execution processes
US7178055B2 (en) * 2003-06-06 2007-02-13 Hewlett-Packard Development Company, L.P. Method and system for ensuring data consistency after a failover event in a redundant data storage system
JP4485763B2 (ja) * 2003-07-10 2010-06-23 株式会社日立製作所 運用管理方法及び装置
US7747717B2 (en) * 2003-08-14 2010-06-29 Oracle International Corporation Fast application notification in a clustered computing system
KR20050067348A (ko) * 2003-12-27 2005-07-01 삼성전자주식회사 일시정지 기능을 포함하는 화상 형성 장치 및 화상 형성장치 동작 방법
US7370244B2 (en) * 2004-05-26 2008-05-06 Sap Ag User-guided error correction
JP4339763B2 (ja) * 2004-09-07 2009-10-07 株式会社日立製作所 フェイルオーバ方法及び計算機システム
JP2006127217A (ja) * 2004-10-29 2006-05-18 Hitachi Ltd 計算機システムおよび計算機システムの制御方法
JP4604666B2 (ja) * 2004-11-10 2011-01-05 株式会社日立製作所 入出力対象変更制御方法
US7665093B2 (en) * 2004-12-22 2010-02-16 Microsoft Corporation Synchronization of runtime and application state via batching of workflow transactions
JP2007041720A (ja) * 2005-08-01 2007-02-15 Fujitsu Ltd ジョブステップ実行プログラムおよびジョブステップ実行方法
WO2007111690A2 (en) * 2005-11-08 2007-10-04 Kaulkin Information Systems, Inc. System and method for managing business processes
US20090165007A1 (en) * 2007-12-19 2009-06-25 Microsoft Corporation Task-level thread scheduling and resource allocation

Also Published As

Publication number Publication date
US20090235126A1 (en) 2009-09-17

Similar Documents

Publication Publication Date Title
JP5156682B2 (ja) ストレージシステムにおけるバックアップ方法
JP5745077B2 (ja) 根本原因を解析する管理計算機及び方法
JP5008991B2 (ja) データのリカバリを制御する装置及び方法
US9442809B2 (en) Management computer used to construct backup configuration of application data
JP5263696B2 (ja) ソフトウェア構成要素をバックアップするためのコンピュータ・システム、並びにその方法及びコンピュータ・プログラム
US7644301B2 (en) Fault management system in multistage copy configuration
US7979905B2 (en) Storage system, virus infection spreading prevention method, and virus removal support method
US8495635B2 (en) Mechanism to enable and ensure failover integrity and high availability of batch processing
JP2010055211A (ja) 複数のサービス構成要素に対応するアクションの実行を管理するためのコンピュータ・システム、並びにその方法及びコンピュータ・プログラム
JP2009199528A (ja) 複数のサービスステップを含むサービスプロセスを管理するためのコンピュータ・システム、並びにその方法及びコンピュータ・プログラム
JP2005100373A (ja) 複数世代の回復スナップショットのバックアップと修復のマッピング装置
US8745342B2 (en) Computer system for controlling backups using wide area network
JP2009217587A (ja) バッチ処理装置及び方法
JP2010244486A (ja) データ処理システム、その処理方法、及び計算機
JP2010033398A (ja) トランザクションを処理する本番システムと該本番システムのバックアップ・システムである代行システムとを含む本番−代行システム
WO2015043155A1 (zh) 一种基于命令集的网元备份与恢复方法及装置
US8112598B2 (en) Apparatus and method for controlling copying
JP5997110B2 (ja) 計算機システム、デバイスドライバインストール方法
WO2012131868A1 (ja) 計算機システムの管理方法及び管理装置
JP2006072684A (ja) ストレージネットワークシステム及び管理サーバ、ホストとストレージ装置
JP6665892B2 (ja) 情報処理システム,情報処理装置および制御プログラム
US8676748B2 (en) Clearing metadata tracks in a storage system
US7240348B2 (en) Suspending scenario generation method, server device, and program therefor
US8214613B2 (en) Storage system and copy method
US7065539B2 (en) Data transfer method