JP2008217367A - バッチ処理の障害復旧方法及び障害復旧システム - Google Patents

バッチ処理の障害復旧方法及び障害復旧システム Download PDF

Info

Publication number
JP2008217367A
JP2008217367A JP2007053323A JP2007053323A JP2008217367A JP 2008217367 A JP2008217367 A JP 2008217367A JP 2007053323 A JP2007053323 A JP 2007053323A JP 2007053323 A JP2007053323 A JP 2007053323A JP 2008217367 A JP2008217367 A JP 2008217367A
Authority
JP
Japan
Prior art keywords
job
processing
tbl
execution
rerun
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2007053323A
Other languages
English (en)
Inventor
Eisuke Sasaki
英介 佐々木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Information Systems Ltd
Original Assignee
Hitachi Information Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Information Systems Ltd filed Critical Hitachi Information Systems Ltd
Priority to JP2007053323A priority Critical patent/JP2008217367A/ja
Publication of JP2008217367A publication Critical patent/JP2008217367A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】本システムの導入時における既存のオペレーティングシステムの仕様変更負担を軽減することを可能にして、システム運用に自由度を持たせることができるバッチ処理の障害復旧方法及びシステムを提供すること。
【解決手段】リランスケジュール処理部は、異常終了したジョブの再実行に必要なリカバリ処理(ジョブ)と、リランポイントからの再実行ジョブとを、リランTBL105に組み込む。ファイルの更新処理等を行うロールバック処理が有る場合は、この処理をリランTBL105の先頭に組み込む。
【選択図】図1

Description

本発明はコンピュータシステムにおけるバッチ処理の障害復旧方法及び障害復旧システムに係り、特に、監視作業が手薄な夜間処理等におけるバッチ処理の障害復旧方法及び障害復旧システムに関する。
従来、バッチ処理の障害復旧方式は、大量のデータを一括処理するバッチ処理時の障害復旧方式として用いられているが、バッチ処理時の障害復旧処理は、リアルタイム処理時の障害復旧処理に比べて、復旧に緊急性を要求されるものではないが、一般にバッチ処理では大量のデータが処理されるので、障害が生じた時に、最初からやり直しをすると、再処理のための多大の時間が必要となり、よって、従来から、再処理の範囲を適当な範囲に収めることができるバックアップ処理手段を備えた障害復旧処理機能が不可欠の機能として使用されている。
そこで、この分野の技術として、バッチ処理の障害復旧処理に必要な障害復旧時間を短縮することを意図し、複数のデータベースの各々に対応したデータベース更新アプリケーションを備えてバッチ処理のデータ更新単位をこのデータベース単位とすると共に、さらに、バッチ状態制御ファイルを参照してデータベース更新アプリケーションを起動し、その処理結果を受け取ってバッチ状態制御ファイルを更新するバッチ処理監視部を備えて、データベース更新アプリケーションが異常終了を通知した時にバッチ処理監視部がバッチ処理を停止し、さらに、ジョブ状態設定部において処理再開の設定が有る場合は、バッチ処理監視部はバッチ状態制御ファイルを参照して異常終了したデータベース更新アプリケーションによる処理から再処理を開始する技術が開示されている(例えば、特許文献1参照)。
また、リカバリスタート機能を備えたバッチ処理システムとして、業務データベースに対するバッチジョブの中途終了後の再開始を、中途終了前後で処理の連続性を確保して容易に実行することができることを意図し、アプリケーションプログラムにより、業務データベースDB、入力ファイルFI、及び出力ファイルFOに対するバッチジョブの進行状態を、データベースとして構成されたチェックポイントテーブルに記載されたチェックポイント毎に監視して記録すると共に、この業務データベースとチェックポイントテーブルによる監視処理とが同時に同期処理するように構成し、中途終了後の再開始時には、このチェックポイントテーブルに記録されているジョブ進行管理情報に基づいてジョブを開始する技術が開示されている(例えば、特許文献2参照)。
特開平10−49417号公報 特開2003−85021号公報
しかしながら、上記背景技術で述べた従来のバッチ処理の障害復旧方式にあっては、システム構成やアプリケーションプログラムと独立した方式ではなく、よって、システム構成やアプリケーションプログラムの種類毎に専用の障害復旧プログラムを使用しなければならないという問題点が有った。
例えば、前述の特許文献1では、複数のデータベース毎に専用の更新アプリケーションを備えると共に、バッチ処理監視部において、これらのデータベースの更新状況を一括監視することにより、再処理時の負担を低減させているが、バッチ処理の障害復旧を専用の更新アプリケーションを備えることで対応しているため、開発手法として位置付けられる技術ではあっても、実存する既成のシステムの運用に適用することは困難であるし、適用するとしても、その際には既成の更新アプリケーションとの組替えが必要になる。
また、前述の特許文献2では、アプリケーションプログラムの実行状況を各サブプログラムで取得してデータベース化してリカバリ・リスタートを実現することを意図するものであるが、この技術も、専用のアプリケーションプログラムに依存しているため、既存のオペレーティングシステムを備えたシステムの運用に適用することが困難である。
本発明は、上記従来の問題点に鑑みてなされたものであって、本システムの導入時における既存のオペレーティングシステムの仕様変更負担を軽減することを可能にして、システム運用に自由度を持たせることができるバッチ処理の障害復旧方法及びシステムを提供することを目的としている。
本発明の他の目的は、処理期限を設定させ、この処理期限までに処理が終了しない場合には処理を停止させることで、処理期限が優先される事務作業にも適用可能なバッチ処理の障害復旧方法及びシステムを提供することにある。
本発明の他の目的は、再発防止対策を本システム用のリカバリ処理として採り入れ、次回の処理からは、同じ障害に対しては当該リカバリ処理を実行できるようにすることで、成長しながら安定稼動していくことができるバッチ処理の障害復旧方法及びシステムを提供することにある。
上記課題を解決するために、本発明は、コンピュータシステムにおいてバッチ処理の障害復旧を行うシステムであって、ジョブの実行結果情報を取得して実行結果ファイルに記録する実行結果取得手段と、前記実行結果情報のうち異常終了となっているジョブの実行結果情報を取得して異常終了結果ファイルに記録する異常終了結果取得手段と、前記異常終了となっているジョブの再実行ポイントからのジョブ制御情報を、再実行処理用のジョブ制御情報として、再実行処理ファイルに記録するスケジューリング手段と、前記異常終了となっているジョブについて、前記再実行処理ファイルに記録されたジョブ制御情報に基づいて再実行処理用のジョブを実行させる再実行指示手段と、を備えたことを特徴とするバッチ処理の障害復旧システムを提供するものである。
このように構成することにより、本システムの導入時における既存のオペレーティングシステムの仕様変更負担を軽減することを可能にして、システム運用に自由度を持たせることができるバッチ処理の障害復旧を実現している。
また、本発明のバッチ処理の障害復旧システムは、前記再実行処理用のジョブ制御情報に対応するジョブの実行時間の総和を求めると共に、前記総和が予め設定された処理の期限を超過する場合は、前記再実行用のジョブを実行させないように制御する手段をさらに備えることを特徴とする。
このように構成することにより、処理期限を考慮して期限までに処理が終了しない場合には障害復旧処理が停止されるので、処理期限が優先される事務作業にも適用可能なバッチ処理の障害復旧を実現している。
また、本発明のバッチ処理の障害復旧システムは、前記再実行処理用のジョブ制御情報で示されるジョブに先立って実行されるべき、前記異常終了ジョブに対応するリカバリジョブのジョブ制御情報を、予めエラー情報が記録されたエラー情報用のファイルを検索して抽出すると共に、前記リラン処理用のファイルに組み込むリカバリ処理手段をさらに備えることを特徴とする。
このように構成することにより、再発防止対策を本システム用のリカバリ処理として採り入れ、次回の処理からは、同じ障害に対しては当該リカバリ処理を実行できるようにすることで、成長しながら安定稼動していくことができるバッチ処理の障害復旧を実現している。
本発明は、また、ジョブの実行結果情報を取得する手段と、異常終了したジョブの再実行ポイントに関するジョブ制御情報を取得する手段と、実行結果情報及びジョブ制御情報を記憶する手段と、ジョブ制御情報に基づいてジョブの再実行を制御する手段とを有するコンピュータシステムにおいてバッチ処理の障害復旧を行う方法であって、(1)ジョブの実行結果情報を取得し、(2)前記実行結果情報から異常終了したジョブを検出し、当該異常終了ジョブのジョブ制御情報を取得し、(3)前記ジョブ制御情報に基づいて、当該異常終了ジョブを再実行させることを特徴とするバッチ処理の障害復旧方法を提供するものである。
以上説明したように、本発明のバッチ処理の障害復旧方式によれば、本システムの導入時における既存のオペレーティングシステムの仕様変更負担を軽減することが可能となり、システム運用に自由度を持たせることができるバッチ処理の障害復旧方式を提供することができる。
また、処理期限を考慮して期限までに処理が終了しない場合には障害復旧処理が停止されるので、処理期限が優先される事務作業にも適用可能なバッチ処理の障害復旧方式を提供することができる。
さらに、再発防止対策を本システム用のリカバリ処理として採り入れ、次回の処理からは、同じ障害に対しては当該リカバリ処理を実行できるようにするので、成長しながら安定稼動していくことができるバッチ処理の障害復旧方式を提供することができる。
以下、本発明のバッチ処理の障害復旧方法及び障害復旧システムの最良の実施形態について、図面を参照して詳細に説明する。
図1は、本発明の実施形態に係るバッチ処理の障害復旧方法で障害復旧が実行されるコンピュータシステムの全体構成を示す構成図である。
以下の説明では、本障害復旧方法で作成されたり参照されたりするテーブルを「TBL」と略称するが、このテーブルの実体は、直接アクセスが可能な直接編成ファイルである。
同図において、本実施形態のバッチ処理の障害復旧方法で障害復旧が実行されるコンピュータシステムは、データベースとして、ジョブ管理TBLを格納するデータベース101と、処理結果を記録したTBL(実行結果用のファイル)を格納するデータベース102と、ロールバック処理に必要な情報を記録するロールバック処理TBLを格納するデータベース103と、異常終了を記録したTBL(異常終了結果用のファイル)を格納するデータベース104と、ロールバック処理、リカバリ処理、及び再実行すべき処理をスケジュールしたリランTBL(再実行処理用のファイル)を格納するデータベース105と、リカバリを要するエラージョブに対応するリカバリ処理を検索するためのエラーTBL(エラー情報用のファイル)を格納するデータベース106と、を備える。
さらに、本実施形態のバッチ処理の障害復旧方法を採用するコンピュータシステムは、処理系として、処理結果を記録したTBLを作成する処理結果TBL作成処理部201(実行結果取得手段)と、異常終了を記録したTBLを作成する異常終了LOGTBL作成処理部202(異常終了結果取得手段)と、リランのスケジュールを作成するリランスケジュール処理部203(スケジューリング手段)と、処理時間をチェックする処理時間チェック処理部204と、リカバリ処理を行うリカバリ処理部205と、OS(オペレーティングシステム)のジョブ管理手段で参照されるパラメータを作成するパラメータ作成処理部206(再実行指示手段)と、を備える。
この他に、通常処理時のジョブスケジュールシステムと、ジョブスケジュールを記録したファイルを格納するデータベースを備える。
以下、本実施形態のバッチ処理の障害復旧方法を実現するためのコンピュータシステムについて各構成要素毎に説明する。
但し、以下の説明では、データベースiに格納されたテーブル名「T」のTBLの符号は、このTBLが格納されているデータベースと同じ符号を付与するものとし、即ち、「Ti」と略称する。
また、ジョブとジョブステップとは区別せず、どちらも「ジョブ」と称している。
本実施形態のバッチ処理の障害復旧方法を採用するコンピュータシステムは、同一サーバ内に通常処理時のジョブスケジュールシステムを備え、処理が終了する毎に実行結果301をファイル出力する。
このジョブスケジュールシステムの存在は、本発明に限ったものではなく、従来から、OSのジョブ管理手段における必須要素として使用されているものである。
一般に、このジョブスケジュールシステムによる実行結果301のファイル出力は、前記ジョブスケジュールシステムに依存するものである。
本発明に係るバッチ処理の障害復旧方法の特徴的な処理は、このジョブスケジュールシステムや、そのファイル出力の変更箇所を極力少なくして、バッチ処理の障害復旧を可能にすることにある。
処理結果TBL作成処理部201は、実行結果301を記録したファイルをデータベース101に累積する。
前述のジョブスケジュールシステムで異常終了が検知された処理結果は、処理結果TBL102に格納されている該当する処理結果のジョブステータス(即ち、「JOBステータス」項目の内容)がエラーとしてセットされている。
異常終了LOGTBL作成処理部202は、処理結果TBL102に格納されている処理結果でジョブステータスがエラーとして格納されているものを検出した時、該当する処理結果を、異常終了を記録した異常終了記録TBL104に記録する。
リランスケジュール処理部203は、データベース101に格納されたジョブ管理TBL101からリランポイント(再実行ポイント)を導き出すと共に、ジョブ管理TBL101と、ロールバック処理TBL103とに基づいてリランスケジュールを編集し、この編集結果をリランTBL105に記録する。
ちなみに、従来の障害復旧方式であるならば、必要なリカバリ処理の実行後、OSのジョブ管理部に対して、前記のリランポイントを指示し、このリランポイントから再実行させるように構成されるであろう。しかし、それでは、OSのジョブ管理部等に対する構成等の変更負担が大きくなり過ぎる。そこで、本発明では、再実行すべきジョブ(またはジョブステップ)を、そっくりリランTLB105に取り込み、これをあたかも通常のジョブスケジュールによる実行ジョブスタックとしてOSのジョブ管理部に引き渡すものである。
処理時間チェック処理部204では、リランTBL105と、ジョブ管理TBL101とから処理の実行時間を集計し、この集計結果をジョブ管理TBL101に指定されている期限設定と比較し、当該集計結果が当該期限設定を超える場合は処理を中止する。
リカバリ処理部205は、異常終了LOGTBL104を、エラーTBL106を参照して変換し、ジョブ管理TBL101から該当するリカバリ処理を抽出することにより、リカバリ処理をスケジュールする。よって、ジョブ管理TBL101には、予め、リカバリを要するエラー(異常終了処理)に対応するリカバリ処理が記録されているものとする。
本実施形態では、このように、異常終了処理に対応するリカバリ処理の検索をエラーTBL106を参照することで行うので、異常終了処理に対応するリカバリ処理の登録が無い異常終了処理が生じて、この異常終了処理に対するリカバリ対策が講じられた場合、このリカバリ対策と等価なリカバリ処理を作成し、このリカバリ処理でリカバリされる異常終了処理との対応をエラーTBL106に新たに登録することで、次回からは、この異常終了処理に対するリカバリ対策がリカバリ処理として自動的に行われる。即ち、本発明のバッチ処理の障害復旧方法は、異常終了処理に対するリカバリ対策の学習が容易となる効果を有する。
なお、この実施形態におけるリカバリ処理とは、ジョブの異常終了が発生した時に、リランポイントからの処理の再実行に先立って行われるべき処理である。このリカバリ処理は、発生した異常の種類に対応しており、この実施形態では、ファイル等の障害原因を除去する処理等が該当する処理である。
パラメータ作成処理部206は、再実行指示302を作成し、この再実行指示302を既存のジョブスケジュールシステムに引き渡して再実行処理を実行させる。
図2は、本実施形態のバッチ処理の障害復旧方法を実行するコンピュータシステムの全体動作を示すフローチャート図である。
以下、図1を参照しながら、本実施形態のバッチ処理の障害復旧方法を採用するコンピュータシステムの全体動作を、図2に示すフローチャート図を用いて説明する。
まず、処理結果TBL作成処理部201は、処理結果TBL作成サブルーチン(図3参照)を実行して、処理結果TBL102を作成する(ステップS01)。
次に、異常終了LOGTBL作成処理部202が、処理結果TBL102のジョブステータスを検証し、処理結果TBL102のジョブステータスが正常であれば処理続行してフローを抜け、処理結果TBL102のジョブステータスが正常でなけれはステップS03に移る(ステップS02)。
ステップS03では、異常終了LOGTBL作成処理部202は、異常終了LOGTBL作成サブルーチン(図4参照)を実行して、異常終了LOGTBL104を作成する。
次に、リランスケジュール処理部203が、スケジュール表作成サブルーチン(図5,6,7)を実行して、リカバリ処理用のリランTBL105を作成する(ステップS04)。
次に、処理時間チェック処理部204が、処理時間チェックサブルーチン(図8)を実行して、リカバリ処理用のリランTBL105を基に、リカバリ処理に必要な処理時間を集計する(ステップS05)。
次に、処理時間チェック処理部204が、処理時間の集計結果と、ジョブ管理TBL101の「期限設定」項目に指定されている期限設定とを比較し、当該集計結果(処理時間の総計)が当該期限設定を超えている場合は処理を抜けて障害復旧処理を中止する(ステップS06)。
但し、ステップS06における処理時間の集計結果とジョブ管理TBL101に指定されている期限設定との比較は、既にステップS05の処理時間チェックサブルーチン(図8)において行われていて、その結果が前記「期限設定」項目にパラメータ値として与えられているから、ここでは、このパラメータ値を検証する。なお、このパラメータ値は、通常の期限設定と区別できる値とする(ここでは、4桁のオール9を採用している)。
次に、リカバリ処理部5が、リカバリ処理サブルーチン(図9参照)を実行して、異常終了LOGTBL104を、対応するエラーTBL106で変換して、リカバリ処理をリランTBL105にセットする(ステップS07)。
次に、パラメータ作成処理部206が、パラメータ作成サブルーチン(図10参照)を実行して、パラメータファイルを作成して前述のジョブスケジュールシステムにセットし(ステップS07)、処理続行してフローを抜ける(この後、再実行指示302により再実行処理が行われる)。
図3は、処理結果TBL作成処理部201が処理結果TBL作成サブルーチンによって実行する処理の流れを示すフローチャート図である。
処理結果TBL作成処理部201(図1)は、本発明の特徴的な処理部ではなく、即ち、正常終了のジョブであるか異常終了のジョブであるかの区別なく、一般的なコンピュータシステムのジョブ管理処理部として実行される処理部であり、従って、この処理結果TBL作成サブルーチンも、本発明の特徴的な処理を行うものではないが、異常終了のジョブについての処理も含んでいるので、以下では、この異常終了のジョブに対する処理の流れとして説明している。
まず、各処理の終了時に前述のジョブスケジュールシステムから、各処理の実行結果を入力パラメータとして受け取る(ステップS09)。
次に、処理結果TBL102に、レコードを追加する(ステップS10)。
以下は、この追加されたレコードの各必要項目に、前記実行結果を示す情報(ジョブスケジュールシステムから受け取った前記入力パラメータ)を記録する処理の説明である。
まず、入力パラメータの「要求ID」項目の内容を、処理結果TBL102の「要求ID」項目に記録する(ステップS11)。
次に、入力パラメータの「JOB_ID」項目の内容を、処理結果TBL102の「JOB_ID」項目に記録する(ステップS12)。
次に、入力パラメータの「JOBステータス」項目の内容を、処理結果TBL102の「JOBステータス」項目に記録する(ステップS13)。
次に、入力パラメータの「開始時間」項目の内容を、処理結果TBL102の「開始時間」項目に記録する(ステップS14)。
次に、入力パラメータの「終了時間」項目の内容を、処理結果TBL102の「終了時間」項目に記録し(ステップS15)、メインルーチン(図2)の呼び出し元直後のステップに復帰する。
図4は、異常終了LOGTBL作成処理部202が処理結果TBL作成サブルーチンによって実行する処理の流れを示すフローチャート図である。
まず、処理結果TBL102から、異常終了LOGTBL作成処理部202(のメインルーチン)によって異常終了が検知されたレコードの「要求ID」項目の内容と「JOB_ID」項目の内容とをキーにして、前述のジョブスケジュールシステムのTBL(ジョブの本体が記録されている)を読み込む(ステップS16)。
以下は、前記ジョブスケジュールシステムのデータを異常終了LOGTBL104に記録する処理の説明である。
まず、前記ジョブスケジュールシステムのTBLの「要求ID」項目の内容を、異常終了LOGTBL104の「要求ID」項目に記録する(ステップS17)。
但し、ステップS17の処理は、異常終了LOGTBL104に「要求ID」項目が設けられている場合に限り実行するものとする。
次に、前記ジョブスケジュールシステムのTBLの「JOB_ID」項目の内容を、異常終了LOGTBL104の「JOB_ID」項目に記録する(ステップS18)。
次に、前記ジョブスケジュールシステムのTBLのエラーステータス等(より具体的には、「エラーステータス」項目、「エラーコード」項目、及び「エラー詳細」項目の内容)を、異常終了LOGTBL104のエラーステータス等(より具体的には、「エラーステータス」項目、「エラーコード」項目、及び「エラー詳細」項目の内容)として記録する(ステップS19)。
次に、異常終了LOGTBL104の「エラー詳細」項目の内容をキーにして、エラーコード変換TBL(より具体的にはエラーTBL106を読み込む)(ステップS20)。
次に、前記エラーコード変換TBLの「エラーコード」項目の内容を、異常終了LOGTBL104の「エラーコード」項目に記録し(ステップS21)、メインルーチン(図2)の呼び出し元直後のステップに復帰する。
図5,6,7は、リランスケジュール処理部203がスケジュール表作成サブルーチンによって実行する処理の流れを示すフローチャート図である。
まず、リランTBL105(図17参照)のレコードをクリアして、このレコードに有意なデータが何も無い状態にする(ステップS22)。
次に、異常終了LOGTBL104のレコードを検証することにより、同時に異常終了を示したジョブが複数件数存在するか否かを検証し、同時に異常終了を示したジョブが複数件数存在する場合はステップS23に進み、同時に異常終了を示したジョブが複数件数存在しない場合はステップS25に進む(ステップS23)。
ステップS23では、異常終了LOGTBL104のレコードで、始めに記録されたレコード(処理終了時刻の古い方のジョブの実行結果を記録するレコード)を選択し、その内容を取得する。これにより、異常終了のジョブが、ほぼ同時に複数件数発生した場合に、これらから1件だけが選択される。
次に、異常終了LOGTBL104の「JOB_ID」項目をキーにして、ロールバック処理TBL103を読み込む(ステップS25)。
次に、前記の読み込みが成功したか否か、即ち、異常終了LOGTBL104の「JOB_ID」項目と内容一致する項目がロールバック処理TBL103に記録されているか否かを検証し、異常終了LOGTBL104の「JOB_ID」項目と内容一致する項目がロールバック処理TBL103に記録されている場合はステップS27に進み、異常終了LOGTBL104の「JOB_ID」項目と内容一致する項目がロールバック処理TBL103に記録されていない場合はステップS37に移る(ステップS26)。
以下、ステップS27からステップS36の処理動作を説明するが、ここでは、異常終了LOGTBL104の「JOB_ID」項目と内容一致する項目がロールバック処理TBL103に記録されている場合であるため、更新系の処理であると判断してリランTBL105のレコード作成処理を行う。
まず、ステップS27では、リランTBL105の1件目のレコードがロールバックの処理対象となるように、リランTBL105の「処理順序」項目の内容を00とし、「枝番」項目の内容を00とする。
次に、リランTBL105の「前処理1」項目の内容を設定するが、このレコードがロールバック処理の対象レコードであり、OSはロールバック処理であることを認識できるので、ここでは、単にスペースを設定しておく(ステップS29)。
次に、リランTBL105の「前処理2」項目の内容を設定するが、このレコードがロールバック処理の対象レコードであるので、単にスペースを設定しておく(ステップS30)。
なお、このレコードがロールバック処理の対象レコードであることは、後述するステップS31の処理により、ロールバック処理TBL103の「JOB_ID」項目の内容(即ち、異常終了ジョブのJOB_ID)がリランTBL105の「JOB_ID」項目に記録されることで、OSは認識することができる。
次に、ロールバック処理TBL103の「JOB_ID」項目の内容を、リランTBL105の「JOB_ID」項目に記録する(ステップS31)。
次に、リランTBL105の「処理属性」項目の内容を設定するが、ステップS30の処理と同様の理由により、ここでは単にスペースを設定しておく(ステップS32)。
次に、リランTBL105の「処理の種類」項目の内容を設定するが、ステップS30の処理と同様の理由により、ここでは単にスペースを設定しておく(ステップS33)。
次に、リランTBL105の「期限設定」項目の内容を設定するが、ステップS30の処理と同様の理由により、ここでは単にスペースを設定しておく(ステップS34)。
次に、リランTBL105の「開始時間」項目の内容として、システム時間(=サーバの認識する処理時間)を設定する(ステップS35)。
次に、リランTBL105の「終了時間」項目の内容として、前記開始時間にロールバック処理TBL103の「処理時間」項目の内容を加算した時間を設定する(ステップS36)。
以下、ステップS27からステップS36の処理動作を説明するが、ここでは、異常終了LOGTBL104の各項目をリランTBL105のレコードに記録する処理が行われる。
まず、異常終了LOGTBL104の「JOB_ID」項目の内容をキーにして、ジョブ管理TBL101を検索する(ステップS37)。
次に、ジョブ管理TBL101の「リランポイント」項目が、同じくジョブ管理TBL101の「JOB_ID」項目と内容一致を示すレコードを検索する(ステップS38)。これにより、ジョブ管理TBL101におけるリランポイントが確定するので、ここから先の処理を実行させるために、以後、このリランポイントに該当するジョブ管理TBL101のレコードから、順次、ジョブ管理TBL101のレコードを、リランTBL105に取り込む。より具体的には、「処理順序」項目と「枝番」項目を使用して、順次、そのレコード位置を確定し、全てのレコードをリランTBL105のレコードとして追加する。これにより、リランTBL105には、リランポイントからの再処理すべき全てのジョブが組み込まれる。以下、ステップS39(図6)からステップS68(図7)までは、この組み込みのための処理動作を示すものである。
まず、ステップS39では、ステップS38の検索で合致を示すジョブ管理TBL101のレコードを読み込む。
次に、リランTBL105にレコードを1つ追加する(ステップS40)。
次に、ジョブ管理TBL101の前記読み込まれた先頭レコードの「処理順序」項目の内容を、リランTBL105の前記追加されたレコードの「処理順序」項目に記録する(ステップS41)。
次に、ジョブ管理TBL101の前記読み込まれた先頭レコードの「枝番」項目の内容を、リランTBL105の前記追加されたレコードの「枝番」項目に記録する(ステップS42)。
次に、ジョブ管理TBL101の前記読み込まれた先頭レコードの「前処理1」項目の内容を、リランTBL105の前記追加されたレコードの「前処理1」項目に記録する(ステップS43)。
次に、ジョブ管理TBL101の前記読み込まれた先頭レコードの「前処理2」項目の内容を、リランTBL105の前記追加されたレコードの「前処理2」項目に記録する(ステップS44)。
次に、ジョブ管理TBL101の前記読み込まれた先頭レコードの「JOB_ID」項目の内容を、リランTBL105の前記追加されたレコードの「JOB_ID」項目に記録する(ステップS45)。
次に、ジョブ管理TBL101の前記読み込まれた先頭レコードの「処理属性」項目の内容を、リランTBL105の前記追加されたレコードの「処理属性」項目に記録する(ステップS46)。
次に、ジョブ管理TBL101の前記読み込まれた先頭レコードの「処理の種類」項目の内容を、リランTBL105の前記追加されたレコードの「処理の種類」項目に記録する(ステップS47)。
次に、ジョブ管理TBL101の前記読み込まれた先頭レコードの「期限設定」項目の内容を、リランTBL105の前記追加されたレコードの「期限設定」項目に記録する(ステップS48)。
次に、リランTBL105の1件目のレコードの「処理順序」項目にゼロが記録されているか否かを検証することにより、ロールバック処理が存在するか否かを検証し、前記「処理順序」項目にゼロが記録されている場合はロールバック処理が存在する場合であるのでステップS50に進み、前記「処理順序」項目にゼロが記録されていない場合はロールバック処理が存在しない場合であるのでステップS51に移る(ステップS49)。
ここで、ロールバック処理が存在する場合は、既にステップS26の検証により、ロールバック処理が存在すると判定されており、ステップS27の処理により、前記「処理順序」項目にはゼロが記録されている。
ロールバック処理が存在する場合の処理として、ステップS50では、リランTBL105の前記1件目のレコードの「開始時間」項目として、システム時間に、ロールバック処理TBL103のリランポイントのロールバック処理時間を記録した「ロールバック処理時間」項目の内容を加算した結果を記録し、ステップS52に進む。
ここで、前記システム時間とは、サーバの認識する処理時間のことであるが、この場合はステップS35の処理により、同レコードの「開始時間」項目に記録されている。
一方、ロールバック処理が存在しない場合の処理として、ステップS51では、リランTBL105の前記1件目のレコードの「開始時間」項目としてシステム時間を記録し、ステップS52に移る。
ステップS52では、前記開始時間に、ジョブ管理TBL101の前記読み込まれた先頭レコードの「処理時間」項目の内容を加算した結果を、リランTBL105の前記追加されたレコードの「終了時間」項目に記録する。
次に、リランTBL105の前記1件目のレコードの「処理順序」項目及び「枝番」項目の内容に従って、正当な処理順序における次のレコード位置を求める(ステップS53)。
次に、ジョブ管理TBL101の前記レコード位置のレコードを読み込み、ステップS55に進む(ステップS54)。
ステップS55では、リランTBL105にレコードを1つ追加する。
次に、ジョブ管理TBL101の前記読み込まれた先頭レコードの「処理順序」項目の内容を、リランTBL105の前記追加されたレコードの「処理順序」項目に記録する(ステップS56)。
次に、ジョブ管理TBL101の前記読み込まれた先頭レコードの「枝番」項目の内容を、リランTBL105の前記追加されたレコードの「枝番」項目に記録する(ステップS57)。
次に、ジョブ管理TBL101の前記読み込まれた先頭レコードの「前処理1」項目の内容を、リランTBL105の前記追加されたレコードの「前処理1」項目に記録する(ステップS58)。
次に、ジョブ管理TBL101の前記読み込まれた先頭レコードの「前処理2」項目の内容を、リランTBL105の前記追加されたレコードの「前処理2」項目に記録する(ステップS59)。
次に、ジョブ管理TBL101の前記読み込まれた先頭レコードの「JOB_ID」項目の内容を、リランTBL105の前記追加されたレコードの「JOB_ID」項目に記録する(ステップS60)。
次に、ジョブ管理TBL101の前記読み込まれた先頭レコードの「処理属性」項目の内容を、リランTBL105の前記追加されたレコードの「処理属性」項目に記録する(ステップS61)。
次に、ジョブ管理TBL101の前記読み込まれた先頭レコードの「処理の種類」項目の内容を、リランTBL105の前記追加されたレコードの「処理の種類」項目に記録する(ステップS62)。
次に、ジョブ管理TBL101の前記読み込まれた先頭レコードの「期限設定」項目の内容を、リランTBL105の前記追加されたレコードの「期限設定」項目に記録する(ステップS63)。
次に、リランTBL105の1つ前のレコードの「終了時間」項目の内容を、リランTBL105の前記追加されたレコードの「開始時間」項目に記録する(ステップS64)。
次に、前記開始時間に、ジョブ管理TBL101の前記読み込まれた先頭レコードの「処理時間」項目の内容を加算した結果を、リランTBL105の前記追加されたレコードの「終了時間」項目に記録する(ステップS65)。
次に、リランTBL105の前記1件目のレコードの「処理順序」項目及び「枝番」項目の内容に従って、正当な処理順序における次のレコード位置を求める(ステップS66)。
次に、ジョブ管理TBL101の前記レコード位置のレコードを読み込む(ステップS67)。
次に、前記読み込まれたレコードは、アンカー(即ち、正規レコードの終了を示すダミーレコード)であるか否かを検証し、アンカーでなければステップS55に戻り、アンカーであればステップS69に進む(ステップS68)。
ステップS69では、作成したリランTBL105を再実行ジョブスタックと宣言する処理(作成したリランTBL105のアクセスアドレスを示すパラメータ設定等)を行って、メインルーチンの呼び出し元直後のステップに復帰する。
図8は、処理結果TBL作成処理部201が処理時間チェックサブルーチンによって実行する処理の流れを示すフローチャート図である。
まず、リランTBL105の各レコードを、先頭レコードから順に、最後のレコードまで読み込み、有意な「期限設定」項目が有るか否か(即ち、内容がスペースではない「期限設定」項目が有るか否か)を検証し、有意な「期限設定」項目が有るレコードを全て抽出する(ステップS70,ステップS71)。
次に、前記抽出した全てのレコードを対象に、「期限設定」項目の内容(時間)と、「終了時間」項目の内容とを比較し、処理終了時間が期限設定を超過するものについては、その旨を示すパラメータ値(ここでは4桁のオール9)を期限設定用のパラメータに設定して、メインルーチンの呼び出し元直後のステップに復帰する(ステップS72,ステップS73)。
なお、この期限設定用のパラメータに4桁のオール9が設定されて復帰した場合は、メインルーチン側では、障害復旧を行わない(図2のステップS06参照)。
図9は、リカバリ処理部205がリカバリ処理サブルーチンによって実行する処理の流れを示すフローチャート図である。
まず、異常終了LOGTBL104の「エラーコード」項目をキーにして、エラーTBL106を検索して該当するレコードを読み込む(ステップS74)。
次に、エラーTBL106の前記読み込まれたレコードの「JOB_ID」項目の内容をキーにして、ジョブ管理TBL101を検索する(ステップS75)。
次に、リランTBL105にレコードを追加し、必要項目のデータを記録しながら、検索されたジョブ管理TBL101のレコードの内容(より具体的には「JOB_ID」項目の内容)をリランTBL105前記追加されたレコードに記録する(ステップS75)。以下のステップ77〜ステップ86は、ステップS75の詳細ステップを示すものである。
まず、ステップS77では、リランTBL105の追加されたレコードの「処理順序」項目の内容を00とする。
次に、リランTBL105の追加されたレコードの「枝番」項目の内容を01とする(ステップS78)。
ステップS77とステップ78の処理により、リランTBL105の追加されたレコードの物理的な位置がリランTBL105の何処であっても(例えばラストであっても)、リランTBL105の処理に際して、または処理の前には、この追加されたレコードは、リランTBL105上で、ロールバック処理(ロールバック処理がある場合)のレコードと、通常のリラン処理の先頭レコードとの間に挿入される。
次に、リランTBL105の「前処理1」項目の内容を設定するが、このレコードが異常終了LOGTBL104のレコードであので、ここでは、単にスペースを設定しておく(ステップS79)。
次に、リランTBL105の「前処理2」項目の内容を設定するが、このレコードが異常終了LOGTBL104のレコードであので、ここでは、単にスペースを設定しておく(ステップS80)。
なお、このレコードが異常終了LOGTBL104のレコードであることは、後述するステップS81の処理により、ジョブ管理TBL101の「JOB_ID」項目の内容(即ち、異常終了ジョブのJOB_ID)がリランTBL105の「JOB_ID」項目に記録されることで、OSは認識することができる。
次に、ジョブ管理TBL101の「JOB_ID」項目の内容を、リランTBL105の「JOB_ID」項目に記録する(ステップS81)。
次に、リランTBL105の「処理属性」項目の内容を設定するが、ステップS80の処理と同様の理由により、ここでは単にスペースを設定しておく(ステップS82)。
次に、リランTBL105の「処理の種類」項目の内容を設定するが、ステップS80の処理と同様の理由により、ここでは単にスペースを設定しておく(ステップS83)。
次に、リランTBL105の「期限設定」項目の内容を設定するが、ステップS80の処理と同様の理由により、ここでは単にスペースを設定しておく(ステップS84)。
次に、リランTBL105の「開始時間」項目の内容を設定するが、ステップS80の処理と同様の理由により、ここでは単にスペースを設定しておく(ステップS85)。
次に、リランTBL105の「終了時間」項目の内容を設定するが、ステップS80の処理と同様の理由により、ここでは単にスペースを設定して、メインルーチンの呼び出し元直後のステップに復帰する(ステップS86)。
図10は、パラメータ作成処理部206がパラメータ作成サブルーチンによって実行する処理の流れを示すフローチャート図である。
リランTBLが実行されるように、ジョブスケジュールシステムの仕様に合わせて、パラメータとして用意されているファイル(パラメータファイル)に出力し、メインルーチンの呼び出し元直後のステップに復帰する(ステップS87)。
ここで、パラメータファイルのフォーマットは、ジョブスケジュールシステム(即ち既存システム)に適合させてカスタマイズするものとする。
なお、このパラメータファイルが、ジョブスケジュールシステムに示された時に、ジョブスケジュールシステムが、このパラメータファイルに格納されたジョブスタックを実行するように、ジョブスケジュールシステムの仕様についても、多少の変更を行うものとする。
図11は、エラーが発生する場合の処理過程の1例を示すシーケンスチャート図である。
同図では、業務TBLを伴う業務処理において、この業務処理が最終的に異常終了となるまでの処理(符号J01〜J12で示される処理)の流れを例示している。この処理では、多重実行が行われている。
以下、符号J01〜J12で示される処理例について順に説明する。
ステップ1の処理J01は、バックアップ処理(JOB_ID:X)であり、符号T01の業務TBL(A)の内容を符号T02のバックアップTBLにコピーする。
ステップ2の処理J02は、符号T01の業務TBL(A)の更新処理(JOB_ID:A)である。
ステップ3の処理J03は、符号T01の業務TBL(A)の検索処理(JOB_ID:B)である。また、処理J04は、符号T01の業務TBL(A)の検索処理(JOB_ID:C)である。
以下、出力系の処理にデータを引き継ぐ。
ステップ4の処理J05は、符号T01の業務TBL(A)の更新処理(JOB_ID:D)である。また、処理J06は、符号T01の業務TBL(A)の検索処理(JOB_ID:E)であり、符号T01の業務TBL(A)を検索して、帳票出力処理とファイル出力処理にデータを引き継ぐ。
ステップ5の処理J07は、符号T01の業務TBL(A)の検索処理(JOB_ID:F)である。また、処理J08は、符号T01の業務TBL(A)の検索処理(JOB_ID:G)であり、符号T01の業務TBL(A)を検索して、符号F01のファイルへ出力する処理を行なう。さらに、処理J09は、符号T01の業務TBL(A)の検索処理(JOB_ID:H)であり、符号T01の業務TBL(A)を検索して、符号L01の帳票ファイルへの出力処理を行なう。
ステップ6の処理J10は、符号T01の業務TBL(A)の更新処理(JOB_ID:I)である。ここでは、この更新処理の途中で異常終了した場合を示している。また、処理J10の処理で参照している符号T02の業務TBL(B)にエラー原因が有る場合を示している。
図12は、異常終了した場合の処理をリランポイントから自動復旧させるリラン処理の1例を示すシーケンスチャート図である。
以下、符号J20〜J30で示されるリラン処理の実行過程の1例について順に説明する。
同図に示すリラン処理の実行過程の1例は、図11に示す処理過程をリラン処理する場合を示している。
ステップ7の処理J20は、リカバリ処理(JOB_ID:Z)であり、符号T03の業務TBL(B)のエラー原因を取り除く。
ステップ8の処理J21は、リストア処理(JOB_ID:Y)であり、符号T02のバックアップTBLから符号T01の業務TBL(A)をリストアする。
ステップ9の処理J22は、符号T01の業務TBL(A)の更新処理である。
ステップ10の処理J23は、符号T01の業務TBL(A)の検索処理(JOB_ID:B)である。また、処理J24は、符号T01の業務TBL(A)の検索処理(JOB_ID:C)である。
以下、出力系の処理にデータを引き継ぐ。
ステップ11の処理J25は、符号T01の業務TBL(A)の更新処理(JOB_ID:D)である。また、処理J26は、符号T01の業務TBL(A)の検索処理(JOB_ID:E)であり、符号T01の業務TBL(A)を検索して、帳票出力処理とファイル出力処理にデータを引き継ぐ。
ステップ12の処理J27は、符号T01の業務TBL(A)の検索処理(JOB_ID:F)である。また、処理J28は、符号T01の業務TBL(A)の検索処理(JOB_ID:G)であり、符号T01の業務TBL(A)を検索して、符号L01の帳票ファイルを上書きする。さらに、処理J29は、符号T01の業務TBL(A)の検索処理(JOB_ID:H)であり、符号T01の業務TBL(A)を検索して、符号F02の帳票への出力処理を行なう(なお、符号F01のファイルの記録は、そのまま残る)。
ステップ13の処理J30は、符号T01の業務TBL(A)の更新処理(JOB_ID:I)であるが、この更新処理に際しては、ステップ7の処理J20においてリカバリ処理済にされた符号T03の業務TBL(B)の記録を参照する。
なお、図13に例示するジョブ管理TBLから図18に示すエラーTBLに渡る各TBLの構成において、項目サンプルXXのデータは、図11と図12に例示する処理過程に基づいて作成されている。
図13は、ジョブ管理TBL101の1構成例を示す構成図である。
同図に例示するジョブ管理TBL101には、サンプル1〜11についてのデータ項目として、処理(ジョブ)の処理順序を示す「処理順序」、処理順序の詳細を示す「枝番」、前処理のJOB_IDを示す「前処理1」、2つ目の前処理のJOB_IDを示す「前処理2」、処理の一意な識別名(キー)を示す「JOB_ID」、処理の日本語名称を示す「JOB名称」、処理の属性(更新処理/検索処理等の区別)を示す「処理属性」、処理の種類(バックアップ処理、更新処理、検索処理、出力処理等)を示す「処理の種類」、処理の時間的な期限を示す「期限設定」、リランポイントのJOB_IDを示す「リランポイント」、処理の実行時間(予定)を示す「処理時間(分)」等の各項目が設けられている。
図14は、処理結果TBL102の1構成例を示す構成図である。
同図に例示する処理結果TBL102には、サンプル1〜10についてのデータ項目として、システム(コンピュータシステム)の実行順序を示す「要求ID」、ジョブの一意な識別名(キー)を示す「JOB_ID」、ジョブの処理結果(例えばエラー時の状態)を示す「JOBステータス」項目、ジョブの開始時間(実行開始された時刻)を示す「開始時間」、ジョブの終了時間(終了された時刻)を示す「終了時間」等の各項目が設けられている。
図15は、ロールバック処理TBL103の1構成例を示す構成図である。
同図に例示するロールバック処理TBL103には、サンプル1〜3についてのデータ項目として、復元(ロールバック)処理の一意な識別名(キー)を示す「JOB_ID」、リランポイントのJOB_IDを示す「リランポイント」、ジョブの実行時間(予定)を示す「処理時間(分)」等の各項目が設けられている。
図16は、異常終了LOGTBL104の1構成例を示す構成図である。
同図に例示する異常終了LOGTBL14には、サンプル1についてのデータ項目として、異常終了処理(異常終了ジョブ)の一意な識別名(キー)を示す「JOB_ID」、エラーの状態を示す「エラーステータス」、エラー詳細をコード分類する「エラーコード」、エラーの詳細な内容を示す「エラー詳細」等の各項目が設けられている。
図17は、リランTBL105の1構成例を示す構成図である。
同図に例示するリランTBL105には、サンプル1〜11についてのデータ項目として、再実行する処理(ジョブ)の処理順序を示す「処理順序」、処理順序の詳細を示す「枝番」、前処理のJOB_IDを示す「前処理1」、2つ目の前処理のJOB_IDを示す「前処理2」、再実行する処理の一意な識別名(キー)を示す「JOB_ID」、再実行する処理の日本語名称を示す「JOB名称」、再実行する処理の属性(更新処理/検索処理等の区別)を示す「処理属性」、処理の種類(バックアップ処理、更新処理、検索処理、出力処理等)を示す「処理の種類」、再実行する処理の時間的な期限を示す「期限設定」、再実行する処理の開始時間(予定時刻)を示す「開始時間」、再実行する処理の終了時間(終了された時刻)を示す「終了時間」等の各項目が設けられている。
図18は、エラーTBL106の1構成例を示す構成図である。
同図に例示するエラーTBL106には、サンプル1についてのデータ項目として、エラー詳細をコード分類して示す「エラーステータス」、エラーの詳細な内容を分類して示す「エラー詳細」、エラー詳細をコード分類する「エラーコード」、エラー対応処理の一意な識別名(キー)を示す「JOB_ID」、等の各項目が設けられている。
なお、本発明に係るバッチ処理の障害復旧方法を実行するシステムの各構成要素による処理の少なくとも一部をコンピュータ制御により実行するものとし、かつ、上記処理を、図2〜10のフローチャートで示した手順によりコンピュータに実行せしめるプログラムは、半導体メモリを始め、CD−ROMや磁気テープなどのコンピュータ読み取り可能な記録媒体に格納して配付してもよい。そして、少なくともマイクロコンピュータ、パーソナルコンピュータ、汎用コンピュータを範疇に含むコンピュータが、上記の記録媒体から上記プログラムを読み出して、実行するものとしてもよい。
本発明のバッチ処理の障害復旧方法及び障害復旧システムは、図1等に示すように、コンピュータのCPU、メモリ、補助記憶装置、入力デバイス等を含むハードウェア資源上に構築されたOS、アプリケーション、データベース、ネットワークシステム等によって実現されるものであり、バッチ処理における障害復旧処理という情報処理が上記のハードウェア資源を用いて具体的に実現されるものであるから、自然法則を利用した技術的思想に該当するものであり、コンピュータ産業等において利用することができるものである。
本発明の実施形態に係るバッチ処理の障害復旧方法が実行されるコンピュータシステムの全体構成を示す構成図である。 本実施形態のバッチ処理の障害復旧方法を実現するコンピュータシステムの全体動作を示すフローチャート図である。 処理結果TBL作成処理部201が処理結果TBL作成サブルーチンによって実行する処理の流れを示すフローチャート図である。 異常終了LOGTBL作成処理部202が処理結果TBL作成サブルーチンによって実行する処理の流れを示すフローチャート図である。 リランスケジュール処理部203がスケジュール表作成サブルーチンによって実行する処理の流れを示すフローチャート図(1/3)である。 リランスケジュール処理部203がスケジュール表作成サブルーチンによって実行する処理の流れを示すフローチャート図(2/3)である。 リランスケジュール処理部203がスケジュール表作成サブルーチンによって実行する処理の流れを示すフローチャート図(3/3)である。 処理結果TBL作成処理部201が処理時間チェックサブルーチンによって実行する処理の流れを示すフローチャート図である。 リカバリ処理部205がリカバリ処理サブルーチンによって実行する処理の流れを示すフローチャート図である。 パラメータ作成処理部206がパラメータ作成サブルーチンによって実行する処理の流れを示すフローチャート図である。 エラーが発生する場合の処理過程の1例を示すシーケンスチャート図である。 異常終了した場合の処理をリランポイントから自動復旧させるリラン処理の1例を示すシーケンスチャート図である。 ジョブ管理TBL101の1構成例を示す構成図である。 処理結果TBL102の1構成例を示す構成図である。 ロールバック処理TBL103の1構成例を示す構成図である。 異常終了LOGTBL104の1構成例を示す構成図である。 リランTBL105の1構成例を示す構成図である。 エラーTBL106の1構成例を示す構成図である。
符号の説明
101 ジョブ管理TBL(データベース)
102 処理結果TBL
103 ロールバック処理TBL
104 異常終了LOGTBL
105 リランTBL
106 エラーTBL
201 処理結果TBL作成処理部
202 異常終了LOGTBL作成処理部
203 リランスケジュール処理部
204 処理時間チェック処理部
205 リカバリ処理部
206 パラメータ作成処理部
301 実行結果
302 再実行指示
J01〜J30 処理(ジョブ)
T01〜T03 データベース
F01〜F02 処理結果の出力ファイル
L01〜L02 処理結果の出力帳票ファイル

Claims (4)

  1. コンピュータシステムにおいてバッチ処理の障害復旧を行うシステムであって、
    ジョブの実行結果情報を取得して実行結果ファイルに記録する実行結果取得手段と、
    前記実行結果情報のうち異常終了となっているジョブの実行結果情報を取得して異常終了結果ファイルに記録する異常終了結果取得手段と、
    前記異常終了となっているジョブの再実行ポイントからのジョブ制御情報を、再実行処理用のジョブ制御情報として、再実行処理ファイルに記録するスケジューリング手段と、
    前記異常終了となっているジョブについて、前記再実行処理ファイルに記録されたジョブ制御情報に基づいて再実行処理用のジョブを実行させる再実行指示手段と、
    を備えたことを特徴とするバッチ処理の障害復旧システム。
  2. 前記再実行処理用のジョブ制御情報に対応するジョブの実行時間の総和を求めると共に、前記総和が予め設定された処理の期限を超過する場合は、前記再実行用のジョブを実行させないように制御する手段をさらに備えたことを特徴とする請求項1記載のバッチ処理の障害復旧システム。
  3. 前記再実行処理用のジョブ制御情報で示されるジョブに先立って実行されるべき、前記異常終了ジョブに対応するリカバリジョブのジョブ制御情報を、予めエラー情報が記録されたエラー情報用のファイルを検索して抽出すると共に、前記リラン処理用のファイルに組み込むリカバリ処理手段をさらに備えたことを特徴とする請求項1または請求項2記載のバッチ処理の障害復旧システム。
  4. ジョブの実行結果情報を取得する手段と、異常終了したジョブの再実行ポイントに関するジョブ制御情報を取得する手段と、実行結果情報及びジョブ制御情報を記憶する手段と、ジョブ制御情報に基づいてジョブの再実行を制御する手段とを有するコンピュータシステムにおいてバッチ処理の障害復旧を行う方法であって、
    ジョブの実行結果情報を取得し、
    前記実行結果情報から異常終了したジョブを検出し、当該異常終了ジョブのジョブ制御情報を取得し、
    前記ジョブ制御情報に基づいて、当該異常終了ジョブを再実行させることを特徴とするバッチ処理の障害復旧方法。
JP2007053323A 2007-03-02 2007-03-02 バッチ処理の障害復旧方法及び障害復旧システム Withdrawn JP2008217367A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007053323A JP2008217367A (ja) 2007-03-02 2007-03-02 バッチ処理の障害復旧方法及び障害復旧システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007053323A JP2008217367A (ja) 2007-03-02 2007-03-02 バッチ処理の障害復旧方法及び障害復旧システム

Publications (1)

Publication Number Publication Date
JP2008217367A true JP2008217367A (ja) 2008-09-18

Family

ID=39837335

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007053323A Withdrawn JP2008217367A (ja) 2007-03-02 2007-03-02 バッチ処理の障害復旧方法及び障害復旧システム

Country Status (1)

Country Link
JP (1) JP2008217367A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011103030A (ja) * 2009-11-10 2011-05-26 Hitachi Ltd インシデント管理方法および運用管理サーバ

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011103030A (ja) * 2009-11-10 2011-05-26 Hitachi Ltd インシデント管理方法および運用管理サーバ

Similar Documents

Publication Publication Date Title
KR101556435B1 (ko) 데이터베이스 백업본 복구 방법 및 그 장치
US20120296878A1 (en) File set consistency verification system, file set consistency verification method, and file set consistency verification program
CN106844102B (zh) 数据恢复方法和装置
JP6342070B2 (ja) ジョブ管理装置及びジョブ管理方法及びジョブ管理プログラム
US6279117B1 (en) Recovery support method for recovering from failure of an external storage device
CN110795287A (zh) 数据恢复方法、系统、电子设备及计算机存储介质
US20050262033A1 (en) Data recording apparatus, data recording method, program for implementing the method, and program recording medium
JP2008217367A (ja) バッチ処理の障害復旧方法及び障害復旧システム
CN115437818A (zh) VxWorks系统启动失败的自动修复方法、系统、存储介质及设备
JP5231035B2 (ja) ジョブ処理システムおよびジョブ処理方法
US20040064784A1 (en) Document management system, method and computer program
CN106293897B (zh) 组件自动化调度系统
JP2001005693A (ja) 障害自動復旧システム、障害自動復旧方法および障害自動復旧用プログラムを記録した記録媒体
JP2008234142A (ja) バッチ処理回復方法とシステムおよびプログラム
JP3613077B2 (ja) データベース復旧方式およびそのプログラム記録媒体
JP2005267036A (ja) トレース出力制御方法およびトレースシステム
JP2009181498A (ja) ジョブ処理システムおよびジョブ処理方法
JP2006293582A (ja) ジョブ自動リランシステム
CN113590387A (zh) 一种数据库的控制文件的恢复方法及存储介质
JP2005149106A (ja) バックアップシステム及びバックアップ運用制御プログラム
JPH02159646A (ja) データベースのデータ保全方式
JP2000315190A (ja) ジョブのリカバリ方式
JPH10240596A (ja) コンピュータシステムのデータ回復方式、データ回復方 法およびデータ回復プログラムを記録した記録媒体
JP3189804B2 (ja) データバックアップ方法および装置
CN115357429A (zh) 恢复数据文件的方法、装置和客户端

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20100511