JPH0644198A - ジョブチェックポイント再開方式 - Google Patents
ジョブチェックポイント再開方式Info
- Publication number
- JPH0644198A JPH0644198A JP4169790A JP16979092A JPH0644198A JP H0644198 A JPH0644198 A JP H0644198A JP 4169790 A JP4169790 A JP 4169790A JP 16979092 A JP16979092 A JP 16979092A JP H0644198 A JPH0644198 A JP H0644198A
- Authority
- JP
- Japan
- Prior art keywords
- checkpoint
- information
- job
- execution
- file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Retry When Errors Occur (AREA)
- Multi Processors (AREA)
Abstract
(57)【要約】
【目的】複数のホストコンピュータに接続される共有装
置にチェックポイント情報を出力し、ホスト間でのジョ
ブの再開を可能にする。 【構成】各ホストコンピュータH1,〜Hnは、共有装
置Kに接続する。共有装置Kのチェックポイントファイ
ルF2は、実行中のジョブのチェックポイント情報を格
納する。チェックポイント情報採取手段11は、実行プ
ログラム10の実行情報をチェックポイント情報として
採取する。チェックポイント情報復旧手段21は、実行
プログラム20の状態をチェックポイント情報を採取し
た時点の状態に復旧して実行を再開する。 【効果】ホスト間でのジョブチェックポイントの採取お
よび再開が可能になることにより、柔軟なジョブスケジ
ューリングが可能になる。
置にチェックポイント情報を出力し、ホスト間でのジョ
ブの再開を可能にする。 【構成】各ホストコンピュータH1,〜Hnは、共有装
置Kに接続する。共有装置Kのチェックポイントファイ
ルF2は、実行中のジョブのチェックポイント情報を格
納する。チェックポイント情報採取手段11は、実行プ
ログラム10の実行情報をチェックポイント情報として
採取する。チェックポイント情報復旧手段21は、実行
プログラム20の状態をチェックポイント情報を採取し
た時点の状態に復旧して実行を再開する。 【効果】ホスト間でのジョブチェックポイントの採取お
よび再開が可能になることにより、柔軟なジョブスケジ
ューリングが可能になる。
Description
【0001】
【産業上の利用分野】本発明は、ジョブチェックポイン
ト再開方式に関し、特に、素結合多重ホストシステムに
おけるジョブチェックポイント再開方式に関する。
ト再開方式に関し、特に、素結合多重ホストシステムに
おけるジョブチェックポイント再開方式に関する。
【0002】
【従来の技術】近年、コンピュータシステムが大規模化
および多様化しており、コンピュータシステムを構成す
るホストコンピュータの構成およびジョブの運用が複雑
化している状況にある。
および多様化しており、コンピュータシステムを構成す
るホストコンピュータの構成およびジョブの運用が複雑
化している状況にある。
【0003】従来のジョブチェックポイント再開方式で
は、チェックポイントファイルは、ホストコンピュータ
間で共有できず、複数のホストコンピュータにまたがっ
たジョブに対するチェックポイントの採取および再開が
不可能であった。
は、チェックポイントファイルは、ホストコンピュータ
間で共有できず、複数のホストコンピュータにまたがっ
たジョブに対するチェックポイントの採取および再開が
不可能であった。
【0004】このために、ジョブチェックポイント採取
時に、自動的に再開することが不可能であり、ジョブの
再開は、操作員の操作を介して行われていた。
時に、自動的に再開することが不可能であり、ジョブの
再開は、操作員の操作を介して行われていた。
【0005】
【発明が解決しようとする課題】近年、コンピュータシ
ステムが大規模化および多様化しており、コンピュータ
システムを構成するホストコンピュータの構成およびジ
ョブの運用が複雑化している状況にあって、上述した従
来のジョブチェックポイント再開方式では、複数のホス
トコンピュータにまたがったジョブチェックポイントの
採取および自動的なジョブの再開という柔軟な運用が不
可能であった。
ステムが大規模化および多様化しており、コンピュータ
システムを構成するホストコンピュータの構成およびジ
ョブの運用が複雑化している状況にあって、上述した従
来のジョブチェックポイント再開方式では、複数のホス
トコンピュータにまたがったジョブチェックポイントの
採取および自動的なジョブの再開という柔軟な運用が不
可能であった。
【0006】本発明の目的は、チェックポイント情報を
複数のホストコンピュータで共有する装置上に出力し、
出力されたチェックポイント情報をもとにジョブを再開
する素結合多重ホストシステムにおけるジョブチェック
ポイント再開方式を提供することにある。
複数のホストコンピュータで共有する装置上に出力し、
出力されたチェックポイント情報をもとにジョブを再開
する素結合多重ホストシステムにおけるジョブチェック
ポイント再開方式を提供することにある。
【0007】
【課題を解決するための手段】第1の発明のジョブチェ
ックポイント再開方式は、複数のホストコンピュータ
と、前記ホストコンピュータの各々に接続される共有装
置とを有する素結合多重ホストシステムのジョブチェッ
クポイント再開方式において、前記共有装置上に実行中
のジョブのスプール情報を格納するスプールファイル
と、前記共有装置上に実行中のジョブのチェックポイン
ト情報を格納するチェックポイントファイルと、前記共
有装置上に実行プログラムおよびその実行プログラムで
使用するデータ等を格納するユーザファイルと、実行中
の実行プログラムの実行情報を前記チェックポイントフ
ァイルに出力する実行情報退避手段と、実行中の実行プ
ログラムが使用しているファイルの使用情報を前記チェ
ックポイントファイルに出力するファイル情報退避手段
と、実行プログラムから引用されて、前記実行情報退避
手段および前記ファイル情報退避手段を用いて、その実
行プログラムの実行情報をチェックポイント情報として
採取するチェックポイント情報採取手段とを具備し、素
結合多重ホストシステムで実行中の実行プログラムのチ
ェックポイント情報を前記共有装置上の前記チェックポ
イントファイルに入力することにより、実行プログラム
の中断を可能とすることにより構成されている。
ックポイント再開方式は、複数のホストコンピュータ
と、前記ホストコンピュータの各々に接続される共有装
置とを有する素結合多重ホストシステムのジョブチェッ
クポイント再開方式において、前記共有装置上に実行中
のジョブのスプール情報を格納するスプールファイル
と、前記共有装置上に実行中のジョブのチェックポイン
ト情報を格納するチェックポイントファイルと、前記共
有装置上に実行プログラムおよびその実行プログラムで
使用するデータ等を格納するユーザファイルと、実行中
の実行プログラムの実行情報を前記チェックポイントフ
ァイルに出力する実行情報退避手段と、実行中の実行プ
ログラムが使用しているファイルの使用情報を前記チェ
ックポイントファイルに出力するファイル情報退避手段
と、実行プログラムから引用されて、前記実行情報退避
手段および前記ファイル情報退避手段を用いて、その実
行プログラムの実行情報をチェックポイント情報として
採取するチェックポイント情報採取手段とを具備し、素
結合多重ホストシステムで実行中の実行プログラムのチ
ェックポイント情報を前記共有装置上の前記チェックポ
イントファイルに入力することにより、実行プログラム
の中断を可能とすることにより構成されている。
【0008】第2の発明のジョブチェックンポイント再
開方式は、複数のホストコンピュータと、前記ホストコ
ンピュータの各々に接続される共有装置とを有する素結
合多重ホストシステムのジョブチェックホイント再開方
式において、前記共有装置上に実行中のジョブのスプー
ル情報を格納するスプールファイルと、前記共有装置上
に実行中のジョブのチェックポイント情報を格納するチ
ェックポイントファイルと、前記共有装置上に実行プロ
グラムおよびその実行プログラムで使用するデータ等を
格納するユーザファイルと、前記スプールファイルスの
プール情報および前記チェックンポイントファイルに格
納されている実行プログラムの実行情報並びに前記ユー
ザファイルに格納されている実行プログラムをもとにし
て、実行プログラムの状態をチェックポイント採取時の
状態に復旧する実行情報復旧手段と、前記チェックポイ
ントファイルに格納されている実行プログラムの使用し
ていたファイルの使用情報をもとにして、実行プログラ
ムの使用するファイルの状態をチェックポイント採取時
の状態に復旧するファイル情報復旧手段と、前記実行情
報復旧手段および前記ファイル情報復旧手段を用いて、
チェックポイントを採取した実行プログラムの状態をチ
ェックンポイントを採取した時点の状態に復旧して、実
行プログラムの実行を再開するチェックポイント情報復
旧手段とを具備し、素結合多重ホストシステムで前記共
有装置上の前記チェックポイントファイルに出力された
チェックポイント情報をもとにして、ジョブの実行を再
開することにより構成されている。
開方式は、複数のホストコンピュータと、前記ホストコ
ンピュータの各々に接続される共有装置とを有する素結
合多重ホストシステムのジョブチェックホイント再開方
式において、前記共有装置上に実行中のジョブのスプー
ル情報を格納するスプールファイルと、前記共有装置上
に実行中のジョブのチェックポイント情報を格納するチ
ェックポイントファイルと、前記共有装置上に実行プロ
グラムおよびその実行プログラムで使用するデータ等を
格納するユーザファイルと、前記スプールファイルスの
プール情報および前記チェックンポイントファイルに格
納されている実行プログラムの実行情報並びに前記ユー
ザファイルに格納されている実行プログラムをもとにし
て、実行プログラムの状態をチェックポイント採取時の
状態に復旧する実行情報復旧手段と、前記チェックポイ
ントファイルに格納されている実行プログラムの使用し
ていたファイルの使用情報をもとにして、実行プログラ
ムの使用するファイルの状態をチェックポイント採取時
の状態に復旧するファイル情報復旧手段と、前記実行情
報復旧手段および前記ファイル情報復旧手段を用いて、
チェックポイントを採取した実行プログラムの状態をチ
ェックンポイントを採取した時点の状態に復旧して、実
行プログラムの実行を再開するチェックポイント情報復
旧手段とを具備し、素結合多重ホストシステムで前記共
有装置上の前記チェックポイントファイルに出力された
チェックポイント情報をもとにして、ジョブの実行を再
開することにより構成されている。
【0009】一方、第3の発明のジョブチェックポイン
ト再開方式は、第1,2の発明のジョブチェックポイン
ト再開方式において、実行中の実行プログラムに割り当
てられた使用可能なCPU使用時間の超過を検出するC
PU使用制限検出手段を具備し、CPU使用時間の超過
時に、自動的にチェックポイント情報を採取することに
より構成されている。
ト再開方式は、第1,2の発明のジョブチェックポイン
ト再開方式において、実行中の実行プログラムに割り当
てられた使用可能なCPU使用時間の超過を検出するC
PU使用制限検出手段を具備し、CPU使用時間の超過
時に、自動的にチェックポイント情報を採取することに
より構成されている。
【0010】他方、第4の発明のジョブチェックポイン
ト再開方式は、第1,2の発明のジョブチェックポイン
ト再開方式において、実行中の実行プログラムに割り当
てられた使用可能な実行経過時間の超過を検出する実行
経過時間制限検出手段を具備し、実行経過時間の超過時
に、自動的にチェックポイント情報を採取することによ
り構成されている。
ト再開方式は、第1,2の発明のジョブチェックポイン
ト再開方式において、実行中の実行プログラムに割り当
てられた使用可能な実行経過時間の超過を検出する実行
経過時間制限検出手段を具備し、実行経過時間の超過時
に、自動的にチェックポイント情報を採取することによ
り構成されている。
【0011】次に、第5の発明のジョブチェックポイン
ト再開方式は、第1,2の発明のジョブチェックポイン
ト再開方式において、実行中の実行プログラムに割り当
てられた使用可能な入出力回数の超過を検出する入出力
回数制限検出手段を具備し、入出力回数超過時に、自動
的にチェックンポイント情報を採取することにより構成
されている。
ト再開方式は、第1,2の発明のジョブチェックポイン
ト再開方式において、実行中の実行プログラムに割り当
てられた使用可能な入出力回数の超過を検出する入出力
回数制限検出手段を具備し、入出力回数超過時に、自動
的にチェックンポイント情報を採取することにより構成
されている。
【0012】また、第6の発明のジョブチェックポイン
ト再開方式は、第1,2発明のジョブチェックポイント
再開方式において、外部から実行中の実行プログラムに
対するチェックポイントの採取要求を受け付けるチェッ
クポイント採取要求受付手段を具備し、外部からのチェ
ックポイントの採取要求の発生時に、自動的にチェック
ポイント情報を採取することにより構成されている。
ト再開方式は、第1,2発明のジョブチェックポイント
再開方式において、外部から実行中の実行プログラムに
対するチェックポイントの採取要求を受け付けるチェッ
クポイント採取要求受付手段を具備し、外部からのチェ
ックポイントの採取要求の発生時に、自動的にチェック
ポイント情報を採取することにより構成されている。
【0013】さらに、第7の発明のジョブチェックポイ
ント再開方式は、第2,〜6の発明のジョブチェックン
ポイント再開方式において、ジョブチェックポイントの
採取時にチェックポイント情報を採取した実行プログラ
ムの実行可能なホストコンピュータを検索するホストス
ケジュール手段と、該実行プログラムが実行可能な前記
ホストコンピュータが存在する場合に、その前記ホスト
コンピュータに該実行プログラムの実行要求を行う他ホ
スト実行要求手段と、前記他ホスト実行要求手段からの
実行要求を受け付けて、請求項2記載のチェックポイン
ト情報復旧手段にジョブの再開要求を行うジョブ再実行
手段とを具備し、チェックポイント採取時に、自動的に
実行可能な前記ホストコンピュータでジョブの再開を行
うことにより構成されている。
ント再開方式は、第2,〜6の発明のジョブチェックン
ポイント再開方式において、ジョブチェックポイントの
採取時にチェックポイント情報を採取した実行プログラ
ムの実行可能なホストコンピュータを検索するホストス
ケジュール手段と、該実行プログラムが実行可能な前記
ホストコンピュータが存在する場合に、その前記ホスト
コンピュータに該実行プログラムの実行要求を行う他ホ
スト実行要求手段と、前記他ホスト実行要求手段からの
実行要求を受け付けて、請求項2記載のチェックポイン
ト情報復旧手段にジョブの再開要求を行うジョブ再実行
手段とを具備し、チェックポイント採取時に、自動的に
実行可能な前記ホストコンピュータでジョブの再開を行
うことにより構成されている。
【0014】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。図1は、素結合多重ホストシステムにおけ
る本発明のジョブチェックポイント再開方式の一実施例
を示すブロック図である。図1に示すように、本実施例
は、ホストコンピュータH1,〜Hnと、各ホストコン
ピュータに接続される共有装置Kとを有している。
て説明する。図1は、素結合多重ホストシステムにおけ
る本発明のジョブチェックポイント再開方式の一実施例
を示すブロック図である。図1に示すように、本実施例
は、ホストコンピュータH1,〜Hnと、各ホストコン
ピュータに接続される共有装置Kとを有している。
【0015】そして、共有装置K上には、実行ジョブの
スプール情報を格納するスプールファイルF1と、実行
中のジョブのチェックポイント情報を格納するチェック
ポイントファイルF2と、実行プログラムおよび該実行
プログラムで使用するデータ等を格納するユーザファイ
ルF3とがある。
スプール情報を格納するスプールファイルF1と、実行
中のジョブのチェックポイント情報を格納するチェック
ポイントファイルF2と、実行プログラムおよび該実行
プログラムで使用するデータ等を格納するユーザファイ
ルF3とがある。
【0016】また、ホストコンピュータH1は、実行中
の実行プログラム10の実行情報をチェックポイントフ
ァイルF2に出力する。実行情報退避手段12と、実行
中の実行プログラム10の使用しているファイルの使用
情報をチェックポイントファイルF2に出力するファイ
ル情報退避手段13と、実行プログラム10から引用さ
れて、実行情報退避手段12およびファイル情報退避手
段13を用いて、実行プログラム10の実行情報をチェ
ックポイント情報として採取するチェックポイント情報
採取手段11とを有している。
の実行プログラム10の実行情報をチェックポイントフ
ァイルF2に出力する。実行情報退避手段12と、実行
中の実行プログラム10の使用しているファイルの使用
情報をチェックポイントファイルF2に出力するファイ
ル情報退避手段13と、実行プログラム10から引用さ
れて、実行情報退避手段12およびファイル情報退避手
段13を用いて、実行プログラム10の実行情報をチェ
ックポイント情報として採取するチェックポイント情報
採取手段11とを有している。
【0017】一方、ホストコンピュータH2は、スプー
ルファイルF1のスプール情報およびチェックポイント
ファイルF2に格納されている実行プログラム10の実
行情報並びにユーザファイルF3に格納されている実行
プログラム10をもとにして、実行プログラム20の状
態をチェックポイント採取時の状態に復旧する実行情報
復旧手段22と、チェックポイントファイルF2に格納
されている実行プログラム10の使用していたファイル
の情報をもとにして、実行プログラム20の使用するフ
ァイルの状態をチェックポイント採取時の状態に復旧す
るファイル情報復旧手段23と、実行情報復旧手段22
およびファイル情報復旧手段23を用いて、チェックポ
イントを採取した実行プログラム20の状態をチェック
ポイントを採取した時点の状態に復旧して実行プログラ
ム10の実行を再開するチェックポイント情報復旧手段
21とを有している。
ルファイルF1のスプール情報およびチェックポイント
ファイルF2に格納されている実行プログラム10の実
行情報並びにユーザファイルF3に格納されている実行
プログラム10をもとにして、実行プログラム20の状
態をチェックポイント採取時の状態に復旧する実行情報
復旧手段22と、チェックポイントファイルF2に格納
されている実行プログラム10の使用していたファイル
の情報をもとにして、実行プログラム20の使用するフ
ァイルの状態をチェックポイント採取時の状態に復旧す
るファイル情報復旧手段23と、実行情報復旧手段22
およびファイル情報復旧手段23を用いて、チェックポ
イントを採取した実行プログラム20の状態をチェック
ポイントを採取した時点の状態に復旧して実行プログラ
ム10の実行を再開するチェックポイント情報復旧手段
21とを有している。
【0018】さらに、ホストコンピュータH1は、実行
中の実行プログラム10の割り当てられた使用可能なC
PU使用時間の超過を検出するCPU使用制限検出手段
30と、実行中の実行プログラム10の割り当てられた
使用可能な実行経過時間の超過を検出する実行経過時間
制限検出手段31と、実行中の実行プログラム10の割
り当てられた使用可能な入出力回数の超過を検出する入
出力回数制限検出手段32と、外部からの実行中の実行
プログラム10に対するチェックポイントの取得要求を
受け付けるチェックポイント採取要求受付手段33とを
有するとともに、CPU使用制限検出手段30,実行経
過時間制限検出手段31,入出力回数制限検出手段32
またはチェックポイント採取要求受付手段33の何れか
一つのジョブチェックポイント採取時に、チェックポイ
ント情報を採取した実行プログラム10の実行可能なホ
ストコンピュータを検索するホストスケジュール手段4
0と、実行プログラム10が実行可能なホストコンピュ
ータが存在する場合に、該ホストコンピュータに該実行
プログラム10の実行要求を行う他ホスト実行要求手段
41とを有しており、ホストコンピュータH2は、他ホ
スト実行要求手段41からの実行要求を受け付けて、チ
ェックポイント情報復旧手段21にジョブの再開要求を
行うジョブ再実行手段42を有している。
中の実行プログラム10の割り当てられた使用可能なC
PU使用時間の超過を検出するCPU使用制限検出手段
30と、実行中の実行プログラム10の割り当てられた
使用可能な実行経過時間の超過を検出する実行経過時間
制限検出手段31と、実行中の実行プログラム10の割
り当てられた使用可能な入出力回数の超過を検出する入
出力回数制限検出手段32と、外部からの実行中の実行
プログラム10に対するチェックポイントの取得要求を
受け付けるチェックポイント採取要求受付手段33とを
有するとともに、CPU使用制限検出手段30,実行経
過時間制限検出手段31,入出力回数制限検出手段32
またはチェックポイント採取要求受付手段33の何れか
一つのジョブチェックポイント採取時に、チェックポイ
ント情報を採取した実行プログラム10の実行可能なホ
ストコンピュータを検索するホストスケジュール手段4
0と、実行プログラム10が実行可能なホストコンピュ
ータが存在する場合に、該ホストコンピュータに該実行
プログラム10の実行要求を行う他ホスト実行要求手段
41とを有しており、ホストコンピュータH2は、他ホ
スト実行要求手段41からの実行要求を受け付けて、チ
ェックポイント情報復旧手段21にジョブの再開要求を
行うジョブ再実行手段42を有している。
【0019】次に、本実施例の動作について図面を参照
して説明する。ホストコンピュータの利用者がジョブの
投入時に、ジョブの実行情報をスプールファイルF1に
スプール情報として格納し、スプールファイルF1内の
スプール情報をもとに、実行プログラム10を実行させ
る。チェックポイント情報採取手段11は、実行情報退
避手段12により実行中の実行プログラム10のチェッ
クポイント情報をチェックポイントファイルF2に出力
し、ファイル情報退避手段13により実行中の実行プロ
グラム10の使用しているユーザファイルF3の使用情
報をチェックポイントファイルF2に出力する。
して説明する。ホストコンピュータの利用者がジョブの
投入時に、ジョブの実行情報をスプールファイルF1に
スプール情報として格納し、スプールファイルF1内の
スプール情報をもとに、実行プログラム10を実行させ
る。チェックポイント情報採取手段11は、実行情報退
避手段12により実行中の実行プログラム10のチェッ
クポイント情報をチェックポイントファイルF2に出力
し、ファイル情報退避手段13により実行中の実行プロ
グラム10の使用しているユーザファイルF3の使用情
報をチェックポイントファイルF2に出力する。
【0020】そこで、ホストコンピュータの使用者によ
るジョブの再開の要求時に、チェックポイント情報復旧
手段21は、スプールファイルF1と、チェックポイン
トファイルF2内の実行情報と、ユーザファイルF3内
の実行プログラム10とをもとにして、実行情報復旧手
段22により、実行中の実行プログラム10の実行状態
を実行プログラム20として復旧する。
るジョブの再開の要求時に、チェックポイント情報復旧
手段21は、スプールファイルF1と、チェックポイン
トファイルF2内の実行情報と、ユーザファイルF3内
の実行プログラム10とをもとにして、実行情報復旧手
段22により、実行中の実行プログラム10の実行状態
を実行プログラム20として復旧する。
【0021】また、ファイル情報復旧手段23により、
チェックポイントファイルF2内のファイル情報をもと
に、実行中の実行プログラム10の使用していたユーザ
ファイルF3の状態を復旧し、実行プログラム20の状
態を実行プロゲラム10がチェックポイント情報を採取
した時点の状態に復旧して実行を再開する。
チェックポイントファイルF2内のファイル情報をもと
に、実行中の実行プログラム10の使用していたユーザ
ファイルF3の状態を復旧し、実行プログラム20の状
態を実行プロゲラム10がチェックポイント情報を採取
した時点の状態に復旧して実行を再開する。
【0022】一方、CPU使用制限検出手段30は、実
行プログラム10に割り当てられた使用可能なCPU使
用時間の超過を検出し、チェックポイント情報採取手段
11によってチェックポイント情報を採取後に、実行プ
ログラム10を強制的に終了させる。
行プログラム10に割り当てられた使用可能なCPU使
用時間の超過を検出し、チェックポイント情報採取手段
11によってチェックポイント情報を採取後に、実行プ
ログラム10を強制的に終了させる。
【0023】他方、実行経過時間制限検出手段31は、
実行プログラム10に割り当てられた使用可能な実行経
過時間の超過を検出し、チェックポイント情報採取手段
11によってチェックポイント情報を採取後に、実行プ
ログラム10を強制的に終了させる。
実行プログラム10に割り当てられた使用可能な実行経
過時間の超過を検出し、チェックポイント情報採取手段
11によってチェックポイント情報を採取後に、実行プ
ログラム10を強制的に終了させる。
【0024】また、入出力回数制限検出手段32は、実
行プログラム10に割り当てられた使用可能な入出力回
数の超過を検出し、チェックポイント情報採取手段11
によってチェックポイント情報を採取後に、実行プログ
ラム10を強制的に終了させる。
行プログラム10に割り当てられた使用可能な入出力回
数の超過を検出し、チェックポイント情報採取手段11
によってチェックポイント情報を採取後に、実行プログ
ラム10を強制的に終了させる。
【0025】さらに、チェックポイント採取要求受付手
段33は、外部からの実行プログラム10に対するチェ
ックポイント採取要求を受け付け、チェックポイント情
報採取手段11によってチェックポイント情報を採取後
に、実行プログラム10を強制的に終了させる。
段33は、外部からの実行プログラム10に対するチェ
ックポイント採取要求を受け付け、チェックポイント情
報採取手段11によってチェックポイント情報を採取後
に、実行プログラム10を強制的に終了させる。
【0026】図2は、スプールファイルF1に格納され
たジョブ実行制限の一例を示す図である。また、図3
は、ホストスケジュール手段40の動作の一例を示す流
れ図である。ホストスケジュール手段40は、CPU使
用制限検出手段30、実行経過時間制限検出手段31、
入出力回数制限検出手段32、チェックポイント採取要
求受付手段33の何れかの方法によるチェックポイント
採取時に、スプールファイルF1に格納された図2に示
すような該当のジョブの各ホストコンピュータでの使用
可能なCPU時間、実行経過時間、入出力回数の情報を
もとに、図3に示すように、実行可能なホストコンピュ
ータを検索し(ステップS1,〜S5)、実行可能なホ
ストコンピュータが存在する場合に、他ホスト実行要求
手段41により、実行可能なホストコンピュータに該当
のジョブの再開を要求する。
たジョブ実行制限の一例を示す図である。また、図3
は、ホストスケジュール手段40の動作の一例を示す流
れ図である。ホストスケジュール手段40は、CPU使
用制限検出手段30、実行経過時間制限検出手段31、
入出力回数制限検出手段32、チェックポイント採取要
求受付手段33の何れかの方法によるチェックポイント
採取時に、スプールファイルF1に格納された図2に示
すような該当のジョブの各ホストコンピュータでの使用
可能なCPU時間、実行経過時間、入出力回数の情報を
もとに、図3に示すように、実行可能なホストコンピュ
ータを検索し(ステップS1,〜S5)、実行可能なホ
ストコンピュータが存在する場合に、他ホスト実行要求
手段41により、実行可能なホストコンピュータに該当
のジョブの再開を要求する。
【0027】そこで、ジョブ再実行手段42は、他ホス
ト実行要求手段41からのジョブの再開要求を受取り、
チェックポイント情報復旧手段21により、ジョブの再
開を行う。
ト実行要求手段41からのジョブの再開要求を受取り、
チェックポイント情報復旧手段21により、ジョブの再
開を行う。
【0028】
【発明の効果】以上説明したように、本発明のジョブチ
ェックポイント再開方式は、複数のホストコンピュータ
に共有されるチェックポイントファイルにチェックポイ
ント情報を出力できるとともに、複数のホストコンピュ
ータに共有されるチェックポイントファイルに出力され
たチェックポイント情報をもとに、ジョブの再開ができ
るという効果を有している。
ェックポイント再開方式は、複数のホストコンピュータ
に共有されるチェックポイントファイルにチェックポイ
ント情報を出力できるとともに、複数のホストコンピュ
ータに共有されるチェックポイントファイルに出力され
たチェックポイント情報をもとに、ジョブの再開ができ
るという効果を有している。
【0029】また、本発明のジョブチェックポイント再
開方式は、複数のホストコンピュータにまたがったジョ
ブチェックポイントの採取および自動的なジョブの再開
という柔軟な運用を可能にするという効果を有してい
る。
開方式は、複数のホストコンピュータにまたがったジョ
ブチェックポイントの採取および自動的なジョブの再開
という柔軟な運用を可能にするという効果を有してい
る。
【図1】素結合多重ホストシステムにおける本発明のジ
ョブチェックポイント再開方式の一実施例を示すブロッ
ク図である。
ョブチェックポイント再開方式の一実施例を示すブロッ
ク図である。
【図2】スプールファイルF1に格納されたジョブ実行
制限の一例を示す図である。
制限の一例を示す図である。
【図3】ホストスケジュール手段40の動作の一例を示
す流れ図である。
す流れ図である。
10,20 実行プログラム 11 チェックポイント情報採取手段 12 実行情報退避手段 13 ファイル情報退避手段 21 チェックポイント情報復旧手段 22 実行情報復旧手段 23 ファイル情報復旧手段 30 CPU使用制限検出手段 31 実行経過時間制限検出手段 32 入出力回数制限検出手段 33 チェックポイント採取要求受付手段 40 ホストスケジュール手段 41 他ホスト実行要求手段 42 ジョブ再実行手段 F1 スプールファイル F2 チェックポイントファイル F3 ユーザファイル H1,〜Hn ホストコンピュータ K 共有装置
Claims (7)
- 【請求項1】 複数のホストコンピュータと、前記ホス
トコンピュータの各々に接続される共有装置とを有する
素結合多重ホストシステムのジョブチェックポイント再
開方式において、 前記共有装置上に実行中のジョブのスプール情報を格納
するスプールファイルと、 前記共有装置上に実行中のジョブのチェックポイント情
報を格納するチェックポイントファイルと、 前記共有装置上に実行プログラムおよびその実行プログ
ラムで使用するデータ等を格納するユーザファイルと、 実行中の実行プログラムの実行情報を前記チェックポイ
ントファイルに出力する実行情報退避手段と、 実行中の実行プログラムが使用しているファイルの使用
情報を前記チェックポイントファイルに出力するファイ
ル情報退避手段と、 実行プログラムから引用されて、前記実行情報退避手段
および前記ファイル情報退避手段を用いて、その実行プ
ログラムの実行情報をチェックポイント情報として採取
するチェックポイント情報採取手段とを具備し、 素結合多重ホストシステムで実行中の実行プログラムの
チェックポイント情報を前記共有装置上の前記チェック
ポイントファイルに入力することにより、実行プログラ
ムの中断を可能とすることを特徴とするジョブチェック
ポイント再開方式。 - 【請求項2】 複数のホストコンピュータと、前記ホス
トコンピュータの各々に接続される共有装置とを有する
素結合多重ホストシステムのジョブチェックホイント再
開方式において、 前記共有装置上に実行中のジョブのスプール情報を格納
するスプールファイルと、 前記共有装置上に実行中のジョブのチェックポイント情
報を格納するチェックポイントファイルと、 前記共有装置上に実行プログラムおよびその実行プログ
ラムで使用するデータ等を格納するユーザファイルと、 前記スプールファイルのスプール情報および前記チェッ
クンポイントファイルに格納されている実行プログラム
の実行情報並びに前記ユーザファイルに格納されている
実行プログラムをもとにして、実行プログラムの状態を
チェックポイント採取時の状態に復旧する実行情報復旧
手段と、 前記チェックポイントファイルに格納されている実行プ
ログラムの使用していたファイルの使用情報をもとにし
て、実行プログラムの使用するファイルの状態をチェッ
クポイント採取時の状態に復旧するファイル情報復旧手
段と、 前記実行情報復旧手段および前記ファイル情報復旧手段
を用いて、チェックポイントを採取した実行プログラム
の状態をチェックンポイントを採取した時点の状態に復
旧して、実行プログラムの実行を再開するチェックポイ
ント情報復旧手段とを具備し、 素結合多重ホストシステムで前記共有装置上の前記チェ
ックポイントファイルに出力されたチェックポイント情
報をもとにして、ジョブの実行を再開することを特徴と
するジョブチェックポイント再開方式。 - 【請求項3】 実行中の実行プログラムに割り当てられ
た使用可能なCPU使用時間の超過を検出するCPU使
用制限検出手段を具備し、 CPU使用時間の超過時に、自動的にチェックポイント
情報を採取することを特徴とする請求項1,2記載のジ
ョブチェックポイント再開方式。 - 【請求項4】 実行中の実行プログラムに割り当てられ
た使用可能な実行経過時間の超過を検出する実行経過時
間制限検出手段を具備し、実行経過時間の超過時に、自
動的にチェックポイント情報を採取することを特徴とす
る請求項1,2記載のジョブチェックポイント再開方
式。 - 【請求項5】 実行中の実行プログラムに割り当てられ
た使用可能な入出力回数の超過を検出する入出力回数制
限検出手段を具備し、 入出力回数超過時に、自動的にチェックポイント情報を
採取することを特徴とする請求項1,2記載のジョブチ
ェックポイント再開方式。 - 【請求項6】 外部から実行中の実行プログラムに対す
るチェックポイントの採取要求を受け付けるチェックポ
イント採取要求受付手段を具備し、 外部からのチェックポイントの採取要求の発生時に、自
動的にチェックポイント情報を採取することを特徴とす
る請求項1,2記載のジョブチェックポイント再開方
式。 - 【請求項7】 ジョブチェックポイントの採取時にチェ
ックポイント情報を採取した実行プログラムの実行可能
なホストコンピュータを検索するホストスケジュール手
段と、 該実行プログラムが実行可能な前記ホストコンピュータ
が存在する場合に、その前記ホストコンピュータに該実
行プログラムの実行要求を行う他ホスト実行要求手段
と、 前記他ホスト実行要求手段からの実行要求を受け付け
て、請求項2記載のチェックポイント情報復旧手段にジ
ョブの再開要求を行うジョブ再実行手段とを具備し、 チェックポイント採取時に、自動的に実行可能な前記ホ
ストコンピュータでジョブの再開を行うことを特徴とす
る請求項2,〜6記載のジョブチェックポイント再開方
式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4169790A JPH0644198A (ja) | 1992-06-29 | 1992-06-29 | ジョブチェックポイント再開方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4169790A JPH0644198A (ja) | 1992-06-29 | 1992-06-29 | ジョブチェックポイント再開方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0644198A true JPH0644198A (ja) | 1994-02-18 |
Family
ID=15892935
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4169790A Withdrawn JPH0644198A (ja) | 1992-06-29 | 1992-06-29 | ジョブチェックポイント再開方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0644198A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007183701A (ja) * | 2006-01-04 | 2007-07-19 | Hitachi Ltd | スナップショット再起動方法 |
-
1992
- 1992-06-29 JP JP4169790A patent/JPH0644198A/ja not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007183701A (ja) * | 2006-01-04 | 2007-07-19 | Hitachi Ltd | スナップショット再起動方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7991744B2 (en) | Method and system for dynamically collecting data for checkpoint tuning and reduce recovery time | |
CN105357038B (zh) | 监控虚拟机集群的方法和系统 | |
KR101691126B1 (ko) | 결함 내성 배치 처리 | |
CN101236515B (zh) | 多核系统单核异常的恢复方法 | |
WO2020232871A1 (zh) | 一种微服务依赖分析方法及装置 | |
JPH10143381A (ja) | 遊休ワークステーションを共用するための装置および方法 | |
CN109033814B (zh) | 智能合约触发方法、装置、设备及存储介质 | |
JP4992740B2 (ja) | マルチプロセッサシステム、障害検出方法および障害検出プログラム | |
JP2008107875A (ja) | ジョブ制御装置及びジョブ制御プログラム | |
CN117312092A (zh) | 多核mcu的监控方法、装置、车辆及可读存储介质 | |
JP5672521B2 (ja) | コンピュータシステム、およびそのチェックポイントリスタート方法 | |
JPH0644198A (ja) | ジョブチェックポイント再開方式 | |
JPWO2007108062A1 (ja) | サーバ管理方法、プログラム及び装置 | |
JP4723465B2 (ja) | ジョブ割当プログラム及びジョブ割当方法 | |
JP3463020B2 (ja) | ワークフロー実行方法および装置とワークフロー実行プログラムを記録した記録媒体 | |
US8001550B2 (en) | Object identifier readers that are configured to automatically send and/or store data read from an object identifier | |
JP5509921B2 (ja) | 性能情報採取装置、性能情報採取方法、及び性能情報採取プログラム | |
KR101725408B1 (ko) | 실시간 운영체제의 태스크 스케줄링 방법 | |
CN114691639A (zh) | 实时流式数据处理方法、装置、计算机设备和存储介质 | |
JPH11353284A (ja) | ジョブ再実行方法 | |
JP2005182594A (ja) | コンピュータ及びプログラム | |
JPWO2007108065A1 (ja) | サーバ管理方法、プログラム及び装置 | |
JP5791524B2 (ja) | Os動作装置及びos動作プログラム | |
JP6795646B2 (ja) | リカバリー支援システム、リカバリー支援方法及びリカバリー支援プログラム | |
EP4068096A1 (en) | Data processing program, information processing system, and data processing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 19990831 |