JPH07175766A - Job reexecution control method for loosely-coupled multiplexing system - Google Patents

Job reexecution control method for loosely-coupled multiplexing system

Info

Publication number
JPH07175766A
JPH07175766A JP5318812A JP31881293A JPH07175766A JP H07175766 A JPH07175766 A JP H07175766A JP 5318812 A JP5318812 A JP 5318812A JP 31881293 A JP31881293 A JP 31881293A JP H07175766 A JPH07175766 A JP H07175766A
Authority
JP
Japan
Prior art keywords
job
host computer
execution
host
management information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5318812A
Other languages
Japanese (ja)
Inventor
Mitsuru Ando
充 安藤
Takeshi Sasaki
猛 佐々木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TOHOKU NIPPON DENKI SOFTWARE KK
NEC Corp
NEC Solution Innovators Ltd
Original Assignee
TOHOKU NIPPON DENKI SOFTWARE KK
NEC Corp
NEC Software Tohoku Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TOHOKU NIPPON DENKI SOFTWARE KK, NEC Corp, NEC Software Tohoku Ltd filed Critical TOHOKU NIPPON DENKI SOFTWARE KK
Priority to JP5318812A priority Critical patent/JPH07175766A/en
Publication of JPH07175766A publication Critical patent/JPH07175766A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To promptly perform the reexecution of a job in execution by a designated host computer Hm when a fault is generated in a host computer Hn. CONSTITUTION:In a host computer H1, a job control language translation means B2 translates a job control language B1 and registers the designation of a host computer Hm reexecuting the job of a host computer Hn in a job control information holding means A4. A host fault recognition means A1 recognizes the fault notification from a host monitoring device G1, and a job reexecution preparation means A2 updates the job control information of the job control information holding means A4 and requests the reexecution for the job in execution in a faulty host computer Hn. A job schedule means A3 performs the rescheduling of the job and requests the host computer Hm to reexecute the job. A job start means A5 starts the execution program A6 of the job for which the execution is requested.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、疎結合多重システムの
ジョブ再実行制御方式に関し、特にジョブを実行中のホ
ストコンピュータに障害が発生した場合における疎結合
多重システムのジョブ再実行制御方式に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a job re-execution control method for a loosely coupled multiple system, and more particularly to a job re-execution control method for a loosely coupled multiple system when a failure occurs in a host computer that is executing a job.

【0002】[0002]

【従来の技術】従来の疎結合多重システムのジョブ再実
行制御方式は、ジョブを実行しているホストコンピュー
タに何らかの要因によって障害が発生した場合には、実
行中のジョブの再実行を行うために必要なジョブ制御情
報をそのホストコンピュータの二次記憶領域上に持つこ
とにより、障害が発生したホストコンピュータの障害の
回復後に、二次記憶領域上のジョブ制御情報の内容を用
いて、障害で中断されたジョブの再実行を自動的に行っ
ている。
2. Description of the Related Art A conventional job re-execution control method for a loosely coupled multiple system is to re-execute a job being executed when a failure occurs in the host computer that is executing the job. By holding the necessary job control information in the secondary storage area of the host computer, after the failure of the failed host computer is recovered, the contents of the job control information in the secondary storage area are used to interrupt due to the failure. The executed job is automatically re-executed.

【0003】このような従来の疎結合多重システムのジ
ョブ再実行制御方式の一例としては特開昭62−795
31,“ジョブステップリスタート方法”がある。
As an example of such a conventional job re-execution control system for a loosely coupled multiplex system, Japanese Patent Application Laid-Open No. 62-795.
31. "Job step restart method".

【0004】[0004]

【発明が解決しようとする課題】上述した従来の疎結合
多重システムのジョブ再実行制御方式は、ジョブを実行
しているホストコンピュータに障害が発生した場合に、
そのホストコンピュータの障害の回復後に、そのホスト
コンピュータの二次記憶領域上のジョブ制御情報の内容
によって障害で中断されたジョブの再実行を行っている
ので、そのホストコンピュータの障害が回復するまで
は、実行を中断されたジョブの再実行を実施することが
できず、そのホストコンピュータの障害の回復後に、操
作員によってジョブの再実行の指示を行う必要があると
いう欠点を有している。
The above-mentioned conventional job re-execution control method for the loosely coupled multiplex system, when a failure occurs in the host computer executing the job,
After the failure of the host computer is recovered, the job interrupted by the failure is re-executed due to the contents of the job control information in the secondary storage area of the host computer, so until the failure of the host computer is recovered However, there is a drawback that the re-execution of the job whose execution has been interrupted cannot be executed, and the operator must give an instruction for re-execution of the job after the failure of the host computer is recovered.

【0005】また、従来の疎結合多重システムのジョブ
再実行制御方式は、障害が発生したホストコンピュータ
の装置故障などによって、そのホストコンピュータの障
害の回復が困難でジョブの再実行を行えない場合もある
という欠点を有している。
Further, according to the conventional job re-execution control method of the loosely coupled multiple system, there is a case where it is difficult to recover the failure of the host computer due to the failure of the host computer in which the failure has occurred and the job cannot be re-executed. It has the drawback of being.

【0006】本発明の目的は、ジョブを実行しているホ
ストコンピュータに障害が発生した場合に、そのホスト
コンピュータの障害の回復を待たずに、速やかにそのジ
ョブの再実行を他のホストコンピュータにより行うこと
ができる疎結合多重システムのジョブ再実行制御方式を
提供することにある。
An object of the present invention is to, when a failure occurs in a host computer executing a job, promptly re-execute the job by another host computer without waiting for recovery from the failure of the host computer. It is to provide a job re-execution control method of a loosely coupled multiple system that can be performed.

【0007】[0007]

【課題を解決するための手段】第1の発明の疎結合多重
システムのジョブ再実行制御方式は、複数のホストコン
ピュータと前記ホストコンピュータの各々に接続して前
記ホストコンピュータの何れかに障害が発生した場合に
他の前記ホストコンピュータに障害が発生したことを通
知するホスト監視装置とを持つ疎結合多重システムのジ
ョブ再実行制御方式において、第1の前記ホストコンピ
ュータには、(A)前記ホストコンピュータ内に投入さ
れたジョブに対するジョブ制御情報を保持するジョブ管
理情報保持手段と、(B)ジョブ制御言語を入力して翻
訳するとともに、ジョブ制御言語により第2の前記ホス
トコンピュータに障害が発生したときジョブの再実行を
行うべき第3の前記ホストコンピュータが指定されてい
る場合に、その指定をジョブ制御情報として前記ジョブ
管理情報保持手段に登録するジョブ制御言語翻訳手段
と、(C)障害の発生時には前記ホスト監視装置から障
害を起した第2の前記ホストコンピュータを通知されて
認識することにより、前記ジョブ管理情報保持手段のジ
ョブ制御情報を参照して、第2の前記ホストコンピュー
タで実行中のジョブに対する再実行要求を行うホスト障
害認識手段と、(D)前記ホスト障害認識手段からジョ
ブの再実行要求を受けることによって、前記ジョブ管理
情報保持手段のジョブ制御情報を参照し、そのジョブ制
御情報で指示された第3の前記ホストコンピュータに対
するジョブの再スケジュール要求を行うジョブ再実行準
備手段と、(E)前記ジョブ制御言語翻訳手段からのジ
ョブ制御情報を受けることによって複数の前記ホストコ
ンピュータで実行すべきジョブのスケジューリングを行
い、前記ジョブ再実行準備手段の第3の前記ホストコン
ピュータに対するジョブの再スケジュール要求を受けて
ジョブの再スケジューリングを行うことによって第3の
前記ホストコンピュータに対して第2の前記ホストコン
ピュータのジョブの再実行を要求するジョブスケジュー
ル手段と、を備えるとともに、複数の前記ホストコンピ
ュータの各々には、(F)前記ジョブスケジュール手段
からスケジュールに基いたジョブの実行要求がある場合
に、実行を要求されたジョブの実行プログラムを起動す
るジョブ起動手段、を備えて構成されている。
According to the job re-execution control method of the loosely coupled multiplex system of the first invention, a failure occurs in any one of the host computers by connecting to each of the plurality of host computers. In the job re-execution control method of the loosely coupled multi-system having a host monitoring device that notifies other host computers that a failure has occurred, the first host computer includes (A) the host computer Job management information holding means for holding job control information for a job entered in (B) a job control language is input and translated, and when a failure occurs in the second host computer due to the job control language If a third host computer to re-execute the job is specified, the Job control information translating means for registering the job control information as job control information in the job management information holding means, and (C) when a failure occurs, the host monitoring apparatus is notified of and recognizes the second host computer in which the failure occurred By referring to the job control information of the job management information holding means, a second host failure recognition means for making a re-execution request for a job being executed in the host computer; and (D) a job from the host failure recognition means Job re-execution preparation means for making a job re-scheduling request to the third host computer designated by the job control information by referring to the job control information of the job management information holding means by receiving the job re-execution request. (E) by receiving the job control information from the job control language translation means, Job to be executed by the host computer, and the job is rescheduled in response to a job rescheduling request from the job reexecution preparation means to the third host computer. And a second job scheduling means for requesting re-execution of the job of the host computer, and each of the plurality of host computers includes (F) a job based on the schedule from the job scheduling means. Job execution means for activating an execution program of a job requested to be executed when there is an execution request is configured.

【0008】そして、第2の発明の疎結合多重システム
のジョブ再実行制御方式は、第1の発明の疎結合多重シ
ステムのジョブ再実行制御方式において、(A)障害が
発生したときにジョブの再実行を行うための請求項1記
載のホストコンピュータの指定が行われていない場合や
行われているその指定を変更したい場合に、第2の前記
ホストコンピュータに障害が発生したときジョブの再実
行を行うべき第3の前記ホストコンピュータの指定を入
力する端末と、(B)前記端末から第2の前記ホストコ
ンピュータに障害が発生したときジョブの再実行を行う
べき第3の前記ホストコンピュータを指定した場合に、
その指定を新たなジョブ制御情報として前記ジョブ管理
情報保持手段内に登録するジョブ再実行ホスト登録手段
と、を第1の前記ホストコンピュータに対して備えて構
成されている。
The job re-execution control method for the loosely coupled multiple system according to the second aspect of the present invention is the job re-execution control method for the loosely coupled multiple system according to the first aspect of the present invention. The re-execution of the job when the host computer according to claim 1 for re-execution is not specified or the specified specification is changed and a failure occurs in the second host computer. And a terminal for inputting the designation of the third host computer to perform the job, and (B) a third host computer to re-execute the job when a failure occurs in the second host computer from the terminal. If you do
Job re-execution host registration means for registering the designation as new job control information in the job management information holding means is provided for the first host computer.

【0009】そして、第3の発明の疎結合多重システム
のジョブ再実行制御方式は、第1の発明の疎結合多重シ
ステムのジョブ再実行制御方式において、(A)障害が
発生したときにジョブの再実行を行うための請求項1記
載のホストコンピュータの指定を利用者ごとに格納する
利用者管理情報格納手段と、(B)障害のジョブの利用
者に対して、前記利用者管理情報格納手段からジョブの
再実行を行うための前記ホストコンピュータの指定を取
得する利用者管理情報取得手段と、(C)第2の前記ホ
ストコンピュータに障害が発生したときに、請求項1記
載のジョブ管理情報保持手段にジョブの再実行を行うた
めの前記ホストコンピュータの指定が行われていない場
合には、障害のジョブの利用者を前記利用者管理情報取
得手段に与えることによって、その利用者に対する前記
ホストコンピュータの指定を取得し、その指定を新たな
ジョブ制御情報として前記ジョブ管理情報保持手段内に
登録するとともに障害のジョブに対する再実行要求を行
う請求項1記載のホスト障害認識手段と、を第1の前記
ホストコンピュータに対して備えて構成されている。
A job re-execution control method for a loosely coupled multiple system according to a third aspect of the present invention is the job re-execution control method for a loosely coupled multiple system according to the first aspect of the present invention. A user management information storage means for storing the designation of the host computer according to claim 1 for re-execution for each user, and (B) the user management information storage means for the user of the faulty job. 2. The job management information according to claim 1, wherein when a failure occurs in the user management information acquisition means for acquiring the designation of the host computer for re-executing the job from (C) the second host computer. If the host computer for re-execution of the job is not designated in the holding means, the user of the job in failure is given to the user management information acquisition means. 2. The host according to claim 1, wherein the designation of the host computer for the user is acquired, the designation is registered as new job control information in the job management information holding unit, and a re-execution request is made for the faulty job. A fault recognition means is provided for the first host computer.

【0010】そして、第4の発明の疎結合多重システム
のジョブ再実行制御方式は、第1の発明の疎結合多重シ
ステムのジョブ再実行制御方式において、(A)障害が
発生したときにジョブの再実行を行うための請求項1記
載のホストコンピュータの指定を前記ホストコンピュー
タごとに保持するシステム定義情報保持手段と、(B)
障害が発生した第2の前記ホストコンピュータに対して
前記システム定義情報保持手段からジョブの再実行を行
うための前記ホストコンピュータの指定を取得するホス
ト情報取得手段と、(C)第2の前記ホストコンピュー
タに障害が発生したときに、請求項1記載のジョブ管理
情報保持手段にジョブの再実行を行うための前記ホスト
コンピュータの指定が行われていない場合には、第2の
前記ホストコンピュータであることを前記ホスト情報取
得手段に与えることにより、第2の前記ホストコンピュ
ータに対する第3の前記ホストコンピュータの指定を取
得し、その指定を新たなジョブ制御情報として前記ジョ
ブ管理情報保持手段内に登録するとともに障害のジョブ
に対する再実行要求を行う請求項1記載のホスト障害認
識手段と、を第1の前記ホストコンピュータに対して備
えて構成されている。
A job re-execution control method for a loosely coupled multiple system according to a fourth aspect of the present invention is the job re-execution control method for a loosely coupled multiple system according to the first aspect of the present invention. A system definition information holding unit for holding the designation of the host computer according to claim 1 for re-execution, (B)
Host information acquisition means for acquiring a designation of the host computer for re-executing a job from the system definition information holding means for the second host computer in which a failure has occurred; and (C) the second host It is the second host computer when the host computer for re-execution of the job is not designated in the job management information holding means according to claim 1 when the computer fails. To the host information acquisition means, the designation of the third host computer with respect to the second host computer is obtained, and the designation is registered in the job management information holding means as new job control information. A host failure recognizing means according to claim 1, wherein a re-execution request is made to the failed job together with the first job. And it is configured to include to the host computer.

【0011】さらに、第5の発明の疎結合多重システム
のジョブ再実行制御方式は、第1の発明の疎結合多重シ
ステムのジョブ再実行制御方式において、(A)障害が
発生したときにジョブの再実行を行うための請求項1記
載のホストコンピュータの指定を各々のジョブクラスご
とに保持するシステム定義情報保持手段と、(B)障害
のジョブのジョブクラスに対して前記システム定義情報
保持手段からのジョブの再実行を行うための前記ホスト
コンピュータの指定を取得するジョブクラス情報取得手
段と、(C)第2の前記ホストコンピュータに障害が発
生したときに、請求項1記載のジョブ管理情報保持手段
にジョブの再実行を行うための前記ホストコンピュータ
の指定が行われていない場合には、障害のジョブについ
てのジョブクラスを前記ジョブクラス情報取得手段に与
えることにより、そのジョブクラスに対する第3の前記
ホストコンピュータの指定を取得して、その指定を新た
なジョブ制御情報として前記ジョブ管理情報保持手段内
に登録するとともに障害のジョブに対する再実行要求を
行う請求項1記載のホスト障害認識手段と、を第1の前
記ホストコンピュータに対して備えて構成されている。
Further, the job re-execution control method for the loosely coupled multiple system according to the fifth aspect of the present invention is the job re-execution control method for the loosely coupled multiple system according to the first aspect of the present invention. The system definition information holding means for holding the designation of the host computer according to claim 1 for re-execution for each job class, and (B) the system definition information holding means for the job class of the faulty job. 2. The job management information holding according to claim 1, wherein the job class information acquisition means for acquiring the designation of the host computer for re-execution of the job of 1) and (C) the second host computer when a failure occurs. If the host computer is not specified to re-execute the job, the job class for the job in error By giving to the job class information acquisition means, the designation of the third host computer for the job class is obtained, the designation is registered as new job control information in the job management information holding means, and The host failure recognizing means according to claim 1, which issues a re-execution request for a job, is provided for the first host computer.

【0012】[0012]

【実施例】次に、本発明の実施例につき図面を参照して
説明する。図1は本発明の疎結合多重システムのジョブ
再実行制御方式の第1の実施例を示すブロック図であ
る。第1の実施例は、図1に示すように、複数のホスト
コンピュータH1,…Hm,…Hn,……と、ホストコ
ンピュータH1,…Hm,…Hn,……の各々に接続し
たホスト監視装置G1とを有して構成されている。
Embodiments of the present invention will now be described with reference to the drawings. FIG. 1 is a block diagram showing a first embodiment of a job re-execution control method for a loosely coupled multiplex system according to the present invention. In the first embodiment, as shown in FIG. 1, a plurality of host computers H1, ... Hm, ... Hn, ... And a host monitoring device connected to each of the host computers H1 ,. And G1.

【0013】以下には、ホストコンピュータH1をジョ
ブのスケジューリングを行うホストとして、また、ホス
トコンピュータHnを障害が発生したホストとして、一
方、ホストコンピュータHmをジョブの再実行を実施す
るホストとして説明することとする。
In the following description, the host computer H1 will be described as a job scheduling host, the host computer Hn as a failed host, and the host computer Hm as a job re-execution host. And

【0014】また、ジョブ制御言語B1は、ホストコン
ピュータHnに障害が発生したときジョブの再実行を行
うべきホストコンピュータHmを指定しており、あらか
じめホストコンピュータH1に投入されている。
Further, the job control language B1 specifies the host computer Hm which should re-execute a job when a failure occurs in the host computer Hn, and is preloaded in the host computer H1.

【0015】一方、このホストコンピュータH1は、ホ
スト障害認識手段A1と、ジョブ再実行準備手段A2
と、ジョブスケジュール手段A3と、ジョブ管理情報保
持手段A4と、ジョブ制御言語翻訳手段B2とを有して
構成されている。
On the other hand, the host computer H1 has a host failure recognition means A1 and a job re-execution preparation means A2.
A job scheduling means A3, a job management information holding means A4, and a job control language translation means B2.

【0016】さらに、ホストコンピュータH1,…H
m,…Hn,……の各々には、ジョブ起動手段A5を備
えている。また、ジョブ起動手段A5は、ジョブスケジ
ュール手段A3からの指示によって、指定されたジョブ
の実行プログラムA6の起動を行っている。
Further, the host computers H1, ... H
Each of m, ... Hn, ... Has a job starting means A5. Further, the job activation means A5 activates the execution program A6 of the designated job according to the instruction from the job scheduling means A3.

【0017】図2は第1の実施例におけるジョブの投入
処理時の動作の一例を示した流れ図である。また、図3
は第1の実施例におけるホストコンピュータの障害発生
時の動作の一例を示した流れ図である。
FIG. 2 is a flow chart showing an example of the operation at the time of job input processing in the first embodiment. Also, FIG.
6 is a flow chart showing an example of an operation when a failure occurs in the host computer in the first embodiment.

【0018】第1の実施例でジョブを投入するときに
は、ジョブ制御言語翻訳手段B2は、順次にジョブ制御
言語B1などを入力して翻訳して、ジョブの投入者,ジ
ョブの実行クラス,実行させるホストコンピュータH
1,…Hm,…Hn,……を決定し、ジョブ管理情報保
持手段A4に登録した後に、ジョブスケジュール手段A
3に通知している。
When a job is submitted in the first embodiment, the job control language translation means B2 sequentially inputs and translates the job control language B1 and the like to translate the job submitter, the job execution class, and the job execution class. Host computer H
1, ... Hm, ... Hn, ... are determined and registered in the job management information holding means A4, and then the job scheduling means A
3 has been notified.

【0019】そこで、ジョブスケジュール手段A3は、
ジョブ制御言語翻訳手段B2からの通知を受け、ジョブ
管理情報保持手段A4を検索し、ホストコンピュータH
1,…Hm,…Hn,……で実行すべきジョブのスケジ
ューリングを行い、実行可能なジョブがある場合には、
そのジョブを実行させるホストコンピュータH1,…H
m,…Hn,……の何れかに起動要求を行っている。ま
た、起動要求を受けたジョブ起動手段A5は、ジョブス
ケジュール手段A3からの指示によって、指定されたジ
ョブの実行プログラムA6の起動を行っている。
Therefore, the job scheduling means A3
Upon receiving the notification from the job control language translation means B2, the job management information holding means A4 is searched and the host computer H
, ... Hm, ... Hn, ... Schedule jobs to be executed, and if there are executable jobs,
Host computers H1, ... H that execute the job
An activation request is issued to any of m, ... Hn ,. Upon receiving the activation request, the job activation unit A5 activates the execution program A6 of the designated job according to the instruction from the job scheduling unit A3.

【0020】そして、図2に示すように、ステップ20
1で、ジョブ制御言語B1により、ホストコンピュータ
Hnに障害が発生したときに、実行しているジョブの再
実行を行うべきホストコンピュータHmが指定されてい
る場合には、ステップ202で、その指定をジョブ制御
情報としてジョブ管理情報保持手段A4内に登録してい
る。また、ステップ203では、ジョブスケジュール手
段A3は、ジョブ制御言語翻訳手段B2からジョブ制御
情報を受けることにより、ホストコンピュータH1,…
Hm,…Hn,……の各々で実行すべき各ジョブのスケ
ジューリングを行っている。
Then, as shown in FIG.
If the host computer Hm that should re-execute the job being executed is designated by the job control language B1 in step 1 when the host computer Hn fails, the designation is made in step 202. It is registered in the job management information holding means A4 as job control information. Further, in step 203, the job scheduling means A3 receives the job control information from the job control language translating means B2, so that the host computers H1, ...
Each job to be executed is scheduled in each of Hm, ... Hn ,.

【0021】一方、ステップ301では、ホスト障害認
識手段A1は、ホストコンピュータHnに障害が発生し
たときに、ホスト監視装置G1からホストコンピュータ
Hnに障害が発生したことを通知されるので、ステップ
302では、ジョブ管理情報保持手段A4の中に登録さ
れているジョブ制御情報を調べて、障害発生のホストコ
ンピュータHnでジョブが実行されているときには、さ
らに、ステップ303で、再実行のホストコンピュータ
Hmが指定されていることを検出して、ジョブ再実行準
備手段A2にそのジョブの再実行を行うための処理を要
求し、ステップ304に移行している。
On the other hand, in step 301, the host failure recognizing means A1 is notified by the host monitoring device G1 that a failure has occurred in the host computer Hn when the host computer Hn has failed. The job control information registered in the job management information holding unit A4 is checked, and when the job is being executed by the host computer Hn in which the failure has occurred, in step 303, the re-execution host computer Hm is designated. When it is detected, the job re-execution preparation unit A2 is requested to perform a process for re-execution of the job, and the process proceeds to step 304.

【0022】そして、ジョブ再実行準備手段A2は、そ
のジョブを再実行する準備として、ステップ304で、
その障害のジョブのために確保した資源の解放処理を行
い、ステップ305で、ジョブ管理情報保持手段A4の
内容をそのジョブの実行開始前の状態に復帰させて、ス
テップ306で、そのジョブの実行を再実行のホストコ
ンピュータHmに変更してジョブスケジュール手段A3
にそのジョブの再実行を要求している。
Then, the job re-execution preparation means A2 prepares for re-execution of the job in step 304.
The resource reserved for the faulty job is released, the contents of the job management information holding unit A4 is returned to the state before the execution of the job is executed in step 305, and the execution of the job is executed in step 306. To the host computer Hm for re-execution, and the job scheduling means A3
Request to re-execute the job.

【0023】そこで、ジョブスケジュール手段A3は、
ステップ307では、ジョブ再実行準備手段A2からホ
ストコンピュータHmに対するジョブの再スケジュール
要求を受けてジョブ管理情報保持手段A4の内容を基に
再スケジューリングを行い、ステップ308では、ホス
トコンピュータHmに対してホストコンピュータHnに
より実行していたジョブの再実行を要求するので、ホス
トコンピュータHmのジョブ起動手段A5は、再実行要
求を受けたジョブの実行プログラムA6の起動を行って
いる。
Therefore, the job scheduling means A3
In step 307, the job re-execution preparation unit A2 receives a job re-scheduling request for the host computer Hm, and re-scheduling is performed based on the contents of the job management information holding unit A4. Since the computer Hn requests the re-execution of the job being executed, the job activating means A5 of the host computer Hm activates the execution program A6 of the job for which the re-execution request is received.

【0024】図4は本発明の疎結合多重システムのジョ
ブ再実行制御方式の第2の実施例を示したブロック図で
ある。第2の実施例は、図4に示したように、複数のホ
ストコンピュータH11,…H1m,…H1n,……と
ホストコンピュータH11,…H1m,…H1n,……
に接続してホストコンピュータH11,…H1m,…H
1n,……の何れかに障害が発生した場合には障害が発
生したことを通知するホスト監視装置G11とを有して
構成されている。
FIG. 4 is a block diagram showing a second embodiment of the job re-execution control system of the loosely coupled multiplex system according to the present invention. In the second embodiment, as shown in FIG. 4, a plurality of host computers H11, ... H1m, ... H1n, ... And host computers H11, ... H1m ,.
Connected to host computer H11, ... H1m, ... H
If any one of 1n, ... Has a failure, the host monitoring device G11 is provided for notifying that the failure has occurred.

【0025】また、ホストコンピュータH11のジョブ
制御言語翻訳手段B12は、ジョブ制御言語B11など
を入力して翻訳して、ジョブ管理情報保持手段A14に
登録しているので、ジョブ管理情報保持手段A14は、
ホストコンピュータH11,…H1m,…H1n,……
内に投入されたジョブに対するジョブ制御情報を保持し
ている。そして、ジョブ制御言語翻訳手段B12は、ジ
ョブ制御言語B11によりホストコンピュータH1nに
障害が発生したときジョブの再実行を行うべきホストコ
ンピュータH1mが指定されている場合に、その指定を
ジョブ制御情報としてジョブ管理情報保持手段A14に
登録している。
Further, the job control language translation means B12 of the host computer H11 inputs and translates the job control language B11 and the like and registers it in the job management information holding means A14. ,
Host computers H11, ... H1m, ... H1n, ...
It holds job control information for the jobs submitted in it. The job control language translation unit B12 uses the job control language B11 as job control information when the host computer H1m that should re-execute the job is designated when a failure occurs in the host computer H1n. It is registered in the management information holding means A14.

【0026】一方で、ホストコンピュータH11の端末
C11は、ジョブ管理情報保持手段A14に障害が発生
したときにジョブの再実行を行うべきホストコンピュー
タの指定が行われていない場合や行われているその指定
を変更したい場合に、ホストコンピュータH1nに障害
が発生したときにはジョブの再実行を行うべきホストコ
ンピュータH1mの指定を入力している。
On the other hand, in the terminal C11 of the host computer H11, when the job management information holding means A14 fails, the host computer to which the job should be re-executed is not specified or is executed. When the user wants to change the designation, when the host computer H1n fails, the designation of the host computer H1m to re-execute the job is input.

【0027】また、ホストコンピュータH11の端末C
11からホストコンピュータH1nに障害が発生したと
きにジョブの再実行を行うべきホストコンピュータH1
mを指定した場合に、ジョブ再実行ホスト登録手段C1
2は、その指定をジョブ制御情報としてジョブ管理情報
保持手段A14に登録している。
The terminal C of the host computer H11
The host computer H1 that should re-execute the job when a failure occurs from 11 to the host computer H1n
When m is specified, the job re-execution host registration means C1
2 has registered the designation as job control information in the job management information holding unit A14.

【0028】そこで、障害の発生時には、ホストコンピ
ュータH11のホスト障害認識手段A11は、ホスト監
視装置G11から障害を起したホストコンピュータH1
nを通知されて認識することによって、ジョブ管理情報
保持手段A14のジョブ制御情報を参照して、ホストコ
ンピュータH1nで実行中のジョブに対する再実行の要
求を行っている。
Therefore, when a failure occurs, the host failure recognition means A11 of the host computer H11 causes the host monitoring apparatus G11 to cause a failure in the host computer H1.
By notifying and recognizing n, the job control information of the job management information holding unit A14 is referred to, and a request for re-execution of the job being executed by the host computer H1n is made.

【0029】そして、ホストコンピュータH11のジョ
ブ再実行準備手段A12は、ホスト障害認識手段A11
からジョブの再実行要求を受けて、ジョブ管理情報保持
手段A14のジョブ制御情報を参照し、そのジョブ制御
情報により指示されたホストコンピュータH1mに対す
るジョブの再スケジュール要求を行っている。
The job re-execution preparation means A12 of the host computer H11 is then connected to the host failure recognition means A11.
In response to the request for re-execution of the job from the job control information holding unit A14, the job re-scheduling request is issued to the host computer H1m designated by the job control information.

【0030】一方、ホストコンピュータH11のジョブ
スケジュール手段A13は、ジョブ制御言語翻訳手段B
12からのジョブ制御情報を検索して、ホストコンピュ
ータH11,…H1m,…H1n,……により実行すべ
きジョブのスケジューリングを行い、ジョブ再実行準備
手段A12からのホストコンピュータH1mに対するジ
ョブの再スケジュール要求を受けたときには、ジョブの
再スケジューリングを行うことにより、ホストコンピュ
ータH1mに対してホストコンピュータH1nのジョブ
の再実行を要求している。
On the other hand, the job scheduling means A13 of the host computer H11 is the job control language translation means B.
.. H1m, ... H1n, ... Scheduling jobs to be executed by the host computers H11, ... H1m ,. When the job is received, the job is rescheduled to request the host computer H1m to reexecute the job of the host computer H1n.

【0031】そこで、ジョブスケジュール手段A13か
らのスケジュールに基いたジョブの実行要求がある場合
に、ホストコンピュータH1mのジョブ起動手段A15
は、実行を要求されたジョブの実行プログラムA16を
起動している。
Therefore, when there is a job execution request based on the schedule from the job scheduling means A13, the job starting means A15 of the host computer H1m.
Has started the execution program A16 of the job requested to be executed.

【0032】図5は本発明の疎結合多重システムのジョ
ブ再実行制御方式の第3の実施例を示したブロック図で
ある。第3の実施例は、図5に示したように、複数のホ
ストコンピュータH21,…H2m,…H2n,……と
ホストコンピュータH21,…H2m,…H2n,……
に接続してホストコンピュータH21,…H2m,…H
2n,……の何れかに障害が発生した場合には障害が発
生したことを通知するホスト監視装置G21とを有して
構成されている。
FIG. 5 is a block diagram showing a third embodiment of the job re-execution control system of the loosely coupled multiplex system according to the present invention. In the third embodiment, as shown in FIG. 5, a plurality of host computers H21, ... H2m, ... H2n, ... And host computers H21, ... H2m ,.
To host computer H21, ... H2m, ... H
When any one of 2n, ... Has a fault, the host monitoring device G21 notifies the fact that the fault has occurred.

【0033】また、ホストコンピュータH21のジョブ
制御言語翻訳手段B22は、ジョブ制御言語B21など
を入力して翻訳して、ジョブ管理情報保持手段A24に
登録しているので、ジョブ管理情報保持手段A24は、
ホストコンピュータH21,…H2m,…H2n,……
内に投入されたジョブに対するジョブ制御情報を保持し
ている。そして、ジョブ制御言語翻訳手段B22は、ジ
ョブ制御言語B21によりホストコンピュータH2nに
障害が発生したときジョブの再実行を行うべきホストコ
ンピュータH2mが指定されている場合に、その指定を
ジョブ制御情報としてジョブ管理情報保持手段A24に
登録している。
Since the job control language translation means B22 of the host computer H21 inputs and translates the job control language B21 and the like and registers it in the job management information holding means A24, the job management information holding means A24 is ,
Host computer H21, ... H2m, ... H2n, ...
It holds job control information for the jobs submitted in it. Then, when the host computer H2n that should re-execute the job when the host computer H2n fails due to the job control language B21, the job control language translation means B22 uses the designation as job control information. It is registered in the management information holding means A24.

【0034】一方、ホストコンピュータH21の利用者
管理情報格納手段D21は、利用者ごとに、障害が発生
したときにジョブの再実行を行うためのホストコンピュ
ータH21,…H2m,…H2n,……の指定を格納し
ており、利用者管理情報取得手段D22は、障害のジョ
ブの利用者に対して、利用者管理情報格納手段D21か
らジョブの再実行を行うホストコンピュータH21,…
H2m,…H2n,……の指定を取得することができ
る。
On the other hand, the user management information storage means D21 of the host computer H21 includes host computers H21, ... H2m, ... H2n, ... For re-executing a job when a failure occurs for each user. The user management information acquisition unit D22, which stores the designation, re-executes the job from the user management information storage unit D21 for the user of the faulty job.
The designations of H2m, ... H2n, ... Can be acquired.

【0035】そこで、障害の発生時には、ホストコンピ
ュータH21のホスト障害認識手段A21は、ホスト監
視装置G21から障害を起したホストコンピュータH2
nを通知されて認識することによって、ジョブ管理情報
保持手段A24のジョブ制御情報を参照して、ジョブ管
理情報保持手段A24にジョブの再実行を行うためのホ
ストコンピュータH21,…H2m,…H2n,……の
指定が行われていない場合には、障害のジョブの利用者
を利用者管理情報取得手段D22に与えることによっ
て、その利用者に対するジョブの再実行を行うためのホ
ストコンピュータH2mの指定を取得し、その指定を新
たなジョブ制御情報としてジョブ管理情報保持手段A2
4内に登録するとともにホストコンピュータH2nで実
行中の障害のジョブに対する再実行要求を行っている。
Therefore, when a failure occurs, the host failure recognition means A21 of the host computer H21 causes the host monitoring apparatus G21 to cause a failure in the host computer H2.
By being notified and recognizing n, the host computer H21, ... H2m, ... H2n, for re-executing the job in the job management information holding unit A24 by referring to the job control information of the job management information holding unit A24, .. is not specified, the user of the faulty job is given to the user management information acquisition means D22 to specify the host computer H2m for re-executing the job for that user. The job management information holding unit A2 that acquires the designation and uses the designation as new job control information
No. 4 is registered and the re-execution request is made for the faulty job being executed by the host computer H2n.

【0036】そして、ホストコンピュータH21のジョ
ブ再実行準備手段A22は、ホスト障害認識手段A21
からジョブの再実行要求を受けて、ジョブ管理情報保持
手段A24のジョブ制御情報を参照し、そのジョブ制御
情報により指示されたホストコンピュータH2mに対す
るジョブの再スケジュール要求を行っている。
Then, the job re-execution preparation means A22 of the host computer H21 uses the host failure recognition means A21.
In response to the request for re-execution of the job from the job control information holding unit A24, the job re-scheduling request is issued to the host computer H2m designated by the job control information.

【0037】一方、ホストコンピュータH21のジョブ
スケジュール手段A23は、ジョブ制御言語翻訳手段B
22からのジョブ制御情報を検索して、ホストコンピュ
ータH21,…H2m,…H2n,……により実行すべ
きジョブのスケジューリングを行い、ジョブ再実行準備
手段A22からのホストコンピュータH2mに対するジ
ョブの再スケジュール要求を受けたときには、ジョブの
再スケジューリングを行うことにより、ホストコンピュ
ータH2mに対してホストコンピュータH2nのジョブ
の再実行を要求している。
On the other hand, the job scheduling means A23 of the host computer H21 has a job control language translation means B.
.. H2m, ... H2n, .. Schedule the job to be executed by the host computers H21, ... H2m ,. When the job is received, the job is rescheduled to request the host computer H2m to re-execute the job of the host computer H2n.

【0038】そこで、ジョブスケジュール手段A23か
らのスケジュールに基いたジョブの実行要求がある場合
に、ホストコンピュータH2mのジョブ起動手段A25
は、実行を要求されたジョブの実行プログラムA26を
起動している。
Therefore, when there is a job execution request based on the schedule from the job scheduling means A23, the job starting means A25 of the host computer H2m.
Has started the execution program A26 of the job requested to be executed.

【0039】図6は本発明の疎結合多重システムのジョ
ブ再実行制御方式の第4の実施例を示したブロック図で
ある。第4の実施例は、図6に示したように、複数のホ
ストコンピュータH31,…H3m,…H3n,……と
ホストコンピュータH31,…H3m,…H3n,……
に接続してホストコンピュータH31,…H3m,…H
3n,……の何れかに障害が発生した場合には障害が発
生したことを通知するホスト監視装置G31とを有して
構成されている。
FIG. 6 is a block diagram showing a fourth embodiment of the job re-execution control system of the loosely coupled multiplex system according to the present invention. In the fourth embodiment, as shown in FIG. 6, a plurality of host computers H31, ... H3m, ... H3n, ... And host computers H31, ... H3m ,.
Connected to host computer H31, ... H3m, ... H
If any of the 3n, ... Has a fault, the host monitoring device G31 for notifying that the fault has occurred is configured.

【0040】また、ホストコンピュータH31のジョブ
制御言語翻訳手段B32は、ジョブ制御言語B31など
を入力して翻訳して、ジョブ管理情報保持手段A34に
登録しているので、ジョブ管理情報保持手段A34は、
ホストコンピュータH31,…H3m,…H3n,……
内に投入されたジョブに対するジョブ制御情報を保持し
ている。そして、ジョブ制御言語翻訳手段B32は、ジ
ョブ制御言語B31によりホストコンピュータH3nに
障害が発生したときジョブの再実行を行うべきホストコ
ンピュータH3mが指定されている場合に、その指定を
ジョブ制御情報としてジョブ管理情報保持手段A34に
登録している。
Since the job control language translation means B32 of the host computer H31 inputs and translates the job control language B31 and the like and registers it in the job management information holding means A34, the job management information holding means A34 ,
Host computer H31, ... H3m, ... H3n, ...
It holds job control information for the jobs submitted in it. Then, when the host computer H3n that should re-execute the job when the host computer H3n fails due to the job control language B31, the job control language translation unit B32 uses the designation as the job control information for the job. It is registered in the management information holding means A34.

【0041】一方、ホストコンピュータH31のシステ
ム定義情報保持手段F31は、障害が発生したときジョ
ブの再実行を行うためのホストコンピュータの指定を各
々のホストコンピュータごとおよび各々のジョブクラス
ごとに保持しており、ホスト情報取得手段E31は、障
害のホストコンピュータH3nに対してシステム定義情
報保持手段F31からジョブの再実行を行うべきホスト
コンピュータH3mの指定を取得しており、ジョブクラ
ス情報取得手段E32は、障害発生のジョブのジョブク
ラスに対してシステム定義情報保持手段F31からのジ
ョブの再実行を行うためのホストコンピュータH3mの
指定を取得している。
On the other hand, the system definition information holding means F31 of the host computer H31 holds the designation of the host computer for re-executing the job when a failure occurs for each host computer and for each job class. Therefore, the host information acquisition unit E31 acquires the designation of the host computer H3m that should re-execute the job from the system definition information holding unit F31 for the failed host computer H3n, and the job class information acquisition unit E32 The designation of the host computer H3m for re-executing the job is acquired from the system definition information holding unit F31 for the job class of the job in which the failure has occurred.

【0042】そこで、障害の発生時には、ホストコンピ
ュータH31のホスト障害認識手段A31は、ホスト監
視装置G31から障害を起したホストコンピュータH3
nを通知されて認識することによって、ジョブ管理情報
保持手段A34のジョブ制御情報を参照して、ジョブ管
理情報保持手段A34にジョブの再実行を行うためのホ
ストコンピュータの指定が行われていない場合に、障害
がホストコンピュータH3nであることをホスト情報取
得手段E31に与えることにより、そのホストコンピュ
ータH3nに対応するホストコンピュータH3mの指定
を取得するか、障害のジョブについてのジョブクラスを
ジョブクラス情報取得手段E32に与えて、そのジョブ
クラスに対するホストコンピュータH3mの指定を取得
するかの何れかにより、その指定を新たなジョブ制御情
報としてジョブ管理情報保持手段A34に登録するとと
もに、そのホストコンピュータH3nで実行していた障
害のジョブに対する再実行要求を行っている。
Therefore, when a failure occurs, the host failure recognition means A31 of the host computer H31 causes the host monitoring apparatus G31 to cause a failure in the host computer H3.
When n is notified and recognized to refer to the job control information of the job management information holding unit A34, and the host computer for re-executing the job is not specified in the job management information holding unit A34 In addition, by giving the host information acquisition means E31 that the failure is the host computer H3n, the designation of the host computer H3m corresponding to the host computer H3n is acquired, or the job class of the failed job is acquired as the job class information. The designation is given to the means E32 to obtain the designation of the host computer H3m for the job class, and the designation is registered in the job management information holding means A34 as new job control information and executed by the host computer H3n. To the job of the fault that was It is doing the re-execution request.

【0043】そして、ホストコンピュータH31のジョ
ブ再実行準備手段A32は、ホスト障害認識手段A31
からジョブの再実行要求を受けて、ジョブ管理情報保持
手段A34のジョブ制御情報を参照し、そのジョブ制御
情報により指示されたホストコンピュータH3mに対す
るジョブの再スケジュール要求を行っている。
The job re-execution preparation means A32 of the host computer H31 is then connected to the host failure recognition means A31.
In response to the job re-execution request from the job control information holding unit A34, the job re-scheduling request is issued to the host computer H3m designated by the job control information.

【0044】一方、ホストコンピュータH31のジョブ
スケジュール手段A33は、ジョブ制御言語翻訳手段B
32からのジョブ制御情報を検索して、ホストコンピュ
ータH31,…H3m,…H3n,……により実行すべ
きジョブのスケジューリングを行い、ジョブ再実行準備
手段A32からのホストコンピュータH3mに対するジ
ョブの再スケジュール要求を受けたときには、ジョブの
再スケジューリングを行うことにより、ホストコンピュ
ータH3mに対してホストコンピュータH3nのジョブ
の再実行を要求している。
On the other hand, the job scheduling means A33 of the host computer H31 is the job control language translation means B.
.. H3m, ... H3n, ... Scheduling of the job to be executed by the host computers H31, ... H3m, ..., And the job re-scheduling request from the job re-execution preparation means A32 to the host computer H3m. When the job is received, the job is rescheduled to request the host computer H3m to reexecute the job of the host computer H3n.

【0045】そこで、ジョブスケジュール手段A33か
らのスケジュールに基いたジョブの実行要求がある場合
に、ホストコンピュータH3mのジョブ起動手段A35
は、実行を要求されたジョブの実行プログラムA36を
起動している。
Therefore, when there is a job execution request from the job scheduling means A33 based on the schedule, the job starting means A35 of the host computer H3m.
Has started the execution program A36 of the job requested to be executed.

【0046】なお、以上に述べた各実施例では、ホスト
コンピュータに障害が発生したときジョブの再実行を行
うためのホストコンピュータを様々な方法で定めている
が、これらの方法を種々に組合わせて、各々の優先順序
をジョブ管理情報保持手段やシステム定義情報保持手段
に保持しておくことにより、再実行を行うべきホストコ
ンピュータを適切に定めることができる。
In each of the embodiments described above, the host computer for re-executing the job when a failure occurs in the host computer is defined by various methods, but these methods are combined in various ways. By holding each priority order in the job management information holding means and the system definition information holding means, the host computer to be re-executed can be appropriately determined.

【0047】[0047]

【発明の効果】以上に説明したように、本発明の疎結合
多重システムのジョブ再実行制御方式は、ジョブを実行
中のホストコンピュータに障害が発生した場合に、その
ホストコンピュータの障害の回復を待たずに、他のホス
トコンピュータにより速やかにそのジョブの再実行を行
うことができるという効果を有している。
As described above, according to the job re-execution control method of the loosely coupled multiple system of the present invention, when a failure occurs in the host computer that is executing a job, the failure recovery of the host computer is performed. There is an effect that the job can be promptly re-executed by another host computer without waiting.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の疎結合多重システムのジョブ再実行制
御方式の第1の実施例を示したブロック図である。
FIG. 1 is a block diagram showing a first embodiment of a job re-execution control method for a loosely coupled multiplex system according to the present invention.

【図2】第1の実施例のジョブの投入処理時の動作の一
例を示す流れ図である。
FIG. 2 is a flowchart showing an example of an operation at the time of a job input process of the first embodiment.

【図3】第1の実施例におけるホストコンピュータの障
害発生時の動作の一例を示した流れ図である。
FIG. 3 is a flow chart showing an example of operation when a failure occurs in the host computer in the first embodiment.

【図4】本発明の疎結合多重システムのジョブ再実行制
御方式の第2の実施例を示したブロック図である。
FIG. 4 is a block diagram showing a second embodiment of the job re-execution control method of the loosely coupled multiplex system according to the present invention.

【図5】本発明の疎結合多重システムのジョブ再実行制
御方式の第3の実施例を示したブロック図である。
FIG. 5 is a block diagram showing a third embodiment of the job re-execution control system of the loosely coupled multiplex system according to the present invention.

【図6】本発明の疎結合多重システムのジョブ再実行制
御方式の第4の実施例を示したブロック図である。
FIG. 6 is a block diagram showing a fourth embodiment of the job re-execution control method for the loosely coupled multiplex system according to the present invention.

【符号の説明】[Explanation of symbols]

A1,A11,A21,A31 ホスト障害認識手段 A2,A12,A22,A32 ジョブ再実行準備手
段 A3,A13,A23,A33 ジョブスケジュール
手段 A4,A14,A24,A34 ジョブ管理情報保持
手段 A5,A15,A25,A35 ジョブ起動手段 A6,A16,A26,A36 実行プログラム B1,B11,B21,B31 ジョブ制御言語 B2,B12,B22,B32 ジョブ制御言語翻訳
手段 C11 端末 C12 ジョブ実行ホスト登録手段 D21 利用者管理情報格納手段 D22 利用者管理情報取得手段 E31 ホスト情報取得手段 E32 ジョブクラス情報取得手段 F31 システム定義情報保持手段 G1,G11,G21,G31 ホスト監視装置 H1,〜Hm,〜Hn,〜,H11,〜H1m,〜H1
n,〜,H21,〜H2m,〜H2n,〜,H31,〜
H3m,〜H3n,〜, ホストコンピュータ
A1, A11, A21, A31 Host failure recognition means A2, A12, A22, A32 Job re-execution preparation means A3, A13, A23, A33 Job scheduling means A4, A14, A24, A34 Job management information holding means A5, A15, A25 , A35 Job activation means A6, A16, A26, A36 Execution programs B1, B11, B21, B31 Job control language B2, B12, B22, B32 Job control language translation means C11 Terminal C12 Job execution host registration means D21 User management information storage Means D22 User management information acquisition means E31 Host information acquisition means E32 Job class information acquisition means F31 System definition information holding means G1, G11, G21, G31 Host monitoring devices H1, ~ Hm, ~ Hn, ~, H11, ~ H1m, ~ H1
n, ~, H21, ~ H2m, ~ H2n, ~, H31, ~
H3m, ~ H3n, ~, Host computer

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 複数のホストコンピュータと前記ホスト
コンピュータの各々に接続して前記ホストコンピュータ
の何れかに障害が発生した場合には他の前記ホストコン
ピュータに障害が発生したことを通知するホスト監視装
置とを備えた疎結合多重システムのジョブ再実行制御方
式において、 第1の前記ホストコンピュータには、(A)前記ホスト
コンピュータ内に投入されたジョブに対するジョブ制御
情報を保持するジョブ管理情報保持手段と、(B)ジョ
ブ制御言語を入力して翻訳するとともに、ジョブ制御言
語により第2の前記ホストコンピュータに障害が発生し
たときジョブの再実行を行うべき第3の前記ホストコン
ピュータが指定されている場合に、その指定をジョブ制
御情報として前記ジョブ管理情報保持手段に登録するジ
ョブ制御言語翻訳手段と、(C)障害の発生時には前記
ホスト監視装置から障害を起した第2の前記ホストコン
ピュータを通知されて認識することにより、前記ジョブ
管理情報保持手段のジョブ制御情報を参照して、第2の
前記ホストコンピュータで実行中のジョブに対する再実
行要求を行うホスト障害認識手段と、(D)前記ホスト
障害認識手段からジョブの再実行要求を受けることによ
って、前記ジョブ管理情報保持手段のジョブ制御情報を
参照し、そのジョブ制御情報で指示された第3の前記ホ
ストコンピュータに対するジョブの再スケジュール要求
を行うジョブ再実行準備手段と、(E)前記ジョブ制御
言語翻訳手段からのジョブ制御情報を受けることによっ
て複数の前記ホストコンピュータで実行すべきジョブの
スケジューリングを行い、前記ジョブ再実行準備手段の
第3の前記ホストコンピュータに対するジョブの再スケ
ジュール要求を受けてジョブの再スケジューリングを行
うことによって第3の前記ホストコンピュータに対して
第2の前記ホストコンピュータのジョブの再実行を要求
するジョブスケジュール手段と、を備えるとともに、複
数の前記ホストコンピュータの各々には、(F)前記ジ
ョブスケジュール手段からスケジュールに基いたジョブ
の実行要求がある場合に、実行を要求されたジョブの実
行プログラムを起動するジョブ起動手段、を備えること
を特徴とする疎結合多重システムのジョブ再実行制御方
式。
1. A host monitoring device connected to a plurality of host computers and each of the host computers, and when any one of the host computers fails, the host monitoring device notifies the other host computer of the failure. In a job re-execution control method for a loosely coupled multiplex system, the first host computer includes (A) job management information holding means for holding job control information for a job input in the host computer. (B) When the job control language is input and translated, and the job control language designates the third host computer to re-execute the job when a failure occurs in the second host computer. The job whose registration is registered in the job management information holding means as job control information The language translation means and (C) when the failure occurs, the host monitoring apparatus notifies the second host computer of the failure and recognizes it, thereby referring to the job control information of the job management information holding means. And (D) receiving the job re-execution request from the host failure recognizing means, and thereby executing the job management information holding means. Job re-execution preparation means for making a job re-scheduling request to the third host computer designated by the job control information, and (E) job control from the job control language translation means. Receives information to schedule jobs for execution on multiple host computers Receiving a job re-scheduling request for the third host computer by the job re-execution preparation means and re-scheduling the job to re-execute the job of the second host computer to the third host computer. A job scheduling unit that requests execution, and (F) a job requested to be executed when each of the plurality of host computers has a job execution request based on the schedule from the job scheduling unit. A job re-execution control method for a loosely coupled multiplex system, comprising:
【請求項2】(A)障害が発生したときにジョブの再実
行を行うための請求項1記載のホストコンピュータの指
定が行われていない場合や行われているその指定を変更
したい場合に、第2の前記ホストコンピュータに障害が
発生したときジョブの再実行を行うべき第3の前記ホス
トコンピュータの指定を入力する端末と、(B)前記端
末から第2の前記ホストコンピュータに障害が発生した
ときジョブの再実行を行うべき第3の前記ホストコンピ
ュータを指定した場合に、その指定を新たなジョブ制御
情報として前記ジョブ管理情報保持手段内に登録するジ
ョブ再実行ホスト登録手段と、を第1の前記ホストコン
ピュータに対して備えることを特徴とする請求項1記載
の疎結合多重システムのジョブ再実行制御方式。
2. A host computer according to claim 1 for re-executing a job when a failure occurs (A) is not specified or the specified specification is changed, When a failure occurs in the second host computer, a terminal for inputting a designation of the third host computer which should re-execute the job, and (B) a failure occurs in the second host computer from the terminal. When the third host computer to re-execute the job is designated, the job re-execution host registration means for registering the designation as new job control information in the job management information holding means is provided. The job re-execution control method for a loosely coupled multiple system according to claim 1, wherein the job re-execution control method is provided for the host computer.
【請求項3】(A)障害が発生したときにジョブの再実
行を行うための請求項1記載のホストコンピュータの指
定を利用者ごとに格納する利用者管理情報格納手段と、
(B)障害のジョブの利用者に対して、前記利用者管理
情報格納手段からジョブの再実行を行うための前記ホス
トコンピュータの指定を取得する利用者管理情報取得手
段と、(C)第2の前記ホストコンピュータに障害が発
生したときに、請求項1記載のジョブ管理情報保持手段
にジョブの再実行を行うための前記ホストコンピュータ
の指定が行われていない場合には、障害のジョブの利用
者を前記利用者管理情報取得手段に与えることによっ
て、その利用者に対する前記ホストコンピュータの指定
を取得し、その指定を新たなジョブ制御情報として前記
ジョブ管理情報保持手段内に登録するとともに障害のジ
ョブに対する再実行要求を行う請求項1記載のホスト障
害認識手段と、を第1の前記ホストコンピュータに対し
て備えることを特徴とする請求項1記載の疎結合多重シ
ステムのジョブ再実行制御方式。
3. (A) User management information storage means for storing the designation of the host computer according to claim 1 for re-executing a job when a failure occurs,
(B) a user management information acquisition unit for acquiring the designation of the host computer for re-executing the job from the user management information storage unit for the user of the faulty job; and (C) the second. If the host computer for re-execution of the job is not designated in the job management information holding means according to claim 1 when a failure occurs in the host computer, the use of the failed job A user to the user management information acquisition unit to acquire the designation of the host computer for the user, register the designation as new job control information in the job management information holding unit, and perform a job failure Host failure recognition means according to claim 1 for making a re-execution request to the first host computer. Claim 1 job re-execution control method of the loosely coupled multiplexing system according to.
【請求項4】(A)障害が発生したときにジョブの再実
行を行うための請求項1記載のホストコンピュータの指
定を前記ホストコンピュータごとに保持するシステム定
義情報保持手段と、(B)障害が発生した第2の前記ホ
ストコンピュータに対して前記システム定義情報保持手
段からジョブの再実行を行うための前記ホストコンピュ
ータの指定を取得するホスト情報取得手段と、(C)第
2の前記ホストコンピュータに障害が発生したときに、
請求項1記載のジョブ管理情報保持手段にジョブの再実
行を行うための前記ホストコンピュータの指定が行われ
ていない場合には、第2の前記ホストコンピュータであ
ることを前記ホスト情報取得手段に与えることにより、
第2の前記ホストコンピュータに対する第3の前記ホス
トコンピュータの指定を取得し、その指定を新たなジョ
ブ制御情報として前記ジョブ管理情報保持手段内に登録
するとともに障害のジョブに対する再実行要求を行う請
求項1記載のホスト障害認識手段と、を第1の前記ホス
トコンピュータに対して備えることを特徴とする請求項
1記載の疎結合多重システムのジョブ再実行制御方式。
4. (A) System definition information holding means for holding the designation of a host computer according to claim 1 for re-executing a job when a fault occurs, and (B) a fault. (C) the second host computer, which acquires the designation of the host computer for re-executing the job from the system definition information holding means for the second host computer in which When a failure occurs,
When the host computer for re-execution of the job is not designated in the job management information holding means according to claim 1, the second host computer is given to the host information acquisition means. By
A method of acquiring a designation of the third host computer for the second host computer, registering the designation as new job control information in the job management information holding means, and requesting re-execution of the failed job. 2. The job re-execution control method for a loosely coupled multiplex system according to claim 1, further comprising: host failure recognition means according to claim 1 for the first host computer.
【請求項5】(A)障害が発生したときにジョブの再実
行を行うための請求項1記載のホストコンピュータの指
定を各々のジョブクラスごとに保持するシステム定義情
報保持手段と、(B)障害のジョブのジョブクラスに対
して前記システム定義情報保持手段からのジョブの再実
行を行うための前記ホストコンピュータの指定を取得す
るジョブクラス情報取得手段と、(C)第2の前記ホス
トコンピュータに障害が発生したときに、請求項1記載
のジョブ管理情報保持手段にジョブの再実行を行うため
の前記ホストコンピュータの指定が行われていない場合
には、障害のジョブについてのジョブクラスを前記ジョ
ブクラス情報取得手段に与えることにより、そのジョブ
クラスに対する第3の前記ホストコンピュータの指定を
取得して、その指定を新たなジョブ制御情報として前記
ジョブ管理情報保持手段内に登録するとともに障害のジ
ョブに対する再実行要求を行う請求項1記載のホスト障
害認識手段と、を第1の前記ホストコンピュータに対し
て備えることを特徴とする請求項1記載の疎結合多重シ
ステムのジョブ再実行制御方式。
5. (A) System definition information holding means for holding the designation of the host computer according to claim 1 for re-executing a job when a failure occurs, and (B) Job class information acquisition means for acquiring the designation of the host computer for re-executing the job from the system definition information holding means for the job class of the faulty job; and (C) the second host computer. When a failure occurs, if the host computer for re-execution of the job is not specified in the job management information holding unit according to claim 1, the job class of the failed job is set to the job class. By giving it to the class information acquisition means, the designation of the third host computer for the job class is obtained and the instruction is given. Host fault recognition means according to claim 1, wherein the host failure recognition means is registered as new job control information in the job management information holding means, and a re-execution request is issued to the failed job. 2. The job re-execution control method for the loosely coupled multiple system according to claim 1.
JP5318812A 1993-12-20 1993-12-20 Job reexecution control method for loosely-coupled multiplexing system Pending JPH07175766A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5318812A JPH07175766A (en) 1993-12-20 1993-12-20 Job reexecution control method for loosely-coupled multiplexing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5318812A JPH07175766A (en) 1993-12-20 1993-12-20 Job reexecution control method for loosely-coupled multiplexing system

Publications (1)

Publication Number Publication Date
JPH07175766A true JPH07175766A (en) 1995-07-14

Family

ID=18103225

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5318812A Pending JPH07175766A (en) 1993-12-20 1993-12-20 Job reexecution control method for loosely-coupled multiplexing system

Country Status (1)

Country Link
JP (1) JPH07175766A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007287171A (en) * 2002-10-25 2007-11-01 Mentor Graphics Corp Method and apparatus for distributing operation to remote computer, and storage medium

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007287171A (en) * 2002-10-25 2007-11-01 Mentor Graphics Corp Method and apparatus for distributing operation to remote computer, and storage medium

Similar Documents

Publication Publication Date Title
US20070220350A1 (en) Memory dump method, memory dump program and computer system
CN109726135B (en) Multi-core debugging method and device and computer readable storage medium
US8381210B2 (en) Method and computer for synchronous scheduling of multiple virtual CPUs
EP3090336A1 (en) Checkpointing systems and methods of using data forwarding
US10379931B2 (en) Computer system
US9070051B2 (en) Image forming apparatus and control method for enabling proper execution of setting and power-off of the image forming apparatus
JPH07175766A (en) Job reexecution control method for loosely-coupled multiplexing system
JP6752440B2 (en) Print control unit, printing system and program
CN113742139A (en) Method and system for providing access to resources
JPH10326201A (en) Distributed batch job processing system and method for automatically re-activating job at the time of failure of the system
JP6795646B2 (en) Recovery support system, recovery support method and recovery support program
CN113312209A (en) Data hot standby method, device, server and storage medium
JP2575761B2 (en) Job management method
JPH07114517A (en) Program execution control system of multiprocessor system
JPH07306800A (en) Debugging system
JP2010140106A (en) Job execution system, method of taking over job flow used therein, and job flow takeover control program
CN116339788A (en) System updating method, device, equipment and storage medium of big data platform
JPS62113238A (en) Correction system for program of electronic computer system
CN117312092A (en) Multi-core MCU monitoring method and device, vehicle and readable storage medium
JP2555386B2 (en) Electronic computer system
JPH06295247A (en) Real time processing realizing method
JPH0644198A (en) System for restarting job check point
JPH04149644A (en) Fault processor
JPH0378034A (en) Program parallel execution device
JPS62106549A (en) Multi-processor system

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19990406