JPS6362007B2 - - Google Patents

Info

Publication number
JPS6362007B2
JPS6362007B2 JP59213182A JP21318284A JPS6362007B2 JP S6362007 B2 JPS6362007 B2 JP S6362007B2 JP 59213182 A JP59213182 A JP 59213182A JP 21318284 A JP21318284 A JP 21318284A JP S6362007 B2 JPS6362007 B2 JP S6362007B2
Authority
JP
Japan
Prior art keywords
file
processing
data
control information
recovery
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP59213182A
Other languages
Japanese (ja)
Other versions
JPS6191730A (en
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed filed Critical
Priority to JP59213182A priority Critical patent/JPS6191730A/en
Publication of JPS6191730A publication Critical patent/JPS6191730A/en
Publication of JPS6362007B2 publication Critical patent/JPS6362007B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 発明の目的 産業上の利用分野 本発明は、電子計算機システムの業務処理ジヨ
ブにソフトウエア障害が発生した時に、オペレー
ター等の人手を介さず自動的に復旧処理を行う自
動復旧処理方式に関する。
[Detailed Description of the Invention] Purpose of the Invention Industrial Application Field The present invention is an automatic system that automatically performs recovery processing without human intervention such as an operator when a software failure occurs in a business processing job of a computer system. Regarding recovery processing method.

従来の技術 従来、電子計算機システムにおけるソウトウエ
ア障害時の復旧処理の方式は、ソフトウエア障害
の原因をサポートSE(プログラマ)やオペレータ
がメモリ・ダンプ、フアイル・ダンプ、トレー
ス・ダンプ等により得られるリストから捜し出し
て、次のようないずれかの方法で処理するのが一
般的である。
Conventional technology Conventionally, the method of recovery processing when a software failure occurs in a computer system is to identify the cause of the software failure by a support system engineer (programmer) or operator from a list obtained from a memory dump, file dump, trace dump, etc. It is common to find them and process them using one of the following methods.

すなわち、第1の方法は障害原因の除去と以後
の障害を回避するために、まずプログラム等を修
正し、引続き、更新途中のフアイルの復元を行い
修正プログラムを起動し、再処理を行う。
That is, in the first method, in order to eliminate the cause of the failure and avoid future failures, the program, etc. is first corrected, then the file that is being updated is restored, the corrected program is activated, and reprocessing is performed.

第2の方法は、障害を誘発したデータの削除と
更新途中フアイルの復元を行つた後、障害を起こ
したプログラムを再起動して再処理を行うもので
ある。なお、プログラムの修正と削除したデータ
の処理は、後日、十分な検討を加えたのち行われ
る。
The second method is to delete the data that caused the failure and restore the file that is being updated, then restart the program that caused the failure and perform reprocessing. Please note that modifications to the program and processing of deleted data will be made at a later date after thorough consideration.

発明が解決しようとする問題点 上記従来のソフトウエア障害復旧処理は、サポ
ートSEやオペレータが膨大な量のリストから障
害原因を探索することを必要としており、探索漏
れによる復旧の失敗や探索に長い時間を要する等
のためシステム稼動率が低下するという問題があ
る。
Problems to be Solved by the Invention The above-mentioned conventional software failure recovery processing requires support system engineers and operators to search for the cause of the failure from a huge list, resulting in recovery failures due to omissions in the search, and long search times. There is a problem that the system operation rate decreases because it takes time.

また、メモリ・ダンプ、フアイル・ダンプ等に
よるリストは16進数に変換されて表示されている
ため、障害原因の探索を行う者がリストの内容を
解釈できる程度の知識を有する必要があり、この
ため復旧処理に携われる作業者が限定されてしま
うという問題もある。
In addition, since lists from memory dumps, file dumps, etc. are converted into hexadecimal numbers and displayed, the person searching for the cause of the failure must have sufficient knowledge to interpret the contents of the list. There is also the problem that the number of workers who can be involved in the recovery process is limited.

発明の構成 問題点を解決するための手段 上記従来技術の問題点を解決する本発明の自動
復旧処理システムは、業務処理ジヨブにおけるソ
フトウエア障害の発生に対処して、障害誘発デー
タの削除方法、更新フアイルの復元方法及び再起
動方法を含む復旧制御情報を予め格納しておく復
旧制御情報フアイルと、業務処理ジヨブが発する
入出力要求を、フアイル・アクセス通番、アクセ
ス中の入出力フアイル及びレコード・アドレスを
記録するインタフエース制御情報記録手段によつ
て管理しつつオペレーテイング・システムの入出
力マクロ命令に変換するインタフエース制御手段
と、業務処理ジヨブにおけるソフトウエア障害の
発生時に、復旧制御情報フアイル及びインタフエ
ース制御情報記録手段を参照して障害誘発データ
の削除及び更新フアイルの復元を行うと共に、復
旧制御情報によつて指定された方法で業務処理ジ
ヨブを再起動する手段とを備えるように構成され
ている。
Means for Solving the Problems of Structure of the Invention The automatic recovery processing system of the present invention that solves the problems of the prior art described above provides a method for deleting fault-inducing data in response to the occurrence of a software fault in a business processing job. A recovery control information file that stores recovery control information including how to restore and restart updated files, and input/output requests issued by business processing jobs, file access sequence numbers, input/output files being accessed, and records. An interface control means that records addresses and converts them into operating system input/output macro instructions while managing them by an interface control information recording means that records addresses, and a recovery control information file and The system is configured to refer to the interface control information recording means to delete failure-inducing data and restore update files, and to restart the business processing job in a method specified by the recovery control information. ing.

以下、本発明の作用を実施例によつて詳細に説
明する。
Hereinafter, the effects of the present invention will be explained in detail by way of examples.

実施例 第1図は、本発明の自動復旧処理システムの構
成の一例を示す機能ブロツク図である。
Embodiment FIG. 1 is a functional block diagram showing an example of the configuration of an automatic recovery processing system of the present invention.

このシステムによつて自動復旧処理される業務
処理ジヨブ1は、この業務処理ジヨブ1に入力す
るデータを格納する入力フアイル2と、業務処理
ジヨブ1によつて更新される更新フアイル3と、
業務処理ジヨブ1の出力データを格納する出力フ
アイル4を使用して業務処理ジヨブを実行する。
The business processing job 1 that is automatically restored by this system includes an input file 2 that stores data input to the business processing job 1, an update file 3 that is updated by the business processing job 1,
The business processing job is executed using the output file 4 that stores the output data of the business processing job 1.

上記業務処理ジヨブ1に対する自動復旧処理シ
ステムを構成するインタフエース制御部10は、
フアイル・アクセス通番(業務処理ジヨブ1が行
う入出力要求の回数)と入出力レコードの格納媒
体上のアドレス等を記憶するインタフエース制御
情報テーブル100を備え、業務処理ジヨブ1が
行う入出力要求を、インタフエース制御情報テー
ブル100を参照しつつ一括管理すると共に、上
記入出力要求をオペレーテイング・システム(以
下「OS」と略称する)の入出力マクロ命令に変
換してOSに渡す。
The interface control unit 10 configuring the automatic recovery processing system for the business processing job 1 includes:
It includes an interface control information table 100 that stores file access sequence numbers (the number of input/output requests made by business processing job 1) and addresses on the storage medium of input/output records, and handles input/output requests made by business processing job 1. , while referring to the interface control information table 100 and converting the input/output requests into input/output macro commands of the operating system (hereinafter referred to as "OS") and passing them to the OS.

20はジヨブ制御部であり、これは業務処理ジ
ヨブ1のソフトウエア障害発生時に当該業務処理
ジヨブを自動復旧するのに必要な復旧制御情報
(障害誘発データとして削除すべきデータ情報、
更新フアイルの復元方法、業務処理ジヨブの再起
動方法等)を記録する復旧制御情報フアイル20
0を備え、ソフトウエア障害発生時に、復旧制御
情報フアイル200と上記インタフエース制御情
報テーブル100を参照して障害誘発データを決
定しかつ復旧後の障害発生業務処理ジヨブの再起
動を行う。
Reference numeral 20 denotes a job control unit, which stores recovery control information (data information to be deleted as failure-inducing data,
Recovery control information file 20 that records information on how to restore updated files, how to restart business processing jobs, etc.
0, and when a software failure occurs, the failure-inducing data is determined by referring to the recovery control information file 200 and the interface control information table 100, and the failure-occurring business processing job is restarted after recovery.

30は、自動運転制御部であり、これは、復旧
制御情報フアイル200を参照して復旧処理のた
めの資源を確保しつつ復旧処理要求を行い、かつ
復旧完了後の資源の変更と障害発生業務処理ジヨ
ブの再起動要求を行う。
Reference numeral 30 denotes an automatic operation control unit that refers to the recovery control information file 200 and requests recovery processing while securing resources for recovery processing, and also changes resources and handles failure-occurring operations after recovery is completed. Requests restart of processing job.

40と50はそれぞれデータ削除処理部とフア
イル復元処理部であり、これらは、自動運転制御
部からの上記復旧処理要求を受けて、それぞれ障
害誘発データの削除と更新途中フアイルの復元を
行う。
Reference numerals 40 and 50 denote a data deletion processing unit and a file restoration processing unit, respectively, which delete failure-inducing data and restore files that are being updated, respectively, in response to the above restoration processing request from the automatic operation control unit.

ソフトウエア障害発生時の自動復旧処理を可能
にするため、操作者が業務処理ジヨブ実行前にそ
の業務形態に応じて設定した復旧制御情報を予め
記録しておくための復旧制御情報フアイル200
が備えられる。第2図乃至第4図は、制御情報フ
アイル200に記録される3種の復旧制御情報を
例示している。
A recovery control information file 200 for recording in advance recovery control information set by an operator according to the business type before executing a business processing job in order to enable automatic recovery processing when a software failure occurs.
will be provided. 2 to 4 illustrate three types of recovery control information recorded in the control information file 200.

第2図はジヨブ制御情報201の構成の一例を
示す概念図であり、これらは、業務処理ジヨブご
とに作成される。ジヨブ制御情報201は、 (1) 業務処理ジヨブ名 (2) 当該業務処理ジヨブで使用する業務処理プロ
グラム名 (3) 障害発生業務処理プログラムを復旧後に再起
動する際の形態 (4) 再起動形態がチエツクポイント・リスタート
である場合に展開するチエツクポイント情報の
格納先 (5) リスタートすべきチエツクポイントの番号 (6) ソフトウエア障害が発生した際削除され得る
データの処理形態 及び (7) データ削除処理形態ごとの情報 を含んでいる。
FIG. 2 is a conceptual diagram showing an example of the structure of job control information 201, which is created for each business processing job. The job control information 201 includes (1) the business processing job name, (2) the business processing program name used in the business processing job, (3) the format for restarting the failed business processing program after recovery, and (4) the restart format. Storage location of checkpoint information that is expanded when is a checkpoint restart (5) Checkpoint number to be restarted (6) Processing form of data that can be deleted when a software failure occurs, and (7) Contains information for each type of data deletion processing.

上記データ削除処理形態(6)は、次の4種類の中
から業務の運用に応じた最適のものが操作者によ
つて業務処理ジヨブの開始前に復旧制御情報フア
イル200に設定される。
The data deletion processing format (6) is set by the operator in the recovery control information file 200 before starting a business processing job, from among the following four types, depending on the operation of the business.

形態1:データ削除を行なわない。 Form 1: Data is not deleted.

形態2:最近にアクセスした入力フアイルのレ
コードを削除する。
Type 2: Delete records of recently accessed input files.

形態3:入力フアイルが複数の場合、現在処理
中のレコードの中で、最小のキー値を持つレ
コードを探索し、その入力フアイル中同一キ
ーを持つレコードを削除する。
Form 3: When there are multiple input files, a record with the smallest key value is searched among the records currently being processed, and records with the same key from the input file are deleted.

形態4:入力フアイルが複数の場合、削除処理
フアイル名と削除キー値を指定しておき、現
在処理中レコードの中で削除対応フアイル名
と削除キーを探索し、そのフアイル中、同一
キー値を持つレコードを削除する。
Form 4: When there are multiple input files, specify the deletion processing file name and deletion key value, search for the deletion compatible file name and deletion key in the record currently being processed, and search for the same key value in the file. Delete the record you have.

第3図は、第1図の復旧制御情報フアイル20
0内に記録される使用フアイル情報202の構成
の一例を示す概念図である。この使用フアイル情
報202は、各業務処理ジヨブが使用する全フア
イルの管理情報であり、 (1) 業務処理ジヨブ名 (2) 当該業務処理ジヨブで使用する使用フアイル
の数 (3) 上記使用フアイルの内部フアイル名(論理ふ
名) (4) 上記使用フアイルの外部フアイル名(実フア
イル) (5) 上記使用フアイルが入力フアイル、出力フア
イルまたは更新フアイルのいずれであるかの区
別 及び (6) 上記使用フアイル割当てに必要な情報 を含んでいる。なお、上記情報(3)乃至(6)は、使用
フアイル数分繰り返されている。
FIG. 3 shows the recovery control information file 20 in FIG.
2 is a conceptual diagram showing an example of the configuration of used file information 202 recorded in 0. This used file information 202 is management information for all files used by each business processing job, and includes (1) business processing job name, (2) number of used files used by the business processing job, and (3) information on the above-mentioned files used. Internal file name (logical name) (4) External file name of the file used above (actual file) (5) Distinction whether the file used above is an input file, output file or update file, and (6) Used above Contains information necessary for file allocation. Note that the above information (3) to (6) is repeated for the number of files used.

第4図は、第1図の復旧制御情報フアイル20
0に記録されるフアイル復元処理情報203の構
成の一例を示す概念図であり、これは更新フアイ
ルごとに作成される。このフアイル復元処理情報
203は、 (1) 更新フアイルの外部フアイル名 (2) 上記更新フアイルを使用する業務処理ジヨブ
名 (3) 更新フアイルの復元処理形態 (4) 更新フアイルの復元を行うフアイル復元ジヨ
ブ名 (5) フアイル復元ジヨブが復元処理を行うための
力フアイル名 (6) 更新フアイルの媒体種類(デイスク、ドラ
ム、テープ等) (7) 更新フアイルが二重化フアイルであるか否か
の区別 及び (8) 更新フアイル領域の割当てに必要な情報を含
んでいる。
FIG. 4 shows the recovery control information file 20 in FIG.
2 is a conceptual diagram showing an example of the configuration of file restoration processing information 203 recorded in 0. This is created for each updated file. This file restoration processing information 203 includes: (1) External file name of the updated file (2) Business process job name that uses the above updated file (3) Restoration processing type of the updated file (4) File restoration for restoring the updated file Job name (5) Name of the file used by the file restoration job to perform restoration processing (6) Media type of the updated file (disk, drum, tape, etc.) (7) Distinction of whether the updated file is a duplicated file and (8) Contains information necessary for allocating update file area.

本実施例においては、以下のような4種の更新
フアイル復元処理形態のうちのいずれかが、業務
処理ジヨブの開始前に復旧制御情報フアイル20
0に設定される。
In this embodiment, one of the following four types of update file restoration processing modes is used to restore the restoration control information file 20 before starting a business processing job.
Set to 0.

a 予め保存されている保存フアイル5を、障害
を起こした更新フアイル3に、再ロードする。
a. Reload the previously saved save file 5 onto the failed update file 3.

b 障害を起こした更新フアイルを、ジヤーナ
ル・フアイルの更新前情報で塗り直す。
b. Repaint the update file that caused the problem with the pre-update information from the journal file.

但し、ジヤーナル・フアイルは、OSによつ
て履歴管理される。
However, the history of journal files is managed by the OS.

c 障害を起こした更新フアイルに、保存フアイ
ルをロードし、ジヤーナルフアイル4に格納さ
れている更新後情報で塗り直す。
c Load the saved file into the updated file that caused the failure and repaint it with the updated information stored in the journal file 4.

d フアイル作成処理をやり直す。d. Redo the file creation process.

第5図は、第1図のインタフエース制御情報テ
ーブル100の構成の一例を示す概念図である。
インタフエース制御情報テーブル100は、イン
タフエース制御部10によつて、業務処理ジヨブ
ごとに作成される。
FIG. 5 is a conceptual diagram showing an example of the configuration of the interface control information table 100 shown in FIG.
The interface control information table 100 is created by the interface control unit 10 for each business processing job.

これらインタフエース制御情報テーブルは、第
5図に示すように、当該業務処理ジヨブが要求し
た入出力の回数を記録するインタフエース制御処
理制御情報101と、当該業務処理ジヨブの各タ
クスによつて入出力されるフアイルの現アクセス
ポイントを記録するフアイル・アクセス―パラメ
ーター・テーブル(以下「FAPテーブル」と称
する)101―1,102―2,……102―n
とから構成される。
As shown in FIG. 5, these interface control information tables include interface control processing control information 101 that records the number of inputs and outputs requested by the relevant business processing job, and information input by each task of the relevant business processing job. File access-parameter table (hereinafter referred to as "FAP table") 101-1, 102-2, ... 102-n that records the current access point of the file to be output.
It consists of

さらに上記FAPテーブルは、第6図で示すよ
うに、各タスクが使用するフアイル毎のフアイ
ル・アクセス―パラメーター情報(以下「FAP
情報」と称する)103―1,103―2,……
103―m から構成される。
Furthermore, as shown in Figure 6, the above FAP table contains file access parameter information (hereinafter referred to as "FAP") for each file used by each task.
103-1, 103-2,...
It consists of 103-m.

第7図は、第5図に示すインタフエース制御処
理制御情報101の構成の一例を示す概念図であ
る。このインタフエース制御処理制御情報101
は、 (1) フアイル・アクセス通番(インタフエース制
御部10が業務処理ジヨブ1の入出力要求に基
づいてOSに発行するOSの入出力マクロ命令の
発行回数であり、ジヨブ単位で一連番号が付さ
れる) (2) 業務処理ジヨブ1の実行中のタスク数(=
FAPテーブル数) 及び (3) 実行中の各タスクが使用するフアイルを管理
するFAPテーブルのアドレス・リスト(先頭
番地のリスト) を含んでいる。上記アドレス・リストは、タスク
の数だけ繰り返される。
FIG. 7 is a conceptual diagram showing an example of the configuration of the interface control processing control information 101 shown in FIG. This interface control processing control information 101
(1) File access sequence number (This is the number of OS input/output macro instructions issued by the interface control unit 10 to the OS based on the input/output request of business processing job 1, and a sequence number is assigned for each job. (2) Number of tasks currently being executed for business processing job 1 (=
(number of FAP tables) and (3) address list (list of starting addresses) of the FAP table that manages files used by each task being executed. The above address list is repeated as many times as there are tasks.

第8図は、第6図に示すFAPテーブル102
を管理するFAP情報103の構成の一例を示す
概念図である。このFAP情報103は、 (1) タスク(業務処理プログラム)が使用するフ
アイルの内部フアイル名 (2) 上記フアイルの外部フアイル名 (3) 現在処理中(最新アクセス)レコードのバツ
フア内格納位置 (4) 現在処理中の格納媒体上のレコードアドレス
及び (5) フアイル・アクセス通番 第9図は、第1図に示すインタフエース制御部
10によるインタフエース制御処理の一例を示す
フローチヤートである。
FIG. 8 shows the FAP table 102 shown in FIG.
FIG. 2 is a conceptual diagram showing an example of the configuration of FAP information 103 that manages . This FAP information 103 includes: (1) Internal file name of the file used by the task (business processing program) (2) External file name of the above file (3) Storage location within the buffer of the record currently being processed (latest access) (4) ) Record address on the storage medium currently being processed and (5) File access sequence number FIG. 9 is a flowchart showing an example of interface control processing by the interface control unit 10 shown in FIG.

インタフエース制御部10は、業務処理ジヨブ
1からの入出力要求を受け付けると、インタフエ
ース制御処理を開始する。インタフエース制御部
10は、まずステツプ11において業務処理ジヨ
ブ1からの入出力要求のパラメーターの適否を判
定し、不適の場合はステツプ18においてエラー
コードをセツトし、業務処理ジヨブ1に戻る。パ
ラメーターが正しいときは、ステツプ12に進
み、ここで上記入出力要求に対応するOSの入出
力マクロ命令を発行する。
When the interface control unit 10 receives an input/output request from the business processing job 1, it starts interface control processing. The interface control unit 10 first determines whether the parameters of the input/output request from the business processing job 1 are appropriate in step 11, and if they are inappropriate, sets an error code in step 18 and returns to the business processing job 1. If the parameters are correct, the process advances to step 12, where an OS input/output macro command corresponding to the above input/output request is issued.

インタフエース制御部10は、次のステツプ1
3において、OSに対する入出力マクロ命令発行
後にOSから戻されるリターンコードが正常か否
かを判定する。リターンコードが正常でない(入
出力に失敗した)場合は、ステツプ18に進みエ
ラーコードをセツトして業務処理ジヨブ1に戻
る。
The interface control unit 10 performs the next step 1.
3, it is determined whether the return code returned from the OS after issuing an input/output macro instruction to the OS is normal. If the return code is not normal (input/output has failed), proceed to step 18, set an error code, and return to business processing job 1.

リターンコードが正常(入出力が完了した)の
場合、インタフエース制御部10は、ステツプ1
4と15において、FAP情報103にそれぞれ
レコード格納位置(3)とレコードアドレス(4)を記録
する。次に、インタフエース制御部10は、ステ
ツプ16において、フアイル・アクセス通番をカ
ウントアツプする。インタフエース制御部10
は、次のステツプ17において、カウントアツプ
したフアイル・アクセス通番をFAP情報103
の(5)とインタフエース制御処理制御情報101の
(1)に記録し、インタフエース制御処理を終了す
る。
If the return code is normal (input/output completed), the interface control unit 10 executes step 1.
4 and 15, the record storage position (3) and record address (4) are recorded in the FAP information 103, respectively. Next, in step 16, the interface control unit 10 counts up the file access serial number. Interface control unit 10
In the next step 17, the counted up file access sequence number is stored in the FAP information 103.
(5) and interface control processing control information 101
(1) and end the interface control processing.

第10図は、第1図のシステムにおいて、業務
処理ジヨブ1に障害が発生した場合に、この障害
発生業務処理ジヨブが再起動されるまでの処理の
全体を示すフローチヤートである。
FIG. 10 is a flowchart showing the entire process up to restart of the failed business processing job when a failure occurs in the business processing job 1 in the system of FIG.

削除データ決定処理 ジヨブ制御部20の削除データ決定部21
は、業務処理ジヨブに障害が発生すると、上述
した復旧制御情報フアイル200とインタフエ
ース制御情報テーブル100内の情報を参照し
て、削除データの決定処理を行う。
Deletion data determination processing Deletion data determination unit 21 of job control unit 20
When a failure occurs in a business processing job, the system refers to the information in the recovery control information file 200 and the interface control information table 100 described above to determine data to be deleted.

復旧処理の起動処理 ジヨブ制御部20から復旧処理要求を受けた
自動運転制御部30の復旧処理要求部31は、
データの削除とフアイルの復元に必要な資源の
確保等復旧処理の起動に必要な前処理を行う。
Activation Process of Recovery Process The recovery process requesting unit 31 of the automatic operation control unit 30 receives the recovery process request from the job control unit 20.
Performs preprocessing necessary to start the recovery process, such as securing resources necessary for deleting data and restoring files.

データ削除処理及び.フアイル復元処理デ
ータ削除処理部40とフアイル復元処理部50
のそれぞれは、自動運転制御部30からの起動
によつてデータ削除処理とフアイル復元処理を
行う。
Data deletion processing and. File restoration processing data deletion processing section 40 and file restoration processing section 50
Each of these performs data deletion processing and file restoration processing upon activation from the automatic operation control unit 30.

再起動要求処理 自動運転制御部30の再起動要求部32は、
データ削除処理とフアイル復元処理の終了の通
知を受けると、業務処理ジヨブ1の再起動に必
要な資源の確保等の処理を行う。
Restart request processing The restart request unit 32 of the automatic operation control unit 30
Upon receiving notification of the end of data deletion processing and file restoration processing, processing such as securing resources necessary for restarting business processing job 1 is performed.

再起動処理 ジヨブ制御部20の再起動部22は、自動運
転制御部30の再起動要求部32から再起動指
令を受けると、復旧制御情報フアイル200を
参照し、指定された形態で業務処理ジヨブ1を
再起動する。
Restart Process When the restart unit 22 of the job control unit 20 receives a restart command from the restart request unit 32 of the automatic operation control unit 30, it refers to the recovery control information file 200 and restarts the business processing job in the specified format. Restart 1.

以下、第10図の処理の流れに従つて、各部の
フローチヤートを用い詳細に説明する。
Hereinafter, each part will be explained in detail using a flowchart according to the process flow shown in FIG.

削除データ決定処理 第11図は、ジヨブ制御部20の削除データ決
定部21における、ソフトウエア障害発生時の削
除データ決定処理の一例を示すフローチヤートで
ある。
Deletion Data Determination Process FIG. 11 is a flowchart showing an example of deletion data determination processing in the deletion data determination unit 21 of the job control unit 20 when a software failure occurs.

削除データ決定部21は、業務処理プログラム
による異常終了の通知、または業務処理プログラ
ム例外を起こした場合のOSによるプログラム例
外の通知を受けると、削除データ決定処理を開始
する。
When the deletion data determination unit 21 receives a notification of abnormal termination by a business processing program or a notification of a program exception by the OS when a business processing program exception occurs, the deletion data determination unit 21 starts deletion data determination processing.

削除データ決定部21は、削除データ決定処理
を開始すると、まずステツプ210において、対
応の業務処理プログラムに関する通知内容を解析
し、ソフトウエア障害(論理矛盾プログラム例
外)かどうかをチエツクする。通知内容がソフト
ウエア障害の場合、ステツプ211に進み、この
業務処理ジヨブ内の他の業務処理プログラムを全
て強制終了させる。
When the deletion data determination unit 21 starts the deletion data determination process, first in step 210 it analyzes the content of the notification regarding the corresponding business processing program and checks whether there is a software failure (logically inconsistent program exception). If the content of the notification is a software failure, the process advances to step 211 and all other business processing programs in this business processing job are forcibly terminated.

削除データ決定部21は、次のステツプ212
において、復旧制御情報フアイル200のジヨブ
制御情報201からデータ削除処理形態情報(6)を
読出し、削除データの有無(形態1であるかどう
か)を検査する。削除データがない場合(形態1
の場合)には、復旧処理を行なうことなくステツ
プ215に進む。削除データ決定部21は、ステ
ツプ212において、削除データが存在すること
(形態2,3または4のいずれかの場合)を判定
すると、ステツプ213へ進み、ここで、以下の
処理を行う。
The deletion data determining unit 21 performs the next step 212.
At , the data deletion processing type information (6) is read from the job control information 201 of the recovery control information file 200, and the presence or absence of deleted data (whether it is type 1 or not) is checked. If there is no deleted data (Form 1)
), the process proceeds to step 215 without performing recovery processing. When the deletion data determination unit 21 determines in step 212 that deletion data exists (in the case of any of forms 2, 3, or 4), it proceeds to step 213, where it performs the following processing.

(イ) データ削除処理形態2(最新アクセス入力フ
アイル内の最新アクセスレコードを削除する)
の場合: 削除データ決定部21は、インタフエース制御
処理制御情報101とFAP情報103及び使用
フアイル情報202を参照して最新アクセス入力
フアイルとその最新アクセスレコードを決定し、
以下の情報を削除データ情報として取得する。
(b) Data deletion processing type 2 (deleting the latest access record in the latest access input file)
In the case of: The deletion data determining unit 21 determines the latest access input file and its latest access record by referring to the interface control processing control information 101, FAP information 103, and used file information 202,
Obtain the following information as deleted data information.

(1) 外部フアイル名(実フアイル名) (2) 該当レコードの媒体上のレコード・アドレス
(例えばデイスクの場合、シリンダ・アドレス、
トラツク・アドレス、ブロツク内相対バイト位
置等) (3) ジヨブ名 (4) データ削除処理形態 (ロ) データ処理形態3(最小キー値を持つ入力レ
コードを削除する)の場合: 削除データ決定部21は、ジヨブ制御情報20
1と使用フアイル情報202及びFAP情報10
3を参照し、複数の入力フアイルの現在処理中の
レコードの中で最小キー値を持つ入力レコードを
決定し、上記(イ)の場合と同様の(1)乃至(4)から成る
削除データ情報を取得する。
(1) External file name (actual file name) (2) Record address on the medium of the applicable record (for example, in the case of a disk, cylinder address,
track address, relative byte position within the block, etc.) (3) Job name (4) Data deletion processing format (b) In the case of data processing format 3 (deleting the input record with the minimum key value): Deletion data determination unit 21 is job control information 20
1 and used file information 202 and FAP information 10
3, determine the input record with the minimum key value among the records currently being processed in multiple input files, and delete data information consisting of (1) to (4) similar to the case (a) above. get.

(ハ) データ削除処理形態4(指定フアイルの指定
キー値を持つ入力フアイルのレコードを削除す
る)の場合: 削除データ決定部21は、ジヨブ制御情報20
1と使用フアイル情報202及びFAP情報10
3を参照し、1または複数の削除対象フアイルの
現在処理中レコードの中で指定キー値を持つレコ
ードを決定し、情報(イ)と(ロ)の場合と同様の(1)乃至
(4)から成る削除データ情報を取得する。
(c) In the case of data deletion processing form 4 (deleting the record of the input file with the specified key value of the specified file): The deletion data determination unit 21 deletes the job control information 20
1 and used file information 202 and FAP information 10
3, determine the record with the specified key value among the records currently being processed for one or more files to be deleted, and perform steps (1) to (1) similar to information (a) and (b).
(4) Obtain the deleted data information consisting of:

但し、指定キー値を持つレコードがない場合、
自動再処理対象外ジヨブとして当該業務処理ジヨ
ブを異常終了させる。
However, if there is no record with the specified key value,
Abnormally terminate the business processing job as a job not subject to automatic reprocessing.

削除データ決定部21は、上述のようにして削
除データを決定すると、次のステツプ214にお
いて、決定した削除データ情報を付して、自動運
転制御部30の復旧起動部31に復旧処理の起動
を要求する。
When the deletion data determining unit 21 determines the deletion data as described above, in the next step 214, it attaches the determined deletion data information and instructs the recovery activation unit 31 of the automatic operation control unit 30 to start the recovery process. request.

更に、削除データ決定部21は、ステツプ21
5において、ソフトウエア障害を生じた業務処理
プログラムを含む全業務処理ジヨブを異常終了さ
せ、削除データ決定処理を全て終了する。
Furthermore, the deletion data determining unit 21 performs step 21.
In step 5, all business processing jobs including the business processing program in which the software failure has occurred are abnormally terminated, and all deletion data determination processing is terminated.

復旧処理の起動処理 第12図は、自動運転制御部30内の復旧処理
起動部31の動作の一例を示すフローチヤートで
ある。
Activation Process of Recovery Process FIG. 12 is a flowchart showing an example of the operation of the recovery process activation unit 31 within the automatic operation control unit 30.

復旧処理起動部31は、ジヨブ制御部20の削
除データ決定部21からの復旧処理要求を受け付
けると、復旧処理の起動処理を開始する。すなわ
ち、復旧処理起動部31は、まずステツプ310
において、削除データ決定部21から渡された削
除データ情報と復旧制御情報フアイル200内の
フアイル復元処理情報203とに基づき、データ
削除処理に必要な資源を確保する。次に、復旧処
理起動部31は、ステツプ31において、前述の
削除データ情報を付加して、データ削除処理部4
0にデータ削除処理を要求する。
When the recovery process starting unit 31 receives a recovery process request from the deleted data determining unit 21 of the job control unit 20, it starts the process of starting the recovery process. That is, the recovery processing starting unit 31 first performs step 310.
In this step, resources necessary for the data deletion process are secured based on the deletion data information passed from the deletion data determining unit 21 and the file restoration processing information 203 in the restoration control information file 200. Next, in step 31, the recovery processing starting unit 31 adds the above-mentioned deleted data information to the data deletion processing unit 4.
0 to request data deletion processing.

また、復旧処理起動部31は、ステツプ312
において、使用フアイル情報202とフアイル復
元処理情報203とを参照して、復元を必要とす
る1または複数の更新フアイルを決定する。
Furthermore, the recovery processing starting unit 31 performs step 312.
At this point, one or more updated files that require restoration are determined by referring to the used file information 202 and file restoration processing information 203.

次に、復旧処理起動部31は、ステツプ313
において、復元すべき更新フアイルの一つについ
て、フアイル復元処理に必要な資源を確保した
後、ステツプ314において、フアイル復元に関
する情報を付してフアイル復元処理部50にフア
イル復元処理を要求する。
Next, the recovery processing starting unit 31 performs step 313.
In step 314, after securing the resources necessary for file restoration processing for one of the updated files to be restored, a request is made to the file restoration processing unit 50 to perform file restoration processing, with information regarding file restoration attached.

復旧処理起動部31は、ステツプ315におい
て、復元すべき更新フアイルの全てについて、フ
アイル復元処理要求の発行が終了したか否かを判
定し、未終了であれば、ステツプ313に戻り、
次の更新フアイルについて上述の処理を繰り返
す。
In step 315, the restoration processing starting unit 31 determines whether the issuance of file restoration processing requests has been completed for all updated files to be restored, and if it has not been completed, the process returns to step 313.
Repeat the above process for the next update file.

データ削除処理 第13図は、データ削除処理部40におけるデ
ータ削除処理の一例を示すフローチヤートであ
る。データ削除処理部40は、復旧処理起動部3
1からのデータ削除処理要を受け付けると、デー
タ削除処理を開始する。
Data Deletion Processing FIG. 13 is a flowchart showing an example of data deletion processing in the data deletion processing section 40. The data deletion processing section 40 includes the recovery processing starting section 3
When the data deletion processing request from 1 is received, the data deletion processing is started.

データ削除処理部40は、ステツプ41と42
において、復旧処理要求部31から受けた削除デ
ータ情報に従つて、入力フアイル内の全ての該当
データに削除フラグをセツトすることにより該当
のデータを全て削除する。
The data deletion processing unit 40 performs steps 41 and 42.
In accordance with the deletion data information received from the recovery process requesting section 31, deletion flags are set for all of the relevant data in the input file, thereby deleting all of the relevant data.

フアイル復元処理 第14図は、フアイル復元処理部50における
更新フアイル復元処理の一例を示すフローチヤー
トである。
File Restoration Processing FIG. 14 is a flowchart showing an example of updated file restoration processing in the file restoration processing section 50.

フアイル復元処理部50は、復旧処理起動部3
1からフアイル復元要求を受け付けると、フアイ
ル復元処理を開始する。
The file restoration processing section 50 is a restoration processing starting section 3.
When a file restoration request is received from 1, file restoration processing is started.

フアイル復元処理50は、ステツプ51におい
て、復旧処理起動部31から受けたフアイル復元
処理形態情報(第4図の3)に従い、第4図のフ
アイル復元処理情報203に関して既に説明した
a乃至dのいずれかの形態によつて、障害を起こ
した更新フアイルの復元処理を行う。
In step 51, the file restoration process 50 performs any of the steps a to d already explained with respect to the file restoration process information 203 in FIG. In this manner, the restoration process for the updated file that caused the failure is performed.

再起動要求処理 第15図は、自動運転制御部30の再起動要求
部32の動作の一例を示すフローチヤートであ
る。
Restart Request Processing FIG. 15 is a flowchart showing an example of the operation of the restart requesting section 32 of the automatic operation control section 30.

再起動要求部32は、データ削除処理部40と
フアイル復元処理部50から処理終了の通知を受
けると、再起動要求処理を開始する。再起動要求
部32は、ステツプ320において、データ削除
処理とフアイル復元処理の終了に伴う使用資源の
変更を行い、次のステツプ321において、ソフ
トウエア障害を起こした業務処理ジヨブの再起動
を、ジヨブ制御部20の再起動部22に要求す
る。
When the restart requesting unit 32 receives notification of the end of processing from the data deletion processing unit 40 and the file restoration processing unit 50, it starts restart request processing. In step 320, the restart request unit 32 changes the resources used upon completion of the data deletion processing and file restoration processing, and in the next step 321, restarts the business processing job that has caused the software failure. A request is made to the restart unit 22 of the control unit 20.

再起動処理 第16図は、ジヨブ制御部20の再起動部22
による、障害発生業務処理ジヨブの再起動処理の
一例を示すフローチヤートである。
Restart Processing FIG. 16 shows the restart unit 22 of the job control unit 20.
2 is a flowchart illustrating an example of restart processing for a faulty business processing job according to the method of FIG.

再起動部22は、自動運転制御部30の再起動
要求部32から再起動処理要求を受け付けると、
再起動処理を開始する。すなわち、再起動部22
は、まずステツプ220において、ジヨブ制御情
報201を参照して当該業務処理ジヨブのジヨブ
再処理形態(3)を判定する。この再処理形態が、チ
エツクポイント・リスタートでなくて再ランであ
れば、ステツプ221において当該業務処理ジヨ
ブを通常処理として再起動する。
When the restart unit 22 receives a restart processing request from the restart request unit 32 of the automatic operation control unit 30,
Start the reboot process. That is, the restart unit 22
First, in step 220, the job reprocessing mode (3) of the business processing job is determined by referring to the job control information 201. If this reprocessing mode is not a checkpoint restart but a rerun, the business processing job is restarted as normal processing in step 221.

再起動部22は、再処理形態がチエツクポイン
トリスタートであれば、ステツプ222に進み、
復旧制御情報フアイル200内のジヨブ制御情報
201のチエツクポイント情報格納域名(4)とチエ
ツクポイント通番(5)を得て展開する。
If the reprocessing mode is checkpoint restart, the restart unit 22 proceeds to step 222;
The checkpoint information storage area name (4) and checkpoint serial number (5) of the job control information 201 in the recovery control information file 200 are obtained and expanded.

次に、再起動部22は、ステツプ223におい
て、該当業務処理ジヨブを該当チエツクポイント
時点から再開する。
Next, in step 223, the restart unit 22 restarts the corresponding business processing job from the corresponding checkpoint point.

このようにして、ソフトウエア障害時の自動復
旧処理が全て終了する。
In this way, all automatic recovery processing in the event of a software failure is completed.

データ削除処理形態1の場合や、データ削除処
理形態4の場合において該当レコードが存在しな
いときに異常終了した業務処理ジヨブについて
は、操作者が適宜な方法でその障害原因の解明と
除去を行つたのちに、操作者が再起動する。
For business processing jobs that terminate abnormally when the corresponding record does not exist in the case of data deletion processing type 1 or data deletion processing type 4, the operator must use an appropriate method to determine the cause of the failure and remove it. Then, the operator restarts it.

自動運転制御部30、データ削除処理部40、
フアイル復元処理部50はジヨブ形式であつても
よい。
Automatic operation control unit 30, data deletion processing unit 40,
The file restoration processing section 50 may be of job format.

発明の効果 以上詳細に説明したように、本発明の自動復旧
処理システムは、業務処理ジヨブにおけるソフト
ウエア障害の発生に対処して、業務処理形態に適
した復旧制御情報を予め設定しておくと共に、業
務処理ジヨブのフアイル使用状況をインタフエー
ス制御部で管理することにより削除データを自動
的に決定する構成であるから、障害発明に対する
復旧処理を自動的に行うことが可能となる。
Effects of the Invention As explained in detail above, the automatic recovery processing system of the present invention deals with the occurrence of software failure in a business processing job, and sets recovery control information suitable for the business processing type in advance. Since the configuration is such that data to be deleted is automatically determined by managing the file usage status of the business processing job in the interface control unit, it is possible to automatically perform recovery processing in response to a failure.

このため、従来例におけるようにサポートSE
やオペレータが膨大な量のリストから障害原因を
探索する必要がなくなり、探索漏れによる復旧の
失敗や探索に長い時間を要するという問題がなく
なり、システム稼動率が大幅に向上すると共に、
オペレータの負荷を軽減することができる。
For this reason, as in the conventional example, support SE
This eliminates the need for operators and operators to search for the cause of failures from a huge list, eliminates the problems of failures in recovery due to omissions in the search, and the long time it takes to search, which greatly improves system availability.
The load on the operator can be reduced.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例の構成を示す機能ブ
ロツク図、第2図乃至第4図は第1図の制御情報
フアイル200内の各種制御情報の構成の一例を
示す概念図、第5図乃至第8図は第1図のインタ
フエース制御情報テーブル100内の各種情報の
構成の一例を示す概念図、第9図は第1図のイン
タフエース制御部10の動作の一例を説明するフ
ローチヤート、第10図は第1図の全システムの
動作の一例を示すフローチヤート、第11図は第
1図の削除データ決定ブロツク21の動作の一例
を説明するためのフローチヤート、第12図は第
1図の復旧処理起動部31の動作一例を説明する
ためのフローチヤート、第13図は第1図のデー
タ削除処理部40の動作の一例を説明するための
フローチヤート、第14図は第1図のフアイル復
元処理部50の動作の一例を説明するためのフロ
ーチヤート、第15図は第1図の再起動要求部3
2の動作の一例を説明するためのフローチヤー
ト、第16図は第1図乃至再起動部22の動作の
一例を説明するためのフローチヤートである。 10…インタフエース制御部、20…ジヨブ制
御部、30…自動運転制御部、40…データ削除
処理部、50…フアイル復元処理部、100…イ
ンタフエース制御情報テーブル、200…復旧制
御情報フアイル。
FIG. 1 is a functional block diagram showing the configuration of an embodiment of the present invention, FIGS. 2 to 4 are conceptual diagrams showing an example of the configuration of various control information in the control information file 200 of FIG. 1, and FIG. 8 are conceptual diagrams showing examples of the configuration of various information in the interface control information table 100 shown in FIG. 1, and FIG. 9 is a flowchart illustrating an example of the operation of the interface control unit 10 shown in FIG. 10 is a flowchart illustrating an example of the operation of the entire system in FIG. 1, FIG. 11 is a flowchart illustrating an example of the operation of the deletion data determination block 21 in FIG. 1, and FIG. 1. FIG. 13 is a flowchart for explaining an example of the operation of the data deletion processing section 40 in FIG. 1. FIG. 14 is a flowchart for explaining an example of the operation of the data deletion processing section 40 in FIG. 15 is a flowchart for explaining an example of the operation of the file restoration processing section 50 shown in FIG. 1, and FIG.
FIG. 16 is a flowchart for explaining an example of the operation of the restart unit 22 from FIG. 1. DESCRIPTION OF SYMBOLS 10...Interface control part, 20...Job control part, 30...Automatic operation control part, 40...Data deletion processing part, 50...File restoration processing part, 100...Interface control information table, 200...Recovery control information file.

Claims (1)

【特許請求の範囲】 1 業務処理ジヨブにおけるソフトウエア障害の
発生に対処して、障害誘発データの削除方法、更
新フアイルの復元方法及び再起動方法を含む復旧
制御情報を予め格納しておく復旧制御情報フアイ
ルと、 前記業務処理ジヨブが発する入出力要求を、フ
アイル・アクセス通番、アクセス中の入出力フア
イル及びレコード・アドレスを記録するインタフ
エース制御情報記録手段によつて管理しつつ、オ
ペレーテイング・システムの入出力マクロ命令に
変換するインタフエース制御手段と、 業務処理ジヨブにおけるソフトウエア障害の発
生時に、前記復旧制御情報フアイル及びインタフ
エース制御情報記録手段を参照して障害誘発デー
タの削除及び更新フアイルの復元を行うと共に、
前記復旧制御情報によつて指定された方法で該業
務処理ジヨブを再起動する手段とを備えたことを
特徴とするソフトウエア障害に対する自動復旧処
理システム。
[Scope of Claims] 1. Recovery control in which recovery control information including a method for deleting failure-inducing data, a method for restoring updated files, and a restart method is stored in advance in response to the occurrence of a software failure in a business processing job. The information file and the input/output requests issued by the business processing job are managed by an interface control information recording means that records the file access sequence number, the input/output file being accessed, and the record address, while the operating system an interface control means that converts the data into input/output macro commands, and when a software failure occurs in a business processing job, refers to the recovery control information file and the interface control information recording means to delete the failure-inducing data and update the update file. Along with the restoration,
An automatic recovery processing system for a software failure, comprising means for restarting the business processing job in a method specified by the recovery control information.
JP59213182A 1984-10-11 1984-10-11 Automatic recovery processing system for software trouble Granted JPS6191730A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59213182A JPS6191730A (en) 1984-10-11 1984-10-11 Automatic recovery processing system for software trouble

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59213182A JPS6191730A (en) 1984-10-11 1984-10-11 Automatic recovery processing system for software trouble

Publications (2)

Publication Number Publication Date
JPS6191730A JPS6191730A (en) 1986-05-09
JPS6362007B2 true JPS6362007B2 (en) 1988-12-01

Family

ID=16634899

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59213182A Granted JPS6191730A (en) 1984-10-11 1984-10-11 Automatic recovery processing system for software trouble

Country Status (1)

Country Link
JP (1) JPS6191730A (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS638834A (en) * 1986-06-28 1988-01-14 Nec Corp Operating condition control system for automatic trouble recovery in computer system
EP0394173A3 (en) * 1989-04-17 1993-10-27 International Business Machines Corporation High concurrency manager of open files

Also Published As

Publication number Publication date
JPS6191730A (en) 1986-05-09

Similar Documents

Publication Publication Date Title
JP3270216B2 (en) File name detection method
US6910112B2 (en) System and method for backing up and restoring data
JP4321705B2 (en) Apparatus and storage system for controlling acquisition of snapshot
JP3675802B2 (en) Method and system for reconfiguring the state of computation
JP4363676B2 (en) Computer system
EP1405152B1 (en) Systems and methods of information backup
JP2710190B2 (en) Method and apparatus for adjusting data dictionary synchronization
JPH04299748A (en) Automatic file extension system
JP4074442B2 (en) Method, apparatus, system, program and storage medium for data backup
JPH11120057A (en) File backup method
US7065539B2 (en) Data transfer method
JPS6362007B2 (en)
CN114138563A (en) Method for backing up and restoring Hyper-V virtual machine
JPH1040123A (en) System and method for job management
JPH09146782A (en) Method for handling occurance of abnormality in inter-job data succession
CN114547191A (en) Method and system for asynchronously executing intelligent contracts by block chain virtual machine and P2P network
JPH04141751A (en) Fault recovery system for mass storage medium
CN118012669A (en) File metadata recovery system and method for distributed file system
JP2933011B2 (en) Exclusive file control system
JPH0563824B2 (en)
JPH04105159A (en) Work substitute system
JPH0236014B2 (en)
JP2000267920A (en) Method for recovering backup and recording medium
JPH04369747A (en) File maintenance system when system is down
JPH0520157A (en) Automatic restoration system for document file

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees