JPS61139847A - Trouble range localizing method of program - Google Patents

Trouble range localizing method of program

Info

Publication number
JPS61139847A
JPS61139847A JP59262357A JP26235784A JPS61139847A JP S61139847 A JPS61139847 A JP S61139847A JP 59262357 A JP59262357 A JP 59262357A JP 26235784 A JP26235784 A JP 26235784A JP S61139847 A JPS61139847 A JP S61139847A
Authority
JP
Japan
Prior art keywords
transaction
application program
data
buffer
program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59262357A
Other languages
Japanese (ja)
Inventor
Takashi Yamamoto
隆 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP59262357A priority Critical patent/JPS61139847A/en
Publication of JPS61139847A publication Critical patent/JPS61139847A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0715Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a system implementing multitasking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Retry When Errors Occur (AREA)
  • Debugging And Monitoring (AREA)

Abstract

PURPOSE:To facilitate explicating trouble causes by managing the execution of an application program for every transaction and preserving the state at the start time of each transaction. CONSTITUTION:When an application program 2 is executed, a transaction management part 3 discriminates the first transaction 6 of the application program 2 and starts it, and register values, etc. at the start time of the transaction 6 are stored in a buffer 10 to preserve the start at the start time of the transaction 6. If the transaction 6 is terminated normally, this normal end is reported to the management part 3. Data, updated data, etc. to be delivered to a transaction 7 to be started next are stored in the buffer 10. If the transaction is terminated abnormally on the way, a transaction recovery part 4 is started, and register values, etc. at the start time which are stored in the buffer 10 are transferred, and required data are transferred form an auxiliary storage device 12, and the program is restored to the state at the start time.

Description

【発明の詳細な説明】 (産業上の利用分野〕 本発明はプログラムの障害範囲の局所化方法に係り、特
に応用プログラムが異常終了するに至ったプロセスを容
易に再現可能とし、障害追及のための資料を効果的且つ
迅速に採取し得るようにするための情報処理システムの
管理方法の改良に関する。
[Detailed Description of the Invention] (Industrial Application Field) The present invention relates to a method for localizing the range of a fault in a program, and in particular, it enables easy reproduction of the process that led to the abnormal termination of an application program, and a method for tracing the fault. The present invention relates to an improvement in a management method for an information processing system so that data can be collected effectively and quickly.

〔従来の技術〕[Conventional technology]

情報処理システムにおいて実行中の応用プログラムが異
常終了した場合には、異常終了時のメモリの内容が取得
されているが、障害範囲を局所化することが出来ない。
When an application program being executed in an information processing system terminates abnormally, the contents of the memory at the time of the abnormal termination have been acquired, but the extent of the failure cannot be localized.

そのため異常終了するに至ったプロセスを追及しようと
すると、その応用プログラムを最初から再実行させる以
外に方法がなく、多大の手間を必要とするので、現実に
は異常終了するに至ったプロセスの再現は非常に困難で
ある。
Therefore, if you try to track down the process that led to the abnormal termination, the only way is to re-run the application program from the beginning, which requires a lot of effort. is extremely difficult.

また現在再試行を行わせる機能がないため、ジョブが異
常終了したときでも再試行することによって正常動作し
得る場合があるにも拘わらず、その機会を逃がしている
Furthermore, since there is currently no function to perform a retry, even if a job ends abnormally, it may be possible to return to normal operation by retrying, but the opportunity to do so is being missed.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

上述したように従来の情報処理システムにおいては、異
常終了に対処する有効な手段を持っていなかった。
As described above, conventional information processing systems do not have effective means for dealing with abnormal termination.

〔問題点を解決するための手段〕[Means for solving problems]

本発明は上記問題点を解消することを目的とする。その
ため本発明においては、まず、各応用プログラムを複数
個のトランザクションに分割した構成とする。各トラン
ザクシリンの先頭と末尾には区切を示す命令を付加する
。オペレーティング・システムはトランザクション管理
手段と、トランザクションリカバリ手段と、トランザク
ションの再試行手段とを設ける。上記応用プログラムの
実行に際しては、トランザクション管理手段が各トラン
ザクションを識別し、実行させようとするトランザクシ
ョンに引き渡すデータと該トランザクションの開始時に
おけるレジスタの値等を退避させておく。異常終了が生
じた場合にはトランザクションリカバリ手段が上述の退
避させておいたデータとレジスタの値等を用いて上記異
常終了したトランザクションを開始時の状態に復元する
The present invention aims to solve the above problems. Therefore, in the present invention, first, each application program is divided into a plurality of transactions. A delimiter command is added to the beginning and end of each transaction. The operating system provides transaction management means, transaction recovery means, and transaction retry means. When executing the application program, the transaction management means identifies each transaction and saves the data to be delivered to the transaction to be executed and the register values at the start of the transaction. When an abnormal termination occurs, the transaction recovery means restores the abnormally terminated transaction to its starting state using the above-mentioned saved data and register values.

この後トランザクション再試行手段は上記トランザクシ
ョンを先頭から再試行させ、該トランザクション内で更
新のあったデータ等のトレースデータを所定のバッファ
に格納するようにした。
Thereafter, the transaction retry means retries the transaction from the beginning, and stores trace data such as data updated within the transaction in a predetermined buffer.

〔作用〕[Effect]

応用プログラムの実行をトランザクション毎に管理し、
各トランザクションの開始時の状態を保存しておくこと
により、異常終了が生じた場合には障害範囲を局所化出
来、しかも異常終了したトランザクションを開始時の状
態に復元することが可能である。従って正常終了したト
ランザクションを再度実行させることなく、異常終了が
生じたトランザクションのみを再試行させることが出来
ることとなる。このように再試行すべき障害範囲を特定
し、局所化することによって、トレースデータを迅速且
つ効果的に取得でき、障害原因の解明が容易となる。
Manage application program execution for each transaction,
By saving the state at the start of each transaction, in the event of an abnormal termination, it is possible to localize the failure range, and moreover, it is possible to restore the abnormally terminated transaction to the state at the start. Therefore, only the transaction that ended abnormally can be retried without having to re-execute the transaction that ended normally. By identifying and localizing the fault range to be retried in this way, trace data can be acquired quickly and effectively, and the cause of the fault can be easily clarified.

〔実施例〕〔Example〕

図は本発明の一実施例に用いた情報処理システムの構成
を示す要部ブロック図である。同図において、■はオペ
レーティング・システム、2は応用プログラム、3〜5
は本実施例で新たに設けた部分で、3はトランザクショ
ン管理部、4はトランザクションリカバリ部、5はトラ
ンザクション再試行部、6〜9はそれぞれ上記応用プロ
グラム2を構成するトランザクション、10及び11は
バッファメモリ、12は補助記憶装置(DASD)を示
す。
The figure is a block diagram of main parts showing the configuration of an information processing system used in an embodiment of the present invention. In the same figure, ■ is the operating system, 2 is the application program, and 3 to 5 are
are newly provided parts in this embodiment, 3 is a transaction management section, 4 is a transaction recovery section, 5 is a transaction retry section, 6 to 9 are transactions constituting the above application program 2, and 10 and 11 are buffers. Memory 12 indicates an auxiliary storage device (DASD).

上述のように構成したシステムにおいて応用プログラム
2を実行させるに当たって、トランザクション管理部3
が応用プログラム2の先頭のトランザクション6を識別
し、これをスタートさせ〔図の矢印■〕、まずトランザ
クション6開始時のレジスタ値等をバッファ10に格納
させる〔図の矢印■〕ことにより、トランザクション6
の開始時の状態を保存する。
In executing the application program 2 in the system configured as described above, the transaction management unit 3
identifies transaction 6 at the beginning of application program 2, starts it [arrow ■ in the figure], and first stores register values etc. at the start of transaction 6 in buffer 10 [arrow ■ in figure].
Save the starting state of .

トランザクション6の実行途中においてデータの更新が
あれば、この更新データもバッファ10に順次格納され
る〔図の矢印■〕。
If data is updated during the execution of transaction 6, this updated data is also sequentially stored in buffer 10 [arrow ■ in the figure].

トランザクション6が正常に終了した場合には。If transaction 6 ends normally.

その旨がトランザクション管理部3に通知〔矢印■〕さ
れる。この時次に起動されるトランザクション7に引き
渡されるデータ及び更新データ等は。
The transaction management unit 3 is notified of this [arrow ■]. At this time, the data, update data, etc. handed over to the next activated transaction 7 are as follows.

既にバッファ10に格納されている。It is already stored in the buffer 10.

トランザクション管理部3はバッファ10に格納されて
いる更新データをD A S D 12に転送〔矢印■
〕させたのち、次位のトランザクション7を起動〔矢印
■〕し、レジスタの値をバッファ10に格納させる〔矢
印■〕とともに、バッファ10からはトランザクション
6から引き渡すべきデータを転送〔矢印■〕させる。
The transaction management unit 3 transfers the updated data stored in the buffer 10 to the D ASD 12 [arrow ■
], then activates the next transaction 7 [arrow ■], stores the register value in buffer 10 [arrow ■], and transfers the data to be transferred from transaction 6 from buffer 10 [arrow ■] .

このトランザクション7が途中で異常終了13シたとす
る。この場合にはトランザクションリカバリ部4が起動
され、これからの指令〔矢印■〕により、トランザクシ
ョン7に対してバッファ10からは先に格納しておいた
開始時のレジスタ値等が、またD A S D 12か
らは必要なデータが転送〔矢印[相]、■〕され、トラ
ンザクション7は開始時の状態に復元される。
Assume that this transaction 7 ends abnormally in the middle. In this case, the transaction recovery unit 4 is activated, and according to a future command [arrow ■], the previously stored register values at the start from the buffer 10 for transaction 7 are restored to D A S D Necessary data is transferred from 12 [arrow [phase], ■], and transaction 7 is restored to its starting state.

一方、トランザクション7が異常終了するまでに更新さ
れてバッファ10に格納されたデータは、まだD A 
S D 12には転送されていない。従ってDA S 
D 12はトランザクション7の開始時の状態を保って
いる。
On the other hand, the data updated and stored in buffer 10 until transaction 7 terminates abnormally is still DA
It has not been transferred to SD12. Therefore, D.A.S.
D12 maintains the state at the start of transaction 7.

そこでトランザクション再試行部5はトランザクション
7を再度起動〔矢印@〕シ、最初から実行させ、トレー
スデータ等必要なデータを取得させる゛。取得されたデ
ータはバッファ11に格納〔矢印0〕する。
Therefore, the transaction retry unit 5 starts the transaction 7 again [arrow @], executes it from the beginning, and obtains necessary data such as trace data. The acquired data is stored in the buffer 11 [arrow 0].

このようにトランザクション7の異常終了を再現させ、
その間に取得したデータを調べることにより、異常の原
因を容易に突き止めることが出来る。
In this way, reproduce the abnormal termination of transaction 7,
By examining the data acquired during that time, the cause of the abnormality can be easily determined.

もし再試行の結果トランザクション7が正常に終了した
場合には、自動的に再実行が行われたものと見なしてよ
い。
If transaction 7 ends normally as a result of the retry, it may be assumed that the transaction has been automatically re-executed.

以上の如く本実施例によれば、再試行すべき範囲は狭い
範囲に特定される。このように局所化された範囲内のト
レースデータ等を取得することは容易であり、従って詳
細にデータを採取することが可能となり、障害原因の解
明が容易となる。
As described above, according to this embodiment, the range to be retried is specified to be a narrow range. It is easy to acquire trace data and the like within a localized range in this way, and therefore it becomes possible to collect detailed data, and it becomes easy to clarify the cause of the failure.

〔発明の効果〕〔Effect of the invention〕

以上説明した如く本発明によれば、正常終了したトラン
ザクションを再度実行させることなく、異常路〒が生じ
たトランザクションのみを再試行させることが可能とな
る。従って障害原因解明のためのデータを迅速に、且つ
効果的にしかも容易に採取することが出来る。
As described above, according to the present invention, it is possible to retry only a transaction in which an abnormal path has occurred, without having to re-execute a transaction that has terminated normally. Therefore, data for elucidating the cause of the failure can be collected quickly, effectively, and easily.

【図面の簡単な説明】[Brief explanation of drawings]

図は本発明の一実施例に用いた情報処理システムの構成
を示す要部ブロック図である。 図において、lはオペレーティング・システム、2は応
用プログラム、3,4.5はそれぞれトランザクション
管理部、トランザクションリカバリ部、トランザクショ
ン再試行部、6〜9それぞれ応用プログラム2を構成す
るトランザクション、10、11はバッファメモリ、1
2はDASDを示す。
The figure is a block diagram of main parts showing the configuration of an information processing system used in an embodiment of the present invention. In the figure, 1 is an operating system, 2 is an application program, 3, 4.5 are transaction management section, transaction recovery section, and transaction retry section, 6 to 9 are transactions that constitute application program 2, respectively, and 10 and 11 are transactions that constitute application program 2. Buffer memory, 1
2 indicates DASD.

Claims (1)

【特許請求の範囲】[Claims] シーケンシャルに連続する複数個のトランザクションか
らなる応用プログラムの実行を管理するオペレーティン
グ・システムを、トランザクション管理手段とトランザ
クションリカバリ手段とトランザクションの再試行手段
とを備えた構成とし、前記応用プログラムの実行に際し
ては前記トランザクション管理手段により各トランザク
ションの区切を検知し、該検知されたトランザクション
の開始時の状態を保存しておき、前記応用プログラムが
異常終了した場合には、その時実行中であったトランザ
クションを前記トランザクションリカバリ手段により前
記保存された開始時の状態に復元し、しかる後前記トラ
ンザクション再試行手段により前記トランザクションを
再実行せしめて所望のトレースデータの取得を行うこと
を特徴とするプログラムの障害範囲の局所化方法。
An operating system for managing the execution of an application program consisting of a plurality of sequential transactions is configured to include a transaction management means, a transaction recovery means, and a transaction retry means, and when executing the application program, The transaction management means detects the end of each transaction, stores the state at the start of the detected transaction, and when the application program terminates abnormally, the transaction that was being executed at that time is recovered. A method for localizing a failure range of a program, characterized in that the program restores the saved starting state by the means, and then causes the transaction retry means to re-execute the transaction to obtain desired trace data. .
JP59262357A 1984-12-11 1984-12-11 Trouble range localizing method of program Pending JPS61139847A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59262357A JPS61139847A (en) 1984-12-11 1984-12-11 Trouble range localizing method of program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59262357A JPS61139847A (en) 1984-12-11 1984-12-11 Trouble range localizing method of program

Publications (1)

Publication Number Publication Date
JPS61139847A true JPS61139847A (en) 1986-06-27

Family

ID=17374617

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59262357A Pending JPS61139847A (en) 1984-12-11 1984-12-11 Trouble range localizing method of program

Country Status (1)

Country Link
JP (1) JPS61139847A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6428737A (en) * 1987-07-24 1989-01-31 Hitachi Ltd Fault recovery system for composite subsystem type on-line system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6428737A (en) * 1987-07-24 1989-01-31 Hitachi Ltd Fault recovery system for composite subsystem type on-line system

Similar Documents

Publication Publication Date Title
US5065311A (en) Distributed data base system of composite subsystem type, and method fault recovery for the system
KR970002669A (en) How to Recover Multiple Volume Sets
JP3481737B2 (en) Dump collection device and dump collection method
JPS61139847A (en) Trouble range localizing method of program
JPS6152753A (en) Fault processing device
JPH07219802A (en) Duplex control system
JPS6254347A (en) Processing system for fault of file
JPS63262737A (en) Data base updating and recording processing method
JPS62194557A (en) File trouble recovery system
JPS597982B2 (en) Restart method in case of system failure of computer system
JPS6360414B2 (en)
JPS6167153A (en) Partial trouble recovery processing system of direct access storage device
JPH06187102A (en) Duplex disk processing system
JPH07160651A (en) Backup mode for system data
JPS6389944A (en) Managing system for file updating history
JPS6130297B2 (en)
JPS6143739B2 (en)
JPH01295338A (en) On switch control system for separation display flag of duplex system
JPS61175739A (en) File restoration system
JPS6121539A (en) Generation management system of data file
JPH08263350A (en) Information management system and method
JPS6218059B2 (en)
JPH0279271A (en) Fault processing system for magnetic disk device
JPH02240799A (en) Fault preventive system for pos
JPS6130296B2 (en)