JPH10275133A - Reexecution processing method for process - Google Patents

Reexecution processing method for process

Info

Publication number
JPH10275133A
JPH10275133A JP9080282A JP8028297A JPH10275133A JP H10275133 A JPH10275133 A JP H10275133A JP 9080282 A JP9080282 A JP 9080282A JP 8028297 A JP8028297 A JP 8028297A JP H10275133 A JPH10275133 A JP H10275133A
Authority
JP
Japan
Prior art keywords
rollback
terminal
checkpoint
management unit
transaction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9080282A
Other languages
Japanese (ja)
Other versions
JP3516428B2 (en
Inventor
Kiyoko Satou
記代子 佐藤
Toshio Shirokibara
敏雄 白木原
Hideaki Hirayama
秀昭 平山
Tatsunori Kanai
達徳 金井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP08028297A priority Critical patent/JP3516428B2/en
Publication of JPH10275133A publication Critical patent/JPH10275133A/en
Application granted granted Critical
Publication of JP3516428B2 publication Critical patent/JP3516428B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Retry When Errors Occur (AREA)

Abstract

PROBLEM TO BE SOLVED: To inform a user that a process is rolled back by specifying the terminal having started the process and informing the specified terminal that reexecution processing has been performed when the process is reexecuted. SOLUTION: A process management part 11 when detecting a fault occurring to a process in execution informs other computers which are performing decentralized processes that the fault has occurred. At the same time, rollback and restarting processing for the process is performed according to checkpoint information held in a storage device 14 and after this rollback and restarting processing, that is reported to a rollback information part 15. The rollback information part 15 once receiving the report from the process management part 11 refers to a terminal information management part 12 to specify the terminal having started the rollback restarted process and informs the terminal that the process is rolled back and restarted.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】この発明は、プロセスの再実
行処理方法に関し、特に、分散チェックポイントを利用
した分散システムにおいて、ロールバック・リスタート
の発生事実をユーザに通知するためのプロセスの再実行
処理方法に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a process re-execution processing method, and more particularly to a process re-execution for notifying a user of the occurrence of rollback / restart in a distributed system using a distributed checkpoint. It relates to a processing method.

【0002】[0002]

【従来の技術】計算機におけるプログラム実行の信頼性
を向上させる方法として、チェックポイントに基づくプ
ログラムの実行方法が知られている。これは、プログラ
ムの実行に際し、所定のチェックポイント・タイミング
に従ってプログラムの実行体であるプロセスの状態等
(以下「チェックポイント情報」という)を定期・不定
期に取得し、プログラムの実行中に障害が発生した場合
には、直近のチェックポイントに取得したチェックポイ
ント情報に基づいて、当該プログラムを再実行(ロール
バック・リスタート)するというものである。ここで、
チェックポイントとは、プログラムの実行を経時的に見
た場合に、チェックポイント情報を取得するための処理
を行う時点をいうものとする。
2. Description of the Related Art As a method of improving the reliability of program execution in a computer, there is known a method of executing a program based on a checkpoint. This is because, during the execution of a program, the status or the like (hereinafter, referred to as “checkpoint information”) of a process which is the execution body of the program is acquired regularly or irregularly according to a predetermined checkpoint timing. When this occurs, the program is re-executed (rollback / restart) based on the checkpoint information acquired at the most recent checkpoint. here,
A checkpoint refers to a point in time when a process for acquiring checkpoint information is performed when the execution of a program is viewed over time.

【0003】ところで、単独で動作するプログラムにお
いては、そのプロセスの途中状態のみのチェックポイン
トで、チェックポイント情報を取得すればよいが、複数
のプログラムがプロセス間通信等の関係をもって動作す
るような場合においては、1つのプロセスについて、チ
ェックポイントに従って当該プロセスの状態を取得する
のみでは不十分である。すなわち、再実行した場合に矛
盾が生じないようにするためには、チェックポイントご
とに相互に関係がある複数のチェックポイント情報を取
得する必要がある。以下では、便宜上、各プロセスごと
についてのチェックポイントをローカルチェックポイン
トといい、相互に関係があるプロセスについてのローカ
ルチェックポイントの集合を分散チェックポイントとい
うものとする。そして、分散チェックポイントでは、障
害が発生した場合に、複数のプロセスに対して直近のチ
ェックポイントに戻って、再実行する必要がある。この
ように、チェックポイントに基づくロールバック・リス
タートを分散システムに適用した場合を分散チェックポ
イント・リスタート方法というものとする。
In a program that operates independently, checkpoint information may be obtained only at checkpoints in the middle of the process. However, in a case where a plurality of programs operate in a relationship such as communication between processes. In, it is not sufficient to simply obtain the state of a process in accordance with a checkpoint. That is, in order to prevent inconsistency when re-executing, it is necessary to acquire a plurality of pieces of checkpoint information that are mutually related for each checkpoint. Hereinafter, for convenience, a checkpoint for each process is referred to as a local checkpoint, and a set of local checkpoints for processes that are interrelated is referred to as a distributed checkpoint. In the distributed checkpoint, when a failure occurs, it is necessary to return to the most recent checkpoint for a plurality of processes and execute again. The case where rollback / restart based on checkpoints is applied to a distributed system in this way is referred to as a distributed checkpoint / restart method.

【0004】ロールバック・リスタートが行なわれるの
は、以下のような場合がある。 (1)単独のプログラムで、チェックポイントを生成し
ながら、処理を行なっている場合 a)ハードウェアの故障、またはOSのバグによるマシ
ンフォールトが原因で、プロセスが中断する場合 b)アプリケーションのバグによるプログラムフォール
トが原因で、プロセスが中断する場合。 (2)複数のプロセスについて分散チェックポイント情
報を生成しながら、分散処理を行なう環境において、関
係する他のプロセスに障害が発生する場合 上記(1) a)の場合、ユーザーは計算機の障害発生を認識
しているので、プロセスがロールバックしたことを理解
することができる。
[0004] Rollback / restart is performed in the following cases. (1) When processing is performed while generating a checkpoint by a single program a) When the process is interrupted due to a hardware failure or a machine fault due to a bug in the OS b) Due to a bug in the application The process is interrupted due to a program fault. (2) In the environment where distributed processing is performed while generating distributed checkpoint information for a plurality of processes, a failure occurs in other related processes. Knowing, you can understand that the process has rolled back.

【0005】しかしながら、同(1) b)の場合にあって
は、ユーザーは計算機の障害発生を認識できないので、
プロセスがロールバックしたことを理解できない。ま
た、同(2) の場合、例えば、クライアント・サーバーシ
ステムで、サーバに障害が発生した場合、各ユーザーが
使っている計算機には何も異常がないのに、プロセスは
ロールバック・リスタートしてしまうことになる。かか
る場合、ユーザーには何が起こったか分からない。
[0005] However, in the case of (1) b), the user cannot recognize the occurrence of the failure of the computer.
I do not understand that the process has rolled back. In the case of (2) above, for example, in the case of a server failure in a client / server system, the process is rolled back and restarted even though the computer used by each user has no abnormality. Would be. In such a case, the user does not know what happened.

【0006】このように、従来の分散チェックポイント
・リスタート方法においては、プロセスがロールバック
・リスタートした場合のユーザへの通知を何ら考慮に入
れていなかったので、ロールバック・リスタートしたか
否かについて、ユーザーが直接的に理解できないという
問題があった。
[0006] As described above, in the conventional distributed checkpoint / restart method, no notification to the user when the process is rolled back or restarted is taken into account. There was a problem that the user could not directly understand whether or not.

【0007】[0007]

【発明が解決しようとする課題】チェックポイント・リ
スタート方法において、ユーザプログラム自体のプログ
ラムフォールトや、分散処理下での他のプロセスの障害
によりロールバックが発生した場合、その事実が各ユー
ザに通知されていなかったため、ユーザーは実行中のプ
ロセスに何が起こったのか分からない、という問題が生
じていた。
In the checkpoint / restart method, when a rollback occurs due to a program fault of a user program itself or a failure of another process under distributed processing, the fact is notified to each user. The problem was that users were not sure what happened to the running process.

【0008】本発明は、このような点に鑑みてなされた
もので、チェックポイント・リスタート方法において、
プロセスのロールバックが行なわれたことを、ユーザー
に通知する方法を提供することを目的とする。
[0008] The present invention has been made in view of the above points, and a checkpoint / restart method includes:
It is intended to provide a method for notifying a user that a process has been rolled back.

【0009】[0009]

【課題を解決するための手段】請求項1に係る発明は、
分散計算機システム上でプロセスのチェックポイント情
報を取得しつつ、該プロセスを実行するに際し、前記プ
ロセスと当該プロセスを起動した端末とを対応づけて所
定の情報として記録しておき、前記プロセスの再実行処
理を行う場合に、該プロセスを起動した端末を特定し
て、該特定された端末に再実行処理が行われた旨を通知
することを特徴とするプロセスの再実行処理方法であ
る。
The invention according to claim 1 is
When executing the process while acquiring the checkpoint information of the process on the distributed computer system, the process and the terminal that has started the process are recorded as predetermined information in association with each other, and the process is executed again. A re-execution processing method for a process, characterized in that when performing a process, a terminal that has started the process is specified, and the specified terminal is notified that re-execution processing has been performed.

【0010】従って、本発明によれば、計算機に障害が
発生した場合、分散チェックポイント・リスタート方法
において、プロセスのロールバック・リスタート処理が
行なわれる際、当該プロセスがロールバックしたことを
ユーザーは知ることが可能となる。
Therefore, according to the present invention, when a failure occurs in a computer, when a rollback / restart process of a process is performed in a distributed checkpoint / restart method, the user is notified that the process has rolled back. Will be able to know.

【0011】また、請求項2に係る発明は、分散処理を
行っているプロセス群のうちの少なくとも1つのプロセ
スが分散チェックポイントに基づいて再実行処理を行う
場合に、前記プロセス群の各々を起動した端末を各々特
定し、該特定された各々の端末に再実行処理が行われた
旨を通知することを特徴とする。
[0011] According to a second aspect of the present invention, when at least one process among the process groups performing the distributed processing performs the re-execution processing based on the distributed checkpoint, each of the process groups is activated. Each of the identified terminals is identified, and a notification that the re-execution processing has been performed is given to each of the identified terminals.

【0012】従って、本発明によれば、分散処理を行っ
ているプロセス群のうちの1つのプロセスに障害が発生
し、分散チェックポイントに従ってロールバック・リス
タート処理が行われた場合には、当該プロセスに関連す
るプロセス群を起動した端末においてロールバック・リ
スタート処理が行われた旨をユーザは知ることが可能と
なる。
Therefore, according to the present invention, when a failure occurs in one of the processes in the process group performing the distributed processing and the rollback / restart processing is performed according to the distributed checkpoint, The user can know that the rollback / restart processing has been performed in the terminal that has started the process group related to the process.

【0013】さらに、請求項3に係る発明は、前記実行
されるプロセスが所定のトランザクションを実行するこ
とによって該トランザクションがコミットされる場合
に、前記トランザクションと該トランザクションを実行
したプロセスとを対応づけて所定の情報として記録して
おき、前記プロセスの再実行処理を行う場合に、該プロ
セスを起動した端末を特定して、該特定された端末に再
実行処理が行われた旨および該対応するトランザクショ
ンを通知することを特徴とする。
Further, according to a third aspect of the present invention, when the executed process executes a predetermined transaction and the transaction is committed, the transaction is associated with the process that executed the transaction. When performing the re-execution processing of the process, the terminal that has started the process is specified, and the fact that the re-execution processing has been performed on the specified terminal and the corresponding transaction are recorded as predetermined information. Is notified.

【0014】従って、本発明によれば、データベースシ
ステムの場合は、プロセスのロールバックにより無効に
なったトランザクションを知ることが可能となる。ま
た、請求項4に係る発明は、前記実行されるプロセスに
対してユーザの入力操作がある場合に、前記プロセスと
該プロセスに対する入力操作の内容とを対応づけて所定
の情報として記録しておき、前記プロセスの再実行処理
を行う場合に、該プロセスを起動した端末を特定して、
該特定された端末に再実行処理が行われた旨および該対
応する入力操作の内容を通知することを特徴とする。
Therefore, according to the present invention, in the case of a database system, it becomes possible to know a transaction that has been invalidated by a rollback of a process. Further, in the invention according to claim 4, when there is a user input operation to the executed process, the process and the content of the input operation to the process are recorded as predetermined information in association with each other. When performing the re-execution process of the process, specify the terminal that has started the process,
The specified terminal is notified of the fact that the re-execution processing has been performed and the content of the corresponding input operation.

【0015】従って、本発明によれば、ウィンドウシス
テム等の環境において、ユーザーの入力操作のうち、プ
ロセスのロールバック・リスタート処理によって無効に
なった入力操作を知ることが可能となる。
Therefore, according to the present invention, in an environment such as a window system, it is possible to know an input operation invalidated by a rollback / restart process of a process among input operations by a user.

【0016】また、請求項5に係る発明は、前記プロセ
スについてのチェックポイント情報が生成された場合
は、前記記録された所定の情報を削除することを特徴と
する。従って、本発明によれば、チェックポイント情報
が生成された場合には、不要となった情報を削除するの
で、不要な情報をユーザに通知することなく、また、効
率的な資源の使用を行うことが可能となる。
The invention according to claim 5 is characterized in that when checkpoint information on the process is generated, the recorded predetermined information is deleted. Therefore, according to the present invention, when checkpoint information is generated, unnecessary information is deleted, so that unnecessary resources are not notified to the user and efficient use of resources is performed. It becomes possible.

【0017】[0017]

【発明の実施の形態】以下、図面を参照しながら本発明
の実施形態について説明する。 [第1の実施形態]図1は、本発明に係る計算機システ
ムの構成を示す図である。
Embodiments of the present invention will be described below with reference to the drawings. [First Embodiment] FIG. 1 is a diagram showing a configuration of a computer system according to the present invention.

【0018】本発明に係る計算機システムは、計算機1
と端末T1,T2,T3,…(以下「端末T」というこ
ともある。)がネットワーク2を介して接続されてい
る。また、同図においては、計算機1のみ図示している
が、ネットワーク2を介してさらに他の計算機が接続さ
れていてもよい。
The computer system according to the present invention comprises a computer 1
And terminals T1, T2, T3,... (Hereinafter sometimes referred to as “terminal T”) are connected via the network 2. Although only the computer 1 is shown in FIG. 1, another computer may be connected via the network 2.

【0019】計算機1は、オペレーティングシステムの
管理の下、本来実行すべきプログラム(アプリケーショ
ンプログラム等)の実行体であるプロセスを実行する機
能を有するとともに、後述する本実施形態の機能実現手
段が設けられている。本実施形態における機能実現手段
は、プログラムとして実現してもよいし、その全部また
は一部をハードウェアとして実現するようにしてもよ
い。例えば、計算機のオペレーティングシステム内部の
機能として実現することができる。また、オペレーティ
ングシステム上で動作するいわゆるデーモンプロセス
や、プログラムに静的または動的にリンクされるライブ
ラリとして実現することも可能である。
The computer 1 has a function of executing a process which is an execution body of a program (application program or the like) to be executed under the control of the operating system, and is provided with a function realizing means of the present embodiment which will be described later. ing. The function realizing means in the present embodiment may be realized as a program, or all or a part thereof may be realized as hardware. For example, it can be realized as a function inside an operating system of a computer. It can also be realized as a so-called daemon process that runs on an operating system, or as a library that is statically or dynamically linked to a program.

【0020】次に、本実施形態における各機能実現手段
について説明する。同図において、プロセス管理部11
は、当該計算機内で実行されるアプリケーションプログ
ラム等のプロセスの実行およびその実行状態等を管理す
るものである。ここで、実行状態の管理としては、実行
中のプロセスに障害が発生した場合、内包する障害検出
部により、障害を検出する処理等があげられる。同図
は、各端末T1,T2,T3からプロセス管理部11へ
の図示しないプロセスの起動要求に従って、プロセス管
理部11がプロセスP1,P2,P3を起動し、当該プ
ロセス群の実行を管理している状態を示している。
Next, each function implementing means in this embodiment will be described. In the figure, the process management unit 11
Manages the execution of processes such as application programs executed in the computer and the execution state of the processes. Here, the management of the execution state includes, for example, a process of detecting a failure by an included failure detection unit when a failure occurs in the process being executed. In the figure, the process management unit 11 starts processes P1, P2, and P3 according to a process start request (not shown) from the terminals T1, T2, and T3 to the process management unit 11, and manages the execution of the process group. It shows the state where it is.

【0021】プロセス管理部11は、端末Tからのプロ
セス起動要求があった場合、上述のようにプロセスを起
動するとともに、どのプロセスがどの端末によって起動
されたかに関する情報を端末情報管理部12に通知す
る。
When a process start request is received from the terminal T, the process management unit 11 starts the process as described above, and notifies the terminal information management unit 12 of information on which process was started by which terminal. I do.

【0022】端末情報管理部12は、プロセス管理部1
1からの通知に基づき、どのプロセスがどの端末によっ
て起動されたかに関する情報(以下「プロセス−端末情
報」という。)を保持する。図2は、プロセス−端末情
報の一例を示す図である。
The terminal information management unit 12 includes the process management unit 1
Based on the notification from No. 1, information on which process was started by which terminal (hereinafter, referred to as “process-terminal information”) is held. FIG. 2 is a diagram illustrating an example of the process-terminal information.

【0023】チェックポイント管理部13は、実行中の
プロセスについて、所定のチェックポイントタイミング
でチェックポイント情報を生成、取得する。このチェッ
クポイント情報は、例えば、ローカルディスク等の記憶
装置に記憶される。
The checkpoint management unit 13 generates and acquires checkpoint information at a predetermined checkpoint timing for the process being executed. This checkpoint information is stored in a storage device such as a local disk.

【0024】プロセス管理部11は、実行中のプロセス
の障害発生を検出した場合、分散処理を行っている他の
計算機へ、当該障害が発生した旨を通知するとともに、
記憶装置14に保持されているチェックポイント情報に
従ってプロセスのロールバック・リスタート処理を行
う。プロセス管理部11は、このロールバック・リスタ
ート処理が完了すると、その旨をロールバック通知部1
5に通知する。
When the process management unit 11 detects the occurrence of a failure in the process being executed, the process management unit 11 notifies other computers performing the distributed processing that the failure has occurred,
The rollback / restart process of the process is performed according to the checkpoint information held in the storage device 14. When the rollback / restart processing is completed, the process management unit 11 notifies the rollback notification unit 1 of the completion.
Notify 5

【0025】ロールバック通知部15は、プロセス管理
部11からの通知を受け取ると、端末情報管理部12を
参照し、ロールバック・リスタートしたプロセスを起動
した端末を特定し、当該端末に対してプロセスがロール
バック・リスタートされた旨を通知する。
Upon receiving the notification from the process management unit 11, the rollback notification unit 15 refers to the terminal information management unit 12, specifies the terminal that has started the rollback / restarted process, Notifies that the process has been rolled back and restarted.

【0026】図3は、プロセス管理部11の動作処理を
説明するための図である。プロセス管理部11は、障害
検出部によってプロセスの障害を検出した場合(STE
P31)、分散チェックポイントについて、分散処理を
行っている他の計算機のプロセス管理部に、ロールバッ
ク・リスタートを行うよう指示する(STEP32)。
STEP31においてプロセスの障害の検出がない場合
であっても、分散処理を行っている他の計算機からのロ
ールバック・リスタート指示を受けた場合、または、S
TEP32の処理を経て、プロセス管理部11は、ロー
ルバック・リスタート処理を行なう(STEP34)。
ロールバック・リスタート処理を行った後、プロセス管
理部11は、ロールバック通知部15にロールバック・
リスタートが完了した旨を通知する(STEP35)。
FIG. 3 is a diagram for explaining the operation processing of the process management section 11. The process management unit 11 detects a process failure by the failure detection unit (STE
P31) With respect to the distributed checkpoint, the process management unit of another computer which is performing distributed processing is instructed to perform rollback / restart (STEP32).
Even if there is no detection of a process failure in STEP 31, if a rollback / restart instruction is received from another computer performing distributed processing, or
After the processing of TEP32, the process management unit 11 performs a rollback / restart processing (STEP34).
After performing the rollback / restart processing, the process management unit 11 sends the rollback notification
A notification that the restart has been completed is given (STEP 35).

【0027】図4は、端末情報管理部12の動作処理を
説明するための図である。同図に示すように、端末情報
管理部12は、プロセス管理部11によりプロセスが起
動された旨の通知があるまで待機する(STEP4
1)。そして、。プロセスが起動された旨の通知を受け
取ると、プロセスとそのプロセスを起動した端末との対
応関係を、プロセス−端末情報として記憶する。
FIG. 4 is a diagram for explaining the operation processing of the terminal information management unit 12. As shown in the figure, the terminal information management unit 12 waits until there is a notification that the process has been started by the process management unit 11 (STEP 4).
1). And. Upon receiving the notification that the process has been started, the correspondence between the process and the terminal that started the process is stored as process-terminal information.

【0028】図5は、ロールバック通知部15の動作処
理を説明するための図である。ロールバック通知部15
は、プロセス管理部11よりロールバック・リスタート
が完了した旨の通知を受けとると(STEP51)、端
末情報管理部12に保持されているプロセス−端末情報
を参照して、当該障害の発生に基づくロールバック・リ
スタートされたプロセスを起動した端末を特定し(ST
EP52)、当該端末にその旨を表示すべく通知する。
FIG. 5 is a diagram for explaining the operation processing of the rollback notification unit 15. Rollback notification unit 15
Upon receiving the notification from the process management unit 11 that the rollback / restart has been completed (STEP 51), the process refers to the process-terminal information held in the terminal information management unit 12 and determines based on the occurrence of the failure. Identify the terminal that started the rollback / restarted process (ST
(EP52), the terminal is notified to that effect.

【0029】図6は、当該通知のあった端末の画面表示
の一例を示す図である。同図は、ディスプレイ(画面)
に、ロールバック通知アイコン61が常時表示されてお
り、ユーザは、エディタ等の作業ウィンドウ62により
作業を行っていると状態を示している。そのときに、ロ
ールバック通知部15により、ロールバック・リスター
トが発生し、完了した旨の通知を発せられると、例え
ば、PoPUpウィンドウ63のようにウィンドウが開
いて、ロールバックが行われた旨が表示される。
FIG. 6 is a diagram showing an example of the screen display of the terminal that has received the notification. The figure shows the display (screen)
, A rollback notification icon 61 is constantly displayed, indicating that the user is working on a work window 62 such as an editor. At that time, when a rollback / restart is generated by the rollback notification unit 15 and a notification indicating that the rollback has been completed is issued, for example, a window is opened as in the PoPUp window 63 and the rollback is performed. Is displayed.

【0030】また、図7は、当該通知された端末の画面
表示の他の例を示す図である。同図(a)は、プロセス
監視モニタウィンドウを示す図であり、プロセスの実行
が経時的に、また、メッセージ通信が同時に表示されて
いる状態を示している。ここで、例えば、プロセスP2
において障害が検出された場合には、当該ウィンドウは
同図(b)のような表示に切り替わる。すなわち、同図
(b)は、分散チェックポイントに従って各プロセスが
直近のチェックポイントCPまでロールバックして、リ
スタートした状態をマーク(点線)で示している。この
マークは、例えば、次のチェックポイントを通過した時
点で、当該ウィンドウから消去される。
FIG. 7 is a diagram showing another example of the screen display of the terminal notified. FIG. 7A is a diagram showing a process monitoring monitor window, showing a state in which the execution of the process is displayed with time and the message communication is simultaneously displayed. Here, for example, the process P2
When a failure is detected in, the window is switched to a display as shown in FIG. That is, FIG. 9B shows the state in which each process has rolled back to the nearest checkpoint CP in accordance with the distributed checkpoint and restarted, with a mark (dotted line). This mark is deleted from the window at the time of passing the next checkpoint, for example.

【0031】以上のように、本実施形態によれば、障害
の発生に基づきロールバック・リスタート処理が行われ
た場合には、当該プロセスを起動した端末においてその
旨が表示されるので、ロールバック・リスタートの事実
を知ることができるようになる。
As described above, according to the present embodiment, when the rollback / restart processing is performed based on the occurrence of a failure, the fact is displayed on the terminal that has started the process, so that the rollback / restart processing is performed. Be able to know the fact of back restart.

【0032】[第2の実施形態]次に実施例2について
説明する。図8は、本実施形態に係る計算機システムの
構成を示す図である。本実施形態に係る計算機1は、ロ
ールバック・リスタート処理を行った後は、トランザク
ション管理部81に、ロールバックが完了した旨を通知
する。
[Second Embodiment] Next, a second embodiment will be described. FIG. 8 is a diagram illustrating a configuration of a computer system according to the present embodiment. After performing the rollback / restart processing, the computer 1 according to the present embodiment notifies the transaction management unit 81 that the rollback has been completed.

【0033】トランザクション管理部81は、コミット
されたトランザクションのIDとそのトランザクション
が実行されたプロセスを対応づけて記録し、次回のチェ
ックポイントまで保存する。そして、ロールバックが完
了した旨の通知を受けとると、保存しているトランザク
ションのIDとプロセスとの対応関係を、ロールバック
通知部15に通知する。すなわち、このとき通知される
トランザクションは、プロセスのロールバックによって
無効になったものである。
The transaction management unit 81 records the ID of the committed transaction in association with the process in which the transaction was executed, and stores it until the next checkpoint. Upon receiving the notification that the rollback has been completed, the rollback notification unit 15 is notified of the correspondence between the stored transaction ID and the process. That is, the transaction notified at this time has been invalidated by the rollback of the process.

【0034】ロールバック通知部15は、トランザクシ
ョン管理部81からの通知を受け取ると、端末情報管理
部12を参照し、プロセス−端末情報に基づいて、当該
プロセスを起動した端末を特定し、特定された端末に対
して、プロセスのロールバックにより無効になったトラ
ンザクションのIDをディスプレイに表示するため通知
を行う。
Upon receiving the notification from the transaction management unit 81, the rollback notification unit 15 refers to the terminal information management unit 12, specifies the terminal that has started the process based on the process-terminal information, and specifies the terminal. A notification is sent to the terminal to display the ID of the transaction invalidated by the rollback of the process on the display.

【0035】チェックポイント管理部82は、各プロセ
スについてのチェックポイント情報を生成すると、トラ
ンザクション管理部81にチェックポイント情報の生成
を完了した旨を通知する。
After generating the checkpoint information for each process, the checkpoint management unit 82 notifies the transaction management unit 81 that the generation of the checkpoint information has been completed.

【0036】図9は、プロセス管理部11の動作処理を
説明するための図である。プロセス管理部11は、障害
検出部によってプロセスの障害を検出した場合(STE
P91)、分散チェックポイントについて、分散処理を
行っている他の計算機のプロセス管理部に、ロールバッ
ク・リスタートを行うよう指示する(STEP92)。
STEP91においてプロセスの障害の検出がない場合
であっても、分散処理を行っている他の計算機からのロ
ールバック・リスタート指示を受けた場合、または、S
TEP92の処理を経て、プロセス管理部11は、ロー
ルバック・リスタート処理を行なう(STEP94)。
ロールバック・リスタート処理を行った後、プロセス管
理部11は、トランザクション管理部81にロールバッ
ク・リスタートが完了した旨を通知する(STEP9
5)。
FIG. 9 is a diagram for explaining the operation processing of the process management section 11. The process management unit 11 detects a process failure by the failure detection unit (STE
P91), with respect to the distributed checkpoint, instructs the process management unit of another computer which is performing distributed processing to perform rollback / restart (STEP92).
Even if no failure of the process is detected in STEP 91, if a rollback / restart instruction is received from another computer performing distributed processing, or
After the processing in TEP92, the process management unit 11 performs a rollback / restart processing (STEP94).
After performing the rollback / restart processing, the process management unit 11 notifies the transaction management unit 81 that the rollback / restart has been completed (STEP 9).
5).

【0037】図10は、トランザクション管理部81の
動作処理を説明するための図である。トランザクション
管理部81は、トランザクションがコミットされたか否
かを判断する(STEP101)このトランザクション
がコミットされたか否かの判断は、例えば、コミットす
る旨のメッセージの受け取りがあった場合にコミットさ
れたと判断する。コミットされたと判断した場合には、
トランザクションのIDと、そのトランザクションを実
行したプロセスとを対応づけて記録する(STEP10
2)。次に、トランザクション管理部81は、チェック
ポイント管理部83からチェックポイント情報を生成し
た旨の通知を受け取ったか否かを判断する(STEP1
03)。STEP103において、当該通知を受け取っ
たと判断した場合には、記録したトランザクションのI
Dとプロセスとの対応関係を削除する(STEP10
4)。次に、トランザクション管理部81は、プロセス
管理部11からロールバック終了の通知を受け取ったか
否かを判断し(STEP105)、受け取ったと判断し
た場合には、記録しているトランザクションのIDとプ
ロセスとの対応関係を、ロールバック通知部15に通知
する(STEP106)。また、STEP105におい
て、通知を受け取っていないと判断した場合には、ST
EP101に戻り、上記処理を繰り返す。
FIG. 10 is a diagram for explaining the operation processing of the transaction management unit 81. The transaction management unit 81 determines whether or not the transaction has been committed (STEP 101). For example, the determination as to whether or not the transaction has been committed determines that the transaction has been committed when a message to commit is received. . If you determine that it has been committed,
The ID of the transaction and the process that executed the transaction are recorded in association with each other (STEP 10).
2). Next, the transaction management unit 81 determines whether a notification that the checkpoint information has been generated is received from the checkpoint management unit 83 (STEP 1).
03). If it is determined in STEP 103 that the notification has been received, the I
Delete the correspondence between D and the process (STEP 10
4). Next, the transaction management unit 81 determines whether or not a notification of the rollback completion has been received from the process management unit 11 (STEP 105). The correspondence is notified to the rollback notification unit 15 (STEP 106). If it is determined in STEP 105 that the notification has not been received,
Returning to EP101, the above processing is repeated.

【0038】図11は、ロールバック通知部の動作処理
を説明するための図である。ロールバック通知部15
は、トランザクション管理部81から無効になったトラ
ンザクションのIDの通知を受け取るまで待機する(S
TEP111)。当該IDの通知を受け取った場合に
は、端末情報管理部12を参照することにより、プロセ
ス−端末情報に基づき、プロセスを起動した端末を特定
する(STEP112)。そして、ロールバック通知部
15は、当該端末のディスプレイに、ロールバックした
トランザクションのIDを表示するため、通知を行う。
なお、図12は、当該通知のあった端末の画面表示の一
例を示す図である。同図は、ディスプレイ(画面)に、
ロールバック通知アイコン121が常時表示されてお
り、ユーザは、エディタ等の作業ウィンドウ122によ
り作業を行っていると状態を示している。このような状
況において、ロールバック通知部15により、ロールバ
ック・リスタートが発生し、無効となったトランザクシ
ョンが通知されると、例えば、PoPUpウィンドウ1
23のようにウィンドウが開いて、トランザクションが
取り消された旨の表示が行われる。
FIG. 11 is a diagram for explaining the operation processing of the rollback notification unit. Rollback notification unit 15
Waits for the notification of the ID of the invalidated transaction from the transaction management unit 81 (S
TEP111). When the notification of the ID is received, the terminal that has started the process is specified based on the process-terminal information by referring to the terminal information management unit 12 (STEP 112). Then, the rollback notifying unit 15 notifies the display of the terminal to display the ID of the rolled back transaction.
FIG. 12 is a diagram illustrating an example of the screen display of the terminal that has received the notification. The figure shows the display (screen)
The rollback notification icon 121 is always displayed, indicating that the user is working on the work window 122 such as an editor. In such a situation, when a rollback / restart occurs and the invalidated transaction is notified by the rollback notification unit 15, for example, the PoPUp window 1
A window is opened as shown at 23, and a message indicating that the transaction has been canceled is displayed.

【0039】図13は、チェックポイント管理部82の
動作処理を説明するための図である。チェックポイント
管理部82は、例えば、OSのタイマ機構により決定さ
れる所定のチェックポイントタイミングでチェックポイ
ント情報を生成し、記憶装置14に記憶するとともに
(STEP131)、トランザクション管理部81にそ
の旨を通知する(STEP132)。
FIG. 13 is a diagram for explaining the operation processing of the checkpoint management unit 82. For example, the checkpoint management unit 82 generates checkpoint information at a predetermined checkpoint timing determined by a timer mechanism of the OS, stores the checkpoint information in the storage device 14 (STEP 131), and notifies the transaction management unit 81 of the fact. (Step 132).

【0040】本実施形態によれば、ロールバック・リス
タート処理が行なわれた場合に、その処理結果だけでな
く、データベースシステムにおいて、当該ロールバック
・リスタートにより無効になったトランザクションのI
Dについても通知、表示されるので、ユーザはその事実
を知ることができる。
According to this embodiment, when the rollback / restart processing is performed, not only the processing result but also the I / O of the transaction invalidated by the rollback / restart in the database system.
Since D is also notified and displayed, the user can know the fact.

【0041】[第3の実施形態]図14は、第3の実施
形態に係る計算機システムの構成を示す図である。本実
施形態では、ユーザの入力操作(ユーザアクション)
と、その操作に対するプロセスの対応関係を記録してお
き、ロールバック・リスタート処理が行われた場合に、
その対応関係を端末に通知することを特徴とする。
[Third Embodiment] FIG. 14 is a diagram showing a configuration of a computer system according to the third embodiment. In the present embodiment, a user input operation (user action)
And the correspondence of the process to the operation is recorded, and if rollback / restart processing is performed,
The correspondence is notified to the terminal.

【0042】同図において、ユーザアクション管理部1
41は、ユーザの入力操作と、その操作が行われたプロ
セスの対応関係を記録し、次回のチェックポイントまで
保存する。そして、ロールバックが完了した旨の通知を
受け取ると、保存しているユーザアクションとプロセス
との対応関係をロールバック通知部へ通知する。
In the figure, a user action management unit 1
Reference numeral 41 records the correspondence between the user's input operation and the process in which the operation has been performed, and stores it until the next checkpoint. Then, when the notification that the rollback is completed is received, the correspondence between the stored user action and the process is notified to the rollback notification unit.

【0043】ここで、ユーザアクションとは、プロセス
からの入力要求やプロセスに対する制御命令等がある。
入力要求としては、例えば、入力フィールドにキーボー
ド等から直接的にデータを入力するような場合があげら
れ、制御命令としては、例えば、ウィンドウの移動操作
等があげられる。このようなユーザアクションは、所定
のフォーマットで、ユーザアクション管理部141の管
理の下、メモリ等に記録される。
Here, the user action includes an input request from a process, a control command for the process, and the like.
The input request includes, for example, a case where data is directly input to the input field from a keyboard or the like, and the control command includes, for example, a window moving operation. Such a user action is recorded in a predetermined format in a memory or the like under the management of the user action management unit 141.

【0044】ロールバック通知部15は、無効になった
入力操作とプロセスとの対応関係をユーザアクション管
理部141から受け取ると、端末情報管理部12に保存
されているプロセス−端末情報を参照することにより、
プロセスを起動した端末を特定し、当該端末にプロセス
のロールバックにより無効になった入力操作をディスプ
レイに表示するよう、通知を行う。
When the rollback notification unit 15 receives the correspondence between the invalidated input operation and the process from the user action management unit 141, the rollback notification unit 15 refers to the process-terminal information stored in the terminal information management unit 12. By
The terminal that has started the process is specified, and a notification is sent to the terminal so that the input operation disabled by the rollback of the process is displayed on the display.

【0045】図15は、ユーザアクション管理部141
の動作処理を説明するための図である。ユーザアクショ
ン管理部141は、実行中のプロセスについて、ユーザ
の入力操作をトレースし、入力操作とその操作が行われ
たプロセスとの対応関係を記録する(STEP15
1)。次に、ユーザアクション管理部141は、チェッ
クポイント管理部142からチェックポイント情報を生
成した旨の通知を受け取ったか否かを判断する(STE
P152)。STEP152において、当該通知を受け
取ったと判断した場合には、記録されている入力操作と
プロセスとの対応関係を削除する(STEP153)。
FIG. 15 shows a user action management section 141.
FIG. 9 is a diagram for explaining the operation processing of FIG. The user action management unit 141 traces the user's input operation for the running process, and records the correspondence between the input operation and the process in which the operation was performed (STEP 15).
1). Next, the user action management unit 141 determines whether a notification that the checkpoint information has been generated is received from the checkpoint management unit 142 (STE).
P152). If it is determined in STEP 152 that the notification has been received, the recorded correspondence between the input operation and the process is deleted (STEP 153).

【0046】記録を削除した後、または、STEP15
2において通知を受け取っていないと判断された場合に
は、ユーザアクション管理部141は、プロセス管理部
からロールバックが完了した旨の通知があったか否かを
判断する(STEP154)。STEP154におい
て、当該通知があったと判断された場合には、入力操作
とプロセスとの対応関係をロールバック通知部15に通
知する(STEP155)。つまり、記録されている入
力操作は、ロールバックにより無効になったものであ
る。
After deleting the record or in STEP 15
If it is determined in step 2 that no notification has been received, the user action management unit 141 determines whether or not a notification that the rollback has been completed has been received from the process management unit (STEP 154). If it is determined in STEP 154 that the notification has been received, the correspondence between the input operation and the process is notified to the rollback notification unit 15 (STEP 155). That is, the recorded input operation is invalidated by the rollback.

【0047】図16は、ロールバック通知部15の動作
処理を説明するための図である。ロールバック通知部1
5は、無効になった入力操作とプロセスとの対応関係を
ユーザアクション管理部141から通知されるまで待機
する(STEP161)。ロールバック通知部15は、
当該通知があったと判断した場合には、端末情報管理部
12に保存されているプロセス−端末情報を参照するこ
とにより、当該プロセスを起動した端末を特定し(ST
EP162)、その端末に対してプロセスのロールバッ
クにより無効になった入力操作を表示するように通知す
る(STEP163)。
FIG. 16 is a diagram for explaining the operation processing of the rollback notifying section 15. Rollback notification unit 1
5 waits until the correspondence between the invalidated input operation and the process is notified from the user action management unit 141 (STEP 161). The rollback notification unit 15
If it is determined that the notification has been received, the terminal that has started the process is specified by referring to the process-terminal information stored in the terminal information management unit 12 (ST
(EP162), and notifies the terminal to display the input operation invalidated by the rollback of the process (STEP163).

【0048】図17は、当該通知のあった端末の画面表
示の一例を示す図である。同図は、ディスプレイ(画
面)に、ロールバック通知アイコン171が常時表示さ
れており、ユーザは、エディタ等の作業ウィンドウ17
2により作業を行っている状態を示している。このよう
な状況において、ロールバック通知部15により、ロー
ルバック・リスタートが発生し、無効となったトランザ
クションが通知されると、例えば、PoPUpウィンド
ウ173のようにウィンドウが開いて、入力操作による
データが取り消された旨の表示が行われる。同図に示す
ように、ユーザアクションは、入力されたデータのほ
か、制御命令等も表示するようにしてもよい。
FIG. 17 is a diagram showing an example of the screen display of the terminal that has received the notification. In the figure, the rollback notification icon 171 is always displayed on the display (screen), and the user can use the work window 17 such as an editor.
2 shows a state in which work is being performed. In such a situation, when a rollback / restart occurs and the invalidated transaction is notified by the rollback notification unit 15, for example, a window is opened as a PoPUp window 173, and the data by the input operation is displayed. Is displayed to the effect that has been canceled. As shown in the figure, the user action may display a control command or the like in addition to the input data.

【0049】以上のように本実施形態によれば、例え
ば、ウィンドウシステム等のインタラクティブな環境に
おいて、ロールバック・リスタート処理が行なわれた場
合に、当該ロールバック・リスタート処理により無効に
なった入力操作が通知されるので、ユーザはその内容を
知ることができるようになる。
As described above, according to the present embodiment, for example, when a rollback / restart process is performed in an interactive environment such as a window system, the rollback / restart process becomes invalid. Since the input operation is notified, the user can know the content.

【0050】[0050]

【発明の効果】本発明によれば、計算機に障害が発生し
た場合、分散チェックポイント・リスタート方法におい
て、プロセスのロールバック・リスタート処理が行なわ
れる際、当該プロセスがロールバックしたことをユーザ
ーが知ることが可能となる。
According to the present invention, when a failure occurs in a computer, when a rollback / restart process of a process is performed in a distributed checkpoint / restart method, a user is notified that the process has rolled back. Will be able to know.

【0051】また、データベースシステムの場合は、プ
ロセスのロールバックにより無効になったトランザクシ
ョンを知ることが可能となる。さらに、ウィンドウシス
テム等の環境において、ユーザーの入力操作のうち、プ
ロセスのロールバック・リスタート処理によって無効に
なった入力操作を知ることが可能となる。
In the case of a database system, it is possible to know a transaction that has become invalid due to a rollback of a process. Further, in an environment such as a window system, it becomes possible to know an input operation invalidated by a rollback / restart process of a process among input operations of a user.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 第1の実施形態に係る計算機システムの構成
を示す図。
FIG. 1 is a diagram showing a configuration of a computer system according to a first embodiment.

【図2】 プロセス−端末情報の一例を示す図。FIG. 2 is a diagram showing an example of process-terminal information.

【図3】 プロセス管理部の動作処理を説明するための
図。
FIG. 3 is a diagram for explaining an operation process of a process management unit.

【図4】 端末情報管理部の動作処理を説明するための
図。
FIG. 4 is a diagram for explaining an operation process of a terminal information management unit.

【図5】 ロールバック通知部の動作処理を説明するた
めの図。
FIG. 5 is a diagram for explaining an operation process of a rollback notification unit.

【図6】 通知のあった端末の画面表示の一例を示す
図。
FIG. 6 is a diagram showing an example of a screen display of a terminal that has been notified.

【図7】 通知のあった端末の画面表示の他の例を示す
図。
FIG. 7 is a diagram showing another example of the screen display of the terminal that has been notified.

【図8】 第2の実施形態に係る計算機システムの構成
を示す図。
FIG. 8 is a diagram showing a configuration of a computer system according to the second embodiment.

【図9】 プロセス管理部の動作処理を説明するための
図。
FIG. 9 is a diagram for explaining an operation process of a process management unit.

【図10】 トランザクション管理部の動作処理を説明
するための図。
FIG. 10 is a diagram for explaining an operation process of a transaction management unit.

【図11】 ロールバック通知部の動作処理を説明する
ための図。
FIG. 11 is a diagram illustrating an operation process of a rollback notification unit.

【図12】 通知のあった端末の画面表示の一例を示す
図。
FIG. 12 is a diagram showing an example of a screen display of a terminal that has been notified.

【図13】 チェックポイント管理部の動作処理を説明
するための図。
FIG. 13 is a diagram for explaining an operation process of a checkpoint management unit.

【図14】 第3の実施形態に係る計算機システムの構
成を示す図。
FIG. 14 is a diagram showing a configuration of a computer system according to a third embodiment.

【図15】 ユーザアクション管理部の動作処理を説明
するための図。
FIG. 15 is a diagram for explaining an operation process of a user action management unit.

【図16】 ロールバック通知部の動作処理を説明する
ための図。
FIG. 16 is a diagram for explaining an operation process of a rollback notification unit.

【図17】 通知のあった端末の画面表示の一例を示す
図。
FIG. 17 is a diagram showing an example of a screen display of a terminal that has been notified.

【符号の説明】[Explanation of symbols]

1…計算機 11…プロセス管理部 12…端末情報管理部 13…チェックポイント管理部 14…記憶装置 15…ロールバック通知部 81…トランザクション管理部 141…ユーザアクション管理部 DESCRIPTION OF SYMBOLS 1 ... Computer 11 ... Process management part 12 ... Terminal information management part 13 ... Checkpoint management part 14 ... Storage device 15 ... Rollback notification part 81 ... Transaction management part 141 ... User action management part

───────────────────────────────────────────────────── フロントページの続き (72)発明者 金井 達徳 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 ──────────────────────────────────────────────────の Continued on the front page (72) Inventor Tatsunori Kanai 1 Toshiba-cho, Komukai-Toshiba-cho, Sai-ku, Kawasaki-shi, Kanagawa Inside the R & D Center of Toshiba Corporation

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】分散計算機システム上でプロセスのチェッ
クポイント情報を取得しつつ、該プロセスを実行するに
際し、前記プロセスと当該プロセスを起動した端末とを
対応づけて所定の情報として記録しておき、前記プロセ
スの再実行処理を行う場合に、該プロセスを起動した端
末を特定して、該特定された端末に再実行処理が行われ
た旨を通知することを特徴とするプロセスの再実行処理
方法。
When executing a process while acquiring checkpoint information of the process on a distributed computer system, the process and the terminal that started the process are recorded as predetermined information in association with each other, When performing the process re-execution processing, a process re-execution processing method characterized by specifying a terminal that has started the process and notifying the specified terminal that the re-execution processing has been performed. .
【請求項2】分散処理を行っているプロセス群のうちの
少なくとも1つのプロセスが分散チェックポイントに基
づいて再実行処理を行う場合に、前記プロセス群の各々
を起動した端末を各々特定し、該特定された各々の端末
に再実行処理が行われた旨を通知することを特徴とする
請求項1記載のプロセスの再実行処理方法。
2. When at least one process in a group of processes performing distributed processing performs re-execution processing based on a distributed checkpoint, a terminal that has started each of the group of processes is specified. 2. The method according to claim 1, wherein each of the identified terminals is notified that the re-execution processing has been performed.
【請求項3】前記実行されるプロセスが所定のトランザ
クションを実行することによって該トランザクションが
コミットされる場合に、前記トランザクションと該トラ
ンザクションを実行したプロセスとを対応づけて所定の
情報として記録しておき、前記プロセスの再実行処理を
行う場合に、該プロセスを起動した端末を特定して、該
特定された端末に再実行処理が行われた旨および該対応
するトランザクションを通知することを特徴とする請求
項1または2記載のプロセスの再実行処理方法。
3. When the executed process executes a predetermined transaction and the transaction is committed, the transaction and the process that executed the transaction are recorded as predetermined information in association with each other. When performing the re-execution processing of the process, identifying the terminal that has started the process, and notifying the identified terminal that the re-execution processing has been performed and the corresponding transaction. A method for re-executing the process according to claim 1.
【請求項4】前記実行されるプロセスに対してユーザの
入力操作がある場合に、前記プロセスと該プロセスに対
する入力操作の内容とを対応づけて所定の情報として記
録しておき、前記プロセスの再実行処理を行う場合に、
該プロセスを起動した端末を特定して、該特定された端
末に再実行処理が行われた旨および該対応する入力操作
の内容を通知することを特徴とする請求項1または2記
載のプロセスの再実行処理方法。
4. When a user performs an input operation on the process to be executed, the process and the content of the input operation on the process are recorded in association with each other as predetermined information, and the process is re-executed. When performing execution processing,
3. The process according to claim 1, wherein the terminal that has started the process is specified, and a notification that re-execution processing has been performed and the content of the corresponding input operation are notified to the specified terminal. Re-execution processing method.
【請求項5】前記プロセスについてのチェックポイント
情報が生成された場合は、前記記録された所定の情報を
削除することを特徴とする請求項1乃至5記載のプロセ
スの再実行処理方法。
5. A method according to claim 1, wherein when the checkpoint information for the process is generated, the recorded predetermined information is deleted.
JP08028297A 1997-03-31 1997-03-31 calculator Expired - Fee Related JP3516428B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP08028297A JP3516428B2 (en) 1997-03-31 1997-03-31 calculator

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP08028297A JP3516428B2 (en) 1997-03-31 1997-03-31 calculator

Publications (2)

Publication Number Publication Date
JPH10275133A true JPH10275133A (en) 1998-10-13
JP3516428B2 JP3516428B2 (en) 2004-04-05

Family

ID=13713928

Family Applications (1)

Application Number Title Priority Date Filing Date
JP08028297A Expired - Fee Related JP3516428B2 (en) 1997-03-31 1997-03-31 calculator

Country Status (1)

Country Link
JP (1) JP3516428B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009169515A (en) * 2008-01-11 2009-07-30 Denso Corp Computer system and system recovery device
WO2011080910A2 (en) 2010-01-04 2011-07-07 Nec Corporation Method, distributed system and computer program for failure recovery

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009169515A (en) * 2008-01-11 2009-07-30 Denso Corp Computer system and system recovery device
WO2011080910A2 (en) 2010-01-04 2011-07-07 Nec Corporation Method, distributed system and computer program for failure recovery
JP2013516665A (en) * 2010-01-04 2013-05-13 日本電気株式会社 Method, distributed system, and computer program for disaster recovery

Also Published As

Publication number Publication date
JP3516428B2 (en) 2004-04-05

Similar Documents

Publication Publication Date Title
JP3253883B2 (en) Process restart method and process monitoring device
JP4321705B2 (en) Apparatus and storage system for controlling acquisition of snapshot
JP3675802B2 (en) Method and system for reconfiguring the state of computation
US8214686B2 (en) Distributed processing method
JP3072048B2 (en) Computer system and software failure recovery method for computer system
US7636741B2 (en) Online page restore from a database mirror
US7594138B2 (en) System and method of error recovery for backup applications
US20060294435A1 (en) Method for automatic checkpoint of system and application software
US5734896A (en) Recovery of a remotely initiated distributed prepared transaction by status report from a second database to an external coordinator
Saridakis A System of Patterns for Fault Tolerance.
JP3094888B2 (en) Numbering mechanism, data consistency confirmation mechanism, transaction re-execution mechanism, and distributed transaction processing system
KR20040047209A (en) Method for automatically recovering computer system in network and recovering system for realizing the same
Huang et al. NT-SwiFT: Software implemented fault tolerance on Windows NT
US7783742B2 (en) Dynamic process recovery in a distributed environment
JP3463020B2 (en) Workflow execution method and apparatus, and recording medium recording workflow execution program
JPH10275133A (en) Reexecution processing method for process
US7350104B2 (en) Invocation of a follow on unit of work
JP2002024055A (en) Computer system and operation reproducing method of application program
JPH103403A (en) Computer system and debugging method
JP2002007218A (en) Memory collation system
TWI220707B (en) Mainboard test program processing system and method
JPH06309213A (en) Rollback control system
JP2022021528A (en) Electronic computer, reproduction test method and program
WO2003073281A1 (en) Highly available transaction recovery for transaction processing systems
JPH0816431A (en) Debugging process system for user program

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040119

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080130

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090130

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100130

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100130

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110130

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120130

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130130

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140130

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees