JPH10320223A - System, method for processing check point communication and storage medium recording the same - Google Patents

System, method for processing check point communication and storage medium recording the same

Info

Publication number
JPH10320223A
JPH10320223A JP9126773A JP12677397A JPH10320223A JP H10320223 A JPH10320223 A JP H10320223A JP 9126773 A JP9126773 A JP 9126773A JP 12677397 A JP12677397 A JP 12677397A JP H10320223 A JPH10320223 A JP H10320223A
Authority
JP
Japan
Prior art keywords
packet
checkpoint
time
communication
reception
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9126773A
Other languages
Japanese (ja)
Inventor
Masanori Tomota
正憲 友田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP9126773A priority Critical patent/JPH10320223A/en
Publication of JPH10320223A publication Critical patent/JPH10320223A/en
Pending legal-status Critical Current

Links

Landscapes

  • Retry When Errors Occur (AREA)
  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

PROBLEM TO BE SOLVED: To execute an application with communication processing at high speed by transmitting a communication packet as speedily as possible while dynamically changing the interval of check point sampling corresponding to the frequency and time interval of communication. SOLUTION: A communication interval observing means 104 is located between an input/output request holding means 103 and a transport 106 and each time a packet is transmitted/received, it is recorded in a packet transmission/ reception time table 107 for each connection when the latest packet is transmitted/received. This time table 107 holds the transmission time of the latest communication packet transmitted by an FT computer 101 and the time of the latest communication packet received by a communication means 105 and dispatched to the transport 106 for each connection. Next, a check point roll-back means 102 samples the next check point by calculating check point intervals while using check point sampling time based on the packet transmission/reception time table 107 and packet information.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、チェックポイント
を採取しながら処理を進めていき、障害が発生した時、
最後に採取したチェックポイントまでロールバックし処
理を再実行することにより障害からの回復を実現するコ
ンピュータシステムに適用して好適なチェックポイント
通信処理システムに係わり、特に次のチェックポイント
を採取する時期を最適にすることにより、コンピュータ
システムにおける通信処理の大幅な高速化を図ることを
可能とするチェックポイント通信処理システム及びチェ
ックポイント通信処理方法に関する。
BACKGROUND OF THE INVENTION The present invention proceeds with processing while collecting checkpoints.
It relates to a suitable checkpoint communication processing system applied to a computer system that realizes recovery from failure by rolling back to the last collected checkpoint and re-executing the process, especially when to collect the next checkpoint. The present invention relates to a checkpoint communication processing system and a checkpoint communication processing method that can achieve a significant speedup of communication processing in a computer system by optimizing.

【0002】[0002]

【従来の技術】従来、チェックポイントを採取しながら
処理を進め、故障が発生した場合には、最後に採取した
チェックポイントまでロールバックし処理を再実行する
ことにより、故障からの回復を可能とするコンピュータ
システムにおいては、通信の出力処理についても、その
発行を次のチェックポイント処理が開始されるまで保存
し、チェックポイント後に一括して発行させなければな
らなかった。
2. Description of the Related Art Conventionally, processing is performed while collecting checkpoints, and when a failure occurs, it is possible to recover from the failure by rolling back to the last collected checkpoint and re-executing the processing. In such a computer system, it is necessary to store the issuance of communication output processing until the next checkpoint processing is started, and to issue the communication output processing collectively after the checkpoint.

【0003】これは、故障が発生した場合にコンピュー
タシステムは直前のチェックポイント迄戻るため、故障
が発生する迄に生成された通信処理も全てキャンセルし
なければ、故障回復時に、応用プログラムなどが発行し
た通信データの一貫性を保証できないからであった。
[0003] This is because, when a failure occurs, the computer system returns to the immediately preceding checkpoint. Therefore, unless all the communication processes generated before the failure occurs are canceled, an application program or the like is issued at the time of recovery from the failure. This is because the consistency of the communication data obtained cannot be guaranteed.

【0004】従来は、この遅延による劣化を少しでも改
善するために、 ・前回のチェックポイント採取後、一定時間を越えた。
Conventionally, in order to improve the deterioration due to the delay as much as possible, a certain time has been exceeded after the previous checkpoint collection.

【0005】・蓄積された通信処理要求が、一定量を越
えた。
[0005] The accumulated communication processing request exceeds a certain amount.

【0006】のいずれかの条件が成立した時にはチェッ
クポイントの採取を行っていた。
When one of the conditions is satisfied, a checkpoint is collected.

【0007】しかし、これらの方式では、十分な速度向
上を引き出すことはできなかった。
However, these methods have not been able to achieve a sufficient speed improvement.

【0008】[0008]

【発明が解決しようとする課題】従来のチェックポイン
トーロールバック方式を採用しているコンピュータシス
テム、例えば、故障や障害に対応可能なフォールト・ト
レラント・コンピュータ(耐故障性コンピュータ、以下
FT計算機とする)において、特に、通信を用いて他の
計算機と情報をやりとりしながら、処理を進めるような
アプリケーションの場合、処理時間が長くなってしまう
という問題がある。
A computer system employing a conventional checkpoint-rollback system, for example, a fault-tolerant computer capable of coping with a failure or a failure (fault-tolerant computer, hereinafter referred to as an FT computer) In particular, in the case of an application that advances processing while exchanging information with another computer using communication, there is a problem that processing time becomes longer.

【0009】そこで、本発明は、チェックポイント・ロ
ールバック方式のコンピュータシステムが、チェックポ
イント採取の間隔を通信の頻度、時間間隔によって動的
に変えることで、通信パケットの送信をできるだけ早く
行うことにより、通信処理を伴うアプリケーションの高
速な実行を可能とするチェックポイント通信システム及
びチェックポイント通信処理方法を提供することを目的
とする。
In view of the above, the present invention provides a checkpoint / rollback type computer system that transmits a communication packet as soon as possible by dynamically changing the checkpoint collection interval depending on the communication frequency and time interval. It is an object of the present invention to provide a checkpoint communication system and a checkpoint communication processing method that enable high-speed execution of an application involving communication processing.

【0010】[0010]

【課題を解決するための手段】[Means for Solving the Problems]

(1)本発明は、ネットワーク上の他のコンピュータと
通信する際に上記他のコンピュータに送信する通信パケ
ットをチェックポイントを採取するまで保持し、チェッ
クポイント採取後に上記保持した通信パケットを一括し
て送信することで、障害が発生した時に最後に採取した
チェックポイントまでロールバックして上記保持した通
信パケットを送信することで処理を再実行し障害からの
回復を実現するコンピュータのチェックポイント通信処
理システムにおいて、上記他のコンピュータと送受信す
る通信パケットの情報であるパケット情報を蓄積するパ
ケット蓄積手段と、最新のチェックポイント採取前に受
け付けた送信する通信パケットのパケット情報の受付時
間を現在のチェックポイントの採取時刻に変更する時刻
変更手段と、上記変更されたパケット情報に基づき上記
他のコンピュータへ送信するパケットと上記他のコンピ
ュータから受信するパケットの送信時間と到着時間の時
間間隔を求め、この時間間隔に基づいて次にチェックポ
イントを採取するまでの時間を算出するチェックポイン
ト間隔算出手段とを備え、上記チェックポイント間隔算
出手段が算出したチェックポイントを採取するまでの時
間に基づき次のチェックポイントを採取することを特徴
とする。
(1) According to the present invention, when communicating with another computer on a network, a communication packet to be transmitted to the other computer is held until a checkpoint is collected, and the held communication packets are collectively collected after the checkpoint is collected. A checkpoint communication processing system for a computer that, by transmitting, rolls back to the last checkpoint taken when a failure occurs and transmits the held communication packet to re-execute processing and realize recovery from the failure A packet storage means for storing packet information, which is information of communication packets transmitted to and received from the other computer, and a reception time of the packet information of the communication packet to be transmitted which is received before the latest checkpoint is collected. Time changing means for changing to the collection time, and The time interval between the transmission time and the arrival time of the packet to be transmitted to the other computer and the packet received from the other computer is determined based on the updated packet information, and until the next checkpoint is collected based on this time interval. Check point interval calculating means for calculating the time of the check point, and the next check point is collected based on the time until the check point calculated by the check point interval calculating means is collected.

【0011】この構成によれば、従来一定の間隔であっ
たチェックポイントの間隔を、チェックポイントの間隔
を通信パケットの送受信される間隔によって自動で変更
することで、チェックポイントをタイミングよく取るこ
とができ、パケットの送信をスムーズに行うことができ
る。
[0011] According to this configuration, the checkpoint interval can be taken with good timing by automatically changing the checkpoint interval, which was conventionally a fixed interval, according to the interval at which communication packets are transmitted and received. The packet can be transmitted smoothly.

【0012】(2)本発明は、(1)記載のチェックポ
イント通信処理システムにおいて、上記チェックポイン
ト間隔算出手段は、上記パケット情報の送信パケットと
同一のアドレス、ポート番号の受信パケットを検索し、
上記送信パケットと上記受信パケットの受付時刻の差分
を計算しこれを送信処理時間とし、上記パケット情報の
受信パケットと同一のアドレス、ポート番号の送信パケ
ットを検索し、上記受信パケットと上記送信パケットの
受付時刻の差分を計算しこれを受信処理時間とし、次の
チェックポイント採取までの上記送信処理時間と上記受
信処理時間を加えてこれを上記計算した差分の数で割っ
たものを次にチェックポイントを採取するまでの時間と
したことを特徴とする。
(2) In the checkpoint communication processing system according to (1), the checkpoint interval calculating means searches for a received packet having the same address and port number as the transmitted packet of the packet information,
Calculate the difference between the reception time of the transmission packet and the reception time of the reception packet and use this as the transmission processing time, search for a transmission packet of the same address and port number as the reception packet of the packet information, and search the transmission packet of the reception packet and the transmission packet. Calculate the difference between the reception times and use this as the reception processing time, add the transmission processing time and the reception processing time until the next checkpoint collection, divide this by the number of calculated differences, and then calculate the checkpoint It is characterized by the time taken until the sample is collected.

【0013】この構成によれば、チェックポイントの間
隔を通信パケットの送受信される間隔によって自動で変
更することで、チェックポイントをタイミングよく取る
ことができ、パケットの送信をスムーズに行うことがで
きる。
According to this configuration, by automatically changing the interval between checkpoints according to the interval at which communication packets are transmitted / received, checkpoints can be taken with good timing and packets can be transmitted smoothly.

【0014】また、通信パケットの送信処理時間と受信
処理時間の平均を算出し、これをチェックポイント間隔
とすることで、より、処理の実際に即したチェックポイ
ント間隔を決定することができる。
Further, by calculating the average of the transmission processing time and the reception processing time of the communication packet and using the average as the check point interval, it is possible to determine the check point interval more suitable for the actual processing.

【0015】(3)本発明は、(1)乃至(2)記載の
チェックポイント通信処理システムにおいて、上記チェ
ックポイント間隔算出手段は、予め設定したチェックポ
イントを採取するまでの時間の最大値と最小値に基づい
て上記算出したチェックポイントを採取するまでの時間
が上記最大値以上になった場合は上記最大値に、上記最
小値以下になった場合は上記最小値にすることを特徴と
する。
(3) In the checkpoint communication processing system according to (1) or (2), the checkpoint interval calculating means may include a maximum value and a minimum time until a preset checkpoint is collected. When the time required to collect the calculated checkpoint based on the value is equal to or more than the maximum value, the value is set to the maximum value, and when it is equal to or less than the minimum value, the value is set to the minimum value.

【0016】この構成によれば、チェックポイントの間
隔を通信パケットの送受信される間隔によって自動で変
更することで、チェックポイントをタイミングよく取る
ことができ、パケットの送信をスムーズに行うことがで
きる。
According to this configuration, by automatically changing the interval between checkpoints according to the interval at which communication packets are transmitted and received, checkpoints can be taken with good timing and packets can be transmitted smoothly.

【0017】また、チェックポイント間隔の最大値と最
小値を予め設定しておき、上記算出したチェックポイン
トがこの最大値以上になった場合は最大値にし、最小値
以下になった場合は最小値にすることで、チェックポイ
ント間隔が長すぎるために起こる通信処理以外の入出力
要求が遅延されそれらの応答時間が長くなることを防
ぎ、またチェックポイント間隔が短くなりすぎることに
より起こるチェックポイント採取するための時間が多く
なりシステムの処理時間を失うことを防いで、チェック
ポイント間隔を適正な値に調整できる。
Also, the maximum value and the minimum value of the checkpoint interval are set in advance, and when the calculated checkpoint exceeds the maximum value, the maximum value is set, and when the calculated checkpoint falls below the minimum value, the minimum value is set. By doing so, I / O requests other than communication processing caused by too long a checkpoint interval are prevented from delaying their response time, and checkpoints caused by a too short checkpoint interval are collected. The checkpoint interval can be adjusted to an appropriate value by preventing the time required for the system from being increased and losing the processing time of the system.

【0018】[0018]

【発明の実施の形態】BEST MODE FOR CARRYING OUT THE INVENTION

(第1の実施の形態)以下、図面を参照して本発明の実
施の形態について説明する。
(First Embodiment) An embodiment of the present invention will be described below with reference to the drawings.

【0019】図1は、第1の実施の形態のシステム構成
図である。FT計算機101は、通常の計算機を構成す
る各要素のほかに、従来の技術で述べたように、チェッ
クポイント・ロールバックを実現するために、障害が起
きた時に戻って再実行できることを保証した状態である
チェックポイントを適宜採取しながら処理を進め、障害
が検出された時点で、以前に採取しておいた故障が起き
る前の状態にプロセッサやメモリを戻し、障害を取り除
いてから再実行するチェックポイント・ロールバック手
段102と、全ての入出力装置への要求(入出力要求)
をチェックポイントが採取され状態が確定するまで保持
する入出力要求保持手段103等から構成される。
FIG. 1 is a system configuration diagram of the first embodiment. The FT computer 101 assures that, in addition to the elements constituting a normal computer, it can be returned and re-executed when a failure occurs in order to realize checkpoint rollback as described in the related art. Proceed with processing while collecting checkpoints as appropriate, and when a failure is detected, return the processor or memory to the state before the failure that was previously collected, remove the failure, and re-execute Checkpoint / rollback means 102 and requests to all input / output devices (input / output requests)
Is held until the checkpoint is collected and the status is determined.

【0020】また、チェックポイント・ロールバック手
段102は、最新のチェックポイントをいつ採取したか
という、チェックポイント採取時間を記録する。チェッ
クポイントをいつ採取するかを決定するこれまでの手法
は、予め決められた時間間隔で採取する、或いは、入出
力要求保持手段103が、ある一定個数以上の入出力要
求を蓄積したかどうか等がある。本実施の形態では、後
で述べるように、チェックポイントを採取するタイミン
グを決めるための新たな方式を提案する。
The checkpoint / rollback means 102 records a checkpoint collection time indicating when the latest checkpoint was collected. The conventional method of determining when to collect checkpoints is to collect checkpoints at predetermined time intervals, or to determine whether the input / output request holding unit 103 has accumulated a certain number or more of input / output requests. There is. In the present embodiment, as will be described later, a new method for determining the timing at which checkpoints are collected is proposed.

【0021】さらに、FT計算機101は、通常の計算
機で通信のために使用するトランスポート106と、通
信手段105を備える。
Further, the FT computer 101 includes a transport 106 used for communication with a normal computer, and a communication means 105.

【0022】通信手段105は、LANでよく使用され
るイ―サネット(Ethernet)等に接続するためのインタ
フェースを操作する手段であり、トランスポート106
は、他の計算機との通信パケットの送受信を行うための
手段で、ここでは例として、TCP/IP(Trans
mission Control Protocol/
Internet Protocol)とする。
The communication means 105 is means for operating an interface for connecting to an Ethernet (Ethernet) or the like often used in a LAN.
Is a means for transmitting and receiving communication packets to and from another computer. Here, for example, TCP / IP (Trans
Mission Control Protocol /
Internet Protocol).

【0023】通信間隔観測手段104は、図1に示した
ように、入出力要求保持手段103とトランスポート1
06の間に位置し、パケットを送受信する度、コネクシ
ョン毎に、最新のパケットをいつ送受信したかを、パケ
ット送受信時間テーブル107に記録する。
The communication interval observing means 104, as shown in FIG.
06, each time a packet is transmitted / received, the time at which the latest packet was transmitted / received is recorded in the packet transmission / reception time table 107 for each connection.

【0024】パケット送受信時間テーブル107は、F
T計算機が送信した最も最近の通信パケットの送信時間
と、通信手段105が受信し、トランスポート 106へ
渡した最も最近の通信パケットの時間を、コネクシヨン
毎に保持する。
The packet transmission / reception time table 107 has F
The transmission time of the latest communication packet transmitted by the T computer and the time of the latest communication packet received by the communication means 105 and passed to the transport 106 are held for each connection.

【0025】ネットワーク109は、LAN(Loca
l Area Network)などのネットワークで
あり、FT計算機101と、このFT計算機とデータの
提供等を受けるクライアント計算機等と接続する。
The network 109 is a LAN (Local
1 Area Network, etc., and connects the FT computer 101 and a client computer or the like that receives data from the FT computer 101 and the like.

【0026】図2は、パケット送受信時間テーブル10
7のデータ格納例である。TCP/IPでは、通信相手
先の計算機のアドレス(IPアドレス)を格納し、この
計算機内のアプリケーションを示すポート番号によっ
て、仮想的なコネクションを決定する。パケット送受信
時間テーブル107は、通信パケットのアドレスとポー
ト番号をアドレス201、ポート番号202に格納す
る。また、送受信フラグ203に、通信パケットの送信
か受信かを示すフラグを格納する。時間204には、通
信パケットの受け付けた時間を格納する。
FIG. 2 shows a packet transmission / reception time table 10.
7 is an example of data storage. In TCP / IP, the address (IP address) of a computer at the other end of communication is stored, and a virtual connection is determined by a port number indicating an application in the computer. The packet transmission / reception time table 107 stores the address and the port number of the communication packet in the address 201 and the port number 202. Further, a flag indicating whether a communication packet is transmitted or received is stored in the transmission / reception flag 203. The time 204 stores the time at which the communication packet was received.

【0027】図3は、通信間隔観測手段104の処理を
示したフローチャートである。ここでは、パケットを送
受信するたび、コネクション毎に、最新のパケットをい
つ送受信したかを、パケット送受信時間テーブル107
に記録する。
FIG. 3 is a flow chart showing the processing of the communication interval observation means 104. Here, each time a packet is transmitted or received, the packet transmission / reception time table 107 indicates when the latest packet has been transmitted / received for each connection.
To record.

【0028】ステップ毎に説明すると、まず、送受信し
た通信パケットが、通信相手先とのコネクションを切断
するための通信パケットかどうかを判定する(A1)。
To describe each step, first, it is determined whether the transmitted / received communication packet is a communication packet for disconnecting the connection with the communication partner (A1).

【0029】コネクション切断のための通信パケットで
ある場合(A1のYES)、この通信パケットから、ア
ドレス、ポート番号を取り出し、パケット送受信時間テ
ーブル107から同一のアドレス、ポート番号をもつエ
ントリを検索し削除し(A2)処理は終了する。
If the packet is a communication packet for disconnecting the connection (YES in A1), the address and port number are extracted from the communication packet, and an entry having the same address and port number is searched from the packet transmission / reception time table 107 and deleted. (A2) The processing ends.

【0030】コネクション切断のための通信パケットで
ない場合(A1のNO)、この通信パケットがFT計算
機から送信する送信パケットかどうかを判定する(A
3)。
If the communication packet is not a communication packet for disconnecting the connection (NO in A1), it is determined whether the communication packet is a transmission packet transmitted from the FT computer (A).
3).

【0031】送信パケットである場合(A3のYE
S)、この送信パケットから、送信先のアドレス、ポー
ト番号を取り出す(A4)。次に、パケット送受信時間
テーブル107に、取り出したアドレス、ポート番号、
送信フラグ、現在時刻を記録し(A5)、処理終了す
る。
If the packet is a transmission packet (YE of A3)
S), and extracts the destination address and port number from the transmission packet (A4). Next, the extracted address, port number,
The transmission flag and the current time are recorded (A5), and the process ends.

【0032】送信パケットでない場合(A3のNO)、
FT計算機101が受信する受信パケットであるから、
この受信パケットから、送信元アドレス、ポート番号を
取り出す(A6)。次に、パケット送受信時間テーブル
107に、取り出したアドレス、ポート番号、受信フラ
グ、現在時刻を記録し(A7)、処理終了する。
If the packet is not a transmission packet (NO in A3),
Since the received packet is received by the FT computer 101,
The source address and port number are extracted from the received packet (A6). Next, the extracted address, port number, reception flag, and current time are recorded in the packet transmission / reception time table 107 (A7), and the process ends.

【0033】図4は、チェックポイント・ロールバック
手段102の処理を示したフローチャートである。チェ
ックポイント採取時間とは、最新のチェックポイントを
採取した時間を示し、チェックポイント間隔とは、次に
チェックポイント・ロールパック手段102がチェック
ポイントを取るまでの時間をあらわす。
FIG. 4 is a flowchart showing the processing of the checkpoint / rollback means 102. The checkpoint collection time indicates the time at which the latest checkpoint was collected, and the checkpoint interval indicates the time until the next checkpoint / roll pack unit 102 takes a checkpoint.

【0034】ステップ毎に説明すると、チェックポイン
ト採取時間を現在時刻とし、チェックポイントを予め定
められた値に初期化する(B1)。そして、定められた
チェックポイント間隔の時間だけ停止する(B2)。
To describe each step, the checkpoint collection time is set to the current time, and the checkpoint is initialized to a predetermined value (B1). Then, the operation is stopped for a predetermined checkpoint interval (B2).

【0035】次に、パケット送受信時間テーブル107
のエントリを全て走査したかを判定する(B3)。
Next, the packet transmission / reception time table 107
It is determined whether all the entries have been scanned (B3).

【0036】エントリを全て走査した場合(B3のYE
S)、チェックポイントを採取する(B4)。そして、
パケット送受信時間テーブル107とチェックポイント
採取時間を使用して、チェックポイント間隔を再計算す
る(B5)。この再計算の方法の詳細は、後で説明す
る。次に、チェックポイント採取時刻を現在時刻とする
(B6)。
When all entries are scanned (YE of B3)
S), a checkpoint is collected (B4). And
The checkpoint interval is recalculated using the packet transmission / reception time table 107 and the checkpoint collection time (B5). The details of this recalculation method will be described later. Next, the checkpoint collection time is set as the current time (B6).

【0037】エントリを全て走査していない場合(B3
のNO)、パケット送受信時間テーブル107の次のエ
ントリを取り出す(B7)。次に、取り出したパケット
が送信パケットかどうか判定する(B8)。
When all the entries have not been scanned (B3
NO), the next entry of the packet transmission / reception time table 107 is taken out (B7). Next, it is determined whether the extracted packet is a transmission packet (B8).

【0038】送信パケットの場合(B8のYES)、こ
のパケットがチェックポイント採取時間より前に登録さ
れたか判定する(B9)。チェックポイント採取時間よ
り前に登録されていなかった場合(B9のNO)、パケ
ット送受信時間テーブル107にエントリを戻す(B1
0)。チェックポイント採取時間より前に登録されてい
た場合(B9のYES)、つまり、この場合、前回のチ
ェックポイントより前に受け付けた送信パケットであ
る。よって、すでにチェックポイントを経ており、送信
を実行して良いパケットの受付時間を、チェックポイン
ト時刻(即ち、前回のチェックポイントを採取した時
間)に変更する。チェックポイント時刻は、現在時刻で
あるから、エントリの時間を現在時刻にし(B11)、
パケット送受信時間テーブルにエントリを戻す(B1
0)。
In the case of a transmission packet (YES in B8), it is determined whether this packet was registered before the checkpoint collection time (B9). If it has not been registered before the checkpoint collection time (NO in B9), an entry is returned to the packet transmission / reception time table 107 (B1).
0). If the packet was registered before the checkpoint collection time (YES in B9), that is, in this case, the transmission packet was received before the previous checkpoint. Therefore, the reception time of the packet that has already passed the checkpoint and is ready to be transmitted is changed to the checkpoint time (that is, the time at which the previous checkpoint was collected). Since the checkpoint time is the current time, the time of the entry is set to the current time (B11),
Return the entry to the packet transmission / reception time table (B1
0).

【0039】送信パケットでない場合(B8のNO)、
B3へ戻る。
If the packet is not a transmission packet (NO in B8),
Return to B3.

【0040】以上の処理により、次に説明するクライア
ント計算機の処理時間(FT計算機からの送信パケット
を受信し、FT計算機にパケットを送信してくるまでの
時間)を正確に求めることができる。なぜなら、上記の
パケットは、チェックポイントまで実際の送信が遅延さ
れるために、通信間隔観測手段104が受け付けた時間
そのままを使用すると、チェックポイント遅延の時間が
加算されてしまうためである。
By the above processing, the processing time of the client computer (the time from when the transmission packet is received from the FT computer to when the packet is transmitted to the FT computer) described below can be accurately obtained. This is because the actual transmission of the above packet is delayed up to the checkpoint, and if the time accepted by the communication interval observing unit 104 is used as it is, the checkpoint delay time is added.

【0041】次に、チェックポイント・ロールバック手
段102が、パケット送受信時間テーブル107と、先
に述べたチェックポイント採取時間を使用して、どのよ
うにチェックポイント間隔を計算するか(図4のB5)
を詳細に説明する。
Next, how the checkpoint / rollback means 102 calculates the checkpoint interval using the packet transmission / reception time table 107 and the checkpoint collection time described above (B5 in FIG. 4). )
Will be described in detail.

【0042】図5に、FT計算機上で動作するアプリケ
ーションと、ネットワーク上のある計算機で動作するア
プリケーションの間でやりとりするパケットの送受信の
タイミングの概念図を示す。
FIG. 5 is a conceptual diagram showing the timing of transmitting and receiving packets exchanged between an application running on the FT computer and an application running on a certain computer on the network.

【0043】FT計算機101上のアプリケーション
が、パケット511を送信し、次に通信相手のクライア
ント計算機上のアプリケーションから、受信パケット5
12を受け取る。その内容をもとに、さらに送信パケッ
ト513を送信する様子である。
The application on the FT computer 101 transmits the packet 511, and then receives the packet 5 from the application on the client computer of the communication partner.
Receive 12. The transmission packet 513 is further transmitted based on the contents.

【0044】送信パケット511は、まず、通信間隔観
測手段104により、パケット送受信時間テーブル10
7に登録される。受付時刻は、時刻501になる。次
に、チェックポイント521まで送信が遅延される。こ
のチェックポイント521の時、図4のB11の処理を
行うので、送信パケット511の受付時刻は、時刻50
2に変更される。チェックポイント522の時点で、以
下の計算を行う。
The transmission packet 511 is first sent to the packet transmission / reception time table 10 by the communication interval observing means 104.
7 is registered. The reception time is time 501. Next, transmission is delayed until check point 521. At the time of this checkpoint 521, the process of B11 in FIG. 4 is performed, so that the reception time of the transmission packet 511 is
It is changed to 2. At the time of the check point 522, the following calculation is performed.

【0045】受信パケット512と送信パケット511
の時間の差分507を、パケット送受信時間テーブル1
07より計算する。パケット送受信時間テーブル107
には、受信パケット512の受付時刻504と、送信パ
ケット511の受付時刻502が記録されているので、
それらの値を用いることで、差分507を求めることが
できる。差分507は、相手のアプリケーションの次の
パケットを送信するまでの処理時間と考えることができ
る。
Received packet 512 and transmitted packet 511
The time difference 507 of the packet transmission / reception time table 1
Calculate from 07. Packet transmission / reception time table 107
Records the reception time 504 of the reception packet 512 and the reception time 502 of the transmission packet 511.
The difference 507 can be obtained by using those values. The difference 507 can be considered as the processing time until the next packet of the other party application is transmitted.

【0046】次に、送信パケット513と受信パケット
512の時間の差分508を求める。これも、パケット
送受信時間テーブル107のエントリより計算すること
ができる。この差分508は、FT計算機101上のア
プリケーションの処理時間と考えることができる。
Next, a time difference 508 between the transmission packet 513 and the reception packet 512 is obtained. This can also be calculated from the entry of the packet transmission / reception time table 107. This difference 508 can be considered as the processing time of the application on the FT computer 101.

【0047】相手のアプリケーションの処理時間507
と、FT計算機101上のアプリケーションの処理時間
508を加えた時間が、チェックポイント採取に適した
時間になる。なぜなら、この時間間隔で、FT計算機1
01上のアプリケーションは、送信パケットを出すと、
予想できるからである。
Processing time 507 of partner application
Then, the time obtained by adding the processing time 508 of the application on the FT computer 101 becomes the time suitable for checkpoint collection. Because at this time interval, FT calculator 1
01 sends an outgoing packet,
Because it can be predicted.

【0048】チェックポイント・ロールバック手段10
2は、チェックポイントを採取する直前に、以下の計算
を行い、次のチェックポイント間隔を決定する。
Checkpoint / rollback means 10
In step 2, immediately before the checkpoint is collected, the following calculation is performed to determine the next checkpoint interval.

【0049】チェックポイント・ロールバック手段10
2のこの処理の流れを図6、図7、図8のフローチャー
トで示す。図6、図7は、先に説明した時間507、5
08を計算し、その平均を求めるものである。
Checkpoint / rollback means 10
2 is shown in the flow charts of FIGS. 6, 7 and 8. 6 and 7 show the times 507 and 5 described above.
08 is calculated and its average is calculated.

【0050】図8では、その値をもとにチェックポイン
ト間隔を計算する。
In FIG. 8, the checkpoint interval is calculated based on the value.

【0051】図6の送信までの平均時間を求める処理か
ら説明する。
The process of FIG. 6 for calculating the average time until transmission will be described.

【0052】パケット送受信時間テーブル107を全て
走査したか判定する(C1)。
It is determined whether the entire packet transmission / reception time table 107 has been scanned (C1).

【0053】全て走査した場合は(C1のYES)、総
処理時間をパケット数で割ったものを送信までの平均時
間とする(C2)。
If all scans have been performed (YES in C1), the total processing time divided by the number of packets is used as the average time until transmission (C2).

【0054】全て走査していない場合は(C1のN
O)、走査した送信パケットがチェックポイント採取時
間より後に受け付けた送信パケットかどうかを判定する
(C3)。
If all scans have not been performed (N of C1)
O), it is determined whether the scanned transmission packet is a transmission packet received after the checkpoint collection time (C3).

【0055】走査した送信パケットがチェックポイント
より後に受け付けたものである場合(C3のYES)、
この送信パケットと同一のアドレス、ポート番号の受信
パケットがあるかどうか判定する(C4)。同一のアド
レス、ポート番号の受信パケットがある場合(C4のY
ES)、送信パケットの受付時刻と受信パケットの受付
時刻の差分を計算し、総処理時間に加え、パケット数を
1つ増加し(C5)、C1へ戻る。同一のアドレス、ポ
ート番号の受信パケットがない場合(C4のNO)、C
1へ戻る。ここで、総処理時間は次のチェックポイント
採取までの上記計算した差分を全て足したものであり、
これを差分の数(ここではパケット数とする)で割った
ものが送信までの平均時間となる。
When the scanned transmission packet is received after the check point (YES in C3),
It is determined whether there is a received packet having the same address and port number as the transmitted packet (C4). When there is a received packet with the same address and port number (Y in C4)
ES), the difference between the reception time of the transmission packet and the reception time of the reception packet is calculated, the number of packets is increased by one in addition to the total processing time (C5), and the process returns to C1. If there is no received packet with the same address and port number (NO in C4), C
Return to 1. Here, the total processing time is the sum of all the calculated differences up to the next checkpoint collection,
The average time until transmission is obtained by dividing this by the number of differences (here, the number of packets).

【0056】走査した送信パケットがチェックポイント
より後に受け付けたものでない場合(C3のNO)、C
1へ戻る。
If the scanned transmission packet is not one received after the check point (NO in C3),
Return to 1.

【0057】次に、図7の受信までの平均時間を求める
を説明する。
Next, a description will be given of how to calculate the average time until reception in FIG.

【0058】パケット送受信時間テーブル107を全て
走査したか判定する(D1)。
It is determined whether the entire packet transmission / reception time table 107 has been scanned (D1).

【0059】全て走査した場合は(D1のYES)、総
処理時間をパケット数で割ったものを受信までの平均時
間とする(D2)。
If all scans have been performed (YES in D1), the total processing time divided by the number of packets is used as the average time until reception (D2).

【0060】全て走査していない場合は(D1のN
O)、走査した受信パケットがチェックポイント採取時
間より後に受け付けた受信パケットかどうかを判定する
(D3)。
If all scans are not performed (N of D1)
O), it is determined whether the scanned received packet is a received packet received after the checkpoint collection time (D3).

【0061】走査した受信パケットがチェックポイント
より後に受け付けたものである場合(D3のYES)、
この受信パケットと同一のアドレス、ポート番号の送信
パケットがあるかどうか判定する(D4)。同一のアド
レス、ポート番号の受信パケットがある場合(D4のY
ES)、送信パケットの受付時刻と受信パケットの受付
時刻の差分を計算し、総処理時間に加え、パケット数を
1つ増加し(D5)、D1へ戻る。同一のアドレス、ポ
ート番号の受信パケットがない場合(D4のNO)、D
1へ戻る。ここで、総処理時間は次のチェックポイント
採取までの上記計算した差分を全て足したものであり、
これを差分の数(ここではパケット数とする)で割った
ものが受信までの平均時間となる。
If the scanned received packet is received after the checkpoint (YES in D3),
It is determined whether there is a transmission packet having the same address and port number as the reception packet (D4). When there is a received packet with the same address and port number (Y in D4)
ES), the difference between the reception time of the transmission packet and the reception time of the reception packet is calculated, the number of packets is increased by one in addition to the total processing time (D5), and the process returns to D1. If there is no received packet with the same address and port number (NO in D4), D
Return to 1. Here, the total processing time is the sum of all the calculated differences up to the next checkpoint collection,
The value obtained by dividing this by the number of differences (here, the number of packets) is the average time until reception.

【0062】走査した受信パケットがチェックポイント
より後に受け付けたものでない場合(D3のNO)、D
1へ戻る。
If the scanned received packet is not the one received after the check point (NO in D3), D
Return to 1.

【0063】次に、図6、図7で求めた送信までの平均
時間と受信までの平均時間を元にチェックポイント間隔
を計算する処理を図8のフローチャートで説明する。
Next, a process of calculating the checkpoint interval based on the average time until transmission and the average time until reception obtained in FIGS. 6 and 7 will be described with reference to the flowchart in FIG.

【0064】図6、図7の処理で送信までの平均時間、
受信までの平均時間を計算する(E1)。次に、チェッ
クポイント間隔を「送信までの平均時間+受信までの平
均時間」にセットする。
The average time until transmission in the processing of FIGS.
The average time until reception is calculated (E1). Next, the checkpoint interval is set to “average time until transmission + average time until reception”.

【0065】このチェックポイント間隔を無制限に変更
することはできないので、あらかじめ最大値、最小値を
設定し、その範囲を超えないようにする。チェックポイ
ントの間隔が長くなりすぎると、通信以外の入出力要求
の処理が長く遅延されることになり、それらの応答時間
が長くなる影響がある。また、チェックポイント間隔が
短いと、チェックポイントを採取するための時間が多く
なり、システムの処理時間を失うことになるためであ
る。
Since the checkpoint interval cannot be changed indefinitely, a maximum value and a minimum value are set in advance so as not to exceed the range. If the interval between checkpoints is too long, processing of input / output requests other than communication will be delayed for a long time, which has the effect of lengthening the response time. Also, if the checkpoint interval is short, the time for collecting checkpoints increases, and the processing time of the system is lost.

【0066】チェックポイント間隔が予め設定した最大
値を超えていないか判定する(E3)。
It is determined whether the check point interval does not exceed a preset maximum value (E3).

【0067】チェックポイント間隔が最大値を超えてい
る場合(E3のNO)、チェックポイント間隔を最大値
にセットし(E5)、処理を終了する。
If the checkpoint interval exceeds the maximum value (NO in E3), the checkpoint interval is set to the maximum value (E5), and the process is terminated.

【0068】チェックポイント間隔が最大値を超えてい
ない場合(E3のYES)は、チェックポイント間隔が
予め設定した最小値を下回っていないか判定する(E
4)。
If the checkpoint interval does not exceed the maximum value (YES in E3), it is determined whether the checkpoint interval is less than a preset minimum value (E3).
4).

【0069】最小値を下回っていない場合(E4のYE
S)、処理は終了する。最小値を下回っている場合(E
4のNO)、チェックポイント間隔を最小値にセットし
(E6)、処理を終了する。
When the value is not below the minimum value (YE of E4)
S), the process ends. If below the minimum value (E
(NO in 4), the checkpoint interval is set to the minimum value (E6), and the process ends.

【0070】上記のように、本実施の形態では、パケッ
トの送信間隔、受信間隔の値により、チェックポイント
間隔を動的に変更することで、パケットの送信が発生し
た直後にチェックポイントを取るように処理が進み、送
信すべきパケットをすぐに送信することができる。
As described above, in the present embodiment, the checkpoint interval is dynamically changed according to the values of the packet transmission interval and the reception interval, so that the checkpoint is taken immediately after the packet transmission occurs. Then, the packet to be transmitted can be transmitted immediately.

【0071】[0071]

【発明の効果】通常のチェックポイント・ロールバック
方式を用いたFT計算機では、チェックポイントは一定
時間間隔で取られることが多い。本発明では、そのチェ
ックポイントの間隔をパケットのやりとりされる間隔に
よって自動で変更することで、チェックポイントをタイ
ミングよく取ることができ、パケットの送信をスムーズ
に行うことができる。
In an FT computer using a normal checkpoint rollback method, checkpoints are often taken at fixed time intervals. According to the present invention, by automatically changing the interval of the checkpoint according to the interval at which the packet is exchanged, the checkpoint can be taken with good timing, and the packet can be transmitted smoothly.

【0072】また、本発明によれば、通信パケットの送
信処理時間と受信処理時間の平均を算出し、これをチェ
ックポイント間隔とすることで、より、処理の実際に即
したチェックポイント間隔を決定することができる。
Further, according to the present invention, the average of the transmission processing time and the reception processing time of the communication packet is calculated, and this is used as the check point interval, so that the check point interval more suitable for the actual processing is determined. can do.

【0073】また、本発明によれば、チェックポイント
間隔の最大値と最小値を予め設定しておき、上記算出し
たチェックポイントがこの最大値以上になった場合は最
大値にし、最小値以下になった場合は最小値にすること
で、チェックポイント間隔が長すぎるために起こる通信
処理以外の入出力要求が遅延されそれらの応答時間が長
くなることを防ぎ、またチェックポイント間隔が短くな
りすぎることにより起こるチェックポイント採取するた
めの時間が多くなりシステムの処理時間を失うことを防
いで、チェックポイント間隔を適正な値に調整できる。
According to the present invention, the maximum value and the minimum value of the checkpoint interval are set in advance, and when the calculated checkpoint exceeds the maximum value, the maximum value is set, and the checkpoint interval is set to the minimum value. If the checkpoint interval becomes too short, the checkpoint interval is too long to prevent I / O requests other than communication processing from being delayed, thereby preventing their response time from becoming long, and the checkpoint interval becoming too short. As a result, it is possible to adjust the checkpoint interval to an appropriate value by preventing the time for collecting checkpoints from being increased and losing the processing time of the system.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施の形態に係わり、第1の実施の形
態のチェックポイント通信処理システムの概略構成を示
す。
FIG. 1 shows a schematic configuration of a checkpoint communication processing system according to a first embodiment of the present invention.

【図2】同実施の形態に係わり、第1の実施の形態のパ
ケット送受信テーブルのデータの格納例を示す図。
FIG. 2 is an exemplary diagram showing an example of data storage in a packet transmission / reception table according to the first embodiment according to the embodiment;

【図3】同実施の形態に係わり、第1の実施の形態の通
信間隔観測手段の処理を示すフローチャート。
FIG. 3 is a flowchart showing processing of a communication interval observing unit according to the first embodiment, according to the embodiment;

【図4】同実施の形態に係わり、第1の実施の形態のチ
ェックポイント・ロールバック手段の処理動作を示すフ
ローチャート。
FIG. 4 is a flowchart showing a processing operation of a checkpoint / rollback unit according to the first embodiment according to the embodiment;

【図5】同実施の形態に係わり、第1の実施の形態のパ
ケット送受信とチェックポイントの概念図。
FIG. 5 is a conceptual diagram of packet transmission / reception and a checkpoint according to the first embodiment according to the first embodiment;

【図6】同実施の形態に係わり、第1の実施の形態のチ
ェックポイント・ロールバック手段の送信までの平均時
間を求める処理を示すフローチャート。
FIG. 6 is a flowchart illustrating a process of calculating an average time until transmission of a checkpoint / rollback unit according to the first embodiment;

【図7】同実施の形態に係わり、第1の実施の形態のチ
ェックポイント・ロールバック手段の受信までの平均時
間を求める処理を示すフローチャート。
FIG. 7 is a flowchart showing a process for calculating an average time until reception of a checkpoint / rollback unit according to the first embodiment according to the embodiment;

【図8】同実施の形態に係わり、第1の実施の形態のチ
ェックポイント・ロールバック手段のチェックポイント
間隔を計算する処理を示すフローチャート。
FIG. 8 is a flowchart showing a process of calculating a checkpoint interval of the checkpoint / rollback unit according to the first embodiment according to the embodiment;

【符号の説明】[Explanation of symbols]

101…FT計算機 102…チェックポイント・ロールバック手段 103…入出力要求保持手段 104…通信間隔観測手段 105…通信手段 106…トランスポート 107…パケット送受信時間テーブル 108…アプリケーション 109…ネットワーク Reference Signs List 101 FT computer 102 Checkpoint / rollback means 103 Input / output request holding means 104 Communication interval observing means 105 Communication means 106 Transport 107 Packet transmission / reception time table 108 Application 109 Network

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 ネットワーク上の他のコンピュータと通
信する際に上記他のコンピュータに送信する通信パケッ
トをチェックポイントを採取するまで保持し、チェック
ポイント採取後に上記保持した通信パケットを一括して
送信することで、障害が発生した時に最後に採取したチ
ェックポイントまでロールバックして上記保持した通信
パケットを送信することで処理を再実行し障害からの回
復を実現するコンピュータのチェックポイント通信処理
システムにおいて、 上記他のコンピュータと送受信する通信パケットの情報
であるパケット情報を蓄積するパケット蓄積手段と、 現在のチェックポイント採取前に受け付けた送信する通
信パケットのパケット情報の受付時間を最新のチェック
ポイントの採取時刻に変更する時刻変更手段と、 上記変更されたパケット情報に基づき上記他のコンピュ
ータへ送信するパケットと上記他のコンピュータから受
信するパケットの送信時間と到着時間の時間間隔を求
め、この時間間隔に基づいて次にチェックポイントを採
取するまでの時間を算出するチェックポイント間隔算出
手段とを備え、 上記チェックポイント間隔算出手段が算出したチェック
ポイントを採取するまでの時間に基づき次のチェックポ
イントを採取することを特徴とするチェックポイント通
信処理システム。
1. A communication packet to be transmitted to another computer when communicating with another computer on a network is held until a checkpoint is taken, and after the checkpoint is taken, the held communication packets are transmitted collectively. By doing so, when a failure occurs, the checkpoint communication processing system of the computer that rolls back to the last collected checkpoint and transmits the held communication packet to re-execute the processing and realize recovery from the failure, A packet storage unit for storing packet information that is information of communication packets transmitted to and received from the other computer, and a reception time of packet information of communication packets to be transmitted received before a current checkpoint is collected, and a latest checkpoint collection time. Time changing means for changing to The time interval between the transmission time and the arrival time of the packet to be transmitted to the other computer and the packet received from the other computer is determined based on the updated packet information, and until the next checkpoint is collected based on this time interval. A checkpoint interval calculating means for calculating the time of the checkpoint, and collecting the next checkpoint based on the time until the checkpoint calculated by the checkpoint interval calculating means is collected. .
【請求項2】 上記パケット情報は、上記他のコンピュ
ータのアドレス、ポート番号と通信パケットの送受信の
区別と通信パケットを受け付けた時刻であることを特徴
とする請求項1記載のチェックポイント通信処理システ
ム。
2. The checkpoint communication processing system according to claim 1, wherein the packet information is an address and a port number of the other computer, a distinction between transmission and reception of the communication packet, and a time when the communication packet is received. .
【請求項3】 上記チェックポイント間隔算出手段は、
上記パケット情報の送信パケットと同一のアドレス、ポ
ート番号の受信パケットを検索し、上記送信パケットと
上記受信パケットの受付時刻の差分を計算しこれを送信
処理時間とし、 上記パケット情報の受信パケットと同一のアドレス、ポ
ート番号の送信パケットを検索し、上記受信パケットと
上記送信パケットの受付時刻の差分を計算しこれを受信
処理時間とし、 次のチェックポイント採取までの上記送信処理時間と上
記受信処理時間を加えてこれを上記計算した差分の数で
割ったものを次にチェックポイントを採取するまでの時
間としたことを特徴とする請求項1乃至2記載のチェッ
クポイント通信処理システム。
3. The checkpoint interval calculation means,
A search is made for a reception packet having the same address and port number as the transmission packet of the packet information, and a difference between the reception time of the transmission packet and the reception time of the reception packet is calculated as a transmission processing time, which is the same as the reception packet of the packet information. Search the transmission packet of the address and port number of the received packet, calculate the difference between the reception time of the reception packet and the reception time of the transmission packet, and use this as the reception processing time. The transmission processing time and the reception processing time until the next checkpoint collection 3. The checkpoint communication processing system according to claim 1, wherein a value obtained by dividing the calculated value by the calculated number of differences is used as a time until a next checkpoint is collected.
【請求項4】 上記チェックポイント間隔算出手段は、
予め設定したチェックポイントを採取するまでの時間の
最大値と最小値に基づいて上記算出したチェックポイン
トを採取するまでの時間が上記最大値以上になった場合
は上記最大値に、上記最小値以下になった場合は上記最
小値にすることを特徴とする請求項1乃至3記載のチェ
ックポイント通信処理システム。
4. The checkpoint interval calculation means,
If the time before collecting the calculated checkpoint based on the maximum value and the minimum value of the time before collecting the preset checkpoint is greater than or equal to the maximum value, the value is less than or equal to the maximum value and less than or equal to the minimum value 4. The checkpoint communication processing system according to claim 1, wherein the minimum value is set to the minimum value in the case of.
【請求項5】 ネットワーク上の他のコンピュータと通
信する際に上記他のコンピュータに送信する通信パケッ
トをチェックポイントを採取するまで保持し、チェック
ポイント採取後に上記保持した通信パケットを一括して
送信することで、障害が発生した時に最後に採取したチ
ェックポイントまでロールバックして上記保持した通信
パケットを送信することで処理を再実行し障害からの回
復を実現するコンピュータのチェックポイント通信処理
システムにおいて、 上記他のコンピュータと送受信する通信パケットの情報
であるパケット情報を蓄積しておき、 現在のチェックポイント採取前に受け付けた送信する通
信パケットのパケット情報の受付時間を最新のチェック
ポイントの採取時刻に変更し、 上記変更されたパケット情報に基づき上記他のコンピュ
ータへ送信するパケットと上記他のコンピュータから受
信するパケットの送信時間と到着時間の時間間隔を求
め、この時間間隔に基づいて次にチェックポイントを採
取するまでの時間を算出し、 この算出したチェックポイントを採取するまでの時間に
基づき次のチェックポイントを採取することを特徴とす
るチェックポイント通信処理方法。
5. A communication packet to be transmitted to another computer when communicating with another computer on a network is held until a checkpoint is collected, and the collected communication packets are transmitted collectively after the checkpoint is collected. By doing so, when a failure occurs, the checkpoint communication processing system of the computer that rolls back to the last collected checkpoint and transmits the held communication packet to re-execute the processing and realize recovery from the failure, Stores packet information, which is information on communication packets transmitted to and received from the other computers, and changes the reception time of the packet information of communication packets to be transmitted that was received before the current checkpoint was collected to the latest checkpoint collection time Based on the changed packet information The time interval between the transmission time and the arrival time of the packet to be transmitted to the other computer and the packet received from the other computer is obtained, and the time until the next checkpoint is obtained is calculated based on the time interval. A checkpoint communication processing method, wherein the next checkpoint is collected based on the calculated time until the checkpoint is collected.
【請求項6】上記パケット情報は、上記他のコンピュー
タのアドレス、ポート番号と通信パケットの送受信の区
別と通信パケットを受け付けた時刻であることを特徴と
する請求項5記載のチェックポイント通信処理方法。
6. The checkpoint communication processing method according to claim 5, wherein the packet information is an address and a port number of the other computer, a distinction between transmission and reception of the communication packet, and a time when the communication packet is received. .
【請求項7】 上記チェックポイントを採取するまでの
時間を算出する際に、上記パケット情報の送信パケット
と同一のアドレス、ポート番号の受信パケットを検索
し、上記送信パケットと上記受信パケットの受付時刻の
差分を計算しこれを送信処理時間とし、 上記パケット情報の受信パケットと同一のアドレス、ポ
ート番号の送信パケットを検索し、上記受信パケットと
上記送信パケットの受付時刻の差分を計算しこれを受信
処理時間とし、 次のチェックポイント採取までの上記送信処理時間と上
記受信処理時間を加えてこれを上記計算した差分の数で
割ったものを次にチェックポイントを採取するまでの時
間としたことを特徴とする請求項5乃至6記載のチェッ
クポイント通信処理方法。
7. When calculating the time until the checkpoint is collected, a reception packet having the same address and port number as the transmission packet of the packet information is searched, and a reception time of the transmission packet and the reception packet is received. Is calculated, and this is set as a transmission processing time. A transmission packet having the same address and port number as the reception packet of the packet information is searched, and a difference between the reception time of the reception packet and the reception time of the transmission packet is calculated and received. The processing time is defined as the time until the next checkpoint is obtained by adding the above-mentioned transmission processing time and the above-mentioned reception processing time until the next checkpoint is obtained, and dividing this by the number of differences calculated above. 7. The checkpoint communication processing method according to claim 5, wherein:
【請求項8】 上記チェックポイントを採取するまでの
時間を算出する際に、予め設定したチェックポイントを
採取するまでの時間の最大値と最小値に基づいて上記算
出したチェックポイントを採取するまでの時間が上記最
大値以上になった場合は上記最大値に、上記最小値以下
になった場合は上記最小値にすることを特徴とする請求
項5乃至7記載のチェックポイント通信処理方法。
8. When calculating the time until the checkpoint is collected, a time until the calculated checkpoint is collected based on the maximum value and the minimum value of the preset time before the checkpoint is collected. 8. The checkpoint communication processing method according to claim 5, wherein the time is set to the maximum value when the time is equal to or more than the maximum value, and is set to the minimum value when the time is equal to or less than the minimum value.
【請求項9】 請求項5乃至8記載のチェックポイント
通信処理方法のプログラムを格納した記憶媒体。
9. A storage medium storing a program for the checkpoint communication processing method according to claim 5.
JP9126773A 1997-05-16 1997-05-16 System, method for processing check point communication and storage medium recording the same Pending JPH10320223A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9126773A JPH10320223A (en) 1997-05-16 1997-05-16 System, method for processing check point communication and storage medium recording the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9126773A JPH10320223A (en) 1997-05-16 1997-05-16 System, method for processing check point communication and storage medium recording the same

Publications (1)

Publication Number Publication Date
JPH10320223A true JPH10320223A (en) 1998-12-04

Family

ID=14943583

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9126773A Pending JPH10320223A (en) 1997-05-16 1997-05-16 System, method for processing check point communication and storage medium recording the same

Country Status (1)

Country Link
JP (1) JPH10320223A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011238234A (en) * 2010-05-11 2011-11-24 Computer Associates Think Inc Fail-safe mechanism using callback for dynamic measurement of software
JP2012221321A (en) * 2011-04-11 2012-11-12 Nec Corp Fault tolerant computer system, control method for fault tolerant computer system and control program for fault tolerant computer system
US9411616B2 (en) 2011-12-09 2016-08-09 Ca, Inc. Classloader/instrumentation approach for invoking non-bound libraries

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011238234A (en) * 2010-05-11 2011-11-24 Computer Associates Think Inc Fail-safe mechanism using callback for dynamic measurement of software
JP2012221321A (en) * 2011-04-11 2012-11-12 Nec Corp Fault tolerant computer system, control method for fault tolerant computer system and control program for fault tolerant computer system
US8990617B2 (en) 2011-04-11 2015-03-24 Nec Corporation Fault-tolerant computer system, fault-tolerant computer system control method and recording medium storing control program for fault-tolerant computer system
US9411616B2 (en) 2011-12-09 2016-08-09 Ca, Inc. Classloader/instrumentation approach for invoking non-bound libraries

Similar Documents

Publication Publication Date Title
US6748413B1 (en) Method and apparatus for load balancing of parallel servers in a network environment
US7580971B1 (en) Method and apparatus for efficient SQL processing in an n-tier architecture
US6748414B1 (en) Method and apparatus for the load balancing of non-identical servers in a network environment
US7464138B2 (en) Mirror queue in a shared queue environment
US5613155A (en) Bundling client write requests in a server
US8868727B2 (en) Methods and computer program products for storing generated network application performance data
US7991744B2 (en) Method and system for dynamically collecting data for checkpoint tuning and reduce recovery time
US7739331B2 (en) Method and apparatus for providing load diffusion in data stream correlations
US8032627B2 (en) Enabling and disabling byte code inserted probes based on transaction monitoring tokens
US9569742B2 (en) Reducing costs related to use of networks based on pricing heterogeneity
US8589537B2 (en) Methods and computer program products for aggregating network application performance metrics by process pool
US7840655B2 (en) Address resolution protocol change enabling load-balancing for TCP-DCR implementations
EP1424779A1 (en) Selective compression of web-based data transmissions
JPH0934818A (en) Method and apparatus for shortened waiting time data reception at inside of data-processing system using packet- based architecture
US20080301311A1 (en) Method and system for extended steering tags (stags) to minimize memory bandwidth for content delivery servers
CN112615793A (en) Data current limiting method and device
US20060287738A1 (en) Optimized performance counter monitoring
US20040047361A1 (en) Method and system for TCP/IP using generic buffers for non-posting TCP applications
US20030187969A1 (en) Most eligible server in a common work queue environment
JPH10320223A (en) System, method for processing check point communication and storage medium recording the same
US7676561B1 (en) Method and apparatus for adaptive load balancing
CN102156684A (en) Interface delay protecting method, coprocessor and data processing system
JP3837670B2 (en) Data relay apparatus, associative memory device, and associative memory device utilization information retrieval method
WO2005046175A1 (en) Method, apparatus, system, and article of manufacture for processing control data by an offload adapter
US6879999B2 (en) Processing of requests for static objects in a network server