JPH1049461A - チェックポイント通信処理システム、及びチェックポイント通信処理方法 - Google Patents

チェックポイント通信処理システム、及びチェックポイント通信処理方法

Info

Publication number
JPH1049461A
JPH1049461A JP8201830A JP20183096A JPH1049461A JP H1049461 A JPH1049461 A JP H1049461A JP 8201830 A JP8201830 A JP 8201830A JP 20183096 A JP20183096 A JP 20183096A JP H1049461 A JPH1049461 A JP H1049461A
Authority
JP
Japan
Prior art keywords
packet
transmission
checkpoint
communication
packets
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8201830A
Other languages
English (en)
Other versions
JP3833746B2 (ja
Inventor
Hideaki Hirayama
秀昭 平山
Akira Honda
亮 本田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP20183096A priority Critical patent/JP3833746B2/ja
Publication of JPH1049461A publication Critical patent/JPH1049461A/ja
Application granted granted Critical
Publication of JP3833746B2 publication Critical patent/JP3833746B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Retry When Errors Occur (AREA)
  • Computer And Data Communications (AREA)

Abstract

(57)【要約】 【課題】本発明は、従来であれば、次のチェックポイン
トが取得されるまで待機させていた通信処理を可能な限
りチェックポイントを待たずに即時に発行させることに
より通信処理の大幅な高速化を図ることを可能とする。 【解決手段】制御部21は、通信パケットを送信する
際、比較判断部25によりその通信パケットそれぞれに
付加されたチェックポイント順次番号と、順次番号イン
クリメント部22により管理された現時点でのチェック
ポイント順次番号とを比較する。ここで、その通信パケ
ットに付加されたチェックポイント順次番号が、順次番
号インクリメント部22により管理された現時点でのチ
ェックポイント順次番号と異なるときは通信パケット作
成後にチェックポイントが取得されていることになるた
めその通信パケットを即座に送信する。また、一致する
場合は、次のチェックポイント取得を待って、その通信
パケットを送信する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、チェックポイント
を取得しながら処理を進めていき、障害が発生したとき
に、最後に取得したチェックポイントから処理を再実行
することにより障害からの回復を実現するコンピュータ
システムに適用して好適なチェックポイント通信処理シ
ステムに係り、特に次のチェックポイント取得まで待機
させなければならないパケット数を最小限にすることに
より、コンピュータシステムにおける通信処理の大幅な
高速化を図ることを可能とするチェックポイント通信処
理システム、及びチェックポイント通信処理方法に関す
る。
【0002】
【従来の技術】従来、チェックポイントを取得しながら
処理を進めていき、障害が発生したときに、最後に取得
したチェックポイントから処理を再実行することにより
障害からの回復を実現するコンピュータシステムにおい
ては、通信入出力の発行を次のチェックポイント取得後
まで遅延させなければならなかった。
【0003】この理由は、システムにおいて障害が発生
したときには、システムの状態を最後に取得したチェッ
クポイントの状態に戻さなければならず、最後のチェッ
クポイント取得以降に実行した処理を常にキャンセルで
きるようにしておく必要があるからである。
【0004】すなわち、通信処理においても、障害が発
生した場合には、最後のチェックポイント取得以降に発
行した通信処理を全てキャンセルする必要がある。しか
し、このようなことを通信処理で行なうことは困難であ
るために、通信処理の発行を次のチェックポイントが取
得されるまで遅延させることで対処しなければならなか
った。
【0005】このときの動作原理を図10を参照して説
明する。たとえば、アプリケーションが送信要求を発行
した場合(図10の(1))、通信処理システムは、こ
の送信要求にしたがって通信パケット(トランスポート
レイヤにおけるトランスポートパケット、たとえばIP
パケット)を作成する(図10の(2))。
【0006】しかしながら、実際にこの作成した通信パ
ケットを送信する際には、即座に送信するようなことは
せずに、次のチェックポイントが取得されるまで(図1
0の(3))、その送信を待機させる。
【0007】これは障害が発生した場合、システムを直
前のチェックポイントの状態(図6の(5))にロール
バックし、そこから再実行を行うタイミング等に起因し
て、直前のチェックポイント以後の送信が(図10の
(1))が必ずしも再び要求されるわけではないためで
ある。
【0008】そして、次のチェックポイントが取得され
た後に、ドライバを介してこの通信パケットを送信する
(図10の(4))。上記の動作を、本発明の実施形態
のタイミングチャート図8を用いて、詳細に説明する。
【0009】たとえば、アプリケーションが送信要求を
発行した場合(図8の(1))、通信処理のシステム
は、この送信要求にしたがって通信パケット(トランス
ポートレイヤにおけるトランスポートパケット、たとえ
ばIPパケット)を作成する(図8の(2))。
【0010】作成された通信パケットを物理的な伝送媒
体に合わせて、複数の伝送パケット(データリンクレイ
ヤにおけるデータリンクパケット、たとえばether
netパケット)に分割する(図8の(3))。
【0011】しかしながら、実際にこの伝送パケットを
送信する際には、即座に送信するようなことはせずに、
次のチェックポイントが取得されるまで(図8の
(8))、その送信で待機させる。
【0012】これは障害が発生した場合、システムを直
前のチェックポイントの状態(図8の(6))にロール
バックし、そこから再実行を行うのだが、タイミング等
に起因して、直前のチェックポイント以後の送信(図8
の(5))が必ずしも再び要求されるわけではないため
である。
【0013】そして、次のチェックポイントが取得され
た後に、ドライバを介してこの伝送パケットを送信する
(図8の(5))。したがって、耐障害性を保証するシ
ステムの動作手順について通信処理にのみ着目してみる
と、次のチェックポイントまで処理を遅延させるため性
能低下のおそれがある。
【0014】すなわち、近年、通信処理の高速化がます
ます要求されているにも関わらず、耐障害性を保証する
システムの通信処理では、上述したチェックポイント取
得に伴う遅延が高速化を阻害してしまっているといった
問題があった。
【0015】
【発明が解決しようとする課題】上述したように、従来
のチェックポイントを取得しながら処理を進めていき、
障害が発生したときに、最後に取得したチェックポイン
トから処理を再実行することにより障害からの回復を表
現するコンピュータシステムにおいては、伝送パケット
の発行を次のチェックポイント取得後まで遅延させなけ
ればならないといった問題があった。
【0016】そこで、本発明は上記事情を考慮して成さ
れたもので、上記不具合を解消し、従来であれば、次の
チェックポイントが取得されるまで待機させていた通信
処理を可能な限りチェックポイントを待たずに即時に発
行させることにより通信処理の大幅な高速化を図ること
を可能とするチェックポイント通信処理システム、及び
チェックポイント通信処理方法を提供することを目的と
する。
【0017】
【課題を解決するための手段】本発明は、上記目的を達
成するため、本発明のチェックポイント通信処理システ
ムは、チェックポイントを取得しながら処理を進めてい
き、障害が発生したときに、最後に取得したチェックポ
イントから処理を再実行することにより障害からの回復
を実現するコンピュータシステムにおいて、上記チェッ
クポイントが取得される度に各チェックポイントを識別
するためのチェックポイント順次番号を更新して管理す
る手段と、通信パケットを作成(トランスポートレイヤ
におけるトランスポートパケットの作成、たとえばIP
レイヤにおけるIPパケットの作成)するときに、その
作成した通信パケットに現在のチェックポイント順次番
号を付加する手段と、上記通信パケットを送信するとき
に、その通信パケットに付加されたチェックポイント順
次番号と現在のチェックポイント順次番号とを比較する
手段と、この比較によりその通信パケットに付加された
チェックポイント順次番号が現在のチェックポイント順
次番号と異なっているときに、即座にその通信パケット
を送信し、一致するときには、その通信パケットの送信
を次のチェックポイントが取得されるまで遅延させる手
段とを具備してなることを特徴とする。
【0018】また、本発明のチェックポイント通信処理
システムは、チェックポイントを取得しながら処理を進
めていき、障害が発生したときに、最後に取得したチェ
ックポイントから処理を再実行することにより障害から
の回復を実現するコンピュータシステムにおいて、ある
特定の通信プロトコルで作成された通信パケット(トラ
ンスポートレイヤで作成されたトランスポートパケッ
ト、たとえばIPレイヤで作成されたIPパケット)を
伝送媒体の伝送パケットサイズで分割して複数の伝送パ
ケットを作成(データリンクレイヤにおけるデータリン
クパケットの作成、たとえばethernetドライバ
におけるethernetパケットの作成)するとき
に、その作成した伝送パケットが上記複数の伝送パケッ
トの中の最後のものであるか否かを示す情報を付加する
手段と、上記伝送パケットを伝送するときに、その伝送
パケットが上記複数の伝送パケットの中の最後のものか
否かを判定する手段と、この判定によりその伝送パケッ
トが上記最後のものでなかったときに、即座にその伝送
パケットを伝送し、上記最後のものであったときには、
その伝送パケットの伝送を次のチェックポイントが取得
される後まで遅延させる手段とを具備してなることを特
徴とする。
【0019】また、本発明のチェックポイント通信処理
システムは、上記通信パケットを伝送媒体の伝送パケッ
トサイズで分割して複数の伝送パケットを作成し、その
複数の伝送パケットの中の最後のもの以外をチェックポ
イントを待機せずに即座に伝送してー番最後のもののみ
をチェックポイントまで待機させる処理をー体として行
うことを特徴とする。
【0020】また、本発明のチェックポイント通信処理
システムは、チェックポイントを取得しながら処理を続
けていき、障害が発生したときに、最後に取得したチェ
ックポイントから処理を再実行することにより障害から
の回復を実現するコンピュータシステムであって、通信
パケットを複数の伝送パケットに分割し、順序番号を付
けた上で送信し、順序番号付きの応答パケットにより送
信完了を確認する通信プロトコルを使用する場合におい
て、最後のチェックポイント取得以降に発生した上記分
割された伝送パケットのうち、同一の送信先への最初の
パケットか否かを判定する手段と、この判定によりその
伝送パケットが上記最初のものでなかったときに、即座
にその伝送パケットを伝送し、上記最初のものであった
時には、その伝送パケットの伝送を次のチェックポイン
トが取得されるまで遅延させる手段を具備していること
を特徴とする。
【0021】また、本発明のチェックポイント通信処理
システムは、上記特徴に加え、故障により直前のチェッ
クポイント迄ロールバックした際には、伝送パケットの
順序番号をリセットし、2つ目の伝送パケットには順序
番号初期化のメッセージを付加して伝送し、その伝送パ
ケットを受信した計算機では、不完全な伝送パケットを
破棄し、順序番号を初期化した上で伝送パケットを受信
する手段を具備していることを特徴とする。
【0022】また、本発明のチェックポイント通信処理
システムは、上記特徴に加え、遅延せずに送出した2つ
目以降の連続する伝送パケット数が、予め設定された閾
値を超えたときに、次のチェックポイント取得を開始す
る手段を具備していることを特徴とする。
【0023】また、本発明のチェックポイント通信処理
システムは、上記特徴に加え、分割された2つ目以降の
伝送パケットを遅延せずに送出した通信相手よりオーバ
ーフローを告知するパケットが到着した際には、その通
信相手へのパケットの伝送を停止し、次のチェックポイ
ントを開始することを具備していることを特徴とする。
【0024】上記構成によれば、本発明のチェックポイ
ント通信処理システムでは、周期的に取得されるチェッ
クポイントを識別するためのチェックポイント順次番号
を管理し、この管理したチェックポイント順次番号に基
づいて送信処理を制御する。
【0025】すなわち、通信パケットを作成するとき
に、その時点で採番されているチェックポイント順次番
号をその通信パケットに付加しておき、実際にこの通信
パケットを送信するときに、この通信パケットに付加さ
れたチェックポイント順次番号と送信時のチェックポイ
ント順次番号とを比較する。
【0026】上記の動作をもう少し正確に述べると、通
信パケット(トランスポートレイヤにおけるトランスポ
ートパケット、たとえばUDPパケット)は物理的伝送
媒体と合わせて、複数の伝送パケット(データリンクレ
イヤにおけるデータリンクパケット、たとえばIPパケ
ットやethernetパケット)に分割される。この
時、通信パケットに付加されているチェックポイント順
次番号を伝送パケットに付加する。そして、伝送パケッ
トは送信する際に、その伝送パケットに付加されたチェ
ックポイント順次番号と、送信時のチェックポイント順
次番号とを比較する。たとえば、通信パケットが作成さ
れた後、送信処理が行われるまでの間に、チェックポイ
ント取得された場合には、通信パケット(正確には伝送
パケット)に付加されたチェックポイント順次番号と現
時点のチェックポイント順次番号は異なっているはずで
ある。したがって、このような通信パケットは、即座に
送信して良い。これにより、すべての通信パケットにつ
いての次のチェックポイント取得を待機するのではな
く、必要最小限の通信パケットのみについて次のチェッ
クポイント取得まで待機させることにより、耐障害性を
保証しつつ通信処理の高速化が図れることとなる。
【0027】また、本発明のチェックポイント通信処理
システムにおける2番目の方法では一つの通信パケット
が複数の伝送パケットに分割されることに着目し、この
パケットの相対位置を判定して送信処理を制御する。
【0028】すなわち、通信パケットを伝送媒体のパケ
ットサイズで分割して複数の伝送パケットを作成する際
に、これらの伝送パケットそれぞれに、その複数作成さ
れた伝送パケットの中の最後の伝送パケットかどうかを
示す情報を付加しておき、実際にこの伝送パケットを送
信するときに、この伝送パケットに付加された情報から
この伝送パケットが最後の伝送パケットであるかどうか
を判定する。そして、この判定により最後のものでなか
った場合には、チェックポイントの取得を待機せずに即
座に送信する。
【0029】したがって、たとえば次のチェックポイン
トが取得される前に障害が発生したとしても、最後の伝
送パケットは送信されておらず、すなわち分割前の通信
パケットは送信完了とはなっていないため、受信側シス
テムによるタイムアウト検知などにより通信パケットの
再送が促されることになる。
【0030】これにより、すべての伝送パケットについ
て次のチェックポイント取得を待機するのではなく、上
述と同様、必要最小限の伝送パケットのみについて次の
チェックポイント取得後まで、その送信を待機させるこ
とにより、耐障害性を保証しつつ通信処理の高速化が図
れることとなる。
【0031】また、本発明のチェックポイント通信処理
システムにおける3番目の方法では、伝送パケットを作
成する処理と、伝送パケットのうちで最後のもの以外を
チェックポイントまで待機せずに伝送する処理とをー体
として実行することにより、伝送パケットにそれが最後
のものであるか否を示す情報を付加する処理を不要にで
きる。
【0032】また、本発明のチェックポイント通信処理
システムでは、順序番号を使った確認応答を行う通信プ
ロトコルにおいても、パケットの相対位置を判定して送
信処理を制御する。
【0033】一般に、確認応答を行う通信プロトコルで
は、各伝送パケットに対する確認応答を待ってから次の
伝送パケットを送信するが、性能劣化を防ぐために、送
信データをいくつかの伝送パケットに分割し、各伝送パ
ケットと確認応答パケットに順序番号を付加した上で、
それらのパケットをー括して送信するという工夫が行わ
れている。そして、通信相手は受信したパケットの順序
番号を判定し、完全に受信している部分までのパケット
に対する確認応答を返す。送り元はさらにその確認応答
パケットの順序番号を判定して次のー括送信を開始す
る。これにより送信順序の乱れにも対応できるようにな
っている。
【0034】しかし、チェックポイントの取得を待って
から伝送パケットを送出する通信方法では、この工夫に
よる効果が得られない。本発明では、最後のチェックポ
イント取得以降に発生した上記分割された伝送パケット
のうち、同一の送信先への最初のパケットか否かを判定
し、その伝送パケットが最初のものでなかったときに、
チェックポイントを待たずに即座にそれらの伝送パケッ
トを伝送する。そして、上記最初のものであった時に
は、その伝送パケットの伝送を次のチェックポイントが
取得されるまで遅延させる。
【0035】したがって、例えば次のチェックポイント
が取得される前に障害が発生したとしても、最初のパケ
ットは送信されておらず、通信相手からの確認応答のパ
ケットは来ない。通信相手側でも受信は完了していない
ことになる。
【0036】そして、直前のチェックポイント迄ロール
バックした際には、伝送パケットの順序番号をリセット
し、2つ目の伝送パケットには順序番号初期化のメッセ
ージを付加して伝送し、順序番号を初期化した上で伝送
パケットを受信することにより、通信相手側の不完全な
伝送パケットを破棄することができる。
【0037】これにより、確認応答を伴う通信プロトコ
ルにおいても、全てのパケットについて次のチェックポ
イント取得を待機するのではなく、必要最小限のパケッ
トのみについて次のチェックポイント取得を待機させる
ことにより、耐障害性を保証しつつ通信処理の高速化が
図れることになる。
【0038】また、本発明のチェックポイント通信処理
システムでは、上記、順序番号を使った確認応答を行う
通信プロトコルにおいて、遅延せずに送出した2つ目以
降の連続する伝送パケット数が、予め設定された閾値を
超えたときに、次のチェックポイント取得を開始する。
さらに、通信相手よりオーバーフローを告知するパケッ
トが到着した際に、その通信相手へのパケットの伝送を
停止し、次のチェックポイントを開始する。これによ
り、性能劣化や、通信相手のバッファオーバーフローや
タイムアウトによる再送を減らすことができる。
【0039】
【発明の実施の形態】本発明の概要は、次の通りであ
る。 (1)チェックポイントを取得しながら処理を進めてい
き、障害が発生したときに、最後に取得したチェックポ
イントから処理を再実行することにより障害からの回復
を実現するコンピュータシステムにおいて、上記チェッ
クポイントが取得される度に各チェックポイントを識別
するためのチェックポイント順次番号を更新して管理す
る手段と、通信パケットを作成するときに、その作成し
た通信パケットに現在のチェックポイント順次番号を付
加する手段と、上記通信パケットを送信するときに、そ
の通信パケットに付加されたチェックポイント順次番号
と現在のチェックポイント順次番号とを比較する手段
と、この比較によるその通信パケットに付加されたチェ
ックポイント順次番号が現在のチェックポイント順次番
号と異なるときに、即座にその通信パケットを送信し、
一致するときには、その通信パケットの送信を次のチェ
ックポイントが取得されるまで遅延させる手段とを具備
してなることを特徴とするチェックポイント通信処理シ
ステムである。そして、この構成によれば、すべての通
信パケットについての次のチェックポイント取得を待機
するのではなく、必要最小限の通信パケットのみについ
て次のチェックポイント取得まで待機させることによ
り、耐障害性を保証しつつ通信処理の高速化が図れるこ
とになる。
【0040】(2)チェックポイントを取得しながら処
理を進めていき、障害が発生したときに、最後に取得し
たチェックポイントから処理を再実行することにより障
害からの回復を実現するコンピュータシステムにおい
て、ある特定の通信プロトコルで作成された通信パケッ
トを伝送媒体の伝送パケットサイズで分割して複数の伝
送パケットを作成するときに、その作成した伝送パケッ
トが上記複数の伝送パケットの中の最後のものであるか
否かを示す情報を付加する手段と、上記伝送パケットを
伝送するときに、その伝送パケットが上記複数の伝送パ
ケットの中の最後のものか否かを判定する手段と、この
判定によりその伝送パケットが上記最後のものでなかっ
たときに、即座にその伝送パケットを伝送し、上記最後
のものであったときには、その伝送パケットの伝送を次
のチェックポイントが取得されるまで遅延させる手段と
を具備してなることを特徴とするチェックポイント通信
処理システムである。そして、この構成によれば、すべ
ての伝送パケットについて次のチェックポイント取得を
待機するのではなく、必要最小限の伝送パケットのみに
ついて次のチェックポイント取得後まで、その送信を待
機させることにより、耐障害性を保証しつつ通信処理の
高速化が図れることになる。
【0041】(3)上記(2)記載のチェックポイント
通信処理システムにおいて、上記通信パケットを伝送媒
体の伝送パケットサイズで分割して複数の伝送パケット
を作成し、その複数の伝送パケットの中の最後のもの以
外をチェックポイントを待機せずに即座に伝送して一番
最後のもののみをチェックポイントまで待機させる処理
を一体として行い、伝送パケットへの情報の付加を不要
とすることを特徴とする。この構成によれば、全ての伝
送パケットの送信を次のチェックポイント取得まで一律
に待機させるのではなく、その必要のあるものだけを待
機させることとなり、耐障害性を保証しつつ通信処理の
高速化が図れることになる。
【0042】(4)チェックポイントを取得しながら処
理を進めていき、障害が発生したときに、最後に取得し
たチェックポイントから処理を再実行することにより障
害からの回復を実現するコンピュータシステムであっ
て、通信パケットを複数の伝送パケットに分割し、上記
伝送パケットに順序番号を付けた上で送信し、順序番号
付きの応答パケットにより送信完了を確認する通信プロ
トコルにおいて、最後のチェックポイント取得以後に発
生した上記分割された伝送パケットのうち、同一の送信
先への最初のパケットか否かを判定する手段と、この判
定によりその伝送パケットが上記最初のものであるとき
には、その伝送パケットの伝送を次のチェックポイント
が取得されるまで遅延させる手段とを具備してなること
を特徴とするチェックポイント通信処理システムを提供
する。この構成によれば、確認応答を伴う通信プロトコ
ルにおいても、全ての伝送パケットの送信を次のチェッ
クポイント取得まで一律に待機させるのではなく、必要
最小限の伝送パケットのみについてチェックポイント取
得を待機させることとにより、耐障害性を保証しつつ通
信処理の高速化が図れることになる。
【0043】(5)上記(4)記載のチェックポイント
通信処理システムであって、通信パケットを複数の伝送
パケットに分割し、上記伝送パケットに順序番号を付け
た上で送信し、順序番号付きの応答パケットにより送信
完了を確認する通信プロトコルにおいて、故障により直
前のチェックポイント迄ロールバックした際には、伝送
パケットの順序番号をリセットし、2つ目の伝送パケッ
トには順序番号初期化のメッセージを付加して伝送し、
その伝送パケットを受信した計算機では、不完全な伝送
パケットを破棄し、順序番号を初期化した上で伝送パケ
ットを受信することを特徴とする。この構成によれば、
確認応答を伴う通信プロトコルにおいても、全ての伝送
パケットの送信を次のチェックポイント取得まで一律に
待機させるのではなく、必要最小限の伝送パケットのみ
についてチェックポイント取得を待機させることとによ
り、耐障害性を保証しつつ通信処理の高速化が図れるこ
とになる。
【0044】(6)上記(4)記載のチェックポイント
通信処理システムにおいて、通信パケットを複数の伝送
パケットに分割し、上記伝送パケットに順序番号を付け
た上で送信し、順序番号付きの応答パケットにより送信
完了を確認する通信プロトコルにおいて、遅延せずに送
出した2つ目以降の連続する伝送パケット数が、予め設
定された閾値を超えたときに、次のチェックポイント取
得を開始することを特徴とする。この構成によれば、性
能劣化や、通信相手のバッファオーバーフローやタイム
アウトによる再送を減らすことができる。
【0045】(7)上記(4)記載のチェックポイント
通信処理システムであって、通信パケットを複数の伝送
パケットに分割し、上記伝送パケットに順序番号を付け
た上で送信し、順序番号付きの応答パケットにより送信
完了を確認する通信プロトコルにおいて、分割された2
つ目以降の伝送パケットを遅延せずに送出した通信相手
よりオーバーフローを告知するパケットが到着した際に
は、その通信相手へのパケットの伝送を停止し、次のチ
ェックポイントを開始することを特徴とする。この構成
によれば、性能劣化や、通信相手のバッファオーバーフ
ローやタイムアウトによる再送を減らすことができる。
【0046】以下、図面を参照して本発明の実施形態を
説明する。 (実施形態1)まず、図1乃至図3を参照して本発明の
実施形態1を説明する。
【0047】図1は、実施形態1に係るチェックポイン
ト通信処理システムの概略構成を示す図である。図1に
示すように、同実施形態に係るチェックポイント通信処
理システム2は、制御部21、順次番号インクリメント
部22、通信パケット作成部23、属性情報付加部2
4、および比較判断部25を有してなる。
【0048】制御部21は、チェックポイント通信処理
システム2全体の制御を司るところである。順次番号イ
ンクリメント部22は、周期的に所定のタイミングで取
得されるチェックポイントそれぞれを識別するためのチ
ェックポイント順次番号を管理するところであり、チェ
ックポイントが取得される度にチェックポイント順次番
号を更新する。
【0049】また、通信パケット作成部23は、アプリ
ケーション1からの送信要求にしたがって通信パケット
(トランスポートレイヤにおけるトランスポートパケッ
ト、たとえばUDPパケット)を作成する。
【0050】属性情報付加部24は、パケット作成部2
3により、通信パケットが作成された際に、この作成通
信パケットに順次番号インクリメント部22が管理する
現時点でのチェックポイント順次番号を付加する。
【0051】そして、比較判断部25は、通信パケット
を実際に送信する際に、その通信パケットに付加された
チェックポイント順次番号と、順次番号インクリメント
部22が管理する現時点でのチェックポイント順次番号
とを比較する。
【0052】ここで、図2を参照して同実施形態の動作
原理について説明する。図2は、同実施形態の動作原理
を説明するためのタイミングチャートである。アプリケ
ーション1が送信要求を発行すると(図2の(1))、
チェックポイント通信処理システム2の制御部21は、
通信パケット作成部23によりこの送信要求にしたがっ
た通信パケットを作成する(図2の(2))。
【0053】ここでは、この送信要求に対し通信パケッ
ト4a〜4cの3つの通信パケットが作成されるものと
する。またこのとき、制御部21は、属性情報付加部2
4により通信パケット作成部23が作成した通信パケッ
トそれぞれに、順次番号インクリメント部22の管理す
る作成時のチェックポイント順次番号を付加しておく。
【0054】ここでは、通信パケット4aが作成された
直後にチェックポイントが取得されたことを前提とし
(図2の(3))。さらに、この状態で、このチェック
ポイント取得後、次のチェックポイント取得前に、この
通信パケット4a〜4cを送信する場合を考える。
【0055】制御部21は、通信パケット4a〜4cを
送信する際、比較判断部25によりその通信パケット4
a〜4cそれぞれに付加されたチェックポイント順次番
号と、順次番号インクリメント部22により管理された
現時点でのチェックポイント順次番号とを比較する。
【0056】ここで、その通信パケットに付加されたチ
ェックポイント順次番号が、順次番号インクリメント部
22により管理された現時点でのチェックポイント順次
番号と異なる場合には(ここでは通信パケット4aが該
当する)、通信パケット作成後にチェックポイントが取
得されていることになるため、その通信パケットを即座
に送信する(図2の(4))。なぜなら、これらの通信
パケットは、障害発生時にも、キャンセルする必要がな
いからである。
【0057】一方、一致する場合には(ここでは通信パ
ケット4bおよび4cが該当する)、次のチェックポイ
ント取得(図2の(5))を待って、その通信パケット
を送信する(図2の(6))。なぜならこれらの通信パ
ケットは、障害が次のチェックポイント以前に発生した
場合にはキャンセルする必要があるからである。
【0058】すなわち、通信パケットを送信する際に、
すべての通信パケットの送信を次のチェックポイント取
得までー律に待機させるのではなく、その必要のあるも
のだけ、すなわち障害発生時にはキャンセルする必要が
ある通信パケットだけを待機させることとなり、耐障害
性を保証しつつ通信処理の高速化が図れることとなる。
【0059】次に、図3を参照して同実施形態の動作手
順を説明する。図3は、同実施形態の動作手順を説明す
るためのフローチャートである。アプリケーション1が
送信要求を発行すると、チェックポイント通信処理シス
テム2の制御部21は、通信パケット作成部23により
この送信要求にしたがった通信パケットを作成する(図
3のステップA1)。
【0060】そして、制御部21は、属性情報付加部2
4により通信パケット作成部23が作成した通信パケッ
トそれぞれに、順次番号インクリメント部22の管理す
る作成時のチェックポイント順次番号を付加する(図3
のステップA2)。
【0061】制御部21は、通信パケットを送信する
際、比較判断部25によりその通信バケットそれぞれに
付加されたチェックポイント順次番号と、順次番号イン
クリメント部22により管理された現時点でのチェック
ポイント順次番号とを比較する(図3のステップA
3)。
【0062】そして、その通信パケットに付加されたチ
ェックポイント順次番号が、順次番号インクリメント部
22により管理された現時点でのチェックポイント順次
番号と異なる場合には(図3のステップA3のY)、そ
の通信パケットを即座に送信する(図3のステップA
5)。
【0063】また、上記通信パケットに付加されたチェ
ックポイント順次番号が、順次番号インクリメント部2
2により管理された現時点でのチェックポイント順次番
号と一致する場合には(図3のステップA3のN)、次
のチェックポイント取得を待って(図3のA4)、その
通信パケットを送信する(図3のステップA5)。
【0064】上記動作をさらに詳細に述べると、通信パ
ケットは物理的な伝送媒体に合わせて、複数の伝送パケ
ット(データリンクレイヤにおけるデータパケット、た
とえばIPパケットやethernetパケット)に分
割される。
【0065】このとき、通信パケットに付加されている
チェックポイント順次番号を伝送パケットに付加する。
そして、伝送パケットを送信する際に、その伝送パケッ
トに付加されたチェックポイント順次番号と、送信時の
チェックポイント順次番号とを比較する。
【0066】これにより通信パケットを送信する際に、
すべての通信パケットの送信を次のチェックポイント取
得までー律に待機させるのではなく、その必要のあるも
のだけを待機させることとなり、耐障害性を保証しつつ
通信処理の高速化が図れることとなる。
【0067】(実施形態2)次に、図6、図4、および
図5を参照して本発明の実施形態2を説明する。同実施
形態では、属性情報付加部24が、伝送パケット作成部
26が作成する伝送パケットの相対位置情報を付加す
る。
【0068】ここでは、通信パケット作成部22が、ア
プリケーション1からの送信要求にしたがって通信パケ
ットを作成し、さらにこの通信パケットを伝送媒体のパ
ケットサイズで分割して複数の伝送パケットを作成する
場合に、その伝送パケットそれぞれが、その複数作成さ
れた伝送パケットの中の最後の伝送パケットかどうかを
示す情報を相対位置情報として付加する。
【0069】ここで、図4を参照して同実施形態の動作
原理について説明する。図4は同実施形態の動作原理を
説明するためのタイミングチャートである。アプリケー
ション1が送信要求を発行すると(図4の(1))、チ
ェックポイント通信処理システム2の制御部21は、通
信パケット作成部22によりこの送信要求にしたがって
通信パケットを作成する(図4の(2))。
【0070】そして、この通信パケットを伝送媒体のバ
ケットサイズで分割して複数の伝送パケットを作成する
(図4の(3))。ここでは、3つの伝送パケット5a
〜5cが作成されるものとする。
【0071】このとき、制御部21は、属性情報付加部
24により伝送パケット作成部26が作成した伝送パケ
ットそれぞれに、その伝送パケットが複数の作成された
伝送パケットの中の最後の伝送パケットかどうかを示す
情報を付加しておく。
【0072】そして、制御部21は、伝送パケット5a
〜5cを送信する際、比較判断部25によりその伝送パ
ケット5a〜5cそれぞれが最後の伝送パケットかどう
かを判断する。
【0073】ここで、その伝送パケットが最後の伝送パ
ケットでない場合には(ここでは伝送パケット5aおよ
び5bが該当する)、その伝送パケットを即座に送信す
る。一方、それ以外の場合には(ここでは伝送パケット
5cが該当する)、次のチェックポイント取得(図4の
(4))を待って、その通信パケットを送信する。
【0074】障害発生時、最後のチェックポイント以降
に作成された伝送パケットは、全てキャンセルする。し
かし、この発明を用いると、本来なら障害発生時にキャ
ンセルすべきパケットが、既に送信されている。
【0075】しかし、そのような場合でも、最後の伝送
パケットは送信されておらず、すなわち分割前の通信パ
ケットは送信完了とはなっていないため、受信側システ
ムによるタイムアウト検知などにより通信パケットの再
送が促されることになり、障害発生時にキャンセルすべ
きパケットが既に送信されていることになるが、問題な
い。
【0076】すなわち、伝送パケットを送信する際に、
すべての伝送パケットの送信を次のチェックポイント取
得までー律に待機させるのではなく、その必要のあるも
のだけを待機させることとなり、耐障害性を保証しつつ
通信処理の高速化が図れることとなる。
【0077】次に、図5を参照して同実施形態の動作手
順を説明する。図5は、同実施形態の動作手順を説明す
るためのフローチャートである。アプリケーション1が
送信要求を発行すると、チェックポイント通信処理シス
テム2の制御部21は、パケット作成部23によりこの
送信要求にしたがった通信パケットを作成し(図5のス
テップB1)、さらにこの通信パケットを伝送媒体のパ
ケットサイズで分割して複数の伝送パケットを作成する
(図5のステップB2)。
【0078】そして、制御部21は、属性情報付加部2
4によりパケット作成部23が作成した伝送パケットそ
れぞれに、その伝送パケットが複数作成された伝送パケ
ットの中の最後の伝送パケットかどうかを示す情報を付
加する(図5のステップB3)。
【0079】制御部21は、伝送パケットを送信する
際、比較判断部25によりその伝送パケット5a〜5c
それぞれが最後の伝送パケットかどうかを判断する(図
5のステップB4)。
【0080】そして、その伝送パケットが最後の伝送パ
ケットでない場合には(図5のステップB4のY)、そ
の伝送パケットを即座に送信する(図5のステップB
6)。一方、それ以外の場合には(図5のステップB4
のN)、次のチェックポイント取得を待って(図5のス
テップB5)、その伝送パケットを送信する(図5のス
テップB6)。
【0081】これにより、伝送パケットを送信する際
に、すべての伝送パケットの送信を次のチェックポイン
ト取得までー律に待機させるのではなく、その必要のあ
るものだけを待機させることとなり、耐障害性を保証し
つつ通信処理の高速化が図れることとなる。
【0082】(実施形態3)次に、図7、図8及び図9
を参照して本発明の実施形態3を説明する。図7は実施
形態3に係るチェックポイント通信処理システムの概略
構成を示す図である。
【0083】図7に示すように、同実施形態に係るチェ
ックポイント通信処理システム5は、制御部51、パケ
ット生成部52、送信パケット属性情報付加部53、送
信パケット比較判断部54、受信パケット属性判断部5
5を有してなる。
【0084】一方、通信相手側の通信処理システム7
は、制御部71、パケット生成部72、受信パケット属
性判断部73を有してなる。チェックポイント通信処理
システム5と通信処理システム7は、それぞれ通信コン
トローラ6,9を介して接続されている。
【0085】チェックポイント通信システム5は、チェ
ックポイントを取得しながら処理を進め、障害が発生し
たときに、最後に取得したチェックポイントから処理を
再実行することにより障害からの回復を実現するコンピ
ュータシステムの通信処理部分である。一方、通信処理
システムはチェックポイント取得は行わないコンピュー
タシステムの通信処理部分である。
【0086】チェックポイント通信処理システム5の制
御部51は、チェックポイント通信処理システム5全体
の制御を司る。パケット生成部52は、アプリケーショ
ン4からの送信要求に従って通信用の各種パケットを作
成する。確認応答を伴うプロトコルのパケットもここで
作成される。
【0087】送信パケット比較判断部54は送信パケッ
トのプロトコル種別の判断と、通信相手先及び順序番号
の判定を行う。送信パケット属性情報付加部53は、故
障が発生し直前のチェックポイント迄ロールバックした
際に、2つ目の伝送パケットには順序番号初期化のメッ
セージを付加する部分である。
【0088】受信パケット属性判断部55は、通信相手
から、オーバーフローを告知するバケットが到着したか
どうかを判定する部分である。一方、通信処理システム
7の制御部71が従来の通信処理システムと異る部分
は、受信パケット属性判断部73である。すなわち、上
記チェックポイント通信処理システム5から順序番号初
期化のメッセージが到着したかを判定する部分である。
【0089】ここで、図8を参照して同実施形態の動作
原理について説明する。図8は、同実施形態の動作原理
を説明するためのタイミングチャートである。アプリケ
ーション4が送信要求を発行すると(第8図(1))、
チェックポイント通信処理システム5の制御部51は、
パケット生成部52によりこの送信要求に従った通信パ
ケットを生成する(図8の(2))。
【0090】ここではこの通信要求に対し通信パケット
6a〜6cの3つの順序番号付きの通信パケットが作成
されるものとする。また、このとき、制御部51は送信
パケット比較判断部54により、2つ目以降のパケット
(図8の6b、6c)はチェックポイントを待たずに通
信コントローラを介して送信する(図8の(4)、
(5))。先頭のパケット6aについてはチェックポイ
ント取得後に送信する(図8の(9))。
【0091】通信相手である、通信処理システム7の制
御部71では、順序番号で受信パケットを管理してい
る。すなわち、先にパケット6a、6cを受信していて
も、パケット6aを受信する迄はパケット6b、6cの
受信は完了していない。パケット6aを受信した後に、
パケット6cに対応する確認応答を発行する(図8の
(11)、(12))。
【0092】チェックポイント通信処理システム5の制
御部は、パケット6cの確認応答を受け取ったのちに次
のパケットの送信を開始する(図8の(13))。ここ
で、もしチェックポイント取得以前(図8の(8)より
以前)で故障が発生した場合には、先頭のパケットを通
信相手側は受信していないため、少なくとも正しく再実
行されない恐れのあるデータが、相手側に渡されること
を防ぐことができる。
【0093】既に渡されている部分的なデータは、タイ
ムアウト等により破棄されることになる。しかし、タイ
ムアウトによる破棄は通信の接続を遮断してしまい、以
降のアプリケーション(図7の4、8)間の通信に支障
を来す可能性がある。これを防ぐために、本発明では順
序番号の初期化と受信済の部分的なパケットの破棄を行
う手段を追加する。これについては以下の動作手順で示
す。
【0094】すなわち、第2実施形態と同様に、パケッ
トを送信する際に、全てのパケットの送信を次のチェッ
クポイント取得までー律に待機させるのではなく、その
必要のあるものだけを待機させることとなり、耐障害性
を保証しつつ通信処理の高速化が図れることになる。
【0095】次に、図9を参照して、同実施形態の動作
手順を説明する。図9は、同実施形態の動作手順を説明
するためのチェックポイント通信処理のフローチャート
である。
【0096】アプリケーション4が送信要求を発行する
と、チェックポイント通信処理システム5の制御部51
は、パケット生成部52によりこの送信要求に従った通
信パケットを生成し分割する(図9のステップC1、C
2)。
【0097】そして、送信パケット比較部54は、分割
された伝送パケットのプロトコルを判定し(図9のステ
ップC3)、確認応答手順のプロトコルでない場合に
は、例えば第1実施形態の処理を行う(図9のステップ
C4)。
【0098】一方、確認応答手順のプロトコルの場合に
はさらに伝送パケットが最初のものであるか判定し(図
9のステップC5)、最初のものである場合は次のチェ
ックポイント採取迄待機させる(図9のステップC)。
【0099】2つ目以降の伝送パケットの場合には送信
パケット数をカウントして実際に送信する(図9のステ
ップC9、C10)。しかし、前回のチェックポイント
採取以降の送信パケット数が閾値を超えた場合にはチェ
ックポイントを採取してカウンタをリセットした後に実
際の送信処理を行う(図9のステップC7、C8)。
【0100】また、故障により最後のチェックポイント
に戻って処理が再実行された場合には、2つ目のパケッ
トには順序番号初期化情報を付加した後に送信する(図
9のステップC5、C11)。
【0101】通信相手側の通信処理システムは、順序番
号初期化情報が付加されたパケットを受信した場合に
は、既に受信済の通信データの順序番号をリセットする
だけでよい。
【0102】一方、受信処理では、通信相手からオーバ
ーフロー情報が付加されたパケットを受信した場合に
は、その通信相手へのパケットの伝送をー旦停止し、次
のチェックポイントを開始する。パケットの伝送はチェ
ックポイント採取後に再開される(図9のステップD
1、D2、D3、D4、D5)。
【0103】これにより、第2実施形態と同様にパケッ
トを送信する際に、全てのパケットの送信を次のチェッ
クポイント取得まで一律に待機させるのではなく、その
必要のあるものだけを待機させることとなり、耐障害性
を保証しつつ通信処理の高速化が図れることになる。
【0104】以上、第1、第2および第3の実施形態と
して、チェックポイント順次番号の管理およびパケット
の相対位直の判定により通信制御を行なう例を示した
が、これらを組み合わせた構成とすれば、さらに一層の
高速化が図れることとなる。
【0105】
【発明の効果】以上詳述したように本発明のチェックポ
イント通信処理システム、及びチェックポイント通信処
理方法によれば、従来であればチェックポイント取得後
まで遅延されていた通信処理を可能な限りチェックポイ
ントを待たずに即時に発行させることができ、チェック
ポイント方式における通信処理のレイテンシを改善させ
ることができる。
【図面の簡単な説明】
【図1】本発明の実施形態1に係るチェックポイント通
信処理システムの概略構成を示すブロック図。
【図2】同実施形態1の動作原理を説明するためのタイ
ミングチャート。
【図3】同実施形態1の動作手順を説明するためのフロ
ーチャート。
【図4】本発明の実施形態2の動作原理を説明するため
のタイミングチャート。
【図5】同実施形態2の動作手順を説明するためのフロ
ーチャート。
【図6】同実施形態2に係るチェックポイント通信処理
システムの概略構成を示すブロック図。
【図7】本発明の実施形態3に係るチェックポイント通
信処理システムの概略構成を示すブロック図。
【図8】同実施形態3の動作原理を説明するためのタイ
ミングチャート。
【図9】同実施形態3の動作手順を説明するためのフロ
ーチャート。
【図10】従来の通信処理手順を説明するためのタイミ
ングチャート。
【符号の説明】
1…アプリケーション、 2…チェックポイント通信処理システム、 3…通信コントローラ、 4…アプリケーション、 4a,4b,4c…通信パケット、 5…チェックポイント通信処理システム、 5a,5b,5c…伝送パケット、 6…通信コントローラ、 7…通信処理システム、 8…アプリケーション、 9…通信コントローラ、 10…ネットワーク、 21…制御部、 22…順次番号インクリメント部、 23…通信パケット作成部、 24…属性情報付加部、 25…比較部、 26…伝送パケット作成部、 51…制御部、 52…パケット生成部、 53…送信パケット属性情報付加部、 54…送信パケット比較判断部、 55…受信パケット属性判断部、 71…制御部、 72…パケット生成部、 73…受信パケット属性判断部。

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 チェックポイントを取得しながら処理を
    進めていき、障害が発生したときに、最後に取得したチ
    ェックポイントから処理を再実行することにより障害か
    らの回復を実現するコンピュータシステムにおいて、 上記チェックポイントが取得される度に各チェックポイ
    ントを識別するためのチェックポイント順次番号を更新
    して管理する手段と、 通信パケットを作成するときに、その作成した通信パケ
    ットに現在のチェックポイント順次番号を付加する手段
    と、 上記通信パケットを送信するときに、その通信パケット
    に付加されたチェックポイント順次番号と現在のチェッ
    クポイント順次番号とを比較する手段と、 この比較によるその通信パケットに付加されたチェック
    ポイント順次番号が現在のチェックポイント順次番号と
    異なるときに、即ちにその通信パケットを送信し、一致
    するときには、その通信パケットの送信を次のチェック
    ポイントが取得されるまで遅延させる手段とを具備して
    なることを特徴とするチェックポイント通信処理システ
    ム。
  2. 【請求項2】 チェックポイントを取得しながら処理を
    進めていき、障害が発生したときに、最後に取得したチ
    ェックポイントから処理を再実行することにより障害か
    らの回復を実現するコンピュータシステムにおいて、 ある特定の通信プロトコルで作成された通信パケットを
    伝送媒体の伝送パケットサイズで分割して複数の伝送パ
    ケットを作成するときに、その作成した伝送パケットが
    上記複数の伝送パケットの中の最後のものであるか否か
    を示す情報を付加する手段と、 上記伝送パケットを伝送するときに、その伝送パケット
    が上記複数の伝送パケットの中の最後のものか否かを判
    定する手段と、 この判定によりその伝送パケットが上記最後のものでな
    かったときに、即座にその伝送パケットを伝送し、上記
    最後のものであったときには、その伝送パケットの伝送
    を次のチェックポイントが取得されるまで遅延させる手
    段とを具備してなることを特徴とするチェックポイント
    通信処理システム。
  3. 【請求項3】 上記通信パケットを伝送媒体の伝送パケ
    ットサイズで分割して複数の伝送パケットを作成し、 その複数の伝送パケットの中の最後のもの以外をチェッ
    クポイントを待機せずに即座に伝送して一番最後のもの
    のみをチェックポイントまで待機させる処理を一体とし
    て行い、 伝送パケットへの情報の付加を不要とすることを特徴と
    する請求項2記載のチェックポイント通信処理システ
    ム。
  4. 【請求項4】 チェックポイントを取得しながら処理を
    進めていき、障害が発生したときに、最後に取得したチ
    ェックポイントから処理を再実行することにより障害か
    らの回復を実現するコンピュータシステムであって、 通信パケットを複数の伝送パケットに分割し、上記伝送
    パケットに順序番号を付けた上で送信し、順序番号付き
    の応答パケットにより送信完了を確認する通信プロトコ
    ルにおいて、 最後のチェックポイント取得以後に発生した上記分割さ
    れた伝送パケットのうち、同一の送信先への最初のパケ
    ットか否かを判定する手段と、 この判定によりその伝送パケットが上記最初のものであ
    るときには、その伝送パケットの伝送を次のチェックポ
    イントが取得されるまで遅延させる手段とを具備してい
    ることを特徴とするチェックポイント通信処理システ
    ム。
  5. 【請求項5】 故障により直前のチェックポイント迄ロ
    ールバックした際には、伝送パケットの順序番号をリセ
    ットし、2つ目の伝送パケットには順序番号初期化のメ
    ッセージを付加して伝送し、その伝送パケットを受信し
    た計算機では、不完全な伝送パケットを破棄し、順序番
    号を初期化した上で伝送パケットを受信することを特徴
    とする請求項4記載のチェックポイント通信処理システ
    ム。
  6. 【請求項6】 遅延せずに送出した2つ目以降の連続す
    る伝送パケット数が、予め設定された閾値を超えたとき
    に、次のチェックポイント取得を開始することを特徴と
    する請求項4記載のチェックポイント通信処理システ
    ム。
  7. 【請求項7】 分割された2つ目以降の伝送パケットを
    遅延せずに送出した通信相手よりオーバーフローを告知
    するパケットが到着した際には、その通信相手へのパケ
    ットの伝送を停止し、次のチェックポイントを開始する
    ことを特徴とする請求項4記載のチェックポイント通信
    処理システム。
  8. 【請求項8】 チェックポイントを取得しながら処理を
    進めていき、障害が発生したときに、最後に取得したチ
    ェックポインから処理を再実行することにより障害から
    の回復を実現するコンピュータシステムにおいて、 上記チェックポイントが取得される度に各チェックポイ
    ントを識別するためのチェックポイント順次番号を更新
    し、通信パケットを作成するときに、その作成した通信
    パケットに現在のチェックポイント順次番号を付加し、
    上記通信パケットを送信するときに、その通信パケット
    に付加されたチェックポイント順次番号と現在のチェッ
    クポイント順次番号とを比較し、この比較によるその通
    信パケットに付加されたチェックポイント順次番号が現
    在のチェックポイント順次番号と異なるときに、即ちに
    その通信パケットを送信し、一致するときには、その通
    信パケットの送信を次のチェックポイントが取得される
    まで遅延させることを特徴とするチェックポイント通信
    処理方法。
  9. 【請求項9】 チェックポイントを取得しながら処理を
    進めていき、障害が発生したときに、最後に取得したチ
    ェックポイントから処理を再実行することにより障害か
    らの回復を実現するコンピュータシステムにおいて、 ある特定の通信プロトコルで作成された通信パケットを
    伝送媒体の伝送パケットサイズで分割して複数の伝送パ
    ケットを作成するときに、その作成した伝送パケットが
    上記複数の伝送パケットの中の最後のものであるか否か
    を示す情報を付加し、上記伝送パケットを伝送するとき
    に、その伝送パケットが上記複数の伝送パケットの中の
    最後のものか否かを判定し、この判定によりその伝送パ
    ケットが上記最後のものでなかったときに、即座にその
    伝送パケットを伝送し、上記最後のものであったときに
    は、その伝送パケットの伝送を次のチェックポイントが
    取得されるまで遅延させることを特徴とするチェックポ
    イント通信処理方法。
  10. 【請求項10】 上記通信パケットを伝送媒体の伝送パ
    ケットサイズで分割して複数の伝送パケットを作成し、
    その複数の伝送パケットの中の最後のもの以外をチェッ
    クポイントを待機せずに即座に伝送して一番最後のもの
    のみをチェックポイントまで待機させる処理を一体とし
    て行い、伝送パケットへの情報の付加を不要とすること
    を特徴とする請求項9記載のチェックポイント通信処理
    方法。
  11. 【請求項11】 チェックポイントを取得しながら処理
    を進めていき、障害が発生したときに、最後に取得した
    チェックポイントから処理を再実行することにより障害
    からの回復を実現するコンピュータシステムであって、
    通信パケットを複数の伝送パケットに分割し、上記伝送
    パケットに順序番号を付けた上で送信し、順序番号付き
    の応答パケットにより送信完了を確認する通信プロトコ
    ルにおいて、最後のチェックポイント取得以後に発生し
    た上記分割された伝送パケットのうち、同一の送信先へ
    の最初のパケットか否かを判定し、この判定によりその
    伝送パケットが上記最初のものであるときには、その伝
    送パケットの伝送を次のチェックポイントが取得される
    まで遅延させることを特徴とするチェックポイント通信
    処理方法。
  12. 【請求項12】 チェックポイントを取得しながら処理
    を進めていき、障害が発生したときに、最後に取得した
    チェックポイントから処理を再実行することにより障害
    からの回復を実現するコンピュータシステムであって、
    通信パケットを複数の伝送パケットに分割し、上記伝送
    パケットに順序番号を付けた上で送信し、順序番号付き
    の応答パケットにより送信完了を確認する通信プロトコ
    ルにおいて、故障により直前のチェックポイント迄ロー
    ルバックした際には、伝送パケットの順序番号をリセッ
    トし、2つ目の伝送パケットには順序番号初期化のメッ
    セージを付加して伝送し、その伝送パケットを受信した
    計算機では、不完全な伝送パケットを破棄し、順序番号
    を初期化した上で伝送パケットを受信することを特徴と
    する請求項11記載のチェックポイント通信処理方法。
  13. 【請求項13】 チェックポイントを取得しながら処理
    を進めていき、障害が発生したときに、最後に取得した
    チェックポイントから処理を再実行することにより障害
    からの回復を実現するコンピュータシステムであって、
    通信パケットを複数の伝送パケットに分割し、上記伝送
    パケットに順序番号を付けた上で送信し、順序番号付き
    の応答パケットにより送信完了を確認する通信プロトコ
    ルにおいて、遅延せずに送出した2つ目以降の連続する
    伝送パケット数が、予め設定された閾値を超えたとき
    に、次のチェックポイント取得を開始することを特徴と
    する請求項11記載のチェックポイント通信処理方法。
  14. 【請求項14】 チェックポイントを取得しながら処理
    を進めていき、障害が発生したときに、最後に取得した
    チェックポイントから処理を再実行することにより障害
    からの回復を実現するコンピュータシステムであって、
    通信パケットを複数の伝送パケットに分割し、上記伝送
    パケットに順序番号を付けた上で送信し、順序番号付き
    の応答パケットにより送信完了を確認する通信プロトコ
    ルにおいて、分割された2つ目以降の伝送パケットを遅
    延せずに送出した通信相手よりオーバーフローを告知す
    るパケットが到着した際には、その通信相手へのパケッ
    トの伝送を停止し、次のチェックポイントを開始するこ
    とを特徴とする請求項11記載のチェックポイント通信
    処理方法。
JP20183096A 1996-07-31 1996-07-31 チェックポイント通信処理システム、及びチェックポイント通信処理方法 Expired - Fee Related JP3833746B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20183096A JP3833746B2 (ja) 1996-07-31 1996-07-31 チェックポイント通信処理システム、及びチェックポイント通信処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20183096A JP3833746B2 (ja) 1996-07-31 1996-07-31 チェックポイント通信処理システム、及びチェックポイント通信処理方法

Publications (2)

Publication Number Publication Date
JPH1049461A true JPH1049461A (ja) 1998-02-20
JP3833746B2 JP3833746B2 (ja) 2006-10-18

Family

ID=16447607

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20183096A Expired - Fee Related JP3833746B2 (ja) 1996-07-31 1996-07-31 チェックポイント通信処理システム、及びチェックポイント通信処理方法

Country Status (1)

Country Link
JP (1) JP3833746B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014529828A (ja) * 2011-09-02 2014-11-13 トレーディング テクノロジーズ インターナショナル インコーポレイテッド メッセージ・ストリーム・インテグリティ
WO2023165743A1 (en) * 2022-03-01 2023-09-07 Graphcore Limited Reset of a multi-node system

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014529828A (ja) * 2011-09-02 2014-11-13 トレーディング テクノロジーズ インターナショナル インコーポレイテッド メッセージ・ストリーム・インテグリティ
US9154393B2 (en) 2011-09-02 2015-10-06 Trading Technologies International, Inc. Order feed message stream integrity
US10152751B2 (en) 2011-09-02 2018-12-11 Trading Technologies International, Inc. Order feed message stream integrity
US10311518B2 (en) 2011-09-02 2019-06-04 Trading Technologies International, Inc. Order feed message stream integrity
WO2023165743A1 (en) * 2022-03-01 2023-09-07 Graphcore Limited Reset of a multi-node system

Also Published As

Publication number Publication date
JP3833746B2 (ja) 2006-10-18

Similar Documents

Publication Publication Date Title
JP4587053B2 (ja) 通信装置、通信システム、パケット欠落検出方法、およびパケット欠落検出プログラム
US7529855B2 (en) Dynamic modification of fragmentation size cluster communication parameter in clustered computer system
US7903546B2 (en) Detecting unavailable network connections
US7107481B2 (en) Server takeover system and method
US7876761B2 (en) System and method for fault tolerant TCP offload
US20040054814A1 (en) System and method for handling frames in multiple stack environments
EP1859594B1 (en) Server side tftp flow control
CN101369877B (zh) 无线传输控制协议处理方法和设备
JP2008090847A (ja) データ通信システムまたはその方法
JP2002527935A (ja) データ通信用方法とシステム
US20070291782A1 (en) Acknowledgement filtering
JP2878988B2 (ja) チェックポイント通信処理システム
US20080212505A1 (en) Method and receiving apparatus for processing arq block in wibro system
JP3587092B2 (ja) 応答分散式通信方法および通信システム
JPH1049461A (ja) チェックポイント通信処理システム、及びチェックポイント通信処理方法
JP2003500979A (ja) ファイバチャネルネットワークにおけるストリーミングデバイスへのマルチイニシエーターサポートのための方法およびシステム
EP1225741B1 (en) High speed interconnection for embedded systems within a computer network
US7808982B2 (en) Method for verifying shared state synchronization of redundant modules in a high availability network switch
JP3415027B2 (ja) データ通信装置及びデータ通信方法
JP2009217765A (ja) 複数宛先への同期送信方法、その実施システム及び処理プログラム
JPH10320326A (ja) チェックポイント通信処理システム、及びチェックポイント通信処理方法、この通信処理方法を格納した記憶媒体
JP5046197B2 (ja) 通信装置、通信システム、パケット欠落検出方法、およびパケット欠落検出プログラム
JP2001297016A (ja) 命令実行システム
WO2022172331A1 (ja) 設定変更装置、設定変更方法及びプログラム
JP5170847B2 (ja) 通信装置、通信システム、パケット欠落検出方法、およびパケット欠落検出プログラム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060718

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060720

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090728

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100728

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100728

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110728

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120728

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130728

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees