JP2008242685A - フェイルオーバ方法、クラスタシステム、情報処理装置、プログラム - Google Patents

フェイルオーバ方法、クラスタシステム、情報処理装置、プログラム Download PDF

Info

Publication number
JP2008242685A
JP2008242685A JP2007080534A JP2007080534A JP2008242685A JP 2008242685 A JP2008242685 A JP 2008242685A JP 2007080534 A JP2007080534 A JP 2007080534A JP 2007080534 A JP2007080534 A JP 2007080534A JP 2008242685 A JP2008242685 A JP 2008242685A
Authority
JP
Japan
Prior art keywords
connection state
information
information processing
computer
connection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007080534A
Other languages
English (en)
Inventor
Hisashi Nagata
悠 永田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2007080534A priority Critical patent/JP2008242685A/ja
Publication of JP2008242685A publication Critical patent/JP2008242685A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

【課題】サービス提供の停止を抑制しつつ迅速に処理を引き継ぐことで、システムの信頼性の向上を図ると共に、ユーザの利便性の向上を図る。
【解決手段】ネットワークを介して接続された所定のコンピュータに対して同一の情報サービスを提供可能な複数の情報処理装置を備えたクラスタシステムにおけるフェイルオーバ方法であって、コンピュータと通信接続中の特定の情報処理装置が、コンピュータとの接続状態を他の情報処理装置にて再現するために必要な情報である接続状態情報を他の情報処理装置に送信し、この送信された接続状態情報を他の情報処理装置が受信して記憶する接続状態情報複製工程と、他の情報処理装置が、特定の情報処理装置の状態に応じて、記憶している接続状態情報に基づいてコンピュータとの接続状態を再現する接続再現工程と、を有する。
【選択図】図1

Description

本発明は、フェイルオーバ方法にかかり、特に、クラスタシステムを構成しクライアント端末に接続された情報処理装置を切り替えるフェイルオーバ方法に関する。
コンピュータ及びネットワークシステムの発達に伴い、ネットワーク上に設置されたサーバコンピュータからネットワークを介した種々の情報サービスが提供されている。そして、このようなネットワークを介した情報システムは、今や社会基盤とも言えるものであり、これを支えるハードウェアとソフトウェアには、高い信頼性が要求されている。このため、近年では、仮に、サーバに障害が発生した場合であっても、他のサーバが処理を引き継ぐよう構成されている。このような複数のサーバコンピュータなどの情報処理装置が相互に状態を監視して処理を代替する機能をフェイルオーバ機能と呼ぶ。そして、このフェイオーバー機能には、できる限り短時間のうちに障害が発生したサーバの処理を引き継いで代替処理を再開することができよう、保守容易性が求められている。
特開2005−182781号公報
ところが、上述したようにネットワーク上でのサービスを提供するコンピュータシステムにおいてフェイルオーバを実行する場合には、サービスを提供していたサーバから他の代替サーバに引き継ぐ間に、一時的にサービスを停止しなければならない、という問題があった。例えば、ファイル共有サービスを提供するシステムにおいて、ネットワーク接続にCIFSプロトコルを用いている場合には、TCPコネクションが切断されると、それまでの状態を捨てて再接続を行う必要があり、この再接続に所定の時間を要していた。
ここで、特許文献1には、主プロセッサがチェックポイント状態のデータをネットワーク接続型永続メモリユニットに記憶し、これをバックアッププロセスがチェックポイント状態を取得して、主プロセスの障害時に当該主プロセスの機能を実行する、というシステムが開示されている。
しかし、上記従来技術では、主プロセッサのチェックポイント状態のデータを、一旦、メモリユニットに記憶しているため、主プロセッサに障害が生じるなどバックアッププロセッサに迅速な処理の引継ぎが必要な場合であっても、チェックポイント状態のデータを取得する際に時間を要し、プロセスの再開の一時的な停止が生じうる、という問題があった。
また、チェックポイントの設定によっては、主プロセッサのプロセス内容が保障されずにバックアッププロセッサに引き継がれる場合も生じ、信頼性が低下しうる、という問題も生じうる。
さらには、予めプロセスを実行するアプリケーションに特別なチェックポイントを設定する必要があり、アプリケーション作成の手間が増大し、また、処理負担が増加する、という問題があった。
このため、本発明では、上記従来例の有する不都合を改善し、特に、サービス提供の停止を抑制しつつ迅速に処理を引き継ぐことで、システムの信頼性の向上を図ることができると共に、ユーザの利便性の向上を図ることができるフェイルオーバ方法を提供する、ことをその目的とする。
そこで、本発明の一形態では、
ネットワークを介して接続された所定のコンピュータに対して同一の情報サービスを提供可能な複数の情報処理装置を備えたクラスタシステムにおけるフェイルオーバ方法であって、
コンピュータと通信接続中の特定の情報処理装置が、コンピュータとの接続状態を他の情報処理装置にて再現するために必要な情報である接続状態情報を他の情報処理装置に送信し、この送信された接続状態情報を他の情報処理装置が受信して記憶する接続状態情報複製工程と、
他の情報処理装置が、特定の情報処理装置の状態に応じて、記憶している接続状態情報に基づいてコンピュータとの接続状態を再現する接続再現工程と、
を有することを特徴としている。
上記発明によると、まず、クラスタシステムにおいて、所定のコンピュータに特定の情報処理装置が接続されて、ある情報サービスが提供されている場合に、特定の情報処理装置はコンピュータとの接続状態を表す接続状態情報を他の情報処理装置に送信する。すると、他の情報処理装置は、送信された接続状態情報を受信して記憶しておく。その後、他の情報処理装置は、特定の情報処理装置に障害が発生するなどした場合には、当該特定の情報処理装置から取得して記憶している上記接続状態情報を用いて、コンピュータとの接続状態を再現する。これにより、コンピュータとの接続が他の情報処理装置に切り替えられ、情報サービスの提供が継続される。従って、サービスを提供する情報処理装置を迅速に切り替えることができ、サービス提供を停止することが抑制されるため、システムの信頼性の向上を図ることができると共に、ユーザの利便性の向上を図ることができる。
そして、上記接続状態情報複製工程は、特定の情報処理装置とコンピュータとの所定の送受信処理が正常に実行されたタイミングで他の情報処理装置に対して接続状態情報を送信する、ことを特徴としている。具体的に、接続状態情報複製工程は、特定の情報処理装置とコンピュータとの間でACK信号が送受信されるタイミングで他の情報処理装置に対して接続状態情報を送信する、ことを特徴としており、特に、特定の情報処理装置がコンピュータに対してACK信号を送信するタイミングで他の情報処理装置に対して接続状態情報を送信する、ことを特徴としている。
これにより、特定の情報処理装置が、コンピュータの送受信処理が正常に実行されたタイミング、例えば、ACK信号の送受信のタイミングで、コンピュータとの接続状態を表す接続状態情報を他の情報処理装置に送信する。従って、特定の情報処理装置は、コンピュータとの相互間における送受信データが保障されたタイミングにおいて、そのときの接続状態情報を他の情報処理装置に送信して記憶させているため、その後に他の情報処理装置への切り替えが生じた場合であっても、データの欠損がなく処理を引き継ぐことができる。その結果、システムの信頼性の向上を図ることができると共に、ユーザの利便性の向上を図ることができる。また、通常、通信時に送受信されるACK信号を接続状態情報の送信タイミングとして利用することで、特定の情報処理装置側のアプリケーションなど特別なチェックポイントを予め設定しておく必要がなく、アプリケーション作成コストを軽減し、また、情報処理装置による処理負担を抑制することができる。
また、上記接続状態情報複製工程は、特定の情報処理装置が複数の他の情報処理装置に対して接続状態情報を送信し、この送信された接続状態情報を複数の他の情報処理装置がそれぞれ受信して記憶し、上記接続再現工程は、接続状態情報を記憶した複数の他の情報処理装置のうちの1つがコンピュータとの接続を再現する、ことを特徴としている。これにより、コンピュータとの接続処理を引き継ぐことが可能な情報処理装置の台数が増え、システムの信頼性の向上を図ることができる。
なお、上記接続状態情報は、コンピュータとの通信接続状態を特定する情報と、通信接続時に作動しているプロセスが扱っている情報と、を含む、ことを特徴としている。
また、上記接続再現工程は、例えば、他の情報処理装置が、特定の情報処理装置に障害が生じたことを検出したときに、記憶している接続状態情報に基づいてコンピュータとの接続状態を再現する、ことを特徴としている。
そして、本発明の他の形態は、
ネットワークを介して接続された所定のコンピュータに対して同一の情報サービスを提供可能な複数の情報処理装置を備えたクラスタシステムであって、
コンピュータと通信接続中の特定の情報処理装置が、コンピュータとの接続状態を他の情報処理装置にて再現するために必要な情報である接続状態情報を他の情報処理装置に送信する接続状態情報送信手段を備え、
他の情報処理装置が、特定の情報処理装置から送信された接続状態情報を受信して記憶する接続状態情報受信手段と、特定の情報処理装置の状態に応じて記憶している接続状態情報に基づいてコンピュータとの接続状態を再現する接続再現手段と、を備えた、ことを特徴としている。
さらに、本発明の他の形態は、
ネットワークを介して接続された所定のコンピュータに対して同一の情報サービスを提供可能な複数の情報処理装置を備えたクラスタシステムを構成する情報処理装置であって、
コンピュータと通信接続中に、当該コンピュータとの接続状態を他の情報処理装置にて再現するために必要な情報である接続状態情報を他の情報処理装置に送信する接続状態情報送信手段と、
コンピュータと通信接続中ではない場合に、コンピュータと通信接続中の他の情報処理装置に装備された接続状態情報送信手段から送信された接続状態情報を受信して記憶する接続状態情報受信手段と、コンピュータと通信接続中の他の情報処理装置の状態に応じて記憶している接続状態情報に基づいてコンピュータとの接続状態を再現する接続再現手段と、
を備えたことを特徴としている。
そして、上記接続状態情報送信手段は、コンピュータとの送受信処理が正常に実行されたタイミング、例えば、コンピュータとの間でACK信号が送受信されるタイミング、特に、コンピュータに対してACK信号を送信するタイミングで、他の情報処理装置に対して接続状態情報を送信する、ことを特徴としている。
また、上記接続状態情報送信手段は、複数の他の情報処理装置に対して接続状態情報を送信する、ことを特徴としている。なお、上記接続状態情報は、コンピュータとの接続状態を特定する情報と、接続時に作動しているプロセスが扱っている情報と、を含む、ことを特徴としている。
また、接続再現手段は、コンピュータと通信接続中の他の情報処理装置の状態を監視してこの情報処理装置に障害が生じたことを検出したときに、記憶している接続状態情報に基づいてコンピュータとの接続状態を再現する、ことを特徴としている。
さらに、本発明の他の形態であるプログラムは、
ネットワークを介して接続された所定のコンピュータに対して同一の情報サービスを提供可能な複数の情報処理装置を備えたクラスタシステムを構成する情報処理装置に、
コンピュータと通信接続中に、当該コンピュータとの接続状態を他の情報処理装置にて再現するために必要な情報である接続状態情報を他の情報処理装置に送信する接続状態情報送信手段と、
コンピュータと通信接続中ではない場合に、コンピュータと通信接続中の他の情報処理装置に装備された接続状態情報送信手段から送信された接続状態情報を受信して記憶する接続状態情報受信手段と、コンピュータと通信接続中の他の情報処理装置の状態に応じて記憶している接続状態情報に基づいてコンピュータとの接続状態を再現する接続再現手段と、
を実現させる、ことを特徴としている。
上述した構成のシステム、情報処理装置、プログラムの発明であっても、上記フェイルオーバ方法と同様に作用するため、上述した本発明の目的を達成することができる。
本発明は、以上のように構成され機能するので、これによると、クラスタシステムにおいて、クライアントのコンピュータに対してサービスを提供する情報処理装置を迅速に切り替えることができ、サービス提供を停止することが抑制されるため、システムの信頼性の向上を図ることができると共に、ユーザの利便性の向上を図ることができる、という従来にない優れた効果を有する。
本発明では、サービスの提供を受けるクライアント端末に接続された複数の情報処理装置を備えたクラスタシステムにおいて、クライアント端末と通信中の情報処理装置を、その接続状態を維持したまま他の情報処理装置に迅速に切り替えることができる、という点に特徴を有する。以下、実施例にて、クライアント端末にネットワークストレージサービスを提供するクラスタシステムを一例に挙げて、詳細な構成及び動作を説明する。但し、本発明の特徴となるフェイルオーバ機能は、いかなる情報サービスを提供するクラスタシステムに利用されてもよく、例えば、Webサービスを提供するシステムに利用されてもよい。
本発明の第1の実施例を、図1乃至図9を参照して説明する。図1は、クラスタシステムの構成を示すブロック図であり、図2は、そのうちのノードの構成を示す機能ブロック図である。図3は、接続状態情報のデータ構造の一例を示す図である。図4は、クラスタシステムにおけるフェイルオーバの動作を示すシーケンス図であり、図5乃至図6は、ノードの動作を示すフローチャートである。図7乃至図9は、クラスタシステムの動作を示す説明図である。
[構成]
図1に、本実施例におけるクラスタシステムの全体構成を示す。この図に示すように、本実施例におけるクラスタシステムは、ストレージ装置4と、このストレージ装置4にSAN40(ストレージエリアネットワーク)を介して接続された複数のノード1,2,3(情報処理装置)と、を備えている。そして、各ノード1,2,3にはネットワークを介してクライアント端末5(コンピュータ)が接続されており、このクライアント端末5にストレージ装置4に対するデータの共有サービス、つまり、ストレージサービスを提供するよう、クラスタシステムは構成されている。なお、クラスタシステムを構成するノード1,2,3は、少なくとも2台装備されていればよく、設置台数は任意である。
そして、各ノード1,2,3は、サーバコンピュータにて構成されており、クライアント端末5とストレージ装置4とを接続する中継点として機能する。つまり、ノード1,2,3は、そのうちの1台がクライアント端末5とTCP/IPを基盤としたCIFSプロトコルにて接続し、ストレージ装置4に対するファイル共有サービスを提供する機能を有する。そして、接続しているノードに障害などが発生してクライアント端末5との接続を維持できなくなると、他のノードがクライアント端末5との接続を引き継いでサービスを継続して提供するフェイルオーバ機能を有する。以下、ノード1,2,3の構成について説明するが、全ては同じ構成を有しているため、符号1に示すノードを例に挙げて説明する。
図2に示すように、ノード1には、演算装置であるCPU1Aと、記憶装置であるメモリ1Bと、が装備されている。そして、CPU1Aには、プログラムが組み込まれることにより、通信処理部11と、接続状態コピー処理部12と、接続再現処理部13と、が構築されている。また、メモリ1Bには、接続状態情報が記憶される接続状態情報記憶部14が形成されている。以下、さらに詳述する。
通信処理部11は、クライアント端末5とTCPコネクションを利用してCIFSプロトコルにて接続する機能を有し、ストレージ装置4を共有可能とする。なお、これに伴い、クライアント端末5にも、CIFSプロトコルにてノード1,2,3と接続する機能が装備されている。また、通信装置11は、ストレージ装置4と接続するよう機能し、さらには、他のノード2,3とも接続するよう機能する。
接続状態コピー処理部12(接続状態情報複製手段)は、上述したようにCIFSプロトコルにて通信接続中のクライアント端末5との接続状態を表す接続状態情報を抽出して、他のノードに送信する機能を有する。具体的に、接続状態情報は、図3に示すように、クライアント端末5との通信接続状態を特定するコネクション情報(例えば、送受信IPアドレス、ポート番号、TCPのシーケンス番号、返却ACK番号など)と、通信接続時に作動しているプロセスが扱っている情報(例えば、プロセスが持つデータ(コンテキスト)、プログラムカウンタなど)と、を含んでいる情報である。そして、この接続状態情報は、ノード1とクライアント端末5との接続状態を、他のノード2,3とクライアント端末5との間で再現するために必要な情報である。つまり、後述するように、他のノード2,3は、上記接続状態情報を得てこれを利用することで、クライアント端末5と通信しているノード1との接続状態を再現することができる。
そして、上記接続状態コピー処理部12は、特に、通信中のクライアント端末5の送受信処理において、当該送受信処理が正常に実行されたタイミング、つまり、クライアント端末5のデータの送受信時にTCP/IPプロトコルにてデータの送信先から送信元へ送られる肯定的な返事となる「ACK信号」が送受信されるタイミングで、他のノード2,3に接続状態情報を送信するよう作動する。具体的に、本実施例では、クライアント端末5がノード1に対してデータを送信し、そのデータをノード1が正常に受信したことをクライアント端末5に通知するためにACL信号を返送するが、このACK信号の返送時に、ノード1が他のノード2,3に対して接続状態情報を送信する。なお、このとき、ノード1の接続状態コピー処理部12は、RDMA(Remote Direct Memory Access)技術にて、他のノード2,3のメモリ(図示せず)に直接、接続状態情報を送信する。
また、接続状態コピー処理部12は、ノードがクライアント端末5と通信接続中ではない場合には、他のノードから送信された上述した接続状態情報を受信して、メモリ1Bの接続状態情報記憶部14に記憶する機能(接続状態情報受信手段)を有する。つまり、本実施例においては、他のノード2,3に装備された接続状態コピー処理部は、クライアント端末5と接続されているノード1の接続状態コピー処理部12から送信された当該ノード1における接続状態情報を受信して、メモリに記憶する。
そして、接続再現処理部13(接続再現手段)は、主にクライアント端末5と接続中ではないノードにて機能するものである。従って、ここでは、符号2のノード2に装備されているものとして説明する。この接続再現処理部は、通信処理部を介して、まず、他のノード(ここでは符号1,3のノード)の状態を監視している。特に、クライアント端末5と通信中のノード1に障害が発生していないかどうかを監視している。そして、上記ノード1に障害が発生したことを検出すると、自身のメモリの接続状態情報記憶部(符号14を参照)に記憶されている接続状態情報を読み出して、当該接続状態情報に基づいてクライアント端末5との接続状態を再現して、ノード2にてクライアント端末5に対するサービス提供を回復するよう作動する。つまり、クライアント端末5に対して符号1のノードが接続していたときの状態を、そのまま符合2のノードにて再現して引き継ぐ。このような引継ぎ処理は、接続状態情報が上述したようにコネクション情報やプロセス情報を利用することで実現可能である。
[動作]
次に、上記構成のシステムの動作を、図4乃至図9を参照して説明する。図4は、システム全体の動作を示すシーケンス図であり、図5は、符号1のノードの動作を示すフローチャートであり、図6は、符号2のノードの動作を示すフローチャートである。図7乃至図9は、接続状態やデータの流れを示す説明図である。
まず、クライアント端末5と符号1のノード1との通信接続が確立され(図4のステップS1,S2、図7の(1))、ノード1がCIFSサービスの提供を開始し(図5のステップS21)、クライアント端末5にCIFSサービスを提供する(図5のステップS22)。これにより、クライアント端末5は、ノード1にて提供されるストレージサービスを利用することができる。つまり、ストレージ装置4にアクセスすることができ、当該ストレージ装置4に対するファイルの記録再生を行うことができる。
そして、クライアント端末5からデータ(A)の送信があり(図4のステップS3)、これをノード1が完全に受信すると、受信確認を表すACK信号をクライアント端末5に返送する(図4のステップS4、図5のステップS23でイエス、図7の(2))。すると、ノード1は、このACK返送のタイミングで、クライアント端末5との接続状態を表す接続状態情報を抽出して(図5のステップS24)、他のノード2,3に送信する(図4のステップS5、図5のステップS25、図7の(3)、接続状態情報複製工程)。
これに対し、他のノード2,3は、上記ノード1から送信された接続状態情報を受信して(図6のステップS31)、メモリ内の接続状態情報記憶部に記憶しておく(図4のステップS6、図6のステップS32、接続状態情報複製工程)。その後、ノード1は、CIFSサービス提供が終了するまで(図5のステップS26でノー、図6のステップS33でノー)、上述したように、クライアント端末5にACK信号を送信するたびに接続状態情報を他のノード2,3に送信し、これに応じて、ノード2,3は、送信されてきた接続状態情報を受信して最新のものを記憶しておく。
続いて、ノード1に障害が発生したときのことを考える。ここでは、図4に示すように、クライアント端末5からデータ(B)がノード1に送信され(図4のステップS7)、これをノード1が完全に受信しないうちに、当該ノード1に障害が発生したとする(図4のステップS8、図6のステップS33でイエス、図8の(4))。すると、他のノード2,3が、監視しているノード1の障害を検出し(図4のステップS9)、ノード2,3間の予め設定されたやり取りによってノード1の処理を引き継ぐことが決定した符号2のノードが、自己のメモリに記憶されているノード1から受信した接続状態情報を読み出して、これに基づいてクライアント端末5との接続を再現する。これにより、ノード2がクライアント端末5に対するCIFSサービスを回復し(図4のステップS10、図6のステップS35)、クライアント端末5のノード1への接続がノード2に引き継がれて、当該ノード2とクライアント端末5との接続が確立される(図4のステップS11,S12、図8の(5)(矢印Y1参照)、接続再現工程)。なお、ノード2がノード1の障害を検出したときには、既に接続を引き継ぐための接続状態情報が記憶されているため、かかる引継ぎ処理を迅速に実行することができる。
そして、その後は、ノード2からクライアント端末5に対してCIFSサービスが提供される(図6のステップS36)。すると、クライアント端末5は、ノード1に障害が生じる前にデータ(B)を送信しているが(図4のステップS7参照)、これに対する受信確認信号であるACK信号を得ていないため、データ(B)を再送する(図4のステップS13)。すると、現在は、ノード2が接続されているため、当該ノード2にデータ(B)を送信することとなる。従って、ノード1の障害発生前の処理がノード2で引き継がれるため、確実に処理が継続されうる。そして、ノード2がクライアント端末5からデータ(B)を完全に受信すると、その受信確認信号であるACKをクライアント端末5に送信する(図4のステップS14、図9の(6))。すると、これと同時に、ノード2は、上述同様に、このときのクライアント端末5との接続状態を表す接続状態情報を、他のノード1,3に送信する(図4のステップS15、図9の(7))。但し、ノード1が障害発生状態のままである場合には、当該ノード1には送信されない。
以上のように本発明によると、まず、常時、クライアント端末5と通信中であるノード1の接続状態を表す情報が他のノード2にコピーされているため、障害発生時には、他のノード2にて迅速に接続状態を引き継ぐことができ、信頼性の向上を図ることができると共に、利用者の利便性の向上を図ることができる。そして、特に、接続状態情報をコピーするタイミングをACK信号の送信タイミングとすることで、クライアント端末との通信されるデータが保障された状態で他のノードに接続を引き継ぐことができ、さらなる信頼性の向上を図ることができる。このことは、ノードのアプリケーションなどに接続状態情報をコピーするタイミングとして特別なチェックポイントを予め設定しておく必要がなく、アプリケーション作成コストを軽減し、また、ノードの処理負担を抑制することにもなる。
なお、上記では、接続状態情報をコピーするタイミングしてACK信号の送信時を一例に挙げて説明したが、クライアント端末5と通信接続中のノード1との通信データが保障されているタイミングであれば、いかなるタイミングで上記接続状態情報のコピーを実行してもよい。例えば、ディスクI/Oが完了していないデータを他のノードにコピーするといったデータ保障タイミングで、上記接続状態情報の他のノードへのコピーを実行してもよい。
また、上記では、ノード1,2,3はサーバコンピュータであるとして説明したが、上述した構成を具備した情報処理装置であれば、いかなる装置であってもよい。例えば、ルータであってもよい。
さらに、上記では、ノードが装備されるシステムとして、ストレージサービスを提供するクラスタシステムを例示したが、他のシステムに適用してもよい。例えば、ノードが同一のウェブサイトを開設してウェブサービスを提供する複数のウェブサーバにて構成されていてもよい。
本発明のフェイルオーバ方法は、ネットワークストレージサービスを提供するクラスタシステムのフェイルオーバや、ウェブサービスを提供するシステムのフェイルオーバといった用途などに適用することができ、産業上の利用可能性を有する。
クラスタシステムの構成を示すブロック図である。 ノードの構成を示す機能ブロック図である。 接続状態情報のデータ構造の一例を示す図である。 クラスタシステムにおけるフェイルオーバの動作を示すシーケンス図である。 ノードの動作を示すフローチャートである。 ノードの動作を示すフローチャートである。 クラスタシステムのフェイルオーバ時の動作を示す説明図である。 クラスタシステムのフェイルオーバ時の動作を示す説明図である。 クラスタシステムのフェイルオーバ時の動作を示す説明図である。
符号の説明
1,2,3 ノード
4 ストレージ装置
5 クライアント端末
11 通信処理部
12 接続状態コピー処理部
13 接続再現処理部
14 接続状態情報記憶部

Claims (16)

  1. ネットワークを介して接続された所定のコンピュータに対して同一の情報サービスを提供可能な複数の情報処理装置を備えたクラスタシステムにおけるフェイルオーバ方法であって、
    前記コンピュータと通信接続中の特定の前記情報処理装置が、前記コンピュータとの接続状態を他の情報処理装置にて再現するために必要な情報である接続状態情報を他の前記情報処理装置に送信し、この送信された前記接続状態情報を前記他の情報処理装置が受信して記憶する接続状態情報複製工程と、
    前記他の情報処理装置が、前記特定の情報処理装置の状態に応じて、記憶している前記接続状態情報に基づいて前記コンピュータとの接続状態を再現する接続再現工程と、
    を有することを特徴とするフェイルオーバ方法。
  2. 前記接続状態情報複製工程は、前記特定の情報処理装置と前記コンピュータとの所定の送受信処理が正常に実行されたタイミングで前記他の情報処理装置に対して前記接続状態情報を送信する、
    ことを特徴とする請求項1記載のフェイルオーバ方法。
  3. 前記接続状態情報複製工程は、前記特定の情報処理装置と前記コンピュータとの間でACK信号が送受信されるタイミングで前記他の情報処理装置に対して前記接続状態情報を送信する、
    ことを特徴とする請求項2記載のフェイルオーバ方法。
  4. 前記接続状態情報複製工程は、前記特定の情報処理装置が前記コンピュータに対してACK信号を送信するタイミングで前記他の情報処理装置に対して前記接続状態情報を送信する、
    ことを特徴とする請求項3記載のフェイルオーバ方法。
  5. 前記接続状態情報複製工程は、前記特定の情報処理装置が複数の他の情報処理装置に対して前記接続状態情報を送信し、この送信された接続状態情報を前記複数の他の情報処理装置がそれぞれ受信して記憶し、
    前記接続再現工程は、前記接続状態情報を記憶した前記複数の他の情報処理装置のうちの1つが前記コンピュータとの接続を再現する、
    ことを特徴とするフェイルオーバ方法。
  6. 前記接続状態情報は、前記コンピュータとの通信接続状態を特定する情報と、通信接続時に作動しているプロセスが扱っている情報と、を含む、
    ことを特徴とする請求項1,2,3,4又は5記載のフェイルオーバ方法。
  7. 前記接続再現工程は、前記他の情報処理装置が、前記特定の情報処理装置に障害が生じたことを検出したときに、記憶している前記接続状態情報に基づいて前記コンピュータとの接続状態を再現する、
    ことを特徴とする請求項1,2,3,4,5又は6記載のフェイルオーバ方法。
  8. ネットワークを介して接続された所定のコンピュータに対して同一の情報サービスを提供可能な複数の情報処理装置を備えたクラスタシステムであって、
    前記コンピュータと通信接続中の特定の前記情報処理装置が、前記コンピュータとの接続状態を他の情報処理装置にて再現するために必要な情報である接続状態情報を他の前記情報処理装置に送信する接続状態情報送信手段を備え、
    他の前記情報処理装置が、前記特定の情報処理装置から送信された前記接続状態情報を受信して記憶する接続状態情報受信手段と、前記特定の情報処理装置の状態に応じて記憶している前記接続状態情報に基づいて前記コンピュータとの接続状態を再現する接続再現手段と、を備えた、
    ことを特徴とするクラスタシステム。
  9. ネットワークを介して接続された所定のコンピュータに対して同一の情報サービスを提供可能な複数の情報処理装置を備えたクラスタシステムを構成する情報処理装置であって、
    前記コンピュータと通信接続中に、当該コンピュータとの接続状態を他の情報処理装置にて再現するために必要な情報である接続状態情報を他の情報処理装置に送信する接続状態情報送信手段と、
    前記コンピュータと通信接続中ではない場合に、前記コンピュータと通信接続中の他の情報処理装置に装備された前記接続状態情報送信手段から送信された前記接続状態情報を受信して記憶する接続状態情報受信手段と、前記コンピュータと通信接続中の他の情報処理装置の状態に応じて記憶している前記接続状態情報に基づいて前記コンピュータとの接続状態を再現する接続再現手段と、
    を備えたことを特徴とする情報処理装置。
  10. 前記接続状態情報送信手段は、前記コンピュータとの送受信処理が正常に実行されたタイミングで他の情報処理装置に対して前記接続状態情報を送信する、
    ことを特徴とする請求項9記載の情報処理装置。
  11. 前記接続状態情報送信手段は、前記コンピュータとの間でACK信号が送受信されるタイミングで他の情報処理装置に対して前記接続状態情報を送信する、
    ことを特徴とする請求項10記載の情報処理装置。
  12. 前記接続状態情報送信手段は、前記コンピュータに対してACK信号を送信するタイミングで他の情報処理装置に対して前記接続状態情報を送信する、
    ことを特徴とする請求項11記載の情報処理装置。
  13. 前記接続状態情報送信手段は、複数の他の情報処理装置に対して前記接続状態情報を送信する、
    ことを特徴とする請求項9,10,11又は12記載の情報処理装置。
  14. 前記接続状態情報は、前記コンピュータとの接続状態を特定する情報と、接続時に作動しているプロセスが扱っている情報と、を含む、
    ことを特徴とする請求項9,10,11,12又は13記載の情報処理装置。
  15. 前記接続再現手段は、前記コンピュータと通信接続中の他の情報処理装置の状態を監視してこの情報処理装置に障害が生じたことを検出したときに、記憶している前記接続状態情報に基づいて前記コンピュータとの接続状態を再現する、
    ことを特徴とする請求項9,10,11,12,13又は14記載の情報処理装置。
  16. ネットワークを介して接続された所定のコンピュータに対して同一の情報サービスを提供可能な複数の情報処理装置を備えたクラスタシステムを構成する情報処理装置に、
    前記コンピュータと通信接続中に、当該コンピュータとの接続状態を他の情報処理装置にて再現するために必要な情報である接続状態情報を他の情報処理装置に送信する接続状態情報送信手段と、
    前記コンピュータと通信接続中ではない場合に、前記コンピュータと通信接続中の他の情報処理装置に装備された前記接続状態情報送信手段から送信された前記接続状態情報を受信して記憶する接続状態情報受信手段と、前記コンピュータと通信接続中の他の情報処理装置の状態に応じて記憶している前記接続状態情報に基づいて前記コンピュータとの接続状態を再現する接続再現手段と、
    を実現させるためのプログラム。
JP2007080534A 2007-03-27 2007-03-27 フェイルオーバ方法、クラスタシステム、情報処理装置、プログラム Pending JP2008242685A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007080534A JP2008242685A (ja) 2007-03-27 2007-03-27 フェイルオーバ方法、クラスタシステム、情報処理装置、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007080534A JP2008242685A (ja) 2007-03-27 2007-03-27 フェイルオーバ方法、クラスタシステム、情報処理装置、プログラム

Publications (1)

Publication Number Publication Date
JP2008242685A true JP2008242685A (ja) 2008-10-09

Family

ID=39913977

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007080534A Pending JP2008242685A (ja) 2007-03-27 2007-03-27 フェイルオーバ方法、クラスタシステム、情報処理装置、プログラム

Country Status (1)

Country Link
JP (1) JP2008242685A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018533788A (ja) * 2015-10-22 2018-11-15 ネットアップ,インコーポレイテッド 自動スイッチオーバーの実装

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06139170A (ja) * 1992-10-23 1994-05-20 Hitachi Ltd 分散処理システム
JPH086910A (ja) * 1994-06-23 1996-01-12 Hitachi Ltd クラスタ型計算機システム
JP2001022718A (ja) * 1999-07-09 2001-01-26 Matsushita Electric Ind Co Ltd 並列処理装置
JP2005050298A (ja) * 2003-07-11 2005-02-24 Ns Solutions Corp 計算機システム、計算機、データ通信方法及びプログラム
JP2005301436A (ja) * 2004-04-07 2005-10-27 Hitachi Ltd クラスタシステムおよびクラスタシステムにおける障害回復方法
JP2006065619A (ja) * 2004-08-27 2006-03-09 Hitachi Information Systems Ltd ネットワークアプリケーション障害原因切り分け装置及び該障害原因切り分けプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06139170A (ja) * 1992-10-23 1994-05-20 Hitachi Ltd 分散処理システム
JPH086910A (ja) * 1994-06-23 1996-01-12 Hitachi Ltd クラスタ型計算機システム
JP2001022718A (ja) * 1999-07-09 2001-01-26 Matsushita Electric Ind Co Ltd 並列処理装置
JP2005050298A (ja) * 2003-07-11 2005-02-24 Ns Solutions Corp 計算機システム、計算機、データ通信方法及びプログラム
JP2005301436A (ja) * 2004-04-07 2005-10-27 Hitachi Ltd クラスタシステムおよびクラスタシステムにおける障害回復方法
JP2006065619A (ja) * 2004-08-27 2006-03-09 Hitachi Information Systems Ltd ネットワークアプリケーション障害原因切り分け装置及び該障害原因切り分けプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018533788A (ja) * 2015-10-22 2018-11-15 ネットアップ,インコーポレイテッド 自動スイッチオーバーの実装

Similar Documents

Publication Publication Date Title
US10489254B2 (en) Storage cluster failure detection
JP4087271B2 (ja) 代理応答装置およびネットワークシステム
JP5828954B2 (ja) サーバ故障中のパケット処理方法及びルータ
US7739391B2 (en) Gateway for wireless mobile clients
JP5863942B2 (ja) ウィットネスサービスの提供
WO2016202051A1 (zh) 一种通信系统中管理主备节点的方法和装置及高可用集群
US20150019491A1 (en) Replication of Data Between Mirrored Data Sites
WO2011157151A2 (zh) 实现容灾备份的方法、设备及系统
WO2009117946A1 (zh) 调度服务器的主备实现方法及调度服务器
CN113132159B (zh) 存储集群节点故障的处理方法、设备及存储系统
WO2020057445A1 (zh) 一种通信系统、方法及装置
CN112671554A (zh) 一种节点故障处理方法及相关装置
WO2012171346A1 (zh) 电话号码映射域名解析系统(enum-dns)及其容灾方法
JP2011203941A (ja) 情報処理装置、監視方法、および監視プログラム
JP4757670B2 (ja) システム切替方法、その計算機システム及びプログラム
JP2008242685A (ja) フェイルオーバ方法、クラスタシステム、情報処理装置、プログラム
JP5016696B2 (ja) 高可用性システム、サーバ、高可用性維持方法及びプログラム
KR20180099143A (ko) Tcp 세션 복구 장치 및 방법
JP2006260223A (ja) iSCSIストレージシステムおよびそのシステムにおけるパス多重化方法
JP2007141129A (ja) システム切替方法、その計算機システム及びプログラム
US10536875B2 (en) System and method for seamless TCP connection handoff
CN113852514A (zh) 服务不中断的数据处理系统、处理设备切换方法、连接设备
KR100793446B1 (ko) 이중화 통신 시스템의 페일 오버 및 원복 처리 방법
JP2016134749A (ja) Dhcpサーバ
WO2021024377A1 (ja) L2スイッチ、通信制御方法、および、通信制御プログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100212

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20100610

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110222

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110419

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110517

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110920