JP2007179310A - フェイルオーバ方法、フェイルオーバプログラム、および、クラスタシステム - Google Patents

フェイルオーバ方法、フェイルオーバプログラム、および、クラスタシステム Download PDF

Info

Publication number
JP2007179310A
JP2007179310A JP2005377016A JP2005377016A JP2007179310A JP 2007179310 A JP2007179310 A JP 2007179310A JP 2005377016 A JP2005377016 A JP 2005377016A JP 2005377016 A JP2005377016 A JP 2005377016A JP 2007179310 A JP2007179310 A JP 2007179310A
Authority
JP
Japan
Prior art keywords
server
database
failover
view
machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005377016A
Other languages
English (en)
Other versions
JP4856949B2 (ja
Inventor
Masahiko Morita
雅彦 森田
Hiroaki Takahashi
啓昭 高橋
Kojiro Watanabe
光治郎 渡辺
Keiji Yonezawa
恵司 米沢
Kaoru Misonoo
薫 御園生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nomura Research Institute Ltd
Original Assignee
Nomura Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nomura Research Institute Ltd filed Critical Nomura Research Institute Ltd
Priority to JP2005377016A priority Critical patent/JP4856949B2/ja
Publication of JP2007179310A publication Critical patent/JP2007179310A/ja
Application granted granted Critical
Publication of JP4856949B2 publication Critical patent/JP4856949B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】クラスタシステムにおいて、システムの稼動停止時間をより短縮し、より高い可用性を確保する。
【解決手段】複数のサーバを備えるクラスタシステムのフェイルオーバ方法であって、各サーバ3A、3Bには、当該サーバが更新する自データベースと、他サーバが更新する他データベースのバックアップデータベースとが格納されたディスクがマウントされ、各サーバ3A、3Bは、他サーバで発生した障害を検知する障害検知ステップと、データ検索時にアクセスするビューを、自データベースと他データベースとを結合した正常時ビューから、前記自データベースと前記バックアップデータベースとを結合したフェイルオーバ時ビューに切り替える切替ステップと、を行う。
【選択図】図1

Description

本発明は、クラスタシステムにおけるフェイルオーバ技術に関する。
サーバ(コンピュータ)に障害が発生した場合、代替サーバが処理やデータを引き継ぐフェイルオーバ技術がある。また、フェイルオーバ技術を適用したクラスタシステムは、複数のサーバによってシステムを冗長化したものである。
なお、フェイルオーバについては、例えば、非特許文献1に記載されている。
"フェイルオーバの仕組みと問題点"、[online]、[2005年11月24日検索]、インターネット<URL:http://www.atmarkit.co.jp/flinux/rensai/cluster02/cluster02.html>
さて、インターネットや電子商取引の普及などに伴い、コンピュータシステムの連続稼動が求められている。連続稼動を実現するためにハードウェアを多重化した無停止サーバが存在する。無停止サーバは、システムを停止させることなく障害部位の修理が可能なため、連続稼動を実現することができるが、コストが非常に高い。
また、一般的なフェイルオーバ技術を適用したクラスタシステムでは、障害発生時にリソースの引き継ぎが必要となる。例えば、リソースの1つであるデータを引き継ぐ場合、障害が発生したサーバにマウントされているディスクを、正常な代替サーバからマウントし直す必要がある。このようなリソースの引継ぎには所定の時間を要するため、システムの稼動停止時間(ダウンタイム)が発生してしまう。
本発明は上記事情に鑑みてなされたものであり、本発明の目的は、システムの稼動停止時間をより短縮し、より高い可用性を確保することにある。
上記課題を解決するために、本発明では、例えば、複数のサーバを備えるクラスタシステムのフェイルオーバ方法であって、前記各サーバには、当該サーバが更新する自データベースと、他サーバが更新する他データベースのバックアップデータベースとが格納されたディスクがマウントされ、前記各サーバは、他サーバで発生した障害を検知する障害検知ステップと、データ検索時にアクセスするビューを、自データベースと他データベースとを結合した正常時ビューから、前記自データベースと前記バックアップデータベースとを結合したフェイルオーバ時ビューに切り替える切替ステップと、を行う。
本発明では、システムの稼動停止時間をより短縮し、より高い可用性を確保することができる。
以下、本発明の実施の形態について説明する。
図1は、本発明の一実施形態が適用されたシステムの全体構成図である。本実施形態のシステムは、端末1と、負荷分散装置(load balancer)2と、複数のサーバ3A、3Bおよび共用ディスク4を備えたクラスタシステムと、を有する。クラスタシステムは、複数のコンピュータを一群にまとめて、信頼性や処理性能の向上を図るシステムである。本実施形態のクラスタシステムは、各端末1からの要求を処理するために、サーバ1号機3Aおよびサーバ2号機3Bの2台のサーバを冗長化させている。なお、各端末1は、インターネットなどのネットワーク9および負荷分散装置2を介して、いずれかのサーバ3A、3Bに接続することができる。
端末1は、ユーザが入力した各種の要求を受け付け、受け付けた要求をネットワーク9を介して負荷分散装置2に送信する。負荷分散装置2は、各端末1からの要求をサーバ1号機3Aまたはサーバ2号機3Bに振り分け、各サーバの負荷を分散させる。
サーバ1号機3Aおよびサーバ2号機3Bには、共用ディスク4が接続されている。そして、共用ディスク4は、サーバ1号機3A用のパーティション(以下、「1号機用ディスク」)4Aと、サーバ2号機3B用のパーティション(以下、「2号機用ディスク」)4Bと、に分割されているものとする。
なお、いずれのサーバにも障害が発生していない正常運用時においては、サーバ1号機3Aは1号機用ディスク4Aをマウントし、サーバ2号機3Bは2号機用ディスク4Bをマウントしている。すなわち、1号機用ディスク4Aは、サーバ1号機3A上で認識され、サーバ1号機3Aからアクセス可能なように接続されている。また、2号機用ディスク4Bは、サーバ2号機3B上で認識され、サーバ2号機3Bからアクセス可能なように接続されている。
サーバ1号機3Aおよびサーバ2号機3Bは、業務処理部31と、受信部32と、状態監視部33と、フェイルオーバ処理部34と、MQ通信部35とをそれぞれ有する。業務処理部31は、端末1の要求に応じて所定の業務処理を行い、データベースに対して所定のアクセス要求を生成する。アクセス要求には、データの書き込み要求(write要求)、データの読み出し要求(read要求)などが含まれる。
受信部32は、メッセージキューイング(MQ:message queueing)方式を用いて受信したデータを、バックアップテーブル42A、42Bに書き込む。状態監視部33は、他サーバの状態を監視し、他サーバで発生した障害を検知する。本実施形態では、サーバ1号機3Aおよびサーバ2号機3Bの状態監視部33は、ハートビートの送受信を行うことにより、相互に状態を監視するものとする。
例えば、状態監視部33は、ハートビートの応答の有無により、相手サーバの死活監視を行うことが考えられる。また、状態監視部33は、自サーバの稼動状態を監視する運用監視エージェント機能を有し、ハートビート等のメッセージに自サーバの稼動状態(CPU利用率、メモリ使用量、自サーバ内の障害など)を相手サーバに送信することとしてもよい。また、本実施形態のクラスタシステムは障害監視サーバ(不図示)を備え、障害監視サーバが各サーバの稼動状態を監視し、障害を検知することとしてもよい。
フェイルオーバ処理部34は、障害が発生したサーバの処理やリソースを、正常なサーバに引き継ぐ処理を行う。具体的には、フェイルオーバ処理部34は、データ検索時にアクセスするビュー(view)を所定のタイミングで切り替えるとともに、ディスクのマウントなどを行う。なお、ビューは、実テーブルから生成される仮想的なテーブルである。また、フェイルオーバ処理部34については後述する。MQ通信部35は、図示しない送信キューおよび受信キューを有し、メッセージキューイング方式によりデータを送受信する。
1号機用ディスク4Aは、1号機用ログテーブル41Aと、2号機用バックアップテーブル42Aとを有する。1号機用ログテーブル41Aは、サーバ1号機3A上で行われた処理の履歴情報(更新データ)を格納するためのデータベースである。すなわち、サーバ1号機3Aが、1号機用ログテーブル41Aにデータを書き込み、更新する。2号機用バックアップテーブル42Aは、2号機用ログテーブル41Bのバックアップである。
2号機用ディスク4Bは、2号機用ログテーブル41Bと、1号機用バックアップテーブル42Bとを有する。2号機用ログテーブル41Bは、サーバ2号機3B上で行われた処理の履歴情報(更新データ)を格納するためのデータベースである。すなわち、サーバ2号機3Bが、2号機用ログテーブル41Bにデータを書き込み、更新する。1号機用バックアップテーブル42Bは、1号機用ログテーブル41Aのバックアップである。
上記説明した端末1および各サーバ3A、3Bは、いずれも、例えば図2に示すようなCPU901と、メモリ902と、HDD等の外部記憶装置903と、キーボードやマウスなどの入力装置904と、ディスプレイやプリンタなどの出力装置905と、ネットワークと接続するための通信制御装置906と、を備えた汎用的なコンピュータシステムを用いることができる。このコンピュータシステムにおいて、CPU901がメモリ902上にロードされた所定のプログラムを実行することにより、各装置の各機能が実現される。
例えば、端末1およびサーバ3A、3Bの各機能は、端末1用のプログラムの場合は端末1のCPU901が、そして、サーバ3A、3B用のプログラムの場合はサーバ3A、3BのCPU901が、それぞれ実行することにより実現される。なお、共用ディスク4は、サーバ1号機3Aおよびサーバ2号機3Bの外部記憶装置903である。また、入力装置904および出力装置905については、各装置が必要に応じて備えるものとする。
次に、サーバ1号機3Aおよびサーバ2号機3Bが、ともに正常に稼動している正常運用時(フェイルオーバ前)の処理について説明する。
図3は、正常運用時の処理を模式的に示した図である。なお、以下に述べる正常運用時の処理はサーバ1号機3Aを例として説明するが、サーバ2号機3Bの処理もサーバ1号機3Aの処理と同様である。また、正常運用時においては、1号機用ディスク4Aはサーバ1号機3Aからマウントされ、2号機用ディスク4Bはサーバ2号機3Bからマウントされている。
サーバ1号機3Aの業務処理部31は、負荷分散装置2を介して端末1の要求を受け付けて所定の業務処理を行い、データベースにアクセスする。すなわち、業務処理部31は、書き込み要求(write要求)、読み出し要求(read要求)などのアクセス要求を生成し、図示しないデータ管理部(DBMS:DataBase Management System)に送出する。データ管理部は、業務処理部から受け付けたアクセス要求に基づいて、データベースにデータを書き込み、または、データベースからデータを読み出す。
なお、業務処理部31は、データを書き込む場合は実テーブルである1号機用ログテーブル41Aに、また、データを読み出す場合は仮想テーブルであるビュー43Aにアクセスするものとする。
まず、データを書き込む場合の処理を説明する。サーバ1号機3Aの業務処理部31は、データ管理部を用いて業務処理の結果である更新データを1号機用ログテーブル41Aに書き込むとともに、当該更新データを送信キュー45Aに書き込む(S11)。
そして、MQ通信部35は、送信キュー45Aに書き込まれた更新データを、メッセージキューイング方式により2号機用ディスク4Bの受信キュー46Bに送信する(S12)。そして、サーバ2号機3Bの受信部32は、受信キュー46Bから更新データを取り出し(S13)、取り出した更新データを1号機用バックアップテーブル42Bに書き込む(S14)。
このように、1号機用ディスク4Aの1号機用ログテーブル41Aに書き込まれたデータは、メッセージキューイングにより、2号機用ディスク4Bの1号機用バックアップテーブル42Bに書き込まれる。すなわち、1号機用バックアップテーブル42Bには、1号機用ログテーブル41Aのデータと同じデータが格納される。
次に、データを読み出す場合(データを検索する場合)の処理を説明する。サーバ1号機3Aの業務処理部31は、データ管理部を用いて1号機用ディスク4Aのビュー43Aにアクセスし、所定のデータを読み出す(S21)。なお、正常運用時のビュー43Aは、1号機用ログテーブル41Aと、2号機用ディスク4Bの2号機用ログテーブル41Bと、を結合した仮想テーブルである。正常運用時のビュー43Aのビュー定義情報は、メモリまたは外部記憶装置にあらかじめ記憶されているものとする。
また、2号機用ディスク4Bの正常運用時のビュー43Bは、2号機用ログテーブル41Bと、1号機用ディスク4Aの1号機用ログテーブル41Aと、を結合した仮想テーブルである。このビュー43Bのビュー定義情報についても、メモリまたは外部記憶装置にあらかじめ記憶されているものとする。
業務処理部31がビュー43Aにアクセスすることより、データ管理部は、ビュー定義情報を参照し、実テーブルである1号機用ログテーブル41Aおよび2号機用ログテーブル41Bにアクセスする。そして、業務処理部31は、ビュー43A(すなわち、実テーブル41A、41Bに格納された全てのデータがマージされた仮想テーブル)の中から、所定のデータを読み出す。
なお、データ管理部は、ビュー43Aにアクセスする際に、サーバ2号機3Bにマウントされている2号機用ディスク4Bの2号機用ログテーブル41Bに対して、DBリンクなどの機能を用いてリモートアクセスする。
このように、データを読み出す際にビュー43Aにアクセスすることにより、業務処理部31は、1号機用ログテーブル41Aのデータだけでなく、サーバ2号機3Bが更新した2号機用ログテーブル41Bのデータを、取得することができる。また、データを読み出す際にビューにアクセスすることにより、サーバ2号機3Bが行った2号機用ログテーブル41Bに対する更新データを、タイムラグを発生させることなく、リアルタイムに取得することができる。
次に、いずれかのサーバに障害が発生し、フェイルオーバ処理を実行中の片寄せ運用時の処理について説明する。フェイルオーバ処理については後述する。
図4は、片寄せ運用時(フェイルオーバ中)の処理を模式的に示した図である。なお、図示する例では、サーバ2号機3Bに障害が発生した場合を示している。この場合、フェイルオーバ処理が完了するまで、正常なサーバ1号機3Aは、サーバ2号機3Bからマウントされている2号機用ディスク4Bにアクセスすることができない。そのため、サーバ1号機3Aと1号機用ディスク4Aに片寄せして、システムを運用する。
サーバ1号機3Aの業務処理部31は、負荷分散装置2を介して端末1から送信された要求を受け付け、所定の業務処理を行う。そして、業務処理部31は、データベースにアクセする。なお、サーバ2号機に障害が発生すると、負荷分散装置2は、端末1からの要求を全てサーバ1号機に送出するものとする。
データを書き込む場合、サーバ1号機3Aの業務処理部31は、正常運用時の書き込み処理と同様に、データ管理部を用いて1号機用ログテーブル41Aに更新データを書き込むとともに、更新データを送信キュー45Aに書き込む(S31)。また、サーバ2号機3Bの更新データが1号機用ディスク4Aの受信キュー46Aに受信されていた場合、サーバ1号機3Aの受信部32は、受信キュー46Aから更新データを取り出し(S32)、取り出した更新データを2号機用バックアップテーブル42Aに書き込む(S33)。
データを読み出す場合、サーバ1号機3Aの業務処理部31は、データ管理部を用いて1号機用ディスク4Aのビュー47Aにアクセスし、所定のデータを読み出す(S41)。なお、片寄せ運用時のビュー47Aは、1号機用ディスク4Aに格納された1号機用ログテーブル41Aおよび2号機用バックアップテーブル42Aを結合した仮想テーブルである。フェイルオーバ処理部34は、後述する処理により、正常運用時のビュー43Aのビュー定義情報を、上述のビュー47Aのビュー定義情報に変更するものとする。
業務処理部31がデータ管理部を用いてビュー47Aにアクセスすることより、データ管理部は、変更後のビュー定義情報を参照し、実テーブルである1号機用ログテーブル41Aおよび2号機用バックアップテーブル42Aにアクセスする。そして、業務処理部31は、ビュー47A(すなわち、実テーブル41A、42Aに格納された全てのデータがマージされた仮想テーブル)の中から、所定のデータを取得する。
片寄せ運用時において、データの書き込み処理については、サーバ1号機3A側で正常運用時と同様に行うことができる。また、データの読み出し処理については、正常運用時のビュー43Aから上述のビュー47Aに切り替えることにより、サーバ1号機3A側で、サーバ2号機3Bの更新データを取得することができる。これにより、フェイルオーバ中であっても、システムを停止することなく、端末に対するサービスを継続することができる。また、業務処理部31は、アクセスするビューが正常運用時のビュー43Aかフェイルオーバ中のビュー47Aかを意識することなく、所望のデータを取得することができる。
次に、フェイルオーバ処理が完了した後の処理について説明する。
図5は、フェイルオーバ後の処理を模式的に示した図である。なお、図示する例では、図4と同様にサーバ2号機3Bに障害が発生した場合を示している。フェイルオーバが完了したことにより、サーバ2号機3Bからマウントされていた2号機用ディスク4Bは、サーバ1号機3A上でマウントされ、サーバ1号機3Aから2号機用ディスク4Bへのアクセスが可能となる。
サーバ1号機3Aの業務処理部31は、負荷分散装置2を介して端末1から送信された要求を受け付け、所定の業務処理を行う。そして、業務処理部31は、データベースにアクセスする。データを書き込む場合、サーバ1号機3Aの業務処理部31は、正常運用時の書き込み処理と同様に、データ管理部を用いて更新データを1号機用ログテーブル41Aに書き込むとともに、更新データを送信キュー45Aに書き込む(S51)。
そして、MQ通信部35は、送信キュー45Aに書き込まれた更新データを、メッセージキューイング方式により2号機用ディスク4Bの受信キュー46Bに送信する(S52)。なお、送信キュー45Aに書き込まれた更新データには、フェイルオーバ中に書き込まれた更新データも含まれる。そして、フェイルオーバ処理により、サーバ1号機3Aに引き継がれたサーバ2号機3Bの受信部39は、受信キュー46Bから更新データを取り出し(S53)、取り出した更新データを1号機用バックアップテーブル42Bに書き込む(S54)。
また、データを読み出す場合、サーバ1号機3Aの業務処理部31は、データ管理部を用いてビュー43Aにアクセスし、所定のデータを読み出す(S61)。なお、フェイルオーバ後のビュー43Aは、正常運用時のビュー43Aと同じものである。すなわち、1号機用ログテーブル41Aと、2号機用ログテーブル41Bとを結合した仮想テーブルである。フェイルオーバ処理部34は、後述する処理により、フェイルオーバ中のビュー47Aのビュー定義情報を、正常運用時のビュー43Aのビュー定義情報に変更するものとする。
業務処理部31がデータ管理部を用いてビュー43Aにアクセスすることより、データ管理部は,変更後のビュー定義情報を参照し、実テーブルである1号機用ログテーブル41Aおよび2号機用ログテーブル41Bにアクセスする。そして、業務処理部31は、ビュー43A(すなわち、実テーブル41A、41Bに格納された全てのデータがマージされた仮想テーブル)の中から、所定のデータを取得する。
フェイルオーバ後では、データの書き込み処理およびデータの読み込み処理が、サーバ1号機3A側で正常運用時と同様に行うことができる。すなわち、システムを停止することなく、端末1に対するサービスを継続することができる。また、サーバ1号機3A側で、サーバ2号機3Bの受信部39を起動し、サーバ2号機3Bの受信処理を行うことにより、1号機用ログテーブル41Aと、1号機用バックアップテーブル42Bとデータの同期をとることができる。
次に、フェイルオーバ処理について説明する。
図6は、各サーバが行うフェイルオーバ処理のフローチャートである。なお、以下に述べるフェイルオーバ処理は、サーバ2号機3Bに障害が発生し、サーバ1号機3Aがサーバ2号機の処理およびリソースを引き継ぐ場合を例として説明する。
まず、サーバ1号機3Aの状態監視部33は、サーバ2号機3Bの状態監視部33とハートビートを送受信することにより、サーバ2号機3Bの状態を監視する。すなわち、状態監視部33は、ハートビートの応答がない場合、サーバ2号機3Bに障害が発生したものと判別する。サーバ2号機3Bの障害を検知した場合(S101:YES)、状態監視部33は、フェイルオーバ処理部34に、障害が発生したことを通知する。
そして、フェイルオーバ処理部34は、あらかじめ設定されていた正常運用時のビュー43Aを削除する(S102)。そして、フェイルオーバ処理部34は、フェイルオーバ中のビュー47Aを作成する(S103)。これにより、図4に示す片寄せ運用時の処理となる。
なお、ビューを削除する場合、例えば「DROP VEIW」のSQL文を用いることが考えられる。また、ビューを作成する場合、例えば、「CREATE VIEW」のSQL文を用いて、ビューの定義情報を設定することが考えられる。
そして、フェイルオーバ処理部34は、サーバ2号機3Bからデータを引き継ぐために、サーバ2号機3Bにマウントされている2号機用ディスク4Bを、サーバ1号機3Aにマウントする(S104)。そして、フェイルオーバ処理部34は、2号機用ディスク4Bに格納されているデータベース41B、42Bを起動する(S105)。
そして、フェイルオーバ処理部34は、S103で作成したフェイルオーバ中のビュー47Aを削除する(S106)。そして、フェイルオーバ処理部34は、正常運用時のビュー43Aを作成する(S107)。そして、フェイルオーバ処理部34は、サーバ2号機3Bで行っていた処理(アプリケーション)を、サーバ1号機3A上で起動する(S108)。本実施形態では、サーバ2号機3Bの受信部32の処理をサーバ1号機3A上で起動し、メッセージキューイング方式を用いて送信されるサーバ1号機3Aの更新データを、1号機用バックアップテーブル42Bに反映させる。これにより、図5に示すフェイルオーバ後の処理となる。
以上説明した本実施形態では、フェイルオーバ処理中であっても、システムを停止することなく、片寄せ運用により(図4参照)、端末に対するサービスを継続することができる。すなわち、データの書き込み処理については、正常なサーバで正常運用時と同様に行うことができ、データの読み出し処理については、正常運用時のビューからフェイルオーバ中のビューに切り替えることにより、正常なサーバ側で障害となったサーバの更新データを取得することができる。
また、本実施形態では、障害を検知した後、正常運用時のビューをフェイルオーバ時のビューに変更するだけで、瞬時に、片寄せ運用時の処理(図4参照)に切り替えることができる。また、本実施形態では、フェイルオーバ処理(図6参照)の完了後、フェイルオーバ時のビューを正常運用時のビューに変更する(戻す)だけで、瞬時に、フェイルオーバ後の処理(図5参照)に切り替えることができる。これにより、フェイルオーバ処理のリソースの引継ぎに時間を要する場合であっても、システムの稼動停止時間をより短縮し、より高い可用性を確保することができる。
なお、本発明は上記の実施形態に限定されるものではなく、その要旨の範囲内で数々の変形が可能である。
本発明の一実施形態が適用されたシステムの全体構成図である。 各装置のハードウェア構成例を示す図である。 通常運用時の処理を模式的に示す図である。 片寄せ運用時(フェイルオーバ中)の処理を模式的に示す図である。 フェイルオーバ後の処理を模式的に示す図である。 フェイルオーバ処理のフローチャートである。
符号の説明
1:端末、2:負荷分散装置、3A:サーバ1号機、3B:サーバ2号機、31:業務処理部、32:受信部、33:状態監視部、34:フェイルオーバ処理部、35:MQ通信部、4:共用ディスク、4A:1号機用ディスク、41A:1号機用ログテーブル、42A:2号機用バックアップテーブル、4B:2号機用ディスク、41B:2号機用ログテーブル、42B:1号機用バックアップテーブル

Claims (6)

  1. 複数のサーバを備えるクラスタシステムのフェイルオーバ方法であって、
    前記各サーバには、当該サーバが更新する自データベースと、他サーバが更新する他データベースのバックアップデータベースとが格納されたディスクがマウントされ、
    前記各サーバは、
    他サーバで発生した障害を検知する障害検知ステップと、
    データ検索時にアクセスするビューを、自データベースと他データベースとを結合した正常時ビューから、前記自データベースと前記バックアップデータベースとを結合したフェイルオーバ時ビューに切り替える切替ステップと、を行うこと
    を特徴とするフェイルオーバ方法。
  2. 請求項1記載のフェイルオーバ方法であって、
    前記他サーバにマウントされたディスクを、自サーバにマウントするマウントステップと、
    前記切替ステップにおいて切り替えたフェイルオーバ時ビューを、前記正常時ビューに戻す再切替ステップと、をさらに行うこと
    を特徴とするフェイルオーバ方法。
  3. 請求項1または請求項2記載のフェイルオーバ方法であって、
    前記自データベースに対する更新データを送信するとともに、前記他データベースに対する更新データを受信して前記バックアップデータベースに書き込む通信ステップと、をさらに行うこと
    を特徴とするフェイルオーバ方法。
  4. 請求項3記載のフェイルオーバ方法であって、
    前記通信ステップは、メッセージキューイング方式を用いて、更新データの送受信を行うこと
    を特徴とするフェイルオーバ方法。
  5. 複数のサーバを備えるクラスタシステムにおける、各サーバが実行するフェイルオーバプログラムであって、
    前記各サーバには、当該サーバが更新する自データベースと、他サーバが更新する他データベースのバックアップデータベースとが格納されたディスクがマウントされ、
    前記各サーバに、
    他サーバで発生した障害を検知する障害検知ステップと、
    データ検索時にアクセスするビューを、自データベースと他データベースとを結合した正常時ビューから、前記自データベースと前記バックアップデータベースとを結合したフェイルオーバ時ビューに切り替える切替ステップと、を実行させること
    を特徴とするフェイルオーバプログラム。
  6. 複数のサーバを備えるクラスタシステムであって、
    前記各サーバには、当該サーバが更新する自データベースと、他サーバが更新する他データベースのバックアップデータベースとが格納されたディスクがマウントされ、
    前記各サーバは、
    他サーバで発生した障害を検知する障害検知手段と、
    データ検索時にアクセスするビューを、自データベースと他データベースとを結合した正常時ビューから、前記自データベースと前記バックアップデータベースとを結合したフェイルオーバ時ビューに切り替えるフェイルオーバ手段と、を有すること
    を特徴とするクラスタシステム。
JP2005377016A 2005-12-28 2005-12-28 フェイルオーバ方法、フェイルオーバプログラム、および、クラスタシステム Expired - Fee Related JP4856949B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005377016A JP4856949B2 (ja) 2005-12-28 2005-12-28 フェイルオーバ方法、フェイルオーバプログラム、および、クラスタシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005377016A JP4856949B2 (ja) 2005-12-28 2005-12-28 フェイルオーバ方法、フェイルオーバプログラム、および、クラスタシステム

Publications (2)

Publication Number Publication Date
JP2007179310A true JP2007179310A (ja) 2007-07-12
JP4856949B2 JP4856949B2 (ja) 2012-01-18

Family

ID=38304432

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005377016A Expired - Fee Related JP4856949B2 (ja) 2005-12-28 2005-12-28 フェイルオーバ方法、フェイルオーバプログラム、および、クラスタシステム

Country Status (1)

Country Link
JP (1) JP4856949B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011501254A (ja) * 2007-10-15 2011-01-06 インターナショナル・ビジネス・マシーンズ・コーポレーション セッション・アフィニティを使用する分散環境においてフェイルオーバを処理する方法及びシステム
US8738961B2 (en) 2010-08-17 2014-05-27 International Business Machines Corporation High-availability computer cluster with failover support based on a resource map
JP2014191491A (ja) * 2013-03-26 2014-10-06 Japan Digital Laboratory Co Ltd 情報処理装置および情報処理システム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0981431A (ja) * 1995-09-19 1997-03-28 Fuji Facom Corp データベース処理システム及びデータベースの更新方法
JPH1196168A (ja) * 1997-09-17 1999-04-09 Hitachi Information Systems Ltd 並列検索/統計処理システムおよび並列検索/統計処理方法、ならびに該方法を実現するためのプログラムを記録した記録媒体
JP2001508900A (ja) * 1997-01-20 2001-07-03 テレフオンアクチーボラゲツト エル エム エリクソン(パブル) 分散データ処理システムにおけるデータの分配および複写
JP2003258997A (ja) * 2002-02-27 2003-09-12 Nippon Telegr & Teleph Corp <Ntt> サービス制御ノードシステムの予備方式
JP2004318744A (ja) * 2003-04-21 2004-11-11 Hitachi Ltd 高可用性を提供するデータベース処理方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0981431A (ja) * 1995-09-19 1997-03-28 Fuji Facom Corp データベース処理システム及びデータベースの更新方法
JP2001508900A (ja) * 1997-01-20 2001-07-03 テレフオンアクチーボラゲツト エル エム エリクソン(パブル) 分散データ処理システムにおけるデータの分配および複写
JPH1196168A (ja) * 1997-09-17 1999-04-09 Hitachi Information Systems Ltd 並列検索/統計処理システムおよび並列検索/統計処理方法、ならびに該方法を実現するためのプログラムを記録した記録媒体
JP2003258997A (ja) * 2002-02-27 2003-09-12 Nippon Telegr & Teleph Corp <Ntt> サービス制御ノードシステムの予備方式
JP2004318744A (ja) * 2003-04-21 2004-11-11 Hitachi Ltd 高可用性を提供するデータベース処理方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011501254A (ja) * 2007-10-15 2011-01-06 インターナショナル・ビジネス・マシーンズ・コーポレーション セッション・アフィニティを使用する分散環境においてフェイルオーバを処理する方法及びシステム
US8738961B2 (en) 2010-08-17 2014-05-27 International Business Machines Corporation High-availability computer cluster with failover support based on a resource map
JP2014191491A (ja) * 2013-03-26 2014-10-06 Japan Digital Laboratory Co Ltd 情報処理装置および情報処理システム

Also Published As

Publication number Publication date
JP4856949B2 (ja) 2012-01-18

Similar Documents

Publication Publication Date Title
KR100711396B1 (ko) 서버의 이중화 방법 및 이중화 서버시스템
CN110224871A (zh) 一种Redis集群的高可用方法及装置
CN100470494C (zh) 集群可用性管理方法和系统
US6996502B2 (en) Remote enterprise management of high availability systems
EP2281240B1 (en) Maintaining data integrity in data servers across data centers
US7996718B1 (en) Techniques for continuous data protection
US7899897B2 (en) System and program for dual agent processes and dual active server processes
US20050114285A1 (en) Data replication system and method
JP4998549B2 (ja) メモリミラー化制御プログラム、メモリミラー化制御方法およびメモリミラー化制御装置
US9798639B2 (en) Failover system and method replicating client message to backup server from primary server
JP4920248B2 (ja) サーバの障害回復方法及びデータベースシステム
US20160110438A1 (en) Data cube high availability
JP2015069655A (ja) プロセス制御システムおよび方法
US8683258B2 (en) Fast I/O failure detection and cluster wide failover
JP4881760B2 (ja) ログ管理装置、ログ管理方法、プログラム、及び記録媒体
JP4856949B2 (ja) フェイルオーバ方法、フェイルオーバプログラム、および、クラスタシステム
JP2005301436A (ja) クラスタシステムおよびクラスタシステムにおける障害回復方法
JP5839774B2 (ja) 計算機及び計算機管理方法並びに計算機管理プログラム
US10067841B2 (en) Facilitating n-way high availability storage services
KR20090123518A (ko) 실시간 데이터 복제 시스템
JP2012198651A (ja) クラスタシステム、仮想マシンサーバ、仮想マシンのフェイルオーバ方法、仮想マシンのフェイルオーバプログラム
US20190124145A1 (en) Method and apparatus for availability management
KR101696911B1 (ko) 분산 데이터 베이스 장치 및 그 장치에서의 스트림 데이터 처리 방법
JP2006058960A (ja) 冗長構成のサーバシステムにおける同期化方法及びシステム
US20120191645A1 (en) Information processing apparatus and database system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081007

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100826

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101116

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110114

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111011

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111031

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141104

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees