JP5544516B2 - 高可用サーバシステム、高可用サーバシステムの障害時復旧方法、および高可用サーバ - Google Patents

高可用サーバシステム、高可用サーバシステムの障害時復旧方法、および高可用サーバ Download PDF

Info

Publication number
JP5544516B2
JP5544516B2 JP2009264014A JP2009264014A JP5544516B2 JP 5544516 B2 JP5544516 B2 JP 5544516B2 JP 2009264014 A JP2009264014 A JP 2009264014A JP 2009264014 A JP2009264014 A JP 2009264014A JP 5544516 B2 JP5544516 B2 JP 5544516B2
Authority
JP
Japan
Prior art keywords
high availability
state
server
availability server
update time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009264014A
Other languages
English (en)
Other versions
JP2011108093A (ja
Inventor
豪生 西村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2009264014A priority Critical patent/JP5544516B2/ja
Publication of JP2011108093A publication Critical patent/JP2011108093A/ja
Application granted granted Critical
Publication of JP5544516B2 publication Critical patent/JP5544516B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Description

本発明は、高可用サーバシステム、高可用サーバシステムの障害時復旧方法、および高可用サーバに関する。
通信サービス等のライフラインサービスを提供するような、極めて高い高可用性が求められるサーバは、長期間無停止であることが望まれる。従来から、そのような高可用サーバを冗長構成とすることにより、あるサーバにおいて障害が発生した時にも、データの処理状態が同期されている他のサーバに処理を引き継ぐことにより、サービスを継続する。
また、従来通信網を構成する交換機における二重化構成では、現用系と待機系のデータの処理状態が専用ハードウェアによって常に同期されていたが、IP通信網における汎用サーバを用いた交換サーバは、ミドルウェアにより系間の状態同期、系切替を行うのが一般的である。
近年は、特にインターネットのサーバにおいて、ハードウェアリソース使用率向上の観点から、現用系・待機系の二重構成(ACT−SBY構成)ではなく、複数の現用系が並列に動作するN−ACT構成が注目されている。N−ACT構成では、ある現用系サーバAが持つデータの処理状態が他の現用系サーバBに冗長化、同期されており、現用系サーバAにおいて障害が発生した際には、現用系サーバBが処理を引き継ぐ(非特許文献1参照)。例えば、IP電話におけるデータ通信の各セッションの情報を、障害発生時には、他の現用系サーバに引き継ぎサービスを継続する。
そして、各冗長構成において、あるサーバAで障害が発生して処理がサーバBに引き継がれた後、さらにサーバBに障害が発生した場合(二重障害)、データの処理状態の冗長化がなされていないため、サービスを継続することができない。そこで、サーバAは復旧後にサーバBが保持しているデータの処理状態に関する情報(状態情報)を取得することにより冗長性を再び確保する。
Trivedi, K., et al., "Availability Modeling of SIP Protocol on IBM WebSphere", 14th IEEE Pacific Rim International Symposium on Dependable Computing (PRDC '08), Dec, 2008
前記した通り、あるサーバ(障害発生サーバ)で障害が発生して処理が他のサーバ(引継サーバ)に引き継がれた後、障害発生サーバは再起動後に引継サーバから状態情報を取得する。しかし、引継サーバは処理中であり、引継サーバの処理に影響を与えないように、状態同期処理は低優先度で実行されるため低速である。二重障害発生の確率を下げるためには、高速に状態の冗長性を確保する必要があり、この状態同期処理をより短時間で行う必要がある。
前記した課題を解決するために本発明がなされたのであり、本発明は、状態同期処理にかかる時間を短縮し、二重障害の確率を低減することができる、高可用サーバシステム、高可用サーバシステムの障害時復旧方法、および高可用サーバを提供することを目的とする。
前記した課題を解決するため、請求項1に記載の発明は、クライアントから通信ネットワークを介してサービスを提供するためのアクセスデータを受け付ける複数の高可用サーバ同士が、通信線を介して接続され冗長化される高可用サーバシステムであって、前記高可用サーバが、前記通信ネットワークを介してクライアントとの間で情報の送受信を行う通信手段と、自己の高可用サーバである第1の高可用サーバ以外の他の高可用サーバである第2の高可用サーバとの間で情報の入出力を行う入出力手段と、前記クライアントから受信した前記アクセスデータの処理状態を示す情報である状態情報およびその状態情報が更新される毎に記憶される時刻である更新時刻が格納される状態管理領域を備えるメモリと、前記メモリを仮想化するためのハイパーバイザー並びに仮想化された前記高可用サーバを制御するためのOSおよび前記クライアントへのサービスを提供するサービス処理部を備える制御手段と、を備え、前記第1の高可用サーバが、障害の発生により冗長性の復旧処理を行う障害発生サーバであり、前記第2の高可用サーバが、前記第1の高可用サーバの障害発生後に前記クライアントに対する処理を引き継いだ引継サーバである場合に、前記第1の高可用サーバの前記制御手段が、前記サービス処理部に含まれ、前記第1の高可用サーバの障害の復旧処理時に、自身の前記状態管理領域から障害発生前の最終の前記更新時刻の取得を要請する第1の状態管理部と、前記OSに含まれ、前記第1の状態管理部からの前記最終の更新時刻の取得要請を受け取り、前記ハイパーバイザーに引き渡す第1の状態アクセスハイパーコール制御部と、前記ハイパーバイザーに含まれ、前記第1の状態アクセスハイパーコール制御部から前記最終の更新時刻の取得要請を受け取り、自身の前記状態管理領域から前記最終の更新時刻を取得する第1の状態アクセス制御部と、前記サービス処理部に含まれ、前記第1の状態管理部の指示により、前記最終の更新時刻を含む更新状態情報要求メッセージを生成し、前記入出力手段を介して、前記第2の高可用サーバに送信する第1の同期制御部と、を備え、前記第1の状態アクセス制御部が、前記最終の更新時刻を取得し、前記第1の状態アクセスハイパーコール制御部に引き渡し、さらに、前記第1の状態アクセスハイパーコール制御部から前記最終の更新時刻を前記第1の状態管理部が取得して前記第2の高可用サーバに送信する指示を出し、前記第1の同期制御部が、前記第2の高可用サーバに前記更新状態情報要求メッセージを送信し、前記第2の高可用サーバの前記制御手段が、前記サービス処理部に含まれ、前記第1の高可用サーバから前記更新状態情報要求メッセージを受信する第2の同期制御部と、前記サービス処理部に含まれ、前記第2の同期制御部から前記更新状態情報要求メッセージを受け取り、前記更新状態情報要求メッセージに含まれる前記最終の更新時刻を用いて、前記最終の更新時刻以降に更新された状態情報を、前記第2の高可用サーバの前記状態管理領域から取得するように指示を出す第2の状態管理部と、前記OSに含まれ、前記最終の更新時刻以降に更新された状態情報の取得指示を前記ハイパーバイザーに引き渡す第2の状態アクセスハイパーコール制御部と、前記ハイパーバイザーに含まれ、前記第2の状態アクセスハイパーコール制御部からの前記最終の更新時刻以降に更新された状態情報の取得指示を受け付け、前記第2の高可用サーバの状態管理領域から、前記最終の更新時刻以降に更新された状態情報を取得する第2の状態アクセス制御部とを備え、前記第2の状態アクセス制御部が、前記最終の更新時刻以降に更新された状態情報を取得し、前記第2の状態アクセスハイパーコール制御部に引き渡し、さらに、前記第2の状態アクセスハイパーコール制御部から前記最終の更新時刻以降に更新された状態情報を前記第2の状態管理部が取得して、前記第2の同期制御部を介して、前記第1の高可用サーバへ送信し、前記第1の高可用サーバの前記制御手段が、前記第2の高可用サーバから受信した前記最終の更新時刻以降に更新された状態情報を用いて、自身の前記状態管理領域に記憶された状態情報を更新することを特徴とする高可用サーバシステムとした。
また、請求項2に記載の発明は、クライアントから通信ネットワークを介してサービスを提供するためのアクセスデータを受け付ける複数の高可用サーバ同士が、通信線を介して接続され冗長化される高可用サーバシステムの障害時復旧方法であって、前記高可用サーバが、前記通信ネットワークを介してクライアントとの間で情報の送受信を行う通信手段と、自己の高可用サーバである第1の高可用サーバ以外の他の高可用サーバである第2の高可用サーバとの間で情報の入出力を行う入出力手段と、前記クライアントから受信した前記アクセスデータの処理状態を示す情報である状態情報およびその状態情報が更新される毎に記憶される時刻である更新時刻が格納される状態管理領域を備えるメモリと、前記メモリを仮想化するためのハイパーバイザー並びに仮想化された前記高可用サーバを制御するためのOSおよび前記クライアントへのサービスを提供するサービス処理部を備える制御手段と、を備え、前記第1の高可用サーバが、障害の発生により冗長性の復旧処理を行う障害発生サーバであり、前記第2の高可用サーバが、前記第1の高可用サーバの障害発生後に前記クライアントに対する処理を引き継いだ引継サーバである場合に、前記第1の高可用サーバの前記制御手段が、第1の前記ハイパーバイザー、第1の前記OSおよび第1の前記サービス処理部を備え、前記第1のサービス処理部が、前記第1の高可用サーバの障害の復旧処理時に、自身の前記状態管理領域から障害発生前の最終の前記更新時刻の取得を前記第1のOSに要請し、前記第1のOSが、前記最終の更新時刻の取得要請を受け取り、前記第1のハイパーバイザーに引き渡し、前記第1のハイパーバイザーが、前記最終の更新時刻の取得要請を受け取り、自身の前記状態管理領域から前記最終の更新時刻を取得して、前記第1のOSに引き渡し、前記第1のサービス処理部が、前記第1のOSから前記最終の更新時刻を取得して、前記最終の更新時刻を含む更新状態情報要求メッセージを生成し、前記入出力手段を介して、前記第2の高可用サーバに送信し、前記第2の高可用サーバの前記制御手段が、第2の前記ハイパーバイザー、第2の前記OSおよび第2の前記サービス処理部を備え、前記第2のサービス処理部が、前記第1の高可用サーバから前記更新状態情報要求メッセージを受信し、前記更新状態情報要求メッセージに含まれる前記最終の更新時刻を用いて、前記最終の更新時刻以降に更新された状態情報を、前記第2の高可用サーバの前記状態管理領域から取得するように前記第2のOSに指示を出し、前記第2のOSが、前記最終の更新時刻以降に更新された状態情報の取得指示を前記第2のハイパーバイザーに引き渡し、前記第2のハイパーバイザーが、前記最終の更新時刻以降に更新された状態情報の取得指示を受け付け、前記第2の高可用サーバの状態管理領域から、前記最終の更新時刻以降に更新された状態情報を取得して、前記第2のOSに引き渡し、前記第2のサービス処理部が、前記最終の更新時刻以降に更新された状態情報を、前記第2のOSから取得して、前記第1の高可用サーバへ送信し、前記第1の高可用サーバの前記制御手段が、前記第2の高可用サーバから受信した前記最終の更新時刻以降に更新された状態情報を用いて、自身の前記状態管理領域に記憶された状態情報を更新することを特徴とする高可用サーバシステムの障害時復旧方法とした。
このようにすることで、障害が発生した第1の高可用サーバは、再起動を行い復旧処理を開始すると、ハイパーバイザーにより仮想化された自身のメモリ内の状態管理領域から障害発生前の状態情報の最終更新時刻を取得し、その最終更新時刻の情報を、引継サーバである第2の高可用サーバに送信する。第2の高可用サーバは、最終更新時刻以降に更新した状態情報を、第1の高可用サーバに送信する。第1の高可用サーバは、障害発生後に更新された状態情報を自身の状態管理領域に記憶させて状態情報を更新する。
よって、本発明によれば、障害が発生した高可用サーバは、障害が発生した後に更新された状態情報だけを、引継サーバである他の高可用サーバの状態管理領域から取得することができる。そのため、同期処理を再開させて、状態の冗長性を確保するまでの時間を短縮することができ、その結果、二重障害の確率を低減することができる。
また、このようにすることで、第1の高可用サーバの状態管理部は、OSに設けられた状態アクセスハイパーコール制御部を介して、ハイパーバイザーの状態アクセス制御部により、状態管理領域にアクセスして、障害発生前の最終の更新時刻を取得する。そして、状態管理部は、同期制御部に指示を出し、最終の更新時刻を第2の高可用サーバに送信することが可能となる。そして、第2の高可用サーバの状態管理部は、状態アクセスハイパーコール制御部を介して、ハイパーバイザーの状態アクセス制御部により、最終の更新時刻以降に更新された状態情報を取得し、同期制御部を介して、第1の高可用サーバに更新された状態情報を送信することが可能となる。
請求項に記載の発明は、請求項に記載の高可用サーバシステムに用いられる前記高可用サーバであって、前記高可用サーバの記憶手段に、前記高可用サーバが前記クライアントから受信した前記アクセスデータが、前記状態管理領域にアクセスする必要のある情報か否かを識別するための判別ポリシーが記憶され、前記ハイパーバイザーが、前記状態管理部から前記OSを介して前記アクセスデータを受け取ると、前記判別ポリシーに基づき、前記アクセスデータを前記状態情報として前記状態管理領域に格納すべきか否かを判定するアクセス判別処理部を備え、前記アクセス判別処理部が、前記アクセスデータを前記状態情報として格納すべきと判定した場合に、前記状態アクセス制御部に当該アクセスデータを引き渡し、前記状態アクセス制御部は、前記アクセスデータを用いて、前記状態管理領域にアクセスすることを特徴とする高可用サーバとした。
このように、ハイパーバイザーがアクセス判別処理部を備えることにより、状態管理部では受け取ったアクセスデータを状態情報として状態管理領域に格納すべきか判断する必要がない。よって、状態管理部やOSを、本システム専用に改良する必要をなくすことができる。また、判別ポリシーを、高可用サーバのサービスの追加や変更等に応じて容易に修正することが可能となる。
請求項に記載の発明は、前記状態管理部および前記同期制御部を、ミドルウェアとして機能させることを特徴とする請求項または請求項に記載の高可用サーバとした。
このようにすることで、クライアントからのアクセスデータを、ミドルウェアに設けられた状態管理部および同期制御部において処理することが可能となる。よって、クライアントにサービスを提供する処理については変更を加えることなく、本システムを実行することが可能となる。
本発明によれば、状態同期処理にかかる時間を短縮し、二重障害の確率を低減することができる、高可用サーバシステム、高可用サーバシステムの障害時復旧方法、および高可用サーバを提供することができる。
本実施形態に係る高可用サーバシステムの構成例を示す機能ブロック図である。 本実施形態に係る状態管理領域に記憶される状態情報の一例を示す図である。 本実施形態に係る高可用サーバシステムにおける同期準備処理の流れを示すフローチャートである。 本実施形態に係る高可用サーバシステムにおける平常時の状態情報の同期処理の流れを示すフローチャートである。 本実施形態に係る高可用サーバシステムにおける障害発生後の状態同期処理の流れを示すフローチャートである。 本実施形態の変形例1に係る高可用サーバを含む高可用サーバシステムの構成例を示す機能ブロック図である。 本実施形態の変形例2に係る高可用サーバを含む高可用サーバシステムの構成例を示す機能ブロック図である。
次に、本発明を実施するための形態(「実施形態」という)について、適宜図面を参照しながら詳細に説明する。
<実施形態>
図1は、本実施形態に係る高可用サーバシステム100の構成例を示す機能ブロック図である。
高可用サーバシステム100は、サーバに対しサービスの提供を要求するアクセスを行うクライアント6と、クライアント6に対しサービスを提供する仮想化された複数の高可用サーバ1(1a,1b)とが、ネットワーク5を介して接続されて構成される。この複数の高可用サーバ1(1a,1b)同士は、専用回線やネットワーク5等の通信線で結ばれ、情報の送受信を行うことができる。また、ネットワーク5は、例えばLAN(Local Area Network)やWAN(Wide Area Network)等の通信ネットワークである。
本実施形態に係る高可用サーバシステム100が実行する障害時復旧方法の概要を簡単に説明する。まず、高可用サーバ1(1a)に障害が発生すると、冗長化されている高可用サーバ1(1b)が、高可用サーバ1(1a)に代わって、クライアント6からの処理を引き継ぐ。そして、障害が発生した高可用サーバ1(1a)は、再起動を行い、仮想化された自身のメモリ部内の状態管理領域から障害発生前の状態情報の最終更新時刻を取得し、その最終更新時刻の情報を、引継サーバである高可用サーバ1(1b)に送信する。高可用サーバ1(1b)は、最終更新時刻以降に更新した状態情報を、自身のメモリ部内の状態管理領域から取得し、障害発生サーバである高可用サーバ1(1a)に送信する。高可用サーバ1(1a)は、障害発生後に更新された状態情報を自身の状態管理領域に記憶することで、状態の冗長性を再び確保する。
次に、本実施形態に係る高可用サーバシステム100の構成について、図1を参照して、具体的に説明する。
高可用サーバ1(1a,1b)は、コンピュータ装置であり、コンピュータ全体の処理を制御する制御手段、ハードディスク等の記憶手段、通信インタフェースを備える通信手段、入力インタフェースを備える入力手段および出力インタフェースを備える出力手段を含んで構成される(不図示)。この制御手段は、CPU(Central Processing Unit)とメモリによって構成され、記憶手段に記憶されたプログラムをCPUがメモリに展開することで実現される。この高可用サーバ1が備える各機能を機能ブロックとして図1に示している。この高可用サーバ1(1a)と高可用サーバ1(1b)とは、同一の構成(機能ブロック)を備えるものである。さらに、高可用サーバ1は、2つの筐体に限定されず、2以上の高可用サーバ1が通信線で接続されていてもよい。
高可用サーバ1は、ゲストVM(Virtual Machine)10と、ハイパーバイザー20と、ハードウェア30とを含んで構成される。このような構成により、後記において詳細に説明するように、高可用サーバ1は、ハードウェア30をハイパーバイザー20が仮想化して、ゲストVM10を動作させている。
ハードウェア30は、高可用サーバ1を構成するメモリ部31と不図示のその他のデバイス(例えば、CPU、ハードディスク等)とを含んで構成される。そして、本実施形態に係るメモリ部31は、例えばRAM(Random Access Memory)等の揮発性の記憶手段からなり、状態管理領域311と通常領域312とを備える。
状態管理領域311は、後記するサービス処理部11において冗長化が必要とされる状態情報を、メモリ部31上に生成や更新して保存しておく記憶領域である。ここで、状態情報とは、例えば、IP電話における音声データ等の通信において、各通信のセッションの状態を状態情報として記憶した情報である。
図2は、本実施形態に係る状態管理領域311に記憶される状態情報の一例を示す図である。図2に示す状態情報は、IP電話を用いた音声データ等の通信における、各通信のセッション状態情報を格納したテーブルである。この例の場合、状態情報には、各セッションを一意に識別する「セッションID」をキーとし、「状態」、「開始時刻」、「参加者ID」等のセッション固有の情報が記憶されるほか、その状態情報が最後に更新された時刻である「更新時刻」が記憶される。本状態情報は、クライアントによる電話発呼要求によって生成され、サービス提供中に失われると、転送・切断等の確立中のセッションに対する操作を行うことができなくなるだけでなく、時間課金も行うことが不可となるため、冗長化が必要である。
図1に戻り、通常領域312は、メモリ部31に記憶される情報のうち、冗長化が必要でない情報(例えば、CPUへのアクセスやプログラムの制御に関する一時的に保存が必要な情報等)を保存しておく領域である。
本実施形態に係る高可用サーバ1は、このように、冗長化が必要な状態情報が記憶される状態管理領域311と、冗長化が必要でない情報が記憶される通常領域312と、を分けて管理することにより、障害復旧時に必要な状態情報を他の高可用サーバ1の状態管理領域311から取得することが可能となる(詳細は、後記する図5参照)。
次に、ゲストVM10は、高可用サーバ1の全体の制御を司り、システムの基本動作を司るOS(オペレーティングシステム)12と、クライアント6へのサービスを提供するサービス処理部11とを備える。
そして、このサービス処理部11は、サービス提供部111、状態管理部112、および同期制御部113を含んで構成される。
サービス提供部111は、クライアント6からのアクセスを受け付け、高可用サーバ1が備える不図示の記憶手段等に記憶された情報を用いてサービスを提供する。
状態管理部112は、冗長化が必要な状態情報の生成や管理等を行う。
具体的には、状態管理部112は、サービス提供部111がクライアント6からサービスを受け付けると、OS12に対して、状態管理領域311における記憶領域の確保依頼や、状態管理領域311へのアクセス依頼を行う。また、状態管理部112は、他の高可用サーバ1と同期させるため、同期制御部113に指示を出し、同期に関する情報を、他の高可用サーバ1に送信させる。また、状態管理部112は、ゲストVM10に障害が発生し、高可用サーバ1(1a)が再起動されたときに、自身の高可用サーバ1(1a)の障害発生時点の状態管理領域311の最終更新時刻を取得し、同期制御部113を介して、他の高可用サーバ1(1b)へ送信し、最終更新時刻以降に更新された状態情報を、他の高可用サーバ1(1b)から取得する。
同期制御部113は、状態管理部112からの指示に基づき、他の高可用サーバ1(1b)と通信線を介して通信を行い、状態情報を同期させることにより、状態情報の冗長性を確保する。
具体的には、同期制御部113は、状態管理部112から、同期指示を受けると、他の高可用サーバ1(1b)の状態管理領域311の記憶領域の確保を要求する同期要求メッセージを生成し、他の高可用サーバ1(1b)へ送信する。また、同期制御部113は、状態管理部112を介して取得した状態情報を他の高可用サーバ1(1b)に送信し、同期処理を実行させる。さらに、同期制御部113は、障害発生をした再起動後に、状態管理部112から、状態情報の最終更新時刻の情報を受け取ると、その最終更新時刻を含んだ更新状態情報要求メッセージを生成し、他の高可用サーバ1(1b)に送信する。そして、同期制御部113は、他の高可用サーバ1(1b)から更新された状態情報を受信し、状態管理部112へ引き渡す。
次に、OS12は、高可用サーバ1全体の処理の制御を司り、状態アクセスハイパーコール制御部121、および通常ハイパーコール制御部122を含んで構成される。
状態アクセスハイパーコール制御部121は、状態管理部112から、OS12に対し、メモリ部31内の状態管理領域311へのアクセスの依頼を受け取ると、状態管理領域311へアクセスするためのハイパーバイザーコール(以下、「状態アクセスハイパーコール」とよぶ)を実行し、ハイパーバイザー20へ指示を出す。
通常ハイパーコール制御部122は、状態管理部112から、OS12に対し、通常領域312へのアクセスの依頼を受け取ると、通常領域312へアクセスするための通常のハイパーコールを実行し、ハイパーバイザー20へ指示を出す。なお、ここで通常のハイパーコールとは、状態管理領域311以外にアクセスする情報についてのハイパーコールを意味する。
次に、ハイパーバイザー20は、OS12からの指示を受け、OS12の代わりに、ハードウェア30に対する処理を実行する。そして、このハイパーバイザー20は、状態アクセス制御部21および仮想化制御部22を含んで構成される。
状態アクセス制御部21は、状態アクセスハイパーコール制御部121から状態アクセスハイパーコールを受け取ると、メモリ部31内の状態管理領域311にアクセスし、状態管理領域311に記憶された状態情報を取得する。また、状態アクセス制御部21は、自身が状態情報を取得した時点の時刻を更新時刻として、状態管理領域311に記憶する。また、障害の発生した他の高可用サーバ1から、最終更新時刻の情報を含んだ更新状態情報要求メッセージを受け取ると、その最終更新時刻以降に更新された状態情報を状態管理領域311から取得し、OS12の状態アクセス制御部21へ引き渡す。
仮想化制御部22は、冗長化が必要な状態管理領域311に記憶される状態情報以外の情報について、通常ハイパーコール制御部122から通常のハイパーコールを受け取り、メモリ部31の通常領域312へのアクセスを行う。また、仮想化制御部22は、ハードウェア30内のメモリ部31以外のCPUやハードディスク等へのアクセス処理を行う。
このように、ハードウェア30をハイパーバイザー20により仮想化することで、ゲストVM10に障害が発生した場合でも、メモリ部31内の状態管理領域311に記憶された状態情報を保持したまま、サービス処理部11およびOS12を再起動させることができる。
<高可用サーバシステムの障害時復旧方法>
次に、本実施形態に係る高可用サーバシステム100の障害時復旧方法について、図1を参照しつつ、図3〜図5を用いて詳細に説明する。なお、本実施形態に係る高可用サーバシステム100においては、高可用サーバ1(1a)が障害の発生した障害発生サーバであり、高可用サーバ1(1b)が障害発生後に処理を引き継いだ引継サーバであるとして説明する。また、引継サーバである高可用サーバ1(1b)の各機能部については、高可用サーバ1(1a)の各機能部と区別するため符号「b」を付して説明する。
<平常時の状態情報保存処理>
まず、本実施形態に係る高可用サーバシステム100の平常時の状態情報保存処理について、図1を参照しつつ、図3および図4を用いて詳細に説明する。
<同期準備処理>
図3は、本実施形態に係る高可用サーバシステム100における同期準備処理の流れを示すフローチャートである。高可用サーバ1(1a,1b)は、クライアント6からサービスの提供のためのアクセスを受け付けると、まず、状態情報の同期処理を行う準備として、状態管理領域311に記憶領域の確保を行う。
図3に示すように、高可用サーバ1(1a)のサービス提供部111は、ネットワーク5経由で、クライアント6からのサービスを提供するためのアクセスを受け付ける(ステップS101)。
次に、状態管理部112は、サービス提供部111にクライアント6からのアクセスがあったことを契機として、そのアクセスがメモリ部31の状態管理領域311へのアクセスであると判定した場合に、OS12に対して、メモリ部31の状態管理領域311に記憶領域の確保依頼を行う(ステップS102)。
ここで、OS12が、メモリ部31にアクセスしようとすると、仮想化されているため、ハイパーバイザー20がその処理を代行する。よって、OS12は、ハイパーバイザー20に対して、状態管理領域311に記憶領域の確保依頼を行う(ステップS103)。そして、確保依頼を受けたハイパーバイザー20が、メモリ部31の状態管理領域311において記憶領域の確保を行う(ステップS104)。
具体的には、状態管理部112から記憶領域の確保依頼を受け付けたOS12の状態アクセスハイパーコール制御部121が、状態管理領域311へアクセスするためのハイパーバイザーコール(状態アクセスハイパーコール)を実行することで、ハイパーバイザー20に状態管理領域311へのアクセスを依頼する。そして、状態アクセスハイパーコールを受け付けたハイパーバイザー20の状態アクセス制御部21は、メモリ部31内の状態管理領域311に記憶領域を確保する。
そして、ハイパーバイザー20は、メモリ部31内の状態管理領域311に記憶領域を確保したことを、OS12を介して、状態管理部112に通知する(ステップS105)。具体的には、ハイパーバイザー20の状態アクセス制御部21が、状態管理領域311に記憶領域を確保したことを、OS12の状態アクセスハイパーコール制御部121経由で、状態管理部112に通知する。
次に、状態管理部112は、同期制御部113に対し、確保された記憶領域の状態を、他の高可用サーバ1(1b)が同期するように指示を出す(ステップS106)。
続いて、同期制御部113は、状態管理部112の指示に基づき、同期要求メッセージを生成し、不図示の出力手段または通信手段を介して、他の高可用サーバ1(1b)に同期要求メッセージを送信する(ステップS107)。
そして、他の高可用サーバ1(1b)の同期制御部113bは、同期要求メッセージを、不図示の入力手段または通信手段を介して受信し(ステップS108)、自己の状態管理部112bに引き渡す。
次に、他の高可用サーバ1(1b)の状態管理部112bは、受け取った同期要求メッセージに基づき、同期要求処理を実行する(ステップS109)。
具体的には、他の高可用サーバ1(1b)の状態管理部112bは、高可用サーバ1(1a)が行ったステップS102〜S104と同様の処理手順で、OS12bを介して、ハイパーバイザー20bに状態管理領域311bの記録領域の確保を依頼する。そして、ハイパーバイザー20bの状態アクセス制御部21bが、メモリ部31b内の状態管理領域311bに記憶領域を確保する。
そして、高可用サーバ1(1b)の状態管理部112bは、ハイパーバイザー20bから、状態管理領域311bに記憶領域が確保されたことの通知を受けると、同期要求処理が完了したこと示す同期応答メッセージを生成して、高可用サーバ1(1a)に送信する(ステップS110)。
続いて、高可用サーバ1(1a)の状態管理部112が、同期制御部113を介して、高可用サーバ1(1b)から同期応答メッセージを受信することで(ステップS111)、高可用サーバ1(1a)と高可用サーバ1(1b)とを同期させる準備を終える。
<平常時の状態情報の同期処理>
次に、平常時の状態情報の同期処理について説明する。
図4は、本実施形態に係る高可用サーバシステム100における平常時の状態情報の同期処理の流れを示すフローチャートである。
まず、クライアント6が、高可用サーバ1(1a)のサービス提供部111に、サービスを要求すると(ステップS201)、サービス提供部111は、そのサービスを提供することにより変更される新たな状態(状態情報)を状態管理部112に問い合わせる(ステップS202)。
そして、状態管理部112は、前記した図3のステップS103の処理と同様に、OS12(状態アクセスハイパーコール制御部121)に対して、メモリ部31内の状態管理領域311へのアクセス要求を行う(ステップS203)。このOS12の状態管理領域311へのアクセス要求は、ハイパーバイザー20によって代行されるため、OS12(状態アクセスハイパーコール制御部121)は、ハイパーバイザー20の状態アクセス制御部21に対して、状態管理領域311へのアクセス要求を行う(ステップS204)。
続いて、ハイパーバイザー20の状態アクセス制御部21は、状態管理領域311から該当するサービスで特定される新たな状態情報を取得する(ステップS205)。このとき、ハイパーバイザー20の状態アクセス制御部21は、新たな状態情報を取得した時刻(状態情報の更新時刻)を、状態管理領域311内に記憶しておく(ステップS206)。
次に、ハイパーバイザー20の状態アクセス制御部21は、取得した新たな状態情報を、OS12(状態アクセスハイパーコール制御部121)を介して、状態管理部112に引き渡す(ステップS207)。そして、状態管理領域311からの新たな状態情報を受け取った状態管理部112は、同期制御部113を介して、新たな状態情報を他の高可用サーバ1(1b)に送信する(ステップS208)。
そして、他の高可用サーバ1(1b)の同期制御部113bは、新たな状態情報を受信し(ステップS209)、状態管理部112bに引き渡す。
続いて、他の高可用サーバ1(1b)の状態管理部112bは、受け取った新たな状態情報に基づき、同期処理を実行する(ステップS210)。
具体的には、他の高可用サーバ1(1b)の状態管理部112bは、OS12b(状態アクセスハイパーコール制御部121b)を介して、ハイパーバイザー20b(状態アクセス制御部21b)へ新たな状態情報を送る。そして、ハイパーバイザー20bの状態アクセス制御部21bが、メモリ部31b内の状態管理領域311bを新たな状態情報に基づき更新する。次に、ハイパーバイザー20bの状態アクセス制御部21bは、状態管理領域311bが新たな状態情報に基づき更新されたことを、OS12b(状態アクセスハイパーコール制御部121b)を介して、状態管理部112bへ通知する。
次に、高可用サーバ1(1b)の状態管理部112bが、ハイパーバイザー20bから、状態管理領域311bの状態情報が更新されたことの通知を受けると、同期制御部113bが、同期処理完了メッセージを生成して、高可用サーバ1(1a)に送信する(ステップS211)。
そして、高可用サーバ1(1a)の状態管理部112が、同期制御部113を介して、高可用サーバ1(1b)から同期処理完了メッセージを受信し(ステップS212)、平常時の状態情報の同期処理を終える。なお、高可用サーバ1(1a)のサービス提供部111は、この同期処理を実行した後に、クライアント6に対して、サービスの提供を行う。
このような処理を常時行うことによって、ある時点で高可用サーバ1(1a)のゲストVM10が障害によって停止した場合でも、メモリ部31の状態管理領域311の状態情報が高可用サーバ1(1b)に同期されているため冗長性が確保され、クライアント6は高可用サーバ1(1a)ではなく、状態を引き継いだ高可用サーバ1(1b)に接続することでサービスを継続して利用することができる。
<障害発生後の状態同期処理>
次に、高可用サーバシステム100が備える高可用サーバ1(1a)に障害が発生した後の、状態同期処理について説明する。ここでは、高可用サーバ1(1a)のゲストVM10において、障害が発生したものとして説明する。
図5は、本実施形態に係る高可用サーバシステム100における障害発生後の状態同期処理の流れを示すフローチャートである。
まず、高可用サーバ1(1a)のゲストVM10は、障害発生後にシステムの復旧させるため、OS12とサービス処理部11とを再起動する(ステップS301)。
次に、状態管理部112は、再起動後、自サーバが管理している状態情報を把握するため、OS12(状態アクセスハイパーコール制御部121)に対して、メモリ部31内の状態管理領域311へのアクセスを依頼する(ステップS302)。このOS12の状態管理領域311へのアクセスは、ハイパーバイザー20によって代行されるため、OS12(状態アクセスハイパーコール制御部121)は、ハイパーバイザー20の状態アクセス制御部21に対して、状態管理領域311へのアクセスを依頼する(ステップS303)。
続いて、ハイパーバイザー20の状態アクセス制御部21は、状態管理領域311にアクセスし、状態情報の最終更新時刻の情報を取得する(ステップS304)。
そして、ハイパーバイザー20の状態アクセス制御部21は、取得した状態情報の最終更新時刻の情報を、OS12(状態アクセスハイパーコール制御部121)を介して、状態管理部112へ引き渡す(ステップS305)。
次に、状態管理部112は、状態情報の最終更新時刻の情報を同期制御部113に引き渡し、同期制御部113は、その最終更新時刻の情報を含んだ更新状態情報要求メッセージを生成し、他の高可用サーバ1(1b)に送信する(ステップS306)。
他の高可用サーバ1(1b)の同期制御部113bは、更新状態情報要求メッセージを受信し(ステップS307)、状態管理部112bに引き渡す。
続いて、他の高可用サーバ1(1b)の状態管理部112bは、受け取った更新状態情報要求メッセージを用いて、更新状態情報取得処理を実行する(ステップS308)。
具体的には、他の高可用サーバ1(1b)の状態管理部112bは、OS12b(状態アクセスハイパーコール制御部121b)を介して、ハイパーバイザー20bに状態情報の最終更新時刻の情報を渡す。そして、ハイパーバイザー20bの状態アクセス制御部21bが、状態情報の最終更新時刻以降に、更新された状態情報(更新状態情報)を、状態管理領域311bにアクセスすることにより取得する。そして、ハイパーバイザー20bの状態アクセス制御部21bは、取得した更新状態情報を、OS12b(状態アクセスハイパーコール制御部121b)を介して、状態管理部112bへ渡す。
そして、状態管理部112bは、受け取った更新状態情報を、同期制御部113bを介して、高可用サーバ1(1b)に送信する(ステップS309)。
次に、高可用サーバ1(1a)の状態管理部112が、同期制御部113を介して、更新状態情報を受信する(ステップS310)。そして、状態管理部112が、その更新状態情報を用いて、OS12およびハイパーバイザー20を介して、状態管理領域311を更新する(ステップS311)。
このような状態同期処理を行うことにより、高可用サーバ1(1a)は、自身で障害が発生した後に更新された状態情報だけを、引継サーバである高可用サーバ1(1b)の状態管理領域311bから取得することができる。そのため、同期処理を再開させて、状態の冗長性を確保するまでの時間を短縮することができ、その結果、二重障害の確率を低減することができる。
<高可用サーバ1の変形例1>
次に、本実施形態に係る高可用サーバ1の変形例である高可用サーバ2について説明する。本実施形態に係る高可用サーバ1(図1参照)においては、メモリ部31内の状態管理領域311または通常領域312のどちらにアクセスするかの振り分けを、状態管理部112が行っていた。それに対して、本実施形態の変形例1に係る高可用サーバ2においては、ハイパーバイザー20が、状態管理領域311へのアクセスか、通常領域312へのアクセスかの振り分けを行うことを特徴とする。
図6は、本実施形態の変形例1に係る高可用サーバ2を含む高可用サーバシステム100の構成例を示す機能ブロック図である。
図6に示すように、本実施形態の変形例1に係る高可用サーバ2は、図1に示した高可用サーバ1に比べて、OS12内に状態アクセスハイパーコール制御部121および通常ハイパーコール制御部122が設けられていない。一方、本実施形態の変形例1に係る高可用サーバ2は、ハイパーバイザー20内に、新たにアクセス判別処理部23が設けられ、不図示の記憶手段内に判別ポリシーが記憶される。
この判別ポリシーには、OS12を介して取得した情報(アクセスデータ)について、状態管理領域311にアクセスさせて状態情報として記憶すべき情報か否かを判別するための条件が設定される。例えば、IP電話等の回線制御のサービスにおいては、セッションデータだと判別すると、状態管理領域311へアクセスし記憶や更新がなされるように、セッションデータを判別するポリシーが記載される。この判別ポリシーは、サービス処理部11の内容に応じて書き換えることが可能である。
また、アクセス判別処理部23は、状態管理部112からOS12を介して、データのアクセスを受け付けると、判別ポリシーに記憶された判別条件に基づいて、そのデータアクセスが、冗長化が必要な状態管理領域311の状態情報にアクセスすべきデータなのか、冗長化が必要ない通常領域312に関するデータなのかを判別する。
このように、ハイパーバイザー20内に、アクセス判別処理部23を備えることで、高可用サーバ2は、状態管理部112からOS12を介して、データアクセスを受け付けると、アクセス判別処理部23が判別ポリシーに記載された判別条件に基づき、そのデータのアクセス先を状態管理領域311にするか通常領域312にするかを判別する。そして、アクセス判別処理部23が、状態管理領域311にアクセスすべきと判別した場合は、そのデータを状態アクセス制御部21に渡し、状態管理領域311での処理を実行する。一方、アクセス判別処理部23が、通常領域312にアクセスすべきと判別した場合には、そのデータを仮想化制御部22に渡し、通常領域312での処理を実行する。
なお、本実施形態の変形例1に係る高可用サーバ2を含む高可用サーバシステム100の障害時復旧方法の全体の処理の流れは、状態管理部112による状態管理領域311へのアクセス方法が変更される以外は、図3〜図5に示した各処理の流れと同じものである。
このようにすることにより、本実施形態に係る高可用サーバ1に比べ、本実施形態の変形例1に係る高可用サーバ2は、OS12やサービス処理部11を、本システム専用に改良する必要がない。また、判別ポリシーを該当するサービス処理部11の追加や変更等に応じて容易に修正することが可能となる。
<高可用サーバ1の変形例2>
次に、本実施形態に係る高可用サーバ1の変形例2である高可用サーバ3について説明する。本実施形態の変形例2に係る高可用サーバ3は、サービス処理部11とOS12との間に、ミドルウェア13を備えることを特徴とする。
図7は、本実施形態の変形例2に係る高可用サーバ3を含む高可用サーバシステム100の構成例を示す機能ブロック図である。
本実施形態に係る高可用サーバ1においては、サービス処理部11内に状態管理部112および同期制御部113を備える構成とした(図1参照)。それに対して、本実施形態の変形例2に係る高可用サーバ3においては、図7に示すように、サービス処理部11とOS12との間に、ミドルウェア13を設け、そのミドルウェア13の中に、状態管理部112、同期制御部113、および状態管理標準API(Application Program Interface)131を備える構成とした。ここで、状態管理標準API131は、サービス提供部111が受け付けたデータアクセスをミドルウェア13に設けられた、状態管理部112および同期制御部113へと引き渡すためのプログラムインタフェースである。
このようにすることで、サービス処理部11のサービス提供部111へのクライアント6からのアクセスを、ミドルウェア13の状態管理標準API131を経由して状態管理部112へ渡し、状態管理部112が、OS12およびハイパーバイザー20を介して、状態管理領域311へアクセスすることができる。
本実施形態の変形例2に係る高可用サーバ3によれば、サービス処理部11に改変を加えることなく、本実施形態にかかる高可用サーバシステム100上で動作させることが可能となる。
なお、本実施形態の変形例2に係る高可用サーバ3を含む高可用サーバシステム100の障害時復旧方法の全体の処理の流れは、状態管理部112による状態管理領域311へのアクセス方法が変更される以外は、図3〜図5に示した各処理の流れと同じものである。
また、本実施形態に係る変形例2に係る高可用サーバ3のミドルウェア13を、本実施形態の変形例1に係る高可用サーバ2(図6参照)に適用して、サービス処理部11とOS12との間にミドルウェア13を設けて、データの処理をさせるようにしてもよい。
1,2,3 高可用サーバ
5 ネットワーク
6 クライアント
10 ゲストVM
11 サービス処理部
12 OS
13 ミドルウェア
20 ハイパーバイザー
21 状態アクセス制御部
22 仮想化制御部
23 アクセス判別処理部
30 ハードウェア
31 メモリ部
100 高可用サーバシステム
111 サービス提供部
112 状態管理部
113 同期制御部
121 状態アクセスハイパーコール制御部
122 通常ハイパーコール制御部
131 状態管理標準API
311 状態管理領域
312 通常領域

Claims (4)

  1. クライアントから通信ネットワークを介してサービスを提供するためのアクセスデータを受け付ける複数の高可用サーバ同士が、通信線を介して接続され冗長化される高可用サーバシステムであって、
    前記高可用サーバは、
    前記通信ネットワークを介してクライアントとの間で情報の送受信を行う通信手段と、自己の高可用サーバである第1の高可用サーバ以外の他の高可用サーバである第2の高可用サーバとの間で情報の入出力を行う入出力手段と、前記クライアントから受信した前記アクセスデータの処理状態を示す情報である状態情報およびその状態情報が更新される毎に記憶される時刻である更新時刻が格納される状態管理領域を備えるメモリと、前記メモリを仮想化するためのハイパーバイザー並びに仮想化された前記高可用サーバを制御するためのOSおよび前記クライアントへのサービスを提供するサービス処理部を備える制御手段と、を備え、
    前記第1の高可用サーバが、障害の発生により冗長性の復旧処理を行う障害発生サーバであり、前記第2の高可用サーバが、前記第1の高可用サーバの障害発生後に前記クライアントに対する処理を引き継いだ引継サーバである場合に、
    前記第1の高可用サーバの前記制御手段は、
    前記サービス処理部に含まれ、前記第1の高可用サーバの障害の復旧処理時に、自身の前記状態管理領域から障害発生前の最終の前記更新時刻の取得を要請する第1の状態管理部と、
    前記OSに含まれ、前記第1の状態管理部からの前記最終の更新時刻の取得要請を受け取り、前記ハイパーバイザーに引き渡す第1の状態アクセスハイパーコール制御部と、
    前記ハイパーバイザーに含まれ、前記第1の状態アクセスハイパーコール制御部から前記最終の更新時刻の取得要請を受け取り、自身の前記状態管理領域から前記最終の更新時刻を取得する第1の状態アクセス制御部と、
    前記サービス処理部に含まれ、前記第1の状態管理部の指示により、前記最終の更新時刻を含む更新状態情報要求メッセージを生成し、前記入出力手段を介して、前記第2の高可用サーバに送信する第1の同期制御部と、を備え、
    前記第1の状態アクセス制御部が、前記最終の更新時刻を取得し、前記第1の状態アクセスハイパーコール制御部に引き渡し、
    さらに、前記第1の状態アクセスハイパーコール制御部から前記最終の更新時刻を前記第1の状態管理部が取得して前記第2の高可用サーバに送信する指示を出し、
    前記第1の同期制御部が、前記第2の高可用サーバに前記更新状態情報要求メッセージを送信し、
    前記第2の高可用サーバの前記制御手段は、
    前記サービス処理部に含まれ、前記第1の高可用サーバから前記更新状態情報要求メッセージを受信する第2の同期制御部と、
    前記サービス処理部に含まれ、前記第2の同期制御部から前記更新状態情報要求メッセージを受け取り、前記更新状態情報要求メッセージに含まれる前記最終の更新時刻を用いて、前記最終の更新時刻以降に更新された状態情報を、前記第2の高可用サーバの前記状態管理領域から取得するように指示を出す第2の状態管理部と、
    前記OSに含まれ、前記最終の更新時刻以降に更新された状態情報の取得指示を前記ハイパーバイザーに引き渡す第2の状態アクセスハイパーコール制御部と、
    前記ハイパーバイザーに含まれ、前記第2の状態アクセスハイパーコール制御部からの前記最終の更新時刻以降に更新された状態情報の取得指示を受け付け、前記第2の高可用サーバの状態管理領域から、前記最終の更新時刻以降に更新された状態情報を取得する第2の状態アクセス制御部とを備え、
    前記第2の状態アクセス制御部が、前記最終の更新時刻以降に更新された状態情報を取得し、前記第2の状態アクセスハイパーコール制御部に引き渡し、
    さらに、前記第2の状態アクセスハイパーコール制御部から前記最終の更新時刻以降に更新された状態情報を前記第2の状態管理部が取得して、
    前記第2の同期制御部を介して、前記第1の高可用サーバへ送信し、
    前記第1の高可用サーバの前記制御手段は、
    前記第2の高可用サーバから受信した前記最終の更新時刻以降に更新された状態情報を用いて、自身の前記状態管理領域に記憶された状態情報を更新すること
    を特徴とする高可用サーバシステム。
  2. クライアントから通信ネットワークを介してサービスを提供するためのアクセスデータを受け付ける複数の高可用サーバ同士が、通信線を介して接続され冗長化される高可用サーバシステムの障害時復旧方法であって、
    前記高可用サーバは、
    前記通信ネットワークを介してクライアントとの間で情報の送受信を行う通信手段と、自己の高可用サーバである第1の高可用サーバ以外の他の高可用サーバである第2の高可用サーバとの間で情報の入出力を行う入出力手段と、前記クライアントから受信した前記アクセスデータの処理状態を示す情報である状態情報およびその状態情報が更新される毎に記憶される時刻である更新時刻が格納される状態管理領域を備えるメモリと、前記メモリを仮想化するためのハイパーバイザー並びに仮想化された前記高可用サーバを制御するためのOSおよび前記クライアントへのサービスを提供するサービス処理部を備える制御手段と、を備え、
    前記第1の高可用サーバが、障害の発生により冗長性の復旧処理を行う障害発生サーバであり、前記第2の高可用サーバが、前記第1の高可用サーバの障害発生後に前記クライアントに対する処理を引き継いだ引継サーバである場合に、
    前記第1の高可用サーバの前記制御手段は、第1の前記ハイパーバイザー、第1の前記OSおよび第1の前記サービス処理部を備え、
    前記第1のサービス処理部が、前記第1の高可用サーバの障害の復旧処理時に、自身の前記状態管理領域から障害発生前の最終の前記更新時刻の取得を前記第1のOSに要請し、
    前記第1のOSが、前記最終の更新時刻の取得要請を受け取り、前記第1のハイパーバイザーに引き渡し、
    前記第1のハイパーバイザーが、前記最終の更新時刻の取得要請を受け取り、自身の前記状態管理領域から前記最終の更新時刻を取得して、前記第1のOSに引き渡し、
    前記第1のサービス処理部が、前記第1のOSから前記最終の更新時刻を取得して、前記最終の更新時刻を含む更新状態情報要求メッセージを生成し、前記入出力手段を介して、前記第2の高可用サーバに送信し、
    前記第2の高可用サーバの前記制御手段は、第2の前記ハイパーバイザー、第2の前記OSおよび第2の前記サービス処理部を備え、
    前記第2のサービス処理部が、前記第1の高可用サーバから前記更新状態情報要求メッセージを受信し、前記更新状態情報要求メッセージに含まれる前記最終の更新時刻を用いて、前記最終の更新時刻以降に更新された状態情報を、前記第2の高可用サーバの前記状態管理領域から取得するように前記第2のOSに指示を出し、
    前記第2のOSが、前記最終の更新時刻以降に更新された状態情報の取得指示を前記第2のハイパーバイザーに引き渡し、
    前記第2のハイパーバイザーが、前記最終の更新時刻以降に更新された状態情報の取得指示を受け付け、前記第2の高可用サーバの状態管理領域から、前記最終の更新時刻以降に更新された状態情報を取得して、前記第2のOSに引き渡し、
    前記第2のサービス処理部が、前記最終の更新時刻以降に更新された状態情報を、前記第2のOSから取得して、前記第1の高可用サーバへ送信し、
    前記第1の高可用サーバの前記制御手段は、
    前記第2の高可用サーバから受信した前記最終の更新時刻以降に更新された状態情報を用いて、自身の前記状態管理領域に記憶された状態情報を更新すること
    を特徴とする高可用サーバシステムの障害時復旧方法。
  3. 請求項に記載の高可用サーバシステムに用いられる前記高可用サーバであって、
    前記高可用サーバの記憶手段に、前記高可用サーバが前記クライアントから受信した前記アクセスデータが、前記状態管理領域にアクセスする必要のある情報か否かを識別するための判別ポリシーが記憶され、
    前記ハイパーバイザーは、前記状態管理部から前記OSを介して前記アクセスデータを受け取ると、前記判別ポリシーに基づき、前記アクセスデータを前記状態情報として前記状態管理領域に格納すべきか否かを判定するアクセス判別処理部を備え、
    前記アクセス判別処理部が、前記アクセスデータを前記状態情報として格納すべきと判定した場合に、前記状態アクセス制御部に当該アクセスデータを引き渡し、前記状態アクセス制御部は、前記アクセスデータを用いて、前記状態管理領域にアクセスすること
    を特徴とする高可用サーバ。
  4. 前記状態管理部および前記同期制御部を、ミドルウェアとして機能させること
    を特徴とする請求項または請求項に記載の高可用サーバ。
JP2009264014A 2009-11-19 2009-11-19 高可用サーバシステム、高可用サーバシステムの障害時復旧方法、および高可用サーバ Active JP5544516B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009264014A JP5544516B2 (ja) 2009-11-19 2009-11-19 高可用サーバシステム、高可用サーバシステムの障害時復旧方法、および高可用サーバ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009264014A JP5544516B2 (ja) 2009-11-19 2009-11-19 高可用サーバシステム、高可用サーバシステムの障害時復旧方法、および高可用サーバ

Publications (2)

Publication Number Publication Date
JP2011108093A JP2011108093A (ja) 2011-06-02
JP5544516B2 true JP5544516B2 (ja) 2014-07-09

Family

ID=44231475

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009264014A Active JP5544516B2 (ja) 2009-11-19 2009-11-19 高可用サーバシステム、高可用サーバシステムの障害時復旧方法、および高可用サーバ

Country Status (1)

Country Link
JP (1) JP5544516B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9483344B2 (en) * 2012-04-05 2016-11-01 Assurant, Inc. System, method, apparatus, and computer program product for providing mobile device support services
JP7044971B2 (ja) * 2018-04-13 2022-03-31 富士通株式会社 クラスタシステム、オートスケールサーバ監視装置、オートスケールサーバ監視プログラムおよびオートスケールサーバ監視方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09274573A (ja) * 1996-04-04 1997-10-21 Mitsubishi Electric Corp バックアップ・システム
JP2000020335A (ja) * 1998-07-01 2000-01-21 Nec Corp 冗長システムの復旧方法
JP2000035911A (ja) * 1998-07-21 2000-02-02 Mitsubishi Electric Corp データベースの等価方法
JP5022062B2 (ja) * 2007-03-01 2012-09-12 株式会社日立製作所 プールi/oデバイス動作確認方法、及び計算機システム
JP4510064B2 (ja) * 2007-09-27 2010-07-21 株式会社東芝 仮想計算機システム及び同システムにおける仮想マシン復元方法

Also Published As

Publication number Publication date
JP2011108093A (ja) 2011-06-02

Similar Documents

Publication Publication Date Title
JP6520959B2 (ja) ノードシステム、サーバ装置、スケールリング制御方法及びプログラム
US9183099B2 (en) Replication of a write-back cache using a placeholder virtual machine for resource management
KR101970839B1 (ko) 서비스의 2차 위치에서의 작업의 재생 기법
EP2754059B1 (en) Clustered client failover
JP2017528809A5 (ja)
US11995100B2 (en) System and method for highly available database service
JP2007213465A (ja) 計算機の制御方法、プログラム及び仮想計算機システム
US20070288532A1 (en) Method of updating an executable file for a redundant system with old and new files assured
JP5948933B2 (ja) ジョブ継続管理装置、ジョブ継続管理方法、及び、ジョブ継続管理プログラム
JP6123626B2 (ja) 処理再開方法、処理再開プログラムおよび情報処理システム
JP2009086701A (ja) 仮想計算機システム及び同システムにおける仮想マシン復元方法
CN105493474A (zh) 用于支持用于同步分布式数据网格中的数据的分区级别日志的系统及方法
US11755364B2 (en) Transferral of process state and/or components in computing environments
JP2007304845A (ja) 仮想計算機システムおよびソフトウェア更新方法
JP4560074B2 (ja) 仮想計算機システム及び同システムにおける仮想計算機復元方法
JP2006323526A (ja) クラスタ管理プログラム、該プログラムを記録した記録媒体、クラスタ管理方法、ノード、およびクラスタ
JP5994601B2 (ja) 並列計算機、並列計算機の制御プログラム及び並列計算機の制御方法
JP2010257284A (ja) データ処理方法、計算機、及びデータ処理プログラム
JP5544516B2 (ja) 高可用サーバシステム、高可用サーバシステムの障害時復旧方法、および高可用サーバ
JP2014016953A (ja) 無共有型データベースシステム、同期装置、データベースサーバ、その同期方法および同期プログラム
CN116501469A (zh) 高性能计算集群的控制方法、电子设备以及存储介质
US20200272453A1 (en) Real-Time Version Controller
JP2013186692A (ja) 仮想マシン提供システム
JP6070282B2 (ja) 仮想マシン管理装置、方法及びプログラム
US9608914B2 (en) Information processing apparatus and information processing method

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20110822

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120125

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130201

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131023

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131119

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140204

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140317

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140408

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20140410

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140411

R150 Certificate of patent or registration of utility model

Ref document number: 5544516

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150