JP5353378B2 - Haクラスタシステムおよびそのクラスタリング方法 - Google Patents

Haクラスタシステムおよびそのクラスタリング方法 Download PDF

Info

Publication number
JP5353378B2
JP5353378B2 JP2009085750A JP2009085750A JP5353378B2 JP 5353378 B2 JP5353378 B2 JP 5353378B2 JP 2009085750 A JP2009085750 A JP 2009085750A JP 2009085750 A JP2009085750 A JP 2009085750A JP 5353378 B2 JP5353378 B2 JP 5353378B2
Authority
JP
Japan
Prior art keywords
server
cluster
standby
servers
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009085750A
Other languages
English (en)
Other versions
JP2010237989A (ja
Inventor
正造 坂根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2009085750A priority Critical patent/JP5353378B2/ja
Publication of JP2010237989A publication Critical patent/JP2010237989A/ja
Application granted granted Critical
Publication of JP5353378B2 publication Critical patent/JP5353378B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、単一点装置における不具合を修正するHAクラスタシステムおよびそのクラスタリング方法に関するものである。
従来から、高可用性(HA:High Availability)クラスタシステムは、通信機器と接続するサーバである稼動系サーバおよび待機系サーバが組み合わされて構成され、サーバの信頼性を向上させるものである。このHAクラスタシステムは、通信機器と接続するサーバとして稼動系サーバを動作させるものであるが、稼動系サーバで障害を検知すると、通信機器と接続するサーバを待機系サーバに切り替えることにより、サーバのダウンタイムを短縮し、サーバの信頼性を向上することができる。すなわち、稼動系であった第1のサーバを待機系に切り替え、かつ待機系であった第2のサーバを稼動系に切り替える。
HAクラスタシステムでは、稼動系サーバおよび待機系サーバは、たとえば互いにハートビート通信して、他系のサーバの状態を監視する。このとき、稼動系サーバに致命的な障害が発生すると、ハートビート通信が途絶え、待機系サーバが稼動系サーバの異常を検知する。このとき、HAクラスタシステムでは、稼動系であった第1のサーバが待機系に切り替えられ、ほぼ同時に、待機系であった第2のサーバが稼動系に切り替えられる。
稼動系サーバおよび待機系サーバは、たとえば、オペレーティングシステム(OS:Operating System)およびハードウエアを備え、とくに、HAクラスタの動作に用いるHAクラスタウエアと、通信機器と通信接続に用いるアプリケーションとを含んで構成されるものである。HAクラスタウエアは、稼動系サーバでは、このアプリケーションを実行してサーバを通信のために稼動させ、待機系サーバでは、このアプリケーションの実行を停止もしくは待機状態としてサーバを待機状態にする。
また、HAクラスタシステムでは、稼動系サーバと待機系サーバとに共通の共有ディスクを備えて、通信機器との通信に関するデータをこの共有ディスクに格納することで、各サーバが共通のデータを使用するので、サーバ間のデータの受け渡しを省略することができる。
特許文献1に記載のクラスタシステムでは、実行系システムおよび待機系システムをそれぞれ構成する物理計算機において、ホストOS上にサーバ仮想化プログラムを稼動して複数の論理区画を構成し、これらの論理区画のそれぞれでゲストOSを実行してそのゲストOS上でアプリケーションプログラムを実行することができる。また、このクラスタシステムは、ホストOSおよびゲストOSでマスタクラスタプログラムおよびスレーブクラスタプログラムをそれぞれ稼動して、実行系と待機系との系切り替えを可能とするもので、とくに、スレーブクラスタプログラムがマスタクラスタプログラムに高可用性要件を設定し、マスタクラスタプログラムがその高可用性要件を満たす系切り替え手法を選択して、選択した手法に従って実行系と待機系との系切り替えを実行する。これによって、このクラスタシステムは、ユーザが求める高可用性要件に好適なクラスタ構成を実現することができる。
特開2008−269332号公報
しかしながら、このように共有ディスクを使用するHAクラスタシステムでは、HAクラスタを構成するサーバ群における単一点装置、たとえば共有ディスクに不具合が発生したとき、共有ディスクを修正するためにホストからのアクセスを停止して稼動系サーバおよび待機系サーバの両方を停止し、パッチの適用などにより共有ディスクの不具合を修正する必要がある。
このように、従来のHAクラスタシステムは、信頼性の向上を要求されるにも拘らず、単一点の不具合が発生すると、不具合を修正する間にサービスの提供を継続できなくなる問題が発生する。
また、このようなサービス中断時間を短縮するために、不具合が修正されたサーバおよび共有ディスクを新設したり、サービスを一時的に代替するサーバおよび共有ディスクを用意したりすることが考えられるが、いずれの場合も通常時には不要な設備であり、そのコストが無駄になる可能性がある。
本発明は、このような従来技術の欠点を解消し、単一点の障害を修正するときに、必要なコストを抑えつつ、サービス中断時間を短縮するHAクラスタシステムおよびそのクラスタリング方法を提供することを目的とする。
本発明は上述の課題を解決するために、ネットワークを介して接続される複数のサーバを含み、また、一のサーバで稼動系サーバを運用し、他のサーバで待機系サーバを運用しつつ、この稼動系サーバの側で障害が生じた場合にこの稼動系サーバとこの待機系サーバとを切り替えるHAクラスタを含むHAクラスタシステムは、少なくとも2つ以上のサーバおよび該これらの2つ以上のサーバの間で共有される共有ディスクを有する複数のサーバ群と、このHAクラスタの構成を管理し、このHAクラスタの移行を指示するHAクラスタ構成変更要求を発行するHAクラスタ構成管理手段とを含み、このサーバは、複数のゲストOSを動作可能にする仮想化システムを有し、このシステムは、通常、これらの複数のサーバ群のそれぞれにこのHAクラスタを備えて、このサーバ群における少なくとも2つのサーバにこの稼動系サーバおよびこの待機系サーバをそれぞれ備えるようにこのHAクラスタ構成管理手段によって管理され、また、このHAクラスタ構成変更要求に応じて、これらの複数のサーバ群のうち、一のサーバ群に備えられた一のHAクラスタを、他のHAクラスタを備える他のサーバ群に一時的に移行して、一のサーバ群について単一点障害を修正可能な状態にする移行手段を含み、この移行手段は、一のサーバ群における一の共有ディスクに格納された共有データを、他のサーバ群における他の共有ディスクに移行し、一のHAクラスタに係るこの待機系サーバおよびこの稼動系サーバを、他のサーバ群におけるこれらの2つ以上のサーバにそれぞれ移行して、移行先のこのサーバにおけるこれらの複数のゲストOSのうち、他のHAクラスタの運用に拘らないこのゲストOSで運用させることを特徴とする。
また、ネットワークを介して接続される複数のサーバを含み、また、一のサーバで稼動系サーバを運用し、他のサーバで待機系サーバを運用しつつ、この稼動系サーバの側で障害が生じた場合にこの稼動系サーバとこの待機系サーバとを切り替えるHAクラスタを含むHAクラスタシステムのクラスタリング方法は、少なくとも2つ以上のサーバおよびこれらの2つ以上のサーバの間で共有される共有ディスクを有する複数のサーバ群と、このHAクラスタの構成を管理し、このHAクラスタの移行を指示するHAクラスタ構成変更要求を発行するHAクラスタ構成管理手段とを含むこのHAクラスタシステムを利用し、このサーバは、複数のゲストOSを動作可能にする仮想化システムを有し、このHAクラスタシステムは、通常、これらの複数のサーバ群のそれぞれにこのHAクラスタを備えて、このサーバ群における少なくとも2つのサーバにこの稼動系サーバおよびこの待機系サーバをそれぞれ備えるようにこのHAクラスタ構成管理システムによって管理され、この方法は、このHAクラスタ構成変更要求に応じて、これらの複数のサーバ群のうち、一のサーバ群に備えられた一のHAクラスタを、他のHAクラスタを備える他のサーバ群に一時的に移行して、一のサーバ群について単一点障害を修正可能な状態にする移行工程を含み、この移行工程は、一のサーバ群における一の共有ディスクに格納された共有データを、他のサーバ群における他の共有ディスクに移行し、一のHAクラスタに係るこの待機系サーバおよびこの稼動系サーバを、他のサーバ群におけるこれらの2つ以上のサーバにそれぞれ移行して、移行先のこのサーバにおけるこれらの複数のゲストOSのうち、他のHAクラスタの運用に拘らないこのゲストOSで運用させることを特徴とする。
本発明のHAクラスタシステムは、一のサーバ群に単一点障害を発見した場合には、この一のサーバ群に設けられた一のHAクラスタを、他のHAクラスタを設ける他のサーバ群に一時的に移行し、このとき、一のサーバ群における一の共有ディスクに格納された共有データを、他のサーバ群における他の共有ディスクに移行し、一のHAクラスタに係る待機系サーバおよび稼動系サーバを、他のサーバ群におけるサーバの仮想化システム上で動作する複数のゲストOSのうち、他のHAクラスタの運用に拘らないゲストOSで運用させる。これによって、本発明のHAクラスタシステムは、一のサーバ群における単一点装置に障害が生じた場合でも、可用性を低下させることなく、また、サーバおよび共有ディスクなどの設備の代替えまたは新設による投資をすることなく、その単一点障害について不具合を修正することができる。
また、本発明のHAクラスタシステムは、一のHAクラスタに係る一の待機系サーバを、他のサーバ群のうち、他のHAクラスタに係る他の稼動系サーバを運用するサーバに移行して、このサーバの仮想化システム上で動作する複数のゲストOSのうち、他の稼動系サーバの運用に拘らないゲストOSで一の待機系サーバを運用し、また、一のHAクラスタに係る一の稼動系サーバを、他のサーバ群のうち、他のHAクラスタに係る他の待機系サーバを運用するサーバに移行して、このサーバの仮想化システム上で動作する複数のゲストOSのうち、他の待機系サーバの運用に拘らないゲストOSで一の稼動系サーバを運用することにより、アプリケーションが動作しない待機系で、別のHAクラスタの稼動系を動作させるので、サーバの計算機資源を有効に利用することができる。
本発明に係るHAクラスタシステムの一実施例を示すブロック図である。 図1に示す実施例のHAクラスタシステムにおいて、待機系のHAクラスタウエアおよび共有データの移動を概要的に説明する図である。 図1に示す実施例のHAクラスタシステムにおいて、稼動系の切り替えを概要的に説明する図である。 図1に示す実施例のHAクラスタシステムにおいて、待機系のHAクラスタウエアの移動および修正パッチの適用を概要的に説明する図である。
次に添付図面を参照して、本発明による高可用性(HA:High Availability)クラスタシステムの実施例を詳細に説明する。たとえば、本発明のシステム10は、図1に示すように、ネットワークを介して接続される複数のサーバ群12および14を含み、また、これらのサーバ群12ならびに14は、それぞれ、複数のサーバ22および24ならびに複数のサーバ26および28を含み、これらのサーバ間で共通に使用される共有ディスク30ならびに32を有して構成される。
このサーバ22では、物理的なハードウエア42に対して仮想化システム44が実装されて、この仮想化システム44上で複数のゲストオペレーティングシステム(OS:Operating System)46および48が動作し、少なくとも一つのゲストOS 46上でHAクラスタウエア50が実行される。このように、一つのサーバ群12において、複数のサーバ22および24のそれぞれでHAクラスタウエア50および52が別々に実行され、稼動系サーバおよび待機系サーバが異なるサーバで運用されることにより、複数のサーバ22および24の間でHAクラスタ82が構成される。
すなわち、本システム10では、複数のサーバ群12および14において、HAクラスタ82および84をそれぞれ構成することができ、とくに、HAクラスタ構成管理システム90を有して、これらのHAクラスタ82および84の構成を管理することができる。なお、本発明の理解に直接関係のない部分は、図示を省略し、冗長な説明を避ける。
本システム10は、実際には多数のサーバ群を有してよいが、図1では複雑化を避けるため、少数のサーバ群12および14しか図示しない。
複数のサーバ群12および14の構成は、互いに同じものでも異なるものでもよいが、少なくとも各サーバ群は複数のサーバおよび共有ディスクを有して構成される。本実施例におけるサーバ群12および14は、同じように構成されるもので、以下ではサーバ群12の構成のみを説明して、サーバ群14の構成の説明を省略する。
サーバ群12は、複数のサーバ22および24を含み、実際には多数のサーバを有してよいが、図1では複雑化を避けるため、少数のサーバ22および24しか図示しない。また、サーバ群12は、複数のサーバ22および24の間で共通に使用される共有ディスク30を含む。
本実施例のサーバ群12は、複数のサーバ22および24のうち、少なくとも一のサーバ22で稼動系サーバが実行され、他のサーバ24で待機系サーバが実行されて、複数のサーバ22および24の間でHAクラスタ82が成立するように構成されるが、多数のサーバのそれぞれで稼動系サーバが実行されてもよい。
このサーバ群12において、複数のサーバ22および24は、互いに同じものでも異なるものでもよいが、少なくとも各サーバは複数のHAクラスタウエアを別々に、かつほぼ同時に実行できるように構成される。本実施例におけるサーバ22および24は、ほぼ同じように構成され、以下では主にサーバ22の構成を説明し、サーバ24については共通する点は省略して異なる点のみを説明する。
サーバ22は、少なくとも、物理的なハードウエア42を含み、このハードウエア42の実行および操作を助けるソフトウエアとしてOSが実装され、このOS上でHAクラスタウエアを動作させるように構成され、このHAクラスタウエアが他のサーバとのクラスタリングを行うことにより、このOS上で実行されるアプリケーション(図示せず)の高可用性を維持することができる。たとえば、サーバ22は、通信アプリケーションを高可用性に実行して、通信サーバとして稼動することができる。
本実施例ではとくに、サーバ22は、ハードウエア42に対して実装される仮想化システム44を含み、また、この仮想化システム44上で別々に、かつほぼ同時に動作する複数のゲストOS 46および48を含んで構成される。また、サーバ22は、複数のゲストOS 46および48のそれぞれにおいてHAクラスタウエアを動作させることができるが、図1に示す例では、ゲストOS 46上で動作するHAクラスタウエア50を含む。
ハードウエア42は、サーバ22における物理的構成要素で、たとえばプログラムおよびデータの保存を行なうハードディスクおよびメモリなどの記憶装置、ならびにプログラムに従ってデータの加工および演算を行なうマザーボードおよび中央演算処理装置(CPU:Central Processing Unit)などの処理装置を含むものでよい。
仮想化システム44は、このサーバ22のリソース、すなわち計算機資源を仮想化して、サーバ22を擬似的に分割することにより、このサーバ22において複数のゲストOS 46および48をほぼ同時に動作可能にするものである。
ゲストOS 46は、ハードウエアの抽象化およびリソースの管理をすることでコンピュータの利用効率を向上し、またアプリケーションプログラミングインタフェース(API:Application Programming Interface)の下でHAクラスタウエア50やアプリケーションなどのソフトウエアをこのサーバ22において実行可能にするものである。
複数のゲストOS 46および48は、互いに同じものでも異なるものでもよいが、各ゲストOSは少なくともHAクラスタウエアを実行できるように構成され、したがって、このサーバ22において複数のHAクラスタウエアが別々に、かつほぼ同時に実行できることとなる。
HAクラスタウエア50は、自身が搭載されるゲストOS 46上の環境を、稼動系サーバまたは待機系サーバとして機能させるように制御するものである。HAクラスタウエア50は、そのゲストOS 46を稼動系サーバとする場合には、高可用性が要求されるアプリケーションを実行可能にし、そのゲストOS 46を待機系サーバとする場合には、このアプリケーションを実行せずに待機状態を維持する。
このHAクラスタウエア50は、他のサーバ24に搭載された他のHAクラスタウエア60と同期してクラスタリング制御することができる。たとえば、複数のHAクラスタウエア50および60は、複数のサーバ22および24のうち、少なくとも一つのサーバで稼動系サーバが作動し、少なくとも他の一つのサーバで待機系サーバが作動するように、サーバ間のクラスタリングを制御して、実質的に一つのHAクラスタ82を成立させる。
本実施例において、HAクラスタ82は、初期状態において、サーバ22のゲストOS 46上の環境を稼動系サーバとし、サーバ24のゲストOS 56上の環境を待機系サーバとするように制御される。
また、HAクラスタ82は、たとえばハートビート通信によって、複数のサーバ22および24が互いに障害を監視できるように構成される。このような障害を監視する監視部は、サーバごとに、すなわち複数のゲストOS 46および48に共通に備えてもよく、またはゲストOSもしくはHAクラスタウエアごとに備えてもよい。
このHAクラスタ82において、HAクラスタウエア50は、HAクラスタ82における稼動系サーバに障害が生じたときに、通常のクラスタリングによって、対応する待機系サーバとこの稼動系サーバとを互いに切り替える。たとえば、HAクラスタウエア50は、ゲストOS 46上で稼動系サーバが動作しているときにサーバ22に障害が生じた場合には、この稼動系サーバで稼動していた業務を他のサーバ24における待機系サーバに引き継いで、ゲストOS 46上の環境を待機系サーバに切り替えることができる。
また、HAクラスタウエア50は、ゲストOS 46上で待機系サーバが動作しているときに他のサーバ24に障害が生じた場合には、他のサーバ24における稼動系サーバから業務を引き継いで、ゲストOS 46上の環境を稼動系サーバに切り替えることもできる。
本実施例のサーバ群12において、サーバ24は、サーバ22と同様にして、ハードウエア52、仮想化システム54、ゲストOS 56および58、ならびにHAクラスタウエア60を有して構成されるものでよい。
また、本実施例のサーバ群12において、共有ディスク30は、複数のサーバ22および24のそれぞれで共有される、データベースおよびハードディスクなどの記録媒体である。この共有ディスク30は、サーバ群12またはHAクラスタ82において、単一に備えられるものである。共有ディスク30は、たとえば、サーバ群12のHAクラスタ82における稼動系サーバおよび待機系サーバの運用に要するデータ、および複数のサーバ22および24で実行されるアプリケーションに関するデータを格納することができる。
また、本実施例において、サーバ群14は、サーバ群12と同様にして、複数のサーバ26および28ならびに共有ディスク32を有して構成されるものでよい。さらに、サーバ26は、サーバ22と同様にして、ハードウエア62、仮想化システム64、ゲストOS 66および68、ならびにHAクラスタウエア70を有して構成されものでよく、また、サーバ28も、サーバ22と同様にして、ハードウエア72、仮想化システム74、ゲストOS 76および78、ならびにHAクラスタウエア80を有して構成されるものでよい。
本実施例ではとくに、HAクラスタ構成管理システム90は、本システム10で運用する複数のHAクラスタ82および84の構成を管理する。この管理システム90は、たとえば、各HAクラスタをいずれのサーバ群で運用するかを管理し、またHAクラスタの稼動系サーバおよび待機系サーバをいずれのサーバのいずれのゲストOSで運用するかを管理することができる。すなわち、管理システム90は、HAクラスタを運用すべきサーバ群を適宜選択し、稼動系サーバおよび待機系サーバを運用すべきサーバおよびゲストOSを適宜選択することができる。
また、HAクラスタ構成管理システム90は、一のサーバ群12に構成されている一のHAクラスタ82の構成要素を、他のHAクラスタ84を有する他のサーバ群14に移行することができる。この管理システム90は、たとえば本システム10の管理者の操作に応じて、HAクラスタ構成変更要求を受け、この変更要求に応じて一のHAクラスタ82の構成要素を他のサーバ群14に移行することができる。したがって、管理システム90によれば、一のサーバ群12に単一点装置の不具合が生じた場合に、一のHAクラスタ82を他のサーバ群14に移行することにより、サーバ群12を単一点装置の不具合が修正可能な状態にすることができる。
たとえば、本実施例のHAクラスタ構成管理システム90は、サーバ群12の共有ディスク30に格納された共有データを、他のサーバ群14の共有ディスク32に移行し、HAクラスタ82に係る待機系サーバおよび稼動系サーバを、他のサーバ群14におけるサーバ26および28にそれぞれ移行する。ここで、管理システム90は、HAクラスタ82に係る待機系サーバおよび稼動系サーバを、移行先のサーバにおける複数のゲストOSのうち、HAクラスタ84の運用に拘らないゲストOSで運用させる。
この管理システム90は、たとえば、HAクラスタ82の待機系サーバに係るHAクラスタウエア60を、他のサーバ群14のうち、他のHAクラスタ84の稼動系サーバを運用するサーバ26に移行して、HAクラスタ82の待機系サーバをサーバ群14に移行する。ここで、管理システム90は、サーバ26の仮想化システム64上で動作する複数のゲストOS 66および68のうち、稼動系サーバの運用に拘らないゲストOS 68を選択し、このゲストOS 68上でHAクラスタ82の待機系サーバを運用する。
また、管理システム90は、HAクラスタ82の稼動系サーバに係るHAクラスタウエア50を、他のサーバ群14のうち、他のHAクラスタ84の待機系サーバを運用するサーバ28に移行して、HAクラスタ82の稼動系サーバをサーバ群14に移行する。ここで、管理システム90は、サーバ28の仮想化システム74上で動作する複数のゲストOS 76および78のうち、待機系サーバの運用に拘らないゲストOS 78を選択し、このゲストOS 78上でHAクラスタ82の稼動系サーバを運用する。
さらに、管理システム90は、HAクラスタ82のサーバ群12からサーバ群14への移行により、サーバ群12で使用されなくなったHAクラスタ82の構成要素、たとえばHAクラスタウエア50および60の動作を停止することができる。
また、管理システム90は、HAクラスタ82の待機系サーバに関してはHAクラスタウエアをサーバ群12からサーバ群14へと直接的に移行し、稼動系サーバに関してはクラスタリングにより間接的に移行することにより、HAクラスタ82をサーバ群12からサーバ群14へと移行することもできる。
次に、本実施例の本システム10において、所定のサーバ群のHAクラスタにおける単一点装置の障害が発生した場合に、そのサーバ群で高可用性が求められるアプリケーションに係る業務を他のサーバ群に引き継ぐ動作例を、図1〜図4を参照しながら説明する。
本システム10は、複数のHAクラスタ82および84が複数のサーバ群12および14のそれぞれに備えられ、各HAクラスタで稼動系サーバを運用することにより、高可用性が求められるアプリケーションを実行する複数の稼動系サーバを同時に運用することができる。
まず、本システム10は、単一点障害のない通常の状態で動作し、図1に示すように、一のHAクラスタ82では、サーバ群12における一のサーバ22のHAクラスタウエア50によって稼動系サーバを運用しつつ、他のサーバ24のHAクラスタウエア60によって待機系サーバを運用している。また、他のHAクラスタ84が、サーバ群14における一のサーバ26のHAクラスタウエア70によって稼動系サーバを運用しつつ、他のサーバ28のHAクラスタウエア80によって待機系サーバを運用している。
本システム10では、このHAクラスタ82、すなわちサーバ群12の単一点装置における障害の発生が検出され、たとえば共有ディスク30における障害の発生が検出されることがある。このような単一点障害が検出されるとき、たとえば管理者がHAクラスタ構成管理システム90を操作することによって、この管理システム90が本システム10に対してHAクラスタ変更要求を指示する。具体的には、管理システム90は、このHAクラスタ変更要求により、単一点障害を有するサーバ群12で稼動系サーバを運用するHAクラスタ82に係る構成要素を、他のサーバ群14に一時的に移行させる。
このHAクラスタ82の移行では、まず、図2に示すように、管理システム90に制御されて、HAクラスタ82に係るデータ、たとえば稼動系サーバおよび待機系サーバの運用に要するデータが、サーバ群12の共有ディスク30から他のサーバ群14の共有ディスク32へとコピーされる。
次に、HAクラスタ82における待機系サーバの他のサーバ群14への移行が管理システム90によって制御される。このとき、他のサーバ群14の各サーバでは、稼動系サーバまたは待機家サーバが運用されているが、この運用は複数のゲストOSのうちの一のOS上で行われているので、使用されていない他のゲストOSに対してHAクラスタ82における待機系サーバを移行する。
本実施例のHAクラスタ82の待機系サーバの移行では、図2に示すように、他のHAクラスタ84の待機系サーバを備えるサーバ28において、その待機系サーバに係るHAクラスタウエア80がゲストOS 76上で動作しているので、他のゲストOS 78を利用する。このとき、他のゲストOS 78において、HAクラスタウエア60に代用されるHAクラスタウエア102を動作させ、ここでHAクラスタ82の待機系サーバを運用させる。
また、この移行処理では、HAクラスタ82の待機系サーバの運用のためにサーバ24で動作していたHAクラスタウエア60を停止し、すなわちサーバ群12における待機系サーバを停止する。
このようにして、サーバ群12でのみ構成されていたHAクラスタ82が、サーバ22におけるHAクラスタウエア50とサーバ28におけるHAクラスタウエア102との間に構成されることとなる。
さらに、このHAクラスタ82がHAクラスタウエア50および102によって制御されて、図3に示すように、サーバ22のゲストOS 46上で動作する稼動系サーバと、サーバ28のゲストOS 78上で動作する待機系サーバとが切り替えられる。これによって、サーバ22のゲストOS 46上ではHAクラスタウエア50によって待機系サーバが運用され、サーバ28のゲストOS 78上ではHAクラスタウエア102によって稼動系サーバが運用されることとなる。
次に、HAクラスタ82で切り替えられた待機系サーバの他のサーバ群14への移行が、上記と同様にして管理システム90によって制御される。このとき、図4に示すように、他のHAクラスタ84の稼動系サーバを備えるサーバ26において、その稼動系サーバに係るHAクラスタウエア70がゲストOS 66上で動作しているので、他のゲストOS 68において、HAクラスタウエア50に代用されるHAクラスタウエア104を動作させ、ここでHAクラスタ82の待機系サーバを運用させる。
この移行処理でも上記と同様にして、HAクラスタ82の待機系サーバの運用のためにサーバ22で動作していたHAクラスタウエア50を停止し、すなわちサーバ群12における待機系サーバを停止する。
このようにして、HAクラスタ82は、サーバ26におけるHAクラスタウエア104とサーバ28におけるHAクラスタウエア102との間に構成されることとなる。
このとき、サーバ群12では、HAクラスタを有さず、高可用性が求められるアプリケーションを実行しない状態となるので、サーバ群12におけるサーバ22および24ならびに共有ディスク30の動作を停止して、サーバ群12における単一点障害に対して修正を行うことができ、たとえば共有ディスク30の不具合を修正するパッチを適用することができる。
このようにしてサーバ群12における単一点障害を修正した後、上記と逆の手順で、HAクラスタ82の構成要素をサーバ群14からサーバ群12に移行して元に戻すことができる。
たとえば、通信システムでは、高可用性を求められる通信アプリケーションを実行するので、本発明のHAクラスタシステムを有効に適用することができ、サーバ群に単一点障害が生じた場合でも、上記のように、単一点障害が生じたサーバ群に備えられたHAクラスタを他のサーバ群に移行するので、通信システムに影響を与えることなく単一点障害を修正することができる。
本発明のHAクラスタシステムでは、サーバ群における単一点装置の不具合について、本システムの管理者が発見することもあるが、各サーバまたは共有ディスクのバグを監視し、修正を要するようなバグの累積に応じて不具合を検出することもある。
また、本発明のHAクラスタシステムは、たとえば一のサーバ群のすべてのサーバが故障して稼動系サーバを運用できなくなり、一のHAクラスタが機能しなくなった場合にも、上述の実施例のようなHAクラスタ切り替えを適用して一のHAクラスタを他のサーバ群に移行することができ、これによって、可用性の低下を防止し、CPUなどの計算機資源を有効利用して故障対策を取ることができる。また、HAクラスタシステムは、稼動系サーバを監視して、その監視において稼動系サーバの故障を検出した場合に自動的にHAクラスタ切り替えを指示する外部装置を設けてもよい。
さらに、HAクラスタシステムでは、たとえば一のサーバ群の一のサーバが故障すると、一のHAクラスタにおいて稼動系サーバと待機系サーバとを切り替えるので、一のサーバ群が稼動系サーバのみを有することになるかもしれないが、上記の実施例のように一のHAクラスタの構成要素を他のサーバ群に移行すれば、一のHAクラスタの待機系サーバを他のサーバ群で運用することにより、本システムの可用性の低下を防止することができる。
10 HAクラスタシステム
12、14 サーバ群
22、24、26、28 サーバ
30、32 共有ディスク
42、52、62、72 ハードウエア
44、54、64、74 仮想化システム
46、48、56、58、66、68、76、78 ゲストOS
50、60、70、80 HAクラスタウエア
82、84 HAクラスタ
90 HAクラスタ構成管理システム

Claims (6)

  1. ネットワークを介して接続される複数のサーバを含み、
    また、一の前記サーバで稼動系サーバを運用し、他の前記サーバで待機系サーバを運用しつつ、前記稼動系サーバの側で障害が生じた場合に前記稼動系サーバと前記待機系サーバとを切り替える高可用性(HA:High Availability)クラスタを含むHAクラスタシステムにおいて、該HAクラスタシステムは、
    少なくとも2つ以上の前記サーバおよび該2つ以上のサーバの間で共有される共有ディスクを有する複数のサーバ群と、
    前記HAクラスタの構成を管理し、前記HAクラスタの移行を指示するHAクラスタ構成変更要求を発行するHAクラスタ構成管理手段とを含み、
    前記サーバは、複数のゲストオペレーティングシステム(OS:Operating System)を動作可能にする仮想化システムを有し、
    HAクラスタシステムは、通常、前記複数のサーバ群のそれぞれに前記HAクラスタを備えて、前記サーバ群における少なくとも2つの前記サーバに前記稼動系サーバおよび前記待機系サーバをそれぞれ備えるように前記HAクラスタ構成管理手段によって管理され、
    また、前記HAクラスタ構成変更要求に応じて、前記複数のサーバ群のうち、一の前記サーバ群に備えられた一の前記HAクラスタを、他の前記HAクラスタを備える他の前記サーバ群に一時的に移行して、前記一のサーバ群について単一点障害を修正可能な状態にする移行手段を含み、
    該移行手段は、前記一のサーバ群における一の前記共有ディスクに格納された共有データを、前記他のサーバ群における他の前記共有ディスクに移行し、
    前記一のHAクラスタに係る前記待機系サーバおよび前記稼動系サーバを、前記他のサーバ群における前記2つ以上のサーバにそれぞれ移行して、移行先の前記サーバにおける前記複数のゲストOSのうち、前記他のHAクラスタの運用に拘らない前記ゲストOSで運用させることを特徴とするHAクラスタシステム。
  2. 請求項1に記載のHAクラスタシステムにおいて、前記移行手段は、前記一のHAクラスタに係る一の前記待機系サーバを、前記他のサーバ群のうち、前記他のHAクラスタに係る他の前記待機系サーバを運用する第1の他のサーバに移行して、第1の他のサーバの前記仮想化システム上で動作する前記複数のゲストOSのうち、前記他の待機系サーバの運用に拘らない前記ゲストOSで最終的に前記他の待機系サーバを前記一の待機系サーバから前記一の稼動系サーバとして運用させ、
    前記一のHAクラスタに係る一の前記稼動系サーバを、前記他のサーバ群のうち、前記他のHAクラスタに係る他の前記待機系サーバを運用する第2の他のサーバに移行して、第2の他のサーバの前記仮想化システム上で動作する前記複数のゲストOSのうち、前記他の待機系サーバの運用に拘らない前記ゲストOSで前記一の稼動系サーバを前記一の待機系サーバとして運用させることを特徴とするHAクラスタシステム。
  3. 請求項2に記載のHAクラスタシステムにおいて、前記移行手段は、まず、前記一のサーバ群における一の前記共有ディスクに格納された共有データを、前記他のサーバ群における他の前記共有ディスクに移行し、
    次に、前記一の待機系サーバを、前記他の待機系サーバを運用する第1の他のサーバに移行して、第1の他のサーバにおける前記他の待機系サーバの運用に拘らない前記ゲストOSで前記一の待機系サーバを運用させ、
    このとき、前記一のサーバ群で前記一の待機系サーバを運用していたクラスタウエアの動作を停止し、
    次に、前記他のサーバ群における前記一の待機系サーバと、前記一のサーバ群における前記一の稼動系サーバとを切り替えて、前記一の稼動系サーバを、第1の他のサーバにおける前記他の待機系サーバの運用に拘らない前記ゲストOSで運用させ、
    さらに、サーバの機能の切り替えにより現在機能している前記一の待機系サーバを、前記他の稼動系サーバを運用する第2の他のサーバに移行して、第2の他のサーバにおける前記他の稼動系サーバの運用に拘らない前記ゲストOSで前記一の待機系サーバを運用させ、
    このとき、前記一のサーバ群で切り替え後に前記一の待機系サーバとして運用していたクラスタウエアの動作を停止して、前記一のサーバ群における前記サーバすべてへのアクセスを停止することを特徴とするHAクラスタシステム。
  4. ネットワークを介して接続される複数のサーバを含み、
    また、一の前記サーバで稼動系サーバを運用し、他の前記サーバで待機系サーバを運用しつつ、前記稼動系サーバの側で障害が生じた場合に前記稼動系サーバと前記待機系サーバとを切り替える高可用性(HA:High Availability)クラスタを含むHAクラスタシステムのクラスタリング方法において、該方法は、
    少なくとも2つ以上の前記サーバおよび該2つ以上のサーバの間で共有される共有ディスクを有する複数のサーバ群と、
    前記HAクラスタの構成を管理し、前記HAクラスタの移行を指示するHAクラスタ構成変更要求を発行するHAクラスタ構成管理手段とを含む前記HAクラスタシステムを利用し、
    前記サーバは、複数のゲストオペレーティングシステム(OS:Operating System)を動作可能にする仮想化システムを有し、
    前記HAクラスタシステムは、通常、前記複数のサーバ群のそれぞれに前記HAクラスタを備えて、前記サーバ群における少なくとも2つの前記サーバに前記稼動系サーバおよび前記待機系サーバをそれぞれ備えるように前記HAクラスタ構成管理システムによって管理され、
    該方法は、前記HAクラスタ構成変更要求に応じて、前記複数のサーバ群のうち、一の前記サーバ群に備えられた一の前記HAクラスタを、他の前記HAクラスタを備える他の前記サーバ群に一時的に移行して、前記一のサーバ群について単一点障害を修正可能な状態にする移行工程を含み、
    該移行工程は、前記一のサーバ群における一の前記共有ディスクに格納された共有データを、前記他のサーバ群における他の前記共有ディスクに移行し、
    前記一のHAクラスタに係る前記待機系サーバおよび前記稼動系サーバを、前記他のサーバ群における前記2つ以上のサーバにそれぞれ移行して、移行先の前記サーバにおける前記複数のゲストOSのうち、前記他のHAクラスタの運用に拘らない前記ゲストOSで運用させることを特徴とするクラスタリング方法。
  5. 請求項4に記載のクラスタリング方法において、前記移行工程は、前記一のHAクラスタに係る一の前記待機系サーバを、前記他のサーバ群のうち、前記他のHAクラスタに係る他の前記待機系サーバを運用する第1の他のサーバに移行して、第1の他のサーバの前記仮想化システム上で動作する前記複数のゲストOSのうち、前記他の待機系サーバの運用に拘らない前記ゲストOSで最終的に前記他の待機系サーバを前記一の待機系サーバから前記一の稼動系サーバとして運用させ、
    前記一のHAクラスタに係る一の前記稼動系サーバを、前記他のサーバ群のうち、前記他のHAクラスタに係る他の前記待機系サーバを運用する第2の他のサーバに移行して、第2の他のサーバの前記仮想化システム上で動作する前記複数のゲストOSのうち、前記他の待機系サーバの運用に拘らない前記ゲストOSで前記一の稼動系サーバを前記一の待機系サーバとして運用させることを特徴とするクラスタリング方法。
  6. 請求項5に記載のクラスタリング方法において、前記移行工程は、まず、前記一のサーバ群における一の前記共有ディスクに格納された共有データを、前記他のサーバ群における他の前記共有ディスクに移行し、
    次に、前記一の待機系サーバを、前記他の待機系サーバを運用する第1の他のサーバに移行して、第1の他のサーバにおける前記他の待機系サーバの運用に拘らない前記ゲストOSで前記一の待機系サーバを運用させ、
    このとき、前記一のサーバ群で前記一の待機系サーバを運用していたクラスタウエアの動作を停止し、
    次に、前記他のサーバ群における前記一の待機系サーバと、前記一のサーバ群における前記一の稼動系サーバとを切り替えて、前記一の稼動系サーバを、第1の他のサーバにおける前記他の待機系サーバの運用に拘らない前記ゲストOSで運用させ、
    さらに、サーバの機能の切り替えにより現在機能している前記一の待機系サーバを、前記他の稼動系サーバを運用する第2の他のサーバに移行して、第2の他のサーバにおける前記他の稼動系サーバの運用に拘らない前記ゲストOSで前記一の待機系サーバを運用させ、
    このとき、前記一のサーバ群で切り替え後に前記一の待機系サーバとして運用していたクラスタウエアの動作を停止して、前記一のサーバ群における前記サーバへのアクセスを停止することを特徴とするクラスタリング方法。
JP2009085750A 2009-03-31 2009-03-31 Haクラスタシステムおよびそのクラスタリング方法 Active JP5353378B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009085750A JP5353378B2 (ja) 2009-03-31 2009-03-31 Haクラスタシステムおよびそのクラスタリング方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009085750A JP5353378B2 (ja) 2009-03-31 2009-03-31 Haクラスタシステムおよびそのクラスタリング方法

Publications (2)

Publication Number Publication Date
JP2010237989A JP2010237989A (ja) 2010-10-21
JP5353378B2 true JP5353378B2 (ja) 2013-11-27

Family

ID=43092242

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009085750A Active JP5353378B2 (ja) 2009-03-31 2009-03-31 Haクラスタシステムおよびそのクラスタリング方法

Country Status (1)

Country Link
JP (1) JP5353378B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016046951A1 (ja) * 2014-09-26 2016-03-31 株式会社日立製作所 計算機システム及びそのファイル管理方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5548647B2 (ja) * 2011-04-25 2014-07-16 株式会社日立製作所 計算機システムでの部分障害処理方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3657665B2 (ja) * 1995-02-14 2005-06-08 富士通株式会社 共用メモリに結合される複数の計算機システム及び共用メモリに結合される複数の計算機システムの制御方法
JP4119162B2 (ja) * 2002-05-15 2008-07-16 株式会社日立製作所 多重化計算機システム、論理計算機の割当方法および論理計算機の割当プログラム
JP4038147B2 (ja) * 2003-04-17 2008-01-23 株式会社日立製作所 情報処理システム
JP4544146B2 (ja) * 2005-11-29 2010-09-15 株式会社日立製作所 障害回復方法
JP4923990B2 (ja) * 2006-12-04 2012-04-25 株式会社日立製作所 フェイルオーバ方法、およびその計算機システム。
JP2008152594A (ja) * 2006-12-19 2008-07-03 Hitachi Ltd マルチコアプロセッサ計算機の高信頼化方法
JP5032191B2 (ja) * 2007-04-20 2012-09-26 株式会社日立製作所 サーバ仮想化環境におけるクラスタシステム構成方法及びクラスタシステム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016046951A1 (ja) * 2014-09-26 2016-03-31 株式会社日立製作所 計算機システム及びそのファイル管理方法

Also Published As

Publication number Publication date
JP2010237989A (ja) 2010-10-21

Similar Documents

Publication Publication Date Title
US8713362B2 (en) Obviation of recovery of data store consistency for application I/O errors
US8909884B2 (en) Migrating virtual machines across sites
US7318138B1 (en) Preventing undesired trespass in storage arrays
US7992032B2 (en) Cluster system and failover method for cluster system
WO2011074284A1 (ja) 仮想計算機の移動方法、仮想計算機システム及びプログラムを格納した記憶媒体
WO2010122709A1 (ja) 若化処理装置、若化処理システム、コンピュータプログラムおよびデータ処理方法
US8032786B2 (en) Information-processing equipment and system therefor with switching control for switchover operation
US8775867B2 (en) Method and system for using a standby server to improve redundancy in a dual-node data storage system
KR20170109635A (ko) 노드 시스템, 서버 장치, 스케일링 제어 방법 및 프로그램
CN110912991A (zh) 一种基于超融合双节点高可用的实现方法
JP2011060055A (ja) 仮想計算機システム、仮想マシンの復旧処理方法及びそのプログラム
US9448615B2 (en) Managing power savings in a high availability system at a redundant component level of granularity
Loveland et al. Leveraging virtualization to optimize high-availability system configurations
JP2008107896A (ja) 物理資源制御管理システム、物理資源制御管理方法および物理資源制御管理用プログラム
US20140317437A1 (en) Automatic cluster-based failover handling
JP2007172334A (ja) 並列型演算システムの冗長性を確保するための方法、システム、およびプログラム
JP2008052407A (ja) クラスタシステム
US8635391B2 (en) Systems and methods for eliminating single points of failure for storage subsystems
JP2007156679A (ja) サーバの障害回復方法及びデータベースシステム
JP2012208896A (ja) ディスクアレイ装置、接続経路制御方法、及び接続経路制御プログラム
CN111935244B (zh) 一种业务请求处理系统及超融合一体机
JP5998577B2 (ja) クラスタ監視装置、クラスタ監視方法、及びプログラム
JP2007304845A (ja) 仮想計算機システムおよびソフトウェア更新方法
JP2012190175A (ja) フォールトトレラントシステム、サーバ、フォールトトレラント化方法およびプログラム
JP7206981B2 (ja) クラスタシステム、その制御方法、サーバ、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111027

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20120813

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130426

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130514

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130712

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130730

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130812

R150 Certificate of patent or registration of utility model

Ref document number: 5353378

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150