JP5712714B2 - クラスタシステム、仮想マシンサーバ、仮想マシンのフェイルオーバ方法、仮想マシンのフェイルオーバプログラム - Google Patents

クラスタシステム、仮想マシンサーバ、仮想マシンのフェイルオーバ方法、仮想マシンのフェイルオーバプログラム Download PDF

Info

Publication number
JP5712714B2
JP5712714B2 JP2011061235A JP2011061235A JP5712714B2 JP 5712714 B2 JP5712714 B2 JP 5712714B2 JP 2011061235 A JP2011061235 A JP 2011061235A JP 2011061235 A JP2011061235 A JP 2011061235A JP 5712714 B2 JP5712714 B2 JP 5712714B2
Authority
JP
Japan
Prior art keywords
virtual
virtual machine
clusterware
failure
nic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011061235A
Other languages
English (en)
Other versions
JP2012198651A (ja
Inventor
大介 久保田
大介 久保田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2011061235A priority Critical patent/JP5712714B2/ja
Publication of JP2012198651A publication Critical patent/JP2012198651A/ja
Application granted granted Critical
Publication of JP5712714B2 publication Critical patent/JP5712714B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Description

本発明は、クラスタウェアに関し、特に、物理NICの障害検知を利用して仮想マシンの自動フェイルオーバを行う技術に関す。
近年では、仮想化技術とクラスタウェアを組み合わせ、仮想マシンサーバに障害が発生した場合、仮想マシンを別の仮想マシンサーバにフェイルオーバさせるシステムが多くなってきている。
ここで、フェイルオーバとは、サーバに障害が発生した場合に、代替サーバが処理やデータを引き継ぐ機能をいう。
一口にクラスタウェアといっても仕様や動作は様々であるが、NIC(Network Interface Card)やアプリケーション等、様々なリソースにIPアドレスを与えることで、それらの状態を監視することが可能となるクラスタウェアが存在する。
該クラスタウェアを用いることで、監視対象リソースになんらかの障害が発生した際にはアプリケーションや仮想マシンの再起動やフェイルオーバ等の対処を速やかに実行することができる。
また、仮想マシンサーバ内のネットワークは次のような構造をしている。
仮想マシンサーバには物理NICが搭載され、その物理NICはハイパーバイザ(仮想化環境を提供するソフトウェア)が提供する仮想スイッチに接続される。
仮想スイッチはハイパーバイザが仮想マシンごとに用意する仮想NICと接続される。仮想マシン上のOSは、それぞれに用意された仮想NICを使用して通信を行う。
すなわち、仮想スイッチを利用することにより、1つの物理NICを複数の仮想マシンで共有して使用することが可能になっている。通常、仮想NICにはIPアドレスが必要であるが、物理NICにはIPアドレスを割り振らなくとも仮想スイッチとの通信を行うことができる。
IPアドレスによる監視方式を採用したクラスタウェアを使用した、背景技術による仮想化環境におけるクラスタシステムの一例を図5に示す。
図5に示すように、背景技術による仮想化環境におけるクラスタシステムは、仮想マシンサーバ19と仮想マシンサーバ20とから構成される。
仮想マシンサーバ19は、管理用OS(オペレーティングシステム)21、仮想マシン32〜33、仮想NIC V8〜V11、仮想スイッチ25〜26、及び物理NIC P5〜P6を含む。管理用OS21はクラスタウェア23を有する。
同様に、仮想マシンサーバ20は、管理用OS(オペレーティングシステム)22、仮想NIC V12〜V14、仮想スイッチ27〜28、及び物理NIC P7〜P8を含む。管理用OS22はクラスタウェア24を有する。
物理NIC P5、P7はL2スイッチ30に接続されており、この通信経路を使用してクラスタウェア23、24は互いが正常に動作しているか確認している。
また、物理NIC P6、P8はL2スイッチ29に接続されており、このネットワークは外部接続31を通じて外部のネットワークが通信可能である。このネットワークは、具体的には仮想マシンユーザーが外部から外部接続31を通じて仮想マシンサーバ19または20上の仮想マシン32または33または34に接続する際に使用される。

この背景技術による仮想化環境におけるクラスタシステムにおいて、クラスタウェア23、24が監視可能なポートは図6に示すように仮想NIC V8〜V14であり、物理NIC P5〜P8は監視不可能である。
このような構成を有する背景技術による仮想化環境におけるクラスタシステムはつぎのように動作する。
すなわち、物理NIC P6で障害が発生した場合、仮想マシンサーバ19はL2スイッチ29との通信が不可能になるため、仮想マシンユーザが外部接続31を利用して仮想マシン32〜33に接続することは不可能となる。
しかし、仮想NIC V9と仮想スイッチ26との通信が正常に動作可能であるため、クラスタウェア23は仮想マシンサーバ19がL2スイッチ29と通信不可能になったことを検知することができない。
そのため、仮想マシンユーザが接続不可能になった仮想マシン32〜33への対処を行うためには保守員による作業が必須となる。
ここで、関連技術として、物理ポート番号と仮想ポート番号とを関連付けて管理する旨が特許文献1に記載されている。
また、関連技術として、仮想マシンのフェイルーバに関する記述が特許文献2にされている。
また、関連技術として、擬似チャネルエラーを通知することによりチャネル障害と判断する旨が記載されている。
特開2008−219531号公報 特開2009−163736号公報 特開平01−021542号公報
仮想化環境におけるクラスタシステムにおいては、仮想マシンサーバに搭載された物理NICに障害が発生した場合、クラスタウェアが監視している仮想NICは仮想スイッチとの接続で通信が正常に動作しているため、クラスタウェアは物理NICの障害を検知することができない。
また、クラスタウェアによっては、IPアドレスが割り振られていない物理NICを監視することができない。
なお、特許文献1には、物理ポート番号と仮想ポート番号とを関連付けて管理する旨の記載があり、特許文献2には、仮想マシンをフェイルオーバさせる旨の記載があり、特許文献3には、擬似的なチャネルエラーを通知することでチャネル障害と判断する旨の記載がある。
しかし、特許文献1−3の何れにおいても、物理NICの障害を検知する具体的な方法、及び該障害を契機に仮想マシンをフェイルオーバさせる旨の記述はない。
そのため、物理NICの障害に応じて迅速な対応を行うことができないという課題がある。
(発明の目的)
本発明の目的は、上述の課題を解決し、物理NICの障害検知を利用して仮想マシンの自動フェイルオーバを行うクラスタシステム、仮想マシンサーバ、仮想マシンのフェイルオーバ方法、仮想マシンのフェイルオーバプログラムを提供することである。
本発明の第1のクラスタシステムは、仮想マシンが動作可能な仮想マシンサーバを備えるクラスタシステムであって、仮想マシンサーバが、1つ以上の物理NICと、物理NICに接続される1つ以上の仮想スイッチと、物理NICの障害を検知する監視手段と、障害を検知した物理NICに接続される仮想スイッチの1つ以上のポートを無効化する制御手段と、各仮想スイッチに接続され、仮想マシンのフェイルオーバと仮想スイッチの状態の監視を行うクラスタウェアとを含み、クラスタウェアは、制御手段によるポートの無効化に起因する仮想スイッチの障害を検知し、仮想マシンのフェイルオーバを行う。
本発明の第1の仮想マシンサーバは、クラスタシステムの仮想マシンが動作可能な仮想マシンサーバであって、1つ以上の物理NICと、物理NICに接続される1つ以上の仮想スイッチと、物理NICの障害を検知する監視手段と、障害を検知した物理NICに接続される仮想スイッチの1つ以上のポートを無効化する制御手段と、各仮想スイッチに接続され、仮想マシンのフェイルオーバと仮想スイッチの状態の監視を行うクラスタウェアとを含み、クラスタウェアは、制御手段によるポートの無効化に起因する仮想スイッチの障害を検知し、仮想マシンのフェイルオーバを行う。
本発明の第1の仮想マシンのフェイルオーバ方法は、仮想マシンが動作可能な仮想マシンサーバを備えるクラスタシステムにおける仮想マシンのフェイルオーバ方法であって、仮想マシンサーバが、物理NICの障害を検知するステップと、障害を検知した物理NICに接続される仮想スイッチの1つ以上のポートを無効化するステップと、各仮想スイッチに接続され、仮想マシンのフェイルオーバと仮想スイッチの状態の監視を行うクラスタウェアによって、ポートの無効化に起因する仮想スイッチの障害を検知し、仮想マシンのフェイルオーバを行うステップとを有する。
本発明の第1の仮想マシンのフェイルオーバプログラムは、仮想マシンが動作可能な仮想マシンサーバを備えるクラスタシステムにおける仮想マシンのフェイルオーバプログラムであって、仮想マシンサーバに、物理NICの障害を検知する処理と、障害を検知した物理NICに接続される仮想スイッチの1つ以上のポートを無効化する処理と、各仮想スイッチに接続され、仮想マシンのフェイルオーバと仮想スイッチの状態の監視を行うクラスタウェアによって、ポートの無効化に起因する仮想スイッチの障害を検知し、仮想マシンのフェイルオーバを行う処理とを、実行させる。
本発明によれば、物理NICの障害検知を利用して仮想マシンの自動フェイルオーバを行うことができる。
本発明の第1の実施の形態によるクラスタシステムの構成を示すブロック図である。 第1の実施の形態によるデータ管理テーブルの構成例を示す図である。 第1の実施の形態による仮想スイッチ制御部の詳細を示すブロック図である。 第1の実施の形態によるクラスタシステムの動作を示すフローチャートである。 背景技術によるクラスタシステムの構成を示すブロック図である。 背景技術によるクラスタシステムにおいてクラスタウェアが監視可能なポートを示す図である。 本発明の仮想マシンサーバのハードウェア構成例を示すブロック図である。
本発明は、仮想スイッチ制御機能により、仮想スイッチと障害が発生した物理NICとの通信に異常が発生したことを契機に、障害が発生した物理NICに関連付けられた仮想スイッチのポートをリンクダウンさせる。
クラスタウェアはクラスタウェアに登録されている仮想NICが仮想スイッチとの通信を正常に行えないため、通信経路に異常が発生していることを検知することが可能となり、それを契機として仮想マシンのフェイルオーバ等の対処を自動で行うことが可能となる。
本発明の上記及び他の目的、特徴及び利点を明確にすべく、添付した図面を参照しながら、本発明の実施形態を以下に詳述する。なお、上述の本願発明の目的のほか、他の技術的課題、その技術的課題を解決する手段及びその作用効果についても、以下の実施形態による開示によって明らかとなるものである。
なお、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。
(第1の実施の形態)
図1は本発明の第1のクラスタシステム100の構成を示すブロック図である。クラスタシステム100は、仮想化環境におけるクラスタシステムである。
図1を参照すると、クラスタシステム100は、仮想マシンサーバ1と、仮想マシンサーバ2との2台により仮想化環境のクラスタ構成をとっている。
仮想マシンサーバ1は、管理用OS3、仮想マシン16〜17、仮想NIC V1〜V4、仮想スイッチ7〜8、仮想スイッチ上のポートC1〜C4、仮想スイッチ制御手段11、及び物理NIC P1〜P2を含む。管理用OS3は、クラスタウェア5を含む。
同様に仮想マシンサーバ2は、管理用OS4、仮想NIC V5〜V7、仮想スイッチ9〜10、仮想スイッチ上のポートC5〜C7、仮想スイッチ制御手段12、及び物理NIC P3〜P4を含む。管理用OS4は、クラスタウェア6を有する。
なお、仮想マシンサーバ1の各部と、仮想マシンサーバ2の各部は同様の機能を有するため、適宜説明を省略する。
管理用OS3上の仮想NIC V1は、仮想スイッチ7上のポートC1を介して物理NIC P1を使用した通信を行うことが可能である。
同様に管理用OS4上の仮想NIC V5は、仮想スイッチ9上のポートC5を介して物理NIC P3を使用した通信を行うことが可能である。
物理NIC P1、P3はL2スイッチ14に接続されており、このネットワークを通じてクラスタウェア5、6は互いが正常に動作しているか確認している。
また、管理用OS3上の仮想NIC V2、仮想マシン16上の仮想NIC V3、仮想マシン17上の仮想NIC V4は、それぞれ仮想スイッチ8上のポートC2〜C4を介して物理NIC P2を使用した通信を行うことが可能である。
同様に管理用OS4上の仮想NIC V6、仮想マシン18上の仮想NIC V7は、仮想スイッチ10上のポートC6〜C7を介して物理NIC P4を使用した通信を行うことが可能である。
物理NIC P2、P4はL2スイッチ13に接続されており、このネットワークは外部接続15を通じて外部のネットワークが通信可能である。このネットワークは、具体的には仮想マシンユーザーが外部から外部接続15を通じて仮想マシンサーバ1または2上の仮想マシン16または17または18に接続する際に使用される。
仮想スイッチ制御手段11は、図3に示すように、監視手段111、制御手段112、データ管理手段113を有し、監視手段111は通信経路Lbによって仮想スイッチ8との接続を、制御手段112は通信経路Leによって仮想スイッチ8との接続を確立している。
データ管理手段113は、後述するデータ管理テーブルを有する。
(第1の実施の形態の動作の説明)
次に、本実施の形態によるクラスタシステム100の動作について、図面を参照して詳細に説明する。
まず、図2を参照すると、図2は本実施の形態によるデータ管理テーブルの構成例を示す図である。
図2に示すように、物理NIC P2を親とし、それと仮想スイッチを介して接続される仮想NICとの接続間において仮想NICと接続されている仮想スイッチ上のポートC1〜C3をP2の子とする設定がされている。
これは親であるポートに障害が発生した場合、それに関連付けられた子であるポートがどのポートであるかを判断するためのデータである。該データに基づき、制御手段112は仮想スイッチ上の所定のポートを無効にする。
なお、子であるポートに障害が発生した場合、その時点でクラスタウェアが検知可能であるため、その親であるポートがどのポートであるかを判断する必要はない。
図4は、本実施の形態によるクラスタシステム100の動作を示すフローチャートである。以下、図4を参照しながら動作を説明する。
図3に示すように、監視手段111は通信経路Lbを介して仮想スイッチに接続されており、通信経路Laの通信が正常に動作しているかを定期的に監視する(ステップS401)。
監視手段11は、物理NIC P2と仮想スイッチ8の接続テストを行うことで、通信経路Laの通信が正常に動作しているかを監視する。
通信経路Laに異常が発生した場合(ステップS402”NO”)、監視手段111は、通信経路Lcを介して制御手段112に物理NIC P2で異常が発生したことを通知する(ステップS403)。
通知を受けた制御手段112は、通信経路Ldを介してデータ管理手段113に格納されているデータ管理テーブルから、物理NIC P2の子である仮想スイッチ14上のポートC2〜C4の情報を抽出する(ステップS404)。
次いで、制御手段112は通信経路Leを介して仮想スイッチ14のポートC2〜C4を無効にする(ステップS405)。
ポートC2が無効になったことにより、仮想NIC V2はポートC2との通信を行うことができなくなる構成になっているため、通信経路Lfに異常が発生したことをクラスタウェア5が検出する(ステップS406)。
これを契機にクラスタウェア5は仮想マシン16〜17を仮想マシンサーバ2にフェイルオーバさせる(ステップS407)。
(第1の実施の形態による効果)
本実施の形態では、通信経路Laで異常が発生した際に仮想スイッチ上のポートC2〜C4を無効にするように構成されているため、クラスタウェア5が通信経路Laで異常が発生したことを疑似的に検知することが可能となる。すなわち、クラスタウェア5が物理NICの障害を疑似的に検知することが可能となる。
なお、本実施の形態では、仮想スイッチ上のポートC2〜C4の全てを無効としたが、クラスタウェア5に接続されているポートC2だけを無効としてもよい。
この検知を契機として仮想マシン16〜17を自動的にフェイルオーバさせることが可能となり、保守員による介入を必要とすることなく業務の継続性が高まる。
なお、背景技術に監視手段111、制御手段112を備える最小限の構成としても、上述した本発明の課題を解決することができる。
次に、本発明の仮想マシンサーバ1のハードウェア構成例について、図7を参照して説明する。図7は、仮想マシンサーバ1のハードウェア構成例を示すブロック図である。
図7を参照すると、仮想マシンサーバ1は、一般的なコンピュータ装置と同様のハードウェア構成であり、CPU(Central Processing Unit)801、RAM(Random Access Memory)等のメモリからなる、データの作業領域やデータの一時退避領域に用いられる主記憶部802、ネットワークを介してデータの送受信を行う通信部803、入力装置805や出力装置806及び記憶装置807と接続してデータの送受信を行う入出力インタフェース部804、上記各構成要素を相互に接続するシステムバス808を備えている。記憶装置807は、例えば、ROM(Read Only Memory)、磁気ディスク、半導体メモリ等の不揮発性メモリから構成されるハードディスク装置等で実現される。
本発明の仮想マシンサーバ1の監視手段111、制御手段112、データ管理手段113は、プログラムを組み込んだ、LSI(Large Scale Integration)等のハードウェア部品である回路部品を実装することにより、その動作をハードウェア的に実現することは勿論として、その機能を提供するプログラムを、記憶装置807に格納し、そのプログラムを主記憶部802にロードしてCPU801で実行することにより、ソフトウェア的に実現することも可能である。
また、仮想マシンサーバ2も、上記のようなハードウェア構成を有し、仮想マシンサーバ2が有する各機能をハードウェア的又はソフトウェア的に実現する。
以上好ましい実施の形態をあげて本発明を説明したが、本発明は必ずしも、上記実施の形態に限定されるものでなく、その技術的思想の範囲内において様々に変形して実施することができる。
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
また、本発明の各種の構成要素は、必ずしも個々に独立した存在である必要はなく、複数の構成要素が一個の部材として形成されていること、一つの構成要素が複数の部材で形成されていること、ある構成要素が他の構成要素の一部であること、ある構成要素の一部と他の構成要素の一部とが重複していること、等でもよい。
また、本発明の方法およびコンピュータプログラムには複数の手順を順番に記載してあるが、その記載の順番は複数の手順を実行する順番を限定するものではない。このため、本発明の方法およびコンピュータプログラムを実施する時には、その複数の手順の順番は内容的に支障しない範囲で変更することができる。
また、本発明の方法およびコンピュータプログラムの複数の手順は個々に相違するタイミングで実行されることに限定されない。このため、ある手順の実行中に他の手順が発生すること、ある手順の実行タイミングと他の手順の実行タイミングとの一部ないし全部が重複していること、等でもよい。
さらに、上記実施形態の一部又は全部は、以下の付記のようにも記載されうるが、これに限定されない。
(付記1)
仮想マシンが動作可能な仮想マシンサーバを備えるクラスタシステムであって、
前記仮想マシンサーバが、
1つ以上の物理NICと、
前記物理NICに接続される1つ以上の仮想スイッチと、
前記物理NICの障害を検知する監視手段と、
障害を検知した前記物理NICに接続される前記仮想スイッチの1つ以上のポートを無効化する制御手段と、
各前記仮想スイッチに接続され、仮想マシンのフェイルオーバと前記仮想スイッチの状態の監視を行うクラスタウェアとを含み、
前記クラスタウェアは、
前記制御手段によるポートの無効化に起因する前記仮想スイッチの障害を検知し、仮想マシンのフェイルオーバを行う
ことを特徴とするクラスタシステム。
(付記2)
前記仮想スイッチの前記ポートに接続され、前記クラスタウェア又は前記仮想マシンに割り当てられている1つ以上の仮想NICとを含み、
前記クラスタウェアは、
自身に割り当てられている前記仮想NICと前記仮想スイッチ間の通信経路の状態を監視することを特徴とする付記1に記載のクラスタシステム。
(付記3)
前記制御手段は、
障害を検知した物理NICに接続される前記仮想スイッチのポートのうち、前記クラスタウェアに割り当てられている前記仮想NICと接続するポートを無効化することを特徴とする付記2に記載のクラスタシステム。
(付記4)
前記制御手段は、
障害を検知した物理NICに接続される前記仮想スイッチのすべてのポートを無効化することを特徴とする付記1又は付記2に記載のクラスタシステム。
(付記5)
前記仮想マシンサーバが、
前記物理NICと、前記物理NICに接続される前記仮想スイッチのポートとを関連付けて管理するデータ管理テーブルを含み、
前記制御手段は、
前記データ管理テーブルを参照し、無効化するポートを決定することを特徴とする付記1から付記4の何れか1項に記載のクラスタシステム。
(付記6)
クラスタシステムの仮想マシンが動作可能な仮想マシンサーバであって、
1つ以上の物理NICと、
前記物理NICに接続される1つ以上の仮想スイッチと、
前記物理NICの障害を検知する監視手段と、
障害を検知した前記物理NICに接続される前記仮想スイッチの1つ以上のポートを無効化する制御手段と、
各前記仮想スイッチに接続され、仮想マシンのフェイルオーバと前記仮想スイッチの状態の監視を行うクラスタウェアとを含み、
前記クラスタウェアは、
前記制御手段によるポートの無効化に起因する前記仮想スイッチの障害を検知し、仮想マシンのフェイルオーバを行う
ことを特徴とする仮想マシンサーバ。
(付記7)
前記仮想スイッチの前記ポートに接続され、前記クラスタウェア又は前記仮想マシンに割り当てられている1つ以上の仮想NICとを含み、
前記クラスタウェアは、
自身に割り当てられている前記仮想NICと前記仮想スイッチ間の通信経路の状態を監視することを特徴とする付記6に記載の仮想マシンサーバ。
(付記8)
前記制御手段は、
障害を検知した物理NICに接続される前記仮想スイッチのポートのうち、前記クラスタウェアに割り当てられている前記仮想NICと接続するポートを無効化することを特徴とする付記7に記載の仮想マシンサーバ。
(付記9)
前記制御手段は、
障害を検知した物理NICに接続される前記仮想スイッチのすべてのポートを無効化することを特徴とする付記6又は付記7に記載の仮想マシンサーバ。
(付記10)
前記物理NICと、前記物理NICに接続される前記仮想スイッチのポートとを関連付けて管理するデータ管理テーブルを含み、
前記制御手段は、
前記データ管理テーブルを参照し、無効化するポートを決定することを特徴とする付記6から付記9の何れか1項に記載の仮想マシンサーバ。
(付記11)
仮想マシンが動作可能な仮想マシンサーバを備えるクラスタシステムにおける仮想マシンのフェイルオーバ方法であって、
仮想マシンサーバが、
物理NICの障害を検知するステップと、
障害を検知した前記物理NICに接続される仮想スイッチの1つ以上のポートを無効化するステップと、
各前記仮想スイッチに接続され、仮想マシンのフェイルオーバと前記仮想スイッチの状態の監視を行うクラスタウェアによって、ポートの無効化に起因する前記仮想スイッチの障害を検知し、前記仮想マシンのフェイルオーバを行うステップと
を有することを特徴とする仮想マシンのフェイルオーバ方法。
(付記12)
前記クラスタウェアは、
前記仮想スイッチの前記ポートに接続され、前記クラスタウェア又は前記仮想マシンに割り当てられている仮想NICと前記仮想スイッチ間の通信経路の状態を監視することを特徴とする付記11に記載の仮想マシンのフェイルオーバ方法。
(付記13)
前記ポートの無効化ステップで、
障害を検知した物理NICに接続される前記仮想スイッチのポートのうち、前記クラスタウェアに割り当てられている前記仮想NICと接続するポートを無効化することを特徴とする付記12に記載の仮想マシンのフェイルオーバ方法。
(付記14)
前記ポートの無効化ステップで、
障害を検知した物理NICに接続される前記仮想スイッチのすべてのポートを無効化することを特徴とする付記11又は付記12に記載の仮想マシンのフェイルオーバ方法。
(付記15)
前記ポートの無効化ステップで、
前記物理NICと、前記物理NICに接続される前記仮想スイッチのポートとを関連付けて管理するデータ管理テーブルを参照し、無効化するポートを決定することを特徴とする付記11から付記14の何れか1項に記載の仮想マシンのフェイルオーバ方法。
(付記16)
仮想マシンが動作可能な仮想マシンサーバを備えるクラスタシステムにおける仮想マシンのフェイルオーバプログラムであって、
仮想マシンサーバに、
物理NICの障害を検知する処理と、
障害を検知した前記物理NICに接続される仮想スイッチの1つ以上のポートを無効化する処理と、
各前記仮想スイッチに接続され、仮想マシンのフェイルオーバと前記仮想スイッチの状態の監視を行うクラスタウェアによって、ポートの無効化に起因する前記仮想スイッチの障害を検知し、前記仮想マシンのフェイルオーバを行う処理とを、実行させることを特徴とする仮想マシンのフェイルオーバプログラム。
(付記17)
前記クラスタウェアが、
前記仮想スイッチの前記ポートに接続され、前記クラスタウェア又は前記仮想マシンに割り当てられている仮想NICと前記仮想スイッチ間の通信経路の状態を監視することを特徴とする付記16に記載の仮想マシンのフェイルオーバプログラム。
(付記18)
前記ポートの無効化処理で、
障害を検知した物理NICに接続される前記仮想スイッチのポートのうち、前記クラスタウェアに割り当てられている前記仮想NICと接続するポートを無効化することを特徴とする付記17に記載の仮想マシンのフェイルオーバプログラム。
(付記19)
前記ポートの無効化処理で、
障害を検知した物理NICに接続される前記仮想スイッチのすべてのポートを無効化することを特徴とする付記16又は付記17に記載の仮想マシンのフェイルオーバプログラム。
(付記20)
前記ポートの無効化処理で、
前記物理NICと、前記物理NICに接続される前記仮想スイッチのポートとを関連付けて管理するデータ管理テーブルを参照し、無効化するポートを決定することを特徴とする付記16から付記19の何れか1項に記載の仮想マシンのフェイルオーバプログラム。
本発明によれば、複数台の仮想マシンサーバで構成されたクラスタ環境における物理NIC障害の検出といった用途に適用できる。また、複数台の仮想マシンサーバで構成されたクラスタ環境における物理NIC障害時の仮想マシン別運用といった用途にも適用可能である。
100:クラスタシステム
1、2:仮想マシンサーバ
3、4:管理用OS
5、6:クラスタウェア
7、8、9、10:仮想スイッチ
11、12:仮想スイッチ制御部
13、14:L2スイッチ
15:外部接続
P1〜P4:物理NIC
V1〜V6:仮想NIC
C1〜C7:仮想スイッチ上のポート
801:CPU
802:主記憶部
803:通信部
804:入出力インタフェース部
805:入力装置
806:出力装置
807:記憶装置
808:システムバス

Claims (10)

  1. 仮想マシンが動作可能な仮想マシンサーバを備えるクラスタシステムであって、
    前記仮想マシンサーバが、
    1つ以上の物理NICと、
    前記物理NICに接続される1つ以上の仮想スイッチと、
    前記物理NICの障害を検知する監視手段と、
    前記障害を検知した前記物理NICに接続される前記仮想スイッチの1つ以上のポートを無効化する制御手段と、
    各前記仮想スイッチに接続され、仮想マシンのフェイルオーバと前記仮想スイッチの状態の監視を行うクラスタウェアとを含み、
    前記クラスタウェアは、
    前記制御手段によるポートの無効化に起因する前記仮想スイッチの障害を検知し、仮想マシンのフェイルオーバを行う
    ことを特徴とするクラスタシステム。
  2. 前記仮想スイッチの前記ポートに接続され、前記クラスタウェア又は前記仮想マシンに割り当てられている1つ以上の仮想NICとを含み、
    前記クラスタウェアは、
    自身に割り当てられている前記仮想NICと前記仮想スイッチ間の通信経路の状態を監視することを特徴とする請求項1に記載のクラスタシステム。
  3. 前記制御手段は、
    障害を検知した物理NICに接続される前記仮想スイッチのポートのうち、前記クラスタウェアに割り当てられている前記仮想NICと接続するポートを無効化することを特徴とする請求項2に記載のクラスタシステム。
  4. 前記制御手段は、
    障害を検知した物理NICに接続される前記仮想スイッチのすべてのポートを無効化することを特徴とする請求項1又は請求項2に記載のクラスタシステム。
  5. 前記仮想マシンサーバが、
    前記物理NICと、前記物理NICに接続される前記仮想スイッチのポートとを関連付けて管理するデータ管理テーブルを含み、
    前記制御手段は、
    前記データ管理テーブルを参照し、無効化するポートを決定することを特徴とする請求項1から請求項4の何れか1項に記載のクラスタシステム。
  6. クラスタシステムの仮想マシンが動作可能な仮想マシンサーバであって、
    1つ以上の物理NICと、
    前記物理NICに接続される1つ以上の仮想スイッチと、
    前記物理NICの障害を検知する監視手段と、
    前記障害を検知した前記物理NICに接続される前記仮想スイッチの1つ以上のポートを無効化する制御手段と、
    各前記仮想スイッチに接続され、仮想マシンのフェイルオーバと前記仮想スイッチの状態の監視を行うクラスタウェアとを含み、
    前記クラスタウェアは、
    前記制御手段によるポートの無効化に起因する前記仮想スイッチの障害を検知し、仮想マシンのフェイルオーバを行う
    ことを特徴とする仮想マシンサーバ。
  7. 前記仮想スイッチの前記ポートに接続され、前記クラスタウェア又は前記仮想マシンに割り当てられている1つ以上の仮想NICとを含み、
    前記クラスタウェアは、
    自身に割り当てられている前記仮想NICと前記仮想スイッチ間の通信経路の状態を監視することを特徴とする請求項6に記載の仮想マシンサーバ。
  8. 仮想マシンが動作可能な仮想マシンサーバを備えるクラスタシステムにおける仮想マシンのフェイルオーバ方法であって、
    仮想マシンサーバが、
    物理NICの障害を検知するステップと、
    障害を検知した前記物理NICに接続される仮想スイッチの1つ以上のポートを無効化するステップと、
    各前記仮想スイッチに接続され、仮想マシンのフェイルオーバと前記仮想スイッチの状態の監視を行うクラスタウェアによって、ポートの無効化に起因する前記仮想スイッチの障害を検知し、前記仮想マシンのフェイルオーバを行うステップと
    を有することを特徴とする仮想マシンのフェイルオーバ方法。
  9. 前記クラスタウェアは、
    前記仮想スイッチの前記ポートに接続され、前記クラスタウェア又は前記仮想マシンに割り当てられている仮想NICと前記仮想スイッチ間の通信経路の状態を監視することを特徴とする請求項8に記載の仮想マシンのフェイルオーバ方法。
  10. 仮想マシンが動作可能な仮想マシンサーバを備えるクラスタシステムにおける仮想マシンのフェイルオーバプログラムであって、
    仮想マシンサーバに、
    物理NICの障害を検知する処理と、
    前記障害を検知した前記物理NICに接続される仮想スイッチの1つ以上のポートを無効化する処理と、
    各前記仮想スイッチに接続され、仮想マシンのフェイルオーバと前記仮想スイッチの状態の監視を行うクラスタウェアによって、ポートの無効化に起因する前記仮想スイッチの障害を検知し、前記仮想マシンのフェイルオーバを行う処理とを、実行させることを特徴とする仮想マシンのフェイルオーバプログラム。
JP2011061235A 2011-03-18 2011-03-18 クラスタシステム、仮想マシンサーバ、仮想マシンのフェイルオーバ方法、仮想マシンのフェイルオーバプログラム Expired - Fee Related JP5712714B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011061235A JP5712714B2 (ja) 2011-03-18 2011-03-18 クラスタシステム、仮想マシンサーバ、仮想マシンのフェイルオーバ方法、仮想マシンのフェイルオーバプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011061235A JP5712714B2 (ja) 2011-03-18 2011-03-18 クラスタシステム、仮想マシンサーバ、仮想マシンのフェイルオーバ方法、仮想マシンのフェイルオーバプログラム

Publications (2)

Publication Number Publication Date
JP2012198651A JP2012198651A (ja) 2012-10-18
JP5712714B2 true JP5712714B2 (ja) 2015-05-07

Family

ID=47180827

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011061235A Expired - Fee Related JP5712714B2 (ja) 2011-03-18 2011-03-18 クラスタシステム、仮想マシンサーバ、仮想マシンのフェイルオーバ方法、仮想マシンのフェイルオーバプログラム

Country Status (1)

Country Link
JP (1) JP5712714B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6089766B2 (ja) * 2013-02-25 2017-03-08 日本電気株式会社 情報処理システム、及び情報処理装置の障害処理方法
KR101709632B1 (ko) 2013-03-15 2017-02-23 닛본 덴끼 가부시끼가이샤 정보 처리 장치
JP6269673B2 (ja) * 2013-07-23 2018-01-31 日本電気株式会社 情報処理装置、i/oシステム、及び、i/o制御方法
JP6278868B2 (ja) * 2014-08-28 2018-02-14 三菱電機株式会社 通信制御装置および計算装置
JP2016206898A (ja) * 2015-04-21 2016-12-08 日本電気通信システム株式会社 情報処理装置および障害検知方法、並びにコンピュータ・プログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0833835B2 (ja) * 1987-07-15 1996-03-29 富士通株式会社 エラー回復制御装置
US6944785B2 (en) * 2001-07-23 2005-09-13 Network Appliance, Inc. High-availability cluster virtual server system
JP4542514B2 (ja) * 2006-02-13 2010-09-15 株式会社日立製作所 計算機の制御方法、プログラム及び仮想計算機システム
JP4753314B2 (ja) * 2007-03-06 2011-08-24 Kddi株式会社 仮想閉域網を1つのレイヤ3スイッチとして設定管理するシステム及びプログラム
US8276208B2 (en) * 2007-12-31 2012-09-25 Intel Corporation Security-level enforcement in virtual-machine fail-over
JP4636625B2 (ja) * 2008-01-25 2011-02-23 株式会社日立情報システムズ 仮想ネットワークシステムのnic接続制御方法と仮想ネットワークのnic接続制御システムおよびプログラム
JP4990940B2 (ja) * 2009-07-06 2012-08-01 株式会社日立製作所 計算機装置及びパス管理方法

Also Published As

Publication number Publication date
JP2012198651A (ja) 2012-10-18

Similar Documents

Publication Publication Date Title
EP2951963B1 (en) Failover in response to failure of a port
JP4882845B2 (ja) 仮想計算機システム
US8127086B2 (en) Transparent hypervisor pinning of critical memory areas in a shared memory partition data processing system
JP5074274B2 (ja) 計算機システム及び通信経路の監視方法
US9575785B2 (en) Cluster system and method for providing service availability in cluster system
JP2014522052A (ja) ハードウェア故障の軽減
JP5712714B2 (ja) クラスタシステム、仮想マシンサーバ、仮想マシンのフェイルオーバ方法、仮想マシンのフェイルオーバプログラム
JP2015103092A (ja) 障害回復システム及び障害回復システムの構築方法
US9049101B2 (en) Cluster monitor, method for monitoring a cluster, and computer-readable recording medium
KR102053849B1 (ko) 항공기 시스템 및 그것의 제어 방법
US20190124145A1 (en) Method and apparatus for availability management
Rauchfuss et al. Enhanced reliability in tiled manycore architectures through transparent task relocation
JP4495248B2 (ja) 情報処理装置、障害処理方法
KR101883251B1 (ko) 가상 시스템에서 장애 조치를 판단하는 장치 및 그 방법
CN107547257B (zh) 一种服务器集群实现方法及装置
EP4361817A1 (en) 2*2oo2 security system based on cloud platform
JP5832408B2 (ja) 仮想計算機システム及びその制御方法
US20220103416A1 (en) Failure notification system, failure notification method, failure notification device, and failure notification program
CN112637336B (zh) 一种虚拟机高可用实现方法、装置及存储介质
JP2013254354A (ja) コンピュータ装置及びソフトウェア管理方法及びプログラム
US20150154083A1 (en) Information processing device and recovery management method
JP2014235503A (ja) 情報処理装置、情報処理システム、ハードディスク障害検知方法、サービス継続方法、ハードディスク障害検知プログラム、サービス継続プログラム
CN117472622A (zh) 隔离故障内存的方法、装置、设备及存储介质
CN117472623A (zh) 处理内存故障的方法、装置、设备及存储介质
JP2012093868A (ja) サービス提供システム、サービス提供サーバ、サービス提供方法、及びプログラム

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20131023

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140217

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150223

R150 Certificate of patent or registration of utility model

Ref document number: 5712714

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees