JP2012209625A - クラスタシステムの結線作業の煩雑さを軽減するシステム及び方法 - Google Patents

クラスタシステムの結線作業の煩雑さを軽減するシステム及び方法 Download PDF

Info

Publication number
JP2012209625A
JP2012209625A JP2011071562A JP2011071562A JP2012209625A JP 2012209625 A JP2012209625 A JP 2012209625A JP 2011071562 A JP2011071562 A JP 2011071562A JP 2011071562 A JP2011071562 A JP 2011071562A JP 2012209625 A JP2012209625 A JP 2012209625A
Authority
JP
Japan
Prior art keywords
node
nic
address
slave
role
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011071562A
Other languages
English (en)
Other versions
JP5483029B2 (ja
Inventor
Akio Kitada
安希雄 北田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2011071562A priority Critical patent/JP5483029B2/ja
Publication of JP2012209625A publication Critical patent/JP2012209625A/ja
Application granted granted Critical
Publication of JP5483029B2 publication Critical patent/JP5483029B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)
  • Small-Scale Networks (AREA)

Abstract

【課題】ユーザがある程度は任意にNICの結線を行うことができる技術を提供する。
【解決手段】主系ノードと従系ノードを備え、上記主系ノードに障害が発生した場合には、上記主系ノードと上記従系ノードとを切り替えるクラスタシステムにおいて、上記主系ノードは上記従系ノードからパケットリソースを受信し、上記受信したパケットリソースに基づき導通確認を行い、さらに上記主系ノードは従系ノードの各NICの役割とIPアドレスを自動的に決定する。
【選択図】図2

Description

本発明は、ユーザがある程度は任意に結線を行っても、ネットワークの設定や、各NICで行われる通信の役割が自動的に決定されることにより、クラスタの機能が実現されるシステム及び方法に関する。
近年、企業などの業務がインターネットで接続される膨大な数の情報処理端末に依存する傾向が強まっている。そのため、情報処理端末の予期せぬ停止などが深刻な損害をもたらすようになった。このような情報処理端末全体の停止などを避ける技術にクラスタシステムがある。クラスタシステムとは、複数の情報処理端末(ノード)が結合したまとまりによって構成されるシステムである。
図1に示すように、2台のノードを有する通常のクラスタシステムでは、各クラスタノードに実装されるNICの役割やIPアドレスがあらかじめ設定されており、それぞれの役割やIPアドレスに合わせて間違えなく各NICを結線する必要がある。
大抵の場合、クラスタシステムを構成する各ノードは複数のEthernet(登録商標)用のNICが実装され、システム導入時には、それぞれのNICに固有の役割とIPアドレス割り振られる。このため、クラスタシステムの導入時には、多くのケーブルの結線を間違いなく行うことが要求される。
このように、クラスタ構成を組むノード(マシン)群は、クラスタの機能を実現するため、それぞれのノードが複数経路のIPネットワークで結ばれる必要があることがわかる。このIPネットワークに利用されるNIC(network interface card)の結線方法は通常、1パターンに決まっており、これを間違いのないように行う作業は、ユーザにとって煩雑なものとなる。
従来では、クラスタシステム結線作業は、複数のNICを誤りのないように正確に結線する必要があり、煩雑なものであったが、「各NICの通信が果たす役割や、IPアドレスが、システム導入時のユーザの結線方法に従って、柔軟に変化する」という観点がこれまでなかった。
例えば、特許文献1は、管理装置から取得したプロファイルを複数保持する記憶手段を備え、プロファイルをネットワークインターフェイスに設定して、ネットワークへの接続を可能にする機能を有する端末装置を開示し、利用者にネットワークの設定を意識させることなく、容易に複数のネットワークに接続可能な環境を提供する。
特開2005−20112号公報
上述の通り、クラスタシステムの導入時には、複数のEthernet通信用のNICを誤りのないように結線する必要があるという問題があった。NICとケーブルは、どのように組み合わせても物理的にはまる可能性があるため、結線作業は、誤りのないよう慎重に行うことを要した。
また、この結線作業は一般的に複雑で、ユーザに負担を強いるものであり、結線誤りがあった場合には、クラスタの機能が正常に動作しなくなる恐れがあった。
更に、クラスタシステムには、図1に示すような2ノードのみで構成されるものもあれば、さらに多数ノードで構成されるものもある。その全ての構成に上記課題が存在し、ノード数が増えるほどこの課題はより深刻なものとなる。
上述の課題を解決するため、本発明の一態様は、主系ノードと従系ノードを備え、上記主系ノードに障害が発生した場合には、上記主系ノードと上記従系ノードとを切り替えるクラスタシステムであって、上記主系ノードは上記従系ノードからパケットリソースを受信し、上記受信したパケットリソースに基づき導通確認を行い、さらに上記主系ノードは従系ノードの各NICの役割とIPアドレスを自動的に決定するクラスタシステムに関する。
また、本発明の別の態様は、主系ノードと従系ノードを有し、上記主系ノードに障害が発生した場合には、上記主系ノードと上記従系ノードとを切り替えるクラスタシステムであって、IPネットワークを通じて上記従系ノードのMACアドレス情報を含んだパケットを受信するMAC通知パケット受理手段と、上記主系ノードの各NICから、上記MACアドレス情報を有する上記従系ノードの各NICと通信可能であるか導通確認し、通信可能なNICのグループ分けを行う導通確認手段と、上記導通確認手段によるグループ分けに基づき、結線状態が妥当であるか決定する判定手段と、上記グループ分けされた上記主系ノードのNICと上記従系ノードのNIC間でIPネットワークが接続できるように上記従系ノードの各NICの役割とIPアドレスを決定するIPアドレス・役割割り振り手段と、上記IPアドレス・役割割り振り手段で決定された上記従系ノードの各NICのIPアドレスと役割を上記従系ノードに通知するIPアドレス・役割通知手段と、を備えるクラスタシステムに関する。
また、本発明の別の態様は、主系ノードと従系ノードを備え、上記主系ノードに障害が発生した場合には、上記主系ノードと上記従系ノードとを切り替えるクラスタリング方法であって、上記主系ノードは上記従系ノードからパケットリソースを受信し、上記受信したパケットリソースに基づき導通確認を行い、さらに上記主系ノードは従系ノードの各NICの役割とIPアドレスを自動的に決定するクラスタリング方法に関する。
また、本発明の別の態様は、主系ノードと従系ノードを有し、上記主系ノードに障害が発生した場合には、上記主系ノードと上記従系ノードとを切り替えるクラスタリング方法であって、IPネットワークを通じて上記従系ノードのMACアドレス情報を含んだパケットを受信するMAC通知パケット受理ステップと、上記主系ノードの各NICから、上記MACアドレス情報を有する上記従系ノードの各NICと通信可能であるか導通確認し、通信可能なNICのグループ分けを行う導通確認ステップと、上記導通確認ステップによるグループ分けに基づき、結線状態が妥当であるか決定する判定ステップと、上記グループ分けされた上記主系ノードのNICと上記従系ノードのNIC間でIPネットワークが接続できるように上記従系ノードの各NICの役割とIPアドレスを決定するIPアドレス・役割割り振りステップと、上記IPアドレス・役割割り振りステップで決定された上記従系ノードの各NICのIPアドレスと役割を上記従系ノードに通知するIPアドレス・役割通知ステップと、を含むクラスタリング方法に関する。
本発明では、各NICの通信が果たす役割がユーザの結線方法に従って柔軟に変化するため、ユーザはある程度は任意に結線を行うことができるようになる。
本発明の更なる利点及び実施形態を、記述と図面を用いて下記に詳細に説明する。
2ノード有する通常のクラスタシステムの概要図である。 本発明に係るクラスタシステムの一実施例を示す動作概要図である。(柔軟に変化する動作の概要) 本発明に係るクラスタシステムの一実施例を説明する図である。 本発明のシステム全体の機能を説明するフローチャートである。 本発明のグループ化処理を説明するためのフローチャートである。
まず、一般的なクラスタ構成のシステムについて説明する。
クラスタシステムの種類としては、高い可用性を目的とした高可用性(High Availability)クラスタや、複数のノードで処理を分散するパフォーマンス向上のための高性能処理(High Performance Computing)クラスタなどがある。HAクラスタは、同一の機能を持たせた複数台のコンピュータ(ノード)を使用して、サービスを提供する主系ノード(稼動系ノード)と、それをバックアップするための従系ノード(待機系ノード)に分けシステムを冗長化する。稼動系ノードに障害が発生した場合には、待機系ノードを稼動系ノードに切り替える。このような仕組みで、サービスを中断させることなく可用性を高めることを目的とする。このようなクラスタシステムを特にフェイルオーバクラスタという。一方、HPCクラスタにおける各ノードの役割は、HAクラスタの各ノードと異なり一律ではない。
本発明は、特に、HAクラスタを改良したものであり、一のノードにより他のノードの機能を制御可能なHAクラスタを提供する。
一般に、クラスタシステムは複数のノードで構成される。それらのマシン(ノード)間では様々な通信が行われ、以下のような各用途に応じたネットワークが形成される。
(a)障害検知機能のためのネットワーク
他ノードの障害の発生を、検知するための機能である。各ノードは、他ノードに対して、自ノードが正常に動作している旨を、複数のIPネットワークの通信経路を利用して定期的に伝える。各ノードは、他ノードからの上記通信が途絶えることで、該当ノードの障害を検知することができる。
(b)サービスネットワーク
クラスタマシンが提供するサービス(例えば、ファイル共有機能や、様々なアプリケーション機能など)を、クライアントマシンに提供するネットワークである。
(c)管理ネットワーク
各マシンを管理するためのネットワークである。また、このネットワークは先述した障害検知機能にも利用されることがある。
(d)その他
クラスタの動作を制御するためのネットワークや、クラスタの制御の一環として、他ノードをダウンさせる通信などがある。
上記の通信は、それぞれのクラスタシステムによって、一つの経路でまとめて複数の通信を行う場合もあれば、一つの通信を複数の経路で冗長化する場合もある。
次に、本発明の実施の形態について図面を参照しつつ説明する。
本実施の形態によるクラスタシステムは、稼動中の稼動系ノードに障害が発生したことを検知すると、待機系ノードへ処理を切り替える(フェイルオーバさせる)といった処理を行う。上述のとおり、本発明で対象とするクラスタシステムとは、特に高可用性のためのクラスタである。
次に、図2を参照しながら本発明の実施の形態について説明する。
図2は、本発明の実施の形態によるクラスタシステム1が柔軟に変化する動作の概略構成を示す図である。ここでは、簡単のため、クラスタノードが2台(masterノード10とslaveノード20)の場合を説明する。他の実施の形態において、複数台のクラスタノードによりクラスタシステム1が構成されていても何ら構わない。
同図に示すように、本実施の形態によるクラスタシステム1は、masterノード10、slaveノード20を備えている。masterノード10は、障害検知通信用NIC(ネットワークインタフェースカード)11、管理LAN用NIC12、及びサービスLAN用NIC13を有する。また、slaveノード20は、役割未定のNIC21、22、23を有する。
次に、本実施の形態によるクラスタシステム1の動作について説明する。まず、slaveノード20は、その役割未定の各NIC21、22、及び23のMACアドレスをmasterノード10に送信する。そして、masterノード10の各NIC11、12、13とslaveノード20の各NIC21、22、23との結線状態に基づき、masterノード10は、slaveノード20の各NIC21、22、23の役割とIPアドレスを決定し、その内容をslaveノード20に通知する。slaveノード20は、受信した内容に応じて、各NIC21、22、23の役割とIPアドレスを設定する。
例えば、NIC11とNIC21が結線する場合には、NIC21は障害検知通信用に設定され、さらにIPアドレスが設定される。他の例として、NIC11とNIC22が結線する場合には、NIC22は管理LAN用となり、そのためのIPアドレスが設定される。
次に、図3を参照して、本実施の形態によるクラスタシステム2を構成する各構成要素について詳細に説明する。
図3では、slaveノードが複数台あった場合の詳細な動作説明を行う。本実施の形態では、一例として、クラスタシステム2は、一台のmasterのノード100と、2台のslaveのノード200、300から構成される。なお、本実施の形態では、masterノードはslaveノードの台数を予め知っていることとする。
ここでは、1台のmasterノード100及び2台のslaveノード200、300を備える計3台のノードの構成について説明する。具体的には、master100ノードのNIC108、109(MACアドレス11、MACアドレス12)、slaveノード200のNIC206、207(MACアドレス21、MACアドレス22)、及びslaveノード300のNIC306、307(MACアドレス31、MACアドレス32)がスイッチ400を介して接続され、さらに、master100ノードのNIC110(MACアドレス13)、slaveノード200のNIC208(MACアドレス23)、及びslaveノード300のNIC308(MACアドレス33)がスイッチ500を介して接続された結線状態の場合について説明する。本発明は上記構成に限られるものではなく、他の実施の形態として、さらに複数台のslaveノードに対しても、同様の考え方ができる。
masterノード100には、複数のNIC108、109、110が実装され、クラスタ制御機能101を有する。上記クラスタ制御機能101は、MAC通知パケット受理手段102、slaveノード数の情報103、導通確認手段104、判定手段105、IPアドレス・役割割り振り手段106、及びIPアドレス・役割通知手段107を含む。
同様に、slaveノード200には、複数のNIC206、207、208が実装され、クラスタ制御機能201を有する。上記クラスタ制御機能201は、自MAC通知手段202、自ノードMACリスト203、IPアドレス・役割受理手段204、IPアドレス・役割設定手段205を含む。なお、slaveノード300は、slaveノード200の構成と同様であるためその説明を省略する。
以下、本実施の形態によるクラスタシステム2を構成する各構成要素について詳細に説明する。まず、masterノード100を構成する各構成要素について説明する。
MAC通知パケット受理手段102は、slaveノード200、300の自MAC通知手段202、302により、IPネットワークを通じて送付される、MACリストの情報を含んだパケット(MAC通知パケット)を受信する手段である。また、slaveノード数の情報103により、全てのslaveノード200、300からMAC通知パケットが届いたか否かを判断する。slaveノード数の情報103は、例えばメモリなどの記憶装置に格納されている。
導通確認手段104は、masterノード100の特定のNIC108、109、110と、slaveノード200、300の特定のMACアドレスを持つNIC206、207、208、306、307、308とが通信可能であるか否かを確認する機能である。判定手段105は、導通確認手段104により得られた情報に従って作成された「通信可能NICグループテーブル」を基に、結線状態が妥当であるか否かを決定する機能である。通信可能NICグループテーブルや結線状態の判定方法については、以下の実施の形態によるクラスタシステムの動作の説明においてより詳細に説明する。
IPアドレス・役割割り振り手段106は、slaveノード200、300の各NIC206、207、208、306、307、308に対して、導通しているmasterノード100のNIC108、109、110とIPネットワークが接続できるようにIPアドレスを割り振り、かつ、その導通しているmasterノード100のNIC108、109、110と通信する役割を決定する手段である。
IPアドレス・役割通知手段107は、IPアドレス・役割割り振り手段106で決定されたslaveノード200、300の各NIC206、207、208、306、307、308のIPアドレスと役割を、各slaveノード200、300に通知する手段である。
次に、slaveノード200、300を構成する各構成要素について詳細に説明する。
slaveノード200、300における自MAC通知手段202、302は、自ノードMACリスト203、303の情報を含んだ特殊なパケットをmasterノード100のMAC通知パケット受理手段102へブロードキャストする手段である。ここで、自ノードMACリスト203、303とは、自ノードの持つ各NICのMACアドレスのリストであり、例えばメモリなどの記憶装置に格納されている。
IPアドレス・役割受理手段204、304は、IPアドレス・役割通知手段107から通知された、各NIC206、207、208、306、307、308の役割とIPアドレスの情報を受理する手段である。
IPアドレス・役割設定手段205、305は、IPアドレス・役割受理手段204、304で受理した各NIC206、207、208、306、307、308の役割とIPアドレスの情報を、実際に各上記NICに設定する手段である。
次に、本願発明の実施形態によるクラスタシステム2の動作について詳細に説明する。ここでは、簡略化のため、MACアドレスは、以後「MAC」と省略する。
まず、slaveノード200、300は、各NIC206、207、208、及び306、307、308へのIPアドレスや役割が割り振られていない状態で起動した場合、自MAC通知手段202、302により、各NIC206、207、208、306、307、308から、以下のようなMAC通知パケットをブロードキャストでmasterノード100へ送信し続ける(ステップS400)。

・ slaveノード200が送付するMAC通知パケット
あて先MACアドレス: FFFFFFFFFFFF (ブロードキャスト)
あて先IPアドレス : FFFFFFFF (ブロードキャスト)
あて先ポート番号(UDP): 「本パケットを識別するための特定な値」
データ部: 自身の各NICのMACのリスト「21、22、23」

・ slaveノード300が送付するMAC通知パケット
あて先MACアドレス: FFFFFFFFFFFF (ブロードキャスト)
あて先IPアドレス : FFFFFFFF (ブロードキャスト)
あて先ポート番号(UDP): 「本パケットを識別するための特定な値」
データ部: 自身の各NICのMACのリスト「31、32、33」
次に、masterノード100は、各NIC206、207、208、306、307、308の役割とIPアドレスの通知(ステップS408で実施する)をslaveノード200、300へ送付していない状態で起動した場合、MAC通知パケット受理手段102により、slaveノード200、300側からのMAC通知パケットが到着するのを待ち、MAC通知パケットを受信する(ステップS401)。ここでは、masterノード100の各NIC108、109、110の役割やIPアドレスは、ユーザやベンダにより、既に設定されているものとする。
そして、masterノード100は、全てのslaveノード200、300からMAC通知パケットを受信したことを確認後(S402)、slaveノード200、300側より通知された全てのMACアドレス(例として、ここでは、MACアドレス21、22、23、31、32、33)について、導通確認手段104により、自身の全てのNIC108、109、110から導通確認を行い(ステップS403)通信可能なNICのグループ分けを行なう(ステップS404)。本実施の形態では、以下の3つの導通確認を行う。
1.NIC(MAC11)から、通知された全てのMAC(21,22,23,31,32,33)への導通確認
2.NIC(MAC12)から、通知された全てのMAC(21,22,23,31,32,33)への導通確認
3.NIC(MAC13)から、通知された全てのMAC(21,22,23,31,32,33)への導通確認
本実施の形態における構成の場合には、導通確認結果は、以下の表1のようになる。
Figure 2012209625
この結果より、以下表2のような「通信可能NICグループテーブル」を作成する。
Figure 2012209625
通信可能NICグループテーブルの作成後、masterノード100は、S403で得られた各NICの導通状態を基に、判定手段105を用いて結線方法(結線状態)が妥当であるかチェックする(ステップS406)。判定手段105が結線状態は妥当であると判断した場合(ステップS406のYES)、次の処理(ステップS407)に進む。一方、判定手段105が結線状態は妥当でないと判断した場合(ステップS406のNO)、一定時間をおいてから、S403における導通確認からやり直す。
判定手段105の判断基準は、以下のような、クラスタシステム2のポリシーによる。
・ 一つの経路で複数の通信を行ってよいか?
・ 必ずしも必要でない通信や、必ず必要な通信はどれか?
また、以下は、全ての通信が必要であって、一つの経路で行なう通信は一つだけとした場合の判断項目の例である。
・全てのslaveノード200、300について、役割の数以上のNICと通信できるか?
・全ての通信可能なグループで、masterノード100側NICの数、各slaveノード200、300側NICの数が等しくなっている。
次に、slaveノード200、300側のNIC206、207、208、306、307、308の役割を通信可能グループ内で順番に決める。また、IPアドレス・役割割り振り手段106により、上記各NICに通信に応じたIPアドレスを決める(ステップS407)。そして、これらの情報を、IPアドレス・役割通知手段107によって、slaveノード200、300側へ通知する(ステップS408)。
ステップS408でmasterノード100側から情報が通知されると、slaveノード200、300は自身のIPアドレス・役割受理手段204、304によりその情報を受け取る。そして、IPアドレス・役割設定手段205、305が、各NIC206、207、208、306、307、308の役割とIPアドレスを設定する(ステップS409)。
このように、本発明の実施の形態では、各NICの通信が果たす役割が、ユーザの結線方法に従って柔軟に変化するため、ユーザはある程度は任意に結線を行うことができるようになる。また、結線ミスにより、クラスタ機能が正常に動作しなくなる可能性を低減することができる。
以上のように、本発明の実施の形態について説明したが、本発明は上記構成に限定されるものではなく、例えば、masterノードやslaveノードに、NICカードが4個や5個などの複数個実装される構成でもあってもよい。
また、図3において、3台のノードのNICのうち、6個のNIC108、109、206、207、306、307が一つのスイッチ400に繋がり、3個のNIC110、208、308がもう一つのスイッチ500に繋がった構成(つまり、9個のNICに対して2個のスイッチを有する構成)を示したが、NICとスイッチの個数及び組み合わせは、これに限定されるものではない。例えば、各ノードに5個のNICを実装させたりスイッチを3個備えたりしてもよいことは言うまでもない。
次に、本発明の他の実施の形態として、masterからスイッチへのポート(不図示)の適切なグループ化(vlanで分ける)方法について以下に詳細に説明する。
masterノード100は、全ての通信経路の接続状態を把握することができる。そのため、接続されたスイッチ400、500に対して、各スイッチの接続ポートの適切なグループ化(vlanで分けること)を行うための情報を提供可能である。これによりスイッチ400、500は、通信パケットを余計なポートに対して送出しないように、ポートのグループ設定を行うことができる。
上記グループ化の手順は、以下のとおりである。ここで、masterノード100は、自身のNIC108(MAC11)と、slaveノード200のNIC(MAC 21)が通信を行い、かつ自身のNIC109(MAC12)と、slaveノード200のNIC(MAC 22)が通信を行なっていることを把握していたものとする。
また、本実施の形態において、スイッチ400は、ネットワーク経由で「どのMACが、どのポートに接続されているか?」という質問がきた場合、ネットワーク経由で回答することができるものとする。また、ネットワーク経由で、スイッチ400のポートのグループ化(vlanで分けること)の設定を行なうことができる機能を、スイッチ400は持っているものとする。
まず、masterノード100は、スイッチ400に対して、MAC11、MAC 12、MAC21、及びMAC 22が、スイッチ400のどのポートに接続されているかを問い合わせる(ステップS500)。
masterノード100からの問い合わせに対して、スイッチ400は、MAC 11がポート1に、MAC 12がポート2に、MAC21がポート3に、MAC22がポート4に接続されていることをmasterノード100に回答する(ステップS501)。
次に、masterノード100は、把握している通信情報を参考にして、ポート1とポート3、及びポート2とポート4のグループ化(vlanで分ける)をスイッチ400に対して指示する(ステップS502)。
そして、スイッチ400は、S502のmasterノード100からの情報を基に、ポートのグループ化(vlanで分けること)を行なう(ステップS503)。
以上のように、masterノード100が把握する通信経路の接続情報を使用して、簡易にポートのグループ分けを行うことができる。その結果、スイッチのポート設定だけで論理的ユーザをグループ化することができるので柔軟なネットワーク設計が可能となる。また、構築された VLAN 内だけの通信に限られるために、部門の分離をしてセキュリティの向上につなげることができる。
なお、上述した実施形態に含まれる特徴を用いたクラスタリング方法も本発明の範疇に含まれる。
以上、いくつかの実施の形態に基づき本発明を具体的に説明したが、本発明は上述の実施の形態に限定されるものではない。本発明の要旨を逸脱しない範囲で種々の変更を施すことができ、これらの変更例も本発明に含まれることはいうまでもない。
1 クラスタシステム
10 masterノード
11 障害検知通信用NIC
12 管理LAN用NIC
13 サービスLAN用NIC
20 slaveノード
21、22、23 役割未定NIC
2 クラスタシステム
100 masterノード
101 クラスタ制御機能
102 MAC通知パケット受理手段
103 slaveノード数
104 導通確認手段
105 判定手段
106 IPアドレス・役割割り振り手段
107 IPアドレス・役割通知手段
108、109、110 masterノード側NIC
200、300 slaveノード
201、301 クラスタ制御機能
202、302 自MAC通知手段
203、303 自ノードMACリスト
204、304 IPアドレス・役割受理手段
205、305 IPアドレス・役割設定手段
206、207、208、306、307、308 slaveノード側NIC
400、500 スイッチ

Claims (9)

  1. 主系ノードと従系ノードを備え、前記主系ノードに障害が発生した場合には、前記主系ノードと前記従系ノードとを切り替えるクラスタシステムにおいて、
    前記主系ノードは前記従系ノードからパケットリソースを受信し、前記受信したパケットリソースに基づき導通確認を行い、さらに前記主系ノードは前記従系ノードの各NICの役割とIPアドレスを自動的に決定することを特徴とするクラスタシステム。
  2. 前記パケットリソースは、従系ノードのMACリストの情報を含んだパケットであることを特徴とする請求項1に記載のクラスタシステム。
  3. 前記導通確認は、主系ノードのNICと従系ノードのNIC間で通信可能か否かにより判断されることを特徴とする請求項1に記載のクラスタシステム。
  4. 前記従系ノードは、複数台備えられることを特徴とする請求項1乃至3に記載のクラスタシステム。
  5. 主系ノードと従系ノードを有し、前記主系ノードに障害が発生した場合には、前記主系ノードと前記従系ノードとを切り替えるクラスタシステムにおいて、
    IPネットワークを通じて前記従系ノードのMACアドレス情報を含んだパケットを受信するMAC通知パケット受理手段と、
    前記主系ノードの各NICから、前記MACアドレス情報を有する前記従系ノードの各NICと通信可能であるか導通確認し、通信可能なNICのグループ分けを行う導通確認手段と、
    前記導通確認手段によるグループ分けに基づき、結線状態が妥当であるか決定する判定手段と、
    前記グループ分けされた前記主系ノードのNICと前記従系ノードのNIC間でIPネットワークが接続できるように前記従系ノードの各NICの役割とIPアドレスを決定するIPアドレス・役割割り振り手段と、及び、
    前記IPアドレス・役割割り振り手段で決定された前記従系ノードの各NICのIPアドレスと役割を前記従系ノードに通知するIPアドレス・役割通知手段と、を備えることを特徴とするクラスタシステム。
  6. 前記主系ノードのNICと前記従系ノードのNIC間の導通状態に基づいて、前記主系ノードと前記従系ノード間に接続されたスイッチの接続ポートのグループ化を行うことを特徴とする請求項1又は5に記載のクラスタシステム。
  7. 主系ノードと従系ノードを備え、前記主系ノードに障害が発生した場合には、前記主系ノードと前記従系ノードとを切り替えるクラスタリング方法において、
    前記主系ノードは前記従系ノードからパケットリソースを受信し、前記受信したパケットリソースに基づき導通確認を行い、さらに前記主系ノードは前記従系ノードの各NICの役割とIPアドレスを自動的に決定することを特徴とするクラスタリング方法。
  8. 主系ノードと従系ノードを有し、前記主系ノードに障害が発生した場合には、前記主系ノードと前記従系ノードとを切り替えるクラスタリング方法において、
    IPネットワークを通じて前記従系ノードのMACアドレス情報を含んだパケットを受信するMAC通知パケット受理ステップと、
    前記主系ノードの各NICから、前記MACアドレス情報を有する前記従系ノードの各NICと通信可能であるか導通確認し、通信可能なNICのグループ分けを行う導通確認ステップと、
    前記導通確認ステップによるグループ分けに基づき、結線状態が妥当であるか決定する判定ステップと、
    前記グループ分けされた前記主系ノードのNICと前記従系ノードのNIC間でIPネットワークが接続できるように前記従系ノードの各NICの役割とIPアドレスを決定するIPアドレス・役割割り振りステップと、及び、
    前記IPアドレス・役割割り振りステップで決定された前記従系ノードの各NICのIPアドレスと役割を前記従系ノードに通知するIPアドレス・役割通知ステップと、を備えることを特徴とするクラスタリング方法。
  9. 前記主系ノードのNICと前記従系ノードのNIC間の導通状態に基づいて、前記主系ノードと前記従系ノード間に接続されたスイッチの接続ポートのグループ化を行うことを特徴とする請求項7又は8に記載のクラスタリング方法。
JP2011071562A 2011-03-29 2011-03-29 クラスタシステムの結線作業の煩雑さを軽減するシステム及び方法 Expired - Fee Related JP5483029B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011071562A JP5483029B2 (ja) 2011-03-29 2011-03-29 クラスタシステムの結線作業の煩雑さを軽減するシステム及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011071562A JP5483029B2 (ja) 2011-03-29 2011-03-29 クラスタシステムの結線作業の煩雑さを軽減するシステム及び方法

Publications (2)

Publication Number Publication Date
JP2012209625A true JP2012209625A (ja) 2012-10-25
JP5483029B2 JP5483029B2 (ja) 2014-05-07

Family

ID=47189052

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011071562A Expired - Fee Related JP5483029B2 (ja) 2011-03-29 2011-03-29 クラスタシステムの結線作業の煩雑さを軽減するシステム及び方法

Country Status (1)

Country Link
JP (1) JP5483029B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106790328A (zh) * 2015-11-23 2017-05-31 北京睿骊通电子技术有限公司 机载分布式采集系统
CN110995805A (zh) * 2019-11-24 2020-04-10 浪潮电子信息产业股份有限公司 一种集群网卡的确定方法、装置、设备及可读存储介质
CN111708668A (zh) * 2020-05-29 2020-09-25 北京金山云网络技术有限公司 集群故障的处理方法、装置及电子设备
CN111866041A (zh) * 2019-04-28 2020-10-30 杭州海康威视系统技术有限公司 业务设备选取、云存储集群更新的方法、装置及存储介质
CN113162797A (zh) * 2021-03-03 2021-07-23 山东英信计算机技术有限公司 一种分布式集群的主节点故障的切换方法、系统及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10135993A (ja) * 1996-10-29 1998-05-22 Mitsubishi Electric Corp 二重系システムにおけるアドレス設定方式
JP2005244672A (ja) * 2004-02-26 2005-09-08 Nec Corp ネットワークの障害監視処理システム及び方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10135993A (ja) * 1996-10-29 1998-05-22 Mitsubishi Electric Corp 二重系システムにおけるアドレス設定方式
JP2005244672A (ja) * 2004-02-26 2005-09-08 Nec Corp ネットワークの障害監視処理システム及び方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106790328A (zh) * 2015-11-23 2017-05-31 北京睿骊通电子技术有限公司 机载分布式采集系统
CN106790328B (zh) * 2015-11-23 2021-04-02 北京睿骊通电子技术有限公司 机载分布式采集系统
CN111866041A (zh) * 2019-04-28 2020-10-30 杭州海康威视系统技术有限公司 业务设备选取、云存储集群更新的方法、装置及存储介质
CN111866041B (zh) * 2019-04-28 2023-05-02 杭州海康威视系统技术有限公司 业务设备选取、云存储集群更新的方法、装置及存储介质
CN110995805A (zh) * 2019-11-24 2020-04-10 浪潮电子信息产业股份有限公司 一种集群网卡的确定方法、装置、设备及可读存储介质
CN110995805B (zh) * 2019-11-24 2022-02-18 浪潮电子信息产业股份有限公司 一种集群网卡的确定方法、装置、设备及可读存储介质
US11979368B2 (en) 2019-11-24 2024-05-07 Inspur Electronic Information Industry Co., Ltd. Method, apparatus and device for determining cluster network card, and readable storage medium
CN111708668A (zh) * 2020-05-29 2020-09-25 北京金山云网络技术有限公司 集群故障的处理方法、装置及电子设备
CN111708668B (zh) * 2020-05-29 2023-07-07 北京金山云网络技术有限公司 集群故障的处理方法、装置及电子设备
CN113162797A (zh) * 2021-03-03 2021-07-23 山东英信计算机技术有限公司 一种分布式集群的主节点故障的切换方法、系统及介质

Also Published As

Publication number Publication date
JP5483029B2 (ja) 2014-05-07

Similar Documents

Publication Publication Date Title
JP5381998B2 (ja) クラスタ制御システム、クラスタ制御方法、及びプログラム
JP5131651B2 (ja) 負荷分散システム、負荷分散方法、及びプログラム
CN101316236B (zh) Vrrp备份组负载分担方法及路由器
EP2617165B1 (en) System and method for providing ethernet over infiniband virtual hub scalability in a middleware machine environment
CN111865514B (zh) 用于软件定义网络路由服务的控制平面隔离
EP2993838B1 (en) Methods for setting a member identity of gateway device and corresponding management gateway devices
CN108306777B (zh) 基于sdn控制器的虚拟网关主备切换方法及装置
CN102315975B (zh) 一种基于irf系统的故障处理方法及其设备
CN102821044B (zh) 一种配置服务器集群的方法和装置
US9455916B2 (en) Method and system for changing path and controller thereof
CN105453487A (zh) 用于数据中心环境中的双归属部署的扩展虚拟站接口发现协议(vdp)和vdp类协议
CN102231682B (zh) 一种堆叠冲突的处理方法和设备
JP6341914B2 (ja) ミドルウェアマシン環境で高可用性(ha)ネットワーク通信をサポートするためのシステムおよび方法
CN1815979A (zh) 用于提供网络连接的设备和方法
JP5483029B2 (ja) クラスタシステムの結線作業の煩雑さを軽減するシステム及び方法
CN104104570A (zh) Irf系统中的聚合处理方法及装置
US20140067983A1 (en) Bi-directional synchronization enabling active-active redundancy for load-balancing switches
EP2731313A1 (en) Distributed cluster processing system and message processing method thereof
CN101938370A (zh) 用于基于边界网关巡逻的虚拟专用局域网业务多宿主机环境的冗余伪线
US11349706B2 (en) Two-channel-based high-availability
EP3038296B1 (en) Pool element status information synchronization method, pool register and pool element
EP3029883A1 (en) Network protection method and apparatus, next-ring node, and system
CN102333027A (zh) 基于vrrpe备份组的流量负载分担实现方法及其装置
EP3253030B1 (en) Method and device for reporting openflow switch capability
US7869351B2 (en) Communication techniques and generic layer 3 automatic switching protection

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130426

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130508

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130708

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130911

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131111

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140204

R150 Certificate of patent or registration of utility model

Ref document number: 5483029

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees