JP2009135580A - 装置内ネットワーク管理システム - Google Patents

装置内ネットワーク管理システム Download PDF

Info

Publication number
JP2009135580A
JP2009135580A JP2007307674A JP2007307674A JP2009135580A JP 2009135580 A JP2009135580 A JP 2009135580A JP 2007307674 A JP2007307674 A JP 2007307674A JP 2007307674 A JP2007307674 A JP 2007307674A JP 2009135580 A JP2009135580 A JP 2009135580A
Authority
JP
Japan
Prior art keywords
port
information
server
management system
port information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007307674A
Other languages
English (en)
Other versions
JP4915334B2 (ja
Inventor
Hiroyuki Kida
裕之 木田
Koji Higuchi
晃治 樋口
Ichiji Koike
一司 小池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2007307674A priority Critical patent/JP4915334B2/ja
Publication of JP2009135580A publication Critical patent/JP2009135580A/ja
Application granted granted Critical
Publication of JP4915334B2 publication Critical patent/JP4915334B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】L2SWを用いた装置内ネットワークにおけるサーバ間の通信経路の迂回および復旧を含む管理を行う装置内ネットワーク管理システムを提供する。
【解決手段】複数のサーバ装置を複数のレイヤ2スイッチを介して接続して構成される装置内ネットワークを管理する装置内ネットワーク管理システムにおいて、複数のサーバ装置間に設定される通信経路それぞれについて、通信経路における中継を行う全てのレイヤ2スイッチから中継にかかわるポートを示すポート情報を収集する収集手段と、各サーバ装置について設定された通信経路に対応して収集されたポート情報を、各通信経路に関連付けて保持する保持手段と、各レイヤ2スイッチから通知される障害情報によって、保持手段に各サーバ装置について設定された通信経路に関連付けて保持されたポート情報で示されるポートに障害が発生したことが示されたときに、ポート情報が関連付けられた経路情報を無効化して迂回経路への切り替えを促す迂回制御手段とを備える。
【選択図】 図1

Description

本発明は、ラックマウント型サーバやブレードサーバをレイヤ2スイッチ(以下、L2SWと称する)を用いて接続して構成される小規模のサーバシステムにおいて、装置内ネットワークにおける通信経路の迂回および復旧などを管理する装置内ネットワーク管理システムに関する。
このような小規模サーバシステムでは、CPUユニットが収められたラック間あるいはシェルフ間をL2SWを介して接続してIPネットワークが構築されており、L2SWを多段接続した構成のシステムの例もある。
L2SWを用いて構成された装置内ネットワークでは、サーバ装置からのフレームを中継するL2SWは、宛先および発信元のサーバのMACアドレスと自装置のポートとの対応関係を学習し、学習した対応関係に基づいて、指定されたアドレスに対応付けられたポートからフレームを送出し、このポートに接続されたL2SWあるいはサーバ装置に渡している。また、このような装置内ネットワークに接続されているサーバ装置では、同様に、宛先のサーバ装置およびそのポートを示すMACアドレスと自装置のポートとの対応関係を示す情報のみが管理されている。
したがって、例えば、図9に示したL2SW11のポートP7とL2SW12のポートP5とを結ぶケーブルに障害が発生し、この障害がこれらのポートを利用して設定された通信経路を介して接続されているサーバ装置A,Bに通知されたとしても、各サーバ装置A,Bでは、この時点では、対向するサーバ装置の各ポート(図9において、符号Pa1,Pa2,Pb1,Pb2を付して示す)について設定された通信経路のうちいずれかの通信経路が影響を受けることは認識されていなかった。
このように、L2SWがポート(図9において、符号P1〜P9を付して示す)の障害を検出したときに、検出された障害を監視ノードに送り、監視ノードがそのような情報を集約するといった仕組み自体は存在するものの、個々のポートに関する障害情報の解釈やそれに基づく対策などは、管理者に委ねられている。
このため、従来は、サーバ間で定期的に監視パケットのやり取りを行い(ヘルスチェック)、このヘルスチェックの結果に基づいて、経路の途中の障害が検出されたときに、サーバ主導で迂回経路を設定する仕組みが用意されている。
その一方、予め個々のL2SWにおいて代替経路を設定しておくことにより、L2SW間の通信経路の障害に応じて、迅速に代替経路を設定する仕組みも提案されている(特許文献1参照)。
特開2007−27954号公報
ヘルスチェックを用いた従来の装置内ネットワーク管理システムでは、サーバの処理負荷の大小や遅延時間の長短を考慮して、監視パケットへの応答が一定数連続して検出されなかったときに、通信障害を検出する手法が一般的である。
しかしながら、この手法では、サーバの処理負担の増大に応じて一時的に監視パケットの遅延時間が大きくなった場合などを通信経路の障害と誤判定することを防ぐことができる反面、ヘルスチェックによって通信障害が検出されるまでに、ヘルスチェック周期の数倍の時間が必要である。
したがって、従来の手法では、ヘルスチェックによって通信障害が検出されるまで迂回経路への切り替えが行われないため、図9に示すようにサーバA,B間の経路が、上述したL2SW11,12を用いた通信経路とL2SW21,22を用いた通信経路とで2重化されている場合であっても、通信障害の発生から一定の時間が経過するまで迂回経路が設定されず、サーバ間で2重化された経路が有効に利用されていなかった。
一方、特許文献1に開示された技法によれば、代替経路への切り替えを迅速化することは可能であるが、予め、個々のL2SWに代替経路にかかわるポート情報を設定しておくとともに、中継するL2SW同士が連携して動作するように設定する必要がある。このために、L2SWの特性である接続の柔軟性が大幅に制限されてしまう。
本発明は、L2SWにおけるポートの接続関係を示す情報を利用して、L2SWを用いた装置内ネットワークにおけるサーバ間の通信経路の迂回および復旧を含む管理を行う装置内ネットワーク管理システムを提供することを目的とする。
上述した目的は、以下に述べる装置内ネットワーク管理システムによって達成可能である。
この装置内ネットワーク管理システムの特徴は、複数のサーバ装置を複数のレイヤ2スイッチを介して接続して構成される装置内ネットワークを管理する装置内ネットワーク管理システムにおいて、複数のサーバ装置間に設定される通信経路それぞれについて、通信経路における中継を行う全てのレイヤ2スイッチから中継にかかわるポートを示すポート情報を収集する収集手段と、各サーバ装置について設定された通信経路に対応して収集されたポート情報を、各通信経路に関連付けて保持する保持手段と、各レイヤ2スイッチから通知される障害情報によって、保持手段に各サーバ装置について設定された通信経路に関連付けて保持されたポート情報で示されるポートに障害が発生したことが示されたときに、ポート情報が関連付けられた経路情報を無効化して迂回経路への切り替えを促す迂回制御手段とを備えている点にある。
このように構成された第1の装置内ネットワーク管理システムでは、例えば、各サーバ装置が装置内ネットワークによって接続された他のサーバ装置との間の通信経路を設定した後に、収集手段により、設定された各通信経路における中継を行うレイヤ2スイッチそれぞれから中継にかかわるポートを示すポート情報が通信経路ごとに収集される。各通信経路に関連付けてこのポート情報を保持手段に保持することにより、各通信経路とこれらの通信経路における中継を行うレイヤ2スイッチにおいて使用されるポートとの関連が示される。
その後、上述したようにして通信経路との関連が示されたポートについて障害の発生が通知されたときに、迂回制御手段により、障害が通知されたポートが関連付けられた経路情報を無効化することにより、レイヤ2スイッチにおいて検出されたポートの障害を示す情報をサーバ間の通信経路管理に反映する。これに応じて、迂回経路への切り替えが促される。
また、上述した構成の装置内ネットワーク管理システムにおいて、各レイヤ2スイッチから障害が発生しているポートの機能が復旧した旨の復旧情報が通知されたときに、少なくとも迂回制御手段によって無効化された経路情報に対応するサーバ装置との間の通信経路の再設定を促す復旧制御手段を備えた装置内ネットワーク管理システムを構成することも可能である。
このように構成された装置内ネットワーク管理システムでは、上述したようにして、レイヤ2スイッチのポートに障害が発生したことを示す障害通知に応じて、サーバ装置の迂回制御手段によって障害が発生したポートを中継に利用している通信経路の経路情報が無効化された後に、例えば、そのポートの障害が復旧した旨の復旧情報が通知されると、復旧制御手段により、無効化されている経路情報に対応するサーバ装置との間の通信経路の再設定が行われ、再度収集されたポート情報がこの経路情報に関連付けられて保持手段に格納される。
上述したように、本発明にかかわる装置内ネットワーク管理システムによれば、レイヤ2スイッチのポートに障害が発生したことおよび障害が復旧したことを示す情報をサーバ装置で管理されている経路情報の管理に反映することができる。これにより、レイヤ2スイッチのポートの障害発生した際に、迅速に迂回経路を設定することができる。特に、予め冗長な通信経路が設定されている場合には、通信経路の冗長性を有効活用することにより、ほぼ即時に迂回経路への切り替えが可能であるので、音声通信のように、リアルタイム性が求められるデータを扱うシステムで極めて有効である。
また、復旧の際に、通信経路の設定を試行する範囲を装置内ネットワークによって接続可能な全てのサーバ装置にまで拡大することにより、障害の復旧作業によって副次的に設定可能となった通信経路を含めて可能な通信経路に関する情報を漏れなく収集して経路情報の管理処理に供することができる。
以下、図面に基づいて、本発明の実施形態について詳細に説明する。
図1に、本発明にかかわる第1の装置内ネットワーク管理システムの実施形態を示す。
図1に示したサーバシステムでは、サーバ装置210aの2つのポートPa1、Pa2はレイヤ2スイッチ(L2SW)2201のポートP11およびL2SW2202のポートP21にそれぞれ接続されており、また、サーバ装置210bの2つのポートPb1、Pb2は、L2SW2203のポートP32およびL2SW2204のポートP42にそれぞれ接続されている。更に、L2SW2201,2203のポートP12、P22とL2SW2203およびL2SW2204のポートP31、P41とが互いに接続されており、これにより、L2SW2201,2202,2203,2204を用いた装置内ネットワークが構築されている。
なお、図1においては、サーバ装置210aおよびL2SW2201について詳細構成を示し、サーバ装置210aと同等な装置であるサーバ装置210bおよびL2SW2201と同等な装置であるL2SW2202,2203,2204の詳細構成の図示は省略した。また、以下の説明で、サーバ装置210a,210bおよびL2SW2201,2202,2203,2204を総称する際は、単に、サーバ装置210およびL2SW220と称する。
図1に示した装置内ネットワークにおける経路情報は、サーバ装置210a,210bにそれぞれ備えられた通信処理部211がアドレス解決プロトコル(ARP)を実行することにより収集される。このとき、手順処理部213は、フレーム送受信部212およびネットワークインタフェース217を介して自装置以外の全てのサーバ装置を宛先とするARPリクエストを自装置に備えられた各ポートから送出し、これに対する応答を収集する。これにより、例えば、図2(a)に示すように、サーバ装置210aの経路情報テーブル214には、宛先のサーバ装置210bを示すサーバ識別情報(サーバB)とARPリクエストの送出に利用したポートを示すポート識別情報(Pa1,Pa2)との組み合わせに対応して、ARPリクエストに対して返された応答で示されたMACアドレス(ADR-B1、ADR-B2)、すなわち、あて先として指定されたサーバ装置210bの2つのポートにそれぞれ付与されたMACアドレスが格納され、この対応関係が経路情報として以降のフレーム送受信処理に供される。同様にして、サーバ装置210bの経路情報テーブル(図示せず)には、図2(b)に示すように、サーバ装置210bのポートPb1,Pb2がサーバ装置210aのMACアドレスADR-A1,ADR-A2で示される各ポートに接続されていることを示す経路情報が格納される。
また、上述したARPリクエストとこれに対する応答がL2SW2201のネットワークインタフェース221,223および中継処理部222を介して授受される過程で、L2SW2201に備えられたポート対応テーブル224に、サーバ装置210aのポートPa1とL2SW2201のポートP11とを結びつける情報と、サーバ装置210bのポートPb1とL2SW2201のポートP12とを結びつける情報とが格納される(図2(c)参照)。同様にして、L2SW2202に備えられたポート対応テーブル(図示せず)にも図2(d)に示したような対応関係が格納され、サーバ装置210aのポートPa2とL2SW2202のポートP21との対応関係およびサーバ装置210bのポートPb2とL2SW2202のポートP22との対応関係が示される。同様に、L2SW2203,2204備えられたポート対応テーブル(図示せず)にも図2(e),(f)に示したような対応関係が格納され、サーバ装置210aのポートPa1、Pa2とL2SW2203,2204のポートP31、P41との対応関係およびサーバ装置210bのポートPb1、Pb2とL2SW2203、2204のポートP32、P42との対応関係が示される。
図1に示したサーバ装置210において、ポート情報管理部215は、例えば、上述した経路情報の収集完了が手順処理部213から通知されたときに、経路情報テーブル214に格納された各経路情報で示される通信経路について、図3に示すような要求フレームを用いて、その通信経路におけるフレームの中継を行うL2SW220において使用されるポートの情報を収集し、ポート情報テーブル216に格納するとともに経路情報管理に反映する。
また、図1に示したL2SW220において、応答処理部226は、要求検出部225によって上述した要求フレームが検出されたときに、ポート対応テーブル224に格納されている情報に基づいて、指定された通信経路における中継に使用するポートを示すポート情報を含む応答フレームを作成し、要求元のサーバ装置に対応するネットワークインタフェースを介してこの応答フレームを返送する。
以下、要求フレームとこれに対する応答フレームとを授受することによって、各サーバ装置210a、210bにおいてL2SW2201,2202のポート情報を収集する動作を詳細に説明する。
例えば、ポート情報管理部215は、図3(a)に示すように、レイヤ2フレームのタイプフィールドに要求フレームであることを示す特定のタイプ情報を設定し、フレームの寿命を示すTTL(Time to Live)タグを送信元MACアドレスとタイプフィールドとの間に追加して要求フレームを形成することができる。
この形式の要求フレームを利用する場合は、ポート情報管理部215により、例えば、図4に示すように、要求フレームに設けられたTTLタグに設定するTTLを初期値「1」から数値1ずつ増やして複数の要求フレームが作成され、これらの要求フレームがフレーム送受信処理部212を介して送出される。
また、図1に示したL2SW220の要求検出部225は、フレームの中継に先立って、レイヤ2フレームに上述したTTLタグが追加されているか否かを判定し、追加されている場合には、そのTTLタグに設定されたTTLから数値「1」を減算した結果、TTL=0となるか否かに基づいて、レイヤ2フレームが自装置宛であるか否かを判定する。また、この要求検出部225は、自装置宛のレイヤ2フレームを検出したときに、そのフレームを中継処理の対象からはずし、タイプフィールドに上述した特定のタイプ情報が設定されていることを確認することで要求フレームを検出し、図1に示した応答処理部226に応答フレームの作成を指示する (図3、図4参照)。
このとき、応答処理部226により、例えば、要求フレームに設定された宛先MACアドレスおよび送信元MACアドレス(例えば、サーバ装置210bのポートPb1およびサーバ装置210aのポートPa1に与えられたADR-B1)に基づいてポート対応テーブル224を検索することにより、これらのMACアドレスに対応してそれぞれ格納されたポート情報P12、P11が取得され、これらのポート情報P12、P11が応答フレームの作成処理に供される。例えば、応答処理部226は、要求フレームに設定された宛先MACアドレスと送信元MACアドレスとを入れ替えることにより、送信元のサーバ装置210aを宛先とする応答フレームを形成し、この応答フレームのデータ部に上述したポート情報(例えば、ポートP12、P11)および自身のスイッチ識別情報(例えば、#1)を設定して中継処理部222を介して送出することにより、要求元のサーバ装置210(例えば、サーバ装置210a)にこの応答フレームを返送することができる。
一方、TTLの減算結果が数値「0」以上であるとされた要求フレームは、他のフレームと同様に、ポート対応テーブル224に宛先MACアドレスに対応して設定されたポートを介して送出され、図4に示したように、次のL2SW220あるいは宛先のサーバ装置210に中継される。
例えば、図4に示すように、TTLタグに数値「1」が設定された要求フレームは、送信元のサーバ装置210aに直接接続されたL2SW2201に対する個別要求として検出され、このL2SW2201に備えられた応答処理部226により、要求フレームで示された宛先への中継処理に用いるポートを示すポート情報が送信元のサーバ装置に返される。同様にして、TTLタグに数値「2」の要求フレームは、上述したL2SW2201によってL2SW2203に中継され、このL2SW2203からポート情報が報告される。
このように、サーバ装置210のポート情報管理部215が、レイヤ2フレームに追加したTTLタグに設定するTTLを変えながら複数の要求フレームを送出し、L2SW220の要求検出部225が自装置宛の要求フレームに選択的に応答フレームを返送することにより、個々の通信経路におけるフレームの中継に用いられる各L2SW220のポート情報を個別に要求し、また、その要求に個別に返送する機能、すなわち、課題を解決する手段の項において述べた個別要求手段および返送手段の機能が果たされている。
また、ポート情報管理部215が、これらの要求フレームに対して返される応答フレームからポート情報を抽出することにより、経路情報テーブル214に格納された各経路情報で示される通信経路における中継を行うL2SW220において利用されるポートを示すポート情報を要求元のサーバ装置210に近い順に収集することができる。
また、このようにしてポート情報を収集する際に、図1に示したポート情報管理部215は、上述した応答フレームに含まれているポート情報とスイッチ識別情報との組み合わせをポート情報テーブル216に格納する。このとき、ポート情報管理部215は、応答フレームに設定された送信元MACアドレスとこの応答フレームを受信した自装置のポートを示す情報とから応答フレームが返された通信経路(例えば、サーバ装置210aのポートPa1とサーバ装置210bのポートPb1とを結ぶ通信経路)を特定し、この通信経路について経路情報テーブル214に登録されている経路情報に関連付けてポート情報テーブル216に上述したポート情報を登録する(図5参照)。
このようにしてポート情報を含む応答フレームを受け取った場合に、ポート情報管理部215により、図3(a)に示したTTLタグに設定するTTLを数値「1」だけ増やした要求フレームが送出される(図4参照)。これに応じて、図1に示したL2SW2203(図4において符号L2SW3として示す)から返された応答フレームから、このL2SW2203を示すスイッチ識別情報(例えば、#3)およびL2SW2203においてサーバ装置210aからのフレームをサーバ装置210bに中継する処理に用いられるポートを示すポート情報(例えば、ポートP32、P31)が抽出され、これらの情報が、上述した通信経路の経路情報に関連付けられた上で、ポート情報テーブル216に格納される(図5参照)。
このようにして、要求フレームに応じてL2SW220から返された応答フレームに含まれるスイッチ識別情報およびポート情報を抽出してポート情報テーブル216に経路情報と関連付けて登録することにより、サーバ装置210a,210b間に設定された各通信経路とこの通信経路における中継処理を行うL2SW220において用いられるポートを示す情報を収集して、通信経路とその通信経路における中継処理に寄与するL2SWのポートとの関連をサーバ装置210aで把握することができる。
図4に示したように、L2SW2203から返された応答フレームに応じて作成された要求フレームにはTTLとして数値「3」が設定されているので、L2SW2201,2203を介してサーバ装置210bに到達する。この場合に、例えば、このサーバ装置210bのポート情報管理部(図示せず)により、要求フレームが到達したポートに付与されたMACアドレスを含む応答フレームを返し、要求元のサーバ装置のポート情報管理部215は、MACアドレスを含む応答フレームを検出したときに、ポート情報収集動作を終了することで、要求元のサーバ装置210は、宛先のサーバ装置との間に設定された通信経路における中継を行う全てのL2SW220のポート情報を漏れなく収集することができる。
また、上述した要求フレームを用いたポート情報収集処理をサーバ装置210bが行うことにより、サーバ装置210bに設けられたポート情報テーブル(図示せず)に経路情報と関連付けて必要なポート情報を登録することができる。
図1に示した実施形態においては、サーバ装置210a,210bに備えられたポート情報管理部215が上述した要求フレームと応答フレームとを授受することにより、課題を解決する手段の項において述べた収集手段の機能が果たされ、収集された情報が、同じく保持手段に相当するポート情報テーブル216に格納される。
なお、図3(a)に示したTTLタグを備えた要求フレームの代わりに、図3(b)に示すように、タイプフィールドにおいてポート情報を収集するための要求であることを示す形式の要求フレームを用いて、装置内ネットワークを構成するL2SW220からポート情報を収集することも可能である。
例えば、図1に示したポート情報管理部215により、図3(b)に示す形式の要求フレームを形成して、フレーム送受信処理部212を介して装置内ネットワークに送出し、この要求フレームの中継を行う各L2SW220に備えられた要求検出部225により、この要求フレームを検出して、応答処理部226に応答フレームの作成を指示することにより、これらのL2SW220に関するポート情報を一括して要求機能およびこのような一括要求に対して個々のL2SW220が応答フレームを返送する機能、すなわち、課題を解決する手段の項において述べた一括要求手段および報告手段の機能が果たされる。
この場合は、上述した要求フレームは、図6に示すように、この要求フレームの宛先MACアドレスに設定された宛先に至るまでに経由する各L2SW220によって要求フレームとして検出され、応答処理部226による応答フレーム返送の契機となるとともに、ポート対応テーブル224で示されたポートを介して宛先側へ中継される。このとき、各L2SW220に備えられた応答処理部226により、上述した個別要求に対する応答処理と同様の処理が行われ、これにより、要求フレームの中継を行った各L2SW220のポート情報が要求元のサーバ装置210に返される。
このようにして、サーバ装置側210から送出した1つの要求フレームに対して、この要求フレームの中継にかかわるすべてのL2SW220からのポート情報を一括して収集することができる。
例えば、L2SW220を2,3段接続した程度の小規模の装置内ネットワークでは、要求元のサーバ装置210は、図3(b)に示した形式の要求フレームを宛先ごとに1つ送出し、装置内ネットワークの規模から推定される適切な時間が経過するまでポート情報の収集処理を継続することによって、各宛先との間に設定された通信経路における中継を行う全てのL2SW220のポート情報を収集することができる。
次に、上述したようにして収集されたポート情報を利用して、装置内ネットワークを構成するL2SW220に障害が発生した場合に迂回経路を設定する方法について説明する。
図1に示したサーバシステムでは、装置内ネットワークを構成する各L2SW220において検出されたポートの障害は、監視ノード230によって収集され、この監視ノード230から各サーバ装置210a、210bに通知される。
例えば、L2SW2201のポートP12とL2SW2203のポートP31とを結ぶケーブルに障害が発生した場合には、図7に示すように、L2SW2201、2203をそれぞれ示すスイッチ識別子(#1,#3)とポートP11、P31を示すポート識別子を含む障害通知が、監視ノード230からサーバ装置210a,210bに通知される。図1に示したサーバ装置210aのポート情報管理部215は、この通知からスイッチ識別情報(#1,#3)とポート識別情報(P11、P31)を抽出し、ポート情報テーブル216を参照して、障害が発生したポートを示すポート情報がポート情報テーブル216に格納されているか否かを判定する。
図5(b)に示したように、スイッチ識別情報(#1)とポート識別情報(P11)の組み合わせおよびスイッチ識別情報(#3)とポート識別情報(P31)の組み合わせがポート情報テーブル216に含まれていた場合に、ポート情報管理部215は、これらを含むポート情報(図5(b)において太枠で囲んで示す)をポート情報テーブル216から削除するとともに、これらのポート情報に関連付けられた経路情報(図5(a)において太枠で囲んで示す)を経路情報テーブル214から削除する。
このように、監視ノード230からの障害通知に応じて、ポート情報管理部215がポート情報テーブル216および経路情報テーブル214を操作することにより、障害通知で得られた情報をポート情報テーブル216および経路情報テーブル214に反映し、図5(c)、(d)に示すように、正常に動作可能なポートを利用して中継可能な有効な通信経路のみを示す経路情報テーブル214およびポート情報テーブル216を得ることができる。
同様にして、サーバ装置210bにおいても、障害通知に応じて、ポート情報テーブル216および経路情報テーブル214を更新する操作が行われ、これにより、サーバ装置210bからL2SW2203,2201を介してサーバ装置210aに至る経路情報は、関連づけられたポート情報とともに削除され、該当する通信経路が無効化される。
図1に示した装置内ネットワーク管理システムでは、上述したようにして、監視ノード230からの障害通知に応じて、L2SW220による中継の過程で障害が発生したポート(たとえば、ポートP12,P31)が用いられる経路情報が削除され、この通信経路が無効化される。すなわち、図1に示した装置内ネットワーク管理システムでは、障害の発生後、直ちに、その障害によって影響を受ける通信経路を無効化することでこの障害の影響をサーバ装置210に認識させ、サーバ装置210による迂回経路への切り替え作業を促すことができる。つまり、図1に示した実施形態では、ポート情報管理部215がポート情報テーブル216および経路情報テーブル214を操作することにより、課題を解決するための手段の項で述べた迂回制御手段の機能が果たされている。
したがって、図5(a)に示したように、サーバ装置210aとサーバ装置210bとの間に無効化されていない通信経路(例えば、L2SW2202,2204を介して設定される通信経路)が残されていれば、図7に示すように、この通信経路を直ちに、迂回経路として設定し、通信を継続することが可能である。
なお、図1に示したように、各L2SW220の障害情報を監視ノード230で収集して各サーバ装置210に通知する代わりに、各L2SW220から各サーバ装置210にハードルートで障害発生を通知し、この通知に応じて、ポート情報管理部215が上述したポート情報テーブル216および経路情報テーブル214の更新処理を行う構成を採用することも可能である。
また、図1に示した装置内ネットワーク管理システムでは、監視ノード230からの障害通知あるいはL2SW220からのハードルートによる障害通知に応じて、各サーバ装置210がL2SW220における障害の影響を把握することが可能となるので、従来のサーバシステムにおいて一般的に行われていたヘルスチェックを不要とし、個々のサーバ装置210の負担を軽減することができる。
次に、L2SW220に発生した障害が復旧したときの装置内ネットワーク管理システムの動作について説明する。
例えば、L2SW2201のポートP12とL2SW2203のポートP31とを結ぶケーブルの交換によって、これらのポートの機能が復旧した場合に、図8に示すように、L2SW2201,2203からの復旧通知に応じて、監視ノード230から各サーバ装置210に復旧通知が送信される。
この復旧通知に応じて、例えば、サーバ装置210aの手順処理部213により、まず、経路情報テーブル214に通信経路が設定されていないポート(ポートP11)を介して、装置内ネットワークに接続された他のサーバ装置(例えば、サーバ装置210b)を対象としたARP処理が行われる。次いで、ポート情報管理部215により、上述したARP処理によって新たに設定された通信経路について、図4あるいは図6に示したポート情報収集処理が行われる。これにより、図5(a),(b)に示したように、復旧したポートを経由する通信経路を含む経路情報とこれらの経路情報に関連付けられたポート情報とを示す経路情報テーブル214およびポート情報テーブル216が得られる。つまり、復旧通知に応じて、手順処理部213とポート情報管理部215が上述した処理を行うことにより、課題を解決するための手段において述べた復旧制御手段の機能が果たされる。
上述したようにして、復旧通知に応じて、装置内ネットワークによって接続可能な全てのサーバ装置について通信経路の設定を試行する機能を備えた場合は、障害情報の通知に応じて無効化された経路情報に対応するサーバ装置のみならず、サーバシステムに属する自装置以外の全てのサーバ装置との間の通信経路の設定が試行される。
このように、監視ノード230からの復旧通知に応じて、各サーバ装置210が他の全てのサーバ装置を対象としてARP処理を行うことにより、交換されたケーブルによって結ばれたポートの組み合わせが、障害が発生していたポートの組み合わせと同一であるか否かにかかわらず、現時点での装置内ネットワークにおいて新たに設定可能となった通信経路が漏れなく設定される。これにより、課題を解決するための手段の項において述べた設定試行手段の機能が果たされ、これらの通信経路に対応するポート情報を収集して、経路情報と関連付けることができる。つまり、ポートを復旧させるための作業においてレイヤ2スイッチの接続の自由度を活用した接続の拡張などが行われた場合にも、新たに接続が可能となったサーバ装置との間の通信経路を復旧処理の過程において合わせて設定することができる。
また、各L2SW220のポート機能の復旧を、個々のL2SW220から各サーバ装置210にハードルートを用いて通知し、この通知に応じて、上述したARP処理およびポート情報の収集処理を行うことも可能である。
なお、以上の説明では、4つのL2SW220を用いて、2つのサーバ装置210a,210bを接続した単純な装置内ネットワークを例にとって説明したが、もちろん、L2SWを3段以上の多段接続して装置内ネットワークを構築し、このような装置内ネットワークによって多数のサーバ装置を接続して構成されるサーバシステムにも、上述した装置内ネットワーク管理システムを適用することができる。
また、経路情報テーブル214およびポート情報テーブル216において、正常な動作が期待できる通信経路に関連する情報と障害の発生に応じて正常な動作が期待できなくなった情報とを個々の経路情報およびポート情報に対応して設けたフラグのオン・オフを切り替えることによって示すことも可能である。その他、経路情報テーブル214に格納された個々の経路情報およびポート情報テーブル216に格納された個々のポート情報について、有効・無効を切り替えて示す手法であれば、上述した装置内ネットワーク管理システムに適用可能である。
また、さらに、経路情報テーブル214およびポート情報テーブル216に障害通知に応じて無効化された通信経路にかかわる情報が残されている場合は、これらの情報に基づいて、無効化された通信経路と同等の通信経路の設定を選択的に行うためのARP処理を行うように制御することも可能である。また、無効化された通信経路と同等の通信経路を設定するためのARP処理を優先的に実行するように制御することも可能である。
本発明に関わる装置内ネットワーク管理システムの実施形態を示す図である。 経路情報およびポート情報の例を示す図である。 要求フレームの例を示す図である。 ポート情報の収集を説明するシーケンス図である。 ポート情報テーブルを説明する図である。 ポート情報の収集を説明するシーケンス図である。 ポートの障害情報を反映する動作を説明するシーケンス図である。 ポート機能復旧時の装置内ネットワーク管理システムの動作説明図である。 装置内ネットワークを説明する図である。
符号の説明
210a,210b サーバ装置
211 通信処理部
212 フレーム送受信処理部
213 手順処理部
214 経路情報テーブル
215 ポート情報管理部
216 ポート情報テーブル
217,221,223 ネットワークインタフェース
2201,2202,2203,2204 レイヤ2スイッチ(L2SW)
222 中継処理部
224 ポート対応テーブル
225 要求検出部
226 応答処理部
230 監視ノード

Claims (5)

  1. 複数のサーバ装置を複数のレイヤ2スイッチを介して接続して構成される装置内ネットワークを管理する装置内ネットワーク管理システムにおいて、
    前記複数のサーバ装置間に設定される通信経路それぞれについて、前記通信経路における中継を行う全てのレイヤ2スイッチから前記中継にかかわるポートを示すポート情報を収集する収集手段と、
    前記各サーバ装置について設定された通信経路に対応して収集されたポート情報を、前記各通信経路に関連付けて保持する保持手段と、
    前記各レイヤ2スイッチから通知される障害情報によって、前記保持手段に各サーバ装置について設定された通信経路に関連付けて保持されたポート情報で示されるポートに障害が発生したことが示されたときに、前記ポート情報が関連付けられた経路情報を無効化して迂回経路への切り替えを促す迂回制御手段と
    を備えたことを特徴とする装置内ネットワーク管理システム。
  2. 請求項1に記載の装置内ネットワーク管理システムにおいて、
    収集手段は、
    前記各サーバ装置に設けられ、前記サーバ装置との間で通信経路が設定されたサーバ装置それぞれを宛先として、前記通信経路におけるフレームの中継を行うレイヤ2スイッチにポート情報の報告を求める複数の要求フレームを、寿命を1ずつ変えながら送信する個別要求手段と、
    各レイヤ2スイッチに設けられ、寿命が零となる要求フレームを受け取ったときに、このフレームの宛先への中継に用いるポートを示すポート情報を発信元のサーバ装置に返送する返送手段とを備えた
    ことを特徴とする装置内ネットワーク管理システム。
  3. 請求項1に記載の装置内ネットワーク管理システムにおいて、
    収集手段は、
    前記各サーバ装置に設けられ、前記サーバ装置との間で通信経路が設定されたサーバ装置それぞれを宛先として、前記通信経路におけるフレームの中継を行うレイヤ2スイッチにポート情報の報告を求める要求フレームを送信する一括要求手段と、
    各レイヤ2スイッチに設けられ、前記要求フレームが中継される際に、前記中継に用いるポートを示すポート情報を発信元のサーバ装置に報告する報告手段とを備えた
    ことを特徴とする装置内ネットワーク管理システム。
  4. 請求項1に記載の装置内ネットワーク管理システムにおいて、
    前記各レイヤ2スイッチから障害が発生しているポートの機能が復旧した旨の復旧情報が通知されたときに、少なくとも前記迂回制御手段によって無効化された経路情報に対応するサーバ装置との間の通信経路の再設定を促す復旧制御手段を備えた
    ことを特徴とする装置内ネットワーク管理システム。
  5. 請求項4に記載の装置内ネットワーク管理システムにおいて、
    復旧制御手段は、
    前記復旧情報の通知に応じて、前記装置内ネットワークによって接続可能な全てのサーバ装置について通信経路の設定を試行する設定試行手段を備えた
    ことを特徴とする装置内ネットワーク管理システム。

JP2007307674A 2007-11-28 2007-11-28 装置内ネットワーク管理システム Expired - Fee Related JP4915334B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007307674A JP4915334B2 (ja) 2007-11-28 2007-11-28 装置内ネットワーク管理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007307674A JP4915334B2 (ja) 2007-11-28 2007-11-28 装置内ネットワーク管理システム

Publications (2)

Publication Number Publication Date
JP2009135580A true JP2009135580A (ja) 2009-06-18
JP4915334B2 JP4915334B2 (ja) 2012-04-11

Family

ID=40867072

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007307674A Expired - Fee Related JP4915334B2 (ja) 2007-11-28 2007-11-28 装置内ネットワーク管理システム

Country Status (1)

Country Link
JP (1) JP4915334B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013004987A (ja) * 2011-06-10 2013-01-07 Fujitsu Ltd ネットワーク装置、送信先問合せ方法および送信先問合せプログラム
CN111263381A (zh) * 2018-12-03 2020-06-09 中国电信股份有限公司 业务处理方法、装置、系统、终端和计算机可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006019866A (ja) * 2004-06-30 2006-01-19 Fujitsu Ltd 伝送装置
JP2007288615A (ja) * 2006-04-18 2007-11-01 Hitachi Ltd 経路設定方法、情報処理システム、サーバ及びプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006019866A (ja) * 2004-06-30 2006-01-19 Fujitsu Ltd 伝送装置
JP2007288615A (ja) * 2006-04-18 2007-11-01 Hitachi Ltd 経路設定方法、情報処理システム、サーバ及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013004987A (ja) * 2011-06-10 2013-01-07 Fujitsu Ltd ネットワーク装置、送信先問合せ方法および送信先問合せプログラム
CN111263381A (zh) * 2018-12-03 2020-06-09 中国电信股份有限公司 业务处理方法、装置、系统、终端和计算机可读存储介质
CN111263381B (zh) * 2018-12-03 2023-04-07 中国电信股份有限公司 业务处理方法、装置、系统、终端和计算机可读存储介质

Also Published As

Publication number Publication date
JP4915334B2 (ja) 2012-04-11

Similar Documents

Publication Publication Date Title
JP6556875B2 (ja) ソフトウェアディファインドデータセンタ及びそこにおけるサービスクラスタの配置方法
JP4681049B2 (ja) ネットワークにおける障害処理のための方法および装置
JP5446040B2 (ja) コンピュータシステム、及び仮想マシンのマイグレーション方法
CN109344014B (zh) 一种主备切换方法、装置及通信设备
JP2011091464A (ja) ネットワーク構成の想定のための装置、システム
US9634887B2 (en) System, method and computer-readable medium for using a plurality of virtual machines
JP5530864B2 (ja) ネットワークシステム、管理サーバ、及び、管理方法
US20170214609A1 (en) Forwarding method and forwarding device
US8724450B2 (en) Network relay system and method of controlling a network relay system
JP2014064252A (ja) ネットワークシステム、伝送装置、及び障害情報通知方法
KR20080082830A (ko) 스패닝 트리 프로토콜을 이용하는 네트워크에서 스위칭장치의 플러싱 처리 장치 및 방법
JP5938995B2 (ja) 通信装置
JP4915334B2 (ja) 装置内ネットワーク管理システム
US8854949B2 (en) Network relay device and network relay method
JP6604336B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
KR20160028247A (ko) 클라우드 서버 관리 방법, 이를 수행하는 클라우드 서버 관리 장치 및 클라우드 서비스 관리 시스템
JP5157685B2 (ja) 通信システム、ネットワーク機器及びそれらに用いる通信復旧方法並びにそのプログラム
JP5518771B2 (ja) 冗長ネットワークシステム、終端装置及び中継点隣接装置
WO2012070274A1 (ja) 通信システムおよびネットワーク障害検出方法
JP5506714B2 (ja) ネットワーク接続装置
JP5585437B2 (ja) ネットワーク管理装置、ネットワーク管理システム、および、ネットワーク管理方法
JP2014023137A (ja) 通信システム、経路制御装置、ユーザ端末および経路制御方法
WO2022044546A1 (ja) 通信システムおよびその障害復旧方法
US11206224B2 (en) Switch device and recording medium recording failure detection program
JP2017022579A (ja) 通信システム、通信ノード、および通信システムにおける代替処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100715

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110908

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110927

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111227

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120109

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150203

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees