JP6781288B2 - マルチノード装置及びその予備通信方法 - Google Patents

マルチノード装置及びその予備通信方法 Download PDF

Info

Publication number
JP6781288B2
JP6781288B2 JP2019036174A JP2019036174A JP6781288B2 JP 6781288 B2 JP6781288 B2 JP 6781288B2 JP 2019036174 A JP2019036174 A JP 2019036174A JP 2019036174 A JP2019036174 A JP 2019036174A JP 6781288 B2 JP6781288 B2 JP 6781288B2
Authority
JP
Japan
Prior art keywords
switch
port
built
node
uplink
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019036174A
Other languages
English (en)
Other versions
JP2019205153A (ja
Inventor
謝孟桓
張毓融
▲劉▼▲得▼▲ガイ▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Quanta Computer Inc
Original Assignee
Quanta Computer Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Quanta Computer Inc filed Critical Quanta Computer Inc
Publication of JP2019205153A publication Critical patent/JP2019205153A/ja
Application granted granted Critical
Publication of JP6781288B2 publication Critical patent/JP6781288B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/15Interconnection of switching modules
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/16Multipoint routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/02Topology update or discovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/22Alternate routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/74Address processing for routing
    • H04L45/745Address table lookup; Address filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/30Peripheral units, e.g. input or output ports
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/55Prevention, detection or correction of errors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/55Prevention, detection or correction of errors
    • H04L49/555Error detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/40Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

本開示は、一般的に、サーバ内のノードのネットワーク通信信頼性の確保に関し、もっと具体的に言えば、スイッチとネットワークとの間のアップリンクが中断された際に、スイッチの間に相互接続ポートを用いて予備通信方法を提供することに関する。
クラウドコンピューティングの応用が出現したことによって、オフサイト(off−site)や別所で実装する必要が増えた。例えば、データを保存して遠隔接続されたコンピュータ装置のユーザのアクセスアプリケーションを実行するデータセンター(data center)が知られている。一般的なデータセンターは、パワー機能及び通信接続機能を兼ねて持つ実体底板構造を有する。ラックごとに、例えば演算、保存又は制御するためのサーバ及びネットワークと管理スイッチのような複数のネットワーク装置が固持される。
演算サーバは通常、幾つかのプロセッサーやノードを含む。プロセッサーのそれぞれは、サーバ内の他のプロセッサーと通信して効率的に演算任務を完成する必要がある。そのため、演算任務がサーバの複数のコアに分割されて処理されることが一般的であり、データはコア(cores)とより大きいネットワークとの間に内蔵スイッチのアップリンクポート(uplink ports)を介して送受信される。これらの内蔵スイッチは、ネットワーク内の他の装置がサーバ内のノードと通信することを許可する。ネットワークとサーバ内のノードとの間の通信は、内蔵スイッチがサーバのそれぞれのノードの異なるアップリンクポートに接続されることで行う。このような配置には、ノードとネットワークとの間のアップリンク通信に故障が発生した場合、通信が行えなくてサーバの操作を妨害してしまう問題がある。
マイクロサーバ内のそれぞれのサーバノードは、それぞれの内蔵スイッチの特定なアップリンクポートを介してマイクロサーバの外部の装置と通信する。サーバノードにアクセスされるアップリンクポートは、内蔵スイッチに管理される。そのため、アップリンクポートに故障が発生した場合、関連するサーバノードはネットワークと通信できなくなる。
マイクロサーバのノードのネットワーク通信の安定性を向上させるために、現状では、内蔵スイッチを作動させて、アップリンクポートが故障した場合又は内部や外部のネットワークの接続が故障した場合に代替通路を提供する。図1はマイクロサーバ12を含む従来技術のネットワークシステム10のブロック図である。サーバ12は、ノード20、22などの複数のサーバノードを含む。サーバ12は、内蔵スイッチ30、32などの複数の内蔵スイッチも含む。それぞれの内蔵スイッチ30、32は、ネットワーク50と通信するための対応するアップリンクポート42、44、46、48を含む。それぞれの内蔵スイッチ30、32は、ノード20、22のポート62、64、66、68に接続するための対応する下流ポート(downstream ports)52、54、56、58を含む。
この従来技術において、ノード20は、スイッチ30の下流ポート52にリンクされるポート62と、スイッチ32の下流ポート56にリンクされるポート64を含む。ノード22は、スイッチ30の下流ポート54にリンクされるポート66と、スイッチ32の下流ポート58にリンクされるポート68を含む。ノード20は、スイッチ30及び対応するポート52を介してネットワーク50と通信できる。同様に、ノード22は、スイッチ32及び対応するポート58を介してネットワーク50と通信できる。
アップリンクポート42、44やアップリンクポート46、48が故障した場合、関連するサーバノード20や22がネットワーク50から入力及び出力されるパケットのロスを検出する。そして、関連するサーバノード20や22は、別の内蔵スイッチの代替アップリンクポートからパケットを送受信することで、アップリンクポートの予備通信メカニズムを作動させる。例えば、アップリンクポート42、44が故障すると、サーバノード20がパケットロスを検出してパケット通信をポート64に切り替える。これによってパケットがリンクを介して下流ポート56に送信され、さらにスイッチ32に至り、そしてアップリンクポート46を介してネットワーク50に送信される。
しかしながら、アップリンクポートが故障した時に内蔵スイッチのノードを変更する現状の実施形態には、2つの課題がある。1つの課題は、アップリンク予備の長すぎる作動時間による著しいパケットロスである。サーバノードが対応するアップリンクポートに直接に接続されていないため、アップリンクポートの故障の検出には時間が掛かり、アップリンクポートの予備通信メカニズムを作動させるまでに潜在的な数多くのパケットロスを招く課題がある。パケットを他の予備スイッチに送信するようにノードがポートを切り替えるには、さらに多くの時間が必要である。そのため、上記段落において、ノード20が故障したアップリンクポート42、44に直接に接続されていないため、アップリンクポート42、44が故障してからパケットロスが検出されるまでに、多くのパケットがロスした。予備通信メカニズムによってパケット通信が切り替えられてスイッチ32の新しい下流ポート56と対応する新しいアップリンクポート46に接続されるまでにも、多くのパケットがロスした。
他の一つの課題は、アップリンクポートの予備メカニズムに関与されるノードの演算能力利用の劣化(degradation)である。現状のアップリンクポートの予備通信メカニズムはソフトウェアのルーティング手続に基づくものであり、当該ルーティング手続は、パケットロスを頻繁に検出するソフトウェア任務を含む。このようなメカニズムを全てのサーバノードで実行する必要があり、これによってノードが演算リソースをソフトウェア任務に投入する必要があるため、サーバノードの演算能力利用の低減を招くことになる。
そのため、現状の業界には、ネットワーク接続が損壞した場合にネットワークからノードまでの通信を確保できるメカニズムと、ノードとネットワークとの間のアップリンク接続が損壞した時にパケットロスを最低限に抑えるメカニズムと、サーバの演算能力を利用する必要のない予備メカニズムと、が求められている。
開示された1つの実施例は、マルチノード装置の信頼可能なネットワーク通信を確保するためのシステムである。マルチノード装置は、第1のノードと、第1の内蔵スイッチと、第2の内蔵スイッチと、を含む。第1のノードは、データパケットを送受信するように操作されるポートを有する。第1の内蔵スイッチは、第1のノードのポートに連結される下流ポートと、相互接続ポートと、ネットワークに連結されるアップリンクポートと、を有する。アップリンクポートは、データパケットを第1のノードからネットワークにルーティングする。第2の内蔵スイッチは、下流ポートと、第1の内蔵スイッチに連結される相互接続ポートと、ネットワークに連結されるアップリンクポートと、を有する。第1の内蔵スイッチによってアップリンクポートの箇所で検出されたネットワーク通信の故障に応じてルーティング処理を作動させて、第1のノードからのデータパケットを、第1の内蔵スイッチの下流ポート、相互接続ポート及び第2の内蔵スイッチのアップリンクポートを介して、ネットワークにルーティングする。
上記内容は全ての実施例や本開示の全ての態様を示すためのものではない。上記内容は本文に記述される新規的な態様及び特徴の一部の実例のみを提供する。添付図面及び添付特許請求の範囲を組み合わせて参照する際、本開示の上記特徴とメリット及び他の特徴とメリットは、本発明を実現するための代表的な実施例及び模式的な下記記述から明らかに分かる。
本実施例は、内蔵スイッチの間の接続と内蔵スイッチが所有するパケット転送表の同期とを含むサーバのアップリンクポートの予備通信メカニズムに関する。アップリンクに故障が発生した時に、故障を検出する内蔵スイッチがパケットをサーバノードから別の内蔵スイッチに転送する。一方、内蔵スイッチのパケット転送表が同期されているため、内蔵スイッチのアップリンクで受信された、他の内蔵スイッチに接続されるサーバノードに用いられるパケットは、内蔵スイッチの相互接続ポートに転送されて、そして他の内蔵スイッチに接続されるサーバノードによって受信されてよい。そのため、本開示のメカニズムでは、サーバノードが予備メカニズムの処理に関与しないので、サーバノードからネットワークまでのシームレス通信が提供される。ポートの切り替えのタイムラグを除去したため、本開示のメカニズムは、マルチノードサーバのネッワーク安定性を向上させることができ、更にパケットロスを防止でき、また予備通信メカニズムに用いられるサーバ演算能力に対する需要も免除できる。
下記添付図面についての説明は、本発明の上記及び他の目的、特徴、メリットと実施例をより分かりやすくするためのものである。
アップリンクが故障した場合に、周知の予備メカニズムを用いてパケットをルーティングするマイクロサーバであり、従来技術によるマルチノード配置の模式図である。 本開示の一実施方式に係るアップリンク故障の予備メカニズムに用いられるマルチノードサーバシステムのブロック図である。 通常操作において図2のマルチノードシステムのブロック図である。 本開示の一実施方式に係る予備通信メカニズムが動作した時の、図2のマルチノードシステムのブロック図である。 図4に示すシステム内のノードとネットワークとの間のアップリンクが故障した時の予備手続のフロー図である。 アップリンクポートが修復した時に初期ルーティングを提供するための回復手続のフロー図である。
本発明は、様々な形式で実現されうる。代表的な実施例は、図面に示され、本文で詳しく記述する。本開示は、本開示の原理の実施例や説明であり、本開示の広い範囲の態様を説明される実施例に限定するためのものではない。ここで、例えば要約書、発明の概要及び発明を実施するための形態において開示されたことにもかかわらず特許請求の範囲に明記されない要件及び制限は、暗示、推理もしくは他の方式で単独又は共同に特許請求の範囲に併入すべきではない。この実施するための形態に基づいて、具体的に排除しない限り、単数形式の記載が複数形式を含み、そして逆も然り。「含む」という単語とは、「含み、だがこれに限定されない」を意味する。なお、例えば「約」、「ほぼ」、「実質的に」、「おおよそ」及び類似した意味を持つ単語は、本文において「…の中に」、「…に近い」、「ほぼ…の中に」又は「…の3〜5%の差異内に」もしくは「許容可能な製造差異内」及び上記の任意な論理の組み合わせを意味する。
本開示の予備メカニズムは、相互接続ポートを介して内蔵スイッチを互いに接続して、内蔵スイッチとネットワークとの間に代替通信経路の存在を可能にすることに基づく。図2に示されるように、図2は本開示の1つの実施例のネットワークシステム100のブロック図である。ネットワークシステム100は、複数のノード(例えばノード120、122)を有するマルチノード装置(例えばサーバ102)を含む。サーバ102は、さらに例えば内蔵スイッチ130、132のような複数の内蔵スイッチを含む。それぞれの内蔵スイッチ130、132は、内蔵スイッチ130、132とネットワーク150のデータ通信の送受信を可能にする対応するアップリンクポート142、144、146、148を含む。それぞれの内蔵スイッチ130、132は、それぞれノード120、122のポート162、164、166、168に接続される対応する下流ポート152、154、156、158を含む。
この実施例において、ノード120は、スイッチ130の下流ポート152にリンクされるポート162と、スイッチ132の下流ポート156にリンクされるポート164を含む。ノード122は、スイッチ130の下流ポート154にリンクされるポート166と、スイッチ132の下流ポート158にリンクされるポート168を含む。ノード120は、スイッチ130と対応するポート152、もしくはスイッチ132と対応するポート156を介してネットワーク150と通信できる。同様に、ノード122は、スイッチ132と対応するポート158、もしくはスイッチ130と対応するポート154を介してネットワーク150と通信できる。
スイッチ130は、2つの相互接続ポート172、174を含む。スイッチ132も、2つの相互接続ポート176、178を含む。この実施例において、スイッチ130の相互接続ポート172は、スイッチ132の相互接続ポート176にリンクされる。スイッチ130の相互接続ポート174は、スイッチ132の相互接続ポート178にリンクされる。それぞれのスイッチ130、132は、対応されているパケット転送表(packet forwarding table)を含む。パケット転送表は、データパケットを第1のノード(例えば、ノード120)から第1のアップリンクポート(例えばアップリンクポート142、144)を介してネットワーク150にルーティングするための第1の情報と、データパケットを第1の下流ポート(例えば、ポート162、164)を介して第1のノード(例えば、ノード120)にルーティングするための第2の情報と、を含む。スイッチ130、132は、相互接続ポート172、174、176、178を使ってアップリンクポート142、144、146、148の動作状態(health status)を周期的に他のスイッチに報告する。相互接続ポート172、174、176、178は、ある1つのスイッチの全てのアップリンクポートが故障した場合(即ち、アップリンクポートの同時故障(concurrent failure))に、パケット転送表の同期の実行にも用いられる。例えば、マルチノード装置(例えばサーバ102)は、第1の内蔵スイッチ(例えば、スイッチ130)が第1のアップリンクポート(例えばアップリンクポート142、144)の同時故障を検出した場合、パケット転送表内の第1の情報を削除する。相互接続ポートからパケットを受信する時に、スイッチ(例えばスイッチ130)は、備えるパケット転送表を参照することでパケットをどのポートに転送するかを決める。パケット転送表は、ネットワークアドレスと受信されたパケットを関連付けられたネットワークアドレスに転送するためのポートとの間の対応関係を提供する。受信されたパケットの宛先ネットワークアドレスがパケット転送表内に存在しない場合、パケットは、そのパケットを受信したポート以外の全てのポートにブロードキャストされる。
この実施例において、ある1つのスイッチ(例えばスイッチ130)の全てのアップリンクポート(例えばアップリンクポート142、144)が故障した場合、スイッチは、相互接続ポート(例えば相互接続ポート172、174、176、178)により他のスイッチ(例えばスイッチ132)にアップリンクポートが故障したことを通知する。通知は、スイッチで動作する予備手続によって行う。故障を検出した内蔵スイッチは、備えるパケット転送表を他の内蔵スイッチに同期させる。具体的に言えば、アップリンクの故障を有するスイッチは、そのアップリンクポートを介してネットワークと通信するサーバノードのネットワークアドレスを他のスイッチに通知する。この通知を受信した場合、他のスイッチは、宛先が上記ネットワークアドレスであるパケットが相互接続ポートに転送されるように、備えるパケット転送表を変更する。例えば、ノード120は、スイッチ130のアップリンクポート142を介してネットワート150と通信する。アップリンクポート142、144のいずれも故障し、且つスイッチ130が故障を検出すると、スイッチ130は、そのアップリンクポート142、144が故障したことをスイッチ132に通知して、備えるパケット転送表とスイッチ132のパケット転送表を同期させる。両方のパケット転送表が同期された後、スイッチ132は、ノード120に送信されるパケットを相互接続ポート176や178に転送してよい。
アップリンクポートにネットワーク通信障害が発生した内蔵スイッチは、関連するサーバノードが相互接続ポート及び他のスイッチのアップリンクポートを介してネットワーク150と通信できるように、他の内蔵スイッチにアップリンクが故障したことを通知する。なお、同期されたパケット転送表は、アップリンクの故障によるパケットフラッデイング(packet flooding)の異常を低減させる。宛先ネットワークアドレスがパケット転送表内に存在しない場合、パケットは、アップリンクポート、下流ポート及び相互接続ポートを含む当該パケットを受信したポート以外の全てのポートにブロードキャストされる。パケット転送表の同期によって、アップリンクポートが正常に動作できる内蔵スイッチが他のスイッチに接続されるノードのネットワークアドレスを感知できるようになる。そのため、スイッチは、宛先が他のスイッチに接続されるノードのネットワークアドレスのパケットを、ブロードキャストする必要なく備える相互接続ポートに転送する。
上記の方法により、それぞれのサーバノードは、たとえいずれか1つのスイッチのアップリンクポートに障害が発生しても、対応する内蔵スイッチに接続される同じポートを介してパケットを送受信することができる。そのため、サーバノードは、アップリンクポート故障の処理に関与する必要がない。なお、内蔵スイッチ130、132は、サーバノード120、122に代ってアップリンク故障の問題を処理する。よって、本開示のメカニズムはより柔軟的にアップリンク故障を対処できるため、アップリンク故障によるパケットロスを低減させることができる。
正常に動作するアップリンクポートを有するそれぞれの内蔵スイッチは、周期的に活動メッセージ(keep−alive message)を発送し、備えるアップリンクポートの状態を相互接続ポートのうちの1つを介して他の内蔵スイッチに報告する。パケット選別規則は、相互接続ポートに配置され、正常に動作するポートの間に活動メッセージのみが送受信されることを許可する。活動メッセージを受信した際、アップリンクポートの故障は解決された。活動メッセージの周期の間のパケットのみがロスしたため、パケットロスは最小値に抑えられる。
図3及び図4は図2のネットワークシステム100においてネットワーク150との通信を確保する予備メカニズムを示す。図3及び図4における構成要素は、図2における対応する物と同じ数字符号で標記する。図3はサーバ102のノードとネットワークとの間の正常なデータフローを示す。例えば、ネットワーク150内のホスト182は、サーバ102内のノード120と通信する。図3は全てのアップリンクポート142、144、146、148が正常に動作する時の、ホスト182とサーバノード120との間の通信ルーティングを示す。この場合、サーバノード120は、内蔵スイッチ132を選択してネットワーク150内のホスト182と通信する。そのため、データはノード120のポート164を介してスイッチ132の下流ポート156に流れる。データはスイッチ132によってアップリンクポート148を介してネットワーク150にルーティングされ、ホスト182に至る。内蔵スイッチでのパケット選別規則は、データが相互接続ポート172、174、176、178を介して通信・伝送されることを防止する。同様に、内蔵スイッチ132は、備えるアップリンクポート148を介してホスト182に向ってパケットを転送する。
図4は内蔵スイッチ132のアップリンクポート146、148のいずれも故障した場合を示す。この場合、内蔵スイッチ132は、備えるアップリンクポート146、148が故障したことを内蔵スイッチ130に通知する。そして、内蔵スイッチ132の相互接続ポート176、178に設置されるパケット選別規則及び内蔵スイッチ130の相互接続ポート172、174に設置されるパケット選別規則が停止される。そして、パケットは、相互接続ポート172、174、176、178を介して伝送されることが許可される。この実施例において、パケットは、相互接続ポート178を介してスイッチ130の相互接続ポート174に送信される。図4に示されるように、サーバノード120からのパケットは、ポート164を介してスイッチ132の下流ポート156に送信される。パケットは、スイッチ132によって相互接続ポート178を介してスイッチ130の相互接続ポート174にルーティングされる。スイッチ130は、アップリンクポート144を介してパケットをネットワーク150にルーティングさせて、ホスト182に至る。
スイッチ132のいずれか1つのアップリンクポート146や148の機能が回復した場合、スイッチ132は、当該アップリンクポート146や148が回復したことをスイッチ130に通知する。そして、内蔵スイッチ130、132の両方に設置されるパケット選別規則を再び作動させる。これによって、相互接続ポート172、174、176、178の間のデータパケットの伝送が再び阻止される。続いて、図3に示されるように、内蔵スイッチ132は、機能が回復したアップリンクポート146や148のいずれか1つを介してホスト182に向かってパケットを再び転送する。
ある1つのスイッチの全てのアップリンクポートが故障した場合、本開示の1つの実施例の予備通信メカニズムが以下のように作動する。図5は予備通信メカニズムのフロー図である。ステップ500において、ある1つのスイッチのアップリンクポートが故障した場合、初期内蔵スイッチは、備えるアップリンクポートが故障した旨の活動メッセージを隣接する内蔵スイッチに発送する。そして、ステップ502のルーティング処理を実行する。ステップ502では、初期内蔵スイッチは、隣接する内蔵スイッチの相互接続ポートにリンクされる相互接続ポートに配置されるパケット選別規則を停止する。これによって、2つのスイッチの間の相互接続ポートで全てのタイプのパケットを送受信することが許可される。
ステップ504では、初期スイッチにおいて、備えるアップリンクポートに関連する全てのパケット転送表の情報を削除する。続いて、ステップ506では、初期内蔵スイッチは、備えるパケット転送表を隣接するスイッチのパケット転送表に同期させる。具体的に言えば、内蔵スイッチは、隣接するスイッチにブロードキャストメッセージを発信する。ブロードキャストメッセージのそれぞれの発信元MACアドレスには、内蔵スイッチに接続されるサーバノードのMACアドレスが設置される。
ステップ508では、初期内蔵スイッチのアップリンクポートが故障した旨の活動メッセージを受信した場合、隣接する内蔵スイッチは、備える相互接続ポートに設置されるパケット選別規則を停止する。これによって、隣接する内蔵スイッチの相互接続ポートと当該相互接続ポートがリンクする活動メッセージを送信した初期スイッチの相互接続ポートとの間で全てのタイプのパケットを送受信することが許可される。続いて、ステップ510を実行して、パケット転送表の同期メカニズムを作動させる。ステップ510において、パケット転送表の同期メカニズムは、初期スイッチから受信したブロードキャストメッセージに基づいて隣接するスイッチのパケット転送表を更新する。これによって、故障したアップリンクポートを有する初期内蔵スイッチに接続されたサーバノードからのパケットは、相互接続ポートに再度案内されて、隣接する内蔵スイッチのアップリンクポートを介してネットワークに送信される。
ステップ512では、受信したブロードキャストメッセージもアップリンクポートを介してネットワーク150に送信される。これによって、サーバ102(図2に示されるように)の外部のネットワーク装置は、サーバノードが隣接する内蔵スイッチのアップリンクポートを介して外部のネットワーク装置と通信しようとすることを感知する。
図2に示されるネットワークシステム100において、別のスイッチに転接されて操作される途中に、初期スイッチの故障したアップリンクポートのいずれか1つが再び正常に動作した場合、ネットワークシステム100が通常の動作に回復されることが許可される。図6のフロー図は、故障したアップリンクポートの1つが既に回復して正常に動作できることを初期スイッチが感知した場合の回復手続を示す。この実施例において、ステップ600のように、初期内蔵スイッチは、備えるアップリンクポートが回復した旨の活動メッセージを隣接する内蔵スイッチに発信する。続いて、ステップ602を実行して、初期スイッチの相互接続ポートに関連する全てのパケット転送表の情報を削除する。
ステップ604では、初期内蔵スイッチのパケット選別規則を作動させる。これによって、初期内蔵スイッチの相互接続ポートと隣接するスイッチの相互接続ポートとの間には、活動メッセージのみを送受信することが許可される。続いて、ステップ606では、初期内蔵スイッチは、回復した1つ又は複数のアップリンクポートに接続されるサーバノードの発信元MACアドレスを有するブロードキャストメッセージを発信する。これによって、サーバ102(図2に示されるように)の外部のネットワーク装置は、回復した1つ又は複数のアップリンクポートを介してサーバノードと通信できる。
ステップ608では、初期内蔵スイッチの1つ又は複数のアップリンクポートが回復した旨の活動メッセージを受信した場合、相互接続ポートでの送受信は活動メッセージのみが許可されるように、隣接する内蔵スイッチの相互接続ポートに配置されるパケット選別規則を作動させる。続いて、ステップ610を実行して、相互接続ポートに関連する全てのパケット転送表の情報を削除する。これにより、ノードとネットワークの通信は、切り替えられてノードから初期スイッチの回復したアップリンクポートを介してネットワークに辿る経路に戻る。
図5及び図6のフロー図は図2におけるネットワークシステム100の例示的な機械読み取り可能なコマンドを示す。この実施例において、機械読み取り可能なコマンドは、:(a)プロセッサー、(b)コントローラー、及び/又は(c)1つ又は複数の他の適切な処理装置のような装置によって実行するアルゴリズムを含む。アルゴリズムは、例えばフラッシュメモリ、CD−ROM、フロッピーディスク、ハードドライバー、デジタルビデオ(バーサトル)ディスク(DVD)又は他のメモリー装置のような実体のあるメディアに保存されるソフトウェアで実現されてよい。しかしながら、アルゴリズムの全体及び/又は一部が交互にプロセッサー以外の装置で実行、及び/又は周知の方式でファームウェアや専用のハードウェアで体現されて(例えば、特定用途向け集積回路(application specific integrated circuit、ASIC)、プログラム可能な論理素子(programmable logic device、PLD)、現場プログラム可能な論理素子(field programmable logic device、FPLD)、現場プログラム可能なゲートアレイ(field programmable gate array、FPGA)、個別な論理などで実現できる)よいことは、当業者に容易に分かることである。例えば、インターフェイスのいずれか又は全ての部品は、ソフトウェア、ハードウェア及び/又はファームウェアで実現されてよい。同様に、フロー図で示される一部や全ての機械読み取り可能なコマンドは、人力で実現されてよい。なお、図5及び図6に示されるフロー図を参照して本開示の1つの実施態様のアルゴリズムを記述したが、本実施例の機械読み取り可能なコマンドを実現できる他の様々な方法を代替的に使用してよいことは、当業者に明らかに分かることである。例えば、ブロックの実行順番を変更してよく、及び/又は本実施例に記述される一部のステップブロックを変更・削除又は組み合わせてよい。
上記をまとめると、本開示はマルチノードのマイクロサーバ装置及びその予備メカニズムに関する。当該予備メカニズムは、任意なシステムに広く配設して応用されてよく、上記システムにおける端末装置は、コアネットワークに接続されるダブルネットワークアクセス装置に至るネットワーク接続を有する。例えば、無線アクセスポイントは、以下で説明される内蔵スイッチの効果を奏する。アップリンクが正常に動作する別のアクセスポイントは初期アクセスポイントとの相互接続位置に適用される類似した方法を有する場合、アクセスポイントに接続されるモバイル装置はアクセスポイントにおけるアップリンクが故障した問題を解決する必要がない。
この出願案に使用される「部品」、「モジュール」、「システム」や類似した意味を持つ単語は、一般的にコンピュータ関連の実体、又はハードウェア(例えば、回路)、ハードウェアとソフトウェアの組み合わせ、ソフトウェア、もしくは1つ又は複数の特定機能を有する操作機械に関連する実体を指す。例えば、部品は、プロセッサー(例えば、デジタルシグナルプロセッサー)で動作する処理、プロセッサー、物体、実行可能ファイル、スレッド、プログラム及び/又はコンピュータであってよいが、これらに限定されない。説明の方式として、コントローラで動作するアプリケーション及びコントローラは部品であってよい。1つ又は複数の部品は処理及び/又はスレッド内に留まってよく、部品は1つのコンピュータにおいてホスト化され、及び/又は2つ又は複数のコンピュータの間に分散されてよい。なお、「装置」は、特殊に設計されるハードウェアや、ハードウェアを作動させて特定の機能を実行するソフトウェアを実行することによって専用で作られた一般的なハードウェア、コンピュータ読み取り可能なメディアに保存されるソフトウェア、又はこれらの組み合わせ、という形式でよい。
本文で使用される技術の目的は特定の実施例を説明するのみであり、本発明を限定するものではない。例えば、前後の文脈が明確に示さない限り、本文で使用される単数形式の「1つ」及び「当該」は複数形式も含む。なお、これについて、「含む」、「有する」、「備える」という単語又はこれらの改変形は発明を実施するための形態及び/又は特許請求の範囲に使用され、これらの単語は「含有する」という単語と類似した方式で指示した対象を含む。
別に定義しない限り、本文で使用される単語(技術及び科学的な単語を含む)は当業者が一般的に理解するものと同じ意味を有する。なお、単語(例えば、一般的な辞書で定義される単語)は、関連分野の先後の文脈における意味と一致した意味に解釈されるべきであり、本文が明確に理想的な意味や厳密で正式な意味に定義しない限り、そのように解釈されるべきではない。
上記では、本発明のそれぞれの実施例を説明したが、本発明のそれぞれの実施例は実例の方式で示されるだけであって限定するものではないと理解すべきである。本発明は1つ又は複数の実現方式に関して説明・記述したが、本明細書及び図面を閲覧・理解しようとする際、同等な変更及び改変が発生し得ることを当業者が理解すべきである。なお、本発明の特定な特徴が既に幾つの実現方式における1つのみの実施方式で開示された可能性があるが、任意の既定又は特定な応用が有利に期待できる場合に対して、その特徴が他の実現方式の1つ又は複数の他の特徴と組み合わせてよい。そのため、本発明の広さ及び範囲は上記に記述された実施例におけるいずれかの実施例に限定されるべきではない。本発明の範囲は以下の特許請求の範囲及び同等なものによって定義されるべきである。
10、100:ネットワークシステム
12、102:サーバ
20、22、120、122:ノード
30、32、130、132:スイッチ
42、44、46、48、52、54、56、58、62、64、66、68、142、144、146、148、152、154、156、158、162、164、166、168、172、174、176、178:ポート
50、150:ネットワーク
182:ホスト
500、502、504、506、508、510、512、600、602、604、606、608、610:ステップ

Claims (8)

  1. データパケットを送受信するように操作される第1のポートを有する第1のノードと、
    前記第1のノードの前記第1のポートに連結される第1の下流ポートと、第1の相互接続ポートと、ネットワークに連結される複数の第1のアップリンクポートと、を有し、前記第1のアップリンクポートでのネットワーク通信故障を検出するように配置される第1の内蔵スイッチと、
    第2の下流ポートと、前記第1の内蔵スイッチの前記第1の相互接続ポートに連結される第2の相互接続ポートと、ネットワークに連結される第2のアップリンクポートと、を有する第2の内蔵スイッチと、
    を含み、
    前記第1の内蔵スイッチが全ての前記第1のアップリンクポートの同時故障を検出した場合、前記第1のノードからのデータパケットは、前記第1の内蔵スイッチの前記第1の下流ポート、前記第1の相互接続ポート及び前記第2の内蔵スイッチの前記第2のアップリンクポートを介して、ネットワークにルーティングされ
    前記第1の内蔵スイッチは、前記第1の内蔵スイッチの前記第1のアップリンクポートの動作状態を示すメッセージのみが前記第1の相互接続ポートで伝送されることを許可する選別手続を含み、前記第1内蔵スイッチが前記第1のアップリンクポートの同時故障を検出した場合、前記選別手続は、前記第1の内蔵スイッチが前記第1の相互接続ポートでデータパケットを受信することを許可するマルチノード装置。
  2. 前記第2の内蔵スイッチの前記第2の下流ポートに連結され、データパケットを送受信するように操作される第2のポートを有する第2のノードを更に含む請求項1に記載のマルチノード装置。
  3. 前記第1の内蔵スイッチは、パケット転送表を含み、
    前記パケット転送表は、
    データパケットを前記第1のノードから前記第1のアップリンクポートを介してネットワークにルーティングするための第1の情報と、
    データパケットを前記第1の下流ポートを介して前記第1のノードにルーティングするための第2の情報と、
    を含み、
    前記第1の内蔵スイッチが前記第1のアップリンクポートの同時故障を検出した場合、前記パケット転送表内の前記第1の情報を削除する請求項1又は2に記載のマルチノード装置。
  4. 請求項1〜のいずれか一項に記載のマルチノード装置において
    前記第1の内蔵スイッチで前記第1のアップリンクポートの同時故障を検出するステップと、
    前記第1の内蔵スイッチが前記第1のアップリンクポートの同時故障を検出したことに応じてルーティング処理を実行するステップと、
    を含み、
    前記ルーティング処理は、
    前記第1のノードの前記第1のポートからのデータパケットを、前記第1の内蔵スイッチから前記第1の内蔵スイッチの前記第1の相互接続ポート及び前記第2の内蔵スイッチの前記第2の相互接続ポートを介して前記第2の内蔵スイッチにルーティングするステップと、
    前記データパケットを前記第2の内蔵スイッチの第2のアップリンクポートを介してネットワークにルーティングするステップと、
    前記第1の内蔵スイッチを介して前記第1のアップリンクポートが同時故障した旨のブロードキャストメッセージを前記第2の内蔵スイッチに送信するステップを含み、
    前記第2の内蔵スイッチは、前記ブロードキャストメッセージを受信した場合、前記第1の相互接続ポートにリンクされる前記第2の相互接続ポートでデータを受信することを許可する選別手続を動作するように配置され、
    前記ブロードキャストメッセージは、前記第1のノードのMACアドレスを含む、マルチノード装置とネットワークの間に予備通信を提供する方法。
  5. 前記ルーティング処理は、
    前記第2の内蔵スイッチの前記第2のアップリンクポートで受信したデータパケットを、前記第1の相互接続ポート、前記第2の相互接続ポート及び前記第1の内蔵スイッチの前記第1の下流ポートを介して前記第1のノードにルーティングするステップを更に含む請求項に記載の方法。
  6. 前記ブロードキャストメッセージに基づいて前記第2の内蔵スイッチ内のパケット転送表内の情報を更新するステップを更に含み、
    前記情報は、前記第1のノードに対するルーティングデータを含む請求項に記載の方法。
  7. ネットワークから前記第2の内蔵スイッチを介して前記第1のノードまでのデータ伝送を実現できるように、前記第2の内蔵スイッチを介してネットワークに前記ブロードキャストメッセージを送信するステップを更に含む請求項に記載の方法。
  8. 前記第1の内蔵スイッチのいずれか1つの前記第1のアップリンクポートの故障が修復したことを検出した場合、前記第1のノードから修復した前記第1のアップリンクポートまでのデータパケットルーティングを回復するステップをさらに含む請求項のいずれか一項に記載の方法。
JP2019036174A 2018-05-24 2019-02-28 マルチノード装置及びその予備通信方法 Active JP6781288B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201862676016P 2018-05-24 2018-05-24
US62/676,016 2018-05-24
US16/138,128 2018-09-21
US16/138,128 US10986015B2 (en) 2018-05-24 2018-09-21 Micro server built-in switch uplink port backup mechanism

Publications (2)

Publication Number Publication Date
JP2019205153A JP2019205153A (ja) 2019-11-28
JP6781288B2 true JP6781288B2 (ja) 2020-11-04

Family

ID=65529236

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019036174A Active JP6781288B2 (ja) 2018-05-24 2019-02-28 マルチノード装置及びその予備通信方法

Country Status (5)

Country Link
US (1) US10986015B2 (ja)
EP (1) EP3573298B1 (ja)
JP (1) JP6781288B2 (ja)
CN (1) CN110535792A (ja)
TW (1) TWI677247B (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113872868B (zh) * 2020-06-30 2022-11-25 华为技术有限公司 通知消息传输方法、装置及系统、存储介质
CN112333096A (zh) * 2020-10-16 2021-02-05 济南浪潮数据技术有限公司 一种微服务流量调度方法及相关组件

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6032266A (en) * 1996-04-05 2000-02-29 Hitachi, Ltd. Network system having function of changing route upon failure
US7152179B1 (en) * 2002-09-19 2006-12-19 Cisco Technology, Inc. IP redundancy with improved failover notification
US8948166B2 (en) * 2006-06-14 2015-02-03 Hewlett-Packard Development Company, Lp. System of implementing switch devices in a server system
CN101436997B (zh) * 2008-12-05 2011-06-01 西安交通大学 一种基于aodv以及链路故障类型的路由修复方法
US8780699B1 (en) * 2009-10-12 2014-07-15 Juniper Networks, Inc. Handling switchover of multi-homed connections in VPLS networks
US9660864B2 (en) 2009-10-16 2017-05-23 Brocade Communications Systems, Inc. Staged port initiation of inter switch links
CN102148677B (zh) * 2010-02-10 2013-06-26 杭州华三通信技术有限公司 一种更新地址解析协议表项的方法及核心交换机
TWI395433B (zh) 2010-03-10 2013-05-01 Etherwan Systems Inc 具有延展性之網路系統及其備援方法
US8730963B1 (en) 2010-11-19 2014-05-20 Extreme Networks, Inc. Methods, systems, and computer readable media for improved multi-switch link aggregation group (MLAG) convergence
JP6007819B2 (ja) * 2013-02-13 2016-10-12 日立金属株式会社 通信システムおよびネットワーク中継装置
US9311022B2 (en) * 2013-10-07 2016-04-12 Dell Products L.P. System and method for improved communication in a storage network
JP6189783B2 (ja) * 2014-04-08 2017-08-30 APRESIA Systems株式会社 中継システムおよびスイッチ装置
US9722915B2 (en) * 2014-04-29 2017-08-01 Dell Products L.P. System and method for multicast routing using peer groups
US9385942B2 (en) 2014-04-30 2016-07-05 Extreme Networks, Inc. Methods, systems, and computer readable media for providing N-node multi-switch link aggregation groups (MLAGs)
JP6333056B2 (ja) * 2014-05-14 2018-05-30 APRESIA Systems株式会社 中継システムおよびスイッチ装置
CN105141521A (zh) * 2015-09-21 2015-12-09 盛科网络(苏州)有限公司 使用保护切换机制实现多系统链路聚合的装置及方法
JP6635884B2 (ja) 2016-07-05 2020-01-29 株式会社ワンブリッジ 中継装置の冗長化構成における物理的および論理的非対称ルーティング防止メカニズム
CN108011816B (zh) * 2016-11-02 2021-04-06 中国移动通信集团公司 Epc防火墙容灾组网系统及基于该系统的数据传输方法
TWM547698U (zh) 2017-02-22 2017-08-21 晨宇創新股份有限公司 軟體定義儲存裝置與系統
TWM556974U (zh) 2017-08-30 2018-03-11 華南商業銀行股份有限公司 雙活備援架構

Also Published As

Publication number Publication date
JP2019205153A (ja) 2019-11-28
TW202005410A (zh) 2020-01-16
EP3573298A1 (en) 2019-11-27
EP3573298B1 (en) 2021-04-28
CN110535792A (zh) 2019-12-03
US10986015B2 (en) 2021-04-20
US20190363973A1 (en) 2019-11-28
TWI677247B (zh) 2019-11-11

Similar Documents

Publication Publication Date Title
US8982692B2 (en) System and method for rapid link failure handling
US9544223B2 (en) Communication system, control apparatus, method for controlling same, and program
EP3029893B1 (en) Method, controller, device and system for protecting service path
US9559892B2 (en) Fast node/link failure detection using software-defined-networking
US9473360B2 (en) System and method for primary switch election in peer groups
US10560550B1 (en) Automatic configuration of a replacement network device in a high-availability cluster
JP2008244907A (ja) 通信装置、通信システム及びそれに用いるlag管理テーブル管理方法
US11818038B2 (en) Initiator-based data-plane validation for segment routed, multiprotocol label switched (MPLS) networks
JP6781288B2 (ja) マルチノード装置及びその予備通信方法
EP3038296B1 (en) Pool element status information synchronization method, pool register and pool element
US20150263884A1 (en) Fabric switchover for systems with control plane and fabric plane on same board
US9426098B2 (en) Synchronizing out-of-sync elements in a distributed fibre channel forwarder
JP4344333B2 (ja) パケット転送装置、パケット転送ネットワークシステムおよびパケット転送方法
JP6554405B2 (ja) リングネットワークシステム、及び、ネットワークノード
US10097457B1 (en) Resolving a mismatch among control plane parameter values received from multiple routing control devices
CN109218117B (zh) 链路检测方法、装置及网络设备
US20180183709A1 (en) Communication node, communication system, communication method, and program
Park et al. Toward control path high availability for software-defined networks
US10666553B2 (en) Method for quick reconfiguration of routing in the event of a fault in a port of a switch
US10924391B2 (en) Systems and methods for automatic traffic recovery after VRRP VMAC installation failures in a LAG fabric
US10855520B1 (en) Utilizing upstream routing of multicast traffic from redundant multicast sources to increase multicast resiliency and availability
JP6282222B2 (ja) 通信装置
WO2016045276A1 (zh) 报文转发方法、装置、sdn及系统
WO2023188860A1 (ja) 分散システムおよび分散システムにおける通信経路作成方法
JP2017183925A (ja) 通信システムおよび制御装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200407

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200625

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200923

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201015

R150 Certificate of patent or registration of utility model

Ref document number: 6781288

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250