JP6129928B2 - アジャイルデータセンタネットワークアーキテクチャ - Google Patents

アジャイルデータセンタネットワークアーキテクチャ Download PDF

Info

Publication number
JP6129928B2
JP6129928B2 JP2015203787A JP2015203787A JP6129928B2 JP 6129928 B2 JP6129928 B2 JP 6129928B2 JP 2015203787 A JP2015203787 A JP 2015203787A JP 2015203787 A JP2015203787 A JP 2015203787A JP 6129928 B2 JP6129928 B2 JP 6129928B2
Authority
JP
Japan
Prior art keywords
server
packet
agile
switch
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015203787A
Other languages
English (en)
Other versions
JP2016040925A (ja
Inventor
グリーンバーグ アルバート
グリーンバーグ アルバート
ラヒリ パランタップ
ラヒリ パランタップ
エー.マルツ デイビッド
エー.マルツ デイビッド
ケー.パテル パルヴィーン
ケー.パテル パルヴィーン
セングプタ スディプタ
セングプタ スディプタ
ジェイン ナヴェンデュ
ジェイン ナヴェンデュ
キム チャンホン
キム チャンホン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2016040925A publication Critical patent/JP2016040925A/ja
Application granted granted Critical
Publication of JP6129928B2 publication Critical patent/JP6129928B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/46Interconnection of networks
    • H04L12/4633Interconnection of networks using encapsulation techniques, e.g. tunneling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/02Topology update or discovery
    • H04L45/04Interdomain routing, e.g. hierarchical routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/16Multipoint routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/24Multipath
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/35Switches specially adapted for specific applications
    • H04L49/356Switches specially adapted for specific applications for storage area networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/09Mapping addresses
    • H04L61/10Mapping addresses of different types
    • H04L61/103Mapping addresses of different types across network layers, e.g. resolution of network layer into physical layer addresses or address resolution protocol [ARP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/45Network directories; Name-to-address mapping
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1027Persistence of sessions during load balancing

Description

本発明は、アジャイルデータセンタネットワークアーキテクチャに関する。
従来のデータセンタネットワークアーキテクチャはそれらのアジリティ(データセンタネットワークのいずれかのサーバを何らかのサービスに割り当てるためのそれらの能力)を弱体化可能ないくつかの設計上の欠点に悩まされている。第一に、従来のネットワークの構成は典型的に、実質的にツリー状であり、比較的高価な機器からなる。これはネットワークの他のどこかで予備能力が利用可能であるときでさえ、計算ホットスポットの混雑及びその発展の結果である。第二に、従来のデータセンタネットワークは1つのサービスにおけるトラフィック輻輳がその周囲の他のサービスに影響を与えることを防止することにほとんど効果がない。1つのサービスがトラフィック輻輳を経験すると、同一のネットワークのサブツリーを共有する全てのサービスが巻き添え被害(ダメージ)を被ることは普通である。第三に、従来のデータセンタネットワークのルーティング設計は、通常、サーバにトポロジ的に重要なインターネットプロトコル(IP)アドレスを割り当て、サーバをVLAN(Virtual Local Area Network)のうちで分けることによりスケールを達成する。しかしながら、これはサーバがサービスの中で再割り当てされるとき大きな設定負担を作り出し、よってデータセンタのリソースを更に使ってしまう。更に、人間の関与がそれらの再設定で通常要求され、これによりこの処理の速度を制限してしまう。最後に、従来のデータセンタネットワークを設定する際の難しさ、そのようなネットワークで使用される機器のコスト等の他の事項は、これらのネットワークの
アジリティを否定的に影響を与えることができる。
本特許出願は、特にデータセンタ内で使用され得るアジャイル(agile)ネットワークアーキテクチャに関する。1つの実施例は、レイヤ3のインフラストラクチャ(インフラ)のサーバ等のマシンを接続する仮想レイヤ2のネットワークを提供する。
他の実施例は複数のスイッチを介して通信可能に接続された複数の計算装置を含んでいる。個々の計算装置をアプリケーションアドレスで関連付けすることができる。1つの計算装置をソースとして動作するように設定することができ、他の計算装置を送り先として動作するように設定することができる。パケットを送り先計算装置のアプリケーションアドレスに送信するようにソース計算装置を設定することができる。この実施例は、パケットを捕まえ、送り先計算装置と関連付けられたロケーションアドレスを識別し、そのロケーションアドレスにパケットを送信するために個々のスイッチを選択するように設定されるアジャイルエージェントを含むことができる。
上記した各実施例は紹介目的のために提供され、請求項に記載した構成の全てを包含及び/又は限定しない。
添付図面は本願で伝えられるコンセプトの実施例を示している。添付図面と関連した次の詳細な説明を参照することにより図示の実施例の特徴を更に容易に理解することができる。各図面の同類の参照番号は実現可能であれば同類の要素を示すために用いられている。更に、各参照番号の最も左の数字は図面と、参照番号が最初に紹介されている関連記載とを表す。
本コンセプトのいくつかの実施に応じたアジャイルネットワークアーキテクチャの例を示す図である。 本コンセプトのいくつかの実施に応じたアジャイルネットワークアーキテクチャの例を示す図である。 本コンセプトのいくつかの実施に応じたアジャイルネットワークアーキテクチャの例を示す図である。 本コンセプトのいくつかの実施に応じたアジャイルネットワークアーキテクチャの例を示す図である。 本コンセプトのいくつかの実施に応じたアジャイルネットワークアーキテクチャの例を示す図である。 本コンセプトのいくつかの実施に応じたアジャイルネットワークアーキテクチャの例を示す図である。 本コンセプトのいくつかの実施に応じたアジャイルネットワークデータセンタレイアウトの例を示す図である。 本コンセプトのいくつかの実施に応じたアジャイルネットワークデータセンタレイアウトの例を示す図である。 本コンセプトのいくつかの実施に応じたアジャイルネットワークデータセンタレイアウトの例を示す図である。 本コンセプトのいくつかの実施に応じて達成可能なアジャイルネットワークのフローチャート図である。
(概要)
本特許出願は特にデータセンタ内で使用され得るアジャイルネットワークアーキテクチャに関する。クラウドサービスは潜在的に10から何十万ものサーバを保有する大規模なデータセンタの構築を押し進めている。それらのデータセンタは多くの動的な数の異なるサービス(Webアプリケーション、電子メール、マップリデュースクラスタ等)を同時にサポートすることができる。クラウドサービスデータセンタの実施例はスケールアウト設計:必要に応じてサービス間で急いで再割り当てされ得るリソース(例えば、サーバ)の大きなプールを介して達成される信頼性及び性能に依存することができる。データネットワークのいずれかサーバに何らかのサービスを割り当てるための能力にはデータセンタネットワークのアジリティを考慮することができる。大きなコストと関連付けられ得るデータセンタの利益を効果的に引き出すためには、ネットワークアジリティは高価になる可能性がある。ネットワークアジリティなしではデータセンタサーバリソースは立ち往生となり、よって無駄なお金となる。
(第1のアジャイルネットワークアーキテクチャ例)
紹介目的のためにアジャイルネットワークアーキテクチャ100を例示する図1及び図2が参照される。アジャイルネットワークアーキテクチャ100はサーバ102(1)、102(2)、102(3)及び102(N)等の複数のサーバサイド計算装置を含むことができる。
用語サーバ及びマシンはデータを送信又は受信することができるいずれかの装置に言及していることを理解されるべきである。例えば、それらの用語は物理サーバ、(例えば、仮想化技術を用いて)サーバ上で動作する仮想マシン、1つのオペレーティングシステムを動作する計算装置、1以上のオペレーティングシステムを動作する計算装置、異なるオペレーティングシステム(例えば、マイクロソフトウインドウズ(登録商標)、Linux(登録商標)、FreeBSD)を動作する計算装置、サーバ以外の計算装置(例えば、ラップトップ、アドレサブルパワーサプライ(addressable power supply))、又は計算装置の一部(例えば、ネットワーク接続ディスク、ネットワーク接続メモリ、記憶サブシステム、記憶エリアネットワーク(SAN)、グラフィックス処理ユニット、計算アクセラレータ、量子計算装置)のいずれかに言及していることを理解されるべきである。
アジャイルネットワークアーキテクチャ100はサーバの数に関連してスケラビリティ(拡張性)を進展させることができる。スケラビリティを達成することができる1つの方法は、アプリケーションを利用してサーバ102(1)〜102(N)に対するイーサネット(登録商標)のようなフラットアドレッシングを作り出すことによって達成され得る。イーサネットのレイヤ2セマンティクスは、フラットアドレッシングをサポートするネットワーク状態を達成することと関連付けることができ、フラットアドレッシングはサーバがLAN(ローカルエリアネットワーク)上に存在したように、いずれかのインターネットプロトコル(IP)アドレスをいずれかのネットワークポートに接続されたいずれかのサーバに割り当てることができる。
この場合において、アプリケーションアドレス(AA)104(1),104(2),104(3),104(N)を各サーバ102(1)、102(2)、102(3),102(N)に各々割り当ていることができる。サーバの観点からすれば、いずれかのサーバ関連付けされたアプリケーションアドレス104(1),104(2),104(3),104(N)を介していずれかの他のサーバと通信することができる。これは何らかの様式でアプリケーションアドレスを配置することができる場合に、サーバ102(1)、102(2)、102(3),102(N)を備えるLANに対して有効であるそれら全てを含む、レイヤ2の機能として考えることができる。しかしながら、以下に説明されるように、いくつかの実施例では、アジャイルネットワークアーキテクチャの根本のインフ
ラは106で示されるようにレイヤ3であっても良い。よって、それらの実施例は、レイヤ3のインフラ106上に(又は利用して)仮想レイヤ2のネットワーク108を作り出すことができる。それらは同一のレイヤ3のインフラ106上に作り出した1以上の仮想レイヤ2のネットワーク108であっても良く、また各サーバはそれらの1以上の仮想レイヤ2のネットワーク108に属することができる。
図2はアジャイルネットワークアーキテクチャ100にインターネット204を介して接続されている外部クライアント202を示している。アジャイルネットワークアーキテクチャ100は、アプリケーションアドレス104(1)〜104(N)の知識を有する外部クライアントなしで1以上のサーバ102(1)〜102(N)に割り当てられているグローバル又はロケーションアドレス206と外部クライアントが通信することを可能にする。それらのコンセプトは図3〜図5の説明において以下に詳細に説明される。
(第2のアジャイルネットワークアーキテクチャ例)
図3は上記のコンセプトを実施可能なアジャイルネットワークアーキテクチャ300を例示している。この場合において、外部クライアント302はアジャイルシステム304とインターネット306及び/又は他のネットワークを介して通信することができる。この実施例では、アジャイルシステム304は、308で概して示された複数のルータ308(1)〜308(N)、310で概して示された複数の中間スイッチ310(1),310(2)及び310(N)、312で概して示された複数の集合スイッチ312(1),312(2)及び312(N)、314で概して示された複数のトップオブラック(TOR又はToR)スイッチ314(1),314(2)及び314(N)、並びに316
で概して示された複数のサーバ316(1),316(2),316(3),316(4),316(5)及び316(N)を含んでいる。図面のページの空間制限のため、6つのサーバ316(1)〜316(N)だけがここでは示されているが、アジャイルシステム304は、何千、何万、何十万、又はそれ以上のサーバを提供することができる。なお、簡潔及び図面のページの空間制限のため、コンポーネント間の接続(すなわち、通信パス)は図3〜図8に示されているとは限らない。
サーバ316(1)及び316(2)はサーバラック318(1)としてTORスイッチ314(1)と関連付けられている。同様に、サーバ316(3)及び316(4)はサーバラック318(2)としてTORスイッチ314(2)と関連付けられ、サーバ316(5)及び316(N)はサーバラック318(N)としてTORスイッチ314(N)と関連付けられている。これは上記したように図面ページの空間制限のためであり、度々、サーバラックは10以上のサーバを含む。更に、個々のサーバはアジャイルエージェントと関連付け可能である。例えば、サーバ316(1)はアジャイルエージェント320(1)と関連付けられる。同様の関係はサーバ316(2)〜316(N)とアジャイルエージェント320(2)〜320(N)との間に各々示される。
アジャイルエージェント320(1)〜320(N)の機能は以下に詳細に説明される。短くは、アジャイルエージェントは個々のサーバ間での通信を容易にすることができる。特にこの例では、アジャイルエージェントはコンピュータ読み取り可能な命令としてサーバ上に保存された論理モジュールとして考えても良い。他の実施例は、サーバ群を提供するアジャイルエージェント320がスイッチ、例えば、TORスイッチ又は中間スイッチに配置される構成を含んでも良い。スイッチに配置されたときには、アジャイルエージェントは、パケットがサーバ316から中間スイッチ310に向けてネットワークを逆送するようにパケットを処理する。そのような構成では、アジャイルエージェント320は
パケット転送パス上のカスタムハードウエアと、その転送パス又はスイッチの制御プロセッサで実施するソフトウエア命令との組み合わせを用いて実施されても良い。
アジャイルシステム304は3つのディレクトリサービスモジュール322(1)〜322(N)を更に含んでいる。ディレクトリサービスモジュールの図示の数はそのアジャイルシステムに必須ではなく、他の実施例は2、3以上のディレクトリサービスモジュール(及び/又は他の図示のコンポーネント)を使用することができる。ディレクトリサーバの機能は以下に詳細に説明される。短くは、ディレクトリサービスモジュールは、他の情報のうちの、アジャイルエージェント320(1)〜320(N)(及び/又は他のコンポーネント)によって利用され得るアプリケーションアドレス対ロケーションアドレスマッピング(順方向又は逆方向のマッピングのいずれか一方又は両方)を含むことができ、これによりアジャイルシステム304内の通信を容易にする。この場合において、ディレクトリサービスモジュール322(1)〜322(N)は特定のサーバ316(1)、316(3)及び316(5)と関連付けされる。他の設定では、そのディレクトリサービスモジュールは、データセンタ制御サーバ、スイッチ等の他のコンポーネントと共に、及び/又は専用の計算装置上で存在することができる。
アジャイルシステム304は2つの論理グループ化として考えても良い。第1の論理グループ化は326で示されたようにロケーション又はグローバルアドレスを担うリンクステートネットワークである。第2の論理グループ化は328で示されたようにアプリケーションアドレスを所有するサーバの代替可能なプールである。短くは、リンクステートネットワーク326のコンポーネントは、サーバ328のプールのどのサーバがどのアプリケーションアドレスを現在用いているかを追跡するために情報を交換することを必要としない。また、サーバの見地からは、サーバはサーバプール328内のいずれかの他のサーバと他のサーバのアプリケーションアドレスを介して通信することができる。この処理は
、サーバに対して透過的であるような方式でアジャイルエージェント、ディレクトリサービス、及び/又は他のコンポーネントによって容易にされる。他の方法としては、その処理は、サーバ上の他のコンポーネントがその処理に気づくかもしれないけれども、サーバ上で動作しているアプリケーションに対して透過的であっても良い。
ルータ308、中間スイッチ310、集合スイッチ312、TORスイッチ314及びサーバ316(1)〜316(N)は、レイヤ3の技術を用いる等で通信可能に接続されても良い。個々のサーバの見地からは、他のサーバとの通信はレイヤ2の通信(例えば、仮想レイヤ2)として現れる。しかしながら、サーバラック318(1)のソースサーバ316(1)からサーバラック318(2)の送り先サーバ316(3)へのようなラック間通信はレイヤ3のインフラを介して実際に起きる。例えば、アジャイルエージェント320(1)は通信(例えば、サーバ316(3)のアプリケーションアドレスにアドレス指定されたパケット)を捕らえ、その伝送を容易にすることができる。
アジャイルエージェント320(1)はディレクトリサービスモジュール322(1)〜322(N)のうちの1以上にアクセスして、サーバ316(3)で関連付けられたロケーションアドレスに対するアプリケーションアドレスのマッピングを得ることができる。例えば、そのマップ化したロケーションアドレスはTORスイッチに対してでも良い。アジャイルエージェントはロケーションアドレスを有するパケットをカプセル化することができる。そのアジャイルエージェントはそのカプセル化パケットを送信又は中継するように個々(又はセット)の集合及び/又は中間スイッチを選択することができる。この選択処理の機能は以下に更に詳細に説明される。TORスイッチ314(2)でそのカプセル化パケットを受け取ると、そのTORスイッチはそのパケットをデカプセル化してそのパケットをサーバ316(3)に送信することができる。代替実施形態では、ロケーションアドレスはサーバ316(3)又はサーバ316(3)上で動作する仮想マシンと関連付けされても良く、パケットは送り先サーバそれ自身上でデカプセル化されても良い。それらの実施形態において、アプリケーションアドレスが他のホストがアプリケーションとの通信のために使用しているアドレスであるLANによって接続されているアプリケーションに対して示し続けるために、サーバ又は仮想マシンに割り当てられたロケーションアドレスはサーバ上で動作する他のアプリケーションから隠されても良い。
代替の実施形態において、パケットはレイヤ3/レイヤ2の境界を横切る際に他のコンポーネントによってカプセル化されても良い。例えば、デカプセル化を行うことができるコンポーネントの例はハイパーバイザ及び/又は仮想マシンモニタのルートパーティションを含んでも良い。
この設定はサーバがサーバプール328の多数の中に加えられることを可能にし、また、サーバの見地からは、他のサーバはそれらが同一のサブネットワーク上にあるように現れることができる。代替的に又は追加的に、リンクステートネットワーク326のコンポーネントはサーバアプリケーションアドレスを気にする必要がない。更に、サーバが追加又は削除された時等のアドレス情報が変化したときはいつでもディレクトリサーバは多数の異なる種類のコンポーネントを更新するよりもむしろ単に更新されても良い。
要約すれば、レイヤ2のセマンティックは、サーバがLAN上に存在したように、いずれかのネットワークポートに接続されたいずれかのサーバにいずれかのIPアドレスを割り当てることができるフラットアドレッシングをサポートするネットワーク状態を達成することと関連付けられても良い。また、リンクステートネットワーク326内のコンポーネント(すなわち、スイッチ)はそのリンクステートネットワーク内の他のコンポーネントに気づいても良いが、サーバプール328のコンポーネントに気づく必要はない。更に、TORスイッチはそれら各々のラック内のサーバについて知っても良いが、他のラックのサーバについては知る必要がない。更に、アジャイルエージェントはサーバアプリケーションアドレス(AA)パケットを捕らえて、AAの送り先計算装置と関連付けされたロケーションアドレス(LA)を識別することができる。そして、アジャイルエージェントはLAにパケットを送信するために個々のスイッチ(又はスイッチのセット)を選択することができる。この場合において、その個々のスイッチは利用可能なスイッチの1以上を含むことができる。
また、この設定はサービスに関係した他のサーバの機能を促進する。例えば、ディレクトリサービスモジュール322(1)〜322(N)に含まれても良いようなデータセンタ管理ソフトウエアはいずれかのサービスにいずれかのサーバ316(1)〜316(N)を割り当て、そのサービスが期待するどのようなIPアドレスを有するサーバでも設定することができる。各サーバのネットワーク設定はLANを介して接続された場合と同一とすることができ、リンクローカルブロードキャストのような機能をサポートすることができる。サービス間の通信分離の目的は、サービス及び通信グループを定義する簡単で一貫したアプリケーションプログラムインターフェース(API)を提供することと関連付
けられても良い。この点において、ディレクトリサービスはサービス(例えば、顧客)と関連付けられたサーバのグループを定義することができる。1つのグループ内のサーバ間での完全接続を許可しても良く、異なるグループのどのサーバが通信することを許可されるべきかを管理するためにアクセスコントロールリスト(ACL)のような方針を規定しても良い。
更に、上記の設定はトラフィック管理にそれ自身役立つ。説明の目的のために、第1の顧客がアジャイルシステム304のサーバによって実行されるべきサービスに対して比較的高いレートを支払い、それによってサービス契約の比較的高い品質を得ると仮定する。更に、第2の顧客が比較的低いレートを支払い、それによってサービス契約の比較的低い品質を受けると仮定する。そのような場合において、第1の顧客のためにトラフィックを運営するように中間スイッチ310(1)〜310(N)の比較的高いパーセンテージ、又は全てを割り当てることができ、第2の顧客に対してより少ない数のスイッチを割り当てることができる。別の言い方をすれば、第1の顧客にスイッチの第1のサブセットを割り当てることができ、第2の顧客にスイッチの第2のサブセットを割り当てることができ
る。第1のセット及び第2のセットを互いに排他的に又は重複させても良い。例えば、いくつかの実施例では、個々のスイッチを特定顧客に対して専用に、又は複数の顧客に割り当てることができる。例えば、中間スイッチ310(1)を両方の顧客に割り当てることができ、中間スイッチ310(2)及び310(N)を排他的に第1の顧客に割り当てることができる。
要約すると、以下に詳細に説明されるように、アジャイルネットワークアーキテクチャ300は次の1以上の目的、すなわちサーバ間の一様な高い能力、サービス間のパフォーマンス分離、イーサネットレイヤ2のセマンティック、及び/又はサービス間の通信分離に関連付けられても良い。サーバ間の一様な高い能力の目的は、ネットワークを流れるトラフィックの割合が、先ず、送信するサーバ及び受信するサーバのネットワークインターフェースカードの利用可能な能力による場合を除いて、制限されないネットワーク状態を達成することと関連付けられても良い。よって、開発者の見地からは、その目的を達成することによって、ネットワークトポロジは、サーバを1つのサービスに加えるときにはもはや第一の関心事ではないかもしれない。サービス間のパフォーマンス分離の目的は、各
サービスが個別の物理スイッチによって接続されたかのように、1つのサービスのトラフィックが何らかの他のサービスによって運営されたトラフィックによって影響を受けないネットワーク状態を達成することと関連付けられても良い。イーサネットレイヤ2のセマンティックの目的は、サーバがLAN上に存在したように、ほとんどのIPアドレスが何らかのネットワークポートに接続されたいずれかのサーバに割り当てられ得るフラットアドレッシングをサポートするネットワーク状態を達成することと関連付けられても良い。よって、データセンタ管理ソフトウエアはいずれかのサーバを何らかのサービスに割り当て、サービスが期待するどんなIPアドレスを有するサーバでも設定することができる。
各サーバのネットワーク設定はLANを介して接続された場合と同一とすることができ、リンクローカルブロードキャストのような機能をサポートすることができる。サービス間の通信分離の目的は、サービス及び通信グループを定義する簡単で一貫したAPIを提供することと関連付けられても良い。この点において、サーバのグループを定義するディレクトリシステム(すなわち、例えば、ディレクトリサービスモジュール322(1)〜322(N)を介して)は提供されても良い。1つのグループ内のサーバ間での完全接続を許可しても良く、異なるグループのどのサーバが通信することを許可されるべきかを管理するために方針を規定しても良い。
説明したアジャイルネットワークアーキテクチャを利用することによって、次のネットワークの特徴の1以上と関連付けられているデータセンタネットワークを備えることができる。(1)サービスインスタンスがネットワークのどこにでも配置されることを可能にするフラットアドレッシング、(2)ネットワークパスを越えて一様にトラフィックを分散するようにランダム化を使用するロードバランシング(例えば、バリアントロードバランシング(VLB:Valiant Load Balancing))、(3)イーサネットレイヤ2のセマンティックを達成し、大きなサーバプールへスケーリングを行う新しいエンドシステムベースのアドレス解決サービス。
上記した目的を達成するために、少なくともいくつかの実施形態において、次のアジャイルネットワークアーキテクチャの設計原理の1以上を様々な実施例で用いることができる。
(多数のパスダイバシティを有するトポロジの利用)
「メッシィ(meshy)」トポロジを利用することにより、サーバの個々のセット間の多数のパスを提供することができる。例えば、サーバラック318(1)の複数のサーバとサーバラック318(N)の複数のサーバとの間の通信はTORスイッチ314(1)から集合スイッチ312(1)〜312(2)のいずれかを介して中間スイッチ310(1)〜310(N)のいずれかに達することができる。中間スイッチから、その通信は集合スイッチ312(2)〜312(N)のいずれかを介してTORスイッチ314(N)に達することができる。
この設定はいくつかの利益を得る結果にすることができる。例えば、多数のパスの存在は、明白なトラフィックエンジニアリング又はパラメータのチューニングの必要性なしにネットワークの輻輳状態の減少及び/又は解消を可能にする。更に、多数のパスは「スケールアウト(scale−out)」ネットワーク設計を可能にさせる。言い換えると、より低コストのスイッチを加えることにより更なる能力を加えることができる。逆に、従来の階層的なネットワーク設計は階層の高いレベルで1又は非常に僅かのリンクのトラフィックを集中させる。その結果、従来のネットワークはトラフィックの高い密度に対処するために高価な「ビッグアイロン(big iron:大型コンピュータ)」スイッチの購入を必要とする可能性がある。
更に、「メッシィ」トポロジを利用することにより、多数のパスはリンク又はスイッチが機能しなくなったとき正常な劣化を可能にさせる。例えば、所定のレイヤで「n」のスイッチを有する説明したアジャイルデータセンタネットワークアーキテクチャに応じて実施されたアジャイルネットワークは、スイッチが機能しなくなったとき、その能力の50%を失う可能性がある従来のネットワークと比較して、その能力の1/nだけ失う可能性がある。アジャイルデータネットワークアーキテクチャに応じて実施されたアジャイルネットワークは、完全な二分トポロジを潜在的に利用することができる。
(アドレス不安定さに対するランダム化)
データセンタはそれらの負荷、それらのトラフィック、及びそれらの故障パターンにおいて非常に大きい不安定さを持つ可能性がある。よって、リソースの複数の大きなプールを作り出すことができる。負荷をランダムにそれらに分散することができ、最悪の場合を平均的な場合に改善するために、最良の場合のいくつかの性能を、引き換えにすることができる。少なくともいくつかの実施形態において、広範囲のパスダイバシティと関連付けられたトポロジ(例えば、図3に明らかにされたように)が利用されても良い。VLB技術等のロードバランシング技術を用いてトポロジを越えてワークフローのルート決めすることができる。短くは、VLB技術はデータ伝送を担うために用いられるパス又は複数のパスをランダムに選択することを含むことができ、ここでパスは一連のリンク及び/又は
スイッチからなる。続いて、パスを再選択し、ここで再選択は初期のパスを構成するスイッチ又はリンクの1以上を変えることを必要とする。その再選択は、特定のバイト/パケット数を送信/受信した後に、及び/又は選択したパス、スイッチ又はリンクと関連付けられた伝送状況が生じたことに応答するように周期的に起きても良い。例えば、パケット遅延又は他の通信障害が検出されたならば、その選択処理が繰り返されても良い。この原理のアプリケーションを通して、一様な能力及びパフォーマンス分離目的を合致することができる。
特に、データセンタトラフィックマトリックスにおけるアドレスの不安定さ及び不確かさに対して、ネットワークパス間でフローをランダムにハッシュ(hash)するためにロードバランシング技術(例えば、VLB)を利用することができる。このアプローチに対する目的は、ホーストラフィックモデルにおいてのように、ネットワークの入出制限の影響下にある任意のトラフィック変動のための帯域幅保証を提供することである。短くは、ホースモデルは、所定のパスに亘るデータ伝送レートがそのパスの最も遅い又は最も規制された部分を越えることができないことを特定する。
フロー単位(フローの大部分のパケットがパスを再選択したときを除いてネットワークを介して同一のパスに続いていることを意味する)で、VBLのようなロードバランシング技術を用いることは、有利である可能性がある。それは、フローのパケットが並べ直しされる機会、又は送り先で判断された待ち時間を急に変更する体験、及び/又はフロー内のMTU(Maximum Transmission Unit)の違いのためにパスMTU発見プロトコルの混乱動作を減少することができるからである。トラフィックのいくつかの種類(例えば、パケットの並べ直しによって悪影響を与えない種類)及びいくつかの環境(例えば、全てのパスに亘って非常に均一な遅延を有する環境)は、パケット精度(潜在的な異なるパスがパケットのシーケンスにおけるパケット毎に使用されることを意味する)でVLBのようなロードバランシングを用いることを好むかもしれない。フローの共通に受け入れられた定義のいくつかを用いることができる。例えば、IP5タプルフロー(5−tuple flow)、IP2タプルフロー(2−tuple flow)、又は2つのサブネット又はアドレスレンジ間のパケットのセット。
アジャイルデータセンタネットワークを提供するコンテキストにおいて、入出制限はサーバラインカード速度に対応することができる。ハイバイセクション帯域幅トポロジ(high bisection bandwidth topology)(例えば、折り畳みClosトポロジ)との組み合わせにおいて、非干渉パケットスイッチ切替ネットワーク(非ブロッキング回路スイッチ切替ネットワークの対応)を作り出し、サーバ入出ポート速度を越える負荷を維持していない)トラフィックパターンのためのホットスポットフリーパフォーマンスを提供するためにロードバランシング技術を利用することができる。この点において、いくつかの実施例では、TCP(Transmission Control Protocol)のエンドツーエンド輻輳制御機構はホースモデルを実行して過動作サーバポート速度を避けるために利用されても良い。この原理は図3に示された論理トポロジに導入することができ、それは3つの異なるスイッチ層、TOR314、集合312及び中間310から構成することができる。1つのサーバから他のサーバへのフローは、ランダム中間スイッチを介し、複数のTOR及び集合スイッチを越えてランダムパスをとることができる。VLB等のロードバランシング技術は、利用を円滑にして持続するトラフィック輻輳を解消するためにデータセンタの中間スイッチ構造のコンテキストに利用されても良い。
(ロケーションからの名称分離)
ロケーションから名称を分離することは、新しい機能を実施するために用いられ得る自由度を作り出すことができる。この原理はデータセンタネットワークにおいてアジリティを可能にし、アドレスとロケーションとの間を結びつけることが起き得るフラグメンテーションを減少することによって利用を改善するために利用することができる。この原理のアプリケーション及び以下に説明されるエンドシステムを包括する原理を通して、レイヤ2のセマンティクス目的を合致することができる。よって、ネットワークトポロジに関係なく、またそれらのアプリケーション又はネットワークスイッチを再設定することなくIPアドレスを割り当てることが開発者に可能になる。
ネットワークアジリティ(サーバ上のサービスをサポートすること、サーバプールの動的成長及び縮小、及び負荷マイグレーション)を拡張するために、AAと称した名称及びLAと称したロケーションを分離するIPアドレッシングスキームを用いることができる。ディレクトリサービスモジュール322(1)〜322(N)として示されたようなアジャイルディレクトリサービスは、拡張性及び信頼性ある方法でAAとLAとの間のマッピングを管理するために定義され得る。アジャイルディレクトリサービスは、個々のサーバ上でのネットワーキングスタックにおいて動作するシム層によって含まれても良い。図3に表された実施例では、このシム層をアジャイルエージェント320(1)〜320(
N)として示している。
(エンドシステムの包括)
データセンタサーバ上のオペレーティングシステムを含むソフトウエアは、通常、データセンタ内での利用のために広範囲に修正される。例えば、新しい又は修正したソフトウエアは仮想化のためのハイパーバイザ又は複数のサーバに亘ってデータを保存するためにブロブファイルシステムを作り出すことができる。スイッチ上のソフトウエアを変更するよりむしろ、このソフトウエアのプログラム可能性を利用することができる。更に、スイッチ又はサーバのハードウエアへの変更を避ける又は制限することができ、使われていないアプリケーションが修正されずに残すことができる。現在利用可能な低コストのスイッチASIC(application specific integrated circuit)の制限内で動作するようにサーバ上でソフトウエアを用いることによって、今日作り開発され得る設計を作り出すことができる。例えば、ARP(Address Resolution Protocol)パケットのブロードキャストにより作り出される拡張性の問題は、スイッチ上でソフトウエア又はハンドウエアの変更を介してARPを制御する試みよりむしろ、サーバ上のARPリクエストを捕らえ、それらをディレクトリシステムに対してルックアップリクエストに変換することによって、減少及び/又は解消され得る。
図4はアジャイルエージェント320(1)を詳細に例示している。この場合において、アジャイルエージェント320(1)はユーザモード406及びカーネルモード408を含むサーバマシン402(1)上で動作する。そのサーバマシンはユーザモードでユーザモードエージェント410を含む。カーネルモードはTCPコンポーネント412、IPコンポーネント414、エンカプスレータ416、NIC418及びルーティング情報キャッシュ420を含む。サーバマシンはディレクトリサービス322(1)を含む、及び/又はそれと通信することができる。ディレクトリサービスはサーバロールコンポーネント422、サーバヘルスコンポーネント424、及びネットワークヘルスコンポーネント426を含むことができる。アジャイルエージェント320(1)はユーザモードエージェント410、エンカプスレータ416、及びルーティング情報キャッシュ420を含んでも良い。エンカプスレータ416はARPを捕らえ、それをユーザモードエージェント410に送信することができる。ユーザモードエージェントはディレクトリサービス322(1)に問い合わせすることができる。カーネルモードコンポーネントにユーザモードエージェントを含むように、又はルーティングテーブルルックアップの期間のようなARP以外の機構を介して又はIPテーブル又はIPチェイン等の機構を介してディレクトリルックアップを含むように、それらのブロックの他の配置が可能であることが理解されるべきである。
図3のアジャイルネットワークアーキテクチャにおいて、エンドシステム制御は新しい機能を速く注入する機構を提供することができる。よって、アジャイルエージェントはロードバランシングに使用されるランダム化を制御することによってきめ細かいパス制御を提供することができる。加えて、名称及びロケーションの分離を実現するために、アジャイルエージェントはイーサネットのARP機能をアジャイルディレクトリサービスへの問い合わせ(クエリ)で置き換えることができる。アジャイルディレクトリサービス自身は、スイッチよりむしろ、サーバ上に実現され得る。このアジャイルディレクトリサービスは、サーバ到達可能性、グループ化、アクセス制御、リソース配分(例えば、中間スイッチの能力)、分離(例えば、中間スイッチの非重複化)、及び動的成長及び縮小のきめ細かい制御を可能にする。
(ネットワーク技術の利用)
ネットワークスイッチにおけるロバスト実装を有する1以上のネットワーク技術を利用することは、アジャイルネットワークの設計を簡単にし、そのようなネットワークを開発するためにオペレータ意欲を増加させることができる。例えば、少なくともいくつかの実施形態において、リンクステートルーティングプロトコルは、サーバから障害を隠すためにネットワークスイッチ上に実装されても良く、また、アジャイルディレクトリサービスでの負荷を減少させる手助けに利用され得る。それらのプロトコルはアジャイルネットワークのためにトポロジ及びルートを維持するために利用されても良く、それはアジャイルディレクトリサービスとネットワーク制御プレーンとの間の結合を減少させることができる。スイッチ上のエニキャスト(anycast)アドレスを定義するルーティング設計を通して、上記したアジャイルアーキテクチャはサーバからスイッチの障害を隠すためにECMP(Equal Cost Multi−Path)を利用することができる。更に、これはディレクトリシステム上の負荷を減少させることができる。また、多数のパスの使用をサポートする他のルーティングプロトコルは適切である。
(仮想レイヤ2のネットワーク例に関する実施詳細)
(トポロジのスケールアウト)
従来のネットワークは、典型的に、ネットワークの最高レベルでトラフィックを少しのスイッチに集中させる。これはそれらの装置の能力に二等分の帯域幅を両方制限し、それらが機能しなくなったときネットワークに影響をかなり与える可能性がある。しかしながら、それらの問題を避けるために、トラフィックの不安定さに対処するためにランダム化を用いる原理によって運営されるアジャイルネットワークトポロジを利用することができる。この点について、ネットワーク装置をスケールアウトするアプローチをとることができる。これは、図3に示されたように、早送りに専門化され得る低複雑スイッチの比較的ブロードなネットワークに、結果的になる可能性がある。これは、中間スイッチ310(1)〜310(N)と集合スイッチ312(1)〜312(N)との間のリンクが完全な二分グラフを形成することができる折り畳みClosネットワークの例である。従来のトポロジにあるように、TORは2つの集合スイッチに接続することができる。しかしながら、いずれかの2つの集合スイッチの間の多数のパスは、nの中間スイッチがあるならば、それらのいずれかの故障が1/nだけ−帯域幅の正常な低下と称され得る望ましいプロパティ、二分帯域幅を減少させることを意味する。更に、オーバサブスクリプション(oversubscription)がないようにクロネットワーク等のネットワークを設計することができる。例えば、図3において、Dの数のインターフェースポートを有する集合スイッチ及び中間スイッチを用いることができる。それらのスイッチは、スイッチの各層間の能力がリンク能力のD*D/2倍であるように接続され得る。
ネットワークの上段又は「スパイン(spine)」で中間スイッチを介して戻ってくることによってネットワークがサーバラインカードで入出限度の影響下にある潜在的に全ての可能なトラフィックマトリックスに対する帯域幅保証を提供することができることにおいて、ロードバランシング(例えば、VLB)に対してClosネットワークのようなネットワークは格別によく適合されても良い。ルーティングは単純で回復力(例えば、ランダムパスはランダム中間ノード及び取り払われたランダムパスを必要としても良い)を持っていて良い。
上記したアジャイルアーキテクチャは従来のネットワークアーキテクチャで達成され得るよりも大きなパス制御を提供することができる。特に、複数の中間ノードを区分することができ、異なる区分に専用化されたトラフィッククラスは高い帯域幅全体をいくつかのトラフィッククラスに割り当てる。輻輳指示は、IEEE(Institute of Electrical and Electronics Engineers)802.1 Qau輻輳制御におけるように、ECN(Explicit Congestion Notification)又は類似の機構を介して送り元に信号で戻されても良い。よって、ECN信号を集める送り元は、(上記のパスを再選択すると呼ばれた)ネットワークを介して代替パスを選択するために用いられるソースパケット内のフィールドを変えることによって応答することができる。
(アジャイルルーティング)
ロケーションから名称を分離する原理を実施するために、アジャイルネットワークは2つのIPアドレスファミリを用いることができる。図3はそのような分離を示している。ネットワークインフラは複数のLAに関して動作することができる。スイッチ及びインターフェース(310(1)〜310(N),312(1)〜312(N),及び314(1)〜314(N))は割り当てられた複数のLAであることができる。スイッチはそれらのLAを担うリンクステートIPルーティングプロトコルを動作させることができる。
サーバ316(1)〜316(N)上で動作するようなアプリケーションは複数のLAに気付かず、複数のAAに気付くことができる。この分離をいくつかの利益と関連付けることができる。第一に、パケットはAAに直接送信されるよりむしろ適当なLAに送られても良い(スイッチはそれらを送信するためにホスト毎にルーティングエントリを維持する必要がない)。これは複数のAAを複数のLAに変換するアジャイルディレクトリサービスが、どのサービスが通信のために許可されるべきかについての方針を実行することができることを意味している。第二に、低コストスイッチは度々、全てのLAルータを保持することができる小さなルーティングテーブル(例えば、12Kエントリ)を有するが、AAの数だけ負担が掛かる。このコンセプトは特に、スイッチが保持することができるルーティングエントリの数より多いネットワークが作られることを可能にすることにおいて価値がある可能性がある。第三に、いずれかのAAがトポロジとは関係なくいずれかのサーバに割り当てられ得るので分離はアジリティを可能にする。第四に、AAから分離して複数のLAを割り当てる自由は、複数のLAがトポロジ的に重要な方法で要約され得るように割り当てられ、更に、スイッチが担う必要があるルーティング状態の量を制限することを意味している。一方、データセンタ内で動作しているサービス又はデータセンタのオペレータは、どんな方法においても、アプリケーションアドレスを割り当てる能力を妨げないことを望んでいる。
本発明の代替的な実施形態はLA及びAAアドレスのための他の種類のデータを用いても良い。例えば、LAアドレスはIPv4で可能であり、AAアドレスはIPv6で可能であり、又は逆も同様である。又はIPv6はAA及びLAの両方のアドレスのために使用可能であり、又はIEEE802.1MACアドレスはAAアドレスとして使用可能である。一方、IPアドレス(v4又はv6)はLAアドレスのために用いられ、又は逆も同様である。また、アドレスは、例えば、IPアドレスを有するVLANタグ又はVRF識別子のように、異なる種類のアドレスと一緒に組み合わせることによって作り出されても良い。
次の記載は、下層のネットワーク構造を仮想化し、レイヤ2LAN及びそれの上の何かのそれらのグループの他のサーバ316(1)〜316(N)に接続され、ホストが比較的大きいデータセンタワイドレイヤ2LANの一部であるアジャイルネットワークのサーバ316(1)〜316(N)にイルージョンを作り出すために、トポロジ、ルーティング設計、アジャイルエージェント、及びアジャイルディレクトリサービスがどのように組み合わされるかを説明する。
(アドレス決定及びパケット転送)
少なくともいくつかの実施例では、サーバ316(1)〜316(N)が信じることを可能にするためそれらは同一のサービスで他のサーバと1つの大きなVLANを共有し、大きなイーサネットを悩ますブロードキャストARPスケーリング障害を解消し、以下に記載した解決策が提供される。なお、予め、次の解決策は下位互換があり、存在するデータセンタアプリケーションに対して透過であることが可能である。
(パケット転送)
AAは通常、ネットワークのルーティングプロトコルに示されても良い。よって、パケットを受信するサーバのために、パケットのソースは先ず、そのパケットをカプセル化することができ、ホストのために外側のヘッダの送り先をLAに設定する。LAアドレスを保持する装置に到達すると、パケットはデカプセル化され、送り先のサーバに配信される。1つの実施形態において、送り先のサーバのためのLAは、その送り先サーバが設置されている元のTORに割り当てられる。パケットがその送り先TORに到着すると、通常のレイヤ2の配信規則によれば、そのTORスイッチがそのパケットをデカプセル化して内側のヘッダの送り先AAに基づいてパケット配信することができる。代替的に、LAは物理的送り先サーバ又はそのサーバ上で動作する仮想マシンと関連付けられても良い。
(アドレス決定)
複数のAAアドレスが複数のサーバと同一のLANに存在することを信じるようにその複数のサーバを設定することができ、それでアプリケーションが初めてAAにパケットを送信するときホスト上のカーネルネットワークスタックは送り先のAAのためのブロードキャストARPリクエストを生成することができる。ソースサーバのネットワーキングスタックで動作するアジャイルエージェントはそのARPリクエストを捕らえてそれをアジャイルディレクトリサービスへのユニキャスト問い合わせ(クエリ)に変換することができる。アジャイルディレクトリサービスがその問い合わせに答えるとき、アジャイルディレクトリサービスはパケットが送られるべきLAを提供することができる。また、アジャ
イルディレクトリサービスはパケットを中継するために用いられ得る中間スイッチ又は中間スイッチのセットを提供することができる。
(ディレクトリサービスによるインターサービスアクセス制御)
サーバは、AAのためのパケットを送る必要がないTORのLAを得ることができないならば、パケットをAAに送信することができなくても良い。よって、アジャイルディレクトリサービス322(1)〜322(N)は通信方針を実行することができる。アジャイルディレクトリサービスはルックアップリクエストを処理するとき、どのサーバがそのリクエストを作っているか、ソース及び送り先の両方が属するサービス、及びそれらのサービスの分離方針を知る。その方針が「拒否(deny)」であるならば、アジャイルディレクトリサービスはLAを提供することを単に拒否することができる。上記したアジャイルネットワークアーキテクチャの有利な点はインターサービス通信が許可されたとき、IPゲートウエイに迂回されることなくパケットが送信サーバから受信サーバへ直接流れることができることである。これは、従来のアーキテクチャでの2つのVLANの接続とは異なっている。
(インターネットとのインターラクション)
度々、データセンタによって処理されるトラフィックのほぼ20%がインターネットへの又はインターネットからのトラフィックである。よって、データセンタネットワークがそれらの大きなボリュームを処理することができることは有利な点である。先ず、上記したアジャイルネットワークアーキテクチャが仮想レイヤ2ネットワークを実施するためにレイヤ3の構造を利用することは不思議に思えるかもしれないが、この1つの有利な点は、いくつかの従来提案されたネットワーク環境で要求されたようなヘッダの書き直しのためにゲートウエイサーバを経由することが強制されることなく、このアーキテクチャを有するアジャイルデータセンタネットワークを作り出すことが可能なスイッチの高速シリコ
ンを横切って外部のトラフィックが直接流れることができることである。
インターネットから直接到達可能であることを必要とするサーバ(例えば、フロントエンドウェブサーバ)には2つのアドレス、LA及びAAを割り当てることができる。LAはインターネットワーク通信のために用いられても良い。AAはバックエンドサーバを用いたイントラデータセンタ通信のために用いられても良い。LAは、BGP(Border Gateway Protocol)を介して伝えられかつ外部から到達可能であるプールから引き出されても良い。そのため、インターネットからのトラフィックはサーバに直接到達することができる。そのサーバから外部の送り先へのパケットはコアルータに向けてルート決めされ、ECMPによって利用可能なリンク及びコアルータを介して拡がっても良い。
(ブロードキャストの処理)
上記したアジャイルネットワークアーキテクチャは下位互換性のアプリケーションに対してレイヤ2セマンティクスを提供することができる。これはブロードキャスト及びマルチメディアをサポートすることを含むことができる。アジャイルネットワークアーキテクチャのアプローチはARP及びDHCP(Dynamic Host Configuration Protocol)のようなブロードキャストの大部分の共通のソースを完全に除去することである。ARPはアジリティエージェント320のARPパケットを捕らえて上記したようにアジャイルディレクトリサービスから情報を調べた後、応答を与えることによって処理されても良く、DHCPパケットは従来のDHCPリレーエージェント及びDHCPサーバに送られたユニキャストを用いてTORで捕らえられても良い。他のブロードキャストパケットを処理するために、セット内の他のホストによって送信されたブロードキャストパケットを受信可能であるべきホストの各セットはIPマルチキャストアドレスを割り当てられても良い。このアドレスはディレクトリサービスによって割り当てられても良く、アジリティエージェントはそのディレクトリシステムを問い合わせることによってそのアドレスを知ることができる。
ブロードキャストアドレスに送信されたパケットは代わりにそのサービスのマルチキャストアドレスに進行するように修正されても良い。アジャイルネットワークアーキテクチャのアジャイルエージェントは混乱を防止するために限界ブロードキャストトラフィックのレートを定めても良い。アジャイルエージェントは、サーバが最新の時間間隔(例えば、過去1秒及び過去60秒)に亘って送信したブロードキャストパケットのレートの見積もりを維持し、サーバが各間隔の期間にブロードキャストパケットの設定数よりも多く送信することを防止することができる。許可されたパケット数を越えた分のパケットは次の間隔まで引っ込められるか又は遅延させても良い。また、ネイティブIPマルチキャストがサポートされても良い。
複数のスイッチがレイヤ3のルータとして動作する実施形態の潜在的な有利な点は、マルチキャストグループに属する全てのマシン又はマシンに対してマルチキャストグループにアドレス指定したパケットの配信を実施することが特に容易であることである。PIM−BIDIR等の存在するIPマルチキャストルーティングプロトコルのいずれかは複数のスイッチに設定されても良い。これは、それらにマルチキャストグループに属する各ホスト又はマシンでエンドポイントを有するマルチキャスト分散ツリーを計算することをさせる。ホスト上のアジャイルエージェント、マシン、又はサーバは、通常、IGMPをそのデフォルトゲートウエイに送信することによって適切なマルチキャストグループの一部であるとしてホスト、マシン、又はサーバを登録する。それ故、そのマルチキャストルーティングプロトコルはホスト、マシン、又はサーバをそのマルチキャストグループのための分散ツリーに加えることを処理する。レイヤ2で動作するスイッチはマルチキャストグループ毎にVLANのような様々な機構を用いることができ、或いは、ネットワークを通して存在するパケットを、アジャイルエージェントのホスト、マシン又はサーバが受信すべきでないパケットを取り除く各ホスト、マシン、又はサーバ上のアジャイルエージェントで満たさせることができる。
(マルチパスルーティングでのランダム化)
上記したアジャイルネットワークアーキテクチャは、少なくともいくつかの実施形態では、2つの関係した機構、VLB及びECMP(Equal Cost Multipath)を用いて不安定さに対処するためにランダム化を用いる原理を活用/利用することができる。両方の目的は似ており、持続的な輻輳状態を減少又は防止するためにVLBは複数の中間ノードに亘ってランダムにトラフィックを分散し、ECMPは等コストパスを越えるトラフィックを発する。以下に詳細に説明されるように、VLB及びECMPは、各々がその他において制限を克服するために用いられる点で相補的である。両方の機構は、パケットの送り元がネットワークを越えるパスの選択に影響を与えるために使用可能な制御を提供することができる。アジャイルエージェントはそれらの制御が輻輳状態を避けるために利用されることを可能にする。
図5は、図3で紹介されたアジャイルネットワークアーキテクチャ300のサブセットを示している。図5はサーバ通信に対するサーバの更なる詳細を提供する。この例はサーバ316(5)と通信するサーバ316(1)を含む。送信サーバ316(1)及び送り先サーバ316(5)は、VLANとして機能し10.128/9のアプリケーションアドレスを有するサーバプール328内で動作することができる。中間スイッチ310(1)〜310(N)はリンクステートネットワーク328内に存在する。
アジャイルネットワークアーキテクチャ300は、VLBの利益がランダムに選択された中間ノードを外れるようにバケットを強制することによって達成されることを可能にする。この場合に、送り元のアジャイルエージェント320(1)は各パケットを中間スイッチ310(1)〜310(N)に対してカプセル化することによりこれを実施することができる。その中間スイッチはそのパケットを送り先のTOR(この場合、314(1))に送る。ここで、パケットは先ず、中間スイッチのうちの、310(2)のような1つに配信され、そのスイッチによってデカプセル化され、TOR314(1)のLAに配信され、再びデカプセル化され、そして、最後に送り先サーバ316(5)に送信されても
良い。
アジャイルエージェント320(1)は活性状態の中間スイッチ310(1)〜310(N)のアドレスを知っているならば、パケットを送信するときそれらの中からランダムに選択することができる。しかしながら、これは、中間スイッチが機能しなくなったとき潜在的な何十万のアジャイルエージェントの更新を必要とする可能性がある。代わって、同一のLAアドレスが多数の中間スイッチに割り当てられても良い(この場合、LAアドレス10.0.0.5)。そのアジャイルディレクトリサービス(図3に示された)は、このエニキャストアドレスを1以上のルックアップ結果の一部としてアジャイルエージェント320(1)に戻すことができる。ECMPはそのエニキャストアドレスにカプセル化されたパケットを活性状態の中間スイッチ310(1)〜310(N)のうちの1つへ配信する処理を行うことができる。もしスイッチが機能しなくなったならば、ECMPは再動作してアジャイルエージェントを通知する必要性を除去することができる。
しかしながら、ECMPはスケーリング限界を有しても良い。従来のスイッチは、今日、16wayのECMPをサポートすることができ、また、256wayのECMPスイッチが利用可能、又はまもなく利用可能である。ECMPを使用するよりも利用可能なパスが存在することが生じたならば、VLBカプセル化は補償することができる。1つの解決法はいくつかのエニキャストアドレスを定義することであり、個々のエニキャストアドレスはECMPが蓄積できるように多くの中間スイッチ310(1)〜310(N)と関連付けされる。送り元は負荷を分散するためにエニキャストアドレスに亘ってハッシュを行うことができ、スイッチが機能しなくなると、個々のサーバが通知される必要性がないようにそのエニキャストアドレスがディレクトリシステムによって他のスイッチに再割り当てされても良い。説明のために、この態様はディレクトリシステムによって提供されたネットワーク制御機能として考慮されても良い。
上記したVLBベースの気がつかないルーティングが、折り畳みClosネットワークトポロジについて純粋なOSPF/ECMP機構を用いて実施されても良い。そのような設定は中間スイッチにおいてデカプセル化のサポートを必要としない。例えば、Nが各TOR上のアップリンクの数であるならば、集合スイッチはセットにグループ化されても良い。いくつかの場合には、それらのセットの各々はNのスイッチを正確に含むことができる。各TORは1つのセット内にNのスイッチ全てにアップリンクを有するか又は1つのセット内にスイッチのどれもアップリンクを有しないとすることができる。TORのこの書き込みで、TOR間のルート決定のためにOSPF及び/又はECMPのようなプロトコルが用いられるときでさえ、サーバの入/出制限の影響下にある任意のトラフィックのための帯域幅保証が保持し続けることを示すことができる。
TOR間のルート決定のためのOSPF又はECMPの使用は、集合スイッチの同一のセット内における2つのTOR間のパケットのようないくつかのパケットが、中間スイッチを介して進行しないパスを利用するようにさせることができる。よって、ソースと送り先との間の最も短いパスに従い、同一の集合スイッチ又は複数の集合スイッチに接続された同一のTOR下、又は複数のTOR下のサーバ間のトラフィックの早期のターンアラウンドを可能にするようにそれらのパスを「アーリターンアラウンドパス(early turnaround paths)」と称することができる。それらのトラフィックフローはコア集合/中間ネットワークのいずれにも入ることを必要としない。
アーリターンアラウンドパスを用いることの潜在的な利益は、トラフィック(例えば、外部)の他のクラスのためのコアにおける能力を制限から解くことを含むことである。自由にされた能力は、存在するアプリケーションがクロス(cross)、例えば、TORトラフィックを最小化するために書き込まれているとき、ほぼ「平均」の場合にあることができる。他の方法を見ると、これはコアが何らかの要因に基づいて設定されることを可能にし、サーバ間のトラフィックのために旨く動作することができる。また、アーリターンアラウンドパスの使用は装置の広範囲が中間スイッチとして使用されることを可能にし、それらのスイッチについて結果的に低コストにすることができる。
(輻輳状態に対する対処)
ECMP及びVLBの両方を用いて、大きなフローが同一のリンク及び中間スイッチ各々にハッシュされる機会があっても良く、それは輻輳状態を生じさせるかもしれない。もし、これが起きるならば、送信アジャイルエージェントは、ECMPがネクストホップ、すなわちパケットが通るべき次のスイッチを選択するために使用するフィールドの値を変更することによって、そのフローがアジャイルネットワークを介して利用するパスを変更することができる。この点において、アジャイルエージェントは、周期的に大きなフローをリハッシュする、又は激しい輻輳イベント(例えば、フルウインドウ損失)又はECNがTCPによって検出されたとき、又は閾値のバイト/パケット数を送信/受信した後のような状況を簡単な機構で検出して処理することができる。
(ホスト情報の維持)
上記したアジリティネットワークアーキテクチャに応じて実施されるネットワークシステムは、データセンタ負荷のために設計されたスケーラブル(拡張可能な)、信頼がある、及び/又は高性能なストア又はディレクトリシステムを使用することができる。アジリティネットワークアーキテクチャに応じて実施されるネットワークは、一様な高能力、パフォーマンス分離、レイヤ2のセマンティック、及びサービス間の通信分離、それらの4つのプロパティの1以上を所有することができる。また、そのネットワークは正常な劣化を示すことができ、ここで、そのネットワークは故障後にどんな能力が残っていても使用することを継続することができる。よって、そのネットワークは故障にあっても信頼性/回復力がある。この点について、そのようなネットワークのディレクトリシステムは2つの潜在的なキー機能、(1)AA対LAマッピングのためのルックアップ及び更新、及び(2)例えば、ライブ仮想マシンマイグレーション等の待ち時間検出動作をサポートすることができる反応型キャッシュ更新機構を提供することができる。
(要求の特徴付け)
ディレクトリシステムのためのルックアップ負荷は頻繁で集中的である。サーバは、AA対LAマッピングのためのルックアップを生成する各フローで短時間の期間に何千又は何万の他のサーバまでと通信することができる。更新のために、負荷を故障及びサーバスタートアップイベントによって駆動することができる。多くの故障は一般に、サイズ的には小さく、大きな相関性がある故障はおそらくまれである。
(パフォーマンス要求)
負荷のバースト性特質は、多くの接続を素早く確立するようにルックアップが高い処理能力及び低応答時間を要求しても良いことを暗示する。ルックアップは初めてサーバと通信するために要求された時間を増加させるので、その応答時間はできだけ小さく保持されるべきである。例えば、1/100秒が妥当な値である。しかしながら、更新のために、潜在的なキー要求は信頼性であって良く、応答時間はあまり気に掛けなくても良い。更に、更新は通常、前もって予定されるので、高い処理能力はバッチ処理の更新によって達成されても良い。
(一貫性の考慮)
従来のレイヤ2のネットワークにおいて、ARPはARP中断のために最終的一貫性を提供することができる。加えて、ホストは余計なARPを発することによってその到着を伝えることができる。極端な例として、上記したアジリティネットワークアーキテクチャに応じて実施されたネットワークにおけるライブ仮想マシン(VM)マイグレーションを考慮する。VMマイグレーションはステイルマッピング(AA対LA)の高速更新を利用することができる。VMマイグレーションの潜在的な目的は、ロケーション変更を越えて進行している通信を保持することであることができる。それらの考慮は、信頼性ある更新機構を提供することができる限り、AA対LAマッピングの弱い又は最終的な一貫性が受け入れ可能であることを暗示している。
(アジャイルディレクトリシステム又はサービス設計)
パフォーマンスパラメータ及びルックアップの負荷パターンは、更新の各々から異なっていても良い。よって、図6に示された2層になったアジャイルディレクトリサービスアーキテクチャ600を考慮する。この場合において、アジャイルディレクトリサービスアーキテクチャ600は、アジャイルエージェント602(1)〜602(N)、ディレクトリサービスモジュール604(1)〜604(N)、及びRSM(Replicated State Machine:複製ステートマシン)サーバ606(1)〜606(N)を含んでいる。特に、この例では、個々のディレクトリサービスモジュールは専用のコンピュータ608(1)〜608(N)各々上で実施される。他の実施例では、ディレクトリサービスモジュールは、他のシステム機能を実行するコンピュータ上で明白になっても良い。この実施例では、ディレクトリサービスモジュールの数は一般に全体のシステムサイズと比較して少ない。例えば、1つの実施例は100Kサーバ(すなわち、図3のサーバ316(1)〜316(N))に対してほぼ50〜100のディレクトリサービスモジュールを用いることができる。この範囲は説明の目的で与えられ、重要ではない。
ディレクトリサービスモジュール604(1)〜604(N)は、AA対LAマッピングをキャッシュすることができる読み取り最適化された、複製ディレクトリサービスとして考慮され得る。そのディレクトリサービスモジュール604(1)〜604(N)はアジャイルエージェント602(1)〜602(N)、及び少量(例えば、ほぼ5〜10サーバ)の読み取り最適化された、RSMサーバ606(1)〜606(N)と通信することができる。RSMサーバ606(1)〜606(N)はAA対LAマッピングの強力な一貫して信頼性あるストア(保存部)を提供することができる。
ディレクトリサービスモジュール604(1)〜604(N)は少ない待ち時間、高い処理能力、及び高ルックアップレートのための高い利用可能性を確かにすることができる。一方、RSMサーバ606(1)〜606(N)は、少なくともいくつかの実施形態において、更新の少ないレートのために、Paxos合意アルゴリズム等を用いて強力な一貫性及び耐久性を確かにすることができる。
個々のディレクトリサービスモジュール604(1)〜604(N)はRSMサーバ606(1)〜606(N)で保存されたAA対LAマッピングをキャッシュすることができ、キャッシュした状態を用いてアジャイルエージェント602(1)〜602(N)からのルックアップに対して独立して応答することができる。強力な一貫性は必要条件でなくても良いので、ディレクトリサービスモジュールは定期的に(例えば、30秒毎)RSMサーバとそのローカルマッピングをゆっくりと同期させることができる。高利用可能性及び少ない待ち時間を同時に達成するために、アジャイルエージェント602(1)〜602(N)はランダムに選択されたディレクトリサービスモジュール604(1)〜604(N)の数k(例えば、2)に対してルックアップを送信することができる。多くの応答が受信されたならば、アジャイルエージェントは単に最も速い応答を選択してそれをそのキャッシュに保存する。
また、ディレクトリサービスモジュール604(1)〜604(N)は、ネットワーク設定(プロビジョニング)システムからの更新を処理することができる。一貫性及び耐久性のために、更新は1つのランダム選択のディレクトリサービスモジュールに送信されても良く、RSMサーバ606(1)〜606(N)にライトスルーされても良い。特に、更新について、ディレクトリサービスモジュールは先ず、RSMに更新を送ることができる。確実に、そのRSMは個々のRSMサーバに対してその更新を複製し、そして、ディレクトリサービスモジュールにアクナリッジメントをもって応答することができ、それはそのアクナリッジメントを元のクライアントに順に送り戻すことができる。
一貫性を拡張するための潜在的最適化として、ディレクトリサービスモジュール604(1)〜604(N)は、少数の他のディレクトリサービスモジュールにアクナリッジメントを行った更新を任意に広めることができる。元のクライアントは中断(例えば2秒)内にアクナリッジメントを受信しなかったならば、そのクライアントは同一の更新を他のディレクトリサービスモジュールに送信して、信頼性及び/又は利用可能性と引き換えに応答時間を提供することができる。
また、ディレクトリサービスの他の実施形態は可能である。例えば、DHT(Distributed Hash Table)がディレクトリサーバと、DHTにエントリーとして保存されたAA/LAマッピングとを用いて構成されても良い。また、パフォーマンスが前述した実施形態と同然でないか、又は強力な一貫性がなくて良いけれども、アクティブディレクトリ(Active Directory)又はライトウエイトディレクトリシステム(Lightweight Directory System)等の他の存在するディレクトリシステムを用いても良い。
(最終的一貫性の確保)
AA対LAマッピングはディレクトリサービスモジュール及びアジャイルエージェントのキャッシュでキャッシュされ得るので、アップデートは一貫性がないことに導く可能性がある。サーバ及びネットワークを浪費することなく一貫性がないことを解決するために、同時にスケラビリティ(拡張性)及びパフォーマンスの両方を確実にするために反応型キャッシュ更新機構を用いることができる。キャッシュ更新プロトコルはキー観察を利用することができる。ステイルホストマッピングは、そのマッピングがトラフィックを配信するために用いられるときだけに、修正される必要がある。特に、ステイルマッピングが用いられるとき、いくつかのパケットはステイルLA(送り先サーバをもはや管理しないTOR又はサーバ)に到着することができる。そのTOR又はサーバはそのような配信不可能なパケットをディレクトリサービスモジュールに送り、例えば、ユニキャストを介して、ソースサーバのキャッシュにおいてステイルマッピングを選択的に修正するようにディレクトリサービスモジュールを動作させることができる。更新の他の実施形態において、ディレクトリサービスは影響を受けたサーバと通信するために許可されている全てのサーバグループに対する更新をマルチキャストによって行っても良い。
(更なる実施例)
(ロードバランシングの最適性)
上記したように、VLBのようなロードバランシング技術は不安定さに対処するためにランダム化を用いることができ、トラフィックパターン(最良の場合及び最悪の場合の両方を含む)を平均の場合に変えることによって最良の場合のトラフィックパターンのいくつかのパフォーマンスを潜在的に犠牲にする。このパフォーマンス損失は、より最適なトラフィックエンジニアリングシステム下にあるよりも高いいくつかのリンクの利用としてそれ自身を明らかにすることができる。しかしながら、活性状態にあるデータセンタ負荷についての評価は、更に複雑なトラフィックエンジニアリングスキームと比較したとき比較的小さい能力損失と関連づけられ得る、VLBのようなロードバランシング技術の簡潔さ及び普遍性を示している。
(レイアウト設定)
図7〜図9は説明したアジャイルネットワークアーキテクチャに応じて実施されるデータセンタネットワークの3つの可能なレイアウト設定を示している。図7〜図9において、図面ページ上の空間制限のためにTORは関連したサーバなしに示されている。
図7はオープンフロアプランデータセンタレイアウト700を示している。データセンタレイアウト700はTOR702(1)〜702(N)、集合スイッチ704(1)〜704(N)、及び中間スイッチ706(1)〜706(N)を含んでいる。図7において、TOR702(1)〜702(N)は、センタ「ネットワークケージ」708を取り囲むとして示され、(例えば、銅及び/又はファイバケーブル等を用いて)接続されても良い。集合スイッチ704(1)〜704(N)及び中間スイッチ706(1)〜706(N)各々はネットワークケージ708内側でごく接近してレイアウトされても良く、それらの中間接続のために銅ケーブルの使用を可能にする(銅ケーブルは低コストで極太であり、ファイバに対して低距離範囲用である)。ネットワークケージ708内側のケーブルの数を(例えば、約4分の1)、例えば、QSFP(Quad Small Form Pluggable)規格のような適切な規格を用いて1つのケーブルに10Gリンクの数(例えば、4)と一緒に構築することによってそれらのコスト(例えば、約2分の1)と共に減らすことができる。
オープンフロアプランデータセンタレイアウト700において、中間スイッチ706(1)〜706(N)は、ネットワークケージ708内の中央に配置され、集合スイッチ704(1)〜704(N)は、中間スイッチ706(1)〜706(N)とTORスイッチ702(1)〜702(N)(及び関連したサーバ)との間に介在されている。
オープンフロアプランデータセンタレイアウト700は望んだように拡張可能である。例えば、追加のサーバラックは、サーバラックを作り出すためにTOR702(1)〜702(N)を有するサーバの形で計算装置を関係付けることによって加えられても良い。そして、サーバラックはネットワークゲージ708の集合スイッチ704(1)〜704(N)に接続されても良い。他のサーバラック及び/個々のサーバはオープンフロアプランデータセンタレイアウトによって提供されたサービスを妨げることなく削除されても良い。
図8はモジュラー化されたコンテナベースのレイアウト800を示している。レイアウト800はTOR802(1)〜802(N)、集合スイッチ804(1)〜804(N)、及び中間スイッチ806(1)〜806(N)を含んでいる。この場合において、中間スイッチ806(1)〜806(N)はそのレイアウトのデータセンタインフラ808に含まれる。集合スイッチ及びTORスイッチはそのデータセンタインフラに接続されているプラグ着脱可能なコンテナとして関連付けられても良い。例えば、集合スイッチ804(1)及び804(2)は、データセンタインフラ808に接続され得るプラグ着脱可能なコンテナ810(1)内でTOR802(1)及び802(2)と関連付けられても良い。同様に、集合スイッチ804(3)及び804(4)は、プラグ着脱可能なコンテナ810(2)内でTOR802(3)及び802(4)と関連付けられ、集合スイッチ804(5)及び804(N)は、プラグ着脱可能なコンテナ810(N)内でTOR802(5)及び802(N)と関連付けられる。
図7のように、図8において、サーバラックを作り出すためにTORと関連付けられているサーバは、図面ページの空間制限のために示されていない。更に、空間制限のために、2つの集合スイッチ及び2つの中間スイッチだけがプラグ着脱可能なコンテナ毎に示されている。勿論、他の実施例はそれらのコンポーネントのいずれか又は両方より多い又は少ないコンポーネントを用いることができる。また、他の実施例は本明細書に示された3より多い又は少ないプラグ着脱可能なコンテナを用いることができる。興味ある1つの特徴は、レイアウト800が1のケーブルの束を各プラグ着脱可能なコンテナ810(1)〜810(N)からデータセンタスパイン(すなわちデータセンタインフラ808)にもたらすためにそれ自身を貸すことができることである。要約すると、データセンタインフラ808はレイアウト800が個々のプラグ着脱可能なコンテナ810(1)〜810(N)加えるか、又は除去することによってサイズとして拡張又は縮小することを可能にする。
図9は「インフラ減少」及び「コンテナ化」データセンタレイアウト900を示している。レイアウトは多くのコンテナ908(1)〜908(N)に配置されたTOR902(1)〜902(N)、集合スイッチ904(1)〜904(N)、及び中間スイッチ906(1)〜906(N)を含んでいる。例えば、TOR902(1)〜902(2)、集合スイッチ904(1)〜904(2)、及び中間スイッチ906(1)はコンテナ908(1)に配置されている。
コンテナ908(1)〜908(N)は「インフラ減少」及び「コンテナ化」データセンタレイアウト900の実現を可能にする。このレイアウト900はコンテナ908(1)及び908(3)の個々のペア間でケーブル束910(1)を繋ぐことと関連付けられても良い。他のケーブル束910(2)はコンテナ908(2)及び908(N)の個々のペア間で繋ぐことができる。個々のケーブル束910(1),910(2)は、コンテナ908(1)内の集合スイッチ904(1),904(2)をコンテナ908(3)内の中間スイッチ906(3)と接続するリンク、また逆の場合も同じリンクを担うことができる。
要約すると、個々のコンテナ908(1)〜908(N)は複数のスイッチを含むことができる。それらのスイッチは、相補型プラグ着脱可能なコンテナに配置されているTOR902(1)〜902(N)、集合スイッチ904(1)〜904(N)、及び中間スイッチ906(1)〜906(N)を含むことができる。相補型プラグ着脱可能なコンテナのペアは、第1のプラグ着脱可能なコンテナの集合スイッチを第2のプラグ着脱可能なコンテナの中間スイッチに接続することによって、また逆の場合もケーブル束を介して同じによって結合されても良い。例えば、コンテナ908(1)はケーブル束910(1)を介してコンテナ908(3)に接続されても良い。特に、ケーブル束は、コンテナ908(1)の集合スイッチ904(1)及び904(2)をコンテナ908(3)の中間スイッチ906(3)と接続することができる。同様に、束910(1)はコンテナ908(3)の集合スイッチ904(5)及び904(6)をコンテナ908(1)の中間スイッチ906(1)と接続することができる。
少なくともいくつかの実施形態において、アジャイルネットワークアーキテクチャは次のコンポーネント(1)〜(5)から構成することができる。(1)トポロジに一緒に接続されたスイッチのセット、(2)スイッチの1以上に各々接続されたサーバのセット、(3)サーバがパケットを他のサーバに送信することを望んだときリクエストが作られ、サーバ(又はサーバの代理アジャイルエージェント)がスイッチのトポロジを越えることができるように送信することを望むパケットを加えるか、又はカプセル化することにおいて使用する情報で応答するディレクトリシステム、(4)パケットがスイッチによって引っ込められてリンクに送られるほどいずれかのリンク上での利用の増大を減少又は防止するネットワークにおいて輻輳状態を制御する機構、(5)ディレクトリサービスと通信し、必要に応じてパケットをカプセル化し、アドレス指定し、又はデカプセル化し、そして、必要に応じて輻輳制御に加わるサーバ上のモジュール。
少なくとも1つの実施形態において、機能(1)〜(5)を提供する各サーバについてアジャイルエージェントが存在することができる。(1)パケットを送り先に送り、システム内のこのサーバに登録する等のために利用されるカプセル化情報を取り出すためにアジャイルディレクトリサービスと通信する、(2)必要に応じて代替手段のセットの中から(例えば、中間スイッチの中から)ランダム選択を行い、それらの選択をキャッシュする、(3)パケットをカプセル化/デカプセル化する、(4)ネットワークから輻輳表示を検出して応答する。よって、少なくともいくつかの実施形態において、それらの機能はネットワーク内の複数のサーバと複数のスイッチとの間で分散されても良い。例えば、デフォルトのルート決定はパケットを(中間スイッチ等の)スイッチのセット、及びパケットが横断する中間スイッチ上のパケット毎に実施された上記のリストの機能を管理するために用いられても良い。
少なくともいくつかの実施形態において、本明細書で説明されたアジャイルネットワークアーキテクチャを実施することは、ネットワーク内の各スイッチがネットワーク内の他のスイッチにパケットを送信することができるように、データセンタ内でスイッチのセットの中からネットワークを作り出すことを含むことできる。他のサーバと通信するためにサーバによって用いられたアドレスと同じ種類のアドレスをそれらのスイッチ又はそのネットワークがそれら自身の中からパケットを管理するために使用することが必要でない。例えば、MACアドレス、IPv4アドレス、及び/又はIPv6アドレスは全て適切であれば良い。
アジャイルネットワークの少なくとも1つの実施形態において、データセンタ内のスイッチのセットの中における1つの考慮は、それらの各々をIPアドレス、IPv4又はIPv6のいずれかを用いて設定されること、及びそれらを1以上の標準レイヤ3ルーティングプロトコルを動作させるために一般的な例OSPF(Open−Shortest Path First)、IS−IS(Intermediate System−Intermediate System)又はBGP(Border Gateway Protocol)を用いて設定することである。そのような実施形態の利益は、ディレクトリシステムがトポロジに対して反応してサーバに大部分の変更を知らせる必要がないように、スイッチ間でパケットを送るためにネットワークの能力を維持するそのルーティングプロトコルによって作り出されるネットワークの制御プレーンを用いて、ネットワークとディレクトリシステムとの間の接続が減少されることである。
代替的又は追加的に、ディレクトリシステムはネットワークのトポロジを監視し(例えば、スイッチ及びリンクの調子(ヘルス)を監視すること)、トポロジが変更するとサーバに提供するカプセル化情報を変更することができる。また、ディレクトリシステムは、前に応答を送信したサーバにそれらの応答がもはや有効でないことを通知しても良い。その代替に亘って第1の実施形態の潜在的な利点は、ディレクトリシステムがトポロジに対して反応してサーバに大部分の変更を知らせる必要がないように、スイッチ間でパケットを送るためにネットワークの能力を維持するそのルーティングプロトコルによって作り出されるネットワークの制御プレーンを用いて、ネットワークとディレクトリシステムとの間の接続が減少されることである。要約すれば、ネットワークパフォーマンスに関係した1以上のパラメータを監視することによってパケット配信遅延を減少又は避けることができる。そのパラメータは、特定のパスに亘る通信障害等のネットワークイベントを表しても良い。
1つの実施形態において、ネットワークの複数のスイッチは、LAアドレスのサブネットから引き出されたIPv4のアドレスを用いて設定される。そのスイッチはOSPFルーティングプロトコルを動作させるように設定される。そのスイッチのアドレスはOSPFプロトコルによってスイッチの中で割り振られる。番号が付けられてないOSPFのインターフェース拡張はOSPFプロトコルによって分配される情報量を減らすために用いられても良い。各トップオブラック(TOR)スイッチのサーバ向き部分はVLAN(Virtual Local Area Network)の一部であるようにそのスイッチ上で設定される。AA空間を含むサブネットはサーバ向きのVLANに割り当てられたようにスイッチに設定される。このVLANのアドレスはOSPFには分配されず、VLANは通常、トランキングされない。サーバへ行くパケットはそのサーバが接続されたTORに対してカプセル化される。このTORはそれらカプセル化パケットを受信するとそのパケットをデカプセル化し、そして、サーバの送り先アドレスに基づいてサーバ向きのVLANにそれらを送る。そのためそのサーバは通常のLANのように、パケットを受信する。
他の実施形態においては、TORスイッチのサーバ向きのVLANにAAサブネットを設定する代わりに、各TORに特有のLAサブネットはそのサーバ向きのVLANに割り当てられる。このLAサブネットはOSPFによって分配される。TORに接続されたサーバは少なくとも2つのアドレスを用いて設定される。LAサブネットから引き出されるLAアドレスはサーバ向きのVLANに割り当てられ、それはVLANの一部とAAアドレスである。サーバ行きのパケットはサーバ上に設定されているLAに対してカプセル化される。サーバ上のモジュールはカプセル化パケットを受信するとデカプセル化して、パケットに含まれたAAアドレスに基づいた送り先であるサーバ上の仮想マシン又は処理にローカル的に配信することができる。
他の実施形態において、TORスイッチはレイヤ2のスイッチとして動作しても良く、一方、集合レイヤスイッチはレイヤ3のスイッチとして動作しても良い。この設計は、潜在的に安価なレイヤ2スイッチがTORスイッチとして使用されることを可能にしても良く(多くのTORスイッチが存在する)、一方、レイヤ3の機能は比較的少ない数の集合レイヤスイッチで実施されても良い。この設計において、デカプセル化機能はレイヤ2のスイッチ、レイヤ3のスイッチ、送り先サーバ、又は送り先仮想マシンで実行されても良い。
いくつかの実施形態において、追加のアドレスはスイッチ上に設定、又はOSPFのようなルーティングプロトコルを介して分配されても良い。それらのアドレスは通常、トポロジ的に重要である(すなわち、LA)。アドレスは通常、パケットをインフラサービス−すなわちサーバ、スイッチ、又は追加のサービスとして知られていることを提供するネットワーク装置に送るために用いられる。そのようなサービスの例はロードバランサ(それらはF5からのBigIPのようなハードウエアベース又はソフトウエアベースのロードバランサであって良い)、S−NAT(Source Network Address Translators)、ディレクトリシステムの一部であるサーバ、DHCPサービスを提供するサーバ、又は(インターネット又は他のデータセンタ等の)他のネットワークへのゲートウエイを含む。
1つの実施形態において、各スイッチはBGPプロトコルを用いてルートリフレクタクライアントとして設定されても良い。追加のアドレスはそのルートリフレクタ上でそれらを設定し、BGPがそれらをスイッチに分配することを許可にすることによってスイッチへ分配される。この実施形態は、追加のアドレスを加える又は除去することがそのスイッチのルーティングプロセッサを過負荷にするOSPF再計算をさせないという利益を有する。
他の実施形態において、ネットワーク内の輻輳状態を制御する機構は複数のサーバそれら自身上で実施される。適切な機構はTCP(Transport Control Protocol)のようなものであり、ここで送り先にサーバによって送られるトラフィックは、ネットワークが担うことができるらしいレートにサーバによって制限される。TCPのようなプロトコルの使用の改善は次に説明される。代替的な実施形態においては、スイッチ上のQoS(Quality of Service)機構が輻輳状態制御のために用いられても良い。そのような機構の例はWFQ(Weighted Fair Queuing)及びその派生物、RED(Random Early Detection)、RSVP、XCP(eXplicit Control Protocol)、及びRCP(Rate Control Protocol)を含む。
少なくとも1つの実施形態において、サーバ上のモジュールはアジャイルネットワークから受信されているパケットを観察し、受信したパケットから得た又は推測した情報に基づいてパケットの送信又はパケットのカプセル化を変更する。アジャイルエージェントは(1)パケットが送信されるレートを減らすためにパケットの送信を変更する、又は(2)ネットワークを通して異なるパスを利用するようにパケットのカプセル化を変更する、ことによってネットワークにおける輻輳状態を減らすことができ、それは、パケットのカプセル化及びアドレス指定を先ず選択するとき作った可能な選択肢の中からのランダム選択のいずれか又は全てを作り変えることによって達成されても良い。
アジャイルエージェントがすることができる観察及びその反応の例は、次の(1)〜(5)を含む。(1)アジャイルエージェントはTCPパケットのフルウインドウの損失を検出するならば、パケットがネットワークを通して利用するパスを再ランダム化する。これは、特に、パケットによって利用されたパスの変更が並べ直されたパケットを送り先によって受信されることが起きないようにフローを前に送られた全てのパケットがネットワークから抜け出たと思われると同時に異なる(望ましくは輻輳してない)パスにフローを置くようにすると都合が良い。(2)アジャイルエージェントはパケットによって利用されるパスを周期的に再ランダム化することができる。(3)アジャイルエージェントは1つのフローによって達成されている実効レートを計算し、そのレートが期待閾値より低いならば再ランダム化することができる。(4)アジャイルエージェントはECN(Explicit Congestion Notification)マークの受信パケットを監視してそのレートを減らすか又はその送り先へのパケットのパスを再ランダム化することができる。(5)スイッチは輻輳状態に入った又は入ろうとしているリンクを検出するようにロジックを実行し(例えば、IEEE QCN及び802.1auにおけるように)、通知を上流スイッチ及び/又はサーバに送ることができる。それらの指示を受信するアジャイルエージェントはそれらのパケットのレートを減らすか又はパケットのパスを再ランダム化することができる。
説明した複数の実施形態の1つの有利な点は、VM(仮想マシン)が1つのサーバから他のサーバへ再配置されても良く、一方、同一のIPアドレスの使用を保持しても良いので、それらが仮想マシン(VM)のライブマイグレーションを可能にすることである。ディレクトリシステムは、移動の間に再配置されるサーバのVMのIPアドレスに向かうパケットを管理するために単に更新されても良い。ロケーションにおける物理的な変更は行われている通信を妨げる必要はない。
少なくとも1つの実施形態において、ネットワークの能力の一部は、好ましいサービスが多数又は少数のパス、又はサービスの他のセットによって使用されるパスから分離されたパスのセットに広がったそれらのパケットを有するように、分割割合の一様な計算によってネットワークに亘って動作するサービスのセットに予約され又は優先的に割り当てられても良い。プリファレンス又はQoSの多数のクラスはこの同じ技術を用いて作り出されても良い。
図10は、本コンセプトの少なくともいくつかの実施例と一致するアジャイルネットワーキング技術又は方法1000のフローチャートを示している。方法1000が説明される順番は、限定として構成されるつもりではなく、その方法又は代替方法を実施するために様々な説明のブロックを組み合わせても良い。更に、方法は、計算装置がその方法を実施することができるように、適切なハードウエア、ソフトウエア、ファームウエア、又はそれらの組み合わせで実施されても良い。1つの場合において、その方法は、計算装置のプロセッサによる実行が計算装置にその方法を行わせるように、命令のセットとしてコンピュータ可読記憶媒体に保存される。他の場合において、その方法はASICによる実行のためにASICのコンピュータ可読記憶媒体に保存される。
1002では、その方法はパケットを送り先に送るために利用されるカプセル化情報を得る。
1004では、その方法は複数のスイッチ等の利用可能なハードウエアを通してパスを選択する。
1006では、その方法はパスを介した配信のためにパケットをカプセル化する。
1008では、その方法は輻輳状態の表示に対して監視する。例えば、その方法はネットワークパフォーマンスに関係したパラメータを監視することができる。例えば、TCPは、パケット伝送レートに関係した更新、及び/又は輻輳状態に関係するネットワークパラメータとして動作可能なネットワークコンポーネント上の負荷を提供することができる。その方法は輻輳状態が検出されたときパスを再選択するか又は他の動作をとることができる。
100 アジャイルネットワークアーキテクチャ
102 サーバ
104 アプリケーションアドレス
106 インフラ
108 ネットワーク
202 クライアント
204 インターネット
308 ルータ
310 スイッチ
322 ディレクトリサービスモジュール
410 ユーザモードエージェント
420 ルーティング情報キャッシュ

Claims (10)

  1. 第1のマシンと第2のマシンとをレイヤ3のインフラストラクチャ上で接続する仮想レイヤ2のネットワークを提供する方法であって、アプリケーションアドレスを前記第1のマシンおよび前記第2のマシンに割り当て、かつ、ロケーションアドレスを前記レイヤ3のインフラストラクチャのコンポーネントに割り当てることにより提供するものであり、
    前記提供することは、
    前記第1のマシンと関連付けられたアジャイルエージェントにおいて、前記第2のマシンと関連付けられた送り先サーバの割り当てられたアプリケーションアドレスを伴う仮想レイヤ2のパケットを受け取るステップと;
    前記アジャイルエージェントによって、前記送り先サーバがサービスのために定義されたサーバのグループの中に在るか否かを判断するステップであり、前記定義されたサーバのグループはディレクトリサービスの中に保管されているステップ、と;を含み、
    前記送り先サーバが前記定義されたサーバのグループの中に在る場合には:
    前記アジャイルエージェントによって、前記レイヤ2のパケットをレイヤ3のパケットにカプセル化する段階であり、前記レイヤ3のパケットは、前記レイヤ3のインフラストラクチャのスイッチの個々のロケーションアドレスが割り当てられる段階と、
    前記レイヤ3のパケットを前記レイヤ3のインフラストラクチャの前記スイッチに送信する段階であり、前記スイッチは、前記カプセル化された仮想レイヤ2のパケットをデカプセル化し、かつ、前記デカプセル化された仮想レイヤ2のパケットを物理的ネットワーク接続上で前記第2のマシンに送信するように構成されている段階と、を含み、
    前記送り先サーバが前記定義されたサーバのグループの中に無い場合には、前記個々のロケーションアドレスの提供を拒否する段階と、を含む、
    ことを特徴とする方法。
  2. 個々のマシン間でターンアラウンドパスを早期に使用するステップ、を更に備える、
    ことを特徴とする請求項1記載の方法。
  3. 前記アジャイルエージェントは、前記第1のマシンと関連付けられたレイヤ2のインフラストラクチャに配置されたハードウェアと前記第1のマシンと関連付けられた前記レイヤ2のインフラストラクチャにおいて実行されるソフトウェアとの組合せを含む、
    ことを特徴とする請求項1記載の方法。
  4. 前記仮想レイヤ2のネットワークを提供することは、複数の仮想レイヤ2のネットワークを提供することを備える、
    ことを特徴とする請求項1に記載の方法。
  5. 前記アジャイルエージェントは、前記第1のマシンと関連付けられたソースサーバ上に配置され、または、前記第1のマシンと関連付けられたトップオブラック(ToR)スイッチ上に配置されおり、
    前記トップオブラックスイッチは、前記スイッチとは異なる、
    ことを特徴とする請求項1に記載の方法。
  6. 前記第1のマシンと前記第2のマシンとの間の前記レイヤ3のインフラストラクチャの個々のパスをランダムに選択するステップ、を更に備える、
    ことを特徴とする請求項1に記載の方法。
  7. 前記個々のパスを選択するためにバリアントロードバランシング(VLB)を利用するステップを更に備える、
    ことを特徴とする請求項6に記載の方法。
  8. 少なくとも一つのネットワークパフォーマンスのパラメータを、前記アジャイルエージェントによって、監視するステップと、
    前記少なくとも一つのネットワークパフォーマンスのパラメータに基づいて、前記個々のパスを再選択するステップ、を更に備える、
    ことを特徴とする請求項6に記載の方法。
  9. システムであって、
    複数のスイッチを含む物理的なネットワーク接続を介して通信可能に接続された複数の計算装置であり、
    一つの個々の計算装置がソース計算装置として動作し、かつ、別の個々の計算装置が送り先計算装置として動作するように構成することができ、前記ソース計算装置はパケットを前記送り先計算装置のアプリケーションアドレスに送信するように構成されている、
    複数の計算装置と、
    前記ソース計算装置と関連付けられたアジャイルエージェントであり、
    前記パケットをインターセプトし、かつ、前記送り先計算装置がアジャイルディレクトリサービスによって定義されるように、前記ソース計算装置の通信グループの中に在るか否かを判断し、
    前記送り先計算装置が前記アジャイルディレクトリサービスによって定義される前記ソース計算装置の通信グループの中に在る場合に、
    前記複数のスイッチのうち個々のスイッチのロケーションアドレスを特定し、前記個々のスイッチは前記送り先計算装置と関連付けられ、
    前記複数のスイッチのうちから前記パケットを前記ロケーションアドレスへ送信する異なる個々のスイッチを選択し、
    前記パケットをカプセル化し、かつ、
    前記カプセル化されたパケットを送信し、
    前記個々のスイッチは、前記カプセル化されたパケットを受信すると、前記パケットをデカプセル化し、かつ、物理的ネットワーク接続上で前記デカプセル化されたパケットを前記送り先計算装置の前記アプリケーションアドレスに送信するように構成されており、
    前記送り先計算装置が前記通信グループの中に無い場合に、
    前記ロケーションアドレスを提供することを拒否する、
    ように構成されているアジャイルエージェントと、
    を含む、ことを特徴とするシステム。
  10. サーバであって、
    マシンで読取り可能なインストラクションを実行するための少なくとも一つのプロセッサと、
    前記少なくとも一つのプロセッサによって実行可能なアジャイルエージェントであり、
    アプリケーションアドレスをもつ別のサーバへ伝送するためにパケットを受信し、
    前記サーバに係る定義されたサーバのグループが、アジャイルディレクトリサービスによって定義されるように別のサーバを含むか否かを判断し、
    前記定義されたサーバのグループが前記別のサーバを含む場合に、
    中間スイッチを介して物理的ネットワーク接続上で伝送するために前記パケットをカプセル化し、
    前記カプセル化されたパケットには、前記別のサーバと関連付けられたスイッチに対するロケーションアドレスが割り当てられ、かつ、
    前記カプセル化されたパケットを受信すると、前記別のサーバと関連付けられた前記スイッチは、前記パケットをデカプセル化し、かつ、物理的ネットワーク接続上で前記デカプセル化されたパケットを前記アプリケーションアドレスをもつ前記別のサーバに送信するように構成されており、
    前記定義されたサーバのグループが前記別のサーバを含まない場合に、
    前記ロケーションアドレスを拒否する、
    ように構成されているアジャイルエージェントと、
    を含む、ことを特徴とするサーバ。
JP2015203787A 2009-05-28 2015-10-15 アジャイルデータセンタネットワークアーキテクチャ Active JP6129928B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US18206309P 2009-05-28 2009-05-28
US61/182,063 2009-05-28
US12/578,608 2009-10-14
US12/578,608 US9497039B2 (en) 2009-05-28 2009-10-14 Agile data center network architecture

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2012513344A Division JP2012528552A (ja) 2009-05-28 2010-05-28 アジャイルデータセンタネットワークアーキテクチャ

Publications (2)

Publication Number Publication Date
JP2016040925A JP2016040925A (ja) 2016-03-24
JP6129928B2 true JP6129928B2 (ja) 2017-05-17

Family

ID=43221536

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2012513344A Pending JP2012528552A (ja) 2009-05-28 2010-05-28 アジャイルデータセンタネットワークアーキテクチャ
JP2015203787A Active JP6129928B2 (ja) 2009-05-28 2015-10-15 アジャイルデータセンタネットワークアーキテクチャ

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2012513344A Pending JP2012528552A (ja) 2009-05-28 2010-05-28 アジャイルデータセンタネットワークアーキテクチャ

Country Status (3)

Country Link
US (1) US9497039B2 (ja)
JP (2) JP2012528552A (ja)
KR (1) KR101669700B1 (ja)

Families Citing this family (142)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8619771B2 (en) 2009-09-30 2013-12-31 Vmware, Inc. Private allocated networks over shared communications infrastructure
US8924524B2 (en) 2009-07-27 2014-12-30 Vmware, Inc. Automated network configuration of virtual machines in a virtual lab data environment
US8892706B1 (en) 2010-06-21 2014-11-18 Vmware, Inc. Private ethernet overlay networks over a shared ethernet in a virtual environment
US8195774B2 (en) 2008-05-23 2012-06-05 Vmware, Inc. Distributed virtual switch for virtualized computer systems
US8483096B2 (en) * 2008-07-22 2013-07-09 The Regents Of The University Of California Scalable commodity data center network architecture
US8798045B1 (en) 2008-12-29 2014-08-05 Juniper Networks, Inc. Control plane architecture for switch fabrics
EP2415221B1 (en) 2009-04-01 2014-05-07 Nicira, Inc. Method and apparatus for implementing and managing virtual switches
US8416692B2 (en) 2009-05-28 2013-04-09 Microsoft Corporation Load balancing across layer-2 domains
JP5540679B2 (ja) * 2009-12-10 2014-07-02 株式会社リコー ネットワーク機器、通信制御方法、及びプログラム
US8654659B2 (en) * 2009-12-23 2014-02-18 Citrix Systems, Inc. Systems and methods for listening policies for virtual servers of appliance
US9413649B2 (en) * 2010-03-12 2016-08-09 Force10 Networks, Inc. Virtual network device architecture
US8694654B1 (en) 2010-03-23 2014-04-08 Juniper Networks, Inc. Host side protocols for use with distributed control plane of a switch
US9813252B2 (en) * 2010-03-23 2017-11-07 Juniper Networks, Inc. Multicasting within a distributed control plane of a switch
US8903942B2 (en) * 2010-03-23 2014-12-02 Juniper Networks, Inc. Methods and apparatus for forwarding-state transport in a distributed control plane
JP5190084B2 (ja) * 2010-03-30 2013-04-24 株式会社日立製作所 仮想マシンのマイグレーション方法およびシステム
US9391716B2 (en) 2010-04-05 2016-07-12 Microsoft Technology Licensing, Llc Data center using wireless communication
US20120324068A1 (en) * 2011-06-17 2012-12-20 Microsoft Corporation Direct networking for multi-server units
US8495194B1 (en) * 2010-06-29 2013-07-23 Amazon Technologies, Inc. Connecting network deployment units
US8750164B2 (en) 2010-07-06 2014-06-10 Nicira, Inc. Hierarchical managed switch architecture
US9680750B2 (en) 2010-07-06 2017-06-13 Nicira, Inc. Use of tunnels to hide network addresses
CN102136917B (zh) * 2010-07-14 2013-04-17 华为技术有限公司 以太网组播的方法及装置
US8718063B2 (en) 2010-07-26 2014-05-06 Juniper Networks, Inc. Methods and apparatus related to route selection within a network
US8948024B2 (en) * 2010-07-30 2015-02-03 Verizon Patent And Licensing Inc. Network simulation rack and system
US8621111B2 (en) * 2010-09-22 2013-12-31 Amazon Technologies, Inc. Transpose box based network scaling
US8560660B2 (en) 2010-12-15 2013-10-15 Juniper Networks, Inc. Methods and apparatus for managing next hop identifiers in a distributed switch fabric system
US9282060B2 (en) 2010-12-15 2016-03-08 Juniper Networks, Inc. Methods and apparatus for dynamic resource management within a distributed control plane of a switch
US9391796B1 (en) 2010-12-22 2016-07-12 Juniper Networks, Inc. Methods and apparatus for using border gateway protocol (BGP) for converged fibre channel (FC) control plane
US9106527B1 (en) 2010-12-22 2015-08-11 Juniper Networks, Inc. Hierarchical resource groups for providing segregated management access to a distributed switch
ES2706416T3 (es) * 2011-01-13 2019-03-28 Nec Corp Sistema de red y método de enrutamiento
US8929377B2 (en) * 2011-03-15 2015-01-06 Futurewei Technologies, Inc. Systems and methods for automatic rack detection
US9363208B1 (en) 2011-03-29 2016-06-07 Amazon Technologies, Inc. Logical switches
US9106564B2 (en) * 2011-03-31 2015-08-11 Amazon Technologies, Inc. Incremental high radix network scaling
US8825900B1 (en) 2011-04-05 2014-09-02 Nicira, Inc. Method and apparatus for stateless transport layer tunneling
CN102859973B (zh) * 2011-04-19 2015-04-15 华为技术有限公司 一种地址解析的方法,装置和系统
US9008510B1 (en) 2011-05-12 2015-04-14 Google Inc. Implementation of a large-scale multi-stage non-blocking optical circuit switch
US8793351B2 (en) * 2011-05-24 2014-07-29 Facebook, Inc. Automated configuration of new racks and other computing assets in a data center
US8924541B2 (en) 2011-05-29 2014-12-30 International Business Machines Corporation Migration of virtual resources over remotely connected networks
US8843502B2 (en) 2011-06-24 2014-09-23 Microsoft Corporation Sorting a dataset of incrementally received data
CN103621048B (zh) 2011-07-11 2016-08-17 甲骨文国际公司 在中间件机器环境中利用多播组和分组处理代理中的至少一种来支持泛洪机制的系统与方法
US9332005B2 (en) 2011-07-11 2016-05-03 Oracle International Corporation System and method for providing switch based subnet management packet (SMP) traffic protection in a middleware machine environment
US9424144B2 (en) 2011-07-27 2016-08-23 Microsoft Technology Licensing, Llc Virtual machine migration to minimize packet loss in virtualized network
US9274825B2 (en) 2011-08-16 2016-03-01 Microsoft Technology Licensing, Llc Virtualization gateway between virtualized and non-virtualized networks
US9209998B2 (en) 2011-08-17 2015-12-08 Nicira, Inc. Packet processing in managed interconnection switching elements
US8958298B2 (en) 2011-08-17 2015-02-17 Nicira, Inc. Centralized logical L3 routing
IL214830A0 (en) * 2011-08-25 2012-02-29 Elta Systems Ltd Network environment separation
US10148550B1 (en) 2011-10-04 2018-12-04 Juniper Networks, Inc. Methods and apparatus for a scalable network with efficient link utilization
US9667485B2 (en) 2011-10-04 2017-05-30 Juniper Networks, Inc. Methods and apparatus for a self-organized layer-2 enterprise network architecture
US9118687B2 (en) 2011-10-04 2015-08-25 Juniper Networks, Inc. Methods and apparatus for a scalable network with efficient link utilization
US8804620B2 (en) 2011-10-04 2014-08-12 Juniper Networks, Inc. Methods and apparatus for enforcing a common user policy within a network
US9407457B2 (en) 2011-10-04 2016-08-02 Juniper Networks, Inc. Apparatuses for a wired/wireless network architecture
EP2748713B1 (en) 2011-11-15 2021-08-25 Nicira Inc. Load balancing and destination network address translation middleboxes
US8738756B2 (en) 2011-12-01 2014-05-27 International Business Machines Corporation Enabling co-existence of hosts or virtual machines with identical addresses
US9531644B2 (en) 2011-12-21 2016-12-27 Juniper Networks, Inc. Methods and apparatus for a distributed fibre channel control plane
US9270484B2 (en) * 2012-01-23 2016-02-23 Microsoft Technology Licensing, Llc Data center network using circuit switching
WO2013117166A1 (en) * 2012-02-08 2013-08-15 Hangzhou H3C Technologies Co., Ltd. Implement equal cost multiple path of trill network
US8862744B2 (en) * 2012-02-14 2014-10-14 Telefonaktiebolaget L M Ericsson (Publ) Optimizing traffic load in a communications network
US20130250802A1 (en) * 2012-03-26 2013-09-26 Praveen Yalagandula Reducing cabling costs in a datacenter network
US8949830B2 (en) 2012-03-29 2015-02-03 International Business Machines Corporation Emulating a data center network on a single physical host with support for virtual machine mobility
US20130326053A1 (en) * 2012-06-04 2013-12-05 Alcatel-Lucent Usa Inc. Method And Apparatus For Single Point Of Failure Elimination For Cloud-Based Applications
US9112787B2 (en) * 2012-06-21 2015-08-18 Cisco Technology, Inc. First hop load balancing
US9083642B2 (en) 2012-07-27 2015-07-14 Dell Products L.P. Systems and methods for optimizing layer three routing in an information handling system
US9210079B2 (en) 2012-08-14 2015-12-08 Vmware, Inc. Method and system for virtual and physical network integration
US8953618B2 (en) 2012-10-10 2015-02-10 Telefonaktiebolaget L M Ericsson (Publ) IP multicast service leave process for MPLS-based virtual private cloud networking
US8831000B2 (en) * 2012-10-10 2014-09-09 Telefonaktiebolaget L M Ericsson (Publ) IP multicast service join process for MPLS-based virtual private cloud networking
US9225624B2 (en) * 2012-12-20 2015-12-29 Dell Products L.P. Systems and methods for topology discovery and application in a border gateway protocol based data center
US8996932B2 (en) 2013-01-09 2015-03-31 Microsoft Technology Licensing, Llc Cloud management using a component health model
US9350558B2 (en) * 2013-01-09 2016-05-24 Dell Products L.P. Systems and methods for providing multicast routing in an overlay network
US8982707B2 (en) * 2013-03-14 2015-03-17 Cisco Technology, Inc. Interoperability of data plane based overlays and control plane based overlays in a network environment
US9219692B2 (en) 2013-04-24 2015-12-22 International Business Machines Corporation Reducing latencies through packet aggregation
KR101480867B1 (ko) * 2013-05-31 2015-01-09 삼성에스디에스 주식회사 맵리듀스 연산 가속 시스템 및 방법
IN2013MU01980A (ja) * 2013-06-10 2015-05-29 Indian Inst Technology Bombay
US9467366B2 (en) * 2013-07-03 2016-10-11 Avaya Inc. Method and apparatus providing single-tier routing in a shortest path bridging (SPB) network
US9571386B2 (en) 2013-07-08 2017-02-14 Nicira, Inc. Hybrid packet processing
US9282019B2 (en) 2013-07-12 2016-03-08 Nicira, Inc. Tracing logical network packets through physical network
US9407580B2 (en) 2013-07-12 2016-08-02 Nicira, Inc. Maintaining data stored with a packet
US9344349B2 (en) 2013-07-12 2016-05-17 Nicira, Inc. Tracing network packets by a cluster of network controllers
US9674087B2 (en) 2013-09-15 2017-06-06 Nicira, Inc. Performing a multi-stage lookup to classify packets
US9602398B2 (en) 2013-09-15 2017-03-21 Nicira, Inc. Dynamically generating flows with wildcard fields
US9960878B2 (en) * 2013-10-01 2018-05-01 Indian Institute Of Technology Bombay Scalable ultra dense hypergraph network for data centers
US9419908B2 (en) * 2013-11-27 2016-08-16 Cisco Technology, Inc. Network congestion management using flow rebalancing
US9967199B2 (en) 2013-12-09 2018-05-08 Nicira, Inc. Inspecting operations of a machine to detect elephant flows
US9548924B2 (en) 2013-12-09 2017-01-17 Nicira, Inc. Detecting an elephant flow based on the size of a packet
US9569368B2 (en) 2013-12-13 2017-02-14 Nicira, Inc. Installing and managing flows in a flow table cache
US9996467B2 (en) 2013-12-13 2018-06-12 Nicira, Inc. Dynamically adjusting the number of flows allowed in a flow table cache
US9798631B2 (en) 2014-02-04 2017-10-24 Microsoft Technology Licensing, Llc Block storage by decoupling ordering from durability
US10193806B2 (en) 2014-03-31 2019-01-29 Nicira, Inc. Performing a finishing operation to improve the quality of a resulting hash
US9385954B2 (en) 2014-03-31 2016-07-05 Nicira, Inc. Hashing techniques for use in a network environment
US9985896B2 (en) 2014-03-31 2018-05-29 Nicira, Inc. Caching of service decisions
TWI531908B (zh) * 2014-04-24 2016-05-01 A method of supporting virtual machine migration with Software Defined Network (SDN)
US9537743B2 (en) * 2014-04-25 2017-01-03 International Business Machines Corporation Maximizing storage controller bandwidth utilization in heterogeneous storage area networks
US9742881B2 (en) 2014-06-30 2017-08-22 Nicira, Inc. Network virtualization using just-in-time distributed capability for classification encoding
US9590906B2 (en) * 2014-09-24 2017-03-07 Cisco Technology, Inc. Network resource sharing for routing and forwarding information
US11178051B2 (en) 2014-09-30 2021-11-16 Vmware, Inc. Packet key parser for flow-based forwarding elements
US10003648B2 (en) 2014-10-02 2018-06-19 Samsung Electronics Co., Ltd. Mechanism for universal parallel information access
US10469342B2 (en) 2014-10-10 2019-11-05 Nicira, Inc. Logical network traffic analysis
US9912584B2 (en) * 2014-11-07 2018-03-06 Cisco Technology, Inc. Data center inbound routing optimization in the event of virtual machine mobility
US10740290B2 (en) * 2015-04-14 2020-08-11 Jetflow Technologies Systems and methods for key-value stores
US10491973B2 (en) * 2015-04-24 2019-11-26 Rockley Photonics Limited Optoelectronic switch
US9954751B2 (en) 2015-05-29 2018-04-24 Microsoft Technology Licensing, Llc Measuring performance of a network using mirrored probe packets
KR101674177B1 (ko) * 2015-07-07 2016-11-09 주식회사 케이티 멀티노드간 이더넷 가상연결서비스를 제공하는 트랜스포트 sdn 컨트롤러 및 멀티노드간 이더넷 가상연결서비스 제공 방법
US9680924B2 (en) 2015-09-11 2017-06-13 At&T Intellectual Property I, L.P. System and method for resource selection during group communication broadcast
US10341185B2 (en) * 2015-10-02 2019-07-02 Arista Networks, Inc. Dynamic service insertion
US10728096B2 (en) 2015-10-02 2020-07-28 Arista Networks, Inc. Dynamic service device integration
WO2017070382A1 (en) * 2015-10-21 2017-04-27 Level 3 Communications, Llc System and method for determining capacity of a telecommunications network
CN108476080B (zh) * 2015-11-05 2021-01-05 洛克利光子有限公司 多维光电子交换机
US10075522B2 (en) 2016-01-29 2018-09-11 Extreme Networks, Inc. Automated mirroring and remote switch port analyzer (RSPAN)/ encapsulated remote switch port analyzer (ERSPAN) functions using fabric attach (FA) signaling
US10097633B2 (en) * 2016-01-29 2018-10-09 Extreme Networks, Inc. Automated mirroring and remote switch port analyzer (RSPAN)/encapsulated remote switch port analyzer (ERSPAN) functions using fabric attach (FA) signaling
US9961138B2 (en) * 2016-02-16 2018-05-01 Justin G. Lelacheur Fiber-based distributed data center architecture
US10929357B2 (en) 2016-02-29 2021-02-23 Red Hat, Inc. Detecting stale storage layouts without using client locks
WO2017186265A1 (en) * 2016-04-25 2017-11-02 Telefonaktiebolaget Lm Ericsson (Publ) Data center network
US10454830B2 (en) * 2016-05-05 2019-10-22 City University Of Hong Kong System and method for load balancing in a data network
US10334334B2 (en) 2016-07-22 2019-06-25 Intel Corporation Storage sled and techniques for a data center
US10142264B2 (en) * 2016-07-29 2018-11-27 Cisco Technology, Inc. Techniques for integration of blade switches with programmable fabric
US10355945B2 (en) * 2016-09-21 2019-07-16 International Business Machines Corporation Service level management of a workload defined environment
US11546266B2 (en) * 2016-12-15 2023-01-03 Arbor Networks, Inc. Correlating discarded network traffic with network policy events through augmented flow
US10200306B2 (en) 2017-03-07 2019-02-05 Nicira, Inc. Visualization of packet tracing operation results
US10277535B2 (en) 2017-03-31 2019-04-30 Hewlett Packard Enterprise Development Lp Network switch systems including logical switches
US10433035B2 (en) * 2017-03-31 2019-10-01 Intel Corporation Profiles for collecting telemetry data
US10382390B1 (en) 2017-04-28 2019-08-13 Cisco Technology, Inc. Support for optimized microsegmentation of end points using layer 2 isolation and proxy-ARP within data center
CN107426290A (zh) * 2017-05-27 2017-12-01 郑州云海信息技术有限公司 一种Smart Rack系统云计算优化方法
US10681000B2 (en) 2017-06-30 2020-06-09 Nicira, Inc. Assignment of unique physical network addresses for logical network addresses
US10637800B2 (en) 2017-06-30 2020-04-28 Nicira, Inc Replacement of logical network addresses with physical network addresses
US10212089B1 (en) * 2017-09-21 2019-02-19 Citrix Systems, Inc. Encapsulating traffic entropy into virtual WAN overlay for better load balancing
US10608887B2 (en) 2017-10-06 2020-03-31 Nicira, Inc. Using packet tracing tool to automatically execute packet capture operations
US10318335B1 (en) * 2017-11-22 2019-06-11 Verizon Patent And Licensing Inc. Self-managed virtual networks and services
US10574566B2 (en) * 2018-05-25 2020-02-25 Juniper Networks, Inc. Reducing or eliminating routing microloops in networks having a CLOS topology, such as data center CLOS networks employing the exterior border gateway protocol (EBGP) for example
EP4123973A1 (en) 2019-02-08 2023-01-25 Palantir Technologies Inc. Isolating applications associated with multiple tenants within a computing platform
US11290491B2 (en) * 2019-03-14 2022-03-29 Oracle International Corporation Methods, systems, and computer readable media for utilizing a security service engine to assess security vulnerabilities on a security gateway element
US11283699B2 (en) 2020-01-17 2022-03-22 Vmware, Inc. Practical overlay network latency measurement in datacenter
US11570090B2 (en) 2020-07-29 2023-01-31 Vmware, Inc. Flow tracing operation in container cluster
US11558426B2 (en) 2020-07-29 2023-01-17 Vmware, Inc. Connection tracking for container cluster
US11196628B1 (en) 2020-07-29 2021-12-07 Vmware, Inc. Monitoring container clusters
US11290380B2 (en) * 2020-07-30 2022-03-29 S.C Correct Networks S.R.L. Method for transferring information across a data center network
US11425044B2 (en) * 2020-10-15 2022-08-23 Cisco Technology, Inc. DHCP layer 2 relay in VXLAN overlay fabric
US11463352B1 (en) * 2020-10-27 2022-10-04 Qualcomm Incorporated Manipulating bottlenecks in systems modeled as networks
US11736436B2 (en) 2020-12-31 2023-08-22 Vmware, Inc. Identifying routes with indirect addressing in a datacenter
US11336533B1 (en) 2021-01-08 2022-05-17 Vmware, Inc. Network visualization of correlations between logical elements and associated physical elements
DE102021113670A1 (de) * 2021-05-27 2022-12-01 Dspace Gmbh Verfahren zur Datenübertragung in einem Netzwerksystem sowie Netzwerksystem
US11687210B2 (en) 2021-07-05 2023-06-27 Vmware, Inc. Criteria-based expansion of group nodes in a network topology visualization
US11711278B2 (en) 2021-07-24 2023-07-25 Vmware, Inc. Visualization of flow trace operation across multiple sites
US11706109B2 (en) 2021-09-17 2023-07-18 Vmware, Inc. Performance of traffic monitoring actions
US11853254B1 (en) * 2022-10-07 2023-12-26 Keysight Technologies, Inc. Methods, systems, and computer readable media for exposing data processing unit (DPU) traffic in a smartswitch

Family Cites Families (123)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4013999A (en) 1974-08-15 1977-03-22 Recognition Equipment Incorporated Single read station acquisition for character recognition
US6718387B1 (en) 1997-12-10 2004-04-06 Sun Microsystems, Inc. Reallocating address spaces of a plurality of servers using a load balancing policy and a multicast channel
JP3721022B2 (ja) 1998-12-11 2005-11-30 沖電気工業株式会社 通信ネットワークシステムおよび通信ノード
US6801949B1 (en) 1999-04-12 2004-10-05 Rainfinity, Inc. Distributed server cluster with graphical user interface
US6697365B1 (en) 1999-06-10 2004-02-24 Charles Hayes Messenger Method of listener transmitted broadcasting
US6662223B1 (en) 1999-07-01 2003-12-09 Cisco Technology, Inc. Protocol to coordinate network end points to measure network latency
WO2001026267A1 (en) 1999-10-05 2001-04-12 Ejasent Inc. Virtual port multiplexing
US7164704B1 (en) 1999-12-09 2007-01-16 Texas Instruments Incorporated Beam forming for transmit using bluetooth modified hopping sequences (BFTBMH)
EP1260061A2 (en) 2000-02-22 2002-11-27 Top Layer Networks, Inc. System and method for flow mirroring in a network switch
US20020034162A1 (en) 2000-06-30 2002-03-21 Brinkerhoff Kenneth W. Technique for implementing fractional interval times for fine granularity bandwidth allocation
US20020032871A1 (en) 2000-09-08 2002-03-14 The Regents Of The University Of Michigan Method and system for detecting, tracking and blocking denial of service attacks over a computer network
US6795655B1 (en) 2000-10-09 2004-09-21 Meklyn Enterprises Limited Free-space optical communication system with spatial multiplexing
AU2001293982A1 (en) 2000-10-10 2002-04-22 Radiant Networks Plc Communications meshes
US6907395B1 (en) 2000-10-24 2005-06-14 Microsoft Corporation System and method for designing a logical model of a distributed computer system and deploying physical resources according to the logical model
ATE381191T1 (de) 2000-10-26 2007-12-15 Prismedia Networks Inc Verfahren und system zur verwaltung von verteilten inhalten und entsprechenden metadaten
WO2002037757A2 (en) 2000-10-30 2002-05-10 The Regents Of The University Of California Receiver-initiated channel-hopping (rich) method for wireless communication networks
US6961315B1 (en) 2000-11-21 2005-11-01 At&T Corp. Technique for monitoring conversational voice over packet
US7296268B2 (en) 2000-12-18 2007-11-13 Microsoft Corporation Dynamic monitor and controller of availability of a load-balancing cluster
US7333482B2 (en) 2000-12-22 2008-02-19 Interactive People Unplugged Ab Route optimization technique for mobile IP
US20020109887A1 (en) 2001-02-15 2002-08-15 Ntt Docomo, Inc. Optical transmitting/receiving method and system, and optical communication network
US20020184368A1 (en) 2001-04-06 2002-12-05 Yunsen Wang Network system, method and protocols for hierarchical service and content distribution via directory enabled network
US20020184383A1 (en) 2001-05-29 2002-12-05 Docomo Communications Laboratories Usa, Inc. Live mobile camera system with a communication protocol and a server cluster
US6999462B1 (en) 2001-06-18 2006-02-14 Advanced Micro Devices, Inc. Mapping layer 2 LAN priorities to a virtual lane in an Infiniband™ network
US20030009559A1 (en) 2001-07-09 2003-01-09 Naoya Ikeda Network system and method of distributing accesses to a plurality of server apparatus in the network system
WO2003009539A1 (fr) 2001-07-10 2003-01-30 Fujitsu Limited Systeme de communication a terminal mobile et procede de communication
US6978223B2 (en) 2001-09-06 2005-12-20 Bbnt Solutions Llc Systems and methods for network performance measurement using packet signature collection
US7177271B2 (en) 2001-09-21 2007-02-13 Microsoft Corporation Method and system for managing admission to a network
US7167648B2 (en) 2001-10-24 2007-01-23 Innovative Fiber Optic Solutions, Llc System and method for an ethernet optical area network
US7213065B2 (en) 2001-11-08 2007-05-01 Racemi, Inc. System and method for dynamic server allocation and provisioning
US7127508B2 (en) 2001-12-19 2006-10-24 Tropic Networks Inc. Method and system of measuring latency and packet loss in a network by using probe packets
US20030154236A1 (en) 2002-01-22 2003-08-14 Shaul Dar Database Switch enabling a database area network
US7133368B2 (en) 2002-02-01 2006-11-07 Microsoft Corporation Peer-to-peer method of quality of service (QoS) probing and analysis and infrastructure employing same
US7512702B1 (en) 2002-03-19 2009-03-31 Cisco Technology, Inc. Method and apparatus providing highly scalable server load balancing
JP2003281109A (ja) 2002-03-26 2003-10-03 Hitachi Ltd 負荷分散方法
US20050003828A1 (en) 2002-04-09 2005-01-06 Sugar Gary L. System and method for locating wireless devices in an unsynchronized wireless environment
AU2003226323A1 (en) 2002-04-10 2003-10-27 Crinis Networks, Inc. Wireless optical system and method for point-to-point high bandwidth communication
US7382782B1 (en) 2002-04-12 2008-06-03 Juniper Networks, Inc. Packet spraying for load balancing across multiple packet processors
US7007103B2 (en) * 2002-04-30 2006-02-28 Microsoft Corporation Method to offload a network stack
EP1383283A1 (en) 2002-07-03 2004-01-21 Alcatel A method for operating a cellular time division multiple access communication system
US7031304B1 (en) 2002-09-11 2006-04-18 Redback Networks Inc. Method and apparatus for selective packet Mirroring
JP2004228828A (ja) 2003-01-22 2004-08-12 Hitachi Ltd ネットワーク障害分析支援システム
US7295119B2 (en) 2003-01-22 2007-11-13 Wireless Valley Communications, Inc. System and method for indicating the presence or physical location of persons or devices in a site specific representation of a physical environment
US7486674B2 (en) 2003-04-28 2009-02-03 Alcatel-Lucent Usa Inc. Data mirroring in a service
KR100511687B1 (ko) 2003-05-21 2005-09-01 니트젠테크놀러지스 주식회사 네트워크에 대한 지능형 트래픽 관리시스템 및 그를이용한 지능형 트래픽 관리방법
US7710867B1 (en) 2003-05-23 2010-05-04 F5 Networks, Inc. System and method for managing traffic to a probe
US7590736B2 (en) 2003-06-30 2009-09-15 Microsoft Corporation Flexible network load balancing
US7613822B2 (en) 2003-06-30 2009-11-03 Microsoft Corporation Network load balancing with session information
US7606929B2 (en) 2003-06-30 2009-10-20 Microsoft Corporation Network load balancing with connection manipulation
US20050027862A1 (en) 2003-07-18 2005-02-03 Nguyen Tien Le System and methods of cooperatively load-balancing clustered servers
US8130661B2 (en) 2003-08-01 2012-03-06 Opnet Technologies, Inc. Systems and methods for intelligent probe testing
JP4892172B2 (ja) 2003-08-04 2012-03-07 ルネサスエレクトロニクス株式会社 半導体装置およびその製造方法
US7289334B2 (en) * 2003-08-27 2007-10-30 Epicenter, Inc. Rack architecture and management system
KR100962647B1 (ko) 2003-10-27 2010-06-11 삼성전자주식회사 모바일 단말기의 이동성 지원 방법 및 그 시스템
EP1528744A1 (en) 2003-10-30 2005-05-04 Hewlett-Packard Development Company, L.P. Method and apparatus for load-balancing
US7860095B2 (en) 2003-10-30 2010-12-28 Hewlett-Packard Development Company, L.P. Method and apparatus for load-balancing
US7487541B2 (en) 2003-12-10 2009-02-03 Alcatel Lucent Flow-based method for tracking back single packets
US7457868B1 (en) 2003-12-30 2008-11-25 Emc Corporation Methods and apparatus for measuring network performance
US7447153B2 (en) 2004-02-19 2008-11-04 Internap Network Services Corporation System and method for end to end route control
JP2005260594A (ja) 2004-03-11 2005-09-22 Oki Techno Creation:Kk ネットワークシステム及び通信装置
KR100818977B1 (ko) 2004-05-20 2008-04-07 프리비트 가부시키가이샤 클라이언트 기기에 대한 접속을 라우팅 하기 위한서버
US8255422B2 (en) 2004-05-28 2012-08-28 Microsoft Corporation Highly reliable and scalable architecture for data centers
US7961637B2 (en) 2004-06-07 2011-06-14 Spirent Communications Of Rockville, Inc. Method and apparatus for monitoring latency, jitter, packet throughput and packet loss ratio between two points on a network
EP1605642A1 (en) 2004-06-08 2005-12-14 Matsushita Electric Industrial Co., Ltd. Service dependent shared physical channel mapping
US8422500B2 (en) 2004-07-02 2013-04-16 Rockstar Consortium Us Lp VLAN support of differentiated services
JP2006074171A (ja) 2004-08-31 2006-03-16 Chuo System Giken Kk 動的メッシュ型vpn構築方法
GB2418326B (en) * 2004-09-17 2007-04-11 Hewlett Packard Development Co Network vitrualization
US7590727B1 (en) 2004-09-28 2009-09-15 Sprint Communications Company L.P. System and method for software failover on a bladed system
US7571470B2 (en) 2004-10-28 2009-08-04 Cisco Technology, Inc. One arm data center topology with layer 4 and layer 7 services
JP4251148B2 (ja) 2004-11-19 2009-04-08 日本電気株式会社 グループ内通信方法、システム及び記録媒体
ATE525829T1 (de) 2005-02-28 2011-10-15 Ibm Bladeserversystem mit mindestens einem stapelschalter mit mehreren untereinander verbundenen und für verwaltung sowie betrieb als virtueller einzelschalter konfigurierten schaltern
US7626938B1 (en) 2005-03-31 2009-12-01 Marvell Israel (M.I.S.L) Ltd. Local area network switch using control plane packet mirroring to support multiple network traffic analysis devices
US7613155B2 (en) 2005-04-30 2009-11-03 Lg Electronics Inc. Terminal, system and method for providing location information service by interworking between WLAN and mobile communication network
US20070002770A1 (en) 2005-06-30 2007-01-04 Lucent Technologies Inc. Mechanism to load balance traffic in an ethernet network
US7984493B2 (en) * 2005-07-22 2011-07-19 Alcatel-Lucent DNS based enforcement for confinement and detection of network malicious activities
JP4702110B2 (ja) 2006-03-03 2011-06-15 日本電気株式会社 無線通信システム、無線基地局、無線通信制御装置、プログラム、および経路制御方法
US8547855B1 (en) 2006-03-21 2013-10-01 Cisco Technology, Inc. Method and apparatus to schedule multiple probes for active or passive monitoring of networks
CN101056217B (zh) 2006-04-14 2011-01-19 华为技术有限公司 一种网络性能测量方法及系统
US8875135B2 (en) 2006-04-17 2014-10-28 Cisco Systems, Inc. Assigning component operations of a task to multiple servers using orchestrated web service proxy
US7532583B2 (en) 2006-05-30 2009-05-12 International Business Machines Corporation Method for integrating downstream performance and resource usage statistics into load balancing weights
CN101083549A (zh) * 2006-06-02 2007-12-05 华为技术有限公司 一种实现vpn配置服务的方法和系统
JP2008042669A (ja) 2006-08-08 2008-02-21 Canon Inc 無線機器装置、その通信方法及びプログラム
US8014308B2 (en) 2006-09-28 2011-09-06 Microsoft Corporation Hardware architecture for cloud services
JP2008085906A (ja) 2006-09-28 2008-04-10 Fujitsu Ltd パケット損失率算出システム
JP4394674B2 (ja) * 2006-11-08 2010-01-06 Necインフロンティア株式会社 通信ネットワークにおける冗長化の方法およびその方法に適するルータ
CN101657802A (zh) 2006-12-06 2010-02-24 弗森多系统公司(dba弗森-艾奥) 用于远程直接存储器存取固态存储设备的装置、系统及方法
JP2008199348A (ja) 2007-02-14 2008-08-28 Fujitsu Ltd 中継装置、中継プログラム及び通信システム
US8054840B2 (en) 2007-06-12 2011-11-08 International Business Machines Corporation Data center virtual local area network system and method
US20090063706A1 (en) 2007-08-30 2009-03-05 International Business Machines Corporation Combined Layer 2 Virtual MAC Address with Layer 3 IP Address Routing
JP4729549B2 (ja) 2007-09-26 2011-07-20 日本電信電話株式会社 負荷制御方法及び装置及びプログラム
US8285789B2 (en) * 2007-10-05 2012-10-09 Intel Corporation Flattened butterfly processor interconnect network
US8248928B1 (en) 2007-10-09 2012-08-21 Foundry Networks, Llc Monitoring server load balancing
US8073195B2 (en) 2007-12-13 2011-12-06 Pitney Bowes Inc. Method and apparatus for detecting malfunctioning print elements in postage meter indicia printer
US8675502B2 (en) 2008-01-30 2014-03-18 Cisco Technology, Inc. Relative one-way delay measurements over multiple paths between devices
JP2009187185A (ja) 2008-02-05 2009-08-20 Fuji Xerox Co Ltd 記憶装置、記憶装置アレイ及びデータ処理システム
US8395621B2 (en) 2008-02-12 2013-03-12 Accenture Global Services Limited System for providing strategies for increasing efficiency of data centers
US8001403B2 (en) 2008-03-14 2011-08-16 Microsoft Corporation Data center power management utilizing a power policy and a load factor
KR101507786B1 (ko) 2008-03-31 2015-04-03 엘지전자 주식회사 단말기 및 이것의 간섭 개선 방법
US8160063B2 (en) 2008-06-09 2012-04-17 Microsoft Corporation Data center interconnect and traffic engineering
US20100036903A1 (en) 2008-08-11 2010-02-11 Microsoft Corporation Distributed load balancer
US8335213B2 (en) 2008-09-11 2012-12-18 Juniper Networks, Inc. Methods and apparatus related to low latency within a data center
US8125985B1 (en) 2008-12-29 2012-02-28 Juniper Networks, Inc. Methods and apparatus for chaining access switches coupled to a switch fabric
US8213937B2 (en) 2009-03-31 2012-07-03 Broadcom Corporation Method and system for dynamic adjustment of power and frequencies in a femtocell network
EP2247042A1 (en) 2009-04-28 2010-11-03 Thomson Licensing, Inc. Device and method for computation of channel loss rate and collision loss rate of communication link(s) in a random access network
US8416692B2 (en) 2009-05-28 2013-04-09 Microsoft Corporation Load balancing across layer-2 domains
US8972601B2 (en) 2009-10-09 2015-03-03 Microsoft Technology Licensing, Llc Flyways in data centers
US8301028B2 (en) 2009-12-21 2012-10-30 The Invention Science Fund I, Llc Data center with free-space optical communications
US9772880B2 (en) 2010-01-27 2017-09-26 Avago Technologies General Ip (Singapore) Pte. Ltd. Wireless bus for intra-chip and inter-chip communication, including adaptive link and route embodiments
US9391716B2 (en) 2010-04-05 2016-07-12 Microsoft Technology Licensing, Llc Data center using wireless communication
US8427958B2 (en) 2010-04-30 2013-04-23 Brocade Communications Systems, Inc. Dynamic latency-based rerouting
US9215275B2 (en) 2010-09-30 2015-12-15 A10 Networks, Inc. System and method to balance servers based on server load status
US8634297B2 (en) 2010-11-01 2014-01-21 Cisco Technology, Inc. Probing specific customer flow in layer-2 multipath networks
US8774213B2 (en) 2011-03-30 2014-07-08 Amazon Technologies, Inc. Frameworks and interfaces for offload device-based packet processing
US8539094B1 (en) 2011-03-31 2013-09-17 Amazon Technologies, Inc. Ordered iteration for data update management
US9274825B2 (en) 2011-08-16 2016-03-01 Microsoft Technology Licensing, Llc Virtualization gateway between virtualized and non-virtualized networks
CN103023797B (zh) 2011-09-23 2016-06-15 百度在线网络技术(北京)有限公司 数据中心系统及装置和提供服务的方法
US20130159487A1 (en) 2011-12-14 2013-06-20 Microsoft Corporation Migration of Virtual IP Addresses in a Failover Cluster
US8718064B2 (en) 2011-12-22 2014-05-06 Telefonaktiebolaget L M Ericsson (Publ) Forwarding element for flexible and extensible flow processing software-defined networks
JP5750714B2 (ja) 2012-01-19 2015-07-22 株式会社日立製作所 計算機システム、仮想サーバ配置方法及び配置制御装置
US8942237B2 (en) 2012-06-20 2015-01-27 International Business Machines Corporation Hypervisor independent network virtualization
US8958327B2 (en) 2012-08-10 2015-02-17 Cisco Technology, Inc. Passive network latency monitoring
US20140369347A1 (en) 2013-06-18 2014-12-18 Corning Cable Systems Llc Increasing radixes of digital data switches, communications switches, and related components and methods
US9565105B2 (en) 2013-09-04 2017-02-07 Cisco Technology, Inc. Implementation of virtual extensible local area network (VXLAN) in top-of-rack switches in a network environment
US9264521B2 (en) 2013-11-01 2016-02-16 Broadcom Corporation Methods and systems for encapsulating and de-encapsulating provider backbone bridging inside upper layer protocols

Also Published As

Publication number Publication date
JP2016040925A (ja) 2016-03-24
US9497039B2 (en) 2016-11-15
US20100306408A1 (en) 2010-12-02
KR101669700B1 (ko) 2016-11-09
KR20120026516A (ko) 2012-03-19
JP2012528552A (ja) 2012-11-12

Similar Documents

Publication Publication Date Title
JP6129928B2 (ja) アジャイルデータセンタネットワークアーキテクチャ
EP2436157B1 (en) Agile data center network architecture
JP6483781B2 (ja) 分散論理l3ルーティング
US8676980B2 (en) Distributed load balancer in a virtual machine environment
US9660905B2 (en) Service chain policy for distributed gateways in virtual overlay networks
CN109937401B (zh) 经由业务旁路进行的负载均衡虚拟机的实时迁移
Greenberg et al. VL2: a scalable and flexible data center network
EP2817926B1 (en) Delegate forwarding and address resolution in fragmented network
JP5661929B2 (ja) マルチシャーシリンクアグリゲーションのためのシステムおよび方法
US9426068B2 (en) Balancing of forwarding and address resolution in overlay networks
US8369296B2 (en) Distributed link aggregation
CN112673596A (zh) 逻辑网关处的服务插入
US11895030B2 (en) Scalable overlay multicast routing
Besta et al. High-performance routing with multipathing and path diversity in ethernet and hpc networks
JP2018191290A (ja) 負荷分散を実現するための方法、装置、およびネットワークシステム
US11057459B2 (en) Datapath-driven fully distributed east-west application load balancer
EP3026851B1 (en) Apparatus, network gateway, method and computer program for providing information related to a specific route to a service in a network
Kiriha et al. Survey on data center networking technologies
EP4211886A1 (en) Fault tolerance for sdn gateways using network switches
Zhang et al. Scalable and Agile Data Center Networking via Software Defined Network and Hybrid Control

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160808

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160816

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20161116

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170314

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170412

R150 Certificate of patent or registration of utility model

Ref document number: 6129928

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250