JP2015231212A - データ転送システム、データ転送サーバ、データ転送方法、および、プログラム - Google Patents

データ転送システム、データ転送サーバ、データ転送方法、および、プログラム Download PDF

Info

Publication number
JP2015231212A
JP2015231212A JP2014117976A JP2014117976A JP2015231212A JP 2015231212 A JP2015231212 A JP 2015231212A JP 2014117976 A JP2014117976 A JP 2014117976A JP 2014117976 A JP2014117976 A JP 2014117976A JP 2015231212 A JP2015231212 A JP 2015231212A
Authority
JP
Japan
Prior art keywords
data transfer
packet
transfer server
domain
termination point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014117976A
Other languages
English (en)
Other versions
JP6379702B2 (ja
Inventor
倫明 宮崎
Tomoaki Miyazaki
倫明 宮崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2014117976A priority Critical patent/JP6379702B2/ja
Priority to EP15802330.9A priority patent/EP3154228A4/en
Priority to PCT/JP2015/002836 priority patent/WO2015186366A1/ja
Priority to US15/316,311 priority patent/US10177935B2/en
Publication of JP2015231212A publication Critical patent/JP2015231212A/ja
Application granted granted Critical
Publication of JP6379702B2 publication Critical patent/JP6379702B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/46Interconnection of networks
    • H04L12/4633Interconnection of networks using encapsulation techniques, e.g. tunneling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/46Interconnection of networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/46Interconnection of networks
    • H04L12/4641Virtual LANs, VLANs, e.g. virtual private networks [VPN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45595Network integration; Enabling network access in virtual machine instances
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L2212/00Encapsulation of packets

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Small-Scale Networks (AREA)

Abstract

【課題】複数のドメインに跨るネットワークにおいて仮想ネットワークを構成する場合に、ブロードキャストおよびマルチキャストを効率良く転送すること。【解決手段】データ転送システムは第1のドメインに属するトンネル終端ポイントに対して設けられた第1のデータ転送サーバと第2のドメインに属するトンネル終端ポイントに対して設けられた第2のデータ転送サーバとを備え、第1のデータ転送サーバは第1のドメインに属するトンネル終端ポイントからパケットを受信すると、第2のデータ転送サーバ、および、第1のドメインに属するトンネル終端ポイントのうちのパケットの転送元以外のトンネル終端ポイントに対して、パケットを転送し、第2のデータ転送サーバは第1のデータ転送サーバからパケットを受信すると、第2のドメインに属するトンネル終端ポイントに対して、パケットを転送する。【選択図】図1

Description

本発明は、データ転送システム、データ転送サーバ、データ転送方法、および、プログラムに関し、特に、トンネリング技術を用いて通信を行う場合のブロードキャストおよびマルチキャストを転送するデータ通信システム、データ転送サーバ、データ転送方法、および、プログラムに関する。
近年、大規模なデータセンターにおいて仮想計算機環境の利用が増大している。また、仮想計算機環境上では、ソフトウェアによりネットワーク機器を制御するSDN(Software-Defined Network)が構築されている。SDNに基づいて構築されたVLAN(Virtual Local Area Network)においては、ネットワーク装置の区画資源が少ないという問題や、ネットワーク機器の設定が複雑となるという問題を回避するため、エッジオーバレイを構築するためのオーバレイネットワーク技術が使用される。
エッジオーバレイネットワーク技術として、VXLAN(Virtual Extensible Local Area Network)やNVGRE(Network Virtualization using Generic Routing Encapsulation)などのトンネリング技術が知られている(非特許文献1、2)。これらの技術は、仮想計算機上に構築される仮想ネットワークの通信をカプセル化して、仮想計算機環境を構成するネットワーク機器から成る基盤ネットワーク(Substrate Network、物理ネットワーク)に対して通信を流す。これらのトンネリング技術では、カプセリングの際に、仮想ネットワークID(Identifier)を付加することで、仮想ネットワークの区画資源を仮想的に増やすことが可能となる。また、これらのトンネリング技術では、基盤ネットワークの通信を用いることで、ネットワーク機器に対する設定の負担が軽減される。
しかしながら、これらのトンネリング技術では、ブロードキャスト、マルチキャスト、Unknownユニキャストに関しては、処理内容が詳細に規定されておらず、単に、基盤ネットワークのIP(Internet Protocol)マルチキャスト技術を用いることが定められているに過ぎない。IPマルチキャストアドレスは共有されることもあるが、通常、仮想ネットワークIDごとに設定される。したがって、マルチキャストは、構築された仮想計算機環境のネットワーク、すなわち、対象となる仮想ネットワークの全域に届けられる(非特許文献1の「4.2. Broadcast Communication and Mapping to Multicast」、非特許文献2の「4.1. Broadcast and Multicast Traffic」参照)。
また、特許文献1には、TRILL(Transparent Interconnection of Lots of Links)ヘッダと呼ばれるヘッダにより、パケットをカプセル化する技術に適用されるスイッチが開示されている。特許文献1に記載されたスイッチは、マルチキャストパケットと関連付けられるソースアドレス、マルチキャストアドレス、および、マルチキャストツリー識別子フィールドに基づいて、内部マルチキャストグループ識別子を判定する手段と、内部マルチキャストグループ識別子に基づいてマルチキャストパケットを転送する手段とを備えている。
さらに、非特許文献3には、オープンフロー(OpenFlow)と呼ばれるネットワーク制御技術が記載されている。オープンフローを用いることにより、オープンフロースイッチをトンネリング技術のTEP装置(Tunnel End Point、トンネル終端ポイント)として機能させることが可能となる。
特表2013−528340号公報
M.Mahalingamほか7名、"VXLAN: A Framework for Overlaying Virtualized Layer 2 Networks over Layer 3 Network"、[online]、[平成26(2014)年5月19日検索]、インターネット<URL:http://tools.ietf.org/pdf/draft-mahalingam-dutt-dcops-vxlan-02.pdf> M.Sridharanほか9名、"NVGRE: Network Virtualization using Generic Routing Encapsulation"、[online]、[平成26(2014)年5月19日検索]、インターネット<URL:http://tools.ietf.org/pdf/draft-sridharan-virtualization-nvgre-01.pdf> Nick McKeownほか7名、"OpenFlow: Enabling Innovation in Campus Networks"、[online]、[平成26(2014)年5月19日検索]、インターネット<URL: http://www.openflow.org/documents/openflow-wp-latest.pdf>
上記特許文献および非特許文献の全開示内容は、本書に引用をもって繰り込み記載されているものとする。以下の分析は、本発明者によってなされたものである。
VXLAN(Virtual Extensible Local Area Network)にはさまざまなメリットがあるものの、マルチキャストに対応した物理ネットワークが必要とされる点が導入の障壁となるおそれがある。一方、マルチキャストを使用する代わりに、代替の装置にブロードキャストを送信する宛先を学習させ、当該代替の装置がすべての宛先に対してパケットをコピーして送信する方法を使用することが考えられる。かかる方法によると、前述のマルチキャストに対応したネットワークが不要となり、ネットワーク構築が簡便になるというメリットがある。しかしながら、かかる方法によると、マルチキャストとは異なり、代替の装置から宛先に転送する際に、パケットがコピーされて転送される。したがって、ドメインを跨る転送が行われる場合には、コピーされたパケットが同一の経路を通過するため、ネットワークの効率が悪化するという問題がある。
そこで、複数のドメイン(ないしは、グループ、拠点)に跨るネットワークにおいて、VXLANを用いて仮想ネットワークを構成する場合に、マルチキャストを使用せず、かつ、ブロードキャストパケットを拠点間の複数の宛先に効率良く転送する技術が望まれる。
特に、複数のドメインに跨るネットワークにおいて仮想ネットワークを構成する場合に、ブロードキャストおよびマルチキャストを効率良く転送することが課題となる。本発明の目的は、かかる課題の解決に寄与するデータ転送システム、データ転送サーバ、データ転送方法、および、プログラムを提供することにある。
本発明の第1の態様に係るデータ転送システムは、第1のドメインに属するトンネル終端ポイントに対して設けられた第1のデータ転送サーバと、第2のドメインに属するトンネル終端ポイントに対して設けられた第2のデータ転送サーバと、を備え、前記第1のデータ転送サーバは、前記第1のドメインに属するトンネル終端ポイントからパケットを受信すると、前記第2のデータ転送サーバ、および、前記第1のドメインに属するトンネル終端ポイントのうちの前記パケットの転送元以外のトンネル終端ポイントに対して、前記パケットを転送する第1の転送部を有し、前記第2のデータ転送サーバは、前記第1のデータ転送サーバから前記パケットを受信すると、前記第2のドメインに属するトンネル終端ポイントに対して、前記パケットを転送する第2の転送部を有する。
本発明の第2の態様に係るデータ転送サーバは、第1のドメインに属するトンネル終端ポイントに対して設けられた第1のデータ転送サーバであって、前記第1のドメインに属するトンネル終端ポイントからパケットを受信すると、第2のドメインに属するトンネル終端ポイントに対して設けられた第2のデータ転送サーバ、および、前記第1のドメインに属するトンネル終端ポイントのうちの前記パケットの転送元以外のトンネル終端ポイントに対して、前記パケットを転送する第1の転送部を備え、前記第2のデータ転送サーバは、前記第1のデータ転送サーバから前記パケットを受信すると、前記第2のドメインに属するトンネル終端ポイントに対して、前記パケットを転送する。
本発明の第3の態様に係るデータ転送方法は、第1のドメインに属するトンネル終端ポイントに対して設けられた第1のデータ転送サーバが、前記第1のドメインに属するトンネル終端ポイントからパケットを受信するステップと、第2のドメインに属するトンネル終端ポイントに対して設けられた第2のデータ転送サーバ、および、前記第1のドメインに属するトンネル終端ポイントのうちの前記パケットの転送元以外のトンネル終端ポイントに対して、前記パケットを転送するステップと、前記第2のデータ転送サーバが、前記第1のデータ転送サーバから前記パケットを受信すると、前記第2のドメインに属するトンネル終端ポイントに対して、前記パケットを転送するステップと、を含む。
本発明の第4の態様に係るプログラムは、第1のドメインに属するトンネル終端ポイントに対して設けられた第1のデータ転送サーバに設けられたコンピュータに対して、前記第1のドメインに属するトンネル終端ポイントからパケットを受信する処理と、第2のドメインに属するトンネル終端ポイントに対して設けられた第2のデータ転送サーバ、および、前記第1のドメインに属するトンネル終端ポイントのうちの前記パケットの転送元以外のトンネル終端ポイントに対して、前記パケットを転送する処理と、を実行させ、前記第2のデータ転送サーバは、前記第1のデータ転送サーバから前記パケットを受信すると、前記第2のドメインに属するトンネル終端ポイントに対して、前記パケットを転送する。なお、プログラムは、非一時的なコンピュータ可読記録媒体(non-transitory computer-readable storage medium)に記録されたプログラム製品として提供することもできる。
本発明に係るデータ転送システム、データ転送サーバ、データ転送方法、および、プログラムによると、複数のドメインに跨るネットワークにおいて仮想ネットワークを構成する場合に、ブロードキャストおよびマルチキャストを効率良く転送することが可能となる。
一実施形態に係るデータ転送システムの構成を例示するブロック図である。 第1の実施形態に係るデータ転送システムの構成を例示するブロック図である。 第1の実施形態に係るデータ転送システムにおいて、BCMC転送サーバの送信先記憶部が保持するテーブルを例示する図である。 第1の比較例に係るデータ転送システムの構成を例示するブロック図である。 第1の実施形態に係るデータ転送システムの他の構成を例示するブロック図である。 第1の実施形態に係るデータ転送システムにおいて、第1のBCMC転送サーバ10−1の送信先記憶部14−1が保持するテーブルを例示する図である。 第1の実施形態に係るデータ転送システムにおいて、第2のBCMC転送サーバ10−2の送信先記憶部14−2が保持するテーブルを例示する図である。 第1の実施形態に係るデータ転送システムの動作を例示するブロック図である。 第1の比較例に係るデータ転送システムにおいて、BCMC転送サーバの送信先記憶部が保持するテーブルを例示する図である。 第1の実施形態に係るデータ転送システムの他の構成の動作を例示するブロック図である。
はじめに、一実施形態の概要について説明する。なお、この概要に付記する図面参照符号は、専ら理解を助けるための例示であり、本発明を図示の態様に限定することを意図するものではない。
図1は、一実施形態に係るデータ転送システムの構成を例示するブロック図である。図1を参照すると、データ転送システムは、第1のドメイン40−1に属するトンネル終端ポイント60−1、60−2に対して設けられた第1のデータ転送サーバ50−1と、第2のドメイン40−2に属するトンネル終端ポイントに対して設けられた第2のデータ転送サーバ50−2とを備えている。第1のデータ転送サーバ50−1は、第1のドメイン40−1に属するトンネル終端ポイント60−1からパケットを受信すると、第2のデータ転送サーバ50−2、および、第1のドメイン40−1に属するトンネル終端ポイントのうちのパケットの転送元以外のトンネル終端ポイント60−2に対して、パケットを転送する第1の転送部12−1を有する。一方、第2のデータ転送サーバ50−2は、第1のデータ転送サーバ50−1からパケットを受信すると、第2のドメイン40−2に属するトンネル終端ポイント60−3、60−4に対して、パケットを転送する第2の転送部12−2を有する。
かかるデータ転送システムによると、トンネル終端ポイント60−1が収容する仮想サーバからトンネル終端ポイント60−2〜60−4が収容する仮想サーバに向けて送出されるマルチキャストまたはブロードキャストは、トンネル終端ポイント60−1からデータ転送サーバ50−1、データ転送サーバ50−1からトンネル終端ポイント60−2、データ転送サーバ50−1からデータ転送サーバ50−2、データ転送サーバ50−2からトンネル終端ポイント60−3、60−4へのユニキャストとして転送される。かかるデータ転送システムによると、データ転送サーバ50−1からトンネル終端ポイント60−3、60−4に対して直接データを転送した場合と比較して、ドメイン40−1とドメイン40−2を接続する通信路Aにおけるトラフィックを削減することができる。すなわち、一実施形態のデータ転送システムによると、複数のドメインに跨るネットワークにおいて仮想ネットワークを構成する場合に、ブロードキャストおよびマルチキャストを効率良く転送することが可能となる。
ここで、第1の転送部12−1はパケットの送信元ポート番号を所定の番号に変更して、第2のデータ転送サーバ50−2に転送し、第2の転送部12−2はパケットの送信元ポート番号に基づいて、パケットの転送元のデータ転送サーバを識別することが好ましい。かかるデータ転送システムによると、データ転送サーバ50−1、50−2の間でパケットが往復する現象を回避することが可能となる。
<実施形態1>
次に、第1の実施形態に係るデータ転送システムについて、図面を参照して詳細に説明する。
図2は、本実施形態に係るデータ転送システムの構成を例示するブロック図である。図2を参照すると、本実施形態のデータ転送システムは、ブロードキャストおよびマルチキャスト(以下、BCMC:Broadcast Multicast)を転送するためのBCMC転送サーバ10と、VXLAN(Virtual Extensible Local Area Network) Tunnel End Point(VTEP、トンネル終端ポイント)20−1、20−2と、仮想サーバ30−1、30−2とを備えている。
BCMC転送サーバ10は、転送部12および送信先記憶部14を備えている。一方、VTEP20−1は転送部22−1、送信先記憶部24−1、カプセル化部26−1、および、パケット送受信部28−1を備え、VTEP20−2は転送部22−2、送信先記憶部24−2、カプセル化部26−2、および、パケット送受信部28−2を備えている。仮想サーバ30−1、30−2は、パケットを送受信する。BCMCサーバ10の転送部12とVTEP20−1、20−2の転送部22−1、22−2は、TCP(Transmission Control Protocol)/IP(Internet Protocol)通信が可能なネットワークで接続されており、それぞれお互いに通信可能なIPアドレスを有する。
VTEP20−1は、仮想サーバ30−1から送信されたパケットをカプセル化して、BCMC転送サーバ10に送信する。図3は、BCMC転送サーバ10の送信先記憶部14が保持するテーブルを例示する。BCMC転送サーバ10は、送信先記憶部14が保持する図3のテーブルに従って、送信元のVTEP20−1を除き、VTEP20−2に対してパケットを送信する。VTEP20−2は、パケットを受信すると、カプセル化を解除して、仮想サーバ30−2に転送する。
次に、図2に示す方式において、VTEPの台数が増えた場合を考える。図4は、第1の比較例として、VTEPの台数を増やしたときの構成を例示するブロック図である。
ここでは、図4に示す構成において、仮想サーバ30−1〜30−4がすべて同一VNI(VXLAN Network Identifier)での通信が可能であるとする。このとき、仮想サーバ30−1がブロードキャストパケットを送信すると、パケットは通信路Aを経由する。ここで、BCMC転送サーバ10でパケットがコピーされるため、通信路AにはVTEP20−3およびVTEP20−4宛の2つのパケットが通過する。また、通信路Aが切断された場合、VTEP20−3とVTEP20−4は、ブロードキャストを送信できなくなる。通信路Aがネットワーク全体に影響を及ぼす問題を解決するため、本実施形態では、図4の構成の代わりに、以下に詳述する図5の構成を採用する。
図5は、本実施形態のデータ転送システムにおいて、VTEPの台数を増やしたときの構成を例示するブロック図である。
図5を参照すると、本実施形態のデータ転送システムでは、BCMC転送サーバはVTEPのドメイン(ないしグループ)ごとに配置される。図5の場合、BCMC転送サーバ10−1はVTEP20−1およびVTEP20−2と接続され、BCMCサーバ10−2はVTEP20−3およびVTEP20−4と接続される。また、送信先記憶部14−1、14−2が保持するテーブルに対して、送信IDと受信IDの欄を追加する。図6は、BCMC転送サーバ10−1の送信先記憶部14−1が保持するテーブルを例示する。一方、図7は、BCMC転送サーバ10−2の送信先記憶部14−2が保持するテーブルを例示する。
BCMC転送サーバ10−1およびBCMC転送サーバ10−2が、それぞれ、図6および図7のテーブルを用いて図2の場合と同様の処理を行う場合を考える。まず、VTEP20−1は仮想サーバ30−1から送信されたパケットをカプセル化してBCMC転送サーバ10−1に送信する。次に、BCMC転送サーバ10−1は、図6のテーブルに従って、VTEP20−1を除いて、VTEP20−2およびBCMC転送サーバ10−2にパケットを送信する。次に、BCMC転送サーバ10−2は、図7のテーブルに従って処理を行う。ここで、送信元のIPアドレスはVTEP20−1であるため、BCMC転送サーバ10−2はBCMC転送サーバ10−1は送信元ではないと判断し、BCMC転送サーバ10−1に対しても、コピーしたパケットを転送する。すると、パケットを受信したBCMC転送サーバ10−1は、さらにパケットをコピーしてBCMC転送サーバ10−2に送信する。
このように、BCMC転送サーバ10−1とBCMC転送サーバ10−2の間で、無限に送受信が繰り返されてしまう。これを回避するために、本実施形態では、送信先記憶部14−1、14−2が保持するテーブルとして、図6および図7に示すように、送信IDおよび受信IDの欄を追加する。また、BCMC転送サーバ10−1、10−2は、送信IDおよび受信IDを用いた処理を追加的に実施する。なお、追加的に実施する処理の内容については、以下の動作の説明において詳述する。
次に、図面を参照しつつ、本実施形態のデータ転送システム(図2または図5)の動作、および、第1の比較例(図4)の動作について説明する。
図8は、本実施形態のデータ転送システム(図2の構成の場合)の動作を説明するための図である。図8を参照すると、VTEP20−1のパケット送受信部28−1は、仮想サーバ30−1からVTEP20−1にブロードキャスト送信されたメッセージを受信し、カプセル化部26−1に送信する(ステップA1)。
VTEP20−1のカプセル化部26−1は、受信したメッセージについてVXLANのカプセル化を施し、転送部22−1に送出する(ステップA2)。
VTEP20−1の転送部22−1は、標準のVXLANプロトコルとは異なり、カプセル化したパケットの宛先をVXLAN用のマルチキャストIPアドレスではなく、BCMC転送サーバ10のユニキャストIPアドレスに設定する。転送部22−1は、生成したユニキャストパケットを、BCMC転送サーバ10宛に送信する(ステップA3)。
BCMC転送サーバ10の転送部12は、パケットを受信し、受信パケットのVNI(VXLAN Network Identifier)をキーとして、VNIに属するIPアドレスを送信先記憶部14に問い合わせる(ステップA4)。図3は、送信先記憶部14が保持するテーブルを例示する。
転送部12は、問い合わせによって得られたすべての外部ノードのIPアドレス宛にパケットを送信するため、パケットをコピーして、個別にユニキャストパケットを送信する(ステップA5)。ただし、転送部12は、送信元のIPアドレスと同一のIPアドレスにはパケットを送信しない。また、転送部12は、送信する際に、送信元のIPアドレスを変更しない。
メッセージを届けられる側のVTEP20−2において、転送部22−2は、上記ユニキャストパケットを受信し、カプセル化部26−2に送信する(ステップA6)。
VTEP20−2のカプセル化部26−2は、受信したパケットのカプセル化を解除して、パケット送受信部28−2に送信する(ステップA7)。
VTEP20−2のパケット送受信部28−2は、仮想サーバ30−2にパケットを送信する(ステップA8)。
次に、図4に示した第1の比較例の動作について説明する。図4において、仮想サーバ30−1〜30−4がすべて同一のVNIでの通信が可能であるとする。このとき、仮想サーバ30−1がブロードキャストパケットを送信すると、図2の場合と同様の処理が発生する。
図9は、図4に示した第1の比較例において、BCMC転送サーバ10の送信先記憶部14が保持するテーブルを例示する。ここで、上記ステップA5の処理を行うと、通信路Aには、VTEP30−3およびVTEP30−4宛の2つのパケットが通過する。また、通信路Aが切断された場合、VTEP30−3とVTEP30−4はブロードキャストを送信できなくなる。かかる問題を解決するため、本実施形態では、VTEPが複数のドメイン(ないしグループ)に跨る場合、図5に示す構成を採用する。
図10は、本実施形態のデータ転送システム(図5に示す構成の場合)における動作例を説明するための図である。図10を参照すると、VTEP20−1のパケット送受信部28−1は、仮想サーバ30−1からVTEP20−1にブロードキャスト送信されたメッセージを受信し、カプセル化部26−1に送信する(ステップB1)。
VTEP20−1のカプセル化部26−1は、受信したメッセージに対してVXLANのカプセル化を施し、転送部22−1に送出する(ステップB2)。
VTEP20−1の転送部22−1は、標準のVXLANプロトコルとは異なり、カプセル化したパケットの宛先をVXLAN用のマルチキャストIPアドレスではなく、BCMC転送サーバ10−1のユニキャストIPアドレスに設定する。転送部22−1は、生成したユニキャストパケットをBCMC転送サーバ10−1宛に送信する(ステップB3)。
BCMC転送サーバ10−1の転送部12−1は、パケットを受信し、受信パケットのVNI(VXLAN Network Identifier)をキーとして、VNIに属するIPアドレスを送信先記憶部14−1に問い合わせる(ステップB4)。図6は、送信先記憶部14−1が保持するテーブルを例示する。
転送部12−1は、問い合わせによって得られたすべての外部ノードのIPアドレス宛にパケットを送信するため、パケットをコピーして、個別にユニキャストパケットを送信する(ステップB5)。ただし、転送部12−1は、送信元のIPアドレスと同一のIPアドレス、または、送信元のポート番号が受信IDと一致した場合、そのIPアドレスにはパケットを送信しない。また、転送部12−1は、送信する際に、送信元のIPアドレスを変更しない。さらに、転送部12−1は、送信する場合に、送信IDに値が含まれている宛先に対しては、送信元ポート番号を送信IDに変更して送信する。
図6を参照すると、BCMC転送サーバ10−2のIPアドレステーブルには送信IDが含まれている。そこで、転送部12−1は、BCMC転送サーバ10−2宛のパケットの送信元ポート番号を「51111」に変更し、変更後のパケットをBCMC転送サーバ10−2に送信する。
BCMC転送サーバ10−2の転送部12−2は、BCMC転送サーバ10−1からのパケットを受信し、受信パケットのVNI(VXLAN Network Identifier)をキーとして、VNIに属するIPアドレスを送信先記憶部14−2に問い合わせる(ステップB6)。図7は、送信先記憶部14−2が保持するテーブルを例示する。
転送部12−2は、問い合わせによって得られたすべての外部ノードのIPアドレス宛にパケットを送信するため、パケットをコピーし、個別にユニキャストパケットを送信する(ステップB7)。ただし、転送部12−2は、送信元のIPアドレスと同一のIPアドレス、または、送信元のポート番号が受信IDと一致した場合、そのIPアドレスにはパケットを送信しない。また、転送部12−2は、送信する際に、送信元のIPアドレスを変更しない。さらに、転送部12−2は、送信する場合に送信IDに値が含まれている宛先に対して、送信元ポート番号を「52222」に変更して送信する。
図7を参照すると、パケットの送信元ポート番号は「51111」であるため、転送部12−2は、BCMC転送サーバ10−1宛にはパケットを転送しない。
メッセージが届けられる側のVTEP20−3において、転送部22−3は、ユニキャストパケットを受信し、カプセル化部26−3に送信する(ステップB8)。
VTEP20−3のカプセル化部26−3は、カプセル化を解除してパケット送受信部28−3に送信する(ステップB9)。
VTEP20−3のパケット送受信部28−3は、仮想サーバ30−3にパケットを送信する(ステップB10)。
本実施形態のデータ転送システムによると、VXLANにおいてマルチキャストが不要となり、かつ、通信路Aを経由するパケット数を第1の比較例よりも削減することができる。
また、本実施形態のデータ転送システムによると、通信路Aの障害時に、BCMC転送サーバ毎のドメイン(ないしグループ)においてブロードキャスト送受信を継続することができる。
さらに、本実施形態のデータ転送システムによると、パケットに対して別途新たなパラメータを追加する必要がないため、関連技術の方式と比較してパケットサイズが増大するおそれもない。
また、本実施形態のデータ転送システムによると、BCMC転送サーバが連携する上で、BCMCサーバとVTEPに対してパケット通信に基づいて情報をやりとりする新たな処理を追加する必要もない。したがって、本実施形態に係るデータ転送システムは、関連技術に対して僅かな変更を施すことにより、実現することができる。
<他の実施形態>
第1の実施形態では、簡単のため、BCMC転送サーバが2台の場合について説明した。ただし、3台目以降のBCMC転送サーバも同様の方式で追加することができる。また、第1の実施形態では、プロトコルとしてVXLANを用いた場合について説明したが、本発明はこれに限定されない。すなわち、本発明は、仮想ネットワークを生成するために用いられるオーバレイを構成するトンネリングプロトコルにおけるブロードキャストおよびマルチキャストの転送方式に適用することができる。
なお、本発明において、さらに下記の形態が可能である。
[形態1]
上記第1の態様に係るデータ転送システムのとおりである。
[形態2]
前記第1の転送部は、前記パケットの送信元ポート番号を所定の番号に変更して、前記第2のデータ転送サーバに転送する、
形態1に記載のデータ転送システム。
[形態3]
前記第1のデータ転送サーバは、前記第2のデータ転送サーバと前記所定の番号を関連付けて保持する第1の記憶部を有し、
前記第1の転送部は、前記第1の記憶部を参照して、前記パケットの送信元ポート番号を前記所定の番号に変更する、
形態2に記載のデータ転送システム。
[形態4]
前記第1の記憶部は、前記第1のドメインに属するトンネル終端ポイントおよび前記第2のデータ転送サーバの各装置と、該各装置のIP(Internet Protocol)アドレスとを関連付けて保持する、
形態3に記載のデータ転送システム。
[形態5]
前記第2の転送部は、前記パケットの送信元ポート番号に基づいて、前記パケットの転送元のデータ転送サーバを識別する、
形態2ないし4のいずれか一に記載のデータ転送システム。
[形態6]
前記第2のデータ転送サーバは、前記第1のデータ転送サーバと前記所定の番号を関連付けて保持する第2の記憶部を有し、
前記第2の転送部は、前記第2の記憶部を参照して、前記パケットの転送元のデータ転送サーバを識別する、
形態5に記載のデータ転送システム。
[形態7]
前記第2の記憶部は、前記第2のドメインに属するトンネル終端ポイントおよび前記第1のデータ転送サーバの各装置と、該各装置のIPアドレスとを関連付けて保持する、
形態6に記載のデータ転送システム。
[形態8]
上記第2の態様に係るデータ転送サーバのとおりである。
[形態9]
前記第1の転送部は、前記パケットの送信元ポート番号を所定の番号に変更して、前記第2のデータ転送サーバに転送する、
形態8に記載のデータ転送サーバ。
[形態10]
前記第2のデータ転送サーバと前記所定の番号を関連付けて保持する第1の記憶部を備え、
前記第1の転送部は、前記第1の記憶部を参照して、前記パケットの送信元ポート番号を前記所定の番号に変更する、
形態9に記載のデータ転送サーバ。
[形態11]
前記第1の記憶部は、前記第1のドメインに属するトンネル終端ポイントおよび前記第2のデータ転送サーバの各装置と、該各装置のIP(Internet Protocol)アドレスとを関連付けて保持する、
形態10に記載のデータ転送サーバ。
[形態12]
上記第3の態様に係るデータ転送方法のとおりである。
[形態13]
前記第1のデータ転送サーバが、前記パケットの送信元ポート番号を所定の番号に変更するステップを含む、
形態12に記載のデータ転送方法。
[形態14]
前記第2のデータ転送サーバが、前記パケットの送信元ポート番号に基づいて、前記パケットの転送元のデータ転送サーバを識別するステップを含む、
形態13に記載のデータ転送方法。
[形態15]
上記第4の態様に係るプログラムのとおりである。
[形態16]
前記パケットの送信元ポート番号を所定の番号に変更する処理を前記コンピュータに実行させる、
形態15に記載のプログラム。
なお、上記特許文献および非特許文献の全開示内容は、本書に引用をもって繰り込み記載されているものとする。本発明の全開示(請求の範囲を含む)の枠内において、さらにその基本的技術思想に基づいて、実施形態の変更・調整が可能である。また、本発明の全開示の枠内において種々の開示要素(各形態の各要素、各実施形態の各要素、各図面の各要素等を含む)の多様な組み合わせ、ないし、選択が可能である。すなわち、本発明は、請求の範囲を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。特に、本書に記載した数値範囲については、当該範囲内に含まれる任意の数値ないし小範囲が、別段の記載のない場合でも具体的に記載されているものと解釈されるべきである。
10、10−1、10−2 BCMC転送サーバ
12、12−1、12−2 転送部
14、14−1、14−2 送信先記憶部
20−1〜20−4 VTEP
22−1〜22−4 転送部
24−1〜24−4 送信先記憶部
26−1〜26−4 カプセル化部
28−1〜28−4 パケット送受信部
30−1〜30−4 仮想サーバ
40−1、40−2 ドメイン
50−1、50−2 データ転送サーバ
60−1〜60−4 トンネル終端ポイント
A 通信路

Claims (10)

  1. 第1のドメインに属するトンネル終端ポイントに対して設けられた第1のデータ転送サーバと、
    第2のドメインに属するトンネル終端ポイントに対して設けられた第2のデータ転送サーバと、を備え、
    前記第1のデータ転送サーバは、前記第1のドメインに属するトンネル終端ポイントからパケットを受信すると、前記第2のデータ転送サーバ、および、前記第1のドメインに属するトンネル終端ポイントのうちの前記パケットの転送元以外のトンネル終端ポイントに対して、前記パケットを転送する第1の転送部を有し、
    前記第2のデータ転送サーバは、前記第1のデータ転送サーバから前記パケットを受信すると、前記第2のドメインに属するトンネル終端ポイントに対して、前記パケットを転送する第2の転送部を有する、
    ことを特徴とするデータ転送システム。
  2. 前記第1の転送部は、前記パケットの送信元ポート番号を所定の番号に変更して、前記第2のデータ転送サーバに転送する、
    請求項1に記載のデータ転送システム。
  3. 前記第1のデータ転送サーバは、前記第2のデータ転送サーバと前記所定の番号を関連付けて保持する第1の記憶部を有し、
    前記第1の転送部は、前記第1の記憶部を参照して、前記パケットの送信元ポート番号を前記所定の番号に変更する、
    請求項2に記載のデータ転送システム。
  4. 前記第1の記憶部は、前記第1のドメインに属するトンネル終端ポイントおよび前記第2のデータ転送サーバの各装置と、該各装置のIP(Internet Protocol)アドレスとを関連付けて保持する、
    請求項3に記載のデータ転送システム。
  5. 前記第2の転送部は、前記パケットの送信元ポート番号に基づいて、前記パケットの転送元のデータ転送サーバを識別する、
    請求項2ないし4のいずれか1項に記載のデータ転送システム。
  6. 前記第2のデータ転送サーバは、前記第1のデータ転送サーバと前記所定の番号を関連付けて保持する第2の記憶部を有し、
    前記第2の転送部は、前記第2の記憶部を参照して、前記パケットの転送元のデータ転送サーバを識別する、
    請求項5に記載のデータ転送システム。
  7. 前記第2の記憶部は、前記第2のドメインに属するトンネル終端ポイントおよび前記第1のデータ転送サーバの各装置と、該各装置のIPアドレスとを関連付けて保持する、
    請求項6に記載のデータ転送システム。
  8. 第1のドメインに属するトンネル終端ポイントに対して設けられた第1のデータ転送サーバであって、
    前記第1のドメインに属するトンネル終端ポイントからパケットを受信すると、第2のドメインに属するトンネル終端ポイントに対して設けられた第2のデータ転送サーバ、および、前記第1のドメインに属するトンネル終端ポイントのうちの前記パケットの転送元以外のトンネル終端ポイントに対して、前記パケットを転送する第1の転送部を備え、
    前記第2のデータ転送サーバは、前記第1のデータ転送サーバから前記パケットを受信すると、前記第2のドメインに属するトンネル終端ポイントに対して、前記パケットを転送する、
    ことを特徴とするデータ転送サーバ。
  9. 第1のドメインに属するトンネル終端ポイントに対して設けられた第1のデータ転送サーバが、前記第1のドメインに属するトンネル終端ポイントからパケットを受信するステップと、
    第2のドメインに属するトンネル終端ポイントに対して設けられた第2のデータ転送サーバ、および、前記第1のドメインに属するトンネル終端ポイントのうちの前記パケットの転送元以外のトンネル終端ポイントに対して、前記パケットを転送するステップと、
    前記第2のデータ転送サーバが、前記第1のデータ転送サーバから前記パケットを受信すると、前記第2のドメインに属するトンネル終端ポイントに対して、前記パケットを転送するステップと、を含む、
    ことを特徴とするデータ転送方法。
  10. 第1のドメインに属するトンネル終端ポイントに対して設けられた第1のデータ転送サーバに設けられたコンピュータに対して、
    前記第1のドメインに属するトンネル終端ポイントからパケットを受信する処理と、
    第2のドメインに属するトンネル終端ポイントに対して設けられた第2のデータ転送サーバ、および、前記第1のドメインに属するトンネル終端ポイントのうちの前記パケットの転送元以外のトンネル終端ポイントに対して、前記パケットを転送する処理と、を実行させ、
    前記第2のデータ転送サーバは、前記第1のデータ転送サーバから前記パケットを受信すると、前記第2のドメインに属するトンネル終端ポイントに対して、前記パケットを転送する、
    ことを特徴とするプログラム。
JP2014117976A 2014-06-06 2014-06-06 データ転送システム、データ転送サーバ、データ転送方法、および、プログラム Active JP6379702B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2014117976A JP6379702B2 (ja) 2014-06-06 2014-06-06 データ転送システム、データ転送サーバ、データ転送方法、および、プログラム
EP15802330.9A EP3154228A4 (en) 2014-06-06 2015-06-05 Data transfer system, data transfer server, data transfer method, and program recording medium
PCT/JP2015/002836 WO2015186366A1 (ja) 2014-06-06 2015-06-05 データ転送システム、データ転送サーバ、データ転送方法、および、プログラム記録媒体
US15/316,311 US10177935B2 (en) 2014-06-06 2015-06-05 Data transfer system, data transfer server, data transfer method, and program recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014117976A JP6379702B2 (ja) 2014-06-06 2014-06-06 データ転送システム、データ転送サーバ、データ転送方法、および、プログラム

Publications (2)

Publication Number Publication Date
JP2015231212A true JP2015231212A (ja) 2015-12-21
JP6379702B2 JP6379702B2 (ja) 2018-08-29

Family

ID=54766449

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014117976A Active JP6379702B2 (ja) 2014-06-06 2014-06-06 データ転送システム、データ転送サーバ、データ転送方法、および、プログラム

Country Status (4)

Country Link
US (1) US10177935B2 (ja)
EP (1) EP3154228A4 (ja)
JP (1) JP6379702B2 (ja)
WO (1) WO2015186366A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10778662B2 (en) * 2018-10-22 2020-09-15 Cisco Technology, Inc. Upstream approach for secure cryptography key distribution and management for multi-site data centers
US11146634B2 (en) * 2019-04-25 2021-10-12 International Business Machines Corporation Storage pool isolation
EP4007221A4 (en) 2020-06-23 2022-11-23 NEC Corporation COMMUNICATIONS SYSTEM, COMMUNICATIONS DEVICE, COMMUNICATIONS METHOD, AND COMPUTER READABLE NON-TRANSITORY MEDIA

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001230774A (ja) * 2000-02-17 2001-08-24 Fujitsu Ltd パケット変換装置およびパケット変換方法
JP2009212739A (ja) * 2008-03-04 2009-09-17 Nec Corp データ処理システム、データ処理方法、及びデータ処理プログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7155740B2 (en) * 2000-07-13 2006-12-26 Lucent Technologies Inc. Method and apparatus for robust NAT interoperation with IPSEC'S IKE and ESP tunnel mode
GB0107638D0 (en) 2001-03-27 2001-05-16 Marconi Comm Ltd Access networks
US7028183B2 (en) * 2001-11-13 2006-04-11 Symantec Corporation Enabling secure communication in a clustered or distributed architecture
US7139828B2 (en) * 2002-08-30 2006-11-21 Ip Dynamics, Inc. Accessing an entity inside a private network
US7478427B2 (en) * 2003-05-05 2009-01-13 Alcatel-Lucent Usa Inc. Method and apparatus for providing adaptive VPN to enable different security levels in virtual private networks (VPNs)
US7864686B2 (en) 2004-05-25 2011-01-04 Cisco Technology, Inc. Tunneling scheme for transporting information over a cable network
EP2580894B1 (en) 2010-06-08 2017-08-30 Brocade Communications Systems, Inc. Switch, system and method for forwarding packets
US9236935B2 (en) * 2013-04-10 2016-01-12 Quortus Limited System and method for data transmission

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001230774A (ja) * 2000-02-17 2001-08-24 Fujitsu Ltd パケット変換装置およびパケット変換方法
JP2009212739A (ja) * 2008-03-04 2009-09-17 Nec Corp データ処理システム、データ処理方法、及びデータ処理プログラム

Also Published As

Publication number Publication date
US10177935B2 (en) 2019-01-08
JP6379702B2 (ja) 2018-08-29
EP3154228A4 (en) 2018-01-17
EP3154228A1 (en) 2017-04-12
US20180109401A1 (en) 2018-04-19
WO2015186366A1 (ja) 2015-12-10

Similar Documents

Publication Publication Date Title
EP3275132B1 (en) Scalable handling of bgp route information in vxlan with evpn control plane
JP5991424B2 (ja) パケット書換装置、制御装置、通信システム、パケット送信方法及びプログラム
US9225641B2 (en) Communication between hetrogenous networks
JP5862769B2 (ja) 通信システム、制御装置、通信方法及びプログラム
JP6544401B2 (ja) パケット転送装置、制御装置、通信システム、通信方法及びプログラム
CN107465590A (zh) 网络基础设施系统、路由网络业务的方法及计算机可读介质
CN104335537A (zh) 用于层2多播多路径传送的系统和方法
US9504016B2 (en) Optimized multicast routing in a Clos-like network
JP2017511069A5 (ja)
CN104246701A (zh) 用于基于源路由在不同无限带宽子网间路由流量的系统和方法
CN102804693A (zh) 用于在ip网络上实现l2vpn的方法和设备
US20150263862A1 (en) Communication system, control apparatus, communication control method, transfer control method, and transfer control program
US11133947B2 (en) Multicast routing
JPWO2013141340A1 (ja) 制御装置、通信装置、通信システム、通信方法及びプログラム
Yamanaka et al. AutoVFlow: Autonomous virtualization for wide-area OpenFlow networks
JP6064989B2 (ja) 制御装置、通信システム、ノード制御方法及びプログラム
JP6379702B2 (ja) データ転送システム、データ転送サーバ、データ転送方法、および、プログラム
JPWO2013176262A1 (ja) パケット転送システム、制御装置、パケット転送方法及びプログラム
CN112822097A (zh) 报文转发的方法、第一网络设备以及第一设备组
KR102001487B1 (ko) 소프트웨어 정의 네트워킹 제어 방법 및 이를 수행하는 컴퓨팅 장치
JP6438313B2 (ja) パケット振り分け装置およびパケット振り分け方法
JP6464631B2 (ja) ネットワーク制御システム、ルータ仮想化装置、ネットワーク制御方法、ルータ仮想化方法およびプログラム
JP2014160907A (ja) 通信システムおよびプログラム
US10812446B1 (en) Dynamic host configuration across multiple sites in software defined access networks
JP5833184B2 (ja) ネットワーク輻輳回避システム及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180326

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180703

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180716

R150 Certificate of patent or registration of utility model

Ref document number: 6379702

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150