CN107071088A - 逻辑l3路由 - Google Patents

逻辑l3路由 Download PDF

Info

Publication number
CN107071088A
CN107071088A CN201710263367.6A CN201710263367A CN107071088A CN 107071088 A CN107071088 A CN 107071088A CN 201710263367 A CN201710263367 A CN 201710263367A CN 107071088 A CN107071088 A CN 107071088A
Authority
CN
China
Prior art keywords
packet
exchange component
logic
managed exchange
managed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710263367.6A
Other languages
English (en)
Other versions
CN107071088B (zh
Inventor
T·考珀内恩
张荣华
M·卡萨多
P·萨卡尔
J·E·格鲁斯四世
D·J·温德兰德特
M·马哈杰安
J·皮提特
K·E·埃米顿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nicira Inc
Original Assignee
Nicira Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nicira Inc filed Critical Nicira Inc
Publication of CN107071088A publication Critical patent/CN107071088A/zh
Application granted granted Critical
Publication of CN107071088B publication Critical patent/CN107071088B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/74Address processing for routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/02Topology update or discovery
    • H04L45/04Interdomain routing, e.g. hierarchical routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/54Organization of routing tables
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/12Avoiding congestion; Recovering from congestion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/12Avoiding congestion; Recovering from congestion
    • H04L47/125Avoiding congestion; Recovering from congestion by balancing the load, e.g. traffic engineering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/09Mapping addresses
    • H04L61/10Mapping addresses of different types
    • H04L61/103Mapping addresses of different types across network layers, e.g. resolution of network layer into physical layer addresses or address resolution protocol [ARP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/09Mapping addresses
    • H04L61/25Mapping addresses of the same type
    • H04L61/2503Translation of Internet protocol [IP] addresses
    • H04L61/256NAT traversal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/09Mapping addresses
    • H04L61/25Mapping addresses of the same type
    • H04L61/2503Translation of Internet protocol [IP] addresses
    • H04L61/2592Translation of Internet protocol [IP] addresses using tunnelling or encapsulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本公开涉及逻辑L3路由。描述了一种用于在第一逻辑域中的源机器与第二逻辑域中的目的地机器之间逻辑地路由分组的新颖方法。该方法将受管理交换元件配置为第二级受管理交换元件。该方法在包括第二级受管理交换元件的主机中配置路由器。该方法将第二级受管理交换元件与路由器通信地耦合。当路由器从第一逻辑域接收到被定址到第二逻辑域的分组时,该方法使路由器路由分组。

Description

逻辑L3路由
本申请是基于申请号为201280046542.1、申请日为2012年8月17日、发明名称为“分布式逻辑L3路由”的专利申请的分案申请。
背景技术
许多当前的企业具有包括交换机、集线器、路由器、服务器、工作站和其它联网设备的大型且尖端的网络,这些网络支持多种连接、应用和系统。计算机网络的增加的尖端性,包括虚拟机迁移、动态工作负载、多租赁和依客户而定的服务质量和安全配置要求网络控制的更好范式。网络在传统上通过对单独组件的低级别配置来管理。网络配置经常取决于底层网络:例如,利用访问控制列表(“ACL”)条目阻止用户的访问要求知道用户的当前IP地址。更复杂的任务要求更广泛的网络知识:迫使访客用户的端口80流量穿过HTTP代理要求知道当前的网络拓扑和每个访客的位置。此过程在网络交换元件(switching element)跨越多个用户被共享的情况下逐渐困难。
作为响应,存在朝着一种被称为软件定义网络(SDN)的新的网络控制范式的日益发展。在SDN范式中,在网络中的一个或多个服务器上运行的网络控制器控制、维护并实现逐个用户地管治共享的网络交换元件的转发行为的控制逻辑。作出网络管理决策经常要求关于网络状态的知识。为了促成管理决策的作出,网络控制器创建并维护网络状态的视图并提供应用编程接口,在该应用编程接口上管理应用可访问网络状态的视图。
维护大型网络(包括数据中心和企业网络)二者的一些主要目标是可扩展性(scalability)、移动性和多租赁。用于处理这些目标中的一个的许多方法都导致妨碍其它目标中的至少一个。例如,可以容易地在L2域内为虚拟机提供网络移动性,但L2域不能扩展到大的尺寸。另外,保持用户隔离大大地使移动性复杂化。这样,需要能够满足可扩展性、移动性和多租赁目标的改进方案。
发明内容
一些实施例在一些情况下将逻辑路由建模为由实现在L3域中操作的逻辑数据路径集合(LDPS)的逻辑路由器互连在L2域中操作的两个或更多个逻辑数据路径(LDP)集合的行为。从一个逻辑L2域穿越到另一个逻辑L2域的分组在一些实施例中将采取以下四个步骤。下文中按照网络控制系统实现的逻辑处理操作来描述这四个步骤。然而,要理解,这些操作由网络的受管理交换元件基于由网络控制系统产生的物理控制平面数据来执行。
第一,将通过发端逻辑L2域的L2表管道来处理分组。该管道将以目的地媒体访问控制(MAC)地址被转发到与逻辑路由器的逻辑端口附接的逻辑端口结束。
第二,将通过逻辑路由器的L3数据路径来处理分组,这同样通过经由此路由器的L3表管道发送它来完成。在一些实施例中在路由器的L3数据路径中跳过物理路由器中常见的L2查找阶段,因为逻辑路由器将仅接收要求路由的分组。
在一些实施例中,L3转发决策将使用前缀(由逻辑路由器的逻辑控制平面配设的转发信息库(FIB)条目)。在一些实施例中,控制应用用于接收逻辑控制平面数据,并将此数据转换成逻辑转发平面数据,该逻辑转发平面数据随后被提供给网络控制系统。对于L3转发决策,一些实施例使用前缀FIB条目来实现最长的前缀匹配。
结果,L3路由器将把分组转发到与目的地L2LDPS相“连接”的逻辑端口。在将分组进一步转发到该LDPS之前,L3路由器将把发端MAC地址改变成在其域中所定义的那个,以及将把目的地IP地址解析成目的地MAC地址。该解析在一些实施例中由L3数据管道的最末“IP输出”阶段执行。同一管道将递减TTL并更新检验和(并且如果TTL达到零则以ICMP响应)。
应当注意,一些实施例在将经处理的分组馈送到下一LDPS之前改写MAC地址,因为如果没有这个改写,则在下一LDPS处可得到不同的转发决策。还应当注意,即使传统的路由器利用ARP来执行目的地IP地址的解析,但一些实施例在L3逻辑路由器中不将ARP用于此目的,因为只要下一跳是逻辑L2数据路径,这个解析就保持在虚拟化应用的内部。
第三,将通过目的地逻辑L2域的L2表管道来处理分组。目的地L2表管道确定其应当发送分组的逻辑出口端口。在未知MAC地址的情况下,这个管道将通过依赖于一些分布式查找机制来解析MAC地址位置。在一些实施例中,受管理交换元件依赖于MAC学习算法,例如,它们洪泛未知分组。在这些或其它实施例中,MAC地址位置信息也可通过其它机制获得,例如通过带外获得。如果这种机制在一些实施例中可用,则最末的逻辑L2表管道使用此机制来获得MAC地址位置。
第四,分组被发送到表示逻辑端口附接的附接到物理端口的逻辑端口。在这个阶段,如果端口是点对点媒介(例如,虚拟网络接口,VIF),则除了将分组发送到该端口以外就没有什么要做的了。然而,如果最末的LDPS是L3路由器并且因此附接是物理L3子网,则附接点在一些实施例中在将分组送出之前通过使用ARP来解析目的地IP地址。在该情况下,源MAC地址在VIF的情况下将依出口而定,而不是逻辑MAC接口地址。在其它实施例中,利用ARP解析目的地IP地址在第二步骤期间由L3逻辑路由器执行。
在上述示例中,仅存在互连逻辑L2数据路径的单个逻辑路由器,但没有什么对拓扑进行限制。普通技术人员将认识到,对于更丰富的拓扑可互连更多的LDP集合。
在一些实施例中,控制应用允许按照指明逻辑L3管道的一个或多个表来定义L3特定的逻辑状态。管理LDPS管道的相应逻辑控制平面或者可依赖于静态路由配置,或者可通过标准的路由协议与其它LDP集合对等。
在一些实施例中,虚拟化应用定义上述的四步L2/L3分组处理成为物理控制平面数据的物理实现,该物理控制平面数据当被受管理交换元件转换成物理转发数据时,实现全部或主要在第一跳受管理边缘交换元件处执行的逻辑管道执行的序列。为了维持物理流量的本地性,第一跳执行该一系列管道(具有所有要求的状态)并直接地将流量向物理网络中的最终出口位置发送。当使用快捷隧道时,虚拟化应用通过将快捷隧道网超出单个LDPS扩展到所有互连的LDP集合的端口的并集来利用逻辑L3数据路径互连逻辑L2数据路径。当所有操作都在第一跳执行时,第一跳元件通常能够访问分组所穿越的逻辑网络的所有状态。
以上发明内容部分旨在用作对本发明的一些实施例的简要介绍。其并不意欲成为对本文档中公开的所有发明主题的介绍或概述。接下来的具体实施方式部分和具体实施方式部分中参考的附图将进一步描述发明内容部分中描述的实施例以及其它实施例。因此,为了理解本文档描述的所有实施例,需要全面查阅发明内容部分、具体实施方式部分和附图。另外,要求保护的主题不受发明内容部分、具体实施方式部分和附图中的说明性细节限制,而应由所附权利要求来限定,因为要求保护的主题可以其它具体的形式实现,而不脱离这些主题的精神。
附图说明
本发明的新颖特征在所附权利要求中阐明。然而,为了解释的目的,本发明的若干实施例在以下附图中阐明。
图1概念性示出了一些实施例的网络体系结构。
图2概念性示出了一些实施例的用于通过逻辑交换机和逻辑路由器处理网络数据的处理管道。
图3概念性示出了在单个L3路由器中实现逻辑路由器的网络体系结构。
图4概念性示出了在受管理交换元件中实现逻辑路由器的网络体系结构。
图5概念性示出了以分布式方式实现路由器以使得若干受管理交换元件中的每一个在L3路由分组的网络体系结构。
图6概念性示出了上文参考图2描述的逻辑处理管道的示例实现。
图7概念性示出了一些实施例的用于通过逻辑交换机、逻辑路由器和逻辑交换机处理分组的逻辑处理管道。
图8概念性示出了一些实施例的实现逻辑路由器和逻辑交换机的示例网络体系结构。
图9概念性示出了一些实施例的实现逻辑路由器和逻辑交换机的示例网络体系结构。
图10概念性示出了一些实施例的实现逻辑路由器和逻辑交换机的示例网络体系结构。
图11概念性示出了一些实施例的包括受管理交换元件和L3的主机的示例体系结构。
图12概念性示出了受管理交换元件和L3路由器中的逻辑交换机和逻辑路由器的示例实现。
图13A-13C概念性示出了在上文参考图12描述的受管理交换元件和L3路由器中实现的逻辑交换机、逻辑路由器的示例操作。
图14概念性示出了一些实施例执行来转发分组以确定向哪个受管理交换元件发送分组的过程。
图15概念性示出了上文参考图8描述的主机。
图16概念性示出了一过程,一些实施例在第一和第二L3路由器在同一主机中被实现时使用该过程来直接地将分组从第一L3路由器转发到第二L3路由器。
图17概念性示出了上文参考图2描述的逻辑处理管道的示例实现。
图18概念性示出了一些实施例的用于通过一逻辑交换机、一逻辑路由器和另一逻辑交换机处理分组的逻辑处理管道。
图19概念性示出了一些实施例的实现逻辑路由器和逻辑交换机的示例网络体系结构。
图20概念性示出了一些实施例的实现逻辑路由器和逻辑交换机的示例网络体系结构。
图21概念性示出了一些实施例的实现逻辑路由器和逻辑交换机的示例网络体系结构。
图22概念性示出了一些实施例的包括基于流条目实现逻辑路由器的受管理交换元件的主机的示例体系结构。
图23概念性示出了受管理交换元件中的逻辑交换机和逻辑路由器的示例实现。
图24概念性示出了上文参考图23描述的逻辑交换机、逻辑路由器和受管理交换元件的示例操作。
图25概念性示出了上文参考图2描述的逻辑处理管道的示例实现。
图26概念性示出了一些实施例的用于通过一逻辑交换机、一逻辑路由器和另一逻辑交换机处理分组的逻辑处理管道。
图27概念性示出了一些实施例的实现逻辑路由器和逻辑交换机的示例网络体系结构。
图28概念性示出了一些实施例的实现逻辑路由器和逻辑交换机的示例网络体系结构。
图29概念性示出了对接收到的分组执行所有的L2和L3处理以转发和路由的第一跳交换元件的示例。
图30A-30B概念性示出了上文参考图29描述的逻辑交换机、逻辑路由器和受管理交换元件的示例操作。
图31概念性示出了受管理交换元件在其上运行的主机的示例软件体系结构。
图32概念性示出了一些实施例执行来转换网络地址的过程。
图33概念性示出了一些实施例的执行包括NAT操作在内的整个逻辑处理管道的第一跳交换元件。
图34概念性示出了当向受管理交换元件发送返回分组时受管理交换元件不执行逻辑处理管道的示例。
图35概念性示出了一些实施例执行来将分组发送到其地址被NAT的目的地机器的过程。
图36示出了当VM从第一主机迁移到第二主机时将NAT状态从第一主机迁移到第二主机的示例。
图37示出了当VM从第一主机迁移到第二主机时将NAT状态从第一主机迁移到第二主机的另一示例。
图38示出了执行负载均衡的逻辑路由器和逻辑交换机的示例物理实现。
图39示出了执行负载均衡的逻辑路由器和逻辑交换机的另一示例物理实现。
图40示出了执行负载均衡的逻辑路由器和逻辑交换机的还一示例物理实现。
图41概念性示出了在共同提供服务(例如web服务)的机器之间均衡负载的负载均衡守护进程。
图42示出了为不同用户向不同逻辑网络提供DHCP服务的DHCP守护进程。
图43示出了中央DHCP守护进程和若干本地DHCP守护进程。
图44概念性示出了在最末跳交换元件处执行一些逻辑处理的示例。
图45A-45B概念性示出了上文参考图44描述的逻辑交换机、逻辑路由器和受管理交换元件的示例操作。
图46概念性示出了在最末跳交换元件处执行一些逻辑处理的示例。
图47A-47B概念性示出了上文参考图46描述的逻辑交换机、逻辑路由器和受管理交换元件的示例操作。
图48概念性示出了受管理交换元件在其上运行的主机的示例软件体系结构。
图49概念性示出了一些实施例执行来解析网络地址的过程。
图50示出了允许各自运行L3守护进程的若干主机(或VM)避免广播ARP请求的映射服务器。
图51示出了一些实施例执行来维护包括IP和MAC地址的映射的映射表的过程。
图52示出了一些实施例执行来维护包括IP和MAC地址的映射的映射表的过程。
图53概念性示出了一些实施例的控制器实例通过利用诸如nLog的表映射处理器(未示出)对表执行表映射操作来生成流。
图54示出了示例体系结构和用户接口。
图55示出了上文参考图54描述的阶段之前的表。
图56示出了在用户提供逻辑端口的识别符、与端口相关联的IP地址和网络掩码以向逻辑路由器添加逻辑端口之后的表。
图57示出了一组表映射操作的结果。
图58示出了一组表映射操作的结果。
图59示出了在上文参考图54描述的阶段之后的表。
图60示出了一组表映射操作的结果。
图61示出了一组表映射操作的结果。
图62示出了在上文参考图61描述的阶段之后添加到一些表的新的行。
图63示出了在控制应用通过执行如上文参考图55-62描述的表映射操作来生成逻辑数据之后的体系结构。
图64概念性示出了实现本发明的一些实施例的电子系统。
具体实施方式
本发明的一些实施例提供了一种网络控制系统,该网络控制系统允许由物理网络的交换元件来实现逻辑数据路径(LDP)集合(例如逻辑网络)。为了实现LDP集合,一些实施例的网络控制系统从逻辑转发平面数据生成物理控制平面数据。物理控制平面数据随后被推送到受管理(managed)交换元件,在这里其通常被转换成允许受管理交换元件执行其转发决策的物理转发平面数据。基于物理转发数据,受管理交换元件可根据在物理控制平面数据中指明(specify)的逻辑处理规则来处理数据分组。
单个逻辑数据路径集合提供了交换架构以互连多个逻辑端口,这些逻辑端口可附接到物理或虚拟端点。在一些实施例中,这种LDP集合和逻辑端口的创建和使用提供了与虚拟局域网(VLAN)相对应的逻辑服务模型。这个模型在一些实施例中将网络控制系统的操作限制到仅定义逻辑L2交换能力。然而,其它实施例将网络控制系统的操作延伸到逻辑L2交换能力和逻辑L3交换能力两者。
一些实施例的网络控制系统支持以下逻辑L3交换能力。
·逻辑路由。代替对分组只执行L2交换,一些实施例的网络控制系统还定义了物理控制平面数据以引导受管理交换元件在跨越L2广播域(IP子网)时基于因特网协议(IP)地址来转发分组。这种逻辑L3路由解决了L2网络的可扩展性问题。
·网关虚拟化(virtualization)。代替利用单纯的L2接口与外部网络接合,一些实施例的网络控制系统可使用IP接口来与外部网络交互。在一些实施例中,即使当存在去往和来自外部网络的多个物理出口(egress)和入口(ingress)点时,网络控制系统也通过定义单个逻辑网关来定义这种IP接口。从而,一些实施例通过使用网关虚拟化来与外部IP网络接合。
·网络地址转换。可对整个L3子网进行网络地址转换(NAT’ed)。在一些实施例中,逻辑网络使用私有地址并且对于外部网络仅暴露经网络地址转换的IP地址。另外,在一些实施例中,逻辑网络的子网通过NAT互连或使用目的地NAT来实现细粒度应用级路由决策。
·状态过滤。与NAT类似,一些实施例通过使用状态访问控制列表(ACL)来将子网与外部网络隔离。另外,一些实施例将ACL置于逻辑子网之间。
·负载均衡。在一些情况下,逻辑网络用于提供服务。对于这些和其它情况,网络控制系统为应用集群(cluster)提供虚拟IP地址。在一些实施例中,网络控制系统指明使得能够在一组逻辑IP地址上散布到来的应用流量的负载均衡操作。
·DHCP。虽然可以设立虚拟机(VM)来在逻辑网络内提供动态IP地址分配服务,但服务提供商可能更偏好在基础设施级别的动态主机配置协议(DHCP)服务的高效实现。从而,一些实施例的网络控制系统在基础设施级别提供DHCP服务的高效实现。
对于这些L3特征中的每一个的设计将在下文中描述。按照实现来说这些特征很大程度上是正交的,因此普通技术人员将会意识到这些特征不是都必须由一些实施例的网络控制系统提供。在进一步描述这些特征之前,应当提及若干假设。这些假设如下。
·大型网络。跨越多个L2网络的逻辑L3网络将大于逻辑L2网络。一些实施例利用映射化简(map-reduce)分布式处理技术来为10K个服务器那么大的服务器集群解决逻辑L3问题。
·物理流量非本地性(non-locality)。数据中心内的逻辑子网可在数据中心内交换巨大的流量。一些实施例在可能的程度上保留流量本地性。在上文提到的映射化简示例中,流量就端点而言不具有本地性。
·逻辑流量本地性。当涉及到在逻辑子网之间交换的流量时,确实存在本地性。换言之,对于上文提到的映射化简集群,不是每一个逻辑网络都具有客户端。
·功能的放置。如这里通过引用并入的美国专利申请13/177,535中提到的,受管理交换元件在一些实施例中为:(1)物理网络的边缘交换元件(即,与由物理网络连接的虚拟或物理计算设备具有直接连接的交换元件),以及(2)插入在受管理交换元件层级中以简化和/或促成所控制的边缘交换元件的操作的非边缘交换元件。如美国专利申请13/177,535中进一步描述的,边缘交换元件在一些实施例中包括:(1)与由网络连接的虚拟或物理计算设备具有直接连接的交换元件,以及(2)将网络的第一受管理部分连接到网络的第二受管理部分(例如,与第一受管理部分不同的物理位置中的部分)或者连接到网络的未管理部分(例如,连接到企业的内部网络)的集成元件(称为扩展器)。一些实施例理想地在第一受管理边缘交换元件处即在第一跳边缘交换元件处执行逻辑L3路由,这可在也容宿(host)着由物理网络互连的虚拟机的超管理器(hypervisor)中实现。理想情况下,第一跳交换元件执行全部或大部分L3路由,因为一些实施例的网络控制系统可将非边缘交换元件(内部网络)看作只不过是用于互连设备的架构。
下文描述的实施例中的一些是在一种由用于管理一个或多个共享的转发元件的一个或多个控制器(下文也称为控制器实例)所形成的新型分布式网络控制系统中实现的。共享的转发元件在一些实施例中可包括虚拟或物理网络交换机、软件交换机(例如OpenvSwitch)、路由器和/或其它交换设备,以及在这些交换机、路由器和/或其它交换设备之间建立连接的任何其它网络元件(例如负载均衡器等等)。这种转发元件(例如,物理交换机或路由器)在下文中也被称为交换元件。与现成的交换机不同,软件转发元件在一些实施例中是通过将其(一个或多个)交换表和逻辑存储在独立设备(例如独立的计算机)的存储器中来形成的交换机,而在其它实施例中,它是通过将其(一个或多个)交换表和逻辑存储在也执行超管理器和在该超管理器之上的一个或多个虚拟机的设备(例如计算机)的存储器中来形成的交换机。
在一些实施例中,控制器实例允许系统接受来自用户的逻辑数据路径集合并对交换元件进行配置以实现这些逻辑数据路径集合。在一些实施例中,一种类型的控制器实例为执行一个或多个模块的设备(例如通用计算机),这些模块将用户输入从逻辑控制平面转换到逻辑转发平面,然后将逻辑转发平面数据转换成物理控制平面数据。这些模块在一些实施例中包括控制模块和虚拟化模块。控制模块允许用户指明和填充逻辑数据路径集合,而虚拟化模块通过将逻辑数据路径集合映射到物理交换基础设施上来实现指明的逻辑数据路径集合。在一些实施例中,控制和虚拟化应用是两个分开的应用,而在其它实施例中它们是同一应用的一部分。
从对于特定逻辑数据路径集合的逻辑转发平面数据,一些实施例的虚拟化模块生成对于实现逻辑数据路径集合的任何受管理交换元件通用的通用物理控制平面(UPCP)数据。在一些实施例中,此虚拟化模块是作为该特定逻辑数据路径集合的主控制器的控制器实例的一部分。此控制器被称为逻辑控制器。
在一些实施例中,UPCP数据随后被转换成针对每个特定受管理交换元件的定制物理控制平面(CPCP)数据,该转换由作为该特定受管理交换元件的主物理控制器实例的控制器实例进行,或者由该特定受管理交换元件的机箱控制器(chassis controller)进行,这在同时递交的标题为“Chassis Controller”且代理人案卷号为No.NCRA.P0081的美国专利申请**中被进一步描述;这里通过引用并入该同时递交的美国专利申请。当该机箱控制器生成CPCP数据时,该机箱控制器通过物理控制器从逻辑控制器的虚拟化模块获得UPCP数据。
无论是物理控制器还是机箱控制器生成CPCP数据,针对特定受管理交换元件的CPCP数据都需要被传播到该受管理交换元件。在一些实施例中,通过网络信息库(NIB)数据结构来传播CPCP数据,网络信息库数据结构在一些实施例中为面向对象的数据结构。使用NIB数据结构的若干示例在美国专利申请13/177,529和13/177,533中描述,这里通过引用并入这些美国专利申请。如这些申请中所述,NIB数据结构在一些实施例中也用来充当不同的控制器实例之间的通信媒介,并且存储关于逻辑数据路径集合(例如逻辑交换元件)和/或实现这些逻辑数据路径集合的受管理交换元件的数据。
然而,其它实施例不使用NIB数据结构来将CPCP数据从物理控制器或机箱控制器传播到受管理交换元件、在控制器实例之间通信以及存储关于逻辑数据路径集合和/或受管理交换元件的数据。例如,在一些实施例中,物理控制器和/或机箱控制器经由配置协议通过OpenFlow条目和更新与受管理交换元件通信。另外,在一些实施例中,控制器实例使用一个或多个直接通信信道(例如RPC调用)来交换数据。此外,在一些实施例中,控制器实例(例如这些实例的控制和虚拟化模块)按照被写入到关系数据库数据结构中的记录来表达逻辑和/或物理数据。在一些实施例中,此关系数据库数据结构是用于实现控制器实例的一个或多个模块的表映射引擎(称为nLog)的输入和输出表的一部分。
I.逻辑路由
一些实施例在一些情况下将逻辑路由建模为由实现在L3域中操作的LDPS的逻辑路由器互连在L2域中操作的两个或更多个LDP集合的行为。从一个逻辑L2域穿越到另一个逻辑L2域的分组在一些实施例中将采取以下四个步骤。下文中按照网络控制系统实现的逻辑处理操作来描述这四个步骤。然而,要理解,这些操作是由网络的受管理交换元件基于由网络控制系统产生的物理控制平面数据来执行的。
第一,将通过发端逻辑L2域的L2表管道来处理分组。该管道将以目的地媒体访问控制(MAC)地址被转发到与逻辑路由器的逻辑端口附接的逻辑端口结束。
第二,将通过逻辑路由器的L3数据路径来处理分组,这再次通过通过此路由器的L3表管道发送它来完成。在一些实施例中在路由器的L3数据路径中跳过物理路由器中常见的L2查找阶段,因为逻辑路由器将只接收要求路由的分组。
在一些实施例中,L3转发决策将使用由逻辑路由器的逻辑控制平面配设的前缀转发信息库(FIB)条目。在一些实施例中,控制应用用于接收逻辑控制平面数据,并将此数据转换成逻辑转发平面数据,该逻辑转发平面数据随后被提供给网络控制系统。对于L3转发决策,一些实施例使用前缀FIB条目来实现最长的前缀匹配。
结果,L3路由器将把分组转发到与目的地L2LDPS“连接”的逻辑端口。在将分组进一步转发到该LDPS之前,L3路由器将把发端MAC地址改变为在其域中所定义的那个以及把目的地IP地址解析成目的地MAC地址。该解析在一些实施例中由L3数据管道的最末的“IP输出”阶段(stage)执行。同一管道将递减TTL并更新检验和(并且如果TTL达到零则以ICMP响应)。
应当注意,一些实施例在将经处理的分组馈送到下一LDPS之前改写MAC地址,因为如果没有这个改写,则在下一LDPS处可导致不同的转发决策。还应当注意,即使传统的路由器利用ARP来执行目的地IP地址的解析,但一些实施例在L3逻辑路由器中不将ARP用于此目的,因为只要下一跳为逻辑L2数据路径,这个解析就保持在虚拟化应用的内部。
第三,将通过目的地逻辑L2域的L2表管道来处理分组。目的地L2表管道确定其应当发送分组的逻辑出口端口。在未知MAC地址的情况下,这个管道将通过依赖于一些分布式查找机制来解析MAC地址位置。在一些实施例中,受管理交换元件依赖于MAC学习算法,例如,它们洪泛(flood)未知分组。在这些或其它实施例中,MAC地址位置信息也可通过其它机制获得,例如通过带外获得。如果这种机制在一些实施例中可用,则最末的逻辑L2表管道使用此机制来获得MAC地址位置。
第四,分组被发送到表示逻辑端口附接(attachment)的附接到物理端口的逻辑端口。在这个阶段,如果端口是点对点媒体(例如,虚拟网络接口,VIF),则除了将分组发送到该端口以外就没有什么要做的了。然而,如果最末的LDPS为L3路由器并且因此附接为物理L3子网,则附接点在一些实施例中在将分组发送出之前通过使用ARP来解析目的地IP地址。在该情况下,源MAC地址在VIF的情况下将是依出口而定(egress specific)的,而不是逻辑MAC接口地址。在其它实施例中,利用ARP解析目的地IP地址是在第二步骤期间由L3逻辑路由器执行的。
在上述示例中,只存在互连逻辑L2数据路径的单个逻辑路由器,但没有什么限制拓扑。普通技术人员将会认识到,对于更丰富的拓扑可互连更多的LDP集合。
在一些实施例中,控制应用允许按照指明逻辑L3管道的一个或多个表来定义L3特定的逻辑状态。管理LDPS管道的相应逻辑控制平面或者可依赖于静态路由配置,或者可通过标准的路由协议与其它LDP集合对等(peer)。
在一些实施例中,虚拟化应用将上述四步L2/L3分组处理的物理实现定义成物理控制平面数据,该物理控制平面数据当被受管理交换元件转换成物理转发数据时,实现了全部或绝大多数在第一跳受管理边缘交换元件处执行的逻辑管道执行的序列。为了维持物理流量的本地性,第一跳执行该一系列管道(具有所有要求的状态)并直接将流量向物理网络中的最终出口位置发送。当使用快捷(cut short)隧道时,虚拟化应用通过将快捷隧道网(mesh)超出单个LDPS扩展到所有互连的LDP集合的端口的并集(union)来利用逻辑L3数据路径互连逻辑L2数据路径。
当所有事情都在第一跳执行时,第一跳元件通常能够访问分组所穿越的逻辑网络的所有状态。第一跳交换元件处的逻辑管道的执行的状态的散播(dessemination)(及其扩展含义)在下文进一步描述。
图1概念性示出了一些实施例的网络体系结构100。具体而言,此图示出了在两个LDP集合(例如逻辑网络)150和155之间路由分组的逻辑路由器105。如图所示,网络体系结构100包括逻辑路由器105、逻辑交换机110和115以及机器120-145。
逻辑交换机110为美国专利申请13/177,535中描述的逻辑交换机(或逻辑交换元件)。逻辑交换机110是跨越若干受管理交换元件(未示出)而实现的。逻辑交换机110在L2(第2层)在机器120-130之间路由网络流量。也就是说,逻辑交换机110基于逻辑交换机110具有的一个或多个转发表(未示出)作出交换决策以在机器120-130之间在数据链路层路由网络数据。逻辑交换机110与若干其它逻辑交换机(未示出)一起为逻辑网络150路由网络流量。逻辑交换机115是另一逻辑交换机。逻辑交换机115为逻辑网络155在机器135-145之间路由流量。
逻辑路由器在一些实施例中在不同的逻辑网络之间在L3(第3层—网络层)路由流量。具体而言,逻辑路由器基于一组路由表在两个或更多个逻辑交换机之间路由网络流量。在一些实施例中,逻辑路由器在单个受管理交换元件中实现,而在其它实施例中,逻辑路由器以分布式方式在若干不同的受管理交换元件中实现。这些不同实施例的逻辑路由器将在下文中进一步详细描述。逻辑路由器105在逻辑网络150和155之间在L3路由网络流量。具体而言,逻辑路由器105在两个逻辑交换机110和115之间路由网络流量。
机器120-145是能够交换数据分组的机器。例如,每个机器120-145具有网络接口控制器(NIC),使得在机器120-145上执行的应用能够通过逻辑交换机110和115和逻辑路由器105在它们之间交换数据。
逻辑网络150和155的不同在于每个网络中的机器使用不同的L3地址。例如,逻辑网络150和155是用于一公司的两个不同部门的不同IP子网。
在操作中,逻辑交换机110和115和逻辑路由器105像交换机和路由器那样工作。例如,逻辑交换机110路由源自机器120-130中的一个并前往机器120-130中的另一个的数据分组。当逻辑网络150中的逻辑交换机110接收到以逻辑网络155中的机器135-145中的一个为目的地的数据分组时,逻辑交换机110将该分组发送到逻辑路由器105。逻辑路由器105随后基于分组的头(header)中包括的信息来将该分组路由到逻辑交换机115。逻辑交换机115随后将分组路由到机器135-145中的一个。源自机器135-145中的一个的数据分组被逻辑交换机110和115以及逻辑路由器105以类似的方式路由。
图1示出了在两个逻辑网络150和155之间路由数据的单个逻辑路由器。普通技术人员将会认识到,在两个逻辑网络之间可存在多于一个的在路由分组中所涉及的逻辑路由器。
图2概念性示出了一些实施例的用于通过逻辑交换机和逻辑路由器处理网络数据的处理管道200。具体而言,处理管道200包括三个阶段205-215,用于分别通过逻辑交换机220、逻辑路由器225、然后是逻辑交换机230来处理数据分组。此图在图的上半部示出了逻辑路由器225以及逻辑交换机220和230,在图的下半部示出了处理管道200。
逻辑路由器225与上文通过参考图1描述的逻辑路由器105的类似之处在于逻辑路由器225在逻辑交换机220和220之间路由数据分组。逻辑交换机220和230与逻辑交换机110和115类似。逻辑交换机220和230各自为逻辑网络在L2转发流量。
当逻辑交换机220接收到分组时,逻辑交换机220执行逻辑处理管道200的阶段205(L2处理)以便在一个逻辑网络中转发分组。当分组以另一逻辑网络为目的地时,逻辑交换机220将该分组转发到逻辑路由器225。逻辑路由器225随后对分组执行逻辑处理管道200的阶段210(L3处理)以便在L3路由数据。逻辑路由器225将此分组发送到另一逻辑路由器(未示出),或者,如果逻辑路由器225耦合到逻辑交换机230,则逻辑路由器225将分组发送到逻辑交换机230,逻辑交换机230将把分组直接发送到分组的目的地机器。直接将分组发送到分组的目的地的逻辑交换机230执行逻辑处理管道200的阶段215(L2处理)以便将分组转发到分组的目的地。
在一些实施例中,逻辑交换机和逻辑路由器由一组受管理交换元件(未示出)来实现。一些实施例的这些受管理交换元件通过执行例如逻辑处理管道200的逻辑处理管道来实现逻辑交换机和逻辑路由器。一些实施例的受管理交换元件基于受管理交换元件中的流条目(entry)来执行逻辑处理管道。受管理交换元件中的流条目(未示出)由一些实施例的网络控制系统配置。逻辑处理管道200的更多细节将在下文中进一步描述。
接下来的三幅图,图3、图4和图5概念性示出了一些实施例的逻辑交换机和逻辑路由器的若干实现。图3和图4示出了集中式(centralized)L3路由的两种不同实现,而图5示出了分布式L3路由。
图3概念性示出了网络体系结构300。具体而言,图3示出了逻辑路由器225在单个L3路由器360(例如硬件路由器或软件路由器)中实现。L3路由器360为不同的逻辑网络路由分组,其中每个逻辑网络包括在若干不同的受管理交换元件中实现的若干逻辑交换机。此图被水平地划分成分别表示逻辑和物理实现的左半部和右半部。此图还被垂直地划分成分别表示第2层和第3层的下半部和上半部。图3示出了网络体系结构300包括L3路由器360和受管理交换元件305、310、315和320。此图还示出了逻辑交换机220和230中的每一个逻辑地耦合到三个VM。
L3路由器360实现逻辑路由器225。L3路由器360在包括逻辑交换机220和230的不同逻辑网络之间路由分组。L3路由器360根据L3条目335来路由分组,其中L3条目335指明以何种方式在L3路由分组。例如,一些实施例的L3条目为路由表中的条目(例如,路由),这些条目指明具有落入IP地址的特定范围中的目的地IP地址的分组应当通过逻辑路由器225的特定物理逻辑端口被发送出去。在一些实施例中,逻辑路由器225的逻辑端口被映射到L3路由器的端口,并且逻辑路由器225基于映射来生成L3条目。逻辑路由器的端口到实现逻辑路由器的L3路由器的映射将在下文中进一步描述。
一些实施例的受管理交换元件305-320以分布式方式实现逻辑交换机。也就是说,这些实施例中的逻辑交换机可跨越受管理交换元件305-320中的一个或多个来实现。例如,逻辑交换机220可跨越受管理交换元件305、310和315来实现,而逻辑交换机230可跨越受管理交换元件305、315和320来实现。逻辑地耦合到逻辑交换机220和230的六个VM 362-374如图所示耦合到受管理交换元件310-320。
一些实施例的受管理交换元件305-320各自根据指明应当以何种方式在L2转发分组的L2流条目来转发分组。例如,L2流条目可指明具有特定目的地MAC地址的分组应当通过逻辑交换机的特定逻辑端口被发送出去。受管理交换元件305-320中的每一个具有一组L2流条目340(为了简单起见,交换元件305-315的流条目340没有被描绘)。每个受管理交换元件的L2流条目通过控制器集群被配置在该受管理交换元件中。通过配置受管理交换元件的L2流条目来配置受管理交换元件将在下文中进一步详细描述。
一些实施例的受管理交换元件305是第二级受管理交换元件。第二级受管理交换元件为受管理非边缘交换元件,与受管理边缘交换元件对比,该受管理非边缘交换元件不直接向机器发送和从机器接收分组。第二级受管理交换元件促成非边缘受管理交换元件和边缘受管理交换元件之间的分组交换。美国专利申请13/177,535中描述的池节点(poolnode)和扩展器也是第二级受管理交换元件。一些实施例的受管理交换元件305用作扩展器。也就是说,受管理交换元件305通信地桥接被一个或多个其它网络(未示出)分离的远程受管理网络(未示出)。
一些实施例的受管理交换元件305通信地耦合到L3路由器360。当存在需要在L3路由的分组时,受管理交换元件310-320将分组发送到受管理交换元件305,使得L3路由器360在L3路由分组。关于在L3路由器中实现的集中式逻辑路由器的更多细节将在下文中参考图6-16来进一步描述。
图4概念性示出了网络体系结构400。具体而言,图4示出了逻辑路由器225在受管理交换元件410中实现。与L3路由器360在L3路由分组的网络体系结构300对比,在网络体系结构400中受管理交换元件410在L3路由分组。此图被水平地划分成分别表示逻辑和物理实现的左半部和右半部。此图还被垂直地划分成分别表示第2层和第3层的下半部和上半部。
除了网络体系结构400不包括L3路由器360,网络体系结构400与网络体系结构300类似。受管理交换元件410实现逻辑路由器225。也就是说,受管理交换元件410在包括逻辑交换机220和230的不同逻辑网络之间路由分组。一些实施例的受管理交换元件410根据指明应当以何种方式在L3路由分组的L3条目405来路由分组。然而,与一些实施例的L3条目335对比,L3条目405不是用于路由表的条目。相反,L3条目405是流条目。如美国专利申请13/177,535中所述,流条目包括限定符(qualifier)和动作,而路由表中的条目只是用于找出分组的下一跳的查找表。另外,L3流条目可指明生成路由表中的条目的方式(未示出)。
除了实现集中式逻辑路由器以外,一些实施例的受管理交换元件410还实现跨越若干受管理交换元件实现的一个或多个逻辑交换机。受管理交换元件410因此具有其自己的一组L2流条目340(未描绘)。在体系结构400中,受管理交换元件410和310-320以分布式方式一起实现逻辑交换机220和230。
一些实施例的受管理交换元件410从而实现集中式逻辑路由器和逻辑交换机二者。在其它实施例中,集中式逻辑路由器和逻辑交换机的实现可被分离到两个或更多个受管理交换元件中。例如,一个受管理交换元件(未示出)可利用流条目实现集中式逻辑路由器,而另一个受管理交换元件(未示出)可以分布式方式基于流条目实现逻辑交换机。关于基于流条目在受管理交换元件中实现的集中式逻辑路由器的更多细节将在下文中参考图17-24进一步描述。
图5概念性示出了网络体系结构500。具体而言,图5示出了以分布式方式实现逻辑路由器225以使得若干受管理交换元件中的每一个在L3路由分组。图5示出了网络体系结构500包括四个受管理交换元件505-520。
受管理交换元件505-520实现用于若干不同逻辑网络的若干逻辑交换机和逻辑路由器。一些实施例的受管理交换元件505-520中的每一个为边缘交换元件。也就是说,受管理交换元件具有耦合到该受管理交换元件的一个或多个机器。耦合到受管理交换元件的机器还逻辑地耦合到逻辑交换机。耦合到受管理交换元件的机器可以逻辑地耦合到同一逻辑交换机,或者可以不逻辑地耦合到同一逻辑交换机。
受管理交换元件505-520中的每一个实现将会路由和转发去往和来自耦合到受管理交换元件的机器的分组的至少一个逻辑路由器和至少一个逻辑交换机。换言之,当受管理交换元件从耦合到受管理交换元件的机器接收分组时,受管理交换元件作出逻辑转发决策和逻辑路由决策。受管理交换元件505-520中的每一个根据逻辑流条目550中的L2条目和L3条目来作出逻辑转发和路由决策。逻辑流条目550包括一组L2流条目530和一组L3流条目535。关于分布式逻辑路由器的更多细节将在下文中参考图25-30B来进一步描述。
图6-16示出了在路由器中实现的集中式逻辑路由器。图6概念性示出了上文参考图2描述的逻辑处理管道200的示例实现。图6示出了网络体系结构600。在网络体系结构600中,逻辑处理管道200由三个受管理交换元件615、620和625以及L3路由器635执行。具体地,L2处理205和L2处理215以分布式方式在受管理交换元件615、620和625上执行。L3处理210由L3路由器635来执行。图6还示出了源机器610和目的地机器630。
受管理交换元件615是直接从耦合到边缘交换元件的机器接收分组的边缘交换元件。受管理交换元件615从源机器610接收分组。当受管理交换元件615接收到来自源机器610的分组时,受管理交换元件615对分组执行L2处理205的一部分以便逻辑地转发分组。
在受管理交换元件615和受管理交换元件620之间可以存在一个或多个受管理交换元件(未示出)。这些受管理交换元件具有网络构造(例如,PIF、VIF等等),逻辑交换机220(图6中未示出)的逻辑构造(例如逻辑端口)被映射到这些网络构造。
当分组要前往另一逻辑网络中的目的地机器630时,分组被转发到受管理交换元件620。受管理交换元件620随后执行L2处理205的剩余部分并将分组发送到L3路由器635,其实现集中式逻辑路由器(未示出)。
与上文参考图3描述的L3路由器360类似,L3路由器635是端口被映射到逻辑路由器的端口的硬件路由器或软件路由器。L3路由器635对分组执行L3处理210以便逻辑地路由分组。也就是说,L3路由器635将分组发送到另一逻辑路由器(未示出)或发送到受管理交换元件620。
受管理交换元件620是第二级受管理交换元件,其在一些实施例中用作扩展器。受管理交换元件620从L3路由器635接收分组并开始执行逻辑处理管道200的L2处理215。在受管理交换元件620和受管理交换元件625之间可以存在一个或多个受管理交换元件(未示出)。这些受管理交换元件具有网络构造,逻辑交换机230(图6中未示出)的逻辑构造被映射到这些网络构造。
受管理交换元件625在该示例中从受管理交换元件620接收分组。受管理交换元件625对分组执行L2处理215的剩余部分以便逻辑地转发分组。在此示例中,受管理交换元件625还是将分组直接发送到目的地机器630的交换元件。然而,在受管理交换元件625和目的地机器630之间可以存在一个或多个受管理交换元件(未示出)。这些受管理交换元件具有网络构造,逻辑交换机230(图6中未示出)的逻辑构造被映射到这些网络构造。
虽然在此示例中以分布式方式执行L2处理205和L2处理215,但L2处理205和L2处理215不是必须以分布式方式执行。例如,受管理交换元件615可执行整个L2处理205,并且受管理交换元件625可执行整个L2处理215。在这种情况下,受管理交换元件620将仅在L3路由器和受管理交换元件615和625之间中继分组。
图7概念性示出了一些实施例的用于通过逻辑交换机220、逻辑路由器225和逻辑交换机230处理分组的逻辑处理管道200。具体而言,此图示出了当在上文参考图6描述的网络体系结构600中执行时的逻辑处理管道200。如上所述,在网络体系结构600中,L2处理205、L3处理210和L2处理215由受管理交换元件615、620和625以及L3路由器635执行。
L2处理205在一些实施例中包括八个阶段705-740,用于通过跨越受管理交换元件615和620实现的逻辑网络(未示出)中的逻辑交换机220(图7中未示出)来处理分组。在一些实施例中,接收分组的受管理交换元件615在受管理交换元件615接收到分组时执行L2处理205的一部分。受管理交换元件620随后执行L2处理205的剩余部分。
在一些实施例中,分组包括头和有效负荷(payload)。头在一些实施例中包括一组字段(field),这些字段包含用于通过网络路由分组的信息。逻辑交换机和逻辑路由器可基于头字段中包含的信息来确定交换/路由决策,并且在一些情况下可修改头字段中的一些或全部。
在L2处理205的阶段705中,对分组执行入口上下文(context)映射以确定分组的逻辑上下文。在一些实施例中,阶段705在逻辑交换机220接收到分组(例如,分组最初被受管理交换元件615接收)时执行。逻辑上下文在一些实施例中表示相对于逻辑交换机的分组的状态。逻辑上下文例如可指明分组所属的逻辑交换机、通过其接收分组的逻辑交换机的逻辑端口、通过其发送分组的逻辑交换机的逻辑端口、分组所处的逻辑交换机的逻辑转发平面的阶段,等等。
一些实施例基于分组的源MAC地址(即,从其发送分组的机器)来确定分组的逻辑上下文。一些实施例基于分组的源MAC地址和分组的进入端口(例如入口端口)(即,通过其接收分组的受管理交换元件615的端口)来执行逻辑上下文查找。其它实施例可使用分组的头中的其它字段(例如,MPLS头、VLAN id等等)来确定分组的逻辑上下文。
在执行第一阶段705之后,一些实施例将表示逻辑上下文的信息存储在分组的头的一个或多个字段中。这些字段也可称为逻辑上下文标签(tag)或逻辑上下文ID。另外,逻辑上下文标签在一些实施例中可与一个或多个已知的头字段(例如,VLAN id字段)一致。这样,这些实施例不以所定义的头字段被使用的方式来利用已知头字段或其伴随特征。可替代地,一些实施例将表示逻辑上下文的信息存储为与分组相关联并与分组一起传递的元数据(而不是存储在分组本身中)。
在一些实施例中,第二阶段710是为逻辑交换机220定义的。在一些这样的实施例中,阶段710在分组的逻辑上下文上操作以相对于该逻辑交换机确定分组的入口访问控制。例如,当逻辑交换机接收到分组时,对分组应用入口ACL以控制分组对该逻辑交换机的访问。基于为逻辑交换机定义的入口ACL,可进一步处理分组(例如通过阶段715),或者例如可丢弃分组。
在L2处理205的第三阶段715中,在逻辑交换机的上下文中对分组执行L2转发。在一些实施例中,第三阶段715在分组的逻辑上下文上操作以相对于逻辑交换机220处理并转发分组。例如,一些实施例定义用于在第2层处理分组的L2转发表或L2转发条目。
另外,当分组的目的地在另一逻辑网络中时(即,当分组的目的地逻辑网络不同于其流量被逻辑交换机220处理的逻辑网络时),逻辑交换机220将分组发送到逻辑路由器225,逻辑路由器225随后将执行L3处理210以便将分组路由到目的地逻辑网络。从而,在第三阶段715,一些实施例的受管理交换元件615确定应当通过逻辑交换机的与逻辑路由器225相关联的逻辑端口(未示出)将分组转发到逻辑路由器225。在其它实施例中,受管理交换元件615不一定要确定分组是否应当被转发到逻辑路由器225。相反,分组将具有逻辑路由器225的端口的地址作为目的地地址并且受管理交换元件615根据该目的地地址来通过逻辑交换机的逻辑端口转发这个分组。
在第四阶段720,执行出口上下文映射以识别与分组的逻辑转发的结果相对应的物理结果。例如,分组的逻辑处理可指明,分组要被从逻辑交换机220的一个或多个逻辑端口(例如,逻辑出口端口)发送出去。这样,出口上下文映射操作识别一个或多个受管理交换元件(包括受管理交换元件615和620)的与逻辑交换机220的特定逻辑端口相对应的物理端口。受管理交换元件615确定在前一阶段715确定的逻辑端口所映射到的物理端口(例如VIF)是受管理交换元件620的端口(未示出)。
L2处理205的第五阶段725基于在第四阶段720执行的出口上下文映射来执行物理映射。在一些实施例中,物理映射确定用于向在第四阶段720中确定的物理端口发送分组的操作。例如,一些实施例的物理映射确定与执行L2处理205的受管理交换元件615的一组端口(未示出)中的一个或多个端口相关联的一个或多个队列(未示出),通过这一个或多个端口发送分组以便分组到达在第五阶段725中确定的物理端口。这样,受管理交换元件可沿着网络中的正确路径来转发分组以便分组到达所确定的物理端口。
如图所示,L2处理205的第六阶段730由受管理交换元件620执行。第六阶段730与第一阶段705类似。阶段730在受管理交换元件620接收到分组时执行。在阶段730,受管理交换元件620查找分组的逻辑上下文并且确定剩下来要执行L2出口访问控制。
一些实施例的第七阶段735是为逻辑交换机220定义的。一些这样的实施例的第七阶段735在分组的逻辑上下文上操作以相对于该逻辑交换机确定分组的出口访问控制。例如,可向分组应用出口ACL,以在对分组执行逻辑转发之后控制分组离开逻辑交换机220的访问。基于为逻辑交换机定义的出口ACL,可进一步处理分组(例如,从逻辑交换机的逻辑端口发送出去或发送到调度端口(dipatch port)以便进一步处理)或者例如可丢弃分组。
第八阶段740与第五阶段725类似。在第八阶段740,受管理交换元件620确定受管理交换元件620的特定物理端口(未示出),逻辑交换机220的逻辑出口端口被映射到该特定物理端口。
L3处理210包括六个阶段745-761,用于通过由L3路由器635实现的逻辑交换机220(图7中未示出)来处理分组。如上所述,L3处理涉及执行一组逻辑路由查找以确定通过第3层网络向何处路由分组。
第一阶段745在逻辑路由器225接收到分组时(即,当实现逻辑路由器225的L3路由器635接收到分组时)执行逻辑入口ACL查找以确定访问控制。下一阶段746对分组执行网络地址转换(NAT)。特别地,阶段746执行目的地NAT(DNAT)以将分组的目的地地址恢复回向分组的源机器隐藏的目的地机器的真实地址。在能够执行DANT时执行此阶段746。
下一阶段750基于分组的L3地址(例如目的地IP地址)和路由表(例如包含L3条目)执行逻辑L3路由以确定一个或多个逻辑端口来通过第3层网络发送分组。由于逻辑路由器225是由L3路由器635实现的,所以路由表在L3路由器635中被配置。
在第四阶段755,一些实施例的L3路由器635还对分组执行源NAT(SNAT)。例如,当能够执行源NAT时,L3路由器635将分组的源IP地址替换为不同的IP地址以便隐藏源IP地址。
第五阶段760在逻辑路由器225通过在阶段740中确定的端口将分组路由出逻辑路由器225之前执行逻辑L3出口ACL查找以确定访问控制。L3出口ACL查找是基于分组的L3地址(例如源和目的地IP地址)来执行的。
第六阶段761执行地址解析以便将目的地L3地址(例如目的地IP地址)转换成目的地L2地址(例如目的地MAC地址)。在一些实施例中,L3路由器635使用标准的地址解析(例如,通过发送出ARP请求或查找ARP缓存)来寻找与目的地IP地址相对应的目的地L2地址。
当逻辑路由器225没有耦合到目的地逻辑网络时,逻辑交换机220朝着目的地逻辑网络将分组发送到另一逻辑路由器。当逻辑路由器225耦合到目的地逻辑网络时,逻辑交换机220将分组路由到目的地逻辑网络(即,为目的地逻辑网络转发分组的逻辑交换机)。
L2处理215在一些实施例中包括八个阶段765-798,用于通过跨越受管理交换元件620和625实现的另一逻辑网络(图7中未示出)中的逻辑交换机230来处理分组。在一些实施例中,接收到分组的受管理网络中的受管理交换元件625在受管理交换元件625从受管理交换元件620接收到分组时执行L2处理215。除了阶段765-798是由逻辑交换机230执行的(即,由实现逻辑交换机230的受管理交换元件620和625执行),阶段765-798分别与阶段705-740类似。也就是说,阶段765-798被执行以将从L3路由器635接收的分组通过受管理交换元件620和625转发到目的地。
图8概念性示出了一些实施例的实现逻辑路由器225和逻辑交换机220和230的示例网络体系结构800。具体而言,网络体系结构800表示实现逻辑网络的物理网络,这些逻辑网络的数据分组被逻辑路由器225和逻辑交换机220和230交换和/或路由。该图在其上半部示出了逻辑路由器225和逻辑交换机220和230。该图在其下半部示出了L3路由器860。下半部还示出了分别在主机890、880和885(例如,由诸如WindowsTM和LinuxTM之类的操作系统操作的机器)中运行的第二级受管理交换元件810、受管理交换元件815和820。该图在其上部和下部都示出了VM 1-4。
在此示例中,逻辑交换机220在逻辑路由器225、VM 1和VM 2之间转发数据分组。逻辑交换机230在逻辑路由器225、VM 3和VM4之间转发数据分组。如上所述,逻辑路由器225在逻辑交换机220和230以及可能其它逻辑路由器和交换机(未示出)之间路由数据分组。逻辑交换机220和230和逻辑路由器225通过逻辑端口(未示出)逻辑地耦合并且通过逻辑端口交换分组。这些逻辑端口被映射到L3路由器860和受管理交换元件810、815和820的物理端口。
在一些实施例中,逻辑交换机220和230中的每一个跨越受管理交换元件815和820以及可能其它受管理交换元件(未示出)来实现。在一些实施例中,逻辑路由器225是在通信地耦合到受管理交换元件810的L3路由器860中实现的。
在此示例中,受管理交换元件810、815和820是分别在主机890、880和885中运行的软件交换元件。受管理交换元件810、815和820具有实现逻辑交换机220和230的流条目。利用这些流条目,受管理交换元件815和820在网络中的耦合到受管理交换元件810、815和820的网络元件之间路由网络数据(例如分组)。例如,受管理交换元件815在VM 1和3以及第二级受管理交换元件810之间路由网络数据。类似地,受管理交换元件820在VM 2和4以及第二级受管理交换元件810之间路由网络数据。如图所示,受管理交换元件815和820各自具有三个端口(描绘为带编号的方形),通过这些端口与耦合到受管理交换元件815和820的网络元件交换数据分组。
受管理交换元件810与上文参考图3描述的受管理交换元件305的类似之处在于受管理交换元件810是用作扩展器的第二级受管理交换元件。受管理交换元件810与L3路由器860在同一主机中运行,L3路由器860在此示例中是软件路由器。
在一些实施例中,网络控制系统(未示出)建立隧道来促成网络元件之间的通信。例如,受管理交换元件810通过隧道耦合到在主机880中运行的受管理交换元件815,该隧道如图所示端接(terminate)于受管理交换元件815的端口2处。类似地,受管理交换元件810通过端接于受管理交换元件820的端口1处的隧道耦合到受管理交换元件820。
在不同实施例中支持不同类型的隧道协议。隧道协议的示例包括无线接入点的控制和配置(CAPWAP)、通用路由封装(GRE)、GRE因特网协议安全性(IPsec),以及其它类型的隧道协议。
在此示例中,主机880和885中的每一个如图所示包括受管理交换元件和若干VM。VM 1-4是虚拟机,这些虚拟机每个被指派了一组网络地址(例如,用于L2的MAC地址、用于L3的IP地址,等等)并且可向其它网络元件发送和从其它网络元件接收网络数据。VM由运行在主机880和885上的超管理器(未示出)来管理。
现在将描述通过网络体系结构800进行的若干示例数据交换。当耦合到逻辑交换机220的VM 1向也耦合到同一逻辑交换机220的VM 2发送分组时,该分组首先被发送到受管理交换元件815。受管理交换元件815随后对分组执行L2处理205,因为受管理交换元件815是从VM 1接收分组的边缘交换元件。对此分组的L2处理205的结果将指示分组应当被发送到受管理交换元件820以通过受管理交换元件820的端口4到达VM 2。因为VM 1和2在同一逻辑网络中并且因此对于分组的L3路由不是必须的,所以不需要对此分组执行L3处理。然后经由在受管理交换元件815和受管理交换元件820之间桥接的第二级受管理交换元件810将分组发送到受管理交换元件820。分组通过受管理交换元件820的端口4到达VM 2。
当耦合到逻辑交换机220的VM 1向耦合到逻辑交换机230的VM 3发送分组时,该分组首先被发送到受管理交换元件815。受管理交换元件815对分组执行L2处理的一部分。然而,因为该分组被从一个逻辑网络发送到另一逻辑网络(即,分组的逻辑L3目的地地址是针对另一逻辑网络的),所以需要对此分组执行L3处理。
受管理交换元件815将分组发送到第二级受管理交换元件810,使得受管理交换元件810对分组执行L2处理的剩余部分以将分组转发到L3路由器860。在L3路由器860处执行的L3处理的结果将指示分组应当被发送回受管理交换元件810。受管理交换元件810随后执行另一L2处理的一部分并且将从L3路由器860接收的分组转发回受管理交换元件815。受管理交换元件815对从受管理交换元件810接收的分组执行L2处理215,并且此L2处理的结果将指示分组应当通过受管理交换元件815的端口5被发送到VM 3。
当耦合到逻辑交换机220的VM 1向耦合到逻辑交换机230的VM 4发送分组时,该分组首先被发送到受管理交换元件815。受管理交换元件815对分组执行L2处理205。然而,因为该分组被从一个逻辑网络发送到另一逻辑网络,所以需要执行L3处理。
受管理交换元件815经由受管理交换元件810将分组发送到L3路由器860,使得L3路由器860对分组执行L3处理210。在L3路由器860处执行的L3处理210的结果将指示分组应当被发送到受管理交换元件820。受管理交换元件810随后对从受管理交换元件接收的分组执行L2处理的一部分,并且此L2处理的结果将指示分组应当通过受管理交换元件820被发送到VM 4。受管理交换元件820执行L2处理的剩余部分以确定分组应当通过受管理交换元件820的端口5被发送到VM 4。
图9概念性示出了一些实施例的实现逻辑路由器225和逻辑交换机220和230的示例网络体系结构900。具体而言,网络体系结构900表示实现逻辑网络的物理网络,这些逻辑网络的数据分组被逻辑路由器225和逻辑交换机220和230交换和/或路由。该图在其上半部示出了逻辑路由器225和逻辑交换机220和230。该图在其下半部示出了L3路由器860。下半部还示出了分别在主机910、890、880和885中运行的第二级受管理交换元件905、第二级受管理交换元件810以及受管理交换元件815和820。该图在其上部和下部都示出了VM 1-4。
除了网络体系结构900附加地包括在主机910中运行的受管理交换元件905网络体系结构900与网络体系结构800类似,。一些实施例的受管理交换元件905是用作池节点的第二级受管理交换元件。
在一些实施例中,网络控制系统(未示出)建立隧道来促成网络元件之间的通信。例如,受管理交换元件815在此示例中通过隧道耦合到在主机910中运行的受管理交换元件905,该隧道如图所示端接于受管理交换元件815的端口1处。类似地,受管理交换元件820通过端接于受管理交换元件820的端口2处的隧道耦合到受管理交换元件905。另外,受管理交换元件905和810如图所示通过隧道耦合。
如上文参考图8所述,逻辑路由器225和逻辑交换机220和230在L3路由器860以及受管理交换元件810、815和820中实现,除了在数据分组交换中涉及第二级受管理交换元件905。也就是说,受管理交换元件815和810通过受管理交换元件905来交换分组。
图10概念性示出了一些实施例的实现逻辑路由器225和逻辑交换机220和230的示例网络体系结构1000。除了存在在受管理交换元件810和受管理交换元件820之间建立的隧道,网络体系结构1000与网络体系结构800类似。此图示出了一些实施例的网络体系结构1000是网络体系结构800和网络体系结构900的混合。也就是说,一些受管理边缘交换元件具有去往与集中式L3路由器耦合的第二级受管理交换元件的隧道,而其它受管理边缘交换元件必须通过用作池节点的第二级受管理交换元件,以便与耦合到集中式L3路由器的第二级受管理交换元件交换分组。
图11概念性示出了一些实施例的包括受管理交换元件810和L3路由器860(未示出)的主机890的示例体系结构。具体而言,此图示出了L3路由器860在主机890的命名空间中被配置。主机890在一些实施例中是由能够创建命名空间和虚拟机的操作系统(例如Linux)管理的机器。如图所示,主机890在此示例中包括受管理交换元件810、命名空间1120和NIC 845。此图还示出了控制器集群1105。
控制器集群1105是管理包括受管理交换元件810在内的网络元件的一组网络控制器或控制器实例。受管理交换元件810在此示例中是在主机890中实现的包括用户空间1112和内核1110的软件交换元件。受管理交换元件810包括在用户空间1115中运行的控制守护进程(daemon)1115;以及在内核1110中运行的控制器补丁(patch)1130和网桥1135。用户空间1115和内核1110在一些实施例中具有主机890的操作系统,而在其它实施例中用户空间1115和内核1110具有在主机890上运行的虚拟机。
在一些实施例中,控制器集群1105与控制守护进程1115通信(例如通过利用OpenFlow协议或另一通信协议),控制守护进程1115在一些实施例中是在用户空间1112的后台中运行的应用。控制守护进程1115与控制器集群1105通信以便处理和路由受管理交换元件810接收的分组。具体而言,控制守护进程1115在一些实施例中从控制器集群1105接收配置信息并且配置控制器补丁1130。例如,控制守护进程1115从控制器集群1105接收关于用于处理和路由受管理交换元件810接收的分组的操作的命令。
控制守护进程1115还接收用于控制器补丁1130的配置信息以设立连接到在命名空间1120中实现的逻辑路由器(未示出)的端口(未示出),以使得该逻辑路由器利用适当的条目来填充路由表和其它表。
控制器补丁1130是在内核1110中运行的模块。在一些实施例中,控制守护进程1115配置控制器补丁1130。当被配置时,控制器补丁1130包含关于对要接收的分组进行处理和转发的规则(例如流条目)。一些实施例的控制器补丁1130还创建一组端口(例如VIF)以与命名空间1120交换分组。
控制器补丁1130从内核1110的网络堆栈1150或从网桥1135接收分组。控制器补丁1130基于关于处理和路由分组的规则来确定向哪个命名空间发送分组。控制器补丁1130还从命名空间1120接收分组并基于规则将分组发送到网络堆栈1150或网桥1135。关于受管理交换元件的体系结构的更多细节在美国专利申请13/177,535中描述。
命名空间1120(例如Linux命名空间)是在主机890中创建的容器。命名空间1120可实现网络堆栈、网络设备、网络地址、路由表、网络地址转换表、网络缓存等等(并非所有这些都在图11中示出)。命名空间1120从而在命名空间被配置为处理具有逻辑源或目的地地址的分组时可实现逻辑路由器。例如可通过配置命名空间的路由表1155来将命名空间1120配置为处理这种分组。在一些实施例中,随着命名空间1120连接到受管理交换元件810并交换分组(即,动态路由),命名空间1120填充路由表1155。在其它实施例中,控制器集群1105可通过利用路由填充路由表1155来直接配置路由表1155。
另外,命名空间在一些实施例中还对命名空间路由的分组执行网络地址转换(NAT)。例如,当命名空间将接收到的分组的源网络地址改变成另一网络地址(即,执行源NAT)时。
网桥1135在网络堆栈1150和主机外部的网络主机之间路由网络数据(即,通过NIC1145接收的网络数据)。如图所示,网桥1135在网络堆栈1150和NIC 1145之间以及控制器补丁1130和NIC 1145之间路由网络数据。一些实施例的网桥1135执行标准的L2分组学习和路由。
网络堆栈1150可通过NIC 1145从受管理交换元件810外部的网络主机接收分组。网络堆栈1150随后将分组发送到控制器补丁1130。在一些情况下,通过隧道从受管理交换元件外部的网络主机接收分组。在一些实施例中,隧道端接于网络堆栈1150。从而,当网络堆栈1150通过隧道接收分组时,网络堆栈1150拆开隧道头(即,解封出有效负荷)并将拆开的分组发送到控制器补丁1130。
现在将描述受管理交换元件810和命名空间1120的示例操作。在此示例中,在受管理交换元件810与主机890外部的受管理交换元件815和820(在图11中未示出)之间建立隧道。也就是说,受管理交换元件810、815和820如图8所示通过隧道连接。隧道端接于网络堆栈1150。
受管理交换元件815向受管理交换元件810发送分组,该分组是由VM 1发送到VM 4的。该分组被NIC 1145接收,然后被发送到网桥1135。基于分组头中的信息,网桥1135确定该分组是通过建立的隧道发送的,并且将分组发送到网络堆栈1150。网络堆栈1150拆开隧道头,并将拆开的分组发送到控制器补丁1130。
根据控制器补丁1130具有的规则,控制器补丁1130将分组发送到命名空间1120,因为分组是从一个逻辑网络发送到另一逻辑网络的。例如,规则可以称,具有特定目的地MAC地址的分组应当被发送到命名空间1120。在一些情况下,控制器补丁1130在将分组发送到命名空间之前从分组去除逻辑上下文。命名空间1120随后对分组执行L3处理以在两个逻辑网络之间路由分组。
通过执行L3处理,命名空间1120确定分组应当被发送到控制器补丁1130,因为目的地网络层地址应当去往属于目的地逻辑网络的逻辑交换机。控制器补丁1130接收分组并通过网络堆栈1150、网桥1135和NIC 1145经由隧道将分组发送到实现属于目的地逻辑网络的逻辑交换机的受管理交换元件820。
如上所述,一些实施例在命名空间1120中实现L3路由器860。然而,其它实施例可在运行在主机890上的VM中实现L3路由器860。
图12概念性示出了受管理交换元件和L3路由器中的逻辑交换机和逻辑路由器的示例实现。具体而言,此图示出了在包括第二级受管理交换元件810和L3路由器860的主机890以及受管理交换元件815和820中实现逻辑路由器225以及逻辑交换机220和230。该图在其左半部示出了逻辑路由器225以及逻辑交换机220和230。该图在其右半部示出了第二级受管理交换元件810以及受管理交换元件815和820。该图在其右半部和左半部都示出了VM1-4。为了简单起见,该图没有示出受管理交换元件的所有组件,例如网络堆栈1150。
逻辑交换机220和230以及逻辑路由器225通过逻辑端口逻辑地耦合。如图所示,逻辑交换机220的逻辑端口X耦合到逻辑路由器225的逻辑端口1。类似地,逻辑交换机230的逻辑端口Y耦合到逻辑路由器225的逻辑端口2。逻辑交换机220和230通过这些逻辑端口与逻辑路由器225交换数据分组。另外,在此示例中,逻辑交换机220将逻辑端口X与MAC地址01:01:01:01:01:01相关联,该MAC地址是逻辑路由器225的逻辑端口1的MAC地址。当逻辑交换机220接收到需要L3处理的分组时,逻辑交换机220通过端口X将该分组送出到逻辑路由器225。类似地,逻辑交换机230将逻辑端口Y与MAC地址01:01:01:01:01:02相关联,该MAC地址是逻辑路由器225的逻辑端口2的MAC地址。当逻辑交换机230接收到需要L3处理的分组时,逻辑交换机230通过端口Y将该分组送出到逻辑路由器225。
在此示例中,控制器集群1105(图12中未示出)配置受管理交换元件810,以使得受管理交换元件810的端口1与相同的MAC地址01:01:01:01:01:01相关联,而该MAC地址01:01:01:01:01:01与逻辑交换机220的端口X相关联。从而,当受管理交换元件810接收到以此MAC地址作为目的地MAC地址的分组时,受管理交换元件810通过受管理交换元件810的端口1将分组送出到L3路由器860(在命名空间1120中配置)。这样,逻辑交换机220的端口X被映射到受管理交换元件810的端口1。
类似地,受管理交换元件810的端口2与相同的MAC地址01:01:01:01:01:02相关联,而该MAC地址01:01:01:01:01:02与逻辑交换机230的端口Y相关联。从而,当受管理交换元件810接收到以此MAC地址作为目的地MAC地址的分组时,受管理交换元件810通过受管理交换元件810的端口2将分组送出到L3路由器860。这样,逻辑交换机230的端口Y被映射到受管理交换元件810的端口2。
在此示例中,逻辑路由器225具有逻辑端口1和2以及其它逻辑端口(未示出)。逻辑路由器225的端口1与IP地址1.1.1.1/24相关联,该IP地址表示端口1后面的子网。也就是说,当逻辑路由器225接收到要路由的分组并且该分组具有目的地IP地址例如1.1.1.10时,逻辑路由器225通过端口1将此分组朝着目的地逻辑网络(例如逻辑子网)发送。
类似地,逻辑路由器225的端口2在此示例中与IP地址1.1.2.1/24相关联,该IP地址表示端口2后面的子网。逻辑路由器225通过端口2将具有目的地IP地址例如1.1.2.10的分组发送到目的地逻辑网络。
在此示例中,L3路由器860通过利用路由填充L3路由器860的路由表(未示出)来实现逻辑路由器225。在一些实施例中,L3路由器860在受管理交换元件810与L3路由器860建立连接并发送分组时填充其路由表。例如,当L3路由器从受管理交换元件接收到初始分组时,L3路由器860查明以该初始分组的源地址作为目的地地址的分组应当被发送到受管理交换元件810。L3路由器也可执行的标准地址解析(例如通过发送出ARP请求)来查明向何处发送初始分组。L3路由器860将在路由表中存储这些“路由”并且在为L3路由器随后接收的分组作出路由决策时查找这些表。其它L3路由器(未示出)可以类似的方式来填充其路由表。
在其它实施例中,控制器集群配置L3路由器860的路由表,使得L3路由器860的端口1与和逻辑路由器225的端口1相关联的相同IP地址相关联。类似地,L3路由器860的端口2与和逻辑路由器225的端口2相关联的相同IP地址相关联。以类似的方式,在受管理交换元件的另一逻辑路由器(未示出)中可实现另一逻辑交换机(未示出)。在这些实施例中的一些中,控制集群可采用一个或多个路由协议来配置L3路由器。
图13A-13C概念性示出了上文参考图12描述的受管理交换元件810、815和820以及L3路由器860中实现的逻辑交换机220和230、逻辑路由器225的示例操作。具体而言,图13A-13C示出了从VM 1发送到VM 4的分组如何到达VM 4。
当耦合到逻辑交换机220的VM 1向耦合到逻辑交换机230的VM 4发送分组1330时,该分组首先通过受管理交换元件815的端口4被发送到受管理交换元件815。受管理交换元件815对分组执行L2处理。
如图13A的上半部所示,受管理交换元件815包括转发表,该转发表包括用于处理和转发分组1330的规则(例如流条目)。当受管理交换元件815通过受管理交换元件815的端口4接收到来自VM 1的分组1330时,受管理交换元件815基于受管理交换元件815的转发表开始处理分组1330。在此示例中,分组1330具有目的地IP地址1.1.2.10,这是VM 4的IP地址。分组1330的源IP地址是1.1.1.10。分组1330还以VM 1的MAC地址作为源MAC地址并且以逻辑路由器225的逻辑端口1的MAC地址(即,01:01:01:01:01:01)作为目的地MAC地址。
受管理交换元件815识别转发表中的实现阶段1340的上下文映射的由带圈的1指示的记录(称为“记录1”)。记录1基于进入端口识别分组1330的逻辑上下文,该进入端口是通过其从VM 1接收分组1330的端口4。此外,在一些实施例中,记录1指明受管理交换元件815将分组1330的逻辑上下文存储在分组1330的头的一组字段(例如,VLAN id字段)中。在其它实施例中,受管理交换元件815将逻辑上下文(即,分组所属的逻辑交换机以及该逻辑交换机的逻辑入口端口)存储在交换机的寄存器或元字段中,而不是存储在分组中。记录1还指明通过转发表来进一步处理分组1330(例如通过将分组1330发送到调度端口)。调度端口在美国专利申请13/177,535中描述。
基于分组1330的头中存储的逻辑上下文和/或其它字段,受管理交换元件815识别转发表中的实现阶段1342的入口ACL的由带圈的2指示的记录(称为“记录2”)。在此示例中,记录2允许分组1330被进一步处理(即,分组1330可通过逻辑交换机220的入口端口),从而指明通过转发表来进一步处理分组1330(例如,通过将分组1330发送到调度端口)。此外,记录2指明受管理交换元件815将分组1330的逻辑上下文(即,分组1330已被处理管道1300的第二阶段1342处理)存储在分组1330的头的该组字段中。
接下来,受管理交换元件815基于分组1330的头中存储的逻辑上下文和/或其它字段来识别转发表中的实现阶段1344的逻辑L2转发的由带圈的3指示的记录(称为“记录3”)。记录3指明具有逻辑路由器225的逻辑端口1的MAC地址作为目的地MAC地址的分组要被发送到逻辑交换机220的逻辑端口X。
记录3还指明通过转发表来进一步处理分组1330(例如,通过将分组1330发送到调度端口)。另外,记录3指明受管理交换元件815将逻辑上下文(即,分组1330已被处理管道1300的第三阶段1344处理)存储在分组1330的头的该组字段中。
基于分组1330的头中存储的逻辑上下文和/或其它字段,受管理交换元件815识别转发表中的实现阶段1346的上下文映射的由带圈的4指示的记录(称为“记录4”)。在此示例中,记录4将L3路由器860的端口1所耦合到的受管理交换元件810的端口1识别为与分组1330要被转发到的逻辑交换机220的逻辑端口X相对应的端口。记录4附加地指明通过转发表来进一步处理分组1330(例如通过将分组1330发送到调度端口)。
基于分组1330的头中存储的逻辑上下文和/或其它字段,受管理交换元件815随后识别转发表中的实现阶段1348的物理映射的由带圈的5指示的记录(称为“记录5”)。记录5指明,为了分组1330到达受管理交换元件810,分组1330要通过受管理交换元件815的端口1来发送。在此情况下,受管理交换元件815将把分组1330从与受管理交换元件810耦合的受管理交换元件815的端口1发送出去。
如图13A的下半部所示,受管理交换元件810包括转发表,该转发表包括用于处理和路由分组1330的规则(例如流条目)。当受管理交换元件810从受管理交换元件815接收到分组1330时,受管理交换元件810基于受管理交换元件810的转发表开始处理分组1330。受管理交换元件810识别转发表中的实现阶段1350的上下文映射的由带圈的1指示的记录(称为“记录1”)。记录1基于分组1330的头中存储的逻辑上下文来识别分组1330的逻辑上下文。逻辑上下文指明分组1330已被第二和第三阶段1342和1344处理,第二和第三阶段1342和1344由受管理交换元件815执行。这样,记录1指明通过转发表来进一步处理分组1330(例如通过将分组1330发送到调度端口)。
接下来,受管理交换元件810基于分组1330的头中存储的逻辑上下文和/或其它字段来识别转发表中的实现阶段1352的出口ACL的由带圈的2指示的记录(称为“记录2”)。在此示例中,记录2允许分组1330被进一步处理(例如,分组1330可通过逻辑交换机220的端口“X”离开逻辑交换机220),并且从而指明通过转发表来进一步处理分组1330(例如,通过将分组1330发送到调度端口)。此外,记录2指明受管理交换元件810将分组1330的逻辑上下文(即,分组1330已被处理管道1300的阶段1352处理)存储在分组1330的头的该组字段中。
接下来,受管理交换元件810基于分组1330的头中存储的逻辑上下文和/或其它字段来识别转发表中的实现阶段1354的物理映射的由带圈的3指示的记录(称为“记录3”)。记录3指明为了分组1330到达L3路由器860要通过其发送分组1330的受管理交换元件810的端口。在此情况下,受管理交换元件810将把分组1330从与L3路由器860的端口1耦合的受管理交换元件810的端口1发送出去。在一些实施例中,受管理交换元件810在将分组1330发送到L3路由器860之前从分组1330去除逻辑上下文。
如图13B的上半部所示,L3路由器860包括入口ACL表、路由表和出口ACL表,其包括用于处理和路由分组1330的条目。当L3路由器860从受管理交换元件810接收到分组1330时,L3路由器860基于L3路由器860中的这些表开始处理分组1330。L3路由器860识别入口ACL表中的由带圈的1指示的条目(称为“条目1”),该条目通过指明L3路由器860应当基于分组1330的头中的信息接受分组来实现L3入口ACL。L3路由器860随后识别路由表中的由带圈的2指示的条目(称为“条目2”),该条目通过指明具有其目的地IP地址(即1.1.2.10)的分组1330应当通过逻辑路由器225的端口2被发送到逻辑交换机230来实现L3路由558。L3路由器860随后识别出口ACL表中的由带圈的3指示的条目(称为“条目3”),该条目通过指明L3路由器860可基于分组1330的头中的信息通过逻辑路由器225的端口2将分组送出来实现L3出口ACL。另外,L3路由器860将分组1330的源MAC地址改写成L3路由器860的端口2的MAC地址(即,01:01:01:01:01:02)。
L3路由器860随后执行地址解析以将目的地IP地址转换成目的地MAC地址。在此示例中,L3路由器860查找ARP缓存以找到目的地IP地址所映射到的目的地MAC地址。如果ARP缓存对于目的地IP地址不具有相应的MAC地址,则L3路由器860可发送出ARP请求。目的地IP地址将被解析成VM 4的MAC地址。L3路由器860随后利用目的地IP地址被解析成的MAC地址来改写分组1330的目的地MAC。L3路由器860将基于新的目的地MAC地址通过L3路由器860的逻辑端口2将把分组1330发送到逻辑交换机230。
如图13B的下半部所示,受管理交换元件810包括转发表,该转发表包括用于处理和转发分组1330的规则(例如流条目)。当受管理交换元件810通过受管理交换元件810的端口2从L3路由器860接收到分组1330时,受管理交换元件810基于受管理交换元件810的转发表开始处理分组1330。受管理交换元件810识别转发表中的实现阶段1362的上下文映射的由带圈的4指示的记录(称为“记录4”)。记录4基于进入端口识别分组1330的逻辑上下文,该进入端口是通过其从L3路由器860接收分组1330的端口2。此外,记录4指明受管理交换元件810把分组1330的逻辑上下文存储在分组1330的头的一组字段(例如,VLAN id字段)中。记录4还指明通过转发表来进一步处理分组1330(例如通过将分组1330发送到调度端口)。
基于分组1330的头中存储的逻辑上下文和/或其它字段,受管理交换元件810识别转发表中的实现阶段1364的入口ACL的由带圈的5指示的记录(称为“记录5”)。在此示例中,记录5允许分组1330被进一步处理,并且从而指明通过转发表来进一步处理分组1330(例如,通过将分组1330发送到调度端口)。此外,记录5指明受管理交换元件810将分组1330的逻辑上下文(即,分组1330已被处理管道1300的阶段1362处理)存储在分组1330的头的该组字段中。
接下来,受管理交换元件810基于分组1330的头中存储的逻辑上下文和/或其它字段来识别转发表中的实现阶段1366的逻辑L2转发的由带圈的6指示的记录(称为“记录6”)。记录6指明以VM 4的MAC地址为目的地MAC地址的分组应当通过逻辑交换机230的逻辑端口(未示出)来转发。
记录6还指明,通过转发表来进一步处理分组1330(例如,通过将分组1330发送到调度端口)。另外,记录6指明受管理交换元件810将逻辑上下文(即,分组1330已被处理管道1300的阶段1366处理)存储在分组1330的头的该组字段中。
基于分组1330的头中存储的逻辑上下文和/或其它字段,受管理交换元件810识别转发表中的实现阶段1368的上下文映射的由带圈的7指示的记录(称为“记录7”)。在此示例中,记录7将受管理交换元件820的与VM 4耦合的端口5识别为与分组1330要被转发到的逻辑交换机230的逻辑端口(在阶段1366确定)相对应的端口。记录7附加地指明通过转发表来进一步处理分组1330(例如通过将分组1330发送到调度端口)。
基于分组1330的头中存储的逻辑上下文和/或其它字段,受管理交换元件810随后识别转发表中的实现阶段1370的物理映射的由带圈的8指示的记录(称为“记录8”)。记录8指明为了分组1330到达受管理交换元件820要通过其发送分组1330的受管理交换元件810的端口(未示出)。在此情况下,受管理交换元件810将把分组1330从与受管理交换元件820耦合的受管理交换元件810的端口发送出去。
如图13C所示,受管理交换元件820包括转发表,该转发表包括用于处理和路由分组1330的规则(例如流条目)。当受管理交换元件820从受管理交换元件810接收到分组1330时,受管理交换元件820基于受管理交换元件820的转发表开始处理分组1330。受管理交换元件820识别转发表中的实现阶段1372的上下文映射的由带圈的4指示的记录(称为“记录4”)。记录4基于分组1330的头中存储的逻辑上下文来识别分组1330的逻辑上下文。逻辑上下文指明分组1330已被阶段1364和1366处理,阶段1364和1366由受管理交换元件810执行。这样,记录4指明通过转发表来进一步处理分组1330(例如通过将分组1330发送到调度端口)。
接下来,受管理交换元件820基于分组1330的头中存储的逻辑上下文和/或其它字段,识别转发表中的实现阶段1374的出口ACL的由带圈的5指示的记录(称为“记录5”)。在此示例中,记录5允许分组1330被进一步处理,并且从而指明通过转发表来进一步处理分组1330(例如,通过将分组1330发送到调度端口)。此外,记录5指明受管理交换元件820将分组1330的逻辑上下文(即,分组1330已被处理管道1300的阶段1374处理)存储在分组1330的头的该组字段中。
接下来,受管理交换元件820基于分组1330的头中存储的逻辑上下文和/或其它字段来识别转发表中的实现阶段1376的物理映射的由带圈的6指示的记录(称为“记录6”)。记录6指明为了分组1330到达VM 4要通过其发送分组1330的受管理交换元件820的端口5。在此情况下,受管理交换元件820将把分组1330从与VM 4耦合的受管理交换元件820的端口5发送出去。在一些实施例中,受管理交换元件820在将分组1330发送到VM 4之前从分组1330去除逻辑上下文。
图14概念性示出了一些实施例执行来转发分组以确定向哪个受管理交换元件发送分组的过程1400。过程1400在一些实施例中由接收分组并将该分组转发到另一受管理交换元件或该分组的目的地机器的受管理边缘交换元件来执行。
过程1400开始于从源机器接收分组(在1405)。过程1400随后(在1410)执行L2处理的一部分。随着该过程执行L2处理,过程1400(在1415)确定分组是否需要被发送到第二级受管理交换元件以对分组进行进一步处理。在一些实施例中,该过程基于分组的目的地L2地址来进行此确定。该过程查看目的地L2地址并且通过与目的地L2地址相关联的端口将分组发送出去。例如,当分组的目的地L2地址是L3路由器的L2地址时,该过程将分组从与受管理交换元件相关联的端口送出,该受管理交换元件与L3路由器相关联。当分组的目的地L2地址是目的地机器的L2地址时,该过程将分组发送到与目的地机器直接连接的受管理交换元件或者在路由上更靠近目的地机器的受管理交换元件。
当过程1400(在1415)确定分组需要被发送到第二级受管理交换元件时,过程1400(在1420)将分组发送到通信地耦合到实现逻辑路由器的L3路由器的第二级受管理交换元件。否则,过程1400(在1425)将分组发送到目的地机器或另一受管理交换元件。该过程随后结束。
图15概念性示出了上文描述的主机890。具体而言,当受管理交换元件810从一L3路由器接收到分组并且该分组要前往在同一主机890中实现的另一L3路由器时,受管理交换元件810基于流条目直接地桥接这两个L3路由器。
如图所示,受管理交换元件810耦合到两个L3路由器1和2。受管理交换元件810包含的流条目在图的右侧示出。流条目指示被定址(address)为从一个L3路由器去往另一L3路由器的流量应当直接去往该另一L3路由器。
另外,此图示出了可在主机890中配设额外的路由器,以便在更多的受管理交换元件被配设并且这些受管理交换元件依赖于现有的L3路由器来路由额外的网络流量时提供额外的路由资源。
图16概念性示出了过程1600,一些实施例在第一和第二L3路由器实现在同一主机中时使用该过程来直接将分组从第一L3路由器转发到第二L3路由器。过程1600在一些实施例中由与在单个主机中实现的两个或更多个L3路由器交换分组的受管理交换元件(例如上文所述的受管理交换元件810)执行。
过程1600开始于从第一L3路由器接收分组(在1605)。过程1600随后(在1610)确定该分组是否被定址到在实现第一L3路由器的同一主机中所实现的第二L3路由器。过程1600通过检查分组的头中的信息(例如目的地MAC地址)来确定这一点。
当过程1600(在1610)确定分组要前往第二L3路由器时,过程1600将分组发送到第二L3路由器。否则,过程1600将分组朝着分组的目的地(例如,另一受管理交换元件或目的地机器)发送。过程1600随后结束。
图17-24示出了基于受管理交换元件的流条目在受管理交换元件中实现的集中式逻辑路由器。图17概念性示出了上文参考图2描述的逻辑处理管道200的示例实现。图17示出了网络体系结构1700。在网络体系结构1700中,逻辑处理管道200由三个受管理交换元件1715、1720和1725执行。特别地,L2处理205和L2处理215以分布式方式跨越受管理交换元件1715、1720和1725执行。L3处理210基于受管理交换元件1720的流条目由受管理交换元件1720执行。图17还示出了源机器1710和目的地机器1730。
受管理交换元件1715与上文参考图6描述的受管理交换元件615的类似之处在于受管理交换元件1715也是直接从耦合到边缘交换元件的机器接收分组的边缘交换元件。受管理交换元件1715从源机器1710接收分组。当受管理交换元件1715接收到来自源机器1710的分组时,受管理交换元件1715对分组执行L2处理205的一部分以便逻辑地转发分组。当分组要前往在另一逻辑网络中的目的地机器1730时,分组被转发到受管理交换元件1720。
在受管理交换元件1715和受管理交换元件1720之间可以存在一个或多个受管理交换元件(未示出)。这些受管理交换元件具有网络构造(例如,PIF、VIF等等),逻辑交换机220(图17中未示出)的逻辑构造(例如逻辑端口)被映射到这些网络构造。
受管理交换元件1720是第二级受管理交换元件,其在一些实施例中用作扩展器。受管理交换元件1720执行L2处理205的剩余部分并且还执行L3处理210。受管理交换元件1720还执行逻辑处理管道200的L2处理215的一部分。受管理交换元件1720随后将分组发送到受管理交换元件1725。
在受管理交换元件1720和受管理交换元件1725之间可以存在一个或多个受管理交换元件(未示出)。这些受管理交换元件具有网络构造,逻辑交换机220(图17中未示出)的逻辑构造被映射到这些网络构造。
受管理交换元件1725在该示例中从受管理交换元件1720接收分组。受管理交换元件1725对分组执行L2处理215的剩余部分以便逻辑地转发分组。在此示例中,受管理交换元件1725也是直接向目的地机器1730发送分组的交换元件。然而,在受管理交换元件1725和目的地机器1130之间可以存在一个或多个受管理交换元件(未示出)。这些受管理交换元件具有网络构造,逻辑交换机230(图17中未示出)的逻辑构造被映射到这些网络构造。
虽然在此示例中以分布式方式执行L2处理205和L2处理215,但L2处理205和L2处理215不是必须要以分布式方式执行。例如,受管理交换元件1715可执行整个L2处理205,并且受管理交换元件1725可执行整个L2处理215。在这种情况下,受管理交换元件1720将仅执行逻辑处理管道200的L3处理210。
图18概念性示出了一些实施例的用于通过逻辑交换机220、逻辑路由器225和逻辑交换机230处理分组的逻辑处理管道200。具体而言,此图示出了当在上文参考图17描述的网络体系结构1700中执行时的逻辑处理管道200。如上所述,在网络体系结构1700中,L2处理205、L3处理210和L2处理215由受管理交换元件1715、1720和1725执行。
L2处理205在一些实施例中包括七个阶段1805-1835,用于通过跨越受管理交换元件1715和1720实现的逻辑网络(未示出)中的逻辑交换机220(图18中未示出)来处理分组。在一些实施例中,接收分组的受管理交换元件1715在受管理交换元件1715接收到分组时执行L2处理205的一部分。受管理交换元件1720随后执行L2处理205的剩余部分。
前五个阶段1805-1825与上文参考图7描述的前五个阶段705-725类似。在L2处理205的阶段1805中,对分组执行入口上下文映射以确定分组的逻辑上下文。在一些实施例中,阶段1805在逻辑交换机220接收到分组(例如,分组最初被受管理交换元件1715接收到)时执行。在执行第一阶段1805之后,一些实施例将表示逻辑上下文的信息存储在分组的头的一个或多个字段中。
在一些实施例中,第二阶段1810是为逻辑交换机220定义的。在一些这样的实施例中,阶段1810在分组的逻辑上下文上操作以相对于该逻辑交换机确定分组的入口访问控制。例如,当逻辑交换机接收到分组时,对分组应用入口ACL以控制分组对该逻辑交换机的访问。基于为逻辑交换机定义的入口ACL,可进一步处理分组(例如通过阶段1815),或者例如可丢弃分组。
在L2处理205的第三阶段1815中,在逻辑交换机的上下文中对分组执行L2转发。在一些实施例中,第三阶段1815在分组的逻辑上下文上操作以相对于逻辑交换机220处理并转发分组。例如,一些实施例定义L2转发表或L2转发条目以在第2层处理分组。另外,当分组的目的地在另一逻辑网络中时(即,当分组的目的地逻辑网络不同于其流量被逻辑交换机220处理的逻辑网络时),逻辑交换机220将分组发送到逻辑路由器225,逻辑路由器225随后将执行L3处理210以便将分组路由到目的地逻辑网络。从而,在第三阶段1815,受管理交换元件1715确定应当通过与逻辑路由器225相关联的逻辑交换机的逻辑端口(未示出)将分组转发到逻辑路由器225。
在第四阶段1820,执行出口上下文映射以识别与分组的逻辑转发的结果相对应的物理结果。例如,分组的逻辑处理可指明分组将要从逻辑交换机220的一个或多个逻辑端口(例如,逻辑出口端口)发送出去。这样,出口上下文映射操作识别一个或多个受管理交换元件(包括受管理交换元件1715和1720)的与逻辑交换机220的特定逻辑端口相对应的物理端口。受管理交换元件1715确定在前一阶段1815确定的逻辑端口被映射到的物理端口(例如VIF)是受管理交换元件1720的端口(未示出)。
L2处理205的第五阶段1825基于在第四阶段1820执行的出口上下文映射来执行物理映射。在一些实施例中,物理映射确定用于向在第四阶段1820中确定的物理端口发送分组的操作。例如,一些实施例的物理映射确定与执行L2处理205的受管理交换元件1715的一组端口(未示出)中的一个或多个端口相关联的一个或多个队列(未示出),将通过这一个或多个端口来发送分组以便分组到达在第四阶段1820中确定的物理端口。这样,受管理交换元件可沿着网络中的正确路径来转发分组以便分组到达所确定的物理端口。
如图所示,L2处理205的第六阶段1830由受管理交换元件1720执行。第六阶段1830与第一阶段1805类似。阶段1830在受管理交换元件1720接收到分组时执行。在阶段1830,受管理交换元件1720查找分组的逻辑上下文并且确定剩下来要执行L2出口访问控制。
一些实施例的第七阶段1835是为逻辑交换机220定义的。一些这样的实施例的第七阶段1835在分组的逻辑上下文上操作以相对于逻辑交换机220确定分组的出口访问控制。例如,可向分组应用出口ACL,以在对分组执行逻辑转发之后控制分组离开逻辑交换机220的访问。基于为逻辑交换机定义的出口ACL,可进一步处理分组(例如,从逻辑交换机的逻辑端口发送出去或发送到调度端口以进一步处理)或者例如可丢弃分组。
L3处理210包括六个阶段1840-1856,用于基于受管理交换元件1720的L3流条目通过在受管理交换元件1720中实现的逻辑交换机220(图18中未示出)来处理分组。如上所述,L3处理涉及执行一组逻辑路由查找以确定通过第3层网络向何处路由分组。
第一阶段1840在逻辑路由器225接收到分组时(即,当实现逻辑路由器225的受管理交换元件1720接收到分组时)执行逻辑入口ACL查找以确定访问控制。下一阶段1841执行DNAT以将分组的目的地地址恢复回对分组的源机器隐藏的目的地机器的真实地址。在能够执行DANT时执行此阶段1841。
下一阶段1845基于分组的L3地址(例如目的地IP地址)和路由表(例如包含L3条目)执行逻辑L3路由以确定通过第3层网络向其发送分组的一个或多个端口。由于逻辑路由器225由受管理交换元件1720实现,所以L3流条目在受管理交换元件1720中被配置。
在第四阶段1850,一些实施例的受管理交换元件1720还对分组执行SNAT。例如,当能够执行源NAT时,受管理交换元件1720将分组的源IP地址替换为不同的IP地址以便隐藏源IP地址。另外,如下文将进一步描述的,受管理交换元件可使用NAT守护进程来接收流条目以用于转换网络地址。下文将参考图31进一步描述NAT守护进程。
第五阶段1855在逻辑路由器225通过在阶段1845中确定的端口将分组路由出逻辑路由器225之前执行逻辑L3出口ACL查找以确定访问控制。L3出口ACL查找是基于分组的L3地址(例如源和目的地IP地址)来执行的。
第六阶段1856执行地址解析以便将目的地L3地址(例如目的地IP地址)转换成目的地L2地址(例如目的地MAC地址)。在一些实施例中,受管理交换元件1720使用标准的地址解析(例如,通过发送出ARP请求或查找ARP缓存)来找到与目的地IP地址相对应的目的地L2地址。另外,如下文将进一步描述的,一些实施例的受管理交换元件1720可使用L3守护进程来接收流条目以用于将L3地址解析成L2地址。下文将参考图48-50来进一步描述L3守护进程。
当逻辑路由器225未耦合到目的地逻辑网络时,逻辑交换机220朝着目的地逻辑网络将分组发送到另一逻辑路由器网络。当逻辑路由器225耦合到目的地逻辑网络时,逻辑交换机220将分组路由到目的地逻辑网络(即,对于目的地逻辑网络转发分组的逻辑交换机)。
L2处理215在一些实施例中包括七个阶段1860-1890,用于通过跨越受管理交换元件1720和1725(未示出)实现的另一逻辑网络(图18中未示出)中的逻辑交换机230来处理分组。除了阶段1860-1890由逻辑交换机230执行(即,由实现逻辑交换机230的受管理交换元件1720和1725执行),阶段1860-1890分别与阶段1805-1835类似。
图19概念性示出了一些实施例的实现逻辑路由器225和逻辑交换机220和230的示例网络体系结构1900。具体而言,网络体系结构1900表示实现逻辑网络的物理网络,这些逻辑网络的数据分组被逻辑路由器225以及逻辑交换机220和230交换和/或路由。该图在其上半部示出了逻辑路由器225以及逻辑交换机220和230。该图在其下半部示出了分别在主机1990、1980和1985(例如,由诸如WindowsTM和LinuxTM之类的操作系统操作的机器)中运行的第二级受管理交换元件1910、受管理交换元件1915和1920。该图在其上部和下部都示出了VM 1-4。
在此示例中,逻辑交换机220在逻辑路由器225、VM 1和VM 2之间转发数据分组。逻辑交换机230在逻辑路由器225、VM 3和VM 4之间转发数据分组。如上所述,逻辑路由器225在逻辑交换机220和230以及可能其它逻辑路由器和交换机(未示出)之间路由数据分组。逻辑交换机220和230以及逻辑路由器225通过逻辑端口(未示出)逻辑地耦合并且通过逻辑端口交换分组。这些逻辑端口被映射到L3路由器1960以及受管理交换元件1910、1915和1920的物理端口。
在一些实施例中,逻辑交换机220和230中的每一个跨越受管理交换元件1915和1920以及可能其它受管理交换元件(未示出)实现。在一些实施例中,逻辑路由器225在通信地耦合到受管理交换元件1910的L3路由器1960中实现。
在此示例中,受管理交换元件1910、1915和1920是分别在主机1990、1980和1985中运行的软件交换元件。受管理交换元件1910、1915和1920具有实现逻辑交换机220和230的流条目。利用这些流条目,受管理交换元件1915和1920在网络中的耦合到受管理交换元件1910、1915和1920的网络元件之间转发网络数据(例如分组)。例如,受管理交换元件1915在VM 1和3和第二级受管理交换元件1910之间路由网络数据。类似地,受管理交换元件1920在VM 2和4和第二级受管理交换元件1910之间路由网络数据。如图所示,受管理交换元件1915和1920各自具有三个端口(描绘为带编号的方形),通过这些端口与耦合到受管理交换元件1915和1920的网络元件交换数据分组。
受管理交换元件1910与上文参考图4描述的受管理交换元件305的类似之处在于受管理交换元件1910是用作扩展器的第二级受管理交换元件。受管理交换元件560也基于流条目实现逻辑路由器225。利用这些流条目,受管理交换元件1910在L3路由分组。在此示例中,在受管理交换元件1910中实现的逻辑路由器225在跨越受管理交换元件1910和1915实现的逻辑交换机220和跨越受管理交换元件1910和1920实现的逻辑交换机230之间路由分组。
在此示例中,受管理交换元件1910通过隧道耦合到在主机1980中运行的受管理交换元件1915,该隧道如图所示端接于受管理交换元件1915的端口2处。类似地,受管理交换元件1910通过端接于受管理交换元件1920的端口1处的隧道耦合到受管理交换元件1920。
在此示例中,主机1980和1985中的每一个如图所示包括受管理交换元件和若干VM。VM 1-4是虚拟机,这些虚拟机每个被指派了一组网络地址(例如,用于L2的MAC地址、用于L3的IP地址,等等)并且能够向其它网络元件发送和从其它网络元件接收网络数据。VM由运行在主机1980和1985上的超管理器(未示出)来管理。
现在将描述通过网络体系结构1900进行的若干示例数据交换。当耦合到逻辑交换机220的VM 1向也耦合到同一逻辑交换机220的VM 2发送分组时,该分组首先被发送到受管理交换元件1915。受管理交换元件1915随后对分组执行L2处理205,因为受管理交换元件1915是从VM 1接收分组的边缘交换元件。对此分组的L2处理205的结果将指示分组应当被发送到受管理交换元件1920以通过受管理交换元件1920的端口4到达VM 2。因为VM 1和2在同一逻辑网络中并且因此对于分组的L3路由不是必须的,所以不需要对此分组执行L3处理。分组然后经由在受管理交换元件1915和受管理交换元件1920之间桥接的第二级受管理交换元件1910被发送到受管理交换元件1920。分组通过受管理交换元件1920的端口4到达VM 2。
当耦合到逻辑交换机220的VM 1向耦合到逻辑交换机230的VM 3发送分组时,该分组首先被发送到受管理交换元件1915。受管理交换元件1915对分组执行L2处理的一部分。然而,因为该分组被从一个逻辑网络发送到另一逻辑网络(即,分组的逻辑L3目的地地址是针对另一逻辑网络的),所以需要对此分组执行L3处理。
受管理交换元件1915将分组发送到第二级受管理交换元件1910,使得受管理交换元件1910对分组执行L2处理的剩余部分和L3处理210。受管理交换元件1910随后执行另一L2处理的一部分并且将分组转发到受管理交换元件1920。受管理交换元件1915对从受管理交换元件1910接收的分组执行L2处理215,并且此L2处理的结果将指示分组应当通过受管理交换元件1915的端口5被发送到VM 3。
当耦合到逻辑交换机220的VM 1向耦合到逻辑交换机230的VM 4发送分组时,该分组首先被发送到受管理交换元件1915。受管理交换元件1915对分组执行L2处理205。然而,因为该分组被从一个逻辑网络发送到另一逻辑网络,所以需要执行L3处理。
受管理交换元件1915将分组发送到受管理交换元件1910,使得受管理交换元件1910对分组执行L2处理205的剩余部分和L3处理210。在受管理交换元件1910处执行的L3处理210的结果将指示分组应当被发送到受管理交换元件1915。受管理交换元件1910随后对分组执行L2处理的一部分,并且此L2处理的结果将指示分组应当通过受管理交换元件1920被发送到VM 4。受管理交换元件1920执行L2处理的剩余部分以确定分组应当通过受管理交换元件1920的端口5被发送到VM 4。
图20概念性示出了一些实施例的实现逻辑路由器225以及逻辑交换机220和230的示例网络体系结构2000。具体而言,网络体系结构2000表示实现逻辑网络的物理网络,这些逻辑网络的数据分组被逻辑路由器225以及逻辑交换机220和230交换和/或路由。该图在其上半部示出了逻辑路由器225以及逻辑交换机220和230。该图在其下半部示出了分别在主机1990、1980和1985中运行的第二级受管理交换元件1910、受管理交换元件1915和1920。该图在其上部和下部都示出了VM 1-4。
除了网络体系结构2000附加地包括在主机2010中运行的受管理交换元件2005,网络体系结构2000与网络体系结构1900类似,。一些实施例的受管理交换元件2005是用作池节点的第二级受管理交换元件。
在一些实施例中,网络控制系统(未示出)建立隧道以促成网络元件之间的通信。例如,受管理交换元件1915在此示例中通过隧道耦合到在主机2010中运行的受管理交换元件2005,该隧道如图所示端接于受管理交换元件1915的端口1处。类似地,受管理交换元件1920通过端接于受管理交换元件1920的端口2处的隧道耦合到受管理交换元件2005。另外,受管理交换元件2005和1910如图所示通过隧道耦合。
如上文参考图19所述,逻辑路由器225以及逻辑交换机220和230在受管理交换元件1910、1915和1920中实现,除了在数据分组交换中涉及第二级受管理交换元件2005。也就是说,受管理交换元件1915和1910通过受管理交换元件2005来交换分组。受管理交换元件1920和1910通过受管理交换元件2005来交换分组。受管理交换元件1915和1920通过受管理交换元件2005来交换分组。
图21概念性示出了一些实施例的实现逻辑路由器225以及逻辑交换机220和230的示例网络体系结构2100。除了存在受管理交换元件1910和受管理交换元件1920之间建立的隧道,网络体系结构2100与网络体系结构1900类似。此图示出了一些实施例的网络体系结构2100是网络体系结构1900和网络体系结构2000的混合。也就是说,一些受管理边缘交换元件具有去往与集中式L3路由器耦合的第二级受管理交换元件的隧道,而其它受管理边缘交换元件为了与耦合到集中式L3路由器的第二级受管理交换元件交换分组必须通过用作池节点的第二级受管理交换元件。
图22概念性示出了一些实施例的包括基于流条目实现逻辑路由器的受管理交换元件1910的主机1990的示例体系结构。主机1990在一些实施例中是由能够创建虚拟机的操作系统(例如Linux)管理的机器。如图所示,主机1990在此示例中包括受管理交换元件1910和NIC 2245。此图还示出了控制器集群2205。
控制器集群2205是管理包括受管理交换元件1910在内的网络元件的一组网络控制器或控制器实例。受管理交换元件1910在此示例中是在主机1990中实现的包括用户空间2212和内核2210的软件交换元件。受管理交换元件1910包括在用户空间2212中运行的控制守护进程2215,以及在内核2210中运行的控制器补丁2230和网桥2235。在用户空间2212中运行的还有NAT守护进程2250,下文将对其进行进一步描述。用户空间2212和内核2210在一些实施例中具有主机1990的操作系统,而在其它实施例中用户空间2212和内核2210具有在主机1990上运行的虚拟机。
在一些实施例中,控制器集群2205与控制守护进程2215通信(例如利用OpenFlow协议或某种其它通信协议),控制守护进程2215在一些实施例中是在用户空间2212的后台运行的应用。控制守护进程2215与控制器集群2205通信以便处理和路由受管理交换元件1910接收的分组。具体而言,控制守护进程2215在一些实施例中从控制器集群2205接收配置信息并且配置控制器补丁2230。例如,控制守护进程2215从控制器集群2205接收关于用于处理和路由受管理交换元件1910接收的分组的操作的命令。
控制器补丁2230是在内核2210中运行的模块。在一些实施例中,控制守护进程2215配置控制器补丁2230。当被配置时,控制器补丁2230包含关于对要接收的分组进行处理、转发和路由的规则(例如流条目)。控制器补丁2230实现逻辑交换机和逻辑路由器二者。
在一些实施例中,控制器补丁2230使用NAT守护进程来进行网络地址转换。如下文将进一步描述的,NAT守护进程2250生成关于网络地址转换的流条目并将流条目发送回受管理交换元件1910以使用。NAT守护进程将在下文进一步描述。
控制器补丁2230从内核2210的网络堆栈2250或从网桥2235接收分组。网桥2235在网络堆栈2250和主机外部的网络主机之间路由网络数据(即,通过NIC 2245接收的网络数据)。如图所示,网桥2235在网络堆栈2250和NIC 2245之间以及网络堆栈2250和NIC2245之间路由网络数据。一些实施例的网桥2235执行标准的L2分组学习和路由。
网络堆栈2250可通过NIC 2245从受管理交换元件1910外部的网络主机接收分组。网络堆栈2250随后将分组发送到控制器补丁2230。在一些情况下,通过隧道从受管理交换元件外部的网络主机接收分组。在一些实施例中,隧道端接于网络堆栈2250。从而,当网络堆栈2250通过隧道接收分组时,网络堆栈2250拆开隧道头(即,解封出有效负荷)并将拆开的分组发送到控制器补丁2230。
现在将描述受管理交换元件1910的示例操作。在此示例中,在受管理交换元件1910与主机1990外部的受管理交换元件1915和1920(在图22中未示出)之间建立隧道。也就是说,受管理交换元件1910、1915和1920如图19所示通过隧道连接。隧道端接于网络堆栈2250。
受管理交换元件1915向受管理交换元件1910发送分组,该分组是由VM 1发送到VM4的。该分组被NIC 2245接收,然后被发送到网桥2235。基于分组头中的信息,网桥2235确定该分组是通过建立的隧道发送的,并且将分组发送到网络堆栈2250。网络堆栈2250拆开隧道头,并将拆开的分组发送到控制器补丁2230。
根据控制器补丁2230具有的流条目,控制器补丁2230执行L3处理以路由分组,因为分组被从一个逻辑网络发送到另一逻辑网络。通过执行L3处理和一些L2处理,受管理交换元件1910确定分组应当被发送到受管理交换元件1920,因为目的地网络层地址应当去往属于目的地逻辑网络的逻辑交换机。控制器补丁2230通过网络堆栈2250、网桥2235和NIC2245经由隧道将分组发送到实现属于目的地逻辑网络的逻辑交换机的受管理交换元件1920。
图23概念性示出了受管理交换元件中的逻辑交换机和逻辑路由器的示例实现。具体而言,该图示出了逻辑路由器225以及逻辑交换机220和230在第二级受管理交换元件1910以及受管理交换元件1915和1920中的实现。该图在其上半部示出了逻辑路由器225以及逻辑交换机220和230。该图在其下半部示出了受管理交换元件1910-1920。该图在其上半部和下半部都示出了VM 1-4。
逻辑交换机220和230以及逻辑路由器225通过逻辑端口逻辑地耦合。逻辑交换机220和230的该特定的配置与上文参考图12描述的示例中示出的配置相同。
在图23的示例中,控制器集群2205(图23中未示出)通过向受管理交换元件1910提供流条目来配置受管理交换元件1910,以使得该受管理交换元件基于流条目实现逻辑路由器225。
图24概念性示出了上文参考图23描述的逻辑交换机220和230、逻辑路由器225以及受管理交换元件1910、1915和1920的示例操作。具体而言,图24示出了实现逻辑路由器225的受管理交换元件1910的操作。为了简单起见,受管理交换元件1915和1920执行的逻辑处理管道的部分在图24中没有描绘。逻辑处理管道的这些部分与图13A和图13C的上半部所示的示例中的受管理交换元件815和820执行的逻辑处理的部分类似。也就是说,为了示出图24的示例,图24替换图13A和图13B的下半部。
如图24的下半部所示,受管理交换元件1910包括L2条目2405和2415以及L3条目2410。这些条目是控制器集群2205(未示出)提供给受管理交换元件1910的流条目。虽然这些条目被描绘为三个分开的表,但这些表不一定必须是分开的表。也就是说,单个表可包括所有这些流条目。
当受管理交换元件1910从受管理交换元件1915接收到从VM 1向VM 4发送的分组2430时,受管理交换元件1910基于受管理交换元件1910的流条目2405开始处理分组2430。受管理交换元件1910识别转发表中的实现阶段1830的上下文映射的由带圈的1指示的记录(称为“记录1”)。记录1基于分组2430的头中存储的逻辑上下文来识别分组2430的逻辑上下文。逻辑上下文指明分组2430已被由受管理交换元件1915执行的逻辑处理的一部分(即,L2入口ACL、L2转发)处理。这样,记录1指明通过转发表来进一步处理分组2430(例如通过将分组2430发送到调度端口)。
接下来,受管理交换元件1910基于分组2430的头中存储的逻辑上下文和/或其它字段,识别转发表中的实现阶段1835的出口ACL的由带圈的2指示的记录(称为“记录2”)。在此示例中,记录2允许分组2430被进一步处理(例如,分组2430可通过逻辑交换机220的端口“X”离开逻辑交换机220),并且从而指明通过受管理交换元件1910的流条目来进一步处理分组2430(例如,通过将分组2430发送到调度端口)。此外,记录2指明受管理交换元件1910将分组2430的逻辑上下文(即,分组2430已被处理管道2400的阶段2452处理)存储在分组2430的头的该组字段中。(要注意,所有记录都指明每当受管理交换元件基于记录执行逻辑处理的某个部分时,执行逻辑处理的受管理交换元件更新该组字段中存储的逻辑上下文。)
受管理交换元件1910基于流条目继续处理分组2430。受管理交换元件1910基于分组2430的头中存储的逻辑上下文和/或其它字段来识别L3条目2410中的由带圈的3指示的记录(称为“记录3”),该记录通过基于分组2430的头中的信息指明受管理交换元件1910应当接受通过逻辑路由器225的逻辑端口1的分组来实现L3入口ACL。
受管理交换元件1910随后识别L3条目2410中的由带圈的4指示的流条目(称为“记录4”),该流条目通过指明具有其目的地IP地址(例如1.1.2.10)的分组2430应当被允许从逻辑路由器225的端口2离开来实现L3路由1845。另外,记录4(或路由表中的另一记录,未示出)指示分组2430的源MAC地址要被改写成逻辑路由器225的端口2的MAC地址(即,01:01:01:01:01:02)。受管理交换元件1910随后识别L3条目2410中的由带圈的5指示的流条目(称为“记录5”),该流条目通过基于分组2430的头中的信息(例如源IP地址)指明受管理交换元件1910可通过逻辑路由器225的端口2将分组发送出去来实现L3出口ACL。
基于分组2430的头中存储的逻辑上下文和/或其它字段,受管理交换元件1910识别L2条目2415中的实现阶段1860的入口ACL的由带圈的6指示的记录(称为“记录6”)。在此示例中,记录6允许分组2430被进一步处理,并且从而指明由受管理交换元件1910来进一步处理分组2430(例如,通过将分组2430发送到调度端口)。此外,记录6指明受管理交换元件1910将分组2430的逻辑上下文(即,分组2430已被处理管道2400的阶段2462处理)存储在分组2430的头的该组字段中。
接下来,受管理交换元件1910基于分组2430的头中存储的逻辑上下文和/或其它字段来识别转发表中的实现阶段1865的逻辑L2转发的由带圈的7指示的记录(称为“记录7”)。记录7指明以VM 4的MAC地址作为目的地MAC地址的分组应当通过连接到VM 4的逻辑交换机230的逻辑端口(未示出)来转发。
记录7还指明通过转发表来进一步处理分组2430(例如,通过将分组2430发送到调度端口)。另外,记录7指明受管理交换元件1910将逻辑上下文(即,分组2430已被处理管道2400的阶段1865处理)存储在分组2430的头的该组字段中。
基于分组2430的头中存储的逻辑上下文和/或其它字段,受管理交换元件1910识别转发表中的实现阶段1870的上下文映射的由带圈的8指示的记录(称为“记录8”)。在此示例中,记录8将与VM 4耦合的受管理交换元件1920的端口5识别为与分组2430要被转发到的逻辑交换机230的逻辑端口(在阶段1865确定)相对应的端口。记录8附加地指明通过转发表来进一步处理分组2430(例如通过将分组2430发送到调度端口)。
基于分组2430的头中存储的逻辑上下文和/或其它字段,受管理交换元件1910随后识别L2条目2415中的实现阶段1875的物理映射的由带圈的9指示的记录(称为“记录9”)。记录9指明为了分组2430到达受管理交换元件1920要通过其发送分组2430的受管理交换元件1910的端口(未示出)。在此情况下,受管理交换元件1910将把分组2430从与受管理交换元件1920耦合的受管理交换元件1910的该端口发送出去。
图25-30B示出了基于受管理交换元件的流条目在若干受管理交换元件中实现的分布式逻辑路由器。特别地,图25-30B示出了包括源L2处理、L3路由和目的地L2处理在内的整个逻辑处理管道由第一跳受管理交换元件(即,直接从机器接收分组的交换元件)执行。
图25概念性示出了上文参考图2描述的逻辑处理管道200的示例实现。特别地,图25示出了L3处理210可由任何直接从源机器接收分组的受管理交换元件执行。图25示出了网络体系结构2500。在网络体系结构2500中,逻辑处理管道200由受管理交换元件2505执行。在此示例中,L3处理210由受管理交换元件2505基于受管理交换元件2505的流条目执行。图25还示出了源机器2515和目的地机器2520。
受管理交换元件2505是直接从耦合到边缘交换元件的机器接收分组的边缘交换元件。受管理交换元件2505从源机器2515接收分组。当受管理交换元件2505接收到来自源机器2515的分组时,受管理交换元件805在一些实施例中对分组执行整个逻辑处理管道200以便逻辑地转发和路由分组。
当接收到的分组要前往在此示例中在另一逻辑网络中的目的地机器2520时,受管理交换元件2505用作:在源机器2515所属的逻辑网络中的逻辑交换机;在目的地机器2520所属的逻辑网络中的逻辑交换机;以及在两个逻辑交换机之间路由分组的逻辑路由器。基于执行逻辑处理管道200的结果,受管理交换元件2505将分组转发到受管理交换元件2510,目的地机器2520通过受管理交换元件2510接收分组。
图26概念性示出了一些实施例的用于通过逻辑交换机220、逻辑路由器225和逻辑交换机230处理分组的逻辑处理管道200。具体而言,此图示出了当在上文参考图25描述的网络体系结构2500中执行时的逻辑处理管道200。如上所述,在网络体系结构2500中,L2处理205、L3处理210和L2处理215由单个受管理交换元件2505执行,受管理交换元件2505是从机器接收分组的边缘交换元件。因此,在这些实施例中,第一跳交换元件执行整个逻辑处理管道200。
L2处理205在一些实施例中包括四个阶段2605-2620,用于通过逻辑交换机220(图26中未示出)来处理分组。在阶段2605中,对分组执行入口上下文映射以确定分组的逻辑上下文。在一些实施例中,阶段2605在逻辑交换机220接收到分组(例如,分组最初被受管理交换元件2505接收)时执行。
在一些实施例中,第二阶段2610是为逻辑交换机220定义的。在一些这样的实施例中,阶段2610在分组的逻辑上下文上操作以相对于该逻辑交换机确定分组的入口访问控制。例如,当逻辑交换机接收到分组时,对分组应用入口ACL以控制分组对该逻辑交换机的访问。基于为逻辑交换机定义的入口ACL,可进一步处理分组(例如通过阶段2615),或者例如可丢弃分组。
在L2处理205的第三阶段2615中,在逻辑交换机的上下文中对分组执行L2转发。在一些实施例中,第三阶段2615在分组的逻辑上下文上操作以相对于逻辑交换机220处理并转发分组。例如,一些实施例定义用于在第2层处理分组的L2转发表或L2转发条目。
一些实施例的第四阶段2620是为逻辑交换机220定义的。一些这样的实施例的第四阶段2620在分组的逻辑上下文上操作以相对于该逻辑交换机确定分组的出口访问控制。例如,可向分组应用出口ACL,以在对分组执行逻辑转发之后控制分组离开逻辑交换机220的访问。基于为逻辑交换机定义的出口ACL,可进一步处理分组(例如,从逻辑交换机的逻辑端口发送出去或发送到调度端口以便进一步处理)或者例如可丢弃分组。
当分组的目的地在另一逻辑网络中时(即,当分组的目的地逻辑网络不同于其流量被逻辑交换机220处理的逻辑网络时),逻辑交换机220将分组发送到逻辑路由器225,逻辑路由器225随后在阶段210执行L3处理以便将分组路由到目的地逻辑网络。L3处理210包括六个阶段2635-2651,用于通过由受管理交换元件2505(图26中未示出)实现的逻辑路由器225(图26中未示出)来处理分组。如上所述,L3处理涉及执行一组逻辑路由查找以确定通过第3层网络向何处路由分组。
第一阶段2635在逻辑路由器225接收到分组时(即,当实现逻辑路由器225的受管理交换元件2505接收到分组时)执行逻辑入口ACL查找以确定访问控制。在一些实施例中,阶段2635在分组的逻辑上下文上操作以相对于逻辑路由器225确定分组的入口访问控制。下一阶段2636执行DNAT以将分组的目的地地址恢复回对分组的源机器隐藏的目的地机器的真实地址。在能够执行DANT时执行此阶段2636。
下一阶段2640基于分组的L3地址(例如目的地IP地址)、包含L3流条目的转发表和分组的逻辑上下文来执行逻辑L3路由以确定一个或多个逻辑端口来通过第3层网络发送分组。
一些实施例的第四阶段2645对分组执行SNAT。例如,当能够执行SNAT时,受管理交换元件2505将分组的源IP地址替换为不同的IP地址以便隐藏源IP地址。另外,如下文将进一步描述的,受管理交换元件可使用NAT守护进程来接收用于转换网络地址的流条目。NAT守护进程将在下文参考图31来进一步描述。
第五阶段2650在逻辑路由器225通过在阶段2640中确定的端口将分组路由出逻辑路由器225之前执行逻辑出口ACL查找以确定访问控制。出口ACL查找基于分组的L3地址(例如源和目的地IP地址)来执行。在一些实施例中,阶段2650在分组的逻辑上下文上操作以相对于逻辑路由器225确定分组的出口访问控制。
第六阶段2651执行地址解析以便将目的地L3地址(例如目的地IP地址)转换成目的地L2地址(例如目的地MAC地址)。在一些实施例中,受管理交换元件2505使用标准的地址解析(例如,通过发送出ARP请求或查找ARP缓存)来找到与目的地IP地址相对应的目的地L2地址。另外,如下文将进一步描述的,一些实施例的受管理交换元件2505可使用L3守护进程来接收用于将L3地址解析成L2地址的流条目。L3守护进程将在下文参考图48-50来进一步描述。
当逻辑路由器225未耦合到目的地逻辑网络时,逻辑交换机220朝着目的地逻辑网络将分组发送到另一逻辑路由器网络。与该另一逻辑路由器的操作相对应的逻辑处理的部分也将在受管理交换元件2505中实现。当逻辑路由器225耦合到目的地逻辑网络时,逻辑交换机220将分组路由到目的地逻辑网络(即,为目的地逻辑网络转发分组的逻辑交换机)。
L2处理215在一些实施例中包括五个阶段2660-2680,用于通过在逻辑交换机225(图26中未示出)来处理分组。在一些实施例中,在一些实施例中,第一阶段2660是为逻辑交换机225定义的。在一些这样的实施例中,阶段2660在分组的逻辑上下文上操作以相对于逻辑交换机230确定分组的入口访问控制。例如,当逻辑交换机230从逻辑路由器225接收到分组时,对分组应用入口ACL以控制分组对逻辑交换机230的访问。基于为逻辑交换机定义的入口ACL,可进一步处理分组(例如通过阶段2665),或者例如可丢弃分组。
在L2处理管道215的第二阶段2665中,在逻辑交换机的上下文中对分组执行L2转发。在一些实施例中,第三阶段2665在分组的逻辑上下文上操作以相对于逻辑交换机220处理并转发分组。例如,一些实施例定义用于在第2层处理分组的L2转发表或L2转发条目。
一些实施例的第三阶段2670是为逻辑交换机220定义的。一些这样的实施例的第三阶段2670在分组的逻辑上下文上操作以相对于该逻辑交换机确定分组的出口访问控制。例如,可向分组应用出口ACL,以在对分组执行逻辑转发之后控制分组离开逻辑交换机230的访问。基于为逻辑交换机定义的出口ACL,可进一步处理分组(例如,从逻辑交换机的逻辑端口发送出去或发送到调度端口以进一步处理)或者例如可丢弃分组。
在第四阶段2675中,执行出口上下文映射以识别与分组的逻辑转发的结果相对应的物理结果。例如,分组的逻辑处理可指明分组要被从逻辑交换机230的一个或多个逻辑端口(例如,逻辑出口端口)发送出去。这样,出口上下文映射操作识别与逻辑交换机的特定逻辑端口相对应的一个或多个受管理交换元件(包括受管理交换元件2505)的物理端口。
L2处理215的第五阶段2680基于在第四阶段2675执行的出口上下文映射来执行物理映射。在一些实施例中,物理映射确定用于向在第四阶段2675中确定的物理端口转发分组的操作。例如,一些实施例的物理映射确定与受管理交换元件2505的一组端口(未示出)中的一个或多个端口相关联的一个或多个队列(未示出),通过这一个或多个端口来发送分组以便分组到达在第四阶段2675中确定的物理端口。这样,受管理交换元件可沿着网络中的正确路径来路由分组以便分组到达所确定的(一个或多个)物理端口。另外,一些实施例在第五阶段2680完成之后去除逻辑上下文以便在对分组执行逻辑处理管道2600之前将分组返回到其原始状态。
图27概念性示出了一些实施例的实现逻辑路由器225以及逻辑交换机220和230的示例网络体系结构2700。具体而言,网络体系结构2700表示实现逻辑网络的物理网络,这些逻辑网络的数据分组通过逻辑路由器225和逻辑交换机220和230交换和/或路由。该图在其上半部示出了逻辑路由器225以及逻辑交换机220和230。该图在其下半部示出了受管理交换元件2505和2510。该图在其上部和下部都示出了VM 1-4。
在此示例中,逻辑交换机220在逻辑路由器225、VM 1和VM 2之间转发数据分组。逻辑交换机230在逻辑路由器225、VM 3和VM 4之间转发数据分组。如上所述,逻辑路由器225在逻辑交换机220和230以及其它逻辑路由器和交换机(未示出)之间路由数据分组。逻辑交换机220和230以及逻辑路由器225通过逻辑端口(未示出)逻辑地耦合并且通过逻辑端口交换数据分组。这些逻辑端口被映射或附接到受管理交换元件2505和2510的物理端口。
在一些实施例中,逻辑路由器是在受管理网络中的每个受管理交换元件中实现的。当受管理交换元件从耦合到受管理交换元件的机器接收到分组时,受管理交换元件执行逻辑路由。换言之,相对于分组是第一跳交换元件的这些实施例的受管理交换元件执行L3处理210。
在此示例中,受管理交换元件2505和2510是分别在主机2525和2530中运行的软件交换元件。受管理交换元件2505和2510具有实现逻辑交换机220和230的流条目以转发和路由受管理交换元件2505和2510从VM 1-4接收的分组。流条目还实现逻辑路由器225。利用这些流条目,受管理交换元件2505和2510可在网络中的耦合到受管理交换元件2505和2510的网络元件之间转发和路由分组。如图所示,受管理交换元件2505和2510每个具有三个端口(例如VIF),通过这些端口与耦合到受管理交换元件2505和2510的网络元件交换数据分组。在一些情况下,这些实施例中的数据分组将行经在受管理交换元件2505和2510之间建立的隧道(例如,端接于受管理交换元件2505的端口3和受管理交换元件2510的端口3的隧道)。
在此示例中,主机2525和2530的每一个如图所示包括受管理交换元件和若干VM。VM 1-4是虚拟机,这些虚拟机的每一个被指派一组网络地址(例如,用于L2的MAC地址、用于网络L3的IP地址等等)并且能够向其它网络元件发送和从其它网络元件接收网络数据。VM由在主机2525和2530上运行的超管理器(未示出)来管理。
现在将描述通过网络体系结构2700进行的若干示例数据交换。当耦合到逻辑交换机220的VM 1向也耦合到同一逻辑交换机220的VM 2发送分组时,该分组首先被发送到受管理交换元件2505。受管理交换元件2505随后对分组执行L2处理205。L2处理的结果将指示分组应当通过在受管理交换元件2505和2510之间建立的隧道被发送到受管理交换元件2510并通过受管理交换元件2510的端口4到达VM 2。因为VM 1和2在同一逻辑网络中,所以受管理交换元件2505不执行L3处理210和L2处理215。
当耦合到逻辑交换机220的VM 1向耦合到逻辑交换机230的VM 3发送分组时,该分组首先被发送到受管理交换元件2505。受管理交换元件2505对分组执行L2处理205。然而,因为该分组被从一个逻辑网络发送到另一逻辑网络(即,分组的逻辑L3目的地地址是针对另一逻辑网络的),所以需要执行L3处理210。受管理交换元件2505还执行L2处理215。也就是说,受管理交换元件2505作为接收到分组的第一跳交换元件对分组执行整个逻辑处理管道200。执行逻辑处理管道200的结果将指示分组应当通过受管理交换元件2505的端口5被发送到VM 3。从而,分组不必去往另一受管理交换元件,虽然分组确实经过了两个逻辑交换机和一逻辑路由器。
当耦合到逻辑交换机220的VM 1向耦合到逻辑交换机230的VM 4发送分组时,该分组首先被发送到受管理交换元件2505。受管理交换元件2505作为该分组的第一跳交换元件对该分组执行整个逻辑处理管道200。对此分组执行逻辑处理管道200的结果将指示分组应当通过在受管理交换元件2505和2510之间建立的隧道被发送到受管理交换元件2510并且通过受管理交换元件2510的端口5到达VM 4。
图28概念性示出了一些实施例的实现逻辑路由器225以及逻辑交换机220和230的示例网络体系结构2800。具体而言,网络体系结构2800表示实现逻辑网络的物理网络,这些逻辑网络的数据分组通过逻辑路由器225和逻辑交换机220和230交换和/或路由。该图在其上半部示出了逻辑路由器225以及逻辑交换机220和230。该图在其下半部示出了受管理交换元件2505和2510。该图在其上部和下部都示出了VM 1-4。
除了网络体系结构2800附加地包括受管理交换元件2805,网络体系结构2800与网络体系结构2700类似,。一些实施例的受管理交换元件2805是用作池节点的第二级受管理交换元件。
在一些实施例中,网络控制系统(未示出)建立隧道以促成网络元件之间的通信。例如,受管理交换元件2505在此示例中通过隧道耦合到在主机2810中运行的受管理交换元件2805,该隧道如图所示端接于受管理交换元件2505的端口1处。类似地,受管理交换元件2510通过端接于受管理交换元件2510的端口2处的隧道耦合到受管理交换元件2805。与以上图27所示的示例体系结构2700不同,在受管理交换元件2505和2510之间没有建立隧道。
在受管理交换元件2505中实现逻辑路由器225以及逻辑交换机220和230,并且在数据分组交换中涉及第二级受管理交换元件2805。也就是说,受管理交换元件2505和2510通过受管理交换元件2805交换分组。
图29概念性示出了对接收到的分组执行所有L2和L3处理以便转发和路由的第一跳交换元件的示例。图29示出了由受管理交换元件2505和2510来实现逻辑路由器225以及逻辑交换机220和230。如图所示,当受管理交换元件2505是第一跳交换元件时,由受管理交换元件2505执行整个逻辑处理管道200。该图在其左半部示出了逻辑路由器225以及逻辑交换机220和230。该图在其右半部示出了受管理交换元件2505和2510。该图在其右半部和左半部都示出了VM 1-4。
当耦合到逻辑交换机220的VM 1向也耦合到同一逻辑交换机220的VM 2发送分组时,该分组首先通过受管理交换元件2505的端口4被发送到受管理交换元件2505,因为逻辑交换机220的逻辑端口1被附接或映射到受管理交换元件2505的端口4,分组通过这个逻辑端口1进入逻辑交换机220。
受管理交换元件2505随后对分组执行L2处理205。具体而言,受管理交换元件2505首先执行逻辑上下文查找以基于分组的头字段中包括的信息来确定分组的逻辑上下文。在此示例中,分组的源MAC地址是VM 1的MAC地址,并且分组的源IP地址是VM 1的IP地址。分组的目的地MAC地址是VM 2的MAC地址,并且分组的目的地IP地址是VM 2的IP地址。在此示例中,逻辑上下文指明逻辑交换机220是要转发分组的逻辑交换机并且逻辑交换机220的逻辑端口1是通过其接收分组的端口。逻辑上下文还指明逻辑交换机220的端口2是通过其将分组送出到VM 2的端口,因为端口2与VM 2的MAC地址相关联。
受管理交换元件2505随后基于所确定的分组的逻辑上下文来执行逻辑转发查找。受管理交换元件2505为分组确定访问控制。例如,受管理交换元件2505确定分组不具有将使得逻辑交换机220拒绝经过逻辑交换机220的端口1的分组的网络地址(例如,源/目的地MAC/IP地址,等等)。受管理交换元件2505还从逻辑上下文识别出逻辑交换机220的端口2是要发送出分组的端口。另外,受管理交换元件2505相对于逻辑交换机220的端口2为分组确定访问控制。例如,受管理交换元件2505确定分组不具有将使得逻辑交换机220不通过逻辑交换机220的端口2发送分组的网络地址。
受管理交换元件2505随后执行映射查找以确定逻辑交换机220的逻辑端口2被映射到的物理端口。在此示例中,受管理交换元件2505确定逻辑交换机220的逻辑端口2被映射到受管理交换元件2510的端口4。受管理交换元件2505随后执行物理查找以确定用于将分组转发到物理端口的操作。在此示例中,受管理交换元件2505确定分组应当通过在受管理交换元件2505和2510之间建立的隧道被发送到受管理交换元件2510并通过受管理交换元件2510的端口4到达VM 2。因为VM 1和2在同一逻辑网络中,所以受管理交换元件2505不执行L3处理。受管理交换元件2510不对分组执行任何逻辑处理,而只是通过受管理交换元件2510的端口4将分组转发到VM 2。
当耦合到逻辑交换机220的VM 1向耦合到逻辑交换机230的VM 3发送分组时(即,当VM 1和3在不同的逻辑网络中时),该分组首先通过受管理交换元件2505的端口4被发送到受管理交换元件2505。受管理交换元件2505对分组执行L2处理205。具体而言,受管理交换元件2505首先执行逻辑上下文查找以基于分组的头字段中包括的信息来确定分组的逻辑上下文。在此示例中,分组的源MAC地址是VM 1的MAC地址,并且分组的源IP地址是VM 1的IP地址。因为分组被从VM 1发送到在不同逻辑网络中的VM 3,所以分组具有与端口X相关联的MAC地址作为目的地MAC地址(即,在此示例中为01:01:01:01:01:01)。分组的目的地IP地址是VM 3的IP地址(例如,1.1.2.10)。在此示例中,逻辑上下文指明逻辑交换机220是要转发分组的逻辑交换机并且逻辑交换机220的逻辑端口1是通过其接收分组的端口。逻辑上下文还指明逻辑交换机220的端口X是通过其将分组送出到逻辑路由器225的端口,因为端口X与逻辑路由器225的端口1的MAC地址相关联。
受管理交换元件2505随后为分组确定访问控制。例如,受管理交换元件2505确定分组不具有将使得逻辑交换机220拒绝经过逻辑交换机220的端口1的分组的网络地址(例如,源/目的地MAC/IP地址,等等)。受管理交换元件2505还从逻辑上下文识别出逻辑交换机220的端口X是要发送出分组的端口。另外,受管理交换元件2505相对于端口X为分组确定访问控制。例如,受管理交换元件2505确定分组不具有将使得逻辑交换机220不通过端口X发送分组的网络地址。
受管理交换元件2505随后对分组执行L3处理210,因为分组的目的地IP地址1.1.2.10是针对另一逻辑网络的(即,当分组的目的地逻辑网络不同于其流量被逻辑交换机220处理的逻辑网络时)。受管理交换元件2505在L3为分组确定访问控制。例如,受管理交换元件2505确定分组不具有将使得逻辑路由器225拒绝经过逻辑路由器225的逻辑端口1的分组的网络地址。受管理交换元件2505还查找L3流条目并确定分组要被发送到逻辑路由器225的逻辑端口2,因为分组的目的地IP地址1.1.2.10属于与逻辑路由器225的逻辑端口2相关联的1.1.2.1/24的子网地址。另外,受管理交换元件2505相对于逻辑路由器225的逻辑端口2为分组确定访问控制。例如,受管理交换元件2505确定分组不具有将使得逻辑交换机220不通过逻辑端口2发送分组的网络地址。
受管理交换元件2505在执行L3处理210时修改分组的逻辑上下文或分组本身。例如,受管理交换元件2505将分组的逻辑源MAC地址修改为逻辑路由器225的逻辑端口2的MAC地址(即,在此示例中为01:01:01:01:01:02)。受管理交换元件2505还将分组的目的地MAC地址修改为VM 3的MAC地址。
受管理交换元件2505随后执行L2处理215。具体而言,受管理交换元件2505为分组确定访问控制。例如,受管理交换元件2505确定分组不具有将使得逻辑交换机230拒绝经过逻辑交换机230的端口Y的分组的网络地址(例如,源/目的地MAC/IP地址,等等)。受管理交换元件2505随后确定逻辑交换机230的端口1是通过其将分组送出到目的地VM 3的端口。另外,受管理交换元件2505相对于逻辑交换机230的端口1为分组确定访问控制。例如,受管理交换元件2505确定分组不具有将使得逻辑交换机230不通过逻辑交换机230的端口1发送分组的网络地址。
受管理交换元件2505随后执行映射查找以确定逻辑交换机230的逻辑端口1被映射到的物理端口。在此示例中,受管理交换元件2505确定逻辑交换机230的逻辑端口1被映射到受管理交换元件2505的端口5。受管理交换元件2505随后执行物理查找以确定用于将分组转发到物理端口的操作。在此示例中,受管理交换元件2505确定分组应当通过受管理交换元件2505的端口5被发送到VM 3。受管理交换元件2505在此示例中在将分组送出到VM3之前从分组去除逻辑上下文。从而,分组不必去往另一受管理交换元件,虽然分组确实经过两个逻辑交换机和一逻辑路由器。
当耦合到逻辑交换机220的VM 1向耦合到逻辑交换机230的VM 4发送分组时,分组以与从VM 1发送到VM 3的分组被发送到VM 3的方式相类似的方式被发送到VM 4,除了前往VM 4的分组通过在受管理交换元件2505和2510之间建立的隧道被从受管理交换元件2505发送到受管理交换元件2510,并且通过受管理交换元件2510的端口5到达VM 4。
图30A-30B概念性示出了上文参考图29描述的逻辑交换机220和230、逻辑路由器225以及受管理交换元件2505和2510的示例操作。具体而言,图30A示出了实现逻辑交换机220和230以及逻辑路由器225的受管理交换元件2505的操作。图30B示出了受管理交换元件2505的操作。
如图30A的下半部所示,受管理交换元件2505包括L2条目3005和3015以及L3条目3010。这些条目是控制器集群(未示出)提供给受管理交换元件2505的流条目。虽然这些条目被描绘为三个分开的表,但这些表不一定必须是分开的表。也就是说,单个表可包括所有这些流条目。
当耦合到逻辑交换机220的VM 1向耦合到逻辑交换机230的VM 4发送分组3030时,该分组首先通过受管理交换元件2505的端口4被发送到受管理交换元件2505。受管理交换元件2505基于受管理交换元件2505的转发表3005-3015对分组执行L2处理。在此示例中,分组3030具有目的地IP地址1.1.2.10,其为VM 4的IP地址。分组3030的源IP地址是1.1.1.10。分组3030还以VM 1的MAC地址作为源MAC地址并且以逻辑路由器225的逻辑端口1的MAC地址(例如,01:01:01:01:01:01)作为目的地MAC地址。
受管理交换元件2505识别转发表中的实现阶段2605的上下文映射的由带圈的1指示的记录(称为“记录1”)。记录1基于进入端口识别分组3030的逻辑上下文,该进入端口是通过其从VM 1接收分组3030的端口4。此外,记录1指明受管理交换元件2505将分组3030的逻辑上下文存储在分组3030的头的一组字段(例如,VLAN id字段)中。记录1还指明通过转发表来进一步处理分组3030(例如通过将分组3030发送到调度端口)。调度端口在美国专利申请30/177,535中描述。
基于分组3030的头中存储的逻辑上下文和/或其它字段,受管理交换元件2505识别转发表中的实现阶段2610的入口ACL的由带圈的2指示的记录(称为“记录2”)。在此示例中,记录2允许分组3030被进一步处理(即,分组3030可通过逻辑交换机220的入口端口),并且从而指明通过转发表来进一步处理分组3030(例如,通过将分组3030发送到调度端口)。此外,记录2指明受管理交换元件2505将分组3030的逻辑上下文(即,分组3030已被处理管道3000的第二阶段3042处理)存储在分组3030的头的该组字段中。
接下来,受管理交换元件2505基于分组3030的头中存储的逻辑上下文和/或其它字段来识别转发表中的实现阶段2615的逻辑L2转发的由带圈的3指示的记录(称为“记录3”)。记录3指明以逻辑路由器225的逻辑端口1的MAC地址为目的地MAC地址的分组要被发送到逻辑交换机220的逻辑端口X。
记录3还指明通过转发表来进一步处理分组3030(例如,通过将分组3030发送到调度端口)。另外,记录3指明受管理交换元件2505将逻辑上下文存储在分组3030的头的该组字段中(即,分组3030已被处理管道3000的第三阶段2615处理)。
接下来,受管理交换元件2505基于分组3030的头中存储的逻辑上下文和/或其它字段识别转发表中的实现阶段2620的出口ACL的由带圈的4指示的记录(称为“记录4”)。在此示例中,记录4允许分组3030被进一步处理(例如,分组3030可通过逻辑交换机220的端口“X”离开逻辑交换机220),并且从而指明通过受管理交换元件2505的流条目来进一步处理分组3030(例如,通过将分组3030发送到调度端口)。此外,记录4指明受管理交换元件2505将分组3030的逻辑上下文(即,分组3030已被处理管道3000的阶段2620处理)存储在分组3030的头的该组字段中。(要注意,所有记录都指明每当受管理交换元件基于记录执行逻辑处理的某个部分时,该受管理交换元件就更新该组字段中存储的逻辑上下文。)
受管理交换元件2505基于流条目继续处理分组3030。受管理交换元件2505基于分组3030的头中存储的逻辑上下文和/或其它字段来识别L3条目3010中的由带圈的5指示的记录(称为“记录5”),该记录5通过基于分组3030的头中的信息指明受管理交换元件2505应当接受通过逻辑路由器225的逻辑端口1的分组来实现L3入口ACL。
受管理交换元件2505随后识别L3条目3010中的由带圈的6指示的流条目(称为“记录6”),该流条目通过指明具有其目的地IP地址(例如1.1.2.10)的分组3030应当从逻辑路由器225的端口2离开来实现L3路由2640。另外,记录6(或路由表中的另一记录,未示出)指示分组3030的源MAC地址要被改写成逻辑路由器225的端口2的MAC地址(即,01:01:01:01:01:02)。
受管理交换元件2505随后识别L3条目3010中的由带圈的7指示的流条目(称为“记录7”),该流条目通过基于分组3030的头中的信息(例如源IP地址)指明受管理交换元件2505允许分组通过逻辑路由器225的端口2离开来实现L3出口ACL。
基于分组3030的头中存储的逻辑上下文和/或其它字段,受管理交换元件2505识别L2条目3015中的实现阶段2660的入口ACL的由带圈的8指示的记录(称为“记录8”)。在此示例中,记录8指明分组3030被受管理交换元件2505进一步处理(例如通过将分组3030发送到调度端口)。此外,记录8指明受管理交换元件2505将分组3030的逻辑上下文(即,分组3030已被处理管道3000的阶段2660处理)存储在分组3030的头的该组字段中。
接下来,受管理交换元件2505基于分组3030的头中存储的逻辑上下文和/或其它字段来识别L2条目3015中的实现阶段2665的逻辑L2转发的由带圈的9指示的记录(称为“记录9”)。记录9指明以VM 4的MAC地址为目的地MAC地址的分组应当通过连接到VM 4的逻辑交换机230的逻辑端口(未示出)来转发。
记录9还指明通过转发表来进一步处理分组3030(例如,通过将分组3030发送到调度端口)。另外,记录9指明受管理交换元件2505将逻辑上下文(即,分组3030已被处理管道3000的阶段2665处理)存储在分组3030的头的该组字段中。
接下来,受管理交换元件2505基于分组3030的头中存储的逻辑上下文和/或其它字段识别转发表中的实现阶段2670的出口ACL的由带圈的10指示的记录(称为“记录10”)。在此示例中,记录10允许分组3030通过连接到VM 4的逻辑端口(未示出)离开,并且从而指明通过转发表来进一步处理分组3030(例如通过将分组3030发送到调度端口)。此外,记录10指明受管理交换元件2505将分组3030的逻辑上下文(即,分组3030已被处理管道3000的阶段2670处理)存储在分组3030的头的该组字段中。
基于分组3030的头中存储的逻辑上下文和/或其它字段,受管理交换元件2505识别L2条目3015中的实现阶段2675的上下文映射的由带圈的11指示的记录(称为“记录11”)。在此示例中,记录11将与VM 4耦合的受管理交换元件2510的端口5识别为与分组3030要被转发到的逻辑交换机230的逻辑端口(在阶段2665确定)相对应的端口。记录11附加地指明通过转发表来进一步处理分组3030(例如通过将分组3030发送到调度端口)。
基于分组3030的头中存储的逻辑上下文和/或其它字段,受管理交换元件2505随后识别L2条目3015中的实现阶段2680的物理映射的由带圈的12指示的记录(称为“记录12”)。记录12指明受管理交换元件2505的端口3作为通过其发送分组3030的端口以便分组3030到达受管理交换元件2510。在此情况下,受管理交换元件2505将把分组3030从与受管理交换元件2510耦合的受管理交换元件2505的端口3发送出去。
如图30B所示,受管理交换元件2510包括转发表,该转发表包括用于处理和路由分组3030的规则(例如流条目)。当受管理交换元件2510从受管理交换元件2505接收到分组3030时,受管理交换元件2510基于受管理交换元件2510的转发表开始处理分组3030。受管理交换元件2510识别转发表中的实现上下文映射的由带圈的1指示的记录(称为“记录1”)。记录1基于分组3030的头中存储的逻辑上下文来识别分组3030的逻辑上下文。逻辑上下文指明分组3030已被由受管理交换元件2505执行的整个逻辑处理200处理。这样,记录4指明通过转发表来进一步处理分组3030(例如通过将分组3030发送到调度端口)。
接下来,受管理交换元件2510基于分组3030的头中存储的逻辑上下文和/或其它字段,识别转发表中的实现物理映射的由带圈的2指示的记录(称为“记录2”)。记录2指明为了分组3030到达VM 4通过其发送分组3030的受管理交换元件2510的端口5。在此情况下,受管理交换元件2510将把分组3030从与VM 4耦合的受管理交换元件2510的端口5发送出去。在一些实施例中,受管理交换元件2510在将分组发送到VM 4之前从分组3030去除逻辑上下文。
图31概念性示出了受管理交换元件在其上运行的主机的示例软件体系结构。具体而言,此图示出了运行逻辑处理管道以逻辑地转发和路由分组的受管理交换元件使用NAT守护进程来转换网络地址。此图在其上半部示出了主机3100、受管理交换元件3105、转发表3120、NAT守护进程3110和NAT表3115。此图示出了流条目3125和3130。
流条目3125和3130是各自具有限定符和动作的流条目。示为流条目3125和3130的文本可能不是实际的格式。相反,文本只是限定符和动作对的概念图示。在一些实施例中,流条目具有优先级,并且当多于一个流条目的限定符满足时,受管理交换元件采取具有最高优先级的流条目的动作。
主机3100在一些实施例中是由能够运行一组软件应用的操作系统(例如,WindowsTM和LinuxTM)操作的机器。一些实施例的受管理交换元件3105是在主机3100中执行的软件交换元件(例如Open vSwitch)。如上所述,控制器集群(未示出)通过提供指明受管理交换元件的功能的流条目来配置受管理交换元件。一些实施例的受管理交换元件3105自身不生成流条目。
一些实施例的受管理交换元件3105运行上述逻辑处理管道200的全部或一部分。特别地,受管理交换元件3105是执行L3处理210以根据需要基于转发表3120中的流条目对从机器接收的分组进行路由的受管理交换元件(例如,受管理交换元件1720或2505)。在一些实施例中,受管理交换元件3105是从耦合到受管理交换元件的机器(未示出)接收分组的边缘交换元件。在一些这样的实施例中,一个或多个虚拟机(未示出)在主机3100中运行并且耦合到受管理交换元件3105。在其它实施例中,受管理交换元件是第二级受管理交换元件。
当受管理交换元件3105被配置为执行网络地址转换(NAT)时,一些实施例的受管理交换元件3105使用NAT守护进程3110来对分组执行NAT。在一些实施例中,受管理交换元件3105不维持查找表来找出从给定地址转换到的地址。反而,受管理交换元件3105向NAT守护进程3110询问地址。
一些实施例的NAT守护进程3110是在主机3100上运行的软件应用。NAT守护进程3110维护表3115,该表3115包括地址配对(pairing),其中每对包括要彼此转换的两个地址。当受管理交换元件3105寻求从给定地址转换到的地址时,NAT守护进程查找表3115以找出该给定地址应当被转换到的地址。
不同实施例的受管理交换元件3105和NAT守护进程3110使用不同的技术来寻求和提供地址。例如,一些实施例的受管理交换元件3105向NAT守护进程发送分组,该分组具有原始地址,但不具有转换后的地址。这些实施例的NAT守护进程3110将原始地址转换成转换后的地址。NAT守护进程3110将分组发送回受管理交换元件3105,受管理交换元件3105将执行逻辑转发和/或路由以向目的地机器发送分组。在一些实施例中,受管理交换元件3105最初将元数据与包含要解析的原始地址的分组一起发送给NAT守护进程3110。此元数据包括受管理交换元件3105在其接收到从NAT守护进程3110返回的分组时用来继续执行逻辑处理管道的信息(例如,寄存器值、逻辑管道状态,等等)。
在其它实施例中,一些实施例的受管理交换元件3105通过向NAT守护进程3110发送流模板(template)来请求地址,该流模板是不具有地址的实际值的流条目。NAT守护进程通过查找表3115来找出地址以填写流模板。NAT守护进程3110随后通过将已填写的流模板放入转发表3120中来将填写了实际地址的流模板发送回到受管理交换元件3110。在一些实施例中,NAT守护进程向已填写的流模板指派比未填写的流模板的优先级值高的优先级值。另外,当NAT守护进程3110未能找到转换后的地址时,NAT守护进程将在流模板中指明丢弃分组。
现在将按照三个不同的阶段1-3(带圈的1-3)来描述受管理交换元件3105和NAT守护进程3110的示例操作。在此示例中,受管理交换元件3105是从机器(未示出)接收要转发和路由的分组的受管理边缘交换元件。受管理交换元件3105接收分组并基于转发表3120中的流条目来执行L3处理210。
在对分组执行L3处理210的同时,受管理交换元件3105(在阶段1)识别流条目3125并执行流条目3125中指明的动作。如图所示,流条目3125指示具有要被转换成X的IP地址1.1.1.10的流模板应当被发送到NAT守护进程3110。在此示例中,流条目3125具有优先级值N,其在一些实施例中是一数字。
在阶段2,NAT守护进程3110接收流模板并通过查找NAT表3115查明1.1.1.10要被转换成2.1.1.10。NAT守护进程填写流模板并将已填写的模板(现在为流条目3130)插入转发表3120中。在此示例中,NAT守护进程向已填写的模板指派优先级N+1。
在阶段3,受管理交换元件3110使用流条目3130来改变分组的地址。另外,对于受管理交换元件3105随后处理的分组,当分组具有源IP地址1.1.1.10时,受管理交换元件3105使用流条目3130而不是流条目3125。
在一些实施例中,NAT守护进程3110和受管理交换元件运行于在主机3100上运行的同一虚拟机中或者在主机3100上运行的不同虚拟机中。NAT守护进程3110和受管理交换元件也可在分开的主机中运行。
图32概念性示出了一些实施例执行来转换网络地址的过程3200。在一些实施例中,过程3200由执行L3处理210以在L3路由分组的受管理交换元件(例如受管理交换元件1720、2505或3105)执行。过程3200在一些实施例中在该过程接收到要在L3被逻辑路由的分组时开始。
过程3200开始于(在3205)确定分组是否需要网络地址转换(NAT)。在一些实施例中,过程基于流条目来确定分组是否需要NAT。其限定符与分组的头或逻辑上下文中存储的信息匹配的流条目指明分组需要NAT。如上所述,NAT可以是SNAT或DNAT。流条目还将指明要对分组执行哪个NAT。
当过程3200(在3205)确定分组不需要NAT时,过程结束。否则,过程3200(在3210)确定过程3200是否需要从NAT守护进程请求将分组的地址(例如源IP地址)转换成的地址。在一些实施例中,过程3200基于流条目来确定过程是否需要询问NAT守护进程。例如,流条目可指明将分组的地址转换成的地址应当通过从NAT守护进程请求该地址来获得。在一些实施例中,当流条目是对于转换后的地址具有空字段或者在该字段中具有指示应当从NAT守护进程获得转换后的地址的某个其它值的流模板时,过程确定NAT守护进程应当提供转换后的地址。
当过程(在3210)确定过程不需要向NAT守护进程请求地址时,过程(在3220)从流条目获得转换后的地址。例如,流条目将提供转换后的地址。过程随后前进到3225,下文将进一步描述3225。当过程(在3210)确定过程需要从NAT守护进程请求地址时,过程3200在3215从NAT守护进程请求并获得转换后的地址。在一些实施例中,过程3200通过向NAT守护进程发送流模板来请求转换后的地址。NAT守护进程将以转换后的地址来填写流模板并且将把已填写的流模板放入过程使用的转发表(未示出)中。
接下来,过程3200(在3225)利用转换后的地址来修改分组。在一些实施例中,过程修改分组的头中的地址字段。可替代地或连带地,过程修改逻辑上下文以利用转换后的地址来替换分组的地址。过程随后结束。
要注意,本申请中上文和下文使用的MAC地址、IP地址和其它网络地址是用于说明目的的示例,并且可不具有允许范围中的值,除非另有指明。
II.下一跳虚拟化
与外部网络接合(interface)的逻辑网络需要与下一跳路由器交互。不同实施例的虚拟化应用使用不同的模型来使逻辑L3网络通过下一跳路由器与外部网络接合。
第一,在固定附接模型中,物理基础设施与一组受管理集成(integration)元件交互,该组受管理集成元件将接收针对给定IP前缀的所有入口流量并且将把所有的出口流量发送回物理网络。在此模型中,对于每给定的一组受管理集成元件的逻辑L3路由器,逻辑抽象可以是单个逻辑上行链路端口。在一些实施例中,可以存在多于单个的集成集群。由控制应用提供的逻辑控制平面负责向上行链路路由出站(outbound)出口流量。在一些实施例中,受管理集成元件的示例包括用作扩展器的第二级受管理交换元件,扩展器在美国专利申请13/177,535中描述。受管理集成元件的示例还包括上文参考图8、图9和图10描述的受管理交换元件。
第二,在分布式附接模型中,虚拟化应用遍及其连接的所有受管理边缘交换元件来分配附接。为此,受管理边缘交换元件必须集成到物理路由基础设施。换言之,每个受管理边缘交换元件必须能够与该组受管理交换元件之外的物理路由基础设施通信。在一些实施例中,这些交换元件使用IGP协议(或其它路由协议)来与将分组发送到(由受管理交换元件实现的)逻辑网络中并从逻辑网络接收分组的物理交换元件(例如物理路由器)通信。利用此协议,一些实施例的受管理边缘交换元件可通告主机路由(/32)以将直接入口流量吸引(attract)到其恰当位置。虽然在一些实施例中不存在集中式的流量热点(hotspot),因为入口和出口流量是完全分布在受管理交换元件上的,但逻辑抽象仍然是对于逻辑L3路由器的单个逻辑上行链路端口并且逻辑控制平面负责将流量路由到上行链路。没有什么妨碍为逻辑控制平面暴露(expose)多于单个的上行链路端口,如果这对于控制平面有益的话。然而,上行链路端口的数目在此模型中不必与附接点的数目匹配。
第三,在控制平面驱动模型中,逻辑控制平面负责与外部网络集成。以一对一路由集成来暴露控制平面;对于物理网络中的每个附接点,存在一逻辑端口。逻辑控制平面负责在路由协议级与下一跳路由器对等。
三个模型全都碰到了不同的设计权衡:固定附接模型意味着非最优的物理流量路由,但要求较少的与物理基础设施的集成。在分布式模型中,在一些实施例中,完全分布式模型扩展性最好,因为逻辑控制平面不负责所有对等流量,对等流量在极端情形中可能是成千上万的对等会话。然而,控制平面驱动模型对于逻辑控制平面给出了最大控制。不过,最大控制要求策略路由,因为如果需要最优物理路由,则出口端口必须依赖于入口端口。
III.状态分组(stateful packet)操作
状态分组操作将NAT放置在被路由的流量的逻辑L3数据路径上。在逻辑管道中,网络地址转换在实际的标准L3管道之前或之后的另外的NAT阶段中进行。换言之,网络地址转换在路由之前或之后命中(hit)分组。在一些实施例中,NAT配置是经由创建实际地址转换条目的流模板进行的。流模板将在下文中进一步描述。
放置NAT功能是与在第一跳中执行逻辑分组处理的全部或大部分的方法偏离的一个特征。在第一跳执行大部分或全部操作的基本模型在一些实施例中将对在相对方向上流动的分组的处理放置在不同的第一跳交换元件处:对于给定的传输级流,一个方向上的分组将通过一端的逻辑管道来发送,而相反方向上的分组将通过另一端的管道来发送。不幸的是,每个流NAT状态可能相当丰富(尤其如果NAT支持更高级应用协议的话),并且对于给定的传输流,必须在各方向之间共享状态。
因此,一些实施例让逻辑端口的第一跳交换元件接收传输流的开放分组(openingpacket)以对两个方向执行逻辑管道。例如,如果VM A向VM B打开TCP连接,则连接到VM A的超管理器的边缘交换元件(其可与超管理器在同一机器上运行)变得负责通过逻辑管道向两个方向发送分组。这允许了完全分布式的NAT功能,以及在逻辑网络拓扑中具有多个NAT。第一跳交换元件将执行所有必要的NAT转换,无论有多少个这样的NAT转换,并且网络地址转换只是变成分组(在该交换元件内)穿越的LDPS管道中的一个另外的步骤。
然而,放置通过逻辑管道在相反方向上发送的分组的馈送要求额外的措施;否则,反向分组的第一跳交换元件将执行处理(而不使NAT状态本地可用)。为了此目的,一些实施例允许从(以上VM A的)源边缘交换元件发送到(以上VM B的)目的地边缘交换元件的第一分组建立特殊的“提示(hint)状态”,该提示状态使目的地交换元件不进行处理而直接将该传输流的反向分组发送到源交换元件。源交换元件随后将执行相反方向上的管道并且对于反向分组利用本地NAT状态反转NAT操作。一些实施例使用流模板(下文描述)在目的地交换元件处建立此反向提示状态,从而控制器不需要涉及每个流操作。
接下来的两幅图图33和图34示出了放置NAT功能和提示状态。图33概念性示出了一些实施例的执行包括NAT操作2645在内的整个逻辑处理管道200的第一跳交换元件。图33与图29相同,除了逻辑处理管道200包括在L3处理220中描绘的NAT操作2645以指示NAT操作2645被执行。
一些实施例的实现逻辑路由器的受管理交换元件在分组被逻辑路由器路由之后对分组执行NAT操作。例如,当耦合到逻辑交换机220的VM 1向耦合到逻辑交换机230的VM 4发送分组时,受管理交换元件2505在将分组送出到受管理交换元件2510之前将分组的源IP地址(例如1.1.1.10)转换成不同的IP地址(例如3.1.1.10)。受管理交换元件2505基于由管理受管理交换元件2505的控制器集群(未示出)在受管理交换元件2505中配置的一组NAT规则(例如流条目)来执行NAT操作2645。
VM 4接收到的分组以转换后的IP地址3.1.1.10作为分组的源IP地址。从VM 4到VM1的返回分组将以这个转换后的地址作为分组的目的地IP地址。从而,转换后的IP地址必须被转换回VM 1的IP地址以便此分组到达VM 1。然而,一些实施例的受管理交换元件2510不会执行NAT操作2645来为返回的分组恢复VM 1的IP地址,因为用于执行NAT操作的NAT规则仅在受管理交换元件2505中,而不在受管理交换元件2510中。以这种方式,NAT规则和状态不需要被所有潜在的受管理边缘交换元件共享。
图34概念性示出了这种实施例的示例。具体而言,图34示出了当向受管理交换元件2505发送返回分组时受管理交换元件2510不执行逻辑处理管道。此图还示出了受管理交换元件2505在接收到来自受管理交换元件2510的返回分组时执行逻辑处理管道200,就好像受管理交换元件2505相对于此返回分组为第一跳交换元件那样。图34与图33相同,除了逻辑处理管道是在相对方向上被描绘(箭头指向左)。图34还示出了规则3400和转发表3405。
规则3400在一些实施例中是转发表3405中的由管理受管理交换元件2510的控制器集群(未示出)配置的流条目。规则3400指明(或“提示”)当受管理交换元件2510接收到源自受管理交换元件2505的分组时,受管理交换元件2510不应当对去往受管理交换元件2505的返回分组执行逻辑处理管道。
当受管理交换元件2510从受管理交换元件2505接收到受管理交换元件2505已对其执行了NAT操作的分组时,受管理交换元件2510基于分组的头中包括的信息(例如逻辑上下文)来找出规则3400。另外,受管理交换元件2510在一些实施例中修改一个或多个其它流条目以指示不应当对来自前往源机器(例如VM 1)的接收分组的目的地机器(例如VM 4)的分组执行逻辑处理管道。
受管理交换元件2510随后将此分组转发到目的地机器,例如VM 4。当受管理交换元件2510从VM 4接收到要前往VM 1的返回分组时,受管理交换元件2510将不对此分组执行逻辑处理管道。也就是说,受管理交换元件2510将不执行L2的逻辑转发或L3的逻辑路由。受管理交换元件2510将简单地在此分组的逻辑上下文中指示未对该分组执行逻辑处理。
当受管理交换元件2505从受管理交换元件2510接收到此分组时,受管理交换元件2505执行逻辑处理管道200。具体而言,受管理交换元件2505首先执行逻辑上下文查找以基于分组的头字段中包括的信息来确定分组的逻辑上下文。在此示例中,分组的源MAC地址是VM 4的MAC地址,并且分组的源IP地址是VM 4的IP地址。因为分组被从VM 4发送到在不同逻辑网络中的VM 1,所以分组以与逻辑交换机230的端口Y相关联的MAC地址作为目的地MAC地址(即,在此示例中为01:01:01:01:01:02)。分组的目的地IP地址是VM 1的经NAT的IP地址(即,3.1.1.10)。
受管理交换元件2505随后相对于逻辑交换机230为分组确定访问控制。例如,受管理交换元件2505确定分组不具有将使得逻辑交换机230拒绝经过逻辑交换机230的端口2的分组的网络地址(例如,源/目的地MAC/IP地址,等等)。受管理交换元件2505还从逻辑上下文识别出逻辑交换机230的端口Y是发送出分组的端口。另外,受管理交换元件2505相对于端口Y为分组确定访问控制。例如,受管理交换元件2505确定分组不具有将使得逻辑交换机230不通过端口Y发送分组的网络地址。
接下来,受管理交换元件2505对分组执行NAT操作2645以将目的地IP地址转换回VM 1的IP地址。也就是说,受管理交换元件2505在此示例中基于NAT规则利用1.1.1.10来替换3.1.1.10。受管理交换元件2505随后对分组执行L3处理,因为分组的目的地IP地址(现在为1.1.1.10)是针对另一逻辑网络的。受管理交换元件2505相对于逻辑路由器225的端口2在L3为分组确定入口访问控制。受管理交换元件2505还查找流条目并确定分组要被发送到逻辑路由器225的逻辑端口1,因为分组的目的地IP地址1.1.1.10属于与逻辑路由器225的逻辑端口1相关联的1.1.1.1/24的子网地址。另外,受管理交换元件2505相对于逻辑路由器225的逻辑端口1为分组确定出口访问控制。受管理交换元件2505还将分组的目的地MAC地址修改为VM 1的MAC地址。
受管理交换元件2505随后执行L2处理215。在此示例中,分组的源MAC地址现在是逻辑路由器225的逻辑端口1的MAC地址并且分组的源IP地址仍是VM 4的IP地址。分组的目的地IP地址是VM 1的IP地址(即,1.1.1.10)。在此示例中,逻辑上下文指明逻辑交换机220是要转发分组的逻辑交换机并且逻辑交换机220的逻辑端口X是通过其接收分组的端口。逻辑上下文还指明逻辑交换机220的端口1是通过其将分组送出到目的地VM 1的端口,因为端口1与VM 1的MAC地址相关联。
受管理交换元件2505随后基于分组的逻辑上下文执行逻辑转发查找,包括分别相对于逻辑交换机220的端口X和端口1确定入口和出口访问控制。受管理交换元件2505执行映射查找来确定逻辑交换机220的逻辑端口1被映射到的物理端口。在此示例中,受管理交换元件2505确定逻辑交换机220的逻辑端口1被映射到受管理交换元件2505的端口4。受管理交换元件2505随后执行物理查找来确定用于将分组转发到物理端口的操作。在此示例中,受管理交换元件2505确定分组应当通过受管理交换元件2505的端口4被发送到VM 1。
图35概念性示出了一些实施例执行来将分组发送到其地址被NAT的目的地机器的过程3500。过程3500在一些实施例中由直接从源机器接收分组的受管理边缘交换元件执行。
过程3500开始于从源机器接收分组(在3505)。过程随后(在3510)确定分组是否要前往其地址被NAT的目的地机器。在一些实施例中,过程通过查找与分组的头中包括的信息(例如目的地IP地址)匹配的流条目来确定分组是否要前往这样的目的地机器。一个或多个流条目指明当分组被定址到其地址被NAT的目的地机器时,不应当对此分组执行逻辑处理(例如,L2的逻辑转发或L3的逻辑路由)。其它流条目指明当分组被定址到其地址被NAT的目的地机器时应当执行逻辑处理。
当过程3500(在3510)确定分组要前往其地址被NAT的目的地机器时,过程3515前进到下文将进一步描述的3520。当过程3500(在3510)确定分组要前往其地址未被NAT的目的地机器时,过程3500对分组执行逻辑处理(例如,L2的逻辑转发和/或L3的逻辑路由)。
过程3500随后(在3520)将分组发送到去往目的地机器的路线中的下一跳受管理交换元件。过程3500随后结束。
如上所述,在每个分组操作中不涉及控制器。逻辑控制平面仅配设识别什么应当被进行网络地址转换的FIB规则。所有每个流状态都是由数据路径(Open vSwitch)建立的。
上述实施例利用了源NAT。然而,一些实施例同时使用目的地NAT(DNAT)。在DNAT的情况下,所有处理都可在源受管理边缘交换元件处完成。
另外,在将NAT功能放置在外部网络和逻辑网络之间的情况下,操作与以上所述的没有不同。在此情况下,对于从外部网络进入的流,对于两个方向都将在扩展器(其在此情况下将是第一跳受管理边缘交换元件)保持NAT状态。另一方面,对于朝着外部网络发起的传输流,将在附接到发端主机/VM的受管理边缘交换元件处保持状态。
在用于网络地址转换的这个完全分布式方案的情况下,VM移动性支持要求将与VM的建立的NAT状态迁移(migrate)到新的超管理器。如果不迁移NAT状态,则传输连接将断开。对于这种情况,一些实施例被设计为期望NAT对于发送到已关闭/不存在的TCP流的分组以TCP复位来响应。更高级的实现将与促成NAT状态与VM一起迁移的VM管理系统集成;在此情况下,传输连接不必断开。
图36示出了当VM从第一主机迁移到第二主机时将NAT状态从第一主机迁移到第二主机的示例。具体而言,该图示出了使用第一主机的超管理器来迁移VM和与VM相关联的NAT状态。该图示出了两个主机3600和3630。
如图所示,主机3600在此示例中是源主机,VM 3625从该源主机迁移到主机3630。在主机3600中,NAT守护进程3610和受管理交换元件3605在运行。NAT守护进程3610与上文参考图31描述的NAT守护进程3110类似。NAT守护进程3610维护包括原始地址和转换后地址的映射的NAT表3115。受管理交换元件3605使用NAT守护进程3610来获得转换后的地址。受管理交换元件在一些实施例中将流模板发送到NAT守护进程3610以如上所述发送原始地址并获得转换后的地址。
超管理器3680创建并管理在主机3600中运行的VM。在一些实施例中,超管理器3680将在主机3600中运行的VM迁移出主机3600在该VM迁移到另一主机之前通知给受管理交换元件3605和/或NAT守护进程3610。受管理交换元件3605和/或NAT守护进程3610在一些实施例中通过针对在VM迁移情况下的回调(callback)进行注册来获得这种通知。
在一些这样的实施例中,受管理交换元件3605要求NAT守护进程取得与迁移的VM相关联的NAT状态(例如,协议信息和VM的地址映射,等等)并将NAT状态提供给超管理器3680。在一些实施例中,当超管理器3680将迁移直接通知给NAT守护进程3610时,NAT守护进程3610将与迁移的VM相关联的NAT状态提供给超管理器3680。超管理器3680随后将NAT状态与迁移的VM一起迁移到目的地主机。
在一些实施例中,NAT守护进程3610将与迁移的VM相关联的NAT状态直接发送到在目的地主机中运行的NAT守护进程。在这些实施例中,NAT守护进程3610和/或受管理交换元件3605将NAT状态的迁移的完成通知给超管理器3680,以便超管理器3680可开始将VM迁移到目的地主机。
在一些实施例中,受管理交换元件3605还将与迁移的VM有关的流条目提供给超管理器3680或提供给在目的地主机中运行的受管理交换元件。当超管理器3680被提供这些流条目时,超管理器3680将这些流条目发送给在目的地主机中运行的受管理交换元件的流表。流条目到目的地主机的迁移是可选的,因为单独NAT状态就将使得在目的地主机中运行的受管理交换元件能够获得用于迁移的VM的转换后地址。
现在将描述源主机3600的示例操作。当超管理器3680要迁移VM 3625时(例如按照用户输入或来自控制集群的输入),超管理器3680通知受管理交换元件3605。受管理交换元件3605在此示例中随后要求NAT守护进程3610取得与VM 3625相关联的NAT状态并将所取得的状态发送到超管理器3680。
超管理器3680随后通过移动VM的数据来将VM 3625迁移到目的地主机3630。在一些实施例中,超管理器3680能够通过捕获VM 3625的运行状态并将该状态发送到VM 3625来进行实时(live)迁移。超管理器3680还将所取得的NAT状态移动到主机3630的NAT表3645,以便在主机3630中运行的受管理交换元件3635能够为刚被迁移到主机3630中的VM 3625从NAT守护进程3640获得转换后的地址。
图37示出了当VM从第一主机迁移到第二主机时将NAT状态从第一主机迁移到第二主机的另一示例。具体而言,该图示出了使用控制集群来要求第一主机的超管理器取得与迁移的VM相关联的NAT状态并将NAT状态发送给第二主机。该图示出了两个主机3600和3630。然而,在主机3600中运行的超管理器3680在此示例中不支持向受管理交换元件或在源主机中运行的NAT守护进程作出通知。
因为一些实施例的超管理器3680不将VM迁移到目的地主机通知给受管理交换元件或NAT守护进程,所以与迁移的VM相关联的NAT状态在超管理器3680开始或完成将VM迁移到目的地主机之后被发送到目的地主机。特别地,受管理交换元件3635在一些实施例中将通过例如检测3625的MAC地址来检测VM 3625的迁移,该MAC地址对于受管理交换元件3635而言是新的。受管理交换元件3635将VM 3625的添加(因此用于VM 3625的受管理交换元件3635的新端口)通知给控制集群3705。
控制集群3705与上文描述的控制集群1105和2205类似。在接收到来自受管理交换元件3635的关于VM的添加的通知时,控制集群3705要求在源主机3600中运行的超管理器3680取得与被迁移的VM 3625相关联的NAT状态并利用取得的NAT状态来更新NAT表3645。在一些实施例中,控制集群3705附加地要求取得与被迁移的VM 3625相关联的流条目并把这些流条目放入目的地3630的流表3650中。
在一些实施例中,控制集群3705可直接要求受管理交换元件和/或NAT守护进程3610将NAT状态和/或流条目发送给NAT守护进程3640和/或受管理交换元件3635以便利用与被迁移的VM 3625相关联的NAT状态和/或流条目来更新NAT表3645和/或3650。
现在将描述源主机3600、目的地主机3630和控制集群3705的示例操作。当超管理器3680要迁移VM 3625时(例如,按照用户输入或来自控制集群的输入),超管理器3680通过将VM 3625的配置数据或运行状态移动到主机3630来迁移VM 3625。现在在主机3630中运行的VM 3625向受管理交换元件3635发送分组。受管理交换元件3635在此示例中通过辨认出分组的源MAC地址对于受管理交换元件3635是新的来检测VM 3625到主机3630的迁移。受管理交换元件3605在此示例中随后将VM 3625的添加(或者对于VM 3625的新端口的创建)通知给控制集群3705。
控制集群3705随后要求超管理器3680取得与VM 3625相关联的NAT状态并将该NAT状态发送给目的地主机3630。在目的地主机3630中运行的受管理交换元件3635可为刚迁移到主机3630中的VM 3625从NAT守护进程3640获得转换后的地址。
IV.负载均衡
作为L3管道中的另外步骤,一些实施例实现负载均衡。例如,一些实施例实现基于逻辑捆绑(bundle)的负载均衡步骤,其后是目的地网络地址转换。在一些实施例中,(提供负载均衡服务的)逻辑路由器容宿虚拟IP地址,因此将对发送到该虚拟IP地址(VIP)的ARP请求作出响应。这样,即使流量被从集群成员所在的同一L2域发送到VIP,虚拟IP也会保持可工作。
图38示出了执行负载均衡的逻辑路由器和逻辑交换机的示例物理实现。特别地,该图示出了集中式L3路由模型,其中逻辑路由器由L3路由器或受管理交换元件基于流条目实现。该图示出了受管理交换元件3805-3825和VM 3830-3850。该图还示出了包括L2处理3855、DNAT和负载均衡3860、L3路由3865以及L2处理3870和3875的逻辑处理管道。
一些实施例的受管理交换元件3805是用作扩展器的第二级受管理交换元件。一些这样的实施例中的受管理交换元件3805与上文描述的受管理交换元件810和1910的相似之处在于受管理交换元件3805基于流条目(未示出)实现逻辑路由器(未示出)或者在实现逻辑路由器的L3路由器在其上运行的同一主机中运行。此外,受管理交换元件3805执行DNAT和负载均衡3860以将目的地地址转换成另一地址并在提供同一服务(例如web服务)的不同机器(例如VM)之间均衡负载。
受管理交换元件3805-3825实现与VM 3830-3850连接的逻辑交换机(未示出)。VM3840和3850在此示例中提供同一服务。也就是说,VM 3840和3850在一些实施例中共同充当提供同一服务的服务器。然而,VM 3840和3850是具有不同的IP地址的分开的VM。受管理交换元件3805或受管理交换元件3805使用的L3路由器(未示出)执行负载均衡以在VM 3840和3850之间分配工作负载。
在一些实施例中,负载均衡通过将请求服务的分组的目的地地址转换成提供该服务的VM的不同地址来实现。特别地,受管理交换元件3805或受管理交换元件3805使用的L3路由器(未示出)将请求分组的目的地地址转换成若干VM 3840和3850的地址,以使得这些VM中没有特定的VM获得比其它VM多得多的工作负载。关于找出提供服务的VM的当前工作负载的更多细节将在下文中进一步描述。
在一些实施例中,受管理交换元件3805或L3路由器在执行逻辑处理管道的负载均衡3860和DNAT之后执行L3路由3865。因此,受管理交换元件3805或L3路由器在这些实施例中基于转换后的目的地地址将分组路由到不同的受管理交换元件。受管理交换元件3820和3825是边缘交换元件,并且从而直接向VM 3840和3850发送和从VM 3840和3850接收分组。在其它实施例中,受管理交换元件3805或L3路由器在执行逻辑处理管道的负载均衡3860和DNAT之前执行L3路由3865。
现在将描述受管理交换元件3805的示例操作。受管理交换元件3810接收请求由VM3840和3850共同提供的服务的分组。此分组来自VM 3830中的一个,具体而言来自使用特定协议的应用。该分组在此示例中包括识别特定协议的协议号。该分组还包括表示提供服务的服务器的IP地址作为目的地IP地址。为了描述简单起见,对此分组执行源L2处理3855的细节被省略,因为其与上文和下文描述的源L2处理示例类似。
在执行源L2处理3855以将分组路由到受管理交换元件3805以执行包括L3路由3865的L3处理之后。在此示例中,受管理交换元件3805对分组执行DNAT和负载均衡3860。也就是说,受管理交换元件3805将分组的目的地IP地址转换成提供服务的VM中的一个的IP地址。在此示例中,受管理交换元件3805选择VM 3840-3850中的在它们之中具有最小工作负载的一个。受管理交换元件3805基于新的目的地IP地址对分组执行L3路由3865(即,路由分组)。
受管理交换元件3820接收分组,因为目的地IP地址具有VM 3840中的一个,并且此目的地IP被解析成该VM的MAC地址。受管理交换元件3820将分组转发到VM。此VM将把分组返回给原本请求服务的应用。这些返回的分组将到达受管理交换元件3805,并且受管理交换元件3805将执行NAT并识别出该应用是这些分组的目的地。
图39示出了执行负载均衡的逻辑路由器和逻辑交换机的另一示例物理实现。特别地,此图示出了分布式L3路由模型,其中逻辑路由器由也执行源和目的地L2处理的受管理交换元件实现。也就是说,此受管理交换元件执行整个逻辑处理管道。此图示出了受管理交换元件3905和3820-3825以及VM 3910和3840-3850。此图还示出了包括L2处理3855、DNAT和负载均衡3860、L3路由3865以及L2处理3870-3875的逻辑处理管道。
一些实施例的受管理交换元件3905与上文参考图29描述的受管理交换元件2505的相似之处在于受管理交换元件3905实现整个逻辑处理管道。也就是说,受管理交换元件3905实现逻辑路由器和逻辑交换机。此外,受管理交换元件3905执行DNAT和负载均衡3860以将目的地地址转换成另一地址并在提供同一服务(例如web服务)的不同机器(例如VM)之间均衡负载。
如上所述,受管理交换元件3905实现与VM 3910和3840-3850连接的逻辑交换机(未示出)。受管理交换元件3905还执行负载均衡以在VM 3840和3850之间分配工作负载。特别地,受管理交换元件3905将请求分组的目的地地址转换成若干VM 3840和3850的地址,以使得这些VM中没有特定的VM得到比其它VM多得多的工作负载。关于找出提供服务的VM的当前工作负载的更多细节将在下文中进一步描述。
在一些实施例中,受管理交换元件3905在执行逻辑处理管道的DNAT和负载均衡3860之后执行L3路由3865。因此,受管理交换元件3905基于转换后的目的地地址将分组路由到不同的受管理交换元件。受管理交换元件3820和3825是边缘交换元件,并且从而直接向VM 3840和3850发送和从VM 3840和3850接收分组。在其它实施例中,受管理交换元件3905在执行逻辑处理管道的DNAT和负载均衡3860之前执行L3路由3865。
受管理交换元件3905的操作将与上文参考图38描述的示例操作类似,除了受管理交换元件3905执行包括DNAT和负载均衡3860在内的整个逻辑处理管道。
图40示出了执行负载均衡的逻辑路由器和逻辑交换机的另一示例物理实现。特别地,此图示出了分布式L3路由模型,其中逻辑路由器由也执行源L2处理的受管理交换元件实现。也就是说,此受管理交换元件作为第一跳受管理交换元件执行源L2处理和L3处理。目的地L2处理由作为最末跳受管理交换元件的另一受管理交换元件执行。此图示出了受管理交换元件4005和3820-3825以及VM 4010和3840-3850。此图还示出了包括L2处理3855、DNAT和负载均衡3860、L3路由3865以及L2处理3870-3875的逻辑处理管道。
一些实施例的受管理交换元件4005与上文参考图46描述的受管理交换元件2505的相似之处在于受管理交换元件4005执行逻辑处理管道的源L2处理和L3处理。也就是说,受管理交换元件4005实现逻辑路由器和与源机器相连的逻辑交换机。此外,受管理交换元件4005执行DNAT和负载均衡3860以将目的地地址转换成另一地址并在提供同一服务(例如web服务)的不同机器(例如VM)之间均衡负载。
如上所述,受管理交换元件4005实现与VM 4010中的一个或多个连接的逻辑交换机(未示出)。受管理交换元件4005还执行负载均衡以在VM 3840和3850之间分配工作负载。特别地,受管理交换元件4005将请求分组的目的地地址转换成若干VM 3840和3850的地址,以使得这些VM中没有特定的VM得到比其它VM多得多的工作负载。关于找出提供服务的VM的当前工作负载的更多细节将在下文中进一步描述。
在一些实施例中,受管理交换元件4005在执行逻辑处理管道的DNAT和负载均衡3860之后执行L3路由3865。因此,受管理交换元件4005基于转换后的目的地地址将分组路由到不同的受管理交换元件。受管理交换元件3820和3825是边缘交换元件,并且从而直接向VM 3840和3850发送和从VM 3840和3850接收分组。在其它实施例中,受管理交换元件4005在执行逻辑处理管道的DNAT和负载均衡3860之前执行L3路由3865。
受管理交换元件4005的操作将与上文参考图38描述的示例操作类似,除了不同的受管理交换元件执行逻辑处理管道的不同部分。
图41概念性示出了在共同提供服务(例如web服务)的机器之间均衡负载的负载均衡守护进程。具体而言,此图示出了运行逻辑处理管道以逻辑地转发和路由分组的受管理交换元件使用负载均衡守护进程来在提供服务的机器之间均衡工作负载。此图在其上半部示出了主机4100、受管理交换元件4105、转发表4120、负载均衡守护进程4110和连接表4115。此图示出了流条目4125和4130。
流条目4125和4130各自具有限定符和动作。示为流条目4125和4130的文本可能不是实际的格式。相反,文本只是限定符和动作对的概念图示。主机4100在一些实施例中是由能够运行一组软件应用的操作系统(例如,WindowsTM和LinuxTM)操作的机器。一些实施例的受管理交换元件4105是在主机4100中执行的软件交换元件(例如Open vSwitch)。如上所述,控制器集群(未示出)通过提供指明受管理交换元件的功能的流条目来配置受管理交换元件。一些实施例的受管理交换元件4105自身不生成流条目。
一些实施例的受管理交换元件4105运行上文参考图38-40描述的逻辑处理管道的全部或一部分。特别地,受管理交换元件4105执行L3处理以根据需要基于转发表4120中的流条目对从机器接收的分组进行路由。在一些实施例中,受管理交换元件4105是从耦合到受管理交换元件的机器(未示出)接收分组的边缘交换元件。在一些这样的实施例中,一个或多个虚拟机(未示出)在主机4100中运行并且耦合到受管理交换元件4105。
当受管理交换元件4105被配置为执行负载均衡时,一些实施例的受管理交换元件4105使用负载均衡守护进程4110来对分组执行负载均衡。负载均衡守护进程4110与NAT守护进程3110的相似之处在于负载均衡守护进程4110提供转换后的目的地地址(例如,目的地IP地址)。此外,负载均衡守护进程4110基于表4115中包括其IP地址的机器的当前负载来选择要将原始目的地地址转换到的目的地。
一些实施例的负载均衡守护进程4110是在主机4100上运行的软件应用。负载均衡守护进程4110维护连接表4115,该连接表4115包括提供服务的机器的可用地址和连接识别符的配对。虽然没有描绘出,但一些实施例的连接表4115还可包括为与地址相关联的机器量化的当前的工作负载。在一些实施例中,负载均衡守护进程4110周期性地与提供服务的VM通信以得到VM的更新状态,其中包括VM的当前工作负载。
当受管理交换元件4105寻求基于连接识别符来选择的地址时,负载均衡守护进程在一些实施例中查找表4115以找出给定的目的地地址应当被转换成的地址。在一些实施例中,负载均衡守护进程运行调度方法来识别服务器VM以便在服务器VM之间均衡负载。这种调度算法考虑与地址相关联的机器的当前负载。负载均衡方法的更多细节和示例在美国临时专利申请61/560,279中描述,这里通过引用并入该申请。
连接识别符唯一地识别服务的请求者(即,分组的起源或来源)和最后提供所请求的服务的机器之间的连接,以便从机器返回的分组能够被准确地中继回请求者。这些返回的分组的源IP地址将被转换回表示提供服务的服务器的IP地址(称为“虚拟IP地址”)。这些连接识别符之间的映射也将用于随后从该来源发送的分组。在一些实施例中,连接识别符包括源端口、目的地端口、源IP地址、目的地IP地址、协议识别符,等等。源端口是从其发送分组的端口(例如,TCP端口)。目的地端口是分组被发送到的端口。协议识别符识别用于格式化分组的协议(例如,TCP、UDP等等)的类型。
不同实施例的受管理交换元件4105和负载均衡守护进程4110使用不同的技术来寻求和提供地址。例如,一些实施例的受管理交换元件4105将具有原始地址但不具有转换后地址的分组发送给负载均衡守护进程。这些实施例的负载均衡守护进程4110将原始地址转换成转换地址。负载均衡守护进程4110将分组发送回受管理交换元件4105,受管理交换元件4105将执行逻辑转发和/或路由以向目的地机器发送分组。在一些实施例中,受管理交换元件4105最初将元数据与包含要解析的原始地址的分组一起发送给负载均衡守护进程4110。此元数据包括受管理交换元件4105在其接收到从负载均衡守护进程4110返回的分组时用来继续执行逻辑处理管道的信息(例如,寄存器值、逻辑管道状态,等等)。
在其它实施例中,一些实施例的受管理交换元件4105通过向负载均衡守护进程4110发送流模板来请求地址,流模板是不具有地址的实际值的流条目。负载均衡守护进程通过查找表4115来查明地址以填写流模板。负载均衡守护进程4110随后通过将已填写的流模板放入转发表4120中来将填入了实际地址的流模板发送回到受管理交换元件4110。在一些实施例中,负载均衡守护进程向已填写的流模板指派比未填写的流模板的优先级值高的优先级值。另外,当负载均衡守护进程4110未能找到转换后的地址时,负载均衡守护进程将在流模板中指明丢弃分组。
现在将按照三个不同的阶段1-3(带圈的1-3)来描述受管理交换元件4105和负载均衡守护进程4110的示例操作。在此示例中,受管理交换元件4115是从机器(未示出)接收要转发和路由的分组的受管理边缘交换元件。具体地,分组在此示例中是针对服务的请求。分组具有表示提供所请求的服务的服务器的IP地址。
受管理交换元件4105接收此分组并基于转发表4120中的流条目来执行L3处理。在对分组执行L3处理210的同时,受管理交换元件4105(在阶段1)识别流条目4125并执行流条目4125中指明的动作。如图所示,流条目4125指示具有连接识别符的流模板应当被发送到负载均衡守护进程4110以让负载均衡守护进程4110提供新的目的地IP地址。在此示例中,流条目4125具有优先级值N,其在一些实施例中为一数字。
在阶段2,负载均衡守护进程4110接收流模板并通过查找连接表4115并运行调度算法来查明具有指明的连接ID的分组的目的地IP地址要被转换成2.1.1.10。负载均衡守护进程填写流模板并将已填写的模板(现在是流条目4130)插入到转发表4130中。在此示例中,负载均衡守护进程向已填写的模板指派优先级N+1。
在阶段3,受管理交换元件4110使用流条目4130来改变分组的目的地IP地址。另外,对于受管理交换元件4105随后处理的分组,当分组具有指明的连接识别符时,受管理交换元件4105使用流条目4130而不是流条目4125。
在一些实施例中,负载均衡守护进程4110和受管理交换元件运行于在主机4100上运行的同一虚拟机中或者在主机4100上运行的不同虚拟机中。负载均衡守护进程4110和受管理交换元件也可在分开的主机中运行。
V.DHCP
虚拟化应用在一些实施例中定义将DHCP请求路由到在共享主机中运行的DHCP守护进程的转发规则。对于此功能使用共享主机避免了对每个客户运行一DHCP守护进程的另外的成本。
图42示出了为不同用户向不同逻辑网络提供DHCP服务的DHCP守护进程。此图在其左半部示出了分别为两个不同用户A和B实现示例逻辑网络4201和4202。逻辑网络4201和4202的示例物理实现在该图的右半部示出。
如该图的左半部所示,逻辑网络4201包括逻辑路由器4205和两个逻辑交换机4210和4215。VM 4220和4225连接到逻辑交换机4210。也就是说,VM 4220和4225发送和接收被逻辑交换机4210转发的分组。VM 4230连接到逻辑交换机4215。逻辑路由器4205在逻辑交换机4210和4215之间路由分组。逻辑路由器4205还连接到DHCP守护进程4206,DHCP守护进程4206向逻辑网络4201中的VM提供DHCP服务,逻辑网络4201中的VM是用户A的VM。
用户B的逻辑网络4202包括逻辑路由器4235以及两个逻辑交换机4240和4245。VM4250和4255连接到逻辑交换机4240。VM 4260连接到逻辑交换机4245。逻辑路由器4235在逻辑交换机4240和4245之间路由分组。逻辑路由器4235还连接到DHCP守护进程4236,DHCP守护进程4236向逻辑网络4202中的VM提供DHCP服务,逻辑网络4202中的VM是用户B的VM。
在该图的左半部所示的逻辑实现中,用户的每个逻辑网络具有其自己的DHCP守护进程。在一些实施例中,DHCP守护进程4206和4236可在物理上实现为在不同的主机或VM中运行的分开的DHCP守护进程。也就是说,每个用户将具有仅用于该用户的机器的单独的DHCP守护进程。
在其它实施例中,用于不同用户的DHCP守护进程可在物理上实现为向不同用户的VM提供DHCP服务的单个DHCP守护进程。也就是说,不同的用户共享同一DHCP守护进程。DHCP守护进程4270是为用户A和B两者的VM服务的共享DHCP守护进程。如该图的右半部所示,为用户A和B实现逻辑路由器4205和4235以及逻辑交换机4210、4215、4240和4245的受管理交换元件4275-4285使用单个DHCP守护进程4270。因此,用户A和B的VM 4220-4260使用DHCP守护进程4270来动态地获得地址(例如IP地址)。
不同实施例的DHCP守护进程4270可在不同主机中运行。例如,一些实施例的DHCP守护进程4270在受管理交换元件4275-4285中的一个在其中运行的同一主机(未示出)中运行。在其它实施例中,DHCP守护进程4270不在受管理交换元件在其上运行的主机中运行,而是在受管理交换元件可访问的单独的主机中运行。
图43示出了一中央DHCP守护进程和若干本地DHCP守护进程。中央DHCP守护进程通过本地DHCP守护进程向不同用户的VM提供DHCP服务。每个本地DHCP守护进程维护和管理一批地址以将中央DHCP守护进程的服务卸载(offload)到本地DHCP守护进程。此图示出了包括中央DHCP守护进程4320和两个本地DHCP守护进程4330和4350的示例体系结构。
如图所示,中央DHCP守护进程4320在主机4305中运行,受管理交换元件4306也在该主机4305中运行。一些实施例的受管理交换元件4306是对于受管理交换元件4340和4360用作池节点的第二级受管理交换元件。中央DHCP守护进程4320向不同用户的不同VM 4345和4365提供DHCP服务。在一些实施例中,中央DHCP守护进程4320将各批地址中的可用地址(例如IP地址)4325分配到包括本地DHCP守护进程4330和4350在内的不同本地DHCP守护进程以便将DHCP服务卸载到这些本地DHCP守护进程。当本地DHCP守护进程在其自己的那批地址中用完了可指派的可用地址时,中央DHCP守护进程4320向该本地DHCP守护进程提供更多地址。
本地DHCP守护进程4330在主机4310中运行,受管理交换元件4340也在主机4310中运行。受管理交换元件4340是直接向VM 4345发送和从VM 4345接收分组的边缘交换元件。受管理交换元件4340实现不同用户的一个或多个逻辑交换机和逻辑路由器。也就是说,VM4345可属于不同用户。本地DHCP守护进程4330利用本地DHCP守护进程4330从中央DHCP守护进程4320获得的那批地址4335向VM4345提供DHCP服务。当本地DHCP守护进程4330在该批地址4335中用完了指派的可用地址时,本地DHCP守护进程4330求助于中央DHCP守护进程4320。在一些实施例中,本地DHCP守护进程4330经由受管理交换元件4340和4306与中央DHCP守护进程4320通信。在一些实施例中受管理交换元件4340和4306具有在它们之间建立的隧道。
类似地,本地DHCP守护进程4350在主机4315中运行,受管理交换元件4360也在主机4315中运行。受管理交换元件4360是直接向VM 4365发送和从VM 4365接收分组的边缘交换元件。受管理交换元件4360实现不同用户的一个或多个逻辑交换机和逻辑路由器。本地DHCP守护进程4350利用本地DHCP守护进程4350从中央DHCP守护进程4320获得的那批地址4355向VM 4365提供DHCP服务。在一些实施例中,这批地址4355不包括在分配给在主机4310中运行的本地DHCP守护进程的那批地址4335中的地址。当本地DHCP守护进程4350在该批地址4355中用完可指派的可用地址时,本地DHCP守护进程4350也求助于中央DHCP守护进程4320。在一些实施例中,本地DHCP守护进程4350经由受管理交换元件4360和4306与中央DHCP守护进程4320通信。在一些实施例中受管理交换元件4360和4306具有在它们之间建立的隧道。
VI.插入服务(interposing service)VM
在以上论述中,描述了一些实施例的虚拟化应用提供的各种L3服务。为了使网络控制系统的灵活性最大化,一些实施例插入服务机器,这些服务机器提供与用户现今在物理网络中使用的“中间盒”(middlebox)提供的功能类似的功能。
从而,一些实施例的网络控制系统包括至少一个附接到逻辑网络的LDPS的“中间盒”VM。然后,LDP集合的管道状态被(填充逻辑控制平面的)控制应用编程,以使得相关分组被转发到此VM的逻辑端口。在VM处理了该分组之后,分组被发送回逻辑网络,使得其转发通过逻辑网络继续。在一些实施例中,网络控制系统利用许多这种“中间盒”VM。以这种方式插入的中间盒VM可以是非常有状态的,并且实现远超本文档中描述的L3服务的特征。
VII.可扩展性(scalability)
下面讨论一些实施例的逻辑L3交换设计沿着三个维度的可扩展性含义。这三个维度是:(1)逻辑状态,(2)物理隧道状态,以及(3)分布式绑定(binding)查找。逻辑管道处理的大部分发生在第一跳。这意味着所有互连的LDP集合的所有逻辑(表)状态在一些实施例中被散布(disseminate)到网络中可发生管道执行的每个地方。换言之,所有互连的LDP集合的组合逻辑状态在一些实施例中被散布到附接于这些LDP集合中的任何一个的每个受管理边缘交换元件。然而,在一些实施例中,逻辑拓扑的“网格性(meshiness)”不增大逻辑状态的散布负担。
为了限制状态散布,一些实施例在源和目的地设备之间均衡管道执行,以使得最末的LDPS管道不是在第一跳执行,而是在最末跳执行。然而,在一些情况下,这可导致没有散布足够的状态来供每个受管理交换元件进行最末LDPS的逻辑转发决策;没有该状态,源受管理交换元件可能甚至不能够将分组递送到目的地受管理交换元件。从而,一些实施例将约束一般的LDPS模型,以便在源和目的地设备之间均衡管道执行。
逻辑状态本身不太可能包含多于最多O(N)个条目(N是互连的LDP集合中的逻辑端口的总数),因为逻辑控制平面在一些实施例中被设计为模仿现今使用的物理控制平面,而物理控制平面受到现有的硬件交换芯片集的能力的限制。因此,散布逻辑状态可能不是系统的主要瓶颈,但随着逻辑控制平面设计的发展,最终其可能会变成一个瓶颈。
一些实施例将网络的受管理交换元件划分成由更高级的聚集(aggregation)交换元件互连的团(clique)。代替实现划分以利用“全都在第一跳上(everything on thefirst-hop)”模型来减少逻辑状态,一些实施例进行划分以减少隧道状态,如下文所讨论的那样。团的示例在上述美国专利申请13/177,535中描述。此申请还描述了在第一跳受管理交换元件处执行逻辑数据处理的全部或大部分的各种实施例。
整个系统中维护的物理隧道状态是O(N2),其中N是互连的LDP集合中的逻辑端口的总数。这是因为任何具有逻辑端口的受管理边缘交换元件都必须能够直接发送流量到目的地受管理边缘交换元件。因此,以有效的方式维护隧道状态而不对任何集中式控制元件施加O(N2)负载变得比纯L2LDP集合更重要。聚集交换元件在一些实施例中用于将网络切(slice)成团。在这些实施例中的一些中,分组仍然一直在源受管理边缘交换元件中被逻辑地路由,但是代替直接地将其隧道到目的地边缘交换元件,它被发送到基于目的地MAC地址将其朝着目的地路由的池节点。实质上,最末的L2LDPS横跨多个团,并且池节点用于将该L2域的各部分联接在一起。
图44-45B示出了基于受管理交换元件的流条目在若干受管理交换元件中实现的分布式逻辑路由器。特别地,图44-45B示出了目的地L2处理中的一些由最末跳受管理交换元件(即,将分组直接发送到目的地机器的交换元件)执行。
图44概念性示出了在最末跳交换元件处执行一些逻辑处理的示例。具体而言,图44示出了耦合到分组的源机器的受管理交换元件2505执行逻辑处理管道200的大部分,并且耦合到目的地机器的受管理交换元件2510执行逻辑处理管道200的一些。该图在其左半部示出了逻辑路由器225以及逻辑交换机220和230。该图在其右半部示出了受管理交换元件2505和2510。该图在其右半部和左半部都示出了VM 1-4。
在一些实施例中,受管理交换元件不保持所有信息(例如,查找表中的流条目)来执行整个逻辑处理管道200。例如,这些实施例的受管理交换元件不维护用于相对于目的地逻辑网络的通过其将分组发送到分组的目的地机器的逻辑端口确定访问控制的信息。
现在将描述沿着受管理交换元件2505和2510的示例分组流。当耦合到逻辑交换机220的VM 1向耦合到逻辑交换机230的VM 4发送分组时,该分组首先被发送到受管理交换元件2505。受管理交换元件2505随后对分组执行L2处理205和L3处理210。
受管理交换元件2505随后执行L2处理215的一部分。具体而言,受管理交换元件2505为分组确定访问控制。例如,受管理交换元件2505确定分组不具有将使得逻辑交换机230拒绝经过逻辑交换机230的端口Y的分组的网络地址(例如,源/目的地MAC/IP地址,等等)。受管理交换元件2505随后确定逻辑交换机230的端口1是通过其将分组送出到目的地VM 4的端口。然而,受管理交换元件2505不相对于逻辑交换机230的端口1为分组确定访问控制,因为受管理交换元件2505在一些实施例中不具有用来执行出口ACL 2670的信息(例如流条目)。
受管理交换元件2505随后执行映射查找以确定逻辑交换机230的逻辑端口1被映射到的物理端口。在此示例中,受管理交换元件2505确定逻辑交换机230的逻辑端口1被映射到受管理交换元件2510的端口5。受管理交换元件2505随后执行物理查找以确定用于将分组转发到物理端口的操作。在此示例中,受管理交换元件2505确定分组应当通过受管理交换元件2505的端口5被发送到VM 4。受管理交换元件2505在此示例中在将逻辑上下文与分组一起送出到VM 4之前修改分组的逻辑上下文。
受管理交换元件2505将分组发送到受管理交换元件2510。在一些情况下,受管理交换元件2505通过在受管理交换元件2505和2510之间建立的隧道(例如,端接于受管理交换元件2505的端口3和受管理交换元件2510的端口3的隧道)发送分组。当隧道不可用时,受管理交换元件2505将分组发送到池节点(未示出),以便分组可到达受管理交换元件2510。
当受管理交换元件2510接收到分组时,受管理交换元件2510基于分组的逻辑上下文(逻辑上下文将会指示剩下来要对分组执行的是出口ACL 2670)对分组执行出口ACL2670。例如,受管理交换元件2510确定分组不具有将使得逻辑交换机230不通过逻辑交换机230的端口1发送分组的网络地址。受管理交换元件2510随后如执行L2处理215的受管理交换元件2505所确定的那样通过受管理交换元件2510的端口5将分组发送到VM 4。
图45A-45B概念性示出了上文参考图44描述的逻辑交换机220和230、逻辑路由器225以及受管理交换元件2505和2510的示例操作。具体而言,图45A示出了实现逻辑路由器225、逻辑交换机220和逻辑交换机230的一部分的受管理交换元件2505的操作。图45B示出了实现逻辑交换机230的一部分的受管理交换元件2510的操作。
如图45A的下半部所示,受管理交换元件2505包括L2条目4505和4515以及L3条目4510。这些条目是控制器集群(未示出)提供给受管理交换元件2505的流条目。虽然这些条目被描绘为三个分开的表,但这些表不一定必须是分开的表。也就是说,单个表可包括所有这些流条目。
当耦合到逻辑交换机220的VM 1向耦合到逻辑交换机230的VM 4发送分组4530时,该分组首先通过受管理交换元件2505的端口4被发送到受管理交换元件2505。受管理交换元件2505基于受管理交换元件2505的转发表4505-4515对分组执行L2处理。在此示例中,分组4530具有目的地IP地址1.1.2.10,这是VM 4的IP地址。分组4530的源IP地址是1.1.1.10。分组4530还以VM 1的MAC地址作为源MAC地址并且以逻辑路由器225的逻辑端口1的MAC地址(例如,01:01:01:01:01:01)作为目的地MAC地址。
受管理交换元件2505的直到受管理交换元件识别带圈的9并执行L2逻辑处理2665为止的操作与图30A的示例中的受管理交换元件2505的操作类似,除了图45A的示例中的受管理交换元件2505是对分组4530执行的。
基于分组4530的头中存储的逻辑上下文和/或其它字段,受管理交换元件2505随后识别L2条目4515中的实现阶段2675的上下文映射的由带圈的10指示的记录(称为“记录10”)。在此示例中,记录10将与VM 4耦合的受管理交换元件2510的端口5识别为与分组4530要被转发到的逻辑交换机230的逻辑端口(在阶段2665确定)相对应的端口。记录10附加地指明通过转发表来进一步处理分组4530(例如通过将分组4530发送到调度端口)。
基于分组4530的头中存储的逻辑上下文和/或其它字段,受管理交换元件2505随后识别L2条目4515中的实现阶段2680的物理映射的由带圈的11指示的记录(称为“记录11”)。记录11指明受管理交换元件2505的端口3作为通过其发送分组4530的端口以便分组4530到达受管理交换元件2510。在此情况下,受管理交换元件2505将把分组4530从与受管理交换元件2510耦合的受管理交换元件2505的端口3发送出去。
如图45B所示,受管理交换元件2510包括转发表,该转发表包括用于处理和路由分组4530的规则(例如流条目)。当受管理交换元件2510从受管理交换元件805接收到分组4530时,受管理交换元件2510基于受管理交换元件2510的转发表开始处理分组4530。受管理交换元件2510识别转发表中的实现上下文映射的由带圈的1指示的记录(称为“记录1”)。记录1基于分组4530的头中存储的逻辑上下文来识别分组4530的逻辑上下文。逻辑上下文指明分组4530已被受管理交换元件805处理到阶段2665。这样,记录1指明通过转发表来进一步处理分组4530(例如通过将分组4530发送到调度端口)。
接下来,受管理交换元件2510基于分组4530的头中存储的逻辑上下文和/或其它字段来识别转发表中的实现出口ACL的由带圈的2指示的记录(称为“记录2”)。在此示例中,记录2允许分组4530被进一步处理,并且从而指明通过转发表来进一步处理分组4530(例如,通过将分组4530发送到调度端口)。此外,记录2指明受管理交换元件2510将分组4530的逻辑上下文(即,对于逻辑交换机230的L2出口ACL,分组4530已被处理)存储在分组4530的头的该组字段中。
接下来,受管理交换元件2510基于分组4530的头中存储的逻辑上下文和/或其它字段来识别转发表中的实现物理映射的由带圈的3指示的记录(称为“记录3”)。记录3指明为了分组4530到达VM 4要通过其发送分组4530的受管理交换元件2510的端口5。在此情况下,受管理交换元件2510将把分组4530从与VM 4耦合的受管理交换元件2510的端口5发送出去。在一些实施例中,受管理交换元件2510在将分组发送到VM 4之前从分组4530去除逻辑上下文。
图46-47B示出了基于受管理交换元件的流条目在若干受管理交换元件中实现的分布式逻辑路由器。特别地,图46-47B示出了源L2处理205和L3处理210由第一跳受管理交换元件(即,直接从源机器接收分组的交换元件)执行,并且整个目的地L2处理215由最末跳受管理交换元件(即,直接向目的地机器发送分组的交换元件)执行。
图46概念性示出了在最末跳交换元件处执行一些逻辑处理的示例。图46示出了耦合到分组的源机器的受管理交换元件2505执行L2处理205和L3处理210,并且耦合到目的地机器的受管理交换元件2510执行L2处理215。也就是说,受管理交换元件2505执行针对源逻辑网络的L2转发并且执行L3路由,而针对目的地逻辑网络的L2转发由受管理交换元件2510执行。该图在其左半部示出了逻辑路由器225以及逻辑交换机220和230。该图在其右半部示出了受管理交换元件2505和2510。该图在其右半部和左半部都示出了VM 1-4。
在一些实施例中,受管理交换元件不保持所有的信息(例如,查找表中的流条目)来执行整个逻辑处理管道200。例如,这些实施例的受管理交换元件不维护用于对分组执行针对目的地逻辑网络的逻辑转发的信息。
现在将描述沿着受管理交换元件2505和2510的示例分组流。当耦合到逻辑交换机220的VM 1向耦合到逻辑交换机230的VM 4发送分组时,该分组首先被发送到受管理交换元件2505。受管理交换元件2505随后对分组执行L2处理205和L3处理210。
受管理交换元件2505将分组发送到受管理交换元件2510。在一些情况下,受管理交换元件2505通过在受管理交换元件2505和2510之间建立的隧道(例如端接于受管理交换元件2505的端口3和受管理交换元件2510的端口3的隧道)发送分组。当隧道不可用时,受管理交换元件2505将分组发送到池节点(未示出),以便分组可到达受管理交换元件2510。
当受管理交换元件2510接收到分组时,受管理交换元件2510基于分组的逻辑上下文(逻辑上下文将指示剩下来要对分组执行的是整个L2处理215)对分组执行L2处理215。受管理交换元件2510随后通过受管理交换元件2510的端口5将分组发送到VM 4。
图47A-47B概念性示出了上文参考图46描述的逻辑交换机220和230、逻辑路由器225以及受管理交换元件2505和2510的示例操作。具体而言,图47A示出了实现逻辑交换机220和逻辑路由器225的受管理交换元件2505的操作。图47B示出了实现逻辑交换机230的受管理交换元件2505的操作。
如图47A的下半部所示,受管理交换元件2505包括L2条目4705和L3条目4710。这些条目是控制器集群(未示出)提供给受管理交换元件2505的流条目。虽然这些条目被描绘为三个分开的表,但这些表不一定必须是分开的表。也就是说,单个表可包括所有这些流条目。
当耦合到逻辑交换机220的VM 1向耦合到逻辑交换机230的VM 4发送分组4730时,该分组首先通过受管理交换元件2505的端口4被发送到受管理交换元件2505。受管理交换元件2505基于受管理交换元件2505的转发表4705-4710对分组执行L2处理。在此示例中,分组4730具有目的地IP地址1.1.2.10,这是VM 4的IP地址。分组4730的源IP地址是1.1.1.10。分组4730还以VM 1的MAC地址作为源MAC地址并且以逻辑路由器225的逻辑端口1的MAC地址(例如,01:01:01:01:01:01)作为目的地MAC地址。
受管理交换元件2505的直到受管理交换元件识别带圈的7并执行相对于逻辑路由器225的端口2的L3出口ACL为止的操作与图47A的示例中的受管理交换元件2505的操作类似,除了图47A的示例中的受管理交换元件2505是对分组4730执行的。
基于分组4730的头中存储的逻辑上下文和/或其它字段,受管理交换元件2505随后识别L2条目4710中的实现阶段2680的物理映射的由带圈的8指示的记录(称为“记录8”)。记录8指明逻辑交换机230在受管理交换元件2510中实现并且分组应当被发送到受管理交换元件2510。
基于分组4730的头中存储的逻辑上下文和/或其它字段,受管理交换元件2505随后识别L2条目4715中的实现阶段2680的物理映射的由带圈的9指示的记录(称为“记录9”)。记录9指明受管理交换元件2505的端口3作为要通过其发送分组4730的端口以便分组4730到达受管理交换元件2510。在此情况下,受管理交换元件2505将把分组4730从与受管理交换元件2510耦合的受管理交换元件2505的端口3发送出去。
如图47B所示,受管理交换元件2510包括转发表,该转发表包括用于处理和路由分组4730的规则(例如流条目)。当受管理交换元件2510从受管理交换元件2510接收到分组4730时,受管理交换元件2510基于受管理交换元件2510的转发表开始处理分组4730。受管理交换元件2510识别转发表中的实现上下文映射的由带圈的1指示的记录(称为“记录1”)。记录1基于分组4730的头中存储的逻辑上下文来识别分组4730的逻辑上下文。逻辑上下文指明受管理交换元件810已对分组4730执行了L2处理205和L3处理210。记录1指明通过转发表来进一步处理分组4730(例如通过将分组4730发送到调度端口)。
基于分组4730的头中存储的逻辑上下文和/或其它字段,受管理交换元件2510识别L2转发表中的实现L2入口ACL的由带圈的2指示的记录(称为“记录2”)。在此示例中,记录2允许分组4730通过逻辑交换机230(未示出)的逻辑端口Y,并且从而指明由受管理交换元件2510进一步处理分组4730(例如通过将分组4730发送到调度端口)。此外,记录2指明受管理交换元件2510将分组4730的逻辑上下文(即,分组4730已被处理管道4700的阶段4762处理)存储在分组4730的头的该组字段中。
接下来,受管理交换元件2510基于分组4730的头中存储的逻辑上下文和/或其它字段识别L2转发表中的实现逻辑L2转发的由带圈的3指示的记录(称为“记录3”)。记录3指明以VM 4的MAC地址作为目的地MAC地址的分组应当通过与VM 4连接的逻辑交换机230的逻辑端口2转发。
记录3还指明通过转发表来进一步处理分组4730(例如,通过将分组4730发送到调度端口)。此外,记录3指明受管理交换元件2510将逻辑上下文(即,分组4730已被处理管道4700的阶段4766处理)存储在分组的该组字段中。
接下来,受管理交换元件2510基于分组4730的头中存储的逻辑上下文和/或其它字段识别转发表中的实现出口ACL的由带圈的4指示的记录(称为“记录4”)。在此示例中,记录4允许分组4730被进一步处理,并且从而指明通过转发表来进一步处理分组4730(例如,通过将分组4730发送到调度端口)。此外,记录4指明受管理交换元件2510将分组4730的逻辑上下文(即,对于逻辑交换机230的L2出口ACL,分组4730已被处理)存储在分组4730的头的该组字段中。
基于分组4730的头中存储的逻辑上下文和/或其它字段,受管理交换元件2505随后识别L2条目4715中的实现上下文映射的由带圈的5指示的记录(称为“记录5”)。在此示例中,记录5将与VM 4耦合的受管理交换元件2510的端口5识别为与分组4730要被转发到的逻辑交换机230的逻辑端口2相对应的端口。记录5附加地指明通过转发表来进一步处理分组4730(例如通过将分组1330发送到调度端口)。
接下来,受管理交换元件2510基于分组4730的头中存储的逻辑上下文和/或其它字段来识别转发表中的实现物理映射的由带圈的6指示的记录(称为“记录6”)。记录6指明为了分组4730到达VM 4要通过其发送分组4730的受管理交换元件2510的端口5。在此情况下,受管理交换元件2510将把分组4730从与VM 4耦合的受管理交换元件2510的端口5发送出去。在一些实施例中,受管理交换元件2510在将分组发送到VM 4之前从分组4730去除逻辑上下文。
在分组的逻辑路径上对所有管道的执行提示了分布式查找,即ARP和学习。由于查找现在可由任何具有附接到逻辑网络的逻辑端口的边缘交换元件执行,所以查找的总量将会超过在类似的物理拓扑上执行的查找;即使分组将前往同一端口,不同的发送者也不能共享缓存的查找状态,因为查找将在不同的受管理边缘交换元件上发起。因此,洪泛的问题被逻辑拓扑放大了,并且基于单播映射的查找方案在实践中是优选的。
通过向一群映射服务器(例如池或根节点发送特殊查找分组,源边缘交换元件可以进行必要的查找,而不求助于洪泛。在一些实施例中,映射服务器受益于大流量聚集本地性(并因此受益于客户端侧的良好的缓存命中率)以及仅限数据路径的实现,这种实现导致了良好的吞吐量。
图48概念性示出了受管理交换元件在其上运行的主机4800的示例软件体系结构。具体而言,此图示出了主机4800还运行L3守护进程,该L3守护进程为L3守护进程从受管理交换元件接收的分组将L3地址(例如IP地址)解析成L2地址(例如MAC地址)。此图在其上半部示出了主机4800包括受管理交换元件4805、转发表4820、L3守护进程4810和映射表4815。此图还示出了流条目4825和4830。
流条目4825和4830各自具有限定符和动作。示为流条目4825和4830的文本可能不是实际的格式。相反,文本只是限定符和动作对的概念图示。在一些实施例中,流条目具有优先级,并且当多于一个流条目的限定符被满足时,受管理交换元件采取具有最高优先级的流条目的动作。
主机4800在一些实施例中是由能够运行一组软件应用的操作系统(例如,WindowsTM和LinuxTM)操作的机器。一些实施例的受管理交换元件4805是在主机4800中执行的软件交换元件(例如Open vSwitch)。如上所述,控制器集群(未示出)通过提供指明受管理交换元件的功能的流条目来配置受管理交换元件。一些实施例的受管理交换元件4805自身不生成流条目和ARP请求。
一些实施例的受管理交换元件4805运行上述逻辑处理管道200的全部或一部分。特别地,受管理交换元件4805是执行L3处理210以根据需要基于转发表4820中的流条目对从机器接收的分组进行路由的受管理交换元件(例如,受管理交换元件1720或2505)。在一些实施例中,受管理交换元件4805是从耦合到受管理交换元件的机器(未示出)接收分组的边缘交换元件。在一些这样的实施例中,一个或多个虚拟机(未示出)在主机4800中运行并且耦合到受管理交换元件4805。在其它实施例中,受管理交换元件是第二级受管理交换元件。
当受管理交换元件4805接收到正是被发送到在另一逻辑网络中的目的地机器的第一个分组的分组(或者该分组本身是ARP请求)时,这些实施例的受管理交换元件4805还不知道目的地机器的MAC地址。换言之,受管理交换元件4805不知道下一跳IP地址与目的地MAC地址之间的映射。为了将下一跳IP地址解析成目的地MAC地址,一些实施例的受管理交换元件4805从L3守护进程4810请求分组的目的地MAC地址。
一些实施例的L3守护进程4810是在主机4800上运行的软件应用。L3守护进程4810维护表4815,该表4815包括IP和MAC地址的映射。当受管理交换元件4805寻求与下一跳IP地址相对应的目的地MAC地址时,L3守护进程查找映射表4815以找出源IP地址被映射到的目的地MAC地址。(在一些情况下,源IP地址被映射到的目的地MAC地址是下一跳逻辑路由器的MAC地址)。
不同实施例的受管理交换元件4805和L3守护进程4810使用不同的技术来寻求和提供地址。例如,一些实施例的受管理交换元件4805向L3守护进程发送分组,该分组具有目的地IP地址,但不具有目的地MAC地址。这些实施例的L3守护进程4810将IP地址解析成目的地MAC地址。L3守护进程4810将分组发送回受管理交换元件4805,受管理交换元件4805将执行逻辑转发和/或路由以向目的地机器发送分组。在一些实施例中,受管理交换元件4805最初将元数据与包含要解析的目的地IP地址的分组一起发送给L3守护进程4810。此元数据包括受管理交换元件4805在其接收到从L3守护进程4810返回的分组时用来继续执行逻辑处理管道的信息(例如,寄存器值、逻辑管道状态,等等)。
在其它实施例中,受管理交换元件4805通过向L3守护进程4810发送流模板来请求目的地地址,该流模板是不具有目的地MAC地址的实际值的流条目。L3守护进程通过查找映射表4815来找出目的地MAC地址以填写流模板。L3守护进程4810随后通过将已填写的流模板放入转发表4820中来将填入了实际目的地MAC地址的流模板发送回到受管理交换元件4810。在一些实施例中,L3守护进程向已填写的流模板指派比未填写的流模板的优先级值高的优先级值。
当映射表4815具有针对目的地IP地址的条目并且该条目具有映射到目的地IP地址的目的地MAC地址时,L3守护进程4810使用该目的地MAC地址来写入分组中或填入流模板中。当没有这样的条目时,L3守护进程生成ARP请求并将该ARP分组广播到其它运行L3守护进程的主机或VM。特别地,一些实施例的L3守护进程仅将ARP请求发送到下一跳逻辑L3路由器可附接到的主机或VM。L3守护进程从接收到ARP分组的主机或VM中的一个接收对ARP分组的响应,该响应包含目的地MAC地址。L3守护进程4810将目的地IP地址映射到目的地MAC地址并将此映射添加到映射表4815。在一些实施例中,L3守护进程4810周期性地向响应了ARP请求的另一L3守护进程发送单播分组以检查目的地MAC地址的有效性。以这种方式,L3守护进程4810将IP和MAC地址映射保持为最新。
在一些实施例中,当L3守护进程4810在查找了流条目并向其它L3守护进程实例发送ARP请求之后仍未能找到解析出的地址时,L3守护进程将在流模板中指明丢弃分组,或者L3守护进程自身将丢弃分组。
当受管理交换元件4805接收到来自另一主机或VM的ARP分组时,一些实施例的受管理交换元件4805不将该ARP分组转发到与该受管理交换元件耦合的机器。这些实施例中的受管理交换元件4800将ARP分组发送到L3守护进程。L3守护进程在映射表4815中维护在本地可用的IP地址与MAC地址(例如,耦合到受管理交换元件4805的机器的IP地址和MAC地址)之间的映射。当映射表4815具有针对接收到的ARP分组的IP地址的条目并且该条目具有耦合到受管理交换元件4805的VM的MAC地址时,L3守护进程响应于ARP分组将MAC地址发送给该ARP分组所源自的主机或VM(即,该主机或VM的L3守护进程)。
现在将按照三个不同的阶段1-3(带圈的1-3)来描述受管理交换元件4805和L3守护进程4810的示例操作。在此示例中,受管理交换元件4805是从机器(未示出)接收要转发和路由的分组的受管理边缘交换元件。受管理交换元件4805接收分组并基于转发表4820中的流条目来执行逻辑处理200。
当分组恰好是携带目的地机器的IP地址的第一个分组或者分组是来自源机器的ARP请求时,受管理交换元件4820(在阶段1)识别流条目4825并且执行流条目4825中指明的动作。如图所示,流条目4825指示具有要被解析成目的地MAC X的目的地IP地址1.1.2.10的流模板应当被发送到L3守护进程4810。在此示例中,流条目4825具有优先级值N,其在一些实施例中为一数字。
在阶段2,L3守护进程4810接收流模板并通过查找映射表4815查明1.1.2.10要被解析成01:01:01:01:01:09。L3守护进程填写流模板并将已填写的模板(现在是流条目4830)插入转发表4830中。在此示例中,L3守护进程向已填写的模板指派优先级N+1。
在阶段3,受管理交换元件4810在一些实施例中使用流条目4830来为分组设定目的地MAC地址。另外,对于受管理交换元件4810随后处理的分组,当分组具有目的地IP地址1.1.2.10时,受管理交换元件4805使用流条目4830而不是流条目4825。
在一些实施例中,L3守护进程4810和受管理交换元件运行于在主机4800上运行的同一虚拟机中或者在主机4800上运行的不同虚拟机中。在一些实施例中,L3守护进程4810在虚拟机的用户空间中运行。L3守护进程4810和受管理交换元件也可在分开的主机中运行。
在一些实施例中,受管理交换元件4805不依赖于L3守护进程4810来解析地址。在一些这样的实施例中,控制集群(图48中未示出)可静态地配置流条目4820,以使得流条目4820包括通过API调用(即,输入)或DHCP获得的IP地址到MAC地址之间的映射。
图49概念性示出了一些实施例执行来解析网络地址的过程4900。在一些实施例中,过程4900由执行L3处理210以在L3路由分组的受管理交换元件(例如受管理交换元件1720、2505或3105)执行。过程4900在一些实施例中在该过程接收到要在L3逻辑路由的分组时开始。
过程4900开始于(在4905)确定分组是否需要地址解析(例如,将目的地IP地址解析成目的地MAC地址)。在一些实施例中,过程基于流条目来确定分组是否需要L3处理。其限定符与分组的头或逻辑上下文中存储的信息匹配的流条目指明分组需要地址解析。
当过程4900(在4905)确定分组不需要地址解析时,过程结束。否则,过程4900(在4910)确定过程4900是否需要从L3守护进程请求将分组的地址(例如目的地IP地址)解析成的地址。在一些实施例中,过程4900基于流条目来确定过程是否需要询问L3守护进程。例如,流条目可指明将分组的地址解析成的地址应当通过从L3守护进程请求解析出的地址来获得。在一些实施例中,当流条目是对于解析出的地址具有空字段或者在该字段中具有指示应当从L3守护进程获得解析出的地址的某个其它值的流模板时,过程确定L3守护进程应当提供解析出的地址。
当过程(在4910)确定过程不需要从L3守护进程请求地址时,过程(在4920)从流条目获得解析出的地址。例如,流条目将提供转换后的地址。过程随后前进到4925,下文将进一步描述4925。当过程(在4910)确定过程需要从L3守护进程请求地址时,过程4900在4915从L3守护进程请求并获得解析出的地址。在一些实施例中,过程4900通过向L3守护进程发送流模板来请求解析出的地址。L3守护进程将利用解析出的地址填写流模板并且将把已填写的流模板放入过程使用的转发表(未示出)中。
接下来,过程4900利用解析出的地址来修改分组。在一些实施例中,过程修改分组的头中的地址字段。可替代地或连带地,过程修改逻辑上下文利用解析出的地址来替换分组的地址。过程随后结束。
图50示出了一些实施例的网络体系结构5000。具体而言,此图示出了允许了各自运行L3守护进程的若干主机(或VM)以避免广播ARP请求的映射服务器。此图示出了一组主机(或VM),包括5005、5010和5015。
主机5010和5015与上文参考图48描述的主机4805的相似之处在于主机5010和5015运行L3守护进程、受管理交换元件和一个或多个VM。
主机5005运行映射服务器。一些实施例的映射服务器5005维护全局映射表5020,该全局映射表5020包括在网络中的每一个运行受管理边缘交换元件的主机中运行的L3守护进程所维护的所有映射表的所有条目。在一些实施例中,网络中的L3守护进程发送本地可用的IP地址与MAC地址映射之间的映射的条目。每当耦合到主机的受管理交换元件的机器存在变化时(例如,当VM发生故障或者耦合到受管理交换元件或与受管理交换元件解除耦合时),主机的L3守护进程就相应更新各自的本地映射表并且还向映射服务器5005发送更新(例如通过发送包含更新的特殊“公布(publish)”分组),以便映射服务器5005保持全局映射表5005随着变化而更新。
在一些实施例中,在运行受管理边缘交换元件的每个主机中运行的L3守护进程在本地映射不具有针对要解析的目的地IP地址的条目时不广播ARP分组。反而,L3守护进程咨询映射服务器5005来将目的地IP地址解析成目的地MAC地址。映射服务器5005通过查找全局映射表5020来将目的地IP地址解析成目的地MAC地址。在映射服务器5005不能解析IP地址的情况下(例如,当全局映射表5020不具有针对该IP地址的条目或者映射服务器5005发生故障时),L3守护进程将采取广播ARP分组到其它运行受管理边缘交换元件的主机。在一些实施例中,映射服务器5005在实现第二级受管理交换元件(例如池节点)的同一主机或VM中实现。
图51示出了一些实施例执行来维护包括IP和MAC地址的映射的映射表的过程5100。在一些实施例中,过程5100由向映射服务器请求解析出的地址的L3守护进程执行。映射服务器在这些实施例中为一组受管理交换元件维护包括IP和MAC地址的映射的全局映射表。过程5100在一些实施例中在过程从受管理交换元件接收到要解析的特定地址时开始。
过程开始于(在5105)确定过程对于从受管理交换元件接收的特定地址是否具有解析出的地址。在一些实施例中,过程查找包括IP和MAC地址的映射的本地映射表来确定过程对于特定地址是否具有解析出的地址。
当过程5100确定过程具有解析出的地址时,过程前进到5120,下文将进一步描述5120。否则,过程5100从映射服务器请求并获得解析出的地址。过程5100随后(在5115)利用从映射服务器获得的解析出的地址来修改本地映射表。在一些实施例中,过程5100将解析出的地址和该特定地址的新映射插入到本地映射表中。
过程5100随后将解析出的地址发送到受管理交换元件。在一些实施例中,过程5100修改具有该特定地址的分组。在其它实施例中,过程5100修改受管理交换元件作为对解析出的地址的请求已发送的流模板。过程随后结束。
图52示出了一些实施例执行来维护包括IP和MAC地址的映射的映射表的过程5200。在一些实施例中,过程5200由维护本地映射表并向映射服务器发送更新的L3守护进程执行。映射服务器在这些实施例中为一组受管理交换元件维护包括IP和MAC地址的映射的全局映射表。过程5200在一些实施例中在L3守护进程开始运行时开始。
过程5200开始于(在5205)监视一组受管理交换元件。特别地,过程5200监视机器与受管理交换元件的耦合和解除耦合或者耦合到受管理交换元件的机器的任何地址变化。在一些实施例中,该组受管理交换元件包括在L3守护进程在其上运行的同一主机或虚拟机上运行的那些受管理交换元件。
接下来,过程5200(在5210)确定对于过程监视的受管理交换元件是否存在这样的变化。当过程(在5210)确定不存在变化时,过程5200循环回5205以继续保持监视该组受管理交换元件。否则,过程(在5215)修改本地映射表中的相应条目。例如,当VM迁移并耦合到该组中的受管理交换元件中的一个时,过程将迁移的VM的IP地址和MAC地址的映射插入到本地映射表中。
过程5200随后向映射服务器发送更新后的映射以便映射服务器可利用IP地址和MAC地址的新的和/或修改后的映射来更新全局映射表。过程随后结束。
VIII.流生成和流处理
如上所述,一些实施例的受管理交换元件基于由一些实施例的控制器集群(一个或多个控制器实例)提供给受管理交换元件的流表来实现逻辑交换机和逻辑路由器。在一些实施例中,控制器集群基于控制器集群检测到的输入或网络事件通过执行表映射操作来生成这些流条目。这些控制器集群及其操作的细节在美国专利申请13/177,533以及以上并入的标题为“Chassis Controller”且代理人案卷号为NCRA.P0081的同时递交的美国专利申请**中描述。
如这个同时递交的美国专利申请中提到的,一些实施例中的网络控制系统是包括若干控制器实例的分布式控制系统,这些控制器实例允许系统接受来自用户的逻辑数据路径集合并且配置交换元件来实现这些逻辑数据路径集合。在一些实施例中,一种类型的控制器实例是执行一个或多个模块的设备(例如通用计算机),这些模块将用户输入从逻辑控制平面转换到逻辑转发平面,然后将逻辑转发平面数据变换到物理控制平面数据。这些模块在一些实施例中包括控制模块和虚拟化模块。控制模块允许用户指明并填充逻辑数据路径集合,而虚拟化模块通过将逻辑数据路径集合映射到物理交换基础设施上来实现指明的逻辑数据路径集合。在一些实施例中,控制和虚拟化模块是两个分开的应用,而在其它实施例中它们是同一应用的一部分。
从对于特定逻辑数据路径集合的逻辑转发平面数据,一些实施例的虚拟化模块生成对于实现逻辑数据路径集合的任何受管理交换元件通用的通用物理控制平面(UPCP)数据。在一些实施例中,此虚拟化模块是作为该特定逻辑数据路径集合的主控制器的控制器实例的一部分。此控制器被称为逻辑控制器。
在一些实施例中,UPCP数据随后被转换成针对每个特定受管理交换元件的定制物理控制平面(CPCP)数据,该转换由作为该特定受管理交换元件的主物理控制器实例的控制器实例进行,或者由该特定受管理交换元件的机箱控制器(Chassis Controller)进行,这在标题为“Chassis Controller”且代理人案卷号为NCRA.P0081的同时递交的美国专利申请**中被进一步描述。当机箱控制器生成CPCP数据时,机箱控制器通过物理控制器从逻辑控制器的虚拟化模块获得UPCP数据。
无论是物理控制器还是机箱控制器生成CPCP数据,针对特定受管理交换元件的CPCP数据都需要被传播到该受管理交换元件。在一些实施例中,通过网络信息库(NIB)数据结构来传播CPCP数据,网络信息库数据结构在一些实施例中是面向对象的数据结构。使用NIB数据结构的若干示例在美国专利申请13/177,529和13/177,533中描述,这里通过引用并入这些美国专利申请。如这些申请中所述,NIB数据结构在一些实施例中也可用来充当不同的控制器实例之间的通信媒介,并且存储关于逻辑数据路径集合(例如逻辑交换元件)和/或实现这些逻辑数据路径集合的受管理交换元件的数据。
然而,其它实施例不使用NIB数据结构来将CPCP数据从物理控制器或机箱控制器传播到受管理交换元件、在控制器实例之间通信以及存储关于逻辑数据路径集合和/或受管理交换元件的数据。例如,在一些实施例中,物理控制器和/或机箱控制器经由配置协议通过OpenFlow条目和更新来与受管理交换元件通信。另外,在一些实施例中,控制器实例使用一个或多个直接通信信道(例如RPC调用)来交换数据。此外,在一些实施例中,控制器实例(例如这些实例的控制和虚拟化模块)按照被写入到关系数据库数据结构中的记录来表达逻辑和/或物理数据。在一些实施例中,此关系数据库数据结构是用于实现控制器实例的一个或多个模块的表映射引擎(称为nLog)的输入和输出表的一部分。
图53概念性示出了一些实施例的控制器集群的三个控制器实例。这三个控制器实例包括用于从作为API调用接收的逻辑控制平面(LCP)数据生成UPCP数据的逻辑控制器5300,以及分别用于定制受管理交换元件5320和5325特定的UPCP数据的物理控制器5390和5330。具体而言,一些实施例的逻辑控制器5300通过利用诸如nLog之类的表映射处理器(未示出)对表执行表映射操作来生成通用流。nLog引擎在美国专利申请13/177,533中描述。该图还示出了用户5325以及受管理交换元件5320和5325。
如图所示,逻辑控制器5300包括控制应用5305和虚拟化应用5310。在一些实施例中,控制应用5305用于接收逻辑控制平面数据,并且将此数据转换成逻辑转发平面数据,该逻辑转发平面数据随后被提供给虚拟化应用5310。虚拟化应用5310从逻辑转发平面数据生成通用物理控制平面数据。
在一些实施例中,逻辑控制平面数据中的一些是从输入转换来的。在一些实施例中,逻辑控制器5300支持一组API调用。逻辑控制器具有将该组API调用转换成LCP数据的输入转换应用(未示出)。利用API调用,用户可配置逻辑交换机和逻辑路由器,就好像用户在配置物理交换元件和路由器那样。
物理控制器5390和5330分别是受管理交换元件5320和5325的主控(master)。一些实施例的物理控制器5390和5330从逻辑控制器5300接收UPCP数据并且将UPCP数据分别转换成用于受管理交换元件5320和5325的CPCP数据。物理控制器5390随后将用于受管理交换元件5320的CPCP数据发送到受管理交换元件5320。物理控制器5330将用于受管理交换元件5325的CPCP数据发送给受管理交换元件5325。用于受管理交换元件5320和5325的CPCP数据采用流条目的形式。受管理交换元件5320和5325随后基于流条目执行转发和路由分组。如美国专利申请13/177,533中所述,从LCP数据到LFP数据然后到CPCP数据的这个转换利用nLog引擎来执行。
即使图53示出了两个物理控制器对于两个不同的受管理交换元件从UPCP数据生成CPCP数据,普通技术人员将会认识到,在其它实施例中,物理控制器起到简单地将UPCP数据中继到每个交换元件的机箱控制器的作用,机箱控制器进而生成该交换元件的CPCP数据并将此数据推送给其交换元件。
图54示出了示例体系结构5400和用户界面5405。具体而言,此图示出了用户向控制器应用发送以便以期望的方式配置逻辑交换机和路由器。此图在其左半部示出了四个阶段5406-5409中的用户界面(UI)5405。此图还在其右半部示出了包括逻辑路由器5425以及两个逻辑交换机5420和5430的体系结构5400。
UI 5405是示例界面,通过该界面用户可输入一些输入并从控制器实例接收响应以便管理逻辑交换机和路由器。在一些实施例中,UI 5405是作为web应用提供的,并且从而可利用web浏览器来打开。可替代地或连带地,一些实施例的控制应用可允许用户通过命令行界面输入并接收输入。
该图的左半部示出了用户输入一些输入来设置控制器实例管理的网络的一组受管理交换元件要实现的逻辑交换机和逻辑路由器中的逻辑端口。特别地,用户通过(在阶段5406)提供端口的识别符“RP1”、与端口相关联的IP地址“1.1.1.253”以及网络掩码“255.255.255.0”来向逻辑路由器LR添加逻辑端口。用户还通过(在5407)提供端口识别符“SP1”,并且指明该端口要连接到逻辑路由器的逻辑端口RP1来向逻辑交换机LS1添加逻辑端口。用户还通过(在阶段5408)提供端口的识别符“RP2”、与端口相关联的IP地址“1.1.2.253”以及网络掩码“255.255.255.0”来向逻辑路由器LR添加另一逻辑端口。用户还通过(在5409)提供端口识别符“SP2”,并且指明该端口要连接到逻辑路由器的逻辑端口RP2来向逻辑交换机LS2添加另一逻辑端口。该图的右半部示出了添加到逻辑路由器和逻辑交换机的端口。
图55-62概念性示出了控制应用5305的示例操作。这些图示出了一组表,控制应用5305使用并修改这组表以便生成要提供给受管理交换元件的流条目。具体而言,受管理交换元件(未示出)基于上文参考图54描述的输入来实现添加到逻辑交换机5420和5430以及逻辑路由器5400的逻辑端口。该图示出了控制应用5305、虚拟化应用5310和物理控制器5330。
如图所示的控制应用5305包括输入转换5505、输入表5510、规则引擎5515、输出表5520、导出器(exporter)5525。
输入转换5505在一些实施例中与管理工具交互,用户可利用该管理工具来查看和/或修改逻辑网络状态。不同的实施例向用户提供不同的管理工具。例如,输入转换5505在一些实施例中提供图形工具,例如上文参考图54描述的UI 5405。代替图形工具或结合图形工具,其它实施例可向用户提供命令行工具或任何其它类型的管理工具。输入转换5505通过管理工具从用户接收输入并处理接收到的输入以创建、填充和/或修改一个或多个输入表5510。
输入表5510与美国专利申请13/288,908中描述的输入表类似,这里通过引用并入该美国专利申请。输入表在一些情况下表示用户管理的逻辑交换机和逻辑路由器的状态。例如,输入表5530是存储与逻辑交换机的逻辑端口相关联的无类域间路由(CIDR)格式的IP地址的表。控制应用利用控制应用通过管理工具接收到的输入或者控制应用检测到的任何网络事件来修改输入表。在控制应用5305修改输入表之后,控制应用5305使用规则引擎5515来处理经修改的输入表。
不同实施例的规则引擎5515对不同组输入表执行数据库操作的不同组合以填充和/或修改不同组输出表5520。例如,当输入表5530被改变以指示创建了逻辑路由器的逻辑端口时,规则引擎5515修改表5535以将MAC地址关联到逻辑路由器的逻辑端口。输出表5565包括流条目,这些流条目指明实现逻辑交换机和逻辑路由器的受管理交换元件对被路由/转发的网络数据执行的动作。除了表5530-5560以外,规则引擎5515还可使用其它输入表、常数表和函数表来促成规则引擎5515的表映射操作。
输出表也可用作规则引擎5515的输入表。也就是说,输出表中的变化可触发规则引擎5515要执行的另一表映射操作。因此,表5530-5560中的条目可产生于执行表映射操作,并且也可为另一组表映射操作向规则引擎5515提供输入。这样,输入表和输出表在此图中在单个点线框中示出以指示这些表是输入和/或输出表。
表5535用于存储逻辑路由器的逻辑端口和关联的MAC地址的配对。表5540是逻辑路由器在路由分组时使用的逻辑路由表。在一些实施例中,表5540将被发送到实现逻辑路由器的受管理交换元件。表5550用于为逻辑路由器的逻辑端口存储下一跳识别符和IP地址。表5555用于存储逻辑交换机的逻辑端口与逻辑路由器的逻辑端口之间的连接。导出器5525向虚拟化应用5310公布或发送输出表5520中的经修改的输出表。
图55示出了上文参考图54描述的阶段5406之前的表5530-5565。表中的条目被描绘为点以指示在这些表中存在一些现有的条目。
图56示出了在阶段5406之后的表5530-5565。也就是说,此图示出了在用户提供了逻辑端口的识别符“RP1”、与端口相关联的IP地址“1.1.1.253”和网络掩码“255.255.255.0”以向被识别为“LR”的逻辑路由器5425添加逻辑端口之后的表5530-5565。这里,表5530通过输入转换5505利用新条目来更新。新条目(或行)5601指示被识别为“RP1”的逻辑端口被添加并且与此端口相关联的IP地址由IP地址1.1.1.253、前缀长度24和网络掩码255.255.255.0来指明。
规则引擎5515检测对表5530的这个更新并且执行一组表映射操作以更新表5535和5540。图57示出了这组表映射操作的结果。具体而言,此图示出了表5535具有新的行5701,其指示逻辑端口RP1现在与MAC地址01:01:01:01:01:01相关联。在利用其它表或功能(未示出)执行表映射操作时该MAC地址由规则引擎5515生成。
图57还示出了表5540具有新的行5702,其是用于逻辑路由器5425的路由表中的条目。逻辑路由器5425(实现逻辑路由器5425的受管理交换元件)将查找此表5540以作出路由决策。行5702指明逻辑端口RP1的下一跳具有唯一识别符“NH1”。行5702还包括路由表中指派给这一行的优先级。此优先级用于确定当路由表中存在多个匹配行时应当使用哪个行来作出路由决策。在一些实施例中,一个条目中对于一行的优先级的值为前缀长度加上基本的优先级值“BP”。
规则引擎5515检测对表5540的更新并且执行一组表映射操作来更新表5550。图58示出了这组表映射操作的结果。具体而言,此图示出了表5550具有新的行5801,其指示逻辑路由器5425的逻辑端口RP1的下一跳的IP地址是给定分组的目的地IP地址。(此行中的“0”意味着下一跳的IP是将通过逻辑路由器的RP1路由的给定分组的目的地。)
图59示出了在上文参考图54描述的阶段5407之后的表5530-5560。也就是说,此图示出了在用户提供逻辑端口的识别符“SP1”以将该逻辑端口添加到逻辑交换机5420(LS1)并将此端口链接到逻辑路由器5425的逻辑端口RP1之后的表5530-5565。这里,表5555通过输入转换5505利用两个新的行来更新。新的行5901指示(逻辑交换机5420的)被识别为“SP1”的逻辑端口附接到(逻辑路由器5425的)逻辑端口RP1。另外,新的行5902指示逻辑端口RP1附接到逻辑端口SP1。此链接连接上文描述的逻辑处理管道200的L2处理和L3处理部分。
规则引擎5515检测表5555的更新并且执行一组表映射操作来更新表5535。图60示出了这组表映射操作的结果。具体而言,此图示出了表5535具有新的行6001,其指示逻辑端口SP1现在与MAC地址01:01:01:01:01:01相关联,因为SP1和RP1现在被链接。
规则引擎5515检测表5555的更新并且执行一组表映射操作来更新表5560。图61示出了这组表映射操作的结果。具体而言,此图示出了表5550具有四个新的行(流条目)6101-6104。行6101是指示其目的地MAC地址为01:01:01:01:01:01的分组要被发送到(逻辑交换机5420的)逻辑端口SP 1的流条目。行6102是指示被递送到逻辑端口SP1的任何分组要被发送到逻辑端口RP1的流条目。行6103是指示被递送到逻辑端口RP1的任何分组要被发送到逻辑端口SP1的流条目。行6104是指示具有落在由1.1.1.253/24指明的IP地址的范围内的IP地址的分组应当通过询问L3守护进程来请求MAC地址的流条目。
图62示出了在上文描述的阶段5408和5409之后添加到一些表的新的行6201-6209。为了描述简单,省略了通过规则引擎5515的表更新的中间图示。
新的行6201指示识别为“RP2”的逻辑端口被添加并且与此端口相关联的IP地址由IP地址1.1.2.253、前缀长度24和网络掩码255.255.255.0来指明。新的行6202指示逻辑端口RP2现在与MAC地址01:01:01:01:01:02相关联。新的行6203指示逻辑端口SP2与MAC地址01:01:01:01:01:02相关联。新的行6204是对于逻辑交换机5430的路由表中的条目。行6204指明逻辑端口RP2的下一跳具有唯一识别符“NH2”。行6204还包括路由表中指派给此行的优先级。
新的行6205指示逻辑路由器5425的逻辑端口RP2的下一跳的IP地址是给定分组的目的地IP地址。新的行6206指示(逻辑交换机5430的)被识别为“SP2”的逻辑端口附接到(逻辑路由器5425的)逻辑端口RP2。另外,新的行6207指示逻辑端口RP2附接到逻辑端口SP2。
行6208是指示其目的地MAC地址为01:01:01:01:01:02的分组要被发送到(逻辑交换机5430的)逻辑端口SP2的流条目。行6209是指示被递送到逻辑端口SP2的任何分组要被发送到逻辑端口RP2的流条目。行6210是指示被递送到逻辑端口RP2的任何分组要被发送到逻辑端口SP2的流条目。行6211是指示具有落在由1.1.2.253/24指明的IP地址的范围内的IP地址的分组应当通过询问L3守护进程来请求MAC地址的流条目。
图62中所示的这些流条目是LFP数据。此LFP数据将被发送到虚拟化应用5310,虚拟化应用5310将从LFP数据生成UPCP数据。然后,UPCP数据将被发送到物理控制器5330,物理控制器5330将为受管理交换元件5325(图62中未示出)定制UPCP数据。最后,物理控制器5330将把CPCP数据发送到受管理交换元件5325。
图63示出了在控制应用5305通过执行如上文参考图55-62所述的表映射操作来生成逻辑数据之后的体系结构5400。如图63所示,端口RP1和RP2分别与由1.1.1.253/24和1.1.2.253/24指明的IP地址的范围相关联。另外,端口SP1和SP2分别与MAC地址01:01:01:01:01:01和01:01:01:01:01:02相关联。此图还示出了耦合到逻辑交换机5420的VM 1和耦合到逻辑交换机5430的VM 2。
现在将描述逻辑交换机5420和5430、逻辑路由器5425以及VM 1和2的示例操作。此示例假定实现逻辑路由器5425以及逻辑交换机5420和5430的一组受管理交换元件具有所有流条目6101-6104和6208-6211。此示例还假定由控制应用5305产生的逻辑数据被虚拟化应用5310转换成物理控制平面数据并且该物理控制平面数据被受管理交换元件接收并转换成物理转发数据。
当VM 1打算向VM 4发送分组时,VM 1首先广播ARP请求以解析逻辑路由器5425的MAC地址。此ARP分组具有VM 1的源IP地址,在此示例中为1.1.1.10,以及VM 4的目的地IP地址,在此示例中为1.1.2.10。此广播分组具有广播MAC地址“ff:ff:ff:ff:ff:ff”作为目的地MAC地址,并且分组的目标协议地址是1.1.1.253。此广播分组(ARP请求)被复制到受管理交换元件5320的所有端口,包括逻辑端口SP1。然后,基于流条目6102,此分组被发送到逻辑路由器5325的RP1。该分组随后根据流条目6104被发送到L3守护进程(未示出),因为目的地IP地址1.1.2.10落在由1.1.2.253/24指明的IP地址的范围中(即,因为目标协议地址是1.1.1.253)。L3守护进程将目的地IP地址解析成MAC地址01:01:01:01:01:01,这是RP1的MAC地址。L3守护进程将带有此MAC地址的ARP响应发回到VM 1。
VM 1随后向VM 4发送分组。此分组以VM 1的MAC地址作为源MAC地址,以RP1的MAC地址(01:01:01:01:01:01)作为目的地MAC地址,以VM 1的IP地址(1.1.1.10)作为源IP地址,并且以VM 4的IP地址(1.1.2.10)作为目的地IP地址。
逻辑交换机5420随后根据指示具有目的地MAC地址01:01:01:01:01:01的分组要被发送到SP1的流条目6101将分组转发到SP1。当分组到达SP1时,分组随后根据流条目6102被发送到RP1,流条目6102指示被递送到SP1的任何分组要被发送到RP1。
此分组随后被发送到逻辑路由器5425的入口ACL阶段,其在此示例中允许分组通过RP1。然后逻辑路由器5425根据条目6204将分组路由到下一跳NH2。此路由决策随后被加载到(实现逻辑路由器5425的受管理交换元件的)寄存器。此分组随后被馈送到下一跳查找过程,该过程使用下一跳的ID NH2来确定下一跳IP地址和分组应当被发送到的端口。在此示例中,基于行6205来确定下一跳,该行6205指示NH2的地址是分组的目的地IP地址并且分组应当被发送到的端口是RP2。
分组随后被馈送到MAC解析过程以将目的地IP地址(1.1.2.10)解析成VM 4的MAC地址。L3守护进程解析MAC地址并将新的流条目(例如通过利用解析出的MAC地址填写流模板)放回到实现逻辑路由器5425的受管理交换元件中。根据这个新的流,分组现在具有VM 4的MAC地址作为目的地MAC地址和逻辑路由器5425的RP2的MAC地址(01:01:01:01:01:02)。
分组随后通过逻辑路由器5425的出口ACL阶段,其在此示例中允许分组通过RP2离开。分组随后根据流条目6210被发送到SP2,流条目6210指示被递送到RP2的任何分组要被发送到SP2。然后对于逻辑交换机5330的L2处理将把分组发送到VM 4。
IX.对受管理边缘交换元件实现的修改
虽然所有LDPS处理都被推送到受管理边缘交换元件,但仅到实际的附接物理端口集成的接口在一些实施例中处理互操作性问题。这些接口在一些实施例中为主机IP/以太网堆栈实现标准的L2/L3接口。逻辑交换机和逻辑路由器之间的接口保持在虚拟化应用的内部,因此不需要实现与现今的路由器完全相同的协议来交换信息。
虚拟化应用在一些实施例中有责任响应发送到第一跳路由器的IP地址的ARP请求。由于逻辑路由器的MAC/IP地址绑定是静态的,所以这没有引入扩展问题。最末跳逻辑路由器在一些实施例中不具有类似的严格要求:只要使虚拟化应用知道附接端口的MAC和IP地址,其就可将它们公布给内部查找服务,内部查找服务对于端点是不暴露的,并且仅被逻辑管道执行使用。不存在向附接端口发送ARP请求的绝对需要。
一些实施例将所要求的L3功能实现为紧挨着Open vSwitch运行的外部守护进程。在一些实施例中,该守护进程负责以下操作:
·响应ARP请求。在一些实施例中,Open vSwitch向守护进程馈送ARP请求并且守护进程创建响应。可替代地,一些实施例使用流模板来在受管理边缘交换元件中创建额外的流条目。流模板是使用一组规则来基于接收到的分组动态地生成一系列流条目。在一些这样的实施例中,响应由Open vSwitch自身处理。
·建立任何状态性的(NAT、ACL、负载均衡)每流状态。同样,如果流模板足够灵活,则可以移动更多来供Open vSwitch处理。
·发起分布式查找。当通过其逻辑管道的序列馈送流量时,根据需要对于映射服务发起分布式查找(例如ARP、学习)。这在一些实施例中将涉及使IP分组排队(queue)。
为了在与外部物理网络集成时生成ARP请求,一些实施例假定可利用OpenFlow的LOCAL输出端口将分组丢弃到本地IP堆栈。
映射服务本身在一些实施例中通过依赖于Open vSwitch的数据路径功能来实现:受管理边缘交换元件处的守护进程通过向映射服务节点发送特殊的“公布”分组来公布MAC和IP地址绑定,映射服务节点随后将利用流模板来创建流条目。来自受管理边缘交换元件的“查询”分组随后将被这些FIB条目响应,这些FIB条目在将查询分组修改到足以变成响应分组之后将把分组发送到特殊的IN_PORT。
X.逻辑交换环境
上文和下文描述的若干实施例提供了将逻辑转发空间(即,逻辑控制和转发平面)与物理转发空间(即,物理控制和转发平面)完全分离的网络控制系统。这些控制系统通过使用映射引擎将逻辑转发空间数据映射到物理转发空间数据来实现这种分离。通过将逻辑空间与物理空间完全解除耦合,这些实施例的控制系统允许当对物理转发空间作出改变(例如,迁移虚拟机、添加物理交换机或路由器等等)时逻辑转发元件的逻辑视图保持不变。
更具体而言,一些实施例的控制系统管理网络,在这些网络上,属于若干不同用户(即,具有被多个不同的相关或无关用户共享的多个容宿计算机和受管理转发元件的私有或公共容宿环境中的若干不同用户)的机器(例如虚拟机)可针对分开的LDP集合交换数据分组。也就是说,属于特定用户的机器可通过对于该用户的LDPS与属于同一用户的其它机器交换数据,而属于不同用户的机器通过在同一物理受管理网络上实现的不同的LDPS与彼此交换数据。在一些实施例中,LDPS(也称为逻辑转发元件(例如,逻辑交换机、逻辑路由器)或者在一些情况下是逻辑网络)是提供互连若干逻辑端口的交换架构的逻辑构造,特定用户的机器(物理的或虚拟的)可附接到这些逻辑端口。
在一些实施例中,这种LDP集合和逻辑端口的创建和使用提供了一种逻辑服务模型,该模型在非专业人士看来可能与虚拟局域网(VLAN)的使用相似。然而,存在与用于分割(segment)网络的VLAN服务模型的各种显著区别。在本文描述的逻辑服务模型中,物理网络可变化,而不对用户对网络的逻辑视图有任何影响(例如,添加受管理交换元件或者将VM从一个位置移动到另一位置不会影响用户对逻辑转发元件的视图)。普通技术人员将会认识到,下文描述的所有区别可不适用于特定的受管理网络。一些受管理网络可包括这一节中描述的所有特征,而其它受管理网络将包括这些特征的不同子集。
为了使得一些实施例的受管理网络内的受管理转发元件识别分组所属的LDPS,网络控制器集群根据定义LDP集合的用户输入自动地为物理的受管理转发元件生成流条目。当来自特定LDPS上的机器的分组被发送到受管理网络上时,受管理转发元件使用这些流条目来识别分组的逻辑上下文(即,分组所属的LDPS以及分组要前往的逻辑端口)并且根据逻辑上下文来转发分组。
在一些实施例中,分组在没有任何种类的逻辑上下文ID的情况下离开其源机器(以及其源机器的网络接口)。反而,分组仅包含源和目的地机器的地址(例如,MAC地址、IP地址等等)。所有的逻辑上下文信息都在网络的受管理转发元件处添加和去除。当第一受管理转发元件直接从源机器接收到分组时,该转发元件使用分组中的信息以及其接收到分组的物理端口来识别分组的逻辑上下文并将此信息附加到分组。类似地,目的地机器之前的最后一个受管理转发元件在将分组转发到其目的地之前去除逻辑上下文。此外,在一些实施例中,附加到分组的逻辑上下文可被沿途的中间受管理转发元件修改。这样,末端机器(以及末端机器的网络接口)不需要知晓发送分组的逻辑网络。结果,末端机器及其网络接口不需要被配置为适应逻辑网络。反而,网络控制器仅配置受管理转发元件。此外,因为转发处理的大部分在边缘转发元件处执行,所以对于网络的整个转发资源将随着更多机器被添加而自动扩展(scale)(因为每个物理边缘转发元件仅能使这么多的机器附接)。
在附加(例如前置)到分组的逻辑上下文中,一些实施例仅包括逻辑出口端口。也就是说,封装分组的逻辑上下文不包括显式用户ID。反而,逻辑上下文捕获在第一跳处作出的逻辑转发决策(即,关于目的地逻辑端口的决策)。由此,在随后的转发元件处可通过检查逻辑出口端口(因为该逻辑出口端口是特定LDPS的一部分)来隐式地确定用户ID(即,分组所属的LDPS)。这导致了一种平的上下文识别符,意味着受管理转发元件不必切开(slice)上下文ID以确定ID内的多条信息。
在一些实施例中,出口端口是32比特ID。然而,在一些实施例中对于处理逻辑上下文的受管理转发元件使用软件转发元件使得系统能够在任何时间被修改以改变逻辑上下文的大小(例如改变到64比特或更大),而硬件转发元件往往更局限于对于上下文识别符使用特定数目的比特。此外,使用例如本文描述的逻辑上下文识别符导致逻辑数据(即,出口上下文ID)与源/目的地地址数据(即,MAC地址)之间的显式分离(explicit separation)。当源和目的地地址被映射到逻辑入口和出口端口时,该信息被分开存储在分组内。从而,在网络内的受管理交换元件处,可完全基于封装分组的逻辑数据(即,逻辑出口信息)来转发分组,而无需对物理地址信息的任何额外查找。
在一些实施例中,受管理转发元件内的分组处理涉及重复地向调度端口发送分组,从而有效地将分组重新提交(resubmit)回交换元件中。在一些实施例中,使用软件交换元件提供了执行分组的这种重新提交的能力。硬件转发元件一般涉及固定的管道(这一部分是由于使用ASIC来执行处理),而一些实施例的软件转发元件则可根据需要扩展分组处理管道,因为没有太多来自执行重新提交的延迟。
此外,一些实施例使得能够优化对于单组相关分组(例如单个TCP/UDP流)内的后续分组的多个查找。当第一分组到达时,受管理转发元件执行所有的查找并重新提交以便完全处理该分组。转发元件随后将决策的最终结果(例如,向分组添加出口上下文,以及通过特定隧道离开转发元件的特定端口的下一跳转发决策)与分组的唯一识别符一起缓存(即,TCP/UDP流的唯一识别符),该唯一识别符将与所有其它的相关分组共享。一些实施例将该缓存的结果推送到转发元件的内核中以进行额外的优化。对于共享唯一识别符的额外分组(即,同一流内的额外分组),转发元件可使用指明要对分组执行的所有动作的单个缓存查找。一旦分组的流完成(例如,在经过了没有分组匹配识别符的特定量的时间之后),在一些实施例中,转发元件清除缓存。对多个查找的使用在一些实施例中涉及将分组从物理空间(例如,物理端口处的MAC地址)映射到逻辑空间(例如,到逻辑交换机的逻辑端口的逻辑转发决策),然后映射回到物理空间(例如,将逻辑出口上下文映射到交换元件的物理输出端口)。
使用封装来提供物理和逻辑地址的显式分离的这种逻辑网络相对于网络虚拟化的其它方法(例如VLAN)提供了显著优势。例如,标签技术(例如,VLAN)使用置于分组上的标签来分割转发表以仅向分组应用与标签相关联的规则。这仅分割了现有的地址空间,而不是引入了新的空间。结果,因为地址被用于虚拟和物理领域中的实体,所以它们必须被暴露给物理转发表。这样,来自于层次化地址映射的聚集的属性不能被利用。此外,因为利用标签技术没有引入新的地址空间,所以所有的虚拟上下文都必须使用相同的地址模型,并且虚拟地址空间限于与物理地址空间相同。标签技术的另一缺点在于不能通过地址重映射来利用移动性。
XI.电子系统
图64概念性示出了实现本发明的一些实施例的电子系统6400。电子系统6400可用于执行上文描述的任何控制、虚拟化或操作系统应用。电子系统6400可以是计算机(例如,桌面计算机、个人计算机、平板计算机、服务器计算机、大型机、刀片计算机等等)、电话、PDA或任何其它种类的电子设备。这种电子系统包括各种类型的计算机可读介质和针对各种其它类型的计算机可读介质的接口。电子系统6400包括总线6405、处理单元6410、系统存储器6425、只读存储器6430、永久性存储设备6435、输入设备6440和输出设备6445。
总线6405共同代表通信地连接电子系统6400的大量内部设备的所有系统、外围和芯片集总线。例如,总线6405将处理单元6410与只读存储器6430、系统存储器6425和永久性存储设备6435通信地连接。
从这些各种存储器单元,处理单元6410检索指令来执行并检索数据来处理以便执行本发明的过程。处理单元在不同实施例中可以是单个处理器或者多核处理器。
只读存储器(ROM)6430存储处理单元6410和电子系统的其它模块所需要的静态数据和指令。另一方面,永久性存储设备6435是读写存储器设备。此设备是即使当电子系统6400关断时也存储指令和数据的非易失性存储器单元。本发明的一些实施例使用大容量存储设备(例如磁盘或光盘及其相应的盘驱动器)作为永久性存储设备6435。
其它实施例使用可移除存储设备(例如软盘、闪存盘等等)作为永久性存储设备。与永久性存储设备6435一样,系统存储器6425是读写存储器设备。然而,与永久性存储设备6435不同,系统存储器是易失性读写存储器,例如随机访问存储器。系统存储器存储处理器在运行时需要的一些指令和数据。在一些实施例中,本发明的过程被存储在系统存储器6425、永久性存储设备6435和/或只读存储器6430中。从这些各种存储器单元,处理单元6410检索指令来执行并检索数据来处理以便执行一些实施例的过程。
总线6405还连接到输入和输出设备6440、6445。输入设备使得用户能够向电子系统传输信息并选择对电子系统的命令。输入设备6440包括字母数字键盘和定点设备(也称为“光标控制设备”)。输出设备6445显示由电子系统生成的图像。输出设备包括打印机和显示设备,例如阴极射线管(CRT)或液晶显示器(LCD)。一些实施例包括诸如触摸屏的用作输入设备和输出设备二者的设备。
最后,如图64所示,总线6405还通过网络适配器(未示出)将电子系统6400耦合到网络6465。以这种方式,计算机可以是计算机的网络(例如局域网(“LAN”)、广域网(“WAN”)或内联网或者网络的网络(例如因特网)的一部分。电子系统6400的任何或所有组件可结合本发明被使用。
一些实施例包括电子组件,例如微处理器、存储设备和存储器,它们将计算机程序指令存储在机器可读或计算机可读介质(可替代地称为计算机可读存储介质、机器可读介质或机器可读存储介质)中。这种计算机可读介质的一些示例包括RAM、ROM、只读致密盘(CD-ROM)、可记录致密盘(CD-R)、可再写致密盘(CD-RW)、只读数字多功能盘(例如,DVD-ROM、双层DVD-ROM)、多种可记录/可再写DVD(例如,DVD-RAM、DVD-RW、DVD+RW等等)、闪存(例如,SD卡、袖珍SD卡、微型SD卡等等)、磁和/或固态硬盘驱动器、只读和可记录盘、超密度光盘、任何其它光或磁介质、以及软盘。计算机可读介质可存储计算机程序,该计算机程序可由至少一个处理单元执行并且包括用于执行各种操作的指令集。计算机程序或计算机代码的示例包括机器代码,例如由编译器产生的那种,以及由计算机、电子组件或微处理器使用解释器来执行的包括更高级代码的文件。
虽然以上论述主要涉及执行软件的微处理器或多核处理器,但一些实施例由诸如专用集成电路(ASIC)或现场可编程门阵列(FPGA)的一个或多个集成电路执行。在一些实施例中,这种集成电路执行存储在电路本身上的指令。
如本说明书中所使用,术语“计算机”、“服务器”、“处理器”和“存储器”都指的是电子或其它技术设备。这些术语排除人或人的群组。对于本说明书的目的,术语“显示”意味着在电子设备上显示。如本说明书中所使用,术语“计算机可读介质”和“机器可读介质”完全限于以可由计算机读取的形式存储信息的有形物理对象。这些术语排除任何无线信号、有线下载信号和任何其它短暂信号。
虽然已参照大量具体的细节描述了本发明,但普通技术人员将认识到,在不脱离本发明的精神的情况下,可以其它具体的形式来实现本发明。此外,多幅附图(包括图14、16、32、35、49、51以及52)概念性示出了过程。这些过程的具体操作可不以所示出和描述的确切顺序执行。具体的操作可不在一个连续的操作系列中执行,并且不同的具体操作可在不同的实施例中执行。另外,过程可利用若干子过程来实现,或者实现为更大的宏过程的一部分。从而,普通技术人员将理解,本发明不受前述说明性细节所限,而应由所附权利要求来限定。

Claims (20)

1.一种用于配置多个受管理转发元件以实现逻辑L3路由器和多个逻辑L2交换机的方法,所述方法包括:
对于实现特定的逻辑L2交换机的一组MFE中的每一个MFE,生成第一组数据记录,所述第一组数据记录用于配置MFE以实现用于处理被发送到逻辑地耦合到所述特定的逻辑L2交换机的网络地址的分组的逻辑L3路由器以及特定的逻辑L2交换机;以及
对于所述一组MFE中的每一个MFE,生成第二组数据记录,所述第二组数据记录用于配置MFE以对被发送到逻辑地耦合到所述特定的逻辑L2交换机的网络地址的分组的子集实现负载均衡处理,所述第二组流条目指定跨越多个机器均衡所述分组的子集,所述多个机器逻辑地耦合到所述特定的逻辑L2交换机并且物理地耦合到多个不同的MFE。
2.根据权利要求1所述的方法,还包括对于所述一组MFE中的每一个MFE,生成第三组数据记录,所述第三组数据记录用于配置MFE以在对从第二逻辑L2交换机发送到所述特定的逻辑L2交换机的分组执行负载均衡处理之前对所述分组实现源网络地址转换NAT处理。
3.根据权利要求1所述的方法,其中,逻辑地耦合到所述特定的逻辑L2交换机的所述多个机器包括提供相同服务的多个虚拟机。
4.根据权利要求1所述的方法,其中,所述一组MFE中的MFE中的每一个在不同的主机上操作,其中,负载均衡守护进程被配置在主机中的每一个上以从逻辑地耦合到所述特定的逻辑L2交换机的所述多个机器中选择机器。
5.根据权利要求4所述的方法,其中,所述负载均衡守护进程基于所述多个机器中的每一个的当前工作负载从所述多个机器中选择机器。
6.根据权利要求4所述的方法,其中,在具有特定的MFE的特定主机中操作的特定的负载均衡守护进程将所选择的机器的地址发送到所述特定的MFE。
7.根据权利要求4所述的方法,其中,用于配置特定的MFE以执行负载均衡处理的所述第二组数据记录对于所述特定的MFE指定从所述负载均衡守护进程请求对逻辑地耦合到所述特定的逻辑L2交换机的机器中的一个的选择。
8.根据权利要求1所述的方法,还包括配置所述一组MFE中的每一个MFE以与所述一组MFE中的其它MFE中的每一个建立隧道。
9.根据权利要求1所述的方法,其中,生成第一组数据记录和第二组数据记录包括生成第一组流条目和第二组流条目。
10.根据权利要求1所述的方法,其中,所述方法由网络控制器执行。
11.一种用于配置多个受管理转发元件以实现逻辑L3路由器和多个逻辑L2交换机的系统,所述系统包括:
用于对于实现特定的逻辑L2交换机的一组MFE中的每一个MFE生成第一组数据记录的部件,所述第一组数据记录用于配置MFE以实现用于处理被发送到逻辑地耦合到所述特定的逻辑L2交换机的网络地址的分组的逻辑L3路由器以及特定的逻辑L2交换机;以及
用于对于所述一组MFE中的每一个MFE生成第二组数据记录的部件,所述第二组数据记录用于配置MFE以对被发送到逻辑地耦合到所述特定的逻辑L2交换机的网络地址的分组的子集实现负载均衡处理,所述第二组流条目指定跨越多个机器均衡所述分组的子集,所述多个机器逻辑地耦合到所述特定的逻辑L2交换机并且物理地耦合到多个不同的MFE。
12.根据权利要求11所述的系统,还包括用于对于所述一组MFE中的每一个MFE生成第三组数据记录的部件,所述第三组数据记录用于配置MFE以在对从第二逻辑L2交换机发送到所述特定的逻辑L2交换机的分组执行负载均衡处理之前对所述分组实现源网络地址转换NAT处理。
13.根据权利要求11所述的系统,其中,逻辑地耦合到所述特定的逻辑L2交换机的所述多个机器包括提供相同服务的多个虚拟机。
14.根据权利要求11所述的系统,其中,所述一组MFE中的MFE中的每一个在不同的主机上操作,其中,负载均衡守护进程被配置在主机中的每一个上以从逻辑地耦合到所述特定的逻辑L2交换机的所述多个机器中选择机器。
15.根据权利要求14所述的系统,其中,所述负载均衡守护进程基于所述多个机器中的每一个的当前工作负载从所述多个机器中选择机器。
16.根据权利要求14所述的系统,其中,在具有特定的MFE的特定主机中操作的特定的负载均衡守护进程将所选择的机器的地址发送到所述特定的MFE。
17.根据权利要求14所述的系统,其中,用于配置特定的MFE以执行负载均衡处理的所述第二组数据记录对于所述特定的MFE指定从所述负载均衡守护进程请求对逻辑地耦合到所述特定的逻辑L2交换机的机器中的一个的选择。
18.根据权利要求11所述的系统,还包括用于配置所述一组MFE中的每一个MFE以与所述一组MFE中的其它MFE中的每一个建立隧道的部件。
19.根据权利要求11所述的系统,其中,用于生成第一组数据记录和第二组数据记录的部件包括用于生成第一组流条目和第二组流条目的部件。
20.一种存储控制器应用的机器可读介质,所述控制器应用在被至少一个处理单元执行时实施根据权利要求1-10中的任何一项所述的方法。
CN201710263367.6A 2011-08-17 2012-08-17 逻辑l3路由 Active CN107071088B (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201161524754P 2011-08-17 2011-08-17
US61/524,754 2011-08-17
US201261643339P 2012-05-06 2012-05-06
US61/643,339 2012-05-06
US201261654121P 2012-06-01 2012-06-01
US61/654,121 2012-06-01
US201261666876P 2012-07-01 2012-07-01
US61/666,876 2012-07-01
CN201280046542.1A CN103890751B (zh) 2011-08-17 2012-08-17 逻辑l3路由

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201280046542.1A Division CN103890751B (zh) 2011-08-17 2012-08-17 逻辑l3路由

Publications (2)

Publication Number Publication Date
CN107071088A true CN107071088A (zh) 2017-08-18
CN107071088B CN107071088B (zh) 2020-06-05

Family

ID=47712585

Family Applications (6)

Application Number Title Priority Date Filing Date
CN201710263352.XA Active CN107071086B (zh) 2011-08-17 2012-08-17 逻辑l3路由
CN201280046542.1A Active CN103890751B (zh) 2011-08-17 2012-08-17 逻辑l3路由
CN201710263621.2A Active CN106850444B (zh) 2011-08-17 2012-08-17 逻辑l3路由
CN201710263367.6A Active CN107071088B (zh) 2011-08-17 2012-08-17 逻辑l3路由
CN201710263356.8A Active CN107071087B (zh) 2011-08-17 2012-08-17 逻辑l3路由
CN201710263419.XA Active CN106850878B (zh) 2011-08-17 2012-08-17 逻辑l3路由

Family Applications Before (3)

Application Number Title Priority Date Filing Date
CN201710263352.XA Active CN107071086B (zh) 2011-08-17 2012-08-17 逻辑l3路由
CN201280046542.1A Active CN103890751B (zh) 2011-08-17 2012-08-17 逻辑l3路由
CN201710263621.2A Active CN106850444B (zh) 2011-08-17 2012-08-17 逻辑l3路由

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN201710263356.8A Active CN107071087B (zh) 2011-08-17 2012-08-17 逻辑l3路由
CN201710263419.XA Active CN106850878B (zh) 2011-08-17 2012-08-17 逻辑l3路由

Country Status (6)

Country Link
US (14) US8958298B2 (zh)
EP (3) EP3605969B1 (zh)
JP (3) JP5870192B2 (zh)
CN (6) CN107071086B (zh)
AU (1) AU2012296329B2 (zh)
WO (1) WO2013026049A1 (zh)

Families Citing this family (485)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8560634B2 (en) * 2007-10-17 2013-10-15 Dispersive Networks, Inc. Apparatus, systems and methods utilizing dispersive networking
US8755283B2 (en) 2010-12-17 2014-06-17 Microsoft Corporation Synchronizing state among load balancer components
US8612550B2 (en) 2011-02-07 2013-12-17 Microsoft Corporation Proxy-based cache content distribution and affinity
US8743885B2 (en) 2011-05-03 2014-06-03 Cisco Technology, Inc. Mobile service routing in a network environment
US9736065B2 (en) 2011-06-24 2017-08-15 Cisco Technology, Inc. Level of hierarchy in MST for traffic localization and load balancing
US8681802B2 (en) * 2011-08-15 2014-03-25 Cisco Technology, Inc. Proxy FHRP for anycast routing service
US9124538B2 (en) * 2011-08-17 2015-09-01 Nicira, Inc. Dynamic generation of flow entries for last-hop processing
US9602404B2 (en) 2011-08-17 2017-03-21 Nicira, Inc. Last-hop processing for reverse direction packets
EP3605969B1 (en) 2011-08-17 2021-05-26 Nicira Inc. Distributed logical l3 routing
US9712599B2 (en) * 2011-10-03 2017-07-18 International Business Machines Corporation Application peak load processing
US9178833B2 (en) * 2011-10-25 2015-11-03 Nicira, Inc. Chassis controller
EP2748714B1 (en) 2011-11-15 2021-01-13 Nicira, Inc. Connection identifier assignment and source network address translation
DE112011105911T5 (de) * 2011-12-01 2014-09-11 Intel Corporation Server mit Switch-Schaltungen
US9363225B2 (en) * 2012-01-12 2016-06-07 Cisco Technology, Inc. Connecting layer-2 domains over layer-3 networks
CN102438331B (zh) * 2012-01-12 2016-04-13 惠州Tcl移动通信有限公司 一种移动终端通过手机上网的方法及系统
US8908698B2 (en) 2012-01-13 2014-12-09 Cisco Technology, Inc. System and method for managing site-to-site VPNs of a cloud managed network
EP2823618A4 (en) * 2012-03-08 2015-11-11 Hewlett Packard Development Co Modification of Virtual Machine Communication
US9231864B2 (en) * 2012-03-19 2016-01-05 Intel Corporation Techniques for packet management in an input/output virtualization system
US9331938B2 (en) * 2012-04-13 2016-05-03 Nicira, Inc. Extension of logical networks across layer 3 virtual private networks
EP2748706B1 (en) * 2012-04-18 2020-01-22 Nicira Inc. Exchange of network state information between forwarding elements
US9515920B2 (en) * 2012-04-20 2016-12-06 Futurewei Technologies, Inc. Name-based neighbor discovery and multi-hop service discovery in information-centric networks
CN103379185B (zh) * 2012-04-26 2016-08-03 华为技术有限公司 一种网络地址转换的方法、设备和系统
US9055006B2 (en) 2012-06-11 2015-06-09 Radware, Ltd. Techniques for traffic diversion in software defined networks for mitigating denial of service attacks
US10177957B1 (en) * 2012-07-06 2019-01-08 Cradlepoint, Inc. Connecting a cloud network to the internet
US8805990B2 (en) * 2012-07-12 2014-08-12 Microsoft Corporation Load balancing for single-address tenants
WO2014010724A1 (ja) * 2012-07-13 2014-01-16 日本電気株式会社 制御装置、通信システム、通信方法及びプログラム
US9049114B2 (en) * 2012-08-31 2015-06-02 Cisco Technology, Inc. Network access device and method for automatically establishing connection to a wide area network
US9104492B2 (en) * 2012-09-04 2015-08-11 Wisconsin Alumni Research Foundation Cloud-based middlebox management system
US9038151B1 (en) 2012-09-20 2015-05-19 Wiretap Ventures, LLC Authentication for software defined networks
US9300541B2 (en) * 2012-09-28 2016-03-29 Time Warner Cable Enterprises Llc System and method for automatically learning and maintaining IP address allocation topology
US9246998B2 (en) 2012-10-16 2016-01-26 Microsoft Technology Licensing, Llc Load balancer bypass
US10367914B2 (en) 2016-01-12 2019-07-30 Cisco Technology, Inc. Attaching service level agreements to application containers and enabling service assurance
US10044671B2 (en) * 2012-11-27 2018-08-07 Nec Corporation Control apparatus, communication system, communication method, and program
US9826056B2 (en) 2012-12-09 2017-11-21 Facebook, Inc. Displaying news ticker content based on diversity in a social networking system
US10168853B2 (en) 2012-12-09 2019-01-01 Facebook, Inc. Displaying news ticker content based on value in a social networking system
US8953439B1 (en) 2012-12-31 2015-02-10 Juniper Networks, Inc. Separation of control plane functions using virtual machines in network device
CN103974380B (zh) * 2013-01-24 2018-05-15 新华三技术有限公司 一种终端接入位置保活的方法及装置
US10616049B2 (en) 2013-01-25 2020-04-07 Dell Products, L.P. System and method for determining the configuration of switches in virtual link trunking environments
US9407500B2 (en) * 2013-01-25 2016-08-02 Dell Products L.P. System and method for determining the configuration of switches in virtual link trunking environments
US9634940B2 (en) 2013-01-31 2017-04-25 Mellanox Technologies, Ltd. Adaptive routing using inter-switch notifications
FR3001849B1 (fr) * 2013-02-05 2016-06-24 Byo Networks Procede pour router des donnees, programme d'ordinateur, controleur de reseau et reseaux associes
US9930066B2 (en) 2013-02-12 2018-03-27 Nicira, Inc. Infrastructure level LAN security
US9043439B2 (en) 2013-03-14 2015-05-26 Cisco Technology, Inc. Method for streaming packet captures from network access devices to a cloud server over HTTP
US9300627B2 (en) 2013-03-14 2016-03-29 Time Warner Cable Enterprises Llc System and method for automatic routing of dynamic host configuration protocol (DHCP) traffic
US9571338B2 (en) * 2013-03-14 2017-02-14 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Scalable distributed control plane for network switching systems
US9967111B2 (en) * 2013-03-15 2018-05-08 Rackspace Us, Inc. Software-defined multinetwork bridge
US9374302B2 (en) 2013-04-26 2016-06-21 Brocade Communications Systems, Inc. Distributed methodology for peer-to-peer transmission of stateful packet flows
US9794379B2 (en) 2013-04-26 2017-10-17 Cisco Technology, Inc. High-efficiency service chaining with agentless service nodes
US9225638B2 (en) 2013-05-09 2015-12-29 Vmware, Inc. Method and system for service switching using service tags
CN104243337B (zh) * 2013-06-09 2017-09-01 新华三技术有限公司 一种跨集群负载均衡的方法及装置
EP3014442A2 (en) * 2013-06-26 2016-05-04 Amazon Technologies Inc. Managing client access to a plurality of computing systems
US9843631B2 (en) 2013-06-26 2017-12-12 Amazon Technologies, Inc. Producer system selection
US9515924B2 (en) 2013-07-03 2016-12-06 Avaya Inc. Method and apparatus providing single-tier routing in a shortest path bridging (SPB) network
US9467366B2 (en) 2013-07-03 2016-10-11 Avaya Inc. Method and apparatus providing single-tier routing in a shortest path bridging (SPB) network
US9559870B2 (en) 2013-07-08 2017-01-31 Nicira, Inc. Managing forwarding of logical network traffic between physical domains
US9571386B2 (en) * 2013-07-08 2017-02-14 Nicira, Inc. Hybrid packet processing
CN109921973A (zh) * 2013-07-10 2019-06-21 华为技术有限公司 Gre隧道实现方法、接入点和网关
US10749711B2 (en) 2013-07-10 2020-08-18 Nicira, Inc. Network-link method useful for a last-mile connectivity in an edge-gateway multipath system
US10454714B2 (en) 2013-07-10 2019-10-22 Nicira, Inc. Method and system of overlay flow control
EP3021528B1 (en) 2013-07-12 2019-09-25 Huawei Technologies Co., Ltd. Gre tunnel implementation method, access device and convergence gateway
US9282019B2 (en) 2013-07-12 2016-03-08 Nicira, Inc. Tracing logical network packets through physical network
US9344349B2 (en) 2013-07-12 2016-05-17 Nicira, Inc. Tracing network packets by a cluster of network controllers
CN103581018B (zh) * 2013-07-26 2017-08-11 北京华为数字技术有限公司 报文发送方法、路由器以及业务交换器
US10355932B2 (en) 2013-08-02 2019-07-16 Telefonaktiebolaget L M Ericsson (Publ) Configuration of forwarding rules using the address resolution protocol
US9952885B2 (en) 2013-08-14 2018-04-24 Nicira, Inc. Generation of configuration files for a DHCP module executing within a virtualized container
US9887960B2 (en) 2013-08-14 2018-02-06 Nicira, Inc. Providing services for logical networks
CN104378298A (zh) * 2013-08-16 2015-02-25 中兴通讯股份有限公司 一种流表条目生成方法及相应设备
US9325609B2 (en) 2013-08-23 2016-04-26 Futurewei Technologies, Inc. Segmented source routing in a network
US9548965B2 (en) 2013-08-26 2017-01-17 Nicira, Inc. Proxy methods for suppressing broadcast traffic in a network
US9374308B2 (en) 2013-08-30 2016-06-21 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Openflow switch mode transition processing
US9654390B2 (en) 2013-09-03 2017-05-16 Cisco Technology, Inc. Method and apparatus for improving cloud routing service performance
US9503371B2 (en) 2013-09-04 2016-11-22 Nicira, Inc. High availability L3 gateways for logical networks
US9577845B2 (en) 2013-09-04 2017-02-21 Nicira, Inc. Multiple active L3 gateways for logical networks
US20150085870A1 (en) * 2013-09-25 2015-03-26 Cisco Technology, Inc. Co-operative load sharing and redundancy in distributed service chains in a network environment
US10033693B2 (en) 2013-10-01 2018-07-24 Nicira, Inc. Distributed identity-based firewalls
JP2015092652A (ja) * 2013-10-03 2015-05-14 キヤノン株式会社 通信装置およびその制御方法
US9455901B2 (en) 2013-10-04 2016-09-27 Nicira, Inc. Managing software and hardware forwarding elements to define virtual networks
US9548960B2 (en) 2013-10-06 2017-01-17 Mellanox Technologies Ltd. Simplified packet routing
US10063458B2 (en) 2013-10-13 2018-08-28 Nicira, Inc. Asymmetric connection with external networks
US9785455B2 (en) * 2013-10-13 2017-10-10 Nicira, Inc. Logical router
US9998530B2 (en) 2013-10-15 2018-06-12 Nicira, Inc. Distributed global load-balancing system for software-defined data centers
US9363180B2 (en) * 2013-11-04 2016-06-07 Telefonkatiebolaget L M Ericsson (Publ) Service chaining in a cloud environment using Software Defined Networking
JP2015095784A (ja) * 2013-11-12 2015-05-18 富士通株式会社 情報処理システム、情報処理システムの制御方法及び情報処理装置の制御プログラム
US9749290B2 (en) * 2013-11-14 2017-08-29 Verizon Patent And Licensing Inc. Distributing and virtualizing a network address translation (NAT)
US9300585B2 (en) 2013-11-15 2016-03-29 Cisco Technology, Inc. Shortening of service paths in service chains in a communications network
EP3059909B1 (en) * 2013-11-22 2018-03-21 Huawei Technologies Co., Ltd. Method, apparatus and system for controlling forwarding of service data in virtual network
US9253043B2 (en) * 2013-11-30 2016-02-02 At&T Intellectual Property I, L.P. Methods and apparatus to convert router configuration data
WO2015081551A1 (zh) * 2013-12-06 2015-06-11 华为技术有限公司 一种网络中实现报文路由的方法、设备和系统
US9197569B2 (en) * 2013-12-06 2015-11-24 Algoblu Holdings Limited Hierarchical control in software-defined network (SDN)
US20150180769A1 (en) * 2013-12-20 2015-06-25 Alcatel-Lucent Usa Inc. Scale-up of sdn control plane using virtual switch based overlay
US9391884B2 (en) 2014-01-31 2016-07-12 Google Inc. Consistent hashing using exact matching with application to hardware load balancing
US9225597B2 (en) 2014-03-14 2015-12-29 Nicira, Inc. Managed gateways peering with external router to attract ingress packets
EP3117561B1 (en) * 2014-03-14 2018-10-17 Nicira Inc. Route advertisement by managed gateways
US9419855B2 (en) * 2014-03-14 2016-08-16 Nicira, Inc. Static routes for logical routers
US9590901B2 (en) 2014-03-14 2017-03-07 Nicira, Inc. Route advertisement by managed gateways
US9313129B2 (en) * 2014-03-14 2016-04-12 Nicira, Inc. Logical router processing by network controller
WO2015142404A1 (en) * 2014-03-21 2015-09-24 Nicira, Inc. Dynamic routing for logical routers
US9647883B2 (en) * 2014-03-21 2017-05-09 Nicria, Inc. Multiple levels of logical routers
US9503321B2 (en) 2014-03-21 2016-11-22 Nicira, Inc. Dynamic routing for logical routers
WO2015147780A1 (en) * 2014-03-24 2015-10-01 Hewlett-Packard Development Company, L.P. Client-based port filter table
CN104954274B (zh) 2014-03-25 2018-03-16 华为技术有限公司 生成转发信息的方法、控制器和业务转发实体
US9338091B2 (en) 2014-03-27 2016-05-10 Nicira, Inc. Procedures for efficient cloud service access in a system with multiple tenant logical networks
US9413644B2 (en) 2014-03-27 2016-08-09 Nicira, Inc. Ingress ECMP in virtual distributed routing environment
US9794186B2 (en) * 2014-03-27 2017-10-17 Nicira, Inc. Distributed network address translation for efficient cloud service access
US9893988B2 (en) 2014-03-27 2018-02-13 Nicira, Inc. Address resolution using multiple designated instances of a logical router
US9825854B2 (en) 2014-03-27 2017-11-21 Nicira, Inc. Host architecture for efficient cloud service access
US10177936B2 (en) * 2014-03-28 2019-01-08 International Business Machines Corporation Quality of service (QoS) for multi-tenant-aware overlay virtual networks
WO2015152435A1 (ko) 2014-03-31 2015-10-08 쿨클라우드㈜ Sdn 기반의 분할 계층적 네트워크 시스템
US9906494B2 (en) 2014-03-31 2018-02-27 Nicira, Inc. Configuring interactions with a firewall service virtual machine
US9215210B2 (en) 2014-03-31 2015-12-15 Nicira, Inc. Migrating firewall connection state for a firewall service virtual machine
US9794079B2 (en) * 2014-03-31 2017-10-17 Nicira, Inc. Replicating broadcast, unknown-unicast, and multicast traffic in overlay logical networks bridged with physical networks
EP3127365B1 (en) * 2014-04-04 2022-06-08 Telefonaktiebolaget LM Ericsson (publ) Mobile network handling of unattended traffic
US9755858B2 (en) 2014-04-15 2017-09-05 Cisco Technology, Inc. Programmable infrastructure gateway for enabling hybrid cloud services in a network environment
TWI531908B (zh) * 2014-04-24 2016-05-01 A method of supporting virtual machine migration with Software Defined Network (SDN)
US9923799B2 (en) * 2014-04-25 2018-03-20 Metaswitch Networks Ltd. Data processing
US10164894B2 (en) 2014-05-05 2018-12-25 Nicira, Inc. Buffered subscriber tables for maintaining a consistent network state
US9473365B2 (en) 2014-05-08 2016-10-18 Cisco Technology, Inc. Collaborative inter-service scheduling of logical resources in cloud platforms
US10313225B1 (en) * 2014-05-09 2019-06-04 Amazon Technologies, Inc. Scalable routing service
US9379931B2 (en) 2014-05-16 2016-06-28 Cisco Technology, Inc. System and method for transporting information to services in a network environment
US9479443B2 (en) 2014-05-16 2016-10-25 Cisco Technology, Inc. System and method for transporting information to services in a network environment
US9648121B2 (en) 2014-05-27 2017-05-09 Ravello Systems Ltd. Source-destination network address translation (SDNAT) proxy and method thereof
US10205648B1 (en) * 2014-05-30 2019-02-12 EMC IP Holding Company LLC Network monitoring using traffic mirroring and encapsulated tunnel in virtualized information processing system
US9413659B2 (en) 2014-06-11 2016-08-09 Cisco Technology, Inc. Distributed network address and port translation for migrating flows between service chains in a network environment
US9641429B2 (en) 2014-06-18 2017-05-02 Radware, Ltd. Predictive traffic steering over software defined networks
US9729473B2 (en) 2014-06-23 2017-08-08 Mellanox Technologies, Ltd. Network high availability using temporary re-routing
US9806994B2 (en) * 2014-06-24 2017-10-31 Mellanox Technologies, Ltd. Routing via multiple paths with efficient traffic distribution
CN105338125B (zh) * 2014-06-25 2019-11-05 华为技术有限公司 报文处理方法及装置
US10747888B2 (en) * 2014-06-30 2020-08-18 Nicira, Inc. Method and apparatus for differently encrypting data messages for different logical networks
US10122605B2 (en) 2014-07-09 2018-11-06 Cisco Technology, Inc Annotation of network activity through different phases of execution
US9313044B2 (en) * 2014-07-17 2016-04-12 Cisco Technology, Inc. Multiple mobility domains with VLAN translation in a multi-tenant network environment
US9699067B2 (en) 2014-07-22 2017-07-04 Mellanox Technologies, Ltd. Dragonfly plus: communication over bipartite node groups connected by a mesh network
US9923827B2 (en) 2014-09-05 2018-03-20 At&T Intellectual Property I, L.P. Load balancing and migration of transport connections
US9825878B2 (en) 2014-09-26 2017-11-21 Cisco Technology, Inc. Distributed application framework for prioritizing network traffic using application priority awareness
US9935827B2 (en) 2014-09-30 2018-04-03 Nicira, Inc. Method and apparatus for distributing load among a plurality of service nodes
US10511458B2 (en) 2014-09-30 2019-12-17 Nicira, Inc. Virtual distributed bridging
US10250443B2 (en) 2014-09-30 2019-04-02 Nicira, Inc. Using physical location to modify behavior of a distributed virtual network element
US10135737B2 (en) 2014-09-30 2018-11-20 Nicira, Inc. Distributed load balancing systems
US9768980B2 (en) 2014-09-30 2017-09-19 Nicira, Inc. Virtual distributed bridging
US11296930B2 (en) 2014-09-30 2022-04-05 Nicira, Inc. Tunnel-enabled elastic service model
US10020960B2 (en) 2014-09-30 2018-07-10 Nicira, Inc. Virtual distributed bridging
US9762508B2 (en) * 2014-10-02 2017-09-12 Microsoft Technology Licensing, Llc Relay optimization using software defined networking
US10469342B2 (en) 2014-10-10 2019-11-05 Nicira, Inc. Logical network traffic analysis
US20160105534A1 (en) * 2014-10-13 2016-04-14 Futurewei Technologies, Inc. Physical switch initialization using representational state transfer services
US10348621B2 (en) * 2014-10-30 2019-07-09 AT&T Intellectual Property I. L. P. Universal customer premise equipment
CN105634959A (zh) * 2014-10-31 2016-06-01 杭州华三通信技术有限公司 一种软件定义网络中的流表项分发方法和装置
WO2016077948A1 (zh) * 2014-11-17 2016-05-26 华为技术有限公司 交换机端口控制方法、装置及系统
US10417025B2 (en) 2014-11-18 2019-09-17 Cisco Technology, Inc. System and method to chain distributed applications in a network environment
US9954775B2 (en) * 2014-11-25 2018-04-24 Electronics And Telecommunications Research Institute Software-defined network (SDN) system using host abstraction, and method for implementing the same
USRE48131E1 (en) 2014-12-11 2020-07-28 Cisco Technology, Inc. Metadata augmentation in a service function chain
WO2016094825A1 (en) 2014-12-11 2016-06-16 Brocade Communications Systems, Inc. Multilayered distributed router architecture
US9660909B2 (en) 2014-12-11 2017-05-23 Cisco Technology, Inc. Network service header metadata for load balancing
US10129180B2 (en) * 2015-01-30 2018-11-13 Nicira, Inc. Transit logical switch within logical router
US10050862B2 (en) 2015-02-09 2018-08-14 Cisco Technology, Inc. Distributed application framework that uses network and application awareness for placing data
US9866427B2 (en) 2015-02-16 2018-01-09 Juniper Networks, Inc. Multi-stage switch fabric fault detection and handling
US10708342B2 (en) 2015-02-27 2020-07-07 Cisco Technology, Inc. Dynamic troubleshooting workspaces for cloud and network management systems
US9680731B2 (en) 2015-02-27 2017-06-13 International Business Machines Corporation Adaptive software defined networking controller
US10037617B2 (en) 2015-02-27 2018-07-31 Cisco Technology, Inc. Enhanced user interface systems including dynamic context selection for cloud-based networks
CN105991430B (zh) 2015-03-05 2022-01-14 李明 跨多个自治网络系统的数据路由
US9935834B1 (en) 2015-03-13 2018-04-03 Cisco Technology, Inc. Automated configuration of virtual port channels
US9733968B2 (en) 2015-03-16 2017-08-15 Oracle International Corporation Virtual machine (VM) migration from switched fabric based computing system to external systems
US11023265B2 (en) * 2015-03-20 2021-06-01 Intel Corporation Techniques for improving output-packet-similarity between primary and secondary virtual machines
US9894005B2 (en) 2015-03-31 2018-02-13 Mellanox Technologies, Ltd. Adaptive routing controlled by source node
US9954783B1 (en) 2015-03-31 2018-04-24 Cisco Technology, Inc. System and method for minimizing disruption from failed service nodes
US10110668B1 (en) 2015-03-31 2018-10-23 Cisco Technology, Inc. System and method for monitoring service nodes
US10305816B1 (en) 2015-03-31 2019-05-28 Cisco Technology, Inc. Adjustable bit mask for high-speed native load balancing on a switch
US10079725B1 (en) 2015-04-01 2018-09-18 Cisco Technology, Inc. Route map policies for network switches
US10103995B1 (en) 2015-04-01 2018-10-16 Cisco Technology, Inc. System and method for automated policy-based routing
US9985894B1 (en) 2015-04-01 2018-05-29 Cisco Technology, Inc. Exclude filter for load balancing switch
WO2016160043A1 (en) * 2015-04-03 2016-10-06 Hewlett Packard Enterprise Development Lp Address cache for tunnel endpoint associated with an overlay network
US10609091B2 (en) 2015-04-03 2020-03-31 Nicira, Inc. Method, apparatus, and system for implementing a content switch
US10382534B1 (en) 2015-04-04 2019-08-13 Cisco Technology, Inc. Selective load balancing of network traffic
US10038628B2 (en) 2015-04-04 2018-07-31 Nicira, Inc. Route server mode for dynamic routing between logical and physical networks
US9967134B2 (en) 2015-04-06 2018-05-08 Nicira, Inc. Reduction of network churn based on differences in input state
US10798048B2 (en) * 2015-04-07 2020-10-06 Nicira, Inc. Address resolution protocol suppression using a flow-based forwarding element
US10498652B2 (en) 2015-04-13 2019-12-03 Nicira, Inc. Method and system of application-aware routing with crowdsourcing
US10135789B2 (en) 2015-04-13 2018-11-20 Nicira, Inc. Method and system of establishing a virtual private network in a cloud service for branch networking
US10425382B2 (en) * 2015-04-13 2019-09-24 Nicira, Inc. Method and system of a cloud-based multipath routing protocol
US9942058B2 (en) 2015-04-17 2018-04-10 Nicira, Inc. Managing tunnel endpoints for facilitating creation of logical networks
US9825902B1 (en) 2015-04-22 2017-11-21 Cisco Technology, Inc. Route advertisement for native hardware-based virtual IP address (“VIP”) on layer 2/layer 3 switch
US10033631B1 (en) 2015-04-23 2018-07-24 Cisco Technology, Inc. Route distribution for service appliances
US10469389B1 (en) 2015-04-23 2019-11-05 Cisco Technology, Inc. TCAM-based load balancing on a switch
US10075377B1 (en) 2015-04-23 2018-09-11 Cisco Technology, Inc. Statistical collection in a network switch natively configured as a load balancer
US10554547B2 (en) * 2015-05-07 2020-02-04 Cisco Technology, Inc. Scalable network address translation at high speed in a network environment
US9935882B2 (en) 2015-05-13 2018-04-03 Cisco Technology, Inc. Configuration of network elements for automated policy-based routing
US10476982B2 (en) 2015-05-15 2019-11-12 Cisco Technology, Inc. Multi-datacenter message queue
US9971624B2 (en) 2015-05-17 2018-05-15 Nicira, Inc. Logical processing for containers
US9762402B2 (en) 2015-05-20 2017-09-12 Cisco Technology, Inc. System and method to facilitate the assignment of service functions for service chains in a network environment
US10554484B2 (en) 2015-06-26 2020-02-04 Nicira, Inc. Control plane integration with hardware switches
US10243848B2 (en) 2015-06-27 2019-03-26 Nicira, Inc. Provisioning logical entities in a multi-datacenter environment
US10225184B2 (en) 2015-06-30 2019-03-05 Nicira, Inc. Redirecting traffic in a virtual distributed router environment
US10225105B2 (en) * 2015-07-08 2019-03-05 Openvpn Technologies, Inc. Network address translation
US10034201B2 (en) 2015-07-09 2018-07-24 Cisco Technology, Inc. Stateless load-balancing across multiple tunnels
US10243914B2 (en) * 2015-07-15 2019-03-26 Nicira, Inc. Managing link aggregation traffic in edge nodes
US9985837B2 (en) 2015-07-23 2018-05-29 Cisco Technology, Inc. Refresh of the binding tables between data-link-layer and network-layer addresses on mobility in a data center environment
US10038632B2 (en) * 2015-07-23 2018-07-31 Netscout Systems, Inc. AIA enhancements to support L2 connected networks
US9847938B2 (en) 2015-07-31 2017-12-19 Nicira, Inc. Configuring logical routers on hardware switches
US9967182B2 (en) 2015-07-31 2018-05-08 Nicira, Inc. Enabling hardware switches to perform logical routing functionalities
US9819581B2 (en) * 2015-07-31 2017-11-14 Nicira, Inc. Configuring a hardware switch as an edge node for a logical router
US10129142B2 (en) 2015-08-11 2018-11-13 Nicira, Inc. Route configuration for logical router
US10075363B2 (en) 2015-08-31 2018-09-11 Nicira, Inc. Authorization for advertised routes among logical routers
US10313186B2 (en) 2015-08-31 2019-06-04 Nicira, Inc. Scalable controller for hardware VTEPS
JP6574906B2 (ja) * 2015-09-29 2019-09-11 華為技術有限公司Huawei Technologies Co.,Ltd. マスター・スレーブ・ネットワークのためのipアドレス割り当て方法、装置、およびシステム
US10230576B2 (en) 2015-09-30 2019-03-12 Nicira, Inc. Managing administrative statuses of hardware VTEPs
US10204122B2 (en) 2015-09-30 2019-02-12 Nicira, Inc. Implementing an interface between tuple and message-driven control entities
US9948577B2 (en) * 2015-09-30 2018-04-17 Nicira, Inc. IP aliases in logical networks with hardware switches
US10263828B2 (en) 2015-09-30 2019-04-16 Nicira, Inc. Preventing concurrent distribution of network data to a hardware switch by multiple controllers
US9998324B2 (en) * 2015-09-30 2018-06-12 Nicira, Inc. Logical L3 processing for L2 hardware switches
US10067780B2 (en) 2015-10-06 2018-09-04 Cisco Technology, Inc. Performance-based public cloud selection for a hybrid cloud environment
US11005682B2 (en) 2015-10-06 2021-05-11 Cisco Technology, Inc. Policy-driven switch overlay bypass in a hybrid cloud network environment
US10462136B2 (en) 2015-10-13 2019-10-29 Cisco Technology, Inc. Hybrid cloud security groups
CN106612200A (zh) * 2015-10-27 2017-05-03 成都鼎桥通信技术有限公司 分布式网络架构及其调度方法
US10095535B2 (en) * 2015-10-31 2018-10-09 Nicira, Inc. Static route types for logical routers
US10078527B2 (en) 2015-11-01 2018-09-18 Nicira, Inc. Securing a managed forwarding element that operates within a data compute node
US10250553B2 (en) 2015-11-03 2019-04-02 Nicira, Inc. ARP offloading for managed hardware forwarding elements
US10680998B2 (en) 2015-11-10 2020-06-09 International Business Machines Corporation Method, system, and computer program product for a network device in switchless networks
US10523657B2 (en) 2015-11-16 2019-12-31 Cisco Technology, Inc. Endpoint privacy preservation with cloud conferencing
US10205677B2 (en) 2015-11-24 2019-02-12 Cisco Technology, Inc. Cloud resource placement optimization and migration execution in federated clouds
US10719341B2 (en) 2015-12-02 2020-07-21 Nicira, Inc. Learning of tunnel endpoint selections
US10069646B2 (en) * 2015-12-02 2018-09-04 Nicira, Inc. Distribution of tunnel endpoint mapping information
CN108432189B (zh) * 2015-12-02 2021-04-20 Nicira股份有限公司 多个隧道端点上的负载平衡
US9912616B2 (en) * 2015-12-02 2018-03-06 Nicira, Inc. Grouping tunnel endpoints of a bridge cluster
US10164885B2 (en) 2015-12-02 2018-12-25 Nicira, Inc. Load balancing over multiple tunnel endpoints
US10084703B2 (en) 2015-12-04 2018-09-25 Cisco Technology, Inc. Infrastructure-exclusive service forwarding
US9998375B2 (en) 2015-12-15 2018-06-12 Nicira, Inc. Transactional controls for supplying control plane data to managed hardware forwarding elements
US10225149B2 (en) 2015-12-15 2019-03-05 Nicira, Inc. Method and tool for diagnosing logical networks
US9917799B2 (en) 2015-12-15 2018-03-13 Nicira, Inc. Transactional controls for supplying control plane data to managed hardware forwarding elements
US9992112B2 (en) 2015-12-15 2018-06-05 Nicira, Inc. Transactional controls for supplying control plane data to managed hardware forwarding elements
US9973435B2 (en) 2015-12-16 2018-05-15 Mellanox Technologies Tlv Ltd. Loopback-free adaptive routing
US9998371B2 (en) 2015-12-16 2018-06-12 Nicira, Inc. Packet communication between container data compute nodes and a managed forwarding element
US10063469B2 (en) 2015-12-16 2018-08-28 Nicira, Inc. Forwarding element implementation for containers
US10305858B2 (en) 2015-12-18 2019-05-28 Nicira, Inc. Datapath processing of service rules with qualifiers defined in terms of dynamic groups
US10148696B2 (en) * 2015-12-18 2018-12-04 Nicira, Inc. Service rule console for creating, viewing and updating template based service rules
US10341297B2 (en) 2015-12-18 2019-07-02 Nicira, Inc. Datapath processing of service rules with qualifiers defined in terms of template identifiers and/or template matching criteria
WO2017113231A1 (zh) * 2015-12-30 2017-07-06 华为技术有限公司 一种报文传输的方法、装置和系统
US10063468B2 (en) 2016-01-15 2018-08-28 Cisco Technology, Inc. Leaking routes in a service chain
US11044203B2 (en) 2016-01-19 2021-06-22 Cisco Technology, Inc. System and method for hosting mobile packet core and value-added services using a software defined network and service chains
US10819621B2 (en) 2016-02-23 2020-10-27 Mellanox Technologies Tlv Ltd. Unicast forwarding of adaptive-routing notifications
US10241820B2 (en) 2016-03-14 2019-03-26 Nicira, Inc. Determining the realization status of logical entities in logical networks
US10243797B2 (en) 2016-03-14 2019-03-26 Nicira, Inc. Identifying the realization status of logical entities based on a global realization number
US10187306B2 (en) 2016-03-24 2019-01-22 Cisco Technology, Inc. System and method for improved service chaining
CN106059881B (zh) * 2016-03-28 2017-11-14 北京智梵网络科技有限公司 一种sdn网络及其流量导入导出方法
US10142231B2 (en) * 2016-03-31 2018-11-27 Intel Corporation Technologies for network I/O access
US10237142B2 (en) 2016-04-04 2019-03-19 Nicira, Inc. Troubleshooting virtual network reachability
US10574741B2 (en) * 2016-04-18 2020-02-25 Nokia Technologies Oy Multi-level load balancing
US10931793B2 (en) 2016-04-26 2021-02-23 Cisco Technology, Inc. System and method for automated rendering of service chaining
US10333849B2 (en) 2016-04-28 2019-06-25 Nicira, Inc. Automatic configuration of logical routers on edge nodes
US10841273B2 (en) 2016-04-29 2020-11-17 Nicira, Inc. Implementing logical DHCP servers in logical networks
US10484515B2 (en) 2016-04-29 2019-11-19 Nicira, Inc. Implementing logical metadata proxy servers in logical networks
US11019167B2 (en) 2016-04-29 2021-05-25 Nicira, Inc. Management of update queues for network controller
US10547588B2 (en) * 2016-04-30 2020-01-28 Nicira, Inc. Method of translating a logical switch into a set of network addresses
US10091161B2 (en) 2016-04-30 2018-10-02 Nicira, Inc. Assignment of router ID for logical routers
CA2966897A1 (en) * 2016-05-10 2017-11-10 Carbon Engineering Limited Partnership High temperature hydrator
US10178029B2 (en) 2016-05-11 2019-01-08 Mellanox Technologies Tlv Ltd. Forwarding of adaptive routing notifications
EP3459225B1 (en) * 2016-05-17 2020-09-23 Telefonaktiebolaget LM Ericsson (PUBL) Methods and apparatus for enabling live virtual machine (vm) migration in software-defined networking networks
US10129177B2 (en) 2016-05-23 2018-11-13 Cisco Technology, Inc. Inter-cloud broker for hybrid cloud networks
US10153973B2 (en) 2016-06-29 2018-12-11 Nicira, Inc. Installation of routing tables for logical router in route server mode
US10560320B2 (en) 2016-06-29 2020-02-11 Nicira, Inc. Ranking of gateways in cluster
US10200343B2 (en) * 2016-06-29 2019-02-05 Nicira, Inc. Implementing logical network security on a hardware switch
US10419550B2 (en) 2016-07-06 2019-09-17 Cisco Technology, Inc. Automatic service function validation in a virtual network environment
US10659283B2 (en) 2016-07-08 2020-05-19 Cisco Technology, Inc. Reducing ARP/ND flooding in cloud environment
WO2018013437A1 (en) * 2016-07-11 2018-01-18 Harmonic, Inc. Namespace routing
US10432532B2 (en) 2016-07-12 2019-10-01 Cisco Technology, Inc. Dynamically pinning micro-service to uplink port
US10382597B2 (en) 2016-07-20 2019-08-13 Cisco Technology, Inc. System and method for transport-layer level identification and isolation of container traffic
US10263898B2 (en) 2016-07-20 2019-04-16 Cisco Technology, Inc. System and method for implementing universal cloud classification (UCC) as a service (UCCaaS)
US10320664B2 (en) 2016-07-21 2019-06-11 Cisco Technology, Inc. Cloud overlay for operations administration and management
US10218616B2 (en) 2016-07-21 2019-02-26 Cisco Technology, Inc. Link selection for communication with a service function cluster
US10142346B2 (en) 2016-07-28 2018-11-27 Cisco Technology, Inc. Extension of a private cloud end-point group to a public cloud
US10225270B2 (en) 2016-08-02 2019-03-05 Cisco Technology, Inc. Steering of cloned traffic in a service function chain
US10218593B2 (en) 2016-08-23 2019-02-26 Cisco Technology, Inc. Identifying sources of packet drops in a service function chain environment
US10567344B2 (en) 2016-08-23 2020-02-18 Cisco Technology, Inc. Automatic firewall configuration based on aggregated cloud managed information
US10798073B2 (en) 2016-08-26 2020-10-06 Nicira, Inc. Secure key management protocol for distributed network encryption
US10341371B2 (en) 2016-08-31 2019-07-02 Nicira, Inc. Identifying and handling threats to data compute nodes in public cloud
US10193749B2 (en) 2016-08-27 2019-01-29 Nicira, Inc. Managed forwarding element executing in public cloud data compute node without overlay network
US10361969B2 (en) 2016-08-30 2019-07-23 Cisco Technology, Inc. System and method for managing chained services in a network environment
US10454758B2 (en) 2016-08-31 2019-10-22 Nicira, Inc. Edge node cluster network redundancy and fast convergence using an underlay anycast VTEP IP
CN107809387B (zh) * 2016-09-08 2020-11-06 华为技术有限公司 一种报文传输的方法、设备及网络系统
US10341236B2 (en) 2016-09-30 2019-07-02 Nicira, Inc. Anycast edge service gateways
US11895177B2 (en) 2016-09-30 2024-02-06 Wisconsin Alumni Research Foundation State extractor for middlebox management system
US10523592B2 (en) 2016-10-10 2019-12-31 Cisco Technology, Inc. Orchestration system for migrating user data and services based on user information
US10419394B2 (en) * 2016-10-24 2019-09-17 Nubeva, Inc. Providing scalable cloud-based security services
US10009801B1 (en) 2016-12-05 2018-06-26 Motorola Solutions, Inc. Systems and methods for forming an incident area network
US10609160B2 (en) * 2016-12-06 2020-03-31 Nicira, Inc. Performing context-rich attribute-based services on a host
US11044162B2 (en) 2016-12-06 2021-06-22 Cisco Technology, Inc. Orchestration of cloud and fog interactions
US10965621B2 (en) 2016-12-15 2021-03-30 At&T Intellectual Property I, L.P. Application-based multiple radio access technology and platform control using SDN
US10848432B2 (en) 2016-12-18 2020-11-24 Cisco Technology, Inc. Switch fabric based load balancing
US10326817B2 (en) 2016-12-20 2019-06-18 Cisco Technology, Inc. System and method for quality-aware recording in large scale collaborate clouds
US10212071B2 (en) 2016-12-21 2019-02-19 Nicira, Inc. Bypassing a load balancer in a return path of network traffic
US10742746B2 (en) 2016-12-21 2020-08-11 Nicira, Inc. Bypassing a load balancer in a return path of network traffic
US10237123B2 (en) 2016-12-21 2019-03-19 Nicira, Inc. Dynamic recovery from a split-brain failure in edge nodes
US10616045B2 (en) 2016-12-22 2020-04-07 Nicira, Inc. Migration of centralized routing components of logical router
US10200294B2 (en) 2016-12-22 2019-02-05 Mellanox Technologies Tlv Ltd. Adaptive routing based on flow-control credits
US10334029B2 (en) 2017-01-10 2019-06-25 Cisco Technology, Inc. Forming neighborhood groups from disperse cloud providers
US10552191B2 (en) 2017-01-26 2020-02-04 Cisco Technology, Inc. Distributed hybrid cloud orchestration model
US10320683B2 (en) 2017-01-30 2019-06-11 Cisco Technology, Inc. Reliable load-balancer using segment routing and real-time application monitoring
US11252079B2 (en) 2017-01-31 2022-02-15 Vmware, Inc. High performance software-defined core network
US10992558B1 (en) 2017-11-06 2021-04-27 Vmware, Inc. Method and apparatus for distributed data network traffic optimization
US10992568B2 (en) 2017-01-31 2021-04-27 Vmware, Inc. High performance software-defined core network
US10671571B2 (en) 2017-01-31 2020-06-02 Cisco Technology, Inc. Fast network performance in containerized environments for network function virtualization
US11706127B2 (en) 2017-01-31 2023-07-18 Vmware, Inc. High performance software-defined core network
US11121962B2 (en) 2017-01-31 2021-09-14 Vmware, Inc. High performance software-defined core network
US10673706B2 (en) * 2017-01-31 2020-06-02 Ca Technologies, Inc. Integrated infrastructure and application performance monitoring
US20200036624A1 (en) 2017-01-31 2020-01-30 The Mode Group High performance software-defined core network
US20180219765A1 (en) 2017-01-31 2018-08-02 Waltz Networks Method and Apparatus for Network Traffic Control Optimization
US10778528B2 (en) 2017-02-11 2020-09-15 Nicira, Inc. Method and system of connecting to a multipath hub in a cluster
US10574528B2 (en) 2017-02-11 2020-02-25 Nicira, Inc. Network multi-source inbound quality of service methods and systems
US10805239B2 (en) 2017-03-07 2020-10-13 Nicira, Inc. Visualization of path between logical network endpoints
US10225187B2 (en) 2017-03-22 2019-03-05 Cisco Technology, Inc. System and method for providing a bit indexed service chain
US10277535B2 (en) 2017-03-31 2019-04-30 Hewlett Packard Enterprise Development Lp Network switch systems including logical switches
US11005731B2 (en) 2017-04-05 2021-05-11 Cisco Technology, Inc. Estimating model parameters for automatic deployment of scalable micro services
US10257033B2 (en) 2017-04-12 2019-04-09 Cisco Technology, Inc. Virtualized network functions and service chaining in serverless computing infrastructure
US10884807B2 (en) 2017-04-12 2021-01-05 Cisco Technology, Inc. Serverless computing and task scheduling
US10333855B2 (en) 2017-04-19 2019-06-25 Cisco Technology, Inc. Latency reduction in service function paths
US10554689B2 (en) 2017-04-28 2020-02-04 Cisco Technology, Inc. Secure communication session resumption in a service function chain
JP6585656B2 (ja) 2017-05-10 2019-10-02 株式会社ソニー・インタラクティブエンタテインメント 製造ライン用コンピュータシステム及びそのネットワーク設定方法
US10708138B2 (en) 2017-06-09 2020-07-07 Datera, Inc. System and method for an improved placement of storage resources on nodes in network
US10735275B2 (en) 2017-06-16 2020-08-04 Cisco Technology, Inc. Releasing and retaining resources for use in a NFV environment
US10798187B2 (en) 2017-06-19 2020-10-06 Cisco Technology, Inc. Secure service chaining
US10523539B2 (en) 2017-06-22 2019-12-31 Nicira, Inc. Method and system of resiliency in cloud-delivered SD-WAN
US10439877B2 (en) 2017-06-26 2019-10-08 Cisco Technology, Inc. Systems and methods for enabling wide area multicast domain name system
US10382274B2 (en) 2017-06-26 2019-08-13 Cisco Technology, Inc. System and method for wide area zero-configuration network auto configuration
US10546018B2 (en) * 2017-06-29 2020-01-28 Arista Networks, Inc. System and method of coalescing writes to a hardware table in a non-disruptive fashion
US10637800B2 (en) 2017-06-30 2020-04-28 Nicira, Inc Replacement of logical network addresses with physical network addresses
US10681000B2 (en) 2017-06-30 2020-06-09 Nicira, Inc. Assignment of unique physical network addresses for logical network addresses
US10397271B2 (en) 2017-07-11 2019-08-27 Cisco Technology, Inc. Distributed denial of service mitigation for web conferencing
US10432513B2 (en) 2017-07-14 2019-10-01 Nicira, Inc. Asymmetric network elements sharing an anycast address
US10873473B2 (en) 2017-07-17 2020-12-22 Nicira, Inc. Distributed multicast logical router
EP3656099B1 (en) * 2017-07-17 2022-12-28 Nicira Inc. Distributed multicast logical router
US10892940B2 (en) 2017-07-21 2021-01-12 Cisco Technology, Inc. Scalable statistics and analytics mechanisms in cloud networking
US10673698B2 (en) 2017-07-21 2020-06-02 Cisco Technology, Inc. Service function chain optimization using live testing
US10425288B2 (en) 2017-07-21 2019-09-24 Cisco Technology, Inc. Container telemetry in data center environments with blade servers and switches
US10601693B2 (en) 2017-07-24 2020-03-24 Cisco Technology, Inc. System and method for providing scalable flow monitoring in a data center fabric
US10541866B2 (en) 2017-07-25 2020-01-21 Cisco Technology, Inc. Detecting and resolving multicast traffic performance issues
US11165863B1 (en) 2017-08-04 2021-11-02 128 Technology, Inc. Network neighborhoods for establishing communication relationships between communication interfaces in an administrative domain
US11063856B2 (en) 2017-08-24 2021-07-13 Cisco Technology, Inc. Virtual network function monitoring in a network function virtualization deployment
US10491516B2 (en) 2017-08-24 2019-11-26 Nicira, Inc. Packet communication between logical networks and public cloud service providers native networks using a single network interface and a single routing table
US10567482B2 (en) 2017-08-24 2020-02-18 Nicira, Inc. Accessing endpoints in logical networks and public cloud service providers native networks using a single network interface and a single routing table
EP3673627B1 (en) 2017-08-27 2023-09-13 Nicira, Inc. Performing in-line service in public cloud
US10791065B2 (en) 2017-09-19 2020-09-29 Cisco Technology, Inc. Systems and methods for providing container attributes as part of OAM techniques
US11533290B2 (en) 2017-09-28 2022-12-20 Nicira, Inc. Systems and methods for providing multi-tenant dynamic host configuration protocol services
US10992636B2 (en) 2017-09-29 2021-04-27 Cisco Technology, Inc. Mitigating network/hardware address explosion in network devices
US10805114B2 (en) 2017-10-02 2020-10-13 Vmware, Inc. Processing data messages of a virtual network that are sent to and received from external service machines
US10959098B2 (en) 2017-10-02 2021-03-23 Vmware, Inc. Dynamically specifying multiple public cloud edge nodes to connect to an external multi-computer node
US10999165B2 (en) 2017-10-02 2021-05-04 Vmware, Inc. Three tiers of SaaS providers for deploying compute and network infrastructure in the public cloud
US11115480B2 (en) 2017-10-02 2021-09-07 Vmware, Inc. Layer four optimization for a virtual network defined over public cloud
US11089111B2 (en) 2017-10-02 2021-08-10 Vmware, Inc. Layer four optimization for a virtual network defined over public cloud
US10999100B2 (en) 2017-10-02 2021-05-04 Vmware, Inc. Identifying multiple nodes in a virtual network defined over a set of public clouds to connect to an external SAAS provider
US10965598B1 (en) 2017-10-04 2021-03-30 Cisco Technology, Inc. Load balancing in a service chain
US11082312B2 (en) 2017-10-04 2021-08-03 Cisco Technology, Inc. Service chaining segmentation analytics
US10965596B2 (en) 2017-10-04 2021-03-30 Cisco Technology, Inc. Hybrid services insertion
US10608887B2 (en) 2017-10-06 2020-03-31 Nicira, Inc. Using packet tracing tool to automatically execute packet capture operations
US11018981B2 (en) 2017-10-13 2021-05-25 Cisco Technology, Inc. System and method for replication container performance and policy validation using real time network traffic
US10353800B2 (en) 2017-10-18 2019-07-16 Cisco Technology, Inc. System and method for graph based monitoring and management of distributed systems
US10541893B2 (en) 2017-10-25 2020-01-21 Cisco Technology, Inc. System and method for obtaining micro-service telemetry data
US10805181B2 (en) 2017-10-29 2020-10-13 Nicira, Inc. Service operation chaining
US10587507B2 (en) 2017-11-09 2020-03-10 International Business Machines Corporation Routing between software defined networks and physical networks
US11223514B2 (en) 2017-11-09 2022-01-11 Nicira, Inc. Method and system of a dynamic high-availability mode based on current wide area network connectivity
CN109787877B (zh) * 2017-11-10 2020-12-25 智邦科技股份有限公司 箱型交换机、网络接口卡、及封包转送的管理方法
CN108011825B (zh) * 2017-11-10 2020-07-28 深圳市泰信通信息技术有限公司 一种基于软件定义网络的多网络设备互联现实方法及系统
US11481362B2 (en) 2017-11-13 2022-10-25 Cisco Technology, Inc. Using persistent memory to enable restartability of bulk load transactions in cloud databases
US10511459B2 (en) 2017-11-14 2019-12-17 Nicira, Inc. Selection of managed forwarding element for bridge spanning multiple datacenters
US10374827B2 (en) 2017-11-14 2019-08-06 Nicira, Inc. Identifier that maps to different networks at different datacenters
US11012420B2 (en) 2017-11-15 2021-05-18 Nicira, Inc. Third-party service chaining using packet encapsulation in a flow-based forwarding element
US10601705B2 (en) 2017-12-04 2020-03-24 Nicira, Inc. Failover of centralized routers in public cloud logical networks
US10862753B2 (en) 2017-12-04 2020-12-08 Nicira, Inc. High availability for stateful services in public cloud logical networks
EP3913861B1 (en) * 2017-12-05 2023-04-19 Google LLC Automated network change system
US10705882B2 (en) 2017-12-21 2020-07-07 Cisco Technology, Inc. System and method for resource placement across clouds for data intensive workloads
US11595474B2 (en) 2017-12-28 2023-02-28 Cisco Technology, Inc. Accelerating data replication using multicast and non-volatile memory enabled nodes
US10659252B2 (en) 2018-01-26 2020-05-19 Nicira, Inc Specifying and utilizing paths through a network
US10797910B2 (en) 2018-01-26 2020-10-06 Nicira, Inc. Specifying and utilizing paths through a network
US10904202B2 (en) 2018-02-09 2021-01-26 Red Hat, Inc. Packet routing using a network device
US10644995B2 (en) 2018-02-14 2020-05-05 Mellanox Technologies Tlv Ltd. Adaptive routing in a box
US10454824B2 (en) 2018-03-01 2019-10-22 Nicira, Inc. Generic communication channel for information exchange between a hypervisor and a virtual machine
CN108494835B (zh) * 2018-03-08 2020-11-03 浪潮云信息技术股份公司 基于Raft算法的分布式动态路由的实现方法及系统
US10805192B2 (en) 2018-03-27 2020-10-13 Nicira, Inc. Detecting failure of layer 2 service using broadcast messages
US10728174B2 (en) 2018-03-27 2020-07-28 Nicira, Inc. Incorporating layer 2 service between two interfaces of gateway device
US10511534B2 (en) 2018-04-06 2019-12-17 Cisco Technology, Inc. Stateless distributed load-balancing
US10728361B2 (en) 2018-05-29 2020-07-28 Cisco Technology, Inc. System for association of customer information across subscribers
US10666612B2 (en) 2018-06-06 2020-05-26 Cisco Technology, Inc. Service chains for inter-cloud traffic
US10904322B2 (en) 2018-06-15 2021-01-26 Cisco Technology, Inc. Systems and methods for scaling down cloud-based servers handling secure connections
US10764266B2 (en) 2018-06-19 2020-09-01 Cisco Technology, Inc. Distributed authentication and authorization for rapid scaling of containerized services
US11019083B2 (en) 2018-06-20 2021-05-25 Cisco Technology, Inc. System for coordinating distributed website analysis
US11343229B2 (en) 2018-06-28 2022-05-24 Vmware, Inc. Managed forwarding element detecting invalid packet addresses
US10819571B2 (en) 2018-06-29 2020-10-27 Cisco Technology, Inc. Network traffic optimization using in-situ notification system
US10819677B2 (en) * 2018-07-16 2020-10-27 Amazon Technologies, Inc. Address migration service
US10904342B2 (en) 2018-07-30 2021-01-26 Cisco Technology, Inc. Container networking using communication tunnels
US10491466B1 (en) 2018-08-24 2019-11-26 Vmware, Inc. Intelligent use of peering in public cloud
US11196591B2 (en) 2018-08-24 2021-12-07 Vmware, Inc. Centralized overlay gateway in public cloud
US11374794B2 (en) 2018-08-24 2022-06-28 Vmware, Inc. Transitive routing in public cloud
US10742686B2 (en) 2018-08-29 2020-08-11 Cisco Technology, Inc. Enforcing network endpoint policies in a cloud-based environment using a covert namespace
US11595250B2 (en) 2018-09-02 2023-02-28 Vmware, Inc. Service insertion at logical network gateway
US10944673B2 (en) 2018-09-02 2021-03-09 Vmware, Inc. Redirection of data messages at logical network gateway
CN109343974A (zh) * 2018-09-14 2019-02-15 珠海国芯云科技有限公司 基于容器的虚拟桌面的进程间通信方法及装置
US10644895B1 (en) * 2018-10-26 2020-05-05 Cisco Technology, Inc. Recovering multicast data traffic during spine reload in software defined networks
US12106132B2 (en) 2018-11-20 2024-10-01 Amazon Technologies, Inc. Provider network service extensions
US10833949B2 (en) * 2018-11-20 2020-11-10 Amazon Technologies, Inc Extension resource groups of provider network services
US10931560B2 (en) 2018-11-23 2021-02-23 Vmware, Inc. Using route type to determine routing protocol behavior
KR20210095890A (ko) * 2018-11-26 2021-08-03 아르쿠스 인크. 세분화된 네트워크 엘리먼트를 포함하는 로직 라우터
US10797998B2 (en) 2018-12-05 2020-10-06 Vmware, Inc. Route server for distributed routers using hierarchical routing protocol
US10938788B2 (en) 2018-12-12 2021-03-02 Vmware, Inc. Static routes for policy-based VPN
US10951527B2 (en) 2018-12-28 2021-03-16 Juniper Networks, Inc. Switch fabric packet flow reordering
US10848345B2 (en) * 2018-12-31 2020-11-24 Hughes Network Systems, Llc Multi-protocol encapsulation traffic acceleration and optimization
US11005724B1 (en) 2019-01-06 2021-05-11 Mellanox Technologies, Ltd. Network topology having minimal number of long connections among groups of network elements
CN109558367B (zh) * 2019-01-10 2022-10-28 西南电子技术研究所(中国电子科技集团公司第十研究所) 多总线处理器mhal路由方法
US11042397B2 (en) 2019-02-22 2021-06-22 Vmware, Inc. Providing services with guest VM mobility
CN111726299B (zh) * 2019-03-18 2023-05-09 华为技术有限公司 流量均衡方法及装置
US11310170B2 (en) 2019-08-27 2022-04-19 Vmware, Inc. Configuring edge nodes outside of public clouds to use routes defined through the public clouds
US11159343B2 (en) 2019-08-30 2021-10-26 Vmware, Inc. Configuring traffic optimization using distributed edge services
US10855644B1 (en) 2019-09-09 2020-12-01 Vmware, Inc. Address resolution protocol entry verification
US11064017B2 (en) 2019-09-24 2021-07-13 Amazon Technologies, Inc. Peripheral device enabling virtualized computing service extensions
US11044190B2 (en) 2019-10-28 2021-06-22 Vmware, Inc. Managing forwarding elements at edge nodes connected to a virtual network
US11283717B2 (en) 2019-10-30 2022-03-22 Vmware, Inc. Distributed fault tolerant service chain
US11140218B2 (en) 2019-10-30 2021-10-05 Vmware, Inc. Distributed service chain across multiple clouds
US11870692B2 (en) * 2019-11-20 2024-01-09 Arris Enterprises Llc Dynamic port forwarding
US11394640B2 (en) 2019-12-12 2022-07-19 Vmware, Inc. Collecting and analyzing data regarding flows associated with DPI parameters
US11489783B2 (en) 2019-12-12 2022-11-01 Vmware, Inc. Performing deep packet inspection in a software defined wide area network
US11539718B2 (en) 2020-01-10 2022-12-27 Vmware, Inc. Efficiently performing intrusion detection
US11223494B2 (en) 2020-01-13 2022-01-11 Vmware, Inc. Service insertion for multicast traffic at boundary
US11283699B2 (en) 2020-01-17 2022-03-22 Vmware, Inc. Practical overlay network latency measurement in datacenter
US11659061B2 (en) 2020-01-20 2023-05-23 Vmware, Inc. Method of adjusting service function chains to improve network performance
US11153406B2 (en) 2020-01-20 2021-10-19 Vmware, Inc. Method of network performance visualization of service function chains
US11689959B2 (en) 2020-01-24 2023-06-27 Vmware, Inc. Generating path usability state for different sub-paths offered by a network link
WO2021157079A1 (ja) * 2020-02-07 2021-08-12 日本電信電話株式会社 信号転送システム、末端機能装置、代理転送エージェント装置、及び、信号転送方法
US11569997B1 (en) 2020-03-09 2023-01-31 Amazon Technologies, Inc. Security mechanisms for data plane extensions of provider network services
US11303557B2 (en) 2020-04-06 2022-04-12 Vmware, Inc. Tunnel endpoint group records for inter-datacenter traffic
US11088902B1 (en) 2020-04-06 2021-08-10 Vmware, Inc. Synchronization of logical network state between global and local managers
US11777793B2 (en) 2020-04-06 2023-10-03 Vmware, Inc. Location criteria for security groups
US11496437B2 (en) * 2020-04-06 2022-11-08 Vmware, Inc. Selective ARP proxy
US11799726B2 (en) 2020-04-06 2023-10-24 Vmware, Inc. Multi-site security groups
US11088919B1 (en) 2020-04-06 2021-08-10 Vmware, Inc. Data structure for defining multi-site logical network
US11212356B2 (en) 2020-04-06 2021-12-28 Vmware, Inc. Providing services at the edge of a network using selected virtual tunnel interfaces
US11258713B2 (en) 2020-04-06 2022-02-22 Vmware, Inc. Policy-based proximity routing
US11689455B2 (en) 2020-05-28 2023-06-27 Oracle International Corporation Loop prevention in virtual layer 2 networks
US11245641B2 (en) 2020-07-02 2022-02-08 Vmware, Inc. Methods and apparatus for application aware hub clustering techniques for a hyper scale SD-WAN
CN116235482A (zh) * 2020-07-14 2023-06-06 甲骨文国际公司 虚拟层2网络
US11606294B2 (en) 2020-07-16 2023-03-14 Vmware, Inc. Host computer configured to facilitate distributed SNAT service
US11616755B2 (en) * 2020-07-16 2023-03-28 Vmware, Inc. Facilitating distributed SNAT service
US11611613B2 (en) 2020-07-24 2023-03-21 Vmware, Inc. Policy-based forwarding to a load balancer of a load balancing cluster
US11451413B2 (en) 2020-07-28 2022-09-20 Vmware, Inc. Method for advertising availability of distributed gateway service and machines at host computer
US11902050B2 (en) 2020-07-28 2024-02-13 VMware LLC Method for providing distributed gateway service at host computer
US11570090B2 (en) 2020-07-29 2023-01-31 Vmware, Inc. Flow tracing operation in container cluster
US11558426B2 (en) 2020-07-29 2023-01-17 Vmware, Inc. Connection tracking for container cluster
US11196628B1 (en) 2020-07-29 2021-12-07 Vmware, Inc. Monitoring container clusters
US11709710B2 (en) 2020-07-30 2023-07-25 Vmware, Inc. Memory allocator for I/O operations
US11575594B2 (en) 2020-09-10 2023-02-07 Mellanox Technologies, Ltd. Deadlock-free rerouting for resolving local link failures using detour paths
US11601474B2 (en) 2020-09-28 2023-03-07 Vmware, Inc. Network virtualization infrastructure with divided user responsibilities
US11411911B2 (en) 2020-10-26 2022-08-09 Mellanox Technologies, Ltd. Routing across multiple subnetworks using address mapping
US11444865B2 (en) 2020-11-17 2022-09-13 Vmware, Inc. Autonomous distributed forwarding plane traceability based anomaly detection in application traffic for hyper-scale SD-WAN
US11575600B2 (en) 2020-11-24 2023-02-07 Vmware, Inc. Tunnel-less SD-WAN
US11611625B2 (en) 2020-12-15 2023-03-21 Vmware, Inc. Providing stateful services in a scalable manner for machines executing on host computers
US11734043B2 (en) 2020-12-15 2023-08-22 Vmware, Inc. Providing stateful services in a scalable manner for machines executing on host computers
US11601356B2 (en) 2020-12-29 2023-03-07 Vmware, Inc. Emulating packet flows to assess network links for SD-WAN
WO2022146585A1 (en) * 2020-12-30 2022-07-07 Oracle International Corporation Layer-2 networking using access control lists in a virtualized cloud environment
US11757773B2 (en) 2020-12-30 2023-09-12 Oracle International Corporation Layer-2 networking storm control in a virtualized cloud environment
US11736436B2 (en) 2020-12-31 2023-08-22 Vmware, Inc. Identifying routes with indirect addressing in a datacenter
US11336533B1 (en) 2021-01-08 2022-05-17 Vmware, Inc. Network visualization of correlations between logical elements and associated physical elements
US11792127B2 (en) 2021-01-18 2023-10-17 Vmware, Inc. Network-aware load balancing
US11979325B2 (en) 2021-01-28 2024-05-07 VMware LLC Dynamic SD-WAN hub cluster scaling with machine learning
US11671355B2 (en) 2021-02-05 2023-06-06 Oracle International Corporation Packet flow control in a header of a packet
US11777897B2 (en) 2021-02-13 2023-10-03 Oracle International Corporation Cloud infrastructure resources for connecting a service provider private network to a customer private network
US11805101B2 (en) 2021-04-06 2023-10-31 Vmware, Inc. Secured suppression of address discovery messages
US11582144B2 (en) 2021-05-03 2023-02-14 Vmware, Inc. Routing mesh to provide alternate routes through SD-WAN edge forwarding nodes based on degraded operational states of SD-WAN hubs
US12009987B2 (en) 2021-05-03 2024-06-11 VMware LLC Methods to support dynamic transit paths through hub clustering across branches in SD-WAN
US11729065B2 (en) 2021-05-06 2023-08-15 Vmware, Inc. Methods for application defined virtual network service among multiple transport in SD-WAN
US11489720B1 (en) 2021-06-18 2022-11-01 Vmware, Inc. Method and apparatus to evaluate resource elements and public clouds for deploying tenant deployable elements based on harvested performance metrics
US12015536B2 (en) 2021-06-18 2024-06-18 VMware LLC Method and apparatus for deploying tenant deployable elements across public clouds based on harvested performance metrics of types of resource elements in the public clouds
US11870682B2 (en) 2021-06-22 2024-01-09 Mellanox Technologies, Ltd. Deadlock-free local rerouting for handling multiple local link failures in hierarchical network topologies
US11895010B2 (en) 2021-06-29 2024-02-06 VMware LLC Active-active support of multicast streams in virtualized environment
US11595296B2 (en) 2021-06-29 2023-02-28 Vmware, Inc. Active-active support of multicast streams in virtualized environment
US11687210B2 (en) 2021-07-05 2023-06-27 Vmware, Inc. Criteria-based expansion of group nodes in a network topology visualization
US12047282B2 (en) 2021-07-22 2024-07-23 VMware LLC Methods for smart bandwidth aggregation based dynamic overlay selection among preferred exits in SD-WAN
US11375005B1 (en) 2021-07-24 2022-06-28 Vmware, Inc. High availability solutions for a secure access service edge application
US11711278B2 (en) 2021-07-24 2023-07-25 Vmware, Inc. Visualization of flow trace operation across multiple sites
US11706109B2 (en) 2021-09-17 2023-07-18 Vmware, Inc. Performance of traffic monitoring actions
US11943146B2 (en) 2021-10-01 2024-03-26 VMware LLC Traffic prioritization in SD-WAN
US11784926B2 (en) 2021-11-22 2023-10-10 Vmware, Inc. Optimized processing of multicast data messages in a host
US11765103B2 (en) 2021-12-01 2023-09-19 Mellanox Technologies, Ltd. Large-scale network with high port utilization
US20230262464A1 (en) * 2022-02-16 2023-08-17 Cisco Technology, Inc. Client mac source address randomization by mesh nodes in wireless mesh networks
CN114629790B (zh) * 2022-03-11 2023-06-06 苏州浪潮智能科技有限公司 一种服务器网络集群配置方法及系统
US11909815B2 (en) 2022-06-06 2024-02-20 VMware LLC Routing based on geolocation costs
US11711339B1 (en) 2022-06-22 2023-07-25 International Business Machines Corporation Network plugin for multiple network interfaces
US12107722B2 (en) 2022-07-20 2024-10-01 VMware LLC Sharing network manager between multiple tenants
US11743191B1 (en) 2022-07-25 2023-08-29 Vmware, Inc. Load balancing over tunnel endpoint groups
CN115426313B (zh) * 2022-08-31 2023-08-18 中电云数智科技有限公司 一种基于ovn虚机网络的nat优化装置和方法
US12057993B1 (en) 2023-03-27 2024-08-06 VMware LLC Identifying and remediating anomalies in a self-healing network
US12034587B1 (en) 2023-03-27 2024-07-09 VMware LLC Identifying and remediating anomalies in a self-healing network

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1574797A (zh) * 2003-06-24 2005-02-02 捷讯研究有限公司 分布式路由器应用程序序列化
WO2005029791A1 (en) * 2003-09-18 2005-03-31 Cisco Technology, Inc. High availability virtual switch
KR20050083427A (ko) * 2004-02-23 2005-08-26 주식회사 케이티 차세대 네트워크에서의 소프트스위치 다중화 시스템 및다중화 방법
US20050257256A1 (en) * 2004-04-30 2005-11-17 Sun Microsystems, Inc. Firewall load balancing using a single physical device
CN1783842A (zh) * 2004-11-01 2006-06-07 朗迅科技公司 软路由器特征服务器
EP1737253A1 (en) * 2005-06-20 2006-12-27 Alcatel Fault tolerant single plane switch fabric for a telecommunication system
EP2193630A2 (en) * 2007-09-26 2010-06-09 Nicira Networks Network operating system for managing and securing networks
WO2010068618A1 (en) * 2008-12-10 2010-06-17 Amazon Technologies, Inc. Providing access to configurable private computer networks
US20100246443A1 (en) * 2009-03-30 2010-09-30 Cohn Daniel T Providing logical networking functionality for managed computer networks
WO2010132094A1 (en) * 2009-05-15 2010-11-18 Cisco Technology, Inc. Port grouping for association with virtual interfaces
US20110085559A1 (en) * 2009-10-08 2011-04-14 Brocade Communications Systems, Inc. Transit Switches in a Network of Logical Switches
CN102055667A (zh) * 2009-11-04 2011-05-11 丛林网络公司 配置虚拟网络交换机的方法和设备

Family Cites Families (371)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06501118A (ja) 1990-09-17 1994-01-27 ケーブルトロン・システムス・インコーポレーテッド モデル準拠のインテリジェンスを使用するネットワーク管理システム
JPH06250869A (ja) 1993-03-01 1994-09-09 Hitachi Ltd 分散制御システム
JPH0779233A (ja) 1993-06-29 1995-03-20 Synoptics Commun Inc トポロジを確定する装置及びトポロジ情報を通信する方法及び装置
SE9402059D0 (sv) 1994-06-13 1994-06-13 Ellemtel Utvecklings Ab Sätt och anordning vid telekommunikation
US5751967A (en) 1994-07-25 1998-05-12 Bay Networks Group, Inc. Method and apparatus for automatically configuring a network device to support a virtual network
US5550816A (en) 1994-12-29 1996-08-27 Storage Technology Corporation Method and apparatus for virtual switching
US6035105A (en) 1996-01-02 2000-03-07 Cisco Technology, Inc. Multiple VLAN architecture system
JP3684262B2 (ja) * 1996-01-17 2005-08-17 富士通株式会社 ネットワークシステム及び集線装置
US6108304A (en) 1996-03-08 2000-08-22 Abe; Hajime Packet switching network, packet switching equipment, and network management equipment
JPH09307587A (ja) 1996-05-09 1997-11-28 Fujitsu Ltd 交換機
CA2213984A1 (en) * 1996-08-22 1998-02-22 Norand Corporation Enhanced mobility and address resolution in a wireless premises based network
US6295299B1 (en) 1997-08-29 2001-09-25 Extreme Networks, Inc. Data path architecture for a LAN switch
DE69837872T2 (de) 1997-09-19 2008-04-10 Hitachi, Ltd. Vorrichtung und Verfahren zur Verbindungsvermittlung und -steuerung
US6456624B1 (en) 1997-10-29 2002-09-24 Enterasys Networks, Inc. Network address resolve blocker
JP3609256B2 (ja) 1998-05-19 2005-01-12 株式会社日立製作所 ネットワーク管理装置,ノード装置及びネットワーク管理システム
US6658002B1 (en) * 1998-06-30 2003-12-02 Cisco Technology, Inc. Logical operation unit for packet processing
US6424659B2 (en) 1998-07-17 2002-07-23 Network Equipment Technologies, Inc. Multi-layer switching apparatus and method
US6970913B1 (en) * 1999-07-02 2005-11-29 Cisco Technology, Inc. Load balancing using distributed forwarding agents with application based feedback for different virtual machines
US6650641B1 (en) * 1999-07-02 2003-11-18 Cisco Technology, Inc. Network address translation using a forwarding agent
US6963585B1 (en) 1999-10-21 2005-11-08 International Business Machines Corporation Method and system for establishing a virtual path capability in a frame relay network
US6680934B1 (en) 1999-12-02 2004-01-20 Nortel Networks Limited System, device and method for expediting control flow in a communication system
US20020013858A1 (en) * 2000-02-09 2002-01-31 Anderson Keith R. ARP caching apparatus and method
US6880089B1 (en) 2000-03-31 2005-04-12 Avaya Technology Corp. Firewall clustering for multiple network servers
AU2001271263A1 (en) * 2000-06-30 2002-01-14 Net2Phone System, method, and computer program product for resolving addressing in a network including a network address translator
US20020093952A1 (en) 2000-06-30 2002-07-18 Gonda Rumi Sheryar Method for managing circuits in a multistage cross connect
US6836462B1 (en) * 2000-08-30 2004-12-28 Cisco Technology, Inc. Distributed, rule based packet redirection
CN1592898A (zh) * 2000-09-01 2005-03-09 Tut系统公司 一种为数据通信设备预编译配置信息的方法和系统
US7389358B1 (en) 2000-09-13 2008-06-17 Fortinet, Inc. Distributed virtual system to support managed, network-based services
US7865596B2 (en) * 2000-11-02 2011-01-04 Oracle America, Inc. Switching system for managing storage in digital networks
US8949471B2 (en) * 2000-11-02 2015-02-03 Oracle America, Inc. TCP/UDP acceleration
US6973023B1 (en) 2000-12-30 2005-12-06 Cisco Technology, Inc. Method for routing information over a network employing centralized control
US7260648B2 (en) 2001-01-25 2007-08-21 Ericsson, Inc. Extension of address resolution protocol (ARP) for internet protocol (IP) virtual networks
US6999454B1 (en) 2001-02-09 2006-02-14 Nortel Networks Limited Information routing system and apparatus
US6785843B1 (en) 2001-02-23 2004-08-31 Mcrae Andrew Data plane restart without state change in a control plane of an intermediate network node
US7069337B2 (en) 2001-03-20 2006-06-27 Mci, Inc. Policy-based synchronization of per-class resources between routers in a data network
US7209439B2 (en) 2001-03-20 2007-04-24 Mci, Llc Pool-based resource management in a data network
JP3945297B2 (ja) * 2001-04-24 2007-07-18 株式会社日立製作所 システム及び管理システム
US7240106B2 (en) 2001-04-25 2007-07-03 Hewlett-Packard Development Company, L.P. System and method for remote discovery and configuration of a network device
US20020186698A1 (en) * 2001-06-12 2002-12-12 Glen Ceniza System to map remote lan hosts to local IP addresses
EP1267529B1 (en) * 2001-06-14 2007-11-14 Hitachi Ltd. Data packets acknowledgment system
US7343410B2 (en) 2001-06-28 2008-03-11 Finisar Corporation Automated creation of application data paths in storage area networks
US7126944B2 (en) 2001-07-05 2006-10-24 Intel Corporation Routing packets across multiple forwarding elements
TW576061B (en) * 2001-08-13 2004-02-11 Via Tech Inc Device and method for load balancing of packet switching
JP2003069609A (ja) 2001-08-23 2003-03-07 Fujitsu Ltd 仮想私設網サービスを提供するシステム
US7085827B2 (en) * 2001-09-20 2006-08-01 Hitachi, Ltd. Integrated service management system for remote customer support
JP3879471B2 (ja) 2001-10-10 2007-02-14 株式会社日立製作所 計算機資源割当方法
US7200144B2 (en) 2001-10-18 2007-04-03 Qlogic, Corp. Router and methods using network addresses for virtualization
US7133365B2 (en) 2001-11-02 2006-11-07 Internap Network Services Corporation System and method to provide routing control of information over networks
US7433948B2 (en) 2002-01-23 2008-10-07 Cisco Technology, Inc. Methods and apparatus for implementing virtualization of storage within a storage area network
US6895429B2 (en) 2001-12-28 2005-05-17 Network Appliance, Inc. Technique for enabling multiple virtual filers on a single filer to participate in multiple address spaces with overlapping network addresses
US7801155B2 (en) 2002-03-01 2010-09-21 Verizon Business Global Llc Resource allocation in virtual routers
US6941487B1 (en) 2002-03-07 2005-09-06 Riverstone Networks, Inc. Method, system, and computer program product for providing failure protection in a network node
JP3904968B2 (ja) 2002-04-19 2007-04-11 日本電信電話株式会社 Vpnシステムおよびルータ
US7197572B2 (en) 2002-05-06 2007-03-27 Qlogic, Corporation System and method for implementing logical switches in a network system
US7532604B2 (en) * 2002-05-08 2009-05-12 Siemens Canada Limited Local area network with wireless client freedom of movement
US20030223379A1 (en) 2002-05-28 2003-12-04 Xuguang Yang Method and system for inter-domain loop protection using a hierarchy of loop resolving protocols
US7340535B1 (en) * 2002-06-04 2008-03-04 Fortinet, Inc. System and method for controlling routing in a virtual router system
US6907039B2 (en) 2002-07-20 2005-06-14 Redback Networks Inc. Method and apparatus for routing and forwarding between virtual routers within a single network element
US7120728B2 (en) * 2002-07-31 2006-10-10 Brocade Communications Systems, Inc. Hardware-based translating virtualization switch
US7349382B2 (en) * 2002-08-10 2008-03-25 Cisco Technology, Inc. Reverse path forwarding protection of packets using automated population of access control lists based on a forwarding information base
FR2844415B1 (fr) 2002-09-05 2005-02-11 At & T Corp Systeme pare-feu pour interconnecter deux reseaux ip geres par deux entites administratives differentes
US7680086B2 (en) * 2002-09-09 2010-03-16 Siemens Canada Limited Wireless local area network with clients having extended freedom of movement
US20040131059A1 (en) * 2002-09-19 2004-07-08 Ram Ayyakad Single-pass packet scan
US20040066782A1 (en) * 2002-09-23 2004-04-08 Nassar Ayman Esam System, method and apparatus for sharing and optimizing packet services nodes
JP4444834B2 (ja) * 2002-10-04 2010-03-31 テレフオンアクチーボラゲット エル エム エリクソン(パブル) アクセスネットワークに接続されるホストの分離
US20040073659A1 (en) 2002-10-15 2004-04-15 Carl Rajsic Method and apparatus for managing nodes in a network
US20040098505A1 (en) 2002-11-20 2004-05-20 Clemmensen Daniel G. Forwarding system with multiple logical sub-system functionality
US7224668B1 (en) * 2002-11-27 2007-05-29 Cisco Technology, Inc. Control plane security and traffic flow management
JP2004287811A (ja) * 2003-03-20 2004-10-14 Fujitsu Ltd データ処理回路
JP2004304371A (ja) * 2003-03-28 2004-10-28 Fujitsu Ltd レイヤ2のスイッチング装置
JP4157409B2 (ja) 2003-03-31 2008-10-01 富士通株式会社 仮想パス構築装置および仮想パス構築方法
US7283473B2 (en) 2003-04-10 2007-10-16 International Business Machines Corporation Apparatus, system and method for providing multiple logical channel adapters within a single physical channel adapter in a system area network
US8473620B2 (en) * 2003-04-14 2013-06-25 Riverbed Technology, Inc. Interception of a cloud-based communication connection
US20040210663A1 (en) * 2003-04-15 2004-10-21 Paul Phillips Object-aware transport-layer network processing engine
US7792987B1 (en) 2003-04-21 2010-09-07 Juniper Networks, Inc. Supporting virtual private networks using a first network topology for forwarding and a subset of the first network topology or a smaller topology for signaling
US7710874B2 (en) 2003-06-04 2010-05-04 International Business Machines Corporation System and method for automatic management of many computer data processing system pipes
JP2004364141A (ja) * 2003-06-06 2004-12-24 Hitachi Communication Technologies Ltd Ipアドレス変換装置およびパケット転送装置
US20040252722A1 (en) * 2003-06-13 2004-12-16 Samsung Electronics Co., Ltd. Apparatus and method for implementing VLAN bridging and a VPN in a distributed architecture router
US7715380B2 (en) 2003-06-19 2010-05-11 Cisco Technology, Inc. Apparatus and methods for handling shared services through virtual route forwarding (VRF)-aware-NAT
US7356818B2 (en) 2003-06-24 2008-04-08 International Business Machines Corporation Virtual machine communicating to external device without going through other virtual machines by using a list of IP addresses managed only by a single virtual machine monitor
US7203944B1 (en) * 2003-07-09 2007-04-10 Veritas Operating Corporation Migrating virtual machines among computer systems to balance load caused by virtual machines
US7463579B2 (en) 2003-07-11 2008-12-09 Nortel Networks Limited Routed split multilink trunking
US20050018669A1 (en) 2003-07-25 2005-01-27 International Business Machines Corporation Infiniband subnet management queue pair emulation for multiple logical ports on a single physical port
US7697527B2 (en) 2003-07-30 2010-04-13 Nortel Networks Limited Method and apparatus for direct frame switching using frame contained destination information
US20050047412A1 (en) * 2003-08-25 2005-03-03 Susan Hares Establishment and enforcement of policies in packet-switched networks
US7366181B2 (en) 2003-09-06 2008-04-29 Fujitsu Limited Virtual private network (VPN) with channelized ethernet over sonet (EoS) interface and method
US7342916B2 (en) 2003-09-10 2008-03-11 Intel Corporation Method, apparatus and system for optimizing routing of mobile IP packets
US7424709B2 (en) * 2003-09-15 2008-09-09 Intel Corporation Use of multiple virtual machine monitors to handle privileged events
US8009556B2 (en) 2003-10-17 2011-08-30 Ip Infusion, Inc. System and method for providing redundant routing capabilities for a network node
US7555002B2 (en) 2003-11-06 2009-06-30 International Business Machines Corporation Infiniband general services queue pair virtualization for multiple logical ports on a single physical port
US8146148B2 (en) 2003-11-19 2012-03-27 Cisco Technology, Inc. Tunneled security groups
US7672302B2 (en) * 2003-11-21 2010-03-02 Samsung Electronics Co., Ltd. Router using switching-before-routing packet processing and method of operation
US8095640B2 (en) 2003-12-12 2012-01-10 Alcatel Lucent Distributed architecture for real-time flow measurement at the network domain level
US7450598B2 (en) * 2003-12-15 2008-11-11 At&T Intellectual Property I, L.P. System and method to provision MPLS/VPN network
US7478173B1 (en) 2003-12-18 2009-01-13 Wmware, Inc. Method and system for sharing a network connection in a virtual computer system
ES2388667T3 (es) 2003-12-22 2012-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Control de caudales de paquetes de comunicaciones móviles
CN100384172C (zh) * 2004-01-20 2008-04-23 华为技术有限公司 基于网络的虚拟专用网中保证服务质量的系统及其方法
US7391771B2 (en) 2004-01-23 2008-06-24 Metro Packet Systems Inc. Method of sending information through a tree and ring topology of a network system
US7633955B1 (en) * 2004-02-13 2009-12-15 Habanero Holdings, Inc. SCSI transport for fabric-backplane enterprise servers
US8838743B2 (en) * 2004-02-13 2014-09-16 Intel Corporation Apparatus and method for a dynamically extensible virtual switch
JP4382528B2 (ja) * 2004-02-27 2009-12-16 富士通株式会社 マルチキャストネットワーク装置,マルチキャストネットワークシステムおよびマルチキャスト方法
US20050251856A1 (en) * 2004-03-11 2005-11-10 Aep Networks Network access using multiple authentication realms
US8161270B1 (en) * 2004-03-30 2012-04-17 Extreme Networks, Inc. Packet data modification processor
US7822032B1 (en) * 2004-03-30 2010-10-26 Extreme Networks, Inc. Data structures for supporting packet data modification operations
US8566946B1 (en) * 2006-04-20 2013-10-22 Fireeye, Inc. Malware containment on connection
US8539582B1 (en) * 2004-04-01 2013-09-17 Fireeye, Inc. Malware containment and security analysis on connection
US20050220096A1 (en) 2004-04-06 2005-10-06 Robert Friskney Traffic engineering in frame-based carrier networks
US7742398B1 (en) 2004-04-12 2010-06-22 Azul Systems, Inc. Information redirection
CN101411156B (zh) 2004-05-12 2011-04-20 阿尔卡特朗讯 对网络入侵者的自动阻止
US20060031432A1 (en) 2004-05-21 2006-02-09 Bea Systens, Inc. Service oriented architecture with message processing pipelines
CN100512123C (zh) * 2004-06-23 2009-07-08 四川南山之桥微电子有限公司 同一芯片上实现交换、路由、数据过滤及防火墙的方法
US7296092B2 (en) * 2004-06-30 2007-11-13 Nokia, Inc. Apparatus for inter-domain communications including a virtual switch for routing data packets between virtual interfaces of the virtual switch
US7808983B2 (en) * 2004-07-08 2010-10-05 Cisco Technology, Inc. Network device architecture for centralized packet processing
ATE387050T1 (de) 2004-08-02 2008-03-15 Alcatel Lucent Gemeinsam genutzte ressourcen in einer multimanager-umgebung
US7706302B2 (en) 2004-09-14 2010-04-27 Alcatel Lucent Optimization of routing forwarding database in a network processor
US7420728B2 (en) 2004-09-27 2008-09-02 Idc, Llc Methods of fabricating interferometric modulators by selectively removing a material
GB2419701A (en) 2004-10-29 2006-05-03 Hewlett Packard Development Co Virtual overlay infrastructure with dynamic control of mapping
GB2419703A (en) 2004-10-29 2006-05-03 Hewlett Packard Development Co Isolated virtual overlay infrastructures each having an interface to control interaction with others
US9014181B2 (en) 2004-11-01 2015-04-21 Alcatel Lucent Softrouter separate control network
US8068408B2 (en) 2004-11-01 2011-11-29 Alcatel Lucent Softrouter protocol disaggregation
US8458467B2 (en) 2005-06-21 2013-06-04 Cisco Technology, Inc. Method and apparatus for adaptive application message payload content transformation in a network infrastructure element
US8285907B2 (en) * 2004-12-10 2012-10-09 Intel Corporation Packet processing in switched fabric networks
DE602004023338D1 (de) 2004-12-21 2009-11-05 Ericsson Telefon Ab L M Anordnung und verfahren in bezug auf den fluss von paketen in kommunikationssystemen
KR20070095374A (ko) 2004-12-31 2007-09-28 브리티쉬 텔리커뮤니케이션즈 파블릭 리미티드 캄퍼니 비연결형 통신 트래픽을 위한 연결형 통신 방법
US20060182118A1 (en) 2005-02-01 2006-08-17 Hong Kong Applied Science and Technology Research Institute Company Limited System And Method For Efficient Traffic Processing
US20070036178A1 (en) * 2005-02-02 2007-02-15 Susan Hares Layer 2 virtual switching environment
US7730486B2 (en) 2005-02-28 2010-06-01 Hewlett-Packard Development Company, L.P. System and method for migrating virtual machines on cluster systems
US7936770B1 (en) 2005-03-08 2011-05-03 Enterasys Networks, Inc. Method and apparatus of virtual class of service and logical queue representation through network traffic distribution over multiple port interfaces
FR2883437B1 (fr) 2005-03-16 2007-08-03 Wavestorm Sarl Dispositif et procede de communication dans un reseau
US7697536B2 (en) 2005-04-01 2010-04-13 International Business Machines Corporation Network communications for operating system partitions
US20060265508A1 (en) * 2005-05-02 2006-11-23 Angel Franklin J System for administering a multiplicity of namespaces containing state information and services
US20060268834A1 (en) * 2005-05-26 2006-11-30 Symbol Technologies, Inc. Method, system and wireless router apparatus supporting multiple subnets for layer 3 roaming in wireless local area networks (WLANs)
US7802000B1 (en) * 2005-08-01 2010-09-21 Vmware Virtual network in server farm
US8149737B2 (en) 2005-08-09 2012-04-03 Motorola Solutions, Inc. Method and system for data transmission in a wireless network
CN1741503B (zh) * 2005-08-18 2010-09-08 杭州华三通信技术有限公司 一种交换设备和交换方法
CN100479417C (zh) * 2005-09-02 2009-04-15 华为技术有限公司 一种防止媒体流迂回的通信方法
US8121146B2 (en) * 2005-09-21 2012-02-21 Intel Corporation Method, apparatus and system for maintaining mobility resistant IP tunnels using a mobile router
US8062221B2 (en) * 2005-09-30 2011-11-22 Nellcor Puritan Bennett Llc Sensor for tissue gas detection and technique for using the same
US7542468B1 (en) * 2005-10-18 2009-06-02 Intuit Inc. Dynamic host configuration protocol with security
US20070101323A1 (en) 2005-10-28 2007-05-03 Microsoft Corporation Automatic virtual machine adjustments to network changes
JP2007135109A (ja) 2005-11-11 2007-05-31 Hitachi Ltd 仮想ネットワーク管理方法、仮想ネットワーク管理プログラム、仮想ネットワーク管理システムおよび仮想ネットワーク管理手段
ATE456890T1 (de) 2005-12-13 2010-02-15 Ibm Verfahren zum betrieb von mehreren virtuellen netzwerken
US20070266433A1 (en) * 2006-03-03 2007-11-15 Hezi Moore System and Method for Securing Information in a Virtual Computing Environment
US7801128B2 (en) 2006-03-31 2010-09-21 Amazon Technologies, Inc. Managing communications between computing nodes
US8838756B2 (en) 2009-07-27 2014-09-16 Vmware, Inc. Management and implementation of enclosed local networks in a virtual lab
US8619771B2 (en) 2009-09-30 2013-12-31 Vmware, Inc. Private allocated networks over shared communications infrastructure
US7839847B2 (en) 2006-05-08 2010-11-23 Cisco Technology, Inc. Methods and apparatus providing VPN traffic matrix construction
CA2547047A1 (en) 2006-05-15 2007-11-15 Embotics Corporation Management of virtual machines using mobile autonomic elements
US7953089B1 (en) * 2006-05-16 2011-05-31 Cisco Technology, Inc. Systems and methods for multicast switching in a private VLAN
US20070271362A1 (en) * 2006-05-18 2007-11-22 Yehuda Bamnolker Implementation of reflexive access control lists on distributed platforms
CA2549285C (en) * 2006-05-26 2017-01-31 Bce Inc Method, system and apparatus for verifying validity of location information in a packet-switched network
US8060875B1 (en) 2006-05-26 2011-11-15 Vmware, Inc. System and method for multiple virtual teams
JP4714081B2 (ja) 2006-06-01 2011-06-29 アラクサラネットワークス株式会社 ネットワーク接続装置
US20070286209A1 (en) * 2006-06-12 2007-12-13 Research In Motion Limited System and method for handling address resolution protocol requests
US7522595B2 (en) * 2006-06-16 2009-04-21 Cisco Technology, Inc. Communicating packets between forwarding contexts using virtual interfaces
US8327008B2 (en) 2006-06-20 2012-12-04 Lenovo (Singapore) Pte. Ltd. Methods and apparatus for maintaining network addresses
US7706303B2 (en) 2006-06-26 2010-04-27 Cisco Technology, Inc. Port pooling
US7643482B2 (en) 2006-06-30 2010-01-05 Sun Microsystems, Inc. System and method for virtual switching in a host
US7761596B2 (en) 2006-06-30 2010-07-20 Telefonaktiebolaget L M Ericsson (Publ) Router and method for server load balancing
JP2008028914A (ja) * 2006-07-25 2008-02-07 Nec Corp 通信負荷低減装置、通信負荷低減方法、及びプログラム
US7525969B2 (en) * 2006-08-25 2009-04-28 Cisco Technology, Inc. NAT processing in a VRF environment
US8204982B2 (en) 2006-09-14 2012-06-19 Quova, Inc. System and method of middlebox detection and characterization
US7643488B2 (en) 2006-09-29 2010-01-05 Nortel Networks Limited Method and apparatus for supporting multiple customer provisioned IPSec VPNs
US7876765B2 (en) * 2006-09-29 2011-01-25 Intel Corporation Method for supporting IP network interconnectivity between partitions in a virtualized environment
JP5244332B2 (ja) 2006-10-30 2013-07-24 株式会社日立製作所 情報システム、データ転送方法及びデータ保護方法
US7826482B1 (en) 2006-11-17 2010-11-02 Juniper Networks, Inc. Service-specific forwarding in an LDP-RSVP hybrid network
WO2008071227A1 (en) 2006-12-12 2008-06-19 Telefonaktiebolaget Lm Ericsson (Publ) Ip address distribution in middleboxes
US8223668B2 (en) 2006-12-14 2012-07-17 Rockstar Bidco Lp Method and apparatus for exchanging routing information and the establishment of connectivity across multiple network areas
US7738457B2 (en) * 2006-12-20 2010-06-15 Oracle America, Inc. Method and system for virtual routing using containers
US8190755B1 (en) * 2006-12-27 2012-05-29 Symantec Corporation Method and apparatus for host authentication in a network implementing network access control
US20080159301A1 (en) * 2006-12-29 2008-07-03 De Heer Arjan Arie Enabling virtual private local area network services
CN101212314A (zh) * 2006-12-30 2008-07-02 北京天融信网络安全技术有限公司 单一芯片实现多项网络安全功能的方法
US7550828B2 (en) * 2007-01-03 2009-06-23 Stats Chippac, Inc. Leadframe package for MEMS microphone assembly
US8381209B2 (en) * 2007-01-03 2013-02-19 International Business Machines Corporation Moveable access control list (ACL) mechanisms for hypervisors and virtual machines and virtual port firewalls
US20080175239A1 (en) * 2007-01-23 2008-07-24 Yipes Enterprise Services, Inc Multicast wide-area network for distributing data to selected destinations with limited or no replication
US7856549B2 (en) 2007-01-24 2010-12-21 Hewlett-Packard Development Company, L.P. Regulating power consumption
US20080189769A1 (en) 2007-02-01 2008-08-07 Martin Casado Secure network switching infrastructure
WO2008093174A1 (en) 2007-02-02 2008-08-07 Groupe Des Ecoles Des Telecommuinications (Get) Institut National Des Telecommunications (Int) Autonomic network node system
US20080186990A1 (en) 2007-02-02 2008-08-07 International Business Machines Corporation Translation module, method and computer program product for providing multiple infiniband address support for vm migration using infiniband address translation
IL189514A (en) 2007-02-14 2011-12-29 Marvell Israel Misl Ltd Logical mediation system and method
US7925850B1 (en) 2007-02-16 2011-04-12 Vmware, Inc. Page signature disambiguation for increasing the efficiency of virtual machine migration in shared-page virtualized computer systems
US8050267B2 (en) * 2007-02-19 2011-11-01 Cisco Technology, Inc. Simple virtual private network for small local area networks
US9661112B2 (en) * 2007-02-22 2017-05-23 International Business Machines Corporation System and methods for providing server virtualization assistance
US8055789B2 (en) 2007-03-27 2011-11-08 Amazon Technologies, Inc. Configuring intercommunications between computing nodes
US8111707B2 (en) 2007-12-20 2012-02-07 Packeteer, Inc. Compression mechanisms for control plane—data plane processing architectures
US8059532B2 (en) * 2007-06-21 2011-11-15 Packeteer, Inc. Data and control plane architecture including server-side triggered flow policy mechanism
US8594085B2 (en) 2007-04-11 2013-11-26 Palo Alto Networks, Inc. L2/L3 multi-mode switch including policy processing
CN101030946A (zh) * 2007-04-12 2007-09-05 华为技术有限公司 一种实现数据业务的方法及系统
WO2008128194A2 (en) 2007-04-12 2008-10-23 Rutgers, The State University Of New Jersey System and method for controlling a file system
US7903655B2 (en) 2007-04-19 2011-03-08 Hewlett-Packard Development Company, L.P. Marked packet forwarding
JP4740897B2 (ja) 2007-05-24 2011-08-03 株式会社日立製作所 仮想ネットワーク構成方法及びネットワークシステム
US7948874B2 (en) 2007-05-24 2011-05-24 World Wide Packets, Inc. Transitioning a virtual interface from one tunnel to another tunnel
US8938489B2 (en) * 2007-06-22 2015-01-20 Red Hat, Inc. Monitoring system performance changes based on configuration modification
US8031633B2 (en) 2007-08-13 2011-10-04 Honeywell International Inc. Virtual network architecture for space data processing
US8671256B2 (en) 2007-08-27 2014-03-11 International Business Machines Corporation Migrating contents of a memory on a virtual machine
US8621573B2 (en) * 2007-08-28 2013-12-31 Cisco Technology, Inc. Highly scalable application network appliances with virtualized services
CN101119208A (zh) * 2007-08-28 2008-02-06 福建星网锐捷网络有限公司 交换机、业务处理单板及交换单板
US8798056B2 (en) 2007-09-24 2014-08-05 Intel Corporation Method and system for virtual port communications
EP2201474B1 (en) 2007-10-03 2020-05-06 NTT Global Networks Incorporated Virtualized application acceleration infrastructure
US8848544B2 (en) 2007-11-08 2014-09-30 Cisco Technology, Inc. Event correlation using network data flow simulation over unmanaged network segments
US7801994B2 (en) * 2007-11-29 2010-09-21 Hitachi, Ltd. Method and apparatus for locating candidate data centers for application migration
US7945647B2 (en) 2007-12-10 2011-05-17 Oracle America, Inc. Method and system for creating a virtual network path
US7984123B2 (en) 2007-12-10 2011-07-19 Oracle America, Inc. Method and system for reconfiguring a virtual network path
US8199750B1 (en) 2007-12-18 2012-06-12 World Wide Packets, Inc. Communicating with a control plane using a forwarding information format and control plane processing of packets devoid of a virtual switch identifier
US8194674B1 (en) 2007-12-20 2012-06-05 Quest Software, Inc. System and method for aggregating communications and for translating between overlapping internal network addresses and unique external network addresses
US9432213B2 (en) 2007-12-31 2016-08-30 Rpx Clearinghouse Llc IP forwarding across a link state protocol controlled ethernet network
US9577842B2 (en) * 2008-02-25 2017-02-21 Cisco Technology, Inc. Shared L2 bridging domains for L3 virtual networks
US8625592B2 (en) * 2008-02-26 2014-01-07 Cisco Technology, Inc. Blade switch with scalable interfaces
GB2458157B (en) 2008-03-07 2012-04-25 Hewlett Packard Development Co Virtual machine liveness check
GB2459433B (en) 2008-03-07 2012-06-06 Hewlett Packard Development Co Distributed network connection policy management
GB2458154B (en) 2008-03-07 2012-06-27 Hewlett Packard Development Co Routing across a virtual network
US8155028B2 (en) 2008-03-17 2012-04-10 Alcatel Lucent Method and apparatus for providing full logical connectivity in MPLS networks
CA2659141C (en) * 2008-03-20 2014-07-08 Embotics Corporation Method and system for supporting wake-on-lan in a virtualized environment
US20090249471A1 (en) * 2008-03-27 2009-10-01 Moshe Litvin Reversible firewall policies
US8429739B2 (en) 2008-03-31 2013-04-23 Amazon Technologies, Inc. Authorizing communications between computing nodes
US7865586B2 (en) * 2008-03-31 2011-01-04 Amazon Technologies, Inc. Configuring communications between computing nodes
US8339959B1 (en) 2008-05-20 2012-12-25 Juniper Networks, Inc. Streamlined packet forwarding using dynamic filters for routing and security in a shared forwarding plane
US8195774B2 (en) 2008-05-23 2012-06-05 Vmware, Inc. Distributed virtual switch for virtualized computer systems
US8004998B2 (en) * 2008-05-23 2011-08-23 Solera Networks, Inc. Capture and regeneration of a network data using a virtual software switch
US8849971B2 (en) 2008-05-28 2014-09-30 Red Hat, Inc. Load balancing in cloud-based networks
US8160063B2 (en) * 2008-06-09 2012-04-17 Microsoft Corporation Data center interconnect and traffic engineering
US8099615B2 (en) 2008-06-30 2012-01-17 Oracle America, Inc. Method and system for power management in a virtual machine environment without disrupting network connectivity
US7941539B2 (en) * 2008-06-30 2011-05-10 Oracle America, Inc. Method and system for creating a virtual router in a blade chassis to maintain connectivity
CN101325551B (zh) * 2008-07-28 2010-09-22 杭州华三通信技术有限公司 一种报文处理方法和报文处理装置
CN101369968B (zh) * 2008-08-18 2011-02-16 中国科学院计算技术研究所 实现端到端通信的可配置nat设备及其数据转发方法
US8300532B1 (en) 2008-09-23 2012-10-30 Juniper Networks, Inc. Forwarding plane configuration for separation of services and forwarding in an integrated services router
US7885276B1 (en) 2008-09-30 2011-02-08 Emc Corporation Isolating network traffic in multi-tenant virtualization environments
JP2010114665A (ja) 2008-11-06 2010-05-20 Toshiba Corp 通信データ制御方法及び計算機システム
US7921197B2 (en) * 2008-11-19 2011-04-05 Vmware, Inc. Dynamic configuration of virtual machines
US7962647B2 (en) 2008-11-24 2011-06-14 Vmware, Inc. Application delivery control module for virtual network switch
US8171124B2 (en) 2008-11-25 2012-05-01 Citrix Systems, Inc. Systems and methods for GSLB remote service monitoring
US8201237B1 (en) 2008-12-10 2012-06-12 Amazon Technologies, Inc. Establishing secure remote access to private computer networks
US8055770B2 (en) 2008-12-15 2011-11-08 At&T Intellectual Property I, L.P. Method and apparatus for providing network virtualization
US8271775B2 (en) 2008-12-17 2012-09-18 Cisco Technology, Inc. Layer two encryption for data center interconnectivity
WO2010070906A1 (ja) * 2008-12-18 2010-06-24 日本電気株式会社 通信装置、通信システム、通信制御方法及び通信制御プログラム
US20100157821A1 (en) * 2008-12-18 2010-06-24 Morris Robert P Methods, Systems, And Computer Program Products For Sending Data Units Based On A Measure Of Energy
US8255496B2 (en) 2008-12-30 2012-08-28 Juniper Networks, Inc. Method and apparatus for determining a network topology during network provisioning
US8054832B1 (en) 2008-12-30 2011-11-08 Juniper Networks, Inc. Methods and apparatus for routing between virtual resources based on a routing location policy
US8190769B1 (en) * 2008-12-30 2012-05-29 Juniper Networks, Inc. Methods and apparatus for provisioning at a network device in response to a virtual resource migration notification
US8331362B2 (en) 2008-12-30 2012-12-11 Juniper Networks, Inc. Methods and apparatus for distributed dynamic network provisioning
US8565118B2 (en) * 2008-12-30 2013-10-22 Juniper Networks, Inc. Methods and apparatus for distributed dynamic network provisioning
US7995483B1 (en) 2009-01-20 2011-08-09 Juniper Networks, Inc. Simultaneously testing connectivity to multiple remote maintenance endpoints of the same maintenance association
US20100192225A1 (en) 2009-01-28 2010-07-29 Juniper Networks, Inc. Efficient application identification with network devices
US7948986B1 (en) 2009-02-02 2011-05-24 Juniper Networks, Inc. Applying services within MPLS networks
WO2010096552A1 (en) 2009-02-19 2010-08-26 Futurewei Technologies, Inc. System and method for point to multipoint inter-domain multiprotocol label switching traffic engineering path calculation
US8213336B2 (en) 2009-02-23 2012-07-03 Cisco Technology, Inc. Distributed data center access switch
JP5544097B2 (ja) * 2009-02-23 2014-07-09 株式会社日立国際電気 ネットワーク間接続装置
WO2010103909A1 (ja) 2009-03-09 2010-09-16 日本電気株式会社 OpenFlow通信システムおよびOpenFlow通信方法
US8130641B2 (en) * 2009-03-13 2012-03-06 Hewlett-Packard Development Company, L.P. Methods and systems for managing network traffic within a virtual network system
US8265075B2 (en) 2009-03-16 2012-09-11 International Business Machines Corporation Method and apparatus for managing, configuring, and controlling an I/O virtualization device through a network switch
US8792490B2 (en) 2009-03-16 2014-07-29 Cisco Technology, Inc. Logically partitioned networking devices
US9817695B2 (en) * 2009-04-01 2017-11-14 Vmware, Inc. Method and system for migrating processes between virtual machines
CA2756289C (en) * 2009-04-01 2016-02-02 Nicira Networks, Inc. Method and apparatus for implementing and managing virtual switches
WO2010121216A1 (en) 2009-04-17 2010-10-21 Viasat, Inc. System, method and apparatus for providing end-to-end layer 2 connectivity
US8589919B2 (en) 2009-04-28 2013-11-19 Cisco Technology, Inc. Traffic forwarding for virtual machines
US8027354B1 (en) 2009-04-29 2011-09-27 Cisco Technology, Inc. Network consolidation for virtualized servers
JP2010263261A (ja) * 2009-04-30 2010-11-18 Nec Corp ネットワーク構成機器、情報通信ネットワーク及びそれらに用いるネットワーク自動構築方法
US8429647B2 (en) * 2009-05-06 2013-04-23 Vmware, Inc. Virtual machine migration across network by publishing routes to the associated virtual networks via virtual router after the start of migration of the virtual machine
US8538919B1 (en) 2009-05-16 2013-09-17 Eric H. Nielsen System, method, and computer program for real time remote recovery of virtual computing machines
US8867349B2 (en) 2009-05-18 2014-10-21 Cisco Technology, Inc. Regulation of network traffic in virtual private networks
US9497039B2 (en) * 2009-05-28 2016-11-15 Microsoft Technology Licensing, Llc Agile data center network architecture
US20100318609A1 (en) 2009-06-15 2010-12-16 Microsoft Corporation Bridging enterprise networks into cloud
US9210065B2 (en) 2009-06-22 2015-12-08 Alcatel Lucent Providing cloud-based services using dynamic network virtualization
US8644188B1 (en) 2009-06-25 2014-02-04 Amazon Technologies, Inc. Providing virtual networking functionality for managed computer networks
CN101594358B (zh) * 2009-06-29 2012-09-05 北京航空航天大学 三层交换方法、装置、系统和宿主机
US8572609B2 (en) 2009-07-01 2013-10-29 Riverbed Technology, Inc. Configuring bypass functionality of a network device based on the state of one or more hosted virtual machines
US8634437B2 (en) 2009-07-01 2014-01-21 Riverbed Technology, Inc. Extended network protocols for communicating metadata with virtual machines
US8954957B2 (en) 2009-07-01 2015-02-10 Riverbed Technology, Inc. Network traffic processing according to network traffic rule criteria and transferring network traffic metadata in a network device that includes hosted virtual machines
US8990433B2 (en) 2009-07-01 2015-03-24 Riverbed Technology, Inc. Defining network traffic processing flows between virtual machines
US8532116B2 (en) * 2009-07-21 2013-09-10 Cisco Technology, Inc. Extended subnets
US8559333B2 (en) * 2009-07-24 2013-10-15 Broadcom Corporation Method and system for scalable switching architecture
US9270542B2 (en) 2009-07-31 2016-02-23 Ixia Apparatus and methods for forwarding data packets captured from a network
US20110032830A1 (en) 2009-08-06 2011-02-10 Jacobus Van Der Merwe Live Router Migration
US8339994B2 (en) 2009-08-27 2012-12-25 Brocade Communications Systems, Inc. Defining an optimal topology for a group of logical switches
CN104065555B (zh) * 2009-09-24 2018-09-18 日本电气株式会社 虚拟服务器间通信识别系统和虚拟服务器间通信识别方法
US8619779B2 (en) 2009-09-30 2013-12-31 Alcatel Lucent Scalable architecture for enterprise extension in a cloud topology
WO2011043379A1 (ja) * 2009-10-06 2011-04-14 日本電気株式会社 ネットワークシステムとコントローラと方法とプログラム
JP5717164B2 (ja) * 2009-10-07 2015-05-13 日本電気株式会社 コンピュータシステム、及びコンピュータシステムのメンテナンス方法
US8571031B2 (en) 2009-10-07 2013-10-29 Intel Corporation Configurable frame processing pipeline in a packet switch
JP5494668B2 (ja) 2009-10-07 2014-05-21 日本電気株式会社 情報システム、制御サーバ、仮想ネットワーク管理方法およびプログラム
US20110085557A1 (en) 2009-10-08 2011-04-14 Brocade Communications Systems, Inc. Partitioning of Switches and Fabrics into Logical Switches and Fabrics
US8369333B2 (en) * 2009-10-21 2013-02-05 Alcatel Lucent Method and apparatus for transparent cloud computing with a virtualized network infrastructure
EP2497234B1 (en) 2009-11-02 2018-09-19 Marvell World Trade Ltd. Network device and method based on virtual interfaces
US8621460B2 (en) * 2009-11-02 2013-12-31 International Business Machines Corporation Endpoint-hosted hypervisor management
US8537860B2 (en) * 2009-11-03 2013-09-17 International Business Machines Corporation Apparatus for switching traffic between virtual machines
US8800025B2 (en) * 2009-11-10 2014-08-05 Hei Tao Fung Integrated virtual desktop and security management system
US7937438B1 (en) 2009-12-07 2011-05-03 Amazon Technologies, Inc. Using virtual networking devices to manage external connections
US20110134931A1 (en) 2009-12-08 2011-06-09 Jacobus Van Der Merwe Virtual router migration
US8705513B2 (en) * 2009-12-15 2014-04-22 At&T Intellectual Property I, L.P. Methods and apparatus to communicatively couple virtual private networks to virtual machines within distributive computing networks
US9392080B2 (en) * 2009-12-18 2016-07-12 Microsoft Technology Licensing, Llc IPv4/IPv6 bridge
US7991859B1 (en) 2009-12-28 2011-08-02 Amazon Technologies, Inc. Using virtual networking devices to connect managed computer networks
US7953865B1 (en) 2009-12-28 2011-05-31 Amazon Technologies, Inc. Using virtual networking devices to manage routing communications between connected computer networks
US8224971B1 (en) 2009-12-28 2012-07-17 Amazon Technologies, Inc. Using virtual networking devices and routing information to initiate external actions
WO2011085559A1 (en) * 2010-01-15 2011-07-21 Style Limited Methods of making manufactured eucalyptus wood products
JP5382451B2 (ja) * 2010-01-29 2014-01-08 日本電気株式会社 フロントエンドシステム、フロントエンド処理方法
US8874749B1 (en) * 2010-02-03 2014-10-28 Citrix Systems, Inc. Network fragmentation and virtual machine migration in a scalable cloud computing environment
JP5392137B2 (ja) * 2010-02-17 2014-01-22 富士通株式会社 通信処理のためのプログラム、コンピュータ及び方法
US8345688B2 (en) * 2010-02-23 2013-01-01 Google Inc. System and method for managing flow of packets
US8612627B1 (en) 2010-03-03 2013-12-17 Amazon Technologies, Inc. Managing encoded multi-part communications for provided computer networks
CN101771618B (zh) 2010-03-11 2014-04-09 中兴通讯股份有限公司 一种分组传送网络接入环中主机路由可达的方法及系统
US9413649B2 (en) * 2010-03-12 2016-08-09 Force10 Networks, Inc. Virtual network device architecture
US8863144B2 (en) 2010-03-15 2014-10-14 International Business Machines Corporation Method and apparatus for determining resources consumed by tasks
US8654680B2 (en) * 2010-03-16 2014-02-18 Force10 Networks, Inc. Packet forwarding using multiple stacked chassis
JP5644150B2 (ja) * 2010-03-23 2014-12-24 日本電気株式会社 サービス提供システム、仮想マシンサーバ、サービス提供方法及びサービス提供プログラム
US8560658B2 (en) * 2010-03-23 2013-10-15 Juniper Networks, Inc. Managing distributed address pools within network devices
US8259571B1 (en) 2010-03-26 2012-09-04 Zscaler, Inc. Handling overlapping IP addresses in multi-tenant architecture
JP5190084B2 (ja) * 2010-03-30 2013-04-24 株式会社日立製作所 仮想マシンのマイグレーション方法およびシステム
US8224931B1 (en) 2010-03-31 2012-07-17 Amazon Technologies, Inc. Managing use of intermediate destination computing nodes for provided computer networks
US8396946B1 (en) * 2010-03-31 2013-03-12 Amazon Technologies, Inc. Managing integration of external nodes into provided computer networks
US8611352B2 (en) 2010-04-20 2013-12-17 Marvell World Trade Ltd. System and method for adapting a packet processing pipeline
US8566257B2 (en) * 2010-04-26 2013-10-22 International Business Machines Corporation Address data learning and registration within a distributed virtual bridge
US8504718B2 (en) 2010-04-28 2013-08-06 Futurewei Technologies, Inc. System and method for a context layer switch
US8989186B2 (en) 2010-06-08 2015-03-24 Brocade Communication Systems, Inc. Virtual port grouping for virtual cluster switching
US8625616B2 (en) * 2010-05-11 2014-01-07 Brocade Communications Systems, Inc. Converged network extension
US9306849B2 (en) * 2010-05-03 2016-04-05 Pluribus Networks, Inc. Methods and systems for managing distribute media access control address tables
US9769016B2 (en) * 2010-06-07 2017-09-19 Brocade Communications Systems, Inc. Advanced link tracking for virtual cluster switching
US8407366B2 (en) 2010-05-14 2013-03-26 Microsoft Corporation Interconnecting members of a virtual network
BR112012018762B1 (pt) 2010-05-28 2022-06-21 Huawei Technologies Co., Ltd Sistema, componente de rede e método para promover uma comunicação entre uma pluralidade de domínios de acesso
US8989187B2 (en) 2010-06-04 2015-03-24 Coraid, Inc. Method and system of scaling a cloud computing network
US8374183B2 (en) 2010-06-22 2013-02-12 Microsoft Corporation Distributed virtual network gateways
US8396954B2 (en) * 2010-06-24 2013-03-12 Aryaka Networks, Inc. Routing and service performance management in an application acceleration environment
US8688994B2 (en) * 2010-06-25 2014-04-01 Microsoft Corporation Federation among services for supporting virtual-network overlays
WO2012006190A1 (en) 2010-06-29 2012-01-12 Huawei Technologies Co., Ltd. Delegate gateways and proxy for target hosts in large layer 2 and address resolution with duplicated internet protocol addresses
US8239863B2 (en) * 2010-06-29 2012-08-07 Hewlett-Packard Development Company, L.P. Method and system for migrating a virtual machine
CN104396192B (zh) * 2010-06-29 2018-03-06 华为技术有限公司 不对称网络地址封装
US8239572B1 (en) 2010-06-30 2012-08-07 Amazon Technologies, Inc. Custom routing decisions
US8958292B2 (en) * 2010-07-06 2015-02-17 Nicira, Inc. Network control apparatus and method with port security controls
US8456984B2 (en) 2010-07-19 2013-06-04 Ciena Corporation Virtualized shared protection capacity
US8351325B2 (en) 2010-08-18 2013-01-08 Yr20 Method and system for layer-2 pseudo-wire rapid-deployment service over unknown internet protocol networks
JP2012053842A (ja) * 2010-09-03 2012-03-15 Konica Minolta Business Technologies Inc ネットワークに接続された端末装置、当該端末装置が適用された印刷システム、及び当該端末装置の制御方法
JP5476261B2 (ja) 2010-09-14 2014-04-23 株式会社日立製作所 マルチテナント型情報処理システム、管理サーバ及び構成管理方法
US8565108B1 (en) * 2010-09-28 2013-10-22 Amazon Technologies, Inc. Network data transmission analysis
CN102457583B (zh) 2010-10-19 2014-09-10 中兴通讯股份有限公司 一种虚拟机移动性的实现方法及系统
US8391289B1 (en) * 2010-10-29 2013-03-05 Hewlett-Packard Development Company, L.P. Managing a forwarding table in a switch
US8533285B2 (en) * 2010-12-01 2013-09-10 Cisco Technology, Inc. Directing data flows in data centers with clustering services
US8699499B2 (en) * 2010-12-08 2014-04-15 At&T Intellectual Property I, L.P. Methods and apparatus to provision cloud computing network elements
JP5573649B2 (ja) * 2010-12-17 2014-08-20 富士通株式会社 情報処理装置
US9258271B1 (en) * 2011-01-13 2016-02-09 Google Inc. Network address translation for virtual machines
US10142218B2 (en) 2011-01-14 2018-11-27 International Business Machines Corporation Hypervisor routing between networks in a virtual networking environment
US8614870B2 (en) * 2011-01-14 2013-12-24 Hamilton Sundstrand Corporation Active transient current control in electronic circuit breakers
US9037633B2 (en) * 2011-01-27 2015-05-19 Wyse Technology L.L.C. Transferring configuration data from a public cloud server and applying onto a mobile client
US9191327B2 (en) * 2011-02-10 2015-11-17 Varmour Networks, Inc. Distributed service processing of network gateways using virtual machines
US9141410B2 (en) * 2011-03-08 2015-09-22 Rackspace Us, Inc. Pluggable allocation in a cloud computing system
US8665739B2 (en) 2011-03-16 2014-03-04 Juniper Networks, Inc. Packet loss measurement at service endpoints of a virtual private LAN service
US8774213B2 (en) * 2011-03-30 2014-07-08 Amazon Technologies, Inc. Frameworks and interfaces for offload device-based packet processing
WO2012133290A1 (ja) * 2011-03-31 2012-10-04 日本電気株式会社 コンピュータシステム、及び通信方法
US8848716B2 (en) * 2011-04-11 2014-09-30 Cisco Technology, Inc. Termination of a pseudowires on multiple line cards
US8793685B2 (en) * 2011-05-13 2014-07-29 International Business Machines Corporation Techniques for operating virtual switches in a virtualized computing environment
US8873398B2 (en) * 2011-05-23 2014-10-28 Telefonaktiebolaget L M Ericsson (Publ) Implementing EPC in a cloud computer with openflow data plane
US8798064B2 (en) * 2011-06-06 2014-08-05 Broadcom Corporation Method and system of frame forwarding with link aggregation in distributed ethernet bridges
US9110703B2 (en) * 2011-06-07 2015-08-18 Hewlett-Packard Development Company, L.P. Virtual machine packet processing
US9229867B2 (en) * 2011-06-16 2016-01-05 International Business Machines Corporation Shared network response cache
JP5824911B2 (ja) 2011-06-29 2015-12-02 富士通株式会社 情報処理装置、情報処理プログラムおよび管理方法
US8874955B2 (en) * 2011-07-07 2014-10-28 International Business Machines Corporation Reducing impact of a switch failure in a switch fabric via switch cards
US20130024553A1 (en) * 2011-07-18 2013-01-24 Cisco Technology, Inc. Location independent dynamic IP address assignment
JP6080313B2 (ja) 2011-08-04 2017-02-15 ミドクラ エスエーアールエル 仮想ネットワークを実装及び管理するシステム及び方法
US8813074B2 (en) * 2011-08-05 2014-08-19 Vmware, Inc. Detecting and correcting network interruptions using network address translation
US9274825B2 (en) * 2011-08-16 2016-03-01 Microsoft Technology Licensing, Llc Virtualization gateway between virtualized and non-virtualized networks
AU2015258336B2 (en) 2011-08-17 2017-07-20 Nicira, Inc. Distributed logical L3 routing
EP3605969B1 (en) 2011-08-17 2021-05-26 Nicira Inc. Distributed logical l3 routing
US8762501B2 (en) 2011-08-29 2014-06-24 Telefonaktiebolaget L M Ericsson (Publ) Implementing a 3G packet core in a cloud computer with openflow data and control planes
US8856518B2 (en) 2011-09-07 2014-10-07 Microsoft Corporation Secure and efficient offloading of network policies to network interface cards
US20130074181A1 (en) 2011-09-19 2013-03-21 Cisco Technology, Inc. Auto Migration of Services Within a Virtual Data Center
US20130103834A1 (en) 2011-10-21 2013-04-25 Blue Coat Systems, Inc. Multi-Tenant NATting for Segregating Traffic Through a Cloud Service
US8521905B2 (en) 2011-12-22 2013-08-27 Telefonaktiebolaget L M Ericsson (Publ) System for flexible and extensible flow processing in software-defined networks
US8711860B2 (en) 2011-12-22 2014-04-29 Telefonaktiebolaget L M Ericsson (Publ) Controller for flexible and extensible flow processing in software-defined networks
US8660129B1 (en) 2012-02-02 2014-02-25 Cisco Technology, Inc. Fully distributed routing over a user-configured on-demand virtual network for infrastructure-as-a-service (IaaS) on hybrid cloud networks
US8923149B2 (en) 2012-04-09 2014-12-30 Futurewei Technologies, Inc. L3 gateway for VXLAN
US9710762B2 (en) 2012-06-06 2017-07-18 Juniper Networks, Inc. Dynamic logging
US9451056B2 (en) 2012-06-29 2016-09-20 Avaya Inc. Method for mapping packets to network virtualization instances
US9094459B2 (en) 2012-07-16 2015-07-28 International Business Machines Corporation Flow based overlay network

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1574797A (zh) * 2003-06-24 2005-02-02 捷讯研究有限公司 分布式路由器应用程序序列化
WO2005029791A1 (en) * 2003-09-18 2005-03-31 Cisco Technology, Inc. High availability virtual switch
CN1826771A (zh) * 2003-09-18 2006-08-30 思科技术公司 高可用性虚拟交换机
KR20050083427A (ko) * 2004-02-23 2005-08-26 주식회사 케이티 차세대 네트워크에서의 소프트스위치 다중화 시스템 및다중화 방법
US20050257256A1 (en) * 2004-04-30 2005-11-17 Sun Microsystems, Inc. Firewall load balancing using a single physical device
CN1783842A (zh) * 2004-11-01 2006-06-07 朗迅科技公司 软路由器特征服务器
EP1737253A1 (en) * 2005-06-20 2006-12-27 Alcatel Fault tolerant single plane switch fabric for a telecommunication system
EP2193630A2 (en) * 2007-09-26 2010-06-09 Nicira Networks Network operating system for managing and securing networks
WO2010068618A1 (en) * 2008-12-10 2010-06-17 Amazon Technologies, Inc. Providing access to configurable private computer networks
US20100246443A1 (en) * 2009-03-30 2010-09-30 Cohn Daniel T Providing logical networking functionality for managed computer networks
WO2010132094A1 (en) * 2009-05-15 2010-11-18 Cisco Technology, Inc. Port grouping for association with virtual interfaces
CN102067533A (zh) * 2009-05-15 2011-05-18 思科技术公司 与虚拟接口相关联的端口分组
US20110085559A1 (en) * 2009-10-08 2011-04-14 Brocade Communications Systems, Inc. Transit Switches in a Network of Logical Switches
CN102055667A (zh) * 2009-11-04 2011-05-11 丛林网络公司 配置虚拟网络交换机的方法和设备

Also Published As

Publication number Publication date
EP2745208A1 (en) 2014-06-25
US9059999B2 (en) 2015-06-16
CN107071087A (zh) 2017-08-18
CN106850878A (zh) 2017-06-13
EP3462686A1 (en) 2019-04-03
US20210144090A1 (en) 2021-05-13
US9185069B2 (en) 2015-11-10
EP3605969B1 (en) 2021-05-26
CN107071086A (zh) 2017-08-18
US9369426B2 (en) 2016-06-14
US20130148541A1 (en) 2013-06-13
EP3462686B1 (en) 2019-10-16
US20130148505A1 (en) 2013-06-13
WO2013026049A4 (en) 2013-04-18
US9350696B2 (en) 2016-05-24
US20230353493A1 (en) 2023-11-02
WO2013026049A1 (en) 2013-02-21
JP2014526225A (ja) 2014-10-02
EP3605969A1 (en) 2020-02-05
CN103890751A (zh) 2014-06-25
US20130142048A1 (en) 2013-06-06
JP2016119679A (ja) 2016-06-30
CN106850444B (zh) 2020-10-27
JP6483781B2 (ja) 2019-03-13
US20130044636A1 (en) 2013-02-21
US20130148543A1 (en) 2013-06-13
US20130151676A1 (en) 2013-06-13
JP5870192B2 (ja) 2016-02-24
US10868761B2 (en) 2020-12-15
US9319375B2 (en) 2016-04-19
US9276897B2 (en) 2016-03-01
US9356906B2 (en) 2016-05-31
CN107071086B (zh) 2020-06-05
US20130148656A1 (en) 2013-06-13
US8958298B2 (en) 2015-02-17
JP6231586B2 (ja) 2017-11-15
EP2745208B1 (en) 2018-11-28
CN103890751B (zh) 2017-05-17
US20190028389A1 (en) 2019-01-24
US20130148542A1 (en) 2013-06-13
US11695695B2 (en) 2023-07-04
CN106850878B (zh) 2020-07-14
US20130051399A1 (en) 2013-02-28
US20160373355A1 (en) 2016-12-22
AU2012296329B2 (en) 2015-08-27
US20130151661A1 (en) 2013-06-13
CN107071087B (zh) 2021-01-26
US9407599B2 (en) 2016-08-02
US9461960B2 (en) 2016-10-04
JP2018050306A (ja) 2018-03-29
CN107071088B (zh) 2020-06-05
US10027584B2 (en) 2018-07-17
EP2745208A4 (en) 2015-12-09
CN106850444A (zh) 2017-06-13
AU2012296329A1 (en) 2014-03-06

Similar Documents

Publication Publication Date Title
CN103890751B (zh) 逻辑l3路由
CN106165358B (zh) 用于逻辑路由器的动态路由
CN105051688B (zh) 经扩展的标记联网
CN104584491B (zh) 提供分布式虚拟路由和交换(dvrs)的系统和方法
CN106576075A (zh) 虚拟分布式路由环境中的进入ecmp
JP6248938B2 (ja) 通信システム、仮想ネットワーク管理装置、仮想ネットワークの管理方法及びプログラム
JPWO2014136864A1 (ja) パケット書換装置、制御装置、通信システム、パケット送信方法及びプログラム
US10757004B2 (en) Routing domain identifier assignment in logical network environments
AU2015258336B2 (en) Distributed logical L3 routing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant