CN103081418A - 计算机系统和计算机系统中的通信方法 - Google Patents

计算机系统和计算机系统中的通信方法 Download PDF

Info

Publication number
CN103081418A
CN103081418A CN2011800395551A CN201180039555A CN103081418A CN 103081418 A CN103081418 A CN 103081418A CN 2011800395551 A CN2011800395551 A CN 2011800395551A CN 201180039555 A CN201180039555 A CN 201180039555A CN 103081418 A CN103081418 A CN 103081418A
Authority
CN
China
Prior art keywords
list item
stream list
node
destination
switches
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011800395551A
Other languages
English (en)
Other versions
CN103081418B (zh
Inventor
高岛正德
加濑知博
上野洋史
增田刚久
尹秀薰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of CN103081418A publication Critical patent/CN103081418A/zh
Application granted granted Critical
Publication of CN103081418B publication Critical patent/CN103081418B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/44Star or tree networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/12Avoiding congestion; Recovering from congestion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/46Interconnection of networks
    • H04L12/4604LAN interconnection over a backbone network, e.g. Internet, Frame Relay
    • H04L12/462LAN interconnection over a bridge based backbone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/38Flow based routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/42Centralised routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/54Organization of routing tables
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/09Mapping addresses
    • H04L61/10Mapping addresses of different types
    • H04L61/103Mapping addresses of different types across network layers, e.g. resolution of network layer into physical layer addresses or address resolution protocol [ARP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/24Multipath
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/66Layer 2 routing, e.g. in Ethernet based MAN's

Abstract

本发明的计算机系统包括:控制器,在从多个节点转发分组之前给多个交换机中的每一个设置流表项;以及交换机,每个所述交换机向流表项中定义的目的地节点传递包含在流表项中定义的目的地地址的接收分组,而不考虑所述接收分组的传输源地址。

Description

计算机系统和计算机系统中的通信方法
技术领域
本发明涉及计算机系统和计算机系统中的通信方法,尤其涉及使用开放流(OpenFlow)技术的计算机系统。
背景技术
在使用以太网(注册商标)的通信中,由于生成树协议(STP)导致丧失在网络中可用的物理链路的灵活性,因而多路径通信逐渐成为不可能。
为了解决该问题,提出了开放流路由控制(参考非专利文献1)。例如,在JP2003-229913A(专利文献1)中公开了使用开放流技术的计算机系统。对应于该技术的网络交换机(以下称为可编程流交换机(PFS))在流表中保持诸如协议类型和端口号之类的详细信息,并且可以控制流。应注意,PFS也被称为开放流交换机。
图1是示出了使用开放流技术的计算机系统的配置示例的图示。参照图1,可编程流控制器(PFC,也称为开放流控制器)100设置到单个子网(P-流网络)中的PFS200和300的流表项,以执行在子网中的流控制。
PFS200和300中的每一个参照其流表来执行在流表项中定义并对应于接收到的分组的头信息的动作(例如,对数据分组的中继和丢弃)。具体地,当接收到在主机400之间传递的分组时,如果接收到的分组的头信息与在其自身流表中设置的流表项(的规则)相符合(相匹配),则PFS200和300中的每一个执行在流表项中定义的动作。另一方面,当接收到的分组的头信息与在流表中设置的流表项(的规则)不相符合(不相匹配),则PFS200和300中的每一个将接收到的分组识别为第一分组,向PFC100通知第一分组的接收,并向PFC100发送分组的头信息。PFC100对作为第一分组的通知源的PFS设置与通知的头信息相对应的流表项(流+动作)。
如上所述,在传统开放流技术中,在PFS200和300中的任何一个接收到在主机400之间传递的分组之后,PFC100对在主机400之间发送和接收的分组执行传递控制。
引用文献列表
专利文献1:JP2003-229913A
非专利文献1:OpenFlow Switch Specification Version1.0.0(WireProtocol0x01)December31,2009
发明内容
传统开放流技术中的PFC设置在源终端与目的地终端之间传递的分组的路由,并设置针对该路由上的交换机的流表项。此外,即使目的地相同,必须在每次生成源终端不同的分组时,设置流表项和在源终端与目的地终端之间的路由。因此,当使用开放流技术时,会担心整个系统的资源(流表项个数)消耗太大。
本发明的计算机系统包括:控制器;多个交换机,每个所述交换机针对与所述控制器设置的流表项相符合的分组,执行在所述流表项中定义的中继操作;以及通过所述多个交换机中的任何一个进行通信的多个节点。所述控制器将目的地地址设置为所述流表项的规则,并将到目的地节点的传递处理设置为所述流表项的动作。所述多个交换机中的每一个基于设置给所述交换机的流表项,向所述目的地节点传递包含所述目的地地址的分组,而不考虑接收分组的源地址。
此外,期望在所述多个节点之间传递分组之前,所述控制器给所述多个交换机中的每一个设置流表项。
此外,期望所述控制器响应于来自所述多个节点中的第一节点的第一ARP(地址解析协议)请求,获取所述第一节点的第一MAC(媒体访问控制)地址,并将所述第一MAC地址作为所述流表项的规则,设置给所述多个交换机中的每一个。
此外,期望所述控制器向所述第一节点发送以所述多个节点中的另一节点的MAC地址作为传输源的ARP应答,作为对从所述第一节点到所述另一节点的第一ARP请求的应答。
此外,所述控制器基于来自所述多个节点中的第一节点的第一ARP(地址解析协议)请求,获取所述第一节点(VM1)的第一MAC(媒体访问控制)地址,并将所述第一MAC地址作为所述流表项的规则,设置给所述多个交换机中的每一个。此外,期望所述控制器发布第二ARP请求,并将基于对所述第二ARP请求的应答获取的第二节点的第二MAC地址作为流表项的规则,设置给所述多个交换机中的每一个交换机。
此外,所述控制器向所述第一节点发送将所述另一节点的MAC地址作为源地址的ARP应答,作为对来自所述第一节点的以另一节点为目的地的第一ARP请求的应答。此外,期望所述控制器向所述另一节点发送对以所述第一节点为目的地且从所述另一节点发送的第三ARP请求的ARP应答。
此外,期望所述多个交换机包括与所述多个节点直接连接的多个第一交换机。在这种情况下,期望所述控制器给所述多个第一交换机中的任意选择的交换机设置所述流表项,而不给剩余交换机设置所述流表项。
此外,期望所述控制器给所述多个交换机中的每一个设置所述流表项,以针对所述接收分组执行ECMP(等价多路径)路由。
本发明的通信方法包括以下步骤:由控制器给多个交换机中的每一个设置流表项;由所述多个交换机中的每一个,针对与所述控制器所设置的流表项相符合的接收分组,执行在所述流表项中定义的中继操作;以及由所述节点中的每一个通过所述多个交换机中的每一个进行通信。所述设置流表项包括以下步骤:由所述控制器将目的地地址设置为所述流表项的规则;以及将到所述目的地节点的传递处理设置为所述流表项的动作。所述通信包括:由所述多个交换机中的每一个向所述目的地节点传递包含所述目的地地址的所述接收分组,而不考虑所述接收分组的传输源地址。
此外,期望在所述多个节点之间传递分组之前,执行所述设置流表项。
根据本发明,可以减小使用开放流技术的整个计算机系统的资源消耗。
附图说明
结合附图,将根据示例性实施例的描述,进一步阐明上述发明的其他目的、效果和特征。在附图中:
图1是示出了使用开放流技术的计算机系统的配置示例的图示;
图2是示出了根据本发明的计算机系统的配置示例的图示;
图3A是示出了根据本发明的计算机系统中的流设置方法和通信方法的示例的图示;
图3B是示出了根据本发明的计算机系统中的流设置方法和通信方法的示例的图示;
图3C是示出了根据本发明的计算机系统中的流设置方法和通信方法的示例的图示;
图3D是示出了根据本发明的计算机系统中的流设置方法和通信方法的示例的图示;
图3E是示出了根据本发明的计算机系统中的流设置方法和通信方法的示例的图示;
图3F是示出了根据本发明的计算机系统中的流设置方法和通信方法的示例的图示;
图3G是示出了根据本发明的计算机系统中的流设置方法和通信方法的示例的图示;
图3H是示出了根据本发明的计算机系统中的流设置方法和通信方法的示例的图示;
图3I是示出了根据本发明的计算机系统中的流设置方法和通信方法的示例的图示;
图3J是示出了根据本发明的计算机系统中的流设置方法和通信方法的示例的图示;以及
图4是示出了根据本发明的由于流控制而被分为多个网络的逻辑网络的配置的图示。
具体实施方式
以下,将参照附图对本发明的示例性实施例进行描述。在附图中,向相同或相似的组件分派相同或相似的参考标号。
(计算机系统的配置)
参考图2,将对根据本发明的计算机系统的配置进行描述。图2是示出了根据本发明的计算机系统的配置示例的图示。根据本发明的计算机系统包括可编程流控制器10(以下被称为PFC10)、多个可编程流交换机20-1至20-3和30-1至30-3(以下被称为PFS20-1至20-3和30-1至30-3)、物理服务器40-1至40-5(以下被称为SV40-1至40-5)、以及存储器50,它们通过通信网络连接。同时,当对PFS20-1至20-3和30-1至30-3进行描述而不区分彼此时,PFS20-1至20-3中的每一个和PFS30-1至30-3中的每一个分别被称为PFS20和PFS30。以及,当对SV40-1至40-5进行描述而不区分彼此时,SV40-1至40-5中的每一个被称为SV40。
SV40和存储器50是均具有CPU、主存储单元、以及外部存储设备(它们未在图中示出)的计算机单元,并通过执行存储在外部存储设备中的程序与其它SV40通信。与SV40的通信是通过PFS20和30执行的。根据所执行的程序,SV40实现通过网络服务器、文件服务器、应用服务器、客户端终端等例示的功能。例如,当SV40用作网络服务器时,SV40根据客户端终端(未示出)的请求,向另一SV40(客户端终端)传递存储单元(未示出)中的HTML文档和图像数据。
SV40包括通过对CPU(未示出)和存储单元(未示出)的存储区域进行逻辑和物理划分而实现的虚拟机VM。在图2所示的示例中,在SV40-1中实现虚拟机VM1和VM2,在SV40-2中实现虚拟机VM3和VM4,在SV40-3中实现虚拟机VM5和VM6,在SV40-4中实现虚拟机VM7和VM8。可以通过在每个服务器的主机操作系统(HOS)上仿真的客户操作系统(GOS)或在GOS上操作的软件来实现虚拟机VM1至VM8。
虚拟机VM通过虚拟机监视器或物理NIC(未示出)管理的虚拟交换机(未示出),向其它设备(例如,外部网络上的计算机单元和另一物理服务器40中的虚拟机VM)发送数据以及从所述其它设备接收数据。在本示例性实施例中,例如,根据TCP/IP(传输控制协议/因特网协议)执行分组通信。
此外,根据本发明的虚拟交换机(未示出)可以基于下文要描述的开放流技术进行控制,并且可以执行传统的交换操作(层2)。此外,虚拟机VM1至VM8中的每一个和物理服务器的外部通过桥接连接彼此连接。也就是说,可以基于虚拟机VM1至VM8的MAC地址和IP地址从外部执行直接通信。
PFC10基于开放流技术控制系统中的通信。开放流技术示出了以下技术:根据路由策略(流表项:流和动作),控制器(这里是,PFC10)以流为单位,给PFS20和30设置多层结构和路由数据,以执行路由控制和节点控制。因此,路由控制功能与路由器和交换机分开,并且可以通过控制器的集中式控制来实现最优路由和业务管理。应用了开放流技术的PFS20和30并不处理如在传统路由器和交换机中的以跳为单位的通信,而是处理作为END2END(端到端)的流的通信。
通过具有CPU和存储单元(未示出)的计算机来实现PFC10。PFC10中的流控制处理通过执行在存储单元(未示出)中存储的程序来实现,并通过给PFS20和30中的每一个设置流表项(流和动作)来控制PFS20和30的操作(例如,对数据分组的中继操作)。
此外,在终端之间(例如,虚拟机VM之间)的分组传递之前,给根据本发明的PFC10设置主机终端(SV40和存储器50)和虚拟机VM的MAC地址。例如,PFC10预先响应于ARP(地址解析协议),获取主机终端和虚拟机VM的MAC地址。
PFC10生成将所获取的MAC地址用于规则的流表项,并给网络中的所有PFS20和30设置流表项。例如,PFC10针对每个PFS生成流表项,所述流表项用于指定以虚拟机VM1的MAC地址为目的地的分组的传递目的地单元以及传递该分组;并且PFC10给网络中的所有交换机PFS20和30设置所述流表项。在本发明中,由于仅基于目的地MAC地址控制流,因而与传输源无关地确定向流表项设置的与规则(目的地MAC地址)相对应的分组的传递目的地。为此,可以在无需知道分组的传输源的情况下执行流控制。也就是说,根据本发明,由于通过设置针对目的地终端的最优路由来形成用于分组传递的多路径,因而可以实现最优多路径操作。此外,由于不同于传统技术,可以无需等待接收到第一分组就给PFS设置流表项,因而可以提高网络吞吐量。此外,在本发明中,由于在终端之间传递分组之前(即,在开始系统操作之前),生成并设置流表项,因此与传统技术相比,降低了在操作期间针对流控制的处理负载。
此外,PFC10生成将所获取的MAC地址用于规则的流表项,并给从网络中的PFS20和30中任意选择的PFS设置该流表项,且不将该流表项设置给剩余PFS。例如,将采用虚拟机VM1的MAC地址作为规则的流表项设置给与主机终端(SV40和存储器50)直接连接的PFS30的所选部分。在这种情况下,当没有设置流表项的PFS30接收到以虚拟机VM1为目的地的分组时,丢弃该分组,不将其传递到任何地方。按照这种方式,由于可以在逻辑上分开分组的传递目的地,可以将一个物理网络分为多个逻辑网络并进行操作。应注意,当向特定PFS设置被定义为丢弃以特定MAC地址为目的地的分组的流表项时,也可以实现类似效果。
PFS20和30中的每一个包括对其设置流表项的流表(未示出),并根据所设置的流表项执行对接收分组的处理(例如,中继处理和丢弃)。PFS30是与主机终端(SV40和存储器50)直接连接的第一级交换机,例如,优选将架顶式(top-of-rack,简称TOR)交换机用于PFS30。此外,对于与自主机终端起的第二级或后续级别连接的L2交换机和L3交换机,例如优选将核心交换机(CORE)用于PFS20。
PFS20和30中的每一个参照其自身流表(未示出),并执行在流表项中定义的、并对应于接收分组的头数据(尤其是,目的地MAC地址)的动作(例如,对数据分组的中继和丢弃)。具体地,当接收分组的头数据与在其自身流表中设置的流表项所定义的流相匹配(相对应)时,PFS20和30中的每一个执行在流表项中定义的动作。此外,当接收分组的头数据与在流表中设置的流表项所定义的流不相匹配(不相对应)时,PFS20和30中的每一个不针对分组执行任何处理。在这种情况下,PFS20和30可以向PFC10通知分组的接收,并可以丢弃该分组。
在流表项中,定义OSI(开放系统互连)参考模型中的层1到层4的地址和标识符的任意组合作为用于指定流(数据分组)的数据(以下被称为规则),并将该地址和标识符例如包括在TCP/IP的数据分组的头数据中。例如,将层1的物理端口、层2的MAC地址、层3的IP地址、层4的物理端口和VLAN标记的任意组合设置给流表项作为规则。然而,在本发明中,不将传输源的MAC地址和IP地址设置给流表项,而总是将目的地MAC地址设置给流表项。这里,可以将标识符(如,端口号、地址等)的预定范围设置给流表项。例如,可以将虚拟机VM1和VM2的MAC地址作为目的地MAC地址设置为流表项的规则。
例如,流表项的动作定义了用于处理TCP/IP的数据分组的方法。例如,设置示出是否对接收到的数据分组进行中继的信息,以及在对数据分组进行中继的情况下还设置数据分组的目的地。此外,在该动作中,可以设置指示对数据分组的复制或丢弃的数据。
(计算机系统中的流设置方法和通信方法)
接下来,将参照图3A至3J,对根据本发明的计算机系统中的流设置方法和通信方法的细节进行描述。以下将针对虚拟机VM1的流设置和针对虚拟机VM5的流设置作为示例进行描述。此外,当虚拟机VM1至VM8、物理服务器40-1至40-5和存储器50不相对进行区分时,将它们统称为节点。
在完成了系统配置(或改变了系统配置)时,PFC10通过与传统流控制器类似的方法知道系统拓扑。此时知道的拓扑数据包括与PFS20和30、节点(虚拟机VM1至VM8、物理服务器40-1至40-5和存储器)、未示出的外部网络(例如,因特网)等的连接状态相关的数据。具体地,作为拓扑数据,设备端口个数和端口目的地数据与用于指定PFS20和30以及节点的设备标识符相关,因而将设备标识符记录于PFC10的存储单元。端口目的地数据包括用于指定连接对侧(a connection counter side)的连接类型(交换机/节点/外部网络)、以及用于指定连接目的地的数据(在交换机的情况下是交换机ID、在节点的情况下是MAC地址、在外部网络的情况下是外部网络ID)。
参照图3A,PFC10俘获来自节点的ARP请求(Arp.req),以获取(学习)请求节点的位置(MAC地址)。例如,向PFC10发送源自虚拟机VM1的以虚拟机VM5为目的地的ARP请求。PFC10从接收到的ARP请求中提取作为源节点的虚拟机VM1的MAC地址。PFC10定义将该MAC地址设置为目的地的规则,以生成流表项。在这种情况下,生成针对系统中所有PFS20和30的流表项。应注意,可以预先将MAC地址的流表项设置到PFC10的存储单元中。
参照图3B,学习了节点位置(MAC地址)的PFC10登记到该节点的路由。例如,PFC10给所有PFS20和30设置定义对以虚拟机VM1的MAC地址为目的地的分组的传递以及传递目的地设备的流表项。在这种情况下,优选给PFS30-1设置流表项,以将与虚拟机VM1连接的物理端口定义为输出目的地,并给第一级的除PFS30-1之外的PFS30设置流表项,以针对第二级或后续级别的PFS20实现负载均衡。例如,优选给PFS30设置流表项,以针对PFS30执行ECMP(同成本多路由)路由。
在层2的正常学习(L2学习)过程中,存在以下情况:由于泛洪(FLOODING)而导致生成循环(LOOP)的情况,以及由于负载均衡导致无法执行期望学习的情况。然而,在本发明中,采用开放流技术,因而这些问题不会发生。
参照图3C,在对MAC地址的获取(学习)中,设置了流表项的PFC10将针对所请求的目的地的ARP请求从一个节点发送给除该节点之外的所有节点。例如,PFC10将以作为图3A中所示ARP请求的目的地的虚拟机VM5为目的地的ARP请求发送到除发出请求的虚拟机VM1之外的所有节点(虚拟机VM2至VM8、SV40-5和存储器50)。
参照图3D,PFC10基于对图3C所示ARP请求的应答(ARP应答),获取(获取)目的地节点的位置(MAC地址)。在本示例中,从虚拟机VM5发送ARP应答,PFC10通过俘获ARP应答来获取虚拟机VM5的位置(MAC地址)。
参照图3E,获取(学习)了节点位置(MAC地址)的PFC10登记到该节点的路由。这里,PFC10给所有PFS20和30设置定义以虚拟机VM5的MAC地址为目的地的分组的传递的流表项和目的地设备。在这种情况下,按照与以上相同的方式,优选将流表项设置给自主机终端起的第一级的PFS30,以针对第二级或后续级别的PFS20实现负载均衡。
参照图3F,PFC10通过代理来应答来自图3A所示的来自节点的ARP请求。这里,PFC10使用虚拟机VM5的MAC地址作为传输源,并发布其目的地为虚拟机VM1的ARP应答。虚拟机VM1接收对其自身发送的ARP请求的ARP应答,并获取所请求的虚拟机VM5的MAC地址。
在上述操作中,将针对分别以ARP请求的目的地节点和请求源节点为目的地的分组的处理内容(流表项)设置给系统中的所有PFS20和30。在图3G所示的示例中,通过上述操作,将针对分别以虚拟机VM1和VM5为目的地的分组的流表项设置给所有PFS20和30。这样,以虚拟机VM1为目的地的通信和以虚拟机VM5为目的地的通信被正常执行。在这种情况下,去往每个目的地的分组通过符合由目的地MAC地址定义的流表项的路由发送,而不考虑传输源。
此外,为了根据传统以太网(注册商标)按生成树协议配置单个树结构,生成了没被使用的物理链路。为此,无法在以太网(注册商标)中的特定节点之间设置多个路由。然而,在本发明中,根据目的地,给每个PFS设置分组传递目的地,使得形成多路径以实现负载分布。例如,在上述示例的情况下,根据在针对虚拟机VM1的通信和针对虚拟机VM5的通信之中的每一个通信的流表项,形成多路径,并实现负载分发。
在上述示例中,采用了通过在流表项中定义的ECMP的负载均衡。然而,本发明不限于此,也可以采用链路聚集或每个流表项的负载分布。
另一方面,为了可以发送ARP请求并执行请求源节点与目的地节点之间的双向通信,作为目的地的节点从PFC10获取(学习)请求源节点的位置(MAC地址)。具体地,参照图3H,来自虚拟机VM5的以虚拟机VM1为目的地的ARP请求被发送到PFC10。参照图3I,已经保留了虚拟机VM1的位置(MAC地址)的PFC10向虚拟机VM5发送将虚拟机VM1的MAC地址作为传输源的ARP应答。虚拟机VM5将其俘获以获取虚拟机VM1的位置(MAC地址)。这样,如图3J所示,虚拟机VM5可以发送以虚拟机VM1为目的地的数据分组。应注意,由于独立地设置以虚拟机VM1为目的地的流表项和以虚拟机VM5为目的地的流表项,因而从虚拟机V1到虚拟机V5的通信路由和从虚拟机V5到虚拟机V1的通信路径并不总是相同。
通过上述操作,虚拟机VM1和VM5都获取(学习)了相互的位置(MAC地址),并且以虚拟机VM1和VM5中的每一个虚拟机为目的地的分组的传递目的地被设置给所有PFS20和30。这样,可以实现虚拟机VM1与虚拟机VM5之间的双向通信。
在本发明中,由于基于目的地MAC地址设置流表项,在流表项的设置中并不总是需要传输源节点的位置。为此,可以在开始节点之间的通信之前设置流表项。此外,不必像传统技术一样针对节点之间的通信路由设置流表项,而是给每个PFS设置目的地MAC地址的流表项就已经足够。因此,可以减小整个计算机系统中的资源消耗。
接下来,将参照图4,对根据本发明的计算机系统的应用示例进行描述。在上述示例中,给所有PFS20和30设置针对以某节点为目的地的分组的流表项。然而,本发明不限于此,设置流表项的节点可以限于与该节点直接连接的一部分PFS30。
图4中所示的计算机系统包括与网络500连接的上层交换机(PFS20-1和20-2)、与诸如SV40之类的主机终端(未示出)直接连接的PFS30-1、30-2和30-3、以及节点S和A。这里,节点A通过PFS30-2与系统连接,节点S通过PFS30-3与系统连接。
在本示例中,通过PFC10(未示出),给PFS20-1、20-2和20-3设置流表项,以控制以节点S为目的地的流,并给PFS20-1、20-2、30-1和30-2设置流表项,以控制以节点A为目的地的流。在这种情况下,以节点S为目的地的分组通过经过PFS20-1、20-2和30-3中的任何一个的通信路由到达节点S,而以节点A为目的地的分组通过经过PFS20-1、20-2、30-1和30-2中的任何一个的通信路由到达节点A。也就是说,在由PFS20-1、20-2和20-3配置的逻辑网络中容纳节点S,以及在由PFS20-1、20-2、30-1和30-2配置的逻辑网络中容纳节点A。
如上所述,图4所示的计算机系统配置了一个物理网络。然而,当选择性地设置流表项时,将计算机系统分为两个逻辑网络。因此,一个物理拓扑可被处理为多个VLAN。
如上所述,详细地描述了本发明的示例性实施例。然而,具体配置不限于上述示例性实施例。本发明包括本发明范围内的各种修改。在图2中,示出具有两级配置的PFS组的系统作为示例。然而,本发明不限于此,系统可以具有多个级别的配置的PFS组。此外,与传统技术一样,外部网络可以通过层3(L3)交换机与PFS20连接。
本申请基于日本专利号JP2010-202468,通过引用将其公开内容引入本文。

Claims (10)

1.一种计算机系统,包括:
控制器;
多个交换机,所述多个交换机中的每一个交换机针对与所述控制器设置的流表项相符合的分组,执行在所述流表项中定义的中继操作;以及
多个节点,所述多个节点通过所述多个交换机中的任何一个进行通信,
其中所述控制器将目的地地址设置为所述流表项的规则,并将到目的地节点的传递处理设置为所述流表项的动作,以及
其中所述多个交换机中的每一个交换机基于设置给所述交换机的流表项,向所述目的地节点传递包含所述目的地地址的分组,而不考虑所述分组的传输源地址。
2.计算机系统,其中在所述多个节点之间传递分组之前,所述控制器给所述多个交换机中的每一个交换机设置所述流表项。
3.根据权利要求1或2所述的计算机系统,其中所述控制器响应于来自所述多个节点中的第一节点的第一ARP(地址解析协议)请求,获取所述第一节点的第一MAC(媒体访问控制)地址,并将所述第一MAC地址作为流表项的规则,设置给所述多个交换机中的每一个交换机。
4.根据权利要求3所述的计算机系统,其中所述控制器向所述第一节点发送以所述多个节点中的另一节点的MAC地址作为传输源的ARP应答,作为对从所述第一节点到所述另一节点的第一ARP请求的应答。
5.根据权利要求2或3所述的计算机系统,其中所述控制器发布第二ARP请求,并将基于对所述第二ARP请求的应答而获取的第二节点的第二MAC地址作为流表项的规则,设置给所述多个交换机中的每一个交换机。
6.根据权利要求4所述的计算机系统,其中所述控制器向所述另一节点发送对从所述另一节点发送的以所述第一节点为目的地的第三ARP请求的ARP应答。
7.根据权利要求1至6中任一项所述的计算机系统,其中所述多个交换机包括与所述多个节点直接连接的多个第一交换机,以及
其中所述控制器给从所述多个第一交换机中任意选择的交换机设置所述流表项,而不给剩余交换机设置所述流表项。
8.根据权利要求1至7中任一项所述的计算机系统,其中所述控制器给所述多个交换机中的每一个交换机设置所述流表项,以对分组执行ECMP(等价多路径)路由。
9.一种通信方法,包括:
由控制器给多个交换机中的每一个交换机设置流表项;
由所述多个交换机中的每一个交换机对与所述流表项相符合的分组执行在所述流表项中定义的中继操作;以及
通过所述多个交换机,在多个节点中的源节点和目的地节点之间进行通信,
其中所述设置流表项包括:
由所述控制器将目的地地址设置为所述流表项的规则;以及
将以所述目的地节点为目的地的传递处理设置为所述流表项的动作,以及
其中所述通信包括:
由所述多个交换机中的每一个交换机向所述目的地节点传递包含所述目的地地址的分组,而不考虑所述分组的传输源地址。
10.根据权利要求9所述的通信方法,其中所述设置流表项是在所述多个节点之间传递分组之前执行的。
CN201180039555.1A 2010-09-09 2011-09-05 计算机系统和计算机系统中的通信方法 Expired - Fee Related CN103081418B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2010-202468 2010-09-09
JP2010202468 2010-09-09
PCT/JP2011/070137 WO2012033041A1 (ja) 2010-09-09 2011-09-05 コンピュータシステム、及びコンピュータシステムにおける通信方法

Publications (2)

Publication Number Publication Date
CN103081418A true CN103081418A (zh) 2013-05-01
CN103081418B CN103081418B (zh) 2015-07-08

Family

ID=45810642

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180039555.1A Expired - Fee Related CN103081418B (zh) 2010-09-09 2011-09-05 计算机系统和计算机系统中的通信方法

Country Status (8)

Country Link
US (1) US9215175B2 (zh)
EP (1) EP2615782A4 (zh)
JP (1) JP5477603B2 (zh)
KR (1) KR101478475B1 (zh)
CN (1) CN103081418B (zh)
CA (1) CA2810660C (zh)
TW (1) TWI461032B (zh)
WO (1) WO2012033041A1 (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103441931A (zh) * 2013-08-23 2013-12-11 华为技术有限公司 一种报文发送方法及装置
CN103763121A (zh) * 2013-12-24 2014-04-30 杭州华三通信技术有限公司 一种网络配置信息快速下发的方法及装置
WO2014183579A1 (zh) * 2013-07-05 2014-11-20 中兴通讯股份有限公司 控制数据转发的方法及逻辑交换机
CN104283756A (zh) * 2013-07-02 2015-01-14 杭州华三通信技术有限公司 一种实现分布式多租户虚拟网络的方法和装置
CN104506408A (zh) * 2014-12-31 2015-04-08 杭州华三通信技术有限公司 基于sdn的数据传输的方法及装置
CN104683231A (zh) * 2013-11-29 2015-06-03 英业达科技有限公司 路由控制方法与装置
WO2015161416A1 (zh) * 2014-04-21 2015-10-29 华为技术有限公司 一种报文传输方法、设备及通信系统
CN108028831A (zh) * 2015-09-22 2018-05-11 慧与发展有限责任合伙企业 加密的数据包
US10063470B2 (en) 2015-05-12 2018-08-28 Industrial Technology Research Institute Data center network system based on software-defined network and packet forwarding method, address resolution method, routing controller thereof
CN111600811A (zh) * 2020-04-14 2020-08-28 新华三信息安全技术有限公司 一种报文处理方法和装置
US10887280B2 (en) 2015-08-07 2021-01-05 New H3C Technologies Co., Ltd Cloud platform security achievement

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104221335A (zh) 2012-03-23 2014-12-17 日本电气株式会社 控制设备、通信设备、通信系统、通信方法和程序
CN104322022B (zh) * 2012-05-15 2017-10-24 日本电气株式会社 多租户系统、交换机、控制器和分组传输方法
US10387201B2 (en) * 2012-06-26 2019-08-20 Vmware, Inc. Storage performance-based virtual machine placement
CN103905577A (zh) * 2012-12-28 2014-07-02 中兴通讯股份有限公司 一种地址解析协议报文的处理方法和系统
CN104113474B (zh) * 2013-04-22 2017-08-29 华为技术有限公司 转发路径的生成方法、控制器和系统
US9210074B2 (en) * 2013-05-03 2015-12-08 Alcatel Lucent Low-cost flow matching in software defined networks without TCAMs
US10454714B2 (en) 2013-07-10 2019-10-22 Nicira, Inc. Method and system of overlay flow control
US9231863B2 (en) 2013-07-23 2016-01-05 Dell Products L.P. Systems and methods for a data center architecture facilitating layer 2 over layer 3 communication
JP6221501B2 (ja) * 2013-08-19 2017-11-01 富士通株式会社 ネットワークシステム、その制御方法、ネットワーク制御装置及びその制御プログラム
US9397957B2 (en) * 2013-12-23 2016-07-19 Google Inc. Traffic engineering for large scale data center networks
JP6260310B2 (ja) 2014-02-03 2018-01-17 富士通株式会社 ネットワークスイッチ、ネットワークシステム及びネットワークシステムの制御方法
CN105122740B (zh) * 2014-02-26 2018-07-20 华为技术有限公司 一种分流上报的方法、交换机、控制器及系统
CN104954281B (zh) 2014-03-31 2018-08-03 中国移动通信集团公司 通信方法、系统、资源池管理系统、交换机和控制装置
JPWO2015194534A1 (ja) * 2014-06-17 2017-04-20 日本電気株式会社 スイッチ装置とコンピュータシステムと方法並びにプログラム
KR102385707B1 (ko) * 2014-11-25 2022-04-12 한국전자통신연구원 호스트 추상화를 이용한 sdn 네트워크 시스템 및 그 구현방법
JP2016139908A (ja) * 2015-01-27 2016-08-04 日本電気株式会社 通信システム、通信ノード、制御装置、通信制御方法、及び、プログラム
US10425382B2 (en) 2015-04-13 2019-09-24 Nicira, Inc. Method and system of a cloud-based multipath routing protocol
US10135789B2 (en) 2015-04-13 2018-11-20 Nicira, Inc. Method and system of establishing a virtual private network in a cloud service for branch networking
US10498652B2 (en) 2015-04-13 2019-12-03 Nicira, Inc. Method and system of application-aware routing with crowdsourcing
JP6525256B2 (ja) * 2015-05-29 2019-06-05 Necプラットフォームズ株式会社 仮想ネットワークシステムおよび仮想ネットワーク経路設定方法
CN105281960A (zh) * 2015-11-20 2016-01-27 英业达科技有限公司 软件定义网络中流量项目的管理方法
US20180219765A1 (en) 2017-01-31 2018-08-02 Waltz Networks Method and Apparatus for Network Traffic Control Optimization
US10992568B2 (en) 2017-01-31 2021-04-27 Vmware, Inc. High performance software-defined core network
US20200036624A1 (en) 2017-01-31 2020-01-30 The Mode Group High performance software-defined core network
US11706127B2 (en) 2017-01-31 2023-07-18 Vmware, Inc. High performance software-defined core network
US10778528B2 (en) 2017-02-11 2020-09-15 Nicira, Inc. Method and system of connecting to a multipath hub in a cluster
US10523539B2 (en) 2017-06-22 2019-12-31 Nicira, Inc. Method and system of resiliency in cloud-delivered SD-WAN
US10594516B2 (en) 2017-10-02 2020-03-17 Vmware, Inc. Virtual network provider
US10999100B2 (en) 2017-10-02 2021-05-04 Vmware, Inc. Identifying multiple nodes in a virtual network defined over a set of public clouds to connect to an external SAAS provider
US11115480B2 (en) 2017-10-02 2021-09-07 Vmware, Inc. Layer four optimization for a virtual network defined over public cloud
US11223514B2 (en) 2017-11-09 2022-01-11 Nicira, Inc. Method and system of a dynamic high-availability mode based on current wide area network connectivity
CN110912825B (zh) 2018-09-18 2022-08-02 阿里巴巴集团控股有限公司 一种报文的转发方法、装置、设备及系统
JP2019092233A (ja) * 2019-03-26 2019-06-13 Necプラットフォームズ株式会社 仮想ネットワークシステムおよび仮想ネットワーク経路設定方法
US11121985B2 (en) 2019-08-27 2021-09-14 Vmware, Inc. Defining different public cloud virtual networks for different entities based on different sets of measurements
US11044190B2 (en) 2019-10-28 2021-06-22 Vmware, Inc. Managing forwarding elements at edge nodes connected to a virtual network
CN114500378B (zh) 2019-11-25 2023-07-14 华为技术有限公司 用于处理转发表项的方法和装置
US11489783B2 (en) 2019-12-12 2022-11-01 Vmware, Inc. Performing deep packet inspection in a software defined wide area network
US11394640B2 (en) 2019-12-12 2022-07-19 Vmware, Inc. Collecting and analyzing data regarding flows associated with DPI parameters
US11153261B2 (en) 2020-01-22 2021-10-19 Cisco Technology, Inc. Routing traffic for virtualized/containerized network functions
US11418997B2 (en) 2020-01-24 2022-08-16 Vmware, Inc. Using heart beats to monitor operational state of service classes of a QoS aware network link
US11477127B2 (en) 2020-07-02 2022-10-18 Vmware, Inc. Methods and apparatus for application aware hub clustering techniques for a hyper scale SD-WAN
US11363124B2 (en) 2020-07-30 2022-06-14 Vmware, Inc. Zero copy socket splicing
US11575591B2 (en) 2020-11-17 2023-02-07 Vmware, Inc. Autonomous distributed forwarding plane traceability based anomaly detection in application traffic for hyper-scale SD-WAN
US11575600B2 (en) 2020-11-24 2023-02-07 Vmware, Inc. Tunnel-less SD-WAN
US11601356B2 (en) 2020-12-29 2023-03-07 Vmware, Inc. Emulating packet flows to assess network links for SD-WAN
US11792127B2 (en) 2021-01-18 2023-10-17 Vmware, Inc. Network-aware load balancing
US11979325B2 (en) 2021-01-28 2024-05-07 VMware LLC Dynamic SD-WAN hub cluster scaling with machine learning
US11388086B1 (en) 2021-05-03 2022-07-12 Vmware, Inc. On demand routing mesh for dynamically adjusting SD-WAN edge forwarding node roles to facilitate routing through an SD-WAN
US11729065B2 (en) 2021-05-06 2023-08-15 Vmware, Inc. Methods for application defined virtual network service among multiple transport in SD-WAN
US11489720B1 (en) 2021-06-18 2022-11-01 Vmware, Inc. Method and apparatus to evaluate resource elements and public clouds for deploying tenant deployable elements based on harvested performance metrics
US11375005B1 (en) 2021-07-24 2022-06-28 Vmware, Inc. High availability solutions for a secure access service edge application
US11943146B2 (en) 2021-10-01 2024-03-26 VMware LLC Traffic prioritization in SD-WAN
US11909815B2 (en) 2022-06-06 2024-02-20 VMware LLC Routing based on geolocation costs

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004056340A (ja) * 2002-07-18 2004-02-19 Nec Corp Ipフロー多段ハッシュ装置、ipフロー多段ハッシュ方法、ipフロー多段ハッシュプログラム及びその記録媒体
JP2010141731A (ja) * 2008-12-12 2010-06-24 Mitsubishi Electric Corp レイヤ2スイッチ

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19803397A1 (de) 1998-01-29 1999-08-05 Volkswagen Ag Gießform zum Herstellen von Gußstücken
US20020109879A1 (en) * 2000-08-23 2002-08-15 Wing So John Ling Co-channel modulation
JP3797937B2 (ja) 2002-02-04 2006-07-19 株式会社日立製作所 ネットワーク接続システム、ネットワーク接続方法、および、それらに用いられるネットワーク接続装置
JP2004126959A (ja) 2002-10-02 2004-04-22 Fujitsu Ltd 通信管理装置、情報処理装置、プログラム
KR100432675B1 (ko) * 2003-09-19 2004-05-27 주식회사 아이앤아이맥스 네트워크상의 장비들 간의 통신제어방법 및 이를 위한 장치
JP5365265B2 (ja) 2009-03-05 2013-12-11 日東紡績株式会社 ガラス繊維及びそれを用いたポリカーボネート樹脂成形体
US9077590B2 (en) * 2009-06-22 2015-07-07 Citrix Systems, Inc. Systems and methods for providing link management in a multi-core system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004056340A (ja) * 2002-07-18 2004-02-19 Nec Corp Ipフロー多段ハッシュ装置、ipフロー多段ハッシュ方法、ipフロー多段ハッシュプログラム及びその記録媒体
JP2010141731A (ja) * 2008-12-12 2010-06-24 Mitsubishi Electric Corp レイヤ2スイッチ

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KENJI YOKOTA等: "[shorei koen] priority control for diversified flow sizes", 《IEICE TECHNICAL REPORT》 *
YOSHIHIKO KANAUMI等: "The demonstration experience of OpenFlow on JGN2plus", 《THE INSTITUTE OF ELECTRONICS,INFORMATION AND COMMUNICATION AND ENGINEERS SOGO TAIKAI KOEN RONBUNSHU 2009》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10298519B2 (en) 2013-07-02 2019-05-21 Hewlett Packard Enterprise Development Lp Virtual network
CN104283756A (zh) * 2013-07-02 2015-01-14 杭州华三通信技术有限公司 一种实现分布式多租户虚拟网络的方法和装置
CN104283756B (zh) * 2013-07-02 2017-12-15 新华三技术有限公司 一种实现分布式多租户虚拟网络的方法和装置
US10791066B2 (en) 2013-07-02 2020-09-29 Hewlett Packard Enterprise Development Lp Virtual network
WO2014183579A1 (zh) * 2013-07-05 2014-11-20 中兴通讯股份有限公司 控制数据转发的方法及逻辑交换机
CN103441931A (zh) * 2013-08-23 2013-12-11 华为技术有限公司 一种报文发送方法及装置
CN104683231A (zh) * 2013-11-29 2015-06-03 英业达科技有限公司 路由控制方法与装置
CN103763121A (zh) * 2013-12-24 2014-04-30 杭州华三通信技术有限公司 一种网络配置信息快速下发的方法及装置
WO2015161416A1 (zh) * 2014-04-21 2015-10-29 华为技术有限公司 一种报文传输方法、设备及通信系统
US10686701B2 (en) 2014-04-21 2020-06-16 Huawei Technologies Co., Ltd. Packet transmission method and device, and communications system
CN104506408A (zh) * 2014-12-31 2015-04-08 杭州华三通信技术有限公司 基于sdn的数据传输的方法及装置
CN104506408B (zh) * 2014-12-31 2018-02-06 新华三技术有限公司 基于sdn的数据传输的方法及装置
US10063470B2 (en) 2015-05-12 2018-08-28 Industrial Technology Research Institute Data center network system based on software-defined network and packet forwarding method, address resolution method, routing controller thereof
US10887280B2 (en) 2015-08-07 2021-01-05 New H3C Technologies Co., Ltd Cloud platform security achievement
CN108028831A (zh) * 2015-09-22 2018-05-11 慧与发展有限责任合伙企业 加密的数据包
CN111600811A (zh) * 2020-04-14 2020-08-28 新华三信息安全技术有限公司 一种报文处理方法和装置

Also Published As

Publication number Publication date
US20130170354A1 (en) 2013-07-04
CA2810660A1 (en) 2012-03-15
JP5477603B2 (ja) 2014-04-23
RU2013110287A (ru) 2014-10-20
CN103081418B (zh) 2015-07-08
TW201225586A (en) 2012-06-16
JPWO2012033041A1 (ja) 2014-01-20
KR101478475B1 (ko) 2014-12-31
EP2615782A4 (en) 2016-11-30
EP2615782A1 (en) 2013-07-17
CA2810660C (en) 2016-04-26
WO2012033041A1 (ja) 2012-03-15
KR20130060291A (ko) 2013-06-07
TWI461032B (zh) 2014-11-11
US9215175B2 (en) 2015-12-15

Similar Documents

Publication Publication Date Title
CN103081418B (zh) 计算机系统和计算机系统中的通信方法
EP3063903B1 (en) Method and system for load balancing at a data network
CN104285416B (zh) 在存储区域网络中端接覆盖隧道的虚拟路由器
CN104580024B (zh) 扩展的以太网互联结构交换机
US9331936B2 (en) Switch fabric support for overlay network features
US8923149B2 (en) L3 gateway for VXLAN
JP5991424B2 (ja) パケット書換装置、制御装置、通信システム、パケット送信方法及びプログラム
CN104104570B (zh) Irf系统中的聚合处理方法及装置
CN108574616A (zh) 一种处理路由的方法、设备及系统
EP2920926B1 (en) Virtual link aggregations across multiple fabric switches
CN104937885A (zh) 用于结构交换机的全局vlan
TWI759571B (zh) 基於流表的資料傳送方法
US20160277251A1 (en) Communication system, virtual network management apparatus, communication node, communication method, and program
JP2015525982A (ja) 通信方法、通信システム、情報処理装置、通信端末およびプログラム
JP2019047255A (ja) 中継装置および中継プログラム
RU2574350C2 (ru) Компьютерная система и способ осуществления связи в компьютерной системе
JP2018182418A (ja) 転送装置および転送方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1180494

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150708

Termination date: 20180905

REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1180494

Country of ref document: HK