CN103534989B - 在分布式结构协议(dfp)交换网络架构中的基于优先级的流控制 - Google Patents
在分布式结构协议(dfp)交换网络架构中的基于优先级的流控制 Download PDFInfo
- Publication number
- CN103534989B CN103534989B CN201280023756.7A CN201280023756A CN103534989B CN 103534989 B CN103534989 B CN 103534989B CN 201280023756 A CN201280023756 A CN 201280023756A CN 103534989 B CN103534989 B CN 103534989B
- Authority
- CN
- China
- Prior art keywords
- rpi
- port
- exchange
- solid
- lower course
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 239000007787 solid Substances 0.000 claims abstract description 85
- 230000005540 biological transmission Effects 0.000 claims abstract description 17
- 238000000034 method Methods 0.000 claims description 96
- 230000004044 response Effects 0.000 claims description 16
- 230000002776 aggregation Effects 0.000 claims description 7
- 238000004220 aggregation Methods 0.000 claims description 7
- 239000000835 fiber Substances 0.000 claims description 5
- 239000011800 void material Substances 0.000 claims description 2
- 210000000056 organ Anatomy 0.000 claims 1
- 230000000007 visual effect Effects 0.000 claims 1
- 230000008569 process Effects 0.000 description 69
- 239000010410 layer Substances 0.000 description 67
- 230000000875 corresponding effect Effects 0.000 description 56
- 238000007726 management method Methods 0.000 description 33
- 238000010586 diagram Methods 0.000 description 15
- 238000012545 processing Methods 0.000 description 12
- 238000012797 qualification Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 230000008859 change Effects 0.000 description 9
- 238000003860 storage Methods 0.000 description 9
- 239000011229 interlayer Substances 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000008878 coupling Effects 0.000 description 7
- 238000010168 coupling process Methods 0.000 description 7
- 238000005859 coupling reaction Methods 0.000 description 7
- 230000007480 spreading Effects 0.000 description 6
- 238000003892 spreading Methods 0.000 description 6
- 238000011217 control strategy Methods 0.000 description 5
- 230000001276 controlling effect Effects 0.000 description 5
- 230000003068 static effect Effects 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 238000009826 distribution Methods 0.000 description 3
- 238000005538 encapsulation Methods 0.000 description 3
- 230000005012 migration Effects 0.000 description 3
- 238000013508 migration Methods 0.000 description 3
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- KFSLWBXXFJQRDL-UHFFFAOYSA-N Peracetic acid Chemical compound CC(=O)OO KFSLWBXXFJQRDL-UHFFFAOYSA-N 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000002567 autonomic effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 235000003642 hunger Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 238000012913 prioritisation Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 230000037351 starvation Effects 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/25—Routing or path finding in a switch fabric
- H04L49/253—Routing or path finding in a switch fabric using establishment or release of connections between ports
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/70—Virtual switches
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/24—Traffic characterised by specific attributes, e.g. priority or QoS
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/20—Support for services
- H04L49/201—Multicast operation; Broadcast operation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/20—Support for services
- H04L49/205—Quality of Service based
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/50—Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
一种交换网络包括上层和下层,下层包括多个下层实体。上层中的主交换机具有各自耦合到相应下层实体的多个端口,主交换机在多个端口中的每个端口上实施多个虚拟端口,每个虚拟端口对应于在耦合到该端口的下层实体处的多个远程物理接口(RPI)中的相应RPI。将在主交换机与RPI之间传送的数据流量排队于虚拟端口内,该虚拟端口对应于下层实体上的、向其传送数据流量的RPI。主交换机通过向对应RPI所在的下层实体发送基于优先级的流控制(PFC)数据帧来对给定的虚拟端口的数据流量实行基于优先级的PFC,PFC数据帧为特定RPI所传送的至少两个不同类别的数据流量指定优先级。
Description
技术领域
本发明一般地涉及网络通信,并且具体地涉及一种用于计算机网络的改进的交换网络架构。
背景技术
如本领域所知,网络通信普遍以公知的七层开放式系统互连(OSI)模型为前提,该OSI模型定义了各种协议层的功能而未指定层协议本身。这里有时称为第7层至第1层的七层分别是应用层、表示层、会话层、传输层、网络层、数据链路层和物理层。
在源站处,数据通信起始于从功能栈的最高(应用)层的源过程接收数据时。在栈的每个相继的低层依次对数据进行格式化直至在数据链路层获得比特数据帧。最后,在物理层,经由网络链路朝着目的站以电磁信号的形式发送数据。当在目的站处接收所发送的数据时,以与在源站处理数据的相反顺序沿着对应功能栈传递所发送的数据,因此向在目的站处的接收过程供应信息。
分层协议比如OSI模型所支持的分层协议的原理是在数据竖直地穿越模型层的同时,在源和目的站的层以对等(即第N层到第N层)方式交互,并且执行每个个别层的功能而不影响个别层的功能与紧接在它之上和之下的协议层之间的接口。为了达到这一效果,源站中的每层协议栈通常在数据沿栈下降时向发送过程所生成的数据添加信息(以封装的报头的形式)。在目的站处,在数据沿着栈的层传播时逐个剥离这些封装的报头直至向接收过程递送去封装的数据。
将源站与目的站进行耦合的物理网络可以包括由一个或者多个有线或者无线网络链路互连的任何数目的网络节点。网络节点常见地包括生产和消费网络流量的主机(例如服务器计算机、客户端计算机、移动设备等)、交换机和路由器。常规网络交换机互连不同网络段并且在OSI模型的数据链路层(层2)处理和转发数据。交换机通常至少提供基本的桥接功能,这些功能包括按照层2媒体访问控制(MAC)地址过滤数据流量、获知帧的源MAC地址并且基于目的MAC地址转发帧。在OSI模型的网络(层3)互连不同网络的路由器通常实施网络服务,比如路由处理、路径确定和路径交换。
大型网络通常包括在管理、控制和数据平面独立地操作的大量交换机。因而,每个交换机必须被单独地配置、实施对数据流量(例如访问控制列表(ACL))的独立控制并且与交换机中的任何其它交换机所处置的数据流量相独立地转发数据流量。
发明内容
根据至少一个实施方式,计算机网络中的多个交换机的管理、控制和数据处置得到改进。
在至少一个实施方式中,一种交换网络包括上层和下层,上层包括主交换机,下层包括多个下层实体。主交换机包括各自耦合到多个下层实体中的相应下层实体的多个端口。多个端口中的每个端口包括多个虚拟端口,每个虚拟端口对应于在耦合到该端口的下层实体处的多个远程物理接口(RPI)中的相应RPI。多个端口中的每个端口也包括接收接口,接收接口响应于从多个下层实体之中的特定下层实体接收到数据流量,将数据流量排队到多个虚拟端口之中的如下虚拟端口,所述虚拟端口对应于特定下层实体上的RPI,所述RPI是数据流量的源。主交换机还包括交换机控制器,该交换机控制器从虚拟端口向多个端口之中的从其转发数据流量的传出端口交换数据流量。
在至少一个实施方式中,一种交换网络包括上层和下层,下层包括多个下层实体。上层中的主交换机具有各自耦合到相应下层实体的多个端口,主交换机在多个端口中的每个端口上实施多个虚拟端口,每个虚拟端口对应于在耦合到该端口的下层实体处的多个远程物理接口(RPI)中的相应RPI。在主交换机与RPI之间传送的数据流量被排队于虚拟端口内,该虚拟端口对应于下层实体上的向其传送数据流量的RPI。主交换机通过向对应RPI所在的下层实体发送基于优先级的流控制(PFC)数据帧来对给定的虚拟端口的数据流量实行基于优先级的PFC,PFC数据帧为特定RPI所传送的至少两个不同数据类别的流量指定优先级。
在至少一个实施方式中,一种交换网络包括上层和下层,上层具有主交换机,下层包括多个下层实体。主交换机具有各自耦合到相应下层实体的多个端口,主交换机在多个端口中的每个端口上实施多个虚拟端口,每个虚拟端口对应于在耦合到该端口的下层实体处的多个远程物理接口(RPI)中的相应RPI。在主交换机与RPI之间传送的数据流量被排队于虚拟端口内,该虚拟端口对应于向其传送数据流量的RPI。主交换机至少基于数据流量被排队于其中的虚拟端口、根据控制策略向数据流量应用数据处置,从而主交换机将不同策略应用于被排队到主交换机的相同端口上的两个虚拟端口的数据流量。
附图说明
通过参照在结合附图阅读时的示例性实施方式的以下具体描述,将最好地理解公开内容本身及其优选实现方式和优点,在附图中:
图1是根据一个实施方式的数据处理环境的高层框图;
图2是可以在图1的数据处理环境内实施的分布式结构协议(DFP)交换网络架构的一个实施方式的高层框图;
图3是可以在图1的数据处理环境内实施的DFP交换网络架构的另一实施方式的高层框图;
图4是根据一个实施方式的图3中的主机的更具体的框图;
图5A是根据一个实施方式的DFP交换网络的主交换机的一个示例性实施方式的高层框图;
图5B是根据一个实施方式的DFP交换网络的从交换机的一个示例性实施方式的高层框图;
图6是根据一个实施方式的经由管理接口作为虚拟化交换机而呈现的图2或者图3的DFP交换网络架构的视图;
图7是根据一个实施方式的用于管理DFP交换网络的示例性过程的高层逻辑流程图;
图8是根据一个实施方式的示例性过程的高层逻辑流程图,通过该示例性过程,从被配置为作为虚拟化交换机操作的DFP交换网络的下层向上层转发网络流量;
图9是根据一个实施方式的示例性过程的高层逻辑流程图,通过该示例性过程,在DFP交换网络的上层的主交换机处置从下层接收的数据帧;
图10是根据一个实施方式的示例性过程的高层逻辑流程图,通过该示例性过程,在DFP交换网络的下层的从交换机或者主机处置从上层的主交换机接收的数据帧;
图11是根据一个实施方式的在DFP交换网络中操作链路聚合组(LAG)的示例性方法的高层逻辑流程图;
图12描绘了根据一个实施方式的用来记录LAG的成员资格的LAG数据结构的一个示例性实施方式;
图13是根据一个实施方式的在DFP交换网络中的多播的示例性方法的高层逻辑流程图;
图14描绘了层2和层3多播索引数据结构的示例性实施方式;
图15是根据一个实施方式的在DFP交换网络中的增强型传输选择(ETS)的示例性方法的高层逻辑流程图;
图16描绘了根据一个实施方式的可以用来为DFP交换网络的主交换机配置ETS的示例性增强型传输选择(ETS)数据结构;
图17是一种示例性方法的高层逻辑流程图,通过该示例性方法,DFP交换网络在下层实施基于优先级的流控制(PFC)和/或其它服务;
图18描绘了根据一个实施方式的可以用来在DFP交换网络的下层实施基于优先级的流控制(PFC)和/或其它服务的示例性PFC数据帧1800;
图19A是根据一个实施方式的示例性过程的高层逻辑流程图,通过该示例性过程,DFP交换网络的下层从交换机处理从主交换机接收的PFC数据帧;以及
图19B是根据一个实施方式的示例性过程的高层逻辑流程图,通过该示例性过程,DFP交换网络中的下层主机处理从主交换机接收的PFC数据帧。
具体实施方式
这里公开了一种对计算机网络中的多个互连的交换机上实施统一管理、控制和数据平面的交换网络架构。
现在参照附图并且具体参照图1,图示了根据一个实施方式的示例性数据处理环境100的高层框图。如图所示,数据处理环境100包括资源102的汇集。可以包括各种主机、客户端、交换机、路由器、存储装置等的资源102被互连以用于通信并且可以在一个或者多个公用、专用、团体、公用或者云网络或者其组合中被物理上或者逻辑上分组(未示出)。以这一方式,数据处理环境100可以提供各种客户端设备110和客户电子装置可访问的基础结构、平台、软件和/或服务,客户端设备110例如个人(例如桌面、膝上、笔记本、平板或者手持)计算机110a、智能电话110b、服务器计算机系统110c,客户电子装置例如媒体播放器(例如机顶盒、数字万用盘(DVD)播放器或者数字视频记录器(DVR))110d。应当理解,图1中所示的客户端设备110的类型仅为说明性的并且客户端设备110可以是能够经由分组网络与资源102通信并访问资源102的任何类型的电子设备。
现在参照图2,图示了根据一个实施方式的可以在资源102内实施的示例性分布式结构协议(DFP)交换网络架构的高层框图。在所示的示例性实施方式中,资源102包括形成DFP交换网络200的多个物理和/或虚拟网络交换机。与其中每个交换机实施独立管理、控制和数据平面的常规网络环境相比,DFP交换网络200实施统一管理、控制和数据平面,从而使所有构成的交换机被视为统一的虚拟化交换机,因此简化了网络结构的部署、配置和管理。
DFP交换网络200包括两层或者更多层交换机,这在本实施方式中包括下层和上层,下层具有包括从交换机202a-202d的多个从交换机,上层具有包括主交换机204a-204b的多个主交换机。在如图所示具有两层的实施方式中,每个主交换机204的端口由层间链路206之一直接连接到每个从交换机202的端口之一,并且每个主交换机204的端口由主链路208直接或者间接耦合到至少一个其它主交换机204的端口。在这样的区别相关时,支持经由层间链路208的交换机到交换机通信的端口这里称为“交换机间端口”,而(例如从交换机202a-202d的)其它端口称为“数据端口”。
在一个优选实施方式中,从交换机202被配置为在通过模式中在数据平面上操作,这意味着在从交换机202的数据端口210(例如从主机)处接收的所有传入数据流量经由交换机间端口和层间链路206由从交换机202转发至主交换机204之一。主交换机204继而用作用于数据流量的结构(因此概念为分布式结构)并且为数据流量实施所有分组交换和路由。利用这一布置,可以例如在箭头212a-212d所指示的第一示例性流和箭头214a-214e所指示的第二示例性流中转发数据流量。
如将理解的那样,在主交换机204中对用于从交换机202的交换和路由进行集中意味着主交换机204知晓从交换机202的接收数据流量的传入数据端口。在一个优选实施方式中,经由链路206、208的交换机到交换机通信运用层2协议,比如由Cisco公司开发的交换机间链路(ISL)协议或者IEEE802.1QnQ,所述层2协议利用显式标签化以在DFP交换网络200之上建立多个层2虚拟局域网(VLAN)。每个从交换机202优选地将VLAN标签(也称为服务标签(S标签))应用于数据帧以向接收方主交换机204传送从交换机202上的接收数据帧的传入数据端口210。在备选实施方式中,传入数据端口可以由另一标识符、例如MAC中的MAC报头、唯一MAC地址、IP中的IP报头等传送。如以下进一步讨论的那样,每个从交换机202上的每个数据端口210具有在每个主交换机204上的对应虚拟端口(或vport),并且在从交换机202的数据端口210上传入的数据帧如同在接收方主交换机204的对应虚拟端口上传入一样被处置。
现在参照图3,图示了根据一个实施方式的可以在资源102内实施的另一示例性分布式结构协议(DFP)交换网络架构的高层框图。作为图2中描绘的DFP交换网络架构的备选方案或者除了图2中描绘的DFP交换网络架构之外,可以在资源102内实施图3中所示的DFP架构,该DFP架构跨越DFP交换网络300实施统一管理、控制和数据平面。
在所示的示例性实施方式中,DFP交换网络300内的资源102包括实施上层中的主交换机204a-204b中的至少一个主交换机的一个或者多个物理和/或虚拟网络交换机。交换网络300在下层还包括多个物理主机302a-302d。如图4中所示,在一个示例性实施方式中,每个主机302包括提供如下接口的一个或者多个网络接口404(例如网络接口卡(NIC)、聚合式网络适配器(CNA)等),通过该接口,主机302与主交换机204通信。主机302还包括一个或者多个处理器402(通常包括一个或者多个集成电路),该一个或者多个处理器处理数据和程序代理,以例如管理、访问和操纵数据处理环境100中的数据或者软件。主机302也包括输入/输出(I/O)设备406,比如端口、显示器、用户输入设备和附接设备等,这些I/O设备接收输入并且提供由数据处理环境100中的主机302和/或其它资源执行的处理的输出。最后,主机302包括数据存储装置410,该数据存储装置可以包括一个或者多个易失性或者非易失性存储设备,这些存储设备包括存储器、固态驱动器、光或者磁盘驱动器、带驱动器等。数据存储装置410可以例如存储程序代码(包括软件、固件或者其组合)和数据。
回到图3,每个主机302所执行的程序代码包括虚拟机监视器(VMM)304(也称为管理程序),该VMM对它的相应物理主机302的资源进行虚拟化和管理。每个VMM304向一个或者多个可能异构的操作系统分区中的一个或者多个虚拟机(VM)306分配资源并且支持该一个或者多个VM的执行。VM304中的每个VM可以具有至少在OSI模型的层2和层3提供网络连通的一个(而在一些情况下为多个)虚拟网络接口(虚拟NIC(VNIC))。
如图所示,VMM304a-304d中的一个或者多个VMM可以可选地提供VM306可以附着到的一个或者多个虚拟交换机(VS)310(例如光纤信道交换机、以太网交换机、以太网光纤信道(FCoE)交换机等)。类似地,主机302的网络接口404中的一个或者多个网络接口可以可选地提供VM306可以连接到的一个或者多个虚拟交换机(VS)312(例如光纤信道交换机、以太网交换机、FCoE交换机等)。因此,VM306经由层间链路206、网络接口404、VMM304所提供的虚拟化层以及可选地在程序代码和/或硬件中实施的一个或者多个虚拟交换机310、312与主交换机204进行网络通信。
如图2中所示,虚拟交换机310、312如果存在则优选地被配置为在通过模式中在数据平面上操作,这意味着在虚拟交换机310、312的虚拟数据端口处从VM306接收的所有传入数据流量经由网络接口404和层间链路206由虚拟交换机310、312转发到主交换机204之一。主交换机204继而用作用于数据流量的结构并且针对数据流量实施所有交换和路由。
如以上讨论的那样,在主交换机204中对用于主机302的交换和路由进行集中意味着从主机302接收数据流量的主交换机204知晓数据流量的源(例如链路聚合组(LAG)接口、物理端口、虚拟端口等)。同样,为了允许传送这样的流量源信息,经由层间链路206的通信优选地利用层2协议,比如Cisco公司开发的交换机间链路(ISL)协议或者IEEE802.1QnQ,所述层2协议包括显式标签化以在DFP交换网络300之上建立多个层2虚拟局域网(VLAN)。每个主机302优选地将VLAN标签应用于数据帧以向接收方主交换机204传送从其接收数据帧的数据流量源(例如物理端口、LAG接口、虚拟端口(例如VM虚拟网络接口卡(VNIC)、单根I/O虚拟化(SR-IOV)NIC分区或者FCoE端口)等)。每个这样的数据流量源具有在每个主交换机204上的对应虚拟端口,并且源自主机302上的数据流量源的数据帧如同在接收方主交换机204的对应虚拟端口上传入一样被处置。为了一般性,除非在各种类型的远程物理接口(RPI)之间有意区分,下文将主机302上的数据流量源和从交换机202上的数据端口210称为远程物理接口(RPI)。
在DFP交换网络200和300中,可以通过配置从交换机202和/或主机302来实现负荷平衡。例如,在静态配置的一个可能的实施方式中,可以基于源RPI而在主交换机204之间划分数据流量。在这一示例性实施方式中,如果部署两个主交换机204,则每个从交换机202或者主机302可以被配置为实施各自包含它的RPI的总数的一半的两个静态RPI组、然后向两个主交换机204中的不同主交换机发送RPI组中的每个RPI组的流量。类似地,如果部署四个主交换机204,则每个从交换机202或者主机302可以被配置为实施各自包含它的RPI的总数的四分之一的四个静态RPI组、然后向四个主交换机204中的不同主交换机发送RPI组中的每个RPI组的流量。
现在参照图5A,图示了交换机500a的一个示例性实施方式的高层框图,该交换机可以用来实施图2-3的主交换机204中的任何主交换机。
如图所示,交换机500a包括多个物理端口502a-502m。每个端口502包括多个接收(Rx)接口504a-504m中的相应一个Rx接口和多个传入队列506a-506m中的缓冲由关联的Rx接口504接收的数据帧的相应一个传入队列。端口502a-502m中的每个端口还包括多个传出队列514a-514m中的相应一个传出队列和从关联的传出队列514发送数据帧的多个发送(Tx)接口520a-520m中的相应一个Tx接口。
在一个实施方式中,每个端口502的传入队列506和传出队列514中的每个队列被配置为在DFP交换网络200、300的下层中针对每个RPI提供多个(例如八个)队列条目,可以在该端口502上从所述队列条目接收传入数据流量。在这里将对于下层RPI定义的在主交换机204内的多个队列条目的群组定义为虚拟端口(vport),而虚拟端口中的每个队列条目对应于VOQ。例如,对于如图2中描绘的DFP交换网络200,交换机500a的端口502a被配置为对于连接到端口502a的从交换机202的k+l个数据端口210中的每个数据端口实施传入虚拟端口522a0-522ak中的相应一个传入虚拟端口和传出虚拟端口524a0-524ak中的相应一个传出虚拟端口。如果在如图3中所示DFP交换网络300中实施交换机500a,则端口502a被配置为对于由层间链路206连接到端口502a的主机302中的k+l个数据流量源中的每个数据流量源实施相应虚拟端口522。类似地,对于如图2中所示的DFP交换网络200,交换机500a的端口502m被配置为对于连接到端口502m的从交换机202的p+l个数据端口210中的每个数据端口实施传入虚拟端口522m0-522mp中的相应一个传入虚拟端口和传出虚拟端口524m0-524mp中的相应一个传出虚拟端口。如果在如图3中所示DFP交换网络300中实施交换机500a,则端口502a针对由层间链路206连接到端口502a的主机302中的k个数据流量源中的每个数据流量源实施相应虚拟端口522。如将理解的那样,在端口502中的每个端口上实施的传入虚拟端口的数目可以根据在连接到端口502中的每个端口的具体下层实体(例如从交换机202或者主机302)上的RPI的数目而不同。因此,将在DFP交换网络200或者300的下层的每个RPI映射到每个主交换机204的物理端口502上的传入和传出虚拟端口522和524的集合,并且当在物理端口502上接收来自该RPI的数据帧时,端口502的接收接口504可以基于数据流量中的RPI标识符将数据帧引向适当传入虚拟端口522。
主交换机204可以例如根据与下层实体202、302的连接状态按照需要跨越它的物理端口502创建、撤销、禁用或者迁移虚拟端口522、524。例如,如果从交换机202被具有更大数目端口的替换从交换机202所替换,则主交换机204将在相关物理端口502上自动创建附加虚拟端口522、524,以便容纳替换从交换机202上的附加RPI。类似地,如果在连接到主交换机204的第一物理端口的主机302上运行的VM306向连接到主交换机204的不同的第二物理端口的不同主机302迁移(即迁移保持于交换机领域内),则主交换机204将与VM306对应的虚拟端口522、524从主交换机204的第一物理端口502向主交换机204的第二物理端口502自动迁移。如果VM306在预定刷新间隔内完成它的迁移,则用于VM306的数据流量可以被交换机控制器530a觉察并且向第二物理端口502上的传出虚拟端口524转发。以这一方式,可以实现VM306的迁移而无数据流量的流量中断或者丢失,这对于对丢失敏感的协议特别有利。
每个主交换机204还检测至下层实体的交换机间链路206的丢失(例如链路状态从建立变成拆除、交换机间链路206断开或者下层实体出现故障)。如果检测到交换机间链路206的丢失,则主交换机204将自动禁用关联的虚拟端口522、524,直至检测到交换机间链路206的恢复。如果在预定刷新间隔内没有恢复交换机间链路206,则主交换机204将撤消关联于与之的通信已经丧失的下层实体的虚拟端口522、524以便恢复队列容量。在刷新间隔期间,交换机控制器530a允许在传入侧缓冲去往所禁用的传出虚拟端口524的数据流量。如果交换机间链路206被恢复并且所禁用的传出虚拟端口524被重新启用,则可以在损失内向传出虚拟端口524转发所缓冲的数据流量。
交换机500a还包括交叉开关(crossbar)510,该交叉开关可操作为在交换机控制器530的导引下从传入队列506a-506m中的任何传入队列向传出队列514a-514m中的任何传出队列(并且因此在任何传入虚拟端口522与任何传出虚拟端口524之间)智能地交换数据帧。如将理解的那样,可以用一个或者多个集中式或者分布式、专用或者通用处理单元或者逻辑器件实施交换机控制器530a,该一个或者多个集中式或者分布式、专用或者通用处理单元或者逻辑器件可以完全在硬件中或者更常见地通过处理单元执行固件和/或软件来实施控制。
为了智能地交换数据帧,交换机控制器530a构建和维护通常被实施为内容可寻址存储器(CAM)中的转发表的一个或者多个数据平面数据结构,例如转发信息库(FIB)532a。在所描绘的示例中,FIB532a包括多个条目534,这些条目可以例如包括MAC字段536、端口标识符(PID)字段538和虚拟端口(vport)标识符(VPID)字段540。每个条目534因此将数据帧的目的MAC地址与用于数据帧的具体传出端口502上的具体虚拟端口520相关联。交换机控制器530a通过从观测的数据帧获知在端口502和虚拟端口520与数据帧所指定的目的MAC地址之间的关联并且在FIB532a中记录所获知的关联而以自动的方式构建FIB332a。交换机控制器530a随后控制交叉开关510,以根据在FIB532a中记录的关联来交换数据帧。因此,每个主交换机204管理和访问它的与在下层的RPI对应的每个虚拟端口的层2和层3QoS、ACL和其它管理数据结构。
交换机控制器530a还实施管理模块550,该管理模块用作用于统一的虚拟化交换机的管理和控制中心。在一个实施方式中,每个主交换机204包括管理模块350,但是给定的DFP交换网络200或者300的仅单个主交换机204(这里称为进行管理的主交换机204)的管理模块350在任一时间可操作。在然后用作管理主交换机204的主交换机204发生故障的情况下(例如如经由主链路208由管理主交换机204通过心搏消息发送而检测的那样),可以从剩余的可操作的主交换机204之中预定的或者选择的另一主交换机204优选地自动承担管理主交换机204的角色并且利用它的管理模块350来提供对DFP交换网络200或者300的集中式管理和控制。
管理模块550优选地包括响应于登录和录入管理证书而由在网络连接的管理员控制器(例如客户端110a-110c之一)处驻守的管理员可访问的管理接口552,例如XML或者HTML接口。管理模块550优选地经由管理接口552呈现在DFP交换网络200或者300中的所有交换机(例如交换机204和/或202)上驻留的所有端口的全局视图。例如,图6是根据一个实施方式的经由管理接口552作为虚拟化交换机600而呈现的图2的DFP交换网络200的视图。在这一实施方式中,主交换机204可以被视为虚拟交换机架(chassis)而从交换机202服务于虚拟线卡。在这一示例中,可以例如在管理员控制台的显示器中以图形和/或列表方式表示的虚拟化交换机600呈现与从交换机202a的数据端口和交换机间端口对应的虚拟化端口(Pa-Pf)602a、与从交换机202b的数据端口和交换机间端口对应的P1-Pp602b、与从交换机202c的数据端口和交换机间端口对应的Pq-Ps602c以及与从交换机202d的数据端口和交换机间端口对应的Pw-Pz602d。此外,虚拟化交换机600用Pg-Pk602e表示主交换机204a的交换机间端口并且用Pt-Pv602f表示主交换机204b的交换机间端口。另外,虚拟化交换机600用虚拟输出队列(VOQ)604的相应集合表示主交换机204上实施的每个虚拟端口522、524。例如,在主交换机204a、204b上实施的虚拟端口522、524中的每个虚拟端口由VOQ集合604a-604k中的相应VOQ集合表示。通过与虚拟化交换机600交互,管理员可以经由统一接口管理和建立(例如经由图形、文字、数值和/或其它输入)对于DFP交换网络200中的从交换机202和主交换机204中的一个或者多个(或者所有)交换机的一个或者多个(或者所有)端口或者虚拟端口的期望控制。应当注意,除了虚拟化端口Pa-Pf602a、P1-Pp602b、Pq-Ps602c和Pw-Pz602d之外,在虚拟化交换机600内还实施VOQ集合604a-604k使得能够在DFP交换网络200或者300的任一层(或者两层)实施对于每个RPI的数据流量的个性化控制(和RPI的数据流量的每个流量类别)。因此,如以下进一步讨论的那样,管理员可以经由与虚拟化交换机600的虚拟化端口Pa交互,对于从交换机202a的具体数据端口210的特定流量分类实施期望控制。备选地或者附加地,管理员可以通过与具体VOQ交互建立针对该数据端口210的、对于该流量类别的期望控制,该具体VOQ对应于表示与数据端口210对应的传入端口522或者传出虚拟端口524的VOQ集合604上的该流量类别。
回到图5A,交换机控制器530a还包括可以用来对于遍历DFP交换网络200或者300的数据帧实施期望控制的控制模块560a。控制模块506a包括本地策略模块562,本地策略模块562在每个虚拟端口基础上在传入和/或传出处针对交换机500a实施期望的一套控制策略。控制模块560还可以包括在每个虚拟端口基础上限制对交换机500a的传入访问的本地访问控制列表(ACL)564。管理主交换机204可以可选地进一步包括远程策略模块566和远程ACL568,该远程策略模块和远程ACL在每个数据端口基础上在传入和/或传出后、在从交换机202或者虚拟交换机310、312中的一个或者多个交换机上实施期望的一套控制策略和访问控制。管理主交换机204可以经由保留的管理VLAN向目标交换机有利地推送用于另一主交换机204、从交换机202或者虚拟交换机310、312的新添加的或者更新的控制信息(例如控制策略或者ACL)。因此,用于通过虚拟化交换机的流量的ACL、控制策略和其它控制信息可以由主交换机204在主交换机204的虚拟端口522、524处、由从交换机202在数据端口210处和/或在虚拟交换机310、312的虚拟端口处实行。
用于在DFP交换网络200或者300内的一个或者多个期望位置全局地实施策略和访问控制的能力促进了多个管理特征。例如,为了实现主交换机204之间的期望的负荷平衡,同构或者异构控制策略可以由从交换机202和/或虚拟交换机310、312实施,从而实现向主交换机204传递以用于交换和路由的数据流量的期望分布。在一个具体实施中,可以根据各种流量类型,利用在不同主交换机204上运行的不同通信协议进行负荷分布。连接到主交换机204的从交换机202和主机302因此可以通过将多个相异流量类型中的每个流量类型的协议数据单元(PDU)引向负责该协议的主交换机204来实施期望的负荷分布。
虽然在图5A中未明示,但是应当理解,在至少一些实施方式中,如本领域已知的,除了层2帧交换之外交换机控制器530a还实施在层3(和更高层)处的路由和其它分组处理。在这样的情况下,交换机控制器530a可以包括将路由与层3地址相关联的路由信息库(RIB)。
现在参照图5B,描绘交换机500b的一个示例性实施方式的高层框图,该交换机可以用来实施图2的从交换机202中的任何从交换机。如相似标号所指示的,可以与交换机500a类似地构造具有多个端口502a-502m的交换机500b、交换机控制器530b和由交换机控制器530b控制的交叉开关交换机510。然而,由于交换机500b旨在在将用于转发帧的最终职责留给主交换机204的通过模式中操作,所以交换机控制器530b得以简化。例如,在所示实施方式中,FIB332b的每个条目534包括控制字段570和关联PID字段538,该控制字段570用于标识用于对帧进行分类(例如管理模块350向交换机控制器530b推送帧类别)的一个或者多个帧字段(例如目的MAC地址、RPI等)的值,该关联PID字段538标识连接到用于转发该分类的数据流量的主交换机204的交换机530b的传出数据端口502。控制模块560被类似地简化,因为不支持远程策略566或者远程ACL568。最后可以完全省略管理模块550,因为无需配备交换机500b以用作主交换机204。
现在参照图7,图示根据一个实施方式的用于管理DFP交换网络的示例性过程的高层逻辑流程图。为了方便起见,参照图2-3的DFP交换网络200和300描绘图7的过程。与这里所示的其它逻辑流程图一样,以逻辑而不是严格的时间顺序图示了步骤,并且可以用与所示的顺序不同的顺序或者并行地执行至少一些步骤。
该过程始于块700、然后继续块702,该块描绘了主交换机204a、204b中的每个主交换机获知其所处的DFP交换网络200或者300的成员资格和拓扑。在各种实施方式中,主交换机204a、204b然后可以例如通过从在客户端设备110a-110c之一驻守的网络管理员接收配置或者备选地通过主交换机204a、204b中的每个主交换机的交换机控制器530a实施自动交换机发现协议来获知DFP交换网络200或者300的成员资格。基于所发现的DFP交换网络200或者300中的成员资格,主交换机204的交换机控制器530a在每个端口502上对于在DFP交换网络200、300的下层中的可以在该端口502上从其接收传入数据流量的每个RPI实施相应传入虚拟端口522和相应传出虚拟端口524(块704)。进行管理的主交换机204、例如主机交换机204a随后允许通过管理接口552配置、管理和控制DFP交换网络200或者300以作为虚拟化交换机600(块706)。应当理解,作为虚拟化交换机600,DFP交换网络200或者300可以被配置、管理和控制以如同虚拟化交换机600的所有虚拟化端口602在单个物理交换机内一样操作。因此,例如,无论对应RPI属于交换机202、310、312或者主机302都可以对于虚拟化端口602实施端口镜像、端口干线化、多播、增强型传输选择(ETS)(例如根据草拟标准IEEE802.1Qaz的速率限制和整形)和基于优先级的流控制。随后,进行管理的主交换机(例如主交换机204a)的交换机控制器530a的管理模块550向其它主交换机204、从交换机202和/或虚拟交换机310、312推送控制信息,以便在性质上配置其它交换机的控制模块560和FIB532(块708)。图7的过程随后结束于块710。现在参照图8,描绘根据一个实施方式的示例性过程的高层逻辑流程图,通过该示例性过程从被配置以作为虚拟化交换机操作的DFP交换网络的下层向上层转发网络流量。为了方便起见,也参照图2的DSF交换网络200和图3的DSF交换网络300描述图8的过程。
所描绘的过程始于块800并且随后继续块802,该块描绘在DSF交换网络的下层的RPI,该RPI接收将向主交换机204传输的数据帧。如在块804的虚线图示所示,RPI所处的从交换机202或者主机302如果先前被进行管理的主交换机204通知这样做则可选地向数据帧实行策略控制或者访问控制(通过参考ACL)。
在块806,在下层的从交换机202或者主机302将RPI标识符(例如S标签)应用于数据帧,以标识在其处接收数据帧的传入RPI。在下层的从交换机202或者主机302然后向在DFP交换网络200或者300的上层的主交换机204转发数据帧(块808)。在从交换机202的情况下,在块808处经由FIB532b所指示的交换机传出端口转发数据帧。随后,图8中所示过程结束于块810。
参照图9,图示根据一个实施方式的示例性过程的高层逻辑流程图,通过该示例性过程,在DFP交换网络的上层的主交换机处置从下层接收的数据帧。所示过程始于块900、然后继续块902,该块描绘DFP交换网络200或者300的主交换机204,该主交换机204在它的端口502之一上从从交换机202或者主机302接收数据帧。响应于接收到数据帧,在其处接收数据帧的端口502的接收接口504根据由数据帧指定的RPI标识符(例如S标签)对数据帧进行预分类并且将数据帧排队到与该RPI关联的传入虚拟端口522(块904)。从块904开始,图9中所示过程继续块910和920二者。
在块910,交换机控制器530a利用由数据帧指定的目的MAC地址来访问FIB532a。如果具有匹配MAC字段536的FIB条目534被找到,则处理在以下描述的块922-928继续。然而,如果交换机控制器530a在块910确定目的MAC地址未知,则交换机控制器530a利用常规发现技术来获知目的MAC地址、传出端口502和目的RPI之间的关联并且相应地更新FIB532a。该过程然后继续块922-928。
在块920,交换机控制器530a将控制模块560a针对传入端口522指定的任何本地策略562或者本地ACL564应用于数据帧。此外,交换机控制器530a对于该数据帧在传入上执行任何其它特殊处置。如以下更具体讨论的那样,该特殊处置可以例如包括实施端口干线化、基于优先级的流控制、多播、端口镜像或者ETS。每个类型的特殊处置可以如以下进一步描述的那样在传入端口和/或在传出端口处应用于数据流量。该过程然后继续块922-928。
现在参照块922-924,交换机控制器530a更新数据帧的RPI标识符以等于在匹配FIB条目534的VPID字段540中指定的(或者发现过程获知的)RPI标识符,并且将数据帧排队于匹配FIB条目534的PID字段538所标识的(或者发现过程获知的)对应传出虚拟端口524中。在块926,交换机控制器530a向数据帧应用控制模块560a针对传出虚拟端口524指定的任何本地策略562或者本地ACL564。此外,交换机控制器530a对于数据帧在传出端口上执行任何其它特殊处置,该特殊处置例如包括实施端口干线化、基于优先级的流控制、多播、端口镜像或者ETS。主交换机204随后经由交换机间链路206向DFP交换网络200或者300的下层(例如从交换机202或者主机302)转发数据帧(块928)。图9中所示过程随后终止于块930。
现在参照图10,描绘根据一个实施方式的示例性过程的高层逻辑流程图,通过该示例性过程,在DFP交换网络200或者300的下层的从交换机202或者主机302处置从上层的主交换机接收的数据帧。图10中所描绘的过程始于块1000、然后继续块1002,该块图示下层实体,比如从交换机202或者主机302,该从交换机202或者主机302例如在从交换机202的交换机端口502处或者在主机302的网络接口404或者VMM304处从主交换机204接收数据帧。
响应于接收到数据帧,下层实体从数据帧中去除由主交换机204更新的RPI标识符(块1004)。下层实体然后使数据帧流向由提取的RPI标识符标识的RPI(块1006)。因此,例如交换机控制器530b用数据帧的RPI和/或目的MAC地址访问它的FIB532b以标识匹配的FIB条目534、然后控制交叉开关510以向在匹配的FIB条目534的PID字段538中指定的端口转发该数据帧。主机的网络接口404或者VMM304类似地将数据帧引向RPI标识符所指示的RPI。随后,该过程结束于块1008。
现在参照图11,图示根据一个实施方式的在DFP交换网络中操作链路聚合组(LAG)的示例性方法的高层逻辑流程图。链路聚合也在本领域中不同地称为干线化、链路成束、接合、组队、端口信道、以太信道和多链路干线化。
图11中所示过程始于块1100、然后继续块1102,该块描绘在DFP交换网络200或者300的主交换机204处建立包括多个RPI的LAG。不同于常规LAG,在DFP交换网络200或者300中建立的LAG可以包括多个不同(以及可能的异构)从交换机202和/或主机302的RPI。例如,在图2-3的DFP交换网络200和300中,单个LAG可以包括从交换机202a-202d和/或主机302a-302d中的一项或者多项的RPI。
在至少一些实施方式中,可以在主交换机204处通过如下方式来建立LAG:例如由在客户端设备110a-110c之一驻守的、与进行管理的主交换机204的管理接口552交互的系统管理员对主交换机204进行静态配置。备选地或者附加地,可以在主交换机204处通过如下方式来建立LAG:经由IEEE802.1AX-2008中所定义的链路聚合控制协议(LACP),在主交换机204与一个或者多个下层实体(例如从交换机202或者主机302)之间交换信息。由于在主交换机204处建立LAG,所以应当理解并非所有连接到属于LAG的交换机间链路206的下级实体均需要为LAG提供支持(或者甚至知道LAG的存在)。
如在块1102处所示的在主交换机204处建立LAG优选地包括在如图12中所示的交换机控制器530a中的LAG数据结构1200中记录LAG的成员资格。在描绘的示例性实施方式中,LAG数据结构1200包括各自指定相应LAG中的成员资格的一个或者多个LAG成员资格条目1202。在一个优选实施方式中,LAG成员资格条目1202在形成LAG的RPI或者与该RPI关联的虚拟端口520方面表达LAG成员资格。在其它实施方式中,可以备选地或者附加地,在连接主交换机204和RPI的交换机间链路206方面表达LAG。如将理解的那样,LAG数据结构1200可以实施为独立的数据结构或者可以在另一数据结构比如FIB532a的一个或者多个字段中实施。
在建立LAG之后,如先前参照图9的块920-926所述,主交换机204对于引向LAG内的RPI的数据帧执行特殊处置。具体而言,如在块1104所示,交换机控制器530a监视接收的用于转发的数据帧并且例如通过参考FIB532a和/或LAG数据结构1200来确定在数据帧中包含的目的MAC地址是否被已知与属于LAG的RPI关联。响应于在块1104的否定确定,该过程转到以下描述的块1112。然而,如果交换机控制器532a在块1104确定数据帧被寻址到与属于LAG的RPI关联的目的MAC,则交换机控制器532a从LAG的成员资格之中为数据帧选择传出RPI。
在块1110,交换机控制器532a可以基于包括轮循、广播、负荷平衡或者哈希式LAG策略的多个LAG策略中的任何LAG策略而从LAG成员资格之中选择传出RPI。在哈希式LAG策略的一个实施中,交换机控制器532a对源MAC地址和目的MAC地址进行异或并且以LAG的大小对结果执行模运算,以便总是针对给定的目的MAC地址选择相同的RPI。在其它实施方式中,哈西式LAG策略可以基于包括源IP地址、目的IP地址、源MAC地址、目的地址和/或源RPI等的不同或者附加因素选择传出RPI。
如在块1112所示,数据帧跨越LAG的“喷射(spraying)”或者分发继续进行,直至例如通过去除主交换机204的静态配置或者经由LCAP来对LAG撤消配置。随后,图11中所示过程终止于块1120。
在主交换机204处实施跨越不同下层实体的分布式LAG这样的能力实现了附加的网络能力。例如,在包括提供相同服务的多个VM306的DFP交换网络300中,形成以所有这样的VM作为成员的LAG使得用于服务的数据流量能够在无VMM304的任何管理的情况下,基于服务标签和其它元组字段、跨越VM306得到自动地负荷平衡。另外,可以跨越在不同VMM 304和不同主机302上运行的VM 306实现这样的负荷平衡。
如以上所述,在图9的块920-926可选地执行的特殊处置不仅可以包括向LAG分发帧,而且可以包括对数据流量的多播。现在参照图13,描绘根据一个实施方式的在DFP交换网络中多播的示例性方法的高层逻辑流程图。该过程始于块1300、然后继续块1302-1322,这些块图示如参照图9的块920-926先前描述的由主交换机为多播数据流量执行的特殊处置。
具体而言,在块1310,主交换机204的交换机控制器530a通过参考在数据流量内指定的目的MAC地址或者IP地址来确定数据流量是否请求多播递送。例如,IP为多播地址保留224.0.0.0至239.255.255.255,并且以太网至少利用在表I中概括的多播地址:
表I
响应于在块1310确定数据流量无需多播处置,对于数据流量不执行多播处置(尽管可以执行其它特殊处置),并且该过程在块1310进行迭代。然而,如果交换机控制器530a在块1310确定传入数据流量为多播流量,则过程转到块1312。
在块1312,交换机控制器530a在多播索引数据结构中对于多播数据流量执行查找。例如,在图14中所示的一个示例性实施方式中,交换机控制器530a实施用于层2多播帧的层2多播索引数据结构1400和用于层3多播分组的层3多播索引数据结构1410。在描绘的示例性实施方式中,可以例如被实施为表的层2多播索引数据结构1400包括多个条目1402,每个条目将四元组字段1404与指定进入多播目的地数据结构1420的索引的索引字段1406相关联,四元组字段1404由传入RPI、源MAC地址、目的MAC地址和VLAN形成。可以类似地被实施为表的层3多播索引数据结构1410包括多个条目1412,每个条目将由源层3(IP)地址和多播组ID形成的二元组字段1404与指定进入多播目的地数据结构1420的索引的索引字段1406相关联。也可以被实施为表或者链表的多播目的地数据结构1420继而包括多个多播目的地条目1422,每个多播目的地条目1422指定在下层中的将向其传输数据流量的一个或者多个RPI。层2多播数据结构1400、层3多播索引数据结构1410和多播目的地数据结构1420都优选地在常规MC获知过程中由控制平面填充。
因此,在块1312,如果数据流量为层2多播帧,则交换机控制器530a在层2多播索引数据结构1400中执行查找以获得进入多播目的地数据结构1420的索引,而如果数据流量为L3多播分组,则交换机控制器530a在层3多播索引数据结构1410中执行查找。如在块1314处所示,主交换机204可以通过传入复制或者传出复制来处置数据流量的多播,而优选地在交换机控制器530a中配置期望的实施。如果在主交换机204上配置传出复制,则该过程继续块1316,该块图示了交换机控制器530a使数据流量的单个副本穿越交叉开关510并且在与在块1312处获得的索引所标识的多播目的地条目1422中标识的RPI对应的每个传出队列514中被复制。如将理解的那样,多播流量的传出复制以线端(HOL)阻塞为代价来减少交叉开关510的带宽利用。在块1316之后,主交换机204对复制的数据流量的处理如图9中先前描述的那样继续进行(块1330)。
另一方面,如果主交换机204被配置用于传入复制,则过程从块1314继续块1320,该块图示了交换机控制器530a使多播数据流量在端口502的传入队列506中的每个传入队列内被复制,这些端口具有与在编索引的多播目的地条目1422中标识的RPI关联的输出队列514。如将理解的那样,传入复制以这一方式消除HOL阻塞。在块1320之后,数据流量经历以上参照图9讨论的附加处理。在这样的处理中,交换机控制器530a控制交叉开关510以从相同端口502的传入队列506向传出队列514直接传输在传入时复制的多播数据流量。
如将理解的那样,所描述的在DFP交换网络200的主交换机204处而不是在从交换机202处实施MC处置使得能够使用简化的从交换机202,该简化的从交换机202无需能够进行数据流量的多播分发。
如以上参照图9的块920-926描述的那样,在DFP交换网络中对数据流量的特殊处置可以可选地包括将ETS应用于数据流量。图15是根据一个实施方式的在DFP交换网络200或者300中的增强型传输选择(ETS)的示例性方法的高层逻辑流程图。
图15中描绘的过程始于块1500、然后继续块1502,该块描绘了配置DFP交换网络200或者300的主交换机204,以例如在进行管理的主交换机204上经由管理接口552实施ETS。在各种实施方式中,ETS被配置为实施于主交换机204的传入和/或传出端口处。
在草拟标准IEEE802.1Qaz中定义的ETS建立多个流量类群组(TCG)并且指定来自流量队列(例如传入虚拟端口522或者传出虚拟端口524)的、在各种TCG中的数据流量的传输(即调度)优先级,以便实现在TCG之间的期望的链路利用平衡。ETS不仅为每个TCG建立最小保证带宽,而且允许低优先级流量消费名义上可用于高优先级TCG的已利用的带宽,由此在防止低优先级流量的互斥等待(starvation)的同时提高链路利用率和灵活性。在主机交换机204处配置ETS可以例如包括在主机交换机204的交换机控制器530a内建立和/或填充如图16中所示的ETS数据结构1600。在图16中所示的示例性实施方式中,可以例如被实施为表的ETS数据结构1600包括多个ETS条目1602。在描绘的实施方式中,每个ETS条目1602包括TCG字段1604、最小字段1606和最大字段1608,该TCG字段1604定义属于给定的TCG的流量类型(例如光纤信道(FC)、以太网、以太网FC(FCoE)、iSCSI等),该最小字段1606针对在TCG字段1604中定义的TCG定义(例如在绝对项中或者作为百分比)保证最小带宽,该最大字段1608针对在TCG字段1604中定义的TCG定义(例如在绝对项中或者作为百分比)保证最大带宽。
回到图15,在主交换机1502上配置ETS之后,该过程继续块1504-1510,这些块描绘在图9的块920-926处可选地针对ETS执行的特殊处置。具体而言,块1504图示了主交换机204确定在传入虚拟端口520或者传出虚拟端口522中接收的数据帧是否属于如下流量类,该流量类属于例如如ETS数据结构1600所定义的当前配置的ETS TCG。如将理解的那样,可以基于常规以太网帧的以太类型字段等对数据帧进行分类。响应于在块1504确定接收的数据帧不属于当前配置的ETS TCG,数据帧接收尽力而为调度,并且该过程继续以下描述的块1512。
回到块1504,响应于确定接收的数据帧属于当前配置的ETSTCG,主交换机204向数据帧应用速率限制和流量整形,以符合在ETS数据结构1600的相关ETS条目1602的字段1606、1608内为ETS TCG指定的最小和最大带宽(块1510)。如以上所述,根据配置,主交换机204可以在传入虚拟端口522和/或传出虚拟端口524处将ETS应用于VOQ。该过程然后继续块1512,该块图示了主交换机204如在块1504和1510处描绘的那样针对流量类别实施ETS,直至针对该流量类别对ETS撤消配置。随后,图15中所示过程终止于块1520。
在DFP交换网络200或者300中,流控制可以有利地不仅如参照图15-16描述的那样实施于主交换机204处而且实施于下层实体、比如从交换机202和主机302的RPI处。现在参照图17,图示示例性方法的高层逻辑流程图,通过该示例方法,DFP交换网络200或者300在下层实施基于优先级的流控制(PFC)和/或其它服务。
图17中所示过程始于块1700、然后继续块1702,该块表示主交换机204例如响应于以下各项而对于在DFP交换网络200或者300的下层的实体实施基于优先级的流控制(PFC):(1)在执行管理模块550的进行管理的主交换机204处接收到对于与下层实体的至少一个RPI对应的虚拟化端口602a-602d的PFC配置;或者(2)在主交换机204处接收到由网络中的下游实体发起的并且在主交换机204处经由通过从交换机202接收的基于标准的PFC数据帧。如本领域技术人员将理解的那样,基于标准的PFC数据帧可以由从上游实体接收数据流量流的下游实体生成以向上游实体通知对于数据流的拥塞。响应于在块1702肯定确定主交换机204已经接收到用于下层实体的PFC配置,该过程继续块1704,该块图示主交换机204构建并且向至少一个下层实体(例如从交换机202或者主机302)发送用PFC配置字段增强的专有数据帧(下文称为专有PFC数据帧),以便配置下层实体以用于PFC。随后,图17中描绘的过程结束于块1706。
现在参照图18,描绘根据一个实施方式的示例性专有PFC数据帧1800的结构。如先前参照图17的块1704描述的那样,专有PFC数据帧1800可以由主交换机204构建并且向DFP交换网络的下层实体、比如从交换机202或者主机302发送,以便在下层实体处实施PFC。
在描绘的示例性实施方式中,专有PFC数据帧1800被实施为扩展的以太网MAC控制帧。专有PFC数据帧1800因而包括目的MAC地址字段1802和源MAC地址字段1804,该目的MAC地址字段1802指定主交换机204可以从其接收数据帧的下层实体处的RPI的MAC地址,该源MAC地址字段1804标识主交换机204上的从其发送专有PFC数据帧1800的传出虚拟端口。地址字段1802、1804之后跟随有以太类型字段1806,以太类型字段1806将PFC数据帧1800标识为MAC控制帧(例如通过值0x8808)。
专有PFC数据帧1800的数据字段然后始于MAC控制操作码字段1808,该MAC控制操作码字段(例如通过PAUSE命令值0x0101)指示专有PFC数据帧1800用于实施流控制。MAC控制操作码字段1808之后跟随有包括启用字段1812和类别矢量字段1814的优先级启用矢量1810。在一个实施方式中,启用字段1812通过最低有效位的状态指示专有PFC数据帧1800是否用于在下层的RPI处实施流控制,该RPI是专有PFC数据帧1800的目的地。类别矢量1814还例如利用多热编码来指示专有PFC数据帧1800对于N个流量类别中的哪个流量类别实施流控制。在优先级启用矢量1810之后,专有PFC数据帧1800包括N个时间量字段1820a-1820n,每个时间量字段对应于可以被实施流控制的N个流量类别中的相应流量类别。假设启用字段1812被设置为对于RPI启用流控制,并且类别矢量1812中的对应位被设置为指示对于特定流量类别的流控制,则给定的时间量字段1820(例如作为百分比或者作为绝对值)指定RPI对关联流量类别中的数据的最大传输带宽。由专有PFC数据帧1800对其配置流控制的RPI由RPI字段1824进一步指定。
在数据字段之后,专有PFC数据帧1800包括可选填充1826以获得预定大小的专有PFC数据帧1800。最后,专有PFC数据帧1800包括用来检测专有PFC数据帧1800中的错误的常规校验和字段1830。
如将理解的那样,专有PFC数据帧1800可以用来针对RPI触发除了流控制之外的功能。例如,专有PFC数据帧1800也可以用来针对指定的RPI触发服务(例如利用时间量字段1820的特殊保留值)。这些附加服务可以例如包括重新哈希处理服务器负荷平衡策略、更新防火墙限制、服务拒绝(DOS)攻击检查的实行等。
现在参照图19A,图示根据一个实施方式的示例性过程的高层逻辑流程图,通过该示例性过程,DFP交换网络200或者300的下层实体、比如从交换机202处理从主交换机204接收的专有PFC数据帧1800。
该过程始于块1900、然后继续块1902,该块图示一种通过下层实体,比如从交换机202,其监视对专有PFC数据帧1800的接收。响应于接收到例如通过基于MAC控制操作码字段1808的分类而检测到的专有PFC数据帧1800,该过程从块1902继续块1904。块1904描绘从交换机202(例如交换机控制器530b)例如通过提取非标准字段1810、1820和1824将专有PFC数据帧1800转换成基于标准的PFC数据帧。从交换机202然后例如通过参考FIB532b将从RPI字段1824提取的RPI转换成端口ID来针对基于标准的PFC数据帧确定传出数据端口210,并且经由所确定的传出数据端口210向引起拥塞的数据流量的源转发所得的基于标准的PFC数据帧(块1906)。随后,图19A中所示过程结束于块1910。应当注意,由于可以针对每个RPI单独地实施PFC,所以描述的过程可以用来针对相同下层实体(例如从交换机202或者主机302)上的不同RPI实施不同PFC。另外,由于在下层实体处的RPI由VOQ604表示,所以可以备选地和选择性地在主交换机204处实施对于RPI中的一个或者多个RPI的个性化PFC,从而相同端口502对于不同虚拟端口522、524的数据流量实施不同PFC。
现在参照图19B,描绘根据一个实施方式的示例性过程的高层逻辑流程图,通过该示例性过程,DFP交换网络200或者300的下级实体、比如主机平台302处理从主交换机204接收的专有PFC数据帧1800。
该过程始于块1920、然后继续块1922,该块图示主机平台302的网络接口404(例如CNA或者NIC)例如通过基于MAC控制操作码字段1808对传入数据帧进行分类来监视对专有PFC数据帧1800的接收。响应于检测到接收到专有PFC数据帧1800,该过程从块1922继续块1930。块1930描绘网络接口404例如经由中断或者其它消息向VMM304发送专有PFC数据帧1800以用于处置。响应于接收到专有PFC数据帧1800,管理程序304继而向与在专有PFC数据帧1800的RPI字段1824中指示的RPI关联的VM306发送专有PFC数据帧1800(块1932)。作为响应,VM306对于专有PFC数据帧1800所指示的特定应用和流量优先级应用PFC(或者专有PFC数据帧1800所指示的其它服务)(块1934)。因此,可以针对每个应用、每个优先级实施PFC,从而例如使数据中心服务器平台例如响应于来自与数据中心服务器平台通信的视频流传输客户端的背压,将与第二VM306(例如FTP服务器)不同的PFC应用于第一VM306(例如视频流传输服务器)。在块1934之后,图19B中描绘的过程结束于块1940。
如已经描述的那样,在一些实施方式中,交换网络包括上层和下层,上层包括主交换机,下层包括多个下层实体。主交换机包括多个端口,每个端口各自耦合到多个下层实体中的相应下层实体。多个端口中的每个端口包括多个虚拟端口,每个虚拟端口对应于在耦合到该端口的下层实体处的多个远程物理接口(RPI)中的相应RPI。多个端口中的每个端口也包括接收接口,该接收接口响应于从多个下层实体之中的特定下层实体接收到数据流量,将数据流量排队到多个虚拟端口之中的与特定下层实体上的RPI对应的虚拟端口,该RPI是数据流量的源。主交换机还包括从虚拟端口向在多个端口之中的从其转发数据流量的传出端口交换数据流量的交换机控制器。
在包括上层和下层的交换网络的一些实施方式中,在所述上层中的具有多个端口的主交换机在所述多个端口中的每个端口上实施多个虚拟端口,所述多个端口中的每个端口耦合到相应下层实体,所述多个虚拟端口中的每个虚拟端口对应于在耦合到所述端口的所述下层实体处的多个远程物理接口(RPI)中的相应RPI。在所述主交换机与所述多个下层实体上的RPI之间传送的数据流量被排队到所述多个虚拟端口之中的如下虚拟端口,所述虚拟端口对应于下层实体上的、向其传送所述数据流量的所述RPI。所述主交换机通过向对应于给定的虚拟端口的特定RPI所在的下层实体发送基于优先级的流控制(PFC)数据帧来对所述给定的虚拟端口的数据流量实行基于优先级的流控制,所述PFC数据帧为所述特定RPI所传送的至少两个不同数据流量类别指定优先级。
在包括上层和下层的切换交换网络的一些实施方式中,在所述上层中的具有多个端口的主交换机在所述多个端口中的每个端口上实施多个虚拟端口,所述多个端口中的每个端口耦合到相应下层实体,所述多个虚拟端口中的每个虚拟端口对应于在耦合到所述端口的所述下层实体处的多个远程物理接口(RPI)中的相应RPI。在所述主交换机与所述多个下层实体上的RPI之间传送的数据流量被排队到所述多个虚拟端口之中的如下虚拟端口,所述虚拟端口对应于下层实体上的、向其传送所述数据流量的所述RPI。所述主交换机至少基于数据流量被排队于其中的虚拟端口、根据控制策略向数据流量应用数据处置,从而所述主交换机将不同策略应用于被排队到主交换机的相同端口上的两个虚拟端口的数据流量。
尽管已经如参照一个或者多个优选实施方式描述的那样具体示出了本发明,但是本领域技术人员将理解其中可以进行形式和细节上的各种改变而未脱离本发明的精神实质和范围。例如,虽然已经关于执行程序代码(例如软件、固件或者其组合)的一个或者多个机器(例如主机和/或网络交换机)描述方面,该程序代码指引这里描述的功能,但是应当理解实施方式可以备选地实施为包括有形机器可读存储介质或者存储设备(例如光存储介质、存储器存储介质、盘存储介质等)的程序产品,该有形机器可读存储介质或者存储设备存储程序代码,该程序代码可以由机器处理以使机器执行所描述的功能中的一个或者多个功能。
Claims (22)
1.一种用于在交换网络中实施流控制的方法,所述交换网络包括上层和下层,所述下层包括多个下层实体,所述方法包括:
在所述上层中的具有多个端口的主交换机处,在所述多个端口中的每个端口上实施多个虚拟端口,所述多个端口中的每个端口可耦合到所述多个下层实体中的相应下层实体,所述多个虚拟端口中的每个虚拟端口对应于在可耦合到所述端口的所述下层实体处的多个远程物理接口(RPI)中的相应RPI;
将在所述主交换机与所述多个下层实体上的RPI之间传送的数据流量排队于所述多个虚拟端口之中的如下虚拟端口内,所述虚拟端口对应于下层实体上的、向其传送所述数据流量的所述RPI;以及
所述主交换机通过向对应于给定的虚拟端口的特定RPI所在的下层实体发送基于优先级的流控制(PFC)数据帧来对所述给定的虚拟端口的数据流量实行基于优先级的流控制,所述PFC数据帧为所述特定RPI所传送的至少两个不同类别的数据流量指定优先级。
2.如权利要求1所述的方法,其中:
在所述主交换机与所述多个下层实体之间传送的所述数据流量包括RPI标识符,所述RPI标识符标识所述下层实体上的、向其传送所述流量的RPI;并且
所述排队包括基于所述RPI标识符将所述数据流量排队到所述主交换机上的虚拟端口。
3.如权利要求1或者权利要求2所述的方法,其中:
所述下层实体包括以流过模式配置的从交换机;
所述特定RPI包括数据端口;并且
所述方法还包括所述从交换机接收所述PFC数据帧、从所述PFC数据帧中去除标识所述特定RPI的RPI标识符以获得标准PFC数据帧、以及经由与所述特定RPI对应的所述数据端口发送所述标准PFC数据帧。
4.如权利要求1所述的方法,其中:
所述下层实体包括具有网络接口和虚拟机监视器的主机平台;
所述特定RPI包括在所述主机平台上执行的虚拟机;并且
所述方法还包括所述网络接口向所述虚拟机监视器传送所述PFC数据帧。
5.如权利要求4所述的方法,还包括:
响应于接收到所述PFC数据帧,所述主机平台上的所述虚拟机监视器基于在所述PFC数据帧中指定的所述特定RPI向所述虚拟机发送所述PFC数据帧。
6.如权利要求1所述的方法,其中所述对所述给定的虚拟端口的数据流量实行基于优先级的流控制包括所述主交换机针对每个应用、每个优先级实行基于优先级的流控制。
7.如权利要求1所述的方法,其中所述特定RPI包括如下集合中的一项,所述集合包括物理端口、链路聚合组(LAG)接口和虚拟端口。
8.如权利要求7所述的方法,其中所述虚拟端口包括如下集合中的一项,所述集合包括虚拟网络接口卡(NIC)、单根I/O虚拟化(SR-IOV)NIC分区和以太网光纤信道(FCoE)端口。
9.如权利要求1所述的方法,其中所述PFC帧包括:
标识所述特定RPI的RPI字段;以及
为所述至少两个不同类别的数据流量指定相对优先级的多个字段。
10.如权利要求1所述的方法,其中所述对所述给定的虚拟端口的数据流量实行基于优先级的流控制包括所述主交换机针对所述下层实体上的两个不同RPI实行不同的基于优先级的流控制。
11.一种用于交换网络的主交换机,所述交换网络包括上层和下层,所述上层包括所述主交换机,所述下层包括多个下层实体,所述主交换机包括:
多个端口,所述多个端口中的每个端口可耦合到所述多个下层实体中的相应下层实体,所述多个端口中的每个端口包括多个虚拟端口,所述多个虚拟端口中的每个虚拟端口对应于在可耦合到所述端口的所述下层实体处的多个远程物理接口(RPI)中的相应RPI,其中在所述主交换机与所述多个下层实体上的RPI之间传送的数据流量被排队到所述多个虚拟端口之中的如下虚拟端口,所述虚拟端口对应于下层实体上的、向其传送所述数据流量的所述RPI;以及
在所述多个端口之间交换数据流量的交换机控制器;
其中所述主交换机通过向对应于给定的虚拟端口的特定RPI所在的下层实体发送基于优先级的流控制(PFC)数据帧来对所述给定的虚拟端口的数据流量实行基于优先级的流控制,所述PFC数据帧为所述特定RPI所传送的至少两个不同类别的数据流量指定优先级。
12.如权利要求11所述的主交换机,其中:
在所述主交换机与所述多个下层实体之间传送的所述数据流量包括RPI标识符,所述RPI标识符标识所述下层实体上的、向其传送所述流量的RPI;并且
所述主交换机基于所述RPI标识符将数据流量排队到其虚拟端口。
13.如权利要求11所述的主交换机,其中所述主交换机针对每个应用、每个优先级实行PFC。
14.如权利要求11或者权利要求12所述的主交换机,其中所述PFC帧包括:
标识所述特定RPI的RPI字段;以及
为所述至少两个不同类别的数据流量指定相对优先级的多个字段。
15.如权利要求11所述的主交换机,其中所述主交换机针对所述下层实体上的两个不同RPI实行不同的基于优先级的流控制。
16.一种交换网络,包括:
如权利要求11至15中的任一权利要求所述的主交换机;以及
所述多个下层实体。
17.如权利要求16所述的交换网络,其中:
所述下层实体包括以流过模式配置的从交换机;并且
所述特定RPI包括所述从交换机上的数据端口;并且
所述从交换机接收所述PFC数据帧、从所述PFC数据帧中去除标识所述特定RPI的RPI标识符以获得标准PFC数据帧、以及经由与所述特定RPI对应的所述数据端口发送所述标准PFC数据帧。
18.如权利要求16所述的交换网络,其中:
所述下层实体包括主机平台;并且
所述特定RPI包括在所述主机平台上执行的虚拟机。
19.如权利要求18所述的交换网络,其中:
所述主机平台执行虚拟机监视器;
所述主机平台包括网络接口,所述网络接口接收所述PFC数据帧并且向所述虚拟机监视器传送所述PFC数据帧;并且
所述虚拟机监视器基于在所述PFC数据帧中指定的所述特定RPI向所述虚拟机传送所述PFC数据帧。
20.如权利要求16所述的交换网络,其中所述特定RPI包括如下集合中的一项,所述集合包括物理端口、链路聚合组(LAG)接口和虚拟端口。
21.如权利要求20所述的交换网络,其中所述虚拟端口包括如下集合中的一项,所述集合包括虚拟网络接口卡(NIC)、单根I/O虚拟化(SR-IOV)NIC分区和以太网光纤信道(FCoE)端口。
22.一种用于在交换网络中实施流控制的设备,所述交换网络包括上层和下层,所述下层包括多个下层实体,所述设备包括:
用于在所述上层中的具有多个端口的主交换机处,在所述多个端口中的每个端口上实施多个虚拟端口的装置,所述多个端口中的每个端口可耦合到所述多个下层实体中的相应下层实体,所述多个虚拟端口中的每个虚拟端口对应于在可耦合到所述端口的所述下层实体处的多个远程物理接口(RPI)中的相应RPI;
用于将在所述主交换机与所述多个下层实体上的RPI之间传送的数据流量排队于所述多个虚拟端口之中的如下虚拟端口内的装置,所述虚拟端口对应于下层实体上的、向其传送所述数据流量的所述RPI;以及
用于在所述主交换机处对给定的虚拟端口的数据流量实行基于优先级的流控制(PFC)的装置,其中用于实行的所述装置进一步包括用于向对应于所述给定的虚拟端口的特定RPI所在的下层实体发送PFC数据帧的装置,所述PFC数据帧为所述特定RPI所传送的至少两个不同类别的数据流量指定优先级。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/107,893 | 2011-05-14 | ||
US13/107,893 US8588224B2 (en) | 2011-05-14 | 2011-05-14 | Priority based flow control in a distributed fabric protocol (DFP) switching network architecture |
PCT/IB2012/051803 WO2012156832A1 (en) | 2011-05-14 | 2012-04-12 | Priority based flow control in a distributed fabric protocol (dfp) switching network architecture |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103534989A CN103534989A (zh) | 2014-01-22 |
CN103534989B true CN103534989B (zh) | 2016-08-17 |
Family
ID=47141829
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280023756.7A Expired - Fee Related CN103534989B (zh) | 2011-05-14 | 2012-04-12 | 在分布式结构协议(dfp)交换网络架构中的基于优先级的流控制 |
Country Status (8)
Country | Link |
---|---|
US (2) | US8588224B2 (zh) |
JP (1) | JP5497244B2 (zh) |
KR (1) | KR101507675B1 (zh) |
CN (1) | CN103534989B (zh) |
CA (1) | CA2833681C (zh) |
DE (1) | DE112012001320B4 (zh) |
GB (1) | GB2504443A (zh) |
WO (1) | WO2012156832A1 (zh) |
Families Citing this family (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8670450B2 (en) | 2011-05-13 | 2014-03-11 | International Business Machines Corporation | Efficient software-based private VLAN solution for distributed virtual switches |
US9276953B2 (en) | 2011-05-13 | 2016-03-01 | International Business Machines Corporation | Method and apparatus to detect and block unauthorized MAC address by virtual machine aware network switches |
US20120287785A1 (en) | 2011-05-14 | 2012-11-15 | International Business Machines Corporation | Data traffic handling in a distributed fabric protocol (dfp) switching network architecture |
US8837499B2 (en) | 2011-05-14 | 2014-09-16 | International Business Machines Corporation | Distributed fabric protocol (DFP) switching network architecture |
US8588224B2 (en) * | 2011-05-14 | 2013-11-19 | International Business Machines Corporation | Priority based flow control in a distributed fabric protocol (DFP) switching network architecture |
US20120291034A1 (en) | 2011-05-14 | 2012-11-15 | International Business Machines Corporation | Techniques for executing threads in a computing environment |
US9497073B2 (en) | 2011-06-17 | 2016-11-15 | International Business Machines Corporation | Distributed link aggregation group (LAG) for a layer 2 fabric |
US20130064066A1 (en) | 2011-09-12 | 2013-03-14 | International Business Machines Corporation | Updating a switch software image in a distributed fabric protocol (dfp) switching network |
US8767529B2 (en) | 2011-09-12 | 2014-07-01 | International Business Machines Corporation | High availability distributed fabric protocol (DFP) switching network architecture |
US20130077530A1 (en) * | 2011-09-28 | 2013-03-28 | Cisco Technology, Inc. | Scaling IPv6 on Multiple Devices Virtual Switching System with Port or Device Level Aggregation |
US8750129B2 (en) | 2011-10-06 | 2014-06-10 | International Business Machines Corporation | Credit-based network congestion management |
US9065745B2 (en) | 2011-10-06 | 2015-06-23 | International Business Machines Corporation | Network traffic distribution |
US8713169B2 (en) | 2011-10-11 | 2014-04-29 | Cisco Technology, Inc. | Distributed IPv6 neighbor discovery for large datacenter switching systems |
US9059868B2 (en) * | 2012-06-28 | 2015-06-16 | Dell Products, Lp | System and method for associating VLANs with virtual switch ports |
US9727386B2 (en) * | 2012-10-12 | 2017-08-08 | Futurewei Technologies, Inc. | Method and apparatus for network resource virtual partitioning |
US9166869B2 (en) * | 2013-01-14 | 2015-10-20 | International Business Machines Corporation | Management of distributed network switching cluster |
US9407500B2 (en) * | 2013-01-25 | 2016-08-02 | Dell Products L.P. | System and method for determining the configuration of switches in virtual link trunking environments |
US10616049B2 (en) * | 2013-01-25 | 2020-04-07 | Dell Products, L.P. | System and method for determining the configuration of switches in virtual link trunking environments |
US9083611B2 (en) * | 2013-02-21 | 2015-07-14 | Oracle International Corporation | Method and system for virtual network interface cards (VNICs) over aggregation spanning multiple switches |
US9647849B2 (en) * | 2013-03-05 | 2017-05-09 | Cisco Technology, Inc. | “Slow-start” problem in data center networks and a potential solution |
US9277452B1 (en) * | 2013-03-07 | 2016-03-01 | Dragonwave, Inc. | Adaptive modulation and priority-based flow control in wireless communications |
US9258253B2 (en) * | 2013-05-14 | 2016-02-09 | Dell Products L.P. | System and method for flexible switching fabric |
CN104253729B (zh) * | 2013-06-28 | 2017-12-29 | 施耐德电器工业公司 | 主从设备间通过寄存器接口传递数据的方法 |
US9325617B2 (en) | 2013-12-09 | 2016-04-26 | International Business Machines Corporation | Overlay capabilities exchange using DCBX |
CN104734986B (zh) * | 2013-12-19 | 2018-12-25 | 华为技术有限公司 | 一种报文转发方法和装置 |
CN103746927B (zh) * | 2013-12-27 | 2017-02-15 | 杭州华为数字技术有限公司 | 基于优先级的流控pfc方法及发送设备、接收设备 |
CN104852869B (zh) * | 2014-02-14 | 2018-07-24 | 新华三技术有限公司 | 一种端口聚合方法及装置 |
US9306865B2 (en) * | 2014-03-12 | 2016-04-05 | Oracle International Corporation | Virtual port mappings for non-blocking behavior among physical ports |
CN104410577B (zh) * | 2014-11-05 | 2018-04-06 | 新华三技术有限公司 | 一种广播报文的传输方法和设备 |
US10135670B2 (en) * | 2014-12-22 | 2018-11-20 | Hewlett Packard Enterprise Development Lp | Response to an inoperative network device managed by a controller |
CN106330782B (zh) * | 2015-06-30 | 2020-06-26 | 中兴通讯股份有限公司 | 端口容量分配方法及装置、交换机业务板卡 |
US10243914B2 (en) * | 2015-07-15 | 2019-03-26 | Nicira, Inc. | Managing link aggregation traffic in edge nodes |
US10462020B2 (en) * | 2017-02-16 | 2019-10-29 | Cisco Technology, Inc. | Network device user interface |
CN107864099B (zh) * | 2017-10-23 | 2020-11-06 | 中国科学院空间应用工程与技术中心 | 一种异构fc网络的流量控制方法及系统 |
US11005778B1 (en) * | 2018-08-23 | 2021-05-11 | Marvell Israel (M.I.S.L) Ltd. | Priority flow control in a distributed network switch architecture |
CN109347908B (zh) * | 2018-09-06 | 2021-10-08 | 东莞中子科学中心 | 分布式异构计算的数据访问方法 |
US10630606B1 (en) | 2019-03-18 | 2020-04-21 | Brightways Corporation | System, method and architecture for data center network switching |
US11381512B1 (en) * | 2019-12-10 | 2022-07-05 | Cisco Technology, Inc. | Priority-based flow control messaging for port extender |
CN111343043B (zh) * | 2020-02-06 | 2022-07-26 | 中国科学院国家空间科学中心 | 一种深空通信网络仿真验证平台构建方法 |
JP7437197B2 (ja) * | 2020-03-16 | 2024-02-22 | 住友電気工業株式会社 | スイッチ装置、車載通信システムおよび通信方法 |
US11894948B2 (en) | 2020-04-02 | 2024-02-06 | PrimeWan Limited | Method of forming a virtual network |
US11245645B2 (en) | 2020-04-02 | 2022-02-08 | PrimeWan Limited | Virtual network device |
US11362865B2 (en) * | 2020-04-02 | 2022-06-14 | PrimeWan Limited | Virtual network |
US11223569B2 (en) * | 2020-04-02 | 2022-01-11 | PrimeWan Limited | Device, method, and system that virtualize a network |
CN113297116A (zh) * | 2020-04-08 | 2021-08-24 | 阿里巴巴集团控股有限公司 | 信息配置方法、端口访问方法、设备及存储介质 |
CN113300984B (zh) * | 2020-04-08 | 2022-09-13 | 阿里巴巴集团控股有限公司 | 通信方法、设备、系统及存储介质 |
US12068979B2 (en) * | 2020-05-01 | 2024-08-20 | EMC IP Holding Company, LLC | System and method for dividing a physical ethernet port |
KR102314880B1 (ko) * | 2021-05-10 | 2021-10-19 | 농업회사법인 유한회사 더자람 | 슬레이브 채널의 자유로운 확장이 가능한 스마트팜 제어 시스템 |
US12010028B1 (en) * | 2023-05-17 | 2024-06-11 | Huawei Technologies Co., Ltd. | Method and apparatus for proactively forming flowlets for a flow in communication network |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1777143A (zh) * | 2004-10-25 | 2006-05-24 | 阿尔卡特公司 | 使用分布式网络处理的数据交换机中的内部负载平衡 |
WO2006103168A1 (en) * | 2005-04-01 | 2006-10-05 | International Business Machines Corporation | Network communications for operating system partitions |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5394402A (en) | 1993-06-17 | 1995-02-28 | Ascom Timeplex Trading Ag | Hub for segmented virtual local area network with shared media access |
US5617421A (en) | 1994-06-17 | 1997-04-01 | Cisco Systems, Inc. | Extended domain computer network using standard links |
US6035105A (en) | 1996-01-02 | 2000-03-07 | Cisco Technology, Inc. | Multiple VLAN architecture system |
US5742604A (en) | 1996-03-28 | 1998-04-21 | Cisco Systems, Inc. | Interswitch link mechanism for connecting high-performance network switches |
US6567403B1 (en) | 1998-04-30 | 2003-05-20 | Hewlett-Packard Development Company, L.P. | Virtual-chassis switch network topology |
US6901452B1 (en) * | 2000-03-02 | 2005-05-31 | Alcatel | Selectable prioritization for data communication switch |
KR100472416B1 (ko) | 2002-11-01 | 2005-03-11 | 삼성전자주식회사 | 패킷 플로우 제어 장치 및 방법 |
JP4257151B2 (ja) * | 2003-02-28 | 2009-04-22 | 富士通株式会社 | パケット制御システム、パケット制御装置、パケット中継装置およびパケット制御プログラム |
JP2007507990A (ja) | 2003-10-14 | 2007-03-29 | ラプター・ネツトワークス・テクノロジー・インコーポレイテツド | 分散スイッチング構造を備えるスイッチングシステム |
CN101087238B (zh) | 2003-10-21 | 2010-08-04 | 华为技术有限公司 | 无源光网络的动态带宽分配装置及方法 |
JP3954007B2 (ja) * | 2003-11-13 | 2007-08-08 | アンリツ株式会社 | 拡張中継システム及び中継装置 |
US7593320B1 (en) | 2004-04-30 | 2009-09-22 | Marvell International, Ltd. | Failover scheme for stackable network switches |
CN100486216C (zh) | 2005-07-15 | 2009-05-06 | 华为技术有限公司 | 一种提高虚拟交换系统中传输可靠性的方法 |
JP4688686B2 (ja) * | 2006-02-02 | 2011-05-25 | 株式会社日立製作所 | 管理装置及びネットワークシステム |
CN100571249C (zh) | 2006-02-27 | 2009-12-16 | 中兴通讯股份有限公司 | 一种实时确定传输的以太网通讯方法 |
JP4888186B2 (ja) | 2007-03-28 | 2012-02-29 | 富士通株式会社 | 通信システム、中継器、中継方法 |
US8625592B2 (en) | 2008-02-26 | 2014-01-07 | Cisco Technology, Inc. | Blade switch with scalable interfaces |
US8385202B2 (en) * | 2008-08-27 | 2013-02-26 | Cisco Technology, Inc. | Virtual switch quality of service for virtual machines |
US9426095B2 (en) * | 2008-08-28 | 2016-08-23 | International Business Machines Corporation | Apparatus and method of switching packets between virtual ports |
US8238340B2 (en) * | 2009-03-06 | 2012-08-07 | Futurewei Technologies, Inc. | Transport multiplexer—mechanisms to force ethernet traffic from one domain to be switched in a different (external) domain |
US8174984B2 (en) * | 2009-05-29 | 2012-05-08 | Oracle America, Inc. | Managing traffic on virtualized lanes between a network switch and a virtual machine |
US8638799B2 (en) * | 2009-07-10 | 2014-01-28 | Hewlett-Packard Development Company, L.P. | Establishing network quality of service for a virtual machine |
US9031081B2 (en) | 2009-08-06 | 2015-05-12 | Broadcom Corporation | Method and system for switching in a virtualized platform |
US8665747B2 (en) * | 2009-12-03 | 2014-03-04 | Cisco Technology, Inc. | Preventing loops on network topologies built with virtual switches and VMS |
US8837499B2 (en) * | 2011-05-14 | 2014-09-16 | International Business Machines Corporation | Distributed fabric protocol (DFP) switching network architecture |
US20120287785A1 (en) * | 2011-05-14 | 2012-11-15 | International Business Machines Corporation | Data traffic handling in a distributed fabric protocol (dfp) switching network architecture |
US8588224B2 (en) * | 2011-05-14 | 2013-11-19 | International Business Machines Corporation | Priority based flow control in a distributed fabric protocol (DFP) switching network architecture |
US8767529B2 (en) * | 2011-09-12 | 2014-07-01 | International Business Machines Corporation | High availability distributed fabric protocol (DFP) switching network architecture |
-
2011
- 2011-05-14 US US13/107,893 patent/US8588224B2/en not_active Expired - Fee Related
-
2012
- 2012-04-12 CN CN201280023756.7A patent/CN103534989B/zh not_active Expired - Fee Related
- 2012-04-12 GB GB1320499.5A patent/GB2504443A/en not_active Withdrawn
- 2012-04-12 JP JP2013538321A patent/JP5497244B2/ja not_active Expired - Fee Related
- 2012-04-12 WO PCT/IB2012/051803 patent/WO2012156832A1/en active Application Filing
- 2012-04-12 CA CA2833681A patent/CA2833681C/en active Active
- 2012-04-12 DE DE112012001320.4T patent/DE112012001320B4/de active Active
- 2012-04-12 KR KR1020137028257A patent/KR101507675B1/ko active IP Right Grant
- 2012-05-16 US US13/472,964 patent/US8594082B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1777143A (zh) * | 2004-10-25 | 2006-05-24 | 阿尔卡特公司 | 使用分布式网络处理的数据交换机中的内部负载平衡 |
WO2006103168A1 (en) * | 2005-04-01 | 2006-10-05 | International Business Machines Corporation | Network communications for operating system partitions |
Also Published As
Publication number | Publication date |
---|---|
GB201320499D0 (en) | 2014-01-01 |
US20120287786A1 (en) | 2012-11-15 |
GB2504443A (en) | 2014-01-29 |
CA2833681A1 (en) | 2012-11-22 |
KR101507675B1 (ko) | 2015-03-31 |
WO2012156832A1 (en) | 2012-11-22 |
DE112012001320B4 (de) | 2020-04-23 |
JP5497244B2 (ja) | 2014-05-21 |
KR20140002013A (ko) | 2014-01-07 |
DE112012001320T5 (de) | 2014-01-02 |
US8588224B2 (en) | 2013-11-19 |
JP2014502089A (ja) | 2014-01-23 |
CN103534989A (zh) | 2014-01-22 |
CA2833681C (en) | 2019-05-07 |
DE112012001320T8 (de) | 2014-01-30 |
US20120287787A1 (en) | 2012-11-15 |
US8594082B2 (en) | 2013-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103534989B (zh) | 在分布式结构协议(dfp)交换网络架构中的基于优先级的流控制 | |
CN103534998A (zh) | 分布式结构协议(dfp)交换网络架构 | |
US8797843B2 (en) | High availability distributed fabric protocol (DFP) switching network architecture | |
CN102821038A (zh) | 交换网络架构中的数据业务处理方法和系统 | |
CN104272684B (zh) | Fabric交换机中的动态服务插入 | |
CN103888369B (zh) | 以太网通信方法、系统和sdn交换机 | |
US10129182B2 (en) | Methods and apparatus for providing services in distributed switch | |
CN104081692B (zh) | 用于FCoE融合结构的网络设备、方法和装置 | |
EP2680536B1 (en) | Methods and apparatus for providing services in a distributed switch | |
CN104303467A (zh) | 集成的异构的软件定义的网络 | |
CN104247341B (zh) | 分布式交换机及其多播树层次结构的动态优化方法 | |
CN103916326A (zh) | 用于数据中心的系统、方法以及设备 | |
CN106027428A (zh) | 动态资源管理方法 | |
CN110298381A (zh) | 一种云安全服务功能树网络入侵检测系统 | |
US9154371B1 (en) | Methods and apparatus for efficient use of link aggregation groups | |
WO2013140507A1 (ja) | ネットワーク集約装置、ネットワーク集約方法およびネットワーク集約システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160817 |