CN103534997B - 用于无损耗以太网的基于端口和优先级的流控制机制 - Google Patents

用于无损耗以太网的基于端口和优先级的流控制机制 Download PDF

Info

Publication number
CN103534997B
CN103534997B CN201280020181.3A CN201280020181A CN103534997B CN 103534997 B CN103534997 B CN 103534997B CN 201280020181 A CN201280020181 A CN 201280020181A CN 103534997 B CN103534997 B CN 103534997B
Authority
CN
China
Prior art keywords
port
terminaloriented
queue
priority
edge switch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201280020181.3A
Other languages
English (en)
Other versions
CN103534997A (zh
Inventor
熊义君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN103534997A publication Critical patent/CN103534997A/zh
Application granted granted Critical
Publication of CN103534997B publication Critical patent/CN103534997B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/55Prevention, detection or correction of errors
    • H04L49/552Prevention, detection or correction of errors by ensuring the integrity of packets received through redundant connections
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/26Flow control; Congestion control using explicit feedback to the source, e.g. choke packets
    • H04L47/266Stopping or restarting the source, e.g. X-on or X-off
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/50Queue scheduling
    • H04L47/62Queue scheduling characterised by scheduling criteria
    • H04L47/6295Queue scheduling characterised by scheduling criteria using multiple queues, one for each individual QoS, connection, flow or priority
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/35Switches specially adapted for specific applications
    • H04L49/356Switches specially adapted for specific applications for storage area networks
    • H04L49/357Fibre channel switches
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/50Overload detection or protection within a single switching element
    • H04L49/505Corrective measures
    • H04L49/506Backpressure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/54Store-and-forward switching systems 
    • H04L12/56Packet switching systems
    • H04L12/5601Transfer mode dependent, e.g. ATM
    • H04L2012/5629Admission control
    • H04L2012/5631Resource management and allocation
    • H04L2012/5632Bandwidth allocation
    • H04L2012/5635Backpressure, e.g. for ABR
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/35Switches specially adapted for specific applications
    • H04L49/351Switches specially adapted for specific applications for local area network [LAN], e.g. Ethernet switches

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Small-Scale Networks (AREA)

Abstract

一种包括聚合/核心交换机的设备,所述聚合/核心交换机用于耦合到边缘交换机并接收与所述边缘交换机的多个面向终端系统的端口相关的信息,其中与所述面向终端系统的端口相关的信息用于使所述面向终端系统的端口与所述聚合/核心交换机处的多个对应队列相关联。还揭示了一种网络组件,所述网络组件包括:接收器,其用于接收与边缘交换机的多个面向终端系统的端口相关的信息;处理器,其用于为所述面向终端系统的端口建立多个对应队列并使所述面向终端系统的端口与所述多个对应队列相关联;以及发射器,其用于返回与相关联的面向终端系统的端口相关的信息。

Description

用于无损耗以太网的基于端口和优先级的流控制机制
相关申请案的交叉参考
本发明要求2011年12月23日递交的发明名称为“用于无损耗以太网的基于端口和优先级的流控制机制(Port and Priority Based Flow Control Mechanism forLossless Ethernet)”的第13/336,260号非美国临时专利申请案(Non-U.S.ProvisionalPatent Application13/336,260)的在先申请优先权,并且要求熊(Y.Xiong)在2011年4月29日递交的发明名称为“对以太网承载光纤通道进行集中控制和管理的方法和系统(Method and System of Centralized Control and Management for Fiber Channelover Ethernet Networks)”的第61/480,671号美国临时专利申请案的在先申请优先权,这两项在先申请的内容以引入的方式并入本文本中,如同全文转载一般。
关于联邦政府所资助的研发的声明
不适用。
参考缩微胶片附录
不适用。
技术领域
背景技术
以太网承载光纤通道(Fiber Channel over Ethernet,FCoE)是一项用于经由以太网传输光纤通道(FC)帧的技术,该项技术当前正在通过国际信息技术标准委员会(INCITS)的光纤通道技术委员会(T11)实现标准化。所传输FC帧的使用是基于用于存储组网(storage networking)的FC架构。FCoE技术在不改变FC成帧(FC-2)层和较高层的情况下,采用以太网架构的以太网物理层和媒体接入控制(MAC)层来替代FC架构的FC物理(FC-0)层和FC编码(FC-1)层。通过使用FCoE技术,FC帧和标准以太网帧可在网络中独立传输。因此,FC帧映射到以太网帧上,并且随后在以太网链路上发射,这样能在基于FC的网络与基于以太网的网络之间实现大体上无缝的集成。FCoE技术可用于基于FC的存储区域网络(SAN)的服务器输入/输出(I/O)合并,并且有可能用于为基于以太网的数据中心建立统一的网络基础设施,其中所述基于FC的存储区域网络(SAN)在企业数据中心内得到广泛使用。
发明内容
在一个实施例中,本发明包含一种包括聚合/核心交换机的设备,所述聚合/核心交换机用于耦合到边缘交换机并接收与所述边缘交换机的多个面向终端系统的端口相关的信息,其中与所述面向终端系统的端口相关的信息用于使所述面向终端系统的端口与所述聚合/核心交换机处的多个对应队列相关联。
在另一个实施例中,本发明包含一种网络组件,所述网络组件包括:接收器,其用于接收与边缘交换机的多个面向终端系统的端口相关的信息;处理器,其用于为所述面向终端系统的端口建立多个对应队列并使所述面向终端系统的端口与所述多个对应队列相关联;以及发射器,其用于返回与相关联的面向终端系统的端口相关的信息。
在另一种实施例中,本发明包含一种由网络组件实施的方法,所述方法包括:从数据中心内的边缘交换机接收与所述边缘交换机的多个面向终端系统的端口相关的信息;以及使耦合到所述边缘交换机的聚合/核心交换机处的多个数据转发队列与所述边缘交换机的面向终端系统的端口相关联。
在又一个实施例中,本发明包含一种包括边缘交换机的设备,所述边缘交换机包括多个面向终端系统的端口,并且用于经由所述面向终端系统的端口而耦合到多个终端系统且耦合到聚合/核心交换机,并且用于将与所述面向终端系统的端口有关的信息发送到所述聚合/核心交换机,其中与面向终端系统的端口相关的信息用于使面向终端系统的端口与聚合/核心交换机处的多个对应队列相关联。
从结合附图和权利要求书进行的以下详细描述中将更清楚地理解这些和其他特征。
附图说明
为了更完整地理解本发明,现在参考以下结合附图和具体实施方式进行的简要描述,其中相同参考标号表示相同部分。
图1是基于优先级的流控制(PFC)系统的一个实施例的示意图。
图2是基于优先级和端口的流控制(PPFC)系统的一个实施例的示意图。
图3是队列关联方案的一个实施例的示意图。
图4是队列关联方案的另一个实施例的示意图。
图5是队列关联方案的另一个实施例的示意图。
图6是队列关联方案的另一个实施例的示意图。
图7是队列关联方案的另一个实施例的示意图。
图8为PPFC队列缩放架构的另一个实施例的示意图。
图9是PPFC包数据单元(PDU)的一个实施例的示意图。
图10是PPFC方法的一个实施例的流程图。
图11是网络单元的一个实施例的示意图。
图12是通用计算机系统的一个实施例的示意图。
具体实施方式
首先应理解,尽管下文提供一个或多个实施例的说明性实施方案,但所揭示的系统和/或方法可使用任何数目的技术来实施,无论该技术是当前已知还是现有的。本发明决不应限于下文所说明的说明性实施方案、附图和技术,包含本文本所说明并描述的示例性设计和实施方案,而是可在所附权利要求书的范围以及其等效物的完整范围内进行修改。
在包交换网络(packet switched network)中,可能因业务拥塞而引起交换机缓冲区溢流,因此可能发生丢包。一些网络业务,例如,使用FCoE的FC业务,不能容许任何实质性的丢包。为了支持此类业务,例如,在以太网中支持,提出了PFC以保证无损耗的包通信,这在以下标准中有所描述,即,电气和电子工程师协会(IEEE)P802.1Qbb/D2.3标准,2010年5月25日,标题为“基于优先级的流控制(Priority-based Flow Control)”,该标准的内容以引入的方式并入本文本中。图1图示了可在数据中心内使用的PFC系统100的一个实施例。PFC系统100可包括:一个或多个聚合/核心交换机110,耦合到聚合/核心交换机110的至少一个边缘交换机120,以及耦合到边缘交换机120的多个终端系统130。PFC系统100的组件可如图1所示进行布置。
聚合/核心交换机110和边缘交换机120可以是用于以包或帧的形式传送以太网数据等数据中心内数据的任何网络组件或节点。聚合/核心交换机110和边缘交换机120可基于因特网协议(IP)地址和/或MAC地址等网络地址将数据转发到数据中心内的目的组件,其中所述网络地址可在数据中指示出来。还可使用转发表来转发数据,例如,保存在聚合/核心交换机110以及边缘交换机120中的转发表。边缘交换机120可对应于数据中心内的机柜顶部(top-of-rack,TOR)交换机。终端系统130可以是经耦合且经配置以与服务器和/或存储装置等数据中心交换数据的任何系统、组件或节点。
每个聚合/核心交换机110可包括用于不同优先级业务的多个队列(例如,用于高优先级业务Q(Hi)的队列以及用于低优先级业务Q(Lo)的队列)。所述队列可位于聚合/核心交换机110中的数据缓冲区(未示出)中。每个聚合/核心交换机110中的每个端口的队列数目可大致相同(例如,如果支持两个业务优先级,那么每个聚合/核心交换机110中的每个端口具有约两个队列)。每个聚合/核心交换机110还可包括可经由调度程序(S)耦合到所述队列的输出或传出(outgoing)端口112(标签为TX)。
边缘交换机120可包括:一个或多个入端口122(标签为RX);耦合到每个入端口122的内部交换逻辑单元123;包分类单元124、队列和缓冲区管理单元125以及数据缓冲区126,以上各者均耦合到内部交换逻辑单元123;以及耦合到数据缓冲区126的一个或多个出端口128(标签为TX)。入端口122中的每一者可耦合到聚合/核心交换机110中的一者,并且出端口128中的每一者可耦合到终端系统130中的一者。边缘交换机120中入端口122的数目可与出端口128的数目相同或不同。边缘交换机120的组件可如图1所示进行布置。
每个入端口122可经由聚合/核心交换机110的传出端口112耦合到聚合/核心交换机110中的一者,并且可用于从对应聚合/核心交换机110接收数据(例如,包)。内部交换逻辑单元123、包分类单元124以及队列和缓冲区管理单元125可彼此通信以确定:在入端口122中接收的包中哪个包需要发送,以及所述需要发送的包将发送到数据缓冲区126中多个队列中的哪个队列。包分类单元124可例如通过使用包中的数据来确定所接收包的优先级(例如,高优先级或低优先级)以及出端口。队列和缓冲区管理单元125可确定数据缓冲区126中适于接收由包分类单元124进行分类的包的队列。内部交换逻辑单元123可按照队列和缓冲区管理单元125的指示,将包从入端口122交换到数据缓冲区126中的合适队列。数据缓冲区126可包括多个队列(例如,Q1、...、Qk、...、Qn,其中k和n是整数并且k<n),这些队列可耦合到对应出端口128(例如,TX1、...、TXk、...、TXn)。
每个出端口128可与数据缓冲区126中可具有不同优先级(例如,低(Lo)和高(Hi)优先级)的至少两个对应队列耦合并关联。每个出端口128可耦合到单独的一组队列(例如,针对低优先级包和高优先级包的约两个队列)。耦合到同一出端口128的队列的业务可由对应调度程序(S)来调度,所述对应调度程序(S)位于组中队列与相关联出端口128之间。指配给每个出端口128的队列的数目可与指配给其他TX128的队列的数目大致相同(例如,约两个队列)。每个TX128可将接收自队列的包转发到一个对应终端系统130。终端系统130可接收并使用来自出端口128的数据。从聚合/核心交换机110发送到边缘交换机120并且随后发送到对应终端系统130的数据或包据称是在下游方向上进行转发。边缘交换机120还可在上游方向上转发数据或包,即从终端系统130转发到聚合/核心交换机110(未示出)。
在一些情况下,业务拥塞可能在边缘交换机120中发生,例如,在下游方向上发生,即从聚合/核心交换机110中任一者到边缘交换机120。当边缘交换机120与转发聚合/核心交换机(forwarding aggregation/core switch)110之间的链路带宽可能实质上大于边缘交换机120与接收终端系统(receiving end system)130之间的链路带宽时,则可能发生这种拥塞,至少会在局部发生。通常,数据缓冲区126的内存或存储容量可能实质上小于聚合/核心交换机110的内存或存储容量,这归因于,例如,对边缘交换机120的以下约束:较高端口密度、较小物理大小(例如,约一到两个机柜单元)和/或较低成本。在运载不容许实质性丢包的FC业务的情况下,如果边缘交换机120中发生业务拥塞,那么可将反压(backpressure)请求发送到转发聚合/核心交换机110。反压请求可使聚合/核心交换机110拖延包的转发,并因此避免FCoE丢包。
此反压程序可在PFC系统100中使用并且可保证无损耗的包通信。然而,在某些情况下,拖延或阻塞(blocking)聚合/核心交换机110中的包可能使转发聚合/核心交换机110发生队头(head-of-line,HOL)阻塞。HOL阻塞是以下状况:响应于来自边缘交换机120的反压请求,所述反压请求针对一个(或多个)出端口但非全部出端口,聚合/核心交换机110停止将某一优先级上的业务发送到边缘交换机120处的所有出端口。当边缘交换机120判定高优先级队列Q1(Hi)以及对应出端口(TX1)符合在入端口122或出端口128处声明反压的标准时,便可能发生HOL阻塞。在此情况下,边缘交换机120可使用PFC帧将针对业务Hi的反压请求发送到对应聚合/核心交换机110(例如,图1中的聚合/核心交换机A)。因此,聚合/核心交换机110一旦从边缘交换机120接收到所述PFC帧,便可停止将高优先级包从Q(Hi)发送到边缘交换机120。即使Q(Hi)中存在指定给边缘交换机120中可能未发生业务拥塞的其他出端口(例如,TXk或TXn)的高优先级包,聚合/核心交换机110也可停止包的发送。由于发送到其他未经历拥塞的出端口的业务也停止或被阻塞,这称作HOL阻塞,因此PFC方案不能有效地控制拥塞的业务,例如,在不使数据中心内的其他非拥塞业务进一步产生不必要延迟的情况下进行控制。
本文本中揭示了一种用于实施PPFC方案的系统和方法,所述系统和方法可解决HOL阻塞问题,例如,因使用PFC方案而引起的HOL阻塞问题。在PPFC方案中,聚合/核心交换机可获得与耦合到聚合/核心交换机的边缘交换机的出端口相关的信息。聚合/核心交换机还可获得出端口可到达的(终端系统的)地址。此类信息可通过使用FCoE系统的FCoE初始化协议(FIP)来获得。基于此信息,聚合/核心交换机可建立多个队列,例如,针对同一业务优先级的队列,所述队列对应于边缘交换机的多个出端口。边缘交换机还可在反压请求中向聚合/核心交换机指示所述出端口和优先级。因此,聚合/核心交换机可仅仅阻塞与所指示出端口和优先级相关联的队列,并允许其他队列将业务发送到其他出端口。PPFC方案在FcoE等要求业务无损耗的系统中具有优势。
图2图示了PPFC系统200的一个实施例,PPFC系统200可在不引起(转发聚合/核心交换机所发生的)HOL阻塞的情况下支持数据中心内的无损耗业务。PPFC系统200可包括:一个或多个聚合/核心交换机210,耦合到聚合/核心交换机210的至少一个边缘交换机220,以及耦合到边缘交换机220的多个终端系统230。PFC系统200的组件可如图2所示进行布置。边缘交换机220和终端系统230的配置大体上可分别类似于边缘交换机120和终端系统130。
边缘交换机220可包括:一个或多个入端口222(标签为RX);耦合到每个入端口222的内部交换逻辑单元223;包分类单元224、队列和缓冲区管理单元225以及数据缓冲区226,以上各者均耦合到内部交换逻辑单元223;以及耦合到数据缓冲区126的一个或多个出端口228(标签为TX)。入端口222中的每一者可耦合到聚合/核心交换机210中的一者,并且出端口228中的每一者可耦合到终端系统230中的一者。边缘交换机220可包括n个出端口228(面向终端系统230的下游端口)以及m个入端口222(面向聚合/核心交换机210的上游端口),其中n和m为相等的或不等的整数。边缘交换机220的组件可配置成大体类似于边缘交换机120的对应组件,并且可如图2所示进行布置。
聚合/核心交换机210可配置成类似于聚合/核心交换机110。每个聚合/核心交换机210可包括针对不同优先级业务的多个队列(针对高优先级业务和低优先级业务的队列)。所述队列可位于聚合/核心交换机210中的数据缓冲区(未示出)中。然而,不同于聚合/核心交换机110,聚合/核心交换机210可在每个端口处包括针对高优先级业务(PQ1(Hi)、...、PQi(Hi)、...、PQn(Hi),i为整数并且i<n)的多个队列,所述多个队列对应于边缘交换机220处的不同出端口228(例如,TX1、...、TXk、...、TXn)。这样,聚合/核心交换机210中每个端口的高优先级队列数目可约等于出端口228的数目(并且约等于设定于数据缓冲区226中的相关联队列的数目)。另外,聚合/核心交换机210中的队列可包括针对低优先级业务Q(Lo)的队列。每个聚合/核心交换机210中的队列的总数目也可大致相同。每个聚合/核心交换机210还可包括传出或输出端口212(标签为TX),传出或输出端口212可经由一个或多个调度程序(S)耦合到本地队列,例如,以分级结构或树状拓扑的方式进行耦合,如图2中所示。
聚合/核心交换机210可执行从队列到输出端口212的分级调度。可在调度分级结构的每一级上使用不同调度算法或这些算法的组合,例如,在位于聚合/核心交换机210中的输出端口212与队列之间的不同级调度程序(S)(例如,两个调度程序)处使用。例如,可在每一优先级/服务种类(CoS)级上(例如,在两个调度程序S的每个调度程序处)使用加权赤字轮循(weighted deficit round-robin,WDRR)调度算法。也可在优先级/CoS内使用同一算法,例如,在直接耦合到高优先级队列(PQ1(Hi)、...、PQi(Hi)、...、PQn(Hi))的调度程序S中使用同一算法。
如上文所述,聚合/核心交换机210可具有分级结构,即不同级调度程序,例如,用于调度高(Hi)和低(Lo)两个业务优先级的约两个调度程序,如上文所述。低优先级业务能容许丢包,然而高优先级业务可以是无损耗的(不能容许丢包)。如上文所述,对于高优先级业务,聚合/核心交换机210可包括针对边缘交换机220中每个出端口228的队列。例如,待从聚合/核心交换机210发送到一个例如TXk的出端口228的具有高优先级的包,可发送到聚合/核心交换机210中的对应队列,例如,PQk(Hi)。当聚合/核心交换机210(例如,聚合/核心交换机A)接收到队列PQ1(Hi)的反压信息时,聚合/核心交换机210可停止对包进行调度以避免按下游方向将该包从PQ1(Hi)发送出去。聚合/核心交换机210可经由对应入端口222从边缘交换机220接收PPFC帧形式的反压信息。然而,聚合/核心交换机210可继续对包进行调度以从其他高优先级队列(例如,PQk(Hi),k=2、3、…、n)发送包,此类发送可不因PQ1(Hi)的反压而中止或不受PQ1(Hi)的反压的影响。因此,PPFC系统200可避免可能发生于PFC系统100中的HOL阻塞。
在不同实施例中,输入列队、输出列队、输入和输出列队、共享缓冲区输出列队或以上各者的组合所用的不同交换机架构可在边缘交换机220中使用。对于边缘交换机210,未设想特定的交换机架构和缓冲区管理方案。针对所接收的每个包,业务分类单元224可确定包优先级并(在边缘交换机210中)识别所接收包的队列。队列和缓冲区管理单元225可确定是否可将所接收包列队或丢弃所接收包,以及是否可以针对接收包的入端口222开始实施反压。尽管针对边缘交换机220未设想特定的缓冲区管理方案,但是,如果使用可在各边缘交换机间共用的共享缓冲区架构,那么数据缓冲区226中可存在针对每个优先级上的每个入端口222的一些专用内存,以防止由其他入端口222引起的内存缺少。数据缓冲区226中还可存在针对每个优先级上的每个出端口228的一些专用内存。数据缓冲区的内存的其余部分可在不同优先级间或给定优先级内的业务间共享(例如,在某种程度上共享),例如,根据所使用的缓冲区管理方案的决定来进行共享。
终端系统230可包括服务器、存储装置和/或其他客户端类型节点。例如,通过使用服务器虚拟化,每个终端系统230可包括至少两个虚拟服务器(未示出)。这样,为了实现上述PPFC方案,聚合/核心交换机210可能需要知道以下信息:边缘交换机220中面向终端系统的端口(出端口228)的数目、每个端口的ID以及每个终端系统230中可接收高优先级业务的的地址。所述地址可以是MAC地址、IP地址、FC N端口ID、其他类型的网络地址或以上各者的组合。聚合/核心交换机210可使用所获得的地址作为业务分类输入数据的一部分以确定在聚合/核心交换机210处接收的每个包所使用的队列。
聚合/核心交换机210可使用多种方法中的一种方法来获得上述信息。例如,在一个实施例中,边缘交换机220可用显式的方式将上述信息发送到聚合/核心交换机210。在另一个实施例中,聚合/核心交换机210可用其他方式得到上述信息。在又一个实施例中,上述信息可由不同于边缘交换机220的交换机或服务器传达至聚合/核心交换机210。或者,边缘交换机210可用显式的方式将面向终端系统的端口(出端口228)的信息发送到聚合/核心交换机210。然而,终端系统230中的地址可由单独的交换机或服务器传达至聚合/核心交换机210。下文将更详细地描述不同方法。
图3图示了队列关联方案(queue association scheme)300的一个实施例,队列关联方案300可用在PPFC系统中,例如,PPFC系统200。队列关联方案300可用于将面向终端系统的端口(例如,出端口228)的数目、每个终端系统(例如,终端系统230)中的地址发送到一个或多个相关联的聚合/核心交换机(例如,聚合/核心交换机210),并且可选择将边缘交换机(例如,边缘交换机220)中的其他相关信息发送到所述一个或多个相关联的聚合/核心交换机。聚合/核心交换机可使用所述信息来建立面向终端系统的端口的队列。具体而言,聚合/核心交换机可相当于FCoE交换机或FC转发器(FC Forwarder,FCF),并且边缘交换机可相当于FCoE交换机与终端系统之间的FCoE中继交换机或FIP侦听桥(FIP SnoopingBridge,FSB)。队列关联方案300可包括聚合/核心FCoE交换机310、FCoE中继交换机320以及终端节点(end node)(E节点)330,所包括的三者可分别对应于聚合/核心交换机210、边缘交换机220以及终端系统230。
队列关联方案300可用在FCoE网络中(例如,用在数据中心内),其中聚合/核心FCoE交换机310可用作FCF,例如,这在以下公开案中有所描述,即INCITS T11公开案,标题为“光纤通道中枢(FC-BB-5)(Fibre Channel Backbone(FC-BB-5))”,修订版2.0,2009年6月4日,该公开案的内容以引入的方式并入本文本中。FCoE业务可指配为高优先级。当E节点330执行针对E节点330中虚拟N端口(VN端口)的FIP结构注册(FIP fabric login)(FLOGI)请求时,聚合/核心FCoE交换机310(例如,FCF A)可在接收到FIP FLOGI请求之后创建虚拟F端口(VF端口)并创建队列(例如,PQk(Hi)),所述队列可对应于E节点的MAC地址(MACX)。聚合/核心FCoE交换机310还可将端口ID(N端口ID)(例如,Z)指配给VN端口,并将FIP FLOGILS-ACC(链路服务接受(Link Service Accept))回复发送到E节点MAC地址。
FCoE中继交换机320可以是FSB,所述FSB侦听在E节点330与聚合/核心FCoE交换机310之间交换的FIP消息,并且因此可知道,E节点MAC地址(MAX X)附接到FCoE中继交换机的出端口k。FCoE中继交换机320还可知道,具有N端口ID Z和MAC地址MAP||Z的VN端口驻留在E节点MAC X中,并且可经由FCoE中继交换机的端口k到达。FCoE中继交换机320还可知道,目的MAC(DMAC)是MAP||Z的业务来自聚合/核心FCoE交换机310。VN端口MAC地址可对应于MAC地址前缀(MAC Address Prefix,MAP)与N端口ID Z的级联。可使用对应于0E-FC-00h的默认MAP。针对随后经由E节点MAC X进行的VN端口结构注册,E节点330可使用FIP FDISC(发现F端口服务参数(Discover F_Port Service Parameter))请求。聚合/核心FCoE交换机310可使指配给E节点MAC X中的VN端口的所有N端口ID与队列PQk(Hi)相关联。例如,VN端口1的N端口ID Z1和VN端口2的N端口ID Z2均可与PQk(Hi)相关联。类似地,FCoE中继交换机320可使所有根据指配给E节点MAC X中的VN端口的N端口ID得到的MAC地址与队列Qk(Hi)相关联,队列Qk(Hi)反过来又可与FCoE中继交换机的出端口k相关联。
当聚合/核心FCoE交换机310接收包括目的ID(D-ID)Z的FCoE帧时,聚合/核心FCoE交换机310可将所述帧列入队列PQk(Hi)中,队列PQk(Hi)可与E节点MAC X相关联。当FCoE中继交换机320接收到DMAC为MAP||Z且具有高优先级的以太网帧时,FCoE中继交换机320可将所述帧列入队列Qk(Hi)中,其中所述帧可以是FCoE帧,所述队列Qk(Hi)可与出端口k相关联并因此与E节点MAC X相关联。如果FCoE中继交换机320决定针对指定给E节点MAC X的FCoE业务向聚合/核心FCoE交换机310实施反压,那么FCoE中继交换机320可向E节点MAC X发送PPFC帧,例如,指示端口ID长度为约六个八比特字节并且指示端口ID设定的PPFC帧。下文将更详细地描述所述PPFC帧。一旦接收到所述PPFC帧,聚合/核心FCoE交换机310便可使用E节点MAC X和高优先级作为索引而找到PQk(Hi),并因此停止对来自PQk(Hi)的帧的调度。
FCoE中继交换机320的出端口k和队列Qk(Hi)以及聚合/核心FCoE交换机310中的队列PQk(Hi)均可与E节点MAC X相关联。因此,FCoE中继交换机320不需要将有关出端口和/或队列的信息传达至聚合/核心FCoE交换机310。FCoE中继交换机320和聚合/核心FCoE交换机310可包括多个表,所述表使E节点MAC地址与端口ID、虚拟局域网ID(VID)和/或其他信息相关联。例如,FCoE中继交换机320可包括MAC转发表321,MAC转发表321可包括与对应VID、(FCoE中继交换机320处的)输出端口和/或队列ID(QID)相关联的一个或多个MAC地址。聚合/核心FCoE交换机310还可包括FC转发表311,FC转发表311可包括与(聚合/核心FCoE交换机310处的)对应输出端口、优先级、QID、下一跳MAC地址、VID或以上各者的组合相关联的一个或多个D-ID。
在队列关联方案300中,FCoE中继交换机320不需要将与面向终端系统的端口相关的信息发送到聚合/核心FCoE交换机310。然而,如果无需进行手动配置,那么可能需要数据中心桥接功能交换(Data Center Bridging Capabilities Exchange,DCBX)协议扩展来保证FCoE中继交换机320和聚合/核心FCoE交换机310均支持PPFC。DCBX协议在以下标准中有所描述,即IEEE P802.1Qaz/D2.5标准,2011年3月28日,标题为“针对业务种类间带宽共享的增强发射选择(Enhanced Transmission Selection for Bandwidth Sharing betweenTraffic Classes)”,所述标准的内容以引入的方式并入本文本中。
图4图示了另一个队列关联方案400的一个实施例,队列关联方案400可用在PPFC系统中,例如,PPFC系统200。队列关联方案400可用于将面向终端系统的端口(例如,出端口228)的数目、每个终端系统(例如,终端系统230)中的地址发送到一个或多个相关联的聚合/核心交换机(例如,聚合/核心交换机210),并且可选择将边缘交换机(例如,边缘交换机220)中的其他相关信息发送到所述一个或多个相关联的聚合/核心交换机。聚合/核心交换机可使用所述信息来建立面向终端系统的端口的队列。具体而言,聚合/核心交换机可相当于FCoE交换机或FCF,并且边缘交换机可相当于FCoE交换机与终端系统之间的N端口标识符虚拟化(NPIV)网关。队列关联方案400可包括聚合/核心FCoE交换机410、NPIV网关420以及E节点430,所包括的三者可分别对应于聚合/核心交换机210、边缘交换机220以及E节点230。
队列关联方案400可用在FCoE网络中(例如,用在数据中心内),其中聚合/核心FCoE交换机410可用作FCF。在NPIV网关420中,面向E节点的端口k可相当于针对E节点430的FCF-MAC,并且面向FCF的端口n+1可相当于针对聚合/核心FCoE交换机410(FCF A)的E节点。NPIV网关420可停止接收来自E节点430的FIP帧,并且可重新生成待发送到聚合/核心FCoE交换机410的FIP帧。NPIV网关420可在相反方向上(从聚合/核心FCoE交换机410到E节点430)实施同一方案。
当NPIV网关420在端口k处从E节点430接收到FIP FLOGI请求时,NPIV网关420可创建VF端口和队列(例如,Qk(Hi)),所述VF端口和队列可对应于端口k以及E节点430的E节点MAC X。NPIV网关420随后可将新FIP FDISC请求发送到聚合/核心FCoE交换机410(FCF A)。新FIP FDISC请求可包括与E节点430的原始E节点MAC X相关的信息。聚合/核心FCoE交换机410对FIP FDISC请求进行处理时可类似于如上文所述的聚合/核心FCoE交换机310。然而,聚合/核心FCoE交换机410可使用(E节点430处的)原始E节点MAC X而非(NPIV网关420处的)真实E节点MAC N2,使得地址与队列PQk(Hi)和N端口ID Z相关联。对于E节点430中的不同端口,可重复同一过程。例如,VN端口1的N端口ID Z1和VN端口2的N端口ID Z2均可与PQk(Hi)相关联。一旦从聚合/核心FCoE交换机410接收到FIP FDISC LS-ACC回复,NPIV网关420便可使VN端口MAC地址(=MAP||Z)与出端口k相关联(当NPIV网关420从端口k接收FIP FLOGI请求时),并因此与Qk(Hi)和E节点MAC X相关联。
当NPIV网关420决定针对指定给E节点MAC X(例如,指定给队列Qk(Hi))的业务向聚合/核心FCoE交换机410实施反压时,NPIV网关420可向原始E节点MAC X发送PPFC帧,例如,指示端口ID长度为约六个八比特字节并且指示端口ID设定的PPFC帧。一旦接收到所述PPFC帧,聚合/核心FCoE交换机410便可使用E节点MAC X和高优先级作为索引而找到PQk(Hi),并停止对来自该队列的包的调度。在队列关联方案400中,NPIV网关420不需要将与面向E节点的端口相关的信息发送到聚合/核心FCoE交换机410。然而,如果无需进行手动配置,那么可能需要DCBX协议扩展来保证NPIV网关420和聚合/核心FCoE交换机410均支持PPFC。此外,聚合/核心FCoE交换机410还可包括FC转发表(未示出),例如,类似于FC转发表311的FC转发表,并且NPIV网关420也可包括FC转发表。
图5图示了另一个队列关联方案500的一个实施例,队列关联方案500可用在PPFC系统中,例如,PPFC系统200。队列关联方案500可用于将面向终端系统的端口(例如,出端口228)的数目、每个终端系统(例如,终端系统230)中的地址发送到一个或多个相关联的聚合/核心交换机(例如,聚合/核心交换机210),并且可选择将边缘交换机(例如,边缘交换机220)中的其他相关信息发送到所述一个或多个相关联的聚合/核心交换机。聚合/核心交换机可使用所述信息来建立面向终端系统的端口的队列。具体而言,聚合/核心交换机可相当于FCoE交换机或FCF,并且边缘交换机可相当于FCoE交换机与终端系统之间的FCoE数据转发器(FDF)。队列关联方案500可包括聚合/核心FCoE交换机510、FDF520以及E节点530,所包括的三者可分别对应于聚合/核心交换机210、边缘交换机220以及终端系统230。
队列关联方案500可类似于队列关联方案400。然而,FDF520可停止接收来自E节点530的FIP帧并且它不需要将与面向E节点的端口相关的信息发送到聚合/核心FCoE交换机510。DCBX协议扩展也可应用于队列关联方案500。不同于NPIV网关420,FDF520不能重新生成待发送到聚合/核心FCoE交换机510的FIP帧。事实上,FDF520可将N端口ID分配请求发送到聚合/核心FCoE交换机510,所述N端口ID分配请求可包括与队列关联方案400中的FIP帧类似的信息。聚合/核心FCoE交换机510可返回N端口ID以及分区访问控制列表(ACL)分布信息,所返回的信息类似于上文所述的FIP FLOGI LS-ACC信息。聚合/核心FCoE交换机510还可包括FC转发表(未示出),例如,类似于FC转发表311的FC转发表,并且FDF520还可包括MAC转发表。
在队列关联方案500中,FDF520不需要将与面向E节点的端口相关的信息发送到聚合/核心FCoE交换机510。然而,如果无需进行手动配置,那么可能需要DCBX协议扩展来保证FDF520和聚合/核心FCoE交换机510均支持PPFC。
图6图示了另一个队列关联方案600的一个实施例,队列关联方案600可用在PPFC系统中,例如,PPFC系统200。队列关联方案600可用于将面向终端系统的端口(例如,出端口228)的数目、每个终端系统(例如,终端系统230)中的地址发送到一个或多个相关联的聚合/核心交换机(例如,聚合/核心交换机210),并且可选择将边缘交换机(例如,边缘交换机220)中的其他相关信息发送到所述一个或多个相关联的聚合/核心交换机。所述信息可用于针对不同面向终端系统的端口建立队列,这与上文方案中相同。队列关联方案600可包括聚合/核心交换机610、边缘交换机620以及终端系统630,所包括的三者可分别对应于聚合/核心交换机210、边缘交换机220以及终端系统230。
边缘交换机620可用显式的方式通过消息将PPFC队列关联信息(面向终端系统的端口以及每个终端系统中的地址)发送到聚合/核心交换机610,发送时使用了DCBX协议扩展并且可选择使用额外的信息交换。例如,包括新的对应子类型的新类型长度值(TLV)可在DCBX协议中定义,以便传达与边缘交换机的面向终端系统的端口相关的信息。新TLV可包括的TLV类型可设定为约127以及以下信息中的至少一些信息:IEEE802.1子类型ID、端口ID类型(例如,数值、MAC地址等)、端口ID的长度、面向终端系统的端口的数目以及一列端口ID。与面向终端系统的端口(端口k)相关联(或耦合)的地址信息还可由边缘交换机620传达至聚合/核心交换机610,传达时使用了IP,例如,使用传输控制协议(Transmission ControlProtocol,TCP)或用户数据报协议(UDP)。聚合/核心交换机610还可包括FC转发表(未示出),例如,类似于FC转发表311的FC转发表,并且边缘交换机620可包括FC转发表(未示出),例如,类似于FCoE应用条件下的FC转发表(图4中)的FC转发表。
在队列关联方案600中,边缘交换机620不需要将与面向E节点的端口相关的信息发送到聚合/核心交换机610。然而,如果无需进行手动配置,那么可能需要DCBX协议扩展来保证边缘交换机620和聚合/核心交换机610均支持PPFC。
图7图示了另一个队列关联方案700的一个实施例,队列关联方案700可用在PPFC系统中,例如,PPFC系统200。队列关联方案700可用于将面向终端系统的端口(例如,出端口228)的数目、每个终端系统(例如,终端系统230)中的地址发送到一个或多个相关联的聚合/核心交换机(例如,聚合/核心交换机210),并且可选择将边缘交换机(例如,边缘交换机220)中的其他相关信息发送到所述一个或多个相关联的聚合/核心交换机。具体而言,聚合/核心交换机可相当于FDF或者可以是以太网交换机,并且边缘交换机可相当于聚合/核心交换机与终端系统之间的包括FIP代理的边缘FDF。队列关联方案700可包括FDF或以太网交换机710、包括FIP代理721的边缘FDF720、E节点730,所包括的三者可分别对应于聚合/核心交换机210、边缘交换机220以及终端系统230。另外,队列关联方案700可包括用于与FDF或以太网交换机710以及边缘FDF720进行通信的FCoE/FC控制和管理(FCM)节点740。
FCM节点740可如第61/480,671号美国临时专利申请案中所述进行配置。边缘FDF720以及FDF或以太网交换机710可用于转发FCoE帧,例如,使用FDF转发表来进行转发。FDF转发表可由FCM节点740来计算并且可下载到边缘FDF720以及FDF或以太网交换机710中的每一者。
一旦从(E节点730的)E节点MAC接收到FIP FLOGI/FDISC请求,边缘FDF720中的FIP代理721便可通过新消息将结构注册请求转发到FCM节点740。FCM节点740还可用于N端口ID指配。在将N端口ID指配给(E节点730的)VN端口之后,FCM节点740可将所指配N端口ID通知到边缘FDF的上游聚合/核心交换机(FDF或以太网交换机710)。FCM节点740还可将耦合到VN端口和下一跳端口ID的出端口ID通知到FDF或以太网交换机710。下一跳端口ID可以是端口的MAC地址,例如,端口(n+1)的MAC地址。当FDF或以太网交换机710在端口k处接收到第一N端口ID时,FDF或以太网交换机710可创建该端口的队列PQk(Hi)。
可选择地,在链路发现阶段中,边缘FDF720可将与相关联的面向终端系统的端口相关的信息发送到FDF或以太网交换机710(例如,通过使用DCBX协议)。这样,当FDF或以太网交换机710接收到N端口ID更新时,FDF或以太网交换机710可检查或确定边缘交换机出端口ID是否存在。DCBX协议扩展也可应用于队列关联方案700。可使用DCBX协议以将面向终端系统的端口的信息从边缘FDF720发送到FDF或以太网交换机710。
在队列关联方案700中,边缘FDF720不需要将与面向E节点的端口相关的信息发送到FDF或以太网交换机710。然而,如果无需进行手动配置,那么可能需要DCBX协议扩展来保证边缘FDF720以及FDF或以太网交换机710均支持PPFC。
图8图示了PPFC队列缩放架构(PPFC queue scaling architecture)800的一个实施例的一个实施例,PPFC队列缩放架构800可用在PPFC系统中,例如,PPFC系统200。PPFC系统可包括:多个聚合/核心交换机810,耦合到聚合/核心交换机810的多个边缘交换机820,以及耦合到边缘交换机820的多个E节点830。聚合/核心交换机810、边缘交换机820以及E节点830可分别对应于聚合/核心交换机210、边缘交换机220以及E节点230。
队列缩放架构800可包括多个队列,所述多个队列可保存在聚合/核心交换机810中,以便计算(边缘交换机820中)面向终端系统的端口的数目以及业务优先级的数目。每个聚合/核心交换机810可包括保存有队列分级结构或树状结构的数据缓冲区814,所述队列分级结构或树状结构可包括约两个调度级(例如,使用两个调度程序S)。第一调度级可用于从聚合/核心交换机810调度来自所有可用业务优先级的业务。业务优先级可包含不同高优先级(例如,针对无损耗业务)与较低优先级(例如,针对容许损耗的业务)的组合。第二较高调度级可用于在多个队列(或子队列)之间调度高优先级业务,所述多个队列对应于边缘交换机820中面向终端系统的不同端口。在第二调度级处,当从边缘交换机820接收到反压请求时,对应于面向终端系统的任一端口的队列(或子队列)可能被阻塞,因而不能发射出去,然而其余的同级队列或子队列,即面向终端系统的其他端口所用的同级队列或子队列,可继续接收数据、将数据列队以及发射数据。边缘交换机820可发送指示出一个面向终端系统的端口的反压请求,例如,发送条件为边缘交换机820处的对应队列发生拥塞或已满。聚合/核心交换机810还可包括FC转发表811,例如,类似于FC转发表311的FC转发表。
例如,业务可分成八个不同优先级。因此,数据缓冲区814中的第一交换级可用于在以下八个队列之间进行调度:Q(0)、...、Q(3)、...、Q(7)。较高优先级队列中的至少一个队列,例如,Q(3)(一种逻辑结构),可用于无损耗业务。此外,边缘交换机820中面向终端系统的端口的数目可等于出端口的数目n,所述n个出端口可耦合到n个对应E节点830(图中示出了N端口ID为Z1和Z40的VN端口,所述两个VN端口分别驻留在MAC地址为MAC1和MAC40的E节点830中)。因此,数据缓冲区814中的第二调度级可用于在以下n个子队列之间进行调度:PQ1(3)、...、PQi(3)、...、PQn(3)。所述分级结构可用于容纳任何数目个面向终端的端口(并因此容纳任何数目个高优先级队列或子队列)以及任何数目个业务优先级。如果另一个优先级队列也用于无损耗业务,例如,Q(7),那么该优先级的另一组数目为n的子队列(未示出)可用于(在第二调度级处)接收指定给n个面向终端系统的端口的业务并将所述业务列队。每一组子队列可使用(第二调度级处的)对应调度程序来进行调度。
在一个实施例中,聚合/核心交换机810的每个输出端口可包括(在数据缓冲区814内)最多约320(或8×40)个队列,所述约320个队列对应于约八个优先级并且每个优先级具有约40个队列。如果所述八个优先级中仅两个优先级(指定为高优先级)要求业务无损耗,那么队列数目可显著减少,例如,减少至约86(或6+2×40)个队列,所述约86个队列对应于约两个高优先级,每个高优先级具有约40个队列,以及其余优先级的约六个额外队列。通过使用业务管理器(TM)芯片或网络处理器(NPU)和TM芯片,具有此数目的队列可得到支持。可进一步使用片外内存(通过支付额外费用)来增大单位端口大小的缓冲区(例如,缓冲时间为约100毫秒)。在一些情况下,可能需要限制(数据缓冲区814中的)队列的数目。因此,可使用基于轮循或散列法的方法来将物理内存位置共享为多个队列(针对不同端口和/或不同优先级)。例如,可使用基于E节点MAC地址的散列法,例如,在进行结构注册时使用。
图9图示了PPFC PDU900的一个实施例,PPFC PDU900可用于将反压信息从边缘交换机发送到聚合/核心交换机。反压信息可详细说明边缘交换机处的出端口ID以及与反压请求相关的业务优先级。PPFC PDU900可由聚合/核心交换机来接收,响应于反压请求,所述聚合/核心交换机随后可使用所述出端口ID以及所述业务优先级来识别对应队列并阻塞该队列中的业务。PPFC PDU900可包括操作代码(operation code或opcode)字段910、端口ID长度字段920、端口ID字段930、优先级启用矢量(priority-enable-vector)字段940以及多个时隙950。操作代码字段910、优先级启用矢量字段940以及时隙950可配置成类似于IEEEP802.1Qbb/D2.3标准中所描述PFC帧中的对应字段。
操作代码字段910可包括指示PPFC PDU900类型或格式的值(例如,01-02),并且操作代码字段910的大小为约两个八比特字节。所述操作代码值可由接收器使用以将PDU识别为PPFC PDU。端口ID长度字段920可指示端口ID字段930的长度并且端口ID长度字段920的大小可为约两个八比特字节。端口ID字段930可指示边缘交换机的面向终端系统的端口并且端口ID字段930可具有可变大小。所指示端口ID可对应于所述端口的MAC地址或仅识别所述端口的任何其他ID。
优先级启用矢量字段940可指示所指示端口ID的业务优先级。优先级启用矢量字段940可包括矢量,所述矢量包含对应于不同优先级的多个时隙或子字段。例如,在八个业务优先级的情况下,所述矢量可包括对应于八个优先级的八个子字段或时隙(e[0]、...、e[n]、...、e[7],其中n<7)。可设定与端口ID的优先级对应的时隙(例如,设定为约一),并且不可设定其余时隙(例如,可设定为约零)。当聚合/核心交换机接收到端口ID以及一个(或多个)被指示优先级时,聚合/核心交换机可阻塞数据缓冲区中的一个(或多个)对应队列。优先级启用矢量字段940的大小可为约两个八比特字节。
时隙950可针对每个优先级指示出队列中应被阻塞以避免继续发射数据或帧的长度。例如,阻塞时间可按毫秒来指示。在八个业务优先级的情况下,时隙950的数目可等于八(时间[0]、...、时间[n]、...、时间[7],其中n<7),所述八个时隙950可对应于八个优先级。时隙950中对应于优先级启用矢量字段940中所设定时隙的值可以是有效的,而其余时隙950可被接收器(聚合/核心交换机)丢弃。例如,如果仅设定了e[7],那么只有时间[7]的值可以是有效的。每个时隙950的大小可为约两个八比特字节。在一些情况下,针对不同优先级的多个队列可大致在同一时间阻塞。例如,e[3]和e[7]均可设定为约一,并且因此时间[3]和时间[7]可以是有效的。
图10图示了PPFC方法1000的一个实施例,PPFC方法1000可在PPFC系统中实施,例如,在PPFC系统200中实施。PPFC方法1000可由聚合/核心交换机来实施,所述聚合/核心交换机与边缘交换机、终端系统、另一个网络组件或以上各者的组合进行通信。PPFC方法1000可包括使聚合/核心交换机中的多个队列与边缘交换机的多个面向终端系统的端口(出端口)相关联。所述队列可指配给同一业务优先级。PPFC方法1000还可包括,阻塞所述队列中对应于所指示的面向终端系统的端口以及业务优先级的一个队列(以实施反压),但不阻塞针对其他面向终端系统的端口的其余队列。因此,PPFC方法1000可在不造成HOL阻塞的情况下提供对拥塞业务的有效控制,这可以有益于无损耗FCoE业务。
PPFC方法1000可从框1010处开始,在框1010处,可接收与多个面向终端系统的端口相关的信息。聚合/核心交换机可例如通过使用上文所述的任一队列关联方案,从边缘交换机、终端系统、另一个组件或以上各者的组合接收信息。所述信息可包括面向终端系统的端口的数目以及终端系统处的相关联MAC地址。还可接收额外信息,例如,与每个端口相关联的业务优先级以及/或者可用于使数据转发队列与面向终端系统的端口相关联的其他信息。
在框1020处,可针对所述面向终端系统的端口建立多个数据转发队列并使所述多个数据转发队列与所述面向终端系统的端口相关联。可通过使用聚合/核心交换机的数据缓冲区中的专用内存来建立所述队列。可通过使用FC转发表811等转发表而使所述队列与所述面向终端系统的端口相关联。在框1030处,可接收指示出面向终端系统的端口中的一个端口以及业务优先级的反压请求。例如,反压请求可由边缘交换机通过使用PPFC帧900等PPFC帧发送到聚合/核心交换机。边缘交换机处被指示的终端系统端口可能在所指示业务优先级上发生拥塞,并且因此可能不需要接收业务或接收较少的业务。
在框1040处,对应于所述面向终端系统的端口以及所述业务优先级的数据转发队列可被阻塞以避免继续转发业务。聚合/核心交换机可阻塞与所指示的面向终端系统的端口以及业务优先级相关联(在转发表中)的队列以避免继续转发业务。这样可使边缘交换机处的所述面向终端系统的端口不能从聚合/核心交换机接收业务或从聚合/核心交换机接收到较少业务,例如,直到解决业务拥塞才接收到业务。然而,边缘交换机处面向终端系统的其余端口可继续从聚合/核心交换机接收业务(例如,在同一业务优先级上进行接收)。随后,PPFC方法1000可结束。
图11图示了网络单元1100的一个实施例,网络单元1100可以是通过网络传输和处理数据的任何装置。例如,网络单元1100可位于数据中心内,并且可对应于聚合/核心交换机、边缘交换机和/或终端系统(或E节点)。网络单元1100可包括一个或多个入端口或单元1110,入端口或单元1110耦合到用于从其他网络组件接收信号和帧/数据的接收器(Rx)1112。网络单元1100可包括逻辑单元1120,逻辑单元1120用于确定将数据发送到哪些网络组件。逻辑单元1120可通过使用硬件、软件或这两者来实施。网络单元1100还可包括一个或多个出端口或单元1130,出端口或单元1130耦合到用于将信号和帧/数据发射到其他网络组件的发射器(Tx)1132。接收器1112、逻辑单元1120以及发射器1132还可实施或支持上文中的任一种队列关联方案和/或PPFC方法1000。网络单元1100的组件可如图11所示进行布置。
上文所述的组件和/或方法可在任何通用网络组件上实施,例如,具有足够的处理能力、内存资源以及网络吞吐能力以处理所承受的必要工作量的计算机或网络组件。图12图示了典型的通用网络组件1200,其适用于实施本文本所揭示组件的一个或多个实施例。网络组件1200包含处理器1202(可称为中央处理器单元或CPU),处理器1202与包含以下项的存储装置进行通信:辅助存储器1204、只读存储器(ROM)1206、随机存取存储器(RAM)1208、输入/输出(I/O)装置1210,以及网络连接装置1212。处理器1202可作为一个或多个CPU芯片来实施,或者可以是一个或多个专用集成电路(ASIC)和/或数字信号处理器(DSP)的一部分。
辅助存储器1204通常由一个或多个磁盘驱动器或磁带驱动器组成并用于数据的非易失性存储,并且如果RAM1208的大小不足以保存所有工作数据,那么辅助存储器1204被用作溢流数据存储装置。辅助存储器1204可用于存储程序,当选择执行这些程序时,所述程序将加载到RAM1208中。ROM1206用于存储在执行程序期间读取的指令,且可能存储所读取的数据。ROM1206为非易失性存储装置,其存储器容量相对于辅助存储器1204的较大存储器容量而言通常较小。RAM1208用于存储易失性数据,还可能用于存储指令。访问ROM1206和RAM1208通常比访问辅助存储器1204要快。
本文本揭示至少一个实施例,且所属领域的技术人员对所述实施例和/或所述实施例的特征所进行的改变、组合和/或修改在本发明的范围内。因组合、合并和/或省略所述实施例的特征而产生的替代实施例也在本发明的范围内。在明确说明数值范围或限制的情况下,此类表达范围或限制应被理解为在明确说明的范围或限制内具有相同大小的迭代范围或限制(例如,从约1到约10包含2、3、4等;大于0.10包含0.11、0.12、0.13等)。例如,只要揭示具有下限Rl和上限Ru的数值范围,则特别揭示落入所述范围内的任何数字。具体而言,特别揭示所述范围内的以下数字:R=Rl+k*(Ru-Rl),其中k为从1%到100%范围内以1%递增的变量,即,k为1%、2%、3%、4%、7%、……、70%、71%、72%、……、97%、96%、97%、98%、99%或100%。此外,还特定揭示由上文所定义的两个R数字界定的任何数值范围。对权利要求的任一元素使用术语“可选择地”意味着需要所述元素,或者并不需要所述元素,两种替代方案均在所述权利要求的范围内。应将使用“包含”、“包括”和“具有”等范围较大的术语理解为支持“由……组成”、“基本上由……组成”以及“大体上由……组成”等范围较窄的术语。因此,保护范围不受上文所陈述的描述限制,而是由所附权利要求书界定,所述范围包含所附权利要求书的标的物的所有等效物。每一和每项权利要求作为进一步揭示内容并入说明书中,且权利要求书是本发明的实施例。本发明中对参考的论述并不是承认其为现有技术,尤其是公开日期在本申请案的在先申请优先权日期之后的任何参考。本发明中所引用的所有专利、专利申请案和公开案的揭示内容以引入的方式并入本文本中,其提供补充本发明的示例性、程序性或其他细节。
虽然本发明中已提供若干实施例,但应理解,在不脱离本发明的精神或范围的情况下,所揭示的系统和方法可用许多其他具体形式来实施。本发明的实例应被视为说明性的而非限制性的,且本发明不限于本文本所给出的细节。例如,各种元件或组件可在另一系统中组合或合并,或者某些特征可省略或不实施。
另外,在不脱离本发明的范围的情况下,各种实施例中描述和说明为离散或单独的技术、系统、子系统和方法可与其他系统、模块、技术或方法组合或合并。展示或讨论为彼此耦合或直接耦合或通信的其他项也可用电气方式、机械方式或其他方式通过某一接口、装置或中间组件间接地耦合或通信。改变、替代和更改的其他实例可由所属领域的技术人员确定,且可在不脱离本文本所揭示的精神和范围的情况下作出。

Claims (18)

1.一种设备,包括:
聚合/核心交换机,用于耦合到边缘交换机并接收与所述边缘交换机的多个面向终端系统的端口相关的信息,
其中与所述面向终端系统的端口相关的所述信息用于使所述面向终端系统的端口与所述聚合/核心交换机处的多个对应队列相关联;
其中使所述面向终端系统的端口与多个对应队列相关联包括:针对与所述边缘交换机的所述面向终端系统的端口相关联的同一业务优先级而建立多个队列;
其中所述聚合/核心交换机包括:
第一调度程序,其耦合到与所述同一业务优先级相关联的多个第一级队列,所述同一业务优先级与所述面向终端系统的端口相关联,并且所述第一调度程序指配给高优先级业务级;
第二调度程序,其耦合到所述第一调度程序以及与所述面向终端系统的端口相关联的额外队列,并且所述第二调度程序指配给低优先级业务级;以及
输出端口,其耦合到所述第二调度程序和所述边缘交换机。
2.根据权利要求1所述的设备,其中所述聚合/核心交换机用于:从所述边缘交换机接收反压请求,所述反压请求所具有的信息指示出所述面向终端系统的端口中的至少一者以及相关联的业务优先级;阻塞所述队列中与所指示的面向终端系统的端口以及所述业务优先级相关联的一个队列;以及允许所述多个队列中的其他队列服务于其他面向终端系统的端口。
3.根据权利要求1所述的设备,其中所述多个队列通过使用转发表而与所述面向终端系统的端口相关联,所述转发表包括以下各者中的至少一者:对应于媒体接入控制(MAC)地址的目的标识符(ID)、所述聚合/核 心交换机的相关联输出端口ID、相关联业务优先级、相关联队列ID(QID)、对应于所述目的ID的相关联下一跳MAC地址以及相关联虚拟局域网ID(VID)。
4.根据权利要求1所述的设备,其中所述边缘交换机经由所述面向终端系统的端口耦合到多个终端系统。
5.根据权利要求4所述的设备,其中与所述面向终端系统的端口相关的所述信息包括所述终端系统的多个媒体接入控制(MAC)地址。
6.一种网络组件,包括:
接收器,其用于接收与边缘交换机的多个面向终端系统的端口相关的信息;
处理器,其用于为所述面向终端系统的端口建立多个对应队列并使所述面向终端系统的端口与所述多个对应队列相关联;以及
发射器,其用于返回与相关联的面向终端系统的端口相关的信息;
其中所述网络组件是光纤通道(FC)转发器(FCF),并且所述边缘交换机是以太网承载光纤通道(FCoE)初始化协议(FIP)侦听桥(FSB),并且其中所述FCF从终端系统接收与所述面向终端系统的端口相关的所述信息,并通过使用FIP经由所述FSB将与所述相关联的面向终端系统的端口相关的所述信息返回给所述终端系统;
其中使所述面向终端系统的端口与多个对应队列相关联包括:针对与所述边缘交换机的所述面向终端系统的端口相关联的同一业务优先级而建立多个队列;
所述网络组件还包括:
第一调度程序,其耦合到与所述同一业务优先级相关联的多个第一级队列,所述同一业务优先级与所述面向终端系统的端口相关联,并且所述第一调度程序指配给高优先级业务级;
第二调度程序,其耦合到所述第一调度程序以及与所述面向终端系统 的端口相关联的额外队列,并且所述第二调度程序指配给低优先级业务级;以及
输出端口,其耦合到所述第二调度程序和所述边缘交换机。
7.根据权利要求6所述的网络组件,其中所接收的信息指示面向终端系统的端口的数目以及耦合到所述边缘交换机的多个终端系统的多个媒体接入控制(MAC)地址,并且其中所返回的信息指示指配给所述终端系统的多个端口标识符(ID)。
8.根据权利要求7所述的网络组件,其中当所述终端系统包括多个FCoE节点时,所述MAC地址和所述端口ID对应于所述FCoE节点。
9.根据权利要求8所述的网络组件,其中当每个所述FCoE节点包括多个虚拟端口时,所述MAC地址和所述端口ID对应于所述虚拟端口。
10.一种网络组件,包括:
接收器,其用于接收与边缘交换机的多个面向终端系统的端口相关的信息;
处理器,其用于为所述面向终端系统的端口建立多个对应队列并使所述面向终端系统的端口与所述多个对应队列相关联;以及
发射器,其用于返回与相关联的面向终端系统的端口相关的信息;
其中所述网络组件是光纤通道(FC)转发器(FCF),并且所述边缘交换机是N端口标识符虚拟化(NPIV)网关,其中所述FCF从所述NPIV网关接收与所述面向终端系统的端口相关的所述信息,并通过使用以太网承载光纤通道(FCoE)初始化协议(FIP)将与所述相关联的面向终端系统的端口相关的所述信息返回给所述NPIV网关,并且其中所述NPIV网关接收、重新生成且转发来自终端系统的与所述面向终端系统的端口相关的所述信息,并通过使用FIP而接收、重新生成且转发来自所述FCF的与所述相关联的面向终端系统的端口相关的所述信息;
其中使所述面向终端系统的端口与多个对应队列相关联包括:针对与 所述边缘交换机的所述面向终端系统的端口相关联的同一业务优先级而建立多个队列;
所述网络组件还包括:
第一调度程序,其耦合到与所述同一业务优先级相关联的多个第一级队列,所述同一业务优先级与所述面向终端系统的端口相关联,并且所述第一调度程序指配给高优先级业务级;
第二调度程序,其耦合到所述第一调度程序以及与所述面向终端系统的端口相关联的额外队列,并且所述第二调度程序指配给低优先级业务级;以及
输出端口,其耦合到所述第二调度程序和所述边缘交换机。
11.一种网络组件,包括:
接收器,其用于接收与边缘交换机的多个面向终端系统的端口相关的信息;
处理器,其用于为所述面向终端系统的端口建立多个对应队列并使所述面向终端系统的端口与所述多个对应队列相关联;以及
发射器,其用于返回与相关联的面向终端系统的端口相关的信息;
其中所述网络组件是光纤通道(FC)转发器(FCF),并且所述边缘交换机是数据平面转发器(FDF),其中所述FDF从终端系统接收与所述面向终端系统的端口相关的所述信息,并通过使用以太网承载光纤通道(FCoE)初始化协议(FIP)将与所述相关联的面向终端系统的端口相关的所述信息返回给所述终端系统,并且其中所述FDF将与所述面向终端系统的端口相关的所述信息发送到所述FCF,并在不使用FIP的情况下接收来自所述FCF的与所述相关联的面向终端系统的端口相关的所述信息;
其中使所述面向终端系统的端口与多个对应队列相关联包括:针对与所述边缘交换机的所述面向终端系统的端口相关联的同一业务优先级而建立多个队列;
所述网络组件还包括:
第一调度程序,其耦合到与所述同一业务优先级相关联的多个第一级队列,所述同一业务优先级与所述面向终端系统的端口相关联,并且所述第一调度程序指配给高优先级业务级;
第二调度程序,其耦合到所述第一调度程序以及与所述面向终端系统的端口相关联的额外队列,并且所述第二调度程序指配给低优先级业务级;以及
输出端口,其耦合到所述第二调度程序和所述边缘交换机。
12.一种网络组件,包括:
接收器,其用于接收与边缘交换机的多个面向终端系统的端口相关的信息;
处理器,其用于为所述面向终端系统的端口建立多个对应队列并使所述面向终端系统的端口与所述多个对应队列相关联;以及
发射器,其用于返回与相关联的面向终端系统的端口相关的信息;
其中与所述面向终端系统的端口相关的所述信息是从所述边缘交换机接收,并且与所述相关联的面向终端系统的端口相关的所述信息是通过使用数据中心桥接功能交换(DCBX)协议、因特网协议(IP)或两者而返回给所述边缘交换机;
其中使所述面向终端系统的端口与多个对应队列相关联包括:针对与所述边缘交换机的所述面向终端系统的端口相关联的同一业务优先级而建立多个队列;
所述网络组件还包括:
第一调度程序,其耦合到与所述同一业务优先级相关联的多个第一级队列,所述同一业务优先级与所述面向终端系统的端口相关联,并且所述第一调度程序指配给高优先级业务级;
第二调度程序,其耦合到所述第一调度程序以及与所述面向终端系统 的端口相关联的额外队列,并且所述第二调度程序指配给低优先级业务级;以及
输出端口,其耦合到所述第二调度程序和所述边缘交换机。
13.一种网络组件,包括:
接收器,其用于接收与边缘交换机的多个面向终端系统的端口相关的信息;
处理器,其用于为所述面向终端系统的端口建立多个对应队列并使所述面向终端系统的端口与所述多个对应队列相关联;以及
发射器,其用于返回与相关联的面向终端系统的端口相关的信息;
其中所述网络组件是FCoE数据转发器(FDF),并且所述边缘交换机是包括了以太网承载光纤通道(FCoE)初始化协议(FIP)代理的边缘FDF,其中所述FDF从所述边缘FDF接收与所述面向终端系统的端口相关的所述信息,并通过使用数据中心桥接功能交换(DCBX)协议、经由耦接到所述FDF和所述边缘FDF的FCoE控制和管理(FCM)节点而将与所述相关联的面向终端系统的端口相关的所述信息返回给所述边缘FDF,并且其中所述边缘FDF从终端系统接收与所述面向终端系统的端口相关的所述信息,并通过使用FIP将与所述相关联的面向终端系统的端口相关的所述信息返回给所述终端系统;
其中使所述面向终端系统的端口与多个对应队列相关联包括:针对与所述边缘交换机的所述面向终端系统的端口相关联的同一业务优先级而建立多个队列;
所述网络组件还包括:
第一调度程序,其耦合到与所述同一业务优先级相关联的多个第一级队列,所述同一业务优先级与所述面向终端系统的端口相关联,并且所述第一调度程序指配给高优先级业务级;
第二调度程序,其耦合到所述第一调度程序以及与所述面向终端系统 的端口相关联的额外队列,并且所述第二调度程序指配给低优先级业务级;以及
输出端口,其耦合到所述第二调度程序和所述边缘交换机。
14.一种由网络组件实施的方法,包括:
从边缘交换机接收与所述边缘交换机的多个面向终端系统的端口相关的信息;以及
使耦合到所述边缘交换机的聚合/核心交换机处的多个数据转发队列与所述边缘交换机的所述多个面向终端系统的端口相关联;
其中使所述面向终端系统的端口与所述多个数据转发队列相关联包括:针对与所述边缘交换机的所述多个面向终端系统的端口相关联的同一业务优先级而建立多个队列;
进一步包括:
从所述边缘交换机接收反压请求,所述反压请求所具有的信息指示出所述面向终端系统的端口中的至少一者以及相关联业务优先级,
阻塞所述数据转发队列中与所指示的面向终端系统的端口以及所述业务优先级相关联的一个队列;以及
允许所述多个队列中的其他数据转发队列服务于其他面向终端系统的端口。
15.根据权利要求14所述的由网络组件实施的方法,其中允许所述多个队列中的其他数据转发队列服务于所述其他面向终端系统的端口包括:不阻塞对应于其余数据的队列,所述对应于其余数据的队列与所述边缘交换机的其余面向终端系统的端口以及所述同一业务优先级相关联。
16.根据权利要求14所述的由网络组件实施的方法,其中所述反压请求以基于优先级和端口的流控制(PPFC)系统包数据单元(PDU)的形式发送出去,所述基于优先级和端口的流控制(PPFC)系统包数据单元(PDU)包括操作代码字段、端口标识符(ID)长度字段、端口ID字段、优先级 启用矢量字段以及多个时间字段。
17.根据权利要求16所述的由网络组件实施的方法,其中所述操作代码字段指示所述PPFC PDU的格式和/或类型,所述端口ID长度字段指示在所述端口ID字段中指示的端口ID的长度,所述端口ID字段中的所述端口ID指示所述面向终端系统的端口,所述优先级启用矢量字段指示所述业务优先级,并且所述时间字段指示所述数据转发队列中与所述所指示的面向终端系统的端口相关联的一个数据转发队列的列队时间。
18.根据权利要求17所述的由网络组件实施的方法,其中所述优先级启用矢量字段包括对应于多个所支持业务优先级的多个子字段,并且所述时间字段对应于同一所支持业务优先级,并且其中所述子字段中只有一个子字段设定为指示所述业务优先级,并且时隙中只有一个时隙是有效的,所述一个时隙对应于所述同一业务优先级。
CN201280020181.3A 2011-04-29 2012-01-04 用于无损耗以太网的基于端口和优先级的流控制机制 Active CN103534997B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201161480671P 2011-04-29 2011-04-29
US61/480,671 2011-04-29
US13/336,260 2011-12-23
US13/336,260 US8989009B2 (en) 2011-04-29 2011-12-23 Port and priority based flow control mechanism for lossless ethernet
PCT/CN2012/070002 WO2012146070A1 (en) 2011-04-29 2012-01-04 Port and priority based flow control mechanism for lossless ethernet

Publications (2)

Publication Number Publication Date
CN103534997A CN103534997A (zh) 2014-01-22
CN103534997B true CN103534997B (zh) 2017-03-15

Family

ID=46028248

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280020181.3A Active CN103534997B (zh) 2011-04-29 2012-01-04 用于无损耗以太网的基于端口和优先级的流控制机制

Country Status (4)

Country Link
US (4) US8989009B2 (zh)
EP (1) EP2695338B1 (zh)
CN (1) CN103534997B (zh)
WO (4) WO2012146070A1 (zh)

Families Citing this family (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8989009B2 (en) 2011-04-29 2015-03-24 Futurewei Technologies, Inc. Port and priority based flow control mechanism for lossless ethernet
US8917722B2 (en) * 2011-06-02 2014-12-23 International Business Machines Corporation Fibre channel forwarder fabric login sequence
JP5488841B2 (ja) * 2011-09-20 2014-05-14 日本電気株式会社 ストレージ装置
WO2013086221A1 (en) 2011-12-07 2013-06-13 Huawei Technologies Co., Ltd. Method to carry fcoe frames over a trill based network
US9191994B2 (en) * 2012-02-03 2015-11-17 Telefonaktiebolaget L M Ericsson (Publ) Apparatus, systems, methods, and computer products suitable for use in an advanced digital baseband processor
CN102611952B (zh) * 2012-03-29 2015-04-01 杭州华三通信技术有限公司 用于实现FCoE交换机之间端口协商的方法和装置
US8873369B2 (en) * 2012-04-25 2014-10-28 Hewlett-Packard Development Company, L.P. Fiber channel 1:N redundancy
US9577872B2 (en) 2012-04-25 2017-02-21 Hewlett Packard Enterprise Development Lp Fiber channel 1:N redundancy
EP2845331B1 (en) * 2012-04-30 2017-03-22 Hewlett Packard Enterprise Development LP Converged fabric for fcoe
CN102723994B (zh) * 2012-06-15 2016-06-22 华为技术有限公司 数据传输的方法、装置及系统
US9166902B1 (en) * 2012-09-14 2015-10-20 Cisco Technology, Inc. Per-port multicast processing
US8971176B2 (en) * 2012-09-28 2015-03-03 International Business Machines Corporation Fibre channel over Ethernet switch implicit logout
US9215174B2 (en) * 2012-10-18 2015-12-15 Broadcom Corporation Oversubscription buffer management
US8875256B2 (en) * 2012-11-13 2014-10-28 Advanced Micro Devices, Inc. Data flow processing in a network environment
US9729459B2 (en) * 2012-11-19 2017-08-08 Avago Technologies General Ip (Singapore) Pte. Ltd. System and method for credit-based link level flow control
US8982703B2 (en) * 2012-12-18 2015-03-17 Mellanox Technologies Ltd. Routing support for lossless data traffic
US9385949B2 (en) 2012-12-20 2016-07-05 Mellanox Technologies Tlv Ltd. Routing controlled by subnet managers
US9154438B2 (en) * 2013-01-24 2015-10-06 Cisco Technology, Inc. Port-based fairness protocol for a network element
US9160673B1 (en) * 2013-02-28 2015-10-13 Pmc-Sierra Us, Inc. Link selection in a bonding protocol
WO2014142980A1 (en) * 2013-03-15 2014-09-18 Hewlett-Packard Development Company, L.P. Maintenance of data forwarder connection state information
JP6191191B2 (ja) * 2013-03-27 2017-09-06 富士通株式会社 スイッチ装置及びスイッチ装置の制御方法
US9258185B2 (en) * 2013-04-10 2016-02-09 Cisco Technology, Inc. Fibre channel over Ethernet support in a trill network environment
CN104350710B (zh) * 2013-04-16 2017-12-08 华为技术有限公司 实现FCoE的方法、装置和系统
US9225483B2 (en) 2013-05-01 2015-12-29 Globalfoundries Inc. Virtual data center bridging exchange (vDCBX) protocol
US9641455B2 (en) * 2013-07-18 2017-05-02 International Business Machines Corporation Mechanism for terminating relay operations in a distributed switch with cascaded configuration
US9288120B2 (en) * 2013-07-19 2016-03-15 Dell Products L.P. Data center bridging network configuration and management
JP5614482B1 (ja) * 2013-09-02 2014-10-29 沖電気工業株式会社 局側終端装置及び経路切替方法
US9473397B2 (en) 2014-02-03 2016-10-18 International Business Machines Corporation Using information on a supported one zone configuration setting in data forwarders to determine zone information to send to data forwarders
US10027590B2 (en) * 2014-02-24 2018-07-17 Avago Technologies General Ip (Singapore) Pte. Ltd. End to end flow control
CN104883325B (zh) * 2014-02-27 2018-02-06 国际商业机器公司 Pvlan交换机及其连接到非pvlan装置的方法
US9338094B2 (en) 2014-03-31 2016-05-10 Dell Products, L.P. System and method for context aware network
US9426098B2 (en) * 2014-04-29 2016-08-23 International Business Machines Corporation Synchronizing out-of-sync elements in a distributed fibre channel forwarder
CN105227334B (zh) * 2014-06-12 2018-10-09 新华三技术有限公司 一种Fabric网络拓扑发现方法和装置
CN104092632B (zh) * 2014-07-14 2017-11-14 新华三技术有限公司 一种网络设备
US10140167B2 (en) * 2014-09-22 2018-11-27 Fts Computertechnik Gmbh Static message placement in queues based on an apriori defined placement plan
EP3079314A1 (en) * 2015-04-08 2016-10-12 Alcatel Lucent Method to manage resources, system and computer-readable medium
JP6418043B2 (ja) * 2015-04-08 2018-11-07 株式会社デンソー スイッチングハブ及び通信ネットワーク
US10218602B2 (en) * 2015-04-15 2019-02-26 Cisco Technology, Inc. Establishing deterministic multicast paths in a network
US9686210B2 (en) * 2015-04-28 2017-06-20 Cisco Technology, Inc. Controller based fibre channel over ethernet (FCoE) fabric
CN105049372A (zh) * 2015-06-18 2015-11-11 福建富士通信息软件有限公司 一种扩展消息中间件吞吐量的方法及系统
US9823849B2 (en) * 2015-06-26 2017-11-21 Intel Corporation Method and apparatus for dynamically allocating storage resources to compute nodes
JP6569374B2 (ja) * 2015-08-10 2019-09-04 富士通株式会社 スイッチ装置及びスイッチ装置の制御方法
JP6582731B2 (ja) * 2015-08-21 2019-10-02 沖電気工業株式会社 局側終端装置、加入者側終端装置、光通信システム、経路切替方法、経路切替プログラム、及び波長切替方法
CN106487764B (zh) * 2015-08-31 2019-09-03 富士通株式会社 用于网络评估的数据发送方法、装置和系统
US10079798B2 (en) * 2015-10-23 2018-09-18 Inernational Business Machines Corporation Domain intercommunication in shared computing environments
US9880949B1 (en) * 2015-12-11 2018-01-30 Microsemi Solutions (U.S.), Inc. Cross clock compensation between layers in peripheral component interconnect express
US10015699B2 (en) * 2016-03-28 2018-07-03 Cisco Technology, Inc. Methods and devices for policing traffic flows in a network
KR102541641B1 (ko) * 2016-06-07 2023-06-08 한국전자통신연구원 분산 서비스 기능 포워딩 시스템 및 방법
US11012378B2 (en) * 2016-08-02 2021-05-18 Telefonaktiebolaget Lm Ericsson (Publ) Methods and apparatus for shared buffer allocation in a transport node
US10567276B2 (en) 2016-08-05 2020-02-18 Huawei Technologies Co., Ltd. Virtual network pre-configuration in support of service-based traffic forwarding
US10326696B2 (en) * 2017-01-02 2019-06-18 Microsoft Technology Licensing, Llc Transmission of messages by acceleration components configured to accelerate a service
US11214561B2 (en) * 2017-01-25 2022-01-04 Ancureall Pharmaceutical (Shanghai) Co., Ltd. Histone methyltransferase EZH2 inhibitor, preparation method and pharmaceutical use thereof
US10574596B2 (en) * 2017-05-23 2020-02-25 Dell Products L.P. Software defined networking FCoE initialization protocol snooping bridge system
CN109600320B (zh) * 2017-09-30 2022-04-05 华为技术有限公司 拥塞处理方法及设备、数据中心网络
CN109818879A (zh) * 2017-11-22 2019-05-28 华为技术有限公司 流量控制方法及装置
US11102127B2 (en) * 2018-04-22 2021-08-24 Mellanox Technologies Tlv Ltd. Load balancing among network links using an efficient forwarding scheme
US10887037B2 (en) 2018-05-17 2021-01-05 Juniper Networks, Inc. Symmetric path/link over LAG interface using LLDP for time synchronization between two nodes using PTP
CN110708255B (zh) * 2018-07-09 2021-11-19 华为技术有限公司 一种报文控制方法及节点设备
US10848458B2 (en) 2018-11-18 2020-11-24 Mellanox Technologies Tlv Ltd. Switching device with migrated connection table
US11349761B2 (en) 2019-03-08 2022-05-31 Hewlett Packard Enterprise Development Lp Cost effective congestion isolation for lossless ethernet
JP7188206B2 (ja) * 2019-03-20 2022-12-13 富士通株式会社 通信装置、通信システム、及び通信方法
US10750258B1 (en) * 2019-03-27 2020-08-18 Dell Products L.P. Virtual node port based virtual fabric support
US10938749B2 (en) 2019-03-27 2021-03-02 Dell Products L.P. Fabric maintenance in vnode_port-based multi-virtual fabric (vfabric) environment
CN110708260A (zh) * 2019-11-13 2020-01-17 鹏城实验室 数据包传输方法及相关装置
US11381512B1 (en) * 2019-12-10 2022-07-05 Cisco Technology, Inc. Priority-based flow control messaging for port extender
CN111953598B (zh) * 2020-06-29 2022-05-31 联想(北京)有限公司 一种分布式流量转发方法、装置及系统
US11411855B1 (en) * 2020-06-30 2022-08-09 Amazon Technologies, Inc. Computation of ranked path options in networks
US12010028B1 (en) * 2023-05-17 2024-06-11 Huawei Technologies Co., Ltd. Method and apparatus for proactively forming flowlets for a flow in communication network

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0901302A2 (en) * 1997-09-05 1999-03-10 Nec Corporation Large capacity, multiclass core ATM switch architecture
US6842423B1 (en) * 2001-05-02 2005-01-11 Advanced Micro Devices, Inc. Systems and methods for priority-based flow control masking

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10126419A (ja) * 1996-10-23 1998-05-15 Nec Corp Atm交換機システム
CA2239133C (en) * 1998-05-28 2007-08-28 Newbridge Networks Corporation Multicast methodology and apparatus for backpressure - based switching fabric
US6981054B1 (en) * 2000-06-06 2005-12-27 Advanced Micro Devices, Inc. Flow control arrangement in a network switch based on priority traffic
US6526024B1 (en) * 2000-06-30 2003-02-25 Marconi Communications, Inc. Synchronization of asynchronous back-pressure from one destination to multiple sources
AU2001278644A1 (en) 2000-08-15 2002-02-25 Conexant Systems, Inc. Switches and routers, with parallel domains operating at a reduced speed
AU2002232481A1 (en) * 2000-11-07 2002-05-21 Fast-Chip, Inc. Switch-based network processor
US7123623B2 (en) * 2000-11-29 2006-10-17 Tellabs Operations, Inc. High-speed parallel cross bar switch
JP3798644B2 (ja) * 2001-03-30 2006-07-19 富士通株式会社 中継装置
US6901052B2 (en) * 2001-05-04 2005-05-31 Slt Logic Llc System and method for policing multiple data flows and multi-protocol data flows
AU2002308616A1 (en) * 2001-05-07 2002-11-18 Vitesse Semiconductor Corporation A system and a method for processing data packets or frames
US6999453B1 (en) * 2001-07-09 2006-02-14 3Com Corporation Distributed switch fabric arbitration
US7212534B2 (en) * 2001-07-23 2007-05-01 Broadcom Corporation Flow based congestion control
US7586909B1 (en) * 2002-03-06 2009-09-08 Agere Systems Inc. Striping algorithm for switching fabric
US7286544B2 (en) * 2002-07-25 2007-10-23 Brocade Communications Systems, Inc. Virtualized multiport switch
WO2005032167A1 (en) * 2003-09-29 2005-04-07 British Telecommunications Public Limited Company Matching process
US7519054B2 (en) * 2005-01-27 2009-04-14 Intel Corporation Replication of multicast data packets in a multi-stage switching system
US7961621B2 (en) 2005-10-11 2011-06-14 Cisco Technology, Inc. Methods and devices for backward congestion notification
US7644179B1 (en) * 2005-12-01 2010-01-05 Cisco Technology, Inc. Inter-VSAN routing with NAT
US7817558B2 (en) * 2006-05-19 2010-10-19 Cisco Technology, Inc. Flow based flow control in an ethernet switch backplane
US20070268903A1 (en) * 2006-05-22 2007-11-22 Fujitsu Limited System and Method for Assigning Packets to Output Queues
US20080159277A1 (en) * 2006-12-15 2008-07-03 Brocade Communications Systems, Inc. Ethernet over fibre channel
US8331387B2 (en) * 2007-06-22 2012-12-11 Broadcom Corporation Data switching flow control with virtual output queuing
JP2009055327A (ja) 2007-08-27 2009-03-12 Hitachi Ltd ネットワークシステム
US9342339B2 (en) * 2007-11-07 2016-05-17 Brocade Communications Systems, Inc. Method and system for congestion management in a fibre channel network
US20090300209A1 (en) * 2008-06-03 2009-12-03 Uri Elzur Method and system for path based network congestion management
US8218442B2 (en) * 2008-09-11 2012-07-10 Juniper Networks, Inc. Methods and apparatus for flow-controllable multi-staged queues
US8111696B2 (en) * 2008-10-14 2012-02-07 Emulex Design & Manufacturing Corporation Method to improve the performance of a computer network
US8400942B2 (en) 2008-11-12 2013-03-19 Emulex Design & Manufacturing Corporation Large frame path MTU discovery and communication for FCoE devices
US8325602B2 (en) * 2008-12-18 2012-12-04 Cisco Technology, Inc. Method and system to manage network traffic congestion in networks with link layer flow control
US8369347B2 (en) 2009-09-14 2013-02-05 Futurewei Technologies, Inc. Fiber channel over Ethernet and fiber channel switching based on Ethernet switch fabrics
US9231890B2 (en) * 2010-06-08 2016-01-05 Brocade Communications Systems, Inc. Traffic management for virtual cluster switching
US8335236B2 (en) * 2010-05-06 2012-12-18 Cisco Technology, Inc. FCoE isolated port channels and FCoE session resynchronization in vPC/MCEC environments using DCBXP
US8879554B2 (en) * 2010-05-07 2014-11-04 Cisco Technology, Inc. Preventing MAC spoofs in a distributed virtual switch
US9172590B2 (en) * 2010-05-11 2015-10-27 Brocade Communications Systems, Inc. Single virtual domain fibre channel over ethernet fabric
US8264985B2 (en) * 2010-05-12 2012-09-11 Cisco Technology, Inc. Locally unique node port identifiers
US8767735B2 (en) * 2010-08-04 2014-07-01 Alcatel Lucent System and method for multi-chassis link aggregation
CN102025617B (zh) 2010-11-26 2015-04-01 中兴通讯股份有限公司 以太网拥塞控制方法及装置
US20120163395A1 (en) * 2010-12-22 2012-06-28 Juniper Networks, Inc. Apparatus and methods to aggregate fcoe (fibre channel over ethernet) filter rules of a single interface in a single or few rules on a first-hop fcoe networking element
US9031072B2 (en) 2010-12-22 2015-05-12 Juniper Networks, Inc. Methods and apparatus to route fibre channel frames using reduced forwarding state on an FCOE-to-FC gateway
US9106579B2 (en) * 2011-01-07 2015-08-11 Jeda Networks, Inc. Methods, systems and apparatus for utilizing an iSNS server in a network of fibre channel over ethernet devices
US8989009B2 (en) 2011-04-29 2015-03-24 Futurewei Technologies, Inc. Port and priority based flow control mechanism for lossless ethernet

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0901302A2 (en) * 1997-09-05 1999-03-10 Nec Corporation Large capacity, multiclass core ATM switch architecture
US6842423B1 (en) * 2001-05-02 2005-01-11 Advanced Micro Devices, Inc. Systems and methods for priority-based flow control masking

Also Published As

Publication number Publication date
US20120275467A1 (en) 2012-11-01
WO2012149504A1 (en) 2012-11-01
US20120275339A1 (en) 2012-11-01
US8989009B2 (en) 2015-03-24
WO2012149505A1 (en) 2012-11-01
US8687623B2 (en) 2014-04-01
EP2695338A1 (en) 2014-02-12
US20120275787A1 (en) 2012-11-01
CN103534997A (zh) 2014-01-22
WO2012146070A1 (en) 2012-11-01
EP2695338B1 (en) 2019-03-13
US9276878B2 (en) 2016-03-01
EP2695338A4 (en) 2014-02-12
WO2012149503A1 (en) 2012-11-01
US20120275301A1 (en) 2012-11-01

Similar Documents

Publication Publication Date Title
CN103534997B (zh) 用于无损耗以太网的基于端口和优先级的流控制机制
US11451491B2 (en) Methods and apparatus related to virtualization of data center resources
US10454849B2 (en) Methods and apparatus related to a flexible data center security architecture
EP1810466B1 (en) Directional and priority based flow control between nodes
US8730954B2 (en) Methods and apparatus related to any-to-any connectivity within a data center
US8340088B2 (en) Methods and apparatus related to a low cost data center architecture
US8755396B2 (en) Methods and apparatus related to flow control within a data center switch fabric
US8335213B2 (en) Methods and apparatus related to low latency within a data center
CN114762304A (zh) 用于在高性能计算环境中支持私有架构中的rdma带宽限制的系统和方法
US6473434B1 (en) Scaleable and robust solution for reducing complexity of resource identifier distribution in a large network processor-based system
US20110019572A1 (en) Method and apparatus for shared shaping
US20100061367A1 (en) Methods and apparatus related to lossless operation within a data center
EP2164209A1 (en) Systems, methods, and apparatus for a data centre
WO2015061357A1 (en) Enabling concurrent operation of tail-drop and priority-based flow control in network devices
US20220150185A1 (en) Methods and apparatus related to a flexible data center security architecture
Cai et al. Survey on converged data center networks with DCB and FCoE: standards and protocols
US11728893B1 (en) Method, system, and apparatus for packet transmission
CN114531399B (zh) 一种内存阻塞平衡方法、装置、电子设备和存储介质
Gai et al. I/o Consolidation in the Data Center
Polezhaev et al. Mathematical model of cloud computing data center based on OpenFlow
Fang Data traffic congestion management for data center ethernet

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant