CN104094559B - 用于收敛增强以太网络的可靠性的方法和系统 - Google Patents

用于收敛增强以太网络的可靠性的方法和系统 Download PDF

Info

Publication number
CN104094559B
CN104094559B CN201380008254.1A CN201380008254A CN104094559B CN 104094559 B CN104094559 B CN 104094559B CN 201380008254 A CN201380008254 A CN 201380008254A CN 104094559 B CN104094559 B CN 104094559B
Authority
CN
China
Prior art keywords
layer
network
dcb
feedback signal
tcp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201380008254.1A
Other languages
English (en)
Other versions
CN104094559A (zh
Inventor
C.德库萨蒂斯
M.古萨特
F.尼瑟
R.P.卢吉坦
C.明肯伯格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN104094559A publication Critical patent/CN104094559A/zh
Application granted granted Critical
Publication of CN104094559B publication Critical patent/CN104094559B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/11Identifying congestion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/19Flow control; Congestion control at layers above the network layer
    • H04L47/193Flow control; Congestion control at layers above the network layer at the transport layer, e.g. TCP related
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/26Flow control; Congestion control using explicit feedback to the source, e.g. choke packets

Abstract

一种用于收敛以太网络的可靠性系统,可包括多个端点,每个包括层‑4传送层,其中每个端点连接到数据中心桥接(DCB)层‑2网络。该系统还包括在层‑4传送层和DCB层‑2网络之间的适配器,用于将DCB网络和传送层的至少一个所提供的流量和拥塞控制反馈信号的至少一个转化为用于控制由传送层进行的传输的被整合的反馈信号。

Description

用于收敛增强以太网络的可靠性的方法和系统
技术领域
本发明涉及计算机联网领域,并且尤其是涉及以太网络。
背景技术
收敛增强以太网(CEE)数据中心借助于超越传统有损操作(有损流通量等级)的链路层流量控制(LL-FC,无私也称为CEE中的优先级流量控制(PFC)),在引入无损操作(以及无损流通量等级)的同时容许高链接速度和短延迟。不过,与传统以太网和英特网相反,CEE的无损操作带来了新的问题。
发明内容
根据本发明的一个方面,用于收敛增强以太网网络的可靠性系统可以包括多个端点,每个包括层-4传送层,其中每个端点连接到数据中心桥接(DCB)层-2网络。该系统还包括在诸如TCP、UDP、RCP、DCCP、XCP等等的层-4传送层和DCB层-2网络之间的适配器,用于将DCB网络和传送层的至少一个所提供的流量和拥塞控制反馈信号的至少一个转化为用于控制由传送层进行的传输的被整合的反馈信号。
所述DCB层-2网络可以根据支持诸如优先级流量控制(PFC)的多个优先级的流量控制协议生成流量控制信号。所述DCB层-2网络根据量化的拥塞通知(QCN)协议生成拥塞控制反馈信号。PFC和QCN可以在所述DCB层-2网络中个别地或同时被启用。如果PFC和QCN两者都被启用,则两者或任意一者可以被任何端点独立使用。
所述端点可通过终端站连接到所述DCB层-2网络,其中该终端站响应于接收到拥塞控制信号实现量化的拥塞通知(QCN)反应点,该反应点基于QCN协议施加速率限制以便限制所述DCB层-2网络中的网络拥塞。所述传送层所生成的网络流通量通过将终端站配置为将该流通量转向优先级流量控制(PFC)协议的有损优先级或通过不使用任何PFC协议而采用有损操作在层-2上被传送。
所述传送层所生成的网络流通量通过将终端站配置为将该流通量转向优先级流量控制(PFC)协议的无损优先级以及使得终端站对由相邻切换器生成的层-2流量控制消息作出反应而采用无损操作在层-2上被传送。所述传送层所生成的网络流通量通过将终端站配置为将该流通量转向优先级流量控制(PFC)协议的有损优先级或通过不使用任何PFC协议而采用有损操作在层-2上被传送。
所述传送层所生成的网络流通量通过将终端站配置为将该流通量转向优先级流量控制(PFC)协议的无损优先级以及使得终端站对由相邻切换器生成的层-2流量控制消息作出反应而采用无损操作在层-2上被传送。所述适配器将所述流量和拥塞控制反馈信号预处理为整合的反馈信号,该预处理包括对初级反馈信号进行延迟、聚合、过滤、增强以及抽取(decimating)的至少一个。
所述层-4传送层可以是传输控制协议(TCP)、RCP、XCP、DCCP、UDP或任何基于接口(socket-based)传送方案,在此成为TCP。所述接口(interface)可以提供指示由于TCP流量引起的拥塞严重程度的速率降低整合(consolidated)反馈信号,并且其中该接口包括用于响应于该整合反馈信号控制TCP流量传输的TCP拥塞模块。
所述整合的反馈信号可包括TCP流量速率限制、TCP流量缓冲器占用度量以及用于处理TCP ACK(如果存在,因为UDP不采用ACK)或显式拥塞通知(ECN)和用于控制相关联的TCP传输的TCP流量速率限制中的至少一个。所述拥塞模块响应于调节整合反馈信号调节TCP流量拥塞窗口和传输调度。
本发明的另一个方面为用于收敛增强以太网网络的可靠性方法。该方法可包括提供多个端点,每个包括层-4传送层,其中每个端点连接到数据中心桥接(DCB)层-2网络。该方法还包括在层-4传送层和所述DCB层-2网络之间安置适配器,以便将DCB网络和传送层的至少一个所提供的流量和拥塞控制反馈信号的至少一个转化为用于控制由传送层进行的传输的被整合的反馈信号。
所述方法还包括:根据支持多个优先级的流量控制协议,诸如优先级流量控制(PFC),在所述DCB层-2网络处生成流量控制信号。所述方法还包括:根据量化的拥塞通知(QCN)协议在所述DCB层-2网络处生成拥塞控制反馈信号。
所述方法还包括:通过终端站将所述端点连接到所述DCB层-2网络,其中该终端站响应于接收到拥塞控制信号,实现量化的拥塞通知(QCN)反应点,该反应点基于QCN协议施加速率限制以便限制所述DCB层-2网络中的网络拥塞。所述方法还包括:通过配置终端站将该流通量转向优先级流量控制(PFC)协议的有损优先级或通过不使用任何PFC协议,采用有损操作在层-2上传送所述传送层所生成的网络流通量。
所述方法还包括:通过配置终端站将该流通量转向优先级流量控制(PFC)协议的无损优先级以及使得终端站对由相邻切换器生成的层-2流量控制消息作出反应,采用无损操作在层-2上传送所述传送层所生成的网络流通量。切换器指的是任何物理或虚拟设备,其可以用于切换、桥接、转向、分类、路由、转发、调度数据包或以太网帧。所述方法还包括:处理TCP ACK和控制相关联的TCP传输,其中所述整合反馈信号包括TCP流量速率限制、TCP流量缓冲器占用度量(metric)以及TCP流量速率限制中的至少一个。所述方法还包括:经过拥塞模块,响应于所述整合的反馈信号,调节TCP流量拥塞窗口以及传输调度。
本发明的另一个方面为一种连接到有形介质中的计算机可读程序代码,用于解决收敛以太网中的可靠性。该计算机可读程序代码可以配置为,使得该程序提供多个端点,每个包括层-4传送层,其中每个端点连接到数据中心桥接(DCB)层-2网络。该计算机可读程序代码还可以配置为在层-4传送层和所述DCB层-2网络之间安置适配器,以便将DCB网络和传送层的至少一个所提供的流量和拥塞控制反馈信号的至少一个转化为用于控制由传送层进行的传输的被整合的反馈信号。
附图说明
图1是显示根据本发明的收敛增强网络的框图。
图2是图示根据本发明的方法方面的流程图。
图3是图示根据图2的方法的一些方法方面的流程图。
图4是图示根据图2的方法的一些方法方面的流程图。
图5是图示根据图4的方法的一些方法方面的流程图。
图6是图示根据图4的方法的一些方法方面的流程图。
图7是图示根据图4的方法的一些方法方面的流程图。
图8是图示根据图5的方法的一些方法方面的流程图.
图9是图示根据图5的方法的一些方法方面的流程图.
图10图释了5-级胖树中的现有技术热点饱和树。
图11图释了现有技术中显式拥塞通知缓存尺寸。
图12是图示根据本发明的替换收敛增强网络实施例的框图。
具体实施方式
下面将参照附图详细描述本发明,附图中显示了本发明的优选实施例。通篇相同的标记指代相同的元件,并且具有字母后缀的相同标记在单一实施例中用于标识相似部件。
现在参见图1,
首先描述用于收敛增强以太网网络12的可靠性系统10。在实施例中,系统10包括多个端点14a-14n,每个端点包括层-4传送层16a-16n,其中每个端点连接到数据中心桥接(DCB)层-2网络18。该系统10还包括层-4传送层16a-16n和所述DCB层-2网络18之间的适配器20,用于将DCB网络和传送层的至少一个所提供的流量和拥塞控制反馈信号的至少一个转化(translate)为用于控制由传送层进行的传输的被整合的反馈信号。
在一个实施例中,所述DCB层-2网络18可以根据支持诸如优先级流量控制(PFC)的多个优先级的流量控制协议生成流量控制信号。所述DCB层-2网络18根据量化的拥塞通知(QCN)协议生成拥塞控制反馈信号。
在一个实施例中,所述端点14a-14n可通过终端站22连接到所述DCB层-2网络18,其中该终端站响应于接收到拥塞控制信号实现量化的拥塞通知(QCN)反应点,该反应点基于QCN协议施加速率限制以便限制所述DCB层-2网络中的网络拥塞。在另一个实施例中,所述传送层16a-16n所生成的网络流通量通过将终端站22配置为将该流通量转向优先级流量控制(PFC)协议的有损优先级或通过不使用任何PFC协议而采用有损操作在层-2 18上被传送。
在一个实施例中,所述传送层16a-16n所生成的网络流通量通过将终端站配置为将该流通量转向优先级流量控制(PFC)协议的无损优先级以及使得终端站22对由相邻切换器生成的层-2流量控制消息作出反应而采用无损操作在层-2上被传送。在另一个实施例中,所述传送层16a-16n所生成的网络流通量通过将终端站22配置为将该流通量转向优先级流量控制(PFC)协议的有损优先级或通过不使用任何PFC协议而采用有损操作在层-2 18上被传送。
在一个实施例中,所述传送层16a-16n所生成的网络流通量通过将终端站22配置为将该流通量转向优先级流量控制(PFC)协议的无损优先级以及使得终端站对由相邻切换器生成的层-2流量控制消息作出反应而采用无损操作在层-2 18上被传送。在另一个实施例中,所述适配器20将所述流量和拥塞控制反馈信号预处理为整合的反馈信号,该预处理包括对初级反馈信号进行延迟、聚合、过滤、增强以及抽取(decimating)的至少一个。
在一个实施例中,所述层-4传送层16a-16n可以是传输控制协议(TCP)层。在另一个实施例中,所述适配器20提供指示由于TCP流量引起的拥塞严重程度的速率降低整合(consolidated)反馈信号,并且其中该接口包括用于响应于该整合反馈信号控制TCP流量传输的TCP拥塞模块。
所述整合的反馈信号可包括TCP流量速率限制、TCP流量缓冲器占用度量以及用于处理TCP ACK和用于控制相关联的TCP传输的TCP流量速率限制中的至少一个。所述拥塞模块响应于调节整合反馈信号调节TCP流量拥塞窗口和传输调度。
本发明的另一个方面为用于收敛增强以太网网络的可靠性方法,现在参照图2的流程图32来描述该方法。该方法起始与块34并且可包括在块36处提供多个端点,每个包括层-4传送层,其中每个端点连接到数据中心桥接(DCB)层-2网络。该方法还包括在块38处,在层-4传送层和所述DCB层-2网络之间安置适配器,以便将DCB网络和传送层的至少一个所提供的流量和拥塞控制反馈信号的至少一个转化为用于控制由传送层进行的传输的被整合的反馈信号。该方法结束于块40。
在将参照图3的流程图42所描述的另一个方法实施例中,所述方法起始于块44。所述方法可以包括图2中在块36和38处的步骤。该方法还包括在块46处根据支持多个优先级的流量控制协议,诸如优先级流量控制(PFC),在所述DCB层-2网络处生成流量控制信号。所述方法还包括:根据量化的拥塞通知(QCN)协议在所述DCB层-2网络处生成拥塞控制反馈信号。该方法结束于块48.
在将参照图4的流程图50被描述的另一个方法实施例中,所述方法起始于块52。所述方法可以包括图2中在块36和38处的步骤。所述方法还包括:在块54处,根据量化的拥塞通知(QCN)协议在所述DCB层-2网络处生成拥塞控制反馈信号。该方法结束于块56。
在将参照图5的流程图58被描述的另一个方法实施例中,所述方法起始于块60。所述方法可以包括图4中在块36、38以及54处的步骤。所述方法还包括:在块62处,通过终端站将所述端点连接到所述DCB层-2网络,其中该终端站响应于接收到拥塞控制信号,实现量化的拥塞通知(QCN)反应点,该反应点基于QCN协议施加速率限制以便限制所述DCB层-2网络中的网络拥塞。该方法结束于块64。
在将参照图6的流程图66被描述的另一个方法实施例中,所述方法起始于块68。所述方法可以包括图4中在块36、38以及54处的步骤。所述方法还包括:在块70处,通过配置终端站将该流通量转向优先级流量控制(PFC)协议的有损优先级或通过不使用任何PFC协议,采用有损操作在层-2上传送所述传送层所生成的网络流通量。该方法结束于块72。
在将参照图7的流程图74被描述的另一个方法实施例中,所述方法起始于块76。所述方法可以包括图4中在块36、38以及54处的步骤。所述方法还包括:在块78处,通过配置终端站将该流通量转向优先级流量控制(PFC)协议的无损优先级以及使得终端站对由相邻切换器生成的层-2流量控制消息作出反应,采用无损操作在层-2上传送所述传送层所生成的网络流通量。该方法结束于块80。
在将参照图8的流程图82被描述的另一个方法实施例中,所述方法起始于块84。所述方法可以包括图5中在块36、38、54以及62处的步骤。所述方法还包括:在块86处,处理TCPACK和ECN以及控制相关联的TCP传输,其中所述整合反馈信号包括TCP流量速率限制、TCP流量缓冲器占用度量(metric)以及TCP流量速率限制中的至少一个。该方法结束于块88。
在将参照图9的流程图90被描述的另一个方法实施例中,所述方法起始于块92。所述方法可以包括图5中在块36、38、54以及62处的步骤。所述方法还包括:在块94处,经过拥塞模块,响应于所述整合的反馈信号,调节TCP流量拥塞窗口以及传输调度。该方法结束于块96。
本发明的另一个方面为一种连接到有形介质中的计算机可读程序代码,用于解决收敛以太网网络12中的可靠性。该计算机可读程序代码可以配置为,使得该程序提供多个端点14a-14n,每个包括层-4传送层16a-16n,其中每个端点连接到数据中心桥接(DCB)层-2网络18。该计算机可读程序代码还可以配置为在层-4传送层16a-16n和所述DCB层-2 18网络之间安置适配器20,以便将DCB网络和传送层的至少一个所提供的流量和拥塞控制反馈信号的至少一个转化为用于控制由传送层进行的传输的被整合的反馈信号。
鉴于前面所述,所述系统10在收敛增强以太网络中提供了可靠性。例如,当前饱和(saturation)收敛增强以太网(CEE)数据中心网络(DCN)遭受着CEE/DCN中的树拥塞(treecongestion)。CEE数据中心借助于超越传统有损操作(有损流通量等级)的链路层流量控制(LL-FC,也称为CEE中的优先级流量控制(PFC)),在引入无损操作(以及无损流通量等级)的同时容许高链接速度和短延迟。不过,与传统以太网和英特网相反,CEE的无损操作带来了新的问题。即,单一热点饱和树可能导致整个DCN在几10个-几100个us内崩溃。
图10图释了这种问题(热点拥塞盒子(box))。如果所有输入的流通量的足够多个分部(fraction)目标是一些输出端之一(在图中,该输出端被标记为128),该输出链路就会饱和:其变成热点(HS),其使得在切换馈送到给链路的队列充满。如果该流通量形态持续,那么无论采用何种技术来重新指派缓冲器空间,空间最终都会被耗尽。这迫使切换器的LL-FC快速将所有馈送到该切换器的所有输入减速(throttle back)。这又反过来使得前一级将其缓冲器空间充满。以一种多米诺效应,拥塞最终将一路返回到网络输入端。这就是所称的树饱和,或者在其他上下文中所称的高阶线头(HOL)堵塞拥塞扩散。
最终,导致热点的流通量将部分地重启(root)一个或多个由固有的流通量分布所导致的和部分由流量干扰或高阶HOL堵塞导致的饱和树。一旦完全形成饱和切换器的树,每个数据包就必须跨过至少一个饱和切换器。随着退出队列的时间指数级增加,就有越多切换器来自热目的地,即使仅有一个切换器必须被跨越,也会出现大量的延迟。因此,网络作为一个整体就会遭受吞吐量的灾难性损失:其累积吞吐量受到单一热输出端的吞吐量的限制(gated)。
饱和经由LL-FC扩散非常快;根据聚集的数据,树在小于网络的10遍历倍数内被充满,这对于软件而言太快以至于不能对该问题作出及时反应。自然地,该问题也会缓慢地消散,因为所涉及的所有队列必须被清空。这样,需要一种足以快速反应的硬件方案来防止树长大。清楚的是,网络拓朴与这种效应没有关系;在任何DCN拓朴中都会引起饱和树。
因此,无损LL-FC提供了基本性能利益,除了其复杂性,虽然其具有促进饱和树拥塞的缺点。除非有效CM协议被设计和实施来将构造(fabric)操作正好控制在饱和区域之下并且从偶发交迭(crossover)中恢复,诸如基于CEE的CEE的无损ICTN将会愈加暴露给饱和树和拥塞崩溃。不过,尽管该问题长期存在,但是实践中依然不能获得彻底解决方案。在IEEE 802.l Qau中通过使用QCN机制克服简单(单一瓶颈)但是持久的热点拥塞在CEE环境中进行了首次尝试。
为什么不依赖于诸如传输控制协议(TCP)的一种广泛部署方案呢?答案是DCN以及其拥塞现象完全不同于以太网(也成为最佳最大努力)和英特网协议(IP),以便使得TCP的直接传送(即使添加ECN)——即,没有主要适应——对CN环境无效。主要的三个原因是:无损性:TCP已经被用于基于损耗操作;数据包丢弃是基本反馈机制,其触发源反应。不过,数据包损失与CEE的原理相矛盾。
下一个是,恢复非常/太慢,无论何时TCP窗口小于6个数据包。在具有大MTU的较小ICTN中,TCP窗口尺寸大部分<6数据包(packet)。相反,如果恢复太积极(aggressive),则性能会降低10-倍。这近来已经被TCP Incast论文验证过。
双反馈回路:与IP网络中的TCP不同,DCN中的FCC机制基于双闭环控制系统:(i)LL-FC(PFC)和(ii)端对端CM(QCN或TCP,或者两者)。前者是更小和更快的环路,其照顾到了LL正确性以及有时照顾到了新更能,比如例如提前调度(ETS)。CM涉及到更大和更慢环路,其具有比LL RTT更长时间量;完整的CM方案可能包括拥塞的避免/防止和控制(在其发生后)。由于CM内在第慢于其底层LL-FC环路,其需要一种ICTN状态的累积观察—而LL-FC仅仅依赖于本地状态。因此,CM应该通过(a)获取关于流通量状况的全局观察(view)反馈(QCNCNM、TCP ECN、Vega的延迟等等)以及(b)详细阐述考虑过期全局观察的更复杂的源反应来补偿其较大环路的惯量,并理论上(ideally)试图基于目前所获得趋势来预测流通量。问题是,TCP既不呈现(assume)快和无损LL-FC层的存在,TCP也与其他流量控制方案(QCN)良好共存,如在ATM/ABR上的TCP所证实的那样。
浅缓冲器:替代性会是过度设计切换器缓冲器以超越所授权(mandated)给无损ICTN的尺寸。不过,这实际上是不可能的(参见图11),而且也由于使得其恢复缓慢而恶化(aggravate)了后拥塞阶段。尽管针对BE广泛地研究和改进了网络TCP(以及ABR),但是我们依然缺乏足够的证据证明其在ICTN的可用性和充分性。而且,近期的研究验证了TCP的使用对某些类型的中间件(middleware)以及TCP Incast无效。
TCP在80年代早期被用于控制(curb)有损BE网络中的具有几100个ms的e2e迟滞和几10个MB切换器缓冲器的单一瓶颈拥塞。相反,基于CEE的DCN是无损的(因此有多瓶颈饱和树拥塞)、快速(5-50个us的迟滞)以及浅的(10-100s KB)的缓冲器。
作为响应,系统10使用了对TCP的下述改变/增强,导致“DC-TCP”:1)在终端节点采用软件和/或硬件版的TCP,诸如(CU)BIC、Reno、Vegas、Compound等等。
2)禁用(disable)QCN的控制器,如果有的话。未来的CEE DCN将实现本地(native)L2CM,即,QCN(参见802.1Qau in[42])。保留QCN拥塞检测,同时在源中禁用QCN速率限制器。
3)拥塞信号发送和TCP速率限制其:基于向后拥塞通知(BCN)和QCN拥塞通知消息(CNM),采用混合速率限制器替代或完善基于混合复制ACK的传统TCP速率限制器。将与TCP源相关联的CNM的摘要形式输入TCP用于基于L2反馈进行窗口控制。
4)检测和补偿饱和树。基于DCN拓朴和尺寸重新调整(tune)TCP常熟(RTO)。潜在地适应以实时地改变网络尺寸和延迟(优选地,经由延迟探测或反馈请求协议)。
一个挑战是,拥塞可能会在可能为有损的外部以太网络中出现,在该情况下,拥塞可能导致数据包丢失并跟着发生来自TCP接收器的重复ACK。这关系到DC-TCP与外部网络中的TCP之间的互用性。因此,需要混合速率限制器,其能够理解BCN、摘要的CNM以及重复ACK。
在有损网络中的DC-TCP的发送器以及TCP接收器的情况下,TCP接收器将采用重复ACK报告有损网络中的拥塞/损失。在有损网络中的TCP发送器以及拥塞出现在引导到DC-TCP接收器的无损网络中的情况下,被发送到源的CNM必须在无损和有损网络之间的边缘被适当地翻译。一种可能性是在边界切换器中将CNM转换为TCP窗口比例,因为CNM将不会被有损网络理解。
在成打的TCP要素(flavor)已经被发布之后,通常处理(deal with)快WAN(与DCN相同速率,但是较长的延迟)或无线应用。处理饱和树(多个相关的瓶颈)并且也与浅缓冲器工作的TCP的无损应用迄今还未知。而且,TCP也还没有与诸如QCN的L2拥塞检测机构结合,QCN启动了多-位(ECN/BCN是普通二进制)定量反馈。为了有效控制DCN拥塞,优选的是,我们额外(可以)施加了上述的补偿方案。图12图示了系统10的一个实施例。
系统10通过将重新调整后的TCP要素(CUBIC、Compound以及New Reno为优选,其他可以使用)与L2QCN信令组合来使得TCP适应于无损DCN。系统10处理饱和树问题、us延迟以及浅缓冲器。
系统10也补偿和适应于快速改变DCN负载。系统10提供全TCP接口兼容性,并因此提供了遗留应用支持。
在基于CEE的数据中心网络12中,通过系统10实现了一种用于防止数据包拥塞的扩散同时防止数据包在网络中丢失的方法,该网络具有至少一个源信道适配器、至少一个目的地信道适配器、在多个启用在以太网上的光纤信道(FCoE)的切换器24。系统10检测在数据中心网络内出现的拥塞。系统10测量该拥塞的程度并在层-2级别生成反馈信号(值),通知源信道适配器以及目的地信道适配器,正在出现拥塞。系统10也通过按照与反馈信号的量级成比例的量改变数据包注入速率(在滑动窗口中)来补偿该拥塞并基于该拥塞程度来动态重新调节反馈信号(值)。
应当注意,在有些作为替换的实现中,流程图方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。因为此处所示的流程图仅仅是实例。此处描述的示图或步骤在不脱离本发明的精神的情况下可以有各种变化形式。例如,步骤可以同时和/或按照不同顺序来执行、或这可以添加、删除和/或修改一些步骤。所有这些变化形式都是要求保护的发明的一部分。
此处所用的术语是仅仅是出于描述特定实施例并不是为了显示奔放买哪个。如此处所使用的,单数形式“一”“一个”以及“该”也意图包括复数形式,除非在上下文中有清楚的指明。还应该理解到,术语“包括”和/或“包含”在用于本说明书时,指的是所给出的特征、整数、步骤、操作、元件和/或组件,但并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或其组合。
在下面权利要求书中的所有装置或步骤加功能元件的对应结构、材料、动作以及等同方式意图包括用于与所具体请求保护的其他声称的元件一起执行该功能的任何结构、材料或行为。为了图释和描述的目的已经给出了本发明的说明书,但是其并不是意图以所披露的方式穷尽或限制本发明。对本领域普通技术人员而言,在不脱离本发明的范围和精神的情况下,很清楚将会有很多修改方式和变化形式。选择和描述该实施例是为了更好解释本发明的原理和实际应用,并且使得本领域普通技术人员中的其他人能够理解用于各种实施例的本发明,因为各种实施例适于所想到的特定用途。
尽管已经描述了本发明的优选实施例,但是在现在和将来的本领域普通技术人员将理解到可以进行落入本发明后面的权利要求的范围内的各种改进和增强,这些权利要求都被认为是为了维持对前面描述的本发明的适当保护。

Claims (11)

1.一种用于收敛增强以太网络的可靠性的系统,包括:
多个端点,每个包括层-4传送层,其中每个端点连接到数据中心桥接DCB层-2网络;以及
在层-4传送层和DCB层-2网络之间的适配器,用于将DCB网络和传送层的至少一个所提供的无损网络和有损网络之间的流量和拥塞控制反馈信号的至少一个转化为用于控制由传送层进行的传输的被整合的反馈信号;
其中所述DCB层-2网络根据量化的拥塞通知QCN协议生成拥塞控制反馈信号;
其中所述端点通过终端站连接到所述DCB层-2网络,其中该终端站响应于接收到拥塞控制信号实现量化的拥塞通知QCN反应点,该反应点基于QCN协议施加速率限制以便限制所述DCB层-2网络中的网络拥塞。
2.根据权利要求1所述的系统,其中所述DCB层-2网络根据支持多个优先级的流量控制协议生成流量控制信号。
3.根据权利要求1所述的系统,其中所述传送层所生成的网络流通量通过将终端站配置为将该流通量转向优先级流量控制PFC协议的有损优先级或通过不使用任何PFC协议而采用有损操作在层-2上被传送。
4.根据权利要求1所述的系统,其中所述传送层所生成的网络流通量通过将终端站配置为将该流通量转向优先级流量控制PFC协议的无损优先级以及使得终端站对由相邻切换器生成的层-2流量控制消息作出反应而采用无损操作在层-2上被传送。
5.根据权利要求1所述的系统,其中所述适配器将所述流量和拥塞控制反馈信号预处理为整合的反馈信号,该预处理包括对初级反馈信号进行延迟、聚合、过滤、增强以及抽取的至少一个。
6.一种用于收敛增强以太网络的可靠性的方法,包括:
提供多个端点,每个包括层-4传送层,其中每个端点连接到数据中心桥接DCB层-2网络;以及
在层-4传送层和所述DCB层-2网络之间安置适配器,以便将DCB网络和传送层的至少一个所提供的流量和无损网络和有损网络之间的拥塞控制反馈信号的至少一个转化为用于控制由传送层进行的传输的被整合的反馈信号;
根据量化的拥塞通知QCN协议在所述DCB层-2网络处生成拥塞控制反馈信号;
通过终端站将所述端点连接到所述DCB层-2网络,其中该终端站响应于接收到拥塞控制信号,实现量化的拥塞通知QCN反应点,该反应点基于QCN协议施加速率限制以便限制所述DCB层-2网络中的网络拥塞。
7.根据权利要求6所述的方法,还包括:根据支持多个优先级的流量控制协议在所述DCB层-2网络处生成流量控制信号。
8.根据权利要求6所述的方法,还包括:通过配置终端站将该流通量转向优先级流量控制PFC协议的有损优先级或通过不使用任何PFC协议,采用有损操作在层-2上传送所述传送层所生成的网络流通量。
9.根据权利要求6所述的方法,还包括:通过配置终端站将该流通量转向优先级流量控制PFC协议的无损优先级以及使得终端站对由相邻切换器生成的层-2流量控制消息作出反应,采用无损操作在层-2上传送所述传送层所生成的网络流通量。
10.根据权利要求6所述的方法,还包括:处理TCP ACK和控制相关联的TCP传输,其中所述整合的反馈信号包括TCP流量速率限制、TCP流量缓冲器占用度量以及TCP流量速率限制中的至少一个。
11.根据权利要求6所述的方法,还包括:经过拥塞模块,响应于所述整合的反馈信号,调节TCP流量拥塞窗口以及传输调度。
CN201380008254.1A 2012-02-06 2013-01-23 用于收敛增强以太网络的可靠性的方法和系统 Active CN104094559B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/366,640 2012-02-06
US13/366,640 US20130205038A1 (en) 2012-02-06 2012-02-06 Lossless socket-based layer 4 transport (reliability) system for a converged ethernet network
PCT/EP2013/051169 WO2013117427A1 (en) 2012-02-06 2013-01-23 Lossless socket-based layer 4 transport (reliability) system for a converged ethernet network

Publications (2)

Publication Number Publication Date
CN104094559A CN104094559A (zh) 2014-10-08
CN104094559B true CN104094559B (zh) 2016-12-14

Family

ID=47598844

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380008254.1A Active CN104094559B (zh) 2012-02-06 2013-01-23 用于收敛增强以太网络的可靠性的方法和系统

Country Status (4)

Country Link
US (2) US20130205038A1 (zh)
EP (1) EP2829025A1 (zh)
CN (1) CN104094559B (zh)
WO (1) WO2013117427A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013140602A1 (ja) * 2012-03-23 2013-09-26 富士通株式会社 輻輳制御方法、輻輳制御装置、通信システム及び輻輳制御プログラム
US9166925B2 (en) * 2013-04-05 2015-10-20 International Business Machines Corporation Virtual quantized congestion notification
US9325639B2 (en) 2013-12-17 2016-04-26 At&T Intellectual Property I, L.P. Hierarchical caching system for lossless network packet capture applications
KR101536141B1 (ko) * 2014-02-13 2015-07-13 현대자동차주식회사 이더넷과 can 통신 간의 신호 변환을 제공하는 차량용 장치 및 그 제어방법
CN104980359A (zh) * 2014-04-04 2015-10-14 中兴通讯股份有限公司 以太网光纤通道的流量控制方法、装置及系统
US9614765B2 (en) 2014-08-26 2017-04-04 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Quantized congestion notification (QCN) proxy function in data center bridging capabilities exchange (DCBX) protocol
CN112968811A (zh) * 2021-02-20 2021-06-15 中国工商银行股份有限公司 一种rdma网络的pfc异常处理方法及装置
US11683250B2 (en) * 2021-10-22 2023-06-20 Palo Alto Networks, Inc. Managing proxy throughput between paired transport layer connections

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6426944B1 (en) * 1998-12-30 2002-07-30 At&T Corp Method and apparatus for controlling data messages across a fast packet network
CN101558616A (zh) * 2006-12-18 2009-10-14 英国电讯有限公司 进行拥塞标记的方法和系统
CN101711468A (zh) * 2007-03-12 2010-05-19 思杰系统有限公司 用于在tcp拥塞控制中提供服务质量优先的系统和方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7564869B2 (en) 2004-10-22 2009-07-21 Cisco Technology, Inc. Fibre channel over ethernet
US7961621B2 (en) 2005-10-11 2011-06-14 Cisco Technology, Inc. Methods and devices for backward congestion notification
US7821939B2 (en) 2007-09-26 2010-10-26 International Business Machines Corporation Method, system, and computer program product for adaptive congestion control on virtual lanes for data center ethernet architecture
KR101303718B1 (ko) * 2009-02-27 2013-09-04 브로드콤 코포레이션 가상 머신 네트워킹을 위한 방법 및 시스템
US8458305B2 (en) * 2009-08-06 2013-06-04 Broadcom Corporation Method and system for matching and repairing network configuration
US8504690B2 (en) 2009-08-07 2013-08-06 Broadcom Corporation Method and system for managing network power policy and configuration of data center bridging
WO2011099365A1 (ja) 2010-02-12 2011-08-18 日本電気株式会社 ネットワークシステム及び輻輳制御方法
US20110261686A1 (en) 2010-04-21 2011-10-27 Kotha Saikrishna M Priority Pause (PFC) in Virtualized/Non-Virtualized Information Handling System Environment
US8767742B2 (en) 2010-04-22 2014-07-01 International Business Machines Corporation Network data congestion management system
US20110261696A1 (en) 2010-04-22 2011-10-27 International Business Machines Corporation Network data congestion management probe system
JP5580706B2 (ja) 2010-09-29 2014-08-27 Kddi株式会社 再送制御プロトコルを用いるデータ転送装置、プログラム及び方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6426944B1 (en) * 1998-12-30 2002-07-30 At&T Corp Method and apparatus for controlling data messages across a fast packet network
CN101558616A (zh) * 2006-12-18 2009-10-14 英国电讯有限公司 进行拥塞标记的方法和系统
CN101711468A (zh) * 2007-03-12 2010-05-19 思杰系统有限公司 用于在tcp拥塞控制中提供服务质量优先的系统和方法

Also Published As

Publication number Publication date
EP2829025A1 (en) 2015-01-28
US20130205038A1 (en) 2013-08-08
US9356867B2 (en) 2016-05-31
WO2013117427A1 (en) 2013-08-15
US20130205039A1 (en) 2013-08-08
CN104094559A (zh) 2014-10-08

Similar Documents

Publication Publication Date Title
CN104094559B (zh) 用于收敛增强以太网络的可靠性的方法和系统
US9413814B2 (en) Systems and methods for providing quality of service via a flow controlled tunnel
US9961585B2 (en) Network-side buffer management
JP5005003B2 (ja) トンネルのトランスポートチャネル上のデータストリームの送信を管理する方法、対応するトンネル終点及びコンピュータ読み取り可能な記憶媒体
US10361921B2 (en) Method and apparatus for managing connections in a communication network
JP2006287331A (ja) 輻輳制御ネットワーク中継装置、および輻輳制御ネットワーク中継方法
EP2959645A1 (en) Dynamic optimization of tcp connections
WO2017009715A1 (en) Method and apparatus for managing network congestion
Verma et al. An adaptive data chunk scheduling for concurrent multipath transfer
WO2017045501A1 (zh) 一种报文调度方法和装置、存储介质
Ye et al. PTP: Path-specified transport protocol for concurrent multipath transmission in named data networks
Liu et al. An UDP-based protocol for internet robots
Tran et al. Making the Linux TCP stack more extensible with eBPF
Alins et al. XPLIT: A cross-layer architecture for TCP services over DVB-S2/ETSI QoS BSM
Tomita et al. Data uploading time estimation for CUBIC TCP in long distance networks
EP2685658A1 (en) Technique for handling a data packet stream
Ehsan et al. Modeling TCP performance with proxies
Sungur Tcp–random early detection (red) mechanism for congestion control
Bisio et al. Performance enhanced proxy solutions for satellite networks: state of the art, protocol stack and possible interfaces
Liu et al. Experimental comparison of high-speed transmission control protocols on a traffic-driven labeled optical burst switching network test bed for grid applications
Osada et al. Performance improvement of tcp using performance enhancing proxies-effect of premature ack transmission timing on throughput
López-Pacheco et al. Enabling large data transfers on dynamic, very high-speed network infrastructures
Gumaste et al. Demonstration of omnipresent ethernet: A novel metro end-to-end communication system using binary ${+} $ source routing and carrier Ethernet
EP3389206B1 (en) Multipath error correction
Zou et al. Performance evaluation of subflow capable SCTP

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant