CN106101005A - 一种数据中心网络中基于分组长度的拥塞控制方法 - Google Patents

一种数据中心网络中基于分组长度的拥塞控制方法 Download PDF

Info

Publication number
CN106101005A
CN106101005A CN201610648257.7A CN201610648257A CN106101005A CN 106101005 A CN106101005 A CN 106101005A CN 201610648257 A CN201610648257 A CN 201610648257A CN 106101005 A CN106101005 A CN 106101005A
Authority
CN
China
Prior art keywords
length
switch
buffer queue
packet
block length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610648257.7A
Other languages
English (en)
Other versions
CN106101005B (zh
Inventor
黄家玮
刘敬玲
王建新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN201610648257.7A priority Critical patent/CN106101005B/zh
Publication of CN106101005A publication Critical patent/CN106101005A/zh
Application granted granted Critical
Publication of CN106101005B publication Critical patent/CN106101005B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/17Interaction among intermediate nodes, e.g. hop by hop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/50Queue scheduling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • H04L47/80Actions related to the user profile or the type of traffic

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种数据中心网络中基于分组长度的拥塞控制方法,在交换机转发分组时,依据缓存队列长度来调节分组长度,当前缓存队列长度q小于阈值q0时,分组长度减小得少,降低包头开销;当前队列长度q大于阈值q0时,分组长度减小得多,有效地降低数据中心网络在高并发传输发生超时的概率,缓解TCP Incast问题,从而提升网络的有效吞吐量。

Description

一种数据中心网络中基于分组长度的拥塞控制方法
技术领域
本发明涉及一种数据中心网络中基于分组长度的拥塞控制方法。
背景技术
数据中心使用通过数据中心网络(DCN,Data Center Network)相互连接的服务器集群处理各种不同的在线业务,如网页搜索、大规模云存储和社会网络应用。数据中心的设计理念是高可用性、高计算性能和低组件成本。数据中心大量采用了ToR机架式服务器和以太网交换机等硬件设备。为了节省成本,交换机只有较小容量的缓冲区。
数据中心虽然采用成熟的TCP/IP作为通信协议,但传统TCP主要适用于广域网络,而无法最大限度地在数据中心网络中发挥通信能力。首先,数据中心的典型服务应用,如集群存储系统和大规模网页搜索,都是采用进程同步机制和多对一的通信模式来实现高性能和服务可靠性。其次,当所有工作机通过同一输出端口同时传输数据时,浅缓冲区的ToR交换机就会经历严重的缓冲区溢出。如果一个TCP连接中整个拥塞窗口内的数据包都丢失,这个连接就要遭受RTO的超时。一旦超时,所有工作机就要等这条TCP重传后才能启动发送下一轮的数据。因为操作系统中默认的最小的RTO为200ms或300ms,所以RTO的过度空闲时间会使得有效带宽吞吐量最多降低到原有10%,这就是TCP Incast问题。
针对数据中心网络的TCP Incast问题,很多文献都提出了DCN TCP拥塞控制的方法。其中,DCTCP协议利用显式拥塞通知(Explicit Congestion Notification,ECN)来判断拥塞状态,在拥塞发生之前提前降低发送速率。由于采用了精确的ECN作为反馈信息,DCTCP大幅降低了交换机队列长度和丢包的可能性。但是,DCTCP协议是一种基于拥塞窗口的传输协议。当并发数过大时,即使所有的发送方都将拥塞窗口置为极小值1,交换机缓存依然会拥塞丢包。而且,DCTCP流在极小拥塞窗口下,更容易发生整个拥塞窗口的包丢失而导致RTO超时。它们都是通过调整TCP拥塞窗口大小来减少瓶颈链路中包的数量。这种方式对适量流产生的拥塞有效,而无法解决高并发流产生的拥塞,在高并发流的情况下,减小拥塞窗口,交换机仍然会遭到频繁的溢出。
针对高并发传输的吞吐率崩溃问题,Packet Slicing依据并发流数和缓存大小来调整数据包的大小,从而在不降低拥塞窗口的情况下,避免缓存的拥塞,有效地降低了TCP的超时概率。但这个方法需要在交换机上实时测量并发流的数量和拥塞窗口的大小,在部署上难度较大。
发明内容
本发明为了以较小的部署代价来解决TCP Incast问题,提出依据缓存队列长度动态调整分组长度的方法,不但能有效降低TCP流发生超时的概率,还避免了较大的部署开销,最终提高了大并发TCP流的传输效率。
一种数据中心网络中基于分组长度的拥塞控制方法,包括以下几个步骤:
步骤一:初始化交换机数据,包括交换机中的数据分组长度s、缓存队列长度q、缓存队列门限阈值q0以及切包率k;
步骤二:依据交换机接收的数据分组,更新交换机当前数据分组长度和缓存队列长度,依据缓存队列长度调节切包率k;交换机按切包率k更新ICMP包的MTU字段,并将该ICMP包发送到发送数据分组到交换机的发送端主机;
步骤三:交换机转发缓存队列队头分组,更新缓存队列长度,等待下一次数据分组的到来,并返回步骤二。
所述初始化交换机数据是指交换机中的数据分组长度s初始化为1500字节,缓存队列长度q初始化为当前缓存中的分组数,缓存队列门限阈值q0初始化为交换机出端口的缓冲区大小B的一半,切包率k初始化为1。
所述更新交换机当前数据分组长度和缓存队列长度是指将交换机当前数据分组长度s更新为收到的数据分组Pa的长度,将交换机当前的缓存队列长度q更新为交换机收到的数据分组Pa的长度和缓存队列长度q两者之和;
所述依据缓存队列长度调节切包率k:
其中,为向下取整符号;切包率k为当前分组长度和目标分组长度的比值。
所述更新ICMP包的MTU字段是指将ICMP包的MTU字段修改为
所述步骤三中更新缓存队列长度是指将更新前的缓存队列长度减去交换机已转发的缓存队列队头分组的长度。
有益效果
本发明提供了一种数据中心网络中基于分组长度的拥塞控制方法,在交换机转发分组时,依据缓存队列长度来调节分组长度,当前缓存队列长度q小于阈值q0时,k值减半,分组长度减小得少,降低包头开销;当前队列长度q大于阈值q0时,k值加1,分组长度减小得多;有效地降低数据中心网络在高并发传输发生超时的概率,缓解TCP Incast问题,从而提升网络的有效吞吐量。
附图说明
图1为本发明的流程图。
图2为30条DCTCP流在是否调整分组长度的两种情况下各性能指标示意图,其中,(a)为TCP序列号随时间增长的变化示意图,(b)为拥塞窗口随时间增长的变化示意图,(c)为缓冲区占用随时间增长的变化示意图,(d)即时有效吞吐量随时间增长的变化示意图;
图3为不同协议在是否调整分组长度两种情况下各性能指标示意图,其中,(a)为有效吞吐量随发送端数目增加的变化示意图,(b)为支持的最大并发流的数量示意图。
具体实施方式
下面将结合附图和实施例对本发明做进一步的说明。
参见图1,一种数据中心网络中基于分组长度的拥塞控制方法,简称为APS,过程如下:
步骤一:交换机数据分组长度s初始化为1500字节,缓存队列长度q初始化为当前缓存中的分组数,缓存队列门限阈值q0初始化为交换机出端口的缓冲区大小B的一半,切包率k初始化为1。
步骤二:交换机在接收到发送端的数据分组Pa后,分别将当前分组长度s和缓存队列长度q更新为Pa的长度和q+s。根据缓存队列长度调节切包率k,通过下式计算k值:
其中,q为当前队列长度,q0为缓存队列门限阈值。
交换机将ICMP包的MTU字段修改为并将ICMP包发送给Pa的发送端主机。
步骤三:交换机转发缓存队列队头分组Pd,并将缓存队列长度q减去Pd的长度。
本发明首先利用NS2网络仿真平台来实现,并进行以下性能测试。
图2(a)为30条DCTCP流在是否调整分组长度的两种情况下TCP序列号随时间增长的变化。DCTCP流在没有调整分组长度的情况下会在0.8ms时超时,200ms后才完成传输。相反,在APS的帮助况下,DCTCP没有发生超时并且在19ms时就完成了流传输。
图2(b)为30条DCTCP流在是否调整分组长度的两种情况下拥塞窗口随时间增长的变化。DCTCP流在应用调整分组APS的情况下拥塞窗口大小保持在2-3。而在没有调整分组长度的情况下,流会经历整窗包丢失,进而导致超时的发生。
图2(c)为30条DCTCP流在是否调整分组长度的两种情况下缓冲区占用随时间增长的变化。如图2(c)所示,由于30条高并发流,DCTCP队列很快就占据了64KB的交换机缓存,这样就会导致一些包丢失和超时。DCTCP在APS的帮助下,缓存占用最大达到40KB。之后,ICMP包携带着期望的分组长度返回给发送方。发送者调整分组长度,在传输剩余数据期间稳定了缓冲区占用率。
图2(d)为30条DCTCP流在是否调整分组长度的两种情况下即时有效吞吐量随时间增长的变化。结合了调整分组长度方法APS的DCTCP实现了满瓶颈链路利用率。由于超时事件的影响,没有结合调整分组长度方法APS的DCTCP必须等待漫长的空闲时间,大大地降低了总链路利用率。
图3(a)为不同协议在是否调整分组长度两种情况下有效吞吐量随发送端数目增加的变化。每个发送端分别发送一条流给汇聚机,当发送端的数目达到30的时候,DCTCP、D2TCP、L2DCT的性能遭受严重下降。但如果使用APS方法,这三种协议都能得到很高的吞吐量。当发送端达到300个时,结合了APS的三种协议的网络吞吐量平均提高了25倍。随着发送端的增加,因为额外的包头开销更大,网络吞吐量有所下降。
图3(b)为不同协议在是否调整分组长度两种情况下支持的最大并发流的数量。因为分组长度有最小限制,最小为64B,这限制了调整分组长度方法的有效性。可以看出,APS通过调整分组长度,帮助DCTCP、D2TCP、L2DCT协议平均提高了17倍的并发流数量。PacketSlicing能将并发流数量平均提升19倍,但这需要交换机上采集拥塞窗口大小和并发流数,具有较大的部署开销。
综上所述,本发明所述方法较好的处理了高并发传输的吞吐率崩溃问题,避免缓存的拥塞,有效地降低了TCP的超时概率且部署代价低。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种数据中心网络中基于分组长度的拥塞控制方法,其特征在于,包括以下几个步骤:
步骤一:初始化交换机数据,包括交换机中的数据分组长度s、缓存队列长度q、缓存队列门限阈值q0以及切包率k;
步骤二:依据交换机接收的数据分组Pa,更新交换机当前数据分组长度和缓存队列长度,依据缓存队列长度调节切包率k;交换机按切包率k更新ICMP包的MTU字段,并将该ICMP包发送到发送数据分组到交换机的发送端主机;
步骤三:交换机转发缓存队列队头分组,更新缓存队列长度,等待下一次数据分组的到来,并返回步骤二。
2.根据权利要求1所述的方法,其特征在于,所述初始化交换机数据是指交换机中的数据分组长度s初始化为1500字节,缓存队列长度q初始化为当前缓存中的分组数,缓存队列门限阈值q0初始化为交换机出端口的缓冲区大小B的一半,切包率k初始化为1。
3.根据权利要求1或2所述的方法,其特征在于,所述更新交换机当前数据分组长度和缓存队列长度是指将交换机当前数据分组长度s更新为收到的数据分组Pa的长度,将交换机当前的缓存队列长度q更新为交换机收到的数据分组Pa的长度和缓存队列长度q两者之和;
所述依据缓存队列长度调节切包率k:
其中,为向下取整符号;
所述更新ICMP包的MTU字段是指将ICMP包的MTU字段修改为
4.根据权利要求3所述的方法,其特征在于,所述步骤三中更新缓存队列长度是指将更新前的缓存队列长度减去交换机已转发的缓存队列队头分组的长度。
CN201610648257.7A 2016-08-09 2016-08-09 一种数据中心网络中基于分组长度的拥塞控制方法 Active CN106101005B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610648257.7A CN106101005B (zh) 2016-08-09 2016-08-09 一种数据中心网络中基于分组长度的拥塞控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610648257.7A CN106101005B (zh) 2016-08-09 2016-08-09 一种数据中心网络中基于分组长度的拥塞控制方法

Publications (2)

Publication Number Publication Date
CN106101005A true CN106101005A (zh) 2016-11-09
CN106101005B CN106101005B (zh) 2018-12-25

Family

ID=57455859

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610648257.7A Active CN106101005B (zh) 2016-08-09 2016-08-09 一种数据中心网络中基于分组长度的拥塞控制方法

Country Status (1)

Country Link
CN (1) CN106101005B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107026716A (zh) * 2017-05-12 2017-08-08 中南大学 一种数据中心网络中基于并发度感知的传输控制方法
CN108833293A (zh) * 2018-06-20 2018-11-16 北京邮电大学 一种基于软件定义网络sdn的数据中心拥塞控制方法及装置
CN116915706A (zh) * 2023-09-13 2023-10-20 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 数据中心网络拥塞控制方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003217146A1 (en) * 2003-03-20 2004-10-11 Agency For Science, Technology And Research Method and apparatus for controlling congestion in communications network
CN101662842A (zh) * 2009-10-09 2010-03-03 天津大学 一种应用于无线自组织网络的tcp参数调节方法
CN104052684A (zh) * 2013-03-15 2014-09-17 国际商业机器公司 动态适配计算机网络中的最大传输单元大小的方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003217146A1 (en) * 2003-03-20 2004-10-11 Agency For Science, Technology And Research Method and apparatus for controlling congestion in communications network
CN101662842A (zh) * 2009-10-09 2010-03-03 天津大学 一种应用于无线自组织网络的tcp参数调节方法
CN104052684A (zh) * 2013-03-15 2014-09-17 国际商业机器公司 动态适配计算机网络中的最大传输单元大小的方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JIAWEI HUANG, YI HUANG, JIANXIN WANG: "Packet Slicing for Highly Concurrent TCPs in Data Center Networks with COTS Switches", 《2015 IEEE 23RD INTERNATIONAL CONFERENCE ON NETWORK PROTOCOLS(ICNP)》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107026716A (zh) * 2017-05-12 2017-08-08 中南大学 一种数据中心网络中基于并发度感知的传输控制方法
CN107026716B (zh) * 2017-05-12 2019-07-26 中南大学 一种数据中心网络中基于并发度感知的传输控制方法
CN108833293A (zh) * 2018-06-20 2018-11-16 北京邮电大学 一种基于软件定义网络sdn的数据中心拥塞控制方法及装置
CN116915706A (zh) * 2023-09-13 2023-10-20 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 数据中心网络拥塞控制方法、装置、设备及存储介质
CN116915706B (zh) * 2023-09-13 2023-12-26 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 数据中心网络拥塞控制方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN106101005B (zh) 2018-12-25

Similar Documents

Publication Publication Date Title
CN105933232B (zh) 支持多业务数据传输需求的多径传输控制终端及方法
US8547839B2 (en) TCP congestion control for heterogeneous networks
US11018701B2 (en) Reliable data transmission method based on reliable UDP and fountain code in aeronautical ad hoc networks
WO2020063003A1 (zh) 拥塞控制方法和网络设备
Dreibholz et al. Transmission scheduling optimizations for concurrent multipath transfer
CN110662256B (zh) 多路径跨协议传输的数据包调度方法及系统
Abed et al. Characterization and observation of (transmission control protocol) TCP-Vegas performance with different parameters over (Long term evolution) LTE networks
WO2017114231A1 (zh) 一种报文发送方法、tcp代理以及tcp客户端
Zhang et al. Congestion control and packet scheduling for multipath real time video streaming
CN106101005A (zh) 一种数据中心网络中基于分组长度的拥塞控制方法
US9832679B2 (en) Window regulator for improved performance in a communications network
CN113329413B (zh) 用于高铁场景的多路径传输数据预调度方法及系统
Hayashi et al. Improving fairness of quantized congestion notification for data center ethernet networks
CN114828081A (zh) 基于路径恢复的协同混合拥塞控制方法
Eklund et al. Efficient scheduling to reduce latency for signaling traffic using CMT-SCTP
Wallace et al. On-demand scheduling for concurrent multipath transfer under delay-based disparity
Latif et al. An investigation of scheduling and packet reordering algorithms for bandwidth aggregation in heterogeneous wireless networks
CN107018086B (zh) 一种数据中心网络中基于数据包优先级的传输控制方法
Szilágyi et al. Efficient LTE PDCP buffer management
Wu et al. COded taking and giving (COTAG): Enhancing transport layer performance over indoor millimeter wave access networks
CN110266608B (zh) 一种基于队列缓存平衡因子的mptcp传输控制方法
Rizk et al. Improving GridFTP performance with split TCP connections
Heuschkel et al. Udp++: Cross-layer optimizable transport protocol for managed wireless networks
CN107370687A (zh) 一种网络tcp流量控制方法
Wang et al. DSTP-end to end based approach to optimize data transmission for satellite communications

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant