CN107171842A - 基于强化学习的多路径传输协议拥塞控制方法 - Google Patents

基于强化学习的多路径传输协议拥塞控制方法 Download PDF

Info

Publication number
CN107171842A
CN107171842A CN201710366309.6A CN201710366309A CN107171842A CN 107171842 A CN107171842 A CN 107171842A CN 201710366309 A CN201710366309 A CN 201710366309A CN 107171842 A CN107171842 A CN 107171842A
Authority
CN
China
Prior art keywords
state
action
area
sub
ack
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710366309.6A
Other languages
English (en)
Other versions
CN107171842B (zh
Inventor
薛超婧
李文中
陆桑璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN201710366309.6A priority Critical patent/CN107171842B/zh
Publication of CN107171842A publication Critical patent/CN107171842A/zh
Application granted granted Critical
Publication of CN107171842B publication Critical patent/CN107171842B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/02Topology update or discovery
    • H04L45/08Learning-based routing, e.g. using neural networks or artificial intelligence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/24Multipath
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/12Avoiding congestion; Recovering from congestion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/27Evaluation or update of window size, e.g. using information derived from acknowledged [ACK] packets

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于强化学习的多路径传输协议拥塞控制方法,通过建立马尔可夫决策过程,将拥塞控制形式化表示。用发送端的各个子流的拥塞窗口大小以及各个子流的RTT来表示各个子流当前的网络状态,定义发送端调整拥塞窗口和发送间隔的动作,建立目标方程,以获得最大平均吞吐量和最小平均时延为目的。通过建立网络模型,模拟产生多种网络环境。在不同的网络环境中,通过不断地试错,对当前网络环境做所有的动作,然后从环境给出的反馈中学习并优化动作。经过大量的线下学习,使得发送端可以在某一个状态区域做出相应的调整拥塞窗口大小和发送间隔的动作,以使得目标方程的值最大。

Description

基于强化学习的多路径传输协议拥塞控制方法
技术领域
本发明涉及拥塞控制领域,具体涉及一种多路径传输协议拥塞控制方法。
背景技术
传输控制协议(Transmission Control Protocol,TCP)是一种面向连接的、可靠的、基于字节流的传输层通信协议。网络中有95%的流量来自于TCP连接,TCP连接的两端一般使用一条路径来传输数据。而随着多种接入技术的发展,现如今大多数的主机都配置有多个网络接口,也可以通过USB接口来扩展网络接口。而且智能移动终端越来越普及,它们也往往都同时具有蜂窝网络接口(如3G接口、4G接口)和WiFi两种接口。传统TCP协议只能将每个连接绑定到单个接口,因此不能有效利用现今设备的多个接口,这将会造成大量的资源浪费。近年来,IETF工作组提出了对传统TCP协议的扩展协议,多路径TCP(Multi-pathTCP,MPTCP)。MPTCP将单个TCP的数据分流到多个不同的子流,每一条子流会走不同的路径,从而形成多条链路。这样就可以充分利用设备的多个网络接口,实现最大的吞吐量和鲁棒性。
网络中的拥塞现象是由于通信子网中某一部分的分组数量过多,使得该部分的网络来不及处理,以致引起这部分乃至整个网络性能下降的现象,严重时甚至会导致网络瘫痪。拥塞控制就是防止过多的数据注入网络,这样可以使网络中的路由器或者链路不会过载。MPTCP的拥塞控制机制决定在每个子流上发送多少数据,这样做的目的是将流量从比较拥挤的路径转移到不那么拥塞的路径上,从而提高吞吐量。链接增长算法(LinkedIncreases Algorithm,LIA)是MPTCP的默认拥塞控制算法,在多路径速率分配时,综合考虑了丢包率和往返时间(Round Time Trip,RTT)。但是由于MPTCP需要收到各个子流的数据并排序后才能上传到应用层,所以当MPTCP的子流之间速率差异较大时,快子流需要“等待”慢子流的数据,如果慢子流的数据迟迟不来,而快子流的数据不停地到达,则容易造成接收端的缓冲区溢出,从而导致来自快子流的数据包也可能被丢弃,使得网络性能下降。
发明内容
发明目的:正是基于以上的原因,本发明提出一种基于强化学习的多路径控制协议拥塞控制方法。通过在网络环境中进行反复学习,得到一组对应于该网络的从状态到动作的映射表,从而使得网络设备知道在不同网络状态下如何改变窗口大小以获得最好的性能。
技术方案:一种基于强化学习的多路径传输控制协议拥塞控制方法,应用于多路径传输控制协议中,包括以下步骤:
1)建立拥塞控制的马尔可夫模型,具体包括:
设置作为发送端的状态,cwndi为第i个子流的拥塞窗口,n为子流个数,rtti为第i个子流的往返时间RTT,min{rtt}为所有子流中的最小RTT,ack_ewma为连续收到两个确认的时间间隔的指数加权移动平均;
设置{m,b,r}作为发送端的动作,m为对当前拥塞窗口的乘数,b为对当前拥塞窗口的加数,m和b都是用于调整当前拥塞窗口大小,r为发送子流的时间间隔,通过调节发送间隔以达到调节发送速率的目的;一般设置为m={0,0.1,0.5,1,2},b={0,+/-1,+/-4,+/-8},r={+/-0.01,+/-0.08,+/-0.64};
为了使平均吞吐量最大化并且使各个子流的平均时延最小化,设置作为目标方程,throughputi为第i个子流在指定时间内的吞吐量,delayi为第i个子流从发送端到达接收端的传输时延,δ为时延的权重;
2)对网络环境采样,得到马尔可夫模型的状态参数;
3)根据状态参数对马尔可夫模型进行迭代训练,得到从状态到动作的映射表;
4)在网络中应用状态-动作映射表,具体为:从拥塞避免阶段开始,发送端每收到一个确认,就计算当前的状态,然后在状态-动作映射表中找到对应的动作并执行该动作。
其中,所述步骤3)具体包括以下步骤:
31)将状态空间划分为多个区域,并设置默认动作;
32)对所有状态区域应用默认动作,找出状态最常出现的区域,作为待优化状态区域;
33)对待优化状态区域应用所有动作,选择使目标方程值最大的动作,形成状态-动作映射规则,并添加到状态-动作映射表中;
34)按照以下原则继续寻找待优化状态区域:对未经优化的区域应用所有动作,对优化过的区域应用前次优化所得到的动作,然后找出状态最常出现的区域,作为待优化状态区域;如果找到的是已经优化过的区域,则将该区域进一步划分,然后再次按照上述原则选取待优化区域;
35)重复执行步骤33)-34),直到状态区域的数目达到指定阈值为止。
在以上过程中,本发明的方法选取状态最常出现的区域作为待优化状态区域,这样可以着重优化经常会用到的规则。这种策略更有针对性,能够提高效率,节省时间。并且在选取待优化状态区域时,利用了前一次优化的成果,可以更快地逼近最优解。这体现了强化学习的思想。
工作原理:强化学习是机器学习的一个分支,是指智能系统从环境到行为映射的学习,以使奖励信号函数值最大。强化学习通常用马尔可夫决策过程(Markov DecisionProcess,MDP)来描述。如图1所示,机器处于环境E中,状态空间为X,其中每个状态x∈X是机器感知到的环境的描述,机器能够采取的动作构成了动作空间A,若某个动作a作用在当前状态x上,则转移函数P将环境从当前状态按某种概率转移到另一个状态,同时根据奖赏函数R反馈给机器一个奖赏。强化学习的目的就是求解马尔可夫决策过程MDP。简单地说,MDP就是一个机器采取行动从而改变自己的状态并获得奖励与环境发生交互的循环过程。MDP的策略完全取决于当前状态,这体现了它的马尔可夫性质。
本发明通过建立马尔可夫决策过程,将拥塞控制形式化表示。用发送端的各个子流的拥塞窗口大小以及各个子流的RTT来表示各个子流当前的网络状态,定义发送端调整拥塞窗口和发送间隔的动作,建立目标方程,以获得最大平均吞吐量和最小平均时延为目的。通过建立网络模型,模拟产生多种网络环境。在不同的网络环境中,通过不断地试错,对当前网络环境做所有的动作,然后从环境给出的反馈中学习并优化动作。经过大量的线下学习,使得发送端可以在某一个状态区域做出相应的调整拥塞窗口大小和发送间隔的动作,以使得目标方程的值最大。
有益效果:本发明利用马尔可夫决策过程实现多路径传输控制协议的拥塞控制,该方法以最大平均吞吐量和最小平均时延为目标,通过感知环境状态来学习动态系统的最优策略,不仅克服了现有技术中丢包的缺点,而且具有速度快,稳定性高,鲁棒性强等优点。并且对环境的先验知识要求低,非常适合于应用到实时网络环境中。
附图说明
图1为强化学习原理示意图;
图2为本发明的拥塞控制总体流程图;
图3为本发明的学习过程流程图;
图4为本发明的拥塞控制方法与LIA算法的应用效果对比图。
具体实施方式
下面结合附图对本发明的技术方案作进一步说明。
图2是基于强化学习的多路径传输协议拥塞控制的流程图,首先建立马尔可夫模型,然后在网络中反复学习,得到学习结果,最后在网络中应用该结果。在本实施例中,我们用模拟器模拟了一个网络环境,基于该模拟网络进行上述学习和应用过程。具体过程如下:
A)建立马尔可夫模型,包括:
A1)定义发送端的状态其中,为第i个子流的拥塞窗口与n个子流的总拥塞窗口的比,rtti/min{rtt}为第i个子流的往返时间RTT与所有子流中的最小RTT的比,ack_ewma为连续收到两个确认(ACK)的时间间隔的指数加权移动平均,其计算公式为ack_ewma(t)=aY(t)+(1-a)ack_ewma(t-1),Y(t)是ACK的时间间隔,即当前ACK到达时间减去上一个ACK的到达时间,ack_ewma(t-1)是上一个ACK的指数加权移动平均,a为历史测量值权重系数,取值在0-1之间,当a越接近1时,表示当前值的权重就越高,时效性就越强,反之,就越弱。在本实施例中a的值设置为1/8,表示在所有的ack_ewma中,新值的权重是1/8。
A2)定义发送端的动作{m,b,r},m和b表示对当前拥塞窗口大小的调整,m为对当前拥塞窗口的乘数,b为对当前拥塞窗口的加数,r为发送子流的时间间隔。在本实施例中,分别设置为m={0.1,0.5,1,2},b={+/-1,+/-4,+/-8},r={+/-0.01,+/-0.08,+/-0.64}。
A3)定义目标方程该目标方程根据资源分配理论推导而得出,其中,throughputi为第i个子流在指定时间内的吞吐量,delayi为第i个子流从发送端到达接收端的传输时延,δ为时延的权重值,取值为[0-1],δ越大表示系统对时延的要求越高。在一些对时延要求高的场景中,如网络电话或视频业务中,可以将δ设置得大一些。在本实施例中,时间设置为一分钟,δ设置为0.1。
B)在模拟器中搭建网络环境,包括:
B1)模拟网络基本状况,包括设置瓶颈链路的速度、不同网络的传输时延、网络中竞争瓶颈链路的用户个数、网络中竞争瓶颈链路的子流个数。网络状况可以根据不同的环境设置不同的参数,目的是针对不同的网络环境学习到不同的规则,以期在不同的网络中都得到理想的结果。
B2)建立网络流量模型,包括模拟网络中的应用,建立连接时产生流量,终止连接时停止流量;此外,不同的用户可能会在不同的时间建立连接,连接也有可能是长连接或者是短连接。流量模型主要体现某个发送端是否产生流量,何时产生流量。在模拟器中,我们设置所有的发送端都随机的产生流量或者终止连接,开流量或者关流量的时间服从某一个分布模式(比如指数分布),目的是模拟真实环境下不同用户竞争瓶颈链路的场景。
在本实施例中,设置瓶颈链路的速度为15Mbps,网络延迟为20ms。有4个MPTCP用户竞争瓶颈链路,且每个用户都同时使用WiFi网络和蜂窝网络,两条子流在带宽和RTT上有明显差异,蜂窝网络的RTT大约是WiFi网络的25倍。在流量模型中,开流量和关流量的时间服从指数分布。
C)根据马尔可夫模型在网络环境中开始学习,图3示出了学习的具体过程,包括:
C1)采样:首先对网络环境进行采样,确定各个状态可能出现的范围。
C2)首次划分状态空间:从每一个状态范围的中点将此状态的范围划分为两部分,将由三个状态组成的状态空间划分为8个区域。这里选取从中点划分是考虑了平均分布情况,当然也可以根据其他划分标准来划分状态空间。
C3)应用默认动作:第一次为所有状态区域应用一个统一的默认动作,默认动作设置为m=1,b=1,r=0.01,表示将当前拥塞窗口的大小乘以1再加上1,并设置子流的发送间隔为0.01ms。
C4)选择待优化状态区域:在模拟器每个发送端的每一条子流中,每当收到一个ACK,就对步骤C1)中的各个状态进行计算,然后更新当前状态。模拟器运行一分钟,找出状态最经常出现的状态区域,作为待优化状态区域。
C5)对待优化状态区域的动作进行优化:在模拟器中的所有发送端的每一条子流上穷举应用所有的动作,模拟器运行一分钟,使用抓包工具(如tcpdump)进行抓包,然后对包进行分析,计算平均吞吐量以及平均时延,如果有动作提高了目标方程的值,就用这个动作替换原来的动作。穷举完所有的动作之后,就得到了对应于这个区域的所有状态的最好的动作,从而形成一条状态区域到动作的映射规则,将该规则添加到状态-动作映射表中。得到的映射表,在系统中用带头结点的单链表的数据结构进行存储,使用该数据结构插入结点速度快。
C6)继续寻找待优化状态区域:为了利用上次学习的结果,此时对不同的状态区域应用不同的动作,其中,对尚未经过优化的区域应用所有动作,对优化过的区域应用前一次优化得到的结果动作,然后再找出状态最经常出现的区域,作为待优化状态区域。有两种情况,一种是找到了其他的区域,就按上述的优化策略进行优化。还有一种是找到的还是刚刚优化过的区域,则再沿着各个状态的中点划分此区域,再按上述的优化策略优化此区域对应的动作。
C7)重复执行步骤C5)-C6),理论上这种优化可以不停地进行下去,并且可以设置不同的状态参数和动作来达到不同的拥塞控制精度。在本实施例中,我们规定在状态区域的数目被划分到50时,停止学习,得到状态-动作映射表。
D)在网络中应用学习结果:在多路径传输控制协议运行至拥塞避免阶段时,每当发送端的一个子流收到一个ACK时,就查找上述步骤C)中得到的状态-动作映射表,找到当前状态所对应的动作,使用该动作对这条子流的拥塞窗口和发送间隔进行调整。一个发送端的所有子流共用同一个状态-动作映射表表。
本发明提出的基于强化学习的多路径传输控制协议拥塞控制方法,从当前网络环境提取状态特征,以最大平均吞吐量和最小平均时延为目标,通过感知环境状态来学习网络连接发送端的最优策略,具有速度快、稳定性高的优点。通过模拟器的实验结果表明,在两条子流有明显差异的情况下,本发明的方法取得效果远远好于LIA算法。如图4所示,S1为快子流,S2为慢子流,本发明的方法将慢子流的数据转移到了网络情况更好的子流上,虽然慢子流的吞吐量比LIA算法略低,但是在快子流上却高了很多,这表明拥塞控制的效果更好。
以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种等同变换,这些等同变换均属于本发明的保护范围。

Claims (5)

1.一种基于强化学习的多路径传输控制协议拥塞控制方法,应用于多路径传输控制协议中,其特征在于,包括以下步骤:
1)建立拥塞控制的马尔可夫模型,包括设置发送端状态、设置发送端动作以及设置目标方程;
2)对网络环境采样,得到马尔可夫模型的状态参数;
3)根据状态参数对马尔可夫模型进行迭代训练,得到从状态到动作的映射表;
4)在网络中应用状态-动作映射表。
2.根据权利要求1所述的基于强化学习的多路径传输控制协议拥塞控制方法,其特征在于,所述步骤1)中设置发送端状态、设置发送端动作以及设置目标方程具体为:
设置作为发送端的状态,其中,cwndi为第i个子流的拥塞窗口,n为子流个数,rtti为第i个子流的往返时间RTT,min{rtt}为所有子流中的最小RTT,ack_ewma为连续收到两个确认的时间间隔的指数加权移动平均;
设置{m,b,r}作为发送端的动作,其中,m为对当前拥塞窗口的乘数,b为对当前拥塞窗口的加数,r为发送子流的时间间隔;
设置为目标方程,其中,throughputi为第i个子流在指定时间内的吞吐量,delayi为第i个子流从发送端到达接收端的传输时延,δ为时延的权重。
3.根据权利要求1所述的基于强化学习的多路径传输控制协议拥塞控制方法,其特征在于,所述步骤3)具体包括以下步骤:
31)将状态空间划分为多个区域,并设置默认动作;
32)对所有状态区域应用默认动作,找出状态最常出现的区域,作为待优化状态区域;
33)对待优化状态区域应用所有动作,选择使目标方程值最大的动作,形成状态-动作映射规则,并添加到状态-动作映射表中;
34)按照以下原则继续寻找待优化状态区域:对未经优化的区域应用所有动作,对优化过的区域应用前次优化所得到的动作,然后找出状态最常出现的区域,作为待优化状态区域;如果找到的是已经优化过的区域,则将该区域进一步划分,然后再次根据所述原则选取待优化区域;
35)重复执行步骤33)-34),直到状态区域的数目达到指定阈值为止。
4.根据权利要求1所述的基于强化学习的多路径传输控制协议拥塞控制方法,其特征在于,所述步骤4)具体包括:从拥塞避免阶段开始,发送端每收到一个确认,就计算当前的状态,然后在状态-动作映射表中找到对应的动作并执行该动作。
5.根据权利要求1所述的基于强化学习的多路径传输控制协议拥塞控制方法,其特征在于,所述ack_ewma(t)的计算公式为ack_ewma(t)=aY(t)+(1-a)ack_ewma(t-1),其中,Y(t)是ACK的时间间隔,即当前ACK到达时间减去上一个ACK的到达时间,ack_ewma(t-1)是上一个ACK的指数加权移动平均,a为历史测量值权重系数。
CN201710366309.6A 2017-05-22 2017-05-22 基于强化学习的多路径传输协议拥塞控制方法 Active CN107171842B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710366309.6A CN107171842B (zh) 2017-05-22 2017-05-22 基于强化学习的多路径传输协议拥塞控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710366309.6A CN107171842B (zh) 2017-05-22 2017-05-22 基于强化学习的多路径传输协议拥塞控制方法

Publications (2)

Publication Number Publication Date
CN107171842A true CN107171842A (zh) 2017-09-15
CN107171842B CN107171842B (zh) 2020-01-03

Family

ID=59815801

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710366309.6A Active CN107171842B (zh) 2017-05-22 2017-05-22 基于强化学习的多路径传输协议拥塞控制方法

Country Status (1)

Country Link
CN (1) CN107171842B (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107864102A (zh) * 2017-11-22 2018-03-30 浙江工商大学 一种基于Sarsa的SDN数据中心拥塞控制方法
CN108401015A (zh) * 2018-02-02 2018-08-14 广州大学 一种基于深度强化学习的数据中心网络路由方法
CN108881048A (zh) * 2018-08-23 2018-11-23 北京理工大学 一种基于强化学习的命名数据网络拥塞控制方法
CN109195207A (zh) * 2018-07-19 2019-01-11 浙江工业大学 一种基于深度强化学习的集能型无线中继网络吞吐量最大化方法
CN109547505A (zh) * 2019-01-26 2019-03-29 福州大学 基于强化学习的多径tcp传输调度方法
CN110278149A (zh) * 2019-06-20 2019-09-24 南京大学 基于深度强化学习的多路径传输控制协议数据包调度方法
CN110581808A (zh) * 2019-08-22 2019-12-17 武汉大学 一种基于深度强化学习的拥塞控制方法及系统
CN111064704A (zh) * 2019-11-19 2020-04-24 中国科学院计算技术研究所 一种基于mptcp启动窗口自适应的数据传输方法、装置和介质
CN111371689A (zh) * 2018-12-25 2020-07-03 上海大学 基于深度学习的tcp拥塞控制版本识别方法和装置
CN111919423A (zh) * 2018-04-06 2020-11-10 华为技术有限公司 网络通信中的拥塞控制
CN112104563A (zh) * 2020-08-12 2020-12-18 新华三技术有限公司 一种拥塞控制方法及装置
CN112118190A (zh) * 2020-08-27 2020-12-22 广州市香雪制药股份有限公司 一种中药材种植监测网络多路径拥塞控制方法
CN112469079A (zh) * 2020-11-05 2021-03-09 南京大学 结合深度强化学习与传统拥塞控制的新型拥塞控制方法
CN112887217A (zh) * 2019-11-30 2021-06-01 华为技术有限公司 控制数据包发送方法、模型训练方法、装置及系统
CN113207147A (zh) * 2021-03-16 2021-08-03 网络通信与安全紫金山实验室 基于深度强化学习的mptcp拥塞控制方法及其存储介质
CN113300970A (zh) * 2021-01-22 2021-08-24 青岛大学 基于深度学习的tcp拥塞动态控制方法及装置
CN113454958A (zh) * 2019-02-18 2021-09-28 上海诺基亚贝尔股份有限公司 用于确定tcp拥塞窗口的方法和装置
CN113747498A (zh) * 2021-08-03 2021-12-03 上海交通大学 针对移动蜂窝网络的可配置低延迟拥塞控制方法及系统
CN115037672A (zh) * 2022-04-28 2022-09-09 北京邮电大学 多路径拥塞控制方法及装置
CN115150335A (zh) * 2022-06-30 2022-10-04 武汉烽火技术服务有限公司 一种基于深度强化学习的最优流量分割的方法和系统
CN115665060A (zh) * 2022-12-26 2023-01-31 中国华能集团清洁能源技术研究院有限公司 一种用于异构网络的多路径传输调度方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104702527A (zh) * 2015-03-24 2015-06-10 大连理工大学 多路径tcp中面向多优先级连接的拥塞时间窗控制方法
US20150263959A1 (en) * 2014-03-13 2015-09-17 Cisco Technology, Inc. Performance enhancement in a heterogeneous network environment with multipath transport protocols
CN105049369A (zh) * 2015-08-14 2015-11-11 浙江大学 异构无线网络中基于mptcp的视频传输拥塞控制方法
CN105610820A (zh) * 2015-12-28 2016-05-25 中国电子科技集团公司第五十四研究所 一种基于mptcp的拥塞控制方法及装置
CN105915466A (zh) * 2016-04-15 2016-08-31 北京邮电大学 一种mptcp路径选择的方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150263959A1 (en) * 2014-03-13 2015-09-17 Cisco Technology, Inc. Performance enhancement in a heterogeneous network environment with multipath transport protocols
CN104702527A (zh) * 2015-03-24 2015-06-10 大连理工大学 多路径tcp中面向多优先级连接的拥塞时间窗控制方法
CN105049369A (zh) * 2015-08-14 2015-11-11 浙江大学 异构无线网络中基于mptcp的视频传输拥塞控制方法
CN105610820A (zh) * 2015-12-28 2016-05-25 中国电子科技集团公司第五十四研究所 一种基于mptcp的拥塞控制方法及装置
CN105915466A (zh) * 2016-04-15 2016-08-31 北京邮电大学 一种mptcp路径选择的方法及装置

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107864102A (zh) * 2017-11-22 2018-03-30 浙江工商大学 一种基于Sarsa的SDN数据中心拥塞控制方法
CN107864102B (zh) * 2017-11-22 2020-09-04 浙江工商大学 一种基于Sarsa的SDN数据中心拥塞控制方法
CN108401015A (zh) * 2018-02-02 2018-08-14 广州大学 一种基于深度强化学习的数据中心网络路由方法
CN108401015B (zh) * 2018-02-02 2020-10-02 广州大学 一种基于深度强化学习的数据中心网络路由方法
CN111919423A (zh) * 2018-04-06 2020-11-10 华为技术有限公司 网络通信中的拥塞控制
CN109195207A (zh) * 2018-07-19 2019-01-11 浙江工业大学 一种基于深度强化学习的集能型无线中继网络吞吐量最大化方法
CN109195207B (zh) * 2018-07-19 2021-05-18 浙江工业大学 一种基于深度强化学习的集能型无线中继网络吞吐量最大化方法
CN108881048B (zh) * 2018-08-23 2019-06-14 北京理工大学 一种基于强化学习的命名数据网络拥塞控制方法
CN108881048A (zh) * 2018-08-23 2018-11-23 北京理工大学 一种基于强化学习的命名数据网络拥塞控制方法
CN111371689A (zh) * 2018-12-25 2020-07-03 上海大学 基于深度学习的tcp拥塞控制版本识别方法和装置
CN111371689B (zh) * 2018-12-25 2022-03-18 上海大学 基于深度学习的tcp拥塞控制版本识别方法和装置
CN109547505A (zh) * 2019-01-26 2019-03-29 福州大学 基于强化学习的多径tcp传输调度方法
CN109547505B (zh) * 2019-01-26 2021-05-18 福州大学 基于强化学习的多径tcp传输调度方法
CN113454958A (zh) * 2019-02-18 2021-09-28 上海诺基亚贝尔股份有限公司 用于确定tcp拥塞窗口的方法和装置
CN110278149A (zh) * 2019-06-20 2019-09-24 南京大学 基于深度强化学习的多路径传输控制协议数据包调度方法
CN110581808A (zh) * 2019-08-22 2019-12-17 武汉大学 一种基于深度强化学习的拥塞控制方法及系统
CN110581808B (zh) * 2019-08-22 2021-06-15 武汉大学 一种基于深度强化学习的拥塞控制方法及系统
CN111064704A (zh) * 2019-11-19 2020-04-24 中国科学院计算技术研究所 一种基于mptcp启动窗口自适应的数据传输方法、装置和介质
WO2021103706A1 (zh) * 2019-11-30 2021-06-03 华为技术有限公司 控制数据包发送方法、模型训练方法、装置及系统
CN112887217A (zh) * 2019-11-30 2021-06-01 华为技术有限公司 控制数据包发送方法、模型训练方法、装置及系统
CN112887217B (zh) * 2019-11-30 2022-09-09 华为技术有限公司 控制数据包发送方法、模型训练方法、装置及系统
CN112104563B (zh) * 2020-08-12 2022-08-30 新华三技术有限公司 一种拥塞控制方法及装置
CN112104563A (zh) * 2020-08-12 2020-12-18 新华三技术有限公司 一种拥塞控制方法及装置
CN112118190B (zh) * 2020-08-27 2024-07-26 广州市香雪制药股份有限公司 一种中药材种植监测网络多路径拥塞控制方法
CN112118190A (zh) * 2020-08-27 2020-12-22 广州市香雪制药股份有限公司 一种中药材种植监测网络多路径拥塞控制方法
CN112469079A (zh) * 2020-11-05 2021-03-09 南京大学 结合深度强化学习与传统拥塞控制的新型拥塞控制方法
CN112469079B (zh) * 2020-11-05 2022-04-22 南京大学 结合深度强化学习与传统拥塞控制的新型拥塞控制方法
CN113300970A (zh) * 2021-01-22 2021-08-24 青岛大学 基于深度学习的tcp拥塞动态控制方法及装置
CN113207147A (zh) * 2021-03-16 2021-08-03 网络通信与安全紫金山实验室 基于深度强化学习的mptcp拥塞控制方法及其存储介质
CN113747498A (zh) * 2021-08-03 2021-12-03 上海交通大学 针对移动蜂窝网络的可配置低延迟拥塞控制方法及系统
CN113747498B (zh) * 2021-08-03 2023-11-28 上海交通大学 针对移动蜂窝网络的可配置低延迟拥塞控制方法及系统
CN115037672A (zh) * 2022-04-28 2022-09-09 北京邮电大学 多路径拥塞控制方法及装置
CN115150335A (zh) * 2022-06-30 2022-10-04 武汉烽火技术服务有限公司 一种基于深度强化学习的最优流量分割的方法和系统
CN115150335B (zh) * 2022-06-30 2023-10-31 武汉烽火技术服务有限公司 一种基于深度强化学习的最优流量分割的方法和系统
CN115665060A (zh) * 2022-12-26 2023-01-31 中国华能集团清洁能源技术研究院有限公司 一种用于异构网络的多路径传输调度方法及装置

Also Published As

Publication number Publication date
CN107171842B (zh) 2020-01-03

Similar Documents

Publication Publication Date Title
CN107171842B (zh) 基于强化学习的多路径传输协议拥塞控制方法
CN108881048B (zh) 一种基于强化学习的命名数据网络拥塞控制方法
CN106160953B (zh) 一种基于学习型能效模型的传输方法
CN101056260B (zh) 混合网络中基于ecn机制的拥塞控制方法
CN105024940A (zh) 基于链路自适应的异构网络tcp拥塞控制方法
Su et al. QRED: A Q-learning-based active queue management scheme
WO2021103706A1 (zh) 控制数据包发送方法、模型训练方法、装置及系统
CN103312606A (zh) 一种基于多路径并发的无线Mesh网络路由及其方法
CN115037672B (zh) 多路径拥塞控制方法及装置
CN109698925A (zh) 基于数据驱动的实时视频拥塞控制方法及装置
CN109547505B (zh) 基于强化学习的多径tcp传输调度方法
Himeedah et al. Tcp congestion analysis of wired and wireless links using ns3
CN112468405B (zh) 基于信用和反应型的数据中心网络拥塞控制方法
Shreedhar et al. An empirical study of ageing in the cloud
Yamazaki et al. Fairness improvement of congestion control with reinforcement learning
Talau et al. Improving TCP performance over a common IoT scenario using the Early Window Tailoring method
Zhao et al. Multipath tcp path scheduling optimization based on q-learning in vehicular heterogeneous networks
CN114501542A (zh) 基于mptcp耦合的自适应带宽估计方法及系统
Bai et al. MACC: Cross-layer multi-agent congestion control with deep reinforcement learning
Razdan et al. Enhancing TCP performance in networks with small buffers
CN116760777B (zh) 一种基于abea3c的多路径拥塞控制方法
Meng et al. Research on TCPW improvement in hybrid network
Li et al. A concurrent multi-path transmission of data allocation algorithm based on heterogeneous networks
CN118740739A (zh) 面向TCP协议的基于Q-learning的卫星网络拥塞控制方法及控制系统
Jasem et al. Fairness of the TCP-based new AIMD congestion control algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant