CN112532530A - 一种拥塞通知信息调整的方法及设备 - Google Patents

一种拥塞通知信息调整的方法及设备 Download PDF

Info

Publication number
CN112532530A
CN112532530A CN201910882662.9A CN201910882662A CN112532530A CN 112532530 A CN112532530 A CN 112532530A CN 201910882662 A CN201910882662 A CN 201910882662A CN 112532530 A CN112532530 A CN 112532530A
Authority
CN
China
Prior art keywords
transmission
ecn
performance parameter
transmission performance
configuration information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910882662.9A
Other languages
English (en)
Other versions
CN112532530B (zh
Inventor
孟柯
郑合文
单良
温华锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201910882662.9A priority Critical patent/CN112532530B/zh
Publication of CN112532530A publication Critical patent/CN112532530A/zh
Application granted granted Critical
Publication of CN112532530B publication Critical patent/CN112532530B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/12Avoiding congestion; Recovering from congestion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/22Traffic shaping
    • H04L47/225Determination of shaping rate, e.g. using a moving window
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/25Flow control; Congestion control with rate being modified by the source upon detecting a change of network conditions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/32Flow control; Congestion control by discarding or delaying data units, e.g. packets or frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/50Queue scheduling
    • H04L47/56Queue scheduling implementing delay-aware scheduling

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请公开了一种拥塞通知信息调整的方法,包括:控制设备接收至少两个传输设备发送的每个传输设备的转发状态参数,根据每个传输设备的转发状态参数,确定第一业务的第一传输性能参数,根据第一传输性能参数相对于第二传输性能参数的变化情况,确定显示拥塞通知ECN的第一配置信息,向每个传输设备发送ECN的第一配置信息,第一配置信息用于每个传输设备调整本设备的ECN信息。本申请技术方案由于可以根据传输性能参数对ECN信息进行动态调整,从而适应实际网络中各种流量场景的需求。

Description

一种拥塞通知信息调整的方法及设备
技术领域
本申请涉及通信技术领域,具体涉及一种拥塞通知信息调整的方法及设备。
背景技术
在云存储等业务中,由于操作的高并发特性,数据中心网络会同时存在大量并发数据流,容易造成网络拥塞。网络拥塞会引入额外延时,造成报文的传输时延高、吞吐率低及资源的大量耗费。
目前支持显式拥塞通知(explicit congestion notification,ECN)机制的数据报文利用其互联网协议(internet protocol,IP)头部的ECN标志位表示网络拥塞程度,如标志位置为11时表示网络拥塞。网络中的传输设备在出端口的待发送数据队列上设置ECN水线。当待发送数据队列的深度低于ECN水线下限(Kmin)时,传输设备不打标。当队列深度高于ECN水线上限(Kmax)时,对待发送数据队列中所有报文打标,打标可以理解为将IP头ECN的标志位置为11。当队列深度位于Kmin和Kmax之间时,对待发送数据队列中的数据报文以0到最大打标概率Pmax的线性概率随机打标。流量接收端收到被ECN标记的数据报文后,生成拥塞通知报文(congestion notification packet,CNP)发往流量发送端,通知发端降低流量发送速率,以避免网络拥塞。
当前各传输设备的待发送数据队列中的ECN水线是静态配置的,无法适应实际网络中的流量的动态变化的需要。
发明内容
本申请实施例提供一种拥塞通知信息调整的方法,可以根据传输性能参数对ECN信息进行动态调整,从而适应实际网络中各种流量场景的需求。本申请实施例还提供了相应的设备。
本申请第一方面提供一种拥塞通知信息调整的方法,可以包括:
控制设备接收至少两个传输设备发送的每个传输设备的转发状态参数,所述转发状态参数是第一业务的数据经过所述每个传输设备时所产生的与拥塞相关的参数;
所述控制设备根据所述每个传输设备的转发状态参数,确定所述第一业务的第一传输性能参数;
所述控制设备根据所述第一传输性能参数相对于第二传输性能参数的变化情况,确定显示拥塞通知(explicit congestion notification,ECN)的第一配置信息,所述第二传输性能参数为之前确定的所述第一业务的传输性能参数;
所述控制设备向所述每个传输设备发送所述ECN的第一配置信息,所述第一配置信息用于所述每个传输设备调整本设备的ECN信息。
该第一方面中,传输设备可以是交换网络中的交换机,或者其他具有数据转发功能的设备,该传输设备例如可以是交换网络中的叶子(leaf)交换机。控制设备可以是交换机,例如:交换网络中的脊柱(spine)交换机,该控制设备也可以是独立于交换网络之外的设备。第一业务可以是存储业务、高性能计算(high-performance computing,HPC)业务或者人工智能(artificial intelligence,AI)业务。第一传输性能参数与第二传输性能参数是相对于,可以将第二传输性能参数理解为是上一轮控制设备通过各传输设备上报的转发性能参数确定得到的第一业务的传输性能参数。第一传输性能参数是本轮确定的。该第一方面中,控制设备可以根据传输性能参数对ECN信息进行动态调整,从而适应实际网络中各种流量场景的需求。
在第一方面的一种可能的实现方式中,该方法还可以包括:
所述控制设备通过启发式的方式不断调整所述第一配置信息,直到所述第一传输性能参数不能再优于所述第二传输性能参数;
当所述第一传输性能参数不能再优于所述第二传输性能参数时,所述控制设备确定到与最优的第一传输性能参数对应的第一配置信息。
该种可能的实现方式中,启发式的含义就是通过反复调整参数值来观察不同输出结果,当输出结果达到期望值时,确定最终想要的参数值。该实现方式中,通过不断调整第一配置信息就可以不断得到一个新的第一传输性能参数,而本轮的第一传输性能参数在执行下一轮时就会成为下一轮的第二传输性能参数。通过第一传输性能参数与第二传输性能参数的比较,就可以为第一配置信息找到调整方向,从而在第一传输性能参数达到最优时,也就找到了最合适的第一配置信息。从而有利于提高第一业务的传输性能。
在第一方面的一种可能的实现方式中,该方法还可以包括:
所述控制设备接收所述每个传输设备的局部拓扑信息;
上述步骤:控制设备根据所述每个传输设备的转发状态参数,确定所述第一业务的第一传输性能参数,可以包括:
所述控制设备根据所述局部拓扑信息和所述转发状态参数,确定所述第一业务的第一传输性能参数。
该种可能的实现方式中,可以根据局部拓扑信息和转发状态参数确定第一业务的第一传输性能参数,有利于提高第一传输性能参数的准确度。
在第一方面的一种可能的实现方式中,上述步骤:控制设备根据所述局部拓扑信息和所述转发状态参数,确定所述第一业务的第一传输性能参数,可以包括:
所述控制设备根据所述每个传输设备的局部拓扑信息和转发状态参数形成第一拓扑结构或第二拓扑结构,所述第一拓扑结构是以所述每个传输设备的标识作为列标题,以所述每个传输设备上的端口标识作为行标题形成的网格矩阵,所述第二拓扑结构是以所述每个传输设备的标识作为行标题,以所述每个传输设备上的端口标识作为列标题形成的网格矩阵,其中,每个网格中填写有所在行和所在列所指示的相应传输设备的相应端口的转发状态参数;
所述控制设备将所述第一拓扑结构或所述第二拓扑结构输入人工智能推理模型,以得到所述第一业务的第一传输性能参数,所述人工智能推理模型是通过大量不同拥塞状态下的转发状态参数和对应的传输性能参数的样本训练得到的。
该种可能的实现方式中,可以根据局部拓扑信息为转发状态参数生成拓扑结构,通过预先训练好的人工智能推理模型确定第一传输性能参数,从而提高了第一传输性能参数生成的速度和第一传输性能参数的准确度。
在第一方面的一种可能的实现方式中,该方法还可以包括:
所述控制设备根据所述每个传输设备的局部拓扑信息确定用于确定所述第一传输性能参数的所有传输设备的转发状态参数都已到达。
该种可能的实现方式中,控制设备处可以有所控制的传输设备的全局拓扑信息,通过全部拓扑信息和已到达的局部拓扑信息,可以确定是否每个传输设备的转发状态参数都已到达。或者,当控制设备处没有全局拓扑信息时控制设备可以通过链路层发现协议(link layer discovery protocol,LLDP)发现自身拓扑,确定出于自身与那些传输设备相连,从而确定出是否每个传输设备的转发状态参数都已到达。在全部都达到后,再确定第一业务的第一传输性能参数,这样可以提高第一传输性能参数的准确度。当然,也可以不需要全部传输设备的转发状态参数都达到,例如:如果收集时间到达,即使有个别传输设备的转发状态参数没到达,控制设备也会执行后续过程。
在第一方面的一种可能的实现方式中,所述第一传输性能参数包括以下至少一项:吞吐量、时延或流完成时间。
在第一方面的一种可能的实现方式中,所述转发状态参数包括以下至少一项:
待发送数据队列的出速率、待发送数据队列的当前深度、待发送数据队列的平均深度、第一ECN水线、端口ECN标记包数或基于优先级的流量控制(priority-based flowcontrol,PFC)标记数,其中,所述第一ECN水线包括本周期的ECN水线的第一下限Kmin、第一上限Kmax和第一打标概率的最大值Pmax,所述第一Pmax为当队列深度位于第一Kmin和第一Kmax之间时对待发送数据队列中的数据报文随机打标的最大概率。
在第一方面的一种可能的实现方式中,所述第一配置信息包括打标概率,或者,第二ECN水线;其中,所述第二ECN水线包括下一周期ECN水线的第二下限Kmin、第二上限Kmax和第二打标概率的最大值Pmax,所述第二Pmax为当队列深度位于第二Kmin和第二Kmax之间时对待发送数据队列中的数据报文随机打标的最大概率。
在第一方面的一种可能的实现方式中,上述步骤:控制设备根据所述第一传输性能参数相对于第二传输性能参数的变化情况,确定显示拥塞通知ECN的第一配置信息,可以包括:
若第M周期的吞吐量大于第(M-1)周期的吞吐量,则按照第(M-1)周期的第一探索方向在第(M-1)周期确定的ECN的第二配置信息的基础上调整预设步长,以得到所述第一配置信息,所述第一探索方向为所述ECN的配置信息上调或下调的方向,所述M为大于1的整数。
若第M周期的吞吐量小于第(M-1)周期的吞吐量,且M大于2时,则将所述第(M-2)周期确定的ECN的第二配置信息确定为所述第一配置信息。
若第M周期的吞吐量小于第(M-1)周期的吞吐量,且M等于2时,则将第一探索方向修改为第二探索方向,并按照所述第二探索方向在初始化的ECN的配置信息的基础上调整预设步长,以得到所述第一配置信息,所述第一探索方向与所述第二探索方向的方向相反。
该种可能的实现方式中,第一配置信息的确定过程可以是通过多个周期来实现的,第一周期中,各传输设备会被初始化一个ECN配置信息,然后每个传输设备基于该初始化的ECN的配置信息向控制设备上报各自的转发状态参数,控制设备会生成第一周期的第一传输性能参数。然后,控制设备会选择一个探索方向,例如:选择上调,控制设备会在初始化的配置信息的基础上向上调整预设步长,得到一个第一配置信息,将该第一配置信息发送给各传输设备。各传输设备接收到该第一配置信息后,可以调整本身的ECN信息,也就是可以直接使用该第一配置信息,也可以结合本设备的拥塞情况,在第一配置信息的基础上做一些微调。然后开始第二个周期,各传输设备基于调整后的ECN信息向控制设备上报自的转发状态参数,控制设备会生成第二周期的第一传输性能参数。这时第一周期的第一传输性能参数成为第二传输性能参数,将第一传输性能参数与第二传输性能参数进行比较,以传输性能参数是吞吐量为例,若第二周期的吞吐量大于第一周期的吞吐量,说明性能变好了,也意味着探索方向是正确的,控制设备会按照该上调的探索方向继续在第一配置信息的基础上再调整预设步长,再重复上述过程,直到吞吐量出现拐点,也就是,直到本周期的吞吐量小于上一周期的吞吐量。若第二周期的吞吐量小于第一周期的吞吐量,则说明第一周期所选择的探索方向错误,调整探索方向,也就是将探索方向改为下调,在初始化的ECN的配置信息的基础上下调预设步长,再重复上述过程,直到找到最好的吞吐量,这时也就确定了最合适的第一配置信息。若第一配置信息包括Kmax、Pmax和Kmin时,可以按照顺序,先调整Kmax,直到通过上述过程找到最合适的Kmax后,再调整Pmax,再重复上述的过程找到最合适的Pmax后,再调整Kmin,直到通过上述过程找到最合适的Kmin后,基于吞吐量的调整过程就结束了。得到了基于吞吐量的最合适的Kmax、Pmax和Kmin。当然,此处按照Kmax、Pmax和Kmin的顺序调整只是一种示例,其他的调整顺序也可以适用,调整原理与上述的调整原理相同。
在第一方面的一种可能的实现方式中,上述步骤:控制设备根据所述第一传输性能参数相对于第二传输性能参数的变化情况,确定显示拥塞通知ECN的第一配置信息,可以包括:
若第K周期的时延小于第(K-1)周期的时延,则按照第(K-1)周期的第一探索方向在第(K-1)周期确定的ECN的第二配置信息的基础上调整预设步长,以得到所述第一配置信息,所述第一探索方向为所述ECN的配置信息上调或下调的方向,所述K为大于1的整数。
若第K周期的时延小于第(K-1)周期的时延,且K大于2时,则将所述第(K-2)周期确定的ECN的第二配置信息确定为所述第一配置信息。
若第K周期的时延小于第(K-1)周期的时延,且K等于2时,则将第一探索方向修改为第二探索方向,并按照所述第二探索方向在初始化的ECN的配置信息的基础上调整预设步长,以得到所述第一配置信息,所述第一探索方向与所述第二探索方向的方向相反。
该种可能的实现方式中,原理与上个吞吐量的实现方式的原理一致,需要说明的是,该时延的方式可以是在上述吞吐量已到达饱和后,在保证吞吐量不会劣化的前提下再基于时延做重复调整,直到所有的条件都调整完毕,得到了最大吞吐量最小的时延对应的第一配置信息,也就是得到了最合适的Kmax、Pmax和Kmin。
本申请第二方面提供一种拥塞通知信息调整的方法,可以包括:
传输设备获取本设备的转发状态参数,所述转发状态参数是第一业务的数据经过所述传输设备时所产生的与拥塞相关的参数;
所述传输设备向所述控制设备发送所述转发状态参数,所述转发状态参数用于所述控制设备确定第一业务的第一传输性能参数;
所述传输设备接收所述控制设备发送的第一配置信息,所述第一配置信息是所述控制设备根据所述第一传输性能参数相对于第二传输性能参数的变化情况确定的,所述第二传输性能参数为所述控制设备之前确定的所述第一业务的传输性能参数;
所述传输设备根据所述第一配置信息调整本设备的ECN信息。
该第二方面中,传输设备可以是交换网络中的交换机,或者其他具有数据转发功能的设备,该传输设备例如可以是交换网络中的叶子(leaf)交换机。控制设备可以是交换机,例如:交换网络中的脊柱(spine)交换机,该控制设备也可以是独立于交换网络之外的设备。第一业务可以是存储业务、高性能计算(high-performance computing,HPC)业务或者人工智能(artificial intelligence,AI)业务。第一传输性能参数与第二传输性能参数是相对于,可以将第二传输性能参数理解为是上一轮控制设备通过各传输设备上报的转发性能参数确定得到的第一业务的传输性能参数。第一传输性能参数是本轮确定的。传输设备根据所述第一配置信息调整本设备的ECN信息可以根据本设备的拥塞情况对第一配置信息做微调得到ECN信息,然后将该ECN信息下发到本设备的转发芯片上。或者直接将第一配置信息下发到本设备的转发芯片上。从而使转发芯片可以基于该调整后的ECN信息确定是否对队列中的待发送数据报文打标。该第二方面中,传输设备可以基于控制设备下发的第一配置信息,动态调整本设备的ECN信息,从而适应实际网络中各种流量场景的需求。
在第二方面的一种可能的实现方式中,所述转发状态参数包括以下至少一项:
待发送数据队列的出速率、待发送数据队列的当前深度、待发送数据队列的平均深度、第一ECN水线、端口ECN标记包数或基于优先级的流量控制PFC标记数,其中,所述第一ECN水线包括本周期的ECN水线的第一下限Kmin、第一上限Kmax和第一打标概率的最大值Pmax,所述第一Pmax为当队列深度位于第一Kmin和第一Kmax之间时对待发送数据队列中的数据报文随机打标的最大概率。
在第二方面的一种可能的实现方式中,所述第一配置信息包括打标概率,或者,第二ECN水线;其中,所述第二ECN水线包括下一周期ECN水线的第二下限Kmin、第二上限Kmax和第二打标概率的最大值Pmax,所述第二Pmax为当队列深度位于第二Kmin和第二Kmax之间时对待发送数据队列中的数据报文随机打标的最大概率。
本申请第三方面提供一种控制设备,该控制设备具有实现上述第一方面或第一方面任意一种可能实现方式的方法的功能。该功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块,例如:接收单元、处理单元和发送单元。
本申请第四方面提供一种传输设备,该传输设备具有实现上述第二方面或第二方面任意一种可能实现方式的方法的功能。该功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块,例如:接收单元、处理单元和发送单元。
本申请第五方面提供一种控制设备,该控制设备包括至少一个处理器、存储器、通信端口以及存储在存储器中并可在处理器上运行的计算机执行指令,当所述计算机执行指令被所述处理器执行时,所述处理器执行如上述第一方面或第一方面任意一种可能的实现方式所述的方法。
本申请第六方面提供一种传输设备,该传输设备包括至少一个处理器、存储器、通信端口以及存储在存储器中并可在处理器上运行的计算机执行指令,当所述计算机执行指令被所述处理器执行时,所述处理器执行如上述第二方面或第二方面任意一种可能的实现方式所述的方法。
本申请第七方面提供一种存储一个或多个计算机执行指令的计算机可读存储介质,当所述计算机执行指令被处理器执行时,所述处理器执行如上述第一方面或第一方面任意一种可能的实现方式所述的方法。
本申请第八方面提供一种存储一个或多个计算机执行指令的计算机可读存储介质,当所述计算机执行指令被处理器执行时,所述处理器执行如上述第二方面或第二方面任意一种可能的实现方式所述的方法。
本申请第九方面提供一种存储一个或多个计算机执行指令的计算机程序产品,当所述计算机执行指令被所述处理器执行时,所述处理器执行上述第一方面或第一方面任意一种可能实现方式的方法。
本申请第十方面提供一种存储一个或多个计算机执行指令的计算机程序产品,当所述计算机执行指令被所述处理器执行时,所述处理器执行上述第二方面或第二方面任意一种可能实现方式的方法。
本申请第十一方面提供了一种芯片系统,该芯片系统包括处理器,用于支持控制设备实现上述第一方面或第一方面任意一种可能的实现方式中所涉及的功能。在一种可能的设计中,芯片系统还可以包括存储器,存储器,用于保存终端设备必要的程序指令和数据。该芯片系统,可以由芯片构成,也可以包含芯片和其他分立器件。
本申请第十二方面提供了一种芯片系统,该芯片系统包括处理器,用于支持传输设备实现上述第二方面或第二方面任意一种可能的实现方式中所涉及的功能。在一种可能的设计中,芯片系统还可以包括存储器,存储器,用于保存控制设备必要的程序指令和数据。该芯片系统,可以由芯片构成,也可以包含芯片和其他分立器件。
其中,第三、第五、第七、第九和第十一方面或者其中任一种可能实现方式所带来的技术效果可参见第一方面或第一方面不同可能实现方式所带来的技术效果,此处不再赘述。
其中,第四、第六、第八、第十和第十二方面或者其中任一种可能实现方式所带来的技术效果可参见第二方面或第二方面不同可能实现方式所带来的技术效果,此处不再赘述本申请实施例中传输设备向控制设备上报转发状态参数,控制设备根据转发状态参数确定传输性能参数,进而再根据前后两轮传输性能参数的变化情况动态调整ECN的配置信息,从而使ECN的信息可以适应实际网络中各种流量场景的需求。
附图说明
图1是本申请实施例提供的数据传输系统的一示例示意图;
图2A至图2C是本申请实施例提供的队列深度与ECN水线的关系示例图;
图3是本申请实施例提供的打标概率示意图;
图4是本申请实施例提供的交换网络的一结构示意图;
图5是本申请实施例提供的传输管理系统的一结构示意图;
图6是本申请实施例提供的拥塞通知信息调整的方法的一实施例示意图;
图7是本申请实施例提供的人工智能模型训练及应用的一结构示意图;
图8为本申请实施例提供的一种卷积神经网络结构示意图;
图9为本申请实施例提供的一种卷积神经网络结构示意图;
图10为本申请实施例提供的一种神经网络处理器的结构示意图;
图11是本申请实施例提供的拥塞通知信息调整的方法的另一实施例示意图;
图12是本申请实施例提供的人工智能模型应用的一结构示意图;
图13是本申请实施例提供的控制设备的一结构示意图;
图14是本申请实施例提供的传输设备的一结构示意图;
图15是本申请实施例提供的控制设备的另一结构示意图;
图16是本申请实施例提供的传输设备的另一结构示意图。
具体实施方式
下面结合附图,对本申请的实施例进行描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。本领域普通技术人员可知,随着技术的发展和新场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本申请实施例提供一种拥塞通知信息调整的方法,可以根据传输性能参数对ECN信息进行动态调整,从而适应实际网络中各种流量场景的需求。本申请实施例还提供了相应的设备。以下分别进行详细说明。
图1为本申请实施例提供的数据传输系统的一示例示意图。
如图1所示的数据传输系统包括发送设备、传输设备和接收设备。发送设备、传输设备和接收设备通信连接。发送设备发出数据报文,该数据报文通过传输设备转发给接收设备。
传输设备的出端口的待发送队列上会设置有(explicit congestionnotification,ECN)水线,如图2A至2C所示,该ECN水线包括下限(Kmin)、上限(Kmax)和当队列深度位于Kmin和Kmax之间时,对待发送数据队列中的数据报文按照线性随机概率打标的最大打标概率Pmax。
如图2A和图3所示,当队列深度低于Kmin时,则传输设备对所有发送的数据报文都不打标,也就是打标概率为0。如图2B和图3所示,当队列深度高于Kmax时,则传输设备对所有发送的数据报文都打标,也就是打标概率为100%。如图2C和图3所示,当队列深度高于Kmin,但低于Kmax时,则传输设备以0至Pmax的线性概率对发送的数据报文随机打标。
数据报文上可以设置有ECN的标识位,若打标则将该标识位置为11,若不达标则该标识位保持00,当然打标的方式也不限于这一种,也可能是通过其他方式来标识打标,打标的标记用来指示传输路径上出现了拥塞。
若接收设备连续一段时间内都接收到了带有打标的数据报文,则接收设备会向发送设备发送拥塞通知报文(congestion notification packet,CNP),通知发送设备降低流量发送速率,以避免网络拥塞。
上述图1中只示出了一个传输设备,实际的传输网络中通常有多个传输设备。如图4所示,以交换网络为例,该交换网络中包括多个交换设备,这些交换设备可以分为两层,与终端设备相连的可以称为接入层,接入层的交换设备主要用于接收终端设备发送的数据报文。位于上层的是汇聚层,汇聚层的交换设备的主要用于汇聚多个接入层的交换设备的数据,然后再向接收设备侧转发。其中,接入层的交换设备可以称为叶子(leaf)设备,汇聚层的交换设备可以称为脊柱(spine)设备。
图5为本申请实施例提供的传输管理系统的一结构示意图。
如图5所示,本申请实施例提供的传输管理系统包括控制设备10和传输设备20,该控制设备10与每个传输设备20通信。该控制设备10可以是上述图4中的汇聚层的交换设备,也可以是专用于传输管理的独立设备,传输设备20可以相当于上述图4中的接入层的交换设备。
该传输管理系统中的控制设备和传输设备可以对拥塞通知信息进行调整。如图6所示,基于上述传输管理系统的拥塞通知信息调整的方法的一实施例可以包括:
301、传输设备获取本设备的转发状态参数。
所述转发状态参数是第一业务的数据经过所述传输设备时所产生的与拥塞相关的参数。
所述转发状态参数包括以下至少一项:
待发送数据队列的出速率、待发送数据队列的当前深度、待发送数据队列的平均深度、第一ECN水线、端口ECN标记包数或基于优先级的流量控制PFC标记数,其中,所述第一ECN水线包括本周期的ECN水线的第一下限Kmin、第一上限Kmax和第一打标概率的最大值Pmax,所述第一Pmax为当队列深度位于第一Kmin和第一Kmax之间时对待发送数据队列中的数据报文随机打标的最大概率。
基于优先级的流量控制PFC在IEEE:802.1Qbb标准文档中定义是对传流控的暂停机制的增强。PFC允许在一条以太网链路上创建8个虚拟通道,并为每条虚拟通道指定一个IEEE802.1P优先等级(cos),允许单独暂停和重启其中任意一条虚拟通道,同时允许其它虚拟通道的流量无中断通过。这一方法使网络能够为单个虚拟链路创建无丢包类别的服务,使其能够与同一接口上的其它流量类型共存。当出现拥塞时传统流控会阻止一条链路上的所有流量,而PFC能够对某个优先级的流量进行降速。
302、传输设备向所述控制设备发送所述转发状态参数。
303、控制设备接收至少两个传输设备发送的每个传输设备的转发状态参数后,根据所述每个传输设备的转发状态参数,确定所述第一业务的第一传输性能参数。
第一业务可以是存储业务、高性能计算(high-performance computing,HPC)业务或者人工智能(artificial intelligence,AI)业务。
所述第一传输性能参数包括以下至少一项:吞吐量、时延或流完成时间,其中,流完成时间是HPC业务中的一项性能参数。
304、控制设备根据所述第一传输性能参数相对于第二传输性能参数的变化情况,确定显示拥塞通知ECN的第一配置信息。
所述第二传输性能参数为之前确定的所述第一业务的传输性能参数。
第一传输性能参数与第二传输性能参数是相对于,可以将第二传输性能参数理解为是上一轮控制设备通过各传输设备上报的转发性能参数确定得到的第一业务的传输性能参数。第一传输性能参数是本轮确定的。
所述第一配置信息包括打标概率,或者,第二ECN水线;其中,所述第二ECN水线包括下一周期ECN水线的第二下限Kmin、第二上限Kmax和第二打标概率的最大值Pmax,所述第二Pmax为当队列深度位于第二Kmin和第二Kmax之间时对待发送数据队列中的数据报文随机打标的最大概率。
打标概率指的是对数据报文进行实际打标的概率。若控制设备直接下发了打标概率,则传输设备则可以直接依据该大概概率进行打标,若是0,则不打标,若是100%,则全部都打标,若是5%,则随机对5%的数据报文进行打标。若控制设备下发的是第二ECN水线,则传输设备会根据该第二ECN水线中的第二下限Kmin、第二上限Kmax和第二打标概率的最大值Pmax,以及待发送数据队列的深度,计算实际打标的概率。
305、控制设备向所述每个传输设备发送所述ECN的第一配置信息。
306、传输设备接收所述控制设备发送的第一配置信息后,根据所述第一配置信息调整本设备的ECN信息。
传输设备可以直接使用该第一配置信息,也可以结合本设备的拥塞情况,在第一配置信息的基础上做一些微调。
由该实施例可知,控制设备可以根据传输性能参数对ECN信息进行动态调整,从而适应实际网络中各种流量场景的需求。
上述步骤302传输设备向所述控制设备发送所述转发状态参数时,还会向控制设备发送该传输设备的局部拓扑信息。
该局部拓扑信息可以是传输设备通过链路层发现协议(link layer discoveryprotocol,LLDP)采集的,LLDP提供了一种标准的链路层发现方式,可以将本设备的主要能力、管理地址、设备标识、接口标识等信息组织成不同的类型/长度/值(Type/Length/Value,TLV),并封装在链路层发现协议数据单元(Link Layer Discovery Protocol DataUnit,LLDPDU)中发布给与本设备直连的邻居,邻居收到这些信息后将其以标准管理信息库(management information base,MIB)的形式保存起来,以供网络管理系统查询及判断链路的通信状况。
传输设备上报的局部拓扑信息会包括本设备的标识、本设备的端口标识,与本设备直接相连的邻居设备的标识以及端口标识等信息。
控制设备可以根据所述每个传输设备的局部拓扑信息确定用于确定所述第一传输性能参数的所有传输设备的转发状态参数都已到达。
因为控制设备处有所控制的传输设备的全局拓扑信息,通过全部拓扑信息和已到达的局部拓扑信息,可以确定是否每个传输设备的转发状态参数都已到达,在全部都达到后,再确定第一业务的第一传输性能参数,这样可以提高第一传输性能参数的准确度。当然,也可以不需要全部传输设备的转发状态参数都达到,例如:如果收集时间到达,即使有个别传输设备的转发状态参数没到达,控制设备也会执行后续过程。
另外,上述步骤303根据所述每个传输设备的转发状态参数,确定所述第一业务的第一传输性能参数时也会结合每个传输设备的局部拓扑信息。
也就是,所述控制设备根据所述局部拓扑信息和所述转发状态参数,确定所述第一业务的第一传输性能参数。该步骤可以包括:
所述控制设备根据所述每个传输设备的局部拓扑信息和转发状态参数形成第一拓扑结构或第二拓扑结构,所述第一拓扑结构是以所述每个传输设备的标识作为列标题,以所述每个传输设备上的端口标识作为行标题形成的网格矩阵,所述第二拓扑结构是以所述每个传输设备的标识作为行标题,以所述每个传输设备上的端口标识作为列标题形成的网格矩阵,其中,每个网格中填写有所在行和所在列所指示的相应传输设备的相应端口的转发状态参数;
所述控制设备将所述第一拓扑结构或所述第二拓扑结构输入人工智能推理模型,以得到所述第一业务的第一传输性能参数,所述人工智能推理模型是通过大量不同拥塞状态下的转发状态参数和对应的传输性能参数的样本训练得到的。
本申请实施例中,第一拓扑结构可以参阅表1进行理解:
表1:第一拓扑结构
端口1 端口2 端口3 端口4
传输设备1 转发状态参数11 转发状态参数12 转发状态参数13 转发状态参数14
传输设备2 转发状态参数21 转发状态参数22 转发状态参数23 转发状态参数24
传输设备3 转发状态参数31 转发状态参数32 转发状态参数33 转发状态参数34
传输设备4 转发状态参数41 转发状态参数42 转发状态参数43 转发状态参数44
第二拓扑结构可以参阅表2进行理解:
表2:第二拓扑结构
传输设备1 传输设备2 传输设备3 传输设备4
端口1 转发状态参数11 转发状态参数21 转发状态参数31 转发状态参数41
端口2 转发状态参数12 转发状态参数22 转发状态参数32 转发状态参数42
端口3 转发状态参数13 转发状态参数23 转发状态参数33 转发状态参数43
端口4 转发状态参数14 转发状态参数24 转发状态参数34 转发状态参数44
上述第一拓扑结构和第二拓扑结构都是以4个传输设备,每个传输设备有4个端口为例进行说明的,实际上,传输设备可以有更多个,也可以少于4个,每个传输设备上的端口不也限于是4个,不应将上述表1和表2理解为是对传输设备数量和端口数量的限定。
将上述第一拓扑结构或第二拓扑结构输入人工智能推理模型,就会得到第一业务的第一传输性能参数。也就是说,该人工智能推理模型是以上述第一拓扑结构或第二拓扑结构的转发状态参数为输入,以传输性能参数为输出的模型。该人工智能推理模型是采用离线训练的方式得到的,如图7所示,可以利用Athena平台加载训练数据,该训练数据可以包括个leaf的转发状态参数和全局拓扑,利用图形处理器(graphic processing unitGPU)服务器训练初始模型。训练完初始模型得到第一形式的人工智能推理模型。因为不同的设备所需要的模型的形式可能不同,例如:基于(中央处理器(central processingunit,CPU)的ARM、x86版本或外挂D芯片版本所运行的模型的形式都会不同。所以,可以利用模型转换工具将第一形式的人工智能推理模型转化为控制设备所支持的第二形式的人工智能推理模型。
上述所涉及的人工智能推理模型可以是基于深度神经网络或者卷积神经网络convolutional neuron nrtwork,CNN)得到的,下面对深度神经网络或者卷积神经网络分别进行介绍。
深度神经网络中的每一层的工作可以用数学表达式
Figure BDA0002206349570000111
来描述:从物理层面深度神经网络中的每一层的工作可以理解为通过五种对输入空间(输入向量的集合)的操作,完成输入空间到输出空间的变换(即矩阵的行空间到列空间),这五种操作包括:1、升维/降维;2、放大/缩小;3、旋转;4、平移;5、“弯曲”。其中1、2、3的操作由
Figure BDA0002206349570000112
完成,4的操作由+b完成,5的操作则由a()来实现。这里之所以用“空间”二字来表述是因为被分类的对象并不是单个事物,而是一类事物,空间是指这类事物所有个体的集合。其中,W是权重向量,该向量中的每一个值表示该层神经网络中的一个神经元的权重值。该向量W决定着上文所述的输入空间到输出空间的空间变换,即每一层的权重W控制着如何变换空间。训练深度神经网络的目的,也就是最终得到训练好的神经网络的所有层的权重矩阵(由很多层的向量W形成的权重矩阵)。因此,神经网络的训练过程本质上就是学习控制空间变换的方式,更具体的就是学习权重矩阵。
因为希望深度神经网络的输出尽可能的接近真正想要预测的值,所以可以通过比较当前网络的预测值和真正想要的目标值,再根据两者之间的差异情况来更新每一层神经网络的权重向量(当然,在第一次更新之前通常会有初始化的过程,即为深度神经网络中的各层预先配置参数),比如,如果网络的预测值高了,就调整权重向量让它预测低一些,不断的调整,直到神经网络能够预测出真正想要的目标值。因此,就需要预先定义“如何比较预测值和目标值之间的差异”,这便是损失函数(loss function)或目标函数(objectivefunction),它们是用于衡量预测值和目标值的差异的重要方程。其中,以损失函数举例,损失函数的输出值(loss)越高表示差异越大,那么深度神经网络的训练就变成了尽可能缩小这个loss的过程。
卷积神经网络是一种带有卷积结构的深度神经网络,是一种深度学习(deeplearning)架构,深度学习架构是指通过机器学习的算法,在不同的抽象层级上进行多个层次的学习。作为一种深度学习架构,CNN是一种前馈(feed-forward)人工神经网络,该前馈人工神经网络中的各个神经元对输入其中的图像中的重叠区域作出响应。
如图8所示,卷积神经网络(CNN)100可以包括输入层110,卷积层卷积(convolution,Conv)/池化(pooling)层120,其中池化层为可选的,以及神经网络层130。该CNN还可以包括金字塔池化(spatial pyramid pooling,SPP)层和全连接(fullconnection,FC)层。
卷积层/池化层120:
卷积层:
如图8所示卷积层/池化层120可以包括如示例121-126层,在一种实现中,121层为卷积层,122层为池化层,123层为卷积层,124层为池化层,125为卷积层,126为池化层;在另一种实现方式中,121、122为卷积层,123为池化层,124、125为卷积层,126为池化层。即卷积层的输出可以作为随后的池化层的输入,也可以作为另一个卷积层的输入以继续进行卷积操作。
以卷积层121为例,卷积层121可以包括很多个卷积算子,卷积算子也称为核,其在图像处理中的作用相当于一个从输入图像矩阵中提取特定信息的过滤器,卷积算子本质上可以是一个权重矩阵,这个权重矩阵通常被预先定义,在对图像进行卷积操作的过程中,权重矩阵通常在输入图像上沿着水平方向一个像素接着一个像素(或两个像素接着两个像素……这取决于步长stride的取值)的进行处理,从而完成从图像中提取特定特征的工作。该权重矩阵的大小应该与图像的大小相关,需要注意的是,权重矩阵的纵深维度(depthdimension)和输入图像的纵深维度是相同的,在进行卷积运算的过程中,权重矩阵会延伸到输入图像的整个深度。因此,和一个单一的权重矩阵进行卷积会产生一个单一纵深维度的卷积化输出,但是大多数情况下不使用单一权重矩阵,而是应用维度相同的多个权重矩阵。每个权重矩阵的输出被堆叠起来形成卷积图像的纵深维度。不同的权重矩阵可以用来提取图像中不同的特征,例如一个权重矩阵用来提取图像边缘信息,另一个权重矩阵用来提取图像的特定颜色,又一个权重矩阵用来对图像中不需要的噪点进行模糊化……该多个权重矩阵维度相同,经过该多个维度相同的权重矩阵提取后的特征图维度也相同,再将提取到的多个维度相同的特征图合并形成卷积运算的输出。
这些权重矩阵中的权重值在实际应用中需要经过大量的训练得到,通过训练得到的权重值形成的各个权重矩阵可以从输入图像中提取信息,从而帮助卷积神经网络100进行正确的预测。
当卷积神经网络100有多个卷积层的时候,初始的卷积层(例如121)往往提取较多的一般特征,该一般特征也可以称之为低级别的特征;随着卷积神经网络100深度的加深,越往后的卷积层(例如126)提取到的特征越来越复杂,比如高级别的语义之类的特征,语义越高的特征越适用于待解决的问题。
池化层:
由于常常需要减少训练参数的数量,因此卷积层之后常常需要周期性的引入池化层,即如图8中120所示例的121-126各层,可以是一层卷积层后面跟一层池化层,也可以是多层卷积层后面接一层或多层池化层。在图像处理过程中,池化层的唯一目的就是减少图像的空间大小。池化层可以包括平均池化算子和/或最大池化算子,以用于对输入图像进行采样得到较小尺寸的图像。平均池化算子可以在特定范围内对图像中的像素值进行计算产生平均值。最大池化算子可以在特定范围内取该范围内值最大的像素作为最大池化的结果。另外,就像卷积层中用权重矩阵的大小应该与图像大小相关一样,池化层中的运算符也应该与图像的大小相关。通过池化层处理后输出的图像尺寸可以小于输入池化层的图像的尺寸,池化层输出的图像中每个像素点表示输入池化层的图像的对应子区域的平均值或最大值。
神经网络层130:
在经过卷积层/池化层120的处理后,卷积神经网络100还不足以输出所需要的输出信息。因为如前所述,卷积层/池化层120只会提取特征,并减少输入图像带来的参数。然而为了生成最终的输出信息(所需要的类信息或别的相关信息),卷积神经网络100需要利用神经网络层130来生成一个或者一组所需要的类的数量的输出。因此,在神经网络层130中可以包括多层隐含层(如图8所示的131、132至13n)以及输出层140,该多层隐含层中所包含的参数可以根据具体的任务类型的相关训练数据进行预先训练得到,例如该任务类型可以包括图像识别,图像分类,图像超分辨率重建等等……。
在神经网络层130中的多层隐含层之后,也就是整个卷积神经网络100的最后层为输出层140,该输出层140具有类似分类交叉熵的损失函数,具体用于计算预测误差,一旦整个卷积神经网络100的前向传播(如图8由110至140的传播为前向传播)完成,反向传播(如图8由140至110的传播为反向传播)就会开始更新前面提到的各层的权重值以及偏差,以减少卷积神经网络100的损失及卷积神经网络100通过输出层输出的结果和理想结果之间的误差。
需要说明的是,如图8所示的卷积神经网络100仅作为一种卷积神经网络的示例,在具体的应用中,卷积神经网络还可以以其他网络模型的形式存在,例如,如图9所示的多个卷积层/池化层并行,将分别提取的特征均输入给全神经网络层130进行处理。
图8和图9所示的基于卷积神经网络的算法在模型训练过程中可以在图10所示的神经网络处理器(network processing unit,NPU)芯片中实现。
图10是本申请实施例提供的一种芯片硬件结构图。
神经网络处理器NPU 50NPU作为协处理器挂载到主CPU(Host CPU)上,由Host CPU分配任务。NPU的核心部分为运算电路50,通过控制器504控制运算电路503提取存储器中的矩阵数据并进行乘法运算。
在一些实现中,运算电路503内部包括多个处理单元(Process Engine,PE)。在一些实现中,运算电路503是二维脉动阵列。运算电路503还可以是一维脉动阵列或者能够执行例如乘法和加法这样的数学运算的其它电子线路。在一些实现中,运算电路503是通用的矩阵处理器。
举例来说,假设有输入矩阵A,权重矩阵B,输出矩阵C。运算电路从权重存储器502中取矩阵B相应的数据,并缓存在运算电路中每一个PE上。运算电路从输入存储器501中取矩阵A数据与矩阵B进行矩阵运算,得到的矩阵的部分结果或最终结果,保存在累加器508accumulator中。
统一存储器506用于存放输入数据以及输出数据。权重数据直接通过存储单元访问控制器505Direct Memory Access Controller,DMAC被搬运到权重存储器502中。输入数据也通过DMAC被搬运到统一存储器506中。
BIU为Bus Interface Unit即,总线接口单元510,用于AXI总线与DMAC和取指存储器509Instruction Fetch Buffer的交互。
总线接口单元510(Bus Interface Unit,简称BIU),用于取指存储器509从外部存储器获取指令,还用于存储单元访问控制器505从外部存储器获取输入矩阵A或者权重矩阵B的原数据。
DMAC主要用于将外部存储器DDR中的输入数据搬运到统一存储器506或将权重数据搬运到权重存储器502中或将输入数据数据搬运到输入存储器501中。
向量计算单元507多个运算处理单元,在需要的情况下,对运算电路的输出做进一步处理,如向量乘,向量加,指数运算,对数运算,大小比较等等。主要用于神经网络中非卷积/FC层网络计算,如Pooling(池化),Batch Normalization(批归一化),Local ResponseNormalization(局部响应归一化)等。
在一些实现种,向量计算单元能507将经处理的输出的向量存储到统一缓存器506。例如,向量计算单元507可以将非线性函数应用到运算电路503的输出,例如累加值的向量,用以生成激活值。在一些实现中,向量计算单元507生成归一化的值、合并值,或二者均有。在一些实现中,处理过的输出的向量能够用作到运算电路503的激活输入,例如用于在神经网络中的后续层中的使用。
控制器504连接的取指存储器(instruction fetch buffer)509,用于存储控制器504使用的指令;
统一存储器506,输入存储器501,权重存储器502以及取指存储器509均为On-Chip存储器。外部存储器私有于该NPU硬件架构。
其中,图8和图9所示的卷积神经网络中各层的运算可以由矩阵计算单元212或向量计算单元507执行。
无论人工智能推理模型采用的是上述哪种结构的神经网络,将表1或表2的拓扑结构输入到人工智能推理模型中都会输出传输性能参数。
另外,本申请实施例的拥塞通知信息调整的过程可以是周期性调整的,当然,也可以是非周期的,下面参阅图11以周期性的调整过程进行说明。
例如:可以以500毫秒(ms)为一个周期,在每个周期中,传输设备都会依据当前的ECN水线的信息采集一次转发状态参数,然后将该转发状态参数,以及局部拓扑信息上报给控制设备。控制设备可以将本周期的局部拓扑信息和转发状态参数组织成表1或表2所列的第一拓扑结构或第二拓扑结构。然后将第一拓扑结构或第二拓扑结构输入到人工智能推理模型,该人工智能推理模型可以通过AI芯片运行。人工智能推理模型会输出本周期的传输性能参数。该过程可以参阅图12进行理解,图12中人工智能模型是以包括卷积池化层、金字塔池化层和全连接层为进行展示的,向该人工智能模型中输入的是表2所列的第二拓扑结构,该第二拓扑结构通过卷积池化层、金字塔池化层和全连接层的层层处理后,会输出本周期的传输性能参数,该传输性能参数可以称为第一传输性能参数。然后控制设备基于该传输性能参数确定本周期的ECN的第一配置信息。确定第一配置信息需要参考上一周期的第二传输性能参数。
上述步骤304:控制设备根据所述第一传输性能参数相对于第二传输性能参数的变化情况,确定显示拥塞通知ECN的第一配置信息,可以包括:
若第M周期的吞吐量大于第(M-1)周期的吞吐量,则按照第(M-1)周期的第一探索方向在第(M-1)周期确定的ECN的第二配置信息的基础上调整预设步长,以得到所述第一配置信息,所述第一探索方向为所述ECN的配置信息上调或下调的方向,所述M为大于1的整数。
若第M周期的吞吐量小于第(M-1)周期的吞吐量,且M大于2时,则将所述第(M-2)周期确定的ECN的第二配置信息确定为所述第一配置信息。
若第M周期的吞吐量小于第(M-1)周期的吞吐量,且M等于2时,则将第一探索方向修改为第二探索方向,并按照所述第二探索方向在初始化的ECN的配置信息的基础上调整预设步长,以得到所述第一配置信息,所述第一探索方向与所述第二探索方向的方向相反。
若从第一周期开始描述,第一周期中,各传输设备会被初始化一个ECN配置信息,然后每个传输设备基于该初始化的ECN的配置信息向控制设备上报各自的转发状态参数,控制设备会生成第一周期的第一传输性能参数。然后,控制设备会选择一个探索方向,例如:选择上调,控制设备会在初始化的配置信息的基础上向上调整预设步长,得到一个第一配置信息,将该第一配置信息发送给各传输设备。各传输设备接收到该第一配置信息后,可以调整本身的ECN信息,也就是可以直接使用该第一配置信息,也可以结合本设备的拥塞情况,在第一配置信息的基础上做一些微调。然后开始第二个周期,各传输设备基于调整后的ECN信息向控制设备上报自的转发状态参数,控制设备会生成第二周期的第一传输性能参数。这时第一周期的第一传输性能参数成为第二传输性能参数,将第一传输性能参数与第二传输性能参数进行比较,以传输性能参数是吞吐量为例,若第二周期的吞吐量大于第一周期的吞吐量,说明性能变好了,也意味着探索方向是正确的,控制设备会按照该上调的探索方向继续在第一配置信息的基础上再调整预设步长,再重复上述过程,直到吞吐量出现拐点,也就是,直到本周期的吞吐量小于上一周期的吞吐量。若第二周期的吞吐量小于第一周期的吞吐量,则说明第一周期所选择的探索方向错误,调整探索方向,也就是将探索方向改为下调,在初始化的ECN的配置信息的基础上下调预设步长,再重复上述过程,直到找到最好的吞吐量,这时也就确定了最合适的第一配置信息。若第一配置信息包括Kmax、Pmax和Kmin时,可以按照顺序,先调整Kmax,直到通过上述过程找到最合适的Kmax后,再调整Pmax,再重复上述的过程找到最合适的Pmax后,再调整Kmin,直到通过上述过程找到最合适的Kmin后,基于吞吐量的调整过程就结束了。得到了基于吞吐量的最合适的Kmax、Pmax和Kmin。
同理,若是单独以时延为参考,上述步骤304可以为:
若第K周期的时延小于第(K-1)周期的时延,则按照第(K-1)周期的第一探索方向在第(K-1)周期确定的ECN的第二配置信息的基础上调整预设步长,以得到所述第一配置信息,所述第一探索方向为所述ECN的配置信息上调或下调的方向,所述K为大于1的整数。
若第K周期的时延小于第(K-1)周期的时延,且K大于2时,则将所述第(K-2)周期确定的ECN的第二配置信息确定为所述第一配置信息。
若第K周期的时延小于第(K-1)周期的时延,且K等于2时,则将第一探索方向修改为第二探索方向,并按照所述第二探索方向在初始化的ECN的配置信息的基础上调整预设步长,以得到所述第一配置信息,所述第一探索方向与所述第二探索方向的方向相反。
原理与上个吞吐量的实现方式的原理一致,需要说明的是,该时延的方式可以是在上述吞吐量已到达饱和的情况下,再基于时延做重复调整,直到所有的条件都调整完毕,得到了最大吞吐量最小的时延对应的第一配置信息,也就是得到了最合适的Kmax、Pmax和Kmin。
对于上述周期性的过程,简单来说,所述控制设备通过启发式的方式不断调整所述第一配置信息,直到所述第一传输性能参数不能再优于所述第二传输性能参数;当所述第一传输性能参数不能再优于所述第二传输性能参数时,所述控制设备确定到与最优的第一传输性能参数对应的第一配置信息。
该种可能的实现方式中,启发式的含义就是通过反复调整参数值来观察不同输出结果,当输出结果达到期望值时,确定最终想要的参数值。该实现方式中,通过不断调整第一配置信息就可以不断得到一个新的第一传输性能参数,而本轮的第一传输性能参数在执行下一轮时就会成为下一轮的第二传输性能参数。通过第一传输性能参数与第二传输性能参数的比较,就可以为第一配置信息找到调整方向,从而在第一传输性能参数达到最优时,也就找到了最合适的第一配置信息。从而有利于提高第一业务的传输性能。
以上描述了拥塞通知信息调整的方法,下面结合附图介绍本申请实施例提供的控制设备和传输设备。
如图13所示,本申请实施例提供的控制设备60的一实施例可以包括:
接收单元601,用于接收至少两个传输设备发送的每个传输设备的转发状态参数,所述转发状态参数是第一业务的数据经过所述每个传输设备时所产生的与拥塞相关的参数;
处理单元602用于:
根据所述接收单元601接收的每个传输设备的转发状态参数,确定所述第一业务的第一传输性能参数;
根据所述第一传输性能参数相对于第二传输性能参数的变化情况,确定显示拥塞通知ECN的第一配置信息,所述第二传输性能参数为之前确定的所述第一业务的传输性能参数;
发送单元603,用于向所述每个传输设备发送所述处理单元602确定的ECN的第一配置信息,所述第一配置信息用于所述每个传输设备调整本设备的ECN信息。
本申请实施例中,控制设备可以根据传输性能参数对ECN信息进行动态调整,从而适应实际网络中各种流量场景的需求。
一种可能的实施例中,所述处理单元602用于:
通过启发式的方式不断调整所述第一配置信息,直到所述第一传输性能参数不能再优于所述第二传输性能参数;
当所述第一传输性能参数不能再优于所述第二传输性能参数时,确定到与最优的第一传输性能参数对应的第一配置信息。
一种可能的实施例中,所述接收单元601,还用于接收所述每个传输设备的局部拓扑信息;
所述处理单元602,用于根据所述局部拓扑信息和所述转发状态参数,确定所述第一业务的第一传输性能参数。
一种可能的实施例中,所述处理单元602用于:
根据所述每个传输设备的局部拓扑信息和转发状态参数形成第一拓扑结构或第二拓扑结构,所述第一拓扑结构是以所述每个传输设备的标识作为列标题,以所述每个传输设备上的端口标识作为行标题形成的网格矩阵,所述第二拓扑结构是以所述每个传输设备的标识作为行标题,以所述每个传输设备上的端口标识作为列标题形成的网格矩阵,其中,每个网格中填写有所在行和所在列所指示的相应传输设备的相应端口的转发状态参数;
将所述第一拓扑结构或所述第二拓扑结构输入人工智能推理模型,以得到所述第一业务的第一传输性能参数,所述人工智能推理模型是通过大量不同拥塞状态下的转发状态参数和对应的传输性能参数的样本训练得到的。
一种可能的实施例中,所述处理单元602,还用于根据所述每个传输设备的局部拓扑信息确定用于确定所述第一传输性能参数的所有传输设备的转发状态参数都已到达。
一种可能的实施例中,所述第一传输性能参数包括以下至少一项:吞吐量、时延或流完成时间。
一种可能的实施例中,所述转发状态参数包括以下至少一项:
待发送数据队列的出速率、待发送数据队列的当前深度、待发送数据队列的平均深度、第一ECN水线、端口ECN标记包数或基于优先级的流量控制PFC标记数,其中,所述第一ECN水线包括本周期的ECN水线的第一下限Kmin、第一上限Kmax和第一打标概率的最大值Pmax,所述第一Pmax为当队列深度位于第一Kmin和第一Kmax之间时对待发送数据队列中的数据报文随机打标的最大概率。
一种可能的实施例中,所述第一配置信息包括打标概率,或者,第二ECN水线;其中,所述第二ECN水线包括下一周期ECN水线的第二下限Kmin、第二上限Kmax和第二打标概率的最大值Pmax,所述第二Pmax为当队列深度位于第二Kmin和第二Kmax之间时对待发送数据队列中的数据报文随机打标的最大概率。
一种可能的实施例中,所述处理单元602,用于若第M周期的吞吐量大于第(M-1)周期的吞吐量,则按照第(M-1)周期的第一探索方向在第(M-1)周期确定的ECN的第二配置信息的基础上调整预设步长,以得到所述第一配置信息,所述第一探索方向为所述ECN的配置信息上调或下调的方向,所述M为大于1的整数。
一种可能的实施例中,所述处理单元602,用于若第K周期的时延小于第(K-1)周期的时延,则按照第(K-1)周期的第一探索方向在第(K-1)周期确定的ECN的第二配置信息的基础上调整预设步长,以得到所述第一配置信息,所述第一探索方向为所述ECN的配置信息上调或下调的方向,所述K为大于1的整数。
需要说明的是,上述控制设备60的各单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其带来的技术效果与本发明方法实施例相同,具体内容可参见本申请前述所示的方法实施例中的叙述,此处不再赘述。
参阅图14,本申请实施例提供的传输设备70的一实施例可以包括:
处理单元701,用于获取本设备的转发状态参数,所述转发状态参数是第一业务的数据经过所述传输设备时所产生的与拥塞相关的参数;
发送单元702,用于向所述控制设备发送所述处理单元701获取的转发状态参数,所述转发状态参数用于所述控制设备确定第一业务的第一传输性能参数;
接收单元703,用于接收所述控制设备发送的第一配置信息,所述第一配置信息是所述控制设备根据所述第一传输性能参数相对于第二传输性能参数的变化情况确定的,所述第二传输性能参数为所述控制设备之前确定的所述第一业务的传输性能参数;
所述处理单元701,还用于根据所述接收单元703接收的第一配置信息调整本设备的ECN信息。
本申请实施例提供的方案中,传输设备可以基于控制设备下发的第一配置信息,动态调整本设备的ECN信息,从而适应实际网络中各种流量场景的需求。
一种可能的实施例中,所述转发状态参数包括以下至少一项:
待发送数据队列的出速率、待发送数据队列的当前深度、待发送数据队列的平均深度、第一ECN水线、端口ECN标记包数或基于优先级的流量控制PFC标记数,其中,所述第一ECN水线包括本周期的ECN水线的第一下限Kmin、第一上限Kmax和第一打标概率的最大值Pmax,所述第一Pmax为当队列深度位于第一Kmin和第一Kmax之间时对待发送数据队列中的数据报文随机打标的最大概率。
一种可能的实施例中,所述第一配置信息包括打标概率,或者,第二ECN水线;其中,所述第二ECN水线包括下一周期ECN水线的第二下限Kmin、第二上限Kmax和第二打标概率的最大值Pmax,所述第二Pmax为当队列深度位于第二Kmin和第二Kmax之间时对待发送数据队列中的数据报文随机打标的最大概率。
需要说明的是,上述传输设备70的各单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其带来的技术效果与本发明方法实施例相同,具体内容可参见本申请前述所示的方法实施例中的叙述,此处不再赘述。
图15所示,为本申请的实施例提供的上述实施例中所涉及的控制设备80的一种可能的逻辑结构示意图。控制设备80包括:处理器801、通信端口802、存储器803以及总线804。处理器801、通信端口802以及存储器803通过总线804相互连接。在本申请的实施例中,处理器801用于对控制设备80的动作进行控制管理,例如,处理器801用于执行图13中的处理单元602所执行的功能。通信端口802用于执行图13中的接收单元601和发送单元603所执行的功能,支持控制设备80进行通信。存储器803,用于存储控制设备80的程序代码和数据。
其中,处理器801可以是中央处理器单元,通用处理器,数字信号处理器,专用集成电路,现场可编程门阵列或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。所述处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,数字信号处理器和微处理器的组合等等。总线804可以是外设部件互连标准(PeripheralComponent Interconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图15中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
图16所示,为本申请的实施例提供的上述实施例中所涉及的传输设备90的一种可能的逻辑结构示意图。传输设备90包括:处理器901、通信端口902、存储器903以及总线904。处理器901、通信端口902以及存储器903通过总线904相互连接。在本申请的实施例中,处理器901用于对传输设备90的动作进行控制管理,例如,处理器901用于执行图14中的处理单元701所执行的功能。通信端口902用于执行图14中的发送单元702和接收单元703所执行的功能,支持传输设备90进行通信。存储器903,用于存储传输设备90的程序代码和数据。
其中,处理器901可以是中央处理器单元,通用处理器,数字信号处理器,专用集成电路,现场可编程门阵列或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。所述处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,数字信号处理器和微处理器的组合等等。总线904可以是外设部件互连标准(PeripheralComponent Interconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图16中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
本申请还提供了一种芯片系统,该芯片系统包括处理器,用于支持上述控制设备或传输设备实现其所涉及的功能,例如,例如接收或处理上述方法实施例中所涉及的数据。在一种可能的设计中,所述芯片系统还包括存储器,所述存储器,用于保存终端设备必要的程序指令和数据。该芯片系统,可以由芯片构成,也可以包含芯片和其他分立器件。
在本申请的另一实施例中,还提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当设备的至少一个处理器执行该计算机执行指令时,设备执行上述图5至图12部分实施例所描述的方法。
在本申请的另一实施例中,还提供一种计算机程序产品,该计算机程序产品包括计算机执行指令,该计算机执行指令存储在计算机可读存储介质中;设备的至少一个处理器可以从计算机可读存储介质读取该计算机执行指令,至少一个处理器执行该计算机执行指令使得设备执行上述图5至图12部分实施例所描述的方法。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请实施例的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请实施例所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请实施例各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请实施例各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请实施例的具体实施方式,但本申请实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请实施例揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请实施例的保护范围之内。因此,本申请实施例的保护范围应以所述权利要求的保护范围为准。

Claims (24)

1.一种拥塞通知信息调整的方法,其特征在于,包括:
控制设备接收至少两个传输设备发送的每个传输设备的转发状态参数,所述转发状态参数是第一业务的数据经过所述每个传输设备时所产生的与拥塞相关的参数;
所述控制设备根据所述每个传输设备的转发状态参数,确定所述第一业务的第一传输性能参数;
所述控制设备根据所述第一传输性能参数相对于第二传输性能参数的变化情况,确定显示拥塞通知ECN的第一配置信息,所述第二传输性能参数为之前确定的所述第一业务的传输性能参数;
所述控制设备向所述每个传输设备发送所述ECN的第一配置信息,所述第一配置信息用于所述每个传输设备调整本设备的ECN信息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
所述控制设备通过启发式的方式不断调整所述第一配置信息,直到所述第一传输性能参数不能再优于所述第二传输性能参数;
当所述第一传输性能参数不能再优于所述第二传输性能参数时,所述控制设备确定到与最优的第一传输性能参数对应的第一配置信息。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
所述控制设备接收所述每个传输设备的局部拓扑信息;
所述控制设备根据所述每个传输设备的转发状态参数,确定所述第一业务的第一传输性能参数,包括:
所述控制设备根据所述局部拓扑信息和所述转发状态参数,确定所述第一业务的第一传输性能参数。
4.根据权利要求3所述的方法,其特征在于,所述控制设备根据所述局部拓扑信息和所述转发状态参数,确定所述第一业务的第一传输性能参数,包括:
所述控制设备根据所述每个传输设备的局部拓扑信息和转发状态参数形成第一拓扑结构或第二拓扑结构,所述第一拓扑结构是以所述每个传输设备的标识作为列标题,以所述每个传输设备上的端口标识作为行标题形成的网格矩阵,所述第二拓扑结构是以所述每个传输设备的标识作为行标题,以所述每个传输设备上的端口标识作为列标题形成的网格矩阵,其中,每个网格中填写有所在行和所在列所指示的相应传输设备的相应端口的转发状态参数;
所述控制设备将所述第一拓扑结构或所述第二拓扑结构输入人工智能推理模型,以得到所述第一业务的第一传输性能参数,所述人工智能推理模型是通过大量不同拥塞状态下的转发状态参数和对应的传输性能参数的样本训练得到的。
5.根据权利要求3或4所述的方法,其特征在于,所述方法还包括:
所述控制设备根据所述每个传输设备的局部拓扑信息确定用于确定所述第一传输性能参数的所有传输设备的转发状态参数都已到达。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述第一传输性能参数包括以下至少一项:吞吐量、时延或流完成时间。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述转发状态参数包括以下至少一项:
待发送数据队列的出速率、待发送数据队列的当前深度、待发送数据队列的平均深度、第一ECN水线、端口ECN标记包数或基于优先级的流量控制PFC标记数,其中,所述第一ECN水线包括本周期的ECN水线的第一下限Kmin、第一上限Kmax和第一打标概率的最大值Pmax,所述第一Pmax为当队列深度位于第一Kmin和第一Kmax之间时对待发送数据队列中的数据报文随机打标的最大概率。
8.根据权利要求1-7任一项所述的方法,其特征在于,所述第一配置信息包括打标概率,或者,第二ECN水线;其中,所述第二ECN水线包括下一周期ECN水线的第二下限Kmin、第二上限Kmax和第二打标概率的最大值Pmax,所述第二Pmax为当队列深度位于第二Kmin和第二Kmax之间时对待发送数据队列中的数据报文随机打标的最大概率。
9.根据权利要求6所述的方法,其特征在于,所述控制设备根据所述第一传输性能参数相对于第二传输性能参数的变化情况,确定显示拥塞通知ECN的第一配置信息,包括:
若第M周期的吞吐量大于第(M-1)周期的吞吐量,则按照第(M-1)周期的第一探索方向在第(M-1)周期确定的ECN的第二配置信息的基础上调整预设步长,以得到所述第一配置信息,所述第一探索方向为所述ECN的配置信息上调或下调的方向,所述M为大于1的整数。
10.根据权利要求6所述的方法,其特征在于,所述控制设备根据所述第一传输性能参数相对于第二传输性能参数的变化情况,确定显示拥塞通知ECN的第一配置信息,包括:
若第K周期的时延小于第(K-1)周期的时延,则按照第(K-1)周期的第一探索方向在第(K-1)周期确定的ECN的第二配置信息的基础上调整预设步长,以得到所述第一配置信息,所述第一探索方向为所述ECN的配置信息上调或下调的方向,所述K为大于1的整数。
11.一种拥塞通知信息调整的方法,其特征在于,包括:
传输设备获取本设备的转发状态参数,所述转发状态参数是第一业务的数据经过所述传输设备时所产生的与拥塞相关的参数;
所述传输设备向所述控制设备发送所述转发状态参数,所述转发状态参数用于所述控制设备确定第一业务的第一传输性能参数;
所述传输设备接收所述控制设备发送的第一配置信息,所述第一配置信息是所述控制设备根据所述第一传输性能参数相对于第二传输性能参数的变化情况确定的,所述第二传输性能参数为所述控制设备之前确定的所述第一业务的传输性能参数;
所述传输设备根据所述第一配置信息调整本设备的ECN信息。
12.根据权利要求11所述的方法,其特征在于,所述转发状态参数包括以下至少一项:
待发送数据队列的出速率、待发送数据队列的当前深度、待发送数据队列的平均深度、第一ECN水线、端口ECN标记包数或基于优先级的流量控制PFC标记数,其中,所述第一ECN水线包括本周期的ECN水线的第一下限Kmin、第一上限Kmax和第一打标概率的最大值Pmax,所述第一Pmax为当队列深度位于第一Kmin和第一Kmax之间时对待发送数据队列中的数据报文随机打标的最大概率。
13.根据权利要求11或12所述的方法,其特征在于,所述第一配置信息包括打标概率,或者,第二ECN水线;其中,所述第二ECN水线包括下一周期ECN水线的第二下限Kmin、第二上限Kmax和第二打标概率的最大值Pmax,所述第二Pmax为当队列深度位于第二Kmin和第二Kmax之间时对待发送数据队列中的数据报文随机打标的最大概率。
14.一种控制设备,其特征在于,包括:
接收单元,用于接收至少两个传输设备发送的每个传输设备的转发状态参数,所述转发状态参数是第一业务的数据经过所述每个传输设备时所产生的与拥塞相关的参数;
处理单元用于:
根据所述接收单元接收的每个传输设备的转发状态参数,确定所述第一业务的第一传输性能参数;
根据所述第一传输性能参数相对于第二传输性能参数的变化情况,确定显示拥塞通知ECN的第一配置信息,所述第二传输性能参数为之前确定的所述第一业务的传输性能参数;
发送单元,用于向所述每个传输设备发送所述处理单元确定的ECN的第一配置信息,所述第一配置信息用于所述每个传输设备调整本设备的ECN信息。
15.根据权利要求14所述的控制设备,其特征在于,
所述处理单元用于:
通过启发式的方式不断调整所述第一配置信息,直到所述第一传输性能参数不能再优于所述第二传输性能参数;
当所述第一传输性能参数不能再优于所述第二传输性能参数时,确定到与最优的第一传输性能参数对应的第一配置信息。
16.根据权利要求14或15所述的控制设备,其特征在于,
所述接收单元,还用于接收所述每个传输设备的局部拓扑信息;
所述处理单元,用于根据所述局部拓扑信息和所述转发状态参数,确定所述第一业务的第一传输性能参数。
17.根据权利要求16所述的控制设备,其特征在于,
所述处理单元用于:
根据所述每个传输设备的局部拓扑信息和转发状态参数形成第一拓扑结构或第二拓扑结构,所述第一拓扑结构是以所述每个传输设备的标识作为列标题,以所述每个传输设备上的端口标识作为行标题形成的网格矩阵,所述第二拓扑结构是以所述每个传输设备的标识作为行标题,以所述每个传输设备上的端口标识作为列标题形成的网格矩阵,其中,每个网格中填写有所在行和所在列所指示的相应传输设备的相应端口的转发状态参数;
将所述第一拓扑结构或所述第二拓扑结构输入人工智能推理模型,以得到所述第一业务的第一传输性能参数,所述人工智能推理模型是通过大量不同拥塞状态下的转发状态参数和对应的传输性能参数的样本训练得到的。
18.根据权利要求16或17所述的控制设备,其特征在于,
所述处理单元,还用于根据所述每个传输设备的局部拓扑信息确定用于确定所述第一传输性能参数的所有传输设备的转发状态参数都已到达。
19.根据权利要求14-18任一项所述的控制设备,其特征在于,所述第一传输性能参数包括以下至少一项:吞吐量、时延或流完成时间。
20.根据权利要求19所述的控制设备,其特征在于,
所述处理单元,用于若第M周期的吞吐量大于第(M-1)周期的时延,则按照第(M-1)周期的第一探索方向在第(M-1)周期确定的ECN的第二配置信息的基础上调整预设步长,以得到所述第一配置信息,所述第一探索方向为所述ECN的配置信息上调或下调的方向,所述M为大于1的整数。
21.根据权利要求19所述的控制设备,其特征在于,
所述处理单元,用于若第K周期的时延小于第(K-1)周期的时延,则按照第(K-1)周期的第一探索方向在第(K-1)周期确定的ECN的第二配置信息的基础上调整预设步长,以得到所述第一配置信息,所述第一探索方向为所述ECN的配置信息上调或下调的方向,所述K为大于1的整数。
22.一种传输设备,其特征在于,包括:
处理单元,用于获取本设备的转发状态参数,所述转发状态参数是第一业务的数据经过所述传输设备时所产生的与拥塞相关的参数;
发送单元,用于向所述控制设备发送所述处理单元获取的转发状态参数,所述转发状态参数用于所述控制设备确定第一业务的第一传输性能参数;
接收单元,用于接收所述控制设备发送的第一配置信息,所述第一配置信息是所述控制设备根据所述第一传输性能参数相对于第二传输性能参数的变化情况确定的,所述第二传输性能参数为所述控制设备之前确定的所述第一业务的传输性能参数;
所述处理单元,还用于根据所述接收单元接收的第一配置信息调整本设备的ECN信息。
23.根据权利要求22所述的传输设备,其特征在于,所述转发状态参数包括以下至少一项:
待发送数据队列的出速率、待发送数据队列的当前深度、待发送数据队列的平均深度、第一ECN水线、端口ECN标记包数或基于优先级的流量控制pfc标记数,其中,所述第一ECN水线包括本周期的ECN水线的第一下限Kmin、第一上限Kmax和第一打标概率的最大值Pmax,所述第一Pmax为当队列深度位于第一Kmin和第一Kmax之间时对待发送数据队列中的数据报文随机打标的最大概率。
24.根据权利要求22所述的传输设备,其特征在于,所述第一配置信息包括打标概率,或者,第二ECN水线;其中,所述第二ECN水线包括下一周期ECN水线的第二下限Kmin、第二上限Kmax和第二打标概率的最大值Pmax,所述第二Pmax为当队列深度位于第二Kmin和第二Kmax之间时对待发送数据队列中的数据报文随机打标的最大概率。
CN201910882662.9A 2019-09-18 2019-09-18 一种拥塞通知信息调整的方法及设备 Active CN112532530B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910882662.9A CN112532530B (zh) 2019-09-18 2019-09-18 一种拥塞通知信息调整的方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910882662.9A CN112532530B (zh) 2019-09-18 2019-09-18 一种拥塞通知信息调整的方法及设备

Publications (2)

Publication Number Publication Date
CN112532530A true CN112532530A (zh) 2021-03-19
CN112532530B CN112532530B (zh) 2022-12-13

Family

ID=74975168

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910882662.9A Active CN112532530B (zh) 2019-09-18 2019-09-18 一种拥塞通知信息调整的方法及设备

Country Status (1)

Country Link
CN (1) CN112532530B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113411263A (zh) * 2021-06-18 2021-09-17 中国工商银行股份有限公司 一种数据传输方法、装置、设备及存储介质
CN114513409A (zh) * 2022-01-05 2022-05-17 新华三技术有限公司 一种ecn门限配置方法及装置
CN115514709A (zh) * 2022-11-23 2022-12-23 北京云脉芯联科技有限公司 拥塞控制事件队列调度方法、装置、设备和存储介质
CN116545933A (zh) * 2023-07-06 2023-08-04 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 网络拥塞控制方法、装置、设备及存储介质
WO2023202565A1 (zh) * 2022-04-20 2023-10-26 华为技术有限公司 一种通信方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103957121A (zh) * 2014-04-30 2014-07-30 哈尔滨工业大学深圳研究生院 一种面向空天信息网络的跨层tcp优化方法
US20150103755A1 (en) * 2013-10-16 2015-04-16 At&T Intellectual Property I, Lp Utlizing explicit congestion notification for network selection
US20150117230A1 (en) * 2013-10-28 2015-04-30 At&T Intellectual Property I, Lp Probe mechanism for discovering explicit congestion notification data
CN106302228A (zh) * 2016-10-18 2017-01-04 中南大学 一种数据中心网络中基于任务感知的传输控制方法
CN107634911A (zh) * 2017-10-31 2018-01-26 河南科技大学 一种信息中心网络中基于深度学习的自适应拥塞控制方法
CN108965151A (zh) * 2018-08-27 2018-12-07 华中科技大学 一种基于排队时延的显式拥塞控制方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150103755A1 (en) * 2013-10-16 2015-04-16 At&T Intellectual Property I, Lp Utlizing explicit congestion notification for network selection
US20150117230A1 (en) * 2013-10-28 2015-04-30 At&T Intellectual Property I, Lp Probe mechanism for discovering explicit congestion notification data
CN103957121A (zh) * 2014-04-30 2014-07-30 哈尔滨工业大学深圳研究生院 一种面向空天信息网络的跨层tcp优化方法
CN106302228A (zh) * 2016-10-18 2017-01-04 中南大学 一种数据中心网络中基于任务感知的传输控制方法
CN107634911A (zh) * 2017-10-31 2018-01-26 河南科技大学 一种信息中心网络中基于深度学习的自适应拥塞控制方法
CN108965151A (zh) * 2018-08-27 2018-12-07 华中科技大学 一种基于排队时延的显式拥塞控制方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
""S2-102916 -CR-Congestion-Control-Priority 23401"", 《3GPP TSG_SA\WG2_ARCH》 *
SIJO JOY等: "SDN based ECN Adaptation Scheme for Improving Data Center Long Flow Throughput", 《IEEE ICC 2015 - WORKSHOP ON SMART COMMUNICATION PROTOCOLS AND ALGORITHMS》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113411263A (zh) * 2021-06-18 2021-09-17 中国工商银行股份有限公司 一种数据传输方法、装置、设备及存储介质
CN113411263B (zh) * 2021-06-18 2023-03-14 中国工商银行股份有限公司 一种数据传输方法、装置、设备及存储介质
CN114513409A (zh) * 2022-01-05 2022-05-17 新华三技术有限公司 一种ecn门限配置方法及装置
CN114513409B (zh) * 2022-01-05 2023-09-15 新华三技术有限公司 一种ecn门限配置方法及装置
WO2023202565A1 (zh) * 2022-04-20 2023-10-26 华为技术有限公司 一种通信方法及装置
CN115514709A (zh) * 2022-11-23 2022-12-23 北京云脉芯联科技有限公司 拥塞控制事件队列调度方法、装置、设备和存储介质
CN115514709B (zh) * 2022-11-23 2023-02-28 北京云脉芯联科技有限公司 拥塞控制事件队列调度方法、装置、设备和存储介质
CN116545933A (zh) * 2023-07-06 2023-08-04 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 网络拥塞控制方法、装置、设备及存储介质
CN116545933B (zh) * 2023-07-06 2023-10-20 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 网络拥塞控制方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN112532530B (zh) 2022-12-13

Similar Documents

Publication Publication Date Title
CN112532530B (zh) 一种拥塞通知信息调整的方法及设备
US20230089380A1 (en) Neural network construction method and apparatus
WO2021078027A1 (zh) 构建网络结构优化器的方法、装置及计算机可读存储介质
WO2022083536A1 (zh) 一种神经网络构建方法以及装置
Li et al. DeepNFV: A lightweight framework for intelligent edge network functions virtualization
WO2017066509A1 (en) Systems and methods of distributed optimization
CN112422443B (zh) 一种拥塞算法的自适应控制方法、存储介质、设备及系统
JP2023510566A (ja) ニューラル・ネットワークのための適応的探索方法および装置
KR20200108341A (ko) 신경망을 위한 동적 메모리 매핑
CN108875482B (zh) 物体检测方法和装置、神经网络训练方法和装置
CN111988787B (zh) 一种任务的网络接入和服务放置位置选择方法及系统
CN111176820A (zh) 一种基于深度神经网络的边缘计算任务的分配方法及装置
CN110955463A (zh) 支持边缘计算的物联网多用户计算卸载方法
CN113177209B (zh) 基于深度学习的加密流量分类方法及相关设备
CN108111335A (zh) 一种调度和链接虚拟网络功能的方法及系统
CN114265631A (zh) 一种基于联邦元学习的移动边缘计算智能卸载方法及装置
CN110533106A (zh) 图像分类处理方法、装置及存储介质
JP7451689B2 (ja) ネットワーク輻輳処理方法、モデル更新方法、および関連装置
CN114511042A (zh) 一种模型的训练方法、装置、存储介质及电子装置
CN112910789A (zh) 拥塞控制方法以及相关设备
CN112446462A (zh) 目标神经网络模型的生成方法和装置
CN110503180A (zh) 模型处理方法、装置以及电子设备
CN112529148B (zh) 一种基于图神经网络的智能QoS推理方法
Kim et al. Network virtualization for real-time processing of object detection using deep learning
Chen et al. AdaDrone: Quality of navigation based neural adaptive scheduling for edge-assisted drones

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant