CN114448896B - 一种网络优化方法和装置 - Google Patents

一种网络优化方法和装置 Download PDF

Info

Publication number
CN114448896B
CN114448896B CN202210238002.9A CN202210238002A CN114448896B CN 114448896 B CN114448896 B CN 114448896B CN 202210238002 A CN202210238002 A CN 202210238002A CN 114448896 B CN114448896 B CN 114448896B
Authority
CN
China
Prior art keywords
link
preset
pfc
preset period
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210238002.9A
Other languages
English (en)
Other versions
CN114448896A (zh
Inventor
余学山
杨飘飘
赵耀
龚叶君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202210238002.9A priority Critical patent/CN114448896B/zh
Publication of CN114448896A publication Critical patent/CN114448896A/zh
Application granted granted Critical
Publication of CN114448896B publication Critical patent/CN114448896B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/12Avoiding congestion; Recovering from congestion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • H04L43/0888Throughput
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/50Queue scheduling

Abstract

本申请提供了一种网络优化方法和装置,涉及互联网技术领域,可用于金融领域或其他领域。该方法包括:第一设备基于RDMA技术,通过第一链路接收来自第二设备的数据;第一设备确定在第一预设周期内通过第一链路发送PFC反压帧的异常次数超出第一预设门限;第一设备根据第一链路中的流量,对第一链路中的队列进行优化。基于上述方法,通过发送PFC反压帧的异常情况监测第一链路中是否有异常,并根据第一链路中的流量判断异常情况,针对不同的网络异常情况采用不同的手段对队列进行优化,进而达到提高RDMA网络的性能的目的。

Description

一种网络优化方法和装置
技术领域
本申请涉及互联网技术领域,尤其涉及一种网络优化方法和装置。
背景技术
远程直接数据存取(remote direct memory access,RDMA)技术,可以实现通过网络将数据直接传入计算机存储,而不对计算机的处理功能造成影响,而且具有延迟更低、吞吐量更高、计算机中央处理器(central processing unit,CPU)占用率更低等优点,被广泛应用在物联网技术领域中。RDMA网络对于丢包非常敏感,一旦丢包就会造成网络性能急剧下降。因此,需要构造RDMA网络的无损队列以保障RDMA的网络性能。
然而,目前构造网络的无损队列存在一些困难。比如,当RDMA网络出现拥塞时,拥塞流量进入队列,可能会导致丢包进而导致队列受损;又如,当RDMA网络出现死锁时,会导致多条队列受损。因此,需要一种方法对RDMA网络进行优化,以提高RDMA网络的性能。
发明内容
本申请提供了一种网络优化方法和装置,对可能出现网络异常的设备进行监测,判断设备的网络异常情况,以便于在存在网络异常的情况下对队列进行优化,进而提高RDMA网络的性能。
第一方面,本申请提供了一种网络优化方法,该方法包括:第一设备基于RDMA技术,通过第一链路接收来自第二设备的数据,第一链路包括多个队列,数据传输在多个队列中的部分队列中;第一设备确定在第一预设周期内通过第一链路发送基于优先级的流量控制(priority-based flow control,PFC)反压帧的异常次数超出第一预设门限;第一设备根据第一链路中的流量,对第一链路中的队列进行优化。
基于上述方法,通过PFC反压帧的异常情况监测第一链路中是否有异常,并根据第一链路中的流量判断异常情况,并在存在网络异常的情况下对队列进行优化,进而提高RDMA网络的性能。
其中,第一预设周期包括多个第二预设周期;结合第一方面,在第一方面的某些可能的实现方式中,第一设备确定在第一预设周期内通过第一链路发送基于优先级的流量控制PFC反压帧的异常次数超出第一预设门限,包括:第一设备监测第一预设周期内的每个第二预设周期中通过第一链路发送PFC反压帧的数量;第一设备在第一预设周期内存在多个第二预设周期满足通过第一链路发送的PFC反压帧的数量超出第二预设门限,且所述多个第二预设周期的数量超出第一预设门限的情况下,确定在第一预设周期内通过第一链路发送PFC反压帧的异常次数超出第一预设门限。
结合第一方面,在第一方面的某些可能的实现方式中,第一设备监测第一预设周期内的每个第二预设周期中通过第一链路发送PFC反压帧的数量,包括:第一设备从网管平台获取第一设备的日志;第一设备基于日志,监测第一预设周期内的每个第二预设周期中通过第一链路发送PFC反压帧的数量。
结合第一方面,在第一方面的某些可能的实现方式中,第一设备根据第一链路中的流量,对第一链路中的队列进行优化,包括:第一设备根据第一链路的流量,确定第一链路是否发生死锁;以及,第一设备在第一链路发生死锁的情况下,将用于连接第一链路的第一端口隔离;或第一设备在第一链路未发生死锁的情况下,向第二设备发送切换请求,切换请求用于请求第二设备将数据切换至第一链路的备份队列中。
可选地,在第一设备在第一链路未发生死锁的情况下,该方法还包括:第一设备关闭第一端口的PFC功能。
可选地,备份队列为多个队列中预先定义的队列。
结合第一方面,在第一方面的某些可能的实现方式中,第一设备根据第一链路的流量,确定第一链路是否发生死锁,包括:第一设备在第一链路的流量为零的情况下,确定第一链路发生死锁;或第一设备在第一链路的流量不为零的情况下,确定第一链路未发生死锁。
结合第一方面,在第一方面的某些可能的实现方式中,该方法还包括:确定第一设备中积压的PFC反压帧数量超出第三预设门限。
其中,第一设备包括多个端口,多个端口用于连接多个链路,第一端口为多个端口中的任意一个,第一链路为多个链路中的任意一个。
第二方面,本申请提供了一种网络优化装置,该装置包括接收模块、网络监控模块和处理模块;接收模块用于基于RDMA技术,通过第一链路接收来自第二设备的数据,第一链路包括多个队列,数据传输在多个队列中的部分队列中;网络监控模块用于确定在第一预设周期内通过第一链路发送PFC反压帧的异常次数超出第一预设门限;处理模块用于根据第一链路中的流量,对第一链路中的队列进行优化。
第三方面,本申请提供了一种装置,包括处理器,该处理器用于执行计算机程序,以执行第一方面以及第一方面任意一种可能的实现方式中的方法。
第四方面,本申请提供了一种计算机可读存储介质,包括计算机程序,当该计算机程序在计算机上运行时,使得计算机执行第一方面以及第一方面任一种可能实现方式中的方法。
第五方面,本申请提供了一种计算机程序产品,包括计算机程序,当该计算机程序在计算机上运行时,使得计算机执行第一方面以及第一方面任一种可能实现方式中的方法。
应当理解的是,本申请的第二方面至第五方面与本申请的第一方面的技术方案相对应,各方面及对应的可行实施方式所取得的有益效果相似,不再赘述。
需要说明的是,本申请提供的网络优化方法和装置可用于金融领域在网络优化方面的应用,如金融服务网络系统的优化,也可用于除金融领域之外任意领域在网络优化方面的应用,本申请对网络优化方法和装置的应用领域不做限定。
附图说明
图1是本申请实施例提供的网络优化方法的场景示意图;
图2是本申请实施例提供的网络优化方法的示意性流程图;
图3是本申请实施例提供的网络优化方法中步骤220的示意性流程图;
图4是本申请实施例提供的网络优化方法中步骤230的示意性流程图;
图5是本申请实施例提供的网络优化装置的示意性框图;
图6是本申请实施例提供的网络优化装置另一示意性框图。
具体实施方式
使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请实施例中,术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。此外,术语“包括”以及任何变形,意图在于覆盖不排他的包含。
图1是本申请实施例提供的网络优化方法的场景示意图。如图1所示,该场景示出了发送设备101、接收设备102和链路103,链路103包括多个队列1031。发送设备101通过链路103运用RDMA技术向接收设备102发送数据,数据会通过链路中的一个或多个队列传输。
应理解,发送设备和接收设备是相对于数据传输的方向而言的。发送和接收是相对应的,并不应对设备本身构成任何限定。在有些情况下,发送设备101也可以成为其他数据的接收设备,接收设备102也可能成为其他数据的发送设备。
RDMA在无损状态下可以满速率传输,而一旦发生丢包,就会造成网络性能急剧下降。因此,要保证RDMA的网络性能,就要保证RDMA数据队列的无损性。
然而,目前构造网络的无损队列存在一些困难。比如,当RDMA网络出现拥塞时,拥塞流量进入队列,可能会导致丢包进而导致队列受损;又如,当RDMA网络出现死锁时,会导致多条队列受损。
鉴于此,本申请提供了一种网络优化方法和装置,对可能出现网络异常的设备进行监测,判断设备的网络异常情况,如发生流量拥塞或者死锁,并根据不同的网络异常情况采用不同的手段对队列进行优化,以提高RDMA网络的性能。
图2是本申请实施例提供的网络优化方法的示意性流程图。
需要说明的是,图2所示的方法以第一设备与第二设备之间的数据传输为例来说明了本申请实施例提供的网络优化方法。其中,第一设备为数据的接收设备,第二设备为数据的发送设备。可以理解的是,第一设备可以接收包括第二设备在内的一个或多个发送设备的数据。在具体实现中,第一设备可以通过其所包括的一个或多个端口与一个或多个发送设备连接,形成不同的链路。下文中不失一般性地以第一端口及其连接的第一链路为例来描述本申请实施例。该第一端口可以为第一设备的多个端口中的任意一个,该第一链路为与该第一设备连接的多个链路中的任意一个。因此,针对每一条链路,都可以通过本方案来进行监测和优化。
如图2所示,该方法200可以包括步骤210至230,例如可以是图1中的接收设备102。下面对方法200中的各个步骤做详细说明。
在步骤210中,第一设备基于RDMA技术,通过第一链路接收来自第二设备的数据。
其中,第一链路包括多个队列,数据传输在多个队列中的部分队列中。
在本实施例中,第一设备例如可以是图1中的接收设备102,第二设备例如可以是图1中的发送设备101,第二设备通过第一链路向第一设备发送数据,数据传输在第一设备和第二设备之间的链路的一个或多个队列中。应注意,由于本申请实施例中针对每个链路会配置一个或多个备份队列,因此,在正常传输中,第二设备向第一设备发送的数据可以传输在该链路包含的多个队列中的一个或多个队列中,但并不是全部队列。可以理解的是,上述数据所在的一个或多个队列不属于备份队列。
在步骤220中,第一设备确定在第一预设周期内通过第一链路发送PFC反压帧的异常次数超出第一预设门限。
一示例,第一预设周期为20秒,第一预设门限为10次,第一设备确定在20秒内通过第一链路发送PFC反压帧的异常次数超出10次,则这条链路需要优化。
应理解,这里的第一预设周期、第一预设门限可以由人为预先规定,分别可以是20秒、10次,也可以是其他值,本申请对此不作限定。超出第一预设门限可以表示大于第一预设门限。
还应理解,在具体实现中,也可以通过对第一预设门限的调整,使得超出第一预设门限这一条件转化为大于或等于第一预设门限。比如,以超出10次作为超出第一预设门限的一例,该条件也可以转化为大于或等于11次。应理解,本申请对于确定第一设备发送PFC反压帧异常的具体判断条件不作限定。
可选地,第一预设周期包括多个第二预设周期,第一设备会在每个第二预设周期内监测一次通过第一链路发送PFC反压帧的异常情况。
一示例,第一预设周期为20秒,第一预设门限为10次,第二预设周期为1秒,第一设备会每1秒监测一次通过第一链路发送PFC反压帧的异常情况,在20秒内会监测20次。如果其中异常次数超出10次,则这条链路需要优化。
应理解,这里的第二预设周期可以由人为预先规定,可以是1秒,也可以是其他值,本申请对此不作限定。第一预设周期可以是第二预设周期的整数倍,如此一来,监测整数次的时间恰好可以完整覆盖一个第一预设周期,便于第一设备对PFC反压帧异常情况的监测。
步骤220一种可能的实现方式如图3所示,步骤220具体包括步骤2201和2202。
步骤2201,第一设备监测第一预设周期内的每个第二预设周期中通过第一链路发送PFC反压帧的数量;
步骤2202,第一设备在第一预设周期内存在多个第二预设周期满足通过第一链路发送的PFC反压帧的数量超出第二预设门限,且多个第二预设周期的数量超出第一预设门限的情况下,确定在第一预设周期内通过第一链路发送PFC反压帧的异常次数超出第一预设门限。
下面对上述步骤做详细说明。
可选地,步骤2201具体包括:第一设备从网管平台获取第一设备的日志;第一设备基于日志,监测第一预设周期内的每个第二预设周期中通过第一链路发送PFC反压帧的数量。
第一设备从网管平台中获取日志的方式例如可以是系统日志(syslog)命令的方式。
一示例,第一设备每1秒从网管平台获取一次日志,并基于日志,每1秒监测一次通过第一链路发送PFC反压帧的数量,例如第一秒数量为2000、第二秒数量为100、第三秒数量为500等。
在一个20秒周期内,每1秒监测的通过第一链路发送PFC反压帧的数量如下表1所示。
表1
一示例,步骤2202中的第二预设门限可以由人为规定,也可以由第一设备通过机器自适应学习的方式确定。例如,认为规定该第二预设门限为1000,或者也可以是其他值,本申请对此不作限定。又例如,第一设备通过机器自适应学习确定,第一链路在此前一段未发生异常的时间内,每1秒发送的PFC反压帧的数量一般为几百个,不大于1000,因此可以将第一链路的第二预设门限设置为1000;或者,第二链路在此前一段未发生异常的时间内,每1秒发送的PFC反压帧的数量一般为几十个,不大于100,因此可以将第二链路的第二预设门限设置为100。本申请对于第二预设门限的具体取值不作限定。
超出第二预设门限可以表示大于第二预设门限。应理解,在具体实现中,也可以通过对第二门限的调整,使得超出第二预设门限这一条件转化为大于或等于第二预设门限。比如,以超出1000作为超出第二预设门限的一例,该条件也可以转化为大于或等于1001。应理解,本申请对于确定发送PFC反压帧是否异常的具体判断条件不做限定。
在一个第一预设周期即20秒内,通过第一链路发送PFC反压帧的数量超出1000的次数为11次,即,在第一预设周期内通过第一链路发送PFC反压帧的异常次数为11次,超出了第一预设门限10次。因此可以确认第一链路上的RDMA数据传输出现了异常情况。
可选地,在步骤220之前,该方法还包括,确定第一设备中积压的PFC反压帧数量超出第三预设门限。
为了降低第一设备的计算量,在对第一设备进行网络优化前,可以先对第一设备进行一次初步筛选。监测第一设备中积压的PFC反压帧数量是否超出第三预设门限,如果未超出第三预设门限,则第一设备没有网络异常的风险;如果超出第三预设门限,则第一设备有网络异常的风险,需要进一步判断是否确实出现了网络异常。
与第二预设门限相似,第三预设门限也可以由人为预先规定或者机器自适应学习的方式确定,此处不再赘述。
在步骤230中,第一设备根据第一链路中的流量,对第一链路中的队列进行优化。
根据步骤220,已经确认了第一链路上的RDMA数据传输出现了异常情况,接下来根据第一链路上的流量来判断异常情况是或不是死锁,再进一步根据不同的异常情况执行不同的优化操作。
步骤230一种可能的实现方式如图4所示,步骤230具体包括步骤2301到2303。
步骤2301,第一设备根据第一链路的流量,确定第一链路是否发生死锁;
步骤2302,第一设备在第一链路发生死锁的情况下,将用于连接第一链路的第一端口隔离;
步骤2303,第一设备在第一链路未发生死锁的情况下,向第二设备发送切换请求,其中,切换请求用于请求第二设备将数据切换至第一链路的备份队列中。下面对上述步骤做详细说明。
可选地,步骤2301包括:第一设备在第一链路的流量为零的情况下,确定第一链路发生死锁;或第一设备在第一链路的流量不为零的情况下,确定第一链路未发生死锁。
当多个设备之间因为数据环路等原因同时出现拥塞,各自端口缓存消耗超过阈值,而又互相等待对方释放资源,从而导致多个设备上的数据流都永久阻塞的网络状态,就是死锁状态。当第一链路发生死锁时,第一链路的流量就会降为零。因此,可以通过监测第一链路的流量情况,来判断第一链路是否发生死锁。
在步骤2302中,如果确定了第一链路发生死锁,就将用于连接第一链路的第一端口隔离。通过这个手段,可以破坏死锁环路,有助于解除死锁状态。后续在监测到死锁状态解除之后,可以解除隔离,恢复使用第一端口。
在步骤2303中,如果确定第一链路未发生死锁,也并不代表第一链路没有问题,因为通过步骤220已经判断出第一链路的数据传输出现了异常情况,这里的异常情况例如可能是拥塞。这时可以向第二设备,即,发送设备发送切换请求,第二设备收到切换请求后会将数据切换至第一链路的备份队列中。
如前所述,这里的备份队列为第一链路的多个队列中预先定义的一个或多个队列。备份队列在第一链路正常工作时,可以不参与数据传输,当第一链路拥塞时,第二设备收到第一设备发来的切换请求,就会将数据切换至备份队列进行传输。
可选地,在第一链路未发生死锁的情况下,步骤2303还包括,第一设备关闭第一端口的PFC功能。
第一设备包括多个端口,并且可以通过这多个端口连接的多个链路接收来自多个不同发送设备的数据。第一设备在第一链路发生拥塞时,会通过所有端口向所有的发送设备发送PFC反压帧,这就有可能影响正常工作未发生拥塞的链路。
因此,第一设备在第一链路发生异常但并未出现死锁时,除了上文提到的向第二设备发送切换请求之外,还可以关闭第一端口的PFC功能。这样就不会因为第一链路的异常,而向所有发送设备发送PFC反压帧,进而避免影响正常工作未发生拥塞的链路。
基于上述方法,筛选出可能出现异常的设备,并对可能出现网络异常的设备进行监测,判断设备的网络异常情况,如发生流量拥塞或者死锁,并根据不同的网络异常情况采用不同的手段对队列进行优化,以提高RDMA网络的性能。
图5是本申请实施例提供的网络优化装置的示意性框图。该装置可以对应于上文方法实施例中的第一设备,用于实现其对应的功能。如图5所示,该网络优化装置500可以包括接收模块510、网络监控模块520和处理模块530。
可选地,处理模块530包括异常处理模块531和死锁处理模块532。
其中,接收模块510可用于,基于RDMA技术,通过第一链路接收来自第二设备的数据,第一链路包括多个队列,数据传输在多个队列中的部分队列中;网络监控模块520可用于,确定在第一预设周期内通过第一链路发送PFC反压帧的异常次数超出第一预设门限;处理模块530可用于,根据第一链路中的流量,对第一链路中的队列进行优化。
其中,第一预设周期包括多个第二预设周期。
可选地,网络监控模块520可用于,监测第一预设周期内的每个第二预设周期中通过第一链路发送PFC反压帧的数量;在第一预设周期内存在多个第二预设周期满足通过第一链路发送的PFC反压帧的数量超出第二预设门限,且多个第二预设周期的数量超出第一预设门限的情况下,确定在第一预设周期内通过第一链路发送PFC反压帧的异常次数超出第一预设门限。
可选地,接收模块510可用于,从网管平台获取第一设备的日志;网络监控模块520可用于,基于日志,监测第一预设周期内的每个第二预设周期中通过第一链路发送PFC反压帧的数量。
可选地,处理模块530可用于,根据第一链路的流量,确定第一链路是否发生死锁;死锁处理模块532可用于,在第一链路发生死锁的情况下,将用于连接第一链路的第一端口隔离;异常处理模块531可用于,在第一链路未发生死锁的情况下,向第二设备发送切换请求,切换请求用于请求第二设备将数据切换至第一链路的备份队列中。
其中,备份队列为多个队列中预先定义的队列。
可选地,异常处理模块531还可用于,关闭第一端口的PFC功能。
可选地,处理模块530可用于,在第一链路的流量为零的情况下,确定第一链路发生死锁;或在第一链路的流量不为零的情况下,确定第一链路未发生死锁。
可选地,网络监控模块520还可用于,确定第一设备中积压的PFC反压帧数量超出第三预设门限。
其中,第一设备包括多个端口,多个端口用于连接多个链路,第一端口为多个端口中的任意一个,第一链路为多个链路中的任意一个。
图6是本申请实施例提供的网络优化装置的另一示意性框图。如图6所示,该装置600可以包括至少一个处理器610,用于可用于实现上述方法实施例中网络优化装置的功能。具体参见方法示例中的详细描述,此处不做赘述。
该装置600还可以包括一个存储器620,用于存储程序指令和/或数据。存储器620和处理器610耦合。本申请中的耦合是装置、单元或模块之间的间接耦合或通信连接,可以是电性,机械或其它的形式,用于装置、单元或模块之间的信息交互。处理器610可能和存储器620协同操作。处理器610可能执行存储器620中存储的程序指令。所述至少一个存储器中的至少一个可以包括于处理器中。
该装置600还可以包括一个通信接口630,用于通过传输介质和其它设备进行通信,从而用于装置600中的装置可以和其它设备进行通信。所述通信接口630例如可以是收发器、接口、总线、电路或者能够实现收发功能的装置。处理器610可利用通信接口630收发数据和/或信息,并用于实现图2对应的实施例中所述的网络优化方法。
本申请中不限定上述处理器610、存储器620以及通信接口630之间的具体连接介质。本申请在图6中以处理器610、存储器620以及通信接口630之间通过总线640连接。总线640在图6中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
在本申请实施例中,处理器可以是通用处理器、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本申请中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
根据本申请提供的方法,本申请还提供一种计算机可读存储介质,该计算机可读存储介质存储有程序代码,当该程序代码在计算机上运行时,使得该计算机执行图2至图4所示实施例中的网络优化方法。
根据本申请提供的方法,本申请还提供一种计算机程序产品,该计算机程序产品包括:计算机程序代码。当该计算机程序代码在计算机上运行时,使得该计算机执行图2至图4所示实施例中的网络优化方法。
本申请提供的技术方案可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、网络设备、终端设备或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线,例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机可以存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质例如,数字视频光盘(digital video disc,DVD)、或者半导体介质等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (11)

1.一种网络优化方法,其特征在于,包括:
第一设备基于远程直接内存访问RDMA技术,通过第一链路接收来自第二设备的数据,所述第一链路包括多个队列,所述数据传输在所述多个队列中的部分队列中;
所述第一设备确定在第一预设周期内通过所述第一链路发送基于优先级的流量控制PFC反压帧的异常次数超出第一预设门限;
所述第一设备根据所述第一链路中的流量,对所述第一链路中的队列进行优化;
所述第一设备确定在第一预设周期内通过所述第一链路发送基于优先级的流量控制PFC反压帧的异常次数超出第一预设门限,包括:
所述第一设备监测所述第一预设周期内的每个第二预设周期中通过所述第一链路发送PFC反压帧的数量;所述第一预设周期包括多个第二预设周期;
所述第一设备在所述第一预设周期内存在多个第二预设周期满足通过所述第一链路发送的PFC反压帧的数量超出第二预设门限,且所述多个第二预设周期的数量超出所述第一预设门限的情况下,确定在所述第一预设周期内通过所述第一链路发送PFC反压帧的异常次数超出第一预设门限。
2.如权利要求1所述的方法,其特征在于,所述第一设备监测所述第一预设周期内的每个第二预设周期中通过所述第一链路发送PFC反压帧的数量,包括:
所述第一设备从网管平台获取所述第一设备的日志;
所述第一设备基于所述日志,监测所述第一预设周期内的每个第二预设周期中通过所述第一链路发送PFC反压帧的数量。
3. 如权利要求1或2所述的方法,其特征在于,所述第一设备根据所述第一链路中的流量,对所述第一链路中的队列进行优化,包括:
所述第一设备根据所述第一链路的流量,确定所述第一链路是否发生死锁;以及
所述第一设备在所述第一链路发生死锁的情况下,将用于连接所述第一链路的第一端口隔离;或
所述第一设备在所述第一链路未发生死锁的情况下,向所述第二设备发送切换请求,所述切换请求用于请求所述第二设备将所述数据切换至所述第一链路的备份队列中。
4.如权利要求3所述的方法,其特征在于,在所述第一链路未发生死锁的情况下,所述方法还包括:
所述第一设备关闭所述第一端口的PFC功能。
5.如权利要求3所述的方法,其特征在于,所述备份队列为所述多个队列中预先定义的队列。
6. 如权利要求3所述的方法,其特征在于,所述第一设备根据所述第一链路的流量,确定所述第一链路是否发生死锁,包括:
所述第一设备在所述第一链路的流量为零的情况下,确定所述第一链路发生死锁;或
所述第一设备在所述第一链路的流量不为零的情况下,确定所述第一链路未发生死锁。
7.如权利要求1所述的方法,其特征在于,在所述第一设备确定在第一预设周期内通过所述第一链路发送基于优先级的流量控制PFC反压帧的异常次数超出第一预设门限之前,所述方法还包括:
确定所述第一设备中积压的PFC反压帧数量超出第三预设门限。
8.如权利要求1所述的方法,其特征在于,所述第一设备包括多个端口,所述多个端口用于连接多个链路,第一端口为所述多个端口中的任意一个,所述第一链路为所述多个链路中的任意一个。
9.一种网络优化装置,其特征在于,包括:
接收模块,用于基于RDMA技术,通过第一链路接收来自第二设备的数据,所述第一链路包括多个队列,所述数据传输在所述多个队列中的部分队列中;
网络监控模块,用于确定在第一预设周期内通过所述第一链路发送PFC反压帧的异常次数超出第一预设门限;
处理模块,用于根据所述第一链路中的流量,对所述第一链路中的队列进行优化;
所述网络监控模块,具体用于监测所述第一预设周期内的每个第二预设周期中通过所述第一链路发送PFC反压帧的数量;所述第一预设周期包括多个第二预设周期;在所述第一预设周期内存在多个第二预设周期满足通过所述第一链路发送的PFC反压帧的数量超出第二预设门限,且所述多个第二预设周期的数量超出所述第一预设门限的情况下,确定在所述第一预设周期内通过所述第一链路发送PFC反压帧的异常次数超出第一预设门限。
10.一种网络优化装置,其特征在于,包括处理器,所述处理器用于执行计算机程序,以实现如权利要求1至8中任一项所述的方法。
11.一种计算机可读存储介质,其特征在于,包括计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行权利要求1至8中任一项所述的方法。
CN202210238002.9A 2022-03-10 2022-03-10 一种网络优化方法和装置 Active CN114448896B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210238002.9A CN114448896B (zh) 2022-03-10 2022-03-10 一种网络优化方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210238002.9A CN114448896B (zh) 2022-03-10 2022-03-10 一种网络优化方法和装置

Publications (2)

Publication Number Publication Date
CN114448896A CN114448896A (zh) 2022-05-06
CN114448896B true CN114448896B (zh) 2024-01-30

Family

ID=81358989

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210238002.9A Active CN114448896B (zh) 2022-03-10 2022-03-10 一种网络优化方法和装置

Country Status (1)

Country Link
CN (1) CN114448896B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115987831B (zh) * 2022-12-19 2024-04-12 浪潮思科网络科技有限公司 一种网络设备的pfc死锁功能测试方法、设备及介质
CN115941599B (zh) * 2023-03-10 2023-05-16 珠海星云智联科技有限公司 一种用于预防pfc死锁的流量控制方法、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111600759A (zh) * 2020-05-22 2020-08-28 中国工商银行股份有限公司 拓扑结构中死锁故障的定位方法和装置
CN112242914A (zh) * 2019-07-18 2021-01-19 华为技术有限公司 网络异常根因定位方法、装置及系统、计算机存储介质
CN112448900A (zh) * 2019-09-02 2021-03-05 华为技术有限公司 一种数据传输方法及装置
CN112968811A (zh) * 2021-02-20 2021-06-15 中国工商银行股份有限公司 一种rdma网络的pfc异常处理方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112242914A (zh) * 2019-07-18 2021-01-19 华为技术有限公司 网络异常根因定位方法、装置及系统、计算机存储介质
CN112448900A (zh) * 2019-09-02 2021-03-05 华为技术有限公司 一种数据传输方法及装置
CN111600759A (zh) * 2020-05-22 2020-08-28 中国工商银行股份有限公司 拓扑结构中死锁故障的定位方法和装置
CN112968811A (zh) * 2021-02-20 2021-06-15 中国工商银行股份有限公司 一种rdma网络的pfc异常处理方法及装置

Also Published As

Publication number Publication date
CN114448896A (zh) 2022-05-06

Similar Documents

Publication Publication Date Title
CN114448896B (zh) 一种网络优化方法和装置
KR101593168B1 (ko) 물리적 단방향 통신 장치 및 방법
US10594606B2 (en) Wired data-connection aggregation
US9007902B1 (en) Method and apparatus for preventing head of line blocking in an Ethernet system
US20180331965A1 (en) Control channel usage monitoring in a software-defined network
CN114040467B (zh) 一种传输路径的确定方法、装置、服务器及存储介质
CN112491700B (zh) 网络路径调整方法、系统、装置、电子设备及存储介质
CN110740072A (zh) 一种故障检测方法、装置和相关设备
US9736187B2 (en) Data processing method and system
CN116233018A (zh) 报文处理方法、装置、电子设备及存储介质
US9225650B2 (en) Network system, gateway, and packet delivery method
EP1679826B1 (en) Terminal apparatus, terminal apparatus control method, network system, network system control method, program and recording medium
US7978597B2 (en) Communication management system, communication management method, and communication management device
CA2621904A1 (en) Bandwidth control apparatus, bandwidth control system, and bandwidth control method
WO2015180265A1 (zh) 多链路保护倒换的方法及装置
CN109067663B (zh) 一种针对应用程序内控制请求响应速率的系统和方法
JP4849270B2 (ja) コンピュータ装置
US11677673B1 (en) Low latency flow control in data centers
CN115529277A (zh) 处理网络拥塞的方法和交换机
US20210004308A1 (en) Data processing method and system
US11784929B2 (en) Heterogeneous link data translation and distribution method, system and device, and storage medium
CN114125931A (zh) 流量调节方法、装置和网络设备
US20100158007A1 (en) Method and apparatus for aggregating single packets in a single session
JP2701797B2 (ja) Lan集線装置
CN106559351B (zh) 一种处理报文的方法、sdn控制器及网元

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant