CN115174432B - Rdma网络状态监测方法、装置、设备及可读存储介质 - Google Patents
Rdma网络状态监测方法、装置、设备及可读存储介质 Download PDFInfo
- Publication number
- CN115174432B CN115174432B CN202210761591.9A CN202210761591A CN115174432B CN 115174432 B CN115174432 B CN 115174432B CN 202210761591 A CN202210761591 A CN 202210761591A CN 115174432 B CN115174432 B CN 115174432B
- Authority
- CN
- China
- Prior art keywords
- rdma network
- network state
- rdma
- rate
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000012544 monitoring process Methods 0.000 title claims abstract description 41
- 238000013139 quantization Methods 0.000 claims abstract description 25
- 238000005259 measurement Methods 0.000 claims abstract description 19
- 238000012549 training Methods 0.000 claims abstract description 18
- 238000004458 analytical method Methods 0.000 claims abstract description 12
- 238000004590 computer program Methods 0.000 claims description 15
- 238000012806 monitoring device Methods 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 12
- 230000005540 biological transmission Effects 0.000 claims description 9
- 238000001514 detection method Methods 0.000 claims description 7
- 230000003068 static effect Effects 0.000 claims description 5
- 230000008447 perception Effects 0.000 claims description 2
- 239000000523 sample Substances 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 5
- 238000013439 planning Methods 0.000 abstract description 5
- 238000012827 research and development Methods 0.000 abstract description 3
- 238000012545 processing Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000010223 real-time analysis Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0677—Localisation of faults
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/142—Network analysis or design using statistical or mathematical methods
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Pure & Applied Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Algebra (AREA)
- Environmental & Geological Engineering (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请适用于计算机网络技术,具体公开了一种RDMA网络状态监测方法、装置、设备及可读存储介质,通过预先获取业务系统的多种业务场景下的历史RDMA网络状态参数,量化得到业务场景状态量化参数,利用历史RDMA网络状态参数与对应的业务场景状态量化参数训练得到高质量的RDMA网络状态感知模型,从而在采集到RDMA网络状态参数后,输入RDMA网络状态感知模型得到RDMA网络状态感知结果,将RDMA网络状态感知结果与业务系统的RDMA网络拓扑结合,得到业务系统当前时刻的RDMA网络状态度量分析结果,有助于数据中心了解RDMA网络情况,进行故障定位和网络规划,有助于指导应用服务的研发人员优化和加速应用。
Description
技术领域
本申请涉及计算机网络技术领域,特别是涉及一种RDMA网络状态监测方法、装置、设备及可读存储介质。
背景技术
远程直接数据存取(Remote direct memory access,下文简称RDMA)技术是目前主流的高性能计算机互连技术之一,其核心在于将网络层和传输层下移到服务器的硬件网卡中,使得数据报文在网卡上完成四层解析后直接到达应用层软件而无需中央处理器(Central Processing Unit,下文简称CPU)干预。与传统的传输控制协议/网际协议(Transmission Control Protocol/Internet Protocol,简称TCP/IP)协议相比,RDMA网络通过将大多网络功能卸载到物理网卡上,可以将数据从一个系统快速移动到远程系统存储器中,绕开了操作系统内核,且RDMA网卡可以直接与应用内存相互传输数据,消除了在应用内存与内核内存之间复制数据的需要,在提高了吞吐量的同时降低了时延和CPU占用率。
然而,现有工业界和学术界缺少针对RDMA的网络状态感知与度量方案。而传统的针对普通网卡的网络状态感知方案,主要分为硬件方案和软件方案两种。其中,传统的针对普通网卡的基于硬件的流量捕获抓包方式,在性能和精度方面较有优势,但是部署时,需要在链路中部署专用的硬件,成本较高,灵活性不强。传统的针对普通网卡的基于软件的流量捕获离线分析方式,利用厂家提供的抓包工具进行抓包分析,但只能进行简单的带宽时延测试。而RDMA网卡相较于普通网卡承担了更多的业务压力,利用传统的针对普通网卡的网络状态感知与度量方案,无法对RDMA网络进行准确的网络状态感知与度量。
提供一种针对RDMA网络的网络状态感知与度量方案,是本领域技术人员需要解决的技术问题。
发明内容
本申请的目的是提供一种RDMA网络状态监测方法、装置、设备及可读存储介质,用于实现对RDMA网络的网络状态感知与度量,利于故障定位。
为解决上述技术问题,本申请提供一种RDMA网络状态监测方法,包括:
预先获取业务系统的多种业务场景下的历史RDMA网络状态参数,利用所述历史RDMA网络状态参数与对应的业务场景状态量化参数训练得到RDMA网络状态感知模型;
当采集到RDMA网络状态参数后,将所述RDMA网络状态参数输入所述RDMA网络状态感知模型,得到RDMA网络状态感知结果;
结合所述RDMA网络状态感知结果和所述业务系统的RDMA网络拓扑,得到所述业务系统的RDMA网络状态度量分析结果。
可选的,所述历史RDMA网络状态参数具体包括:RDMA链路层的节点可用性指标,RDMA网络层的连接可用性指标,RDMA网络层的网络负载指标,以及RDMA应用层的RDMA操作相关指标。
可选的,所述节点可用性指标具体包括:RDMA端口状态、丢弃发送速率、溢出发送速率中的至少一项。
可选的,所述连接可用性指标具体包括:发送应答超时数、发送等待时间、报文序列号错误数中的至少一项。
可选的,所述网络负载指标具体包括:传输建立连接时的往返时间、RDMA操作时延、发送拥塞速率、接收失序速率、网卡接收速率、转发失败发送速率、单位否定应答错误数、网卡发送速率、单位冗余检测错误数、网卡多播速率、接收错报速率、网卡单播速率、静态显示拥塞通知接收速率中的至少一项。
可选的,所述传输建立连接时的往返时间,具体为RDMA网络的请求端进行握手时发送的SYN包到发送应答的多个连接的平均值。
可选的,所述RDMA操作时延,具体通过在RDMA网络的节点发送探测包计算得到。
可选的,所述RDMA操作相关流量指标具体包括:单位接收原子对象请求速率、单位设备控制表接收请求数、读请求速率、写请求速率、单位请求完成队列失败数、单位请求完成队列刷新失败数、单位远程访问错误数、非法请求错误数、单位被动重传数、单位响应完成队列失败数、单位响应完成队列刷新失败数、单位长度错误数中的至少一项。
可选的,所述获取业务系统的多种业务场景下的历史RDMA网络状态参数,具体为:
基于安装于RDMA网卡的网卡驱动获取所述历史RDMA网络状态参数;
采集所述RDMA网络状态参数,具体为:
基于所述网卡驱动获取所述RDMA网络状态参数。
为解决上述技术问题,本申请还提供一种RDMA网络状态监测装置,包括:
训练单元,用于预先获取业务系统的多种业务场景下的历史RDMA网络状态参数,利用所述历史RDMA网络状态参数与对应的业务场景状态量化参数训练得到RDMA网络状态感知模型;
感知单元,用于当采集到RDMA网络状态参数后,将所述RDMA网络状态参数输入所述RDMA网络状态感知模型,得到RDMA网络状态感知结果;
度量单元,用于结合所述RDMA网络状态感知结果和所述业务系统的RDMA网络拓扑,得到所述业务系统的RDMA网络状态度量分析结果。
为解决上述技术问题,本申请还提供一种RDMA网络状态监测设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,所述计算机程序被所述处理器执行时实现如上述任意一项所述RDMA网络状态监测方法的步骤。
为解决上述技术问题,本申请还提供一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任意一项所述RDMA网络状态监测方法的步骤。
本申请所提供的RDMA网络状态监测方法,通过预先获取业务系统的多种业务场景下的历史RDMA网络状态参数,量化得到业务场景状态量化参数,利用历史RDMA网络状态参数与对应的业务场景状态量化参数训练得到高质量的RDMA网络状态感知模型,从而在采集到RDMA网络状态参数后,将RDMA网络状态参数输入RDMA网络状态感知模型,可以得到RDMA网络状态感知结果,进而将RDMA网络状态感知结果与业务系统的RDMA网络拓扑结合,得到业务系统当前时刻的RDMA网络状态度量分析结果,有助于数据中心的网络管理员了解RDMA网络情况,进行故障定位和网络规划,有助于指导应用服务的研发人员优化和加速应用。
本申请还提供一种RDMA网络状态监测装置、设备及可读存储介质,具有上述有益效果,在此不再赘述。
附图说明
为了更清楚的说明本申请实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种RDMA网络状态监测方法的流程图;
图2为本申请实施例提供的一种RDMA网络状态监测装置的结构示意图;
图3为本申请实施例提供的一种RDMA网络状态监测设备的结构示意图。
具体实施方式
本申请的核心是提供一种RDMA网络状态监测方法、装置、设备及可读存储介质,用于实现对RDMA网络的网络状态感知与度量,利于故障定位。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
实施例一
图1为本申请实施例提供的一种RDMA网络状态监测方法的流程图。
如图1所示,本申请实施例提供的RDMA网络状态监测方法包括:
S101:预先获取业务系统的多种业务场景下的历史RDMA网络状态参数,利用历史RDMA网络状态参数与对应的业务场景状态量化参数训练得到RDMA网络状态感知模型。
S102:当采集到RDMA网络状态参数后,将RDMA网络状态参数输入RDMA网络状态感知模型,得到RDMA网络状态感知结果。
S103:结合RDMA网络状态感知结果和业务系统的RDMA网络拓扑,得到业务系统的RDMA网络状态度量分析结果。
由于RDMA网络实现了绕过内核进行远程数据存取、零拷贝技术,且相较于普通网卡,RDMA网卡承担了更多的业务压力,导致采用传统的利用抓包工具对网络进行简单的带宽时延测试的方式无法对RDMA网络状态进行准确的感知与度量,不利于RDMA技术的推广应用。
故本申请实施例提供一种RDMA网络状态监测方法,通过预先训练RDMA网络状态感知模型,建立RDMA网络状态与业务场景的对应关系,将该RDMA网络状态感知模型投入RDMA网络状态监测,有助于数据中心的网络管理员了解网络情况,进行故障定位和网络规划,有助于指导应用服务的研发人员优化和加速应用。
在具体实施中,对于S101,首先需要获取特定的业务场景下的历史RDMA网络状态参数,从而生成由历史RDMA网络状态参数与对应的业务场景状态量化参数组成的训练数据,利用该训练数据进行深度学习或机器学习的权重训练,输出各参考状态的度量计算机制。
具体可以从RDMA链路层、RDMA网络层和RDMA应用层三个角度获取历史RDMA网络状态参数,从RDMA网络各Opcode类型流量速率、RDMA消息吞吐量(网络)、QP(QPair,RDMA传输的数据类型)的消耗量(即通过检测RDMA网络中传输了多少数据,来确定接收缓冲区的大小)可以为研究时延敏感型、吞吐量敏感型、带宽敏感型的应用之间的相互竞争分析提供依据。
目前部分RDMA厂商提供的RDMA网卡驱动具有读取RDMA网络状态参数的功能,但现有情况下并未对RDMA网络状态参数进行处理。在本申请实施例提供的RDMA网络状态监测方法中,可以利用RDMA网卡驱动读取历史RDMA网络状态参数和实时的RDMA网络状态参数。
则S101中,获取业务系统的多种业务场景下的历史RDMA网络状态参数,具体可以为:基于安装于RDMA网卡的网卡驱动获取历史RDMA网络状态参数。
S102中,采集RDMA网络状态参数,具体可以为:基于网卡驱动获取RDMA网络状态参数。
而在S101中,为了实现对RDMA网络状态进行准确的感知和度量,需要对各业务场景进行等级划分以作为度量指标。例如,针对链路拥塞场景,可以设置多级拥塞程度参数用以度量多个拥塞程度等级。业务场景状态量化参数也可以从业务场景下对业务系统的业务状态参数进行统计汇总后得到。
而S101中获取到特定业务场景下的历史RDMA网络状态参数,可以通过长期对业务系统进行RDMA网络状态参数采集得到,也可以通过对业务系统进行加压,得到多种业务场景下的历史RDMA网络状态参数。
为保证RDMA网络状态感知模型感知的准确性,利用多组训练数据对模型权重进行不断迭代训练,并利用新获取到的RDMA网络状态参数与对应的业务场景状态量化参数对RDMA网络状态感知模型进行准确性验证,直至得到满足训练准确性条件的RDMA网络状态感知模型。
对于S102,将S101中得到的RDMA网络状态感知模型投入RDMA网络状态监测中,将采集的RDMA网络状态参数输入RDMA网络状态感知模型,输出的是RDMA网络状态感知模型预测得到的业务场景状态量化参数,以作为监测时刻的RDMA网络状态感知结果。
对于S103,再将S102得到的RDMA网络状态感知结果与业务系统的RDMA网络拓扑结合,对RDMA网络状态感知结果进行定位,可以在较低误差下客观反映出RDMA网络的网络状态,提供故障定位建议。
本申请实施例提供的RDMA网络状态监测方法,通过预先获取业务系统的多种业务场景下的历史RDMA网络状态参数,量化得到业务场景状态量化参数,利用历史RDMA网络状态参数与对应的业务场景状态量化参数训练得到高质量的RDMA网络状态感知模型,从而在采集到RDMA网络状态参数后,将RDMA网络状态参数输入RDMA网络状态感知模型,可以得到RDMA网络状态感知结果,进而将RDMA网络状态感知结果与业务系统的RDMA网络拓扑结合,得到业务系统当前时刻的RDMA网络状态度量分析结果,有助于数据中心的网络管理员了解RDMA网络情况,进行故障定位和网络规划,有助于指导应用服务的研发人员优化和加速应用。
实施例二
为全面描述RDMA网络状态,本申请实施例提供的RDMA网络状态监测方法采用的历史RDMA网络状态参数具体可以包括RDMA链路层的节点可用性指标,RDMA网络层的连接可用性指标,RDMA网络层的网络负载指标,以及RDMA应用层的RDMA操作相关指标。
其中,节点可用性指标为针对网络和服务性能下降时,关于RDMA节点方面的状态感知。作为链路层指标,节点可用性指标可以包括但不限于:RDMA端口状态phys_state/state、丢弃发送速率port_xmit_discards、溢出发送速率out_of_buffer等。这些指标均可以通过RDMA网卡安装的RDMA网卡驱动读取到,通常来源于/sys/class/infiniband/文件夹下的统计文件。
连接可用性指标从网络层数据包角度表征网络状态。作为网络层指标,连接可用性指标可以包括但不限于:发送应答(acknowledge,ACK)超时数local_ack_timeout_err、发送等待时间port_xmit_wait、报文序列号(Packet Sequence Number,PSN)错误数implied_nak_seq_err等。这些指标同样可以通过RDMA网卡安装的RDMA网卡驱动读取到,来源于/sys/class/infiniband/文件夹下的统计文件。
网络负载指标也属于网络层,主要针对网络规划和网络拥塞发现两个角度。网络负载指标可以包括但不限于:传输建立连接时的往返时间RTT、RDMA操作时延、发送拥塞速率snp_cnp_sent、接收失序速率out_of_sequence、网卡接收速率port_rcv_date/port_rcv_packets、转发失败发送速率port_rcv_switch_relay_errors、单位否定应答(Negative Acknowledgment,NAK)错误数packet_seq_err、网卡发送速率port_xmit_data/port_xmit_packets、单位冗余检测(ICRC)错误数rx_icrc_encapsulated、网卡多播速率port_multicast_rcv_packets、接收错报速率port_rcv_errors、网卡单播速率port_unicast_rcv_packets、静态显示拥塞通知(Explicit Congestion Notification,ECN)接收速率np_ecn_marked_roce_packets等。
其中,传输建立连接时的往返时间RTT,具体可以采用RDMA网络的请求端进行握手时发送的SYN包(TCP连接时用于握手的第一个数据包)到发送应答(ACK)的多个连接的平均值。此时,传输建立连接时的往返时间RTT可以在度量系统进行在线实时分析计算得出。
RDMA操作时延,具体可以通过在RDMA网络的节点发送探测包计算得到。
发送拥塞速率snp_cnp_sent、接收失序速率out_of_sequence、网卡接收速率port_rcv_date/port_rcv_packets、转发失败发送速率port_rcv_switch_relay_errors、单位否定应答(Negative Acknowledgment,NAK)错误数packet_seq_err、网卡发送速率port_xmit_data/port_xmit_packets、单位冗余检测(ICRC)错误数rx_icrc_encapsulated、网卡多播速率port_multicast_rcv_packets、接收错报速率port_rcv_errors、网卡单播速率port_unicast_rcv_packets、静态显示拥塞通知(ExplicitCongestion Notification,ECN)接收速率np_ecn_marked_roce_packets等指标同样可以通过RDMA网卡安装的RDMA网卡驱动读取到,来源于/sys/class/infiniband/文件夹下的统计文件。
需要说明的是,单位冗余检测(ICRC)错误数rx_icrc_encapsulated与RDMA网络协议类型对应,例如当采用RoCE(RDMA over Converged Ethernet)协议时,即为RoCE单位冗余检测(RoCE-ICRC)错误数。
RDMA操作相关指标旨在发现网络中各种服务调用中RDMA操作类型的分布,从而了解网络中真正关键操作,发现性能瓶颈,指导基于RDMA的应用的优化方向,属于应用层指标。RDMA操作相关流量指标可以包括但不限于:单位接收原子对象(atomic)请求速率rx_atomic_requesets、单位设备控制表(DCT)接收请求数rx_atomic_requests、读(READ)请求速率rx_read_requests、写(WRITE)请求速率rx_write_requests、单位请求完成队列失败数req_cqe_error、单位请求完成队列刷新(flush)失败数req_cqe_flush_error、单位远程访问错误数req_remote_access_errors、非法请求错误数req_remote_invalid_request、单位被动重传数duplicate_request、单位响应完成队列失败数resp_cqe_error、单位响应完成队列刷新(flush)失败数resp_cqe_flush_error、单位长度错误数resq_local_length_error等。这些指标同样可以通过RDMA网卡安装的RDMA网卡驱动读取到,来源于/sys/class/infiniband/文件夹下的统计文件。
本申请实施例提供的RDMA网络状态监测方法,通过从RDMA链路层的节点可用性指标,RDMA网络层的连接可用性指标,RDMA网络层的网络负载指标,以及RDMA应用层的RDMA操作相关指标,多角度、多维度、多层次的RDMA网络指标度量体系,全方位分析网络状态、弥补了现有技术只有硬件统计的错误累计数据、缺失应用层和业务流方面指标而无法全方位感知网络状态的不足。
实施例三
在上述实施例的基础上,为更方便度量业务场景状态,业务场景具体可以包括但不限于:流控场景、拥塞控制场景、优化资源调度控制场景等。
流控场景、拥塞控制场景、优化资源调度控制场景均为站在业务系统预先部署的控制方法的角度进行描述的业务场景。
如流控机制是用来避免消息的发送速率过快而导致服务器难以支撑的情形。
拥塞控制是针对到达通信子网中某一部分的分组数量过多,使得该部分网络来不及处理,以致引起这部分乃至整个网络性能下降的现象,通过传输层的重传策略、乱序缓存策略、确认策略、流控制策略和确定超时策略等,网络层的子网内部的虚电路与数据报策略、分组排队和服务策略、分组丢弃策略、路由算法和分组生存管理等,数据链路层的重传策略、乱序缓存策略、确认策略和流控制策略等,来防止拥塞。
优化资源调度控制则是根据业务需求和业务系统实际资源情况,对业务系统资源进行合理分配。
应用这些业务系统预先部署的控制方案,可以方便地选取业务场景状态量化参数。如针对拥塞控制场景,可以以拥塞控制机制中触发拥塞控制的多个阈值作为业务场景状态量化参数,并对应定性为拥塞一级场景、拥塞二级场景等。
上文详述了RDMA网络状态监测方法对应的各个实施例,在此基础上,本申请还公开了与上述方法对应的RDMA网络状态监测装置、设备及可读存储介质。
实施例四
图2为本申请实施例提供的一种RDMA网络状态监测装置的结构示意图。
如图2所示,本申请实施例提供的RDMA网络状态监测装置包括:
训练单元201,用于预先获取业务系统的多种业务场景下的历史RDMA网络状态参数,利用历史RDMA网络状态参数与对应的业务场景状态量化参数训练得到RDMA网络状态感知模型;
感知单元202,用于当采集到RDMA网络状态参数后,将RDMA网络状态参数输入RDMA网络状态感知模型,得到RDMA网络状态感知结果;
度量单元203,用于结合RDMA网络状态感知结果和业务系统的RDMA网络拓扑,得到业务系统的RDMA网络状态度量分析结果。
进一步的,历史RDMA网络状态参数具体可以包括RDMA链路层的节点可用性指标,RDMA网络层的连接可用性指标,RDMA网络层的网络负载指标,以及RDMA应用层的RDMA操作相关指标。
进一步的,节点可用性指标具体可以包括:RDMA端口状态、丢弃发送速率、溢出发送速率中的至少一项。
进一步的,连接可用性指标具体可以包括:发送应答超时数、发送等待时间、报文序列号错误数中的至少一项。
进一步的,网络负载指标具体可以包括:传输建立连接时的往返时间、RDMA操作时延、发送拥塞速率、接收失序速率、网卡接收速率、转发失败发送速率、单位否定应答错误数、网卡发送速率、单位冗余检测错误数、网卡多播速率、接收错报速率、网卡单播速率、静态显示拥塞通知接收速率中的至少一项。
其中,传输建立连接时的往返时间,具体可以为RDMA网络的请求端进行握手时发送的SYN包到发送应答的多个连接的平均值。
其中,RDMA操作时延,具体可以通过在RDMA网络的节点发送探测包计算得到。
进一步的,RDMA操作相关流量指标具体可以包括:单位接收原子对象请求速率、单位设备控制表接收请求数、读请求速率、写请求速率、单位请求完成队列失败数、单位请求完成队列刷新失败数、单位远程访问错误数、非法请求错误数、单位被动重传数、单位响应完成队列失败数、单位响应完成队列刷新失败数、单位长度错误数中的至少一项。
进一步的,训练单元201获取业务系统的多种业务场景下的历史RDMA网络状态参数,具体可以为:基于安装于RDMA网卡的网卡驱动获取历史RDMA网络状态参数;
感知单元202采集RDMA网络状态参数,具体可以为:基于网卡驱动获取RDMA网络状态参数。
由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
实施例五
图3为本申请实施例提供的一种RDMA网络状态监测设备的结构示意图。
如图3所示,本申请实施例提供的RDMA网络状态监测设备包括:
存储器310,用于存储计算机程序311;
处理器320,用于执行计算机程序311,该计算机程序311被处理器320执行时实现如上述任意一项实施例所述RDMA网络状态监测方法的步骤。
其中,处理器320可以包括一个或多个处理核心,比如3核心处理器、8核心处理器等。处理器320可以采用数字信号处理DSP(Digital Signal Processing)、现场可编程门阵列FPGA(Field-Programmable Gate Array)、可编程逻辑阵列PLA(Programmable LogicArray)中的至少一种硬件形式来实现。处理器320也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称中央处理器CPU(CentralProcessing Unit);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器320可以集成有图像处理器GPU(Graphics Processing Unit),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器320还可以包括人工智能AI(Artificial Intelligence)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器310可以包括一个或多个可读存储介质,该可读存储介质可以是非暂态的。存储器310还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器310至少用于存储以下计算机程序311,其中,该计算机程序311被处理器320加载并执行之后,能够实现前述任一实施例公开的RDMA网络状态监测方法中的相关步骤。另外,存储器310所存储的资源还可以包括操作系统312和数据313等,存储方式可以是短暂存储或者永久存储。其中,操作系统312可以为Windows。数据313可以包括但不限于上述方法所涉及到的数据。
在一些实施例中,RDMA网络状态监测设备还可包括有显示屏330、电源340、通信接口350、输入输出接口360、传感器370以及通信总线380。
本领域技术人员可以理解,图3中示出的结构并不构成对RDMA网络状态监测设备的限定,可以包括比图示更多或更少的组件。
本申请实施例提供的RDMA网络状态监测设备,包括存储器和处理器,处理器在执行存储器存储的程序时,能够实现如上所述的RDMA网络状态监测方法,效果同上。
实施例六
需要说明的是,以上所描述的装置、设备实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个可读存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本申请各个实施例所述方法的全部或部分步骤。
为此,本申请实施例还提供一种可读存储介质,该可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如RDMA网络状态监测方法的步骤。
该可读存储介质可以包括:U盘、移动硬盘、只读存储器ROM(Read-Only Memory)、随机存取存储器RAM(Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本实施例中提供的可读存储介质所包含的计算机程序能够在被处理器执行时实现如上所述的RDMA网络状态监测方法的步骤,效果同上。
以上对本申请所提供的一种RDMA网络状态监测方法、装置、设备及可读存储介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、设备及可读存储介质而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
Claims (12)
1.一种RDMA网络状态监测方法,其特征在于,包括:
预先获取业务系统的多种业务场景下的历史RDMA网络状态参数,利用所述历史RDMA网络状态参数与对应的业务场景状态量化参数训练得到RDMA网络状态感知模型;
当采集到RDMA网络状态参数后,将所述RDMA网络状态参数输入所述RDMA网络状态感知模型,得到RDMA网络状态感知结果;
结合所述RDMA网络状态感知结果和所述业务系统的RDMA网络拓扑,得到所述业务系统的RDMA网络状态度量分析结果;
其中,所述RDMA网络状态感知结果包括业务场景状态量化参数;所述业务场景状态量化参数包括用以度量多个拥塞程度等级的多级拥塞程度参数。
2.根据权利要求1所述的RDMA网络状态监测方法,其特征在于,所述历史RDMA网络状态参数具体包括:RDMA链路层的节点可用性指标,RDMA网络层的连接可用性指标,RDMA网络层的网络负载指标,以及RDMA应用层的RDMA操作相关指标。
3.根据权利要求2所述的RDMA网络状态监测方法,其特征在于,所述节点可用性指标具体包括:RDMA端口状态、丢弃发送速率、溢出发送速率中的至少一项。
4.根据权利要求2所述的RDMA网络状态监测方法,其特征在于,所述连接可用性指标具体包括:发送应答超时数、发送等待时间、报文序列号错误数中的至少一项。
5.根据权利要求2所述的RDMA网络状态监测方法,其特征在于,所述网络负载指标具体包括:传输建立连接时的往返时间、RDMA操作时延、发送拥塞速率、接收失序速率、网卡接收速率、转发失败发送速率、单位否定应答错误数、网卡发送速率、单位冗余检测错误数、网卡多播速率、接收错报速率、网卡单播速率、静态显示拥塞通知接收速率中的至少一项。
6.根据权利要求5所述的RDMA网络状态监测方法,其特征在于,所述传输建立连接时的往返时间,具体为RDMA网络的请求端进行握手时发送的SYN包到发送应答的多个连接的平均值。
7.根据权利要求5所述的RDMA网络状态监测方法,其特征在于,所述RDMA操作时延,具体通过在RDMA网络的节点发送探测包计算得到。
8.根据权利要求2所述的RDMA网络状态监测方法,其特征在于,所述RDMA操作相关流量指标具体包括:单位接收原子对象请求速率、单位设备控制表接收请求数、读请求速率、写请求速率、单位请求完成队列失败数、单位请求完成队列刷新失败数、单位远程访问错误数、非法请求错误数、单位被动重传数、单位响应完成队列失败数、单位响应完成队列刷新失败数、单位长度错误数中的至少一项。
9.根据权利要求1所述的RDMA网络状态监测方法,其特征在于,所述获取业务系统的多种业务场景下的历史RDMA网络状态参数,具体为:
基于安装于RDMA网卡的网卡驱动获取所述历史RDMA网络状态参数;
采集所述RDMA网络状态参数,具体为:
基于所述网卡驱动获取所述RDMA网络状态参数。
10.一种RDMA网络状态监测装置,其特征在于,包括:
训练单元,用于预先获取业务系统的多种业务场景下的历史RDMA网络状态参数,利用所述历史RDMA网络状态参数与对应的业务场景状态量化参数训练得到RDMA网络状态感知模型;
感知单元,用于当采集到RDMA网络状态参数后,将所述RDMA网络状态参数输入所述RDMA网络状态感知模型,得到RDMA网络状态感知结果;
度量单元,用于结合所述RDMA网络状态感知结果和所述业务系统的RDMA网络拓扑,得到所述业务系统的RDMA网络状态度量分析结果;
其中,所述RDMA网络状态感知结果包括业务场景状态量化参数;所述业务场景状态量化参数包括用以度量多个拥塞程度等级的多级拥塞程度参数。
11.一种RDMA网络状态监测设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至9任意一项所述RDMA网络状态监测方法的步骤。
12.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至9任意一项所述RDMA网络状态监测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210761591.9A CN115174432B (zh) | 2022-06-30 | 2022-06-30 | Rdma网络状态监测方法、装置、设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210761591.9A CN115174432B (zh) | 2022-06-30 | 2022-06-30 | Rdma网络状态监测方法、装置、设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115174432A CN115174432A (zh) | 2022-10-11 |
CN115174432B true CN115174432B (zh) | 2024-02-13 |
Family
ID=83489889
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210761591.9A Active CN115174432B (zh) | 2022-06-30 | 2022-06-30 | Rdma网络状态监测方法、装置、设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115174432B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115622929B (zh) * | 2022-12-20 | 2023-03-07 | 珠海星云智联科技有限公司 | 远程直接数据存取rdma的测试方法及相关装置 |
CN115801642B (zh) * | 2023-02-13 | 2023-05-30 | 深圳市泛联信息科技有限公司 | 基于状态控制的rdma通讯管理模块、方法、设备及介质 |
CN116405377B (zh) * | 2023-06-07 | 2023-08-08 | 太初(无锡)电子科技有限公司 | 网络状态检测方法、协议转换组件、设备及存储介质 |
CN117579559B (zh) * | 2024-01-17 | 2024-04-23 | 企商在线(北京)数据技术股份有限公司 | 一种基于AI的RoCEv2拥塞控制方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111211988A (zh) * | 2019-12-04 | 2020-05-29 | 哈尔滨工业大学(深圳) | 面向分布式机器学习的数据传输方法及系统 |
CN112953842A (zh) * | 2021-04-28 | 2021-06-11 | 中国工商银行股份有限公司 | 处理rdma网络拥塞的方法、装置、设备及介质 |
CN114024913A (zh) * | 2021-09-30 | 2022-02-08 | 浪潮电子信息产业股份有限公司 | 一种网络性能优化方法、装置、设备以及存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11068412B2 (en) * | 2019-02-22 | 2021-07-20 | Microsoft Technology Licensing, Llc | RDMA transport with hardware integration |
US11575609B2 (en) * | 2019-07-19 | 2023-02-07 | Intel Corporation | Techniques for congestion management in a network |
-
2022
- 2022-06-30 CN CN202210761591.9A patent/CN115174432B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111211988A (zh) * | 2019-12-04 | 2020-05-29 | 哈尔滨工业大学(深圳) | 面向分布式机器学习的数据传输方法及系统 |
CN112953842A (zh) * | 2021-04-28 | 2021-06-11 | 中国工商银行股份有限公司 | 处理rdma网络拥塞的方法、装置、设备及介质 |
CN114024913A (zh) * | 2021-09-30 | 2022-02-08 | 浪潮电子信息产业股份有限公司 | 一种网络性能优化方法、装置、设备以及存储介质 |
Non-Patent Citations (1)
Title |
---|
RDMA高速网络状态感知与度量指标体系研究;徐佳玮等;《计算机应用与软件》;第39卷(第2期);第128-137页 * |
Also Published As
Publication number | Publication date |
---|---|
CN115174432A (zh) | 2022-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115174432B (zh) | Rdma网络状态监测方法、装置、设备及可读存储介质 | |
Chen et al. | Fine-grained queue measurement in the data plane | |
US20210119930A1 (en) | Reliable transport architecture | |
Zats et al. | DeTail: Reducing the flow completion time tail in datacenter networks | |
US20180375748A1 (en) | Network traffic tracking using encapsulation protocol | |
CN1795446B (zh) | 计算机集群及其中的计算机节点和传送状态信息的方法 | |
US7414975B2 (en) | Protocol stack | |
US7016971B1 (en) | Congestion management in a distributed computer system multiplying current variable injection rate with a constant to set new variable injection rate at source node | |
US10033602B1 (en) | Network health management using metrics from encapsulation protocol endpoints | |
EP3874698A1 (en) | Link fault isolation using latencies | |
CN102404170B (zh) | 报文丢失检测方法、装置、及系统 | |
US20220038374A1 (en) | Microburst detection and management | |
US9172646B2 (en) | Dynamic reconfiguration of network devices for outage prediction | |
US9197566B2 (en) | Information processing method, recording medium, and information processing apparatus | |
JP2022532731A (ja) | スライスベースネットワークにおける輻輳回避 | |
Pedretti et al. | Using the Cray Gemini Performance Counters. | |
US20170063660A1 (en) | Application-specific integrated circuit data flow entity counting | |
JP5957318B2 (ja) | ネットワークシステム、情報中継装置、及びパケット配信方法 | |
US11528187B1 (en) | Dynamically configurable networking device interfaces for directional capacity modifications | |
US11218394B1 (en) | Dynamic modifications to directional capacity of networking device interfaces | |
JP7458424B2 (ja) | 性能ルーティング測定を伴う双方向フォワーディング検出を提供するためのシステムおよび方法 | |
CN114244692B (zh) | 一种适用于超大规模互连网络的故障快速定位方法 | |
US11451998B1 (en) | Systems and methods for communication system resource contention monitoring | |
US9882751B2 (en) | Communication system, communication controller, communication control method, and medium | |
US11637739B2 (en) | Direct memory access (DMA) engine for diagnostic data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |