CN114629824A - 丢包定位方法、装置、计算设备及介质 - Google Patents

丢包定位方法、装置、计算设备及介质 Download PDF

Info

Publication number
CN114629824A
CN114629824A CN202210302678.XA CN202210302678A CN114629824A CN 114629824 A CN114629824 A CN 114629824A CN 202210302678 A CN202210302678 A CN 202210302678A CN 114629824 A CN114629824 A CN 114629824A
Authority
CN
China
Prior art keywords
monitoring data
packet loss
nak
server
switch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210302678.XA
Other languages
English (en)
Other versions
CN114629824B (zh
Inventor
黄建博
焦海荣
刘阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Alibaba China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd filed Critical Alibaba China Co Ltd
Priority to CN202210302678.XA priority Critical patent/CN114629824B/zh
Publication of CN114629824A publication Critical patent/CN114629824A/zh
Application granted granted Critical
Publication of CN114629824B publication Critical patent/CN114629824B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • H04L43/0829Packet loss
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

公开了一种丢包定位方法、装置、计算设备及介质,所述方法包括:获取服务器集群的非应答NAK监控数据,所述NAK监控数据指示在进行数据传输过程中发生丢包事件的发送方和接收方的IP地址;根据所述NAK监控数据确定第一服务器,所述第一服务器为IP地址出现次数大于第一设定阈值的服务器;通过根据第一服务器的数量初步判断引起丢包事件的可能是服务器或者交换机,结合所述NAK监控数据与所述服务器集群的异常监测数据的关联性,可以进一步确定引起丢包事件的第一服务器中的目标网卡,或者交换机的目标端口,实现了基于服务器集群的NAK监控数据对网络丢包事件进行高效、细粒度的定位。

Description

丢包定位方法、装置、计算设备及介质
技术领域
本说明书一个或多个实施例涉及通信技术领域,尤其涉及一种丢包定位方法、装置、计算设备及介质。
背景技术
远程直接内存访问(Remote Direct Memory Access,RDMA)技术能够提供高带宽、低时延和低CPU负载的特性,随着对网络性能要求的提高,RDMA网络技术的应用也日益广泛。而随着应用RDMA技术的需求的增加,诞生了基于融合以太网的远程直接内存访问(RDMAover Converged Ethernet,RoCE)技术。目前众多的大规模数据中心部署RoCE网络。虽然RoCE网络引入了多种拥塞控制机制,但还是有一定的丢包概率。对于大规模RoCE网络而言,丢包的定位效率和定位准确度成为影响RoCE网络质量的重要一环,因此需要提出一种针对大规模RoCE网络进行丢包定位的方法。
发明内容
有鉴于此,本说明书一个或多个实施例提供一种丢包定位方法、装置、计算设备及介质。为实现上述目的,本说明书一个或多个实施例提供技术方案如下。
根据本说明书一个或多个实施例的第一方面,提出了一种丢包定位方法,该方法包括:
获取服务器集群的非应答NAK监控数据,所述NAK监控数据指示在进行数据传输过程中发生丢包事件的发送方和接收方的IP地址;
根据所述NAK监控数据确定第一服务器,所述第一服务器为IP地址出现次数大于第一设定阈值的服务器;
根据所述服务器集群中存在所述第一服务器的数目,以及所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的目标对象。
在一些实施例中,所述根据所述服务器集群中存在所述第一服务器的数目,以及所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的目标对象,包括:
响应于所述服务器集群中存在一个第一服务器,根据所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的第一服务器的目标网卡;
响应于存在多个第一服务器,根据所述服务器集群的拓扑结构以及所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的交换机的目标端口。
在一些实施例中,所述方法还包括:接收丢包告警,所述丢包告警指示第一范围内的服务器集群在第一时间范围内存在丢包事件;
所述获取服务器集群的非应答NAK监控数据,包括:
响应于所述丢包告警,获取所述第一范围内的服务器集群在所述第一时间范围内的NAK监控数据。
在一些实施例中,所述根据所述NAK监控数据确定第一服务器包括:
根据所述服务器集群的NAK监控数据生成节点图,所述节点图中的节点指示所述服务器集群中各个服务器的IP地址,两个节点之间的边指示NAK监控数据;
根据度大于所述第一设定阈值的节点,确定所述第一服务器,其中,所述度指示与所述节点相关联的边的数目。
在一些实施例中,所述第一服务器具有多个网卡,每个网卡通过一条链路上联至交换机的端口;
所述根据所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的第一服务器的目标网卡,包括:
根据所述NAK监控数据与所述第一服务器的各个网卡的异常监测数据之间的关联性,以及所述NAK监控数据与各个网卡所连接的交换机的端口的异常监测数据之间的关联性,确定引起丢包事件的网卡与交换机端口之间的链路;
根据所述链路对应的网卡确定引起丢包事件的所述第一服务器的目标网卡
在一些实施例中,所述方法还包括:
根据丢包时间范围与第一异常时间范围的重合度确定所述NAK监控数据与所述第一服务器的各个网卡的异常监测数据之间的关联性,其中,所述丢包时间范围为所述NAK监控数据所指示的丢包事件的时间范围,所述第一异常时间范围指示所述第一服务器的各个网卡的异常监测数据指示的异常事件发生的时间范围;
根据所述丢包时间范围与第二异常时间范围的重合度,确定所述NAK监控数据与各个网卡所连接的交换机的端口的异常监测数据之间的关联性,其中,所述第二异常时间范围指示与各个网卡连接的交换机的端口的异常监测数据指示的异常事件发生的时间范围。
在一些实施例中,所述响应于存在多个第一服务器,根据所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的交换机的目标端口,包括:
根据所述服务器集群的拓扑结构以及所述NAK监控数据指示在数据传输过程中发生丢包事件的发送方以及接收方的IP地址,确定发生丢包事件的交换机的IP地址;
根据所述发生丢包事件的交换机的IP地址确定第一交换机,所述第一交换机为IP地址出现次数大于第二设定阈值的交换机;
根据所述NAK监控数据与所述第一交换机的各个端口的异常监测数据之间的关联性,确定发生丢包事件的第一交换机的目标端口。
在一些实施例中,所述根据所述发生丢包事件的交换机的IP地址确定第一交换机,所述第一交换机为IP地址出现次数大于第二设定阈值的交换机,包括:
根据发生丢包事件的交换机的IP地址生成第二节点图,所述第二节点图中的节点指示发生丢包事件的交换机的IP地址,两个节点之间的边指示NAK监控数据;根据度大于所述第二设定阈值的节点,确定所述第一交换机,其中,所述度指示与所述节点相关联的边的数目。
在一些实施例中,所述根据所述NAK监控数据与所述第一交换机的各个端口的异常监测数据之间的关联性,确定发生丢包事件的第一交换机的目标端口,包括:
根据所述NAK监控数据所指示的丢包事件的时间范围,与所述第一交换机的各个端口的异常监测数据所指示的异常事件的时间范围之间的重合度,确定所述NAK监控数据与所述第一交换机的各个端口的异常监测数据之间的关联性。
根据本说明书一个或多个实施例的第二方面,提出了一种丢包定位装置,该装置包括:
获取单元,用于获取服务器集群的非应答NAK监控数据,所述NAK监控数据指示在进行数据传输过程中发生丢包事件的发送方和接收方的IP地址;
确定单元,用于根据所述NAK监控数据确定第一服务器,所述第一服务器为IP地址出现次数大于第一设定阈值的服务器;
定位单元,用于根据所述服务器集群中存在所述第一服务器的数目,以及所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的目标对象。
在一些实施例中,所述定位单元具体用于:响应于所述服务器集群中存在一个第一服务器,根据所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的第一服务器的目标网卡;
响应于存在多个第一服务器,根据所述服务器集群的拓扑结构以及所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的交换机的目标端口。
在一些实施例中,所述装置还包括告警单元,用于接收丢包告警,所述丢包告警指示第一范围内的服务器集群在第一时间范围内存在丢包事件;
所述获取单元具体用于:
响应于所述丢包告警,获取所述第一范围内的服务器集群在所述第一时间范围内的NAK监控数据。
在一些实施例中,所述确定单元具体用于:
根据所述服务器集群的NAK监控数据生成节点图,所述节点图中的节点指示所述服务器集群中各个服务器的IP地址,两个节点之间的边指示NAK监控数据;
根据度大于所述第一设定阈值的节点,确定所述第一服务器,其中,所述度指示与所述节点相关联的边的数目。
在一些实施例中,所述第一服务器具有多个网卡,每个网卡通过一条链路上联至交换机的端口;
所述第一定位单元具体用于:
根据所述NAK监控数据与所述第一服务器的各个网卡的异常监测数据之间的关联性,以及所述NAK监控数据与各个网卡所连接的交换机的端口的异常监测数据之间的关联性,确定引起丢包事件的网卡与交换机端口之间的链路;
根据所述链路对应的网卡确定引起丢包事件的所述第一服务器的目标网卡
在一些实施例中,所述装置还包括关联性确定单元,用于:
根据丢包时间范围与第一异常时间范围的重合度确定所述NAK监控数据与所述第一服务器的各个网卡的异常监测数据之间的关联性,其中,所述丢包时间范围为所述NAK监控数据所指示的丢包事件的时间范围,所述第一异常时间范围指示所述第一服务器的各个网卡的异常监测数据指示的异常事件发生的时间范围;
根据所述丢包时间范围与第二异常时间范围的重合度,确定所述NAK监控数据与各个网卡所连接的交换机的端口的异常监测数据之间的关联性,其中,所述第二异常时间范围指示与各个网卡连接的交换机的端口的异常监测数据指示的异常事件发生的时间范围。
在一些实施例中,所述第二定位单元具体用于:
根据所述服务器集群的拓扑结构以及所述NAK监控数据指示在数据传输过程中发生丢包事件的发送方以及接收方的IP地址,确定发生丢包事件的交换机的IP地址;
根据所述发生丢包事件的交换机的IP地址确定第一交换机,所述第一交换机为IP地址出现次数大于第二设定阈值的交换机;
根据所述NAK监控数据与所述第一交换机的各个端口的异常监测数据之间的关联性,确定发生丢包事件的第一交换机的目标端口。
在一些实施例中,所述第二定位单元在用于根据所述发生丢包事件的交换机的IP地址确定第一交换机,所述第一交换机为IP地址出现次数大于第二设定阈值的交换机时,具体用于:根据发生丢包事件的交换机的IP地址生成第二节点图,所述第二节点图中的节点指示发生丢包事件的交换机的IP地址,两个节点之间的边指示NAK监控数据;根据度大于所述第二设定阈值的节点,确定所述第一交换机,其中,所述度指示与所述节点相关联的边的数目。
在一些实施例中,所述第二定位单元在用于根据所述NAK监控数据与所述第一交换机的各个端口的异常监测数据之间的关联性,确定发生丢包事件的第一交换机的目标端口时,具体用于:
根据所述NAK监控数据所指示的丢包事件的时间范围,与所述第一交换机的各个端口的异常监测数据所指示的异常事件的时间范围之间的重合度,确定所述NAK监控数据与所述第一交换机的各个端口的异常监测数据之间的关联性。
根据本说明书一个或多个实施例的第三方面,提出了一种计算设备,该计算设备包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,处理器通过运行可执行指令以实现上述第一方面以及第一方面中任一实施例所提供的丢包定位方法所执行的操作。
根据本说明书一个或多个实施例的第四方面,提出了一种计算机可读存储介质,其上存储有计算机指令,指令被处理器执行时实现上述第一方面以及第一方面中任一实施例所提供的丢包定位方法所执行的操作。
根据本说明书一个或多个实施例的第五方面,提出了一种计算机程序产品,包括计算机程序,程序被处理器执行时实现上述第一方面以及第一方面中任一实施例所提供的丢包定位方法所执行的操作。
本申请获取服务器集群的非应答NAK监控数据,根据所述NAK监控数据确定第一服务器,所述第一服务器为IP地址出现次数大于第一设定阈值的服务器;根据所述服务器集群中存在所述第一服务器的数目,以及所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的目标对象,通过根据第一服务器的数量初步判断引起丢包事件的可能是服务器,或者交换机,结合所述NAK监控数据与所述服务器集群的异常监测数据的关联性,可以进一步确定引起丢包事件的第一服务器中的目标网卡,或者交换机的目标端口,实现了基于服务器集群的NAK监控数据对网络丢包事件进行高效、细粒度的定位。
附图说明
图1是一示例性实施例提供的一种丢包定位方法的流程图。
图2是一示例性实施例提供的一种丢包定位方法的示意图。
图3是一示例性实施例提供的一种丢包定位装置的框图。
图4是一示例性实施例提供的一种计算设备的示意结构图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书一个或多个实施例相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书一个或多个实施例的一些方面相一致的装置和方法的例子。
需要说明的是:在其他实施例中并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中,其方法所包括的步骤可以比本说明书所描述的更多或更少。此外,本说明书中所描述的单个步骤,在其他实施例中可能被分解为多个步骤进行描述;而本说明书中所描述的多个步骤,在其他实施例中也可能被合并为单个步骤进行描述。
本申请提供了一种丢包定位方法,用于对具有多个网络节点的服务器集群进行丢包定位。该丢包定位方法可以由计算设备执行,计算设备可以为服务器,如一台服务器、多台服务器、服务器集群、云计算平台等,或者,计算设备可以为终端设备,如台式计算机、便携式计算机、超级计算机等,本申请对计算设备的具体类型不加以限定。
参见图1,图1是一示例性实施例提供的一种丢包定位方法的流程图,该方法包括:
步骤101、获取服务器集群的非应答NAK监控数据。
其中,所述服务器集群可以是RoCE服务器集群。在本公开实施例中,可以获取一个完整的服务器集群的NAK监控数据,也可以获取该服务器集群中指定范围内的服务器的NAK监控数据。
所述NAK监控数据为服务器集群在运行过程中所产生的NAK报文的数据,NAK报文是RoCE网络中数据接收方发现收到的报文乱序时向发送方回复的报文,用于告知发送方数据报文缺失。也即,所述NAK监控数据用于指示在数据传输过程中发生丢包事件的发送方服务器和接收方服务器的IP地址。
步骤102、根据所述NAK监控数据确定第一服务器。
其中,第一服务器为IP地址在所述NAK监控数据中出现次数大于第一设定阈值的服务器。也即是说,由于多次(多于第一设定阈值)丢包事件都与一个服务器相关的情况下,则可以认为丢包事件是由该服务器引起的,因此也可以将第一服务器称为嫌疑服务器。而IP地址在所述NAK监控数据中出现次数不为0,且小于或等于第一设定阈值的服务器,则可能是丢包受害者,而非引起丢包事件的原因。
由于本申请所提出的丢包定位方法主要面向由于硬件故障导致的丢包,而硬件故障具有独立性,同一个服务器集群中同时出现多处硬件故障的可能性较多,因此,可以将所述第一设定阈值设置为1,也即将IP地址在所述NAK监控数据中出现次数大于1的服务器确定为第一服务器;而IP地址出现1次的服务器,则可能是丢包受害者。本领域技术人员应当理解,该第一设定阈值的设置仅为示例,也可以根据实际需要将该第一设定阈值设置为其他数据,本公开对次不进行限制。
步骤103、根据所述服务器集群中存在所述第一服务器的数目,以及所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的目标对象。
在步骤102中确定出第一服务器之后,可以根据第一服务器的数量初步判断引起丢包事件的可能是服务器,或者可能是交换机。并进一步根据所述NAK监控数据与所述服务器集群的异常监测数据的关联性,可以进一步确定服务器中的哪个网卡或者交换机中的哪个端口,是引起丢包事件的目标对象。
本申请获取服务器集群的非应答NAK监控数据,根据所述NAK监控数据确定第一服务器,所述第一服务器为IP地址出现次数大于第一设定阈值的服务器;根据所述服务器集群中存在所述第一服务器的数目,以及所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的目标对象,通过根据第一服务器的数量初步判断引起丢包事件的可能是服务器,或者交换机,结合所述NAK监控数据与所述服务器集群的异常监测数据的关联性,可以进一步确定引起丢包事件的第一服务器中的目标网卡,或者交换机的目标端口,实现了基于服务器集群的NAK监控数据对网络丢包事件进行高效、细粒度的定位。
在介绍了本申请的基本实现过程之后,下面结合本申请的多个可选实施例,对本申请所提供的丢包定位方法进行进一步说明。
在一些实施例中,响应于所述服务器集群中存在一个第一服务器,根据所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的第一服务器的目标网卡。
在步骤102中确定出第一服务器之后,则进入根据第一服务器的数量进行分类处理的过程。在第一服务器只有一个的情况下,也即可以锁定一个服务器为引起丢包事件的嫌疑服务器的情况下,则根据所述NAK监控数据(丢包数据)与所述服务器集群的异常监测数据的关联性,进一步确定引起丢包事件的是第一服务器中的哪个网卡。当然,在所述第一服务器仅具有一个网卡的情况下,在确定了所述服务器集群中仅存在一个第一服务器的情况下,则可以直接确定引起丢包事件的第一服务器的网卡。
其中,所述NAK监控数据与所述服务器集群的异常监测数据的关联性可以根据丢包事件发生的时间段与服务器集群中服务器的网卡或交换机的端口发生异常事件的时间段是否吻合,来确定所述NAK监控数据与所述异常监测数据是否具有关联性。此外,也可以计算所述NAK监控数据与所述异常监测数据的相关系数,比如皮尔森相关系数,根据该相关系数来确定二者的关联性,例如可以在该相关系数大于设定阈值的情况下,确定确定所述NAK监控数据与所述异常监测数据具有关联性。
在一些实施例中,响应于存在多个第一服务器,根据所述服务器集群的拓扑结构以及所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的交换机的目标端口。
在存在多个第一服务器的情况下,则说明该丢包事件有可能是由交换机引起的,因此可以根据所述服务器集群的拓扑结构,根据嫌疑服务器定位嫌疑交换机,例如将所述嫌弃服务器上联的交换机确定为嫌疑交换机,并根据所述NAK监控数据与所述服务器集群的异常监测数据的关联性,进一步确定引起丢包事件的是嫌疑交换机的哪个端口。
在本公开实施例中,可以通过对NAK监控数据与所述服务器集群的异常监测数据进行关联性分析,确定所述NAK监控数据与所述异常监测数据的关联性,从而确定嫌疑交换机的哪个端口更可能是引起丢包事件的根本原因。
在一些实施例中,该丢包定位方法可以是由丢包告警触发开始执行的,并且该丢包告警触可以指示丢包定位的范围以及时间。具体地,所述方法在获取NAK监控数据之前,还包括接收丢包告警;所述丢包告警指示第一范围内的服务器集群在第一时间范围内存在丢包事件。其中,该丢包告警可以来自实时的自动告警系统的输出。
响应于所述丢包告警,根据所指示的服务器集群的范围以及时间范围,获取相应的范围内的服务器集群在相应的时间范围内的NAK监控数据。
通过上述方式,可以针对告警更有针对性地获取NAK监控数据,缩小丢包定位的网络范围以及时间范围,从而可以提高丢包定位的效率。
在一个示例中,可以利用节点图的方式来根据所述NAK监控数据确定第一服务器。具体地,可以根据所述服务器集群的NAK监控数据生成节点图,所述节点图中的节点指示所述服务器集群中各个服务器的IP地址,两个节点之间的边指示NAK监控数据;根据度大于所述第一设定阈值的节点,确定所述第一服务器,其中,所述度指示与所述节点相关联的边的数目。也即是说,可以将服务器集群输出的NAK监控数据理解为一张节点图,该节点图中的各个节点指示所述服务器集群中各个服务器的IP地址,两个节点之间的边指示NAK监控数据。换言之,服务器集群内所有的IP地址是该节点图中的各个节点,存在NAK监控数据的两个节点间就存在边。其中,每个节点具有度,用于指示与所述节点相关联的边的数目。也即是说,如果两个节点之间存在NAK报文,则这两个节点之间存在边。如果一个节点的度大于第一设定阈值,例如大于1,则说明这个节点与不止一个节点之间存在NAK报文,说明该节点可能是引起丢包事件的原因,或者是引起丢包告警的原因,则可以将该节点确定为第一服务器。
在本公开实施例中,通过在第一节点图中根据度大于第一设定阈值的节点来确定第一服务器,可以自动定位出可能引起丢包事件或者引起丢包告警的嫌疑服务器,相较于人工定位嫌疑服务器提高了定位效率和准确度。
在第一服务器只有一个的情况下,可以锁定该服务器为引起丢包事件的嫌疑服务器。然而由于第一服务器可能具有多个网卡,因此还可以进一步确定引起丢包事件的是第一服务器中的哪个网卡,从而实现对丢包事件更加精准、更细粒度的定位。
在所述第一服务器具有多个网卡的情况下,每个网卡通过一条链路上联至交换机的端口。以所述第一服务器具有两张网卡为例,这两张网卡分别通过两条链路上联至两台交换机上。
在所述第一服务器具有多个网卡的情况下,可以根据以下方法,确定引起丢包事件的第一服务器的目标网卡:对服务器的NAK监控数据与第一服务器的各个网卡的异常监测数据进行关联性分析,得到所述NAK监控数据所指示的丢包事件与所述第一服务器的各个网卡的异常监测数据之间的关联性;并对服务器的NAK监控数据与各个网卡所连接的交换机的端口的异常监测数据进行关联性分析,所述NAK监控数据所指示的丢包事件与各个网卡所连接的交换机的端口的异常监测数据之间的关联性,从而确定引起丢包事件的网卡与交换机端口之间的链路;根据所述链路对应的网卡确定引起丢包事件的所述第一服务器的目标网卡。
其中,所述网卡和交换机的端口的异常监测数据包括丢包、错包等异常事件数据。由于网卡所记录的异常事件可能是由于其他服务器的网卡或者交换机的端口引起的,因此如果仅针对服务器的NAK监控数据与第一服务器的各个网卡的异常监测数据进行关联性分析,得到的结论可能是不准确的;对于交换机的网卡也是同理。因此,本公开实施例同时对NAK监控数据与各个网卡的异常监测数据和各个网卡所连接的交换机的端口的异常监测数据进行关联性分析,如果某一个链路上网卡和交换机的端口的异常监测数据同时与NAK监控数据具有关联性,则说明丢包事件是在该链路上发生的,那么该链路对应的网卡则是引起丢包事件或引发丢包告警的根本原因,则将该链路对应的网卡确定为引起丢包事件的所述第一服务器的目标网卡。
在一个示例中,可以根据服务器集群的NAK监控数据与所述第一服务器的网卡记录的异常事件以及交换机的端口记录的异常事件之间的时间重合度,来确定所述NAK监控数据所指示的丢包事件与所述第一服务器的各个网卡的异常监测数据之间的关联性。
具体地,可以根据丢包时间范围与第一异常时间范围的重合度确定所述NAK监控数据与所述第一服务器的各个网卡的异常监测数据之间的关联性,其中,所述丢包时间范围为所述NAK监控数据所指示的丢包事件的时间范围,所述第一异常时间范围指示所述第一服务器的各个网卡的异常监测数据指示的异常事件发生的时间范围;接下来,根据所述丢包时间范围与第二异常时间范围的重合度,确定所述NAK监控数据所指示的丢包事件与各个网卡所连接的交换机的端口的异常监测数据之间的关联性,其中,所述第二异常时间范围指示与各个网卡连接的交换机的端口的异常监测数据指示的异常事件发生的时间范围。
在本公开实施例中,通过将NAK监控数据与所述第一服务器的各个网卡的异常数据,以及与交换机的各个端口的异常监测数据进行关联,根据NAK监控数据与各个链路中的异常监测数据的关联性来确定引起丢包事件的网卡,相较于将丢包事件定位至服务器可以实现更细粒度的丢包定位。
在通过NAK监控数据确定出存在多个第一服务器的情况下,则说明该丢包事件有可能是由交换机引起的,因此可以根据所述服务器集群的拓扑结构,根据嫌疑服务器定位嫌疑交换机,并进一步根据所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的是嫌疑交换机的哪个端口。
在一些实施例中,可以根据所述服务器集群的拓扑结构以及所述NAK监控数据指示在数据传输过程中发生丢包事件的发送方以及接收方的IP地址,确定发生丢包事件的交换机的IP地址。
具体地,可以通过服务器集群的拓扑结构,确定与发送方节点上联的交换机,从而将发送方的IP地址转换为发送方交换机的IP地址,同理,可以通过服务器集群的拓扑结构,确定与接收方节点上联的交换机,从而将接收方的IP地址转换为接收方交换机的IP地址,从而确定发生丢包事件的交换机的IP地址。
接下来,根据所述发生丢包事件的交换机的IP地址确定第一交换机,所述第一交换机为IP地址出现次数大于第二设定阈值的交换机,即引起丢包事件的嫌疑交换机。
在一个示例中,可以同样利用节点图的方式来根据所述发生丢包事件的交换机的IP地址确定第一交换机。具体地,根据发生丢包事件的交换机的IP地址生成第二节点图,所述第二节点图中的节点指示发生丢包事件的交换机的IP地址,两个节点之间的边指示NAK监控数据;根据度大于所述第二设定阈值的节点,确定所述第一交换机,其中,所述度指示与所述节点相关联的边的数目。也即是说,可以将发生丢包事件的交换机的IP地址理解为一张节点图,该节点图中的各个节点指示发生丢包事件的交换机的IP地址,两个节点之间的边指示NAK监控数据。换言之,发生丢包事件的交换机的IP地址是该节点图中的各个节点,存在NAK监控数据的两个节点间就存在边。其中,每个节点具有度,用于指示与所述节点相关联的边的数目。也即是说,如果两个节点之间存在NAK报文,则这两个节点之间存在边。如果一个节点的度大于第一设定阈值,例如大于1,则说明这个节点与不止一个节点之间存在NAK报文,说明该节点可能是引起丢包事件的原因,或者是引起丢包告警的原因,则可以将该节点确定为第一交换机。
最后,根据所述NAK监控数据所指示的丢包事件,与所述第一交换机的各个端口的异常监测数据之间的关联性,确定发生丢包事件的第一交换机的目标端口。
其中,所述第一交换机的各个端口的异常监测数据包括端口记录的丢包数据、错包数据、端口状态跳变数据等中的一项或多项。其中,端口状态跳变是指端口在短时间内关闭又开启这样的状态跳变。通过对NAK监控数据与所述第一交换机的各个端口的异常监测数据进行关联性分析,确定所述NAK监控数据与所述异常监测数据的关联性,从而确定第一交换机的哪个端口更可能是引起丢包事件的根本原因。
在一个示例中,可以根据所述NAK监控数据所指示的丢包事件的时间范围,与所述第一交换机的各个端口的异常监测数据所指示的异常事件的时间范围之间的重合度,确定所述NAK监控数据所指示的丢包事件,与所述第一交换机的各个端口的异常监测数据之间的关联性。
在本公开实施例中,通过将NAK监控数据与所述第一交换机的各个端口的异常监测数据进行关联,根据与各个端口的关联性来确定引起丢包事件的交换机端口,相较于将丢包事件定位至交换机可以实现更细粒度的丢包定位。
图2是一示例性实施例提供的一种丢包定位方法的示意图。如图2所示,在收到丢包告警的情况下,首先根据NAK监控数据确定第一服务器,所述第一服务器为IP地址出现次数大于1的服务器,也即可能引起丢包事件的嫌疑服务器。在所述服务器集群中存在一个第一服务器,也即第一服务器是单一服务器的情况下,则根据所述NAK监控数据与所述服务器集群的异常监测数据(包括网卡监控数据、交换机监控数据)之间的关联性,定位引起丢包事件的目标网卡,而该定位结论可以被称为“服务器-网卡”型结论;在服务器集群中存在多个第一服务器的情况下,根据所述服务器集群的拓扑结构以及所述NAK监控数据与所述服务器集群的异常监测数据(包括交换机监控数据)的关联性,定位引起丢包事件的交换机的目标端口,而该定位结论可以被称为“交换机-端口”型结论。
与前述方法的实施例相对应,本说明书还提供了装置及其所应用的计算设备的实施例。
参见图3,图3是一示例性实施例提供的一种丢包定位装置的框图,该装置包括:
获取单元301,用于获取服务器集群的非应答NAK监控数据,所述NAK监控数据指示在进行数据传输过程中发生丢包事件的发送方和接收方的IP地址;
确定单元302,用于根据所述NAK监控数据确定第一服务器,所述第一服务器为IP地址出现次数大于第一设定阈值的服务器;
定位单元303,用于根据所述服务器集群中存在所述第一服务器的数目,以及所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的目标对象。
在一些实施例中,所述定位单元具体用于:
响应于所述服务器集群中存在一个第一服务器,根据所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的第一服务器的目标网卡;
响应于存在多个第一服务器,根据所述服务器集群的拓扑结构以及所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的交换机的目标端口。
在一些实施例中,所述装置还包括告警单元,用于接收丢包告警,所述丢包告警指示第一范围内的服务器集群在第一时间范围内存在丢包事件;
所述获取单元具体用于:
响应于所述丢包告警,获取所述第一范围内的服务器集群在所述第一时间范围内的NAK监控数据。
在一些实施例中,所述确定单元具体用于:
根据所述服务器集群的NAK监控数据生成第一节点图,所述第一节点图中的节点指示所述服务器集群中各个服务器的IP地址,两个节点之间的边指示NAK监控数据;
根据度大于所述第一设定阈值的节点,确定所述第一服务器,其中,所述度指示与所述节点相关联的边的数目。
在一些实施例中,所述第一服务器具有多个网卡,每个网卡通过一条链路上联至交换机的端口;
所述第一定位单元具体用于:
根据所述NAK监控数据与所述第一服务器的各个网卡的异常监测数据之间的关联性,以及所述NAK监控数据与各个网卡所连接的交换机的端口的异常监测数据之间的关联性,确定引起丢包事件的网卡与交换机端口之间的链路;
根据所述链路对应的网卡确定引起丢包事件的所述第一服务器的目标网卡
在一些实施例中,所述装置还包括关联性确定单元,用于:
根据丢包时间范围与第一异常时间范围的重合度确定所述NAK监控数据与所述第一服务器的各个网卡的异常监测数据之间的关联性,其中,所述丢包时间范围为所述NAK监控数据所指示的丢包事件的时间范围,所述第一异常时间范围指示所述第一服务器的各个网卡的异常监测数据指示的异常事件发生的时间范围;
根据所述丢包时间范围与第二异常时间范围的重合度,确定所述NAK监控数据与各个网卡所连接的交换机的端口的异常监测数据之间的关联性,其中,所述第二异常时间范围指示与各个网卡连接的交换机的端口的异常监测数据指示的异常事件发生的时间范围。
在一些实施例中,所述第二定位单元具体用于:
根据所述服务器集群的拓扑结构以及所述NAK监控数据指示在数据传输过程中发生丢包事件的发送方以及接收方的IP地址,确定发生丢包事件的交换机的IP地址;
根据所述发生丢包事件的交换机的IP地址确定第一交换机,所述第一交换机为IP地址出现次数大于第二设定阈值的交换机;
根据所述NAK监控数据与所述第一交换机的各个端口的异常监测数据之间的关联性,确定发生丢包事件的第一交换机的目标端口。
在一些实施例中,所述第二定位单元在用于根据所述发生丢包事件的交换机的IP地址确定第一交换机,所述第一交换机为IP地址出现次数大于第二设定阈值的交换机时,具体用于:根据发生丢包事件的交换机的IP地址生成第二节点图,所述第二节点图中的节点指示发生丢包事件的交换机的IP地址,两个节点之间的边指示NAK监控数据;根据度大于所述第二设定阈值的节点,确定所述第一交换机,其中,所述度指示与所述节点相关联的边的数目。
在一些实施例中,所述第二定位单元在用于根据所述NAK监控数据与所述第一交换机的各个端口的异常监测数据之间的关联性,确定发生丢包事件的第一交换机的目标端口时,具体用于:
根据所述NAK监控数据所指示的丢包事件的时间范围,与所述第一交换机的各个端口的异常监测数据所指示的异常事件的时间范围之间的重合度,确定所述NAK监控数据与所述第一交换机的各个端口的异常监测数据之间的关联性。
上述装置中各个模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本申请还提供了一种计算设备,参见图4,图4是一示例性实施例提供的一种计算设备的示意结构图。请参考图4,在硬件层面,该设备包括处理器402、内部总线404、网络接口406、内存408以及非易失性存储器410,当然还可能包括实现其他功能所需要的硬件。本说明书一个或多个实施例可以基于软件方式来实现,比如由处理器402从非易失性存储器410中读取对应的计算机程序到内存408中然后运行。当然,除了软件实现方式之外,本说明书一个或多个实施例并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
本申请还提供了一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现本申请任一实施例所提供的丢包定位方法。
上述实施例阐明的系统、装置或模块,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
在一个典型的配置中,计算机包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带、磁盘存储、量子存储器、基于石墨烯的存储介质或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(Transitory Media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在本说明书一个或多个实施例使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
以上所述仅为本说明书一个或多个实施例的较佳实施例而已,并不用以限制本说明书一个或多个实施例,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例保护的范围之内。

Claims (12)

1.一种丢包定位方法,其特征在于,所述方法包括:
获取服务器集群的非应答NAK监控数据,所述NAK监控数据指示在进行数据传输过程中发生丢包事件的发送方和接收方的IP地址;
根据所述NAK监控数据确定第一服务器,所述第一服务器为IP地址出现次数大于第一设定阈值的服务器;
根据所述服务器集群中存在所述第一服务器的数目,以及所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的目标对象。
2.根据权利要求1所述的方法,其特征在于,所述根据所述服务器集群中存在所述第一服务器的数目,以及所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的目标对象,包括:
响应于所述服务器集群中存在一个第一服务器,根据所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的第一服务器的目标网卡;
响应于存在多个第一服务器,根据所述服务器集群的拓扑结构以及所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的交换机的目标端口。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:接收丢包告警,所述丢包告警指示第一范围内的服务器集群在第一时间范围内存在丢包事件;
所述获取服务器集群的非应答NAK监控数据,包括:
响应于所述丢包告警,获取所述第一范围内的服务器集群在所述第一时间范围内的NAK监控数据。
4.根据权利要求2所述的方法,其特征在于,所述根据所述NAK监控数据确定第一服务器包括:
根据所述服务器集群的NAK监控数据生成第一节点图,所述第一节点图中的节点指示所述服务器集群中各个服务器的IP地址,两个节点之间的边指示NAK监控数据;
根据度大于所述第一设定阈值的节点,确定所述第一服务器,其中,所述度指示与所述节点相关联的边的数目。
5.根据权利要求2至4任一项所述的方法,其特征在于,所述第一服务器具有多个网卡,每个网卡通过链路上联至交换机的端口;
所述根据所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的第一服务器的目标网卡,包括:
根据所述NAK监控数据与所述第一服务器的各个网卡的异常监测数据之间的关联性,以及所述NAK监控数据与各个网卡所连接的交换机的端口的异常监测数据之间的关联性,确定引起丢包事件的网卡与交换机端口之间的链路;
根据所述链路对应的网卡确定引起丢包事件的所述第一服务器的目标网卡。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
根据丢包时间范围与第一异常时间范围的重合度确定所述NAK监控数据与所述第一服务器的各个网卡的异常监测数据之间的关联性,其中,所述丢包时间范围为所述NAK监控数据所指示的丢包事件的时间范围,所述第一异常时间范围指示所述第一服务器的各个网卡的异常监测数据指示的异常事件发生的时间范围;
根据所述丢包时间范围与第二异常时间范围的重合度,确定所述NAK监控数据与各个网卡所连接的交换机的端口的异常监测数据之间的关联性,其中,所述第二异常时间范围指示与各个网卡连接的交换机的端口的异常监测数据指示的异常事件发生的时间范围。
7.根据权利要求2至4任一项所述的方法,其特征在于,所述响应于存在多个第一服务器,根据所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的交换机的目标端口,包括:
根据所述服务器集群的拓扑结构以及所述NAK监控数据指示在数据传输过程中发生丢包事件的发送方以及接收方的IP地址,确定发生丢包事件的交换机的IP地址;
根据所述发生丢包事件的交换机的IP地址确定第一交换机,所述第一交换机为IP地址出现次数大于第二设定阈值的交换机;
根据所述NAK监控数据与所述第一交换机的各个端口的异常监测数据之间的关联性,确定发生丢包事件的第一交换机的目标端口。
8.根据权利要求7所述的方法,其特征在于,所述根据所述发生丢包事件的交换机的IP地址确定第一交换机,所述第一交换机为IP地址出现次数大于第二设定阈值的交换机,包括:
根据发生丢包事件的交换机的IP地址生成第二节点图,所述第二节点图中的节点指示发生丢包事件的交换机的IP地址,两个节点之间的边指示NAK监控数据;根据度大于所述第二设定阈值的节点,确定所述第一交换机,其中,所述度指示与所述节点相关联的边的数目。
9.根据权利要求7所述的方法,其特征在于,所述根据所述NAK监控数据与所述第一交换机的各个端口的异常监测数据之间的关联性,确定发生丢包事件的第一交换机的目标端口,包括:
根据所述NAK监控数据所指示的丢包事件的时间范围,与所述第一交换机的各个端口的异常监测数据所指示的异常事件的时间范围之间的重合度,确定所述NAK监控数据与所述第一交换机的各个端口的异常监测数据之间的关联性。
10.一种丢包定位装置,其特征在于,所述装置包括:
获取单元,用于获取服务器集群的非应答NAK监控数据,所述NAK监控数据指示在进行数据传输过程中发生丢包事件的发送方和接收方的IP地址;
确定单元,用于根据所述NAK监控数据确定第一服务器,所述第一服务器为IP地址出现次数大于第一设定阈值的服务器;
定位单元,用于根据所述服务器集群中存在所述第一服务器的数目,以及所述NAK监控数据与所述服务器集群的异常监测数据的关联性,确定引起丢包事件的目标对象。
11.一种计算设备,其特征在于,所述计算设备包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器通过运行所述可执行指令以实现如权利要求1至9中任一项所述的丢包定位方法。
12.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,所述指令被处理器执行时实现如权利要求1至9中任一项所述的丢包定位方法。
CN202210302678.XA 2022-03-24 2022-03-24 丢包定位方法、装置、计算设备及介质 Active CN114629824B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210302678.XA CN114629824B (zh) 2022-03-24 2022-03-24 丢包定位方法、装置、计算设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210302678.XA CN114629824B (zh) 2022-03-24 2022-03-24 丢包定位方法、装置、计算设备及介质

Publications (2)

Publication Number Publication Date
CN114629824A true CN114629824A (zh) 2022-06-14
CN114629824B CN114629824B (zh) 2024-03-19

Family

ID=81903631

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210302678.XA Active CN114629824B (zh) 2022-03-24 2022-03-24 丢包定位方法、装置、计算设备及介质

Country Status (1)

Country Link
CN (1) CN114629824B (zh)

Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1507352A1 (en) * 2003-08-14 2005-02-16 Matsushita Electric Industrial Co., Ltd. Time monitoring of packet retransmissions during soft handover
EP1722506A1 (en) * 2005-05-10 2006-11-15 Harris Corporation Multicast data communication method and network
US20070091815A1 (en) * 2005-10-21 2007-04-26 Peerapol Tinnakornsrisuphap Methods and systems for adaptive encoding of real-time information in packet-switched wireless communication systems
US8958318B1 (en) * 2011-09-21 2015-02-17 Cisco Technology, Inc. Event-based capture of packets from a network flow
WO2016095379A1 (zh) * 2014-12-17 2016-06-23 中兴通讯股份有限公司 丢包位置的辅助定位方法、装置及计算机存储介质
CN106533722A (zh) * 2015-09-11 2017-03-22 北京国双科技有限公司 网络监测方法和装置
CN108282381A (zh) * 2017-09-15 2018-07-13 广州市动景计算机科技有限公司 网络丢包率监控方法、装置及测试服务器
CN109450727A (zh) * 2018-11-01 2019-03-08 广州市百果园信息技术有限公司 一种网络监控数据的展示方法、装置、设备和存储介质
CN109714230A (zh) * 2018-12-29 2019-05-03 北京世纪互联宽带数据中心有限公司 一种流量监控方法、装置和计算设备
CN111092962A (zh) * 2019-11-29 2020-05-01 苏州浪潮智能科技有限公司 一种防止数据传输中丢包的方法、设备及介质
WO2020220641A1 (zh) * 2019-04-28 2020-11-05 平安科技(深圳)有限公司 基于点对点网络的数据存储方法、装置、介质及服务器
CN112152876A (zh) * 2020-09-09 2020-12-29 锐捷网络股份有限公司 一种获取丢包信息的方法及装置
CN112291076A (zh) * 2019-07-25 2021-01-29 华为技术有限公司 丢包定位方法、装置及系统、计算机存储介质
CN112422241A (zh) * 2020-11-09 2021-02-26 广州博冠信息科技有限公司 数据传输方法、装置、存储介质及计算机设备
WO2021072847A1 (zh) * 2019-10-18 2021-04-22 平安科技(深圳)有限公司 计算机网络状况监控方法、装置、计算机设备及存储介质
CN113300816A (zh) * 2020-07-15 2021-08-24 阿里巴巴集团控股有限公司 节点定位方法、网络传输方法、装置及设备
WO2021174684A1 (zh) * 2020-03-05 2021-09-10 网宿科技股份有限公司 一种割接信息处理方法、系统及装置
WO2021179488A1 (zh) * 2020-03-11 2021-09-16 平安科技(深圳)有限公司 监控数据存储方法、设备、服务器及存储介质
CN113709131A (zh) * 2021-08-22 2021-11-26 山东云海国创云计算装备产业创新中心有限公司 一种网络数据传输方法、装置、计算机设备及可读介质
US20210409311A1 (en) * 2020-06-30 2021-12-30 Huawei Technologies Co., Ltd. Packet loss processing method and network device

Patent Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1507352A1 (en) * 2003-08-14 2005-02-16 Matsushita Electric Industrial Co., Ltd. Time monitoring of packet retransmissions during soft handover
EP1722506A1 (en) * 2005-05-10 2006-11-15 Harris Corporation Multicast data communication method and network
US20070091815A1 (en) * 2005-10-21 2007-04-26 Peerapol Tinnakornsrisuphap Methods and systems for adaptive encoding of real-time information in packet-switched wireless communication systems
US8958318B1 (en) * 2011-09-21 2015-02-17 Cisco Technology, Inc. Event-based capture of packets from a network flow
WO2016095379A1 (zh) * 2014-12-17 2016-06-23 中兴通讯股份有限公司 丢包位置的辅助定位方法、装置及计算机存储介质
CN106533722A (zh) * 2015-09-11 2017-03-22 北京国双科技有限公司 网络监测方法和装置
CN108282381A (zh) * 2017-09-15 2018-07-13 广州市动景计算机科技有限公司 网络丢包率监控方法、装置及测试服务器
CN109450727A (zh) * 2018-11-01 2019-03-08 广州市百果园信息技术有限公司 一种网络监控数据的展示方法、装置、设备和存储介质
CN109714230A (zh) * 2018-12-29 2019-05-03 北京世纪互联宽带数据中心有限公司 一种流量监控方法、装置和计算设备
WO2020220641A1 (zh) * 2019-04-28 2020-11-05 平安科技(深圳)有限公司 基于点对点网络的数据存储方法、装置、介质及服务器
CN112291076A (zh) * 2019-07-25 2021-01-29 华为技术有限公司 丢包定位方法、装置及系统、计算机存储介质
WO2021072847A1 (zh) * 2019-10-18 2021-04-22 平安科技(深圳)有限公司 计算机网络状况监控方法、装置、计算机设备及存储介质
CN111092962A (zh) * 2019-11-29 2020-05-01 苏州浪潮智能科技有限公司 一种防止数据传输中丢包的方法、设备及介质
WO2021174684A1 (zh) * 2020-03-05 2021-09-10 网宿科技股份有限公司 一种割接信息处理方法、系统及装置
WO2021179488A1 (zh) * 2020-03-11 2021-09-16 平安科技(深圳)有限公司 监控数据存储方法、设备、服务器及存储介质
US20210409311A1 (en) * 2020-06-30 2021-12-30 Huawei Technologies Co., Ltd. Packet loss processing method and network device
CN113300816A (zh) * 2020-07-15 2021-08-24 阿里巴巴集团控股有限公司 节点定位方法、网络传输方法、装置及设备
CN112152876A (zh) * 2020-09-09 2020-12-29 锐捷网络股份有限公司 一种获取丢包信息的方法及装置
CN112422241A (zh) * 2020-11-09 2021-02-26 广州博冠信息科技有限公司 数据传输方法、装置、存储介质及计算机设备
CN113709131A (zh) * 2021-08-22 2021-11-26 山东云海国创云计算装备产业创新中心有限公司 一种网络数据传输方法、装置、计算机设备及可读介质

Also Published As

Publication number Publication date
CN114629824B (zh) 2024-03-19

Similar Documents

Publication Publication Date Title
US20160142369A1 (en) Service addressing in distributed environment
WO2023179433A1 (zh) 流表存储及报文转发方法、装置、计算设备及介质
US8335843B2 (en) Communication system having multiple communication lines between a transmitter and a receiver
CN111177165A (zh) 数据一致性检测的方法、装置及设备
US8196151B1 (en) Detecting queue problems using messages entering and leaving a queue during a time period
CN111506580B (zh) 一种基于中心化块链式账本的交易存储方法
CN110990438A (zh) 数据处理方法、装置、电子设备和存储介质
CN110806960A (zh) 信息处理方法、装置及终端设备
CN110069217B (zh) 一种数据存储方法及装置
CN114629824B (zh) 丢包定位方法、装置、计算设备及介质
CN110377757B (zh) 一种实时知识图谱构建系统
CN108390770B (zh) 一种信息生成方法、装置及服务器
CN114691612A (zh) 数据写入方法及装置、数据读取方法及装置
CN109656805B (zh) 用于业务分析的代码链路的生成方法、装置及业务服务器
CN111651466A (zh) 数据采样方法及装置
CN112612848A (zh) 数据实时同步的方法及装置、系统、电子设备、存储介质
CN117251384B (zh) 一种接口自动化测试用例生成方法及系统
CN112506736B (zh) office文件打开状态监控方法及装置
CN117493298A (zh) 数据库管理方法及装置、电子设备及存储介质
Gramoli et al. The Static Environment
CN113377757A (zh) 数据对账方法、装置、电子设备及机器可读存储介质
CN116662053A (zh) 一种数据库的故障诊断方法、装置、设备及存储介质
CN115344466A (zh) 一种集群健壮性测试方法、装置及电子设备
CN117768362A (zh) 一种基于eBPF的网络诊断与预警方法、装置和介质
CN111367774A (zh) 检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant