CN112152872A - 一种网络亚健康检测方法及装置 - Google Patents

一种网络亚健康检测方法及装置 Download PDF

Info

Publication number
CN112152872A
CN112152872A CN202010892778.3A CN202010892778A CN112152872A CN 112152872 A CN112152872 A CN 112152872A CN 202010892778 A CN202010892778 A CN 202010892778A CN 112152872 A CN112152872 A CN 112152872A
Authority
CN
China
Prior art keywords
physical link
server
message
transmitting
packet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010892778.3A
Other languages
English (en)
Other versions
CN112152872B (zh
Inventor
秦璇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Big Data Technologies Co Ltd
Original Assignee
New H3C Big Data Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New H3C Big Data Technologies Co Ltd filed Critical New H3C Big Data Technologies Co Ltd
Priority to CN202010892778.3A priority Critical patent/CN112152872B/zh
Publication of CN112152872A publication Critical patent/CN112152872A/zh
Application granted granted Critical
Publication of CN112152872B publication Critical patent/CN112152872B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0852Delays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/24Multipath
    • H04L45/245Link aggregation, e.g. trunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请涉及网络通信技术领域,特别涉及一种网络亚健康检测方法及装置。该方法包括:向第二服务器发送第一报文,记录传输第一报文所使用的第一物理链路,其中,第一报文携带有第一发送时间戳,第二服务器在接收到第一报文时,基于第一发送时间戳,计算传输第一报文的第一时长;接收第二服务器响应的第二报文,并记录传输第二报文的第二物理链路,其中,第二报文携带有第二发送时间戳和第一时长;在判定第一物理链路和第二物理链路为同一目标物理链路时,基于第二发送时间戳,计算传输第二报文的第二时长,并基于第一时长和第二时长计算目标物理链路的传输时延;否则,将第一时长作为第一物理链路的传输时延,并将第二时长作为第二链路的传输时延。

Description

一种网络亚健康检测方法及装置
技术领域
本申请涉及网络通信技术领域,特别涉及一种网络亚健康检测方法及装置。
背景技术
随着全球大数据时代的来临,网络中需要传输的数据量越来越大,距离也越来越远,人们对网络的要求也越来越高。早期的网络连接依靠的是单张网卡,这些网卡的速率和带宽都有限,慢慢地便不能满足实际的网络需求。如果要从硬件上提升网卡的性能来满足这些需求,付出的代价可能会比得到的收益大,因此,人们从软件角度出发,发明了一种链路聚合的技术——bond。
Bond是一种链路聚合技术,它将多张物理网卡绑定成一张逻辑网卡,从而达到扩大网络带宽、实现负载均衡、增强网络可靠性等目的。多张物理网卡在逻辑上使用同一个IP地址,报文在发送的时候会根据配置的bond策略选择其中一张物理网卡来传输。传输过程中,长距离、大负荷或链路震荡等现象,往往会导致网络中出现丢包、时延、错包等不稳定状态,这就是我们所说的网络亚健康。
网络亚健康状态下传输的报文或不完整、或有延迟、或有错误,这些报文最后都不能使用,只能丢弃或者要求对端重传,这无疑会增加网络传输的数据量,降低网络传输效率。
当前bond 4策略下,bond-manager(bond管理者)不处理网络时延,而是由存储集群内的osd(Object Storage Device)层来处理。Osd层计算的是绑定同一bond的多条物理链路上的时延的平均值,也无法区分各条物理链路,故当平均时延大于阈值时,即使有健康的物理链路,该服务器上的osd也会全部被标down,导致集群中该节点的存储服务不可用,甚至可能导致集群不健康。
发明内容
本申请提供了一种网络亚健康检测方法及装置,用以解决现有技术中存在的逻辑链路中各物理链路的平均时延过高而导致各物理链路均不可用的问题。
第一方面,本申请提供了一种网络亚健康检测方法,应用于存储集群中的第一服务器,所述存储集群还包括第二服务器,所述第一服务器与所述第二服务器之间的至少两条物理链路基于bond策略聚合为一条逻辑链路,所述存储集群中各服务器时间同步,所述方法包括:
向所述第二服务器发送第一报文,并记录传输所述第一报文所使用的第一物理链路,其中,所述第一报文携带有第一发送时间戳,所述第二服务器在接收到所述第一报文时,基于所述第一发送时间戳,计算传输所述第一报文的第一时长;
接收所述第二服务器基于所述第一报文响应的第二报文,并记录传输所述第二报文的第二物理链路,其中,所述第二报文携带有第二发送时间戳和所述第一时长;
判断所述第一物理链路和所述第二物理链路是否为同一目标物理链路,若是,则基于所述第二发送时间戳,计算传输所述第二报文的第二时长,并基于所述第一时长和所述第二时长计算所述目标物理链路的传输时延;否则,将所述第一时长作为所述第一物理链路的传输时延,并将所述第二时长作为所述第二链路的传输时延。
可选地,所述记录传输所述第一报文所使用的第一物理链路的步骤包括:
记录发送所述第一报文所使用的网卡的标识;
所述记录传输所述第二报文的第二物理链路的步骤包括:
记录接收所述第二报文所使用的网卡的标识。
可选地,基于所述第二发送时间戳,计算传输所述第二报文的第二时长的步骤包括:
记录接收到所述第二报文的第一接收时间戳,并获取所述第二报文携带的所述第二发送时间戳;
将所述第一接收时间戳与所述第二发送时间戳之差值作为传输所述第二报文的第二时长。
可选地,所述方法还包括:
将计算得到的各物理链路的传输时延分别与预设阈值进行比对,若任一物理链路的传输时延大于或等于预设阈值,则确定所述任一物理链路亚健康,隔离所述任一物理链路对应的网卡。
第二方面,本申请提供了一种网络亚健康检测方法,应用于存储集群中的第二服务器,所述存储集群还包括第一服务器,所述第一服务器与所述第二服务器之间的至少两条物理链路基于bond策略聚合为一条逻辑链路,所述存储集群中各服务器时间同步,所述方法包括:
接收所述第一服务器发送的第一报文,其中,所述第一服务器在向所述第二服务器发送第一报文时,记录传输所述第一报文所使用的第一物理链路,所述第一报文携带有第一发送时间戳;
基于所述第一发送时间戳,计算传输所述第一报文的第一时长;
向所述第一服务器发送携带有第二发送时间戳和所述第一时长的第二报文,以使得所述第一服务器在接收到所述第二报文时,记录传输所述第二报文的第二物理链路,并判断所述第一物理链路和所述第二物理链路是否为同一目标物理链路,若是,则基于所述第二发送时间戳,计算传输所述第二报文的第二时长,并基于所述第一时长和所述第二时长计算所述目标物理链路的传输时延;否则,将所述第一时长作为所述第一物理链路的传输时延,并将所述第二时长作为所述第二链路的传输时延。
第三方面,本申请提供了一种网络亚健康检测装置,应用于存储集群中的第一服务器,所述存储集群还包括第二服务器,所述第一服务器与所述第二服务器之间的至少两条物理链路基于bond策略聚合为一条逻辑链路,所述存储集群中各服务器时间同步,所述装置包括:
发送单元,用于向所述第二服务器发送第一报文,并记录传输所述第一报文所使用的第一物理链路,其中,所述第一报文携带有第一发送时间戳,所述第二服务器在接收到所述第一报文时,基于所述第一发送时间戳,计算传输所述第一报文的第一时长;
接收单元,用于接收所述第二服务器基于所述第一报文响应的第二报文,并记录传输所述第二报文的第二物理链路,其中,所述第二报文携带有第二发送时间戳和所述第一时长;
判断单元,用于判断所述第一物理链路和所述第二物理链路是否为同一目标物理链路,若是,则基于所述第二发送时间戳,计算传输所述第二报文的第二时长,并基于所述第一时长和所述第二时长计算所述目标物理链路的传输时延;否则,将所述第一时长作为所述第一物理链路的传输时延,并将所述第二时长作为所述第二链路的传输时延。
可选地,所述记录传输所述第一报文所使用的第一物理链路时,所述发送单元具体用于:
记录发送所述第一报文所使用的网卡的标识;
所述记录传输所述第二报文的第二物理链路时,所述接收单元具体用于:
记录接收所述第二报文所使用的网卡的标识。
可选地,基于所述第二发送时间戳,计算传输所述第二报文的第二时长时,所述判断单元具体用于:
记录接收到所述第二报文的第一接收时间戳,并获取所述第二报文携带的所述第二发送时间戳;
将所述第一接收时间戳与所述第二发送时间戳之差值作为传输所述第二报文的第二时长。
可选地,所述装置还包括:
比对单元,用于将计算得到的各物理链路的传输时延分别与预设阈值进行比对,若任一物理链路的传输时延大于或等于预设阈值,则确定所述任一物理链路亚健康,隔离所述任一物理链路对应的网卡。
第四方面,本申请提供了一种网络亚健康检测装置,应用于存储集群中的第二服务器,所述存储集群还包括第一服务器,所述第一服务器与所述第二服务器之间的至少两条物理链路基于bond策略聚合为一条逻辑链路,所述存储集群中各服务器时间同步,所述装置包括:
接收单元,用于接收所述第一服务器发送的第一报文,其中,所述第一服务器在向所述第二服务器发送第一报文时,记录传输所述第一报文所使用的第一物理链路,所述第一报文携带有第一发送时间戳;
计算单元,用于基于所述第一发送时间戳,计算传输所述第一报文的第一时长;
发送单元,用于向所述第一服务器发送携带有第二发送时间戳和所述第一时长的第二报文,以使得所述第一服务器在接收到所述第二报文时,记录传输所述第二报文的第二物理链路,并判断所述第一物理链路和所述第二物理链路是否为同一目标物理链路,若是,则基于所述第二发送时间戳,计算传输所述第二报文的第二时长,并基于所述第一时长和所述第二时长计算所述目标物理链路的传输时延;否则,将所述第一时长作为所述第一物理链路的传输时延,并将所述第二时长作为所述第二链路的传输时延。
第五方面,本申请实施例提供一种网络亚健康检测装置,该网络亚健康检测装置包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行如上述第一方面中任一项所述的方法的步骤。
第六方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使所述计算机执行如上述第一方面中任一项所述方法的步骤。
第七方面,本申请实施例提供一种网络亚健康检测装置,该网络亚健康检测装置包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行如上述第二方面中任一项所述的方法的步骤。
第八方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使所述计算机执行如上述第二方面中任一项所述方法的步骤。
综上可知,本申请实施例提供的网络亚健康检测方法,应用于存储集群中的第一服务器,所述存储集群还包括第二服务器,所述第一服务器与所述第二服务器之间的至少两条物理链路基于bond策略聚合为一条逻辑链路,所述存储集群中各服务器时间同步,所述方法包括:向所述第二服务器发送第一报文,并记录传输所述第一报文所使用的第一物理链路,其中,所述第一报文携带有第一发送时间戳,所述第二服务器在接收到所述第一报文时,基于所述第一发送时间戳,计算传输所述第一报文的第一时长;接收所述第二服务器基于所述第一报文响应的第二报文,并记录传输所述第二报文的第二物理链路,其中,所述第二报文携带有第二发送时间戳和所述第一时长;判断所述第一物理链路和所述第二物理链路是否为同一目标物理链路,若是,则基于所述第二发送时间戳,计算传输所述第二报文的第二时长,并基于所述第一时长和所述第二时长计算所述目标物理链路的传输时延;否则,将所述第一时长作为所述第一物理链路的传输时延,并将所述第二时长作为所述第二链路的传输时延。
采用本申请实施例提供的网络亚健康检测方法,可以准确计算出各报文在逻辑链路中各物理链路上的传输时延,当检测到任一物理链路的传输时延大于等于预设阈值时,只需隔离该任一物理链路即可,逻辑链路中其它物理链路仍可以继续用于传输报文。
附图说明
为了更加清楚地说明本申请实施例或者现有技术中的技术方案,下面将对本申请实施例或者现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据本申请实施例的这些附图获得其他的附图。
图1为本申请实施例提供的一种存储集群中服务器间通信链路示意图;
图2为本申请实施例提供的一种网络亚健康检测方法的详细流程图;
图3为本申请实施例提供的另一种网络亚健康检测方法的详细流程图;
图4为本申请实施例提供的一种网络亚健康检测装置的结构示意图;
图5为本申请实施例提供的另一种网络亚健康检测装置的结构示意图;
图6为本申请实施例提供的第一服务器的结构示意图;
图7为本申请实施例提供的第二服务器的结构示意图。
具体实施方式
在本申请实施例使用的术语仅仅是出于描述特定实施例的目的,而非限制本申请。本申请和权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其它含义。还应当理解,本文中使用的术语“和/或”是指包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请实施例可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,此外,所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
下面,以存储集群为背景,存储集群中第一服务器和第二服务器之间的至少两条物理链路基于bond策略聚合为一条逻辑链路。示例性的,参阅图1所示,为本申请实施例提供的一种存储集群中服务器间通信链路示意图,服务器1和服务器2是存储集群中的两个节点,它们的两条物理链路(物理链路1和物理链路2)通过bond 4绑定为一条逻辑链路,假设服务器1发送报文时从物理链路1发出,服务器2接收到报文后,通过bond 4的负载均衡算法选择一条物理链路发送回复报文,那么服务器1可能从任意一条物理链路上接收到回复包。
示例性的,参阅图2所示,为本申请实施例提供的一种网络亚健康检测方法的详细流程图,该方法应用于存储集群中的第一服务器,上述存储集群还包括第二服务器,上述第一服务器与上述第二服务器之间的至少两条物理链路基于bond策略聚合为一条逻辑链路,上述存储集群中各服务器时间同步,该方法包括以下步骤:
步骤200:向第二服务器发送第一报文,并记录传输上述第一报文所使用的第一物理链路,其中,上述第一报文携带有第一发送时间戳,上述第二服务器在接收到上述第一报文时,基于上述第一发送时间戳,计算传输上述第一报文的第一时长。
本申请实施例中,第一服务器记录传输上述第一报文所使用的第一物理链路时,一种较佳的实现方式为,记录发送上述第一报文所使用的网卡的标识。
实际应用中,服务器网卡之间物理连接,实现物理链路的创建,例如,第一服务器的网卡1和第二服务器的网卡1组成物理链路1,第一服务器的网卡2和第二服务器的网卡2组成物理链路2,即第一服务器通过物理链路1发送报文指的是通过网卡1发送报文,第一服务器通过物理链路2接收到报文指的是通过网卡2接收到报文。
那么,第一服务器在发送携带有第一发送时间戳的第一报文时,在本地记录发送第一报文所使用的网卡的标识信息。该第一发送时间戳是发送该第一报文的时间点(如,发送时间t1)。
进一步地,第二服务器在接收到第一服务器发送的第一报文时,从第一报文中取出该第一发送时间戳(t1),并根据接收到第一报文的时间点(如,t)和t1,计算传输该第一报文所花费的时长(△t=t-t1)。
接着,第二服务器基于第一报文向第一服务器反馈第二报文时,将△t和第二发送时间戳(发送第二报文的时间点)添加在第二报文中。
步骤210:接收上述第二服务器基于上述第一报文响应的第二报文,并记录传输上述第二报文的第二物理链路,其中,上述第二报文携带有第二发送时间戳和上述第一时长
本申请实施例中,第一服务器在接收第二服务器发送的第二报文后,在记录传输上述第二报文的第二物理链路时,一种较佳的实现方式为,记录接收所述第二报文所使用的网卡的标识。同时,可以从第二报文中取出△t和第二发送时间戳,其中,该第二发送时间戳是第二服务器发送该第二报文的时间点(如,发送时间t2)。
步骤220:判断上述第一物理链路和上述第二物理链路是否为同一目标物理链路,若是,则基于上述第二发送时间戳,计算传输上述第二报文的第二时长,并基于上述第一时长和上述第二时长计算上述目标物理链路的传输时延;否则,将上述第一时长作为上述第一物理链路的传输时延,并将上述第二时长作为上述第二链路的传输时延。
本申请实施例中,由于第一服务器记录有发送第一报文所使用的网卡的标识(标识1),以及记录有接收第二报文所使用的网卡的标识(标识2),那么,只需通过判断标识1和标识2是否相同,即可判断出第一物理链路和第二物理链路是否为同一目标物理链路。
若第一物理链路和第二物理链路为同一物理链路(目标物理链路,即物理链路1或物理链路2),那么,采用该目标物理链路传输第一报文所花费的第一时长为△t,假设接收到第二报文的时间点为t3,那么,采用该目标物理链路传输第二报文所花费的第二时长为(t3-t2),此次计算该目标物理链路的传输时延的方式为:目标物理链路的传输时延=(△t+(t3-t2))/2。
若第一物理链路和第二物理链路不是同一物理链路(物理链路1传输第一报文,物理链路2传输第二报文),那么,此次计算物理链路1的传输时延的方式为:物理链路1的传输时延=△t;此次计算物理链路2的传输时延的方式为:物理链路2的传输时延=(t3-t2)。
进一步地,本申请实施例中,自定义有预设阈值,即在计算出各物理链路的传输时延之后,即可将计算得到的各物理链路的传输时延分别与预设阈值进行比对,若任一物理链路的传输时延大于或等于预设阈值,则确定所述任一物理链路亚健康,隔离所述任一物理链路对应的网卡。
当然,本申请实施例中,也可以针对任务物理链路统计最近N次传输时延的平均值,基于该平均值与预设阈值进行比对,并基于比对结果执行后续物理链路亚健康检测操作。
示例性的,参阅图3所示,为本申请实施例提供的一种网络亚健康检测方法的详细流程图,该方法应用于存储集群中的第二服务器,上述存储集群还包括第一服务器,上述第一服务器与上述第二服务器之间的至少两条物理链路基于bond策略聚合为一条逻辑链路,上述存储集群中各服务器时间同步,上述方法包括:
步骤300:接收第一服务器发送的第一报文,其中,上述第一服务器在向上述第二服务器发送第一报文时,记录传输上述第一报文所使用的第一物理链路,上述第一报文携带有第一发送时间戳。
步骤310:基于上述第一发送时间戳,计算传输上述第一报文的第一时长。
步骤320:向上述第一服务器发送携带有第二发送时间戳和上述第一时长的第二报文,以使得上述第一服务器在接收到上述第二报文时,记录传输上述第二报文的第二物理链路,并判断上述第一物理链路和上述第二物理链路是否为同一目标物理链路,若是,则基于上述第二发送时间戳,计算传输上述第二报文的第二时长,并基于上述第一时长和上述第二时长计算上述目标物理链路的传输时延;否则,将上述第一时长作为上述第一物理链路的传输时延,并将上述第二时长作为上述第二链路的传输时延。
基于与上述应用于第一服务器的发明实施例同样的发明构思,示例性的,参阅图4所示,为本申请实施例提供的一种网络亚健康检测装置的结构示意图,该网络亚健康检测装置应用于存储集群中的第一服务器,所述存储集群还包括第二服务器,所述第一服务器与所述第二服务器之间的至少两条物理链路基于bond策略聚合为一条逻辑链路,所述存储集群中各服务器时间同步,所述装置包括:
发送单元40,用于向所述第二服务器发送第一报文,并记录传输所述第一报文所使用的第一物理链路,其中,所述第一报文携带有第一发送时间戳,所述第二服务器在接收到所述第一报文时,基于所述第一发送时间戳,计算传输所述第一报文的第一时长;
接收单元41,用于接收所述第二服务器基于所述第一报文响应的第二报文,并记录传输所述第二报文的第二物理链路,其中,所述第二报文携带有第二发送时间戳和所述第一时长;
判断单元42,用于判断所述第一物理链路和所述第二物理链路是否为同一目标物理链路,若是,则基于所述第二发送时间戳,计算传输所述第二报文的第二时长,并基于所述第一时长和所述第二时长计算所述目标物理链路的传输时延;否则,将所述第一时长作为所述第一物理链路的传输时延,并将所述第二时长作为所述第二链路的传输时延。
可选地,所述记录传输所述第一报文所使用的第一物理链路时,发送单元40具体用于:
记录发送所述第一报文所使用的网卡的标识;
所述记录传输所述第二报文的第二物理链路时,接收单元41具体用于:
记录接收所述第二报文所使用的网卡的标识。
可选地,基于所述第二发送时间戳,计算传输所述第二报文的第二时长时,判断单元42具体用于:
记录接收到所述第二报文的第一接收时间戳,并获取所述第二报文携带的所述第二发送时间戳;
将所述第一接收时间戳与所述第二发送时间戳之差值作为传输所述第二报文的第二时长。
可选地,所述装置还包括:
比对单元,用于将计算得到的各物理链路的传输时延分别与预设阈值进行比对,若任一物理链路的传输时延大于或等于预设阈值,则确定所述任一物理链路亚健康,隔离所述任一物理链路对应的网卡。
基于与上述应用于第二服务器的发明实施例同样的发明构思,示例性的,参阅图5所示,为本申请实施例提供的一种网络亚健康检测装置的结构示意图,所述网络亚健康检测装置应用于存储集群中的第二服务器,所述存储集群还包括第一服务器,所述第一服务器与所述第二服务器之间的至少两条物理链路基于bond策略聚合为一条逻辑链路,所述存储集群中各服务器时间同步,所述装置包括:
接收单元51,用于接收所述第一服务器发送的第一报文,其中,所述第一服务器在向所述第二服务器发送第一报文时,记录传输所述第一报文所使用的第一物理链路,所述第一报文携带有第一发送时间戳;
计算单元52,用于基于所述第一发送时间戳,计算传输所述第一报文的第一时长;
发送单元53,用于向所述第一服务器发送携带有第二发送时间戳和所述第一时长的第二报文,以使得所述第一服务器在接收到所述第二报文时,记录传输所述第二报文的第二物理链路,并判断所述第一物理链路和所述第二物理链路是否为同一目标物理链路,若是,则基于所述第二发送时间戳,计算传输所述第二报文的第二时长,并基于所述第一时长和所述第二时长计算所述目标物理链路的传输时延;否则,将所述第一时长作为所述第一物理链路的传输时延,并将所述第二时长作为所述第二链路的传输时延。
以上这些单元可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital singnal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个单元通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些单元可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
综上可知,本申请实施例提供的网络亚健康检测方法,应用于存储集群中的第一服务器,所述存储集群还包括第二服务器,所述第一服务器与所述第二服务器之间的至少两条物理链路基于bond策略聚合为一条逻辑链路,所述存储集群中各服务器时间同步,所述方法包括:向所述第二服务器发送第一报文,并记录传输所述第一报文所使用的第一物理链路,其中,所述第一报文携带有第一发送时间戳,所述第二服务器在接收到所述第一报文时,基于所述第一发送时间戳,计算传输所述第一报文的第一时长;接收所述第二服务器基于所述第一报文响应的第二报文,并记录传输所述第二报文的第二物理链路,其中,所述第二报文携带有第二发送时间戳和所述第一时长;判断所述第一物理链路和所述第二物理链路是否为同一目标物理链路,若是,则基于所述第二发送时间戳,计算传输所述第二报文的第二时长,并基于所述第一时长和所述第二时长计算所述目标物理链路的传输时延;否则,将所述第一时长作为所述第一物理链路的传输时延,并将所述第二时长作为所述第二链路的传输时延。
采用本申请实施例提供的网络亚健康检测方法,可以准确计算出各报文在逻辑链路中各物理链路上的传输时延,当检测到任一物理链路的传输时延大于等于预设阈值时,只需隔离该任一物理链路即可,逻辑链路中其它物理链路仍可以继续用于传输报文。
进一步地,本申请实施例提供的第一服务器,从硬件层面而言,所述第一服务器的硬件架构示意图可以参见图6所示,所述第一服务器可以包括:存储器60和处理器61,
存储器60用于存储程序指令;处理器61调用存储器60中存储的程序指令,按照获得的程序指令执行上述应用于第一服务器的方法实施例。具体实现方式和技术效果类似,这里不再赘述。
可选地,本申请还提供一种第一服务器,包括用于执行上述应用于第一服务器的方法实施例的至少一个处理元件(或芯片)。
可选地,本申请还提供一种程序产品,例如计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令用于使该计算机执行上述应用于第一服务器的方法实施例。
进一步地,本申请实施例提供的第二服务器,从硬件层面而言,所述第二服务器的硬件架构示意图可以参见图7所示,所述第二服务器可以包括:存储器70和处理器71,
存储器70用于存储程序指令;处理器71调用存储器70中存储的程序指令,按照获得的程序指令执行上述应用于第二服务器的方法实施例。具体实现方式和技术效果类似,这里不再赘述。
可选地,本申请还提供一种第二服务器,包括用于执行上述应用于第二服务器的方法实施例的至少一个处理元件(或芯片)。
可选地,本申请还提供一种程序产品,例如计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令用于使该计算机执行上述应用于第二服务器的方法实施例。
这里,机器可读存储介质可以是任何电子、磁性、光学或其它物理存储装置,可以包含或存储信息,如可执行指令、数据,等等。例如,机器可读存储介质可以是:RAM(RadomAccess Memory,随机存取存储器)、易失存储器、非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、固态硬盘、任何类型的存储盘(如光盘、dvd等),或者类似的存储介质,或者它们的组合。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可以由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其它可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其它可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
而且,这些计算机程序指令也可以存储在能引导计算机或其它可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或者多个流程和/或方框图一个方框或者多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其它可编程数据处理设备上,使得在计算机或者其它可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其它可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (10)

1.一种网络亚健康检测方法,其特征在于,应用于存储集群中的第一服务器,所述存储集群还包括第二服务器,所述第一服务器与所述第二服务器之间的至少两条物理链路基于bond策略聚合为一条逻辑链路,所述存储集群中各服务器时间同步,所述方法包括:
向所述第二服务器发送第一报文,并记录传输所述第一报文所使用的第一物理链路,其中,所述第一报文携带有第一发送时间戳,所述第二服务器在接收到所述第一报文时,基于所述第一发送时间戳,计算传输所述第一报文的第一时长;
接收所述第二服务器基于所述第一报文响应的第二报文,并记录传输所述第二报文的第二物理链路,其中,所述第二报文携带有第二发送时间戳和所述第一时长;
判断所述第一物理链路和所述第二物理链路是否为同一目标物理链路,若是,则基于所述第二发送时间戳,计算传输所述第二报文的第二时长,并基于所述第一时长和所述第二时长计算所述目标物理链路的传输时延;否则,将所述第一时长作为所述第一物理链路的传输时延,并将所述第二时长作为所述第二链路的传输时延。
2.如权利要求1所述的方法,其特征在于,所述记录传输所述第一报文所使用的第一物理链路的步骤包括:
记录发送所述第一报文所使用的网卡的标识;
所述记录传输所述第二报文的第二物理链路的步骤包括:
记录接收所述第二报文所使用的网卡的标识。
3.如权利要求1所述的方法,其特征在于,基于所述第二发送时间戳,计算传输所述第二报文的第二时长的步骤包括:
记录接收到所述第二报文的第一接收时间戳,并获取所述第二报文携带的所述第二发送时间戳;
将所述第一接收时间戳与所述第二发送时间戳之差值作为传输所述第二报文的第二时长。
4.如权利要求1-3任一项所述的方法,其特征在于,所述方法还包括:
将计算得到的各物理链路的传输时延分别与预设阈值进行比对,若任一物理链路的传输时延大于或等于预设阈值,则确定所述任一物理链路亚健康,隔离所述任一物理链路对应的网卡。
5.一种网络亚健康检测方法,其特征在于,应用于存储集群中的第二服务器,所述存储集群还包括第一服务器,所述第一服务器与所述第二服务器之间的至少两条物理链路基于bond策略聚合为一条逻辑链路,所述存储集群中各服务器时间同步,所述方法包括:
接收所述第一服务器发送的第一报文,其中,所述第一服务器在向所述第二服务器发送第一报文时,记录传输所述第一报文所使用的第一物理链路,所述第一报文携带有第一发送时间戳;
基于所述第一发送时间戳,计算传输所述第一报文的第一时长;
向所述第一服务器发送携带有第二发送时间戳和所述第一时长的第二报文,以使得所述第一服务器在接收到所述第二报文时,记录传输所述第二报文的第二物理链路,并判断所述第一物理链路和所述第二物理链路是否为同一目标物理链路,若是,则基于所述第二发送时间戳,计算传输所述第二报文的第二时长,并基于所述第一时长和所述第二时长计算所述目标物理链路的传输时延;否则,将所述第一时长作为所述第一物理链路的传输时延,并将所述第二时长作为所述第二链路的传输时延。
6.一种网络亚健康检测装置,其特征在于,应用于存储集群中的第一服务器,所述存储集群还包括第二服务器,所述第一服务器与所述第二服务器之间的至少两条物理链路基于bond策略聚合为一条逻辑链路,所述存储集群中各服务器时间同步,所述装置包括:
发送单元,用于向所述第二服务器发送第一报文,并记录传输所述第一报文所使用的第一物理链路,其中,所述第一报文携带有第一发送时间戳,所述第二服务器在接收到所述第一报文时,基于所述第一发送时间戳,计算传输所述第一报文的第一时长;
接收单元,用于接收所述第二服务器基于所述第一报文响应的第二报文,并记录传输所述第二报文的第二物理链路,其中,所述第二报文携带有第二发送时间戳和所述第一时长;
判断单元,用于判断所述第一物理链路和所述第二物理链路是否为同一目标物理链路,若是,则基于所述第二发送时间戳,计算传输所述第二报文的第二时长,并基于所述第一时长和所述第二时长计算所述目标物理链路的传输时延;否则,将所述第一时长作为所述第一物理链路的传输时延,并将所述第二时长作为所述第二链路的传输时延。
7.如权利要求6所述的装置,其特征在于,所述记录传输所述第一报文所使用的第一物理链路时,所述发送单元具体用于:
记录发送所述第一报文所使用的网卡的标识;
所述记录传输所述第二报文的第二物理链路时,所述接收单元具体用于:
记录接收所述第二报文所使用的网卡的标识。
8.如权利要求6所述的装置,其特征在于,基于所述第二发送时间戳,计算传输所述第二报文的第二时长时,所述判断单元具体用于:
记录接收到所述第二报文的第一接收时间戳,并获取所述第二报文携带的所述第二发送时间戳;
将所述第一接收时间戳与所述第二发送时间戳之差值作为传输所述第二报文的第二时长。
9.如权利要求6-7任一项所述的装置,其特征在于,所述装置还包括:
比对单元,用于将计算得到的各物理链路的传输时延分别与预设阈值进行比对,若任一物理链路的传输时延大于或等于预设阈值,则确定所述任一物理链路亚健康,隔离所述任一物理链路对应的网卡。
10.一种网络亚健康检测装置,其特征在于,应用于存储集群中的第二服务器,所述存储集群还包括第一服务器,所述第一服务器与所述第二服务器之间的至少两条物理链路基于bond策略聚合为一条逻辑链路,所述存储集群中各服务器时间同步,所述装置包括:
接收单元,用于接收所述第一服务器发送的第一报文,其中,所述第一服务器在向所述第二服务器发送第一报文时,记录传输所述第一报文所使用的第一物理链路,所述第一报文携带有第一发送时间戳;
计算单元,用于基于所述第一发送时间戳,计算传输所述第一报文的第一时长;
发送单元,用于向所述第一服务器发送携带有第二发送时间戳和所述第一时长的第二报文,以使得所述第一服务器在接收到所述第二报文时,记录传输所述第二报文的第二物理链路,并判断所述第一物理链路和所述第二物理链路是否为同一目标物理链路,若是,则基于所述第二发送时间戳,计算传输所述第二报文的第二时长,并基于所述第一时长和所述第二时长计算所述目标物理链路的传输时延;否则,将所述第一时长作为所述第一物理链路的传输时延,并将所述第二时长作为所述第二链路的传输时延。
CN202010892778.3A 2020-08-31 2020-08-31 一种网络亚健康检测方法及装置 Active CN112152872B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010892778.3A CN112152872B (zh) 2020-08-31 2020-08-31 一种网络亚健康检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010892778.3A CN112152872B (zh) 2020-08-31 2020-08-31 一种网络亚健康检测方法及装置

Publications (2)

Publication Number Publication Date
CN112152872A true CN112152872A (zh) 2020-12-29
CN112152872B CN112152872B (zh) 2022-05-27

Family

ID=73890893

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010892778.3A Active CN112152872B (zh) 2020-08-31 2020-08-31 一种网络亚健康检测方法及装置

Country Status (1)

Country Link
CN (1) CN112152872B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113890816A (zh) * 2021-11-19 2022-01-04 深信服科技股份有限公司 网络健康状态分析方法、装置、计算机设备和存储介质
CN115118635A (zh) * 2022-06-29 2022-09-27 济南浪潮数据技术有限公司 一种时延检测方法、装置、设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101261308A (zh) * 2008-02-01 2008-09-10 清华大学 一种路径延迟故障模拟方法及装置
CN103312628A (zh) * 2012-03-16 2013-09-18 中兴通讯股份有限公司 一种包交换网络中聚合链路的调度方法及装置
US20130301407A1 (en) * 2012-05-08 2013-11-14 Cisco Technology, Inc. Method and apparatus for adaptive fast start in link aggregation
CN103618678A (zh) * 2013-11-18 2014-03-05 北京星网锐捷网络技术有限公司 自适应多链路聚合的方法、装置及系统
CN106464419A (zh) * 2014-12-29 2017-02-22 华为技术有限公司 聚合链路的工作状态调整方法、装置、终端设备及系统
CN106998302A (zh) * 2016-01-26 2017-08-01 华为技术有限公司 一种业务流量的分配方法及装置
WO2018094616A1 (zh) * 2016-11-23 2018-05-31 华为技术有限公司 监测虚拟网络的方法、设备和虚拟网络系统
CN109067664A (zh) * 2018-08-29 2018-12-21 迈普通信技术股份有限公司 一种负载均衡方法及装置
CN111277502A (zh) * 2020-01-20 2020-06-12 北京红云融通技术有限公司 多链路聚合传输数据的方法及发送设备
CN111294251A (zh) * 2018-12-07 2020-06-16 中国移动通信集团辽宁有限公司 链路时延的检测方法、装置、设备及介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101261308A (zh) * 2008-02-01 2008-09-10 清华大学 一种路径延迟故障模拟方法及装置
CN103312628A (zh) * 2012-03-16 2013-09-18 中兴通讯股份有限公司 一种包交换网络中聚合链路的调度方法及装置
US20130301407A1 (en) * 2012-05-08 2013-11-14 Cisco Technology, Inc. Method and apparatus for adaptive fast start in link aggregation
CN103618678A (zh) * 2013-11-18 2014-03-05 北京星网锐捷网络技术有限公司 自适应多链路聚合的方法、装置及系统
CN106464419A (zh) * 2014-12-29 2017-02-22 华为技术有限公司 聚合链路的工作状态调整方法、装置、终端设备及系统
CN106998302A (zh) * 2016-01-26 2017-08-01 华为技术有限公司 一种业务流量的分配方法及装置
WO2018094616A1 (zh) * 2016-11-23 2018-05-31 华为技术有限公司 监测虚拟网络的方法、设备和虚拟网络系统
CN109067664A (zh) * 2018-08-29 2018-12-21 迈普通信技术股份有限公司 一种负载均衡方法及装置
CN111294251A (zh) * 2018-12-07 2020-06-16 中国移动通信集团辽宁有限公司 链路时延的检测方法、装置、设备及介质
CN111277502A (zh) * 2020-01-20 2020-06-12 北京红云融通技术有限公司 多链路聚合传输数据的方法及发送设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113890816A (zh) * 2021-11-19 2022-01-04 深信服科技股份有限公司 网络健康状态分析方法、装置、计算机设备和存储介质
CN115118635A (zh) * 2022-06-29 2022-09-27 济南浪潮数据技术有限公司 一种时延检测方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN112152872B (zh) 2022-05-27

Similar Documents

Publication Publication Date Title
TWI686709B (zh) 業務受理及共識的方法及裝置
CN109976771B (zh) 一种应用的部署方法及装置
CN112152872B (zh) 一种网络亚健康检测方法及装置
CN109064325B (zh) 一种基于区块链的智能合约实现方法和装置
CN113472900B (zh) 报文处理方法、设备、存储介质及计算机程序产品
CN110162270B (zh) 基于分布式存储系统的数据存储方法、存储节点及介质
CN109600375A (zh) 消息跟踪方法、装置、电子设备及存储介质
CN108259348B (zh) 一种报文传输方法和装置
CN112948313A (zh) 一种会话数据的管理方法和装置
CN108399175B (zh) 一种数据存储、查询方法及其装置
CN109982034A (zh) 视频监控系统中的访问请求处理方法及装置
WO2016107102A1 (zh) 短信并发业务处理方法及装置
CN111865716B (zh) 一种端口拥塞检测方法、装置、设备及机器可读存储介质
CN112367267B (zh) 一种虚拟机管理方法及装置
CN107547412B (zh) 一种stp计算方法和装置
CN111314432B (zh) 一种报文处理方法及装置
CN114757777A (zh) 用于区块链的最优链路选择方法及装置和电子设备
CN110162415B (zh) 用于处理数据请求的方法、服务器、装置及存储介质
CN112383471A (zh) 一种刀箱链路管理方法、装置、设备及机器可读存储介质
CN113094618A (zh) 执行异步请求响应操作的方法、装置、设备及存储介质
CN108206823A (zh) 一种处理报文的方法及网络设备
CN112925659A (zh) 消息处理方法、装置、设备及计算机存储介质
CN112988463B (zh) 一种故障节点隔离方法及装置
CN110677497A (zh) 一种网络介质分发方法及装置
CN110489231A (zh) 交易信息记录方法、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant