CN115118635A - 一种时延检测方法、装置、设备及存储介质 - Google Patents
一种时延检测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN115118635A CN115118635A CN202210753289.9A CN202210753289A CN115118635A CN 115118635 A CN115118635 A CN 115118635A CN 202210753289 A CN202210753289 A CN 202210753289A CN 115118635 A CN115118635 A CN 115118635A
- Authority
- CN
- China
- Prior art keywords
- node
- target
- nodes
- preset
- time delay
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 58
- 230000004044 response Effects 0.000 claims abstract description 69
- 238000000034 method Methods 0.000 claims abstract description 25
- 238000004590 computer program Methods 0.000 claims description 17
- 230000009467 reduction Effects 0.000 claims description 14
- 238000012163 sequencing technique Methods 0.000 claims description 12
- 238000004891 communication Methods 0.000 abstract description 9
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0852—Delays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/50—Network service management, e.g. ensuring proper service fulfilment according to agreements
- H04L41/508—Network service management, e.g. ensuring proper service fulfilment according to agreements based on type of value added network service under agreement
- H04L41/5096—Network service management, e.g. ensuring proper service fulfilment according to agreements based on type of value added network service under agreement wherein the managed service relates to distributed or central networked applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/16—Threshold monitoring
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/50—Testing arrangements
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请公开了一种时延检测方法、装置、设备及存储介质,涉及分布式存储系统技术领域,包括:获取目标存储池对应的目标节点组的全部节点,并基于预设主节点确定规则从所述目标节点组的全部节点中确定主节点;通过主节点向所述目标节点组中的目标节点发送预设报文信息,以便所述目标节点在接收到所述预设报文信息后返回对应的响应信息;接收所述响应信息并基于所述响应信息确定所述目标节点对应的目标时延;判断所述目标时延是否大于预设时延阈值,若所述目标时延大于所述预设时延阈值则报警。本申请在每一个存储池对应的节点组内设置主节点,由于主节点与目标节点位于同一个存储池且可以直接通信,提高了时延检测的准确性。
Description
技术领域
本发明涉及分布式存储系统技术领域,特别涉及一种时延检测方法、装置、设备及存储介质。
背景技术
在海量数据环境下,集群的规模变的越来越大,并且集群复杂度越来越高,因此在对系统的扩展性要求高适配的同时,对分布式集群的管理及运维的要求也越来越高、越来越重要。在分布式存储系统中,一般把集群的网络按照其本身承担的功能分为集群网络、业务网络以及管理网络。集群网络是集群内部各个模块通信所依赖的网络,业务网络是对接上层业务时所依赖的网络,管理网络是管理软件正常运行所依赖的网络。一般情况下,集群中各个节点的管理网络都处于同一个网段,在检测网口的时延信息时,我们可以通过主节点的网口向集群中的其他节点对应的网口发送携带vlan(Virtual Local Area Network,虚拟局域网)号标识的udp(User Data Protocol,用户数据报协议)报文,主节点接收到其他节点返回的报文后,会获取该报文的发送时间,并与接收时间对比从而计算该网口的延时。在大规模集群中,集群的节点可以达到几百的规模,集群往往按照不同的存储池去规划网络,同一个存储池的各个节点的管理网络都连接同一个EOR(End of Row)交换机,不同的存储池内的各个节点通过不同的EOR交换机进行管理,在二层网络协议上,存储池之间是隔离的,不能直接进行通信,因此导致不同存储池内各个节点的管理网络处于不同的网段,此时再通过主节点向集群的其他所有节点发送携带vlan号标识的udp报文就会受到交换机的影响,部分节点无法接收到udp报文信息,无法正确检测网口的时延。
发明内容
有鉴于此,本发明的目的在于提供一种时延检测方法、装置、设备和存储介质,能够提高时延检测的准确性。其具体方案如下:
第一方面,本申请公开了一种时延检测方法,应用于分布式存储集群,包括:
获取目标存储池对应的目标节点组的全部节点,并基于预设主节点确定规则从所述目标节点组的全部节点中确定主节点;
通过主节点向所述目标节点组中的目标节点发送预设报文信息,以便所述目标节点在接收到所述预设报文信息后返回对应的响应信息;
接收所述响应信息并基于所述响应信息确定所述目标节点对应的目标时延;
判断所述目标时延是否大于预设时延阈值,若所述目标时延大于所述预设时延阈值则报警。
可选的,所述获取目标存储池对应的目标节点组中的全部节点之前,还包括:
统计所述分布式存储集群中存储池的数量、每个所述存储池中的全部节点以及每个节点的管理网络对应的网段信息;
基于所述存储池的数量将所述分布式存储集群的全部节点划分为不同的节点组;其中,每个所述节点组包含一个所述存储池中的全部节点;
将全部所述节点组的信息存储至预设存储区域。
可选的,所述获取目标存储池对应的目标节点组中的全部节点,基于预设主节点确定规则从全部所述节点中确定主节点,包括:
从全部所述节点组中确定目标节点组,并获取所述目标节点组的全部节点;
按照预设排序规则对所述目标节点组的全部节点进行排序,以得到节点排序表;
按照预设顺序依次为所述节点排序表的全部节点设置对应且不同的优先级,以得到节点优先级表;
将最高优先级对应的节点确定为所述主节点。
可选的,所述基于预设主节点确定规则从所述目标节点组的全部节点中确定主节点之后,还包括:
若所述主节点故障,则获取所述节点优先级表;
确定所述节点优先级表中不包含所述最高优先级的剩余优先级中的当前最高优先级;
将所述当前最高优先级对应的所述目标节点确定为新的主节点。
可选的,所述将全部所述节点组的信息存储至预设存储区域之后,还包括:
若所述目标存储池扩容并添加扩容节点,则在所述扩容节点上开启网口时延检测客户端程序;
将所述扩容节点对应的扩容节点信息更新至所述预设存储区域中与所述目标存储池对应的节点组。
可选的,所述将全部所述节点组的信息存储至预设存储区域之后,还包括:
若所述目标存储池缩容并删除缩容节点,则在所述缩容节点上关闭所述网口时延检测客户端程序;
将所述缩容节点对应的缩容节点信息从所述预设存储区域中与所述目标存储池对应的节点组内删除。
可选的,所述通过主节点向所述目标节点组中的目标节点发送预设报文信息,以便所述目标节点在接收到所述预设报文信息后返回对应的响应信息,包括:
通过所述主节点向所述目标节点组中的目标节点发送包含第一源地址与第一目的地址的预设报文信息,以便所述目标节点在接收到所述预设报文信息后返回包含第二源地址、第二目的地址、报文信息接收时间以及响应信息发送时间的响应信息;其中,所述目标节点为所述目标节点组中不包含所述主节点的剩余节点。
第二方面,本申请公开了一种时延检测装置,应用于分布式存储集群,包括:
节点获取模块,用于获取目标存储池对应的目标节点组的全部节点;
主节点确定模块,用于基于预设主节点确定规则从所述目标节点组的全部节点中确定主节点;
报文信息发送模块,用于通过主节点向所述目标节点组中的目标节点发送预设报文信息,以便所述目标节点在接收到所述预设报文信息后返回对应的响应信息;
时延确定模块,用于接收所述响应信息并基于所述响应信息确定所述目标节点对应的目标时延;
时延判断模块,用于判断所述目标时延是否大于预设时延阈值,若所述目标时延大于所述预设时延阈值则报警。
第三方面,本申请公开了一种电子设备,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序,以实现如前述公开的时延检测方法的步骤。
第四方面,本申请公开了一种计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现如前述公开的时延检测方法。
可见,本申请提供了一种时延检测方法,包括:获取目标存储池对应的目标节点组的全部节点,并基于预设主节点确定规则从所述目标节点组的全部节点中确定主节点;通过主节点向所述目标节点组中的目标节点发送预设报文信息,以便所述目标节点在接收到所述预设报文信息后返回对应的响应信息;接收所述响应信息并基于所述响应信息确定所述目标节点对应的目标时延;判断所述目标时延是否大于预设时延阈值,若所述目标时延大于所述预设时延阈值则报警。由此可见,本申请通过在目标存储池对应的目标节点组中选择主节点,然后利用所述主节点向所述目标节点组中的目标节点发送预设报文信息,从而计算对应的目标时延,由于主节点与目标节点位于同一个存储池且可以直接通信,无需通过交换机转发报文,因此提高了时延检测的准确性,并且每个存储池中的节点都可以接收到该存储池中的主节点发送的报文信息,提高了节点检测的覆盖率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请公开的一种时延检测方法流程图;
图2为本申请公开的一种时延检测方法框架图;
图3为本申请公开的一种具体的时延检测方法流程图;
图4为本申请公开的一种具体的时延检测方法流程图;
图5为本申请提供的时延检测装置结构示意图;
图6为本申请提供的一种电子设备结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,在大规模集群中,集群的节点可以达到几百的规模,集群往往按照不同的存储池去规划网络,同一个存储池的各个节点的管理网络都连接同一个EOR交换机,不同的存储池内的各个节点通过不同的EOR交换机进行管理,在二层网络协议上,存储池之间是隔离的,不能直接进行通信,因此导致不同存储池内各个节点的管理网络处于不同的网段,此时再通过主节点向集群的其他所有节点发送携带vlan号标识的udp报文就会受到交换机的影响,部分节点无法接收到udp报文信息,无法正确检测网口的时延。为此,本申请提供了一种时延检测方法,能够提高时延检测的准确性以及节点检测的覆盖率。
本发明实施例公开了一种时延检测方法,参见图1所示,应用于分布式存储集群,该方法包括:
步骤S11:获取目标存储池对应的目标节点组的全部节点,并基于预设主节点确定规则从所述目标节点组的全部节点中确定主节点。
本实施例中,首先获取目标存储池对应的目标节点组的全部节点,并基于预设主节点确定规则从所述目标节点组的全部节点中确定主节点。可以理解的是,在现有的大规模集群中,集群往往按照不同的存储池去规划网络,同一个存储池的各个节点的管理网络都连接同一个EOR交换机,不同的存储池内的各个节点通过不同的EOR交换机进行管理,在二层网络协议上存储池之间是隔离的,不能直接进行通信,因此导致不同存储池内各个节点的管理网络处于不同的网段,此时再通过主节点向集群的其他所有节点发送携带vlan号标识的udp报文就会受到交换机的影响,部分节点无法接收到udp报文信息,无法正确检测网口的时延。因此提出一种分布式集群多网段的网口时延检测的方法,如图2所示,主要包含三个模块:集群节点分组模块、同一分组内网口时延检测模块以及分组信息动态管理模块。
需要指出的是,集群节点分组模块可以统计集群中所有的存储池、每个存储池包含的节点以及存储池内节点的管理网络对应的网段,并根据存储池把集群中的节点分成不同的组。然后获取目标存储池对应的目标节点组的全部节点,并基于预设主节点确定规则从所述目标节点组的全部节点中确定主节点。可以理解的是,为所述分布式存储集群中的每个存储池都设置一个主节点,每个所述主节点检测其所在的存储池中的其他节点的时延,此时主节点与其检测的其他节点位于同一个存储池且可以直接通信,无需通过交换机转发报文,从而提高时延检测的准确性,每个存储池中的非主节点的其他节点都可以接收到该存储池中的主节点发送的报文信息,进而提高节点检测的覆盖率。
可以理解的是,基于预设主节点确定规则从所述目标节点组的全部节点中确定主节点,所述预设主节点确定规则为自定义规则,例如根据节点的优先级顺序确定主节点,即将当前最高优先级的节点确定为所述主节点。
步骤S12:通过主节点向所述目标节点组中的目标节点发送预设报文信息,以便所述目标节点在接收到所述预设报文信息后返回对应的响应信息。
本实施例中,基于预设主节点确定规则从所述目标节点组的全部节点中确定主节点之后,通过主节点向所述目标节点组中的目标节点发送预设报文信息,以便所述目标节点在接收到所述预设报文信息后返回对应的响应信息。可以理解的是,主节点作为节点网口时延检测的服务端可以定时向分组内的其他节点(即目标节点或客户端)发送udp报文信息,udp报文信息中包含主节点网口的mac(Media Access Control,物理地址)地址以及客户端网口的mac地址,此时主节点网口的mac地址为源地址,客户端网口的mac地址为目的地址。当其他节点在接收到udp报文信息之后,将目的地址和源地址对调,并与udp报文信息的接收时间以及响应信息的发送时间构成响应信息,然后将上述响应信息返回给主节点网口。所述响应信息中的目的地址为主节点网口的mac地址,源地址为客户端网口的mac地址。
步骤S13:接收所述响应信息并基于所述响应信息确定所述目标节点对应的目标时延。
本实施例中,所述目标节点在接收到所述预设报文信息后返回对应的响应信息之后,接收所述响应信息并基于所述响应信息确定所述目标节点对应的目标时延。可以理解的是,由于所述响应信息中包含udp报文信息的接收时间以及响应信息的发送时间,因此通过计算udp报文信息的接收时间与响应信息的发送时间之间的差值即可得到该目标节点的时延信息,得到目标时延。
步骤S14:判断所述目标时延是否大于预设时延阈值,若所述目标时延大于所述预设时延阈值则报警。
本实施例中,确定所述目标节点对应的目标时延之后,判断所述目标时延是否大于预设时延阈值,若所述目标时延大于所述预设时延阈值则报警。可以理解的是,若所述目标节点的时延小于所述预设时延阈值,则表明该目标节点的时延处于正常范围内,若所述目标节点的时延大于所述预设时延阈值,则表明该目标节点的时延异常,上报异常信息并报警。
可见,本申请提供了一种时延检测方法,包括:获取目标存储池对应的目标节点组的全部节点,并基于预设主节点确定规则从所述目标节点组的全部节点中确定主节点;通过主节点向所述目标节点组中的目标节点发送预设报文信息,以便所述目标节点在接收到所述预设报文信息后返回对应的响应信息;接收所述响应信息并基于所述响应信息确定所述目标节点对应的目标时延;判断所述目标时延是否大于预设时延阈值,若所述目标时延大于所述预设时延阈值则报警。由此可见,本申请通过在目标存储池对应的目标节点组中选择主节点,然后利用所述主节点向所述目标节点组中的目标节点发送预设报文信息,从而计算对应的目标时延,由于主节点与目标节点位于同一个存储池且可以直接通信,无需通过交换机转发报文,因此提高了时延检测的准确性,并且每个存储池中的节点都可以接收到该存储池中的主节点发送的报文信息,提高了节点检测的覆盖率。
参见图3所示,本发明实施例公开了一种时延检测方法,相对于上一实施例,本实施例对技术方案作了进一步的说明和优化。
步骤S21:从全部所述节点组中确定目标节点组,并获取所述目标节点组的全部节点。
本实施例中,从全部所述节点组中确定目标节点组,并获取所述目标节点组的全部节点。可以理解的是,由于在集群节点分组模块中根据存储池把集群中的节点分成不同的节点组,因此从划分完成的全部节点组中确定与当前存储池对应的目标节点组,然后确定该目标节点组中的全部节点,以便对上述节点进行时延检测。
步骤S22:按照预设排序规则对所述目标节点组的全部节点进行排序,以得到节点排序表。
本实施例中,获取所述目标节点组的全部节点之后,按照预设排序规则对所述目标节点组的全部节点进行排序,以得到节点排序表。可以理解的是,同一分组内网口时延检测模块需要限按照预设排序规则对所述目标节点组的全部节点进行排序,以得到节点排序表。例如,在该模块中将获取到的目标节点组的全部节点按照节点名称进行排序。需要指出的是,预设排序规则可以是按照节点名称进行排序,也可以是按照其他自定义排序规则对节点进行排序,从而得到对应的节点排序表。
步骤S23:按照预设顺序依次为所述节点排序表的全部节点设置对应且不同的优先级,以得到节点优先级表。
本实施例中,得到节点排序表之后,按照预设顺序依次为所述节点排序表的全部节点设置对应且不同的优先级,以得到节点优先级表。例如,按照序号递增的顺序为上述节点排序表中的全部节点设置对应且不同的优先级,以得到节点优先级表。可以理解的是,为节点设置优先级为一种具体的标识方法,也可以利用其他的标识方法为节点设置唯一的标识。
步骤S24:将最高优先级对应的节点确定为所述主节点。
本实施例中,得到节点优先级表之后,将最高优先级对应的节点确定为所述主节点。可以理解的是,在一种具体的实施方式中,将优先级最高的节点作为该目标节点组内的网口时延检测的主节点。主节点的设置方式也可以是其他的自定义方式。
需要指出的是,若所述主节点故障,则获取所述节点优先级表,然后确定所述节点优先级表中不包含所述最高优先级的剩余优先级中的当前最高优先级,再将所述当前最高优先级对应的所述目标节点确定为新的主节点,即从除了故障主节点的剩余节点中选择一个优先级最高的节点作为新的主节点,并继续完成对分组内其他节点网口时延的监控。若该故障主节点恢复正常,此时该故障主节点会作为普通节点重新加入该目标节点组中,接收新的主节点发送的预设报文信息。
步骤S25:通过主节点向所述目标节点组中的目标节点发送预设报文信息,以便所述目标节点在接收到所述预设报文信息后返回对应的响应信息。
本实施例中,通过主节点向所述目标节点组中的目标节点发送预设报文信息,以便所述目标节点在接收到所述预设报文信息后返回对应的响应信息。可以理解的是,由于同一个分组内的各个节点的管理网络都处于同一个网段,可以正常通信,因此主节点作为节点网口时延检测的服务端可以定时向分组内的其他节点发送udp报文信息,并接收其他节点返回给主节点的响应信息。
步骤S26:接收所述响应信息并基于所述响应信息确定所述目标节点对应的目标时延。
步骤S27:判断所述目标时延是否大于预设时延阈值,若所述目标时延大于所述预设时延阈值则报警。
关于上述步骤S26、S27的具体内容可以参考前述实施例中公开的相应内容,在此不再进行赘述。
可见,本申请实施例从全部所述节点组中确定目标节点组,并获取所述目标节点组的全部节点;按照预设排序规则对所述目标节点组的全部节点进行排序,以得到节点排序表;按照预设顺序依次为所述节点排序表的全部节点设置对应且不同的优先级,以得到节点优先级表;将最高优先级对应的节点确定为所述主节点;通过主节点向所述目标节点组中的目标节点发送预设报文信息,以便所述目标节点在接收到所述预设报文信息后返回对应的响应信息;接收所述响应信息并基于所述响应信息确定所述目标节点对应的目标时延;判断所述目标时延是否大于预设时延阈值,若所述目标时延大于所述预设时延阈值则报警,提高了时延检测的准确性以及节点检测的覆盖率。
参见图4所示,本发明实施例公开了一种时延检测方法,相对于上一实施例,本实施例对技术方案作了进一步的说明和优化。
步骤S31:统计所述分布式存储集群中存储池的数量、每个所述存储池中的全部节点以及每个节点的管理网络对应的网段信息。
本实施例中,统计所述分布式存储集群中存储池的数量、每个所述存储池中的全部节点以及每个节点的管理网络对应的网段信息。可以理解的是,分布式存储集群中存储池的数量即为划分出的节点组的数量,每个所述存储池中的全部节点即为每个存储池对应的节点组中包含的具体节点,每个节点的管理网络对应的网段信息即可以确定统一网段信息下的全部节点。
步骤S32:基于所述存储池的数量将所述分布式存储集群的全部节点划分为不同的节点组。
本实施例中,基于所述存储池的数量将所述分布式存储集群的全部节点划分为不同的节点组。可以理解的是,每个所述节点组包含一个所述存储池中的全部节点,并且上述节点处于同一网段信息。
步骤S33:将全部所述节点组的信息存储至预设存储区域。
本实施例中,划分节点组之后,将全部所述节点组的信息存储至预设存储区域,以便后续使用所述节点组信息时可以直接从预设存储区域中调用。
需要指出的是,当存储池进行扩容或者缩容时,会对该存储池对应的分组中的节点信息造成影响,因此分布式存储集群中的分组信息动态管理模块实时管理节点组中的节点信息。具体的,若所述目标存储池扩容并添加扩容节点,则在所述扩容节点上开启网口时延检测客户端程序,然后将所述扩容节点对应的扩容节点信息更新至所述预设存储区域中与所述目标存储池对应的节点组,保证新扩容的节点可以被该分组内的主节点进行监控。若所述目标存储池缩容并删除缩容节点,则在所述缩容节点上关闭所述网口时延检测客户端程序,然后将所述缩容节点对应的缩容节点信息从所述预设存储区域中与所述目标存储池对应的节点组内删除。
通过分布式存储集群中的三个模块,可以保证在集群的管理网络处于多个网段的情况下实现对所有节点的网口时延进行监控,即保障了的节点网口时延监控功能的正常运行,并且不受存储池扩缩容的影响。
步骤S34:获取目标存储池对应的目标节点组的全部节点,并基于预设主节点确定规则从所述目标节点组的全部节点中确定主节点。
步骤S35:通过主节点向所述目标节点组中的目标节点发送预设报文信息,以便所述目标节点在接收到所述预设报文信息后返回对应的响应信息。
本实施例中,通过主节点向所述目标节点组中的目标节点发送预设报文信息,以便所述目标节点在接收到所述预设报文信息后返回对应的响应信息。具体的,通过所述主节点向所述目标节点组中的目标节点发送包含第一源地址与第一目的地址的预设报文信息,以便所述目标节点在接收到所述预设报文信息后返回包含第二源地址、第二目的地址、报文信息接收时间以及响应信息发送时间的响应信息。其中,所述目标节点为所述目标节点组中不包含所述主节点的剩余节点。
步骤S36:接收所述响应信息并基于所述响应信息确定所述目标节点对应的目标时延。
步骤S37:判断所述目标时延是否大于预设时延阈值,若所述目标时延大于所述预设时延阈值则报警。
关于上述步骤S34、S36、S37的具体内容可以参考前述实施例中公开的相应内容,在此不再进行赘述。
可见,本申请实施例统计所述分布式存储集群中存储池的数量、每个所述存储池中的全部节点以及每个节点的管理网络对应的网段信息;基于所述存储池的数量将所述分布式存储集群的全部节点划分为不同的节点组;将全部所述节点组的信息存储至预设存储区域;获取目标存储池对应的目标节点组的全部节点,并基于预设主节点确定规则从所述目标节点组的全部节点中确定主节点;通过主节点向所述目标节点组中的目标节点发送预设报文信息,以便所述目标节点在接收到所述预设报文信息后返回对应的响应信息;接收所述响应信息并基于所述响应信息确定所述目标节点对应的目标时延;判断所述目标时延是否大于预设时延阈值,若所述目标时延大于所述预设时延阈值则报警,提高了时延检测的准确性以及节点检测的覆盖率。
参见图5所示,本申请实施例还相应公开了一种时延检测装置,应用于分布式存储集群,包括:
节点获取模块11,用于获取目标存储池对应的目标节点组的全部节点;
主节点确定模块12,用于基于预设主节点确定规则从所述目标节点组的全部节点中确定主节点;
报文信息发送模块13,用于通过主节点向所述目标节点组中的目标节点发送预设报文信息,以便所述目标节点在接收到所述预设报文信息后返回对应的响应信息;
时延确定模块14,用于接收所述响应信息并基于所述响应信息确定所述目标节点对应的目标时延;
时延判断模块15,用于判断所述目标时延是否大于预设时延阈值,若所述目标时延大于所述预设时延阈值则报警。
可见,本申请包括:获取目标存储池对应的目标节点组的全部节点,并基于预设主节点确定规则从所述目标节点组的全部节点中确定主节点;通过主节点向所述目标节点组中的目标节点发送预设报文信息,以便所述目标节点在接收到所述预设报文信息后返回对应的响应信息;接收所述响应信息并基于所述响应信息确定所述目标节点对应的目标时延;判断所述目标时延是否大于预设时延阈值,若所述目标时延大于所述预设时延阈值则报警。由此可见,本申请通过在目标存储池对应的目标节点组中选择主节点,然后利用所述主节点向所述目标节点组中的目标节点发送预设报文信息,从而计算对应的目标时延,由于主节点与目标节点位于同一个存储池且可以直接通信,无需通过交换机转发报文,因此提高了时延检测的准确性,并且每个存储池中的节点都可以接收到该存储池中的主节点发送的报文信息,提高了节点检测的覆盖率。
在一些具体实施例中,所述节点获取模块11,具体包括:
信息统计单元,用于统计所述分布式存储集群中存储池的数量、每个所述存储池中的全部节点以及每个节点的管理网络对应的网段信息;
节点组划分单元,用于基于所述存储池的数量将所述分布式存储集群的全部节点划分为不同的节点组;其中,每个所述节点组包含一个所述存储池中的全部节点;
节点组信息存储单元,用于将全部所述节点组的信息存储至预设存储区域;
目标节点组确定单元,用于从全部所述节点组中确定目标节点组;
节点获取单元,用于获取所述目标节点组的全部节点;
扩容节点程序开启单元,用于若所述目标存储池扩容并添加扩容节点,则在所述扩容节点上开启网口时延检测客户端程序;
扩容节点信息更新单元,用于将所述扩容节点对应的扩容节点信息更新至所述预设存储区域中与所述目标存储池对应的节点组;
缩容节点程序关闭单元单元,用于若所述目标存储池缩容并删除缩容节点,则在所述缩容节点上关闭所述网口时延检测客户端程序;
缩容节点信息删除单元,用于将所述缩容节点对应的缩容节点信息从所述预设存储区域中与所述目标存储池对应的节点组内删除。
在一些具体实施例中,所述主节点确定模块12,具体包括:
节点排序单元,用于按照预设排序规则对所述目标节点组的全部节点进行排序,以得到节点排序表;
优先级设置单元,用于按照预设顺序依次为所述节点排序表的全部节点设置对应且不同的优先级,以得到节点优先级表;
第一主节点确定单元,用于将最高优先级对应的节点确定为所述主节点;
节点优先级表获取单元,用于若所述主节点故障,则获取所述节点优先级表;
当前最高优先级确定单元,用于确定所述节点优先级表中不包含所述最高优先级的剩余优先级中的当前最高优先级;
第二主节点确定单元,用于将所述当前最高优先级对应的所述目标节点确定为新的主节点。
在一些具体实施例中,所述报文信息发送模块13,具体包括:
报文信息发送单元,用于通过所述主节点向所述目标节点组中的目标节点发送包含第一源地址与第一目的地址的预设报文信息,以便所述目标节点在接收到所述预设报文信息后返回包含第二源地址、第二目的地址、报文信息接收时间以及响应信息发送时间的响应信息;其中,所述目标节点为所述目标节点组中不包含所述主节点的剩余节点。
在一些具体实施例中,所述时延确定模块14,具体包括:
响应信息接收单元,用于接收所述响应信息;
目标时延确定单元,用于基于所述响应信息确定所述目标节点对应的目标时延。
在一些具体实施例中,所述时延判断模块15,具体包括:
时延判断单元,用于判断所述目标时延是否大于预设时延阈值;
报警单元,用于若所述目标时延大于所述预设时延阈值则报警。
进一步的,本申请实施例还提供了一种电子设备。图6是根据一示例性实施例示出的电子设备20结构图,图中的内容不能认为是对本申请的使用范围的任何限制。
图6为本申请实施例提供的一种电子设备20的结构示意图。该电子设备20,具体可以包括:至少一个处理器21、至少一个存储器22、电源23、通信接口24、输入输出接口25和通信总线26。其中,所述存储器22用于存储计算机程序,所述计算机程序由所述处理器21加载并执行,以实现前述任一实施例公开的时延检测方法中的相关步骤。另外,本实施例中的电子设备20具体可以为电子计算机。
本实施例中,电源23用于为电子设备20上的各硬件设备提供工作电压;通信接口24能够为电子设备20创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进行具体限定;输入输出接口25,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。
另外,存储器22作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源可以包括操作系统221、计算机程序222等,存储方式可以是短暂存储或者永久存储。
其中,操作系统221用于管理与控制电子设备20上的各硬件设备以及计算机程序222,其可以是Windows Server、Netware、Unix、Linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的时延检测方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。
进一步的,本申请实施例还公开了一种存储介质,所述存储介质中存储有计算机程序,所述计算机程序被处理器加载并执行时,实现前述任一实施例公开的时延检测方法步骤。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的一种时延检测方法、装置、设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种时延检测方法,其特征在于,应用于分布式存储集群,包括:
获取目标存储池对应的目标节点组的全部节点,并基于预设主节点确定规则从所述目标节点组的全部节点中确定主节点;
通过主节点向所述目标节点组中的目标节点发送预设报文信息,以便所述目标节点在接收到所述预设报文信息后返回对应的响应信息;
接收所述响应信息并基于所述响应信息确定所述目标节点对应的目标时延;
判断所述目标时延是否大于预设时延阈值,若所述目标时延大于所述预设时延阈值则报警。
2.根据权利要求1所述的时延检测方法,其特征在于,所述获取目标存储池对应的目标节点组中的全部节点之前,还包括:
统计所述分布式存储集群中存储池的数量、每个所述存储池中的全部节点以及每个节点的管理网络对应的网段信息;
基于所述存储池的数量将所述分布式存储集群的全部节点划分为不同的节点组;其中,每个所述节点组包含一个所述存储池中的全部节点;
将全部所述节点组的信息存储至预设存储区域。
3.根据权利要求2所述的时延检测方法,其特征在于,所述获取目标存储池对应的目标节点组中的全部节点,基于预设主节点确定规则从全部所述节点中确定主节点,包括:
从全部所述节点组中确定目标节点组,并获取所述目标节点组的全部节点;
按照预设排序规则对所述目标节点组的全部节点进行排序,以得到节点排序表;
按照预设顺序依次为所述节点排序表的全部节点设置对应且不同的优先级,以得到节点优先级表;
将最高优先级对应的节点确定为所述主节点。
4.根据权利要求3所述的时延检测方法,其特征在于,所述基于预设主节点确定规则从所述目标节点组的全部节点中确定主节点之后,还包括:
若所述主节点故障,则获取所述节点优先级表;
确定所述节点优先级表中不包含所述最高优先级的剩余优先级中的当前最高优先级;
将所述当前最高优先级对应的所述目标节点确定为新的主节点。
5.根据权利要求2所述的时延检测方法,其特征在于,所述将全部所述节点组的信息存储至预设存储区域之后,还包括:
若所述目标存储池扩容并添加扩容节点,则在所述扩容节点上开启网口时延检测客户端程序;
将所述扩容节点对应的扩容节点信息更新至所述预设存储区域中与所述目标存储池对应的节点组。
6.根据权利要求2所述的时延检测方法,其特征在于,所述将全部所述节点组的信息存储至预设存储区域之后,还包括:
若所述目标存储池缩容并删除缩容节点,则在所述缩容节点上关闭所述网口时延检测客户端程序;
将所述缩容节点对应的缩容节点信息从所述预设存储区域中与所述目标存储池对应的节点组内删除。
7.根据权利要求1至6任一项所述的时延检测方法,其特征在于,所述通过主节点向所述目标节点组中的目标节点发送预设报文信息,以便所述目标节点在接收到所述预设报文信息后返回对应的响应信息,包括:
通过所述主节点向所述目标节点组中的目标节点发送包含第一源地址与第一目的地址的预设报文信息,以便所述目标节点在接收到所述预设报文信息后返回包含第二源地址、第二目的地址、报文信息接收时间以及响应信息发送时间的响应信息;其中,所述目标节点为所述目标节点组中不包含所述主节点的剩余节点。
8.一种时延检测装置,其特征在于,应用于分布式存储集群,包括:
节点获取模块,用于获取目标存储池对应的目标节点组的全部节点;
主节点确定模块,用于基于预设主节点确定规则从所述目标节点组的全部节点中确定主节点;
报文信息发送模块,用于通过主节点向所述目标节点组中的目标节点发送预设报文信息,以便所述目标节点在接收到所述预设报文信息后返回对应的响应信息;
时延确定模块,用于接收所述响应信息并基于所述响应信息确定所述目标节点对应的目标时延;
时延判断模块,用于判断所述目标时延是否大于预设时延阈值,若所述目标时延大于所述预设时延阈值则报警。
9.一种电子设备,其特征在于,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序,以实现如权利要求1至7任一项所述的时延检测方法的步骤。
10.一种计算机可读存储介质,其特征在于,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的时延检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210753289.9A CN115118635B (zh) | 2022-06-29 | 2022-06-29 | 一种时延检测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210753289.9A CN115118635B (zh) | 2022-06-29 | 2022-06-29 | 一种时延检测方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115118635A true CN115118635A (zh) | 2022-09-27 |
CN115118635B CN115118635B (zh) | 2024-08-20 |
Family
ID=83330141
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210753289.9A Active CN115118635B (zh) | 2022-06-29 | 2022-06-29 | 一种时延检测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115118635B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115914038A (zh) * | 2022-11-11 | 2023-04-04 | 中国联合网络通信集团有限公司 | 劣化转发设备检测方法、装置、设备及存储介质 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150199141A1 (en) * | 2014-01-14 | 2015-07-16 | Netapp, Inc. | Method and system for monitoring and analyzing quality of service in a metro-cluster |
CN109379247A (zh) * | 2018-09-27 | 2019-02-22 | 腾讯科技(深圳)有限公司 | 一种对应用程序的网络延时进行检测的方法及装置 |
CN111884870A (zh) * | 2020-06-28 | 2020-11-03 | 苏州浪潮智能科技有限公司 | 一种预测网络亚健康状态的方法、装置、终端及存储介质 |
CN112152872A (zh) * | 2020-08-31 | 2020-12-29 | 新华三大数据技术有限公司 | 一种网络亚健康检测方法及装置 |
CN112764993A (zh) * | 2021-01-22 | 2021-05-07 | 苏州浪潮智能科技有限公司 | 一种节点信息收集方法、装置、设备及可读存储介质 |
CN112787877A (zh) * | 2019-11-07 | 2021-05-11 | 华为技术有限公司 | 一种网络时延检测方法及相关设备 |
CN113132160A (zh) * | 2021-04-08 | 2021-07-16 | 山东英信计算机技术有限公司 | 一种客户端节点的网络亚健康状态的检测方法和系统 |
CN113890816A (zh) * | 2021-11-19 | 2022-01-04 | 深信服科技股份有限公司 | 网络健康状态分析方法、装置、计算机设备和存储介质 |
CN114285729A (zh) * | 2021-11-29 | 2022-04-05 | 苏州浪潮智能科技有限公司 | 分布式集群管理节点部署方法、装置、设备及存储介质 |
US20220107848A1 (en) * | 2019-06-15 | 2022-04-07 | Huawei Technologies Co., Ltd. | Edge service providing method and apparatus, and device |
CN114301813A (zh) * | 2021-12-24 | 2022-04-08 | 锐捷网络股份有限公司 | 一种ping检测的时延测量方法及装置 |
CN114531373A (zh) * | 2022-02-25 | 2022-05-24 | 苏州浪潮智能科技有限公司 | 节点状态检测方法、节点状态检测装置、设备及介质 |
-
2022
- 2022-06-29 CN CN202210753289.9A patent/CN115118635B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150199141A1 (en) * | 2014-01-14 | 2015-07-16 | Netapp, Inc. | Method and system for monitoring and analyzing quality of service in a metro-cluster |
CN109379247A (zh) * | 2018-09-27 | 2019-02-22 | 腾讯科技(深圳)有限公司 | 一种对应用程序的网络延时进行检测的方法及装置 |
US20220107848A1 (en) * | 2019-06-15 | 2022-04-07 | Huawei Technologies Co., Ltd. | Edge service providing method and apparatus, and device |
CN112787877A (zh) * | 2019-11-07 | 2021-05-11 | 华为技术有限公司 | 一种网络时延检测方法及相关设备 |
CN111884870A (zh) * | 2020-06-28 | 2020-11-03 | 苏州浪潮智能科技有限公司 | 一种预测网络亚健康状态的方法、装置、终端及存储介质 |
CN112152872A (zh) * | 2020-08-31 | 2020-12-29 | 新华三大数据技术有限公司 | 一种网络亚健康检测方法及装置 |
CN112764993A (zh) * | 2021-01-22 | 2021-05-07 | 苏州浪潮智能科技有限公司 | 一种节点信息收集方法、装置、设备及可读存储介质 |
CN113132160A (zh) * | 2021-04-08 | 2021-07-16 | 山东英信计算机技术有限公司 | 一种客户端节点的网络亚健康状态的检测方法和系统 |
CN113890816A (zh) * | 2021-11-19 | 2022-01-04 | 深信服科技股份有限公司 | 网络健康状态分析方法、装置、计算机设备和存储介质 |
CN114285729A (zh) * | 2021-11-29 | 2022-04-05 | 苏州浪潮智能科技有限公司 | 分布式集群管理节点部署方法、装置、设备及存储介质 |
CN114301813A (zh) * | 2021-12-24 | 2022-04-08 | 锐捷网络股份有限公司 | 一种ping检测的时延测量方法及装置 |
CN114531373A (zh) * | 2022-02-25 | 2022-05-24 | 苏州浪潮智能科技有限公司 | 节点状态检测方法、节点状态检测装置、设备及介质 |
Non-Patent Citations (2)
Title |
---|
XIWEI LIU; WENWEN CHEN: "Cluster synchronization of complex networks with unbounded time-varying delays", 2016 35TH CHINESE CONTROL CONFERENCE (CCC), 29 August 2016 (2016-08-29) * |
夏文忠;邹雯奇;: "基于X86平台的高性能数据库集群技术的研究", 微型机与应用, no. 01 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115914038A (zh) * | 2022-11-11 | 2023-04-04 | 中国联合网络通信集团有限公司 | 劣化转发设备检测方法、装置、设备及存储介质 |
CN115914038B (zh) * | 2022-11-11 | 2024-04-09 | 中国联合网络通信集团有限公司 | 劣化转发设备检测方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115118635B (zh) | 2024-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9246777B2 (en) | Computer program and monitoring apparatus | |
JPH09186688A (ja) | 改善されたノードディスカバリ及び監視付きネットワーク管理システム | |
JPH11338836A (ja) | コンピュータネットワークの負荷分散システム | |
CN106656682A (zh) | 集群心跳检测方法、系统及装置 | |
CN116418876A (zh) | 一种算力网络服务的迁移方法、系统及云管理平台 | |
CN107612772B (zh) | 支付系统的节点状态探测方法及装置 | |
CN115118635A (zh) | 一种时延检测方法、装置、设备及存储介质 | |
CN108769118A (zh) | 一种分布式系统中主节点的选取方法及装置 | |
CN117492944A (zh) | 任务调度方法、装置、电子设备及可读存储介质 | |
CN113949649B (zh) | 故障检测协议的部署方法、装置、电子设备及存储介质 | |
EP2645625B1 (en) | Computer system and subsystem management method | |
CN117081983B (zh) | 数据传输方法及装置 | |
EP3570169A1 (en) | Method and system for processing device failure | |
CN107426012B (zh) | 一种基于超融合架构的故障恢复方法及其装置 | |
CN113300914A (zh) | 网络质量监测方法、装置、系统、电子设备和存储介质 | |
CN110830284A (zh) | 一种基于sdn网络的业务故障监测的方法和装置 | |
CN113055203B (zh) | Sdn控制平面的异常恢复方法及装置 | |
JP4309321B2 (ja) | ネットワークシステムの運用管理方法及びストレージ装置 | |
CN112468400A (zh) | 一种故障定位方法、装置、设备和介质 | |
CN109688011B (zh) | 一种基于OpenStack的agent选择方法及装置 | |
CN110109933B (zh) | 信息维护方法、配置管理数据库系统及存储介质 | |
CN116800686A (zh) | 负载均衡的流量分配方法、系统、设备及存储介质 | |
US11595292B2 (en) | Dynamic node cluster discovery in an unknown topology graph | |
EP3424182B1 (en) | Neighbor monitoring in a hyperscaled environment | |
US20240291740A1 (en) | Cause inference regarding network trouble |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |