CN115103006A - 分布式存储集群场景下心跳消息发送方法及其相关组件 - Google Patents

分布式存储集群场景下心跳消息发送方法及其相关组件 Download PDF

Info

Publication number
CN115103006A
CN115103006A CN202210831370.4A CN202210831370A CN115103006A CN 115103006 A CN115103006 A CN 115103006A CN 202210831370 A CN202210831370 A CN 202210831370A CN 115103006 A CN115103006 A CN 115103006A
Authority
CN
China
Prior art keywords
target
sending
cluster
receiving node
heartbeat message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210831370.4A
Other languages
English (en)
Inventor
吴双艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Jinan data Technology Co ltd
Original Assignee
Inspur Jinan data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Jinan data Technology Co ltd filed Critical Inspur Jinan data Technology Co ltd
Priority to CN202210831370.4A priority Critical patent/CN115103006A/zh
Publication of CN115103006A publication Critical patent/CN115103006A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/14Session management
    • H04L67/143Termination or inactivation of sessions, e.g. event-controlled end of session
    • H04L67/145Termination or inactivation of sessions, e.g. event-controlled end of session avoiding end of session, e.g. keep-alive, heartbeats, resumption message or wake-up for inactive or interrupted session
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • Computer And Data Communications (AREA)

Abstract

本申请公开了一种分布式存储集群场景下心跳消息发送方法、装置、设备及介质,应用于分布式存储集群中的目标集群琐碎数据库发送节点,涉及计算机技术领域,该方法包括:确定目标集群琐碎数据库接收节点,并基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点,以便当所述目标集群琐碎数据库接收节点接收到所述目标心跳消息时,生成对应的回复消息;判断是否获取到所述目标集群琐碎数据库接收节点返回的所述回复消息;若否则重新跳转至所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,直至满足预设条件为止。通过上述方法,能够降低集群琐碎数据库接收节点被误判为发生故障的概率。

Description

分布式存储集群场景下心跳消息发送方法及其相关组件
技术领域
本发明涉及计算机技术领域,特别涉及分布式存储集群场景下心跳消息发送方法、装置、设备及介质。
背景技术
在分布式存储系统中,往往运行着较多的服务,实际环境经常出现某些突发的情况,比如网络波动,服务崩溃等,造成服务不可用,存储集群需要面对这些突发的情况,快速做出反应,减少对客户业务的影响。CTDB(Cluster Trivial Database,即集群琐碎数据库)在存储集群中就承担着重要角色。集群琐碎数据库可以监控服务的运行状态,在服务发生故障等情况下,可以在5s的检测周期内发现,并拉起服务。同时,集群琐碎数据库也会监控存储集群的网卡状态,当网络发生异常的时候,也会进行相应的处理,减少因网络问题对存储集群性能、业务等的影响。
集群琐碎数据库现有的机制中,集群琐碎数据库中的发送节点通过向分布式存储集群中的其他接收节点发送心跳消息,判断其他接收节点是否正常。若接收节点在心跳周期内不能收到某个发送节点的心跳消息,则认为该接收节点出现了故障,那么集群琐碎数据库中的主节点需要进行相应的故障处理,例如将虚拟IP(Internet Protocol,即网络之间互连的协议)切换到正常的节点上,减少网络对分布式存储集群业务的影响。但该机制在网络波动的情况下,会存在网络丢包的情况。当网络中丢包时,集群琐碎数据库存在误认为节点故障的情况,使得主节点进行不必要的故障处理,并且还可能因此出现分布式存储集群“脑裂”问题。
综上可见,如何降低集群琐碎数据库接收节点被误判为发生故障的概率是本领域有待解决的问题。
发明内容
有鉴于此,本发明的目的在于提供一种分布式存储集群场景下心跳消息发送方法、装置、设备及介质,能够降低集群琐碎数据库接收节点被误判为发生故障的概率。其具体方案如下:
第一方面,本申请公开了一种分布式存储集群场景下心跳消息发送方法,应用于分布式存储集群中的目标集群琐碎数据库发送节点,包括:
确定目标集群琐碎数据库接收节点,并基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点,以便当所述目标集群琐碎数据库接收节点接收到所述目标心跳消息时,生成对应的回复消息;
判断是否获取到所述目标集群琐碎数据库接收节点返回的所述回复消息;
若否则重新跳转至所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,直至满足预设条件为止。
可选的,所述确定目标集群琐碎数据库接收节点,并基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点,包括:
判断当前时刻是否满足预设发送心跳消息条件,若满足则确定目标集群琐碎数据库接收节点,并基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点。
可选的,所述判断当前时刻是否满足预设发送心跳消息条件,若满足则确定目标集群琐碎数据库接收节点,包括:
判断当前时刻是否存在其他集群琐碎数据库发送节点向其他集群琐碎数据库接收节点发送心跳消息,若不存在则确定出目标集群琐碎数据库接收节点。
可选的,所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点,以便当所述目标集群琐碎数据库接收节点接收到所述目标心跳消息时,生成对应的回复消息,包括:
基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点,以便当所述目标集群琐碎数据库接收节点接收到目标心跳消息时,基于预设回复消息生成规则,生成与所述目标心跳消息对应的回复消息。
可选的,所述判断是否获取到所述目标集群琐碎数据库接收节点返回的所述回复消息之后,还包括:
若判定获取到所述回复消息,则停止向所述目标集群琐碎数据库接收节点发送所述目标心跳消息。
可选的,所述若否则重新跳转至所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,直至满足预设条件为止,包括:
重新跳转至所述向所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,并记录所述目标心跳消息的发送总次数,直至所述发送总次数满足预设发送次数阈值为止。
可选的,所述若否则重新跳转至所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,直至满足预设条件为止,包括:
重新跳转至所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,直至获取到所述回复消息为止。
第二方面,本申请公开了一种分布式存储集群场景下心跳消息发送装置,应用于分布式存储集群中的目标集群琐碎数据库发送节点,包括:
心跳消息发送模块,用于确定目标集群琐碎数据库接收节点,并基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点,以便当所述目标集群琐碎数据库接收节点接收到所述目标心跳消息时,生成对应的回复消息;
判断模块,用于判断是否获取到所述目标集群琐碎数据库接收节点返回的所述回复消息;
停止发送模块,用于若否则重新跳转至所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,直至满足预设条件为止。
第三方面,本申请公开了一种电子设备,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序,以实现前述公开的分布式存储集群场景下心跳消息发送方法的步骤。
第四方面,本申请公开了一种计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的分布式存储集群场景下心跳消息发送方法的步骤。
可见,本申请确定目标集群琐碎数据库接收节点,并基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点,以便当所述目标集群琐碎数据库接收节点接收到所述目标心跳消息时,生成对应的回复消息;判断是否获取到所述目标集群琐碎数据库接收节点返回的所述回复消息;若否则重新跳转至所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,直至满足预设条件为止。由此可见,分布式存储集群中的目标集群琐碎数据库发送节点基于samba共享传输协议发送目标心跳消息至目标集群琐碎数据库接收节点,当判定出未收到目标集群琐碎数据库接收节点返回的回复消息时,再次向目标集群琐碎数据库接收节点发送目标心跳消息,直至满足预设条件为止,因此如果当前因为网络波动,而非目标集群琐碎数据库接收节点发生故障导致未收到回复消息,通过本申请多次向目标集群琐碎数据库接收节点发送目标心跳消息后,目标集群琐碎数据库发送节点收到了回复消息,那么则可以判定当前处于网络波动,即降低了集群琐碎数据库接收节点被误判为发生故障的概率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请公开的一种分布式存储集群场景下心跳消息发送方法流程图;
图2为本申请公开的一种具体的脑裂示意图;
图3为本申请公开的一种分布式存储集群场景下心跳消息发送方法流程图;
图4为本申请公开的一种分布式存储集群场景下心跳消息发送方法流程图;
图5为本申请公开的一种分布式存储集群场景下心跳消息发送装置结构示意图;
图6为本申请公开的一种电子设备结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
集群琐碎数据库现有的机制中,集群琐碎数据库中的发送节点通过向分布式存储集群中的其他接收节点发送心跳消息,判断其他接收节点是否正常。若接收节点在心跳周期内不能收到某个发送节点的心跳消息,则认为该接收节点出现了故障,那么集群琐碎数据库中的主节点需要进行相应的故障处理,例如将虚拟IP切换到正常的节点上,减少网络对分布式存储集群业务的影响。但该机制在网络波动的情况下,会存在网络丢包的情况。当网络中丢包时,集群琐碎数据库存在误认为节点故障的情况,使得主节点进行不必要的故障处理,并且还可能因此出现分布式存储集群“脑裂”问题。
为此本申请相应的提供了一种分布式存储集群场景下心跳消息发送方案,能够降低集群琐碎数据库接收节点被误判为发生故障的概率。
参见图1所示,本申请实施例公开了一种分布式存储集群场景下心跳消息发送方法,应用于分布式存储集群中的目标集群琐碎数据库发送节点,包括:
步骤S11:确定目标集群琐碎数据库接收节点,并基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点,以便当所述目标集群琐碎数据库接收节点接收到所述目标心跳消息时,生成对应的回复消息。
本实施例中,基于samba共享传输协议发送目标心跳消息至目标集群琐碎数据库接收节点,其中,samba共享传输协议为实现SMB(Server Message Block)协议,用于从Linux服务端向Windows客户端提供共享服务的应用,集群琐碎数据库(Cluster TrivialDatabase,即CTDB)是一个集群TDB(临时数据库)数据库,可以被Samba或者其他的应用使用来存储数据,也是Samba3/4的一个核心组件。
步骤S12:判断是否获取到所述目标集群琐碎数据库接收节点返回的所述回复消息。
本实施例中,判断是否获取到目标集群琐碎数据库接收节点返回的回复消息,如果获取到目标集群琐碎数据库接收节点返回的回复消息,则说明当前目标集群琐碎数据库接收节点未出现故障或者未出现网络波动。
步骤S13:若否则重新跳转至所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,直至满足预设条件为止。
本实施例中,如果未获取到目标集群琐碎数据库接收节点返回的回复消息,则说明当前目标集群琐碎数据库接收节点出现故障或者出现网络波动,为了避免将当前未收到回复消息的原因为网络波动误判为当前目标集群琐碎数据库接收节点出现故障,所以本实施例当前再次向目标集群琐碎数据库接收节点发送目标心跳消息,如果当前未收到回复消息的原因为网络波动,那么基于samba共享传输协议多次发送目标心跳消息,就可以收到目标集群琐碎数据库接收节点返回的回复消息,进而避免了当前未收到回复消息的原因误被判的情况,也使得目标集群琐碎数据库中的主节点避免进行不必要的故障处理。
本实施例中,如图2所示的一种具体的脑裂示意图,需要注意的是,在集群琐碎数据库中当存在两个小集群琐碎数据库中存在共同节点的情况时,被称为“脑裂”,即节点0、1、2、3是相互连接形成一个小集群琐碎数据库1,节点3、4、5、6相互连接形成一个小集群琐碎数据库2,其中节点3为小集群琐碎数据库1和小集群琐碎数据库2之间的共同节点,如果出现上述情况,小集群琐碎数据库1中会选出主节点,暂定为1,则节点0、2、3中保存的主节点均为1;小集群琐碎数据库2会选出一个主节点,暂定为4,则节点3、5、6中保存的主节点为4,此时节点3上的主节点被修改为4,若小集群琐碎数据库1的主节点1发现节点3上所记录的主节点不是1,则会重新触发选举,并将记录节点3的culprit_count++,选举成功后,节点3上所记录的主节点又被修改为1,而小集群琐碎数据库2中的主节点4又会发现节点3上记录的主节点不是4,而重新发起选举……以此类推,频繁如此下去,集群琐碎数据库节点的状态会频繁的变成不正常,不能持有虚拟IP,从而影响集群的正常运行和客户端的业务。在分配小集群琐碎数据库1时,向节点3告知节点3被划分为小集群琐碎数据库1中,但是在分配小集群琐碎数据库2时,可能由于网络波动或者节点3出现故障,无法收到节点3返回的回复消息,导致误认为节点3当前未被划分,所以就像节点3告知节点3被划分为小集群琐碎数据库2中,所以就出现了节点3既属于小集群琐碎数据库1,又属于小集群琐碎数据库2。本实施例在未收到节点3返回的回复消息时,需要多次向节点3发送目标心跳消息,直至满足预设条件,即避免武断的判定节点3的当前情况,降低误判概率,进而有效避免脑裂情况的发生。
可见,本申请确定目标集群琐碎数据库接收节点,并基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点,以便当所述目标集群琐碎数据库接收节点接收到所述目标心跳消息时,生成对应的回复消息;判断是否获取到所述目标集群琐碎数据库接收节点返回的所述回复消息;若否则重新跳转至所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,直至满足预设条件为止。由此可见,分布式存储集群中的目标集群琐碎数据库发送节点基于samba共享传输协议发送目标心跳消息至目标集群琐碎数据库接收节点,当判定出未收到目标集群琐碎数据库接收节点返回的回复消息时,再次向目标集群琐碎数据库接收节点发送目标心跳消息,直至满足预设条件为止,因此如果当前因为网络波动,而非目标集群琐碎数据库接收节点发生故障导致未收到回复消息,通过本申请多次向目标集群琐碎数据库接收节点发送目标心跳消息后,目标集群琐碎数据库发送节点收到了回复消息,那么则可以判定当前处于网络波动,即降低了集群琐碎数据库接收节点被误判为发生故障的概率。
本申请实施例公开了一种具体的分布式存储集群场景下心跳消息发送方法,应用于分布式存储集群中的目标集群琐碎数据库发送节点,相对于上一实施例,本实施例对技术方案作了进一步的说明和优化。参见图3所示,具体包括:
步骤S21:判断当前时刻是否满足预设发送心跳消息条件,若满足则确定目标集群琐碎数据库接收节点,并基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点,以便当所述目标集群琐碎数据库接收节点接收到所述目标心跳消息时,生成对应的回复消息。
本实施例中,所述判断当前时刻是否满足预设发送心跳消息条件,若满足则确定目标集群琐碎数据库接收节点,具体包括:判断当前时刻是否存在其他集群琐碎数据库发送节点向其他集群琐碎数据库接收节点发送心跳消息,若不存在则确定出目标集群琐碎数据库接收节点。可以理解的是,集群琐碎数据库发送节点间每秒都会发送心跳消息至集群琐碎数据库接收节点,且每秒只向一个集群琐碎数据库接收节点发送一个心跳消息,所以当目标集群琐碎数据库发送节点1发送心跳消息时,需要判断当前时刻是否满足预设发送心跳消息条件,即判断当前时刻是否存在其他集群琐碎数据库发送节点向其他集群琐碎数据库接收节点发送心跳消息,若不存在则确定出目标集群琐碎数据库接收节点3,并基于samba共享传输协议发送目标心跳消息至目标集群琐碎数据库接收节点3。
本实施例中,所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点,以便当所述目标集群琐碎数据库接收节点接收到所述目标心跳消息时,生成对应的回复消息,具体包括:基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点,以便当所述目标集群琐碎数据库接收节点接收到目标心跳消息时,基于预设回复消息生成规则,生成与所述目标心跳消息对应的回复消息。可以理解的是,如果目标集群琐碎数据库接收节点接收到目标心跳消息,则利用预设回复消息生成规则生成与目标心跳消息对应的回复消息,如果目标集群琐碎数据库接收节点未接收到目标心跳消息,则无法生成回复消息。
步骤S22:判断是否获取到所述目标集群琐碎数据库接收节点返回的所述回复消息。
其中,关于上述步骤S22更加具体的工作过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
步骤S23:若否则重新跳转至所述向所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,并记录所述目标心跳消息的发送总次数,直至所述发送总次数满足预设发送次数阈值为止。
本实施例中,需要注意的是,为了避免当前一直未收到目标集群琐碎数据库接收节点的回复消息,因此一直处于重新跳转至所述向所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,使得可能耽误其他相关流程的处理,并且即使当前为网络波动,但是多次发送后可以收到回复消息,所以本实施例可以设定一个预设发送次数阈值,例如预设发送次数阈值为10,如果当前发送总次数为5,则可以重新跳转至所述向所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,如果当前发送总次数为10,则不能重新跳转至所述向所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,并且可以判定当前未收到回复消息的原因为目标集群琐碎数据库接收节点发生故障,以便进行后续相关处理。
由此可见,本申请能够有效避免误判当前未收到回复消息的原因的情况,即降低误判概率,如果当前未收到回复消息的原因为目标集群琐碎数据库接收节点发生故障,那么设置预设发送次数阈值,当发送总次数满足预设发送次数阈值,则不再进行重新发送,使得即使当前未收到对应的回复消息,也可以停止重新发送目标心跳消息至目标集群琐碎数据库接收节点,以便进行后续相关处理工作。
本申请实施例公开了一种具体的分布式存储集群场景下心跳消息发送方法,应用于分布式存储集群中的目标集群琐碎数据库发送节点。参见图4所示,具体包括:
步骤S31:确定目标集群琐碎数据库接收节点,并基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点,以便当所述目标集群琐碎数据库接收节点接收到所述目标心跳消息时,生成对应的回复消息。
步骤S32:判断是否获取到所述目标集群琐碎数据库接收节点返回的所述回复消息。
本实施例中,所述判断是否获取到所述目标集群琐碎数据库接收节点返回的所述回复消息之后,还包括:若判定获取到所述回复消息,则停止向所述目标集群琐碎数据库接收节点发送所述目标心跳消息。
步骤S33:若否则重新跳转至所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,直至获取到所述回复消息为止。
本实施例中,重新跳转至所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,直至获取到回复消息为止,即如果当前的发送总次数为5,并收到了目标集群琐碎数据库接收节点返回的回复消息,则停止向目标集群琐碎数据库接收节点发送目标心跳消息。可以理解的是,也可以结合预设发送次数阈值进行处理,例如预设发送次数阈值为8,当前的发送总次数为7,并收到了目标集群琐碎数据库接收节点返回的回复消息,则可以停止向目标集群琐碎数据库接收节点发送目标心跳消息,无需进行下一次发送目标心跳消息。
由此可见,本申请如果当前未收到对应的回复消息,可以重新发送目标心跳消息,以防止是网络波动引起当前未收到回复消息,降低未收到回复消息的原因被误判的概率。
参见图5所示,本申请实施例公开了一种分布式存储集群场景下心跳消息发送装置,应用于分布式存储集群中的目标集群琐碎数据库发送节点,包括:
心跳消息发送模块11,用于确定目标集群琐碎数据库接收节点,并基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点,以便当所述目标集群琐碎数据库接收节点接收到所述目标心跳消息时,生成对应的回复消息;
判断模块12,用于判断是否获取到所述目标集群琐碎数据库接收节点返回的所述回复消息;
停止发送模块13,用于若否则重新跳转至所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,直至满足预设条件为止。
可见,本申请确定目标集群琐碎数据库接收节点,并基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点,以便当所述目标集群琐碎数据库接收节点接收到所述目标心跳消息时,生成对应的回复消息;判断是否获取到所述目标集群琐碎数据库接收节点返回的所述回复消息;若否则重新跳转至所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,直至满足预设条件为止。由此可见,分布式存储集群中的目标集群琐碎数据库发送节点基于samba共享传输协议发送目标心跳消息至目标集群琐碎数据库接收节点,当判定出未收到目标集群琐碎数据库接收节点返回的回复消息时,再次向目标集群琐碎数据库接收节点发送目标心跳消息,直至满足预设条件为止,因此如果当前因为网络波动,而非目标集群琐碎数据库接收节点发生故障导致未收到回复消息,通过本申请多次向目标集群琐碎数据库接收节点发送目标心跳消息后,目标集群琐碎数据库发送节点收到了回复消息,那么则可以判定当前处于网络波动,即降低了集群琐碎数据库接收节点被误判为发生故障的概率。
在一些具体实施例中,所述心跳消息发送模块11,包括:
消息发送单元,用于判断当前时刻是否满足预设发送心跳消息条件,若满足则确定目标集群琐碎数据库接收节点,并基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点。
在一些具体实施例中,所述消息发送单元,包括:
接收节点确定单元,用于判断当前时刻是否存在其他集群琐碎数据库发送节点向其他集群琐碎数据库接收节点发送心跳消息,若不存在则确定出目标集群琐碎数据库接收节点。
在一些具体实施例中,所述心跳消息发送模块11,包括:
回复消息生成单元,用于基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点,以便当所述目标集群琐碎数据库接收节点接收到目标心跳消息时,基于预设回复消息生成规则,生成与所述目标心跳消息对应的回复消息。
在一些具体实施例中,所述分布式存储集群场景下心跳消息发送装置,还包括:
第一停止单元,用于若判定获取到所述回复消息,则停止向所述目标集群琐碎数据库接收节点发送所述目标心跳消息。
在一些具体实施例中,所述停止发送模块13,包括:
第二停止单元,用于重新跳转至所述向所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,并记录所述目标心跳消息的发送总次数,直至所述发送总次数满足预设发送次数阈值为止。
在一些具体实施例中,所述停止发送模块13,包括:
第三停止单元,用于重新跳转至所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,直至获取到所述回复消息为止。
图6为本申请实施例提供的一种电子设备的结构示意图。具体可以包括:至少一个处理器21、至少一个存储器22、电源23、通信接口24、输入输出接口25和通信总线26。其中,所述存储器22用于存储计算机程序,所述计算机程序由所述处理器21加载并执行,以实现以下步骤:
确定目标集群琐碎数据库接收节点,并基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点,以便当所述目标集群琐碎数据库接收节点接收到所述目标心跳消息时,生成对应的回复消息;
判断是否获取到所述目标集群琐碎数据库接收节点返回的所述回复消息;
若否则重新跳转至所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,直至满足预设条件为止。
在一些具体实施方式中,所述处理器通过执行所述存储器中保存的计算机程序,具体可以实现以下步骤:
判断当前时刻是否满足预设发送心跳消息条件,若满足则确定目标集群琐碎数据库接收节点,并基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点。
在一些具体实施方式中,所述处理器通过执行所述存储器中保存的计算机程序,具体可以实现以下步骤:
判断当前时刻是否存在其他集群琐碎数据库发送节点向其他集群琐碎数据库接收节点发送心跳消息,若不存在则确定出目标集群琐碎数据库接收节点。
在一些具体实施方式中,所述处理器通过执行所述存储器中保存的计算机程序,具体可以实现以下步骤:
基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点,以便当所述目标集群琐碎数据库接收节点接收到目标心跳消息时,基于预设回复消息生成规则,生成与所述目标心跳消息对应的回复消息。
在一些具体实施方式中,所述处理器通过执行所述存储器中保存的计算机程序,具体可以实现以下步骤:
若判定获取到所述回复消息,则停止向所述目标集群琐碎数据库接收节点发送所述目标心跳消息。
在一些具体实施方式中,所述处理器通过执行所述存储器中保存的计算机程序,具体可以实现以下步骤:
重新跳转至所述向所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,并记录所述目标心跳消息的发送总次数,直至所述发送总次数满足预设发送次数阈值为止。
在一些具体实施方式中,所述处理器通过执行所述存储器中保存的计算机程序,还可以进一步包括以下步骤:
重新跳转至所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,直至获取到所述回复消息为止。
本实施例中,电源23用于为电子设备上的各硬件设备提供工作电压;通信接口24能够为电子设备创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进行具体限定;输入输出接口25,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。
其中,处理器21可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器21可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器21也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器21可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器21还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
另外,存储器22作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源包括操作系统221、计算机程序222及数据223等,存储方式可以是短暂存储或者永久存储。
其中,操作系统221用于管理与控制电子设备上的各硬件设备以及计算机程序222,以实现处理器21对存储器22中海量数据223的运算与处理,其可以是Windows、Unix、Linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备执行的分布式存储集群场景下心跳消息发送方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。数据223除了可以包括电子设备接收到的由外部设备传输进来的数据,也可以包括由自身输入输出接口25采集到的数据等。
进一步的,本申请实施例还公开了一种计算机可读存储介质,所述存储介质中存储有计算机程序,所述计算机程序被处理器加载并执行时,实现前述任一实施例公开的由分布式存储集群场景下心跳消息发送过程中执行的方法步骤。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的一种分布式存储集群场景下心跳消息发送方法、装置、设备及介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种分布式存储集群场景下心跳消息发送方法,其特征在于,应用于分布式存储集群中的目标集群琐碎数据库发送节点,包括:
确定目标集群琐碎数据库接收节点,并基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点,以便当所述目标集群琐碎数据库接收节点接收到所述目标心跳消息时,生成对应的回复消息;
判断是否获取到所述目标集群琐碎数据库接收节点返回的所述回复消息;
若否则重新跳转至所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,直至满足预设条件为止。
2.根据权利要求1所述的分布式存储集群场景下心跳消息发送方法,其特征在于,所述确定目标集群琐碎数据库接收节点,并基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点,包括:
判断当前时刻是否满足预设发送心跳消息条件,若满足则确定目标集群琐碎数据库接收节点,并基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点。
3.根据权利要求2所述的分布式存储集群场景下心跳消息发送方法,其特征在于,所述判断当前时刻是否满足预设发送心跳消息条件,若满足则确定目标集群琐碎数据库接收节点,包括:
判断当前时刻是否存在其他集群琐碎数据库发送节点向其他集群琐碎数据库接收节点发送心跳消息,若不存在则确定出目标集群琐碎数据库接收节点。
4.根据权利要求1所述的分布式存储集群场景下心跳消息发送方法,其特征在于,所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点,以便当所述目标集群琐碎数据库接收节点接收到所述目标心跳消息时,生成对应的回复消息,包括:
基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点,以便当所述目标集群琐碎数据库接收节点接收到目标心跳消息时,基于预设回复消息生成规则,生成与所述目标心跳消息对应的回复消息。
5.根据权利要求1至4任一项所述的分布式存储集群场景下心跳消息发送方法,其特征在于,所述判断是否获取到所述目标集群琐碎数据库接收节点返回的所述回复消息之后,还包括:
若判定获取到所述回复消息,则停止向所述目标集群琐碎数据库接收节点发送所述目标心跳消息。
6.根据权利要求1所述的分布式存储集群场景下心跳消息发送方法,其特征在于,所述若否则重新跳转至所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,直至满足预设条件为止,包括:
重新跳转至所述向所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,并记录所述目标心跳消息的发送总次数,直至所述发送总次数满足预设发送次数阈值为止。
7.根据权利要求1所述的分布式存储集群场景下心跳消息发送方法,其特征在于,所述若否则重新跳转至所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,直至满足预设条件为止,包括:
重新跳转至所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,直至获取到所述回复消息为止。
8.一种分布式存储集群场景下心跳消息发送装置,其特征在于,应用于分布式存储集群中的目标集群琐碎数据库发送节点,包括:
心跳消息发送模块,用于确定目标集群琐碎数据库接收节点,并基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点,以便当所述目标集群琐碎数据库接收节点接收到所述目标心跳消息时,生成对应的回复消息;
判断模块,用于判断是否获取到所述目标集群琐碎数据库接收节点返回的所述回复消息;
停止发送模块,用于若否则重新跳转至所述基于samba共享传输协议发送目标心跳消息至所述目标集群琐碎数据库接收节点的步骤,直至满足预设条件为止。
9.一种电子设备,其特征在于,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序,以实现如权利要求1至7任一项所述的分布式存储集群场景下心跳消息发送方法的步骤。
10.一种计算机可读存储介质,其特征在于,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的分布式存储集群场景下心跳消息发送方法的步骤。
CN202210831370.4A 2022-07-15 2022-07-15 分布式存储集群场景下心跳消息发送方法及其相关组件 Pending CN115103006A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210831370.4A CN115103006A (zh) 2022-07-15 2022-07-15 分布式存储集群场景下心跳消息发送方法及其相关组件

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210831370.4A CN115103006A (zh) 2022-07-15 2022-07-15 分布式存储集群场景下心跳消息发送方法及其相关组件

Publications (1)

Publication Number Publication Date
CN115103006A true CN115103006A (zh) 2022-09-23

Family

ID=83296234

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210831370.4A Pending CN115103006A (zh) 2022-07-15 2022-07-15 分布式存储集群场景下心跳消息发送方法及其相关组件

Country Status (1)

Country Link
CN (1) CN115103006A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101039313A (zh) * 2006-03-17 2007-09-19 广东省电信有限公司研究院 一种网络实体分别独立控制协议心跳的实现方法
CN102025474A (zh) * 2010-12-30 2011-04-20 北京佳讯飞鸿电气股份有限公司 一种网络数据传输方法
US20170116084A1 (en) * 2015-10-26 2017-04-27 Beijing Baidu Netcom Science And Technology, Ltd. Method and System for Monitoring Virtual Machine Cluster
CN113010337A (zh) * 2021-01-21 2021-06-22 腾讯科技(深圳)有限公司 故障检测方法、总控节点、工作节点及分布式系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101039313A (zh) * 2006-03-17 2007-09-19 广东省电信有限公司研究院 一种网络实体分别独立控制协议心跳的实现方法
CN102025474A (zh) * 2010-12-30 2011-04-20 北京佳讯飞鸿电气股份有限公司 一种网络数据传输方法
US20170116084A1 (en) * 2015-10-26 2017-04-27 Beijing Baidu Netcom Science And Technology, Ltd. Method and System for Monitoring Virtual Machine Cluster
CN113010337A (zh) * 2021-01-21 2021-06-22 腾讯科技(深圳)有限公司 故障检测方法、总控节点、工作节点及分布式系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王明;张春熹;伊小素;: "基于自适应心跳算法的分布式系统故障检测器", 北京航空航天大学学报, no. 07, 23 January 2013 (2013-01-23) *

Similar Documents

Publication Publication Date Title
CN113452774B (zh) 消息推送方法、装置、设备及存储介质
CN112769652B (zh) 一种节点服务监控方法、装置、设备及介质
CN112836152B (zh) 页面渲染方法、系统、计算机设备及计算机可读存储介质
CN111865632B (zh) 分布式数据存储集群的切换方法及切换指令发送方法和装置
CN112217847A (zh) 微服务平台及其实现方法、电子设备及存储介质
CN112583931A (zh) 消息处理方法、消息中间件、电子设备和存储介质
CN111835685B (zh) 一种监控Nginx网络隔离空间的运行状态的方法和服务器
CN114900449B (zh) 一种资源信息管理方法、系统及装置
CN105577480A (zh) 一种网络连接性能的监测方法及装置
WO2024169385A1 (zh) 一种集群部署方法、装置、设备、介质及产品
CN112994934B (zh) 数据交互方法、装置及系统
CN118193238A (zh) 一种业务信息的处理方法、装置、设备及存储介质
CN112217718A (zh) 一种业务处理方法、装置、设备及存储介质
US20200236165A1 (en) System and method for synchronization of media objects between devices operating in a multiroom system
CN110519337B (zh) 一种节点状态判断、采集方法及状态决策器、状态采集器
CN112463514A (zh) 分布式缓存集群的监测方法和装置
CN115103006A (zh) 分布式存储集群场景下心跳消息发送方法及其相关组件
CN111934909B (zh) 主备机ip资源切换方法、装置、计算机设备和存储介质
CN110933122A (zh) 管理服务器的方法、设备和计算机存储介质
CN112965831A (zh) 抑制数据反复平滑的方法及装置
CN111930587B (zh) 告警消息处理方法、装置、存储介质及电子设备
CN114945023B (zh) 一种网络连接复用方法、装置、设备及介质
CN112882853B (zh) 一种数据处理方法、装置及设备
CN115134217B (zh) 一种数据处理方法、装置、设备及存储介质
CN108959170B (zh) 虚拟设备管理方法、装置、堆叠系统及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination