CN114844799A - 一种集群管理方法、装置、主机设备及可读存储介质 - Google Patents

一种集群管理方法、装置、主机设备及可读存储介质 Download PDF

Info

Publication number
CN114844799A
CN114844799A CN202210591045.5A CN202210591045A CN114844799A CN 114844799 A CN114844799 A CN 114844799A CN 202210591045 A CN202210591045 A CN 202210591045A CN 114844799 A CN114844799 A CN 114844799A
Authority
CN
China
Prior art keywords
node
cluster
consistency
nodes
host
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210591045.5A
Other languages
English (en)
Inventor
蔺林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sangfor Technologies Co Ltd
Original Assignee
Sangfor Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sangfor Technologies Co Ltd filed Critical Sangfor Technologies Co Ltd
Priority to CN202210591045.5A priority Critical patent/CN114844799A/zh
Publication of CN114844799A publication Critical patent/CN114844799A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route

Abstract

本发明公开了一种集群管理方法、装置、主机设备及可读存储介质,应用于计算机集群技术领域,该方法包括:当前主机节点向集群中的一致性节点发送节点状态信息;其中,一致性节点为集群中基于分布式一致性协议通信连接的主机节点,接收一致性节点发送的集群状态信息;根据集群状态信息,获取集群的当前集群状态;本发明通过当前主机节点向集群中的一致性节点发送节点状态信息,可以利用集群中的一致性节点更新集群的主机的在线情况,从而使各主机节点能够及时了解集群中主机的在线情况;并且通过集群中的一致性节点的设置,能够便快速便捷的调整集群成员,实现对大规模集群进行便捷可靠的管理,保证高可用性,提升了用户体验。

Description

一种集群管理方法、装置、主机设备及可读存储介质
技术领域
本发明涉及计算机集群技术领域,特别涉及一种集群管理方法、装置、主机设备及可读存储介质。
背景技术
随着云计算技术的快速发展,计算机集群规模越来越大,其管理工作越来越复杂,对其职能要求也越来越高。以kubernetes(K8s,一种容器编排引擎)系统为例,控制平面需要了解集群中各个主机的在线情况,如了解集群中离线的主机,以将此主机上运行的服务,转移到其他可用主机上。
目前,现有的集群管理系统往往偏向于资源管理调度,并不具备高可用性,如kubernetes集群本身是一主多从的架构,原生没有高可用,也偏向于资源管理调度,并且集群中主机的在线状态依赖心跳机制,而控制平面单点故障时,整个管理面不可用。因此,如何能够对大规模集群进行便捷可靠的管理,保证高可用性,提升用户体验,实现急需解决的问题。
发明内容
本发明的目的是提供一种集群管理方法、装置、主机设备及可读存储介质,以对大规模集群进行便捷可靠的管理,保证高可用性,提升用户体验。
为解决上述技术问题,本发明提供一种集群管理方法,包括:
当前主机节点向集群中的一致性节点发送节点状态信息;其中,当前主机节点为所述集群中的任一主机节点,所述一致性节点为所述集群中基于分布式一致性协议通信连接的主机节点,所述一致性节点的数量小于所述主机节点的数量;
接收所述一致性节点发送的集群状态信息;
根据所述集群状态信息,获取所述集群的当前集群状态;其中,当前集群状态包括在线主机节点信息。
可选的,该方法还包括:
若当前主机节点为所述一致性节点,则利用本节点一致性组件,与其他一致性节点中的一致性组件进行通信交互,更新所述集群的当前集群状态;其中,所述本节点一致性组件为当前主机节点中的一致性组件,所述其他一致性节点为所述集群中当前主机节点之外的一致性节点;
对应的,所述当前主机节点向集群中的一致性节点发送节点状态信息,包括:
当前主机节点利用本节点代理组件向所述一致性组件发送所述节点状态信息;其中,所述本节点代理组件为当前主机节点中的代理组件;
可选的,该方法还包括:
若当前主机节点为所述一致性节点,则利用本节点代理组件,与其他一致性节点中的代理组件进行通信交互,更新所述集群的当前集群状态;其中,所述本节点代理组件为当前主机节点中的代理组件,所述代理组件中设置有分布式一致性协议,所述其他一致性节点为所述集群中当前主机节点之外的一致性节点;
对应的,所述当前主机节点向集群中的一致性节点发送节点状态信息,包括:
当前主机节点利用所述本节点代理组件获取所述节点状态信息;其中,所述本节点代理组件为当前主机节点中的代理组件。
可选的,所述节点状态信息包括心跳信息。
可选的,所述一致性节点的数量为大于或等于3的奇数。
可选的,该方法还包括:
若当前主机节点为所述一致性节点,则与其他一致性节点进行通信交互,从全部所述主机节点中选取出领导节点,以利用所述领导节点管理所述主机节点;其中,所述其他一致性节点为所述集群中当前主机节点之外的一致性节点,所述领导节点为任一所述主机节点。
可选的,该方法还包括:
若当前主机节点为所述领导节点,则在所述一致性节点中存在异常节点时,从目标节点中选取所述异常节点对应的主机节点作为所述一致性节点,以替换所述异常节点。
本发明还提供了一种集群管理装置,应用于集群中的主机节点,包括:
信息上报模块,用于向集群中的一致性节点发送节点状态信息;其中,当前主机节点为所述集群中的任一主机节点,所述一致性节点为所述集群中基于分布式一致性协议通信连接的主机节点,所述一致性节点的数量小于所述主机节点的数量;
接收模块,用于接收所述一致性节点发送的集群状态信息;
获取模块,用于根据所述集群状态信息,获取所述集群的当前集群状态;其中,当前集群状态包括在线主机节点信息。
本发明还提供了一种主机设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上述所述的集群管理方法的步骤。
此外,本发明还提供了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述的集群管理方法的步骤。
本发明所提供的一种集群管理方法,包括:当前主机节点向集群中的一致性节点发送节点状态信息;其中,当前主机节点为集群中的任一主机节点,一致性节点为集群中基于分布式一致性协议通信连接的主机节点,一致性节点的数量小于主机节点的数量;接收一致性节点发送的集群状态信息;根据集群状态信息,获取集群的当前集群状态;其中,当前集群状态包括在线主机节点信息。
可见,本发明通过当前主机节点向集群中的一致性节点发送节点状态信息,可以利用集群中的一致性节点更新集群的主机的在线情况,从而使各主机节点能够及时了解集群中主机的在线情况;并且通过集群中的一致性节点的设置,能够便快速便捷的调整集群成员,实现对大规模集群进行便捷可靠的管理,保证高可用性,提升了用户体验。此外,本发明还提供了一种集群管理装置、主机设备及可读存储介质,同样具有上述有益效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例所提供的一种集群管理方法的流程图;
图2为本发明实施例所提供的一种集群的结构示意图;
图3为本发明实施例所提供的一种代理组件的结构示意图;
图4为本发明实施例所提供的一种集群管理装置的结构框图;
图5为本发明实施例所提供的一种主机设备的结构示意图;
图6为本发明实施例所提供的一种主机设备的具体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明实施例所提供的一种集群管理方法的流程图。该方法可以包括:
步骤101:当前主机节点向集群中的一致性节点发送节点状态信息;其中,当前主机节点为集群中的任一主机节点,一致性节点为集群中基于分布式一致性协议通信连接的主机节点,一致性节点的数量小于主机节点的数量。
可以理解的是,本实施例中的当前主机节点可以为集群(即计算机集群)中的任一一个主机节点(即主机设备);本实施例中的一致性节点可以为集群中基于分布式一致性协议进行通信连接的主机节点(如图2中的一致性组件集群),以利用集群中一致性节点组成的一致性集群作为配置中心,提供全部主机节点对应的集群的集群状态信息,如各主机节点的在线情况。
具体的,本步骤中的节点状态信息可以为集群中的主机节点需要向一致性节点上报的信息。对于本实施例中的节点状态信息的具体内容和上报方式,可以由设计人员根据实用场景和用户需求自行设置,如节点状态信息可以包括心跳信息,以使一致性节点可以根据各主机节点发送的心跳信息,确定集群中的全部主机节点的在线状态;例如当前主机节点可以按预设时间间隔向一致性节点发送心跳信息,以定时更新在一致性节点中的在线状态,维护节点在线。节点状态信息还可以包括主机资源信息,如CPU(中央处理器)状态信息和内存状态信息等,以方便对集群中主机节点的管理。只要当前主机节点可以通过向集群中的一致性节点发送节点状态信息,上报自身的在线状态,本实施例对此不做任何限制。
需要说明的是,对于本步骤中的当前主机节点向集群中的一致性节点发送节点状态信息的具体方式,可以由设计人员自行设置,如图2所示,一致性节点利用各自的基于分布式一致性协议的一致性组件进行通信连接时,当前主机节点可以利用本节点代理组件向一致性组件发送节点状态信息;其中,本节点代理组件为当前主机节点中的代理组件(Agent);也就是说,集群中的各主机节点可以利用各自对应的代理组件向各自对应的一致性节点中的代理组件上报各自的节点状态信息,以使一致性节点可以利用一致性组件更新集群的当前集群状态;如图3所示,各主机节点可以利用一致性组件中的信息上报模块向一致性组件发送节点状态信息,以维护节点在线;例如当前主机节点为任一一致性节点的情况下,本步骤中当前主机节点可以利用本节点代理组件向本节点一致性组件发送节点状态信息;其中,本节点一致性组件为当前主机节点中的一致性组件。一致性节点也可以利用各自的基于分布式一致性协议的代理组件进行通信连接时,当前主机节点可以利用本节点代理组件对应的一致性节点中代理组件的发送节点状态信息,即集群中主机节点中的代理组件可以内置分布式一致性协议,以使作为一致性节点的主机节点可以直接利用代理组件进行基于分布式一致性协议的通信连接;例如当前主机节点为任一一致性节点的情况下,本步骤中当前主机节点可以直接利用本节点代理组件获取节点状态信息;其中,本节点代理组件为当前主机节点中的代理组件。
具体的,对于本实施例中的一致性节点所采用的分布式一致性协议的具体类型和一致性节点之间的通信连接方式,可以由设计人员根据实用场景和用户需求自行设置,如分布式一致性协议可以采用Raft协议(一种易理解的分布式一致性协议),也可以采用其他如ZAB(Zookeeper Atomic Broadcast,Zookeeper原子广播协议)的其他分布式一致性协议;如图2所示,本实施例中的一致性节点可以利用各自的基于分布式一致性协议的一致性组件之间的信道进行通信连接,以利用一致性组件进行集群管理;例如,一致性节点可以利用基于Raft协议的Etcd组件(一种分布式一致性组件)之间的信道进行通信连接,一致性节点也可以利用基于ZAB协议的Zookeeper组件(一种分布式一致性组件)之间的信道进行通信连接。本实施例对此不做任何限制。
步骤102:接收一致性节点发送的集群状态信息。
其中,本步骤中的集群状态信息可以为各一致性节点向各主机节点发送的当前集群状态对应的信息,以使各主机节点可以利用集群状态信息确定集群的当前集群状态。
具体的,对于本步骤中的集群状态信息的具体内容可以由设计人员根据实用场景和用户需求自行设置,如集群状态信息可以包括集群中在线的主机节点的信息(即在线主机节点信息),以使各主机节点可以根据在线主机节点信息,了解集群中全部在线的主机;集群状态信息也可以包括集群中变更的主机节点的信息(即变更主机节点信息),如新增主机节点信息和/或离线主机节点信息。本实施例对此不做任何限制。
对应的,本实施例中集群中的各一致性节点可以通过与其他一致性节点之间通信交互,更新整个集群的当前集群状态,从而获取并向各自对应的主机节点发送相应的集群状态信息。也就是说,本实施例所提供的方法还可以包括在当前主机节点为任一一致性节点的情况下,与其他一致性节点中进行通信交互,更新集群的当前集群状态;其中,其他一致性节点为集群中当前主机节点之外的一致性节点。也就是说,本实施例中可以利用一致性节点之间的基于分布式一致性协议的通信,实时记录集群中每个主机节点的节点状态信息(如在线状态和健康状态评估等)。例如,若当前主机节点为一致性节点,则利用本节点一致性组件,与其他一致性节点中的一致性组件进行通信交互,更新集群的当前集群状态;其中,本节点一致性组件为当前主机节点中的一致性组件,其他一致性节点为集群中当前主机节点之外的一致性节点;相应的,当前主机节点还可以利用本节点一致性组件,根据当前集群状态,获取并向对应的主机节点的代理组件发送集群状态信息。若当前主机节点为一致性节点,则利用本节点代理组件,与其他一致性节点中的代理组件进行通信交互,更新集群的当前集群状态;其中,本节点代理组件为当前主机节点中的代理组件,代理组件中设置有分布式一致性协议,其他一致性节点为集群中当前主机节点之外的一致性节点;相应的,当前主机节点还可以利用本节点代理组件,根据当前集群状态,获取并向对应的主机节点的代理组件发送集群状态信息。
步骤103:根据集群状态信息,获取集群的当前集群状态;其中,当前集群状态包括在线主机节点信息。
可以理解的是,本步骤中当前主机节点可以利用接收的集群状态信息,获取集群的当前集群状态,以使集群中的各主机节点均可以利用一致性节点了解集群中各主机节点当前的状态(即当前集群状态)。
具体的,对于本步骤中当前主机节点获取的集群的当前集群状态的具体内容,可以由设计人员根据实用场景和用户需求自行设置,如当前集群状态可以包括在线主机节点信息,即集群中在线的主机节点的信息;当前集群状态还可以包括在线主机资源信息,即集群中在线的主机节点的资源信息,如CPU和内存等资源的信息。本实施例对此不做任何限制。
对应的,本实施例所提供的方法还可以包括当前主机节点根据当前集群状态,获取并向本机集群服务发送集群信息;也就是说,本实施例中当前主机节点可以根据获取的当前集群状态,向当前主机节点中与集群相关的服务(即本机集群服务)发送相应的集群信息,以向本机集群服务通知集群的变动。如图3所示,当前主机节点可以利用代理组件中的通知管理模块,根据当前集群状态,获取并向本机集群服务发送集群信息,如在线主机节点信息、新增主机节点信息和/或离线主机节点信息,以方便集群的扩展。
需要说明的是,为了提高集群的容错性,本实施例中集群中的各一致性节点可以通过与其他一致性节点之间通信交互,从集群中的主机节点中选取出一个主机节点作为领导节点(即leader节点),以利用主机节点负责集群管理(Cluster Management),即对集群中的各主机节点进行管理。
对应的,在当前主机节点为任一一致性节点的情况下,当前主机节点可以与其他一致性节点进行通信交互,从全部主机节点中选取出领导节点,以利用领导节点管理主机节点;其中,其他一致性节点为集群中当前主机节点之外的一致性节点,领导节点为任一主机节点。例如,在集群中的领导节点离线的情况下,当前主机节点可以与其他一致性节点进行通信交互,从集群中全部在线的主机节点中选取出领导节点,或者从集群中一致性节点之外的全部在线的主机节点中选取出领导节点,本实施例对此不做任何限制。
具体的,对于上述当前主机节点与其他一致性节点进行通信交互,从全部主机节点中选取出领导节点的具体方式,可以由设计人员自行设置,如可以采用与现有技术中一致性协议算法中的领导节点选取方式相同或相似的方式实现,例如当前主机节点可以与其他一致性节点进行通信交互,通过投票机制从全部主机节点中选取出领导节点,本实施例对此不做任何限制。
可以理解的是,对于本实施例中的集群中的一致性节点的具体数量,可以由设计人员根据实用场景和用户需求自行设置,如本实施例中的集群中一致性节点的数量可以大于或等于3,以能够容忍至少1个一致性节点的故障,提高集群的容错能力;例如为了减少资源浪费,本实施例中集群中一致性节点的数量可以为大于或等于3的奇数,如3、5或7等;其中,一致性节点的数量为3、5或7时,分别可以容忍1、2和3个一致性节点故障;本实施例中集群中一致性节点的数量也可以为大于或等于4的偶数,如4、6或8等;其中,一致性节点的数量为4、6或8时,分别可以容忍1、2和3个一致性节点故障。只要保证一致性节点的数量小于集群中全部主机节点的数量,本实施例对此不做任何限制。
具体的,本实施例中的领导节点还可以用于集群中的一致性节点的管理,如领导节点可以负责一致性节点中的一致性组件的管理;如图3所示,基于一致性组件选举出领导节点可以利用代理组件中的选举模块,负责一致性组件的管理和集群中主机节点的管理。
对应的,本实施例中集群中的领导节点可以在一致性节点中存在异常节点(如节点离线)时,从目标节点中选取异常节点对应的主机节点作为一致性节点,以替换异常节点,提高集群的容错性;也就是说,本实施例中若当前主机节点为领导节点,则在一致性节点中存在异常节点时,当前主机节点可以从目标节点中选取异常节点对应的主机节点作为一致性节点,以替换异常节点。如图3所示,基于一致性组件选举出领导节点可以利用代理组件中的一致性组件管理模块,负责一致性组件的健康管理,当有一致性节点有异常(如节点离线和一致性组件异常等异常)时,选出其他主机节点替换异常的一致性节点。
进一步的,本实施例中集群中的领导节点或各主机节点可以根据集群服务的需求以及在线主机资源信息,从全部主机节点中选取该集群服务对应的最优节点,以利用最优节点处理该集群服务。例如,若当前主机节点为领导节点,则根据在线主机资源信息和待分配集群服务的需求信息,从全部主机节点中选取待分配集群服务对应的最优节点,并控制最优节点处理各自对应的最优节点。
本实施例中,本发明实施例通过当前主机节点向集群中的一致性节点发送节点状态信息,可以利用集群中的一致性节点更新集群的主机的在线情况,从而使各主机节点能够及时了解集群中主机的在线情况;并且通过集群中的一致性节点的设置,能够便快速便捷的调整集群成员,实现对大规模集群进行便捷可靠的管理,保证高可用性,提升了用户体验。
相应于上面的方法实施例,本发明实施例还提供了一种集群管理装置,下文描述的一种集群管理装置与上文描述的一种集群管理方法可相互对应参照。
请参考图4,图4为本发明实施例所提供的一种集群管理装置的结构框图。该数据写入装置应用于应用于当前主机节点,可以包括:
信息上报模块10,用于向集群中的一致性节点发送节点状态信息;其中,当前主机节点为集群中的任一主机节点,一致性节点为集群中基于分布式一致性协议通信连接的主机节点,一致性节点的数量小于主机节点的数量;
接收模块20,用于接收一致性节点发送的集群状态信息;
获取模块30,用于根据集群状态信息,获取集群的当前集群状态;其中,当前集群状态包括在线主机节点信息。
可选的,该装置还可以包括:
更新模块,用于若当前主机节点为一致性节点,则利用本节点一致性组件,与其他一致性节点中的一致性组件进行通信交互,更新集群的当前集群状态;其中,本节点一致性组件为当前主机节点中的一致性组件,其他一致性节点为集群中当前主机节点之外的一致性节点;
对应的,信息上报模块10可以具体用于利用本节点代理组件向一致性组件发送节点状态信息;其中,本节点代理组件为当前主机节点中的代理组件;
可选的,该装置还可以包括:
代理更新模块,用于若当前主机节点为一致性节点,则利用本节点代理组件,与其他一致性节点中的代理组件进行通信交互,更新集群的当前集群状态;其中,本节点代理组件为当前主机节点中的代理组件,代理组件中设置有分布式一致性协议,其他一致性节点为集群中当前主机节点之外的一致性节点;
对应的,信息上报模块10可以具体用于利用本节点代理组件获取节点状态信息;其中,本节点代理组件为当前主机节点中的代理组件。
可选的,节点状态信息包括心跳信息。
可选的,一致性节点的数量为大于或等于3的奇数。
可选的,该装置还可以包括:
领导选择模块,用于若当前主机节点为一致性节点,则与其他一致性节点进行通信交互,从全部主机节点中选取出领导节点,以利用领导节点管理主机节点;其中,其他一致性节点为集群中当前主机节点之外的一致性节点,领导节点为任一主机节点。
可选的,该装置还可以包括:
一致性管理模块,用于若当前主机节点为领导节点,则在一致性节点中存在异常节点时,从目标节点中选取异常节点对应的主机节点作为一致性节点,以替换异常节点。
本实施例中,本发明实施例通过信息上报模块10向集群中的一致性节点发送节点状态信息,可以利用集群中的一致性节点更新集群的主机的在线情况,从而使各主机节点能够及时了解集群中主机的在线情况;并且通过集群中的一致性节点的设置,能够便快速便捷的调整集群成员,实现对大规模集群进行便捷可靠的管理,保证高可用性,提升了用户体验。
相应于上面的方法实施例,本发明实施例还提供了一种主机设备,下文描述的一种主机设备与上文描述的一种集群管理方法可相互对应参照。
请参考图5,图5为本发明实施例所提供的一种主机设备的结构示意图。该主机设备可以包括:
存储器D1,用于存储计算机程序;
处理器D2,用于执行计算机程序时实现上述方法实施例所提供的集群管理方法的步骤。
具体的,请参考图6,图6为本发明实施例所提供的一种主机设备的具体结构示意图,该主机设备310可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)322(例如,一个或一个以上处理器)和存储器332,一个或一个以上存储应用程序342或数据344的存储介质330(例如一个或一个以上海量存储设备)。其中,存储器332和存储介质330可以是短暂存储或持久存储。存储在存储介质330的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对数据处理设备中的一系列指令操作。更进一步地,中央处理器322可以设置为与存储介质330通信,在主机设备310上执行存储介质330中的一系列指令操作。
主机设备310还可以包括一个或一个以上电源326,一个或一个以上有线或无线网络接口350,一个或一个以上输入输出接口358,和/或,一个或一个以上操作系统341。例如,Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等。
其中,主机设备310可以具体为集群中的计算机设备。
上文所描述的集群管理方法中的步骤可以由主机设备的结构实现。
相应于上面的方法实施例,本发明实施例还提供了一种可读存储介质,下文描述的一种可读存储介质与上文描述的一种集群管理方法可相互对应参照。
一种可读存储介质,可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例所提供的集群管理方法的步骤。
该可读存储介质具体可以为U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可存储程序代码的可读存储介质。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、主机设备及可读存储介质而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的一种集群管理方法、装置、主机设备及可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (10)

1.一种集群管理方法,其特征在于,包括:
当前主机节点向集群中的一致性节点发送节点状态信息;其中,当前主机节点为所述集群中的任一主机节点,所述一致性节点为所述集群中基于分布式一致性协议通信连接的主机节点,所述一致性节点的数量小于所述主机节点的数量;
接收所述一致性节点发送的集群状态信息;
根据所述集群状态信息,获取所述集群的当前集群状态;其中,当前集群状态包括在线主机节点信息。
2.根据权利要求1所述的集群管理方法,其特征在于,还包括:
若当前主机节点为所述一致性节点,则利用本节点一致性组件,与其他一致性节点中的一致性组件进行通信交互,更新所述集群的当前集群状态;其中,所述本节点一致性组件为当前主机节点中的一致性组件,所述其他一致性节点为所述集群中当前主机节点之外的一致性节点;
对应的,所述当前主机节点向集群中的一致性节点发送节点状态信息,包括:
当前主机节点利用本节点代理组件向所述一致性组件发送所述节点状态信息;其中,所述本节点代理组件为当前主机节点中的代理组件。
3.根据权利要求1所述的集群管理方法,其特征在于,还包括:
若当前主机节点为所述一致性节点,则利用本节点代理组件,与其他一致性节点中的代理组件进行通信交互,更新所述集群的当前集群状态;其中,所述本节点代理组件为当前主机节点中的代理组件,所述代理组件中设置有分布式一致性协议,所述其他一致性节点为所述集群中当前主机节点之外的一致性节点;
对应的,所述当前主机节点向集群中的一致性节点发送节点状态信息,包括:
当前主机节点利用所述本节点代理组件获取所述节点状态信息;其中,所述本节点代理组件为当前主机节点中的代理组件。
4.根据权利要求1所述的集群管理方法,其特征在于,所述节点状态信息包括心跳信息。
5.根据权利要求1所述的集群管理方法,其特征在于,所述一致性节点的数量为大于或等于3的奇数。
6.根据权利要求1至5任一项所述的集群管理方法,其特征在于,还包括:
若当前主机节点为所述一致性节点,则与其他一致性节点进行通信交互,从全部所述主机节点中选取出领导节点,以利用所述领导节点管理所述主机节点;其中,所述其他一致性节点为所述集群中当前主机节点之外的一致性节点,所述领导节点为任一所述主机节点。
7.根据权利要求6所述的集群管理方法,其特征在于,还包括:
若当前主机节点为所述领导节点,则在所述一致性节点中存在异常节点时,从目标节点中选取所述异常节点对应的主机节点作为所述一致性节点,以替换所述异常节点。
8.一种集群管理装置,其特征在于,应用于当前主机节点,包括:
信息上报模块,用于向集群中的一致性节点发送节点状态信息;其中,当前主机节点为所述集群中的任一主机节点,所述一致性节点为所述集群中基于分布式一致性协议通信连接的主机节点,所述一致性节点的数量小于所述主机节点的数量;
接收模块,用于接收所述一致性节点发送的集群状态信息;
获取模块,用于根据所述集群状态信息,获取所述集群的当前集群状态;其中,当前集群状态包括在线主机节点信息。
9.一种主机设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述的集群管理方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的集群管理方法的步骤。
CN202210591045.5A 2022-05-27 2022-05-27 一种集群管理方法、装置、主机设备及可读存储介质 Pending CN114844799A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210591045.5A CN114844799A (zh) 2022-05-27 2022-05-27 一种集群管理方法、装置、主机设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210591045.5A CN114844799A (zh) 2022-05-27 2022-05-27 一种集群管理方法、装置、主机设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN114844799A true CN114844799A (zh) 2022-08-02

Family

ID=82572965

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210591045.5A Pending CN114844799A (zh) 2022-05-27 2022-05-27 一种集群管理方法、装置、主机设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN114844799A (zh)

Citations (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050188283A1 (en) * 2004-01-23 2005-08-25 Pomaranski Ken G. Node management in high-availability cluster
CN1725702A (zh) * 2004-07-20 2006-01-25 联想网御科技(北京)有限公司 一种网络安全设备及其组成的实现高可用性的系统及方法
US20110179231A1 (en) * 2010-01-21 2011-07-21 Sun Microsystems, Inc. System and method for controlling access to shared storage device
CN102571960A (zh) * 2012-01-12 2012-07-11 浪潮(北京)电子信息产业有限公司 一种实现高可用集群状态监控的方法及装置
CN106484327A (zh) * 2016-09-20 2017-03-08 华为技术有限公司 一种数据处理方法及相关存储设备
US20170109184A1 (en) * 2015-10-15 2017-04-20 Netapp Inc. Storage virtual machine relocation
CN107135274A (zh) * 2017-06-20 2017-09-05 郑州云海信息技术有限公司 一种分布式集群系统的存储管理方法及装置
WO2017189133A1 (en) * 2016-04-29 2017-11-02 Netapp, Inc. Location-based resource availability management in a partitioned distributed storage environment
CN107357529A (zh) * 2017-07-11 2017-11-17 郑州云海信息技术有限公司 一种存储集群在线升级方法及系统
US20170373926A1 (en) * 2016-06-22 2017-12-28 Vmware, Inc. Dynamic heartbeating mechanism
CN107943555A (zh) * 2017-10-17 2018-04-20 华南理工大学 一种云计算环境下的大数据存储和处理平台及处理方法
CN108768758A (zh) * 2018-08-31 2018-11-06 郑州云海信息技术有限公司 分布式存储系统在线升级方法、装置、设备及存储介质
CA3168286A1 (en) * 2019-01-18 2020-07-23 10353744 Canada Ltd. Data flow processing method and system
CN111813348A (zh) * 2020-09-08 2020-10-23 苏州浪潮智能科技有限公司 统一存储设备中的节点事件处理装置、方法、设备及介质
CN112231148A (zh) * 2020-10-23 2021-01-15 北京思特奇信息技术股份有限公司 分布式缓存数据离线传输方法、装置及可读存储介质
CN112261135A (zh) * 2020-10-22 2021-01-22 腾讯科技(深圳)有限公司 基于一致性协议的节点选举方法、系统、装置及设备
CN112363815A (zh) * 2020-11-23 2021-02-12 中信银行股份有限公司 Redis集群处理方法、装置、电子设备及计算机可读存储介质
CN112486776A (zh) * 2020-12-07 2021-03-12 中国船舶重工集团公司第七一六研究所 一种集群成员节点可用性监测设备及方法
CN112749178A (zh) * 2019-10-31 2021-05-04 华为技术有限公司 一种保证数据一致性的方法及相关设备
CN113312153A (zh) * 2021-06-25 2021-08-27 深信服科技股份有限公司 一种集群部署方法、装置、电子设备及存储介质
CN114070858A (zh) * 2020-07-31 2022-02-18 中移(苏州)软件技术有限公司 一种数据处理方法及装置、设备、存储介质
CN114448831A (zh) * 2022-03-18 2022-05-06 以萨技术股份有限公司 一种集群所属服务器状态监控方法及系统

Patent Citations (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050188283A1 (en) * 2004-01-23 2005-08-25 Pomaranski Ken G. Node management in high-availability cluster
CN1725702A (zh) * 2004-07-20 2006-01-25 联想网御科技(北京)有限公司 一种网络安全设备及其组成的实现高可用性的系统及方法
US20110179231A1 (en) * 2010-01-21 2011-07-21 Sun Microsystems, Inc. System and method for controlling access to shared storage device
CN102571960A (zh) * 2012-01-12 2012-07-11 浪潮(北京)电子信息产业有限公司 一种实现高可用集群状态监控的方法及装置
US20170109184A1 (en) * 2015-10-15 2017-04-20 Netapp Inc. Storage virtual machine relocation
WO2017189133A1 (en) * 2016-04-29 2017-11-02 Netapp, Inc. Location-based resource availability management in a partitioned distributed storage environment
US20170373926A1 (en) * 2016-06-22 2017-12-28 Vmware, Inc. Dynamic heartbeating mechanism
CN106484327A (zh) * 2016-09-20 2017-03-08 华为技术有限公司 一种数据处理方法及相关存储设备
CN107135274A (zh) * 2017-06-20 2017-09-05 郑州云海信息技术有限公司 一种分布式集群系统的存储管理方法及装置
CN107357529A (zh) * 2017-07-11 2017-11-17 郑州云海信息技术有限公司 一种存储集群在线升级方法及系统
CN107943555A (zh) * 2017-10-17 2018-04-20 华南理工大学 一种云计算环境下的大数据存储和处理平台及处理方法
CN108768758A (zh) * 2018-08-31 2018-11-06 郑州云海信息技术有限公司 分布式存储系统在线升级方法、装置、设备及存储介质
CA3168286A1 (en) * 2019-01-18 2020-07-23 10353744 Canada Ltd. Data flow processing method and system
CN112749178A (zh) * 2019-10-31 2021-05-04 华为技术有限公司 一种保证数据一致性的方法及相关设备
CN114070858A (zh) * 2020-07-31 2022-02-18 中移(苏州)软件技术有限公司 一种数据处理方法及装置、设备、存储介质
CN111813348A (zh) * 2020-09-08 2020-10-23 苏州浪潮智能科技有限公司 统一存储设备中的节点事件处理装置、方法、设备及介质
CN112261135A (zh) * 2020-10-22 2021-01-22 腾讯科技(深圳)有限公司 基于一致性协议的节点选举方法、系统、装置及设备
CN112231148A (zh) * 2020-10-23 2021-01-15 北京思特奇信息技术股份有限公司 分布式缓存数据离线传输方法、装置及可读存储介质
CN112363815A (zh) * 2020-11-23 2021-02-12 中信银行股份有限公司 Redis集群处理方法、装置、电子设备及计算机可读存储介质
CN112486776A (zh) * 2020-12-07 2021-03-12 中国船舶重工集团公司第七一六研究所 一种集群成员节点可用性监测设备及方法
CN113312153A (zh) * 2021-06-25 2021-08-27 深信服科技股份有限公司 一种集群部署方法、装置、电子设备及存储介质
CN114448831A (zh) * 2022-03-18 2022-05-06 以萨技术股份有限公司 一种集群所属服务器状态监控方法及系统

Similar Documents

Publication Publication Date Title
CN107295080B (zh) 应用于分布式服务器集群的数据存储方法和服务器
CN111917846A (zh) 一种Kafka集群切换方法、装置、系统、电子设备及可读存储介质
CN110933137B (zh) 一种数据同步方法、系统、设备及可读存储介质
WO2018113522A1 (en) Cross–Data Center Hierarchical Consensus Scheme with Geo-Aware Leader Election
CN110795503A (zh) 分布式存储系统的多集群数据同步方法及相关装置
CN112261135A (zh) 基于一致性协议的节点选举方法、系统、装置及设备
CN110457176B (zh) 用于分布式系统的监控方法、装置、存储介质及电子设备
CN110855737B (zh) 一种一致性级别可控的自适应数据同步方法和系统
CN107666493B (zh) 一种数据库配置方法及其设备
JP7341244B2 (ja) クラスタ管理方法、装置、およびシステム
CN110581782A (zh) 一种容灾数据的处理方法、装置及系统
CN113742031A (zh) 节点状态信息获取方法、装置、电子设备及可读存储介质
CN114265753A (zh) 消息队列的管理方法、管理系统和电子设备
CN114844799A (zh) 一种集群管理方法、装置、主机设备及可读存储介质
CN108881412B (zh) 分布式存储集群的统一管理方法、系统、设备及存储介质
US11467731B2 (en) Client driven multi-site consistency for object storage
CN114615320A (zh) 服务治理方法、装置、电子设备及计算机可读存储介质
CN111541608B (zh) 一种网络通信的方法、系统以及相关装置
CN114398208A (zh) 一种无状态应用的跨集群备份方法、系统、介质和设备
CN113472849A (zh) 一种节点的管理方法、系统、设备以及介质
CN111953760B (zh) 数据同步方法、装置、多活系统及存储介质
CN110457392B (zh) 副本读写方法及装置
CN112564968B (zh) 故障处理方法、装置及存储介质
CN115550287B (zh) 一种远程复制关系的建立方法及相关装置
CN113708960B (zh) 一种Zookeeper集群的部署方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination