CN109587218A - 一种集群选举的方法和装置 - Google Patents

一种集群选举的方法和装置 Download PDF

Info

Publication number
CN109587218A
CN109587218A CN201811317948.4A CN201811317948A CN109587218A CN 109587218 A CN109587218 A CN 109587218A CN 201811317948 A CN201811317948 A CN 201811317948A CN 109587218 A CN109587218 A CN 109587218A
Authority
CN
China
Prior art keywords
node
leader
memory system
distributed memory
monitor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811317948.4A
Other languages
English (en)
Other versions
CN109587218B (zh
Inventor
顾雷雷
陆强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Technologies Co Ltd
Original Assignee
New H3C Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New H3C Technologies Co Ltd filed Critical New H3C Technologies Co Ltd
Priority to CN201811317948.4A priority Critical patent/CN109587218B/zh
Publication of CN109587218A publication Critical patent/CN109587218A/zh
Application granted granted Critical
Publication of CN109587218B publication Critical patent/CN109587218B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1044Group management mechanisms 
    • H04L67/1051Group master selection mechanisms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种集群选举的方法和装置,该方法包括:获取分布式存储系统中的可用Monitor节点的第一数量;若所述第一数量小于或者等于Monitor节点总数量的一半,则将所述分布式存储系统的Leader选举模式从集群模式切换为独立模式;在所述分布式存储系统的Leader选举模式为独立模式时,则采用特定策略从可用Monitor节点中选举所述分布式存储系统的Leader节点。通过本申请的技术方案,可以保证分布式存储系统的高可用性和健壮性,提高分布式存储系统应对异常环境的能力,并维持分布式存储系统的对外可用性。

Description

一种集群选举的方法和装置
技术领域
本申请涉及通信技术领域,尤其是涉及一种集群选举的方法和装置。
背景技术
随着大数据时代的到来,越来越多的分布式系统应运而生,而分布式存储系统(如Ceph等)是一个重要部分,大数据、云计算产生的数据均可以通过分布式存储系统进行存储。分布式存储系统包括多个Monitor(监视)节点,Monitor节点用于维护整个集群的健康状态,提供一致性的决策,是集群状态的管理者。而且,可以从Monitor节点中选举一个Monitor节点作为Leader(主)节点,Leader节点负责管理、维护、发布集群的状态信息。如果Leader节点处于不可用状态,则从剩余的Monitor节点中重新选举一个Monitor节点作为Leader节点。
在传统方式中,通常采用一致分布式算法(如paxos)从Monitor节点中选举Leader节点,而在使用一致分布式算法时,需要有一半以上的Monitor节点处于可用状态,一旦可用状态的Monitor节点数量未达到总数量的一半,则无法从Monitor节点中选举出Leader节点,从而导致分布式存储系统无法正常使用。
例如,分布式存储系统包括3个Monitor节点,若有2个或3个Monitor节点处于可用状态,则可以采用一致分布式算法从Monitor节点中选举Leader节点,一旦有2个Monitor节点故障,则可用状态的Monitor节点数量(即1)未达到总数量(即3)的一半,因此,导致无法正确的选举出Leader节点。
发明内容
本申请提供一种集群选举的方法,应用于分布式存储系统,所述分布式存储系统包括多个Monitor节点,所述方法包括:
获取所述分布式存储系统中的可用Monitor节点的第一数量;
若所述第一数量小于或者等于Monitor节点总数量的一半,则将所述分布式存储系统的Leader选举模式从集群模式切换为独立模式;
在所述分布式存储系统的Leader选举模式为独立模式时,则采用特定策略从可用Monitor节点中选举所述分布式存储系统的Leader节点。
本申请提供一种集群选举的装置,应用于分布式存储系统,所述分布式存储系统包括多个Monitor节点,所述装置包括:
获取模块,用于获取分布式存储系统中的可用Monitor节点的第一数量;
切换模块,用于当所述第一数量小于或者等于Monitor节点总数量的一半时,将所述分布式存储系统的Leader选举模式从集群模式切换为独立模式;
选择模块,用于在所述分布式存储系统的Leader选举模式为独立模式时,采用特定策略从可用Monitor节点中选举所述分布式存储系统的Leader节点。
基于上述技术方案,本申请实施例中,在分布式存储系统中,即使可用状态的Monitor节点数量未达到Monitor节点总数量的一半,也可以从处于可用状态的Monitor节点中选举Leader节点,从而可以正确的选举Leader节点,也就是说,可以从Monitor节点中选举出分布式存储系统的Leader节点,使得分布式存储系统正常使用,保证分布式存储系统的高可用性和健壮性,提高了分布式存储系统应对异常环境的能力,并可以维持分布式存储系统的对外可用性。
附图说明
为了更加清楚地说明本申请实施例或者现有技术中的技术方案,下面将对本申请实施例或者现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据本申请实施例的这些附图获得其他的附图。
图1是本申请一种实施方式中的分布式存储系统的结构示意图;
图2是本申请一种实施方式中的集群选举的方法的流程图;
图3是本申请另一种实施方式中的集群选举的方法的流程图;
图4是本申请一种实施方式中的集群选举的装置的结构图。
具体实施方式
在本申请实施例使用的术语仅仅是出于描述特定实施例的目的,而非限制本申请。本申请和权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其它含义。还应当理解,本文中使用的术语“和/或”是指包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请实施例可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,此外,所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
本申请实施例中提出一种集群选举的方法,可以应用于分布式存储系统(如Ceph等),该分布式存储系统可以包括多个Monitor节点(如3个Monitor节点、4个Monitor节点、5个Monitor节点等,对此数量不做限制),该方法用于从分布式存储系统的多个Monitor节点中选举出Leader节点。其中,Monitor节点用于维护整个集群的健康状态,提供一致性的决策,是集群状态的管理者,Leader节点是从Monitor节点中选举出的,负责管理、维护、发布集群的状态信息。
参见图1所示,为分布式存储系统的结构示意图,分布式存储系统可以包括主机节点101、主机节点102、主机节点103,主机节点101、主机节点102和主机节点103既是Monitor节点也是存储节点,当然,该分布式存储系统还可以包括仅用于存储的主机节点(即作为存储节点)、仅用于监视的主机节点(即作为Monitor节点)和其它类型的主机节点,对此分布式存储系统不做限制。
参见图1所示,是一个3节点3副本的应用场景,3节点是指分布式存储系统存在3个具有监视功能的主机节点,这3个主机节点作为分布式存储系统的Monitor节点,如主机节点101、主机节点102、主机节点103。此外,3副本是指分布式存储系统存在3个具有存储功能的主机节点,这3个主机节点作为分布式存储系统的存储节点,如主机节点101、主机节点102、主机节点103。
当然,上述图1所示的应用场景只是分布式存储系统的一个示例,对此分布式存储系统不做限制。例如,分布式存储系统还可以包括主机节点104,主机节点104只具有存储功能,而不具有监视功能。又例如,分布式存储系统还可以包括主机节点105,主机节点105具有监视功能,而不具有存储功能。
参见图2所示,为集群选举的方法的流程示意图,该方法可以应用于分布式存储系统,该分布式存储系统可以包括多个Monitor节点,该方法可以包括:
步骤201,获取分布式存储系统中的可用Monitor节点的第一数量。
其中,获取分布式存储系统中的可用Monitor节点的第一数量,可以包括但不限于:若分布式存储系统中的第一Monitor节点从可用状态切换为不可用状态,则可以获取分布式存储系统中的可用Monitor节点的第一数量。
其中,第一Monitor节点可以是分布式存储系统的任一Monitor节点,第一Monitor节点从可用状态切换为不可用状态,如第一Monitor节点发生故障。
步骤202,若该第一数量小于或者等于Monitor节点总数量的一半,则将分布式存储系统的Leader选举模式从集群模式切换为独立模式。
步骤203,在分布式存储系统的Leader选举模式为独立模式时,则采用特定策略从可用Monitor节点中选举分布式存储系统的Leader节点。
在传统方式中,分布式存储系统的Leader选举模式可以为集群模式,在Leader选举模式为集群模式时,若可用Monitor节点的数量小于或者等于Monitor节点总数量的一半,则一致分布式算法(如paxos等)不允许选举Leader节点,也就是说,无法从可用Monitor节点中选举分布式存储系统的Leader节点,从而使得分布式存储系统无法对外提供业务服务。
本实施例中,若可用Monitor节点的数量小于或者等于Monitor节点总数量的一半,则可以将分布式存储系统的Leader选举模式从集群模式切换为独立模式。在分布式存储系统的Leader选举模式为独立模式时,就可以采用特定策略从可用Monitor节点中选举分布式存储系统的Leader节点,而不再受限于一致分布式算法,也就是说,突破一致分布式算法的限制,可以从可用Monitor节点中选举分布式存储系统的Leader节点,避免分布式存储系统不可用的问题。
在一个例子中,采用特定策略从可用Monitor节点中选举分布式存储系统的Leader节点,可以包括但不限于:若分布式存储系统中只存在一个可用Monitor节点,则可以将该一个可用Monitor节点选举为分布式存储系统的Leader节点,并为该Leader节点设置独立Leader标识;或者,若分布式存储系统中存在多个可用Monitor节点,则可以将IP地址最大或IP地址最小的可用Monitor节点选举为分布式存储系统的Leader节点,并为该Leader节点设置独立Leader标识。
当然,上述方式只是利用特定策略选举Leader节点的示例,对此不做限制,只要能够从可用Monitor节点中选举分布式存储系统的Leader节点即可。
基于上述技术方案,本申请实施例中,在分布式存储系统中,即使可用状态的Monitor节点数量未达到Monitor节点总数量的一半,也可以从处于可用状态的Monitor节点中选举Leader节点,从而可以正确的选举Leader节点,也就是说,可以从Monitor节点中选举出分布式存储系统的Leader节点,使得分布式存储系统正常使用,保证分布式存储系统的高可用性和健壮性,提高了分布式存储系统应对异常环境的能力,并可以维持分布式存储系统的对外可用性。
以下结合具体的应用场景,对上述集群选举的方法进行详细说明。
在初始状态下,存在5个Monitor节点(如Monitor节点1-Monitor节点5),这5个Monitor节点均为可用状态,可用Monitor节点的第一数量5大于Monitor节点总数量5的一半,采用一致分布式算法从5个Monitor节点中选举出Leader节点,对此选举方式不再赘述,假设将Monitor节点1选举为Leader节点。
在分布式存储系统的运行过程中,假设Monitor节点1发生故障,如存在主机故障或存在网络故障等,则Monitor节点1从可用状态切换为不可用状态,因此,需要重新获取可用Monitor节点的第一数量。由于可用Monitor节点的第一数量4大于Monitor节点总数量5的一半,因此采用一致分布式算法从4个可用Monitor节点中选举出Leader节点,假设将Monitor节点5选举为Leader节点。
进一步的,在分布式存储系统的运行过程中,假设Monitor节点2也发生故障,也就是说,Monitor节点2从可用状态切换为不可用状态,因此,需要重新获取可用Monitor节点的第一数量。由于可用Monitor节点的第一数量3仍然大于Monitor节点总数量5的一半,因此,采用一致分布式算法从3个可用Monitor节点中选举出Leader节点,假设将Monitor节点5选举为Leader节点。
进一步的,在分布式存储系统的运行过程中,假设Monitor节点3发生故障,即Monitor节点3从可用状态切换为不可用状态,则需要重新获取可用Monitor节点的第一数量。由于可用Monitor节点的第一数量2小于Monitor节点总数量5的一半,因此,将分布式存储系统的Leader选举模式从集群模式切换为独立模式,在分布式存储系统的Leader选举模式为独立模式时,则采用特定策略从2个可用Monitor节点中选举分布式存储系统的Leader节点,而不再采用一致分布式算法选举出Leader节点,假设将Monitor节点4选举为Leader节点。
在分布式存储系统的运行过程中,假设Monitor节点4发生故障,即Monitor节点4从可用状态切换为不可用状态,重新获取可用Monitor节点的第一数量。由于可用Monitor节点的第一数量1小于Monitor节点总数量5的一半,且分布式存储系统的Leader选举模式为独立模式,采用特定策略从可用Monitor节点中选举分布式存储系统的Leader节点,即将Monitor节点5选举为Leader节点。
在上述实施例中,为了区分采用特定策略选举出的Leader节点和采用一致分布式算法选举出的Leader节点,还可以采用如下方式:在采用特定策略从可用Monitor节点中选举分布式存储系统的Leader节点之后,还可以为Leader节点设置独立Leader标识。基于此,若Leader节点具有独立Leader标识,则表示这个Leader节点是采用特定策略选举的Leader节点;若Leader节点不具有独立Leader标识,则表示这个Leader节点是采用一致分布式算法选举的Leader节点。
在一个例子中,在采用特定策略从可用Monitor节点中选举分布式存储系统的Leader节点之后,参见图3所示,所述集群选举的方法还可以包括:
步骤204,若分布式存储系统中增加可用状态的第二Monitor节点,则获取分布式存储系统中的可用Monitor节点的第二数量。
步骤205,若第二数量大于Monitor节点总数量的一半,则采用一致分布式算法从可用Monitor节点中选举分布式存储系统的Leader节点。
在一个例子中,在采用特定策略从可用Monitor节点中选举分布式存储系统的Leader节点之后,还可以周期性的检测分布式存储系统是否增加了可用状态的第二Monitor节点,如果是,则可以执行步骤204和步骤205。
其中,若有Monitor节点从不可用状态恢复为可用状态,则可以将该Monitor节点确定为第二Monitor节点;或者,若在分布式存储系统中增加新的可用状态的Monitor节点,则可以将该Monitor节点确定为第二Monitor节点。
例如,若Monitor节点1从不可用状态恢复为可用状态,则可以将Monitor节点1确定为第二Monitor节点;或者,若在分布式存储系统中增加新的可用状态的Monitor节点6,则可以将Monitor节点6确定为第二Monitor节点。
以下结合具体的应用场景,对上述步骤204和步骤205进行详细说明。
参见上述实施例,Monitor节点1-Monitor节点4均发生故障,且采用特定策略将Monitor节点5选举为分布式存储系统的Leader节点。在分布式存储系统的运行过程中,若Monitor节点4从不可用状态恢复为可用状态,即增加可用状态的Monitor节点4,则获取可用Monitor节点的第二数量。由于可用Monitor节点的第二数量2小于Monitor节点总数量5的一半,因此,采用特定策略从Monitor节点4和Monitor节点5中选举分布式存储系统的Leader节点,而不采用一致分布式算法选举Leader节点,假设将Monitor节点4选举为Leader节点。
在分布式存储系统的运行过程中,若Monitor节点3从不可用状态恢复为可用状态,则获取可用Monitor节点的第二数量。由于可用Monitor节点的第二数量3大于Monitor节点总数量5的一半,因此,可以采用一致分布式算法从可用Monitor节点中选举分布式存储系统的Leader节点,不再采用特定策略选举分布式存储系统的Leader节点,假设将Monitor节点5选举为Leader节点。
以此类推,若Monitor节点2和/或Monitor节点1从不可用状态恢复为可用状态,也可以采用一致分布式算法选举Leader节点,对此不再赘述。
在一个例子中,采用一致分布式算法从可用Monitor节点中选举分布式存储系统的Leader节点之后,若新选举出的Leader节点是原Leader节点,则删除该Leader节点的独立Leader标识,并将分布式存储系统的Leader选举模式从独立模式切换为集群模式;或者,若新选举出的Leader节点是除原Leader节点之外的其它可用Monitor节点,则将原Leader节点的业务切换到新选举出的Leader节点,并在业务切换完成后,删除原Leader节点的独立Leader标识,将原Leader节点恢复为可用Monitor节点,将分布式存储系统的Leader选举模式从独立模式切换为集群模式。
例如,在步骤203中,采用特定策略将Monitor节点5选举为Leader节点,在步骤205中,采用一致分布式算法将Monitor节点5选举为Leader节点,也就是说,新选举出的Leader节点是原Leader节点,因此,可以删除该Leader节点的独立Leader标识,并直接将分布式存储系统的Leader选举模式从独立模式切换为集群模式,即恢复原有的集群模式。
又例如,在步骤203中,采用特定策略将Monitor节点5选举为Leader节点,在步骤205中,采用一致分布式算法将Monitor节点4选举为Leader节点,也就是说,新选举出的Leader节点是除原Leader节点之外的其它可用Monitor节点,因此,可以将原Leader节点(即Monitor节点5)的业务(如与Leader节点有关的业务,对此不做限制)切换到新选举出的Leader节点(如Monitor节点4),对此业务切换过程不做限制。在业务切换完成后,删除原Leader节点的独立Leader标识,将原Leader节点恢复为可用Monitor节点,将分布式存储系统的Leader选举模式从独立模式切换为集群模式,即恢复原有的集群模式。
在上述实施例中,在采用一致分布式算法从可用Monitor节点中选举分布式存储系统的Leader节点后,先不将Leader节点生效,即Monitor节点还不执行Leader节点的操作。在将分布式存储系统的Leader选举模式从独立模式切换为集群模式后,才将Leader节点生效,即Monitor节点执行Leader节点的操作。
在一个例子中,在将分布式存储系统的Leader选举模式从独立模式切换为集群模式后,可以删除Leader节点的独立Leader标识,这样,Leader节点不具有独立Leader标识,表示Leader节点是采用一致分布式算法选举的Leader节点。
基于上述技术方案,本申请实施例中,在分布式存储系统中,若可用Monitor节点的第二数量大于Monitor节点总数量的一半,则可以采用一致分布式算法重新选举Leader节点。进一步的,在重新选举的Leader节点未发生变化时,无需进行Leader业务切换;在重新选举的Leader节点发生变化时,对Leader业务进行切换即可,可以提供业务切换机制,保证业务的正常过渡。
基于与上述方法同样的申请构思,本申请实施例中还提出一种集群选举的装置,可以应用于分布式存储系统,所述分布式存储系统包括多个Monitor节点,参见图4所示,为所述装置的结构示意图,所述装置包括:
获取模块401,用于获取分布式存储系统中的可用Monitor节点的第一数量;
切换模块402,用于当所述第一数量小于或者等于Monitor节点总数量的一半时,将所述分布式存储系统的Leader选举模式从集群模式切换为独立模式;
选择模块403,用于在分布式存储系统的Leader选举模式为独立模式时,采用特定策略从可用Monitor节点中选举所述分布式存储系统的Leader节点。
所述获取模块401获取分布式存储系统中的可用Monitor节点的第一数量时具体用于:若所述分布式存储系统中的第一Monitor节点从可用状态切换为不可用状态,则获取所述分布式存储系统中的可用Monitor节点的第一数量。
所述选择模块403采用特定策略从可用Monitor节点中选举所述分布式存储系统的Leader节点时具体用于:若所述分布式存储系统中只存在一个可用Monitor节点,则将所述一个可用Monitor节点选举为所述分布式存储系统的Leader节点,并为该Leader节点设置独立Leader标识;或者,若所述分布式存储系统中存在多个可用Monitor节点,则将IP地址最大或最小的可用Monitor节点选举为所述分布式存储系统的Leader节点,并为该Leader节点设置独立Leader标识。
所述获取模块401,还用于当所述分布式存储系统中增加可用状态的第二Monitor节点时,获取所述分布式存储系统中的可用Monitor节点的第二数量;
所述选择模块403,还用于当第二数量大于Monitor节点总数量的一半时,采用一致分布式算法从可用Monitor节点中选举分布式存储系统的Leader节点。
所述切换模块402,还用于:若新选举出的Leader节点是原Leader节点,则删除该Leader节点的独立Leader标识,将所述分布式存储系统的Leader选举模式从独立模式切换为集群模式;或者,
若新选举出的Leader节点是除原Leader节点之外的其它可用Monitor节点,则将原Leader节点的业务切换到新选举出的Leader节点,并在业务切换完成后,删除原Leader节点的独立Leader标识,将原Leader节点恢复为可用Monitor节点,将所述分布式存储系统的Leader选举模式从独立模式切换为集群模式。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可以由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其它可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其它可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
而且,这些计算机程序指令也可以存储在能引导计算机或其它可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或者多个流程和/或方框图一个方框或者多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其它可编程数据处理设备上,使得在计算机或者其它可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其它可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种集群选举的方法,其特征在于,应用于分布式存储系统,所述分布式存储系统包括多个Monitor节点,所述方法包括:
获取所述分布式存储系统中的可用Monitor节点的第一数量;
若所述第一数量小于或者等于Monitor节点总数量的一半,则将所述分布式存储系统的Leader选举模式从集群模式切换为独立模式;
在所述分布式存储系统的Leader选举模式为独立模式时,采用特定策略从可用Monitor节点中选举所述分布式存储系统的Leader节点。
2.根据权利要求1所述的方法,其特征在于,所述获取所述分布式存储系统中的可用Monitor节点的第一数量,包括:
若所述分布式存储系统中的第一Monitor节点从可用状态切换为不可用状态,则获取所述分布式存储系统中的可用Monitor节点的第一数量。
3.根据权利要求1或2所述的方法,其特征在于,所述采用特定策略从可用Monitor节点中选举所述分布式存储系统的Leader节点,包括:
若所述分布式存储系统中只存在一个可用Monitor节点,则将所述一个可用Monitor节点选举为所述分布式存储系统的Leader节点,并为该Leader节点设置独立Leader标识;或者,
若所述分布式存储系统中存在多个可用Monitor节点,则将IP地址最大或最小的可用Monitor节点选举为所述分布式存储系统的Leader节点,并为该Leader节点设置独立Leader标识。
4.根据权利要求3所述的方法,其特征在于,所述采用特定策略从可用Monitor节点中选举所述分布式存储系统的Leader节点之后,还包括:
若所述分布式存储系统中增加可用状态的第二Monitor节点,则获取所述分布式存储系统中的可用Monitor节点的第二数量;
若所述第二数量大于Monitor节点总数量的一半,则采用一致分布式算法从可用Monitor节点中选举所述分布式存储系统的Leader节点。
5.根据权利要求4所述的方法,其特征在于,所述采用一致分布式算法从可用Monitor节点中选举所述分布式存储系统的Leader节点之后,还包括:
若新选举出的Leader节点是原Leader节点,则删除该Leader节点的独立Leader标识,将所述分布式存储系统的Leader选举模式从独立模式切换为集群模式;或者,
若新选举出的Leader节点是除原Leader节点之外的其它可用Monitor节点,则将原Leader节点的业务切换到新选举出的Leader节点,并在业务切换完成后,删除原Leader节点的独立Leader标识,将原Leader节点恢复为可用Monitor节点,将所述分布式存储系统的Leader选举模式从独立模式切换为集群模式。
6.一种集群选举的装置,其特征在于,应用于分布式存储系统,所述分布式存储系统包括多个Monitor节点,所述装置包括:
获取模块,用于获取分布式存储系统中的可用Monitor节点的第一数量;
切换模块,用于当所述第一数量小于或者等于Monitor节点总数量的一半时,将所述分布式存储系统的Leader选举模式从集群模式切换为独立模式;
选择模块,用于在所述分布式存储系统的Leader选举模式为独立模式时,采用特定策略从可用Monitor节点中选举所述分布式存储系统的Leader节点。
7.根据权利要求6所述的装置,其特征在于,所述获取模块获取分布式存储系统中的可用Monitor节点的第一数量时具体用于:
若所述分布式存储系统中的第一Monitor节点从可用状态切换为不可用状态,则获取所述分布式存储系统中的可用Monitor节点的第一数量。
8.根据权利要求6或7所述的装置,其特征在于,所述选择模块采用特定策略从可用Monitor节点中选举所述分布式存储系统的Leader节点时具体用于:
若所述分布式存储系统中只存在一个可用Monitor节点,则将所述一个可用Monitor节点选举为所述分布式存储系统的Leader节点,并为该Leader节点设置独立Leader标识;或者,
若所述分布式存储系统中存在多个可用Monitor节点,则将IP地址最大或最小的可用Monitor节点选举为所述分布式存储系统的Leader节点,并为该Leader节点设置独立Leader标识。
9.根据权利要求8所述的装置,其特征在于,
所述获取模块,还用于当所述分布式存储系统中增加可用状态的第二Monitor节点时,获取所述分布式存储系统中的可用Monitor节点的第二数量;
所述选择模块,还用于当所述第二数量大于Monitor节点总数量的一半时,采用一致分布式算法从可用Monitor节点中选举分布式存储系统的Leader节点。
10.根据权利要求9所述的装置,其特征在于,所述切换模块,还用于:
若新选举出的Leader节点是原Leader节点,则删除该Leader节点的独立Leader标识,将所述分布式存储系统的Leader选举模式从独立模式切换为集群模式;或者,
若新选举出的Leader节点是除原Leader节点之外的其它可用Monitor节点,则将原Leader节点的业务切换到新选举出的Leader节点,并在业务切换完成后,删除原Leader节点的独立Leader标识,将原Leader节点恢复为可用Monitor节点,将所述分布式存储系统的Leader选举模式从独立模式切换为集群模式。
CN201811317948.4A 2018-11-07 2018-11-07 一种集群选举的方法和装置 Active CN109587218B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811317948.4A CN109587218B (zh) 2018-11-07 2018-11-07 一种集群选举的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811317948.4A CN109587218B (zh) 2018-11-07 2018-11-07 一种集群选举的方法和装置

Publications (2)

Publication Number Publication Date
CN109587218A true CN109587218A (zh) 2019-04-05
CN109587218B CN109587218B (zh) 2021-08-24

Family

ID=65921628

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811317948.4A Active CN109587218B (zh) 2018-11-07 2018-11-07 一种集群选举的方法和装置

Country Status (1)

Country Link
CN (1) CN109587218B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112019601A (zh) * 2020-08-07 2020-12-01 烽火通信科技股份有限公司 一种基于分布式存储Ceph的两节点实现方法及系统
WO2021012930A1 (zh) * 2019-07-23 2021-01-28 中南民族大学 投票节点配置方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107295080A (zh) * 2017-06-19 2017-10-24 北京百度网讯科技有限公司 应用于分布式服务器集群的数据存储方法和服务器
CN107995029A (zh) * 2017-11-28 2018-05-04 紫光华山信息技术有限公司 选举控制方法及装置、选举方法及装置
CN108494585A (zh) * 2018-02-28 2018-09-04 新华三技术有限公司 选举控制方法及装置
CN108600328A (zh) * 2018-03-29 2018-09-28 新华三技术有限公司 一种集群选举方法和装置
CN108769199A (zh) * 2018-05-29 2018-11-06 郑州云海信息技术有限公司 一种分布式文件存储系统主节点管理方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107295080A (zh) * 2017-06-19 2017-10-24 北京百度网讯科技有限公司 应用于分布式服务器集群的数据存储方法和服务器
CN107995029A (zh) * 2017-11-28 2018-05-04 紫光华山信息技术有限公司 选举控制方法及装置、选举方法及装置
CN108494585A (zh) * 2018-02-28 2018-09-04 新华三技术有限公司 选举控制方法及装置
CN108600328A (zh) * 2018-03-29 2018-09-28 新华三技术有限公司 一种集群选举方法和装置
CN108769199A (zh) * 2018-05-29 2018-11-06 郑州云海信息技术有限公司 一种分布式文件存储系统主节点管理方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021012930A1 (zh) * 2019-07-23 2021-01-28 中南民族大学 投票节点配置方法及系统
CN112019601A (zh) * 2020-08-07 2020-12-01 烽火通信科技股份有限公司 一种基于分布式存储Ceph的两节点实现方法及系统

Also Published As

Publication number Publication date
CN109587218B (zh) 2021-08-24

Similar Documents

Publication Publication Date Title
CN109857445A (zh) 存储系统和控制软件配置方法
US10725878B2 (en) Storage apparatus, storage system, and control method of storage system for dynamically securing free space when a storage apparatus is disused
US9286113B2 (en) Method, apparatus, and system for issuing partition balancing subtask
CN108733509A (zh) 用于在集群系统中备份和恢复数据的方法和系统
CN109597567B (zh) 一种数据处理方法和装置
US20100023564A1 (en) Synchronous replication for fault tolerance
CN105468302B (zh) 一种处理数据的方法、装置及系统
CN106844108B (zh) 一种数据存储方法、服务器以及存储系统
CN112650576A (zh) 资源调度方法、装置、设备、存储介质及计算机程序产品
CN104378447A (zh) 一种基于哈希环的非迁移分布式存储方法及系统
CN105980991A (zh) 在多个计算节点之间的存储资源共享
CN108259175A (zh) 一种分布式密码服务方法和系统
CN105827678B (zh) 一种基于高可用架构下的通信方法和节点
CN110049091A (zh) 数据存储方法及装置、电子设备、存储介质
CN109491609A (zh) 一种缓存数据处理方法、装置、设备及可读存储介质
CN105306507A (zh) 分布式架构中的容灾处理方法及容灾处理装置
WO2020134678A1 (zh) 容灾方法、装置及系统
CN109587218A (zh) 一种集群选举的方法和装置
CN113867957A (zh) 一种跨集群容器数量弹性伸缩实现方法及装置
CN108462756A (zh) 一种数据写入方法和装置
JP7322161B2 (ja) 分散システムにおける非同期ストレージ管理
CN113312339B (zh) 一种数据迁移的方法及装置、计算机设备和存储介质
CN102609454B (zh) 一种分布式文件系统中的副本管理方法
CN105760391A (zh) 数据动态重分布的方法、数据节点、名字节点及系统
CN104052799B (zh) 一种利用资源环实现高可用存储的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant