CN107360025B - 一种分布式存储系统集群监控方法及设备 - Google Patents

一种分布式存储系统集群监控方法及设备 Download PDF

Info

Publication number
CN107360025B
CN107360025B CN201710551855.7A CN201710551855A CN107360025B CN 107360025 B CN107360025 B CN 107360025B CN 201710551855 A CN201710551855 A CN 201710551855A CN 107360025 B CN107360025 B CN 107360025B
Authority
CN
China
Prior art keywords
monitoring node
monitoring
message
cluster
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710551855.7A
Other languages
English (en)
Other versions
CN107360025A (zh
Inventor
许银龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201710551855.7A priority Critical patent/CN107360025B/zh
Publication of CN107360025A publication Critical patent/CN107360025A/zh
Application granted granted Critical
Publication of CN107360025B publication Critical patent/CN107360025B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0813Configuration setting characterised by the conditions triggering a change of settings
    • H04L41/082Configuration setting characterised by the conditions triggering a change of settings the condition being updates or upgrades of network functionality
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1044Group management mechanisms 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Hardware Redundancy (AREA)

Abstract

本申请公开了一种分布式存储系统集群监控方法及设备,包括:通过Paxos算法在所有的监控节点中选举出集群监控的主核心监控节点和备用核心监控节点;判断当前集群是否处于繁忙或故障状态,若是,则不触发重新选举,通过备用核心监控节点管理集群,若否,则触发重新选举新的主核心监控节点和备用核心监控节点。这样通过优化的选举算法选举出主核心监控节点和备用核心监控节点,当主核心监控节点失效后,备用核心监控节点可以迅速接替它工作,保证集群在繁忙或故障情况下监控节点的稳定,当检测到系统不繁忙后,重新发起选举,保证分布式存储系统的稳定性,从而减少系统震荡,保持系统稳定高效运行,用户的读写服务不受影响。

Description

一种分布式存储系统集群监控方法及设备
技术领域
本发明涉及分布式云存储领域,特别是涉及一种分布式存储系统集群监控方法及设备。
背景技术
随着云计算技术的兴起和普及,分布式共享存储系统越来越开始受到业界的关注。传统的网络存储系统采用集中的存储服务器存放所有数据,存储服务器成为系统性能的瓶颈,也是可靠性和安全性的焦点,不能满足大规模存储应用的需要。分布式网络存储系统采用可扩展的系统结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,它不但提高了系统的可靠性、可用性和存取效率,还易于扩展。对分布式存储而言,集群的稳定性和可靠性至关重要。而当前分布式集群选择监控节点来监控整个集群的状态,因此监控节点的选择和稳定性对整个集群稳定性有核心的作用。而当前分布式集群监控节点选择多数与集群的状态无关,当集群处于极其繁忙状态或者异常状态时,监控节点的重新选择往往导致集群无法提供对外读写服务或者引起集群震荡。
发明内容
有鉴于此,本发明的目的在于提供一种分布式存储系统集群监控方法及设备,可以保证集群在繁忙或故障情况下监控节点的稳定,进而保证系统的稳定性,减少系统震荡,保持系统稳定高效运行。其具体方案如下:
一种分布式存储系统集群监控方法,包括:
通过Paxos算法在所有的监控节点中选举出集群监控的主核心监控节点和备用核心监控节点;
判断当前集群是否处于繁忙或故障状态,若是,则不触发重新选举,通过所述备用核心监控节点管理集群,若否,则触发重新选举新的主核心监控节点和备用核心监控节点。
优选地,在本发明实施例提供的上述分布式存储系统集群监控方法中,通过Paxos算法在所有的监控节点中选举出集群监控的主核心监控节点和备用核心监控节点,具体包括:
任一监控节点向其他监控节点发出选举自己作为主核心监控节点的消息,并接收其他监控节点的回应消息;
根据所述回应消息,判断是否所有监控节点都同意所述消息;
若是,则发送所述消息的监控节点作为主核心监控节点,并从其他监控节点中随机选择一个监控节点作为备用核心监控节点;若否,则判断发送所述消息的监控节点是否首次提出选举;
若判断发送所述消息的监控节点是首次提出选举,则发送所述消息的监控节点作为主核心监控节点,并从其他监控节点中随机选择一个监控节点作为备用核心监控节点。
优选地,在本发明实施例提供的上述分布式存储系统集群监控方法中,若判断发送所述消息的监控节点不是首次提出选举,则所有监控节点进行选举,赢得选举的监控节点作为主核心监控节点,并从除赢得选举的监控节点之外的其余监控节点中选举出排序值最低的监控节点作为备用核心监控节点。
优选地,在本发明实施例提供的上述分布式存储系统集群监控方法中,在选举出所述主核心监控节点和备用核心监控节点之后,还包括:
选举出的所述主核心监控节点将选举出的结果进行广播,并向其他监控节点发送结束选举的消息。
优选地,在本发明实施例提供的上述分布式存储系统集群监控方法中,其他监控节点在接收到所述消息后,采用下列方式向发送所述消息的监控节点回复所述回应消息:
对比所述消息中的版本号与自身保存的版本号;
若所述消息中的版本号大于自身保存的版本号,则更新自身保存的版本号,若否,则不同意所述消息;
在更新自身保存的版本号后,比较发送所述消息的监控节点的排序值与自身的排序值;
若发送所述消息的监控节点的排序值低于自身的排序值,则查看是否已经确认过其他监控节点排序值比发送所述消息的监控节点的排序值更低;
若已经确认过,则不同意所述消息;若否,则同意所述消息。
优选地,在本发明实施例提供的上述分布式存储系统集群监控方法中,若发送所述消息的监控节点的排序值不低于自身的排序值,则查看是否已经确认过其他监控节点选举的消息;
若同意过其他监控节点选举的消息,则不同意所述消息;若否,则自身发起选举自己作为主核心监控节点的消息。
优选地,在本发明实施例提供的上述分布式存储系统集群监控方法中,在判断当前集群处于繁忙或故障状态之后,不触发重新选举,通过所述备用核心监控节点管理集群,具体包括:
在判断当前集群处于繁忙或故障状态之后,判断所述主核心监控节点是否失效;
若所述主核心监控节点失效,则判断所述备用核心监控节点是否失效;
若所述备用核心监控节点未失效,则不触发重新选举,通过所述备用核心监控节点管理集群。
优选地,在本发明实施例提供的上述分布式存储系统集群监控方法中,在判断当前集群处于繁忙或故障状态之后,还包括:
若所述主核心监控节点未失效,则不触发重新选举,通过所述主核心监控节点管理集群。
优选地,在本发明实施例提供的上述分布式存储系统集群监控方法中,在判断当前集群处于繁忙或故障状态之后,还包括:
若所述备用核心监控节点失效,则触发重新选举新的主核心监控节点和备用核心监控节点。
本发明实施例还提供了一种分布式存储系统集群监控设备,包括:
节点选举模块,用于通过Paxos算法在所有的监控节点中选举出集群监控的主核心监控节点和备用核心监控节点;
状态判断模块,用于判断当前集群是否处于繁忙或故障状态,若是,则不触发重新选举,通过所述备用核心监控节点管理集群,若否,则触发重新选举新的主核心监控节点和备用核心监控节点。
本发明所提供的一种分布式存储系统集群监控方法及设备,包括:通过Paxos算法在所有的监控节点中选举出集群监控的主核心监控节点和备用核心监控节点;判断当前集群是否处于繁忙或故障状态,若是,则不触发重新选举,通过备用核心监控节点管理集群,若否,则触发重新选举新的主核心监控节点和备用核心监控节点。这样通过优化的选举算法选举出主核心监控节点和备用核心监控节点,当主核心监控节点失效后,备用核心监控节点可以迅速接替它工作,保证集群在繁忙或故障情况下监控节点的稳定,当检测到系统不繁忙后,重新发起选举,保证分布式存储系统的稳定性,从而减少系统震荡,保持系统稳定高效运行,用户的读写服务不受影响。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的分布式存储系统集群监控方法的流程图;
图2为本发明实施例提供的分布式存储系统集群监控方法的具体流程图之一;
图3为本发明实施例提供的分布式存储系统集群监控方法的具体流程图之二;
图4为本发明实施例提供的分布式存储系统集群监控方法的具体流程图之三。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种分布式存储系统集群监控方法,如图1所示,包括以下步骤:
S101、通过Paxos算法在所有的监控节点中选举出集群监控的主核心监控节点和备用核心监控节点;
S102、判断当前集群是否处于繁忙或故障状态;
若是,则执行步骤S103;若否,则执行步骤S104;
S103、不触发重新选举,通过备用核心监控节点管理集群;
S104、触发重新选举新的主核心监控节点和备用核心监控节点。
在本发明实施例提供的上述分布式存储系统集群监控方法中,首先在系统集群处于正常状态下,通过Paxos算法在所有的监控节点中选举出集群监控的主核心监控节点和备用核心监控节点;然后判断当前集群是否处于繁忙或故障状态,若是,则不触发重新选举,通过备用核心监控节点管理集群,若否,则触发重新选举新的主核心监控节点和备用核心监控节点。这样通过优化的选举算法选举出主核心监控节点和备用核心监控节点,当主核心监控节点失效后,备用核心监控节点可以迅速接替它工作,保证集群在繁忙或故障情况下监控节点的稳定,当检测到系统不繁忙后,重新发起选举,保证分布式存储系统的稳定性,从而减少系统震荡,保持系统稳定高效运行,用户的读写服务不受影响。
在具体实施时,在本发明实施例提供的上述分布式存储系统集群监控方法中,如图2所示,步骤S101通过Paxos算法在所有的监控节点中选举出集群监控的主核心监控节点和备用核心监控节点,具体可以包括以下步骤:
S201、任一监控节点向其他监控节点发出选举自己作为主核心监控节点的消息,并接收其他监控节点的回应消息;
S202、根据回应消息,判断是否所有监控节点都同意消息;
若是,则执行步骤S203;若否,则执行步骤S204;
S203、发送消息的监控节点作为主核心监控节点,并从其他监控节点中随机选择一个监控节点作为备用核心监控节点;
S204、判断发送消息的监控节点是否首次提出选举;
若是,则执行步骤S203;若否,则执行步骤S205;
S205、所有监控节点进行选举,赢得选举的监控节点作为主核心监控节点,并从除赢得选举的监控节点之外的其余监控节点中选举出排序(rank)值最低的监控节点作为备用核心监控节点。
在具体实施时,在本发明实施例提供的上述分布式存储系统集群监控方法中,如图2所示,在执行步骤S101选举出主核心监控节点和备用核心监控节点之后,还可以包括以下步骤:
S206、选举出的主核心监控节点将选举出的结果进行广播,并向其他监控节点发送结束选举的消息。
在具体实施时,在本发明实施例提供的上述分布式存储系统集群监控方法中,如图3所示,其他监控节点在接收到消息后,采用下列方式向发送消息的监控节点回复回应消息:
S301、对比消息中的版本号与自身保存的版本号;
S302、判断消息中的版本号是否大于自身保存的版本号;
若是,则执行步骤S303;若否,则执行步骤S304;
S303、更新自身保存的版本号;
S304、不同意消息;
在执行步骤S303更新自身保存的版本号后,执行步骤S305;
S305、判断发送消息的监控节点的rank值是否低于自身的rank值;
若是,则执行步骤S306;若否,则执行步骤S308;
S306、查看是否已经确认过其他监控节点rank值比发送消息的监控节点的rank值更低;
若是,则执行步骤S304;若否,则执行步骤S307;
S307、同意消息;
S308、查看是否已经确认过其他监控节点选举的消息;
若是,则执行步骤S304;若否,则执行步骤S309;
S309、自身发起选举自己作为主核心监控节点的消息。
在具体实施时,在本发明实施例提供的上述分布式存储系统集群监控方法中,如图4所示,在判断当前集群处于繁忙或故障状态之后,不触发重新选举,通过备用核心监控节点管理集群,具体包括:
S401、在判断当前集群处于繁忙或故障状态之后,判断主核心监控节点是否失效;
若是,则执行步骤S402;若否,则执行步骤S405;
S402、判断备用核心监控节点是否失效;
若是,则执行步骤S403;若否,则执行步骤S404;
S403、触发重新选举新的主核心监控节点和备用核心监控节点;
S404、不触发重新选举,通过备用核心监控节点管理集群。
S405、不触发重新选举,通过主核心监控节点管理集群。
基于同一发明构思,本发明实施例还提供了一种分布式存储系统集群监控设备,由于该设备解决问题的原理与前述一种分布式存储系统集群监控方法相似,因此该设备的实施可以参见分布式存储系统集群监控方法的实施,重复之处不再赘述。
在具体实施时,本发明实施例提供的分布式存储系统集群监控设备,具体包括:
节点选举模块,用于通过Paxos算法在所有的监控节点中选举出集群监控的主核心监控节点和备用核心监控节点;
状态判断模块,用于判断当前集群是否处于繁忙或故障状态,若是,则不触发重新选举,通过备用核心监控节点管理集群,若否,则触发重新选举新的主核心监控节点和备用核心监控节点。
本发明实施例提供的一种分布式存储系统集群监控方法及设备,包括:通过Paxos算法在所有的监控节点中选举出集群监控的主核心监控节点和备用核心监控节点;判断当前集群是否处于繁忙或故障状态,若是,则不触发重新选举,通过备用核心监控节点管理集群,若否,则触发重新选举新的主核心监控节点和备用核心监控节点。这样通过优化的选举算法选举出主核心监控节点和备用核心监控节点,当主核心监控节点失效后,备用核心监控节点可以迅速接替它工作,保证集群在繁忙或故障情况下监控节点的稳定,当检测到系统不繁忙后,重新发起选举,保证分布式存储系统的稳定性,从而减少系统震荡,保持系统稳定高效运行,用户的读写服务不受影响。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的分布式存储系统集群监控方法及设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (9)

1.一种分布式存储系统集群监控方法,其特征在于,包括:
通过Paxos算法在所有的监控节点中选举出集群监控的主核心监控节点和备用核心监控节点;
判断当前集群是否处于繁忙或故障状态;在判断当前集群处于繁忙或故障状态之后,判断所述主核心监控节点是否失效;若所述主核心监控节点失效,则判断所述备用核心监控节点是否失效;若所述备用核心监控节点未失效,则不触发重新选举,通过所述备用核心监控节点管理集群;在判断当前集群未处于繁忙或故障状态之后,触发重新选举新的主核心监控节点和备用核心监控节点。
2.根据权利要求1所述的分布式存储系统集群监控方法,其特征在于,通过Paxos算法在所有的监控节点中选举出集群监控的主核心监控节点和备用核心监控节点,具体包括:
任一监控节点向其他监控节点发出选举自己作为主核心监控节点的消息,并接收其他监控节点的回应消息;
根据所述回应消息,判断是否所有监控节点都同意所述消息;
若是,则发送所述消息的监控节点作为主核心监控节点,并从其他监控节点中随机选择一个监控节点作为备用核心监控节点;若否,则判断发送所述消息的监控节点是否首次提出选举;
若判断发送所述消息的监控节点是首次提出选举,则发送所述消息的监控节点作为主核心监控节点,并从其他监控节点中随机选择一个监控节点作为备用核心监控节点。
3.根据权利要求2所述的分布式存储系统集群监控方法,其特征在于,若判断发送所述消息的监控节点不是首次提出选举,则所有监控节点进行选举,赢得选举的监控节点作为主核心监控节点,并从除赢得选举的监控节点之外的其余监控节点中选举出rank值最低的监控节点作为备用核心监控节点。
4.根据权利要求3所述的分布式存储系统集群监控方法,其特征在于,在选举出所述主核心监控节点和备用核心监控节点之后,还包括:
选举出的所述主核心监控节点将选举出的结果进行广播,并向其他监控节点发送结束选举的消息。
5.根据权利要求2所述的分布式存储系统集群监控方法,其特征在于,其他监控节点在接收到所述消息后,采用下列方式向发送所述消息的监控节点回复所述回应消息:
对比所述消息中的版本号与自身保存的版本号;
若所述消息中的版本号大于自身保存的版本号,则更新自身保存的版本号,若否,则不同意所述消息;
在更新自身保存的版本号后,比较发送所述消息的监控节点的rank值与自身的rank值;
若发送所述消息的监控节点的rank值低于自身的rank值,则查看是否已经确认过其他监控节点rank值比发送所述消息的监控节点的rank值更低;
若已经确认过,则不同意所述消息;若否,则同意所述消息。
6.根据权利要求5所述的分布式存储系统集群监控方法,其特征在于,若发送所述消息的监控节点的rank值不低于自身的rank值,则查看是否已经确认过其他监控节点选举的消息;
若同意过其他监控节点选举的消息,则不同意所述消息;若否,则自身发起选举自己作为主核心监控节点的消息。
7.根据权利要求1所述的分布式存储系统集群监控方法,其特征在于,在判断当前集群处于繁忙或故障状态之后,还包括:
若所述主核心监控节点未失效,则不触发重新选举,通过所述主核心监控节点管理集群。
8.根据权利要求7所述的分布式存储系统集群监控方法,其特征在于,在判断当前集群处于繁忙或故障状态之后,还包括:
若所述备用核心监控节点失效,则触发重新选举新的主核心监控节点和备用核心监控节点。
9.一种分布式存储系统集群监控设备,其特征在于,包括:
节点选举模块,用于通过Paxos算法在所有的监控节点中选举出集群监控的主核心监控节点和备用核心监控节点;
状态判断模块,用于判断当前集群是否处于繁忙或故障状态;在判断当前集群处于繁忙或故障状态之后,判断所述主核心监控节点是否失效;若所述主核心监控节点失效,则判断所述备用核心监控节点是否失效;若所述备用核心监控节点未失效,则不触发重新选举,通过所述备用核心监控节点管理集群;在判断当前集群未处于繁忙或故障状态之后,触发重新选举新的主核心监控节点和备用核心监控节点。
CN201710551855.7A 2017-07-07 2017-07-07 一种分布式存储系统集群监控方法及设备 Active CN107360025B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710551855.7A CN107360025B (zh) 2017-07-07 2017-07-07 一种分布式存储系统集群监控方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710551855.7A CN107360025B (zh) 2017-07-07 2017-07-07 一种分布式存储系统集群监控方法及设备

Publications (2)

Publication Number Publication Date
CN107360025A CN107360025A (zh) 2017-11-17
CN107360025B true CN107360025B (zh) 2020-11-10

Family

ID=60292419

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710551855.7A Active CN107360025B (zh) 2017-07-07 2017-07-07 一种分布式存储系统集群监控方法及设备

Country Status (1)

Country Link
CN (1) CN107360025B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109062923B (zh) * 2018-06-04 2022-04-19 创新先进技术有限公司 一种集群状态切换方法及装置
CN109379238B (zh) * 2018-12-14 2022-06-17 郑州云海信息技术有限公司 一种分布式集群的ctdb主节点选举方法、装置及系统
CN112799867B (zh) * 2021-02-03 2022-02-18 柏科数据技术(深圳)股份有限公司 一种基于分布式存储系统的选举方法及分布式存储系统
CN113542052A (zh) * 2021-06-07 2021-10-22 新华三信息技术有限公司 一种节点故障确定方法、装置和服务器
CN114137942B (zh) * 2021-11-29 2023-11-10 北京天融信网络安全技术有限公司 一种分布式控制器集群的控制方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102387210A (zh) * 2011-10-25 2012-03-21 曙光信息产业(北京)有限公司 一种基于快速同步网络的分布式文件系统监控方法
CN106878111A (zh) * 2017-03-15 2017-06-20 郑州云海信息技术有限公司 一种高可用的云监控系统及监控方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9596301B2 (en) * 2006-09-18 2017-03-14 Hewlett Packard Enterprise Development Lp Distributed-leader-election service for a distributed computer system
CN103200033B (zh) * 2013-03-21 2016-09-07 中兴通讯股份有限公司 Cdn与网络融合系统及其主、备用调度单元的选举方法
CN103731341B (zh) * 2013-12-30 2018-08-03 广州华多网络科技有限公司 一种对即时通讯业务进行处理的方法及系统
CN106856489B (zh) * 2015-12-08 2020-09-08 阿里巴巴集团控股有限公司 一种分布式存储系统的服务节点切换方法和装置
CN105681404A (zh) * 2016-01-04 2016-06-15 北京百度网讯科技有限公司 用于分布式缓存系统的元数据节点管理方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102387210A (zh) * 2011-10-25 2012-03-21 曙光信息产业(北京)有限公司 一种基于快速同步网络的分布式文件系统监控方法
CN106878111A (zh) * 2017-03-15 2017-06-20 郑州云海信息技术有限公司 一种高可用的云监控系统及监控方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Monitors and Paxos, a chat with Joao;ceph;《https:/ceph.io/green-categorie/monitors-and-paxos-a-chat-with-joao/》;20130910;全文 *

Also Published As

Publication number Publication date
CN107360025A (zh) 2017-11-17

Similar Documents

Publication Publication Date Title
CN107360025B (zh) 一种分布式存储系统集群监控方法及设备
CN108810100B (zh) 一种主节点的选举方法、装置及设备
CN112463448B (zh) 分布式集群数据库同步方法、装置、设备及存储介质
TWI701916B (zh) 用於在分布式系統中使管理能力自恢復的方法和裝置
CN108881512B (zh) Ctdb的虚拟ip均衡分配方法、装置、设备及介质
CN111901422B (zh) 一种集群中节点的管理方法、系统及装置
CN108984349B (zh) 主节点选举方法及装置、介质和计算设备
CN107659948B (zh) 一种控制ap接入的方法及装置
CN110417600B (zh) 分布式系统的节点切换方法、装置及计算机存储介质
CN112073250B (zh) 控制器集群故障处理方法、装置、控制器及控制器集群
CN110971662A (zh) 一种基于Ceph的两节点高可用实现方法及装置
CN112130761A (zh) 一种存储系统的扩容方法、系统及相关装置
CN106533751B (zh) 一种sdn控制器集群合并方法及装置
CN112130758A (zh) 一种数据读请求的处理方法、系统、电子设备及存储介质
JP6007988B2 (ja) 予備系装置、運用系装置、冗長構成システム、及び負荷分散方法
CN107508700B (zh) 容灾方法、装置、设备及存储介质
EP2071764B1 (en) A method, device and communication system thereof of electing local master
CN113126925A (zh) 一种成员列表确定方法、装置、设备及可读存储介质
CN110737543B (zh) 一种分布式文件系统数据恢复的方法、装置及存储介质
CN111953808A (zh) 一种双机双活架构的数据传输切换方法及架构构建系统
CN112612652A (zh) 分布式存储系统异常节点重启方法及系统
CN111614701A (zh) 一种分布式集群、以及容器状态切换方法、装置
CN112491633B (zh) 一种多节点集群的故障恢复方法、系统及相关组件
CN114297182A (zh) 一种工业模型数据管理方法、装置、设备及可读存储介质
CN113301086A (zh) Dns数据管理系统和管理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant