CN111371599A - 一种基于etcd的集群容灾管理系统 - Google Patents

一种基于etcd的集群容灾管理系统 Download PDF

Info

Publication number
CN111371599A
CN111371599A CN202010119902.2A CN202010119902A CN111371599A CN 111371599 A CN111371599 A CN 111371599A CN 202010119902 A CN202010119902 A CN 202010119902A CN 111371599 A CN111371599 A CN 111371599A
Authority
CN
China
Prior art keywords
cluster
monitoring
module
etcd
task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010119902.2A
Other languages
English (en)
Inventor
赵建昌
赵山
王阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Huimao Electronic Port Co Ltd
Original Assignee
Shandong Huimao Electronic Port Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Huimao Electronic Port Co Ltd filed Critical Shandong Huimao Electronic Port Co Ltd
Priority to CN202010119902.2A priority Critical patent/CN111371599A/zh
Publication of CN111371599A publication Critical patent/CN111371599A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0889Techniques to speed-up the configuration process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0823Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
    • H04L41/0836Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability to enhance reliability, e.g. reduce downtime
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0893Assignment of logical groups to network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开一种基于ETCD的集群容灾管理系统,涉及集群管理技术领域,该系统基于ETCD分布式存储特性,通过多节点监控方式,对集群中节点状态进行投票,根据投票结果,确认集群中节点是否发生异常,并对异常状态的节点进行切换,完成对集群中节点状态的实时监控,同时,通过记录节点状态,保证集群中各个节点的稳定性。本发明可以保证集群中各个节点的稳定性,同时,支持多集群监控,且相同类型的集群可以使用同一套监控程序,不同类型的集群则使用不同的监控程序,提高了监控程序的可复用性,还提高了集群的部署效率,保证了集群的稳定性。

Description

一种基于ETCD的集群容灾管理系统
技术领域
本发明涉及集群管理技术领域,具体的说是一种基于ETCD的集群容灾管理系统。
背景技术
随着科技的高速发展,保证应用系统的稳定性变得尤为重要,现阶段许多软件都带有自己的高可用程序,保证应用集群的高可用性,但是许多应用程序对集群状态的判断存在主观性,不能有效反馈集群节点的状态,并且集群较多时,部署的高可用程序会随之增多,每个部署的应用程序都单独进行高可用部署,效率太低,并且可复用性很低。
Etcd是CoreOS基于Raft开发的分布式key-value存储,可用于服务发现、共享配置以及一致性保障(如数据库选主、分布式锁等)。
发明内容
本发明针对目前技术发展的需求和不足之处,提供一种基于ETCD的集群容灾管理系统,通过多节点监控方式,监控集群中节点状态,保证集群中各个节点的稳定性,同时,提高集群的部署效率,保证集群的稳定性。
本发明的一种基于ETCD的集群容灾管理系统,解决上述技术问题采用的技术方案如下:
一种基于ETCD的集群容灾管理系统,该系统基于ETCD分布式存储特性,通过多节点监控方式,对集群中节点状态进行投票,根据投票结果,确认集群中节点是否发生异常,并对异常状态的节点进行切换,完成对集群中节点状态的实时监控,同时,通过记录节点状态,保证集群中各个节点的稳定性。
具体的,集群容灾管理系统通过同一套监控程序监控同一类型的集群,通过不同的监控程序监控不同类型的集群。
具体的,集群容灾管理系统包括:
API接口模块,用于接收用户请求,用户请求包括创建集群监控;
控制服务模块,用于根据用户请求对集群中节点进行监控实例管理、投票管理和故障转移;
事件监听模块,用于根据用户请求对集群中节点状态进行实例监听、投票监听、故障转移监听;
ETCD分布式存储模块,用于实时保存事件监听模块的元数据信息,并根据事件监听模块确定异常节点,还便于用户查看集群中各个节点的稳定性;
任务管理模块,用于根据控制服务模块、事件监听模块和ETCD分布式存储模块的传送信息生成任务,生成的任务实时存储于ETCD分布式存储模块;
定时任务线程池模块,用于根据控制服务模块的集群中节点状态和任务管理模块生成的任务进一步执行异步任务或定时任务,任务执行后实时存储于ETCD分布式存储模块;
更具体的,所涉及事件监听模块实时向ETCD分布式存储模块传送监听信息,ETCD分布式存储模块根据监听信息确定异常节点并传送至任务管理模块,任务管理模块生成节点切换任务或定时任务;
任务管理模块执行节点切换任务,随后,定时任务线程池模块执行异步任务,或者,任务管理模块接收并执行定时任务,随后,定时任务线程池模块执行同步任务;定时任务线程池模块的任务执行结果存储于ETCD分布式存储模块。
更具体的,所涉及用户请求包括创建集群监控,在用户创建集群监控时,创建操作包括:
首先,用户准备好需要监控的集群的健康检查脚本及异常切换脚本;
随后,用户通过API接口模块向控制服务模块发送创建集群监控的请求,利用控制服务模块确定用户请求所包含节点的状态,并将准备的脚本中需要的监控信息经事件监听模块后发送给ETCD分布式存储模块进行实时存储。
更具体的,所涉及用户请求还包括删除集群监控,在用户删除集群监控时,删除操作包括:
首先,用户通过API接口模块向控制服务模块发送删除集群监控的请求,请求参数应当为创建集群监控时的监控实例ID;
随后,根据用户删除集群监控的请求,删除经事件监听模块存储在ETCD分布式存储模块中与监控实例ID相同的元数据信息;
同时,用户删除控制服务模块中与监控实例ID相同的集群监控。
更具体的,所涉及用户请求还包括更新集群监控,在用户更新集群监控时,更新操作包括:
首先,用户通过API接口模块向控制服务模块发送更新集群监控的请求,请求参数应当为需要更新的集群信息;
随后,控制服务模块暂停所要更新集群的监控任务;
同时,根据用户更新集群监控的请求,更新经事件监听模块存储在ETCD分布式存储模块中集群的原始元数据信息;
最后,ETCD分布式存储模块的信息更新完毕后,控制服务模块继续对更新集群进行监控。
更具体的,所涉及用户请求还包括集群监控状态,集群监控状态包含状态检测和状态修复;
A)集群监控的状态检测流程如下:
A1)用户通过API接口模块向控制服务模块发送创建集群监控的请求,设定时间间隔,对集群按照时间间隔发送健康状态检测脚本,脚本返回结果:
A1-a)返回成功时,通过事件监听模块更新ETCD分布式存储模块存储的元数据信息;
A1-b)返回失败时,ETCD分布式存储模块根据事件监听模块的监听信息确认投票结果,执行步骤A2);
A2)多个节点投票完成后,判断ETCD分布式存储模块中投异常票的节点数是否过半,超过半数,则任务实例状态异常,则进行集群状态修复。
B)集群监控的状态修复流程如下:
B1)根据ETCD分布式存储模块的投票结果确定需要修复的集群后,控制服务模块暂停所要更新集群的监控任务;
B2)用户在ETCD分布式存储模块预存有集群中所有节点的集群状态修复脚本,用户通过API接口模块随机选择一个节点,利用ETCD分布式存储模块存储的集群状态修复脚本进行选中节点的状态修复。
本发明的一种基于ETCD的集群容灾管理系统,与现有技术相比具有的有益效果是:
本发明基于ETCD分布式存储特性,对集群中的节点状态进行实时监控,保证集群中各个节点的稳定性,同时,支持多集群监控,且相同类型的集群可以使用同一套监控程序,不同类型的集群则使用不同的监控程序,提高了监控程序的可复用性,还提高了集群的部署效率,保证了集群的稳定性。
附图说明
附图1是本发明的连接框图。
附图中各标号信息表示:
1、API接口模块,2、控制服务模块,3、事件监听模块,
4、ETCD分布式存储模块,5、任务管理模块,6、定时任务线程池模块。
具体实施方式
为使本发明的技术方案、解决的技术问题和技术效果更加清楚明白,以下结合具体实施例,对本发明的技术方案进行清楚、完整的描述。
实施例一:
本实施例提出一种基于ETCD的集群容灾管理系统,该系统基于ETCD分布式存储特性,通过多节点监控方式,对集群中节点状态进行投票,根据投票结果,确认集群中节点是否发生异常,并对异常状态的节点进行切换,完成对集群中节点状态的实时监控,同时,通过记录节点状态,保证集群中各个节点的稳定性。
本实施例实施过程中,集群容灾管理系统通过同一套监控程序监控同一类型的集群,通过不同的监控程序监控不同类型的集群。
结合附图1,在本实施例中,针对该系统的实现过程,集群容灾管理系统包括:
API接口模块1,用于接收用户请求,用户请求包括创建集群监控;
控制服务模块2,用于根据用户请求对集群中节点进行监控实例管理、投票管理和故障转移;
事件监听模块3,用于根据用户请求对集群中节点状态进行实例监听、投票监听、故障转移监听;
ETCD分布式存储模块4,用于实时保存事件监听模块3的元数据信息,并根据事件监听模块3确定异常节点,还便于用户查看集群中各个节点的稳定性;
任务管理模块5,用于根据控制服务模块2、事件监听模块3和ETCD分布式存储模块4的传送信息生成任务,生成的任务实时存储于ETCD分布式存储模块4;
定时任务线程池模块6,用于根据控制服务模块2的集群中节点状态和任务管理模块5生成的任务进一步执行异步任务或定时任务,任务执行后实时存储于ETCD分布式存储模块4;
在上述模块中,所涉及事件监听模块3实时向ETCD分布式存储模块4传送监听信息,ETCD分布式存储模块4根据监听信息确定异常节点并传送至任务管理模块5,任务管理模块5生成节点切换任务或定时任务;
任务管理模块5执行节点切换任务,随后,定时任务线程池模块6执行异步任务,或者,任务管理模块5接收并执行定时任务,随后,定时任务线程池模块6执行同步任务;定时任务线程池模块6的任务执行结果存储于ETCD分布式存储模块4。
在本实施例中,所涉及用户请求包括创建集群监控,在用户创建集群监控时,创建操作包括:
首先,用户准备好需要监控的集群的健康检查脚本及异常切换脚本;
随后,用户通过API接口模块1向控制服务模块2发送创建集群监控的请求,利用控制服务模块2确定用户请求所包含节点的状态,并将准备的脚本中需要的监控信息经事件监听模块3后发送给ETCD分布式存储模块4进行实时存储。
在本实施例中,所涉及用户请求还包括删除集群监控,在用户删除集群监控时,删除操作包括:
首先,用户通过API接口模块1向控制服务模块2发送删除集群监控的请求,请求参数应当为创建集群监控时的监控实例ID;
随后,根据用户删除集群监控的请求,删除经事件监听模块3存储在ETCD分布式存储模块4中与监控实例ID相同的元数据信息;
同时,用户删除控制服务模块2中与监控实例ID相同的集群监控。
在本实施例中,所涉及用户请求还包括更新集群监控,在用户更新集群监控时,更新操作包括:
首先,用户通过API接口模块1向控制服务模块2发送更新集群监控的请求,请求参数应当为需要更新的集群信息;
随后,控制服务模块2暂停所要更新集群的监控任务;
同时,根据用户更新集群监控的请求,更新经事件监听模块3存储在ETCD分布式存储模块4中集群的原始元数据信息;
最后,ETCD分布式存储模块4的信息更新完毕后,控制服务模块2继续对更新集群进行监控。
在本实施例中,所涉及用户请求还包括集群监控状态,集群监控状态包含状态检测和状态修复;
A)集群监控的状态检测流程如下:
A1)用户通过API接口模块1向控制服务模块2发送创建集群监控的请求,设定时间间隔,对集群按照时间间隔发送健康状态检测脚本,脚本返回结果:
A1-a)返回成功时,通过事件监听模块3更新ETCD分布式存储模块4存储的元数据信息;
A1-b)返回失败时,ETCD分布式存储模块4根据事件监听模块3的监听信息确认投票结果,执行步骤A2);
A2)多个节点投票完成后,判断ETCD分布式存储模块4中投异常票的节点数是否过半,超过半数,则任务实例状态异常,则进行集群状态修复。
B)集群监控的状态修复流程如下:
B1)根据ETCD分布式存储模块4的投票结果确定需要修复的集群后,控制服务模块2暂停所要更新集群的监控任务;
B2)用户在ETCD分布式存储模块4预存有集群中所有节点的集群状态修复脚本,用户通过API接口模块1随机选择一个节点,利用ETCD分布式存储模块4存储的集群状态修复脚本进行选中节点的状态修复。
综上可知,采用本发明的一种基于ETCD的集群容灾管理系统,基于ETCD分布式存储特性,对集群中的节点状态进行实时监控,保证集群中各个节点的稳定性,同时,支持多集群监控,且相同类型的集群可以使用同一套监控程序,不同类型的集群则使用不同的监控程序,提高了监控程序的可复用性,还提高了集群的部署效率,保证了集群的稳定性。
以上应用具体个例对本发明的原理及实施方式进行了详细阐述,这些实施例只是用于帮助理解本发明的核心技术内容。基于本发明的上述具体实施例,本技术领域的技术人员在不脱离本发明原理的前提下,对本发明所作出的任何改进和修饰,皆应落入本发明的专利保护范围。

Claims (8)

1.一种基于ETCD的集群容灾管理系统,其特征在于,该系统基于ETCD分布式存储特性,通过多节点监控方式,对集群中节点状态进行投票,根据投票结果,确认集群中节点是否发生异常,并对异常状态的节点进行切换,完成对集群中节点状态的实时监控,同时,通过记录节点状态,保证集群中各个节点的稳定性。
2.根据权利要求1所述的一种基于ETCD的集群容灾管理系统,其特征在于,所述系统通过同一套监控程序监控同一类型的集群,通过不同的监控程序监控不同类型的集群。
3.根据权利要求1所述的一种基于ETCD的集群容灾管理系统,其特征在于,所述系统包括:
API接口模块,用于接收用户请求,所述用户请求包括创建集群监控;
控制服务模块,用于根据用户请求对集群中节点进行监控实例管理、投票管理和故障转移;
事件监听模块,用于根据用户请求对集群中节点状态进行实例监听、投票监听、故障转移监听;
ETCD分布式存储模块,用于实时保存事件监听模块的元数据信息,并根据事件监听模块确定异常节点,还便于用户查看集群中各个节点的稳定性;
任务管理模块,用于根据控制服务模块、事件监听模块和ETCD分布式存储模块的传送信息生成任务,生成的任务实时存储于所述ETCD分布式存储模块;
定时任务线程池模块,用于根据控制服务模块的集群中节点状态和任务管理模块生成的任务进一步执行异步任务或定时任务,任务执行后实时存储于所述ETCD分布式存储模块。
4.根据权利要求3所述的一种基于ETCD的集群容灾管理系统,其特征在于,所述事件监听模块实时向ETCD分布式存储模块传送监听信息,所述ETCD分布式存储模块根据监听信息确定异常节点并传送至所述任务管理模块,所述任务管理模块生成节点切换任务或定时任务;
所述任务管理模块执行节点切换任务,随后,所述定时任务线程池模块执行异步任务,或者,所述任务管理模块接收并执行定时任务,随后,所述定时任务线程池模块执行同步任务;所述定时任务线程池模块的任务执行结果存储于所述ETCD分布式存储模块。
5.根据权利要求3所述的一种基于ETCD的集群容灾管理系统,其特征在于,所述用户请求包括创建集群监控,在用户创建集群监控时,创建操作包括:
首先,用户准备好需要监控的集群的健康检查脚本及异常切换脚本;
随后,用户通过所述API接口模块向所述控制服务模块发送创建集群监控的请求,利用控制服务模块确定用户请求所包含节点的状态,并将准备的脚本中需要的监控信息经所述事件监听模块后发送给ETCD分布式存储模块进行实时存储。
6.根据权利要求5所述的一种基于ETCD的集群容灾管理系统,其特征在于,所述用户请求还包括删除集群监控,在用户删除集群监控时,删除操作包括:
首先,用户通过所述API接口模块向所述控制服务模块发送删除集群监控的请求,请求参数应当为创建集群监控时的监控实例ID;
随后,根据用户删除集群监控的请求,删除经所述事件监听模块存储在所述ETCD分布式存储模块中与监控实例ID相同的元数据信息;
同时,用户删除控制服务模块中与监控实例ID相同的集群监控。
7.根据权利要求5所述的一种基于ETCD的集群容灾管理系统,其特征在于,所述用户请求还包括更新集群监控,在用户更新集群监控时,更新操作包括:
首先,用户通过所述API接口模块向所述控制服务模块发送更新集群监控的请求,请求参数应当为需要更新的集群信息;
随后,所述控制服务模块暂停所要更新集群的监控任务;
同时,根据用户更新集群监控的请求,更新经所述事件监听模块存储在所述ETCD 分布式存储模块中集群的原始元数据信息;
最后,所述ETCD分布式存储模块的信息更新完毕后,所述控制服务模块继续对更新集群进行监控。
8.根据权利要求5-7中任一项所述的一种基于ETCD的集群容灾管理系统,其特征在于,所述用户请求还包括集群监控状态,所述集群监控状态包含状态检测和状态修复;
A)所述集群监控的状态检测流程如下:
A1)用户通过所述API接口模块向所述控制服务模块发送创建集群监控的请求,设定时间间隔,对集群按照时间间隔发送健康状态检测脚本,脚本返回结果:
A1-a)返回成功时,通过所述事件监听模块更新所述ETCD分布式存储模块存储的元数据信息;
A1-b)返回失败时,所述ETCD分布式存储模块根据所述事件监听模块的监听信息确认投票结果,执行步骤A2);
A2)多个节点投票完成后,判断所述ETCD分布式存储模块中投异常票的节点数是否过半,超过半数,则任务实例状态异常,则进行集群状态修复。
B)所述集群监控的状态修复流程如下:
B1)根据所述ETCD分布式存储模块的投票结果确定需要修复的集群后,所述控制服务模块暂停所要更新集群的监控任务;
B2)用户在所述ETCD分布式存储模块预存有集群中所有节点的集群状态修复脚本,用户通过所述API接口模块随机选择一个节点,利用所述ETCD分布式存储模块存储的集群状态修复脚本进行选中节点的状态修复。
CN202010119902.2A 2020-02-26 2020-02-26 一种基于etcd的集群容灾管理系统 Pending CN111371599A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010119902.2A CN111371599A (zh) 2020-02-26 2020-02-26 一种基于etcd的集群容灾管理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010119902.2A CN111371599A (zh) 2020-02-26 2020-02-26 一种基于etcd的集群容灾管理系统

Publications (1)

Publication Number Publication Date
CN111371599A true CN111371599A (zh) 2020-07-03

Family

ID=71208260

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010119902.2A Pending CN111371599A (zh) 2020-02-26 2020-02-26 一种基于etcd的集群容灾管理系统

Country Status (1)

Country Link
CN (1) CN111371599A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111813605A (zh) * 2020-07-20 2020-10-23 北京百度网讯科技有限公司 容灾方法、平台、电子设备以及介质
CN112015593A (zh) * 2020-08-27 2020-12-01 北京浪潮数据技术有限公司 Kubernetes集群的容灾备份方法及相关组件
CN114584458A (zh) * 2022-03-03 2022-06-03 平安科技(深圳)有限公司 一种基于etcd的集群容灾管理方法、系统、设备及存储介质
CN114764380A (zh) * 2021-01-15 2022-07-19 国电南瑞科技股份有限公司 一种基于etcd的分布式集群控制方法和装置
CN115421971A (zh) * 2022-08-16 2022-12-02 江苏安超云软件有限公司 Etcd灾备故障恢复的方法及应用
WO2024148854A1 (zh) * 2023-01-09 2024-07-18 苏州元脑智能科技有限公司 基于监控服务的数据库故障处理方法、装置及分布式集群

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170116095A1 (en) * 2015-10-27 2017-04-27 Netapp, Inc. Third vote consensus in a cluster using shared storage devices
CN107038192A (zh) * 2016-11-17 2017-08-11 阿里巴巴集团控股有限公司 数据库容灾方法和装置
CN107147540A (zh) * 2017-07-19 2017-09-08 郑州云海信息技术有限公司 高可用性系统中的故障处理方法和故障处理集群

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170116095A1 (en) * 2015-10-27 2017-04-27 Netapp, Inc. Third vote consensus in a cluster using shared storage devices
CN107038192A (zh) * 2016-11-17 2017-08-11 阿里巴巴集团控股有限公司 数据库容灾方法和装置
CN107147540A (zh) * 2017-07-19 2017-09-08 郑州云海信息技术有限公司 高可用性系统中的故障处理方法和故障处理集群

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111813605A (zh) * 2020-07-20 2020-10-23 北京百度网讯科技有限公司 容灾方法、平台、电子设备以及介质
CN112015593A (zh) * 2020-08-27 2020-12-01 北京浪潮数据技术有限公司 Kubernetes集群的容灾备份方法及相关组件
CN114764380A (zh) * 2021-01-15 2022-07-19 国电南瑞科技股份有限公司 一种基于etcd的分布式集群控制方法和装置
CN114584458A (zh) * 2022-03-03 2022-06-03 平安科技(深圳)有限公司 一种基于etcd的集群容灾管理方法、系统、设备及存储介质
CN115421971A (zh) * 2022-08-16 2022-12-02 江苏安超云软件有限公司 Etcd灾备故障恢复的方法及应用
WO2024148854A1 (zh) * 2023-01-09 2024-07-18 苏州元脑智能科技有限公司 基于监控服务的数据库故障处理方法、装置及分布式集群

Similar Documents

Publication Publication Date Title
CN111371599A (zh) 一种基于etcd的集群容灾管理系统
CN102567438A (zh) 对分布式存储系统中的数据项进行访问的方法
CN106909411A (zh) 一种文件更新方法及装置
CN103595572B (zh) 一种云计算集群中节点自修复的方法
CN109063005B (zh) 一种数据迁移方法及系统、存储介质、电子设备
CN111026602A (zh) 一种云平台的健康巡检调度管理方法、装置及电子设备
CN112199178B (zh) 一种基于轻量化容器的云服务动态调度方法及系统
CN113010392B (zh) 大数据平台的测试方法、装置、设备、存储介质和系统
CN109144789A (zh) 一种重启osd的方法、装置及系统
CN109697112A (zh) 分布式集约化一站式作业系统和实现方法
CN111984274A (zh) 一种一键自动化部署etcd集群的方法及装置
CN115242596B (zh) 面向用户的网络测试床场景业务调度方法及装置
CN113515316A (zh) 一种新型边缘云操作系统
CN115658166A (zh) 集中管理和容易使用应用程序配置的系统、方法及介质
CN115801799A (zh) 基于kubernetes多集群管理中间件生命周期的系统
CN115550164A (zh) 一种一键安装、管理单节点大数据组件的方法及系统
CN113064755B (zh) 数据恢复方法、装置、设备、介质及程序产品
CN115017235A (zh) 数据同步方法及电子设备、存储介质
CN101621404A (zh) 一种故障分层处理方法和系统
CN109508223A (zh) 一种虚拟机批量创建方法、系统及设备
CN116185697B (zh) 容器集群管理方法、装置、系统、电子设备及存储介质
WO2024078015A1 (zh) 基于镜像对的故障注入方法、装置、设备和存储介质
CN111338767B (zh) PostgreSQL主从数据库自动切换系统及方法
CN111881018A (zh) 一种自动化测试动态调度系统
CN114036129A (zh) 一种减小数据丢失的数据库切换方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200703