CN110740167A - 一种分布式存储系统及其节点监控方法 - Google Patents

一种分布式存储系统及其节点监控方法 Download PDF

Info

Publication number
CN110740167A
CN110740167A CN201910894170.1A CN201910894170A CN110740167A CN 110740167 A CN110740167 A CN 110740167A CN 201910894170 A CN201910894170 A CN 201910894170A CN 110740167 A CN110740167 A CN 110740167A
Authority
CN
China
Prior art keywords
key value
target
distributed storage
storage system
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910894170.1A
Other languages
English (en)
Inventor
章恩世
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Inspur Data Technology Co Ltd
Original Assignee
Beijing Inspur Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Inspur Data Technology Co Ltd filed Critical Beijing Inspur Data Technology Co Ltd
Priority to CN201910894170.1A priority Critical patent/CN110740167A/zh
Publication of CN110740167A publication Critical patent/CN110740167A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种分布式存储系统及其节点监控方法、装置及节点,在各个节点均设置etcd系统,基于此,在分布式存储系统选举出向外提供iSCSI服务的目标节点时,etcd系统能够在目标节点创建目标键值,其中目标键值包括分布式存储系统的浮动IP和目标节点的真实IP。此外,etcd系统还能够在目标节点发生故障时删除目标键值,并生成故障信号,以便于重新选举目标节点。可见,本申请利用etcd的键值对存储与键值对监控功能,实现了分布式存储系统的高可用,由于只需要在一个节点上设置浮动IP,大大减轻了集群间的网络压力。另外,得益于etcd监控通知的迅速性,使用etcd调度浮动IP节点,大大缩短了节点调度的时间。

Description

一种分布式存储系统及其节点监控方法
技术领域
本申请涉及计算机技术领域,特别涉及一种分布式存储系统及其节点监控方法、装置及节点。
背景技术
iSCSI是一种基于因特网及SCSI-3协议的存储技术,得益于因特网的迅速发展,iSCSI的使用也越来越普及。iSCSI又称为IP-SAN,它可以将块存储通过网络提供给物理上不在同一区域的多台主机使用。但是单独使用iSCSI存在一个缺陷,即iSCSI服务需要通过一个主机提供出去,若提供服务的主机发生故障,则整个存储服务就不能被使用,这在实际的生产环境中时不被接受的。
所以,一般iSCSI都是配合着分布式系统来使用。在分布式系统中,每个节点都能提供的完整的服务,所以当其中一个节点发生故障时,只要转移到其他节点依旧可以提供相同的服务。iSCSI与分布式系统的结合方式为:使用分布式存储作为iSCSI的后端存储,通过iSCSI将分布式存储共享出去。在这种方式下,需要实现iSCSI的高可用,当其中一个对外提供的节点发生故障时,系统能自动转移到新的节点继续提供相同的服务。
目前,业内普遍的做法是利用浮动IP,在每个分布式系统节点上部署相同的浮动IP,iSCSI客户端通过浮动IP连接iSCSI server获取服务。当提供服务的节点故障后,由于其他节点的浮动IP依然正常,客户端可以通过浮动IP连接到其他正常的节点上,以此来保证服务可用。但这种方式目前存在如下问题:第一,每个节点上都设置相同的浮动IP,会增加网络负载;第二,浮动IP在协调至下一个可用节点时,耗时较长,大约2min左右。
可见,如何降低分布存储系统的网络负载,减少节点故障时切换节点过程的耗时,是亟待本领域技术人员解决的问题。
发明内容
本申请的目的是提供一种分布式存储系统及其节点监控方法、装置及节点,用以解决目前分布式存储系统在全部节点设置相同的浮动IP,导致网络负载较大,且节点切换过程耗时较长的问题。具体方案如下:
第一方面,本申请提供了一种分布式存储系统,包括:设置有etcd系统的多个节点;
在分布式存储系统从所述多个节点中选举出向外提供iSCSI服务的目标节点时,所述etcd系统用于在所述目标节点创建目标键值,其中所述目标键值包括所述分布式存储系统的浮动IP和所述目标节点的真实IP;所述etcd系统还用于在所述目标节点发生故障时删除所述目标键值,并在监测到所述目标键值被删除时生成故障信号,以便于所述分布式存储系统根据所述故障信号重新选举目标节点。
优选的,所述etcd系统具体用于:在所述目标节点发生故障且超出所述目标键值的存活时间时,删除所述目标键值。
优选的,所述etcd系统还用于:在所述目标节点正常运行时,每隔预设时长更新所述目标键值的存活时间,以保持所述目标键值存活;在所述目标节点发生故障时,停止更新所述目标键值的存活时间。
优选的,所述多个节点均设置有sheepdog系统,以作为iSCSI服务的后端存储。
第二方面,本申请还提供了一种分布式存储系统的节点监控方法,基于设置于分布式存储系统的节点上的etcd系统实现,包括:
在所述分布式存储系统选举出向外提供iSCSI服务的目标节点时,在所述目标节点创建目标键值,其中所述目标键值包括所述分布式存储系统的浮动IP和所述目标节点的真实IP;
在所述目标节点发生故障时,删除所述目标键值;
在监测到所述目标键值被删除时,生成故障信号,以便于所述分布式存储系统根据所述故障信号重新选举目标节点。
优选的,所述在所述目标节点发生故障时,删除所述目标键值,包括:
在所述目标节点发生故障且超出所述目标键值的存活时间时,删除所述目标键值。
优选的,在所述删除所述目标键值之前,还包括:
在所述目标节点正常运行时,每隔预设时长更新所述目标键值的存活时间,以保持所述目标键值存活;在所述目标节点发生故障时,停止更新所述目标键值的存活时间。
优选的,所述分布式存储系统的节点均设置有sheepdog系统,以作为iSCSI服务的后端存储。
第三方面,本申请提供了一种分布式存储系统的节点监控装置,包括:
创建模块:用于在所述分布式存储系统选举出向外提供iSCSI服务的目标节点时,在所述目标节点创建目标键值,其中所述目标键值包括所述分布式存储系统的浮动IP和所述目标节点的真实IP;
删除模块:用于在所述目标节点发生故障时,删除所述目标键值;
信号生成模块:用于在监测到所述目标键值被删除时,生成故障信号,以便于所述分布式存储系统根据所述故障信号重新选举目标节点。
第四方面,本申请提供了一种分布式存储系统的节点,包括:
存储器:用于存储计算机程序;
处理器:用于执行所述计算机程序,以实现如上所述的一种分布式存储系统的节点监控方法的步骤。
本申请所提供的一种分布式存储系统,在分布式存储系统的各个节点均设置了etcd系统,基于此,在分布式存储系统选举出向外提供iSCSI服务的目标节点时,etcd系统能够在目标节点创建目标键值,其中目标键值包括分布式存储系统的浮动IP和目标节点的真实IP。此外,etcd系统还能够在目标节点发生故障时删除目标键值,并在监测到目标键值被删除时生成故障信号,以便于分布式存储系统根据故障信号重新选举目标节点。可见,该系统将etcd作为服务发现工具与键值对存储工具,利用etcd的键值对存储与键值对监控功能,实现了分布式存储系统的高可用,同时由于只需要在一个节点上设置浮动IP,所以大大减轻了集群间的网络压力。另外,得益于etcd监控通知的迅速性,使用etcd调度浮动IP节点,大大缩短了节点调度的时间。
此外,本申请还提供了一种分布式存储系统的节点监控方法、节点监控装置及节点,其作用与上述系统的作用相对应,这里不再赘述。
附图说明
为了更清楚的说明本申请实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请所提供的一种分布式存储系统实施例的架构示意图;
图2为本申请所提供的一种分布式存储系统的节点监控方法实施例的实现流程图;
图3为本申请所提供的一种分布式存储系统的节点监控装置实施例的功能框图;
图4为本申请所提供的一种分布式存储系统的节点实施例的结构示意图。
具体实施方式
本申请的核心是提供一种分布式存储系统及其节点监控方法、装置及节点,利用etcd的键值对存储与键值对监控功能,实现了分布式存储系统的高可用,减轻了集群间的网络压力,缩短了节点调度的耗时。
为了使本技术领域的人员更好地理解本申请方案,下面结合附图和具体实施方式对本申请作进一步的详细说明。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面对本申请提供的一种分布式存储系统实施例进行介绍,参见图1,该分布式存储系统11包括:设置有etcd系统12的多个节点;
在分布式存储系统11从所述多个节点中选举出向外提供iSCSI服务的目标节点13时,所述etcd系统12用于在所述目标节点13创建目标键值14,其中所述目标键值14包括所述分布式存储系统的浮动IP和所述目标节点的真实IP;所述etcd系统12还用于在所述目标节点13发生故障时删除所述目标键值14,并在监测到所述目标键值14被删除时生成故障信号,以便于所述分布式存储系统11根据所述故障信号重新选举目标节点。
上述etcd,是指一种可靠的分布式键值存储系统。本实施例在分布式存储系统中全部提供服务的节点上设置并开启etcd,组成etcd集群。
iSCSI,全称Internet Small Computer System Interface,Internet小型计算机系统接口,又称为IP-SAN,是一种基于因特网及SCSI-3协议下的存储技术。
本实施例在分布式存储系统中全部提供服务的节点上设置并开启sheepdog,组成sheepdog集群,作为iSCSI的后端存储。由于sheepdog是一个分布式存储系统,所以sheepdog集群内每个节点都可以提供完全相同的服务。
上述浮动IP是客户端与服务器之间的关键连接,也就是说,iSCSI客户端通过浮动IP连接iSCSI server获取服务。本实施例中,每当分布式存储系统11选举出目标节点13,etcd系统就会在目标节点13上创建目标键值14,目标键值14会记录分布式存储系统11的当前浮动IP以及目标键值14所在节点的真实IP。
上述目标键值14会带有一个存活时间,由创建其的节点定期更新存活时间。具体的,在所述目标节点13正常运行时,etcd系统12每隔预设时长更新所述目标键值14的存活时间,以保持所述目标键值14存活;在所述目标节点13发生故障时,etcd系统12停止更新所述目标键值14的存活时间。
在此基础之上,当目标节点13发生故障,目标键值14的存活时间得不到更新,超出目标键值14的存活时间时,etcd系统12会主动删除目标键值14。
在分布式存储系统中,需要实现iSCSI的高可用,当其中一个对外提供的节点发生故障时,系统需要自动转移到新的节点继续提供相同的服务。因此,本实施例在全部节点上设置监控etcd集群中目标键值14的删除事件,当目标键值14被删除时,所有节点都会感知到该删除事件。
在监测到目标键值14的删除事件之后,etcd集群会生成故障信号,分布式存储系统11在接收到该故障信号之后就会自动执行重新选举目标节点的操作。具体的,通过特定的算法选出新的节点作为目标节点,然后重复上述过程,如在新的目标节点上创建目标键值,并启动iSCSI服务来向外提供存储服务。值得一提的是,目标键值中的浮动IP的值始终固定。
也就是说,当目标节点发生故障时,集群中的其他节点都能捕获到目标键值14的删除事件,并通过一定的算法推举出一个新的节点作为浮动IP的提供节点。
本实施例所提供一种分布式存储系统,在分布式存储系统的各个节点均设置了etcd系统,基于此,在分布式存储系统选举出向外提供iSCSI服务的目标节点时,etcd系统能够在目标节点创建目标键值,其中目标键值包括分布式存储系统的浮动IP和目标节点的真实IP。此外,etcd系统还能够在目标节点发生故障时删除目标键值,并在监测到目标键值被删除时生成故障信号,以便于分布式存储系统根据故障信号重新选举目标节点。
可见,该系统将etcd作为一个服务发现工具与键值存储工具,利用etcd的键值对存储与键值对监控功能,所有节点监控etcd集群内一个相同的键,该键由浮动IP所在节点创建并负责维持其生命周期;该键会记录当前集群中的iSCSI浮动IP以及该浮动IP对应的真实IP及节点。当浮动IP所在节点发生故障时,其他节点感知到浮动IP所在节点离线,会推举出一个新的节点建立浮动IP,并创建上文中所说的键,记录浮动IP与真实IP,由此保证浮动IP一直存在,实现了iSCSI的高可用。
下面对本申请实施例提供的一种分布式存储系统的节点监控方法实施例进行介绍,下文描述的一种分布式存储系统的节点监控方法实基于上文描述的一种分布式存储系统实现。
如图2所示,该方法基于设置于分布式存储系统的节点上的etcd系统实现,包括:
S201、在所述分布式存储系统选举出向外提供iSCSI服务的目标节点时,在所述目标节点创建目标键值,其中所述目标键值包括所述分布式存储系统的浮动IP和所述目标节点的真实IP;
S202、在所述目标节点发生故障时,删除所述目标键值;
S203、在监测到所述目标键值被删除时,生成故障信号,以便于所述分布式存储系统根据所述故障信号重新选举目标节点。
在一些具体的实施例中,所述在所述目标节点发生故障时,删除所述目标键值,包括:
在所述目标节点发生故障且超出所述目标键值的存活时间时,删除所述目标键值。
在一些具体的实施例中,在所述删除所述目标键值之前,还包括:
在所述目标节点正常运行时,每隔预设时长更新所述目标键值的存活时间,以保持所述目标键值存活;在所述目标节点发生故障时,停止更新所述目标键值的存活时间。
在一些具体的实施例中,所述分布式存储系统的节点均设置有sheepdog系统,以作为iSCSI服务的后端存储。
本实施例的一种分布式存储系统的节点监控方法实基于上文描述的一种分布式存储系统实现,因此该方法的具体实施方式可见前文中的一种分布式存储系统的实施例部分。且其作用与上述系统的作用相对应,这里不再赘述。
此外,本申请还提供了一种分布式存储系统的节点监控装置,如图3所示,包括:
创建模块301:用于在所述分布式存储系统选举出向外提供iSCSI服务的目标节点时,在所述目标节点创建目标键值,其中所述目标键值包括所述分布式存储系统的浮动IP和所述目标节点的真实IP;
删除模块302:用于在所述目标节点发生故障时,删除所述目标键值;
信号生成模块303:用于在监测到所述目标键值被删除时,生成故障信号,以便于所述分布式存储系统根据所述故障信号重新选举目标节点。
最后,本申请提供了一种分布式存储系统的节点,如图4所示,包括:
存储器100:用于存储计算机程序;
处理器200:用于执行所述计算机程序,以实现如前文所述的一种分布式存储系统的节点监控方法的步骤。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本申请所提供的方案进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种分布式存储系统,其特征在于,包括:设置有etcd系统的多个节点;
在分布式存储系统从所述多个节点中选举出向外提供iSCSI服务的目标节点时,所述etcd系统用于在所述目标节点创建目标键值,其中所述目标键值包括所述分布式存储系统的浮动IP和所述目标节点的真实IP;所述etcd系统还用于在所述目标节点发生故障时删除所述目标键值,并在监测到所述目标键值被删除时生成故障信号,以便于所述分布式存储系统根据所述故障信号重新选举目标节点。
2.如权利要求1所述的系统,其特征在于,所述etcd系统具体用于:在所述目标节点发生故障且超出所述目标键值的存活时间时,删除所述目标键值。
3.如权利要求2所述的系统,其特征在于,所述etcd系统还用于:在所述目标节点正常运行时,每隔预设时长更新所述目标键值的存活时间,以保持所述目标键值存活;在所述目标节点发生故障时,停止更新所述目标键值的存活时间。
4.如权利要求1-3任意一项所述的系统,其特征在于,所述多个节点均设置有sheepdog系统,以作为iSCSI服务的后端存储。
5.一种分布式存储系统的节点监控方法,其特征在于,基于设置于分布式存储系统的节点上的etcd系统实现,包括:
在所述分布式存储系统选举出向外提供iSCSI服务的目标节点时,在所述目标节点创建目标键值,其中所述目标键值包括所述分布式存储系统的浮动IP和所述目标节点的真实IP;
在所述目标节点发生故障时,删除所述目标键值;
在监测到所述目标键值被删除时,生成故障信号,以便于所述分布式存储系统根据所述故障信号重新选举目标节点。
6.如权利要求5所述的方法,其特征在于,所述在所述目标节点发生故障时,删除所述目标键值,包括:
在所述目标节点发生故障且超出所述目标键值的存活时间时,删除所述目标键值。
7.如权利要求6所述的方法,其特征在于,在所述删除所述目标键值之前,还包括:
在所述目标节点正常运行时,每隔预设时长更新所述目标键值的存活时间,以保持所述目标键值存活;在所述目标节点发生故障时,停止更新所述目标键值的存活时间。
8.如权利要求5-7任意一项所述的方法,其特征在于,所述分布式存储系统的节点均设置有sheepdog系统,以作为iSCSI服务的后端存储。
9.一种分布式存储系统的节点监控装置,其特征在于,包括:
创建模块:用于在所述分布式存储系统选举出向外提供iSCSI服务的目标节点时,在所述目标节点创建目标键值,其中所述目标键值包括所述分布式存储系统的浮动IP和所述目标节点的真实IP;
删除模块:用于在所述目标节点发生故障时,删除所述目标键值;
信号生成模块:用于在监测到所述目标键值被删除时,生成故障信号,以便于所述分布式存储系统根据所述故障信号重新选举目标节点。
10.一种分布式存储系统的节点,其特征在于,包括:
存储器:用于存储计算机程序;
处理器:用于执行所述计算机程序,以实现如权利要求5-8任意一项所述的一种分布式存储系统的节点监控方法的步骤。
CN201910894170.1A 2019-09-20 2019-09-20 一种分布式存储系统及其节点监控方法 Pending CN110740167A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910894170.1A CN110740167A (zh) 2019-09-20 2019-09-20 一种分布式存储系统及其节点监控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910894170.1A CN110740167A (zh) 2019-09-20 2019-09-20 一种分布式存储系统及其节点监控方法

Publications (1)

Publication Number Publication Date
CN110740167A true CN110740167A (zh) 2020-01-31

Family

ID=69269417

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910894170.1A Pending CN110740167A (zh) 2019-09-20 2019-09-20 一种分布式存储系统及其节点监控方法

Country Status (1)

Country Link
CN (1) CN110740167A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111371886A (zh) * 2020-02-29 2020-07-03 苏州浪潮智能科技有限公司 一种iSCSI高可用的实现方法及系统
CN112069154A (zh) * 2020-09-18 2020-12-11 中国工商银行股份有限公司 etcd分布式数据库自动运维方法及相关装置
CN112199176A (zh) * 2020-10-16 2021-01-08 济南浪潮数据技术有限公司 一种业务处理方法、装置及相关设备
CN114553900A (zh) * 2022-02-18 2022-05-27 苏州浪潮智能科技有限公司 一种分布式块存储管理系统、方法及电子设备
CN114584458A (zh) * 2022-03-03 2022-06-03 平安科技(深圳)有限公司 一种基于etcd的集群容灾管理方法、系统、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106850877A (zh) * 2017-03-30 2017-06-13 北京华云网际科技有限公司 分布式存储系统中的虚拟ip的设置方法和装置
CN106850746A (zh) * 2016-12-23 2017-06-13 微梦创科网络科技(中国)有限公司 服务平滑升级的方法及装置
CN107018159A (zh) * 2016-01-27 2017-08-04 五八同城信息技术有限公司 业务请求处理方法及装置、和业务请求方法及装置
US20180287912A1 (en) * 2017-04-03 2018-10-04 Datrium Inc. Data path monitoring in a distributed storage network
CN109040212A (zh) * 2018-07-24 2018-12-18 苏州科达科技股份有限公司 设备接入服务器集群方法、系统、设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107018159A (zh) * 2016-01-27 2017-08-04 五八同城信息技术有限公司 业务请求处理方法及装置、和业务请求方法及装置
CN106850746A (zh) * 2016-12-23 2017-06-13 微梦创科网络科技(中国)有限公司 服务平滑升级的方法及装置
CN106850877A (zh) * 2017-03-30 2017-06-13 北京华云网际科技有限公司 分布式存储系统中的虚拟ip的设置方法和装置
US20180287912A1 (en) * 2017-04-03 2018-10-04 Datrium Inc. Data path monitoring in a distributed storage network
CN109040212A (zh) * 2018-07-24 2018-12-18 苏州科达科技股份有限公司 设备接入服务器集群方法、系统、设备及存储介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111371886A (zh) * 2020-02-29 2020-07-03 苏州浪潮智能科技有限公司 一种iSCSI高可用的实现方法及系统
CN111371886B (zh) * 2020-02-29 2022-12-27 苏州浪潮智能科技有限公司 一种iSCSI高可用的实现方法及系统
CN112069154A (zh) * 2020-09-18 2020-12-11 中国工商银行股份有限公司 etcd分布式数据库自动运维方法及相关装置
CN112069154B (zh) * 2020-09-18 2023-08-29 中国工商银行股份有限公司 etcd分布式数据库自动运维方法及相关装置
CN112199176A (zh) * 2020-10-16 2021-01-08 济南浪潮数据技术有限公司 一种业务处理方法、装置及相关设备
CN114553900A (zh) * 2022-02-18 2022-05-27 苏州浪潮智能科技有限公司 一种分布式块存储管理系统、方法及电子设备
CN114553900B (zh) * 2022-02-18 2023-08-04 苏州浪潮智能科技有限公司 一种分布式块存储管理系统、方法及电子设备
CN114584458A (zh) * 2022-03-03 2022-06-03 平安科技(深圳)有限公司 一种基于etcd的集群容灾管理方法、系统、设备及存储介质

Similar Documents

Publication Publication Date Title
CN110740167A (zh) 一种分布式存储系统及其节点监控方法
US10581674B2 (en) Method and apparatus for expanding high-availability server cluster
CN109274544B (zh) 一种分布式存储系统的故障检测方法及装置
US10313452B2 (en) Migrating a chat message service provided by a chat server to a new chat server
CN103383689A (zh) 一种服务进程故障检测方法、装置及服务节点
CN111371886B (zh) 一种iSCSI高可用的实现方法及系统
CN112612769B (zh) 文件处理方法、装置及存储介质
CN111953566A (zh) 一种基于分布式故障监控的方法和虚拟机高可用系统
CN112202853B (zh) 数据同步方法、系统、计算机设备和存储介质
CN112887367B (zh) 实现分布式集群高可用的方法、系统及计算机可读介质
JP5617304B2 (ja) スイッチング装置、情報処理装置および障害通知制御プログラム
CN106021070A (zh) 服务器集群监测方法及装置
WO2017071384A1 (zh) 报文处理的方法及装置
EP3186720B1 (en) Organizing a computing system having multiple computers, distributing computing tasks among the computers, and maintaining data integrity and redundancy in the computing system
CN111342986B (zh) 分布式节点管理方法及装置、分布式系统、存储介质
CN112671554A (zh) 一种节点故障处理方法及相关装置
CN111752488A (zh) 存储集群的管理方法、装置、管理节点及存储介质
CN109818785B (zh) 一种数据处理方法、服务器集群及存储介质
CN113326100B (zh) 一种集群管理方法、装置、设备及计算机存储介质
CN108509296B (zh) 一种处理设备故障的方法和系统
CN110278109B (zh) 一种容灾方法及系统
US20200042408A1 (en) Method for creating consistency snapshot for distributed application, apparatus, and distributed system
CN109344202B (zh) 一种数据同步方法及管理节点
CN114363356B (zh) 数据同步方法、系统、装置、计算机设备和存储介质
KR101883671B1 (ko) 노드 분산 방법 및 이를 수행하는 관리 서버

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200131