CN109460315A - 共享磁盘故障节点的处理方法、装置、计算机设备 - Google Patents

共享磁盘故障节点的处理方法、装置、计算机设备 Download PDF

Info

Publication number
CN109460315A
CN109460315A CN201811563025.7A CN201811563025A CN109460315A CN 109460315 A CN109460315 A CN 109460315A CN 201811563025 A CN201811563025 A CN 201811563025A CN 109460315 A CN109460315 A CN 109460315A
Authority
CN
China
Prior art keywords
node
malfunctioning
shared disk
malfunctioning node
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811563025.7A
Other languages
English (en)
Inventor
盛凯博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huadi Computer Group Co Ltd
Original Assignee
Huadi Computer Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huadi Computer Group Co Ltd filed Critical Huadi Computer Group Co Ltd
Priority to CN201811563025.7A priority Critical patent/CN109460315A/zh
Publication of CN109460315A publication Critical patent/CN109460315A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了共享磁盘故障节点的处理方法,属于计算机技术领域。所述方法包括:接收正常节点发送的故障节点修复命令;根据所述故障节点修复命令,判断所述故障节点是否为当前节点;当所述故障节点为当前节点时,对所述当前节点进行故障修复;其中,每个所述节点对应于一个共享磁盘分区,所述共享磁盘分区包括共享磁盘头、节点标识区、命令区和节点信息区,所述当前节点接收所述故障节点修复命令后存储于所述命令区。采用本方法能够降低处理节点故障的成本、提高故障处理想效率。

Description

共享磁盘故障节点的处理方法、装置、计算机设备
技术领域
本发明涉及计算机技术领域,并且更具体地,涉及一种共享磁盘故障节点的处理方法、装置、计算机设备。
背景技术
在高可用集群中,通过节点的心跳网络连接状况判断节点是否活跃,当节点的心跳网络出现故障,运行在生产节点的服务可迁移到其它健康节点,以保证高可用集群能够对外提供不间断的可用服务,生产节点为正在提供服务的节点。当高可用集群中各节点心跳网络正常,生产节点由于某种程序故障或恶意插件导致内存或CPU耗尽,由于SSH(SecureShell,安全外壳)协议不能登录到产生故障的生产节点,因此不能根据集群的策略引擎发出的服务迁移指令将服务可迁移到其它健康节点,导致服务滞留在内存耗尽的生产节点上,最终导致高可用集群对外提供的服务瘫痪。
现有使用串行或者基于网络的电源切换设备作为fencing资源,添加到高可用集群中。这种设备采用stonithd机制,stonith的意思是"Shoot the Other Node in theHead",主要是使出现问题的节点从集群环境中脱离,即对出现问题的节点关机或重启。当现有方法存在如下问题:
向高可用集群中添加额外的fencing设备,来保证高可用集群的不间断服务,由于这种设备价格昂贵,并不适合中小企业。同时,生产环境中出现生产节点出现故障问题必须及时解决以恢复集群正常服务,如果通过购买设备来解决所述问题,导致问题解决不及时,会造成巨大损失。
发明内容
基于此,未解决上述问题,提供一种能够降低故障节点处理成本和提高故障处理效率的共享磁盘故障节点的处理方法、装置、计算机设备。
一种共享磁盘故障节点的处理方法,所述方法包括:
接收正常节点发送的故障节点修复命令;
根据所述故障节点修复命令,判断所述故障节点是否为当前节点;
当所述故障节点为当前节点时,对所述当前节点进行故障修复;
其中,每个所述节点对应于一个共享磁盘分区,所述共享磁盘分区包括共享磁盘头、节点标识区、命令区和节点信息区,所述当前节点接收所述故障节点修复命令后存储于所述命令区。
在其中一个实施例中,所述方法还包括:
当所述故障节点不为当前节点时,判断所述故障节点是否存在于集群中;
当所述故障节点存在于集群中时,则将所述故障节点修复命令发送至所述故障节点;
当所述故障节点不存在于集群中时,删除所述故障节点修复命令;
其中,所述集群包括多个节点,集群中各个节点之间相互连接,集群各个节点通过主控节点进行任务调度。
在其中一个实施例中,所述故障节点修复命令包括命令发送节点标识、故障修复命令和命令接收节点标识。
在其中一个实施例中,所述根据所述故障节点修复命令,判断所述故障节点是否为当前节点,包括:
根据所述故障节点修复命令中所述命令接收节点标识,判断所述命令接收节点标识与当前节点标识是否相同;
如果所述命令接收节点标识与当前节点标识相同,则判断所述故障节点为当前节点,否则判断所述故障节点不为当前节点。
在其中一个实施例中,所述故障修复包括关闭或重启所述当前节点。
一种共享磁盘故障节点的获取方法,所述方法包括:
将当前节点的共享磁盘分区配置信息发送至集群;
初始化所述共享磁盘分区;
启动守护进程,通过所述共享磁盘分区获取所述集群中其它节点信息;
根据所述节点信息,获取故障节点并发送故障节点修复命令;
其中,所述集群包括多个节点,集群中各个节点之间相互通信连接,集群各个节点通过主控节点进行任务调度。
在其中一个实施例中,所述初始化所述共享磁盘分区之后,包括:
当启动守护进程从所述共享磁盘分区获取到所述集群中其它节点信息时,则向集群中的其它相关进程发送所述共享磁盘分区初始化成功消息;
当启动守护进程不能从所述共享磁盘分区获取所述集群中其它节点信息时,则向集群中的其它相关进程发送所述共享磁盘分区初始化失败消息。
一种共享磁盘故障节点的处理装置,所述装置包括:
命令接收模块,用于接收正常节点发送的故障节点修复命令;
判断模块,用于根据所述故障节点修复命令,判断所述故障节点是否为当前节点;
故障修复模块,用于当所述故障节点为当前节点时,对所述当前节点进行故障修复;
其中,每个所述节点对应于一个共享磁盘分区,所述共享磁盘分区包括共享磁盘头、节点标识区、命令区和节点信息区,所述当前节点接收所述故障节点修复命令后存储于所述命令区。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
接收正常节点发送的故障节点修复命令;
根据所述故障节点修复命令,判断所述故障节点是否为当前节点;
当所述故障节点为当前节点时,对所述当前节点进行故障修复;
其中,每个所述节点对应于一个共享磁盘分区,所述共享磁盘分区包括共享磁盘头、节点标识区、命令区和节点信息区,所述当前节点接收所述故障节点修复命令后存储于所述命令区。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
接收正常节点发送的故障节点修复命令;
根据所述故障节点修复命令,判断所述故障节点是否为当前节点;
当所述故障节点为当前节点时,对所述当前节点进行故障修复;
其中,每个所述节点对应于一个共享磁盘分区,所述共享磁盘分区包括共享磁盘头、节点标识区、命令区和节点信息区,所述当前节点接收所述故障节点修复命令后存储于所述命令区。
上述共享磁盘故障节点的处理方法、装置、计算机设备,通过对每个节点建立共享磁盘分区,再通过正常节点向故障节点发送故障修复命令,以实现对故障的有效处理,从而避免通过外部的fencing设备来处理故障,能够降低节点故障的处理成本,提供故障的处理效率。
附图说明
通过参考下面的附图,可以更为完整地理解本发明的示例性实施方式:
图1为一个实施例中共享磁盘故障节点的处理方法的流程示意图;
图2为一个实施例中故障节点修复命令转发步骤的流程示意图;
图3为一个实施例中共享磁盘分区的组成示意图;
图4为一个实施例中共享磁盘故障节点的获取方法的流程示意图;
图5为一个实施例中共享磁盘故障节点的处理装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。
除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。
在一个实施例中,如图1所示,提供一种共享磁盘故障节点的处理方法,所述方法包括步骤:
步骤S110,接收正常节点发送的故障节点修复命令。
其中,所述故障节点修复命令包括命令发送节点标识、故障修复命令和命令接收节点标识。所述命令发送节点标识用于保存命令发送节点的地址信息,所述命令接收节点标识用于保存命令接收节点的地址信息。
步骤S120,根据所述故障节点修复命令,判断所述故障节点是否为当前节点。
步骤S130,当所述故障节点为当前节点时,对所述当前节点进行故障修复。
其中,每个所述节点对应于一个共享磁盘分区,所述共享磁盘分区包括共享磁盘头、节点标识区、命令区和节点信息区,所述当前节点接收所述故障节点修复命令后存储于所述命令区。如图3所示,所述节点标识区用于存储节点id与节点磁盘id映射表,所述命令区为Message命令,所述Message命令包括命令发送节点标识、故障修复命令和命令接收节点标识,所述节点信息区用于存储节点信息,所述节点信息包括时间戳、节点id、节点名称、节点状态、节点状态持续时间、是否是主控节点中至少一种。
其中,所述当前节点通过守护进程进行故障修复。所述守护进程运行在所有节点上,并把节点的状态信息放到指定的共享磁盘分区。
本实施例中,节点出现故障有两种情况:第一,出现节点心跳断裂,即当集群中的某一节点的信息持续不变时(达到超时时间),则认为节点心跳断裂,故障修复方法为删除节点信息、回收此分区;第二,节点出现内存、CPU耗尽,故障节点修复命令为重启或关闭此节点信息,故障修复方法为根据重启或关闭此节点信息对节点进行重启或关闭。
在其中一个实施例中,在步骤S120中,所述根据所述故障节点修复命令,判断所述故障节点是否为当前节点,包括:根据所述故障节点修复命令中所述命令接收节点标识,判断所述命令接收节点标识与当前节点标识是否相同;如果所述命令接收节点标识与当前节点标识相同,则判断所述故障节点为当前节点,否则判断所述故障节点不为当前节点。
在其中一个实施例中,所述故障修复包括关闭或重启所述当前节点。
上述共享磁盘故障节点的处理方法中,通过对每个节点建立共享磁盘分区,再通过正常节点向故障节点发送故障修复命令,以实现对故障的有效处理,从而避免通过外部的fencing设备来处理故障,能够降低节点故障的处理成本,提供故障的处理效率。
在其中一个实施例中,如图2所示,一种共享磁盘故障节点的处理方法,包括步骤:
步骤S110,接收正常节点发送的故障节点修复命令。
步骤S120,根据所述故障节点修复命令,判断所述故障节点是否为当前节点。
步骤S130,如果所述故障节点为当前节点,对所述当前节点进行故障修复。
步骤S140,如果所述故障节点不为当前节点,判断所述故障节点是否存在于集群中。
步骤S150,如果所述故障节点存在于集群中,将所述故障节点修复命令发送至所述故障节点。
步骤S160,如果所述故障节点不存在于集群中,删除所述故障节点修复命令。
具体的,所述故障节点不存在于集群中,则将命令区置0。
其中,所述集群包括多个节点,集群中各个节点之间相互连接,集群各个节点通过主控节点进行任务调度。
在一个实施例中,如图4所示,一种共享磁盘故障节点的获取方法,包括步骤:
步骤S210,将当前节点的共享磁盘分区配置信息发送至集群。
其中,每个节点加入集群之前,需要将所述节点的共享磁盘分区配置信息发送至集群。
步骤S220,初始化所述共享磁盘分区。
所述共享磁盘分区包括共享磁盘头、节点标识区、命令区和节点信息区,所述当前节点接收所述故障节点修复命令后存储于所述命令区。
具体的,初始化所述共享磁盘分区为在所述共享磁盘头、节点标识区、命令区和节点信息区存入对应的信息。
步骤S230,启动守护进程,通过所述共享磁盘分区获取所述集群中其它节点信息。
其中,共享磁盘分区中的节点信息区存储了集群中其它节点信息。所述其它节点的信息通过守护进程,存放在共享磁盘分区中的节点信息区。
步骤S240,根据所述节点信息,获取故障节点并发送故障节点修复命令。
其中,所述节点信息包括时间戳、节点id、节点名称、节点状态、节点状态持续时间、是否是主控节点中至少一种。通过节点信息中节点状态能够判断某一节点是否为故障节点,并向故障节点发送故障节点修复命令。
其中,所述集群包括多个节点,集群中各个节点之间相互通信连接,集群各个节点通过主控节点进行任务调度。
在其中一个实施例中,所述初始化所述共享磁盘分区之后,包括:当启动守护进程从所述共享磁盘分区获取到所述集群中其它节点信息时,则向集群中的其它相关进程发送所述共享磁盘分区初始化成功消息;当启动守护进程不能从所述共享磁盘分区获取所述集群中其它节点信息时,则向集群中的其它相关进程发送所述共享磁盘分区初始化失败消息。
应该理解的是,虽然图1、2、4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1、2、4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供一种共享磁盘故障节点的处理装置,所述装置包括:命令接收模块310、判断模块320和故障修复模块330。
其中:
命令接收模块310,用于接收正常节点发送的故障节点修复命令。
判断模块320,用于根据所述故障节点修复命令,判断所述故障节点是否为当前节点。
故障修复模块330,用于当所述故障节点为当前节点时,对所述当前节点进行故障修复。
其中,每个所述节点对应于一个共享磁盘分区,所述共享磁盘分区包括共享磁盘头、节点标识区、命令区和节点信息区,所述当前节点接收所述故障节点修复命令后存储于所述命令区。
在其中一个实施例中,所述判断模块320包括:节点标识判断单元,用于根据所述故障节点修复命令中所述命令接收节点标识,判断所述命令接收节点标识与当前节点标识是否相同,如果所述命令接收节点标识与当前节点标识相同,则判断所述故障节点为当前节点,否则判断所述故障节点不为当前节点。
在其中一个实施例中,所述故障修复包括关闭或重启所述当前节点。
在其中一个实施例中,一种共享磁盘故障节点的处理装置还包括:集群判断模块,用于如果所述故障节点不为当前节点,判断所述故障节点是否存在于集群中;发送模块,用于如果所述故障节点存在于集群中,将所述故障节点修复命令发送至所述故障节点;命令删除模块,用于如果所述故障节点不存在于集群中,删除所述故障节点修复命令。
在一个实施例中,提供了一种共享磁盘故障节点的获取装置,包括:
配置信息发送模块,用于将当前节点的共享磁盘分区配置信息发送至集群;
初始化模块,用于初始化所述共享磁盘分区;
节点信息获取模块,用于启动守护进程,通过所述共享磁盘分区获取所述集群中其它节点信息;
命令发送模块,用于根据所述节点信息,获取故障节点并发送故障节点修复命令。
其中,所述节点信息包括时间戳、节点id、节点名称、节点状态、节点状态持续时间、是否是主控节点中至少一种。通过节点信息中节点状态能够判断某一节点是否为故障节点,并向故障节点发送故障节点修复命令。
在其中一个实施例中,一种共享磁盘故障节点的获取装置,还包括:消息发送模块,用于当启动守护进程从所述共享磁盘分区获取到所述集群中其它节点信息时,则向集群中的其它相关进程发送所述共享磁盘分区初始化成功消息;当启动守护进程不能从所述共享磁盘分区获取所述集群中其它节点信息时,则向集群中的其它相关进程发送所述共享磁盘分区初始化失败消息。
关于共享磁盘故障节点的处理装置的具体限定可以参见上文中对于共享磁盘故障节点的处理方法的限定,在此不再赘述。上述共享磁盘故障节点的处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储节点信息数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种共享磁盘故障节点的处理方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
接收正常节点发送的故障节点修复命令;
根据所述故障节点修复命令,判断所述故障节点是否为当前节点;
当所述故障节点为当前节点时,对所述当前节点进行故障修复;
其中,每个所述节点对应于一个共享磁盘分区,所述共享磁盘分区包括共享磁盘头、节点标识区、命令区和节点信息区,所述当前节点接收所述故障节点修复命令后存储于所述命令区。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:当所述故障节点不为当前节点时,判断所述故障节点是否存在于集群中;当所述故障节点存在于集群中时,则将所述故障节点修复命令发送至所述故障节点;当所述故障节点不存在于集群中时,删除所述故障节点修复命令;其中,所述集群包括多个节点,集群中各个节点之间相互连接,集群各个节点通过主控节点进行任务调度。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
接收正常节点发送的故障节点修复命令;
根据所述故障节点修复命令,判断所述故障节点是否为当前节点;
当所述故障节点为当前节点时,对所述当前节点进行故障修复;
其中,每个所述节点对应于一个共享磁盘分区,所述共享磁盘分区包括共享磁盘头、节点标识区、命令区和节点信息区,所述当前节点接收所述故障节点修复命令后存储于所述命令区。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:当所述故障节点不为当前节点时,判断所述故障节点是否存在于集群中;当所述故障节点存在于集群中时,则将所述故障节点修复命令发送至所述故障节点;当所述故障节点不存在于集群中时,删除所述故障节点修复命令;其中,所述集群包括多个节点,集群中各个节点之间相互连接,集群各个节点通过主控节点进行任务调度。
已经通过参考少量实施方式描述了本发明。然而,本领域技术人员所公知的,正如附带的专利权利要求所限定的,除了本发明以上公开的其他的实施例等同地落在本发明的范围内。
通常地,在权利要求中使用的所有术语都根据他们在技术领域的通常含义被解释,除非在其中被另外明确地定义。所有的参考“一个/所述/该[装置、组件等]”都被开放地解释为所述装置、组件等中的至少一个实例,除非另外明确地说明。这里公开的任何方法的步骤都没必要以公开的准确的顺序运行,除非明确地说明。

Claims (10)

1.一种共享磁盘故障节点的处理方法,其特征在于,所述方法包括:
接收正常节点发送的故障节点修复命令;
根据所述故障节点修复命令,判断所述故障节点是否为当前节点;
当所述故障节点为当前节点时,对所述当前节点进行故障修复;
其中,每个所述节点对应于一个共享磁盘分区,所述共享磁盘分区包括共享磁盘头、节点标识区、命令区和节点信息区,所述当前节点接收所述故障节点修复命令后存储于所述命令区。
2.根据权利要求1所述的方法,其特征在于,还包括:
当所述故障节点不为当前节点时,判断所述故障节点是否存在于集群中;
当所述故障节点存在于集群中时,则将所述故障节点修复命令发送至所述故障节点;
当所述故障节点不存在于集群中时,删除所述故障节点修复命令;
其中,所述集群包括多个节点,集群中各个节点之间相互连接,集群各个节点通过主控节点进行任务调度。
3.根据权利要求1所述的方法,其特征在于,所述故障节点修复命令包括命令发送节点标识、故障修复命令和命令接收节点标识。
4.根据权利要求3所述的方法,其特征在于,所述根据所述故障节点修复命令,判断所述故障节点是否为当前节点,包括:
根据所述故障节点修复命令中所述命令接收节点标识,判断所述命令接收节点标识与当前节点标识是否相同;
如果所述命令接收节点标识与当前节点标识相同,则判断所述故障节点为当前节点,否则判断所述故障节点不为当前节点。
5.根据权利要求1所述的方法,其特征在于,所述故障修复包括关闭或重启所述当前节点。
6.一种共享磁盘故障节点的获取方法,其特征在于,所述方法包括:
将当前节点的共享磁盘分区配置信息发送至集群;
初始化所述共享磁盘分区;
启动守护进程,通过所述共享磁盘分区获取所述集群中其它节点信息;
根据所述节点信息,获取故障节点并发送故障节点修复命令;
其中,所述集群包括多个节点,集群中各个节点之间相互通信连接,集群各个节点通过主控节点进行任务调度。
7.根据权利要求6所述的方法,其特征在于,所述初始化所述共享磁盘分区之后,包括:
当启动守护进程从所述共享磁盘分区获取到所述集群中其它节点信息时,则向集群中的其它相关进程发送所述共享磁盘分区初始化成功消息;
当启动守护进程不能从所述共享磁盘分区获取所述集群中其它节点信息时,则向集群中的其它相关进程发送所述共享磁盘分区初始化失败消息。
8.一种共享磁盘故障节点的处理装置,其特征在于,所述装置包括:
命令接收模块,用于接收正常节点发送的故障节点修复命令;
判断模块,用于根据所述故障节点修复命令,判断所述故障节点是否为当前节点;
故障修复模块,用于当所述故障节点为当前节点时,对所述当前节点进行故障修复;
其中,每个所述节点对应于一个共享磁盘分区,所述共享磁盘分区包括共享磁盘头、节点标识区、命令区和节点信息区,所述当前节点接收所述故障节点修复命令后存储于所述命令区。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN201811563025.7A 2018-12-20 2018-12-20 共享磁盘故障节点的处理方法、装置、计算机设备 Pending CN109460315A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811563025.7A CN109460315A (zh) 2018-12-20 2018-12-20 共享磁盘故障节点的处理方法、装置、计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811563025.7A CN109460315A (zh) 2018-12-20 2018-12-20 共享磁盘故障节点的处理方法、装置、计算机设备

Publications (1)

Publication Number Publication Date
CN109460315A true CN109460315A (zh) 2019-03-12

Family

ID=65613972

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811563025.7A Pending CN109460315A (zh) 2018-12-20 2018-12-20 共享磁盘故障节点的处理方法、装置、计算机设备

Country Status (1)

Country Link
CN (1) CN109460315A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111813348A (zh) * 2020-09-08 2020-10-23 苏州浪潮智能科技有限公司 统一存储设备中的节点事件处理装置、方法、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8132044B1 (en) * 2010-02-05 2012-03-06 Symantec Corporation Concurrent and incremental repair of a failed component in an object based storage system for high availability
CN104077199A (zh) * 2014-06-06 2014-10-01 中标软件有限公司 基于共享磁盘的高可用集群的隔离方法和系统
CN104504348A (zh) * 2014-12-11 2015-04-08 上海爱数软件有限公司 一种基于高可用存储系统的数据保护方法
CN105024879A (zh) * 2015-07-15 2015-11-04 中国船舶重工集团公司第七0九研究所 虚拟机故障检测、恢复系统及虚拟机检测、恢复、启动方法
CN105162632A (zh) * 2015-09-15 2015-12-16 浪潮集团有限公司 一种服务器集群故障自动处理系统
CN107947976A (zh) * 2017-11-20 2018-04-20 新华三云计算技术有限公司 故障节点隔离方法及集群系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8132044B1 (en) * 2010-02-05 2012-03-06 Symantec Corporation Concurrent and incremental repair of a failed component in an object based storage system for high availability
CN104077199A (zh) * 2014-06-06 2014-10-01 中标软件有限公司 基于共享磁盘的高可用集群的隔离方法和系统
CN104504348A (zh) * 2014-12-11 2015-04-08 上海爱数软件有限公司 一种基于高可用存储系统的数据保护方法
CN105024879A (zh) * 2015-07-15 2015-11-04 中国船舶重工集团公司第七0九研究所 虚拟机故障检测、恢复系统及虚拟机检测、恢复、启动方法
CN105162632A (zh) * 2015-09-15 2015-12-16 浪潮集团有限公司 一种服务器集群故障自动处理系统
CN107947976A (zh) * 2017-11-20 2018-04-20 新华三云计算技术有限公司 故障节点隔离方法及集群系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111813348A (zh) * 2020-09-08 2020-10-23 苏州浪潮智能科技有限公司 统一存储设备中的节点事件处理装置、方法、设备及介质

Similar Documents

Publication Publication Date Title
US8959395B2 (en) Method and system for providing high availability to computer applications
CN103201724B (zh) 在高可用性虚拟机环境中提供高可用性应用程序
CN107360135B (zh) 拟态化网络操作系统、构建装置及方法
CN110430115B (zh) 业务恢复方法、系统、网络设备及计算机可读存储介质
CN112506702B (zh) 数据中心容灾方法、装置、设备及存储介质
WO2018019242A1 (zh) 网站服务器的自恢复方法和自恢复系统
CN109286529A (zh) 一种恢复RabbitMQ网络分区的方法及系统
US7886181B2 (en) Failure recovery method in cluster system
CN104391777B (zh) 基于Linux操作系统的云平台及其运行监控方法和装置
CN106130763A (zh) 服务器集群及适用于该集群的数据库资源组切换控制方法
CN107124305A (zh) 节点设备运行方法及节点设备
CN111342986B (zh) 分布式节点管理方法及装置、分布式系统、存储介质
CN109460315A (zh) 共享磁盘故障节点的处理方法、装置、计算机设备
CN104821889B (zh) 一种备份报文的处理方法和设备
CN113377702A (zh) 两节点集群启动的方法及装置、电子设备和存储介质
CN102073523A (zh) 实现软件版本同步的方法及装置
CN110555017A (zh) 区块链数据清理方法、装置、计算机设备和存储介质
CN114422428A (zh) 服务节点的重启方法、装置、电子设备及存储介质
KR100832890B1 (ko) 정보통신 시스템의 프로세스 장애 감시방법 및 복구방법
CN107870777A (zh) 一种热补丁实现方法及装置、终端
CN112367386A (zh) 基于Ignite的自动化运维方法、装置及计算机设备
CN109522158A (zh) 一种容灾备份方法以及相关装置
CN111124638B (zh) 一种嵌入式Linux系统下多机程序调度系统及实现方法
CN115499296B (zh) 一种云桌面热备管理方法、装置及系统
JP7189085B2 (ja) 異常箇所推定装置及び方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190312

RJ01 Rejection of invention patent application after publication