CN112491633A - 一种多节点集群的故障恢复方法、系统及相关组件 - Google Patents

一种多节点集群的故障恢复方法、系统及相关组件 Download PDF

Info

Publication number
CN112491633A
CN112491633A CN202011495810.0A CN202011495810A CN112491633A CN 112491633 A CN112491633 A CN 112491633A CN 202011495810 A CN202011495810 A CN 202011495810A CN 112491633 A CN112491633 A CN 112491633A
Authority
CN
China
Prior art keywords
node
fault
module
recovery
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011495810.0A
Other languages
English (en)
Other versions
CN112491633B (zh
Inventor
杨建阁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Inspur Data Technology Co Ltd
Original Assignee
Beijing Inspur Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Inspur Data Technology Co Ltd filed Critical Beijing Inspur Data Technology Co Ltd
Priority to CN202011495810.0A priority Critical patent/CN112491633B/zh
Publication of CN112491633A publication Critical patent/CN112491633A/zh
Application granted granted Critical
Publication of CN112491633B publication Critical patent/CN112491633B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0659Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
    • H04L41/0661Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities by reconfiguring faulty entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0876Aspects of the degree of configuration automation
    • H04L41/0886Fully automatic configuration
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Automation & Control Theory (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请公开了一种多节点集群的故障恢复方法、系统、装置及可读存储介质,该方法包括:通过故障监控节点的监控模块,监控集群中所有节点的网络状态,并在所有节点中确定发生网络故障的故障节点;通过故障监控节点的推送模块,将包含故障节点的地址信息的故障恢复指令通过数据链路层推送到所有节点;通过每个节点与数据链路层连接的监听模块,接收故障恢复指令,并根据故障恢复指令判断本地节点是否为故障节点;若是,通过故障节点的恢复模块,恢复故障节点的网络配置。由于数据链路层不会随故障节点的网络故障而失效,因此本申请通过底层的数据链路层推送故障恢复指令,不需要人工手动对故障节点进行网络配置,故障恢复更为简单快捷,准确率更高。

Description

一种多节点集群的故障恢复方法、系统及相关组件
技术领域
本发明涉及多节点集群领域,特别涉及一种多节点集群的故障恢复方法、系统及相关组件。
背景技术
当前多节点集群中,多节点协作工作时,一旦出现某一节点故障,会影响整个集群的性能,可能导致更多的故障,尤其是故障表现为集群节点失联、节点密钥损坏、网络故障等情况下,该节点将无法提供服务,同时无法上报警告进行网络恢复。对于此类故障,恢复方法只有人工手动登录该节点后修改其网路配置,重新扩容进入集群,这种手段效率较低,且恢复容易出错。
因此,如何提供一种解决上述技术问题的方案是目前本领域技术人员需要解决的问题。
发明内容
有鉴于此,本发明的目的在于提供一种多节点集群的故障恢复方法、系统及相关组件,以便自动恢复故障,避免人工恢复的失误。其具体方案如下:
一种多节点集群的故障恢复方法,包括:
通过故障监控节点的监控模块,监控集群中所有节点的网络状态,并在所有所述节点中确定发生网络故障的故障节点;
通过所述故障监控节点的推送模块,将包含所述故障节点的地址信息的故障恢复指令通过数据链路层推送到所有所述节点;
通过每个所述节点与所述数据链路层连接的监听模块,接收所述故障恢复指令,并根据所述故障恢复指令判断本地节点是否为所述故障节点;
若是,通过所述故障节点的恢复模块,恢复所述故障节点的网络配置。
优选的,所述通过所述故障节点的恢复模块,恢复所述故障节点的网络配置的过程,具体包括:
通过所述故障节点的恢复模块,根据所述恢复模块内部存储的备份数据,恢复所述故障节点的网络配置。
优选的,所述通过所述故障节点的恢复模块,根据所述恢复模块内部存储的备份数据,恢复所述故障节点的网络配置的过程,具体包括:
通过所述故障节点的恢复模块,根据所述恢复模块内部存储的备份数据,恢复所述故障节点的网络基础配置、密钥信息和证书信息。
优选的,所述故障节点的地址信息具体为所述故障节点的SN号。
优选的,所述故障恢复指令中还包括所述故障监控节点的MAC地址;相应的,所述故障恢复方法还包括:
通过所述故障节点的恢复模块,向所述监控模块发送已回复成功消息。
优选的,所述通过故障监控节点的监控模块,监控集群中所有节点的网络状态,并在所有所述节点中确定发生网络故障的故障节点的过程,还包括:
向用户管理界面发送所述故障节点发生网络故障的故障信息。
优选的,所述通过所述故障监控节点的推送模块,将包含所述故障节点的地址信息的故障恢复指令通过数据链路层推送到所有所述节点的过程,包括:
当收到用户发送的故障恢复命令,通过所述故障监控节点的推送模块,将包含所述故障节点的地址信息的故障恢复指令通过数据链路层推送到所有所述节点。
相应的,本申请还公开了一种多节点集群的故障恢复系统,包括:
位于故障监控节点的监控模块,用于监控集群中所有节点的网络状态,并在所有所述节点中确定发生网络故障的故障节点;
位于所述故障监控节点的推送模块,用于将包含所述故障节点的地址信息的故障恢复指令通过数据链路层推送到所有所述节点;
位于每个所述节点、与所述数据链路层连接的监听模块,接收所述故障恢复指令,并根据所述故障恢复指令判断本地节点是否为所述故障节点;
位于每个所述节点的恢复模块,用于在本地节点为所述故障节点时,恢复所述故障节点的网络配置。
相应的,本申请还公开了一种多节点集群的故障恢复装置,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上文任一项所述多节点集群的故障恢复方法的步骤。
相应的,本申请还公开了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上文任一项所述多节点集群的故障恢复方法的步骤。
本申请公开了一种多节点集群的故障恢复方法,包括:通过故障监控节点的监控模块,监控集群中所有节点的网络状态,并在所有所述节点中确定发生网络故障的故障节点;通过所述故障监控节点的推送模块,将包含所述故障节点的地址信息的故障恢复指令通过数据链路层推送到所有所述节点;通过每个所述节点与所述数据链路层连接的监听模块,接收所述故障恢复指令,并根据所述故障恢复指令判断本地节点是否为所述故障节点;若是,通过所述故障节点的恢复模块,恢复所述故障节点的网络配置。由于数据链路层不会随故障节点的网络故障而失效,因此本申请通过底层的数据链路层推送故障恢复指令,使故障节点在收到故障恢复指令后进行网络配置的恢复,不需要人工手动对故障节点进行网络配置,故障恢复更为简单快捷,准确率更高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例中一种多节点集群的故障恢复方法的步骤流程图;
图2为本发明实施例中一种多节点集群的故障恢复系统的结构分布图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有节点故障时的恢复方法只有人工手动登录该节点后修改其网路配置,重新扩容进入集群,这种手段效率较低,且恢复容易出错。本申请通过底层的数据链路层推送故障恢复指令,使故障节点在收到故障恢复指令后进行网络配置的恢复,不需要人工手动对故障节点进行网络配置,故障恢复更为简单快捷,准确率更高。
本发明实施例公开了一种多节点集群的故障恢复方法,参见图1所示,包括:
S1:通过故障监控节点的监控模块,监控集群中所有节点的网络状态,并在所有节点中确定发生网络故障的故障节点;
S2:通过故障监控节点的推送模块,将包含故障节点的地址信息的故障恢复指令通过数据链路层推送到所有节点;
S3:通过每个节点与数据链路层连接的监听模块,接收故障恢复指令,并根据故障恢复指令判断本地节点是否为故障节点;
S4:若是,通过故障节点的恢复模块,恢复故障节点的网络配置。
可以理解的是,多节点集群中节点之间除了上层网络的通信关系外,还具有物理层的数据链路层的连接关系,利用数据链路层可进行相关信息的广播和推送。当故障监控节点的监控模块发现故障节点,可利用推送模块将故障恢复指令通过数据链路层推送到所有节点,每个节点的监听模块解析故障恢复指令的内容,判断其中包含的地址信息对应的故障节点是否为本地节点,如果是,则利用恢复模块对故障节点的网络配置进行恢复;如果否,则当前节点不是故障节点,忽略该条故障恢复指令即可。
可以理解的是,多节点集群中的节点包括主节点和从节点,这里的故障监控节点通常为主节点,监控模块和推送模块位于故障监控节点,每个节点都有一个监听模块和一个恢复模块,当监听模块判定本地节点为故障节点,会触发本地节点的恢复模块。这里的监控模块、推送模块、监听模块和恢复模块通常以程序语言的形式实现。
在有节点发生网络故障时,该节点的IP失效,不能通过主节点进行管理,而由于数据链路层不会随故障节点的网络故障而失效,本申请通过底层的数据链路层推送故障恢复指令,使故障节点在收到故障恢复指令后进行网络配置的恢复,不需要人工手动对故障节点进行网络配置,故障恢复更为简单快捷,准确率更高。
本发明实施例公开了一种具体的多节点集群的故障恢复方法,相对于上一实施例,本实施例对技术方案作了进一步的说明和优化。
具体的,通过故障节点的恢复模块,恢复故障节点的网络配置的过程,包括:
通过故障节点的恢复模块,根据恢复模块内部存储的备份数据,恢复故障节点的网络配置。
也就是说,恢复模块进行网络配置的恢复,实际上是将网络配置回滚到备份数据的版本,因此恢复模块在多节点集群每次网络配置结束后都应当进行一次网络配置的数据备份,以便在该节点发送网络故障时提供数据支持。
进一步,该步骤包括:通过故障节点的恢复模块,根据恢复模块内部存储的备份数据,恢复故障节点的网络基础配置、密钥信息和证书信息。具体在恢复时,不一定将网络配置完全覆盖,也可以先比较当前配置和备份数据,然后将出现错误或差异的部分按照备份数据恢复。之后可进行重启网络等相关服务,以使恢复后的数据生效。
进一步的,监控模块对故障节点的确定、推送模块对故障恢复指令的封装、监听模块对故障节点的判断,都需要故障节点的地址信息,故障节点的地址信息通常选择故障节点的SN号(Serial Number,序列号)。
进一步的,故障恢复指令中还包括故障监控节点的MAC地址;相应的,故障恢复方法还包括:
通过故障节点的恢复模块,向监控模块发送已回复成功消息。
可以理解的是,通过故障监控节点的监控模块,监控集群中所有节点的网络状态,并在所有节点中确定发生网络故障的故障节点的过程,还可以包括:
向用户管理界面发送故障节点发生网络故障的故障信息。
进一步的,本实施例中,用户可以通过用户界面的故障信息了解节点故障,然后进行是否发出故障恢复命令的判定,具体的,通过故障监控节点的推送模块,将包含故障节点的地址信息的故障恢复指令通过数据链路层推送到所有节点的过程,包括:
当收到用户发送的故障恢复命令,通过故障监控节点的推送模块,将包含故障节点的地址信息的故障恢复指令通过数据链路层推送到所有节点。
当然,监控模块也可以只是发出故障信息的通知,故障恢复指令由监控模块主动触发推送模块来实现。
不论何种手段触发故障恢复指令,主要的故障恢复指令的发送和故障节点的恢复均由多节点集群内部的推送模块和恢复模块自动实现,非人工的操作能够答复提高恢复效率和准确率。
相应的,本申请实施例还公开了一种多节点集群的故障恢复系统,参见图2所示,包括:
位于故障监控节点的监控模块1,用于监控集群中所有节点的网络状态,并在所有节点中确定发生网络故障的故障节点;
位于故障监控节点的推送模块2,用于将包含故障节点的地址信息的故障恢复指令通过数据链路层推送到所有节点;
位于每个节点、与数据链路层连接的监听模块3,接收故障恢复指令,并根据故障恢复指令判断本地节点是否为故障节点;
位于每个节点的恢复模块4,用于在本地节点为故障节点时,恢复故障节点的网络配置。
可以理解的是,多节点集群中的节点包括主节点和从节点,这里的故障监控节点通常为主节点,监控模块1和推送模块2位于故障监控节点,每个节点都有一个监听模块3和一个恢复模块4,当监听模块判定本地节点为故障节点,会触发本地节点的恢复模块。
由于数据链路层不会随故障节点的网络故障而失效,因此本申请实施例通过底层的数据链路层推送故障恢复指令,使故障节点在收到故障恢复指令后进行网络配置的恢复,不需要人工手动对故障节点进行网络配置,故障恢复更为简单快捷,准确率更高。
相应的,本申请实施例还公开了一种多节点集群的故障恢复装置,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上文实施例任一项所述多节点集群的故障恢复方法的步骤。
相应的,本申请实施例还公开了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上文实施例任一项所述多节点集群的故障恢复方法的步骤。
其中,本申请实施例中多节点集群的故障恢复方法的具体细节可参照上文实施例中的相关内容,此处不再赘述。
其中,本申请实施例中多节点集群的故障恢复装置和可读存储介质均具有与上文实施例中多节点集群的故障恢复方法相同的技术效果,此处不再赘述。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的一种多节点集群的故障恢复方法、系统及相关组件进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种多节点集群的故障恢复方法,其特征在于,包括:
通过故障监控节点的监控模块,监控集群中所有节点的网络状态,并在所有所述节点中确定发生网络故障的故障节点;
通过所述故障监控节点的推送模块,将包含所述故障节点的地址信息的故障恢复指令通过数据链路层推送到所有所述节点;
通过每个所述节点与所述数据链路层连接的监听模块,接收所述故障恢复指令,并根据所述故障恢复指令判断本地节点是否为所述故障节点;
若是,通过所述故障节点的恢复模块,恢复所述故障节点的网络配置。
2.根据权利要求1所述多节点集群的故障恢复方法,其特征在于,所述通过所述故障节点的恢复模块,恢复所述故障节点的网络配置的过程,具体包括:
通过所述故障节点的恢复模块,根据所述恢复模块内部存储的备份数据,恢复所述故障节点的网络配置。
3.根据权利要求2所述多节点集群的故障恢复方法,其特征在于,所述通过所述故障节点的恢复模块,根据所述恢复模块内部存储的备份数据,恢复所述故障节点的网络配置的过程,具体包括:
通过所述故障节点的恢复模块,根据所述恢复模块内部存储的备份数据,恢复所述故障节点的网络基础配置、密钥信息和证书信息。
4.根据权利要求1所述多节点集群的故障恢复方法,其特征在于,所述故障节点的地址信息具体为所述故障节点的SN号。
5.根据权利要求1所述多节点集群的故障恢复方法,其特征在于,所述故障恢复指令中还包括所述故障监控节点的MAC地址;相应的,所述故障恢复方法还包括:
通过所述故障节点的恢复模块,向所述监控模块发送已回复成功消息。
6.根据权利要求1至5任一项所述多节点集群的故障恢复方法,其特征在于,所述通过故障监控节点的监控模块,监控集群中所有节点的网络状态,并在所有所述节点中确定发生网络故障的故障节点的过程,还包括:
向用户管理界面发送所述故障节点发生网络故障的故障信息。
7.根据权利要求6所述多节点集群的故障恢复方法,其特征在于,所述通过所述故障监控节点的推送模块,将包含所述故障节点的地址信息的故障恢复指令通过数据链路层推送到所有所述节点的过程,包括:
当收到用户发送的故障恢复命令,通过所述故障监控节点的推送模块,将包含所述故障节点的地址信息的故障恢复指令通过数据链路层推送到所有所述节点。
8.一种多节点集群的故障恢复系统,其特征在于,包括:
位于故障监控节点的监控模块,用于监控集群中所有节点的网络状态,并在所有所述节点中确定发生网络故障的故障节点;
位于所述故障监控节点的推送模块,用于将包含所述故障节点的地址信息的故障恢复指令通过数据链路层推送到所有所述节点;
位于每个所述节点、与所述数据链路层连接的监听模块,接收所述故障恢复指令,并根据所述故障恢复指令判断本地节点是否为所述故障节点;
位于每个所述节点的恢复模块,用于在本地节点为所述故障节点时,恢复所述故障节点的网络配置。
9.一种多节点集群的故障恢复装置,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述多节点集群的故障恢复方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述多节点集群的故障恢复方法的步骤。
CN202011495810.0A 2020-12-17 2020-12-17 一种多节点集群的故障恢复方法、系统及相关组件 Active CN112491633B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011495810.0A CN112491633B (zh) 2020-12-17 2020-12-17 一种多节点集群的故障恢复方法、系统及相关组件

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011495810.0A CN112491633B (zh) 2020-12-17 2020-12-17 一种多节点集群的故障恢复方法、系统及相关组件

Publications (2)

Publication Number Publication Date
CN112491633A true CN112491633A (zh) 2021-03-12
CN112491633B CN112491633B (zh) 2023-01-24

Family

ID=74917691

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011495810.0A Active CN112491633B (zh) 2020-12-17 2020-12-17 一种多节点集群的故障恢复方法、系统及相关组件

Country Status (1)

Country Link
CN (1) CN112491633B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112511356A (zh) * 2020-12-18 2021-03-16 北京浪潮数据技术有限公司 一种多节点集群的故障修复方法、装置、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6581166B1 (en) * 1999-03-02 2003-06-17 The Foxboro Company Network fault detection and recovery
CN103607297A (zh) * 2013-11-07 2014-02-26 上海爱数软件有限公司 一种计算机集群系统的故障处理方法
CN108769170A (zh) * 2018-05-18 2018-11-06 郑州云海信息技术有限公司 一种集群网络故障自检系统及方法
CN111124755A (zh) * 2019-12-06 2020-05-08 中国联合网络通信集团有限公司 集群节点的故障恢复方法、装置、电子设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6581166B1 (en) * 1999-03-02 2003-06-17 The Foxboro Company Network fault detection and recovery
CN103607297A (zh) * 2013-11-07 2014-02-26 上海爱数软件有限公司 一种计算机集群系统的故障处理方法
CN108769170A (zh) * 2018-05-18 2018-11-06 郑州云海信息技术有限公司 一种集群网络故障自检系统及方法
CN111124755A (zh) * 2019-12-06 2020-05-08 中国联合网络通信集团有限公司 集群节点的故障恢复方法、装置、电子设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112511356A (zh) * 2020-12-18 2021-03-16 北京浪潮数据技术有限公司 一种多节点集群的故障修复方法、装置、设备及介质

Also Published As

Publication number Publication date
CN112491633B (zh) 2023-01-24

Similar Documents

Publication Publication Date Title
CN108847982B (zh) 一种分布式存储集群及其节点故障切换方法和装置
CN106330475B (zh) 一种通信系统中管理主备节点的方法和装置及高可用集群
CN112463448B (zh) 分布式集群数据库同步方法、装置、设备及存储介质
CN105933407B (zh) 一种实现Redis集群高可用的方法及系统
CN102394914A (zh) 集群脑裂处理方法和装置
CN112612545A (zh) 一种服务器集群的配置热加载系统、方法、设备及介质
CN111385107B (zh) 一种服务器的主备切换处理方法及装置
CN111478796B (zh) 一种ai平台的集群扩容异常处理方法
CN101729426A (zh) 一种虚拟路由冗余协议主备用设备快速切换的方法及系统
WO2017071384A1 (zh) 报文处理的方法及装置
CN108243031B (zh) 一种双机热备的实现方法及装置
CN112491633B (zh) 一种多节点集群的故障恢复方法、系统及相关组件
CN106533751B (zh) 一种sdn控制器集群合并方法及装置
CN109189854B (zh) 提供持续业务的方法及节点设备
CN111314443A (zh) 基于分布式存储系统的节点处理方法、装置和设备及介质
CN104796283A (zh) 一种监控报警的方法
CN102487332B (zh) 故障处理方法、装置和系统
CN116185697B (zh) 容器集群管理方法、装置、系统、电子设备及存储介质
CN117130730A (zh) 面向联邦Kubernetes集群的元数据管理方法
CN114124803B (zh) 设备管理方法、装置、电子设备及存储介质
CN116737444A (zh) 一种数据库服务器故障处理方法及系统
CN110677316A (zh) 一种分布式存储服务器网卡检测方法和系统
CN111309515A (zh) 一种容灾控制方法、装置及系统
CN114328033A (zh) 保持高可用设备组业务配置一致性的方法及装置
CN111817892B (zh) 一种网络管理方法、系统、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant