CN106330475A - 一种通信系统中管理主备节点的方法和装置及高可用集群 - Google Patents

一种通信系统中管理主备节点的方法和装置及高可用集群 Download PDF

Info

Publication number
CN106330475A
CN106330475A CN201510331124.2A CN201510331124A CN106330475A CN 106330475 A CN106330475 A CN 106330475A CN 201510331124 A CN201510331124 A CN 201510331124A CN 106330475 A CN106330475 A CN 106330475A
Authority
CN
China
Prior art keywords
node
primary node
primary
standby
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510331124.2A
Other languages
English (en)
Other versions
CN106330475B (zh
Inventor
白涛
陈河堆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201510331124.2A priority Critical patent/CN106330475B/zh
Priority to PCT/CN2016/078490 priority patent/WO2016202051A1/zh
Publication of CN106330475A publication Critical patent/CN106330475A/zh
Application granted granted Critical
Publication of CN106330475B publication Critical patent/CN106330475B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks

Abstract

本发明提供一种通信系统中管理主备节点的方法和装置及高可用集群;所述方法,包括:备用节点检测主用节点是否正常工作;在检测到所述主用节点未正常工作后,所述备用节点触发主备切换操作的执行。

Description

一种通信系统中管理主备节点的方法和装置及高可用集群
技术领域
本发明涉及通信领域,尤其涉及一种通信系统中管理主备节点的方法和装置及高可用集群。
背景技术
在大型商用软件系统中,为保证运行的稳定性,通常要求不能由于一台服务器的失效,导致整个服务中断,即应避免单点故障。典型地,通常由主备两台服务器组成一个集群,正常情况下由主用服务器对外提供服务,当主用服务器故障时,由从服务器接管并继续对外提供服务。主备用服务器之间的故障检测与接管过程是一个技术难点。目前典型的方法需要借助第三方仲裁来实现,即主备用服务器都定期向仲裁者报告自身状态,由仲裁者来判断是否达到了条件来触发故障接管过程。但是在实际应用中,如果仲裁者本身发生故障出现失效的情况,即不能正常完成故障接管。因此目前亟需一种新的主备管理机制对主备服务器进行管理。
发明内容
本发明提供一种通信系统中管理主备节点的方法和装置及高可用集群,要解决的问题是提供一种新的主备切换的管理方式。
为解决上述技术问题,本发明提供了如下技术方案:
一种通信系统中管理主备节点的方法,包括:
备用节点检测主用节点是否正常工作;
在检测到所述主用节点未正常工作后,所述备用节点触发主备切换操作的执行。
其中,所述备用节点检测主用节点是否正常工作,包括:
通过主用节点和备用节点之间的链路,所述备用节点检测是否能收到来自所述主用节点的心跳消息;
如果通过所述链路未收到来自所述主用节点的心跳消息,则确定所述主用节点发生故障。
其中,所述备用节点控制本地是否执行主备切换操作,包括:
在检测到所述主用节点未正常工作后,在执行主备切换操作之前,所述备用节点在预先设置的等待时间内,继续检测主用节点是否正常工作;
如果在所述等待时间内所述主用节点未恢复正常工作,则所述备用节点执行主备切换操作。
其中,所述方法还包括:
如果在所述等待时间内所述主用节点恢复正常工作,则所述备用节点将已接收的业务请求转发给所述主用节点。
其中,所述方法还包括:
所述备用节点在所述等待时间内,如果接收到客户端发送的业务请求,则所述备用节点向所述客户端发送与所述业务请求对应的业务响应,其中所述业务响应包括用于处理所述业务请求的服务当前不可用的信息。
一种通信系统中管理主备节点的装置,包括:
检测模块,用于检测主用节点是否正常工作;
控制模块,用于在检测到所述主用节点未正常工作后,触发主备切换操作的执行。
其中,所述检测模块包括:
第一检测单元,用于通过主用节点和备用节点之间的链路,检测是否能收到来自所述主用节点的心跳消息;
确定单元,用于如果通过所述链路未收到来自所述主用节点的心跳消息,则确定所述主用节点发生故障。
其中,所述控制模块包括:
第二检测单元,用于在检测到所述主用节点未正常工作后,在执行主备切换操作之前,在预先设置的等待时间内,继续检测通过主用节点是否正常工作;
切换模块,用于如果在所述等待时间内所述主用节点未恢复正常工作,则执行主备切换操作。
其中,所述控制模块还包括:
第一发送单元,用于如果在所述等待时间内所述主用节点恢复正常工作,则将已接收的业务请求转发给所述主用节点。
其中,所述装置还包括:
第二发送单元,用于在所述等待时间内,如果接收到客户端发送的业务请求,则向所述客户端发送与所述业务请求对应的业务响应,其中所述业务响应包括用于处理所述业务请求的服务当前不可用的信息。
一种高可用集群,包括第一节点和上文任一所述装置的第二节点。
其中,所述第一节点还用于在第二节点发生主备切换成为主用节点后,如果所述第一节点恢复工作,则通知所述第二节点发起状态切换请求,并在接收到所述第二节点的同意消息后,执行所述第一节点成为主用节点的操作。
本发明提供的实施例,在不依赖于第三方仲裁的情况下由备用节点完成主备节点之间的故障检测与接管,提供了新的主备切换的管理方式,实现对外提供高可用服务的目的。
附图说明
图1为本发明提供的通信系统中管理主备节点的方法的流程图;
图2为本发明提供的客户端在实现主备节点的管理方法中的方法的流程图;
图3为本发明提供的主用服务器在实现主备节点的管理方法中的方法的流程图;
图4为本发明提供的备用服务器在实现主备节点的管理方法中的方法的流程图;
图5为本发明提供的通信系统中管理主备节点的装置的结构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本发明作进一步的详细描述。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
图1为本发明提供的通信系统中管理主备节点的方法的流程图。图1所示方法包括:
步骤101、备用节点检测主用节点是否正常工作;
步骤102、在检测所述主用节点未正常工作后,所述备用节点触发主备切换操作的执行。
本发明提供的方法实施例,在不依赖于第三方仲裁的情况下由备用节点完成主备节点之间的故障检测与接管,提供了新的主备切换的管理方式,实现对外提供高可用服务的目的。
下面对本发明提供的方法实施例作进一步说明:
在启动主用节点和备用节点后,他们的初始服务状态均为非活跃状态,都不能对外提供服务。主用节点可以先主动向备用节点发起连接请求,在链路建立成功后,主用节点发送状态切换请求消息,消息中指出主用节点请求切换为活跃状态,此时备用节点因为也处于非活跃状态,认为主用节点此时可以立即切换为活跃状态,回复响应同意切换,主用节点收到响应后将自身服务状态置为活跃状态,开始对外提供服务。
其中,所述备用节点检测主用节点是否正常工作,包括:
通过主用节点和备用节点之间的链路,所述备用节点检测是否能收到来自所述主用节点的心跳消息;
如果通过所述链路未收到来自所述主用节点的心跳消息,则确定所述主用节点发生故障。
其中,来自所述主用节点的消息可以是主用节点主动发送的,也可以是对备用节点发送的消息的响应消息。
由上可以看出,借助主备节点之间的链接来检测主用节点是否正常工作,实现简单方便。
其中,所述备用节点控制本地是否执行主备切换操作,包括:
在检测到所述主用节点未正常工作后,在执行主备切换操作之前,所述备用节点在预先设置的等待时间内,继续检测通过主用节点是否正常工作;
如果在所述等待时间内所述主用节点未恢复正常工作,则所述备用节点执行主备切换操作。
在实际应用中,由于节点在工作过程中极有可能发生短时的故障,如果该故障能够很快的解决,就不需要发起主备切换,避免引起业务处理的迁移,延迟业务的处理进度,因此通过设置一个等待时间,为主用节点解决自身故障提供了一段时间,从而降低业务处理的迁移的可能性,保证数据处理的进度,提高系统的稳定性。
当然,如果在所述等待时间内所述主用节点恢复正常工作,则所述备用节点将已接收的业务请求转发给所述主用节点。
另外,所述备用节点在所述等待时间内,如果接收到客户端发送的业务请求,则所述备用节点向所述客户端发送与所述业务请求对应的业务响应,其中所述业务响应包括用于处理所述业务请求的服务当前不可用的信息。
通过告知发起业务请求的客户端当前业务不可用,方便客户端获知节点的处理能力,为客户端后续的操作提供依据。
下面以节点为服务器为例进行说明:
在对本发明提供的方法进行说明前,首先对本发明的方法的应用场景作以简单说明:
一种网络通信系统,包括:一台主用服务器,一台备用服务器,一个或多个客户端,其中客户端与主备用服务器之间分别存在一条通信链路,主用服务器与备用服务器之间存在一条通信链路。主用服务器通过一个物理网络接口对外通信,其中主用服务器对外通信具体包括与备用服务器和其它一个或多个客户端的通信,其中主用服务器具有唯一的IP地址;备用服务器通过一个物理网络接口对外通信,其中备用服务器对外通信具体包括与主用服务器和其它一个或多个客户端的通信,备用服务器也具有唯一的IP地址,且不同于主用服务器的IP地址。因此如果是主用服务器故障离线时,其与备用服务器和所有客户端的通信链接将会断开。如果是备用服务器故障离线时,其与主用服务器和所有客户端的通信链接将会断开。
图2至图4为依次客户端、主用服务器和备用服务器在实现主备节点的管理方法中的方法的流程图。其中图2至图4的说明,具体如下:
主备用服务器之间的故障检测与接管依赖于对于当前对外链接数量的计算及与对端服务器链路是否存在的判断。
链路映射表:用于保存当前主机的所有外部通信链接信息,其中key值可使用能唯一标识通信对端的识别标志,如对端的IP地址+端口,value值为最近一次收到心跳或心跳响应消息的时间。
链路数量的计算:
通信中由通信客户端定时发送心跳消息给通信服务端,而后通信服务端回复心跳响应消息给通信客户端。通信服务端收到心跳消息后即认为一条链路已经建立,在链路映射表中增加一条记录,通信服务端链路数量增加1。与此同时,通信客户端收到心跳响应消息后也认为一条链路已经建立成功,在链路映射表中增加一条记录,通信客户端链路数量增加1。
如果链路已经中断,则通信服务端收不到来自同一通信客户端的心跳消息,在超过一定时间(时间可配置)后,通信服务端认为该链路已经断开,将该记录从其链路映射表中移除,服务端链路数量减少1。同样地,通信客户端收不到来自通信服务端的心跳响应消息,在超过一定时间(时间可配置)后,通信客户端认为该链路已经断开,将该记录从其链路映射表中移除,通信客户端链路数量减少1。
为方便说明:为方案涉及到的三种角色,客户端,主用服务器,备用服务器分别设置下列参数:
1.客户端:
与主用服务器通信链路是否正常(查找链路映射表是否有对应主用服务器的记录)
与备用服务器通信链路是否正常(查找链路映射表是否有对应备用服务器的记录)
2.主用服务器:
链接数量(链路映射表当前记录的数量)
与备用服务器通信链路是否正常(查找链路映射表是否有对应备用服务器的记录)
服务状态(活跃或非活跃)
3.备用服务器:
链接数量(链路映射表当前记录的数量)
与主用服务器通信链路是否正常(查找链路映射表是否有对应主用服务器的记录)
服务状态(活跃或非活跃)
客户端会向主(备)服务器发送业务请求消息,主(备)服务器会返回响应消息。
主用服务器会向备用服务器发送状态切换请求消息,备用服务器会返回响应消息。
上述两种响应消息格式中应包括错误码,如响应消息格式为:错误码+响应消息内容,错误码主要用于判断请求操作是否被成功处理,该请求是否需要被重新发送。
主用服务器和备用服务器之间的通信约定由一方作为通信客户端主动向对方发起连接请求,我们假定由主用服务器主动向备用服务器发起连接请求,主用服务器和备用服务器之间只有一条通信链路。
步骤一:分别启动主用服务器和备用服务器,他们的初始服务状态均为非活跃状态,都不能对外提供服务。主用服务器先主动向备用服务器发起连接请求,在链路建立成功后,主用服务器发送状态切换请求消息,消息中指出主用服务器请求切换为活跃状态,此时备用服务器因为也处于非活跃状态,认为主用服务器此时可以立即切换为活跃状态,回复响应同意切换,主用服务器收到响应后将自身服务状态置为活跃状态,开始对外提供服务。
步骤二:客户端向主或备用服务器发送具体业务消息,并接收响应消息,响应消息中会包括一个错误码,该错误码用于标识该请求消息是否真正得到了处理。
客户端访问时基于以下原则,如果与主用服务器的链路正常,则将请求消息向主用服务器发送,反之则向备用服务器发送。当主或备用服务器收到客户端请求时,如果服务状态为非活跃状态,则向客户端回复服务不可用错误码。除非客户端与主备用服务器的链路都断开,否则客户端需要不断重试发送请求消息,直至收到其它错误码时,则表示请求消息已经被成功处理,可从响应消息中解析具体业务请求的处理结果。可将重试相关逻辑封装到一个API中供上层应用调用,上层应用无须关心重试等通信细节。
步骤三:如果主用服务器故障离线,它与客户端和备用服务器的链路将会断开。备用服务器检测到主用服务器的链路断开后,立即设定一个等待时间(可配置),等待与主用服务器的链路恢复,如果在这个时间内,链路恢复,则会重新收到主用服务器的状态切换请求消息,直接回复同意,整个系统恢复到原样。但如果超过了这个时间,与主用服务器的链路仍未恢复,则备用服务器将自身状态置为活跃状态,完成故障接管。在这个过程中,客户端初始检测到主用服务器的链路不可用,只能将请求发送给备用服务器,备用服务器在状态切换为活跃之前,会一直回复给客户端服务不可用错误码,切换为活跃状态之后,处理完业务请求后回复响应,响应中包含其它错误码(非服务不可用)。如果主用服务器在这期间恢复,则客户端转而向其发送请求,直到收到包括非服务不可用错误码的响应消息。
步骤四:如果主用服务器故障离线,备用服务器已经实现接管切换为活跃状态。此时如果主用服务器修复后重新上线,主用服务器会向备用服务器发送状态切换请求消息,此时备用服务器置为非活跃状态,但此时可能正在处理客户端的业务请求,需要等待现有请求处理完成,所以不能立即同意其切换请求,回复不同意,这时如果有新的业务请求发送到备用服务器,备用服务器回复服务不可用。直到所有当前的业务请求处理完毕后,回复主用服务器同意其状态切换请求。主用服务器初始在收到备用服务器不同意其状态切换的响应时,会不断重发状态切换请求消息,直至收到备用服务器的同意响应为止。客户端在这个过程中新增业务请求需要向主用服务器发送,如果收到错误码为服务不可用时需要重试,直到收到包含其它错误码的响应。
图5为本发明提供的种通信系统中管理主备节点的装置的结构图。图5所示装置包括:
检测模块501,用于检测主用节点是否正常工作;
控制模块502,用于在检测所述主用节点未正常工作后,触发主备切换操作的执行。
其中,所述检测模块501包括:
第一检测单元,用于通过主用节点和备用节点之间的链路,检测是否能收到来自所述主用节点的消息;
确定单元,用于如果通过所述链路未收到来自所述主用节点的消息,则确定所述主用节点发生故障。
其中,所述控制模块502包括:
第二检测单元,用于在检测到所述主用节点未正常工作后,在执行主备切换操作之前,在预先设置的等待时间内,继续检测通过主用节点是否正常工作;
切换模块,用于如果在所述等待时间内所述主用节点未恢复正常工作,则执行主备切换操作。
其中,所述控制模块502还包括:
第一发送单元,用于如果在所述等待时间内所述主用节点恢复正常工作,则将已接收的业务请求转发给所述主用节点。
其中,所述控制模块502还包括:
第二发送单元,用于在所述等待时间内,如果接收到客户端发送的业务请求,则向所述客户端发送与所述业务请求对应的业务响应,其中所述业务响应包括用于处理所述业务请求的服务当前不可用的信息。
本发明提供的装置实施例,在不依赖于第三方仲裁的情况下由备用节点完成主备节点之间的故障检测与接管,提供了新的主备切换的管理方式,实现对外提供高可用服务的目的。
另外,本发明提供一种高可用集群,包括第一节点和包括图5所示装置的第二节点。
其中,所述第一节点还用于在第二节点发生主备切换成为主用节点后,如果所述第一节点恢复工作,则通知所述第二节点发起状态切换请求,并在接收到所述第二节点的同意消息后,执行所述第一节点成为主用节点的操作。
本发明提供的实施例,在不依赖于第三方仲裁的情况下由备用节点完成主备节点之间的故障检测与接管,提供了新的主备切换的管理方式,实现对外提供高可用服务的目的。
本领域普通技术人员可以理解上述实施例的全部或部分步骤可以使用计算机程序流程来实现,所述计算机程序可以存储于一计算机可读存储介质中,所述计算机程序在相应的硬件平台上(如系统、设备、装置、器件等)执行,在执行时,包括方法实施例的步骤之一或其组合。
可选地,上述实施例的全部或部分步骤也可以使用集成电路来实现,这些步骤可以被分别制作成一个个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
上述实施例中的各装置/功能模块/功能单元可以采用通用的计算装置来实现,它们可以集中在单个的计算装置上,也可以分布在多个计算装置所组成的网络上。
上述实施例中的各装置/功能模块/功能单元以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。上述提到的计算机可读取存储介质可以是只读存储器,磁盘或光盘等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求所述的保护范围为准。

Claims (12)

1.一种通信系统中管理主备节点的方法,其特征在于,包括:
备用节点检测主用节点是否正常工作;
在检测到所述主用节点未正常工作后,所述备用节点触发主备切换操作的执行。
2.根据权利要求1所述的方法,其特征在于,所述备用节点检测主用节点是否正常工作,包括:
通过主用节点和备用节点之间的链路,所述备用节点检测是否能收到来自所述主用节点的心跳消息;
如果通过所述链路未收到来自所述主用节点的心跳消息,则确定所述主用节点发生故障。
3.根据权利要求1所述的方法,其特征在于,所述备用节点控制本地是否执行主备切换操作,包括:
在检测到所述主用节点未正常工作后,在执行主备切换操作之前,所述备用节点在预先设置的等待时间内,继续检测主用节点是否正常工作;
如果在所述等待时间内所述主用节点未恢复正常工作,则所述备用节点执行主备切换操作。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
如果在所述等待时间内所述主用节点恢复正常工作,则所述备用节点将已接收的业务请求转发给所述主用节点。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
所述备用节点在所述等待时间内,如果接收到客户端发送的业务请求,则所述备用节点向所述客户端发送与所述业务请求对应的业务响应,其中所述业务响应包括用于处理所述业务请求的服务当前不可用的信息。
6.一种通信系统中管理主备节点的装置,其特征在于,包括:
检测模块,用于检测主用节点是否正常工作;
控制模块,用于在检测到所述主用节点未正常工作后,触发主备切换操作的执行。
7.根据权利要求6所述的装置,其特征在于,所述检测模块包括:
第一检测单元,用于通过主用节点和备用节点之间的链路,检测是否能收到来自所述主用节点的心跳消息;
确定单元,用于如果通过所述链路未收到来自所述主用节点的心跳消息,则确定所述主用节点发生故障。
8.根据权利要求6所述的装置,其特征在于,所述控制模块包括:
第二检测单元,用于在检测到所述主用节点未正常工作后,在执行主备切换操作之前,在预先设置的等待时间内,继续检测通过主用节点是否正常工作;
切换模块,用于如果在所述等待时间内所述主用节点未恢复正常工作,则执行主备切换操作。
9.根据权利要求8所述的装置,其特征在于,所述控制模块还包括:
第一发送单元,用于如果在所述等待时间内所述主用节点恢复正常工作,则将已接收的业务请求转发给所述主用节点。
10.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第二发送单元,用于在所述等待时间内,如果接收到客户端发送的业务请求,则向所述客户端发送与所述业务请求对应的业务响应,其中所述业务响应包括用于处理所述业务请求的服务当前不可用的信息。
11.一种高可用集群,其特征在于,包括第一节点和包括如权利要求6至10任一所述装置的第二节点。
12.根据权利要求11所述的高可用集群,其特征在于,所述第一节点还用于在第二节点发生主备切换成为主用节点后,如果所述第一节点恢复工作,则通知所述第二节点发起状态切换请求,并在接收到所述第二节点的同意消息后,执行所述第一节点成为主用节点的操作。
CN201510331124.2A 2015-06-15 2015-06-15 一种通信系统中管理主备节点的方法和装置及高可用集群 Active CN106330475B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201510331124.2A CN106330475B (zh) 2015-06-15 2015-06-15 一种通信系统中管理主备节点的方法和装置及高可用集群
PCT/CN2016/078490 WO2016202051A1 (zh) 2015-06-15 2016-04-05 一种通信系统中管理主备节点的方法和装置及高可用集群

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510331124.2A CN106330475B (zh) 2015-06-15 2015-06-15 一种通信系统中管理主备节点的方法和装置及高可用集群

Publications (2)

Publication Number Publication Date
CN106330475A true CN106330475A (zh) 2017-01-11
CN106330475B CN106330475B (zh) 2020-12-04

Family

ID=57544964

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510331124.2A Active CN106330475B (zh) 2015-06-15 2015-06-15 一种通信系统中管理主备节点的方法和装置及高可用集群

Country Status (2)

Country Link
CN (1) CN106330475B (zh)
WO (1) WO2016202051A1 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106911524A (zh) * 2017-04-27 2017-06-30 紫光华山信息技术有限公司 一种ha实现方法及装置
CN107528724A (zh) * 2017-07-20 2017-12-29 北京奇安信科技有限公司 一种节点集群的优化处理方法及装置
CN108023775A (zh) * 2017-12-07 2018-05-11 湖北三新文化传媒有限公司 高可用集群架构系统及方法
CN108023891A (zh) * 2017-12-12 2018-05-11 北京安博通科技股份有限公司 一种基于ipsec的隧道切换方法、装置及网关
CN109101367A (zh) * 2018-08-15 2018-12-28 郑州云海信息技术有限公司 云计算系统中组件的管理方法和装置
CN109344015A (zh) * 2018-10-10 2019-02-15 武汉达梦数据库有限公司 一种数据库服务使用ha预防双主节点的方法及系统
CN109428740A (zh) * 2017-08-21 2019-03-05 华为技术有限公司 设备故障恢复的方法和装置
CN110300023A (zh) * 2019-06-28 2019-10-01 上海智臻智能网络科技股份有限公司 一种状态切换方法、装置、节点、节点组及存储介质
CN115134219A (zh) * 2022-06-29 2022-09-30 北京飞讯数码科技有限公司 设备资源管理方法及装置、计算设备和存储介质
CN116582618A (zh) * 2023-07-13 2023-08-11 天津金城银行股份有限公司 电销高可用的实现方法、装置、机房管理平台和计算机

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112787917A (zh) * 2019-11-11 2021-05-11 中兴通讯股份有限公司 灵活以太网的保护方法、端节点、保护组网和存储介质
CN114257500B (zh) * 2021-12-24 2023-06-09 苏州浪潮智能科技有限公司 一种超融合集群内部网络的故障切换方法、系统及装置
CN114466391A (zh) * 2022-03-21 2022-05-10 中国电信股份有限公司 网元设备状态更新方法、装置、存储介质及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040034807A1 (en) * 2002-08-14 2004-02-19 Gnp Computers, Inc. Roving servers in a clustered telecommunication distributed computer system
CN101039172A (zh) * 2007-05-15 2007-09-19 华为技术有限公司 以太环网系统及其保护方法和备用主节点
CN101179432A (zh) * 2007-12-13 2008-05-14 浪潮电子信息产业股份有限公司 一种多机环境中实现系统高可用的方法
CN101335702A (zh) * 2008-07-07 2008-12-31 中兴通讯股份有限公司 一种gprs业务支持节点容灾的处理方法
CN102118309A (zh) * 2010-12-31 2011-07-06 中国科学院计算技术研究所 一种双机热备份方法及系统
CN103490969A (zh) * 2013-09-17 2014-01-01 烽火通信科技股份有限公司 实现vpws冗余保护快速收敛的系统及方法
US20150023149A1 (en) * 2013-07-19 2015-01-22 Fujitsu Limited Communication system and transfer apparatus

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040034807A1 (en) * 2002-08-14 2004-02-19 Gnp Computers, Inc. Roving servers in a clustered telecommunication distributed computer system
CN101039172A (zh) * 2007-05-15 2007-09-19 华为技术有限公司 以太环网系统及其保护方法和备用主节点
CN101179432A (zh) * 2007-12-13 2008-05-14 浪潮电子信息产业股份有限公司 一种多机环境中实现系统高可用的方法
CN101335702A (zh) * 2008-07-07 2008-12-31 中兴通讯股份有限公司 一种gprs业务支持节点容灾的处理方法
CN102118309A (zh) * 2010-12-31 2011-07-06 中国科学院计算技术研究所 一种双机热备份方法及系统
US20150023149A1 (en) * 2013-07-19 2015-01-22 Fujitsu Limited Communication system and transfer apparatus
CN103490969A (zh) * 2013-09-17 2014-01-01 烽火通信科技股份有限公司 实现vpws冗余保护快速收敛的系统及方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106911524A (zh) * 2017-04-27 2017-06-30 紫光华山信息技术有限公司 一种ha实现方法及装置
CN107528724A (zh) * 2017-07-20 2017-12-29 北京奇安信科技有限公司 一种节点集群的优化处理方法及装置
CN107528724B (zh) * 2017-07-20 2020-09-29 奇安信科技集团股份有限公司 一种节点集群的优化处理方法及装置
CN109428740A (zh) * 2017-08-21 2019-03-05 华为技术有限公司 设备故障恢复的方法和装置
CN109428740B (zh) * 2017-08-21 2020-09-08 华为技术有限公司 设备故障恢复的方法和装置
CN108023775A (zh) * 2017-12-07 2018-05-11 湖北三新文化传媒有限公司 高可用集群架构系统及方法
CN108023891A (zh) * 2017-12-12 2018-05-11 北京安博通科技股份有限公司 一种基于ipsec的隧道切换方法、装置及网关
CN109101367A (zh) * 2018-08-15 2018-12-28 郑州云海信息技术有限公司 云计算系统中组件的管理方法和装置
CN109344015A (zh) * 2018-10-10 2019-02-15 武汉达梦数据库有限公司 一种数据库服务使用ha预防双主节点的方法及系统
CN109344015B (zh) * 2018-10-10 2022-05-24 武汉达梦数据库股份有限公司 一种数据库服务使用ha预防双主节点的方法及系统
CN110300023A (zh) * 2019-06-28 2019-10-01 上海智臻智能网络科技股份有限公司 一种状态切换方法、装置、节点、节点组及存储介质
CN115134219A (zh) * 2022-06-29 2022-09-30 北京飞讯数码科技有限公司 设备资源管理方法及装置、计算设备和存储介质
CN116582618A (zh) * 2023-07-13 2023-08-11 天津金城银行股份有限公司 电销高可用的实现方法、装置、机房管理平台和计算机
CN116582618B (zh) * 2023-07-13 2023-10-10 天津金城银行股份有限公司 电销高可用的实现方法、装置、机房管理平台和计算机

Also Published As

Publication number Publication date
WO2016202051A1 (zh) 2016-12-22
CN106330475B (zh) 2020-12-04

Similar Documents

Publication Publication Date Title
CN106330475A (zh) 一种通信系统中管理主备节点的方法和装置及高可用集群
US11809291B2 (en) Method and apparatus for redundancy in active-active cluster system
CN107391294B (zh) 一种ipsan容灾系统的建立方法及装置
US20140095925A1 (en) Client for controlling automatic failover from a primary to a standby server
TW201824823A (zh) 虛擬互聯網協定位址的切換方法及裝置
US8880703B2 (en) Address distribution method, device and system thereof
KR100411978B1 (ko) 내 고장성 시스템 및 이중화 방법
CN107276839B (zh) 一种云平台的自监控方法和系统
CN111176888B (zh) 云存储的容灾方法、装置及系统
CN110677282B (zh) 一种分布式系统的热备份方法及分布式系统
CN112328421B (zh) 一种系统故障处理方法、装置、计算机设备和存储介质
CN101237315A (zh) 一种用于双控高可用系统的同步检测和故障隔离方法
CN115269248B (zh) 双节点集群下防止脑裂方法和装置、电子设备和存储介质
WO2017071384A1 (zh) 报文处理的方法及装置
CN101262479B (zh) 一种网络文件共享的方法、服务器和网络文件共享的系统
CN103916226A (zh) 基于嵌入式设备冗余备份的方法
CN109189854B (zh) 提供持续业务的方法及节点设备
CN112787918B (zh) 一种基于服务路由树的数据中心寻址与主备切换方法
US20130185425A1 (en) Method for Optimizing Network Performance After A Temporary Loss of Connection
CN113055203B (zh) Sdn控制平面的异常恢复方法及装置
JP4757670B2 (ja) システム切替方法、その計算機システム及びプログラム
CN114301763A (zh) 分布式集群故障的处理方法及系统、电子设备及存储介质
JP2003186722A (ja) クラスタシステムにおけるデータベースサーバフェイルオーバー方法
CN110716827A (zh) 适用于分布式系统的热备份方法及分布式系统
CN106685697B (zh) 一种异常边际消息数据恢复处理的方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant