CN117687827A - 服务器故障处理方法、装置、电子设备和计算机存储介质 - Google Patents

服务器故障处理方法、装置、电子设备和计算机存储介质 Download PDF

Info

Publication number
CN117687827A
CN117687827A CN202311687023.XA CN202311687023A CN117687827A CN 117687827 A CN117687827 A CN 117687827A CN 202311687023 A CN202311687023 A CN 202311687023A CN 117687827 A CN117687827 A CN 117687827A
Authority
CN
China
Prior art keywords
node
server
slave
master
normal state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311687023.XA
Other languages
English (en)
Inventor
李欣宇
车倩
王志海
喻波
张毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Wondersoft Technology Co Ltd
Original Assignee
Beijing Wondersoft Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Wondersoft Technology Co Ltd filed Critical Beijing Wondersoft Technology Co Ltd
Priority to CN202311687023.XA priority Critical patent/CN117687827A/zh
Publication of CN117687827A publication Critical patent/CN117687827A/zh
Pending legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Hardware Redundancy (AREA)

Abstract

本发明实施例提供了一种服务器故障处理方法、装置、电子设备和计算机可读存储介质,涉及数据备份技术领域,包括:检测第一服务器和第二服务器是否均处于正常状态;所述第一服务器包括一个第一节点和一个第一哨兵,所述第二服务器包括一个第二节点和两个第二哨兵;若是,则检测所述第一节点是否为主节点,以及,所述第二节点是否为从节点;若所述第一节点不为主节点,且所述第二节点不为从节点,则将所述第一节点设置为主节点,以及,将所述第二节点设置为从节点。这样,在一主一从且均正常运行的情况下,始终保持主节点对应一个哨兵,从节点对应两个哨兵,从而解决了单点问题,避免了单点问题导致业务系统的故障风险,保证了业务系统的高可用性。

Description

服务器故障处理方法、装置、电子设备和计算机存储介质
技术领域
本发明涉及数据备份技术领域,特别是涉及一种服务器故障处理方法、一种服务器故障处理装置、一种电子设备和一种计算机可读存储介质。
背景技术
数据备份常见方式有热备和冷备,热备的情况下,只有主设备承担用户的业务,在不停机情况下对主设备进行备份。冷备的情况下,也是只有主设备承担业务,在停机情况下对主设备进行备份。
针对冷备,通常当主设备发生故障或停机后,备设备才开始由停机等待状态进入启动运转状态,并承担起故障设备的工作任务,这中间会有人工干预,需要手动启动设备或服务进行故障转移,一般来说,技术人员可能需要很长时间才能将服务恢复正常,对于一些重要的系统,很难忍受如此长时间的服务中断。
热备是指与主设备共同运转,当主设备发生故障或停机时,备设备立即承担起故障设备的工作任务,从而在不需要人工干预的情况下进行故障转移,自动将服务恢复正常,需要注意的是热备也不是无中断的,在设备切换时,服务是有可能中断的。而且,现在的热备方式存在单点问题,导致故障转移失败,使得业务系统存在较大的故障风险。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种服务器故障处理方法、一种服务器故障处理装置、一种电子设备和一种计算机可读存储介质。
本发明实施例公开了一种服务器故障处理方法,所述方法包括:
检测第一服务器和第二服务器是否均处于正常状态;所述第一服务器包括一个第一节点和一个第一哨兵,所述第二服务器包括一个第二节点和两个第二哨兵;
若是,则检测所述第一节点是否为主节点,以及,所述第二节点是否为从节点;
若所述第一节点不为主节点,且所述第二节点不为从节点,则将所述第一节点设置为主节点,以及,将所述第二节点设置为从节点。
在一个或多个实施例中,所述检测第一服务器和第二服务器是否均处于正常状态,包括:
向所述第一服务器和所述第二服务器均发送ping指令,并获取所述第一服务器和所述第二服务器针对所述ping指令的响应信息;
若所述第一服务器和所述第二服务器的响应信息均为pong,则所述第一服务器和所述第二服务器均处于正常状态。
在一个或多个实施例中,所述将所述第一节点设置为主节点,以及,将所述第二节点设置为从节点,包括:
通过所述第二哨兵关闭所述第二节点;
当检测到所述第一哨兵将所述第一节点设置为主节点时,启动所述第二节点。
在一个或多个实施例中,还包括:
若所述第一节点为主节点,且所述第二节点为从节点,则检测所述第一节点、所述第一哨兵、所述第二节点和所述第二哨兵是否处于正常状态;
若所述第一节点处于非正常状态,且所述第一哨兵、所述第二节点和所述第二哨处于正常状态,则通过所述第一节点将所述第一节点设置为从节点,且通过所述第二哨兵将所述第二节点设置为主节点。
在一个或多个实施例中,还包括:
若所述第一服务器处于离线状态,且所述第二服务器处于正常状态,则将所述第二节点设置为主节点;
当检测到所述第一服务器处于在线状态时,将所述第一节点设置为从节点。
相应的,本发明实施例公开了一种服务器故障处理装置,所述装置包括:
第一检测模块,用于检测第一服务器和第二服务器是否均处于正常状态;所述第一服务器包括一个第一节点和一个第一哨兵,所述第二服务器包括一个第二节点和两个第二哨兵;
第二检测模块,用于检测所述第一节点是否为主节点,以及,所述第二节点是否为从节点;
设置模块,用于若所述第一节点不为主节点,且所述第二节点不为从节点,则将所述第一节点设置为主节点,以及,将所述第二节点设置为从节点。
在一个或多个实施例中,所述第一检测模块,具体用于:
向所述第一服务器和所述第二服务器均发送ping指令,并获取所述第一服务器和所述第二服务器针对所述ping指令的响应信息;
若所述第一服务器和所述第二服务器的响应信息均为pong,则所述第一服务器和所述第二服务器均处于正常状态。
在一个或多个实施例中,所述设置模块,具体用于:
通过所述第二哨兵关闭所述第二节点;
当检测到所述第一哨兵将所述第一节点设置为主节点时,启动所述第二节点。
在一个或多个实施例中,还包括:
第三检测模块,用于若所述第一节点为主节点,且所述第二节点为从节点,则检测所述第一节点、所述第一哨兵、所述第二节点和所述第二哨兵是否处于正常状态;
所述设置模块,还用于若所述第一节点处于非正常状态,且所述第一哨兵、所述第二节点和所述第二哨处于正常状态,则通过所述第一节点将所述第一节点设置为从节点,且通过所述第二哨兵将所述第二节点设置为主节点。
在一个或多个实施例中,所述设置模块,还用于:
若所述第一服务器处于离线状态,且所述第二服务器处于正常状态,则将所述第二节点设置为主节点;
当检测到所述第一服务器处于在线状态时,将所述第一节点设置为从节点。
相应的,本发明实施例公开了一种电子设备,包括:处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述服务器故障处理方法实施例的各个步骤。
相应的,本发明实施例公开了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现上述服务器故障处理方法实施例的各个步骤。
本发明实施例包括以下优点:
在本发明实施例中,运维平台检测第一服务器和第二服务器是否均处于正常状态;所述第一服务器包括一个第一节点和一个第一哨兵,所述第二服务器包括一个第二节点和两个第二哨兵;若是,则检测所述第一节点是否为主节点,以及,所述第二节点是否为从节点;若所述第一节点不为主节点,且所述第二节点不为从节点,则将所述第一节点设置为主节点,以及,将所述第二节点设置为从节点。这样,在一主一从且均正常运行的情况下,始终保持主节点对应一个哨兵,从节点对应两个哨兵,从而解决了单点问题,避免了单点问题导致业务系统的故障风险,保证了业务系统的高可用性。
附图说明
图1是本发明的一种服务器故障处理方法实施例的系统框架图;
图2是本发明的一种服务器故障处理方法实施例的步骤流程图;
图3是本发明的一种服务器故障处理装置实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明实施例的核心构思之一在于,在一主一从且均正常运行的情况下,始终保持主节点对应一个哨兵,从节点对应两个哨兵,从而解决了单点问题,避免了单点问题导致业务系统的故障风险,保证了业务系统的高可用性。
参照图1,示出了本发明的一种服务器故障处理方法实施例的系统框架图,该系统可以对redis服务进行双机热备,双机热备就是使用两台服务器共同运行,主服务器提供服务,如果主服务器发生故障,则自动切换由备服务器提供服务,保证应用在短时间内恢复正常。该系统具体可以包括第一服务器和第二服务器,第一服务器中部署有一个第一节点和一个第一哨兵,第二服务器中部署有一个第二节点和两个第二哨兵,第一节点与第二节点之间进行数据同步,每个哨兵均对第一节点和第二节点进行监控。在服务器、节点和哨兵均处于正常状态时,第一节点为主节点,第二节点为从节点。其中,主节点和从节点都可以是redis节点。
参照图2,示出了本发明的一种服务器故障处理方法实施例的步骤流程图,可以应用于运维平台,具体可以包括如下步骤:
步骤201,检测第一服务器和第二服务器是否均处于正常状态。
在实际应用中,可以实时检测第一服务器和第二服务器是否均处于正常状态,如果任一服务器处于非正常状态,那么就需要进行故障处理了。当然,除了可以实时检测之外,还可以每经过预设时间间隔进行检测,比如,每隔10秒进行检测,在实际应用中可以根据实际需求进行设置,本发明实施例对此不作限制。
在本发明实施例中,所述检测第一服务器和第二服务器是否均处于正常状态,包括:
向所述第一服务器和所述第二服务器均发送ping指令,并获取所述第一服务器和所述第二服务器针对所述ping指令的响应信息;
若所述第一服务器和所述第二服务器的响应信息均为pong,则所述第一服务器和所述第二服务器均处于正常状态。
具体而言,在检测服务器是否处于正常状态时,可以使用ping指令,即,运维平台可以向第一服务器和第二服务器分别发送ping指令,第一服务器和第二服务器在接收到ping指令后,可以向运维平台反馈响应信息,如果从第一服务器和第二服务器获取到的响应信息均是pong,那么就表示第一服务器和第二服务器都是正常的;如果任一台服务器的响应信息不是pong,那么就表示服务器处于非正常状态,比如,服务器离线、服务器出现故障等。
步骤202,若是,则检测所述第一节点是否为主节点,以及,所述第二节点是否为从节点。
当检测到第一服务器和第二服务器均处于正常状态时,即可进一步检测第一节点是否为主节点,以及,第二节点是否从节点,从而确定是否需要对第一节点和第二节点进行切换。
步骤203,若所述第一节点不为主节点,且所述第二节点不为从节点,则将所述第一节点设置为主节点,以及,将所述第二节点设置为从节点。
当检测到第一节点不为主节点,且第二节点也不为从节点时,那么就需要将第一节点设置为主节点,以及,将第二节点设置为从节点,从而保证主节点对应一个哨兵,从节点对应两个哨兵,进而保证redis服务的高可用性。
在本发明实施例中,所述将所述第一节点设置为主节点,以及,将所述第二节点设置为从节点,包括:
通过所述第二哨兵关闭所述第二节点;
当检测到所述第一哨兵将所述第一节点设置为主节点时,启动所述第二节点。
具体而言,在设置主节点和从节点时,运维平台可以通过第二哨兵将第二节点关闭,第一哨兵检测到第二节点关闭后,可以将第一节点设置为主节点,当运维平台检测到第一节点设置为主节点完成后,即可通过第二哨兵启动第二节点。
需要说明的是,由于每个哨兵都可以对第一节点和第二节点进行监控,所以,除了可以通过第二哨兵关闭、启动第二节点,通过第一哨兵将第一节点设置为主节点之外,也可以通过第一哨兵关闭、启动第二节点,通过第二哨兵将第一节点设置为主节点,还可以通过第一哨兵和第二哨兵同时对一个节点进行设置,在实际应用中,可以根据实际需求进行设置,本发明实施例对此不作限制。
在本发明实施例中,在步骤203之后,还可以包括:
若所述第一节点为主节点,且所述第二节点为从节点,则检测所述第一节点、所述第一哨兵、所述第二节点和所述第二哨兵是否处于正常状态;
若所述第一节点处于非正常状态,且所述第一哨兵、所述第二节点和所述第二哨处于正常状态,则通过所述第一节点将所述第一节点设置为从节点,且通过所述第二哨兵将所述第二节点设置为主节点。
具体而言,如果第一服务器和第二服务器均处于正常状态,第一节点为主节点,且第二节点为从节点,那么就可以进一步检测第一节点、第一哨兵、第二节点和第二哨兵是否均处于正常状态。
如果第一节点处于非正常状态,但是第一哨兵、第二节点和第二哨兵均处于正常状态,那么就可以通过第一哨兵将第一节点设置为从节点,以及,通过第二哨兵将第二节点设置为主节点。
当然,如前所述,也可以通过第二哨兵将第一节点设置为从节点,以及,通过第一哨兵将第二节点设置为主节点,在实际应用中,可以根据实际需求进行设置,本发明实施例对此不作限制。
在本发明实施例中,在步骤203之后,还可以包括:
若所述第一服务器处于离线状态,且所述第二服务器处于正常状态,则将所述第二节点设置为主节点;
当检测到所述第一服务器处于在线状态时,将所述第一节点设置为从节点。
具体而言,如果运维平台检测到第一服务器处于离线状态,且第二服务器处于正常状态,那么就可以通过一个或多个哨兵将第二节点设置为主节点。在设置完成后,如果运维平台检测到第一服务器再次处于在线状态时,那么就可以通过一个或多个哨兵将第一节点设置为从节点。
之后,运维平台检测到服务器、节点和哨兵均处于正常状态时,即可执行步骤201~步骤203,将第一服务器中的第一节点设置为主节点,以及,将第二服务器中的第二节点设置为从节点。
在本发明实施例中,运维平台检测第一服务器和第二服务器是否均处于正常状态;所述第一服务器包括一个第一节点和一个第一哨兵,所述第二服务器包括一个第二节点和两个第二哨兵;若是,则检测所述第一节点是否为主节点,以及,所述第二节点是否为从节点;若所述第一节点不为主节点,且所述第二节点不为从节点,则将所述第一节点设置为主节点,以及,将所述第二节点设置为从节点。这样,在一主一从且均正常运行的情况下,始终保持主节点对应一个哨兵,从节点对应两个哨兵,从而解决了单点问题,避免了单点问题导致业务系统的故障风险,保证了业务系统的高可用性。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图3,示出了本发明的一种服务器故障处理装置实施例的结构框图,具体可以包括如下模块:
第一检测模块301,用于检测第一服务器和第二服务器是否均处于正常状态;所述第一服务器包括一个第一节点和一个第一哨兵,所述第二服务器包括一个第二节点和两个第二哨兵;
第二检测模块302,用于检测所述第一节点是否为主节点,以及,所述第二节点是否为从节点;
设置模块303,用于若所述第一节点不为主节点,且所述第二节点不为从节点,则将所述第一节点设置为主节点,以及,将所述第二节点设置为从节点。
在本发明实施例中,所述第一检测模块,具体用于:
向所述第一服务器和所述第二服务器均发送ping指令,并获取所述第一服务器和所述第二服务器针对所述ping指令的响应信息;
若所述第一服务器和所述第二服务器的响应信息均为pong,则所述第一服务器和所述第二服务器均处于正常状态。
在本发明实施例中,所述设置模块,具体用于:
通过所述第二哨兵关闭所述第二节点;
当检测到所述第一哨兵将所述第一节点设置为主节点时,启动所述第二节点。
在本发明实施例中,还包括:
第三检测模块,用于若所述第一节点为主节点,且所述第二节点为从节点,则检测所述第一节点、所述第一哨兵、所述第二节点和所述第二哨兵是否处于正常状态;
所述设置模块,还用于若所述第一节点处于非正常状态,且所述第一哨兵、所述第二节点和所述第二哨处于正常状态,则通过所述第一节点将所述第一节点设置为从节点,且通过所述第二哨兵将所述第二节点设置为主节点。
在本发明实施例中,所述设置模块,还用于:
若所述第一服务器处于离线状态,且所述第二服务器处于正常状态,则将所述第二节点设置为主节点;
当检测到所述第一服务器处于在线状态时,将所述第一节点设置为从节点。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本发明实施例还提供了一种电子设备,包括:
包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,该计算机程序被处理器执行时实现上述服务器故障处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储计算机程序,计算机程序被处理器执行时实现上述服务器故障处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种服务器故障处理方法和一种服务器故障处理装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种服务器故障处理方法,其特征在于,所述方法包括:
检测第一服务器和第二服务器是否均处于正常状态;所述第一服务器包括一个第一节点和一个第一哨兵,所述第二服务器包括一个第二节点和两个第二哨兵;
若是,则检测所述第一节点是否为主节点,以及,所述第二节点是否为从节点;
若所述第一节点不为主节点,且所述第二节点不为从节点,则将所述第一节点设置为主节点,以及,将所述第二节点设置为从节点。
2.根据权利要求1所述的服务器故障处理方法,其特征在于,所述检测第一服务器和第二服务器是否均处于正常状态,包括:
向所述第一服务器和所述第二服务器均发送ping指令,并获取所述第一服务器和所述第二服务器针对所述ping指令的响应信息;
若所述第一服务器和所述第二服务器的响应信息均为pong,则所述第一服务器和所述第二服务器均处于正常状态。
3.根据权利要求1所述的服务器故障处理方法,其特征在于,所述将所述第一节点设置为主节点,以及,将所述第二节点设置为从节点,包括:
通过所述第二哨兵关闭所述第二节点;
当检测到所述第一哨兵将所述第一节点设置为主节点时,启动所述第二节点。
4.根据权利要求1所述的服务器故障处理方法,其特征在于,还包括:
若所述第一节点为主节点,且所述第二节点为从节点,则检测所述第一节点、所述第一哨兵、所述第二节点和所述第二哨兵是否处于正常状态;
若所述第一节点处于非正常状态,且所述第一哨兵、所述第二节点和所述第二哨处于正常状态,则通过所述第一节点将所述第一节点设置为从节点,且通过所述第二哨兵将所述第二节点设置为主节点。
5.根据权利要求1所述的服务器故障处理方法,其特征在于,还包括:
若所述第一服务器处于离线状态,且所述第二服务器处于正常状态,则将所述第二节点设置为主节点;
当检测到所述第一服务器处于在线状态时,将所述第一节点设置为从节点。
6.一种服务器故障处理装置,其特征在于,所述装置包括:
第一检测模块,用于检测第一服务器和第二服务器是否均处于正常状态;所述第一服务器包括一个第一节点和一个第一哨兵,所述第二服务器包括一个第二节点和两个第二哨兵;
第二检测模块,用于检测所述第一节点是否为主节点,以及,所述第二节点是否为从节点;
设置模块,用于若所述第一节点不为主节点,且所述第二节点不为从节点,则将所述第一节点设置为主节点,以及,将所述第二节点设置为从节点。
7.根据权利要求6所述的服务器故障处理装置,其特征在于,所述第一检测模块,具体用于:
向所述第一服务器和所述第二服务器均发送ping指令,并获取所述第一服务器和所述第二服务器针对所述ping指令的响应信息;
若所述第一服务器和所述第二服务器的响应信息均为pong,则所述第一服务器和所述第二服务器均处于正常状态。
8.根据权利要求6所述的服务器故障处理装置,其特征在于,所述设置模块,具体用于:
通过所述第二哨兵关闭所述第二节点;
当检测到所述第一哨兵将所述第一节点设置为主节点时,启动所述第二节点。
9.一种电子设备,其特征在于,包括:处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1~5中任一项所述服务器故障处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1~5中任一项所述服务器故障处理方法的步骤。
CN202311687023.XA 2023-12-08 2023-12-08 服务器故障处理方法、装置、电子设备和计算机存储介质 Pending CN117687827A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311687023.XA CN117687827A (zh) 2023-12-08 2023-12-08 服务器故障处理方法、装置、电子设备和计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311687023.XA CN117687827A (zh) 2023-12-08 2023-12-08 服务器故障处理方法、装置、电子设备和计算机存储介质

Publications (1)

Publication Number Publication Date
CN117687827A true CN117687827A (zh) 2024-03-12

Family

ID=90131225

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311687023.XA Pending CN117687827A (zh) 2023-12-08 2023-12-08 服务器故障处理方法、装置、电子设备和计算机存储介质

Country Status (1)

Country Link
CN (1) CN117687827A (zh)

Similar Documents

Publication Publication Date Title
CN109032849B (zh) 热备份系统、热备份方法和计算机设备
US10491671B2 (en) Method and apparatus for switching between servers in server cluster
CN102708018B (zh) 一种异常处理方法及系统、代理设备与控制装置
CN105933407B (zh) 一种实现Redis集群高可用的方法及系统
CN107480014B (zh) 一种高可用设备切换方法及装置
WO2016183967A1 (zh) 一种关键组件的故障告警方法、装置及大数据管理系统
CN112477919B (zh) 一种适用于列车控制系统平台的动态冗余备份方法及系统
CN106970861A (zh) 一种虚拟机容错方法和系统
WO2022088861A1 (zh) 数据库故障处理方法和装置
CN104079442A (zh) 基于实时以太网的冗余控制装置、设备冗余系统和方法
CN112380062A (zh) 一种基于系统备份点多次快速恢复系统的方法及系统
CN104503861A (zh) 一种异常处理方法及系统、代理设备与控制装置
CN111338858B (zh) 一种双机房的容灾方法及装置
CN112153134A (zh) 一种容灾云主机的容灾演练方法、装置、设备及存储介质
CN113438111A (zh) 基于Raft分布式恢复RabbitMQ网络分区的方法及应用
CN114328033A (zh) 保持高可用设备组业务配置一致性的方法及装置
CN117687827A (zh) 服务器故障处理方法、装置、电子设备和计算机存储介质
CN113778607A (zh) 虚拟机实现高可用方法及装置、云管理平台、存储介质
JP2010231257A (ja) 高可用性システム、高可用性システムの対障害対策方法
CN107783855B (zh) 虚拟网元的故障自愈控制装置及方法
CN109617761B (zh) 一种主备服务器切换方法及装置
JP2006229512A (ja) サーバ切替方法,サーバ及びサーバ切替プログラム
CN110955210B (zh) Agv调度方法、装置和系统
JP5951520B2 (ja) 多重系処理システム
KR20050071975A (ko) 자동화 재해 복구 시스템 및 그 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination