CN115499295A - 服务器故障上报方法、装置、电子设备及存储介质 - Google Patents

服务器故障上报方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN115499295A
CN115499295A CN202210907799.7A CN202210907799A CN115499295A CN 115499295 A CN115499295 A CN 115499295A CN 202210907799 A CN202210907799 A CN 202210907799A CN 115499295 A CN115499295 A CN 115499295A
Authority
CN
China
Prior art keywords
server
fault
error code
main server
code corresponding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210907799.7A
Other languages
English (en)
Inventor
李小刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Communication Technology Co Ltd
Original Assignee
Inspur Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Communication Technology Co Ltd filed Critical Inspur Communication Technology Co Ltd
Priority to CN202210907799.7A priority Critical patent/CN115499295A/zh
Publication of CN115499295A publication Critical patent/CN115499295A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications

Abstract

本发明提供一种服务器故障上报方法、装置、电子设备及存储介质,包括:在检测到主用服务器发生故障的情况下,获取所述主用服务器的故障原因对应的错误码;将所述故障原因对应的错误码存储到数据库中间件;启动备用服务器,并将所述备用服务器的状态切换为新的主用服务器,以使所述新的主用服务器从所述数据库中间件中读取所述错误码,将所述故障原因上报到前端界面。本发明可以及时提醒用户发生故障的服务器的具体故障原因,帮助用户有针对性地对有故障的服务器进行修复,提高修复效率,使得修复好的服务器能够及时加入到服务器群中,极大地提升了系统的运行效率。

Description

服务器故障上报方法、装置、电子设备及存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种服务器故障上报方法、装置、电子设备及存储介质。
背景技术
Keepalived软件一般用于检测服务器的状态。在服务器高可用管理中,如果有一台服务器工作出现故障,将被Keepalived检测到,实现服务器的主备自动倒换,并将有故障的服务器从系统中剔除。当服务器工作正常后,Keepalived自动将服务器加入到服务器群中,上述这些工作全部自动完成,需要用户介入参与的仅仅是修复有故障的服务器。
然而,现有技术中,当服务器发生故障时,Keepalived仅会通知故障的发生,触发主备服务器的倒换,而不会记录及上报服务器故障原因,使得用户无法高效地对有故障的服务器进行修复,影响了该服务器重新加入到服务器群的时间,导致系统的运行效率不高。
发明内容
本发明提供一种服务器故障上报方法、装置、电子设备及存储介质,用以解决现有技术中Keepalived不会记录及上报服务器故障原因,使得用户不能有针对性地对有故障的服务器进行及时修复,导致系统的运行效率不高的缺陷。
本发明提供一种服务器故障上报方法,包括:
在检测到主用服务器发生故障的情况下,获取所述主用服务器的故障原因对应的错误码;
将所述故障原因对应的错误码存储到数据库中间件;
启动备用服务器,并将所述备用服务器的状态切换为新的主用服务器,以使所述新的主用服务器从所述数据库中间件中读取所述错误码,将所述故障原因上报到前端界面。
根据本发明提供的一种服务器故障上报方法,在所述在检测到主用服务器发生故障的情况下,获取所述主用服务器的故障原因对应的错误码之前,还包括:
调用预设检查模块对所述主用服务器进行健康状态检查,确定所述主用服务器的检查结果;
在确定所述检查结果为异常的情况下,确定所述主用服务器发生故障。
根据本发明提供的一种服务器故障上报方法,在所述在检测到主用服务器发生故障的情况下,获取所述主用服务器的故障原因对应的错误码之前,还包括:
在检测到内核报告所述主用服务器发生故障的情况下,确定所述主用服务器发生故障。
根据本发明提供的一种服务器故障上报方法,在所述在检测到内核报告所述主用服务器发生故障的情况下,确定所述主用服务器发生故障之后,包括:
执行预设故障回调程序;
在执行所述预设故障回调程序的过程中,将所述主用服务器的故障原因对应的错误码存储到所述数据库中间件。
根据本发明提供的一种服务器故障上报方法,所述在检测到主用服务器发生故障的情况下,获取所述主用服务器的故障原因对应的错误码,包括:
在检测到主用服务器发生故障的情况下,确定所述主用服务器的故障原因;
从预设数据库中,获取所述故障原因对应的错误码。
根据本发明提供的一种服务器故障上报方法,所述预设数据库存储有服务器中各个模块的故障原因与对应的错误码范围的关联信息;所述错误码范围包括各个所述故障原因对应的错误码。
本发明还提供一种服务器故障上报装置,包括:
获取模块,用于在检测到主用服务器发生故障的情况下,获取所述主用服务器的故障原因对应的错误码;
存储模块,用于将所述故障原因对应的错误码存储到数据库中间件;
上报模块,用于启动备用服务器,并将所述备用服务器的状态切换为新的主用服务器,以使所述新的主用服务器从所述数据库中间件中读取所述错误码,将所述故障原因上报到前端界面。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述服务器故障上报方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述服务器故障上报方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述服务器故障上报方法。
本发明提供的服务器故障上报方法、装置、电子设备及存储介质,通过预先按照服务器故障类型,配置一套错误码,可以使Keepalived在检测到主用服务器发生故障的情况下,获取主用服务器的故障原因对应的错误码;并通过将故障原因对应的错误码存储到数据库中间件,启动备用服务器,并将备用服务器的状态切换为新的主用服务器,使得新的主用服务器可以从数据库中间件中及时读取错误码,解析出错误码所指的故障原因,从而将故障原因上报到前端界面,可以及时提醒用户发生故障的服务器的具体故障原因,帮助用户有针对性地对有故障的服务器进行修复,提高修复效率,使得修复好的服务器能够及时加入到服务器群中,极大地提升了系统的运行效率。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的服务器故障上报方法的流程示意图之一;
图2是本发明提供的服务器故障上报方法的流程示意图之二;
图3是本发明提供的服务器故障上报装置的结构示意图;
图4是本发明提供的电子设备的实体结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
下面结合图1-图4描述本发明的服务器故障上报方法、装置、电子设备及存储介质。
核心网作为整个移动通信网络的中央枢纽,对系统有高可靠性要求。一种常用的可靠性性方案为“1+1”主备方案,即一个网元作为主网元处理相关业务消息,另一个网元作为备份。当主网元故障后,备网元将升为主网元,并承接业务消息处理。在“1+1”主备方案中,需关键解决的问题是,如何在主网元故障时,业务可快速切换到备网元,且外部网元感知不到“1+1”主备网元发生故障并经过主备倒换的过程。
Keepalived是Linux下以虚拟路由冗余协议为实现基础的轻量级别的高可用解决方案。虚拟路由冗余协议可以将N(N≥2)台物理路由器设备虚拟成一个虚拟路由,这个虚拟路由器通过虚拟IP(IP数≥1)对外提供服务,而在虚拟路由器内部物理路由器协同工作,同一时间只有1台物理路由器对外提供服务,这台物理路由设备被称为“主用路由器(Master角色)”。一般情况下Master是由选举算法产生,它拥有对外服务的虚拟IP,提供各种网络功能。而其它的物理路由器不拥有对外的虚拟IP,也不提供对外网络功能,仅仅接收Master的虚拟路由冗余协议状态通告信息,这些路由器被统称为“备用路由器(Backup角色)”。当主路由器故障时,处于Backup角色的路由器将重新进行选举,产生一个新的主路由器进入Master角色,继续提供对外服务,整个切换对用户来说是完全透明的。由此,Keepalived可以在主用服务器发生故障的情况下,实现服务器的主备自动倒换。
图1是本发明提供的服务器故障上报方法的流程示意图之一,如图1所示,包括:步骤110、步骤120和步骤130。
步骤110,在检测到主用服务器发生故障的情况下,获取主用服务器的故障原因对应的错误码;
具体地,本发明实施例所描述的错误码指的是预先根据服务器中各个模块可能存在的故障类型进行划分,针对各个故障原因进行统一定义后的编码。也就是说,服务器中的每个模块发生的故障原因,都会对应有一个错误码,根据错误码,可以确定发生故障的模块及故障原因。
基于上述实施例的内容,作为一种可选的实施例,在检测到主用服务器发生故障的情况下,获取主用服务器的故障原因对应的错误码,包括:
在检测到主用服务器发生故障的情况下,确定主用服务器的故障原因;
从预设数据库中,获取故障原因对应的错误码。
具体地,本发明实施例所描述的预设数据库指的是用于存储服务器故障原因对应的错误码数据的数据库。
在本实施例中,在Keepalived检测到主用服务器发生故障的情况下,根据检测到的主用服务器的故障原因,从预设数据库中,获取该故障原因对应的错误码。
本发明实施例的方法,通过预先设置用于存储服务器故障原因对应的错误码数据的数据库,可以方便Keepalived检测到主用服务器发生故障时,及时获取故障原因对应的错误码数据,保证后续程序执行的效率。
基于上述实施例的内容,作为一种可选的实施例,预设数据库存储有服务器中各个模块的故障原因与对应的错误码范围的关联信息;错误码范围包括各个故障原因对应的错误码。
在本发明的实施例中,通过将服务器中各个模块的故障原因进行分类,统一定义一套错误码,按照需要检查的模块,划分错误码范围。可以按照划分的错误码范围,将模块内可能出现的各个故障原因和每个错误码进行一对一定义,并将定义好的数据存储到预设数据库中,
也就是说,预设数据库中会存储服务器中各个模块的故障原因与对应的错误码范围的关联信息,在错误码范围中,包含有各个故障原因对应的错误码。
本发明实施例的方法,通过预先对服务器的模块进行故障类型分类,统一定义故障原因对应的错误码,实现对服务器故障原因的细分类,有利于故障信息上报的准确率。
步骤120,将故障原因对应的错误码存储到数据库中间件;
具体地,本发明实施例所描述的数据库中间件指的是介于应用系统和系统软件之间的一类软件,它使用系统软件所提供的基础服务(功能),衔接网络上应用系统的各个部分或不同的应用,能够达到资源共享、功能共享的目的。
在本发明的实施例中,在获取主用服务器的故障原因对应的错误码之后,Keepalived可以将故障原因对应的错误码存储到数据库中间件,以实现数据共享的目的。
步骤130,启动备用服务器,并将备用服务器的状态切换为新的主用服务器,以使新的主用服务器从数据库中间件中读取错误码,将故障原因上报到前端界面。
具体地,本发明实施例所描述的新的主用服务器指的是通过Keepalived进行主备服务器倒换,从备用服务器中重新确定服务器群中的主用服务器。
本发明实施例所描述的前端界面可以指的是系统前端的管理界面,可以与用户进行人机交互。
在本发明的实施例中,可以通过选举算法,从备用服务器中选出用于主备倒换的备用服务器,启动该备用服务器,将备用服务器的状态切换为新的主用服务器。
可以理解的是,在进行主备倒换过程中,原先的主用服务器会将所有功能数据同步给新的主用服务器中,由新的主用服务器承接业务消息的处理。
进一步地,新的主用服务器可以从数据库中间件中读取到故障服务器的故障原因对应的错误码,并将该错误码解析为具体地故障原因,从而感知到上一次故障倒换的具体原因,同时新的主用服务器还可以将故障原因上报到前端的管理界面,提醒用户故障服务发生故障的具体原因。
本发明实施例提供的服务器故障上报方法,通过预先按照服务器故障类型,配置一套错误码,可以使Keepalived在检测到主用服务器发生故障的情况下,获取主用服务器的故障原因对应的错误码;并通过将故障原因对应的错误码存储到数据库中间件,启动备用服务器,并将备用服务器的状态切换为新的主用服务器,使得新的主用服务器可以从数据库中间件中及时读取错误码,解析出错误码所指的故障原因,从而将故障原因上报到前端界面,可以及时提醒用户发生故障的服务器的具体故障原因,帮助用户有针对性地对有故障的服务器进行修复,提高修复效率,使得修复好的服务器能够及时加入到服务器群中,极大地提升了系统的运行效率。
基于上述实施例的内容,作为一种可选的实施例,在检测到主用服务器发生故障的情况下,获取主用服务器的故障原因对应的错误码之前,还包括:
调用预设检查模块对主用服务器进行健康状态检查,确定主用服务器的检查结果;
在确定检查结果为异常的情况下,确定主用服务器发生故障。
具体地,本发明实施例所描述的预设检查模块指的是用户预先自定义的检查模块,其用于检查服务器的健康状态。
在本发明的实施例中,可以在Keepalived调用用户自定义预设检查模块的场景下,进行服务器故障信息的上报。
在本发明的实施例中,Keepalived可以周期调用预设检查模块,以对对主用服务器进行健康状态检查,确定主用服务器的检查结果。
当预设检查模块检测服务器的健康状态为不通过,即确定检查结果为异常时,即可确定主用服务器发生故障。
图2是本发明提供的服务器故障上报方法的流程示意图之二,如图2所示,在Keepalived监测到主用服务器故障后,获取主用服务器的故障原因对应的错误码,将该故障原因对应的错误码存储到数据库中间件,并返回非0的检查结果。
主用服务器状态切换为故障状态。
进一步地,备用服务器倒换为主用角色,即倒换为新的主用服务器。
进一步地,新的主用服务器可以从数据库中间件中读取错误码,将错误码解析为具体地故障原因,并将故障原因上报到前端界面。
本发明实施例的方法,通过用户预先自定义的服务器健康状态的预设检查模块,使Keepalived可以通过周期调用该预设检查模块,监测主用服务器的健康状态,便于Keepalived在检测到主用服务器发生故障时,记录故障原因对应的错误码,以共享给新的主用服务器,实现服务器故障原因的自动上报。
基于上述实施例的内容,作为一种可选的实施例,在检测到主用服务器发生故障的情况下,获取主用服务器的故障原因对应的错误码之前,还包括:
在检测到内核报告主用服务器发生故障的情况下,确定主用服务器发生故障。
在本发明的实施例中,还可以在Linux内核报告相关服务器设备故障的场景下,进行服务器故障信息的上报。
基于上述实施例的内容,作为一种可选的实施例,在检测到内核报告主用服务器发生故障的情况下,确定主用服务器发生故障之后,包括:
执行预设故障回调程序;
在执行预设故障回调程序的过程中,将主用服务器的故障原因对应的错误码存储到数据库中间件。
具体地,本发明实施例所描述的预设故障回调程序指的是预先在Keepalived中新增的服务器故障回调点程序。
在本发明的实施例中,预先在Keepalived中新增的服务器故障回调点程序,实现预设故障回调程序。
在本发明的实施例中,当Linux内核上报主用服务器故障时,Keepalived执行预设故障回调程序,将故障原因对应的错误码传到回调中,在回调中将该错误码存储到数据库中间件中。
如图2所示,在Keepalived通过检测到内核报告主用服务器发生故障时,监测到主用服务器故障后,Keepalived执行预设故障回调程序,并在执行预设故障回调程序的过程中,将主用服务器的故障原因对应的错误码存储到数据库中间件。
主用服务器状态切换为故障状态。
进而备用服务器倒换为主用角色,即倒换为新的主用服务器。
新的主用服务器可以从数据库中间件中读取错误码,将错误码解析为具体地故障原因,并将故障原因上报到前端界面。
本发明实施例的方法,通过预先在Keepalived中新增的服务器故障回调点程序,使得Linux内核上报主用服务器发生故障时,Keepalived可以通过执行该预设故障回调程序,在回调中记录故障原因对应的错误码,以共享给新的主用服务器,实现服务器故障原因的自动上报。
下面对本发明提供的服务器故障上报装置进行描述,下文描述的服务器故障上报装置与上文描述的服务器故障上报方法可相互对应参照。
图3是本发明提供的服务器故障上报装置的结构示意图,如图3所示,包括:
获取模块310,用于在检测到主用服务器发生故障的情况下,获取主用服务器的故障原因对应的错误码;
存储模块320,用于将故障原因对应的错误码存储到数据库中间件;
上报模块330,用于启动备用服务器,并将备用服务器的状态切换为新的主用服务器,以使新的主用服务器从数据库中间件中读取错误码,将故障原因上报到前端界面。
本实施例所述的服务器故障上报装置可以用于执行上述服务器故障上报方法实施例,其原理和技术效果类似,此处不再赘述。
本发明实施例提供的服务器故障上报装置,通过预先按照服务器故障类型,配置一套错误码,可以使Keepalived在检测到主用服务器发生故障的情况下,获取主用服务器的故障原因对应的错误码;并通过将故障原因对应的错误码存储到数据库中间件,启动备用服务器,并将备用服务器的状态切换为新的主用服务器,使得新的主用服务器可以从数据库中间件中及时读取错误码,解析出错误码所指的故障原因,从而将故障原因上报到前端界面,可以及时提醒用户发生故障的服务器的具体故障原因,帮助用户有针对性地对有故障的服务器进行修复,提高修复效率,使得修复好的服务器能够及时加入到服务器群中,极大地提升了系统的运行效率。
基于上述实施例的内容,作为一种可选的实施例,该装置还包括:
调用模块,用于调用预设检查模块对所述主用服务器进行健康状态检查,确定所述主用服务器的检查结果;
第一处理模块,用于在确定所述检查结果为异常的情况下,确定所述主用服务器发生故障。
基于上述实施例的内容,作为一种可选的实施例,该装置还包括:
第二处理模块,用于在检测到内核报告所述主用服务器发生故障的情况下,确定所述主用服务器发生故障。
基于上述实施例的内容,作为一种可选的实施例,该装置还包括:
执行模块,用于执行预设故障回调程序;
第三处理模块,用于在执行所述预设故障回调程序的过程中,将所述主用服务器的故障原因对应的错误码存储到所述数据库中间件。
基于上述实施例的内容,作为一种可选的实施例,获取模块310包括:
处理子模块,用于在检测到主用服务器发生故障的情况下,确定所述主用服务器的故障原因;
获取子模块,用于从预设数据库中,获取所述故障原因对应的错误码。
图4是本发明提供的电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和通信总线440,其中,处理器410,通信接口420,存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令,以执行上述各方法所提供的服务器故障上报方法,该方法包括:在检测到主用服务器发生故障的情况下,获取所述主用服务器的故障原因对应的错误码;将所述故障原因对应的错误码存储到数据库中间件;启动备用服务器,并将所述备用服务器的状态切换为新的主用服务器,以使所述新的主用服务器从所述数据库中间件中读取所述错误码,将所述故障原因上报到前端界面。
此外,上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的服务器故障上报方法,该方法包括:在检测到主用服务器发生故障的情况下,获取所述主用服务器的故障原因对应的错误码;将所述故障原因对应的错误码存储到数据库中间件;启动备用服务器,并将所述备用服务器的状态切换为新的主用服务器,以使所述新的主用服务器从所述数据库中间件中读取所述错误码,将所述故障原因上报到前端界面。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的服务器故障上报方法,该方法包括:在检测到主用服务器发生故障的情况下,获取所述主用服务器的故障原因对应的错误码;将所述故障原因对应的错误码存储到数据库中间件;启动备用服务器,并将所述备用服务器的状态切换为新的主用服务器,以使所述新的主用服务器从所述数据库中间件中读取所述错误码,将所述故障原因上报到前端界面。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种服务器故障上报方法,其特征在于,包括:
在检测到主用服务器发生故障的情况下,获取所述主用服务器的故障原因对应的错误码;
将所述故障原因对应的错误码存储到数据库中间件;
启动备用服务器,并将所述备用服务器的状态切换为新的主用服务器,以使所述新的主用服务器从所述数据库中间件中读取所述错误码,将所述故障原因上报到前端界面。
2.根据权利要求1所述的服务器故障上报方法,其特征在于,在所述在检测到主用服务器发生故障的情况下,获取所述主用服务器的故障原因对应的错误码之前,还包括:
调用预设检查模块对所述主用服务器进行健康状态检查,确定所述主用服务器的检查结果;
在确定所述检查结果为异常的情况下,确定所述主用服务器发生故障。
3.根据权利要求1所述的服务器故障上报方法,其特征在于,在所述在检测到主用服务器发生故障的情况下,获取所述主用服务器的故障原因对应的错误码之前,还包括:
在检测到内核报告所述主用服务器发生故障的情况下,确定所述主用服务器发生故障。
4.根据权利要求3所述的服务器故障上报方法,其特征在于,在所述在检测到内核报告所述主用服务器发生故障的情况下,确定所述主用服务器发生故障之后,包括:
执行预设故障回调程序;
在执行所述预设故障回调程序的过程中,将所述主用服务器的故障原因对应的错误码存储到所述数据库中间件。
5.根据权利要求1所述的服务器故障上报方法,其特征在于,所述在检测到主用服务器发生故障的情况下,获取所述主用服务器的故障原因对应的错误码,包括:
在检测到主用服务器发生故障的情况下,确定所述主用服务器的故障原因;
从预设数据库中,获取所述故障原因对应的错误码。
6.根据权利要求5所述的服务器故障上报方法,其特征在于,所述预设数据库存储有服务器中各个模块的故障原因与对应的错误码范围的关联信息;所述错误码范围包括各个所述故障原因对应的错误码。
7.一种服务器故障上报装置,其特征在于,包括:
获取模块,用于在检测到主用服务器发生故障的情况下,获取所述主用服务器的故障原因对应的错误码;
存储模块,用于将所述故障原因对应的错误码存储到数据库中间件;
上报模块,用于启动备用服务器,并将所述备用服务器的状态切换为新的主用服务器,以使所述新的主用服务器从所述数据库中间件中读取所述错误码,将所述故障原因上报到前端界面。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述服务器故障上报方法。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述服务器故障上报方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述服务器故障上报方法。
CN202210907799.7A 2022-07-29 2022-07-29 服务器故障上报方法、装置、电子设备及存储介质 Pending CN115499295A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210907799.7A CN115499295A (zh) 2022-07-29 2022-07-29 服务器故障上报方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210907799.7A CN115499295A (zh) 2022-07-29 2022-07-29 服务器故障上报方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN115499295A true CN115499295A (zh) 2022-12-20

Family

ID=84466755

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210907799.7A Pending CN115499295A (zh) 2022-07-29 2022-07-29 服务器故障上报方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN115499295A (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080049962A (ko) * 2006-12-01 2008-06-05 한국동서발전(주) 발전기 제어 시스템에 대한 고장 진단 및 예측 정비를제공하는 방법과 그를 위한 장치 및 시스템
CN102185720A (zh) * 2011-05-13 2011-09-14 中兴通讯股份有限公司 一种北向通知管理接口装置及其管理方法
US20140071834A1 (en) * 2012-08-30 2014-03-13 Huawei Technologies Co., Ltd. Method and Device for Processing Location Information of Fault Point
JP2015201031A (ja) * 2014-04-08 2015-11-12 日本電信電話株式会社 冗長システムとアラーム管理方法
WO2016183967A1 (zh) * 2015-05-19 2016-11-24 中兴通讯股份有限公司 一种关键组件的故障告警方法、装置及大数据管理系统
CN108109287A (zh) * 2017-12-29 2018-06-01 深圳怡化电脑股份有限公司 用于存取款设备错误上报的方法、装置、设备及存储介质
CN108243031A (zh) * 2016-12-23 2018-07-03 大唐移动通信设备有限公司 一种双机热备的实现方法及装置
CN110413489A (zh) * 2019-07-31 2019-11-05 浪潮商用机器有限公司 快速识别服务器故障代码的系统、方法、设备及存储介质
CN110868311A (zh) * 2018-08-27 2020-03-06 阿里巴巴集团控股有限公司 LoRaWAN基站及其故障监测方法、装置、设备及存储介质
CN111427730A (zh) * 2020-03-13 2020-07-17 苏州浪潮智能科技有限公司 一种集中式安全管理框架服务故障的修复方法和装置
CN113127299A (zh) * 2021-03-30 2021-07-16 山东英信计算机技术有限公司 服务器运维方法、装置、系统及计算机可读存储介质
WO2021208564A1 (zh) * 2020-04-15 2021-10-21 杭州海康威视数字技术股份有限公司 设备故障修复方法、装置、电子设备及存储介质
CN113608908A (zh) * 2021-07-28 2021-11-05 烽火超微信息科技有限公司 服务器故障处理方法、系统、设备及可读存储介质
CN113961398A (zh) * 2021-11-10 2022-01-21 中国建设银行股份有限公司 业务处理方法、装置、系统、设备、存储介质和产品
WO2022100540A1 (zh) * 2020-11-13 2022-05-19 深圳市领峰电动智能科技有限公司 无人机系统故障诊断方法、装置、电子设备和存储介质

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080049962A (ko) * 2006-12-01 2008-06-05 한국동서발전(주) 발전기 제어 시스템에 대한 고장 진단 및 예측 정비를제공하는 방법과 그를 위한 장치 및 시스템
CN102185720A (zh) * 2011-05-13 2011-09-14 中兴通讯股份有限公司 一种北向通知管理接口装置及其管理方法
US20140071834A1 (en) * 2012-08-30 2014-03-13 Huawei Technologies Co., Ltd. Method and Device for Processing Location Information of Fault Point
JP2015201031A (ja) * 2014-04-08 2015-11-12 日本電信電話株式会社 冗長システムとアラーム管理方法
WO2016183967A1 (zh) * 2015-05-19 2016-11-24 中兴通讯股份有限公司 一种关键组件的故障告警方法、装置及大数据管理系统
CN108243031A (zh) * 2016-12-23 2018-07-03 大唐移动通信设备有限公司 一种双机热备的实现方法及装置
CN108109287A (zh) * 2017-12-29 2018-06-01 深圳怡化电脑股份有限公司 用于存取款设备错误上报的方法、装置、设备及存储介质
CN110868311A (zh) * 2018-08-27 2020-03-06 阿里巴巴集团控股有限公司 LoRaWAN基站及其故障监测方法、装置、设备及存储介质
CN110413489A (zh) * 2019-07-31 2019-11-05 浪潮商用机器有限公司 快速识别服务器故障代码的系统、方法、设备及存储介质
CN111427730A (zh) * 2020-03-13 2020-07-17 苏州浪潮智能科技有限公司 一种集中式安全管理框架服务故障的修复方法和装置
WO2021208564A1 (zh) * 2020-04-15 2021-10-21 杭州海康威视数字技术股份有限公司 设备故障修复方法、装置、电子设备及存储介质
WO2022100540A1 (zh) * 2020-11-13 2022-05-19 深圳市领峰电动智能科技有限公司 无人机系统故障诊断方法、装置、电子设备和存储介质
CN113127299A (zh) * 2021-03-30 2021-07-16 山东英信计算机技术有限公司 服务器运维方法、装置、系统及计算机可读存储介质
CN113608908A (zh) * 2021-07-28 2021-11-05 烽火超微信息科技有限公司 服务器故障处理方法、系统、设备及可读存储介质
CN113961398A (zh) * 2021-11-10 2022-01-21 中国建设银行股份有限公司 业务处理方法、装置、系统、设备、存储介质和产品

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
FARAH EL ALI; BERTRAND DUCOURTHIAL: "Keepalive service for VANET applications", 2014 IEEE WIRELESS COMMUNICATIONS AND NETWORKING CONFERENCE (WCNC) *
苏志刚;郝敬堂;屈景怡;吴仁彪;: "基于中间件的可修复分布式系统可靠性分析", 计算机工程与设计, no. 05 *

Similar Documents

Publication Publication Date Title
US10601643B2 (en) Troubleshooting method and apparatus using key performance indicator information
CN105808394B (zh) 一种服务器自愈的方法和装置
CN106933843B (zh) 数据库心跳检测方法以及装置
CN111385107B (zh) 一种服务器的主备切换处理方法及装置
WO2017107656A1 (zh) 虚拟化网元故障自愈方法及装置
CN107508694B (zh) 一种集群内的节点管理方法及节点设备
US20210105179A1 (en) Fault management method and related apparatus
CN110875841A (zh) 报警信息的推送方法、装置及可读存储介质
CN114741060A (zh) 基于中台的业务系统开发方法及装置
CN101262479B (zh) 一种网络文件共享的方法、服务器和网络文件共享的系统
CN106506278B (zh) 一种服务可用性监控方法及装置
CN109510730B (zh) 分布式系统及其监控方法、装置、电子设备及存储介质
WO2013111317A1 (ja) 情報処理方法、装置及びプログラム
CN113765690A (zh) 集群切换方法、系统、装置、终端、服务器及存储介质
CN116737444A (zh) 一种数据库服务器故障处理方法及系统
CN115499295A (zh) 服务器故障上报方法、装置、电子设备及存储介质
CN111309515A (zh) 一种容灾控制方法、装置及系统
CN115496470A (zh) 全链路配置化数据处理方法、装置和电子设备
CN109753292B (zh) 一种在多单实例数据库服务中部署多个应用的方法及装置
CN107919980B (zh) 一种集群化系统的评测方法和装置
CN108400894B (zh) 一种服务器集群网络故障定位方法及系统
CN112564968B (zh) 故障处理方法、装置及存储介质
US20240036968A1 (en) Managing service configuration attempts for a host in response to failure
EP4084492A1 (en) A method, system and olt for dual-parenting pon protection
CN116841834A (zh) 状态调节方法和装置、存储介质及电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination