CN112579356A - 一种故障处理方法及服务器 - Google Patents
一种故障处理方法及服务器 Download PDFInfo
- Publication number
- CN112579356A CN112579356A CN202011521749.2A CN202011521749A CN112579356A CN 112579356 A CN112579356 A CN 112579356A CN 202011521749 A CN202011521749 A CN 202011521749A CN 112579356 A CN112579356 A CN 112579356A
- Authority
- CN
- China
- Prior art keywords
- service
- fault
- processing core
- type
- serial number
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1415—Saving, restoring, recovering or retrying at system level
- G06F11/142—Reconfiguring to eliminate the error
- G06F11/143—Reconfiguring to eliminate the error with loss of software functionality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1415—Saving, restoring, recovering or retrying at system level
- G06F11/1438—Restarting or rejuvenating
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Retry When Errors Occur (AREA)
Abstract
本申请适用于计算机技术领域,提供了一种故障处理方法,包括:当检测到业务处理核心发生崩溃故障时,获取故障业务的业务信息,将所述故障业务的业务类型记录为故障业务类型,重启所述业务处理核心,并控制所述业务处理核心跳过业务类型为故障业务类型的业务。上述方法,当检测到业务处理核心发生崩溃故障时,将故障业务的业务类型记录为故障业务类型,重启业务处理核心,并控制业务处理核心跳过业务类型为故障业务类型的业务。这样,通过记录故障业务类型,实现降级配置,遇到此类故障跳过处理,这样交易系统不会发生崩溃,而自动重启和反演。节省了系统资源,并且提高了效率。
Description
技术领域
本申请属于计算机技术领域,尤其涉及一种故障处理方法及服务器。
背景技术
在分布式交易系统中,服务器在处理业务崩溃时,崩溃的业务进程会停止,然后再次启动业务进程。被重新拉起的业务进程需要反演,即业务进程在重新启动时,需要重新处理一遍业务进程,以建立其当时的内存状态。当服务器再次处理上一次崩溃的子业务时,默认不处理直接跳过。虽然这样的故障处理方式能够跳过崩溃的子业务,但是应用性不好,如果客户业务量大,反演时间比较长,业务进程重启和反演次数也会较多,导致占用系统资源,并且效率低。
发明内容
本申请实施例提供了一种虚拟定时器的定时方法及设备,可以解决当需要使用多个定时功能,需要提供多个硬件定时器,硬件成本过高的问题。
第一方面,本申请实施例提供了一种故障处理方法,应用于服务器,所述方法包括:
当检测到业务处理核心发生崩溃故障时,获取故障业务的业务信息,所述故障业务为所述业务处理核心发生崩溃故障时正在处理的业务,所述业务信息包括业务类型;
将所述故障业务的业务类型记录为故障业务类型,重启所述业务处理核心,并控制所述业务处理核心跳过业务类型为故障业务类型的业务。
进一步地,所述当检测到业务处理核心发生崩溃故障时,获取故障业务的业务信息,包括:
当检测到业务处理核心发生崩溃故障时,获取所述业务处理正在处理的业务的序号处理状态;
若所述序号处理状态为异常状态,则将所述业务确定为故障业务,并获取故障业务的业务信息。
进一步地,在所述获取所述业务处理正在处理的业务的序号处理状态之后,还包括:
若所述序号处理状态为正常状态,则重启所述业务处理核心。
进一步地,所述业务信息还包括业务序号;
所述重启所述业务处理核心,并控制所述业务处理核心跳过业务类型为故障业务类型的业务,包括:
将所述业务序号记录为故障业务序号,以及,根据所述业务序号确定反演序号;
重启所述业务处理核心,获取消息总线上的待处理业务;
若所述待处理业务的业务序号不是故障业务序号,且所述待处理业务的业务序号大于或等于所述反演序号,则获取所述待处理业务的业务类型;
若所述待处理业务的业务类型为故障业务类型,则跳过所述待处理业务。
进一步地,在所述获取消息总线上的待处理业务之后,还包括:
若所述待处理业务的业务序号为故障业务序号,则控制所述业务处理核心跳过所述待处理业务。
进一步地,在所述当检测到业务处理核心发生崩溃故障时,获取故障业务的业务信息之后,还包括:
将所述业务信息发送至客户端设备;
接收由所述客户端设备返回的用户指定的目标业务类型;所述目标业务类型属于所述业务信息包括的业务类型;
所述将所述故障业务的业务类型记录为故障业务类型,包括:
将所述故障业务的业务类型中所述客户指定的目标业务类型记录为故障业务类型。
第二方面,本申请实施例提供了一种服务器,包括:
第一处理单元,用于当检测到业务处理核心发生崩溃故障时,获取故障业务的业务信息,所述故障业务为所述业务处理核心发生崩溃故障时正在处理的业务,所述业务信息包括业务类型;
第二处理单元,用于将所述故障业务的业务类型记录为故障业务类型,重启所述业务处理核心,并控制所述业务处理核心跳过业务类型为故障业务类型的业务。
进一步地,所述第一处理单元,具体用于:
当检测到业务处理核心发生崩溃故障时,获取所述业务处理正在处理的业务的序号处理状态;
若所述序号处理状态为异常状态,则将所述业务确定为故障业务,并获取故障业务的业务信息。
进一步地,所述第一处理单元,具体还用于:
若所述序号处理状态为正常状态,则重启所述业务处理核心。
进一步地,所述业务信息还包括业务序号;
所述第二处理单元,具体用于:
将所述业务序号记录为故障业务序号,以及,根据所述业务序号确定反演序号;
重启所述业务处理核心,获取消息总线上的待处理业务;
若所述待处理业务的业务序号不是故障业务序号,且所述待处理业务的业务序号大于或等于所述反演序号,则获取所述待处理业务的业务类型;
若所述待处理业务的业务类型为故障业务类型,则跳过所述待处理业务。
进一步地,所述第二处理单元,具体还用于:
若所述待处理业务的业务序号为故障业务序号,则控制所述业务处理核心跳过所述待处理业务。
进一步地,所述服务器,还包括:
发送单元,用于将所述业务信息发送至客户端设备;
接收单元,用于接收由所述客户端设备返回的用户指定的目标业务类型;所述目标业务类型属于所述业务信息包括的业务类型;
所述第二处理单元,具体用于:
将所述故障业务的业务类型中所述客户指定的目标业务类型记录为故障业务类型。
第三方面,本申请实施例提供了一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的故障处理方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的故障处理方法。
本申请实施例中,当检测到业务处理核心发生崩溃故障时,获取故障业务的业务信息,将所述故障业务的业务类型记录为故障业务类型,重启所述业务处理核心,并控制所述业务处理核心跳过业务类型为故障业务类型的业务。上述方法,当检测到业务处理核心发生崩溃故障时,将故障业务的业务类型记录为故障业务类型,重启业务处理核心,并控制业务处理核心跳过业务类型为故障业务类型的业务。这样,通过记录故障业务类型,实现降级配置,遇到此类故障跳过处理,这样交易系统不会发生崩溃,而自动重启和反演。节省了系统资源,并且提高了效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请第一实施例提供的一种故障处理方法的示意流程图;
图2是本申请第二实施例提供的服务器的示意图;
图3是本申请第三实施例提供的服务器的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
请参见图1,图1是本申请第一实施例提供的一种故障处理方法的示意流程图。本实施例中一种故障处理方法的执行主体为服务器。如图1所示的故障处理方法可以包括:
S101:当检测到业务处理核心发生崩溃故障时,获取故障业务的业务信息,所述故障业务为所述业务处理核心发生崩溃故障时正在处理的业务,所述业务信息包括业务类型。
在分布式交易系统中,业务处理核心在处理某类业务时,可能会出现崩溃故障。其中,本实施例中的崩溃故障需要是业务原因导致的。
本实施例中的服务器可以包括两部分,一部分为业务处理核心,一部分为代理。其中,业务处理核心用于处理业务,代理用于监控服务器所有进程。
如果业务处理核心发生崩溃或者业务处理核心进程被杀掉,代理会进行判断,判断本次崩溃的原因是否是因为业务原因,如果是业务原因导致业务处理核心崩溃而停止,获取故障业务的业务信息。
一种实施方式中,服务器中会对业务进行序号处理状态的标记,当该业务出现崩溃故障时,该业务序号处理状态标记为异常状态;当该业务并未出现崩溃故障时,该业务序号处理状态标记为正常状态。当检测到业务处理核心发生崩溃故障时,服务器可以获取业务处理正在处理的业务的序号处理状态,业务的序号处理状态标识了业务是否为故障业务。所以,若服务器判断序号处理状态为异常状态,说明当前崩溃故障是由于业务原因导致的,则将业务确定为故障业务,并获取故障业务的业务信息;若序号处理状态为正常状态,则正常重启业务处理核心。
其中,故障业务为业务处理核心发生崩溃故障时正在处理的业务,业务信息包括业务类型。
S102:将所述故障业务的业务类型记录为故障业务类型,重启所述业务处理核心,并控制所述业务处理核心跳过业务类型为故障业务类型的业务。
设备将故障业务的业务类型记录为故障业务类型,当重启业务处理核心后,需要根据之前发送给该业务处理核心的指令流,重新处理一遍,以建立其重启前的内存状态。当再次处理上一次故障业务时,由于该故障业务被标记为了故障业务类型,再次处理该故障业务,可能会再次发生崩溃,再次重启,所以,为了避免这种情况,业务处理核心会跳过业务类型为故障业务类型的业务。本实施例中,是服务器自动将业务类型记录为故障业务类型,并且重启后,控制业务处理核心跳过业务类型为故障业务类型的业务。
一种实施方式中,服务器可以将业务信息发送给客户端设备,用户可以通过在客户端设备进行人工干预,确定是否跳过故障业务。在获取故障业务的业务信息之后,服务器可以将业务信息发送至客户端设备;客户端设备上可以向用户展示故障业务的业务信息,故障业务的业务信息可以包括业务类型,业务名称、异常次数和跳过次数等等。用户可以通过这些业务信息了解当前业务故障的情况,从而选择是否跳过。用户也可以将直接将该故障业务指定为目标业务类型,即客户端设备可能会接收到多个业务信息包括的业务类型,用户可以从多个业务类型中指定目标业务类型,作为故障业务类型,即遇到目标业务类型都可以进行跳过处理。
此外,用户也可以选择重启后,不跳过故障业务,先观察再次遇到故障业务是否还出现崩溃故障,如果再次崩溃,再次人工干预方式进行选择。
用户可以通过客户端设备直接的获取到业务信息,了解故障业务的情况。
需要说明的是不管用户选择哪种方式,业务处理核心要保证主备节点数据一致。每次反演的所有业务处理方式保持一致,即之前处理过的业务数据流不管是否跳过,后续再次反演也是同样处理方式。
客户端设备将用户指定的目标业务类型发送至服务器,服务器接收由客户端设备返回的用户指定的目标业务类型;可以理解是,目标业务类型属于业务信息包括的业务类型。服务器将客户指定的目标业务类型记录为故障业务类型,服务器重启业务处理核心,并控制业务处理核心跳过业务类型为故障业务类型的业务。
一种实施方式中,业务信息还包括业务序号,服务器在判断是否跳过故障业务时,可以根据业务序号来判断。在重启之前,服务器可以根据需要确定反演序号,并且服务器可以将故障业务的业务序号可以记录为故障业务序号。在服务器重启业务处理核心后,会重新接收消息总线上的所有消息并且重新处理,服务器获取消息总线上的待处理业务。服务器需要恢复数据到重启前上次业务处理核心停止时的状态。
服务器开始进行业务处理,对每个待处理业务的业务序号都进行判断,判断待处理业务的业务序号是不是故障业务序号,以及判断待处理业务的业务序号是否大于或等于反演序号。
服务器判断待处理业务的业务序号是不是故障业务序号,若待处理业务的业务序号为故障业务序号,则控制业务处理核心跳过所述待处理业务,直接就可以跳过处理,不用继续判断。
服务器判断待处理业务的业务序号是否大于或等于反演序号是为了确定当前是否在在反演,如果是在反演,说明以前已经处理成功,本次也会处理成功。
若待处理业务的业务序号不是故障业务序号,且待处理业务的业务序号大于或等于反演序号,则该待处理业务不是反演过程,是新的业务,服务器需要获取待处理业务的业务类型,并且再次判断待处理业务的业务类型是否为故障业务类型,若待处理业务的业务类型为故障业务类型,则跳过待处理业务。服务器也可以将待处理业务的业务信息发送给客户端设备,让用户进行人为干预,可以参与上文中对于这一部分的详细描述,此处不再赘述。
可以理解的是,如果待处理业务的业务类型不属于故障业务类型,则正常处理该业务即可。
本申请实施例中,当检测到业务处理核心发生崩溃故障时,获取故障业务的业务信息,将所述故障业务的业务类型记录为故障业务类型,重启所述业务处理核心,并控制所述业务处理核心跳过业务类型为故障业务类型的业务。上述方法,当检测到业务处理核心发生崩溃故障时,将故障业务的业务类型记录为故障业务类型,重启业务处理核心,并控制业务处理核心跳过业务类型为故障业务类型的业务。这样,通过记录故障业务类型,实现降级配置,遇到此类故障跳过处理,这样交易系统不会发生崩溃,而自动重启和反演。节省了系统资源,并且提高了业务处理核心的健壮性和执行效率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
请参见图2,图2是本申请第二实施例提供的服务器的示意图。包括的各单元用于执行图1对应的实施例中的各步骤。具体请参阅图1对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图2,服务器2包括:
第一处理单元210,用于当检测到业务处理核心发生崩溃故障时,获取故障业务的业务信息,所述故障业务为所述业务处理核心发生崩溃故障时正在处理的业务,所述业务信息包括业务类型;
第二处理单元220,用于将所述故障业务的业务类型记录为故障业务类型,重启所述业务处理核心,并控制所述业务处理核心跳过业务类型为故障业务类型的业务。
进一步地,所述第一处理单元210,具体用于:
当检测到业务处理核心发生崩溃故障时,获取所述业务处理正在处理的业务的序号处理状态;
若所述序号处理状态为异常状态,则将所述业务确定为故障业务,并获取故障业务的业务信息。
进一步地,所述第一处理单元210,具体还用于:
若所述序号处理状态为正常状态,则重启所述业务处理核心。
进一步地,所述业务信息还包括业务序号;
所述第二处理单元220,具体用于:
将所述业务序号记录为故障业务序号,以及,根据所述业务序号确定反演序号;
重启所述业务处理核心,获取消息总线上的待处理业务;
若所述待处理业务的业务序号不是故障业务序号,且所述待处理业务的业务序号大于或等于所述反演序号,则获取所述待处理业务的业务类型;
若所述待处理业务的业务类型为故障业务类型,则跳过所述待处理业务。
进一步地,所述第二处理单元220,具体还用于:
若所述待处理业务的业务序号为故障业务序号,则控制所述业务处理核心跳过所述待处理业务。
进一步地,所述服务器2,还包括:
发送单元,用于将所述业务信息发送至客户端设备;
接收单元,用于接收由所述客户端设备返回的用户指定的目标业务类型;所述目标业务类型属于所述业务信息包括的业务类型;
所述第二处理单元220,具体用于:
将所述客户指定的目标业务类型记录为故障业务类型。
图3是本申请第三实施例提供的服务器的示意图。如图3所示,该实施例的服务器3包括:处理器30、存储器31以及存储在所述存储器31中并可在所述处理器30上运行的计算机程序32,例如故障处理程序。所述处理器30执行所述计算机程序32时实现上述各个故障处理方法实施例中的步骤,例如图1所示的步骤101至102。或者,所述处理器30执行所述计算机程序32时实现上述各装置实施例中各模块/单元的功能,例如图2所示模块210至220的功能。
示例性的,所述计算机程序32可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器31中,并由所述处理器30执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序32在所述服务器3中的执行过程。例如,所述计算机程序32可以被分割成第一处理单元、第二处理单元,各单元具体功能如下:
第一处理单元,用于当检测到业务处理核心发生崩溃故障时,获取故障业务的业务信息,所述故障业务为所述业务处理核心发生崩溃故障时正在处理的业务,所述业务信息包括业务类型;
第二处理单元,用于将所述故障业务的业务类型记录为故障业务类型,重启所述业务处理核心,并控制所述业务处理核心跳过业务类型为故障业务类型的业务。
所述服务器可包括,但不仅限于,处理器30、存储器31。本领域技术人员可以理解,图3仅仅是服务器3的示例,并不构成对服务器3的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述服务器还可以包括输入输出设备、网络接入设备、总线等。
所称处理器30可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器31可以是所述服务器3的内部存储单元,例如服务器3的硬盘或内存。所述存储器31也可以是所述服务器3的外部存储设备,例如所述服务器3上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述服务器3还可以既包括所述服务器3的内部存储单元也包括外部存储设备。所述存储器31用于存储所述计算机程序以及所述服务器所需的其他程序和数据。所述存储器31还可以用于暂时地存储已经输出或者将要输出的数据。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供了一种虚拟定时器的定时设备,该虚拟定时器的定时设备包括:至少一个处理器、存储器以及存储在所述存储器中并可在所述至少一个处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意各个方法实施例中的步骤。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在移动终端上运行时,使得移动终端执行时实现可实现上述各个方法实施例中的步骤。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种故障处理方法,其特征在于,应用于服务器,所述方法包括:
当检测到业务处理核心发生崩溃故障时,获取故障业务的业务信息,所述故障业务为所述业务处理核心发生崩溃故障时正在处理的业务,所述业务信息包括业务类型;
将所述故障业务的业务类型记录为故障业务类型,重启所述业务处理核心,并控制所述业务处理核心跳过业务类型为故障业务类型的业务。
2.如权利要求1所述的故障处理方法,其特征在于,所述当检测到业务处理核心发生崩溃故障时,获取故障业务的业务信息,包括:
当检测到业务处理核心发生崩溃故障时,获取所述业务处理正在处理的业务的序号处理状态;
若所述序号处理状态为异常状态,则将所述业务确定为故障业务,并获取故障业务的业务信息。
3.如权利要求2所述的故障处理方法,其特征在于,在所述获取所述业务处理正在处理的业务的序号处理状态之后,还包括:
若所述序号处理状态为正常状态,则重启所述业务处理核心。
4.如权利要求1所述的故障处理方法,其特征在于,所述业务信息还包括业务序号;
所述重启所述业务处理核心,并控制所述业务处理核心跳过业务类型为故障业务类型的业务,包括:
将所述业务序号记录为故障业务序号,以及,根据所述业务序号确定反演序号;
重启所述业务处理核心,获取消息总线上的待处理业务;
若所述待处理业务的业务序号不是故障业务序号,且所述待处理业务的业务序号大于或等于所述反演序号,则获取所述待处理业务的业务类型;
若所述待处理业务的业务类型为故障业务类型,则跳过所述待处理业务。
5.如权利要求4所述的故障处理方法,其特征在于,在所述获取消息总线上的待处理业务之后,还包括:
若所述待处理业务的业务序号为故障业务序号,则控制所述业务处理核心跳过所述待处理业务。
6.如权利要求1所述的故障处理方法,其特征在于,在所述当检测到业务处理核心发生崩溃故障时,获取故障业务的业务信息之后,还包括:
将所述业务信息发送至客户端设备;
接收由所述客户端设备返回的用户指定的目标业务类型;所述目标业务类型属于所述业务信息包括的业务类型;
所述将所述故障业务的业务类型记录为故障业务类型,包括:
将所述故障业务的业务类型中所述客户指定的目标业务类型记录为故障业务类型。
7.一种服务器,其特征在于,包括:
第一处理单元,用于当检测到业务处理核心发生崩溃故障时,获取故障业务的业务信息,所述故障业务为所述业务处理核心发生崩溃故障时正在处理的业务,所述业务信息包括业务类型;
第二处理单元,用于将所述故障业务的业务类型记录为故障业务类型,重启所述业务处理核心,并控制所述业务处理核心跳过业务类型为故障业务类型的业务。
8.如权利要求7所述的服务器,其特征在于,所述第一处理单元,具体用于:
当检测到业务处理核心发生崩溃故障时,获取所述业务处理正在处理的业务的序号处理状态;
若所述序号处理状态为异常状态,则将所述业务确定为故障业务,并获取故障业务的业务信息。
9.一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011521749.2A CN112579356B (zh) | 2020-12-21 | 2020-12-21 | 一种故障处理方法及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011521749.2A CN112579356B (zh) | 2020-12-21 | 2020-12-21 | 一种故障处理方法及服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112579356A true CN112579356A (zh) | 2021-03-30 |
CN112579356B CN112579356B (zh) | 2022-09-16 |
Family
ID=75136683
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011521749.2A Active CN112579356B (zh) | 2020-12-21 | 2020-12-21 | 一种故障处理方法及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112579356B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114095964A (zh) * | 2021-11-19 | 2022-02-25 | 中国联合网络通信集团有限公司 | 一种故障恢复方法、装置及计算机可读存储介质 |
CN114553562A (zh) * | 2022-02-24 | 2022-05-27 | 新华三信息安全技术有限公司 | 一种安全管理方法、装置、设备及机器可读存储介质 |
CN116860508A (zh) * | 2023-08-31 | 2023-10-10 | 深圳华锐分布式技术股份有限公司 | 分布式系统软件缺陷连续自愈方法、装置、设备及介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101304282A (zh) * | 2008-06-10 | 2008-11-12 | 中兴通讯股份有限公司 | 成帧芯片保护方法及装置 |
CN104521181A (zh) * | 2013-06-27 | 2015-04-15 | 华为技术有限公司 | 故障处理方法、装置和系统 |
CN108519909A (zh) * | 2018-03-02 | 2018-09-11 | 阿里巴巴集团控股有限公司 | 一种流数据处理方法和装置 |
CN108628694A (zh) * | 2017-03-20 | 2018-10-09 | 腾讯科技(深圳)有限公司 | 一种基于可编程硬件的数据处理方法以及装置 |
WO2019019457A1 (zh) * | 2017-07-25 | 2019-01-31 | 平安科技(深圳)有限公司 | 控制中心装置、业务系统处理的方法、系统及存储介质 |
CN110233749A (zh) * | 2019-04-30 | 2019-09-13 | 视联动力信息技术股份有限公司 | 一种故障处理方法、系统及装置和存储介质 |
CN110569114A (zh) * | 2019-08-15 | 2019-12-13 | 平安普惠企业管理有限公司 | 一种业务处理方法、装置、设备及存储介质 |
CN110955554A (zh) * | 2019-12-13 | 2020-04-03 | 潍柴动力股份有限公司 | 故障的处理方法、装置、设备及存储介质 |
-
2020
- 2020-12-21 CN CN202011521749.2A patent/CN112579356B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101304282A (zh) * | 2008-06-10 | 2008-11-12 | 中兴通讯股份有限公司 | 成帧芯片保护方法及装置 |
CN104521181A (zh) * | 2013-06-27 | 2015-04-15 | 华为技术有限公司 | 故障处理方法、装置和系统 |
CN108628694A (zh) * | 2017-03-20 | 2018-10-09 | 腾讯科技(深圳)有限公司 | 一种基于可编程硬件的数据处理方法以及装置 |
WO2019019457A1 (zh) * | 2017-07-25 | 2019-01-31 | 平安科技(深圳)有限公司 | 控制中心装置、业务系统处理的方法、系统及存储介质 |
CN108519909A (zh) * | 2018-03-02 | 2018-09-11 | 阿里巴巴集团控股有限公司 | 一种流数据处理方法和装置 |
CN110233749A (zh) * | 2019-04-30 | 2019-09-13 | 视联动力信息技术股份有限公司 | 一种故障处理方法、系统及装置和存储介质 |
CN110569114A (zh) * | 2019-08-15 | 2019-12-13 | 平安普惠企业管理有限公司 | 一种业务处理方法、装置、设备及存储介质 |
CN110955554A (zh) * | 2019-12-13 | 2020-04-03 | 潍柴动力股份有限公司 | 故障的处理方法、装置、设备及存储介质 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114095964A (zh) * | 2021-11-19 | 2022-02-25 | 中国联合网络通信集团有限公司 | 一种故障恢复方法、装置及计算机可读存储介质 |
CN114095964B (zh) * | 2021-11-19 | 2023-05-26 | 中国联合网络通信集团有限公司 | 一种故障恢复方法、装置及计算机可读存储介质 |
CN114553562A (zh) * | 2022-02-24 | 2022-05-27 | 新华三信息安全技术有限公司 | 一种安全管理方法、装置、设备及机器可读存储介质 |
CN116860508A (zh) * | 2023-08-31 | 2023-10-10 | 深圳华锐分布式技术股份有限公司 | 分布式系统软件缺陷连续自愈方法、装置、设备及介质 |
CN116860508B (zh) * | 2023-08-31 | 2023-12-26 | 深圳华锐分布式技术股份有限公司 | 分布式系统软件缺陷连续自愈方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112579356B (zh) | 2022-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112579356B (zh) | 一种故障处理方法及服务器 | |
CN108683528B (zh) | 一种数据传输方法、中心服务器、服务器及数据传输系统 | |
CN112286723A (zh) | 机房容灾控制方法、终端及存储介质 | |
CN112068935B (zh) | kubernetes程序部署监控方法、装置以及设备 | |
CN114363334A (zh) | 云系统及云桌面虚拟机的网络配置方法、装置及设备 | |
CN113760611A (zh) | 系统站点切换方法、装置、电子设备及存储介质 | |
CN111198725B (zh) | 应用启动的处理方法、计算设备及计算机存储介质 | |
CN110224872B (zh) | 一种通信方法、装置及存储介质 | |
CN116015425B (zh) | 光模块的控制方法和装置、存储介质及电子装置 | |
CN112153215A (zh) | 通话处理方法、装置、相关设备及存储介质 | |
CN110968456B (zh) | 分布式存储系统中故障磁盘的处理方法及装置 | |
CN111010706A (zh) | 一种异常恢复方法及装置 | |
CN111190754A (zh) | 一种区块链事件通知方法及区块链系统 | |
CN115268785A (zh) | 一种应用于分布式存储系统的管理方法、装置及存储介质 | |
CN115460271B (zh) | 一种基于边缘计算的网络控制方法及装置、存储介质 | |
CN111651294B (zh) | 一种节点异常检测方法及装置 | |
CN110716822A (zh) | 嵌入式设备、跨芯片监控方法、装置及存储介质 | |
CN110955556B (zh) | 数据库恢复方法及装置、存储介质、数据库系统 | |
CN110297741B (zh) | 一种后台任务监控方法及装置 | |
CN112905109A (zh) | 消息处理方法、装置、设备及存储介质 | |
CN116401118A (zh) | 一种文件共享服务Samba监测方法及装置 | |
CN118843108A (zh) | Ota验证码的发送方法、装置、设备、介质及程序产品 | |
CN117544913A (zh) | 话单积压自适应处理方法、装置、电子设备及存储介质 | |
CN117895653A (zh) | 故障处理方法、装置、设备、介质及程序产品 | |
CN115242615A (zh) | 服务器的运行管理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder | ||
CP01 | Change in the name or title of a patent holder |
Address after: No. 210, Liangjing Road, free trade zone, Pudong New Area, Shanghai, 200120 Patentee after: Shanghai Jinshida Software Technology Co.,Ltd. Address before: No. 210, Liangjing Road, free trade zone, Pudong New Area, Shanghai, 200120 Patentee before: Shanghai Kingstar Software Technology Co.,Ltd. |