CN105847057A - 故障处理方法及装置 - Google Patents

故障处理方法及装置 Download PDF

Info

Publication number
CN105847057A
CN105847057A CN201610186587.9A CN201610186587A CN105847057A CN 105847057 A CN105847057 A CN 105847057A CN 201610186587 A CN201610186587 A CN 201610186587A CN 105847057 A CN105847057 A CN 105847057A
Authority
CN
China
Prior art keywords
server
call request
request
response
invoking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610186587.9A
Other languages
English (en)
Inventor
邹紫雯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LeTV Holding Beijing Co Ltd
LeTV Information Technology Beijing Co Ltd
Original Assignee
LeTV Holding Beijing Co Ltd
LeTV Information Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LeTV Holding Beijing Co Ltd, LeTV Information Technology Beijing Co Ltd filed Critical LeTV Holding Beijing Co Ltd
Priority to CN201610186587.9A priority Critical patent/CN105847057A/zh
Publication of CN105847057A publication Critical patent/CN105847057A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明实施例提供一种故障处理方法及装置,应用于由多个服务器构成的业务处理系统中,所述方法包括:请求服务器向调用服务器发起调用请求时,对所述调用请求进行监控;所述请求服务器为所述多个服务器中的任一个服务器,所述调用服务器为所述多个服务器中,所述请求服务器请求调用的任一个服务器;监控所述调用请求是否响应成功;在所述调用请求响应失败时,生成故障提示信息,所述故障提示信息用于提示用户所述调用服务器发生故障。本发明实施例提高了故障处理的及时性。

Description

故障处理方法及装置
技术领域
本发明实施例涉及网络技术领域,尤其涉及一种故障处理方法及装置。
背景技术
随着用户访问量以及数据量的迅猛增长,在不同的业务处理领域,业务处理系统都面临了超大量的用户访问和海量的数据处理。比如在互联网领域中,互联网的用户访问量的不断增大,网站需要处理超大量的用户访问和海量的数据处理。
因此为了提高处理性能,对于一个业务请求,通常由业务处理系统中部署的多个服务器共同处理,每一个服务器根据配置的功能特性,执行相应的处理操作,比如业务请求为查询请求时,对查询请求的处理包括分词处理、关键词获取、根据关键词查询等,则可以由至少三个服务器分别进行分词处理、关键词获取以及根据关键词搜索等。
由上述描述可知,多个服务器对一个业务请求的处理过程中,每一个服务器可能需要调用其他服务器,以请求获取其他服务器的处理结果等信息,多个服务器之间存在依赖关系。但是如果请求调用的服务器出现宕机等故障时,就会导致调用失败,使得业务处理无法正常进行,就可能会出现页面显示异常等错误情况。而开发人员只有接收到用户反馈时才能发现错误,而且无法快速的定位出现故障的服务器,导致故障无法及时处理。
发明内容
本发明实施例提供一种故障处理方法及装置,用以解决现有技术中故障处理不及时的问题。
本发明实施例提供一种故障处理方法,应用于由多个服务器构成的业务处理系统中,所述方法包括:
当请求服务器向调用服务器发起调用请求时,监控所述调用请求是否响应成功;所述请求服务器为所述多个服务器中的服务器,所述调用服务器为所述多个服务器中,所述请求服务器请求调用的服务器;
在所述调用请求响应失败时,生成故障提示信息,所述故障提示信息用于提示用户所述调用服务器发生故障。
本发明实施例提供一种故障处理装置,应用于由多个服务器构成的业务处理系统中的每一个服务器中,所述装置包括:
监控模块,用于当请求服务器向调用服务器发起调用请求时,监控所述调用请求是否响应成功;所述请求服务器为所述多个服务器中的服务器,所述调用服务器为所述多个服务器中所述请求服务器请求调用的服务器;
故障提示模块,用于在所述调用请求响应失败时,生成故障提示信息,所述故障提示信息用于提示用户所述调用服务器发生故障。
本发明实施例提供的故障处理方法及装置,请求服务器向调用服务器发起调用请求时,对所述调用请求进行监控;所述请求服务器为所述多个服务器中的服务器,所述调用服务器为所述多个服务器中,所述请求服务器请求调用的服务器;一旦监控调用请求响应失败时,即可以生成故障提示信息,所述故障提示信息用于提示用户所述调用服务器发生故障,本发明实施例通过对调用请求监控,实现了对调用服务器的故障自动检测,能够及时发现故障,并提示给用户,从而能够及时进行故障处理,提高了故障处理及时性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明故障处理方法一个实施例的流程图;
图2为本发明故障处理方法又一个实施例流程图;
图3为本发明故障处理装置一个实施例结构示意图;
图4为本发明故障处理装置又一个实施例的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的技术方案主要应用于由多个服务器构成的业务处理系统,特别是在互联网领域中,互联网的用户访问量的不断增大,需要处理超大量的用户访问和海量的数据处理,特别是大型网站具有高并发,大流量、高可用、海量数据、用户分布广泛等特点,采用多个服务器构成的业务处理系统作为网站的服务端,可以提高网站处理性能以及可用性等。
业务处理系统中多个服务器之间采用分布式部署,多个服务器之间主要利用RPC(Remote Procedure Call Protocol,远程过程调用协议)进行访问。在一个业务处理请求过程中,每一个服务器可能需要调用其他服务器,以请求获取其他服务器的处理结果等信息。因此如果请求调用的服务器出现宕机等故障时,就会导致调用失败,而现有技术无法及时发现故障且无法准确定位故障,造成故障无法及时处理。
为了解决这一技术问题,发明人经过一系列研究提出本发明的技术方案,在本发明实施例中,请求服务器向调用服务器发起调用请求时,对所述调用请求进行监控;所述请求服务器为所述多个服务器中的服务器,所述调用服务器为所述多个服务器中,所述请求服务器请求调用的服务器;一旦监控调用请求响应失败时,即可以生成故障提示信息,所述故障提示信息用于提示用户所述调用服务器发生故障,本发明实施例通过对调用请求监控,实现了对调用服务器的故障自动检测,能够及时发现故障,并提示给用户,从而能够及时进行故障处理,提高了故障处理及时性。
下面将结合附图对本发明技术方案进行详细描述。
图1为本发明实施例提供的一种故障处理方法一个实施例的流程图,本实施方法主要应用于业务处理系统中,所述业务处理系统由多个服务器构成。多个服务器之间存在依赖关系,任一个服务器的执行可能需要调用其他服务器,请求获取其他服务器的处理结果。
该方法可以包括以下几个步骤:
101:当请求服务器向调用服务器发起调用请求时,对所述调用请求进行监控。
所述请求服务器为所述多个服务器中的服务器,所述调用服务器为所述多个服务器中,所述请求服务器请求调用的服务器。
在对一个业务请求处理过程中,请求服务器和调用服务器具有依赖关系。请求服务器向调用服务器发起调用请求,以用于获取调用服务器的处理结果等信息。
本发明实施例中,在请求服务器发起调用请求时,即对该调用请求进行监控,以至少可以确定调用请求是否开始、是否结束、是否成功、是否失败等。
102:监控所述调用请求是否响应成功,如果否,执行步骤103,如果是则结束流程。
其中,监控调用请求是否响应成功,有多种可能的实现方式。
在一种可能的实现方式中,可以是:
监控是否接收到调用服务器反馈的针对所述调用请求的响应消息,所述响应消息包括响应成功消息以及响应失败消息;在接收到所述响应成功消息时,确定所述调用请求响应成功;在接收到所述响应失败消息时,确定所述调用请求响应失败。
响应成功消息中还可以携带请求服务器请求获取的调用服务器的处理结果等信息。
调用服务对调用请求进行响应处理之后,会向请求服务器反馈响应消息,从而请求服务器即可以确定调用请求是否响应成功。
在又一种可能的实现方式中,可以是:
监控在预设时间内是否接收到所述调用服务器反馈的针对所述响应消息,其中,在预设时间内未接收到所述调用服务器的响应消息时,确定所述调用请求响应失败。
如果请求服务器长时间未接收到调用服务器的任何响应消息,则即可以确定调用请求响应失败。
而如果在预设时间内接收到调用服务器的响应消息,即可以根据响应消息为响应成功消息或响应失败消息,确定调用请求是否成功。
103:生成故障提示信息,所述故障提示信息用于提示用户所述调用服务器发生故障。
如果监控调用请求响应失败,表明调用服务器可能出现故障,或者访问接口出现问题或者服务器出现宕机等问题,导致正常处理调用请求。此时请求服务器即可以生成故障提示信息。
该故障提示信息即用于提示用户所述调用服务器发生故障。
为了方便用户能够及时获取该故障提示信息,作为又一个实施例,生成故障提示信息之后,还可以将所述故障提示信息发送至用户设备,以便于所述用户设备将故障提示信息提供给用户,使得用户可以获得该故障提示信息,以及时进行故障处理。
其中,将所述故障提示信息发送至用户设备,可以是以邮件、短消息或者语音呼叫等方式发送至用户设备,用户设备可以是用户的手机、平板电脑、笔记本等电子设备。用户设备接收到故障提示信息还可以输出警示信息,以警示用户查收所述故障提示信息。警示信息可以是铃声、振动或者屏幕闪烁等方式。
在本实施例中,请求服务器向调用服务器发起调用请求时,即对调用请求进行监控,如果调用请求响应失败,即生成故障提示信息,以提示用户调用服务器发生故障,实现了故障自动检测,可以及时发现故障并提示用户,以便于用户及时进行故障处理,从而提高了故障处理及时性。
图2为本发明实施例提供的一种故障处理方法一个实施例的流程图,本实施方法主要应用于业务处理系统中,所述业务处理系统由多个服务器构成。多个服务器之间存在依赖关系,任一个服务器的执行可能需要调用其他服务器,请求获取其他服务器的处理结果。
该方法可以包括以下几个步骤:
201:当请求服务器向调用服务器发起调用请求时,对所述调用请求进行监控。
所述请求服务器为所述多个服务器中的任一个服务器,所述调用服务器为所述多个服务器中,所述请求服务器请求调用的任一个服务器;
202:监控所述调用请求是否响应成功,如果是则结束流程,如果否则执行步骤203。
调用请求响应成功也即调用服务器响应成功,调用请求响应失败也即调用服务器响应失败。
其中,监控调用请求是否响应成功,有多种可能的实现方式。
在一种可能的实现方式中,可以是:
监控是否接收到调用服务器反馈的针对所述调用请求响应消息,所述响应消息包括响应成功消息以及响应失败消息;在接收到所述响应成功消息时,确定所述调用请求响应成功;在接收到所述响应失败消息时,确定所述调用请求响应失败。
响应成功消息中还可以携带请求服务器请求获取的调用服务器的处理结果等信息。
调用服务对调用请求进行响应处理之后,会向请求服务器反馈响应消息,从而请求服务器即可以确定调用请求是否响应成功。
在又一种可能的实现方式中,可以是:
监控在预设时间内是否接收到所述调用服务器反馈的针对所述调用请求的响应消息,其中,在预设时间内未接收到所述调用服务器的响应消息时,确定所述调用请求响应失败。
如果请求服务器长时间未接收到调用服务器的任何响应消息,则即可以确定调用请求响应失败。
而如果在预设时间内接收到调用服务器的响应消息,即可以根据响应消息为响应成功消息或响应失败消息,确定调用请求是否成功。
203:统计所述调用服务器的累计响应失败次数。
如果当前的调用请求响应失败,则首先统计调用服务器的累计响应识别次数,该累计响应识别次数包括当前一次调用请求响应次数。
204:判断所述响应失败次数满足预设条件,如果否,执行步骤205,如果是,执行步骤206。
205:记录所述调用服务器的响应失败次数,返回步骤206继续执行。
206:生成故障提示信息。
所述故障提示信息用于提示用户所述调用服务器发生故障。
为了提高故障检测的准确性,本实施例中,如果当前调用请求响应失败,则首先统计调用服务器的累计的响应失败次数。
在响应失败次数满足预设条件时,再生成故障提示信息。
该预设条件可以是指响应失败次数大于监控阈值,也即如果调用服务器累计响应失败多次时,再生成故障提示信息。该监控阈值可以根据实际情况进行设定。
而如果响应失败次数不满足预设条件,即记录调用服务器当前一次的响应失败次数,以便于统计调用服务器的累计响应失败次数。
其中,作为又一个实施例,统计所述调用服务器的累计响应失败次数可以是:
统计一定时间内,所述调用服务器的累计响应失败次数。也即如果调用服务器在一定时间内,发生响应失败的次数满足预设条件,即生成故障提示信息。
作为又一个实施例,统计所述调用服务器的累计响应失败次数可以是:
统计所述调用服务器的连续响应失败次数。
具体的可以是统计一定时间内,调用服务器的连续响应失败次数。
如果调用服务器连续响应失败次数满足预设条件,例如大于监控阈值时,再生成故障提示信息。
207:将所述故障提示信息发送至用户设备,以使得所述用户设备将所述故障提示信息提供给用户,用于提示所述用户所述调用服务器发生故障。
其中,将所述故障提示信息发送至用户设备,可以是以邮件、短消息或者语音呼叫等方式发送至用户设备,用户设备可以是用户的手机、平板电脑、笔记本等电子设备。用户设备接收到故障提示信息还可以输出警示信息,以警示用户查收所述故障提示信息。警示信息可以是铃声、振动或者屏幕闪烁等方式。
在本实施例中,请求服务器向调用服务器发起调用请求时,即对调用请求进行监控,如果调用请求响应失败,统计调用服务器的响应失败次数,在响应失败次数满足预设条件时,再发生故障提示信息并发送至用户设备,以便于及时提示用户,本实施例,不仅可以提高故障处理及时性,还提高了故障检测的准确度,可以避免误检测,并能够及时提示用户。
图3为本发明实施例提供的一种故障处理装置一个实施例的结构示意图,该装置具体配置在业务处理系统中的每一个服务器中,以实现在服务器发起调用请求时,即调用该装置实现对调用请求的监控。
该装置可以包括:
监控模块301,用于在请求服务器向调用服务器发起调用请求时,监控所述调用请求是否响应成功;所述请求服务器为所述多个服务器中的服务器,所述调用服务器为所述多个服务器中,所述请求服务器请求调用的服务器;
其中,在一种可能的实现方式中,所述监控模块监控所述调用请求是否响应成功可以具体用于:
监控是否接收到调用服务器反馈的针对所述调用请求响应消息,所述响应消息包括响应成功消息以及响应失败消息;在接收到所述响应成功消息时,确定所述调用请求响应成功;在接收到所述响应失败消息时,确定所述调用请求响应失败。
响应成功消息中还可以携带请求服务器请求获取的调用服务器的处理结果等信息。
调用服务对调用请求进行响应处理之后,会向请求服务器反馈响应消息,从而请求服务器即可以确定调用请求是否响应成功。
在又一种可能的实现方式中,所述监控模块监控所述调用请求是否响应成功可以具体是:
监控在预设时间内是否接收到所述调用服务器反馈的针对所述调用请求的响应消息,其中,在预设时间内未接收到所述调用服务器的响应消息时,确定所述调用请求响应失败。
如果请求服务器长时间未接收到调用服务器的任何响应消息,则即可以确定调用请求响应失败。
而如果在预设时间内接收到调用服务器的响应消息,即可以根据响应消息为响应成功消息或响应失败消息,确定调用请求是否成功。
故障提示模块302,用于在所述调用请求响应失败时,生成故障提示信息,所述故障提示信息用于提示用户所述调用服务器发生故障。
在本实施例中,请求服务器向调用服务器发起调用请求时,即对调用请求进行监控,如果调用请求响应失败,即生成故障提示信息,以提示用户调用服务器发生故障,实现了故障自动检测,可以及时发现故障,能够及时提示用户,以便于用户及时进行故障处理,从而提高了故障处理及时性。
其中,为了方便用户能够及时获取该故障提示信息,作为又一个实施例,该装置还可以包括:
发送模块,用于将所述故障提示信息发送至用户设备,以使得所述用户设备将所述故障提示信息提供给用户,用于提示所述用户所述调用服务器发生故障。使得用户可以获得该故障提示信息,以及时进行故障处理。
其中,将所述故障提示信息发送至用户设备,可以是以邮件、短消息或者语音呼叫等方式发送至用户设备,用户设备可以是用户的手机、平板电脑、笔记本等电子设备。用户设备接收到故障提示信息还可以输出警示信息,以警示用户查收所述故障提示信息。警示信息可以是铃声、振动或者屏幕闪烁等方式。
图4为本发明实施例提供的一种故障处理装置又一个实施例的结构示意图,该装置具体配置在业务处理系统中的每一个服务器中,以实现在服务器发起调用请求时,即调用该装置实现对调用请求的监控。
该装置可以包括:
监控模块401,用于在请求服务器向调用服务器发起调用请求时,监控所述调用请求是否响应成功;所述请求服务器为所述多个服务器中的服务器,所述调用服务器为所述多个服务器中,所述请求服务器请求调用的服务器;
其中,在一种可能的实现方式中,所述监控模块监控所述调用请求是否响应成功可以具体时:
监控是否接收到调用服务器反馈的针对所述调用请求响应消息,所述响应消息包括响应成功消息以及响应失败消息;在接收到所述响应成功消息时,确定所述调用请求响应成功;在接收到所述响应失败消息时,确定所述调用请求响应失败。
响应成功消息中还可以携带请求服务器请求获取的调用服务器的处理结果等信息。
调用服务对调用请求进行响应处理之后,会向请求服务器反馈响应消息,从而请求服务器即可以确定调用请求是否响应成功。
在又一种可能的实现方式中,所述监控模块监控所述调用请求是否响应成功可以具体时:
监控在预设时间内是否接收到所述调用服务器反馈的针对所述调用请求的响应消息,其中,在预设时间内未接收到所述调用服务器的响应消息时,确定所述调用请求响应失败。
如果请求服务器长时间未接收到调用服务器的任何响应消息,则即可以确定调用请求响应失败。
而如果在预设时间内接收到调用服务器的响应消息,即可以根据响应消息为响应成功消息或响应失败消息,确定调用请求是否成功。
故障提示模块402,用于在所述调用请求响应失败时,生成故障提示信息,所述故障提示信息用于提示用户所述调用服务器发生故障。
其中,所述故障提示模块402可以包括:
统计单元4021,用于在所述调用请求响应失败时,统计所述调用服务器的响应失败次数;
故障提示单元4022,用于在所述调用服务器的响应失败次数满足预设条件时,生成故障提示信息。
为了提高故障检测的准确性,本实施例中,如果当前调用请求响应失败,则首先统计调用服务器的累计的响应失败次数。
在响应失败次数满足预设条件时,再生成故障提示信息。
该预设条件可以是指响应失败次数大于监控阈值,也即如果调用服务器累计响应失败多次时,再生成故障提示信息。该监控阈值可以根据实际情况进行设定。
而如果响应失败次数不满足预设条件,即记录所述调用服务器的当前响应失败记录,以便于统计调用服务器的响应失败次数。
其中,作为又一个实施例,所述统计单元具体可以用于:
统计一定时间内,所述调用服务器的累计响应失败次数。也即如果调用服务器在一定时间内,发生响应失败的次数满足预设条件,即生成故障提示信息。
作为又一个实施例,所述统计单元具体可以用于:
统计所述调用服务器的连续响应失败次数。
具体的可以是统计一定时间内,调用服务器的连续响应失败次数。
如果调用服务器调度连续响应失败次数满足预设条件,例如大于监控阈值时,再生成故障提示信息。
发送模块403,用于将所述故障提示信息发送至用户设备,以使得所述用户设备将所述故障提示信息提供给用户,用于提示所述用户所述调用服务器发生故障。使得用户可以获得该故障提示信息,以及时进行故障处理。
其中,将所述故障提示信息发送至用户设备,可以是以邮件、短消息或者语音呼叫等方式发送至用户设备,用户设备可以是用户的手机、平板电脑、笔记本等电子设备。用户设备接收到故障提示信息还可以输出警示信息,以警示用户查收所述故障提示信息。警示信息可以是铃声、振动或者屏幕闪烁等方式。
在本实施例中,请求服务器向调用服务器发起调用请求时,所述装置即对调用请求进行监控,如果调用请求响应失败,统计调用服务器的响应失败次数,在响应失败次数满足预设条件时,再发生故障提示信息并发送至用户设备,以便于及时提示用户,本实施例,不仅可以提高故障处理及时性,还提高了故障检测的准确度,可以避免误检测,并能够及时提示用户。
本发明实施例还提供了一种服务器,配置有上述图3或图4所示的故障处理装置。该故障处理装置可以集成到服务器的访问器中,以便于服务器通过访问器发起调用请求时,即自动调用该故障处理装置,对调用请求进行监控,从而既可以实现故障自动检测,能够及时发现故障,并提示用户,使得用户可以及时进行故障处理,提高了故障处理的及时性。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种故障处理方法,其特征在于,应用于由多个服务器构成的业务处理系统中,所述方法包括:
当请求服务器向调用服务器发起调用请求时,监控所述调用请求是否响应成功;其中,所述请求服务器为所述多个服务器中的服务器,所述调用服务器为所述多个服务器中所述请求服务器请求调用的服务器;
在所述调用请求响应失败时,生成故障提示信息,所述故障提示信息用于提示用户所述调用服务器发生故障。
2.根据权利要求1所述的方法,其特征在于,所述监控所述调用请求是否响应成功包括:
监控是否接收到调用服务器反馈的针对所述调用请求的响应消息,所述响应消息包括响应成功消息以及响应失败消息;在接收到所述响应成功消息时,确定所述调用请求响应成功;在接收到所述响应失败消息时,确定所述调用请求响应失败。
3.根据权利要求1所述的方法,其特征在于,所述监控所述调用请求是否响应成功包括:
监控在预设时间内是否接收到所述调用服务器反馈的针对所述调用请求的响应消息,其中,在预设时间内未接收到所述调用服务器的响应消息时,确定所述调用请求响应失败。
4.根据权利要求1所述的方法,其特征在于,所述在所述调用请求响应失败时,生成故障提示信息之后,所述方法还包括:
将所述故障提示信息发送至用户设备,以使得所述用户设备将所述故障提示信息提供给用户,用于提示所述用户所述调用服务器发生故障。
5.根据权利要求1所述的方法,其特征在于,在所述调用请求响应失败时,生成故障提示信息包括:
在所述调用请求响应失败时,统计所述调用服务器的累计响应失败次数;
在所述调用服务器的响应失败次数满足预设条件时,生成故障提示信息。
6.一种故障处理装置,其特征在于,应用于由多个服务器构成的业务处理系统中的每一个服务器中,所述装置包括:
监控模块,用于当请求服务器向调用服务器发起调用请求时,监控所述调用请求是否响应成功;所述请求服务器为所述多个服务器中的服务器,所述调用服务器为所述多个服务器中所述请求服务器请求调用的服务器;
故障提示模块,用于在所述调用请求响应失败时,生成故障提示信息,所述故障提示信息用于提示用户所述调用服务器发生故障。
7.根据权利要求6所述的装置,其特征在于,所述监控模块监控所述调用请求是否响应成功具体是:监控是否接收到调用服务器反馈的针对所述调用请求的响应消息,所述响应消息包括响应成功消息以及响应失败消息;在接收到所述响应成功消息时,确定所述调用请求响应成功;在接收到所述响应失败消息时,确定所述调用请求响应失败。
8.根据权利要求6所述的装置,其特征在于,所述监控模块监控所述调用请求是否响应成功具体是:
监控在预设时间内是否接收到所述调用服务器反馈的针对所述调用请求的响应消息,其中,在预设时间内未接收到所述调用服务器的响应消息时,确定所述调用请求响应失败。
9.根据权利要求6所述的装置,其特征在于,还包括:
发送模块,用于将所述故障提示信息发送至用户设备,以使得所述用户设备将所述故障提示信息提供给用户,用于提示所述用户所述调用服务器发生故障。
10.根据权利要求6所述的装置,其特征在于,所述故障提示模块包括:
统计单元,用于在所述调用请求响应失败时,统计所述调用服务器的响应失败次数;
故障提示单元,用于在所述调用服务器的响应失败次数满足预设条件时,生成故障提示信息。
CN201610186587.9A 2016-03-29 2016-03-29 故障处理方法及装置 Pending CN105847057A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610186587.9A CN105847057A (zh) 2016-03-29 2016-03-29 故障处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610186587.9A CN105847057A (zh) 2016-03-29 2016-03-29 故障处理方法及装置

Publications (1)

Publication Number Publication Date
CN105847057A true CN105847057A (zh) 2016-08-10

Family

ID=56584206

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610186587.9A Pending CN105847057A (zh) 2016-03-29 2016-03-29 故障处理方法及装置

Country Status (1)

Country Link
CN (1) CN105847057A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107608634A (zh) * 2017-09-25 2018-01-19 四川长虹电器股份有限公司 安卓系统空间处理方法
CN108809688A (zh) * 2018-02-22 2018-11-13 阿里巴巴集团控股有限公司 故障信息识别方法、装置、服务器及系统
CN109542641A (zh) * 2018-11-14 2019-03-29 中国联合网络通信集团有限公司 服务调用方法、装置及系统
CN109739726A (zh) * 2018-12-29 2019-05-10 阿里巴巴集团控股有限公司 一种健康检查方法、装置及电子设备
CN111039115A (zh) * 2018-10-15 2020-04-21 奥的斯电梯公司 用于监控电梯通信模块故障的方法、系统以及电梯
CN111385125A (zh) * 2018-12-29 2020-07-07 Tcl集团股份有限公司 一种服务器动态控制方法及服务器

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104065526A (zh) * 2013-03-22 2014-09-24 腾讯科技(深圳)有限公司 一种服务器故障报警的方法和装置
CN104410550A (zh) * 2014-12-10 2015-03-11 深圳中兴网信科技有限公司 Web服务监控方法和Web服务监控装置
CN104615489A (zh) * 2015-01-22 2015-05-13 江苏大烨智能电气股份有限公司 一种多节点数据交互的实现方法
CN104954190A (zh) * 2014-03-24 2015-09-30 深圳市金蝶友商电子商务服务有限公司 应用服务器故障检测方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104065526A (zh) * 2013-03-22 2014-09-24 腾讯科技(深圳)有限公司 一种服务器故障报警的方法和装置
CN104954190A (zh) * 2014-03-24 2015-09-30 深圳市金蝶友商电子商务服务有限公司 应用服务器故障检测方法及装置
CN104410550A (zh) * 2014-12-10 2015-03-11 深圳中兴网信科技有限公司 Web服务监控方法和Web服务监控装置
CN104615489A (zh) * 2015-01-22 2015-05-13 江苏大烨智能电气股份有限公司 一种多节点数据交互的实现方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107608634A (zh) * 2017-09-25 2018-01-19 四川长虹电器股份有限公司 安卓系统空间处理方法
CN108809688A (zh) * 2018-02-22 2018-11-13 阿里巴巴集团控股有限公司 故障信息识别方法、装置、服务器及系统
CN111039115A (zh) * 2018-10-15 2020-04-21 奥的斯电梯公司 用于监控电梯通信模块故障的方法、系统以及电梯
CN109542641A (zh) * 2018-11-14 2019-03-29 中国联合网络通信集团有限公司 服务调用方法、装置及系统
CN109739726A (zh) * 2018-12-29 2019-05-10 阿里巴巴集团控股有限公司 一种健康检查方法、装置及电子设备
CN111385125A (zh) * 2018-12-29 2020-07-07 Tcl集团股份有限公司 一种服务器动态控制方法及服务器
CN111385125B (zh) * 2018-12-29 2022-05-03 Tcl科技集团股份有限公司 一种服务器动态控制方法及服务器

Similar Documents

Publication Publication Date Title
CN105847057A (zh) 故障处理方法及装置
CN104394009B (zh) 一种故障信息的处理方法及装置
CN105516266B (zh) 一种业务监控方法、系统及相关设备
CN106575222B (zh) Node.js应用的监测
US8719942B2 (en) System and method for prioritizing computers based on anti-malware events
CN105978721B (zh) 一种集群系统中监控服务运行状态的方法、装置和系统
CN104065526B (zh) 一种服务器故障报警的方法和装置
US10924326B2 (en) Method and system for clustered real-time correlation of trace data fragments describing distributed transaction executions
CN105760240A (zh) 分布式任务处理方法及装置
CN106656682A (zh) 集群心跳检测方法、系统及装置
CN109660426A (zh) 监控方法及系统、计算机可读介质和电子设备
CN105978938A (zh) 一种业务处理设备的业务状态确定方法及调度设备
US11163875B1 (en) Discovery of computer system incidents to be remediated based on correlation between support interaction data and computer system telemetry data
CN110502399A (zh) 故障检测方法及装置
CN105450694A (zh) 一种处理连续重定向的方法和装置
CN113411209A (zh) 一种分布式的密码服务全链路检测系统及方法
US20210112025A1 (en) Method and server for processing messages
CN110309645A (zh) 一种对api进行安全防护的方法、设备和系统
CN108650123A (zh) 故障信息记录方法、装置、设备和存储介质
WO2016067299A1 (en) Location aware failover solution
CN107819754A (zh) 一种防劫持方法、监控服务器、终端及系统
CN113676365A (zh) 一种访问请求的处理方法、装置及电子设备
CN115037653B (zh) 业务流量监控方法、装置、电子设备和存储介质
CN110502896A (zh) 一种网站信息的泄露监测方法、系统及相关装置
CN103457771B (zh) 一种ha的虚拟机集群的管理方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160810