CN110247823A - 一种故障检测方法、装置及相关设备 - Google Patents

一种故障检测方法、装置及相关设备 Download PDF

Info

Publication number
CN110247823A
CN110247823A CN201910510221.6A CN201910510221A CN110247823A CN 110247823 A CN110247823 A CN 110247823A CN 201910510221 A CN201910510221 A CN 201910510221A CN 110247823 A CN110247823 A CN 110247823A
Authority
CN
China
Prior art keywords
service
end server
interface
preset
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910510221.6A
Other languages
English (en)
Inventor
周正
王平
王杨
段光磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201910510221.6A priority Critical patent/CN110247823A/zh
Publication of CN110247823A publication Critical patent/CN110247823A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0681Configuration of triggering conditions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1034Reaction to server failures by a load balancer

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明实施例提供了一种故障检测方法、装置及相关设备,应用于负载均衡服务器,该故障检测方法包括:负载均衡服务器向后端服务器发送针对后端服务器的预设服务接口的服务请求后,接收后端服务器针返回的服务响应,其中,该服务响应中携带表示预设服务接口状态的状态码,上述状态码为表示接口故障的故障状态码或表示接口正常的正常状态码,当状态码为故障状态码时,负载均衡服务器累计当前所接收到的故障状态码的数量,当故障状态码的数量达到预设数量阈值时,确定该预设服务接口发生故障。通过本方法进行故障检测,能够检测出具体服务接口的故障状态,与现有技术中只能检测出后端服务器的整体故障状态相比,提高了故障检测的准确率。

Description

一种故障检测方法、装置及相关设备
技术领域
本发明涉及故障检测技术领域,特别是涉及一种故障检测方法、装置及相关设备。
背景技术
一个完整的服务器集群系统主要是由前端的负载均衡服务器和后端的服务器群组组成,负载均衡服务器负责将用户请求发送到一组服务器中,应用于多个服务器的负载均衡,服务器集群系统主要工作在网络层,可以实现高性能,高可用的服务器集群技术。
在这样一个集群系统中,在某台后端服务器存在系统故障的情况,负载均衡服务器依然将一部分数据流量引流到这台后端服务器上,将会导致大量的服务请求被丢失,因此集群系统中的故障检测非常重要,需要良好的故障检测方法检测后端服务器的系统故障、应用故障等问题。
现有的故障检测方法中,负载均衡服务器在向后端服务器发送服务请求时,在服务请求中设置检测命令,例如ping命令,当后端服务器存在故障问题时,将得不到后端服务器的响应。但是这种检测方法只能检测出后端服务器的整体故障状态,不能具体检测出服务请求对应的服务接口的故障状态,例如某后端服务器的查询请求接口正常,注册请求接口故障,若负载均衡服务器只对后端服务器发送了查询请求并且测试无故障,则判断出该后端服务器无故障。也就是说现有技术只能检测出后端服务器的整体故障状态,不能细化到具体的服务接口,从而导致故障检测的准确率下降。
发明内容
本发明实施例的目的在于提供一种故障检测方法,能够提高故障检测的准确率。具体技术方案如下:
本发明实施例提供了一种故障检测方法,应用于负载均衡服务器,包括:
向后端服务器发送服务请求,其中,所述服务请求为针对所述后端服务器的预设服务接口的请求;
接收所述后端服务器针对所述服务请求返回的服务响应,其中,所述服务响应中携带表示所述预设服务接口状态的状态码,所述状态码为表示接口故障的故障状态码或表示接口正常的正常状态码;
当所述状态码为故障状态码时,针对向所述后端服务器已发送的全部所述服务请求,累计当前所接收到的故障状态码的数量;
当所述故障状态码的数量达到预设数量阈值时,确定所述后端服务器的所述预设服务接口发生故障。
进一步的,在所述确定所述后端服务器的所述预设服务接口发生故障之后,还包括:
在经过预设时长后,当存在待下发的所述服务请求时,向所述后端服务器发送所述服务请求;
接收所述后端服务器针对本次下发的所述服务请求返回的服务响应;
当本次返回的所述服务响应中携带正常状态码时,启动向所述后端服务器持续下发所述服务请求。
进一步的,在所述接收所述后端服务器针对本次下发的所述服务请求返回的服务响应之后,还包括:
当本次返回的所述服务响应中携带故障状态码时,暂停向所述后端服务器持续下发所述服务请求。
进一步的,所述故障状态码为预设的不同种类的多个故障状态码之一。
本发明实施例提供了一种故障检测方法,应用于后端服务器,包括:
接收负载均衡服务器发送的服务请求,其中,所述服务请求为针对所述后端服务器的预设服务接口的请求;
向所述负载均衡服务器返回服务响应,所述服务响应中携带表示所述预设服务接口状态的状态码,当所述预设服务接口为故障状态时,所述状态码为故障状态码,当所述预设服务接口为正常状态时,所述状态码为正常状态码。
进一步的,所述故障状态码为预设的不同种类的多个故障状态码之一。
本发明实施例还提供了一种故障检测装置,应用于负载均衡服务器,包括:
发送模块,用于向后端服务器发送服务请求,其中,所述服务请求为针对所述后端服务器的预设服务接口的请求;
第一接收模块,用于接收所述后端服务器针对所述服务请求返回的服务响应,其中,所述服务响应中携带表示所述预设服务接口状态的状态码,所述状态码为表示接口故障的故障状态码或表示接口正常的正常状态码;
累计模块,用于当所述状态码为故障状态码时,针对向所述后端服务器已发送的全部所述服务请求,累计当前所接收到的故障状态码的数量;
确定模块,当所述故障状态码的数量达到预设数量阈值时,确定所述后端服务器的所述预设服务接口发生故障。
进一步的,所述发送模块,还用于在所述确定模块确定所述后端服务器的所述预设服务接口发生故障之后,在经过预设时长后,当存在待下发的所述服务请求时,向所述后端服务器发送所述服务请求;
所述第一接收模块,还用于接收所述后端服务器针对本次下发的所述服务请求返回的服务响应;
所述发送模块,还用于当本次返回的所述服务响应中携带正常状态码时,启动向所述后端服务器持续下发所述服务请求。
进一步的,所述发送模块,还用于在所述接收所述后端服务器针对本次下发的所述服务请求返回的服务响应之后,当本次返回的所述服务响应中携带故障状态码时,暂停向所述后端服务器持续下发所述服务请求。
进一步的,所述故障状态码为预设的不同种类的多个故障状态码之一。
本发明实施例还提供了一种故障检测装置,应用于后端服务器,包括:
第二接收模块,用于接收负载均衡服务器发送的服务请求,其中,所述服务请求为针对所述后端服务器的预设服务接口的请求;
返回模块,用于向所述负载均衡服务器返回服务响应,所述服务响应中携带表示所述预设服务接口状态的状态码,当所述预设服务接口为故障状态时,所述状态码为故障状态码,当所述预设服务接口为正常状态时,所述状态码为正常状态码。
进一步的,所述故障状态码为预设的不同种类的多个故障状态码之一。
本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一应用于负载均衡服务器的故障检测方法的步骤。
本发明实施例还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一应用于后端服务器的故障检测方法的步骤。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一应用于负载均衡服务器的故障检测方法的步骤。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一应用于后端服务器的故障检测方法的步骤。
本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一应用于负载均衡服务器的故障检测方法的步骤。
本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一应用于后端服务器的故障检测方法的步骤。
本发明实施例的有益效果:
本发明实施例提供的故障检测方法,负载均衡服务器向后端服务器发送针对后端服务器的预设服务接口的服务请求后,接收后端服务器针返回的服务响应,其中,该服务响应中携带表示预设服务接口状态的状态码,上述状态码为表示接口故障的故障状态码或表示接口正常的正常状态码,当状态码为故障状态码时,负载均衡服务器针对向后端服务器已发送的全部上述服务请求,累计当前所接收到的故障状态码的数量,当故障状态码的数量达到预设数量阈值时,确定后端服务器的预设服务接口发生故障。通过本方法进行故障检测,能够检测出具体服务接口的故障状态,与现有技术中只能检测出后端服务器的整体故障状态相比,提高了故障检测的准确率。
当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种应用于负载均衡服务器的故障检测方法的流程示意图;
图2为本发明实施例提供的一种应用于后端服务器的故障检测方法的流程示意图;
图3为本发明实施例提供的一种故障检测方法的一个实施例的详细流程图;
图4为本发明实施例提供的一种应用于负载均衡服务器的故障检测装置的结构示意图;
图5为本发明实施例提供的一种应用于后端服务器的故障检测装置的结构示意图;
图6为本发明实施例提供的应用于负载均衡服务器的电子设备的结构示意图;
图7为本发明实施例提供的应用于后端服务器的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种应用于负载均衡服务器的故障检测方法,如图1所示,具体可以包括如下步骤:
步骤101、向后端服务器发送服务请求,其中,服务请求为针对后端服务器的预设服务接口的请求。
步骤102、接收后端服务器针对服务请求返回的服务响应,其中,服务响应中携带表示预设服务接口状态的状态码,状态码为表示接口故障的故障状态码或表示接口正常的正常状态码;
步骤103、当状态码为故障状态码时,针对向后端服务器已发送的全部服务请求,累计当前所接收到的故障状态码的数量;
步骤104、当故障状态码的数量达到预设数量阈值时,确定后端服务器的预设服务接口发生故障。
采用本发明实施例提供的应用于负载均衡服务器的故障检测方法,通过向后端服务器发送服务请求后接收后端服务器返回的服务响应,该服务响应中包含有针对具体服务接口状态的状态码,有表示接口故障的故障状态码或表示接口正常的正常状态码,当累计当前接收到的故障状态码的数量超过预设数量阈值时,确定后端服务器的服务接口发生故障,该方法能够有效的检测出具体的服务接口的故障状态,有效的提高故障检测的检测准确率。
相应的,本发明实施例提供了一种应用于后端服务器的故障检测方法,如图2所示,具体可以包括如下步骤:
步骤201、接收负载均衡服务器发送的服务请求,其中,服务请求为针对后端服务器的预设服务接口的请求。
步骤202、向负载均衡服务器返回服务响应,服务响应中携带表示预设服务接口状态的状态码,当预设服务接口为故障状态时状态码为故障状态码,当预设服务接口为正常状态时状态码为正常状态码。
采用本发明实施例提供的应用于后端服务器的故障检测方法,后端服务器通过接收负载均衡服务器发送的服务请求,再向负载均衡服务器返回携带有预设服务接口状态的状态码的服务响应,当预设服务接口为故障状态时状态码为故障状态码,当预设服务接口为正常状态时状态码为正常状态码。通过该方法能够确定具体服务接口的故障状态,有效的提高故障检测的准确率。
下面结合附图3,对本发明实施例提供的一种故障检测方法的流程进行详细描述,包括如下步骤:
步骤301、负载均衡服务器向后端服务器发送服务请求,其中,服务请求为针对后端服务器的预设服务接口的请求。
在本步骤中,服务请求可以是客户端向负载均衡服务器发送后负载均衡服务器下发给后端服务器的,也可以是负载均衡服务器直接向后端服务器发送的。
具体的,上述服务请求可以是基于http协议发送的http请求,每一个http请求包含一个请求头,它是请求报文中使用的头部信息,包含有对资源的请求方法、资源的标识符及使用的协议等信息,其中每一种服务请求对应后端服务器的一种预设服务接口。
例如负载均衡服务器向后端服务器发送了一种查询服务请求,则该查询服务请求对应了后端服务器的查询服务接口。
步骤302、后端服务器接收负载均衡服务器发送的服务请求后,向负载均衡服务器返回服务响应,其中,服务响应中携带有表示预设服务接口状态的正常状态码或者故障状态码。
在本步骤中,后端服务器针对负载均衡服务器发送的服务请求向负载均衡服务器返回的服务响应包含一个响应头,它是响应报文中使用的头部信息,包含有状态码字段、服务端名称、需要客户端访问的页面路径等信息。
具体的,上述状态码字段包含了表示预设服务接口状态的状态码,当预设服务接口为故障状态时,状态码为故障状态码,当预设服务接口为正常状态时,状态码为正常状态码。
在服务响应的响应头中可以预设用于携带状态码的标志位或者字段,通过将状态码添加到该标志位或者字段中,生成上述服务响应。
后端服务器返回的故障状态码为预设的不同种类的多个状态码之一,不同种类的故障状态码表示服务接口不同的故障原因,以便技术人员针对服务接口存在不同的故障进行修复。
例如当预设服务接口的故障状态为后端服务器内存不够使用时,预设的故障状态码为M1,当预设服务接口的故障状态为后端服务器数据库崩溃时,预设的故障状态码为M2,当预设服务接口的故障状态为网络故障时,预设的故障状态码为M3等等。假设当预设服务接口故障状态为后端服务器内存不够时,后端服务器向负载均衡服务器返回的故障状态码为M1。
步骤303、负载均衡服务器接收后端服务器针对服务请求返回的服务响应后,针对已经接收到的全部服务请求,累计当前所接收到的故障状态码的数量。
在本步骤中,当预设服务接口为某种故障状态时,负载均衡服务器接收到后端服务器针对该种故障状态返回的故障状态码,在预设的时间内,负载均衡服务器针对预设服务接口统计所有故障状态码的数量。
步骤304、当故障状态码的数量达到预设数量阈值时,确定后端服务器的预设服务接口发生故障。
例如该预设数量阈值为30个,当查询服务接口发生故障,后端服务器向负载均衡服务器返回的故障状态码的数量达到30个时,确定后端服务器的查询服务接口发生故障。
步骤305、在经过预设时长之后,当存在待下发的服务请求时,负载均衡服务器向后端服务器发送服务请求。
在本步骤中,经过了预设时长后,负载均衡服务器可以是接收到了客户端发送的服务请求后向后端服务器转发该服务请求,也可以是直接向后端服务器发送服务请求,以检测后端服务器的预设服务接口状态在经过了预设时长后是否已经恢复正常或者再次出现故障。
步骤306、后端服务器针对上述服务请求向负载均衡服务器返回了服务响应后,负载均衡服务器接收该服务响应。
步骤307、当上述服务响应中携带正常状态码时,负载均衡服务器启动向后端服务器持续下发服务请求。
步骤308、当上述服务响应中携带故障状态码时,负载均衡服务器暂停向后端服务器发送服务请求。
针对步骤307和步骤308,当负载均衡服务器再次向后端服务器发送响应后,后端服务器返回的响应中若携带有正常状态码,表明该后端服务器已经恢复正常状态,后续可以再继续转发服务请求到该后端服务器,后端服务器返回的响应中若携带有故障状态码,表明该后端服务器仍处于故障状态,则不再向该后端服务器发送服务请求。
执行完步骤307之后,可以返回步骤301,负载均衡服务器向后端服务器发送服务请求,并重新累计所接收到的故障状态码的数量,继续检测后端服务器预设服务接口的故障状态,执行完步骤308之后,可以返回步骤305。
根据本发明实施例提供的一种故障检测方法,负载均衡服务器向后端服务器发送针对后端服务器的预设服务接口的服务请求后,接收后端服务器针返回的服务响应,其中,该服务响应中携带表示预设服务接口状态的状态码,上述状态码为表示接口故障的故障状态码或表示接口正常的正常状态码,当状态码为故障状态码时,负载均衡服务器针对向后端服务器已发送的全部上述服务请求,累计当前所接收到的故障状态码的数量,当故障状态码的数量达到预设数量阈值时,确定后端服务器的预设服务接口发生故障。通过本方法进行故障检测,能够检测出具体服务接口的故障状态,与现有技术中只能检测出后端服务器的整体故障状态相比,提高了故障检测的准确率。
根据本发明实施例提供的一种应用于负载均衡服务器的故障检测装置,本发明实施例还提供了一种应用于负载均衡服务器的故障检测装置,如图4所示,包括:
发送模块401,用于向后端服务器发送服务请求,其中,服务请求为针对后端服务器的预设服务接口的请求;
第一接收模块402,用于接收后端服务器针对服务请求返回的服务响应,其中,服务响应中携带表示预设服务接口状态的状态码,状态码为表示接口故障的故障状态码或表示接口正常的正常状态码;
累计模块403,用于当状态码为故障状态码时,针对向后端服务器已发送的全部服务请求,累计当前所接收到的故障状态码的数量;
确定模块404,当故障状态码的数量达到预设数量阈值时,确定后端服务器的预设服务接口发生故障。
进一步的,发送模块401,还用于在所述确定模块确定所述后端服务器的所述预设服务接口发生故障之后,在经过预设时长后,当存在待下发的服务请求时,向后端服务器发送服务请求;
第一接收模块402,还用于接收后端服务器针对本次下发的服务请求返回的服务响应;
发送模块401,还用于当本次返回的服务响应中携带正常状态码时,启动向后端服务器持续下发服务请求。
进一步的,还包括:
发送模块401,还用于当本次返回的服务响应中携带故障状态码时,暂停向后端服务器持续下发服务请求。
进一步的,故障状态码为预设的不同种类的多个故障状态码之一。
根据本发明实施例提供的一种应用于后端服务器的故障检测装置,本发明实施例还提供了一种应用于后端服务器的故障检测装置,如图5所示,包括:
第二接收模块501,用于接收负载均衡服务器发送的服务请求,其中,服务请求为针对后端服务器的预设服务接口的请求;
返回模块502,用于向负载均衡服务器返回服务响应,服务响应中携带表示预设服务接口状态的状态码,当预设服务接口为故障状态时,状态码为故障状态码,当预设服务接口为正常状态时,状态码为正常状态码。
进一步的,故障状态码为预设的不同种类的多个故障状态码之一。
本发明实施例还提供了一种电子设备,如图6所示,包括处理器601、通信接口602、存储器603和通信总线604,其中,处理器601,通信接口602,存储器603通过通信总线604完成相互间的通信,
存储器603,用于存放计算机程序;
处理器601,用于执行存储器603上所存放的程序时,实现上述任一应用于负载均衡服务器的故障检测方法的步骤。
本发明实施例还提供了一种电子设备,如图7所示,包括处理器701、通信接口702、存储器703和通信总线704,其中,处理器701,通信接口702,存储器703通过通信总线704完成相互间的通信,
存储器703,用于存放计算机程序;
处理器701,用于执行存储器703上所存放的程序时,实现上述任一应用于后端服务器的故障检测方法的步骤。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一应用于负载均衡服务器的故障检测方法的步骤。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一应用于后端服务器的故障检测方法的步骤。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一应用于负载均衡服务器的故障检测方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一应用于后端服务器的故障检测方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机介质以及计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种故障检测方法,其特征在于,应用于负载均衡服务器,所述方法包括:
向后端服务器发送服务请求,其中,所述服务请求为针对所述后端服务器的预设服务接口的请求;
接收所述后端服务器针对所述服务请求返回的服务响应,其中,所述服务响应中携带表示所述预设服务接口状态的状态码,所述状态码为表示接口故障的故障状态码或表示接口正常的正常状态码;
当所述状态码为故障状态码时,针对向所述后端服务器已发送的全部所述服务请求,累计当前所接收到的故障状态码的数量;
当所述故障状态码的数量达到预设数量阈值时,确定所述后端服务器的所述预设服务接口发生故障。
2.根据权利要求1所述的方法,其特征在于,在所述确定所述后端服务器的所述预设服务接口发生故障之后,还包括:
在经过预设时长后,当存在待下发的所述服务请求时,向所述后端服务器发送所述服务请求;
接收所述后端服务器针对本次下发的所述服务请求返回的服务响应;
当本次返回的所述服务响应中携带正常状态码时,启动向所述后端服务器持续下发所述服务请求。
3.根据权利要求2所述的方法,其特征在于,在所述接收所述后端服务器针对本次下发的所述服务请求返回的服务响应之后,还包括:
当本次返回的所述服务响应中携带故障状态码时,暂停向所述后端服务器持续下发所述服务请求。
4.一种故障检测方法,其特征在于,应用于后端服务器,所述方法包括:
接收负载均衡服务器发送的服务请求,其中,所述服务请求为针对所述后端服务器的预设服务接口的请求;
向所述负载均衡服务器返回服务响应,所述服务响应中携带表示所述预设服务接口状态的状态码,当所述预设服务接口为故障状态时,所述状态码为故障状态码,当所述预设服务接口为正常状态时,所述状态码为正常状态码。
5.一种故障检测装置,其特征在于,应用于负载均衡服务器,所述装置包括:
发送模块,用于向后端服务器发送服务请求,其中,所述服务请求为针对所述后端服务器的预设服务接口的请求;
第一接收模块,用于接收所述后端服务器针对所述服务请求返回的服务响应,其中,所述服务响应中携带表示所述预设服务接口状态的状态码,所述状态码为表示接口故障的故障状态码或表示接口正常的正常状态码;
累计模块,用于当所述状态码为故障状态码时,针对向所述后端服务器已发送的全部所述服务请求,累计当前所接收到的故障状态码的数量;
确定模块,当所述故障状态码的数量达到预设数量阈值时,确定所述后端服务器的所述预设服务接口发生故障。
6.根据权利要求5所述的装置,其特征在于,所述发送模块,还用于在所述确定模块确定所述后端服务器的所述预设服务接口发生故障之后,在经过预设时长后,当存在待下发的所述服务请求时,向所述后端服务器发送所述服务请求;
所述第一接收模块,还用于接收所述后端服务器针对本次下发的所述服务请求返回的服务响应;
所述发送模块,还用于当本次返回的所述服务响应中携带正常状态码时,启动向所述后端服务器持续下发所述服务请求。
7.根据权利要求6所述的装置,其特征在于,所述发送模块,还用于在所述接收所述后端服务器针对本次下发的所述服务请求返回的服务响应之后,当本次返回的所述服务响应中携带故障状态码时,暂停向所述后端服务器持续下发所述服务请求。
8.一种故障检测装置,其特征在于,应用于后端服务器,所述装置包括:
第二接收模块,用于接收负载均衡服务器发送的服务请求,其中,所述服务请求为针对所述后端服务器的预设服务接口的请求;
返回模块,用于向所述负载均衡服务器返回服务响应,所述服务响应中携带表示所述预设服务接口状态的状态码,当所述预设服务接口为故障状态时,所述状态码为故障状态码,当所述预设服务接口为正常状态时,所述状态码为正常状态码。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-3任一所述的方法步骤或实现权利要求4所述的方法步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-3任一所述的方法步骤或实现权利要求4所述的方法步骤。
CN201910510221.6A 2019-06-13 2019-06-13 一种故障检测方法、装置及相关设备 Pending CN110247823A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910510221.6A CN110247823A (zh) 2019-06-13 2019-06-13 一种故障检测方法、装置及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910510221.6A CN110247823A (zh) 2019-06-13 2019-06-13 一种故障检测方法、装置及相关设备

Publications (1)

Publication Number Publication Date
CN110247823A true CN110247823A (zh) 2019-09-17

Family

ID=67886894

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910510221.6A Pending CN110247823A (zh) 2019-06-13 2019-06-13 一种故障检测方法、装置及相关设备

Country Status (1)

Country Link
CN (1) CN110247823A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110868477A (zh) * 2019-11-29 2020-03-06 北京金山云网络技术有限公司 任务调度方法、装置及系统
CN110928568A (zh) * 2019-11-05 2020-03-27 杭州衣科信息技术有限公司 一种发布更新web应用程序时业务服务不间断的方法
CN110971482A (zh) * 2019-11-05 2020-04-07 北京字节跳动网络技术有限公司 基于ebpf的后端服务器检测方法、装置及电子设备
CN113765971A (zh) * 2020-10-12 2021-12-07 北京沃东天骏信息技术有限公司 控制接口的方法、装置、设备和计算机可读介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106303059A (zh) * 2016-08-24 2017-01-04 努比亚技术有限公司 电子设备及信息处理方法
CN108199914A (zh) * 2017-12-27 2018-06-22 杭州迪普科技股份有限公司 服务端状态检测方法和装置
CN109739726A (zh) * 2018-12-29 2019-05-10 阿里巴巴集团控股有限公司 一种健康检查方法、装置及电子设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106303059A (zh) * 2016-08-24 2017-01-04 努比亚技术有限公司 电子设备及信息处理方法
CN108199914A (zh) * 2017-12-27 2018-06-22 杭州迪普科技股份有限公司 服务端状态检测方法和装置
CN109739726A (zh) * 2018-12-29 2019-05-10 阿里巴巴集团控股有限公司 一种健康检查方法、装置及电子设备

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110928568A (zh) * 2019-11-05 2020-03-27 杭州衣科信息技术有限公司 一种发布更新web应用程序时业务服务不间断的方法
CN110971482A (zh) * 2019-11-05 2020-04-07 北京字节跳动网络技术有限公司 基于ebpf的后端服务器检测方法、装置及电子设备
CN110971482B (zh) * 2019-11-05 2021-07-23 北京字节跳动网络技术有限公司 基于ebpf的后端服务器检测方法、装置及电子设备
CN110868477A (zh) * 2019-11-29 2020-03-06 北京金山云网络技术有限公司 任务调度方法、装置及系统
CN113765971A (zh) * 2020-10-12 2021-12-07 北京沃东天骏信息技术有限公司 控制接口的方法、装置、设备和计算机可读介质

Similar Documents

Publication Publication Date Title
CN110247823A (zh) 一种故障检测方法、装置及相关设备
CN103338243B (zh) Web节点的缓存数据更新方法和系统
US11012339B2 (en) Web site reachability management for content browsing
CN106407083B (zh) 故障检测方法及装置
US8452901B1 (en) Ordered kernel queue for multipathing events
JPH06104956A (ja) 通信装置
CN110932933B (zh) 网络状况监测方法、计算设备及计算机存储介质
KR101443071B1 (ko) 웹페이지의 에러 체크 시스템
CN111181760B (zh) 网络故障探测方法、装置、计算机可读介质及电子设备
CN107172171A (zh) 一种服务请求处理方法、装置及计算机可读存储介质
CN110401697A (zh) 一种并发处理http请求的方法、系统及设备
US20180248772A1 (en) Managing intelligent microservices in a data streaming ecosystem
CN104579765A (zh) 一种集群系统的容灾方法和装置
CN107395783A (zh) 一种ip地址处理方法、系统、装置及电子设备
CN107819825A (zh) 一种服务调度方法、装置和电子设备
CN108647240A (zh) 一种统计访问量的方法、装置、电子设备及存储介质
CN107276857A (zh) 一种监测流量的方法及装置
CN110347955B (zh) 一种资源检测方法及装置
CN107145304A (zh) 服务器、存储系统及相关方法
CN107018039B (zh) 测试服务器集群性能瓶颈的方法和装置
CN106484720A (zh) 一种检测推广url的有效性的方法和装置
CN102684925A (zh) 互联网访问来源信息的获取方法和装置
CN110569178B (zh) 基于大数据平台的接口预警方法和系统
CN111245948A (zh) Dht网络连接方法、电子设备及介质
CN115811483A (zh) 一种网络状态监测方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190917