CN110908872A - 一种服务器状态检测方法及系统 - Google Patents

一种服务器状态检测方法及系统 Download PDF

Info

Publication number
CN110908872A
CN110908872A CN201911205580.7A CN201911205580A CN110908872A CN 110908872 A CN110908872 A CN 110908872A CN 201911205580 A CN201911205580 A CN 201911205580A CN 110908872 A CN110908872 A CN 110908872A
Authority
CN
China
Prior art keywords
server
detected
bfd
value
load balancing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911205580.7A
Other languages
English (en)
Other versions
CN110908872B (zh
Inventor
王意萍
易盼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou DPTech Technologies Co Ltd
Original Assignee
Hangzhou DPTech Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou DPTech Technologies Co Ltd filed Critical Hangzhou DPTech Technologies Co Ltd
Priority to CN201911205580.7A priority Critical patent/CN110908872B/zh
Publication of CN110908872A publication Critical patent/CN110908872A/zh
Application granted granted Critical
Publication of CN110908872B publication Critical patent/CN110908872B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems

Abstract

本说明书提供一种服务器状态检测方法及系统,该方法包括:负载均衡设备发送BFD检测报文至待检测服务器;该服务器接收到所述BFD检测报文后判断自身工作状态;待检测服务器在自身处于正常工作状态的情况下,将BFD检测报文中的本地标识符字段的值添加到BFD回应报文中的远程标识符字段,并将BFD回应报文发送至负载均衡设备;负载均衡设备接收待检测服务器返回的BFD回应报文后,判断BFD回应报文中的远程标识符的值与BFD检测报文中的本地标识符的值是否一致;在远程标识符的值与检测报文中的本地标识符的值一致的情况下,确定待检测服务器处于正常工作状态。采用本说明书的技术方案,无论服务器处理的是何种业务负载均衡设备均能准确判断该服务器的工作状态。

Description

一种服务器状态检测方法及系统
技术领域
本说明书涉及网络通信技术领域,具体涉及一种服务器状态检测方法及系统。
背景技术
目前,在负载均衡的网络架构中多台服务器共同为网络中的客户端提供相同的服务。当负载均衡设备得知其中一台服务器出现故障时则会将原本发往该服务器的业务流量调度到其他正常工作的服务器,以使正常工作的服务器对业务流量继续进行处理。可见负责均衡设备需要得到各服务器的真实工作状态。
现有的技术方案中负载均衡设备得知服务器真实工作状态的手段为,负载均衡设备利用TCP或HTTP等协议构建检测报文并发送至服务器,如果服务器回应的报文符合TCP或者HTTP的协议规范(例如服务器返回的回应报文与负载均衡设备发送的检测报文中的五元组信息相对应,回应报文中的源端口与检测报文中的目的端口一致,回应报文中的源IP地址与检测报文中的目的IP地址一致,以此类推),负载均衡设备则判断该服务器处于正常工作状态。但这种检测方法并不适用于所有情况,例如当服务器处理的业务为某种特定业务时,由于协议规定在正常情况下该服务器返回的回应报文中的五元组信息就会与检测报文中的五元组信息不对应(例如,回应报文中的源端口不与检测报文中的目的端口一致),此时该服务器实际处于正常工作状态,但负载均衡设备判断的结果却是该服务器处于非正常状态,可见在这种情况下负载均衡设备无法准确判断出服务器的工作状态,也就无法得到服务器的真实工作状态。
发明内容
针对上述技术问题,本说明书提供一种服务器状态检测方法及系统,技术方案如下:
根据本说明书的第一方面,提供一种服务器状态检测方法,该方法包括:
负载均衡设备发送BFD检测报文至待检测服务器;BFD检测报文中携带本地标识符,本地标识符用于标识BFD检测报文;
待检测服务器接收到BFD检测报文后,判断自身工作状态;
在自身处于正常工作状态的情况下,待检测服务器将BFD检测报文中的本地标识符字段的值添加到BFD回应报文中的远程标识符字段中,并将BFD回应报文发送至负载均衡设备;
负载均衡设备接收待检测服务器返回的BFD回应报文后,判断BFD回应报文中的远程标识符的值与BFD检测报文中的本地标识符的值是否一致;
在确定远程标识符的值与检测报文中的本地标识符的值一致的情况下,确定待检测服务器处于正常工作状态。
根据本说明书的第二方面,提供一种服务器状态检测系统,该系统包括负载均衡设备和待检测服务器;
负载均衡设备,用于发送BFD检测报文至待检测服务器,BFD检测报文中携带本地标识符,本地标识符用于标识BFD检测报文;
待检测服务器,用于在接收到BFD检测报文后,判断自身工作状态;在自身处于正常工作状态的情况下,将BFD检测报文中的本地标识符字段的值添加到BFD回应报文中的远程标识符字段,并将BFD回应报文发送至负载均衡设备;
负载均衡设备,还用于接收待检测服务器返回的BFD回应报文后,判断BFD回应报文中的远程标识符的值与BFD检测报文中的本地标识符的值是否一致;在确定远程标识符的值与检测报文中的本地标识符的值一致的情况下,确定待检测服务器处于正常工作状态。
本说明书中,负载均衡设备发送BFD检测报文至待检测服务器,接收待检测服务器返回的BFD回应报文,由于待检测服务器在自身工作状态正常时,会将检测报文中的本地标识符的值添加到回应报文中的远程标识符的字段中。故当负载均衡设备在接收到BFD回应报文后,判断BFD回应报文中的远程标识符与BFD检测报文中的本地标识符一致时,可以确定服务器处于正常工作状态。基于本说明书的检测方法,无论待检测服务器处理的业务是何种业务,负载均衡设备均能得知待检测服务器的真实工作状态。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1是本说明书示出的负载均衡网络架构示意图;
图2是本说明书实施例的一种服务器状态检测方法的流程示意图;
图3是本说明书实施例的另一种服务器状态检测方法的流程示意图;
图4是本说明书实施例的一种服务器状态检测装置的结构示意图;
图5是本说明书实施例的另一种服务器状态检测装置的结构示意图。
具体实施方式
为了使本领域技术人员更好地理解本说明书实施例中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行详细地描述,显然,所描述的实施例仅仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于保护的范围。
在本说明书使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本说明书和所附权利要求书中所使用的单数形式的“一种”、“”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
如图1所示,是目前负载均衡的网络架构示意图,在负载均衡的网络架构中多台服务器共同为网络中的客户端提供相同的服务,各客户端将业务流量发送至负载均衡设备,负载均衡设备在将业务流量分发至各服务器进行处理。当负载均衡设备得知其中一台服务器出现故障时则会将原本要发往该服务器的业务流量调度到其他正常工作的服务器,以使正常工作的服务器对业务流量继续进行处理,避免业务的中断。例如,当负载均衡设备得知服务器A出现故障时,会将原本要发给服务器A的业务流量调度至架构中其他正常工作的服务器进行处理,例如调度给服务器B和/或服务器C进行处理,可见负责均衡设备需要得知各服务器的真实工作状态。
现有的技术方案中负载均衡设备得知服务器真实工作状态的手段为,负载均衡设备利用TCP或HTTP等协议构建检测报文并发送至待检测服务器,如果服务器回应的报文符合TCP或者HTTP的协议规范,负载均衡设备则判断该服务器处于正常工作状态。但这种检测方法并不适用于所有情况,例如当服务器处理的业务为某种特定业务时,在正常情况下该服务器返回的回应报文中的五元组信息就会与检测报文中的五元组信息不对应(回应报文中的源端口不与检测报文中的目的端口一致)。
此时该服务器实际处于正常工作状态,但负载均衡设备接收到的回应报文中的五元组与检测报文中的五元组信息不对应,因此负载均衡设备判断的结果是该服务器处于非正常状态。可见在这种情况下负载均衡设备无法准确判断出服务器的工作状态,即无法得到服务器的真实工作状态,故而无法做到负载均衡。结合图1,例如当服务器A实际处于正常工作状态时,但负载均衡设备却判定服务器A处于非正常工作状态,此时会将原本发往服务器A的业务流量调度至服务器B和/或服务器C进行处理,此时不仅增加了服务器B和服务器C的工作负载,同时由于减少了一个服务器的工作,业务的处理效率也大大下降,服务器A处于空闲状态,浪费了业务处理资源。
为了解决上述问题,本说明书提供的方案是,负载均衡设备发送BFD检测报文至待检测服务器,接收待检测服务器返回的BFD回应报文,待检测服务器在自身工作状态正常时,会将BFD检测报文中的本地标识符的值添加到BFD回应报文中的远程标识符的字段中。故当负载均衡设备在接收到BFD回应报文后,判断BFD回应报文中的远程标识符与BFD检测报文中的本地标识符一致时,可以确定服务器处于正常工作状态。
基于本说明书的检测方法,无论待检测服务器处理的业务是何种业务,负载均衡设备均能得知待检测服务器的真实工作状态。
图2所示,为本说明书提供的一种服务器状态检测方法流程示意图,
该方法可以包括以下步骤:
S201,负载均衡设备发送BFD检测报文至待检测服务器;
本说明书中负载均衡设备利用BFD功能构建BFD检测报文,针对每条BFD检测报文生成一个索引值并将该索引值添加到BFD检测报文的本地标识符字段中,例如生成的索引值为a,将索引值a添加到该本地标识符字段中,故本地标识符可以用于标识BFD检测报文,即每条BFD检测报文的本地标识符字段中的值都不同,将本地标识符的值设置完成后,可以将该BFD检测报文的远程标识符字段的值设为默认值,将目的IP设置为待检测服务器的IP地址,将源IP设置为负载均衡设备自身的IP地址,将目的端口号设置为3785,源端口号设置为默认值,将构建完成的BFD检测报文发送至待检测服务器。该待检测服务器可以是负载均衡网络架构中任一个负责处理业务的服务器。
S202,待检测服务器在自身处于正常工作状态的情况下,将BFD检测报文中的本地标识符字段的值添加到BFD回应报文中的远程标识符字段中;
待检测服务器接收到上述BFD检测报文后,判断自身工作状态,待检测服务器可以查看自身服务的工作进程,通过查看自身服务的工作进程判断自身的工作状态,当自身服务的工作进程正常时,确定自身处于正常工作状态。当待检测服务器确定自身处于正常工作状态时,解析负载均衡设备发送的BFD检测报文,获取该BFD检测报文携带的本地标识符字段中的索引值a,同时构造BFD回应报文,将获取到的索引值a添加到BFD回应报文的远程标识符字段中,并将构造完成的BFD回应报文发送至负载均衡设备。
S203,负载均衡设备在回应报文中的远程标识符的值与检测报文中的本地标识符的值一致的情况下,确定待检测服务器处于正常工作状态;
负载均衡设备接收待检测服务器返回的BFD回应报文后,判断BFD回应报文中的远程标识符的值与BFD检测报文中的本地标识符的值是否一致,负载均衡设备可以在接收到待检测服务器发送的BFD回应报文后,解析该BFD回应报文获取该报文中远程标识符字段中的值a,将获取的值与之前发送的BFD检测报文中本地标识符的值进行比较,判断是否一致。
由于服务器在确定自身处于正常状态下,已经将获取到的索引值a添加到BFD回应报文的远程标识符字段中,故负载均衡设备获取到的BFD回应报文的远程标识符字段中的值一定与检测报文中的本地标识符的值一致,此时确定检测的待检测服务器处于正常状态。
本说明书中,负载均衡设备发送BFD检测报文至待检测服务器,由于待检测服务器随时都在监测自身的工作状态,所以可以立刻确定自身的工作状态,并在确定自身处于正常工作状态时,将BFD检测报文的本地标识符中的值添加到回应报文的远程标识符中,并将该回应报文发送至负载均衡设备,负载均衡设备在接收到回应报文后可以根据回应报文中的远程标识符确定该待检测服务器的工作状态。本说明书中负载均衡设备获知待检测服务器工作状态的方法为判断BFD响应报文的远程标识符是否与BFD检测报文的本地标识符一致。故不论待检测服务器处理的是何种业务,负载均衡设备都能获知该待检测服务器的真实工作状态,从而能够根据该待检测服务器的真实工作状态合理的进行负载均衡处理。
图3所示,为本说明书提供的另一种服务器状态检测方法流程示意图。
S301,待检测服务器在自身处于非正常工作状态的情况下,将预设的值添加到BFD回应报文中的远程标识符字段。
当待检测服务器接收到负载均衡设备发送的检测报文后,通过查询自身工作进程确定自身处于非正常工作状态时,可以将预设的值添加到BFD回应报文中的远程标识符字段中,预设的值可以是任何不与BFD检测报文中本地标识符字段中的值不同的值。例如当BFD检测报文中本地标识符字段中的值为a时,待检测服务器添加到BFD回应报文中远程标识符中预设的值可以是任何不为a的值。待检测服务器在添加完成后,将该BFD回应报文发送至负载均衡设备。
S302,负载均衡设备在回应报文中的远程标识符的值与检测报文中的本地标识符的值不一致的情况下,确定待检测服务器处于非正常工作状态。
负载均衡设备在接收到回应报文后,获取该回应报文中远程标识符中的值,并将获取的值与之前自身发送的检测报文中的值相比较,此时负载均衡设备确定回应报文中远程标识符的值与检测报文中的本地标识符的值不一致,故判断该待检测服务器处于非正常工作状态。由于该待检测服务器处于非正常工作状态,例如可能是业务端口出现故障或其他原因造成的该待检测服务器无法继续处理业务,故可以基于预设的算法将待发送至该待检测服务器的业务流量调度至其他正常工作的服务器,以使其他服务器能够继续处理业务,避免业务中断。
在本说明书的一种实施例中,为了检测服务器的工作状态,负载均衡设备可以周期性的发送BFD检测报文至同一待检测服务器,以确定该待检测服务器的工作状态。可以根据需求设定周期时间,例如可以将周期设置为2分钟,负载均衡设备每2分钟向待检测服务器发送一次BFD检测报文,并等待该待检测服务器回应。由于BFD报文回应速度较快,故可以在发送BFD检测报文后几秒内仍未接收到该待检测服务器的回应报文时,即可确定该待检测服务器在本周期未做回应,例如在发送BFD检测报文后5秒内未接收到该待检测服务器的回应报文时,即可确定该待检测服务器在本周期未做回应。当然也可以在本周期结束时还没收到该待检测服务器的回应报文时,判定该待检测服务器在本周期未做回应。本说明书并不对此做限定。当此时判定该待检测服务器未做回应时,记录该待检测服务器未做回应的周期次数,例如当待检测服务器首次出现未做回应的情况时,则将该待检测服务器未做回应的周期次数记为1。此时可能是由于网络延迟或业务突发等情况造成的回应报文未传回至负载均衡设备,故并不立即确定该待检测服务器处于非正常工作状态。当检测到下一周期该待检测服务器仍未做回应时,将该待检测服务器未做回应的周期次数记为2,以此类推。当记录的该待检测服务器未做回应的连续周期次数达到了预设阈值时,则说明该待检测服务器很有可能已经出现故障,此时为了避免业务的中断,将待发往该待检测服务器的业务流量调度至其他正常工作的服务器,以使其他服务器能够继续处理业务。例如将待检测服务器的阈值设置为3次,当检测到该待检测服务器未做回应的连续周期次数达到了3次,则确定该待检测服务器处于非正常工作状态,并将发往该待检测服务器的业务流量调度至其他正常工作的服务器进行处理。另外,当待检测服务器出现了未做回应的情况,但未做回应的连续周期次数在未达到预设阈值时又对负载均衡设备进行了回应,此时对记录的该待检测服务器的未做回应的周期次数进行清零处理。
需要说明的是,预设阈值除了统一设置为固定值以外。预设阈值还可以根据待检测服务器处理的业务类型确定,例如,当待检测服务器处理的业务是非常重要的业务不能容忍中断时,可以将预设阈值设置为较小的数值,例如当待检测服务器处理的业务为游戏业务或金融业务,这类业务时效性要求较高,可以将预设阈值设置为2,即当判定待检测服务器出现2次未回应时,即判定该待检测服务器处于非正常工作状态并将发往该待检测服务器的业务流量调度至其他服务器进行处理,避免该业务出现中断带来的损失,当然也可以将设阈值设置为1,即当判定待检测服务器出现1次未回应时,即将发往该待检测服务器的业务流量调度至其他服务器进行处理。当待检测服务器处理的业务能够接受短暂的中断,时效性要求较低时,可以将预设阈值设置为较大的数值,例如可以将预设阈值设置为5,即在经过连续5个周期的检测,且待检测服务器均未回应时,则判定该待检测服务器处于非正常工作状态,并将发往该待检测服务器的业务流量调度至其他服务器进行处理。预设阈值具体的数值,可以根据待检测服务器处理的业务类型进行设定。上述将业务流量调度至其他正常工作的服务器的算法可以采用现有技术中的算法,例如轮询算法、随机法和/或最小连接法等,本说明书并不对此做限定。
另外,上述负载均衡设备未接收到待检测服务器发送的回应报文仍不能排除是业务突发或网络延迟造成的,故为了进一步确定待检测服务器的真实工作状态,在将业务调度至其他正常工作的服务器后,仍然周期性的向该待检测服务器发送BFD检测报文,并检测是否能收到回应报文。避免该待检测服务器实际处于正常状态,而不向其发送业务流量造成的处理资源的空闲。如果接收到该待检测服务器发送的回应报文,则解析回应报文,判断BFD回应报文中的远程标识符的值与发送的BFD检测报文中的本地标识符的值是否一致,如果一致则说明该服务器处于正常工作状态。故为了提高业务处理效率,可以将业务流量再次调度至该服务器进行处理。另外,如果判断不一致时,则说明该服务器处于非正常工作状态,此时为了节约负载均衡设备的处理资源,可以停止周期性的向该待检测服务器发送BFD检测报文。
为了使本领域技术人员更好地理解本说明书中的技术方案,下面从单侧描述本说明书的技术方案。
本说明书示出一种服务器状态检测方法,该方法应用于负载均衡设备,该方法包括:
发送BFD检测报文至待检测服务器;上述BFD检测报文中携带本地标识符,上述本地标识符用于标识上述BFD检测报文;
接收上述待检测服务器返回的BFD回应报文后,判断上述BFD回应报文中的远程标识符的值与所述BFD检测报文中的本地标识符的值是否一致;
在上述远程标识符的值与检测报文中的本地标识符的值一致的情况下,确定上述待检测服务器处于正常工作状态。
在本说明书的一个实施例中,当在上述远程标识符的值与检测报文中的本地标识符的值不一致的情况下,确定上述待检测服务器处于非正常工作状态。
在本说明书的一个实施例中,周期性发送BFD检测报文至待检测服务器,在该待检测服务器未做回应的连续周期次数达到预设阈值的情况下,确定该待检测服务器处于非正常工作状态,并基于预设算法将待发送至该待检测服务器的业务流量调度至其他处于正常工作状态的服务器。
在本说明书的一个实施例中,在将业务流量调度至其他服务器后,继续周期性发送BFD检测报文至该待检测服务器,当接收到该待检测服务器返回的BFD回应报文,且判断该BFD回应报文中的远程标识符的值与BFD检测报文中的本地标识符的值一致时,确定该待检测服务器处于正常工作状态,并将业务流量调度至该待检测服务器。
本说明书示出一种服务器状态检测方法,该方法应用于待检测服务器,该方法包括:
接收到负载均衡设备发送的BFD检测报文后,判断自身工作状态;
在自身处于正常工作状态的情况下,将该BFD检测报文中的本地标识符字段的值添加到BFD回应报文中的远程标识符字段中,并将该BFD回应报文发送至负载均衡设备。
在本说明书的一个实施例中,在自身处于非正常工作状态的情况下,将预设的值添加到BFD回应报文中的远程标识符字段中,并将所述BFD回应报文发送至负载均衡设备。
与前述单侧描述的方法相对应,本说明书还提出了相应的装置。
如图4本所示为本说明书示出一种服务器状态检测装置,该装置应用于负载均衡设备,该装置包括:
发送模块410,用于发送BFD检测报文至待检测服务器;上述BFD检测报文中携带本地标识符,上述本地标识符用于标识上述BFD检测报文;
判断模块420,用于接收上述待检测服务器返回的BFD回应报文后,判断上述BFD回应报文中的远程标识符的值与所述BFD检测报文中的本地标识符的值是否一致;
确定模块430,用于在上述远程标识符的值与检测报文中的本地标识符的值一致的情况下,确定上述待检测服务器处于正常工作状态。
在本说明书的一个实施例中,上述确定模块430还用于在上述远程标识符的值与检测报文中的本地标识符的值不一致的情况下,确定上述待检测服务器处于非正常工作状态。
在本说明书的一个实施例中,上述发送模块410,具体用于周期性发送BFD检测报文至待检测服务器。
上述确定模块430,还用于在该待检测服务器未做回应的连续周期次数达到预设阈值的情况下,确定该待检测服务器处于非正常工作状态,并基于预设算法将待发送至该待检测服务器的业务流量调度至其他处于正常工作状态的服务器。
在本说明书的一个实施例中,上述发送模块410,还用于在将业务流量调度至其他服务器后,继续周期性发送BFD检测报文至该待检测服务器。
上述确定模块430,还用于当接收到该待检测服务器返回的BFD回应报文,且判断该BFD回应报文中的远程标识符的值与BFD检测报文中的本地标识符的值一致时,确定该待检测服务器处于正常工作状态,并将业务流量调度至该待检测服务器。
如图5所示,为本说明书示出一种服务器状态检测装置,该装置应用于待检测服务器,该装置包括:
接收模块510,用于接收到负载均衡设备发送的BFD检测报文后,判断自身工作状态;
添加模块520,用于在自身处于正常工作状态的情况下,将该BFD检测报文中的本地标识符字段的值添加到BFD回应报文中的远程标识符字段中,并将该BFD回应报文发送至负载均衡设备。
在本说明书的一个实施例中,上述添加模块520,还用于在自身处于非正常工作状态的情况下,将预设的值添加到BFD回应报文中的远程标识符字段中,并将所述BFD回应报文发送至负载均衡设备。
与前述服务器状态检测方法相对应,本说明书还提供了一种服务器状态检测系统。
该系统包括:
负载均衡设备,用于发送BFD检测报文至待检测服务器,BFD检测报文中携带本地标识符,本地标识符用于标识BFD检测报文;
待检测服务器,用于在接收到BFD检测报文后,判断自身工作状态;在自身处于正常工作状态的情况下,将BFD检测报文中的本地标识符字段的值添加到BFD回应报文中的远程标识符字段,并将BFD回应报文发送至负载均衡设备;
负载均衡设备,还用于接收待检测服务器返回的BFD回应报文后,判断BFD回应报文中的远程标识符的值与BFD检测报文中的本地标识符的值是否一致;在远程标识符的值与检测报文中的本地标识符的值一致的情况下,确定待检测服务器处于正常工作状态。
在本说明书的一种实施例中,上述待检测服务器,还用于在自身处于非正常工作状态的情况下,将预设的值添加到BFD回应报文中的远程标识符字段,并将BFD回应报文发送至负载均衡设备;
上述负载均衡设备,还用于在确定远程标识符的值与检测报文中的本地标识符的值不一致的情况下,确定待检测服务器处于非正常工作状态,并基于预设算法将待发送至待检测服务器的业务流量调度至其他处于正常工作状态的服务器。
在本说明书的一种实施例中,负载均衡设备周期性发送BFD检测报文至待检测服务器;
上述负载均衡设备,还用于对待检测服务器未做回应的连续周期次数进行统计;在待检测服务器未做回应的连续周期次数达到预设阈值的情况下,确定待检测服务器处于非正常工作状态,并基于预设算法将待发送至待检测服务器的业务流量调度至其他处于正常工作状态的服务器。
在本说明书的一种实施例中,预设阈值根据待检测服务器处理的业务类型确定。
在本说明书的一种实施例中,上述负载均衡设备,还用于继续周期性发送BFD检测报文至待检测服务器,当接收到上述待检测服务器返回的BFD回应报文,且判断BFD回应报文中的远程标识符的值与BFD检测报文中的本地标识符的值一致时,确定服务器处于正常工作状态,并将业务流量调度至待检测服务器。
上述系统中各个设备的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于系统实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的系统实施例仅仅是示意性的。可以根据实际的需要选择其中的部分或者全部设备来实现本说明书方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统实施例仅仅是示意性的,由此,主题的特定实施例已被描述。其他实施例在所附权利要求书的范围以内。在某些情况下,权利要求书中记载的动作可以以不同的顺序执行并且仍实现期望的结果。此外,附图中描绘的处理并非必需所示的特定顺序或顺次顺序,以实现期望的结果。在某些实现中,多任务和并行处理可能是有利的。
以上所述仅是本说明书实施例的具体实施例,应当指出,对于本技术领域的普通技术人员来说,在不脱离本说明书实施例原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本说明书实施例的保护范围。

Claims (10)

1.一种服务器状态检测方法,其特征在于,所述方法包括:
负载均衡设备发送BFD检测报文至待检测服务器;所述BFD检测报文中携带本地标识符,所述本地标识符用于标识所述BFD检测报文;
待检测服务器接收到所述BFD检测报文后,判断自身工作状态;
待检测服务器在自身处于正常工作状态的情况下,将所述BFD检测报文中的本地标识符字段的值添加到BFD回应报文中的远程标识符字段中,并将所述BFD回应报文发送至所述负载均衡设备;
负载均衡设备接收所述待检测服务器返回的BFD回应报文后,判断所述BFD回应报文中的远程标识符的值与所述BFD检测报文中的本地标识符的值是否一致;
负载均衡设备在所述远程标识符的值与检测报文中的本地标识符的值一致的情况下,确定所述待检测服务器处于正常工作状态。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
待检测服务器在自身处于非正常工作状态的情况下,将预设的值添加到BFD回应报文中的远程标识符字段中,并将所述BFD回应报文发送至负载均衡设备;
负载均衡设备在确定所述远程标识符的值与检测报文中的本地标识符的值不一致的情况下,判断所述负载均衡设备确定所述待检测服务器处于非正常工作状态,并基于预设算法将待发送至所述待检测服务器的业务流量调度至其他处于正常工作状态的服务器。
3.根据权利要求1所述的方法,其特征在于,所述负载均衡设备周期性发送BFD检测报文至待检测服务器,所述方法还包括:
负载均衡设备,对所述待检测服务器未做回应的连续周期次数进行统计;
在所述待检测服务器未做回应的连续周期次数达到预设阈值的情况下,确定所述待检测服务器处于非正常工作状态,并基于预设算法将待发送至所述待检测服务器的业务流量调度至其他处于正常工作状态的服务器。
4.根据权利要求3所述的方法,其特征在于,
所述预设阈值根据所述待检测服务器处理的业务类型确定。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
所述负载均衡设备继续周期性发送BFD检测报文至所述待检测服务器,当接收到所述待检测服务器返回的BFD回应报文,且判断所述BFD回应报文中的远程标识符的值与BFD检测报文中的本地标识符的值一致时,确定所述待检测服务器处于正常工作状态,并将业务流量调度至所述待检测服务器。
6.一种服务器状态检测系统,其特征在于,所述系统包括负载均衡设备和待检测服务器;
所述负载均衡设备,用于发送BFD检测报文至待检测服务器,所述BFD检测报文中携带本地标识符,所述本地标识符用于标识所述BFD检测报文;
所述待检测服务器,用于在接收到所述BFD检测报文后,判断自身工作状态;在自身处于正常工作状态的情况下,将所述BFD检测报文中的本地标识符字段的值添加到BFD回应报文中的远程标识符字段,并将所述BFD回应报文发送至所述负载均衡设备;
所述负载均衡设备,还用于接收所述待检测服务器返回的BFD回应报文后,判断所述BFD回应报文中的远程标识符的值与所述BFD检测报文中的本地标识符的值是否一致;在所述远程标识符的值与检测报文中的本地标识符的值一致的情况下,确定所述待检测服务器处于正常工作状态。
7.根据权利要求6所述的系统,其特征在于,
所述待检测服务器,还用于在自身处于非正常工作状态的情况下,将预设的值添加到BFD回应报文中的远程标识符字段,并将所述BFD回应报文发送至负载均衡设备;
所述负载均衡设备,还用于在确定所述远程标识符的值与检测报文中的本地标识符的值不一致的情况下,确定所述待检测服务器处于非正常工作状态,并基于预设算法将待发送至所述待检测服务器的业务流量调度至其他处于正常工作状态的服务器。
8.根据权利要求6所述的系统,其特征在于,所述负载均衡设备周期性发送BFD检测报文至待检测服务器;
所述负载均衡设备,还用于对所述待检测服务器未做回应的连续周期次数进行统计;在所述待检测服务器未做回应的连续周期次数达到预设阈值的情况下,确定所述待检测服务器处于非正常工作状态,并基于预设算法将待发送至所述待检测服务器的业务流量调度至其他处于正常工作状态的服务器。
9.根据权利要求8所述的系统,其特征在于,
所述预设阈值根据所述待检测服务器处理的业务类型确定。
10.根据权利要求8所述的系统,其特征在于,
所述负载均衡设备,还用于继续周期性发送BFD检测报文至所述待检测服务器,当接收到所述待检测服务器返回的BFD回应报文,且判断所述BFD回应报文中的远程标识符的值与BFD检测报文中的本地标识符的值一致时,确定所述服务器处于正常工作状态,并将业务流量调度至所述待检测服务器。
CN201911205580.7A 2019-11-29 2019-11-29 一种服务器状态检测方法及系统 Active CN110908872B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911205580.7A CN110908872B (zh) 2019-11-29 2019-11-29 一种服务器状态检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911205580.7A CN110908872B (zh) 2019-11-29 2019-11-29 一种服务器状态检测方法及系统

Publications (2)

Publication Number Publication Date
CN110908872A true CN110908872A (zh) 2020-03-24
CN110908872B CN110908872B (zh) 2023-04-25

Family

ID=69820863

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911205580.7A Active CN110908872B (zh) 2019-11-29 2019-11-29 一种服务器状态检测方法及系统

Country Status (1)

Country Link
CN (1) CN110908872B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112866338A (zh) * 2020-12-31 2021-05-28 杭州迪普科技股份有限公司 一种服务器状态检测的方法及装置
CN113055236A (zh) * 2021-03-31 2021-06-29 阿米华晟数据科技(江苏)有限公司 集群业务节点故障的处理方法、装置、设备及存储介质
CN113132159A (zh) * 2021-04-08 2021-07-16 北京马赫谷科技有限公司 存储集群节点故障的处理方法、设备及存储系统
CN113596170A (zh) * 2021-08-03 2021-11-02 上海浦东发展银行股份有限公司 基于负载均衡设备的停机处理方法、装置、介质及设备
CN114390047A (zh) * 2022-03-23 2022-04-22 北京国联政信科技有限公司 基于数字包裹的跨网段文件交换方法和装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101640620A (zh) * 2009-09-01 2010-02-03 杭州华三通信技术有限公司 一种被均衡设备的健康检测方法及装置
CN102624627A (zh) * 2012-03-15 2012-08-01 杭州华三通信技术有限公司 一种报文的传输方法和设备
US8949658B1 (en) * 2012-03-02 2015-02-03 Amazon Technologies, Inc. Load balancer host selection and fault detection
CN105871588A (zh) * 2015-12-11 2016-08-17 乐视云计算有限公司 负载均衡配置方法、设备及系统
CN107070983A (zh) * 2017-01-23 2017-08-18 天地融科技股份有限公司 一种基于地址转发的负载均衡方法、设备和系统
CN108199914A (zh) * 2017-12-27 2018-06-22 杭州迪普科技股份有限公司 服务端状态检测方法和装置
CN109660626A (zh) * 2018-12-29 2019-04-19 天翼电子商务有限公司 一种负载均衡方法、系统及负载均衡监控端
CN110175074A (zh) * 2019-04-18 2019-08-27 北京奇艺世纪科技有限公司 负载均衡方法和服务器、负载单元、服务处理设备及介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101640620A (zh) * 2009-09-01 2010-02-03 杭州华三通信技术有限公司 一种被均衡设备的健康检测方法及装置
US8949658B1 (en) * 2012-03-02 2015-02-03 Amazon Technologies, Inc. Load balancer host selection and fault detection
CN102624627A (zh) * 2012-03-15 2012-08-01 杭州华三通信技术有限公司 一种报文的传输方法和设备
CN105871588A (zh) * 2015-12-11 2016-08-17 乐视云计算有限公司 负载均衡配置方法、设备及系统
US20170171301A1 (en) * 2015-12-11 2017-06-15 Le Holdings (Beijing) Co., Ltd. Method, device and system for load balancing configuration
CN107070983A (zh) * 2017-01-23 2017-08-18 天地融科技股份有限公司 一种基于地址转发的负载均衡方法、设备和系统
CN108199914A (zh) * 2017-12-27 2018-06-22 杭州迪普科技股份有限公司 服务端状态检测方法和装置
CN109660626A (zh) * 2018-12-29 2019-04-19 天翼电子商务有限公司 一种负载均衡方法、系统及负载均衡监控端
CN110175074A (zh) * 2019-04-18 2019-08-27 北京奇艺世纪科技有限公司 负载均衡方法和服务器、负载单元、服务处理设备及介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112866338A (zh) * 2020-12-31 2021-05-28 杭州迪普科技股份有限公司 一种服务器状态检测的方法及装置
CN113055236A (zh) * 2021-03-31 2021-06-29 阿米华晟数据科技(江苏)有限公司 集群业务节点故障的处理方法、装置、设备及存储介质
CN113132159A (zh) * 2021-04-08 2021-07-16 北京马赫谷科技有限公司 存储集群节点故障的处理方法、设备及存储系统
CN113132159B (zh) * 2021-04-08 2023-04-25 北京马赫谷科技有限公司 存储集群节点故障的处理方法、设备及存储系统
CN113596170A (zh) * 2021-08-03 2021-11-02 上海浦东发展银行股份有限公司 基于负载均衡设备的停机处理方法、装置、介质及设备
CN114390047A (zh) * 2022-03-23 2022-04-22 北京国联政信科技有限公司 基于数字包裹的跨网段文件交换方法和装置

Also Published As

Publication number Publication date
CN110908872B (zh) 2023-04-25

Similar Documents

Publication Publication Date Title
CN110908872B (zh) 一种服务器状态检测方法及系统
CN108989136B (zh) 业务端到端性能监控方法及装置
CN101953139B (zh) 响应于网络层连通性的dhcp初始化
CN109194547B (zh) 报文传输方法、装置、本端设备及可读存储介质
CN108965123A (zh) 一种链路切换方法和网络通信系统
CN107360239A (zh) 一种客户端连接状态检测方法及系统
CN110808873B (zh) 一种检测链路故障的方法及装置
CN108199914A (zh) 服务端状态检测方法和装置
EP2698948A1 (en) Method and device for determining failure elimination based on oam protocol
CN109714190A (zh) 一种基于应用级别的负载均衡与故障转移系统及其方法
EP2892274B1 (en) Fault recovery method of operation and maintenance channel and network management terminal
CN102761461A (zh) 一种链路健康检查方法及装置
JP2006501717A (ja) 電気通信ネットワーク・エレメントの監視
US20150381498A1 (en) Network system and its load distribution method
CN105516658A (zh) 一种监控设备控制方法及装置
CN114401258A (zh) 短信发送方法、装置、电子装置和存储介质
CN112866338B (zh) 一种服务器状态检测的方法及装置
CN115037785B (zh) 即时通讯系统及方法
CN110572315A (zh) 一种信息交互的方法及装置、机器人、存储介质
CN115914027A (zh) 一种负载均衡设备中的健康检查系统
CN108781215B (zh) 网络服务实现方法、服务控制器及通信系统
CN106961344B (zh) 一种网络故障检测方法及装置
CN113542052A (zh) 一种节点故障确定方法、装置和服务器
EP3158685B1 (en) Identification of candidate problem network entities
CN112636999A (zh) 一种端口的探测方法和网络监控系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant