CN116800636B - 负载均衡中的被动健康检查方法、装置、设备及介质 - Google Patents

负载均衡中的被动健康检查方法、装置、设备及介质 Download PDF

Info

Publication number
CN116800636B
CN116800636B CN202310955555.0A CN202310955555A CN116800636B CN 116800636 B CN116800636 B CN 116800636B CN 202310955555 A CN202310955555 A CN 202310955555A CN 116800636 B CN116800636 B CN 116800636B
Authority
CN
China
Prior art keywords
end server
data
health
health state
request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310955555.0A
Other languages
English (en)
Other versions
CN116800636A (zh
Inventor
包雯韬
徐文豪
王弘毅
张凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhiling Haina Technology Co ltd
Original Assignee
SmartX Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SmartX Inc filed Critical SmartX Inc
Priority to CN202310955555.0A priority Critical patent/CN116800636B/zh
Publication of CN116800636A publication Critical patent/CN116800636A/zh
Application granted granted Critical
Publication of CN116800636B publication Critical patent/CN116800636B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/50Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种负载均衡中的被动健康检查方法、装置、设备及介质,包括:采集后端服务器的健康状态数据并上报至数据工厂;获取原始的服务日志、系统日志及网卡状态数据进行预处理,提取并输出目标特征数据;将所述目标特征数据输入预设决策模型,判断后端服务器的健康状态是否发生改变,触发主动探测;在当前业务请求失败次数大于预设阈值的情况下,更新后端服务器的健康状态完成对被动健康检查机制的启动;判断是否对当前请求处理失败的后端服务器进行调度权重的调整以控制在后端服务器出现问题时被调度的概率,降低首次连接失败的概率,从而避免重新请求引起的低效率现象,及时感知后端服务器的健康状态。

Description

负载均衡中的被动健康检查方法、装置、设备及介质
技术领域
本发明涉及负载均衡技术领域,尤其涉及一种负载均衡中的被动健康检查方法、装置、设备及介质。
背景技术
对于负载均衡器的健康检查来说,一般有两种模式:主动健康检查和被动健康检查。主动健康检查指的是周期性地发送探测请求,来感知后端服务器的健康状态。而被动健康检查机制不会主动发起探测请求,而是根据业务请求失败的次数来判断服务器的状态是否为失败。如果失败超过一定时间,则自动恢复为健康状态。现有技术中,被动健康检查方式一般会结合主动健康检查一起使用。它的原理描述如下:1,在RS为“正常”的状态下,负载均衡系统不会主动向RS发送探测请求。2,在RS为“正常”的状态下,如果RS处理业务请求连续失败的次数超过一定阈值,则改变RS的健康状态为“失败”。3,在RS为“失败”的状态下,负载均衡系统向RS发送探测请求。4,在RS为“失败”的状态下,如果连续探测成功的次数到达一定的阈值,则改变RS的健康状态为“正常”。
虽然被动健康检查在结合主动健康检查后,能够解决很多场景,但是它不可避免地存在如下缺陷:
1、请求效率低,参见附图1所示,同一个请求只会连接一个服务一次。首先,当前RS-1和RS-2的健康状态都是显示正常,而实际上RS-1的状态是不健康。那么,请求1连接RS-1失败了,则下一次选择RS-2进行连接。同理,请求2,请求3都会有两次连接的情况。因此,这种机制存在的问题是在请求RS-1的失败总次数还没有达到上线的时候,每一个请求都需要连接两次,这样会影响请求的效率。
2、无法及时感知后端服务器的健康状态。尤其在业务请求频度较低,比如:对某个RS,几分钟才有一个请求的情况下,对于负载均衡器来说,无法及时发现后端服务器的状态。
鉴于此,有必要提出一种负载均衡中的被动健康检查方法克服上述缺陷。
发明内容
本发明的目的是提供一种负载均衡中的被动健康检查方法、装置、设备及介质,降低首次连接失败的概率,从而避免重新请求引起的低效率现象。
本发明提供了一种负载均衡中的被动健康检查方法,包括:
从负载均衡系统向后端服务器发送请求来获取后端服务器运行的状况;
采集后端服务器的健康状态数据并上报至数据工厂,后端服务器的健康状态数据包括服务日志特征集、系统日志特征集及网卡状态特征集;
获取原始的服务日志、系统日志及网卡状态数据进行预处理,提取并输出目标特征数据;
将所述目标特征数据输入预设决策模型,判断后端服务器的健康状态是否发生改变,在后端服务器的健康状态发生改变的情况触发主动探测;
在当前业务请求失败次数大于预设阈值的情况下,更新后端服务器的健康状态完成对被动健康检查机制的启动;
在当前业务请求失败的情况下,判断是否对当前请求处理失败的后端服务器进行调度权重的调整以控制在后端服务器出现问题时被调度的概率。
作为优选地,所述提取并输出目标特征数据包括:
获取当前后端服务器的健康状态数据上报至数据工厂;
在数据工厂中进行原始健康状态数据的存储及加工处理,通过自然语言处理算法将不同格式的若干健康状态数据进行有效数据的提取,推导出相应的目标特征数据并进行提取及存储。
作为优选地,所述服务日志特征集包括异步请求队列长度以及请求入队的速率、请求处理的速率,服务端/客户端错误以及错误发生次数、错误发生时间点,所述系统日志特征集包括当前系统状态、CPU利用率、磁盘使用率、内存使用率、负载情况、错误日志统计、error次数、Critical次数、Alert次数和Emerg次数,所述网卡状态特征集包括网卡名称、网卡的队列长度、网卡的丢包率和网卡带宽使用情况。
作为优选地,所述将所述目标特征数据输入预设决策模型,判断后端服务器的健康状态是否发生改变,在后端服务器的健康状态发生改变的情况触发主动探测包括:
获取当前所述目标特征数据,判断后端服务器的所述目标特征数据是否更新;
在所述目标特征数据更新的情况下,通过预设决策模型输出后端服务器的健康状态,判断后端服务器的健康状态是否发生改变;
在后端服务器的健康状态发生改变的情况下,触发主动探测从而决定是否更新健康状态。
作为优选地,在所述目标特征数据更新的情况下,通过预设决策模型输出后端服务器的健康状态,判断后端服务器的健康状态是否发生改变包括:
获取当前负载均衡系统中的后端服务器的第一健康状态;
获取当前后端服务器的第二健康状态;
将所述第一健康状态与所述第二健康状态作对比,判断二者健康状态是否一致;
在二者健康状态不一致的情况下,则触发主动探测请求得到最终的健康检查结果。
作为优选地,所述在当前业务请求失败的情况下,判断是否对当前请求处理失败的后端服务器进行调度权重的调整以控制在后端服务器出现问题时被调度的概率包括:
在当前业务请求失败次数大于预设阈值时,输出并更新后端服务器的健康状态为不健康;
在当前业务请求失败次数小于等于预设阈值时,继续进行后续的业务请求中显示后端服务器请求成功,则将对当前统计的失败次数归零;
判断是否对当前后端服务器进行调度权重的降低处理,在对降低处理后的后端服务器的调度权重进行恢复。
作为优选地,所述提取并输出目标特征数据进一步包括:从负载均衡系统向数据工厂对感兴趣的后端服务器目标特征数据进行监听以监控后端服务器的状态。
本发明提供了一种负载均衡中的被动健康检查装置,包括:
后端服务器,用于从负载均衡系统向后端服务器发送请求来获取后端服务器运行的状况;采集后端服务器的健康状态数据并上报至数据工厂,后端服务器的健康状态数据包括服务日志特征集、系统日志特征集及网卡状态特征集;
数据工厂,用于获取原始的服务日志、系统日志及网卡状态数据进行预处理,提取并输出目标特征数据;
负载均衡系统,用于将所述目标特征数据输入预设决策模型,判断后端服务器的健康状态是否发生改变,在后端服务器的健康状态发生改变的情况触发主动探测;在当前业务请求失败次数大于预设阈值的情况下,更新后端服务器的健康状态完成对被动健康检查机制的启动;在当前业务请求失败的情况下,判断是否对当前请求处理失败的后端服务器进行调度权重的调整以控制在后端服务器出现问题时被调度的概率。
本发明还提供了一种电子设备,包括:
存储器,所述存储器用于存储处理程序;
处理器,所述处理器执行所述处理程序时实现如本发明实施例所述的负载均衡中的被动健康检查方法。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有处理程序,所述处理程序被处理器执行时实现如本发明实施例所述的负载均衡中的被动健康检查方法。
针对现有技术,本发明具有如下的有益效果:
本发明所提供的负载均衡中的被动健康检查方法是降低首次连接失败的概率,从而避免重新请求引起的低效率现象,通过被动健康检查的触发,及时感知后端服务器的健康状态。
本发明所提供的负载均衡中的被动健康检查方法通过对后端服务器的数据分析,能在一定概率上感知RS自身的健康状态,再通过主动探测请求进行确认。这种模式提高了准确性以及实时性。
本发明所提供的负载均衡中的被动健康检查方法通过将请求失败的后端服务器权重降低的方式,使得后续请求尽可能地不被调度到这台可能有问题的服务器上,能够提升请求的效率;
本发明结合触发主动探测,提升健康检查的准确性,又避免周期性探测导致的系统压力;
本发明通过对请求处理失败的后端服务器进行调度权重的调整,提高了请求后续成功的概率。
附图说明
图1为本发明背景技术中的所述负载均衡中的被动健康检查方法示例图;
图2为本发明一实施例中所述负载均衡中的被动健康检查方法的流程图;
图3为本发明一实施例中后端服务器的数据采集示例图;
图4为本发明一实施例中数据工厂的数据处理示例图;
图5为本发明一实施例中负载均衡系统的结构示例图;
图6-7为本发明一实施例中整个健康检查流程示例图;
图8为本发明一实施例中所述负载均衡中的被动健康检查装置的总体架构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
如图2所示,本发明提供了一种负载均衡中的被动健康检查方法,其特征在于,包括:
S1:从负载均衡系统向后端服务器发送请求来获取后端服务器运行的状况;本实施例中采用的负载均衡系统可以是LB:Load Balancer负载均衡器,用于将请求分散到某个集群中的可用服务器上,来缓解单个服务器的压力。本实施例所指的后端服务器为真正处理请求的后端服务器即RS。
S2:采集后端服务器的健康状态数据并上报至数据工厂,后端服务器的健康状态数据包括服务日志特征集、系统日志特征集及网卡状态特征集;
对于负载均衡器对后端服务器的健康检查机制,主要有两个方面决定:1,网络问题。2,后端服务器自身问题。在真实环境中,往往第二个方面出问题的概率更大。本发明实施例通过分析后端服务器自身的数据来判断健康状态。采集的数据如图3所示,主要包括:服务自身日志,系统日志以及网卡相关状态。这些数据只需要采集,不需要处理,上报到集中式的数据工厂进行加工即可。
S3:获取原始的服务日志、系统日志及网卡状态数据进行预处理,提取并输出目标特征数据,有利于将原始的日志文件以及网卡状态数据进行加工和处理,输出为指定的特征数据,供负载均衡器进行分析。
具体地,本实施例步骤S3中提取并输出目标特征数据步骤包括:获取当前后端服务器的健康状态数据上报至数据工厂;在数据工厂中进行原始健康状态数据的存储及加工处理,通过自然语言处理算法将不同格式的若干健康状态数据进行有效数据的提取,推导出相应的目标特征数据并进行提取及存储。基本流程如图4所示:原始数据存储,原始数据加工处理,数据特征提取以及特征存储。所述服务日志特征集包括异步请求队列长度以及请求入队的速率、请求处理的速率,服务端/客户端错误以及错误发生次数、错误发生时间点,所述系统日志特征集包括当前系统状态、CPU利用率、磁盘使用率、内存使用率、负载情况、错误日志统计、error次数、Critical次数、Alert次数和Emerg次数,所述网卡状态特征集包括网卡名称、网卡的队列长度、网卡的丢包率和网卡带宽使用情况。即error:错误信息,出现这一项时,已经挑明服务出现了问题,服务都无法确认是否能正常运行。critical:比较严重的错误信息,服务已经宕了,可能已经无法修复。alert:警报信息,需要立即采取行动,不仅是服务宕了,还会影响系统的正常后动。emerg:紧急信息,系统可能已经不能使用了,如果不能解决,得重新装机。
所述步骤S3中提取并输出目标特征数据进一步包括:从负载均衡系统向数据工厂对感兴趣的后端服务器目标特征数据进行监听以监控后端服务器的状态。可以理解为,每一个负载均衡器都会只会监听自己感兴趣的相关后端服务器的数据。
本实施例中预处理过程中分析的数据为后端服务器上报的数据,包括服务日志,系统日志以及网卡状态。对于不同的后端服务器,这些数据的格式不一定相同,但是数据工厂可以通过自然语言处理算法,将不同格式的大量数据进行有效数据的提取,并且推导出相应的特征。对于本发明,需要的具体特征主要如下三个表格所示。
S4:将所述目标特征数据输入预设决策模型,判断后端服务器的健康状态是否发生改变,在后端服务器的健康状态发生改变的情况触发主动探测;参见图5所示,主要有两个因素可能会触发后端服务器健康状态的更新:1,对RS数据的分析决策,判断后端服务器的状态,如果跟当前负载均衡器中的状态不一致,则触发主动探测请求,得到最终的检查结果。2,由当前业务请求决定,也就是现有的被动健康检查机制,如果对某个服务器的失败请求超过一定次数,则更新健康检查状态。
整个健康检查流程主要如图6根据特征数据判断是否触发主动探测,从而决定是否更新健康状态的过程,具体如下:
获取当前所述目标特征数据,判断后端服务器的所述目标特征数据是否更新;
在所述目标特征数据更新的情况下,通过预设决策模型输出后端服务器的健康状态,判断后端服务器的健康状态是否发生改变;
在后端服务器的健康状态发生改变的情况下,触发主动探测从而决定是否更新健康状态。结合触发主动探测,提升健康检查的准确性,又避免周期性探测导致的系统压力。
具体地,在所述目标特征数据更新的情况下,通过预设决策模型输出后端服务器的健康状态,判断后端服务器的健康状态是否发生改变包括:
获取当前负载均衡系统中的后端服务器的第一健康状态,如健康、不健康状态;
获取当前后端服务器的第二健康状态,如健康、不健康状态;
将所述第一健康状态与所述第二健康状态作对比,判断二者健康状态是否一致;
在二者健康状态不一致的情况下,则触发主动探测请求得到最终的健康检查结果。
S5:在当前业务请求失败次数大于预设阈值的情况下,更新后端服务器的健康状态完成对被动健康检查机制的启动;
为了提高了请求后续成功的概率,通过对请求处理失败的后端服务器进行调度权重的调整,如图7基于现有的被动健康检查流程做的流程改动,主要是增加了关键步骤:降低请求失败的RS的调度权重,从而使得该可能有问题的服务器尽可能小的概率被调度到。
S6:在当前业务请求失败的情况下,判断是否对当前请求处理失败的后端服务器进行调度权重的调整以控制在后端服务器出现问题时被调度的概率。具体步骤包括:
在当前业务请求失败次数大于预设阈值时,输出并更新后端服务器的健康状态为不健康;
在当前业务请求失败次数小于等于预设阈值时,继续进行后续的业务请求中显示后端服务器请求成功,则将对当前统计的失败次数归零;
判断是否对当前后端服务器进行调度权重的降低处理,在对降低处理后的后端服务器的调度权重进行恢复。
本领域技术人员可以理解,如果请求RS失败次数没有达到上限,并且在后续的请求中,请求该RS成功,则统计的失败次数变化成0,此时,判断是否为该RS进行权重的降低,如果是的话,恢复该权重。
可以看到,通过图6能够较为及时的感知到后端服务器的状态变化,同时无须引入周期性的主动健康检查,减轻因探测请求带来的服务器压力。
通过图7的流程,可以一定程度上避免请求的失败,因为通过降低可能有问题的后端服务器的调度权值,减少该服务器被调度的概率,也就降低了请求的失败率。
基本过程为:1,后端服务器服务相关数据收集,比如服务日志,系统状态,网卡丢包情况等。2,实时分析收集到的数据,从而判断状态改变的可能性,触发主动探测请求。3,处理业务请求过程中,一旦出现失败,则将该服务器状态的权重降低,减少下一个请求访问该服务器的概率。
相比于现有的被动健康检查机制,主要有两个优化点:1,通过对后端服务器的数据分析,能在一定概率上感知RS自身的健康状态,再通过主动探测请求进行确认。这种模式提高了准确性以及实时性。2,通过将请求失败的后端服务器权重降低的方式,使得后续请求尽可能地不被调度到这台可能有问题的服务器上,能够提升请求的效率。
实施例二
基于相同的构思,如图8所示,本发明提供了一种负载均衡中的被动健康检查装置,包括:
后端服务器,用于从负载均衡系统向后端服务器发送请求来获取后端服务器运行的状况;采集后端服务器的健康状态数据并上报至数据工厂,后端服务器的健康状态数据包括服务日志特征集、系统日志特征集及网卡状态特征集;
数据工厂,用于获取原始的服务日志、系统日志及网卡状态数据进行预处理,提取并输出目标特征数据;
负载均衡系统,用于将所述目标特征数据输入预设决策模型,判断后端服务器的健康状态是否发生改变,在后端服务器的健康状态发生改变的情况触发主动探测;在当前业务请求失败次数大于预设阈值的情况下,更新后端服务器的健康状态完成对被动健康检查机制的启动;在当前业务请求失败的情况下,判断是否对当前请求处理失败的后端服务器进行调度权重的调整以控制在后端服务器出现问题时被调度的概率。
本发明实施例整个架构基本过程为:1,后端服务器服务相关数据收集,比如服务日志,系统状态,网卡丢包情况等。2,实时分析收集到的数据,从而判断状态改变的可能性,触发主动探测请求。3,处理业务请求过程中,一旦出现失败,则将该服务器状态的权重降低,减少下一个请求访问该服务器的概率。整个架构主要分为三大部分:1,负载均衡器实现对后端服务器健康状态的更新。2,数据工厂实现对后端服务器数据的加工处理和分析。3,后端服务器进行数据采集。后端服务器、数据工厂、负载均衡系统的具体内容及实现方法,均如实施例一中所述,在此不再赘述。
实施例三
基于相同的构思,本发明所提供的一种电子设备,包括:
存储器,所述存储器用于存储处理程序;
处理器,所述处理器执行所述处理程序时实现如本发明实施例所述的负载均衡中的被动健康检查方法。
本发明所提供的一种可读存储介质,所述可读存储介质上存储有处理程序,所述处理程序被处理器执行时实现如本发明实施例所述的负载均衡中的被动健康检查方法。
该一种负载均衡中的被动健康检查设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)和存储器,一个或一个以上存储应用程序或数据的存储介质(例如一个或一个以上海量存储设备)。其中,存储器和存储介质可以是短暂存储或持久存储。存储在存储介质的程序可以包括一个或一个以上模块,每个模块可以包括对一种负载均衡中的被动健康检查设备中的一系列指令操作。
进一步地,处理器可以设置为与存储介质通信,在负载均衡中的被动健康检查的设备上执行存储介质中的一系列指令操作。
一种负载均衡中的被动健康检查设备还可以包括一个或一个以上电源,一个或一个以上有线或无线网络接口,一个或一个以上输入输出接口,和/或,一个或一个以上操作系统,例如Windows Serve、Vista等等。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被一个或多个处理器执行时,实现如本发明实施例一中的负载均衡中的被动健康检查方法。实施例二中的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件的形式体现出来,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质。该计算机可读存储介质中存储有指令,当该指令在计算机上运行时,使得计算机执行实施例一中负载均衡中的被动健康检查的步骤。
本领域技术人员可以理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件的形式体现出来,该计算机软件存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器ROM、随机存取存储器RAM、磁碟或者光盘等各种可以存储程序代码的介质。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种负载均衡中的被动健康检查方法,其特征在于,包括:
从负载均衡系统向后端服务器发送请求来获取后端服务器运行的状况;
采集后端服务器的健康状态数据并上报至数据工厂,后端服务器的健康状态数据包括服务日志特征集、系统日志特征集及网卡状态特征集;
获取后端服务器的健康状态数据进行预处理,提取并输出目标特征数据;
将所述目标特征数据输入预设决策模型,判断后端服务器的健康状态是否发生改变,在后端服务器的健康状态发生改变的情况触发主动探测;
在当前主动探测业务请求连接后端服务器失败次数大于预设阈值的情况下,更新后端服务器的健康状态启动被动健康检查机制;
在当前主动探测业务请求连接后端服务器失败的情况下,判断是否对当前请求处理失败的后端服务器进行调度权重的调整以控制在后端服务器出现问题时被调度的概率。
2.如权利要求1所述的负载均衡中的被动健康检查方法,其特征在于,所述提取并输出目标特征数据包括:
获取当前后端服务器的健康状态数据上报至数据工厂;
在数据工厂中进行获取到的后端服务器的健康状态数据的存储及加工处理,通过自然语言处理算法将不同格式的若干健康状态数据进行有效数据的提取,推导出相应的目标特征数据并进行提取及存储。
3.如权利要求1所述的负载均衡中的被动健康检查方法,其特征在于,所述服务日志特征集包括异步请求队列长度以及请求入队的速率、请求处理的速率,服务端/客户端错误以及错误发生次数、错误发生时间点,所述系统日志特征集包括当前系统状态、CPU 利用率、磁盘使用率、内存使用率、负载情况、错误日志统计、error次数、Critical次数、Alert次数和Emerg次数,所述网卡状态特征集包括网卡名称、网卡的队列长度、网卡的丢包率和网卡带宽使用情况。
4.如权利要求1所述的负载均衡中的被动健康检查方法,其特征在于,所述将所述目标特征数据输入预设决策模型,判断后端服务器的健康状态是否发生改变,在后端服务器的健康状态发生改变的情况触发主动探测包括:
获取当前所述目标特征数据,判断后端服务器的所述目标特征数据是否更新;
在所述目标特征数据更新的情况下,通过预设决策模型输出后端服务器的健康状态,判断后端服务器的健康状态是否发生改变;
在后端服务器的健康状态发生改变的情况下,触发主动探测从而决定是否更新健康状态。
5.如权利要求4所述的负载均衡中的被动健康检查方法,其特征在于,在所述目标特征数据更新的情况下,通过预设决策模型输出后端服务器的健康状态,判断后端服务器的健康状态是否发生改变包括:
获取当前负载均衡系统中的后端服务器的第一健康状态;
获取当前后端服务器的第二健康状态;
将所述第一健康状态与所述第二健康状态作对比,判断二者健康状态是否一致;
在二者健康状态不一致的情况下,则触发主动探测请求得到最终的健康检查结果。
6.如权利要求1所述的负载均衡中的被动健康检查方法,其特征在于,所述在当前业务请求失败的情况下,判断是否对当前请求处理失败的后端服务器进行调度权重的调整以控制在后端服务器出现问题时被调度的概率包括:
在当前业务请求失败次数大于预设阈值时,输出并更新后端服务器的健康状态为不健康;
在当前业务请求失败次数小于等于预设阈值时,继续进行后续的业务请求中显示后端服务器请求成功,则将对当前统计的失败次数归零;
判断是否是对该后端服务器进行的调度权重的降低处理操作,若是针对该后端服务器执行降低处理操作时,则对该后端服务器的调度权重进行恢复。
7.如权利要求1所述的负载均衡中的被动健康检查方法,其特征在于,所述提取并输出目标特征数据进一步包括:从负载均衡系统向数据工厂对感兴趣的后端服务器目标特征数据进行监听以监控后端服务器的状态。
8.一种负载均衡中的被动健康检查装置,其特征在于,包括:
后端服务器,用于接收负载均衡系统发送的获取后端服务器运行的状况的请求;采集后端服务器的健康状态数据并上报至数据工厂,后端服务器的健康状态数据包括服务日志特征集、系统日志特征集及网卡状态特征集;
数据工厂,用于获取后端服务器的健康状态数据进行预处理,提取并输出目标特征数据;
负载均衡系统,用于向后端服务器发送请求获取后端服务器运行的状况,将所述目标特征数据输入预设决策模型,判断后端服务器的健康状态是否发生改变,在后端服务器的健康状态发生改变的情况触发主动探测;在当前主动探测业务请求连接后端服务器失败次数大于预设阈值的情况下,更新后端服务器的健康状态启动被动健康检查机制;在当前主动探测业务请求连接后端服务器失败的情况下,判断是否对当前请求处理失败的后端服务器进行调度权重的调整以控制在后端服务器出现问题时被调度的概率。
9.一种电子设备,其特征在于,包括:
存储器,所述存储器用于存储处理程序;
处理器,所述处理器执行所述处理程序时实现如权利要求1至7中任意一项所述的负载均衡中的被动健康检查方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有处理程序,所述处理程序被处理器执行时实现如权利要求1至7中任意一项所述的负载均衡中的被动健康检查方法。
CN202310955555.0A 2023-08-01 2023-08-01 负载均衡中的被动健康检查方法、装置、设备及介质 Active CN116800636B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310955555.0A CN116800636B (zh) 2023-08-01 2023-08-01 负载均衡中的被动健康检查方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310955555.0A CN116800636B (zh) 2023-08-01 2023-08-01 负载均衡中的被动健康检查方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN116800636A CN116800636A (zh) 2023-09-22
CN116800636B true CN116800636B (zh) 2024-01-23

Family

ID=88036520

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310955555.0A Active CN116800636B (zh) 2023-08-01 2023-08-01 负载均衡中的被动健康检查方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN116800636B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107181636A (zh) * 2016-03-10 2017-09-19 阿里巴巴集团控股有限公司 一种负载均衡系统中的健康检查方法及装置
CN110311988A (zh) * 2019-07-30 2019-10-08 中国工商银行股份有限公司 后端服务器的健康检查方法、负载均衡方法及装置
CN113824768A (zh) * 2021-08-23 2021-12-21 北京天融信网络安全技术有限公司 负载均衡系统中的健康检查方法及装置和流量转发方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8086596B2 (en) * 2008-05-15 2011-12-27 International Business Machines Corporation Healthcheck of information technology infrastructure based on log data

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107181636A (zh) * 2016-03-10 2017-09-19 阿里巴巴集团控股有限公司 一种负载均衡系统中的健康检查方法及装置
CN110311988A (zh) * 2019-07-30 2019-10-08 中国工商银行股份有限公司 后端服务器的健康检查方法、负载均衡方法及装置
CN113824768A (zh) * 2021-08-23 2021-12-21 北京天融信网络安全技术有限公司 负载均衡系统中的健康检查方法及装置和流量转发方法

Also Published As

Publication number Publication date
CN116800636A (zh) 2023-09-22

Similar Documents

Publication Publication Date Title
EP3335120B1 (en) Method and system for resource scheduling
CN110971444B (zh) 告警管理方法、装置、服务器及存储介质
EP2301197B1 (en) Message management and suppression in a monitoring system
US20150026337A1 (en) Techniques for web server management
CN116433009A (zh) 一种用于变电设备的异常监测方法、装置及存储介质
CN107643983B (zh) 一种测试数据处理方法及系统
US10091110B2 (en) Edge-based load shedding system for fast data analysis and operating method thereof
CN110830289A (zh) 一种容器异常监测方法及监测系统
EP1907934A2 (en) System and method for adaptively collecting performance and event information
CN107766208B (zh) 一种监控业务系统的方法、系统及装置
CN107426033B (zh) 一种对物联网接入终端进行状态预测的方法和装置
CN111416836A (zh) 基于Nginx的服务器维护方法、装置、计算机设备及存储介质
CN116089213A (zh) 云平台资源监控方法、装置、电子设备及可读存储介质
CN110389840B (zh) 负载消耗预警方法、装置、计算机设备和存储介质
CN116800636B (zh) 负载均衡中的被动健康检查方法、装置、设备及介质
CN113238917B (zh) 前端性能监控方法、装置、设备及存储介质
CN110011845B (zh) 日志采集方法及系统
CN111258854B (zh) 模型训练方法、基于预测模型的报警方法和相关装置
CN110460487B (zh) 服务节点的监控方法及系统、服务节点
CN109995834A (zh) 大流量数据处理方法、装置、计算设备及存储介质
CN110069382B (zh) 软件监控方法、服务器、终端设备、计算机设备及介质
CN111258870A (zh) 分布式存储系统的性能分析方法、装置、设备及存储介质
CN114640567A (zh) Apache日志的分析方法及装置
CN111611131B (zh) 基于Saltstack的运维方法、装置、系统及存储介质
CN109889602B (zh) 资源采集频率调整方法、装置、系统和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: 8b, building 1, No. 48, Zhichun Road, Haidian District, Beijing 100098

Patentee after: Beijing Zhiling Haina Technology Co.,Ltd.

Country or region after: China

Address before: 8b, building 1, No. 48, Zhichun Road, Haidian District, Beijing 100098

Patentee before: Beijing zhilinghaina Technology Co.,Ltd.

Country or region before: China

CP03 Change of name, title or address