CN113312234A - 一种健康检测的优化方法及终端 - Google Patents

一种健康检测的优化方法及终端 Download PDF

Info

Publication number
CN113312234A
CN113312234A CN202110537971.XA CN202110537971A CN113312234A CN 113312234 A CN113312234 A CN 113312234A CN 202110537971 A CN202110537971 A CN 202110537971A CN 113312234 A CN113312234 A CN 113312234A
Authority
CN
China
Prior art keywords
health
node
detection
detected
health degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110537971.XA
Other languages
English (en)
Other versions
CN113312234B (zh
Inventor
刘德建
林伟
陈宏�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujian Tianquan Educational Technology Ltd
Original Assignee
Fujian Tianquan Educational Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujian Tianquan Educational Technology Ltd filed Critical Fujian Tianquan Educational Technology Ltd
Priority to CN202110537971.XA priority Critical patent/CN113312234B/zh
Publication of CN113312234A publication Critical patent/CN113312234A/zh
Application granted granted Critical
Publication of CN113312234B publication Critical patent/CN113312234B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3037Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3041Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is an input/output interface
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开一种健康检测的优化方法及终端,设置健康检测集群,所述健康检测集群包括一个以上的健康检测节点;接收健康度规则,包括每一个应用节点所对应的健康度检测属性及健康度阈值;根据健康度检测方式通过健康检测节点对待检测的应用节点进行健康检测得到节点健康度,并判断节点健康度是否大于待检测的应用节点所对应的健康度阈值,若否,则断开待检测的应用节点的对外服务;本发明针对每个应用节点定制的健康度检测方式和健康度阈值实现对每一应用节点的个性化配置,针对性高,通过健康检测集群提高健康检测数据的承载量,能够接收并处理更大量的应用节点健康数据,从而能够实现对应用全面的健康检测。

Description

一种健康检测的优化方法及终端
技术领域
本发明涉及分布式系统领域,尤其涉及一种健康检测的优化方法及终端。
背景技术
现在很多服务端系统都是采用分布式进行部署的。当客户端向服务端发起请求,请求到达服务端时,一般都是首先到达Nginx这样的反向代理服务器,再由Nginx通过一定的策略分配将请求流量转发到后端的任意一台应用上,由应用进行请求处理,并且返回数据给客户端。这样的架构方式能够横向地动态扩容应用数量,从而能够极大的增大服务端处理请求的吞吐量。不过,随着应用的增加,反向代理服务器也将需要对增加的扩容应用进行健康检测,现有技术中实现对应用的健康检测需要由反向代理服务器向其接入的应用定时发送心跳包,当需检测的应用达到一定的数量,将会对反向代理服务器的性能带来一些不利的影响;并且,健康检测将会占用不少的资源。同时,通用的反向代理服务器对于接入的应用只进行一般的可用性检测,如存在某些应用僵死,响应慢或者其他非无法使用的问题(即应用可以正常使用,但是效率低下的情况)则无法进行有效的控制。
发明内容
本发明所要解决的技术问题是:提供一种健康检测的优化方法及终端,实现对应用全面的健康检测。
为了解决上述技术问题,本发明采用的一种技术方案为:
一种健康检测的优化方法,包括步骤:
S1、设置健康检测集群,所述健康检测集群包括一个以上的健康检测节点;
S2、接收健康度规则,所述健康度规则包括每一个应用节点所对应的健康度检测方式及健康度阈值;
S3、根据所述健康度检测方式通过所述健康检测节点对待检测的应用节点进行健康检测得到节点健康度,并判断所述节点健康度是否大于所述待检测的应用节点所对应的健康度阈值,若否,则断开所述待检测的应用节点的对外服务。
为了解决上述技术问题,本发明采用的另一种技术方案为:
一种健康检测的优化终端,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
S1、设置健康检测集群,所述健康检测集群包括一个以上的健康检测节点;
S2、接收健康度规则,所述健康度规则包括每一个应用节点所对应的健康度检测方式及健康度阈值;
S3、根据所述健康度检测方式通过所述健康检测节点对待检测的应用节点进行健康检测得到节点健康度,并判断所述节点健康度是否大于所述待检测的应用节点所对应的健康度阈值,若否,则断开所述待检测的应用节点的对外服务。
本发明的有益效果在于:设置包括多个健康检测节点的健康检测集群,由健康检测集群专门负责对应用节点的健康度检测,并且根据所接受的健康度规则对应用节点进行健康度检测,若应用节点的数量较多,健康检测集群由健康检测节点组成,则通过增加健康检测节点的数量可以对健康检测集群进行横向扩展即并入新的健康检测节点分担压力,能够处理更大的数据量,支撑对应用节点各项不同指标的健康度检测,针对每个应用节点定制的健康度检测方式和健康度阈值实现对每一应用节点的个性化配置,针对性高,通过健康检测集群提高健康检测数据的承载量,能够接收并处理更大量的应用节点健康数据,从而能够实现对应用全面的健康检测,及时断开应用节点的对外服务避免请求堵塞。
附图说明
图1为本发明实施例的一种健康检测的优化方法的步骤流程图;
图2为本发明实施例的一种健康检测的优化终端的结构示意图;
标号说明:
1、一种健康检测的优化终端;2、处理器;3、存储器。
具体实施方式
为详细说明本发明的技术内容、所实现目的及效果,以下结合实施方式并配合附图予以说明。
请参照图1,一种健康检测的优化方法,包括步骤:
S1、设置健康检测集群,所述健康检测集群包括一个以上的健康检测节点;
S2、接收健康度规则,所述健康度规则包括每一个应用节点所对应的健康度检测方式及健康度阈值;
S3、根据所述健康度检测方式通过所述健康检测节点对待检测的应用节点进行健康检测得到节点健康度,并判断所述节点健康度是否大于所述待检测的应用节点所对应的健康度阈值,若否,则断开所述待检测的应用节点的对外服务。
从上述描述可知,本发明的有益效果在于:设置包括多个健康检测节点的健康检测集群,由健康检测集群专门负责对应用节点的健康度检测,并且根据所接受的健康度规则对应用节点进行健康度检测,若应用节点的数量较多,健康检测集群由健康检测节点组成,则通过增加健康检测节点的数量可以对健康检测集群进行横向扩展即并入新的健康检测节点分担压力,能够处理更大的数据量,支撑对应用节点各项不同指标的健康度检测,针对每个应用节点定制的健康度检测方式和健康度阈值实现对每一应用节点的个性化配置,针对性高,通过健康检测集群提高健康检测数据的承载量,能够接收并处理更大量的应用节点健康数据,从而能够实现对应用全面的健康检测,及时断开应用节点的对外服务避免请求堵塞。
进一步地,所述S1中:
每一所述健康检测节点对应一个以上的所述应用节点;
每一所述健康检测节点包括主节点及备节点;
所述S3中所述根据所述健康度检测方式通过所述健康检测节点对待检测的应用节点进行健康检测具体为:
根据所述健康度检测方式通过所述主节点对所述待检测的应用节点进行健康检测,若检测失败,则切换所述备节点对所述待检测的应用节点进行健康检测。
由上述描述可知,对于每一个健康检测节点,都设置有主节点和备节点,若主节点出现故障能够在切换到备节点继续进行健康检测,提高了健康检测集群的稳定性。
进一步地,所述健康度检测属性包括所述应用节点所对应的接口地址、请求参数及接口响应时间上限;
所述S3具体为:
S31、根据所述接口地址及所述请求参数对所述待检测的应用节点进行健康度检测,得到接口响应结果;
S32、若所述接口响应结果为失败,从预设健康度中扣除第一健康度;
若所述接口响应结果为成功,获取接口响应时间,判断所述接口响应时间是否大于所述接口响应时间上限,若是,则从所述预设健康度中扣除第二健康度,否则,在所述预设健康度上加上第三健康度;
S33、重复所述S31及所述S32,直至所述健康度检测方式中的所有所述接口地址都检测完毕,得到节点健康度;
S34、判断所述节点健康度是否大于所述待检测的应用节点所对应的所述健康度阈值,若否,则断开所述待检测的应用节点的对外服务。
由上述描述可知,接收健康度规则后,根据其中的健康度检测属性对应用节点进行健康度检测,可根据不同应用节点的实际需要配置不同的接口地址、请求参数及接口响应时间上限,对应用节点中不同业务所对应的接口设置不同的评判标准,使得最终所得到的健康度更加能够反应应用节点的实际健康情况。
进一步地,所述健康度检测属性包括所述应用节点所对应的关键接口列表,所述关键接口列表中包括关键接口地址及关键接口请求参数;
所述S3还包括:
根据所述关键接口地址及所述关键接口请求参数对所述待检测的应用节点进行健康度检测,得到关键接口响应结果;
若所述关键接口响应结果为失败,则断开所述待检测的应用节点的对外服务。
由上述描述可知,应用节点中存在对外提供服务的关键接口,若关键接口出现问题,相较于其余接口出现问题会对应用节点的对外服务造成更大的影响,对此设置关键接口,若关键接口响应失败则马上断开应用节点的对外服务,便于后续进行故障排查等操作,避免了大量请求的堵塞。
进一步地,所述S2还包括:
将所述健康度规则保存在所述健康检测节点的内存中;
接收更新信息,根据所述更新信息更新所述内存中的所述健康度规则。
由上述描述可知,将健康度规则保存在健康检测节点的内存中,从内存中直接获取数据提高了进行健康检测的效率,并且还能够根据接收到的更新信息对健康度规则进行更新,若应用节点的业务发生改变或对健康度的要求提高,都能够方便地更新对应的健康度规则,及时适应应用节点的改变。
请参照图2,一种健康检测的优化终端,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
S1、设置健康检测集群,所述健康检测集群包括一个以上的健康检测节点;
S2、接收健康度规则,所述健康度规则包括每一个应用节点所对应的健康度检测方式及健康度阈值;
S3、根据所述健康度检测方式通过所述健康检测节点对待检测的应用节点进行健康检测得到节点健康度,并判断所述节点健康度是否大于所述待检测的应用节点所对应的健康度阈值,若否,则断开所述待检测的应用节点的对外服务。
本发明的有益效果在于:设置包括多个健康检测节点的健康检测集群,由健康检测集群专门负责对应用节点的健康度检测,并且根据所接受的健康度规则对应用节点进行健康度检测,若应用节点的数量较多,健康检测集群由健康检测节点组成,则通过增加健康检测节点的数量可以对健康检测集群进行横向扩展即并入新的健康检测节点分担压力,能够处理更大的数据量,支撑对应用节点各项不同指标的健康度检测,针对每个应用节点定制的健康度检测方式和健康度阈值实现对每一应用节点的个性化配置,针对性高,通过健康检测集群提高健康检测数据的承载量,能够接收并处理更大量的应用节点健康数据,从而能够实现对应用全面的健康检测,及时断开应用节点的对外服务避免请求堵塞。
进一步地,所述S1中:
每一所述健康检测节点对应一个以上的所述应用节点;
每一所述健康检测节点包括主节点及备节点;
所述S3中所述根据所述健康度检测方式通过所述健康检测节点对待检测的应用节点进行健康检测具体为:
根据所述健康度检测方式通过所述主节点对所述待检测的应用节点进行健康检测,若检测失败,则切换所述备节点对所述待检测的应用节点进行健康检测。
由上述描述可知,对于每一个健康检测节点,都设置有主节点和备节点,若主节点出现故障能够在切换到备节点继续进行健康检测,提高了健康检测集群的稳定性。
进一步地,所述健康度检测属性包括所述应用节点所对应的接口地址、请求参数及接口响应时间上限;
所述S3具体为:
S31、根据所述接口地址及所述请求参数对所述待检测的应用节点进行健康度检测,得到接口响应结果;
S32、若所述接口响应结果为失败,从预设健康度中扣除第一健康度;
若所述接口响应结果为成功,获取接口响应时间,判断所述接口响应时间是否大于所述接口响应时间上限,若是,则从所述预设健康度中扣除第二健康度,否则,在所述预设健康度上加上第三健康度;
S33、重复所述S31及所述S32,直至所述健康度检测方式中的所有所述接口地址都检测完毕,得到节点健康度;
S34、判断所述节点健康度是否大于所述待检测的应用节点所对应的所述健康度阈值,若否,则断开所述待检测的应用节点的对外服务。
由上述描述可知,接收健康度规则后,根据其中的健康度检测属性对应用节点进行健康度检测,可根据不同应用节点的实际需要配置不同的接口地址、请求参数及接口响应时间上限,对应用节点中不同业务所对应的接口设置不同的评判标准,使得最终所得到的健康度更加能够反应应用节点的实际健康情况。
进一步地,所述健康度检测属性包括所述应用节点所对应的关键接口列表,所述关键接口列表中包括关键接口地址及关键接口请求参数;
所述S3还包括:
根据所述关键接口地址及所述关键接口请求参数对所述待检测的应用节点进行健康度检测,得到关键接口响应结果;
若所述关键接口响应结果为失败,则断开所述待检测的应用节点的对外服务。
由上述描述可知,应用节点中存在对外提供服务的关键接口,若关键接口出现问题,相较于其余接口出现问题会对应用节点的对外服务造成更大的影响,对此设置关键接口,若关键接口响应失败则马上断开应用节点的对外服务,便于后续进行故障排查等操作,避免了大量请求的堵塞。
进一步地,所述S2还包括:
将所述健康度规则保存在所述健康检测节点的内存中;
接收更新信息,根据所述更新信息更新所述内存中的所述健康度规则。
由上述描述可知,将健康度规则保存在健康检测节点的内存中,从内存中直接获取数据提高了进行健康检测的效率,并且还能够根据接收到的更新信息对健康度规则进行更新,若应用节点的业务发生改变或对健康度的要求提高,都能够方便地更新对应的健康度规则,及时适应应用节点的改变。
请参照图1,本发明的实施例一为:
一种健康检测的优化方法,包括步骤:
S1、设置健康检测集群,所述健康检测集群包括一个以上的健康检测节点;
S1中,每一所述健康检测节点对应一个以上的应用节点;
每一所述健康检测节点包括主节点及备节点;
在一种可选的实施方式中,应用节点均接入反向代理服务器;
S2、接收健康度规则,所述健康度规则包括每一个应用节点所对应的健康度检测属性及健康度阈值;
健康检测节点将健康度规则保存在内存中;
在一种可选的实施方式中,健康检测节点可将其对应的应用节点的健康度规则保存在内存中,或将所有健康度规则保存在内存中;只保存对应的应用节点的健康度规则能够节约内存,直接保存所有的健康度规则无需根据不同的应用节点对健康度规则进行拆分,加快了配置的效率;
S3、根据所述健康度检测方式通过所述健康检测节点对待检测的应用节点进行健康检测得到节点健康度,并判断所述节点健康度是否大于所述待检测的应用节点所对应的健康度阈值,若否,则断开所述待检测的应用节点的对外服务;
其中,所述根据所述健康度检测方式通过所述健康检测节点对待检测的应用节点进行健康检测具体为:
根据所述健康度检测方式通过所述主节点对所述待检测的应用节点进行健康检测,若检测失败,则切换所述备节点对所述待检测的应用节点进行健康检测;
在一种可选的实施方式中,在预设时间段内以预设频率根据所述健康度检测方式通过所述健康检测节点对待检测的应用节点进行健康检测,得到预设时间段内的节点健康度。
本发明的实施例二为:
一种健康检测的优化方法,其与实施例一的不同之处在于:
S2中,健康度检测属性包括应用节点所对应的接口地址、请求参数、接口响应时间上限及关键接口列表,关键接口列表中包括关键接口地址、关键接口请求参数及关键接口响应时间上限;
S3具体为:
每间隔预设周期通过健康检测节点向应用节点发送心跳检测包,若连续三个周期都未接收到应用节点的应答消息,则输出应用节点可用性异常消息,否则,执行S31;
S31、根据所述接口地址及所述请求参数对所述待检测的应用节点进行健康度检测,得到接口响应结果;
S32、若所述接口响应结果为失败,从预设健康度中扣除第一健康度;
若所述接口响应结果为成功,获取接口响应时间,判断所述接口响应时间是否大于所述接口响应时间上限,若是,则从所述预设健康度中扣除第二健康度,否则,在所述预设健康度上加上第三健康度;
S33、重复所述S31及所述S32,直至所述健康度检测方式中的所有所述接口地址都检测完毕,得到节点健康度;
S34、判断所述节点健康度是否大于所述待检测的应用节点所对应的所述健康度阈值,若否,则断开所述待检测的应用节点的对外服务并发送预警信息至操作员,其中,断开待检测的应用节点的对外服务具体为:上传所有节点健康度大于所对应的健康度阈值的应用节点的节点信息至Redis缓存并覆盖原有的节点信息记录,以供代理服务器读取确定分流的目标应用节点;或,从原有的节点信息记录中删除所有节点健康度小于所对应的健康度阈值的应用节点的节点信息,并添加原有的节点信息记录中不存在的所有节点健康度大于所对应的健康度阈值的应用节点的节点信息;
S3还包括:
根据所述关键接口地址及所述关键接口请求参数对所述应用节点进行健康度检测,得到关键接口响应结果;
若所述关键接口响应结果为失败,则断开所述待检测的应用节点的对外服务并不再执行S31-S34,或,从所述预设健康度中扣除第四健康度并执行S31-S34,此时可同时执行S31-S34也可分别执行,对此不做限制;
若所述关键接口响应结果为成功,获取关键接口响应时间,在上传所有节点健康度大于所对应的健康度阈值的应用节点的节点信息的同时上传对应的关键接口响应时间,以供代理服务器根据关键接口响应时间调整目标应用节点的分流比例;
若所述关键接口响应结果为成功,获取关键接口响应时间,判断所述接口响应时间是否大于关键接口响应时间上限,若是,则从所述预设健康度中扣除第五健康度;
例如,存在a、b及c三个应用节点对同一应用提供服务,a、b及c三个应用节点中同一功能的关键接口的关键接口响应时间分别为1秒、2秒及3秒,则代理服务器接收到客户端的请求之后分流到a、b及c的分流比例为6:3:2;
在一种可选的实施方式中,根据关键接口响应时间确定的分流比例可计算后直接存储在Redis缓存中。
本发明的实施例三为:
将上述的一种健康检测的优化方法应用于实际场景中:
假设存在一个Nginx集群,存在一个Redis集群,存在一个健康检测集群(此集群中存在4个实例即4个健康检测节点check1到check4),存在10个业务实例分别对应10个应用节点(busi1到busi10);应用节点中均包括登录接口(A接口)、获取用户信息接口(B接口)及令牌校验接口(C接口),且都为关键接口,正常情况下,A接口的响应时间为1秒,B接口的响应时间为0.5秒,C接口的响应时间为0.1秒;
A1、设置健康检测节点与应用节点的对应关系:check1对应busi1到busi5,check3对应busi6到busi10;且配置check1为主节点,check2为check1的备节点,check3为主节点,check4为check3的备节点;
A2、每间隔预设周期,通过check1和check3分别向busi1-busi10发送心跳检测包,若连续3个周期都未接收到某一应用节点的应答消息,输出该应用节点可用性异常消息,否则,执行A3;
A3、接收健康度规则,所述健康度规则包括每一个应用节点所对应的健康度检测属性及健康度阈值;check1到check4都将健康度规则保存在内存中;
每间隔第一预设时间段,根据健康度规则通过健康检测节点对应用节点进行健康检测,并将所有节点健康度大于所对应的健康度阈值的应用节点的节点信息至Redis集群并覆盖原有的节点信息记录;
每间隔第二预设时间段,反向代理服务器Nginx从Redis集群中查询节点信息并保存在内存中,若Nginx接收到客户端的请求,则根据内存中的节点信息进行分流操作;
在本实施例中,S3包括:
所接收的健康度规则中的健康度检测属性包括应用节点所对应的关键接口列表(A接口、B接口、C接口),关键接口列表中包括关键接口地址、关键接口请求参数及关键接口响应时间上限(A接口:1秒、B接口:0.5秒、C接口:0.1秒),健康度阈值为0;
预设在30秒内,对同一个应用节点分别访问A接口、B接口及C接口10次,预设健康度都为30,若接口调用失败,则该接口对应的健康度在现有健康度的基础上减去10,若接口调用成功但调用时间超过关键接口响应时间上限,则接口对应的健康度在现有健康度的基础上减去1,若30秒后最终得到的节点健康度小于0,则停止该应用节点的对外服务。
请参照图2,本发明的实施例四为:
一种健康检测的优化终端1,包括处理器2、存储器3及存储在存储器3上并可在所述处理器2上运行的计算机程序,所述处理器2执行所述计算机程序时实现实施例一、实施例二或实施例三中的各个步骤。
综上所述,本发明提供了一种健康检测的优化方法及终端,由一个以上的健康检测节点组成健康检测集群替代现有的Nginx等反向代理服务器自带的健康检测系统,并且保存健康度规则在健康检测节点的内存中,健康度规则包括健康度检测属性及健康度阈值,健康检测节点根据健康度规则在预设时间段内以预设频率对其对应的应用节点进行健康检测得到应用节点在预设时间段内的的节点健康度,若节点健康度小于该应用节点对应的健康度阈值则断开该应用节点的对外服务,由健康检测节点组成的健康检测集群能够通过添加新健康检测节点的方式进行扩展,实现更大数据量的处理,健康度规则具体到对接口的的自由配置,不仅仅能够测试应用节点是否能够正常访问,还可以针对不同节点上不同的业务实例进行针对性的健康度限制,检测出应用节点中接口的僵死、慢响应等问题,配合不同的业务需求做出不同的健康度规则,且专门的健康检测节点相较于反向代理服务器中自带的健康检测能够处理更大的数据量,即能够处理应用节点多角度获取到的健康数据,从而能够支撑对应用节点全面的健康检测。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种健康检测的优化方法,其特征在于,包括步骤:
S1、设置健康检测集群,所述健康检测集群包括一个以上的健康检测节点;
S2、接收健康度规则,所述健康度规则包括每一个应用节点所对应的健康度检测属性及健康度阈值;
S3、根据所述健康度检测方式通过所述健康检测节点对待检测的应用节点进行健康检测得到节点健康度,并判断所述节点健康度是否大于所述待检测的应用节点所对应的健康度阈值,若否,则断开所述待检测的应用节点的对外服务。
2.根据权利要求1所述的一种健康检测的优化方法,其特征在于,所述S1中:
每一所述健康检测节点对应一个以上的所述应用节点;
每一所述健康检测节点包括主节点及备节点;
所述S3中所述根据所述健康度检测方式通过所述健康检测节点对待检测的应用节点进行健康检测具体为:
根据所述健康度检测方式通过所述主节点对所述待检测的应用节点进行健康检测,若检测失败,则切换所述备节点对所述待检测的应用节点进行健康检测。
3.根据权利要求1所述的一种健康检测的优化方法,其特征在于,所述健康度检测属性包括所述应用节点所对应的接口地址、请求参数及接口响应时间上限;
所述S3具体为:
S31、根据所述接口地址及所述请求参数对所述待检测的应用节点进行健康度检测,得到接口响应结果;
S32、若所述接口响应结果为失败,从预设健康度中扣除第一健康度;
若所述接口响应结果为成功,获取接口响应时间,判断所述接口响应时间是否大于所述接口响应时间上限,若是,则从所述预设健康度中扣除第二健康度,否则,在所述预设健康度上加上第三健康度;
S33、重复所述S31及所述S32,直至所述健康度检测方式中的所有所述接口地址都检测完毕,得到节点健康度;
S34、判断所述节点健康度是否大于所述待检测的应用节点所对应的所述健康度阈值,若否,则断开所述待检测的应用节点的对外服务。
4.根据权利要求1所述的一种健康检测的优化方法,其特征在于,所述健康度检测属性包括所述应用节点所对应的关键接口列表,所述关键接口列表中包括关键接口地址及关键接口请求参数;
所述S3还包括:
根据所述关键接口地址及所述关键接口请求参数对所述待检测的应用节点进行健康度检测,得到关键接口响应结果;
若所述关键接口响应结果为失败,则断开所述待检测的应用节点的对外服务。
5.根据权利要求1所述的一种健康检测的优化方法,其特征在于,所述S2还包括:
将所述健康度规则保存在所述健康检测节点的内存中;
接收更新信息,根据所述更新信息更新所述内存中的所述健康度规则。
6.一种健康检测的优化终端,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现以下步骤:
S1、设置健康检测集群,所述健康检测集群包括一个以上的健康检测节点;
S2、接收健康度规则,所述健康度规则包括每一个应用节点所对应的健康度检测属性及健康度阈值;
S3、根据所述健康度检测方式通过所述健康检测节点对待检测的应用节点进行健康检测得到节点健康度,并判断所述节点健康度是否大于所述待检测的应用节点所对应的健康度阈值,若否,则断开所述待检测的应用节点的对外服务。
7.根据权利要求6所述的一种健康检测的优化终端,其特征在于,所述S1中:
每一所述健康检测节点对应一个以上的所述应用节点;
每一所述健康检测节点包括主节点及备节点;
所述S3中所述根据所述健康度检测方式通过所述健康检测节点对待检测的应用节点进行健康检测具体为:
根据所述健康度检测方式通过所述主节点对所述待检测的应用节点进行健康检测,若检测失败,则切换所述备节点对所述待检测的应用节点进行健康检测。
8.根据权利要求6所述的一种健康检测的优化终端,其特征在于,所述健康度检测属性包括所述应用节点所对应的接口地址、请求参数及接口响应时间上限;
所述S3具体为:
S31、根据所述接口地址及所述请求参数对所述待检测的应用节点进行健康度检测,得到接口响应结果;
S32、若所述接口响应结果为失败,从预设健康度中扣除第一健康度;
若所述接口响应结果为成功,获取接口响应时间,判断所述接口响应时间是否大于所述接口响应时间上限,若是,则从所述预设健康度中扣除第二健康度,否则,在所述预设健康度上加上第三健康度;
S33、重复所述S31及所述S32,直至所述健康度检测方式中的所有所述接口地址都检测完毕,得到节点健康度;
S34、判断所述节点健康度是否大于所述待检测的应用节点所对应的所述健康度阈值,若否,则断开所述待检测的应用节点的对外服务。
9.根据权利要求6所述的一种健康检测的优化终端,其特征在于,所述健康度检测属性包括所述应用节点所对应的关键接口列表,所述关键接口列表中包括关键接口地址及关键接口请求参数;
所述S3还包括:
根据所述关键接口地址及所述关键接口请求参数对所述待检测的应用节点进行健康度检测,得到关键接口响应结果;
若所述关键接口响应结果为失败,则断开所述待检测的应用节点的对外服务。
10.根据权利要求6所述的一种健康检测的优化终端,其特征在于,所述S2还包括:
将所述健康度规则保存在所述健康检测节点的内存中;
接收更新信息,根据所述更新信息更新所述内存中的所述健康度规则。
CN202110537971.XA 2021-05-18 2021-05-18 一种健康检测的优化方法及终端 Active CN113312234B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110537971.XA CN113312234B (zh) 2021-05-18 2021-05-18 一种健康检测的优化方法及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110537971.XA CN113312234B (zh) 2021-05-18 2021-05-18 一种健康检测的优化方法及终端

Publications (2)

Publication Number Publication Date
CN113312234A true CN113312234A (zh) 2021-08-27
CN113312234B CN113312234B (zh) 2022-07-26

Family

ID=77373570

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110537971.XA Active CN113312234B (zh) 2021-05-18 2021-05-18 一种健康检测的优化方法及终端

Country Status (1)

Country Link
CN (1) CN113312234B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117891696A (zh) * 2024-03-15 2024-04-16 天津医康互联科技有限公司 计算资源调整方法、装置、电子设备和可读存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170115978A1 (en) * 2015-10-26 2017-04-27 Microsoft Technology Licensing, Llc Monitored upgrades using health information
CN111404759A (zh) * 2020-04-17 2020-07-10 腾讯科技(深圳)有限公司 服务检测方法、规则配置方法、相关设备及介质
CN111651329A (zh) * 2020-06-08 2020-09-11 中国工商银行股份有限公司 针对应用的健康检查方法和装置、计算机系统和存储介质
CN111865722A (zh) * 2020-07-20 2020-10-30 深圳市活力天汇科技股份有限公司 一种节点健康状态检测及处理方法
CN111869163A (zh) * 2018-03-19 2020-10-30 华为技术有限公司 一种故障检测的方法、装置及系统
CN112162907A (zh) * 2020-09-30 2021-01-01 上海新炬网络信息技术股份有限公司 基于监控指标数据的健康度评估方法
CN112749071A (zh) * 2020-12-30 2021-05-04 中国人寿保险股份有限公司上海数据中心 一种用于检测应用集群健康度的系统及方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170115978A1 (en) * 2015-10-26 2017-04-27 Microsoft Technology Licensing, Llc Monitored upgrades using health information
CN111869163A (zh) * 2018-03-19 2020-10-30 华为技术有限公司 一种故障检测的方法、装置及系统
CN111404759A (zh) * 2020-04-17 2020-07-10 腾讯科技(深圳)有限公司 服务检测方法、规则配置方法、相关设备及介质
CN111651329A (zh) * 2020-06-08 2020-09-11 中国工商银行股份有限公司 针对应用的健康检查方法和装置、计算机系统和存储介质
CN111865722A (zh) * 2020-07-20 2020-10-30 深圳市活力天汇科技股份有限公司 一种节点健康状态检测及处理方法
CN112162907A (zh) * 2020-09-30 2021-01-01 上海新炬网络信息技术股份有限公司 基于监控指标数据的健康度评估方法
CN112749071A (zh) * 2020-12-30 2021-05-04 中国人寿保险股份有限公司上海数据中心 一种用于检测应用集群健康度的系统及方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117891696A (zh) * 2024-03-15 2024-04-16 天津医康互联科技有限公司 计算资源调整方法、装置、电子设备和可读存储介质

Also Published As

Publication number Publication date
CN113312234B (zh) 2022-07-26

Similar Documents

Publication Publication Date Title
CN109522287B (zh) 分布式文件存储集群的监控方法、系统、设备及介质
USRE45806E1 (en) System and method for the optimization of database access in data base networks
US10313452B2 (en) Migrating a chat message service provided by a chat server to a new chat server
US7603423B2 (en) Communication system with primary device and standby device to prevent suspension of service of the system
CN106603319B (zh) 一种故障处理的方法、管理服务器以及逻辑服务器
US9390156B2 (en) Distributed directory environment using clustered LDAP servers
CN102082800A (zh) 一种用户请求处理的方法和服务器
CN110334072A (zh) 一种分布式文件系统、文件更新方法及装置
CN113014623B (zh) 埋点实时流数据处理方法、装置、计算机设备和存储介质
CN112231108A (zh) 任务处理方法、装置、计算机可读存储介质及服务器
CN108924043A (zh) 系统监控方法、网关通信、网关装置、业务处理设备
CN113312234B (zh) 一种健康检测的优化方法及终端
CN111342986A (zh) 分布式节点管理方法及装置、分布式系统、存储介质
CN112492030B (zh) 数据存储方法、装置、计算机设备和存储介质
CN106790610B (zh) 一种云系统消息分发方法,装置和系统
CN111935782A (zh) 客户端重试机制的优化方法、存储介质
US20160085638A1 (en) Computer system and method of identifying a failure
CN112131201B (zh) 一种网络附加存储高可用性的方法、系统、设备及介质
CN111064636B (zh) 前置机连接的控制方法、装置、系统、计算机设备
CN110134547B (zh) 一种基于中间件的重复数据删除方法和相关装置
CN114218471A (zh) 数据查询方法、装置、系统、电子设备及存储介质
CN115002114B (zh) 节点处理方法、装置、电子设备、存储介质及服务器
CN114627599B (zh) Pos终端实现业务处理的方法和pos终端及服务端
CN117573397B (zh) 内存优化方法、系统和存储介质
CN116860434A (zh) 业务请求处理方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant