CN111813625A - 分布式服务器集群的健康检查方法及装置 - Google Patents

分布式服务器集群的健康检查方法及装置 Download PDF

Info

Publication number
CN111813625A
CN111813625A CN202010612338.8A CN202010612338A CN111813625A CN 111813625 A CN111813625 A CN 111813625A CN 202010612338 A CN202010612338 A CN 202010612338A CN 111813625 A CN111813625 A CN 111813625A
Authority
CN
China
Prior art keywords
detection
health check
health
service node
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010612338.8A
Other languages
English (en)
Other versions
CN111813625B (zh
Inventor
顾欣
夏龙飞
张家宇
颜高飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202010612338.8A priority Critical patent/CN111813625B/zh
Publication of CN111813625A publication Critical patent/CN111813625A/zh
Application granted granted Critical
Publication of CN111813625B publication Critical patent/CN111813625B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3093Configuration details thereof, e.g. installation, enabling, spatial arrangement of the probes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • H04L67/025Protocols based on web technology, e.g. hypertext transfer protocol [HTTP] for remote control or remote monitoring of applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • Health & Medical Sciences (AREA)
  • Environmental & Geological Engineering (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种分布式服务器集群的健康检查方法及装置,在服务节点的一本地应用程序启动之后,所述服务节点通过集成在所述本地应用程序上的健康检查模块进行运行环境探测和定制业务探测;所述健康检查模块通过所述服务节点的公共探测接口自定义设置得到,本发明基于节点内部自发运行健康探测,合理布局探测任务,如对网络探测,则依赖与外部的注册中心,其他节点内部运行环境探测则集成至应用服务框架中自发进行探测,减少冗余探测降低资源消耗,同时健康探测能力增加对业务的深度健康探测。

Description

分布式服务器集群的健康检查方法及装置
技术领域
本发明涉及服务器健康检查领域,尤其涉及一种分布式服务器集群的健康检查方法及装置。
背景技术
本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
随着分布式微服务的流行,安全可靠的服务变得越来越重要。由于分布式系统集群庞大,集群中有大量服务节点,对于集群中的故障节点快速发现就变得越来越重要。传统的分布式服务健康探测主要有2种方式。1,注册中心探测机制:当应用节点与注册中心连接探测异常,会话超时后自动隔离异常节点,服务恢复后,重新建立会话后恢复节点注册。该探测只能节点做网络及应用节点进程系统级异常,即网络故障,或应用节点卡死无响应才能被探测。2,容器健康检查机制:PaaS云可对节点容器系统指标进行健康探测,即系统级探测。上述健康检查只能对系统指标做探测,并且需要依赖第三方,探测耗时较长。
发明内容
本发明实施例提供一种分布式服务器集群的健康检查方法及装置,能够减少冗余探测降低资源消耗,同时健康探测能力增加对业务的深度健康探测。
第一方面,一种分布式服务器集群的健康检查方法,包括:
在服务节点的一本地应用程序启动之后,所述服务节点通过集成在所述本地应用程序上的健康检查模块进行运行环境探测和定制业务探测;其中,
所述健康检查模块通过所述服务节点的公共探测接口自定义设置得到。
在优选的实施例中,还包括:
所述服务节点通过与注册中心建立心跳进行网络环境检测。
在优选的实施例中,进行运行环境探测包括:
对所述本地应用程序启动后的cpu资源占比、内存使用占比进行探测。
在优选的实施例中,进行运行环境探测,包括:
探测数据库连接池是否可用。
另一方面,一种分布式服务器集群的健康检查装置,包括:
第一检查模块,在服务节点的一本地应用程序启动之后,所述服务节点通过集成在所述本地应用程序上的健康检查模块进行运行环境探测和定制业务探测;其中,
所述健康检查模块通过所述服务节点的公共探测接口自定义设置得到。
在优选的实施例中,还包括:
第二检查模块,所述服务节点通过与注册中心建立心跳进行网络环境检测。
在优选的实施例中,第一检查模块包括:
运行环境探测单元,对所述本地应用程序启动后的cpu资源占比、内存使用占比进行探测。
在优选的实施例中,第一检查模块包括:
可用性探测单元,探测数据库连接池是否可用。
第三方面,本发明实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面任一所述方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述第一方面任一所述方法的计算机程序。
综上所述,本发明提供的一种分布式服务器集群的健康检查方法及装置,在服务节点的一本地应用程序启动之后,所述服务节点通过集成在所述本地应用程序上的健康检查模块进行运行环境探测和定制业务探测;所述健康检查模块通过所述服务节点的公共探测接口自定义设置得到,本发明基于节点内部自发运行健康探测,合理布局探测任务,如对网络探测,则依赖与外部的注册中心,其他节点内部运行环境探测则集成至应用服务框架中自发进行探测,减少冗余探测降低资源消耗,同时健康探测能力增加对业务的深度健康探测。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中提供的一种分布式服务器集群的健康检查方法流程示意图;
图2为本发明实施例中健康检查模块架构图;
图3为本发明实施例中健康检查模块在分布式系统中运行示意图;
图4为本发明实施例中健康检查模块中探测项运行示意图;
图5为本发明实施例中提供的一种分布式服务器集群的健康检查装置的结构示意图;
图6为适用于实现本发明中的分布式服务器集群的健康检查方法的计算机设备结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。
虽然本发明提供了如下述实施例或附图所示的方法操作步骤或装置结构,但基于常规或者无需创造性的劳动在所述方法或装置中可以包括更多或者更少的操作步骤或模块单元。在逻辑性上不存在必要因果关系的步骤或结构中,这些步骤的执行顺序或装置的模块结构不限于本发明实施例或附图所示的执行顺序或模块结构。所述的方法或模块结构的在实际中的装置或终端产品应用时,可以按照实施例或者附图所示的方法或模块结构进行顺序执行或者并行执行。
图1示出了本发明实施例中一种分布式服务器集群的健康检查方法,包括:
S1在服务节点的一本地应用程序启动之后,所述服务节点通过集成在所述本地应用程序上的健康检查模块进行运行环境探测和定制业务探测。
在步骤S1中,所述健康检查模块通过所述服务节点的公共探测接口自定义设置得到。
本发明提供的一种分布式服务器集群的健康检查方法,在服务节点的一本地应用程序启动之后,所述服务节点通过集成在所述本地应用程序上的健康检查模块进行运行环境探测和定制业务探测;所述健康检查模块通过所述服务节点的公共探测接口自定义设置得到,本发明基于节点内部自发运行健康探测,合理布局探测任务,如对网络探测,则依赖与外部的注册中心,其他节点内部运行环境探测则集成至应用服务框架中自发进行探测,减少冗余探测降低资源消耗,同时健康探测能力增加对业务的深度健康探测。
具体而言,进行运行环境探测包括:对所述本地应用程序启动后的cpu资源占比、内存使用占比进行探测。应用程序启动后,健康检查模块通过对系统发送获取系统指令的方式获取系统运行时环境,如linux就发送top命令等等。
在优选的实施例中,进行运行环境探测,包括:探测数据库连接池是否可用。
进一步的,在优选的实施例中,本发明还包括:所述服务节点通过与注册中心建立心跳进行网络环境检测。
对于定制业务的探测,每个应用程序的业务都不一样,有的业务强依赖数据库,我们就对数据做健康探测,比如探测数据库连接池是否可用,有的业务强依赖某些中间件,如redis,那健康探测就探测redis是否可用,对于业务这块,健康探测模块也可集成每个业务的冒烟测试案例,关键单元测试案例,来对各业务定制化探测。
下面结合场景对本发明进行详细说明。
本发明提供的一种含有业务深度健康探测的部署方法,应用程序内框架集成健康检查模块,随应用程序启动,自发对应用节点做健康探测,如图2。将原有健康探测分为3类,基础运行环境探测(CPU,内存等),网络环境探测,业务深度探测。健康检查模块中包含内置检测项,如系统一些指标(内存,cpu等)。自定义检测项(应用定制化业务层面的深度探测),以及探测后的报警如图3,如图3所示,健康探测模块分为三个子模块,内置检测项,应用检测项,自定义报警,系统运行时,会默认运行内置检测项中的对系统环境的基础探测,同时会多线程并行应用自定义业务深度健康探测项,即应用检测项,如果探测发现检测项失败,则会运行自定报警,自定义报警也是通过spi的方式,由各业务自己实现,在健康检查失败时,运行各业务的自定义报警,举例而言,如图4所示,应用自定义健康探测运行时,是多线程并行运行各业务的深度健康探测,如磁盘探测,通过在探测程序中同步输出日志文件,如果磁盘故障,则同步输出日志文件会超时响应,导致健康探测失败,成功探测出磁盘故障,应用节点异常。健康检查模块运行时会并行运行多探测项,加快探测速度如图4。
主要包括如下步骤:
步骤1):将原有健康探测分为3类,基础运行环境探测(CPU,内存等),网络环境探测,业务深度探测。
步骤2):服务框架新增健康检查模块,健康检查模块负责对服务节点进行健康探测。
步骤3):健康检查模块分为基础运行环境探测(该能力直接内置其中),网络环境探测(通过与注册中心的心跳实现),业务深度探测,(开放公共SPI接口,各业务应用自定义实现业务层面的健康探测程序),报警能力(健康探测发现节点故障时触发报警任务)等。
步骤4):健康检查模块运行时,并行同时执行多探测任务,增加探测效率,及时发现故障节点。
步骤5):服务框架周期性运行健康检查模块实现对服务节点的健康探测。
可以理解,本发明具有如下优点:
1、传统健康探测需要外部系统去对节点进行探测(如通过脚本,外部系统定期访问等方式),会消耗一部分资源,同时如果外部系统故障则探测就会异常,本方法完全依赖节点内部自发探测,解耦了外部探测系统依赖,减少资源开销。
2、传统健康探测缺少业务层面的深度探测,本发明通过开放探测接口,是各业务方能实现自定义业务层面的探测程序,实现业务深度探测。
3、传统探测缺乏统一的部署管控,可能同时存在多种探测方式(脚本外部系统等),他们之前缺乏相关联动性并且部分探测内容还会存在冗余,增加资源开销,本方案将探测内容统一划分为3部分,全部集成在应用自身的健康检查模块中统一调度,统一部署,减少资源浪费。
基于相同的发明构思,本发明提供一种分布式服务器集群的健康检查装置,如图5所示,包括:
第一检查模块10,在服务节点的一本地应用程序启动之后,所述服务节点通过集成在所述本地应用程序上的健康检查模块进行运行环境探测和定制业务探测;其中,
所述健康检查模块通过所述服务节点的公共探测接口自定义设置得到。
本发明提供的一种分布式服务器集群的健康检查装置,在服务节点的一本地应用程序启动之后,所述服务节点通过集成在所述本地应用程序上的健康检查模块进行运行环境探测和定制业务探测;所述健康检查模块通过所述服务节点的公共探测接口自定义设置得到,本发明基于节点内部自发运行健康探测,合理布局探测任务,如对网络探测,则依赖与外部的注册中心,其他节点内部运行环境探测则集成至应用服务框架中自发进行探测,减少冗余探测降低资源消耗,同时健康探测能力增加对业务的深度健康探测。
基于相同的发明构思,一实施例中,请继续结合图5,还包括:
第二检查模块20,所述服务节点通过与注册中心建立心跳进行网络环境检测。
基于相同的发明构思,一实施例中,第一检查模块包括:
运行环境探测单元,对所述本地应用程序启动后的cpu资源占比、内存使用占比进行探测。
基于相同的发明构思,一实施例中,第一检查模块包括:可用性探测单元,探测数据库连接池是否可用。
从硬件层面来说,为了本发明提供一种用于实现所述分布式服务器集群的健康检查方法中的全部或部分内容的电子设备的实施例,所述电子设备具体包含有如下内容:
处理器(processor)、存储器(memory)、通信接口(Communications Interface)和总线;其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;所述通信接口用于实现服务器、装置、分布式消息中间件集群装置、各类数据库以及用户终端等相关设备之间的信息传输;该电子设备可以是台式计算机、平板电脑及移动终端等,本实施例不限于此。在本实施例中,该电子设备可以参照实施例中的分布式服务器集群的健康检查方法的实施例,以及,分布式服务器集群的健康检查方法装置的实施例进行实施,其内容被合并于此,重复之处不再赘述。
图6为本发明实施例的电子设备9600的系统构成的示意框图。如图6所示,该电子设备9600可以包括中央处理器9100和存储器9140;存储器9140耦合到中央处理器9100。值得注意的是,该图6是示例性的;还可以使用其他类型的结构,来补充或代替该结构,以实现电信功能或其他功能。
一实施例中,分布式服务器集群的健康检查方法功能可以被集成到中央处理器9100中。例如,中央处理器9100可以被配置为进行如下控制:
S1在服务节点的一本地应用程序启动之后,所述服务节点通过集成在所述本地应用程序上的健康检查模块进行运行环境探测和定制业务探测。
从上述描述可知,本发明的实施例提供的电子设备,在服务节点的一本地应用程序启动之后,所述服务节点通过集成在所述本地应用程序上的健康检查模块进行运行环境探测和定制业务探测;所述健康检查模块通过所述服务节点的公共探测接口自定义设置得到,本发明基于节点内部自发运行健康探测,合理布局探测任务,如对网络探测,则依赖与外部的注册中心,其他节点内部运行环境探测则集成至应用服务框架中自发进行探测,减少冗余探测降低资源消耗,同时健康探测能力增加对业务的深度健康探测。
在另一个实施方式中,分布式服务器集群的健康检查方法装置可以与中央处理器9100分开配置,例如可以将分布式服务器集群的健康检查方法配置为与中央处理器9100连接的芯片,通过中央处理器的控制来实现分布式服务器集群的健康检查方法功能。
如图6所示,该电子设备9600还可以包括:通信模块9110、输入单元9120、音频处理器9130、显示器9160、电源9170。值得注意的是,电子设备9600也并不是必须要包括图6中所示的所有部件;此外,电子设备9600还可以包括图6中没有示出的部件,可以参考现有技术。
如图6所示,中央处理器9100有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器9100接收输入并控制电子设备9600的各个部件的操作。
其中,存储器9140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器9100可执行该存储器9140存储的该程序,以实现信息存储或处理等。
输入单元9120向中央处理器9100提供输入。该输入单元9120例如为按键或触摸输入装置。电源9170用于向电子设备9600提供电力。显示器9160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器,但并不限于此。
该存储器9140可以是固态存储器,例如,只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为EPROM等。存储器9140还可以是某种其它类型的装置。存储器9140包括缓冲存储器9141(有时被称为缓冲器)。存储器9140可以包括应用/功能存储部9142,该应用/功能存储部9142用于存储应用程序和功能程序或用于通过中央处理器9100执行电子设备9600的操作的流程。
存储器9140还可以包括数据存储部9143,该数据存储部9143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器9140的驱动程序存储部9144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
通信模块9110即为经由天线9111发送和接收信号的发送机/接收机9110。通信模块(发送机/接收机)9110耦合到中央处理器9100,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块9110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)9110还经由音频处理器9130耦合到扬声器9131和麦克风9132,以经由扬声器9131提供音频输出,并接收来自麦克风9132的音频输入,从而实现通常的电信功能。音频处理器9130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器9130还耦合到中央处理器9100,从而使得可以通过麦克风9132能够在本机上录音,且使得可以通过扬声器9131来播放本机上存储的声音。
本发明的实施例还提供能够实现上述实施例中的执行主体可以为服务器的分布式服务器集群的健康检查方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的分布式服务器集群的健康检查方法的全部步骤。
从上述描述可知,本发明的实施例提供的计算机可读存储介质,在服务节点的一本地应用程序启动之后,所述服务节点通过集成在所述本地应用程序上的健康检查模块进行运行环境探测和定制业务探测;所述健康检查模块通过所述服务节点的公共探测接口自定义设置得到,本发明基于节点内部自发运行健康探测,合理布局探测任务,如对网络探测,则依赖与外部的注册中心,其他节点内部运行环境探测则集成至应用服务框架中自发进行探测,减少冗余探测降低资源消耗,同时健康探测能力增加对业务的深度健康探测。
本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(装置)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种分布式服务器集群的健康检查方法,其特征在于,包括:
在服务节点的一本地应用程序启动之后,所述服务节点通过集成在所述本地应用程序上的健康检查模块进行运行环境探测和定制业务探测;其中,
所述健康检查模块通过所述服务节点的公共探测接口自定义设置得到。
2.根据权利要求1所述的健康检查方法,其特征在于,还包括:
所述服务节点通过与注册中心建立心跳进行网络环境检测。
3.根据权利要求1所述的健康检查方法,其特征在于,进行运行环境探测包括:
对所述本地应用程序启动后的cpu资源占比、内存使用占比进行探测。
4.根据权利要求1所述的健康检查方法,其特征在于,进行运行环境探测,包括:
探测数据库连接池是否可用。
5.一种分布式服务器集群的健康检查装置,其特征在于,包括:
第一检查模块,在服务节点的一本地应用程序启动之后,所述服务节点通过集成在所述本地应用程序上的健康检查模块进行运行环境探测和定制业务探测;其中,
所述健康检查模块通过所述服务节点的公共探测接口自定义设置得到。
6.根据权利要求5所述的健康检查装置,其特征在于,还包括:
第二检查模块,所述服务节点通过与注册中心建立心跳进行网络环境检测。
7.根据权利要求5所述的健康检查装置,其特征在于,第一检查模块包括:
运行环境探测单元,对所述本地应用程序启动后的cpu资源占比、内存使用占比进行探测。
8.根据权利要求5所述的健康检查装置,其特征在于,第一检查模块包括:
可用性探测单元,探测数据库连接池是否可用。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4任一所述方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至4任一所述方法的计算机程序。
CN202010612338.8A 2020-06-30 2020-06-30 分布式服务器集群的健康检查方法及装置 Active CN111813625B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010612338.8A CN111813625B (zh) 2020-06-30 2020-06-30 分布式服务器集群的健康检查方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010612338.8A CN111813625B (zh) 2020-06-30 2020-06-30 分布式服务器集群的健康检查方法及装置

Publications (2)

Publication Number Publication Date
CN111813625A true CN111813625A (zh) 2020-10-23
CN111813625B CN111813625B (zh) 2024-03-08

Family

ID=72855701

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010612338.8A Active CN111813625B (zh) 2020-06-30 2020-06-30 分布式服务器集群的健康检查方法及装置

Country Status (1)

Country Link
CN (1) CN111813625B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113590024A (zh) * 2021-06-18 2021-11-02 济南浪潮数据技术有限公司 一种分布式存储系统的健康巡检方法、装置及终端
CN113641558A (zh) * 2021-08-31 2021-11-12 合众人寿保险股份有限公司 一种健康检查方法、装置及电子设备
CN114938377A (zh) * 2022-04-20 2022-08-23 京东科技信息技术有限公司 后端服务器管理方法、装置、可读介质及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102130776A (zh) * 2010-01-19 2011-07-20 新浪网技术(中国)有限公司 一种通信方法和系统
US20110296231A1 (en) * 2010-05-25 2011-12-01 Dake Steven C Distributed healthchecking mechanism
CN105589787A (zh) * 2015-12-18 2016-05-18 畅捷通信息技术股份有限公司 应用程序的健康检查方法及健康检查系统
CN110336715A (zh) * 2019-07-12 2019-10-15 广州虎牙科技有限公司 状态检测方法、主节点和集群管理系统
CN110674034A (zh) * 2019-09-12 2020-01-10 北京浪潮数据技术有限公司 一种健康检查方法、装置及电子设备和存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102130776A (zh) * 2010-01-19 2011-07-20 新浪网技术(中国)有限公司 一种通信方法和系统
US20110296231A1 (en) * 2010-05-25 2011-12-01 Dake Steven C Distributed healthchecking mechanism
CN105589787A (zh) * 2015-12-18 2016-05-18 畅捷通信息技术股份有限公司 应用程序的健康检查方法及健康检查系统
CN110336715A (zh) * 2019-07-12 2019-10-15 广州虎牙科技有限公司 状态检测方法、主节点和集群管理系统
CN110674034A (zh) * 2019-09-12 2020-01-10 北京浪潮数据技术有限公司 一种健康检查方法、装置及电子设备和存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113590024A (zh) * 2021-06-18 2021-11-02 济南浪潮数据技术有限公司 一种分布式存储系统的健康巡检方法、装置及终端
CN113590024B (zh) * 2021-06-18 2023-12-22 济南浪潮数据技术有限公司 一种分布式存储系统的健康巡检方法、装置及终端
CN113641558A (zh) * 2021-08-31 2021-11-12 合众人寿保险股份有限公司 一种健康检查方法、装置及电子设备
CN114938377A (zh) * 2022-04-20 2022-08-23 京东科技信息技术有限公司 后端服务器管理方法、装置、可读介质及电子设备
CN114938377B (zh) * 2022-04-20 2024-05-17 京东科技信息技术有限公司 后端服务器管理方法、装置、可读介质及电子设备

Also Published As

Publication number Publication date
CN111813625B (zh) 2024-03-08

Similar Documents

Publication Publication Date Title
CN111813625B (zh) 分布式服务器集群的健康检查方法及装置
US20170163479A1 (en) Method, Device and System of Renewing Terminal Configuration In a Memcached System
RU2689203C2 (ru) Гибкая схема для настройки языковой модели
CN111813601B (zh) 有状态分布式集群的微服务回滚方法及装置
CN111782470B (zh) 分布式容器日志数据处理方法及装置
CN110022260B (zh) 一种跨环境回执消息处理方法及系统
CN111796838B (zh) Mpp数据库自动部署方法及装置
US7366505B2 (en) Apparatus and method for delivering messages to a mobile information terminal
WO2024078218A1 (zh) 系统启动方法及电子设备
CN111371695B (zh) 服务限流方法及装置
CN114257532B (zh) 服务端状态探测方法及装置
CN112328413A (zh) 应用服务的调用方法、装置及系统
CN113760611B (zh) 系统站点切换方法、装置、电子设备及存储介质
CN111078506A (zh) 业务数据跑批任务监控方法及装置
CN111930565B (zh) 分布式管理系统中组件的进程故障自愈方法、装置及设备
CN112882685A (zh) 面向对象编程语言的对象的扩展方法及装置
CN104615426A (zh) 运行多系统的方法、装置及终端
CN117707439A (zh) 日志打印方法及相关装置
CN111158987A (zh) 微服务架构的健康检查方法及装置
CN114697339A (zh) 集中式架构下的负载均衡方法及装置
CN107301089B (zh) 一种app部署及调用方法和终端
CN111698337B (zh) 建立通信连接的方法、装置及设备
CN113722022A (zh) 状态管理系统及方法
CN113438251A (zh) 协议转换方法、装置及系统
CN106487650B (zh) 消息同步方法、及服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant