CN110912779A - 一种集群主机健康检测方法,系统,设备及可读存储介质 - Google Patents

一种集群主机健康检测方法,系统,设备及可读存储介质 Download PDF

Info

Publication number
CN110912779A
CN110912779A CN201911235920.0A CN201911235920A CN110912779A CN 110912779 A CN110912779 A CN 110912779A CN 201911235920 A CN201911235920 A CN 201911235920A CN 110912779 A CN110912779 A CN 110912779A
Authority
CN
China
Prior art keywords
state
health
service
server
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911235920.0A
Other languages
English (en)
Inventor
刘进源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Wave Intelligent Technology Co Ltd
Original Assignee
Suzhou Wave Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Wave Intelligent Technology Co Ltd filed Critical Suzhou Wave Intelligent Technology Co Ltd
Priority to CN201911235920.0A priority Critical patent/CN110912779A/zh
Publication of CN110912779A publication Critical patent/CN110912779A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1044Group management mechanisms 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1044Group management mechanisms 
    • H04L67/1048Departure or maintenance mechanisms

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Environmental & Geological Engineering (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种集群主机健康检测方法,系统,设备及可读存储介质,配置集群主机健康检测服务,并配置启动自定义端口作为开放服务端口;检测集群主机的服务状态是否为正常服务状态;如果是,则回复健康信息;将HAProxy模块调整为检测方式。监测开放服务端口返回的检测信息,并判断后端服务器的健康状态;如果检测到后端服务器状态为非正常服务状态,将该服务器从HAProxy后端服务器组中剔除,检测到synced状态则重新添加到后端服务器组。通过对HAProxy关于MariaDB主机状态健康检测的优化处理,大大提高了HAProxy对于MariaDB健康检测的准确性,直接提高了使用该检测方式的云平台产品的稳定性。

Description

一种集群主机健康检测方法,系统,设备及可读存储介质
技术领域
本发明涉及服务器技术领域,尤其涉及一种集群主机健康检测方法,系统,设备及可读存储介质。
背景技术
在云平台环境下,MariaDB因为开源、实用的数据库特性得到广泛应用,而MariaDBGalera Cluster提供了一套高可用集群解决方案。在这种情况下,默认的HAProxy对于MariaDB Galera Cluster主机的健康检测方式是检测MariaDB主机地址端口是否可用,可用即为健康状态;或者检测MariaDB中haproxy用户是否可登陆数据库,可登陆即为健康状态。
但是实际使用中,MariaDB主机如果处于非synced状态,数据库也是可登陆的,但是此时MariaDB不能提供读写服务,如果此时HAProxy依据以上方式误检测为MariaDB可用就会导致云平台故障。
发明内容
为了克服上述现有技术中的不足,本发明提供一种可以更准确的判定MariaDB主机的健康状态,从而决定HAProxy负载均衡是往该后端MariaDB节点分发。
一种集群主机健康检测方法,其特征在于,方法包括:
配置集群主机健康检测服务,并配置启动自定义端口作为开放服务端口;
检测集群主机的服务状态是否为正常服务状态;
如果是,则回复健康信息;
将HAProxy模块调整为检测方式。
优选地,步骤将HAProxy模块调整为检测方式之后还包括:
监测开放服务端口返回的检测信息,并判断后端服务器的健康状态;
如果检测到后端服务器状态为非正常服务状态,将该服务器从HAProxy后端服务器组中剔除,检测到synced状态则重新添加到后端服务器组。
优选地,依靠xinetd服务安装部署主机健康检测服务。
优选地,步骤检测集群主机的服务状态是否为正常服务状态之后还包括:
如果为否,则确定所述服务器的非健康状态;
并再执行对所述服务器的服务状态检测,直至达到预设次数;
如果仍为否,对所述服务器进行标识。
本发明还提供一种集群主机健康检测系统,包括:配置模块,检测模块以及调整模块;
配置模块用于配置集群主机健康检测服务,并配置启动自定义端口作为开放服务端口;
检测模块用于检测集群主机的服务状态是否为正常服务状态;
如果是,则回复健康信息;
调整模块用于将HAProxy模块调整为检测方式。
优选地,监测健康模块用于监测开放服务端口返回的检测信息,并判断后端服务器的健康状态;
如果检测到后端服务器状态为非正常服务状态,将该服务器从HAProxy后端服务器组中剔除,检测到synced状态则重新添加到后端服务器组。
优选地,检测模块还用于检测集群主机的服务状态是否为正常服务状态之后还包括:
如果为否,则确定所述服务器的非健康状态;
并再执行对所述服务器的服务状态检测,直至达到预设次数;
如果仍为否,对所述服务器进行标识。
本发明还提供一种实现集群主机健康检测方法的设备,包括:
存储器,用于存储计算机程序及集群主机健康检测方法;
处理器,用于执行所述计算机程序及集群主机健康检测方法,以实现集群主机健康检测方法的步骤。
本发明还提供一种具有集群主机健康检测方法的可读存储介质,可读存储介质上存储有计算机程序,所述计算机程序被处理器执行以实现集群主机健康检测方法的步骤。
从以上技术方案可以看出,本发明具有以下优点:
本发明通过对HAProxy关于MariaDB主机状态健康检测的优化处理,大大提高了HAProxy对于MariaDB健康检测的准确性,直接提高了使用该检测方式的云平台产品的稳定性。
附图说明
为了更清楚地说明本发明的技术方案,下面将对描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为集群主机健康检测方法流程图;
图2为集群主机健康检测方法实施例流程图;
图3为集群主机健康检测系统示意图。
具体实施方式
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
本发明的HAProxy:一种提供高可用性、负载均衡功能的代理软件。HAProxy是一个使用C语言编写的自由及开放源代码软件[1],其提供高可用性、负载均衡,以及基于TCP和HTTP的应用程序代理。
MariaDB:MariaDB是MySQL的分支,是一种开源数据库产品。
MariaDB Galera Cluster:一种开源的mariadb集群方式,具有多主模式,能够实时同步,在云平台模式下获得广泛应用。
健康检测:判断后端负载主机服务是否可用的一种检测方式。
synced:MariaDB Galera Cluster集群中MariaDB的一种主机状态,此状态下节点正常提供服务。
本发明提供一种集群主机健康检测方法,方法包括:
S101,配置集群主机健康检测服务,并配置启动自定义端口作为开放服务端口;
S102,检测集群主机的服务状态是否为正常服务状态;
S103,如果是,则回复健康信息;
S104,将HAProxy模块调整为检测方式。
为了进一步说明本发明涉及的内容下面以一个具体实施例说明本发明的实施方式,如图2所示,
本发明的具体实施方式是更改HAProxy对于MariaDB Galera Cluster主机的健康检测策略,更改为检测数据库是否为synced状态。其具体方式如下:
依靠xinetd服务安装部署MariaDB Galera Cluster主机健康检测服务,新启动自定义端口作为状态端口开放。
创建MariaDB Galera Cluster主机的健康检测脚本,检测MariaDB GaleraCluster主机状态是否为synced状态,如果是则回复健康信息;非synced状态则全部为不健康信息。
HAProxy调整为新的检测方式,依据监听xinetd自定义的服务端口返回的检测信息判断后端MariaDB的健康状态。
如果检测到MariaDB状态不是synced状态,将该服务器从HAProxy后端服务器组中剔除,检测到synced状态则重新添加到后端服务器组。
本发明通过对HAProxy关于MariaDB主机状态健康检测的优化处理,大大提高了HAProxy对于MariaDB健康检测的准确性,直接提高了使用该检测方式的云平台产品的稳定性。
基于上述方法本发明还提供一种集群主机健康检测系统,如图3所示,包括:配置模块1,检测模块2以及调整模块3;
配置模块1用于配置集群主机健康检测服务,并配置启动自定义端口作为开放服务端口;检测模块2用于检测集群主机的服务状态是否为正常服务状态;如果是,则回复健康信息;调整模块3用于将HAProxy模块调整为检测方式。
如果为否,则确定所述服务器的非健康状态;并再执行对所述服务器的服务状态检测,直至达到预设次数;如果仍为否,对所述服务器进行标识。
监测健康模块用于监测开放服务端口返回的检测信息,并判断后端服务器的健康状态;如果检测到后端服务器状态为非正常服务状态,将该服务器从HAProxy后端服务器组中剔除,检测到synced状态则重新添加到后端服务器组。
通过对HAProxy检测后端MariaDB主机是否为synced状态的检测方式,确定后端主机状态,提高了健康检测的准确性,避免了云平台由于检测不准引发的故障。
本发明根据实际需求,弃用了HAProxy自带的MariaDB健康检测方式,具体问题具体分析,本发明大大提高云平台的稳定性。
本发明将HAProxy对于MariaDB Galera Cluster主机健康检测方法更改为检测后端MariaDB主机是否为synced状态,从而确定MariaDB是否可用。
弃用了HAProxy自带的Mariadb健康检测方式,依赖xinetd服务,通过自定义MariaDB健康检测脚本判定MariaDB健康状态。
基于上述方法和系统本发明还提供一种实现集群主机健康检测方法的设备,包括:存储器,用于存储计算机程序及集群主机健康检测方法;处理器,用于执行所述计算机程序及集群主机健康检测方法,以实现集群主机健康检测方法的步骤。
基于上述方法和系统本发明还提供一种具有集群主机健康检测方法的可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行以实现集群主机健康检测方法的步骤。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的实现集群主机健康检测方法的设备可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据实现集群主机健康检测方法的设备公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的索引方法。
在实现集群主机健康检测方法的设备的存储介质中,存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (9)

1.一种集群主机健康检测方法,其特征在于,方法包括:
配置集群主机健康检测服务,并配置启动自定义端口作为开放服务端口;
检测集群主机的服务状态是否为正常服务状态;
如果是,则回复健康信息;
将HAProxy模块调整为检测方式。
2.根据权利要求1所述的集群主机健康检测方法,其特征在于,
步骤将HAProxy模块调整为检测方式之后还包括:
监测开放服务端口返回的检测信息,并判断后端服务器的健康状态;
如果检测到后端服务器状态为非正常服务状态,将该服务器从HAProxy后端服务器组中剔除,检测到synced状态则重新添加到后端服务器组。
3.根据权利要求1所述的集群主机健康检测方法,其特征在于,
依靠xinetd服务安装部署主机健康检测服务。
4.根据权利要求1所述的集群主机健康检测方法,其特征在于,
步骤检测集群主机的服务状态是否为正常服务状态之后还包括:
如果为否,则确定所述服务器的非健康状态;
并再执行对所述服务器的服务状态检测,直至达到预设次数;
如果仍为否,对所述服务器进行标识。
5.一种集群主机健康检测系统,其特征在于,包括:配置模块,检测模块以及调整模块;
配置模块用于配置集群主机健康检测服务,并配置启动自定义端口作为开放服务端口;
检测模块用于检测集群主机的服务状态是否为正常服务状态;
如果是,则回复健康信息;
调整模块用于将HAProxy模块调整为检测方式。
6.根据权利要求5所述的系统,其特征在于,还包括监测健康模块;
监测健康模块用于监测开放服务端口返回的检测信息,并判断后端服务器的健康状态;
如果检测到后端服务器状态为非正常服务状态,将该服务器从HAProxy后端服务器组中剔除,检测到synced状态则重新添加到后端服务器组。
7.根据权利要求5所述的系统,其特征在于,还包括监测健康模块;
检测模块还用于检测集群主机的服务状态是否为正常服务状态之后还包括:
如果为否,则确定所述服务器的非健康状态;
并再执行对所述服务器的服务状态检测,直至达到预设次数;
如果仍为否,对所述服务器进行标识。
8.一种实现集群主机健康检测方法的设备,其特征在于,包括:
存储器,用于存储计算机程序及集群主机健康检测方法;
处理器,用于执行所述计算机程序及集群主机健康检测方法,以实现如权利要求1至4任意一项所述集群主机健康检测方法的步骤。
9.一种具有集群主机健康检测方法的可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1至4任意一项所述集群主机健康检测方法的步骤。
CN201911235920.0A 2019-12-05 2019-12-05 一种集群主机健康检测方法,系统,设备及可读存储介质 Pending CN110912779A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911235920.0A CN110912779A (zh) 2019-12-05 2019-12-05 一种集群主机健康检测方法,系统,设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911235920.0A CN110912779A (zh) 2019-12-05 2019-12-05 一种集群主机健康检测方法,系统,设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN110912779A true CN110912779A (zh) 2020-03-24

Family

ID=69822620

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911235920.0A Pending CN110912779A (zh) 2019-12-05 2019-12-05 一种集群主机健康检测方法,系统,设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN110912779A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112836220A (zh) * 2021-02-07 2021-05-25 浪潮云信息技术股份公司 一种云中心环境检查方法
WO2023202182A1 (zh) * 2022-04-20 2023-10-26 京东科技信息技术有限公司 后端服务器管理方法、装置、可读介质及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140372533A1 (en) * 2011-02-09 2014-12-18 Cliqr Technologies, Inc. Apparatus, systems, and methods for cloud agnostic multi-tier application modeling and deployment
CN104394224A (zh) * 2014-11-28 2015-03-04 无锡华云数据技术服务有限公司 一种负载均衡系统
US9251114B1 (en) * 2012-10-12 2016-02-02 Egnyte, Inc. Systems and methods for facilitating access to private files using a cloud storage system
CN105979009A (zh) * 2016-07-06 2016-09-28 乾云众创(北京)信息科技研究院有限公司 一种针对云应用容器的增加负载自动均衡方法
CN106131122A (zh) * 2016-06-21 2016-11-16 浪潮电子信息产业股份有限公司 一种部署负载均衡服务的方法及装置
CN109361572A (zh) * 2018-12-10 2019-02-19 浪潮(北京)电子信息产业有限公司 一种主机集群管理方法及相关装置
CN109617966A (zh) * 2018-12-14 2019-04-12 武汉烽火信息集成技术有限公司 一种基于Openstack的云管平台部署系统及方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140372533A1 (en) * 2011-02-09 2014-12-18 Cliqr Technologies, Inc. Apparatus, systems, and methods for cloud agnostic multi-tier application modeling and deployment
US9251114B1 (en) * 2012-10-12 2016-02-02 Egnyte, Inc. Systems and methods for facilitating access to private files using a cloud storage system
CN104394224A (zh) * 2014-11-28 2015-03-04 无锡华云数据技术服务有限公司 一种负载均衡系统
CN106131122A (zh) * 2016-06-21 2016-11-16 浪潮电子信息产业股份有限公司 一种部署负载均衡服务的方法及装置
CN105979009A (zh) * 2016-07-06 2016-09-28 乾云众创(北京)信息科技研究院有限公司 一种针对云应用容器的增加负载自动均衡方法
CN109361572A (zh) * 2018-12-10 2019-02-19 浪潮(北京)电子信息产业有限公司 一种主机集群管理方法及相关装置
CN109617966A (zh) * 2018-12-14 2019-04-12 武汉烽火信息集成技术有限公司 一种基于Openstack的云管平台部署系统及方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112836220A (zh) * 2021-02-07 2021-05-25 浪潮云信息技术股份公司 一种云中心环境检查方法
CN112836220B (zh) * 2021-02-07 2023-03-24 浪潮云信息技术股份公司 一种云中心环境检查方法
WO2023202182A1 (zh) * 2022-04-20 2023-10-26 京东科技信息技术有限公司 后端服务器管理方法、装置、可读介质及电子设备

Similar Documents

Publication Publication Date Title
US9514034B1 (en) Ordered test execution to enable faster feedback
US10938697B2 (en) Generating production server load activity for a test server
US10002054B2 (en) Method and system for performing automatic system recovery
US9104796B2 (en) Correlation of source code with system dump information
CN110399267B (zh) 一种服务器pcie设备监控方法、系统、设备及可读存储介质
US10664390B2 (en) Optimizing execution order of system interval dependent test cases
US10212058B2 (en) System and method for detecting system's performance regression
CN105204968B (zh) 一种故障内存检测方法和装置
CN110737891A (zh) 一种主机入侵检测方法和装置
US20150019722A1 (en) Determining, managing and deploying an application topology in a virtual environment
US9116808B2 (en) Method and system for determining device configuration settings
JP2022100301A (ja) ソフトウェア・アップグレードがコンピューティング・デバイスに与える潜在的な影響を判定するための方法、コンピュータ・プログラム、および更新推奨コンピュータ・サーバ(ソフトウェア・アップグレードの安定性の推奨)
CN110912779A (zh) 一种集群主机健康检测方法,系统,设备及可读存储介质
CN110716922A (zh) 基于Inception的数据库运维方法、装置、计算机设备及存储介质
CN104092732A (zh) 一种终端软件智能更新方法及装置
US8099628B2 (en) Software problem identification tool
CN110716912B (zh) 一种sql性能检测方法及服务器
CN114070889B (zh) 配置方法、流量转发方法、设备、存储介质及程序产品
US8798982B2 (en) Information processing device, information processing method, and program
US20150331772A1 (en) Methods for updating diagnostic tools on a hardware device and devices thereof
CN114706772A (zh) 安装环境检测方法、装置、设备及存储介质
US11036624B2 (en) Self healing software utilizing regression test fingerprints
CN111355614A (zh) 适用于支付设备日志的异常信息定位方法和装置
CN114003497A (zh) 业务系统的测试方法、装置、设备及存储介质
CN114338846A (zh) 一种报文测试的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200324