CN106254534A - 基于混合架构的分布式集群监控代理及方法 - Google Patents

基于混合架构的分布式集群监控代理及方法 Download PDF

Info

Publication number
CN106254534A
CN106254534A CN201610841877.2A CN201610841877A CN106254534A CN 106254534 A CN106254534 A CN 106254534A CN 201610841877 A CN201610841877 A CN 201610841877A CN 106254534 A CN106254534 A CN 106254534A
Authority
CN
China
Prior art keywords
stop
state
interface
request
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610841877.2A
Other languages
English (en)
Other versions
CN106254534B (zh
Inventor
袁海龙
宋书磊
滕飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Sinovatio Technology LLC
Original Assignee
Nanjing Sinovatio Technology LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Sinovatio Technology LLC filed Critical Nanjing Sinovatio Technology LLC
Priority to CN201610841877.2A priority Critical patent/CN106254534B/zh
Publication of CN106254534A publication Critical patent/CN106254534A/zh
Application granted granted Critical
Publication of CN106254534B publication Critical patent/CN106254534B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)
  • Stored Programmes (AREA)

Abstract

本发明公开了一种基于混合架构的分布式集群监控代理,该代理安装于混合架构平台中的X86服务器或ARM服务器中,包括:HTTP接口模块,用于根据外部调用系统的请求参数,调用各模块,并将调用的模块返回的数据传输至外部调用系统;硬件资源运行状态获取模块,用于按照硬件状态获取接口的请求,采用与当前平台结构匹配的sigar动态库,获取并返回当前平台硬件资源的运行状态信息;软件进程启停模块,用于按照软件进程启停接口的请求,启停止当前平台的软件进程;软件进程运行状态获取模块,用于按照软件进程状态获取接口的请求,获取并返回当前平台的软件进程的运行状态信息。本发明还公开了一种监控方法。本发明可以对X86、ARM混合架构的分布式集群软硬件进行监控。

Description

基于混合架构的分布式集群监控代理及方法
技术领域
本发明涉及分布式集群技术,尤其涉及一种基于混合架构的分布式集群监控代理。
背景技术
目前,主流的分布式集群都运行在基于X86架构服务器上,故对集群的监控都采用X86架构上可以实现的技术。如果分布式集群同时部署在X86、ARM混合架构集群上,原先的监控技术对ARM服务器将不再起作用。如需对ARM服务器进行监控则需要重新再实现一套基于ARM架构的监控技术。此时完成X86、ARM混合架构的分布式集群监控需要两套技术,增加了集群部署及维护的复杂性。
发明内容
发明目的:本发明针对现有技术存在的问题,提供一种基于混合架构的分布式集群监控代理,实现对X86、ARM混合架构的分布式集群软硬件进行监控。
技术方案:本发明所述的基于混合架构的分布式集群监控代理安装于混合架构平台中的X86服务器或ARM服务器中,该代理包括:
HTTP接口模块,具体包括硬件状态获取接口、软件进程启停接口和软件进程状态获取接口;其中,硬件状态获取接口、软件进程启停接口和软件进程状态获取接口用于根据外部调用系统的请求参数,分别调用硬件资源运行状态获取模块、软件进程启停模块和软件进程运行状态获取模块,并将调用的模块返回的数据传输至外部调用系统;
硬件资源运行状态获取模块,用于按照硬件状态获取接口的请求,采用与当前平台结构匹配的sigar动态库,获取并返回当前平台硬件资源的运行状态信息;
软件进程启停模块,用于按照软件进程启停接口的请求,启停止当前平台的软件进程;
软件进程运行状态获取模块,用于按照软件进程状态获取接口的请求,获取并返回当前平台的软件进程的运行状态信息。
进一步的,所述软件进程启停接口请求的启停类型包括一键启停本机进程、启停单个进程和一键启停集群所有进程;所述软件进程启停模块具体用于:若接收到的启停类型为一键启停本机进程,则依据定义的进程启停命令顺序先后进行进程的启停;若启停类型为启停单个进程,则依据启停的进程名称在配置文件中找到该进程的启停脚本,然后调用该脚本进行进程启停;若启停类型为一键启停集群所有进程,则依据定义的集群机器顺序列表依次发送请求给每台机器进行进程启停。
进一步的,所述软件进程状态获取接口请求的类型包括一键获取本机进程状态、获取单个进程运行状态和一键获取集群所有进程运行状态;所述软件进程运行状态获取模块具体用于:若接收的请求类型为一键获取本机进程状态,则依据定义的进程状态获取命令的先后顺序进行状态获取;若类型为获取单个进程运行状态,则依据进程名称在配置文件中找到该进程的状态获取脚本,然后调用该脚本进行状态获取;若类型为一键获取集群所有进程运行状态信息,则依据定义的集群机器顺序列表依次发送请求给每台机器进行进程状态获取并将状态结果依次返回给外部调用系统。
进一步的,所述硬件资源运行状态获取模块获取的硬件资源状态信息具体包括平台的CPU、内存、磁盘和网卡的运行状态信息。
本发明还提供了一种基于上述的监控代理的监控方法,包括步骤:
(1)使用Jetty作为内嵌的Web服务器提供HTTP接口;
(2)在配置文件中定义集群机器启停顺序的IP地址,定义每台机器部署的软件进程名称、进程启停脚本、进程状态获取脚本,通过HTTP接口发送至监控代理;
(3)当监控代理收到硬件状态获取请求时,根据当前平台架构选择匹配的sigar动态库进行硬件状态信息的获取,并将结果返回给外部调用系统;
(4)当监控代理收到软件启停请求时,依据请求类型进行相应的操作,具体为:若启停类型为一键启停本机进程,依据配置文件中定义的进程启停命令顺序先后进行进程的启停;若启停类型为启停单个进程,依据启停的进程名称在配置文件中找到该进程的启停脚本,然后调用该脚本进行进程启停;若启停类型为一键启停集群所有进程,依据定义的集群机器顺序列表依次发送请求给每台机器进行进程启停;
(5)当监控代理收到软件运行状态请求时,依据请求类型进行相应的操作,具体为:若类型为一键获取本机进程状态,依据配置文件中定义的进程状态获取命令的先后顺序进行状态获取;若类型为获取单个进程运行状态,依据进程名称在配置文件中找到该进程的状态获取脚本,然后调用该脚本进行状态获取;若类型为一键获取集群所有进程运行状态信息,依据定义的集群机器顺序列表依次发送请求给每台机器进行进程状态获取并将状态结果依次返回给外部调用系统。
有益效果:本发明与现有技术相比,其显著优点是:实现了对X86、ARM混合架构的分布式集群软硬件进行监控,降低了基于X86、ARM混合架构的分布式集群监控模块部署及维护的复杂性。
附图说明
图1是本发明的一个实施例的系统框图。
具体实施方式
如图1所示,本实施例的监控代理安装于混合架构平台中的X86服务器或ARM服务器中,该代理包括HTTP接口模块、硬件资源运行状态获取模块、软件进程启停模块和软件进程运行状态获取模块。
HTTP接口模块具体包括硬件状态获取接口、软件进程启停接口和软件进程状态获取接口;其中,硬件状态获取接口、软件进程启停接口和软件进程状态获取接口用于根据外部调用系统的请求参数,分别调用硬件资源运行状态获取模块、软件进程启停模块和软件进程运行状态获取模块,并将调用的模块返回的数据传输至外部调用系统。软件进程启停接口请求的启停类型包括一键启停本机进程、启停单个进程和一键启停集群所有进程;软件进程状态获取接口请求的类型包括一键获取本机进程状态、获取单个进程运行状态和一键获取集群所有进程运行状态。
硬件资源运行状态获取模块用于按照硬件状态获取接口的请求,采用与当前平台结构匹配的sigar动态库,获取并返回当前平台硬件资源(CPU、内存、磁盘和网卡)的运行状态信息。
软件进程启停模块用于按照软件进程启停接口的请求,启停止当前平台的软件进程。具体为:若接收到的启停类型为一键启停本机进程,则依据定义的进程启停命令顺序先后进行进程的启停;若启停类型为启停单个进程,则依据启停的进程名称在配置文件中找到该进程的启停脚本,然后调用该脚本进行进程启停;若启停类型为一键启停集群所有进程,则依据定义的集群机器顺序列表依次发送请求给每台机器进行进程启停。
软件进程运行状态获取模块用于按照软件进程状态获取接口的请求,获取并返回当前平台的软件进程的运行状态信息。具体为:若接收的请求类型为一键获取本机进程状态,则依据定义的进程状态获取命令的先后顺序进行状态获取;若类型为获取单个进程运行状态,则依据进程名称在配置文件中找到该进程的状态获取脚本,然后调用该脚本进行状态获取;若类型为一键获取集群所有进程运行状态信息,则依据定义的集群机器顺序列表依次发送请求给每台机器进行进程状态获取并将状态结果依次返回给外部调用系统。
基于上述的监控代理的监控方法的步骤为:
(1)使用Jetty作为内嵌的Web服务器提供HTTP接口;
(2)在配置文件中定义集群机器启停顺序的IP地址,定义每台机器部署的软件进程名称、进程启停脚本、进程状态获取脚本,通过HTTP接口发送至监控代理;
(3)当监控代理收到硬件状态获取请求时,根据当前平台架构(X86或ARM)选择匹配的sigar动态库进行硬件状态信息的获取,并将结果返回给外部调用系统;
(4)当监控代理收到软件启停请求时,依据请求类型进行相应的操作,具体为:若启停类型为一键启停本机进程,依据配置文件中定义的进程启停命令顺序先后进行进程的启停;若启停类型为启停单个进程,依据启停的进程名称在配置文件中找到该进程的启停脚本,然后调用该脚本进行进程启停;若启停类型为一键启停集群所有进程,依据定义的集群机器顺序列表依次发送请求给每台机器进行进程启停;
(5)当监控代理收到软件运行状态请求时,依据请求类型进行相应的操作,具体为:若类型为一键获取本机进程状态,依据配置文件中定义的进程状态获取命令的先后顺序进行状态获取;若类型为获取单个进程运行状态,依据进程名称在配置文件中找到该进程的状态获取脚本,然后调用该脚本进行状态获取;若类型为一键获取集群所有进程运行状态信息,依据定义的集群机器顺序列表依次发送请求给每台机器进行进程状态获取并将状态结果依次返回给外部调用系统。
以上所揭露的仅为本发明一种较佳实施例而已,不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (5)

1.一种基于混合架构的分布式集群监控代理,其特征在于,该代理安装于混合架构平台中的X86服务器或ARM服务器中,该代理包括:
HTTP接口模块,具体包括硬件状态获取接口、软件进程启停接口和软件进程状态获取接口;其中,硬件状态获取接口、软件进程启停接口和软件进程状态获取接口用于根据外部调用系统的请求参数,分别调用硬件资源运行状态获取模块、软件进程启停模块和软件进程运行状态获取模块,并将调用的模块返回的数据传输至外部调用系统;
硬件资源运行状态获取模块,用于按照硬件状态获取接口的请求,采用与当前平台结构匹配的sigar动态库,获取并返回当前平台硬件资源的运行状态信息;
软件进程启停模块,用于按照软件进程启停接口的请求,启停止当前平台的软件进程;
软件进程运行状态获取模块,用于按照软件进程状态获取接口的请求,获取并返回当前平台的软件进程的运行状态信息。
2.根据权利要求1所述的基于混合架构的分布式集群监控代理,其特征在于:
所述软件进程启停接口请求的启停类型包括一键启停本机进程、启停单个进程和一键启停集群所有进程;
所述软件进程启停模块具体用于:若接收到的启停类型为一键启停本机进程,则依据定义的进程启停命令顺序先后进行进程的启停;若启停类型为启停单个进程,则依据启停的进程名称在配置文件中找到该进程的启停脚本,然后调用该脚本进行进程启停;若启停类型为一键启停集群所有进程,则依据定义的集群机器顺序列表依次发送请求给每台机器进行进程启停。
3.根据权利要求1所述的基于混合架构的分布式集群监控代理,其特征在于:
所述软件进程状态获取接口请求的类型包括一键获取本机进程状态、获取单个进程运行状态和一键获取集群所有进程运行状态;
所述软件进程运行状态获取模块具体用于:若接收的请求类型为一键获取本机进程状态,则依据定义的进程状态获取命令的先后顺序进行状态获取;若类型为获取单个进程运行状态,则依据进程名称在配置文件中找到该进程的状态获取脚本,然后调用该脚本进行状态获取;若类型为一键获取集群所有进程运行状态信息,则依据定义的集群机器顺序列表依次发送请求给每台机器进行进程状态获取并将状态结果依次返回给外部调用系统。
4.根据权利要求1所述的基于混合架构的分布式集群监控代理,其特征在于:所述硬件资源运行状态获取模块获取的硬件资源状态信息具体包括平台的CPU、内存、磁盘和网卡的运行状态信息。
5.一种基于权利要求1所述的监控代理的监控方法,其特征在于包括步骤:
(1)使用Jetty作为内嵌的Web服务器提供HTTP接口;
(2)在配置文件中定义集群机器启停顺序的IP地址,定义每台机器部署的软件进程名称、进程启停脚本、进程状态获取脚本,通过HTTP接口发送至监控代理;
(3)当监控代理收到硬件状态获取请求时,根据当前平台架构选择匹配的sigar动态库进行硬件状态信息的获取,并将结果返回给外部调用系统;
(4)当监控代理收到软件启停请求时,依据请求类型进行相应的操作,具体为:若启停类型为一键启停本机进程,依据配置文件中定义的进程启停命令顺序先后进行进程的启停;若启停类型为启停单个进程,依据启停的进程名称在配置文件中找到该进程的启停脚本,然后调用该脚本进行进程启停;若启停类型为一键启停集群所有进程,依据定义的集群机器顺序列表依次发送请求给每台机器进行进程启停;
(5)当监控代理收到软件运行状态请求时,依据请求类型进行相应的操作,具体为:若类型为一键获取本机进程状态,依据配置文件中定义的进程状态获取命令的先后顺序进行状态获取;若类型为获取单个进程运行状态,依据进程名称在配置文件中找到该进程的状态获取脚本,然后调用该脚本进行状态获取;若类型为一键获取集群所有进程运行状态信息,依据定义的集群机器顺序列表依次发送请求给每台机器进行进程状态获取并将状态结果依次返回给外部调用系统。
CN201610841877.2A 2016-09-22 2016-09-22 基于混合架构的分布式集群监控代理及方法 Active CN106254534B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610841877.2A CN106254534B (zh) 2016-09-22 2016-09-22 基于混合架构的分布式集群监控代理及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610841877.2A CN106254534B (zh) 2016-09-22 2016-09-22 基于混合架构的分布式集群监控代理及方法

Publications (2)

Publication Number Publication Date
CN106254534A true CN106254534A (zh) 2016-12-21
CN106254534B CN106254534B (zh) 2019-04-09

Family

ID=57600140

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610841877.2A Active CN106254534B (zh) 2016-09-22 2016-09-22 基于混合架构的分布式集群监控代理及方法

Country Status (1)

Country Link
CN (1) CN106254534B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107483257A (zh) * 2017-08-25 2017-12-15 中国软件与技术服务股份有限公司 一种基于x86和arm混合环境的应用系统部署方法及架构
CN107623745A (zh) * 2017-10-12 2018-01-23 郑州市景安网络科技股份有限公司 一种监控方法、系统及计算机可读存储介质
CN109871267A (zh) * 2018-12-26 2019-06-11 国网甘肃省电力公司 一种基优先级的一键启停方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103034527A (zh) * 2013-01-09 2013-04-10 上海交通大学 混合虚拟化云计算资源优化控制方法与系统
CN103246504A (zh) * 2012-02-10 2013-08-14 联想(北京)有限公司 混合式架构系统及其应用程序切换方法
CN103297279A (zh) * 2013-06-20 2013-09-11 烽火通信科技股份有限公司 一种多软件进程系统上软件控制的主备单盘倒换方法
CN103780441A (zh) * 2014-03-04 2014-05-07 国家电网公司 一种基于arm架构的云终端网络管理平台和管理方法
KR20150126243A (ko) * 2014-05-02 2015-11-11 김현수 에이치-아이엠에이: 비행 소프트웨어의 이식성 향상을 위한 아이엠에이 기반의 혼합형 플랫폼 아키텍처

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103246504A (zh) * 2012-02-10 2013-08-14 联想(北京)有限公司 混合式架构系统及其应用程序切换方法
CN103034527A (zh) * 2013-01-09 2013-04-10 上海交通大学 混合虚拟化云计算资源优化控制方法与系统
CN103297279A (zh) * 2013-06-20 2013-09-11 烽火通信科技股份有限公司 一种多软件进程系统上软件控制的主备单盘倒换方法
CN103780441A (zh) * 2014-03-04 2014-05-07 国家电网公司 一种基于arm架构的云终端网络管理平台和管理方法
KR20150126243A (ko) * 2014-05-02 2015-11-11 김현수 에이치-아이엠에이: 비행 소프트웨어의 이식성 향상을 위한 아이엠에이 기반의 혼합형 플랫폼 아키텍처

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107483257A (zh) * 2017-08-25 2017-12-15 中国软件与技术服务股份有限公司 一种基于x86和arm混合环境的应用系统部署方法及架构
CN107483257B (zh) * 2017-08-25 2020-05-08 中国软件与技术服务股份有限公司 一种基于x86和arm混合环境的应用系统部署方法及架构
CN107623745A (zh) * 2017-10-12 2018-01-23 郑州市景安网络科技股份有限公司 一种监控方法、系统及计算机可读存储介质
CN109871267A (zh) * 2018-12-26 2019-06-11 国网甘肃省电力公司 一种基优先级的一键启停方法及系统
CN109871267B (zh) * 2018-12-26 2023-05-09 国网甘肃省电力公司 一种基优先级的一键启停方法及系统

Also Published As

Publication number Publication date
CN106254534B (zh) 2019-04-09

Similar Documents

Publication Publication Date Title
CN104199957B (zh) 一种Redis通用代理的实现方法
CN103927218B (zh) 事件分发方法及系统
CN102999716B (zh) 虚拟机器监控系统及方法
CN103546343B (zh) 网络流量分析系统的网络流量展示方法和系统
CN103634138B (zh) 分布式调度的远程管理与运维方法及其系统
CN105684382A (zh) 报文的控制方法、交换机及控制器
CN105610972A (zh) 集群式的任务调派系统
CN101502144A (zh) 无线通信网络中的元件管理系统
CN112511218B (zh) 一种基于微服务的卫星地面站监控系统
CN104852939B (zh) 一种部署能力接口的方法和系统
CN105912455A (zh) 业务执行方法及服务器
CN106254534A (zh) 基于混合架构的分布式集群监控代理及方法
CN104852813B (zh) 家庭网关设备中tr069参数节点的按需加载方法及系统
CN105052076A (zh) 一种接口管理服务实体、功能服务实体及网元管理方法
CN105183299A (zh) 一种人机界面服务处理系统和方法
CN114189274A (zh) 一种基于微服务的卫星地面站监控系统
CN103259869B (zh) 一种基于分布式数据存储的集中信息管理方法
CN107770030B (zh) 基于vpn技术的舞台设备控制系统、控制方法及控制装置
CN111858113A (zh) 应用程序的修复方法、装置、业务系统及存储介质
CN102271331A (zh) 一种检测业务提供商sp站点可靠性的方法及系统
US20220272166A1 (en) Method, Apparatus, and System for Implementing Service Function Deployment
CN103546331B (zh) 监控信息的获取方法、装置及系统
CN109525443A (zh) 分布式前置采集通讯链路的处理方法、装置和计算机设备
CN106571943A (zh) 分布式架构集群扩容方法及装置
CN105353701B (zh) 一种可靠的分布式报警系统和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder

Address after: Room 1501, building 2, No.19, ningshuang Road, Yuhuatai District, Nanjing City, Jiangsu Province

Patentee after: Nanjing Sinovatio Technology LLC

Address before: 210012 tulip Road 17, Yuhuatai District, Jiangsu, Nanjing

Patentee before: Nanjing Sinovatio Technology LLC

CP02 Change in the address of a patent holder