CN110247801A - 一种对集群宿主机的监控系统及方法 - Google Patents

一种对集群宿主机的监控系统及方法 Download PDF

Info

Publication number
CN110247801A
CN110247801A CN201910529534.6A CN201910529534A CN110247801A CN 110247801 A CN110247801 A CN 110247801A CN 201910529534 A CN201910529534 A CN 201910529534A CN 110247801 A CN110247801 A CN 110247801A
Authority
CN
China
Prior art keywords
host
monitoring
performance data
influxdb
monitored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910529534.6A
Other languages
English (en)
Inventor
赵龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Wave Intelligent Technology Co Ltd
Original Assignee
Suzhou Wave Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Wave Intelligent Technology Co Ltd filed Critical Suzhou Wave Intelligent Technology Co Ltd
Priority to CN201910529534.6A priority Critical patent/CN110247801A/zh
Publication of CN110247801A publication Critical patent/CN110247801A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0893Assignment of logical groups to network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/22Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks comprising specially adapted graphical user interfaces [GUI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • H04L43/045Processing captured monitoring data, e.g. for logfile generation for graphical visualisation of monitoring data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种对集群宿主机的监控系统及方法,涉及集群宿主机的监控技术。本文公开的一种对集群宿主机的监控方法,包括:接收被监控的各个宿主机发送的本宿主机的性能数据;将接收到的被监控的所有宿主机的性能数据存储至预先创建的分布式时序数据库influxdb中;当接收到监控操作指令时,从所述influxdb中查询所述监控操作指令指定的宿主机的性能数据并进行展示。采用本发明技术方案可以对由多个不同版本的Openstack构建的集群,统一进行监控管理,不再受Openstack版本不同带来的差异的限制。

Description

一种对集群宿主机的监控系统及方法
技术领域
本发明涉及集群宿主机的监控技术,特别涉及一种对集群宿主机的监控系统及方法。
背景技术
在云计算时代,大量异构的资源通过云平台Openstack(云计算管理平台)统一管理,一个大的数据中心下会存在多个不同版本的Openstack,不同版本的Openstack可能差异会很大,多个版本之间会存在不支持监控、提供监控功能不同、提供监控数据差异比较大等多个差异问题,导致无法做到基于整个数据中心的统一监控管理。
发明内容
本发明公开了一种对集群宿主机的监控系统及方法,可以解决现有监控技术无法对多个不同版本的Openstack下的集群宿主机进行统一监控管理的问题。
本发明公开了一种对集群宿主机的监控方法,包括:
接收被监控的各个宿主机发送的本宿主机的性能数据;
将接收到的被监控的所有宿主机的性能数据存储至预先创建的分布式时序数据库influxdb中;
当接收到监控操作指令时,从所述influxdb中查询所述监控操作指令指定的宿主机的性能数据并进行展示。
可选地,上述方法还包括:
预先在所有被监控的宿主机上安装采集工具telegraf,用于采集本宿主机的各项性能数据。
可选地,上述方法还包括:预先在如下任一或多个位置上创建所述influxdb:
宿主机、虚拟机、共享节点、监控节点。
可选地,上述方法还包括:在如下任一或多个位置上安装客户端应用程序接口pluto_api,通过所述pluto_api接收监控操作指令:
宿主机、共享节点、监控节点。
可选地,上述方法还包括:在如下任一或多个位置上安装性能图表展示工具grafana,用于展示从所述influxdb中查询到的所述监控操作指令指定的宿主机的性能数据:
宿主机、共享节点、监控节点。
本文还公开了一种对集群宿主机的监控系统,包括存储器和处理器,其中:
所述存储器,用于保存对集群宿主机的监控程序;
所述处理器,用于读取执行所述对集群宿主机的监控程序,执行如下操作:
接收被监控的各个宿主机发送的本宿主机的性能数据;
将接收到的被监控的所有宿主机的性能数据存储至预先创建的分布式时序数据库influxdb中;
当接收到监控操作指令时,从所述influxdb中查询所述监控操作指令指定的宿主机的性能数据并进行展示。
可选地,上述系统中,所述处理器还进行如下操作:
预先在所有被监控的宿主机上安装采集工具telegraf,用于采集本宿主机的各项性能数据。
可选地,上述系统中,所述处理器还进行如下操作:
预先在如下任一或多个位置上创建所述influxdb:
宿主机、虚拟机、共享节点、监控节点。
可选地,上述系统中,所述处理器还进行如下操作:
在如下任一或多个位置上安装客户端应用程序接口pluto_api,通过所述pluto_api接收监控操作指令:
宿主机、共享节点、监控节点。
可选地,上述系统中,所述处理器还进行如下操作:
在如下任一或多个位置上安装性能图表展示工具grafana,用于展示从所述influxdb中查询到的所述监控操作指令指定的宿主机的性能数据:
宿主机、共享节点、监控节点。
采用本发明技术方案可以对由多个不同版本的Openstack构建的集群,统一进行监控管理,不再受Openstack版本不同带来的差异的限制。
附图说明
图1为本发明实施例中对集群宿主机的监控配置示意图;
图2为本发明实施例中对集群宿主机的监控流程示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文将结合具体实施方式对本发明技术方案作进一步详细说明。需要说明的是,在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。
实施例1
本实施例提供一种对集群宿主机的监控方法,主要包括如下操作:
接收被监控的各个宿主机发送的本宿主机的性能数据;
将接收到的被监控的所有宿主机的性能数据存储至预先创建的分布式时序数据库influxdb中;
当接收到监控操作指令时,从所述influxdb中查询所述监控操作指令指定的宿主机的性能数据并进行展示。
其中,接收到的各个宿主机的性能数据,可以是现有监控技术中待监控的宿主机的各项参数等,本实施例对此不做特别限制。而本实施例中,接收到各个宿主机发送的本宿主机的性能数据,是可以通过预先在所有被监控的宿主机上安装采集工具telegraf的方式来实现的,即通过此采集工具,各个宿主机可以主动采集本宿主机的各项性能数据。
本实施例中,预先创建的influxdb可以是一个或多个,创建的位置可以在如下任一或多个位置:
宿主机、虚拟机、共享节点、监控节点。
另外,接收的监控操作指令,可以通过API接口接收。例如在如下任一或多个位置上安装pluto_api,可以通过此pluto_api接收监控操作指令:
宿主机、共享节点、监控节点。
而安装的pluto_api的个数可以是一个或多个,可根据实际需要进行安装。
相应地,在进行监控操作指令的处理时,可以通过图表等形式进行展示。即可以在如下任一或多个位置上安装性能图表展示工具grafana,从而展示监控操作指令指定的宿主机的性能数据:
宿主机、共享节点、监控节点。
还有,上述数据库influxdb、pluto_api以及性能图表展示工具可以安装在同一个位置,也可以分别安装在不同的位置,只需要相互之间保持正常通讯传输即可。
下面结合附图及实际应用,说明上述方法的一种实施方式。
此种实施方式中,对集群宿主机的监控方法的完整过程,包括配置过程和监控过程。其中,配置过程可认为是预先操作的,包括数据库安装、采集安装、页面展示和统一接口模块安装,此过程如图1所示。
步骤101,选择宿主机安装存储采集到的性能数据的数据库influxdb;
该步骤中,还可以选择宿主机或者虚拟机或者共享节点安装数据库influxdb,存储采集到的宿主机性能数据。数据库influxdb的安装位置一般可以根据整个数据中心内多个Openstack的宿主机资源数量选择。
步骤102,在所有被监控的宿主机上安装采集工具telegraf;
该步骤中,在数据中心下各个宿主机安装监控采集agent工具telegraf,用于宿主机主动采集宿主机的各项性能数据。
步骤103,安装性能图表展示工具grafana;
该步骤中,可以选择某个主机、共享节点或监控节点安装性能图标展示工具grafana,可以以页面展示的形式展示出待监控的宿主机的各项性能数据。
步骤104,安装客户端接口pluto_api为第三方提供统一API(ApplicationProgram Interface,应用程序接口);
该步骤中,可以选择某个主机、共享节点或监控节点安装接口客户端pluto_api为其他第三方提供接口展示监控数据。pluto_api的数量也可以是一个或多个,一般实施应用中可以是1个或3个等。
上述配置过程只是为了便于解释说明,采用了先后顺序的方式。实际应用中,这些配置操作也可以按照其他先后顺序进行执行,本文对此不做限制。
按照上述描述进行配置后,进行监控操作,该过程如图2所示,包括如下操作步骤:
步骤201,接收被监控的各个宿主机发送的本宿主机的性能数据;
其中,可以是实时接收各个宿主机发送的本宿主机的性能数据,也可以是周期性接收各个宿主机发送的本宿主机的性能数据。接收方式可按照实际情况进行配置。
步骤202,将接收到的被监控的所有宿主机的性能数据存储至预先创建的influxdb中;
步骤203,通过客户端接口pluto_api接收用户发起的监控操作指令;
该步骤中,监控操作指令是一个统称,可以是现有监控操作指令也可以新增的监控操作指令,只要属于监控管理范围内的操作,均可以认为是本文中所称的监控操作指令。
步骤204:根据接收到的监控操作指令,从influxdb中查询指定的宿主机的性能数据;
其中,监控操作指令指定的宿主机的性能数据,即指监控操作指令要求反馈的被监控的宿主机及其监控的性能数据。
步骤205:将所查询到的宿主机的性能数据通过性能图标展示工具grafana展示给用户,例如以页面展示的形式进行显示。
从上述描述可以看出,本实施例采用各个宿主机主动采集本宿主机的性能数据的方式来收集待监控数据,即脱离了宿主机的Openstack版本,因此可以对整个集群宿主机进行统一的监控管理,而不再受Openstack版本不同带来的差异的限制。
实施例2
本实施例提供一种对集群宿主机的监控系统,包括存储器和处理器,其中:
存储器,用于保存对集群宿主机的监控程序;
处理器,用于读取执行所述对集群宿主机的监控程序,执行如下操作:
接收被监控的各个宿主机发送的本宿主机的性能数据;
将接收到的被监控的所有宿主机的性能数据存储至预先创建的分布式时序数据库influxdb中;
当接收到监控操作指令时,从所述influxdb中查询所述监控操作指令指定的宿主机的性能数据并进行展示。
其中,处理器还进行如下操作:
预先在所有被监控的宿主机上安装采集工具telegraf,用于采集本宿主机的各项性能数据。
由此可以看出,本实施例收集的待监控数据,是由各个宿主机主动采集本宿主机的性能数据并上报给本监控系统的,因此与宿主机的Openstack版本无关。这样,在后续监控处理中,只需要对存储在influxdb中的监控数据进行对应的操作,从而实现对整个集群宿主机的统一监控管理,而不再受Openstack版本不同带来的差异的限制。
处理器还进行如下操作:
预先创建influxdb,创建位置可以是宿主机、虚拟机、共享节点以及监控节点中任一个或几个位置。
处理器还进行如下操作:
预先安装客户端应用程序接口pluto_api,通过pluto_api接收监控操作指令。安装pluto_api的装置可以是宿主机、共享节点、监控节点中任一个或几个位置。
处理器还进行如下操作:
预先安装性能图表展示工具grafana,用于展示从所述influxdb中查询到的所述监控操作指令指定的宿主机的性能数据:安装位置可以是宿主机、共享节点和监控节点中任一个或几个位置。
还有,上述数据库influxdb、pluto_api以及性能图表展示工具可以安装在同一个位置,也可以分别安装在不同的位置,只需要相互之间保持正常通讯传输即可。
从上述实施例可以看出,本申请技术方案主要应用于Openstack集群下宿主机的监控,这套监控系统独立于Openstack,可以后期单独部署。从而使得对数据中心内云资源进行监控时,可以随意添加进监控范围进行统一的管理,不再受Openstack版本不同带来的差异的限制。
本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本申请不限制于任何特定形式的硬件和软件的结合。
以上所述,仅为本发明的较佳实例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种对集群宿主机的监控方法,其特征在于,包括:
接收被监控的各个宿主机发送的本宿主机的性能数据;
将接收到的被监控的所有宿主机的性能数据存储至预先创建的分布式时序数据库influxdb中;
当接收到监控操作指令时,从所述influxdb中查询所述监控操作指令指定的宿主机的性能数据并进行展示。
2.如权利要求1所述的方法,其特征在于,该方法还包括:
预先在所有被监控的宿主机上安装采集工具telegraf,用于采集本宿主机的各项性能数据。
3.如权利要求1或2所述的方法,其特征在于,该方法还包括:
预先在如下任一或多个位置上创建所述influxdb:
宿主机、虚拟机、共享节点、监控节点。
4.如权利要求3所述的方法,其特征在于,该方法还包括:
在如下任一或多个位置上安装客户端应用程序接口pluto_api,通过所述pluto_api接收监控操作指令:
宿主机、共享节点、监控节点。
5.如权利要求4所述的方法,其特征在于,该方法还包括:
在如下任一或多个位置上安装性能图表展示工具grafana,用于展示从所述influxdb中查询到的所述监控操作指令指定的宿主机的性能数据:
宿主机、共享节点、监控节点。
6.一种对集群宿主机的监控系统,包括存储器和处理器,其中:
所述存储器,用于保存对集群宿主机的监控程序;
所述处理器,用于读取执行所述对集群宿主机的监控程序,执行如下操作:
接收被监控的各个宿主机发送的本宿主机的性能数据;
将接收到的被监控的所有宿主机的性能数据存储至预先创建的分布式时序数据库influxdb中;
当接收到监控操作指令时,从所述influxdb中查询所述监控操作指令指定的宿主机的性能数据并进行展示。
7.如权利要求6所述的系统,其特征在于,所述处理器还进行如下操作:
预先在所有被监控的宿主机上安装采集工具telegraf,用于采集本宿主机的各项性能数据。
8.如权利要求6或7所述的系统,其特征在于,所述处理器还进行如下操作:
预先在如下任一或多个位置上创建所述influxdb:
宿主机、虚拟机、共享节点、监控节点。
9.如权利要求8所述的系统,其特征在于,所述处理器还进行如下操作:
在如下任一或多个位置上安装客户端应用程序接口pluto_api,通过所述pluto_api接收监控操作指令:
宿主机、共享节点、监控节点。
10.如权利要求9所述的系统,其特征在于,所述处理器还进行如下操作:
在如下任一或多个位置上安装性能图表展示工具grafana,用于展示从所述influxdb中查询到的所述监控操作指令指定的宿主机的性能数据:
宿主机、共享节点、监控节点。
CN201910529534.6A 2019-06-19 2019-06-19 一种对集群宿主机的监控系统及方法 Pending CN110247801A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910529534.6A CN110247801A (zh) 2019-06-19 2019-06-19 一种对集群宿主机的监控系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910529534.6A CN110247801A (zh) 2019-06-19 2019-06-19 一种对集群宿主机的监控系统及方法

Publications (1)

Publication Number Publication Date
CN110247801A true CN110247801A (zh) 2019-09-17

Family

ID=67888123

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910529534.6A Pending CN110247801A (zh) 2019-06-19 2019-06-19 一种对集群宿主机的监控系统及方法

Country Status (1)

Country Link
CN (1) CN110247801A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113542074A (zh) * 2021-08-04 2021-10-22 成都安恒信息技术有限公司 一种可视化管理kubernetes集群的东西向网络流量的方法及系统
CN114490248A (zh) * 2021-12-31 2022-05-13 南京维拓科技股份有限公司 一种工作站性能监控及告警系统及其方法
WO2023024307A1 (zh) * 2021-08-27 2023-03-02 苏州浪潮智能科技有限公司 应用服务监控方法、装置、电子设备及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105243008A (zh) * 2015-11-02 2016-01-13 上海新炬网络信息技术有限公司 一种基于宿主机的虚拟机性能监控方法
US20160036640A1 (en) * 2013-03-13 2016-02-04 Lawrence Livermore National Security, Llc Internet protocol network mapper
CN107404417A (zh) * 2017-07-25 2017-11-28 郑州云海信息技术有限公司 一种监控数据的处理方法、处理装置及处理系统
CN108848157A (zh) * 2018-06-12 2018-11-20 郑州云海信息技术有限公司 一种Kubernetes集群容器监控的方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160036640A1 (en) * 2013-03-13 2016-02-04 Lawrence Livermore National Security, Llc Internet protocol network mapper
CN105243008A (zh) * 2015-11-02 2016-01-13 上海新炬网络信息技术有限公司 一种基于宿主机的虚拟机性能监控方法
CN107404417A (zh) * 2017-07-25 2017-11-28 郑州云海信息技术有限公司 一种监控数据的处理方法、处理装置及处理系统
CN108848157A (zh) * 2018-06-12 2018-11-20 郑州云海信息技术有限公司 一种Kubernetes集群容器监控的方法和装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113542074A (zh) * 2021-08-04 2021-10-22 成都安恒信息技术有限公司 一种可视化管理kubernetes集群的东西向网络流量的方法及系统
CN113542074B (zh) * 2021-08-04 2023-03-10 成都安恒信息技术有限公司 一种可视化管理kubernetes集群的东西向网络流量的方法及系统
WO2023024307A1 (zh) * 2021-08-27 2023-03-02 苏州浪潮智能科技有限公司 应用服务监控方法、装置、电子设备及可读存储介质
CN114490248A (zh) * 2021-12-31 2022-05-13 南京维拓科技股份有限公司 一种工作站性能监控及告警系统及其方法

Similar Documents

Publication Publication Date Title
US10515000B2 (en) Systems and methods for performance testing cloud applications from multiple different geographic locations
US10320709B2 (en) Configuring a service based on manipulations of graphical representations of abstractions of resources
JP6346377B2 (ja) 1つまたは複数のクラウドシステムにアプリケーションを移動可能にデプロイする方法及びシステム
CN103814362B (zh) 用于分布式kvs系统的处理方法和系统
CN106933508B (zh) 应用容器的迁移方法及装置
US9606894B2 (en) Collaborative collection of diagnostics data of software programs
CN110247801A (zh) 一种对集群宿主机的监控系统及方法
JP2004227359A (ja) ポリシーに基づいたストレージシステムの運用管理方法
US7680905B1 (en) Methods and system for viewing SAN resources
US20080177948A1 (en) Method and apparatus for managing placement of data in a tiered storage system
US10025630B2 (en) Operating programs on a computer cluster
US9612899B2 (en) Collaborative collection of diagnostics data of software programs
WO2015057188A1 (en) Package dependency maps for distributed computing
CN108345477B (zh) 一种双镜像共享conf分区文件的设计方法及装置
US11681585B2 (en) Data migration for a shared database
CN103077070A (zh) 云计算管理系统以及云计算系统的管理方法
US20180234327A1 (en) Method and apparatus to manage it infrastructure based on application characteristics
CN112181762A (zh) 软件项目应用基础环境部署与三遥的可视化处理方法
CN108604231A (zh) 镜像处理方法以及计算设备
US20150193150A1 (en) Storage system management computer and management method for storage system
CN114282620A (zh) 一种多源信息物理孪生数据融合管理方法与管理系统
EP2821928A2 (en) Method and system for limiting output results in a mobile telecommunication system
US7881946B1 (en) Methods and apparatus for guiding a user through a SAN management process
US20180219728A1 (en) Provisioning and activating hardware resources
CN109995617A (zh) 主机管理特性的自动化测试方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190917