CN106911783A - 一种面向超融合一体机的资源监控系统 - Google Patents

一种面向超融合一体机的资源监控系统 Download PDF

Info

Publication number
CN106911783A
CN106911783A CN201710116061.8A CN201710116061A CN106911783A CN 106911783 A CN106911783 A CN 106911783A CN 201710116061 A CN201710116061 A CN 201710116061A CN 106911783 A CN106911783 A CN 106911783A
Authority
CN
China
Prior art keywords
data
modules
monitorserver
zookeeper
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710116061.8A
Other languages
English (en)
Other versions
CN106911783B (zh
Inventor
高英
艾如鹏
黄永燊
陈志凌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201710116061.8A priority Critical patent/CN106911783B/zh
Publication of CN106911783A publication Critical patent/CN106911783A/zh
Application granted granted Critical
Publication of CN106911783B publication Critical patent/CN106911783B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)

Abstract

本发明公开了一种面向超融合一体机的资源监控系统,包括若干个HcpMonitor监控组件,所述HcpMonitor监控组件包括MonitorServer模块和MonitorClient模块;若干个所述HcpMonitor监控组件依据ZooKeeper客户端框架选择其中一个MonitorServer模块为主控节点,其他MonitorServer模块作为随从节点处于待命状态,所述MonitorClient模块从ZooKeeper组件中采集数据,将采集到的数据传送到AMQP Message Middle文件中,其中作为主控节点的MonitorServer模块从AMQP Message Middle文件中读取到数据后,进行数据分析处理,通过ZooKeeper集群进行分布式管理。本发明基于超融合基础架构,系统简单高效的,减少监控系统的侵入性,可用性高,最大限度的共享超融合基础架构已有的资源,数据采集、处理高效。

Description

一种面向超融合一体机的资源监控系统
技术领域
本发明涉及计算机领域,尤其涉及一种面向超融合一体机的资源监控系统。
背景技术
超融合是云计算的一个新分支,主要关注于虚拟计算、分布式存储与虚拟网络的融合,定位于实现私有云平台。目前超融合集群以最少3个物理节点组成,每个节点都处于对等的地位,集群扩展以节点线性扩展的方式扩展。但目前在实际生产环境中,超融合平台由众多物理机以及运行在物理机上的超融合相关服务组成,当平台规模变大时,集群的物理服务器会很多,上面运行着成千上万的租户的虚拟机实例,单纯依靠系统管理员的经验和运维人员来进行监控和维护是不现实也不合理的。
传统的资源监控方案中,如Ganglia,一般采用侵入式的数据采集方式,这种监控方式会影响到虚拟机的用户体验,而且对于恶意用户恶意关闭监控程序等现象没有很好的解决办法,同时也会增加系统的复杂程度。因此需要一个简单高效的系统将整个集群的物理资源和虚拟资源等同时监控起来,监控系统不会随着监控数据的增加被压垮,同时降低虚拟机监控的侵入性。
发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是提供一种面向超融合一体机的资源监控系统,本系统通过Libvirt接口等方式,减少监控系统的侵入性,同时使用基于ZooKeeper的分布式架构,来保证整个监控集群的高可用性。
为实现上述目的,本发明提供了一种面向超融合一体机的资源监控系统,包括若干个HcpMonitor监控组件,所述HcpMonitor监控组件包括MonitorServer模块和MonitorClient模块;
若干个所述HcpMonitor监控组件依据ZooKeeper客户端框架选择其中一个MonitorServer模块为主控节点,其他MonitorServer模块作为随从节点处于待命状态,所述MonitorClient模块从ZooKeeper组件中采集数据,将采集到的数据传送到AMQP MessageMiddle文件中,其中作为主控节点的MonitorServer模块从AMQP Message Middle文件中读取到数据后,进行数据分析处理,通过ZooKeeper集群进行分布式管理。
较佳的,所述MonitorServer模块工作流程包括如下步骤:
S1:服务器初始化;
S2:判断是否成为主控节点,如果否,则执行步骤S3,否则,则执行步骤S4;
S3:放弃等待,放弃CPU占用并且等待,并定时执行步骤S2。
S4:集群管理,管理HcpMonitor监控组件集群的主循环,包括设置监听器,处理数据等工作,执行完毕后,继续执行步骤S2。
较佳的,所述MonitorClient模块中包括数据收集器和主循环器;
所述数据收集器主要使用Linux常见的系统工具以及Python脚本调用Libvirt的方式来获取物理机和虚拟机对应的监控信息;
所述主循环器的流程如下:
A1:获取物理机状态;
A2:获取物理机数据;
A3:获取监控数据;
A4:数据适配器处理;
A5:判断是否结束,是则结束程序,否则执行步骤A1。
较佳的,所述步骤S1中服务器初始化流程如下:
S1-1:初始化ZooKeeper路径,对ZooKeeper中所有使用到的路径根据应有的状态进行初始化,如果不存在的则进行创建;
S1-2:初始化清理线程,启动一根线程定时清理集群中所有长期未处理的请求和未响应的事件,防止集群资源的浪费;
S1-3:初始化配置线程,启动集群配置的更新线程,该线程的主要工作是定时同步所修改的集群配置,让集群配置可以更新同步到每台物理机上。
较佳的,所述步骤S4中集群管理的流程如下:
S4-1:设置监听器,初始化所有的监听事件,包括/hosts、/hosts-ephemeral以及/monitor等,并且根据所触发的节点事件来生成集群的事件,包括物理节点上线、物理节点掉线、虚拟机上线、虚拟机掉线等等;
S4-2:清理旧数据,新选出来的主控节点会对旧主控节点产生的集群数据进行清理,防止有数据不一致的情况发生;
S4-3:判断是否结束程序,如果是则结束成程序,否则继续执行下一步;
S4-4:收集数据;
S4-5:数据处理;
S4-6:返回步骤S4-3继续执行。
本发明的有益效果是:本发明提出了一种面向超融合一体机的资源监控系统,此监控系统基于超融合基础架构下,系统简单高效的,减少监控系统的侵入性,可用性高,最大限度的共享超融合基础架构已有的资源,数据采集、处理高效。
附图说明
图1是本发明总体结构图;
图2是本发明MonitorServer模块工作流程图;
图3是本发明主循环器的工作流程图;
图4是本发明服务器初始化工作流程图;
图5是本发明集群管理的工作流程图;
具体实施方式
下面结合附图和实施例对本发明作进一步说明:
如图1所示,本实施例包括若干个HcpMonitor监控组件,所述HcpMonitor监控组件包括MonitorServer模块和MonitorClient模块;若干个所述HcpMonitor监控组件依据ZooKeeper客户端框架选择其中一个MonitorServer模块为主控节点,其他MonitorServer模块作为随从节点处于待命状态,所述MonitorClient模块从ZooKeeper组件中采集数据,将采集到的数据传送到AMQP Message Middle文件中,其中作为主控节点的MonitorServer模块从AMQP Message Middle文件中读取到数据后,进行数据分析处理,并将数据传输给ZooKeeper集群和MariaDB Cluster数据库集群,通过ZooKeeper集群进行分布式管理。
如图2所示,所述MonitorServer模块工作流程包括如下步骤:
S1:服务器初始化;
S2:判断是否成为主控节点,如果否,则执行步骤S3,否则执行步骤S4;
S3:放弃等待,放弃CPU占用并且等待,并每隔一段时间定时执行步骤S2,本实施例每隔5s或者10s定时执行步骤S2。
S4:集群管理,管理HcpMonitor监控组件集群的主循环,包括设置监听器,处理数据等工作,执行完毕后,继续执行步骤S2。
如图3所示,所述MonitorClient模块中包括数据收集器和主循环器;
所述数据收集器主要使用Linux常见的系统工具以及Python脚本调用Libvirt的方式来获取物理机和虚拟机对应的监控信息;
所述主循环器的流程如下:
A1:获取物理机状态;
A2:获取物理机数据;
A3:获取监控数据;
A4:数据适配器处理;
A5:判断是否结束,是则结束程序,否则执行步骤A1。
如图4所示,所述步骤S1中服务器初始化流程如下:
S1-1:初始化ZooKeeper路径,对ZooKeeper中所有使用到的路径根据应有的状态进行初始化,如果不存在的则进行创建;
S1-2:初始化清理线程,启动一根线程定时清理集群中所有长期未处理的请求和未响应的事件,防止集群资源的浪费;
S1-3:初始化配置线程,启动集群配置的更新线程,该线程的主要工作是定时同步所修改的集群配置,让集群配置可以更新同步到每台物理机上。
如图5所示所述步骤S4中集群管理的流程如下:
S4-1:设置监听器,初始化所有的监听事件,包括/hosts、/hosts-ephemeral以及/monitor等,并且根据所触发的节点事件来生成集群的事件,包括物理节点上线、物理节点掉线、虚拟机上线、虚拟机掉线等等;
S4-2:清理旧数据,新选出来的主控节点会对旧主控节点产生的集群数据进行清理,防止有数据不一致的情况发生;
S4-3:判断是否结束程序,如果是则结束成程序,否则继续执行下一步;
S4-4:收集数据;
S4-5:数据处理;
S4-6:返回步骤S4-3继续执行。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (5)

1.一种面向超融合一体机的资源监控系统,其特征在于:包括若干个HcpMonitor监控组件,所述HcpMonitor监控组件包括MonitorServer模块和MonitorClient模块;
若干个所述HcpMonitor监控组件依据ZooKeeper客户端框架选择其中一个MonitorServer模块为主控节点,其他MonitorServer模块作为随从节点处于待命状态,所述MonitorClient模块从ZooKeeper组件中采集数据,将采集到的数据传送到AMQP MessageMiddle文件中,其中作为主控节点的MonitorServer模块从AMQP Message Middle文件中读取到数据后,进行数据分析处理,通过ZooKeeper集群进行分布式管理。
2.如权利要求1所述的一种面向超融合一体机的资源监控系统,其特征在于:所述MonitorServer模块工作流程包括如下步骤:
S1:服务器初始化;
S2:判断是否成为主控节点,如果否,则执行步骤S3,否则执行步骤S4;
S3:放弃等待,放弃CPU占用并且等待,并定时执行步骤S2;
S4:集群管理,管理HcpMonitor监控组件集群的主循环,包括设置监听器,处理数据等工作,执行完毕后,继续执行步骤S2。
3.如权利要求1所述的一种面向超融合一体机的资源监控系统,其特征在于:所述MonitorClient模块中包括数据收集器和主循环器;
所述数据收集器主要使用Linux系统工具以及Python脚本调用Libvirt的方式来获取物理机和虚拟机对应的监控信息;
所述主循环器的流程如下:
A1:获取物理机状态;
A2:获取物理机数据;
A3:获取监控数据;
A4:数据适配器处理;
A5:判断是否结束,是则结束程序,否则执行步骤A1。
4.如权利要求2所述的一种面向超融合一体机的资源监控系统,其特征在于:所述步骤S1中服务器初始化流程如下:
S1-1:初始化ZooKeeper路径,对ZooKeeper中所有使用到的路径根据应有的状态进行初始化,如果不存在的则进行创建;
S1-2:初始化清理线程,启动一根线程定时清理集群中所有长期未处理的请求和未响应的事件,防止集群资源的浪费;
S1-3:初始化配置线程,启动集群配置的更新线程,该线程的主要工作是定时同步所修改的集群配置,让集群配置可以更新同步到每台物理机上。
5.如权利要求2所述的一种面向超融合一体机的资源监控系统,其特征在于:所述步骤S4中集群管理的流程如下:
S4-1:设置监听器,初始化所有的监听事件,包括/hosts、/hosts-ephemeral以及/monitor等,并且根据所触发的节点事件来生成集群的事件,包括物理节点上线、物理节点掉线、虚拟机上线、虚拟机掉线等等;
S4-2:清理旧数据,新选出来的主控节点会对旧主控节点产生的集群数据进行清理,防止有数据不一致的情况发生;
S4-3:判断是否结束程序,如果是则结束成程序,否则继续执行下一步;
S4-4:收集数据;
S4-5:数据处理;
S4-6:返回步骤S4-3继续执行。
CN201710116061.8A 2017-03-01 2017-03-01 一种面向超融合一体机的资源监控系统 Expired - Fee Related CN106911783B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710116061.8A CN106911783B (zh) 2017-03-01 2017-03-01 一种面向超融合一体机的资源监控系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710116061.8A CN106911783B (zh) 2017-03-01 2017-03-01 一种面向超融合一体机的资源监控系统

Publications (2)

Publication Number Publication Date
CN106911783A true CN106911783A (zh) 2017-06-30
CN106911783B CN106911783B (zh) 2020-04-24

Family

ID=59208465

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710116061.8A Expired - Fee Related CN106911783B (zh) 2017-03-01 2017-03-01 一种面向超融合一体机的资源监控系统

Country Status (1)

Country Link
CN (1) CN106911783B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107844402A (zh) * 2017-11-17 2018-03-27 北京联想超融合科技有限公司 一种基于超融合存储系统的资源监控方法、装置及终端

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102681899A (zh) * 2011-03-14 2012-09-19 金剑 云计算服务平台的虚拟计算资源动态管理系统
US20140025770A1 (en) * 2012-07-17 2014-01-23 Convergent.Io Technologies Inc. Systems, methods and devices for integrating end-host and network resources in distributed memory
CN103905537A (zh) * 2014-03-20 2014-07-02 冶金自动化研究设计院 分布式环境下管理工业实时数据存储的系统
CN104461740A (zh) * 2014-12-12 2015-03-25 国家电网公司 一种跨域集群计算资源聚合和分配的方法
CN104506589A (zh) * 2014-12-10 2015-04-08 上海爱数软件有限公司 一种基于超融合存储的资源迁移调度方法
US20150186175A1 (en) * 2013-12-31 2015-07-02 Vmware, Inc. Pre-configured hyper-converged computing device
CN105721582A (zh) * 2016-02-22 2016-06-29 中国农业银行股份有限公司 多节点文件备份系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102681899A (zh) * 2011-03-14 2012-09-19 金剑 云计算服务平台的虚拟计算资源动态管理系统
US20140025770A1 (en) * 2012-07-17 2014-01-23 Convergent.Io Technologies Inc. Systems, methods and devices for integrating end-host and network resources in distributed memory
US20150186175A1 (en) * 2013-12-31 2015-07-02 Vmware, Inc. Pre-configured hyper-converged computing device
CN103905537A (zh) * 2014-03-20 2014-07-02 冶金自动化研究设计院 分布式环境下管理工业实时数据存储的系统
CN104506589A (zh) * 2014-12-10 2015-04-08 上海爱数软件有限公司 一种基于超融合存储的资源迁移调度方法
CN104461740A (zh) * 2014-12-12 2015-03-25 国家电网公司 一种跨域集群计算资源聚合和分配的方法
CN105721582A (zh) * 2016-02-22 2016-06-29 中国农业银行股份有限公司 多节点文件备份系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
周儒军: "基于Hadoop的分布式监控平台的研究与实现", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
易柏胜: "基于zookeeper的虚拟机动态变更机制的设计与实现", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107844402A (zh) * 2017-11-17 2018-03-27 北京联想超融合科技有限公司 一种基于超融合存储系统的资源监控方法、装置及终端

Also Published As

Publication number Publication date
CN106911783B (zh) 2020-04-24

Similar Documents

Publication Publication Date Title
CN106126346B (zh) 一种大规模分布式数据采集系统及方法
CN103064742B (zh) 一种hadoop集群的自动部署系统及方法
CN104618693B (zh) 一种基于云计算的监控视频在线处理任务管理方法及系统
Beloglazov et al. OpenStack Neat: a framework for dynamic and energy‐efficient consolidation of virtual machines in OpenStack clouds
CN105677486B (zh) 数据并行处理方法及系统
CN103024060B (zh) 一种开放式云计算大规模集群监控系统及方法
CN101738997B (zh) 多线程电力负控系统及控制方法
CN105357296A (zh) 一种Docker云平台下弹性缓存系统
CN112162821B (zh) 容器集群资源监视方法、装置及系统
CN106850260A (zh) 一种虚拟化资源管理平台的部署方法和装置
CN102857363A (zh) 一种虚拟网络的自主管理系统和方法
CN102508709A (zh) 购供售一体化电能量采集与监控系统中基于分布式缓存的采集任务调度方法
CN103164283A (zh) 一种虚拟桌面系统中虚拟化资源动态调度管理方法及系统
CN112437129B (zh) 集群的管理方法及集群的管理装置
Maeno et al. Evolution of the ATLAS PanDA production and distributed analysis system
CN105096181A (zh) 一种大数据的电商交易方法及电商交易系统
CN114598586A (zh) 一种多云场景算力网格化方法及系统
CN102915255A (zh) 用于大规模数据集并行运算的云计算服务系统和方法
CN101256599A (zh) 基于网格的分布仿真平台数据收集系统
CN110245020A (zh) 基于多个取证设备的手机内容取证方法和系统
CN106911783A (zh) 一种面向超融合一体机的资源监控系统
CN109302319B (zh) 报文池分布式集群及其管理方法
KR101509506B1 (ko) 모바일 클라우드 컴퓨팅 환경에서의 리소스 제공 시스템 및 그 방법
Yongdnog et al. A scalable and integrated cloud monitoring framework based on distributed storage
Yang et al. An extensible Hadoop framework for monitoring performance metrics and events of OpenStack cloud

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200424

Termination date: 20210301