CN108874543A - 一种容器集群管理方法和系统 - Google Patents

一种容器集群管理方法和系统 Download PDF

Info

Publication number
CN108874543A
CN108874543A CN201810581059.2A CN201810581059A CN108874543A CN 108874543 A CN108874543 A CN 108874543A CN 201810581059 A CN201810581059 A CN 201810581059A CN 108874543 A CN108874543 A CN 108874543A
Authority
CN
China
Prior art keywords
load
cluster
container cluster
node
container
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810581059.2A
Other languages
English (en)
Inventor
吴栋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201810581059.2A priority Critical patent/CN108874543A/zh
Publication of CN108874543A publication Critical patent/CN108874543A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system

Abstract

本发明公开了一种容器集群管理方法和系统。涉及云计算领域,解决了现有的容器集群配置方式浪费资源的问题。该方法包括:监控容器集群内各节点的负载情况;根据监控得到的负载情况,调整所述容器集群的规模。本发明提供的技术方案适用于云计算平台,实现了兼顾效率与资源利用率的容器集群管理机制。

Description

一种容器集群管理方法和系统
技术领域
本发明涉及云计算技术,尤指一种容器集群管理方法和系统。
背景技术
随着信息技术的发展,云计算已经逐步成为了业界的发展热点,云计算技术也逐渐被应用到教育、科学、文化、公安、政府、卫生、高性能计算、电子商务、物联网等多个领域,随之云计算服务平台的使用量和活跃度也与日俱增。随着云计算的发展,云计算管理平台系统的逐渐庞大,单纯靠虚拟机在灵活性、效率等方面已经难以满足用户日益复杂的需求,容器技术应运而生,容器技术的便捷性在云计算领域引起了革命性的变革。
日益复杂庞大的云平台系统中,各功能模块日益复杂,系统的规模无论从设备数量还是规模和之前计算系统都不在一个数量级。在容器技术发展的如火如荼大背景下,容器在云计算领域为用户提供服务的便捷性、高效性优点日渐凸显出来,同时容器集群的维护工作也为运维人员带来了巨大的负担。在实际的容器生产环境中,由于用户实际业务具有周期性,当业务高峰期时需要投入大量的计算资源以提供容器服务,提供高效的业务服务,当业务低谷期时大量的计算资源就会出现荒置的情况,造成资源浪费,这样就违背了云计算绿色、高效的宗旨。
发明内容
为了解决上述技术问题,本发明提供了一种容器集群管理方法和系统,通过监控容器集群,动态调整容器集群的规模,实现了兼顾效率与资源利用率的容器集群管理机制。
为了达到本发明目的,本发明提供了一种容器集群管理方法,其特征在于,包括:
监控容器集群内各节点的负载情况;
根据监控得到的负载情况,调整所述容器集群的规模。
优选的,所述根据监控得到的负载情况,调整所述容器集群的规模的步骤包括:
在所述容器集群内负载低于预置的负载低位水平的节点数量达到预置的集群收缩门限时,将所述容器集群的规模缩小。
优选的,所述监控容器集群内各节点的负载情况的步骤包括:
在第一周期内多次检查到同一节点的负载均低于所述负载低位水平时,判定所述节点负载低于所述负载低位水平。
优选的,所述根据监控得到的负载情况,调整所述容器集群的规模的步骤包括:
在所述容器集群内负载高于预置的负载高位水平的节点数量达到预置的集群扩大门限时,将所述容器集群的规模扩大。
优选的,所述监控容器集群内各节点的负载情况的步骤包括:
在第二周期内多次检查到同一节点的负载均高于所述负载高位水平时,判定所述节点负载高于所述负载高位水平。
本发明还提供了一种容器集群管理系统,包括:
监控模块,用于监控容器集群内各节点的负载情况;
集群调整模块,用于根据监控得到的负载情况,调整所述容器集群的规模。
优选的,所述集群调整模块包括:
收缩单元,用于在所述容器集群内负载低于预置的负载低位水平的节点数量达到预置的集群收缩门限时,将所述容器集群的规模缩小;
扩大单元,用于在所述容器集群内负载高于预置的负载高位水平的节点数量达到预置的集群扩大门限时,将所述容器集群的规模扩大。
优选的,所述监控模块包括:
低水平监测单元,用于在第一周期内多次检查到同一节点的负载均低于所述负载低位水平时,判定所述节点负载低于所述负载低位水平;
高水平监测单元,用于在第二周期内多次检查到同一节点的负载均高于所述负载高位水平时,判定所述节点负载高于所述负载高位水平。
本发明提供的一种容器集群管理方法和系统,监控容器集群内各节点的负载情况,然后根据监控得到的负载情况,调整所述容器集群的规模。实现了兼顾效率与资源利用率的容器集群管理机制,解决了现有的容器集群配置方式浪费资源的问题。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1为本发明的一实施例提供的一种容器集群管理方法的流程示意图;
图2为本发明的一实施例提供的一种容器集群管理系统的架构示意图;
图3为图2中集群调整模块202的结构示意图;
图4为图2中监控模块201的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
日益复杂庞大的云平台系统中,各功能模块日益复杂,系统的规模无论从设备数量还是规模和之前计算系统都不在一个数量级。在容器技术发展的如火如荼大背景下,容器在云计算领域为用户提供服务的便捷性、高效性优点日渐凸显出来,同时容器集群的维护工作也为运维人员带来了巨大的负担。在实际的容器生产环境中,由于用户实际业务具有周期性,当业务高峰期时需要投入大量的计算资源以提供容器服务,提供高效的业务服务,当业务低谷期时大量的计算资源就会出现荒置的情况,造成资源浪费,这样就违背了云计算绿色、高效的宗旨。
为了解决上述问题,本发明的实施例提供了一种容器集群管理方法和系统,下面结合附图进行详细说明。
本发明的一实施例提供了一种容器集群管理方法,使用该方法完成对容器集群的规模进行管理调整的流程如图1所示,包括:
步骤101、监控容器集群内各节点的负载情况。
本步骤中,对容器集群内各节点的负载情况进行监控,判定节点的工作状态,在节点的负载持续低于预置的负载低位水平时判定节点负载低于负载低位水平,在节点的负载持续高于预置的负载高位水平时判定节点负载高于负载高位水平。
具体的,可在第一周期内多次检测到同一节点的负载均低于所述负载低位水平时,判定所述节点负载低于所述负载低位水平。可根据具体应用需求,设置第一周期长度和判定所需的检测次数。例如在第一周期内检测M次,M次的检测结果均低于所述负载低位水平时,判定该节点的负载低于所述负载低位水平;也可设置判定门限N,在M次检测得到的结果中有N次检测结果低于所述负载低位水平时,判定该节点的负载低于所述负载低位水平。
在第二周期内多次检测到同一节点的负载均高于所述负载高位水平时,判定所述节点负载高于所述负载高位水平。可根据具体应用需求,设置第二周期长度和判定所需的检测次数。例如在第二周期内检测M次,M次的检测结果均高于所述负载高位水平时,判定该节点的负载高于所述负载高位水平;也可设置判定门限N,在M次检测得到的结果中有N次检测结果高于所述负载高位水平时,判定该节点的负载高于所述负载高位水平。
第一周期与第二周期长度可相同,也可不同。
步骤102、根据监控得到的负载情况,调整所述容器集群的规模。
本步骤中,在所述容器集群内负载低于预置的负载低位水平的节点数量达到预置的集群收缩门限时,将所述容器集群的规模缩小;在所述容器集群内负载高于预置的负载高位水平的节点数量达到预置的集群扩大门限时,将所述容器集群的规模扩大。
优选的,采用虚拟机等虚拟资源构建容器集群,以便对容器集群的规模进行动态调整。
本发明实施例提供的一种容器集群管理方法,监控容器集群内各节点的负载情况,然后根据监控得到的负载情况,调整所述容器集群的规模。实现了兼顾效率与资源利用率的容器集群管理机制,解决了现有的容器集群配置方式浪费资源的问题。利用容器宿主机集群架构一致性、集群节点可动态调整的特性,当容器集群各节点性能压力比较大时,通过虚拟化手段扩展容器服务节点,以提供更加高效的服务,当容器集群各节点性能压力持续较小时,通过虚拟化手段缩减容器服务节点,以降低系统能耗,达到节能的效果。
本发明的一实施例还提供了一种容器集群管理方法,以Kubernetes集群作为容器集群,通过Magnum+Heapster的容器集群水平伸缩方案实现该方法。
本发明实施例中,利用容器编排框架Kubernetes能够自动发现服务,进行容器服务自动负载的特性。利用Openstack中Magnum组件能够实现Kubernetes集群部署的特性,并使用heapster实现对Kubernetes集群的性能监控,结合监控信息获取到各节点的负载情况,根据负载情况依赖magnum修改集群规模的特性实现Kubernetes集群的水平伸缩。
Openstack组件Magnum基于云主机、网络实现Kubernetes集群的自动化部署,在部署完成后自动地在Kubernetes集群中拉起Heapster和InfluxDB的容器服务,这两个组件负责对Kubernetes集群各节点的负载情况进行监控,当发现各节点负载持续保持高位后,则触发magnum组件将集群规模调大,当发现各节点的负载持续保持低位后,则触发magnum组件将集群规模调小,进而实现Kubernetes集群的自动化水平伸缩。
通过本发明实施例的容器集群管理方法实现容器集群自动化水平伸缩的详细步骤包括:
(1)制作虚拟机模板,操作系统目前支持Fedora-Automic版本,模板中内置创建Kubernetes集群需要的依赖包,制作完成后上传到glance。
(2)在openstack项目内创建Kubernetes集群,并设定自动拉起heapster+influxDB服务,实现对Kubernetes集群的监控。
(3)监控容器集群节点负载,保存集群负载数据,持续监测系统中集群节点的负载情况,持续高负载则触发扩展节点动作,持续低负载则触发缩减节点动作。
本发明实施例提供的容器集群管理方法,利用Magnum能够自动调整Kubernetes集群部署节点规模的特性,当容器服务节点持续高负载时,可以利用服务编排自动化高效部署节点的特性,及时部署容器服务节点,提高系统可用性。基于Magnum组件根据Heapster监控数据动态调整Kubernetes集群部署节点规模,容器服务可以自动发现并提供服务达到容器集群自动运维,实现水平伸缩。
基于Magnum组件调整集群规模特性,以Kubernetes容器集群节点性能指标为依据,当发现各节点负载持续保持高位后,则触发magnum组件将集群规模调大,当发现各节点的负载持续保持低位后,则触发magnum组件将集群规模调小,进而实现Kubernetes集群的自动化水平伸缩。2.4.2.本发明的权利要求如下
根据节点性能监控和用户设置,在需要进行节点调整的时候,适时地修改集群规模。结合对Kubernetes容器集群节点资源使用率监控,对容器集群自动横向扩展,实现容器集群的高可用方案。
本发明的一实施例还提供了一种容器集群管理系统,其架构如图2所示,包括:
监控模块201,用于监控容器集群内各节点的负载情况;
集群调整模块202,用于根据监控得到的负载情况,调整所述容器集群的规模。
优选的,所述集群调整模块202的结构如图3所示,包括:
收缩单元2021,用于在所述容器集群内负载低于预置的负载低位水平的节点数量达到预置的集群收缩门限时,将所述容器集群的规模缩小;
扩大单元2022,用于在所述容器集群内负载高于预置的负载高位水平的节点数量达到预置的集群扩大门限时,将所述容器集群的规模扩大。
优选的,所述监控模块201的结构如图4所示,包括:
低水平监测单元2011,用于在第一周期内多次检查到同一节点的负载均低于所述负载低位水平时,判定所述节点负载低于所述负载低位水平;
高水平监测单元2022,用于在第二周期内多次检查到同一节点的负载均高于所述负载高位水平时,判定所述节点负载高于所述负载高位水平。
本发明实施例提供的一种容器集群管理系统,能够与本发明的实施例提供的一种容器集群管理方法相结合,监控容器集群内各节点的负载情况,然后根据监控得到的负载情况,调整所述容器集群的规模。实现了兼顾效率与资源利用率的容器集群管理机制,解决了现有的容器集群配置方式浪费资源的问题。利用容器宿主机集群架构一致性、集群节点可动态调整的特性,当容器集群各节点性能压力比较大时,通过虚拟化手段扩展容器服务节点,以提供更加高效的服务,当容器集群各节点性能压力持续较小时,通过虚拟化手段缩减容器服务节点,以降低系统能耗,达到节能的效果。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。

Claims (8)

1.一种容器集群管理方法,其特征在于,包括:
监控容器集群内各节点的负载情况;
根据监控得到的负载情况,调整所述容器集群的规模。
2.根据权利要求1所述的容器集群管理方法,其特征在于,所述根据监控得到的负载情况,调整所述容器集群的规模的步骤包括:
在所述容器集群内负载低于预置的负载低位水平的节点数量达到预置的集群收缩门限时,将所述容器集群的规模缩小。
3.根据权利要求3所述的容器集群管理方法,其特征在于,所述监控容器集群内各节点的负载情况的步骤包括:
在第一周期内多次检查到同一节点的负载均低于所述负载低位水平时,判定所述节点负载低于所述负载低位水平。
4.根据权利要求2所述的容器集群管理方法,其特征在于,所述根据监控得到的负载情况,调整所述容器集群的规模的步骤包括:
在所述容器集群内负载高于预置的负载高位水平的节点数量达到预置的集群扩大门限时,将所述容器集群的规模扩大。
5.根据权利要求4所述的容器集群管理方法,其特征在于,所述监控容器集群内各节点的负载情况的步骤包括:
在第二周期内多次检查到同一节点的负载均高于所述负载高位水平时,判定所述节点负载高于所述负载高位水平。
6.一种容器集群管理系统,其特征在于,包括:
监控模块,用于监控容器集群内各节点的负载情况;
集群调整模块,用于根据监控得到的负载情况,调整所述容器集群的规模。
7.根据权利要求6所述的容器集群管理系统,其特征在于,所述集群调整模块包括:
收缩单元,用于在所述容器集群内负载低于预置的负载低位水平的节点数量达到预置的集群收缩门限时,将所述容器集群的规模缩小;
扩大单元,用于在所述容器集群内负载高于预置的负载高位水平的节点数量达到预置的集群扩大门限时,将所述容器集群的规模扩大。
8.根据权利要求7所述的容器集群管理系统,其特征在于,所述监控模块包括:
低水平监测单元,用于在第一周期内多次检查到同一节点的负载均低于所述负载低位水平时,判定所述节点负载低于所述负载低位水平;
高水平监测单元,用于在第二周期内多次检查到同一节点的负载均高于所述负载高位水平时,判定所述节点负载高于所述负载高位水平。
CN201810581059.2A 2018-06-05 2018-06-05 一种容器集群管理方法和系统 Pending CN108874543A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810581059.2A CN108874543A (zh) 2018-06-05 2018-06-05 一种容器集群管理方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810581059.2A CN108874543A (zh) 2018-06-05 2018-06-05 一种容器集群管理方法和系统

Publications (1)

Publication Number Publication Date
CN108874543A true CN108874543A (zh) 2018-11-23

Family

ID=64337260

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810581059.2A Pending CN108874543A (zh) 2018-06-05 2018-06-05 一种容器集群管理方法和系统

Country Status (1)

Country Link
CN (1) CN108874543A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112073223A (zh) * 2020-08-20 2020-12-11 丁禹 一种管控云计算终端和云服务器运作的系统及其方法
CN114327023A (zh) * 2021-12-30 2022-04-12 上海道客网络科技有限公司 一种Kubernetes集群的节能方法、系统、计算机介质和电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105979009A (zh) * 2016-07-06 2016-09-28 乾云众创(北京)信息科技研究院有限公司 一种针对云应用容器的增加负载自动均衡方法
CN107193652A (zh) * 2017-04-27 2017-09-22 华中科技大学 容器云环境中流数据处理系统的弹性资源调度方法及系统
CN107395731A (zh) * 2017-07-28 2017-11-24 郑州云海信息技术有限公司 一种基于服务编排的容器集群的调节方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105979009A (zh) * 2016-07-06 2016-09-28 乾云众创(北京)信息科技研究院有限公司 一种针对云应用容器的增加负载自动均衡方法
CN107193652A (zh) * 2017-04-27 2017-09-22 华中科技大学 容器云环境中流数据处理系统的弹性资源调度方法及系统
CN107395731A (zh) * 2017-07-28 2017-11-24 郑州云海信息技术有限公司 一种基于服务编排的容器集群的调节方法和装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112073223A (zh) * 2020-08-20 2020-12-11 丁禹 一种管控云计算终端和云服务器运作的系统及其方法
CN114327023A (zh) * 2021-12-30 2022-04-12 上海道客网络科技有限公司 一种Kubernetes集群的节能方法、系统、计算机介质和电子设备
CN114327023B (zh) * 2021-12-30 2023-08-15 上海道客网络科技有限公司 一种Kubernetes集群的节能方法、系统、计算机介质和电子设备

Similar Documents

Publication Publication Date Title
CN102713854B (zh) 一种容器状态的保存和恢复的方法及装置
US8739169B2 (en) Method for monitoring operating experiences of images to improve workload optimization in cloud computing environments
CN103631633B (zh) 虚拟机全系统在线迁移方法、装置与系统
CN105429776B (zh) 一种虚拟化网络功能管理的方法和系统
CN105049268A (zh) 分布式计算资源分配系统和任务处理方法
CN108023967B (zh) 一种数据平衡方法、装置及分布式存储系统中的管理设备
CN105991458B (zh) 一种负载均衡的方法及负载均衡装置
CN106959893B (zh) 加速器、用于加速器的内存管理方法以及数据处理系统
CN107977254B (zh) 云数据系统中请求的响应方法和计算机可读存储介质
US20160380921A1 (en) Mechanism of identifying available memory resources in a network of multi-level memory modules
EP3000024B1 (en) Dynamically provisioning storage
CN102841759A (zh) 一种针对超大规模虚拟机集群的存储系统
CN104750573B (zh) 分布式数据系统数据节点的全局一致性备份和还原方法
CN103399781A (zh) 云服务器及其虚拟机管理方法
CN109960579B (zh) 一种调整业务容器的方法及装置
CN104580194A (zh) 面向视频应用的虚拟化资源管理方法及装置
CN105446792A (zh) 一种虚拟机的部署方法、部署装置和管理节点
CN108874543A (zh) 一种容器集群管理方法和系统
CN105743677A (zh) 一种资源配置方法及装置
CN111414228B (zh) 基于Kubernetes的管理存储空间的方法和相关装置
CN104753992A (zh) 一种数据存储、虚拟平台故障恢复的方法、设备和系统
CN110162396A (zh) 内存回收方法、装置、系统和存储介质
CN108897603B (zh) 一种内存资源管理方法和装置
CN109189739B (zh) 缓存空间回收方法和装置
CN108984102B (zh) 管理存储系统的方法、系统和计算机程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181123

RJ01 Rejection of invention patent application after publication