CN103916396A - 一种基于负载自适应的云平台应用实例自动伸缩方法 - Google Patents

一种基于负载自适应的云平台应用实例自动伸缩方法 Download PDF

Info

Publication number
CN103916396A
CN103916396A CN201410140537.8A CN201410140537A CN103916396A CN 103916396 A CN103916396 A CN 103916396A CN 201410140537 A CN201410140537 A CN 201410140537A CN 103916396 A CN103916396 A CN 103916396A
Authority
CN
China
Prior art keywords
load
application
cloud platform
threshold values
running
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410140537.8A
Other languages
English (en)
Other versions
CN103916396B (zh
Inventor
陆鑫
李涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201410140537.8A priority Critical patent/CN103916396B/zh
Publication of CN103916396A publication Critical patent/CN103916396A/zh
Application granted granted Critical
Publication of CN103916396B publication Critical patent/CN103916396B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明涉及云计算领域,具体的说是一种基于负载自适应的云平台应用实例自动伸缩方法。本发明的方法主要步骤为:通过实例负载监测组件从各个运行中的应用实例采集实时负载数据;通过应用负载分析组件对接收到的实例负载数据进行汇总计算确定该应用的运行负载,并结合该应用的用户访问请求量进行综合决策分析,确定是否对该应用进行实例伸缩控制;然后通过实例控制组件调用云平台API进行该应用的实例增减操作。本发明的有益效果为,首先解决了原生Cloud Foundry开源云平台使用人工方式伸缩应用实例问题,同时还解决了仅依据应用的用户访问请求量进行应用实例伸缩所带来的可能与实际情况不吻合问题。本发明尤其适用于Cloud Foundry开源云平台。

Description

一种基于负载自适应的云平台应用实例自动伸缩方法
技术领域
本发明涉及云计算领域,具体的说是一种基于负载自适应的云平台应用实例自动伸缩方法。
背景技术
云计算是一种服务的交付和使用模式,它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和信息服务。云计算基本特征为按需使用资源、资源可以动态扩展、应用弹性计算、通过网络以服务方式提供给用户。
弹性计算是云计算的基本特征之一,它是指用户应用根据实际业务或者计算需要,灵活地使用计算资源,真正实现按需使用、按需交付和按需付费。弹性计算主要通过云计算平台运行资源的垂直伸缩和水平伸缩来实现。资源垂直伸缩是在云计算平台中单个运行节点中增减资源,如给运行计算机增减CPU或内存;资源水平伸缩是指在云计算平台中,增加或减少运行节点数量,例如将应用的运行服务器由一台增加为三台。
Cloud Foundry是VMware于2011年初推出的业界第一个开源PaaS云计算平台,它支持应用运行所需的多种框架、数据库服务、运行时环境,使开发人员能够在短时间内在云计算环境进行应用程序的部署和扩展,无需管理应用所依赖的基础架构运行环境。Cloud Foundry作为一种云计算平台软件,提供了基本的弹性计算功能。它具体通过控制云平台上各应用运行的实例数量来支持不同负载的弹性计算能力。当外界对应用的访问请求增多时,用户可通过调用云平台提供的实例增加命令,复制更多的应用实例,来增强应用的运行能力,满足云平台中应用的弹性计算。反之,当外界对应用的访问请求减少时,为避免资源浪费,则减少应用的运行实例个数,这样可以将节省下的资源用于其他应用的计算需求,从而实现平台计算资源的高效利用。
但原生的Cloud Foundry开源云平台对于应用弹性计算的支持有限,仅仅提供用户根据监测到的应用负载情况,手动更改应用实例数进行计算资源的水平伸缩能力处理。该平台提供的应用计算资源伸缩方式不能及时适应负载动态变化,其时效性不强,可能会造成应用一定时间内响应失效的情况;还可能因为用户手动设置数值不合理,造成平台资源浪费或不能满足应用需求;同时该方式对平台管理人员要求高,需要人工时刻关注各个应用负载状态,及时进行应用运行资源调整操作,这会耗费较多的人员精力,也增大管理难度。
为了改进Cloud Foundry开源云平台的应用弹性计算局限,一些云服务提供商在原生Cloud Foundry平台基础上实现了一定程度上的应用实例自动伸缩控制。其实现方法是在平台资源调度层中增加了应用实例自动伸缩模块,同时在平台中为各个应用定义一个实例伸缩规则,如根据应用的HTTP访问量评估应用负载状态,然后基于应用负载进行实例数伸缩处理。例如,若监测应用每秒收到的HTTP访问请求数大于100时,则在当前运行应用中增加一个实例;当HTTP访问量大于150时,又增加一个实例,以次类推,应用最多可以有10个实例。若监测应用每秒收到的HTTP访问请求数少于50时,则减少1个实例,应用最少为2个实例。现有改进技术方案是通过上述简单的应用负载判断方式来决定Cloud Foundry开源云平台的应用实例自动伸缩控制,从而实现云平台的基本弹性计算。
虽然现有的Cloud Foundry云平台应用实例伸缩技术方案提供了基本的应用实例自动伸缩控制策略方法,实现一定的应用弹性计算能力。但它们在技术实现上,只是简单地根据应用的用户访问请求量,判断其访问量负载范围,当负载超过阈值范围之外时,就自动增减一个实例。此种策略方法虽然简单,也实现了一定的平台应用弹性计算,但其对于应用实例伸缩控制是被动的、滞后的。需要强调,应用的用户访问请求量并不一定能完全反映出应用实际负载状况。因此,仅仅将应用的用户访问请求量作为应用实例伸缩依据是不充分的,在特定情况下,该方法并不能有效实现负载均衡和提高资源利用率。此外,当应用的访问量变化频繁时,简单的依据当前访问请求量决定增减应用的实例数,容易造成“应用访问抖动”开销。所谓应用访问抖动是指应用在短时间内频繁增减实例,如云平台刚刚根据应用的访问请求量,减少了一个应用实例,但下一时刻应用的访问请求量又突发增加,导致平台又立刻增加应用实例,带来平台系统较大开销。这种状况我们定义为“先减后增抖动”,还有一种就是“先增后减抖动”。由于在云平台中增减应用实例是一种耗时耗资源的操作,频繁地增减应用实例既会造成云平台系统的额外开销,也会导致应用响应处理能力降低。因此,目前的Cloud Foundry云平台应用实例伸缩技术方案仍具有较大的局限性。
发明内容
本发明所要解决的问题,就是针对目前Cloud Foundry云平台存在的应用实例伸缩技术局限,提供一种能够负载自适应的云平台应用实例自动伸缩方法,实现云平台的应用弹性计算,并提高应用访问稳定性。
本发明解决上述技术问题所采用的技术方案是:一种基于负载自适应的云平台应用实例自动伸缩方法,其特征在于,包括以下步骤:
a.通过实例负载监测代理组件实时采集云平台各应用实例的负载状态,并将当前时刻采集到的实例负载数据值与前一时刻记录的实例负载值进行对比得到该实例负载数据变化量,判断变化量是否超出预设的变化量阀值,若是,则将负载数据发送到应用负载分析组件并进入步骤b,若否,则重复步骤a;
b.应用负载分析组件接收实例负载监测组件发送的负载数据,将应用各实例负载数据汇总计算出该应用的运行负载,判断应用运行负载是否处于预设的负载上、下阀值之间,若是,表明应用负载正常,则不进行处理并回到步骤a,若否,则进一步判断应用运行负载数据是大于负载上阀值或是小于负载下阀值,若是大于负载上阀值,则标记该应用为重载状态,若是小于负载下阀值,则标记该应用为轻载状态;
c.判断标记为重载状态/轻载状态的应用的变化趋势,具体为:判断标记为重载状态的应用运行负载是否保持重载,若是,则进入步骤d,若否,则回到步骤a;判断标记为轻载状态的应用负载是否保持轻载,若是,则进入步骤e,若否,则回到步骤a;
d.应用负载分析组件发送实例增加指令到应用实例伸缩控制组件,应用实例伸缩控制组件根据应用负载分析组件指令,调用云平台应用实例伸缩API为当前应用增加实例,回到步骤a;
e.应用负载分析组件发送实例减少指令到应用实例伸缩控制组件,应用实例伸缩控制组件根据应用负载分析组件指令,调用云平台应用实例伸缩API为当前应用减少实例,回到步骤a。
具体的,步骤a中通过应用实例负载监测代理组件实时采集云平台每个应用实例的负载状态的具体方法为:
在每个应用实例运行节点中设置实例负载监测代理模块定时对该节点上所有负载数据进行采集,所述负载数据至少包括CPU负载、内存负载、磁盘负载和网络负载。
具体的,步骤b还包括以下步骤:
b1.应用负载分析组件接收到应用的实例负载数据后,对该应用的运行负载进行计算,具体方法为:
假设应用的CPU负载为Lcpu、内存负载为Lmem、磁盘负载为Ldisk和网络负载为Lnet,计算公式分别为:
CPU负载其中n是该应用实例个数,Ci是该应用的第i号实例对应的CPU负载数据,
内存负载其中n是该应用实例个数,Mi是该应用的第i号实例对应的内存负载数据,
磁盘负载其中n是该应用实例个数,Di是该应用的第i号实例对应的磁盘负载数据,
网络负载其中n是该应用实例个数,Ni是该应用的第i号实例对应的网络负载数据;
b2.假设预设的各负载数据上阀值分别为:CPU负载上阀值Hcpu、内存负载上阀值Hmem、磁盘负载上阀值Hdisk、网络负载上阀值Hnet;各负载数据下阀值分别为:CPU负载下阀值Bcpu、内存负载下阀值Bmem、磁盘负载下阀值Bdisk、网络负载下阀值Bnet,根据步骤b1中所得到的应用运行负载数据,计算它在系统中的高负载比值RH和低负载比值RL:
RH=α*Lcpu/Hcpu+β*Lmem/Hmem+γ*Ldisk/Hdisk+δ*Lnet/Hnet,
RL=α*Lcpu/Bcpu+β*Lmem/Bmem+γ*Ldisk/Bdisk+δ*Lnet/Bnet,
其中,α,β,γ,δ,分别表示CPU负载、内存负载、磁盘负载和网络负载的权重比例值,α+β+γ+δ=1;
b3.判断该应用的高负载比值RH与1的大小,若RH>=1,则确定该应用运行处于重载状态,进入步骤c,若RH<1,则进入步骤b4;
b4.判断该应用的低负载比值RL与1的大小,若RL<=1,则确定该应用运行处于轻载状态,进入步骤c,若RL>1,则回到步骤a。
具体的,步骤c还包括以下步骤:
c1.判断标记为重载的应用负载的运行负载是否保持重载,具体方法为:从云平台获取单位时间内该应用的访问请求量visit,判断visit<VH*N是否成立,若成立,则表示运行负载不会保持重载并回到步骤a,若不成立,则表面运行负载会保持重载并进入步骤c3,其中VH为使实例保持正常负载范围内单位时间最大请求数,N为应用当前实例数目;
c2.判断标记为轻载的应用负载的运行负载是否保持轻载,具体方法为:从云平台获取单位时间内该应用实例的访问请求书visit,判断visit>=VL*N是否成立,若成立,则表示运行负载不会保持轻载并回到步骤a,若不成立,则表示运行负载会保持轻载并进入步骤c4,其中VL为使实例保持正常负载范围内单位时间最小请求数,N为应用当前实例数目;
c3.判断当前该应用的实例数是否小于平台允许应用的最大实例数NH,若是,则进入步骤d,若否,则反馈无法操作信息到平台;
c4.判断当前该应用的实例数是否大于平台允许应用的最小实例数NL,若是,则进入步骤e,若否,则反馈无法操作信息到平台。
本方案的优点在于,它不仅能满足平台应用实例的自动伸缩,还通过应用负载分析组件结合应用当前访问请求量,综合决策应用实例的自动伸缩处理。应用负载分析组件一旦接收到实例负载数据,就启动一次应用负载计算。它将当前同一应用的各个实例负载数据汇总计算,得到本应用运行负载,并根据设定的应用负载上、下阈值判断当前应用是否出现重载或轻载情况。若出现应用过载,并结合当前应用的用户访问请求量,进行应用实例伸缩决策分析处理,给出决策结果(增加实例、减少实例、暂不处理)。若分析决策结果为增加实例情况,应用负载分析组件发出指令给应用实例伸缩控制组件进行实例资源调度处理,并通过CloudFoundry云平台提供API选定最适合应用实例创建的运行结点,然后创建该应用实例。若分析决策结果为减少实例情况,应用实例伸缩控制组件将选定当前负载最轻的实例进行关闭处理。若分析决策结果为减少暂不处理情况,应用实例伸缩控制组件不做处理。从而有效避免了可能的“应用访问抖动”开销,增加了平台的稳定性。
其中,应用实例伸缩控制组件每次进行的实例增减数量为单个实例增减。
本发明的有益效果为,首先解决了原生Cloud Foundry开源云平台使用人工方式进行应用实例伸缩的局限问题,实现一种基于负载反馈的应用实例自动伸缩方法,提高了平台应用自动适应负载的弹性计算能力。同时还解决了仅依据应用的用户访问请求量进行应用实例伸缩所带来的可能与实际情况不吻合问题,并且还能很好地解决应用的用户访问请求变化剧烈时,平台应用实例伸缩可能出现的应用访问抖动问题,维持了应用访问性能的稳定性。
附图说明
图1为本发明的在原生Cloud Foundry平台中改进应用实例伸缩控制功能的架构图;
图2为本发明的云平台应用实例自动伸缩方法的基本流程图;
图3为应用实例负载监测代理组件的工作流程示意图;
图4为应用负载分析组件的工作流程示意图;
图5为应用实例伸缩控制组件的工作流程示意图。
具体实施方式
下面结合附图,详细描述本发明的技术方案:
如图1所示,本发明在原生Cloud Foundry平台中,设计了实例负载监测组件、应用负载分析组件和应用实例伸缩控制组件。
其中原生Cloud Foundry云平台包括云控制器(Cloud Controller)组件、数据库及用户身份验证(UAA)组件、应用实例运行(DEA)组件、健康管理(Health Manager)组件、路由(Router)组件、服务(Service)组件和消息总线(NATS)组件等。除了NATS外,每个组件都可以在多个虚拟机节点运行。新增功能组件包括实例负载监测代理组件、应用负载分析组件、应用实例伸缩控制组件。其中实例负载监测代理组件位于应用运行节点(DEA)中,负责监测每个DEA节点中的应用实例运行负载情况。应用负载分析组件和实例伸缩控制组件位于云控制Cloud Controller节点中,前者负责对负载监测代理提交的负载数据进行分析决策,后者依据前者的决策结果实施平台应用实例伸缩控制。每个应用都以若干实例形式运行在多个DEA节点中。平台各节点功能及工作原理如下:
Router节点:识别并路由所有来自内网和外网的请求,进入Router的请求主要有两类:第一类是来自VMC Client或者STS的,由Cloud Foundry使用者发出的,管理型指令。第二类是外界对所部署应用系统访问的请求。应用访问请求会被路由到该应用所在的运行环境,即DEA的组件。Router管理动态路由表,通过映射应用对应的IP和端口实现负载平衡。
DEA节点:DEA(Droplet Execution Agents)是安全并且完全隔离的应用运行容器。同时,它也管理应用生命周期活动,如创建、启动、停止,并定期广播状态消息。
Cloud Controller节点:它是Cloud Foundry的核心控制管理模块。主要工作包括:对应用apps的增删改读;启动、停止应用程序;Staging apps(把apps打包成一个droplet);修改应用程序运行环境,包括实例数(instance)、内存(mem)等等;管理service,包括service与app的绑定等;Cloud Foundry环境的管理;修改Cloud Foundry平台的用户信息;查看Cloud Foundry,以及每一个app的日志信息。总体来说,Cloud Controller管理整个Cloud Foundry平台的命令和控制系统,包括与各类客户端(CLI,Web UI,Spring STS)的调用接口,账户管理,应用部署等核心功能。提供RESTful接口和对象模型。
Stager节点:它是负责应用打包组件,从v1.0版本的Cloud Controller中独立出来,专门负责将用户上传的应用代码打包后暂时存放在blobstore中。
身份验证(UAA-AuthN)节点:UAA(User Authorization and Authentication),负责云平台系统的用户认证和授权,以及第三方Oauth2.0访问和身份识别。
Health Manager节点:监控应用的状态,监听NATS消息总线,发现应用异常并报警。它监测Cloud Controller节点发布应用预期状态、DEA发布应用实际状态,并将它们进行对比。
Service节点:主要负责对外提供服务,可以是平台本身自带的几个基础数据库服务,也可以是加入的第三方扩展其他服务。
Gateway和Node节点:Gateway是其它组件(Cloud Controller)访问Node的入口,它对外提供了对Node进行管理的一套“接口”。同时它对外隐藏内部Node的结构,这样外部的组件就可以忽略内部Node的情况,只需要关心服务实例的创建、绑定的动作。Node负责管理服务,包括创建、注销、绑定、启用、禁用等操作。Node不是服务的提供者,它是本地服务的管理者。
NATS消息组件:Cloud Foundry的内部消息总线,通过订阅和发布的方式,管理系统级别的通信。NATS是系统各个模块之间通信的桥梁,各组件组成一套基于消息的分布式系统,面向消息的架构是它节点横向扩展,组件自发现等云特性的基础。
为实现基于负载自适应的云平台应用实例伸缩,本发明在原生Cloud Foundry平台中,设计了实例负载监测代理组件、应用负载分析组件和应用实例伸缩控制组件,它们的主要功能如下:
实例负载监测代理组件:负责从各个运行中的应用实例采集实时负载数据。若当前负载数据与前一次记录负载数据的变化值超出一定量时,将实例的当前负载数据发送给云控制器中的负载分析组件处理。
应用负载分析组件:每当接收到实例负载监测代理传送的实例负载数据,负载监测代理就进行一次应用运行负载计算。它将本应用各实例最近负载数据作为输入,按照特定公式计算应用运行负载,并根据设定的应用负载上、下阈值判断当前应用是否出现重载或轻载情况。若出现应用过载,并结合当前应用访问请求量,进行应用实例伸缩决策分析处理,给出决策结果(增加实例、减少实例、暂不处理)。将决策分析结果,即是否要增减应用实例数,传送给实例控制组件处理。
应用实例伸缩控制组件:根据应用负载分析组件发送的结果,调用云平台实例资源API选择合适节点作为应用实例伸缩控制响应节点,并进行实例伸缩操作。
如图2所示,本发明的云平台应用实例自动伸缩方法总体处理流程。首先由平台各运行节点中的实例负载监测代理组件监测各个应用实例的负载,当实例负载变化超出一定值时,将该负载数据提交给应用负载分析组件处理;应用负载分析组件接收到实例负载数据后,将进行应用运行负载计算,并判断应用运行负载是否过载,同时结合该应用的访问请求量进行决策分析处理,给出决策结果(增加实例、减少实例、暂不处理),根据决策结果给应用实例伸缩控制组件发出实例伸缩指令;应用实例伸缩控制组件根据指令进行应用实例伸缩控制处理。
如图3所示,应用实例负载监测代理组件工作流程。每个应用实例运行节点中都有一个实例负载检测代理,负责监测该节点上所有实例的CPU使用率、内存使用率、磁盘I/O和网络流量四项负载情况。同时,系统对每个被测负载事先设定全局固定一致的上阈值H[object]和下阈值B[object],[object]值可取cpu,mem,disk和net中的一个。例如选取CPU使用率上阈值为80%,下阈值20%,则Hcpu=80%,Bcpu=20%;磁盘I/O值和网络流量根据具体云平台硬件配置及所处网络环境选择合理的上阈值和下阈值。
工作时,实例负载监测代理定时分别采集被测实例的四种负载数据。其后计算当前负载数据与上次保存实例负载数据的变化量,若此变化量绝对值大于上阈值的5%,则认为该负载数据为有效采样数据,并提交该数据到应用负载分析组件,同时记录在本地;若不大于,则认为负载变化不大,不需要进行实例资源调度处理。
负载监测代理在给负载分析组件上传负载数据时,以三元组(instance_ID,object,load)形式发送。其中instance_ID为实例标号,它用于标识应用实例;object是采样对象(CPU使用率,内存使用率,磁盘I/O和网络流量等四个);load为该对象负载数据。
如图4所示,应用负载分析组件是本发明的关键功能组件,它负责对应用实例负载进行计算得到应用运行负载,并根据应用运行负载状态和应用的访问请求量,进行应用实例伸缩决策分析,从而确定应用实例伸缩操作,工作流程为:
第1步:应用负载分析组件一旦接受到负载监测代理发送的数据,就启动一次应用负载计算。根据新接收到的实例负载数据和应用全部实例的最近负载数据,计算得到应用运行负载。例如,计算应用的CPU负载,其计算公式为:其中n是该应用实例个数,Ci是该应用的第i号实例对应的CPU负载数据,Lcpu为本应用的CPU运行负载。同理,可计算应用的内存负载Lmem、磁盘负载Ldisk、网络负载Lnet
第2步:应用负载分析组件利用公式计算出该应用的“高负载比”和“低负载比”指标数据。其计算公式分别为:RH=α*Lcpu/Hcpu+β*Lmem/Hmem+γ*Ldisk/Hdisk+δ*Lnet/Hnet,RL=α*Lcpu/Bcpu+β*Lmem/Bmem+γ*Ldisk/Bdisk+δ*Lnet/Bnet。这里Lcpu、Lmem、Ldisk、Lnet分别是应用的CPU使用率、内存使用率、磁盘I/O和网络的运行负载,Hcpu、Hmem、Hdisk、Hnet分别为应用各类负载的上阈值,Bcpu、Bmem、Bdisk、Bnet分别为应用各类负载的下阈值。α,β,γ,δ,表示四类负载的权重比例值,重要性越高权重值越大,且α+β+γ+δ=1,可以根据平台应用类型调整权值。例如,如果应用是CPU消耗型负载,可以α参数值较大。
第3步:比较应用的高负载比RH值与1大小。若RH>=1,则当前应用处于重载状态,转第5步处理;若RH<1,表明应用运行负载没有超过上阈值,转第4步处理。
第4步:比较应用的低负载比RL值与1大小。若RL<=1,则当前应用处于轻载状态,转第6步处理;若RL>1,表明应用运行负载没有过低,无需调整实例数。
第5步:判断应用负载是否会出现“先增后减抖动”情况,即判断标记为重载状态的应用是否持续保持重载。检查方法是:负载分析组件得到云平台路由组件发送过来的单位时间内该应用的访问请求数visit,若visit<VH*N(VH是使实例保持正常负载范围内单位时间最大请求数,依据具体平台的应用实例资源配置情况确定,N是应用当前实例数目),则表明应用负载未来很可能会降低,为避免抖动,暂不增加应用实例数;否则,则转第7步。
第6步:判断应用负载是否会出现“先减后增抖动”情况,即判断标记为轻载状态的应用是否持续保持轻载。检查方法是:负载分析组件根据云平台路由组件发送过来的单位时间内应用访问请求数visit,若visit>=VL*N(VL是使实例保持正常负载范围内单位时间最小请求数,依据具体平台的应用实例资源配置情况确定,N是应用当前实例数目),则表明应用负载未来很可能会增大,为避免抖动,暂不减少应用实例数;否则,则转第8步。
第7步:判断当前应用的实例数是否小于NH(平台允许应用的最大实例数为NH,可依据平台实际情况确定此最大值)。若当前应用实例数小于NH,决策结果为增加一个实例,则发送结果“+1”指令给应用实例伸缩控制组件。若当前应用实例数等于NH,则决策结果为不能调整应用实例数,并告警平台。
第8步:判断当前应用的实例数是否大于NL(平台允许应用的最少实例数为NL,可依据平台实际情况确定此最小值)。若当前应用实例数大于NL,决策结果为减少一个实例,则发送结果“-1”给应用实例伸缩控制组件。若当前应用实例数等于NL,则决策结果为不能调整应用实例数,并告警平台。
如图5所示,应用实例伸缩控制组件收到应用负载分析组件上传的实例伸缩指令时,将进行实例伸缩处理。当收到的命令为某应用“+1”指令时,表示该应用要增加一个实例。实例伸缩控制组件将调用云平台提供实例操作API函数进行该应用的实例增加操作。云平台在进行应用实例增加时,能够自动根据负载均衡原则选择负载最轻的运行节点创建当前应用的新实例,并通知路由组件在路由表中注册此新实例。当收到的命令为某应用“-1”指令时,表示该应用要减少一个实例。应用实例伸缩控制组件调用云平台提供实例操作API函数进行该应用的实例减少操作,并选择实例负载最轻的实例运行节点删除处理。同时通知路由组件从路由表中去掉此实例,以便路由节点及时更新应用实例数据。
在云平台中,本发明的实例负载监测代理组件采集负载数据并判断应用实例负载的变化量,如果负载变化量不大,即负载保持相对稳定,平台不需要调整应用实例数。本发明所述方法选择了上阈值的5%作为最小有效变化单位,实际可以根据平台处理能力选取合适的最小有效变化单位。实例负载监测代理组件将本次监测值与上次保存负载值求差,如果结果值大于规定的变化量时,则将该负载值发送给负载分析组件,并将它记录保存在系统中。
判断应用实例数是否需要伸缩,需要分析组件依据该应用的运行负载和访问请求情况来决策确定。其中应用的运行负载是由分析组件将该应用的所有实例负载数据进行汇总计算,分别得到应用的CPU、内存、磁盘I/O和网络四项运行负载值。应用访问请求负载是由平台的路由组件提供。
在应用的运行负载计算过程中,将计算本应用的“高负载比”和“低负载比”指标数据。通过该数据判断本应用的运行负载是否过载。具体将比较“高负载比”与1的大小关系,若本应用的“高负载比”>=1,则认为本应用重载,否则本应用没有重载。若本应用没有出现重载,还需要判断本应用是否出现轻载。具体将比较本应用的“低负载比”与1的大小关系。若本应用的“低负载比”<=1,则表明了本应用的运行负载过低。
当应用的运行负载出现重载或是轻载情况,还需要根据该应用的当前访问请求量变化,进一步判断应用是否将会“应用访问抖动”。本发明的解决方式是结合应用当前的访问请求数和应用运行负载情况,决策是否进行应用实例数调整,以避免平台应用“抖动”问题出现。

Claims (4)

1.一种基于负载自适应的云平台应用实例自动伸缩方法,其特征在于,包括以下步骤:
a.通过实例负载监测代理组件实时采集云平台各应用实例的负载状态,并将当前时刻采集到的实例负载数据值与前一时刻记录的实例负载值进行对比得到该实例负载数据变化量,判断变化量是否超出预设的变化量阀值,若是,则将负载数据发送到应用负载分析组件并进入步骤b,若否,则重复步骤a;
b.应用负载分析组件接收实例负载监测组件发送的负载数据,将应用各实例负载数据汇总计算出该应用的运行负载,判断应用运行负载是否处于预设的负载上、下阀值之间,若是,表明应用负载正常,则不进行处理并回到步骤a,若否,则进一步判断应用运行负载数据是大于负载上阀值或是小于负载下阀值,若是大于负载上阀值,则标记该应用为重载状态,若是小于负载下阀值,则标记该应用为轻载状态;
c.判断标记为重载状态/轻载状态的应用的变化趋势,具体为:判断标记为重载状态的应用运行负载是否保持重载,若是,则进入步骤d,若否,则回到步骤a;判断标记为轻载状态的应用负载是否保持轻载,若是,则进入步骤e,若否,则回到步骤a;
d.应用负载分析组件发送实例增加指令到应用实例伸缩控制组件,应用实例伸缩控制组件根据应用负载分析组件指令,调用云平台应用实例伸缩API为当前应用增加实例,回到步骤a;
e.应用负载分析组件发送实例减少指令到应用实例伸缩控制组件,应用实例伸缩控制组件根据应用负载分析组件指令,调用云平台应用实例伸缩API为当前应用减少实例,回到步骤a。
2.根据权利要求1所述的一种基于负载自适应的云平台应用实例自动伸缩方法,其特征在于,步骤a中通过应用实例负载监测代理组件实时采集云平台每个应用实例的负载状态的具体方法为:
在每个应用实例运行节点中设置实例负载监测子模块定时对该节点上所有负载数据进行采集,所述负载数据至少包括CPU负载、内存负载、磁盘负载和网络负载。
3.根据权利要求2所述的一种基于负载自适应的云平台应用实例自动伸缩方法,其特征在于,步骤b还包括以下步骤:
b1.应用负载分析组件接收到应用的实例负载数据后,对该应用的运行负载进行计算,具体方法为:
假设应用的CPU负载为Lcpu、内存负载为Lmem、磁盘负载为Ldisk和网络负载为Lnet,计算公式分别为:
CPU负载其中n是该应用实例个数,Ci是该应用的第i号实例对应的CPU负载数据,
内存负载其中n是该应用实例个数,Mi是该应用的第i号实例对应的内存负载数据,
磁盘负载其中n是该应用实例个数,Di是该应用的第i号实例对应的磁盘负载数据,
网络负载其中n是该应用实例个数,Ni是该应用的第i号实例对应的网络负载数据;
b2.假设预设的各负载数据上阀值分别为:CPU负载上阀值Hcpu、内存负载上阀值Hmem、磁盘负载上阀值Hdisk、网络负载上阀值Hnet;各负载数据下阀值分别为:CPU负载下阀值Bcpu、内存负载下阀值Bmem、磁盘负载下阀值Bdisk、网络负载下阀值Bnet,根据步骤b1中所得到的应用运行负载数据,计算它在系统中的高负载比值RH和低负载比值RL:
RH=α*Lcpu/Hcpu+β*Lmem/Hmem+γ*Ldisk/Hdisk+δ*Lnet/Hnet,
RL=α*Lcpu/Bcpu+β*Lmem/Bmem+γ*Ldisk/Bdisk+δ*Lnet/Bnet,
其中,α,β,γ,δ,分别表示CPU负载、内存负载、磁盘负载和网络负载的权重比例值,α+β+γ+δ=1;
b3.判断该应用的高负载比值RH与1的大小,若RH>=1,则确定该应用运行处于重载状态,进入步骤c,若RH<1,则进入步骤b4;
b4.判断该应用的低负载比值RL与1的大小,若RL<=1,则确定该应用运行处于轻载状态,进入步骤c,若RL>1,则回到步骤a。
4.根据权利要求3所述的一种基于负载自适应的云平台应用实例自动伸缩方法,其特征在于,步骤c还包括以下步骤:
c1.判断标记为重载的应用负载的运行负载是否保持重载,具体方法为:从云平台获取单位时间内该应用的访问请求量visit,判断visit<VH*N是否成立,若成立,则表示运行负载不会保持重载并回到步骤a,若不成立,则表面运行负载会保持重载并进入步骤c3,其中VH为使实例保持正常负载范围内单位时间最大请求数,N为应用当前实例数目;
c2.判断标记为轻载的应用负载的运行负载是否保持轻载,具体方法为:从云平台获取单位时间内该应用实例的访问请求书visit,判断visit>=VL*N是否成立,若成立,则表示运行负载不会保持轻载并回到步骤a,若不成立,则表示运行负载会保持轻载并进入步骤c4,其中VL为使实例保持正常负载范围内单位时间最小请求数,N为应用当前实例数目;
c3.判断当前该应用的实例数是否小于平台允许应用的最大实例数NH,若是,则进入步骤d,若否,则反馈无法操作信息到平台;
c4.判断当前该应用的实例数是否大于平台允许应用的最小实例数NL,若是,则进入步骤e,若否,则反馈无法操作信息到平台。
CN201410140537.8A 2014-04-10 2014-04-10 一种基于负载自适应的云平台应用实例自动伸缩方法 Expired - Fee Related CN103916396B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410140537.8A CN103916396B (zh) 2014-04-10 2014-04-10 一种基于负载自适应的云平台应用实例自动伸缩方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410140537.8A CN103916396B (zh) 2014-04-10 2014-04-10 一种基于负载自适应的云平台应用实例自动伸缩方法

Publications (2)

Publication Number Publication Date
CN103916396A true CN103916396A (zh) 2014-07-09
CN103916396B CN103916396B (zh) 2016-09-21

Family

ID=51041803

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410140537.8A Expired - Fee Related CN103916396B (zh) 2014-04-10 2014-04-10 一种基于负载自适应的云平台应用实例自动伸缩方法

Country Status (1)

Country Link
CN (1) CN103916396B (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104158732A (zh) * 2014-08-22 2014-11-19 成都致云科技有限公司 一种智能的云服务动态路由策略
CN104391750A (zh) * 2014-11-26 2015-03-04 浪潮(北京)电子信息产业有限公司 一种基于软件定义的混合异构主机系统
CN104410712A (zh) * 2014-12-16 2015-03-11 国家电网公司 应用实例管理方法、用户访问请求处理方法及系统
CN104539708A (zh) * 2014-12-29 2015-04-22 杭州华为数字技术有限公司 一种云平台资源的缩容方法、装置与系统
CN104932898A (zh) * 2015-06-30 2015-09-23 东北大学 一种基于改进多目标粒子群优化算法的待增组件选择方法
CN105553721A (zh) * 2015-12-15 2016-05-04 浪潮电子信息产业股份有限公司 一种云应用伸缩方法、应用管理端和系统
CN105577457A (zh) * 2016-03-09 2016-05-11 上海天玑科技股份有限公司 一种数据中心资源智能弹性调度系统及方法
CN106445512A (zh) * 2016-09-12 2017-02-22 浪潮软件股份有限公司 一种实现运行环境动态伸缩的方法
CN106533839A (zh) * 2016-11-30 2017-03-22 郑州云海信息技术有限公司 一种混合云的应用节点监控方法及装置
CN106657220A (zh) * 2016-09-21 2017-05-10 郑州云海信息技术有限公司 一种基于nginx的Cloud Foundry内网部署方案
CN106789303A (zh) * 2016-12-29 2017-05-31 北京奇艺世纪科技有限公司 一种容器日志采集方法及装置
CN107205008A (zh) * 2016-03-18 2017-09-26 上海有云信息技术有限公司 云计算环境下web应用防火墙的负载自适应方法
CN107689891A (zh) * 2017-09-01 2018-02-13 广西大学 大规模突访情境下容器云弹性供给时间点预测方法与系统
CN108156212A (zh) * 2017-06-29 2018-06-12 广东网金控股股份有限公司 一种基于用户感知的弹性伸缩方法及系统
CN108173683A (zh) * 2017-12-25 2018-06-15 东软集团股份有限公司 云应用的弹性控制方法、装置和云服务器
CN109104497A (zh) * 2018-09-26 2018-12-28 郑州云海信息技术有限公司 一种基于云平台的业务处理方法及装置
CN109150603A (zh) * 2018-08-17 2019-01-04 中软信息系统工程有限公司 云服务端自动扩容方法及装置
CN109684043A (zh) * 2018-12-28 2019-04-26 北京百度网讯科技有限公司 用于更新信息的方法和装置
TWI701562B (zh) * 2015-07-08 2020-08-11 香港商阿里巴巴集團服務有限公司 資料庫彈性調度方法以及裝置
CN114443283A (zh) * 2021-12-29 2022-05-06 苏州浪潮智能科技有限公司 一种应用实例的伸缩方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102244685A (zh) * 2011-08-11 2011-11-16 中国科学院软件研究所 一种支持负载均衡的分布式缓存动态伸缩方法及系统
CN102681899A (zh) * 2011-03-14 2012-09-19 金剑 云计算服务平台的虚拟计算资源动态管理系统
CN102904955A (zh) * 2012-10-16 2013-01-30 南京大学镇江高新技术研究院 云计算平台中Web应用的自适应伸缩控制系统及其方法
CN103297542A (zh) * 2013-06-24 2013-09-11 浪潮电子信息产业股份有限公司 一种支持构件在线伸缩的云操作系统总线及均衡方法
US20140006384A1 (en) * 2012-06-28 2014-01-02 Sap Ag Elastic Complex Event Processing
CN103701920A (zh) * 2013-12-31 2014-04-02 曙光云计算技术有限公司 云环境下配置虚拟应用服务器的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102681899A (zh) * 2011-03-14 2012-09-19 金剑 云计算服务平台的虚拟计算资源动态管理系统
CN102244685A (zh) * 2011-08-11 2011-11-16 中国科学院软件研究所 一种支持负载均衡的分布式缓存动态伸缩方法及系统
US20140006384A1 (en) * 2012-06-28 2014-01-02 Sap Ag Elastic Complex Event Processing
CN102904955A (zh) * 2012-10-16 2013-01-30 南京大学镇江高新技术研究院 云计算平台中Web应用的自适应伸缩控制系统及其方法
CN103297542A (zh) * 2013-06-24 2013-09-11 浪潮电子信息产业股份有限公司 一种支持构件在线伸缩的云操作系统总线及均衡方法
CN103701920A (zh) * 2013-12-31 2014-04-02 曙光云计算技术有限公司 云环境下配置虚拟应用服务器的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
温鉴荣: "PaaS云平台中Java Web应用调度机制的研究与实现", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104158732B (zh) * 2014-08-22 2017-11-28 成都致云科技有限公司 一种智能的云服务动态路由策略
CN104158732A (zh) * 2014-08-22 2014-11-19 成都致云科技有限公司 一种智能的云服务动态路由策略
CN104391750A (zh) * 2014-11-26 2015-03-04 浪潮(北京)电子信息产业有限公司 一种基于软件定义的混合异构主机系统
CN104391750B (zh) * 2014-11-26 2018-05-04 浪潮(北京)电子信息产业有限公司 一种基于软件定义的混合异构主机系统
CN104410712A (zh) * 2014-12-16 2015-03-11 国家电网公司 应用实例管理方法、用户访问请求处理方法及系统
CN104410712B (zh) * 2014-12-16 2018-09-11 国家电网公司 应用实例管理方法、用户访问请求处理方法及系统
CN104539708A (zh) * 2014-12-29 2015-04-22 杭州华为数字技术有限公司 一种云平台资源的缩容方法、装置与系统
CN104539708B (zh) * 2014-12-29 2018-01-23 杭州华为数字技术有限公司 一种云平台资源的缩容方法、装置与系统
CN104932898A (zh) * 2015-06-30 2015-09-23 东北大学 一种基于改进多目标粒子群优化算法的待增组件选择方法
CN104932898B (zh) * 2015-06-30 2018-03-23 东北大学 一种基于改进多目标粒子群优化算法的待增组件选择方法
TWI701562B (zh) * 2015-07-08 2020-08-11 香港商阿里巴巴集團服務有限公司 資料庫彈性調度方法以及裝置
CN105553721A (zh) * 2015-12-15 2016-05-04 浪潮电子信息产业股份有限公司 一种云应用伸缩方法、应用管理端和系统
CN105577457A (zh) * 2016-03-09 2016-05-11 上海天玑科技股份有限公司 一种数据中心资源智能弹性调度系统及方法
CN105577457B (zh) * 2016-03-09 2019-02-01 上海天玑科技股份有限公司 一种数据中心资源智能弹性调度系统及方法
CN107205008A (zh) * 2016-03-18 2017-09-26 上海有云信息技术有限公司 云计算环境下web应用防火墙的负载自适应方法
CN106445512A (zh) * 2016-09-12 2017-02-22 浪潮软件股份有限公司 一种实现运行环境动态伸缩的方法
CN106445512B (zh) * 2016-09-12 2019-07-02 浪潮软件股份有限公司 一种实现运行环境动态伸缩的方法
CN106657220A (zh) * 2016-09-21 2017-05-10 郑州云海信息技术有限公司 一种基于nginx的Cloud Foundry内网部署方案
CN106533839A (zh) * 2016-11-30 2017-03-22 郑州云海信息技术有限公司 一种混合云的应用节点监控方法及装置
CN106789303A (zh) * 2016-12-29 2017-05-31 北京奇艺世纪科技有限公司 一种容器日志采集方法及装置
CN106789303B (zh) * 2016-12-29 2020-04-03 北京奇艺世纪科技有限公司 一种容器日志采集方法及装置
CN108156212A (zh) * 2017-06-29 2018-06-12 广东网金控股股份有限公司 一种基于用户感知的弹性伸缩方法及系统
CN108156212B (zh) * 2017-06-29 2020-12-22 广东网金控股股份有限公司 一种基于用户感知的弹性伸缩方法及系统
CN107689891A (zh) * 2017-09-01 2018-02-13 广西大学 大规模突访情境下容器云弹性供给时间点预测方法与系统
CN108173683A (zh) * 2017-12-25 2018-06-15 东软集团股份有限公司 云应用的弹性控制方法、装置和云服务器
CN109150603A (zh) * 2018-08-17 2019-01-04 中软信息系统工程有限公司 云服务端自动扩容方法及装置
CN109104497A (zh) * 2018-09-26 2018-12-28 郑州云海信息技术有限公司 一种基于云平台的业务处理方法及装置
CN109684043A (zh) * 2018-12-28 2019-04-26 北京百度网讯科技有限公司 用于更新信息的方法和装置
CN114443283A (zh) * 2021-12-29 2022-05-06 苏州浪潮智能科技有限公司 一种应用实例的伸缩方法和装置
CN114443283B (zh) * 2021-12-29 2023-11-17 苏州浪潮智能科技有限公司 一种应用实例的伸缩方法和装置

Also Published As

Publication number Publication date
CN103916396B (zh) 2016-09-21

Similar Documents

Publication Publication Date Title
CN103916396A (zh) 一种基于负载自适应的云平台应用实例自动伸缩方法
CN102111337B (zh) 任务调度方法和系统
Yang et al. A cost-aware auto-scaling approach using the workload prediction in service clouds
Brebner Is your cloud elastic enough? Performance modelling the elasticity of infrastructure as a service (IaaS) cloud applications
EP3507692B1 (en) Resource oversubscription based on utilization patterns in computing systems
CN104102543B (zh) 一种云计算环境中负载调整的方法和装置
TWI382318B (zh) 協調的服務效能以及應用程式置放管理
CN103118124B (zh) 一种基于分层多代理的云计算负载均衡方法
US10783002B1 (en) Cost determination of a service call
CN108182105B (zh) 基于Docker容器技术的局部动态迁移方法及控制系统
CN106133693B (zh) 虚拟机的迁移方法、装置及设备
CN106790726A (zh) 一种基于Docker云平台的优先级队列动态反馈负载均衡资源调度方法
WO2017000628A1 (zh) 一种云计算系统中的资源调度方法及装置
Bi et al. SLA-based optimisation of virtualised resource for multi-tier web applications in cloud data centres
CN104123189A (zh) 一种基于IaaS层应用感知的Web多层应用动态资源调整方法
CN102035737A (zh) 一种基于认知网络的自适应负载均衡方法和装置
CN105159775A (zh) 基于负载均衡器的云计算数据中心的管理系统和管理方法
CN103401947A (zh) 多个服务器的任务分配方法和装置
CN105024842A (zh) 服务器的扩容方法及装置
Cao et al. Energy efficient allocation of virtual machines in cloud computing environments based on demand forecast
Ma et al. Dynamic task scheduling in cloud computing based on greedy strategy
CN103248622B (zh) 一种自动伸缩的在线视频服务质量保障方法及系统
CN103488538B (zh) 云计算系统中的应用扩展装置和应用扩展方法
Remesh Babu et al. Service‐level agreement–aware scheduling and load balancing of tasks in cloud
CN105404549A (zh) 基于yarn架构的虚拟机调度系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160921

Termination date: 20170410