WO2016119412A1 - 一种云平台上的资源伸缩方法和一种云平台 - Google Patents

一种云平台上的资源伸缩方法和一种云平台 Download PDF

Info

Publication number
WO2016119412A1
WO2016119412A1 PCT/CN2015/084178 CN2015084178W WO2016119412A1 WO 2016119412 A1 WO2016119412 A1 WO 2016119412A1 CN 2015084178 W CN2015084178 W CN 2015084178W WO 2016119412 A1 WO2016119412 A1 WO 2016119412A1
Authority
WO
WIPO (PCT)
Prior art keywords
application
service
moment
time
value
Prior art date
Application number
PCT/CN2015/084178
Other languages
English (en)
French (fr)
Inventor
姜恩龙
刘赫伟
Original Assignee
华为技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 华为技术有限公司 filed Critical 华为技术有限公司
Publication of WO2016119412A1 publication Critical patent/WO2016119412A1/zh
Priority to US15/663,140 priority Critical patent/US20170331705A1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5003Managing SLA; Interaction between SLA and QoS
    • H04L41/5019Ensuring fulfilment of SLA
    • H04L41/5025Ensuring fulfilment of SLA by proactively reacting to service quality change, e.g. by reconfiguration after service quality degradation or upgrade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/508Network service management, e.g. ensuring proper service fulfilment according to agreements based on type of value added network service under agreement
    • H04L41/5096Network service management, e.g. ensuring proper service fulfilment according to agreements based on type of value added network service under agreement wherein the managed service relates to distributed or central networked applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications

Definitions

  • the embodiment of the present invention provides a resource scaling method on a cloud platform, which is used to dynamically allocate resources for an application deployed on a cloud platform, where the application is used to carry a corresponding service to implement a specific service function.
  • the method includes:
  • the embodiment of the present invention provides a storage form diagram of a mapping relationship between a time and an application required resource.
  • FIG. 3 there are a total of 24 hour points from 0 to 23 points.
  • Each hour point corresponds to one or more event nodes.
  • Each event node contains the hour of the hour and the amount of resources required at the time of the hour.
  • Mapping relations For example, the event node 1 corresponding to the 0 point includes: 0:10, the number of instances of the application deployment is 3.
  • the mapping relationship between the time required by the application and the resource required by the application may be added or deleted by adding or deleting the event node corresponding to the hour.
  • the prediction module 53 predicts the value of the service indicator of the service at the second moment, below Specifically provide two implementation methods:

Abstract

本发明提供了一种云平台上的资源伸缩方法和一种云平台,用以实现为云平台上部署的应用动态分配资源,保证业务流量突发场景下应用能够正常运行。本发明方法包括:在第一时刻,根据预测策略预测业务在第二时刻的业务指标的数值,以得到预测的业务指标数值,其中,预测策略用于指示业务指标数值的预测方式,第二时刻晚于第一时刻;根据预测的业务指标数值,以及业务指标数值和应用所需资源量的映射关系,确定应用在第二时刻所需的资源量;在第二时刻到来之前,将应用的资源量调整为应用在第二时刻所需的资源量。

Description

一种云平台上的资源伸缩方法和一种云平台
本申请要求在2015年1月30日提交中国专利局、申请号为201510054470.0、发明名称为一种云平台上的资源伸缩方法和一种云平台的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本发明涉及信息技术领域,尤其涉及一种云平台上的资源伸缩方法和一种云平台。
背景技术
PaaS(platform as an service)是云计算领域的三大服务模式之一,是把云平台作为一种服务提供的商业模式。开发者开发各种各样的应用,来承载不同的业务,例如,可以开发一个Web应用来实现即时通信业务;同时,开发者可以将开发的应用部署到云平台,云平台为应用提供的运行环境和资源,例如实例、内存等,并且支持应用的多实例部署,以支持高并发的外部用户访问。
为了保证通过部署在云平台上的应用为用户提供服务时具有良好的用户体验,需要为应用分配较多系统资源,应用占用的系统资源越多,应用的运营成本越高。目前,通常利用自动扩容技术来为应用动态分配系统资源,使得在保证业务指标的前提下,提高云平台系统资源利用率,降低应用的运营成本。利用自动扩容技术来为应用动态分配系统资源是指,云平台实时收集应用的资源使用情况,例如应用的cpu占用率、内存占用率、应用的并发请求数等信息等信息,根据收集信息,实时调整为应用分配的系统资源。例如:如果CPU(Central Processing Unit)占用率超过80%,且持续1分钟,增加一个应用实例;如果CPU占用率低于20%,且持续1分钟,则减少一个应用实例,以降低应用的运营成本。
但在云平台业务流量突发的场景中,利用现有的自动扩容技术来动态调整应用的资源时,由于调整应用占用的系统资源量的过程需要一定时间,不能够快速实现应用占用的系统资源量的增加或减少,导致业务流量突发场景下部分业务无法处理,影响应用正常运行。
发明内容
本发明实施例提供一种云平台上的资源伸缩方法和一种云平台,用以实现为云平台上部署的应用动态分配资源,保证业务流量突发场景下应用能够正常运行。
第一方面,本发明实施例提供一种云平台上的资源伸缩方法,用于为云平台上部署的应用动态分配资源,其中,该应用用于承载相应的业务,以实现特定的业务功能,该方法包括:
在第一时刻,根据预测策略预测业务在第二时刻的业务指标的数值,以得到预测的业务指标数值,其中,预测策略用于指示业务指标数值的预测方式,第二时刻晚于第一时刻;
根据预测的业务指标数值,以及业务指标数值和应用所需资源量的映射关系,确定应用在第二时刻所需的资源量;
在第二时刻到来之前,将应用的资源量调整为应用在第二时刻所需的资源量。
结合第一方面,在第一种实现方式中,预测策略包括:基于历史数据的业务指标数值预测方式;
根据预测策略预测业务在第二时刻的业务指标的数值,包括:
获取业务在第一时刻之前的预设时间间隔内的业务指标的数值;
根据获取的数值,预测业务在第二时刻的业务指标的数值。
结合第一方面的第一种实现方式,在第一方面的第二种实现方式中,根据获取的数值,预测业务在第二时刻的业务指标的数值,包括:
根据获取的数值,确定业务在第一时刻之前的预设时间间隔内的业务指 标数值的变化轨迹,根据变化轨迹,预测业务在第二时刻的业务指标的数值;
其中,预设时间间隔内包含相邻时刻第三时刻和第四时刻,变化轨迹指示业务在第三时刻的业务指标的数值与业务在第四时刻的业务指标的数值之间的大小关系,以及业务在第四时刻的业务指标的数值与业务在第三时刻的业务指标的数值相比增加或减少的数值。
结合第一方面,在第三种实现方式中,预测策略包括:基于指定时间的业务指标预测方式;
根据预测策略预测业务在第二时刻的业务指标的数值,包括:
获取业务在第一时刻之前的历史时刻的业务指标的数值,根据获取的数值预测业务在第二时刻的业务指标的数值;
其中,历史时刻中包含至少一个时刻,历史时刻中任一时刻与第二时刻之间的时间间隔为N个预设周期,N为正整数。
结合第一方面、第一方面的第一种至第三种实现方式,在第一方面的第四种实现方式中,业务的业务指标包括以下信息之一或组合:业务的并发请求数量、业务的访问流量、业务的超文本传输协议(Hyper Text Transfer Protocol,HTTP)请求数量以及业务的用户数量。
结合第一方面,在第五种实现方式中,将应用的资源量调整为应用在第二时刻所需的资源量,包括:
向云平台控制器发送指令,指令用于指示云平台控制器将应用的资源量调整为应用在第二时刻所需的资源量。
结合第一方面或第一方面的第五种实现方式,在第一方面的第六种实现方式中,应用的资源量包括以下信息之一或组合:应用部署的实例数目、应用的中央处理器CPU占用率、应用的内存占用率、应用的磁盘占用率以及应用占用的网络输入输出IO设备吞吐量。
第一方面中,通过在第一时刻,根据预测策略预测业务在第二时刻的业务指标的数值,以得到预测的业务指标数值,然后根据预测的业务指标数值,以及业务指标数值和应用所需资源量的映射关系,确定应用在第二时刻所需 的资源量,在第二时刻到来之前,将应用的资源量调整为应用在第二时刻所需的资源量,实现为云平台上部署的应用动态分配资源。第一方面中可以将业务流量突发时刻设置为第二时刻,因此,通过第一方面实现了在第二时刻到来之前云平台上部署的应用所需的资源量的动态调整,在保证高资源利用率的同时,保证业务流量突发场景下云平台上部署的应用分配的资源量能够维持应用进行正常业务运行。
第二方面,本发明实施例提供一种云平台上的资源伸缩方法,用于为云平台上部署的应用动态分配资源,其中,该应用用于承载相应的业务,以实现特定的业务功能,该方法包括:
在第一时刻,根据时刻与应用所需资源的映射关系,预测应用在第二时刻所需的资源量,其中,第二时刻晚于第一时刻;
在第二时刻到来之前,将应用的资源量调整为应用在第二时刻所需的资源量。
结合第二方面,在第一种实现方式中,时刻与应用所需资源量的映射关系是基于历史时刻与应用在历史时刻所需的资源量设置的。
结合第二方面,在第二种实现方式中,将应用的资源量调整为应用在第二时刻所需的资源量,包括:
向云平台控制器发送指令,指令用于指示云平台控制器将应用的资源量调整为应用在第二时刻所需的资源量。
结合第二方面或第二方面的第二种实现方式,在第二方面的第三种实现方式中,应用的资源量包括以下信息之一或组合:应用部署的实例数目、应用的中央处理器(Central Processing Unit,CPU)占用率、应用的内存占用率、应用的磁盘占用率以及应用占用的网络输入输出(In Out,IO)设备吞吐量。
第二方面中,通过在第一时刻,根据时刻与应用所需资源的映射关系,预测应用在第二时刻所需的资源量,然后在第二时刻到来之前,将应用的资源量调整为应用在第二时刻所需的资源量,实现为云平台上部署的应用动态分配资源。第二方面中可以将业务流量突发时刻设置为第二时刻,因此,通 过第二方面实现了在第二时刻到来之前云平台上部署的应用所需的资源量的动态调整,在保证高资源利用率的同时,保证业务流量突发场景下云平台上部署的应用分配的资源量能够维持应用进行正常业务运行。
第三方面,本发明实施例提供一种云平台,用于为云平台上部署的应用动态分配资源,其中,该应用用于承载相应的业务,以实现特定的业务功能,该云平台包括:
收集模块,用于收集业务在第一时刻之前的业务指标的数值;
策略模块,用于配置业务指标数值和应用所需资源量的映射关系;
预测模块,用于在第一时刻,根据收集模块收集的业务在第一时刻之前的业务指标的数值,预测业务在第二时刻的业务指标的数值,以得到预测的业务指标数值,第二时刻晚于第一时刻;根据预测的业务指标数值,以及策略模块配置的业务指标数值和应用所需资源量的映射关系,确定应用在第二时刻所需的资源量;
执行模块,用于在第二时刻到来之前,将应用的资源量调整为预测模块确定的应用在第二时刻所需的资源量。
结合第三方面,在第一种实现方式中,收集模块,具体用于:
收集业务在第一时刻之前的预设时间间隔内的业务指标的数值。
结合第三方面的第一种实现方式,在第三方面的二种实现方式中,预测模块根据收集模块收集的业务在第一时刻之前的业务指标的数值,预测业务在第二时刻的业务指标的数值时,具体用于:
根据收集模块收集的业务在第一时刻之前的预设时间间隔内的业务指标的数值,确定业务在第一时刻之前的预设时间间隔内的业务指标数值的变化轨迹;
根据变化轨迹,预测业务在第二时刻的业务指标的数值;
其中,预设时间间隔内包含相邻时刻第三时刻和第四时刻,变化轨迹指示业务在第三时刻的业务指标的数值与业务在第四时刻的业务指标的数值之间的大小关系,以及业务在第四时刻的业务指标的数值与业务在第三时刻的 业务指标的数值相比增加或减少的数值。
结合第三方面,在第三种实现方式中,收集模块,具体用于:
收集业务在第一时刻之前的历史时刻的业务指标的数值,其中,历史时刻中包含至少一个时刻,历史时刻中任一时刻与第二时刻之间的时间间隔为N个预设周期,N为正整数。
结合第三方面的第三种实现方式,在第三方面的四种实现方式中,预测模块根据收集模块收集的业务在第一时刻之前的业务指标的数值,预测业务在第二时刻的业务指标的数值时,具体用于:
根据收集模块收集的业务在第一时刻之前的历史时刻的业务指标的数值,预测业务在第二时刻的业务指标的数值。
结合第三方面、第三方面的第一种至第四种实现方式,在第三方面的第五种实现方式中,业务的业务指标包括以下信息之一或组合:业务的并发请求数量、业务的访问流量、业务的超文本传输协议HTTP请求数量以及业务的用户数量。
结合第三方面,在第六种实现方式中,执行模块具体用于:
向云平台控制器发送指令,指令用于指示云平台控制器将应用的资源量调整为应用在第二时刻所需的资源量。
结合第三方面或第三方面的第六种实现方式,在第三方面的第七种实现方式中,应用的资源量包括以下信息之一或组合:应用部署的实例数目、应用的中央处理器CPU占用率、应用的内存占用率、应用的磁盘占用率以及应用占用的网络输入输出IO设备吞吐量。
第三方面中,通过收集模块、策略模块、预测模块和执行模块,实现为云平台上部署的应用动态分配资源。第三方面中可以将业务流量突发时刻设置为第二时刻,因此,通过第三方面实现了在第二时刻到来之前云平台上部署的应用所需的资源量的动态调整,在保证高资源利用率的同时,保证业务流量突发场景下云平台上部署的应用分配的资源量能够维持应用进行正常业务运行。
第四方面,本发明实施例提供一种云平台,用于为云平台上部署的应用动态分配资源,其中,该应用用于承载相应的业务,以实现特定的业务功能,该云平台包括:
策略模块,用于配置时刻与应用所需资源的映射关系;
预测模块,用于在第一时刻,根据第二时刻,以及策略模块配置的时刻与应用所需资源的映射关系,预测应用在第二时刻所需的资源量,其中,第二时刻晚于第一时刻;
执行模块,用于在第二时刻到来之前,将应用的资源量调整为预测模块确定的应用在第二时刻所需的资源量。
结合第四方面,在第一种实现方式中,云平台还包括:
收集模块,用于收集应用在历史时刻所需的资源量;
策略模块,具体用于:
根据收集模块收集的应用在历史时刻所需的资源量,配置时刻与应用所需资源的映射关系。
结合第四方面,在第二种实现方式中,执行模块具体用于:
向云平台控制器发送指令,指令用于指示云平台控制器将应用的资源量调整为应用在第二时刻所需的资源量。
结合第四方面或第四方面的第二种实现方式,在第四方面的第三种实现方式中,应用的资源量包括以下信息之一或组合:应用部署的实例数目、应用的中央处理器CPU占用率、应用的内存占用率、应用的磁盘占用率以及应用占用的网络输入输出IO设备吞吐量。
第四方面中,通过收集模块、策略模块、预测模块和执行模块,实现为云平台上部署的应用动态分配资源。第四方面中可以将业务流量突发时刻设置为第二时刻,因此,通过第四方面实现了在第二时刻到来之前云平台上部署的应用所需的资源量的动态调整,在保证高资源利用率的同时,保证业务流量突发场景下云平台上部署的应用分配的资源量能够维持应用进行正常业务运行。
附图说明
图1为本发明实施例提供的一种云平台上的资源伸缩方法流程示意图;
图2为本发明实施例提供的一种云平台上的资源伸缩方法流程示意图;
图3为本发明实施例提供的一种时刻与应用的资源量的映射关系的存储形式示意图;
图4为本发明实施例提供的一种应用的资源量伸缩前后效果示意图;
图5为本发明实施例提供的一种云平台的结构示意图;
图6为本发明实施例提供的一种云平台的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的技术方案适用于云平台系统,以下简称云平台。云平台是一种服务器平台,其提供服务的商业模式是平台即服务(PaaS),PaaS是云计算领域的三大服务模式之一。云平台服务的用户是应用开发者,开发者将开发的应用部署到云平台,云平台为应用提供运行环境和资源,例如实例、内存等,并且支持应用的多实例部署,以支持高并发的外部用户访问。
本发明实施例涉及的场景为云平台上应用业务流量突发场景,其中,云平台上部署有一个或多个应用,每个应用用于承载一种业务,以实现相应的业务功能,应用也可以看成是业务的运行形态,比如云平台上托管的一个Web服务类应用,可以用来实现即时通信业务。通常一个应用对应于一个业务,某些情形下也可以由多个应用一起配合实现一个业务,本发明实施例不做特别限定。本发明实施例中,在业务流量突发时刻之前预测业务在流量突发时刻所需的资源量,并在业务流量突发时刻之前将应用的资源量调整为预测的 的资源量,在实现为云平台上部署的应用动态分配资源的同时,保证业务流量突场景下,部署在云平台上的应用仍能分配到足够的资源,进行正常的业务运行。
如图1所示,本发明实施例提供一种云平台上的资源伸缩方法,用于为云平台上部署的应用动态分配资源,应用用于承载相应的业务,以实现特定的业务功能,该方法包括:
S11、在第一时刻,根据预测策略预测业务在第二时刻的业务指标的数值,以得到预测的业务指标数值,其中,预测策略用于指示业务指标数值的预测方式,第二时刻晚于第一时刻;
S12、根据预测的业务指标数值,以及业务指标数值和应用所需资源量的映射关系,确定应用在第二时刻所需的资源量;
S13、在第二时刻到来之前,将应用的资源量调整为应用在第二时刻所需的资源量。
本实施例中,业务的业务指标可以为以下至少一种:业务的并发请求数量、业务的访问流量、业务的超文本传输协议HTTP请求数量以及业务的用户数量等。业务指标的数值,是指业务指标对应的具体数值,比如,业务指标为业务的并发请求数量,则业务指标的数值即为并发请求的数量的数值。
本实施例中,应用的资源量可以为以下至少一种:应用部署的实例数目、应用的中央处理器CPU占用率、应用的内存占用率、应用的磁盘占用率以及应用占用的网络输入输出IO设备吞吐量。
本实施例中,第一时刻通常指当前时刻,第二时刻通常指业务流量突发时刻,第二时刻晚于第一时刻。例如:根据以往经验可以确定将来某段时间范围内将会出现云平台上业务流量突发情况时,比如节日、商品抢购时间等,可以将该时间范围的起始时刻设置为第二时刻。也可以将第二时刻设置为其他时刻,本发明实施例中不做具体限定。可选的,第一时刻与第二时刻之间的时间间隔大于或等于调整应用的资源量所需的时间。
本实施例中,S11中根据预测策略预测业务在第二时刻的业务指标的数 值,下面具体提供两种实现方式:
第一种实现方式,预测策略是基于历史数据的业务指标数值预测方式。具体的,根据预测策略预测业务在第二时刻的业务指标的数值,包括:
获取业务在第一时刻之前的预设时间间隔内的业务指标的数值;
根据获取的数值,预测业务在第二时刻的业务指标的数值。
可选的,通过云平台预先采集历史数据,该历史数据包括历史时刻的业务指标的数值采集的隶属数据进行降噪处理,以去除历史数据中偶发性的抖动数据,最后将处理后的历史数据保存在云平台的数据库中,以便后续利用历史数据预测业务指标数值。例如,采样得到30条历史数据,计算出这30条历史数据的平均值;用计算的平均值分别和这30条历史数据求差,然后对差值按照大小排序;删除差值排序中数值较大的前5%对应的历史数据,删除的历史数据即为抖动数据;将未删除的历史数据保存在云平台的数据库中,以便后续利用历史数据预测业务指标数值。
针对第一种实现方式,根据获取的数值,预测业务在第二时刻的业务指标的数值,包括:
根据获取的数值,确定业务在第一时刻之前的预设时间间隔内的业务指标数值的变化轨迹,根据变化轨迹,预测业务在第二时刻的业务指标的数值;
其中,预设时间间隔内包含相邻时刻第三时刻和第四时刻,变化轨迹指示业务在第三时刻的业务指标的数值与业务在第四时刻的业务指标的数值之间的大小关系,以及业务在第四时刻的业务指标的数值与业务在第三时刻的业务指标的数值相比增加或减少的数值。
针对第一种实现方式,例如:第一时刻(即当前时刻)为下午7点50分,第二时刻为下午8点,获取昨天下午8点至今天下午7点50分的时间间隔内业务在每个整点时刻的业务指标的数值,根据获取的每个整点时刻对应的数值,确定业务在整点时刻的业务指标的数值的变化轨迹,该变化轨迹可以包括相邻整点时刻对应的数值之间的大小关系,以及相对而言增加或减少的数值,进而可以根据该变化轨迹,预测业务在第二时刻(下午8点)的业务指 标的数值。
第二种实现方式,预测策略是基于指定时间的业务指标预测方式。具体的,根据预测策略预测业务在第二时刻的业务指标的数值,包括:
获取业务在第一时刻之前的历史时刻的业务指标的数值,根据获取的数值预测业务在第二时刻的业务指标的数值;
其中,历史时刻中包含至少一个时刻,历史时刻中任一时刻与第二时刻之间的时间间隔为N个预设周期,N为正整数。
针对第二种实现方式,例如:第一时刻(即当前时刻)为下午7点50分,第二时刻为下午8点,获取业务在今天之前的每一天下午8点的业务指标的数值,然后获取的数值,预测业务在今天下午8点的业务指标的数值。
S11中根据预测策略预测业务在第二时刻的业务指标的数值,除上述两种实现方式外,还可以基于业务增长规律预测业务指标,例如:根据权威机构评估,业务每年增长量为8%。或者,基于业务的运营成本预测业务指标,业务的运营成本与承载该业务的应用的资源量成正比,例如:白天的电价高,因此业务在白天的运营成本相对较高,在不影响服务等级协议(Service-Level Agreement,SLA)的情况下,可以减少应用的资源量,以降低业务的运营成本。
本发明实施例中,可以通过向云平台控制器发送指令,来实现将应用的资源量调整为应用在第二时刻所需的资源量,该指令用于指示云平台控制器将应用的资源量调整为应用在第二时刻所需的资源量。
本发明实施例中,业务指标数值和应用所需资源量的映射关系可以基于人工配置,如基于个人的经验、或者第三方公司给出的权威数据,完成业务指标数值和应用所需资源量的映射关系配置。业务指标数值和应用所需资源量的映射关系也可以基于自动计算,即根据应用的历史运行状态信息,计算出业务指标数值对应的应用所需资源量,进而完成业务指标数值和应用所需资源量的映射关系配置。
图4为应用的资源量伸缩前后效果示意图,横向伸缩是指调整应用的实 例数量,纵向伸缩是指调整应用的内存。横向伸缩前应用的实例数量为3,通过以上实施例中的技术方案,在第二时刻到来之前将应用的实例数量横向伸缩为5;纵向伸缩前应用的内存为64M,通过以上实施例中的技术方案,在第二时刻到来之前将应用的内存纵向伸缩为128M。因此可以在第二时刻(通常指业务流量突发时刻)到来时,保证应用能够正常运行。
通过以上技术方案,实现为云平台上部署的应用动态分配资源。可以将业务流量突发时刻设置为第二时刻,实现在业务流量突发时刻到来之前云平台上部署的应用所需的资源量的动态调整,在保证高资源利用率的同时,保证业务流量突发场景下云平台上部署的应用分配的资源量能够维持应用进行正常业务运行。由于应用的运营成本与应用占用的资源量成正比,本发明实施例通过以上技术方案,避免了为应用分配过多云平台资源导致的资源浪费和运营成本较高的问题。
如图2所示,本发明实施例提供一种云平台上的资源伸缩方法,用于为云平台上部署的应用动态分配资源,其中,应用用于承载相应的业务,以实现特定的业务功能,包括:
S21、在第一时刻,根据时刻与应用所需资源的映射关系,预测应用在第二时刻所需的资源量,其中,第二时刻晚于第一时刻;
S22、在第二时刻到来之前,将应用的资源量调整为应用在第二时刻所需的资源量。
本实施例中,应用的资源量可以为以下至少一种:应用部署的实例数目、应用的中央处理器CPU占用率、应用的内存占用率、应用的磁盘占用率以及应用占用的网络输入输出IO设备吞吐量。
本发明实施例中,可以通过向云平台控制器发送指令,来实现将应用的资源量调整为应用在第二时刻所需的资源量,该指令用于指示云平台控制器将应用的资源量调整为应用在第二时刻所需的资源量。
本发明实施例中,时刻与应用所需资源量的映射关系可以基于历史时刻与应用在历史时刻所需的资源量。具体的,时刻与应用所需资源量的映射关 系可以基于自动计算,即根据应用的历史运行状态信息,计算出时刻对应的应用所需资源量,进而完成时刻与应用所需资源的映射关系配置。时刻与应用所需资源的映射关系也可以基于人工配置,如基于个人的经验、或者第三方公司给出的权威数据,完成时刻与应用所需资源的映射关系配置。
如图3所示,本发明实施例提供一种时刻与应用所需资源的映射关系的存储形式示意图。图3中共有0点至23点共24个整点时刻,每个整点时刻对应一个或多个事件节点,每个事件节点中包含整点时刻与应用在该整点时刻所需资源量的映射关系。例如:0点对应的事件节点1中包括:0点10分时应用部署的实例数量为3。在如3所示的时刻与应用所需资源的映射关系中,可以通过增加或删除整点时刻对应的事件节点,来增加或删除时刻与应用所需资源的映射关系。
通过图3所示的时刻与应用所需资源的映射关系,预测应用在第二时刻所需的资源量的方法如下:
在第一时刻(通常为当前时刻),根据第一时刻的整点时刻可以快速锁定图3所示的映射关系中的整点时刻,然后在锁定的整点时刻对应的事件节点中查找第二时刻对应的事件节点,进而根据该事件节点确定应用在第二时刻所需的资源量。例如,在第一时刻0点5分,根据第二时刻0点10分锁定图3所示的映射关系中0点对应的事件节点,并确定0点对应的事件节点1中包含的时刻与第二时刻吻合,因此确定应用在第二时刻(0点10分)所需部署的实例数量为3。
需要说明的是,本发明实施例中时刻与应用所需资源的映射关系并不局限于图3所示的形式,也可以为其他形式。
图4为应用的资源量伸缩前后效果示意图,横向伸缩是指调整应用的实例数量,纵向伸缩是指调整应用的内存。横向伸缩前应用的实例数量为3,通过实施例二中的技术方案,在第二时刻到来之前将应用的实例数量横向伸缩为5;纵向伸缩前应用的内存为64M,通过实施例二中的技术方案,在第二时刻到来之前将应用的内存纵向伸缩为128M。因此可以在第二时刻(通常指业 务流量突发时刻)到来时,保证应用能够正常运行。
通过实施例二中的技术方案,实现为云平台上部署的应用动态分配资源。可以将业务流量突发时刻设置为第二时刻,通过实施例二中的技术方案实现在业务流量突发时刻到来之前云平台上部署的应用所需的资源量的动态调整,在保证高资源利用率的同时,保证业务流量突发场景下云平台上部署的应用分配的资源量能够维持应用进行正常业务运行。由于应用的运营成本与应用占用的资源量成正比,通过实施例二中的技术方案,避免了为应用分配过多云平台资源导致的资源浪费和运营成本较高的问题。
基于前述方法实施例,本发明实施例提供一种云平台,用于为云平台上部署的应用动态分配资源,应用用于实现业务功能。该云平台在业务流量突发时刻之前预测应用在业务流量突发时刻所需的资源量,并在业务流量突发时刻之前将应用的资源量调整为预测的应用在业务流量突发时刻所需的资源量,在实现为云平台上部署的应用动态分配资源的同时,保证业务流量突场景下,部署在云平台上的应用仍能分配到足够的资源,进行正常的业务运行。
如图5所示,本发明实施例提供一种云平台,该云平台至少包括收集模块51、策略模块52、预测模块53和执行模块54,各模块的具体操作如下:
收集模块51,用于收集业务在第一时刻之前的业务指标的数值,其中,这里的业务具体由一个应用来承载或实施;
策略模块52,用于配置业务指标数值和应用所需资源量的映射关系;
预测模块53,用于在第一时刻,根据收集模块51收集的业务在第一时刻之前的业务指标的数值,预测业务在第二时刻的业务指标的数值,以得到预测的业务指标数值,第二时刻晚于第一时刻;根据预测的业务指标数值,以及策略模块52配置的业务指标数值和应用所需资源量的映射关系,确定应用在第二时刻所需的资源量;
执行模块54,用于在第二时刻到来之前,将应用的资源量调整为预测模块53确定的应用在第二时刻所需的资源量。
本实施例中,预测模块53预测业务在第二时刻的业务指标的数值,下面 具体提供两种实现方式:
第一种实现方式,是基于历史数据的业务指标数值预测方式。具体的,
收集模块51收集业务在第一时刻之前的预设时间间隔内的业务指标的数值。
预测模块53根据收集模块51收集的业务在第一时刻之前的预设时间间隔内的业务指标的数值,确定业务在第一时刻之前的预设时间间隔内的业务指标数值的变化轨迹;根据变化轨迹,预测业务在第二时刻的业务指标的数值;
其中,预设时间间隔内包含相邻时刻第三时刻和第四时刻,变化轨迹指示业务在第三时刻的业务指标的数值与业务在第四时刻的业务指标的数值之间的大小关系,以及业务在第四时刻的业务指标的数值与业务在第三时刻的业务指标的数值相比增加或减少的数值。
第二种实现方式,是基于指定时间的业务指标预测方式。具体的,
收集模块51收集业务在第一时刻之前的历史时刻的业务指标的数值,其中,历史时刻中包含至少一个时刻,历史时刻中任一时刻与第二时刻之间的时间间隔为N个预设周期,N为正整数。
预测模块53根据收集模块51收集的业务在第一时刻之前的历史时刻的业务指标的数值,预测业务在第二时刻的业务指标的数值。
针对第一种实现方式或第二中实现方式,可选的,收集模块51通过云监控器55收集业务在第一时刻之前的业务指标的数值。
本发明实施例中,可选的,执行模块54通过向云控制器56发送指令,来实现将应用的资源量调整为应用在第二时刻所需的资源量,该指令用于指示云平台控制器将应用的资源量调整为应用在第二时刻所需的资源量。
本发明实施例中,业务指标数值和应用所需资源量的映射关系可以基于人工配置,如基于个人的经验、或者第三方公司给出的权威数据,完成业务指标数值和应用所需资源量的映射关系配置。业务指标数值和应用所需资源量的映射关系也可以基于自动计算,即根据应用的历史运行状态信息,计算 出业务指标数值对应的应用所需资源量,进而完成业务指标数值和应用所需资源量的映射关系配置。
通过以上实施例提供的云平台,实现为云平台上部署的应用动态分配资源。可以将业务流量突发时刻设置为第二时刻,通过实施例三提供的云平台实现在业务流量突发时刻到来之前云平台上部署的应用所需的资源量的动态调整,在保证高资源利用率的同时,保证业务流量突发场景下云平台上部署的应用分配的资源量能够维持应用进行正常业务运行。由于应用的运营成本与应用占用的资源量成正比,通过实施例三中提供的云平台,避免了为应用分配过多云平台资源导致的资源浪费和运营成本较高的问题。
如图6所示,本发明实施例提供一种云平台,该云平台至少包括策略模块61、预测模块62和执行模块63,可选的,该云平台还包括收集模块64,各模块的具体操作如下:
策略模块61,用于配置时刻与应用所需资源的映射关系;
预测模块62,用于在第一时刻,根据第二时刻,以及策略模块61配置的时刻与应用所需资源的映射关系,预测应用在第二时刻所需的资源量,其中,第二时刻晚于第一时刻;
执行模块63,用于在第二时刻到来之前,将应用的资源量调整为预测模块62确定的应用在第二时刻所需的资源量。
本实施例中,应用的资源量可以为以下至少一种:应用部署的实例数目、应用的中央处理器CPU占用率、应用的内存占用率、应用的磁盘占用率以及应用占用的网络输入输出IO设备吞吐量。
本实施例中,第一时刻通常指当前时刻,第二时刻通常指业务流量突发时刻,第二时刻晚于第一时刻。例如:根据以往经验可以确定将来某段时间范围内将会出现业务流量突发情况时,比如节日、商品抢购时间等,可以将该时间范围的起始时刻设置为第二时刻。也可以将第二时刻设置为其他时刻,本发明实施例中不做具体限定。可选的,第一时刻与第二时刻之间的时间间隔大于或等于调整应用的资源量所需的时间。
本发明实施例中,可选的,云平台还包括:
收集模块64,用于收集应用在历史时刻所需的资源量;
此时,策略模块61根据收集模块64收集的应用在历史时刻所需的资源量,配置时刻与应用所需资源的映射关系。
可选的,收集模块64通过云监控器65收集应用在历史时刻所需的资源量。
本发明实施例中,可选的,执行模块63通过向云控制器66发送指令,来实现将应用的资源量调整为应用在第二时刻所需的资源量,该指令用于指示云平台控制器将应用的资源量调整为应用在第二时刻所需的资源量。
本发明实施例中,时刻与应用所需资源量的映射关系可以基于历史时刻与应用在历史时刻所需的资源量。具体的,时刻与应用所需资源量的映射关系可以基于自动计算,即根据应用的历史运行状态信息,计算出时刻对应的应用所需资源量,进而完成时刻与应用所需资源的映射关系配置。时刻与应用所需资源的映射关系也可以基于人工配置,如基于个人的经验、或者第三方公司给出的权威数据,完成时刻与应用所需资源的映射关系配置。
如图3所示,本发明实施例提供一种时刻与应用所需资源的映射关系的存储形式示意图。图6所示的云平台通过图3所示的时刻与应用所需资源的映射关系,预测应用在第二时刻所需的资源量的过程详见前述实施例,此处不再赘述。
通过本发明实施例提供的云平台,实现为云平台上部署的应用动态分配资源。可以将业务流量突发时刻设置为第二时刻,通过实施例四中提供的云平台实现在业务流量突发时刻到来之前云平台上部署的应用所需的资源量的动态调整,在保证高资源利用率的同时,保证业务流量突发场景下云平台上部署的应用分配的资源量能够维持应用进行正常业务运行。由于应用的运营成本与应用占用的资源量成正比,通过实施例四中提供的云平台,避免了为应用分配过多云平台资源导致的资源浪费和运营成本较高的问题。
需要说明的是,本发明提供的云平台上的资源伸缩方法,以及相应的云 平台,彼此之间并不是独立的,装置实施例的相关技术细节,可以参考相应的方法实施例。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (23)

  1. 一种云平台上的资源伸缩方法,用于为所述云平台上部署的应用动态分配资源,所述应用用于承载相应的业务,其特征在于,包括:
    在第一时刻,根据预测策略预测所述业务在第二时刻的业务指标的数值,以得到预测的业务指标数值,其中,所述预测策略用于指示业务指标数值的预测方式,所述第二时刻晚于所述第一时刻;
    根据所述预测的业务指标数值,以及业务指标数值和所述应用所需资源量的映射关系,确定所述应用在所述第二时刻所需的资源量;
    在所述第二时刻到来之前,将所述应用的资源量调整为所述应用在所述第二时刻所需的资源量。
  2. 如权利要求1所述的方法,其特征在于,所述预测策略包括:基于历史数据的业务指标数值预测方式;
    根据预测策略预测所述业务在第二时刻的业务指标的数值,包括:
    获取所述业务在第一时刻之前的预设时间间隔内的业务指标的数值;
    根据获取的所述数值,预测所述业务在第二时刻的业务指标的数值。
  3. 如权利要求2所述的方法,其特征在于,根据获取的所述数值,预测所述业务在第二时刻的业务指标的数值,包括:
    根据获取的所述数值,确定所述业务在第一时刻之前的预设时间间隔内的业务指标数值的变化轨迹,根据所述变化轨迹,预测所述业务在第二时刻的业务指标的数值;
    其中,所述预设时间间隔内包含相邻时刻第三时刻和第四时刻,所述变化轨迹指示所述业务在所述第三时刻的业务指标的数值与所述业务在所述第四时刻的业务指标的数值之间的大小关系,以及所述业务在所述第四时刻的业务指标的数值与所述业务在所述第三时刻的业务指标的数值相比增加或减少的数值。
  4. 如权利要求1所述的方法,其特征在于,所述预测策略包括:基于指 定时间的业务指标预测方式;
    根据预测策略预测所述业务在第二时刻的业务指标的数值,包括:
    获取所述业务在所述第一时刻之前的历史时刻的业务指标的数值,根据获取的所述数值预测所述业务在第二时刻的业务指标的数值;
    其中,所述历史时刻中包含至少一个时刻,所述历史时刻中任一时刻与所述第二时刻之间的时间间隔为N个预设周期,N为正整数。
  5. 如权利要求1至4任一权项所述的方法,其特征在于,所述业务的业务指标包括以下信息之一或组合:所述业务的并发请求数量、所述业务的访问流量、所述业务的超文本传输协议HTTP请求数量以及所述业务的用户数量。
  6. 如权利要求1所述的方法,其特征在于,将所述应用的资源量调整为所述应用在所述第二时刻所需的资源量,包括:
    向云平台控制器发送指令,所述指令用于指示所述云平台控制器将所述应用的资源量调整为所述应用在所述第二时刻所需的资源量。
  7. 如权利要求1或6所述的方法,其特征在于,所述应用的资源量包括以下信息之一或组合:所述应用部署的实例数目、所述应用的中央处理器CPU占用率、所述应用的内存占用率、所述应用的磁盘占用率以及所述应用占用的网络输入输出IO设备吞吐量。
  8. 一种云平台上的资源伸缩方法,用于为所述云平台上部署的应用动态分配资源,所述应用用于承载相应的业务,其特征在于,包括:
    在第一时刻,根据时刻与所述应用所需资源的映射关系,预测所述应用在第二时刻所需的资源量,其中,所述第二时刻晚于所述第一时刻;
    在所述第二时刻到来之前,将所述应用的资源量调整为所述应用在所述第二时刻所需的资源量。
  9. 如权利要求8所述的方法,其特征在于,所述时刻与所述应用所需资源量的映射关系是基于历史时刻与所述应用在所述历史时刻所需的资源量设置的。
  10. 如权利要求8所述的方法,其特征在于,将所述应用的资源量调整为所述应用在所述第二时刻所需的资源量,包括:
    向云平台控制器发送指令,所述指令用于指示所述云平台控制器将所述应用的资源量调整为所述应用在所述第二时刻所需的资源量。
  11. 如权利要求8或10所述的方法,其特征在于,所述应用的资源量包括以下信息之一或组合:所述应用部署的实例数目、所述应用的中央处理器CPU占用率、所述应用的内存占用率、所述应用的磁盘占用率以及所述应用占用的网络输入输出IO设备吞吐量。
  12. 一种云平台,用于为所述云平台上部署的应用动态分配资源,所述应用用于承载相应的业务,其特征在于,包括:
    收集模块,用于收集所述业务在第一时刻之前的业务指标的数值;
    策略模块,用于配置业务指标数值和所述应用所需资源量的映射关系;
    预测模块,用于在所述第一时刻,根据所述收集模块收集的所述业务在第一时刻之前的业务指标的数值,预测所述业务在第二时刻的业务指标的数值,以得到预测的业务指标数值,所述第二时刻晚于所述第一时刻;根据所述预测的业务指标数值,以及所述策略模块配置的业务指标数值和所述应用所需资源量的映射关系,确定所述应用在所述第二时刻所需的资源量;
    执行模块,用于在所述第二时刻到来之前,将所述应用的资源量调整为所述预测模块确定的所述应用在所述第二时刻所需的资源量。
  13. 如权利要求12所述的云平台,其特征在于,所述收集模块,具体用于:
    收集所述业务在第一时刻之前的预设时间间隔内的业务指标的数值。
  14. 如权利要求13所述的云平台,其特征在于,所述预测模块根据所述收集模块收集的所述业务在第一时刻之前的业务指标的数值,预测所述业务在第二时刻的业务指标的数值时,具体用于:
    根据所述收集模块收集的所述业务在第一时刻之前的预设时间间隔内的业务指标的数值,确定所述业务在所述第一时刻之前的预设时间间隔内的业 务指标数值的变化轨迹;
    根据所述变化轨迹,预测所述业务在第二时刻的业务指标的数值;
    其中,所述预设时间间隔内包含相邻时刻第三时刻和第四时刻,所述变化轨迹指示所述业务在所述第三时刻的业务指标的数值与所述业务在所述第四时刻的业务指标的数值之间的大小关系,以及所述业务在所述第四时刻的业务指标的数值与所述业务在所述第三时刻的业务指标的数值相比增加或减少的数值。
  15. 如权利要求12所述的云平台,其特征在于,所述收集模块,具体用于:
    收集所述业务在所述第一时刻之前的历史时刻的业务指标的数值,其中,所述历史时刻中包含至少一个时刻,所述历史时刻中任一时刻与所述第二时刻之间的时间间隔为N个预设周期,N为正整数。
  16. 如权利要求15所述的云平台,其特征在于,所述预测模块根据所述收集模块收集的所述业务在第一时刻之前的业务指标的数值,预测所述业务在第二时刻的业务指标的数值时,具体用于:
    根据所述收集模块收集的所述业务在所述第一时刻之前的历史时刻的业务指标的数值,预测所述应用在第二时刻的业务指标的数值。
  17. 如权利要求12至16任一权项所述的云平台,其特征在于,所述业务的业务指标包括以下信息之一或组合:所述业务的并发请求数量、所述业务的访问流量、所述业务的超文本传输协议HTTP请求数量以及所述业务的用户数量。
  18. 如权利要求12所述的云平台,其特征在于,所述执行模块,具体用于:
    向云平台控制器发送指令,所述指令用于指示所述云平台控制器将所述应用的资源量调整为所述应用在所述第二时刻所需的资源量。
  19. 如权利要求12或18所述的云平台,其特征在于,所述应用的资源量包括以下信息之一或组合:所述应用部署的实例数目、所述应用的中央处 理器CPU占用率、所述应用的内存占用率、所述应用的磁盘占用率以及所述应用占用的网络输入输出IO设备吞吐量。
  20. 一种云平台,用于为所述云平台上部署的应用动态分配资源,所述应用用于承载相应的业务,其特征在于,包括:
    策略模块,用于配置时刻与所述应用所需资源的映射关系;
    预测模块,用于在第一时刻,根据第二时刻,以及所述策略模块配置的时刻与所述应用所需资源的映射关系,预测所述应用在所述第二时刻所需的资源量,其中,所述第二时刻晚于所述第一时刻;
    执行模块,用于在所述第二时刻到来之前,将所述应用的资源量调整为所述预测模块确定的所述应用在所述第二时刻所需的资源量。
  21. 如权利要求20所述的云平台,其特征在于,所述云平台还包括:
    收集模块,用于收集所述应用在历史时刻所需的资源量;
    所述策略模块,具体用于:
    根据所述收集模块收集的所述应用在历史时刻所需的资源量,配置所述时刻与所述应用所需资源的映射关系。
  22. 如权利要求20所述的云平台,其特征在于,所述执行模块,具体用于:
    向云平台控制器发送指令,所述指令用于指示所述云平台控制器将所述应用的资源量调整为所述应用在所述第二时刻所需的资源量。
  23. 如权利要求20或22所述的云平台,其特征在于,所述应用的资源量包括以下信息之一或组合:所述应用部署的实例数目、所述应用的中央处理器CPU占用率、所述应用的内存占用率、所述应用的磁盘占用率以及所述应用占用的网络输入输出IO设备吞吐量。
PCT/CN2015/084178 2015-01-30 2015-07-16 一种云平台上的资源伸缩方法和一种云平台 WO2016119412A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US15/663,140 US20170331705A1 (en) 2015-01-30 2017-07-28 Resource Scaling Method on Cloud Platform and Cloud Platform

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201510054470.0 2015-01-30
CN201510054470.0A CN104580524A (zh) 2015-01-30 2015-01-30 一种云平台上的资源伸缩方法和一种云平台

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US15/663,140 Continuation US20170331705A1 (en) 2015-01-30 2017-07-28 Resource Scaling Method on Cloud Platform and Cloud Platform

Publications (1)

Publication Number Publication Date
WO2016119412A1 true WO2016119412A1 (zh) 2016-08-04

Family

ID=53095681

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2015/084178 WO2016119412A1 (zh) 2015-01-30 2015-07-16 一种云平台上的资源伸缩方法和一种云平台

Country Status (3)

Country Link
US (1) US20170331705A1 (zh)
CN (1) CN104580524A (zh)
WO (1) WO2016119412A1 (zh)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104580524A (zh) * 2015-01-30 2015-04-29 华为技术有限公司 一种云平台上的资源伸缩方法和一种云平台
CN105516242A (zh) * 2015-11-23 2016-04-20 华为技术有限公司 一种存储资源分配方法及存储资源分配系统
CN106919450B (zh) * 2015-12-24 2020-11-17 华为技术有限公司 资源调整方法和装置
US20170214634A1 (en) * 2016-01-26 2017-07-27 Futurewei Technologies, Inc. Joint autoscaling of cloud applications
CN106100901B (zh) * 2016-08-04 2019-12-06 中国银联股份有限公司 一种流速控制方法及装置
CN106484540B (zh) * 2016-10-20 2019-11-19 腾讯科技(深圳)有限公司 一种资源配置方法及装置
CN108023742B (zh) * 2016-10-31 2021-08-27 阿里巴巴集团控股有限公司 一种应用的扩容方法、装置和系统
CN108009017B (zh) * 2016-11-01 2022-02-18 阿里巴巴集团控股有限公司 一种应用链路的扩容方法、装置和系统
CN107040475B (zh) * 2016-11-14 2020-10-02 平安科技(深圳)有限公司 资源调度方法和装置
US10812407B2 (en) * 2017-11-21 2020-10-20 International Business Machines Corporation Automatic diagonal scaling of workloads in a distributed computing environment
US10733015B2 (en) 2017-11-21 2020-08-04 International Business Machines Corporation Prioritizing applications for diagonal scaling in a distributed computing environment
US10893000B2 (en) 2017-11-21 2021-01-12 International Business Machines Corporation Diagonal scaling of resource allocations and application instances in a distributed computing environment
US10721179B2 (en) 2017-11-21 2020-07-21 International Business Machines Corporation Adaptive resource allocation operations based on historical data in a distributed computing environment
CN108092797A (zh) * 2017-11-21 2018-05-29 北京奇艺世纪科技有限公司 一种容器管理方法及装置
US10635501B2 (en) 2017-11-21 2020-04-28 International Business Machines Corporation Adaptive scaling of workloads in a distributed computing environment
US10887250B2 (en) 2017-11-21 2021-01-05 International Business Machines Corporation Reducing resource allocations and application instances in diagonal scaling in a distributed computing environment
CN108093062B (zh) * 2017-12-26 2021-01-26 北京微网通联股份有限公司 云资源管理方法及装置
CN110196767B (zh) * 2018-03-05 2023-07-25 腾讯科技(深圳)有限公司 服务资源控制方法、装置、设备和存储介质
CN109086135B (zh) * 2018-07-26 2021-10-26 北京百度网讯科技有限公司 资源伸缩方法、装置、计算机设备及存储介质
US10956221B2 (en) 2018-11-26 2021-03-23 International Business Machines Corporation Estimating resource requests for workloads to offload to host systems in a computing environment
CN111221847B (zh) * 2018-11-26 2023-04-28 杭州海康威视系统技术有限公司 监控数据存储方法、装置及计算机可读存储介质
US10877814B2 (en) 2018-11-26 2020-12-29 International Business Machines Corporation Profiling workloads in host systems allocated to a cluster to determine adjustments to allocation of host systems to the cluster
US10841369B2 (en) 2018-11-26 2020-11-17 International Business Machines Corporation Determining allocatable host system resources to remove from a cluster and return to a host service provider
CN111858015B (zh) * 2019-04-25 2024-01-12 中国移动通信集团河北有限公司 配置应用程序的运行资源的方法、装置及网关
CN110609747A (zh) * 2019-08-29 2019-12-24 联想(北京)有限公司 信息处理方法及电子设备
CN113055937B (zh) * 2019-12-27 2023-04-28 中移雄安信息通信科技有限公司 一种资源调整方法和资源调整装置
CN111338788B (zh) * 2020-02-06 2023-08-29 福建天泉教育科技有限公司 资源配额审批方法、存储介质
CN111930479B (zh) * 2020-06-22 2024-02-06 北京视博云信息技术有限公司 一种资源的调度方法、装置、可读存储介质及设备
CN113271606B (zh) * 2021-04-21 2022-08-05 北京邮电大学 云原生移动网络稳定性保障的业务调度方法及电子设备
CN113391883A (zh) * 2021-08-18 2021-09-14 中关村科学城城市大脑股份有限公司 应用于城市大脑的ai模型推理系统及方法
CN113992525A (zh) * 2021-10-12 2022-01-28 支付宝(杭州)信息技术有限公司 一种应用的容器数量调节方法及装置
CN117170855A (zh) * 2022-05-27 2023-12-05 华为云计算技术有限公司 一种业务集群的伸缩方法及相关设备
CN115361302B (zh) * 2022-08-16 2023-08-22 中国联合网络通信集团有限公司 基于sla的算网服务控制方法、装置及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102307241A (zh) * 2011-09-27 2012-01-04 上海忠恕物联网科技有限公司 一种基于动态预测的云计算资源部署方法
CN103152389A (zh) * 2013-02-01 2013-06-12 华南师范大学 应用于云计算机系统中应对高峰访问的方法和装置
US20140032405A1 (en) * 2011-06-14 2014-01-30 Empire Technology Development Llc Peak-performance-aware billing for cloud computing environment
CN104065663A (zh) * 2014-07-01 2014-09-24 复旦大学 一种基于混合云调度模型的自动伸缩、费用优化的内容分发服务方法
CN104244436A (zh) * 2014-09-29 2014-12-24 中国联合网络通信集团有限公司 一种网络设备的调整方法及装置
CN104580524A (zh) * 2015-01-30 2015-04-29 华为技术有限公司 一种云平台上的资源伸缩方法和一种云平台

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140032405A1 (en) * 2011-06-14 2014-01-30 Empire Technology Development Llc Peak-performance-aware billing for cloud computing environment
CN102307241A (zh) * 2011-09-27 2012-01-04 上海忠恕物联网科技有限公司 一种基于动态预测的云计算资源部署方法
CN103152389A (zh) * 2013-02-01 2013-06-12 华南师范大学 应用于云计算机系统中应对高峰访问的方法和装置
CN104065663A (zh) * 2014-07-01 2014-09-24 复旦大学 一种基于混合云调度模型的自动伸缩、费用优化的内容分发服务方法
CN104244436A (zh) * 2014-09-29 2014-12-24 中国联合网络通信集团有限公司 一种网络设备的调整方法及装置
CN104580524A (zh) * 2015-01-30 2015-04-29 华为技术有限公司 一种云平台上的资源伸缩方法和一种云平台

Also Published As

Publication number Publication date
CN104580524A (zh) 2015-04-29
US20170331705A1 (en) 2017-11-16

Similar Documents

Publication Publication Date Title
WO2016119412A1 (zh) 一种云平台上的资源伸缩方法和一种云平台
JP6457447B2 (ja) データセンターのネットワークトラフィックスケジューリング方法及び装置
US9483288B2 (en) Method and system for running a virtual appliance
WO2019001092A1 (zh) 负载均衡引擎,客户端,分布式计算系统以及负载均衡方法
US10616370B2 (en) Adjusting cloud-based execution environment by neural network
US20180198855A1 (en) Method and apparatus for scheduling calculation tasks among clusters
CN105743962A (zh) 端对端数据中心性能控制
WO2019091387A1 (en) Method and system for provisioning resources in cloud computing
US20180046477A1 (en) Technique For Scaling An Application Having A Set Of Virtual Machines
US20170118088A1 (en) Service chain management apparatus, service chain management system, service chain management method, and program recording medium
TWI755415B (zh) 雲端環境下應用集群資源分配的方法、裝置和系統
Bi et al. SLA-based optimisation of virtualised resource for multi-tier web applications in cloud data centres
KR102612312B1 (ko) 전자 장치 및 이의 제어방법
CN112422440B (zh) 一种应用于服务器的流量控制方法以及相关装置
CN105808341B (zh) 一种资源调度的方法、装置和系统
US20150317081A1 (en) Adaptive system provisioning
CN110990138A (zh) 资源调度方法、装置、服务器及存储介质
WO2016041446A1 (zh) 一种资源分配方法、装置及设备
CN109739627B (zh) 任务的调度方法、电子设备及介质
CN103488538B (zh) 云计算系统中的应用扩展装置和应用扩展方法
CN113886010A (zh) 容器资源的控制方法、设备及计算机存储介质
CN115917510A (zh) 精简云计算环境中的虚拟机部署
KR101630125B1 (ko) 클라우드 컴퓨팅 자원관리 시스템에서의 자원 요구량 예측 방법
CN114625500A (zh) 云环境下拓扑感知的微服务应用调度的方法及应用
CN107203256B (zh) 一种网络功能虚拟化场景下的节能分配方法与装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15879612

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 15879612

Country of ref document: EP

Kind code of ref document: A1