WO2016119412A1

WO2016119412A1 - 一种云平台上的资源伸缩方法和一种云平台

Info

Publication number: WO2016119412A1
Application number: PCT/CN2015/084178
Authority: WO
Inventors: 姜恩龙; 刘赫伟
Original assignee: 华为技术有限公司
Priority date: 2015-01-30
Filing date: 2015-07-16
Publication date: 2016-08-04
Also published as: CN104580524A; US20170331705A1

Abstract

本发明提供了一种云平台上的资源伸缩方法和一种云平台，用以实现为云平台上部署的应用动态分配资源，保证业务流量突发场景下应用能够正常运行。本发明方法包括：在第一时刻，根据预测策略预测业务在第二时刻的业务指标的数值，以得到预测的业务指标数值，其中，预测策略用于指示业务指标数值的预测方式，第二时刻晚于第一时刻；根据预测的业务指标数值，以及业务指标数值和应用所需资源量的映射关系，确定应用在第二时刻所需的资源量；在第二时刻到来之前，将应用的资源量调整为应用在第二时刻所需的资源量。

Description

一种云平台上的资源伸缩方法和一种云平台

本申请要求在2015年1月30日提交中国专利局、申请号为201510054470.0、发明名称为一种云平台上的资源伸缩方法和一种云平台的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及信息技术领域，尤其涉及一种云平台上的资源伸缩方法和一种云平台。

背景技术

PaaS(platform as an service)是云计算领域的三大服务模式之一，是把云平台作为一种服务提供的商业模式。开发者开发各种各样的应用，来承载不同的业务，例如，可以开发一个Web应用来实现即时通信业务；同时，开发者可以将开发的应用部署到云平台，云平台为应用提供的运行环境和资源，例如实例、内存等，并且支持应用的多实例部署，以支持高并发的外部用户访问。

为了保证通过部署在云平台上的应用为用户提供服务时具有良好的用户体验，需要为应用分配较多系统资源，应用占用的系统资源越多，应用的运营成本越高。目前，通常利用自动扩容技术来为应用动态分配系统资源，使得在保证业务指标的前提下，提高云平台系统资源利用率，降低应用的运营成本。利用自动扩容技术来为应用动态分配系统资源是指，云平台实时收集应用的资源使用情况，例如应用的cpu占用率、内存占用率、应用的并发请求数等信息等信息，根据收集信息，实时调整为应用分配的系统资源。例如：如果CPU(Central Processing Unit)占用率超过80％，且持续1分钟，增加一个应用实例；如果CPU占用率低于20％，且持续1分钟，则减少一个应用实例，以降低应用的运营成本。

但在云平台业务流量突发的场景中，利用现有的自动扩容技术来动态调整应用的资源时，由于调整应用占用的系统资源量的过程需要一定时间，不能够快速实现应用占用的系统资源量的增加或减少，导致业务流量突发场景下部分业务无法处理，影响应用正常运行。

发明内容

本发明实施例提供一种云平台上的资源伸缩方法和一种云平台，用以实现为云平台上部署的应用动态分配资源，保证业务流量突发场景下应用能够正常运行。

第一方面，本发明实施例提供一种云平台上的资源伸缩方法，用于为云平台上部署的应用动态分配资源，其中，该应用用于承载相应的业务，以实现特定的业务功能，该方法包括：

在第一时刻，根据预测策略预测业务在第二时刻的业务指标的数值，以得到预测的业务指标数值，其中，预测策略用于指示业务指标数值的预测方式，第二时刻晚于第一时刻；

根据预测的业务指标数值，以及业务指标数值和应用所需资源量的映射关系，确定应用在第二时刻所需的资源量；

在第二时刻到来之前，将应用的资源量调整为应用在第二时刻所需的资源量。

结合第一方面，在第一种实现方式中，预测策略包括：基于历史数据的业务指标数值预测方式；

根据预测策略预测业务在第二时刻的业务指标的数值，包括：

获取业务在第一时刻之前的预设时间间隔内的业务指标的数值；

根据获取的数值，预测业务在第二时刻的业务指标的数值。

结合第一方面的第一种实现方式，在第一方面的第二种实现方式中，根据获取的数值，预测业务在第二时刻的业务指标的数值，包括：

根据获取的数值，确定业务在第一时刻之前的预设时间间隔内的业务指标数值的变化轨迹，根据变化轨迹，预测业务在第二时刻的业务指标的数值；

其中，预设时间间隔内包含相邻时刻第三时刻和第四时刻，变化轨迹指示业务在第三时刻的业务指标的数值与业务在第四时刻的业务指标的数值之间的大小关系，以及业务在第四时刻的业务指标的数值与业务在第三时刻的业务指标的数值相比增加或减少的数值。

结合第一方面，在第三种实现方式中，预测策略包括：基于指定时间的业务指标预测方式；

获取业务在第一时刻之前的历史时刻的业务指标的数值，根据获取的数值预测业务在第二时刻的业务指标的数值；

其中，历史时刻中包含至少一个时刻，历史时刻中任一时刻与第二时刻之间的时间间隔为N个预设周期，N为正整数。

结合第一方面、第一方面的第一种至第三种实现方式，在第一方面的第四种实现方式中，业务的业务指标包括以下信息之一或组合：业务的并发请求数量、业务的访问流量、业务的超文本传输协议(Hyper Text Transfer Protocol，HTTP)请求数量以及业务的用户数量。

结合第一方面，在第五种实现方式中，将应用的资源量调整为应用在第二时刻所需的资源量，包括：

向云平台控制器发送指令，指令用于指示云平台控制器将应用的资源量调整为应用在第二时刻所需的资源量。

结合第一方面或第一方面的第五种实现方式，在第一方面的第六种实现方式中，应用的资源量包括以下信息之一或组合：应用部署的实例数目、应用的中央处理器CPU占用率、应用的内存占用率、应用的磁盘占用率以及应用占用的网络输入输出IO设备吞吐量。

第一方面中，通过在第一时刻，根据预测策略预测业务在第二时刻的业务指标的数值，以得到预测的业务指标数值，然后根据预测的业务指标数值，以及业务指标数值和应用所需资源量的映射关系，确定应用在第二时刻所需的资源量，在第二时刻到来之前，将应用的资源量调整为应用在第二时刻所需的资源量，实现为云平台上部署的应用动态分配资源。第一方面中可以将业务流量突发时刻设置为第二时刻，因此，通过第一方面实现了在第二时刻到来之前云平台上部署的应用所需的资源量的动态调整，在保证高资源利用率的同时，保证业务流量突发场景下云平台上部署的应用分配的资源量能够维持应用进行正常业务运行。

第二方面，本发明实施例提供一种云平台上的资源伸缩方法，用于为云平台上部署的应用动态分配资源，其中，该应用用于承载相应的业务，以实现特定的业务功能，该方法包括：

在第一时刻，根据时刻与应用所需资源的映射关系，预测应用在第二时刻所需的资源量，其中，第二时刻晚于第一时刻；

结合第二方面，在第一种实现方式中，时刻与应用所需资源量的映射关系是基于历史时刻与应用在历史时刻所需的资源量设置的。

结合第二方面，在第二种实现方式中，将应用的资源量调整为应用在第二时刻所需的资源量，包括：

结合第二方面或第二方面的第二种实现方式，在第二方面的第三种实现方式中，应用的资源量包括以下信息之一或组合：应用部署的实例数目、应用的中央处理器(Central Processing Unit，CPU)占用率、应用的内存占用率、应用的磁盘占用率以及应用占用的网络输入输出(In Out，IO)设备吞吐量。

第二方面中，通过在第一时刻，根据时刻与应用所需资源的映射关系，预测应用在第二时刻所需的资源量，然后在第二时刻到来之前，将应用的资源量调整为应用在第二时刻所需的资源量，实现为云平台上部署的应用动态分配资源。第二方面中可以将业务流量突发时刻设置为第二时刻，因此，通过第二方面实现了在第二时刻到来之前云平台上部署的应用所需的资源量的动态调整，在保证高资源利用率的同时，保证业务流量突发场景下云平台上部署的应用分配的资源量能够维持应用进行正常业务运行。

第三方面，本发明实施例提供一种云平台，用于为云平台上部署的应用动态分配资源，其中，该应用用于承载相应的业务，以实现特定的业务功能，该云平台包括：

收集模块，用于收集业务在第一时刻之前的业务指标的数值；

策略模块，用于配置业务指标数值和应用所需资源量的映射关系；

预测模块，用于在第一时刻，根据收集模块收集的业务在第一时刻之前的业务指标的数值，预测业务在第二时刻的业务指标的数值，以得到预测的业务指标数值，第二时刻晚于第一时刻；根据预测的业务指标数值，以及策略模块配置的业务指标数值和应用所需资源量的映射关系，确定应用在第二时刻所需的资源量；

执行模块，用于在第二时刻到来之前，将应用的资源量调整为预测模块确定的应用在第二时刻所需的资源量。

结合第三方面，在第一种实现方式中，收集模块，具体用于：

收集业务在第一时刻之前的预设时间间隔内的业务指标的数值。

结合第三方面的第一种实现方式，在第三方面的二种实现方式中，预测模块根据收集模块收集的业务在第一时刻之前的业务指标的数值，预测业务在第二时刻的业务指标的数值时，具体用于：

根据收集模块收集的业务在第一时刻之前的预设时间间隔内的业务指标的数值，确定业务在第一时刻之前的预设时间间隔内的业务指标数值的变化轨迹；

根据变化轨迹，预测业务在第二时刻的业务指标的数值；

结合第三方面，在第三种实现方式中，收集模块，具体用于：

收集业务在第一时刻之前的历史时刻的业务指标的数值，其中，历史时刻中包含至少一个时刻，历史时刻中任一时刻与第二时刻之间的时间间隔为N个预设周期，N为正整数。

结合第三方面的第三种实现方式，在第三方面的四种实现方式中，预测模块根据收集模块收集的业务在第一时刻之前的业务指标的数值，预测业务在第二时刻的业务指标的数值时，具体用于：

根据收集模块收集的业务在第一时刻之前的历史时刻的业务指标的数值，预测业务在第二时刻的业务指标的数值。

结合第三方面、第三方面的第一种至第四种实现方式，在第三方面的第五种实现方式中，业务的业务指标包括以下信息之一或组合：业务的并发请求数量、业务的访问流量、业务的超文本传输协议HTTP请求数量以及业务的用户数量。

结合第三方面，在第六种实现方式中，执行模块具体用于：

结合第三方面或第三方面的第六种实现方式，在第三方面的第七种实现方式中，应用的资源量包括以下信息之一或组合：应用部署的实例数目、应用的中央处理器CPU占用率、应用的内存占用率、应用的磁盘占用率以及应用占用的网络输入输出IO设备吞吐量。

第三方面中，通过收集模块、策略模块、预测模块和执行模块，实现为云平台上部署的应用动态分配资源。第三方面中可以将业务流量突发时刻设置为第二时刻，因此，通过第三方面实现了在第二时刻到来之前云平台上部署的应用所需的资源量的动态调整，在保证高资源利用率的同时，保证业务流量突发场景下云平台上部署的应用分配的资源量能够维持应用进行正常业务运行。

第四方面，本发明实施例提供一种云平台，用于为云平台上部署的应用动态分配资源，其中，该应用用于承载相应的业务，以实现特定的业务功能，该云平台包括：

策略模块，用于配置时刻与应用所需资源的映射关系；

预测模块，用于在第一时刻，根据第二时刻，以及策略模块配置的时刻与应用所需资源的映射关系，预测应用在第二时刻所需的资源量，其中，第二时刻晚于第一时刻；

结合第四方面，在第一种实现方式中，云平台还包括：

收集模块，用于收集应用在历史时刻所需的资源量；

策略模块，具体用于：

根据收集模块收集的应用在历史时刻所需的资源量，配置时刻与应用所需资源的映射关系。

结合第四方面，在第二种实现方式中，执行模块具体用于：

结合第四方面或第四方面的第二种实现方式，在第四方面的第三种实现方式中，应用的资源量包括以下信息之一或组合：应用部署的实例数目、应用的中央处理器CPU占用率、应用的内存占用率、应用的磁盘占用率以及应用占用的网络输入输出IO设备吞吐量。

第四方面中，通过收集模块、策略模块、预测模块和执行模块，实现为云平台上部署的应用动态分配资源。第四方面中可以将业务流量突发时刻设置为第二时刻，因此，通过第四方面实现了在第二时刻到来之前云平台上部署的应用所需的资源量的动态调整，在保证高资源利用率的同时，保证业务流量突发场景下云平台上部署的应用分配的资源量能够维持应用进行正常业务运行。

附图说明

图1为本发明实施例提供的一种云平台上的资源伸缩方法流程示意图；

图2为本发明实施例提供的一种云平台上的资源伸缩方法流程示意图；

图3为本发明实施例提供的一种时刻与应用的资源量的映射关系的存储形式示意图；

图4为本发明实施例提供的一种应用的资源量伸缩前后效果示意图；

图5为本发明实施例提供的一种云平台的结构示意图；

图6为本发明实施例提供的一种云平台的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的技术方案适用于云平台系统，以下简称云平台。云平台是一种服务器平台，其提供服务的商业模式是平台即服务(PaaS)，PaaS是云计算领域的三大服务模式之一。云平台服务的用户是应用开发者，开发者将开发的应用部署到云平台，云平台为应用提供运行环境和资源，例如实例、内存等，并且支持应用的多实例部署，以支持高并发的外部用户访问。

本发明实施例涉及的场景为云平台上应用业务流量突发场景，其中，云平台上部署有一个或多个应用，每个应用用于承载一种业务，以实现相应的业务功能，应用也可以看成是业务的运行形态，比如云平台上托管的一个Web服务类应用，可以用来实现即时通信业务。通常一个应用对应于一个业务，某些情形下也可以由多个应用一起配合实现一个业务，本发明实施例不做特别限定。本发明实施例中，在业务流量突发时刻之前预测业务在流量突发时刻所需的资源量，并在业务流量突发时刻之前将应用的资源量调整为预测的的资源量，在实现为云平台上部署的应用动态分配资源的同时，保证业务流量突场景下，部署在云平台上的应用仍能分配到足够的资源，进行正常的业务运行。

如图1所示，本发明实施例提供一种云平台上的资源伸缩方法，用于为云平台上部署的应用动态分配资源，应用用于承载相应的业务，以实现特定的业务功能，该方法包括：

S11、在第一时刻，根据预测策略预测业务在第二时刻的业务指标的数值，以得到预测的业务指标数值，其中，预测策略用于指示业务指标数值的预测方式，第二时刻晚于第一时刻；

S12、根据预测的业务指标数值，以及业务指标数值和应用所需资源量的映射关系，确定应用在第二时刻所需的资源量；

S13、在第二时刻到来之前，将应用的资源量调整为应用在第二时刻所需的资源量。

本实施例中，业务的业务指标可以为以下至少一种：业务的并发请求数量、业务的访问流量、业务的超文本传输协议HTTP请求数量以及业务的用户数量等。业务指标的数值，是指业务指标对应的具体数值，比如，业务指标为业务的并发请求数量，则业务指标的数值即为并发请求的数量的数值。

本实施例中，应用的资源量可以为以下至少一种：应用部署的实例数目、应用的中央处理器CPU占用率、应用的内存占用率、应用的磁盘占用率以及应用占用的网络输入输出IO设备吞吐量。

本实施例中，第一时刻通常指当前时刻，第二时刻通常指业务流量突发时刻，第二时刻晚于第一时刻。例如：根据以往经验可以确定将来某段时间范围内将会出现云平台上业务流量突发情况时，比如节日、商品抢购时间等，可以将该时间范围的起始时刻设置为第二时刻。也可以将第二时刻设置为其他时刻，本发明实施例中不做具体限定。可选的，第一时刻与第二时刻之间的时间间隔大于或等于调整应用的资源量所需的时间。

本实施例中，S11中根据预测策略预测业务在第二时刻的业务指标的数值，下面具体提供两种实现方式：

第一种实现方式，预测策略是基于历史数据的业务指标数值预测方式。具体的，根据预测策略预测业务在第二时刻的业务指标的数值，包括：

根据获取的数值，预测业务在第二时刻的业务指标的数值。

可选的，通过云平台预先采集历史数据，该历史数据包括历史时刻的业务指标的数值采集的隶属数据进行降噪处理，以去除历史数据中偶发性的抖动数据，最后将处理后的历史数据保存在云平台的数据库中，以便后续利用历史数据预测业务指标数值。例如，采样得到30条历史数据，计算出这30条历史数据的平均值；用计算的平均值分别和这30条历史数据求差，然后对差值按照大小排序；删除差值排序中数值较大的前5％对应的历史数据，删除的历史数据即为抖动数据；将未删除的历史数据保存在云平台的数据库中，以便后续利用历史数据预测业务指标数值。

针对第一种实现方式，根据获取的数值，预测业务在第二时刻的业务指标的数值，包括：

针对第一种实现方式，例如：第一时刻(即当前时刻)为下午7点50分，第二时刻为下午8点，获取昨天下午8点至今天下午7点50分的时间间隔内业务在每个整点时刻的业务指标的数值，根据获取的每个整点时刻对应的数值，确定业务在整点时刻的业务指标的数值的变化轨迹，该变化轨迹可以包括相邻整点时刻对应的数值之间的大小关系，以及相对而言增加或减少的数值，进而可以根据该变化轨迹，预测业务在第二时刻(下午8点)的业务指标的数值。

第二种实现方式，预测策略是基于指定时间的业务指标预测方式。具体的，根据预测策略预测业务在第二时刻的业务指标的数值，包括：

针对第二种实现方式，例如：第一时刻(即当前时刻)为下午7点50分，第二时刻为下午8点，获取业务在今天之前的每一天下午8点的业务指标的数值，然后获取的数值，预测业务在今天下午8点的业务指标的数值。

S11中根据预测策略预测业务在第二时刻的业务指标的数值，除上述两种实现方式外，还可以基于业务增长规律预测业务指标，例如：根据权威机构评估，业务每年增长量为8％。或者，基于业务的运营成本预测业务指标，业务的运营成本与承载该业务的应用的资源量成正比，例如：白天的电价高，因此业务在白天的运营成本相对较高，在不影响服务等级协议(Service-Level Agreement，SLA)的情况下，可以减少应用的资源量，以降低业务的运营成本。

本发明实施例中，可以通过向云平台控制器发送指令，来实现将应用的资源量调整为应用在第二时刻所需的资源量，该指令用于指示云平台控制器将应用的资源量调整为应用在第二时刻所需的资源量。

本发明实施例中，业务指标数值和应用所需资源量的映射关系可以基于人工配置，如基于个人的经验、或者第三方公司给出的权威数据，完成业务指标数值和应用所需资源量的映射关系配置。业务指标数值和应用所需资源量的映射关系也可以基于自动计算，即根据应用的历史运行状态信息，计算出业务指标数值对应的应用所需资源量，进而完成业务指标数值和应用所需资源量的映射关系配置。

图4为应用的资源量伸缩前后效果示意图，横向伸缩是指调整应用的实例数量，纵向伸缩是指调整应用的内存。横向伸缩前应用的实例数量为3，通过以上实施例中的技术方案，在第二时刻到来之前将应用的实例数量横向伸缩为5；纵向伸缩前应用的内存为64M，通过以上实施例中的技术方案，在第二时刻到来之前将应用的内存纵向伸缩为128M。因此可以在第二时刻(通常指业务流量突发时刻)到来时，保证应用能够正常运行。

通过以上技术方案，实现为云平台上部署的应用动态分配资源。可以将业务流量突发时刻设置为第二时刻，实现在业务流量突发时刻到来之前云平台上部署的应用所需的资源量的动态调整，在保证高资源利用率的同时，保证业务流量突发场景下云平台上部署的应用分配的资源量能够维持应用进行正常业务运行。由于应用的运营成本与应用占用的资源量成正比，本发明实施例通过以上技术方案，避免了为应用分配过多云平台资源导致的资源浪费和运营成本较高的问题。

如图2所示，本发明实施例提供一种云平台上的资源伸缩方法，用于为云平台上部署的应用动态分配资源，其中，应用用于承载相应的业务，以实现特定的业务功能，包括：

S21、在第一时刻，根据时刻与应用所需资源的映射关系，预测应用在第二时刻所需的资源量，其中，第二时刻晚于第一时刻；

S22、在第二时刻到来之前，将应用的资源量调整为应用在第二时刻所需的资源量。

本发明实施例中，时刻与应用所需资源量的映射关系可以基于历史时刻与应用在历史时刻所需的资源量。具体的，时刻与应用所需资源量的映射关系可以基于自动计算，即根据应用的历史运行状态信息，计算出时刻对应的应用所需资源量，进而完成时刻与应用所需资源的映射关系配置。时刻与应用所需资源的映射关系也可以基于人工配置，如基于个人的经验、或者第三方公司给出的权威数据，完成时刻与应用所需资源的映射关系配置。

如图3所示，本发明实施例提供一种时刻与应用所需资源的映射关系的存储形式示意图。图3中共有0点至23点共24个整点时刻，每个整点时刻对应一个或多个事件节点，每个事件节点中包含整点时刻与应用在该整点时刻所需资源量的映射关系。例如：0点对应的事件节点1中包括：0点10分时应用部署的实例数量为3。在如3所示的时刻与应用所需资源的映射关系中，可以通过增加或删除整点时刻对应的事件节点，来增加或删除时刻与应用所需资源的映射关系。

通过图3所示的时刻与应用所需资源的映射关系，预测应用在第二时刻所需的资源量的方法如下：

在第一时刻(通常为当前时刻)，根据第一时刻的整点时刻可以快速锁定图3所示的映射关系中的整点时刻，然后在锁定的整点时刻对应的事件节点中查找第二时刻对应的事件节点，进而根据该事件节点确定应用在第二时刻所需的资源量。例如，在第一时刻0点5分，根据第二时刻0点10分锁定图3所示的映射关系中0点对应的事件节点，并确定0点对应的事件节点1中包含的时刻与第二时刻吻合，因此确定应用在第二时刻(0点10分)所需部署的实例数量为3。

需要说明的是，本发明实施例中时刻与应用所需资源的映射关系并不局限于图3所示的形式，也可以为其他形式。

图4为应用的资源量伸缩前后效果示意图，横向伸缩是指调整应用的实例数量，纵向伸缩是指调整应用的内存。横向伸缩前应用的实例数量为3，通过实施例二中的技术方案，在第二时刻到来之前将应用的实例数量横向伸缩为5；纵向伸缩前应用的内存为64M，通过实施例二中的技术方案，在第二时刻到来之前将应用的内存纵向伸缩为128M。因此可以在第二时刻(通常指业务流量突发时刻)到来时，保证应用能够正常运行。

通过实施例二中的技术方案，实现为云平台上部署的应用动态分配资源。可以将业务流量突发时刻设置为第二时刻，通过实施例二中的技术方案实现在业务流量突发时刻到来之前云平台上部署的应用所需的资源量的动态调整，在保证高资源利用率的同时，保证业务流量突发场景下云平台上部署的应用分配的资源量能够维持应用进行正常业务运行。由于应用的运营成本与应用占用的资源量成正比，通过实施例二中的技术方案，避免了为应用分配过多云平台资源导致的资源浪费和运营成本较高的问题。

基于前述方法实施例，本发明实施例提供一种云平台，用于为云平台上部署的应用动态分配资源，应用用于实现业务功能。该云平台在业务流量突发时刻之前预测应用在业务流量突发时刻所需的资源量，并在业务流量突发时刻之前将应用的资源量调整为预测的应用在业务流量突发时刻所需的资源量，在实现为云平台上部署的应用动态分配资源的同时，保证业务流量突场景下，部署在云平台上的应用仍能分配到足够的资源，进行正常的业务运行。

如图5所示，本发明实施例提供一种云平台，该云平台至少包括收集模块51、策略模块52、预测模块53和执行模块54，各模块的具体操作如下：

收集模块51，用于收集业务在第一时刻之前的业务指标的数值，其中，这里的业务具体由一个应用来承载或实施；

策略模块52，用于配置业务指标数值和应用所需资源量的映射关系；

预测模块53，用于在第一时刻，根据收集模块51收集的业务在第一时刻之前的业务指标的数值，预测业务在第二时刻的业务指标的数值，以得到预测的业务指标数值，第二时刻晚于第一时刻；根据预测的业务指标数值，以及策略模块52配置的业务指标数值和应用所需资源量的映射关系，确定应用在第二时刻所需的资源量；

执行模块54，用于在第二时刻到来之前，将应用的资源量调整为预测模块53确定的应用在第二时刻所需的资源量。

本实施例中，预测模块53预测业务在第二时刻的业务指标的数值，下面具体提供两种实现方式：

第一种实现方式，是基于历史数据的业务指标数值预测方式。具体的，

收集模块51收集业务在第一时刻之前的预设时间间隔内的业务指标的数值。

预测模块53根据收集模块51收集的业务在第一时刻之前的预设时间间隔内的业务指标的数值，确定业务在第一时刻之前的预设时间间隔内的业务指标数值的变化轨迹；根据变化轨迹，预测业务在第二时刻的业务指标的数值；

第二种实现方式，是基于指定时间的业务指标预测方式。具体的，

收集模块51收集业务在第一时刻之前的历史时刻的业务指标的数值，其中，历史时刻中包含至少一个时刻，历史时刻中任一时刻与第二时刻之间的时间间隔为N个预设周期，N为正整数。

预测模块53根据收集模块51收集的业务在第一时刻之前的历史时刻的业务指标的数值，预测业务在第二时刻的业务指标的数值。

针对第一种实现方式或第二中实现方式，可选的，收集模块51通过云监控器55收集业务在第一时刻之前的业务指标的数值。

本发明实施例中，可选的，执行模块54通过向云控制器56发送指令，来实现将应用的资源量调整为应用在第二时刻所需的资源量，该指令用于指示云平台控制器将应用的资源量调整为应用在第二时刻所需的资源量。

通过以上实施例提供的云平台，实现为云平台上部署的应用动态分配资源。可以将业务流量突发时刻设置为第二时刻，通过实施例三提供的云平台实现在业务流量突发时刻到来之前云平台上部署的应用所需的资源量的动态调整，在保证高资源利用率的同时，保证业务流量突发场景下云平台上部署的应用分配的资源量能够维持应用进行正常业务运行。由于应用的运营成本与应用占用的资源量成正比，通过实施例三中提供的云平台，避免了为应用分配过多云平台资源导致的资源浪费和运营成本较高的问题。

如图6所示，本发明实施例提供一种云平台，该云平台至少包括策略模块61、预测模块62和执行模块63，可选的，该云平台还包括收集模块64，各模块的具体操作如下：

策略模块61，用于配置时刻与应用所需资源的映射关系；

预测模块62，用于在第一时刻，根据第二时刻，以及策略模块61配置的时刻与应用所需资源的映射关系，预测应用在第二时刻所需的资源量，其中，第二时刻晚于第一时刻；

执行模块63，用于在第二时刻到来之前，将应用的资源量调整为预测模块62确定的应用在第二时刻所需的资源量。

本实施例中，第一时刻通常指当前时刻，第二时刻通常指业务流量突发时刻，第二时刻晚于第一时刻。例如：根据以往经验可以确定将来某段时间范围内将会出现业务流量突发情况时，比如节日、商品抢购时间等，可以将该时间范围的起始时刻设置为第二时刻。也可以将第二时刻设置为其他时刻，本发明实施例中不做具体限定。可选的，第一时刻与第二时刻之间的时间间隔大于或等于调整应用的资源量所需的时间。

本发明实施例中，可选的，云平台还包括：

收集模块64，用于收集应用在历史时刻所需的资源量；

此时，策略模块61根据收集模块64收集的应用在历史时刻所需的资源量，配置时刻与应用所需资源的映射关系。

可选的，收集模块64通过云监控器65收集应用在历史时刻所需的资源量。

本发明实施例中，可选的，执行模块63通过向云控制器66发送指令，来实现将应用的资源量调整为应用在第二时刻所需的资源量，该指令用于指示云平台控制器将应用的资源量调整为应用在第二时刻所需的资源量。

如图3所示，本发明实施例提供一种时刻与应用所需资源的映射关系的存储形式示意图。图6所示的云平台通过图3所示的时刻与应用所需资源的映射关系，预测应用在第二时刻所需的资源量的过程详见前述实施例，此处不再赘述。

通过本发明实施例提供的云平台，实现为云平台上部署的应用动态分配资源。可以将业务流量突发时刻设置为第二时刻，通过实施例四中提供的云平台实现在业务流量突发时刻到来之前云平台上部署的应用所需的资源量的动态调整，在保证高资源利用率的同时，保证业务流量突发场景下云平台上部署的应用分配的资源量能够维持应用进行正常业务运行。由于应用的运营成本与应用占用的资源量成正比，通过实施例四中提供的云平台，避免了为应用分配过多云平台资源导致的资源浪费和运营成本较高的问题。

需要说明的是，本发明提供的云平台上的资源伸缩方法，以及相应的云平台，彼此之间并不是独立的，装置实施例的相关技术细节，可以参考相应的方法实施例。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样，倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

一种云平台上的资源伸缩方法，用于为所述云平台上部署的应用动态分配资源，所述应用用于承载相应的业务，其特征在于，包括：

在第一时刻，根据预测策略预测所述业务在第二时刻的业务指标的数值，以得到预测的业务指标数值，其中，所述预测策略用于指示业务指标数值的预测方式，所述第二时刻晚于所述第一时刻；

根据所述预测的业务指标数值，以及业务指标数值和所述应用所需资源量的映射关系，确定所述应用在所述第二时刻所需的资源量；

在所述第二时刻到来之前，将所述应用的资源量调整为所述应用在所述第二时刻所需的资源量。
如权利要求1所述的方法，其特征在于，所述预测策略包括：基于历史数据的业务指标数值预测方式；

根据预测策略预测所述业务在第二时刻的业务指标的数值，包括：

获取所述业务在第一时刻之前的预设时间间隔内的业务指标的数值；

根据获取的所述数值，预测所述业务在第二时刻的业务指标的数值。
如权利要求2所述的方法，其特征在于，根据获取的所述数值，预测所述业务在第二时刻的业务指标的数值，包括：

根据获取的所述数值，确定所述业务在第一时刻之前的预设时间间隔内的业务指标数值的变化轨迹，根据所述变化轨迹，预测所述业务在第二时刻的业务指标的数值；

其中，所述预设时间间隔内包含相邻时刻第三时刻和第四时刻，所述变化轨迹指示所述业务在所述第三时刻的业务指标的数值与所述业务在所述第四时刻的业务指标的数值之间的大小关系，以及所述业务在所述第四时刻的业务指标的数值与所述业务在所述第三时刻的业务指标的数值相比增加或减少的数值。
如权利要求1所述的方法，其特征在于，所述预测策略包括：基于指定时间的业务指标预测方式；

根据预测策略预测所述业务在第二时刻的业务指标的数值，包括：

获取所述业务在所述第一时刻之前的历史时刻的业务指标的数值，根据获取的所述数值预测所述业务在第二时刻的业务指标的数值；

其中，所述历史时刻中包含至少一个时刻，所述历史时刻中任一时刻与所述第二时刻之间的时间间隔为N个预设周期，N为正整数。
如权利要求1至4任一权项所述的方法，其特征在于，所述业务的业务指标包括以下信息之一或组合：所述业务的并发请求数量、所述业务的访问流量、所述业务的超文本传输协议HTTP请求数量以及所述业务的用户数量。
如权利要求1所述的方法，其特征在于，将所述应用的资源量调整为所述应用在所述第二时刻所需的资源量，包括：

向云平台控制器发送指令，所述指令用于指示所述云平台控制器将所述应用的资源量调整为所述应用在所述第二时刻所需的资源量。
如权利要求1或6所述的方法，其特征在于，所述应用的资源量包括以下信息之一或组合：所述应用部署的实例数目、所述应用的中央处理器CPU占用率、所述应用的内存占用率、所述应用的磁盘占用率以及所述应用占用的网络输入输出IO设备吞吐量。
一种云平台上的资源伸缩方法，用于为所述云平台上部署的应用动态分配资源，所述应用用于承载相应的业务，其特征在于，包括：

在第一时刻，根据时刻与所述应用所需资源的映射关系，预测所述应用在第二时刻所需的资源量，其中，所述第二时刻晚于所述第一时刻；

在所述第二时刻到来之前，将所述应用的资源量调整为所述应用在所述第二时刻所需的资源量。
如权利要求8所述的方法，其特征在于，所述时刻与所述应用所需资源量的映射关系是基于历史时刻与所述应用在所述历史时刻所需的资源量设置的。
如权利要求8所述的方法，其特征在于，将所述应用的资源量调整为所述应用在所述第二时刻所需的资源量，包括：

向云平台控制器发送指令，所述指令用于指示所述云平台控制器将所述应用的资源量调整为所述应用在所述第二时刻所需的资源量。
如权利要求8或10所述的方法，其特征在于，所述应用的资源量包括以下信息之一或组合：所述应用部署的实例数目、所述应用的中央处理器CPU占用率、所述应用的内存占用率、所述应用的磁盘占用率以及所述应用占用的网络输入输出IO设备吞吐量。
一种云平台，用于为所述云平台上部署的应用动态分配资源，所述应用用于承载相应的业务，其特征在于，包括：

收集模块，用于收集所述业务在第一时刻之前的业务指标的数值；

策略模块，用于配置业务指标数值和所述应用所需资源量的映射关系；

预测模块，用于在所述第一时刻，根据所述收集模块收集的所述业务在第一时刻之前的业务指标的数值，预测所述业务在第二时刻的业务指标的数值，以得到预测的业务指标数值，所述第二时刻晚于所述第一时刻；根据所述预测的业务指标数值，以及所述策略模块配置的业务指标数值和所述应用所需资源量的映射关系，确定所述应用在所述第二时刻所需的资源量；

执行模块，用于在所述第二时刻到来之前，将所述应用的资源量调整为所述预测模块确定的所述应用在所述第二时刻所需的资源量。
如权利要求12所述的云平台，其特征在于，所述收集模块，具体用于：

收集所述业务在第一时刻之前的预设时间间隔内的业务指标的数值。
如权利要求13所述的云平台，其特征在于，所述预测模块根据所述收集模块收集的所述业务在第一时刻之前的业务指标的数值，预测所述业务在第二时刻的业务指标的数值时，具体用于：

根据所述收集模块收集的所述业务在第一时刻之前的预设时间间隔内的业务指标的数值，确定所述业务在所述第一时刻之前的预设时间间隔内的业务指标数值的变化轨迹；

根据所述变化轨迹，预测所述业务在第二时刻的业务指标的数值；

其中，所述预设时间间隔内包含相邻时刻第三时刻和第四时刻，所述变化轨迹指示所述业务在所述第三时刻的业务指标的数值与所述业务在所述第四时刻的业务指标的数值之间的大小关系，以及所述业务在所述第四时刻的业务指标的数值与所述业务在所述第三时刻的业务指标的数值相比增加或减少的数值。
如权利要求12所述的云平台，其特征在于，所述收集模块，具体用于：

收集所述业务在所述第一时刻之前的历史时刻的业务指标的数值，其中，所述历史时刻中包含至少一个时刻，所述历史时刻中任一时刻与所述第二时刻之间的时间间隔为N个预设周期，N为正整数。
如权利要求15所述的云平台，其特征在于，所述预测模块根据所述收集模块收集的所述业务在第一时刻之前的业务指标的数值，预测所述业务在第二时刻的业务指标的数值时，具体用于：

根据所述收集模块收集的所述业务在所述第一时刻之前的历史时刻的业务指标的数值，预测所述应用在第二时刻的业务指标的数值。
如权利要求12至16任一权项所述的云平台，其特征在于，所述业务的业务指标包括以下信息之一或组合：所述业务的并发请求数量、所述业务的访问流量、所述业务的超文本传输协议HTTP请求数量以及所述业务的用户数量。
如权利要求12所述的云平台，其特征在于，所述执行模块，具体用于：

向云平台控制器发送指令，所述指令用于指示所述云平台控制器将所述应用的资源量调整为所述应用在所述第二时刻所需的资源量。
如权利要求12或18所述的云平台，其特征在于，所述应用的资源量包括以下信息之一或组合：所述应用部署的实例数目、所述应用的中央处理器CPU占用率、所述应用的内存占用率、所述应用的磁盘占用率以及所述应用占用的网络输入输出IO设备吞吐量。
一种云平台，用于为所述云平台上部署的应用动态分配资源，所述应用用于承载相应的业务，其特征在于，包括：

策略模块，用于配置时刻与所述应用所需资源的映射关系；

预测模块，用于在第一时刻，根据第二时刻，以及所述策略模块配置的时刻与所述应用所需资源的映射关系，预测所述应用在所述第二时刻所需的资源量，其中，所述第二时刻晚于所述第一时刻；

执行模块，用于在所述第二时刻到来之前，将所述应用的资源量调整为所述预测模块确定的所述应用在所述第二时刻所需的资源量。
如权利要求20所述的云平台，其特征在于，所述云平台还包括：

收集模块，用于收集所述应用在历史时刻所需的资源量；

所述策略模块，具体用于：

根据所述收集模块收集的所述应用在历史时刻所需的资源量，配置所述时刻与所述应用所需资源的映射关系。
如权利要求20所述的云平台，其特征在于，所述执行模块，具体用于：

向云平台控制器发送指令，所述指令用于指示所述云平台控制器将所述应用的资源量调整为所述应用在所述第二时刻所需的资源量。
如权利要求20或22所述的云平台，其特征在于，所述应用的资源量包括以下信息之一或组合：所述应用部署的实例数目、所述应用的中央处理器CPU占用率、所述应用的内存占用率、所述应用的磁盘占用率以及所述应用占用的网络输入输出IO设备吞吐量。