WO2019024445A1

WO2019024445A1 - 地理分布交互服务云资源协同优化方法

Info

Publication number: WO2019024445A1
Application number: PCT/CN2018/072031
Authority: WO
Inventors: 姚建国; 吴家宏; 管海兵
Original assignee: 上海交通大学
Priority date: 2017-07-31
Filing date: 2018-01-10
Publication date: 2019-02-07
Also published as: CN107395733B; CN107395733A

Abstract

本发明提供了一种地理分布交互服务云资源协同优化方法，包括以下步骤：步骤1：确定每个区域可用的数据中心；步骤2：确定交互服务可以调度分布所有可能数据中心组合；步骤3：设计并且约定数据中心资源提供方式；步骤4：确定与随机规划算法对应的价格需求概率分布模型；步骤5：根据步骤3制定的资源提供计划确定价格模型；步骤6：定义交互交互服务的尾延迟，并作为优化模型的延迟约束；步骤7：确定数据中心资源调度优化模型；步骤8：利用随机规划的特点把总体问题分解为一个主问题和一系列的子问题求解；步骤9：优化算法求解。本发明旨在通过多云服务提供商最小化地理分布交互服务的资源配置成本。

Description

地理分布交互服务云资源协同优化方法

技术领域

本发明涉及一种优化方法，具体地，涉及一种地理分布交互服务云资源协同优化方法。

背景技术

地理分布交互服务是一类需要部署到多个数据中心区域(如：北美、亚太以及欧洲等数据中心区域)的延迟敏感计算服务。对于web search、real-time data analysis等交互服务，用户发送Web请求到服务部署的数据中心获取数据或者进行决策分析。因为交互服务依赖于多个数据中心区域提供的基础数据，而这些基础数据是全球分布的，所以决定了地理分布交互服务需要选择一组合适的数据中心进行部署，而且这一组数据中心由各数据中心区域提供的至少一个数据中心组成。另外为了满足交互服务的部署要求，需要数据中心提供足够的资源运行支撑交互服务的数据中心工作负载。所以由于基础数据的依赖以及数据中心资源的需求，地理分布交互服务的部署位置以及数据中心资源计划需要满足用户的尾延迟要求。最终目标是最少化地理分布交互服务的总体计算和通信成本。

现今的云计算服务已经非常成熟。Google Compute Engine、Amazon AWS、Microsoft Azure以及阿里云等在全球范围按区域部署了一定数量的数据中心，这些数据中心均能提供完备的云资源使用方案。Google Compute Engine和Microsoft Azure提供了按需使用数据中心资源的策略。它们提供差异化的计算和存储能力的VM实例以及相应的价格。特别地，资源的实际使用花费是按照使用时间计算，例如某用户租用了一个VM实例10小时，那么总费用为VM实例的单价乘10小时。Amazon AWS不仅提供了类似Google Compute Engine和Microsoft Azure按需使用资源的策略，同时Amazon AWS还允许用户制定预留资源合约，用户可以预留1年或者3年特定配置的VM实例并且预先支付资源预留费用，然后以较低的价格(按需资源价格的50％左右)按照实际使用时间进行计价。一方面各个云服务提供商的资源价格各异，另一方面同一个云服务提供商不同区域的数据中心资源价格也不同，并且根据市场需求资源价格在不断的变化。表1列举了云服务提供商部分VM实例的价格信息。因为交互服务通过Web请求请求访问数据中心获取计算服务，所以对于WAN网络带宽的使用，云服务提供商均按照使用流量的总量进行计价，并且流量的单价通常呈现阶梯型。例如AWS对于前1GB免费，大于1G少于10TB按照$0.090/GB收费，大于10TB少于40TB按照$0.085/GB收费。

因为地理分布交互服务是一类延迟敏感的Web服务，所以对于不同的服务请求率需要适当数量的数据中心资源提供用户要求期望的服务质量。在GoogleCompute Engine对于交互服务在不同时段请求率的统计信息中，可以得到服务请求率差异巨大，最低请求率与最高请求相差10 ³倍以上。所以对于交互服务的部署，资源计划适应需求的不确定性是一个亟待解决的问题。尽管目前云服务提供商提供了基于预留或者按需使用资源的策略，但是都暴露了一些缺点。假如用户使用基于保留的资源，为了保证服务质量，用户必须使用预留大量的资源保证在请求率最大的时候交互服务依然能够满足用户的服务质量需求。但是因为需求的不确定性以及巨大的差异，这样就会造成大量资源的浪费，而且花费很高但很多时候没有发挥相应的作用。当用户仅使用按需资源时，虽然可以动态满足服务的资源需求，但是因为按需资源的价格比保留资源价格高50％以上，所以与利用预留资源策略的资源花费差异不大。基于这个前提需要设计一种能够混合预留资源与按需资源的策略、节以省地理分布交互服务的部署费用。

发明内容

针对现有技术中的缺陷，本发明的目的是提供一种地理分布交互服务云资源协同优化方法，其旨在通过多云服务提供商最小化地理分布交互服务的资源配置成本。

根据本发明的一个方面，提供一种地理分布交互服务云资源协同优化方法，其特征在于，包括以下步骤：

步骤1：确定每个区域可用的数据中心；

步骤2：确定交互服务可以调度分布所有可能数据中心组合；

步骤3：设计并且约定数据中心资源提供方式；

步骤4：确定与随机规划算法对应的价格需求概率分布模型；

步骤5：根据步骤3制定的资源提供计划确定价格模型；

步骤6：定义交互交互服务的尾延迟，并作为优化模型的延迟约束；

步骤7：确定数据中心资源调度优化模型；

步骤8：利用随机规划的特点把总体问题分解为一个主问题和一系列的子问题求解；

步骤9：优化算法求解，记录每一个交互服务的资源需求以及相应的延迟信息，确定资源数量与延迟的关系并用于预测初步的工作负载调度；当服务上线以后，资源需求以及延迟相应的变化，这些变化将用于随机规划并最终作用于资源计划的动态调整。

优选地，所述步骤3具体包括以下步骤：

步骤3.1：仅使用预留资源模式；数据中心提供预留资源，云消费者结合服务部署周期以及折中的资源需求首先制定预留合同和支付预付金；交互服务上线后，首先按照服务资源实际需求分配预留资源，如果预留资源能够在部署周期均能满足服务质量要求，则仅预留资源就满足交互服务的服务质量需求；

步骤3.2：仅使用按需资源模式；服务的实际需求因为请求率的变化而出现实际需求大于租约最大可用资源数量导致达不到要求的服务质量，在预留资源的基础上租用额外的按需资源以达到服务质量的要求，这种情况称为混合阶段；

步骤3.3：混合模式，云消费者更倾向于按需资源进行服务的短期部署，数据中心仅提供按需资源。

优选地，所述步骤5具体包括以下步骤：

步骤5.1：确定预留合约预付价格；

步骤5.2：确定实际运行VM实例的动态价格；

步骤5.3：确定网络资源计费方式与价格；

步骤5.4：将计算资源与网络资源的花费叠加得到总价格；

步骤5.5：确定实例实时运行的动态成本。

优选地，所述步骤6具体包括以下步骤：

步骤6.1：确定计算延迟与网络传输延迟；

步骤6.2：确定每个请求的延迟阈值，建立延迟阈值矩阵；

步骤6.3：利用服务等级协议衡量在资源提供计划确定条件下尾延迟是否满足服务质量要求。

优选地，所述步骤6.3具体包括以下步骤：

步骤6.3.1：利用概率统计方法，对历史数据进行概率分析，得到资源提供计划与SLA尾延迟的初步关系。

优选地，所述步骤6.3.1具体包括以下步骤：

步骤6.3.1.1：计算延迟与网络传输延迟概率统计分析；

步骤6.3.1.2：计算每个请求的概率延迟；

步骤6.3.1.3：计算概率尾延迟。

优选地，所述步骤8包括以下步骤：

步骤8.1：计算每一个区域的候选数据中心的部署成本；

步骤8.2：确定随机规划主问题与子问题。

优选地，所述步骤9包括以下步骤：

步骤9.1：工作负载调度；

步骤9.2：工作负载资源计划实时调整。

优选地，所述步骤9.1包括以下步骤：

步骤9.1.1首先根据地理分布交互服务的请求记录生成VCPU需求，内存需求，磁盘需求以及网络使用率的概率分布；

步骤9.1.2以生成的概率分布作为配置数据，对公式(13)进行求解，并得到每个可调度数据中心的相应部署成本；

步骤9.1.3初始化调度决策变量。

优选地，所述步骤9.2包括以下步骤：

步骤9.2.1通过对工作负载的调度，得到所有交互服务的目标数据中心组，但是得到的初步资源计划是粗粒度的，需要在么一个RPP时间调整资源计划，因此在每一个RPP时间产生相应的资源需求概率分布；

步骤9.2.2以生成的概率分布作为配置数据进行求解，得到每一个工作负载在目标数据中心的资源计划，该资源计划是细粒度的；

步骤9.2.3我们算法需要在每一个WDD时间为地理分布交互服务选择目标数据中心组，并在每一个RPP时间重新配置资源计划，其中每个WDD时间包含多个RPP时间。

与现有技术相比，本发明具有如下的有益效果：本发明旨在通过多云服务提供商最小化地理分布交互服务的资源配置成本。因为数据中心资源价格的不确定性，以及交互服务动态资源需求的特点，我们设计了一个价格模型以及一个SLA延迟模型，基于得到的约束条件并且结合随机规划把工作负载的调度以及资源计划分别描述为主方法以及一系列子问题是本方法的精髓。这种通过价格建模以及SLA延迟建模而得到的优化设计及其约束方法，对大部分的地理分布交互服务的资源调度有较好的通用性与扩展性。本发明比基于按需资源的服务部署节省了24％的成本。我们的设计比基于预留资源的服务部署节省了10％的成本。我们的设计能够满足延迟的SLA约束，即能够满足基于协商的尾延迟约束。另外对于全球分布的交互服务还缺少相关的旨在减少服务部署成本的研究，某些相关的研究往往面向单个数据中心或者非延迟敏感应用的部署。因此我们开创性地研究了如何优化全球分布的交互服务部署成本，并设计了一种算法达到了相应的预期效果。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1为VCPU需求概率分布示意图。

图2为内存需求概率分布示意图。

图3为磁盘需求概率分布示意图。

图4为网络使用量概率分布示意图。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明，但不以任何形式限制本发明。应当指出的是，对本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进。这些都属于本发明的保护范围。

地理分布交互服务需要基础数据的支持，而为了提供高可用性，基础数据通常会在同一个区域的数据中心之间进行备份。因为基础数据的备份，交互服务可以选择价格较低的数据中心进行部署。但是，各个云服务提供商对于相同配置的VM实例以及相同的网络流量的价格是不同的。另外，不同时刻交互服务的用户对于服务的请求压力是变化的，因此造成交互服务对于资源的需求是不确定的。因为变化的资源需求以及变化的数据中心资源价格，地理分布交互服务可能会改变预期的资源计划甚至重新部署在价格更低的数据中心。因此本发明的设计原则是分别优化地理分布交互服务工作负载的分布以及根据资源需求调整相应的资源计划。

本发明地理分布交互服务云资源协同优化方法包括以下步骤：

步骤1：确定每个区域可用的数据中心。假设有R个数据中心区域为地理分布交互服务工作负载的运行提供资源。在每个区域，存在P个云服务提供商并且每个云服务提供商已经部署了DC _i个数据中心，其中i∈P。令J _r表示区域r的数据中心数量，我们可以用下面的公式计算区域r中所有可用数据中心，如下式(1)：

步骤2：确定交互服务可以调度分布所有可能数据中心组合。假设存在m个地理分布交互服务，每个服务都包含多于|R|个工作负载，这些工作负载需要分布到一个数据中心组。例如，用户向n(n≥|R|)个数据中心发送服务请求，这n个数据中心称为一个目标数据中心组。特别地，n个数据中心由不同的区域提供，即每个区域都需要提供至少一个数据中心完成工作负载的运行。因此，令G表示R个区域提供的所有可能数据中心组。我们使用组合数学理论计算所有可用的数据中心组，如下式(2)：

步骤3：设计并且约定数据中心资源提供方式。因为单一使用预留资源或者单一使用按需资源都需要较高的资源成本，因此我们同时考虑预留资源和按需资源。基于这个前提有三种资源使用情况：仅预留，仅按需和混合。步骤3具体包括以下步骤：

步骤3.1：仅使用预留资源模式；数据中心提供预留资源，云消费者结合服务部署周期以及折中的资源需求首先制定预留合同和支付预付金；交互服务上线后，首先按照服务资源实际需求分配预留资源，如果预留资源能够在部署周期均能满足服务质量要求，则仅预留资源就可以满足交互服务的服务质量需求。

步骤3.2：仅使用按需资源模式；服务的实际需求因为请求率的变化而出现实际需求大于租约最大可用资源数量导致达不到要求的服务质量，可以在预留资源的基础上租用额外的按需资源以达到服务质量的要求，这种情况称为混合阶段(预留和按需)。

步骤3.3：混合模式。云消费者更倾向于按需资源进行服务的短期部署，数据中心仅提供按需资源。

步骤4：确定与随机规划算法对应的价格需求概率分布模型。数据中心资源的价格是动态变化的，另外地理分布交互服务的资源需求将根据服务请求率动态变化。利用随机规划可以处理价格与需求的不确定性。随机规划采用一组由概率分布描述的不确定参数，把问题分解为一个主问题以及一系列概率相关的子问题。求解主问题可以得到一个初步的结果，然后逐一求解子问题弥补主问题初步求解的误差。所述步骤4包括以下步骤：确定随机规划各子问题的概率分布。根据上述的三种资源提供计划，我们分析价格以及需求的概率属性。令Λ _t表示每个RPP(资源计划)时间t中的价格和需求情况的集合，对于一个WDD(工作负载调度)时间T中的所有价格与需求情况，Λ被定义为如下式(3)：

Λ的概率分布是有限的，例如集合Λ代表有限数量的价格与需求情况，用P _λ∈[0，1]表示每一种情况出现的概率，其中λ是一个复合变量，λ＝(λ ₁，λ ₂，…，λ _|T|)∈Λ。

步骤5：根据步骤3制定的资源提供计划确定价格模型。步骤5具体包括以下步骤：

步骤5.1：确定预留合约预付价格。假设云消费者为工作负载i在数据中心j制定预留资源合约k时，合约k描述了一种特定配置的VM实例，令

表示该VM实例对于资源类型

的需求量，令

表示资源类型

的单位价格。把VM实例需要的资源类型价格相加，即可得到工作负载i在数据中心j制定预留合约k的预付价格

步骤5.2：确定实际运行VM实例的动态价格。当在λ情况下实际使用该VM实例，可以得到预留资源以及按需资源在时间t内的实际使用价格

和

因为实际使用资源需要按照使用时间计费，其中t为一个计费周期同时也是一个RPP周期，如下式(4)：

步骤5.3：确定网络资源计费方式与价格。WAN网络资源根据每月传输流量进行计费。当数据传输超过网络价格策略中设置的最大流量时，WAN网络资源将以不同的单价收费。令K _n表示传输的数据量与单位价格之间的关系。例如，Amazon EC2的WAN网络价格策略为：K _n＝{“前1GB”：“$0.000/GB”，“大于1G少于10TB”：“$0.090/GB”，“大于10T少于40TB”：“$0.085/GB”，“大于40TB少于100TB”：“$0.070/GB”，“大于100TB少于350TB”：“$0.050/GB”，...}。因此，令

表示WAN网络流量的单价。

步骤5.4：将计算资源与网络资源的花费叠加得到总价格。如果将地理分布交互服务分发到数据中心组，则必须为工作负载分配足够数量的VM实例(例如，16核CPU，64G内存和每个VM实例500G SSD×10)。因此我们根据下面的公式计算地理分布互动服务的部署成本，如下式(5)：

式中，S表示m个地理分布交互服务的请求源，I表示每个交互服务的工作负载集合，J _g表示数据中心组g(g∈G)的所有数据中心集合。

表示为工作负载i在数据中心j制定预留合约k的保留VM实例数量，另外云消费者可以在一个数据中心制定多个预留合约。

表示每个网络资源计费周期的网络数据传输量，其中T _n通常表示为一年12个网络资源计费周期。X _ij表示一个二进制变量，如果工作量i分配给数据中心j，则等于1，否则为0。

步骤5.5：确定实例实时运行的动态成本。由公式(5)可以知道，资源配置成本包括三部分：预留

数量VM实例的预付成本；WAN网络使用成本；实际运行预留VM实例和运行按需VM实例的成本。因为VM按照实际需求启动运行，所以实际运行VM实例的成本是动态变化的。我们用C ^Y表示该动态成本。如果保留的VM实例

的运行不能满足交互服务的尾延迟要求

那么我们需要额外

数量的VM实例使交互服务达到尾延迟要求，如下式(6)：

步骤6：定义交互交互服务的尾延迟，并作为优化模型的延迟约束。所述步骤6具体包括以下步骤：

步骤6.1：确定计算延迟与网络传输延迟。令

和

分别表示数据处理延迟和WAN网络传输延迟。利用下面的公式(7)计算服务的总延迟。

步骤6.2：确定每个请求的延迟阈值，建立延迟阈值矩阵。每个服务请求都有相应的延迟要求，具体表现为延迟阈值。我们独立地考虑每一个服务请求，如果所有的服务请求都满足各自的延迟要求，我们认为地理分布交互服务可以满足服务尾延迟要求。因此，令

和

分别表示处理延迟阈值和WAN网络传输延迟阈值，令L(t)表示发送到n(n＝|J _g|)个数据中心的服务请求的延迟约束阈值，我们可以得到下面的延迟阈值矩阵，如下式(8)：

步骤6.3：利用服务等级协议衡量在资源提供计划确定条件下尾延迟是否满足QoS(服务质量)要求。由于对每一个服务请求的延迟进行实时预测并最终反映为资源要求的开销非常大，特别对于大量的交互服务请求的延迟预测在现实中难以实现。因此，我们将高百分比尾延迟作为SLA(服务等级协议)对交互服务的资源需求进行评估预测，而且这种评估是基于历史请求的。例如，如果我们将x设置为高百分位SLA尾延迟约束，服务延迟不超过阈值的概率不得低于x％，否则服务质量不能保证。高百分位SLA尾延迟提供了一种让地理分布交互服务满足服务质量要求的方法。步骤6.3具体包括以下步骤：步骤6.3.1：利用概率统计方法对历史数据进行概率分析，得到资源提供计划与SLA尾延迟的初步关系。考虑一个请求源在t时间内为完成工作负载i的执行将Ω个请求发送到数据中心j，利用下面的步骤计算概率尾延迟。步骤6.3.1具体包括以下步骤：

步骤6.3.1.1：计算延迟与网络传输延迟概率统计分析。令

表示工作负载i在数据中心j的计算延迟不超过计算延迟阈值的概率，令

表示WAN网络传输延迟不超过传输延迟阈值的概率。操作

表示一个用于计算数据中心处理概率延迟的方法，当

时，结果为1，否则为0。类似地，操作

用于估算网络概率延迟，如下式(9)：

根据大数法则(LLN)，从大量请求的延迟记录获得的平均延迟概率值应接近延迟的预期值。当在估计中考虑到更多的请求记录时，延迟概率的估算将更准确。

步骤6.3.1.2：计算每个请求的概率延迟。交互服务的延迟主要包括两部分：a)数据中心处理延迟。b)WAN网络传输延迟。卷积函数在数学上产生第三个函数表示前两个函数的叠加，所以在这里通常被视为计算延迟和网络延迟的叠加。对于工作负载i，利用卷积函数可以得到发送到数据中心j的每个服务请求的预期概率延迟，如下式(10)：

其中运算符“*”表示卷积方法。

步骤6.3.1.3：计算概率尾延迟。交互式服务需要把请求发送到特定的数据中心组中完成相应的工作负载，因此对于一个交互服务s的所有服务请求的概率尾延迟应在数据中心组之间取平均概率，如下式(11)：

其中F _sg(t)表示交互服务s的互联网请求发送到数据中心组g的概率尾延迟，F _sg(t)作为交互服务的调度决策和资源提供计划的约束函数。

步骤7：确定数据中心资源调度优化模型。通过价格建模以及延迟约束建模，交互服务的调度以及资源计划可以通过求解下面的优化方程得到如下式(12)等：

其中(11a)表示每一个交互服务的工作负载需要分配到一个目标数据中心，(12b)表示交互服务的尾延迟应该满足尾延迟SAL要求，(12c)表示分配的资源必须小于或者等于数据中心的最大资源约束，(12d)表示实际使用的预留VM实例数量不超过预留合约的最大约束，(12e-12h)表示VM实例的数量为自然数。

步骤8：利用随机规划的特点把总体问题分解为一个主问题和一系列的子问题求解。所述步骤8包括以下步骤：

步骤8.1：利用公式(13)计算每一个区域的候选数据中心的部署成本。把得到的初步成本作为工作负载调度的权重因子，利用整数规划选择成本最少的数据中心组，交互服务调度到一个最优化的数据中心组，并且在每一个WDD时间区间内交互服务常驻这个数据中心组；同时在每一个RPP时间，根据需求的变化利用随机规划求解该时间段在目标数据中心组的资源计划如下式(13)等：

步骤8.2：确定随机规划主问题与子问题。主问题根据权重值把交互服务调度到花费最低的数据中心组；一系列关于价格与需求概率分布的子问题根据动态的资源需求动态地调整资源提供计划，如下式(14)等：

因为价格的不确定性，需要在每一个WDD时间重复上面的算法进行工作负载的调度以及资源计划。

步骤9：优化算法求解，记录每一个交互服务的资源需求以及相应的延迟信息，确定资源数量与延迟的关系并用于预测初步的工作负载调度；当服务上线以后，资源需求以及延迟相应的变化，这些变化将用于随机规划并最终作用于资源计划的动态调整。步骤9包括以下步骤：

步骤9.1：工作负载调度。步骤9.1包括以下步骤：

步骤9.1.1，首先根据地理分布交互服务的请求记录生成VCPU需求，内存需求，磁盘需求以及网络使用率的概率分布。

步骤9.1.2，以生成的概率分布作为配置数据，对公式(13)进行求解，并得到每个可调度数据中心的相应部署成本；

步骤9.1.3，初始化调度决策变量，利用步骤9.1.2得到的初步成本作为权重值，利用公式(14)选择价格最低的数据中心作为目标数据中心组，而且工作负载的分布需要满足数据中心最大处理能力的约束。

步骤9.2：工作负载资源计划实时调整。步骤9.2包括以下步骤：

步骤9.2.1通过对工作负载的调度，我们可以得到所有交互服务的目标数据中心组，但是得到的初步资源计划是粗粒度的，需要在么一个RPP时间调整资源计划，因此在每一个RPP时间产生相应的资源需求概率分布；

步骤9.2.2以生成的概率分布作为配置数据，利用公式(15)定义的子问题进行求解，可以得到每一个工作负载在目标数据中心的资源计划，该资源计划是细粒度的；

本发明选取了Google Compute Engine，Microsoft Azure和Amazon AWS三个云服务提供商的多个数据中心最为实验配置数据，选择了Web Search，Real-time Data Analysis和Big Query三种交互服务以及相关的服务请求记录作为基础测试数据。分别对工作负载的调度以及交互服务的资源计划进行了实验。

其中，工作负载调度的流程如下：首先根据地理分布交互服务的请求记录生成VCPU需求，内存需求，磁盘需求以及网络使用率的概率分布。实验结果如图1至图4所示；以生成的概率分布作为配置数据，对公式(13)进行求解，并得到每个可调度数据中心的相应部署成本；初始化调度决策变量，利用到的初步成本作为权重值，利用选择价格最低的数据中心作为目标数据中心组，而且工作负载的分布需要满足数据中心最大处理能力的约束。

而工作负载资源计划的流程如下：通过对工作负载的调度，可以得到所有交互服务的目标数据中心组，但是得到的初步资源计划是粗粒度的，需要在么一个RPP时间调整资源计划，因此在每一个RPP时间产生相应的资源需求概率分布；以生成的概率分布作为配置数据，利用公式(15)定义的子问题进行求解，可以得到每一个工作负载在目标数据中心的资源计划，该资源计划是细粒度的；需要在每一个WDD时间为地理分布交互服务选择目标数据中心组，并在每一个RPP时间重新配置资源计划，其中每个WDD时间包含多个RPP时间。

以上对本发明的具体实施例进行了描述。需要理解的是，本发明并不局限于上述特定实施方式，本领域技术人员可以在权利要求的范围内做出各种变形或修改，这并不影响本发明的实质内容。

Claims

一种地理分布交互服务云资源协同优化方法，其特征在于，包括以下步骤：

步骤1：确定每个区域可用的数据中心；

步骤2：确定交互服务可以调度分布所有可能数据中心组合；

步骤3：设计并且约定数据中心资源提供方式；

步骤4：确定与随机规划算法对应的价格需求概率分布模型；

步骤5：根据步骤3制定的资源提供计划确定价格模型；

步骤6：定义交互交互服务的尾延迟，并作为优化模型的延迟约束；

步骤7：确定数据中心资源调度优化模型；

步骤8：利用随机规划的特点把总体问题分解为一个主问题和一系列的子问题求解；

步骤9：优化算法求解，记录每一个交互服务的资源需求以及相应的延迟信息，确定资源数量与延迟的关系并用于预测初步的工作负载调度；当服务上线以后，资源需求以及延迟相应的变化，这些变化将用于随机规划并最终作用于资源计划的动态调整。
根据权利要求1所述的地理分布交互服务云资源协同优化方法，其特征在于，所述步骤3具体包括以下步骤：

步骤3.1：仅使用预留资源模式；数据中心提供预留资源，云消费者结合服务部署周期以及折中的资源需求首先制定预留合同和支付预付金；交互服务上线后，首先按照服务资源实际需求分配预留资源，如果预留资源能够在部署周期均能满足服务质量要求，则仅预留资源就满足交互服务的服务质量需求；

步骤3.2：仅使用按需资源模式；服务的实际需求因为请求率的变化而出现实际需求大于租约最大可用资源数量导致达不到要求的服务质量，在预留资源的基础上租用额外的按需资源以达到服务质量的要求，这种情况称为混合阶段；

步骤3.3：混合模式，云消费者更倾向于按需资源进行服务的短期部署，数据中心仅提供按需资源。
根据权利要求1所述的地理分布交互服务云资源协同优化方法，其特征在于，所述步骤5具体包括以下步骤：

步骤5.1：确定预留合约预付价格；

步骤5.2：确定实际运行VM实例的动态价格；

步骤5.3：确定网络资源计费方式与价格；

步骤5.4：将计算资源与网络资源的花费叠加得到总价格；

步骤5.5：确定实例实时运行的动态成本。
根据权利要求1所述的地理分布交互服务云资源协同优化方法，其特征在于，所述步骤6具体包括以下步骤：

步骤6.1：确定计算延迟与网络传输延迟；

步骤6.2：确定每个请求的延迟阈值，建立延迟阈值矩阵；

步骤6.3：利用服务等级协议衡量在资源提供计划确定条件下尾延迟是否满足服务质量要求。
根据权利要求4所述的地理分布交互服务云资源协同优化方法，其特征在于，所述步骤6.3具体包括以下步骤：

步骤6.3.1：利用概率统计方法，对历史数据进行概率分析，得到资源提供计划与SLA尾延迟的初步关系。
根据权利要求5所述的地理分布交互服务云资源协同优化方法，其特征在于，所述步骤6.3.1具体包括以下步骤：

步骤6.3.1.1：计算延迟与网络传输延迟概率统计分析；

步骤6.3.1.2：计算每个请求的概率延迟；

步骤6.3.1.3：计算概率尾延迟。
根据权利要求1所述的地理分布交互服务云资源协同优化方法，其特征在于，所述步骤8包括以下步骤：

步骤8.1：计算每一个区域的候选数据中心的部署成本；

步骤8.2：确定随机规划主问题与子问题。
根据权利要求1所述的地理分布交互服务云资源协同优化方法，其特征在于，所述步骤9包括以下步骤：

步骤9.1：工作负载调度；

步骤9.2：工作负载资源计划实时调整。
根据权利要求8所述的地理分布交互服务云资源协同优化方法，其特征在于，所述步骤9.1包括以下步骤：

步骤9.1.1首先根据地理分布交互服务的请求记录生成VCPU需求，内存需求，磁盘需求以及网络使用率的概率分布；

步骤9.1.2以生成的概率分布作为配置数据，对公式(13)进行求解，并得到每个可调度数据中心的相应部署成本；

步骤9.1.3初始化调度决策变量。
根据权利要求8所述的地理分布交互服务云资源协同优化方法，其特征在于，所述步骤9.2包括以下步骤：

步骤9.2.1通过对工作负载的调度，得到所有交互服务的目标数据中心组，但是得到的初步资源计划是粗粒度的，需要在么一个RPP时间调整资源计划，因此在每一个RPP时间产生相应的资源需求概率分布；

步骤9.2.2以生成的概率分布作为配置数据进行求解，得到每一个工作负载在目标数据中心的资源计划，该资源计划是细粒度的；

步骤9.2.3我们算法需要在每一个WDD时间为地理分布交互服务选择目标数据中心组，并在每一个RPP时间重新配置资源计划，其中每个WDD时间包含多个RPP时间。