CN105072049A

CN105072049A - 面向数据中心多层次弹性应用的资源分配方法及装置

Info

Publication number: CN105072049A
Application number: CN201510546681.6A
Authority: CN
Inventors: 沈蒙; 徐恪; 吴波
Original assignee: Beijing Institute of Technology BIT
Current assignee: Beijing Institute of Technology BIT
Priority date: 2015-08-31
Filing date: 2015-08-31
Publication date: 2015-11-18
Anticipated expiration: 2035-08-31
Also published as: CN105072049B

Abstract

本发明涉及一种面向数据中心多层次弹性应用的资源分配方法及装置，属于多层次云应用技术领域。本发明方法首先获取用户提出的多层次应用请求；其次对各层的带宽需求进行降序排列；接下来按照各层的带宽需求从高到低的顺序为各层分配虚拟机资源，具体如下：首先对该层请求需要的虚拟机数量根据当前云平台下的树形拓扑结构计算所有分配方案的可行向量FV_l，其次，通过递归方法获取每条链路对该层的最优分配方案；接下来计算“按需运行”虚拟资源的数量，并在数据中心中进行预留；最后输出该用户多层次应用请求的最优分配方案。对比现有技术，本发明的资源分配方案兼顾到资源利用率和弹性，在保证弹性的同时，提高了整个系统的效率。

Description

面向数据中心多层次弹性应用的资源分配方法及装置

技术领域

本发明涉及一种资源分配方法，特别涉及一种面向数据中心多层次应用的弹性资源分配方法，属于数据中心领域，具体属于多层次应用中资源分配的效率与弹性请求这两个矛盾之间的平衡处理问题。

背景技术

近几年，越来越多的应用迁移到了形如亚马逊EC2、微软Azure和阿里云等的公共云平台之上。很多这些应用都是多个服务组件的复杂结合体，并能组成多层虚拟网络，而多层次程度因商业和应用需求而异。在多层次应用中，表示层用于管理用户交互，提供易于操作的前端；业务逻辑层管理业务规则，控制和操作整个应用框架；数据存储层用于存储和供应底层数据。每一层包含一个或多个运行在单个虚拟机上的虚拟实例。

在多层次应用的虚拟网络资源分配中，有两个需要面临的问题：(1)从用户角度来讲，其应用在面对可预见的负载变化或突发负载增加等的工作量变化时，能够避免其性能退化。因此，用户希望分配到的虚拟网络资源具有一定的弹性，能够自动应对工作量的变化，即用户应用能应对资源需求突然增加，且初始阶段无需花费较大成本申请较多资源。(2)从云运营商角度来讲，他们希望提高虚拟网络资源利用率和服务质量，尽可能地满足用户需求，例如提高需求接收率、最大化虚拟网络资源分配的利益，这对于运营商长远发展具有非常重要的意义。但是，实现这两个目标具有非常大的挑战性，一方面，作为虚拟网络资源分配的第一步，应该有合适的抽象模型用于描述用户对虚拟网络资源的需求，并促进云服务运营商资源的分配。该模型能够明确每一次虚拟网络资源请求的虚拟机和带宽请求，已有的方法要么从运营商角度出发，要么从应用角度出发，并没有关注到用户的弹性资源需求。因此，需要处理弹性应用需求和高效分配资源这两者之间的平衡关系。另一方面在于设计一个虚拟网络资源分配算法，现有的一些算法通过全局优化虚拟机放置和带宽分配策略来提高虚拟网络资源分配需求的效率，但是，当考虑针对弹性应用进行虚拟网络资源分配时，这些方法变得无效。

在本发明中，我们提出了一种面向数据中心多层次弹性应用的虚拟网络资源分配方法，该方法能够同时实现效率和弹性的需求，这是目前第一个解决虚拟网络资源分配的弹性问题的方法。

发明内容

本发明的目的是为解决现有技术无法实现兼顾效率和弹性的需求进行资源分配的问题，提出一种面向数据中心多层次弹性应用的资源分配方法，该方法具有灵活性高，适应性强，高效而具有弹性等的优点。

本发明的思想是根据用户提出的请求，系统对用户应用的每一层请求计算每条链路的可行向量，并根据该向量分配虚拟资源，最终达到资源分配效率和弹性的平衡，实现合理的资源分配。

本发明的目的是通过以下技术方案实现的：

在介绍本发明的技术方案之前，需要对本发明涉及到的一些术语进行简单说明，具体如下：

1.为了获取多层次应用中虚拟网络资源分配的弹性，本发明将每一层中的虚拟机划分为“始终运行”和“按需运行”两大类，“始终运行”虚拟机主要针对资源正常加载的情况，是保证最差性能的最小虚拟机资源需求，而“按需运行”虚拟机主要针对资源动态变化情况，是峰值或突发负载情况下的动态调整。

2.根据对多层次应用通信特征的观察，本发明中弹性的模型将每个虚拟机的带宽需求划分为层内和层间需求，这种解耦能够在源于供应商和源于应用之间建立平衡，保证了资源分配的简单性，避免了带宽资源的过度分配。

一种面向数据中心多层次弹性应用的资源分配方法，包括以下步骤：

1.用户提出虚拟网络资源需求T＝{T_i,i∈[1,k]}，k为应用包含的层数，T_i表示用户对于应用第i层的需求，T_i是一个五元组变量，表示形式为其中，表示“始终运行”的虚拟机数量，表示“按需运行”的虚拟机数量，表示层内通信所需的带宽，表示层间通信所需的带宽，S_i表示加载“按需运行”虚拟机的阈值；

例如，假设S_i为“CPU利用率为80％”，则当CPU利用率超过80％时(即S_i条件满足)，数量的虚拟机会启动使用；

2.运营商对于用户应用请求T中的每一层请求T_i，分别计算其带宽需求并对各层的带宽需求进行降序排列，存储到集合T'中；

3.i＝1；

4.对于集合T'中的元素Ti，运营商根据当前数据中心拓扑结构G＝(V,L)(其中，V表示服务器集合，L表示链路集合，这里根链路为root)以及资源分配记录分别计算数据中心中每一条链路l相连子树分配虚拟机数量的可行向量FV_l，其中，可行向量FV_l的形式如表1所示：

表1链路l对应的可行向量FV_l

在数据中心树形拓扑中，规定链路l直接相连的子树为l^In，除去l_In之后的拓扑结构为l^Out；对于新应用T的每一层i，和分别表示l^In和l^Out中分配到的虚拟机数量。可行向量FV_l表示当l^In中分配x个虚拟机，即时，该层的分配方案是否可行(y＝1表示可行，否则不可行)；对于变量x，若满足x≤r_v和b_l≤r_b，则对应的y值为1，其中，r_v表示服务器v空槽的数量，b_l表示分配方案所产生的链路l的带宽开销，r_b表示链路剩余的带宽开销，即服务器v中分配的虚拟机资源数量不大于服务器v中剩余空槽数量，且由此产生的链路带宽开销不大于链路剩余带宽时，方案是可行的(y＝1)；r_v,r_b均能在数据中心中直接获得，带宽开销b_l由通过该链路的层内通信和层间通信组成，具体可通过公式(1)计算：

b_{l} = Σ_{m = 1}^{i} \min (N_{m}^{I n} B_{m}^{a}, N_{m}^{O u t} B_{m}^{a}) + \min (Σ_{m = 1}^{i} N_{m}^{I n} B_{m}^{e}, Σ_{m = 1}^{i} N_{m}^{O u t} B_{m}^{e}) - - - (1)

所以，表示i层内通信链路带宽最小值之和，表示i层间通信链路带宽的最小值；

5.运营商根据可行向量FV_l通过遍历方法获得第i层最优的虚拟资源分配方案；作为优选，所述的遍历方法为递归方法alloc(r,l,n)，该方法获得给第i层应用分配的虚拟资源数量，并与用户请求进行对比，如果两者相等，则返回true，即存在第i层应用的分配方案；如果两者不相等，则返回false，说明不存在第i层应用的分配方案；其中，参数r表示用户请求，参数l表示链路，参数n表示用户请求分配的虚拟资源数量；并且，将跟链路root作为方法alloc的初始执行链路，即将T_i,root,N_i代入方法alloc(r,l,n)中；alloc(r,l,n)的工作流程如下：

(1)若level(l)＝0(level表示链路l在数据中心所处的层次，level(l)＝0时，链路l与服务器直接相连)，在链路l相连的服务器中分配的虚拟资源数量为count＝max{j|FV_j＝1&j≤n}，count表示当FV_j＝1时，j取得的最大值，此时j≤n；判断count在可行向量FV_j中是否合法(即当x＝count时，y是否为1)，如果不合法，则alloc方法返回-1；如果合法，则返回count值,即给第i层应用在链路e相连的服务器v内分配数量为count的虚拟机资源，数学表达为f_iv＝count；

(2)若level(l)≠0，设set(l)为链路l子树level(l)-1层的链路集合，链路l'∈set(l)。计算剩余虚拟资源可用数量base＝n-∑_l'∈set(l)Q_l'。对于set(l)中的每条链路l'，计算n_l'＝Q_l'+base和tmp＝alloc(r,l',n_l')，tmp是递归执行方法alloc(步骤3)得到数值。如果tmp≠-1,则base和count进行如下赋值：base←base-(tmp-Q_l')和count←count+tmp；如果tmp＝-1，则alloc返回-1值，即没有分配方案。在执行完set(l)中的每条链路l'操作之后，判断count在可行向量FV_j是否合法(即当x＝count时，y是否为1)，如果不合法，则返回-1，即没有分配方案；如果合法，则返回count值。

6.i＝i+1；如果i≤k，转到步骤4；否则，转到步骤7；

7.根据每一次步骤5的执行结果，获得最终的虚拟资源分配方案F＝{f_iv},1≤i≤k,v∈V，f_iv表示给应用的第i层在服务器v中分配的虚拟资源的数量；

8.上述步骤3～7获得应用每一层的“始终运行”虚拟机需求分配方案，数据中心在获得该分配方案之后，为该应用的“按需运行”虚拟机数量在服务器中预留出相应空槽，并在资源分配记录中对“始终运行”虚拟机需求的分配方案和为该应用预留的“按需运行”虚拟机空槽的数量及对应的服务器中的位置进行记录，为以后新的用户请求的资源分配以及为原有已有应用调度“按需运行”的虚拟机做准备；具体分为以下两个方面：

(1)若原有已有应用资源需求突然增加，则数据中心调用之前为该应用预留的“按需运行”虚拟机来解决资源调度问题(即本发明中的针对弹性应用的资源分配方案)；

(2)当新的用户请求到来时，数据中心将当前有效的虚拟资源(即去除已分配的资源和预留的资源)分配给新的请求，分配方法同步骤3～7。

一种面向数据中心多层次弹性应用的资源分配装置，包括依次连接的用户请求接收模块、请求计算模块、资源分配模块、可用资源计算模块和资源分配输出模块；

用户请求接收模块用于接收用户提出的请求T＝{T_i,i∈[1,k]}，并向请求计算模块输出该用户请求；

请求计算模块用于根据用户请求T、当前数据中心拓扑结构G＝(V,L)和资源分配记录分别计算每条链路的可行向量，并向资源分配模块输出用户请求和可行向量计算结果；

资源分配模块用于采用遍历方法根据用户请求、可行向量为应用的每一层计算最优的虚拟机资源分配方案，并将该分配方案以及用户请求输出到可用资源计算模块；

可用资源计算模块用于在资源分配记录中登记当前请求的虚拟机资源分配方案，以及计算当前请求中“按需运行”的虚拟机数量并在资源分配记录中进行登记，该模块将来自资源分配模块的分配方案输出给资源分配输出模块；

资源分配输出模块用于将用户请求的最优资源分配方案输出给运营商。

作为优选，所述遍历方法为递归方法。

有益效果

在现有技术下，很多研究都是针对提高数据中心的弹性或者资源利用率(即带宽开销)，没有将两者结合在一起的研究，这就会导致数据中心要么弹性差，不能应对用户需求的突然增加，要么资源利用率低，两者很难同时达到最优平衡效果。而本发明提出的一种面向数据中心多层次应用的弹性资源分配方法，提高了数据中心的弹性和资源利用率。本发明能够解决数据中心所有树形拓扑结构的弹性资源分配问题，具有灵活性高的特点；本发明提出的方法能够立刻部署在数据中心之上，具有可用性强的特点；同时，本发明的资源分配方案兼顾到资源利用率和弹性，保证了弹性的同时，提高了整个系统的效率。

附图说明

图1是三层应用示意图；

图2是三层应用结构逻辑连接方式示意图；

图3是某数据中心树形网络拓扑结构示意图；

图4是资源分配后示意图；

图5是新请求到达后的弹性资源分配方法示意图；

图6是是本发明方法流程示意图；

图7是本发明方法装置结构示意图；

图8是本发明方法试验结果对比图。

具体实施方式

为使本发明的目标，技术方案及优点更加清楚明确，下面将结合附图对本发明的实施例进行详细的描述。本实施例以本发明的技术方案为指导进行实际的实践核验，同时给出了详细的实施方式和具体的操作流程，但本发明的保护范围并不只限于如下的实施例。

图1表示具有三层应用的结构，第一层为表示层(PR)，用于管理用户交互，提供易于操作的前端；第二层为业务逻辑层(BL)，用于管理业务规则，控制和操作整个应用框架；第三层为数据存储层(DB)，用于存储和供应底层数据。每一层包含一个或多个运行在单个虚拟机上的虚拟实例。

图2表示三层应用的结构在逻辑上的一种连接方式，每一层通过虚拟交换机进行交互。

图3表示某数据中心树形网络拓扑结构示意图，在该拓扑结构中包含有A、B、C、D四个服务器，每个服务器能够支持四个虚拟机的运行，该结构中包含两种交换机，分别是ToR交换机和汇聚交换机，ToR交换机用于连接两个服务器，汇聚交换机用于连接两个ToR交换机。

实施例1

如图6所示为本发明的弹性资源分配方法流程图，根据本流程，以如图3所示的数据中心网络拓扑结构为例对本发明的实施过程进行说明。

在本实例中，假设每条物理链路的带宽容量为1Gbps。用户提出如表2所示的请求P，该请求包括三层，每一层的参数见表2。以请求P的第1层参数T₁＝<1，0，0，150，null>表示为用户请求“始终运行”的虚拟机数量、“按需运行”的虚拟机数量、层内通信所需的带宽、层间通信所需的带宽分别为1、0、0、150，没有加载“按需运行”虚拟机的阈值。另外，从表中可以看出，用户请求“始终运行”的虚拟机数量为6个，“按需运行”的虚拟机数量为2个(在第二层，即业务逻辑层BL)

表2用户请求参数表(单位：Mbps)

根据步骤2，分别计算请求P各层的带宽需求为150、600、700，降序排列存储到T’＝<700，600，150>中。

根据降序，分别对第3层、第2层和第1层进行资源分配。

首先对第3层进行资源分配，用户请求的“始终运行”的虚拟机数量为2，此时，根据步骤3，对于数据中心的链路l₁、l₂、l₃、l₄、l₅、l₆的可行向量FV₁、FV₂、FV₃、FV₄、FV₅、FV₆分别为表3，表4，表5，表6，表7、表8。

表3链路l₁的可行向量FV₁

0	1	2
			1	1	1

表4链路l₂的可行向量FV₂

0	1	2
			1	1	1

表5链路l₃的可行向量FV₃

0	1	2
			1	1	1

表6链路l₄的可行向量FV₄

0	1	2
			1	1	1

表7链路l₅的可行向量FV₅

0	1	2
			1	1	1

表8链路l₆的可行向量FV₆

0	1	2
			1	1	1

在分配过程中，根据步骤4，将参数<T₃,root,2>代入方法alloc(r,l,n)中，链路root是根链路，level(root)≠0，执行步骤4(2)，设root'∈set(root)，计算虚拟资源可用量base＝2-(0+0)＝2。

对于set(root)中的每一条链路l₅和l₆，首先计算有关l₅的变量，并调用alloc方法tmp₅＝alloc(T₃,l₅,2)，此时level(l₅)≠0，执行步骤4(2)，计算虚拟资源可用量base＝2-(0+0)＝2。

对于set(l₅)中的每一条链路l₁和l₂，首先计算有关l₁的变量：并调用alloc方法tmp₁＝alloc(T₃,l₁,2)，此时level(l₁)＝0，执行步骤4(1)，得到count＝2，所以tmp₁＝2，即f₃₁＝2，服务器1中给应用第三层分配2个虚拟资源。此时，tmp₁≠-1，base＝2-(2-0)＝0，count＝0+2＝2。然后计算有关l₂的变量：并调用alloc方法tmp₂＝alloc(T₃,l₂,0)，此时level(l₂)＝0，执行步骤4(1)，得到count＝0，所以tmp₂＝0，即f₃₂＝0，服务器2中给应用第三层分配0个虚拟资源。此时，tmp₂≠-1，base＝0-(0-0)＝0，count＝2+0＝2。

此时，跳出set(l₅)的递归，进入l₅递归层面，根据set(l₅)的递归情况，得到tmp₅＝2，此时，tmp₅≠-1，base＝2-(2-0)＝0，count＝0+2＝2。然后用同样的方法计算set(root)中的另一条链路l₆相关的变量，得到f₃₃＝0,f₃₄＝0，即服务器3中给应用第三层分配0个虚拟资源，服务器4中给应用第三层分配0个虚拟资源。

所以，针对应用第三层请求，数据中心的资源分配方式为f₃₁＝2,f₃₂＝0,f₃₃＝0,f₃₄＝0，即服务器1给应用第三层分配2个虚拟机资源，其它服务器不对应用第三层分配虚拟机资源。

然后，对第2层进行资源分配，用户请求的“始终运行”的虚拟机数量为3，此时，对于数据中心的链路l₁、l₂、l₃、l₄、l₅、l₆的可行向量FV₁、FV₂、FV₃、FV₄、FV₅、FV₆分别为表9，表10，表11，表12，表13、表14。

表9链路l₁的可行向量FV₁

0	1	2	3
				1	1	1	0

表10链路l₂的可行向量FV₂

0

1

2

3

1

表11链路l₃的可行向量FV₃

0	1	2	3
				1	1	1	1

表12链路l₄的可行向量FV₄

0	1	2	3
				1	1	1	1

表13链路l₅的可行向量FV₅

0	1	2	3
				1	1	1	1

表14链路l₆的可行向量FV₆

0	1	2	3
				1	1	1	1

在分配过程中，根据步骤4，将参数<T₂,root,3>代入方法alloc(r,l,n)中，链路root是根链路，level(root)≠0，执行步骤4(2)，设root'∈set(root)，计算虚拟资源可用量base＝3-(0+0)＝3。

对于set(root)中的每一条链路l₅和l₆，首先计算有关l₅的变量，并调用alloc方法tmp₅＝alloc(T₃,l₅,3)，此时level(l₅)≠0，执行步骤4(2)，计算虚拟资源可用量base＝3-(0+0)＝3。

对于set(l₅)中的每一条链路l₁和l₂，首先计算有关l₁的变量：并调用alloc方法tmp₁＝alloc(T₂,l₁,3),此时level(l₁)＝0，执行步骤4(1)，得到count＝2，所以tmp₁＝2，即f₂₁＝2，服务器1中给应用第二层分配2个虚拟资源。此时，tmp₁≠-1，base＝3-(2-0)＝1，count＝0+2＝2。

计算有关l₂的变量：并调用alloc方法tmp₂＝alloc(T₂,l₂,1),此时level(l₂)＝0，执行步骤4(1)，得到count＝1，所以tmp₂＝1，即f₂₂＝1，服务器2中给应用第二层分配1个虚拟资源。此时，tmp₂≠-1，base＝1-(1-0)＝0，count＝2+1＝3。

此时，跳出set(l₅)的递归，进入l₅层面递归，根据set(l₅)的递归情况，得到tmp₅＝3，此时，tmp₅≠-1，base＝3-(3-0)＝0，count＝0+3＝3。然后用同样的方法计算set(root)中的另一条链路l₆相关的变量，得到f₂₃＝0,f₂₄＝0，即服务器3中给应用第二层分配0个虚拟资源，服务器4中给应用第二层分配0个虚拟资源。

所以，针对应用第二层请求，数据中心的资源分配方式为f₂₁＝2,f₂₂＝1,f₂₃＝0,f₂₄＝0，即服务器1中为应用第二层分配2个虚拟机资源，服务器2为应用第二层分配1个虚拟机资源，其它服务器不对应用第二层分配虚拟机资源。

最后，对第1层进行资源分配，用户请求的“始终运行”的虚拟机数量为1，此时，对于数据中心的链路l₁、l₂、l₃、l₄、l₅、l₆的可行向量FV₁、FV₂、FV₃、FV₄、FV₅、FV₆分别为表15，表16，表17，表18，表19、表20。

表15链路l₁的可行向量FV₁

0	1
		1	0

表16链路l₂的可行向量FV₂

0	1
		1	1

表17链路l₃的可行向量FV₃

0	1
		1	1

表18链路l₄的可行向量FV₄

0	1
		1	1

表19链路l₅的可行向量FV₅

0	1
		1	1

表20链路l₆的可行向量FV₆

0	1
		1	1

在分配过程中，根据步骤4，将参数<T₁,root,3>代入方法alloc(r,l,n)中，链路root是根链路，level(root)≠0，执行步骤4(2)，设root'∈set(root)，计算虚拟资源可用量base＝1-(0+0)＝1。

对于set(root)中的每一条链路l₅和l₆，首先计算有关l₅的变量，并调用alloc方法tmp₅＝alloc(T₁,l₅,1)，此时level(l₅)≠0，执行步骤4(2)，计算虚拟资源可用量base＝1-(0+0)＝1。

对于set(l₅)中的每一条链路l₁和l₂，首先计算有关l₁的变量：并调用alloc方法tmp₁＝alloc(T₁,l₁,1),此时level(l₁)＝0，执行步骤4(1)，得到count＝0，所以tmp₁＝0，即f₁₁＝0，服务器1中给应用第一层分配0个虚拟资源。此时，tmp₁≠-1，base＝1-(0-0)＝1，count＝0+0＝0。

计算有关l₂的变量：并调用alloc方法tmp₂＝alloc(T₁,l₂,1),此时level(l₂)＝0，执行步骤4(1)，得到count＝1，所以tmp₂＝1，即f₁₂＝1，服务器2中给应用第一层分配1个虚拟资源。此时，tmp₂≠-1，base＝1-(1-0)＝0，count＝0+1＝1。

此时，跳出set(l₅)的递归，进入l₅层面递归，根据set(l₅)的递归情况，得到tmp₅＝1，此时，tmp₅≠-1，base＝1-(1-0)＝0，count＝0+1＝1。然后用同样的方法计算set(root)中的另一条链路l₆相关的变量，得到f₁₃＝0,f₁₄＝0，即服务器3中给应用第一层分配0个虚拟资源，服务器4中给应用第一层分配0个虚拟资源。所以，针对应用第一层请求，数据中心的资源分配方式为f₁₁＝0,f₁₂＝1,f₁₃＝0,f₁₄＝0，即服务器2中为应用第一层分配1个虚拟机资源，其它服务器不对应用第一层分配虚拟机资源。

按照上述对第3层、第2层和第1层的资源分配，最终的分配方案如图4所示。数学表达为

b_{l} = Σ_{i = 1}^{k} \min (N_{i}^{I n} B_{i}^{a}, N_{i}^{O u t} B_{i}^{a}) + \min (Σ_{i = 1}^{k} N_{i}^{I n} B_{i}^{e}, Σ_{i = 1}^{k} N_{i}^{O u t} B_{i}^{e})

F＝{f₃₁＝2,f₃₂＝0,f₃₃＝0,f₃₄＝0,f₂₁＝2,f₂₂＝1,f₂₃＝0,f₂₄＝0,f₁₁＝0,f₁₂＝1,f₁₃＝0,f₁₄＝0}，即在服务器1为应用第三层分配2个虚拟机资源，为应用第二层分配2个虚拟机资源，服务器2为应用第二层分配1个虚拟机资源，为应用第二层分配1个虚拟机资源。此时，在链路l₁和l₂上预留的带宽均为350Mbps，均未超过各个链路的带宽容量。

所以，针对请求P的最终资源分配方案是F＝{f₁₂＝1,f₂₁＝2,f₂₂＝1,f₃₁＝2}，如图4所示。

由于请求P的应用第二层有2个“按需运行”虚拟资源需求，故应该在数据中心剩余可用资源中预留出2个虚拟机空槽供该应用以后使用，如图5所示，在剩余资源中紧随其后预留出2个虚拟机空槽，即在服务器2中进行预留，数据中心此时也会进行记录，此时由于服务器1和服务器2的虚拟机资源已经用尽，当再有应用请求Q到来时，将在剩余的服务器3和服务器4中进行分配，而不会占用为请求P预留出的资源(如图5服务器2中虚线所示)。为请求Q分配资源的方式与之前请求P分配资源的方式相同，这里不再赘述。

综上，本发明可实现面向数据中心多层次弹性应用的资源分配。

实施例2

如图7所示为本发明一种面向数据中心多层次弹性应用的资源分配装置结构示意图，从图中可知，该装置包括依次连接的用户请求接收模块、请求计算模块、资源分配模块、可用资源计算模块和资源分配输出模块；

请求计算模块用于根据用户请求T和当前数据中心拓扑结构G＝(V,L)分别计算每条链路的可行向量(每条链路连接的子树中分配的虚拟机数量的所有可行值)，并向资源分配模块输出用户请求和可行向量计算结果；

资源分配模块用于采用遍历方法根据用户请求、可行向量为应用的每一层计算最优的虚拟机资源分配方案，并将该分配方案和用户请求输出到可用资源计算模块；

作为优选，所述遍历方法为实施例1中所述递归方法alloc；

可用资源计算模块用于在数据中心拓扑结构中记录当前请求的虚拟机资源分配方案，以及计算当前请求中“按需运行”的虚拟机数量并在数据中心拓扑结构中进行预留，以及将资源分配方案输出到资源分配输出模块；

实验结果

以下通过仿真实验验证本发明的有益效果。

实验使用的数据中心网络为三层树形拓扑，共包含4,000台服务器。每40台服务器连接至1台ToR(架顶)交换机，每10台ToR交换机连接至1台Agg(汇聚)交换机，全部10台Agg交换机连接至1台核心层交换机。每台服务器支持4个虚拟机，网络支持的虚拟机总数为16,000。每台服务器与ToR交换机之间的链路带宽为1Gbps，每台ToR交换机与Agg交换机之间的链路带宽为10Gbps，每台Agg交换机与核心层交换机之间的链路带宽为25Gbps。

实验共模拟了5000个应用请求，请求的到达次序符合泊松分布。如果请求到达时，它所需要的虚拟资源无法得到满足，则该请求被拒绝(即成功调度失败)；否则，该请求被接受。通过控制请求达到的平均速率，分别模拟数据中心网络预期资源利用率为10％、20％、30％、40％、50％、60％、70％、80％、90％和100％的情形。

实验对比了两种方法，分别是：本发明提出的考虑请求动态扩展需求的弹性资源分配方法，简称弹性方法；已有的、不考虑请求动态扩展需求的贪婪资源分配方法，简称贪婪方法。

图8表示在不同预期负载情形下，本发明方法(弹性方法)与贪婪方法在资源成功调度率方面的差异。可见，弹性方法始终优于贪婪方法。并且，数据中心负载越高，弹性方法的优势越明显。

以上所述的具体描述，对发明的目的、技术方案和优点益处都进行了进一步的详细说明，所应理解的是，以上所述仅为本发明的具体实施例而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种面向数据中心多层次弹性应用的资源分配方法，其特征在于：包括以下步骤：

(1)用户提出虚拟网络资源需求T＝{T_i,i∈[1,k]}，k为应用包含的层数，T_i表示用户对于应用第i层的需求，T_i是一个五元组变量，表示形式为其中，表示“始终运行”的虚拟机数量，表示“按需运行”的虚拟机数量，表示层内通信所需的带宽，表示层间通信所需的带宽，S_i表示加载“按需运行”虚拟机的阈值；

(2)运营商对于用户应用请求T中的每一层请求T_i，分别计算其带宽需求并对各层的带宽需求进行降序排列，存储到集合T'中；

(3)i＝1；

(4)对于集合T'中的元素Ti，运营商根据当前数据中心拓扑结构G＝(V,L)(其中，V表示服务器集合，L表示链路集合，这里根链路为root)以及资源分配记录分别计算数据中心中每一条链路l相连子树分配虚拟机数量的可行向量FV_l；在数据中心树形拓扑中，规定链路l直接相连的子树为l^In，除去l_In之后的拓扑结构为l^Out；对于新应用T的每一层i，和分别表示l^In和l^Out中分配到的虚拟机数量；可行向量FV_l表示当l^In中分配x个虚拟机时，该层的分配方案是否可行(y＝1表示可行，否则不可行)；对于变量x，若满足x≤r_v和b_l≤r_b，则对应的y值为1，其中，r_v表示服务器v空槽的数量，b_l表示分配方案所产生的链路l的带宽开销，r_b表示链路剩余的带宽开销；其中，带宽开销b_l由通过该链路的层内通信和层间通信组成，具体通过如下公式计算：

b_{l} = Σ_{m = 1}^{i} \min (N_{m}^{I n} B_{m}^{a}, N_{m}^{O u t} B_{m}^{a}) + \min (Σ_{m = 1}^{i} N_{m}^{I n} B_{m}^{e}, Σ_{m = 1}^{i} N_{m}^{O u t} B_{m}^{e})

(5)运营商根据可行向量FV_l通过遍历方法获得第i层最优的虚拟资源分配方案；

(6)i＝i+1；如果i≤k，转到步骤(4)；否则，转到步骤(7)；

(7)根据每一次步骤(5)的执行结果，获得最终的虚拟资源分配方案F＝{f_iv},1≤i≤k,v∈V，f_iv表示给应用的第i层在服务器v中分配的虚拟资源的数量；

(8)通过上述步骤(3)～(7)获得应用每一层的“始终运行”虚拟机需求的分配方案，数据中心在获得该分配方案之后，为该应用的“按需运行”虚拟机数量在服务器中预留出相应空槽，并在资源分配记录中对“始终运行”虚拟机需求的分配方案和为该应用预留的“按需运行”虚拟机空槽的数量及对应的服务器中的位置进行记录，为以后新的用户请求的资源分配以及为原有已有应用调度“按需运行”的虚拟机做准备。

2.根据权利要求1所述的一种面向数据中心多层次弹性应用的资源分配方法，其特征在于：步骤(5)所述遍历方法为递归方法alloc(r,l,n)，该方法获得给第i层应用分配的虚拟资源数量，并与用户请求的进行对比，如果两者相等，则返回true，说明存在第i层应用的分配方案；如果两者不相等，则返回false，说明不存在第i层应用的分配方案；其中，参数r表示用户请求，参数l表示链路，参数n表示用户请求分配的虚拟资源数量；其具体实现过程如下：

(1)若level(l)＝0，在链路l相连的服务器中分配的虚拟资源数量为count＝max{j|FV_j＝1&j≤n}，count表示当FV_j＝1时，j取得的最大值，此时j≤n；判断count在可行向量FV_j中是否合法(即当x＝count时，y是否为1)，如果不合法，则alloc方法返回-1；如果合法，则返回count值,即给第i层应用在链路e相连的服务器v内分配数量为count的虚拟机资源，数学表达为f_iv＝count；

(2)若level(l)≠0，设set(l)为链路l子树level(l)-1层的链路集合，链路l'∈set(l)，计算剩余虚拟资源可用数量base＝n-Σ_l'∈set(l)Q_l'；对于set(l)中的每条链路l'，计算n_l'＝Q_l'+base和tmp＝alloc(r,l',n_l')，tmp是递归执行方法alloc得到的数值；如果tmp≠-1,则base和count进行如下赋值：base←base-(tmp-Q_l')和count←count+tmp；如果tmp＝-1，则alloc返回-1值；在执行完set(l)中的每条链路l'操作之后，判断count在可行向量FV_j是否合法，如果不合法，则返回-1；如果合法，则返回count值。

3.一种面向数据中心多层次弹性应用的资源分配装置，其特征在于：包括依次连接的用户请求接收模块、请求计算模块、资源分配模块、可用资源计算模块和资源分配输出模块；

4.根据权利要求3所述的一种面向数据中心多层次弹性应用的资源分配装置，其特征在于：所述遍历方法为权利要求2所述的递归方法alloc(r,l,n)。