CN104008001A

CN104008001A - 用于大数据支撑的虚拟机动态迁移算法

Info

Publication number: CN104008001A
Application number: CN201410224917.XA
Authority: CN
Inventors: 李叶飞; 王松云; 官国飞; 姚鹏
Original assignee: State Grid Corp of China SGCC; State Grid Jiangsu Electric Power Co Ltd; Jiangsu Fangtian Power Technology Co Ltd
Current assignee: State Grid Corp of China SGCC; State Grid Jiangsu Electric Power Co Ltd; Jiangsu Fangtian Power Technology Co Ltd
Priority date: 2014-05-26
Filing date: 2014-05-26
Publication date: 2014-08-27
Anticipated expiration: 2034-05-26
Also published as: CN104008001B

Abstract

本发明公开了一种用于大数据支撑的虚拟机动态迁移算法，以为所有作业中预计完成时间最短者值最小作为虚拟机迁移的目标函数，采用退火算法就行求解，搜索最优的虚拟机迁移策略，以达到迁移目的。本发明有效解决了利用虚拟机运行大数据框架时物理资源分配不均的问题，为大数据的实现提供了技术支撑，提高大数据框架的效率。

Description

用于大数据支撑的虚拟机动态迁移算法

技术领域

本发明涉及一种用于大数据支撑的虚拟机动态迁移算法，属于大数据部署的技术领域。

背景技术

随着信息化技术以及物联网技术的高速发展，越来越多企业意识到大数据对企业发展的战略意义，但是并不是所有的企业都有足够的精力和能力去应对部署以Hadoop为代表的大数据平台带来的挑战(部署门槛和系统调优门槛)。而且Name Node和Job tracker存在单点失效问题，Hive、HCatalog等非Hadoop核心模块也没有双机集群高可用性的保障，专有的Hadoop集群CPU利用率低，Hadoop和非Hadoop负载不能直接共享资源，等等。这一系列的问题，都给Hadoop的使用带来了诸多不便。

因此，利用服务器虚拟化技术来部署大数据平台成为有效的解决手段。服务器虚拟化技术将多台物理机及其CPU、内存等资源聚合起来统一管理，提高计算机物理资源的利用率，降低了部署大数据的成本。同时，服务器虚拟化提供了高可用的基础设施，当物理服务器发生故障时，虚拟服务器可以自动切换到资源池中的其他物理服务器上。

不同于在物理服务器上部署大数据框架，虚拟机的高可靠性，资源的高效利用，便利的创建和注销方法为大数据的部署带来便利。然而，大数据框架的资源调度只能针对虚拟资源而非物理资源，因此，物理资源调度问题成为在虚拟机上部署大数据带来的新挑战

针对在物理机器上部署大数据框架的资源调度优化问题，通常的思路是对大数据框架进行改进。考虑到实际应用场景中，不同作业对资源的需求往往具有较大差异，静态配置slot数目往往会导致节点上的资源利用率过高或者过低，为了解决该问题，有学者提出采用动态调整slot数目的方案。针对现有框架中区分slot类别的资源管理方案会降低slot的利用率，有学者提出不再区分Map slot和Reduce slot，而是只有一种slot，并让Map Task和ReduceTask共享这些slot，从而提高slot的利用率。然而，针对在虚拟服务器上部署大数据框架的资源调度优化问题，鲜有研究

发明内容

本发明提出一种用于大数据支撑的虚拟机动态迁移算法，用于解决利用虚拟机部署大数据时，物理资源分配不均的问题。

本发明所采用的技术方案为：

用于大数据支撑的虚拟机动态迁移算法，包括以下步骤：

1)建立解空间，所述解空间是指物理机运行无异常情况下所有的云平台状态，，用如下方式表示：

{P_{status}^{1}, P_{status}^{2} . . . P_{status}^{i} . . .};

其中，i表示任一云平台状态；

2)对于任意一个云平台中，定义每个任务预计完成时间为建立与资源及任务之间的预测模型；

其中，j表示任一云平台状态i中任一任务；

3)对于任意给定的云平台状态，每个作业都会包含很多任务，定义作业预计完成时间

T_{job, k}^{i},

其中，k表示任一云平台状态i中任一作业；

4)构建虚拟机迁移的目标函数；

5)采用退火算法求解所述虚拟机迁移的目标函数。

前述的云平台状态i定义为：

P_{status}^{i} = {PM, VM, JOB, TASK, F_{VM &RightArrow; PM}, F_{TASK &RightArrow; JOB}, F_{TASK &RightArrow; VM}},

其中，PM表示物理机集合，VM表示虚拟机集合，JOB表示当前运行的作业集合，TASK表示当前运行的任务集合，

F_VM→PM表示虚拟机到物理机的映射，

{&ForAll; vm}_{p}, {vm}_{q} &Element; VM, {&Exists; F}_{VM &RightArrow; PM} ({vm}_{p}), F_{VM &RightArrow; PM} ({vm}_{q}) &Element; PM,

且F_VM→PM(vm_p)≠F_VM→PM(vm_q)；

F_TASK→JOB表示MapReduce的任务到作业的映射，

{&ForAll; task}_{p}, {task}_{q} &Element; TASK, {&Exists; F}_{TASK &RightArrow; JOB} ({task}_{p}), F_{TASK &RightArrow; JOB} ({task}_{q}) &Element; JOB,

且

F_TASK→JOB(task_p)≠F_TASK→JOB(task_q)；

F_TASK→VM表示MapReduce的任务到虚拟机的映射。

前述的任务预计完成时间与资源及任务之间的预测模型为：

T_{task, j}^{i} = β_{task, j}^{i} + β_{1}^{i} x_{cpu, F_{TASK &RightArrow; VM} (T_{task, j}^{i})}^{i} + β_{2}^{i} x_{m, F_{TASK &RightArrow; VM} (T_{task, j}^{i})}^{i} + β_{3}^{i} x_{I / O, F_{TASK &RightArrow; VM} (T_{task, j}^{i})}^{i}

其中，为云平台状态i下j任务的预计完成时间，为虚拟机在云平台状态i下的回归系数，为云平台状态i下计算j任务预计完成时间时的任务量，分别表示云平台状态下i下第j个任务运行的虚拟机的CPU、内存、I/O的空闲资源；

为了使计算过程更加清晰，所述预测模型简化为：

前述的任务预计完成时间的求解包括以下步骤：

2-1)在云平台状态i下，结合计算机资源使用的惯性，取最近的运行完成任务的历史数据作为预测样本，在任务运行时，每间隔一段时间记录一次当前的任务量、时间点、CPU、内存、I/O空闲资源信息，设所记录的预测样本数为n，

定义：

X = [\begin{matrix} β_{0}^{1}, & x_{cpu}^{1}, & x_{m}^{1}, & x_{I / O}^{1} \\ \cdot & \cdot \\ \cdot & \cdot \\ \cdot & \cdot \\ β_{0}^{n}, & x_{cpu}^{n}, & x_{m}^{n}, & x_{I / O}^{n} \end{matrix}], Y = [\begin{matrix} t_{1} \\ \cdot \\ \cdot \\ \cdot \\ t_{n} \end{matrix}],

其中，t₁…t_n在历史任务运行完成时计算得到，用结束的时间戳减去记录的时间戳，为从MapReduce的任务监控参数获取到的任务的当前时间点的剩余任务量，分别为通过虚拟化软件的sdk获取的历史任务的当前时间点的CPU、内存、I/O空闲资源信息；

2-2)对回归系数进行最小二乘法运算，可得回归系数的估计值

\hat{β} = {(X^{T} X)}^{- 1} X^{T} Y,

其中

\hat{β} = ({\hat{β}}_{1}, {\hat{β}}_{2}, {\hat{β}}_{3});

2-3)计算虚拟机迁移后的任务预计完成时间的估计值

{\hat{T}}_{task, j}^{i} = {\hat{β}}_{0} + {\hat{β}}_{1} x_{cpu} + {\hat{β}}_{2} x_{m} + {\hat{β}}_{3} x_{I / O}

其中，虚拟机的CPU空闲资源x_cpu、内存空闲资源x_m、I/O的空闲资源x_I/O由虚拟机资源分配策略算出：

x=(x_cpu，x_m，x_I/O)。

前述的作业预计完成时间定义为该作业中所有任务的预计完成时间最大值，表达式如下：

T_{job, k}^{i} = \max {\hat{T}}_{task, j}^{i};

其中，表示云平台状态i下k作业的预计完成时间。

前述的目标函数是指所有作业中预计完成时间最短者值最小，表达方式如下：

\min {\min {T_{job, k}^{i} (job, k) &Element; JOB, JOB &Subset; P_{status}^{i}}};

前述的利用退火算法求解虚拟机迁移的目标函数包括以下步骤：

5-1)定义代价函数差Δf，

由于虚拟机进行迁移导致云平台由解空间的i状态变到解空间的i+1状态，所述代价函数差是指云平台状态i+1所有作业的预计完成时间最短值与云平台状态i所有作业的预计完成时间最短值之差，表达式如下：

Δf = \min {T_{job, k}^{i + 1}, (job, k) &Element; JOB, JOB &Subset; P_{status}^{i + 1}} - \min {T_{job, k}^{i}, (job, k) &Element; JOB, JOB &Subset; P_{status}^{i}}

5-2)设定接受准则P，

P = \{\begin{matrix} 1 & Δf < 0 \\ \exp (- Δf / T) & Δf &GreaterEqual; 0 \end{matrix}

如果代价函数差Δf＜0，则接受迁移该虚拟机作为迁移策略；如果代价函数差Δf≥0，则以概率exp(-Δf/T)接受迁移该虚拟机作为迁移策略，其中，T表示当前温度；

5-3)选定终止温度e，若T＜e，则退火算法结束，输出当前状态，即为目标函数的解；若T≥e，则更新T为T×α，返回步骤5-1)，继续计算；

其中，α为降温系数，T的初始值T₀：T₀＝1。

前述的降温系数α选取0.99；所述终止温度e选取e＝10^-5。

本发明有效解决了利用虚拟机运行大数据框架时物理资源分配不均的问题，为大数据的实现提供了技术支撑，提高大数据框架的效率。

附图说明

图1为本发明实施例中虚拟机的分布示意图；

图2为图1的虚拟机的资源占用情况示意图。

具体实施方式

下面结合附图和具体实施方式详细说明本发明。

在云平台下，利用虚拟机部属大数据平台时，由于大数据框架MapReduce的资源调度策略只是针对虚拟机的，并不能涉及到物理机的资源分配情况，因此会存在物理资源分配不均匀的情况。如图1和图2所示，位于物理机1上的虚拟机vm1，vm2，vm3，vm4都会占用很多I/O资源，但CPU和内存资源比较空闲，此时运行于这些虚拟机上的任务会由于I/O瓶颈，运行得相当慢。同样，位于物理机2上的虚拟机vm5，vm6，vm7，vm8由于CPU和内存资源的瓶颈，导致运行在上面的任务速度也相当慢，然而I/O资源却相当空闲。

本发明的用于大数据支撑的虚拟机动态迁移算法，主要包括以下步骤：

1、建立解空间，解空间是指物理机运行无异常情况下，所有可能的云平台状态，表达方式为：

云平台状态i定义为：

P_{status}^{i} = {PM, VM, JOB, TASK, F_{VM &RightArrow; PM}, F_{TASK &RightArrow; JOB}, F_{TASK &RightArrow; VM}},

F_VM→PM表示虚拟机到物理机的映射，

{&ForAll; vm}_{p}, {vm}_{q} &Element; VM, {&Exists; F}_{VM &RightArrow; PM} ({vm}_{p}), F_{VM &RightArrow; PM} ({vm}_{q}) &Element; PM,

且F_VM→PM（vm_p)≠F_VM→PM(vm_q)；F_TASK→JOB表示MapReduce的任务到作业的映射，

{&ForAll; task}_{p}, {task}_{q} &Element; TASK, {&Exists; F}_{TASK &RightArrow; JOB} ({task}_{p}), F_{TASK &RightArrow; JOB} ({task}_{q}) &Element; JOB,

且

F_TASK→JOB(task_p)≠F_TASK→JOB(task_q)；

F_TASK→VM表示MapReduce的任务到虚拟机的映射，即任务运行在哪个虚拟机上。

2、对于任意一个云平台状态i，定义每个任务j预计完成时间为任务的预计完成时间与任务量、CPU资源、内存资源、I/O资源密切相关，并且可以发现与各资源成线性关系，因此利用回归分析的方法建立任务j预计完成时间与资源及任务之间的预测模型为：

T_{task, j}^{i} = β_{task, j}^{i} + β_{1}^{i} x_{cpu, F_{TASK &RightArrow; VM} (T_{task, j}^{i})}^{i} + β_{2}^{i} x_{m, F_{TASK &RightArrow; VM} (T_{task, j}^{i})}^{i} + β_{3}^{i} x_{I / O, F_{TASK &RightArrow; VM} (T_{task, j}^{i})}^{i}

其中，为云平台状态i下j任务的预计完成时间，为虚拟机

在云平台状态i下的回归系数，为云平台状态i下计算j任务预计完成时间时的任务量，分别表示云平台状态下i下第j个任务运行的虚拟机的CPU、内存、I/O的空闲资源；

为了使计算过程更加清晰，将上述的预测模型简化为：

T_{task, j}^{i} = β_{0} + β_{1} x_{cpu} + β_{2} x_{m} + β_{3} x_{I / O} .

任务预计完成时间的求解过程为：

在云平台状态i下，结合计算机资源使用的惯性，取最近的运行完成任务的历史数据作为预测样本，在任务运行时，每间隔一段时间记录一次当前的任务量、时间点、CPU、内存、I/O空闲资源信息，设所记录样本数为n，在实际应用中n的数量需要权衡效率和成本；

根据记录的预测样本，得到

X = [\begin{matrix} β_{0}^{1}, & x_{cpu}^{1}, & x_{m}^{1}, & x_{I / O}^{1} \\ \cdot & \cdot \\ \cdot & \cdot \\ \cdot & \cdot \\ β_{0}^{n}, & x_{cpu}^{n}, & x_{m}^{n}, & x_{I / O}^{n} \end{matrix}], Y = [\begin{matrix} t_{1} \\ \cdot \\ \cdot \\ \cdot \\ t_{n} \end{matrix}],

对回归系数进行最小二乘法运算，可得回归系数的估计值

\hat{β} = {(X^{T} X)}^{- 1} X^{T} Y,

其中

\hat{β} = ({\hat{β}}_{1}, {\hat{β}}_{2}, {\hat{β}}_{3});

计算虚拟机迁移后的任务预计完成时间的估计值

{\hat{T}}_{task, j}^{i} = {\hat{β}}_{0} + {\hat{β}}_{1} x_{cpu} + {\hat{β}}_{2} x_{m} + {\hat{β}}_{3} x_{I / O},

其中，为任务量，可由MapReduce的任务监控程序获得，虚拟机的CPU空闲资源x_cpu、内存空闲资源x_m、I/O的空闲资源x_I/O由虚拟机资源分配策略算出：

x＝(x_cpu,x_m,x_I/O)

其中，物理资源，虚拟机份额值，所有虚拟机份额总值，实际使用资源都可由虚拟机软件的sdk获取。

本发明对虚拟机的资源使用状态监控通过服务器虚拟化软件提供的接口实现，包括VMWare的vsphere webservice sdk以及Xen的xenserver sdk。

1)vsphere webservice sdk

获取CPU——summary.quickStats.overallCpuUsage

获取内存——HostSystem.QueryMemoryOverheadEx

2)xenserver sdk

获取CPU——VM.VCPU_params

获取内存——VM.memory_static。

3、考虑到每个作业都会包含很多任务，对于任一给定的云平台状态i，定义作业预计完成时间该作业中所有任务的预计完成时间最大值，表达式如下：

T_{job, k}^{i} = \max {\hat{T}}_{task, j}^{i};

其中，表示云平台状态i下k作业的预计完成时间。

4、因为虚拟机最终是运行在物理机上，虚拟机之间会竞争物理机的资源，本发明采取贪心的策略，尽量以最快的速度提交一个作业，从而释放占用的资源，并且云平台中会有多个作业同时运行，因此构建虚拟机迁移的目标函数为所有作业中预计完成时间最短者值最小，表达方式如下：

\min {\min {T_{job, k}^{i} (job, k) &Element; JOB, JOB &Subset; P_{status}^{i}}};

5、采用退火算法求解虚拟机迁移的目标函数：

5-1)定义代价函数差Δf，

由于虚拟机进行迁移导致云平台由解空间的i状态变到解空间的i+1状态，所以定义代价函数差为云平台i+1状态所有作业的预计完成时间最短值与云平台i状态所有作业的预计完成时间最短值之差，表达式如下：

Δf = \min {T_{job, k}^{i + 1}, (job, k) &Element; JOB, JOB &Subset; P_{status}^{i + 1}} - \min {T_{job, k}^{i}, (job, k) &Element; JOB, JOB &Subset; P_{status}^{i}}

5-2)设定接受准则P，

P = \{\begin{matrix} 1 & Δf < 0 \\ \exp (- Δf / T) & Δf &GreaterEqual; 0 \end{matrix}

其中，α为降温系数，本发明中取α＝0.99，终止温度e选取e＝10^-5，T的初始值T₀：T₀＝1。

Claims

1.用于大数据支撑的虚拟机动态迁移算法，其特征在于，包括以下步骤：

1)建立解空间，所述解空间是指物理机运行无异常情况下所有的云平台状态，用如下方式表示：

其中，i表示任一云平台状态；

其中，j表示任一云平台状态i中任一任务；

其中，k表示任一云平台状态i中任一作业；

4)构建虚拟机迁移的目标函数；

5)采用退火算法求解所述虚拟机迁移的目标函数。

2.根据权利要求1所述的用于大数据支撑的虚拟机动态迁移算法，其特征在于，所述云平台状态i定义为：

F_VM→PM表示虚拟机到物理机的映射，

且F_VM→PM(vm_p)≠F_VM→PM(vm_q)；

F_TASK→JOB表示MapReduce的任务到作业的映射，

且

F_TASK→JOB(task_p)≠F_TASK→JOB(task_q)；

F_TASK→VM表示MapReduce的任务到虚拟机的映射。

3.根据权利要求1所述的用于大数据支撑的虚拟机动态迁移算法，其特征在于，所述任务预计完成时间与资源及任务之间的预测模型为：

为了使计算过程更加清晰，所述预测模型简化为：

4.根据权利要求3所述的用于大数据支撑的虚拟机动态迁移算法，其特征在于，所述任务预计完成时间的求解包括以下步骤：

定义：

2-2)对回归系数进行最小二乘法运算，可得回归系数的估计值

其中

2-3)计算虚拟机迁移后的任务预计完成时间的估计值

x＝(x_cpu,x_m,x_I/O)。

5.根据权利要求1所述的用于大数据支撑的虚拟机动态迁移算法，其特征在于，所述作业预计完成时间定义为该作业中所有任务的预计完成时间最大值，表达式如下：

其中，表示云平台状态i下k作业的预计完成时间。

6.根据权利要求1所述的用于大数据支撑的虚拟机动态迁移算法，其特征在于，所述目标函数是指所有作业中预计完成时间最短者值最小，表达方式如下：

。

7.根据权利要求1所述的用于大数据支撑的虚拟机动态迁移算法，其特征在于，所述利用退火算法求解虚拟机迁移的目标函数包括以下步骤：

5-1)定义代价函数差Δf，

5-2)设定接受准则P，

其中，α为降温系数，T的初始值T₀：T₀＝1。

8.根据权利要求7所述的用于大数据支撑的虚拟机动态迁移算法，其特征在于，所述降温系数α选取0.99；所述终止温度e选取e＝10^-5。