CN110196772B - 一种云数据中心环境下考虑容错机制的虚拟机调度方法 - Google Patents

一种云数据中心环境下考虑容错机制的虚拟机调度方法 Download PDF

Info

Publication number
CN110196772B
CN110196772B CN201910325217.2A CN201910325217A CN110196772B CN 110196772 B CN110196772 B CN 110196772B CN 201910325217 A CN201910325217 A CN 201910325217A CN 110196772 B CN110196772 B CN 110196772B
Authority
CN
China
Prior art keywords
virtual machine
physical
scheduling
ikj
machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910325217.2A
Other languages
English (en)
Other versions
CN110196772A (zh
Inventor
程鹏悦
许贺洋
刘扬
魏蔚
阎子悦
高奎
韩婷婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan University of Technology
Original Assignee
Henan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan University of Technology filed Critical Henan University of Technology
Priority to CN201910325217.2A priority Critical patent/CN110196772B/zh
Publication of CN110196772A publication Critical patent/CN110196772A/zh
Application granted granted Critical
Publication of CN110196772B publication Critical patent/CN110196772B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5072Grid computing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5077Logical partitioning of resources; Management or configuration of virtualized resources
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明公开了一种云数据中心环境下考虑容错机制的虚拟机调度方法,云用户提交的虚拟机服务请求被成功执行以后,云服务供应商会向用户收取一定的服务费用,云数据中心的虚拟机调度问题是指如何把用户提交中的n个虚拟机服务请求分配到云数据中心合适的物理机上执行,使得在考虑容错技术的情况下,最小化所有用户执行成本之和的期望值。

Description

一种云数据中心环境下考虑容错机制的虚拟机调度方法
技术领域
本发明涉及分布式计算的资源调度技术领域,更具体的说是涉及一种云数据中心环境下考虑容错机制的虚拟机调度方法。
背景技术
目前,虚拟机调度是指把用户提交的虚拟机请求分配到云数据中心合适的物理机上执行,以优化某些性能指标。由于软、硬件或其它原因,云数据中心的物理机在执行虚拟机任务的时候可能会发出故障。为提高服务可靠性,云服务供应商往往会在数据中心当中采用故障恢复等容错技术,而故障恢复需要一定的时间,因此会对所运行的虚拟机性能产生影响,从而影响虚拟机调度的运行结果。现有云数据中心的虚拟机调度技术大多没有考虑物理机故障及故障恢复对虚拟机调度的影响,因此所提出的虚拟机调度方法往往不能满足云数据中心的实际情况。
因此,如何降低物理机故障及故障恢复对虚拟机调度的影响,令虚拟机调度方法满足云数据中心的实际情况是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种云数据中心环境下考虑容错机制的虚拟机调度方法,云用户提交的虚拟机服务请求被成功执行以后,云服务供应商会向用户收取一定的服务费用,云数据中心的虚拟机调度问题是指如何把用户提交中的n个虚拟机服务请求分配到云数据中心合适的物理机上执行,使得在考虑容错技术的情况下,最小化所有用户执行成本之和的期望值。
为了实现上述目的,本发明采用如下技术方案:
一种云数据中心环境下考虑容错机制的虚拟机调度方法,包括:在云数据中心环境下结合容错机制的虚拟机调度对云用户总执行成本的期望值进行优化,具体步骤包括:
步骤1:利用基于改进的最佳适应下降虚拟机调度算法进行虚拟机调度;
步骤2:根据虚拟机调度结果计算云用户总执行成本的期望值。
优选的,所述步骤1中进行所述虚拟机调度时,所述物理机要满足约束条件才能执行对应的虚拟机服务请求,所述虚拟机服务请求对物理机的约束条件为:
1)对
Figure BDA0002036041570000021
和/>
Figure BDA0002036041570000022
xij∈{0,1};
2)对
Figure BDA0002036041570000023
3)对
Figure BDA0002036041570000024
且/>
Figure BDA0002036041570000025
4)对
Figure BDA0002036041570000026
若xij=1,则所述物理机PSj必须满足下述公式(1)和(2);
Figure BDA0002036041570000027
/>
Figure BDA0002036041570000028
其中,i为所述虚拟机服务请求个数,j为所述物理机个数,xij为调度结果;Corej为所述物理机的CPU内核数,Memj为所述物理机的内存大小;Ki(Ki≥1)为所述虚拟机服务请求需要执行的任务个数,memi为所述虚拟机服务请求需求的内存大小,bi为所述虚拟机服务请求的执行预算,di为对所述虚拟机服务请求要求的截止时间;ATikj为所述虚拟机服务请求在所述物理机上的实际执行时间。
优选的,云数据中心有m个物理机PSj(1≤j≤m),云数据中心在[0,T)内接收到n个虚拟机服务请求,组成虚拟机服务请求集合V={V1,V2,...,Vn},步骤1中所述基于改进的最佳适应下降虚拟机调度算法的具体过程为:
步骤11:输入所述虚拟机服务请求集合V={V1,V2,...,Vn}和所述物理机集合PS={PS1,PS2,...,PSm};初始化所有待调度虚拟机,将所有所述待调度虚拟机的状态设置为“未调度”,调度结果矩阵X=(xij)n×m的所有元素的值设置为0;
步骤12:将所述物理机按成本效率因子的值由高到低的顺序排序,假设排序后的物理机顺序为:PS1′,PS2′,...,PSm′;
步骤13:依次调度所述虚拟机服务请求Vi(1≤i≤n),输出所述调度结果矩阵X=(xij)n×m
优选的,步骤13中依次调度所述虚拟机服务请求Vi的具体实现过程为:
步骤131:令i=1,从所述虚拟机服务请求V1开始调度;
步骤132:依次判断所述物理机PSj′(1≤j≤m)能否满足所述虚拟机服务请求Vi的资源需求和QoS约束;如果所述物理机PSj′满足所述虚拟机服务请求Vi的资源需求和QoS约束,则进入步骤步骤133;否则,进入步骤134;
步骤133:所述虚拟机服务请求Vi分配到所述物理机PSj′上执行;改变所述物理机PSj′的可用CPU核数和内存大小,设置所述虚拟机服务请求Vi的状态为“已调度”,并令xij=1;进入步骤135;
步骤134:设置所述虚拟机请求的状态为“调度失败”;
步骤135:令i=i+1,判断i是否大于n:如果是,则算法终止;否则,返回步骤132,继续调度下一个所述虚拟机服务请求Vi
优选的,所述步骤12中所述物理机的成本效率为
Figure BDA0002036041570000031
其中,pj为所述物理机的CPU内核单价,λj为故障率,μj为恢复率。
优选的,所述云数据中心有m个物理机PSj(1≤j≤m),所述物理机PSj的故障率为λj,故障修复率为μj,所述云数据中心在[0,T)内接收到n个虚拟机服务请求,组成所述虚拟机服务请求集合V={V1,V2,...,Vn};根据公式(3)-(10)计算获得所述云用户总执行成本的期望值:
τikj=lik/Sj (3)
Figure BDA0002036041570000032
Figure BDA0002036041570000033
/>
Figure BDA0002036041570000034
ATikj=τikj+RTjikj) (7)
Figure BDA0002036041570000035
Figure BDA0002036041570000036
Figure BDA0002036041570000037
其中,Vi为第i个所述虚拟机服务请求,1≤i≤n;τikj为所述Vi在第k个物理机PSk上执行的执行时间;Njikj)为所述物理机PSj
Figure BDA0002036041570000038
内发生故障的次数;/>
Figure BDA0002036041570000039
为第
Figure BDA00020360415700000312
故障的期望值;/>
Figure BDA00020360415700000310
为所述物理机PSj在第N(N=1,2,…,Njikj))次所述故障的恢复时间;RTjikj)为所述物理机PSj在/>
Figure BDA00020360415700000311
内发生所有所述故障的总恢复时间;
Figure BDA0002036041570000041
为所述总恢复时间的期望;ATikj为所述虚拟机服务请求Vi在所述物理机PSj上的实际执行时间;/>
Figure BDA0002036041570000042
为所述实际执行时间期望;C为总执行成本;E[C]为所述总执行成本的期望。
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种云数据中心环境下考虑容错机制的虚拟机调度方法,云用户提交的虚拟机服务请求被成功执行以后,需要支付一定的服务费用即总执行成本,云用户的总执行成本是所有用户提交的n个虚拟机执行请求被成功执行后,云服务供应上向用户收取的费用之和,本发明进一步考虑了物理机故障及故障恢复对虚拟机调度的影响,在考虑容错机制下,优化云用户总执行成本的期望值,使得云用户的总执行成本最小化,其中本发明采用一种基于改进的最佳适应下降虚拟机调度算法进行虚拟机调度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1附图为本发明提供的基于改进的最佳适应下降虚拟机调度算法流程示意图;
图2附图为本发明提供的虚拟机服务请求调度流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种云数据中心环境下考虑容错机制的虚拟机调度方法,包括:在云数据中心环境下结合容错机制的虚拟机调度对云用户总执行成本的期望值进行优化,具体过程包括:
S1:利用基于改进的最佳适应下降虚拟机调度算法进行虚拟机调度;
S2:根据虚拟机调度结果计算云用户总执行成本的期望值。
为了进一步优化上述技术方案,虚拟机服务请求对物理机的约束条件为:
1)对
Figure BDA0002036041570000051
和/>
Figure BDA0002036041570000052
xij∈{0,1};
2)对
Figure BDA0002036041570000053
3)对
Figure BDA0002036041570000054
且/>
Figure BDA0002036041570000055
4)对
Figure BDA0002036041570000056
若xij=1,则物理机PSj必须满足公式(1)和(2);
Figure BDA0002036041570000057
Figure BDA0002036041570000058
其中,i为虚拟机服务请求个数,j为物理机个数,xij为调度结果;Corej为物理机的CPU内核数,Memj为物理机的内存大小;Ki(Ki≥1)为虚拟机服务请求需要执行的任务个数,memi为虚拟机服务请求需求的内存大小,bi为虚拟机服务请求的执行预算,di为对虚拟机服务请求要求的截止时间;ATikj为虚拟机服务请求在所述物理机上的实际执行时间。
约束条件1)规定了决策变量xij的取值范围,即:若服务请求Vi被分配给物理服务器PSj上,则xij=1;否则xij=0。;
约束条件2)限制了每一个虚拟机服务请求都是不可再分的,只能被分配到某一个物理机上执行;
约束条件3)表示部署到某物理机上的所有虚拟机对某种资源(CPU核或内存)的需求之和不能大于物理机能提供的该种资源的能力,是物理机资源(CPU核和内存)能力限制,即分配到物理机PSj上所有虚拟机对CPU核、内存的需求之和不能超过该物理机所能提供的CPU核的个数和内存容量;
约束条件4)确保如果将服务请求Vi分配给物理服务器PSj,则物理服务器PSj必须满足服务请求Vi的截止时间和预算要求,即如果虚拟机请求Vi被分配到物理机PSj上执行,则PSj必须能够在Vi的截止时间之前完成该请求的所有任务,且收取的服务费用小于或等于该虚拟机服务请求的预算。
为了进一步优化上述技术方案,云数据中心有m个物理机PSj(1≤j≤m),云数据中心在[0,T)内接收到n个虚拟机服务请求,组成虚拟机服务请求集合V={V1,V2,...,Vn},采用基于改进的最佳适应下降虚拟机调度算法进行虚拟机调度的具体过程为:
S11:输入虚拟机服务请求集合V={V1,V2,...,Vn}和物理机集合PS={PS1,PS2,...,PSm};初始化所有待调度虚拟机,将所有待调度虚拟机的状态设置为“未调度”,将调度结果矩阵X=(xij)n×m的所有元素的值设置为0;
S12:将物理机按成本效率因子的值由高到低的顺序排序,假设排序后的物理机顺序为:PS1′,PS2′,...,PSm′;
S13:依次调度虚拟机服务请求Vi(1≤i≤n),输出调度结果矩阵X=(xij)n×m
为了进一步优化上述技术方案,S13中依次调度虚拟机服务请求Vi的具体实现过程为:
S131:令i=1,从虚拟机服务请求V1开始调度;
S132:依次判断物理机PSj′(1≤j≤m)能否满足虚拟机服务请求Vi的资源需求和QoS约束,其中资源需求约束是指物理机PSj的可用CPU核数和内存大小,QoS约束是指服务请求Vi的截止时间和预算约束;如果物理机PSj′满足虚拟机服务请求Vi的资源需求和QoS约束,则进入S133;否则,进入S134;
S133:虚拟机服务请求Vi分配到物理机PSj′上执行;改变物理机PSj′的可用CPU核数和内存大小,设置虚拟机服务请求Vi的状态为“已调度”,并令xij=1;进入S135;
S134:设置虚拟机请求的状态为“调度失败”;
S135:令i=i+1,判断i是否大于n:如果是,则算法终止;否则,返回S132,继续调度下一个虚拟机服务请求Vi
为了进一步优化上述技术方案,S22中物理机的成本效率为
Figure BDA0002036041570000061
其中,pj为物理机的CPU内核单价,λj为故障率,μj为恢复率。
为了进一步优化上述技术方案,在考虑容错机制的情况下,根据公式(1)-(8)计算获得云用户总执行成本的期望值:
τikj=lik/Sj (3)
Figure BDA0002036041570000062
Figure BDA0002036041570000063
Figure BDA0002036041570000064
ATikj=τikj+RTjikj) (7)
Figure BDA0002036041570000071
Figure BDA0002036041570000072
Figure BDA0002036041570000073
其中,Vi为第i个虚拟机服务请求,1≤i≤n;τikj为Vi在第k个物理机PSk上执行的执行时间;Njikj)为物理机PSj在
Figure BDA0002036041570000074
内发生故障的次数;/>
Figure BDA0002036041570000075
为Njikj)故障的期望值;/>
Figure BDA0002036041570000076
为物理机PSj在第N(N=1,2,…,Njikj))次故障的恢复时间;RTjikj)为物理机PSj在/>
Figure BDA0002036041570000077
内发生所有故障的总恢复时间;/>
Figure BDA0002036041570000078
为总恢复时间的期望;ATikj为虚拟机服务请求Vi在物理机PSj上的实际执行时间;/>
Figure BDA0002036041570000079
为实际执行时间期望;C为总执行成本;E[C]为总执行成本的期望。
实施例
设云数据中心共有m个异构的物理机,用PSj(1≤j≤m)表示第j个物理机。每一个物理机PSj可用一个四元组PSj=(Corej,Memj,sj,pj)来描述,其中Corej、Memj、sj、pj分别表示物理机PSj的CPU内核数、内存大小、处理速度和使用CPU内核的单价。CPU处理速度是通过每秒执行的百万指令数(MIPS)进行度量。假设物理机PSj上发生故障的时间间隔相互独立,且都服从参数为λj的负指数分布F(t)=1-e-λjt(t≥0)。若故障都是可修复的,则一旦物理机发生故障,将启动修复过程。假设物理机PSj上发生故障的修复时间相互独立、且都服从相同参数μj的负指数分布F(t)=1-e-μjt(t≥0),而且物理机PSj上的故障发生的时间和故障恢复时间都是相互独立的,则物理机PSj的故障率为λj,故障修复率为μj
用V={V1,V2,...,Vn}表示用户在[0,T)内提交的n个虚拟机服务请求,T为虚拟机的调度周期。第i(1≤i≤n)个虚拟机请求Vi可用一个六元组
Figure BDA00020360415700000710
表示,其中Ki(Ki≥1)是虚拟机请求Vi需要执行的任务个数;Li={lik|1≤k≤Ki}是虚拟机请求Vi的Ki个任务的工作负载集,lik是虚拟机请求Vi的第k个任务的工作负载量,单位为百万指令数(MI);memi表示虚拟机请求Vi需求的内存大小;ti(0≤ti<T)是虚拟机请求Vi到达云数据中心的时间;bi是虚拟机请求Vi的执行预算;di是用户对虚拟机请求Vi要求的截止时间。
云数据中心的虚拟机调度问题是指如何把用户提交中的n个虚拟机请求分配到云数据中心合适的物理机上执行,使得在考虑容错技术的情况下,最小化所有用户执行成本之和(即总执行成本)的期望值。
基于改进的最佳适应下降虚拟机调度算法(MBFD)的核心思想是:把每一个待调度的虚拟机服务请求分配到能够满足约束条件1)-4),且成本效率最高的物理机上。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (2)

1.一种云数据中心环境下考虑容错机制的虚拟机调度方法,其特征在于,包括:在云数据中心环境下结合容错机制的虚拟机调度对云用户总执行成本的期望值进行优化,具体步骤包括:
步骤1:利用最佳适应下降虚拟机调度算法进行虚拟机调度;
云数据中心有m个物理机PSj(1≤j≤m),云数据中心在[0,T)内接收到n个虚拟机服务请求,组成虚拟机服务请求集合V={V1,V2,...,Vn},步骤1中基于改进的最佳适应下降虚拟机调度算法的具体过程为:
步骤11:输入所述虚拟机服务请求集合V={V1,V2,...,Vn}和物理机集合PS={PS1,PS2,...,PSm};初始化所有待调度虚拟机,将所有所述待调度虚拟机的状态设置为未调度,调度结果矩阵X=(xij)n×m的所有元素的值设置为0;
步骤12:将所述物理机按成本效率因子的值由高到低的顺序排序,假设排序后的物理机顺序为:PS1′,PS2′,...,PSm′;
所述物理机的成本效率为
Figure FDA0004097359600000011
其中,pj为所述物理机的CPU内核单价,λj为故障率,μj为恢复率;
步骤13:依次调度虚拟机服务请求Vi(1≤i≤n),输出所述调度结果矩阵X=(xij)n×m
依次调度所述虚拟机服务请求Vi的具体实现过程为:
步骤131:令i=1,从虚拟机服务请求V1开始调度;
步骤132:依次判断物理机PSj′(1≤j≤m)能否满足所述虚拟机服务请求Vi的资源需求和QoS约束;如果所述物理机PSj′满足所述虚拟机服务请求Vi的资源需求和QoS约束,则进入步骤步骤133;否则,进入步骤134;
步骤133:所述虚拟机服务请求Vi分配到所述物理机PSj′上执行;改变所述物理机PSj′的可用CPU核数和内存大小,设置所述虚拟机服务请求Vi的状态为已调度,并令xij=1;进入步骤135;
步骤134:设置所述待调度虚拟机的状态为调度失败;
步骤135:令i=i+1,判断i是否大于n:如果是,则算法终止;否则,返回步骤132,继续调度下一个所述虚拟机服务请求Vi
步骤2:根据虚拟机调度结果计算云用户总执行成本的期望值;根据公式(3)-(10)计算获得所述云用户总执行成本的期望值:
τikj=lik/Sj (3)
Figure FDA0004097359600000021
Figure FDA0004097359600000022
Figure FDA0004097359600000023
ATikj=τikj+RTjikj) (7)
Figure FDA0004097359600000024
/>
Figure FDA0004097359600000025
Figure FDA0004097359600000026
其中,Vi为第i个所述虚拟机服务请求,1≤i≤n;τikj为所述Vi在第k个物理机PSk上执行的执行时间;Njikj)为所述物理机PSj
Figure FDA0004097359600000027
内发生故障的次数;/>
Figure FDA0004097359600000028
为第Njikj)故障的期望值;/>
Figure FDA0004097359600000029
为所述物理机PSj在第N(N=1,2,…,Njikj))次所述故障的恢复时间;RTjikj)为所述物理机PSj在/>
Figure FDA00040973596000000210
内发生所有所述故障的总恢复时间;/>
Figure FDA00040973596000000211
为所述总恢复时间的期望;ATikj为所述虚拟机服务请求Vi在所述物理机PSj上的实际执行时间;
Figure FDA00040973596000000212
为所述实际执行时间期望;C为总执行成本;E[C]为所述总执行成本的期望。
2.根据权利要求1所述的一种云数据中心环境下考虑容错机制的虚拟机调度方法,其特征在于,所述步骤1中进行所述虚拟机调度时,物理机要满足约束条件才能执行对应的虚拟机服务请求,所述虚拟机服务请求对所述物理机的约束条件为:
1)对
Figure FDA00040973596000000213
和/>
Figure FDA00040973596000000214
xij∈{0,1};
2)对
Figure FDA00040973596000000215
3)对
Figure FDA00040973596000000216
且/>
Figure FDA00040973596000000217
4)对
Figure FDA00040973596000000218
若xij=1,则所述物理机PSj必须满足下述公式(1)和(2);
Figure FDA00040973596000000219
Figure FDA0004097359600000031
其中,i为所述虚拟机服务请求个数,j为所述物理机个数,xij为调度结果;
Corej为所述物理机的CPU内核数,Memj为所述物理机的内存大小;Ki(Ki≥1)为所述虚拟机服务请求需要执行的任务个数,memi为所述虚拟机服务请求需求的内存大小,bi为所述虚拟机服务请求的执行预算,di为对所述虚拟机服务请求要求的截止时间;ATikj为所述虚拟机服务请求在所述物理机上的实际执行时间。
CN201910325217.2A 2019-04-22 2019-04-22 一种云数据中心环境下考虑容错机制的虚拟机调度方法 Active CN110196772B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910325217.2A CN110196772B (zh) 2019-04-22 2019-04-22 一种云数据中心环境下考虑容错机制的虚拟机调度方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910325217.2A CN110196772B (zh) 2019-04-22 2019-04-22 一种云数据中心环境下考虑容错机制的虚拟机调度方法

Publications (2)

Publication Number Publication Date
CN110196772A CN110196772A (zh) 2019-09-03
CN110196772B true CN110196772B (zh) 2023-05-23

Family

ID=67752068

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910325217.2A Active CN110196772B (zh) 2019-04-22 2019-04-22 一种云数据中心环境下考虑容错机制的虚拟机调度方法

Country Status (1)

Country Link
CN (1) CN110196772B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102929685A (zh) * 2011-09-15 2013-02-13 微软公司 自动化基础架构供应
CN106657238A (zh) * 2016-10-13 2017-05-10 内蒙古工业大学 一种面向交互式工作负载的数据中心粗粒度动态服务器预留算法
CN106779283A (zh) * 2016-11-14 2017-05-31 阿坝师范学院 一种SLA保障QoS期望的云计算服务收益方法
CN107273185A (zh) * 2017-06-19 2017-10-20 成都鼎智汇科技有限公司 一种基于虚拟机的负载均衡控制方法
CN107273211A (zh) * 2017-06-19 2017-10-20 成都鼎智汇科技有限公司 一种云计算环境下基于虚拟机的数据处理方法
CN107748693A (zh) * 2017-11-30 2018-03-02 成都启力慧源科技有限公司 云计算环境下的群组虚拟机调度策略
CN108449411A (zh) * 2018-03-19 2018-08-24 河南工业大学 一种随机需求下面向异质费用的云资源调度方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9311140B2 (en) * 2013-08-13 2016-04-12 Vmware, Inc. Method and apparatus for extending local area networks between clouds and migrating virtual machines using static network addresses
US20160350146A1 (en) * 2015-05-29 2016-12-01 Cisco Technology, Inc. Optimized hadoop task scheduler in an optimally placed virtualized hadoop cluster using network cost optimizations
US20170293501A1 (en) * 2016-04-11 2017-10-12 Vmware, Inc. Method and system that extends a private data center to encompass infrastructure allocated from a remote cloud-computing facility

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102929685A (zh) * 2011-09-15 2013-02-13 微软公司 自动化基础架构供应
CN106657238A (zh) * 2016-10-13 2017-05-10 内蒙古工业大学 一种面向交互式工作负载的数据中心粗粒度动态服务器预留算法
CN106779283A (zh) * 2016-11-14 2017-05-31 阿坝师范学院 一种SLA保障QoS期望的云计算服务收益方法
CN107273185A (zh) * 2017-06-19 2017-10-20 成都鼎智汇科技有限公司 一种基于虚拟机的负载均衡控制方法
CN107273211A (zh) * 2017-06-19 2017-10-20 成都鼎智汇科技有限公司 一种云计算环境下基于虚拟机的数据处理方法
CN107748693A (zh) * 2017-11-30 2018-03-02 成都启力慧源科技有限公司 云计算环境下的群组虚拟机调度策略
CN108449411A (zh) * 2018-03-19 2018-08-24 河南工业大学 一种随机需求下面向异质费用的云资源调度方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
《Autonomic Allocation of Communicating Virtual Machines in Hierarchical Cloud Data Centers》;Arwa Aldhalaan et al.;《 2014 International Conference on Cloud and Autonomic Computing》;20150129;全文 *
《QoS-aware replica placement for data grid considering economic benefit》;Heyang Xu et al.;《2012 2nd IEEE International Conference on Parallel, Distributed and Grid Computing》;20130127;全文 *
《随机需求下面向异质费用的云资源调度算法》;刘扬 等;《万方》;20181029;全文 *
《面向云数据中心的虚拟机调度机制研究》;董健康;《中国博士论文全文数据库》;20150415;全文 *
云数据中心中负载均衡的虚拟机调度方法;栾志坤等;《计算机与现代化》;20170515(第05期);全文 *

Also Published As

Publication number Publication date
CN110196772A (zh) 2019-09-03

Similar Documents

Publication Publication Date Title
US11226848B2 (en) Systems, methods, and apparatuses for implementing a scheduler and workload manager with snapshot and resume functionality
US11243807B2 (en) Systems, methods, and apparatuses for implementing a scheduler and workload manager with workload re-execution functionality for bad execution runs
US11243818B2 (en) Systems, methods, and apparatuses for implementing a scheduler and workload manager that identifies and optimizes horizontally scalable workloads
CN106293919B (zh) 一种时间触发的嵌入式任务调度装置与方法
US20200026564A1 (en) Systems, methods, and apparatuses for implementing a scheduler and workload manager with dynamic workload termination based on cost-benefit analysis
US20200026579A1 (en) Systems, methods, and apparatuses for implementing a scheduler and workload manager that identifies and consumes global virtual resources
US9424077B2 (en) Throttle control on cloud-based computing tasks utilizing enqueue and dequeue counters
US11237866B2 (en) Systems, methods, and apparatuses for implementing a scheduler and workload manager with scheduling redundancy and site fault isolation
US9307048B2 (en) System and method for proactive task scheduling of a copy of outlier task in a computing environment
US10810043B2 (en) Systems, methods, and apparatuses for implementing a scheduler and workload manager with cyclical service level target (SLT) optimization
CN105279027B (zh) 一种虚拟机部署方法及装置
CN109347974B (zh) 提高在线服务质量和集群资源利用率的混合调度系统
US20040015973A1 (en) Resource reservation for large-scale job scheduling
US20090113434A1 (en) Apparatus, system and method for rapid resource scheduling in a compute farm
CN111381950A (zh) 一种面向边缘计算环境基于多副本的任务调度方法和系统
Silberstein et al. Gridbot: execution of bags of tasks in multiple grids
EP3861443B1 (en) Service-aware serverless cloud computing system
CN110262897B (zh) 一种基于负载预测的Hadoop计算任务初始分配方法
CN104407912A (zh) 一种虚拟机配置方法及装置
WO2024021489A1 (zh) 一种任务调度方法、装置及Kubernetes调度器
CN107885577A (zh) 一种基于任务主副本和重提交结合的云计算资源混合式容错调度方法
Sabyasachi et al. A resilient auction framework for deadline-aware jobs in cloud spot market
Zhang et al. Strategy-proof mechanism for online time-varying resource allocation with restart
WO2013119905A1 (en) Method for distributed caching and scheduling for shared nothing computer frameworks
CN110196772B (zh) 一种云数据中心环境下考虑容错机制的虚拟机调度方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant