CN106250251A - 考虑共因和虚拟机故障迁移的云计算系统可靠性建模方法 - Google Patents

考虑共因和虚拟机故障迁移的云计算系统可靠性建模方法 Download PDF

Info

Publication number
CN106250251A
CN106250251A CN201610578944.6A CN201610578944A CN106250251A CN 106250251 A CN106250251 A CN 106250251A CN 201610578944 A CN201610578944 A CN 201610578944A CN 106250251 A CN106250251 A CN 106250251A
Authority
CN
China
Prior art keywords
cloud computing
computing system
state
virtual machines
migration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610578944.6A
Other languages
English (en)
Other versions
CN106250251B (zh
Inventor
李瑞莹
李琼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201610578944.6A priority Critical patent/CN106250251B/zh
Publication of CN106250251A publication Critical patent/CN106250251A/zh
Application granted granted Critical
Publication of CN106250251B publication Critical patent/CN106250251B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/008Reliability or availability analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45591Monitoring or debugging support

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明公布了一种考虑云计算共因故障和虚拟机故障迁移的可靠性建模方法,属于网络可靠性技术领域。本方法包括:建立云计算系统并进行资源分配;对云计算系统进行状态空间划分,并计算各状态存在概率;确定云计算系统可靠性建模方式;正常工作的虚拟机数量满足需求的概率计算;分状态计算各状态的迁移失败概率;计算给定需求下考虑共因和虚拟机故障迁移的云计算系统可靠度。本发明方法考虑了云计算系统中由服务器故障引起的多个虚拟机共因故障和虚拟机迁移的容错策略,基于状态空间模型,解决了其他模型对这种共因故障和虚拟机故障迁移考虑不周的问题;并对状态空间进行化简,提高了建模效率。

Description

考虑共因和虚拟机故障迁移的云计算系统可靠性建模方法
技术领域
本发明属于网络可靠性技术领域,具体涉及一种考虑云计算共因故障和虚拟机故障迁移的可靠性建模方法。
背景技术
云计算作为一种新的计算模型,由于其高可用性和高可扩展性等优点,已经得到广泛应用。然而,云计算系统故障频发也让人们关注其可靠性问题。虚拟化是云计算系统的关键特征,其通过在物理服务器上创建多个虚拟机(VM)实现,实现了云计算基础设施的共享、提高了资源利用率,由于服务器故障会造成运行在其中的多个虚拟机共同故障,因此,云计算系统的可靠性建模需要考虑共因故障。同时,为了提高系统的可用性,使系统运行过程中有故障发生的情况下仍能保证不间断的服务,云计算系统使用了虚拟机故障迁移技术,即当源主机上的虚拟机发生故障时,通过虚拟机迁移技术将运行在其中的任务迁移到其他正常的目的主机继续执行。虚拟机迁移作为云计算系统特有的一种容错方式,通过故障后任务的迁移实现将故障影响最小化,而虚拟机的迁移又存在迁移失败的可能,成为云计算系统的可靠性建模的难点,但鲜有文献针对虚拟机迁移对云计算系统可靠性的影响进行研究。
有一些学者对云计算系统的可靠性建模进行了研究。在云计算基础设施层的可靠性方面,Qiu等(参考文献[1]:Qiu X,Dai Y,Xiang Y,et al.A Hierarchical CorrelationModel for Evaluating Reliability,Performance,and Power Consumption of a CloudService[J].IEEE Transactions on Systems,Man,and Cybernetics:Systems,2016,46(3):401-412.)考虑了服务器故障引起的虚拟机共因故障,其可靠性定义为至少一个虚拟机能提供服务的概率,然而事实上,要提供可靠的云服务,需要一定数量的服务器/虚拟机,同时,在其可靠性建模中没有云计算的容错特征。在云计算服务可靠性方面,谭峰(参考文献[2]:谭峰.云计算可靠性评估与任务调度方法研究[D].电子科技大学,2012.)对云服务可靠性即云计算系统对用户请求能否在规定时间内给出响应的概率进行建模,考虑了云计算系统中计算节点和通信链路采用容错机制带来的影响,建立了云服务可靠性模型,然而其没有考虑云计算系统的虚拟化特征,也没有针对具体的容错方法进行建模。
发明内容
本发明的目的是为了解决云计算的可靠性建模中对虚拟机故障迁移考虑不周的问题,在考虑共因故障的云计算系统可靠性模型的基础上,针对虚拟机迁移的容错策略,实现给定需求下考虑共因和虚拟机故障迁移的云计算系统可靠性建模。
本发明提供的考虑共因和虚拟机故障迁移的云计算系统可靠性建模方法,适用于如下情况:
(1)服务器被划分为多个虚拟机,划分策略为一个核对应一个虚拟机,即服务器的核与虚拟机之间为一对一映射关系。
(2)服务器的故障会引起其上所有虚拟机的故障,服务器和不同服务器的虚拟机之间故障独立。
(3)使用以负载均衡为目标的云计算资源分配策略,即在资源分配时将队列中等待执行的任务优先分配给负载较轻的服务器节点。
(4)当执行任务的虚拟机节点故障时,将运行在其中的任务迁移到其他正常服务器上(包括服务器正常和其上运行的虚拟机全部正常)继续运行;如服务器上已有虚拟机出现故障,则不会选择迁移到该服务器上的其他虚拟机。
(5)迁移策略如下:将故障虚拟机迁移到其他服务器上的虚拟机。每个虚拟机迁移次数不限,直到没有剩余空间供继续迁移。
本发明的考虑共因和虚拟机故障迁移的云计算系统可靠性建模方法,实现步骤为:
步骤一,建立云计算系统,使用以负载均衡为目标的云计算资源分配策略;
设云计算系统中包含n类服务器,第i类服务器的个数为mi个且每个服务器含有pi个核,每个核对应一个虚拟机;其中,第i类服务器故障服从失效率为λS(i)的指数分布,服务器之间故障独立,第i类服务器下虚拟机的故障服从失效率为λV(i)的指数分布,n、mi、pi均为正整数,i=1,2,…,n。假设完成任务需要z个虚拟机,使用上述分配策略将任务分配给云计算系统中的z个虚拟机。
步骤二:对云计算系统进行状态空间划分,并计算各状态存在概率;
设Pα(i,q)表示第i类单台服务器第q种状态的存在概率,单台服务器状态划分为三类:单台服务器中虚拟机全部不可用、单台服务器中虚拟机全部可用、单台服务器中有j个可用虚拟机,1≤j≤pi-1;
第i类服务器的状态由mi台服务器的状态组合而成,设第i类服务器在第l种状态组合对应的存在概率为Pi,l
在分别得到n类服务器的状态组合及其存在概率后,枚举整个云计算系统的状态,将不同类服务器状态对应的存在概率相乘,得到云计算系统在n类服务器状态枚举后的状态组合存在概率;设云计算系统的第k种状态组合的存在概率为P(k);
步骤三:确定云计算系统可靠性建模方式;
云计算系统在给定工作时间内可靠需要满足两个条件:(1)正常工作的虚拟机数目不小于z;(2)执行工作的虚拟机若出现故障,能成功迁移;
云计算系统可靠度R=Pr{正常工作的虚拟机数量满足需求}-Pr{正常虚拟机数量满足需求但需要迁移且无法迁移成功}。
步骤四:确定正常工作的虚拟机数量满足需求的概率RCCF
其中,Ak为判别变量,
步骤五:计算云计算系统中正常虚拟机数目大于等于z、需要迁移且迁移失败的概率;
对于正常虚拟机数目大于等于z的状态,设状态k中需要迁移的虚拟机数目为Xk,供迁移的位置数为Yk;Xk的取值范围为则通过迁移不能满足使用要求的概率
其中,f为虚拟机迁移成功概率;
步骤六:计算给定需求下考虑共因和虚拟机故障迁移的云计算系统可靠度R;
R = R C C F - Σ k = 1 M P ( k ) Q ( k )
其中,M为云计算系统对应的状态空间模型中正常工作的虚拟机数目满足要求,但分配到任务的虚拟机存在故障而需要迁移的状态数目;计算如下:
M = Σ j = 0 Σ i p i m i - z C Σ i p i m i j - 2 Σ i p i m i - z .
本发明的优点与积极效果在于:
(1)本发明综合考虑云计算系统中由服务器故障引起的多个虚拟机共因故障和虚拟机迁移的容错策略,这类共因故障和虚拟机故障迁移是云计算特有的方法,成为云计算系统可靠性建模的难点,本发明基于状态空间模型,解决了其他模型对这种共因故障和虚拟机故障迁移考虑不周的问题;
(2)本发明方法对状态空间进行了化简,提高了建模效率。
附图说明
图1是本发明的考虑共因故障和虚拟机故障迁移的云计算系统可靠性建模方法的流程示意图;
图2是云计算系统结构示意图;
图3本发明实施例中的云计算系统组成结构图。
具体实施方式
下面将结合附图和实施例对本发明作进一步的详细说明。
本发明提出一种考虑共因故障和虚拟机故障迁移的云计算系统可靠性建模方法,流程如图1所示,包括如下步骤:
步骤一:建立云计算系统并进行资源分配。
建立云计算系统,如图2所示,云计算系统的基础设施包含n类服务器,第i类服务器的个数为mi个且每个服务器上含有pi个核,每个核对应一个虚拟机,其中第i类服务器故障服从失效率为λS(i)的指数分布,服务器之间故障独立;第i类服务器下虚拟机的故障服从失效率为λV(i)的指数分布。n、mi、pi均为正整数,i=1,2,…,n。服务器的故障会引起其上所有虚拟机的故障,服务器和不同服务器的虚拟机之间故障独立。
云计算操作系统(Cloud OS)是云计算系统的核心,接收到来自用户的服务请求后将其转化为多个子任务,通过虚拟机分配器分配到各个虚拟机执行。本发明采用以负载均衡为目标的云计算资源分配策略,即在资源分配时将队列中等待执行的任务优先分配给负载较轻的服务器节点。假设完成任务需要z个虚拟机,使用上述分配策略将任务分配给云计算系统中的z个虚拟机。
步骤二:对云计算系统通过状态空间模型划分为多个状态,并计算各状态存在概率。
每个虚拟机有故障和正常两种状态,分别用1和0表示。对于单台服务器,虚拟机数目为pi,因此每台服务器包含种状态,每种状态由pi个0或1组成,枚举出具体状态空间如下:
采用故障树法计算同类单台服务器状态组合的存在概率,可参考文献[3](李琼,李瑞莹,黄宁.考虑共因故障的云计算系统可靠性建模方法.中国专利申请号201610053266.1)来计算,令Pα(i,q)表示第i类单台服务器第q种状态的存在概率,将单台服务器状态划分为三类,分别为:
(1)单台服务器中虚拟机全部不可用,存在概率其中中间参数
(2)单台服务器中虚拟机全部可用,存在概率
(3)单台服务器中可用虚拟机数目为j(1≤j≤pi-1),存在的概率
P α ( i , q ) = R S ( i ) [ R V ( i ) ] j [ 1 - R V ( i ) ] p i - j .
得到单台服务器的状态组合及各状态存在概率后,第i类服务器的状态由mi台服务器的状态组合而成,第i类服务器状态总数目为由于服务器间故障相互独立,可以相乘得到第i类服务器状态对应的概率,假设第i类服务器的第l种状态组合中,单台服务器的种状态存在的个数分别为则第i类服务器在第l种状态组合对应的存在概率为Pa(i,q)为单台服务器的第q种状态的存在概率,此处l为整数,取值范围为
分别得到n类服务器的状态组合及其存在概率后,可以枚举整个云计算系统的状态,即n类服务器的不同状态,状态总数目为考虑不同服务器间状态独立性,可将不同类服务器状态对应的存在概率相乘,得到云计算系统在n类服务器状态枚举后的状态组合存在概率。当第i类服务器的状态取ωi时,云计算系统的第k种状态组合的存在概率此处k为整数,取值范围为云计算系统的第k种状态组合就是云计算系统的状态k,下面在描述中出现的P(k)是Pk的另一种表示方式。
步骤三:确定云计算系统可靠性建模方式。
要使云计算系统在给定工作时间内可靠需要满足两个条件:(1)系统中正常工作的虚拟机数目不小于z。(2)执行工作的虚拟机若出现故障,则要能成功迁移。
考虑共因和虚拟机故障迁移的云计算系统可靠性通过如下方式计算:云计算系统可靠度R=Pr{正常工作的虚拟机数量满足需求}-Pr{正常虚拟机数量满足需求但需要迁移且无法迁移成功}。Pr表示概率计算。
步骤四:正常工作的虚拟机数量满足需求的概率RCCF计算。
步骤三中“正常工作的虚拟机数量满足需求的概率”就是仅考虑共因故障的云计算系统可靠度,可参考文献[3]计算,即所有正常工作的虚拟机满足需求的状态概率总和,即
其中Pk为步骤二中计算得的云计算系统状态k的存在概率;Ak为判别变量,
步骤五:分状态计算各状态的迁移失败概率。
系统执行任务过程中,如果正在承担任务的虚拟机或者服务器出现故障,为了减少故障对云计算系统的影响,对无法正常工作的虚拟机进行迁移,将其执行的任务迁移到其他服务器的虚拟机上继续执行。虚拟机的迁移存在失败的可能性,假设迁移成功概率为f。
本发明在应用时,当执行任务的虚拟机节点故障时,将运行在其中的任务迁移到其他正常服务器上继续运行,所迁移到的服务器正常、其上运行的虚拟机也全部正常;如服务器上已有虚拟机出现故障,则不会选择迁移到该服务器上的其他虚拟机。在将故障虚拟机迁移到其他正常服务器上的虚拟机时,每个虚拟机迁移次数不限,直到没有剩余空间供继续迁移。
这里计算云计算系统中正常虚拟机数目大于等于z、需要迁移且迁移失败的概率。注意到对于那些正常虚拟机数目大于等于z的状态,但其执行任务的虚拟机都正常,不需要迁移。这类状态的数目为:因此需要通过迁移确定能否满足使用需求的状态数量是:
这样化简效率
下面计算云计算系统各状态的迁移失败概率。
对于正常虚拟机数目大于等于z的状态,将状态k中执行任务的虚拟机中有故障的VM数目记为Xk,其取值范围为将状态k确定可供迁移的位置数记为Yk。Xk和Yk由具体的状态计算可得。
(1)当需要迁移的VM数为1时,这类状态有种;则其通过迁移不能满足使用要求的概率计算为:
(2)当需要迁移的VM数为2时,这种情况有种。当Yk<2时可供迁移的位置数不足,肯定不会迁移成功。那么,对第k种状态,其通过迁移不能满足使用要求的概率计算为:
可化简为:
Q ( k ) = ( 1 - f ) Y k + ( 1 - f ) Y k - 1 &lsqb; 1 - ( 1 - f ) Y k &rsqb; , Y k &GreaterEqual; 2 1 , Y k < 2 .
(3)当需要迁移的VM数为3时,这种状态有种。当Yk<3时可供迁移的位置数不足,肯定不会迁移成功。那么,对第k种状态,其通过迁移不能满足使用要求的概率计算为:
Q ( k ) = ( 1 - f ) Y k + ( 1 - f ) Y k - 1 &lsqb; 1 - ( 1 - f ) Y k &rsqb; + ( 1 - f ) Y k - 2 &lsqb; 1 - ( 1 - f ) Y k - 1 &rsqb; &lsqb; 1 - ( 1 - f ) Y k &rsqb; , Y k &GreaterEqual; 3 1 , Y k < 3
(4)当需要迁移的VM数为Xk时,这种情况有种。
当Yk<Xk时,肯定不会迁移成功。那么,对第k种情况,其通过迁移不能满足使用要求的概率计算为:
Q ( k ) = ( 1 - f ) Y k + &Sigma; d = 1 X k - 1 ( 1 - f ) Y k - d &Pi; s = 1 d &lsqb; 1 - ( 1 - f ) Y k - ( s - 1 ) &rsqb; , Y k &GreaterEqual; X k 1 , Y k < X k .
其中,
步骤六:计算给定需求下考虑共因和虚拟机故障迁移的云计算系统可靠度。
综上所述,考虑共因和虚拟机故障迁移的云计算可靠度计算公式为:
R = R C C F - &Sigma; k = 1 M P ( k ) Q ( k )
其中,M为状态空间模型中正常工作的虚拟机数目满足要求,但分配到任务的虚拟机存在故障而需要迁移的状态数目;P(k)的计算参考见步骤二和参考文件[3]。RCCF表示考虑共因故障情况下,在给定工作时间t内云系统中正常工作的虚拟机数目大于等于z的概率,见步骤四。Q(k)表示状态k的迁移失败的概率,由步骤五可得。
实施例:云计算系统中包含两类服务器,第1类服务器为单核服务器,个数为2台,该类服务器故障服从λS(1)=0.00001/h的指数分布,虚拟机故障服从λV(1)=0.00005/h的指数分布;第2类服务器为双核服务器,个数为3台,该类服务器故障服从λS(2)=0.00002/h的指数分布,虚拟机故障服从λV(2)=0.00008/h的指数分布。其中服务器之间故障独立。确定工作时间T=1000h。给定需求量z为5。迁移成功概率f=0.8。
步骤一:建立云计算系统并进行资源分配;
以负载均衡为目标,将任务分配给云计算系统中5个服务器的第一个VM。
步骤二:对云计算系统进行状态空间划分,并计算各状态存在概率。
用1和0分别表示虚拟机的故障和正常状态,虚拟机的总数为8,因此状态数目为28=256,云计算系统的状态空间如下:
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 1
0 0 0 0 0 0 1 0
1 1 1 1 1 1 1 1
使用步骤二中的方法分别计算256种状态的存在概率P(k)。
步骤三:确定云计算系统可靠性建模方式。
考虑共因和虚拟机故障迁移的云计算系统可靠性通过如下方式计算:云计算系统可靠度R=Pr{正常工作的虚拟机数量满足需求的状态}-Pr{正常虚拟机数量满足要求但需要迁移且无法迁移成功}。
步骤四:正常工作的虚拟机数量满足需求的概率计算
“正常工作的虚拟机数量满足需求的概率”就是仅考虑共因故障的云计算系统可靠度,即
步骤五:计算云计算系统中各状态的迁移失败概率。
已知故障虚拟机的数目≥z且需要通过迁移确定能否满足使用需求的状态数量是:则化简效率
下面计算云计算系统各状态的迁移失败概率。
可知需迁移的故障VM数量Xk的取值范围为[1,min{5,3}],即[1,3]。
(1)当需要迁移的VM数为1时,这类状态有35个。其通过迁移不能满足使用要求的概率计算为:
其中Yk表示可供迁移的位置数,可由以下公式计算:
Yk=状态k中不执行任务的正常VM个数-状态k中故障VM所在服务器中正常VM个数。
(2)当需要迁移的VM数为2时,这种情况有40个。那么,对第k种状态,其通过迁移不能满足使用要求的概率计算为:
Q ( k ) = ( 1 - f ) Y k + ( 1 - f ) Y k - 1 &lsqb; 1 - ( 1 - f ) Y k &rsqb; , Y k &GreaterEqual; 2 1 , Y k < 2 .
(3)当需要迁移的VM数为3时,这种状态有10个。那么,对第k种状态,其通过迁移不能满足使用要求的概率计算为:
Q ( k ) = ( 1 - f ) Y k + ( 1 - f ) Y k - 1 &lsqb; 1 - ( 1 - f ) Y k &rsqb; + ( 1 - f ) Y k - 2 &lsqb; 1 - ( 1 - f ) Y k - 1 &rsqb; &lsqb; 1 - ( 1 - f ) Y k &rsqb; , Y k &GreaterEqual; 3 1 , Y k < 3 .
步骤六:计算给定需求下考虑共因和虚拟机故障迁移的云计算系统可靠度。
考虑共因和虚拟机故障迁移的云计算可靠度为:
R = R C C F - &Sigma; k = 1 M P ( k ) Q ( k )
代入考虑共因故障的云计算系统可靠度RCCF及各状态存在概率P(k),以及步骤五中计算的各状态迁移失败概率Q(k),可得R=0.949022。

Claims (1)

1.一种考虑共因和虚拟机故障迁移的云计算系统可靠性建模方法,其特征在于,实现步骤如下:
步骤一:建立云计算系统,使用以负载均衡为目标的云计算资源分配策略;
设云计算系统中包含n类服务器,第i类服务器的个数为mi个且每个服务器含有pi个核,每个核对应一个虚拟机;其中,第i类服务器故障服从失效率为λS(i)的指数分布,服务器之间故障独立,第i类服务器下虚拟机的故障服从失效率为λV(i)的指数分布,n、mi、pi均为正整数,i=1,2,…,n;设完成任务需要z个虚拟机,并以负载均衡为目标分配资源;
步骤二:对云计算系统进行状态空间划分,并计算各状态存在概率;
虚拟机的故障和正常两种状态,分别用1和0表示;设Pα(i,q)表示第i类单台服务器第q种状态的存在概率,单台服务器状态划分为三类:单台服务器中虚拟机全部不可用、单台服务器中虚拟机全部可用、单台服务器中有j个可用虚拟机,1≤j≤pi-1;
第i类服务器的状态由mi台服务器的状态组合而成,设第i类服务器在第l种状态组合对应的存在概率为Pi,l
在分别得到n类服务器的状态组合及其存在概率后,枚举整个云计算系统的状态,将不同类服务器状态对应的存在概率相乘,得到云计算系统在n类服务器状态枚举后的状态组合存在概率;设云计算系统状态k的存在概率为P(k),简写形式为Pk
步骤三:确定云计算系统可靠性建模方式;
云计算系统在给定工作时间内可靠需要满足两个条件:(1)正常工作的虚拟机数目不小于z;(2)执行工作的虚拟机若出现故障,能成功迁移;
云计算系统可靠度R=Pr{正常工作的虚拟机数量满足需求}-Pr{正常虚拟机数量满足需求但需要迁移且无法迁移成功};
步骤四:确定正常工作的虚拟机数量满足需求的概率RCCF
其中,Ak为判别变量,
步骤五:计算云计算系统中正常虚拟机数目大于等于z、需要迁移且迁移失败的概率;
对于正常虚拟机数目大于等于z的状态,设状态k中需要迁移的虚拟机数目为Xk,供迁移的位置数为Yk;Xk的取值范围为则通过迁移不能满足使用要求的概率
其中,f为虚拟机迁移成功概率;
步骤六:计算给定需求下考虑共因和虚拟机故障迁移的云计算系统可靠度R;
R = R C C F - &Sigma; k = 1 M P ( k ) Q ( k )
其中,M为云计算系统对应的状态空间模型中正常工作的虚拟机数目满足要求,但分配到任务的虚拟机存在故障而需要迁移的状态数目;
M = &Sigma; j = 0 &Sigma; i p i m i - z C &Sigma; i p i m i j - 2 &Sigma; i p i m i - z .
CN201610578944.6A 2016-07-21 2016-07-21 考虑共因和虚拟机故障迁移的云计算系统可靠性建模方法 Active CN106250251B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610578944.6A CN106250251B (zh) 2016-07-21 2016-07-21 考虑共因和虚拟机故障迁移的云计算系统可靠性建模方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610578944.6A CN106250251B (zh) 2016-07-21 2016-07-21 考虑共因和虚拟机故障迁移的云计算系统可靠性建模方法

Publications (2)

Publication Number Publication Date
CN106250251A true CN106250251A (zh) 2016-12-21
CN106250251B CN106250251B (zh) 2018-12-21

Family

ID=57603228

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610578944.6A Active CN106250251B (zh) 2016-07-21 2016-07-21 考虑共因和虚拟机故障迁移的云计算系统可靠性建模方法

Country Status (1)

Country Link
CN (1) CN106250251B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111708613A (zh) * 2020-08-18 2020-09-25 广东睿江云计算股份有限公司 一种修复vm虚拟机开机失败卡任务的方法及系统
WO2020237727A1 (zh) * 2019-05-31 2020-12-03 东北大学 一种支持可靠性保障的冷热操模式虚拟机数量评估方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103685542A (zh) * 2013-12-23 2014-03-26 重庆广播电视大学 云虚拟机迁移方法、装置和系统
US20150039764A1 (en) * 2013-07-31 2015-02-05 Anton Beloglazov System, Method and Computer Program Product for Energy-Efficient and Service Level Agreement (SLA)-Based Management of Data Centers for Cloud Computing
CN104780075A (zh) * 2015-03-13 2015-07-15 浪潮电子信息产业股份有限公司 一种云计算系统可用性评估方法
CN105740084A (zh) * 2016-01-27 2016-07-06 北京航空航天大学 考虑共因故障的云计算系统可靠性建模方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150039764A1 (en) * 2013-07-31 2015-02-05 Anton Beloglazov System, Method and Computer Program Product for Energy-Efficient and Service Level Agreement (SLA)-Based Management of Data Centers for Cloud Computing
CN103685542A (zh) * 2013-12-23 2014-03-26 重庆广播电视大学 云虚拟机迁移方法、装置和系统
CN104780075A (zh) * 2015-03-13 2015-07-15 浪潮电子信息产业股份有限公司 一种云计算系统可用性评估方法
CN105740084A (zh) * 2016-01-27 2016-07-06 北京航空航天大学 考虑共因故障的云计算系统可靠性建模方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
姜雅楠: "云计算环境下虚拟机实时迁移及负载均衡研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
韩辉: "基于Pi演算的虚拟机动态迁移建模及性能分析", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020237727A1 (zh) * 2019-05-31 2020-12-03 东北大学 一种支持可靠性保障的冷热操模式虚拟机数量评估方法
CN111708613A (zh) * 2020-08-18 2020-09-25 广东睿江云计算股份有限公司 一种修复vm虚拟机开机失败卡任务的方法及系统

Also Published As

Publication number Publication date
CN106250251B (zh) 2018-12-21

Similar Documents

Publication Publication Date Title
Marahatta et al. Energy-aware fault-tolerant dynamic task scheduling scheme for virtualized cloud data centers
Abd Latiff A checkpointed league championship algorithm-based cloud scheduling scheme with secure fault tolerance responsiveness
CN102346460B (zh) 一种基于事务的服务控制系统及其控制方法
Sotiriadis et al. SimIC: Designing a new inter-cloud simulation platform for integrating large-scale resource management
CN105740084A (zh) 考虑共因故障的云计算系统可靠性建模方法
CN107168782A (zh) 一种基于Spark与GPU的并行计算系统
US20240111586A1 (en) Multi-policy intelligent scheduling method and apparatus oriented to heterogeneous computing power
US20140156847A1 (en) Service Allocation in a Distributed Computing Platform
CN107168770B (zh) 一种低能耗的云数据中心工作流调度与资源供给方法
CN110308984B (zh) 一种用于处理地理分布式数据的跨集群计算系统
TWI786564B (zh) 任務調度方法和裝置、儲存媒體及計算機設備
Song et al. A load balancing scheme using federate migration based on virtual machines for cloud simulations
CN104243617A (zh) 一种异构集群中面向混合负载的任务调度方法及系统
CN103885811B (zh) 虚拟机系统全系统在线迁移的方法、系统与装置
CN115134371A (zh) 包含边缘网络算力资源的调度方法、系统、设备及介质
CN106201701A (zh) 一种带任务重复的工作流调度算法
Rouzaud-Cornabas A distributed and collaborative dynamic load balancer for virtual machine
CN111190691A (zh) 适用于虚拟机的自动迁移方法、系统、装置及存储介质
CN106095335A (zh) 一种电力大数据弹性云计算存储平台架构方法
CN112905297A (zh) 容器集群资源调度方法和装置
CN113255165A (zh) 一种基于动态任务分配的实验方案并行推演系统
CN106250251B (zh) 考虑共因和虚拟机故障迁移的云计算系统可靠性建模方法
Hu et al. Cloud model-based security-aware and fault-tolerant job scheduling for computing grid
WO2024022142A1 (zh) 资源使用方法和装置
Yan et al. Affinity-aware virtual cluster optimization for mapreduce applications

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant