CN110188002B - 一种支持可靠性保障的冷热操模式虚拟机数量评估方法 - Google Patents

一种支持可靠性保障的冷热操模式虚拟机数量评估方法 Download PDF

Info

Publication number
CN110188002B
CN110188002B CN201910466716.3A CN201910466716A CN110188002B CN 110188002 B CN110188002 B CN 110188002B CN 201910466716 A CN201910466716 A CN 201910466716A CN 110188002 B CN110188002 B CN 110188002B
Authority
CN
China
Prior art keywords
mode
reliability
cold
operation mode
hot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910466716.3A
Other languages
English (en)
Other versions
CN110188002A (zh
Inventor
郭军
刘文凤
张斌
刘晨
侯帅
侯凯
李薇
柳波
王嘉怡
王馨悦
张瀚铎
张娅杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201910466716.3A priority Critical patent/CN110188002B/zh
Priority to PCT/CN2019/090866 priority patent/WO2020237727A1/zh
Publication of CN110188002A publication Critical patent/CN110188002A/zh
Application granted granted Critical
Publication of CN110188002B publication Critical patent/CN110188002B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1479Generic software techniques for error detection or fault masking
    • G06F11/1482Generic software techniques for error detection or fault masking by means of middleware or OS functionality
    • G06F11/1484Generic software techniques for error detection or fault masking by means of middleware or OS functionality involving virtual machines
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明提出一种支持可靠性保障的冷热操模式虚拟机数量评估方法,包括:初始化参数;虚拟机的失效率排序;当前系统的可靠性与可靠性上限阈值比较,进行模式转换;前系统的可靠性与可靠性下限阈值比较,进行模式转换;单个操作模式虚拟机失效率与失效限定条件比较,进行模式转换;调用MDD算法重新评估系统的可靠性R1,系统可靠性R1与可靠性下限阈值比较,进行模式转换。为了使虚拟机冷热模式之间的数量分配达到平衡,本发明在操作模式虚拟机数量变化时,在满足可靠性要求R的基础上,调整冷热备份模式数量使系统满足可靠性要求,可靠性的高低通过平均响应时间和平均请求失败率来反映,实验证明本发明可以使得系统可靠性提高。

Description

一种支持可靠性保障的冷热操模式虚拟机数量评估方法
技术领域
本发明属于云计算领域,具体涉及一种支持可靠性保障的冷热操模式虚拟机数量评估方法。
背景技术
云计算服务于庞大的用户群体,随着云计算技术的发展,云系统可靠性问题备受人们关注。可靠性是系统正常运作的根本保障。在实际应用中,各种类型的云服务系统都不可避免的会出现各种类型的失效情况。但为了不影响用户的正常使用,系统仍需保持正常运行,因此云系统可靠性保障问题变得尤为重要。用冗余技术可以提高整个网络系统的可靠性。备份模式一般分为冷备份、暖备份和热备份三种模式。
由于静态的混合备用机制无法适应动态变化的服务并发量和服务失效率的运行场景,故必须采用动态优化策略,但由于根据当前的服务并发量对操作模式虚拟机的数量进行调整,会导致当前系统的可靠性发生变化,因此,在确定操作模式虚拟机的数量以后,根据用户对系统可靠性的要求建立支持可靠性保障的各模式集合调整算法调整冷热备份集合。
发明内容
基于以上技术问题,本发明提出一种支持可靠性保障的冷热操作模式虚拟机数量评估方法,为满足性能要求调整操作模式虚拟机,在满足可靠性要求R的基础上调整冷热备份模式数量。
一种支持可靠性保障的冷热操作模式虚拟机数量评估方法,具体步骤如下:
步骤1:初始化参数:输入当前操作模式虚拟机失效率矩阵M,当前系统可靠性Rcurrent,当前系统各模式虚拟机集合,其中所述各模式包括:冷模式、热模式、操作模式;
步骤2:计算每台操作模式虚拟机的失效率Mo[i],并从大到小进行排序得到M′,其中,Mo[i]为第i台操作模式虚拟机的失效率;
步骤3:若当前系统的可靠性Rcurrent大于可靠性上限阈值Rs,则转换一台热模式虚拟机进入冷模式,更新各模式中的集合元素,转到步骤11,输出冷热操模式虚拟机数量;若当前系统的可靠性Rcurrent小于等于上限阈值Rs,转到步骤4;
步骤4:判断当前系统的可靠性Rcurrent是否满足如下条件:Rs>Rcurrent>Rz其中,Rz为可靠性下限阈值,若满足则转到步骤5,若不满足,则转到步骤6;
步骤5:判断单个操作模式虚拟机失效率与失效限定条件大小p;
步骤5.1:若单个操作模式虚拟机失效率大于失效率限定条件p,则转到步骤5.2,若单个操作模式虚拟机失效率小于等于失效率限定条件p,则转到步骤5.3;
步骤5.2:若存在有虚拟机在热模式状态,则从热模式转到操作模式,若存在虚拟机在操作模式,则从操作模式转换到冷模式,更新各模式中的集合元素;
步骤5.3:判断是否遍历完所有的操作模式虚拟机,若已经遍历完所有操作模式虚拟机,则转到步骤11,输出冷热操模式虚拟机数量;若没有遍历完所有操作模式虚拟机,则遍历下一台操作模式虚拟机,转到步骤5.1;
步骤6:保存当前集合,即VM′o←VMcuro,VM′h←VMcurh,VM′c←VMcurc,其中VMcuro为当前系统操作模式集合,VM′o为保存集合后当前系统操作模式集合,VM′h为保存集合后当前系统热模式集合,VM′c为保存集合后当前系统冷模式集合;
步骤7:将一台热模式虚拟机添加到操作模式中,一台失效率最高的操作模式虚拟机添加到冷模式中;
步骤8:调用MDD算法重新评估系统的可靠性R1,判断系统可靠性R1是否大于可靠性下限阈值Rz;若系统可靠性大于可靠性下限阈值Rz,则更新各模式中的集合元素,转到步骤11,输出冷热操模式虚拟机数量;若系统可靠性小于等于可靠性下限阈值Rz,则转到步骤9;
步骤9:判断所有的操作模式是否转换完,若所有的操作模式虚拟机没有转换完,则转到步骤7;若所有的操作模式虚拟机转换完,则将一台冷模式添加到热模式集合中,更新各模式中的集合元素,转到步骤10;
步骤10:判断冷模式虚拟机是否全部转换为热模式,若冷模式虚拟机没有全部转换为热模式,则遍历下一台虚拟机转到步骤6,若冷模式虚拟机全部转换为热模式,则转到步骤11;
步骤11:输出冷热操模式虚拟机数量;
有益技术效果:
本发明采用支持可靠性保障的冷热操作模式虚拟机数量评估方法,由于在系统运行中,热模式转移到操作模式时间可以忽略,但是冷模式到热模式替换时间较长不可忽略。所以当我们分配给热备用模式较多的虚拟机时,可靠性提高了但能耗增加,当热模式分配的数量过少时,在很短的时间内如果有多台虚拟机发生失效,但是因为没有足够的热备用虚拟机去替换,而是要从冷备用的虚拟机去替换,这样就会严重影响系统的正常运行,因为冷模式到操作模式要花费大量的时间,很有可能导致系统崩溃。为了使虚拟机冷热模式之间的数量分配达到平衡,本发明在操作模式虚拟机数量变化时,在满足可靠性要求R的基础上,调整冷热备份模式数量使系统满足可靠性要求,可靠性的高低通过平均响应时间和平均请求失败率来反映,可靠性越高,则平均响应时间越低,平均请求失败率越低。
附图说明
图1为本发明实施例的一种支持可靠性保障的冷热操模式虚拟机数量评估方法流程图;
图2为本发明实施例的三种方法的平均响应时间。
图3为本发明实施例的三种方法的平均请求失败率。
具体实施方式
下面结合附图和具体实施实例对发明做进一步说明,本发明提出一种支持可靠性保障的冷热操模式虚拟机数量评估方法,如图1所示,具体步骤如下:
步骤1:初始化参数:输入当前操作模式虚拟机失效率矩阵M,当前系统可靠性Rcurrent,当前系统各模式虚拟机集合,其中所述各模式包括:冷模式、热模式、操作模式;
当前系统操作模式数量为k,热模式虚拟机个数为m1;OM虚拟机k在下一时刻的失效率矩阵为Mo[k];当前系统操作模式集合为VMcuro={VM1,VM2,…,VMk};当前系统热模式集合为VMcurh={VMc1,VMc2,...,VMcm1},VMcurc={VMc1,VMc2,...,VMci1}为冷模式集合,当前系统可靠性Rcurrent
步骤2:计算每台操作模式虚拟机的失效率Mo[i],并从大到小进行排序得到M′,其中,Mo[i]为第i台操作模式虚拟机的失效率;
步骤3:若当前系统的可靠性Rcurrent大于可靠性上限阈值Rs,则转换一台热模式虚拟机进入冷模式,更新各模式中的集合元素,转到步骤11,输出冷热操模式虚拟机数量;若当前系统的可靠性Rcurrent小于等于上限阈值Rs,转到步骤4;
步骤4:判断当前系统的可靠性Rcurrent是否满足如下条件:Rs>Rcurrent>Rz其中,Rz为可靠性下限阈值,若满足则转到步骤5,若不满足,则转到步骤6;
步骤5:判断单个操作模式虚拟机失效率与失效限定条件大小p;
步骤5.1:若单个操作模式虚拟机失效率大于失效率限定条件p,则转到步骤5.2,若单个操作模式虚拟机失效率小于等于失效率限定条件p,则转到步骤5.3;
步骤5.2:若存在有虚拟机在热模式状态,则从热模式转到操作模式,若存在虚拟机在操作模式,则从操作模式转换到冷模式,更新各模式中的集合元素;
步骤5.3:判断是否遍历完所有的操作模式虚拟机,若已经遍历完所有操作模式虚拟机,则转到步骤11,输出冷热操模式虚拟机数量;若没有遍历完所有操作模式虚拟机,则遍历下一台操作模式虚拟机,转到步骤5.1;
步骤6:保存当前集合,即VM′o←VMcuro,VM′h←VMcurh,VM′c←VMcurc,其中VMcuro为当前系统操作模式集合,VM′o为保存集合后当前系统操作模式集合,VM′h为保存集合后当前系统热模式集合,VM′c为保存集合后当前系统冷模式集合;
步骤7:将一台热模式虚拟机添加到操作模式中,一台失效率最高的操作模式虚拟机添加到冷模式中;
步骤8:调用MDD算法(多值决策图算法)重新评估系统的可靠性R1,判断系统可靠性是否大于可靠性下限阈值Rz;若系统可靠性大于可靠性下限阈值Rz,则更新各模式中的集合元素,转到步骤11,输出冷热操模式虚拟机数量;若系统可靠性小于等于可靠性下限阈值Rz,则转到步骤9;
步骤9:判断所有的操作模式是否转换完,若所有的操作模式虚拟机没有转换完,则转到步骤7;若所有的操作模式虚拟机转换完,则将一台冷模式添加到热模式集合中,更新各模式中的集合元素,转到步骤10;
步骤10:判断冷模式虚拟机是否全部转换为热模式,若冷模式虚拟机没有全部转换为热模式,则遍历下一台虚拟机转到步骤6,若冷模式虚拟机全部转换为热模式,则转到步骤11;
步骤11:输出冷热操模式虚拟机数量。
实验说明;
为了使虚拟机冷热模式之间的数量分配达到平衡,本发明在操作模式虚拟机数量变化时,在满足可靠性要求R的基础上,调整冷热备份模式数量使系统满足可靠性要求,可靠性的高低通过平均响应时间和平均请求失败率来反映,可靠性越高,则平均响应时间越低,平均请求失败率越低。如图2与图3所示,对照方法一为系统全部都是操作模式的平均响应时间,对照方法二为传统备份模式的平均响应时间,本文方法即本发明方法的平均响应时间;从图2中可以看出,本发明所用的平均响应时间最低,说明系统最可靠;如图3所示,对照方法一为系统全部都是操作模式的平均请求失败率,对照方法二为传统备份模式的平均请求失败率,本文方法即本发明方法的平均请求失败率;从图3中可以看出,本发明所用的平均请求失败率最低,说明系统最可靠。

Claims (2)

1.一种支持可靠性保障的冷热操模式虚拟机数量评估方法,其特征在于,具体步骤如下:
步骤1:初始化参数:输入当前操作模式虚拟机失效率矩阵M,当前系统可靠性
Figure DEST_PATH_IMAGE001
,当前系统各模式虚拟机集合;
步骤2:计算每台操作模式虚拟机的失效率
Figure 84007DEST_PATH_IMAGE002
,并从大到小进行排序得到
Figure 67006DEST_PATH_IMAGE003
,其中,
Figure 931057DEST_PATH_IMAGE004
为第i台操作模式虚拟机的失效率;
步骤3:若当前系统的可靠性
Figure 948692DEST_PATH_IMAGE001
大于可靠性上限阈值
Figure 239996DEST_PATH_IMAGE005
,则转换一台热模式虚拟机进入冷模式,更新各模式中的集合元素,转到步骤11,输出冷热操模式虚拟机数量;若当前系统的可靠性
Figure 710291DEST_PATH_IMAGE001
小于等于上限阈值,转到步骤4;
步骤4:判断当前系统的可靠性
Figure 876568DEST_PATH_IMAGE001
是否满足如下条件:
Figure 748709DEST_PATH_IMAGE006
其中,
Figure 945336DEST_PATH_IMAGE007
为可靠性下限阈值,若满足则转到步骤5,若不满足,则转到步骤6;
步骤5:判断单个操作模式虚拟机失效率与失效限定条件
Figure 168506DEST_PATH_IMAGE008
的大小关系;
步骤5.1:若单个操作模式虚拟机失效率大于失效率限定条件
Figure 108781DEST_PATH_IMAGE008
,则转到步骤5.2,若单个操作模式虚拟机失效率小于等于失效率限定条件
Figure 101007DEST_PATH_IMAGE008
,则转到步骤5.3;
步骤5.2:若存在有虚拟机在热模式状态,则从热模式转到操作模式,若存在虚拟机在操作模式,则从操作模式转换到冷模式,更新各模式中的集合元素;
步骤5.3:判断是否遍历完所有的操作模式虚拟机,若已经遍历完所有操作模式虚拟机,则转到步骤11,输出冷热操模式虚拟机数量;若没有遍历完所有操作模式虚拟机,则遍历下一台操作模式虚拟机,转到步骤5.1;
步骤6:保存当前集合,即
Figure 498228DEST_PATH_IMAGE009
,其中
Figure 943116DEST_PATH_IMAGE010
为当前系统操作模式集合,
Figure 421502DEST_PATH_IMAGE011
为保存集合后当前系统操作模式集合,
Figure 533815DEST_PATH_IMAGE012
为保存集合后当前系统热模式集合,
Figure 337823DEST_PATH_IMAGE013
为保存集合后当前系统冷模式集合;
Figure 270006DEST_PATH_IMAGE014
为当前系统热模式集合;
Figure 50618DEST_PATH_IMAGE015
为冷模式集合;
步骤7:将一台热模式虚拟机添加到操作模式中,一台失效率最高的操作模式虚拟机添加到冷模式中;
步骤8:调用多值决策图算法重新评估系统的可靠性R1,判断系统可靠性是否大于可靠性下限阈值
Figure 17437DEST_PATH_IMAGE016
;若系统可靠性大于可靠性下限阈值
Figure DEST_PATH_IMAGE017
,则更新各模式中的集合元素,转到步骤11,输出冷热操模式虚拟机数量;若系统可靠性小于等于可靠性下限阈值
Figure 461188DEST_PATH_IMAGE018
,则转到步骤9;
步骤9:判断所有的操作模式是否转换完,若所有的操作模式虚拟机没有转换完,则转到步骤7;若所有的操作模式虚拟机转换完,则将一台冷模式虚拟机添加到热模式集合中,更新各模式中的集合元素,转到步骤10;
步骤10:判断冷模式虚拟机是否全部转换为热模式,若冷模式虚拟机没有全部转换为热模式,则遍历下一台虚拟机并转到步骤6,若冷模式虚拟机全部转换为热模式,则转到步骤11;
步骤11:输出冷热操模式虚拟机数量。
2.根据权利要求1所述支持可靠性保障的冷热操模式虚拟机数量评估方法,其特征在于,所述各模式包括:冷模式、热模式、操作模式。
CN201910466716.3A 2019-05-31 2019-05-31 一种支持可靠性保障的冷热操模式虚拟机数量评估方法 Active CN110188002B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910466716.3A CN110188002B (zh) 2019-05-31 2019-05-31 一种支持可靠性保障的冷热操模式虚拟机数量评估方法
PCT/CN2019/090866 WO2020237727A1 (zh) 2019-05-31 2019-06-12 一种支持可靠性保障的冷热操模式虚拟机数量评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910466716.3A CN110188002B (zh) 2019-05-31 2019-05-31 一种支持可靠性保障的冷热操模式虚拟机数量评估方法

Publications (2)

Publication Number Publication Date
CN110188002A CN110188002A (zh) 2019-08-30
CN110188002B true CN110188002B (zh) 2022-08-30

Family

ID=67719195

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910466716.3A Active CN110188002B (zh) 2019-05-31 2019-05-31 一种支持可靠性保障的冷热操模式虚拟机数量评估方法

Country Status (2)

Country Link
CN (1) CN110188002B (zh)
WO (1) WO2020237727A1 (zh)

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9092250B1 (en) * 2006-10-27 2015-07-28 Hewlett-Packard Development Company, L.P. Selecting one of plural layouts of virtual machines on physical machines
US7904540B2 (en) * 2009-03-24 2011-03-08 International Business Machines Corporation System and method for deploying virtual machines in a computing environment
CN103200020B (zh) * 2012-01-04 2016-06-01 中兴通讯股份有限公司 一种资源部署方法和系统
CN103810020B (zh) * 2014-02-14 2017-08-29 华为技术有限公司 虚拟机弹性伸缩方法及装置
CN105677440A (zh) * 2014-11-18 2016-06-15 姚秋丽 一种虚拟机自动迁移系统
CN106020967B (zh) * 2016-05-03 2019-04-12 华中科技大学 一种混合式云资源自动扩容方法
CN108139925B (zh) * 2016-05-31 2022-06-03 安华高科技股份有限公司 虚拟机的高可用性
US20190266534A1 (en) * 2016-07-20 2019-08-29 Worldline Multi-criteria adaptive scheduling method for a market-oriented hybrid cloud infrastructure
CN106250251B (zh) * 2016-07-21 2018-12-21 北京航空航天大学 考虑共因和虚拟机故障迁移的云计算系统可靠性建模方法
JP2018097684A (ja) * 2016-12-14 2018-06-21 富士通株式会社 制御装置及び制御方法
US10387686B2 (en) * 2017-07-27 2019-08-20 International Business Machines Corporation Hardware based isolation for secure execution of virtual machines

Also Published As

Publication number Publication date
CN110188002A (zh) 2019-08-30
WO2020237727A1 (zh) 2020-12-03

Similar Documents

Publication Publication Date Title
CN106411770B (zh) 一种基于sdn架构的数据中心网络节能路由算法
CN109324875A (zh) 一种基于强化学习的数据中心服务器功耗管理与优化方法
CN113490254B (zh) 一种基于联邦学习双向gru资源需求预测的vnf迁移方法
US20220417156A1 (en) Network burst load evacuation method for edge servers
CN109901932B (zh) 一种基于虚拟机的服务器整合方法
WO2020220436A1 (zh) 面向不同老化场景的虚拟机工作队列和冗余队列更新方法
CN108196935A (zh) 一种面向云计算的虚拟机节能迁移方法
Supreeth et al. Hybrid genetic algorithm and modified-particle swarm optimization algorithm (GA-MPSO) for predicting scheduling virtual machines in educational cloud platforms
CN104754063B (zh) 本地云计算资源调度方法
CN114884895A (zh) 一种基于深度强化学习的智能流量调度方法
CN105430049B (zh) 一种基于dcn的虚拟流媒体集群协同迁移方法
CN104821906A (zh) 一种高效节能虚拟网络节点映射模型及算法
CN110188002B (zh) 一种支持可靠性保障的冷热操模式虚拟机数量评估方法
CN115022926A (zh) 一种基于资源均衡度的多目标优化容器迁移方法
CN107479949A (zh) 低能耗云计算任务调度方法
CN108170522B (zh) 一种基于动态阈值的云计算虚拟机迁移控制方法
CN105393518B (zh) 分布式缓存控制方法及装置
CN108073449B (zh) 一种虚拟机动态放置方法
CN104468379B (zh) 基于最短逻辑距离的虚拟Hadoop集群节点选择方法及装置
CN113296893B (zh) 一种基于混合正弦余弦粒子群优化算法的云平台低资源损耗虚拟机放置方法
CN108123893A (zh) 一种实时虚拟机迁移的多目标带宽分配方法
Li et al. SLA‐Aware and Energy‐Efficient VM Consolidation in Cloud Data Centers Using Host State 3rd‐Order Markov Chain Model
CN110647381B (zh) 一种虚拟机资源均衡和部署优化方法
CN112379966A (zh) 一种云数据中心虚拟机实时整合方法及系统
Zhang et al. A virtual network embedding algorithm based on RBF neural network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20190830

Assignee: Shenyang Zhizhi Technology Co.,Ltd.

Assignor: Northeastern University

Contract record no.: X2023210000209

Denomination of invention: A method for evaluating the number of virtual machines in cold and hot operation modes that support reliability assurance

Granted publication date: 20220830

License type: Common License

Record date: 20231127

EE01 Entry into force of recordation of patent licensing contract