CN117850965A - 一种基于auto converge的限速门限计算的虚拟机在线迁移优化方法 - Google Patents
一种基于auto converge的限速门限计算的虚拟机在线迁移优化方法 Download PDFInfo
- Publication number
- CN117850965A CN117850965A CN202311718397.3A CN202311718397A CN117850965A CN 117850965 A CN117850965 A CN 117850965A CN 202311718397 A CN202311718397 A CN 202311718397A CN 117850965 A CN117850965 A CN 117850965A
- Authority
- CN
- China
- Prior art keywords
- migration
- virtual machine
- rate
- speed limit
- limit threshold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005012 migration Effects 0.000 title claims abstract description 176
- 238000013508 migration Methods 0.000 title claims abstract description 175
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000004364 calculation method Methods 0.000 title claims abstract description 38
- 238000005457 optimization Methods 0.000 title claims abstract description 23
- 238000006243 chemical reaction Methods 0.000 title claims description 7
- 230000015654 memory Effects 0.000 claims abstract description 101
- 230000008569 process Effects 0.000 claims abstract description 19
- 230000007704 transition Effects 0.000 claims abstract description 16
- 238000012986 modification Methods 0.000 claims description 4
- 230000004048 modification Effects 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 claims description 3
- 238000012360 testing method Methods 0.000 description 14
- 230000000694 effects Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 238000011056 performance test Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000007334 memory performance Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000013509 system migration Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5077—Logical partitioning of resources; Management or configuration of virtualized resources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
- G06F2009/4557—Distribution of virtual machine instances; Migration and load balancing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及新兴信息技术‑云计算虚拟化技术领域,是一种基于auto converge的限速门限计算的虚拟机在线迁移优化方法,具体方法包括:通过基于auto converge的迁移收敛条件,建立限速门限计算公式;计算获取虚拟机限速门限值;实时获取虚拟机迁移拷贝速率和内存脏页产生的速率,比较迁移拷贝速率和内存脏页产生的速率,进行迁移状态的收敛判断;触发进行内存脏页速率的限速门限,对虚拟机进行限速,并对虚拟机在线热迁移流程进行优化。本发明可以省下多轮不必要的实际迁移动作,大大节省迁移时间、减少在迁移过程中对客户业务的影响程度、节省对系统带宽的占用、提高大压力下虚拟机在线迁移的成功率。
Description
技术领域
本发明涉及新兴信息技术-云计算虚拟化技术领域,是一种基于auto converge的限速门限计算的虚拟机在线迁移优化方法。
背景技术
在云计算的虚拟机化领域中,在线(热)迁移虚拟机是一个很重要的功能,是运维人员经常用到的一个功能。在云计算应用中,一台物理主机上可能承载着几个到几百个虚拟机,每个虚拟机对客户来说就是一台独立可用的电脑可以像使用普通PC一样使用。在一个物理主机上如果承载的虚拟机过多就会影响每个虚拟可分得的资源进而影响到虚拟机的性能,当云管理平台监控到这种状态就需要启动在线迁移将多余的虚拟机从负载高的物理主机迁移到负载小的物理主机上。另外当在一个物理主机上发现潜在故障并随时可能影响到客户业务时也需要启动在线迁移将虚拟机迁移到健康的物理主机上。虚拟机在线迁移能够保证在迁移的过程中客户虚拟机不需要关机,可以正常使用业务,只会在迁移完成前暂停预设的一段很短的时间(一般为几百毫秒),之后客户业务可以继续执行而不会被中断,客户几乎感知不到后台在进行虚拟机在线迁移。虚拟在线迁移技术是云计算应用中一个很重要的基本功能,一方面能够帮助运维人员进行有效地进行整个系统资源的调配,另一方面也是故障恢复和排障中不可或缺的一种手段。
在现有已公开的发明技术中,如申请公开号为CN115480867A的专利公开了一种热迁移耗时的预估方法、装置及计算机设备,包括:先获取目标虚拟机的初始脏页速率及迁移带宽,对该目标虚拟机的初始脏页内存进行第一阶段虚拟迭代,直至目标虚拟机的脏页速率小于指定阈值;再根据第一阶段虚拟迭代中最后一次迭代的脏页速率,确定稳定脏页速率;进而对目标虚拟机进行第二阶段虚拟迭代,直至该目标虚拟机的脏页内存小于脏页阈值;最后将第一虚拟迭代时间与第二虚拟迭代时间进行求和,确定该目标虚拟机的预计虚拟迁移总耗时。
上述专利通过一种不断迭代尝试的方式来找到可以完成迁移所需要的限速门限,在内存压力很大的情况下,会经过很多轮尝试迁移,而实际上这些迁移仅仅是为了找到合适的限速门限,所进行的耗时的内存迁移工作是非必要的,因为在没有找到合适限速门限之前,所进行的迁移尝试是不能达到迁移收敛的,对迁移进度本身而言实际是无意义的。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
本发明可以省下多轮不必要的实际迁移动作,大大节省迁移时间、减少在迁移过程中对客户业务的影响程度、节省对系统带宽的占用、提高大压力下虚拟机在线迁移的成功率以及能提前自动识别出当前系统资源无法支撑此压力虚拟机在线迁移成功的情况避免了迁移一直进行而不能成功的严重影响客户业务极端情况的出现。为了达到上述目的,本发明一种基于auto converge的限速门限计算的虚拟机在线迁移优化方法的技术方案包括如下步骤:
S1:通过基于auto converge的迁移收敛条件,建立限速门限计算公式;
S2:根据步骤S1,计算获取虚拟机限速门限值;
S3:实时获取虚拟机迁移拷贝速率和内存脏页产生的速率,比较迁移拷贝速率和内存脏页产生的速率,进行迁移状态的收敛判断;
S4:触发进行内存脏页速率的限速门限,对虚拟机进行限速,并对虚拟机在线热迁移流程进行优化。
具体地,S1中,限速门限计算公式的建立包括:
其中,A为迁移拷贝速率;S为内存脏页速率;
X为限速门限值;M为下一轮还需要传输的数据量;
N为最小数据量门限值;V为下一轮的内存脏页产生速率;
T为下一轮的时间周期。
具体地,所述下一轮还需要传输的数据量M包括:在下一轮的数据迁移阶段需要从源拷贝到目的的内存数据量,M的计算策略如下:
最小数据量门限值N包括:为了能够在下一轮迁移中达到迁移收敛状态必须完成的迁移拷贝的最小数据量,N的计算策略如下:
具体地,S2中,所述限速门限值包括:对虚拟机内存脏页产生速率的限速程度,为一个百分比值。比如限速门限为10,表示虚拟机将以90%(1-10/100)的CPU效率工作,此时内存脏页速率也会变成原来的90%,在auto converge中是通过限制VCPU的运行时间来达到限制虚拟机CPU执行效率从而到达降低客户虚拟机运行效率进而到达降低内存脏页产生速率的效果的。
具体地,S1中,所述迁移状态收敛判断包括:当迁移拷贝速率快于内存脏页产生的速率,且满足一定比例关系使得系统在完成一轮迁移后,可在预先设定的虚拟机暂停时间内即可将虚拟机在上一轮迁移过程中新产生的内存脏页一次性完成迁移。
具体地,所述迁移拷贝速率包括:热迁移虚拟机过程中,拷贝虚拟机内存的速率,即每秒钟可以从源虚拟机拷贝到目的虚拟机的内存的大小。在客户业务没有那么繁忙时产生的内存脏页速率没那么高或者迁移拷贝速率足够大时,热迁移在几轮迁移并暂停很短时间后是最终能够完成的。设想如果迁移拷贝的速率仅仅等于设置小于内存脏页产生速率,那么理论上讲热迁移将永远不能完成的,迁移拷贝的速率必须大于内存脏页速率到一定程度才能让迁移最终完成,而能保证热迁移能够最终完成的这种状态可称之为收敛状态。
具体地,所述内存脏页速率S包括:虚拟机在运行过程中单位时间内产生的新的内存脏页的大小,表征虚拟机内存被修改的频率以及虚拟机内业务的内存压力大小。
具体地,S4中,所述触发进行内存脏页速率的限速门限包括:
S411:根据限速门限公式计算提取U,其中U为迁移拷贝速率和内存脏页速率的百分比关系,限速门限公式为
S412:进行U的默认值判断,下一轮的数据迁移传输速率与默认值的乘积所得值必须大于等于内存脏页速率。
具体地,S4中,所述对虚拟机在线热迁移流程的优化包括如下具体步骤:
S421:根据所述限速门限计算公式计算出的门限值进行对应程度的虚拟机VCPU限速,将下一轮的内存脏页速率限制在满足收敛的速率值上;
S422:当下一轮迁移完成后并达到收敛的状态时,马上暂停虚拟机;
S423:在目的虚拟上恢复目的虚拟机的运行。
具体地,S421中,所述下一轮的内存脏页速率V的计算策略如下:
与现有技术相比,本发明的技术效果如下:
1、本发明通过限速门限计算公式根据当前系统实际的迁移带宽和客户业务压力情况计算出当前最合适的限速门限,让系统一开始就在合适的限速门限上进行迁移,而不是依据不停实际的迭代迁移尝试的方式来寻找合适的限速门限,能够大大减少无效迁移,在高压力场景下能够大大缩短迁移时间、减小对客户业务的影响和大大节省系统的计算资源和网络带宽资源。
2、本发明动态根据环境具体情况计算限速门限,相对优化前方案能够一开始就能识别出当前资源无法支撑完成虚拟机迁移的情况并告知上层应用,而老的方式是无法做到的只会一直做无效的尝试,这样可以避免:1)虚拟机长时间处在迁移状态影响虚拟机稳定性和性能。2)迁移长期占用系统的网络带宽和计算资源影响系统的整体性能。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
其中:
图1为本发明的一种基于auto converge的虚拟机热迁移整体流程图;
图2为本发明的一种基于autoconverge的虚拟机热迁移的限速流程图;
图3为本发明的一种基于autoconverge的限速门限计算的虚拟机热迁移流程图;
图4为本发明的一种未优化版本,8C32G虚拟机内部加压10G,MET测试结果的示意图;
图5为本发明的一种优化版本,8C32G虚拟机内部加压10G,MET测试结果的示意图;
图6为本发明的一种未优化版本,8C32G虚拟机内部加压30G,MET测试结果的示意图;
图7为本发明的优化版本,8C32G虚拟机内部加压30G,MET测试结果的示意图;
图8为本发明的一种未优化版本和本例优化版本的性能数据比对表图;
图9为本发明的一种未优化版本和本例优化版本的迁移时间对比图;
图10为本发明的一种未优化版本和本例优化版本的存储访问时间比对表图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
实施例一:
目前qemu是在GNU/Linux平台上使用得最广泛的开源虚拟化软件。qemu虚拟机的在线迁移默认使用auto converge模式。基于auto converge的虚拟机在线迁移技术简介:虚拟机需要完成第一轮的虚拟机全量内存迁移,迁移对象是虚拟机的所有内存,在迁移的过程中客户业务继续运行并产生新的内存数据,我们称之为内存脏页数据。在完成第一轮全量内存迁移后,通过内核接口读取到在此迁移期间新产生的内存脏页数据作为下一轮需要迁移数据的依据并判断当前所剩的数据判断是否能够在预设短的时间内一次性完成数据拷贝,如果能够就暂停虚拟机后进行最后一次数据迁移。如果不满足条件,再判断是否需要进行限速,如果需要限速就将虚拟机的CPU能力降低到约定的百分比,这样下一轮内存脏页产生速率也随之降低相应的百分比,开始下一轮内存数据迁移。完成次轮后看是否已经收敛,如果没有收敛将继续按照预先设置的步长加大对虚拟机的限速程度直到最终达到收敛状态完成迁移并继续下一轮的迁移。或者在达到约定的最大限速程度后虚拟机内存压力过大,任然不能收敛那么迁移将一直进行下去,此时被迁移虚拟机内的业务将变得几乎不可用,系统带宽也将被持续占用,对客户造成很大影响。基于auto converge的虚拟机热迁移整体流程可以参考图1所示,基于auto converge热迁移的限速流程可以参考图2所示。本例为了能够解决这种在大压力情况下,迁移耗时长、系统资源占用多、对客户影响大甚至是迁移不能成功等问题提出了新的一种基于auto converge的限速门限计算的虚拟机在线迁移优化方法。
如图1、2、3所示,本发明实施例的一种基于auto converge的限速门限计算的虚拟机在线迁移优化方法,如图1所示,包括如下具体步骤:
S1:通过基于auto converge的迁移收敛条件,建立限速门限计算公式;
S1中,限速门限计算公式的建立包括:
其中,A为迁移拷贝速率;S为内存脏页速率;
X为限速门限值;M为下一轮还需要传输的数据量;
N为最小数据量门限值;V为下一轮的内存脏页产生速率;
T为下一轮的时间周期。
所述下一轮还需要传输的数据量M包括:在下一轮的数据迁移阶段需要从源拷贝到目的的内存数据量,M的计算策略如下:
最小数据量门限值N包括:为了能够在下一轮迁移中达到迁移收敛状态必须完成的迁移拷贝的最小数据量,N的计算策略如下:
S1中,所述迁移状态收敛判断包括:当迁移拷贝速率快于内存脏页产生的速率,且满足一定比例关系使得系统在完成一轮迁移后,可在预先设定的虚拟机暂停时间内即可将虚拟机在上一轮迁移过程中新产生的内存脏页一次性完成迁移。
S2:根据步骤S1,计算获取虚拟机限速门限值;
S2中,所述限速门限值包括:对虚拟机内存脏页产生速率的限速程度,为一个百分比值。比如限速门限为10,表示虚拟机将以90%(1-10/100)的CPU效率工作,此时内存脏页速率也会变成原来的90%,在auto converge中是通过限制VCPU的运行时间来达到限制虚拟机CPU执行效率从而到达降低客户虚拟机运行效率进而到达降低内存脏页产生速率的效果的。
S3:实时获取虚拟机迁移拷贝速率和内存脏页产生的速率,比较迁移拷贝速率和内存脏页产生的速率,进行迁移状态的收敛判断;
所述迁移拷贝速率包括:热迁移虚拟机过程中,拷贝虚拟机内存的速率,即每秒钟可以从源虚拟机拷贝到目的虚拟机的内存的大小。在客户业务没有那么繁忙时产生的内存脏页速率没那么高或者迁移拷贝速率足够大时,热迁移在几轮迁移并暂停很短时间后是最终能够完成的。设想如果迁移拷贝的速率仅仅等于设置小于内存脏页产生速率,那么理论上讲热迁移将永远不能完成的,迁移拷贝的速率必须大于内存脏页速率到一定程度才能让迁移最终完成,而能保证热迁移能够最终完成的这种状态可称之为收敛状态。
所述内存脏页速率S包括:虚拟机在运行过程中单位时间内产生的新的内存脏页的大小,表征虚拟机内存被修改的频率以及虚拟机内业务的内存压力大小。
S4:触发进行内存脏页速率的限速门限,对虚拟机进行限速,并对虚拟机在线热迁移流程进行优化。
S4中,所述触发进行内存脏页速率的限速门限包括:
S411:根据限速门限公式计算提取U,其中U为迁移拷贝速率和内存脏页速率的百分比关系,限速门限公式为
S412:进行U的默认值判断,下一轮的数据迁移传输速率与默认值的乘积所得值必须大于等于内存脏页速率。
S4中,所述对虚拟机在线热迁移流程的优化包括如下具体步骤:
S421:根据所述限速门限计算公式计算出的门限值进行对应程度的虚拟机VCPU限速,将下一轮的内存脏页速率限制在满足收敛的速率值上;
S422:当下一轮迁移完成后并达到收敛的状态时,马上暂停虚拟机;
S423:在目的虚拟上恢复目的虚拟机的运行。
S421中,所述下一轮的内存脏页速率V的计算策略如下:
实施例二:
本发明的实施就是使用本例的限速门限计算方法替代原来的迭代尝试方法,并依据本例优化后迁移流程修改相应的qemu在线迁移代码。
如图4、5、6、7、8、9、10本节主要通过优化前后的测试数据对比分析,说明本方案的可行性和相对当前方式的优化点。
测试环境:
宿主机:CPU 64核Intel(R)Xeon(R)Gold 5218CPU@2.30GHz,内存512G,一张千兆网卡,一张万兆网卡,操作系统centos7.6
虚拟机:CPU 8核,内存32G,虚拟机操作系统:centos7.6
测试工具:
MET测试工具是qemu配套开发的一个测试qemu热迁移性能的测试工具,能够统计迁移时长和迁移过程中客户业务的内存访问性能的工具,测试结果可以图形化展示。stress.out内存压力工具,能够根据输入的参数产生对应的内存压力,比如每秒写10G内存数据即产生10GB/s的内存压力。
测试数据:
在线迁移测试场景1:虚拟机内部加10GB/s的内存压力,虚拟机最长暂停时间为300ms,迁移网带宽为1000MB/s。未优化版本的MET迁移性能测试数据见图4,本专利优化版本的MET迁移性能测试数据见图5。
在线迁移测试场景2:虚拟机内部加30GB/s的内存压力,虚拟机最长暂停时间为300ms,迁移网带宽为1000MB/s。未优化版本的MET迁移性能测试数据见图6,本专利优化版本的MET迁移性能测试数据见图7。
性能指标说明:更新1G内存花费时间指标(ms/GB),是指更新完1GB内存空间的内容需要需要花费的时间,单位为毫秒,值越小说明内存性能越好。
从整体实验数据来看,如图8所示,随着虚拟机的内存压力的增大(虚拟机更频繁使用和更新内存)本专利方案相对原始auto converge方案迁移的耗时明显变短,比如在内存压力为30GB/s的时候,原始方案需要花费497秒完成迁移,而本专利方案只需要93.7秒,迁移速度是原来的差不多5倍。于此同时作为衡量虚拟机内部业务内存访问性能指标的更新1G内存花费时间性能指标,本专利方案是28.9K略好于30.4K,优于其他方案的该指标明显劣化。在压力稍大时,比如10GB/s内存压力本专利方案的更新1G内存花费时间为11.2K也是明显优于未优化版本的25.4K!图9和图10分别是优化前后迁移时间对比图和虚拟机存储访问时间对比图,其中灰色为优化前数据、黑色为本例优化后数据,从两个图可以直观的看出本例优化作用还是比较明显的。
综上所述,本专利方案不仅能够将迁移时间大大缩短而且降低了迁移过程中对客户业务的影响程度。而且在其他实验中也发现,在极限内存压力情况下或者系统迁移带宽有限的情况下,迁移是不能够成功的,相同环境下更换了本专利版本热迁移即可完成提高了在线迁移的成功率。
应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
应理解,根据A确定B并不意味着仅仅根据A确定B,还能够根据A和/或其它信息确定B。
上述实施例,可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时,上述实施例可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令或计算机程序。在计算机上加载或执行计算机指令或计算机程序时,全部或部分地产生按照本发明实施例的流程或功能。计算机可以为通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线网络或/和无线网络方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务器、数据中心等数据存储设备。可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质。半导体介质可以是固态硬盘。
本领域普通技术人员可以意识到,结合本发明中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
综上实施例,与现有技术相比,本发明的技术效果如下:
1、本发明通过限速门限计算公式根据当前系统实际的迁移带宽和客户业务压力情况计算出当前最合适的限速门限,让系统一开始就在合适的限速门限上进行迁移,而不是依据不停实际的迭代迁移尝试的方式来寻找合适的限速门限,能够大大减少无效迁移,在高压力场景下能够大大缩短迁移时间、减小对客户业务的影响和大大节省系统的计算资源和网络带宽资源。
2、本发明动态根据环境具体情况计算限速门限,相对优化前方案能够一开始就能识别出当前资源无法支撑完成虚拟机迁移的情况并告知上层应用,而老的方式是无法做到的只会一直做无效的尝试,这样可以避免:1)虚拟机长时间处在迁移状态影响虚拟机稳定性和性能。2)迁移长期占用系统的网络带宽和计算资源影响系统的整体性能。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (10)
1.一种基于auto converge的限速门限计算的虚拟机在线迁移优化方法,其特征在于:所述方法包括如下具体步骤:
S1:通过基于auto converge的迁移收敛条件,建立限速门限计算公式;
S2:根据步骤S1,计算获取虚拟机限速门限值;
S3:实时获取虚拟机迁移拷贝速率和内存脏页产生的速率,比较迁移拷贝速率和内存脏页产生的速率,进行迁移状态的收敛判断;
S4:触发进行内存脏页速率的限速门限,对虚拟机进行限速,并对虚拟机在线热迁移流程进行优化。
2.根据权利要求1所述的一种基于auto converge的限速门限计算的虚拟机在线迁移优化方法,其特征在于,S1中,限速门限计算公式的建立包括:
其中,A为迁移拷贝速率;S为内存脏页速率;
X为限速门限值;M为下一轮还需要传输的数据量;
N为最小数据量门限值;V为下一轮的内存脏页产生速率;
T为下一轮的时间周期。
3.根据权利要求2所述的一种基于auto converge的限速门限计算的虚拟机在线迁移优化方法,其特征在于,所述下一轮还需要传输的数据量M包括:在下一轮的数据迁移阶段需要从源拷贝到目的的内存数据量,M的计算策略如下:
最小数据量门限值N包括:为了能够在下一轮迁移中达到迁移收敛状态必须完成的迁移拷贝的最小数据量,N的计算策略如下:
4.根据权利要求1所述的一种基于auto converge的限速门限计算的虚拟机在线迁移优化方法,其特征在于,S2中,所述限速门限值X包括:对虚拟机内存脏页产生速率的限速程度,为一个百分比值。
5.根据权利要求1所述的一种基于auto converge的限速门限计算的虚拟机在线迁移优化方法,其特征在于,S1中,所述迁移状态收敛判断包括:当迁移拷贝速率快于内存脏页产生的速率,且满足一定比例关系使得系统在完成一轮迁移后,可在预先设定的虚拟机暂停时间内即可将虚拟机在上一轮迁移过程中新产生的内存脏页一次性完成迁移。
6.根据权利要求5所述的一种基于auto converge的限速门限计算的虚拟机在线迁移优化方法,其特征在于,所述迁移拷贝速率A包括:热迁移虚拟机过程中,拷贝虚拟机内存的速率,即每秒钟可以从源虚拟机拷贝到目的虚拟机的内存的大小。
7.根据权利要求5所述的一种基于auto converge的限速门限计算的虚拟机在线迁移优化方法,其特征在于,所述内存脏页速率S包括:虚拟机在运行过程中单位时间内产生的新的内存脏页的大小,表征虚拟机内存被修改的频率以及虚拟机内业务的内存压力大小。
8.根据权利要求1所述的一种基于auto converge的限速门限计算的虚拟机在线迁移优化方法,其特征在于,S4中,所述触发进行内存脏页速率的限速门限包括:
S411:根据限速门限公式计算提取U,其中U为迁移拷贝速率和内存脏页速率的百分比关系,限速门限公式为
S412:进行U的默认值判断,下一轮的数据迁移传输速率与默认值的乘积所得值必须大于等于内存脏页速率。
9.根据权利要求1所述的一种基于auto converge的限速门限计算的虚拟机在线迁移优化方法,其特征在于,S4中,所述对虚拟机在线热迁移流程的优化包括如下具体步骤:
S421:根据所述限速门限计算公式计算出的门限值进行对应程度的虚拟机VCPU限速,将下一轮的内存脏页速率限制在满足收敛的速率值上;
S422:当下一轮迁移完成后并达到收敛的状态时,马上暂停虚拟机;
S423:在目的虚拟上恢复目的虚拟机的运行。
10.根据权利要求9所述的一种基于auto converge的限速门限计算的虚拟机在线迁移优化方法,其特征在于,S421中,所述下一轮的内存脏页速率V的计算策略如下:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311718397.3A CN117850965A (zh) | 2023-12-13 | 2023-12-13 | 一种基于auto converge的限速门限计算的虚拟机在线迁移优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311718397.3A CN117850965A (zh) | 2023-12-13 | 2023-12-13 | 一种基于auto converge的限速门限计算的虚拟机在线迁移优化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117850965A true CN117850965A (zh) | 2024-04-09 |
Family
ID=90539166
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311718397.3A Pending CN117850965A (zh) | 2023-12-13 | 2023-12-13 | 一种基于auto converge的限速门限计算的虚拟机在线迁移优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117850965A (zh) |
-
2023
- 2023-12-13 CN CN202311718397.3A patent/CN117850965A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10853139B2 (en) | Dynamic workload management based on predictive modeling and recommendation engine for storage systems | |
JP5162579B2 (ja) | 作業負荷特性に基づいたホストへの仮想マシンのデプロイ | |
CN110134495B (zh) | 一种容器跨主机在线迁移方法、存储介质及终端设备 | |
CN105872016B (zh) | 一种桌面云中虚拟机的运行方法 | |
US10108460B2 (en) | Method and system for integrated deployment planning for virtual appliances | |
CN107544864B (zh) | 一种虚拟机数据拷贝方法及虚拟机数据拷贝系统 | |
EP3000024B1 (en) | Dynamically provisioning storage | |
CN112433812B (zh) | 一种虚拟机跨集群迁移方法、系统、设备及计算机介质 | |
CN109739614A (zh) | 虚拟机新建方法、装置及设备 | |
CN110704161A (zh) | 虚拟机创建方法、装置及计算机设备 | |
CN111309443A (zh) | 物联网设备系统的虚拟化方法、装置、设备及存储介质 | |
CN111666266A (zh) | 一种数据迁移方法及相关设备 | |
US20080215843A1 (en) | Storage area management method for a storage system | |
CN109088636B (zh) | 一种数据处理方法、系统及电子设备和存储介质 | |
CN112631994A (zh) | 数据迁移方法及系统 | |
CN111913768A (zh) | 虚拟化云桌面及其构建方法 | |
CN117850965A (zh) | 一种基于auto converge的限速门限计算的虚拟机在线迁移优化方法 | |
CN115151902A (zh) | 集群扩容方法、装置、存储介质及电子设备 | |
CN115951845A (zh) | 一种磁盘管理方法、装置、设备及存储介质 | |
CN110908783A (zh) | 一种云数据中心虚拟机的管控方法、系统及设备 | |
JP2024506131A (ja) | 仮想マシンのメモリ共有方法および装置 | |
KR102496674B1 (ko) | 쿠버네티스를 기반으로 하는 데이터 분석 오토 스케일링 시스템 | |
CN112306373B (zh) | 一种集群扩容方法、系统及电子设备和存储介质 | |
WO2012108007A1 (ja) | 実行制御プログラム、実行制御装置および実行制御方法 | |
CN114625474A (zh) | 容器迁移方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |