CN115357194A - 一种云主机在线迁移方法、装置、设备、存储介质 - Google Patents

一种云主机在线迁移方法、装置、设备、存储介质 Download PDF

Info

Publication number
CN115357194A
CN115357194A CN202211032618.7A CN202211032618A CN115357194A CN 115357194 A CN115357194 A CN 115357194A CN 202211032618 A CN202211032618 A CN 202211032618A CN 115357194 A CN115357194 A CN 115357194A
Authority
CN
China
Prior art keywords
dirty page
migration
cloud host
page data
rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211032618.7A
Other languages
English (en)
Inventor
王旭东
郭立民
孔维亭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Inspur Smart Computing Technology Co Ltd
Original Assignee
Guangdong Inspur Smart Computing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Inspur Smart Computing Technology Co Ltd filed Critical Guangdong Inspur Smart Computing Technology Co Ltd
Priority to CN202211032618.7A priority Critical patent/CN115357194A/zh
Publication of CN115357194A publication Critical patent/CN115357194A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/0647Migration mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/065Replication mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种云主机在线迁移方法、装置、设备、介质,涉及云计算技术领域,包括:当检测到全量拷贝完成后,开启循环拷贝云主机中变化的脏页数据的操作,记录每次循环拷贝操作的脏页数据的脏页数据量以及脏页率;若云主机中的剩余脏页数据数量的剩余迁移时间大于预设云主机停机时间,则基于上一次拷贝操作的脏页率预测当前拷贝操作的目标脏页率;若目标脏页率小于脏页数据迁移的平均迁移速度,则对预测的下一次的脏页率与平均带宽进行比较,得到比较结果;基于比较结果选择对应的脏页数据迁移方式进行脏页数据迁移。通过设置脏页率预测方式根据云主机变化的脏页数据的拷贝情况获取对应自适应阈值的方式,解决需手动设置合理迁移阈值的问题。

Description

一种云主机在线迁移方法、装置、设备、存储介质
技术领域
本发明涉及云计算技术领域,特别涉及一种云主机在线迁移方法、装置、设备、存储介质。
背景技术
云计算(Cloud Computing)是指基于互联网相关服务,通过虚拟化方式实现IT资源共享的新型计算模式。其核心思想是通过网络统一管理和调度计算、存储、网络、软件等资源,实现资源整合与配置优化,以服务方式满足不同用户随时获取并扩展、按需使用并付费,最大限度地降低成本等各类需求。
在云计算平台中,经常需要对云主机进行在线迁移,包括VCPU、内存及设备的迁移,对于云服务器内存的迁移常用的方法有预拷贝(PreCopy)、后拷贝(PostCopy),预拷贝的过程如下:云主机还在源服务器上运行,第一个循环,对源服务器上云主机的全部内存镜像复制到目标服务器上。在复制过程中,监视器会监视云主机内存的变化。以后的循环中,检查上一个循环中内存是否发生了变化。假如发生了变化,那么监视器会将发生变化的内存页(Dirty pages)重新复制到目标服务器中,并覆盖掉先前的内存页。在这个阶段,监视器会继续监视云主机内存的变化情况。监视器会持续这样的内存复制循环。随着循环次数的增加,所需要复制的Dirty pages就会明显减少,而复制所耗费的时间也逐渐变短。最后,当源服务器与目标服务器之间的内存数据的差异达到一定标准时,内存复制操作结束,同时在源服务器上停止云主机并在目的服务器上启动云主机,完成迁移。这种预拷贝的迁移方案,在云主机负载低带宽高的情况下,可以取得较好的迁移效果,内存脏页的数量可以快速收敛,最终以很短的停机时间完成迁移。但问题在于,当云主机的负载较高持续向内存写入大量数据的情况下,内存脏页的数量可能收敛较慢甚至于不收敛。对于这种情况,当前业界并没有成熟的解决方法,通常的方法是,当拷贝内存数据的迭代次数大于某一个阈值时,认为无法收敛,此时在源服务器暂停云主机强制迁移;当内存脏页的数量小于某一个阈值时或预测停机时间小于某一阈值时,在源服务器上停止云主机并在目的服务器上启动云主机,完成迁移。在高负载低带宽或负载、带宽波动比较大的情况下,可能不能在短时间内收敛,因而不能有效的确定拷贝内存脏页的循环次数的阈值。
综上,如何在不设置固定的迁移阈值的前提下,可以自动适应高负载低带宽或者负载、带宽大幅波动等各种复杂的情况,减少无效的循环次数,减少云主机停机时间实现云主机在线迁移是本领域有待解决的技术问题。
发明内容
有鉴于此,本发明的目的在于提供一种云主机在线迁移方法、装置、设备、存储介质,能够在不设置固定的迁移阈值的前提下,可以自动适应高负载低带宽或者负载、带宽大幅波动等各种复杂的情况,减少无效的循环次数,减少云主机停机时间实现云主机在线迁移。其具体方案如下:
第一方面,本申请公开了一种云主机在线迁移方法,包括:
对源服务器上的云主机的内存镜像进行复制,全量拷贝至目标服务器;
当检测到所述全量拷贝完成后,开启循环拷贝所述云主机中变化的脏页数据的操作,并记录每次循环拷贝操作的脏页数据的脏页数据量以及脏页率;
若所述云主机中的剩余脏页数据数量的剩余迁移时间大于预设云主机停机时间,则基于上一次拷贝操作的脏页率预测当前拷贝操作的目标脏页率;
若所述目标脏页率大于脏页数据迁移的平均迁移速度,则判断所述脏页数据能够成功迁移,并继续执行循环拷贝所述云主机中变化的脏页数据的操作,直至所述脏页数据迁移完成;
若所述目标脏页率小于脏页数据迁移的平均迁移速度,则对预测的下一次的脏页率与平均带宽进行比较,以得到比较结果;
基于所述比较结果选择对应的脏页数据迁移方式进行脏页数据迁移。
可选的,所述若所述云主机中的剩余脏页数据数量的剩余迁移时间大于预设云主机停机时间,则基于上一次拷贝操作的脏页率预测当前拷贝操作的目标脏页率之前,还包括:
基于剩余脏页数据数量和平均迁移时间确定出剩余迁移时间。
可选的,所述云主机在线迁移方法,还包括:
若所述云主机中的剩余脏页数据数量的剩余迁移时间小于预设云主机停机时间,则将源服务器上的所述云主机暂停,以便将剩余脏页数据拷贝到目标服务器,完成所述云主机在线迁移。
可选的,所述对预测的下一次的脏页率与平均带宽进行比较,以得到比较结果之前,还包括:
基于若干数量的总迁移数据量和对应的若干数量的总迁移时间确定出平均带宽。
可选的,所述对预测的下一次的脏页率与平均带宽进行比较,以得到比较结果之前,还包括:
采集每次循环的脏页率作为预测样本,基于预设指数平滑算法和所述预测样本对下一次的脏页率进行预测,以得到预测的下一次的脏页率。
可选的,所述对预测的下一次的脏页率与平均带宽进行比较,以得到比较结果,包括:
若预测的下一次的脏页率小于平均带宽,则得到第一比较结果;
若预测的下一次的脏页率大于平均带宽,则对脏页率趋势进行预测,以得到包含所述脏页率趋势的第二比较结果。
可选的,所述对脏页率趋势进行预测,以得到包含所述脏页率趋势的第二比较结果,包括:
基于预设趋势检验算法对脏页率趋势进行预测,以得到包含所述脏页率趋势收敛和/或所述脏页率趋势发散的第二比较结果。
第二方面,本申请公开了一种云主机在线迁移装置,包括:
内存镜像模块,用于对源服务器上的云主机的内存镜像进行复制,全量拷贝至目标服务器;
数据拷贝模块,用于当检测到所述全量拷贝完成后,开启循环拷贝所述云主机中变化的脏页数据的操作,并记录每次循环拷贝操作的脏页数据的脏页数据量以及脏页率;
脏页率预测模块,用于若所述云主机中的剩余脏页数据数量的剩余迁移时间大于预设云主机停机时间,则基于上一次拷贝操作的脏页率预测当前拷贝操作的目标脏页率;
第一迁移模块,用于若所述目标脏页率大于脏页数据迁移的平均迁移速度,则判断所述脏页数据能够成功迁移,并继续执行循环拷贝所述云主机中变化的脏页数据的操作,直至所述脏页数据迁移完成;
结果比较模块,用于若所述目标脏页率小于脏页数据迁移的平均迁移速度,则对预测的下一次的脏页率与平均带宽进行比较,以得到比较结果;
第二迁移模块,用于基于所述比较结果选择对应的脏页数据迁移方式进行脏页数据迁移。
第三方面,本申请公开了一种电子设备,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序,以实现前述公开的云主机在线迁移方法的步骤。
第四方面,本申请公开了一种计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的云主机在线迁移方法的步骤。
由此可见,本申请公开了一种云主机在线迁移方法,包括:对源服务器上的云主机的内存镜像进行复制,全量拷贝至目标服务器;当检测到所述全量拷贝完成后,开启循环拷贝所述云主机中变化的脏页数据的操作,并记录每次循环拷贝操作的脏页数据的脏页数据量以及脏页率;若所述云主机中的剩余脏页数据数量的剩余迁移时间大于预设云主机停机时间,则基于上一次拷贝操作的脏页率预测当前拷贝操作的目标脏页率;若所述目标脏页率大于脏页数据迁移的平均迁移速度,则判断所述脏页数据能够成功迁移,并继续执行循环拷贝所述云主机中变化的脏页数据的操作,直至所述脏页数据迁移完成;若所述目标脏页率小于脏页数据迁移的平均迁移速度,则对预测的下一次的脏页率与平均带宽进行比较,以得到比较结果;基于所述比较结果选择对应的脏页数据迁移方式进行脏页数据迁移。可见,通过本申请中设置脏页率预测方式自行根据每一云主机变化的脏页数据的拷贝情况获取对应的自适应阈值的方式,解决了难以手动设置合理的迁移阈值的问题,能够对不同脏页率和网络带宽进行自适应,减少了总的迁移时间并尽可能将停机时间控制在较小的范围内,并在减少总的迁移时间提高迁移效率和减少云主机停机时间两者之间取得平衡。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请公开的一种云主机在线迁移方法流程图;
图2为本申请公开的一种具体的云主机在线迁移方法流程图;
图3为本申请公开的一种云主机在线迁移装置结构示意图;
图4为本申请公开的一种电子设备结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在云计算平台中,经常需要对云主机进行在线迁移,包括VCPU、内存及设备的迁移,对于云服务器内存的迁移常用的方法有预拷贝(PreCopy)、后拷贝(PostCopy),预拷贝的过程如下:云主机还在源服务器上运行,第一个循环,对源服务器上云主机的全部内存镜像复制到目标服务器上。在复制过程中,监视器会监视云主机内存的变化。以后的循环中,检查上一个循环中内存是否发生了变化。假如发生了变化,那么监视器会将发生变化的内存页(Dirty pages)重新复制到目标服务器中,并覆盖掉先前的内存页。在这个阶段,监视器会继续监视云主机内存的变化情况。监视器会持续这样的内存复制循环。随着循环次数的增加,所需要复制的Dirty pages就会明显减少,而复制所耗费的时间也逐渐变短。最后,当源服务器与目标服务器之间的内存数据的差异达到一定标准时,内存复制操作结束,同时在源服务器上停止云主机并在目的服务器上启动云主机,完成迁移。这种预拷贝的迁移方案,在云主机负载低带宽高的情况下,可以取得较好的迁移效果,内存脏页的数量可以快速收敛,最终以很短的停机时间完成迁移。但问题在于,当云主机的负载较高持续向内存写入大量数据的情况下,内存脏页的数量可能收敛较慢甚至于不收敛。对于这种情况,当前业界并没有成熟的解决方法,通常的方法是,当拷贝内存数据的迭代次数大于某一个阈值时,认为无法收敛,此时在源服务器暂停云主机强制迁移;当内存脏页的数量小于某一个阈值时或预测停机时间小于某一阈值时,在源服务器上停止云主机并在目的服务器上启动云主机,完成迁移。在高负载低带宽或负载、带宽波动比较大的情况下,可能不能在短时间内收敛,因而不能有效的确定拷贝内存脏页的循环次数的阈值。
为此,本申请提供了一种云主机在线迁移方案,能够在不设置固定的迁移阈值的前提下,可以自动适应高负载低带宽或者负载、带宽大幅波动等各种复杂的情况,减少无效的循环次数,减少云主机停机时间实现云主机在线迁移。
参照图1所示,本发明实施例公开了一种云主机在线迁移方法,包括:
步骤S11:对源服务器上的云主机的内存镜像进行复制,全量拷贝至目标服务器。
本实施例中,对源服务器上云主机的全部内存镜像复制到目标服务器上,其中,源服务器上的云主机在进行全部内存镜像复制的过程时,云主机还在源服务器上运行,同时通过hypervisor(虚拟机监视器)提供虚拟的作业平台来执行客体操作系统(guestoperating systems),负责管理其他客体操作系统的执行阶段;这些客体操作系统,共同分享虚拟化后的硬件资源。其中,hypervisor是用来建立与执行虚拟机器的软件、固件或硬件。
步骤S12:当检测到所述全量拷贝完成后,开启循环拷贝所述云主机中变化的脏页数据的操作,并记录每次循环拷贝操作的脏页数据的脏页数据量以及脏页率。
本实施例中,当检测到全量拷贝完成后,循环拷贝变化的云主机内存数据,也即脏页数据,并记录下每次循环拷贝的脏页数据的脏页数据量和脏页率,可以理解的是,记录每次循环拷贝的脏页数据的脏页数据量用于为后续自动计算相关阈值提供条件;而传统方式下,需要在每次云主机迁移前人为的设置某些特定的阈值,当达到阈值时停止迁移。比如设置总的迁移时间作为阈值,如果设置的阈值过大,则可能因为脏页率不收敛而一直再迁移,浪费了时间。
步骤S13:若所述云主机中的剩余脏页数据数量的剩余迁移时间大于预设云主机停机时间,则基于上一次拷贝操作的脏页率预测当前拷贝操作的目标脏页率。
本实施例中,所述若所述云主机中的剩余脏页数据数量的剩余迁移时间大于预设云主机停机时间,则基于上一次拷贝操作的脏页率预测当前拷贝操作的目标脏页率之前,还包括:基于剩余脏页数据数量和平均迁移时间确定出剩余迁移时间。可以理解的是,利用剩余的脏页数据数量除以平均的迁移速度计算出剩余脏页迁移所需要的剩余迁移时间,其中,平均的迁移速度计算过程为用之前若干次迁移的总的数据量除以之前若干次迁移总的时间;若计算得到的剩余脏页数据数量的剩余迁移时间大于预设云主机停机时间,则基于上一次循环拷贝操作的脏页率预测本次循环拷贝操作的目标脏页率。例如:如果拷贝循环次数大于10次,仍没有完成迁移,则认为每次循环的脏页数量可能不收敛,需要基于上次循环拷贝操作的脏页率预测目标脏页率,比较脏页数据迁移的平均迁移速度与目标脏页率。
本实施例中,若所述云主机中的剩余脏页数据数量的剩余迁移时间小于预设云主机停机时间,则将源服务器上的所述云主机暂停,以便将剩余脏页数据拷贝到目标服务器,完成所述云主机在线迁移。可以理解的是,如果这个时间是小于预期的最大的云主机停机时间,则认为满足云主机切换的条件,将源主机上的云主机暂停,将源主机上的剩余的脏页拷贝到目的主机,然后在目的主机上恢复云主机完成迁移,例如:拷贝循环次数小于10次,内存脏页就收敛到足够小,可以保证在足够短的时间内完成云主机在源服务器和目的服务器之间的切换,那么就可以完成迁移。
步骤S14:若所述目标脏页率大于脏页数据迁移的平均迁移速度,则判断所述脏页数据能够成功迁移,并继续执行循环拷贝所述云主机中变化的脏页数据的操作,直至所述脏页数据迁移完成。
本实施例中,若迁移的平均速度大于目标脏页率,则认为每次循环脏页的数量会逐步减少,可以迁移成功,继续进行循环拷贝数据,直至脏页数据迁移完成。
步骤S15:若所述目标脏页率小于脏页数据迁移的平均迁移速度,则对预测的下一次的脏页率与平均带宽进行比较,以得到比较结果。
本实施例中,若检测到目标脏页率小于脏页数据迁移的平均迁移速度,则开启第二次的比较操作,比较预测的下一脏页率与平均带宽的大小,并得到相应的比较结果,可以理解的是,在所述云主机中的剩余脏页数据数量的剩余迁移时间大于预设云主机停机时间的前提下,预测当前目标脏页率,并在目标脏页率小于平均迁移速度的二次前提下,进行下一次的循环拷贝操作的脏页率的预测,对下一脏页率与平均带宽进行比较,得到相应的比较结果。
本实施例中,所述对预测的下一次的脏页率与平均带宽进行比较,以得到比较结果之前,还包括:基于若干数量的总迁移数据量和对应的若干数量的总迁移时间确定出平均带宽。可以理解的是,在进行平均带宽比较之前,根据记录总的迁移拷贝的数据量和总的迁移时间,用总的数据量除以总的迁移时间作为平均带宽。
步骤S16:基于所述比较结果选择对应的脏页数据迁移方式进行脏页数据迁移。
本实施例中,基于预测的下一次的脏页率与平均带宽进行比较的比较结果选择继续拷贝剩余脏页数据直至拷贝完成的迁移方式或者采取强制干预措施对源主机中的云主机的部分操作进行抑制,然后拷贝执行抑制操作后的脏页数据直至拷贝完成的迁移方式进行脏页数据迁移。可以理解的是,采用了本申请提出的自适应阈值的方法,则可以提前预判出脏页率不收敛的趋势,及时采取干预措施,避免陷入长时间陷入无效的循环拷贝数据,提高了迁移效率;如果设置的阈值过小,则可能剩余大量的脏页没有迁移,此时如果强制停机迁移,则会造成云主机停机时间过长,而采用了自适应阈值的方法,可以预判出脏页率趋势收敛,增加循环的次数,直至剩余脏页的数量较少时,再进行停机迁移,减少了云主机在迁移过程中的停机时间,不需要在迁移前人为设置总的迁移时间或总的迁移数据量或总的循环次数作为阈值,可以对于不同的脏页率和网络带宽进行自适应,自动选择合适的云主机停机切换时机。
由此可见,本申请公开了一种云主机在线迁移方法,包括:对源服务器上的云主机的内存镜像进行复制,全量拷贝至目标服务器;当检测到所述全量拷贝完成后,开启循环拷贝所述云主机中变化的脏页数据的操作,并记录每次循环拷贝操作的脏页数据的脏页数据量以及脏页率;若所述云主机中的剩余脏页数据数量的剩余迁移时间大于预设云主机停机时间,则基于上一次拷贝操作的脏页率预测当前拷贝操作的目标脏页率;若所述目标脏页率大于脏页数据迁移的平均迁移速度,则判断所述脏页数据能够成功迁移,并继续执行循环拷贝所述云主机中变化的脏页数据的操作,直至所述脏页数据迁移完成;若所述目标脏页率小于脏页数据迁移的平均迁移速度,则对预测的下一次的脏页率与平均带宽进行比较,以得到比较结果;基于所述比较结果选择对应的脏页数据迁移方式进行脏页数据迁移。可见,通过本申请中设置脏页率预测方式自行根据每一云主机变化的脏页数据的拷贝情况获取对应的自适应阈值的方式,解决了难以手动设置合理的迁移阈值的问题,能够对不同脏页率和网络带宽进行自适应,减少了总的迁移时间并尽可能将停机时间控制在较小的范围内,并在减少总的迁移时间提高迁移效率和减少云主机停机时间两者之间取得平衡。
参照图2所示,本发明实施例公开了一种具体的云主机在线迁移方法,相对于上一实施例,本实施例对技术方案作了进一步的说明和优化。具体的:
步骤S21:对源服务器上的云主机的内存镜像进行复制,全量拷贝至目标服务器。
步骤S22:当检测到所述全量拷贝完成后,开启循环拷贝所述云主机中变化的脏页数据的操作,并记录每次循环拷贝操作的脏页数据的脏页数据量以及脏页率。
步骤S23:若所述云主机中的剩余脏页数据数量的剩余迁移时间大于预设云主机停机时间,则基于上一次拷贝操作的脏页率预测当前拷贝操作的目标脏页率。
步骤S24:若所述目标脏页率大于脏页数据迁移的平均迁移速度,则判断所述脏页数据能够成功迁移,并继续执行循环拷贝所述云主机中变化的脏页数据的操作,直至所述脏页数据迁移完成。
其中,步骤S21、S22、S23、S24中更加详细的处理过程请参照前述公开的实施例内容,在此不再进行赘述。
步骤S25:若所述目标脏页率小于脏页数据迁移的平均迁移速度,则对预测的下一次的脏页率与平均带宽进行比较,若预测的下一次的脏页率小于所述平均带宽,则得到第一比较结果;若预测的下一次的脏页率大于所述平均带宽,则对脏页率趋势进行预测,以得到包含所述脏页率趋势的第二比较结果。
本实施例中,如果迁移的平均速度小于脏页率,那么如果继续进行循环,可能每次循环脏页的数量可能不收敛,需要预测下一次循环的脏页率,然后对脏页率的趋势进行预测。所述对预测的下一次的脏页率与平均带宽进行比较,以得到比较结果之前,还包括:采集每次循环的脏页率作为预测样本,基于预设指数平滑算法和所述预测样本对下一次的脏页率进行预测,以得到预测的下一次的脏页率。可以理解的是,预测脏页率的方法是通过以前面若干次循环每次循环的脏页率作为样本,采用指数平滑算法进行预测下一循环的脏页率。
本实施例中,所述对脏页率趋势进行预测,以得到包含所述脏页率趋势的第二比较结果,包括:基于预设趋势检验算法对脏页率趋势进行预测,以得到包含所述脏页率趋势收敛和/或所述脏页率趋势发散的第二比较结果。
在一种实施方式中,如果预测的结果是下一次循环的脏页率小于平均的带宽,则继续循环进行迁移,并在每一次拷贝循环中判断脏页率的趋势会不会发散,若脏页率的趋势不会发散,则继续进行下一轮的循环。每次循环后,按照前述方法判断是否满足前述云主机停机时间的要求,如果满足条件则在源主机、目的主机间进行切换,完成迁移;如果不满足停机时间的要求,则按照上述的脏页率判断条件,判断脏页率是否收敛,选择强制干预或继续循环。
在另一种实施方式中,如果预测的结果是下一次循环的脏页率大于平均的带宽,那么如果继续循环拷贝数据,脏页率可能不会收敛。为了进一步确认脏页率的趋势,对脏页率的趋势进行预测。可以采用Cox-Stuart检验或Mann-Kendall检验等方法,预测脏页率的趋势,如果在一定的置信区间,预测到脏页率的趋势是上升,那么此时继续迁移很可能会失败,需要采取强制措施进行干预。比如在源主机上对云主机的内存写入进行抑制,人为降低脏页率;或者强制将源主机上的云主机暂停,将源主机上的剩余的脏页拷贝到目的主机,然后在目的主机上恢复云主机完成迁移。
步骤S26:基于比较结果选择对应的脏页数据迁移方式进行脏页数据迁移。
本实施例中,基于第一比较结果和第二比较结果选择对应的脏页数据迁移方式进行数据迁移操作,最终完成云主机从源主机到目标主机的迁移。
由此可见,本申请的技术方案可适用于各种复杂的场景,不论是脏页率由初始小于网络带宽逐渐调整到超过网络带宽还是脏页率由初始大于网络带宽逐渐调整到小于网络带宽还是,都可以使用这种方案改善迁移效果,其中,当脏页率和网络环境持续变化时,可以自动调整来进行自适应。兼顾了降低总的迁移时间和降低云主机停机时间两个目标,在脏页率不收敛的情况下,可以采用抑制云主机内存写入的方法或其他方法来进行干预,改善迁移效果,在采用指数平滑算法进行预测的基础上,进行了趋势检验,更加保证了预测的准确性。
参照图3所示,本发明实施例还相应公开了一种云主机在线迁移装置,包括:
内存镜像模块11,用于对源服务器上的云主机的内存镜像进行复制,全量拷贝至目标服务器;
数据拷贝模块12,用于当检测到所述全量拷贝完成后,开启循环拷贝所述云主机中变化的脏页数据的操作,并记录每次循环拷贝操作的脏页数据的脏页数据量以及脏页率;
脏页率预测模块13,用于若所述云主机中的剩余脏页数据数量的剩余迁移时间大于预设云主机停机时间,则基于上一次拷贝操作的脏页率预测当前拷贝操作的目标脏页率;
第一迁移模块14,用于若所述目标脏页率大于脏页数据迁移的平均迁移速度,则判断所述脏页数据能够成功迁移,并继续执行循环拷贝所述云主机中变化的脏页数据的操作,直至所述脏页数据迁移完成;
结果比较模块15,用于若所述目标脏页率小于脏页数据迁移的平均迁移速度,则对预测的下一次的脏页率与平均带宽进行比较,以得到比较结果;
第二迁移模块16,用于基于所述比较结果选择对应的脏页数据迁移方式进行脏页数据迁移。
由此可见,本申请公开了一种云主机在线迁移方法,包括:对源服务器上的云主机的内存镜像进行复制,全量拷贝至目标服务器;当检测到所述全量拷贝完成后,开启循环拷贝所述云主机中变化的脏页数据的操作,并记录每次循环拷贝操作的脏页数据的脏页数据量以及脏页率;若所述云主机中的剩余脏页数据数量的剩余迁移时间大于预设云主机停机时间,则基于上一次拷贝操作的脏页率预测当前拷贝操作的目标脏页率;若所述目标脏页率大于脏页数据迁移的平均迁移速度,则判断所述脏页数据能够成功迁移,并继续执行循环拷贝所述云主机中变化的脏页数据的操作,直至所述脏页数据迁移完成;若所述目标脏页率小于脏页数据迁移的平均迁移速度,则对预测的下一次的脏页率与平均带宽进行比较,以得到比较结果;基于所述比较结果选择对应的脏页数据迁移方式进行脏页数据迁移。可见,通过本申请中设置脏页率预测方式自行根据每一云主机变化的脏页数据的拷贝情况获取对应的自适应阈值的方式,解决了难以手动设置合理的迁移阈值的问题,能够对不同脏页率和网络带宽进行自适应,减少了总的迁移时间并尽可能将停机时间控制在较小的范围内,并在减少总的迁移时间提高迁移效率和减少云主机停机时间两者之间取得平衡。
进一步的,本申请实施例还公开了一种电子设备,图4是根据一示例性实施例示出的电子设备20结构图,图中的内容不能认为是对本申请的使用范围的任何限制。
图4为本申请实施例提供的一种电子设备20的结构示意图。该电子设备20,具体可以包括:至少一个处理器21、至少一个存储器22、电源23、通信接口24、输入输出接口25和通信总线26。其中,所述存储器22用于存储计算机程序,所述计算机程序由所述处理器21加载并执行,以实现前述任一实施例公开的云主机在线迁移方法中的相关步骤。另外,本实施例中的电子设备20具体可以为电子计算机。
本实施例中,电源23用于为电子设备20上的各硬件设备提供工作电压;通信接口24能够为电子设备20创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进行具体限定;输入输出接口25,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。
其中,处理器21可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器21可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器21也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器21可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器21还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
另外,存储器22作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源可以包括操作系统221、计算机程序222等,存储方式可以是短暂存储或者永久存储。
其中,操作系统221用于管理与控制电子设备20上的各硬件设备以及计算机程序222,以实现处理器21对存储器22中海量数据223的运算与处理,其可以是Windows Server、Netware、Unix、Linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的云主机在线迁移方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。数据223除了可以包括电子设备接收到的由外部设备传输进来的数据,也可以包括由自身输入输出接口25采集到的数据等。
进一步的,本申请还公开了一种计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的云主机在线迁移方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的一种云主机在线迁移方法、装置、设备、存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种云主机在线迁移方法,其特征在于,包括:
对源服务器上的云主机的内存镜像进行复制,全量拷贝至目标服务器;
当检测到所述全量拷贝完成后,开启循环拷贝所述云主机中变化的脏页数据的操作,并记录每次循环拷贝操作的脏页数据的脏页数据量以及脏页率;
若所述云主机中的剩余脏页数据数量的剩余迁移时间大于预设云主机停机时间,则基于上一次拷贝操作的脏页率预测当前拷贝操作的目标脏页率;
若所述目标脏页率大于脏页数据迁移的平均迁移速度,则判断所述脏页数据能够成功迁移,并继续执行循环拷贝所述云主机中变化的脏页数据的操作,直至所述脏页数据迁移完成;
若所述目标脏页率小于脏页数据迁移的平均迁移速度,则对预测的下一次的脏页率与平均带宽进行比较,以得到比较结果;
基于所述比较结果选择对应的脏页数据迁移方式进行脏页数据迁移。
2.根据权利要求1所述的云主机在线迁移方法,其特征在于,所述若所述云主机中的剩余脏页数据数量的剩余迁移时间大于预设云主机停机时间,则基于上一次拷贝操作的脏页率预测当前拷贝操作的目标脏页率之前,还包括:
基于剩余脏页数据数量和平均迁移时间确定出剩余迁移时间。
3.根据权利要求1所述的云主机在线迁移方法,其特征在于,还包括:
若所述云主机中的剩余脏页数据数量的剩余迁移时间小于预设云主机停机时间,则将源服务器上的所述云主机暂停,以便将剩余脏页数据拷贝到目标服务器,完成所述云主机在线迁移。
4.根据权利要求1所述的云主机在线迁移方法,其特征在于,所述对预测的下一次的脏页率与平均带宽进行比较,以得到比较结果之前,还包括:
基于若干数量的总迁移数据量和对应的若干数量的总迁移时间确定出平均带宽。
5.根据权利要求1所述的云主机在线迁移方法,其特征在于,所述对预测的下一次的脏页率与平均带宽进行比较,以得到比较结果之前,还包括:
采集每次循环的脏页率作为预测样本,基于预设指数平滑算法和所述预测样本对下一次的脏页率进行预测,以得到预测的下一次的脏页率。
6.根据权利要求1至5任一项所述的云主机在线迁移方法,其特征在于,所述对预测的下一次的脏页率与平均带宽进行比较,以得到比较结果,包括:
若预测的下一次的脏页率小于平均带宽,则得到第一比较结果;
若预测的下一次的脏页率大于平均带宽,则对脏页率趋势进行预测,以得到包含所述脏页率趋势的第二比较结果。
7.根据权利要求6所述的云主机在线迁移方法,其特征在于,所述对脏页率趋势进行预测,以得到包含所述脏页率趋势的第二比较结果,包括:
基于预设趋势检验算法对脏页率趋势进行预测,以得到包含所述脏页率趋势收敛和/或所述脏页率趋势发散的第二比较结果。
8.一种云主机在线迁移装置,其特征在于,包括:
内存镜像模块,用于对源服务器上的云主机的内存镜像进行复制,全量拷贝至目标服务器;
数据拷贝模块,用于当检测到所述全量拷贝完成后,开启循环拷贝所述云主机中变化的脏页数据的操作,并记录每次循环拷贝操作的脏页数据的脏页数据量以及脏页率;
脏页率预测模块,用于若所述云主机中的剩余脏页数据数量的剩余迁移时间大于预设云主机停机时间,则基于上一次拷贝操作的脏页率预测当前拷贝操作的目标脏页率;
第一迁移模块,用于若所述目标脏页率大于脏页数据迁移的平均迁移速度,则判断所述脏页数据能够成功迁移,并继续执行循环拷贝所述云主机中变化的脏页数据的操作,直至所述脏页数据迁移完成;
结果比较模块,用于若所述目标脏页率小于脏页数据迁移的平均迁移速度,则对预测的下一次的脏页率与平均带宽进行比较,以得到比较结果;
第二迁移模块,用于基于所述比较结果选择对应的脏页数据迁移方式进行脏页数据迁移。
9.一种电子设备,其特征在于,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序,以实现如权利要求1至7任一项所述的云主机在线迁移方法的步骤。
10.一种计算机可读存储介质,其特征在于,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的云主机在线迁移方法的步骤。
CN202211032618.7A 2022-08-26 2022-08-26 一种云主机在线迁移方法、装置、设备、存储介质 Pending CN115357194A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211032618.7A CN115357194A (zh) 2022-08-26 2022-08-26 一种云主机在线迁移方法、装置、设备、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211032618.7A CN115357194A (zh) 2022-08-26 2022-08-26 一种云主机在线迁移方法、装置、设备、存储介质

Publications (1)

Publication Number Publication Date
CN115357194A true CN115357194A (zh) 2022-11-18

Family

ID=84005279

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211032618.7A Pending CN115357194A (zh) 2022-08-26 2022-08-26 一种云主机在线迁移方法、装置、设备、存储介质

Country Status (1)

Country Link
CN (1) CN115357194A (zh)

Similar Documents

Publication Publication Date Title
US11494233B2 (en) Baselining for compute resource allocation
US10552199B2 (en) System and method for binary throttling for live migration of virtual machines
US8631131B2 (en) Virtual machine pool cache
CN102821158B (zh) 一种实现虚拟机迁移的方法和云系统
US10552200B2 (en) System and method for dynamic throttling for live migration of virtual machines
US20100332658A1 (en) Selecting a host from a host cluster to run a virtual machine
US20100332657A1 (en) Selecting a host from a host cluster for live migration of a virtual machine
US20140082311A1 (en) Maintaining consistency of storage in a mirrored virtual environment
US8479214B2 (en) Hardware throughput saturation detection
CN110737512A (zh) 跨平台虚拟机在线迁移方法及相关组件
US10552209B2 (en) System and method for throttling for live migration of virtual machines
US11960941B2 (en) Managing virtual machine memory balloon using time series predictive data
CN115794337B (zh) 资源调度方法、装置、云平台、设备及存储介质
TW201347459A (zh) 管理方法及其系統
JP7035858B2 (ja) マイグレーション管理プログラム、マイグレーション方法およびマイグレーションシステム
CN110134490B (zh) 虚拟机动态迁移方法、设备及存储介质
CN115437739A (zh) 虚拟化系统的资源管理方法、电子设备和计算机程序产品
CN110413369B (zh) 用于虚拟化环境中的备份的系统和方法
US10095533B1 (en) Method and apparatus for monitoring and automatically reserving computer resources for operating an application within a computer environment
GB2507816A (en) Calculating timeout for remote task execution from network delays and processing duration on local application/hardware replica
CN115357194A (zh) 一种云主机在线迁移方法、装置、设备、存储介质
US20200073566A1 (en) Storage system and storage control method
CN115033337A (zh) 虚拟机内存迁移方法、装置、设备及存储介质
CN115840635A (zh) 计算资源管理方法、电子设备和程序产品
US11169885B2 (en) System and method for reconfiguring configuration parameters of virtual objects during recovery

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination