CN112379974A - 一种虚拟机热迁移系统及其热迁移方法 - Google Patents

一种虚拟机热迁移系统及其热迁移方法 Download PDF

Info

Publication number
CN112379974A
CN112379974A CN202011415532.3A CN202011415532A CN112379974A CN 112379974 A CN112379974 A CN 112379974A CN 202011415532 A CN202011415532 A CN 202011415532A CN 112379974 A CN112379974 A CN 112379974A
Authority
CN
China
Prior art keywords
physical machine
migration
migrated
virtual machine
machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011415532.3A
Other languages
English (en)
Inventor
藏洪永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Haiguang Information Technology Co Ltd
Original Assignee
Haiguang Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Haiguang Information Technology Co Ltd filed Critical Haiguang Information Technology Co Ltd
Priority to CN202011415532.3A priority Critical patent/CN112379974A/zh
Publication of CN112379974A publication Critical patent/CN112379974A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种虚拟机热迁移系统及其热迁移方法,用于预估待迁移虚拟机能否完成热迁移。其中,该虚拟机热迁移系统通过设置预迁移决策装置,预迁移决策装置根据在设定时间段内待迁移虚拟机产生的脏页量、以及源物理机和目的物理机之间的网络带宽,预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机从源物理机热迁移到目的物理机,从而得出预估结果,并将该预估结果发送给迁移管理装置,由迁移管理装置根据预迁移决策装置的预估结果进行相应的调整。即通过预先统计虚拟机内存负载情况,判断是否可以热迁移,若内存脏页变化较大,可以提前判断待迁移虚拟机不可热迁移,从而避免热迁移失败引入的时间和空间开销。

Description

一种虚拟机热迁移系统及其热迁移方法
技术领域
本发明涉及虚拟机技术领域,尤其涉及一种虚拟机热迁移系统及其热迁移方法。
背景技术
虚拟化技术随着云计算的开展得到广泛应用,其中热迁移技术可以方便的将虚拟机在业务不中断的情况下,从一台物理机迁移到另一台物理机,在系统软硬件升级、负载均衡以及节能等场景得到广泛应用。
在热迁移时,首先在目的物理主机上启动同规格的虚拟机并置暂停状态,然后将源物理主机上虚拟机的内存通过网络复制到目的物理机的虚拟机中,由于虚拟机同时在运行,内存复制过程中会产生新的内存脏页,内存复制完后,继续将新产生的脏页内容复制到目的物理机的虚拟机中,虚拟机内存持续迭代复制,直到内存脏页量很小时,中止虚拟机运行,将脏页全部同步到目的虚拟机,并激活目的虚拟机运行。
从上述过程可知,在内存负载压力大的情况下,虚拟机热迁移不一定成功。热迁移过程中,每一轮内存迭代拷贝,如果虚拟机的内存压力较大,产生的脏页数目不能收敛,当内存拷贝迭代次数超过阈值时,就会热迁移失败。对巨型虚拟机(比如数据库业务虚拟机等)而言,由于虚拟机占用的内存较大,目的物理主机需要预留同样的资源,热迁移过程中多轮迭代后才发现不能热迁移,同时热迁移过程由于将页表设为只读,对内存写操作会引入性能损耗,所以巨型虚拟机热迁移失败,会引入较高的空间和时间开销。
发明内容
本发明提供了一种虚拟机热迁移系统及其热迁移方法,避免热迁移失败引入的时间和空间开销。
第一方面,本发明提供了一种虚拟机热迁移系统,该虚拟机热迁移系统包括源物理机和目的物理机。在源物理机上安装有虚拟机监视器(Hypervisor),在虚拟机监视器上安装有待迁移虚拟机。该虚拟机热迁移系统还包括迁移管理装置,迁移管理装置用于将待迁移虚拟机从源物理机热迁移到目的物理机。在虚拟机监视器上还安装有与迁移管理装置通信连接的预迁移决策装置。预迁移决策装置根据在设定时间段内待迁移虚拟机产生的脏页量、以及源物理机和目的物理机之间的网络带宽,预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机从源物理机热迁移到目的物理机。预迁移决策装置还用于将预估结果发送给迁移管理装置。
在上述的方案中,通过设置预迁移决策装置,预迁移决策装置根据在设定时间段内待迁移虚拟机产生的脏页量、以及源物理机和目的物理机之间的网络带宽,预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机从源物理机热迁移到目的物理机,从而得出预估结果,并将该预估结果发送给迁移管理装置,由迁移管理装置根据预迁移决策装置的预估结果进行相应的调整。现有技术中不经预先估计能够完成热迁移,而是直接进行内存迭代拷贝的热迁移,直到迭代次数超出阈值,才确定热迁移失败,若热迁移失败,对待迁移虚拟机为巨型虚拟机的场景会引入较大的资源开销。本申请的方案相比现有技术,对待迁移虚拟机先预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机从源物理机热迁移到目的物理机,即通过预先统计虚拟机内存负载情况,判断是否可以热迁移,若内存脏页变化较大,可以提前判断待迁移虚拟机不可热迁移,从而避免热迁移失败引入的时间和空间开销。
在一个具体的实施方式中,预迁移决策装置根据设定时间段内待迁移虚拟机产生的脏页量,计算单位时间内的脏页变化率;并根据单位时间内的脏页变化率、以及源物理机和目的物理机之间的网络带宽,预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机从源物理机热迁移到目的物理机。以简化预估算法,同时提高预估准确性。
在一个具体的实施方式中,预迁移决策装置根据单位时间内的脏页变化率、以及源物理机和目的物理机之间的网络带宽,计算能否在允许业务中断时间内,将单位时间内产生的脏页从源物理机拷贝到目的物理机;并根据计算结果,预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机从源物理机热迁移到目的物理机。以准确判断能否完成热迁移。
在一个具体的实施方式中,如果计算结果为能够在允许业务中断时间内,将单位时间内产生的脏页从源物理机拷贝到目的物理结,则预迁移决策装置的预估结果为能够在内存迭代拷贝的次数不超过预设阈值的情况下,将待迁移虚拟机从源物理机热迁移到目的物理机。如果计算结果为不能够在允许业务中断时间内,将单位时间内产生的脏页从源物理机拷贝到目的物理机,则预迁移决策装置的预估结果为不能够在内存迭代拷贝的次数不超过预设阈值的情况下,将待迁移虚拟机从源物理机热迁移到目的物理机。
在一个具体的实施方式中,如果迁移管理装置接收到预迁移决策装置发送的预估结果为能够在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机从源物理机热迁移到目的物理机,则迁移管理装置采用包含有内存迭代拷贝的方式将待迁移虚拟机从源物理机热迁移到目的物理机。如果迁移管理装置接收到预迁移决策装置发送的预估结果为不能够在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机从源物理机热迁移到目的物理机,则迁移管理装置停止将待迁移虚拟机从源物理机热迁移到目的物理机。以根据预估结果确定是否进行热迁移,从而避免热迁移失败引入的时间和空间开销。
在一个具体的实施方式中,预迁移决策装置在设定时间段内,将待迁移虚拟机的EPT(Extended Page Tables)或NPT(Nested Page Tables)页表设置为只读,使虚拟机监视器能够截获待迁移虚拟机的内存写操作,以统计设定时间段内待迁移虚拟机产生的脏页量。以便于统计在设定时间段内的内存写操作的数据量。
在一个具体的实施方式中,设定时间段为60s~120s,提高判断脏页增加率的准确性,同时减小对待迁移虚拟机的正常运行造成影响的时间。
在一个具体的实施方式中,允许业务中断时间为不大于2s,以防止对待迁移虚拟机的正常运行造成较大的影响。
在一个具体的实施方式中,迁移管理装置为云计算平台,以便于进行远程控制。
第二方面,本发明还提供了一种基于上述虚拟机热迁移系统的热迁移方法,该热迁移方法包括:
迁移管理装置指定待迁移虚拟机,并将指定的待迁移虚拟机信息发送给预迁移决策装置;
预迁移决策装置根据在设定时间段内待迁移虚拟机产生的脏页量、以及源物理机和目的物理机之间的网络带宽,预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机从源物理机热迁移到目的物理机;
预迁移决策装置将预估结果发送给迁移管理装置。
在上述的方案中,通过使预迁移决策装置根据在设定时间段内待迁移虚拟机产生的脏页量、以及源物理机和目的物理机之间的网络带宽,预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机从源物理机热迁移到目的物理机,从而得出预估结果,并将该预估结果发送给迁移管理装置,由迁移管理装置根据预迁移决策装置的预估结果进行相应的调整。本申请的方案相比现有技术,对待迁移虚拟机先预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机从源物理机热迁移到目的物理机,即通过预先统计虚拟机内存负载情况,判断是否可以热迁移,若内存脏页变化较大,可以提前判断待迁移虚拟机不可热迁移,从而避免热迁移失败引入的时间和空间开销。
在一个具体的实施方式中,预迁移决策装置根据在设定时间段内待迁移虚拟机产生的脏页量、以及源物理机和目的物理机之间的网络带宽,预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机从源物理机热迁移到目的物理机包括:预迁移决策装置根据设定时间段内待迁移虚拟机产生的脏页量,计算单位时间内的脏页变化率;根据单位时间内的脏页变化率、以及源物理机和目的物理机之间的网络带宽,预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机从源物理机热迁移到目的物理机。以简化预估算法,同时提高预估准确性。
在一个具体的实施方式中,根据单位时间内的脏页变化率、以及源物理机和目的物理机之间的网络带宽,预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机从源物理机热迁移到目的物理机包括:预迁移决策装置根据单位时间内的脏页变化率、以及源物理机和目的物理机之间的网络带宽,计算能否在允许业务中断时间内,将单位时间内产生的脏页从源物理机拷贝到目的物理机;根据计算结果,预估能否在内存迭代拷贝的迭代次数不超过设定阈值的情况下,将待迁移虚拟机从源物理机热迁移到目的物理机。以准确判断能否完成热迁移。
在一个具体的实施方式中,根据计算结果,预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机从源物理机热迁移到目的物理机包括:如果计算结果为能够在允许业务中断时间内,将单位时间内产生的脏页从源物理机拷贝到目的物理机,则预迁移决策装置的预估结果为能够在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机从源物理机热迁移到目的物理机。如果计算结果为不能够在允许业务中断时间内,将单位时间内产生的脏页从源物理机拷贝到目的物理机,则预迁移决策装置的预估结果为不能够在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机从源物理机热迁移到目的物理机。以根据预估结果确定是否进行热迁移,从而避免热迁移失败引入的时间和空间开销。
附图说明
图1为本发明实施例提供的一种虚拟机热迁移系统的示意框图;
图2为本发明实施例提供的热迁移方法的一种流程图;
图3为本发明实施例提供的热迁移方法的另一种流程图;
图4为本发明实施例提供的热迁移方法的另一种流程图。
附图标记:
10-源物理机 20-目的物理机
30-虚拟机监视器 40-待迁移虚拟机
50-预迁移决策装置 60-迁移管理装置
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了方便理解本发明实施例提供的虚拟机热迁移系统,下面首先说明一下本发明实施例提供的虚拟机热迁移系统的应用场景,该虚拟机热迁移系统用于将待迁移虚拟机从源物理机热迁移到目的物理机的过程中。下面结合附图对该虚拟机热迁移系统进行详细的叙述。
参考图1,本发明实施例提供的虚拟机热迁移系统包括源物理机10和目的物理机20。在源物理机10上安装有虚拟机监视器30,在虚拟机监视器30上安装有待迁移虚拟机40。该虚拟机热迁移系统还包括迁移管理装置60,迁移管理装置60用于将待迁移虚拟机40从源物理机10热迁移到目的物理机20。具体的,在目的物理机20上还安装有虚拟机监视器30,迁移管理装置60用于将待迁移虚拟机40从源物理机10上热迁移到目的物理机20的虚拟机监视器30上。在设置迁移管理装置60时,该迁移管理装置60可以为云计算平台,以便于进行远程控制。
参考图1及图2,在虚拟机监视器30上还安装有与迁移管理装置60通信连接的预迁移决策装置50。预迁移决策装置50用于根据在设定时间段内待迁移虚拟机40产生的脏页量、以及源物理机10和目的物理机20之间的网络带宽,预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机40从源物理机10热迁移到目的物理机20。预迁移决策装置50还用于将预估结果发送给迁移管理装置60。即预迁移决策装置50用于先预估待迁移虚拟机40能否完成从源物理机10到目的物理机20的热迁移,之后根据预估结果,迁移管理装置60进行相应的调整。通过设置预迁移决策装置50,预迁移决策装置50根据在设定时间段内待迁移虚拟机40产生的脏页量、以及源物理机10和目的物理机20之间的网络带宽,预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机40从源物理机10热迁移到目的物理机20,从而得出预估结果,并将该预估结果发送给迁移管理装置60,由迁移管理装置60根据预迁移决策装置50的预估结果进行相应的调整。现有技术中不经预先估计能够完成热迁移,而是直接进行内存迭代拷贝的热迁移,直到迭代次数超出阈值,才确定热迁移失败,若热迁移失败,对待迁移虚拟机40为巨型虚拟机的场景会引入较大的资源开销。本申请的方案相比现有技术,对待迁移虚拟机40先预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机40从源物理机10热迁移到目的物理机20,即通过预先统计虚拟机内存负载情况,判断是否可以热迁移,若内存脏页变化较大,可以提前判断待迁移虚拟机40不可热迁移,从而避免热迁移失败引入的时间和空间开销。
在确定上述设定时间段的大小时,设定时间段的大小可以为60s~120s,具体的,设定时间段的大小可以为60s、70s、80s、90s、100s、110s、120s等介于60s~120s之间的任意值。以提高判断脏页增加率的准确性,同时减小对待迁移虚拟机40的正常运行造成影响的时间。
在具体实现预迁移决策装置50来统计设定时间段内产生的脏页量时,预迁移决策装置50在设定时间段内,可以将待迁移虚拟机40的EPT(Extended Page Tables)或NPT(Nested Page Tables)页表设置为只读,使虚拟机监视器30能够截获待迁移虚拟机40的内存写操作,以统计设定时间段内待迁移虚拟机40产生的脏页量。即由于将页表设置为只读,如果待迁移虚拟机40有内存写操作,将导致VM-exit,被虚拟机监视器30截获,由预迁移决策装置50统计该待迁移虚拟机40产生的脏页情况,以便于统计在设定时间段内的内存写操作的数据量。
预迁移决策装置50在具体进行预估时,参考图3,首先,预迁移决策装置50根据设定时间段内待迁移虚拟机40产生的脏页量,计算单位时间内的脏页变化率。之后,预迁移决策装置50根据单位时间内的脏页变化率、以及源物理机10和目的物理机20之间的网络带宽,预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机40从源物理机10热迁移到目的物理机20。即预迁移决策装置50根据单位时间内的脏页变化率、以及源物理机10与目的物理机20之间的网络带宽,预估待迁移虚拟机40能否在不超过预设阈值的内存迭代拷贝之后,完成从源物理机10到目的物理机20的热迁移,以简化预估算法,同时提高预估准确性。
预迁移决策装置50在具体根据单位时间内的脏页变化率、以及源物理机10和目的物理机20之间的网络带宽进行预估时,参考图4,首先,预迁移决策装置50根据单位时间段内的脏页变化率、以及源物理机10和目的物理机20之间的网络带宽,计算能否在允许业务中断时间内,将单位时间内产生的脏页从源物理机10拷贝到目的物理机20。之后,根据计算结果,预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机40从源物理机10热迁移到目的物理机20。以准确判断能否完成热迁移,同时不对待迁移虚拟机40的运行造成很大影响。即通过计算单位时间内的脏页变化率,之后计算能否在允许业务中断时间内将单位时间内产生的脏页从源物理机10拷贝到目的物理机20,以确定是否能够进行热迁移,从而提高判断能否成功将待迁移虚拟机40热迁移到目的物理机20的可能性。
预迁移决策装置50预估的结果可以为待迁移虚拟机40能够完成从源物理机10热迁移到目的物理机20,或者是待迁移虚拟机40不能够完成从源物理机10热迁移到目的物理机20。具体的结果如下:如果计算结果为能够在允许业务中断时间内,将单位时间内产生的脏页从源物理机10拷贝到目的物理结,则预迁移决策装置50的预估结果为能够在内存迭代拷贝的次数不超过预设阈值的情况下,将待迁移虚拟机40从源物理机10热迁移到目的物理机20。同样的,参考图4,此时预迁移决策装置50向迁移管理装置60发送的是能够完成待迁移虚拟机40向目的物理机20的热迁移。如果迁移管理装置60接收到预迁移决策装置50发送的预估结果为能够在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机40从源物理机10热迁移到目的物理机20,则迁移管理装置60可以采用包含有内存迭代拷贝的方式将待迁移虚拟机40从源物理机10热迁移到目的物理机20。以实现将待迁移虚拟机40从源物理机10热迁移到目的物理机20。
如果预迁移决策装置50的计算结果为不能够在允许业务中断时间内,将单位时间内产生的脏页从源物理机10拷贝到目的物理机20,则预迁移决策装置50的预估结果为不能够在内存迭代拷贝的次数不超过预设阈值的情况下,将待迁移虚拟机40从源物理机10热迁移到目的物理机20。同样的,参考图4,此时预迁移决策装置50向迁移管理装置60发送的是不能够完成待迁移虚拟机40向目的物理机20的热迁移。如果迁移管理装置60接收到预迁移决策装置50发送的预估结果为不能够在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机40从源物理机10热迁移到目的物理机20,则迁移管理装置60停止将待迁移虚拟机40从源物理机10热迁移到目的物理机20。以根据预估结果确定是否进行热迁移,从而避免热迁移失败引入的时间和空间开销。
另外,上述允许业务中断时间可以为不大于2s,具体的,允许业务中断时间可以为0.5s、1.0s、1.5s、2.0s等不大于2s的任意值,以防止对待迁移虚拟机40的正常运行造成较大的影响。
通过设置预迁移决策装置50,预迁移决策装置50根据在设定时间段内待迁移虚拟机40产生的脏页量、以及源物理机10和目的物理机20之间的网络带宽,预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机40从源物理机10热迁移到目的物理机20,从而得出预估结果,并将该预估结果发送给迁移管理装置60,由迁移管理装置60根据预迁移决策装置50的预估结果进行相应的调整。本申请的方案相比现有技术,对待迁移虚拟机40先预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机40从源物理机10热迁移到目的物理机20,即通过预先统计虚拟机内存负载情况,判断是否可以热迁移,若内存脏页变化较大,可以提前判断待迁移虚拟机40不可热迁移,从而避免热迁移失败引入的时间和空间开销。
另外,本发明实施例还提供了一种基于上述虚拟机热迁移系统的热迁移方法,参考图1及图2,该热迁移方法包括:
Step10:迁移管理装置60指定待迁移虚拟机40,并将指定的待迁移虚拟机40信息发送给预迁移决策装置50;
Step20:预迁移决策装置50根据在设定时间段内待迁移虚拟机40产生的脏页量、以及源物理机10和目的物理机20之间的网络带宽,预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机40从源物理机10热迁移到目的物理机20;
Step30:预迁移决策装置50将预估结果发送给迁移管理装置60。
通过使预迁移决策装置50根据在设定时间段内待迁移虚拟机40产生的脏页量、以及源物理机10和目的物理机20之间的网络带宽,预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机40从源物理机10热迁移到目的物理机20,从而得出预估结果,并将该预估结果发送给迁移管理装置60,由迁移管理装置60根据预迁移决策装置50的预估结果进行相应的调整。本申请的方案相比现有技术,对待迁移虚拟机40先预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机40从源物理机10热迁移到目的物理机20,即通过预先统计虚拟机内存负载情况,判断是否可以热迁移,若内存脏页变化较大,可以提前判断待迁移虚拟机40不可热迁移,从而避免热迁移失败引入的时间和空间开销。
预迁移决策装置50在具体根据在设定时间段内待迁移虚拟机40产生的脏页量、以及源物理机10和目的物理机20之间的网络带宽,预估能否成功将待迁移虚拟机40热迁移到目的物理机20时,参考图3,预迁移决策装置50可以先根据设定时间段内待迁移虚拟机40产生的脏页量,计算单位时间内的脏页变化率。之后根据单位时间内的脏页变化率、以及源物理机10和目的物理机20之间的网络带宽,预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机40从源物理机10热迁移到目的物理机20。以简化预估算法,同时提高预估准确性。
在预迁移决策装置50在具体根据单位时间内的脏页变化率、以及源物理机10和目的物理机20之间的网络带宽,预估待迁移虚拟机40能否完成热迁移时,参考图4,预迁移决策装置50可以先根据单位时间内的脏页变化率、以及源物理机10和目的物理机20之间的网络带宽,计算能否在允许业务中断时间内,将单位时间内产生的脏页从源物理机10拷贝到目的物理机20。之后,根据计算结果,预估能否在内存迭代拷贝的迭代次数不超过设定阈值的情况下,将待迁移虚拟机40从源物理机10热迁移到目的物理机20。以准确判断能否完成热迁移。
参考图4,预迁移决策装置50具体根据计算结果,预估的结果可能是待迁移虚拟机40能够完成热迁移到目的物理机20,也可能是待迁移虚拟机40不能够完成热迁移到目的物理机20。具体的预估结果如下:如果计算结果为能够在允许业务中断时间内,将单位时间内产生的脏页从源物理机10拷贝到目的物理机20,则预迁移决策装置50的预估结果为能够在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机40从源物理机10热迁移到目的物理机20。如果计算结果为不能够在允许业务中断时间内,将单位时间内产生的脏页从源物理机10拷贝到目的物理机20,则预迁移决策装置50的预估结果为不能够在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将待迁移虚拟机40从源物理机10热迁移到目的物理机20。以根据预估结果确定是否进行热迁移,从而避免热迁移失败引入的时间和空间开销。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (10)

1.一种虚拟机热迁移系统,其特征在于,包括:
源物理机和目的物理机;
安装在所述源物理机上的虚拟机监视器;
安装在所述虚拟机监视器上的待迁移虚拟机;
迁移管理装置,用于将所述待迁移虚拟机从所述源物理机热迁移到所述目的物理机;
其中,所述虚拟机监视器上还安装有与所述迁移管理装置通信连接的预迁移决策装置;所述预迁移决策装置根据在设定时间段内所述待迁移虚拟机产生的脏页量、以及所述源物理机和目的物理机之间的网络带宽,预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将所述待迁移虚拟机从所述源物理机热迁移到所述目的物理机;所述预迁移决策装置还将所述预估结果发送给所述迁移管理装置。
2.如权利要求1所述的虚拟机热迁移系统,其特征在于,所述预迁移决策装置根据所述设定时间段内所述待迁移虚拟机产生的脏页量,计算单位时间内的脏页变化率;并根据所述单位时间内的脏页变化率、以及所述源物理机和目的物理机之间的网络带宽,预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将所述待迁移虚拟机从所述源物理机热迁移到所述目的物理机。
3.如权利要求2所述的虚拟机热迁移系统,其特征在于,所述预迁移决策装置根据所述单位时间内的脏页变化率、以及所述源物理机和目的物理机之间的网络带宽,计算能否在允许业务中断时间内,将所述单位时间内产生的脏页从所述源物理机拷贝到所述目的物理机;并根据所述计算结果,预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将所述待迁移虚拟机从所述源物理机热迁移到所述目的物理机。
4.如权利要求3所述的虚拟机热迁移系统,其特征在于,如果所述计算结果为能够在允许业务中断时间内,将所述单位时间内产生的脏页从所述源物理机拷贝到所述目的物理机,则所述预迁移决策装置的预估结果为能够在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将所述待迁移虚拟机从所述源物理机热迁移到所述目的物理机;
如果所述计算结果为不能够在允许业务中断时间内,将所述单位时间内产生的脏页从所述源物理机拷贝到所述目的物理机,则所述预迁移决策装置的预估结果为不能够在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将所述待迁移虚拟机从所述源物理机热迁移到所述目的物理机。
5.如权利要求4所述的虚拟机热迁移系统,其特征在于,如果所述迁移管理装置接收到所述预迁移决策装置发送的预估结果为能够在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将所述待迁移虚拟机从所述源物理机热迁移到所述目的物理机,则所述迁移管理装置采用包含有内存迭代拷贝的方式将所述待迁移虚拟机从所述源物理机热迁移到所述目的物理机;
如果所述迁移管理装置接收到所述预迁移决策装置发送的预估结果为不能够在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将所述待迁移虚拟机从所述源物理机热迁移到所述目的物理机,则所述迁移管理装置停止将所述待迁移虚拟机从所述源物理机热迁移到所述目的物理机。
6.如权利要求1~5任一项所述的虚拟机热迁移系统,其特征在于,所述预迁移决策装置在所述设定时间段内,将所述待迁移虚拟机的EPT或NPT页表设置为只读,使所述虚拟机监视器能够截获所述待迁移虚拟机的内存写操作,以统计所述设定时间段内所述待迁移虚拟机产生的脏页量。
7.一种基于权利要求1所述的虚拟机热迁移系统的热迁移方法,其特征在于,包括:
迁移管理装置指定待迁移虚拟机,并将指定的待迁移虚拟机信息发送给预迁移决策装置;
所述预迁移决策装置根据在设定时间段内所述待迁移虚拟机产生的脏页量、以及所述源物理机和目的物理机之间的网络带宽,预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将所述待迁移虚拟机从所述源物理机热迁移到所述目的物理机;
所述预迁移决策装置将所述预估结果发送给所述迁移管理装置。
8.如权利要求7所述的热迁移方法,其特征在于,所述预迁移决策装置根据在设定时间段内所述待迁移虚拟机产生的脏页量、以及所述源物理机和目的物理机之间的网络带宽,预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将所述待迁移虚拟机从所述源物理机热迁移到所述目的物理机包括:
所述预迁移决策装置根据所述设定时间段内所述待迁移虚拟机产生的脏页量,计算单位时间内的脏页变化率;
根据所述单位时间内的脏页变化率、以及所述源物理机和目的物理机之间的网络带宽,预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将所述待迁移虚拟机从所述源物理机热迁移到所述目的物理机。
9.如权利要求8所述的热迁移方法,其特征在于,所述根据所述单位时间内的脏页变化率、以及所述源物理机和目的物理机之间的网络带宽,预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将所述待迁移虚拟机从所述源物理机热迁移到所述目的物理机包括:
所述预迁移决策装置根据所述单位时间内的脏页变化率、以及所述源物理机和目的物理机之间的网络带宽,计算能否在允许业务中断时间内,将所述单位时间内产生的脏页从所述源物理机拷贝到所述目的物理机;
根据所述计算结果,预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将所述待迁移虚拟机从所述源物理机热迁移到所述目的物理机。
10.如权利要求9所述的热迁移方法,其特征在于,所述根据所述计算结果,预估能否在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将所述待迁移虚拟机从所述源物理机热迁移到所述目的物理机包括:
如果所述计算结果为能够在允许业务中断时间内,将所述单位时间内产生的脏页从所述源物理机拷贝到所述目的物理机,则所述预迁移决策装置的预估结果为能够在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将所述待迁移虚拟机从所述源物理机热迁移到所述目的物理机;
如果所述计算结果为不能够在允许业务中断时间内,将所述单位时间内产生的脏页从所述源物理机拷贝到所述目的物理机,则所述预迁移决策装置的预估结果为不能够在内存迭代拷贝的迭代次数不超过预设阈值的情况下,将所述待迁移虚拟机从所述源物理机热迁移到所述目的物理机。
CN202011415532.3A 2020-12-04 2020-12-04 一种虚拟机热迁移系统及其热迁移方法 Pending CN112379974A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011415532.3A CN112379974A (zh) 2020-12-04 2020-12-04 一种虚拟机热迁移系统及其热迁移方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011415532.3A CN112379974A (zh) 2020-12-04 2020-12-04 一种虚拟机热迁移系统及其热迁移方法

Publications (1)

Publication Number Publication Date
CN112379974A true CN112379974A (zh) 2021-02-19

Family

ID=74590587

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011415532.3A Pending CN112379974A (zh) 2020-12-04 2020-12-04 一种虚拟机热迁移系统及其热迁移方法

Country Status (1)

Country Link
CN (1) CN112379974A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023274049A1 (zh) * 2021-06-30 2023-01-05 华为技术有限公司 一种虚拟机迁移方法以及相关装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150007172A1 (en) * 2013-06-28 2015-01-01 Sap Ag Cloud-enabled, distributed and high-availability system with virtual machine checkpointing
CN104965757A (zh) * 2015-01-21 2015-10-07 深圳市腾讯计算机系统有限公司 虚拟机热迁移的方法、虚拟机迁移管理装置及系统
CN107463424A (zh) * 2016-06-02 2017-12-12 北京金山云网络技术有限公司 一种虚拟机迁移方法及装置
CN108037980A (zh) * 2018-01-02 2018-05-15 腾讯科技(深圳)有限公司 控制执行虚拟机热迁移的方法、装置和可读存储介质
CN111625321A (zh) * 2020-07-30 2020-09-04 上海有孚智数云创数字科技有限公司 基于温度预测的虚拟机迁移规划调度方法及其系统与介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150007172A1 (en) * 2013-06-28 2015-01-01 Sap Ag Cloud-enabled, distributed and high-availability system with virtual machine checkpointing
CN104965757A (zh) * 2015-01-21 2015-10-07 深圳市腾讯计算机系统有限公司 虚拟机热迁移的方法、虚拟机迁移管理装置及系统
CN107463424A (zh) * 2016-06-02 2017-12-12 北京金山云网络技术有限公司 一种虚拟机迁移方法及装置
CN108037980A (zh) * 2018-01-02 2018-05-15 腾讯科技(深圳)有限公司 控制执行虚拟机热迁移的方法、装置和可读存储介质
CN111625321A (zh) * 2020-07-30 2020-09-04 上海有孚智数云创数字科技有限公司 基于温度预测的虚拟机迁移规划调度方法及其系统与介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李刘威: "虚拟机动态迁移算法的优化与实现", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023274049A1 (zh) * 2021-06-30 2023-01-05 华为技术有限公司 一种虚拟机迁移方法以及相关装置

Similar Documents

Publication Publication Date Title
KR101814560B1 (ko) 가상 머신 마이그레이션 관리 방법, 장치, 및 시스템
US9720728B2 (en) Migrating a VM when the available migration duration times of a source and destination node are greater than the VM's migration duration time
US8782235B2 (en) Resource migration system and resource migration method
WO2016165472A1 (zh) 一种创建虚拟机的方法和装置
CN108319617B (zh) 确定数据库主从差异的方法、装置及切换控制方法、装置
US11216345B2 (en) Technologies for limiting performance variation in a storage device
US10318166B1 (en) Preserving locality of storage accesses by virtual machine copies in hyper-converged infrastructure appliances
CN107967164B (zh) 一种虚拟机热迁移的方法及系统
TW201347459A (zh) 管理方法及其系統
JP5780377B2 (ja) 情報処理システム、及びアプリケーションの移転方法
CN112148430A (zh) 一种虚拟网络功能的虚拟机在线安全迁移的方法
CN104268003A (zh) 一种适用于虚拟机动态迁移的内存状态迁移方法
CN111611055B (zh) 一种虚拟设备最优空闲时间迁移法、装置及可读存储介质
CN112379974A (zh) 一种虚拟机热迁移系统及其热迁移方法
US9300530B2 (en) Management device, management method, and medium
CN108595250B (zh) 一种面向IaaS云平台的资源调度效率优化方法及系统
CN112631994A (zh) 数据迁移方法及系统
CN111722909A (zh) 一种虚拟机迁移方法、系统、设备及存储介质
US20220229689A1 (en) Virtualization platform control device, virtualization platform control method, and virtualization platform control program
WO2018192475A1 (zh) 虚机规格调整方法及装置
CN111831389A (zh) 一种数据处理方法、装置以及存储介质
CN113986878A (zh) 一种数据写入方法、数据迁移方法、装置及电子设备
CN114020218A (zh) 混合重复数据删除调度方法及系统
JP5500301B2 (ja) 監視制御システム、監視制御方法、監視制御サーバ及び監視制御プログラム
CN115016901B (zh) 一种虚拟机的迁移方法、装置、介质、及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination