WO2021023052A1

WO2021023052A1 - 虚拟机热迁移方法、装置、电子设备及计算机存储介质

Info

Publication number: WO2021023052A1
Application number: PCT/CN2020/105032
Authority: WO
Inventors: 张超
Original assignee: 阿里巴巴集团控股有限公司
Priority date: 2019-08-05
Filing date: 2020-07-28
Publication date: 2021-02-11
Also published as: CN112328354A

Abstract

本发明实施例提供了一种虚拟机热迁移方法、装置、电子设备及计算机存储介质，其中，虚拟机热迁移方法包括：根据切换触发指令，将第一物理机中用于指示虚拟客户机内存地址与宿主机物理地址映射关系的第一页表切换至第二页表；根据所述第二页表，将虚拟客户机从所述第一物理机热迁移至第二物理机；其中，所述第二页表的末级页表指示的物理内存页的尺寸满足设定大小，所述第一页表的末级页表指示的物理内存页的尺寸大于所述设定大小。通过本发明实施例，提升了虚拟客户机及其热迁移性能。

Description

虚拟机热迁移方法、装置、电子设备及计算机存储介质

本申请要求2019年08月05日递交的申请号为201910715884.1、发明名称为“虚拟机热迁移方法、装置、电子设备及计算机存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明实施例涉及数据处理技术领域，尤其涉及一种虚拟机热迁移方法、装置、电子设备及计算机存储介质。

背景技术

虚拟机热迁移是云计算运营中的一个关键技术，通过虚拟机热迁移可以在保证虚拟客户机正常运行的同时，将虚拟客户机从一个物理机迁移至另一个物理机，以实现计算资源的动态调度、物理机故障维修等。

具体地，虚拟机热迁移的过程是通过迭代的方式将虚拟客户机的内存从一个物理机拷贝到另一个物理机中，每次拷贝的内存内容根据虚拟客户机的内存分页确定。

传统的虚拟客户机一般采用4k BYTES的内存分页方式，即末级页表指示的内存页面大小为4k，而现在，为了提高虚拟客户机的性能，在分页时一般采用“大页”，例如采用2M BYTES或1G BYTES的内存分页方式。然而，内存分页方式的改变增加了虚拟机热迁移的对带宽的消耗，使得虚拟机热迁移的难度较高。现有技术中，为了较少对带宽的消耗，会在热迁移前直接删除原2M或1G的“大页”，然后通过缺页异常实现4K页表的重建，但是这种方式会导致虚拟客户机内的缺页异常量较大，使得虚拟客户机的性能受损。

有鉴于此，现有技术中亟需解决的技术问题是如何提供另一种难度较低的虚拟机热迁移方法。

发明内容

有鉴于此，本发明实施例提供一种虚拟机热迁移方法、装置、电子设备及计算机存储介质，以解决上述问题。

根据本发明实施例的第一方面，提供了一种虚拟机热迁移方法，包括：根据切换触发指令，将第一物理机中用于指示虚拟客户机内存地址与宿主机物理地址映射关系的第一页表切换至第二页表；根据所述第二页表，将虚拟客户机从所述第一物理机热迁移至第二物理机；其中，所述第二页表的末级页表指示的物理内存页的尺寸满足设定大小，所述第一页表的末级页表指示的物理内存页的尺寸大于所述设定大小。

根据本发明实施例的第二方面，提供了一种虚拟机热迁移装置，包括：切换模块，用于根据切换触发指令，将第一物理机中用于指示虚拟客户机内存地址与宿主机物理地址映射关系的第一页表切换至第二页表；热迁移模块，用于根据所述第二页表，将虚拟客户机从所述第一物理机热迁移至第二物理机；其中，所述第二页表的末级页表指示的物理内存页的尺寸满足设定大小，所述第一页表的末级页表指示的物理内存页的尺寸大于所述设定大小。

根据本发明实施例的第三方面，提供了一种电子设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如上所述的虚拟机热迁移方法对应的操作。

根据本发明实施例的第四方面，提供了一种计算机存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上所述的虚拟机热迁移方法。

根据本发明实施例提供的方案，在第一物理机中设置有第一页表和第二页表，第一和第二页表均用于指示虚拟客户机内存地址与宿主机物理地址之间的映射关系，以形成该映射关系的主备份设置。所不同的是，第二页表的末级页表指示的物理内存页的尺寸满足设定大小，如常规使用的4K BYTES大小，而第一页表的末级页表指示的物理内存页的尺寸则大于所述设定大小，即通常所说的“大页”。由此，根据第二页表即可实现虚拟机热迁移。一方面，因第二页表对应的物理内存页的尺寸满足设定大小，也即，满足了热迁移对物理内存页面的大小要求，提升了虚拟客户机及其热迁移成功率和性能；另一方面，通过第一页表和第二页表的主备份设置与合理切换，使得在将物理内存页面大小转变为热迁移所需的页面大小的过程中，不会引入虚拟机的暂停或者其他对虚拟机的运行产生性能影响的问题，大大降低了热迁移的页表大小改变对虚拟客户机运行造成的不良影响。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明实施例中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1为本发明实施例一的一种虚拟机热迁移方法的步骤流程图；

图2为本发明实施例二的一种虚拟机热迁移方法的步骤流程图；

图3为本发明实施例三的一种虚拟机热迁移方法的步骤流程图；

图4为本发明实施例四的一种虚拟机热迁移方法的步骤流程图；

图5为图4所示实施例中的第一页表和第二页表的示意图；

图6为本发明实施例五的一种虚拟机热迁移装置的结构框图；

图7为本发明实施例六的一种虚拟机热迁移装置的结构框图；

图8为本发明实施例七的一种电子设备的结构示意图。

具体实施方式

为了使本领域的人员更好地理解本发明实施例中的技术方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明实施例一部分实施例，而不是全部的实施例。基于本发明实施例中的实施例，本领域普通技术人员所获得的所有其他实施例，都应当属于本发明实施例保护的范围。

下面结合本发明实施例附图进一步说明本发明实施例具体实现。

实施例一

参照图1，示出了根据本发明实施例一的一种虚拟机热迁移方法的步骤流程图。

本实施例的虚拟机热迁移方法包括以下步骤：

步骤S102：根据切换触发指令，将第一物理机中用于指示虚拟客户机内存地址与宿主机物理地址映射关系的第一页表切换至第二页表。

在虚拟机体系下，一台物理机可以被虚拟为多台虚拟机，该多台虚拟机即为虚拟客户机，该物理机可以被认为是多台虚拟机的宿主机。多台虚拟客户机通过用于指示虚拟客户机内存地址与宿主机物理地址映射关系的页表，使用宿主机的实际物理资源。例如，KVM(Kernel-based Virtual Machine)虚拟机体系、XEN虚拟机体系等多种虚拟机体系中，使用EPT(Extended Page Tables)页表实现虚拟客户机内存地址与宿主机物理地址映射。

本发明实施例中，在实现虚拟机体系下的虚拟机热迁移时，设置了第一页表和第二页表，第一页表和第二页表均为用于指示虚拟客户机内存地址与宿主机物理地址映射关系的页表，通过切换触发指令指示进行第一页表和第二页表的切换操作，进而基于第一页表和第二页表的切换操作进行虚拟机热迁移。其中，切换触发指令可以是任意适当的指令，或者是由任意适当的触发操作所触发的指令。切换后，可以将第一页表标记为只读，并且，如果热迁移中发生写错误异常的情况，也可以使用第二页表进行处理。

此外，本实施例中，第一页表和第二页表均为多级页表，第二页表的末级页表指示的物理内存页的尺寸满足设定大小，第一页表的末级页表指示的物理内存页的尺寸大于所述设定大小。其中，所述设定大小可以由本领域技术人员根据热迁移的内存拷贝迭代所需求的内存分页尺寸进行设置，例如，可以设置为4K BYTES。满足所述设定大小的物理内存页可以被称为“小页”，相应地，大于所述设定大小的物理内存页则可以被称为“大页”，如大小为2M BYTES或者1G BYTES的物理内存页。

第二页表可以根据第一页表中的信息进行进一步加工后生成，如，将第一页表中的“大页”分割为“小页”并建立相应的页表项后生成，以节约生成成本，提高生成效率。但不限于此，第二页表也可以采用常规生成页表的方式生成，如与第一页表相同的生成方式(例如EPT页表的生成方式)等。

需要说明的是，本发明实施例中，若无特殊说明，“多级”、“多个”等与“多”有关的数量均意指两个及两个以上。另外，“第一”和“第二”仅用于区别不同的页表，并不表示两个页表之间具有必然的顺序或时序关系。

步骤S104：根据第二页表，将虚拟客户机从第一物理机热迁移至第二物理机。

因第二页表的末级页表指示的物理内存页的尺寸满足所述设定大小，也即，满足虚拟机热迁移的内存拷贝迭代所需求的内存分页尺寸，因此，基于该第二页表即可实现将虚拟客户机从第一物理机热迁移至第二物理机。

通过本实施例，在第一物理机中设置有第一页表和第二页表，第一和第二页表均用于指示虚拟客户机内存地址与宿主机物理地址之间的映射关系，以形成该映射关系的主备份设置。所不同的是，第二页表的末级页表指示的物理内存页的尺寸满足设定大小，如常规使用的4K BYTES大小，而第一页表的末级页表指示的物理内存页的尺寸则大于所述设定大小，即通常所说的“大页”。由此，根据第二页表即可实现虚拟机热迁移。一方面，因第二页表对应的物理内存页的尺寸满足设定大小，也即，满足了热迁移对物理内存页面的大小要求，提升了虚拟客户机及其热迁移成功率和性能；另一方面，通过第一页表和第二页表的主备份设置与合理切换，使得在将物理内存页面大小转变为热迁移所需的页面大小的过程中，不会引入虚拟机的暂停或者其他对虚拟机的运行产生性能影响的问题，大大降低了热迁移的页表大小改变对虚拟客户机运行造成的不良影响。

本实施例的虚拟机热迁移方法可以由任意适当的具有数据处理能力的电子设备执行，包括但不限于：服务器、移动终端(如平板电脑、手机等)和PC机。

实施例二

参照图2，示出了本发明实施例二的一种虚拟机热迁移方法的步骤流程图。

本实施例的虚拟机热迁移方法包括以下步骤：

步骤S202：根据切换触发指令，将第一物理机中用于指示虚拟客户机内存地址与宿主机物理地址映射关系的第一页表切换至第二页表。

其中，第二页表的末级页表指示的物理内存页的尺寸满足设定大小，第一页表的末级页表指示的物理内存页的尺寸大于所述设定大小。所述设定大小如实施例一中所述，可以由本领域技术人员根据热迁移的内存拷贝迭代所需求的内存分页尺寸进行设置，例如，可以设置为4K BYTES。在KVM虚拟机体系、XEN虚拟机体系等多种虚拟机体系下，第一页表和第二页表均可采用EPT(Extended Page Tables，扩展页表)页表的形式。

在一种可行方式中，本步骤可以实现为：根据切换触发指令，将当前使用的虚拟机活动页表从第一页表切换为第二页表；并向第一物理机中的所有虚拟客户机发送用于指示重新加载页表的指示信号，以指示各个虚拟客户机将当前使用的第一页表中的页表节点切换至第二页表中对应的页表节点。

虚拟客户机需要通过处于活动状态的页表来使用宿主机的内存资源，本发明实施例为实现“大页”情况下的虚拟机热迁移，提供了第一页表和第二页表，其中，第一页表可以认为是指向“大页”的页表，而第二页表可以认为是指向“小页”的页表。基于此，在进行虚拟机热迁移时，需要将当前使用的虚拟机活动页表从第一页表切换为第二页表，进而，向第一物理机中的所有虚拟客户机发送用于指示重新加载页表的指示信号，以虚拟客户机为单位进行页表切换，以降低页表切换对虚拟客户机的性能影响。

可选地，可以以虚拟处理器(VCPU)为单位进行页表切换，进一步页表切换降低对虚拟客户机的性能影响。此种情况下，所述向第一物理机中的所有虚拟客户机发送用于指示重新加载页表的指示信号，以指示各个虚拟客户机将当前使用的第一页表中的页表节点切换至第二页表中对应的页表节点，包括：向第一物理机中的所有虚拟客户机对应的虚拟处理器发送用于指示重新加载页表的指示信号，以指示各个虚拟处理器将当前使用的第一页表中的页表节点切换至第二页表中对应的页表节点。

在根据切换触发指令，将当前使用的虚拟机活动页表从第一页表切换为第二页表时，一种可行方案中，可以在接收到切换触发指令后，根据第一页表创建第二页表；在第二页表创建成功后，将当前使用的虚拟机活动页表从第一页表切换为第二页表。但不限于此，第二页表也可提前创建，则在接收到切换触发指令后，直接进行切换即可。而采用在接收到切换触发指令后根据第一页表创建第二页表的方式，一方面，根据切换触发指令来创建第二页表，也即在确定了要进行热迁移才进行创建，有效保证了第二页表会被使用，避免了提前创建方式下第二页表后续可能不会被使用导致的数据浪费和资源浪费；另一方面，依据第一页表创建第二页表，提高了创建效率，也保证了切换的平稳过渡和虚拟机性能。

为了降低页表切换成本，提高页表切换效率，本发明实施例进一步提供了通过变量实现页表切换的方式。该种方式下，在将当前使用的虚拟机活动页表从第一页表切换为第二页表时，先确定指向虚拟机活动页表的根页表的第一变量对应的变量值，根据所述变量值确定当前使用的虚拟机活动页表为第一页表；再将第一变量重新赋值为设定值，根据所述设定值去激活第一页表，并激活第二页表作为虚拟机活动页表。其中，所述设定值可以由本领域技术人员根据实际情况适当设置，可以为数字也可以为字母或符号或者上述的结合。例如，以active_page作为第一变量，当active_page为1时，指示当前使用的虚拟机活动页表为第一页表，当active_page为0时，指示当前使用的虚拟机活动页表为第二页表。则可以通过改变active_page的变量值，即可实现对页表的切换指示。

在KVM虚拟机体系下，所述第一变量可以为内存管理单元节点MMU_NODE变量。设置使用MMU锁来保护MMU资源，则在将第一变量重新赋值为设定值之前，还可以对第一变量对应的内存管理单元MMU加锁；并且，在激活第二页表作为虚拟机活动页表之后，再对所述MMU解锁。以此，保证对MMU资源的独占使用。采用MMU_NODE变量的方式，便于后续通过改变NODE的值来实现第一页表和第二页表的快速切换，且可最大可能地与现有代码逻辑兼容。但如前所述，其它变量形式也同样适用。

此外，基于第一变量的设置，在采用前述向第一物理机中的所有虚拟客户机对应的虚拟处理器发送用于指示重新加载页表的指示信号，以指示各个虚拟处理器将当前使用的第一页表中的页表节点切换至第二页表中对应的页表节点的方式时，各个虚拟处理器可以通过以下方式将当前使用的第一页表中的页表节点切换至第二页表中对应的页表节点，包括：各个虚拟处理器根据所述指示信号，检查指向各虚拟处理器当前使用的根页表的第二变量的变量值和所述第一变量的变量值是否一致；若不一致，则使用所述第一变量的变量值替换所述第二变量的变量值。通过变量值替换的方式，可以简单快速地实现虚拟处理器使用的页表节点的切换，提高了切换效率。

可见，通过上述过程，有效实现了第一页表和第二页表之间的切换。基于此，可进行如下步骤S204。

步骤S204：根据第二页表，将虚拟客户机从第一物理机热迁移至第二物理机。

第二页表的末级页表指示的物理内存页的尺寸满足设定大小，如4K BYTES，可以有效满足虚拟机热迁移对内存分页尺寸的需求，通过第二页表，可一次完成所有的虚拟客户机内存页表更新，降低热迁移对虚拟机性能和用户的影响。

步骤S206：判断所述热迁移是否成功；若成功，则执行步骤S208；否则，执行步骤S210。

对虚拟机热迁移是否成功的判断可以采用常规方式实现，如虚拟客户机是否运行正常，数据是否完整等，本发明实施例在此不作限定。

步骤S208：若所述热迁移成功，则释放第一物理机中的第一页表和第二页表。结束本次流程。

在热迁移成功后，虚拟客户机的内存数据从第一物理机中成功拷贝到第二物理机中，热迁移后的虚拟客户机可使用第二物理机中相应的数据和机制进行正常工作，在此情况下，可释放第一物理机中第一页表和第二页表，包括释放与页表相关的数据以及占用的资源等。

步骤S210：若所述热迁移失败，则进行失败处理。

一种情况下，进行热迁移操作后，虚拟客户机在第二物理机上不能正常工作，也即，虽然进行了热迁移但热迁移没有成功且触发了回滚操作。针对此种热迁移失败情况，可则将第二页表切换回第一页表，并释放第一物理机中的第二页表。也即，通过将第二页表切换回第一页表，以使虚拟客户机可以在云端根据第一页表正常工作，并且释放掉第二页表。因该种情况下，热迁移失败可能是由诸如迁移不收敛等原因引起，因此，可以进行切换回第一页表以及热迁移回滚操作，以保证虚拟客户机在原状况下工作，继续使用第一页表，提升虚拟机性能，避免影响用户使用。

另一种情况下，若在所述热迁移过程中出现热迁移异常(如虚拟客户机异常退出或关机)，则可以先释放第二页表，再将当前使用的虚拟机活动页表切换回第一页表后，释放第一页表。也即，热迁移还没有完成，在热迁移过程中即出现异常，此时，需要将第一页表和第二页表的相关数据及占用的资源均释放掉。

需要说明的是，在实际应用中，也可以同时释放第一和第二页表。但采用先释放第二页表，再将当前使用的虚拟机活动页表切换回第一页表后释放的方式，更符合方案实现的实际代码逻辑。

通过步骤S206-S210，有效实现了对热迁移不成功情况的处理，保证了热迁移的可靠性和安全性。

实施例三

参照图3，示出了根据本发明实施例三的一种虚拟机热迁移方法的步骤流程图。

本实施例以如何创建第二页表为侧重点，对本发明实施例提供的虚拟机热迁移方案进行说明。

本实施例的虚拟机热迁移方法包括以下步骤：

步骤S302：接收到切换触发指令后，根据第一页表创建第二页表。

其中，第二页表的末级页表指示的物理内存页的尺寸满足设定大小，第一页表的末级页表指示的物理内存页的尺寸大于所述设定大小。所述设定大小如实施例一中所述，可以由本领域技术人员根据热迁移的内存拷贝迭代所需求的内存分页尺寸进行设置，例如，可以设置为4K BYTES。

在一种可行方式中，可以对第一页表指向的虚拟内存槽所对应的内存反向映射表进行遍历，根据遍历结果创建第二页表。由此，可以实现第二页表的快速创建。在另一种可行方式中，也可以通过直接遍历第一页表，然后，基于遍历结果以及相应的“小页分割”结果来创建第二页表。

内存反向映射表中记录了反映宿主机的物理内存地址及其对应的虚拟地址的映射关系。每当一个物理内存页被映射到一块新的虚拟地址空间(此处为虚拟客户机物理地址)的时候，该物理内存页对应的末级页表项会被记录到内存反向映射表中。而虚拟客户机的内存由多个虚拟内存槽memslot构成，每个memslot互不重叠。也即，通过遍历各个虚拟内存槽memslot对应的内存反向映射表，可获得所述虚拟客户机的内存地址与对应的物理内存地址的映射关系。据此，可以获得用于创建第二页表的数据和信息。又因第二页表的末级页表指示的物理内存页的尺寸需要满足设定大小，因此需要根据相应内存反向映射表的遍历结果进行进一步处理，如将遍历出的物理内存页尺寸大于所述设定大小的页面按照所述设定大小进行分割后，生成相应的第二页表中的表项。

例如，根据遍历结果创建第二页表可以包括：根据遍历的各个末级页表项拷贝生成第二页表中的末级页表项，并使用设定标识对生成的所述末级页表项进行标记；判断生成的所述末级页表项指向的物理内存页的尺寸是否大于所述设定大小；若大于，则删除所述末级页表项对应的所述设定标识，并根据所述末级页表项指向的物理内存页的尺寸，为所述末级页表项建立至少一级子页表项，其中，所述至少一级子页表项中的最后一级页表项指向的物理内存页的尺寸为所述设定大小。所述设定标识可以由本领域技术人员根据实际需求适当设置，本发明实施例对此不作限制；所述设定大小如前所述，在此不再赘述。

若物理内存页尺寸大于所述设定大小，表明其为“大页”，不符合第二页表的末级页表项要求，则需删除用于指示末级页表项的设定标识，并将“大页”处理为“小页”。从“大页”到“小页”可能需要一级或多级处理，例如，若“大页”为2M，则可将其处理为512个4K BYTES的“小页”，据此再在第二页表的当前表项级别之下建立下一级子页表项，每个子页表项指向一个4K BYTES的物理内存页。而若“大页”为1G，则需要先将其处理为512个2M的页面，再将每个2M的页面处理为512个4K BYTES的“小页”，据此再在第二页表的当前表项级别之下建立二级子页表项，第一级子页表项指向第二级子页表项，每个第二级子页表项指向一个4K BYTES的物理内存页。

而若生成的所述末级页表项指向的物理内存页的尺寸不大于所述设定大小，则表明其指向“小页”，可直接拷贝使用。

除此之外，针对每个生成的末级页表项，还可以判断生成的所述末级页表项对应的上级页表是否存在；若不存在，则为所述末级页表项生成对应的上级页表并保存至第二页表。通过这种方式，实现第二页表的完善和生成。

在某些情况下，宿主机的一个物理内存页可能被映射至一个虚拟客户机的多个内存页，此时，内存反向映射表中则存储有对应的指向所述物理内存页的多个末级页表项的链表。此时情况下，对第一页表指向的虚拟内存槽所对应的内存反向映射表进行遍历，根据遍历结果创建第二页表，包括：获取第一页表指向的虚拟内存槽所对应的内存反向映射表；对内存反向映射表的表项逐个进行遍历，判断当前表项中是否存储有所述链表；若存储有所述链表，则遍历所述链表中的每个末级页表项，并将所述链表对应的多个末级页表项的信息和遍历的每个末级页表项的内容拷贝至第二页表；若未存储有所述链表，则将所述当前表项的内容拷贝至第二页表。由此，有效解决了一个物理内存页被映射至多个虚拟客户机内存页对应的页表项的生成问题。

步骤S304：在第二页表创建成功后，将当前使用的虚拟机活动页表从第一页表切换为第二页表。

其中，将当前使用的虚拟机活动页表从第一页表切换为第二页表的具体实现可参照实施例二的步骤S202中的描述，在此不再赘述。

步骤S306：根据第二页表，将虚拟客户机从第一物理机热迁移至第二物理机。

实施例四

参照图4，示出了根据本发明实施例四的一种虚拟机热迁移方法的步骤流程图。

本实施例以KVM虚拟机体系为示例，对本发明实施例提供的虚拟机热迁移方法进行说明。KVM是一种在CPU硬件支持基础之上的虚拟化技术，可以实现为Linux的一个模块，即KVM模块。Linux在加载了KVM模块后，才能进一步通过其他工具创建虚拟机。但仅通过KVM模块用户无法直接控制操作系统内核进行操作，还需要通过相应的用户空间工具如Qemu实现对KVM的用户空间进行控制，即，通过Qemu实现在操作系统的用户模式下工作。

此外，在KVM中，为了实现内存虚拟化，让虚拟客户机使用一个隔离的、从零开始且具有连续的内存空间，KVM引入了客户机物理地址空间(Guest Physical Address，GPA)，GPA并不是真正的物理地址空间，它只是宿主机(Host机)虚拟地址空间(HVA)在虚拟客户机地址空间的一个映射。对虚拟客户机来说，GPA都是从零开始的连续地址空间，但对于宿主机来说，虚拟客户机的物理地址空间并不一定是连续的，虚拟客户机物理地址空间有可能映射在若干个不连续的宿主机地址区间。

由于虚拟客户机本质上是Host机上的一个进程，在虚拟化模式下，虚拟客户机处于非Root模式，无法直接访问Root模式下的Host机上的内存。此时，需要VMM(虚拟客户机监控器)的介入，通过VMM来intercept(截获)虚拟客户机的内存访问指令，然后virtualize(模拟)Host机上的内存，相当于VMM在虚拟客户机的虚拟地址空间(GVA)和Host机的虚拟地址空间(HVA)中间增加了一层，即GPA。

可见，内存虚拟化就是将虚拟客户机的虚拟地址(Guest Virtual Address，GVA)转化为Host的物理地址(Host Physical Address，HPA)，中间要经过虚拟机的物理地址(Guest Physical Address，GPA)和Host虚拟地址(Host Virtual Address，HVA)的转化，即：GVA→GPA→HVA→HPA。通过上述转化，建立起虚拟客户机与宿主机之间的内存映射关系，据此实现虚拟客户机对宿主机物理内存资源的使用。在虚拟机热迁移中，也需依据上述内存映射关系进行页表生成、热迁移等操作。

基于此，本实施例的虚拟机热迁移方法包括以下步骤：

步骤S402：Qemu线程在进行虚拟机热迁移前通过IOCTL调用触发生成切换触发指令，以指示准备进行主、备页表切换。

本实施例中，主页表即前述第一页表，备用页表(也称备页表)即前述第二页表。

需要说明的是，本实施例中，仅以IOCTL调用触发生成切换触发指令为例，但实际应用中，本领域技术人员还可以根据实际需求设置其它适当的触发操作或触发条件，以生成切换触发指令。

步骤S404：根据切换触发指令，依据主页表创建备用页表。

在KVM中，虚拟客户机的物理内存被分成若干个memslot，每个memslot互不重叠。本实施例中，采用依次遍历所有的memslot，依次完成各memslot对应的物理内存的页表项拷贝和重建的方式，来创建备用页表。具体地，采用遍历当前memslot的内存反向映射rmap表的表项的方式来创建备用页表。

内存反向映射rmap是一个记录物理内存地址和其虚拟地址对应关系的数据结构，它记录了每个物理内存页及其页表的关联关系。在实际应用中，可以通过Guest物理内存页的页框号(gfn)来找到与该物理内存页所关联的EPT页表，即rmap[gfn]。

每当一个宿主机的物理内存页被映射到一块新的虚拟地址空间(此处为虚拟机物理地址)的时候，该物理内存页对应的末级页表项地址会被记录到rmap[gfn]中。当一个宿主机的物理内存页同时被映射到多个新的虚拟地址空间的时候，rmap[gfn]中会记录一个pte链表的首地址，与该物理内存页相关联的所有末级页表项都会被记录到该pte链表中。

虚拟客户机的物理内存中包括的多个物理内存页面可以根据虚拟机的内存分配信息确定，确定的物理内存页面可以通过物理内存页面的页框号(gfn)表示。虚拟客户机的物理内存由多个memslot构成，每个memslot有一个basegfn，该basegfn记录了该memslot在整个虚拟客户机物理地址空间的起始偏移，memslot内部每个物理内存页面所对应的gfn由该memslot的basegfn和该物理内存页面在memslot内部的偏移量共同计算得出。为了遍历整个gfn，需要一次遍历每个memslot。

针对每个rmap[gfn]，如果其对应了多个虚拟地址空间，需要通过遍历rmap[gfn]对应的pte链表项中的每个末级页表项。所有的末级页表项遍历结束后，继续遍历下一个gfn。

对遍历获得的每个末级页表项，将其拷贝到备份页表即备份的EPT页表中。具体地，可以包括：(a)如果备份页表中，当前拷贝的末级页表项对应的上级页表不存在，则为该末级页表项建立相应的上级页表并加入到备份页表中(如采用和第一页表(如EPT)相同的建立方法)；(b)判断当前拷贝的末级页表项指向的页面是否为“大页”，如果不是“大页”，则在拷贝结束后回到(a)继续遍历下一个页表项；如果是“大页”，则要将表明该页表项为末级页表项的标志删除，然后，再依次建立该指向“大页”的页表项对应的所有子页表项。

其中，上述建立该指向“大页”的页表项对应的所有子页表项包括：首先从该指向 “大页”的页表项中，查询该页表项关联的虚拟客户机的物理页框号gfn及其在宿主机中的真实的物理页框号pfn；判断创建页表项所需的内存缓存池资源是否充足，如果不充足，向缓存池中新增缓存资源；如果充足，针对该“大页”物理内存所涵盖的所有“小页”物理内存，依次创建其对应的多级“小页”页表(例如，对2M BYTES的“大页”，需要分别创建2M BYTES和4K BYTES级别的页表；对1G BYTES的“大页”，需要分别创建1G BYTES、2M BYTES和4K BYTES三级页表。具体到EPT页表时，对1G BYTES的物理内存需要创建第二、三、四级页表，对2M BYTES的物理内存需要创建第三、四级页表)。

进而，进行备份页表的表项的填写，包括：对非末级页表(第四级页表之外的页表)，从该gfn对应的第一级页表进行查询，查看其对应的下一级页表是否存在；如果不存在，则为下一级页表申请一个页表，并将该新申请的页表内存的物理地址等信息填入第一级页表。重复上述过程，直到最后一级页表，即第四级页表。对于末级页表(第四级页表)，根据内存属性，对应的gfn、pfn信息，填入末级页表。其中，对于内存属性的dirtybit，标志位设置为0，以便后续使用pml进行跟踪。并且，将该末级页表添加到该gfn对应的rmap结构中，如果有多个gfn，需要将该末级页表项加入到对应的rmap链表中。在所有的物理内存遍历完成后，完成备用页表的创建工作。

一种创建完成的备份页表(即第二页表)与主页表(即第一页表)的对比如图5所示。图5中，主页表和备份页表均以EPT页表为例(主EPT页表、备EPT页表)，各节点含义与常规EPT页表相同。在图5中所示的主EPT页表中，直接使用高级的页表项如PDE或者PDPTE来指向一个物理“大页”。例如，PDE(第三级页表)指向2M BYTES的物理内存页(图5中实线方框所示)，PDPTE(第二级页表)指向1G BYTES的物理内存页(图中未示出)。备EPT页表通过主EPT页表创建，从图5中可见，备EPT页表使用PTE(第四级页表)指向4K BYTES的物理内存页(图5中虚线方框所示)，PTE作为备EPT页表的末级页表，完成整个物理内存映射。

步骤S406：将KVM的表明当前虚拟客户机的活跃的页表节点切换到备份页表节点。

本实施例中，为了避免页表整体切换对虚拟客户机的性能产生影响，将主备页表的切换流程拆解到vcpu粒度来实现。为此，本实施例引入了两个新的变量kvm->mmu_node和vcpu->mmu_node，其中，kvm->mmu_node表示当前KVM所指向的根页表,vcpu->mmu_node表示当前vcpu所使用的根页表。

基于上述变量，主备EPT页表的切换可以通过kvm->mmu_node＝kvm->mmu_node^1来完成。其中，“^1”表示1->0(从1至0)或者0->1(从0到1)的操作。例如，若用“1”指示主EPT页表，“0”指示备份EPT页表，假设需要从主EPT页表切换为备份EPT页表，则可以通过诸如：kvm->mmu_node＝kvm->mmu_node-1来实现。

此外，本实施例中，mmu_node采用mmu锁来保护，因此在更改mmu_node前需要获取mmu锁。以在备份页表的创建和切换过程中，和内存热插拔操作互斥。

步骤S408：向所有的vcpu发送mmu_reload信号。

该mmu_reload信号会被所有的vcpu在下次enter guest mode之前被调用，以进行页表的重新加载。

步骤S410：vcpu发现mmu_reload信号，检查当前vcpu使用的mmu_node和KVM所指定的活跃的mmu_node是否一致。如果一致，则该mmu_reload信号是因为别的原因触发，则不对其进行处理。如果不一致，则执行步骤S412。

步骤S412：如果vcpu发现使用的mmu_node和KVM所指定的活跃的mmu_node不一致，则将当前vcpu所使用的mmu_node替换成KVM所指定的mmu_node。

同时，切换该vcpu所使用的ept root table为备用页表的ept root table。

步骤S414：当所有的vcpu的mmu_node都和KVM所指定的mmu_node一致时，则切换完成。

步骤S416：刷新该vm对应的TLB缓存，确保新加载的页表生效；同时使能PML，开启对内存更改的监控。

TLB(Translation Lookaside Buffer，转换检测缓冲区)是一个内存管理单元,是用于改进虚拟地址到物理地址转换速度的缓存。TLB中的每一行都保存着一个由单个PTE(Page Table Entry,页表项)组成的块。通过TLB，无需每次读取数据都要两次访问内存(即查页表获得物理地址和读取数据)，直接从TLB中读取即可。CPU提供了TLB刷新指令，通过该指令和该VM对应的VPID信息，完成TLB的刷新。

PML是CPU的一个特性，该特性开启后，CPU会记录被CPU改写了的物理内存页面信息。而热迁移需要记录这个改写信息，从而保证源端和目的端的vm数据一致。

步骤S418：进行虚拟机热迁移。

即根据切换后的备份EPT页表，将第一物理机上的虚拟客户机热迁移至第二物理机。

步骤S420：进行虚拟机热迁移后处理。

如果虚拟机热迁移成功，则可以释放主页表和备份页表；如果虚拟机热迁移失败，虚拟客户机需要继续保持在第一物理机上工作，可以重复步骤S406-S416将备份EPT页表切换回主EPT页表，从而保证虚拟客户机能够使用回主EPT页表，从而带来虚拟客户机的性能提升。在切换回主EPT页表后，可以释放掉备份EPT页表。

在KVM中，active_mmu_pages记录了当前虚拟客户机所使用的所有页表项的地址缩影，主、备用页表各有一个active_mmu_pages。在虚拟机热迁移后，可以通过遍历相应页表对应的active_mmu_pages来实现相应页表的释放。

以备用页表的释放为例，该备用页表的释放流程包括：逐个遍历active_mmu_pages中的每一项；判断当前表项是否active，是否还存在页表子节点，如果存在页表子节点，则遍历所有的子节点，并记录所有的子节点到invalid列表中；释放invalid列表中的所有页表项，并以此释放所有的页表内存。

以上，以备用页表为例，对页表释放过程进行了说明，主页表的释放采用与上述备用页表的释放相同的方式，本领域技术人员可以根据上述描述实现主页表的释放，在此不再赘述。

通过本实施例，针对现有技术中采用“大页”方式组织页表情况下，在虚拟机热迁移导致的缺页异常给虚拟机性能带来很大抖动的问题，本实施例提供的方案在虚拟机热迁移前，主动地通过分析虚拟客户机的rmap的内存映射关系，对虚拟客户机的EPT页表进行备份重建，然后对每个vcpu依次进行备份EPT页表的根目录项root table的重新加载，一次性的将虚拟客户机的页表从主EPT页表切换到备份EPT页表，从而将该虚拟客户机的内存切换成标准的4KBYTES模式，有效提升了虚拟机性能，降低了虚拟机热迁移对用户的影响。

实施例五

参照图6，示出了根据本发明实施例五的一种虚拟机热迁移装置的结构框图。

本实施例的虚拟机热迁移装置包括：切换模块502，用于根据切换触发指令，将第一物理机中用于指示虚拟客户机内存地址与宿主机物理地址映射关系的第一页表切换至第二页表；热迁移模块504，用于根据所述第二页表，将虚拟客户机从所述第一物理机热迁移至第二物理机；其中，所述第二页表的末级页表指示的物理内存页的尺寸满足设定大小，所述第一页表的末级页表指示的物理内存页的尺寸大于所述设定大小。

本实施例的虚拟机热迁移装置用于实现前述多个方法实施例中相应的虚拟机热迁移方法，并具有相应的方法实施例的有益效果，在此不再赘述。此外，本实施例的虚拟机热迁移装置中的各个模块的功能实现均可参照前述方法实施例中的相应部分的描述，在此亦不再赘述。

实施例六

参照图7，示出了根据本发明实施例六的一种虚拟机热迁移装置的结构框图。

本实施例的虚拟机热迁移装置包括：切换模块602，用于根据切换触发指令，将第一物理机中用于指示虚拟客户机内存地址与宿主机物理地址映射关系的第一页表切换至第二页表；热迁移模块604，用于根据所述第二页表，将虚拟客户机从所述第一物理机热迁移至第二物理机；其中，所述第二页表的末级页表指示的物理内存页的尺寸满足设定大小，所述第一页表的末级页表指示的物理内存页的尺寸大于所述设定大小。

可选地，所述切换模块602包括：活动页表切换子模块6022，用于根据切换触发指令，将当前使用的虚拟机活动页表从第一页表切换为第二页表；指示子模块6024，用于向所述第一物理机中的所有虚拟客户机发送用于指示重新加载页表的指示信号，以指示各个虚拟客户机将当前使用的第一页表中的页表节点切换至第二页表中对应的页表节点。

可选地，所述活动页表切换子模块6022包括：创建单元60222，用于接收到切换触发指令后，根据所述第一页表创建所述第二页表；创建后切换单元60224，用于在所述第二页表创建成功后，将当前使用的虚拟机活动页表从所述第一页表切换为所述第二页表。

可选地，所述创建后切换单元60224，用于在所述第二页表创建成功后，确定指向所述虚拟机活动页表的根页表的第一变量对应的变量值，根据所述变量值确定当前使用的虚拟机活动页表为所述第一页表；将所述第一变量重新赋值为设定值，根据所述设定值去激活所述第一页表，并激活所述第二页表作为虚拟机活动页表。

可选地，所述第一变量为内存管理单元节点MMU_NODE变量；所述创建后切换单元60224，还用于在所述将所述第一变量重新赋值为设定值之前，对所述第一变量对应的内存管理单元MMU加锁；以及，在所述激活所述第二页表作为虚拟机活动页表之后，对所述MMU解锁。

可选地，所述指示子模块6024，用于向所述第一物理机中的所有虚拟客户机对应的虚拟处理器发送用于指示重新加载页表的指示信号，以指示各个虚拟处理器将当前使用的第一页表中的页表节点切换至第二页表中对应的页表节点。

可选地，各个虚拟处理器通过以下方式将当前使用的第一页表中的页表节点切换至第二页表中对应的页表节点：各个虚拟处理器根据所述指示信号，检查指向各虚拟处理器当前使用的根页表的第二变量的变量值和所述第一变量的变量值是否一致；若不一致，则使用所述第一变量的变量值替换所述第二变量的变量值。

可选地，本实施例的虚拟机热迁移装置还包括：第一热迁移处理模块606，用于判断所述热迁移是否成功；若所述热迁移成功，则释放所述第一物理机中的所述第一页表和所述第二页表；若所述热迁移失败，则将所述第二页表切换回所述第一页表，并释放所述第一物理机中的所述第二页表。

可选地，所述创建单元60222，用于接收到切换触发指令后，对所述第一页表指向的虚拟内存槽所对应的内存反向映射表进行遍历，根据遍历结果创建所述第二页表。

可选地，所述创建单元60222，用于接收到切换触发指令后，对所述第一页表指向的虚拟内存槽所对应的内存反向映射表进行遍历；根据遍历的各个末级页表项拷贝生成所述第二页表中的末级页表项，并使用设定标识对生成的所述末级页表项进行标记；判断生成的所述末级页表项指向的物理内存页的尺寸是否大于所述设定大小；若大于，则删除所述末级页表项对应的所述设定标识，并根据所述末级页表项指向的物理内存页的尺寸，为所述末级页表项建立至少一级子页表项，其中，所述至少一级子页表项中的最后一级页表项指向的物理内存页的尺寸为所述设定大小。

可选地，所述创建单元60222，还用于判断生成的所述末级页表项对应的上级页表是否存在；若不存在，则为所述末级页表项生成对应的上级页表并保存至所述第二页表。

可选地，当宿主机的一个物理内存页被映射至多个虚拟客户机内存页时，则所述内存反向映射表中存储有对应的指向所述物理内存页的多个末级页表项的链表。

可选地，所述创建单元60222在对所述第一页表指向的虚拟内存槽所对应的内存反向映射表进行遍历，根据遍历结果创建所述第二页表时：获取所述第一页表指向的虚拟内存槽所对应的内存反向映射表；对所述内存反向映射表的表项逐个进行遍历，判断当前表项中是否存储有所述链表；若存储有所述链表，则遍历所述链表中的每个末级页表项，并将所述链表对应的多个末级页表项的信息和遍历的每个末级页表项的内容拷贝至所述第二页表；若未存储有所述链表，则将所述当前表项的内容拷贝至所述第二页表。

可选地，本实施例的虚拟机热迁移装置还包括：第二热迁移处理模块608，用于若在所述热迁移过程中出现热迁移异常，则先释放所述第二页表，再将当前使用的虚拟机活动页表切换回所述第一页表后，释放所述第一页表。

实施例七

一种电子设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如上所述的虚拟机热迁移方法对应的操作。

具体地，参照图8，示出了根据本发明实施例七的一种电子设备的结构示意图，本发明具体实施例并不对电子设备的具体实现做限定。

如图8所示，该电子设备可以包括：处理器(processor)702、通信接口(Communications Interface)704、存储器(memory)706、以及通信总线708。

其中：

处理器702、通信接口704、以及存储器706通过通信总线708完成相互间的通信。

通信接口704，用于与其它电子设备或服务器进行通信。

处理器702，用于执行程序710，具体可以执行上述虚拟机热迁移方法实施例中的相关步骤。

具体地，程序710可以包括程序代码，该程序代码包括计算机操作指令。

处理器702可能是中央处理器CPU，或者是特定集成电路ASIC(Application Specific Integrated Circuit)，或者是被配置成实施本发明实施例的一个或多个集成电路。电子设备包括的一个或多个处理器，可以是同一类型的处理器，如一个或多个CPU；也可以是不同类型的处理器，如一个或多个CPU以及一个或多个ASIC。

存储器706，用于存放程序710。存储器706可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

程序710具体可以用于使得处理器702执行以下操作：根据切换触发指令，将第一物理机中用于指示虚拟客户机内存地址与宿主机物理地址映射关系的第一页表切换至第二页表；根据所述第二页表，将虚拟客户机从所述第一物理机热迁移至第二物理机；其中，所述第二页表的末级页表指示的物理内存页的尺寸满足设定大小，所述第一页表的末级页表指示的物理内存页的尺寸大于所述设定大小。

在一种可选的实施方式中，程序710还用于使得处理器702在根据切换触发指令，将第一物理机中用于指示虚拟客户机内存地址与宿主机物理地址映射关系的第一页表切换至第二页表时：根据切换触发指令，将当前使用的虚拟机活动页表从第一页表切换为第二页表；并向所述第一物理机中的所有虚拟客户机发送用于指示重新加载页表的指示信号，以指示各个虚拟客户机将当前使用的第一页表中的页表节点切换至第二页表中对应的页表节点。

在一种可选的实施方式中，程序710还用于使得处理器702在根据切换触发指令，将当前使用的虚拟机活动页表从第一页表切换为第二页表时：接收到切换触发指令后，根据所述第一页表创建所述第二页表；在所述第二页表创建成功后，将当前使用的虚拟机活动页表从所述第一页表切换为所述第二页表。

在一种可选的实施方式中，程序710还用于使得处理器702在将当前使用的虚拟机活动页表从所述第一页表切换为所述第二页表时：确定指向所述虚拟机活动页表的根页表的第一变量对应的变量值，根据所述变量值确定当前使用的虚拟机活动页表为所述第一页表；将所述第一变量重新赋值为设定值，根据所述设定值去激活所述第一页表，并激活所述第二页表作为虚拟机活动页表。

在一种可选的实施方式中，所述第一变量为内存管理单元节点MMU_NODE变量；程序710还用于使得处理器702在在所述将所述第一变量重新赋值为设定值之前，对所述第一变量对应的内存管理单元MMU加锁；以及，在所述激活所述第二页表作为虚拟机活动页表之后，对所述MMU解锁。

在一种可选的实施方式中，程序710还用于使得处理器702在向所述第一物理机中的所有虚拟客户机发送用于指示重新加载页表的指示信号，以指示各个虚拟客户机将当前使用的第一页表中的页表节点切换至第二页表中对应的页表节点时：向所述第一物理机中的所有虚拟客户机对应的虚拟处理器发送用于指示重新加载页表的指示信号，以指示各个虚拟处理器将当前使用的第一页表中的页表节点切换至第二页表中对应的页表节点。

在一种可选的实施方式中，各个虚拟处理器通过以下方式将当前使用的第一页表中的页表节点切换至第二页表中对应的页表节点：各个虚拟处理器根据所述指示信号，检查指向各虚拟处理器当前使用的根页表的第二变量的变量值和所述第一变量的变量值是否一致；若不一致，则使用所述第一变量的变量值替换所述第二变量的变量值。

在一种可选的实施方式中，程序710还用于使得处理器702判断所述热迁移是否成功；若所述热迁移成功，则释放所述第一物理机中的所述第一页表和所述第二页表；若所述热迁移失败，则将所述第二页表切换回所述第一页表，并释放所述第一物理机中的所述第二页表。

在一种可选的实施方式中，程序710还用于使得处理器702在根据所述第一页表创建所述第二页表时：对所述第一页表指向的虚拟内存槽所对应的内存反向映射表进行遍历，根据遍历结果创建所述第二页表。

在一种可选的实施方式中，程序710还用于使得处理器702在根据遍历结果创建所述第二页表时：根据遍历的各个末级页表项拷贝生成所述第二页表中的末级页表项，并使用设定标识对生成的所述末级页表项进行标记；判断生成的所述末级页表项指向的物理内存页的尺寸是否大于所述设定大小；若大于，则删除所述末级页表项对应的所述设定标识，并根据所述末级页表项指向的物理内存页的尺寸，为所述末级页表项建立至少一级子页表项，其中，所述至少一级子页表项中的最后一级页表项指向的物理内存页的尺寸为所述设定大小。

在一种可选的实施方式中，程序710还用于使得处理器702判断生成的所述末级页表项对应的上级页表是否存在；若不存在，则为所述末级页表项生成对应的上级页表并保存至所述第二页表。

在一种可选的实施方式中，当宿主机的一个物理内存页被映射至多个虚拟客户机内存页时，则所述内存反向映射表中存储有对应的指向所述物理内存页的多个末级页表项的链表。

在一种可选的实施方式中，程序710还用于使得处理器702在对所述第一页表指向的虚拟内存槽所对应的内存反向映射表进行遍历，根据遍历结果创建所述第二页表时：获取所述第一页表指向的虚拟内存槽所对应的内存反向映射表；对所述内存反向映射表的表项逐个进行遍历，判断当前表项中是否存储有所述链表；若存储有所述链表，则遍历所述链表中的每个末级页表项，并将所述链表对应的多个末级页表项的信息和遍历的每个末级页表项的内容拷贝至所述第二页表；若未存储有所述链表，则将所述当前表项的内容拷贝至所述第二页表。

在一种可选的实施方式中，程序710还用于使得处理器702在若所述热迁移过程中出现热迁移异常，则先释放所述第二页表，再将当前使用的虚拟机活动页表切换回所述第一页表后，释放所述第一页表。

程序710中各步骤的具体实现可以参见上述虚拟机热迁移方法实施例中的相应步骤和单元中对应的描述，在此不赘述。所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的设备和模块的具体工作过程，可以参考前述方法实施例中的对应过程描述，在此不再赘述。

本实施例的电子设备，在第一物理机中设置有第一页表和第二页表，第一和第二页表均用于指示虚拟客户机内存地址与宿主机物理地址之间的映射关系，以形成该映射关系的主备份设置。所不同的是，第二页表的末级页表指示的物理内存页的尺寸满足设定大小，如常规使用的4K BYTES大小，而第一页表的末级页表指示的物理内存页的尺寸则大于所述设定大小，即通常所说的“大页”。由此，根据第二页表即可实现虚拟机热迁移。一方面，因第二页表对应的物理内存页的尺寸满足设定大小，也即，满足了热迁移对物理内存页面的大小要求，提升了虚拟客户机及其热迁移成功率和性能；另一方面，通过第一页表和第二页表的主备份设置与合理切换，使得在将物理内存页面大小转变为热迁移所需的页面大小的过程中，不会引入虚拟机的暂停或者其他对虚拟机的运行产生性能影响的问题，大大降低了热迁移的页表大小改变对虚拟客户机运行造成的不良影响。

需要指出，根据实施的需要，可将本发明实施例中描述的各个部件/步骤拆分为更多部件/步骤，也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤，以实现本发明实施例的目的。

上述根据本发明实施例的方法可在硬件、固件中实现，或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码，或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码，从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解，计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如，RAM、ROM、闪存等)，当所述软件或计算机代码被计算机、处理器或硬件访问且执行时，实现在此描述的虚拟机热迁移方法。此外，当通用计算机访问用于实现在此示出的虚拟机热迁移方法的代码时，代码的执行将通用计算机转换为用于执行在此示出的虚拟机热迁移方法的专用计算机。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及方法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明实施例的范围。

以上实施方式仅用于说明本发明实施例，而并非对本发明实施例的限制，有关技术领域的普通技术人员，在不脱离本发明实施例的精神和范围的情况下，还可以做出各种变化和变型，因此所有等同的技术方案也属于本发明实施例的范畴，本发明实施例的专利保护范围应由权利要求限定。

Claims

一种虚拟机热迁移方法，其特征在于，包括：

根据切换触发指令，将第一物理机中用于指示虚拟客户机内存地址与宿主机物理地址映射关系的第一页表切换至第二页表；

根据所述第二页表，将虚拟客户机从所述第一物理机热迁移至第二物理机；

其中，所述第二页表的末级页表指示的物理内存页的尺寸满足设定大小，所述第一页表的末级页表指示的物理内存页的尺寸大于所述设定大小。
根据权利要求1所述的方法，其特征在于，所述根据切换触发指令，将第一物理机中用于指示虚拟客户机内存地址与宿主机物理地址映射关系的第一页表切换至第二页表，包括：

根据切换触发指令，将当前使用的虚拟机活动页表从第一页表切换为第二页表；

并向所述第一物理机中的所有虚拟客户机发送用于指示重新加载页表的指示信号，以指示各个虚拟客户机将当前使用的第一页表中的页表节点切换至第二页表中对应的页表节点。
根据权利要求2所述的方法，其特征在于，所述根据切换触发指令，将当前使用的虚拟机活动页表从第一页表切换为第二页表，包括：

接收到切换触发指令后，根据所述第一页表创建所述第二页表；

在所述第二页表创建成功后，将当前使用的虚拟机活动页表从所述第一页表切换为所述第二页表。
根据权利要求3所述的方法，其特征在于，所述将当前使用的虚拟机活动页表从所述第一页表切换为所述第二页表，包括：

确定指向所述虚拟机活动页表的根页表的第一变量对应的变量值，根据所述变量值确定当前使用的虚拟机活动页表为所述第一页表；

将所述第一变量重新赋值为设定值，根据所述设定值去激活所述第一页表，并激活所述第二页表作为虚拟机活动页表。
根据权利要求4所述的方法，其特征在于，所述第一变量为内存管理单元节点MMU_NODE变量；

在所述将所述第一变量重新赋值为设定值之前，所述方法还包括：对所述第一变量对应的内存管理单元MMU加锁；

在所述激活所述第二页表作为虚拟机活动页表之后，所述方法还包括：对所述MMU 解锁。
根据权利要求4所述的方法，其特征在于，所述向所述第一物理机中的所有虚拟客户机发送用于指示重新加载页表的指示信号，以指示各个虚拟客户机将当前使用的第一页表中的页表节点切换至第二页表中对应的页表节点，包括：

向所述第一物理机中的所有虚拟客户机对应的虚拟处理器发送用于指示重新加载页表的指示信号，以指示各个虚拟处理器将当前使用的第一页表中的页表节点切换至第二页表中对应的页表节点。
根据权利要求6所述的方法，其特征在于，各个虚拟处理器通过以下方式将当前使用的第一页表中的页表节点切换至第二页表中对应的页表节点：

各个虚拟处理器根据所述指示信号，检查指向各虚拟处理器当前使用的根页表的第二变量的变量值和所述第一变量的变量值是否一致；

若不一致，则使用所述第一变量的变量值替换所述第二变量的变量值。
根据权利要求1-7任一项所述的方法，其特征在于，所述方法还包括：

判断所述热迁移是否成功；

若所述热迁移成功，则释放所述第一物理机中的所述第一页表和所述第二页表；

若所述热迁移失败，则将所述第二页表切换回所述第一页表，并释放所述第一物理机中的所述第二页表。
根据权利要求3-7任一项所述的方法，其特征在于，所述根据所述第一页表创建所述第二页表，包括：

对所述第一页表指向的虚拟内存槽所对应的内存反向映射表进行遍历，根据遍历结果创建所述第二页表。
根据权利要求9所述的方法，其特征在于，所述根据遍历结果创建所述第二页表，包括：

根据遍历的各个末级页表项拷贝生成所述第二页表中的末级页表项，并使用设定标识对生成的所述末级页表项进行标记；

判断生成的所述末级页表项指向的物理内存页的尺寸是否大于所述设定大小；

若大于，则删除所述末级页表项对应的所述设定标识，并根据所述末级页表项指向的物理内存页的尺寸，为所述末级页表项建立至少一级子页表项，其中，所述至少一级子页表项中的最后一级页表项指向的物理内存页的尺寸为所述设定大小。
根据权利要求9所述的方法，其特征在于，所述方法还包括：

判断生成的所述末级页表项对应的上级页表是否存在；

若不存在，则为所述末级页表项生成对应的上级页表并保存至所述第二页表。
根据权利要求9所述的方法，其特征在于，

当宿主机的一个物理内存页被映射至多个虚拟客户机内存页时，则所述内存反向映射表中存储有对应的指向所述物理内存页的多个末级页表项的链表。
根据权利要求12所述的方法，其特征在于，所述对所述第一页表指向的虚拟内存槽所对应的内存反向映射表进行遍历，根据遍历结果创建所述第二页表，包括：

获取所述第一页表指向的虚拟内存槽所对应的内存反向映射表；

对所述内存反向映射表的表项逐个进行遍历，判断当前表项中是否存储有所述链表；

若存储有所述链表，则遍历所述链表中的每个末级页表项，并将所述链表对应的多个末级页表项的信息和遍历的每个末级页表项的内容拷贝至所述第二页表；

若未存储有所述链表，则将所述当前表项的内容拷贝至所述第二页表。
根据权利要求1-7任一项所述的方法，其特征在于，所述方法还包括：

若在所述热迁移过程中出现热迁移异常，则先释放所述第二页表，再将当前使用的虚拟机活动页表切换回所述第一页表后，释放所述第一页表。
一种虚拟机热迁移装置，其特征在于，包括：

切换模块，用于根据切换触发指令，将第一物理机中用于指示虚拟客户机内存地址与宿主机物理地址映射关系的第一页表切换至第二页表；

热迁移模块，用于根据所述第二页表，将虚拟客户机从所述第一物理机热迁移至第二物理机；

其中，所述第二页表的末级页表指示的物理内存页的尺寸满足设定大小，所述第一页表的末级页表指示的物理内存页的尺寸大于所述设定大小。
根据权利要求15所述的装置，其特征在于，所述切换模块包括：

活动页表切换子模块，用于根据切换触发指令，将当前使用的虚拟机活动页表从第一页表切换为第二页表；

指示子模块，用于向所述第一物理机中的所有虚拟客户机发送用于指示重新加载页表的指示信号，以指示各个虚拟客户机将当前使用的第一页表中的页表节点切换至第二页表中对应的页表节点。
根据权利要求16所述的装置，其特征在于，所述活动页表切换子模块包括：

创建单元，用于接收到切换触发指令后，根据所述第一页表创建所述第二页表；

创建后切换单元，用于在所述第二页表创建成功后，将当前使用的虚拟机活动页表从所述第一页表切换为所述第二页表。
根据权利要求17所述的装置，其特征在于，所述创建后切换单元，用于在所述第二页表创建成功后，确定指向所述虚拟机活动页表的根页表的第一变量对应的变量值，根据所述变量值确定当前使用的虚拟机活动页表为所述第一页表；将所述第一变量重新赋值为设定值，根据所述设定值去激活所述第一页表，并激活所述第二页表作为虚拟机活动页表。
根据权利要求18所述的装置，其特征在于，所述第一变量为内存管理单元节点MMU_NODE变量；

所述创建后切换单元，还用于在所述将所述第一变量重新赋值为设定值之前，对所述第一变量对应的内存管理单元MMU加锁；以及，在所述激活所述第二页表作为虚拟机活动页表之后，对所述MMU解锁。
根据权利要求18所述的装置，其特征在于，所述指示子模块，用于向所述第一物理机中的所有虚拟客户机对应的虚拟处理器发送用于指示重新加载页表的指示信号，以指示各个虚拟处理器将当前使用的第一页表中的页表节点切换至第二页表中对应的页表节点。
根据权利要求20所述的装置，其特征在于，各个虚拟处理器通过以下方式将当前使用的第一页表中的页表节点切换至第二页表中对应的页表节点：

各个虚拟处理器根据所述指示信号，检查指向各虚拟处理器当前使用的根页表的第二变量的变量值和所述第一变量的变量值是否一致；

若不一致，则使用所述第一变量的变量值替换所述第二变量的变量值。
根据权利要求15-21任一项所述的装置，其特征在于，所述装置还包括：

第一热迁移处理模块，用于判断所述热迁移是否成功；若所述热迁移成功，则释放所述第一物理机中的所述第一页表和所述第二页表；若所述热迁移失败，则将所述第二页表切换回所述第一页表，并释放所述第一物理机中的所述第二页表。
根据权利要求17-21任一项所述的装置，其特征在于，所述创建单元，用于接收到切换触发指令后，对所述第一页表指向的虚拟内存槽所对应的内存反向映射表进行遍历，根据遍历结果创建所述第二页表。
根据权利要求23所述的装置，其特征在于，所述创建单元，用于接收到切换触发指令后，对所述第一页表指向的虚拟内存槽所对应的内存反向映射表进行遍历；根据遍历的各个末级页表项拷贝生成所述第二页表中的末级页表项，并使用设定标识对生成的所述末级页表项进行标记；判断生成的所述末级页表项指向的物理内存页的尺寸是否大于所述设定大小；若大于，则删除所述末级页表项对应的所述设定标识，并根据所述末级页表项指向的物理内存页的尺寸，为所述末级页表项建立至少一级子页表项，其中，所述至少一级子页表项中的最后一级页表项指向的物理内存页的尺寸为所述设定大小。
根据权利要求23所述的装置，其特征在于，所述创建单元，还用于判断生成的所述末级页表项对应的上级页表是否存在；若不存在，则为所述末级页表项生成对应的上级页表并保存至所述第二页表。
根据权利要求23所述的装置，其特征在于，

当宿主机的一个物理内存页被映射至多个虚拟客户机内存页时，则所述内存反向映射表中存储有对应的指向所述物理内存页的多个末级页表项的链表。
根据权利要求26所述的装置，其特征在于，所述创建单元在对所述第一页表指向的虚拟内存槽所对应的内存反向映射表进行遍历，根据遍历结果创建所述第二页表时：

获取所述第一页表指向的虚拟内存槽所对应的内存反向映射表；

对所述内存反向映射表的表项逐个进行遍历，判断当前表项中是否存储有所述链表；

若存储有所述链表，则遍历所述链表中的每个末级页表项，并将所述链表对应的多个末级页表项的信息和遍历的每个末级页表项的内容拷贝至所述第二页表；

若未存储有所述链表，则将所述当前表项的内容拷贝至所述第二页表。
根据权利要求15-21任一项所述的装置，其特征在于，所述装置还包括：

第二热迁移处理模块，用于若在所述热迁移过程中出现热迁移异常，则先释放所述第二页表，再将当前使用的虚拟机活动页表切换回所述第一页表后，释放所述第一页表。
一种电子设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如权利要求1-14任一项所述的虚拟机热迁移方法对应的操作。
一种计算机存储介质，其上存储有计算机程序，该程序被处理器执行时实现如权利要求1-14中任一所述的虚拟机热迁移方法。