CN110908832A - 一种云平台的虚拟机故障疏散方法、系统及计算机可读介质 - Google Patents

一种云平台的虚拟机故障疏散方法、系统及计算机可读介质 Download PDF

Info

Publication number
CN110908832A
CN110908832A CN201911018681.3A CN201911018681A CN110908832A CN 110908832 A CN110908832 A CN 110908832A CN 201911018681 A CN201911018681 A CN 201911018681A CN 110908832 A CN110908832 A CN 110908832A
Authority
CN
China
Prior art keywords
virtual machine
machine
host
evacuated
message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911018681.3A
Other languages
English (en)
Inventor
梁华
张一帆
高泽旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fiberhome Telecommunication Technologies Co Ltd
Original Assignee
Fiberhome Telecommunication Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fiberhome Telecommunication Technologies Co Ltd filed Critical Fiberhome Telecommunication Technologies Co Ltd
Priority to CN201911018681.3A priority Critical patent/CN110908832A/zh
Publication of CN110908832A publication Critical patent/CN110908832A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1479Generic software techniques for error detection or fault masking
    • G06F11/1482Generic software techniques for error detection or fault masking by means of middleware or OS functionality
    • G06F11/1484Generic software techniques for error detection or fault masking by means of middleware or OS functionality involving virtual machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1438Restarting or rejuvenating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45562Creating, deleting, cloning virtual machine instances

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种云平台的虚拟机故障疏散方法、系统及计算机可读介质,其通过获取待疏散虚拟机的节点地址,获取与待疏散虚拟机关联的宿主机节点地址;发送宿主机状态查询消息给宿主机,接收宿主机上报的状态消息;宿主机状态正常时,发送删除虚拟机关联消息给所述宿主机,否则,执行虚拟机重建操作;接收宿主机上传的虚拟机关联删除成功消息,执行虚拟机重建操作,从而解决虚拟机异地重建因原宿主机正常而发生虚拟机脑裂导致业务无法正常进行。

Description

一种云平台的虚拟机故障疏散方法、系统及计算机可读介质
技术领域
本发明属于云平台领域,具体涉及一种云平台的虚拟机故障疏散方法、系统及计算机可读介质。
背景技术
目前云平台的虚拟机疏散流程执行必要的条件是待疏散虚拟机的宿主机状态异常,并且使用共享存储(本地镜像启动虚拟机,evacuate后会重建系统盘),满足一般的HA故障场景触发虚拟机重建等场景,以openstack为基础的应用场景为示例,原生openstack/Nova中api.py代码模块文件中定义了evacuate方法,其通过调用RestfulAPI入口,将instance(虚拟机的实例)通过实例化对象调用变量的方式,将虚拟机所在宿主机变量传递给get_by_compute方法,从而实现对宿主机的服务状态进行检查,进而返回得到一个Service对象,如果计算服务状态为UP,直接抛错“Instance compute service stateexpected to be down,but it was up”,虚拟机疏散流程结束,虚拟机疏散失败。
但是由于云计算IAAS层上虚拟机故障场景繁多,可使用措施有:迁移,evacuate。当计算节点服务正常下,虚拟机由于某些原因导致在IAAS层上状态异常,那么迁移操作无法进行虚拟机恢复操作。而如果对迁移流程的原生代码进行扩展会对openstack开源社区代码流程进行破坏,对生态会有影响迁移操作只有在计算节点服务正常和虚拟机处于active,stop,pause状态进行操作,所以迁移操作的初衷是虚拟机是正常的情况下,主机资源不足等,可以通过迁移操作实现主机资源的平均分配及充分利用。如果对迁移操作针对于此场景进行扩展,有悖于openstack社区对迁移API接口的设计和开发。
evacuate流程本身开发思想就是针对于主机异常,导致虚拟机异常,需要异地重建,由于openstack/Nova evacuate疏散流程中,虚拟机异地重建之后,由于宿主机的计算服务已经异常,无法从Hypervisor底层执行删除虚拟机信息的操作,等待宿主机服务正常时,会调用start接口,接口包括初始化节点操作,通过python语言方法调用的方式,调用init_host方法,该方法在初始化点中会进行清理残留虚拟机信息,磁盘文件等操作。此时之上残留的虚拟机会被删除,确保虚拟机不会出现脑裂的情况。虚拟机所在的宿主机计算服务处于正常状态,如果进行疏散流程,异地重建。那么会在源和目的宿主机上存在两台相同的虚拟机,虚拟机会出现脑裂导致业务无法正常进行。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种云平台的虚拟机故障疏散方法、系统及计算机可读介质,其通过获取待疏散虚拟机的节点地址,获取与待疏散虚拟机关联的宿主机节点地址;发送宿主机状态查询消息给宿主机,接收宿主机上报的状态消息;宿主机状态正常时,发送删除虚拟机关联消息给所述宿主机,否则,执行虚拟机重建操作;接收宿主机上传的虚拟机关联删除成功消息,执行虚拟机重建操作,从而解决虚拟机异地重建因原宿主机正常而发生虚拟机脑裂导致业务无法正常进行。
为实现上述目的,按照本发明的一个方面,提供了一种云平台的虚拟机故障疏散方法,包括如下步骤:
获取待疏散虚拟机的节点地址,获取与待疏散虚拟机关联的宿主机节点地址;发送宿主机状态查询消息给宿主机,接收宿主机上报的状态消息;
宿主机状态正常时,发送删除虚拟机关联消息给所述宿主机;否则,执行虚拟机重建操作;
接收宿主机上传的虚拟机关联删除成功消息,执行虚拟机重建操作。
作为本发明的进一步改进,获取待疏散虚拟机的节点地址具体为:通过定时查询虚拟机的状态获取,或通过待疏散虚拟机上报的故障消息获取。
作为本发明的进一步改进,通过开发新的RPC消息实现删除虚拟机关联消息的发送,开发新的RPC消息的具体过程为:创建RPC客户端;通过客户端将待实现功能的操作名称发送给RPC服务端;服务端调用待实现功能的操作名称以执行操作。
作为本发明的进一步改进,宿主机接收删除虚拟机本地信息后,执行删除虚拟机本地信息的操作,该操作具体为:预设删除次数阈值,在宿主机的hypervisor底层执行删除待疏散虚拟机本地信息操作,执行删除操作次数超过预设的删除次数阈值时,hypervisor底层未删除待疏散虚拟机信息,则上报虚拟机删除异常消息;hypervisor底层成功删除待疏散虚拟机信息后,释放待疏散虚拟机在宿主机上申请的资源,同时上报虚拟机关联删除成功消息。
作为本发明的进一步改进,虚拟机重建操作具体为:调用openstack中的rebuild_instance接口,使用待疏散虚拟机的信息在NOVA计算服务nova-scheduler组件过滤出来的宿主机上创建虚拟机。
为实现上述目的,按照本发明的另一个方面,提供了一种云平台的虚拟机故障疏散系统,该系统包括疏散信息获取模块和虚拟机重建模块,
疏散信息获取模块用于获取待疏散虚拟机的节点地址,获取与待疏散虚拟机关联的宿主机节点地址;疏散信息获取模块还用于发送宿主机状态查询消息给宿主机;
虚拟机重建模块用于接收所述宿主机上报的状态消息,宿主机状态正常时,发送删除虚拟机关联消息给宿主机,否则,执行虚拟机重建操作;
虚拟机重建模块还用于接收宿主机上传的虚拟机关联删除成功消息,执行虚拟机重建操作。
作为本发明的进一步改进,疏散信息获取模块获取待疏散虚拟机的节点地址具体为:通过定时查询虚拟机的状态获取,或通过待疏散虚拟机上报的故障消息获取。
作为本发明的进一步改进,虚拟机重建模块还用于开发新的RPC消息实现删除虚拟机关联消息的发送,开发新的RPC消息的具体过程为:创建RPC客户端;通过客户端将待实现功能的操作名称发送给RPC服务端;服务端调用待实现功能的操作名称以执行操作。
作为本发明的进一步改进,虚拟机重建模块执行虚拟机重建操作具体为:调用openstack中的rebuild_instance接口,使用待疏散虚拟机的信息在NOVA计算服务nova-scheduler组件过滤出来的宿主机上创建虚拟机。
为实现上述目的,按照本发明的另一个方面,提供了一种计算机可读介质,其存储有可由终端设备执行的计算机程序,当上述程序在终端设备上运行时,使得上述终端设备执行上述方法的步骤。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,具有以下有益效果:
本发明的一种云平台的虚拟机故障疏散方法、系统及计算机可读介质,其通过获取待疏散虚拟机的节点地址,获取与待疏散虚拟机关联的宿主机节点地址;发送宿主机状态查询消息给宿主机,接收宿主机上报的状态消息;宿主机状态正常时,发送删除虚拟机关联消息给所述宿主机,否则,执行虚拟机重建操作;接收宿主机上传的虚拟机关联删除成功消息,执行虚拟机重建操作,从而解决虚拟机异地重建因原宿主机正常而发生虚拟机脑裂导致业务无法正常进行,从而丰富了处理虚拟机故障的机制,针对于计算节点服务正常,而业务虚拟机故障的场景,可以较为平滑的完成虚拟机异地重建,恢复虚拟机业务。
本发明的一种云平台的虚拟机故障疏散方法、系统及计算机可读介质,其通过预设删除次数阈值,在宿主机的hypervisor底层删除待疏散虚拟机信息,超过预设的删除次数阈值时未执行成功,则上报虚拟机删除异常消息;hypervisor底层成功删除待疏散虚拟机信息后,释放待疏散虚拟机在宿主机上申请的资源,同时上报虚拟机关联删除成功消息,从而确保执行删除虚拟机本地信息的操作的可靠性,进一步防止虚拟机异地重建因原宿主机正常而发生虚拟机脑裂导致业务无法正常进行。
附图说明
图1是本发明实施例的一种云平台的虚拟机故障疏散方法的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。下面结合具体实施方式对本发明进一步详细说明。
Openstack:一个开源的云计算管理平台项目,支持几乎所有类型的云环境,项目目标是提供实施简单、可大规模扩展、丰富、标准统一的云计算管理平台。
Evacuate接口:是openstack专门针对于计算节点故障,疏散故障计算节点上虚拟机,异地恢复虚拟机接口。
RPC:远程过程调用(Remote Procedure Call)的缩写形式。
Hypervisor:又称虚拟机监视器(英语:virtual machine monitor,缩写为VMM),是用来建立与执行虚拟机器的软件、固件或硬件。
图1是本发明实施例的一种云平台的虚拟机故障疏散方法的示意图。如图1所示,一种云平台的虚拟机故障疏散方法,其包括如下步骤:
获取待疏散虚拟机的节点地址,获取与待疏散虚拟机关联的宿主机的节点地址;发送宿主机状态查询消息给上述宿主机,接收上述宿主机上报的状态消息;
具体地,其中,获取待疏散虚拟机的节点地址可以是通过定时查询虚拟机的状态获取,也可以是通过待疏散虚拟机上报的故障消息获取。作为一个示例,以openstack为基础的应用场景为例,原生openstack/Nova中api.py代码模块文件中定义了evacuate方法,其通过调用RestfulAPI入口,将instance(虚拟机的实例)通过实例化对象调用变量的方式,将虚拟机所在宿主机变量传递给get_by_compute方法,从而实现对宿主机的服务状态进行检查,进而返回得到一个Service对象,在获取虚拟机所在主机的计算服务状态后,主机服务为正常的情况下,不在抛出异常错误,只在nova-api.log日志中打印“此次疏散操作,主机服务正常”,继续疏散流程(instance compute service state on compute nodewas up)。当然,上述应用场景仅为一个示例,可依据应用需要在其他开发平台进行相应的调整。
上述宿主机状态正常时,发送删除虚拟机关联消息给上述宿主机;否则,执行虚拟机重建操作;
通过开发新的RPC消息实现所述删除虚拟机关联消息的发送,开发新的RPC消息的具体过程为:创建RPC客户端;通过客户端将待实现功能的操作名称发送给RPC服务端;服务端调用待实现功能的操作名称以执行操作。作为一个示例,以openstack为基础的应用场景为例,为了防止虚拟机出现脑裂的情况,需要先对源主机上的虚拟机本地信息进行删除,删除后在执行异地重建。Openstack组件相互信息交互是通过Rabbitmq消息队列进行传递消息,所以在openstack原消息队列框架下,开发出新的RPC消息即删除虚拟机本地信息“delete_evacuate_ha_instance”,向宿主机的消息队列中发送删除虚拟机本地信息“delete_evacuate_ha_instance”的操作。
宿主机接收删除虚拟机本地信息“delete_evacuate_ha_instance”后,执行删除虚拟机本地信息的操作;作为一个优选的实施例,预设删除次数阈值,通过实例化libvirt类,调用driver类对象的destroy销毁方法,在宿主机的hypervisor底层执行删除待疏散虚拟机本地信息操作,执行删除操作次数超过预设的删除次数阈值时,hypervisor底层未删除待疏散虚拟机信息,则上报虚拟机删除异常消息;hypervisor底层成功删除待疏散虚拟机信息后,从数据库中将待疏散虚拟机在宿主机上申请的资源(CPU、MEM、DISK等等)释放掉,同时上报虚拟机关联删除成功消息;通过以上的功能实现,底层已经没有了残留的虚拟机信息。
上述宿主机状态异常时,执行虚拟机重建操作,等待宿主机服务正常时,会调用start接口,接口包括初始化节点操作,通过python语言方法调用的方式,调用init_host方法,该方法在初始化点中会进行清理残留虚拟机信息,磁盘文件等操作。此时之上残留的虚拟机会被删除,确保虚拟机不会出现脑裂的情况。
接收上述宿主机上传的虚拟机关联删除成功消息,执行虚拟机重建操作。
作为一个示例,以openstack为基础的应用场景为例,秉承编码原则“尽量少出现冗余和重复代码实现已知业务功能”,直接复用原OpenStack Rebuild重建虚拟机流程,虚拟机重建操作具体为:调用原生的rebuild_instance接口,rebuild_instance接口功能就是对虚拟机进行重建,其使用原虚拟机的信息在NOVA计算服务nova-scheduler组件过滤出来的宿主机上创建虚拟机。
一种计算机可读介质,其存储有可由终端设备执行的计算机程序,当上述程序在终端设备上运行时,使得上述终端设备执行上述方法的步骤。
一种云平台的虚拟机故障疏散系统,该系统包括疏散信息获取模块和虚拟机重建模块,
疏散信息获取模块用于获取待疏散虚拟机的节点地址,获取与待疏散虚拟机关联的宿主机节点地址;疏散信息获取模块还用于发送宿主机状态查询消息给所述宿主机;
虚拟机重建模块用于接收所述宿主机上报的状态消息,宿主机状态正常时,发送删除虚拟机关联消息给宿主机,否则,执行虚拟机重建操作;
虚拟机重建模块还用于接收宿主机上传的虚拟机关联删除成功消息,执行虚拟机重建操作。
作为一个优选的实施例,疏散信息获取模块获取待疏散虚拟机的节点地址具体为:通过定时查询虚拟机的状态获取,或通过待疏散虚拟机上报的故障消息获取。作为一个示例,以openstack为基础的应用场景为例,原生openstack/Nova中api.py代码模块文件中定义了evacuate方法,其通过调用RestfulAPI入口,将instance(虚拟机的实例)通过实例化对象调用变量的方式,将虚拟机所在宿主机变量传递给get_by_compute方法,从而实现对宿主机的服务状态进行检查,进而返回得到一个Service对象,在获取虚拟机所在主机的计算服务状态后,主机服务为正常的情况下,不在抛出异常错误,只在nova-api.log日志中打印“此次疏散操作,主机服务正常”,继续疏散流程(instance compute service stateon compute node was up)。当然,上述应用场景仅为一个示例,可依据应用需要在其他开发平台进行相应的调整。
虚拟机重建模块还用于开发新的RPC消息实现删除虚拟机关联消息的发送,开发新的RPC消息的具体过程为:创建RPC客户端;通过客户端将待实现功能的操作名称发送给RPC服务端;服务端调用待实现功能的操作名称以执行操作。作为一个示例,以openstack为基础的应用场景为例,为了防止虚拟机出现脑裂的情况,需要先对源主机上的虚拟机本地信息进行删除,删除后在执行异地重建。Openstack组件相互信息交互是通过Rabbitmq消息队列进行传递消息,所以在openstack原消息队列框架下,开发出新的RPC消息即删除虚拟机本地信息“delete_evacuate_ha_instance”,向宿主机的消息队列中发送删除虚拟机本地信息“delete_evacuate_ha_instance”的操作。
上述宿主机状态异常时,虚拟机重建模块执行虚拟机重建操作,等待宿主机服务正常时,会调用start接口,接口包括初始化节点操作,通过python语言方法调用的方式,调用init_host方法,该方法在初始化点中会进行清理残留虚拟机信息,磁盘文件等操作。此时之上残留的虚拟机会被删除,确保虚拟机不会出现脑裂的情况。
虚拟机重建模块执行虚拟机重建操作具体为:调用openstack中的rebuild_instance接口,使用待疏散虚拟机的信息在NOVA计算服务nova-scheduler组件过滤出来的宿主机上创建虚拟机。作为一个示例,以openstack为基础的应用场景为例,秉承编码原则“尽量少出现冗余和重复代码实现已知业务功能”,直接复用原OpenStack Rebuild重建虚拟机流程,虚拟机重建操作具体为:调用原生的rebuild_instance接口,rebuild_instance接口功能就是对虚拟机进行重建,其使用原虚拟机的信息在NOVA计算服务nova-scheduler组件过滤出来的宿主机上创建虚拟机。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种云平台的虚拟机故障疏散方法,其特征在于,包括如下步骤:
获取待疏散虚拟机的节点地址,获取与待疏散虚拟机关联的宿主机节点地址;发送宿主机状态查询消息给所述宿主机,接收所述宿主机上报的状态消息;
所述宿主机状态正常时,发送删除虚拟机关联消息给所述宿主机;否则,执行虚拟机重建操作;
接收所述宿主机上传的虚拟机关联删除成功消息,执行虚拟机重建操作。
2.根据权利要求1所述的一种云平台的虚拟机故障疏散方法,其特征在于,获取待疏散虚拟机的节点地址具体为:通过定时查询虚拟机的状态获取,或通过待疏散虚拟机上报的故障消息获取。
3.根据权利要求1或2所述的一种云平台的虚拟机故障疏散方法,其特征在于,通过开发新的RPC消息实现所述删除虚拟机关联消息的发送,开发新的RPC消息的具体过程为:创建RPC客户端;通过客户端将待实现功能的操作名称发送给RPC服务端;服务端调用待实现功能的操作名称以执行操作。
4.根据权利要求1或2所述的一种云平台的虚拟机故障疏散方法,其特征在于,所述宿主机接收删除虚拟机本地信息后,执行删除虚拟机本地信息的操作,该操作具体为:预设删除次数阈值,在所述宿主机的hypervisor底层执行删除待疏散虚拟机本地信息操作,执行删除操作次数超过预设的删除次数阈值时,hypervisor底层未删除待疏散虚拟机信息,则上报虚拟机删除异常消息;hypervisor底层成功删除待疏散虚拟机信息后,释放待疏散虚拟机在宿主机上申请的资源,同时上报虚拟机关联删除成功消息。
5.根据权利要求1或2所述的一种云平台的虚拟机故障疏散方法,其特征在于,虚拟机重建操作具体为:调用openstack中的rebuild_instance接口,使用待疏散虚拟机的信息在NOVA计算服务nova-scheduler组件过滤出来的宿主机上创建虚拟机。
6.一种云平台的虚拟机故障疏散系统,该系统包括疏散信息获取模块和虚拟机重建模块,其特征在于,
所述疏散信息获取模块用于获取待疏散虚拟机的节点地址,获取与待疏散虚拟机关联的宿主机节点地址;疏散信息获取模块还用于发送宿主机状态查询消息给所述宿主机;
所述虚拟机重建模块用于接收所述宿主机上报的状态消息,所述宿主机状态正常时,发送删除虚拟机关联消息给所述宿主机,否则,执行虚拟机重建操作;
所述虚拟机重建模块还用于接收所述宿主机上传的虚拟机关联删除成功消息,执行虚拟机重建操作。
7.根据权利要求6所述的一种云平台的虚拟机故障疏散系统,其特征在于,所述疏散信息获取模块获取待疏散虚拟机的节点地址具体为:通过定时查询虚拟机的状态获取,或通过待疏散虚拟机上报的故障消息获取。
8.根据权利要求6或7所述的一种云平台的虚拟机故障疏散系统,其特征在于,所述虚拟机重建模块还用于开发新的RPC消息实现所述删除虚拟机关联消息的发送,开发新的RPC消息的具体过程为:创建RPC客户端;通过客户端将待实现功能的操作名称发送给RPC服务端;服务端调用待实现功能的操作名称以执行操作。
9.根据权利要求6或7所述的一种云平台的虚拟机故障疏散系统,其特征在于,所述虚拟机重建模块执行虚拟机重建操作具体为:调用openstack中的rebuild_instance接口,使用待疏散虚拟机的信息在NOVA计算服务nova-scheduler组件过滤出来的宿主机上创建虚拟机。
10.一种计算机可读介质,其特征在于,其存储有可由终端设备执行的计算机程序,当所述程序在终端设备上运行时,使得所述终端设备执行权利要求1~5任一权利要求所述方法的步骤。
CN201911018681.3A 2019-10-24 2019-10-24 一种云平台的虚拟机故障疏散方法、系统及计算机可读介质 Pending CN110908832A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911018681.3A CN110908832A (zh) 2019-10-24 2019-10-24 一种云平台的虚拟机故障疏散方法、系统及计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911018681.3A CN110908832A (zh) 2019-10-24 2019-10-24 一种云平台的虚拟机故障疏散方法、系统及计算机可读介质

Publications (1)

Publication Number Publication Date
CN110908832A true CN110908832A (zh) 2020-03-24

Family

ID=69814639

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911018681.3A Pending CN110908832A (zh) 2019-10-24 2019-10-24 一种云平台的虚拟机故障疏散方法、系统及计算机可读介质

Country Status (1)

Country Link
CN (1) CN110908832A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111722911A (zh) * 2020-06-23 2020-09-29 浪潮云信息技术股份公司 一种云中心宿主机发生宕机时自动疏散的方法
CN112003895A (zh) * 2020-07-24 2020-11-27 苏州浪潮智能科技有限公司 OpenStack云平台中云主机疏散方法、装置、设备及存储介质
TWI795887B (zh) * 2021-08-25 2023-03-11 新加坡商鴻運科股份有限公司 虛擬機器遷移方法、電子設備及存儲介質
US11720455B2 (en) 2021-08-25 2023-08-08 Fulian Precision Electronics (Tianjin) Co., Ltd. Method, apparatus, and non-transitory computer readable medium for migrating virtual machines

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130198739A1 (en) * 2012-01-30 2013-08-01 Microsoft Corporation Validation of Business Continuity Preparedness of a Virtual Machine
US20140101401A1 (en) * 2011-10-05 2014-04-10 International Business Machines Corporation Resource recovery for checkpoint-based high-availability in a virtualized environment
CN105357038A (zh) * 2015-10-26 2016-02-24 北京百度网讯科技有限公司 监控虚拟机集群的方法和系统
CN106598700A (zh) * 2016-12-12 2017-04-26 武汉烽火信息集成技术有限公司 基于pacemaker的虚拟机的秒级高可用实现方法
CN110188969A (zh) * 2018-02-23 2019-08-30 北京京东尚科信息技术有限公司 一种控制任务下发的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140101401A1 (en) * 2011-10-05 2014-04-10 International Business Machines Corporation Resource recovery for checkpoint-based high-availability in a virtualized environment
US20130198739A1 (en) * 2012-01-30 2013-08-01 Microsoft Corporation Validation of Business Continuity Preparedness of a Virtual Machine
CN105357038A (zh) * 2015-10-26 2016-02-24 北京百度网讯科技有限公司 监控虚拟机集群的方法和系统
CN106598700A (zh) * 2016-12-12 2017-04-26 武汉烽火信息集成技术有限公司 基于pacemaker的虚拟机的秒级高可用实现方法
CN110188969A (zh) * 2018-02-23 2019-08-30 北京京东尚科信息技术有限公司 一种控制任务下发的方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JINGZY88888: "某局点虚拟机因脑裂出现蓝屏,重启后还是蓝屏,并提示某个文件丢失或损坏", 《HTTPS://SUPPORT.HUAWEI.COM/ENTERPRISE/ZH/KNOWLEDGE/EKB1000422784》 *
TECHNOLOGYNOTE: "计算机节点宕机怎么办?", 《HTTPS://WWW.BILIBILI.COM/READ/CV1822465/》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111722911A (zh) * 2020-06-23 2020-09-29 浪潮云信息技术股份公司 一种云中心宿主机发生宕机时自动疏散的方法
CN112003895A (zh) * 2020-07-24 2020-11-27 苏州浪潮智能科技有限公司 OpenStack云平台中云主机疏散方法、装置、设备及存储介质
TWI795887B (zh) * 2021-08-25 2023-03-11 新加坡商鴻運科股份有限公司 虛擬機器遷移方法、電子設備及存儲介質
US11720455B2 (en) 2021-08-25 2023-08-08 Fulian Precision Electronics (Tianjin) Co., Ltd. Method, apparatus, and non-transitory computer readable medium for migrating virtual machines

Similar Documents

Publication Publication Date Title
CN110908832A (zh) 一种云平台的虚拟机故障疏散方法、系统及计算机可读介质
CN107515776B (zh) 业务不间断升级方法、待升级节点和可读存储介质
US9760448B1 (en) Hot recovery of virtual machines
US8055937B2 (en) High availability and disaster recovery using virtualization
US10445186B1 (en) Associating a guest application within a virtual machine to create dependencies in backup/restore policy
US10649861B1 (en) Operational recovery of serverless applications in a cloud-based compute services platform
JP2017528809A5 (zh)
CN112395047A (zh) 虚拟机故障疏散方法、系统及计算机可读介质
CN110888858B (zh) 数据库的操作方法和装置、存储介质、电子装置
WO2016045439A1 (zh) 一种vnfm容灾保护的方法、装置和nfvo、存储介质
CN113672350B (zh) 一种应用处理方法、装置及相关设备
US11647103B1 (en) Compression-as-a-service for data transmissions
CN115292003A (zh) 服务器故障恢复方法、装置、电子设备及存储介质
CN110737503B (zh) 容器服务快照的管理方法和装置
US20110225463A1 (en) Detecting and recovering from process failures
CN114090179A (zh) 有状态服务的迁移方法、装置及服务器
US11080150B2 (en) Method for creating consistency snapshot for distributed application, apparatus, and distributed system
US10936425B2 (en) Method of tracking and analyzing data integrity issues by leveraging cloud services
CN112506682A (zh) 业务服务器异常救济方法、装置和计算机可读存储介质
CN109257235B (zh) 网络异常恢复方法、装置、设备及计算机可读存储介质
US11314601B1 (en) Automated capture and recovery of applications in a function-as-a-service environment
CN112035063A (zh) 一种基于云平台的硬盘及文件系统热扩容的方法
CN115048190B (zh) 虚拟机快照管理方法、系统及计算机可读介质
CN109284169B (zh) 基于进程虚拟化的大数据平台进程管理方法及计算机设备
CN111104367B (zh) 一种基于openstack卷启动虚拟机创建私有镜像的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200324