CN115794470A - 虚拟机的运行管理方法、装置、电子设备及存储介质 - Google Patents

虚拟机的运行管理方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN115794470A
CN115794470A CN202211532712.9A CN202211532712A CN115794470A CN 115794470 A CN115794470 A CN 115794470A CN 202211532712 A CN202211532712 A CN 202211532712A CN 115794470 A CN115794470 A CN 115794470A
Authority
CN
China
Prior art keywords
virtual machine
physical device
physical
selecting
downtime
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211532712.9A
Other languages
English (en)
Inventor
李成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Capitalonline Data Service Co ltd
Original Assignee
Capitalonline Data Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Capitalonline Data Service Co ltd filed Critical Capitalonline Data Service Co ltd
Priority to CN202211532712.9A priority Critical patent/CN115794470A/zh
Publication of CN115794470A publication Critical patent/CN115794470A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

本申请提供了一种虚拟机的运行管理方法、装置、电子设备及存储介质,依据本申请实施例,在监测第一物理设备出现宕机故障的情况下,获取第一物理设备上运行的至少一个第一虚拟机的标识信息。针对单个第一虚拟机,从其他物理设备中选取可承载第一虚拟机的第二物理设备,并在第二物理设备上重建与第一虚拟机对应的第二虚拟机。然后,将指向第一虚拟机的处理任务变更为指向第二虚拟机。如此以来,第一虚拟机所对应执行的处理任务可以在由第二物理设备所承载的第二虚拟机继续执行,从而快速应对由于物理设备宕机故障,而导致虚拟机对应提供的服务中断的异常情况。

Description

虚拟机的运行管理方法、装置、电子设备及存储介质
技术领域
本申请涉及云计算技术领域,尤其涉及一种虚拟机的运行管理方法和装置、电子设备及存储介质。
背景技术
随着云计算服务的广泛推广,越来越多的用户将业务迁移至云端平台,并依赖云端平台所提供的服务来处理业务。
在云计算环境中,由物理设备承载虚拟机,通过云端平台为用户提供服务。在物理设备出现宕机故障时,物理设备所承载的虚拟机也会无法运行,这会导致虚拟机对应执行的任务受到影响,用户无法正常处理部署与云端平台的业务,从而需要承受损失。因此,如何高效应对由物理设备出现宕机故障,导致虚拟机对应执行的处理任务无法正常进行的情况,成为有待解决的问题之一。
发明内容
本申请实施例提供一种虚拟机的运行管理方法、装置、电子设备及存储介质,以快速应对由于物理设备宕机故障,而导致虚拟机对应提供的服务中断的异常情况。
第一方面,本申请实施例提供了一种虚拟机的运行管理方法,所述方法包括:
在监测第一物理设备出现宕机故障的情况下,获取所述第一物理设备上运行的至少一个第一虚拟机的标识信息;
针对单个第一虚拟机,从其他物理设备中选取可承载所述第一虚拟机的第二物理设备;
在所述第二物理设备上重建与所述第一虚拟机对应的第二虚拟机;
将指向所述第一虚拟机的处理任务变更为指向所述第二虚拟机。
第二方面,本申请实施例提供了一种虚拟机的运行管理装置,所述装置包括:
信息获取模块,用于在监测第一物理设备出现宕机故障的情况下,获取所述第一物理设备上运行的至少一个第一虚拟机的标识信息;
设备选取模块,用于针对单个第一虚拟机,从其他物理设备中选取可承载所述第一虚拟机的第二物理设备;
虚拟机重建模块,用于在所述第二物理设备上重建与所述第一虚拟机对应的第二虚拟机;
任务变更模块,用于将指向所述第一虚拟机的处理任务变更为指向所述第二虚拟机。
第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器在执行所述计算机程序时实现上述任一项所述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法。
与相关技术相比,本申请具有如下优点:
依据本申请实施例,可以监测承载虚拟机的物理设备的运行状态,在监测到物理设备的运行状态发生异常时,及时采取应对方案,避免由物理设备异常导致服务中断而带来的损失。在监测第一物理设备出现宕机故障的情况下,获取第一物理设备上运行的至少一个第一虚拟机的标识信息。然后,针对单个第一虚拟机,从其他物理设备中选取可承载第一虚拟机的第二物理设备。在第二物理设备上重建与第一虚拟机对应的第二虚拟机,并将指向第一虚拟机的处理任务变更为指向第二虚拟机。如此以来,第一虚拟机所对应执行的处理任务可以在由第二物理设备所承载的第二虚拟机继续执行,从而实现对物理设备宕机故障,而导致物理设备所承载虚拟机对应提供的服务中断的异常情况的快速应对。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,可依照说明书的内容予以实施,并且为了让本申请的上述和其他目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本申请的一些实施方式,而不应将其视为是对本申请范围的限制。
图1为本申请一实施例的虚拟机的运行管理方法的流程图;
图2是本申请另一实施例的虚拟机的运行管理方法的流程图;
图3是本申请一实施例的虚拟机的运行管理装置的结构框图;以及
图4为用来实现本申请实施例的电子设备的框图。
具体实施方式
在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本申请的构思或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的,而非限制性的。
为便于理解本申请实施例的技术方案,以下对本申请实施例的相关技术进行说明。以下相关技术作为可选方案与本申请实施例的技术方案可以进行任意结合,其均属于本申请实施例的保护范围。
为了对不同的物理设备和虚拟机进行划分,将出现宕机故障的物理设备记为第一物理设备,将第一物理设备上运行的虚拟机记为第一虚拟机,将其他设备中可承载某一单个第一虚拟机的物理设备记为第二物理设备,将在第二物理设备上创建的,用于执行第一虚拟机的处理任务的虚拟机记为第二虚拟机。其中,第一物理设备上可能运行有一个或多个第一虚拟机,涉及到的其他物理设备是值与第一物理设备属于同一设备集群的物理设备。
可以理解的是,上述物理设备所对应的设备集群可以包括应用于提供云计算服务或是其他形式服务的设备集群,本申请实施例对涉及到的设备集群的应用形式或是架构配置不做限制。
本申请实施例提供了一种虚拟机的运行管理方法,如图1所示为本申请一实施例的虚拟机的运行管理方法100的流程图,该方法100可以包括:
在步骤S101中,在监测第一物理设备出现宕机故障的情况下,获取所述第一物理设备上运行的至少一个第一虚拟机的标识信息。
在对虚拟机的运行进行管理时,可以监测承载虚拟机的物理设备的运行状态,在监测到物理设备的运行状态发生异常,即出现宕机故障时,及时采取应对方案,避免由物理设备异常导致服务中断而带来的损失。其中,涉及到的物理设备是指部署有云计算服务,或是用于提供其他形式服务的设备集群中的基础架构设备,可以包括服务器硬件设备、网关设备、交换机设备等。涉及到的宕机故障是指由于物理设备的硬件部件造成的,导致物理设备无法正常启动或是正常运转的故障。例如,服务器硬件设备的宕机故障可以是由服务器硬件设备中的主板、处理器、电源模块、风扇、本地硬盘或内存等硬件部件的损坏产生的。由于一台物理设备可能部署有多个虚拟机,因此在监测到第一物理设备出现宕机故障时,可以获取在第一物理设备上所运行的一个或多个第一虚拟机的标识信息,以在后续根据第一虚拟机的标识信息,获取与第一虚拟机相关的信息(例如第一虚拟机所对应使用的资源的种类和资源量),并根据与第一虚拟机相关的信息,从其他物理设备中选取可承载第一虚拟机的第二物理设备。在第一物理设备上运行有至少两个第一虚拟机时,可以获取记录有第一虚拟机的标识信息的列表,在后续按照列表中所记载的第一虚拟机的标识信息,依次为第一虚拟机选取第二物理设备。
一种实现方式中,在监测第一物理设备出现宕机故障的情况下,获取物理设备上运行的虚拟机的标识信息时,为了确定第一物理设备出现了宕机故障,可以与第一物理设备进行通信交互,当交互结果符合宕机故障的判断标准时,即确定第一物理设备出现宕机故障。也即是说,可以通过与第一物理设备进行通信交互,依据通信结果判断第一物理设备是否出现了宕机故障。其中,交互结果是指在发起向第一物理设备的通信交互后,第一物理设备对上述通信交互的响应。可以理解的是,在第一物理设备在正常运转的情况下,可以正常与外界进行通信交互,响应其所接收到的交互信息。也即是说,第一物理设备在正常运转的情况下,可以针对接收到的通信交互做出符合预期的响应。因此,当交互结果不符合与其或是交互结果为没有响应时,可以确定第一物理机出现了宕机故障。在确定第一物理设备出现宕机故障后,获取第一物理设备上运行的至少一个第一虚拟机的标识信息,以便后续为第一虚拟机选取第二物理设备。
一种实现方式中,在通过与第一物理设备进行通信交互,并当交互结果符合宕机故障的判断标准的情况下确定第一物理设备出现宕机故障时,可以通过向第一物理设备发送状态获取请求的方式,与第一物理设备进行通信交互。例如,可以使用ping(PacketInternet Groper,因特网包探索器)向第一物理设备发送ICMP(Internet ControlMessage Protocol,因特网报文控制协议)的请求数据包,并等待接收回显回应数据包,也即是等待针对状态获取请求的,来自第一物理设备的响应信息。为了避免由于如网络时延等原因而导致未收到符合预期的响应信息,可以重新发送多次状态获取请求,并等待接收第一物理设备的响应信息。若未收到第一物理设备针对状态获取请求的响应信息且重新发送多次状态获取请求均未收到响应信息,则确定第一物理设备出现宕机故障。
在步骤S102中,针对单个第一虚拟机,从其他物理设备中选取可承载所述第一虚拟机的第二物理设备。
在确定第一物理设备出现宕机故障后,为第一虚拟机选取第二物理设备,第二物理设备用于创建与第一虚机相对应的第二虚拟机,第二物理设备所承载的第二虚拟机可以用于执行第一虚拟机所对应执行的处理任务。
一种实现方式中,在针对单个第一虚拟机从其他物理设备中选取可承载第一虚拟机的第二物理设备时,可以首先针对单个第一虚拟机,从其他物理设备中选取可承载第一虚拟机的至少一个候选物理设备。也即是说,所选取的候选物理设备至少可以提供于运转第一虚拟机所需要的资源。其中,运转第一虚拟机所需要的资源可以包括第一虚拟机所使用的算力资源、网络资源和存储资源等。依据运转第一物理机所需要的资源,即可从第一物理设备所属的设备集群的其他物理设备中选取至少一个候选物理设备。
然后从至少一个候选物理设备中,选取一个候选物理设备。也即是说,可以从一个或多个候选物理设备中,确定一个候选物理设备为第二物理设备。在只存在一个候选物理设备时,即可将该候选物理设备确定为第二物理设备。在存在至少两个候选物理设备时,可以从多个候选物理设备中,选取一个物理设备为第二物理设备。在选取时,可以通过随机选取的方式,将多个候选物理设备中的一个候选物理设备确定为第二物理设备,也可以通过预设的规则,对符合规则的候选物理设备进行优先选取。例如,可以根据候选物理设备的负载情况进行优先选取。具体而言,可以优先将负载水位较低,也即是资源较为空闲的候选物理设备选取为第二物理设备。
在步骤S103中,在所述第二物理设备上重建与所述第一虚拟机对应的第二虚拟机。
确定第二物理设备后,为了尽快继续执行第一虚拟机所执行的处理任务,在第二物理设备上重建与第一虚拟机所对应的第二虚拟机。
一种实现方式中,由于第二物理设备可以至少提供运转第一虚拟机所需的资源,因此,在第二物理设备上重建与第一虚拟机对应的第二虚拟机时,可以首先在第二物理设备上分配第一虚拟机所需的目标资源。其中,可以根据第一虚拟机所需的资源的种类(如算力资源、网络资源、存储资源),以及资源量(如占用磁盘空间大小)在第二物理设备上分配第一虚拟机所需要的资源,并将所分配的资源记为目标资源。
然后,将第一虚拟机迁移至所述目标资源,以创建第二虚拟机。其中,在进行迁移时,可以根据第一虚拟机所使用的资源的种类和资源量,建立第一虚拟机所使用的资源与目标资源的映射关系,并绘制第一虚拟机所使用资源的应用拓扑图,根据映射关系和应用拓扑图,将第一虚拟机所使用的资源迁移至第二物理设备的目标资源。
在步骤S104中,将指向所述第一虚拟机的处理任务变更为指向所述第二虚拟机。
在第二虚拟机创建完成后,为了使第二虚拟机能够继续执行第一虚拟机所对应执行的处理任务,将原本指向第一虚拟机的处理任务,变更为指向第二虚拟机,由第二虚拟机继续执行原本由第一虚拟机所执行的处理任务,以恢复由于第一物理设备宕机故障而中断的服务。
一种实现方式中,在针对单个第一虚拟机,从其他物理设备中选取可承载第一虚拟机的第二物理设备之前,还可以创建针对第一虚拟机的重建任务。也即是说,可以针对各第一虚拟机,创建独立的第一虚拟机的重建任务。重建任务是指针对单个第一虚拟机,在其他物理设备中选取第二物理设备,并第二物理设备重建与第一虚拟机所对应的第二虚拟机的任务。
通过该方法100,还可以在第二虚拟机创建不成功的情况下,重新执行虚拟机的重建任务。可以理解的是,创建第二虚拟机后,可以监测第二虚拟机的创建结果,判断第二虚拟机的创建是否成功。例如,可以通过监测变更为指向第二虚拟机的执行任务是否正常运行的方式,判断第二虚拟机是否成功创建。在发现第二虚拟机创建不成功时,可以重新执行上述重建任务,再次为涉及到的第一虚拟机选取第二物理设备,并创建第二虚拟机。重复执行重建任务,直至第二虚拟机创建成功。
其中,可以通过并发的方式创建并执行针对单个第一虚拟机的重建任务。通过这种方式,可以为多个第一虚机同时处理重建任务,提高了对虚拟机运行管理的效率,减少了由于第一物理机宕机故障而造成的服务中断所带来的损失。
一种实现方式中,在第二虚拟机创建成功的情况下,可以通过调用消息队列中间件(Message Oriented Middleware),将创建成功通知发送至运维管理方的终端。可以理解的是,通过在物理设备上重建与第一虚拟机对应的第二虚拟机,可以解决由于第一物理设备宕机故障而导致的服务中断的问题,而无法解决第一物理设备的宕机故障。在云计算环境或是其他远程服务的环境下,第一物理机的故障可能很难被及时发现。因此,可以在第二虚拟机创建成功后,通过调用消息队列中间件,将第二虚拟机创建成功的通知,连同第一物理设备的故障通知发送给运维管理方。
具体而言,上述通知可以包括第一物理设备宕机故障的发生时间、第一物理设备的标识信息、第一虚拟机的标识信息、第二虚拟机等内容。运维管理方在通过其所使用的终端获取上述通知后,可以根据通知的指示定位第一物理设备,进而排查导致第一物理设备发生宕机故障的原因,对第一物理设备进行维修,以及实施其他相关的后续事宜。上述通知还可以进一步包括第二物理设备的标识信息、第二虚拟机的标识信息等内容,以方便运营管理方跟进检查第二虚拟机的运行状态,确保第二虚拟机,同时可以掌握设备集群中物理设备的使用情况,方便运维管理方对设备集群所承载虚拟机的运行管理。
图2是本申请另一实施例的虚拟机的运行管理方法的流程图。如图2所示,在开始执行本申请实施例所提供的虚拟机的运行管理方法后,持续检查设备集群中物理设备的运行状态,针对状态异常,即出现宕机故障的第一物理设备,获取该第一物理设备所承载的第一虚拟机的标识信息列表。在获得上述列表后,依次按照列表中的标识信息所指示的第一虚拟机,为第一虚拟机建立重建任务。在获取及执行重建任务时,可以通过并发的方式,同时处理多个第一虚拟机的重建任务。
针对单个第一虚拟机,根据第一虚拟机所需的算力资源、网络资源和存储资源等资源,在第一物理设备所对应的设备集群的其他物理设备中选取可以匹配其资源需求的候选物理设备。在选取的一个或多个候选物理设备中,通过随机选取或是优先按照某种预设规则(如优先选取资源更为空闲的候选物理设备),选取一个候选物理设备,将针对第一虚拟机的重建任务下发给第二物理设备。第二物理设备用于接收针对第一虚拟机的重建任务,在第二物理设备上建立与第一虚拟机相对应的第二虚拟机,可以通过将第一虚拟机所对应的资源迁移至第二物理设备的方式,在第二物理设备上建立第二虚拟机。在云计算环境中,物理设备基于IP地址和mac地址对虚拟机进行访问。建立第二虚拟机时,可以为第二虚拟机配置与第一虚拟机相同的IP地址和mac地址,从而在基于IP地址访问云计算环境中的服务的时候,交换机就会自动将原本由第一虚拟机提供的服务转到第二虚拟机上。由此,第二物理设备所承载的第二虚拟机可以用于执行第一虚拟机所对应执行的处理任务。
与此同时,可以持续监测第二虚拟机的创建结果,若创建失败,重新执行重建任务,直至成功。在创建成功后,可以通过向运维管理方的终端发送邮件、短信、应用程序推送或其他即时通讯信息的方式,告知运维管理方上述第二虚拟机的创建结果,以使得运维管理方可以处理例如排查第一物理设备的宕机故障原因、维修第一物理设备等后续事宜。
与本申请实施例提供的方法的应用场景以及方法相对应地,本申请实施例还提供一种虚拟机的运行管理装置。如图3所示为本申请一实施例的虚拟机的运行管理装置300的结构框图,该虚拟机的运行管理装置300可以包括:
信息获取模块301,用于在监测第一物理设备出现宕机故障的情况下,获取所述第一物理设备上运行的至少一个第一虚拟机的标识信息;
设备选取模块302,用于针对单个第一虚拟机,从其他物理设备中选取可承载所述第一虚拟机的第二物理设备;
虚拟机重建模块303,用于在所述第二物理设备上重建与所述第一虚拟机对应的第二虚拟机;
任务变更模块304,用于将指向所述第一虚拟机的处理任务变更为指向所述第二虚拟机。
一种实现方式中,所述信息获取模块301可以包括:
故障确定子模块,用于与所述第一物理设备进行通信交互,当交互结果符合宕机故障的判断标准时,确定所述第一物理设备出现宕机故障;
信息获取子模块,用于获取所述第一物理设备上运行的至少一个第一虚拟机的标识信息。
一种实现方式中,所述故障确定子模块,可以具体用于向所述第一物理设备发送状态获取请求;若未收到针对所述状态获取请求的响应信息且重新发送多次状态获取请求均未收到响应信息,则确定所述第一物理设备出现宕机故障。
一种实现方式中,所述设备选取模块302可以包括:
第一选取子模块,用于针对单个第一虚拟机,从其他物理设备中选取可承载所述第一虚拟机的至少一个候选物理设备;
第二选取子模块,用于从所述至少一个候选物理设备中,选取一个候选物理设备。
一种实现方式中,所述虚拟机重建模块303可以包括:
资源分配子模块,用于在所述第二物理设备上分配所述第一虚拟机所需的目标资源;
虚拟机创建子模块,用于将所述第一虚拟机迁移至所述目标资源,以创建第二虚拟机。
一种实现方式中,所述装置300还包括:
重建任务创建模块,用于在所述针对单个第一虚拟机,从其他物理设备中选取可承载所述第一虚拟机的第二物理设备之前,创建针对第一虚拟机的重建任务;
任务执行模块,用于在所述第二虚拟机创建不成功的情况下,重新执行所述虚拟机的重建任务。
一种实现方式中,所述装置300还包括:
信息通知模块,用于在所述第二虚拟机创建成功的情况下,通过调用消息队列中间件,将创建成功通知发送至运维管理方的终端。
本申请实施例各装置中的各模块的功能可以参见上述方法中的对应描述,并具备相应的有益效果,在此不再赘述。
图4为用来实现本申请实施例的电子设备的框图。如图4所示,该电子设备包括:存储器401和处理器402,存储器401内存储有可在处理器402上运行的计算机程序。处理器402执行该计算机程序时实现上述实施例中的方法。存储器401和处理器402的数量可以为一个或多个。
该电子设备还包括:
通信接口403,用于与外界设备进行通信,进行数据交互传输。
如果存储器401、处理器402和通信接口403独立实现,则存储器401、处理器402和通信接口403可以通过总线相互连接并完成相互间的通信。该总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准体系结构(Extended Industry StandardArchitecture,EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器401、处理器402及通信接口403集成在一块芯片上,则存储器401、处理器402及通信接口403可以通过内部接口完成相互间的通信。
本申请实施例提供了一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现本申请实施例中提供的方法。
本申请实施例还提供了一种芯片,该芯片包括处理器,用于从存储器中调用并运行存储器中存储的指令,使得安装有芯片的通信设备执行本申请实施例提供的方法。
本申请实施例还提供了一种芯片,包括:输入接口、输出接口、处理器和存储器,输入接口、输出接口、处理器以及存储器之间通过内部连接通路相连,处理器用于执行存储器中的代码,当代码被执行时,处理器用于执行申请实施例提供的方法。
应理解的是,上述处理器可以是中央处理器(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(FieldProgrammable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者是任何常规的处理器等。值得说明的是,处理器可以是支持进阶精简指令集机器(Advanced RISC Machines,ARM)架构的处理器。
进一步地,可选的,上述存储器可以包括只读存储器和随机访问存储器。该存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以包括只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以包括随机访问存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM均可用。例如,静态随机访问存储器(Static RAM,SRAM)、动态随机访问存储器(Dynamic Random Access Memory,DRAM)、同步动态随机访问存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机访问存储器(Double Data RateSDRAM,DDR SDRAM)、增强型同步动态随机访问存储器(Enhanced SDRAM,ESDRAM)、同步链接动态随机访问存储器(Sync link DRAM,SLDRAM)和直接内存总线随机访问存储器(DirectRambus RAM,DR RAM)。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生依照本申请的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包括于本申请的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中描述的或在此以其他方式描述的任何过程或方法可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分。并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能。
在流程图中描述的或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。
应理解的是,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。上述实施例方法的全部或部分步骤是可以通过程序来指令相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。上述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。该存储介质可以是只读存储器,磁盘或光盘等。
以上所述,仅为本申请的示例性实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请记载的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种虚拟机的运行管理方法,其特征在于,包括:
在监测第一物理设备出现宕机故障的情况下,获取所述第一物理设备上运行的至少一个第一虚拟机的标识信息;
针对单个第一虚拟机,从其他物理设备中选取可承载所述第一虚拟机的第二物理设备;
在所述第二物理设备上重建与所述第一虚拟机对应的第二虚拟机;
将指向所述第一虚拟机的处理任务变更为指向所述第二虚拟机。
2.根据权利要求1所述的方法,其特征在于,所述在监测第一物理设备出现宕机故障的情况下,获取所述物理设备上运行的虚拟机的标识信息包括:
与所述第一物理设备进行通信交互,当交互结果符合宕机故障的判断标准时,确定所述第一物理设备出现宕机故障;
获取所述第一物理设备上运行的至少一个第一虚拟机的标识信息。
3.根据权利要求2所述的方法,其特征在于,所述与所述第一物理设备进行通信交互,当交互结果符合宕机故障的判断标准时,确定所述第一物理设备出现宕机故障包括:
向所述第一物理设备发送状态获取请求;
若未收到针对所述状态获取请求的响应信息且重新发送多次状态获取请求均未收到响应信息,则确定所述第一物理设备出现宕机故障。
4.根据权利要求1所述的方法,其特征在于,所述针对单个第一虚拟机,从其他物理设备中选取可承载所述第一虚拟机的第二物理设备包括:
针对单个第一虚拟机,从其他物理设备中选取可承载所述第一虚拟机的至少一个候选物理设备;
从所述至少一个候选物理设备中,选取一个候选物理设备。
5.根据权利要求1所述的方法,其特征在于,所述在所述第二物理设备上重建与所述第一虚拟机对应的第二虚拟机包括:
在所述第二物理设备上分配所述第一虚拟机所需的目标资源;
将所述第一虚拟机迁移至所述目标资源,以创建第二虚拟机。
6.根据权利要求1所述的方法,其特征在于,在所述针对单个第一虚拟机,从其他物理设备中选取可承载所述第一虚拟机的第二物理设备之前,所述方法还包括:
创建针对第一虚拟机的重建任务;
所述方法还包括:
在所述第二虚拟机创建不成功的情况下,重新执行所述虚拟机的重建任务。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述第二虚拟机创建成功的情况下,通过调用消息队列中间件,将创建成功通知发送至运维管理方的终端。
8.一种虚拟机的运行管理装置,其特征在于,包括:
信息获取模块,用于在监测第一物理设备出现宕机故障的情况下,获取所述第一物理设备上运行的至少一个第一虚拟机的标识信息;
设备选取模块,用于针对单个第一虚拟机,从其他物理设备中选取可承载所述第一虚拟机的第二物理设备;
虚拟机重建模块,用于在所述第二物理设备上重建与所述第一虚拟机对应的第二虚拟机;
任务变更模块,用于将指向所述第一虚拟机的处理任务变更为指向所述第二虚拟机。
9.一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器在执行所述计算机程序时实现权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7中任一项所述的方法。
CN202211532712.9A 2022-12-01 2022-12-01 虚拟机的运行管理方法、装置、电子设备及存储介质 Pending CN115794470A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211532712.9A CN115794470A (zh) 2022-12-01 2022-12-01 虚拟机的运行管理方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211532712.9A CN115794470A (zh) 2022-12-01 2022-12-01 虚拟机的运行管理方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN115794470A true CN115794470A (zh) 2023-03-14

Family

ID=85444669

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211532712.9A Pending CN115794470A (zh) 2022-12-01 2022-12-01 虚拟机的运行管理方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN115794470A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102137167A (zh) * 2011-04-29 2011-07-27 中国人民解放军国防科学技术大学 不间断运行的虚拟机迁移方法及装置
WO2015021629A1 (zh) * 2013-08-15 2015-02-19 华为技术有限公司 一种资源发放方法
CN107526653A (zh) * 2017-07-31 2017-12-29 华为技术有限公司 一种虚拟机的管理方法和服务器
CN112181593A (zh) * 2020-09-27 2021-01-05 北京首都在线科技股份有限公司 虚拟机调度方法、装置、设备及存储介质
CN113467873A (zh) * 2021-06-29 2021-10-01 深信服科技股份有限公司 虚拟机的调度方法、装置、电子设备及存储介质
CN114884836A (zh) * 2022-04-28 2022-08-09 济南浪潮数据技术有限公司 一种虚拟机高可用方法、装置及介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102137167A (zh) * 2011-04-29 2011-07-27 中国人民解放军国防科学技术大学 不间断运行的虚拟机迁移方法及装置
WO2015021629A1 (zh) * 2013-08-15 2015-02-19 华为技术有限公司 一种资源发放方法
CN107526653A (zh) * 2017-07-31 2017-12-29 华为技术有限公司 一种虚拟机的管理方法和服务器
CN112181593A (zh) * 2020-09-27 2021-01-05 北京首都在线科技股份有限公司 虚拟机调度方法、装置、设备及存储介质
CN113467873A (zh) * 2021-06-29 2021-10-01 深信服科技股份有限公司 虚拟机的调度方法、装置、电子设备及存储介质
CN114884836A (zh) * 2022-04-28 2022-08-09 济南浪潮数据技术有限公司 一种虚拟机高可用方法、装置及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ORIS SCHOLL等: "《云原生 运用容器、函数计算和数据构建下一代应用》", 30 April 2018, 中国农业大学出版社, pages: 80 - 85 *

Similar Documents

Publication Publication Date Title
CN107832329B (zh) 页面资源获取方法及终端设备
US8769040B2 (en) Service providing system, a virtual machine server, a service providing method, and a program thereof
CN109788068B (zh) 心跳状态信息上报方法、装置和设备及计算机存储介质
EP3675420B1 (en) Distributed storage system upgrade management method and device, and distributed storage system
US10541862B2 (en) VNF processing policy determining method, apparatus, and system
CN108347339B (zh) 一种业务恢复方法及装置
CN106452836B (zh) 主节点设置方法及装置
CN113872997B (zh) 基于容器集群服务的容器组pod重建方法及相关设备
US11159608B2 (en) Method and control node for managing cloud resources in a communications network
CN114979286A (zh) 容器服务的访问控制方法、装置、设备及计算机存储介质
CN111506388B (zh) 容器性能探测方法、容器管理平台及计算机存储介质
CN115794470A (zh) 虚拟机的运行管理方法、装置、电子设备及存储介质
CN113127191B (zh) 一种资源更新方法、存储介质及相关装置
CN114816656A (zh) 容器组迁移方法、电子设备及存储介质
CN113626139A (zh) 一种高可用的虚拟机存储方法及装置
CN112954087A (zh) SaaS服务的域名连接方法、装置、计算机设备及存储介质
CN114490015A (zh) 配置计算模式的方法、装置及计算设备
CN107783855B (zh) 虚拟网元的故障自愈控制装置及方法
CN112822792A (zh) 承载标识的分配方法、装置、设备和存储介质
US11921605B2 (en) Managing applications in a cluster
CN112087336B (zh) 一种虚拟ip服务系统的部署、管理方法、装置及电子设备
JP5663525B2 (ja) サーバ、管理サーバ、および計算機システムのネットワークデバイスの設定方法
US11461109B1 (en) Quick restart using virtualized resource migration
CN115333944B (zh) 虚拟机集群ip资源配置方法、系统、设备和存储介质
US20230254270A1 (en) Computer-readable recording medium storing program, information processing method, and information processing system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination