CN108733454A - 一种虚拟机故障处理方法和装置 - Google Patents

一种虚拟机故障处理方法和装置 Download PDF

Info

Publication number
CN108733454A
CN108733454A CN201810534197.5A CN201810534197A CN108733454A CN 108733454 A CN108733454 A CN 108733454A CN 201810534197 A CN201810534197 A CN 201810534197A CN 108733454 A CN108733454 A CN 108733454A
Authority
CN
China
Prior art keywords
virtual machine
virtual
machine
resource utilization
fail
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810534197.5A
Other languages
English (en)
Other versions
CN108733454B (zh
Inventor
孙佳
苏广峰
苏志远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201810534197.5A priority Critical patent/CN108733454B/zh
Publication of CN108733454A publication Critical patent/CN108733454A/zh
Application granted granted Critical
Publication of CN108733454B publication Critical patent/CN108733454B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/301Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is a virtual computing platform, e.g. logically partitioned systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45575Starting, stopping, suspending or resuming virtual machine instances

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种虚拟机故障处理方法和装置,其中,该虚拟机故障处理方法包括:监听虚拟机故障事件;在监听到虚拟机故障时,按照预设的处理模式进行故障处理。本发明公开的虚拟机故障处理方法和装置,可实现虚拟机的高可用。

Description

一种虚拟机故障处理方法和装置
技术领域
本发明涉及通信领域,尤指一种虚拟机故障处理方法和装置。
背景技术
虚拟化是一种能够充分利用物理资源,通过互联网实现计算资源的共享的物理模型。按需的资源和服务,对资源进行动态分配是虚拟化技术的特点,虚拟化技术不断发展的同时,虚拟机作为虚拟化技术实现的焦点,如何保证虚拟机在使用过程中的高可用也成为当前热点问题。
实际生产环境中虚拟机在建立以后发生故障的风险就一直存在,且当虚拟机资源不足、压力过大时虚拟机发生故障的风险随之增高,当虚拟机故障后不能够及时处理直接导致虚拟机内业务不可用,严重影响用户体验。因此,如何设计一套虚拟机的高可用系统满足用户高可用的需求,实现虚拟机故障及时处理成为一个需要迫切解决的问题。
发明内容
为了解决上述技术问题,本发明提供了一种虚拟机故障处理方法和装置,可实现虚拟机的高可用。
为了达到本发明目的,第一方面,本发明提供了一种虚拟机故障处理方法,包括:
监听虚拟机故障事件;
在监听到虚拟机故障时,按照预设的处理模式进行故障处理。
第二方面,本发明提供了一种虚拟机故障处理装置,包括:
监控模块,用于监听虚拟机故障事件;
处理模块,用于在监听到虚拟机故障时,按照预设的处理模式进行故障处理。
第三方面,本发明提供了虚拟机故障处理装置,包括存储器和处理器,存储器用于存储执行指令;处理器调用所述执行指令,用于执行如第一方面实施例所述的虚拟机故障处理方法。
第四方面,本发明提供了一种计算机可读存储介质,其上存储有计算机指令,其特征在于,所述指令被处理器执行时实现第一方面实施例所述的方法的步骤。
本发明提供的虚拟机故障处理方法和装置,在监听到虚拟机故障事件后,可直接按照用户预先设置的预设的处理模块进行故障处理,实现虚拟机的高可用,及大的提高了虚拟机的容错能力;而无需在出现虚拟故障事件后,向用户咨询或提示,在用户执行相应操作后,比如,选择重启还是关闭虚拟机,才进行故障处理。同时,预设的处理模式包括自动处理和强制处理模式,且强制处理可选择强制重启或强制关机,在自动处理模式下能够根据当前物理主机资源情况自动做出相应处理,可实现向用户提供多种高可用处理策略,实现虚拟机的高可用,及大的提高了虚拟机的容错能力。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1为本发明实施例提供的虚拟机故障处理方法的流程图;
图2为本发明实施例一提供的虚拟机故障处理装置的结构示意图;
图3为本发明实施例二提供的虚拟机故障处理装置的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1为本发明实施例提供的虚拟机故障处理方法的流程图,如图1所示,本发明实施例提供的虚拟机故障处理方法,用于实现虚拟机高可用,包括:
S101:监听虚拟机故障事件。
具体的,可通过虚拟机中的监控模块完成虚拟机事件监控功能,监控模块通过事件端口实时监听虚拟机故障事件,及时捕获虚拟机事件并及时上报给处理模块。
S102:在监听到虚拟机故障时,按照预设的处理模式进行故障处理。
具体的,可通过虚拟机中的处理模块主完成虚拟机故障处理,其在接收到监控模块上报的虚拟机故障事件后,可直接按照预设的处理模块进行故障处理,实现虚拟机的高可用,及大的提高了虚拟机的容错能力;而无需在出现虚拟故障事件后,向用户咨询或提示,在用户执行相应操作后,比如,选择重启还是关闭虚拟机,才进行故障处理。
其中,预设的处理模式是用户预先设置好的,预设的处理模式可以包括:自动处理模式和强制处理模式。
一种实现方式:用户可直接在每一个虚拟上设置好虚拟机的故障处理,具体为,用户操作页面设置虚拟机高可用,并设置处理器的高可用处理策略为自动处理或者强制处理,当选择为强制处理时需选择强制关机或者强制重启。比如,有两个虚拟机:虚拟机1和虚拟机2,用户预先设置虚拟机1中故障的处理模式为强制处理模式,且为强制重启,预先设置虚拟机2中故障的处理模式为自动处理模式,这样,在出现故障时,虚拟机1以强制处理模式进行故障处理,虚拟机2以自动处理模式进行故障处理。
可选的,预设的处理模式可以根据虚拟机的重要程度而定,比如,对于重要的虚拟机可设置故障的处理模式为强制处理模式,对于不重要的虚拟机可设置故障的处理模式为自动处理模式。
另一种实现方式:用户可在虚拟机中设置虚拟机与预设的处理模式的对应关系,或者设置故障类型与预设的处理模式的对应关系,在监听到虚拟机故障时,处理模块通过查询预先设置的虚拟机与预设的处理模式或故障类型与预设的处理模式的对应关系,确定该虚拟机的预设的处理模式,按照确定出的预设的处理模式进行故障处理。
需要说明的是,本发明实施例中,确定监听的虚拟机事件是否是虚拟机故障事件与现有技术的实现原理相同,本发明实施例在此不进行限定和赘述。
本发明实施例提供的虚拟机故障处理方法,在监听到虚拟机故障事件后,可直接按照预设的处理模块进行故障处理,实现虚拟机的高可用,及大的提高了虚拟机的容错能力;而无需在出现虚拟故障事件后,向用户咨询或提示,在用户执行相应操作后,比如,选择重启还是关闭虚拟机,才进行故障处理。
进一步,在上述实施例中,预设的处理模式包括:自动处理模式;按照预设的处理模式进行故障处理,包括:
确定虚拟机所在物理主机的当前资源使用率;判断当前资源使用率是否高于预设阈值;在当前资源使用率高于或等于预设阈值时,关闭故障虚拟机并发出警告;在当前资源使用率低于预设阈值时,重启故障虚拟机。
具体的,在预设的处理模式为自动处理模式,即用户预先设置为自动处理模式时,通过判断虚拟机所在物理主机的当前资源使用率,以确定关闭还是重启故障虚拟机。其中,预设阈值可以是虚拟机默认的,也可以是用户根据自身需求预先设置的。可选的,预设阈值为90。
可选的,确定虚拟机所在物理主机的当前资源使用率,包括:根据当前CPU和内存的使用率计算当前物理主机的资源使用率ret,具体方法为:若CPU使用率=100%,或者内存使用率=100%,则ret=100;否则,ret=CPU使用率*0.5+内存使用率*0.5。
可选的,确定虚拟机所在物理主机的当前资源使用率,还包括:根据当前存储情况计算当前物理主机的资源使用率ret,具体方法:若当前存储总量为0、使用量为0,则ret=100。
具体的,处理模块获取当前虚拟机所在物理主机的资源使用情况,根据当前存储情况、CPU和内存的使用率计算当前物理主机的资源使用率ret,计算方法为:1.若CPU使用率=100%或者内存使用率=100%,则ret=100。2.若CPU使用率!=100%且内存使用率!=100%,则ret=CPU使用率*0.5+内存使用率*0.5。3.特别的,当前存储总量为0、使用量为0,即存储损坏或者故障,此时直接ret=100。
可选的,本发明实施例提供的虚拟机故障处理方法,还包括:预先设置重启故障虚拟机的最大重启次数;在重启故障虚拟机的次数达到最大重启次数仍为成功重启时,关闭故障虚拟机并发出警告。
具体的,本发明实施例在重启故障虚拟机时,设置有重启故障虚拟机的最大重启次数,在重启故障虚拟机的次数达到最大重启次数仍为成功重启时,关闭故障虚拟机并发出警告,避免了虚拟机在出现故障时不断的重复重启。其中,最大重启次数可以是虚拟机默认的,也可以是用户根据自身需求预先设置的。可选的,最大重启次数为3次。
本发明实施例中,在预设的处理模式为自动处理模式,即用户预先设置为自动处理模式时,获取当前虚拟机所在物理主机的资源使用情况,根据当前资源使用率计算结果ret,若ret>=90,则关闭虚拟机并发出警告,若ret<90,则尝试重启虚拟机,如果3次产生均不能成功则关闭虚拟机并发出警告。
进一步,在上述实施例中,预设的处理模式包括:强制处理模式;按照预设的处理模式进行故障处理,包括:
监听到虚拟机故障,强制关闭故障虚拟机;或者,监听到虚拟机故障,强制重启故障虚拟机。
具体的,在预设的处理模式为强制处理模式,即用户预先设置为强制处理模式时,本发明实施例提供了强制关闭故障虚拟机和强制重启故障虚拟机两种强制处理模式,若是强制关闭故障虚拟机,即监听到故障事件时直接强制关闭虚拟机;若是强制重启故障虚拟机,即监听到故障事件强制时直接重启虚拟机。
需要说明的是,当用户预先设置为强制处理模式时,需要设置是强制关闭还是强制重启。
可选的,本发明实施例提供的虚拟机故障处理方法,还包括:预先设置强制重启故障虚拟机的最大强制重启次数;在强制重启故障虚拟机的次数达到最大强制重启次数仍为成功重启时,关闭故障虚拟机并发出警告。
具体的,本发明实施例在强制重启故障虚拟机时,设置有强制重启故障虚拟机的最大强制重启次数,在强制重启故障虚拟机的次数达到最大强制重启次数仍为成功重启时,关闭故障虚拟机并发出警告,避免了虚拟机在出现故障时不断的重复强制重启。其中,最大强制重启次数可以是虚拟机默认的,也可以是用户根据自身需求预先设置的。可选的,最大强制重启次数为3次。
本发明实施例中,根据用户设置,若是强制关机,即处理模块接收到监控模块发送的故障事件直接强制关闭虚拟机;若是强制重启,即处理模块接收到监控模块发送的故障事件强制直接重启虚拟机,强制重启最大次数为3,若尝试3次都未能成功则关闭虚拟机发出警告。
本发明实施例提供的虚拟机故障处理方法,在监听到虚拟机故障事件后,可直接按照用户预先设置的预设的处理模块进行故障处理,实现虚拟机的高可用,及大的提高了虚拟机的容错能力;而无需在出现虚拟故障事件后,向用户咨询或提示,在用户执行相应操作后,比如,选择重启还是关闭虚拟机,才进行故障处理。同时,预设的处理模式包括自动处理和强制处理模式,且强制处理可选择强制重启或强制关机,在自动处理模式下能够根据当前物理主机资源情况自动做出相应处理,可实现向用户提供多种高可用处理策略,实现虚拟机的高可用,及大的提高了虚拟机的容错能力。
图2为本发明实施例一提供的虚拟机故障处理装置的结构示意图,如图2所示,本发明实施例提供的虚拟机故障处理装置,包括:监控模块21和处理模块22。
监控模块21,用于监听虚拟机故障事件;
处理模块22,用于在监听到虚拟机故障时,按照预设的处理模式进行故障处理。
本发明实施例提供的虚拟机故障处理装置用于执行图1所示方法实施例的技术方案,其实现原理和实现效果类似,此处不再赘述。
进一步地,在上述实施例中,所述预设的处理模式包括:自动处理模式;
处理模块22按照预设的处理模式进行故障处理,包括:
确定所述虚拟机所在物理主机的当前资源使用率;判断所述当前资源使用率是否高于预设阈值;在所述当前资源使用率高于或等于预设阈值时,关闭故障虚拟机并发出警告;或者;在所述当前资源使用率低于预设阈值时,重启故障虚拟机;
进一步地,在上述实施例中,处理模块22确定所述虚拟机所在物理主机的当前资源使用率,包括:根据当前CPU和内存的使用率计算当前物理主机的资源使用率ret,包括:
若CPU使用率=100%,或者内存使用率=100%,则ret=100;否则,ret=CPU使用率*0.5+内存使用率*0.5。
进一步地,在上述实施例中,处理模块22确定所述虚拟机所在物理主机的当前资源使用率,还包括:根据当前存储情况计算当前物理主机的资源使用率ret,包括:
若当前存储总量为0、使用量为0,则ret=100.
进一步地,在上述实施例中,处理模块22,还用于:
预先设置重启故障虚拟机的最大重启次数;在重启故障虚拟机的次数达到所述最大重启次数仍为成功重启时,关闭故障虚拟机并发出警告。
进一步地,在上述实施例中,所述预设的处理模式包括:强制处理模式;
处理模块22按照预设的处理模式进行故障处理,包括:
监听到虚拟机故障,强制关闭故障虚拟机;或者;监听到虚拟机故障,强制重启故障虚拟机。
进一步地,在上述实施例中,处理模块22还用于:
预先设置强制重启故障虚拟机的最大强制重启次数;在强制重启故障虚拟机的次数达到所述最大强制重启次数仍为成功重启时,关闭故障虚拟机并发出警告。
图3为本发明实施例二提供的虚拟机故障处理装置的结构示意图,如图3所示,本发明实施例提供的虚拟机故障处理装置,包括:存储器31和处理器32。
存储器31用于存储执行指令,处理器32可以是一个中央处理器(CentralProcessing Unit,简称CPU),或者是特定集成电路(Application Specific IntegratedCircuit,简称ASIC),或者完成实施本发明实施例的一个或多个集成电路。当虚拟机故障处理装置运行时,处理器32与存储器31之间通信,处理器32调用执行指令,用于执行以下操作:
监听虚拟机故障事件;
在监听到虚拟机故障时,按照预设的处理模式进行故障处理。
进一步地,所述预设的处理模式包括:自动处理模式;
处理器32按照预设的处理模式进行故障处理,包括:
确定所述虚拟机所在物理主机的当前资源使用率;
判断所述当前资源使用率是否高于预设阈值;
在所述当前资源使用率高于或等于预设阈值时,关闭故障虚拟机并发出警告;
或者;
在所述当前资源使用率低于预设阈值时,重启故障虚拟机。
进一步地,处理器32确定所述虚拟机所在物理主机的当前资源使用率,包括:
根据当前CPU和内存的使用率计算当前物理主机的资源使用率ret,包括:
若CPU使用率=100%,或者内存使用率=100%,则ret=100;
否则,ret=CPU使用率*0.5+内存使用率*0.5。
进一步地,处理器32确定所述虚拟机所在物理主机的当前资源使用率,还包括:
根据当前存储情况计算当前物理主机的资源使用率ret,包括:
若当前存储总量为0、使用量为0,则ret=100。
进一步地,处理器32还用于:
预先设置重启故障虚拟机的最大重启次数;
在重启故障虚拟机的次数达到所述最大重启次数仍为成功重启时,关闭故障虚拟机并发出警告。
进一步地,所述预设的处理模式包括:强制处理模式;
处理器32按照预设的处理模式进行故障处理,包括:
监听到虚拟机故障,强制关闭故障虚拟机;
或者;
监听到虚拟机故障,强制重启故障虚拟机。
进一步地,处理器32还用于:
预先设置强制重启故障虚拟机的最大强制重启次数;
在强制重启故障虚拟机的次数达到所述最大强制重启次数仍为成功重启时,关闭故障虚拟机并发出警告。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机指令,所述指令被处理器执行时实现上述任一实施例所述的虚拟机故障处理方法的步骤。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。

Claims (12)

1.一种虚拟机故障处理方法,包括:
监听虚拟机故障事件;
在监听到虚拟机故障时,按照预设的处理模式进行故障处理。
2.根据权利要求1所述的方法,其特征在于,所述预设的处理模式包括:自动处理模式;
所述按照预设的处理模式进行故障处理,包括:
确定所述虚拟机所在物理主机的当前资源使用率;
判断所述当前资源使用率是否高于预设阈值;
在所述当前资源使用率高于或等于预设阈值时,关闭故障虚拟机并发出警告;
或者;
在所述当前资源使用率低于预设阈值时,重启故障虚拟机。
3.根据权利要求2所述的方法,其特征在于,所述确定所述虚拟机所在物理主机的当前资源使用率,包括:
根据当前CPU和内存的使用率计算当前物理主机的资源使用率ret,包括:
若CPU使用率=100%,或者内存使用率=100%,则ret=100;
否则,ret=CPU使用率*0.5+内存使用率*0.5。
4.根据权利要求3所述的方法,其特征在于,所述确定所述虚拟机所在物理主机的当前资源使用率,还包括:
根据当前存储情况计算当前物理主机的资源使用率ret,包括:
若当前存储总量为0、使用量为0,则ret=100。
5.根据权利要求2~4任一项所述的方法,其特征在于,所述方法还包括:
预先设置重启故障虚拟机的最大重启次数;
在重启故障虚拟机的次数达到所述最大重启次数仍为成功重启时,关闭故障虚拟机并发出警告。
6.根据权利要求1所述的方法,其特征在于,所述预设的处理模式包括:强制处理模式;
所述按照预设的处理模式进行故障处理,包括:
监听到虚拟机故障,强制关闭故障虚拟机;
或者;
监听到虚拟机故障,强制重启故障虚拟机。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
预先设置强制重启故障虚拟机的最大强制重启次数;
在强制重启故障虚拟机的次数达到所述最大强制重启次数仍为成功重启时,关闭故障虚拟机并发出警告。
8.一种虚拟机故障处理装置,其特征在于,包括:
监控模块,用于监听虚拟机故障事件;
处理模块,用于在监听到虚拟机故障时,按照预设的处理模式进行故障处理。
9.根据权利要求8所述的装置,其特征在于,所述预设的处理模式包括:自动处理模式;
所述处理模块按照预设的处理模式进行故障处理,包括:
确定所述虚拟机所在物理主机的当前资源使用率;判断所述当前资源使用率是否高于预设阈值;在所述当前资源使用率高于或等于预设阈值时,关闭故障虚拟机并发出警告;或者;在所述当前资源使用率低于预设阈值时,重启故障虚拟机;
其中,所述处理模块确定所述虚拟机所在物理主机的当前资源使用率,包括:根据当前CPU和内存的使用率计算当前物理主机的资源使用率ret,包括:
若CPU使用率=100%,或者内存使用率=100%,则ret=100;否则,ret=CPU使用率*0.5+内存使用率*0.5;
其中,所述处理模块确定所述虚拟机所在物理主机的当前资源使用率,还包括:根据当前存储情况计算当前物理主机的资源使用率ret,包括:
若当前存储总量为0、使用量为0,则ret=100;
所述处理模块,还用于:
预先设置重启故障虚拟机的最大重启次数;在重启故障虚拟机的次数达到所述最大重启次数仍为成功重启时,关闭故障虚拟机并发出警告。
10.根据权利要求8所述的装置,其特征在于,所述预设的处理模式包括:强制处理模式;
所述处理模块按照预设的处理模式进行故障处理,包括:
监听到虚拟机故障,强制关闭故障虚拟机;或者;监听到虚拟机故障,强制重启故障虚拟机;
所述处理模块还用于:
预先设置强制重启故障虚拟机的最大强制重启次数;在强制重启故障虚拟机的次数达到所述最大强制重启次数仍为成功重启时,关闭故障虚拟机并发出警告。
11.一种虚拟机故障处理装置,其特征在于,包括存储器和处理器,存储器用于存储执行指令;处理器调用所述执行指令,用于执行如权利要求1-7任一项所述的虚拟机故障处理方法。
12.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,所述指令被处理器执行时实现权利要求1-7任一项所述的方法的步骤。
CN201810534197.5A 2018-05-29 2018-05-29 一种虚拟机故障处理方法和装置 Active CN108733454B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810534197.5A CN108733454B (zh) 2018-05-29 2018-05-29 一种虚拟机故障处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810534197.5A CN108733454B (zh) 2018-05-29 2018-05-29 一种虚拟机故障处理方法和装置

Publications (2)

Publication Number Publication Date
CN108733454A true CN108733454A (zh) 2018-11-02
CN108733454B CN108733454B (zh) 2021-10-01

Family

ID=63935811

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810534197.5A Active CN108733454B (zh) 2018-05-29 2018-05-29 一种虚拟机故障处理方法和装置

Country Status (1)

Country Link
CN (1) CN108733454B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109491764A (zh) * 2018-11-20 2019-03-19 郑州云海信息技术有限公司 一种基于openstack的虚拟机故障管理方法
CN109558209A (zh) * 2018-11-20 2019-04-02 郑州云海信息技术有限公司 一种用于虚拟机的监控方法
CN112035295A (zh) * 2020-08-27 2020-12-04 苏州浪潮智能科技有限公司 一种虚拟机崩溃事件处理方法、系统、终端及存储介质
CN115858222A (zh) * 2022-12-19 2023-03-28 安超云软件有限公司 一种虚拟机故障处理方法、系统及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100083247A1 (en) * 2008-09-26 2010-04-01 Netapp, Inc. System And Method Of Providing Multiple Virtual Machines With Shared Access To Non-Volatile Solid-State Memory Using RDMA
CN102693177A (zh) * 2011-03-23 2012-09-26 中国移动通信集团公司 虚拟机故障诊断方法、处理方法及其装置和系统
CN102708000A (zh) * 2012-04-19 2012-10-03 北京华胜天成科技股份有限公司 通过虚拟机迁移实现能耗控制的系统和方法
CN105024879A (zh) * 2015-07-15 2015-11-04 中国船舶重工集团公司第七0九研究所 虚拟机故障检测、恢复系统及虚拟机检测、恢复、启动方法
CN106951321A (zh) * 2017-02-13 2017-07-14 深信服科技股份有限公司 虚拟机cpu资源的管理方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100083247A1 (en) * 2008-09-26 2010-04-01 Netapp, Inc. System And Method Of Providing Multiple Virtual Machines With Shared Access To Non-Volatile Solid-State Memory Using RDMA
CN102693177A (zh) * 2011-03-23 2012-09-26 中国移动通信集团公司 虚拟机故障诊断方法、处理方法及其装置和系统
CN102708000A (zh) * 2012-04-19 2012-10-03 北京华胜天成科技股份有限公司 通过虚拟机迁移实现能耗控制的系统和方法
CN105024879A (zh) * 2015-07-15 2015-11-04 中国船舶重工集团公司第七0九研究所 虚拟机故障检测、恢复系统及虚拟机检测、恢复、启动方法
CN106951321A (zh) * 2017-02-13 2017-07-14 深信服科技股份有限公司 虚拟机cpu资源的管理方法及装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109491764A (zh) * 2018-11-20 2019-03-19 郑州云海信息技术有限公司 一种基于openstack的虚拟机故障管理方法
CN109558209A (zh) * 2018-11-20 2019-04-02 郑州云海信息技术有限公司 一种用于虚拟机的监控方法
CN109558209B (zh) * 2018-11-20 2021-10-29 郑州云海信息技术有限公司 一种用于虚拟机的监控方法
CN112035295A (zh) * 2020-08-27 2020-12-04 苏州浪潮智能科技有限公司 一种虚拟机崩溃事件处理方法、系统、终端及存储介质
CN115858222A (zh) * 2022-12-19 2023-03-28 安超云软件有限公司 一种虚拟机故障处理方法、系统及电子设备
CN115858222B (zh) * 2022-12-19 2024-01-02 安超云软件有限公司 一种虚拟机故障处理方法、系统及电子设备

Also Published As

Publication number Publication date
CN108733454B (zh) 2021-10-01

Similar Documents

Publication Publication Date Title
CN108733454A (zh) 一种虚拟机故障处理方法和装置
US9141491B2 (en) Highly available server system based on cloud computing
EP3537670B1 (en) Protection switching method, network device, and system
RU2640724C1 (ru) Способ устранения неисправностей, устройство и система, основанные на виртуализации сетевых функций
US9838483B2 (en) Methods, systems, and computer readable media for a network function virtualization information concentrator
CN104468407B (zh) 实现业务平台资源弹性分配的方法与装置
US20200213937A1 (en) Network Slice Instance Processing Method and Apparatus, and System
EP3907617A1 (en) Container management based on application performance indicators
CN105656962A (zh) 一种服务调用方法和装置
CN106452846A (zh) 故障处理方法、虚拟架构管理系统和业务管理系统
EP2887720A1 (en) Resource allocation method and device
EP3661291A1 (en) Method for managing network component, and network device
CN111209110B (zh) 一种实现负载均衡的任务调度管理方法、系统和存储介质
US20200233712A1 (en) Data Processing Method, Apparatus, Storage Medium, Processor, and System
CN104991822A (zh) 一种管理内存的方法和装置
CN107729213B (zh) 一种后台任务监控方法及装置
CN104461731B (zh) 一种动态资源扩展中虚拟机资源回收方法和装置
CN106557404B (zh) 一种应用控制的方法及移动终端
CN107092551A (zh) 一种服务器系统性能优化方法及装置
CN103944940A (zh) 动态配置代理服务器的设备及方法
CN108141374B (zh) 一种网络亚健康诊断方法及装置
CN109284275B (zh) 一种云平台虚拟机文件系统监控方法和装置
EP3376711A1 (en) Management method and device for managing instruction transmission and automatic vnf scaling function
CN114780270A (zh) 内存故障处理方法和装置、电子设备及计算机可读存储介质
CN114531357A (zh) 配置信息的对账方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant