CN111708613B - 一种修复vm虚拟机开机失败卡任务的方法及系统 - Google Patents

一种修复vm虚拟机开机失败卡任务的方法及系统 Download PDF

Info

Publication number
CN111708613B
CN111708613B CN202010829529.XA CN202010829529A CN111708613B CN 111708613 B CN111708613 B CN 111708613B CN 202010829529 A CN202010829529 A CN 202010829529A CN 111708613 B CN111708613 B CN 111708613B
Authority
CN
China
Prior art keywords
task
virtual machine
machine
module
repairing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010829529.XA
Other languages
English (en)
Other versions
CN111708613A (zh
Inventor
彭国柱
史伟
闵宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Eflycloud Computing Co Ltd
Original Assignee
Guangdong Eflycloud Computing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Eflycloud Computing Co Ltd filed Critical Guangdong Eflycloud Computing Co Ltd
Priority to CN202010829529.XA priority Critical patent/CN111708613B/zh
Publication of CN111708613A publication Critical patent/CN111708613A/zh
Application granted granted Critical
Publication of CN111708613B publication Critical patent/CN111708613B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1438Restarting or rejuvenating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45575Starting, stopping, suspending or resuming virtual machine instances

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Retry When Errors Occur (AREA)
  • Stored Programmes (AREA)

Abstract

本发明公开了一种修复VM虚拟机开机失败卡任务的方法及系统,方法步骤包括:对宿主机的VM虚拟机进行重启或者开机;等待一定时间后,查看任务池的任务列表,判断任务列表中VM.start_on任务的任务状态是否为pending以及任务进度是否为0.000,仅当VM.start_on任务的任务状态为pending且任务进度为0.000情况下才会强制重启VM虚拟机,其他情况下则不作处理。本发明通过检测发现开机任务卡顿的VM虚拟机,然后对其自行进行修复,及时释放因任务挂起占用的资源,及时发现故障和自动修复,减少计算的资源浪费。

Description

一种修复VM虚拟机开机失败卡任务的方法及系统
技术领域
本发明涉及云计算虚拟机技术领域,特别涉及一种修复VM虚拟机开机失败卡任务的方法及系统。
背景技术
基于Xenserver下的VM虚拟机在开机或者重启后,会因为存储负荷或者宿主机负荷等原因从而导致VM虚拟机开机失败情况,并且VM虚拟机后台有任务进度一直卡在0.000现象。另外,由于Xenserver无权限并且没有有效的机制保证VM虚拟机的开机任务挂起,很多时候花了1-2小时等待,虚拟机的进程任务也不会完成并结束。而日常工作中出现了这种问题,只能需要人为干预进行排障和修复。
发明内容
本发明要解决的技术问题在于,提供一种修复VM虚拟机开机失败卡任务的方法及系统,通过检测发现开机任务卡顿的VM虚拟机,然后对其自行进行修复,及时释放因任务挂起占用的资源,及时发现故障和自动修复,减少计算的资源浪费。
为解决上述技术问题,本发明提供如下技术方案:一种修复VM虚拟机开机失败卡任务的方法,包括以下步骤:设定查看程序,所述查看程序用于自动查看任务池的任务列表;对宿主机的VM虚拟机进行重启或者开机;等待一定时间后,查看程序自动查看任务池的任务列表,并判断任务列表中VM.start_on任务的任务状态是否为pending以及判断VM.start_on任务的任务进度是否为0.000,仅当VM.start_on任务的任务状态为pending且任务进度为0.000情况下才会强制重启VM虚拟机,其他情况下则不作处理。
进一步地,所述对宿主机的VM虚拟机进行重启或者开机,具体为:API机器模块通过调用API接口对宿主机的VM虚拟机进行重启或者开机。
进一步地,任务列表中VM.start_on任务的任务状态为pending且任务进度为0.000时,API机器模块通过调用API接口对宿主机的VM虚拟机强制断电,然后强制重启VM虚拟机。
进一步地,所述一定时间具体设定为30秒。
本发明另一目的是提供一种修复VM虚拟机开机失败卡任务的系统,运行于VM虚拟机所在宿主机上,包括VM虚拟机、API机器模块、任务池检查模块以及强制重启模块;
所述API机器模块用于通过调用API接口对所述宿主机的所述VM虚拟机进行重启或者开机;所述任务池检查模块用于设定查看程序,所述VM虚拟机进行重启或者开机经过一定时间后,所述任务池检查模块设定的查看程序用于自动查看任务池的任务列表,并用于判断任务列表中VM.start_on任务的任务状态是否为pending以及判断VM.start_on任务的任务进度是否为0.000,仅当VM.start_on任务的任务状态为pending且任务进度为0.000情况下,所述API机器模块用于通过调用API接口对宿主机的VM虚拟机强制断电,然后所述强制重启模块用于强制重启所述VM虚拟机。
采用上述技术方案后,本发明至少具有如下有益效果:本发明的VM虚拟机由于是开机的操作,所以强制断电并不会对VM虚拟机的数据产生任何影响;本发明在运维人员遇到此类型故障后,不用再进行排错修复等手动工作,减少了运维人力成本;本发明所解决的VM虚拟机故障,其会造成任务挂起,加大xenserver的负荷,而本发明提供自动修复方法可以让任务顺利执行,及时释放因任务挂起占用的资源,及时发现故障和自动修复,减少计算的资源浪费。
附图说明
图1为本发明一种修复VM虚拟机开机失败卡任务的方法步骤流程图;
图2为本发明一种修复VM虚拟机开机失败卡任务的系统框架图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互结合,下面结合附图和具体实施例对本申请作进一步详细说明。
实施例1
如图1所示,本实施例提供一种修复VM虚拟机开机失败卡任务的方法,具体步骤为:
设定查看程序,所述查看程序用于自动查看任务池的任务列表;对宿主机的VM虚拟机进行重启或者开机;具体为:API机器模块通过调用API接口对宿主机的VM虚拟机进行重启或者开机;
等待一定时间后,查看程序自动查看任务池的任务列表;优选地,本实施例的一定时间具体设定为30秒;
判断任务列表中VM.start_on任务的任务状态是否为pending以及任务进度是否为0.000,仅当VM.start_on任务的任务状态为pending且任务进度为0.000情况下才会强制重启VM虚拟机,具体是使用API机器模块通过调用API接口对宿主机的VM虚拟机强制断电,然后强制重启VM虚拟机;其他情况下则不作处理,具体为:若VM.start_on任务的任务状态不为pending情况下,无论VM.start_on任务的任务进度处于何种情况下,则不作处理;若VM.start_on任务的任务状态为pending,而VM.start_on任务的任务进度不是0.000情况下,则不作处理。由此可见,只有VM.start_on任务的任务状态为pending且任务进度为0.000这唯一的一种情况下,才会对VM虚拟机强制断电然后强制重启VM虚拟机,其他情况都不作处理。
其中,需要说明的是在VM虚拟机中,VM虚拟机开机过程中,系统就会有许多进程任务需要开启的,而VM.start_on任务为所有进程任务中的一种,人为操作情况下可以直接打开任务列表进行查看的,本申请就是设定程序进行自动查看VM.start_on任务,而VM.start_on任务后面查看到有pending这个词的话就意味着VM.start_on任务正在执行中,最后“0.000”是代表任务进度的一种,“0.000”代表任务进度进行中,“1.000”代表任务进度完成,所有情况都可以在VM.start_on任务后面查看到。本申请均通过程序自动获取并判断任务列表中VM.start_on任务的任务状态是否为pending以及任务进度是否为0.000。
实施例2
如图2所示,本实施提供一种修复VM虚拟机开机失败卡任务的系统,其运行于VM虚拟机所在宿主机上,包括VM虚拟机、API机器模块、任务池检查模块以及强制重启模块;
所述API机器模块用于通过调用API接口对所述宿主机的所述VM虚拟机进行重启或者开机;所述任务池检查模块用于设定查看程序,所述VM虚拟机进行重启或者开机经过一定时间后,所述任务池检查模块设定的查看程序用于自动查看任务池的任务列表,并用于判断任务列表中VM.start_on任务的任务状态是否为pending以及任务进度是否为0.000,仅当VM.start_on任务的任务状态为pending且任务进度为0.000情况下所述API机器模块用于通过调用API接口对宿主机的VM虚拟机强制断电,然后所述强制重启模块用于强制重启所述VM虚拟机。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解的是,在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种等效的变化、修改、替换和变型,本发明的范围由所附权利要求及其等同范围限定。

Claims (5)

1.一种修复VM虚拟机开机失败卡任务的方法,其特征在于,包括以下步骤:设定查看程序,所述查看程序用于自动查看任务池的任务列表;对宿主机的VM虚拟机进行重启或者开机;等待一定时间后,查看程序自动查看任务池的任务列表,并判断任务列表中VM.start_on任务的任务状态是否为pending以及判断VM.start_on任务的任务进度是否为0.000,仅当VM.start_on任务的任务状态为pending且任务进度为0.000情况下才会强制重启VM虚拟机,其他情况下则不作处理。
2.根据权利要求1所述的一种修复VM虚拟机开机失败卡任务的方法,其特征在于,所述对宿主机的VM虚拟机进行重启或者开机,具体为:API机器模块通过调用API接口对宿主机的VM虚拟机进行重启或者开机。
3.根据权利要求2所述的一种修复VM虚拟机开机失败卡任务的方法,其特征在于,任务列表中VM.start_on任务的任务状态为pending且任务进度为0.000时,API机器模块通过调用API接口对宿主机的VM虚拟机强制断电,然后强制重启VM虚拟机。
4.根据权利要求1所述的一种修复VM虚拟机开机失败卡任务的方法,其特征在于,所述一定时间具体设定为30秒。
5.一种修复VM虚拟机开机失败卡任务的系统,运行于VM虚拟机所在宿主机上,其特征在于,包括VM虚拟机、API机器模块、任务池检查模块以及强制重启模块;
所述API机器模块用于通过调用API接口对所述宿主机的所述VM虚拟机进行重启或者开机;所述任务池检查模块用于设定查看程序,所述VM虚拟机进行重启或者开机经过一定时间后,所述任务池检查模块设定的查看程序用于自动查看任务池的任务列表,并用于判断任务列表中VM.start_on任务的任务状态是否为pending以及判断VM.start_on任务的任务进度是否为0.000,仅当VM.start_on任务的任务状态为pending且任务进度为0.000情况下,所述API机器模块用于通过调用API接口对宿主机的VM虚拟机强制断电,然后所述强制重启模块用于强制重启所述VM虚拟机。
CN202010829529.XA 2020-08-18 2020-08-18 一种修复vm虚拟机开机失败卡任务的方法及系统 Active CN111708613B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010829529.XA CN111708613B (zh) 2020-08-18 2020-08-18 一种修复vm虚拟机开机失败卡任务的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010829529.XA CN111708613B (zh) 2020-08-18 2020-08-18 一种修复vm虚拟机开机失败卡任务的方法及系统

Publications (2)

Publication Number Publication Date
CN111708613A CN111708613A (zh) 2020-09-25
CN111708613B true CN111708613B (zh) 2020-12-11

Family

ID=72547068

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010829529.XA Active CN111708613B (zh) 2020-08-18 2020-08-18 一种修复vm虚拟机开机失败卡任务的方法及系统

Country Status (1)

Country Link
CN (1) CN111708613B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104932978A (zh) * 2015-06-29 2015-09-23 北京宇航时代科技发展有限公司 一种系统运行故障自检测及自修复的方法和系统
CN108255576A (zh) * 2017-12-08 2018-07-06 上海陆家嘴国际金融资产交易市场股份有限公司 虚拟机热迁移异常处理方法、装置和存储介质
CN109684063A (zh) * 2018-12-26 2019-04-26 亚信科技(中国)有限公司 一种任务调度方法和装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7707578B1 (en) * 2004-12-16 2010-04-27 Vmware, Inc. Mechanism for scheduling execution of threads for fair resource allocation in a multi-threaded and/or multi-core processing system
US8370835B2 (en) * 2009-03-12 2013-02-05 Arend Erich Dittmer Method for dynamically generating a configuration for a virtual machine with a virtual hard disk in an external storage device
US9363190B2 (en) * 2013-07-31 2016-06-07 Manjrasoft Pty. Ltd. System, method and computer program product for energy-efficient and service level agreement (SLA)-based management of data centers for cloud computing
US10467068B2 (en) * 2015-10-30 2019-11-05 Council Of Scientific And Industrial Research Automated remote computing method and system by email platform for molecular analysis
CN106250251B (zh) * 2016-07-21 2018-12-21 北京航空航天大学 考虑共因和虚拟机故障迁移的云计算系统可靠性建模方法
US10678603B2 (en) * 2016-09-01 2020-06-09 Microsoft Technology Licensing, Llc Resource oversubscription based on utilization patterns in computing systems
CN110286324B (zh) * 2019-07-18 2021-07-09 北京碧水润城水务咨询有限公司 一种电池荷电状态估算方法及电池健康状态估算方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104932978A (zh) * 2015-06-29 2015-09-23 北京宇航时代科技发展有限公司 一种系统运行故障自检测及自修复的方法和系统
CN108255576A (zh) * 2017-12-08 2018-07-06 上海陆家嘴国际金融资产交易市场股份有限公司 虚拟机热迁移异常处理方法、装置和存储介质
CN109684063A (zh) * 2018-12-26 2019-04-26 亚信科技(中国)有限公司 一种任务调度方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
vmware centOS 开机进度条 卡死 Determining IP Information for eth0...;晓镁;《https://blog.csdn.net/realmardrid/article/details/46955509》;20150719;第1-4页 *
无法启动某虚拟机,发现它在启动-强制关闭卡死的虚拟机;MissRong;《https://www.cnblogs.com/liuxinrong/p/12665321.html》;20200409;第1-3页 *

Also Published As

Publication number Publication date
CN111708613A (zh) 2020-09-25

Similar Documents

Publication Publication Date Title
CN100517246C (zh) 一种计算机远程控制方法及系统
CN102855174B (zh) 自动化测试中可自动恢复的目标程序运行控制方法及装置
CN104220985A (zh) 使用用户空间同步增强休眠和恢复处理的方法和装置
CN101673216A (zh) 应用程序关闭方法和装置
CN104636217A (zh) 一种根文件系统自动备份和异常恢复方法和分区结构
CN105159719A (zh) 一种主备用基本输入输出系统的启动方法及装置
CN103970564A (zh) 嵌入式操作系统自动修复升级功能的方法及其系统
CN105653405A (zh) 一种通用引导程序的故障处理方法及系统
CN111949333A (zh) 一种实现arm服务器bios主备切换的系统及方法
CN106406962A (zh) 基于arm的风力发电控制器远程升级失败可恢复的方法
CN111708613B (zh) 一种修复vm虚拟机开机失败卡任务的方法及系统
CN105426263A (zh) 一种实现金库系统安全运行的方法及系统
CN110413450A (zh) 一种处理应用程序崩溃的方法、装置及设备
CN111984195A (zh) 一种提高嵌入式Linux系统稳定性的方法及装置
CN110928726A (zh) 一种基于看门狗及pxe的嵌入式系统自恢复方法及系统
CN113687867B (zh) 一种云平台集群的关机方法、系统、设备及存储介质
CN109324834A (zh) 一种分布式存储服务器自动重启的系统及方法
CN114510374A (zh) 一种外设挂载失败自动恢复系统及方法
CN113515291A (zh) 设备在线升级方法和装置
CN105391575A (zh) 一种金库控制方法及系统
US20030140082A1 (en) Patch processing system and method
CN111078452A (zh) 一种bmc固件镜像恢复方法与装置
CN104142832A (zh) 电脑装置及其重开机方法
CN112328434A (zh) 一种故障恢复方法、装置、设备、介质和系统
CN110308919A (zh) 一种基于mSATA本地升级BMC的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant