CN109558209B - 一种用于虚拟机的监控方法 - Google Patents

一种用于虚拟机的监控方法 Download PDF

Info

Publication number
CN109558209B
CN109558209B CN201811383752.5A CN201811383752A CN109558209B CN 109558209 B CN109558209 B CN 109558209B CN 201811383752 A CN201811383752 A CN 201811383752A CN 109558209 B CN109558209 B CN 109558209B
Authority
CN
China
Prior art keywords
virtual machine
physical host
file
monitoring method
life cycle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811383752.5A
Other languages
English (en)
Other versions
CN109558209A (zh
Inventor
卢正超
岳彩仓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201811383752.5A priority Critical patent/CN109558209B/zh
Publication of CN109558209A publication Critical patent/CN109558209A/zh
Application granted granted Critical
Publication of CN109558209B publication Critical patent/CN109558209B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45583Memory management, e.g. access or allocation

Abstract

本发明提供了一种用于虚拟机的监控方法,包括如下步骤:1)对虚拟机进行监控,并获取虚拟机的属性信息;2)如果虚拟机不工作,判断虚拟机是否到达生命周期,如果到达生命周期,则发出报警,并将虚拟机删除;如果未到达生命周期,则进入步骤3)3)查看虚拟机所在物理主机的状态,如果物理主机异常,则向管理员发出报警;如果物理主机异常,则进入步骤4);4)检测虚拟机的心跳信息,如果无心跳信息,则判断虚拟机故障,重启虚拟机。该方法可以监控虚拟机的生命周期,还可以在使用中遇到故障时,及时的发出报警,提醒管理者,这样可以很高的提高用户的使用感受,并且也节省了资源。

Description

一种用于虚拟机的监控方法
技术领域
本发明涉及的是一种一种用于虚拟机的监控方法。
背景技术
随着信息爆炸式的增长,云平台得到了越来越多的关注,OpenStack作为一款开源的云计算管理平台,得到很多公司的青睐,在虚拟机的使用过程中,如果虚拟机损坏或者出现了比较严重的故障,但是horizon页面,虚拟机的状态依旧正常,管理员无法及时获知,并且在实际使用过程中,可能需要一部分虚拟机只使用一段时间,之后将虚拟机的资源收回,因此需要一种监控方法,能快速处理虚拟机故障,并能通知管理员,还可以监控虚拟机的使用周期。
发明内容
本发明的目的就是针对现有技术所存在的不足,而提供一种用于虚拟机的监控方法,该方法可以监控虚拟机的生命周期,还可以在使用中遇到故障时,及时的发出报警,提醒管理者,这样可以很高的提高用户的使用感受,并且也节省了资源。
本方案是通过如下技术措施来实现的:一种用于虚拟机的监控方法,包括如下步骤:1)对虚拟机进行监控,并获取虚拟机的属性信息;属性信息包括虚拟机编码、实时信息和生命周期;2)如果虚拟机不工作,判断虚拟机是否到达生命周期,如果到达生命周期,则发出报警,并将虚拟机删除,如果未到达生命周期,则进入步骤3);3)查看虚拟机所在物理主机的状态,如果物理主机异常,则向管理员发出报警;如果物理主机异常,则进入步骤4);4)检测虚拟机的心跳信息,如果无心跳信息,则判断虚拟机故障,重启虚拟机。这样首先判断是否达到生命周期,避免误报警,并且如果物理主机出现问题也可以及时报警,提升用户的体验。
虚拟机编码为虚拟机在整个云计算平台的创建时间顺序,得到对应虚拟机编码,实时信息为虚拟机的用户标识,生存周期为虚拟机的使用时长。这样每个虚拟机均有编码,避免混乱,并且编码根据虚拟机的创建时间,保证了编码的唯一性。
所述的步骤3)中,查看虚拟机所在物理主机的状态时,判断虚拟机所在物理主机的当前资源使用情况,如果cpu或内存使用率为100%,则物理主机异常,如果cpu使用率*0.5+内存使用率*0.5大于设定值,设定值为90%,则物理主机异常。这样可以判断物理主机是否出现故障。。
重启虚拟机时,对虚拟机进行镜像并进行存储。步骤4)中,重启虚拟机后,重复步骤4)如果依然无心跳信息,则重复重启,设定虚拟机的重启阈值n,n≤5,如果重启次数超过阈值,则加载重启前的虚拟机镜像,并将该虚拟机删除。采用镜像,保证了数据的完整性,并且可以使虚拟机的文件是第一次重启之前的镜像,避免重启时的数据错误。
步骤2)中,将删除的虚拟机文件暂存在虚拟机回收站后,设定时间阈值,并在设定的时间阈值内问询用户是否需要本虚拟机生命周期内产生的文件,如果客户需要,则将产生的文件发送给用户,然后删除此虚拟机在虚拟机回收站的文件,如果用户确认删除,则直接删除此虚拟机在虚拟机回收站的文件。这样可以保存文件一段时间,便于用户及时的获取原虚拟机的文件,避免用户的损失,提升了用户的体验。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
图1为本发明具体实施方式的流程图。
具体实施方式
为能清楚说明本方案的技术特点,下面通过一个具体实施方式,并结合其附图,对本方案进行阐述。
通过附图可以看出,本方案的用于虚拟机的监控方法,包括如下步骤:1)对虚拟机进行监控,并获取虚拟机的属性信息;属性信息包括虚拟机编码、实时信息和生命周期;2)如果虚拟机不工作,判断虚拟机是否到达生命周期,如果到达生命周期,则发出报警,并将虚拟机删除,如果未到达生命周期,则进入步骤3);3)查看虚拟机所在物理主机的状态,如果物理主机异常,则向管理员发出报警;如果物理主机异常,则进入步骤4);4)检测虚拟机的心跳信息,如果无心跳信息,则判断虚拟机故障,重启虚拟机,重启虚拟机后,重复步骤4)如果依然无心跳信息,则重复重启,设定虚拟机的重启阈值n,n≤5,如果重启次数超过阈值,则加载重启前的虚拟机镜像,并将该虚拟机删除。重启虚拟机时,对虚拟机进行镜像并进行存储,这样可以使数据完整的保存。
虚拟机编码为虚拟机在整个云计算平台的创建时间顺序,得到对应虚拟机编码,实时信息为虚拟机的用户标识,生存周期为虚拟机的使用时长。
所述的步骤3)中,查看虚拟机所在物理主机的状态时,判断虚拟机所在物理主机的当前资源使用情况,如果cpu或内存使用率为100%,则物理主机异常,如果cpu使用率*0.5+内存使用率*0.5大于90%,则物理主机异常,向管理员发出报警,提醒物理主机出现故障。
步骤2)中,将删除的虚拟机文件暂存在虚拟机回收站后,设定时间阈值,并在设定的时间阈值内问询用户是否需要本虚拟机生命周期内产生的文件,如果客户需要,则将产生的文件发送给用户,然后删除此虚拟机在虚拟机回收站的文件,如果用户确认删除,则直接删除此虚拟机在虚拟机回收站的文件,这样可以为用户保存一段时间的文件,便于用户保存或者提取数据。
本发明并不仅限于上述具体实施方式,本领域普通技术人员在本发明的实质范围内做出的变化、改型、添加或替换,也应属于本发明的保护范围。

Claims (6)

1.一种用于虚拟机的监控方法,其特征包括如下步骤:
1)对虚拟机进行监控,并获取虚拟机的属性信息;
2)如果虚拟机不工作,判断虚拟机是否到达生命周期,如果到达生命周期,则发出报警,并将虚拟机删除;如果未到达生命周期,则进入步骤3);
3)查看虚拟机所在物理主机的状态,如果物理主机异常,则向管理员发出报警;如果物理主机异常,则进入步骤4);
4)检测虚拟机的心跳信息,如果无心跳信息,则判断虚拟机故障,重启虚拟机;
所述步骤1)中的属性信息包括虚拟机编码、实时信息和生命周期;
步骤2)中,将删除的虚拟机文件暂存在虚拟机回收站后,设定时间阈值,并在设定的时间阈值内问询用户是否需要本虚拟机生命周期内产生的文件,如果客户需要,则将产生的文件发送给用户,然后删除此虚拟机在虚拟机回收站的文件,如果用户确认删除,则直接删除此虚拟机在虚拟机回收站的文件。
2.根据权利要求1所述的用于虚拟机的监控方法,其特征是:虚拟机编码为虚拟机在整个云计算平台的创建时间顺序,得到对应虚拟机编码,实时信息为虚拟机的用户标识,生存周期为虚拟机的使用时长。
3.根据权利要求1所述的用于虚拟机的监控方法,其特征是:所述的步骤3)中,查看虚拟机所在物理主机的状态时,判断虚拟机所在物理主机的当前资源使用情况,如果cpu或内存使用率为100%,则物理主机异常,如果cpu使用率*0.5+内存使用率*0.5大于设定值,则物理主机异常。
4.根据权利要求3所述的用于虚拟机的监控方法,其特征是:设定值为90%。
5.根据权利要求1所述的用于虚拟机的监控方法,其特征是:重启虚拟机时,对虚拟机进行镜像并进行存储。
6.根据权利要求5所述的用于虚拟机的监控方法,其特征是:步骤4)中,重启虚拟机后,重复步骤4)如果依然无心跳信息,则重复重启,设定虚拟机的重启阈值n,n≤5,如果重启次数超过阈值,则加载重启前的虚拟机镜像,并将该虚拟机删除。
CN201811383752.5A 2018-11-20 2018-11-20 一种用于虚拟机的监控方法 Active CN109558209B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811383752.5A CN109558209B (zh) 2018-11-20 2018-11-20 一种用于虚拟机的监控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811383752.5A CN109558209B (zh) 2018-11-20 2018-11-20 一种用于虚拟机的监控方法

Publications (2)

Publication Number Publication Date
CN109558209A CN109558209A (zh) 2019-04-02
CN109558209B true CN109558209B (zh) 2021-10-29

Family

ID=65866595

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811383752.5A Active CN109558209B (zh) 2018-11-20 2018-11-20 一种用于虚拟机的监控方法

Country Status (1)

Country Link
CN (1) CN109558209B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111399775A (zh) * 2020-03-12 2020-07-10 山东汇贸电子口岸有限公司 一种基于OpenStack环境的资源清理方法和系统
CN111953566B (zh) * 2020-08-13 2022-03-11 北京中电兴发科技有限公司 一种基于分布式故障监控的方法和虚拟机高可用系统
CN111736961B (zh) * 2020-08-18 2020-12-01 鹏城实验室 虚拟机的释放方法及装置、存储介质及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105487917A (zh) * 2015-12-07 2016-04-13 郑州轻工业学院 一种虚拟机实现验证码系统修复的方法及装置
CN108108255A (zh) * 2016-11-25 2018-06-01 中兴通讯股份有限公司 虚拟机故障的检测和恢复方法及装置
CN108733454A (zh) * 2018-05-29 2018-11-02 郑州云海信息技术有限公司 一种虚拟机故障处理方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9477427B2 (en) * 2014-09-19 2016-10-25 Vmware, Inc. Storage tiering based on virtual machine operations and virtual volume type

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105487917A (zh) * 2015-12-07 2016-04-13 郑州轻工业学院 一种虚拟机实现验证码系统修复的方法及装置
CN108108255A (zh) * 2016-11-25 2018-06-01 中兴通讯股份有限公司 虚拟机故障的检测和恢复方法及装置
CN108733454A (zh) * 2018-05-29 2018-11-02 郑州云海信息技术有限公司 一种虚拟机故障处理方法和装置

Also Published As

Publication number Publication date
CN109558209A (zh) 2019-04-02

Similar Documents

Publication Publication Date Title
US10817386B2 (en) Virtual machine recovery method and virtual machine management device
CN109558209B (zh) 一种用于虚拟机的监控方法
CN110442498B (zh) 异常数据节点的定位方法、装置、存储介质及计算机设备
EP3142011A1 (en) Anomaly recovery method for virtual machine in distributed environment
CN108255576B (zh) 虚拟机热迁移异常处理方法、装置和存储介质
CN110825495A (zh) 一种容器云平台的恢复方法、装置、设备及可读存储介质
CN110063042B (zh) 一种数据库故障的响应方法及其终端
CN111901176B (zh) 故障确定方法、装置、设备及存储介质
CN108647118B (zh) 基于存储集群的副本异常恢复方法、装置及计算机设备
CN108958965B (zh) 一种bmc监控可恢复ecc错误的方法、装置及设备
CN107729213B (zh) 一种后台任务监控方法及装置
CN114978883B (zh) 网络唤醒的管理方法、装置、电子设备及存储介质
TWI518680B (zh) 維護電腦系統之檔案系統的方法
CN115314361B (zh) 一种服务器集群管理方法及其相关组件
WO2021012562A1 (zh) 区块链数据清理方法、装置、计算机设备和存储介质
CN114416284A (zh) 分布式作业系统控制方法、装置、设备、介质及程序产品
CN114490196A (zh) 数据库切换方法、系统、设备及介质
WO2021078222A1 (zh) 对象存储系统中对象主副本文件的确定方法及装置
CN107590647A (zh) 船舶管理系统的伺服监管系统
CN114296827A (zh) 数据文件处理方法、装置、设备及存储介质
CN109144788B (zh) 一种重建osd的方法、装置及系统
CN111400100A (zh) 一种分布式软件备份的管理方法及其系统
CN110908821A (zh) 任务失败管理的方法、装置、设备和存储介质
CN110764940A (zh) 分布式系统服务异常的处理方法及装置
CN110597609A (zh) 一种集群迁移与自动恢复方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant