CN109558209A - 一种用于虚拟机的监控方法 - Google Patents

一种用于虚拟机的监控方法 Download PDF

Info

Publication number
CN109558209A
CN109558209A CN201811383752.5A CN201811383752A CN109558209A CN 109558209 A CN109558209 A CN 109558209A CN 201811383752 A CN201811383752 A CN 201811383752A CN 109558209 A CN109558209 A CN 109558209A
Authority
CN
China
Prior art keywords
virtual machine
life cycle
monitoring method
physical host
machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811383752.5A
Other languages
English (en)
Other versions
CN109558209B (zh
Inventor
卢正超
岳彩仓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201811383752.5A priority Critical patent/CN109558209B/zh
Publication of CN109558209A publication Critical patent/CN109558209A/zh
Application granted granted Critical
Publication of CN109558209B publication Critical patent/CN109558209B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45583Memory management, e.g. access or allocation

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供了一种用于虚拟机的监控方法,包括如下步骤:1)对虚拟机进行监控,并获取虚拟机的属性信息;2)如果虚拟机不工作,判断虚拟机是否到达生命周期,如果到达生命周期,则发出报警,并将虚拟机删除;如果未到达生命周期,则进入步骤3)3)查看虚拟机所在物理主机的状态,如果物理主机异常,则向管理员发出报警;如果物理主机异常,则进入步骤4);4)检测虚拟机的心跳信息,如果无心跳信息,则判断虚拟机故障,重启虚拟机。该方法可以监控虚拟机的生命周期,还可以在使用中遇到故障时,及时的发出报警,提醒管理者,这样可以很高的提高用户的使用感受,并且也节省了资源。

Description

一种用于虚拟机的监控方法
技术领域
本发明涉及的是一种一种用于虚拟机的监控方法。
背景技术
随着信息爆炸式的增长,云平台得到了越来越多的关注,OpenStack作为一款开源的云计算管理平台,得到很多公司的青睐,在虚拟机的使用过程中,如果虚拟机损坏或者出现了比较严重的故障,但是horizon页面,虚拟机的状态依旧正常,管理员无法及时获知,并且在实际使用过程中,可能需要一部分虚拟机只使用一段时间,之后将虚拟机的资源收回,因此需要一种监控方法,能快速处理虚拟机故障,并能通知管理员,还可以监控虚拟机的使用周期。
发明内容
本发明的目的就是针对现有技术所存在的不足,而提供一种用于虚拟机的监控方法,该方法可以监控虚拟机的生命周期,还可以在使用中遇到故障时,及时的发出报警,提醒管理者,这样可以很高的提高用户的使用感受,并且也节省了资源。
本方案是通过如下技术措施来实现的:一种用于虚拟机的监控方法,包括如下步骤:1)对虚拟机进行监控,并获取虚拟机的属性信息;属性信息包括虚拟机编码、实时信息和生命周期;2)如果虚拟机不工作,判断虚拟机是否到达生命周期,如果到达生命周期,则发出报警,并将虚拟机删除,如果未到达生命周期,则进入步骤3);3)查看虚拟机所在物理主机的状态,如果物理主机异常,则向管理员发出报警;如果物理主机异常,则进入步骤4);4)检测虚拟机的心跳信息,如果无心跳信息,则判断虚拟机故障,重启虚拟机。这样首先判断是否达到生命周期,避免误报警,并且如果物理主机出现问题也可以及时报警,提升用户的体验。
虚拟机编码为虚拟机在整个云计算平台的创建时间顺序,得到对应虚拟机编码,实时信息为虚拟机的用户标识,生存周期为虚拟机的使用时长。这样每个虚拟机均有编码,避免混乱,并且编码根据虚拟机的创建时间,保证了编码的唯一性。
所述的步骤3)中,查看虚拟机所在物理主机的状态时,判断虚拟机所在物理主机的当前资源使用情况,如果cpu或内存使用率为100%,则物理主机异常,如果cpu使用率*0.5+内存使用率*0.5大于设定值,设定值为90%,则物理主机异常。这样可以判断物理主机是否出现故障。。
重启虚拟机时,对虚拟机进行镜像并进行存储。步骤4)中,重启虚拟机后,重复步骤4)如果依然无心跳信息,则重复重启,设定虚拟机的重启阈值n,n≤5,如果重启次数超过阈值,则加载重启前的虚拟机镜像,并将该虚拟机删除。采用镜像,保证了数据的完整性,并且可以使虚拟机的文件是第一次重启之前的镜像,避免重启时的数据错误。
步骤2)中,将删除的虚拟机文件暂存在虚拟机回收站后,设定时间阈值,并在设定的时间阈值内问询用户是否需要本虚拟机生命周期内产生的文件,如果客户需要,则将产生的文件发送给用户,然后删除此虚拟机在虚拟机回收站的文件,如果用户确认删除,则直接删除此虚拟机在虚拟机回收站的文件。这样可以保存文件一段时间,便于用户及时的获取原虚拟机的文件,避免用户的损失,提升了用户的体验。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
图1为本发明具体实施方式的流程图。
具体实施方式
为能清楚说明本方案的技术特点,下面通过一个具体实施方式,并结合其附图,对本方案进行阐述。
通过附图可以看出,本方案的用于虚拟机的监控方法,包括如下步骤:1)对虚拟机进行监控,并获取虚拟机的属性信息;属性信息包括虚拟机编码、实时信息和生命周期;2)如果虚拟机不工作,判断虚拟机是否到达生命周期,如果到达生命周期,则发出报警,并将虚拟机删除,如果未到达生命周期,则进入步骤3);3)查看虚拟机所在物理主机的状态,如果物理主机异常,则向管理员发出报警;如果物理主机异常,则进入步骤4);4)检测虚拟机的心跳信息,如果无心跳信息,则判断虚拟机故障,重启虚拟机,重启虚拟机后,重复步骤4)如果依然无心跳信息,则重复重启,设定虚拟机的重启阈值n,n≤5,如果重启次数超过阈值,则加载重启前的虚拟机镜像,并将该虚拟机删除。重启虚拟机时,对虚拟机进行镜像并进行存储,这样可以使数据完整的保存。
虚拟机编码为虚拟机在整个云计算平台的创建时间顺序,得到对应虚拟机编码,实时信息为虚拟机的用户标识,生存周期为虚拟机的使用时长。
所述的步骤3)中,查看虚拟机所在物理主机的状态时,判断虚拟机所在物理主机的当前资源使用情况,如果cpu或内存使用率为100%,则物理主机异常,如果cpu使用率*0.5+内存使用率*0.5大于90%,则物理主机异常,向管理员发出报警,提醒物理主机出现故障。
步骤2)中,将删除的虚拟机文件暂存在虚拟机回收站后,设定时间阈值,并在设定的时间阈值内问询用户是否需要本虚拟机生命周期内产生的文件,如果客户需要,则将产生的文件发送给用户,然后删除此虚拟机在虚拟机回收站的文件,如果用户确认删除,则直接删除此虚拟机在虚拟机回收站的文件,这样可以为用户保存一段时间的文件,便于用户保存或者提取数据。
本发明并不仅限于上述具体实施方式,本领域普通技术人员在本发明的实质范围内做出的变化、改型、添加或替换,也应属于本发明的保护范围。

Claims (8)

1.一种用于虚拟机的监控方法,其特征包括如下步骤:
1)对虚拟机进行监控,并获取虚拟机的属性信息;
2)如果虚拟机不工作,判断虚拟机是否到达生命周期,如果到达生命周期,则发出报警,并将虚拟机删除;如果未到达生命周期,则进入步骤3);
3)查看虚拟机所在物理主机的状态,如果物理主机异常,则向管理员发出报警;如果物理主机异常,则进入步骤4);
4)检测虚拟机的心跳信息,如果无心跳信息,则判断虚拟机故障,重启虚拟机。
2.根据权利要求1所述的用于虚拟机的监控方法,其特征是:所述的步骤1)中的属性信息包括虚拟机编码、实时信息和生命周期。
3.根据权利要求2所述的用于虚拟机的监控方法,其特征是:虚拟机编码为虚拟机在整个云计算平台的创建时间顺序,得到对应虚拟机编码,实时信息为虚拟机的用户标识,生存周期为虚拟机的使用时长。
4.根据权利要求1所述的用于虚拟机的监控方法,其特征是:所述的步骤3)中,查看虚拟机所在物理主机的状态时,判断虚拟机所在物理主机的当前资源使用情况,如果cpu或内存使用率为100%,则物理主机异常,如果cpu使用率*0.5+内存使用率*0.5大于设定值,则物理主机异常。
5.根据权利要求4所述的用于虚拟机的监控方法,其特征是:设定值为90%。
6.根据权利要求1所述的用于虚拟机的监控方法,其特征是:重启虚拟机时,对虚拟机进行镜像并进行存储。
7.根据权利要求6所述的用于虚拟机的监控方法,其特征是:步骤4)中,重启虚拟机后,重复步骤4)如果依然无心跳信息,则重复重启,设定虚拟机的重启阈值n,n≤5,如果重启次数超过阈值,则加载重启前的虚拟机镜像,并将该虚拟机删除。
8.根据权利要求1所述的用于虚拟机的监控方法,其特征是:步骤2)中,将删除的虚拟机文件暂存在虚拟机回收站后,设定时间阈值,并在设定的时间阈值内问询用户是否需要本虚拟机生命周期内产生的文件,如果客户需要,则将产生的文件发送给用户,然后删除此虚拟机在虚拟机回收站的文件,如果用户确认删除,则直接删除此虚拟机在虚拟机回收站的文件。
CN201811383752.5A 2018-11-20 2018-11-20 一种用于虚拟机的监控方法 Active CN109558209B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811383752.5A CN109558209B (zh) 2018-11-20 2018-11-20 一种用于虚拟机的监控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811383752.5A CN109558209B (zh) 2018-11-20 2018-11-20 一种用于虚拟机的监控方法

Publications (2)

Publication Number Publication Date
CN109558209A true CN109558209A (zh) 2019-04-02
CN109558209B CN109558209B (zh) 2021-10-29

Family

ID=65866595

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811383752.5A Active CN109558209B (zh) 2018-11-20 2018-11-20 一种用于虚拟机的监控方法

Country Status (1)

Country Link
CN (1) CN109558209B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111399775A (zh) * 2020-03-12 2020-07-10 山东汇贸电子口岸有限公司 一种基于OpenStack环境的资源清理方法和系统
CN111736961A (zh) * 2020-08-18 2020-10-02 鹏城实验室 虚拟机的释放方法及装置、存储介质及电子设备
CN111953566A (zh) * 2020-08-13 2020-11-17 北京中电兴发科技有限公司 一种基于分布式故障监控的方法和虚拟机高可用系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160085481A1 (en) * 2014-09-19 2016-03-24 Vmware, Inc. Storage tiering based on virtual machine operations and virtual volume type
CN105487917A (zh) * 2015-12-07 2016-04-13 郑州轻工业学院 一种虚拟机实现验证码系统修复的方法及装置
CN108108255A (zh) * 2016-11-25 2018-06-01 中兴通讯股份有限公司 虚拟机故障的检测和恢复方法及装置
CN108733454A (zh) * 2018-05-29 2018-11-02 郑州云海信息技术有限公司 一种虚拟机故障处理方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160085481A1 (en) * 2014-09-19 2016-03-24 Vmware, Inc. Storage tiering based on virtual machine operations and virtual volume type
CN105487917A (zh) * 2015-12-07 2016-04-13 郑州轻工业学院 一种虚拟机实现验证码系统修复的方法及装置
CN108108255A (zh) * 2016-11-25 2018-06-01 中兴通讯股份有限公司 虚拟机故障的检测和恢复方法及装置
CN108733454A (zh) * 2018-05-29 2018-11-02 郑州云海信息技术有限公司 一种虚拟机故障处理方法和装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111399775A (zh) * 2020-03-12 2020-07-10 山东汇贸电子口岸有限公司 一种基于OpenStack环境的资源清理方法和系统
CN111953566A (zh) * 2020-08-13 2020-11-17 北京中电兴发科技有限公司 一种基于分布式故障监控的方法和虚拟机高可用系统
CN111736961A (zh) * 2020-08-18 2020-10-02 鹏城实验室 虚拟机的释放方法及装置、存储介质及电子设备
CN111736961B (zh) * 2020-08-18 2020-12-01 鹏城实验室 虚拟机的释放方法及装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN109558209B (zh) 2021-10-29

Similar Documents

Publication Publication Date Title
TWI746512B (zh) 實體機器故障分類處理方法、裝置和虛擬機器恢復方法、系統
CN109558209A (zh) 一种用于虚拟机的监控方法
JP7478226B2 (ja) 充電ステーション監視方法および装置
CN109614283B (zh) 分布式数据库集群的监控系统
CN103812699A (zh) 基于云计算的监控管理系统
CN104252500A (zh) 一种数据库管理平台的故障修复方法和装置
CN104639368A (zh) 通信网络设备的故障处理方法及装置
CN106646057A (zh) 停复电主动判断方法
CN108647118B (zh) 基于存储集群的副本异常恢复方法、装置及计算机设备
CN103744977A (zh) 一种云计算系统平台中的监控方法及系统
BR112017001171B1 (pt) Método executado em um dispositivo de computação, dispositivo de computação e dispositivo de memória legível por computador para recuperar a operacionalidade de um serviço baseado em nuvem
CN108090331A (zh) 一种解锁方法及设备
CN103885406A (zh) 基于多数据融合的工业制气设备故障智能诊断和监控系统
CN108958965A (zh) 一种bmc监控可恢复ecc错误的方法、装置及设备
CN104579737A (zh) 一种分布式web系统的运行维护的方法及系统
CN110825580A (zh) Kuberrnates Pod健康监控方法
CN107291589A (zh) 在机器人操作系统中提升系统可靠性的方法
CN107026762B (zh) 一种基于分布式集群的容灾系统及方法
CN104618461A (zh) 一种基于动码云手机的服务器监控方法
CN104699551B (zh) 一种数据恢复方法及云端服务器
CN110572783A (zh) 基于短信的远程安全监控管理系统和方法
CN115099778A (zh) 一种工业制造设备的管控方法、系统、设备及介质
CN109491764A (zh) 一种基于openstack的虚拟机故障管理方法
CN108122037A (zh) It运维管理方法及it运维管理装置
CN109408293B (zh) 一种实时监测rack机柜电源的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant