CN105511937A - 一种适用于云平台的批量虚拟机蓝屏监控方法 - Google Patents
一种适用于云平台的批量虚拟机蓝屏监控方法 Download PDFInfo
- Publication number
- CN105511937A CN105511937A CN201510820944.8A CN201510820944A CN105511937A CN 105511937 A CN105511937 A CN 105511937A CN 201510820944 A CN201510820944 A CN 201510820944A CN 105511937 A CN105511937 A CN 105511937A
- Authority
- CN
- China
- Prior art keywords
- virtual machine
- blue screen
- snapshot
- mirror image
- batch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2056—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明涉及云计算环境下资源监控技术领域,特别是一种适用于云平台的批量虚拟机蓝屏监控方法。本发明所述方法包括:配置虚拟机模板镜像;利用所述母版镜像创建快照并启动虚拟机;在所述虚拟机所在的宿主机上运行虚拟机蓝屏检测程序定时获取虚拟机的屏幕快照文件,并分析处理快照文件判断虚拟机是否出现蓝屏;当检测到所述虚拟机出现蓝屏时,发出告警,并进行蓝屏后的相关处理。本发明可确保在虚拟机出现蓝屏时能够快速有效的检测到并给出告警;可以运用于云平台上,完善云平台的监控功能。
Description
技术领域
本发明涉及云计算环境下资源监控技术领域,特别是一种适用于云平台的批量虚拟机蓝屏监控方法。
背景技术
在云计算环境下的资源监控中,对虚拟机的监控包括各个方面,从虚拟机的参数配置情况到CPU利用率、磁盘IO等实时性能监控,无一不标明对虚拟机的管理越来越重要。
目前对虚拟机的运行状态、性能参数的监控一般都通过在虚拟机中植入代理agent来实现,这种方法带来的好处是宿主机可以通过与虚拟机里面的agent通信来获取虚拟机里面的参数信息,并且可以随着agent的功能越来越强大,管理员对虚拟机的监控也越来越完整,但是这种监控方式也存在如下几点不足:
一是agent代理的运行占用虚拟机资源,每一个待监控的虚拟机都需要运行一个agent,且随着agent功能越强,占用虚拟机资源就越大;
二是无法监控虚拟机蓝屏、虚拟机系统异常等状态,由于agent代理监控方式必要保证agent在虚拟机内部正常运行,那也就需要保证虚拟机系统的正常运行,当虚拟机出现蓝屏等异常情况时,宿主机根本无法通过agent或者虚拟机的监控数据。
另外,随着各种云平台的层出不穷,也带了了一些其他非agent方式监控虚拟机的运行状态,例如在宿主机通过windowsAPI、图像处理等的方式。此种方式虽然避免了agent代理监控方式存在的资源占用大、无法监控蓝屏等系统异常等盲区,但实现手段比较复杂,不能很好的结合到云平台中去。
为了简单可靠的实现对云平台各个windows虚拟机进行实时监控,在虚拟机发生蓝屏无法正常运行时,管理员能够及时掌握并处理,需要一种简单有效的虚拟机蓝屏监控方法。
发明内容
本发明解决的技术问题在于提供一种简单有效的适用于云平台的虚拟机蓝屏监控方法,解决了现阶段云平台环境下对虚拟机出现蓝屏后无法简单有效地进行实时监控与处理的问题。
本发明解决上述技术问题的技术方案是:
所述的方法包括以下步骤:
步骤1:配置虚拟机的模板镜像;
步骤2:利用所述母版镜像创建快照并启动虚拟机;
步骤3:在所述虚拟机所在的宿主机上运行虚拟机蓝屏检测程序定时获取虚拟机的屏幕快照文件,并分析处理快照文件判断虚拟机是否出现蓝屏;
步骤4:当检测到所述虚拟机出现蓝屏时,发出告警,并进行蓝屏后的相关处理。
所述的配置虚拟机模板镜像,包括配置虚拟机母版镜像里的故障恢复策略和屏幕分辨率;
所述的虚拟机母版镜像是一个镜像,利用该镜像,管理员可以批量创建很多台相同配置的虚拟机;
所述的故障恢复策略是指指定当虚拟机出现蓝屏或其他异常情况时系统是否马上自动重启,这里配置的策略是不让虚拟机出现蓝屏时自动重启。
所述的利用母版镜像创建快照并启动虚拟机包括:
利用虚拟化相关工具创建母版镜像的快照;
创建虚拟机配置文件,将快照设置为虚拟机的系统盘文件启动虚拟机。
所述的虚拟化工具是例如qemu-img,vhd-util等,可分别创建KVM和XEN虚拟化下的镜像快照。
在宿主机上运行监控程序,以定时线程方式执行libvirt命令获取虚拟机屏幕图片快照文件;
所述的libvirt命令为virshscreenshotvm-xxx;
所述的快照文件是一个ppm格式的图像二进制文件。
所述的分析处理蓝屏快照文件是根据分析蓝屏时的图像文件的RGB像素点的值来判断。
本发明方案的有益效果如下:
1、提供一种新的、更加简单易用的虚拟机蓝屏监控方法,本发明在虚拟机蓝屏检测上原理简单,方法易实现。
2、完善云平台的监控功能,云平台需要对其上所有资源进行实时监控,采用本发明的方法,可以很容易的实现批量虚拟机的蓝屏监控。
3、提高虚拟机系统运行性能,本发明无需再虚拟机系统内部运行额外的agent代理程序,降低了虚拟机系统资源开销。
附图说明
下面结合附图对本发明进一步说明:
图1为本发明的蓝屏监控方法流程图;
图2为本发明的模块图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参见图1、2,为本发明实施例提供的一种适用于云平台的批量虚拟机蓝屏检控方法的流程示意图,所述方法包括:
配置虚拟机母版镜像;
具体的首先以虚拟机母版镜像启动一台虚拟机,进入系统后通过点击系统“开始——>计算机——>属性——>高级选项卡——>启动和故障恢复——>设置”在系统失败配置中将“自动重启启动”项标识为不选。这样就完成了当虚拟机在出现蓝屏的时候不会立即进行系统的重启恢复。
然后配置虚拟机母版镜像的桌面背景分辨率,我们这里以配置640*480位标准进行后续的描述。这里对分辨率统一为多少不做要求,当用户配置了一个分辨率后,只需要在后面的检测程序做相应的调整即可。
配置虚拟机母版镜像之后关闭虚拟机,然后用户即可利用此母版镜像创建很多快照,每一个快照都可以创建一台虚拟机,快照创建的虚拟机都满足了相应的配置。
虚拟机(windows)运行期间,宿主机上采用定时线程实时采集虚拟机的桌面图像,定时线程执行如下命令进行采集:
virshscreenshotwin2003
其中win2003是虚拟机的名称。
每次采集都会生成一个ppm格式的图像二进制文件:
如win2003-2015-01-22-13:41:08.ppm
然后,监控模块继续对采集到的图像文件进行分析,蓝屏分析程序的方案原理是根据分析蓝屏时的图像文件(ppm文件)的RGB像素点的值(3字节=24位)来判断(例如蓝屏时的蓝色RGB为#000080)。得出是否蓝屏结论,如下为一个最简单的仅供参考的图像文件分析程序代码:
上述图像分析程序是通过蓝屏时ppm二进制文件的第16字节至27003字节之间的每3个字节依次为#000080来是否判断蓝屏,这里要注意根据设置的屏幕分辨率来做出相应的调整。
根据虚拟机屏幕采集文件的分析来确定是否出现蓝屏,当虚拟机出现蓝屏时,继而进入虚拟机蓝屏处理模块,例如短信或者邮件形式的告警处理、继而通过云平台重启虚拟机等,由于本发明关注点是在虚拟机蓝屏的检测,故相应的具体处理不在此讨论。
Claims (7)
1.一种适用于云平台的批量虚拟机蓝屏监控方法,其特征在于:所述的方法包括以下步骤:
步骤1:配置虚拟机的模板镜像;
步骤2:利用所述母版镜像创建快照并启动虚拟机;
步骤3:在所述虚拟机所在的宿主机上运行虚拟机蓝屏检测程序定时获取虚拟机的屏幕快照文件,并分析处理快照文件判断虚拟机是否出现蓝屏;
步骤4:当检测到所述虚拟机出现蓝屏时,发出告警,并进行蓝屏后的相关处理。
2.根据权利要求1所述的批量虚拟机蓝屏监控方法,其特征在于:所述的配置虚拟机模板镜像,包括配置虚拟机母版镜像里的故障恢复策略和屏幕分辨率;
所述的虚拟机母版镜像是一个镜像,利用该镜像,管理员可以批量创建很多台相同配置的虚拟机;
所述的故障恢复策略是指指定当虚拟机出现蓝屏或其他异常情况时系统是否马上自动重启,这里配置的策略是不让虚拟机出现蓝屏时自动重启。
3.根据权利要求1所述的批量虚拟机蓝屏监控方法,其特征在于:所述的利用母版镜像创建快照并启动虚拟机包括:
利用虚拟化相关工具创建母版镜像的快照;
创建虚拟机配置文件,将快照设置为虚拟机的系统盘文件启动虚拟机。
所述的虚拟化工具是例如qemu-img,vhd-util等,可分别创建KVM和XEN虚拟化下的镜像快照。
4.根据权利要求2所述的批量虚拟机蓝屏监控方法,其特征在于:所述的利用母版镜像创建快照并启动虚拟机包括:
利用虚拟化相关工具创建母版镜像的快照;
创建虚拟机配置文件,将快照设置为虚拟机的系统盘文件启动虚拟机。
所述的虚拟化工具是例如qemu-img,vhd-util等,可分别创建KVM和XEN虚拟化下的镜像快照。
5.根据权利要求1至4任一项所述的批量虚拟机蓝屏监控方法,其特征在于:在宿主机上运行监控程序,以定时线程方式执行libvirt命令获取虚拟机屏幕图片快照文件;
所述的libvirt命令为virshscreenshotvm-xxx;
所述的快照文件是一个ppm格式的图像二进制文件。
6.根据权利要求1至4任一项所述的批量虚拟机蓝屏监控方法,其特征在于:所述的分析处理蓝屏快照文件是根据分析蓝屏时的图像文件的RGB像素点的值来判断。
7.根据权利要求5所述的批量虚拟机蓝屏监控方法,其特征在于:所述的分析处理蓝屏快照文件是根据分析蓝屏时的图像文件的RGB像素点的值来判断。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510820944.8A CN105511937A (zh) | 2015-11-23 | 2015-11-23 | 一种适用于云平台的批量虚拟机蓝屏监控方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510820944.8A CN105511937A (zh) | 2015-11-23 | 2015-11-23 | 一种适用于云平台的批量虚拟机蓝屏监控方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105511937A true CN105511937A (zh) | 2016-04-20 |
Family
ID=55719944
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510820944.8A Pending CN105511937A (zh) | 2015-11-23 | 2015-11-23 | 一种适用于云平台的批量虚拟机蓝屏监控方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105511937A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106775957A (zh) * | 2017-01-20 | 2017-05-31 | 郑州云海信息技术有限公司 | 一种虚拟机快照实现方法 |
CN107480033A (zh) * | 2016-06-08 | 2017-12-15 | 阿里巴巴集团控股有限公司 | 虚拟机蓝屏检测方法及设备 |
CN107783820A (zh) * | 2017-11-01 | 2018-03-09 | 国云科技股份有限公司 | 一种云平台虚拟机定时操作任务设置方法 |
CN109697145A (zh) * | 2018-12-19 | 2019-04-30 | 国云科技股份有限公司 | 一种自动分析云桌面蓝屏的方法 |
CN113157394A (zh) * | 2021-04-14 | 2021-07-23 | 深信服科技股份有限公司 | 一种镜像备份方法、装置及电子设备和存储介质 |
CN113849251A (zh) * | 2020-06-28 | 2021-12-28 | 中兴通讯股份有限公司 | 虚拟云桌面监测方法、客户端、服务端和存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6020931A (en) * | 1996-04-25 | 2000-02-01 | George S. Sheng | Video composition and position system and media signal communication system |
US20080070665A1 (en) * | 2006-09-19 | 2008-03-20 | Cyberscan Technology, Inc. | Regulated gaming - compartmented freelance code |
CN102637144A (zh) * | 2012-03-31 | 2012-08-15 | 奇智软件(北京)有限公司 | 一种系统故障的处理方法和装置 |
CN103530162A (zh) * | 2013-10-22 | 2014-01-22 | 中国科学院信息工程研究所 | 一种虚拟机在线自动软件安装的方法及系统 |
CN103729264A (zh) * | 2013-12-23 | 2014-04-16 | 国云科技股份有限公司 | 一种Windows虚拟机系统盘备份还原方法 |
CN104407931A (zh) * | 2014-10-28 | 2015-03-11 | 国云科技股份有限公司 | 一种获取虚拟机损坏系统盘镜像的方法 |
-
2015
- 2015-11-23 CN CN201510820944.8A patent/CN105511937A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6020931A (en) * | 1996-04-25 | 2000-02-01 | George S. Sheng | Video composition and position system and media signal communication system |
US20080070665A1 (en) * | 2006-09-19 | 2008-03-20 | Cyberscan Technology, Inc. | Regulated gaming - compartmented freelance code |
CN102637144A (zh) * | 2012-03-31 | 2012-08-15 | 奇智软件(北京)有限公司 | 一种系统故障的处理方法和装置 |
CN103530162A (zh) * | 2013-10-22 | 2014-01-22 | 中国科学院信息工程研究所 | 一种虚拟机在线自动软件安装的方法及系统 |
CN103729264A (zh) * | 2013-12-23 | 2014-04-16 | 国云科技股份有限公司 | 一种Windows虚拟机系统盘备份还原方法 |
CN104407931A (zh) * | 2014-10-28 | 2015-03-11 | 国云科技股份有限公司 | 一种获取虚拟机损坏系统盘镜像的方法 |
Non-Patent Citations (1)
Title |
---|
李斌,胡屹峰: "基于K VM的服务器虚拟化环境实现", 《洛阳理工学院学报(自然科学版)》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107480033A (zh) * | 2016-06-08 | 2017-12-15 | 阿里巴巴集团控股有限公司 | 虚拟机蓝屏检测方法及设备 |
CN106775957A (zh) * | 2017-01-20 | 2017-05-31 | 郑州云海信息技术有限公司 | 一种虚拟机快照实现方法 |
CN107783820A (zh) * | 2017-11-01 | 2018-03-09 | 国云科技股份有限公司 | 一种云平台虚拟机定时操作任务设置方法 |
CN109697145A (zh) * | 2018-12-19 | 2019-04-30 | 国云科技股份有限公司 | 一种自动分析云桌面蓝屏的方法 |
CN113849251A (zh) * | 2020-06-28 | 2021-12-28 | 中兴通讯股份有限公司 | 虚拟云桌面监测方法、客户端、服务端和存储介质 |
CN113157394A (zh) * | 2021-04-14 | 2021-07-23 | 深信服科技股份有限公司 | 一种镜像备份方法、装置及电子设备和存储介质 |
CN113157394B (zh) * | 2021-04-14 | 2023-11-03 | 深信服科技股份有限公司 | 一种镜像备份方法、装置及电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105511937A (zh) | 一种适用于云平台的批量虚拟机蓝屏监控方法 | |
EP3121726B1 (en) | Fault processing method, related device and computer | |
US6944796B2 (en) | Method and system to implement a system event log for system manageability | |
US8862727B2 (en) | Problem determination and diagnosis in shared dynamic clouds | |
WO2020134634A1 (zh) | 程序调试方法、程序调试装置、终端设备及存储介质 | |
WO2016145888A1 (zh) | 显示屏处理方法及装置 | |
US10848839B2 (en) | Out-of-band telemetry data collection | |
WO2014204996A1 (en) | Monitoring mobile application performance | |
Chen et al. | Predicting job completion times using system logs in supercomputing clusters | |
US20140143768A1 (en) | Monitoring updates on multiple computing platforms | |
US20170308423A1 (en) | Mitigating Crashes of an Application Server Executing a Monitoring Agent | |
WO2020211253A1 (zh) | 分布式系统中主机数量弹性伸缩方法、装置和计算机设备 | |
CN109144834B (zh) | 用户行为数据的采集方法及装置、安卓系统及终端设备 | |
CN111970151A (zh) | 虚拟及容器网络的流量故障定位方法及系统 | |
CN116302306A (zh) | 用于微服务体系结构的基于匹配的增强的调试 | |
CN109582505B (zh) | 一种bios选项默认值的恢复系统、方法及装置 | |
CN109918276B (zh) | 基于app应用程序的曝光埋点处理方法及相关设备 | |
CN114184885A (zh) | 一种故障检测方法、装置及存储介质 | |
CN113918411A (zh) | 基于边缘计算的终端设备管控方法和系统 | |
CN105159815A (zh) | 高性能计算集群系统故障预测方法和装置 | |
CN110618884A (zh) | 故障监控方法、虚拟化的网络功能模块管理器和存储介质 | |
CN107179911A (zh) | 一种重启管理引擎的方法和设备 | |
CN103106100B (zh) | 基于虚拟化技术的应用软件数据信息的处理方法和系统 | |
CN112068980A (zh) | 采样cpu挂死前信息的方法和装置、设备和存储介质 | |
US20080133900A1 (en) | Machine learning performance analysis tool |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160420 |
|
RJ01 | Rejection of invention patent application after publication |