CN106559441B - 一种基于云计算服务的虚拟机监控方法、装置及系统 - Google Patents

一种基于云计算服务的虚拟机监控方法、装置及系统 Download PDF

Info

Publication number
CN106559441B
CN106559441B CN201510623196.4A CN201510623196A CN106559441B CN 106559441 B CN106559441 B CN 106559441B CN 201510623196 A CN201510623196 A CN 201510623196A CN 106559441 B CN106559441 B CN 106559441B
Authority
CN
China
Prior art keywords
virtual machine
application
cloud computing
restart
operating system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510623196.4A
Other languages
English (en)
Other versions
CN106559441A (zh
Inventor
严永福
曾宪军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201510623196.4A priority Critical patent/CN106559441B/zh
Priority to PCT/CN2016/090068 priority patent/WO2017049997A1/zh
Publication of CN106559441A publication Critical patent/CN106559441A/zh
Application granted granted Critical
Publication of CN106559441B publication Critical patent/CN106559441B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • H04L67/025Protocols based on web technology, e.g. hypertext transfer protocol [HTTP] for remote control or remote monitoring of applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/08Protocols specially adapted for terminal emulation, e.g. Telnet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Stored Programmes (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明实施例公开了一种基于云计算的虚拟机监控方法,包括:云计算管理设备向虚拟机发送HACS部署请求以指示虚拟机为应用安装HACS功能;云计算管理设备接收虚拟机发送的应用异常指示,其中,应用异常指示用于指示应用运行异常;云计算管理设备根据应用的运行异常指示判断是否需要重启应用,若需要重启应用,则向虚拟机发送重启应用请求以指示虚拟机重启应用。本发明实施例还公开了一种基于云计算的虚拟机监控的装置,可以有效保证通过虚拟机向用户提供正常的应用,这种在虚拟机中部署软件监控虚拟机的方式实现起来较为简单,而且使用成本较低。

Description

一种基于云计算服务的虚拟机监控方法、装置及系统
技术领域
本发明涉及通信技术领域,尤其涉及一种基于云计算的虚拟机监控方法、装置及系统。
背景技术
随着并行计算(Parallel Computing)、分布式计算(Distributed Computing)的发展,云计算的概念应运而生。“云”是一些可以自我维护和管理的虚拟计算资源,通常是一些大型服务器集群,包括计算服务器、存储服务器和宽带资源等。云计算将计算资源集中起来,并通过专门软件实现自动管理,无需人为参与。
云计算服务是基于云计算的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且虚拟化的资源。云计算服务指通过网络以按需、易扩展的方式获得所需服务,这种服务可以是IT和软件、互联网相关,也可是其他服务。云计算的核心理念是资源池,网格计算池将计算和存储资源虚拟成为一个可以任意组合分配的集合,资源池的规模可以动态扩展,分配给用户的处理能力可以动态回收重用,用户通常通过异地虚拟机使用这些服务,能够大大提高资源的利用率。
随着各运营商云资源池的不断建设和完善,运营商对云计算平台的成本控制越来越严格,越来越多的运营商要求将增值服务(VAS,Value Added Service)部署到云资源池中,但同时要求保证云计算服务质量,即保证能正常提供虚拟机上的增值服务。现有的虚拟机监控技术包括传统的物理机双机部署方案,即每个虚拟机有一个物理的备用机,但该方案需要给所有虚拟机提供备用机并使备用机连接到网络中,因此部署成本较高而且导致复杂的组网方案。另外,现有的基于云计算平台的虚拟机监控技术中,通常只能通过部署在虚拟机中的代理软件监控虚拟机的运行情况,不能监控虚拟机的应用运行情况,因此难以保证通过虚拟机向用户提供正常的增值应用服务。
因此,提供一种有效的虚拟监控方案以保证通过虚拟机向用户提供正常的增值应用服务是亟待解决的问题。
发明内容
本发明实施例公开了一种基于云计算的虚拟机监控方法、装置及系统,可以使云计算管理设备监控虚拟机的应用的运行状况,若需要重启应用,则向虚拟机发送重启应用请求以使虚拟机重启应用。从而可以有效保证通过虚拟机向用户提供正常的增值应用,这种在虚拟机中部署软件监控虚拟机的方式实现起来较为简单,而且使用成本较低。
本发明实施例第一方面提供了一种基于云计算服务的虚拟机监控方法,所述方法包括:
云计算管理设备向虚拟机发送高可用集群服务(HACS,High AvailabilityCluster Server)部署请求以指示所述虚拟机为其上运行的应用安装HACS功能,所述HACS功能用于监控所述应用的运行是否异常;
所述云计算管理设备接收所述虚拟机发送的应用异常指示,其中,所述应用异常指示用于指示所述应用运行异常;
所述云计算管理设备根据所述应用运行异常指示判断是否需要重启所述应用,若需要重启所述应用,则向所述虚拟机发送重启应用请求以指示所述虚拟机重启所述应用。
结合第一方面,在第一种可能的实现方式中,在所述向所述虚拟机设备发送重启应用请求以指示所述虚拟机重启所述应用之后,所述方法还包括:
所述云计算管理设备接收所述虚拟机发送的重启应用响应,其中,所述重启应用响应用于指示所述虚拟机重启所述应用是否成功;
若所述云计算管理设备根据所述重启应用响应判断所述虚拟机重启所述应用失败,则向所述虚拟机发送重启操作系统请求以指示所述虚拟机重启所述应用所在的操作系统。
结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,在所述向所述虚拟机发送重启操作系统请求以指示所述虚拟机重启所述应用所在的操作系统之后,所述方法还包括:
所述云计算管理设备接收所述虚拟机发送的重启操作系统响应,其中,所述重启操作系统响应用于指示所述虚拟机重启所述应用所在的操作系统是否成功;
若所述云计算管理设备根据所述重启操作系统响应判断所述虚拟机重启所述应用所在的操作系统失败,则向所述虚拟机的云计算基础设施发送虚拟机迁移命令以请求迁移所述虚拟机,所述虚拟机迁移命令中包含所述虚拟机的标识。
结合第一方面,在第三种可能的实现方式中,在所述向所述虚拟机设备发送重启应用请求以指示所述虚拟机重启所述应用之后,所述方法还包括:
所述云计算管理设备接收所述虚拟机发送的重启应用响应,其中,所述重启应用响应用于指示所述虚拟机重启所述应用是否成功;
若所述云计算管理设备根据所述重启应用响应判断所述虚拟机重启所述应用失败,则向所述虚拟机所在的云计算基础设施发送虚拟机迁移命令以请求迁移所述虚拟机,所述虚拟机迁移命令中包含所述虚拟机的标识。
结合第一方面的第二种或第三种可能的实现方式,在第四种可能的实现方式中,其特征在于,在所述云计算管理设备向所述虚拟机所在的云计算基础设施发送虚拟机迁移命令以请求迁移所述虚拟机的步骤之后,所述方法还包括:
所述云计算管理设备接收所述云计算基础设施发送的虚拟机迁移指示,其中,所述虚拟机迁移指示用于指示所述虚拟机是否迁移成功;
若所述云计算管理设备根据所述虚拟机迁移指示判断所述虚拟机迁移失败,则向所述虚拟机所在的云计算基础设施发送虚拟机重建命令以请求重建所述虚拟机,所述虚拟机重建命令中包含所述虚拟机的标识和所述应用的标识;
若所述云计算管理设备根据所述虚拟机迁移指示判断所述虚拟机迁移成功,接收所述虚拟机发送的第一应用恢复指示,所述第一应用恢复指示用于指示所述应用已成功恢复。
结合第一方面的第四种可能的实现方式,在第五种可能的实现方式中,在所述云计算管理设备向所述虚拟机所在的云计算基础设施发送虚拟机重建命令以请求重建所述虚拟机的步骤之后,所述方法还包括:
所述云计算管理设备接收所述云计算基础设施发送的虚拟机重建指示,其中,所述虚拟机重建指示用于指示所述虚拟机是否重建成功;
若所述云计算管理设备根据所述虚拟机重建指示判断所述虚拟机重建失败,则输出故障信息以进行人工故障处理;
若所述云计算管理设备根据所述虚拟机重建指示判断所述虚拟机重建成功,根据所述虚拟机重建指示中的应用标识和重建后的所述虚拟机的标识更新所述应用对应的虚拟机标识,并接收所述虚拟机发送的第二应用恢复指示,所述第二应用恢复指示用于指示所述应用已成功恢复。
本发明第二方面提供了一种基于云计算服务的虚拟机监控方法,包括:
虚拟机接收云计算管理设备发送的HACS部署请求,并安装所述HACS部署请求中指定的应用的HACS功能;
所述虚拟机的所述应用的HACS监控所述应用的运行是否异常;
若所述应用的HACS判断所述应用运行异常,则所述虚拟机向所述云计算管理设备发送应用异常指示。
结合第二方面,在第一种可能的实现方式中,在所述虚拟机向所述云计算管理设备发送应用异常指示之后,所述方法还包括:
所述虚拟机接收所述云计算管理设备发送的重启应用请求,所述重启应用请求用于指示重启所述应用;
所述虚拟机的所述应用的HACS重启所述应用;
所述虚拟机向所述云计算管理设备发送重启应用响应以指示重启所述应用是否成功。
结合第二方面的第一种可能的实现方式,在第二种可能的实现方式中,在所述虚拟机的所述应用的HACS重启所述应用之后,所述方法还包括:
若所述应用的重启失败,所述虚拟机的所述应用的HACS再次重启所述应用;
所述虚拟机向所述云计算管理设备发送重启应用响应以指示重启所述应用是否成功,包括:
当所述应用重启成功时,所述虚拟机向所述云计算管理设备发送所述重启应用响应以指示重启所述应用成功;或者,
当所述应用重启失败的次数达到N次时,所述虚拟机向所述云计算管理设备发送重启应用响应以指示重启所述应用失败,其中,所述N为大于1的整数。
结合第二方面的第一种或第二种可能的实现方式,在第三种可能的实现方式中,在所述向所述云计算管理设备发送重启应用响应以指示重启所述应用是否成功的步骤之后,所述方法还包括:
若所述应用重启失败,所述虚拟机接收所述云计算管理设备发送的重启操作系统请求,所述重启操作系统请求用于指示重启所述应用所在的操作系统;
所述虚拟机的所述应用的HACS重启所述应用所在的操作系统;
所述虚拟机向所述云计算管理设备发送重启操作系统响应以指示重启所述应用所在的操作系统是否成功。
结合第二方面的第三种可能的实现方式,在第四种可能的实现方式中,在所述虚拟机的所述应用的HACS重启所述应用所在的操作系统之后,所述方法还包括:
若所述应用所在的操作系统重启失败,所述虚拟机的所述应用的HACS再次重启所述应用所在的操作系统;
所述虚拟机向所述云计算管理设备发送重启操作系统响应以指示重启所述应用所在的操作系统是否成功,包括:
若所述应用所在的操作系统重启成功,所述虚拟机向所述云计算管理设备发送重启操作系统响应以指示重启所述应用所在的操作系统成功;或者,
当所述应用所在的操作系统重启失败的次数达到M次时,所述虚拟机向所述云计算管理设备发送重启操作系统响应以指示重启所述应用所在的操作系统失败,其中,所述M为大于1的整数。
结合第二方面的第三种或第四种可能的实现方式,在第五种可能的实现方式中,在所述虚拟机向所述云计算管理设备发送重启操作系统响应以指示重启所述应用所在的操作系统是否成功之后,所述方法还包括:
若所述应用所在的操作系统重启失败,当所述虚拟机成功迁移之后,所述虚拟机向所述云计算管理设备发送第一应用恢复指示以指示所述应用已成功恢复,或者,当所述虚拟机成功重建之后,所述虚拟机向所述云计算管理设备发送第二应用恢复指示以指示所述应用已成功恢复。
本发明实施例第三方面提供了一种云计算管理设备,包括:
发送单元,用于向虚拟机发送HACS部署请求以指示所述虚拟机为其上运行的应用安装HACS功能,所述HACS功能用于监控所述应用的运行是否异常;
接收单元,用于接收所述虚拟机发送的应用异常指示,其中,所述应用异常指示用于指示所述应用运行异常;
处理单元,用于根据所述应用运行异常指示判断是否需要重启所述应用;
所述发送单元还用于,若所述处理单元判断需要重启所述应用,向所述虚拟机发送重启应用请求以指示所述虚拟机重启所述应用。
结合第三方面,在第一种可能的实现方式中,所述接收单元还用于:
接收所述虚拟机发送的重启应用响应,其中,所述重启应用响应用于指示所述虚拟机重启所述应用是否成功;
所述处理单元还用于,根据所述重启应用响应判断所述虚拟机重启所述应用是否成功;
所述发送单元还用于,若所述处理单元判断所述虚拟机重启所述应用失败,向所述虚拟机发送重启操作系统请求以指示所述虚拟机重启所述应用所在的操作系统。
结合第三方面的第一种可能的实现方式,在第二种可能的实现方式中,所述接收单元还用于:
接收所述虚拟机发送的重启操作系统响应,其中,所述重启操作系统响应用于指示所述虚拟机重启所述应用所在的操作系统是否成功;
所述处理单元还用于,根据所述重启操作系统响应判断所述虚拟机重启所述应用所在的操作系统是否成功;
所述发送单元还用于,若所述处理单元判断所述虚拟机重启所述应用所在的操作系统失败,向所述虚拟机的云计算基础设施发送虚拟机迁移命令以请求迁移所述虚拟机,所述虚拟机迁移命令中包含所述虚拟机的标识。
结合第三方面,在第三种可能的实现方式中,所述接收单元还用于:
接收所述虚拟机发送的重启应用响应,其中,所述重启应用响应用于指示所述虚拟机重启所述应用是否成功;
所述处理单元还用于,根据所述重启应用响应判断所述虚拟机重启所述应用是否成功;
所述发送单元还用于,若所述处理单元判断所述虚拟机重启所述应用失败,向所述虚拟机所在的云计算基础设施发送虚拟机迁移命令以请求迁移所述虚拟机,所述虚拟机迁移命令中包含所述虚拟机的标识。
结合第三方面的第一种或第二种可能的实现方式,在第四种可能的实现方式中,所述接收单元还用于:
接收所述云计算基础设施发送的虚拟机迁移指示,其中,所述虚拟机迁移指示用于指示所述虚拟机是否迁移成功;
所述处理单元还用于,根据所述虚拟机迁移指示判断所述虚拟机迁移是否成功;
所述发送单元还用于,若所述处理单元判断所述虚拟机迁移失败,向所述虚拟机所在的云计算基础设施发送虚拟机重建命令以请求重建所述虚拟机,所述虚拟机重建命令中包含所述虚拟机的标识和所述应用的标识;
所述接收单元还用于,若所述处理单元判断所述虚拟机迁移成功,接收所述虚拟机发送的第一应用恢复指示,所述第一应用恢复指示用于指示所述应用已成功恢复。
结合第三方面的第四种可能的实现方式,在第五种可能的实现方式中,所述接收单元还用于:
接收所述云计算基础设施发送的虚拟机重建指示,其中,所述虚拟机重建指示用于指示所述虚拟机是否重建成功;
所述处理单元还用于,根据所述虚拟机重建指示判断所述虚拟机重建是否成功,若判断所述虚拟机重建失败,则输出故障信息以进行人工故障处理;若判断所述虚拟机重建成功,根据所述虚拟机重建指示中的应用标识和重建后的所述虚拟机的标识更新所述应用对应的虚拟机标识;
所述接收单元还用于,若所述处理单元判断所述虚拟机重建成功,接收所述虚拟机发送的第二应用恢复指示,所述第二应用恢复指示用于指示所述应用已成功恢复。
本发明实施例第四方面提供了一种虚拟机,包括:
接收单元,用于接收云计算管理设备发送的HACS部署请求,并安装所述HACS部署请求中指定的应用的HACS功能;
处理单元,用于监控所述应用的运行是否异常;
发送单元,用于若监控单元判断所述应用运行异常,向所述云计算管理设备发送应用异常指示。
结合第四方面,在第一种可能的实现方式中,所述接收单元还用于:
接收所述云计算管理设备发送的重启应用请求,所述重启应用请求用于指示重启所述应用;
所述处理单元还用于,重启所述应用;
所述发送单元还用于,向所述云计算管理设备发送重启应用响应以指示重启所述应用是否成功。
结合第四方面的第一种可能的实现方式,在第二种可能的实现方式中,所述处理单元还用于:
若重启所述应用失败,则再次重启所述应用;
所述发送单元具体用于:
当所述处理单元重启应用成功时,向所述云计算管理设备发送所述重启应用响应以指示重启所述应用成功;或者,
当所述处理单元重启应用失败的次数达到N次时,向所述云计算管理设备发送重启应用响应以指示重启所述应用失败,其中,所述N为大于1的整数。
结合第四方面的第一种或第二种可能的实现方式,在第三种可能的实现方式中,所述接收单元还用于:
若所述处理单元重启所述应用失败,接收所述云计算管理设备发送的重启操作系统请求,所述重启操作系统请求用于指示重启所述应用所在的操作系统;
所述处理单元还用于,重启所述应用所在的操作系统;
所述发送单元还用于,向所述云计算管理设备发送重启操作系统响应以指示重启所述应用所在的操作系统是否成功。
结合第四方面的第三种可能的实现方式,在第四种可能的实现方式中,所述处理单元还用于:
若重启所述应用所在的操作系统失败,则再次重启所述应用所在的操作系统;
所述发送单元具体用于:
若所述处理单元重启所述应用所在的操作系统成功,向所述云计算管理设备发送重启操作系统响应以指示重启所述应用所在的操作系统成功;或者,
当所述处理单元重启所述应用所在的操作系统失败的次数达到M次时,向所述云计算管理设备发送重启操作系统响应以指示重启所述应用所在的操作系统失败,其中,所述M为大于1的整数。
结合第四方面的第三种或第四种可能的实现方式,在第五种可能的实现方式中,所述发送单元还用于:
若所述处理单元重启所述应用所在的操作系统失败,当所述虚拟机成功迁移之后,向所述云计算管理设备发送第一应用恢复指示以指示所述应用已成功恢复,或者,当所述虚拟机成功重建之后,向所述云计算管理设备发送第二应用恢复指示以指示所述应用已成功恢复。
本发明实施例第五方面提供了一种云计算管理设备,包括:处理器、存储器和收发器;
所述存储器用于存储指令,所述处理器用于执行所述存储器存储的指令,以控制收发器进行信号的接收和发送,当处理器执行所述存储器存储的指令时,所述云计算管理设备用于完成本发明实施例提供的第一方面至第一方面的第五种可能的实现方式中的任意一种所述的方法。
本发明实施例第六方面提供了一种虚拟机,包括:处理器、存储器和收发器;
所述存储器用于存储指令,所述处理器用于执行所述存储器存储的指令,以控制收发器进行信号的接收和发送,当处理器执行所述存储器存储的指令时,所述虚拟机用于完成本发明实施例提供的第二方面至第二方面的第五种可能的实现方式中的任意一种所述的方法。
在本发明实施例的技术方案中,云计算管理设备向虚拟机发送HACS部署请求以指示虚拟机为应用安装HACS功能;虚拟机为应用安装HACS功能,HACS监控应用的运行状况并向云计算管理设备发送应用异常指示,当云计算管理设备收到应用异常指示后判断需要重启应用时向虚拟机发送重启应用请求以使虚拟机重启应用。可见,本发明实施例提出的技术方案可使云计算管理设备向虚拟机提供应用监控服务,当需要重启应用时云计算管理设备向虚拟机发送重启应用请求以使虚拟机重启应用。本发明实施例公开的技术可以有效保证通过虚拟机向用户提供正常的增值应用,在虚拟机中部署HACS功能监控虚拟机的方式实现起来较为简单,而且使用成本较低。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的云计算管理系统的结构示意图;
图2是本发明的第一实施例提供的基于云计算服务的虚拟机监控方法的流程示意图;
图3是本发明实施例提供的云计算平台和虚拟机的结构示意图;
图4是本发明实施例提供的基于云计算服务的虚拟机监控方法的第一交互示意图;
图5是本发明的第二实施例提供的基于云计算服务的虚拟机监控方法的流程示意图;
图6是本发明实施例提供的基于云计算服务的虚拟机监控方法的第二交互示意图;
图7是本发明实施例提供的基于云计算服务的虚拟机监控方法的第三交互示意图;
图8是本发明实施例提供的基于云计算服务的虚拟机监控方法的第四交互示意图;
图9是本发明实施例提供的基于云计算服务的虚拟机监控方法的第五交互示意图;
图10是本发明的第三实施例提供的基于云计算服务的虚拟机监控方法的流程示意图;
图11是本发明的第四实施例提供的一种云计算管理设备的结构示意图;
图12是本发明的第五实施例提供的一种虚拟机的结构示意图;
图13是本发明的第六实施例提供的另一种云计算管理设备的结构示意图;
图14是本发明的第七实施例提供的另一种虚拟机的结构示意图。
具体实施方式
云计算的服务模式可分为软件即服务(SaaS,Software as a Service)、平台即服务(PaaS,Platform as a Service)和基础设施即服务(IaaS,Infrastructure as aService)三类。其中,PaaS和IaaS源于SaaS理念,PaaS和IaaS可以直接通过面向服务的体系结构(SOA,Service-Oriented Architecture)或网页服务向平台用户提供服务,也可以作为SaaS模式的支撑平台间接向最终用户服务。
SaaS提供给客户的服务是运营商运行在云计算基础设施上的应用程序,用户可以在各种设备上通过客户端界面访问,比如浏览器。客户不需要管理或控制任何云计算基础设施,包括网络、服务器、操作系统、存储等等。PaaS提供给客户的服务是把客户提供的开发语言和工具(例如Java,python,.Net等)开发的或收购的应用程序部署到供应商的云计算基础设施。客户不需要管理或控制底层的云基础设施,包括网络、服务器、操作系统、存储等,但客户能控制部署的应用程序,也可能控制运行应用程序的托管环境。IaaS提供给消费者的服务是对所有计算基础设施的利用,包括处理器、内存、硬盘、网络和其它基本的计算资源,用户能够部署和运行任意软件,包括操作系统和应用程序。消费者不管理或控制任何云计算基础设施,但能选择操作系统、选择存储空间和部署应用,也有可能获得对有限的网络组件(例如路由器、防火墙和负载均衡器等)的控制。
IaaS主要是将虚拟化技术与云服务相结合,直接提升IT系统的运作能力,IaaS服务提供商会以月费形式提供软硬件及服务,例如服务器、存储系统、网络硬件和虚拟化软件等。IaaS让企业可以自由选择使用哪些软、硬件及服务,中小企业都可根据行业的需要、发展规模,建设最适合自己的IT基建系统。这种服务模式能为中小企业带来多重优势,第一,不必配备花费庞大的IT基建设备,却可享受同样专业的服务;第二,可根据业务发展的规模和需求调配所需的服务;第三,当有新技术出现时,可随时向服务提供商提出升级要求;第四,因为IaaS服务提供商一般会向客户免费提供技术支持,因此可避免系统管理方面的支出。
在云计算应用中,可由云计算管理设备提供对虚拟机和虚拟机所在的云计算基础设施(即IaaS设备)的统一管理。图1为云计算管理系统的结构示意图,如图1所示,虚拟机运行在云计算基础设施上,可与云计算管理设备相交互。其中,云计算管理设备中的云计算基础环境(例如Vmware vCloud、OpenStack或AWS)负责对虚拟机所在的云计算基础设施(即IaaS设备)进行管理,云计算管理设备的云计算管理平台提供云计算基础环境的统一管理,可提供对虚拟机运行的监控管理。云计算管理平台可以通过监控虚拟机的运行情况确定是否需要迁移或重建虚拟机,若需要迁移或重建虚拟机则请求虚拟机所在的云计算基础设施(即IaaS设备)执行虚拟机的迁移或重建。
本领域的研究人员发现,现有的物理双机虚拟机监控技术的部署成本较高,而且现有的云计算管理平台监控技术并不能监控虚拟机的特定应用的运行情况因而难以保证通过虚拟机向用户提供正常的增值应用服务。
本发明实施例提供了一种基于云计算服务的虚拟机监控方法方法、装置及系统,其方法实施于云计算管理设备和虚拟机中,可有效保证通过虚拟机向用户提供正常的增值应用服务,这种在虚拟机中部署软件监控虚拟机的方式实现起来较为简单,而且使用成本较低。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
以下分别对每个实施例进行说明。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先参见图1,图2为本发明第一实施例提供的一种基于云计算服务的虚拟机监控方法的流程示意图。其中,如图2所示,本发明第一实施例提供的一种基于云计算服务的虚拟机监控方法,用于云计算管理设备中,可包括以下步骤:
S101、云计算管理设备向虚拟机发送高可用集群服务(HACS,High AvailabilityCluster Server)部署请求以指示虚拟机为其上运行的应用安装HACS功能,HACS功能用于监控应用的运行是否异常。
在本发明实施例提出的技术方案中,云计算管理设备的云计算基础环境提供对云计算基础设施(即IaaS设备)进行管理,云计算管理设备的云计算管理平台提供云计算环境的统一管理,可提供对虚拟机运行的监控管理。其中,云计算管理平台包括应用高可用服务(Application HA Service)模块、HACS模块和虚拟机重建模块(VM Rebuild)模块。其中,Application HA Service和VM Rebuild模块部署在云计算管理设备中,Application HAServic模块可提供云化虚拟机应用监控服务,虚拟机可通过向Application HA Service模块订阅相关服务实现云计算管理设备对虚拟机应用的监控、故障判断、故障恢复和策略配置等。Application HA Service模块可通知VM Rebuild进行虚拟机迁移或重建,由VMRebuild调用云计算环境提供的接口实现应用所在的虚拟机的迁移和重建。HACS为部署在虚拟机中的应用监控代理,可对应用进行实时监控,HACS可通过调用通用的脚本实现对应用的启动、停止和重启以及对操作系统的重启。图3为本发明实施例提供的云计算管理设备中的云计算管理平台的结构和虚拟机的结构示意图,如图3所示,应用可运行在虚拟机上,虚拟机可为其上运行的每个应用部署HACS功能,HACS通过调用脚本实现对相关应用的监控并与云计算管理平台中的Application HA Service进行交互。
为了使云计算管理设备监控虚拟机中应用的运行情况,云计算管理设备可以先为虚拟机中的应用部署HACS功能,并向虚拟机发送HACS部署请求以指示虚拟机为其上运行的应用安装HACS功能,HACS功能可用于监控应用的运行是否异常。图4为本发明实施例提供的基于云计算服务的虚拟机监控方法的第一交互示意图,如图4所示,在具体实现中,可由虚拟机向云计算管理设备发送监控服务订阅请求以请求云计算管理平台的Application HAService模块提供虚拟机应用监控服务。具体来说,虚拟机中的应用可调用云计算管理平台的服务订阅接口请求订阅对该应用的监控,虚拟机发送的监控服务订阅请求中包含应用标识和虚拟机标识。当云计算管理设备收到监控服务订阅请求后,Application HA Service模块记录应用对应的虚拟机标识,为虚拟机中的应用部署HACS功能,并向虚拟机发送HACS部署请求指示虚拟机为其上运行的应用安装HACS功能。虚拟机为指定的应用安装HACS功能后,HACS可通过通用脚本实时监控应用的运行状况以检测该应用的运行是否异常。若应用的HACS检测到该应用运行异常,则虚拟机向云计算管理设备发送应用异常指示。
S102、云计算管理设备接收虚拟机发送的应用异常指示,其中,应用异常指示用于指示应用运行异常。
当云计算管理设备向虚拟机发送HACS部署请求指示虚拟机为其上运行的应用安装HACS功能后,可收到虚拟机发送的应用异常指示。
S103、云计算管理设备根据应用的运行异常指示判断是否需要重启应用,若需要重启应用,则向虚拟机发送重启应用请求以指示虚拟机重启该应用。
当云计算管理设备收到虚拟机发送的应用异常指示后,云计算管理平台的Application HA Service模块可根据应用异常指示中的信息判断是否需要重启应用,示例的,当Application HA Service模块判断应用的异常情况无法恢复时可对该应用进行重启。若Application HA Service模块判断需要重启应用,则向虚拟机发送重启应用请求以指示虚拟机重启应用。虚拟机收到重启应用请求之后,该应用的HACS通过调用通用脚本(Service Script)实现该应用重启,该应用通过通用脚本向HACS返回重启结果,虚拟机根据该应用的重启结果向云计算管理设备发送重启应用响应以指示该应用是否重启成功。
在一些可行的实施方式中,当云计算管理设备收到虚拟机发送的重启应用响应后,若Application HA Service模块根据重启应用响应判断虚拟机重启应用失败,则向虚拟机发送重启操作系统请求以指示虚拟机重启该应用的操作系统。在一些情况下,云计算管理设备也可向虚拟机的云计算基础设施(即IaaS设备)发送虚拟机迁移命令以请求迁移该虚拟机,虚拟机迁移命令中包含虚拟机的标识。
在一些可行的实施方式中,云计算管理设备向虚拟机发送重启操作系统请求以指示虚拟机重启该应用所在的操作系统后,可收到虚拟机发送的重启操作系统响应,重启操作系统响应用于指示虚拟机重启该应用所在的操作系统是否成功。若云计算管理设备的Application HA Service模块根据重启操作系统响应判断虚拟机重启应用的操作系统失败,则向虚拟机的云计算基础设施(即IaaS设备)发送虚拟机迁移命令以请求迁移该虚拟机,虚拟机迁移命令中包含虚拟机的标识。
在一些可行的实施方式中,当云计算管理设备向虚拟机的云计算基础设施(即IaaS设备)发送虚拟机迁移命令以请求迁移该虚拟机之后,可收到上述IaaS设备发送的虚拟机迁移指示,虚拟机迁移指示用于指示所述虚拟机是否迁移成功。若云计算管理设备的Application HA Service模块根据虚拟机迁移指示判断虚拟机迁移失败,向虚拟机的云计算基础设施(IaaS设备)发送虚拟机重建命令以请求重建虚拟机,虚拟机重建命令中包含虚拟机的标识和应用标识;若Application HA Service模块判断虚拟机迁移成功,则云计算管理设备将接收到迁移后的虚拟机发送的第一应用恢复指示,该第一应用恢复指示用于指示上述应用已成功恢复。
在一些可行的实施方式中,当云计算管理设备向虚拟机的云计算基础设施(即IaaS设备)发送虚拟机重建命令以请求重建虚拟机后,可收到上述IaaS设备发送的虚拟机重建指示,虚拟机重建指示用于指示虚拟机是否重建成功。若云计算管理设备的Application HA Service模块根据所述虚拟机重建指示判断所述虚拟机重建失败,则输出故障信息以进行人工故障处理。若Application HA Service模块判断虚拟机重建成功,可根据虚拟机重建指示中的应用标识和重建后虚拟机的标识更新该应用对应的虚拟机的标识,并且云计算管理设备可接收到重建后的虚拟机发送的第二应用恢复指示,第二应用恢复指示用于指示上述应用已成功恢复。
可见,本发明实施例提出的技术方案可使云计算管理设备向虚拟机提供应用监控服务,当需要重启应用时云计算管理设备向虚拟机发送重启应用请求以使虚拟机重启应用。本发明实施例公开的技术可以有效保证通过虚拟机向用户提供正常的增值应用服务,在虚拟机中部署HACS功能监控虚拟机的应用的方式实现起来较为简单,而且使用成本较低。
本发明第二实施例提供了一种物联网数据的传输方法,参见图5,图5为本发明第二实施例提供的一种基于云计算服务的虚拟机监控方法的流程示意图。如图5所示,本发明第二实施例提供的方法,用于云计算管理设备中,可包括以下步骤:
S201、云计算管理设备接收虚拟机发送的重启应用响应,其中,重启应用响应用于指示虚拟机重启应用是否成功。
在本发明实施例公开的技术方案中,当虚拟机接收到云计算管理设备发送的重启应用请求后,虚拟机上运行的应用的HACS可重启该应用,虚拟机可以根据重启结果向云计算管理设备发送重启应用响应以指示该应用是否重启成功,云计算管理设备将会接收虚拟机发送的重启应用响应。
S202、若云计算管理设备根据重启应用响应判断虚拟机重启应用失败,则向虚拟机发送重启操作系统请求以指示虚拟机重启应用所在的操作系统。
图6为本发明实施例提供的基于云计算服务的虚拟机监控方法的第二交互示意图,如图6所示,当云计算管理设备收到虚拟机发送的重启应用响应后,云计算管理平台的Application HA Service模块可根据重启应用响应判断虚拟机重启应用是否成功。若Application HA Service模块判断重启应用成功,Application HA Service模块可以继续通过虚拟机的HACS监控应用,若判断重启该应用失败,则云计算管理设备向虚拟机发送重启操作系统请求以指示虚拟机重启该应用的操作系统。虚拟机收到重启操作系统请求之后,上述应用的HACS通过调用通用脚本重启应用所在的操作系统,上述应用可通过通用脚本向HACS返回操作系统重启结果,虚拟机根据该应用所在的操作系统重启结果向云计算管理设备发送重启操作系统响应以指示该应用的操作系统是否重启成功。
S203、云计算管理设备接收虚拟机发送的重启操作系统响应,其中,重启操作系统响应用于指示虚拟机重启应用所在的操作系统是否成功。
图7为本发明实施例提供的基于云计算服务的虚拟机监控方法的第三交互示意图,如图7所示,当云计算管理设备收到虚拟机发送的重启操作系统响应之后,云计算管理平台的Application HA Service模块可根据重启操作系统响应判断虚拟机重启应用所在的操作系统是否成功。
S204、若云计算管理设备根据重启操作系统响应判断虚拟机重启应用的操作系统失败,则向虚拟机所在的云计算基础设施发送虚拟机迁移命令以请求迁移虚拟机,虚拟机迁移命令中包含虚拟机的标识。
若云计算管理平台的Application HA Service模块判断重启应用所在的操作系统成功,则Application HA Service模块可以继续通过虚拟机的HACS监控应用。若Application HA Service模块判断重启应用的操作系统失败,则云计算管理设备向虚拟机所在的云计算基础设施(即IaaS设备)发送虚拟机迁移命令以请求迁移虚拟机,虚拟机迁移命令中包含虚拟机的标识。在具体实现中,如图7所示,云计算管理平台的Application HAService模块可向VM Rebuild模块发送虚拟机迁移请求,其中携带虚拟机标识,VM Rebuild模块通过调用虚拟机所在的云计算基础设施(IaaS设备)的云计算基础环境提供的接口向虚拟机所在的云计算基础设施(IaaS设备)发送虚拟机迁移命令以请求迁移虚拟机。云计算基础设施(即IaaS设备)收到虚拟机迁移命令后,对虚拟机迁移命令中指定的虚拟机进行迁移,迁移后的虚拟机保持标识不改变。虚拟机所在的IaaS设备可将虚拟机迁移结果通过虚拟机迁移指示发送给云计算管理设备。
S205、云计算管理设备接收云计算基础设施发送的虚拟机迁移指示,其中,虚拟机迁移指示用于指示虚拟机是否迁移成功。
S206、云计算管理设备根据虚拟机迁移指示判断虚拟机是否成功迁移。
图8为本发明实施例提供的基于云计算服务的虚拟机监控方法的第四交互示意图,如图8所示,当云计算管理设备收到IaaS设备发送的虚拟机迁移指示之后,云计算管理平台的VM Rebuild模块将虚拟机迁移指示转发给Application HA Service模块,Application HA Service模块可根据虚拟机迁移指示判断虚拟机迁移是否成功。
S207、若虚拟机迁移失败,则云计算管理设备向虚拟机所在的云计算基础设施发送虚拟机重建命令以请求重建虚拟机,虚拟机重建命令中包含虚拟机的标识和应用的标识。
若云计算管理平台的Application HA Service模块根据虚拟机迁移指示判断虚拟机迁移失败,则云计算管理设备向虚拟机所在的云计算基础设施(即IaaS设备)发送虚拟机重建命令以请求重建所述虚拟机,虚拟机重建命令中包含虚拟机的标识和应用的标识。在具体实现中,如图8所示,云计算管理平台的Application HA Service模块可向VMRebuild模块发送虚拟机重建请求,其中携带上述应用的标识和虚拟机标识,VM Rebuild模块通过调用虚拟机的云计算基础设施(即IaaS设备)的云计算基础环境提供的接口向云计算基础设施(即IaaS设备)发送虚拟机重建命令(携带上述应用标识和虚拟机标识,)以请求重建虚拟机。IaaS设备收到虚拟机重建命令后,根据其中的应用标识查询应用对应的软件镜像,通过镜像文件重建虚拟机重建命令指定的虚拟机,重建后虚拟机的标识可与虚拟机重建命令中的虚拟机标识不同。云计算基础设施可将虚拟机重建结果通过虚拟机重建指示发送给云计算管理设备,若虚拟机重建成功,虚拟机重建指示中可携带应用标识和重建立的虚拟机标识。
S208、若虚拟机迁移成功,云计算管理设备接收虚拟机发送的第一应用恢复指示,第一应用恢复指示用于指示应用已成功恢复。
若云计算管理平台的Application HA Service模块根据虚拟机迁移指示判断虚拟机迁移成功,云计算管理设备可接收到迁移后的虚拟机发送的第一应用恢复指示,因为在虚拟机迁移成功的情况下,迁移后的虚拟机可向云计算管理设备发送第一应用恢复指示以指示上述应用已成功恢复。Application HA Service模块可继续通过虚拟机的HCAS监控该应用的运行情况。
S209、云计算管理设备接收云计算基础设施发送的虚拟机重建指示,其中,虚拟机重建指示用于指示虚拟机是否重建成功。
云计算管理设备向虚拟机的云计算基础设施(即IaaS设备)发送虚拟机重建命令后,云计算管理设备可接收到云计算基础设施发送的虚拟机重建指示。
S210、云计算管理设备根据虚拟机重建指示判断虚拟机是否成功重建。
图9为本发明实施例提供的基于云计算服务的虚拟机监控方法的第五交互示意图,如图9所示,当云计算管理设备收到云计算基础设施发送的虚拟机重建指示之后,云计算管理平台的VM Rebuild模块将虚拟机重建指示转发给Application HA Service模块,Application HA Service模块可根据虚拟机重建指示判断虚拟机重建是否成功。
S211、若虚拟机重建失败,则云计算管理设备输出故障信息以进行人工故障处理。
若云计算管理平台的Application HA Service模块根据虚拟机重建指示判断虚拟机重建失败,则云计算管理设备输出故障信息以进行人工故障处理。
S212、若虚拟机重建成功,云计算管理设备根据虚拟机重建指示中的应用标识和重建后的虚拟机标识更新应用对应的虚拟机标识,并接收虚拟机发送的第二应用恢复指示,第二应用恢复指示用于指示应用已成功恢复。
若云计算管理平台的Application HA Service模块根据虚拟机重建指示判断虚拟机重建成功,Application HA Service模块根据虚拟机重建指示中的应用标识和重建后的虚拟机标识更新应用对应的虚拟机标识。云计算管理设备还可收到重建后的虚拟机发送的第二应用恢复指示,因为在虚拟机重建成功的情况下,重建后的虚拟机可向云计算管理设备发送第二应用恢复指示以指示上述应用已成功恢复。Application HA Service模块可继续通过虚拟机的应用的HCAS监控该应用的运行情况。
可见,本发明实施例提出的技术方案可使云计算管理设备向虚拟机提供应用监控服务,当需要重启应用时云计算管理设备向虚拟机发送重启应用请求以使虚拟机重启应用;当虚拟机重启应用失败时,云计算管理设备可向虚拟机发送重启操作系统请求以使虚拟机重启应用的操作系统;若虚拟机重启操作系统失败,云计算管理设备还可以迁移虚拟机或重建虚拟机以恢复应用。本发明实施例公开的技术可以有效保证通过虚拟机向用户提供正常的增值应用服务,在虚拟机中部署HACS功能监控虚拟机的方式实现起来较为简单,而且使用成本较低。
本发明第三实施例提供了一种基于云计算服务的虚拟机监控方法,参见图10,图10为本发明第三实施例提供的一种基于云计算服务的虚拟机监控方法的流程示意图。如图10所示,本发明第三实施例提供的方法,用于虚拟机中,可包括以下步骤:
S301、虚拟机接收云计算管理设备发送的HACS部署请求,并安装HACS部署请求中指定的应用的HACS功能。
在本发明实施例提出的技术方案中,云计算管理设备的云计算基础环境提供对云计算基础设施(即IaaS设备)进行管理,云计算管理设备的云计算管理平台提供云计算环境的统一管理,可提供对虚拟机运行的监控管理。其中,云计算管理平台包括Application HAService模块、HACS模块和VM Rebuild模块。Application HA Service和VM Rebuild模块部署在云计算管理设备中,负责对虚拟机应用进行监控、故障判断、故障恢复和策略配置等。HACS为部署在虚拟机中的应用监控代理,可对应用进行实时监控,HACS可通过调用通用的脚本实现对应用的启动、停止和重启以及对操作系统的重启。如图3所示,应用可运行在虚拟机上,虚拟机为每个应用部署的HACS功能通过调用脚本实现对相关应用的监控并与云计算管理平台中的Application HA Service进行交互。
为了使云计算管理设备监控虚拟机中应用的运行情况,云计算管理设备可以先为虚拟机中运行的应用部署HACS功能,并向虚拟机发送HACS部署请求以指示虚拟机为其上运行的应用安装HACS功能,虚拟机接收云计算管理设备发送的HACS部署请求并安装HACS部署请求中指定的应用的HACS功能。如图4所示,在具体实现中,可由虚拟机向云计算管理设备发送监控服务订阅请求以请求云计算管理平台提供虚拟机应用监控服务。具体来说,虚拟机中的应用可调用云计算管理平台的服务订阅接口请求订阅对该应用的监控,虚拟机发送的监控服务订阅请求中包含应用标识和虚拟机标识。当云计算管理设备收到监控服务订阅请求后,记录该应用对应的虚拟机标识,为虚拟机中运行的应用部署HACS功能,并向虚拟机发送HACS部署请求指示虚拟机安装HACS功能。虚拟机可接收云计算管理设备发送的HACS部署请求,为HACS部署请求中指定的应用安装HACS功能。
S302、虚拟机的应用的HACS监控应用运行是否异常。
虚拟机的应用安装HACS功能后,HACS可通过通用脚本实时监控应用的运行状况以检测应用的运行是否异常。举例来说,HACS可以调用通用脚本以指定周期向上述应用发送测试消息,若超过一定时间未收到应用的有效应答,则通用脚本向HACS返回监控信息,监控信息可包括测试消息发送周期和异常错误代码等。
S303、若应用的HACS判断应用运行异常,则虚拟机向云计算管理设备发送应用异常指示。
当应用的HACS收到通用脚本的监控信息后,通过分析监控信息判断应用是否发生运行异常,若应用的HACS判断应用运行异常,则虚拟机向云计算管理设备发送应用异常指示。
在一些可行的实施方式中,当云计算管理设备收到虚拟机发送的应用异常指示后,可根据应用异常指示中的信息判断是否需要重启应用,若判断需要重启应用,则向虚拟机发送重启应用请求以指示虚拟机重启应用。虚拟机收到重启应用请求之后,上述应用的HACS通过调用通用脚本进行应用重启,应用可通过通用脚本向HACS返回重启结果,虚拟机根据该应用的重启结果向云计算管理设备发送重启应用响应以指示该应用是否重启成功。
在具体实现中,当应用重启失败时应用的HACS可尝试多次重启该应用。具体来说,若应用重启成功,虚拟机向云计算管理设备发送重启应用响应指示重启应用成功;若应用重启失败,应用的HACS可调用通用脚本再次重启该应用,当应用的重启失败次数达到N次时,虚拟机才向云计算管理设备发送重启应用响应指示重启应用失败。
在一些可行的实施方式中,若虚拟机重启应用失败,可收到云计算管理设备发送的重启操作系统请求指示虚拟机重启应用所在的操作系统。虚拟机收到云计算管理设备发送的重启操作系统请求后,HACS通过调用应用的通用脚本重启应用所在的操作系统,应用通过通用脚本向HACS返回操作系统重启结果,虚拟机根据操作系统的重启结果向云计算管理设备发送重启操作系统响应以指示该应用所在的操作系统是否成功重启。在一些情况下,云计算管理设备也可不向虚拟机发送重启操作系统请求,而是向虚拟机所在的云计算基础设施(即IaaS设备)发送虚拟机迁移命令请求迁移该虚拟机。
在具体实现中,当应用所在的操作系统重启失败时应用的HACS可尝试多次重启操作系统。具体来说,若应用所在的操作系统重启成功,虚拟机向云计算管理设备发送重启操作系统响应指示重启应用所在的操作系统成功;若应用所在的操作系统重启失败,应用的HACS可调用通用脚本再次重启操作系统,当该应用的操作系统重启失败次数达到M次时,虚拟机才向云计算管理设备发送重启操作系统响应指示重启应用所在的操作系统失败。
在一些可行的实施方式中,若虚拟机重启应用所在的操作系统失败,云计算管理设备根据虚拟机发送的重启操作系统响应判断虚拟机重启应用所在的操作系统失败,则请求虚拟机的云计算基础设施(即IaaS设备)迁移虚拟机。若虚拟机的云计算基础设施(即IaaS设备)迁移虚拟机失败,则云计算管理设备请求云计算基础设施重建虚拟机;若虚拟机的云计算基础设施迁移虚拟机成功,则该应用在虚拟机恢复服务后通过通用脚本向HACS上报应用恢复,虚拟机向云计算管理设备发送第一应用恢复指示以指示上述应用已成功恢复。
在一些可行的实施方式中,若虚拟机的云计算基础设施(即IaaS设备)重建虚拟机失败,则云计算管理设备输出故障信息,故障信息用于维护人员进行人工故障处理;若虚拟机的云计算基础设施(即IaaS设备)重建虚拟机成功,则该应用在重建的虚拟机上恢复服务后通过通用脚本向HACS上报应用恢复,虚拟机向云计算管理设备发送第二应用恢复指示以指示上述应用已成功恢复。
可见,本发明实施例提出的技术方案可使云计算管理设备向虚拟机提供应用监控服务,当需要重启应用服务时云计算管理设备向虚拟机发送重启应用请求以使虚拟机重启应用服务;当虚拟机重启应用服务失败时,云计算管理设备可向虚拟机发送重启操作系统请求以使虚拟机重启应用服务的操作系统;若虚拟机重启操作系统失败,云计算管理设备还可以迁移虚拟机或重建虚拟机以恢复应用服务。本发明实施例公开的技术可以有效保证通过虚拟机向用户提供正常的增值应用服务,在虚拟机中部署HACS功能监控虚拟机的方式实现起来较为简单,而且使用成本较低。
本发明第四实施例提供了一种云计算管理设备,用于实现本发明提出的一种基于云计算服务的虚拟机监控方法。参见图11,所述云计算管理设备400可包括发送单元410、接收单元420和处理单元430。
发送单元410,用于向虚拟机发送HACS部署请求以指示虚拟机为其上运行的应用安装HACS功能,HACS功能用于监控应用的运行是否异常;
接收单元420,用于接收虚拟机发送的应用异常指示,其中,应用异常指示用于指示应用运行异常;
处理单元430,用于根据应用运行异常指示判断是否需要重启应用;
发送单元410还用于,若处理单元430判断需要重启应用,向虚拟机发送重启应用请求以指示虚拟机重启应用。
在一些可行的实施方式中,接收单元420可接收虚拟机发送的重启应用响应,其中,重启应用响应用于指示虚拟机重启应用是否成功。处理单元430根据重启应用响应判断虚拟机重启应用是否成功。若处理单元430判断虚拟机重启应用失败,发送单元410向虚拟机发送重启操作系统请求以指示虚拟机重启应用所在的操作系统。
发送单元410向虚拟机发送重启操作系统请求后,接收单元420可接收虚拟机发送的重启操作系统响应,其中,重启操作系统响应用于指示虚拟机重启应用所在的操作系统是否成功。处理单元430根据重启操作系统响应判断虚拟机重启应用所在的操作系统是否成功,若处理单元430判断虚拟机重启应用所在的操作系统失败,发送单元410向虚拟机的云计算基础设施发送虚拟机迁移命令以请求迁移虚拟机,虚拟机迁移命令中包含虚拟机的标识。
在另一些可行的实施方式中,接收单元420可接收虚拟机发送的重启应用响应,重启应用响应用于指示虚拟机重启应用是否成功;处理单元430根据重启应用响应判断虚拟机重启应用是否成功;若处理单元430判断虚拟机重启应用失败,发送单元410向虚拟机所在的云计算基础设施发送虚拟机迁移命令以请求迁移虚拟机,虚拟机迁移命令中包含虚拟机的标识。
当发送单元410向虚拟机所在的云计算基础设施发送虚拟机迁移请求后,接收单元420可接收云计算基础设施发送的虚拟机迁移指示,虚拟机迁移指示用于指示虚拟机是否迁移成功;处理单元430根据虚拟机迁移指示判断虚拟机迁移是否成功;若处理单元430判断虚拟机迁移失败,发送单元410向虚拟机所在的云计算基础设施发送虚拟机重建命令以请求重建虚拟机,虚拟机重建命令中包含虚拟机的标识和应用的标识;若处理单元430判断虚拟机迁移成功,接收单元420可接收虚拟机发送的第一应用恢复指示,第一应用恢复指示用于指示应用已成功恢复。
当发送单元410向虚拟机所在的云计算基础设施发送虚拟机重建命令之后,接收单元420可接收云计算基础设施发送的虚拟机重建指示,虚拟机重建指示用于指示虚拟机是否重建成功。处理单元430根据虚拟机重建指示判断虚拟机重建是否成功,若判断虚拟机重建失败,则输出故障信息以进行人工故障处理;若判断虚拟机重建成功,根据虚拟机重建指示中的应用标识和重建后的虚拟机的标识更新应用对应的虚拟机标识,接收单元420还可接收虚拟机发送的第二应用恢复指示,第二应用恢复指示用于指示应用已成功恢复。
可见,本发明实施例提出的技术方案可使云计算管理设备向虚拟机提供应用监控服务,当需要重启应用时云计算管理设备向虚拟机发送重启应用请求以使虚拟机重启应用。本发明实施例公开的技术可以有效保证通过虚拟机向用户提供正常的增值应用服务,在虚拟机中部署HACS功能监控虚拟机的应用的方式实现起来较为简单,而且使用成本较低。
本发明第五实施例提供了一种虚拟机,用于实现本发明提出的一种基于云计算服务的虚拟机监控方法。参见图12,所述虚拟机500可包括接收单元510、处理单元520和发送单元530。
接收单元510,用于接收云计算管理设备发送的HACS部署请求,并安装HACS部署请求中指定的应用的HACS功能;
处理单元520,用于监控应用的运行是否异常;
发送单元530,用于若处理单元520判断应用运行异常,向云计算管理设备发送应用异常指示。
在一些可行的实施方式中,接收单元510接收云计算管理设备发送的重启应用请求,重启应用请求用于指示重启应用;处理单元520可重启应用;发送单元530向云计算管理设备发送重启应用响应以指示重启应用是否成功。
在具体实现中,若处理单元520若重启应用失败,可再次重启应用。当处理单元520重启应用成功时,发送单元530向云计算管理设备发送重启应用响应以指示重启应用成功;或者,当处理单元520重启应用失败的次数达到N次时,发送单元530向云计算管理设备发送重启应用响应以指示重启应用失败,其中,N为大于1的整数。
在一些可行的实施方式中,若处理单元520重启应用失败,接收单元510接收云计算管理设备发送的重启操作系统请求,重启操作系统请求用于指示重启应用所在的操作系统;处理单元520可重启应用所在的操作系统;发送单元530向云计算管理设备发送重启操作系统响应以指示重启应用所在的操作系统是否成功。
在具体实现中,若处理单元520重启应用所在的操作系统失败,可再次重启应用所在的操作系统。若处理单元520重启应用所在的操作系统成功,发送单元530向云计算管理设备发送重启操作系统响应以指示重启应用所在的操作系统成功;或者,当处理单元520重启应用所在的操作系统失败的次数达到M次时,发送单元530向云计算管理设备发送重启操作系统响应以指示重启应用所在的操作系统失败,其中,M为大于1的整数。
若处理单元520重启应用所在的操作系统失败,当虚拟机成功迁移之后,发送单元530可向云计算管理设备发送第一应用恢复指示以指示应用已成功恢复,或者,当虚拟机成功重建之后,发送单元530可向云计算管理设备发送第二应用恢复指示以指示应用已成功恢复。
可见,本发明实施例提出的技术方案可使云计算管理设备向虚拟机提供应用监控服务,当需要重启应用服务时云计算管理设备向虚拟机发送重启应用请求以使虚拟机重启应用服务;当虚拟机重启应用服务失败时,云计算管理设备可向虚拟机发送重启操作系统请求以使虚拟机重启应用服务的操作系统;若虚拟机重启操作系统失败,云计算管理设备还可以迁移虚拟机或重建虚拟机以恢复应用服务。本发明实施例公开的技术可以有效保证通过虚拟机向用户提供正常的增值应用服务,在虚拟机中部署HACS功能监控虚拟机的方式实现起来较为简单,而且使用成本较低。
本发明第六实施例提供了另一种云计算管理设备,用于实现本发明提出的一种基于云计算服务的虚拟机监控方法。参见图13,该设备600包括处理器610、存储器620、总线系统630、接收器640和发送器650。其中,处理器610、存储器620、接收器640和发送器650通过总线系统630相连,该存储器620用于存储指令,该处理器610用于执行该存储器620存储的指令,以控制接收器640接收信号,并控制发送器650发送信号,完成上述基于云计算服务的虚拟机监控方法中的步骤。其中,接收器640和发送器650可以为相同或者不同的物理实体。为相同的物理实体时,可以统称为收发器。
该设备600完成的方法步骤至少可以包括:
向虚拟机发送HACS部署请求以指示虚拟机为其上运行的应用安装HACS功能,HACS功能用于监控应用的运行是否异常;
接收虚拟机发送的应用异常指示,其中,应用异常指示用于指示应用运行异常;
根据应用运行异常指示判断是否需要重启应用,若需要重启所述应用,则向虚拟机发送重启应用请求以指示虚拟机重启应用。
上述云计算管理设备所涉及的与本发明实施例提供的技术方案相关的概念,解释和详细说明及其他步骤请参见前述方法或实施例中关于这些内容的描述,此处不做赘述。
本发明第七实施例提供了另一种虚拟机,用于实现本发明提出的一种基于云计算服务的虚拟机监控方法。参见图14,该设备700包括处理器710、存储器720、总线系统730、接收器740和发送器750。其中,处理器710、存储器720、接收器740和发送器750通过总线系统730相连,该存储器720用于存储指令,该处理器710用于执行该存储器720存储的指令,以控制接收器740接收信号,并控制发送器750发送信号,完成上述基于云计算服务的虚拟机监控方法中的步骤。其中,接收器740和发送器750可以为相同或者不同的物理实体。为相同的物理实体时,可以统称为收发器。
该设备700完成的方法步骤至少可以包括:
接收云计算管理设备发送的HACS部署请求,并安装HACS部署请求中指定的应用的HACS功能;
监控应用的运行是否异常;
若判断应用运行异常,则向云计算管理设备发送应用异常指示。
上述虚拟机所涉及的与本发明实施例提供的技术方案相关的概念,解释和详细说明及其他步骤请参见前述方法或实施例中关于这些内容的描述,此处不做赘述。
本领域普通技术人员将会理解,本发明的各个方面、或各个方面的可能实现方式可以被具体实施为系统、方法或者计算机程序产品。此外,本发明的各方面、或各个方面的可能实现方式可以采用计算机程序产品的形式,计算机程序产品是指存储在计算机可读介质中的计算机可读程序代码。
计算机可读介质可以是计算机可读数据介质或者计算机可读存储介质。计算机可读存储介质包含但不限于电子、磁性、光学、电磁、红外或半导体系统、设备或者装置,或者前述的任意适当组合,如随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或者快闪存储器)、光纤、便携式只读存储器(CD-ROM)。
计算机中的处理器读取存储在计算机可读介质中的计算机可读程序代码,使得处理器能够执行在流程图中每个步骤、或各步骤的组合中规定的功能动作;生成实施在框图的每一块、或各块的组合中规定的功能动作的装置。
计算机可读程序代码可以完全在用户的计算机上执行、部分在用户的计算机上执行、作为单独的软件包、部分在用户的本地计算机上并且部分在远程计算机上,或者完全在远程计算机或者服务器上执行。也应该注意,在某些替代实施方案中,在流程图中各步骤、或框图中各块所注明的功能可能不按图中注明的顺序发生。例如,依赖于所涉及的功能,接连示出的两个步骤、或两个块实际上可能被大致同时执行,或者这些块有时候可能被以相反顺序执行。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,所述功能单元的划分,仅仅为一种逻辑功能划分,具体实现时可能有其他的划分方式,例如多个单元可以结合到同一个子系统或模块中实现,或将一个单元拆分成几个单元实现,或一些实现特征可以忽略或不执行。
以上对本发明实施例公开的一种基于云计算服务的虚拟机监控方法及设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (24)

1.一种基于云计算服务的虚拟机监控方法,其特征在于,包括:
云计算管理设备接收虚拟机的应用通过可调用云计算管理平台的服务订阅接口发送的监控服务订阅请求,以请求云计算管理平台提供虚拟机应用监控服务;所述监控服务订阅请求包括应用标识和虚拟机标识;
所述云计算管理设备向所述虚拟机发送高可用集群服务HACS部署请求以指示所述虚拟机为其上运行的应用安装HACS功能,所述HACS功能用于监控所述应用的运行是否异常;其中,所述HACS通过调用脚本实现对应用的实时监控并与所述云计算管理平台中的应用高可用服务Application HA Service进行交互;
所述云计算管理设备接收所述虚拟机发送的应用异常指示,其中,所述应用异常指示用于指示所述应用运行异常;
所述云计算管理设备根据所述应用运行异常指示判断是否需要重启所述应用,若需要重启所述应用,则向所述虚拟机发送重启应用请求以指示所述虚拟机重启所述应用。
2.根据权利要求1所述的方法,其特征在于,在所述向所述虚拟机设备发送重启应用请求以指示所述虚拟机重启所述应用之后,所述方法还包括:
所述云计算管理设备接收所述虚拟机发送的重启应用响应,其中,所述重启应用响应用于指示所述虚拟机重启所述应用是否成功;
若所述云计算管理设备根据所述重启应用响应判断所述虚拟机重启所述应用失败,则向所述虚拟机发送重启操作系统请求以指示所述虚拟机重启所述应用所在的操作系统。
3.根据权利要求2所述的方法,其特征在于,在所述向所述虚拟机发送重启操作系统请求以指示所述虚拟机重启所述应用所在的操作系统之后,所述方法还包括:
所述云计算管理设备接收所述虚拟机发送的重启操作系统响应,其中,所述重启操作系统响应用于指示所述虚拟机重启所述应用所在的操作系统是否成功;
若所述云计算管理设备根据所述重启操作系统响应判断所述虚拟机重启所述应用所在的操作系统失败,则向所述虚拟机的云计算基础设施发送虚拟机迁移命令以请求迁移所述虚拟机,所述虚拟机迁移命令中包含所述虚拟机的标识。
4.根据权利要求1所述的方法,其特征在于,在所述向所述虚拟机设备发送重启应用请求以指示所述虚拟机重启所述应用之后,所述方法还包括:
所述云计算管理设备接收所述虚拟机发送的重启应用响应,其中,所述重启应用响应用于指示所述虚拟机重启所述应用是否成功;
若所述云计算管理设备根据所述重启应用响应判断所述虚拟机重启所述应用失败,则向所述虚拟机所在的云计算基础设施发送虚拟机迁移命令以请求迁移所述虚拟机,所述虚拟机迁移命令中包含所述虚拟机的标识。
5.根据权利要求3或4所述的方法,其特征在于,在所述云计算管理设备向所述虚拟机所在的云计算基础设施发送虚拟机迁移命令以请求迁移所述虚拟机的步骤之后,所述方法还包括:
所述云计算管理设备接收所述云计算基础设施发送的虚拟机迁移指示,其中,所述虚拟机迁移指示用于指示所述虚拟机是否迁移成功;
若所述云计算管理设备根据所述虚拟机迁移指示判断所述虚拟机迁移失败,则向所述虚拟机所在的云计算基础设施发送虚拟机重建命令以请求重建所述虚拟机,所述虚拟机重建命令中包含所述虚拟机的标识和所述应用的标识;
若所述云计算管理设备根据所述虚拟机迁移指示判断所述虚拟机迁移成功,接收所述虚拟机发送的第一应用恢复指示,所述第一应用恢复指示用于指示所述应用已成功恢复。
6.根据权利要求5所述的方法,其特征在于,在所述云计算管理设备向所述虚拟机所在的云计算基础设施发送虚拟机重建命令以请求重建所述虚拟机的步骤之后,所述方法还包括:
所述云计算管理设备接收所述云计算基础设施发送的虚拟机重建指示,其中,所述虚拟机重建指示用于指示所述虚拟机是否重建成功;
若所述云计算管理设备根据所述虚拟机重建指示判断所述虚拟机重建失败,则输出故障信息以进行人工故障处理;
若所述云计算管理设备根据所述虚拟机重建指示判断所述虚拟机重建成功,根据所述虚拟机重建指示中的应用标识和重建后的所述虚拟机的标识更新所述应用对应的虚拟机标识,并接收所述虚拟机发送的第二应用恢复指示,所述第二应用恢复指示用于指示所述应用已成功恢复。
7.一种基于云计算服务的虚拟机监控方法,其特征在于,包括:
虚拟机的应用通过可调用云计算管理平台的服务订阅接口向云计算管理设备发送监控服务订阅请求,以请求云计算管理平台提供虚拟机应用监控服务;所述监控服务订阅请求包括应用标识和虚拟机标识;
所述虚拟机接收所述云计算管理设备发送的高可用集群服务HACS部署请求,并安装所述HACS部署请求中指定的应用的HACS功能;其中,所述HACS通过调用脚本实现对应用的实时监控并与所述云计算管理平台中的应用高可用服务Application HA Service进行交互;
所述虚拟机的所述应用的HACS监控所述应用的运行是否异常;
若所述应用的HACS判断所述应用运行异常,则所述虚拟机向所述云计算管理设备发送应用异常指示。
8.根据权利要求7所述的方法,其特征在于,在所述虚拟机向所述云计算管理设备发送应用异常指示之后,所述方法还包括:
所述虚拟机接收所述云计算管理设备发送的重启应用请求,所述重启应用请求用于指示重启所述应用;
所述虚拟机的所述应用的HACS重启所述应用;
所述虚拟机向所述云计算管理设备发送重启应用响应以指示重启所述应用是否成功。
9.根据权利要求8所述的方法,其特征在于,在所述虚拟机的所述应用的HACS重启所述应用之后,所述方法还包括:
若所述应用的重启失败,所述虚拟机的所述应用的HACS再次重启所述应用;
所述虚拟机向所述云计算管理设备发送重启应用响应以指示重启所述应用是否成功,包括:
当所述应用重启成功时,所述虚拟机向所述云计算管理设备发送所述重启应用响应以指示重启所述应用成功;或者,
当所述应用重启失败的次数达到N次时,所述虚拟机向所述云计算管理设备发送重启应用响应以指示重启所述应用失败,其中,所述N为大于1的整数。
10.根据权利要求8或9所述的方法,其特征在于,在所述向所述云计算管理设备发送重启应用响应以指示重启所述应用是否成功的步骤之后,所述方法还包括:
若所述应用重启失败,所述虚拟机接收所述云计算管理设备发送的重启操作系统请求,所述重启操作系统请求用于指示重启所述应用所在的操作系统;
所述虚拟机的所述应用的HACS重启所述应用所在的操作系统;
所述虚拟机向所述云计算管理设备发送重启操作系统响应以指示重启所述应用所在的操作系统是否成功。
11.根据权利要求10所述的方法,其特征在于,在所述虚拟机的所述应用的HACS重启所述应用所在的操作系统之后,所述方法还包括:
若所述应用所在的操作系统重启失败,所述虚拟机的所述应用的HACS再次重启所述应用所在的操作系统;
所述虚拟机向所述云计算管理设备发送重启操作系统响应以指示重启所述应用所在的操作系统是否成功,包括:
若所述应用所在的操作系统重启成功,所述虚拟机向所述云计算管理设备发送重启操作系统响应以指示重启所述应用所在的操作系统成功;或者,
当所述应用所在的操作系统重启失败的次数达到M次时,所述虚拟机向所述云计算管理设备发送重启操作系统响应以指示重启所述应用所在的操作系统失败,其中,所述M为大于1的整数。
12.根据权利要求10所述的方法,其特征在于,在所述虚拟机向所述云计算管理设备发送重启操作系统响应以指示重启所述应用所在的操作系统是否成功之后,所述方法还包括:
若所述应用所在的操作系统重启失败,当所述虚拟机成功迁移之后,所述虚拟机向所述云计算管理设备发送第一应用恢复指示以指示所述应用已成功恢复,或者,当所述虚拟机成功重建之后,所述虚拟机向所述云计算管理设备发送第二应用恢复指示以指示所述应用已成功恢复。
13.一种云计算管理设备,其特征在于,包括:
接收单元,用于接收虚拟机的应用通过可调用云计算管理平台的服务订阅接口发送的监控服务订阅请求,以请求云计算管理平台提供虚拟机应用监控服务;所述监控服务订阅请求包括应用标识和虚拟机标识;
发送单元,用于向所述虚拟机发送高可用集群服务HACS部署请求以指示所述虚拟机为其上运行的应用安装HACS功能,所述HACS功能用于监控所述应用的运行是否异常;其中,所述HACS通过调用脚本实现对应用的实时监控并与所述云计算管理平台中的应用高可用服务Application HA Service进行交互;
接收单元,用于接收所述虚拟机发送的应用异常指示,其中,所述应用异常指示用于指示所述应用运行异常;
处理单元,用于根据所述应用运行异常指示判断是否需要重启所述应用;
所述发送单元还用于,若所述处理单元判断需要重启所述应用,向所述虚拟机发送重启应用请求以指示所述虚拟机重启所述应用。
14.根据权利要求13所述的设备,其特征在于,所述接收单元还用于:
接收所述虚拟机发送的重启应用响应,其中,所述重启应用响应用于指示所述虚拟机重启所述应用是否成功;
所述处理单元还用于,根据所述重启应用响应判断所述虚拟机重启所述应用是否成功;
所述发送单元还用于,若所述处理单元判断所述虚拟机重启所述应用失败,向所述虚拟机发送重启操作系统请求以指示所述虚拟机重启所述应用所在的操作系统。
15.根据权利要求14所述的设备,其特征在于,所述接收单元还用于:
接收所述虚拟机发送的重启操作系统响应,其中,所述重启操作系统响应用于指示所述虚拟机重启所述应用所在的操作系统是否成功;
所述处理单元还用于,根据所述重启操作系统响应判断所述虚拟机重启所述应用所在的操作系统是否成功;
所述发送单元还用于,若所述处理单元判断所述虚拟机重启所述应用所在的操作系统失败,向所述虚拟机的云计算基础设施发送虚拟机迁移命令以请求迁移所述虚拟机,所述虚拟机迁移命令中包含所述虚拟机的标识。
16.根据权利要求13所述的设备,其特征在于,所述接收单元还用于:
接收所述虚拟机发送的重启应用响应,其中,所述重启应用响应用于指示所述虚拟机重启所述应用是否成功;
所述处理单元还用于,根据所述重启应用响应判断所述虚拟机重启所述应用是否成功;
所述发送单元还用于,若所述处理单元判断所述虚拟机重启所述应用失败,向所述虚拟机所在的云计算基础设施发送虚拟机迁移命令以请求迁移所述虚拟机,所述虚拟机迁移命令中包含所述虚拟机的标识。
17.根据权利要求14或15所述的设备,其特征在于,所述接收单元还用于:
接收所述云计算基础设施发送的虚拟机迁移指示,其中,所述虚拟机迁移指示用于指示所述虚拟机是否迁移成功;
所述处理单元还用于,根据所述虚拟机迁移指示判断所述虚拟机迁移是否成功;
所述发送单元还用于,若所述处理单元判断所述虚拟机迁移失败,向所述虚拟机所在的云计算基础设施发送虚拟机重建命令以请求重建所述虚拟机,所述虚拟机重建命令中包含所述虚拟机的标识和所述应用的标识;
所述接收单元还用于,若所述处理单元判断所述虚拟机迁移成功,接收所述虚拟机发送的第一应用恢复指示,所述第一应用恢复指示用于指示所述应用已成功恢复。
18.根据权利要求17所述的设备,其特征在于,所述接收单元还用于:
接收所述云计算基础设施发送的虚拟机重建指示,其中,所述虚拟机重建指示用于指示所述虚拟机是否重建成功;
所述处理单元还用于,根据所述虚拟机重建指示判断所述虚拟机重建是否成功,若判断所述虚拟机重建失败,则输出故障信息以进行人工故障处理;若判断所述虚拟机重建成功,根据所述虚拟机重建指示中的应用标识和重建后的所述虚拟机的标识更新所述应用对应的虚拟机标识;
所述接收单元还用于,若所述处理单元判断所述虚拟机重建成功,接收所述虚拟机发送的第二应用恢复指示,所述第二应用恢复指示用于指示所述应用已成功恢复。
19.一种虚拟机,其特征在于,包括:
发送单元,用于所述虚拟机的应用通过可调用云计算管理平台的服务订阅接口向云计算管理设备发送监控服务订阅请求,以请求云计算管理平台提供虚拟机应用监控服务;所述监控服务订阅请求包括应用标识和虚拟机标识;
接收单元,用于接收所述云计算管理设备发送的高可用集群服务HACS部署请求,并安装所述HACS部署请求中指定的应用的HACS功能;其中,所述HACS通过调用脚本实现对应用的实时监控并与所述云计算管理平台中的应用高可用服务Application HA Service进行交互;
处理单元,用于监控所述应用的运行是否异常;
发送单元,用于若所述处理单元判断所述应用运行异常,向所述云计算管理设备发送应用异常指示。
20.根据权利要求19所述的虚拟机,其特征在于,所述接收单元还用于:
接收所述云计算管理设备发送的重启应用请求,所述重启应用请求用于指示重启所述应用;
所述处理单元还用于,重启所述应用;
所述发送单元还用于,向所述云计算管理设备发送重启应用响应以指示重启所述应用是否成功。
21.根据权利要求20所述的虚拟机,其特征在于,所述处理单元还用于:
若重启所述应用失败,则再次重启所述应用;
所述发送单元具体用于:
当所述处理单元重启应用成功时,向所述云计算管理设备发送所述重启应用响应以指示重启所述应用成功;或者,
当所述处理单元重启应用失败的次数达到N次时,向所述云计算管理设备发送重启应用响应以指示重启所述应用失败,其中,所述N为大于1的整数。
22.根据权利要求20或21所述的虚拟机,其特征在于,所述接收单元还用于:
若所述处理单元重启所述应用失败,接收所述云计算管理设备发送的重启操作系统请求,所述重启操作系统请求用于指示重启所述应用所在的操作系统;
所述处理单元还用于,重启所述应用所在的操作系统;
所述发送单元还用于,向所述云计算管理设备发送重启操作系统响应以指示重启所述应用所在的操作系统是否成功。
23.根据权利要求22所述的虚拟机,其特征在于,所述处理单元还用于:
若重启所述应用所在的操作系统失败,则再次重启所述应用所在的操作系统;
所述发送单元具体用于:
若所述处理单元重启所述应用所在的操作系统成功,向所述云计算管理设备发送重启操作系统响应以指示重启所述应用所在的操作系统成功;或者,
当所述处理单元重启所述应用所在的操作系统失败的次数达到M次时,向所述云计算管理设备发送重启操作系统响应以指示重启所述应用所在的操作系统失败,其中,所述M为大于1的整数。
24.根据权利要求22所述的虚拟机,其特征在于,所述发送单元还用于:
若所述处理单元重启所述应用所在的操作系统失败,当所述虚拟机成功迁移之后,向所述云计算管理设备发送第一应用恢复指示以指示所述应用已成功恢复,或者,当所述虚拟机成功重建之后,向所述云计算管理设备发送第二应用恢复指示以指示所述应用已成功恢复。
CN201510623196.4A 2015-09-25 2015-09-25 一种基于云计算服务的虚拟机监控方法、装置及系统 Active CN106559441B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201510623196.4A CN106559441B (zh) 2015-09-25 2015-09-25 一种基于云计算服务的虚拟机监控方法、装置及系统
PCT/CN2016/090068 WO2017049997A1 (zh) 2015-09-25 2016-07-14 一种基于云计算服务的虚拟机监控方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510623196.4A CN106559441B (zh) 2015-09-25 2015-09-25 一种基于云计算服务的虚拟机监控方法、装置及系统

Publications (2)

Publication Number Publication Date
CN106559441A CN106559441A (zh) 2017-04-05
CN106559441B true CN106559441B (zh) 2020-09-04

Family

ID=58385841

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510623196.4A Active CN106559441B (zh) 2015-09-25 2015-09-25 一种基于云计算服务的虚拟机监控方法、装置及系统

Country Status (2)

Country Link
CN (1) CN106559441B (zh)
WO (1) WO2017049997A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109144788B (zh) * 2018-09-10 2021-10-22 网宿科技股份有限公司 一种重建osd的方法、装置及系统
CN110928714A (zh) * 2018-09-19 2020-03-27 阿里巴巴集团控股有限公司 一种服务异常处理方法、装置和计算设备
CN109327335A (zh) * 2018-10-07 2019-02-12 杭州安恒信息技术股份有限公司 一种云监控解决系统及方法
CN113127137A (zh) * 2019-12-30 2021-07-16 中标软件有限公司 使用自托管虚拟机的云计算管理平台及其创建实现方法
CN111885112A (zh) * 2020-06-24 2020-11-03 广东浪潮大数据研究有限公司 节点服务异常处理方法、装置、设备及存储介质
CN113127270B (zh) * 2021-04-01 2023-06-27 北京交通大学 一种基于云计算的3取2安全计算机平台
CN113064762B (zh) * 2021-04-09 2024-02-23 上海新炬网络信息技术股份有限公司 基于多样探测的服务自恢复方法
WO2023185355A1 (zh) * 2022-03-28 2023-10-05 同方威视技术股份有限公司 实现集群虚拟机高可用的方法和装置、设备和介质
CN114826981B (zh) * 2022-04-27 2023-09-22 广东悦伍纪网络技术有限公司 一种云手机内应用常驻的实现系统及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102521128A (zh) * 2011-12-08 2012-06-27 华中科技大学 面向云平台的软件故障容忍方法
CN102708018A (zh) * 2012-04-20 2012-10-03 华为技术有限公司 一种异常处理方法及系统、代理设备与控制装置
CN103118100A (zh) * 2013-01-25 2013-05-22 武汉大学 一种提高虚拟机应用的可用性的保障方法及系统
CN103201724A (zh) * 2010-07-30 2013-07-10 赛门铁克公司 在高可用性虚拟机环境中提供高可用性应用程序
CN103493021A (zh) * 2011-04-21 2014-01-01 国际商业机器公司 虚拟机高可用性
CN104572241A (zh) * 2013-10-18 2015-04-29 南京中兴新软件有限责任公司 应用程序的切换方法及装置、系统

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102325192B (zh) * 2011-09-30 2013-11-13 上海宝信软件股份有限公司 云计算实现方法和系统
CN102571965B (zh) * 2012-01-16 2014-08-13 浪潮(北京)电子信息产业有限公司 实现高可用集群中业务组启动的方法及装置
US20130275966A1 (en) * 2012-04-12 2013-10-17 International Business Machines Corporation Providing application based monitoring and recovery for a hypervisor of an ha cluster
CN104503861A (zh) * 2012-04-20 2015-04-08 华为技术有限公司 一种异常处理方法及系统、代理设备与控制装置
CN102629224B (zh) * 2012-04-26 2014-11-26 广东电子工业研究院有限公司 一种基于云平台的一体化数据容灾方法及其装置
US8983961B2 (en) * 2012-11-29 2015-03-17 International Business Machines Corporation High availability for cloud servers
CN103077079B (zh) * 2012-12-28 2016-06-08 华为技术有限公司 虚拟机迁移控制方法和装置
CN103152414B (zh) * 2013-03-01 2016-03-30 四川省电力公司信息通信公司 一种基于云计算的高可用系统
US9298566B2 (en) * 2013-04-17 2016-03-29 Hewlett Packard Enterprise Development Lp Automatic cluster-based failover handling
CN104683131A (zh) * 2013-11-27 2015-06-03 杭州迪普科技有限公司 一种应用级虚拟化高可靠性方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103201724A (zh) * 2010-07-30 2013-07-10 赛门铁克公司 在高可用性虚拟机环境中提供高可用性应用程序
CN103493021A (zh) * 2011-04-21 2014-01-01 国际商业机器公司 虚拟机高可用性
CN102521128A (zh) * 2011-12-08 2012-06-27 华中科技大学 面向云平台的软件故障容忍方法
CN102708018A (zh) * 2012-04-20 2012-10-03 华为技术有限公司 一种异常处理方法及系统、代理设备与控制装置
CN103118100A (zh) * 2013-01-25 2013-05-22 武汉大学 一种提高虚拟机应用的可用性的保障方法及系统
CN104572241A (zh) * 2013-10-18 2015-04-29 南京中兴新软件有限责任公司 应用程序的切换方法及装置、系统

Also Published As

Publication number Publication date
WO2017049997A1 (zh) 2017-03-30
CN106559441A (zh) 2017-04-05

Similar Documents

Publication Publication Date Title
CN106559441B (zh) 一种基于云计算服务的虚拟机监控方法、装置及系统
CN105103132B (zh) 在升级期间修复云服务
EP3234774B1 (en) Elasticity for highly availabile applications
US9081750B2 (en) Recovery escalation of cloud deployments
US10037237B2 (en) Method and arrangement for fault management in infrastructure as a service clouds
US9880826B2 (en) Installing of application resources in a multi-tenant platform-as-a-service (PaS) system
US8566650B2 (en) Virtual machine infrastructure with storage domain monitoring
EP2648391B1 (en) Automatically scaled network overlay with heuristic monitoring in a hybrid cloud environment
US8997093B2 (en) Application installation management by selectively reuse or terminate virtual machines based on a process status
US20140189677A1 (en) Effective Migration and Upgrade of Virtual Machines in Cloud Environments
CN103595801B (zh) 一种云计算系统及其虚拟机实时监控方法
US20150326535A1 (en) Network platform-as-a-service for creating and inserting virtual network functions into a service provider network
US11418575B2 (en) Optimizing service deployment in a distributed computing environment
CN108632057A (zh) 一种云计算服务器的故障恢复方法、装置及管理系统
US20150331763A1 (en) Host swap hypervisor that provides high availability for a host of virtual machines
CN106874214B (zh) 云硬盘资源的回收方法及相关装置
KR20150062634A (ko) 클라우드 컴퓨팅 환경 내 오토 스케일링 시스템 및 방법
US12039377B2 (en) Load leveling device, load leveling method, and load leveling program
US9588831B2 (en) Preventing recurrence of deterministic failures
CN106550002B (zh) 一种paas云托管系统及方法
US10740185B2 (en) Inplace process restart
CN116501469A (zh) 高性能计算集群的控制方法、电子设备以及存储介质
CN107885574B (zh) 一种虚拟机的部署方法、业务节点、控制装置及控制节点
US20230327949A1 (en) Endpoint performance monitoring migration between remote collectors
CN115827148A (zh) 一种资源管理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant