CN113312230A - 云主机的状态监控方法、装置、计算机设备和存储介质 - Google Patents

云主机的状态监控方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN113312230A
CN113312230A CN202010118667.7A CN202010118667A CN113312230A CN 113312230 A CN113312230 A CN 113312230A CN 202010118667 A CN202010118667 A CN 202010118667A CN 113312230 A CN113312230 A CN 113312230A
Authority
CN
China
Prior art keywords
cloud host
monitoring
event
management component
monitoring event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010118667.7A
Other languages
English (en)
Inventor
舒剑平
王子桐
邱平
吴秀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SF Technology Co Ltd
SF Tech Co Ltd
Original Assignee
SF Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SF Technology Co Ltd filed Critical SF Technology Co Ltd
Priority to CN202010118667.7A priority Critical patent/CN113312230A/zh
Publication of CN113312230A publication Critical patent/CN113312230A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/301Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is a virtual computing platform, e.g. logically partitioned systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请涉及一种云主机的状态监控方法、装置、计算机设备和存储介质。所述方法包括:运行监控脚本,以向云主机管理组件注册至少一个监控事件;调用云主机管理组件监测云主机是否出现至少一个监控事件;当云主机管理组件监测到云主机出现至少一个监控事件时,根据监测到的目标监控事件进行事件回调处理。通过本发明实施例,云主机管理组件在监控到目标监控事件后,服务器可以及时进行事件回调处理,减少状态变化时间和状态采集时间之间的时间差,从而提高管理的及时性;并且,采用云主机管理组件进行监控并上报,服务器无需对虚拟出的多个云主机进行循环状态采集,降低了资源占用率。

Description

云主机的状态监控方法、装置、计算机设备和存储介质
技术领域
本申请涉及云主机技术领域,特别是涉及一种云主机的状态监控方法、装置、计算机设备和存储介质。
背景技术
随着云计算技术的飞速发展,出现了云主机。云主机是在服务器集群中虚拟出多个类似独立主机的部分,服务器集群中每个服务器上都有云主机的一个镜像,并且虚拟出的多个云主机由云主机控制节点管理。
目前,由服务器集群中的服务器主动采集云主机的状态,这种状态监控方式存在以下缺点:状态变化时间和状态采集时间存在一定时间差,导致管理不及时;对服务器上虚拟出的多个云主机进行循环状态采集,占用资源较多。
因此,如何解决上述缺点,更好地监控云主机的状态成为了亟待解决的技术问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够及时对云主机进行管理的云主机的状态监控方法、装置、计算机设备和存储介质。
第一方面,本发明实施例提供了一种云主机的状态监控方法,该方法包括:
运行监控脚本,以向云主机管理组件注册至少一个监控事件;
调用云主机管理组件监测云主机是否出现至少一个监控事件;
当云主机管理组件监测到云主机出现至少一个监控事件时,根据监测到的目标监控事件进行事件回调处理。
在其中一个实施例中,上述根据监测到的目标监控事件进行事件回调处理,包括:
根据目标监控事件生成告警信息;
将告警信息发送至用户终端。
在其中一个实施例中,上述根据监测到的目标监控事件进行事件回调处理,包括:
根据目标监控事件生成上报信息;
将上报信息反馈至云主机控制节点。
在其中一个实施例中,在上述向云主机管理组件注册至少一个监控事件之前,该方法还包括:
接收用户设置的至少一个监控事件;监控事件包括云主机的生命周期、重启、磁盘错误、输入输出错误、服务异常终止中的至少一种。
在其中一个实施例中,在上述向云主机管理组件注册至少一个监控事件之前,该方法还包括:
运行监控脚本,以建立监控脚本与云主机管理组件之间的连接。
在其中一个实施例中,在上述运行监控脚本,以建立监控脚本与云主机管理组件之间的连接之前,该方法还包括:
获取监控脚本中预先设置的目标连接方式;其中,目标连接方式包括本地连接、远程TCP连接或远程TLS连接;
建立监控脚本与云主机管理组件之间的连接,包括:
根据获取到的目标连接方式建立监控脚本与云主机管理组件之间的连接。
在其中一个实施例中,该方法还包括:
根据预先设置的云主机模板创建云主机;云主机模板中设置有虚拟看门狗设备,虚拟看门狗设备用于在云主机挂死的情况下重启云主机。
第二方面,本发明实施例提供了一种云主机的状态监控装置,该装置包括:
监控事件注册模块,用于运行监控脚本,以向云主机管理组件注册至少一个监控事件;
监控模块,用于调用云主机管理组件监测云主机是否出现至少一个监控事件;
事件回调处理模块,用于当云主机管理组件监测到云主机出现至少一个监控事件时,根据监测到的目标监控事件进行事件回调处理。
在其中一个实施例中,上述事件回调处理模块,具体用于根据目标监控事件生成告警信息;将告警信息发送至用户终端。
在其中一个实施例中,上述事件回调处理模块,具体用于根据目标监控事件生成上报信息;将上报信息反馈至云主机控制节点。
在其中一个实施例中,该装置还包括:
监控事件设置模块,用于接收用户设置的至少一个监控事件;监控事件包括云主机的生命周期、重启、磁盘错误、输入输出错误、服务异常终止中的至少一种。
在其中一个实施例中,该装置还包括:
连接建立模块,用于运行监控脚本,以建立监控脚本与云主机管理组件之间的连接。
在其中一个实施例中,该装置还包括:
目标连接方式获取模块,用于获取监控脚本中预先设置的目标连接方式;其中,目标连接方式包括本地连接、远程TCP连接或远程TLS连接;
连接建立模块,具体用于根据获取到的目标连接方式建立监控脚本与云主机管理组件之间的连接。
在其中一个实施例中,该装置还包括:
云主机创建模块,用于根据预先设置的云主机模板创建云主机;云主机模板中设置有虚拟看门狗设备,虚拟看门狗设备用于在云主机挂死的情况下重启云主机。
第三方面,本发明实施例提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上述方法中的步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述方法中的步骤。
上述云主机的状态监控方法、装置、计算机设备和存储介质,运行监控脚本,以向云主机管理组件注册至少一个监控事件;调用云主机管理组件监测云主机是否出现至少一个监控事件;当云主机管理组件监测到云主机出现至少一个监控事件时,根据监测到的目标监控事件进行事件回调处理。通过本发明实施例,云主机管理组件在监控到目标监控事件后,服务器可以及时进行事件回调处理,减少状态变化时间和状态采集时间之间的时间差,从而提高管理的及时性;并且,采用云主机管理组件进行监控并上报,服务器无需对虚拟出的多个云主机进行循环状态采集,降低了资源占用率。
附图说明
图1为一个实施例中云主机的状态监控方法的应用环境图;
图2为一个实施例中云主机的状态监控方法的流程示意图;
图3为一个实施例中根据监控到的目标监控事件进行回调处理步骤的流程示意图;
图4为另一个实施例中云主机的状态监控方法的流程示意图;
图5为一个实施例中云主机的状态监控装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的云主机的状态监控方法,可以应用于如图1所示的应用环境中。其中,该应用环境包括服务器101。其中,服务器101可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种云主机的状态监控方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤201,运行监控脚本,以向云主机管理组件注册至少一个监控事件。
本实施例中,服务器中设置有监控脚本,在服务器上虚拟出至少一个云主机,同时设置云主机管理组件。其中,云主机管理组件(Libvirt)提供了一个管理虚拟机和其他虚拟化功能的软件的集合,用于管理虚拟化平台的开源的API(Application ProgrammingInterface,应用程序接口)、后台程序和管理工具。例如,在服务器上虚拟出云主机A、B和C,云主机管理组件管理云主机A、B和C。
可以预先在监控脚本中设置监控事件,在进行云主机的状态监控时,服务器运行监控脚本,则向云主机管理组件注册监控脚本中设置的监控事件。例如,预先在监控脚本中设置监控事件M、N、O和P,服务器运行监控脚本后,向云主机管理组件注册监控事件M、N、O和P。
步骤202,调用云主机管理组件监测云主机是否出现至少一个监控事件。
本实施例中,在向云主机管理组件注册监控事件之后,云主机管理组件根据注册的监控事件对云主机进行状态监控,即监测云主机是否出现注册的监控事件。例如,云主机管理组件监测云主机A、B和C是否出现监控事件M、N、O和P。
步骤203,当云主机管理组件监测到云主机出现至少一个监控事件时,根据监测到的目标监控事件进行事件回调处理。
本实施例中,如果云主机管理组件监测到云主机出现至少一个监控事件,则服务器根据云主机管理组件监测到的目标监控事件进行事件回调处理。例如,当云主机管理组件监测到云主机A出现监控事件M时,服务器根据目标监控事件M进行相应的事件回调处理。当云主机管理组件监测到云主机B出现监控事件P时,服务器根据目标监控事件P进行相应的事件回调处理。本发明实施例对事件回调处理的具体方式不作详细限定,可以根据实际情况进行设置。
上述云主机的状态监控方法中,运行监控脚本,以向云主机管理组件注册至少一个监控事件;调用云主机管理组件监测云主机是否出现至少一个监控事件;当云主机管理组件监测到云主机出现至少一个监控事件时,根据监测到的目标监控事件进行事件回调处理。通过本发明实施例,云主机管理组件在监控到目标监控事件后,服务器可以及时进行事件回调处理,减少状态变化时间和状态采集时间之间的时间差,从而提高管理的及时性;并且,采用云主机管理组件进行监控并上报,服务器无需对虚拟出的多个云主机进行循环状态采集,降低了资源占用率。
在另一个实施例中,如图3所示,本实施例涉及的是根据监测到的目标监控事件进行事件回调处理步骤的一种可选的过程。在上述图2所示实施例的基础上,上述步骤203具体可以包括以下步骤:
步骤301,根据目标监控事件生成告警信息;将告警信息发送至用户终端。
本实施例中,在云主机管理组件监测到监控事件后,可以根据监测到的目标监控事件生成告警信息。例如,云主机管理组件监测到云主机C出现磁盘错误,则根据目标监控事件为磁盘错误生成告警信息;或者,云主机管理组件监测到云主机A出现系统服务终止,则根据目标监控事件为系统服务终止生成告警信息。
在生成告警信息之后,将告警信息发送至用户终端。例如,通过邮件方式将“云主机C出现磁盘错误”的告警信息发送到用户电脑;或者通过即时通讯软件将“云主机A出现系统服务终止”的告警信息发送到用户手机。本发明实施例对发送方式不作详细限定,可以根据实际情况进行设置。
步骤302,根据目标监控事件生成上报信息;将上报信息反馈至云主机控制节点。
本实施例中,在云主机管理组件监测到监控事件后,还可以根据监测到的目标监控事件生成上报信息。例如,云主机管理组件监测到云主机A出现重启,则根据目标监控事件为重启生成上报信息;或者,云主机管理组件监测到云主机B出现云主机的生命周期结束,则根据目标监控事件为云主机的生命周期结束生成上报信息。
在生成上报信息之后,将上报信息反馈至云主机控制节点。例如,将“云主机A出现重启的”的上报信息反馈至云主机控制节点;或者,将“云主机B出现云主机的生命周期结束”的上报信息反馈至云主机控制节点。
本发明实施例可以采用步骤301和步骤302中至少一种事件回调处理方式,并且,在采用上述两种事件回调处理方式时,对步骤301和步骤302的顺序不作限制。
上述根据监测到的目标监控事件进行事件回调处理步骤中,根据目标监控事件生成告警信息;将告警信息发送至用户终端;根据目标监控事件生成上报信息;将上报信息反馈至云主机控制节点。通过本发明实施例,可以将监控到的目标监控事件及时通知到管理人员或者云主机控制节点,从而及时响应目标监控事件。
在另一个实施例中,如图4所示,本实施例涉及的是云主机的状态监控方法的一种可选的过程。在上述图2所示实施例的基础上,具体可以包括以下步骤:
步骤401,根据预先设置的云主机模板创建云主机;云主机模板中设置有虚拟看门狗设备,虚拟看门狗设备用于在云主机挂死的情况下重启云主机。
本实施例中,在云主机模板中预先设置虚拟看门狗设备,服务器在根据云主机模板创建云主机时,则可以在虚拟出的云主机中添加虚拟看门狗设备。当云主机出现挂死的情况,虚拟看门狗设备则会重启云主机,从而解决云主机一直挂死无法自动重启的问题。
步骤402,接收用户设置的至少一个监控事件;监控事件包括云主机的生命周期、重启、磁盘错误、输入输出错误、服务异常终止中的至少一种。
本实施例中,用户可以根据实际情况设置监控事件。例如,用户在运行脚本中设置云主机的生命周期、重启、磁盘错误等事件作为监控事件;或者,用户向服务器输入磁盘错误、输入输出错误、服务异常终止等事件作为监控事件。本发明实施例对设置方式不作详细限定,可以根据实际进行设置。
步骤403,运行监控脚本,以建立监控脚本与云主机管理组件之间的连接。
本实施例中,运行监控脚本后,可以获取监控脚本中预先设置的目标连接方式;根据获取到的目标连接方式建立监控脚本与云主机管理组件之间的连接。其中,目标连接方式包括本地连接、远程TCP连接或远程TLS连接。
例如,运行监控脚本后,获取到监控脚本中设置的目标连接方式为本地连接,则根据本地连接的方式建立监控脚本与云主机管理组件之间的连接。或者,获取到监控脚本中设置的目标连接方式为远程TCP(Transmission Control Protocol,传输控制协议)连接,则根据远程TCP连接的方式建立监控脚本与云主机管理组件之间的连接。还可以是,获取到监控脚本中设置的目标连接方式为远程TLS(Transport Layer Security,传输层安全性协议)连接,则根据远程TLS连接的方式建立监控脚本与云主机管理组件之间的连接。本发明实施例对目标连接方式不作详细限定,可以根据实际情况进行设置。
步骤404,向云主机管理组件注册至少一个监控事件。
本实施例中,可以预先在监控脚本中设置监控事件,在进行云主机的状态监控时,服务器运行监控脚本,则向云主机管理组件注册监控脚本中设置的监控事件。例如,预先在监控脚本中设置监控事件:云主机的生命周期、重启、磁盘错误、输入输出错误和服务异常终止,服务器运行监控脚本后,向云主机管理组件注册云主机的生命周期、重启、磁盘错误、输入输出错误和服务异常终止。
步骤405,调用云主机管理组件监测云主机是否出现至少一个监控事件。
本实施例中,在向云主机管理组件注册监控事件之后,云主机管理组件根据注册的监控事件对云主机进行状态监控,即监测云主机是否出现注册的监控事件。例如,云主机管理组件监测云主机A、B和C是否出现云主机的生命周期、重启、磁盘错误、输入输出错误、服务异常终止等监控事件。
步骤406,当云主机管理组件监测到云主机出现至少一个监控事件时,根据监测到的目标监控事件进行事件回调处理。
本实施例中,当云主机管理组件监测到云主机出现注册的监控事件时,根据监测到的目标监控事件进行事件回调处理。例如,云主机管理组件监测到云主机A出现磁盘错误时,根据云主机A出现磁盘错误进行事件回调处理;或者,云主机管理组件监测到虚拟看门狗设备在云主机B挂死的情况下重启云主机B,则根据云主机B重启进行事件回调处理。
在其中一个实施例中,根据监测到的目标监控事件进行事件回调处理,包括:根据目标监控事件生成告警信息;将告警信息发送至用户终端。
在其中一个实施例中,根据监测到的目标监控事件进行事件回调处理,包括:根据目标监控事件生成上报信息;将上报信息反馈至云主机控制节点。
上述云主机的状态监控方法中,根据预先设置的云主机模板创建云主机;接收用户设置的至少一个监控事件;运行监控脚本,以建立监控脚本与云主机管理组件之间的连接;向云主机管理组件注册至少一个监控事件;调用云主机管理组件监测云主机是否出现至少一个监控事件;当云主机管理组件监测到云主机出现至少一个监控事件时,根据监测到的目标监控事件进行事件回调处理。通过本发明实施例,在云主机模板中设置虚拟看门狗设备,从而解决云主机一直挂死无法自动重启的问题;并且,当云主机管理组件监控到目标监控事件后,服务器可以及时进行事件回调处理,减少状态变化时间和状态采集时间之间的时间差,从而提高管理的及时性;采用云主机管理组件进行监控并上报,服务器不用对采集到的云主机状态进行精确区分,也无需对虚拟出的多个云主机进行循环状态采集,因此降低了资源占用率。
应该理解的是,虽然图2-图4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-图4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种云主机的状态监控装置,包括:
监控事件注册模块501,用于运行监控脚本,以向云主机管理组件注册至少一个监控事件;
监控模块502,用于调用云主机管理组件监测云主机是否出现至少一个监控事件;
事件回调处理模块503,用于当云主机管理组件监测到云主机出现至少一个监控事件时,根据监测到的目标监控事件进行事件回调处理。
本实施例中,服务器中设置有监控脚本,在服务器上虚拟出至少一个云主机,同时设置云主机管理组件。其中,云主机管理组件(Libvirt)提供了一个管理虚拟机和其他虚拟化功能的软件的集合,用于管理虚拟化平台的开源的API(Application ProgrammingInterface,应用程序接口)、后台程序和管理工具。例如,在服务器上虚拟出云主机A、B和C,云主机管理组件管理云主机A、B和C。
可以预先在监控脚本中设置监控事件,在进行云主机的状态监控时,服务器运行监控脚本,则向云主机管理组件注册监控脚本中设置的监控事件。例如,预先在监控脚本中设置监控事件M、N、O和P,服务器运行监控脚本后,向云主机管理组件注册监控事件M、N、O和P。
在向云主机管理组件注册监控事件之后,云主机管理组件根据注册的监控事件对云主机进行状态监控,即监测云主机是否出现注册的监控事件。例如,云主机管理组件监测云主机A、B和C是否出现监控事件M、N、O和P。
如果云主机管理组件监测到云主机出现至少一个监控事件,则服务器根据云主机管理组件监测到的目标监控事件进行事件回调处理。例如,当云主机管理组件监测到云主机A出现监控事件M时,服务器根据目标监控事件M进行相应的事件回调处理。当云主机管理组件监测到云主机B出现监控事件P时,服务器根据目标监控事件P进行相应的事件回调处理。本发明实施例对事件回调处理的具体方式不作详细限定,可以根据实际情况进行设置。
在其中一个实施例中,上述事件回调处理模块,具体用于根据目标监控事件生成告警信息;将告警信息发送至用户终端。
本实施例中,在云主机管理组件监测到监控事件后,可以根据监测到的目标监控事件生成告警信息。例如,云主机管理组件监测到云主机C出现磁盘错误,则根据目标监控事件为磁盘错误生成告警信息;或者,云主机管理组件监测到云主机A出现系统服务终止,则根据目标监控事件为系统服务终止生成告警信息。
在生成告警信息之后,将告警信息发送至用户终端。例如,通过邮件方式将“云主机C出现磁盘错误”的告警信息发送到用户电脑;或者通过即时通讯软件将“云主机A出现系统服务终止”的告警信息发送到用户手机。本发明实施例对发送方式不作详细限定,可以根据实际情况进行设置。
在其中一个实施例中,上述事件回调处理模块,具体用于根据目标监控事件生成上报信息;将上报信息反馈至云主机控制节点。
本实施例中,在云主机管理组件监测到监控事件后,还可以根据监测到的目标监控事件生成上报信息。例如,云主机管理组件监测到云主机A出现重启,则根据目标监控事件为重启生成上报信息;或者,云主机管理组件监测到云主机B出现云主机的生命周期结束,则根据目标监控事件为云主机的生命周期结束生成上报信息。
在生成上报信息之后,将上报信息反馈至云主机控制节点。例如,将“云主机A出现重启的”的上报信息反馈至云主机控制节点;或者,将“云主机B出现云主机的生命周期结束”的上报信息反馈至云主机控制节点。
在其中一个实施例中,该装置还包括:
监控事件设置模块,用于接收用户设置的至少一个监控事件;监控事件包括云主机的生命周期、重启、磁盘错误、输入输出错误、服务异常终止中的至少一种。
本实施例中,用户可以根据实际情况设置监控事件。例如,用户在运行脚本中设置云主机的生命周期、重启、磁盘错误等事件作为监控事件;或者,用户向服务器输入磁盘错误、输入输出错误、服务异常终止等事件作为监控事件。本发明实施例对设置方式不作详细限定,可以根据实际进行设置。
在其中一个实施例中,该装置还包括:
连接建立模块,用于运行监控脚本,以建立监控脚本与云主机管理组件之间的连接。
在其中一个实施例中,该装置还包括:
目标连接方式获取模块,用于获取监控脚本中预先设置的目标连接方式;其中,目标连接方式包括本地连接、远程TCP连接或远程TLS连接;
连接建立模块,具体用于根据获取到的目标连接方式建立监控脚本与云主机管理组件之间的连接。
本实施例中,运行监控脚本后,可以获取监控脚本中预先设置的目标连接方式;根据获取到的目标连接方式建立监控脚本与云主机管理组件之间的连接。其中,目标连接方式包括本地连接、远程TCP连接或远程TLS连接。
例如,运行监控脚本后,获取到监控脚本中设置的目标连接方式为本地连接,则根据本地连接的方式建立监控脚本与云主机管理组件之间的连接。或者,获取到监控脚本中设置的目标连接方式为远程TCP(Transmission Control Protocol,传输控制协议)连接,则根据远程TCP连接的方式建立监控脚本与云主机管理组件之间的连接。还可以是,获取到监控脚本中设置的目标连接方式为远程TLS(Transport Layer Security,传输层安全性协议)连接,则根据远程TLS连接的方式建立监控脚本与云主机管理组件之间的连接。本发明实施例对目标连接方式不作详细限定,可以根据实际情况进行设置。
在其中一个实施例中,该装置还包括:
云主机创建模块,用于根据预先设置的云主机模板创建云主机;云主机模板中设置有虚拟看门狗设备,虚拟看门狗设备用于在云主机挂死的情况下重启云主机。
本实施例中,在云主机模板中预先设置虚拟看门狗设备,服务器在根据云主机模板创建云主机时,则可以在虚拟出的云主机中添加虚拟看门狗设备。当云主机出现挂死的情况,虚拟看门狗设备则会重启云主机,从而解决云主机一直挂死无法自动重启的问题。
关于云主机的状态监控装置的具体限定可以参见上文中对于云主机的状态监控方法的限定,在此不再赘述。上述云主机的状态监控装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储云主机的状态监控数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种云主机的状态监控方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
运行监控脚本,以向云主机管理组件注册至少一个监控事件;
调用云主机管理组件监测云主机是否出现至少一个监控事件;
当云主机管理组件监测到云主机出现至少一个监控事件时,根据监测到的目标监控事件进行事件回调处理。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据目标监控事件生成告警信息;
将告警信息发送至用户终端。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据目标监控事件生成上报信息;
将上报信息反馈至云主机控制节点。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
接收用户设置的至少一个监控事件;监控事件包括云主机的生命周期、重启、磁盘错误、输入输出错误、服务异常终止中的至少一种。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
运行监控脚本,以建立监控脚本与云主机管理组件之间的连接。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取监控脚本中预先设置的目标连接方式;其中,目标连接方式包括本地连接、远程TCP连接或远程TLS连接;
建立监控脚本与云主机管理组件之间的连接,包括:
根据获取到的目标连接方式建立监控脚本与云主机管理组件之间的连接。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据预先设置的云主机模板创建云主机;云主机模板中设置有虚拟看门狗设备,虚拟看门狗设备用于在云主机挂死的情况下重启云主机。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
运行监控脚本,以向云主机管理组件注册至少一个监控事件;
调用云主机管理组件监测云主机是否出现至少一个监控事件;
当云主机管理组件监测到云主机出现至少一个监控事件时,根据监测到的目标监控事件进行事件回调处理。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据目标监控事件生成告警信息;
将告警信息发送至用户终端。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据目标监控事件生成上报信息;
将上报信息反馈至云主机控制节点。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
接收用户设置的至少一个监控事件;监控事件包括云主机的生命周期、重启、磁盘错误、输入输出错误、服务异常终止中的至少一种。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
运行监控脚本,以建立监控脚本与云主机管理组件之间的连接。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取监控脚本中预先设置的目标连接方式;其中,目标连接方式包括本地连接、远程TCP连接或远程TLS连接;
建立监控脚本与云主机管理组件之间的连接,包括:
根据获取到的目标连接方式建立监控脚本与云主机管理组件之间的连接。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据预先设置的云主机模板创建云主机;云主机模板中设置有虚拟看门狗设备,虚拟看门狗设备用于在云主机挂死的情况下重启云主机。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种云主机的状态监控方法,其特征在于,所述方法包括:
运行监控脚本,以向云主机管理组件注册至少一个监控事件;
调用所述云主机管理组件监测云主机是否出现所述至少一个监控事件;
当所述云主机管理组件监测到所述云主机出现所述至少一个监控事件时,根据监测到的目标监控事件进行事件回调处理。
2.根据权利要求1所述的方法,其特征在于,所述根据监测到的目标监控事件进行事件回调处理,包括:
根据所述目标监控事件生成告警信息;
将所述告警信息发送至用户终端。
3.根据权利要求1所述的方法,其特征在于,所述根据监测到的目标监控事件进行事件回调处理,包括:
根据所述目标监控事件生成上报信息;
将所述上报信息反馈至云主机控制节点。
4.根据权利要求1所述的方法,其特征在于,在所述向云主机管理组件注册至少一个监控事件之前,所述方法还包括:
接收用户设置的所述至少一个监控事件;所述监控事件包括云主机的生命周期、重启、磁盘错误、输入输出错误、服务异常终止中的至少一种。
5.根据权利要求1所述的方法,其特征在于,在所述向云主机管理组件注册至少一个监控事件之前,所述方法还包括:
运行所述监控脚本,以建立所述监控脚本与所述云主机管理组件之间的连接。
6.根据权利要求5所述的方法,其特征在于,在所述运行所述监控脚本,以建立所述监控脚本与所述云主机管理组件之间的连接之前,所述方法还包括:
获取所述监控脚本中预先设置的目标连接方式;其中,所述目标连接方式包括本地连接、远程TCP连接或远程TLS连接;
所述建立所述监控脚本与云主机管理组件之间的连接,包括:
根据获取到的所述目标连接方式建立所述监控脚本与所述云主机管理组件之间的连接。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据预先设置的云主机模板创建所述云主机;所述云主机模板中设置有虚拟看门狗设备,所述虚拟看门狗设备用于在所述云主机挂死的情况下重启所述云主机。
8.一种云主机的状态监控装置,其特征在于,所述装置包括:
监控事件注册模块,用于运行监控脚本,以向云主机管理组件注册至少一个监控事件;
监控模块,用于调用所述云主机管理组件监测云主机是否出现所述至少一个监控事件;
事件回调处理模块,用于当所述云主机管理组件监测到所述云主机出现所述至少一个监控事件时,根据监测到的目标监控事件进行事件回调处理。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202010118667.7A 2020-02-26 2020-02-26 云主机的状态监控方法、装置、计算机设备和存储介质 Pending CN113312230A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010118667.7A CN113312230A (zh) 2020-02-26 2020-02-26 云主机的状态监控方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010118667.7A CN113312230A (zh) 2020-02-26 2020-02-26 云主机的状态监控方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN113312230A true CN113312230A (zh) 2021-08-27

Family

ID=77370164

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010118667.7A Pending CN113312230A (zh) 2020-02-26 2020-02-26 云主机的状态监控方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN113312230A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007065326A1 (fr) * 2005-12-09 2007-06-14 Huawei Technologies Co., Ltd. Procede de gestion de dispositif terminal
CN104092575A (zh) * 2014-07-29 2014-10-08 中国联合网络通信集团有限公司 一种资源监控方法及系统
CN105337811A (zh) * 2015-12-03 2016-02-17 上海斐讯数据通信技术有限公司 基于Radius服务器的监控系统及监控方法
CN106162715A (zh) * 2015-04-28 2016-11-23 中兴通讯股份有限公司 监控管理方法及装置
CN107888444A (zh) * 2017-09-29 2018-04-06 深圳市牛鼎丰科技有限公司 服务监控方法、服务监控装置、计算机设备和存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007065326A1 (fr) * 2005-12-09 2007-06-14 Huawei Technologies Co., Ltd. Procede de gestion de dispositif terminal
CN104092575A (zh) * 2014-07-29 2014-10-08 中国联合网络通信集团有限公司 一种资源监控方法及系统
CN106162715A (zh) * 2015-04-28 2016-11-23 中兴通讯股份有限公司 监控管理方法及装置
CN105337811A (zh) * 2015-12-03 2016-02-17 上海斐讯数据通信技术有限公司 基于Radius服务器的监控系统及监控方法
CN107888444A (zh) * 2017-09-29 2018-04-06 深圳市牛鼎丰科技有限公司 服务监控方法、服务监控装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN112910945B (zh) 请求链路跟踪方法和业务请求处理方法
CN108256118B (zh) 数据处理方法、装置、系统、计算设备以及存储介质
CN110399241B (zh) 任务异常处理方法、装置、计算机设备和可读存储介质
CN110334126B (zh) 基于Spring MVC的定时任务处理方法、装置和计算机设备
CN108446172B (zh) 数据调取方法、装置、计算机设备和存储介质
WO2018019242A1 (zh) 网站服务器的自恢复方法和自恢复系统
CN112948174A (zh) 消息处理方法、装置、计算机设备和存储介质
CN112564980B (zh) 一种基于微服务架构的服务监控方法及系统
US10891193B2 (en) Application health monitoring and automatic remediation
CN111526049A (zh) 运维系统、运维方法、电子设备和存储介质
CN109257396B (zh) 一种分布式锁调度方法及装置
CN107729213B (zh) 一种后台任务监控方法及装置
CN114281263A (zh) 容器集群管理系统的存储资源处理方法、系统和设备
CN112003895A (zh) OpenStack云平台中云主机疏散方法、装置、设备及存储介质
CN114884840A (zh) 应用健康状态检查方法及电子设备
CN111538585A (zh) 一种基于node.js的服务器进程调度方法、系统和装置
CN111897843B (zh) 物联网数据流转策略的配置方法、装置和计算机设备
CN111447136B (zh) 消息推送方法、装置、计算机设备和存储介质
CN112070585A (zh) 订单状态统一管理方法、装置、计算机设备和存储介质
CN113312230A (zh) 云主机的状态监控方法、装置、计算机设备和存储介质
CN109117243B (zh) 业务部署方法、装置、客户端设备及计算机可读存储介质
CN114610413A (zh) 基于Java的同异步任务的执行方法、装置、设备及存储介质
CN112256384B (zh) 基于容器技术的服务集合处理方法、装置和计算机设备
CN114816866A (zh) 故障处理方法、装置、电子设备和存储介质
CN111176959B (zh) 跨域的应用服务器的预警方法、系统及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210827

RJ01 Rejection of invention patent application after publication