CN109245966A - 云平台的服务状态的监控方法和装置 - Google Patents

云平台的服务状态的监控方法和装置 Download PDF

Info

Publication number
CN109245966A
CN109245966A CN201811305317.0A CN201811305317A CN109245966A CN 109245966 A CN109245966 A CN 109245966A CN 201811305317 A CN201811305317 A CN 201811305317A CN 109245966 A CN109245966 A CN 109245966A
Authority
CN
China
Prior art keywords
monitoring
node
run script
monitored object
cloud platform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811305317.0A
Other languages
English (en)
Inventor
孙辽东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201811305317.0A priority Critical patent/CN109245966A/zh
Publication of CN109245966A publication Critical patent/CN109245966A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0681Configuration of triggering conditions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/14Arrangements for monitoring or testing data switching networks using software, i.e. software packages

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computer Security & Cryptography (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种云平台的服务状态的监控方法和装置。所述方法包括:获取云平台内节点的被监控对象,其中所述被监控对象包括一个或至少两个组件的信息和/或所述节点上数据库的连接;为所述节点的被监控对象配置对应的监控策略,其中所述监控策略包括被监控对象上的监控参数以及监控参数对应的告警条件;和/或,数据库的连接对应的监控参数以及异常状态的判断条件;为所述节点配置对应的运行脚本,其中所述运行脚本用于执行所述被监控对象的监控策略;向所述节点发送所述运行脚本。

Description

云平台的服务状态的监控方法和装置
技术领域
本发明涉及信息处理领域,尤指一种云平台的服务状态的监控方法和装置。
背景技术
云计算(Cloud Computing)是基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。云是网络、互联网的一种比喻说法。过去在图中往往用云来表示电信网,后来也用来表示互联网和底层基础设施的抽象。因此,云计算甚至可以让你体验每秒10万亿次的运算能力,拥有这么强大的计算能力可以预测气候变化和市场发展趋势。用户通过电脑、笔记本、手机等方式接入数据中心,按自己的需求进行运算。
对云计算的定义,现阶段广为接受的是美国国家标准与技术研究院定义:云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源共享池,其中资源包括网络、服务器、存储、应用软件和服务等,这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。在数据中心建设的初期主要是完成网络、计算、存储的搭建,构建统一的资源管理平台,完成资源的统一化管理和自主服务;在后续的发展过程中用户逐渐关注资源的真正使用情况,以便更好的规划资源和控制资源的使用。
随着互联网和软件技术的发展,软件系统架构从单体式架构到面向服务架构一直在不断演进。近年来,面向服务的架构方式由于其灵活、解耦、规范化等诸多优势,被广泛应用于大型企业系统架构。云管理平台也采用这种架构进行代码重构,但是由于面向服务架构的经验不足,没有完全实现微服务相关组件的监控功能。随着云平台市场的拓展,数据中心设备越来越多,计算任务也越来越繁重,这使得数据中心中服务器硬件设备的故障率持续增高,如何更加高效、快捷、智能的完成服务器硬件的监控及告警、预警,用户对于云平台自身服务的监控和自我修复呼声越来越高,已成了业务发展的重要目标。
鉴于此,如何提高云平台的监控管理效率是亟待解决的问题。
发明内容
为了解决上述技术问题,本发明提供了一种云平台的服务状态的监控方法和装置,能够提高云平台的监控管理效率。
为了达到本发明目的,本发明提供了一种云平台的服务状态的监控方法,包括:
获取云平台内节点的被监控对象,其中所述被监控对象包括一个或至少两个组件的信息和/或所述节点上数据库的连接;
为所述节点的被监控对象配置对应的监控策略,其中所述监控策略包括被监控对象上的监控参数以及监控参数对应的告警条件;和/或,数据库的连接对应的监控参数以及异常状态的判断条件;
为所述节点配置对应的运行脚本,其中所述运行脚本用于执行所述被监控对象的监控策略;
向所述节点发送所述运行脚本。
在本发明提供的一个示例性实施例中,所述向所述节点发送所述运行脚本之后,所述方法还包括:
接收所述节点发送的告警数据;
在接收到所述告警数据后,确定所述节点的告警信息对应的告警通知策略,其中所述告警通知策略包括通知人和/或通知方式;
按照所述告警通知策略,发送所述告警信息。
为了达到本发明目的,本发明提供了另一种云平台的服务状态的监控方法,其特征在于,包括:
获取云平台发送的运行脚本,其中所述运行脚本用于执行组件监控策略,所述监控策略包括被监控对象上的监控参数以及监控参数对应的告警条件;和/或,数据库的连接对应的监控参数以及异常状态的判断条件;
执行所述运行脚本的安装操作;
利用所述运行脚本获取所述监控策略中被监控对象的状态信息。
在本发明提供的一个示例性实施例中,所述利用所述运行脚本获取所述监控策略中被监控对象的状态信息之后,所述方法还包括:
在获取的监控对象的状态信息达到所述告警条件或者异常状态的判断条件后,向云平台发送告警数据。
在本发明提供的一个示例性实施例中,所述利用所述运行脚本获取所述监控策略中被监控对象的状态信息之后,所述方法还包括:
在获取的监控对象的状态信息达到所述告警条件后,对所述组件进行如下操作,包括:对所述组件进行重启操作;或者,判断所述组件是否处在响应用户操作的过程中,如果是,则提示用户对所述组件进行重启操作,在得到用户的确认信息后,重启所述组件;否则,直接重启所述组件;
和/或,
在获取的监控对象的状态信息达到所述异常状态的判断条件后,获取所述数据库发生的异常事件的描述信息,根据异常事件的描述信息,确定与所述异常事件对应的数据库连接,停止所述数据库连接的访问。
为了达到本发明目的,本发明提供了一种云平台的服务状态的监控装置,包括:
第一获取模块,用于获取云平台内节点的被监控对象,其中所述被监控对象包括一个或至少两个组件的信息和/或所述节点上数据库的连接;
第一配置模块,用于为所述节点的被监控对象配置对应的监控策略,其中所述监控策略包括被监控对象上的监控参数以及监控参数对应的告警条件;和/或,数据库的连接对应的监控参数以及异常状态的判断条件;
第二配置模块,用于为所述节点配置对应的运行脚本,其中所述运行脚本用于执行所述被监控对象的监控策略;
第一发送模块,用于向所述节点发送所述运行脚本。
在本发明提供的一个示例性实施例中,所述装置还包括:
接收模块,用于在向所述节点发送所述运行脚本之后,接收所述节点发送的告警数据;
确定模块,用于在接收到所述告警数据后,确定所述节点的告警信息对应的告警通知策略,其中所述告警通知策略包括通知人和/或通知方式;
第二发送模块,用于按照所述告警通知策略,发送所述告警信息。
为了达到本发明目的,本发明提供了另一种云平台的服务状态的监控装置,包括:
第二获取模块,用于获取云平台发送的运行脚本,其中所述运行脚本用于执行组件监控策略,所述监控策略包括被监控对象上的监控参数以及监控参数对应的告警条件;和/或,数据库的连接对应的监控参数以及异常状态的判断条件;
安装模块,用于执行所述运行脚本的安装操作;
第三获取模块,用于利用所述运行脚本获取所述监控策略中被监控对象的状态信息。
在本发明提供的一个示例性实施例中,所述装置还包括:
第三发送模块,用于在获取的监控对象的状态信息达到所述告警条件或者异常状态的判断条件后,向云平台发送告警数据。
在本发明提供的一个示例性实施例中,所述装置还包括:
第一处理模块,用于在利用所述运行脚本获取所述监控策略中被监控对象的状态信息之后,如果获取的监控对象的状态信息达到所述告警条件,对所述组件进行如下操作,包括:对所述组件进行重启操作;或者,判断所述组件是否处在响应用户操作的过程中,如果是,则提示用户对所述组件进行重启操作,在得到用户的确认信息后,重启所述组件;否则,直接重启所述组件;
和/或,
第二处理模块,用于在利用所述运行脚本获取所述监控策略中被监控对象的状态信息之后,如果获取的监控对象的状态信息达到所述异常状态的判断条件,获取所述数据库发生的异常事件的描述信息,根据异常事件的描述信息,确定与所述异常事件对应的数据库连接,停止所述数据库连接的访问。
本发明提供的实施例,获取云平台内节点的被监控对象,并为所述节点的被监控对象配置对应的监控策略,再为所述节点配置对应的运行脚本,向所述节点发送所述运行脚本,使得节点能够利用运行脚本进行节点的监控操作,保障了用户数据的安全性,提高了云平台运行的稳定性,并且降低了运营成本,提高了云平台在同类产品中的竞争力。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1为本发明提供的一种云平台的服务状态的监控方法的流程图;
图2为本发明提供的另一种云平台的服务状态的监控方法的流程图
图3为本发明提供的一种云平台的服务状态的监控装置的结构图;
图4为本发明提供的另一种云平台的服务状态的监控装置的结构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1为本发明提供的一种云平台的服务状态的监控方法的流程图。图1 所示方法包括:
步骤101、获取云平台内节点的被监控对象,其中所述被监控对象包括一个或至少两个组件的信息和/或所述节点上数据库的连接;
其中,组件可以为数据库mysql、消息中间件RabbitMQ、内存数据库Redis、 Web中间件Tomcat等;数据库的连接可以为云平台数据库mysql连接信息以及死锁信息和事务信息。
步骤102、为所述节点的被监控对象配置对应的监控策略,其中所述监控策略包括被监控对象上的监控参数以及监控参数对应的告警条件;和/或,数据库的连接对应的监控参数以及异常状态的判断条件;
步骤103、为所述节点配置对应的运行脚本,其中所述运行脚本用于执行所述被监控对象的监控策略;
步骤104、向所述节点发送所述运行脚本。
在本发明提供的一个示例性实施例中,向所述节点发送所述运行脚本之后,所述方法还包括:
接收所述节点发送的告警数据;
在接收到所述告警数据后,确定所述节点的告警信息对应的告警通知策略,其中所述告警通知策略包括通知人和/或通知方式;
按照所述告警通知策略,发送所述告警信息。
例如,向用户输出监控信息报告:按照重要级别颜色区分,比如磁盘不足、内存泄漏等;通知的方式可以为短信、邮件和微信等。
本发明提供的方法实施例,获取云平台内节点的被监控对象,并为所述节点的被监控对象配置对应的监控策略,再为所述节点配置对应的运行脚本,向所述节点发送所述运行脚本,使得节点能够利用运行脚本进行节点的监控操作,保障了用户数据的安全性,提高了云平台运行的稳定性,并且降低了运营成本,提高了云平台在同类产品中的竞争力。
图2为本发明提供的另一种云平台的服务状态的监控方法的流程图。图2 所示方法包括:
步骤201、获取云平台发送的运行脚本,其中所述运行脚本用于执行组件监控策略,所述监控策略包括被监控对象上的监控参数以及监控参数对应的告警条件;和/或,数据库的连接对应的监控参数以及异常状态的判断条件;
步骤202、执行所述运行脚本的安装操作;
步骤203、利用所述运行脚本获取所述监控策略中被监控对象的状态信息。
在本发明提供的一个示例性实施例中,所述利用所述运行脚本获取所述监控策略中被监控对象的状态信息之后,所述方法还包括:
在获取的监控对象的状态信息达到所述告警条件或者异常状态的判断条件后,向云平台发送告警数据。
在本发明提供的一个示例性实施例中,所述利用所述运行脚本获取所述监控策略中被监控对象的状态信息之后,所述方法还包括:
在获取的监控对象的状态信息达到所述告警条件后,对所述组件进行如下操作,包括:对所述组件进行重启操作;或者,判断所述组件是否处在响应用户操作的过程中,如果是,则提示用户对所述组件进行重启操作,在得到用户的确认信息后,重启所述组件;否则,直接重启所述组件;
和/或,
在获取的监控对象的状态信息达到所述异常状态的判断条件后,获取所述数据库发生的异常事件的描述信息,根据异常事件的描述信息,确定与所述异常事件对应的数据库连接,停止所述数据库连接的访问。
在本示例性实施例中,在对组件进行重启前,通过确定该组件是否处在响应用户操作的过程中,用以确定重启操作是否会影响到用户的正常业务操作,保证用户的正常使用。
本发明提供的方法实施例,通过获取云平台发送的运行脚本,执行所述运行脚本的安装操作,并利用所述运行脚本获取所述监控策略中被监控对象的状态信息,实现利用运行脚本进行节点的监控操作面对,保障了用户数据的安全性,提高了云平台运行的稳定性,并且降低了运营成本,提高了云平台在同类产品中的竞争力。
下面对本发明提供的方法作进一步说明:
在云平台运行节点上安装监控Agent,该Agent采用Python脚本开发,主要收集信息包括:当前节点的物理资源使用情况(CPU、内存、磁盘),云平台组件服务状态,组件可以为数据库mysql、消息中间件RabbitMQ、内存数据库Redis、Web中间件Tomcat等云平台数据库mysql连接信息以及死锁信息和事务信息。
节点上的Agent收集当前节点的运行情况,可以使用Linux操作系统自身的定时任务定时执行Agent脚本、输出监控信息到特定的监控文件中;并在检测到异常信息时,通知系统管理员云平台当前运行节点异常信息,可以将监控文件分析和分析报告通过短信、邮件、微信的方式通知系统管理员。
节点在检测到异常信息时,可以执行修复流程,包括:对组件进行重启;对数据库的连接进行处理。
下面以本发明提供的应用实例作进一步说明:
在云平台运行节点上安装监控脚本Agent、Agent收集当前的运行情况、通知系统管理员云平台节点异常信息、异常监控的自我修复(修复组件状态、处理mysql死锁和长连接事务)。主要包括如下几个步骤:
步骤1.通过安装脚本在云平台的运行节点上安装监控Agent,完成之后执行步骤2;
步骤2.在云平台的运行节点上使用Linux系统自带的定时任务配置监控 Agent定时执行,设置完成之后执行步骤3;
步骤3.定时收集当前节点的物理资源使用情况(CPU、内存、磁盘),云平台组件(数据库mysql、消息中间件RabbitMQ、内存数据库Redis、Web 中间件Tomcat等)服务状态,云平台数据库mysql连接信息以及死锁信息和事务信息,并且输出到特定的监控文件中,完成之后执行步骤4;
步骤4.通知系统管理员云平台当前运行节点的异常信息,完成之后执行步骤5;
步骤5.异常自我修复:修复组件状态(自动重启服务),处理mysql死锁和长连接事务。
本发明应用实施例提供的方法,在云平台运行节点上安装监控脚本Agent、 Agent收集当前的运行情况、通知系统管理员云平台节点异常信息、异常监控的自我修复,不仅保障了用户数据的安全性行,提高了云平台运行的稳定性,并且降低了运营成本,提高了浪潮云平台在同类产品中的竞争力。
图3为本发明提供的一种云平台的服务状态的监控装置的结构图。图3 所示装置包括:
第一获取模块301,用于获取云平台内节点的被监控对象,其中所述被监控对象包括一个或至少两个组件的信息和/或所述节点上数据库的连接;
第一配置模块302,用于为所述节点的被监控对象配置对应的监控策略,其中所述监控策略包括被监控对象上的监控参数以及监控参数对应的告警条件;和/或,数据库的连接对应的监控参数以及异常状态的判断条件;
第二配置模块303,用于为所述节点配置对应的运行脚本,其中所述运行脚本用于执行所述被监控对象的监控策略;
第一发送模块304,用于向所述节点发送所述运行脚本。
在本发明提供的一个示例性实施例中,所述装置还包括:
接收模块,用于在向所述节点发送所述运行脚本之后,接收所述节点发送的告警数据;
确定模块,用于在接收到所述告警数据后,确定所述节点的告警信息对应的告警通知策略,其中所述告警通知策略包括通知人和/或通知方式;
第二发送模块,用于按照所述告警通知策略,发送所述告警信息。
本发明提供的装置实施例,获取云平台内节点的被监控对象,并为所述节点的被监控对象配置对应的监控策略,再为所述节点配置对应的运行脚本,向所述节点发送所述运行脚本,使得节点能够利用运行脚本进行节点的监控操作,保障了用户数据的安全性,提高了云平台运行的稳定性,并且降低了运营成本,提高了云平台在同类产品中的竞争力。
图4为本发明提供的另一种云平台的服务状态的监控装置的结构图。图4 所示装置包括:
第二获取模块401,用于获取云平台发送的运行脚本,其中所述运行脚本用于执行组件监控策略,所述监控策略包括被监控对象上的监控参数以及监控参数对应的告警条件;和/或,数据库的连接对应的监控参数以及异常状态的判断条件;
安装模块402,用于执行所述运行脚本的安装操作;
第三获取模块403,用于利用所述运行脚本获取所述监控策略中被监控对象的状态信息。
在本发明提供的一个示例性实施例中,所述装置还包括:
第三发送模块,用于在获取的监控对象的状态信息达到所述告警条件或者异常状态的判断条件后,向云平台发送告警数据。
在本发明提供的一个示例性实施例中,所述装置还包括:
第一处理模块,用于在利用所述运行脚本获取所述监控策略中被监控对象的状态信息之后,如果获取的监控对象的状态信息达到所述告警条件,对所述组件进行如下操作,包括:对所述组件进行重启操作;或者,判断所述组件是否处在响应用户操作的过程中,如果是,则提示用户对所述组件进行重启操作,在得到用户的确认信息后,重启所述组件;否则,直接重启所述组件;
和/或,
第二处理模块,用于在利用所述运行脚本获取所述监控策略中被监控对象的状态信息之后,如果获取的监控对象的状态信息达到所述异常状态的判断条件,获取所述数据库发生的异常事件的描述信息,根据异常事件的描述信息,确定与所述异常事件对应的数据库连接,停止所述数据库连接的访问。
本发明提供的装置实施例,通过获取云平台发送的运行脚本,执行所述运行脚本的安装操作,并利用所述运行脚本获取所述监控策略中被监控对象的状态信息,实现利用运行脚本进行节点的监控操作面对,保障了用户数据的安全性,提高了云平台运行的稳定性,并且降低了运营成本,提高了云平台在同类产品中的竞争力。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质) 和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。

Claims (10)

1.一种云平台的服务状态的监控方法,其特征在于,包括:
获取云平台内节点的被监控对象,其中所述被监控对象包括一个或至少两个组件的信息和/或所述节点上数据库的连接;
为所述节点的被监控对象配置对应的监控策略,其中所述监控策略包括被监控对象上的监控参数以及监控参数对应的告警条件;和/或,数据库的连接对应的监控参数以及异常状态的判断条件;
为所述节点配置对应的运行脚本,其中所述运行脚本用于执行所述被监控对象的监控策略;
向所述节点发送所述运行脚本。
2.根据权利要求1所述的方法,其特征在于,所述向所述节点发送所述运行脚本之后,所述方法还包括:
接收所述节点发送的告警数据;
在接收到所述告警数据后,确定所述节点的告警信息对应的告警通知策略,其中所述告警通知策略包括通知人和/或通知方式;
按照所述告警通知策略,发送所述告警信息。
3.一种云平台的服务状态的监控方法,其特征在于,包括:
获取云平台发送的运行脚本,其中所述运行脚本用于执行组件监控策略,所述监控策略包括被监控对象上的监控参数以及监控参数对应的告警条件;和/或,数据库的连接对应的监控参数以及异常状态的判断条件;
执行所述运行脚本的安装操作;
利用所述运行脚本获取所述监控策略中被监控对象的状态信息。
4.根据权利要求3所述的方法,其特征在于,所述利用所述运行脚本获取所述监控策略中被监控对象的状态信息之后,所述方法还包括:
在获取的监控对象的状态信息达到所述告警条件或者异常状态的判断条件后,向云平台发送告警数据。
5.根据权利要求3或4所述的方法,其特征在于,所述利用所述运行脚本获取所述监控策略中被监控对象的状态信息之后,所述方法还包括:
在获取的监控对象的状态信息达到所述告警条件后,对所述组件进行如下操作,包括:对所述组件进行重启操作;或者,判断所述组件是否处在响应用户操作的过程中,如果是,则提示用户对所述组件进行重启操作,在得到用户的确认信息后,重启所述组件;否则,直接重启所述组件;
和/或,
在获取的监控对象的状态信息达到所述异常状态的判断条件后,获取所述数据库发生的异常事件的描述信息,根据异常事件的描述信息,确定与所述异常事件对应的数据库连接,停止所述数据库连接的访问。
6.一种云平台的服务状态的监控装置,其特征在于,包括:
第一获取模块,用于获取云平台内节点的被监控对象,其中所述被监控对象包括一个或至少两个组件的信息和/或所述节点上数据库的连接;
第一配置模块,用于为所述节点的被监控对象配置对应的监控策略,其中所述监控策略包括被监控对象上的监控参数以及监控参数对应的告警条件;和/或,数据库的连接对应的监控参数以及异常状态的判断条件;
第二配置模块,用于为所述节点配置对应的运行脚本,其中所述运行脚本用于执行所述被监控对象的监控策略;
第一发送模块,用于向所述节点发送所述运行脚本。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
接收模块,用于在向所述节点发送所述运行脚本之后,接收所述节点发送的告警数据;
确定模块,用于在接收到所述告警数据后,确定所述节点的告警信息对应的告警通知策略,其中所述告警通知策略包括通知人和/或通知方式;
第二发送模块,用于按照所述告警通知策略,发送所述告警信息。
8.一种云平台的服务状态的监控装置,其特征在于,包括:
第二获取模块,用于获取云平台发送的运行脚本,其中所述运行脚本用于执行组件监控策略,所述监控策略包括被监控对象上的监控参数以及监控参数对应的告警条件;和/或,数据库的连接对应的监控参数以及异常状态的判断条件;
安装模块,用于执行所述运行脚本的安装操作;
第三获取模块,用于利用所述运行脚本获取所述监控策略中被监控对象的状态信息。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第三发送模块,用于在获取的监控对象的状态信息达到所述告警条件或者异常状态的判断条件后,向云平台发送告警数据。
10.根据权利要求8或9所述的装置,其特征在于,所述装置还包括:
第一处理模块,用于在利用所述运行脚本获取所述监控策略中被监控对象的状态信息之后,如果获取的监控对象的状态信息达到所述告警条件,对所述组件进行如下操作,包括:对所述组件进行重启操作;或者,判断所述组件是否处在响应用户操作的过程中,如果是,则提示用户对所述组件进行重启操作,在得到用户的确认信息后,重启所述组件;否则,直接重启所述组件;
和/或,
第二处理模块,用于在利用所述运行脚本获取所述监控策略中被监控对象的状态信息之后,如果获取的监控对象的状态信息达到所述异常状态的判断条件,获取所述数据库发生的异常事件的描述信息,根据异常事件的描述信息,确定与所述异常事件对应的数据库连接,停止所述数据库连接的访问。
CN201811305317.0A 2018-11-05 2018-11-05 云平台的服务状态的监控方法和装置 Pending CN109245966A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811305317.0A CN109245966A (zh) 2018-11-05 2018-11-05 云平台的服务状态的监控方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811305317.0A CN109245966A (zh) 2018-11-05 2018-11-05 云平台的服务状态的监控方法和装置

Publications (1)

Publication Number Publication Date
CN109245966A true CN109245966A (zh) 2019-01-18

Family

ID=65076902

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811305317.0A Pending CN109245966A (zh) 2018-11-05 2018-11-05 云平台的服务状态的监控方法和装置

Country Status (1)

Country Link
CN (1) CN109245966A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110806963A (zh) * 2019-11-13 2020-02-18 浪潮云信息技术有限公司 一种基于浪潮云数据库的实例信息监控及可视化展示方法
CN112579560A (zh) * 2020-08-21 2021-03-30 中国科学院国家授时中心 一种监测控制管理系统及方法
CN112714030A (zh) * 2021-03-24 2021-04-27 腾讯科技(深圳)有限公司 告警方法、装置、设备及计算机可读存储介质
CN112799919A (zh) * 2021-04-13 2021-05-14 上海钐昆网络科技有限公司 数据监控方法、装置、设备及计算机存储介质
CN112969151A (zh) * 2021-04-30 2021-06-15 中国银行股份有限公司 一种短信监控方法、装置及设备
CN113468159A (zh) * 2021-07-19 2021-10-01 广东电网有限责任公司 一种数据应用全链路管控方法及系统
CN113535521A (zh) * 2021-07-28 2021-10-22 中国建设银行股份有限公司 一种数据监控方法及装置
CN114650218A (zh) * 2020-12-17 2022-06-21 中移(苏州)软件技术有限公司 一种数据获取方法、设备、系统及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150154039A1 (en) * 2013-12-03 2015-06-04 Vmware, Inc. Methods and apparatus to automatically configure monitoring of a virtual machine
CN105516293A (zh) * 2015-12-03 2016-04-20 国家电网公司 一种智能变电站云资源监控系统
CN106095641A (zh) * 2016-06-12 2016-11-09 浪潮电子信息产业股份有限公司 一种监控方法、装置和系统
CN107491375A (zh) * 2017-08-18 2017-12-19 国网山东省电力公司信息通信公司 一种云计算环境下的设备检测及故障预警系统及方法
CN108418697A (zh) * 2017-02-09 2018-08-17 南京联成科技发展有限公司 一种智能化的安全运维服务云平台的实现架构

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150154039A1 (en) * 2013-12-03 2015-06-04 Vmware, Inc. Methods and apparatus to automatically configure monitoring of a virtual machine
CN105516293A (zh) * 2015-12-03 2016-04-20 国家电网公司 一种智能变电站云资源监控系统
CN106095641A (zh) * 2016-06-12 2016-11-09 浪潮电子信息产业股份有限公司 一种监控方法、装置和系统
CN108418697A (zh) * 2017-02-09 2018-08-17 南京联成科技发展有限公司 一种智能化的安全运维服务云平台的实现架构
CN107491375A (zh) * 2017-08-18 2017-12-19 国网山东省电力公司信息通信公司 一种云计算环境下的设备检测及故障预警系统及方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110806963A (zh) * 2019-11-13 2020-02-18 浪潮云信息技术有限公司 一种基于浪潮云数据库的实例信息监控及可视化展示方法
CN112579560A (zh) * 2020-08-21 2021-03-30 中国科学院国家授时中心 一种监测控制管理系统及方法
CN114650218A (zh) * 2020-12-17 2022-06-21 中移(苏州)软件技术有限公司 一种数据获取方法、设备、系统及存储介质
CN114650218B (zh) * 2020-12-17 2023-12-12 中移(苏州)软件技术有限公司 一种数据获取方法、设备、系统及存储介质
CN112714030A (zh) * 2021-03-24 2021-04-27 腾讯科技(深圳)有限公司 告警方法、装置、设备及计算机可读存储介质
CN112799919A (zh) * 2021-04-13 2021-05-14 上海钐昆网络科技有限公司 数据监控方法、装置、设备及计算机存储介质
CN112969151A (zh) * 2021-04-30 2021-06-15 中国银行股份有限公司 一种短信监控方法、装置及设备
CN112969151B (zh) * 2021-04-30 2022-03-29 中国银行股份有限公司 一种短信监控方法、装置及设备
CN113468159A (zh) * 2021-07-19 2021-10-01 广东电网有限责任公司 一种数据应用全链路管控方法及系统
CN113535521A (zh) * 2021-07-28 2021-10-22 中国建设银行股份有限公司 一种数据监控方法及装置

Similar Documents

Publication Publication Date Title
CN109245966A (zh) 云平台的服务状态的监控方法和装置
US10956849B2 (en) Microservice auto-scaling for achieving service level agreements
US9921877B2 (en) Intelligent auto-scaling
US20170048110A1 (en) Dynamic Virtual Network Topology Discovery Engine
US11140029B1 (en) Server side filtering in hybrid cloud environments
US10536348B2 (en) Operational micro-services design, development, deployment
CN102571498B (zh) 故障注入控制方法和装置
US20140095694A1 (en) Systems and methods for installing, managing, and provisioning applications
CN111008026B (zh) 集群管理方法、装置及系统
CN104935621A (zh) 一种远程监控系统及远程监控方法
US10848839B2 (en) Out-of-band telemetry data collection
CN110716842A (zh) 集群故障检测方法和装置
CN112968789A (zh) 数据采集方法、装置、计算机设备及计算机可读介质
US20220182851A1 (en) Communication Method and Apparatus for Plurality of Administrative Domains
US10122602B1 (en) Distributed system infrastructure testing
CN105306234A (zh) 设备监控方法及装置
CN112887355B (zh) 异常服务器的业务处理方法及装置
CN110008092B (zh) 一种虚拟机安全监控方法、装置、设备及可读存储介质
CN113760634A (zh) 一种数据处理方法和装置
CN115190052A (zh) 一种长连接的管理方法、系统和控制单元
CN116032728A (zh) 用于微服务环境的智能访问方法、系统
CN113656239A (zh) 针对中间件的监控方法、装置及计算机程序产品
WO2018173698A1 (ja) 監視システム、コンピュータ可読記憶媒体および監視方法
CN112714035A (zh) 监控方法及系统
CN112860504A (zh) 监控方法及装置、计算机存储介质、电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190118