CN112162912A - 一种云资源监控方法及系统 - Google Patents

一种云资源监控方法及系统 Download PDF

Info

Publication number
CN112162912A
CN112162912A CN202011147486.3A CN202011147486A CN112162912A CN 112162912 A CN112162912 A CN 112162912A CN 202011147486 A CN202011147486 A CN 202011147486A CN 112162912 A CN112162912 A CN 112162912A
Authority
CN
China
Prior art keywords
data
module
monitoring
cloud resource
alarm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011147486.3A
Other languages
English (en)
Inventor
宁明晓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Big Data Technologies Co Ltd
Original Assignee
New H3C Big Data Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New H3C Big Data Technologies Co Ltd filed Critical New H3C Big Data Technologies Co Ltd
Priority to CN202011147486.3A priority Critical patent/CN112162912A/zh
Publication of CN112162912A publication Critical patent/CN112162912A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • G06Q10/063114Status monitoring or status determination for a person or group

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Computing Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请涉及云计算技术领域,特别涉及一种云资源监控方法及系统。该云资源监控系统包括若干数据采集模块,数据处理模块,告警模块,预测模块和数据库,其中,数据采集模块获取对应的目标云资源的监控数据,并针对该监控数据添加用于标识该目标云资源的标识;数据处理模块基于预设的数据采集方式采集该监控数据,并将该监控数据存储至该数据库;数据处理模块基于用户自定义的告警规则,判断该监控数据中是否存在满足任一告警规则的目标监控数据,若存在,则生成对应的告警信息,并将该告警信息发送至告警模块;预测模块基于该目标云资源的历史监控数据,对该云资源的各资源使用情况进行预测,并将预测结果发送至该告警模块。

Description

一种云资源监控方法及系统
技术领域
本申请涉及云计算技术领域,特别涉及一种云资源监控方法及系统。
背景技术
在云计算平台中,资源的监控告警是确保云平台稳定运行的重要方式之一。随着系统复杂程度的不断提升对监控系统也提出了越来越高的要求,需要监控的对象也越来越多。主要包含网络监控,应用监控,服务器基础资源监控,中间件监控等。
常见的云资源监控系统由数据采集系统和数据处理系统组成。其中数据采集系统主要负责资源监控数据的采集,筛选,汇总,存储。数据处理系统负责数据的分析,展示,告警触发等。
目前,常见的云资源监控系统都是基于单个指标进行监控的,例如云主机的cpu利用率较高,运维人员无法根据单个指标准确的判断资源占用过高的原因;云资源告警都是在发生故障后触发的,无法对故障进行预测。没有统一的标准,扩展性差,不易集成到第三方系统中;只会根据静态配置文件去采集特定的服务,如果服务发生迁移、更换地址或者端口,需要手动配置新的配置文件。
发明内容
本申请提供了一种云资源监控方法及系统,用以解决现有技术中存在的监控指标单一,无法准确进行故障定位,且无法进行故障预测的问题。
第一方面,本申请提供了一种云资源监控方法,应用于云资源监控系统,所述云资源监控系统包括若干数据采集模块,数据处理模块,告警模块,预测模块和数据库,所述方法包括:
数据采集模块获取对应的目标云资源的监控数据,并针对所述监控数据添加用于标识所述目标云资源的标识;
数据处理模块基于预设的数据采集方式采集所述监控数据,并将所述监控数据存储至所述数据库;
数据处理模块基于用户自定义的告警规则,判断所述监控数据中是否存在满足任一告警规则的目标监控数据,若存在,则生成对应的告警信息,并将所述告警信息发送至告警模块,以使得所述告警模块将所述告警信息推送给用户;
预测模块基于所述目标云资源的历史监控数据,对所述云资源的各资源使用情况进行预测,并将预测结果发送至所述告警模块,以使得所述告警模块将所述预测信息推送给用户。
可选地,若所述预设的数据采集方式为推送模式,则所述数据处理模块基于预设的数据采集方式采集所述监控数据的步骤包括:
所述数据处理模块接收所述数据采集模块推送的所述监控数据,其中,所述数据采集模块在获取到所述目标云资源的监控数据后,将获取到的监控数据发送给所述数据处理模块。
可选地,若所述预设的数据采集模块为拉取模式,则所述数据处理模块基于预设的数据采集方式采集所述监控数据的步骤包括:
所述数据处理模块基于所述目标云资源的地址信息向所述数据采集模块发送数据获取请求,以从所述数据采集模块获取所述监控数据。
可选地,所述数据处理模块基于所述目标云资源的地址信息向所述数据采集模块发送数据获取请求的步骤包括:
所述数据处理模块基于基于所述目标云资源的地址信息,通过HTTP协议向所述数据采集模块发送GET请求,以使得所述数据采集模块基于所述GET请求向所述数据处理模块发送对应的监控数据,其中,所述GET请求携带有所需的监控数据信息。
可选地,所述云资源监控系统还包括服务发现模块;
若所述预设的数据采集模块为拉取模式,则所述服务发现模块在确定所述目标云资源接入所述云资源监控系统时,通过静态配置方式/动态获取方式获取所述目标云资源的地址信息。
第二方面,本申请提供了一种云资源监控系统,所述云资源监控系统包括若干数据采集模块,数据处理模块,告警模块,预测模块和数据库,所述方法包括:
数据采集模块获取对应的目标云资源的监控数据,并针对所述监控数据添加用于标识所述目标云资源的标识;
数据处理模块基于预设的数据采集方式采集所述监控数据,并将所述监控数据存储至所述数据库;
数据处理模块基于用户自定义的告警规则,判断所述监控数据中是否存在满足任一告警规则的目标监控数据,若存在,则生成对应的告警信息,并将所述告警信息发送至告警模块,以使得所述告警模块将所述告警信息推送给用户;
预测模块基于所述目标云资源的历史监控数据,对所述云资源的各资源使用情况进行预测,并将预测结果发送至所述告警模块,以使得所述告警模块将所述预测信息推送给用户。
可选地,若所述预设的数据采集方式为推送模式,则所述数据处理模块基于预设的数据采集方式采集所述监控数据的步骤包括:
所述数据处理模块接收所述数据采集模块推送的所述监控数据,其中,所述数据采集模块在获取到所述目标云资源的监控数据后,获取到的监控数据发送给所述数据处理模块。
可选地,若所述预设的数据采集模块为拉取模式,则所述数据处理模块基于预设的数据采集方式采集所述监控数据的步骤包括:
所述数据处理模块基于所述目标云资源的地址信息向所述数据采集模块发送数据获取请求,以从所述数据采集模块获取所述监控数据。
可选地,所述数据处理模块基于所述目标云资源的地址信息向所述数据采集模块发送数据获取请求的步骤包括:
所述数据处理模块基于基于所述目标云资源的地址信息,通过HTTP协议向所述数据采集模块发送GET请求,以使得所述数据采集模块基于所述GET请求向所述数据处理模块发送对应的监控数据,其中,所述GET请求携带有所需的监控数据信息。
可选地,所述云资源监控系统还包括服务发现模块;
若所述预设的数据采集模块为拉取模式,则所述服务发现模块在确定所述目标云资源接入所述云资源监控系统时,通过静态配置方式/动态获取方式获取所述目标云资源的地址信息。
第三方面,本申请实施例提供一种云资源监控装置,应用于云资源监控系统,所述云资源监控系统包括若干数据采集模块,数据处理模块,告警模块,预测模块和数据库,该云资源监控装置包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行如上述第一方面中任一项所述的方法的步骤。
第四方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使所述计算机执行如上述第一方面中任一项所述方法的步骤。
综上可知,本申请实施例提供的云资源监控方法,应用于云资源监控系统,所述云资源监控系统包括若干数据采集模块,数据处理模块,告警模块,预测模块和数据库,所述方法包括:数据采集模块获取对应的目标云资源的监控数据,并针对所述监控数据添加用于标识所述目标云资源的标识;数据处理模块基于预设的数据采集方式采集所述监控数据,并将所述监控数据存储至所述数据库;数据处理模块基于用户自定义的告警规则,判断所述监控数据中是否存在满足任一告警规则的目标监控数据,若存在,则生成对应的告警信息,并将所述告警信息发送至告警模块,以使得所述告警模块将所述告警信息推送给用户;预测模块基于所述目标云资源的历史监控数据,对所述云资源的各资源使用情况进行预测,并将预测结果发送至所述告警模块,以使得所述告警模块将所述预测信息推送给用户。
采用本申请实施例提供的云资源监控方法,可以支持多维度的资源监控,便于故障定位,且各模块可以独立部署,扩展较好,易集成至第三方软件中,进一步地,还可以基于当前采集到的目标云资源的监控数据和/或数据库中目标云资源的历史监控数据进行故障预测。
附图说明
为了更加清楚地说明本申请实施例或者现有技术中的技术方案,下面将对本申请实施例或者现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据本申请实施例的这些附图获得其他的附图。
图1为本申请实施例提供的一种云资源监控方法的详细流程图;
图2为本申请实施例提供的一种云资源监控系统的结构示意图;
图3为本申请实施例提供的一种云资源监控装置的结构示意图。
具体实施方式
在本申请实施例使用的术语仅仅是出于描述特定实施例的目的,而非限制本申请。本申请和权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其它含义。还应当理解,本文中使用的术语“和/或”是指包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请实施例可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,此外,所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
示例性的,参阅图1所示,为本申请实施例提供的一种……方法的详细流程图,该方法应用于云资源监控系统,所述云资源监控系统包括若干数据采集模块,数据处理模块,告警模块,预测模块和数据库,该方法包括以下步骤:
步骤100:数据采集模块获取对应的目标云资源的监控数据,并针对所述监控数据添加用于标识所述目标云资源的标识。
实际应用中,数据采集模块可以是一个组件/软件,其可以安装在云资源(如,云主机)上,也可以安装在可以与云资源进行网络通信的设备上,数据采集模块可以采集对应的云资源的监控数据,具体地,可以采集对应的云资源的性能数据(如,CPU使用率,内存使用率,可用磁盘大小等数据),状态数据(如,节点为主节点/备节点)等。
进一步地,数据采集模块在采集到一个云资源的监控数据之后,可以针对该监控数据添加对应的云资源的标识。例如{node_name=node1,node_zone=beijing}表示该数据是北京地区,名称为node1的云资源的监控数据。可选地,该监控数据为标准的json数据。
步骤110:数据处理模块基于预设的数据采集方式采集上述监控数据,并将上述监控数据存储至上述数据库。
本申请实施例中,数据采集方式可以包括推送模式(即数据采集模块主动将采集到的数据推送给数据处理模块)和拉取模式(数据处理模块基于预设规则从数据采集模块获取数据)。
那么,第一种情况为:若上述预设的数据采集方式为推送模式,则上述数据处理模块基于预设的数据采集方式采集上述监控数据的步骤包括:上述数据处理模块接收上述数据采集模块推送的上述监控数据,其中,上述数据采集模块在获取到上述目标云资源的监控数据后,将获取到的监控数据发送给上述数据处理模块。
较佳地,数据采集模块将采集到的监控数据通过post请求发送给推送网关,由推送网关将该监控数据转发至数据处理模块。
第二种情况为:若上述预设的数据采集模块为拉取模式,则上述数据处理模块基于预设的数据采集方式采集上述监控数据的步骤包括:上述数据处理模块基于上述目标云资源的地址信息向上述数据采集模块发送数据获取请求,以从上述数据采集模块获取上述监控数据。
较佳地,本申请实施例中,上述数据处理模块基于上述目标云资源的地址信息向上述数据采集模块发送数据获取请求时,一种较佳地实现方式为,上述数据处理模块基于基于上述目标云资源的地址信息,通过HTTP协议向上述数据采集模块发送GET请求,以使得上述数据采集模块基于上述GET请求向上述数据处理模块发送对应的监控数据,其中,上述GET请求携带有所需的监控数据信息。
进一步地,本申请实施例中,云资源监控系统还可以包括服务发现模块,若所述预设的数据采集模块为拉取模式,则所述服务发现模块在确定所述目标云资源接入所述云资源监控系统时,通过静态配置方式/动态获取方式获取所述目标云资源的地址信息。
也就是说,在新增一个云资源时,若配置的该云资源的数据采集模式为拉取模式,或者,在将一个云资源的数据采集模块由推送模式调整为拉取模式时,云资源监控系统的数据处理模块需要知道该云资源的地址信息,以便后续与该云资源进行通信,从该云资源处采集所需的监控数据。
具体地,服务发现可以包含两种方式:静态配置方式和动态获取方式。其中静态配置方式主要用来发现固定的监控环境,例如,云资源固定的ip,固定的域名等。这种方式直接在服务发现模块里添加相应的配置文件,服务发现模块根据配置文件的配置信息获取待监控的服务的地址信息。动态服务发现主要适用于云环境下经常动态改变的服务的发现,常见的动态服务发现的方式包括:DNS,Consul等。
若数据采集模式为拉取模式,那么,数据处理模块即可基于用户需求(用户配置),按照预设的周期,周期性的从数据采集模块获取指定类型的监控数据,
例如,为保证采集的性能,对每个采集点单独启动一个独立的线程或者进程去采集数据。数据处理模块还包括检索服务,即还支持标签筛选功能,能够根据用户配置采集只包含特定标签的数据,这样既可以节省大量存储空间,还能够提高查询效率。最后将采集到的数据实时的存储到数据库中。
步骤120:数据处理模块基于用户自定义的告警规则,判断所述监控数据中是否存在满足任一告警规则的目标监控数据,若存在,则生成对应的告警信息,并将所述告警信息发送至告警模块,以使得所述告警模块将所述告警信息推送给用户。
本申请实施例中,数据处理模块还包括告警推送服务,该告警推送服务支持手动配置告警规则,然后根据告警规则定期的去检索数据库,当发现满足告警规则的告警时,告警推送服务把告警信息推送给告警模块。
本申请实施例中,告警模块主要包含告警去重服务,分组,然后发送告警通知给相关接收模块。常见的接收模块包含电子邮箱,webhook接收器、第三方聊天软件等。
可选地,本申请实施例中,数据处理模块还可以包括Http server,其主要负责提供检索数据库的http接口功能,外部接口通过标准的http接口可以检索不同资源,不同维度,不同时间的目标的监控信息。如,通过Http server从数据库中获取任一云主机的cpu使用情况,并通过Web界面展示该云主机的历史cpu使用率曲线图。
步骤130:预测模块基于所述目标云资源的历史监控数据,对所述云资源的各资源使用情况进行预测,并将预测结果发送至所述告警模块,以使得所述告警模块将所述预测信息推送给用户。
具体地,本申请实施例中,预测模块主要是通过检索目标的监控数据,利用相应的算法进行告警预测。例如,针对磁盘空间这一常规的随时间增加的数据,利用多元线性回归算法可以预测磁盘空间将会在某个时刻用尽,然后向告警模块发出告警,以提示用户。
下面结合具体应用场景对本申请实施例提供的云资源监控系统的结构进行详细说明。示例性的,参阅图2所示,为本申请实施例提供的一种云资源监控系统的结构示意图,该云资源监控系统包括若干数据采集模块20,数据处理模块21,告警模块22,预测模块23和数据库24,其中,
数据采集模块20获取对应的目标云资源的监控数据,并针对所述监控数据添加用于标识所述目标云资源的标识;
数据处理模块21基于预设的数据采集方式采集所述监控数据,并将所述监控数据存储至所述数据库24;
数据处理模块21基于用户自定义的告警规则,判断所述监控数据中是否存在满足任一告警规则的目标监控数据,若存在,则生成对应的告警信息,并将所述告警信息发送至告警模块22,以使得所述告警模块22将所述告警信息推送给用户;
预测模块23基于所述目标云资源的历史监控数据,对所述云资源的各资源使用情况进行预测,并将预测结果发送至所述告警模块22,以使得所述告警模块22将所述预测信息推送给用户。
可选地,若所述预设的数据采集方式为推送模式,则所述数据处理模块21基于预设的数据采集方式采集所述监控数据的步骤包括:
所述数据处理模块21接收所述数据采集模块20推送的所述监控数据,其中,所述数据采集模块20在获取到所述目标云资源的监控数据后,将获取到的监控数据发送给所述数据处理模块21。
可选地,若所述预设的数据采集模块20为拉取模式,则所述数据处理模块21基于预设的数据采集方式采集所述监控数据的步骤包括:
所述数据处理模块21基于所述目标云资源的地址信息向所述数据采集模块20发送数据获取请求,以从所述数据采集模块20获取所述监控数据。
可选地,所述数据处理模块21基于所述目标云资源的地址信息向所述数据采集模块20发送数据获取请求的步骤包括:
所述数据处理模块21基于基于所述目标云资源的地址信息,通过HTTP协议向所述数据采集模块20发送GET请求,以使得所述数据采集模块20基于所述GET请求向所述数据处理模块21发送对应的监控数据,其中,所述GET请求携带有所需的监控数据信息。
可选地,所述云资源监控系统还包括服务发现模块25;
若所述预设的数据采集模块20为拉取模式,则所述服务发现模块25在确定所述目标云资源接入所述云资源监控系统时,通过静态配置方式/动态获取方式获取所述目标云资源的地址信息。
本申请实施例中,上述云资源监控系统还可以包括显示模块26,其中,数据处理模块21从数据库24中获取任一云主机的任一历史性能数据(如,CPU使用率,内存使用率,可用磁盘大小等),并通过显示模块26展示该云主机的该任一历史性能数据的曲线图。
以上这些单元可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital singnal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个单元通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些单元可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
进一步地,本申请实施例提供的云资源监控装置,从硬件层面而言,所述云资源监控装置的硬件架构示意图可以参见图3所示,所述云资源监控装置可以包括:存储器30和处理器31,
存储器30用于存储程序指令;处理器31调用存储器30中存储的程序指令,按照获得的程序指令执行上述方法实施例。具体实现方式和技术效果类似,这里不再赘述。
可选地,本申请还提供一种云资源监控装置,包括用于执行上述方法实施例的至少一个处理元件(或芯片)。
可选地,本申请还提供一种程序产品,例如计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令用于使该计算机执行上述方法实施例。
这里,机器可读存储介质可以是任何电子、磁性、光学或其它物理存储装置,可以包含或存储信息,如可执行指令、数据,等等。例如,机器可读存储介质可以是:RAM(RadomAccess Memory,随机存取存储器)、易失存储器、非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、固态硬盘、任何类型的存储盘(如光盘、dvd等),或者类似的存储介质,或者它们的组合。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可以由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其它可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其它可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
而且,这些计算机程序指令也可以存储在能引导计算机或其它可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或者多个流程和/或方框图一个方框或者多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其它可编程数据处理设备上,使得在计算机或者其它可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其它可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (10)

1.一种云资源监控方法,其特征在于,应用于云资源监控系统,所述云资源监控系统包括若干数据采集模块,数据处理模块,告警模块,预测模块和数据库,所述方法包括:
数据采集模块获取对应的目标云资源的监控数据,并针对所述监控数据添加用于标识所述目标云资源的标识;
数据处理模块基于预设的数据采集方式采集所述监控数据,并将所述监控数据存储至所述数据库;
数据处理模块基于用户自定义的告警规则,判断所述监控数据中是否存在满足任一告警规则的目标监控数据,若存在,则生成对应的告警信息,并将所述告警信息发送至告警模块,以使得所述告警模块将所述告警信息推送给用户;
预测模块基于所述目标云资源的历史监控数据,对所述云资源的各资源使用情况进行预测,并将预测结果发送至所述告警模块,以使得所述告警模块将所述预测信息推送给用户。
2.如权利要求1所述的方法,其特征在于,若所述预设的数据采集方式为推送模式,则所述数据处理模块基于预设的数据采集方式采集所述监控数据的步骤包括:
所述数据处理模块接收所述数据采集模块推送的所述监控数据,其中,所述数据采集模块在获取到所述目标云资源的监控数据后,将获取到的监控数据发送给所述数据处理模块。
3.如权利要求1所述的方法,其特征在于,若所述预设的数据采集模块为拉取模式,则所述数据处理模块基于预设的数据采集方式采集所述监控数据的步骤包括:
所述数据处理模块基于所述目标云资源的地址信息向所述数据采集模块发送数据获取请求,以从所述数据采集模块获取所述监控数据。
4.如权利要求3所述的方法,其特征在于,所述数据处理模块基于所述目标云资源的地址信息向所述数据采集模块发送数据获取请求的步骤包括:
所述数据处理模块基于基于所述目标云资源的地址信息,通过HTTP协议向所述数据采集模块发送GET请求,以使得所述数据采集模块基于所述GET请求向所述数据处理模块发送对应的监控数据,其中,所述GET请求携带有所需的监控数据信息。
5.如权利要求3所述的方法,其特征在于,所述云资源监控系统还包括服务发现模块;
若所述预设的数据采集模块为拉取模式,则所述服务发现模块在确定所述目标云资源接入所述云资源监控系统时,通过静态配置方式/动态获取方式获取所述目标云资源的地址信息。
6.一种云资源监控系统,其特征在于,所述云资源监控系统包括若干数据采集模块,数据处理模块,告警模块,预测模块和数据库,所述方法包括:
数据采集模块获取对应的目标云资源的监控数据,并针对所述监控数据添加用于标识所述目标云资源的标识;
数据处理模块基于预设的数据采集方式采集所述监控数据,并将所述监控数据存储至所述数据库;
数据处理模块基于用户自定义的告警规则,判断所述监控数据中是否存在满足任一告警规则的目标监控数据,若存在,则生成对应的告警信息,并将所述告警信息发送至告警模块,以使得所述告警模块将所述告警信息推送给用户;
预测模块基于所述目标云资源的历史监控数据,对所述云资源的各资源使用情况进行预测,并将预测结果发送至所述告警模块,以使得所述告警模块将所述预测信息推送给用户。
7.如权利要求6所述的系统,其特征在于,若所述预设的数据采集方式为推送模式,则所述数据处理模块基于预设的数据采集方式采集所述监控数据的步骤包括:
所述数据处理模块接收所述数据采集模块推送的所述监控数据,其中,所述数据采集模块在获取到所述目标云资源的监控数据后,将获取到的监控数据发送给所述数据处理模块。
8.如权利要求6所述的系统,其特征在于,若所述预设的数据采集模块为拉取模式,则所述数据处理模块基于预设的数据采集方式采集所述监控数据的步骤包括:
所述数据处理模块基于所述目标云资源的地址信息向所述数据采集模块发送数据获取请求,以从所述数据采集模块获取所述监控数据。
9.如权利要求8所述的系统,其特征在于,所述数据处理模块基于所述目标云资源的地址信息向所述数据采集模块发送数据获取请求的步骤包括:
所述数据处理模块基于基于所述目标云资源的地址信息,通过HTTP协议向所述数据采集模块发送GET请求,以使得所述数据采集模块基于所述GET请求向所述数据处理模块发送对应的监控数据,其中,所述GET请求携带有所需的监控数据信息。
10.如权利要求8所述的系统,其特征在于,所述云资源监控系统还包括服务发现模块;
若所述预设的数据采集模块为拉取模式,则所述服务发现模块在确定所述目标云资源接入所述云资源监控系统时,通过静态配置方式/动态获取方式获取所述目标云资源的地址信息。
CN202011147486.3A 2020-10-23 2020-10-23 一种云资源监控方法及系统 Pending CN112162912A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011147486.3A CN112162912A (zh) 2020-10-23 2020-10-23 一种云资源监控方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011147486.3A CN112162912A (zh) 2020-10-23 2020-10-23 一种云资源监控方法及系统

Publications (1)

Publication Number Publication Date
CN112162912A true CN112162912A (zh) 2021-01-01

Family

ID=73864478

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011147486.3A Pending CN112162912A (zh) 2020-10-23 2020-10-23 一种云资源监控方法及系统

Country Status (1)

Country Link
CN (1) CN112162912A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113740636A (zh) * 2021-07-26 2021-12-03 南方电网深圳数字电网研究院有限公司 一种便于扩展的配电网应用状态监测系统和方法
CN113778001A (zh) * 2021-09-28 2021-12-10 上海市大数据股份有限公司 一种适用于应用系统的实时数据监控系统
CN116032021A (zh) * 2023-03-30 2023-04-28 西安热工研究院有限公司 新能源场站一体化监控方法、系统、设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103401699A (zh) * 2013-07-18 2013-11-20 深圳先进技术研究院 一种云数据中心安全监控预警系统及方法
CN107612755A (zh) * 2017-10-31 2018-01-19 郑州云海信息技术有限公司 一种云资源的管理方法及其装置
CN107729219A (zh) * 2017-11-17 2018-02-23 北京联想超融合科技有限公司 基于超融合存储系统的资源监控方法、装置及终端
US20180212843A1 (en) * 2017-01-23 2018-07-26 Electronics And Telecommunications Research Institute Cloud system for supporting big data process and operation method thereof
CN109039714A (zh) * 2018-07-17 2018-12-18 郑州云海信息技术有限公司 云计算系统中资源的管理方法和装置
CN110134488A (zh) * 2018-02-08 2019-08-16 中移(苏州)软件技术有限公司 一种容器应用监控方法及系统
CN111459750A (zh) * 2020-03-18 2020-07-28 平安科技(深圳)有限公司 基于非扁平网络的私有云监控方法、装置、计算机设备及存储介质
CN211321337U (zh) * 2019-12-20 2020-08-21 国铁吉讯科技有限公司 通信系统的监测系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103401699A (zh) * 2013-07-18 2013-11-20 深圳先进技术研究院 一种云数据中心安全监控预警系统及方法
US20180212843A1 (en) * 2017-01-23 2018-07-26 Electronics And Telecommunications Research Institute Cloud system for supporting big data process and operation method thereof
CN107612755A (zh) * 2017-10-31 2018-01-19 郑州云海信息技术有限公司 一种云资源的管理方法及其装置
CN107729219A (zh) * 2017-11-17 2018-02-23 北京联想超融合科技有限公司 基于超融合存储系统的资源监控方法、装置及终端
CN110134488A (zh) * 2018-02-08 2019-08-16 中移(苏州)软件技术有限公司 一种容器应用监控方法及系统
CN109039714A (zh) * 2018-07-17 2018-12-18 郑州云海信息技术有限公司 云计算系统中资源的管理方法和装置
CN211321337U (zh) * 2019-12-20 2020-08-21 国铁吉讯科技有限公司 通信系统的监测系统
CN111459750A (zh) * 2020-03-18 2020-07-28 平安科技(深圳)有限公司 基于非扁平网络的私有云监控方法、装置、计算机设备及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113740636A (zh) * 2021-07-26 2021-12-03 南方电网深圳数字电网研究院有限公司 一种便于扩展的配电网应用状态监测系统和方法
CN113740636B (zh) * 2021-07-26 2024-04-19 南方电网数字平台科技(广东)有限公司 一种便于扩展的配电网应用状态监测系统和方法
CN113778001A (zh) * 2021-09-28 2021-12-10 上海市大数据股份有限公司 一种适用于应用系统的实时数据监控系统
CN116032021A (zh) * 2023-03-30 2023-04-28 西安热工研究院有限公司 新能源场站一体化监控方法、系统、设备及存储介质
CN116032021B (zh) * 2023-03-30 2023-08-25 西安热工研究院有限公司 新能源场站一体化监控方法、系统、设备及存储介质

Similar Documents

Publication Publication Date Title
CN112653586B (zh) 基于全链路监控的时空大数据平台应用性能管理方法
CN112162912A (zh) 一种云资源监控方法及系统
US10353742B2 (en) Tracking large numbers of moving objects in an event processing system
CN104348650B (zh) 网站的监控方法、业务装置及系统
JP2019523952A (ja) ストリーミングデータ分散処理方法及び装置
CN111600746B (zh) 网络故障定位方法、装置及设备
CN112130996A (zh) 数据监控控制系统、方法、装置、电子设备和存储介质
CN108289034A (zh) 一种故障发现方法和装置
US10002075B1 (en) Managing memory resources in a network environment in order to handle querying of logical data structures
CN105306300A (zh) 网络集群实时监控方法和系统
CN110543512B (zh) 一种信息同步方法,装置及系统
CN111314158B (zh) 大数据平台监控方法、装置及设备、介质
CN111258851A (zh) 一种集群的告警方法、装置、设置及存储介质
US20190362016A1 (en) Frequent pattern analysis for distributed systems
CN112511580A (zh) 消息推送的方法、装置、存储介质和设备
CN108399175B (zh) 一种数据存储、查询方法及其装置
CN112433921A (zh) 用于动态埋点的方法及设备
CN105471938B (zh) 服务器负载管理方法及装置
CN110018932B (zh) 一种容器磁盘的监控方法及装置
CN114490527A (zh) 元数据检索方法、系统、终端及存储介质
CN109286532B (zh) 云计算系统中告警信息的管理方法和装置
CN114691445A (zh) 集群故障处理方法、装置、电子设备及可读存储介质
CN111324583B (zh) 一种业务日志的分类方法及装置
US9299112B2 (en) Utilizing social media for information technology capacity planning
CN115373757A (zh) 一种Promethues分片模式下集群监控数据缺失的解决方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210101

RJ01 Rejection of invention patent application after publication