CN111352809A - 一种分布式告警方法、系统及计算机可读存储介质 - Google Patents

一种分布式告警方法、系统及计算机可读存储介质 Download PDF

Info

Publication number
CN111352809A
CN111352809A CN202010152748.9A CN202010152748A CN111352809A CN 111352809 A CN111352809 A CN 111352809A CN 202010152748 A CN202010152748 A CN 202010152748A CN 111352809 A CN111352809 A CN 111352809A
Authority
CN
China
Prior art keywords
monitoring
alarm
database
data
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010152748.9A
Other languages
English (en)
Inventor
逄立业
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202010152748.9A priority Critical patent/CN111352809A/zh
Publication of CN111352809A publication Critical patent/CN111352809A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种分布式告警方法、系统及计算机可读存储介质,该方法包括:分发设备接收多个监控采集设备发送的监控数据;其中,监控数据为时序型数据;分发设备将每个监控采集设备发送的监控数据,发送到每个监控采集设备的IP信息各自对应的第一数据库中存储;每个告警设备根据从各自对应的第一数据库中拉取监控数据,生成告警数据,并将告警数据发送到第二数据库中存储,以利用第二数据库中存储的告警数据进行告警;本发明利用分发设备将监控数据存储到每个告警设备各自对应的第一数据库中存储,实现多个告警设备所需使用的监控数据的分库存储,从而能够对大规模集群进行稳定可靠的监控告警,避免出现丢告警数据的情况。

Description

一种分布式告警方法、系统及计算机可读存储介质
技术领域
本发明涉及监控技术领域,特别涉及一种分布式告警方法、系统及计算机可读存储介质。
背景技术
现有技术中,传统监控多采用关系型数据库作为存储,但是并发能力、读写性能等无法支撑大规模集群。而对于大规模集群,随着主机数量的增加,历史监控数据呈现爆发时的增长,特别是监控频率设置的比较高的时候,例如每秒十万以上监控项的大规模集群监控,传统监控软件(如Zabbix)的后端采用关系型数据,读写性能及计算性能成为瓶颈,使得传统监控并不适合大规模的监控告警。
大数据软件多采用消息队列作为中间件,此方法消息队列作为消息的载体从而进行分发,从而进行分布式告警计算,技术上是一种可行的方案;但是此方案的稳定性很难达到监控系统的要求,而且对运维人员的要求过高,且部署复杂,也很难集成到产品中,所有只有少部分厂商在生产环境使用。
随着时序数据库在监控环境中的应用,很大程度上解决了存储并发能力、读写性能的问题,但是时序数据库不提供分布式订阅方案,导致告警端只能全量订阅监控数据,导致告警端的计算能力产生瓶颈,典型的方案是如图1所示的分布式Telegraf(一个用Go编写的代理程序,可收集系统和服务的统计数据,并写入到InfluxDB数据库)采集+InfluxDB(一个由InfluxData开发的开源时序型数据,由Go写成,着力于高性能地查询与存储)+Kapacitor(一种告警服务)。此方案在大规模集群监控的使用中发现,当监控数据达到2万条/秒时,运行Kapacitor服务的告警端的cpu使用率出现瓶颈,出现丢告警数据的情况。
因此,如何能够对大规模集群进行稳定可靠的监控告警,避免告警数据丢失的情况,提升用户体验,是现今急需解决的问题。
发明内容
本发明的目的是提供一种分布式告警方法、系统及计算机可读存储介质,以对大规模集群进行稳定可靠的监控告警,避免告警数据丢失的情况。
为解决上述技术问题,本发明提供一种分布式告警方法,包括:
分发设备接收多个监控采集设备发送的监控数据;其中,所述监控数据为时序型数据;
所述分发设备将每个所述监控采集设备发送的所述监控数据,发送到每个所述监控采集设备的IP信息各自对应的第一数据库中存储;
每个告警设备根据从各自对应的第一数据库中拉取所述监控数据,生成告警数据,并将所述告警数据发送到第二数据库中存储,以利用所述第二数据库中存储的所述告警数据进行告警。
可选的,所述分发设备将每个所述监控采集设备发送的所述监控数据,发送到每个所述监控采集设备的IP信息各自对应的第一数据库中存储,包括:
所述分发设备对每个所述监控采集设备的IP信息进行一致性hash计算,确定每个所述监控采集设备各自对应的第一数据库;
将每个所述监控采集设备发送的所述监控数据发送到各自对应的第一数据库中存储。
可选的,所述分发设备接收多个监控采集设备发送的监控数据之前,还包括:
每个所述监控采集设备将各自采集的所述监控数据发送到所述分发设备,并将所述监控数据发送到所述第二数据库中存储。
可选的,所述监控数据具体为InfluxDB数据时,所述分发设备将每个所述监控采集设备发送的所述监控数据,发送到每个所述监控采集设备的IP信息各自对应的第一数据库中存储,包括:
所述分发设备运行HAProxy软件,将每个所述监控采集设备发送的所述监控数据,发送到每个所述监控采集设备的IP信息各自对应的第一数据库中存储;
对应的,所述每个告警设备根据从各自对应的第一数据库中拉取所述监控数据,生成告警数据,并将所述告警数据发送到第二数据库中存储,包括:
每个所述告警设备运行Kapacitor服务,根据从各自对应的第一数据库中拉取所述监控数据,生成告警数据,并将所述告警数据发送到第二数据库中存储。
本发明还提供了一种分布式告警系统,包括:
分发设备,用于接收多个监控采集设备发送的监控数据;将每个所述监控采集设备发送的所述监控数据,发送到每个所述监控采集设备的IP信息各自对应的第一数据库中存储;其中,所述监控数据为时序型数据;
多个所述第一数据库,用于存储所述分发设备发送的所述监控数据;
多个所述告警设备,用于根据从各自对应的第一数据库中拉取所述监控数据,生成告警数据,并将所述告警数据发送到第二数据库中存储,以利用所述第二数据库中存储的所述告警数据进行告警;其中,所述告警设备的数量与所述第一数据库的数量相同;
所述第二数据库,用于存储多个所述告警设备发送的所述告警数据。
可选的,所述分发设备具体用于对每个所述监控采集设备的IP信息进行一致性hash计算,确定每个所述监控采集设备各自对应的第一数据库;将每个所述监控采集设备发送的所述监控数据发送到各自对应的第一数据库中存储。
可选的,该系统还包括:
多个所述监控采集设备,用于将各自采集的所述监控数据发送到所述分发设备,并将所述监控数据发送到所述第二数据库中存储;
对应的,所述第二数据库还用于存储多个所述监控采集设备发送的所述监控数据。
可选的,所述监控数据具体为InfluxDB数据时,所述分发设备具体用于运行HAProxy软件,将每个所述监控采集设备发送的所述监控数据,发送到每个所述监控采集设备的IP信息各自对应的第一数据库中存储;
每个所述告警设备具体用于运行Kapacitor服务,根据从各自对应的第一数据库中拉取所述监控数据,生成告警数据,并将所述告警数据发送到第二数据库中存储。
此外,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述的分布式告警方法的步骤。
本发明所提供的一种分布式告警方法,包括:分发设备接收多个监控采集设备发送的监控数据;其中,监控数据为时序型数据;分发设备将每个监控采集设备发送的监控数据,发送到每个监控采集设备的IP信息各自对应的第一数据库中存储;每个告警设备根据从各自对应的第一数据库中拉取监控数据,生成告警数据,并将告警数据发送到第二数据库中存储,以利用第二数据库中存储的告警数据进行告警;
可见,本发明利用分发设备将监控数据存储到每个告警设备各自对应的第一数据库中存储,实现多个告警设备所需使用的监控数据的分库存储,从而能够对大规模集群进行稳定可靠的监控告警,降低每个告警设备的cpu使用率,避免出现丢告警数据的情况;并且利用监控采集设备的IP信息进行监控数据的分库存储,使同一监控采集设备发送的监控数据可以存储到相同的第一数据库,方便后续告警和查询操作。此外,本发明还提供了一种分布式告警系统及计算机可读存储介质,同样具有上述有益效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为现有技术中的告警系统的架构示意图;
图2为本发明实施例所提供的一种分布式告警方法的流程图;
图3为本发明实施例所提供的一种分布式告警系统的结构框图;
图4为本发明实施例所提供的另一种分布式告警系统的架构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图2,图2为本发明实施例所提供的一种分布式告警方法的流程图。
该方法可以包括:
步骤101:分发设备接收多个监控采集设备发送的监控数据;其中,监控数据为时序型数据。
可以理解的是,本步骤中的监控采集设备可以为部署有监控数据的采集软件的设备,即大规模集群的物理节点,如存储系统中的各存储服务器。也就是说,大规模集群的每台物理节点可以部署用于采集时序型数据的监控数据的监控软件程序,如Telegraf,从而在监控软件程序运行时,采集所在物理节点的监控数据,并将其发送到分发设备。
对应的,本步骤中的分发设备可以为部署有对接收的监控数据进行分发的分发软件的设备,如服务器。也就是说,分布式告警系统中的一个服务器可以运行部署分发软件,如HAProxy(一种使用C语言编写的自由及开放源代码软件,其提供高可用性、负载均衡,以及基于TCP和HTTP的应用程序代理服务)软件,从而在监控软件程序运行时,将每个监控采集设备发送的监控数据,发送到每个监控采集设备的IP信息各自对应的第一数据库中存储。
需要说明的是,本实施例并不限定监控软件程序的具体类型,只要监控采集设备可以在运行监控软件程序时,采集数据类型为时序型数据(如InfluxDB数据)的监控数据,并将其发送到分发设备,本实施例对此不做任何限制。
对应的,本实施例中监控采集设备在运行监控软件程序时,不仅可以将采集的监控数据发送到分发设备,还可以将采集的监控数据发送到第二数据库,以便后续前端展现和发送通知。
具体的,如图4所示,监控采集设备(即采集端)的监控软件程序为Telegraf时,可以通过如向下方式,配置Telegraf将采集的监控数据发送至第二数据库(即InfluxDB)和分发设备(HAProxy):
[[outputs.influxdb]]
urls=[“http://监控数据库的ip:port”,”http://haproxy的ip:bindport”]
步骤102:分发设备将每个监控采集设备发送的监控数据,发送到每个监控采集设备的IP信息各自对应的第一数据库中存储。
可以理解的是,本步骤中分发设备在运行分发软件(如HAProxy软件)时,可以将每个监控采集设备发送的监控数据,发送到每个监控采集设备的IP信息各自对应的第一数据库中存储,从而将多个监控采集设备发送的监控数据分发到各自对应的第一数据库中存储,实现监控数据的分库存储。
对应的,对于本步骤中分发设备将每个监控采集设备发送的监控数据,发送到每个监控采集设备的IP信息各自对应的第一数据库的具体方式,即分发设备根据每个监控采集设备的IP信息,将每个监控采集设备发送的监控数据发送到各自对应的第一数据库中存储的具体方式,可以由设计人员自行设置,如分发设备可以对每个监控采集设备的IP信息进行一致性hash计算,确定每个监控采集设备各自对应的第一数据库;将每个监控采集设备发送的监控数据发送到各自对应的第一数据库中存储;如图4所示,分发设备运行HAProxy软件时,可以对监控数据按照原ip(即监控采集设备的IP信息)进行一致性hash,发送至不同的第一数据库(InfluxDB1、InfluxDB2和InfluxDB3)。也就是说,分发设备可以通过监控采集设备的IP信息的一致性hash,确定每个监控采集设备各自对应的第一数据库,即每个监控采集设备对应一个第一数据库,一个第一数据库可以对应多个监控采集设备,从而通过多个第一数据库对全部监控数据分库存储。只要分发设备可以利用监控采集设备的IP信息,确定每个监控采集设备对应的第一数据库,本实施例对此不做任何限制。
具体的,分发设备(即分发端)的监控软件程序为HAProxy软件时,可以根据数据路由至后端的第一数据库。如图3所示,当后端配置3个第一数据库(InfluxDB1、InfluxDB2和InfluxDB3)时,可以采用如下方式配置:listen influxdb
bind ip:bindport
balance source
server 8086influxdb1的ip:influxdb1的端口check inter 2000rise 2fall 5
server 8076influxdb1的ip:influxdb2的端口check inter 2000rise 2fall 5
server 8066influxdb1的ip:influxdb3的端口check inter 2000rise 2fall 5
步骤103:每个告警设备根据从各自对应的第一数据库中拉取监控数据,生成告警数据,并将告警数据发送到第二数据库中存储,以利用第二数据库中存储的告警数据进行告警。
其中,本步骤中告警设备产生的告警数据可以为时序型数据,如InfluxDB数据。本步骤中的每个告警设备可以为部署有从各自对应的一个第一数据库中拉取监控数据进行告警的告警服务的设备,如服务器。也就是说,分布式告警系统中的多个服务器可以分别部署告警服务(如Kapacitor服务),从而在告警服务运行时,分别整库订阅各自对应的一个第一数据库中的监控数据进行处理,并将得到的告警数据发送到第二数据库中存储。也就是说,本实施例中可以设置多个第一数据库和多个告警设备,第一数据库与告警设备一一对应。
具体的,如图4所示,告警设备(即告警端,Kapacitor1、Kapacitor2或Kapacitor3)的监控软件程序为Kapacitor时,可以分别配置第一数据库(订阅库)和第二数据库(告警库),如可以通过如下方式配置第二数据库,将生成的告警数据写入第二数据库:
[[influxdb]]
enabled=true
name="default"
default=true为True会将告警数据写入此库中
disable-subscriptions=true不处理主库(第二数据库)的告警
可以通过如下方式配置第一数据库,从第一数据库拉取监控数据:
[[influxdb]]
enabled=true
name="sub"名字不能与主库相同
default=false为True会将告警数据写入此库中
disable-subscriptions=false处理分库的告警
需要说明的是,本实施例中每个第一数据库可以存储分发设备发送的各自对应的监控采集设备的监控数据。第二数据库可以存储全部告警设备发送的告警数据。为了方便后续前端展现和发送通知,本实施例中第二数据库也可以存储全部监控采集设备发送的监控数据,如图4所示,第二数据库(InfluxDB)可以包括用于存储监控数据的监控库和用于存储告警数据的告警库;即监控采集设备将各自采集的监控数据分别发送到分发设备和第二数据库。
具体的,本实施例中并不限定第一数据库和第二数据库的具体配置,如监控数据的保存时间可以由设计人员根据数据量和运维需求自行设置,而相较于监控数据的保存时间,告警数据的保存时间可以设置较短的时间值。
本实施例中,本发明实施例利用分发设备将监控数据存储到每个告警设备各自对应的第一数据库中存储,实现多个告警设备所需使用的监控数据的分库存储,从而能够对大规模集群进行稳定可靠的监控告警,降低每个告警设备的cpu使用率,避免出现丢告警数据的情况;并且利用监控采集设备的IP信息进行监控数据的分库存储,使同一监控采集设备发送的监控数据可以存储到相同的第一数据库,方便后续告警和查询操作。
请参考图3,图3为本发明实施例所提供的一种分布式告警系统的结构框图。该系统可以包括:
分发设备10,用于接收多个监控采集设备发送的监控数据;将每个监控采集设备发送的监控数据,发送到每个监控采集设备的IP信息各自对应的第一数据库20中存储;其中,监控数据为时序型数据;
多个第一数据库20,用于存储分发设备10发送的监控数据;
多个告警设备30,用于根据从各自对应的第一数据库20中拉取监控数据,生成告警数据,并将告警数据发送到第二数据库40中存储,以利用第二数据库40中存储的告警数据进行告警;其中,告警设备30的数量与第一数据库的数量相同;
第二数据库40,用于存储多个告警设备发送的告警数据。
可选的,分发设备10具体用于对每个监控采集设备的IP信息进行一致性hash计算,确定每个监控采集设备各自对应的第一数据库20;将每个监控采集设备10发送的监控数据发送到各自对应的第一数据库20中存储。
可选的,该系统还包括:
多个监控采集设备,用于将各自采集的监控数据发送到分发设备10,并将监控数据发送到第二数据库40中存储;
对应的,第二数据库40还用于存储多个监控采集设备发送的监控数据。
可选的,监控数据具体为InfluxDB数据时,分发设备10具体用于运行HAProxy软件,将每个监控采集设备发送的监控数据,发送到每个监控采集设备的IP信息各自对应的第一数据库20中存储;
每个告警设备30具体用于运行Kapacitor服务,根据从各自对应的第一数据库20中拉取监控数据,生成告警数据,并将告警数据发送到第二数据库40中存储。
本实施例中,本发明实施例利用分发设备10将监控数据存储到每个告警设备30各自对应的第一数据库20中存储,实现多个告警设备30所需使用的监控数据的分库存储,从而能够对大规模集群进行稳定可靠的监控告警,降低每个告警设备的cpu使用率,避免出现丢告警数据的情况;并且利用监控采集设备的IP信息进行监控数据的分库存储,使同一监控采集设备发送的监控数据可以存储到相同的第一数据库20,方便后续告警和查询操作。
本发明实施例还提供了一种计算机可读存储介质,其上存有计算机程序,该计算机程序被执行时可以实现上述实施例所提供的分布式告警方法的步骤。该存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random AccessMemory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统及计算机可读存储介质而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
以上对本发明所提供的一种分布式告警方法、系统及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (9)

1.一种分布式告警方法,其特征在于,包括:
分发设备接收多个监控采集设备发送的监控数据;其中,所述监控数据为时序型数据;
所述分发设备将每个所述监控采集设备发送的所述监控数据,发送到每个所述监控采集设备的IP信息各自对应的第一数据库中存储;
每个告警设备根据从各自对应的第一数据库中拉取所述监控数据,生成告警数据,并将所述告警数据发送到第二数据库中存储,以利用所述第二数据库中存储的所述告警数据进行告警。
2.根据权利要求1所述的分布式告警方法,其特征在于,所述分发设备将每个所述监控采集设备发送的所述监控数据,发送到每个所述监控采集设备的IP信息各自对应的第一数据库中存储,包括:
所述分发设备对每个所述监控采集设备的IP信息进行一致性hash计算,确定每个所述监控采集设备各自对应的第一数据库;
将每个所述监控采集设备发送的所述监控数据发送到各自对应的第一数据库中存储。
3.根据权利要求1所述的分布式告警方法,其特征在于,所述分发设备接收多个监控采集设备发送的监控数据之前,还包括:
每个所述监控采集设备将各自采集的所述监控数据发送到所述分发设备,并将所述监控数据发送到所述第二数据库中存储。
4.根据权利要求1所述的分布式告警方法,其特征在于,所述监控数据具体为InfluxDB数据时,所述分发设备将每个所述监控采集设备发送的所述监控数据,发送到每个所述监控采集设备的IP信息各自对应的第一数据库中存储,包括:
所述分发设备运行HAProxy软件,将每个所述监控采集设备发送的所述监控数据,发送到每个所述监控采集设备的IP信息各自对应的第一数据库中存储;
对应的,所述每个告警设备根据从各自对应的第一数据库中拉取所述监控数据,生成告警数据,并将所述告警数据发送到第二数据库中存储,包括:
每个所述告警设备运行Kapacitor服务,根据从各自对应的第一数据库中拉取所述监控数据,生成告警数据,并将所述告警数据发送到第二数据库中存储。
5.一种分布式告警系统,其特征在于,包括:
分发设备,用于接收多个监控采集设备发送的监控数据;将每个所述监控采集设备发送的所述监控数据,发送到每个所述监控采集设备的IP信息各自对应的第一数据库中存储;其中,所述监控数据为时序型数据;
多个所述第一数据库,用于存储所述分发设备发送的所述监控数据;
多个所述告警设备,用于根据从各自对应的第一数据库中拉取所述监控数据,生成告警数据,并将所述告警数据发送到第二数据库中存储,以利用所述第二数据库中存储的所述告警数据进行告警;其中,所述告警设备的数量与所述第一数据库的数量相同;
所述第二数据库,用于存储多个所述告警设备发送的所述告警数据。
6.根据权利要求5所述的分布式告警系统,其特征在于,所述分发设备具体用于对每个所述监控采集设备的IP信息进行一致性hash计算,确定每个所述监控采集设备各自对应的第一数据库;将每个所述监控采集设备发送的所述监控数据发送到各自对应的第一数据库中存储。
7.根据权利要求5所述的分布式告警系统,其特征在于,还包括:
多个所述监控采集设备,用于将各自采集的所述监控数据发送到所述分发设备,并将所述监控数据发送到所述第二数据库中存储;
对应的,所述第二数据库还用于存储多个所述监控采集设备发送的所述监控数据。
8.根据权利要求5所述的分布式告警系统,其特征在于,所述监控数据具体为InfluxDB数据时,所述分发设备具体用于运行HAProxy软件,将每个所述监控采集设备发送的所述监控数据,发送到每个所述监控采集设备的IP信息各自对应的第一数据库中存储;
每个所述告警设备具体用于运行Kapacitor服务,根据从各自对应的第一数据库中拉取所述监控数据,生成告警数据,并将所述告警数据发送到第二数据库中存储。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述的分布式告警方法的步骤。
CN202010152748.9A 2020-03-06 2020-03-06 一种分布式告警方法、系统及计算机可读存储介质 Withdrawn CN111352809A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010152748.9A CN111352809A (zh) 2020-03-06 2020-03-06 一种分布式告警方法、系统及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010152748.9A CN111352809A (zh) 2020-03-06 2020-03-06 一种分布式告警方法、系统及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN111352809A true CN111352809A (zh) 2020-06-30

Family

ID=71196065

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010152748.9A Withdrawn CN111352809A (zh) 2020-03-06 2020-03-06 一种分布式告警方法、系统及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111352809A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112950908A (zh) * 2021-02-03 2021-06-11 重庆川仪自动化股份有限公司 一种数据监测预警方法、系统、介质及电子终端
CN115269516A (zh) * 2022-06-30 2022-11-01 北京数美时代科技有限公司 一种日志数据采集管理方法、系统、存储介质和电子设备
WO2023050705A1 (zh) * 2021-09-30 2023-04-06 苏州浪潮智能科技有限公司 一种监控数据管理方法、装置及电子设备和存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112950908A (zh) * 2021-02-03 2021-06-11 重庆川仪自动化股份有限公司 一种数据监测预警方法、系统、介质及电子终端
CN112950908B (zh) * 2021-02-03 2022-12-30 重庆川仪自动化股份有限公司 一种数据监测预警方法、系统、介质及电子终端
WO2023050705A1 (zh) * 2021-09-30 2023-04-06 苏州浪潮智能科技有限公司 一种监控数据管理方法、装置及电子设备和存储介质
CN115269516A (zh) * 2022-06-30 2022-11-01 北京数美时代科技有限公司 一种日志数据采集管理方法、系统、存储介质和电子设备

Similar Documents

Publication Publication Date Title
CN109714192B (zh) 一种监控云平台的监控方法及系统
CN111352809A (zh) 一种分布式告警方法、系统及计算机可读存储介质
CN111049705B (zh) 一种监控分布式存储系统的方法及装置
CN110262807B (zh) 集群创建进度日志采集系统、方法和装置
CN108897854B (zh) 一种超时任务的监控方法和装置
CN101707632A (zh) 一种动态监控服务器集群性能并实时报警的方法
CN111917687B (zh) 一种循环推送提醒消息的方法和装置
CN106656682A (zh) 集群心跳检测方法、系统及装置
US11588890B2 (en) System, method and apparatus having a redundant cluster for processing data
CN110543512B (zh) 一种信息同步方法,装置及系统
US10862988B2 (en) On-demand real-time sensor data distribution system
CN111294218B (zh) 信息处理方法、装置、系统及存储介质
CN112860343B (zh) 配置变更方法、系统、装置、电子设备以及存储介质
CN114048090A (zh) 基于k8s的容器云平台监控的方法、设备及存储介质
CN111274032B (zh) 任务处理系统及方法、存储介质
CN113422808A (zh) 物联网平台http信息推送方法、系统、装置及介质
CN112751689B (zh) 一种网络连通性检测方法、监控服务端和监控代理装置
CN113254245A (zh) 一种存储集群的故障检测方法和系统
CN106230939A (zh) 一种应用运行监控方法及系统
US10237372B2 (en) Scalable programming architecture for telecommunications devices
CN115629909A (zh) 业务数据处理的方法、装置、电子设备和存储介质
CN114168672A (zh) 日志数据的处理方法、装置、系统以及介质
CN114327849A (zh) 一种基于智能监控的资源调度方法
CN109388546B (zh) 处理应用程序的故障的方法、装置和系统
CN113282455A (zh) 一种监控处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20200630