CN117395132B - 一种分布式告警监控方法、系统、存储介质及电子设备 - Google Patents

一种分布式告警监控方法、系统、存储介质及电子设备 Download PDF

Info

Publication number
CN117395132B
CN117395132B CN202311704454.2A CN202311704454A CN117395132B CN 117395132 B CN117395132 B CN 117395132B CN 202311704454 A CN202311704454 A CN 202311704454A CN 117395132 B CN117395132 B CN 117395132B
Authority
CN
China
Prior art keywords
alarm
data
monitoring
distributed
items
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311704454.2A
Other languages
English (en)
Other versions
CN117395132A (zh
Inventor
段义文
许畅
谢月
郭小光
周光雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangxi Yunyan Shijie Technology Co ltd
Original Assignee
Jiangxi Yunyan Shijie Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangxi Yunyan Shijie Technology Co ltd filed Critical Jiangxi Yunyan Shijie Technology Co ltd
Priority to CN202311704454.2A priority Critical patent/CN117395132B/zh
Publication of CN117395132A publication Critical patent/CN117395132A/zh
Application granted granted Critical
Publication of CN117395132B publication Critical patent/CN117395132B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/042Network management architectures or arrangements comprising distributed management centres cooperatively managing the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种分布式告警监控方法、系统、存储介质及电子设备,该方法包括:创建分布式监控网络,通过分布式监控网络从待监控软件处获取监控数据;根据处理加工规则对监控数据进行处理加工;对处理加工后的监控数据进行可视化数据处理,生成可视化媒体供用户查阅;对处理加工后的监控数据进行告警评估处理,以生成告警项目,具体步骤包括:通过分布式监控网络约定设置告警规则,并根据告警规则对符合条件的监控数据进行报警触发,以生成告警数据;将告警数据进行分层,并通过多个接口将分层后的告警数据暴露出去;自动发现暴露出来的告警数据,根据告警数据的分层等级、生成不同等级的告警项目并推送给用户,本发明可以对软件进行监控。

Description

一种分布式告警监控方法、系统、存储介质及电子设备
技术领域
本发明涉及软件监控技术领域,特别涉及一种分布式告警监控方法、系统、存储介质及电子设备。
背景技术
目前成熟的主流监控方案都无法完整的实现分布式存储监控数据,多维度的展示告警信息,并对监控响应人员进行工作审计。现有的优秀监控方案,优势在于,具有完善的生态体系,天然的支持k8s容器化的指标自动发现,有可以独立作为一个时序数据库可以任意拓展多个节点进行分布式存储,且自身具有查询语法对指标进行复杂检索并通过web界面展示,可对监控指标设置告警规则生成监控项。但缺点在于没有用户体系,安全难以保证,web界面功能过一单一无法展示复杂美观的图表,对已触发的告警项无法做跟踪,评论和审计。还有的监控方案,web界面功能丰富,具有完善的用户权限管理功能,可以添加不同的告警媒介对告警项进行推送,支持对已经触发的告警项进行跟踪,评论和审计,可以通过脚本,插件的形式调用接口进行自动发现,但缺点在于,需要开发大量的监控脚本去获取不同服务的监控指标,数据存储依赖常驻数据库,无法做到数据层面的分布式。
本发明对主流监控方案,弃糟取精,实现了分布式存储监控数据,多维度的展示告警信息,并对监控响应人员进行工作审计完整的功能。
发明内容
针对现有技术的不足,本发明的目的在于提供一种分布式告警监控方法,旨在解决上述提到的技术问题。
为了实现上述目的,本发明是通过如下技术方案来实现的:
一种分布式告警监控方法,包括如下步骤:
创建一套分布式监控网络,通过所述分布式监控网络从待监控软件处获取监控数据;
其中,所述分布式监控网络包括多个子节点、及一个或多个主节点,各个所述子节点从所述待监控软件处采集所述监控数据并传输给所述主节点;
根据自定义的处理加工规则对所述监控数据进行处理加工;
对处理加工后的所述监控数据进行可视化数据处理,以生成可视化媒体供用户查阅;
同时对处理加工后的所述监控数据进行告警评估处理,以生成告警项目,并推送给用户;
其中,对处理加工后的所述监控数据进行告警评估处理,以生成告警项目,并推送给用户的具体步骤包括:
通过所述分布式监控网络约定设置告警规则,并根据所述告警规则对符合条件的所述监控数据进行报警触发,以生成告警数据;
将所述告警数据进行多维度分层,并通过所述分布式监控网络的多个接口将分层后的所述告警数据暴露出去;
自动发现从所述分布式监控网络暴露出来的所述告警数据,根据所述告警数据的分层等级、生成不同等级的告警项目并推送给用户。
进一步的,所述将所述告警数据进行多维度分层,并通过所述分布式监控网络的多个接口暴露出去的具体步骤包括:
向所述分布式监控网络发起查询请求,查询当前已生成的所有所述告警数据;
创建一个线程池,并为每个所述线程池配备多个线程;
所述线程逐个将所述告警数据解析为约定格式,其中,所述约定格式中包含了所述告警数据的名称、等级和项目三个信息;
配备N个数据存储篮子,并根据所述告警数据的约定格式中的名称、等级和项目三个信息,将所述告警数据分类存储进不同的所述存储篮子,其中,所述N=项目的个数×等级的个数;
将各所述存储篮子中的所述告警数据暴露出去。
进一步的,所述自动发现从所述分布式监控网络暴露出来的所述告警数据,根据所述告警数据的分层等级、生成不同等级的告警项目并推送给用户的具体步骤包括:
创建自动发现模版,并将所述自动发现模版与所述待监控软件绑定,所述自动发现模版包括多个自动发现规则和监控项自动生成规则,其中,每个所述自动发现规则均对应一种等级的所述告警数据;
通过所述自动发现规则自动发现所述待监控软件指定等级的所述告警数据、并通过所述监控项自动生成规则生成不同等级的所述告警项目。
进一步的,在所述通过所述自动发现规则自动发现所述待监控软件指定等级的所述告警数据、并通过所述监控项自动生成规则生成不同等级的所述告警项目的步骤之后还包括:
给所述监控项自动生成规则生成的所述告警项目创建一个过期时间和恢复表达式,当所述待监控软件的告警项目被修复后,通过所述监控项自动生成规则生成的信息也会自动消失。
进一步的,所述通过所述分布式监控网络约定设置告警规则,并根据所述告警规则对符合条件的所述监控数据进行报警触发,以生成告警数据的步骤之后还包括:
对已生成的所述告警数据进行不同账号备注评论说明、及对特定项目的所述告警数据设置静默期。
进一步的,所述对处理加工后的所述监控数据进行可视化数据处理,以生成可视化媒体供用户查阅的具体步骤包括:
从所述分布式监控网络处提取所有监控数据,并按时间维度生成不同种类的媒体;
自由组合多个不同种类的媒体以生成可视化媒体。
本发明还提供一种分布式告警监控系统,包括:
监控模块:用于创建一套分布式监控网络,通过所述分布式监控网络从待监控软件处获取监控数据,其中,所述分布式监控网络包括多个子节点、及一个或多个主节点,各个所述子节点从所述待监控软件处采集所述监控数据并传输给所述主节点;
处理加工模块:用于根据自定义的处理加工规则对所述监控数据进行处理加工;
展示模块:用于对处理加工后的所述监控数据进行可视化数据处理,以生成可视化媒体供用户查阅;
告警模块:用于对处理加工后的所述监控数据进行告警评估处理,以生成告警项目,并推送给用户;
所述告警模块包括:筛选单元:用于通过所述分布式监控网络约定设置告警规则,并根据所述告警规则对符合条件的所述监控数据进行报警触发,以生成告警数据;
分层单元:用于将所述告警数据进行多维度分层,并通过所述分布式监控网络的多个接口将分层后的所述告警数据暴露出去;
推送单元:用于自动发现从所述分布式监控网络暴露出来的所述告警数据,根据所述告警数据的分层等级、生成不同等级的告警项目并推送给用户。
本发明还提供一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上所述的分布式告警监控方法。
本发明还提供一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的分布式告警监控方法。
与现有技术相比,本发明的有益效果在于:
通过创建分布式监控网络,从多个节点获取待监控软件的监控数据,避免了单个主节点负载过高的问题,并对获取的监控数据进行双重处理,将监控数据进行可视化数据处理,生成可视化媒体如图表的形式供用户查阅,使得用户可以查询到所有待监控软件中监控数据的发展趋势,以作出应对准备,同时将监控数据进行告警评估处理,以生成告警项目,并推送给用户,使得用户可以直观地看到已触发告警的监控数据,其中,告警数据可根据需求,经过多维度分层,分层后的告警数据通过分布式监控网络暴露出,并可供自动发现,然后生成不同等级的告警项目,使用户可以掌握告警数据的重要程度。
附图说明
本发明的所述与/或附加的方面与优点从结合下面附图对实施例的描述中将变得明显与容易理解,其中:
图1为本发明第一实施例中分布式告警监控方法的流程图;
图2为图1中步骤S103a的详细流程图;
图3为图1中步骤S103b的详细流程图;
图4为图3中步骤S103b2的详细流程图;
图5为图3中步骤S103b3的详细流程图;
图6为第二实施例中分布式告警监控系统的结构框图;
图7为第三实施例中计算机设备的结构框图;
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的多个实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使本发明的公开内容更加透彻全面。
需要说明的是,当元件被称为“固设于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
实施例一
请参阅图1,所示为本发明第一实施例中的分布式告警监控方法,包括如下步骤S101~S103b:
S101,创建一套分布式监控网络,通过所述分布式监控网络从待监控软件处获取监控数据;
其中,所述分布式监控网络包括多个子节点、及一个或多个主节点,各个所述子节点从所述待监控软件处采集所述监控数据并传输给所述主节点,主节点越多,单个主节点的压力就越小;
可使用采集器来采集并推送所述监控数据,所述采集器,适配待监控软件的监控接口,并从中定时采集指标信息。
S102,根据自定义的处理加工规则对所述监控数据进行处理加工;
该步骤可根据约定的方法,自定义所述监控数据接收后的处理加工规则。
在处理该步骤时,还可以对所述采集器的注册连接信息进行管理统计,识别该采集器属于哪个子节点。
S103a,对处理加工后的所述监控数据进行可视化数据处理,以生成可视化媒体供用户查阅;
该步骤通过从所述主节点处调取数据源,根据所述数据源提供的所有所述监控数据,整合成可视化媒体。
S103b,同时对处理加工后的所述监控数据进行告警评估处理,以生成告警项目,并推送给用户。
具体的,请参阅图2,对处理加工后的所述监控数据进行可视化数据处理,以生成可视化媒体供用户查阅的具体步骤包括S103a1~ S103a2:
S103a1,从所述分布式监控网络处提取所有监控数据,并按时间维度生成不同种类的媒体;
S103a2,自由组合多个不同种类的媒体以生成可视化媒体。
示例性的,可将所述监控数据按时间维度生成不同种类的图表,包括趋势图、饼状图、水滴图等等,以直观地反映出所有监控数据的趋势、比例,层次等,并可在看板中自由组合若干个图表。
在步骤S103a2后,还可对已创建的看板,进行增删改查,导入导出,以美化可视界面。
具体的,请参阅图3,同时对处理加工后的所述监控数据进行告警评估处理,以生成告警项目,并推送给用户的具体步骤包括:S103b1~S103b3:
S103b1,通过所述分布式监控网络约定设置告警规则,并根据所述告警规则对符合条件的所述监控数据进行报警触发,以生成告警数据;
可以理解的,在该步骤前,需要对所有的监控数据进行聚合检索,然后将满足告警条件(即不符合要求)的监控数据进行报警触发,将其列为告警数据。
S103b2,将所述告警数据进行多维度分层,并通过所述分布式监控网络的多个接口将分层后的所述告警数据暴露出去;
S103b3,自动发现从所述分布式监控网络暴露出来的所述告警数据,根据所述告警数据的分层等级、生成不同等级的告警项目并推送给用户。
可以理解的,本发明通过创建分布式监控网络,从多个节点获取待监控软件的监控数据,避免了单个主节点负载过高的问题,并对获取的监控数据进行双重处理,将监控数据进行可视化数据处理,生成可视化媒体如图表的形式供用户查阅,使得用户可以查询到所有待监控软件中监控数据的发展趋势,以作出应对准备,同时将监控数据进行告警评估处理,以生成告警项目,并推送给用户,使得用户可以直观地看到已触发告警的监控数据,其中,告警数据可根据需求,经过多维度分层,分层后的告警数据通过分布式监控网络暴露出,并可供自动发现,然后生成不同等级的告警项目,使用户可以掌握告警数据的重要程度。
更具体的,请参阅图4,将所述告警数据进行多维度分层,并通过所述分布式监控网络的多个接口暴露出去的具体步骤包括:
向所述分布式监控网络发起查询请求,查询当前已生成的所有所述告警数据;
创建一个线程池,并为每个所述线程池配备多个线程;
所述线程逐个将所述告警数据解析为约定格式,其中,所述约定格式中包含了所述告警数据的名称、等级和项目三个信息;
可以理解,由于本发明提供了一个分布式监控网络,但网络内接入的子节点过多后,该告警数据会变的异常的庞大,因此需要将所述告警数据中1亿行的二进制数据解析成struct格式,struct格式中都包含了告警名称,等级,和项目3个信息,为了快速解析这1亿行的二进制数据,我们创建了一个可配置大小的线程池(即工厂),假定所述线程池中有20个线程在工作(工人),通过逐行读取二进制数据,一个接一个地将其放入队列,工人则按顺序去队列中逐个获取二进制数据进行解析,具体步骤如下:
配备N个数据存储篮子,并根据所述告警数据的约定格式中的名称、等级和项目三个信息,将所述告警数据分类存储进不同的所述存储篮子,其中,所述N=项目的个数×等级的个数;
将各所述存储篮子中的所述告警数据暴露出去。
更具体的,请参阅图5,自动发现从所述分布式监控网络暴露出来的所述告警数据,根据所述告警数据的分层等级、生成不同等级的告警项目并推送给用户的具体步骤包括:
创建自动发现模版,并将所述自动发现模版与所述待监控软件绑定,所述自动发现模版包括多个自动发现规则和监控项自动生成规则,其中,每个所述自动发现规则均对应一种等级的所述告警数据;
通过所述自动发现规则自动发现所述待监控软件指定等级的所述告警数据、并通过所述监控项自动生成规则生成不同等级的所述告警项目。
进一步的,在通过所述自动发现规则自动发现所述待监控软件指定等级的所述告警数据、并通过所述监控项自动生成规则生成不同等级的所述告警项目的步骤之后还包括:
给所述监控项自动生成规则生成的所述告警项目创建一个过期时间和恢复表达式,当所述待监控软件的告警项目被修复后,通过所述监控项自动生成规则生成的信息也会自动消失。
节省存储空间的同时,还能使得告警界面更加整洁。
更进一步的,通过所述分布式监控网络约定设置告警规则,并根据所述告警规则对符合条件的所述监控数据进行报警触发,以生成告警数据的步骤之后还包括:
对已生成的所述告警数据进行不同账号备注评论说明、及对特定项目的所述告警数据设置静默期。
可以理解的,该步骤可使用户对告警数据进行管理。
具体的,所述告警项目可通过不同媒介推送给用户,这些媒介包括但不限于短信、电话、邮箱、机器人等等;
综上,本发明上述实施例当中的分布式告警监控方法,通过创建分布式监控网络,从多个节点获取待监控软件的监控数据,避免了单个主节点负载过高的问题,并对获取的监控数据进行双重处理,将监控数据进行可视化数据处理,生成可视化媒体如图表的形式供用户查阅,使得用户可以查询到所有待监控软件中监控数据的发展趋势,以作出应对准备,同时将监控数据进行告警评估处理,以生成告警项目,并推送给用户,使得用户可以直观地看到已触发告警的监控数据,其中,告警数据可根据需求,经过多维度分层,分层后的告警数据通过分布式监控网络暴露出,并可供自动发现,然后生成不同等级的告警项目,使用户可以掌握告警数据的重要程度。
实施例二
请查阅图6,所示为本发明第二实施例中的分布式告警监控系统40,包括:
监控模块11:用于创建一套分布式监控网络,通过所述分布式监控网络从待监控软件处获取监控数据,其中,所述分布式监控网络包括多个子节点、及一个或多个主节点,各个所述子节点从所述待监控软件处采集所述监控数据并传输给所述主节点;
处理加工模块12:用于根据自定义的处理加工规则对所述监控数据进行处理加工;
展示模块13:用于对处理加工后的所述监控数据进行可视化数据处理,以生成可视化媒体供用户查阅;
告警模块14:用于对处理加工后的所述监控数据进行告警评估处理,以生成告警项目,并推送给用户;
具体的,所述监控模块11包括:
采集单元:即所述采集器,用于采集并推送所述监控数据,所述采集器,适配待监控软件的监控接口,并从中定时采集指标信息。
所述展示模块具体用于:
从所述分布式监控网络处提取所有监控数据,并按时间维度生成不同种类的媒体;
自由组合多个不同种类的媒体以生成可视化媒体。
所述告警模块14包括:筛选单元141:用于通过所述分布式监控网络约定设置告警规则,并根据所述告警规则对符合条件的所述监控数据进行报警触发,以生成告警数据;
分层单元142:用于将所述告警数据进行多维度分层,并通过所述分布式监控网络的多个接口将分层后的所述告警数据暴露出去;
推送单元143:用于自动发现从所述分布式监控网络暴露出来的所述告警数据,根据所述告警数据的分层等级、生成不同等级的告警项目并推送给用户。
所述分布式监控网络包括多个子节点、及一个或多个主节点,各个所述子节点从所述待监控软件处采集所述监控数据并传输给所述主节点。
所述分层单元具体用于:
向所述分布式监控网络发起查询请求,查询当前已生成的所有所述告警数据;
创建一个线程池,并为每个所述线程池配备多个线程;
所述线程逐个将所述告警数据解析为约定格式,其中,所述约定格式中包含了所述告警数据的名称、等级和项目三个信息;
配备N个数据存储篮子,并根据所述告警数据的约定格式中的名称、等级和项目三个信息,将所述告警数据分类存储进不同的所述存储篮子,其中,所述N=项目的个数×等级的个数;
将各所述存储篮子中的所述告警数据暴露出去。
所述推送单元具体用于:
创建自动发现模版,并将所述自动发现模版与所述待监控软件绑定,所述自动发现模版包括多个自动发现规则和监控项自动生成规则,其中,每个所述自动发现规则均对应一种等级的所述告警数据;
通过所述自动发现规则自动发现所述待监控软件指定等级的所述告警数据、并通过所述监控项自动生成规则生成不同等级的所述告警项目。
上述各模块、单元被执行时所实现的功能或操作步骤与上述方法实施例大体相同,在此不再赘述。
本发明实施例所提供的分布式告警监控系统40,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
实施例三
本发明还提出一种计算机设备,请参阅图7,所示为本发明第三实施例中的计算机设备,包括存储器10、处理器20以及存储在所述存储器10上并可在所述处理器20上运行的计算机程序30,所述处理器20执行所述计算机程序30时实现上述的分布式告警监控方法。
其中,存储器10至少包括一种类型的存储介质,所述存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器10在一些实施例中可以是计算机设备的内部存储单元,例如该计算机设备的硬盘。存储器10在另一些实施例中也可以是外部存储装置,例如插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)等。进一步地,存储器10还可以既包括计算机设备的内部存储单元也包括外部存储装置。存储器10不仅可以用于存储安装于计算机设备的应用软件及各类数据,还可以用于暂时地存储已经输出或者将要输出的数据。
其中,处理器20在一些实施例中可以是电子控制单元 (Electronic ControlUnit,简称ECU,又称行车电脑)、中央处理器(Central Processing Unit, CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器10中存储的程序代码或处理数据,例如执行访问限制程序等。
需要指出的是,图6示出的结构并不构成对计算机设备的限定,在其它实施例当中,该计算机设备可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
本发明实施例还提出一种可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述的分布式告警监控方法。
本领域技术人员可以理解,在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或它们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (9)

1.一种分布式告警监控方法,其特征在于,包括如下步骤:
创建一套分布式监控网络,通过所述分布式监控网络从待监控软件处获取监控数据;
其中,所述分布式监控网络包括多个子节点、及一个或多个主节点,各个所述子节点从所述待监控软件处采集所述监控数据并传输给所述主节点;
根据自定义的处理加工规则对所述监控数据进行处理加工;
对处理加工后的所述监控数据进行可视化数据处理,以生成可视化媒体供用户查阅;
同时对处理加工后的所述监控数据进行告警评估处理,以生成告警项目,并推送给用户;
其中,对处理加工后的所述监控数据进行告警评估处理,以生成告警项目,并推送给用户的具体步骤包括:
通过所述分布式监控网络约定设置告警规则,并根据所述告警规则对符合条件的所述监控数据进行报警触发,以生成告警数据;
将所述告警数据进行多维度分层,并通过所述分布式监控网络的多个接口将分层后的所述告警数据暴露出去;
自动发现从所述分布式监控网络暴露出来的所述告警数据,根据所述告警数据的分层等级、生成不同等级的告警项目并推送给用户。
2.根据权利要求1所述的分布式告警监控方法,其特征在于,所述将所述告警数据进行多维度分层,并通过所述分布式监控网络的多个接口暴露出去的具体步骤包括:
向所述分布式监控网络发起查询请求,查询当前已生成的所有所述告警数据;
创建一个线程池,并为每个所述线程池配备多个线程;
所述线程逐个将所述告警数据解析为约定格式,其中,所述约定格式中包含了所述告警数据的名称、等级和项目三个信息;
配备N个数据存储篮子,并根据所述告警数据的约定格式中的名称、等级和项目三个信息,将所述告警数据分类存储进不同的所述存储篮子,其中,所述N=项目的个数×等级的个数;
将各所述存储篮子中的所述告警数据暴露出去。
3.根据权利要求2所述的分布式告警监控方法,其特征在于,所述自动发现从所述分布式监控网络暴露出来的所述告警数据,根据所述告警数据的分层等级、生成不同等级的告警项目并推送给用户的具体步骤包括:
创建自动发现模版,并将所述自动发现模版与所述待监控软件绑定,所述自动发现模版包括多个自动发现规则和监控项自动生成规则,其中,每个所述自动发现规则均对应一种等级的所述告警数据;
通过所述自动发现规则自动发现所述待监控软件指定等级的所述告警数据、并通过所述监控项自动生成规则生成不同等级的所述告警项目。
4.根据权利要求3所述的分布式告警监控方法,其特征在于,在所述通过所述自动发现规则自动发现所述待监控软件指定等级的所述告警数据、并通过所述监控项自动生成规则生成不同等级的所述告警项目的步骤之后还包括:
给所述监控项自动生成规则生成的所述告警项目创建一个过期时间和恢复表达式,当所述待监控软件的告警项目被修复后,通过所述监控项自动生成规则生成的信息也会自动消失。
5.根据权利要求1所述的分布式告警监控方法,其特征在于,所述通过所述分布式监控网络约定设置告警规则,并根据所述告警规则对符合条件的所述监控数据进行报警触发,以生成告警数据的步骤之后还包括:
对已生成的所述告警数据进行不同账号备注评论说明、及对特定项目的所述告警数据设置静默期。
6.根据权利要求1所述的分布式告警监控方法,其特征在于,所述对处理加工后的所述监控数据进行可视化数据处理,以生成可视化媒体供用户查阅的具体步骤包括:
从所述分布式监控网络处提取所有监控数据,并按时间维度生成不同种类的媒体;
自由组合多个不同种类的媒体以生成可视化媒体。
7.一种分布式告警监控系统,其特征在于,包括:
监控模块:用于创建一套分布式监控网络,通过所述分布式监控网络从待监控软件处获取监控数据,其中,所述分布式监控网络包括多个子节点、及一个或多个主节点,各个所述子节点从所述待监控软件处采集所述监控数据并传输给所述主节点;
处理加工模块:用于根据自定义的处理加工规则对所述监控数据进行处理加工;
展示模块:用于对处理加工后的所述监控数据进行可视化数据处理,以生成可视化媒体供用户查阅;
告警模块:用于对处理加工后的所述监控数据进行告警评估处理,以生成告警项目,并推送给用户;
所述告警模块包括:筛选单元:用于通过所述分布式监控网络约定设置告警规则,并根据所述告警规则对符合条件的所述监控数据进行报警触发,以生成告警数据;
分层单元:用于将所述告警数据进行多维度分层,并通过所述分布式监控网络的多个接口将分层后的所述告警数据暴露出去;
推送单元:用于自动发现从所述分布式监控网络暴露出来的所述告警数据,根据所述告警数据的分层等级、生成不同等级的告警项目并推送给用户。
8.一种存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-6中任一项所述的分布式告警监控方法。
9.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-6中任一项所述的分布式告警监控方法。
CN202311704454.2A 2023-12-13 2023-12-13 一种分布式告警监控方法、系统、存储介质及电子设备 Active CN117395132B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311704454.2A CN117395132B (zh) 2023-12-13 2023-12-13 一种分布式告警监控方法、系统、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311704454.2A CN117395132B (zh) 2023-12-13 2023-12-13 一种分布式告警监控方法、系统、存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN117395132A CN117395132A (zh) 2024-01-12
CN117395132B true CN117395132B (zh) 2024-02-20

Family

ID=89437827

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311704454.2A Active CN117395132B (zh) 2023-12-13 2023-12-13 一种分布式告警监控方法、系统、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN117395132B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6611955B1 (en) * 1999-06-03 2003-08-26 Swisscom Ag Monitoring and testing middleware based application software
CN102624570A (zh) * 2012-04-27 2012-08-01 杭州东信北邮信息技术有限公司 实现对web服务器可用性进行检测的监控系统和方法
WO2020015061A1 (zh) * 2018-07-18 2020-01-23 平安科技(深圳)有限公司 WebLogic服务器的监控告警方法、装置、系统及计算机存储介质
CN110968482A (zh) * 2019-12-18 2020-04-07 上海良鑫网络科技有限公司 企业服务及应用智能监控系统
CN111078507A (zh) * 2019-12-27 2020-04-28 广州三七互娱科技有限公司 数据监控方法、系统、计算机设备和存储介质
CN115567526A (zh) * 2022-09-21 2023-01-03 中国平安人寿保险股份有限公司 数据监控方法、装置、设备及介质
CN115809179A (zh) * 2022-12-13 2023-03-17 河北幸福消费金融股份有限公司 基于应用性能数据的告警方法、系统、设备和存储介质
WO2023142054A1 (zh) * 2022-01-27 2023-08-03 中远海运科技股份有限公司 一种面向容器微服务的性能监控告警方法及告警系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11334665B2 (en) * 2019-01-17 2022-05-17 Jpmorgan Chase Bank, N.A. Systems and methods for automated detection and analysis of security threats

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6611955B1 (en) * 1999-06-03 2003-08-26 Swisscom Ag Monitoring and testing middleware based application software
CN102624570A (zh) * 2012-04-27 2012-08-01 杭州东信北邮信息技术有限公司 实现对web服务器可用性进行检测的监控系统和方法
WO2020015061A1 (zh) * 2018-07-18 2020-01-23 平安科技(深圳)有限公司 WebLogic服务器的监控告警方法、装置、系统及计算机存储介质
CN110968482A (zh) * 2019-12-18 2020-04-07 上海良鑫网络科技有限公司 企业服务及应用智能监控系统
CN111078507A (zh) * 2019-12-27 2020-04-28 广州三七互娱科技有限公司 数据监控方法、系统、计算机设备和存储介质
WO2023142054A1 (zh) * 2022-01-27 2023-08-03 中远海运科技股份有限公司 一种面向容器微服务的性能监控告警方法及告警系统
CN115567526A (zh) * 2022-09-21 2023-01-03 中国平安人寿保险股份有限公司 数据监控方法、装置、设备及介质
CN115809179A (zh) * 2022-12-13 2023-03-17 河北幸福消费金融股份有限公司 基于应用性能数据的告警方法、系统、设备和存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于Zabbix的分布式数字化监控系统设计与实现;于滨;刘鹏宇;陆丽丽;孙玉强;崔建伟;;信息通信技术(第03期);全文 *
柔性微服务监控框架;刘一田;刘士进;郭伟;何翔;;计算机系统应用(第10期);全文 *

Also Published As

Publication number Publication date
CN117395132A (zh) 2024-01-12

Similar Documents

Publication Publication Date Title
CN107861859B (zh) 一种基于微服务架构的日志管理方法及系统
CN110855473B (zh) 一种监控方法、装置、服务器及存储介质
US9959015B2 (en) Systems and methods for monitoring and analyzing performance in a computer system with node pinning for concurrent comparison of nodes
US10205643B2 (en) Systems and methods for monitoring and analyzing performance in a computer system with severity-state sorting
CN110007913A (zh) 可视化的数据处理流程设置方法、装置、设备及存储介质
CN108270785A (zh) 一种基于知识图谱的分布式安全事件关联分析方法
CN115129736B (zh) 基于规则引擎的规则事件动态加载与更新方法及相关设备
CN107294764A (zh) 智能监管方法和智能监管系统
US20120124047A1 (en) Managing log entries
US20120297393A1 (en) Data Collecting Method, Data Collecting Apparatus and Network Management Device
CN111881011A (zh) 日志管理方法、平台、服务器及存储介质
CN108399199A (zh) 一种基于Spark的应用软件运行日志的收集与服务处理系统及方法
CN117971606B (zh) 基于ElasticSearch的日志管理系统及方法
CN105760491B (zh) 基于设备功能的数据建模方法及装置
CN106681808A (zh) 一种任务调度方法和装置
US20180176095A1 (en) Data analytics rendering for triage efficiency
CN106708965A (zh) 一种数据的处理方法和装置
US8762424B2 (en) Generating views of subsets of nodes of a schema
CN113505048A (zh) 基于应用系统画像的统一监控平台及实现方法
US10324818B2 (en) Data analytics correlation for heterogeneous monitoring systems
CN112579552A (zh) 日志存储及调用方法、装置及系统
CN116961241B (zh) 一种基于电网业务的统一应用监测平台
CN117395132B (zh) 一种分布式告警监控方法、系统、存储介质及电子设备
CN105653419B (zh) 基于监控点的溯源实现方法及系统
CN112685370A (zh) 一种日志采集方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant