CN117135033A - 一种应用全链路智能告警系统 - Google Patents

一种应用全链路智能告警系统 Download PDF

Info

Publication number
CN117135033A
CN117135033A CN202311204595.8A CN202311204595A CN117135033A CN 117135033 A CN117135033 A CN 117135033A CN 202311204595 A CN202311204595 A CN 202311204595A CN 117135033 A CN117135033 A CN 117135033A
Authority
CN
China
Prior art keywords
module
data
alarm
full link
intelligent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311204595.8A
Other languages
English (en)
Inventor
曹小明
石宏宇
邹文景
何明东
粟邈如
毛正雄
王皓然
马超
陈瑞
王林
钱方
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Southern Power Grid Digital Power Grid Group Information Communication Technology Co ltd
Original Assignee
China Southern Power Grid Digital Power Grid Group Information Communication Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Southern Power Grid Digital Power Grid Group Information Communication Technology Co ltd filed Critical China Southern Power Grid Digital Power Grid Group Information Communication Technology Co ltd
Priority to CN202311204595.8A priority Critical patent/CN117135033A/zh
Publication of CN117135033A publication Critical patent/CN117135033A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/22Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks comprising specially adapted graphical user interfaces [GUI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • H04L43/045Processing captured monitoring data, e.g. for logfile generation for graphical visualisation of monitoring data

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Alarm Systems (AREA)

Abstract

本发明涉及告警系统技术领域,且公开了一种应用全链路智能告警系统,包括:数据采集模块,通过各种监控工具和传感器,实时采集各个链路节点的监控数据和日志;数据存储模块,用于采集到的数据经过清洗和预处理后,存储在数据存储模块中的数据仓库中;数据分析模块,用于数据存储模块中的数据被提取并进行实时分析和异常检测;告警处理模块,用于根据数据分析模块的结果,进行智能告警,并及时通知相关人员;可视化展示模块,用于监控数据和告警状态可以通过可视化展示模块进行展示。本发明提出一种应用全链路智能告警系统,本发明全链路智能告警;快速故障排除;自动化决策;持续优化;安全保护。

Description

一种应用全链路智能告警系统
技术领域
本发明涉及告警系统领域,尤其涉及一种应用全链路智能告警系统。
背景技术
在现代复杂的信息技术环境中,各种系统和服务的性能和可用性对于用户体验和业务运行至关重要。然而,传统的告警系统往往只能针对单个节点或组件进行告警,无法全面评估和分析系统的全链路性能和异常情况。
目前,监控系统仅关注单个节点或服务不足以满足日益复杂的业务需求,因此需要一种能够全链路智能告警的系统,能够实时监控并分析整个链路的性能和状态,并提供及时的故障排除和问题定位;仅关注单个节点或服务,无法提供全链路的告警和监控。对于大规模分布式系统,监控精度不高,无法准确识别和定位问题。故障排除和问题定位困难,缺乏全面的业务链路分析和可视化展示。无法及时应对动态变化的业务需求,缺乏智能化的决策和优化能力。
发明内容
(一)发明目的
为解决背景技术中存在的技术问题,本发明提出一种应用全链路智能告警系统,本发明全链路智能告警;快速故障排除;自动化决策;持续优化;安全保护。
(二)技术方案
为解决上述问题,本发明提供了一种应用全链路智能告警系统,包括:
数据采集模块,通过各种监控工具和传感器,实时采集各个链路节点的监控数据和日志。数据可以是实时推送或定时拉取的方式获取;
数据存储模块,用于采集到的数据经过清洗和预处理后,存储在数据存储模块中的数据仓库中。可以使用关系型数据库、NoSQL数据库或文件系统来进行存储和索引;
数据分析模块,用于数据存储模块中的数据被提取并进行实时分析和异常检测。可以使用机器学习、数据挖掘和统计分析技术进行数据分析,以识别潜在的问题和异常情况。
告警处理模块,用于根据数据分析模块的结果,进行智能告警,并及时通知相关人员。可以通过短信、邮件、手机应用程序方式来发送告警通知。
可视化展示模块,用于监控数据和告警状态可以通过可视化展示模块进行展示。可以使用仪表盘、图表、图形界面方式来展示数据,帮助用户实时了解系统的性能和状态。
故障排除模块,用于可视化展示模块中提供了问题定位和故障排查工具,用于帮助用户快速解决故障和异常情况。可以提供日志分析、报警详情、错误日志功能来辅助故障定位。
优选的,还包括数据预处理模块;
数据预处理模块用于对采集到的原始数据进行清洗和筛选,去除干扰和噪声。
优选的,还包括异常检测模块;
异常检测模块用于使用机器学习或统计方法,识别异常行为和异常模式。
优选的,还包括告警阈值设置模块;
警阈值设置模块根据历史数据和业务需求,设定合理的告警阈值。
优选的,异常分类与优先级模块;
异常分类与优先级模块用于对异常进行分类和优先级排序,帮助快速定位问题。
优选的,还包括自动化决策模块;
自动化决策模块用于基于分析结果和预设规则,自动化执行决策和调整。
优选的,还包括自愈能力模块;
自愈能力模块根据异常情况,自动采取措施恢复或调整系统状态。
优选的,还包括持续优化模块;
持续优化模块根据实时数据反馈和业务需求,持续优化系统和服务。
优选的,还包括安全保护模块;
安全保护模块用于保护监控数据的机密性和完整性,防止未授权访问和数据泄露。
本发明的上述技术方案具有如下有益的技术效果:
全链路智能告警:实时监控和告警整个服务链路的异常情况。
快速故障排除:提供准确的问题定位和故障排查工具,缩短故障处理时间。
自动化决策:根据实时数据分析结果,自动执行决策和优化措施。
持续优化:通过持续优化和自愈能力,提升系统的稳定性和性能。
安全保护:保护监控数据的安全和隐私,防止未授权访问和数据泄露。
附图说明
图1为本发明提出的一种应用全链路智能告警系统的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
如图1所示,本发明提出的一种应用全链路智能告警系统,包括:
数据采集模块,通过各种监控工具和传感器,实时采集各个链路节点的监控数据和日志。数据可以是实时推送或定时拉取的方式获取;
数据存储模块,用于采集到的数据经过清洗和预处理后,存储在数据存储模块中的数据仓库中。可以使用关系型数据库、NoSQL数据库或文件系统来进行存储和索引;
数据分析模块,用于数据存储模块中的数据被提取并进行实时分析和异常检测。可以使用机器学习、数据挖掘和统计分析技术进行数据分析,以识别潜在的问题和异常情况。
告警处理模块,用于根据数据分析模块的结果,进行智能告警,并及时通知相关人员。可以通过短信、邮件、手机应用程序方式来发送告警通知。
可视化展示模块,用于监控数据和告警状态可以通过可视化展示模块进行展示。可以使用仪表盘、图表、图形界面方式来展示数据,帮助用户实时了解系统的性能和状态。
故障排除模块,用于可视化展示模块中提供了问题定位和故障排查工具,用于帮助用户快速解决故障和异常情况。可以提供日志分析、报警详情、错误日志功能来辅助故障定位。
还包括数据预处理模块;
数据预处理模块用于对采集到的原始数据进行清洗和筛选,去除干扰和噪声。
还包括异常检测模块;
异常检测模块用于使用机器学习或统计方法,识别异常行为和异常模式。
还包括告警阈值设置模块;
警阈值设置模块根据历史数据和业务需求,设定合理的告警阈值。
异常分类与优先级模块;
异常分类与优先级模块用于对异常进行分类和优先级排序,帮助快速定位问题。
数据采集模块和数据存储模块之间的连接:数据采集模块负责实时采集各个链路节点的监控数据和日志,然后将采集到的数据传输给数据存储模块。这可以通过网络通信方式实现,例如使用HTTP或者消息队列技术进行数据传输。
数据存储模块和数据分析模块之间的连接:数据存储模块将采集到的数据进行存储和索引,以建立数据仓库。数据分析模块需要从数据存储模块中获取数据来进行实时分析和异常检测。可以通过查询数据存储模块的接口或者连接数据库的方式来获取所需的数据。
数据分析模块和告警处理模块之间的连接:数据分析模块负责对采集到的数据进行实时分析和异常检测,一旦发现异常情况,将相关信息传递给告警处理模块。这可以通过消息通知或者调用告警处理模块的API接口来实现。
告警处理模块和可视化展示模块之间的连接:告警处理模块在收到异常信息后,负责进行智能告警,并及时通知相关人员。同时,告警处理模块也需要将告警信息传递给可视化展示模块,以便在展示界面上展示实时的性能和告警状态。这可以通过消息通知、API接口或者共享数据库方式来实现。
故障排除模块与其他模块的连接:故障排除模块通常是一个独立的模块,它与其他模块之间通过接口或者API进行交互。当系统发生故障或异常情况时,故障排除模块可以通过获取相关的监控数据和告警信息来辅助问题定位和故障排查。
进一步的,还包括自动化决策模块;
自动化决策模块用于基于分析结果和预设规则,自动化执行决策和调整。
还包括自愈能力模块;
自愈能力模块根据异常情况,自动采取措施恢复或调整系统状态。
还包括持续优化模块;
持续优化模块根据实时数据反馈和业务需求,持续优化系统和服务。
还包括安全保护模块;
安全保护模块用于保护监控数据的机密性和完整性,防止未授权访问和数据泄露。
本发明中:
全链路智能告警:实时监控和告警整个服务链路的异常情况。
快速故障排除:提供准确的问题定位和故障排查工具,缩短故障处理时间。
自动化决策:根据实时数据分析结果,自动执行决策和优化措施。
持续优化:通过持续优化和自愈能力,提升系统的稳定性和性能。
安全保护:保护监控数据的安全和隐私,防止未授权访问和数据泄露。
工作原理,应用全链路智能告警系统通过采集、存储、分析、展示和决策模块的协同工作,实现对全链路的实时监控和异常检测。具体而言,通过数据采集模块获取监控数据,存储在数据存储模块中;然后通过数据分析模块对数据进行分析和异常检测,并通过告警处理模块发送告警通知;最后通过可视化展示模块展示监控数据和告警状态,辅助故障排除和问题定位。整个系统通过智能化的决策模块和持续优化模块实现自动化的问题处理和系统优化,从而提高服务的稳定性和可靠性。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims (9)

1.一种应用全链路智能告警系统,其特征在于,包括:
数据采集模块,通过各种监控工具和传感器,实时采集各个链路节点的监控数据和日志;
数据存储模块,用于采集到的数据经过清洗和预处理后,存储在数据存储模块中的数据仓库中;
数据分析模块,用于数据存储模块中的数据被提取并进行实时分析和异常检测;
告警处理模块,用于根据数据分析模块的结果,进行智能告警,并及时通知相关人员;
可视化展示模块,用于监控数据和告警状态可以通过可视化展示模块进行展示;
故障排除模块,用于可视化展示模块中提供了问题定位和故障排查工具。
2.根据权利要求1所述的一种应用全链路智能告警系统,其特征在于,还包括数据预处理模块;
数据预处理模块用于对采集到的原始数据进行清洗和筛选,去除干扰和噪声。
3.根据权利要求2所述的一种应用全链路智能告警系统,其特征在于,还包括异常检测模块;
异常检测模块用于使用机器学习或统计方法,识别异常行为和异常模式。
4.根据权利要求3所述的一种应用全链路智能告警系统,其特征在于,还包括告警阈值设置模块;
警阈值设置模块根据历史数据和业务需求,设定合理的告警阈值。
5.根据权利要求4所述的一种应用全链路智能告警系统,其特征在于,异常分类与优先级模块;
异常分类与优先级模块用于对异常进行分类和优先级排序。
6.根据权利要求5所述的一种应用全链路智能告警系统,其特征在于,还包括自动化决策模块;
自动化决策模块用于基于分析结果和预设规则,自动化执行决策和调整。
7.根据权利要求6所述的一种应用全链路智能告警系统,其特征在于,还包括自愈能力模块;
自愈能力模块根据异常情况,自动采取措施恢复或调整系统状态。
8.根据权利要求7所述的一种应用全链路智能告警系统,其特征在于,还包括持续优化模块;
持续优化模块根据实时数据反馈和业务需求,持续优化系统和服务。
9.根据权利要求1所述的一种应用全链路智能告警系统,其特征在于,还包括安全保护模块;
安全保护模块用于保护监控数据的机密性和完整性。
CN202311204595.8A 2023-09-18 2023-09-18 一种应用全链路智能告警系统 Pending CN117135033A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311204595.8A CN117135033A (zh) 2023-09-18 2023-09-18 一种应用全链路智能告警系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311204595.8A CN117135033A (zh) 2023-09-18 2023-09-18 一种应用全链路智能告警系统

Publications (1)

Publication Number Publication Date
CN117135033A true CN117135033A (zh) 2023-11-28

Family

ID=88854552

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311204595.8A Pending CN117135033A (zh) 2023-09-18 2023-09-18 一种应用全链路智能告警系统

Country Status (1)

Country Link
CN (1) CN117135033A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118199272A (zh) * 2024-05-17 2024-06-14 广东电网有限责任公司广州供电局 一种复杂配电网的智能高效主动调控方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118199272A (zh) * 2024-05-17 2024-06-14 广东电网有限责任公司广州供电局 一种复杂配电网的智能高效主动调控方法及系统

Similar Documents

Publication Publication Date Title
CN108763957B (zh) 一种数据库的安全审计系统、方法及服务器
CN101201786B (zh) 一种故障日志监控方法及装置
CN112612669A (zh) 一种基于态势感知的基础设施监测预警方法及系统
CN101916499B (zh) 一种智能报警装置及智能报警方法
CN117135033A (zh) 一种应用全链路智能告警系统
CN113157994A (zh) 一种多源异构平台数据处理方法
CN103490917A (zh) 故障处理情况的检测方法及装置
CN100586202C (zh) 故障定位的方法及装置
CN112416872A (zh) 一种基于大数据的云平台日志管理系统
CN104574191A (zh) 一种用于安全生产的态势评估与可视化展示方法
CN110784352B (zh) 一种基于Oracle Goldengate的数据同步监控告警方法及装置
CN116859800A (zh) 基于复杂事件流的生产车间安全监测系统和方法
CN103763143A (zh) 基于存储服务器的设备异常报警的方法及系统
CN104243192A (zh) 故障处理方法及系统
CN117240594B (zh) 一种多维度网络安全运维防护管理系统及方法
CN103618635A (zh) 信息化设备分层关联管控系统
CN105739408A (zh) 一种电力调度系统用业务监控方法及系统
CN117478830A (zh) 基于视频监控的设备状态管理系统及设备状态管理方法
CN117220917A (zh) 一种基于云计算的网络实时监控方法
CN103713976A (zh) 用于信号集中监测系统的信号设备故障根源搜索方法
KR101973728B1 (ko) 통합 보안 이상징후 모니터링 시스템
CN105530136A (zh) 一种电力调度系统用业务监控方法及系统
CN110988584A (zh) 一种电力系统智能监控和自动控制系统
Padarthi et al. Iot-based embedded sensor system for real-time health monitoring of composite structures for large-scale industrial operations
CN113064890A (zh) 一种运营商数据的质量评估方法、装置、服务器及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication