CN113778783A - 一种基于监控数据的智能告警方法和系统 - Google Patents
一种基于监控数据的智能告警方法和系统 Download PDFInfo
- Publication number
- CN113778783A CN113778783A CN202110841728.7A CN202110841728A CN113778783A CN 113778783 A CN113778783 A CN 113778783A CN 202110841728 A CN202110841728 A CN 202110841728A CN 113778783 A CN113778783 A CN 113778783A
- Authority
- CN
- China
- Prior art keywords
- alarm
- period
- module
- information
- noise reduction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000012544 monitoring process Methods 0.000 title claims abstract description 29
- 230000009467 reduction Effects 0.000 claims abstract description 46
- 230000001629 suppression Effects 0.000 claims abstract description 46
- 238000012423 maintenance Methods 0.000 claims abstract description 40
- 230000030279 gene silencing Effects 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 12
- 230000002776 aggregation Effects 0.000 claims description 3
- 238000004220 aggregation Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3089—Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
- G06F11/3093—Configuration details thereof, e.g. installation, enabling, spatial arrangement of the probes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明提供一种基于监控数据的智能告警方法和系统。方法包括:在告警系统中注册告警策略包括:告警降噪周期、告警抑制周期、告警沉默周期、告警信息;根据接收到的告警信息,进入告警降噪;系统在告警降噪周期内持续接收到相同的告警信息,将告警噪周期内的告警信息合并成一条降噪的告警信息进入告警抑制;系统在告警抑制周期内持续接收到相同的降噪的告警信息,将告警抑制周期内的降噪的告警信息合并成一条抑制的告警信息进入告警沉默;系统在告警沉默周期内持续接收到相同的抑制的告警信息,会将告警沉默周期内的抑制的告警信息合并成一条沉默的告警记录送给运维者;在记录没有被标记为解决的情况下,记录会被过滤掉,不会重复发送给运维者。
Description
技术领域
本发明涉及智能告警技术领域,尤其是涉及一种基于监控数据的智能告警方法和系统。
背景技术
当系统出现故障时,通过智能告警平台能够及时有效的通知到运维者。
公开号为CN107894944A公开了一种基于大数据和云计算业务下的智能监控方法,包括:监控中心以业务系统为单位设置差异化的监控策略;当业务系统触发监控策略时,监控中心生成告警信息并将告警信息发送至智能处理中心及智能分析中心;智能处理中心根据所述告警信息及处理策略对业务系统进行处理,所述处理策略包括扩展策略、回收策略及冷却策略;智能分析中心收集并统计分析告警信息,并将结果反馈至监控中心。
公开号为CN112069039A公开了一种人工智能开发平台的监控预知告警方法、装置及存储介质,本发明将人工智能开发平台收集到的实时监控数据,按照设置的告警检测周期进行分组,形成原始训练集,使用LSTM神经网络模型进行训练,将得到的预测监控数据的LSTM模型进行保存,在预测场景下,实时使用卡尔曼滤波算法,对LSTM模型预测出的监控数据进行修正,计算出下个告警检测周期的较优监控预测数据,与告警管理模块的阈值进行对比,完成人工智能开发平台的监控预知告警功能。
现有的告警系统基本是出现一次故障,通知一次运维者,不管运维者是否能准确的分辨其中的噪音。
在这种情况下如果有大量相同类似的故障,其形成的告警通知会形成一场告警风暴淹没运维者,同时也浪费大量告警资源比如短信,电话,邮件等等资源。
发明内容
本发明的目的在于提供一种基于监控数据的智能告警方法和系统,以解决现有技术中存在的技术问题。
本发明第一方面提供了一种基于监控数据的智能告警方法,所述方法包括:
S1:在告警系统中注册告警策略包括:告警降噪周期、告警抑制周期、告警沉默周期、告警信息;
S2:根据接收到的告警信息,进入告警降噪;
S3:系统在告警降噪周期内持续接收到相同的告警信息,才会将告警噪周期内的告警信息合并成一条降噪的告警信息进入告警抑制;
S4:系统在告警抑制周期内持续接收到相同的降噪的告警信息,才会将告警抑制周期内的降噪的告警信息合并成一条抑制的告警信息进入告警沉默;
S5:系统在告警沉默周期内持续接收到相同的抑制的告警信息,会将告警沉默周期内的抑制的告警信息合并成一条沉默的告警记录送给运维者;在所述记录没有被标记为解决的情况下,所述记录会被过滤掉,不会重复发送给运维者。
根据本发明第一方面提供的方法,所述告警策略还包括:运维通知策略;所述运维通知策略包括通知方式和通知分级;所述通知方式包括:邮箱、短信、电话和企业微信;所述通知分级分为三级联系人通知。
根据本发明第一方面提供的方法,根据运维通知策略,所述告警方法还包括:
S6:根据三级联系人,每级尝试通知三次,尝试通知间隔1分钟,在给第一级联系人尝试三次不成功后,会依次往下直到第三级也三次全部失败为止。
根据本发明第一方面提供的方法,所述告警信息包括:告警内容、告警唯一标识和告警分组标识。
根据本发明第一方面提供的方法,所述降噪的告警信息包括:降噪的告警唯一标识和降噪的告警分组标识。
根据本发明第一方面提供的方法,所述抑制的告警信息包括:抑制的告警唯一标识和抑制的告警分组标识。
根据本发明第一方面提供的方法,所述告警降噪周期小于所述告警抑制周期;所述告警抑制周期小于所述告警沉默周期。
根据本发明第一方面提供的方法,所述告警降噪周期的设置范围为1-1.5分钟;所述告警抑制周期的设置范围为2-2.5分钟;所述告警沉默周期的设置范围为10-12分钟。
本发明第二方面提供了一种基于监控数据的智能告警系统,所述系统包括:告警策略模块、告警降噪模块、告警抑制模块、告警沉默模块和运维通知模块;所述告警策略模块分别与所述告警降噪模块、告警抑制模块、告警沉默模块和运维通知模块连接,所述告警降噪模块与所述告警抑制模块连接,所述告警抑制模块与所述告警沉默模块连接,所述告警沉默模块与所述运维通知模块连接。
根据本发明第二方面提供的系统,所述告警策略模块:保存告警信息,是告警处理的逻辑依据,包括:合并周期,告警降噪周期、告警抑制周期、告警沉默周期,告警内容,告警唯一标识,告警分组标识,通知策略;
所述告警降噪模块:在告警降噪周期内持续接收到相同的告警信息中的唯一标识识别重复的告警,会将告警噪周期内的告警信息合并成一条降噪的告警信息,将降噪的告警信息发送至告警抑制模块;
所述告警抑制模块:所述告警抑制模块与告警策略模块结合能够识别有效告警,结合降噪的告警唯一标识和分组标识进行聚合从而抑短时间内的告警风暴;
所述告警沉默模块:避免已经完成过告警的信息在有效周期内进行重复告警;
所述运维通知模块:根据三级联系人,每级尝试通知三次,尝试通知间隔1分钟,在给第一级联系人尝试三次不成功后,会依次往下直到第三级也三次全部失败为止。
本申请实施例提供的上述技术方案与现有技术相比具有如下优点:快速接入各种告警源,以多种方式通知告警到相关人员,通过告警降噪,告警抑制,告警沉默全面提升告警能力并且当系统出现故障时,通过智能告警平台能够及时有效的通知到运维者,现有的告警系统基本是出现一次故障,通知一次运维者,不管运维者是否能准确的分辨其中的噪音。在这种情况下如果有大量相同类似的故障,其形成的告警通知会形成一场告警风暴淹没运维者,同时也浪费大量告警资源比如短信,电话,邮件等等资源。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所采用的一种基于监控数据的智能告警方法流程图;
图2为本发明所采用的一种基于监控数据的智能告警系统图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明第一方面提供了一种基于监控数据的智能告警方法和系统,所述方法包括:
10:00分创建一个告警策略,其中告警降噪周期为1分钟,告警抑制周期为2分钟,告警沉默周期为10分钟,告警唯一标识为ECS-CPU,告警分组标识为${ip}(取各自服务器的IP),告警内容为CPU过高
10:10分100台服务器对告警系统发出告警唯一标识为ECS-CPU的告警信息,其告警分组标识为各自服务器的IP,告警系统接收到这100条后进入降噪周期,等待1分钟
10:11分告警系统发现距离第一次接收到告警唯一标识为ECS-CPU的告警信息的时间已经超过1分钟,将从10:00开始到10:11所有告警唯一标识为ECS-CPU的告警信息从告警降噪器移到告警抑制器,等待2分钟
10:13分告警系统中的告警抑制器将从10:00开始到10:13的所有告警唯一标识为ECS-CPU的告警信息按照告警分组标识合并成一条总告警信息,然后告警系统将这条信息从告警抑制器移到告警沉默期,告警沉默期检查发现以前10分钟内没有发送过该告警唯一标识的告警信息,然后交给通知策略进行通知,然后进入沉默期
10:14分这100台服务器继续对告警系统发出告警唯一标识为ECS-CPU的告警信息,但是由于告警系统针对告警唯一标识ECS-CPU进入了沉默期,所以从10:13开始到10:23,ECS-CPU的告警信息均只会记录但不会通知相关人员S1:在告警系统中注册告警策略包括:告警降噪周期(在该周期内,拥有同一唯一标识的告警将被压缩成一条,例如:告警降噪周期为1分钟,那么在这一分钟内本系统接收到了100条告警ID同为X,告警分组ID同为Y的告警信息,会在1分钟后将这100条告警合并为一条告警信息)、告警抑制周期(在该周期内,告警唯一标识相同而告警分组标识不同的告警将被压缩成一条,例如:例如:告警降噪周期为1分钟,那么在这一分钟内本系统接收到了100条告警ID同为X,告警分组标识各不相同的告警信息,会在1分钟后将这100条告警合并为一条告警信息)、告警沉默周期(在该周期内,拥有同一唯一标识的告警将被禁止再次发送给运维者,例如:告警沉默周期为10分钟,10:00发送给了运维者一条告警ID为X,告警分组ID为Y的告警信息,那么从10:00到10:10分接收到的所有一条告警ID为X,告警分组ID为Y的告警信息均不再发送给运维者)、告警内容(告警内容,由用户自定义,例如:CPU使用率超过85%)、告警唯一标识(标识一个唯一的告警策略,例如所有对于服务器CPU的告警唯一标识为ECS-CPU)、告警分组标识(标识一个唯一的分组,例如告警唯一标识为ECS-CPU的IP分组是${ip}那么对于IP为123.123.123.123这台服务器的分组标识就是取的它的IP,也就是123.123.123.123)、运维通知策略;所述告警策略还包括:运维通知策略;所述运维通知策略包括通知方式和通知分级;所述通知方式包括:邮箱、短信、电话和企业微信;所述通知分级分为三级联系人通知;
S2:根据接收到的告警信息,进入告警降噪;
S3:系统在1分钟内持续接收到相同的告警信息,才会将告警降噪周期内的告警信息合并成一条降噪的告警信息进入告警抑制;所述降噪的告警信息包括:降噪的告警唯一标识和降噪的告警分组标识;比如服务器CPU过高的故障,一次高CPU使用可能只是偶然,持续1分钟就绝非是偶然可以解释;
S4:系统在2分钟内持续接收到相同的降噪的告警信息,才会将告警抑制周期内的降噪的告警信息合并成一条抑制的告警信息进入告警沉默;所述抑制的告警信息包括:抑制的告警唯一标识和抑制的告警分组标识;比如A,B,C等等20台服务器先后报告CPU过高,如果不存在告警抑制就会给运维者发送20次报警信息;
S5:系统在10分钟内持续接收到相同的抑制的告警信息,会将告警沉默周期内的抑制的告警信息合并成一条沉默的告警记录送给运维者;在所述记录没有被标记为解决的情况下,所述记录会被过滤掉,不会重复发送给运维者;
S6:根据三级联系人,每级尝试通知三次,尝试通知间隔1分钟,在给第一级联系人尝试三次不成功后,会依次往下直到第三级也三次全部失败为止。
如图2所示,一种基于监控数据的智能告警系统,所述系统包括:告警策略模块、告警降噪模块、告警抑制模块、告警沉默模块和运维通知模块;所述告警策略模块分别与所述告警降噪模块、告警抑制模块、告警沉默模块和运维通知模块连接,所述告警降噪模块与所述告警抑制模块连接,所述告警抑制模块与所述告警沉默模块连接,所述告警沉默模块与所述运维通知模块连接。
所述告警策略模块:保存告警信息,是告警处理的逻辑依据,包括:合并周期,告警降噪周期、告警抑制周期、告警沉默周期,告警内容,告警唯一标识,告警分组标识,通知策略;
所述告警降噪模块:在告警降噪周期内持续接收到相同的告警信息中的唯一标识识别重复的告警,会将告警噪周期内的告警信息合并成一条降噪的告警信息,将降噪的告警信息发送至告警抑制模块;比如:用户内存凌晨0点10分忽然升高,这可能是正常的执行定时任务,但是持续到了0点50内存还是高的,就有可能不是正常的;当然具体情况具体看待;
所述告警抑制模块:所述告警抑制模块与告警策略模块结合能够识别有效告警,结合降噪的告警唯一标识和分组标识进行聚合从而抑短时间内的告警风暴;比如说存在一个内存过高告警策略,10台服务器先后报内存过高,相差不超过1分钟。这时候需要告警抑制器去将这十条聚组成一条包含十条子信息的告警信息发送,而不是将这十条告警十次;
所述告警沉默模块:避免已经完成过告警的信息在有效周期内进行重复告警;比如:内存使用率过高并且持续超过10分钟这条告警信息在没标记为解决之前不应该在5分钟内重复推送到运维者两次;
所述运维通知模块:根据三级联系人,每级尝试通知三次,尝试通知间隔1分钟,在给第一级联系人尝试三次不成功后,会依次往下直到第三级也三次全部失败为止。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本说明书中描述的主题及功能操作的实施例可以在以下中实现:数字电子电路、有形体现的计算机软件或固件、包括本说明书中公开的结构及其结构性等同物的计算机硬件、或者它们中的一个或多个的组合。本说明书中描述的主题的实施例可以实现为一个或多个计算机程序,即编码在有形非暂时性程序载体上以被数据处理装置执行或控制数据处理装置的操作的计算机程序指令中的一个或多个模块。可替代地或附加地,程序指令可以被编码在人工生成的传播信号上,例如机器生成的电、光或电磁信号,该信号被生成以将信息编码并传输到合适的接收机装置以由数据处理装置执行。计算机存储介质可以是机器可读存储设备、机器可读存储基板、随机或串行存取存储器设备、或它们中的一个或多个的组合。
本说明书中描述的处理及逻辑流程可以由执行一个或多个计算机程序的一个或多个可编程计算机执行,以通过根据输入数据进行操作并生成输出来执行相应的功能。所述处理及逻辑流程还可以由专用逻辑电路—例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)来执行,并且装置也可以实现为专用逻辑电路。
适合用于执行计算机程序的计算机包括,例如通用和/或专用微处理器,或任何其他类型的中央处理单元。通常,中央处理单元将从只读存储器和/或随机存取存储器接收指令和数据。计算机的基本组件包括用于实施或执行指令的中央处理单元以及用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括用于存储数据的一个或多个大容量存储设备,例如磁盘、磁光盘或光盘等,或者计算机将可操作地与此大容量存储设备耦接以从其接收数据或向其传送数据,抑或两种情况兼而有之。然而,计算机不是必须具有这样的设备。此外,计算机可以嵌入在另一设备中,例如移动电话、个人数字助理(PDA)、移动音频或视频播放器、游戏操纵台、全球定位系统(GPS)接收机、或例如通用串行总线(USB)闪存驱动器的便携式存储设备,仅举几例。
适合于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、媒介和存储器设备,例如包括半导体存储器设备(例如EPROM、EEPROM和闪存设备)、磁盘(例如内部硬盘或可移动盘)、磁光盘以及CD ROM和DVD-ROM盘。
虽然本说明书包含许多具体实施细节,但是这些不应被解释为限制任何发明的范围或所要求保护的范围,而是主要用于描述特定发明的具体实施例的特征。本说明书内在多个实施例中描述的某些特征也可以在单个实施例中被组合实施。另一方面,在单个实施例中描述的各种特征也可以在多个实施例中分开实施或以任何合适的子组合来实施。此外,虽然特征可以如上所述在某些组合中起作用并且甚至最初如此要求保护,但是来自所要求保护的组合中的一个或多个特征在一些情况下可以从该组合中去除,并且所要求保护的组合可以指向子组合或子组合的变型。
类似地,虽然在附图中以特定顺序描绘了操作,但是这不应被理解为要求这些操作以所示的特定顺序执行或顺次执行、或者要求所有例示的操作被执行,以实现期望的结果。在某些情况下,多任务和并行处理可能是有利的。此外,上述实施例中的各种系统模块和组件的分离不应被理解为在所有实施例中均需要这样的分离,并且应当理解,所描述的程序组件和系统通常可以一起集成在单个软件产品中,或者封装成多个软件产品。
由此,主题的特定实施例已被描述。其他实施例在所附权利要求书的范围以内。在某些情况下,权利要求书中记载的动作可以以不同的顺序执行并且仍实现期望的结果。此外,附图中描绘的处理并非必需所示的特定顺序或顺次顺序,以实现期望的结果。在某些实现中,多任务和并行处理可能是有利的。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (10)
1.一种基于监控数据的智能告警方法,其特征在于,所述方法包括:
S1:在告警系统中注册告警策略包括:告警降噪周期、告警抑制周期、告警沉默周期、告警信息;
S2:根据接收到的告警信息,进入告警降噪;
S3:系统在告警降噪周期内持续接收到相同的告警信息,才会将告警噪周期内的告警信息合并成一条降噪的告警信息进入告警抑制;
S4:系统在告警抑制周期内持续接收到相同的降噪的告警信息,才会将告警抑制周期内的降噪的告警信息合并成一条抑制的告警信息进入告警沉默;
S5:系统在告警沉默周期内持续接收到相同的抑制的告警信息,会将告警沉默周期内的抑制的告警信息合并成一条沉默的告警记录送给运维者;在所述记录没有被标记为解决的情况下,所述记录会被过滤掉,不会重复发送给运维者。
2.根据权利要求1所述的基于监控数据的智能告警方法,其特征在于,所述告警策略还包括:运维通知策略;所述运维通知策略包括通知方式和通知分级;所述通知方式包括:邮箱、短信、电话和企业微信;所述通知分级分为三级联系人通知。
3.根据权利要求2所述的基于监控数据的智能告警方法,其特征在于,根据运维通知策略,所述告警方法还包括:
S6:根据三级联系人,每级尝试通知三次,尝试通知间隔1分钟,在给第一级联系人尝试三次不成功后,会依次往下直到第三级也三次全部失败为止。
4.根据权利要求1所述的基于监控数据的智能告警方法,其特征在于,所述告警信息包括:告警内容、告警唯一标识和告警分组标识。
5.根据权利要求4所述的基于监控数据的智能告警方法,其特征在于,所述降噪的告警信息包括:降噪的告警唯一标识和降噪的告警分组标识。
6.根据权利要求5所述的基于监控数据的智能告警方法,其特征在于,所述抑制的告警信息包括:抑制的告警唯一标识和抑制的告警分组标识。
7.根据权利要求1所述的基于监控数据的智能告警方法,其特征在于,所述告警降噪周期小于所述告警抑制周期;所述告警抑制周期小于所述告警沉默周期。
8.根据权利要求7所述的基于监控数据的智能告警方法,其特征在于,所述告警降噪周期的设置范围为1-1.5分钟;所述告警抑制周期的设置范围为2-2.5分钟;所述告警沉默周期的设置范围为10-12分钟。
9.一种基于监控数据的智能告警系统,其特征在于,所述系统包括:告警策略模块、告警降噪模块、告警抑制模块、告警沉默模块和运维通知模块;所述告警策略模块分别与所述告警降噪模块、告警抑制模块、告警沉默模块和运维通知模块连接,所述告警降噪模块与所述告警抑制模块连接,所述告警抑制模块与所述告警沉默模块连接,所述告警沉默模块与所述运维通知模块连接。
10.根据权利要求9所述的基于监控数据的智能告警系统,其特征在于,
所述告警策略模块:保存告警信息,是告警处理的逻辑依据,包括:合并周期,告警降噪周期、告警抑制周期、告警沉默周期,告警内容,告警唯一标识,告警分组标识,通知策略;
所述告警降噪模块:在告警降噪周期内持续接收到相同的告警信息中的唯一标识识别重复的告警,会将告警噪周期内的告警信息合并成一条降噪的告警信息,将降噪的告警信息发送至告警抑制模块;
所述告警抑制模块:所述告警抑制模块与告警策略模块结合能够识别有效告警,结合降噪的告警唯一标识和分组标识进行聚合从而抑短时间内的告警风暴;
所述告警沉默模块:避免已经完成过告警的信息在有效周期内进行重复告警;
所述运维通知模块:根据三级联系人,每级尝试通知三次,尝试通知间隔1分钟,在给第一级联系人尝试三次不成功后,会依次往下直到第三级也三次全部失败为止。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110841728.7A CN113778783B (zh) | 2021-07-26 | 2021-07-26 | 一种基于监控数据的智能告警方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110841728.7A CN113778783B (zh) | 2021-07-26 | 2021-07-26 | 一种基于监控数据的智能告警方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113778783A true CN113778783A (zh) | 2021-12-10 |
CN113778783B CN113778783B (zh) | 2023-12-12 |
Family
ID=78836062
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110841728.7A Active CN113778783B (zh) | 2021-07-26 | 2021-07-26 | 一种基于监控数据的智能告警方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113778783B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101217592A (zh) * | 2008-01-16 | 2008-07-09 | 中兴通讯股份有限公司 | 用于告警风暴抑制的方法及系统 |
CN101247269A (zh) * | 2008-03-05 | 2008-08-20 | 中兴通讯股份有限公司 | 一种自动发现判定冗余告警的关联规则的方法 |
CN110096410A (zh) * | 2019-03-15 | 2019-08-06 | 中国平安人寿保险股份有限公司 | 告警信息处理方法、系统、计算机装置及可读存储介质 |
CN110221947A (zh) * | 2019-04-16 | 2019-09-10 | 中国平安人寿保险股份有限公司 | 告警信息巡检方法、系统、计算机装置及可读存储介质 |
CN111767195A (zh) * | 2020-09-02 | 2020-10-13 | 江苏达科云数据科技有限公司 | 一种告警信息智能降噪的处理方法 |
-
2021
- 2021-07-26 CN CN202110841728.7A patent/CN113778783B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101217592A (zh) * | 2008-01-16 | 2008-07-09 | 中兴通讯股份有限公司 | 用于告警风暴抑制的方法及系统 |
CN101247269A (zh) * | 2008-03-05 | 2008-08-20 | 中兴通讯股份有限公司 | 一种自动发现判定冗余告警的关联规则的方法 |
CN110096410A (zh) * | 2019-03-15 | 2019-08-06 | 中国平安人寿保险股份有限公司 | 告警信息处理方法、系统、计算机装置及可读存储介质 |
CN110221947A (zh) * | 2019-04-16 | 2019-09-10 | 中国平安人寿保险股份有限公司 | 告警信息巡检方法、系统、计算机装置及可读存储介质 |
CN111767195A (zh) * | 2020-09-02 | 2020-10-13 | 江苏达科云数据科技有限公司 | 一种告警信息智能降噪的处理方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113778783B (zh) | 2023-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110213068B (zh) | 一种消息中间件的监控方法及相关设备 | |
CN112988501B (zh) | 一种告警信息生成方法、装置、电子设备及存储介质 | |
CN101656013A (zh) | 一种车载监控报警终端、系统及报警方法 | |
CN103246589A (zh) | 一种多线程的监控方法及装置 | |
CN114465870B (zh) | 告警信息的处理方法及装置、存储介质和电子设备 | |
CN110097740A (zh) | 一种地震预警紧急处置方法及信息中心 | |
CN109861856B (zh) | 系统故障信息的通知方法、装置、存储介质及计算机设备 | |
CN110768828A (zh) | 告警处理方法及系统 | |
CN110933172A (zh) | 一种基于云计算的远程监控系统及方法 | |
CN111447272A (zh) | 负载均衡方法及装置 | |
CN110990245A (zh) | 基于调用链数据的微服务运行状态判断方法及装置 | |
CN103856344A (zh) | 一种告警事件信息处理方法及装置 | |
CN115017022A (zh) | 日志级别调整方法及装置 | |
CN110213770B (zh) | 无线传感器网络的防串谋攻击方法及系统 | |
CN115277577A (zh) | 数据处理方法、装置、计算机设备和计算机可读存储介质 | |
CN115038088A (zh) | 一种智能网络安全检测预警系统和方法 | |
CN115080356A (zh) | 异常告警方法和装置 | |
CN113778783A (zh) | 一种基于监控数据的智能告警方法和系统 | |
CN113806045A (zh) | 一种任务分配方法、系统、设备以及介质 | |
CN116795643A (zh) | 一种告警管理方法 | |
CN109766198A (zh) | 流式处理方法、装置、设备及计算机可读存储介质 | |
CN106161058B (zh) | 一种告警分级方法及装置 | |
CN116055291A (zh) | 节点的异常提示信息的确定方法、装置 | |
CN101192962A (zh) | 电信网管系统中涉及粘滞值的告警产生和恢复方法 | |
CN111614501A (zh) | 一种监控方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |