CN108156039B - 一种防告警风暴方法以及装置 - Google Patents
一种防告警风暴方法以及装置 Download PDFInfo
- Publication number
- CN108156039B CN108156039B CN201810016990.6A CN201810016990A CN108156039B CN 108156039 B CN108156039 B CN 108156039B CN 201810016990 A CN201810016990 A CN 201810016990A CN 108156039 B CN108156039 B CN 108156039B
- Authority
- CN
- China
- Prior art keywords
- alarm
- node
- detection
- user
- abnormal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0681—Configuration of triggering conditions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0604—Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0604—Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
- H04L41/0622—Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time based on time
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0817—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/16—Threshold monitoring
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/02—Standardisation; Integration
- H04L41/0246—Exchanging or transporting network management information using the Internet; Embedding network management web servers in network elements; Web-services-based protocols
- H04L41/026—Exchanging or transporting network management information using the Internet; Embedding network management web servers in network elements; Web-services-based protocols using e-messaging for transporting management information, e.g. email, instant messaging or chat
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/50—Network service management, e.g. ensuring proper service fulfilment according to agreements
- H04L41/5003—Managing SLA; Interaction between SLA and QoS
- H04L41/5009—Determining service level performance parameters or violations of service level contracts, e.g. violations of agreed response time or mean time between failures [MTBF]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0852—Delays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/10—Active monitoring, e.g. heartbeat, ping or trace-route
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Alarm Systems (AREA)
Abstract
本发明提供了一种防告警暴风方法以及装置,该方法包括:获取每个探测节点的探测数据;针对每个探测节点,基于所述探测数据,在判该探测节点的探测数据满足预设的初始探测策略时,确定该探测节点为异常节点;在所述异常节点的数量满足所述初始探测策略时,生成告警;每隔预设周期,结合每个异常节点的探测数据以及用户的反馈信息,调整所述初始化探测策略。通过该方法,可以给用户发送精确的告警,同时防止告警风暴给监控系统带来的压力,避免了资源浪费。
Description
技术领域
本发明涉及移动互联网领域,具体而言,涉及一种防告警风暴方法以及装置。
背景技术
用户网站使用监控系统后,网站达到告警阈值且用户开启了告警通知,系统就会给用户发出告警通知。传统的监控系统所采用的告警策略过于单一和固定,容易出现告警过于灵敏、同一故障期间反复告警等情形,导致告警次数多且频繁——称之为告警风暴。告警风暴会给用户带来一定的骚扰,并给用户留下监控系统不精准的印象,同时也给监控系统带来压力、造成资源浪费。
发明内容
有鉴于此,本发明实施例的目的在于提供一种防告警风暴方法以及装置,以缓解上述问题。
第一方面,本发明实施例提供了一种防告警暴风的方法,应用于网络监控系统,所述方法包括:获取每个探测节点的探测数据;针对每个探测节点,基于所述探测数据,在判该探测节点的探测数据满足预设的初始探测策略时,确定该探测节点为异常节点;在所述异常节点的数量满足所述初始探测策略时,生成告警;每隔预设周期,结合每个异常节点的探测数据以及用户的反馈信息,调整所述初始化探测策略。
第二方面,本发明实施例提供了一种防告警暴风的装置,应用于网络监控系统,所述装置包括:获取模块,用于获取每个探测节点的探测数据;确定模块,用于针对每个探测节点,基于所述探测数据,在判该探测节点的探测数据满足预设的初始探测策略时,确定该探测节点为异常节点;生成模块,用于在所述异常节点的数量满足所述初始探测策略时,生成告警;调整模块,用于每隔预设周期,结合每个异常节点的探测数据以及用户的反馈信息,调整所述初始化探测策略。
与现有技术相比,本发明各实施例提出的防告警风暴方法以及装置,该方法包括:获取每个探测节点的探测数据;针对每个探测节点,基于所述探测数据,在判该探测节点的探测数据满足预设的初始探测策略时,确定该探测节点为异常节点;在所述异常节点的数量满足所述初始探测策略时,生成告警;每隔预设周期,结合每个异常节点的探测数据以及用户的反馈信息,调整所述初始化探测策略。通过该方法,可以给用户发送精确的告警,同时防止告警风暴给监控系统带来的压力,避免了资源浪费。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的网络监控系统的结构框图;
图2为本发明第一实施例提供的一种防告警风暴方法的流程图;
图3为本发明第一实施例提供的另一种防告警风暴方法的流程图;
图4为本发明第一实施例提供的一种防告警风暴方法的自动调节示意图;
图5为本发明第二实施例提供的一种防告警风暴装置的结构框图;
图6为本发明第二实施例提供的一种防告警风暴装置的结构框图。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
如图1所示,是所述网络监控系统100的方框示意图。所述网络监控系统100包括:防告警风暴装置、存储器110、存储控制器120、处理器130、外设接口140、输入输出单元150、音频单元160、显示单元170。
所述存储器110、存储控制器120、处理器130、外设接口140、输入输出单元150、音频单元160以及显示单元170各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述防告警风暴装置包括至少一个可以软件或固件(firmware)的形式存储于所述存储器110中或固化在客户端设备的操作系统(operating system,OS)中的软件功能模块。所述处理器130用于执行存储器110中存储的可执行模块,例如所述防告警风暴装置包括的软件功能模块或计算机程序。
其中,存储器110可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器110用于存储程序,所述处理器130在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流程定义的服务器200、网络监控系统100所执行的方法可以应用于处理器130中,或者由处理器130实现。
处理器130可能是一种集成电路芯片,具有信号的处理能力。上述的处理器130可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述外设接口140将各种输入/输出装置耦合至处理器130以及存储器110。在一些实施例中,外设接口140,处理器130以及存储控制器120可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。
输入输出单元150用于提供给用户输入数据实现用户与网络监控系统100的交互。所述输入输出单元150可以是,但不限于,鼠标和键盘等。
音频单元160向用户提供音频接口,其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。
显示单元170在网络监控系统100与用户之间提供一个交互界面(例如用户操作界面)或用于显示图像数据给用户参考。在本实施例中,所述显示单元170可以是液晶显示器或触控显示器。若为触控显示器,其可为支持单点和多点触控操作的电容式触控屏或电阻式触控屏等。支持单点和多点触控操作是指触控显示器能感应到来自该触控显示器上一个或多个位置处同时产生的触控操作,并将该感应到的触控操作交由处理器130进行计算和处理。
第一实施例
请参照图2,图2是本发明第一实施例提供的一种防告警风暴方法的流程图,所述方法应用于网络监控系统。该系统主要通过HTTP(含HTTPS)探测方式模拟用户访问行为,探测网站是否可访问、响应速度是否过慢(超过一定阈值),并返回网络异常参数(如:HTTP响应码),同时可以结合PING探测等手段排查网站异常原因。当异常发生时,系统会向网站管理人员发送告警通知,同时记录异常数据、生成分析报表。
下面将对图2所示的流程进行详细阐述,所述方法包括:
步骤S110:获取每个探测节点的探测数据。
网络监控系统通过HTTP探测每个节点,从而获取每个探测节点的探测数据。其中,所述探测数据包括响应时间、HTTP状态码。
步骤S120:针对每个探测节点,基于所述探测数据,在判该探测节点的探测数据满足预设的初始探测策略时,确定该探测节点为异常节点。
其中,所述初始探测策略为:针对一个节点,满足该节点的响应时间达到Yms,或者该节点的状态码大于其或者等于500,或者该节点无状态返回时,确定该节点为异常节点,有大于或等于X个节点为异常节点时,生成告警,每次故障期间最多告警Z次。
进一步地,X取值为:
X=N-1,当n1≤N≤n2时(N最小取n0),N为探测节点总数;
X=N-2,当n2<N≤n3时,N为探测节点总数;
X=x0,当N>n3时,N为探测节点总数;
以上n0,n1,n2,n3,x0为具体数值,视具体网络监控系统规模而定,X可以设置为大于等于n0小于等于N的自然数。具体数值根据网络监控系统运行的数据,统计每次探测中异常节点数跟节点总数的关系而得出,网络监控系统体量不同、监控对象不同,数值通常也不同。
Y取值为:
Y=y0,Y可设置为大于0小于y1的自然数(无法访问的情况将响应时间置为y1ms),y0为具体数值。具体数值根据网络监控系统网站的平均响应时间,及用户承受心理得出。
Z取值为:
Z=1,可选1-5(每连续监测到一次异常则计数器+1,计数器在第1次、第z1次、第z2次、z3次、z4次时生成告警,最多5次),z1-z4为具体数值。根据用户对该设置项的具体选择及用户调研得出。
同时,HTTP状态码默认为:某探测节点HTTP状态码大于等于500视为异常。无状态返回(请求连接超时、DNS查询域名不存在等)则为无法访问,也视为异常。
此外,作为一种实施方式,在所述异常节点的数量不满足所述初始探测策略,生成恢复数据。进一步的,可以在所述非异常节点数目大于或等于N-X+1时,进行告警恢复。其中,N为探测节点总数,X为异常节点阈值。
步骤S130:在所述异常节点的数量满足所述初始探测策略时,生成告警。
即有大于或等于X个节点为异常节点时,生成告警,每次故障期间最多告警Z次。
作为一种实施方式,请参看图3,在步骤S130之后,所述方法还可以包括:
步骤S131:判断用户是否开启告警通知功能。
步骤S132:在为是时,将所述告警发送给用户所对应的客户端。
其中,可以将所述告警以邮件、短信或者微信的形式发送给用户对应的客户端。
其中,可以为用户生成告警接收人(即用户账号邮箱)和接收组(默认组),默认为开启告警通知。本发明实施例提供的方案可以设置邮件/短信/微信每日发送数量和时间段,默认每日发送邮件上限A封、短信上限B条、微信上限C条,默认接收时段为0-24点。若遇到网络延时,导致告警生成后需要发通知时,超过1个探测周期通知还未发出,则取消本次告警通知发送并记录原因,同时将“异常”探测计数器清0。
步骤S140:每隔预设周期,结合每个异常节点的探测数据以及用户的反馈信息,调整所述初始化探测策略。
进一步,对异常节点阈值X(单位:个)的调节,可以参考为:
每天结束后,对每个任务的异常探测次数进行统计:首先去掉响应时间超过设定阈值的探测结果,再统计最近7天(视系统体量可调整天数)异常节点数分别为1,2,3…N(N为探测节点总数)的探测次数Q,如下所示:
异常节点数 | 探测次数 |
1 | Q1 |
2 | Q2 |
3 | Q3 |
N | QN |
取Q1-QN中的最大值,其对应的(节点个数+1)作为X的最新取值,取值不能大于N(节点总数)。
对响应时间阈值Y(单位:ms)的调节,可以参考为:
每天结束后,取每个任务每个探测节点最近7天(视系统体量可调整天数)响应码小于400的探测数据。
取各节点响应时间最大的2%里面的最小值T1(暂定为2%,根据实际测试选取一个最佳数值)。
若T1大于y0(y0为系统默认的响应时间告警阈值),则将对应节点响应时间阈值置为T1;若T1小于y0,则将对应节点响应时间阈值置为y0(因为y0以下是访客通常能接收的响应时间,故这里我们不把响应时间告警阈值设置得低于y0)。
对告警次数Z(单位:次)的调节可以参考为:
任务在一次故障期间第1次生成告警数据并发送告警通知后,网络系统监测用户是否打开了告警通知(短信、邮件、微信等渠道)。
若第2次告警生成(按周期探测连续50次异常时生成第2次告警)前用户任一渠道都未打开过告警通知,则第2次生成告警数据并发送;若第1次告警通知用户打开了则该次故障恢复前不再生成告警。
若第2次告警通知用户仍未打开,则不再生成告警。
只尝试增加告警(及发送告警通知)的次数,不对Z的默认值(1)做更改。
请参看图4,随着系统的自动调节,告警数量会下降,告警通知跟告警数据接近,且每个任务由最初的每个节点告警阈值相同,自动调节为适应该任务每个节点的数值。随着时间的推移,产生告警数量和告警通知数量有明显降低并达到平稳。
此外,网络监控系统还可以根据用户的行为,调整告警通知发送策略,具体如下:
用户回复消息可更改每日通知数量上限:系统根据测试设定每日上限相对合理的值,若用户不够用,可回复消息取消限制,还可以回复消息恢复限制。
用户回复消息可更改通知接收时段:由于默认0-24点都可能发送告警通知,虽然网站可用性通常有7*24小时的高要求,但不排除有的用户不需要0-24小时一直关注网站的可用性(比如:有的网站在晚上会关闭服务,所以晚上不需要接收告警通知),故提供回复消息(包括邮件、短信、微信)即可更改告警通知发送时间的功能。
告警详情查看和反馈页面:在通知消息中,提供查看告警详情的链接(邮件通知可直接展示告警详情),点击后即可查看告警详情(无需登录,记录用户点击来源,一定时间后失效),除了告警详情外,还有退订按钮和退订原因选项,用户可退订告警通知并选择退订原因。
网络延迟告警通知发送失败的处理:网络延迟异常告警通知发送失败后,随机等待1-10秒后尝试再次发送,若仍然失败则继续尝试发送,每次随机等待时间增加10秒钟(第二次等待11-20秒,第三次等待21-30秒…),直到到达该任务的一个探测周期(如5分钟)仍未发送出去则取消本次告警通知发送,并记录发送失败的原因,同时将“异常”探测计数器清0。
另外,告警策略设置处提供选择——是否采用智能调节模式?(是/否,默认“是”)选择“是”,则采用本发明提供的自动调节方式。
本发明第一实施例提供的一种防告警风暴方法,包括获取每个探测节点的探测数据;针对每个探测节点,基于所述探测数据,在判该探测节点的探测数据满足预设的初始探测策略时,确定该探测节点为异常节点;在所述异常节点的数量满足所述初始探测策略时,生成告警;每隔预设周期,结合每个异常节点的探测数据以及用户的反馈信息,调整所述初始化探测策略。其中,告警生成环节无需用户干涉,告警发送环节可根据用户操作反馈调节告警发送数量和时段,还根据不同网站的特性,自动调节各参数以适应各网站的情况,让监控告警更加个性化。可减少不必要的告警,让每一条告警都是用户需要关注的,提升告警的精确度。
第二实施例
请参照图5,图5是本发明第五实施例提供的一种防告警风暴装置400的结构框图,该装置应用于网络监控系统。下面将对图5所示的结构框图进行阐述,所示装置包括:
获取模块410,用于获取每个探测节点的探测数据;
确定模块420,用于针对每个探测节点,基于所述探测数据,在判该探测节点的探测数据满足预设的初始探测策略时,确定该探测节点为异常节点;
生成模块430,用于在所述异常节点的数量满足所述初始探测策略时,生成告警;其中,所述初始探测策略为:针对一个节点,满足该节点的响应时间达到Yms或者该节点的状态码大于其或者等于500或者该节点无状态返回时,确定该节点为异常节点,有大于或等于X个节点为异常节点时,生成告警,每次故障期间最多告警Z次。
调整模块440,用于每隔预设周期,结合每个异常节点的探测数据以及用户的反馈信息,调整所述初始化探测策略。
作为一种实施方式,请参看图6,所述装置还可以包括:
判断模块450,用于判断用户是否开启告警通知功能,在为是时,将所述告警发送给用户所对应的客户端。
其中,所述判断模块450用于将所述告警以邮件、短信或者微信的形式发送给用户对应的客户端。
作为一种实施方式,所述生成模块430,还用于在所述异常节点的数量不满足所述初始探测策略时,生成恢复数据。
本实施例对防告警风暴装置400的各功能模块实现各自功能的过程,请参见上述图1至图4所示实施例中描述的内容,此处不再赘述。
综上所述,本发明实施例提出的一种防告警风暴方法以及装置,该方法包括获取每个探测节点的探测数据;针对每个探测节点,基于所述探测数据,在判该探测节点的探测数据满足预设的初始探测策略时,确定该探测节点为异常节点;在所述异常节点的数量满足所述初始探测策略时,生成告警;每隔预设周期,结合每个异常节点的探测数据以及用户的反馈信息,调整所述初始化探测策略。其中,告警生成环节无需用户干涉,告警发送环节可根据用户操作反馈调节告警发送数量和时段,还根据不同网站的特性,自动调节各参数以适应各网站的情况,让监控告警更加个性化。可减少不必要的告警,让每一条告警都是用户需要关注的,提升告警的精确度。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (8)
1.一种防告警风暴方法,其特征在于,所述方法应用于网络监控系统,所述网络监控系统用于通过HTTP探测方式模拟用户访问网站行为,所述方法包括:
获取每个探测节点的探测数据;
针对每个探测节点,基于所述探测数据,在判断该探测节点的探测数据满足预设的初始探测策略时,确定该探测节点为异常节点;
在所述异常节点的数量满足所述初始探测策略时,生成告警;
每隔预设周期,结合每个异常节点的探测数据以及用户的反馈信息,调整所述初始探测策略;
其中,所述初始探测策略为:针对一个节点,满足该节点的响应时间达到Yms或者该节点的状态码大于或者等于500或者该节点无状态返回时,确定该节点为异常节点,有大于或等于X个节点为异常节点时,生成告警,在一次故障期间第一次生成告警数据并发送告警通知后,监测用户是否打开所述告警通知;当所述用户打开了所述告警通知,则不再告警;若所述用户并未打开所述告警通知,则在第二次向所述用户发送告警通知后,不再告警。
2.根据权利要求1所述的方法,其特征在于,所述在所述异常节点的数量满足所述初始探测策略时,生成告警之后,所述方法还包括:
判断用户是否开启告警通知功能;
在为是时,将所述告警发送给用户所对应的客户端。
3.根据权利要求2所述的方法,其特征在于,所述将所述告警发送给用户所对应的客户端,包括:
将所述告警以邮件、短信或者微信的形式发送给用户对应的客户端。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:在所述异常节点的数量不满足所述初始探测策略时,生成恢复数据。
5.一种防告警风暴装置,其特征在于,应用于网络监控系统,所述网络监控系统用于通过HTTP探测方式模拟用户访问网站行为,所述装置包括:
获取模块,用于获取每个探测节点的探测数据;
确定模块,用于针对每个探测节点,基于所述探测数据,在判断该探测节点的探测数据满足预设的初始探测策略时,确定该探测节点为异常节点;
生成模块,用于在所述异常节点的数量满足所述初始探测策略时,生成告警;
调整模块,用于每隔预设周期,结合每个异常节点的探测数据以及用户的反馈信息,调整所述初始探测策略;
其中,所述初始探测策略为:针对一个节点,满足该节点的响应时间达到Yms或者该节点的状态码大于或者等于500或者该节点无状态返回时,确定该节点为异常节点,有大于或等于X个节点为异常节点时,生成告警,在一次故障期间第一次生成告警数据并发送告警通知后,监测用户是否打开所述告警通知;当所述用户打开了所述告警通知,则不再告警;若所述用户并未打开所述告警通知,则在第二次向所述用户发送告警通知后,不再告警。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
判断模块,用于判断用户是否开启告警通知功能,在为是时,将所述告警发送给用户所对应的客户端。
7.根据权利要求6所述的装置,其特征在于,所述装置包括:
所述判断模块用于将所述告警以邮件、短信或者微信的形式发送给用户对应的客户端。
8.根据权利要求5所述的装置,其特征在于,所述装置还包括:
所述生成模块,还用于在所述异常节点的数量不满足所述初始探测策略时,生成恢复数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810016990.6A CN108156039B (zh) | 2018-01-08 | 2018-01-08 | 一种防告警风暴方法以及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810016990.6A CN108156039B (zh) | 2018-01-08 | 2018-01-08 | 一种防告警风暴方法以及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108156039A CN108156039A (zh) | 2018-06-12 |
CN108156039B true CN108156039B (zh) | 2021-07-09 |
Family
ID=62460806
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810016990.6A Active CN108156039B (zh) | 2018-01-08 | 2018-01-08 | 一种防告警风暴方法以及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108156039B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104268080A (zh) * | 2014-09-25 | 2015-01-07 | 北京金山安全软件有限公司 | 一种软件异常处理方法和设备 |
CN105549508A (zh) * | 2015-12-25 | 2016-05-04 | 北京奇虎科技有限公司 | 一种基于信息合并的报警方法及装置 |
CN107579861A (zh) * | 2017-10-09 | 2018-01-12 | 杭州安恒信息技术有限公司 | 基于多线路监测的网站可用性告警方法、装置及电子设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10063433B2 (en) * | 2014-08-11 | 2018-08-28 | Honeywell International Inc. | Remotely monitoring network diagnostics |
-
2018
- 2018-01-08 CN CN201810016990.6A patent/CN108156039B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104268080A (zh) * | 2014-09-25 | 2015-01-07 | 北京金山安全软件有限公司 | 一种软件异常处理方法和设备 |
CN105549508A (zh) * | 2015-12-25 | 2016-05-04 | 北京奇虎科技有限公司 | 一种基于信息合并的报警方法及装置 |
CN107579861A (zh) * | 2017-10-09 | 2018-01-12 | 杭州安恒信息技术有限公司 | 基于多线路监测的网站可用性告警方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN108156039A (zh) | 2018-06-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108572907B (zh) | 一种告警方法、装置、电子设备及计算机可读存储介质 | |
CN106961352B (zh) | 监控系统及监控方法 | |
WO2021109314A1 (zh) | 一种异常数据的检测方法、系统及设备 | |
US7523357B2 (en) | Monitoring system and method | |
CN110213068B (zh) | 一种消息中间件的监控方法及相关设备 | |
US7095321B2 (en) | Extensible sensor monitoring, alert processing and notification system and method | |
CN108737132B (zh) | 一种告警信息处理方法及装置 | |
US20130086010A1 (en) | Systems and methods for data quality control and cleansing | |
US20090234944A1 (en) | Liveexception system | |
US20080174426A1 (en) | Monitoring usage rate patterns in storage resources | |
CN109560976B (zh) | 一种消息延迟的监控方法及装置 | |
CN107682345B (zh) | Ip地址的检测方法、检测装置及电子设备 | |
WO2017167099A1 (zh) | 一种分布式系统中节点的处理方法和装置 | |
GB2528792A (en) | Detection device, detection method, and recording medium | |
CN112152833B (zh) | 一种网络异常报警方法、装置及电子设备 | |
JP5431540B2 (ja) | 水位観測装置及び水位観測システム | |
JP2016535365A (ja) | コンピュータネットワークにおけるルートキット検出 | |
CN108156039B (zh) | 一种防告警风暴方法以及装置 | |
US10176033B1 (en) | Large-scale event detector | |
CN110399405A (zh) | 日志报警方法、装置、系统及存储介质 | |
JP2018506811A (ja) | マルチアラーム遠隔監視システム | |
US20180205752A1 (en) | Security Breach Detection in a Digital Medium Environment | |
US10855633B2 (en) | Controlling asset messages | |
US20140122692A1 (en) | Diagnostics information extraction from the db signals with measureless parameters | |
JP2015011391A (ja) | 変化検知装置、変化検知システム、変化検知方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: Room 311501, Unit 1, Building 5, Courtyard 1, Futong East Street, Chaoyang District, Beijing Applicant after: Beijing Zhichuangyu Information Technology Co., Ltd. Address before: Room 803, Jinwei Building, 55 Lanindichang South Road, Haidian District, Beijing Applicant before: Beijing Knows Chuangyu Information Technology Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |