CN112383442B - 告警处理方法、装置、设备及存储介质 - Google Patents

告警处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112383442B
CN112383442B CN202011470336.6A CN202011470336A CN112383442B CN 112383442 B CN112383442 B CN 112383442B CN 202011470336 A CN202011470336 A CN 202011470336A CN 112383442 B CN112383442 B CN 112383442B
Authority
CN
China
Prior art keywords
notification
alarm
alerted
current
personnel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011470336.6A
Other languages
English (en)
Other versions
CN112383442A (zh
Inventor
余星光
蓝昭宝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bigo Technology Singapore Pte Ltd
Original Assignee
Bigo Technology Singapore Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bigo Technology Singapore Pte Ltd filed Critical Bigo Technology Singapore Pte Ltd
Priority to CN202011470336.6A priority Critical patent/CN112383442B/zh
Publication of CN112383442A publication Critical patent/CN112383442A/zh
Application granted granted Critical
Publication of CN112383442B publication Critical patent/CN112383442B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0876Aspects of the degree of configuration automation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Automation & Control Theory (AREA)
  • Alarm Systems (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请公开了一种告警处理方法、装置、设备及存储介质,属于互联网技术领域。所述方法包括:获取当前待告警通知;确定当前待告警通知对应的人员配置信息,人员配置信息是指负责处理当前待告警通知的人员所对应的配置信息;基于人员配置信息,针对当前待告警通知进行告警呼叫;按照告警呼叫的响应结果,对目标待告警通知进行告警处理;其中,目标待告警通知是指基于响应结果和当前待告警通知确定的待告警通知。本申请实施例实现了针对监控异常情况进行自动化告警,提升了告警效率,节约了人力成本,并且可以针对异常情况及时进行告警,以避免由于告警不及时导致的损失和危害等。

Description

告警处理方法、装置、设备及存储介质
技术领域
本申请实施例涉及互联网技术领域,特别涉及一种告警处理方法、装置、设备及存储介质。
背景技术
在互联网企业,对各种数据都会有监控,如业务监控(QPS(Query Per Second,每秒查询率)、TPS(Transactions Per Second,每秒传输的事务处理个数)、服务是否健康、异常日志等)、网络监控(延时、丢包率)、服务器监控(CPU(Central Processing Unit,中央处理器)、内存、磁盘等)等。
若在数据监控过程中发现异常情况,则需要对这些异常情况进行告警。在相关技术中,对异常情况的告警采用的方式包括:发邮件、短信、IM(Instant Messaging,即时通讯)系统推送等。然而,若相关人员没有接收到或者没有注意到告警信息,将很容易导致这些异常情况没有人处理,从而引发一系列连锁问题,对公司产生严重的影响。因此,相关技术中提出一种新的解决方案:安排专门人员24小时值班,当有异常情况发生时,由专门人员联系负责处理异常情况的人进行处理。
然而,随着监控数据量的增加,异常情况和告警量也会持续增加,由专门人员24小时值班可能会在同一时间处理不来所有的异常情况,从而导致针对异常情况的告警不及时。
发明内容
本申请实施例提供了一种告警处理方法、装置、设备及存储介质,可用于实现针对监控异常情况进行自动化告警,提升了告警效率。所述技术方案如下:
一方面,本申请实施例提供了一种告警处理方法,所述方法包括:
获取当前待告警通知;
确定所述当前待告警通知对应的人员配置信息,所述人员配置信息是指负责处理所述当前待告警通知的人员所对应的配置信息;
基于所述人员配置信息,针对所述当前待告警通知进行告警呼叫;
按照所述告警呼叫的响应结果,对目标待告警通知进行告警处理;
其中,所述目标待告警通知是指基于所述响应结果和所述当前待告警通知确定的待告警通知。
另一方面,本申请实施例提供了一种告警处理装置,所述装置包括:
通知获取模块,用于获取当前待告警通知;
人员确定模块,用于确定所述当前待告警通知对应的人员配置信息,所述人员配置信息是指负责处理所述当前待告警通知的人员所对应的配置信息;
告警呼叫模块,用于基于所述人员配置信息,针对所述当前待告警通知进行告警呼叫;
告警处理模块,用于按照所述告警呼叫的响应结果,对目标待告警通知进行告警处理;
其中,所述目标待告警通知是指基于所述响应结果和所述当前待告警通知确定的待告警通知。
再一方面,本申请实施例提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现如上述告警处理方法。
又一方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述告警处理方法。
还一方面,本申请实施例提供了一种计算机程序产品,当所述计算机程序产品在计算机设备上运行时,使得计算机设备执行如上述告警处理方法。
本申请实施例提供的技术方案可以带来如下有益效果:
通过由计算机设备根据待告警通知确定负责处理待告警通知的人员,并向负责处理待告警通知的人员进行告警呼叫,以实现针对监控异常情况进行自动化告警,提升了告警效率。相比于由专门人员24小时值班可能会在同一时间处理不来所有的异常情况,由计算机设备进行自动化告警节约了人力成本,并且可以针对异常情况及时进行告警,以避免由于告警不及时导致的损失和危害等。并且,本申请实施例提供的技术方案,针对告警呼叫不同的响应结果,进行不同的告警处理,一方面可以确保待告警通知及时有效地进行了相关的处理,另一方面可以灵活进行告警处理。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个实施例提供的告警处理系统的示意图;
图2是本申请一个实施例提供的告警呼叫方法的示意图;
图3是本申请一个实施例提供的告警呼叫方法的流程图;
图4是本申请另一个实施例提供的告警呼叫方法的示意图;
图5是本申请一个实施例提供的告警呼叫装置的框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
请参考图1,其示出了本申请一个实施例提供的告警处理系统的示意图。该告警处理系统包括:计算机设备10。
计算机设备10用于针对监控异常情况做出告警处理,例如,发出警报、推送告警消息、进行告警呼叫等。可选地,计算机设备10可以为服务器,也可以为智能手机、平板电脑、笔记本电脑、台式计算机等终端。在计算机设备10为服务器的情况下,其可以实现为可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者是一个云计算服务中心。
本申请实施例中,计算机设备10的数量可以为一个,也可以为多个。可选地,设置一台计算机设备进行告警处理;或者,根据监控类型的不同,设置不同的计算机设备10进行告警处理。例如,需要监控的类型包括:业务监控、网络监控和服务器监控,计算机设备10包括第一计算机设备、第二计算机设备和第三计算机设备,其中,第一计算机设备用于进行业务监控的告警处理,第二计算机设备用于进行网络监控的告警处理,第三计算机设备用于进行服务器监控的告警处理。可选地,针对每一种监控类型,又可以设置多个计算机设备进行告警处理。
可选地,计算机设备10除了用于针对监控异常情况进行告警处理,也可以进行实际的监控,也即,进行监控的计算机设备和进行告警处理的计算机设备可以为同一个计算机设备。当然,进行监控的计算机设备和进行告警处理的计算机设备也可以为不同的计算机设备。可选地,进行实际监控的计算机设备的数量可以为一个,也可以为多个。
例如,如图1所示,以进行监控的计算机设备和进行告警处理的计算机设备为不同的计算机设备,且针对不同的监控类型设置不同的用于监控的计算机设备进行监控为例,告警处理系统还包括计算机设备20,该计算机设备20用于进行监控。假设需要监控的类型包括:业务监控、网络监控和服务器监控,计算机设备20包括:计算机设备22、计算机设备24和计算机设备26,其中,计算机设备22用于业务监控,计算机设备24用于网络监控,计算机设备26用于服务器监控。计算机设备20若监控到异常情况,则将该异常情况发送至计算机设备10,由计算机设备10针对该异常情况做出告警处理。可选地,计算机设备10和计算机设备20之间通过网络进行互相通信,该网络可以为有线网络,也可以为无线网络。
以计算机设备10针对异常情况进行告警呼叫为例,如图1所示,该告警处理系统还包括终端30。终端30可以是诸如手机、平板电脑、游戏主机、电子书阅读器、多媒体播放设备、可穿戴设备、PC(Personal Computer,个人计算机)等电子设备。终端30的数量可以是一个,也可以是多个。计算机设备10可以呼叫负责处理异常情况的人员所持有的终端30。可选地,计算机设备10和终端30之间通过网络进行互相通信,该网络可以为有线网络,也可以为无线网络。
为了提升告警处理的效率、节约人力成本,本申请实施例提供了一种自动化平台,可用于进行自动化告警。在一个示例中,如图2所示,计算机设备210中包括消息模块210、配置模块220、OA(Office Automation,办公自动化)模块230以及告警模块240。其中,消息模块210用于存储待告警的异常情况;配置模块220用于配置负责处理异常情况的人员;OA模块230用于配置各个人员的联系方式等信息;告警模块240用于根据从消息模块210中拉取的待告警的异常情况,从配置模块220中查找到对应的人员、从OA模块230中获取该人员的联系方式,并按照获取到的联系方式呼叫相应的人员处理异常情况。
然而,这种自动化告警的方式还存在一些弊端:(1)若没有接通配置模块220中配置的人员的电话,则异常情况还是无人处理;(2)若接通了配置模块220中配置的人员的电话,相关人员已经在处理异常情况,但是后续与该异常情况类似的异常情况再次告警时,仍然会呼叫相关人员,导致相关人员一直被告警呼叫骚扰;(3)总是呼叫相同的人员处理异常情况,配置不够灵活。
基于此,本申请实施例提供了一种告警处理方法,可用于解决上述技术问题。下面,通过几个实施例对本申请实施例提供的技术方案进行介绍说明。
请参考图3,其示出了本申请一个实施例提供的告警处理方法的流程图。该方法可应用于上文介绍的计算机设备中。该方法可以包括如下几个步骤。
步骤310,获取当前待告警通知。
待告警通知是指需要进行告警处理的通知消息,本申请实施例中,待告警通知包括监控过程中发现的异常情况,如网络监控过程中发现的延时过长、丢包率过高等情况。可选地,计算机设备中包括消息模块,待告警通知存储于消息模块中。本申请实施例对待告警通知的存储方式不作限定。在一个示例中,待告警通知以时间顺序依次存储于消息模块中,也即,待告警通知存在以时间为参考的优先级顺序,后续可以先对时间靠前的待告警通知进行告警处理。在另一个示例中,待告警通知以异常情况类型为参考存储于消息模块中,也即,指示不同类别异常情况的待告警通知分类存储于消息模块中。在还一个示例中,待告警通知可以结合时间顺序和异常情况类型这两方面的参考因素存储于消息模块中。
可选地,计算机设备中还包括告警模块,该告警模块即用于获取消息模块中的当前待告警通知,并对当前待告警通知进行告警处理。可选地,消息模块中的待告警通知的数量为多个,并且,多个待告警通知存在优先级顺序,从而,告警模块可以从消息模块中获取优先级最高的待告警通知作为当前待告警通知。本申请实施例对告警模块获取当前待告警通知的方式不作限定,可选地,告警处理模块每隔预设时间间隔主动从消息模块中拉取当前待告警通知;或者,消息模块在接收到当前待告警通知时主动向告警模块推送待告警通知;或者,消息模块每隔预设时间间隔主动将当前待告警通知推送至告警模块。
步骤320,确定当前待告警通知对应的人员配置信息,人员配置信息是指负责处理当前待告警通知的人员所对应的配置信息。
在获取到当前待告警通知后,即可确定当前待告警通知的人员配置信息,从而确定负责处理当前待告警通知的人员。待告警通知的人员配置信息是指负责处理待告警通知的人员所对应的配置信息,其用于指示负责处理待告警通知的人员。本申请实施例中,人员配置信息既可以指示负责处理待告警通知的一个人员,也可以指示负责处理待告警通知的多个人员。在人员配置信息指示负责处理待告警通知的多个人员的情况下,可选地,人员配置信息还可以包括负责处理待告警通知的多个人员的优先级顺序。
本申请实施例中,计算机设备获取到的当前待告警通知不同,其确定的人员配置信息也可能有所不同。在一个示例中,上述步骤320包括:确定当前待告警通知的属性信息;从至少一个配置信息中,选择与属性信息对应的配置信息,作为当前待告警通知对应的人员配置信息。也即,人员配置信息按照待告警通知的属性信息进行了区别配置,属性信息相同的待告警通知对应的是相同的人员配置信息。可选地,属性信息包括以下至少一项:待告警通知的获取时间、待告警通知的通知类别。例如,针对星期一获取到的待告警通知采用一种人员配置信息;针对星期二获取到的待告警通知采用另一种人员配置信息。又例如,针对业务监控场景下得到的待告警通知采用一种人员配置信息;针对网络监控场景下获取到的待告警通知采用另一种人员配置信息。
步骤330,基于人员配置信息,针对当前待告警通知进行告警呼叫。
基于人员配置信息所指示的负责处理当前待告警通知的人员,计算机设备即针对当前待告警通知进行告警呼叫。本申请实施例对告警呼叫的内容不作限定,可选地,告警呼叫的内容包括以下任意一项:待告警通知的获取时间、待告警通知的通知类别、待告警通知的重要级别。
在一个示例中,人员配置信息用于指示负责处理当前待告警通知的一个人员,上述步骤330包括:按照目标呼叫方式,向人员配置信息所指示的人员针对待告警通知进行告警呼叫。可选地,目标呼叫方式包括按照目标时间间隔重复进行目标次数的告警呼叫。可选地,在未接收到针对告警呼叫的确认处理信息的情况下,计算机设备按照目标呼叫方式,向人员配置信息所指示的人员的上一级人员针对待告警通知进行告警呼叫。
在另一个示例中,人员配置信息用于指示负责处理当前待告警通知的n个人员,n为大于或等于2的整数;上述步骤330,包括:按照目标呼叫方式,向n个人员中的第i个人员针对待告警通知进行告警呼叫,i为小于或等于n的正整数;在未接收到针对告警呼叫的确认处理信息的情况下,按照目标呼叫方式,向n个人员中的第i+1个人员针对待告警通知进行告警呼叫,第i+1个人员的优先级低于第i个人员的优先级。也即,人员配置信息用于指示负责处理当前待告警通知的多个人员,且多个人员之间存在优先级顺序,计算机设备先按照目标呼叫方式,向优先级最高的人员进行告警呼叫,在未接收到针对告警呼叫的确认处理信息的情况下,可以进一步按照目标呼叫方式向次于优先级最高的人员依次进行告警呼叫。可选地,在向人员配置信息所指示的所有人员进行了告警呼叫,却仍未接收到针对告警呼叫的确认处理信息的情况下,计算机设备按照目标呼叫方式,向人员配置信息所指示的人员的上一级人员针对待告警通知进行告警呼叫。
可选地,计算机设备包括配置模块、OA模块和告警模块,其中,告警模块用于按照目标呼叫方式进行告警呼叫,且告警模块可以从配置模块中获取人员配置信息,从OA模块中获取人员配置信息所指示的人员的联系方式,以及该人员的上一级人员及上一级人员的联系方式。
步骤340,按照告警呼叫的响应结果,对目标待告警通知进行告警处理;其中,目标待告警通知是指基于响应结果和当前待告警通知确定的待告警通知。
计算机设备按照告警呼叫不同的响应结果,可以进行不同的告警处理。可选地,针对不同的响应结果,计算机设备也可以针对不同的待告警通知进行告警处理。本申请实施例中,计算机设备按照告警呼叫的响应结果,对目标待告警通知进行告警呼叫处理,其中,目标待告警通知是指基于响应结果和当前待告警通知确定的待告警通知。有关响应结果、目标待告警通知、针对目标待告警通知的告警处理等的介绍说明,请参见下述方法实施例,此处不多赘述。
综上所述,本申请实施例提供的技术方案,通过由计算机设备根据待告警通知确定负责处理待告警通知的人员,并向负责处理待告警通知的人员进行告警呼叫,以实现针对监控异常情况进行自动化告警,提升了告警效率。相比于由专门人员24小时值班可能会在同一时间处理不来所有的异常情况,由计算机设备进行自动化告警节约了人力成本,并且可以针对异常情况及时进行告警,以避免由于告警不及时导致的损失和危害等。并且,本申请实施例提供的技术方案,针对告警呼叫不同的响应结果,进行不同的告警处理,一方面可以确保待告警通知及时有效地进行了相关的处理,另一方面可以灵活进行告警处理。
以下针对响应结果、目标待告警通知以及对目标待告警通知的告警处理等进行介绍说明。
在一个示例中,响应结果包括第一响应结果,第一响应结果用于指示接收到针对告警呼叫的第一确认处理信息。
第一确认处理信息用于指示确认处理当前待告警通知。也即,接通告警呼叫的人员确认处理当前待告警通知。此时,目标待告警通知包括除当前待告警通知之外的待告警通知。本申请实施例对第一确认处理信息的形式不作限定,可选地,第一确认处理信息为第一数值,如1。例如,告警呼叫为电话呼叫,接通告警呼叫的人员回复1,则计算机设备确认接收到第一确认处理信息。
基于此,上述步骤340,包括:针对目标待告警通知,从确定当前待告警通知对应的人员配置信息的步骤开始再次执行;其中,再次执行时的当前待告警通知为目标待告警通知。
本申请实施例中,若计算机设备接收到的是第一确认处理信息,也即,接通告警呼叫的人员仅确认处理当前待告警通知,则后续计算机设备针对新的待告警通知(即目标待告警通知)进行告警呼叫时,执行的是与当前待告警通知相同的告警呼叫处理,也即,计算机设备再次执行上述步骤220至步骤240,其中,再次执行时,上述步骤220至步骤240中的当前待告警通知为目标待告警通知。
在另一个示例中,响应结果包括第二响应结果,第二响应结果用于指示接收到针对告警呼叫的第二确认处理信息。
第二确认处理信息用于指示确认处理当前待告警通知所属类别下的所有待告警通知。也即,接通告警呼叫的人员确认处理当前待告警通知所属类别下的所有待告警通知。此时,目标待告警通知包括当前待告警通知所属类别下除当前待告警通知之外的待告警通知,也即,与当前待告警通知不属于同一类的待告警通知。例如,当前待告警通知为业务监控场景下的待告警通知,目标待告警通知可以为网络监控场景下的待告警通知。本申请实施例对第二确认处理信息的形式不作限定,可选地,第二确认处理信息为第二数值,如2。例如,告警呼叫为电话呼叫,接通告警呼叫的人员回复2,则计算机设备确认接收到第二确认处理信息。
基于此,上述步骤340,包括:确定第二确认处理信息的确认人员;在目标时间段内,向确认人员针对目标待告警通知进行信息推送。
本申请实施例中,若计算机设备接收到的是第二确认处理信息,也即,接通告警呼叫的人员确认处理当前待告警通知所属类别下的所有待告警通知,则后续计算机设备针对与当前待告警通知属于同一类别的待告警通知,不再进行告警呼叫处理,以避免打扰到接通告警呼叫的人员处理待告警通知。虽然计算机设备不再针对同一类别的待告警通知进行告警呼叫,但是为了使得确认人员及时掌握需要处理的待告警通知,计算机设备可以向确认人员针对同一类别的待告警通知进行信息推送,如通过发邮件、短信、IM消息等进行推送。
可选地,为了避免同一人员过长时间处理待告警通知,本申请实施例中,计算机设备在目标时间段内,向确认人员针对目标待告警通知进行信息推送,而在超过目标时间段的情况下,再次执行上述步骤220至上述步骤240。示例性地,目标时间段的起始时刻包括计算机设备接收到第二确认处理信息的时刻,目标时间段的终止时刻包括从起始时刻经过目标时间间隔的时刻,从起始时刻开始经过一个小时的时刻。
在又一个示例中,响应结果包括第三响应结果。
第三响应结果用于指示未接收到针对告警呼叫的确认处理信息,也即,人员配置信息所指示的人员没有接通告警呼叫。可选地,在计算机设备还针对人员配置信息所指示的人员的上一级人员进行告警呼叫的情况下,第三响应结果用于指示人员配置信息所指示的人员以及该人员的上一级人员均没有接通告警呼叫。此时,目标告警通知包括当前待告警通知,也即,计算机设备继续处理当前待告警通知,以确保当前待告警通知及时被处理。
基于此,上述步骤340,包括:确定目标人员,目标人员负责联系人员配置信息所指示的人员;向目标人员针对当前待告警通知进行告警呼叫。
目标人员,又称为兜底人员,是配置的24小时值班的人员,以负责联系人员配置信息所指示的人员。若计算机设备针对当前待告警通知,没有接通人员配置信息所指示的人员,则进一步确定目标人员,然后向目标人员针对当前待告警通知进行告警呼叫,以使得目标人员联系到人员配置信息所指示的人员后,人员配置信息所指示的人员能够针对当前待告警通知做出及时处理。
综上所述,本申请实施例提供的技术方案,通过在接通告警呼叫的人员确认处理本次告警呼叫的待告警通知的情况下,后续新的待告警通知,采用与本次告警呼叫的待告警通知相同的告警处理方式进行告警呼叫,以确保每一个待告警通知及时有效地通知到相关人员,以确保及时被处理。
并且,本申请实施例提供的技术方案,通过在接通告警呼叫的人员确认处理本次告警呼叫所属类别的所有待告警通知的情况下,后续与本次告警呼叫属于同一类别的待告警通知,不再进行告警呼叫,而是进行消息推送,以避免打扰到相关人员的处理过程。
另外,本申请实施例提供的技术方案,通过在计算机设备未接收到针对告警呼叫的确认处理信息的情况下,也即,在没有人员确认处理告警呼叫的情况下,向兜底人员针对本次告警呼叫的待告警通知进行告警呼叫,以使得兜底人员进一步联系相关人员,确保待告警通知被及时有效地处理。
下面,以计算机设备包括消息模块、告警模块、配置模块、OA模块,第一确认处理信息包括数值1、第二确认处理信息包括数值2为例,对本申请实施例提供的技术方案进行介绍说明。
如图4所示,在进行自动化告警处理之前,需要先进行告警相关的配置。本申请实施例中,告警相关的配置包括:告警人员配置、告警呼叫配置、响应结果配置。
首先,介绍说明告警人员配置。本申请实施例提供的告警人员配置包括以下几种方案,实际应用中用户可以自由选择。
(1)类似于值班表,每天安排不同的人员。若安排的人员没有接到告警呼叫,则升级到上级人员(上级人员相关的信息从OA模块获取),如此递归,直到其中任意一个人员接通并确认为止。
(2)如果不想升级给上级,可以将负责处理此类待告警通知的所有人员写入,从第一个人开始轮询通知,直到其中任意一个人员接通并确认为止。
(3)将(1)与(2)结合,即第一个通知的人员是值班表里配置的,后面升级的人员是列表里其他人员,直到其中任意一个人员接通并确认为止。
其次,介绍说明告警呼叫配置。
告警呼叫配置主要包括:告警呼叫未接通或未确认情况下,重复呼叫的次数,以及每次重复呼叫的时间间隔。
再次,介绍说明响应结果配置。响应结果配置主要包括以下几种情况。
(1)有人员接通并回复1,说明该人员只确认本次告警,告警呼叫完成,不需要进行升级操作。
(2)有人员接通并回复2,说明该人员针对此类告警N(N为正数)分钟内,不再告警呼叫,该人员已在处理问题,只需要看推送消息即可。
(3)有人员接通但未确认,或者,未接通且呼叫次数超过配置的次数,告警呼叫升级。
需要说明的一点是,由于后续自动化告警是以这些配置信息为基础,因此,需要提前确保录入到OA模块中的负责处理待告警通知的人员的电话信息准确无误。
如图4所示,在监控到异常情况时,发出待告警通知,并且,将待告警通知写入消息模块中的消息队列。
如图4所示,告警模块可以主动从消息模块中拉取待告警通知,并且根据配置模块及OA模块找到负责处理该待告警通知的人员的升级序列以及其他信息,并开始呼叫相关的人员。针对不同的响应结果,告警模块的处理如下。
(1)若当前人员未接通告警呼叫,则间隔X(X为正数)时间后,再次呼叫,重复Y(Y为正数)次,直到接通并确认。
(2)若(1)执行完后,还是未接通或确认,则升级下一个负责人员,重复(1)步骤,如此升级,直到其中一个人员接通。
(3)若有人员接通并回复1,说明该人员只确认本次告警呼叫,本次告警呼叫完成,后续有新告警,继续从第一个人员呼叫。
(4)若有人员接通并回复2,说明针对此类告警N分钟内不再电话通知。
(5)若告警呼叫升级到最后一个人员还未接通,则呼叫兜底人员,兜底人员确认,再联系相关人员处理问题。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
请参考图5,其示出了本申请一个实施例提供的告警处理装置的框图。该装置具有实现上述告警处理方法示例的功能,所述功能可以由硬件实现,也可以由硬件执行相应的软件实现。该装置可以是计算机设备,也可以设置在计算机设备中。该装置500可以包括:通知获取模块510、人员确定模块520、告警呼叫模块530和告警处理模块540。
通知获取模块510,用于获取当前待告警通知。
人员确定模块520,用于确定所述当前待告警通知对应的人员配置信息,所述人员配置信息是指负责处理所述当前待告警通知的人员所对应的配置信息。
告警呼叫模块530,用于基于所述人员配置信息,针对所述当前待告警通知进行告警呼叫。
告警处理模块540,用于按照所述告警呼叫的响应结果,对目标待告警通知进行告警处理;其中,所述目标待告警通知是指基于所述响应结果和所述当前待告警通知确定的待告警通知。
可选地,所述响应结果包括第一响应结果,所述第一响应结果用于指示接收到针对所述告警呼叫的第一确认处理信息,所述第一确认处理信息用于指示确认处理所述当前待告警通知;所述目标待告警通知包括除所述当前待告警通知之外的待告警通知;所述告警处理模块540,用于:针对所述目标待告警通知,从确定所述当前待告警通知对应的人员配置信息的步骤开始再次执行;其中,所述再次执行时的当前待告警通知为所述目标待告警通知。
可选地,所述响应结果包括第二响应结果,所述第二响应结果用于指示接收到针对所述告警呼叫的第二确认处理信息,所述第二确认处理信息用于指示确认处理所述当前待告警通知所属类别下的所有待告警通知;所述目标待告警通知包括所述当前待告警通知所属类别下除所述当前待告警通知之外的待告警通知;所述告警处理模块540,用于:确定所述第二确认处理信息的确认人员;在目标时间段内,向所述确认人员针对所述目标待告警通知进行信息推送。
可选地,所述响应结果包括第三响应结果,所述第三响应结果用于指示未接收到针对所述告警呼叫的确认处理信息;所述目标告警通知包括所述当前待告警通知;所述告警处理模块540,用于:确定目标人员,所述目标人员负责联系所述人员配置信息所指示的人员;向所述目标人员针对所述当前待告警通知进行告警呼叫。
可选地,所述人员配置信息用于指示负责处理所述当前待告警通知的n个人员,n为大于或等于2的整数;所述告警呼叫模块530,用于:按照目标呼叫方式,向所述n个人员中的第i个人员针对所述待告警通知进行所述告警呼叫,所述i为小于或等于所述n的正整数;在未接收到针对所述告警呼叫的确认处理信息的情况下,按照所述目标呼叫方式,向所述n个人员中的第i+1个人员针对所述待告警通知进行告警呼叫,所述第i+1个人员的优先级低于所述第i个人员的优先级。
可选地,所述目标呼叫方式包括按照目标时间间隔重复进行目标次数的告警呼叫。
可选地,所述人员确定模块520,用于:确定所述当前待告警通知的属性信息;从至少一个配置信息中,选择与所述属性信息对应的配置信息,作为所述当前待告警通知对应的人员配置信息。
可选地,所述属性信息包括以下至少一项:待告警通知的获取时间、待告警通知的通知类别。
综上所述,本申请实施例提供的技术方案,通过由计算机设备根据待告警通知确定负责处理待告警通知的人员,并向负责处理待告警通知的人员进行告警呼叫,以实现针对监控异常情况进行自动化告警,提升了告警效率。相比于由专门人员24小时值班可能会在同一时间处理不来所有的异常情况,由计算机设备进行自动化告警节约了人力成本,并且可以针对异常情况及时进行告警,以避免由于告警不及时导致的损失和危害等。并且,本申请实施例提供的技术方案,针对告警呼叫不同的响应结果,进行不同的告警处理,一方面可以确保待告警通知及时有效地进行了相关的处理,另一方面可以灵活进行告警处理。
需要说明的是,上述实施例提供的装置在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
在示例性实施例中,还提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现如上述告警处理方法。
在示例性实施例中,还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述告警处理方法。
在示例性实施例中,还提供一种计算机程序产品,当所述计算机程序产品在计算机设备上运行时,使得计算机设备执行如上述告警处理方法。
以上所述仅为本申请的示例性实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (9)

1.一种告警处理方法,其特征在于,所述方法包括:
获取当前待告警通知;
确定所述当前待告警通知对应的人员配置信息,所述人员配置信息是指负责处理所述当前待告警通知的人员所对应的配置信息;
基于所述人员配置信息,针对所述当前待告警通知进行告警呼叫;
在接收到针对所述告警呼叫的第一确认处理信息的情况下,将除所述当前待告警通知之外的待告警通知作为新的所述当前待告警通知,从所述确定所述当前待告警通知对应的人员配置信息的步骤开始执行,所述第一确认处理信息用于指示确认处理所述当前待告警通知;
在接收到针对所述告警呼叫的第二确认处理信息的情况下,确认所述第二确认处理信息的确认人员,所述第二确认处理信息用于指示确认处理所述当前待告警通知所属类别下的待告警通知;在目标时间段内,向所述确认人员针对所述当前待告警通知所属类别下除所述当前待告警通知之外的待告警通知进行消息推送。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在未接收到针对所述告警呼叫的确认处理信息的情况下,确定目标人员,所述目标人员负责联系所述人员配置信息所指示的人员;
向所述目标人员针对所述当前待告警通知进行告警呼叫。
3.根据权利要求1所述的方法,其特征在于,所述人员配置信息用于指示负责处理所述当前待告警通知的n个人员,n为大于或等于2的整数;
所述基于所述人员配置信息,针对所述当前待告警通知进行告警呼叫,包括:
按照目标呼叫方式,向所述n个人员中的第i个人员针对所述待告警通知进行所述告警呼叫,所述i为小于或等于所述n的正整数;
在未接收到针对所述告警呼叫的确认处理信息的情况下,按照所述目标呼叫方式,向所述n个人员中的第i+1个人员针对所述待告警通知进行告警呼叫,所述第i+1个人员的优先级低于所述第i个人员的优先级。
4.根据权利要求3所述的方法,其特征在于,所述目标呼叫方式包括按照目标时间间隔重复进行目标次数的告警呼叫。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述确定所述当前待告警通知对应的人员配置信息,包括:
确定所述当前待告警通知的属性信息;
从至少一个配置信息中,选择与所述属性信息对应的配置信息,作为所述当前待告警通知对应的人员配置信息。
6.根据权利要求5所述的方法,其特征在于,所述属性信息包括以下至少一项:待告警通知的获取时间、待告警通知的通知类别。
7.一种告警处理装置,应用上述权利要求1所述的方法,其特征在于,所述装置包括:
通知获取模块,用于获取当前待告警通知;
人员确定模块,用于确定所述当前待告警通知对应的人员配置信息,所述人员配置信息是指负责处理所述当前待告警通知的人员所对应的配置信息;
告警呼叫模块,用于基于所述人员配置信息,针对所述当前待告警通知进行告警呼叫;
告警处理模块,用于在接收到针对所述告警呼叫的第一确认处理信息的情况下,将除所述当前待告警通知之外的待告警通知作为新的所述当前待告警通知,从所述确定所述当前待告警通知对应的人员配置信息的步骤开始执行,所述第一确认处理信息用于指示确认处理所述当前待告警通知;在接收到针对所述告警呼叫的第二确认处理信息的情况下,确认所述第二确认处理信息的确认人员,所述第二确认处理信息用于指示确认处理所述当前待告警通知所属类别下的待告警通知;在目标时间段内,向所述确认人员针对所述当前待告警通知所属类别下除所述当前待告警通知之外的待告警通知进行消息推送。
8.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现如权利要求1至6任一项所述的告警处理方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的告警处理方法。
CN202011470336.6A 2020-12-14 2020-12-14 告警处理方法、装置、设备及存储介质 Active CN112383442B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011470336.6A CN112383442B (zh) 2020-12-14 2020-12-14 告警处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011470336.6A CN112383442B (zh) 2020-12-14 2020-12-14 告警处理方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN112383442A CN112383442A (zh) 2021-02-19
CN112383442B true CN112383442B (zh) 2023-09-15

Family

ID=74590747

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011470336.6A Active CN112383442B (zh) 2020-12-14 2020-12-14 告警处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112383442B (zh)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106411548A (zh) * 2015-07-30 2017-02-15 中兴通讯股份有限公司 告警信息通知方法、装置及告警信息过滤设备
CN111782487A (zh) * 2020-07-10 2020-10-16 中国建设银行股份有限公司 一种告警通知方法和装置

Also Published As

Publication number Publication date
CN112383442A (zh) 2021-02-19

Similar Documents

Publication Publication Date Title
CN111711697A (zh) 消息推送方法、装置、设备及存储介质
CN109669835A (zh) MySQL数据库监控方法、装置、设备及可读存储介质
CN112286770A (zh) 告警通知的方法、装置、计算机设备及存储介质
CN107819745B (zh) 异常流量的防御方法和装置
CN111010318A (zh) 发现物联网终端设备失联的方法、系统和设备影子服务器
CN111090532B (zh) 应用服务的调用方法、其装置、电子设备及计算机存储介质
CN110968410B (zh) 任务失败重试方法、装置、计算机设备及存储介质
CN109639490B (zh) 一种宕机通知方法及装置
CN112383442B (zh) 告警处理方法、装置、设备及存储介质
CN116488989A (zh) 监控接口访问数据出现异常的方法、计算机设备、计算机可读存储介质
CN112398725B (zh) 群消息提示方法、系统、计算机设备及存储介质
CN114328156B (zh) 协议端口的健康检测方法、装置、设备及可读存储介质
CN108881646B (zh) 呼叫中心的任务跟踪方法、装置、设备及存储介质
CN112751743A (zh) 消息发送异常的处理方法、消息发送装置和电子设备
CN112270531B (zh) 事项通知方法、装置、服务器及存储介质
CN110888770B (zh) 用于发送信息的方法和装置
CN109040491A (zh) 挂机行为处理方法、装置、计算机设备及存储介质
CN111290873B (zh) 故障处理方法和装置
CN114565425A (zh) 消息推送方法、装置、电子设备及存储介质
CN113032492A (zh) 一种边缘端数据传输与存储的方法以及装置
CN112799921A (zh) 一种多设备、多网络环境运维监控方法、装置及存储介质
CN112770275A (zh) 一种消息推送方法、系统及相关设备
CN112860504A (zh) 监控方法及装置、计算机存储介质、电子设备
CN114979187B (zh) 一种数据处理方法及装置
CN117950703A (zh) 维测数据的自适应更新方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant