CN108768753B - 告警源的定位方法、装置、存储介质及电子装置 - Google Patents

告警源的定位方法、装置、存储介质及电子装置 Download PDF

Info

Publication number
CN108768753B
CN108768753B CN201810671412.6A CN201810671412A CN108768753B CN 108768753 B CN108768753 B CN 108768753B CN 201810671412 A CN201810671412 A CN 201810671412A CN 108768753 B CN108768753 B CN 108768753B
Authority
CN
China
Prior art keywords
alarm
alarms
historical
target
association relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810671412.6A
Other languages
English (en)
Other versions
CN108768753A (zh
Inventor
李春晓
李雄政
张加浪
郝开青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201810671412.6A priority Critical patent/CN108768753B/zh
Publication of CN108768753A publication Critical patent/CN108768753A/zh
Application granted granted Critical
Publication of CN108768753B publication Critical patent/CN108768753B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/065Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/064Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Alarm Systems (AREA)

Abstract

本发明公开了一种告警源的定位方法、装置、存储介质及电子装置。其中,该方法包括:检测到多个告警同时发生;从告警关联关系集合中获取目标关联关系,其中,所述告警关联关系集合中包括第一告警和第二告警之间的关联关系,所述第一告警和第二告警之间的关联关系指所述第一告警的发生导致了所述第二告警的发生,目标关联关系为上述多个告警之间的关联关系;依据所述目标关联关系确定所述多个告警中的告警源,其中,所述告警源为导致所述多个告警同时发生的告警。本发明解决了相关技术中对告警源进行定位时的定位效率较低的技术问题。

Description

告警源的定位方法、装置、存储介质及电子装置
技术领域
本发明涉及计算机领域,具体而言,涉及一种告警源的定位方法、装置、存储介质及电子装置。
背景技术
模调是指后台服务逻辑层调用质量监控,以每分钟为一个粒度,如果连续几次成功率异常(低于某个值或波动范围超过某阈值)则产生一条告警。在模调过程中,很有可能同时产生多条告警,而在这种情况下,维护人员需要知道告警的根源,从而对系统进行维护,使得系统能够正常运行。目前查找告警根源的方式是人工一个个查看告警模块,查看调用关系,逐步由上层定位到下层找到根源。采用这种方式,更多的依赖于人工或者经验判断,维护人员需查询的告警过多,导致问题定位时长较长,严重影响了对告警源进行定位时的定位效率。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种告警源的定位方法、装置、存储介质及电子装置,以至少解决相关技术中对告警源进行定位时的定位效率较低的技术问题。
根据本发明实施例的一个方面,提供了一种告警源的定位方法,包括:检测到多个告警同时发生;从告警关联关系集合中获取目标关联关系,其中,所述告警关联关系集合中包括第一告警和第二告警之间的关联关系,所述第一告警和第二告警之间的关联关系指所述第一告警的发生导致了所述第二告警的发生,所述目标关联关系为所述多个告警之间的关联关系;依据所述目标关联关系确定所述多个告警中的告警源,其中,所述告警源为导致所述多个告警同时发生的告警。
根据本发明实施例的另一方面,还提供了一种告警源的定位装置,包括:检测模块,用于检测到多个告警同时发生;第一获取模块,用于从告警关联关系集合中获取目标关联关系,其中,所述告警关联关系集合中包括第一告警和第二告警之间的关联关系,所述第一告警和第二告警之间的关联关系指所述第一告警的发生导致了所述第二告警的发生,所述目标关联关系为所述多个告警之间的关联关系;第一确定模块,用于依据所述目标关联关系确定所述多个告警中的告警源,其中,所述告警源为导致所述多个告警同时发生的告警。
根据本发明实施例的另一方面,还提供了一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项中所述的方法。
根据本发明实施例的另一方面,还提供了一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行上述任一项中所述的方法。
在本发明实施例中,采用检测到多个告警同时发生;从告警关联关系集合中获取目标关联关系,其中,所述告警关联关系集合中包括第一告警和第二告警之间的关联关系,所述第一告警和第二告警之间的关联关系指所述第一告警的发生导致了所述第二告警的发生,目标关联关系为上述多个告警之间的关联关系;依据所述目标关联关系确定所述多个告警中的告警源,其中,所述告警源为导致所述多个告警同时发生的告警的方式,当多个告警同时发生时,从告警关联关系集合中获取同时发生的这多个告警之间的目标关联关系,在目标关联关系中记录了多个告警之间的因果关系,从而根据该目标关联关系确定多个告警中的告警源,不必再由人工逐个排查各个告警,节省了人力的同时,也加快了告警源的定位速度,从而实现了提高对告警源进行定位时的定位效率的技术效果,进而解决了相关技术中对告警源进行定位时的定位效率较低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的告警源的定位方法的示意图;
图2是根据本发明实施例的一种可选的告警源的定位方法的应用环境示意图;
图3是根据本发明可选的实施方式的一种可选的告警源的定位方法的示意图;
图4是根据本发明可选的实施方式的另一种可选的告警源的定位方法的示意图;
图5是根据本发明实施例的一种可选的告警源的定位装置的示意图;
图6是根据本发明实施例的一种可选的告警源的定位方法的应用场景示意图;以及
图7是根据本发明实施例的一种可选的电子装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例的一个方面,提供了一种告警源的定位方法,如图1所示,该方法包括:
S102,检测到多个告警同时发生;
S104,从告警关联关系集合中获取目标关联关系,其中,告警关联关系集合中包括第一告警和第二告警之间的关联关系,第一告警和第二告警之间的关联关系指第一告警的发生导致了第二告警的发生,目标关联关系为上述多个告警之间的关联关系;
S106,依据目标关联关系确定多个告警中的告警源,其中,告警源为导致多个告警同时发生的告警。
可选地,在本实施例中,上述告警源的定位方法可以应用于如图2所示的服务器202所构成的硬件环境中。如图2所示,服务器202检测到多个告警同时发生;从告警关联关系集合中获取目标关联关系,其中,所述告警关联关系集合中包括第一告警和第二告警之间的关联关系,所述第一告警和第二告警之间的关联关系指所述第一告警的发生导致了所述第二告警的发生,目标关联关系为上述多个告警之间的关联关系;依据所述目标关联关系确定所述多个告警中的告警源,其中,所述告警源为导致所述多个告警同时发生的告警。
可选地,在本实施例中,上述告警源的定位方法可以但不限于应用于对告警源进行定位的场景中。其中,上述告警源的定位方法可以但不限于应用于各种类型的应用中,例如,在线教育应用、即时通讯应用、社区空间应用、游戏应用、购物应用、浏览器应用、金融应用、多媒体应用、直播应用等。具体的,可以但不限于应用于在上述游戏应用中对告警源进行定位的场景中,或还可以但不限于应用于在上述浏览器应用中对告警源进行定位的场景中,以提高告警源的定位效率。上述仅是一种示例,本实施例中对此不做任何限定。
可选地,在本实施例中,多个告警同时发生可以但不限于指两个或者两个以上的告警同时发生,或者说至少两个告警同时发生。
可选地,在本实施例中,告警关联关系集合中可以但不限于包括第一告警和第二告警之间的关联关系,第一告警和第二告警之间的关联关系可以指第一告警的发生导致了第二告警的发生。第一告警和第二告警均可以但不限于为一个或者多个告警,也就是说,一个告警引发一个告警、一个告警引发多个告警、多个告警引发一个告警、多个告警引发多个告警的情况都是可能存在的。
可选地,在本实施例中,对于一个告警引发多个告警的情况,可以在告警关联关系集合中记录一个告警引发多个告警中每个告警的多条关联关系,因为若一个告警导致多个告警同时发生,那么它导致多个告警中每个告警单独发生也是必然成立的。
可选地,在本实施例中,对于多个告警引发多个告警的情况,可以在告警关联关系集合中记录多个告警引发多个告警中每个告警的多条关联关系,因为若多个告警导致多个告警同时发生,那么它们导致多个告警中每个告警单独发生也是必然成立的。
可选地,在本实施例中,目标关联关系中包括的告警均为多个告警中的告警,也就是说,从告警关联关系集合中获取目标关联关系的过程可以是在告警关联关系集合中查找同时发生的多个告警所命中的关联关系,也就是从告警关联关系集合中找到这多个告警互相之间的关联关系。
在一个可选的实施方式中,如图3所示,检测到A,B,C同时告警,从告警关联关系集合中获取到这3个告警命中了两条目标关联关系A->B,B->C,也就是说,B是A的结果,又是C的起因,依据上述目标关联关系可以确定A,B,C这三条告警的告警源是A。
可见,通过上述步骤,当多个告警同时发生时,从告警关联关系集合中获取同时发生的这多个告警之间的目标关联关系,在目标关联关系中记录了多个告警之间的因果关系,从而根据该目标关联关系确定多个告警中的告警源,不必再由人工逐个排查各个告警,节省了人力的同时,也加快了告警源的定位速度,从而实现了提高对告警源进行定位时的定位效率的技术效果,进而解决了相关技术中对告警源进行定位时的定位效率较低的技术问题。
作为一种可选的方案,依据目标关联关系确定多个告警中的告警源包括:
S1,将目标关联关系转换为告警传播链,其中,告警传播链用于指示多个告警之间的传播顺序;
S2,根据告警传播链确定多个告警中的告警源。
可选地,在本实施例中,依据目标关联关系可以将多个告警串联在告警传播链中,使用告警传播链来表示多个告警之间的关联关系,能够简单直接、方便快捷地确定出告警源。
可选地,在本实施例中,告警传播链并不一定是真实的调用链路,它的目的仅在于将告警串联起来,找出引发多个告警同时发生的根源所在,从而高效地解决告警问题,而不是分析调用关系。
作为一种可选的方案,根据告警传播链确定多个告警中的告警源包括:
S1,在告警传播链所指示的传播顺序为告警传播链中一个告警的发生导致了排列在一个告警后面一个告警的发生的情况下,将位于告警传播链最前部的告警确定为告警源;或者,
S2,在告警传播链所指示的传播顺序为告警传播链中一个告警的发生是由排列在一个告警后面一个告警的发生所导致的情况下,将位于告警传播链最后部的告警确定为告警源。
可选地,在本实施例中,告警传播链可以是按照告警的传播顺序正向排列的,也可以是按照告警的传播顺序逆向排列的。比如:在正向排列的情况下,是由排在前面的告警引发了排在后面的告警的发生,因此可以将告警传播链最前部的告警确定为告警源。在逆向排列的情况下,是由排在后面的告警引发了排在前面的告警的发生,因此可以将告警传播链最后部的告警确定为告警源。
可选地,在本实施例中,采用告警传播链的方式表示告警之间的关联关系,能够清楚快捷地表示出同时发生的告警之间的引发关系,对于同时发生的告警数量较多的情况下,能够有效提高告警的定位效率。
在上述可选的实施方式中,如图4所示,两条目标关联关系A->B,B->C,可以转换为两种形式的告警传播链A->B->C或者C<-B<-A,依据上述告警传播链可以快速地确定A,B,C这三条告警的告警源是A。
作为一种可选的方案,在从告警关联关系集合中获取目标关联关系之前,还包括:
S1,获取目标时间段内发生的历史告警事件,其中,历史告警事件中包括多个同时发生的历史告警;
S2,根据历史告警事件确定告警关联关系集合。
可选地,在本实施例中,从历史告警事件中统计出告警之间的关联关系,形成告警关联关系集合,当再次同时发生多个告警时,则可以利用该告警关联关系集合来确定多个告警之间的目标关联关系,从而定位出告警源,使得能够更加高效地对告警源进行定位。
可选地,在本实施例中,目标时间段可以设定为较近的一段时间,例如:近2个月、近半年、近一年等等。也可以被设定为是一段特定的时间,例如:每年的4月至10月、2017年的全年等等。或者还可以被设定为从系统开始运行到本次获取历史告警事件是整个时段。也就是说,获取系统上发生的全部历史告警事件。
作为一种可选的方案,根据历史告警事件确定告警关联关系集合包括:
S1,获取历史告警事件的频繁项集,以及频繁项集中每个频繁项对应的支持度,其中,频繁项用于记录第一历史告警和第二历史告警同时发生,支持度用于指示第一历史告警和第二历史告警在历史告警事件中同时发生的次数;
S2,将频繁项集中支持度高于目标支持度的频繁项确定为目标频繁项;
S3,确定目标频繁项中每个目标频繁项对应的置信度,其中,置信度用于指示第一历史告警与第二历史告警之间具有关联关系的概率,第一历史告警与第二历史告警之间具有关联关系指第一历史告警的发生导致第二历史告警发生的概率;
S4,将高于目标置信度的置信度所指示的第一历史告警和第二历史告警之间的关联关系确定为第一告警和第二告警之间的关联关系,得到告警关联关系集合。
可选地,在本实施例中,可以但不限于采用FP-Growth算法获取频繁项集,再采用Apriori算法的思想获取告警之间的关联关系。
可选地,在本实施例中,目标支持度是获取频繁项集(经常一起出现的告警的集合)时定义的支持度的最小值,支持度高于该最小值的频繁项可以认为是满足条件的频繁项,将其确定为目标频繁项。在本实施例中,支持度用告警同时出现的次数表示。
可选地,在本实施例中,目标置信度是确定关联关系时定义的置信度的最小值。置信度是个条件概率值。如A告警发生引发B告警发生的概率,即P(B|A),大于设置的目标置信度,则A->B形成一个告警关联关系。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
根据本发明实施例的另一个方面,还提供了一种用于实施上述告警源的定位方法的告警源的定位装置,如图5所示,该装置包括:
检测模块52,用于检测到多个告警同时发生;
第一获取模块54,用于从告警关联关系集合中获取目标关联关系,其中,告警关联关系集合中包括第一告警和第二告警之间的关联关系,第一告警和第二告警之间的关联关系指第一告警的发生导致了第二告警的发生,目标关联关系为上述多个告警之间的关联关系;
第一确定模块56,用于依据目标关联关系确定多个告警中的告警源,其中,告警源为导致多个告警同时发生的告警。
可选地,在本实施例中,上述告警源的定位装置可以应用于如图2所示的服务器202所构成的硬件环境中。如图2所示,服务器202检测到多个告警同时发生;从告警关联关系集合中获取目标关联关系,其中,所述告警关联关系集合中包括第一告警和第二告警之间的关联关系,所述第一告警和第二告警之间的关联关系指所述第一告警的发生导致了所述第二告警的发生,目标关联关系为多个告警之间的关联关系;依据所述目标关联关系确定所述多个告警中的告警源,其中,所述告警源为导致所述多个告警同时发生的告警。
可选地,在本实施例中,上述告警源的定位装置可以但不限于应用于对告警源进行定位的场景中。其中,上述告警源的定位装置可以但不限于应用于各种类型的应用中,例如,在线教育应用、即时通讯应用、社区空间应用、游戏应用、购物应用、浏览器应用、金融应用、多媒体应用、直播应用等。具体的,可以但不限于应用于在上述游戏应用中对告警源进行定位的场景中,或还可以但不限于应用于在上述浏览器应用中对告警源进行定位的场景中,以提高告警源的定位效率。上述仅是一种示例,本实施例中对此不做任何限定。
可选地,在本实施例中,多个告警同时发生可以但不限于指两个或者两个以上的告警同时发生,或者说至少两个告警同时发生。
可选地,在本实施例中,告警关联关系集合中可以但不限于包括第一告警和第二告警之间的关联关系,第一告警和第二告警之间的关联关系可以指第一告警的发生导致了第二告警的发生。第一告警和第二告警均可以但不限于为一个或者多个告警,也就是说,一个告警引发一个告警、一个告警引发多个告警、多个告警引发一个告警、多个告警引发多个告警的情况都是可能存在的。
可选地,在本实施例中,对于一个告警引发多个告警的情况,可以在告警关联关系集合中记录一个告警引发多个告警中每个告警的多条关联关系,因为若一个告警导致多个告警同时发生,那么它导致多个告警中每个告警单独发生也是必然成立的。
可选地,在本实施例中,对于多个告警引发多个告警的情况,可以在告警关联关系集合中记录多个告警引发多个告警中每个告警的多条关联关系,因为若多个告警导致多个告警同时发生,那么它们导致多个告警中每个告警单独发生也是必然成立的。
可选地,在本实施例中,目标关联关系中包括的告警均为多个告警中的告警,也就是说,从告警关联关系集合中获取目标关联关系的过程可以是在告警关联关系集合中查找同时发生的多个告警所命中的关联关系,也就是从告警关联关系集合中找到这多个告警互相之间的关联关系。
在一个可选的实施方式中,如图3所示,检测到A,B,C同时告警,从告警关联关系集合中获取到这3个告警命中了两条目标关联关系A->B,B->C,也就是说,B是A的结果,又是C的起因,依据上述目标关联关系可以确定A,B,C这三条告警的告警源是A。
可见,通过上述装置,当多个告警同时发生时,从告警关联关系集合中获取同时发生的这多个告警之间的目标关联关系,在目标关联关系中记录了多个告警之间的因果关系,从而根据该目标关联关系确定多个告警中的告警源,不必再由人工逐个排查各个告警,节省了人力的同时,也加快了告警源的定位速度,从而实现了提高对告警源进行定位时的定位效率的技术效果,进而解决了相关技术中对告警源进行定位时的定位效率较低的技术问题。
作为一种可选的方案,确定模块包括:
转换单元,用于将目标关联关系转换为告警传播链,其中,告警传播链用于指示多个告警之间的传播顺序;
第一确定单元,用于根据告警传播链确定多个告警中的告警源。
可选地,在本实施例中,依据目标关联关系可以将多个告警串联在告警传播链中,使用告警传播链来表示多个告警之间的关联关系,能够简单直接、方便快捷地确定出告警源。
可选地,在本实施例中,告警传播链并不一定是真实的调用链路,它的目的仅在于将告警串联起来,找出引发多个告警同时发生的根源所在,从而高效地解决告警问题,而不是分析调用关系。
作为一种可选的方案,第一确定单元包括:
第一确定子单元,用于在告警传播链所指示的传播顺序为告警传播链中一个告警的发生导致了排列在一个告警后面一个告警的发生的情况下,将位于告警传播链最前部的告警确定为告警源;或者,
第二确定子单元,用于在告警传播链所指示的传播顺序为告警传播链中一个告警的发生是由排列在一个告警后面一个告警的发生所导致的情况下,将位于告警传播链最后部的告警确定为告警源。
可选地,在本实施例中,告警传播链可以是按照告警的传播顺序正向排列的,也可以是按照告警的传播顺序逆向排列的。比如:在正向排列的情况下,是由排在前面的告警引发了排在后面的告警的发生,因此可以将告警传播链最前部的告警确定为告警源。在逆向排列的情况下,是由排在后面的告警引发了排在前面的告警的发生,因此可以将告警传播链最后部的告警确定为告警源。
可选地,在本实施例中,采用告警传播链的方式表示告警之间的关联关系,能够清楚快捷地表示出同时发生的告警之间的引发关系,对于同时发生的告警数量较多的情况下,能够有效提高告警的定位效率。
在上述可选的实施方式中,如图4所示,两条目标关联关系A->B,B->C,可以转换为两种形式的告警传播链A->B->C或者C<-B<-A,依据上述告警传播链可以快速地确定A,B,C这三条告警的告警源是A。
作为一种可选的方案,上述装置还包括:
第二获取模块,用于获取目标时间段内发生的历史告警事件,其中,历史告警事件中包括多个同时发生的历史告警;
第二确定模块,用于根据历史告警事件确定告警关联关系集合。
可选地,在本实施例中,从历史告警事件中统计出告警之间的关联关系,形成告警关联关系集合,当再次同时发生多个告警时,则可以利用该告警关联关系集合来确定多个告警之间的目标关联关系,从而定位出告警源,使得能够更加高效地对告警源进行定位。
可选地,在本实施例中,目标时间段可以设定为较近的一段时间,例如:近2个月、近半年、近一年等等。也可以被设定为是一段特定的时间,例如:每年的4月至10月、2017年的全年等等。或者还可以被设定为从系统开始运行到本次获取历史告警事件是整个时段。也就是说,获取系统上发生的全部历史告警事件。
作为一种可选的方案,第二确定模块包括:
获取单元,用于获取历史告警事件的频繁项集,以及频繁项集中每个频繁项对应的支持度,其中,频繁项用于记录第一历史告警和第二历史告警同时发生,支持度用于指示第一历史告警和第二历史告警在历史告警事件中同时发生的次数;
第二确定单元,用于将频繁项集中支持度高于目标支持度的频繁项确定为目标频繁项;
第三确定单元,用于确定目标频繁项中每个目标频繁项对应的置信度,其中,置信度用于指示第一历史告警与第二历史告警之间具有关联关系的概率,第一历史告警与第二历史告警之间具有关联关系指第一历史告警的发生导致第二历史告警发生的概率;
第四确定单元,用于将高于目标置信度的置信度所指示的第一历史告警和第二历史告警之间的关联关系确定为第一告警和第二告警之间的关联关系,得到告警关联关系集合。
可选地,在本实施例中,可以但不限于采用FP-Growth算法获取频繁项集,再采用Apriori算法的思想获取告警之间的关联关系。
可选地,在本实施例中,目标支持度是获取频繁项集(经常一起出现的告警的集合)时定义的支持度的最小值,支持度高于该最小值的频繁项可以认为是满足条件的频繁项,将其确定为目标频繁项。在本实施例中,支持度用告警同时出现的次数表示。
可选地,在本实施例中,目标置信度是确定关联关系时定义的置信度的最小值。置信度是个条件概率值。如A告警发生引发B告警发生的概率,即P(B|A),大于设置的目标置信度,则A->B形成一个告警关联关系。
本发明实施例的应用环境可以但不限于参照上述实施例中的应用环境,本实施例中对此不再赘述。本发明实施例提供了用于实施上述实时通信的连接方法的一种可选的具体应用示例。
作为一种可选的实施例,上述告警源的定位方法可以但不限于应用于如图6所示的对告警源进行定位的场景中。在本场景中,由历史告警事件分析出历史告警之间的告警关联关系,当实时告警发生时,依据关联关系确定出告警的告警传播链,找出最底层的告警,即为告警根源,直接将其解决,无需人工定位。告警关联关系则基于频繁项集,首先获取频繁项集和支持度,再进一步获取告警关联关系。Apriori算法能获取关联关系,但效率较低,工程不适用,而FP-Growth算法仅能获取频繁项集,无法获取关联关系。本实施例中借鉴Apriori的思路,对FP-Growth算法进行了改造,使其支持关联关系的获取。
在本场景中,确定目标支持度为30,目标置信度为80%,取过去两个月的历史告警事件,同时告警30次以上的告警事件构成频繁项集,M告警引起N告警的概率超过80%,则形成一条M->N的关联规则,由此产生了告警关联关系集合,由{warn_from},{warn_to},probabiliy构成一条关联关系,意思为:warn_from告警发生后warn_to告警会发生的概率为probability。warn_from,warn_to可以都是一个集合,可能存在多条。而warn_to可以只取一条的即可,因为若一个告警导致{P,Q}同时发生,那么它导致P和Q单独发生,也必然成立。如图6所示,A,B,C同时告警,命中了如图6所示的两条关联关系,B是A的结果,又是C的起因,可确定出一个告警传播链:A->B->C,即A,B,C这三条告警的告警源是A。从而实现对告警源的高效定位。
根据本发明实施例的又一个方面,还提供了一种用于实施上述告警源的定位的电子装置,如图7所示,该电子装置包括:一个或多个(图中仅示出一个)处理器702、存储器704、传感器706、编码器708以及传输装置710,该存储器中存储有计算机程序,该处理器被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述电子装置可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,检测到多个告警同时发生;
S2,从告警关联关系集合中获取目标关联关系,其中,告警关联关系集合中包括第一告警和第二告警之间的关联关系,第一告警和第二告警之间的关联关系指第一告警的发生导致了第二告警的发生,目标关联关系为上述多个告警之间的关联关系;
S3,依据目标关联关系确定多个告警中的告警源,其中,告警源为导致多个告警同时发生的告警。
可选地,本领域普通技术人员可以理解,图7所示的结构仅为示意,电子装置也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图7其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比图7中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图7所示不同的配置。
其中,存储器702可用于存储软件程序以及模块,如本发明实施例中的告警源的定位方法和装置对应的程序指令/模块,处理器704通过运行存储在存储器702内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的目标组件的控制方法。存储器702可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器702可进一步包括相对于处理器704远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述的传输装置710用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置710包括一个网络适配器(NetworkInterface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置710为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
其中,具体地,存储器702用于存储应用程序。
本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,检测到多个告警同时发生;
S2,从告警关联关系集合中获取目标关联关系,其中,告警关联关系集合中包括第一告警和第二告警之间的关联关系,第一告警和第二告警之间的关联关系指第一告警的发生导致了第二告警的发生,目标关联关系为上述多个告警之间的关联关系;
S3,依据目标关联关系确定多个告警中的告警源,其中,告警源为导致多个告警同时发生的告警。
可选地,存储介质还被设置为存储用于执行上述实施例中的方法中所包括的步骤的计算机程序,本实施例中对此不再赘述。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (8)

1.一种告警源的定位方法,应用于应用程序的告警,其特征在于,包括:
获取历史告警事件的频繁项集,以及所述频繁项集中每个频繁项对应的支持度;其中,所述频繁项用于记录第一历史告警和第二历史告警同时发生,所述支持度用于指示所述第一历史告警和所述第二历史告警在所述历史告警事件中同时发生的次数;
将所述频繁项集中所述支持度高于目标支持度的频繁项确定为目标频繁项;
确定所述目标频繁项中每个目标频繁项对应的置信度,其中,所述置信度用于指示所述第一历史告警与所述第二历史告警之间具有关联关系的概率,所述第一历史告警与所述第二历史告警之间具有关联关系指所述第一历史告警的发生导致所述第二历史告警发生的概率;
将高于目标置信度的所述置信度所指示的所述第一历史告警和所述第二历史告警之间的关联关系确定为第一告警和第二告警之间的关联关系,得到所述告警关联关系集合;
在检测到多个告警同时发生时,所述多个告警同时发生指两个以上的告警同时发生;从告警关联关系集合中获取所述多个告警在所述告警关联集合中命中的关联关系,得到目标关联关系,其中,所述告警关联关系集合中包括第一告警和第二告警之间的关联关系,所述第一告警和第二告警之间的关联关系指所述第一告警的发生导致了所述第二告警的发生,所述目标关联关系为所述多个告警互相之间的关联关系,目标关联关系中包括的告警均为多个告警中的告警;
将所述目标关联关系转换为告警传播链,其中,所述告警传播链用于指示所述多个告警之间的传播顺序;
依据所述目标关联关系对应的告警传播链确定所述多个告警中的告警源,其中,所述告警源为导致所述多个告警同时发生的告警。
2.根据权利要求1所述的方法,其特征在于,所述依据所述目标关联关系对应的告警传播链确定所述多个告警中的告警源包括:
在所述告警传播链所指示的所述传播顺序为所述告警传播链中一个告警的发生导致了排列在所述一个告警后面一个告警的发生的情况下,将位于所述告警传播链最前部的告警确定为所述告警源;或者,
在所述告警传播链所指示的所述传播顺序为所述告警传播链中一个告警的发生是由排列在所述一个告警后面一个告警的发生所导致的情况下,将位于所述告警传播链最后部的告警确定为所述告警源。
3.根据权利要求1所述的方法,其特征在于,在从告警关联关系集合中获取目标关联关系之前,所述方法还包括:
获取目标时间段内发生的历史告警事件,其中,所述历史告警事件中包括多个同时发生的历史告警。
4.一种告警源的定位装置,应用于应用程序的告警,其特征在于,包括:
第二确定模块,用于获取历史告警事件的频繁项集,以及所述频繁项集中每个频繁项对应的支持度,其中,所述频繁项用于记录第一历史告警和第二历史告警同时发生,所述支持度用于指示所述第一历史告警和所述第二历史告警在所述历史告警事件中同时发生的次数;将所述频繁项集中所述支持度高于目标支持度的频繁项确定为目标频繁项;确定所述目标频繁项中每个目标频繁项对应的置信度,其中,所述置信度用于指示所述第一历史告警与所述第二历史告警之间具有关联关系的概率,所述第一历史告警与所述第二历史告警之间具有关联关系指所述第一历史告警的发生导致所述第二历史告警发生的概率;以及,将高于目标置信度的所述置信度所指示的所述第一历史告警和所述第二历史告警之间的关联关系确定为第一告警和第二告警之间的关联关系,得到所述告警关联关系集合;
检测模块,用于检测到多个告警同时发生,所述多个告警同时发生指两个以上的告警同时发生;
第一获取模块,用于从告警关联关系集合中获取所述多个告警在所述告警关联集合中命中的关联关系,得到目标关联关系,其中,所述告警关联关系集合中包括第一告警和第二告警之间的关联关系,所述第一告警和第二告警之间的关联关系指所述第一告警的发生导致了所述第二告警的发生,所述目标关联关系为所述多个告警互相之间的关联关系,目标关联关系中包括的告警均为多个告警中的告警;
第一确定模块,用于将所述目标关联关系转换为告警传播链,其中,所述告警传播链用于指示所述多个告警之间的传播顺序;依据所述目标关联关系对应的告警传播链确定所述多个告警中的告警源,其中,所述告警源为导致所述多个告警同时发生的告警。
5.根据权利要求4所述的装置,其特征在于,所述第一确定模块包括:
第一确定子单元,用于在所述告警传播链所指示的所述传播顺序为所述告警传播链中一个告警的发生导致了排列在所述一个告警后面一个告警的发生的情况下,将位于所述告警传播链最前部的告警确定为所述告警源;或者,
第二确定子单元,用于在所述告警传播链所指示的所述传播顺序为所述告警传播链中一个告警的发生是由排列在所述一个告警后面一个告警的发生所导致的情况下,将位于所述告警传播链最后部的告警确定为所述告警源。
6.根据权利要求4所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于获取目标时间段内发生的历史告警事件,其中,所述历史告警事件中包括多个同时发生的历史告警。
7.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至3任一项中所述的方法。
8.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至3任一项中所述的方法。
CN201810671412.6A 2018-06-26 2018-06-26 告警源的定位方法、装置、存储介质及电子装置 Active CN108768753B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810671412.6A CN108768753B (zh) 2018-06-26 2018-06-26 告警源的定位方法、装置、存储介质及电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810671412.6A CN108768753B (zh) 2018-06-26 2018-06-26 告警源的定位方法、装置、存储介质及电子装置

Publications (2)

Publication Number Publication Date
CN108768753A CN108768753A (zh) 2018-11-06
CN108768753B true CN108768753B (zh) 2022-03-25

Family

ID=63977471

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810671412.6A Active CN108768753B (zh) 2018-06-26 2018-06-26 告警源的定位方法、装置、存储介质及电子装置

Country Status (1)

Country Link
CN (1) CN108768753B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109656969B (zh) * 2018-11-16 2024-08-23 北京奇虎科技有限公司 数据异动分析方法及装置
CN109633351B (zh) * 2018-12-13 2021-10-22 平安普惠企业管理有限公司 智能it运维故障定位方法、装置、设备及可读存储介质
CN110147387B (zh) * 2019-05-08 2023-06-09 腾讯科技(上海)有限公司 一种根因分析方法、装置、设备及存储介质
CN110149223B (zh) * 2019-05-10 2022-04-15 中国联合网络通信集团有限公司 故障定位方法和设备
CN112073208B (zh) 2019-05-25 2022-01-14 成都华为技术有限公司 一种告警分析方法、装置、芯片系统、存储介质
CN110460460B (zh) * 2019-07-08 2022-06-03 创新先进技术有限公司 业务链路故障定位方法、装置及设备
CN113051308A (zh) * 2019-12-27 2021-06-29 深信服科技股份有限公司 告警信息处理方法、设备、存储介质及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102136949A (zh) * 2011-03-24 2011-07-27 国网电力科学研究院 一种基于网络和时间的告警相关性分析方法及系统
CN107451708A (zh) * 2017-04-26 2017-12-08 国家电网公司 一种基于Apriori算法的电网设备监控信息置信关联分析方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102136949A (zh) * 2011-03-24 2011-07-27 国网电力科学研究院 一种基于网络和时间的告警相关性分析方法及系统
CN107451708A (zh) * 2017-04-26 2017-12-08 国家电网公司 一种基于Apriori算法的电网设备监控信息置信关联分析方法

Also Published As

Publication number Publication date
CN108768753A (zh) 2018-11-06

Similar Documents

Publication Publication Date Title
CN108768753B (zh) 告警源的定位方法、装置、存储介质及电子装置
CN109698934B (zh) 一种区域监控方法及装置
CN108011782B (zh) 用于推送告警信息的方法和装置
CN110475124B (zh) 视频卡顿检测方法及装置
CN108628721B (zh) 用户数据值的异常检测方法、装置、存储介质及电子装置
CN108509309B (zh) 一种基于访问日志进行性能监控的系统及方法
US20140143249A1 (en) Unsupervised prioritization and visualization of clusters
CN105868256A (zh) 处理用户行为数据的方法和系统
CN107748790B (zh) 一种线上服务系统、数据加载方法、装置及设备
CN105404631B (zh) 图片识别方法和装置
US11635985B2 (en) Using degree of completeness of real-time data to maximize product revenue
CN110609780A (zh) 数据监控方法、装置、电子设备及存储介质
CN112395156A (zh) 故障的告警方法和装置、存储介质和电子设备
CN107592236A (zh) 一种推广信息相关的业务数据的监控方法和装置
CN104378406B (zh) 信息推送方法及装置
CN109542294A (zh) 意见反馈方法、装置与存储介质
CN110300089B (zh) 目标帐号的处理方法、装置、存储介质及电子装置
CN105630650A (zh) 一种日志处理方法、装置及系统
CN112751711A (zh) 告警信息处理方法和装置、存储介质和电子设备
CN111540020A (zh) 目标行为的确定方法及装置、存储介质、电子装置
CN111124891A (zh) 接入状态的检测方法和装置、存储介质及电子装置
CN110196920B (zh) 文本数据的处理方法和装置、以及存储介质和电子装置
CN112395155A (zh) 服务的监控方法和装置、存储介质、电子装置
CN110598797B (zh) 故障的检测方法及装置、存储介质和电子装置
CN117118739A (zh) 网络安全规则的评估方法及装置、存储介质、电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant