CN110661660B - 告警信息根源分析方法及装置 - Google Patents

告警信息根源分析方法及装置 Download PDF

Info

Publication number
CN110661660B
CN110661660B CN201910913070.9A CN201910913070A CN110661660B CN 110661660 B CN110661660 B CN 110661660B CN 201910913070 A CN201910913070 A CN 201910913070A CN 110661660 B CN110661660 B CN 110661660B
Authority
CN
China
Prior art keywords
alarm information
node
root
horizontal
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910913070.9A
Other languages
English (en)
Other versions
CN110661660A (zh
Inventor
易存道
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baolande Software Co ltd
Original Assignee
Beijing Baolande Software Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baolande Software Co ltd filed Critical Beijing Baolande Software Co ltd
Priority to CN201910913070.9A priority Critical patent/CN110661660B/zh
Publication of CN110661660A publication Critical patent/CN110661660A/zh
Application granted granted Critical
Publication of CN110661660B publication Critical patent/CN110661660B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明实施例提供一种告警信息根源分析方法及装置,所述方法包括:从告警信息集中确定一目标告警信息;根据所述目标告警信息、预存的水平调用关系拓扑图和垂直部署关系拓扑图生成水平调用故障链和垂直部署故障链;根据所述水平调用故障链、垂直部署故障链确定所述目标告警信息的根源信息。本发明实施例提供的告警信息根源分析方法及装置,通过根据告警信息集、预存的水平调用关系拓扑图和垂直部署关系拓扑图生成水平调用故障链和垂直部署故障链,进而从水平调用故障链和垂直部署故障链获知引起当前告警或告警风暴的根源信息,做到深层分析告警之间的关联性,能够从根源上快速得到故障分析结果。

Description

告警信息根源分析方法及装置
技术领域
本发明涉及网络告警技术领域,尤其涉及一种告警信息根源分析方法及装置。
背景技术
在现在的运维系统中,由于当今生产集群规模越来越大,运维监控系统需要监控的节点服务越来越多,当集群中某个节点出现故障不能服务而产生告警时,往往会引起集群中其他节点的正常服务,导致其他节点也产生告警信息,从而产生告警风暴。因为告警的多面性、冗余性、耦合性,导致某些核心层面的故障会引起大面积告警的现象。
运维人员在处理告警信息时,一般都需要在这些告警的节点中找到真正引起告警风暴的罪魁祸首,希望导致出现告警的服务优先被处理和恢复。但是在传统的运维系统中,告警信息往往只是跟某个节点、某个服务、甚至于某个指标有关,各个告警信息之间是独立且散列,运维人员碰到告警风暴而产生的大量告警信息时,想要在诸多散列的告警信息中找到真正的告警源头和对应的服务,需要耗费大量的人力、精力和时间。其中生成系统中出现服务不可用时第一要务是恢复系统正常运行,这就意味着越多的时间消耗,损失就越大。
目前业界一些公司相继建立了对告警的统一引擎化处理,对来自不同系统间的告警进行分析处理,但这些产品在实时处理告警以及关联分析领域是比较薄弱的,由于缺乏统一的标准,不能深层次挖掘告警之间的关联关系,导致实际运行场景下效果与理想间差距。
发明内容
针对现有技术存在的问题,本发明实施例提供一种告警信息根源分析方法及装置。
本发明实施例提供一种告警信息根源分析方法,包括:
从告警信息集中确定一目标告警信息;
根据所述目标告警信息、预存的水平调用关系拓扑图和垂直部署关系拓扑图生成水平调用故障链和垂直部署故障链;
根据所述水平调用故障链、垂直部署故障链确定所述目标告警信息的根源信息。
可选地,所述根据所述目标告警信息、预存的水平调用关系拓扑图和垂直部署关系拓扑图生成水平调用故障链和垂直部署故障链,包括:
节点确定步骤:根据所述目标告警信息在所述水平调用关系拓扑图确定对应的目标应用节点;
节点关联步骤:根据所述水平调用关系拓扑图确定所述目标应用节点在服务过程中被调用的上级应用节点;
节点判断步骤:从所述告警信息集中确定对应于所述上级应用节点的所有告警信息,若所有告警信息中存在与所述目标告警信息相关联的告警信息,则将所述上级应用节点作为新的目标应用节点继续执行节点关联步骤;
水平调用故障链生成步骤:若所有告警信息中不存在与所述目标告警信息相关联的告警信息,则根据目标应用节点和上级应用节点生成水平调用故障链;
垂直部署故障链生成步骤:根据目标应用节点和上级应用节点确定在垂直部署中对应的设备节点,根据所述设备节点生成垂直部署故障链。
可选地,所述根据所述水平调用故障链、垂直部署故障链确定所述目标告警信息的根源信息,包括:
从所述水平调用故障链中确定最末端的上级应用节点作为应用根源节点,对应于所述应用根源节点的告警信息作为应用根源信息;
从所述垂直部署故障链中确定最末端的设备节点作为设备根源节点,对应于所述设备根源节点的告警信息作为设备根源信息;
根据所述应用根源信息和所述设备根源信息生成根源信息。
可选地,还包括:
获取所述应用根源节点对应的故障指标权重关系表,根据所述故障指标权重关系表确定最大权值对应的告警信息作为应用根源信息;
获取所述设备根源节点对应的故障指标权重关系表,根据所述故障指标权重关系表确定最大权值对应的告警信息作为设备根源信息。
本发明实施例提供一种告警信息根源分析装置,包括:
获取模块,用于从告警信息集中确定一目标告警信息;
生成模块,用于根据所述目标告警信息、预存的水平调用关系拓扑图和垂直部署关系拓扑图生成水平调用故障链和垂直部署故障链;
第一分析模块,用于根据所述水平调用故障链、垂直部署故障链确定所述目标告警信息的根源信息。
可选地,所述生成模块具体用于执行:
节点确定步骤:根据所述目标告警信息在所述水平调用关系拓扑图确定对应的目标应用节点;
节点关联步骤:根据所述水平调用关系拓扑图确定所述目标应用节点在服务过程中被调用的上级应用节点;
节点判断步骤:从所述告警信息集中确定对应于所述上级应用节点的所有告警信息,若所有告警信息中存在与所述目标告警信息相关联的告警信息,则将所述上级应用节点作为新的目标应用节点继续执行节点关联步骤;
水平调用故障链生成步骤:若所有告警信息中不存在与所述目标告警信息相关联的告警信息,则根据目标应用节点和上级应用节点生成水平调用故障链;
垂直部署故障链生成步骤:根据目标应用节点和上级应用节点确定在垂直部署中对应的设备节点,根据所述设备节点生成垂直部署故障链。
可选地,所述第一分析模块具体用于:
从所述水平调用故障链中确定最末端的上级应用节点作为应用根源节点,对应于所述应用根源节点的告警信息作为应用根源信息;
从所述垂直部署故障链中确定最末端的设备节点作为设备根源节点,对应于所述设备根源节点的告警信息作为设备根源信息;
根据所述应用根源信息和所述设备根源信息生成根源信息。
可选地,还包括第二分析模块,用于:
获取所述应用根源节点对应的故障指标权重关系表,根据所述故障指标权重关系表确定最大权值对应的告警信息作为应用根源信息;
获取所述设备根源节点对应的故障指标权重关系表,根据所述故障指标权重关系表确定最大权值对应的告警信息作为设备根源信息。
本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述告警信息根源分析方法的步骤。
本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述告警信息根源分析方法的步骤。
本发明实施例提供的告警信息根源分析方法及装置,通过根据告警信息集、预存的水平调用关系拓扑图和垂直部署关系拓扑图生成水平调用故障链和垂直部署故障链,进而从水平调用故障链和垂直部署故障链获知引起当前告警或告警风暴的根源信息,做到深层分析告警之间的关联性,能够从根源上快速得到故障分析结果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明告警信息根源分析方法一实施例流程图;
图2为本发明告警信息根源分析方法又一实施例流程图;
图3为本发明告警信息根源分析装置实施例结构图;
图4为本发明电子设备实施例结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在现在的运维系统中,由于当今生产集群规模越来越大,运维监控系统需要监控的节点服务越来越多,当集群中某个节点出现故障不能服务而产生告警时,往往会引起集群中其他节点的正常服务,导致其他节点也产生告警信息,从而产生告警风暴。告警风暴带来的众多告警信息会被及时采集,作为告警信息集。此时,需要对该告警信息集中的告警信息进行分析,找到告警的根源,即主要引起此次告警风暴的原因。在这里,告警信息会按照预设的格式进行记录存储,可以包含很多内容,如告警名称、告警时间、告警分类、告警原因等,在此不一一举出。从这些内容中可以获知告警信息对应集群中的哪个节点,以便能够对告警信息的根源进行分析。
图1示出了本发明一实施例提供的一种告警信息根源分析方法,包括:
S11、从告警信息集中确定一目标告警信息;
S12、根据所述目标告警信息、预存的水平调用关系拓扑图和垂直部署关系拓扑图生成水平调用故障链和垂直部署故障链;
S13、根据所述水平调用故障链、垂直部署故障链确定所述目标告警信息的根源信息。
针对步骤S11,需要说明的是,在本发明实施例中,告警信息集为发生告警时或发生告警风暴时采集到的所有告警信息的集合。由于不知告警信息集中的某个告警信息的根源信息分别是哪个信息。因此,需要对告警信息集中的每一个告警信息进行逐个分析。每一次分析所选取的告警信息在本实施例中作为目标告警信息。
针对步骤S12,需要说明的是,在本发明实施例中,由于确定了目标告警信息,故要以目标告警信息作为基础信息,采用“向上追溯”的方式分析出根源信息。
在本发明实施例中,水平调用关系拓扑图为网络服务过程中应用程序层层调用的关系拓扑图。如某个浏览器请求浏览网页,需要调用云服务平台上的数据,此时,浏览网页请求过程作为一个应用节点,服务平台数据反馈过程作为另一个应用节点,这两个应用节点之间的关系作为水平调用关系拓扑图中的一个调用关系。因此,水平调用关系拓扑图包括多个应用节点之间的调用关系。
在本发明实施例中,垂直部署关系拓扑图为网络服务过程中执行应用程序进行服务的设备之间归属的关系拓扑图。如上述的浏览器通过用户终端(手机、电脑等)进行网页访问,访问的数据来源于服务平台所在的服务器。此时,用户终端作为一个设备节点,服务器作为一个设备节点,这两个设备节点之间的关系作为垂直部署关系拓扑图中的一个部署关系。因此,垂直部署关系拓扑图包括多个设备节点之间的部署关系。
在本发明实施例中,以目标告警信息为基础信息,根据水平调用关系拓扑图和垂直部署关系拓扑图生成水平调用故障链和垂直部署故障链。水平调用故障链和垂直部署故障链为当前告警或告警风暴下所涉及到的所有节点(应用节点和设备节点)之间相互关联的故障链。需要从该故障链中获知根源信息。
针对步骤S13,需要说明的是,在本发明实施例中,根据所述水平调用故障链、垂直部署故障链确定所述目标告警信息的根源信息。就是从水平调用故障链和垂直部署故障链中获得当前告警或告警风暴的根源节点(应用节点和设备节点),将根源节点对应的告警信息作为所述目标告警信息的根源信息。
本发明实施例提供的告警信息根源分析方法,通过根据告警信息集、预存的水平调用关系拓扑图和垂直部署关系拓扑图生成水平调用故障链和垂直部署故障链,进而从水平调用故障链和垂直部署故障链获知引起当前告警或告警风暴的根源信息,做到深层分析告警之间的关联性,能够从根源上快速得到故障分析结果。
图2示出了本发明一实施例提供的一种告警信息根源分析方法,包括:
S21、从告警信息集中确定一目标告警信息;
S221、节点确定步骤:根据所述目标告警信息在所述水平调用关系拓扑图确定对应的目标应用节点;
S222、节点关联步骤:根据所述水平调用关系拓扑图确定所述目标应用节点在服务过程中被调用的上级应用节点;
S223、节点判断步骤:从所述告警信息集中确定对应于所述上级应用节点的所有告警信息,若所有告警信息中存在与所述目标告警信息相关联的告警信息,则将所述上级应用节点作为新的目标应用节点继续执行节点关联步骤;
S224、水平调用故障链生成步骤:若所有告警信息中不存在与所述目标告警信息相关联的告警信息,则根据目标应用节点和上级应用节点生成水平调用故障链;
S225、垂直部署故障链生成步骤:根据目标应用节点和上级应用节点确定在垂直部署中对应的设备节点,根据所述设备节点生成垂直部署故障链;
S23、根据所述水平调用故障链、垂直部署故障链确定所述目标告警信息的根源信息。
针对步骤S21和步骤S23,这些步骤与上述实施例所述步骤S11和步骤S13在原理相同,在此不再赘述。
针对步骤S221-步骤S225,需要说明的是,在本发明实施例中,首先根据所述目标告警信息在所述水平调用关系拓扑图确定对应的应用节点,在这里作为目标应用节点。根据所述水平调用关系拓扑图确定所述目标应用节点在服务过程中被调用的另一个应用节点,在这里作为上级应用节点。由于该上级应用节点可能会存在对应的告警信息。因此需从所述告警信息集中确定对应于所述上级应用节点的所有告警信息,若所有告警信息中存在与所述目标告警信息相关联的告警信息,则将所述上级应用节点作为新的目标应用节点继续执行节点关联步骤。另外,若得到的上级应用节点不存在对应的告警信息,则表明目标应用节点可能造成当前次告警。
若所有告警信息中不存在与所述目标告警信息相关联的告警信息,则根据目标应用节点和上级应用节点生成水平调用故障链。
同时,根据目标应用节点和上级应用节点确定在垂直部署中对应的设备节点,根据所述设备节点生成垂直部署故障链。
本发明实施例提供的告警信息根源分析方法,通过根据告警信息集、预存的水平调用关系拓扑图和垂直部署关系拓扑图生成水平调用故障链和垂直部署故障链,进而从水平调用故障链和垂直部署故障链获知引起当前告警或告警风暴的根源信息,做到深层分析告警之间的关联性,能够从根源上快速得到故障分析结果。
在上述两个实施例基础上的进一步的实施例,根据水平调用故障链、垂直部署故障链确定目标告警信息的根源信息,包括:
从水平调用故障链中确定最末端的上级应用节点作为应用根源节点,对应于应用根源节点的告警信息作为应用根源信息;
从垂直部署故障链中确定最末端的设备节点作为设备根源节点,对应于设备根源节点的告警信息作为设备根源信息;
根据所述应用根源信息和所述设备根源信息生成根源信息。
对此,需要说明的是,在本发明实施例中,通常情况下,对于当前次的告警事故来看,水平调用故障链可能会是单向链,为此,单向链上的最末端的上级应用节点作为应用根源节点,对应于应用根源节点的告警信息作为应用根源信息。同理,最末端的设备节点作为设备根源节点,对应于设备根源节点的告警信息作为设备根源信息。根据所述应用根源信息和所述设备根源信息生成根源信息输出。
在上述实施例基础上的进一步实施例,无论应用节点还是设备节点,一旦某个服务指标不达标,则会发生告警。每个应用节点或是设备节点均会包括很多指标。比如设备节点的指标可包括资源总量、访问接口数量、存储空间等。应用节点的指标可包括请求延迟、请求通道被占有等。在此均不一一举出。指标与指标之间在对应的节点上存在轻重关系,为此,针对每个服务指标建立故障指标权重关系表。一旦一些指标不达标发出告警,则在根源分析过程中,需获取所述应用根源节点对应的故障指标权重关系表,根据所述故障指标权重关系表确定最大权值对应的告警信息作为应用根源信息;同时,获取所述设备根源节点对应的故障指标权重关系表,根据所述故障指标权重关系表确定最大权值对应的告警信息作为设备根源信息。经上述内容的阐述,能够进一步的确定相关节点的根源信息。
图3示出了本发明一实施例提供的一种告警信息根源分析装置,包括获取模块31、生成模块32和第一分析模块33,其中:
获取模块31,用于从告警信息集中确定一目标告警信息;
生成模块32,用于根据所述目标告警信息、预存的水平调用关系拓扑图和垂直部署关系拓扑图生成水平调用故障链和垂直部署故障链;
第一分析模块33,用于根据所述水平调用故障链、垂直部署故障链确定所述目标告警信息的根源信息。
由于本发明实施例所述装置与上述实施例所述方法的原理相同,对于更加详细的解释内容在此不再赘述。
需要说明的是,本发明实施例中可以通过硬件处理器(hardware processor)来实现相关功能模块。
本发明实施例提供的告警信息根源分析装置,通过根据告警信息集、预存的水平调用关系拓扑图和垂直部署关系拓扑图生成水平调用故障链和垂直部署故障链,进而从水平调用故障链和垂直部署故障链获知引起当前告警或告警风暴的根源信息,做到深层分析告警之间的关联性,能够从根源上快速得到故障分析结果。
本发明一实施例提供的一种告警信息根源分析装置,包括获取模块、生成模块和第一分析模块,其中:
获取模块,用于从告警信息集中确定一目标告警信息;
生成模块,具体用于执行:
节点确定步骤:根据所述目标告警信息在所述水平调用关系拓扑图确定对应的目标应用节点;
节点关联步骤:根据所述水平调用关系拓扑图确定所述目标应用节点在服务过程中被调用的上级应用节点;
节点判断步骤:从所述告警信息集中确定对应于所述上级应用节点的所有告警信息,若所有告警信息中存在与所述目标告警信息相关联的告警信息,则将所述上级应用节点作为新的目标应用节点继续执行节点关联步骤;
水平调用故障链生成步骤:若所有告警信息中不存在与所述目标告警信息相关联的告警信息,则根据目标应用节点和上级应用节点生成水平调用故障链;
垂直部署故障链生成步骤:根据目标应用节点和上级应用节点确定在垂直部署中对应的设备节点,根据所述设备节点生成垂直部署故障链;
第一分析模块,用于根据所述水平调用故障链、垂直部署故障链确定所述目标告警信息的根源信息。
由于本发明实施例所述装置与上述实施例所述方法的原理相同,对于更加详细的解释内容在此不再赘述。
需要说明的是,本发明实施例中可以通过硬件处理器(hardware processor)来实现相关功能模块。
本发明实施例提供的告警信息根源分析装置,通过根据告警信息集、预存的水平调用关系拓扑图和垂直部署关系拓扑图生成水平调用故障链和垂直部署故障链,进而从水平调用故障链和垂直部署故障链获知引起当前告警或告警风暴的根源信息,做到深层分析告警之间的关联性,能够从根源上快速得到故障分析结果。
在上述实施例所述装置的进一步实施例,第一分析模块具体用于:
从所述水平调用故障链中确定最末端的上级应用节点作为应用根源节点,对应于所述应用根源节点的告警信息作为应用根源信息;
从所述垂直部署故障链中确定最末端的设备节点作为设备根源节点,对应于所述设备根源节点的告警信息作为设备根源信息;
根据所述应用根源信息和所述设备根源信息生成根源信息。
在上述实施例所述装置的进一步实施例,还包括第二分析模块,用于:
获取所述应用根源节点对应的故障指标权重关系表,根据所述故障指标权重关系表确定最大权值对应的告警信息作为应用根源信息;
获取所述设备根源节点对应的故障指标权重关系表,根据所述故障指标权重关系表确定最大权值对应的告警信息作为设备根源信息。
经上述第二分析模块的执行内容,能够进一步的确定相关节点的根源信息。
由于本发明实施例所述装置与上述实施例所述方法的原理相同,对于更加详细的解释内容在此不再赘述。
需要说明的是,本发明实施例中可以通过硬件处理器(hardware processor)来实现相关功能模块。
图4示例了一种电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器(processor)41、通信接口(Communications Interface)42、存储器(memory)43和通信总线44,其中,处理器41,通信接口42,存储器43通过通信总线44完成相互间的通信。处理器41可以调用存储器43中的逻辑指令,以执行如下方法:从告警信息集中确定一目标告警信息;根据所述目标告警信息、预存的水平调用关系拓扑图和垂直部署关系拓扑图生成水平调用故障链和垂直部署故障链;根据所述水平调用故障链、垂直部署故障链确定所述目标告警信息的根源信息。
此外,上述的存储器43中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的方法,例如包括:从告警信息集中确定一目标告警信息;根据所述目标告警信息、预存的水平调用关系拓扑图和垂直部署关系拓扑图生成水平调用故障链和垂直部署故障链;根据所述水平调用故障链、垂直部署故障链确定所述目标告警信息的根源信息。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (6)

1.一种告警信息根源分析方法,其特征在于,包括:
从告警信息集中确定一目标告警信息;
根据所述目标告警信息、预存的水平调用关系拓扑图和垂直部署关系拓扑图生成水平调用故障链和垂直部署故障链;
根据所述水平调用故障链、垂直部署故障链确定所述目标告警信息的根源信息;
其中,所述根据所述目标告警信息、预存的水平调用关系拓扑图和垂直部署关系拓扑图生成水平调用故障链和垂直部署故障链,包括:
节点确定步骤:根据所述目标告警信息在所述水平调用关系拓扑图确定对应的目标应用节点;
节点关联步骤:根据所述水平调用关系拓扑图确定所述目标应用节点在服务过程中被调用的上级应用节点;
节点判断步骤:从所述告警信息集中确定对应于所述上级应用节点的所有告警信息,若所有告警信息中存在与所述目标告警信息相关联的告警信息,则将所述上级应用节点作为新的目标应用节点继续执行节点关联步骤;
水平调用故障链生成步骤:若所有告警信息中不存在与所述目标告警信息相关联的告警信息,则根据目标应用节点和上级应用节点生成水平调用故障链;
垂直部署故障链生成步骤:根据目标应用节点和上级应用节点确定在垂直部署中对应的设备节点,根据所述设备节点生成垂直部署故障链;
其中,所述根据所述水平调用故障链、垂直部署故障链确定所述目标告警信息的根源信息,包括:
从所述水平调用故障链中确定最末端的上级应用节点作为应用根源节点,对应于所述应用根源节点的告警信息作为应用根源信息;
从所述垂直部署故障链中确定最末端的设备节点作为设备根源节点,对应于所述设备根源节点的告警信息作为设备根源信息;
根据所述应用根源信息和所述设备根源信息生成根源信息。
2.根据权利要求1所述的告警信息根源分析方法,其特征在于,还包括:
获取所述应用根源节点对应的故障指标权重关系表,根据所述故障指标权重关系表确定最大权值对应的告警信息作为应用根源信息;
获取所述设备根源节点对应的故障指标权重关系表,根据所述故障指标权重关系表确定最大权值对应的告警信息作为设备根源信息。
3.一种告警信息根源分析装置,其特征在于,包括:
获取模块,用于从告警信息集中确定一目标告警信息;
生成模块,用于根据所述目标告警信息、预存的水平调用关系拓扑图和垂直部署关系拓扑图生成水平调用故障链和垂直部署故障链;
第一分析模块,用于根据所述水平调用故障链、垂直部署故障链确定所述目标告警信息的根源信息;
其中,所述生成模块具体用于执行:
节点确定步骤:根据所述目标告警信息在所述水平调用关系拓扑图确定对应的目标应用节点;
节点关联步骤:根据所述水平调用关系拓扑图确定所述目标应用节点在服务过程中被调用的上级应用节点;
节点判断步骤:从所述告警信息集中确定对应于所述上级应用节点的所有告警信息,若所有告警信息中存在与所述目标告警信息相关联的告警信息,则将所述上级应用节点作为新的目标应用节点继续执行节点关联步骤;
水平调用故障链生成步骤:若所有告警信息中不存在与所述目标告警信息相关联的告警信息,则根据目标应用节点和上级应用节点生成水平调用故障链;
垂直部署故障链生成步骤:根据目标应用节点和上级应用节点确定在垂直部署中对应的设备节点,根据所述设备节点生成垂直部署故障链;
其中,所述第一分析模块具体用于:
从所述水平调用故障链中确定最末端的上级应用节点作为应用根源节点,对应于所述应用根源节点的告警信息作为应用根源信息;
从所述垂直部署故障链中确定最末端的设备节点作为设备根源节点,对应于所述设备根源节点的告警信息作为设备根源信息;
根据所述应用根源信息和所述设备根源信息生成根源信息。
4.根据权利要求3所述的告警信息根源分析装置,其特征在于,还包括第二分析模块,用于:
获取所述应用根源节点对应的故障指标权重关系表,根据所述故障指标权重关系表确定最大权值对应的告警信息作为应用根源信息;
获取所述设备根源节点对应的故障指标权重关系表,根据所述故障指标权重关系表确定最大权值对应的告警信息作为设备根源信息。
5.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1或2所述告警信息根源分析方法的步骤。
6.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1或2所述告警信息根源分析方法的步骤。
CN201910913070.9A 2019-09-25 2019-09-25 告警信息根源分析方法及装置 Active CN110661660B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910913070.9A CN110661660B (zh) 2019-09-25 2019-09-25 告警信息根源分析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910913070.9A CN110661660B (zh) 2019-09-25 2019-09-25 告警信息根源分析方法及装置

Publications (2)

Publication Number Publication Date
CN110661660A CN110661660A (zh) 2020-01-07
CN110661660B true CN110661660B (zh) 2021-09-10

Family

ID=69039242

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910913070.9A Active CN110661660B (zh) 2019-09-25 2019-09-25 告警信息根源分析方法及装置

Country Status (1)

Country Link
CN (1) CN110661660B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111930547B (zh) * 2020-07-31 2024-06-25 中国工商银行股份有限公司 一种故障定位方法、装置及存储介质
CN114500227B (zh) * 2020-11-13 2023-11-21 中国移动通信集团安徽有限公司 一种告警分析方法、装置、设备及计算机存储介质
CN112882796B (zh) * 2021-02-25 2024-05-24 深信服科技股份有限公司 异常根因分析方法和装置,及存储介质
CN113434320A (zh) * 2021-06-24 2021-09-24 中国工商银行股份有限公司 信息系统故障定位方法、装置、设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5946373A (en) * 1996-06-21 1999-08-31 Mci Communications Corporation Topology-based fault analysis in telecommunications networks
US7120819B1 (en) * 2001-11-15 2006-10-10 3Com Corporation Method and system for fault diagnosis in a data network
CN102195826A (zh) * 2010-03-10 2011-09-21 杭州华三通信技术有限公司 一种检测根源告警的方法及设备
CN104796273A (zh) * 2014-01-20 2015-07-22 中国移动通信集团山西有限公司 一种网络故障根源诊断的方法和装置
CN105991339A (zh) * 2015-03-05 2016-10-05 腾讯科技(深圳)有限公司 一种告警根源定位方法及装置
CN106209400A (zh) * 2015-04-30 2016-12-07 华为技术有限公司 一种定位故障的方法和设备
CN108809734A (zh) * 2018-07-16 2018-11-13 北京思特奇信息技术股份有限公司 网络告警根源分析方法、系统、存储介质及计算机设备
CN108964960A (zh) * 2017-05-27 2018-12-07 阿里巴巴集团控股有限公司 一种告警事件的处理方法及装置
CN109150635A (zh) * 2018-10-26 2019-01-04 中国农业银行股份有限公司 故障影响分析方法及装置
CN109450677A (zh) * 2018-10-29 2019-03-08 中国联合网络通信集团有限公司 一种根源故障的定位方法和装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5946373A (en) * 1996-06-21 1999-08-31 Mci Communications Corporation Topology-based fault analysis in telecommunications networks
US7120819B1 (en) * 2001-11-15 2006-10-10 3Com Corporation Method and system for fault diagnosis in a data network
CN102195826A (zh) * 2010-03-10 2011-09-21 杭州华三通信技术有限公司 一种检测根源告警的方法及设备
CN104796273A (zh) * 2014-01-20 2015-07-22 中国移动通信集团山西有限公司 一种网络故障根源诊断的方法和装置
CN105991339A (zh) * 2015-03-05 2016-10-05 腾讯科技(深圳)有限公司 一种告警根源定位方法及装置
CN106209400A (zh) * 2015-04-30 2016-12-07 华为技术有限公司 一种定位故障的方法和设备
CN108964960A (zh) * 2017-05-27 2018-12-07 阿里巴巴集团控股有限公司 一种告警事件的处理方法及装置
CN108809734A (zh) * 2018-07-16 2018-11-13 北京思特奇信息技术股份有限公司 网络告警根源分析方法、系统、存储介质及计算机设备
CN109150635A (zh) * 2018-10-26 2019-01-04 中国农业银行股份有限公司 故障影响分析方法及装置
CN109450677A (zh) * 2018-10-29 2019-03-08 中国联合网络通信集团有限公司 一种根源故障的定位方法和装置

Also Published As

Publication number Publication date
CN110661660A (zh) 2020-01-07

Similar Documents

Publication Publication Date Title
CN110661660B (zh) 告警信息根源分析方法及装置
US10824535B1 (en) Detection of anomalous computer behavior
US10983856B2 (en) Identifying root causes of performance issues
CN110493025B (zh) 一种基于多层有向图的故障根因诊断的方法及装置
US10915508B2 (en) Data linking
US20160212023A1 (en) Apparatus and method for processing data streams in a communication network
CN110716842B (zh) 集群故障检测方法和装置
CN105743730A (zh) 为移动终端的网页服务提供实时监控的方法及其系统
CN114430365B (zh) 故障根因分析方法、装置、电子设备和存储介质
CN112286774A (zh) 运维监控数据展示方法、装置、存储介质及计算设备
CN111177193A (zh) 一种基于Flink的日志流式处理方法及系统
CN113656252B (zh) 故障定位方法、装置、电子设备以及存储介质
CN110784358A (zh) 网络调用关系拓扑图的构建方法及装置
CN107885634B (zh) 监控中异常信息的处理方法和装置
CN111147306A (zh) 一种物联网设备的故障分析方法、装置以及物联网平台
CN117827784A (zh) 噪音日志的过滤方法、系统
CN111371570A (zh) 一种nfv网络的故障检测方法及装置
CN116996363A (zh) 一种配电网的故障预警方法及相关装置
CN105245394A (zh) 一种基于分层方式分析网络访问日志的方法和设备
CN115630073B (zh) 基于边缘计算的电力物联网数据处理方法及平台
CN112671567B (zh) 一种基于服务化接口的5g核心网拓扑发现方法及装置
CN112671565B (zh) 一种基于信令链路的5g核心网拓扑发现方法及装置
US20230336409A1 (en) Combination rules creation device, method and program
CN114706893A (zh) 故障检测方法、装置、设备及存储介质
CN105446707A (zh) 一种数据转换方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant