CN113641526A - 告警根因定位方法、装置、电子设备及计算机存储介质 - Google Patents

告警根因定位方法、装置、电子设备及计算机存储介质 Download PDF

Info

Publication number
CN113641526A
CN113641526A CN202111021572.4A CN202111021572A CN113641526A CN 113641526 A CN113641526 A CN 113641526A CN 202111021572 A CN202111021572 A CN 202111021572A CN 113641526 A CN113641526 A CN 113641526A
Authority
CN
China
Prior art keywords
alarm
root cause
attribute
alarm root
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111021572.4A
Other languages
English (en)
Other versions
CN113641526B (zh
Inventor
张静
张宪波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jingdong Technology Information Technology Co Ltd
Original Assignee
Jingdong Technology Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jingdong Technology Information Technology Co Ltd filed Critical Jingdong Technology Information Technology Co Ltd
Priority to CN202111021572.4A priority Critical patent/CN113641526B/zh
Publication of CN113641526A publication Critical patent/CN113641526A/zh
Application granted granted Critical
Publication of CN113641526B publication Critical patent/CN113641526B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3495Performance evaluation by tracing or monitoring for systems

Abstract

本发明提供一种告警根因定位方法、装置、电子设备及计算机存储介质,在预设时间段内监测到任意类型的告警日志的数量大于阈值时,针对每一类型的告警日志,将每一条告警日志所对应的热点属性值输入至预设的告警根因聚合模型进行处理,得到告警根因属性组合和告警根因得分;若告警根因得分处于预设范围内,对告警根因进行排序并为排在首位的第一告警根赋予置信度;按照置信度对不同类型的第一告警根因进行排序并输出。在本方案中,基于预设的告警根因聚合模型快速确定同一类型告警的告警根因属性组合和告警根因得分,针对同一类型的告警根因,根据告警根因得分保留且推荐可读性最强的告警根因并推荐,从而实现快速准确的对告警根因进行定位的目的。

Description

告警根因定位方法、装置、电子设备及计算机存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种告警根因定位方法、装置、电子设备及计算机存储介质。
背景技术
告警日志是记录系统运行状态的一种重要工具。当系统出现故障时,运维人员可以通过查看错误日志告警,定位故障原因。
在现有技术中,当业务流量较小、逻辑复杂度较低时,系统出现故障时的错误日志告警也较少,此时,运维人员能够根据错误日志迅速定位到问题。但是,随着业务逻辑的迭代,系统接入的依赖服务不断增多,引入的组件不断增多,当系统出现故障时,错误日志的告警量级会急剧增加,可能会出现告警风暴现象,此时,面对海量报错告警日志运维人员无法快速准确的对告警根因进行定位。
发明内容
有鉴于此,本发明实施例提供一种告警根因定位方法、装置、电子设备及计算机存储介质,以解决出现告警风暴现象时,通过人为方式无法快速准确的对告警根因进行定位的问题。
为解决上述问题,本发明实施例提供如下技术方案:
本发明实施例第一方面公开的一种告警根因定位方法,所述方法包括:
实时监测业务系统的每一类型的告警日志在预设时间段内产生的数量;
若任意类型的告警日志的数量大于阈值,针对每一类型的告警日志,将每一条告警日志所对应的热点属性值输入至预设的告警根因聚合模型进行处理,得到告警根因属性组合和告警根因得分,所述告警根因属性组合中包含同类型的告警根因;
判断所述告警根因得分是否处于预设范围内;
若是,按照告警根因所包含的告警关联维度的数量由大至小,对所述告警根因属性组合中的告警根因进行排序,得到排在首位的第一告警根因,并基于维度数量赋予置信度;
按照所述置信度的大小对不同类型的第一告警根因进行排序,并输出。
可选的,所述预先构建告警根因聚合模型的过程包括:
提取历史告警日志中的告警属性、根因模式和告警关联规则;
通过热点分析模型对所述告警属性进行训练,确定每一所述告警属性的告警类型;
按照告警类型对所述告警属性进行聚类分析,得到有用告警属性集合;
基于所述历史告警日志和所述有用告警属性集合搭建根因聚合FPTree树;
基于所述FPTree树、所述根因模式和所述告警关联规则构建告警根因聚合模型。
可选的,所述按照告警类型对所述告警属性进行聚类分析,得到有用告警属性集合,包括:
基于自然语言处理NLP对告警属性进行聚类分析,得到有用告警属性和无用告警属性;
将相同类型的有用告警属性进行合并,得到有用告警属性集合。
可选的,还包括:
基于输出的所述第一告警根因的类型,进行告警故障分析。
本发明第二方面公开了一种告警根因定位装置,所述装置包括:
监测模块,用于实时监测业务系统的每一类型的告警日志在预设时间段内产生的数量;若任意类型的告警日志的数量大于阈值,执行告警根因处理模块;
所述告警根因处理模块,用于针对每一类型的告警日志,将每一条告警日志所对应的热点属性值输入至预设的告警根因聚合模型进行处理,得到告警根因属性组合和告警根因得分,所述告警根因属性组合中包含同类型的告警根因;
判断模块,用于判断所述告警根因得分是否处于预设范围内;若是,执行定位模块;
所述定位模块,用于按照告警根因所包含的告警关联维度的数量由大至小,对所述告警根因属性组合中的告警根因进行排序,得到排在首位的第一告警根因,并基于维度数量赋予置信度;按照所述置信度的大小对不同类型的第一告警根因进行排序,并输出。
可选的,所述装置还包括:预设模块;
所述预设模块包括:
提取单元,用于提取历史告警日志中的告警属性、根因模式和告警关联规则;
分析单元,用于通过热点分析模型对所述告警属性进行训练,确定每一所述告警属性的告警类型;
聚类单元,用于按照告警类型对所述告警属性进行聚类分析,得到有用告警属性集合;
搭建单元,用于基于所述历史告警日志和所述有用告警属性集合搭建根因聚合FPTree树,以及基于所述FPTree树、所述根因模式和所述告警关联规则构建告警根因聚合模型。
可选的,所述聚类单元,具体用于:
基于自然语言处理NLP对告警属性进行聚类分析,得到有用告警属性和无用告警属性;将相同类型的有用告警属性进行合并,得到有用告警属性集合。
可选的,所述装置还包括:
故障分析模块,用于基于输出的所述第一告警根因的类型,进行告警故障分析。
本发明实施例第三方面公开了一种电子设备,包括处理器和存储器;
所述存储器,用于存储计算机程序;
所述处理器,用于调用并执行所述存储器中存储的计算机程序时,实现本发明实施例第一方面公开的告警根因定位方法。
本发明实施例第四方面公开了一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现本发明实施例第一方面公开的告警根因定位方法。
上述本发明实施例提供的一种告警根因定位方法、装置、电子设备及计算机存储介质具体有如下优点或有益效果:
本发明实施例通过实时监测业务系统的每一类型的告警日志在预设时间段内产生的数量;若任意类型的告警日志的数量大于阈值,针对每一类型的告警日志,将每一条告警日志所对应的热点属性值输入至预设的告警根因聚合模型进行处理,得到告警根因属性组合和告警根因得分,所述告警根因属性组合中包含同类型的告警根因;判断所述告警根因得分是否处于预设范围内;若是,按照告警根因所包含的告警关联维度的数量由大至小,对所述告警根因属性组合中的告警根因进行排序,得到排在首位的第一告警根因,并基于维度数量赋予置信度;按照所述置信度的大小对不同类型的第一告警根因进行排序,并输出。在本方案中,基于预设的告警根因聚合模型快速确定同一类型告警的告警根因属性组合和告警根因得分,针对同一类型的告警根因,根据告警根因得分保留且推荐可读性最强的告警根因并推荐,从而实现快速准确的对告警根因进行定位的目的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例公开的一种告警根因定位方法的流程示意图;
图2为本发明实施例公开的一种构建预设告警根因聚合模型的流程示意图;
图3为本发明实施例公开的一种告警根因定位装置的结构示意图;
图4为本发明实施例公开的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
由背景技术可知,随着业务逻辑的迭代,系统接入的依赖服务不断增多,引入的组件不断增多,当系统出现故障时,错误日志的告警量级会急剧增加,可能会出现告警风暴现象,此时,面对海量报错告警日志运维人员无法快速准确的对告警根因进行定位。因此,本发明实施例公开了一种告警根因定位方法、装置、电子设备及计算机存储介质,基于预设的告警根因聚合模型快速确定同一类型告警的告警根因属性组合和告警根因得分,针对同一类型的告警根因,根据告警根因得分保留且推荐可读性最强的告警根因并推荐,从而实现快速准确的对告警根因进行定位的目的。具体通过以下实施例进行详细说明。
如图1所示,为本发明实施例公开的一种告警根因定位方法的流程示意图,所述方法主要包括以下步骤:
S101:实时监测业务系统的每一类型的告警日志在预设时间段内产生的数量。
在实际应用中,告警日志的类型根据告警类型进行划分,告警类型根据告警源可以分为网络告警,专线告警,主机告警,DB告警,缓存告警,网络告警,TDSQL告警和WEMQ告警等类型的告警。
在具体实现S101的过程中,针对每一类型的告警日志实时监测预设时间内所产生的告警日志数量。
S102:判断每一类型的告警日志的数量是否大于阈值,若任意类型的告警日志的数量大于阈值,执行S103,若所有类型的告警日志的数量均不大于阈值,继续执行S101。
在具体实现S102的过程中,针对每一类型的告警日志,将预设时间段内实时监测到告警日志的数量与阈值进行判断,以此确定该类型的告警是否发生告警风暴。若任意类型的告警日志的数量大于阈值,则确定发生告警风暴。
需要说明的是,在实时监测过程中,可能会监测到发生不同类型的告警风暴,并不局限于一种类型。
S103:针对每一类型的告警日志,将每一条告警日志所对应的热点属性值输入至预设的告警根因聚合模型进行处理,得到告警根因属性组合和告警根因得分。
在S103中,所述告警根因属性组合中包含同类型的告警根因。
需要说明的是,该预设的告警根因聚合模型的构建过程如图2所示,主要包括如下步骤:
S201:提取历史告警日志中的告警属性、根因模式和告警关联规则。
需要说明的是,告警之间往往会通过多种维度互相关联。告警关联规则的主要功能是用指定的条件的告警数据抑制另外一批告警的上报。告警关联规则按网元可以使不同网元的告警相互抑制。抑制其它告警的告警叫主告警,被抑制的告警叫辅告警。只要主告警产生或者存在,辅告警都不上报。
S202:通过热点分析模型对所述告警属性进行训练,确定每一所述告警属性的告警类型。
在S202中,告警属性指告警特征,每个告警对应有热点属性取值。通过该热点分析模型,可以确定告警属性的告警类型。
S203:按照告警类型对所述告警属性进行聚类分析,得到有用告警属性集合。
在具体实现S203的过程中,可选的,首先基于自然语言处理NLP对告警属性进行聚类分析,得到有用告警属性和无用告警属性,然后将相同类型的有用告警属性进行合并,得到有用告警属性集合。
需要说明的是,告警属性集合具有对应的所有值。
在一实施例中,在将相同类型的有用告警属性进行合并后,继续检测是否有同类型的告警属性需要继续聚类分析,若不需要继续进行聚类分析,则直接输出聚类分析结果和有用告警属性集合。若需要继续进行聚类分析,则利用FPTree(根因聚合)算法确定最优的告警属性,将该告警属性的所有值替换上一次合并得到的有用告警属性集合的所有值并进行合并,继续检测是否有同类型的告警属性需要继续聚类分析。
S204:基于所述历史告警日志和所述有用告警属性集合搭建根因聚合FPTree树。
在S204中,FPTree树也为FPTree算法,其在不生成候选项的情况下,完成Apriori算法的功能。Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。
FPTree算法的基本数据结构包含一个一棵FP树和一个项头表,每个项通过一个结点链指向它在树中出现的位置。
在实现S204的过程中,首先,基于有用告警属性集合建立项头表。其次,基于历史告警日志计算各个有用告警属性集合在该历史告警日志中的比例,即支持度,并按照支持度进行倒叙排序。最后,创建FP树的根节点,每一个有用告警属性集合以路径的方式存在FP树上。最后,得到根因聚合FPTree树。
S205:基于所述FPTree树、所述根因模式和所述告警关联规则构建告警根因聚合模型。
S104:判断所述告警根因得分是否处于预设范围内;若是,执行S105,若否,执行S101。
S105:按照告警根因所包含的告警关联维度的数量由大至小,对所述告警根因属性组合中的告警根因进行排序,得到排在首位的第一告警根因,并基于维度数量赋予置信度。
在S105中,置信度基于告警根因中包含多个告警关联维度对应的告警属性的支持度确定。该支持度指告警属性在告警属性组合中的比例。
S106:按照所述置信度的大小对不同类型的第一告警根因进行排序,并输出。
在S106中,按照所述置信度的大小对不同类型的第一告警根因进行排序,同时按照排序进行输出。
在一实施例中,在按照排序输出不同类型的第一告警根因之后,还包括:
基于输出的所述第一告警根因的类型,进行告警故障分析。
本发明实施例公开的一种告警根因定位方法,通过实时监测业务系统的每一类型的告警日志在预设时间段内产生的数量;若任意类型的告警日志的数量大于阈值,针对每一类型的告警日志,将每一条告警日志所对应的热点属性值输入至预设的告警根因聚合模型进行处理,得到告警根因属性组合和告警根因得分,所述告警根因属性组合中包含同类型的告警根因;判断所述告警根因得分是否处于预设范围内;若是,按照告警根因所包含的告警关联维度的数量由大至小,对所述告警根因属性组合中的告警根因进行排序,得到排在首位的第一告警根因,并基于维度数量赋予置信度;按照所述置信度的大小对不同类型的第一告警根因进行排序,并输出。在本方案中,基于预设的告警根因聚合模型快速确定同一类型告警的告警根因属性组合和告警根因得分,针对同一类型的告警根因,根据告警根因得分保留且推荐可读性最强的告警根因并推荐,从而实现快速准确的对告警根因进行定位的目的。
基于上述本发明实施例公开的一种告警根因定位方法,本发明实施例还对应公开了一种告警根因定位装置,如图3所示,该告警根因定位装置包括:监测模块301,告警根因处理模块302,判断模块303和定位模块304。
监测模块301,用于实时监测业务系统的每一类型的告警日志在预设时间段内产生的数量;若任意类型的告警日志的数量大于阈值,执行告警根因处理模块302。
所述告警根因处理模块302,用于针对每一类型的告警日志,将每一条告警日志所对应的热点属性值输入至预设的告警根因聚合模型进行处理,得到告警根因属性组合和告警根因得分,所述告警根因属性组合中包含同类型的告警根因。
判断模块303,用于判断所述告警根因得分是否处于预设范围内;若是,执行定位模块304。
所述定位模块304,用于按照告警根因所包含的告警关联维度的数量由大至小,对所述告警根因属性组合中的告警根因进行排序,得到排在首位的第一告警根因,并基于维度数量赋予置信度;按照所述置信度的大小对不同类型的第一告警根因进行排序,并输出。
在一实施例中,所述告警定位装置还包括:预设模块。
所述预设模块包括:
提取单元,用于提取历史告警日志中的告警属性、根因模式和告警关联规则。
分析单元,用于通过热点分析模型对所述告警属性进行训练,确定每一所述告警属性的告警类型。
聚类单元,用于按照告警类型对所述告警属性进行聚类分析,得到有用告警属性集合。
所述聚类单元,具体用于:
基于自然语言处理NLP对告警属性进行聚类分析,得到有用告警属性和无用告警属性;将相同类型的有用告警属性进行合并,得到有用告警属性集合。
搭建单元,用于基于所述历史告警日志和所述有用告警属性集合搭建根因聚合FPTree树,以及基于所述FPTree树、所述根因模式和所述告警关联规则构建告警根因聚合模型。
在一实施例中,所述告警定位装置还包括:故障分析模块。
该故障分析模块,用于基于输出的所述第一告警根因的类型,进行告警故障分析。
在本发明实施例公开了一种告警根因定位装置中,基于预设的告警根因聚合模型快速确定同一类型告警的告警根因属性组合和告警根因得分,针对同一类型的告警根因,根据告警根因得分保留且推荐可读性最强的告警根因并推荐,从而实现快速准确的对告警根因进行定位的目的。
基于上述本公开实施例公开的告警根因定位装置,上述各个模块可以通过一种由处理器和存储器构成的硬件设备实现。具体为上述各个模块作为程序单元存储于存储器中,由处理器执行存储在存储器中的上述程序单元来实现告警根因定位。
其中,处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来实现告警根因定位。
本公开实施例提供了一种计算机存储介质,存储介质包括告警根因定位程序,其中,程序被处理器执行时实现前述本发明实施例公开的告警根因定位方法。
本公开实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述实施例公开的告警根因定位方法。
本公开实施例提供了一种电子设备,如图4所示,为本公开实施例提供的一种电子设备的结构示意图。
本公开实施例中的电子设备40可以是服务器、PC、PAD、手机等。
该电子设备40包括至少一个处理器401,以及与处理器连接的至少一个存储器402,以及总线403。
处理器401、存储器402通过总线403完成相互间的通信。
处理器401,用于执行存储器中存储的程序。
存储器402,用于存储程序,该程序至少用于:
实时监测业务系统的每一类型的告警日志在预设时间段内产生的数量;若任意类型的告警日志的数量大于阈值,针对每一类型的告警日志,将每一条告警日志所对应的热点属性值输入至预设的告警根因聚合模型进行处理,得到告警根因属性组合和告警根因得分,所述告警根因属性组合中包含同类型的告警根因;判断所述告警根因得分是否处于预设范围内;若是,按照告警根因所包含的告警关联维度的数量由大至小,对所述告警根因属性组合中的告警根因进行排序,得到排在首位的第一告警根因,并基于维度数量赋予置信度;按照所述置信度的大小对不同类型的第一告警根因进行排序,并输出。
本申请还提供了一种计算机程序产品,当在电子设备上执行时,适于执行初始化有如下方法步骤的程序:
实时监测业务系统的每一类型的告警日志在预设时间段内产生的数量;若任意类型的告警日志的数量大于阈值,针对每一类型的告警日志,将每一条告警日志所对应的热点属性值输入至预设的告警根因聚合模型进行处理,得到告警根因属性组合和告警根因得分,所述告警根因属性组合中包含同类型的告警根因;判断所述告警根因得分是否处于预设范围内;若是,按照告警根因所包含的告警关联维度的数量由大至小,对所述告警根因属性组合中的告警根因进行排序,得到排在首位的第一告警根因,并基于维度数量赋予置信度;按照所述置信度的大小对不同类型的第一告警根因进行排序,并输出。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
在一个典型的配置中,设备包括一个或多个处理器(CPU)、存储器和总线。设备还可以包括输入/输出接口、网络接口等。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本公开的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本公开。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种告警根因定位方法,其特征在于,所述方法包括:
实时监测业务系统的每一类型的告警日志在预设时间段内产生的数量;
若任意类型的告警日志的数量大于阈值,针对每一类型的告警日志,将每一条告警日志所对应的热点属性值输入至预设的告警根因聚合模型进行处理,得到告警根因属性组合和告警根因得分,所述告警根因属性组合中包含同类型的告警根因;
判断所述告警根因得分是否处于预设范围内;
若是,按照告警根因所包含的告警关联维度的数量由大至小,对所述告警根因属性组合中的告警根因进行排序,得到排在首位的第一告警根因,并基于维度数量赋予置信度;
按照所述置信度的大小对不同类型的第一告警根因进行排序,并输出。
2.根据权利要求1所述的方法,其特征在于,所述预先构建告警根因聚合模型的过程包括:
提取历史告警日志中的告警属性、根因模式和告警关联规则;
通过热点分析模型对所述告警属性进行训练,确定每一所述告警属性的告警类型;
按照告警类型对所述告警属性进行聚类分析,得到有用告警属性集合;
基于所述历史告警日志和所述有用告警属性集合搭建根因聚合FPTree树;
基于所述FPTree树、所述根因模式和所述告警关联规则构建告警根因聚合模型。
3.根据权利要求2所述的方法,其特征在于,所述按照告警类型对所述告警属性进行聚类分析,得到有用告警属性集合,包括:
基于自然语言处理NLP对告警属性进行聚类分析,得到有用告警属性和无用告警属性;
将相同类型的有用告警属性进行合并,得到有用告警属性集合。
4.根据权利要求1至3中任一项所述的方法,其特征在于,还包括:
基于输出的所述第一告警根因的类型,进行告警故障分析。
5.一种告警根因定位装置,其特征在于,所述装置包括:
监测模块,用于实时监测业务系统的每一类型的告警日志在预设时间段内产生的数量;若任意类型的告警日志的数量大于阈值,执行告警根因处理模块;
所述告警根因处理模块,用于针对每一类型的告警日志,将每一条告警日志所对应的热点属性值输入至预设的告警根因聚合模型进行处理,得到告警根因属性组合和告警根因得分,所述告警根因属性组合中包含同类型的告警根因;
判断模块,用于判断所述告警根因得分是否处于预设范围内;若是,执行定位模块;
所述定位模块,用于按照告警根因所包含的告警关联维度的数量由大至小,对所述告警根因属性组合中的告警根因进行排序,得到排在首位的第一告警根因,并基于维度数量赋予置信度;按照所述置信度的大小对不同类型的第一告警根因进行排序,并输出。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:预设模块;
所述预设模块包括:
提取单元,用于提取历史告警日志中的告警属性、根因模式和告警关联规则;
分析单元,用于通过热点分析模型对所述告警属性进行训练,确定每一所述告警属性的告警类型;
聚类单元,用于按照告警类型对所述告警属性进行聚类分析,得到有用告警属性集合;
搭建单元,用于基于所述历史告警日志和所述有用告警属性集合搭建根因聚合FPTree树,以及基于所述FPTree树、所述根因模式和所述告警关联规则构建告警根因聚合模型。
7.根据权利要求6所述的装置,其特征在于,所述聚类单元,具体用于:
基于自然语言处理NLP对告警属性进行聚类分析,得到有用告警属性和无用告警属性;将相同类型的有用告警属性进行合并,得到有用告警属性集合。
8.根据权利要求5至7中任一项所述的装置,其特征在于,还包括:
故障分析模块,用于基于输出的所述第一告警根因的类型,进行告警故障分析。
9.一种电子设备,其特征在于,包括处理器和存储器;
所述存储器,用于存储计算机程序;
所述处理器,用于调用并执行所述存储器中存储的计算机程序时,实现如权利要求1至4中任一项所述的告警根因定位方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现如权利要求1至4中任一项所述的告警根因定位方法。
CN202111021572.4A 2021-09-01 2021-09-01 告警根因定位方法、装置、电子设备及计算机存储介质 Active CN113641526B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111021572.4A CN113641526B (zh) 2021-09-01 2021-09-01 告警根因定位方法、装置、电子设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111021572.4A CN113641526B (zh) 2021-09-01 2021-09-01 告警根因定位方法、装置、电子设备及计算机存储介质

Publications (2)

Publication Number Publication Date
CN113641526A true CN113641526A (zh) 2021-11-12
CN113641526B CN113641526B (zh) 2024-04-05

Family

ID=78424846

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111021572.4A Active CN113641526B (zh) 2021-09-01 2021-09-01 告警根因定位方法、装置、电子设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN113641526B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114448774A (zh) * 2021-12-16 2022-05-06 武汉光迅科技股份有限公司 告警处理方法、装置和存储介质
CN114598539A (zh) * 2022-03-16 2022-06-07 京东科技信息技术有限公司 根因定位方法、装置、存储介质及电子设备
CN115051907A (zh) * 2022-06-10 2022-09-13 中国电信股份有限公司 告警日志数据的处理方法及装置、非易失性存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109905270A (zh) * 2018-03-29 2019-06-18 华为技术有限公司 定位根因告警的方法、装置和计算机可读存储介质
CN111459695A (zh) * 2020-03-12 2020-07-28 平安科技(深圳)有限公司 根因定位方法、装置、计算机设备和存储介质
CN111669282A (zh) * 2019-03-08 2020-09-15 华为技术有限公司 识别疑似根因告警的方法、装置及计算机存储介质
WO2021016978A1 (zh) * 2019-08-01 2021-02-04 中国科学院深圳先进技术研究院 电信网络告警预测方法及系统
WO2021057576A1 (zh) * 2019-09-29 2021-04-01 中兴通讯股份有限公司 一种构造云化网络告警根因关系树模型方法、装置和存储介质
CN112636967A (zh) * 2020-12-18 2021-04-09 北京浪潮数据技术有限公司 一种根因分析方法、装置、设备及存储介质
CN112953738A (zh) * 2019-11-26 2021-06-11 中国移动通信集团山东有限公司 根因告警的定位系统、方法、装置、计算机设备
CN113282461A (zh) * 2021-05-28 2021-08-20 中国联合网络通信集团有限公司 传输网的告警识别方法和装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109905270A (zh) * 2018-03-29 2019-06-18 华为技术有限公司 定位根因告警的方法、装置和计算机可读存储介质
CN111669282A (zh) * 2019-03-08 2020-09-15 华为技术有限公司 识别疑似根因告警的方法、装置及计算机存储介质
WO2020182051A1 (zh) * 2019-03-08 2020-09-17 华为技术有限公司 识别疑似根因告警的方法、装置及计算机存储介质
WO2021016978A1 (zh) * 2019-08-01 2021-02-04 中国科学院深圳先进技术研究院 电信网络告警预测方法及系统
WO2021057576A1 (zh) * 2019-09-29 2021-04-01 中兴通讯股份有限公司 一种构造云化网络告警根因关系树模型方法、装置和存储介质
CN112953738A (zh) * 2019-11-26 2021-06-11 中国移动通信集团山东有限公司 根因告警的定位系统、方法、装置、计算机设备
CN111459695A (zh) * 2020-03-12 2020-07-28 平安科技(深圳)有限公司 根因定位方法、装置、计算机设备和存储介质
CN112636967A (zh) * 2020-12-18 2021-04-09 北京浪潮数据技术有限公司 一种根因分析方法、装置、设备及存储介质
CN113282461A (zh) * 2021-05-28 2021-08-20 中国联合网络通信集团有限公司 传输网的告警识别方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WANG J 等: "Association rules mining based analysis of consequential alarm sequences in chemical processes", JOURNAL OF LOSS PREVENTION IN THE PROCESS INDUSTRIES, pages 178 - 185 *
罗晨伊: "面向网络功能虚拟化的故障管理机制研究", 中国优秀硕士学位论文全文数据库 信息科技辑, pages 139 - 18 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114448774A (zh) * 2021-12-16 2022-05-06 武汉光迅科技股份有限公司 告警处理方法、装置和存储介质
CN114448774B (zh) * 2021-12-16 2023-12-05 武汉光迅科技股份有限公司 告警处理方法、装置和存储介质
CN114598539A (zh) * 2022-03-16 2022-06-07 京东科技信息技术有限公司 根因定位方法、装置、存储介质及电子设备
CN114598539B (zh) * 2022-03-16 2024-03-01 京东科技信息技术有限公司 根因定位方法、装置、存储介质及电子设备
CN115051907A (zh) * 2022-06-10 2022-09-13 中国电信股份有限公司 告警日志数据的处理方法及装置、非易失性存储介质

Also Published As

Publication number Publication date
CN113641526B (zh) 2024-04-05

Similar Documents

Publication Publication Date Title
US11710131B2 (en) Method and apparatus of identifying a transaction risk
CN110661659B (zh) 一种告警方法、装置、系统及电子设备
CN113641526B (zh) 告警根因定位方法、装置、电子设备及计算机存储介质
CN112181804A (zh) 一种参数校验方法、设备以及存储介质
US20210119899A1 (en) Monitoring a distributed application server environment
CN114465870B (zh) 告警信息的处理方法及装置、存储介质和电子设备
EP3011454A1 (en) Generating a fingerprint representing a response of an application to a simulation of a fault of an external service
CN114580933A (zh) 事件分配方法、装置、存储介质以及电子设备
CN115442262B (zh) 一种资源评估方法、装置、电子设备及存储介质
CN113360350A (zh) 定位网络设备根因告警的方法、装置、设备和存储介质
CN109039695B (zh) 业务故障处理方法、装置及设备
CN109598525B (zh) 数据处理方法和装置
CN109947713B (zh) 一种日志的监控方法及装置
CN114500249B (zh) 一种根因定位方法和装置
CN115529219A (zh) 告警分析方法、装置、计算机可读存储介质及电子设备
CN113468384B (zh) 网络情报源信息的处理方法、装置、存储介质及处理器
CN113222223B (zh) 实时数仓的风控联动预警方法、系统、设备及存储介质
CN114625611A (zh) 一种量子计算环境的监控方法、设备及存储介质
CN114138615A (zh) 一种业务告警处理方法、装置、设备及存储介质
CN107766216A (zh) 一种用于获取应用执行信息的方法与设备
CN108234196B (zh) 故障检测方法及装置
CN110968546A (zh) 图谱节点跳转概率的设置方法及相关设备
CN117650970A (zh) 云上cpu告警的评估方法及装置、电子设备、存储介质
CN117632426A (zh) 应用软件的处理方法及装置、存储介质和电子设备
CN116029540A (zh) 一种针对前端代码开发系统的风险评估方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant