CN110147387A - 一种根因分析方法、装置、设备及存储介质 - Google Patents

一种根因分析方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110147387A
CN110147387A CN201910380698.7A CN201910380698A CN110147387A CN 110147387 A CN110147387 A CN 110147387A CN 201910380698 A CN201910380698 A CN 201910380698A CN 110147387 A CN110147387 A CN 110147387A
Authority
CN
China
Prior art keywords
event
probability
transfer
node
subgraph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910380698.7A
Other languages
English (en)
Other versions
CN110147387B (zh
Inventor
杨帅
胡飞雄
李世岗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shanghai Co Ltd
Original Assignee
Tencent Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shanghai Co Ltd filed Critical Tencent Technology Shanghai Co Ltd
Priority to CN201910380698.7A priority Critical patent/CN110147387B/zh
Publication of CN110147387A publication Critical patent/CN110147387A/zh
Application granted granted Critical
Publication of CN110147387B publication Critical patent/CN110147387B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24564Applying rules; Deductive queries
    • G06F16/24566Recursive queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Fuzzy Systems (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明涉及一种根因分析方法、装置、设备及存储介质,所述方法包括:获取历史事件关联数据,构建事件概率转移图;确定当前时间段内的目标事件,以及关联事件;确定与所述目标事件对应的目标节点,以及与所述关联事件对应的关联节点,生成与当前时间段相对应的概率转移子图;在所述概率转移子图中,以所述目标节点为起点,递归搜索满足访问条件的下一个关联节点,直至所述概率转移子图中不存在满足所述访问条件的关联节点;确定最后访问的关联节点所对应的关联事件为所述目标事件的根因。本发明能够在事件发生时快速定位引发该事件的深层原因,减少事件处理时间;借助于大数据的能力,使得根因分析结果更加准确、精细。

Description

一种根因分析方法、装置、设备及存储介质
技术领域
本发明涉及数据分析技术领域,尤其涉及一种根因分析方法、装置、设备及存储介质。
背景技术
根因分析是一项结构化的问题处理方法,用以逐步找出问题的根本原因并加以解决,而不仅仅关注问题的表征。例如,在游戏的运营过程中,会伴随着系统或接口故障,如网络波动,鉴权接口失败、服务器负载过高等,为了在出现游戏严重故障时能够快速定位到引发此故障的深层原因,通过根因分析方法进行故障排查。
现有的主要根因分析方法主要还是依赖于运维工程师和开发工程师的经验,通过大量的经验累计出的规律,人为地对可能的故障点进行猜测或检验。这种方式准确性较低,且需要工程师的从业经验,完成整体的排障过程耗时也较高。
发明内容
本发明所要解决的技术问题在于,提供一种根因分析方法、装置、设备及存储介质,能够基于大量历史数据进行智能根因分析,在事件发生时快速定位引发该事件的深层原因,减少事件处理时间;借助于大数据的能力,能够广泛收集可能的事件发生的原因,使得根因分析结果更加准确、精细。
为了解决上述技术问题,第一方面,本发明提供了一种根因分析方法,所述方法包括:
获取历史事件关联数据,根据所述历史事件关联数据构建事件概率转移图,其中,每个事件与所述事件概率转移图中的节点一一对应;
确定当前时间段内的目标事件,以及与所述目标事件相关联的关联事件;
在所述事件概率转移图中确定与所述目标事件对应的目标节点,以及与所述关联事件对应的关联节点,根据所述目标节点和所述关联节点生成与当前时间段相对应的概率转移子图;
在所述概率转移子图中,以所述目标节点为起点,递归搜索满足访问条件的下一个关联节点,直至所述概率转移子图中不存在满足所述访问条件的关联节点;
确定最后访问的关联节点所对应的关联事件为所述目标事件的根因。
第二方面,本发明提供了一种根因分析装置,所述装置包括:
概率转移图构建模块,用于获取历史事件关联数据,根据所述历史事件关联数据构建事件概率转移图,其中,每个事件与所述事件概率转移图中的节点一一对应;
事件确定模块,用于确定当前时间段内的目标事件,以及与所述目标事件相关联的关联事件;
子图生成模块,用于在所述事件概率转移图中确定与所述目标事件对应的目标节点,以及与所述关联事件对应的关联节点,根据所述目标节点和所述关联节点生成与当前时间段相对应的概率转移子图;
递归搜索模块,用于在所述概率转移子图中,以所述目标节点为起点,递归搜索满足访问条件的下一个关联节点,直至所述概率转移子图中不存在满足所述访问条件的关联节点;
根因确定模块,用于确定最后访问的关联节点所对应的关联事件为所述目标事件的根因。
第三方面,本发明提供了一种设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如第一方面所述的根因分析方法。
第四方面,本发明提供了一种计算机存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行如第一方面所述的根因分析方法。
实施本发明实施例,具有如下有益效果:
本发明通过对大量历史数据进行分析,生成事件概率转移图;在当前时间段内发生的事件中确定目标事件,并确定与目标事件相关联的关联事件;在事件概率转移图中分别确定与目标事件和关联事件相对应的目标节点和关联节点,根据确定出的相关节点生成与当前时间段相对应的概率转移子图;在概率转移子图中,以目标节点为起点,递归搜索满足访问条件的下一个关联节点,直至不存在满足所述访问条件的关联节点;确定在递归搜索过程中最后访问的关联节点所对应的关联事件为所述目标事件的根因。本发明基于根据历史数据生成的事件概率转移图进行智能根因分析,能够快速定位引发当前事件的深层原因,减少事件处理时间;并且借助于大数据的能力,广泛收集导致各类事件的可能原因,从而使得根因分析结果更准确、更精细。
附图说明
图1是本发明实施例提供的应用场景示意图;
图2是本发明实施例提供的一种根因分析方法示意图;
图3是本发明实施例提供的一种概率转移图构建的方法示意图;
图4是本发明实施例提供的一种概率图优化方法示意图;
图5是本发明实施例提供的一种当前时间段内事件确定方法示意图;
图6是本发明实施例提供的一种递归搜索方法示意图;
图7是本发明实施例提供的应用过程第一示意图;
图8是本发明实施例提供的应用过程第二示意图;
图9是本发明实施例提供的应用过程第三示意图;
图10是本发明实施例提供的应用过程第四示意图;
图11是本发明实施例提供的应用过程第五示意图;
图12是本发明实施例提供的应用过程第六示意图;
图13是本发明实施例提供的一种故障根因分析系统物理架构图;
图14是本发明实施例提供的一种根因分析装置示意图;
图15是本发明实施例提供的概率转移图构建模块示意图;
图16是本发明实施例提供的优化模块示意图;
图17是本发明实施例提供的事件确定模块示意图;
图18是本发明实施例提供的递归搜索模块示意图;
图19是本发明实施例提供的一种设备结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。而且,术语“第一”、“第二”等适用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
请参见图1,其示出了本发明实施例提供的应用场景示意图,包括:业务系统服务器110、根因分析服务器120和控制终端130。
其中业务系统服务器110可以包括一个独立运行的服务器,或者分布式服务器,或者由多个服务器组成的服务器集群。所述业务系统服务器110可以包括有网络通信单元、处理器和存储器等。所述业务系统服务器110能够对运行过程中出现的相关事件进行事件上报。
根因分析服务器120可以包括一个独立运行的服务器,或者分布式服务器,或者由多个服务器组成的服务器集群。所述根因分析服务器120可以包括有网络通信单元、处理器和存储器等。所述根因分析服务器120可根据当前发生的相关事件分析导致发生相关事件的根因。
控制终端130可包括个人电脑、平板电脑及智能移动设备等,所述控制终端130能够根据当前发生的事件情况,发出对目标事件进行根因分析的控制指令,并显示根因分析的结果供相关人员参考。
以上仅仅是本申请的一种示例性场景示意图,其中根因分析服务器120和控制终端130也可以设置在同一端。
以下介绍本申请基于上述场景示意图的根因分析方法,请参见图2,其示出了一种根因分析方法示意图,所述方法包括:
S210.获取历史事件关联数据,根据所述历史事件关联数据构建事件概率转移图,其中,每个事件与所述事件概率转移图中的节点一一对应。
这里的历史事件关联数据可以是指通过特定模块和业务逻辑规则,将不同系统之间的告警事件与业务故障事件相关联起来的对应关系。通过采集过去一段时间的告警关联数据,作为构建事件概率转移图的训练样本。
其中,对于具体的事件概率转移图构建的方法可参见图3,所述方法包括:
S310.对所述历史事件关联数据进行预处理,得到基础事件组。
根据采集的历史事件关联数据,将同一时间段发生的,且相关联的事件作为一个事件组;从而对于不同时间段内发生的事件,可有若干事件组,若干事件组构成了基础事件组。
S320.确定所述基础事件组的频繁项集以及每个频繁项集相应的支持度,其中每个频繁项集中包括两个事件。
本实施例中的频繁项集及每个频繁项集相应的支持度可通过FP-growth(Frequent Pattern growth)得到,FP-growth算法发现频繁项集的基本过程可包括:构建FP树以及从FP树中挖掘频繁项集。具体的发现频繁项集的方法可参见现有技术中的实现方法,在此不再赘述。
FP-growth的具体输出主要包含频繁项集和对应的支持度。在项集中频繁出现并满足最小支持度阈值的集合,例如{牛奶,面包}、{手机,手机壳}等称为频繁项集。支持度比如{A,B}的支持度,代表着A,B同时出现的概率。最小支持度,则是指频繁项集最低成立时所需要的最低的支持度,可以是人为设置的,从0~1之间的小数。该数值越高,筛选出来的频繁项集就越少,反之越多。
S330.根据每个频繁项集相应的支持度,确定每个频繁项集中两个事件的条件概率。
本实施例中,每个频繁项集中包括两个事件,具体可以为第一事件和第二事件,根据得到的频繁项集,可以推导出每个频繁项集中两个事件之间的概率关联,即:
计算在第二事件发生的情况下,第一事件发生的第一条件概率,其概率转移方向为第二事件到第一事件;
以及,计算在第一事件发生的情况下,第二事件发生的第二条件概率,其概率转移方向为第一事件到第二事件。
具体的求概率关联的方法如下:
基于条件概率,如果要求事件B出现的情况下事件A出现的概率,即为P(A|B),通过贝叶斯公式可知P(A|B)=P(AB)/P(B),P(AB)即为事件A和事件B同时出现的概率,即{A,B}这个频繁项集的支持度,这是通过FP-growth算法得到的输出,在此基础上,只要再求出P(B)即可。在收集到的历史事件关联数据中,统计一共出现的事件总数N,再求N次中出现B事件的次数,出现的次数除以N即为P(B)。
由上述方法可计算得到P(A|B)和P(B|A),P(A|B)对应B事件发生时,A事件发生的概率,概率转移方向为B→A;P(B|A)对应A事件发生时,B事件发生的概率,概率转移方向为A→B。
通过以上的计算,可得到基础事件组中任意两个事件之间的转移概率。
S340.以所述基础事件组中的各事件为节点,以所述条件概率为两个节点之间边的权重,构建概率图。
以所述基础事件组中的各事件为节点,构建概率链,用来描述不同节点出现时,会转移到其他节点的概率。将问题抽象成一个图(Graph),图的顶点对应的是各个事件,边(edge)的权重和方向即为事件发生的概率和方向,即其中任意两个节点之间的边的权重为该两个节点对应的条件转移概率,例如节点a和节点b之间的边的权重为:在事件A发生的情况下,事件B发生的概率,概率转移方向由节点a→节点b;在事件B发生的情况下。事件A发生的概率,概率转移方向由节点b→节点a。
S350.对所述概率图进行优化,生成所述事件概率转移图。
根据上述步骤,已经生成了与历史事件关联数据相对应的概率转移图,但为了提高概率图的应用效率以及应用效果,需要对其进行进一步的优化。
请参见图4,其示出了一种概率图优化方法示意图,所述方法包括:
S410.删除所述概率图中权重小于第一预设值的边。
在所述概率图中,会存在一些关系较弱的边,比如,有一些边,它们的权重很低,代表着它连接的两个节点之间同时发生的概率很低,这是可通过剪枝的方式,删除掉这些权重值较低的边,去掉相应节点之间的关系。具体的权重值的删除阈值可根据具体情况进行设置。
S420.获取所述概率图中的协同节点组,删除所述协同节点组之间的边;其中,所述协同节点组包括在所述概率图中由一条边直接相连的第一节点和第二节点,且所述第一节点对应的第一条件概率和所述第二节点对应的第二条件概率的差值小于第二预设值。
这里的协同节点组具体可以指:对于事件A和事件B,当A存在时B发生的概率,与B发生时A发生的概率相似时,意味着A和B经常是共同发生的,无法获知是A导致B的可能高一些,还是B导致A的可能高一些,定义事件A和事件B为一协同节点组,也可称作为一组co_list。
本实施例中,在得到的概率图中找到所有存在的co_list,将其关系记录下来,并在图中删除所有标记为co_list的边,以避免它们之间产生因果关系。
经过对概率图优化之后,得到了事件概率转移图。
S220.确定当前时间段内的目标事件,以及与所述目标事件相关联的关联事件。
请参见图5,其示出了一种当前时间段内事件确定方法示意图,所述方法包括:
S510.确定当前时间段内检测到的表现层事件为所述目标事件。
表现层事件是指宏观层面的表现事件或者是用户侧所呈现出来的表现事件,可以理解为显性的、比较容易获知的事件。
S520.获取当前时间段内的若干周边事件。
这里的周边事件可以是与当前业务相关联的周边系统中产生的事件,一般是深层次的、技术层面的事件。
S530.对于每个周边事件,当所述周边事件与所述目标事件存在预设的共同点时,确定所述周边事件为所述目标事件的关联事件。
表现层事件和周边事件之间的关联,是通过判断这两个事件是否满足以下两个条件:
(1)两个事件存在共同点,例如发生在同一个IP的服务器,或者在同一个交换机下,或是发生掉线事件的游戏大区所属服务器之一等等。
(2)两个事件是在同一个时间窗口之内,他们发生的时间很接近。
以当前时间段内一个表现层事件为例,将表现层事件逐一与若干周边事件进行匹配判断,当判断满足以上所述的两个条件时,判断该周边事件与所述表现层事件相关联。经过以上过程,可以得到与当前表现层事件相关联的关联事件。
S230.在所述事件概率转移图中确定与所述目标事件对应的目标节点,以及与所述关联事件对应的关联节点,根据所述目标节点和所述关联节点生成与当前时间段相对应的概率转移子图。
根据历史事件关联数据得到的概率转移图G中包括历史数据中发生的所有事件的总和,而对于当前某一时间段内涉及到的事件总和往往只是其中的一部分。比如,对于概率转移图中有节点V1,V2,…Vn,这是历史总和;但当前时间段只发生了V1,V3,…V8,那么只取这三个事件以及它们之间直接的边作为子图G’。
S240.在所述概率转移子图中,以所述目标节点为起点,递归搜索满足访问条件的下一个关联节点,直至所述概率转移子图中不存在满足所述访问条件的关联节点。
请参见图6,其示出了一种递归搜索方法示意图,所述方法包括:
S610.以所述目标节点为当前起点进行搜索,确定以所述当前起点为出度,且边的权重值最高的关联节点为访问节点,标记所述访问节点。
所述以当前起点为出度可以通过以下举例进行理解:假设有节点a和节点b,并且存在概率转移方向由节点b到节点a的边,此时认为节点b以节点a为出度。
在确定与节点a为出度的所有节点之后,需要判断其中哪一个节点与节点a之间的权重值最高,并将权重值最高的节点确定为下一个访问的节点。
S620.以所述访问节点为当前起点,重复执行搜索、标记的步骤,直至搜索完所述概率转移子图或所述概率转移子图不存在联通路。
在概率转移子图中,以当前时间段内发生的目标事件所对应的节点为起点,不断找到一个到该节点边权重最高的父节点,删除已访问的节点,并递归下去,直到找到搜索完整各子图、或图中不存在任何联通路。
S250.确定最后访问的关联节点所对应的关联事件为所述目标事件的根因。
输出所述目标事件的根因事件,以便于相关技术人员进行相关系统的维护与事件分析。
以上为本发明实施例提供的一种根因分析方法的具体实施方式,另外,该根因分析方法还可以包括:
通过预设规则对所述目标事件和所述关联事件进行匹配,从所述关联事件中确定所述目标事件的根因。
由于工程上会有一些特殊要求,比如A事件发生时一定会导致严重故障,或者B事件发生是常态不会导致严重故障;并且特殊规则可根据业务的实际情况酌情添加。
具体地,特殊规则是指通过工程师的经验,直接笃定一些事件的因果关系的规则。比如当发生游戏掉线时(事件A),此时同时侦测到了游戏正在停机发布(事件B),就直接将B认定为A的原因。这种情况只需要找到子图G’里同时存在A和B,即判定B是A的原因并输出结果,就不需要递归搜索了。
下面以一具体的例子来说明根因分析的具体应用方法:
(1)根据历史数据,构建出全局的概率转移图,参见图7,其示出了一概率转移示意图,图中包括事件A,B,C,D,E,F,G,H,I,J和K。
(2)进行协同节点组(co_list)查找,co_list定义为两个节点之间如果互相到对方的概率很高且接近,意味着它们总是成对出现,互相因果性并无关联,需要去除这些干扰项。
请参见图8,其示出了经过剪枝和去除co_list的概率转移图。从图8中可以看出,相比于图7:由A向B的转移概率为0.3,所以去除了由A到B的概率转移方向;由B到D的转移概率约等于由D到B的转移概率,判定B和D为一组co_list,将其之间的边由实线改为虚线。
(3)对于需要进行分析的案例,需要输入该案例所涉及的相关事件,并在概率转移图中标识出来。
假设当前涉及到的事件已在图9中标出,该过程即为上述实施例中的子图的生成过程,包括A,B,C,D,E,F和K,其中包括目标事件和与所述目标事件关联的关联事件。本例中,以A为目标事件,在找子图的过程中,是判断了A与图中其它的节点之间是否存在关联关系,最终得到AB、AC、AD、AE、AF、AK之间存在关联关系,并将其在图9中标识出来。具体确定关联关系的方法可根据上述实施例中步骤S530所示的方法进行判断。
(4)已知查询的最初告警(表现层)为A,以A为起点进行递归搜索。将A以另一种样式进行标识,具体可参见图10。
(5)搜索以A为出度,且边权重值最高的节点。
请参见图11,以A为出度的有B,I,G和K,其中对应边的权重值最大的为B,故下一个访问点为B,并将B以与A相同的方式进行标识。
因为B和D为co_list关系,所以将B、D同时进行染色标识操作。其中,D被染色的原因是B被A染色。而BD为共生节点(co_list),即两个节点之间如果互相到对方的概率很高且接近,他们意味着他们总是成对出现,互相因果性并无关联,需要去除这些干扰项。所以D被染色排除干扰项,由A的直接原因B继续扩展。
(6)继续搜索,找到以B为出度且权重最高的节点,即为C。请参见图12,此时由于C没有与非染色的其他节点相连,整个递归过程结束,即找到了C导致B、D,继而导致A的整条链路,即C为A的根因。
请参见图13,其示出了基于本发明的一种故障根因分析系统物理架构图,该故障根因分析系统包括:
周边系统:可以是对应的游戏周边系统生态。
游戏服务器:是指游戏的业务服务器,实际提供游戏业务的服务。
周边故障同步:指周边系统所产生故障、告警等信息,并统一同步的系统。
表现层故障检测:采用智能检测的方法,检测游戏服务器中汇总得到的在线、登录、注册等曲线是否异常的模块。
这里的故障种类非常多,而且可以不断添加。举例如内网延迟增高、内网丢包告警、登录鉴权失败、支付模块超时、服务器CPU过高、服务器PING不可达等等。
关联模块:将周边故障信息与表现层故障根据他们之间的共同点相关联结合的模块。
根因分析模型:根据已有的关联数据进行训练,在故障发生时候能进行根因推导的模块。
基于上述根因分析系统,既可以实现根因分析模型的创建与更新,又可以根据生成的根因分析模型对特定的实例进行根因分析。
本发明通过对大量历史数据进行分析,生成事件概率转移图;在当前时间段内发生的事件中确定目标事件,并确定与目标事件相关联的关联事件;在事件概率转移图中分别确定与目标事件和关联事件相对应的目标节点和关联节点,根据确定出的相关节点生成与当前时间段相对应的概率转移子图;在概率转移子图中,以目标节点为起点,递归搜索满足访问条件的下一个关联节点,直至不存在满足所述访问条件的关联节点;确定在递归搜索过程中最后访问的关联节点所对应的关联事件为所述目标事件的根因。本发明基于根据历史数据生成的事件概率转移图进行智能根因分析,能够快速定位引发当前事件的深层原因,以便更好地着手排查;减少事件处理时间降低故障的影响时长和影响范围,最大限度地挽回损失;并且借助于大数据的能力,广泛收集导致各类事件的可能原因,从而使得根因分析结果更准确、更精细。
本实施例还提供了一种根因分析装置,该装置可通过硬件和/或软件的方式实现,请参见图14,所述装置包括:
概率转移图构建模块1410,用于获取历史事件关联数据,根据所述历史事件关联数据构建事件概率转移图,其中,每个事件与所述事件概率转移图中的节点一一对应。
事件确定模块1420,用于确定当前时间段内的目标事件,以及与所述目标事件相关联的关联事件。
子图生成模块1430,用于在所述事件概率转移图中确定与所述目标事件对应的目标节点,以及与所述关联事件对应的关联节点,根据所述目标节点和所述关联节点生成与当前时间段相对应的概率转移子图。
递归搜索模块1440,用于在所述概率转移子图中,以所述目标节点为起点,递归搜索满足访问条件的下一个关联节点,直至所述概率转移子图中不存在满足所述访问条件的关联节点。
根因确定模块1450,用于确定最后访问的关联节点所对应的关联事件为所述目标事件的根因。
请参见图15,所述概率转移图构建模块1410包括:
预处理模块1510,用于对所述历史事件关联数据进行预处理,得到基础事件组。
频繁项集确定模块1520,用于确定所述基础事件组的频繁项集以及每个频繁项集相应的支持度,其中每个频繁项集中包括两个事件。
概率确定模块1530,用于根据每个频繁项集相应的支持度,确定每个频繁项集中两个事件的条件概率;
第一构建模块1540,用于以所述基础事件组中的各事件为节点,以所述条件概率为两个节点之间边的权重,构建概率图;
优化模块1550,用于对所述概率图进行优化,生成所述事件概率转移图。
其中,所述概率确定模块1530包括:
条件概率计算模块,用于计算在第二事件发生的情况下,第一事件发生的第一条件概率,其概率转移方向为第二事件到第一事件;以及,计算在第一事件发生的情况下,第二事件发生的第二条件概率,其概率转移方向为第一事件到第二事件。
请参见图16,所述优化模块1550包括:
第一删除模块1610,用于删除所述概率图中权重小于第一预设值的边。
第二删除模块1620,用于获取所述概率图中的协同节点组,删除所述协同节点组之间的边;其中,所述协同节点组包括在所述概率图中由一条边直接相连的第一节点和第二节点,且所述第一节点对应的第一条件概率和所述第二节点对应的第二条件概率的差值小于第二预设值。
请参见图17,所述事件确定模块1420包括:
目标事件确定模块1710,用于确定当前时间段内检测到的表现层事件为所述目标事件。
周边事件获取模块1720,用于获取当前时间段内的若干周边事件;
关联事件确定模块1730,用于对于每个周边事件,当所述周边事件与所述目标事件存在预设的共同点时,确定所述周边事件为所述目标事件的关联事件。
请参见图18,所述递归搜索模块1440包括:
搜索标记模块1810,用于以所述目标节点为当前起点进行搜索,确定以所述当前起点为出度,且边的权重值最高的关联节点为访问节点,标记所述访问节点。
重复执行模块1820,用于以所述访问节点为当前起点,重复执行搜索、标记的步骤,直至搜索完所述概率转移子图或所述概率转移子图不存在联通路。
所述装置还包括规则预设模块,用于通过预设规则对所述目标事件和所述关联事件进行匹配,从所述关联事件中确定所述目标事件的根因。
上述实施例中提供的装置可执行本发明任意实施例所提供方法,具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的方法。
请参见图19,本实施例还提供了一种设备,该设备1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对设备中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在设备1900上执行存储介质1930中的一系列指令操作。设备1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。本实施例上述的任一方法均可基于图19所示的设备进行实施。
本实施例还提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行如本实施例上述的任一方法。
本发明具体可以应用于需要进行故障检测或者相关事件检测,并需要对发生的故障和事件进行根因分析的应用场景,能够快速定位到引发当前故障的深层原因,以便于更好地着手排查,降低故障的影响时长和影响范围,有效提升服务的可用性;在准确性上也比传统的人工有很大提升,且可以借助大数据的能力,更加广泛的收集可能故障原因,从而使得根因的分析更为准确、精细。
本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤和顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或中断产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。
本实施例中所示出的结构,仅仅是与本申请方案相关的部分结构,并不构成对本申请方案所应用于其上的设备的限定,具体的设备可以包括比示出的更多或更少的部件,或者组合某些部件,或者具有不同的部件的布置。应当理解到,本实施例中所揭露的方法、装置等,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分仅仅为一种逻辑功能的划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元模块的间接耦合或通信连接。
基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域技术人员还可以进一步意识到,结合本说明书所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但这种实现不应认为超出本发明的范围。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种根因分析方法,其特征在于,包括:
获取历史事件关联数据,根据所述历史事件关联数据构建事件概率转移图,其中,每个事件与所述事件概率转移图中的节点一一对应;
确定当前时间段内的目标事件,以及与所述目标事件相关联的关联事件;
在所述事件概率转移图中确定与所述目标事件对应的目标节点,以及与所述关联事件对应的关联节点,根据所述目标节点和所述关联节点生成与当前时间段相对应的概率转移子图;
在所述概率转移子图中,以所述目标节点为起点,递归搜索满足访问条件的下一个关联节点,直至所述概率转移子图中不存在满足所述访问条件的关联节点;
确定最后访问的关联节点所对应的关联事件为所述目标事件的根因。
2.根据权利要求1所述的一种根因分析方法,其特征在于,所述获取历史事件关联数据,根据所述历史事件关联数据构建事件概率转移图包括:
对所述历史事件关联数据进行预处理,得到基础事件组;
确定所述基础事件组的频繁项集以及每个频繁项集相应的支持度,其中每个频繁项集中包括两个事件;
根据每个频繁项集相应的支持度,确定每个频繁项集中两个事件的条件概率;
以所述基础事件组中的各事件为节点,以所述条件概率为两个节点之间边的权重,构建概率图;
对所述概率图进行优化,生成所述事件概率转移图。
3.根据权利要求2所述的一种根因分析方法,其特征在于,所述每个频繁项集中的两个事件为第一事件和第二事件,所述根据每个频繁项集相应的支持度,确定每个频繁项集中两个事件的条件概率包括:
计算在第二事件发生的情况下,第一事件发生的第一条件概率,其概率转移方向为第二事件到第一事件;
以及,计算在第一事件发生的情况下,第二事件发生的第二条件概率,其概率转移方向为第一事件到第二事件。
4.根据权利要求3所述的一种根因分析方法,其特征在于,所述对所述概率图进行优化,生成所述事件概率转移图包括:
删除所述概率图中权重小于第一预设值的边;
获取所述概率图中的协同节点组,删除所述协同节点组之间的边;其中,所述协同节点组包括在所述概率图中由一条边直接相连的第一节点和第二节点,且所述第一节点对应的第一条件概率和所述第二节点对应的第二条件概率的差值小于第二预设值。
5.根据权利要求1所述的一种根因分析方法,其特征在于,所述确定当前时间段内的目标事件,以及与所述目标事件相关联的关联事件包括:
确定当前时间段内检测到的表现层事件为所述目标事件;
获取当前时间段内的若干周边事件;
对于每个周边事件,当所述周边事件与所述目标事件存在预设的共同点时,确定所述周边事件为所述目标事件的关联事件。
6.根据权利要求1所述的一种根因分析方法,其特征在于,所述在所述概率转移子图中,以所述目标节点为起点,递归搜索满足访问条件的下一个关联节点,直至所述概率转移子图中不存在满足所述访问条件的关联节点包括:
以所述目标节点为当前起点进行搜索,确定以所述当前起点为出度,且边的权重值最高的关联节点为访问节点,标记所述访问节点;
以所述访问节点为当前起点,重复执行搜索、标记的步骤,直至搜索完所述概率转移子图或所述概率转移子图不存在联通路。
7.根据权利要求1所述的一种根因分析方法,其特征在于,所述方法还包括:
通过预设规则对所述目标事件和所述关联事件进行匹配,从所述关联事件中确定所述目标事件的根因。
8.一种根因分析装置,其特征在于,包括:
概率转移图构建模块,用于获取历史事件关联数据,根据所述历史事件关联数据构建事件概率转移图,其中,每个事件与所述事件概率转移图中的节点一一对应;
事件确定模块,用于确定当前时间段内的目标事件,以及与所述目标事件相关联的关联事件;
子图生成模块,用于在所述事件概率转移图中确定与所述目标事件对应的目标节点,以及与所述关联事件对应的关联节点,根据所述目标节点和所述关联节点生成与当前时间段相对应的概率转移子图;
递归搜索模块,用于在所述概率转移子图中,以所述目标节点为起点,递归搜索满足访问条件的下一个关联节点,直至所述概率转移子图中不存在满足所述访问条件的关联节点;
根因确定模块,用于确定最后访问的关联节点所对应的关联事件为所述目标事件的根因。
9.一种设备,其特征在于,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至7任一项所述的根因分析方法。
10.一种计算机存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行如权利要求1至7任一项所述的根因分析方法。
CN201910380698.7A 2019-05-08 2019-05-08 一种根因分析方法、装置、设备及存储介质 Active CN110147387B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910380698.7A CN110147387B (zh) 2019-05-08 2019-05-08 一种根因分析方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910380698.7A CN110147387B (zh) 2019-05-08 2019-05-08 一种根因分析方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN110147387A true CN110147387A (zh) 2019-08-20
CN110147387B CN110147387B (zh) 2023-06-09

Family

ID=67594871

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910380698.7A Active CN110147387B (zh) 2019-05-08 2019-05-08 一种根因分析方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN110147387B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110515758A (zh) * 2019-08-27 2019-11-29 北京博睿宏远数据科技股份有限公司 一种故障定位方法、装置、计算机设备及存储介质
CN110661818A (zh) * 2019-10-30 2020-01-07 腾讯云计算(北京)有限责任公司 事件异常检测方法、装置、可读存储介质和计算机设备
CN112052151A (zh) * 2020-10-09 2020-12-08 腾讯科技(深圳)有限公司 故障根因分析方法、装置、设备及存储介质
CN112102891A (zh) * 2020-08-04 2020-12-18 广东工业大学 基于根因分析层次聚类的马蹄焰玻璃熔窑能耗异常定位方法
CN113535050A (zh) * 2021-09-16 2021-10-22 深圳市至简科技设计有限公司 一种基于界面联动的多界面展示方法、系统及设备
CN113572633A (zh) * 2021-06-15 2021-10-29 阿里巴巴新加坡控股有限公司 根因定位方法、系统、设备及存储介质
WO2022007108A1 (zh) * 2020-07-07 2022-01-13 南京邮电大学 一种基于深度学习的网络告警定位方法
CN115422263A (zh) * 2022-11-01 2022-12-02 广东亿能电力股份有限公司 一种电力现场多功能通用型故障分析方法及系统
CN116502125A (zh) * 2023-04-28 2023-07-28 成都赛力斯科技有限公司 车辆事件划分方法、装置及车联网服务器
CN117194083A (zh) * 2023-06-19 2023-12-08 山东理工大学 基于因果推断的流程时间异常根因追溯分析方法与系统
EP4071616A4 (en) * 2019-12-03 2024-01-24 Zte Corp METHOD FOR GENERATING A TOPOLOGY DIAGRAM, ANOMALY DETECTION METHOD, APPARATUS, APPARATUS AND STORAGE MEDIUM

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5748098A (en) * 1993-02-23 1998-05-05 British Telecommunications Public Limited Company Event correlation
US20050188240A1 (en) * 2003-12-19 2005-08-25 Brendan Murphy Determination of related failure events in a multi-node system
EP1954004A1 (en) * 2007-01-31 2008-08-06 Deutsche Telekom AG Method for collaborative storage of event-related data in sensor networks and sensor network capable of providing a file system for storing event-related data
WO2011015135A1 (zh) * 2009-08-04 2011-02-10 华为技术有限公司 一种系统故障检测的方法及装置
US20130097463A1 (en) * 2011-10-12 2013-04-18 Vmware, Inc. Method and apparatus for root cause and critical pattern prediction using virtual directed graphs
CN105006119A (zh) * 2015-06-30 2015-10-28 中国寰球工程公司 一种基于贝叶斯网络的报警系统优化方法
US20160148111A1 (en) * 2014-11-26 2016-05-26 Yokogawa Electric Corporation Event analysis apparatus, event analysis method and computer program product
US20160224899A1 (en) * 2015-01-29 2016-08-04 Splunk Inc. Methods and Systems For Determining Probabilities of Occurrence For Events and Determining Anomalous events
WO2016188279A1 (zh) * 2015-05-25 2016-12-01 阿里巴巴集团控股有限公司 一种故障谱的生成、基于故障谱的检测方法和装置
US20170201897A1 (en) * 2016-01-08 2017-07-13 Futurewei Technologies, Inc. Fingerprinting root cause analysis in cellular systems
US20170364819A1 (en) * 2016-06-17 2017-12-21 Futurewei Technologies, Inc. Root cause analysis in a communication network via probabilistic network structure
WO2018009643A1 (en) * 2016-07-07 2018-01-11 Aspen Technology, Inc. Computer systems and methods for performing root cause analysis and building a predictive model for rare event occurrences in plant-wide operations
CN108009715A (zh) * 2017-11-28 2018-05-08 邢加和 一种自动分析指标波动根因的方法
CN108320040A (zh) * 2017-01-17 2018-07-24 国网重庆市电力公司 基于贝叶斯网络优化算法的采集终端故障预测方法及系统
CN108768753A (zh) * 2018-06-26 2018-11-06 腾讯科技(深圳)有限公司 告警源的定位方法、装置、存储介质及电子装置
CN109634808A (zh) * 2018-12-05 2019-04-16 中信百信银行股份有限公司 一种基于关联分析的链式监控事件根因分析方法
CN109672554A (zh) * 2018-10-24 2019-04-23 华为技术服务有限公司 确定故障根因的方法及装置

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5748098A (en) * 1993-02-23 1998-05-05 British Telecommunications Public Limited Company Event correlation
US20050188240A1 (en) * 2003-12-19 2005-08-25 Brendan Murphy Determination of related failure events in a multi-node system
EP1954004A1 (en) * 2007-01-31 2008-08-06 Deutsche Telekom AG Method for collaborative storage of event-related data in sensor networks and sensor network capable of providing a file system for storing event-related data
WO2011015135A1 (zh) * 2009-08-04 2011-02-10 华为技术有限公司 一种系统故障检测的方法及装置
US20130097463A1 (en) * 2011-10-12 2013-04-18 Vmware, Inc. Method and apparatus for root cause and critical pattern prediction using virtual directed graphs
US20160148111A1 (en) * 2014-11-26 2016-05-26 Yokogawa Electric Corporation Event analysis apparatus, event analysis method and computer program product
US20160224899A1 (en) * 2015-01-29 2016-08-04 Splunk Inc. Methods and Systems For Determining Probabilities of Occurrence For Events and Determining Anomalous events
WO2016188279A1 (zh) * 2015-05-25 2016-12-01 阿里巴巴集团控股有限公司 一种故障谱的生成、基于故障谱的检测方法和装置
CN105006119A (zh) * 2015-06-30 2015-10-28 中国寰球工程公司 一种基于贝叶斯网络的报警系统优化方法
US20170201897A1 (en) * 2016-01-08 2017-07-13 Futurewei Technologies, Inc. Fingerprinting root cause analysis in cellular systems
US20170364819A1 (en) * 2016-06-17 2017-12-21 Futurewei Technologies, Inc. Root cause analysis in a communication network via probabilistic network structure
WO2018009643A1 (en) * 2016-07-07 2018-01-11 Aspen Technology, Inc. Computer systems and methods for performing root cause analysis and building a predictive model for rare event occurrences in plant-wide operations
CN108320040A (zh) * 2017-01-17 2018-07-24 国网重庆市电力公司 基于贝叶斯网络优化算法的采集终端故障预测方法及系统
CN108009715A (zh) * 2017-11-28 2018-05-08 邢加和 一种自动分析指标波动根因的方法
CN108768753A (zh) * 2018-06-26 2018-11-06 腾讯科技(深圳)有限公司 告警源的定位方法、装置、存储介质及电子装置
CN109672554A (zh) * 2018-10-24 2019-04-23 华为技术服务有限公司 确定故障根因的方法及装置
CN109634808A (zh) * 2018-12-05 2019-04-16 中信百信银行股份有限公司 一种基于关联分析的链式监控事件根因分析方法

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110515758A (zh) * 2019-08-27 2019-11-29 北京博睿宏远数据科技股份有限公司 一种故障定位方法、装置、计算机设备及存储介质
CN110515758B (zh) * 2019-08-27 2023-03-31 北京博睿宏远数据科技股份有限公司 一种故障定位方法、装置、计算机设备及存储介质
CN110661818B (zh) * 2019-10-30 2022-07-08 腾讯云计算(北京)有限责任公司 事件异常检测方法、装置、可读存储介质和计算机设备
CN110661818A (zh) * 2019-10-30 2020-01-07 腾讯云计算(北京)有限责任公司 事件异常检测方法、装置、可读存储介质和计算机设备
EP4071616A4 (en) * 2019-12-03 2024-01-24 Zte Corp METHOD FOR GENERATING A TOPOLOGY DIAGRAM, ANOMALY DETECTION METHOD, APPARATUS, APPARATUS AND STORAGE MEDIUM
WO2022007108A1 (zh) * 2020-07-07 2022-01-13 南京邮电大学 一种基于深度学习的网络告警定位方法
CN112102891A (zh) * 2020-08-04 2020-12-18 广东工业大学 基于根因分析层次聚类的马蹄焰玻璃熔窑能耗异常定位方法
CN112052151A (zh) * 2020-10-09 2020-12-08 腾讯科技(深圳)有限公司 故障根因分析方法、装置、设备及存储介质
CN112052151B (zh) * 2020-10-09 2022-02-18 腾讯科技(深圳)有限公司 故障根因分析方法、装置、设备及存储介质
CN113572633B (zh) * 2021-06-15 2023-05-19 阿里巴巴新加坡控股有限公司 根因定位方法、系统、设备及存储介质
CN113572633A (zh) * 2021-06-15 2021-10-29 阿里巴巴新加坡控股有限公司 根因定位方法、系统、设备及存储介质
CN113535050B (zh) * 2021-09-16 2021-12-07 深圳市至简科技设计有限公司 一种基于界面联动的多界面展示方法、系统及设备
CN113535050A (zh) * 2021-09-16 2021-10-22 深圳市至简科技设计有限公司 一种基于界面联动的多界面展示方法、系统及设备
CN115422263A (zh) * 2022-11-01 2022-12-02 广东亿能电力股份有限公司 一种电力现场多功能通用型故障分析方法及系统
CN116502125A (zh) * 2023-04-28 2023-07-28 成都赛力斯科技有限公司 车辆事件划分方法、装置及车联网服务器
CN116502125B (zh) * 2023-04-28 2024-03-12 重庆赛力斯凤凰智创科技有限公司 车辆事件划分方法、装置及车联网服务器
CN117194083A (zh) * 2023-06-19 2023-12-08 山东理工大学 基于因果推断的流程时间异常根因追溯分析方法与系统
CN117194083B (zh) * 2023-06-19 2024-03-29 山东理工大学 基于因果推断的流程时间异常根因追溯分析方法与系统

Also Published As

Publication number Publication date
CN110147387B (zh) 2023-06-09

Similar Documents

Publication Publication Date Title
CN110147387A (zh) 一种根因分析方法、装置、设备及存储介质
KR102483025B1 (ko) 운영 유지 시스템 및 방법
CN105095048B (zh) 一种基于业务规则的监控系统告警关联处理方法
CN110493025B (zh) 一种基于多层有向图的故障根因诊断的方法及装置
CN109189736B (zh) 一种告警关联规则的生成方法和装置
CN111459766A (zh) 一种面向微服务系统的调用链跟踪与分析方法
CN107886238A (zh) 一种基于海量数据分析的业务流程管理系统及方法
CN110430224B (zh) 一种基于随机块模型的通信网络异常行为检测方法
CN110427298B (zh) 一种分布式日志的自动特征提取方法
CN112769605B (zh) 一种异构多云的运维管理方法及混合云平台
Bhaduri et al. Detecting abnormal machine characteristics in cloud infrastructures
CN110162445A (zh) 基于主机日志及性能指标的主机健康评价方法及装置
CN113259176B (zh) 一种告警事件分析方法和装置
CN110135603B (zh) 一种基于改进熵权法的电力网络告警空间特征分析方法
CN112559237B (zh) 运维系统排障方法、装置、服务器和存储介质
CN112422571A (zh) 一种跨越多个属性网络进行异常对齐的方法
EP4024765A1 (en) Method and apparatus for extracting fault propagation condition, and storage medium
Shahraki et al. An outlier detection method to improve gathered datasets for network behavior analysis in IoT
CN115237717A (zh) 一种微服务异常检测方法和系统
CN110287237B (zh) 一种基于社会网络结构分析社团数据挖掘方法
CN116684253A (zh) 基于智能运维的网络异常管控方法
Shogan A single server queue with arrival rate dependent on server breakdowns
Li et al. A distributed parallel alarm management strategy for alarm reduction in chemical plants
Bhuiyan et al. Event detection through differential pattern mining in internet of things
CN107454089A (zh) 一种基于多节点关联性的网络安全态势诊断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant