CN113391943B - 一种基于因果推断的微服务故障根因定位方法及装置 - Google Patents

一种基于因果推断的微服务故障根因定位方法及装置 Download PDF

Info

Publication number
CN113391943B
CN113391943B CN202110681573.5A CN202110681573A CN113391943B CN 113391943 B CN113391943 B CN 113391943B CN 202110681573 A CN202110681573 A CN 202110681573A CN 113391943 B CN113391943 B CN 113391943B
Authority
CN
China
Prior art keywords
fault
micro
service
network element
index data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110681573.5A
Other languages
English (en)
Other versions
CN113391943A (zh
Inventor
朱文辉
傅雪娟
江智豪
丁凯培
刘跃群
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN202110681573.5A priority Critical patent/CN113391943B/zh
Publication of CN113391943A publication Critical patent/CN113391943A/zh
Application granted granted Critical
Publication of CN113391943B publication Critical patent/CN113391943B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis

Abstract

本发明提出一种基于因果推断的微服务故障根因定位方法及装置,解决了当前微服务故障根因定位方法无法兼顾定位准确度及定位效率,且网络运行开销耗费大的问题,其中方法包括故障网元定位、因果推断模型构建、故障根因定位三个阶段,本发明能够严格区分各组件节点间的因果关系,从而能够对冗余的节点进行剔除,克服传统人工或者简单的机器运维费时费力的缺点,同时因果溯源的特性能够快速精准地对故障根因进行定位,对智能运维的发展具有一定的研究价值和意义。

Description

一种基于因果推断的微服务故障根因定位方法及装置
技术领域
本发明涉及数据分析和因果推断的技术领域,更具体地,涉及一种基于因果推断的微服务故障根因定位方法及装置。
背景技术
近年来,微服务框架的应用场景越来越广,在微服务体系结构中,一个应用程序可被解耦成多个微服务。在发生故障时,故障会在整个动态拓扑网络中传播,从而引起多个节点的告警并出现告警风暴,将导致运维难度成倍提高。因此,一旦微服务出现故障又无法迅速定位并解决根因,将直接影响用户体验,给应用的企业带来巨大的经济损失。
目前,有许多故障根因定位方法被提出,如基于事件相关性分析的方法、基于日志的方法、基于路径跟踪的方法等,其中,基于事件相关性分析的方法无法保障定位准确度,而由于微服务系统中日志数据量很大,使用基于日志的方法直接分析日志需要很高的开销;基于路径跟踪的方法则难以适应微服务的动态变化。
2020年3月17日,中国发明专利(CN110888755A)中公开一种微服务系统异常根因节点的查找方法,该专利所提出的方案通过微服务节点之间生成的依赖关系拓扑图,结合多种算法(如孤立森林算法、皮尔森相关系数算法),对依赖关系拓扑图中的各拓扑节点进行状态更新以及异常检测得到互为父子关系的异常根因节点之间的拓扑依赖关系,基于该拓扑依赖关系,进而计算出待定的各异常根因节点对目标故障节点的根因影响程度对应的各根因分值,最终实现快速查找出最大根因分值对应的异常根因节点,不需要人工对各拓扑节点对应的状态数据进行标注、也不需要人工进行状态数据的筛选,进而提高了微服务系统异常根因节点的排查效率,显著降低了人力成本,但过程需要复杂的算法和模型支撑,因此,相对而言费时且网络运行开销大。
发明内容
为解决当前微服务故障根因定位方法无法兼顾定位准确度及定位效率,且网络运行开销耗费大的问题,本发明提出一种基于因果推断的微服务故障根因定位方法及装置,克服了传统人工或者简单的机器运维费时费力的缺点,迅速精准地定位出发生故障的组件。
为了达到上述技术效果,本发明的技术方案如下:
一种基于因果推断的微服务故障根因定位方法,所述方法至少包括:
S1.采集业务指标数据,对业务指标数据进行异常检测,并根据时间戳信息定位故障时刻;
S2.根据微服务调用关系,对微服务调用关系进行还原,定位微服务故障网元组件;
S3.确定微服务故障网元组件的指标,利用微服务故障网元组件的所有指标构建全连接图;
S4.确定时序指标数据,结合全连接图,对时序指标数据进行偏相关独立性检测及瞬时独立性检验,形成因果推断模型;
S5.故障网元组件节点基于因果推断模型进行偏相关随机游走,根据故障网元组件节点的游走次数计算故障得分,并按从大到小顺序将故障得分排序;
S6.根据故障得分排序,输出故障根因。
优选地,步骤S1所述的业务指标数据包括:微服务调用平均时间、调用成功次数及调用成功率,业务指标数据进行异常检测时采用3σ原则。
优选地,步骤S2所述定位微服务故障网元组件的具体过程为:
S21.将所定位的故障时刻时段处在同一个调用链ID的组件进行连接,完成微服务调用关系的还原,形成调用链拓扑图,所述调用链拓扑图中包各组件节点和调用关系;
S22.各组件节点采用随机游走算法在调用链拓扑图上进行随机游走,输出游走次数最多的组件节点,将其作为故障网元组件。
优选地,所述随机游走算法的随机游走种类包括前向游走、反向游走及自游走。
优选地,微服务故障网元组件的指标包括:内存指标、网络指标和中央处理器指标。
优选地,步骤S4所述对时序指标数据进行偏相关独立性检测及瞬时独立性检验,形成因果推断模型的具体过程为:
S41.设t时刻的时序指标数据表示为:
Figure BDA0003122831570000021
N表示数据个数,初始化条件
Figure BDA0003122831570000031
设S是
Figure BDA0003122831570000032
的父亲节点;
S42.在显著性水平α下,若
Figure BDA00031228315700000315
不能被拒绝,则从
Figure BDA0003122831570000033
中删除Xt-τ τ,剔除无关条件,完成偏相关独立性检测,得到无关条件剔除后的全连接图;
S43.若
Figure BDA0003122831570000034
其中,
Figure BDA0003122831570000035
不包括Xt-τ τ以及
Figure BDA0003122831570000036
则定出方向Xt-τ τ→Xt j,确定因果规则的走向,形成最终的因果推断模型。
优选地,步骤S5的具体过程为:
S51.首先对时序指标数据进行异常等级检测,异常等级检测采用阈值法,其中,成果率指标设置为低阈值,除成果率指标之外的其它指标设置为高阈值;
S52.计算时序指标数据的故障等级,表达式为:
Figure BDA0003122831570000037
其中,
Figure BDA0003122831570000038
表示故障等级,
Figure BDA0003122831570000039
表示t时刻第j个时序数据,
Figure BDA00031228315700000310
表示阈值数值;
S53.故障网元组件节点基于因果推断模型进行偏相关随机游走,得到节点游走次数v,根据节点游走次数计算故障得分,计算表达式为:
Figure BDA00031228315700000311
其中,
Figure BDA00031228315700000312
表示标准化的游走次数,
Figure BDA00031228315700000313
表示标准化的故障等级,
Figure BDA00031228315700000314
表示是控制参数。
优选地,步骤S6所述根据故障得分排序,输出故障根因时,选取故障得分排序位于前2~3个的根因作为故障根因输出。
本发明还提出一种基于因果推断的微服务故障根因定位装置,所述装置用于实现所述的基于因果推断的微服务故障根因定位方法,包括:
采集检测模块,用于采集业务指标数据,对业务指标数据进行异常检测,并根据时间戳信息定位故障时刻;
故障网元组件定位模块,根据微服务调用关系,对微服务调用关系进行还原,定位微服务故障网元组件;
全连接图构建模块,用于确定微服务故障网元组件的指标,利用微服务故障网元组件的所有指标构建全连接图;
因果推断模型形成模块,用于确定时序指标数据,结合全连接图,对时序指标数据进行偏相关独立性检测及瞬时独立性检验,形成因果推断模型;
故障得分计算模块,根据故障网元组件节点的游走次数计算故障得分,并按从大到小顺序将故障得分排序;
输出模块,根据故障得分排序,输出故障根因。
一种存储介质,所述存储介质上存储有实现基于因果判断的微服务故障根因定位方法的程序,所述程序被处理器执行以实现所述的基于因果判断的微服务故障根因定位方法的步骤。
与现有技术相比,本发明技术方案的有益效果是:
本发明提出一种基于因果推断的微服务故障根因定位方法及装置,其中方法包括故障网元定位、因果推断模型构建、故障根因定位三个阶段,在故障网元定位阶段,对业务指标数据进行异常检测,根据时间戳信息进行故障时刻的定位,之后对微服务调用关系进行还原并定位故障网元组件;在因果推断模型构建阶段,进行指标全连接图的构建,对其进行独立性检验,从而对无关条件进行删除,随后进行第二阶段的瞬时条件独立性检测,结合时序信息和因果规则进行方向的确定;在故障根因定位阶段,进行故障等级判定,实施随机游走算法,根据故障等级得分输出故障根因,本发明能够严格区分各组件节点间的因果关系,从而能够对冗余的节点进行剔除,克服传统人工或者简单的机器运维费时费力的缺点,同时因果溯源的特性能够快速精准地对故障根因进行定位,对智能运维的发展具有一定的研究价值和意义。
附图说明
图1表示本发明所提方案实现的框架图;
图2表示本发明实施例中提出的基于因果推断的微服务故障根因定位方法的流程示意图;
图3表示本发明实施例中提出的基于因果推断的微服务故障根因定位系统的结构图;
图4表示应用本发明所提方法得出的故障根因输出结果的示意图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好地说明本实施例,附图某些部位会有省略、放大或缩小,并不代表实际尺寸;
对于本领域技术人员来说,附图中某些公知内容说明可能省略是可以理解的。
附图中描述位置关系的仅用于示例性说明,不能理解为对本专利的限制;
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例
考虑现有的故障根因定位方法无法满足微服务框架下的需求,本发明提出利用因果推断区分各组件节点间的因果关系,本发明所提方案实现的框架图如图1所示。
参见图1,本发明所提方案包括了故障网元定位、因果推断模型构建、故障根因定位三个阶段,在故障网元定位阶段,对业务指标数据进行异常检测,根据时间戳信息进行故障时刻的定位,之后对微服务调用关系进行还原并定位故障网元组件;在因果推断模型构建阶段,进行指标全连接图的构建,对其进行独立性检验,从而对无关条件进行删除,随后进行第二阶段的瞬时条件独立性检测,结合时序信息和因果规则进行方向的确定;在故障根因定位阶段,进行故障等级判定,实施随机游走算法,根据故障等级得分输出故障根因。
下面具体进行说明:
参见图2,在本实施例中,提出一种基于因果推断的微服务故障根因定位方法,所述方法包括:
S1.采集业务指标数据,对业务指标数据进行异常检测,并根据时间戳信息定位故障时刻;
所述的业务指标数据包括:微服务调用平均时间、调用成功次数及调用成功率,业务指标数据进行异常检测时采用3σ原则。
S2.根据微服务调用关系,对微服务调用关系进行还原,定位微服务故障网元组件;
定位微服务故障网元组件的具体过程为:
S21.将所定位的故障时刻时段处在同一个调用链ID的组件进行连接,完成微服务调用关系的还原,形成调用链拓扑图,所述调用链拓扑图中包各组件节点和调用关系;
S22.各组件节点采用随机游走算法在调用链拓扑图上进行随机游走,输出游走次数最多的组件节点,将其作为故障网元组件。
在此,故障网元组件的定位是指具体定位到某个操作系统或数据库。
S3.确定微服务故障网元组件的指标,利用微服务故障网元组件的所有指标构建全连接图;
微服务故障网元组件的指标包括:内存指标、网络指标和中央处理器指标。
S4.确定时序指标数据,结合全连接图,对时序指标数据进行偏相关独立性检测及瞬时独立性检验,形成因果推断模型;
所述对时序指标数据进行偏相关独立性检测及瞬时独立性检验,形成因果推断模型的具体过程为:
S41.设t时刻的时序指标数据表示为:
Figure BDA0003122831570000061
N表示数据个数,初始化条件
Figure BDA0003122831570000062
设S是
Figure BDA0003122831570000063
的父亲节点;
S42.在显著性水平α下,若
Figure BDA00031228315700000612
不能被拒绝,则从
Figure BDA0003122831570000064
中删除Xt-τ τ,剔除无关条件,完成偏相关独立性检测,得到无关条件剔除后的全连接图;
S43.若
Figure BDA0003122831570000065
其中,
Figure BDA0003122831570000066
不包括Xt-τ τ以及
Figure BDA0003122831570000067
则定出方向Xt-τ τ→Xt j,确定因果规则的走向,形成最终的因果推断模型,加入的时序信息有效解决了基于结构的因果定位方法的马尔科夫等价类问题。
在具体实施时,在因果推断模型的构建方面,结合实际的运维场景一般多含有时间信息,需要考虑时间序列数据中的时间要素而非仅从数值进行模型构建。本发明考虑时间信息加入到因果模型的构建当中,充分利用结果不能发生在原因之前这个自然定律,因此在因果定向时避免出现马尔科夫等价类定向难题。
S5.故障网元组件节点基于因果推断模型进行偏相关随机游走,根据故障网元组件节点的游走次数计算故障得分,并按从大到小顺序将故障得分排序;具体为:
S51.首先对时序指标数据进行异常等级检测,异常等级检测采用阈值法,其中,成果率指标设置为低阈值,除成果率指标之外的其它指标设置为高阈值;
S52.计算时序指标数据的故障等级,表达式为:
Figure BDA0003122831570000068
其中,
Figure BDA0003122831570000069
表示故障等级,
Figure BDA00031228315700000610
表示t时刻第j个时序数据,
Figure BDA00031228315700000611
表示阈值数值;
S53.故障网元组件节点基于因果推断模型进行偏相关随机游走,得到节点游走次数v,根据节点游走次数计算故障得分,计算表达式为:
Figure BDA0003122831570000071
其中,
Figure BDA0003122831570000072
表示标准化的游走次数,
Figure BDA0003122831570000073
表示标准化的故障等级,
Figure BDA0003122831570000074
表示是控制参数。
S6.根据故障得分排序,输出故障根因。
根据故障得分排序,输出故障根因时,选取故障得分排序位于前2~3个的根因作为故障根因输出。
如图3所示,本发明还提出一种基于因果推断的微服务故障根因定位装置,所述装置用于实现所述的基于因果推断的微服务故障根因定位方法,包括:
采集检测模块,用于采集业务指标数据,对业务指标数据进行异常检测,并根据时间戳信息定位故障时刻;
故障网元组件定位模块,根据微服务调用关系,对微服务调用关系进行还原,定位微服务故障网元组件;
全连接图构建模块,用于确定微服务故障网元组件的指标,利用微服务故障网元组件的所有指标构建全连接图;
因果推断模型形成模块,用于确定时序指标数据,结合全连接图,对时序指标数据进行偏相关独立性检测及瞬时独立性检验,形成因果推断模型;
故障得分计算模块,根据故障网元组件节点的游走次数计算故障得分,并按从大到小顺序将故障得分排序;
输出模块,根据故障得分排序,输出故障根因。
本发明还提出一种存储介质,所述存储介质上存储有实现基于因果判断的微服务故障根因定位方法的程序,所述程序被处理器执行以实现所述的基于因果判断的微服务故障根因定位方法的步骤,存储介质可为磁碟、光盘、只读存储记忆体、随机存储记忆体、快闪存储器、硬盘或固态硬盘等;所述存储介质还可以包括上述种类的存储器的组合。
为进一步验证本发明所提方案的有效性,挑选某运营商云环境的真实微服务架构2020年5月22日这天的数据进行实际验证,数据包括:调用链数据、服务之间的静态拓扑数据、观测业务的黄金指标数据,以及所依赖的底层服务(数据库、操作系统、容器和中间件)的时间序列数据。图4为最终根因输出的结果,分别为数据库03的开关状态故障、docker_001、docker_005的容器CPU故障、数据库018的队列故障以及数据库005的用户连接故障。
显然,本发明的上述实施例仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (9)

1.一种基于因果推断的微服务故障根因定位方法,其特征在于,所述方法至少包括:
S1.采集业务指标数据,对业务指标数据进行异常检测,并根据时间戳信息定位故障时刻;
S2.根据微服务调用关系,对微服务调用关系进行还原,定位微服务故障网元组件;
S3.确定微服务故障网元组件的指标,利用微服务故障网元组件的所有指标构建全连接图;
S4.确定时序指标数据,结合全连接图,对时序指标数据进行偏相关独立性检测及瞬时独立性检验,形成因果推断模型;
步骤S4所述对时序指标数据进行偏相关独立性检测及瞬时独立性检验,形成因果推断模型的具体过程为:
S41.设t时刻的时序指标数据表示为:
Figure FDA0003781202370000011
N表示数据个数,初始化条件
Figure FDA0003781202370000012
设S是
Figure FDA0003781202370000013
的父亲节点;
S42.在显著性水平α下,若
Figure FDA0003781202370000014
不能被拒绝,则从
Figure FDA0003781202370000015
中删除
Figure FDA0003781202370000016
剔除无关条件,完成偏相关独立性检测,得到无关条件剔除后的全连接图;
S43.若
Figure FDA0003781202370000017
其中,
Figure FDA0003781202370000018
不包括
Figure FDA0003781202370000019
以及
Figure FDA00037812023700000110
则定出方向
Figure FDA00037812023700000111
确定因果规则的走向,形成最终的因果推断模型;
S5.故障网元组件节点基于因果推断模型进行偏相关随机游走,根据故障网元组件节点的游走次数计算故障得分,并按从大到小顺序将故障得分排序;
S6.根据故障得分排序,输出故障根因。
2.根据权利要求1所述的基于因果推断的微服务故障根因定位方法,其特征在于,步骤S1所述的业务指标数据包括:微服务调用平均时间、调用成功次数及调用成功率,业务指标数据进行异常检测时采用3σ原则。
3.根据权利要求2所述的基于因果推断的微服务故障根因定位方法,其特征在于,步骤S2所述定位微服务故障网元组件的具体过程为:
S21.将所定位的故障时刻时段处在同一个调用链ID的组件进行连接,完成微服务调用关系的还原,形成调用链拓扑图,所述调用链拓扑图中包各组件节点和调用关系;
S22.各组件节点采用随机游走算法在调用链拓扑图上进行随机游走,输出游走次数最多的组件节点,将其作为故障网元组件。
4.根据权利要求3所述的基于因果推断的微服务故障根因定位方法,其特征在于,所述随机游走算法的随机游走种类包括前向游走、反向游走及自游走。
5.根据权利要求1所述的基于因果推断的微服务故障根因定位方法,其特征在于,微服务故障网元组件的指标包括:内存指标、网络指标和中央处理器指标。
6.根据权利要求5所述的基于因果推断的微服务故障根因定位方法,其特征在于,步骤S5的具体过程为:
S51.首先对时序指标数据进行异常等级检测,异常等级检测采用阈值法,其中,成果率指标设置为低阈值,除成果率指标之外的其它指标设置为高阈值;
S52.计算时序指标数据的故障等级,表达式为:
Figure FDA0003781202370000021
其中,
Figure FDA0003781202370000022
表示故障等级,
Figure FDA0003781202370000023
表示t时刻第j个时序数据,
Figure FDA0003781202370000024
表示阈值数值;
S53.故障网元组件节点基于因果推断模型进行偏相关随机游走,得到节点游走次数v,根据节点游走次数计算故障得分,计算表达式为:
Figure FDA0003781202370000025
其中,
Figure FDA0003781202370000026
表示标准化的游走次数,
Figure FDA0003781202370000027
表示标准化的故障等级,
Figure FDA0003781202370000028
表示是控制参数。
7.根据权利要求6所述的基于因果推断的微服务故障根因定位方法,其特征在于,步骤S6所述根据故障得分排序,输出故障根因时,选取故障得分排序位于前2~3个的根因作为故障根因输出。
8.一种基于因果推断的微服务故障根因定位装置,其特征在于,所述装置用于实现权利要求1所述的基于因果推断的微服务故障根因定位方法,包括:
采集检测模块,用于采集业务指标数据,对业务指标数据进行异常检测,并根据时间戳信息定位故障时刻;
故障网元组件定位模块,根据微服务调用关系,对微服务调用关系进行还原,定位微服务故障网元组件;
全连接图构建模块,用于确定微服务故障网元组件的指标,利用微服务故障网元组件的所有指标构建全连接图;
因果推断模型形成模块,用于确定时序指标数据,结合全连接图,对时序指标数据进行偏相关独立性检测及瞬时独立性检验,形成因果推断模型;
故障得分计算模块,根据故障网元组件节点的游走次数计算故障得分,并按从大到小顺序将故障得分排序;
输出模块,根据故障得分排序,输出故障根因。
9.一种存储介质,其特征在于,所述存储介质上存储有实现基于因果判断的微服务故障根因定位方法的程序,所述程序被处理器执行以实现如权利要求1~7中任一项所述的基于因果推 断的微服务故障根因定位方法的步骤。
CN202110681573.5A 2021-06-18 2021-06-18 一种基于因果推断的微服务故障根因定位方法及装置 Active CN113391943B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110681573.5A CN113391943B (zh) 2021-06-18 2021-06-18 一种基于因果推断的微服务故障根因定位方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110681573.5A CN113391943B (zh) 2021-06-18 2021-06-18 一种基于因果推断的微服务故障根因定位方法及装置

Publications (2)

Publication Number Publication Date
CN113391943A CN113391943A (zh) 2021-09-14
CN113391943B true CN113391943B (zh) 2023-01-06

Family

ID=77623050

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110681573.5A Active CN113391943B (zh) 2021-06-18 2021-06-18 一种基于因果推断的微服务故障根因定位方法及装置

Country Status (1)

Country Link
CN (1) CN113391943B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114325232B (zh) * 2021-12-28 2023-07-25 微梦创科网络科技(中国)有限公司 一种故障定位方法和装置
CN114579407B (zh) * 2022-05-05 2022-08-23 北京航空航天大学 一种因果关系检验和微服务指标预测报警方法
CN115150253B (zh) * 2022-06-27 2024-03-08 杭州萤石软件有限公司 一种故障根因确定方法、装置及电子设备
CN116796031B (zh) * 2023-03-01 2024-03-26 中国人民解放军海军航空大学 一种基于因果关系的故障传播路径辨识方法
CN116450399B (zh) * 2023-06-13 2023-08-22 西华大学 微服务系统故障诊断及根因定位方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111290900A (zh) * 2020-01-16 2020-06-16 中山大学 一种基于微服务日志的软件故障检测方法
CN111694721A (zh) * 2020-06-15 2020-09-22 南方电网科学研究院有限责任公司 一种微服务的故障监测方法和装置
CN112491634A (zh) * 2020-12-21 2021-03-12 北京云思畅想科技有限公司 一种微服务场景下全链路智能故障模拟及评估防御方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10289471B2 (en) * 2016-02-08 2019-05-14 Nec Corporation Ranking causal anomalies via temporal and dynamical analysis on vanishing correlations
CN109861858B (zh) * 2019-01-28 2020-06-26 北京大学 微服务系统根因节点的错误排查方法
CN112231187B (zh) * 2019-07-15 2022-07-26 华为技术有限公司 微服务异常分析方法及装置
CN112698975B (zh) * 2020-12-14 2022-09-27 北京大学 一种微服务架构信息系统的故障根因定位方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111290900A (zh) * 2020-01-16 2020-06-16 中山大学 一种基于微服务日志的软件故障检测方法
CN111694721A (zh) * 2020-06-15 2020-09-22 南方电网科学研究院有限责任公司 一种微服务的故障监测方法和装置
CN112491634A (zh) * 2020-12-21 2021-03-12 北京云思畅想科技有限公司 一种微服务场景下全链路智能故障模拟及评估防御方法

Also Published As

Publication number Publication date
CN113391943A (zh) 2021-09-14

Similar Documents

Publication Publication Date Title
CN113391943B (zh) 一种基于因果推断的微服务故障根因定位方法及装置
KR102483025B1 (ko) 운영 유지 시스템 및 방법
CN113282461B (zh) 传输网的告警识别方法和装置
US20180095816A1 (en) Scalable predictive early warning system for data backup event log
CN111338836A (zh) 处理故障数据的方法、装置、计算机设备和存储介质
CN114328198A (zh) 一种系统故障检测方法、装置、设备及介质
CN111913824B (zh) 确定数据链路故障原因的方法及相关设备
CN113360722A (zh) 一种基于多维数据图谱的故障根因定位方法及系统
CN115204536A (zh) 楼宇设备故障预测方法、装置、设备及存储介质
CN116361147A (zh) 测试用例根因定位方法及其装置、设备、介质、产品
CN116610104A (zh) 基于砷烷合成控制系统的故障分析方法及系统
CN113965497B (zh) 服务器异常识别方法、装置、计算机设备及可读存储介质
CN111444075A (zh) 一种自动发现关键影响力指标的方法
CN115309575A (zh) 基于图卷积神经网络的微服务故障诊断方法、装置及设备
CN114416573A (zh) 一种应用程序的缺陷分析方法、装置、设备及介质
CN113313304A (zh) 一种基于大数据决策树的电网事故异常分析方法及系统
CN117376228A (zh) 一种网络安全测试工具确定方法及装置
CN111045902A (zh) 服务器的压力测试方法及装置
CN109889258B (zh) 一种光网络故障校验方法和设备
CN116582414A (zh) 故障根因定位方法、装置、设备及可读存储介质
US20220245475A1 (en) Automatically evaluating application architecture through architecture-as-code
CN114765574B (zh) 一种网络异常定界定位方法及装置
CN115514627A (zh) 一种故障根因定位方法、装置、电子设备及可读存储介质
CN113094249A (zh) 一种节点异常检测方法、装置及介质
CN114157553A (zh) 一种数据处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant