CN113032238A - 基于应用知识图谱的实时根因分析方法 - Google Patents

基于应用知识图谱的实时根因分析方法 Download PDF

Info

Publication number
CN113032238A
CN113032238A CN202110568306.7A CN202110568306A CN113032238A CN 113032238 A CN113032238 A CN 113032238A CN 202110568306 A CN202110568306 A CN 202110568306A CN 113032238 A CN113032238 A CN 113032238A
Authority
CN
China
Prior art keywords
abnormal
root cause
fault
knowledge graph
application
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110568306.7A
Other languages
English (en)
Other versions
CN113032238B (zh
Inventor
赵杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanchang Huilian Network Technology Co ltd
Original Assignee
Nanchang Huilian Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanchang Huilian Network Technology Co ltd filed Critical Nanchang Huilian Network Technology Co ltd
Priority to CN202110568306.7A priority Critical patent/CN113032238B/zh
Publication of CN113032238A publication Critical patent/CN113032238A/zh
Application granted granted Critical
Publication of CN113032238B publication Critical patent/CN113032238B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Biology (AREA)
  • Computer Hardware Design (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种基于应用知识图谱的实时根因分析方法,通过构建应用知识图谱,实现对运维对象KPI指标的实时检测和根因分析。所用核心方法包括:基于关键指标选择和Bagel检测的多指标异常检测方法;跨层的知识图谱异常推理;故障链剪枝;基于相似性算法的实例级根因分析。有益效果在于:能够定位到系统故障的根本原因,且具有可扩展性,满足生产服务的要求。

Description

基于应用知识图谱的实时根因分析方法
技术领域
本发明涉及数据业务支撑的网络信息管理技术领域,尤其涉及一种基于应用知识图谱的实时根因分析方法。
背景技术
随着云平台、5G、物联网等基础设施的发展,容器化、面向服务、分布式架构等应用体系的应用,IT运维管理对象的模块、依赖场景越来越复杂。在复杂系统中,IT运管对象涉及应用服务、中间件、主机、网络等多个层级,包含调用、依赖关系的多个运维对象。当复杂系统存在异常或故障时,针对运维对象KPI异常的检测能力和根因分析能力不足,已经成为运维工作的核心痛点之一。
在针对此问题的现有专利中,专利号CN110888755A提出的主要方案为:基于依赖关系拓扑,通过算法对待定根因节点基于影响力排序,实现根因分析。专利号CN111190756A的主要方案为:基于算法,对时间窗口的调用链数据进行异常检测;将异常、正常请求的服务实例KPI、实例间依赖关系输入自定义方阵迭代计算得到服务实例异常、正常得分;结合服务实例异常得分和正常得分,采用频谱方法计算每个服务实例的最终得分,并根据最终得分高低返回可疑服务实例列表。
以上所述现有应用场景下的故障根因分析方法,主要存在两个问题:运维对象KPI指标巨大,实时检测性能不足,缺乏在复杂系统中实时定位根因的能力;推理能力不足,没有建立异常的传播链,当多个运维对象出现异常时,无法提高故障定位效率。
发明内容
针对上述现有技术存在的缺陷,本发明提出了一种基于应用知识图谱的实时根因分析方法,是一种面向应用场景的通用故障根因分析方案,通过构建应用知识图谱,实现对运维对象KPI指标的实时检测和根因分析,定位系统故障的根本原因,且具有可扩展性,能够满足生产服务的要求。
本发明的技术方案是这样实现的:
一种基于应用知识图谱的实时根因分析方法,具体包括:
构建运维对象的知识图谱,构建运维对象结构体,将应用的各个运维对象按相互关系有机的联系在一起,以支持后续的根因推断;
构建KPI指标,构建应用场景的四类黄金指标,包括业务量、成功率、延迟和TPS,其中业务量代表流入系统的请求数量,成功率代表请求流出系统成功或者失败的比例,延迟代表系统处理请求的性能,TPS为系统吞吐量,代表系统当前能够处理的请求数量
多指标异常检测,通过多指标异常检测算法对运维对象的KPI指标实时检测,其中,所述算法包括:利用历史数据,通过PCA模型,选择出在应用场景中造成影响的主指标;实时将选择出的关键指标输入到使用历史数据训练好的Bagel神经网络中,对各层的运维对象进行同步异常检测,检测后返回各个运维对象的实时异常情况、异常开始时间和异常打分;
基于知识图谱的异常链推理,通过构建的应用知识图谱,从应用服务层级的异常入口,推理异常传播的路径,同时对每条传播路径根据路径深度、异常等级、持续时间给予评分;
故障链剪枝,利用异常链推理后形成的按链接权重排列的多条故障链,根据不同层级运维对象异常的相似性,计算异常的关联性,以合并相似的故障链,同时判定、排除分值较低的疑似故障链;
判断根因,根据异常点在知识图谱的路径深度、特征相似的程度,通过对故障链的权重计算,确定根因疑似的位置;
实例级关联分析,在将疑似根因定位到服务、中间件、主机层级之后,针对多个实 例的异常,根据服务与实例的异常指标在时间窗口内的曲线特性、异常点特征的相似性,计 算其相关性分数,并通过与预设的阈值
Figure 611328DEST_PATH_IMAGE001
相比较确定最终的一个或者多个故障根因,根 据定位的对应实例或服务的异常,确定为应用系统的根因异常,之后,调用故障解决方案知 识库,输出根因解决方案。
在本发明中,应用场景一般包含应用服务、中间件、数据库、主机等层级结构,每个层级结构包含多个能够独立部署服务的实体,亦即运维对象;
在本发明中,运维对象的结构体包括实体E、属性A和关系R;
在本发明中,用于多指标异常检测的Bagel神经网络模型采用CAVE算法。
相对现有技术,本发明所提技术方案的优势主要有四个方面:
一、扩展性。本发明采用通用的黄金指标和应用拓扑作为根因分析的基础,因此本发明技术方案适用于具有应用服务、中间件、数据库、主机结构的通用场景,该抽象场景具有一定的普适性,基于该模型的根因分析具备较强的使用扩展能力;
二、推理能力。相对采用算法计算异常根因,基于知识图谱,利用运维实体、属性和关系形成推理能力,对于复杂业务场景下,异常的传播关系建立、异常根因的确定,具备普适性的推理能力;
三、相比于现有的多指标异常检测算法仅能确定多个指标是否发生异常,不能确定发生异常的位置,本发明提出的从业务分段定位至实例的故障定位方式,能够有效对业务指标异常的场景进行故障定位,定位到导致业务指标发生故障的根本原因实例;
四、实时性。相对于大规模使用异常检测算法的技术方案,本发明利用知识图谱推理、故障链剪枝的方法,提高根因分析性能和准确度,能够满足生产环境下故障根因分析的需求,具有较好的实时性。
附图说明
图1为本发明提出的基于应用知识图谱的实时根因分析方法的流程示意图;
图2为本发明中Bagel模型检测的流程示意图;
图3为本发明中基于知识图谱的异常链推理的流程示意图;
图4为本发明中故障链剪枝的流程示意图;
图5为本发明中对故障链权重计算的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
如图1所示,图1为本发明提出的这种基于应用知识图谱的实时根因分析方法的流程示意图,具体包括:
步骤S1:设计运维对象的KPI指标。在应用场景中,通常选择四类黄金指标作为异常检测对象,黄金四指标为业务量、成功率、延迟和TPS,其中,业务量代表流入系统的请求数量,成功率指代表请求流出系统成功或者失败的比例;延迟代表系统处理请求的性能,TPS代表系统当前能够处理的请求;
所述运维对象是应用场景包含的应用服务、中间件、数据库、主机等层级结构中,每个层级结构包含的多个能够独立部署服务的实体;构建所述运维对象的知识图谱,构建运维对象结构体,将应用的各个运维对象有机的联系在一起,以支持后续的根因推断。
步骤S2:多指标异常检测。该步骤包括:
针对四类黄金指标,利用历史数据,通过PCA模型,选择出在应用场景中造成影响的主指标;
实时将选择出的关键指标输入到使用历史数据训练好的Bagel神经网络中,对各层的运维对象同步异常检测,检测后返回各个运维对象实时异常情况、异常开始时间和异常打分。
其中,Bagel模型检测的流程如图2所示,过程包括:
主指标KPI,经过数据补齐、EWMA划分,形成待检测的KPI序列;
同步地,将时间信息编码输入检测模型;
最后经过CVAE算法,最终得到异常时间、异常对象、对KPI的异常打分等。
步骤S3:基于知识图谱的异常链推理。通过构建的应用知识图谱,从应用服务层级的异常入口,推理异常传播的路径,同时对每条传播路径根据路径深度、异常等级、持续时间给予评分。具体流程如图3:
一个运维对象异常表达为
Figure 954585DEST_PATH_IMAGE002
,其中E是Entity,指运维对象;
Figure 596919DEST_PATH_IMAGE003
是异常结构体,形如
Figure 342021DEST_PATH_IMAGE004
,其中
Figure 44398DEST_PATH_IMAGE005
为异常指标,
Figure 360104DEST_PATH_IMAGE006
为异常开始时间,
Figure 806129DEST_PATH_IMAGE007
为 异常持续时间;
Figure 405737DEST_PATH_IMAGE008
是传播结构体,形如
Figure 279015DEST_PATH_IMAGE009
在S3O1中,从应用场景的运维对象E1中检测出异常,表达该异常运维对象为
Figure 596864DEST_PATH_IMAGE010
,i=1;
在S302中,根据已经构建的知识图谱,遍历与运维对象
Figure 581001DEST_PATH_IMAGE011
具有调用、连接、包含等 关系的所有运维对象,查找其中具有相同异常KPI的
Figure 300695DEST_PATH_IMAGE012
在S303中,构建
Figure 344875DEST_PATH_IMAGE011
Figure 399287DEST_PATH_IMAGE012
的链接,形如
Figure 187114DEST_PATH_IMAGE013
,根据链接关系的不同,记录链接权 重为
Figure 230157DEST_PATH_IMAGE014
在S304中,再从
Figure 445238DEST_PATH_IMAGE012
节点开始,重复步骤S302,继续遍历,直到对应节点到达实例、 主机层级;
在S305中,形成多条基于知识图谱的故障链,形如
Figure 206520DEST_PATH_IMAGE016
的运维对象故 障链向量,和形如
Figure 545841DEST_PATH_IMAGE017
的链接权重向量。
步骤S4:故障链剪枝。经过步骤S3后,形成按照链接权重排列的多条故障链,在复杂系统中,通常存在多条故障链、多个异常点。故障链剪枝可根据不同层级运维对象异常的相似性,计算异常的关联性,以合并相似的故障链,同时判定、排除分值较低的疑似故障链,提高故障根因分析的效率和准确性。具体流程如图4:
在S401中,选取故障链
Figure 974549DEST_PATH_IMAGE018
,将
Figure 360530DEST_PATH_IMAGE019
Figure 140268DEST_PATH_IMAGE020
的持续时 间作为时间窗口
Figure 269898DEST_PATH_IMAGE021
在S402中,在异常持续的时间窗口
Figure 553111DEST_PATH_IMAGE021
内,进行局部异常特征提取,利用EWMA方法提 取局部平滑特征,提取公式如下:
Figure 109995DEST_PATH_IMAGE022
其中,
Figure 360716DEST_PATH_IMAGE023
是当前t时间下异常指标的实际测量值,
Figure 559617DEST_PATH_IMAGE024
为t时间下异常指 标的指数加权平均数,
Figure 697337DEST_PATH_IMAGE025
是平滑系数,越接近当前时刻越接近1;
在S403中,针对故障链上具有调用、连接、包含关系的运维对象,将S402提取的特征带入公式计算相关性,对于相关性小于预设阈值的,作为剪枝备选;所述相似性计算公式如下:
Figure 690701DEST_PATH_IMAGE026
其中,A,B是具备关系的两个运维对象,
Figure 179451DEST_PATH_IMAGE027
是相关系数,根据调用、连接、包含的不 同关系取不同的权重,
Figure 650883DEST_PATH_IMAGE028
Figure 908689DEST_PATH_IMAGE029
分别指对象A、B的EMWA特征序列;
在S404中,重复S303,计算各故障链上不同层级对象异常的相似性,当相似性小于阈值,对当前故障链剪枝;
在S405中,将剪枝后留下的故障链,作为备选故障根因推断的选项。
步骤S5:根据异常点在知识图谱的路径深度、特征相似的程度,通过对故障链的权重计算,确定根因疑似的位置。对故障链的权重计算如图5:
在S501中,按照故障链的深度计算故障链分数,运用公式如下:
Figure 72955DEST_PATH_IMAGE030
其中,故障链i的分数
Figure 783422DEST_PATH_IMAGE031
由两部分构成,一个是
Figure 809278DEST_PATH_IMAGE032
,用来代表故障的拓扑层次深度;一个是
Figure 187169DEST_PATH_IMAGE033
,表示故障链上所有运维对象异常的评分, 每个异常点评分是
Figure 256756DEST_PATH_IMAGE034
(异常开始时间),
Figure 720099DEST_PATH_IMAGE035
(异常类型),
Figure 533334DEST_PATH_IMAGE036
(异常发生概率)的 函数;
在S502中,根据各故障链的评分,取分数最高的top3,作为备选故障根因。
步骤S6:在通过步骤S5将故障根因定位到服务、中间件或主机层级之后,针对多个 实例的异常,根据服务与实例的异常指标在时间窗口内的曲线特性、异常点特征相似性,计 算相关性分数,并根据与阈值
Figure 765732DEST_PATH_IMAGE001
相比较确定最终的一个或者多个故障根因,若单个或多 个实例异常分数大于
Figure 740641DEST_PATH_IMAGE001
,则对应实例为故障根因;若所有实例异常分数大于
Figure 940548DEST_PATH_IMAGE001
,则为 服务故障;
以数据库和其实施例为例,确定实例异常分数的公式如下:
Figure 291894DEST_PATH_IMAGE037
其中,实例X的异常分数
Figure 378799DEST_PATH_IMAGE038
由两部分构成,
Figure 55768DEST_PATH_IMAGE039
是实例本身的异常检测分数,
Figure 493703DEST_PATH_IMAGE040
是实例X与服务的异常点特征序列 相似性,β为配置权重。
在完成以上步骤后,根据定位的对应实例或服务异常,确定为应用系统的根因异常,之后,调用故障解决方案知识库,输出对应根因的解决方案。
综上所述,本发明所提出的方案要解决的技术问题包含以下几个方面:
扩展性:当前的专利方案,聚焦在数据库、应用的细分场景,缺乏对场景的抽象,导致专利的适用场景较为狭窄,缺乏扩展性;
只检测、不定位:当前专利异常检测算法,只是检测KPI指标是否存在异常,对于引发故障的来源位置没有明确的描述,不能满足故障定位场景的需求;
根因分析的实时性:应用系统的KPI数量巨大,异常点多,且形态多变,如何对异常导致的故障链正确剪枝,从而具备复杂系统中实时定位的能力,是当前较大的挑战;
推理能力:现在的专利,聚焦在用算法检测异常,对于异常之间的传播、影响缺乏分析和推理能力,难以建立异常的传播链,从表象中寻找异常根因。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改,等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种基于应用知识图谱的实时根因分析方法,其特征在于包括:
构建运维对象的知识图谱,构建运维对象结构体,将应用的各个运维对象按相互关系有机的联系在一起,以支持后续的根因推断;
构建KPI指标,构建应用场景的四类黄金指标,包括业务量、成功率、延迟和TPS,其中业务量代表流入系统的请求数量,成功率代表请求流出系统成功或者失败的比例,延迟代表系统处理请求的性能,TPS为系统吞吐量,代表系统当前能够处理的请求数量;
多指标异常检测,通过多指标异常检测算法对运维对象的KPI指标实时检测,其中,所述算法包括:利用历史数据,通过PCA模型,选择出在应用场景中造成影响的关键指标;实时将选择出的关键指标输入到使用历史数据训练好的Bagel神经网络中,对各层的运维对象进行同步异常检测,检测后返回各个运维对象的实时异常情况、异常开始时间和异常打分;
基于知识图谱的异常链推理,通过构建的应用知识图谱,从应用服务层级的异常入口,推理异常传播的路径,同时对每条传播路径根据路径深度、异常等级、持续时间给予评分;
故障链剪枝,利用异常链推理后形成的按链接权重排列的多条故障链,根据不同层级运维对象异常的相似性,计算异常的关联性,以合并相似的故障链,同时判定、排除分值较低的疑似故障链;
判断根因,根据异常点在知识图谱的路径深度、特征相似的程度,通过对故障链的权重计算,确定根因疑似的位置;
实例级关联分析,在将疑似根因定位到服务、中间件、主机层级之后,针对多个实例的 异常,根据服务与实例的异常指标在时间窗口内的曲线特性、异常点特征的相似性,计算其 相关性分数,并通过与预设的阈值
Figure 271384DEST_PATH_IMAGE001
相比较确定最终的一个或者多个故障根因,根据定 位的对应实例或服务的异常,确定为应用系统的根因异常,之后,调用故障解决方案知识 库,输出根因解决方案。
2.根据权利要求1所述的基于应用知识图谱的实时根因分析方法,其特征在于,应用场景一般包含应用服务、中间件、数据库、主机等层级结构,每个层级结构包含多个能够独立部署服务的运维对象。
3.根据权利要求1所述的基于应用知识图谱的实时根因分析方法,其特征在于,运维对象的结构体包括实体E、属性A和关系R。
4.根据权利要求1所述的基于应用知识图谱的实时根因分析方法,其特征在于,用于异常检测的Bagel神经网络模型采用CAVE算法。
CN202110568306.7A 2021-05-25 2021-05-25 基于应用知识图谱的实时根因分析方法 Active CN113032238B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110568306.7A CN113032238B (zh) 2021-05-25 2021-05-25 基于应用知识图谱的实时根因分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110568306.7A CN113032238B (zh) 2021-05-25 2021-05-25 基于应用知识图谱的实时根因分析方法

Publications (2)

Publication Number Publication Date
CN113032238A true CN113032238A (zh) 2021-06-25
CN113032238B CN113032238B (zh) 2021-08-17

Family

ID=76455628

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110568306.7A Active CN113032238B (zh) 2021-05-25 2021-05-25 基于应用知识图谱的实时根因分析方法

Country Status (1)

Country Link
CN (1) CN113032238B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113672743A (zh) * 2021-08-20 2021-11-19 北京宝兰德软件股份有限公司 故障判别方法、装置、电子设备、存储介质及产品
CN114124738A (zh) * 2021-11-04 2022-03-01 昆明理工大学 基于服务交互图的云环境服务故障概率计算方法、系统及终端
CN114422325A (zh) * 2021-12-30 2022-04-29 优刻得科技股份有限公司 内容分发网络异常定位方法、装置、设备及存储介质
CN114528190A (zh) * 2022-04-21 2022-05-24 云账户技术(天津)有限公司 单指标异常的检测方法、装置、电子设备及可读存储介质
CN114978877A (zh) * 2022-05-13 2022-08-30 京东科技信息技术有限公司 一种异常处理方法、装置、电子设备及计算机可读介质
CN115277453A (zh) * 2022-06-13 2022-11-01 北京宝兰德软件股份有限公司 运维领域异常知识图谱的生成方法、应用方法和装置
CN116170514A (zh) * 2023-04-21 2023-05-26 华能信息技术有限公司 一种用于中台业务的服务策略调用实现方法及系统

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190236205A1 (en) * 2018-01-31 2019-08-01 Cisco Technology, Inc. Conversational knowledge graph powered virtual assistant for application performance management
CN110825769A (zh) * 2019-10-11 2020-02-21 苏宁金融科技(南京)有限公司 一种数据指标异常的查询方法和系统
CN111064614A (zh) * 2019-12-17 2020-04-24 腾讯科技(深圳)有限公司 一种故障根因定位方法、装置、设备及存储介质
CN111158977A (zh) * 2019-12-12 2020-05-15 深圳前海微众银行股份有限公司 一种异常事件根因定位方法及装置
CN111193605A (zh) * 2019-08-28 2020-05-22 腾讯科技(深圳)有限公司 一种故障定位方法、装置及存储介质
US10679133B1 (en) * 2019-06-07 2020-06-09 Peritus.AI, Inc. Constructing and utilizing a knowledge graph for information technology infrastructure
CN111368089A (zh) * 2018-12-25 2020-07-03 中国移动通信集团浙江有限公司 一种基于知识图谱的业务处理方法及装置
CN111444247A (zh) * 2020-06-17 2020-07-24 北京必示科技有限公司 一种基于kpi指标的根因定位方法、装置及存储介质
CN111858123A (zh) * 2020-07-29 2020-10-30 中国工商银行股份有限公司 基于有向图网络的故障根因分析方法和装置
CN112579707A (zh) * 2020-12-08 2021-03-30 西安邮电大学 一种日志数据的知识图谱构建方法
CN112732472A (zh) * 2021-01-07 2021-04-30 广州虎牙科技有限公司 异常根因定位方法、模型、电子设备及计算机存储介质
CN112787841A (zh) * 2019-11-11 2021-05-11 华为技术有限公司 故障根因定位方法及装置、计算机存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190236205A1 (en) * 2018-01-31 2019-08-01 Cisco Technology, Inc. Conversational knowledge graph powered virtual assistant for application performance management
CN111368089A (zh) * 2018-12-25 2020-07-03 中国移动通信集团浙江有限公司 一种基于知识图谱的业务处理方法及装置
US10679133B1 (en) * 2019-06-07 2020-06-09 Peritus.AI, Inc. Constructing and utilizing a knowledge graph for information technology infrastructure
CN111193605A (zh) * 2019-08-28 2020-05-22 腾讯科技(深圳)有限公司 一种故障定位方法、装置及存储介质
CN110825769A (zh) * 2019-10-11 2020-02-21 苏宁金融科技(南京)有限公司 一种数据指标异常的查询方法和系统
CN112787841A (zh) * 2019-11-11 2021-05-11 华为技术有限公司 故障根因定位方法及装置、计算机存储介质
CN111158977A (zh) * 2019-12-12 2020-05-15 深圳前海微众银行股份有限公司 一种异常事件根因定位方法及装置
CN111064614A (zh) * 2019-12-17 2020-04-24 腾讯科技(深圳)有限公司 一种故障根因定位方法、装置、设备及存储介质
CN111444247A (zh) * 2020-06-17 2020-07-24 北京必示科技有限公司 一种基于kpi指标的根因定位方法、装置及存储介质
CN111858123A (zh) * 2020-07-29 2020-10-30 中国工商银行股份有限公司 基于有向图网络的故障根因分析方法和装置
CN112579707A (zh) * 2020-12-08 2021-03-30 西安邮电大学 一种日志数据的知识图谱构建方法
CN112732472A (zh) * 2021-01-07 2021-04-30 广州虎牙科技有限公司 异常根因定位方法、模型、电子设备及计算机存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ZHENGONG CAI 等: "A Real-Time Trace-Level Root-Cause Diagnosis System in Alibaba Datacenters", 《IEEE ACCESS》 *
刘瑞宏 等: "基于知识图谱的智能故障诊断研究", 《邮电设计技术》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113672743A (zh) * 2021-08-20 2021-11-19 北京宝兰德软件股份有限公司 故障判别方法、装置、电子设备、存储介质及产品
CN113672743B (zh) * 2021-08-20 2024-04-02 北京宝兰德软件股份有限公司 故障判别方法、装置、电子设备、存储介质及产品
CN114124738A (zh) * 2021-11-04 2022-03-01 昆明理工大学 基于服务交互图的云环境服务故障概率计算方法、系统及终端
CN114124738B (zh) * 2021-11-04 2024-03-19 昆明理工大学 基于服务交互图的云环境服务故障概率计算方法、系统及终端
CN114422325A (zh) * 2021-12-30 2022-04-29 优刻得科技股份有限公司 内容分发网络异常定位方法、装置、设备及存储介质
CN114528190A (zh) * 2022-04-21 2022-05-24 云账户技术(天津)有限公司 单指标异常的检测方法、装置、电子设备及可读存储介质
CN114528190B (zh) * 2022-04-21 2022-07-01 云账户技术(天津)有限公司 单指标异常的检测方法、装置、电子设备及可读存储介质
CN114978877A (zh) * 2022-05-13 2022-08-30 京东科技信息技术有限公司 一种异常处理方法、装置、电子设备及计算机可读介质
CN114978877B (zh) * 2022-05-13 2024-04-05 京东科技信息技术有限公司 一种异常处理方法、装置、电子设备及计算机可读介质
CN115277453A (zh) * 2022-06-13 2022-11-01 北京宝兰德软件股份有限公司 运维领域异常知识图谱的生成方法、应用方法和装置
CN116170514A (zh) * 2023-04-21 2023-05-26 华能信息技术有限公司 一种用于中台业务的服务策略调用实现方法及系统

Also Published As

Publication number Publication date
CN113032238B (zh) 2021-08-17

Similar Documents

Publication Publication Date Title
CN113032238B (zh) 基于应用知识图谱的实时根因分析方法
CN110888755B (zh) 一种微服务系统异常根因节点的查找方法及装置
US10621027B2 (en) IT system fault analysis technique based on configuration management database
US7769561B2 (en) Robust sensor correlation analysis for machine condition monitoring
CN112217674B (zh) 基于因果网络挖掘和图注意力网络的告警根因识别方法
CN110768971B (zh) 适用于人工智能系统的对抗样本快速预警方法及系统
US7716152B2 (en) Use of sequential nearest neighbor clustering for instance selection in machine condition monitoring
CN112100403A (zh) 一种基于神经网络的知识图谱不一致性推理方法
CN108549817A (zh) 一种基于文本深度学习的软件安全漏洞预测方法
CN115278741A (zh) 一种基于多模态数据依赖关系的故障诊断方法和装置
CN115237717A (zh) 一种微服务异常检测方法和系统
CN113225346A (zh) 一种基于机器学习的网络运维态势评估方法
CN114385397A (zh) 基于故障传播图的微服务故障根因定位方法
CN112769605A (zh) 一种异构多云的运维管理方法及混合云平台
CN117078048A (zh) 基于数字孪生的智慧城市资源管理方法及系统
CN115514627A (zh) 一种故障根因定位方法、装置、电子设备及可读存储介质
CN115051929A (zh) 基于自监督目标感知神经网络的网络故障预测方法及装置
CN113765698B (zh) 一种面向工业互联网的网络故障定位和根因检测方法及系统
CN117221087A (zh) 告警根因定位方法、装置及介质
CN117034149A (zh) 故障处理策略确定方法、装置、电子设备和存储介质
WO2023093431A1 (zh) 一种模型训练方法、装置、设备、存储介质和程序产品
CN109728958A (zh) 一种网络节点信任预测方法、装置、设备及介质
CN112597699B (zh) 一种融入客观赋权法的社交网络谣言源识别方法
Munikoti et al. Bayesian graph neural network for fast identification of critical nodes in uncertain complex networks
CN117473571B (zh) 一种数据信息安全处理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant