CN113157473A - 一种对多维日志的故障根因定位方法和装置 - Google Patents

一种对多维日志的故障根因定位方法和装置 Download PDF

Info

Publication number
CN113157473A
CN113157473A CN202110322835.9A CN202110322835A CN113157473A CN 113157473 A CN113157473 A CN 113157473A CN 202110322835 A CN202110322835 A CN 202110322835A CN 113157473 A CN113157473 A CN 113157473A
Authority
CN
China
Prior art keywords
leaf
dimension
combinations
combination
dimension combination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110322835.9A
Other languages
English (en)
Inventor
裴丹
李则言
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202110322835.9A priority Critical patent/CN113157473A/zh
Publication of CN113157473A publication Critical patent/CN113157473A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Abstract

本申请提出了一种对多维日志的故障根因定位方法,涉及软件系统故障定位技术领域,其中,该方法包括:对多维日志中所有的叶子维度组合进行时间序列回归分析,得到每个所述叶子维度组合的实际值和预测值;通过偏移分数对所述多维日志中所有的叶子维度组合进行聚类,得到所有受同一个根因影响的类,其中,通过所述的实际值和预测值获取所述的偏移分数;分别对每一个所述的类进行启发式的根因搜索,得到根因维度组合。采用上述方案的本申请考虑了多个根因维度组合同时存在的情况,同时对根因维度组合不做任何限定,不需要特别精细调节的参数,运行效率稳定且适用于任何关键性能KPI。

Description

一种对多维日志的故障根因定位方法和装置
技术领域
本申请涉及软件系统故障定位技术领域,尤其涉及一种对多维日志的故障根因定位方 法和装置。
背景技术
为了保证软件系统的服务质量,运维人员会在应用日志中部署多种关键性能指标(key performance indicator,KPI)(例如响应时间,成功率)的监控,用来在故障发生时帮助及时地定位故障和消除影响。这些KPI在采集时还会包含其他许多属性(attribute)(例如省份和运营商)。这样的包含多个属性和KPI监控的日志是我们研究的多维日志。图1展示了一个多维日志的示例。其中时间表示每条记录对应的时间点,响应时间是这个多维日志对应的KPI,其他列都是属性。
当故障发生时,例如系统的总体响应时间突增。运维人员定位故障的第一步是确定故 障的发生范围,即哪些属性组合对应的响应时间才有异常。我们将这样的维度组合称为根 因维度组合,我们聚焦的问题就是在故障发生时在多维日志中定位根因维度组合。定位根 因维度组合一方面可以缩减运维人员排查的范围,另一方面可以运维人员排查根因提供有 用的线索。例如,图1对应的根因维度组合如果是(省份=北京AND运营商=移动),那么故 障很可能是由于运营商北京移动的网络出现问题导致的。
我们形式化地定义多维维度组合问题:我们记A是所有属性的集合A={a1,a2,...,an} 其中ai(1<=i<=n)是第i个属性。对于ai,它的所有可能的取值的集合为Vi={vi 1,vi 2,...,vi n} 其中vi k是ai的第k个可能的取值,mi是ai的所有可能取值的个数。一个属性和一个它的可 能取值组成一个元组(tuple),t=(ai,vi k)。
对于维度ai,它的所有可能的元组的集合为Ti={ai}×Vi,其中×表示笛卡尔积。维度 组合中不能包含两个重复的属性,所以所有维度组合的集合为
Figure BDA0002992329010000011
其中2的幂表示集合的幂集。
因为根因可能是多维维度组合的集合,所以所有可能的根因维度组合的集合为2S根因 维度组合的定位就是在2S中搜索,得到最能够分离异常和正常部分(即根因对应的KPI是 异常的,其他的KPI是正常的),且最具有解释性(能对运维人员产生其他,例如将所有异 常的日志行对应的维度组合枚举出来,就毫无解释性)的元素(根因维度组合)。根因维度 组合的定位问题的挑战在于整个搜索空间2S极其巨大。
现有技术没有考虑多个根因同时存在的情况,运行效率没有保证,无法做到及时的定 位,只适用于特定类型的KPI,且需要精细地调节参数。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的第一个目的在于提出一种对多维日志的故障根因定位方法,本方案通 过聚类的方式,一方面考虑了多个根因同时存在的情况;另一方面在后续的定位过程中对 每一类单独考虑,就只需要考虑单根因的情况,因此又能保持高效率。相比HotSpot,我 们搜索空间更小。相比Adtributor,iDice,MID等,我们的方案能够有效考虑多个根因维度组合同时存在的情况;
本方案没有对根因维度组合做任何限制,可以定位包含多个属性的根因。相比Adtributor只定位包含一个维度的维度组合的限制,我们可以定位任意的维度组合;
本方案的运行效率稳定,运行时间不依赖数据的具体情况。通过聚类和启发式的搜索, 我们大大减小了搜索空间,保证了运行效率。通过我们的聚类算法,在后续搜索的时候可 以只考虑仅有单个根因的情况。基于此前提,我们提出了一个启发式的算法,将搜索空间 从O(2^N)(如HotSpot采用的搜索空间)(N为方体中的维度组合的数量)(O是渐进符号) 变为了O(N),从而大大减少了时间开销,提高了运行效率;
本方案的方法适用于各种类型的KPI,包括可加和和不可加和的KPI。我们通过研究证 明涟漪效应和基于偏离分数的聚类方法适合可加和和不可加和的KPI。相比HotSpot,iDice, MID等,我们的方法能够应用于更多类型的KPI(例如平均响应时间,平均订单金额等)上;
本方案没有需要特别精细调节的参数。算法结果对参数的取值不敏感。本方案主要需 要调节的参数是在利用ARMA算法进行异常检测的步骤,但是这一步骤和所有其他现有技术 并不特别的不同。后续的定位步骤中,我们的方案没有需要调节的超参数或者阈值,可以 直接应用于各种系统中。而像Apriori,就存在两个需要精细调节的参数。
本申请的第二个目的在于提出一种计算机设备。
本申请的第三个目的在于提出一种非临时性计算机可读存储介质。
为达上述目的,本申请第一方面实施例提出了一种对多维日志的故障根因方法,包括:
对多维日志中所有的叶子维度组合进行时间序列回归分析,得到每个所述叶子维度组 合的实际值和预测值;
通过偏移分数对所述多维日志中所有的叶子维度组合进行聚类,得到所有受同一个根 因影响的类,其中,通过所述的实际值和预测值获取所述的偏移分数;
分别对每一个所述的类进行启发式的根因搜索,得到根因维度组合。
进一步地,在本申请的一个实施例中,通过ARMA模型对所述多维日志中所有的叶子维 度组合进行时间序列回归分析,得到每一个所述叶子维度组合的预测值和实际值;
其中,对于每一个叶子节点,周期性地维护一个时间序列的ARMA模型,所述的ARMA模型的公式为:
Figure BDA0002992329010000031
其中,p为自回归项的个数,q为滑动平均项的个数,xt-i表示该叶子维度组合的历史 KPI,∈t-i表示历史KPI的差分,C、φ、θ为所述ARMA模型的参数。
进一步地,在本申请的一个实施例中,所述通过偏移分数对所述多维日志中所有的叶 子维度组合进行聚类的方法,具体包括以下步骤:
计算每个所述叶子维度组合的偏移分数,统计每个所述的偏移分数,并将统计得到的 所述偏移分数制作成直方图;
计算所述直方图分布的极大值和极小值;其中,将所述的极大值作为所述类的中心, 将所述的极小值作为每个所述类的中心两边的边界;
通过所述类的中心和所述类的边得到每一个所述类的范围。
进一步地,在本申请的一个实施例中,基于涟漪效应的原理获取所述的偏移分数,其 中,所述涟漪效应为同一个根因对它的各个子维度组合的影响比例是相同的,且表示为:
Figure BDA0002992329010000032
其中S是根因维度组合,f(e)为叶子维度组合的预测值,v(e)为叶子维度组合的实际 值,对于一个非叶子维度组合,它的f和v是它对应的所有子叶子维度组合的f和v的和;
所述基于涟漪效应获取所述偏移分数的公式为:
Figure BDA0002992329010000033
其中f(e)为叶子维度组合的预测值,v(e)为叶子维度组合的实际值,d(e)为偏移分数。
进一步地,在本申请的一个实施例中,根据所述的实际值和预测值通过自上而下的方 式分别对每一个所述的类进行启发式的根因搜索,包括以下步骤:
按数据方体包含的属性的数量,将所述的数据方体cuboid划分层次,从而得到所述数 据方体之间的层次关系,其中,所述数据方体为相同属性的所有维度组合的集合;
将所述数据方体中所有的维度组合,按对应的叶子维度组合属于当前所述类的比例从 大到小进行排序,通过下述公式得到排序结果:
Figure BDA0002992329010000041
其中,descent()是一个函数,用来给cuboid中每个维度组合计算一个分数,e0是所述函数的自变量,表示当前在分析的维度组合,Ti为叶子维度组合所有可能的元组的集合,G为当前所述类。
分别测试所述排序结果的前k项组成集合的最大化GPS分数,其中k=1,2,...,得到 使得所述最大化GPS分数最大的k,所述前k项组成集合为当前cuboid的最可能的根因;
通过下式计算每个所述cuboid得到的结果的分数,选择分数最大的作为最终的根因:
GPS*C-ele*layer
C是参数,一般可以取0.01-0.1,ele指的是根因里维度组合的个数,即所述k,layer 指的是这个cuboid中涉及的属性的个数。
进一步地,在本申请的一个实施例中,所述最大化GPS分数的公式为:
Figure BDA0002992329010000042
其中avg指的是算术平均,S1指的是当前在评估的维度组合集合,S2指的是当前在评 估的维度组合集合的补集,v(.)和f(.)分别是集合中每一个叶子维度组合的实际值和预测 值组成的向量,
Figure BDA0002992329010000043
a 指的是根据涟漪效应推算出来的异常,
Figure BDA0002992329010000044
为达上述目的,本申请第二方面实施例提出了一种计算机设备,包括存储器、处理器 及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算 机程序时,实现如上所述的基于深度哈希能量模型的多标签图像检索方法。
为了实现上述目的,本申请第三方面实施例提出了一种非临时性计算机可读存储介质, 其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的基于深度哈希能 量模型的多标签图像检索方法。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明 显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显 和容易理解,其中:
图1为本申请实施例的一个多维日志示例图;
图2为本申请实施例一所提供的一种多维日志的故障根因定位方法的流程示意图;
图3为本申请实施例的聚类效果示意图;
图4为本申请实施例的考虑三个属性(ABC)时的数据方体的层次关系。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同 或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描 述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的多维日志的故障根因定位方法和装置。
图2为本申请实施例一所提供的一种多维日志的故障根因定位方法的流程示意图。
如图2所示,该多维日志的故障根因定位方法包括以下步骤:
步骤101,对多维日志中所有的叶子维度组合进行时间序列回归分析,得到每个所述 叶子维度组合的实际值和预测值;
步骤102,通过偏移分数对所述多维日志中所有的叶子维度组合进行聚类,得到所有 受同一个根因影响的类,其中,通过所述的实际值和预测值获取所述的偏移分数;
步骤103,分别对每一个所述的类进行启发式的根因搜索,得到根因维度组合。
本申请实施例的对多维日志的故障根因定位方法,通过对多维日志中所有的叶子维度 组合进行时间序列回归分析,得到每个所述叶子维度组合的实际值和预测值;通过偏移分 数对所述多维日志中所有的叶子维度组合进行聚类,得到所有受同一个根因影响的类,其中, 通过所述的实际值和预测值获取所述的偏移分数;分别对每一个所述的类进行启发式的根 因搜索,得到根因维度组合。由此,能够有效考虑了多个根因维度组合存在同时存在的情 况,同时不对根因维度组合做任何限定,不需要特别精细调节的参数,运行效率稳定且适 用于任何KPI。
进一步地,在本申请的一个实施例中,通过ARMA模型对所述多维日志中所有的叶子维 度组合进行时间序列回归分析,得到每一个所述叶子维度组合的预测值和实际值,这一部 分和已有方法全部都大同小异,没有特别的不同之处。这一部分方法并不局限于ARMA,采 用其他任何回归方法都不影响整体方法的可用性;
其中,对于每一个叶子节点,周期性地维护一个时间序列的ARMA模型,所述的ARMA模型的公式为:
Figure BDA0002992329010000051
其中,p为自回归项的个数,q为滑动平均项的个数,xt-i表示该叶子维度组合的历史 KPI,∈t-i表示历史KPI的差分,C、φ、θ为所述ARMA模型的参数。
进一步地,在本申请的实施例中,所述通过偏移分数对所述多维日志中所有的叶子维 度组合进行聚类的方法,具体包括以下步骤:
首先计算每个叶子维度组合的偏移分数;然后统计所有的偏移分数的直方(histogram), 采用Freedman Diaconis Estimator和sturges的最好结果计算直方图的边界划分方法; 然后计算直方图分布的极大值(relmax)和极小值(relmin);将极大值作为类的中心, 每个类中心两边最近的极小值作为该类的边界,这样就得到了每一个类的范围,聚类效果 如图3所示。
对所有的叶子维度组合进行聚类,从而将被不同根因影响的维度组合分到不同的类中, 这一步和所有的现有技术都不同,现有技术都没有通过聚类分离受不同根因影响的维度组 合的步骤。这使得后续的对每一类内的根因定位都只需要考虑单个根因的情况,从而大大 简化问题。
进一步地,在本申请的一个实施例中,所述偏移分数的公式基于涟漪效应的原理完成, 其中,所述涟漪效应指的是同一个根因对它的各个子维度组合(如果维度组合
Figure BDA0002992329010000063
则 e2是e1的子维度组合,例如(省份=北京,运营商=中国移动)是(省份=北京)的子维度 组合)的影响比例是相同的。其中S是根因维度组合。对于一个非叶子维度组合,它的f 和v是它对应的所有子叶子维度组合的f和v的和,表示为:
Figure BDA0002992329010000061
其中S是根因维度组合,f(e)为叶子维度组合的预测值,v(e)为叶子维度组合的实际 值,对于一个非叶子维度组合,它的f和v是它对应的所有子叶子维度组合的f和v的和;
基于涟漪效应,我们发现可以通过所述偏移分数d(e)对叶子维度组合进行聚类。基于 涟漪效应,所有受同一个根因影响的叶子维度组合都应该有相同或者相近的d(e),表示为:
Figure BDA0002992329010000062
其中f(e)为叶子维度组合的预测值,v(e)为叶子维度组合的实际值,d(e)为偏移分数。
进一步地,在本申请的一个实施例中,根据所述的实际值和预测值通过自上而下的方 式分别对每一个所述的类进行启发式的根因搜索,包括以下步骤:
按数据方体包含的属性的数量,将所述的数据方体cuboid划分层次,从而得到所述数 据方体之间的层次关系,如图4所示。其中,所述数据方体为相同属性的所有维度组合的 集合,这个从上往下逐方体搜索的方式的好处是越上层的方体中的维度组合,越具有解释 力,即越可能是根因;
将所述数据方体中所有的维度组合,按对应的叶子维度组合属于当前所述类的比例从 大到小进行排序,比例越大顺序越靠前,通过下述公式得到排序结果:
Figure BDA0002992329010000071
其中,descent()是一个函数,用来给cuboid中每个维度组合计算一个分数,e0是所述函数的自变量,表示当前在分析的维度组合,Ti为叶子维度组合所有可能的元组的集合,G为当前所述类。
分别测试所述排序结果的前k项组成集合的最大化GPS分数,其中k=1,2,...,得到 使得所述最大化GPS分数最大的k,所述前k项组成集合为当前cuboid的最可能的根因;
通过下式计算每个所述cuboid得到的结果的分数,选择分数最大的作为最终的根因:
GPS*C-ele*layer
C是参数,一般可以取0.01-0.1,ele指的是根因里维度组合的个数,即所述k,layer 指的是这个cuboid中涉及的属性的个数。
进一步地,在本申请的实施例中,所述最大化GPS分数是搜索的目标,GPS用来评估一个维度组合的集合有多大的可能是根因,它的定义如下:
Figure BDA0002992329010000072
其中avg指的是算术平均,S1指的是当前在评估的维度组合集合,S2指的是当前在评 估的维度组合集合的补集,v(.)和f(.)分别是集合中每一个叶子维度组合的实际值和预测 值组成的向量,
Figure BDA0002992329010000073
a 指的是根据涟漪效应推算出来的异常,
Figure BDA0002992329010000074
为了实现上述实施例,本发明还提出了一种计算机设备,包括存储器、处理器及存储 在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时,实现上述施例 所述的方法。
为了实现上述实施例,本发明还提出了一种非临时性计算机可读存储介质,其上存储 有计算机程序,计算机程序被处理器执行时实现上述实施例的方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者 特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述 不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以 在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领 域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进 行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示 或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两 个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个 或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分, 并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序, 包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的 实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实 现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令 执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行 系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设 备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布 线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读 存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式 光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸 或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解 译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机 存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实 施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或 固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技 术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离 散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可 编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可 以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中, 该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各 个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既 可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以 软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读 取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了 本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制, 本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (8)

1.一种对多维日志的故障根因定位方法,其特征在于,包括以下步骤:
对多维日志中所有的叶子维度组合进行时间序列回归分析,得到每个所述叶子维度组合的实际值和预测值;
通过偏移分数对所述多维日志中所有的叶子维度组合进行聚类,得到所有受同一个根因影响的类,其中,通过所述的实际值和预测值获取所述的偏移分数;
分别对每一个所述的类进行启发式的根因搜索,得到根因维度组合。
2.如权利要求1所述的方法,其特征在于,通过ARMA模型对所述多维日志中所有的叶子维度组合进行时间序列回归分析,得到每一个所述叶子维度组合的预测值和实际值;
其中,对于每一个叶子节点,周期性地维护一个时间序列的ARMA模型,所述的ARMA模型的公式为:
Figure FDA0002992329000000011
其中,p为自回归项的个数,q为滑动平均项的个数,xt-i表示该叶子维度组合的历史KPI,∈t-i表示历史KPI的差分,C、φ、θ为所述ARMA模型的参数。
3.如权利要求1所述的方法,其特征在于,所述通过偏移分数对所述多维日志中所有的叶子维度组合进行聚类的方法,具体包括以下步骤:
计算每个所述叶子维度组合的偏移分数,统计每个所述的偏移分数,并将统计得到的所述偏移分数制作成直方图;
计算所述直方图分布的极大值和极小值;其中,将所述的极大值作为所述类的中心,将所述的极小值作为每个所述类的中心两边的边界;
通过所述类的中心和所述类的边得到每一个所述类的范围。
4.如权利要求3所述的方法,其特征在于,基于涟漪效应的原理获取所述的偏移分数;其中,所述涟漪效应为同一个根因对它的各个子维度组合的影响比例是相同的,且表示为:
Figure FDA0002992329000000012
其中S是根因维度组合,f(e)为叶子维度组合的预测值,v(e)为叶子维度组合的实际值,对于一个非叶子维度组合,它的f和v是它对应的所有子叶子维度组合的f和v的和;
所述基于涟漪效应获取所述偏移分数的公式为:
Figure FDA0002992329000000021
其中f(e)为叶子维度组合的预测值,v(e)为叶子维度组合的实际值,d(e)为偏移分数。
5.如权利要求1所述的方法,其特征在于,根据所述的实际值和预测值通过自上而下的方式分别对每一个所述的类进行启发式的根因搜索,包括以下步骤:
按数据方体包含的属性的数量,将所述的数据方体cuboid划分层次,从而得到所述数据方体之间的层次关系,其中,所述数据方体为相同属性的所有维度组合的集合;
将所述数据方体中所有的维度组合,按对应的叶子维度组合属于当前所述类的比例从大到小进行排序,通过下述公式得到排序结果:
Figure FDA0002992329000000022
其中,descent()是一个函数,用来给cuboid中每个维度组合计算一个分数,e0是所述函数的自变量,表示当前在分析的维度组合,Ti为叶子维度组合所有可能的元组的集合,G为当前所述类。
分别测试所述排序结果的前k项组成集合的最大化GPS分数,其中k=1,2,...,得到使得所述最大化GPS分数最大的k,所述前k项组成集合为当前cuboid的最可能的根因;
通过下式计算每个所述cuboid得到的结果的分数,选择分数最大的作为最终的根因:
GPS*C-ele*layer
C是参数,一般可以取0.01-0.1,ele指的是根因里维度组合的个数,即所述k,layer指的是这个cuboid中涉及的属性的个数。
6.如权利要求5所述的方法,其特征在于,所述最大化GPS分数的公式为:
Figure FDA0002992329000000023
其中avg指的是算术平均,S1指的是当前在评估的维度组合集合,S2指的是当前在评估的维度组合集合的补集,v(.)和f(.)分别是集合中每一个叶子维度组合的实际值和预测值组成的向量,
Figure FDA0002992329000000024
a指的是根据涟漪效应推算出来的异常,
Figure FDA0002992329000000025
7.一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-6中任一所述的方法。
8.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6中任一所述的方法。
CN202110322835.9A 2021-03-25 2021-03-25 一种对多维日志的故障根因定位方法和装置 Pending CN113157473A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110322835.9A CN113157473A (zh) 2021-03-25 2021-03-25 一种对多维日志的故障根因定位方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110322835.9A CN113157473A (zh) 2021-03-25 2021-03-25 一种对多维日志的故障根因定位方法和装置

Publications (1)

Publication Number Publication Date
CN113157473A true CN113157473A (zh) 2021-07-23

Family

ID=76884990

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110322835.9A Pending CN113157473A (zh) 2021-03-25 2021-03-25 一种对多维日志的故障根因定位方法和装置

Country Status (1)

Country Link
CN (1) CN113157473A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115277245A (zh) * 2022-08-10 2022-11-01 清华大学 基于属性的多维异常根因定位方法、系统及存储介质
CN115756919A (zh) * 2022-11-10 2023-03-07 上海鼎茂信息技术有限公司 一种面向多维数据的根因定位方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111064614A (zh) * 2019-12-17 2020-04-24 腾讯科技(深圳)有限公司 一种故障根因定位方法、装置、设备及存储介质
CN111444247A (zh) * 2020-06-17 2020-07-24 北京必示科技有限公司 一种基于kpi指标的根因定位方法、装置及存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111064614A (zh) * 2019-12-17 2020-04-24 腾讯科技(深圳)有限公司 一种故障根因定位方法、装置、设备及存储介质
CN111444247A (zh) * 2020-06-17 2020-07-24 北京必示科技有限公司 一种基于kpi指标的根因定位方法、装置及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ZEYAN LI等: "Generic and Robust Localization of Multi-Dimensional Root Causes", 《2019 IEEE 30TH INTERNATIONAL SYMPOSIUM ON SOFTWARE RELIABILITY ENGINEERING (ISSRE)》 *
陈兴蜀等: "基于多维时间序列分析的网络异常检测", 《工程科学与技术》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115277245A (zh) * 2022-08-10 2022-11-01 清华大学 基于属性的多维异常根因定位方法、系统及存储介质
CN115756919A (zh) * 2022-11-10 2023-03-07 上海鼎茂信息技术有限公司 一种面向多维数据的根因定位方法及系统
CN115756919B (zh) * 2022-11-10 2023-10-31 上海鼎茂信息技术有限公司 一种面向多维数据的根因定位方法及系统

Similar Documents

Publication Publication Date Title
Isaksson et al. SOStream: Self organizing density-based clustering over data stream
US11755938B2 (en) Graphical user interface indicating anomalous events
US10902062B1 (en) Artificial intelligence system providing dimension-level anomaly score attributions for streaming data
CN111885012B (zh) 基于多种网络设备信息采集的网络态势感知方法及系统
JP6503679B2 (ja) フィルタルール作成装置、フィルタルール作成方法、およびプログラム
CN108683530B (zh) 多维度数据的数据分析方法、装置及存储介质
US20150026167A1 (en) Discovering fields to filter data returned in response to a search
CN113157473A (zh) 一种对多维日志的故障根因定位方法和装置
WO2012138319A1 (en) Creating a correlation rule defining a relationship between event types
Marini et al. Big Data As A Service For Monitoring Cyber-Physical Production Systems.
EP4053757A1 (en) Degradation suppression program, degradation suppression method, and information processing device
Wang et al. A log-based anomaly detection method with efficient neighbor searching and automatic K neighbor selection
CN112951311A (zh) 一种基于变权重随机森林的硬盘故障预测方法及系统
CN114611616A (zh) 一种基于集成孤立森林的无人机智能故障检测方法及系统
Zhen et al. A global evaluation criterion for feature selection in text categorization using Kullback-Leibler divergence
Zhu et al. A cluster-based sequential feature selection algorithm
CN114860525A (zh) 一种硬盘故障检测方法、装置、设备及存储介质
CN107920067B (zh) 一种主动对象存储系统上的入侵检测方法
JP2011159125A (ja) イベントクラスタリングシステム、そのコンピュータプログラムおよびデータ処理方法
CN117207778A (zh) 一种车辆部件无损检测方法及系统
JP4121061B2 (ja) 類識別装置及び類識別方法
Dentamaro et al. Ensemble Consensus: An Unsupervised Algorithm for Anomaly Detection in Network Security data.
CN108268876A (zh) 一种基于聚类的近似重复记录的检测方法及装置
Bergmeir et al. Classifying component failures of a hybrid electric vehicle fleet based on load spectrum data: Balanced random forest approaches employing uni-and multivariate decision trees
WO2023136871A1 (en) Multi-dimensional root cause analysis based on cross-metrics

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210723