CN109992479A - 一种多维度kpi数据异常定位方法、装置及计算机设备 - Google Patents

一种多维度kpi数据异常定位方法、装置及计算机设备 Download PDF

Info

Publication number
CN109992479A
CN109992479A CN201910254307.7A CN201910254307A CN109992479A CN 109992479 A CN109992479 A CN 109992479A CN 201910254307 A CN201910254307 A CN 201910254307A CN 109992479 A CN109992479 A CN 109992479A
Authority
CN
China
Prior art keywords
value
kpi data
vector
numerical value
potential score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910254307.7A
Other languages
English (en)
Inventor
董春曦
冯鲁汉
董阳阳
郭凯德
张君君
赵悦琪
张思齐
徐加驹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201910254307.7A priority Critical patent/CN109992479A/zh
Publication of CN109992479A publication Critical patent/CN109992479A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Abstract

本发明涉及计算机技术领域,尤其涉及一种多维度KPI数据异常定位方法、装置及计算机设备。该方法包括:获取具有周期性的多维度KPI数据;将所述多维度KPI数据划分为预测值KPI数据和异常定位KPI数据;计算预测值KPI数据的元素向量的期望值,作为KPI数据的预测值;根据KPI数据的元素向量的维度数异常定位KPI数据进行分层;根据最细粒度元素向量的实际数值和KPI数据的预测值,采用蒙特卡洛树方法对分层后的异常定位KPI数据进行逐层搜索,获得最大潜在分数的子集;根据所述最大潜在分数的子集确定异常发生的根因集合,该方法大大减小了搜索空间,从而提高了异常定位效率,同时异常定位的准确率也明显提高。

Description

一种多维度KPI数据异常定位方法、装置及计算机设备
技术领域
本发明涉及计算机技术领域,尤其涉及一种多维度KPI数据异常定位方法、装置及计算机设备。
背景技术
随着大数据,云计算等互联网技术的飞速发展,各个公司的IT系统、业务系统也变得越来越复杂,保障业务健康运行的传统基于人工经验的手动运维也逐渐转向基于机器学习的智能运维AIOps。
在互联网服务运维中,当某个总指标(如总流量)发生异常时,需要快速准确地定位到是哪个交叉维度的细粒度指标的异常导致的,以便尽快做进一步的修复止损操作。由于运维中的这种多维度指标是相互依存的,根本原因维度上的变化可能会导致其他多个维度上的数据同时发生变化,因此难以确定真正的根因维度,其次因为监控维度多、每个维度取值范围大,导致异常定位根因时的搜索空间非常大,当前的运维系统更多的还是依靠经验进行人工的故障定位,另外还包括有三种智能根因分析方法:Focus System、AdtributorSystem和iDice System。
但是人工故障定位方法效率较低,且上述三种智能根因分析方法只能处理搜索空间小得多的简单案例,而针对大规模的多维度KPI数据异常定位至今没有一个好的办法。
发明内容
基于此,本发明针对上述的问题,提供了一种多维度KPI数据异常定位方法,旨在解决针对大规模的多维度KPI数据异常定位问题。
本发明实施例提供的一种多维度KPI数据异常定位方法,包括:
获取具有周期性的多维度KPI数据,所述多维度KPI数据至少包括KPI数据的元素向量和最细粒度元素向量的实际数值;
以周期为单位按照预设的数据划分规则将所述多维度KPI数据划分为预测值KPI数据和异常定位KPI数据;
计算所述预测值KPI数据的元素向量的期望值,并将所述期望值作为KPI数据的预测值;
根据所述异常定位KPI数据的元素向量的维度数对所述异常定位KPI数据进行分层;
根据所述最细粒度元素向量的实际数值和KPI数据的预测值,采用蒙特卡洛树方法对分层后的异常定位KPI数据进行逐层搜索,获得最大潜在分数的子集;
根据所述最大潜在分数的子集确定异常发生的根因集合。
本发明实施例的另一目的在于提供一种多维度KPI数据异常定位装置,包括:
多维度KPI数据获取模块,用于获取具有周期性的多维度KPI数据;
多维度KPI数据分类模块,用于以周期为单位按照预设的数据划分规则将所述多维度KPI数据划分为预测值KPI数据和异常定位KPI数据;
KPI数据预测值计算模块,用于计算所述预测值KPI数据的元素向量的期望值,并将所述期望值作为KPI数据的预测值;
异常定位KPI数据分层模块,用于根据所述异常定位KPI数据的维度数将所述异常定位KPI数据进行分层;
蒙特卡洛树搜索模块,用于根据所述最细粒度元素向量的实际数值和KPI数据的预测值,对分层后的异常定位KPI数据采用蒙特卡洛树方法进行逐层搜索,获得最大潜在分数的子集;
根因集合确定模块,用于根据所述最大潜在分数的子集确定异常发生的根因集合。
本发明实施例的另一目的在于提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述方法的步骤。
有益效果:
本发明通过获取多维度KPI数据,并划分成预测值KPI数据和异常定位KPI数据,并对异常定位KPI数据进行分层处理,针对每一层的集合,提出了一个揭示异常传播连锁效应的潜在分数作为衡量指标,并通过最细粒度元素向量的实际数值和KPI数据的预测值进行潜在分数的计算,应用蒙特卡洛树方法进行逐层搜索,获得具有最大潜在分数的子集,从而确定导致异常发生的根因,该方法大大减小了搜索空间,从而提高了异常定位效率,同时异常定位的准确率也明显提高。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1为实施例一提供的一种多维度KPI数据异常定位方法流程图;
图2为实施例二提供的一种多维度KPI数据异常定位方法流程图;
图3为实施例三提供的一种多维度KPI数据异常定位方法流程图;
图4为实施例四提供的一种多维度KPI数据异常定位方法流程图;
图5为实施例五提供的一种多维度KPI数据异常定位方法流程图;
图6为实施例六提供的一种多维度KPI数据异常定位方法流程图;
图7为实施例七提供的一种多维度KPI数据异常定位方法流程图;
图8为实施例八提供的一种多维度KPI数据异常定位的结构框图;
图9为本发明KPI数据异常定位方法(HotSpot)与iDice和Adtributor三种异常定位方法的F-score图;
图10为发明KPI数据异常定位方法(HotSpot)与iDice和Adtributor三种异常定位方法的Precision(准确度)-Recall(召回率)图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,在一个实施例中,提出了一种多维度KPI数据异常定位方法,具体可以包括以下步骤:
步骤S101,获取具有周期性的多维度KPI数据,所述多维度KPI数据至少包括KPI数据的元素向量和最细粒度元素向量的实际数值。
在本发明的实施例中,在运维监控系统中监控到的数据是具有多维度的,将其命名为多维度KPI数据,例如,表1所示的示例数据,其中包括时间戳;四个不同维度(省份(P),运营商类型ISP(I),数据中心(D)和频道(C))的候选值,其中表1中显示的元素向量为最细粒度元素向量。
表1运维监控系统中监控的数据示例
时间 元素向量(p,i,d,c) 实际值
10:00 (Beijng,Mobile,DC1,Channel1) 2
10:00 (Beijng,Mobile,DC1,Channel2) 1
10:00 (Beijng,Unicom,DC1,Channel2) 3
10:01 (Beijng,Mobile,DC2,Channel1) 1
步骤102,以周期为单位按照预设的数据划分规则将所述多维度KPI数据划分为预测值KPI数据和异常定位KPI数据。
在本发明实施例中,获得的多位KPI数据一般以周为单位,比如获得的多维度KPI数据包括9周全部数据,通过用户输入的数据划分规则,比如将前七周的数据作为预测值KPI数据,后两周的数据作为异常定位数据。
步骤103,计算所述预测值KPI数据的元素向量的期望值,并将所述期望值作为KPI数据的预测值。
在本发明的实施例中,其中计算预测值KPI数据的元素向量的期望值,主要利用预测值KPI数据的真实数值通过求解平均获得,比如预测值KPI数据中的元素向量中的(Beijng,Mobile,DC1,Channel1)出现了5次,每次出现的真实值为3、2、4、3、3,则该元素向量的预测值为3。
步骤104,根据所述异常定位KPI数据的元素向量的维度数对所述异常定位KPI数据进行分层。
在本发明的实施例中,比如步骤1例举的运维监控系统中监控的数据示例,其中元素向量有4个维度Province,ISP,IDC,Channel,则将其进行分层四层,其中第一层的元素向量为一维向量,可以包括BP、BI、BD、BC,可表示为E(BP)={e|e=(p,*,*,*),p≠*},其中*是通配符,第二层的元素向量为二维向量,BP,I、BP,D、PD,C等,可表示为E(BP,I)={e|e=(p,i,*,*),p,i≠*},应当理解的是第三层为三维向量、第四层为四维向量,且如向量E(BP)和E(BP,I)具有父子关系。
在本发明的实施例中,为了更好的理解各维度向量之间的关系,进行一下定义,定义e′=(p′,i′,d′,c′)为e=(p,i,d,c)的子代,当且仅当p∈P or p=*,i∈I or i=*,d∈D or d=*,c∈C or c=*,以Desc(e)={e′|e′是e的子代},Desc′(e)={e′|e′=(p′,i′,d′,c′)∈LEAF,e′∈Desc(e)},Desc′(e)表示e的子代集合中的叶子节点。当e是一个叶子向量(即最小粒度向量),我们可以直接从监控数据中读到它所对应的数值,如表1中显示的那样。当向量e中含有通配符*时,我们可以根据公式v(e)=∑e′∈Desc′(e)v(e′),来计算出对应的数值,其中v(e)表示元素向量的真实值。在上面的例子中,v(Beijing,*,*,*)=∑j,k,hv(Beijing,ij,dk,ch)。
步骤105,根据所述最细粒度元素向量的实际数值和KPI数据的预测值,采用蒙特卡洛树方法对分层后的异常定位KPI数据进行逐层搜索,获得最大潜在分数的子集。
在本发明的实施例中,所述的蒙特卡洛树方法是用于通过在决策空间中获取随机样本并根据现有随机示例的结果构建搜索树来搜索给定域中的最优决策,从根节点出发,经过选择、添加、计算和反馈四个步骤,对蒙特卡洛树中的节点进行搜索,通过不断的添加、计算过程,获得最小的搜索空间。所述的最大潜在分数是通过根据最细粒度元素向量的实际数值和KPI数据的预测值,获得相应的实际数值向量和预测值向量,以及推导数值向量,并根据实际数值向量、预测值向量和推导数值向量,计算获得不同元素向量的潜在分数。
在本发明的实施例中,本发明在蒙特卡洛树搜索过程中,以潜在分数最大的候选值或者元素向量为起点,并通过添加剩余元素向量中具有最大潜在分数的候选值或者元素向量进行扩展,并对扩展后的新的向量进行最大潜在分数的计算,获得新的最大潜在分数的向量或者向量集合,通过逐层的搜索,最终获得具有最大潜在分数的向量或者向量集合。
在本发明的实施例中,当根本原因元素的值增加或减少时,它遵循如下的涟漪效应。假设x不属于叶子向量LEAF,x′i表示向量x的子代向量,即x′i∈Desc′(x)。当x的值变化h(x)时,即h(x)=f(x)-v(x)(f(x)为预测值,v(x)为实际观测到的数据),x′i将根据其预测值f(x)的比例,利用公式1得到它的推导值。
并根据a(e)=∑a′∈Desc′a(e′)获得元素向量的推导数值。根据上述预测数值和实际数值以及推导数值,获得预测数值向量实际数值向量以及推导数值向量根据公式(2)计算潜在分数Potential Score(ps)。
其中表示向量和向量的距离,根据公式(3)进行计算。
步骤106,根据所述最大潜在分数的子集确定异常发生的根因集合。
在本发明实施例中,其中最大潜在分数的子集可以为任一维度的的元素向量,或者向量的集合。比如具有最大潜在分数的向量集合为{(Beijing,Mobile),(Shanghai,Mobile),(Beijing,Unicom),(Shanghai,Unicom)},确定次异常的根本原因{(Beijing,*),(Shanghai,*)}。
该方法通过获取多维度KPI数据,并划分成预测值KPI数据和异常定位KPI数据,并对异常定位KPI数据进行分层处理,针对每一层的集合,提出了一个揭示异常传播连锁效应的潜在分数作为衡量指标,并通过最细粒度元素向量的实际数值和KPI数据的预测值进行潜在分数的计算,应用蒙特卡洛树方法进行逐层搜索,获得具有最大潜在分数的子集,从而确定导致异常发生的根因,该方法大大减小了搜索空间,从而提高了异常定位效率,同时异常定位的准确率也明显提高。
在一个实施例中,如图2所示,步骤105具体可以包括以下步骤:
步骤S201,获取分层后的异常定位KPI数据的第一层元素向量,根据所述最细粒度元素向量的实际数值和KPI数据的预测值,按照潜在分数计算方法计算所述第一层元素向量中的候选值的潜在分数,并按照潜在分数的大小对所述候选值进行排序。
在本发明的实施例中,其中第一层元素向量为一维向量,以实施例一提供的示例BP为例其中包含三个候选值,可以将其表示为三个元素向量(Beijing,*),(Shanghai,*)和(Guangdong,*),根据最细粒度元素向量的实际数值和KPI数据的预测值利用公式(1)-(3)计算含有上述三个元素向量的潜在分数,并对三者进行排序,应当理解的是,对于第一层元素向量中的其他向量比如BI、BD、BC进行同样的处理,获得第一层元素向量中的各候选值的潜在分数。
步骤S202,选择潜在分数最大的候选值作为起始点,并增加同一元素向量中除潜在分数最大的候选值外的候选值进行组合,获得候选值组。
在本发明的是实例中,将潜在分数最大的候选值作为蒙特卡洛树的起点,并以添加潜在分数排序第二的候选值,进行组合,获得候选值组,应当理解的是,当以潜在分数最大的元素向量作为起点时,添加其他的元素向量,获得元素向量组合。
步骤S203,根据所述最细粒度元素向量的实际数值和KPI数据的预测值,按照潜在分数计算方法计算候选值组的潜在分数。
在本发明的实施例中,针对所获得的候选值组或者元素向量组根据包含有对应候选值的最细粒度元素向量的实际数值和KPI数据的预测值,按照公式(1)-(3)计算其潜在分数。
步骤S204,根据所述候选值和候选值组的潜在分数,按照预先设定的选择方法分别选择不同第一层元素向量中候选值进行两两组合,获得第二层元素向量。
在本发明的实施例中,当获得候选值和候选值组或者元素向量和元素向量的潜在分数时,根据候选值和候选值组的潜在分数按照潜在分数的大小进行排序,获得潜在分数最大的候选值或者候选值组;选择不同第一层元素向量中潜在分数最大的候选值或者潜在分数最大的候选值组中的任一一个候选值进行两两组合,获得第二层元素向量,比如在潜在分数最大的第一层元素向量的候选值中包括(p1,*)、(p2,*)和(*,i1),则以(p1,i1)、(p2,i1)作为第二层元素向量。
步骤S205,根据所述最细粒度元素向量的实际数值和KPI数据的预测值,按照潜在分数计算方法计算第二层元素向量的潜在分数,获得最大潜在分数的第二层元素向量,并将所述最大潜在分数的第二层元素向量作为最大潜在分数子集。
在本发明的实施例中,根据第二元素向量和与之相应的所述最细粒度元素向量的实际数值和KPI数据的预测值,并按照公式(1)-(3)计算第二层元素向量的潜在分数,其中获得的最大潜在分数的第二层元素向量则为最大潜在分数子集。应该理解的是,本实施例只是以包含两层的实施例进行描述,当包含有更多层时,按照对第一层元素向量的处理方式对后续各层的元素向量进行蒙特卡洛树方法搜索,一直到最后一层,以获得最大潜在分数的子集。
该方法对多维KPI数据的各层采用蒙特卡洛树方法进行搜索,通过最大潜在分数作为起点选择和节点扩增的指标,能够极大的减小搜索空间,提高运行效率。
在一个实施例中,如图3所示,步骤105还包括以下步骤:
步骤S301,获取用户输入的最大潜在分数阈值。
在本发明的实施例中,最大潜在分数的阈值为用户的经验值,或者通过大数据分析获得的一个小于1的值。
步骤S302,当最大潜在分数大于阈值时,则最大潜在分数对应的元素向量则为最大潜在分数的子集。
在本发明的实施例中,在步骤S105的搜索过程中,不断的对元素向量的潜在分数进行计算,将获得的潜在分数与阈值进行比较,当潜在分数大于设定的阈值时,则该潜在分数对应的元素向量为最大潜在分数子集。
应该理解的是,在蒙特卡洛树的搜索过程中,如果没有一直没有获得潜在分数大于阈值,则选择搜索过程中获得最大潜在分数对应的元素向量或者元素向量组作为最大潜在分数子集。
该方法通过用户的经验值获得最大潜在分数阈值,在蒙特卡洛树的搜索过程中对获得的潜在分数与阈值进行比较,获得最大潜在分数子集,提高搜索效率。
在一个实施例中,图4提供了S201中潜在分数计算方法具有包括以下步骤:
步骤S401,获取最细粒度元素向量的实际数值,并从所述最细粒度元素的实际数值中获取与第一候选值对应的实际数值,以获得第一候选值的实际数值向量。
在本发明的实施例中,选择含有第一候选值的最细粒度元素向量的实际数值,将所有实际数值进行组合获得第一候选值的实际数值向量,比如以yi表示最细粒度元素向量,并以v(e)为最细粒度元素向量对应实际数值,则获得实际数值向量为其中n表示最细粒度元素向量的数量。
步骤S402,获取KPI数据的预测值,并从所述KPI数据的预测值中获取与第一候选值对应的预测值,以获得第一候选值的预测数值向量。
在本发明的实施例中,选择含有第一候选值的最细粒度元素的预测数值,将所有预测数值进行组合获得第一候选值的预测数值向量,比如以yi表示最细粒度元素向量,并以f(e)为最细粒度元素向量对应预测数值,则获得预测数值向量为
步骤S403,根据所述第一候选值的实际数值向量和预测数值向量按照预先设定的方法获得第一候选值推导数值向量。
在本发明的实施例中,根据第一候选值的实际数值向量和预测数值向量获得包含有第一候选值的最细粒度的实际数值和预测数值,根据第一候选值的最细粒度的实际数值和预测数值获得第一候选值的变化量,根据所述第一候选值的变化量、包含有第一候选值的最细粒度的实际数值和预测数值获得第一候选值的推导值,以获得第一候选值推导数值向量,以表示为
步骤S404,按照向量距离计算方法计算所述第一候选值的实际数值向量与推导数值向量的第一距离和所述第一候选值的试剂数值向量与预测数值向量的第二距离,根据第一距离和第二距离的比值确定潜在分数。
在本发明的实施例中,向量距离计算方法采用欧式距离,记为按照公式(4)进行计算获得第一候选值的实际数值向量与推导数值向量的第一距离以及第一候选值的试剂数值向量与预测数值向量的第二距离并根据公式(5)计算第一候选值的潜在分数(Potential Score)。
应当理解的是,上述潜在分数计算方法同样适用于向量潜在分数的计算,知识将相应的候选值变为含有多个候选值的向量,通过获得含有所述多个候选值最细粒度元素向量的实际数值和预测数值从而获得相应的向量,通过公式(4)、(5)计算相应向量的潜在分数。
通过该方法通过获得相应的向量,获得不同元素的潜在积分,为蒙特卡洛树搜索提供了必要的衡量参数,用于确定潜在可能性导致异常的根本原因。
在一个实施例中,图5提供了步骤S204具体可以包括以下步骤:
步骤S501,根据候选值和候选值组的潜在分数按照潜在分数的大小进行排序,获得潜在分数最大的候选值或者候选值组。
在本发明的实施例中,将前述步骤中获得候选值和候选值组的潜在分数按照潜在分数的大小进行排序,应当理解的是,所述的候选值和候选值组可以为元素向量和元素向量组,以获得潜在分数最大的候选值或者候选值组,作为最佳集合。
步骤S502,选择不同第一层元素向量中潜在分数最大的候选值或者潜在分数最大的候选值组中的任一一个候选值进行两两组合,获得第二层元素向量。
在本发明的实施例中,从不同第一层元素向量中选择潜在分数最大的候选值或者潜在分数最大的候选值组中的任一一个候选值进行两两组合,获得第二层元素向量。该方法采用了分层剪枝策略对较高层中不太可能是根本原因的元素的元素集合,比如对于子代元素,当只有其所有的父代元素都不在上一级的最佳集合中时,我们才会对该子代元素进行剪枝。例如,当子代元素(p1,i1,d1)的父代元素(p1,i1,*),(p1,*,d1)和(*,i1,d1)都不在最佳集合中时,我们才会将子代元素(p1,i1,d1)删除掉。
该方法通过选择最佳集合,删除不太可能是根本原因的元素集合,可以进一步减小搜索空间,加快异常定位的时间。
在一个实施例中,图6提供了步骤S403具体可以包括以下步骤:
步骤S601,根据第一候选值的实际数值向量和预测数值向量获得包含有第一候选值的最细粒度的实际数值和预测数值。
步骤S602,根据第一候选值的最细粒度的实际数值和预测数值获得第一候选值的变化量。
在本发明的实施例中,通过步骤S601获得包含有第一候选值的实际数值和预测数值,比如表2所示。其中定义x′i表示元素向量x中最细粒度的子代元素,在表2的例子中x′i=(Beijing,Unicom)或者是x′i=(Shanghai,Unicom)。当x的值变化h(x)时,即h(x)=f(x)-v(x)。
表2
步骤S603,根据所述第一候选值的变化量、包含有第一候选值的最细粒度的实际数值和预测数值获得第一候选值的推导值,以获得第一候选值推导数值向量。
在本发明的实施例中,将获得的第一候选值的变化量、包含有第一候选值的最细粒度的实际数值和预测数值通过公式(6)进行计算,获得推导值。并将获得的推导值组合形成推导数值向量。以下以一个具体实例进行说明。
根据表2中数值,对于(Beijing,Unicom)和(Beijing,Mobile)这两个元素是集合{(Beijing,*)}中元素(Beijing,*)的子代元素,所以我们利用公式(6)进行推导。
而对于而对于其他元素值,例如(Shanghai,Mobile),因为他们不是集合{(Beijing,*)}中元素(Beijing,*)的子代元素,所以我们直接让他们等与各自的预测值。即a(Shanghai,Unicom)=f(Shanghai,Unicom)=25,a(Shanghai,Mobile)=f(Shanghai,Mobile)=15,a(Guangdong,Mobile)=f(Guangdong,Mobile)=10,a(Guangdong,Unicom)=f(Guangdong,Unicom)=20。按照同样的方法,获得不同其他向量的推导值,从而获得对于集合合{(Beijing,*)},它的推导值向量
在本发明的实施例中,步骤S404中计算向量距离计算方法,主要是通过计算两向量之间的欧式距离,比如设置两个向量为向量和向量根据公式进行计算,获得两向量的距离。
该方法通过实际数值和预测值推导出相应的变化值,从而获得推导数值向量,将根本原因元素的增加或者减少所遵循的涟漪效应进行了考虑,为后续向量的比较提供了有效的数据。
在一个实施例中,图7提供了步骤S404中根据第一距离和第二距离的比值确定潜在分数具体包括:
步骤S701,将所述第一距离与所述第二距离进行比较,获得第一距离与第二距离的比值。
在本发明的实施例中,将所获得的第一距离和第二距离按照进行计算,获得二者的比值。
步骤S702,根据所述比值与1的大小关系,确定潜在分数。
在本发明的实施例中,当所述比值大于1或等于时,其潜在分数为0,当所述比值小于1时,潜在分数为具体按照公式(5)进行计算。
如图8所示,在一个实施例中,提供了一种多维度KPI数据异常定位装置,该多维度KPI数据异常定位装置具体包括多维度KPI数据获取模块810,多维度KPI数据分类模块820,KPI数据预测值计算模块830,异常定位KPI数据分层模块840,蒙特卡洛树搜索模块850,根因集合确定模块860。
多维度KPI数据获取模块810,用于获取具有周期性的多维度KPI数据;
在本发明的实施例中,在运维监控系统中监控到的数据是具有多维度的,将其命名为多维度KPI数据,例如,表1所示的示例数据,其中包括时间戳;四个不同维度(省份(P),运营商类型ISP(I),数据中心(D)和频道(C))的候选值。
多维度KPI数据分类模块820,用于以周期为单位按照预设的数据划分规则将所述多维度KPI数据划分为预测值KPI数据和异常定位KPI数据;
在本发明的实施例中,获得的多位KPI数据一般以周为单位,比如获得的多维度KPI数据包括9周全部数据,通过用户输入的数据划分规则,比如将前七周的数据作为预测值KPI数据,后两周的数据作为异常定位数据。
KPI数据预测值计算模块830,用于计算所述预测值KPI数据的元素向量的期望值,并将所述期望值作为KPI数据的预测值;
在本发明的实施例中,在本发明的实施例中,其中计算预测值KPI数据的元素向量的期望值,主要利用预测值KPI数据的真实数值通过求解平均获得,比如预测值KPI数据中的元素向量中的(Beijng,Mobile,DC1,Channel1)出现了5次,每次出现的真实值为3、2、4、3、3,则该元素向量的预测值为3。
异常定位KPI数据分层模块840,用于根据所述异常定位KPI数据的维度数将所述异常定位KPI数据进行分层;
在本发明的实施例中,比如步骤1例举的运维监控系统中监控的数据示例,其中元素向量有4个维度Province,ISP,IDC,Channel,则将其进行分层四层,其中第一层的元素向量为一维向量,可以包括BP、BI、BD、BC,可表示为E(BP)={e|e=(p,*,*,*),p≠*},其中*是通配符,第二层的元素向量为二维向量,BP,I、BP,D、PD,C等,可表示为E(BP,I)={e|e=(p,i,*,*),p,i≠*},应当理解的是第三层为三维向量、第四层为四维向量,且如向量E(BP)和E(BP,I)具有父子关系。
在本发明的实施例中,为了更好的理解各维度向量之间的关系,进行一下定义,定义e′=(p′,i′,d′,c′)为e=(p,i,d,c)的子代,当且仅当p∈P or p=*,i∈I or i=*,d∈D or d=*,c∈C or c=*,以Desc(e)={e′|e′是e的子代},Desc′(e)={e′|e′=(p′,i′,d′,c′)∈LEAF,e′∈Desc(e)},Desc′(e)表示e的子代集合中的叶子节点。当e是一个叶子向量(即最小粒度向量),我们可以直接从监控数据中读到它所对应的数值,如表1中显示的那样。当向量e中含有通配符*时,我们可以根据公式v(e)=∑e′∈Desc′(e)v(e′),来计算出对应的数值,其中v(e)表示元素向量的真实值。在上面的例子中,v(Beijing,*,*,*)=∑j,k,hv(Beijing,ij,dk,ch)。
蒙特卡洛树搜索模块850,用于根据所述最细粒度元素向量的实际数值和KPI数据的预测值,对分层后的异常定位KPI数据采用蒙特卡洛树方法进行逐层搜索,获得最大潜在分数的子集;
在本发明实施例中,在本发明的实施例中,所述的蒙特卡洛树方法是用于通过在决策空间中获取随机样本并根据现有随机示例的结果构建搜索树来搜索给定域中的最优决策,从根节点出发,经过选择、添加、计算和反馈四个步骤,对蒙特卡洛树中的节点进行搜索,通过不断的添加、计算过程,获得最小的搜索空间。所述的最大潜在分数是通过根据最细粒度元素向量的实际数值和KPI数据的预测值,获得相应的实际数值向量和预测值向量,以及推导数值向量,并根据实际数值向量、预测值向量和推导数值向量,计算获得不同元素向量的潜在分数。
在本发明的实施例中,本发明在蒙特卡洛树搜索过程中,以潜在分数最大的候选值或者元素向量为起点,并通过添加剩余元素向量中具有最大潜在分数的候选值或者元素向量进行扩展,并对扩展后的新的向量进行最大潜在分数的计算,获得新的最大潜在分数的向量或者向量集合,通过逐层的搜索,最终获得具有最大潜在分数的向量或者向量集合。
在本发明的实施例中,当根本原因元素的值增加或减少时,它遵循如下的涟漪效应。假设x不属于叶子向量LEAF,x′i表示向量x的子代向量,即x′i∈Desc′(x)。当x的值变化h(x)时,即h(x)=f(x)-v(x)(f(x)为预测值,v(x)为实际观测到的数据),x′i将根据其预测值f(x)的比例,利用公式1得到它的推导值。
并根据a(e)=∑a′∈Desc′a(e′)获得元素向量的推导数值。根据上述预测数值和实际数值以及推导数值,获得预测数值向量实际数值向量以及推导数值向量根据公式(2)计算潜在分数Potential Score(ps)。其中表示向量和向量的距离,根据公式(3)进行计算。
根因集合确定模块860,用于根据所述最大潜在分数的子集确定异常发生的根因集合。
在本发明实施例中,其中最大潜在分数的子集可以为任一维度的的元素向量,或者向量的集合。比如具有最大潜在分数的向量集合为{(Beijing,Mobile),(Shanghai,Mobile),(Beijing,Unicom),(Shanghai,Unicom)},确定次异常的根本原因{(Beijing,*),(Shanghai,*)}。
在本发明的实施例中,本发明还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现雷达干扰效果评估方法的步骤。
下列以一个实验例与现有的方法iDice和Adtributor进行对比,考察本发明多维度KPI数据异常定位的准确度,并将本发明的方法定义为HotSpot方法。从全球顶级搜索引擎收集了9周的PV(网页的访问量)数据,数据具有一周的周期性。我们利用数据集的前七周数据计算每个元素向量对应的期望值,即f(e),最后两周的数据用来进行多维度KPI的异常定位。该数据集中共包含了20种导致异常发生的根因。数据的格式为‘10:00:01,Beijing,Mobile,DC1,Channel1,32’。每条数据有4个维度,分别是P、ISP、DC和Channel,第一列是时间戳,最后一列是该元素向量对应的实际数值,即v(e)。
表3
将本文的方法与之前的iDice和Adtributor在F-score和Precision-Recall作了比较,评估指标F-score,该指标是准确率(Precision)和召回率(Recall)综合体现。具体计算如下所示:score=(2×Precision×Recall)/(Precision+Recall)。其中:Precision=TP/(TP+FP),Recall=TP/(TP+FN)。每个异常时刻都有一个根因集合,该集合中包含一个或多个元素指标:针对某一时刻根因集合中的每一个元素指标,记为S*,如果算法输出结果(记为S)中包含其中一个,则算一次true positive(TP),遗漏一个算一次false negative(FN),多出一个S*中不存在的,记一次false positive(FP)。计算出所有异常时刻的F-score,求其平均值得到全局的F-score。实验结果如图9和图10所示。
图9显示了三种算法的F分数的比较。与iDice和Adtributor相比,HotSpot在所有20种异常案例中都获得了更高的F分数(按Layer ID和每种情况下的元素数量区分)。随着元素数量的增加,iDice的F分数急剧下降。尽管Adtributor在第一层异常情况下获得了极好的准确性,但当案例处于较高层时,其准确性降至零。相比之下,HotSpot在每种情况下的不同数量的元素和不同的层上表现得非常强大。
图10示出了在20种情况类型中三种算法的精确回忆的分布。在此图中,HotSpot的Precision-Recall集中在右上角,展示了HotSpot在准确性方面的稳健性。而图10中iDice的Precision-Recall比HotSpot更加分散,这表明iDice的准确性对于不同类型的异常情况并不稳健。除了第一层中的异常情况的五个Precision-Recall之外,Adtributor的大多数Precision-Recall都集中在左下角。简而言之,图9和图10都显示HotSpot比iDice和Adtributor更准确和更强大。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
应该理解的是,虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

Claims (10)

1.一种多维度KPI数据异常定位方法,其特征在于,具体包括,
获取具有周期性的多维度KPI数据,所述多维度KPI数据至少包括KPI数据的元素向量和最细粒度元素向量的实际数值;
以周期为单位按照预设的数据划分规则将所述多维度KPI数据划分为预测值KPI数据和异常定位KPI数据;
计算所述预测值KPI数据的元素向量的期望值,并将所述期望值作为KPI数据的预测值;
根据所述异常定位KPI数据的元素向量的维度数对所述异常定位KPI数据进行分层;
根据所述最细粒度元素向量的实际数值和KPI数据的预测值,采用蒙特卡洛树方法对分层后的异常定位KPI数据进行逐层搜索,获得最大潜在分数的子集;
根据所述最大潜在分数的子集确定异常发生的根因集合。
2.根据权利要求1所述的多维度KPI数据异常定位方法,其特征在于,所述根据所述最细粒度元素向量的实际数值和KPI数据的预测值,采用蒙特卡洛树方法对分层后的异常定位KPI数据进行逐层搜索,获得最大潜在分数的子集的步骤具体包括:
获取分层后的异常定位KPI数据的第一层元素向量,根据所述最细粒度元素向量的实际数值和KPI数据的预测值,按照潜在分数计算方法计算所述第一层元素向量中的候选值的潜在分数,并按照潜在分数的大小对所述候选值进行排序;
选择潜在分数最大的候选值作为起始点,并增加同一元素向量中除潜在分数最大的候选值外的候选值进行组合,获得候选值组;
根据所述最细粒度元素向量的实际数值和KPI数据的预测值,按照潜在分数计算方法计算候选值组的潜在分数;
根据所述候选值和候选值组的潜在分数,按照预先设定的选择方法分别选择不同第一层元素向量中候选值进行两两组合,获得第二层元素向量;
根据所述最细粒度元素向量的实际数值和KPI数据的预测值,按照潜在分数计算方法计算第二层元素向量的潜在分数,获得最大潜在分数的第二层元素向量,并将所述最大潜在分数的第二层元素向量作为最大潜在分数子集。
3.根据权利要求2所述的多维度KPI数据异常定位方法,其特征在于,所述对分层后的KPI数据采用蒙特卡洛树方法进行逐层搜索,获得最大潜在分数的子集的步骤具体还包括:
获取用户输入的最大潜在分数阈值;
当潜在分数大于所述阈值时,则潜在分数对应的元素向量则为最大潜在分数的子集。
4.根据权利要求2所述的多维度KPI数据异常定位方法,其特征在于,所述潜在分数计算方法具有包括以下步骤:
获取最细粒度元素的实际数值,并从所述最细粒度元素向量的实际数值中获取与第一候选值对应的实际数值,以获得第一候选值的实际数值向量;
获取KPI数据的预测值,并从所述KPI数据的预测值中获取与第一候选值对应的预测值,以获得第一候选值的预测数值向量;
根据所述第一候选值的实际数值向量和预测数值向量按照预先设定的方法获得第一候选值推导数值向量;
按照向量距离计算方法计算所述第一候选值的实际数值向量与推导数值向量的第一距离和所述第一候选值的试剂数值向量与预测数值向量的第二距离,根据第一距离和第二距离的比值确定潜在分数。
5.根据权利要求2所述的多维度KPI数据异常定位方法,其特征在于,所述根据所述候选值和候选值组的潜在分数,按照预先设定的选择方法分别选择不同第一层元素向量中候选值进行两两组合,获得第二层元素向量的步骤具体包括:
根据候选值和候选值组的潜在分数按照潜在分数的大小进行排序,获得潜在分数最大的候选值或者候选值组;
选择不同第一层元素向量中潜在分数最大的候选值或者潜在分数最大的候选值组中的任一一个候选值进行两两组合,获得第二层元素向量。
6.根据权利4所述的多维度KPI数据异常定位方法,其特征在于,所述根据所述第一候选值的实际数值向量和预测数值向量按照预先设定的方法获得第一候选值推导数值向量的步骤具体包括:
根据第一候选值的实际数值向量和预测数值向量获得包含有第一候选值的最细粒度的实际数值和预测数值;
根据第一候选值的最细粒度的实际数值和预测数值获得第一候选值的变化量;
根据所述第一候选值的变化量、包含有第一候选值的最细粒度的实际数值和预测数值获得第一候选值的推导值,以获得第一候选值推导数值向量。
7.根据权利4所述的多维度KPI数据异常定位方法,其特征在于,所述向量距离技术方法具体包括:
获取两个向量按照公式计算两个向量的距离。
8.根据权利4所述的多维度KPI数据异常定位方法,其特征在于,根据第一距离和第二距离的比值确定潜在分数的步骤包括:
将所述第一距离与所述第二距离进行比较,获得第一距离与第二距离的比值;
根据所述比值与1的大小关系,确定潜在分数。
9.一种多维度KPI数据异常定位装置,其特征在于,包括:
多维度KPI数据获取模块,用于获取具有周期性的多维度KPI数据;
多维度KPI数据分类模块,用于以周期为单位按照预设的数据划分规则将所述多维度KPI数据划分为预测值KPI数据和异常定位KPI数据;
KPI数据预测值计算模块,用于计算所述预测值KPI数据的元素向量的期望值,并将所述期望值作为KPI数据的预测值;
异常定位KPI数据分层模块,用于根据所述异常定位KPI数据的维度数将所述异常定位KPI数据进行分层;
蒙特卡洛树搜索模块,用于根据所述最细粒度元素向量的实际数值和KPI数据的预测值,对分层后的异常定位KPI数据采用蒙特卡洛树方法进行逐层搜索,获得最大潜在分数的子集;
根因集合确定模块,用于根据所述最大潜在分数的子集确定异常发生的根因集合。
10.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述方法的步骤。
CN201910254307.7A 2019-03-31 2019-03-31 一种多维度kpi数据异常定位方法、装置及计算机设备 Pending CN109992479A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910254307.7A CN109992479A (zh) 2019-03-31 2019-03-31 一种多维度kpi数据异常定位方法、装置及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910254307.7A CN109992479A (zh) 2019-03-31 2019-03-31 一种多维度kpi数据异常定位方法、装置及计算机设备

Publications (1)

Publication Number Publication Date
CN109992479A true CN109992479A (zh) 2019-07-09

Family

ID=67131339

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910254307.7A Pending CN109992479A (zh) 2019-03-31 2019-03-31 一种多维度kpi数据异常定位方法、装置及计算机设备

Country Status (1)

Country Link
CN (1) CN109992479A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110362952A (zh) * 2019-07-24 2019-10-22 张�成 一种快速计算任务分流方法
CN110825769A (zh) * 2019-10-11 2020-02-21 苏宁金融科技(南京)有限公司 一种数据指标异常的查询方法和系统
CN110928718A (zh) * 2019-11-18 2020-03-27 上海维谛信息科技有限公司 一种基于关联分析的异常处理方法、系统、终端及介质
CN111064614A (zh) * 2019-12-17 2020-04-24 腾讯科技(深圳)有限公司 一种故障根因定位方法、装置、设备及存储介质
CN111314173A (zh) * 2020-01-20 2020-06-19 腾讯科技(深圳)有限公司 监控信息异常的定位方法、装置、计算机设备及存储介质
CN111444247A (zh) * 2020-06-17 2020-07-24 北京必示科技有限公司 一种基于kpi指标的根因定位方法、装置及存储介质
CN111506637A (zh) * 2020-06-17 2020-08-07 北京必示科技有限公司 一种基于kpi指标的多维异常检测方法、装置及存储介质
CN111538951A (zh) * 2020-03-31 2020-08-14 北京华三通信技术有限公司 一种异常定位方法及装置
CN111897695A (zh) * 2020-07-31 2020-11-06 平安科技(深圳)有限公司 获取kpi异常数据样本的方法、装置和计算机设备
CN112132362A (zh) * 2020-09-30 2020-12-25 上海众源网络有限公司 一种指标数据处理方法、装置、电子设备及存储介质
CN112187554A (zh) * 2020-12-01 2021-01-05 北京蒙帕信创科技有限公司 一种基于蒙特卡洛树搜索的运维系统故障定位方法和系统
CN112446647A (zh) * 2020-12-14 2021-03-05 上海众源网络有限公司 异常元素的定位方法、装置、电子设备及存储介质
CN112732472A (zh) * 2021-01-07 2021-04-30 广州虎牙科技有限公司 异常根因定位方法、模型、电子设备及计算机存储介质
CN113128875A (zh) * 2021-04-22 2021-07-16 阳光保险集团股份有限公司 一种面向多维数据集的指标异常的根因定位方法及装置
WO2022160675A1 (zh) * 2021-01-29 2022-08-04 北京达佳互联信息技术有限公司 根因确定方法及装置
CN115562948A (zh) * 2022-12-05 2023-01-03 成都索贝数码科技股份有限公司 大规模并行化的多kpi预测方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9235465B2 (en) * 2012-06-06 2016-01-12 University of Pittsburgh—of the Commonwealth System of Higher Education Recursively determined invertible set approach to correct multiple stuck-at faults in rewritable memory
US9442694B1 (en) * 2015-11-18 2016-09-13 International Business Machines Corporation Method for storing a dataset
CN105975604A (zh) * 2016-05-12 2016-09-28 清华大学 一种分布迭代式数据处理程序异常检测与诊断方法
CN109254865A (zh) * 2018-09-25 2019-01-22 江苏润和软件股份有限公司 一种基于统计分析的云数据中心服务异常根因定位方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9235465B2 (en) * 2012-06-06 2016-01-12 University of Pittsburgh—of the Commonwealth System of Higher Education Recursively determined invertible set approach to correct multiple stuck-at faults in rewritable memory
US9442694B1 (en) * 2015-11-18 2016-09-13 International Business Machines Corporation Method for storing a dataset
CN105975604A (zh) * 2016-05-12 2016-09-28 清华大学 一种分布迭代式数据处理程序异常检测与诊断方法
CN109254865A (zh) * 2018-09-25 2019-01-22 江苏润和软件股份有限公司 一种基于统计分析的云数据中心服务异常根因定位方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HUIWEN GUO: "A novel approach for global abnormal event detection in multi-camera surveillance system", 《2015 IEEE INTERNATIONAL CONFERENCE ON INFORMATION AND AUTOMATION》 *
郑黎明: "大规模通信网络流量异常检测与优化关键技术研究", 《中国博士学位论文全文数据库信息科技辑》 *

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110362952A (zh) * 2019-07-24 2019-10-22 张�成 一种快速计算任务分流方法
CN110362952B (zh) * 2019-07-24 2022-12-20 张�成 一种快速计算任务分流方法
CN110825769A (zh) * 2019-10-11 2020-02-21 苏宁金融科技(南京)有限公司 一种数据指标异常的查询方法和系统
CN110928718A (zh) * 2019-11-18 2020-03-27 上海维谛信息科技有限公司 一种基于关联分析的异常处理方法、系统、终端及介质
CN110928718B (zh) * 2019-11-18 2024-01-30 上海维谛信息科技有限公司 一种基于关联分析的异常处理方法、系统、终端及介质
CN111064614A (zh) * 2019-12-17 2020-04-24 腾讯科技(深圳)有限公司 一种故障根因定位方法、装置、设备及存储介质
CN111064614B (zh) * 2019-12-17 2020-12-08 腾讯科技(深圳)有限公司 一种故障根因定位方法、装置、设备及存储介质
CN111314173B (zh) * 2020-01-20 2022-04-08 腾讯科技(深圳)有限公司 监控信息异常的定位方法、装置、计算机设备及存储介质
CN111314173A (zh) * 2020-01-20 2020-06-19 腾讯科技(深圳)有限公司 监控信息异常的定位方法、装置、计算机设备及存储介质
CN111538951A (zh) * 2020-03-31 2020-08-14 北京华三通信技术有限公司 一种异常定位方法及装置
CN111538951B (zh) * 2020-03-31 2024-01-12 北京华三通信技术有限公司 一种异常定位方法及装置
CN111506637A (zh) * 2020-06-17 2020-08-07 北京必示科技有限公司 一种基于kpi指标的多维异常检测方法、装置及存储介质
CN111444247B (zh) * 2020-06-17 2023-10-17 北京必示科技有限公司 一种基于kpi指标的根因定位方法、装置及存储介质
CN111444247A (zh) * 2020-06-17 2020-07-24 北京必示科技有限公司 一种基于kpi指标的根因定位方法、装置及存储介质
CN111897695B (zh) * 2020-07-31 2022-06-17 平安科技(深圳)有限公司 获取kpi异常数据样本的方法、装置和计算机设备
CN111897695A (zh) * 2020-07-31 2020-11-06 平安科技(深圳)有限公司 获取kpi异常数据样本的方法、装置和计算机设备
CN112132362A (zh) * 2020-09-30 2020-12-25 上海众源网络有限公司 一种指标数据处理方法、装置、电子设备及存储介质
CN112187554A (zh) * 2020-12-01 2021-01-05 北京蒙帕信创科技有限公司 一种基于蒙特卡洛树搜索的运维系统故障定位方法和系统
CN112446647A (zh) * 2020-12-14 2021-03-05 上海众源网络有限公司 异常元素的定位方法、装置、电子设备及存储介质
CN112732472A (zh) * 2021-01-07 2021-04-30 广州虎牙科技有限公司 异常根因定位方法、模型、电子设备及计算机存储介质
WO2022160675A1 (zh) * 2021-01-29 2022-08-04 北京达佳互联信息技术有限公司 根因确定方法及装置
CN113128875A (zh) * 2021-04-22 2021-07-16 阳光保险集团股份有限公司 一种面向多维数据集的指标异常的根因定位方法及装置
CN113128875B (zh) * 2021-04-22 2024-02-27 阳光保险集团股份有限公司 一种面向多维数据集的指标异常的根因定位方法及装置
CN115562948A (zh) * 2022-12-05 2023-01-03 成都索贝数码科技股份有限公司 大规模并行化的多kpi预测方法及系统

Similar Documents

Publication Publication Date Title
CN109992479A (zh) 一种多维度kpi数据异常定位方法、装置及计算机设备
Khafaga et al. Forecasting Energy Consumption Using a Novel Hybrid Dipper Throated Optimization and Stochastic Fractal Search Algorithm
CN112820105B (zh) 路网异常区域处理的方法及系统
CN107256237A (zh) 基于动态网格优化的lof聚类数据异常点检测方法和检测系统
CN113077097B (zh) 一种基于深度时空相似性的空气质量预测方法
CN111525587B (zh) 一种基于无功负荷态势的电网无功电压控制方法及系统
CN110163429A (zh) 一种基于相似日优化筛选的短期负荷预测方法
CN113780684A (zh) 一种基于lstm神经网络的智慧楼宇用户用能行为预测方法
CN112801411A (zh) 一种基于生成对抗网络的网络流量预测方法
Xu et al. Graph-based time series edge anomaly detection in smart grid
Ólafsson et al. Intelligent partitioning for feature selection
WO2016112618A1 (zh) 一种基于距离的求解二维空间中代表性节点集的算法
CN105791010A (zh) 基于用户隐含特征和协同过滤的服务质量QoS预测方法
Naghavipour et al. Hybrid metaheuristics using rough sets for QoS-aware service composition
CN115660730A (zh) 基于分类算法的流失用户分析方法及系统
CN110309948A (zh) 整车物流订单预测方法及装置、物流系统以及计算机可读介质
CN115310355A (zh) 考虑多能耦合的综合能源系统多元负荷预测方法及系统
Ibrahim et al. Using qualitative probability in reverse-engineering gene regulatory networks
CN111210088B (zh) 一种基于时空因素的交通状态指数预测方法
CN113780347A (zh) 负荷曲线多重聚类集成方法、系统及存储介质
Raja et al. An Optimal Ensemble Classification for Predicting Churn in Telecommunication.
CN117035562B (zh) 基于电力大数据的环保智慧监测方法及数据分析设备
Wei-wei et al. Big Data Outlier Detection Algorithm Based on Grid
CN108363728A (zh) 一种挖掘特高压变电设备状态数据关联规则的方法及系统
CN110942149B (zh) 一种基于信息变化率及条件互信息的特征变量选择方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190709