CN114095337A - Kpi异常检测方法、装置、计算设备及计算机存储介质 - Google Patents

Kpi异常检测方法、装置、计算设备及计算机存储介质 Download PDF

Info

Publication number
CN114095337A
CN114095337A CN202010796082.0A CN202010796082A CN114095337A CN 114095337 A CN114095337 A CN 114095337A CN 202010796082 A CN202010796082 A CN 202010796082A CN 114095337 A CN114095337 A CN 114095337A
Authority
CN
China
Prior art keywords
abnormal
kpi
index data
model
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010796082.0A
Other languages
English (en)
Inventor
胡秦月
林永兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Zhejiang Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Zhejiang Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Zhejiang Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202010796082.0A priority Critical patent/CN114095337A/zh
Publication of CN114095337A publication Critical patent/CN114095337A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明实施例涉及大数据技术领域,公开了一种KPI异常检测方法、装置、计算设备及计算机存储介质,该方法包括:获取KPI指标数据,并进行预处理;根据所述KPI指标数据应用预设的异常检测模型动态获取异常门限;根据所述异常门限判断所述KPI指标数据是否异常。通过上述方式,本发明实施例能够提升故障发现和定位能力,使性能指标异常检测更灵敏。

Description

KPI异常检测方法、装置、计算设备及计算机存储介质
技术领域
本发明实施例涉及数据处理技术领域,具体涉及一种KPI异常检测方法、装置、计算设备及计算机存储介质。
背景技术
随着云化大网商用,维护人员将面临不同业务海量关键绩效指标(KeyPerformance Indicators,KPI),针对海量指标,如何设置合理的告警阈值并进行有效的监控管理,是一个业界共通的难题。在网络功能虚拟化(Network Function Virtualization,NFV)场景中,中型局点已经有超过100万条的指标。
目前对性能指标的监控,依赖人工经验的静态阈值和同比环比检测方法设定。现网采用静态阈值触发告警的方式来实现对性能的监控,无法针对不同场景(如白天和晚上,节假日和日常工作日)和不同时间段对网元合理监控。静态阈值存在告警不准或者告警遗漏问题,静态阈值的设定也需要根据不同业务、不同KPI指标频繁改变。同比环比检测办法算法简单,但检测速度慢,误告警较多。
现有技术方案中目前对性能指标的监控,依赖人工经验的静态阈值和同比环比检测方法,但是静态阈值设置和同比环比检测方法检测速度慢,且存在告警不准或告警遗漏问题,难以满足海量指标监控需求。
发明内容
鉴于上述问题,本发明实施例提供了一种KPI异常检测方法、装置、计算设备及计算机存储介质,克服了上述问题或者至少部分地解决了上述问题。
根据本发明实施例的一个方面,提供了一种KPI异常检测方法,所述方法包括:获取KPI指标数据,并进行预处理;根据所述KPI指标数据应用预设的异常检测模型动态获取异常门限;根据所述异常门限判断所述KPI指标数据是否异常。
在一种可选的方式中,所述异常检测模型为箱线图模型和/或时序预测算法模型。
在一种可选的方式中,所述根据所述KPI指标数据应用预设的异常检测模型动态获取异常门限之前,包括:根据历史KPI指标数据应用所述异常检测模型输出异常门限;根据所述异常门限检测所述历史KPI指标数据中的异常KPI指标数据;对比所述异常KPI指标数据与实际异常KPI指标数据,并根据对比结果调整所述异常检测模型的模型参数;应用调整后的所述模型参数对应的所述异常检测模型对所述历史KPI指标数据进行迭代训练,直至所述异常KPI指标数据与实际异常KPI指标数据相近。
在一种可选的方式中,所述异常检测模型为箱线图模型时,所述根据历史KPI指标数据对所述异常检测模型进行训练输出异常门限,包括:将所述历史KPI指标数据按数值大小顺序排列;将排列好的所述历史KPI指标数据进行四分位划分;根据四分位数、箱体长度以及模型参数计算所述异常门限。
在一种可选的方式中,所述根据四分位数、箱体长度以及模型参数计算所述异常门限,包括:上限计算为上四分位数+n*箱体长度;下限计算为下四分位数-n*箱体长度,其中n为所述模型参数,所述箱体长度为四分位距。
在一种可选的方式中,所述异常检测模型为时序预测算法模型时,所述根据历史KPI指标数据对所述异常检测模型进行训练输出异常门限,包括:对所述历史KPI指标数据基于时间序列进行分解;将整体时间序列分解为趋势成分、周期成分、节假日成分和噪声成分四部分序列分别进行拟合;根据拟合后的时间序列统计所述异常门限。
在一种可选的方式中,所述方法还包括:将异常的所述KPI指标数据以短信形式发送给维护人员以进行异常标注。
根据本发明实施例的另一个方面,提供了一种KPI异常检测装置,所述装置包括:数据获取单元,用于获取KPI指标数据,并进行预处理;门限获取单元,用于根据所述KPI指标数据应用预设的异常检测模型动态获取异常门限;异常检测单元,用于根据所述异常门限判断所述KPI指标数据是否异常。
根据本发明实施例的另一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述KPI异常检测方法的步骤。
根据本发明实施例的又一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使所述处理器执行上述KPI异常检测方法的步骤。
本发明实施例通过获取KPI指标数据,并进行预处理;根据所述KPI指标数据应用预设的异常检测模型动态获取异常门限;根据所述异常门限判断所述KPI指标数据是否异常,能够提升故障发现和定位能力,使性能指标异常检测更灵敏。
上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的KPI异常检测方法的流程示意图;
图2示出了本发明实施例提供的KPI异常检测方法的箱线图模型示意图;
图3示出了本发明实施例提供的KPI异常检测方法的时序预测算法模型的样本数据示意图;
图4示出了本发明实施例提供的KPI异常检测方法的时序预测算法模型示意图;
图5示出了本发明实施例提供的KPI异常检测方法的注册成功率的异常门限示例图;
图6示出了本发明实施例提供的KPI异常检测方法的在线注册用户数的异常门限示例图;
图7示出了本发明实施例提供的KPI异常检测装置的结构示意图;
图8示出了本发明实施例提供的计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
图1示出了本发明实施例提供的KPI异常检测方法的流程示意图。该KPI异常检测方法应用于服务器端,如图1所示,KPI异常检测方法包括:
步骤S11:获取KPI指标数据,并进行预处理。
每15分钟查询所有网元的KPI指标,读取实时KPI指标数据,加载到指标源表,并进行数据预处理,具体进行数据清洗,去除明显异常的数据,获取不含标注的待分析数据。同时还可以应用特征工程,分析获取专门用于进行异常检测的KPI指标数据。数据预处理完成后,把清洗完成的曲线数据入库。
步骤S12:根据所述KPI指标数据应用预设的异常检测模型动态获取异常门限。
在本发明实施例中,在步骤S12之前,对异常检测模型进行训练学习,以获取合理的模型参数。具体地,根据历史KPI指标数据应用所述异常检测模型输出异常门限;根据所述异常门限检测所述历史KPI指标数据中的异常KPI指标数据;对比所述异常KPI指标数据与实际异常KPI指标数据,并根据对比结果调整所述异常检测模型的模型参数;应用调整后的所述模型参数对应的所述异常检测模型对所述历史KPI指标数据进行迭代训练,直至所述异常KPI指标数据与实际异常KPI指标数据相近。
本发明实施例中的异常检测模型可以为箱线图模型和/或时序预测算法模型。不同的异常检测模型根据历史KPI指标数据输出的异常门限不同。异常检测模型为箱线图模型时,将所述历史KPI指标数据按数值大小顺序排列;将排列好的所述历史KPI指标数据进行四分位划分。根据四分位数、箱体长度以及模型参数计算所述异常门限。例如,将历史KPI指标数据从小到大排序,确定前25%位置的数据为下四分位数,前75%位置处的数据为上四分位数,如图2所示,中位数则为前50%位置处的数据。上限计算为上四分位数+n*箱体长度,如图2中的上边缘;下限计算为下四分位数-n*箱体长度,如图2中的下边缘,其中n为所述模型参数,所述箱体长度等于上四分位数减去下四分位数为四分位距。进而根据异常门限判断历史KPI指标数据是否异常。如果历史KPI指标数据超过异常门限,则确定为异常KPI指标数据,如图2中低于下边缘的KPI指标数据确定为异常值。模型参数n>=1,可以根据实际情况调节。箱线图模型适合KPI指标数据分布较平稳,同一时刻无快速变化趋势的情况。
异常检测模型为时序预测算法模型时,对所述历史KPI指标数据基于时间序列进行分解;将整体时间序列分解为趋势成分、周期成分、节假日成分和噪声成分四部分序列分别进行拟合;根据拟合后的时间序列统计所述异常门限。趋势成分、周期成分、节假日成分和噪声成分可以通过相加和/或相乘的组合方式进行拟合以得到拟合后的时间序列。对时序预测算法模型进行学习训练时,如图3所示,采用的样本数据为一定时间范围内所有统计的历史KPI指标数据,包括异常值,缺失值,算法可自动填补缺失值部分。本发明实施例的时序预测算法模型应用Prophet算法,是facebook开源的一种时序预测算法,关键参数包括:趋势部分模型选择、变点位置、时序容量上限、傅里叶特征个数、时序周期、周期部分和趋势部分组合模式(加或乘)、节假日时间设置、节假日影响系数、预测上下限宽度范围。拟合过程及模型参数估计的过程,采用全贝叶斯或最大后验概率估计算法。基于时间序列分解,通过参数估计拟合各部分时序成分,综合各部分预测结果进行总体预测。考虑了多种周期叠加,趋势性,节假日影响等因素,参数可凭经验调整,比较适合对现网多种运维时序指标进行预测。趋势成分、周期成分、节假日成分如图4所示,其中,趋势部分可以选择用逻辑斯谛增长(logistic growth)函数或线性函数来拟合。周期部分可以用傅里叶级数拟合。而对于节假日部分,每个节假日造成的影响用统计概率分布来拟合,分布参数可根据经验单独设置。Prophet算法通过预测来检测异常,如当真实数值超过预测上下限,则认为有异常数据的可能,无需特征工程,时序数据直接输入,超参可解释性强,可根据专家经验调整,可拟合有趋势特征的时序,算法生成统计上下限值,以检测异常数据。例如,实际预测现网网元HZPSBC55注册成功率和HZISBG57在线注册用户数门限如图5和图6所示。
步骤S13:根据所述异常门限判断所述KPI指标数据是否异常。
在本发明实施例中,可以由箱线图模型获取的异常门限判断KPI指标数据是否异常,如果KPI指标数据超出根据箱线图模型获取的异常门限的上限或者下限,则确定该KPI指标数据异常。本发明实施例也可以由时序预测算法模型获取的异常门限判断KPI指标数据是否异常,如果KPI指标数据超出根据时序预测算法模型获取的异常门限的上限或者下限,则确定该KPI指标数据异常。本发明实施例也可以同时根据箱线图模型和时序预测算法模型来判断KPI指标数据是否异常。具体分别根据由箱线图模型和时序预测算法模型获取的异常门限判断KPI指标数据是否异常,然后取根据两个模型判断出的异常KPI指标数据的并集。在根据箱线图模型或时序预测算法模型判断KPI指标数据是否异常时,根据异常门限的上限确定KPI数据是否异常,获取检测结果,然后再基于检测结果根据异常门限的下限确定KPI数据是否异常。针对异常数据,结合相邻时段异常情况、分析时段特性进一步确认是否异常。
在本发明实施例中,异常检测完成后,将异常的所述KPI指标数据以短信形式发送给维护人员以进行异常标注。本发明实施例以15分钟为粒度查询所有网元的KPI指标数据,使用AI算法(包括箱线图算法和/或时序预测算法)输出计算结果,并将异常的指标立即下发短信给维护人员,抢在告警工单和用户投诉之前提前发现故障;同时维护人员可以对异常指标进行标注,实现AI模型自动修正,解决了在海量KPI指标背景下,基于静态阈值设置和同比环比检测方法检测速度慢,且存在告警不准或告警遗漏问题,提升故障发现和定位能力,提前10分钟发现性能指标恶化,使性能指标异常检测更灵敏,同时缩短故障处理时长。
本发明实施例使用数据统计的箱线图法和基于时序预测的prophet算法,基于Python开发,100%代码自研发;掌握源代码,迭代开发和后续维护便利,本发明实施例的KPI异常检测方法部署在容器环境中,并由Kubernetes托管,可以根据自身性能进行弹性的扩缩容,具有守护进程,当业务进程异常时守护进程清理容器环境并重新拉起一个新的容器,保障该KPI异常检测方法稳定运行。
本发明实施例通过获取KPI指标数据,并进行预处理;根据所述KPI指标数据应用预设的异常检测模型动态获取异常门限;根据所述异常门限判断所述KPI指标数据是否异常,能够提升故障发现和定位能力,使性能指标异常检测更灵敏。
图7示出了本发明实施例的KPI异常检测装置的结构示意图。如图7所示,该KPI异常检测装置包括:数据获取单元701、门限获取单元702、异常检测单元703以及模型训练单元704。其中:
数据获取单元701用于获取KPI指标数据,并进行预处理;门限获取单元702用于根据所述KPI指标数据应用预设的异常检测模型动态获取异常门限;异常检测单元703用于根据所述异常门限判断所述KPI指标数据是否异常。
在一种可选的方式中,所述异常检测模型为箱线图模型和/或时序预测算法模型。
在一种可选的方式中,模型训练单元704用于:根据历史KPI指标数据应用所述异常检测模型输出异常门限;根据所述异常门限检测所述历史KPI指标数据中的异常KPI指标数据;对比所述异常KPI指标数据与实际异常KPI指标数据,并根据对比结果调整所述异常检测模型的模型参数;应用调整后的所述模型参数对应的所述异常检测模型对所述历史KPI指标数据进行迭代训练,直至所述异常KPI指标数据与实际异常KPI指标数据相近。
在一种可选的方式中,所述异常检测模型为箱线图模型时,模型训练单元704用于:将所述历史KPI指标数据按数值大小顺序排列;将排列好的所述历史KPI指标数据进行四分位划分;根据四分位数、箱体长度以及模型参数计算所述异常门限。
在一种可选的方式中,模型训练单元704用于:上限计算为上四分位数+n*箱体长度;下限计算为下四分位数-n*箱体长度,其中n为所述模型参数,所述箱体长度为四分位距。
在一种可选的方式中,所述异常检测模型为时序预测算法模型时,模型训练单元704用于:对所述历史KPI指标数据基于时间序列进行分解;将整体时间序列分解为趋势成分、周期成分、节假日成分和噪声成分四部分序列分别进行拟合;根据拟合后的时间序列统计所述异常门限。
在一种可选的方式中,异常检测单元703还用于:将异常的所述KPI指标数据以短信形式发送给维护人员以进行异常标注。
本发明实施例通过获取KPI指标数据,并进行预处理;根据所述KPI指标数据应用预设的异常检测模型动态获取异常门限;根据所述异常门限判断所述KPI指标数据是否异常,能够提升故障发现和定位能力,使性能指标异常检测更灵敏。
本发明实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的KPI异常检测方法。
可执行指令具体可以用于使得处理器执行以下操作:
获取KPI指标数据,并进行预处理;
根据所述KPI指标数据应用预设的异常检测模型动态获取异常门限;
根据所述异常门限判断所述KPI指标数据是否异常。
在一种可选的方式中,所述异常检测模型为箱线图模型和/或时序预测算法模型。
在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:
根据历史KPI指标数据应用所述异常检测模型输出异常门限;
根据所述异常门限检测所述历史KPI指标数据中的异常KPI指标数据;
对比所述异常KPI指标数据与实际异常KPI指标数据,并根据对比结果调整所述异常检测模型的模型参数;
应用调整后的所述模型参数对应的所述异常检测模型对所述历史KPI指标数据进行迭代训练,直至所述异常KPI指标数据与实际异常KPI指标数据相近。
在一种可选的方式中,所述异常检测模型为箱线图模型时,所述可执行指令使所述处理器执行以下操作:
将所述历史KPI指标数据按数值大小顺序排列;
将排列好的所述历史KPI指标数据进行四分位划分;
根据四分位数、箱体长度以及模型参数计算所述异常门限。
在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:
上限计算为上四分位数+n*箱体长度;
下限计算为下四分位数-n*箱体长度,其中n为所述模型参数,所述箱体长度为四分位距。
在一种可选的方式中,所述异常检测模型为时序预测算法模型时,所述可执行指令使所述处理器执行以下操作:
对所述历史KPI指标数据基于时间序列进行分解;
将整体时间序列分解为趋势成分、周期成分、节假日成分和噪声成分四部分序列分别进行拟合;
根据拟合后的时间序列统计所述异常门限。
在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:
将异常的所述KPI指标数据以短信形式发送给维护人员以进行异常标注。
本发明实施例通过获取KPI指标数据,并进行预处理;根据所述KPI指标数据应用预设的异常检测模型动态获取异常门限;根据所述异常门限判断所述KPI指标数据是否异常,能够提升故障发现和定位能力,使性能指标异常检测更灵敏。
本发明实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在计算机存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述任意方法实施例中的KPI异常检测方法。
可执行指令具体可以用于使得处理器执行以下操作:
获取KPI指标数据,并进行预处理;
根据所述KPI指标数据应用预设的异常检测模型动态获取异常门限;
根据所述异常门限判断所述KPI指标数据是否异常。
在一种可选的方式中,所述异常检测模型为箱线图模型和/或时序预测算法模型。
在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:
根据历史KPI指标数据应用所述异常检测模型输出异常门限;
根据所述异常门限检测所述历史KPI指标数据中的异常KPI指标数据;
对比所述异常KPI指标数据与实际异常KPI指标数据,并根据对比结果调整所述异常检测模型的模型参数;
应用调整后的所述模型参数对应的所述异常检测模型对所述历史KPI指标数据进行迭代训练,直至所述异常KPI指标数据与实际异常KPI指标数据相近。
在一种可选的方式中,所述异常检测模型为箱线图模型时,所述可执行指令使所述处理器执行以下操作:
将所述历史KPI指标数据按数值大小顺序排列;
将排列好的所述历史KPI指标数据进行四分位划分;
根据四分位数、箱体长度以及模型参数计算所述异常门限。
在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:
上限计算为上四分位数+n*箱体长度;
下限计算为下四分位数-n*箱体长度,其中n为所述模型参数,所述箱体长度为四分位距。
在一种可选的方式中,所述异常检测模型为时序预测算法模型时,所述可执行指令使所述处理器执行以下操作:
对所述历史KPI指标数据基于时间序列进行分解;
将整体时间序列分解为趋势成分、周期成分、节假日成分和噪声成分四部分序列分别进行拟合;
根据拟合后的时间序列统计所述异常门限。
在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:
将异常的所述KPI指标数据以短信形式发送给维护人员以进行异常标注。
本发明实施例通过获取KPI指标数据,并进行预处理;根据所述KPI指标数据应用预设的异常检测模型动态获取异常门限;根据所述异常门限判断所述KPI指标数据是否异常,能够提升故障发现和定位能力,使性能指标异常检测更灵敏。
图8示出了本发明实施例提供的计算设备的结构示意图,本发明具体实施例并不对设备的具体实现做限定。
如图8所示,该计算设备可以包括:处理器(processor)802、通信接口(Communications Interface)804、存储器(memory)806、以及通信总线808。
其中:处理器802、通信接口804、以及存储器806通过通信总线808完成相互间的通信。通信接口804,用于与其它设备比如客户端或其它服务器等的网元通信。处理器802,用于执行程序810,具体可以执行上述KPI异常检测方法实施例中的相关步骤。
具体地,程序810可以包括程序代码,该程序代码包括计算机操作指令。
处理器802可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或各个集成电路。设备包括的一个或各个处理器,可以是同一类型的处理器,如一个或各个CPU;也可以是不同类型的处理器,如一个或各个CPU以及一个或各个ASIC。
存储器806,用于存放程序810。存储器806可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序810具体可以用于使得处理器802执行以下操作:
获取KPI指标数据,并进行预处理;
根据所述KPI指标数据应用预设的异常检测模型动态获取异常门限;
根据所述异常门限判断所述KPI指标数据是否异常。
在一种可选的方式中,所述异常检测模型为箱线图模型和/或时序预测算法模型。
在一种可选的方式中,所述程序810使所述处理器执行以下操作:
根据历史KPI指标数据应用所述异常检测模型输出异常门限;
根据所述异常门限检测所述历史KPI指标数据中的异常KPI指标数据;
对比所述异常KPI指标数据与实际异常KPI指标数据,并根据对比结果调整所述异常检测模型的模型参数;
应用调整后的所述模型参数对应的所述异常检测模型对所述历史KPI指标数据进行迭代训练,直至所述异常KPI指标数据与实际异常KPI指标数据相近。
在一种可选的方式中,所述异常检测模型为箱线图模型时,所述程序810使所述处理器执行以下操作:
将所述历史KPI指标数据按数值大小顺序排列;
将排列好的所述历史KPI指标数据进行四分位划分;
根据四分位数、箱体长度以及模型参数计算所述异常门限。
在一种可选的方式中,所述程序810使所述处理器执行以下操作:
上限计算为上四分位数+n*箱体长度;
下限计算为下四分位数-n*箱体长度,其中n为所述模型参数,所述箱体长度为四分位距。
在一种可选的方式中,所述异常检测模型为时序预测算法模型时,所述程序810使所述处理器执行以下操作:
对所述历史KPI指标数据基于时间序列进行分解;
将整体时间序列分解为趋势成分、周期成分、节假日成分和噪声成分四部分序列分别进行拟合;
根据拟合后的时间序列统计所述异常门限。
在一种可选的方式中,所述程序810使所述处理器执行以下操作:
将异常的所述KPI指标数据以短信形式发送给维护人员以进行异常标注。
本发明实施例通过获取KPI指标数据,并进行预处理;根据所述KPI指标数据应用预设的异常检测模型动态获取异常门限;根据所述异常门限判断所述KPI指标数据是否异常,能够提升故障发现和定位能力,使性能指标异常检测更灵敏。
在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。

Claims (10)

1.一种KPI异常检测方法,其特征在于,所述方法包括:
获取KPI指标数据,并进行预处理;
根据所述KPI指标数据应用预设的异常检测模型动态获取异常门限;
根据所述异常门限判断所述KPI指标数据是否异常。
2.根据权利要求1所述的方法,其特征在于,所述异常检测模型为箱线图模型和/或时序预测算法模型。
3.根据权利要求1所述的方法,其特征在于,所述根据所述KPI指标数据应用预设的异常检测模型动态获取异常门限之前,包括:
根据历史KPI指标数据应用所述异常检测模型输出异常门限;
根据所述异常门限检测所述历史KPI指标数据中的异常KPI指标数据;
对比所述异常KPI指标数据与实际异常KPI指标数据,并根据对比结果调整所述异常检测模型的模型参数;
应用调整后的所述模型参数对应的所述异常检测模型对所述历史KPI指标数据进行迭代训练,直至所述异常KPI指标数据与实际异常KPI指标数据相近。
4.根据权利要求3所述的方法,其特征在于,所述异常检测模型为箱线图模型时,所述根据历史KPI指标数据对所述异常检测模型进行训练输出异常门限,包括:
将所述历史KPI指标数据按数值大小顺序排列;
将排列好的所述历史KPI指标数据进行四分位划分;
根据四分位数、箱体长度以及模型参数计算所述异常门限。
5.根据权利要求4所述的方法,其特征在于,所述根据四分位数、箱体长度以及模型参数计算所述异常门限,包括:
上限计算为上四分位数+n*箱体长度;
下限计算为下四分位数-n*箱体长度,其中n为所述模型参数,所述箱体长度为四分位距。
6.根据权利要求3所述的方法,其特征在于,所述异常检测模型为时序预测算法模型时,所述根据历史KPI指标数据对所述异常检测模型进行训练输出异常门限,包括:
对所述历史KPI指标数据基于时间序列进行分解;
将整体时间序列分解为趋势成分、周期成分、节假日成分和噪声成分四部分序列分别进行拟合;
根据拟合后的时间序列统计所述异常门限。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将异常的所述KPI指标数据以短信形式发送给维护人员以进行异常标注。
8.一种KPI异常检测装置,其特征在于,所述装置包括:
数据获取单元,用于获取KPI指标数据,并进行预处理;
门限获取单元,用于根据所述KPI指标数据应用预设的异常检测模型动态获取异常门限;
异常检测单元,用于根据所述异常门限判断所述KPI指标数据是否异常。
9.一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行根据权利要求1-7任一项所述KPI异常检测方法的步骤。
10.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行根据权利要求1-7任一项所述KPI异常检测方法的步骤。
CN202010796082.0A 2020-08-10 2020-08-10 Kpi异常检测方法、装置、计算设备及计算机存储介质 Pending CN114095337A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010796082.0A CN114095337A (zh) 2020-08-10 2020-08-10 Kpi异常检测方法、装置、计算设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010796082.0A CN114095337A (zh) 2020-08-10 2020-08-10 Kpi异常检测方法、装置、计算设备及计算机存储介质

Publications (1)

Publication Number Publication Date
CN114095337A true CN114095337A (zh) 2022-02-25

Family

ID=80295361

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010796082.0A Pending CN114095337A (zh) 2020-08-10 2020-08-10 Kpi异常检测方法、装置、计算设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN114095337A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110032480A (zh) * 2019-01-17 2019-07-19 阿里巴巴集团控股有限公司 一种服务器异常检测方法、装置及设备
CN110069810A (zh) * 2019-03-11 2019-07-30 北京百度网讯科技有限公司 电池故障预测方法、装置、设备和可读存储介质
CN110888788A (zh) * 2019-10-16 2020-03-17 平安科技(深圳)有限公司 异常检测方法、装置、计算机设备及存储介质
CN111177505A (zh) * 2019-12-31 2020-05-19 中国移动通信集团江苏有限公司 指标异常检测模型的训练方法、推荐的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110032480A (zh) * 2019-01-17 2019-07-19 阿里巴巴集团控股有限公司 一种服务器异常检测方法、装置及设备
CN110069810A (zh) * 2019-03-11 2019-07-30 北京百度网讯科技有限公司 电池故障预测方法、装置、设备和可读存储介质
CN110888788A (zh) * 2019-10-16 2020-03-17 平安科技(深圳)有限公司 异常检测方法、装置、计算机设备及存储介质
CN111177505A (zh) * 2019-12-31 2020-05-19 中国移动通信集团江苏有限公司 指标异常检测模型的训练方法、推荐的方法及装置

Similar Documents

Publication Publication Date Title
WO2020259421A1 (zh) 一种业务系统的监控方法及装置
CN112162878B (zh) 数据库故障发现方法、装置、电子设备及存储介质
CN108073497B (zh) 一种基于数据中心数据采集平台的多指标异动分析方法
CN111143102B (zh) 异常数据检测方法、装置、存储介质及电子设备
US10592308B2 (en) Aggregation based event identification
US20190228296A1 (en) Significant events identifier for outlier root cause investigation
CN110647446B (zh) 一种日志故障关联与预测方法、装置、设备及存储介质
CN110362612B (zh) 由电子设备执行的异常数据检测方法、装置和电子设备
CN108491305A (zh) 一种服务器故障的检测方法及系统
CN109933500A (zh) 设备故障告警方法、装置、可读介质及电子设备
CN111177485B (zh) 基于参数规则匹配设备故障的预测方法、设备及介质
US20190228353A1 (en) Competition-based tool for anomaly detection of business process time series in it environments
CN113313280B (zh) 云平台的巡检方法、电子设备及非易失性存储介质
CN113190426B (zh) 一种大数据评分系统稳定性监控方法
CN108306997B (zh) 域名解析监控方法及装置
CN112884159A (zh) 模型更新系统、模型更新方法及相关设备
CN114610561A (zh) 系统监测方法、装置、电子设备及计算机可读存储介质
CN115622867A (zh) 一种工控系统安全事件预警分类方法及系统
CN114138601A (zh) 一种业务告警方法、装置、设备及存储介质
JP2023520066A (ja) 産業用機械学習のためのデータ処理
CN114095337A (zh) Kpi异常检测方法、装置、计算设备及计算机存储介质
CN108170825B (zh) 基于云平台的分布式能源数据监控清洗方法
CN110928942A (zh) 指标数据监控管理方法及装置
WO2023111392A1 (en) Method and system for modifying state of device using detected anomalous behavior
Torikka et al. Predictive Maintenance Service Powered by Machine Learning and Big Data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination