CN115168159A - 异常检测方法、装置、电子设备及存储介质 - Google Patents

异常检测方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN115168159A
CN115168159A CN202211083995.3A CN202211083995A CN115168159A CN 115168159 A CN115168159 A CN 115168159A CN 202211083995 A CN202211083995 A CN 202211083995A CN 115168159 A CN115168159 A CN 115168159A
Authority
CN
China
Prior art keywords
data
quartile
service
sequence
time period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211083995.3A
Other languages
English (en)
Inventor
邓丽平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202211083995.3A priority Critical patent/CN115168159A/zh
Publication of CN115168159A publication Critical patent/CN115168159A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开关于一种异常检测方法、装置、电子设备及存储介质,所述异常检测方法包括:获取服务在过去时间段上的调用数据时间序列,所述调用数据时间序列反映服务在所述过去时间段上的被调用情况;通过指数平滑算法对所述调用数据时间序列进行处理,得到预测的服务在当前时间段上的被调用情况的预测时间序列;基于所述调用数据时间序列和所述预测时间序列之间的差异,确定残差序列;根据残差序列中的数据分布情况,确定误差限度;基于所述预测时间序列、所述误差限度和服务在当前时间段上的调用数据,确定服务在当前时间段上的调用情况是否存在异常。根据本公开示出的异常检测方法、装置、电子设备及存储介质,可提高异常检测的准确性。

Description

异常检测方法、装置、电子设备及存储介质
技术领域
本公开涉及异常检测领域,更具体地说,涉及一种异常检测方法、装置、电子设备及存储介质。
背景技术
对于为大量用户提供大量业务的平台而言,为保障业务的稳定性,通常需要对整个平台的服务被调情况进行巡检,而为保证巡检的有效性,需要实时准确地检测出发生异常的服务并优先展示,从而使巡检人员能够及时定位故障服务并尽快采取措施。
发明内容
本公开提供一种异常检测方法、装置、电子设备及存储介质,以至少解决上述相关技术中的问题。
根据本公开实施例的第一方面,提供一种异常检测方法,包括:获取服务在过去时间段上的调用数据时间序列,所述调用数据时间序列反映所述服务在所述过去时间段上的被调用情况;通过指数平滑算法对所述调用数据时间序列进行处理,得到预测的所述服务在当前时间段上的被调用情况的预测时间序列;基于所述调用数据时间序列和所述预测时间序列之间的差异,确定残差序列;根据所述残差序列中的数据分布情况,确定误差限度,所述误差限度用于确定所述预测时间序列所反映的所述服务的被调用情况与所述服务在当前时间段上的真实被调用情况之间的允许误差;基于所述预测时间序列、所述误差限度和所述服务在当前时间段上的调用数据,确定所述服务在当前时间段上的调用情况是否存在异常。
可选地,所述调用数据时间序列为具有周期性和趋势性的时间序列。
可选地,所述通过指数平滑算法对所述调用数据时间序列进行处理,包括:通过Holt-Winters三阶指数平滑算法对所述调用数据时间序列进行处理。
可选地,所述Holt-Winters三阶指数平滑算法包括平滑方程和预测方程,所述通过Holt-Winters三阶指数平滑算法对所述调用数据时间序列进行处理,包括:通过所述平滑方程对所述调用数据时间序列中的每个调用数据进行平滑处理,得到平滑时间序列;通过所述预测方程对所述平滑时间序列中的每个平滑数据进行数学统计处理,得到预测的所述服务在当前时间段上的被调用情况的预测时间序列。
可选地,所述平滑方程包括平滑因子,所述平滑因子用于衡量所述平滑时间序列中的每个平滑数据对所对应的所述调用数据时间序列中的每个调用数据的倾向程度。
可选地,所述平滑因子是通过使所述调用数据时间序列和所述预测时间序列之间的损失函数最小化的方式而得到的。
可选地,所述根据所述残差序列中的数据分布情况,确定误差限度,包括:将所述残差序列中的数据按照从小到大的顺序排列,得到排序后的残差序列;确定所述排序后的残差序列的第一四分位数和第三四分位数,其中,所述第一四分位数为处于所述排序后的残差序列的四分之一位置的数据,所述第三四分位数为处于所述排序后的残差序列的四分之三位置的数据;根据所述第一四分位数和所述第三四分位数,确定所述误差限度。
可选地,所述根据所述第一四分位数和所述第三四分位数,确定所述误差限度,包括:根据所述第一四分位数和所述第三四分位数,确定四分位距,所述四分位距为所述第一四分位数和所述第三四分位数之间的差距;根据所述第一四分位数和所述四分位距,确定所述误差限度的下限;根据所述第三四分位数和所述四分位距,确定所述误差限度的上限。
可选地,所述基于所述预测时间序列、所述误差限度和所述服务在当前时间段上的调用数据,确定所述服务在当前时间段上的调用情况是否存在异常,包括:根据所述预测时间序列和所述误差限度,确定允许区间,所述允许区间用于限定所述服务在当前时间段上的调用情况的波动范围;在所述服务在当前时间段上的调用数据处于所述允许区间之外的情况下,确定所述服务在当前时间段上的调用情况存在异常。
根据本公开实施例的第二方面,提供一种异常检测装置,包括:数据获取单元,被配置为:获取服务在过去时间段上的调用数据时间序列,所述调用数据时间序列反映所述服务在所述过去时间段上的被调用情况;数据处理单元,被配置为:通过指数平滑算法对所述调用数据时间序列进行处理,得到预测的所述服务在当前时间段上的被调用情况的预测时间序列;残差序列确定单元,被配置为:基于所述调用数据时间序列和所述预测时间序列之间的差异,确定残差序列;误差限度确定单元,被配置为:根据所述残差序列中的数据分布情况,确定误差限度,所述误差限度用于确定所述预测时间序列所反映的所述服务的被调用情况与所述服务在当前时间段上的真实被调用情况之间的允许误差;异常确定单元,被配置为:基于所述预测时间序列、所述误差限度和所述服务在当前时间段上的调用数据,确定所述服务在当前时间段上的调用情况是否存在异常。
可选地,所述调用数据时间序列为具有周期性和趋势性的时间序列。
可选地,所述数据处理单元可被配置为通过Holt-Winters三阶指数平滑算法对所述调用数据时间序列进行处理。
可选地,所述Holt-Winters三阶指数平滑算法包括平滑方程和预测方程,所述数据处理单元可被配置为通过所述平滑方程对所述调用数据时间序列中的每个调用数据进行平滑处理,得到平滑时间序列;通过所述预测方程对所述平滑时间序列中的每个平滑数据进行数学统计处理,得到预测的所述服务在当前时间段上的被调用情况的预测时间序列。
可选地,所述平滑方程包括平滑因子,所述平滑因子用于衡量所述平滑时间序列中的每个平滑数据对所对应的所述调用数据时间序列中的每个调用数据的倾向程度。
可选地,所述平滑因子是通过使所述调用数据时间序列和所述预测时间序列之间的损失函数最小化的方式而得到的。
可选地,所述误差限度确定单元可被配置为将所述残差序列中的数据按照从小到大的顺序排列,得到排序后的残差序列;确定所述排序后的残差序列的第一四分位数和第三四分位数,其中,所述第一四分位数为处于所述排序后的残差序列的四分之一位置的数据,所述第三四分位数为处于所述排序后的残差序列的四分之三位置的数据;根据所述第一四分位数和所述第三四分位数,确定所述误差限度。
可选地,所述误差限度确定单元可被配置为根据所述第一四分位数和所述第三四分位数,确定四分位距,所述四分位距为所述第一四分位数和所述第三四分位数之间的差距;根据所述第一四分位数和所述四分位距,确定所述误差限度的下限;根据所述第三四分位数和所述四分位距,确定所述误差限度的上限。
可选地,所述异常确定单元可被配置为根据所述预测时间序列和所述误差限度,确定允许区间,所述允许区间用于限定所述服务在当前时间段上的调用情况的波动范围;在所述服务在当前时间段上的调用数据处于所述允许区间之外的情况下,确定所述服务在当前时间段上的调用情况存在异常。
根据本公开实施例的第三方面,提供一种电子设备,包括:至少一个处理器;至少一个存储计算机可执行指令的存储器,其中,所述计算机可执行指令在被所述至少一个处理器运行时,促使所述至少一个处理器执行根据本公开的异常检测方法。
根据本公开实施例的第四方面,提供一种存储指令的计算机可读存储介质,当所述指令被至少一个处理器运行时,促使所述至少一个处理器执行根据本公开的异常检测方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,该计算机程序产品中的指令可由计算机设备的处理器执行以完成根据本公开的异常检测方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
根据本公开的异常检测方法、装置、电子设备及存储介质,采用指数平滑算法来预测服务在当前时间段上的被调用情况,并基于预测得到的预测时间序列和在过去时间段上的调用数据时间序列确定误差限度,基于预测时间序列、误差限度和服务在当前时间段上的调用数据确定服务在当前时间段上的调用情况是否存在异常,由于通过指数平滑算法生成的预测是服务在过去时间段上的所有实际被调数据的加权平均值,并且随着过去实际被调数据离预测数据距离的增大,权重呈指数型衰减(即,距离预测数据越远,对预测数据的贡献度越低),因此通过指数平滑算法生成的预测准确性更高,从而基于预测时间序列进行异常检测的准确性更高;另外,由于基于根据残差序列中的数据分布情况而确定的误差限度来确定是否存在异常,因此异常的确定过程受异常调用数据的影响比较小,进一步提高了异常检测的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是示出根据本公开的示例性实施例的异常检测方法的流程图。
图2是示出根据本公开的示例性实施例的商品交易服务的QPS(Query PerSecond,每秒查询率)数据的示意图。
图3是示出根据本公开的示例性实施例的误差限度的示意图。
图4是示出根据本公开的示例性实施例的异常检测装置的框图。
图5是示出根据本公开的示例性实施例的电子设备500的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
在此需要说明的是,在本公开中出现的“若干项之中的至少一项”均表示包含“该若干项中的任意一项”、“该若干项中的任意多项的组合”、“该若干项的全体”这三类并列的情况。例如“包括A和B之中的至少一个”即包括如下三种并列的情况:(1)包括A;(2)包括B;(3)包括A和B。又例如“执行步骤一和步骤二之中的至少一个”,即表示如下三种并列的情况:(1)执行步骤一;(2)执行步骤二;(3)执行步骤一和步骤二。
相关技术中的异常检测算法通常分为两类,其一为分类算法,其二为预测算法。在使用分类算法时,将每个时间点标记为异常或非异常,然后通过分类算法对每个时间点进行分类,由于需要对历史数据的异常与否状况进行人工标注,因此对人为判断的依赖程度偏高;在使用预测算法时,首先预测某个时间点的数据,然后根据该时间点的实际值与预测值的差判断该点是否存在异常。例如,在监控平台服务的被调情况时存在一种预测算法,以一天为一个周期,采用简单移动平均法,对平台服务的环比数据临近值取平均作为预测值,其具体思路为:若要确定某服务在今日Tt时刻的调用成功数是否存在异常,则可以通过昨天的Tt时刻之前的预设数目个样本值来预测今日Tt时刻的调用成功数,并根据昨天的样本值计算出标准差和均值,通过将今日Tt时刻的调用成功数的真实值与预测值通过3-sigma准则(3σ准则,又称拉依达准则,其先假设一组检测数据只包括随机误差,对该组检测数据进行计算处理得到标准偏差,然后以标准偏差和均值按照一定规则确定一个区间,认为凡超过这个区间的误差,就不属于随机误差而是粗大误差,含有该误差的数据应予以剔除)进行比较,来判断该服务在今日该时刻的调用成功数是否存在异常,其中,某服务在今日Tt时刻的调用成功数的预测值=(昨日Tt-1时刻成功数 + 昨日Tt-2时刻成功数 + 昨日Tt-3时刻成功数 + 昨日Tt-4时刻成功数 + 昨日Tt-5时刻成功数)/ 5。但该方案至少存在如下问题:移动平均值并不能总是很好地反映出服务调用数据的特点(例如,被调用数据可能存在随时间向上升或向下降的趋势等),另外,由于是对过去的数据取平均,预测值总是停留在过去的水平上而无法预计会导致将来更高或更低的波动;并且,3-sigma准则得以实施的前提是数据呈现近似正态的分布,但服务的调用成功数的分布一般不符合近似正态分布;此外,均值和标准差的计算用到了样本区间的全部数据,受异常数据的影响较大,因此,采用本方案进行异常检测的准确性偏低。
为解决异常检测的准确性偏低的技术问题,本公开提出一种异常检测方法、装置、电子设备及存储介质,具体来讲,采用指数平滑算法来预测服务在当前时间段上的被调用情况,并基于预测得到的预测时间序列和在过去时间段上的调用数据时间序列确定误差限度,基于预测时间序列、该误差限度和服务在当前时间段上的调用数据确定服务在当前时间段上的调用情况是否存在异常,由于通过指数平滑算法生成的预测是服务在过去时间段上的所有实际被调数据的加权平均值,并且随着过去实际被调数据离预测数据距离的增大,权重呈指数型衰减(即,距离预测数据越远,对预测数据的贡献度越低),因此通过指数平滑算法生成的预测准确性更高,从而基于预测时间序列进行异常检测的准确性更高;另外,由于基于根据残差序列中的数据分布情况而确定的误差限度来确定是否存在异常,因此异常的确定过程受异常调用数据的影响比较小,进一步提高了异常检测的准确性。下面,将参照图1至图5具体描述根据本公开的示例性实施例的数据处理方法、装置、电子设备及存储介质。
首先需要说明的是,本公开的异常检测方法可用于检测平台中各种服务的被调用情况是否存在异常。在一个实施例中,本公开示出的异常检测方法可由计算机、笔记本电脑、智能手机、平板电脑、可穿戴设备、车载设备等执行,在另一个实施例中,本公开示出的异常检测方法也可由具备计算能力的芯片执行,本公开对具体的执行设备不作限制。
图1是示出根据本公开的示例性实施例的异常检测方法的流程图。
参照图1,在步骤101,获取服务在过去时间段上的调用数据时间序列,该调用数据时间序列反映服务在过去时间段上的被调用情况。
具体来讲,服务的被调用情况随着时间的发生而呈现不同的表现,将服务的被调用情况按照时间发生的先后顺序进行排列,可以得到服务在过去时间段(例如,在当前时刻之前的几个小时、一天、一周、一个月、一年等)上的调用数据时间序列。
根据本公开的示例性实施例,该调用数据时间序列为具有周期性和趋势性的时间序列。具体而言,周期性是指受服务特点的影响,服务的被调用情况在时间尺度上按照日、周、月、年等周期呈现周期性变化,趋势性是指服务的被调用情况在时间尺度上呈线性或指数型递增或下降的趋势,例如,图2是示出根据本公开的示例性实施例的商品交易服务的QPS(Query Per Second,每秒查询率)数据的示意图,参照图2,展示了2022.03.12 00:00 -2022.03.14 00:00之间的QPS数据,其中,凌晨00:00-06:00属于QPS低峰期,早上8:00左右出现一个早高峰(即,6:00-8:00 QPS数据呈现上升趋势),晚上20:00-22:00左右又出现一个晚高峰,22:00-00:00 QPS数据呈现下降趋势,变化情况以一天为周期。分别以一天,七天,三十天为一个周期观察环比数据,可以发现,随着时间的迁移,环比数据也在发生变化,其基本趋势是同一时刻的QPS数据随着周期内天数的减少而逐渐降低。
在步骤102,通过指数平滑算法对该调用数据时间序列进行处理,得到预测的服务在当前时间段上的被调用情况的预测时间序列。这里,当前时间段的时间长度与前述的过去时间段的时间长度一致,例如,若过去时间段为昨天全天的时间,则当前时间段为今天全天的时间。
指数平滑算法的处理逻辑是对服务在当前时间段上的预测值是服务在过去时间段上的所有观测值的加权平均值,并且随着过去观测值离预测值距离的增大,权重呈指数型衰减(即,过去观测值距离预测值越远,对预测值的贡献度越低),因此通过指数平滑算法生成的预测值的准确性更高,从而基于预测时间序列进行异常检测的准确性更高。可根据调用数据时间序列的特点,采用不同的指数平滑算法来得到服务在当前时间段上的预测时间序列,例如,若调用数据时间序列既没有周期性,也没有趋势性,可采用简单指数平滑算法,在一个实施例中,简单指数平滑算法,例如,但不限于,可被表示为:
Figure 89505DEST_PATH_IMAGE001
(1)
其中,
Figure 424321DEST_PATH_IMAGE002
是数据平滑因子,且
Figure 759488DEST_PATH_IMAGE003
;平滑统计值
Figure 426092DEST_PATH_IMAGE004
是服务调用数据在过去时间段上的真实值
Figure 957437DEST_PATH_IMAGE005
Figure 455414DEST_PATH_IMAGE006
时刻之前的平滑统计值
Figure 633586DEST_PATH_IMAGE007
的加权平均值。当
Figure 849804DEST_PATH_IMAGE002
越大时,调用数据时间序列的平滑度越低,当
Figure 420724DEST_PATH_IMAGE008
时,预测时间序列为服务在过去时间段上的真实调用数据时间序列。
若调用时间序列具有趋势性而无周期性,则可采用二阶指数平滑算法来得到服务在当前时间段上的预测时间序列,二阶指数平滑算法将调用数据时间序列的baseline(对调用数据时间序列水平部分的估计)和趋势性(对调用数据时间序列的趋势的估计)纳入考虑。在一个实施例中,二阶指数平滑算法,例如,但不限于,可被表示为:
Figure 773208DEST_PATH_IMAGE009
(2)
Figure 919019DEST_PATH_IMAGE010
(3)
其中,
Figure 356953DEST_PATH_IMAGE002
是水平平滑因子;
Figure 698942DEST_PATH_IMAGE011
是趋势平滑因子;
Figure 171512DEST_PATH_IMAGE005
是服务调用数据在过去时间段上的真实值;
Figure 222644DEST_PATH_IMAGE004
是水平平滑统计值;
Figure 567782DEST_PATH_IMAGE012
是对服务调用数据在过去时间段上的趋势的估计。
在二阶指数平滑算法中,基于
Figure 792089DEST_PATH_IMAGE006
时刻对
Figure 56849DEST_PATH_IMAGE013
时刻的预测方程,例如,但不限于,可被表示为:
Figure 341200DEST_PATH_IMAGE014
(4)
其中,公式(4)中各项参数的含义与公式(2)和(3)中的各项参数相同,在此不再赘述。
三阶指数平滑算法可用于处理既有趋势性又具有周期性的调用时间序列。根据本公开的示例性实施例,可通过Holt-Winters三阶指数平滑算法对调用数据时间序列进行处理,以保留调用数据时间序列中各调用数据的周期信息和趋势信息,并快速适应调用时间序列可能出现的趋势或周期发生变化的情况,由于更符合真实的数据场景,因此处理得到的预测时间序列可以更好地反映出调用数据本身具有的特点。具体来讲,Holt-Winters三阶指数平滑算法包括平滑方程和预测方程,可通过平滑方程对服务在过去时间段上的调用数据时间序列中的每个调用数据进行平滑处理,得到平滑时间序列,并通过预测方程对该平滑时间序列中的每个平滑数据进行数学统计处理,得到预测的服务在当前时间段上的被调用情况的预测时间序列。一个实施例中,平滑方程包括平滑因子,该平滑因子可用于衡量平滑时间序列中的每个平滑数据对所对应的服务在过去时间段上的调用数据时间序列中的每个调用数据的倾向程度,此外,平滑因子是决定预测时间序列准确性的关键参数,可通过使服务在过去时间段上的调用数据时间序列和前述的预测时间序列之间的损失函数最小化的方式而得到该平滑因子,由于以在过去时间段上的调用数据时间序列和预测时间序列之间的损失最小化为目标来不断尝试和修正,因此最终得到的平滑因子的可信度更高,进而,基于平滑因子而计算平滑方程,其计算准确性也更高。这里,预测方程,例如,但不限于,可被表示为:
Figure 206256DEST_PATH_IMAGE015
(5)
其中,
Figure 968676DEST_PATH_IMAGE016
表示基于
Figure 822362DEST_PATH_IMAGE006
时刻对
Figure 277614DEST_PATH_IMAGE017
时刻的调用数据进行预测的预测值;
Figure 131432DEST_PATH_IMAGE018
表示调用数据时间序列的水平平均状态;
Figure 697543DEST_PATH_IMAGE019
表示调用数据时间序列的趋势;
Figure 671315DEST_PATH_IMAGE020
表示调用数据时间序列的周期性分量。
平滑方程,例如,但不限于,可包括三个,并可分别被表示为:
Figure 297468DEST_PATH_IMAGE021
(6)
Figure 605959DEST_PATH_IMAGE022
(7)
Figure 913443DEST_PATH_IMAGE023
(8)
其中,公式(6)为水平方程,表示针对服务在过去时间段上的整体调用数据的平滑,其在水平和趋势的基础上加入对周期性的调整(通过直接减去周期性指数
Figure 69618DEST_PATH_IMAGE024
,来去除周期性的影响),
Figure 280720DEST_PATH_IMAGE018
表示调用数据时间序列的水平平均状态,其通过
Figure 889556DEST_PATH_IMAGE006
时刻去掉周期性的影响之后的调用数据
Figure 266311DEST_PATH_IMAGE025
Figure 276992DEST_PATH_IMAGE006
前一时刻的去掉周期性的影响之后的调用数据
Figure 431899DEST_PATH_IMAGE026
之间的加权平均来得到;公式(7)为趋势方程,其主要在于修正调用数据的趋势在最近两次平滑值之间的差异,也就是说,
Figure 528031DEST_PATH_IMAGE019
是连续两次平滑值
Figure 646159DEST_PATH_IMAGE018
Figure 776926DEST_PATH_IMAGE027
之间的差值和
Figure 869779DEST_PATH_IMAGE006
前一时刻趋势的估计值
Figure 453207DEST_PATH_IMAGE028
的加权平均;公式(8)为周期性方程,对调用数据的周期性进行平滑所采取的方法是用
Figure 640605DEST_PATH_IMAGE006
时刻的前一个周期数据
Figure 625879DEST_PATH_IMAGE024
对本周期进行调整,
Figure 122588DEST_PATH_IMAGE004
表示当前周期性指数
Figure 193312DEST_PATH_IMAGE029
与前一个周期数据
Figure 246719DEST_PATH_IMAGE024
的加权平均;
Figure 24182DEST_PATH_IMAGE002
Figure 504842DEST_PATH_IMAGE030
Figure 217190DEST_PATH_IMAGE011
分别为水平平滑因子,趋势平滑因子和周期平滑因子,其取值都在[0, 1]区间内。
根据本公开的示例性实施例,服务在过去时间段上的调用数据时间序列和前述的预测时间序列之间的损失函数,例如,但不限于,可被表示为:
Figure 74287DEST_PATH_IMAGE031
(9)
其中,
Figure 971836DEST_PATH_IMAGE005
表示服务在过去时间段上的真实调用数据;
Figure 623397DEST_PATH_IMAGE032
表示预测的服务在当前时间段上的调用数据,通过最小化该损失函数可得到
Figure 855665DEST_PATH_IMAGE002
Figure 250874DEST_PATH_IMAGE030
Figure 799667DEST_PATH_IMAGE011
的估计值,此外,也可使用服务在过去时间段上的调用数据进行多次尝试来得到
Figure 825392DEST_PATH_IMAGE002
Figure 92425DEST_PATH_IMAGE030
Figure 714161DEST_PATH_IMAGE011
的值,本公开对此不作限制。
根据本公开的示例性实施例,
Figure 320723DEST_PATH_IMAGE018
Figure 579666DEST_PATH_IMAGE019
Figure 255367DEST_PATH_IMAGE004
的初始值可分别设定为
Figure 257958DEST_PATH_IMAGE033
Figure 719027DEST_PATH_IMAGE034
Figure 883292DEST_PATH_IMAGE035
,当然,也可采用其他方法(例如,通过设定的公式进行计算等)来确定
Figure 816262DEST_PATH_IMAGE018
Figure 356965DEST_PATH_IMAGE019
Figure 734857DEST_PATH_IMAGE004
的初始值,本公开对此不作限制。在得到
Figure 273286DEST_PATH_IMAGE018
Figure 923579DEST_PATH_IMAGE019
Figure 267972DEST_PATH_IMAGE004
的初始值之后,可将服务在过去时间段上的调用数据时间序列中的每个调用数据代入公式(5)~(8),得到服务在当前时间段上的预测时间序列。
返回参照图1,在步骤103,基于该调用数据时间序列和该预测时间序列之间的差异,确定残差序列。
在步骤104,根据残差序列中的数据分布情况,确定误差限度,这里,误差限度用于确定该预测时间序列所反映的服务的被调用情况与服务在当前时间段上的真实被调用情况之间的允许误差。
根据本公开的示例性实施例,可基于该调用数据时间序列和预测时间序列之间的差异(例如,相对应时刻的调用数据之间的差异),确定残差序列,然后将该残差序列中的数据按照从小到大的顺序排列,得到排序后的残差序列,并确定排序后的残差序列的第一四分位数和第三四分位数,这里,第一四分位数为处于排序后的残差序列的四分之一位置的数据,第三四分位数为处于排序后的残差序列的四分之三位置的数据,最后,可根据该第一四分位数和该第三四分位数,确定误差限度。在一个实施例中,可根据第一四分位数和第三四分位数,确定四分位距,该四分位距为第一四分位数和第三四分位数之间的差距。可根据第一四分位数和四分位距,确定出误差限度的下限,以及,可根据第三四分位数和四分位距,确定出误差限度的上限。例如,可将第一四分位数与1.5个四分位距相减,得到误差限度的下限,将第三四分位数与1.5个四分位距相加,得到误差限度的上限等,本公开对此不作限制。
图3是示出根据本公开的示例性实施例的误差限度的示意图。
参照图3,第一四分位数和第三四分位数组成一个“箱子”,四分位距为该“箱子”的高度,在该箱子中,存在一个中位数,表示按顺序排列的一组数据中居于中间位置的数据。可由第一四分位数向下延伸至1.5个四分位距的位置,为误差限度的下限,由第三四分位数向上延伸至1.5个四分位距的位置,为误差限度的上限,残差序列中超出上限或者下限的数据则为异常值。
在上述的误差限度的确定方案中,根据四分位数和四分位距确定误差限度的上限和下限,可将异常数据排除在误差限度之外,从而避免后续的异常检测过程因受到个别异常数据的影响而使得检测效果不好的情况,提高了异常检测的准确性。
在步骤105,基于该预测时间序列、该误差限度和服务在当前时间段上的调用数据,确定服务在当前时间段上的调用情况是否存在异常。
根据本公开的示例性实施例,可根据该预测时间序列和误差限度,确定允许区间,该允许区间用于限定服务在当前时间段上的调用情况的波动范围,可在服务在当前时间段上的调用数据处于该允许区间之外的情况下,确定服务在当前时间段上的调用情况存在异常。具体来讲,可将预测时间序列中的每一个数据分别与误差限度的上限和下限相加,得到每个数据的允许区间,当对服务在当前时间段上的某个时刻的调用数据进行异常检测时,可将该时刻的调用数据与该时刻调用数据的允许区间进行比较,如果处于允许区间之外,则判断服务在该时刻的调用数据出现异常。
根据本公开的示例性实施例,在步骤102得到预测时间序列之后,也可采用其他的异常判断方法,例如,Standard Score(标准分数)方法等来确定服务在当前时间段上的调用情况是否存在异常,本公开对此不作限制。
根据本公开的示例性实施例,在确定服务的调用数据出现异常(例如,QPS下降、与订单相关的服务流量陡增或陡降等)之后,可通过报警平台(与异常检测平台相关联)自动将异常及时发送给巡检人员,从而可在故障发生的第一时间及时发现并采取相应的措施,保证平台各服务的调用稳定性。
下面结合一种具体实施场景来描述根据本公开示出的异常检测方法。
假设服务A的调用数据的周期为一天,需要检测服务A在2022年03月15日早上08:00的调用数据是否有异常。则首先查询服务A在2022年03月14日00:00-23:59的全部调用数据,作为公式(6)中的
Figure 703633DEST_PATH_IMAGE036
,然后可通过最小化损失函数的方法计算出合适的
Figure 209700DEST_PATH_IMAGE002
Figure 114334DEST_PATH_IMAGE030
Figure 996839DEST_PATH_IMAGE011
的取值,初始化
Figure 349323DEST_PATH_IMAGE033
Figure 963975DEST_PATH_IMAGE034
Figure 401910DEST_PATH_IMAGE035
,并根据公式(6)~(8)计算得到2022年03月14日00:00-23:59每个时刻的
Figure 275057DEST_PATH_IMAGE018
Figure 482047DEST_PATH_IMAGE019
Figure 533180DEST_PATH_IMAGE004
,并根据公式(5),可得到2022年03月15日00:00-23:59每个时刻的预测调用数据(包括2022年03月15日早上08:00的预测调用数据)。接下来,可将2022年03月14日00:00-23:59的全部调用数据与2022年03月15日00:00-23:59每个时刻的预测调用数据相减,得到残差序列,基于前述步骤103的相关原理得到该残差序列的上限和下限,如果2022年03月15日早上08:00的真实调用数据处于区间[真实调用数据+下限,真实调用数据+上限]内,则服务在该时刻的调用数据正常,否则,可判定服务在在该时刻的调用数据为异常。
图4是示出根据本公开的示例性实施例的异常检测装置的框图。
参照图4,根据本公开的示例性实施例的异常检测装置400可包括数据获取单元401、数据处理单元402、残差序列确定单元403、误差限度确定单元404和异常确定单元405。
数据获取单元401可获取服务在过去时间段上的调用数据时间序列,该调用数据时间序列反映服务在过去时间段上的被调用情况。具体来讲,服务的被调用情况随着时间的发生而呈现不同的表现,将服务的被调用情况按照时间发生的先后顺序进行排列,可以得到服务在过去时间段(例如,在当前时刻之前的几个小时、一天、一周、一个月、一年等)上的调用数据时间序列。
根据本公开的示例性实施例,该调用数据时间序列为具有周期性和趋势性的时间序列。具体而言,周期性是指受服务特点的影响,服务的被调用情况在时间尺度上按照日、周、月、年等周期呈现周期性变化,趋势性是指服务的被调用情况在时间尺度上呈线性或指数型递增或下降的趋势。
数据处理单元402可通过指数平滑算法对该调用数据时间序列进行处理,得到预测的服务在当前时间段上的被调用情况的预测时间序列。这里,当前时间段的时间长度与前述的过去时间段的时间长度一致,例如,若过去时间段为昨天全天的时间,则当前时间段为今天全天的时间。
指数平滑算法的处理逻辑是对服务在当前时间段上的预测值是服务在过去时间段上观测值的加权平均值,并且随着过去观测值离预测值距离的增大,权重呈指数型衰减,因此通过指数平滑算法生成的预测值的准确性更高,从而基于预测时间序列进行异常检测的准确性更高。可根据调用数据时间序列的特点,采用不同的指数平滑算法来得到服务在当前时间段上的预测时间序列,例如,若调用数据时间序列既没有周期性,也没有趋势性,可采用简单指数平滑算法(例如,可被表示为前述的公式(1)),若调用时间序列具有趋势性而无周期性,则可采用二阶指数平滑算法(例如,可被表示为前述的公式(2)~(4))来得到服务在当前时间段上的预测时间序列,二阶指数平滑算法将调用数据时间序列的baseline(对调用数据时间序列水平部分的估计)和趋势性(对调用数据时间序列趋势的估计)纳入考虑。
三阶指数平滑算法可用于处理既有趋势性又具有周期性的调用时间序列。根据本公开的示例性实施例,数据处理单元402可通过Holt-Winters三阶指数平滑算法对调用数据时间序列进行处理,以保留调用数据时间序列中各调用数据的周期信息和趋势信息,由于更符合真实的数据场景,因此处理得到的预测时间序列可以更好地反映出调用数据本身具有的特点。具体来讲,Holt-Winters三阶指数平滑算法包括平滑方程和预测方程,可通过平滑方程对服务在过去时间段上的调用数据时间序列中的每个调用数据进行平滑处理,得到平滑时间序列,并通过预测方程对该平滑时间序列中的每个平滑数据进行数学统计处理,得到预测的服务在当前时间段上的被调用情况的预测时间序列。一个实施例中,平滑方程包括平滑因子,该平滑因子用于衡量平滑时间序列中的每个平滑数据对所对应的服务在过去时间段上的调用数据时间序列中的每个调用数据的倾向程度,此外,该平滑因子可通过使服务在过去时间段上的调用数据时间序列和前述的预测时间序列之间的损失函数最小化的方式而得到。这里,预测方程、平滑方程以及平滑因子的确定过程可参照前述的公式(5)~(9),在此不再赘述。残差序列确定单元403可基于该调用数据时间序列和该预测时间序列之间的差异,确定残差序列。
误差限度确定单元404可根据残差序列中的数据分布情况,确定误差限度,这里,误差限度用于确定该预测时间序列所反映的服务的被调用情况与服务在当前时间段上的真实被调用情况之间的允许误差。
根据本公开的示例性实施例,残差序列确定单元403可基于该调用数据时间序列和预测时间序列之间的差异(例如,相对应时刻的调用数据之间的差异),确定残差序列,误差限度确定单元404可将该残差序列中的数据按照从小到大的顺序排列,得到排序后的残差序列,并确定排序后的残差序列的第一四分位数和第三四分位数,这里,第一四分位数为处于排序后的残差序列的四分之一位置的数据,第三四分位数为处于排序后的残差序列的四分之三位置的数据,最后,可根据该第一四分位数和该第三四分位数,确定误差限度。在一个实施例中,误差确定单元403可根据第一四分位数和第三四分位数,确定四分位距,并根据第一四分位数和四分位距,确定出误差限度的下限,以及,根据第三四分位数和四分位距,确定出误差限度的上限,这里,四分位距为第一四分位数和第三四分位数之间的差距。
异常确定单元405可基于该预测时间序列、该误差限度和服务在当前时间段上的调用数据,确定服务在当前时间段上的调用情况是否存在异常。
根据本公开的示例性实施例,异常确定单元405可根据该预测时间序列和误差限度,确定允许区间,这里,该允许区间用于限定服务在当前时间段上的调用情况的波动范围。可在服务在当前时间段上的调用数据处于该允许区间之外的情况下,确定服务在当前时间段上的调用情况存在异常。具体来讲,异常确定单元405可将预测时间序列中的每一个数据分别与误差限度的上限和下限相加,得到每个数据的允许区间,当对服务在当前时间段上的某个时刻的调用数据进行异常检测时,异常确定单元405可将该时刻的调用数据与该时刻调用数据的允许区间进行比较,如果处于允许区间之外,则判断服务在该时刻的调用数据出现异常。
图5是根据本公开的示例性实施例的电子设备500的框图。
参照图5,电子设备500包括至少一个存储器501和至少一个处理器502,所述至少一个存储器501中存储有计算机可执行指令集合,当计算机可执行指令集合被至少一个处理器502执行时,执行根据本公开的示例性实施例的异常检测方法。
作为示例,电子设备500可以是PC计算机、平板装置、个人数字助理、智能手机、或其他能够执行上述指令集合的装置。这里,电子设备500并非必须是单个的电子设备,还可以是任何能够单独或联合执行上述指令(或指令集)的装置或电路的集合体。电子设备500还可以是集成控制系统或系统管理器的一部分,或者可被配置为与本地或远程(例如,经由无线传输)以接口互联的便携式电子设备。
在电子设备500中,处理器502可包括中央处理器(CPU)、图形处理器(GPU)、可编程逻辑装置、专用处理器系统、微控制器或微处理器。作为示例而非限制,处理器还可包括模拟处理器、数字处理器、微处理器、多核处理器、处理器阵列、网络处理器等。
处理器502可运行存储在存储器501中的指令或代码,其中,存储器501还可以存储数据。指令和数据还可经由网络接口装置而通过网络被发送和接收,其中,网络接口装置可采用任何已知的传输协议。
存储器501可与处理器502集成为一体,例如,将RAM或闪存布置在集成电路微处理器等之内。此外,存储器501可包括独立的装置,诸如,外部盘驱动、存储阵列或任何数据库系统可使用的其他存储装置。存储器501和处理器502可在操作上进行耦合,或者可例如通过I/O端口、网络连接等互相通信,使得处理器502能够读取存储在存储器中的文件。
此外,电子设备500还可包括视频显示器(诸如,液晶显示器)和用户交互接口(诸如,键盘、鼠标、触摸输入装置等)。电子设备500的所有组件可经由总线和/或网络而彼此连接。
根据本公开的示例性实施例,还可提供一种存储指令的计算机可读存储介质,其中,当指令被至少一个处理器运行时,促使至少一个处理器执行根据本公开的异常检测方法。这里的计算机可读存储介质的示例包括:只读存储器(ROM)、随机存取可编程只读存储器(PROM)、电可擦除可编程只读存储器(EEPROM)、随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)、闪存、非易失性存储器、CD-ROM、CD-R、CD+R、CD-RW、CD+RW、DVD-ROM、DVD-R、DVD+R、DVD-RW、DVD+RW、DVD-RAM、BD-ROM、BD-R、BD-RLTH、BD-RE、蓝光或光盘存储器、硬盘驱动器(HDD)、固态硬盘(SSD)、卡式存储器(诸如,多媒体卡、安全数字(SD)卡或极速数字(XD)卡)、磁带、软盘、磁光数据存储装置、光学数据存储装置、硬盘、固态盘以及任何其他装置,所述任何其他装置被配置为以非暂时性方式存储计算机程序以及任何相关联的数据、数据文件和数据结构并将所述计算机程序以及任何相关联的数据、数据文件和数据结构提供给处理器或计算机使得处理器或计算机能执行所述计算机程序。上述计算机可读存储介质中的计算机程序可在诸如客户端、主机、代理装置、服务器等计算机设备中部署的环境中运行,此外,在一个示例中,计算机程序以及任何相关联的数据、数据文件和数据结构分布在联网的计算机系统上,使得计算机程序以及任何相关联的数据、数据文件和数据结构通过一个或多个处理器或计算机以分布式方式存储、访问和执行。
根据本公开的示例性实施例,还可提供一种计算机程序产品,该计算机程序产品中的指令可由计算机设备的处理器执行以完成根据本公开的示例性实施例的异常检测方法。
根据本公开的异常检测方法、装置、电子设备及存储介质,采用指数平滑算法来预测服务在当前时间段上的被调用情况,并基于预测得到的预测时间序列和在过去时间段上的调用数据时间序列确定误差限度,基于预测时间序列、该误差限度和服务在当前时间段上的调用数据确定服务在当前时间段上的调用情况是否存在异常,由于通过指数平滑算法生成的预测是服务在过去时间段上的所有实际被调数据的加权平均值,并且随着过去实际被调数据离预测数据距离的增大,权重呈指数型衰减(即,距离预测数据越远,对预测数据的贡献度越低),因此通过指数平滑算法生成的预测准确性更高,从而基于预测时间序列进行异常检测的准确性更高;另外,由于基于根据残差序列中的数据分布情况而确定的误差限度来确定是否存在异常,因此异常的确定过程受异常调用数据的影响比较小,进一步提高了异常检测的准确性。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (20)

1.一种异常检测方法,其特征在于,包括:
获取服务在过去时间段上的调用数据时间序列,所述调用数据时间序列反映所述服务在所述过去时间段上的被调用情况;
通过指数平滑算法对所述调用数据时间序列进行处理,得到预测的所述服务在当前时间段上的被调用情况的预测时间序列;
基于所述调用数据时间序列和所述预测时间序列之间的差异,确定残差序列;
根据所述残差序列中的数据分布情况,确定误差限度,所述误差限度用于确定所述预测时间序列所反映的所述服务的被调用情况与所述服务在当前时间段上的真实被调用情况之间的允许误差;
基于所述预测时间序列、所述误差限度和所述服务在当前时间段上的调用数据,确定所述服务在当前时间段上的调用情况是否存在异常。
2.如权利要求1所述的异常检测方法,其特征在于,所述调用数据时间序列为具有周期性和趋势性的时间序列。
3.如权利要求2所述的异常检测方法,其特征在于,所述通过指数平滑算法对所述调用数据时间序列进行处理,包括:
通过Holt-Winters三阶指数平滑算法对所述调用数据时间序列进行处理。
4.如权利要求3所述的异常检测方法,其特征在于,所述Holt-Winters三阶指数平滑算法包括平滑方程和预测方程,所述通过Holt-Winters三阶指数平滑算法对所述调用数据时间序列进行处理,包括:
通过所述平滑方程对所述调用数据时间序列中的每个调用数据进行平滑处理,得到平滑时间序列;
通过所述预测方程对所述平滑时间序列中的每个平滑数据进行数学统计处理,得到预测的所述服务在当前时间段上的被调用情况的预测时间序列。
5.如权利要求4所述的异常检测方法,其特征在于,
所述平滑方程包括平滑因子,所述平滑因子用于衡量所述平滑时间序列中的每个平滑数据对所对应的所述调用数据时间序列中的每个调用数据的倾向程度。
6.如权利要求5所述的异常检测方法,其特征在于,
所述平滑因子是通过使所述调用数据时间序列和所述预测时间序列之间的损失函数最小化的方式而得到的。
7.如权利要求1所述的异常检测方法,其特征在于,所述根据所述残差序列中的数据分布情况,确定误差限度,包括:
将所述残差序列中的数据按照从小到大的顺序排列,得到排序后的残差序列;
确定所述排序后的残差序列的第一四分位数和第三四分位数,其中,所述第一四分位数为处于所述排序后的残差序列的四分之一位置的数据,所述第三四分位数为处于所述排序后的残差序列的四分之三位置的数据;
根据所述第一四分位数和所述第三四分位数,确定所述误差限度。
8.如权利要求7所述的异常检测方法,其特征在于,所述根据所述第一四分位数和所述第三四分位数,确定所述误差限度,包括:
根据所述第一四分位数和所述第三四分位数,确定四分位距,所述四分位距为所述第一四分位数和所述第三四分位数之间的差距;
根据所述第一四分位数和所述四分位距,确定所述误差限度的下限;
根据所述第三四分位数和所述四分位距,确定所述误差限度的上限。
9.如权利要求1所述的异常检测方法,其特征在于,所述基于所述预测时间序列、所述误差限度和所述服务在当前时间段上的调用数据,确定所述服务在当前时间段上的调用情况是否存在异常,包括:
根据所述预测时间序列和所述误差限度,确定允许区间,所述允许区间用于限定所述服务在当前时间段上的调用情况的波动范围;
在所述服务在当前时间段上的调用数据处于所述允许区间之外的情况下,确定所述服务在当前时间段上的调用情况存在异常。
10.一种异常检测装置,其特征在于,包括:
数据获取单元,被配置为:获取服务在过去时间段上的调用数据时间序列,所述调用数据时间序列反映所述服务在所述过去时间段上的被调用情况;
数据处理单元,被配置为:通过指数平滑算法对所述调用数据时间序列进行处理,得到预测的所述服务在当前时间段上的被调用情况的预测时间序列;
残差序列确定单元,被配置为:基于所述调用数据时间序列和所述预测时间序列之间的差异,确定残差序列;
误差限度确定单元,被配置为:根据所述残差序列中的数据分布情况,确定误差限度,所述误差限度用于确定所述预测时间序列所反映的所述服务的被调用情况与所述服务在当前时间段上的真实被调用情况之间的允许误差;
异常确定单元,被配置为:基于所述预测时间序列、所述误差限度和所述服务在当前时间段上的调用数据,确定所述服务在当前时间段上的调用情况是否存在异常。
11.如权利要求10所述的异常检测装置,其特征在于,所述调用数据时间序列为具有周期性和趋势性的时间序列。
12.如权利要求11所述的异常检测装置,其特征在于,所述数据处理单元被配置为通过Holt-Winters三阶指数平滑算法对所述调用数据时间序列进行处理。
13.如权利要求12所述的异常检测装置,其特征在于,所述Holt-Winters三阶指数平滑算法包括平滑方程和预测方程,所述数据处理单元被配置为:通过所述平滑方程对所述调用数据时间序列中的每个调用数据进行平滑处理,得到平滑时间序列;通过所述预测方程对所述平滑时间序列中的每个平滑数据进行数学统计处理,得到预测的所述服务在当前时间段上的被调用情况的预测时间序列。
14.如权利要求13所述的异常检测装置,其特征在于,所述平滑方程包括平滑因子,所述平滑因子用于衡量所述平滑时间序列中的每个平滑数据对所对应的所述调用数据时间序列中的每个调用数据的倾向程度。
15.如权利要求14所述的异常检测装置,其特征在于,所述平滑因子是通过使所述调用数据时间序列和所述预测时间序列之间的损失函数最小化的方式而得到的。
16.如权利要求10所述的异常检测装置,其特征在于,所述误差限度确定单元被配置为:将所述残差序列中的数据按照从小到大的顺序排列,得到排序后的残差序列;确定所述排序后的残差序列的第一四分位数和第三四分位数,其中,所述第一四分位数为处于所述排序后的残差序列的四分之一位置的数据,所述第三四分位数为处于所述排序后的残差序列的四分之三位置的数据;根据所述第一四分位数和所述第三四分位数,确定所述误差限度。
17.如权利要求16所述的异常检测装置,其特征在于,所述误差限度确定单元被配置为:根据所述第一四分位数和所述第三四分位数,确定四分位距,所述四分位距为所述第一四分位数和所述第三四分位数之间的差距;根据所述第一四分位数和所述四分位距,确定所述误差限度的下限;根据所述第三四分位数和所述四分位距,确定所述误差限度的上限。
18.如权利要求10所述的异常检测装置,其特征在于,所述异常确定单元被配置为:根据所述预测时间序列和所述误差限度,确定允许区间,所述允许区间用于限定所述服务在当前时间段上的调用情况的波动范围;在所述服务在当前时间段上的调用数据处于所述允许区间之外的情况下,确定所述服务在当前时间段上的调用情况存在异常。
19.一种电子设备,其特征在于,包括:
至少一个处理器;
至少一个存储计算机可执行指令的存储器,
其中,所述计算机可执行指令在被所述至少一个处理器运行时,促使所述至少一个处理器执行如权利要求1到9中的任一权利要求所述的异常检测方法。
20.一种存储指令的计算机可读存储介质,其特征在于,当所述指令被至少一个处理器运行时,促使所述至少一个处理器执行如权利要求1到9中的任一权利要求所述的异常检测方法。
CN202211083995.3A 2022-09-06 2022-09-06 异常检测方法、装置、电子设备及存储介质 Pending CN115168159A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211083995.3A CN115168159A (zh) 2022-09-06 2022-09-06 异常检测方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211083995.3A CN115168159A (zh) 2022-09-06 2022-09-06 异常检测方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN115168159A true CN115168159A (zh) 2022-10-11

Family

ID=83481653

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211083995.3A Pending CN115168159A (zh) 2022-09-06 2022-09-06 异常检测方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN115168159A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117421538A (zh) * 2023-12-18 2024-01-19 中铁建工集团第二建设有限公司 一种细节防水数据调控优化方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104915846A (zh) * 2015-06-18 2015-09-16 北京京东尚科信息技术有限公司 一种电子商务时间序列数据的异常检测方法及系统
CN108920336A (zh) * 2018-05-25 2018-11-30 麒麟合盛网络技术股份有限公司 一种基于时间序列的服务异常提醒方法及装置
CN110795324A (zh) * 2019-10-30 2020-02-14 中国银联股份有限公司 一种数据处理方法及装置
CN112148768A (zh) * 2020-09-14 2020-12-29 北京基调网络股份有限公司 一种指标时间序列异常检测方法、系统及存储介质
CN112395120A (zh) * 2019-08-14 2021-02-23 阿里巴巴集团控股有限公司 异常点检测方法、装置、设备及存储介质
CN112668693A (zh) * 2020-12-03 2021-04-16 支付宝(杭州)信息技术有限公司 用于检测异常的业务指标的方法和装置
CN112800116A (zh) * 2021-04-08 2021-05-14 腾讯科技(深圳)有限公司 一种业务数据的异常检测方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104915846A (zh) * 2015-06-18 2015-09-16 北京京东尚科信息技术有限公司 一种电子商务时间序列数据的异常检测方法及系统
CN108920336A (zh) * 2018-05-25 2018-11-30 麒麟合盛网络技术股份有限公司 一种基于时间序列的服务异常提醒方法及装置
CN112395120A (zh) * 2019-08-14 2021-02-23 阿里巴巴集团控股有限公司 异常点检测方法、装置、设备及存储介质
CN110795324A (zh) * 2019-10-30 2020-02-14 中国银联股份有限公司 一种数据处理方法及装置
CN112148768A (zh) * 2020-09-14 2020-12-29 北京基调网络股份有限公司 一种指标时间序列异常检测方法、系统及存储介质
CN112668693A (zh) * 2020-12-03 2021-04-16 支付宝(杭州)信息技术有限公司 用于检测异常的业务指标的方法和装置
CN112800116A (zh) * 2021-04-08 2021-05-14 腾讯科技(深圳)有限公司 一种业务数据的异常检测方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117421538A (zh) * 2023-12-18 2024-01-19 中铁建工集团第二建设有限公司 一种细节防水数据调控优化方法
CN117421538B (zh) * 2023-12-18 2024-03-15 中铁建工集团第二建设有限公司 一种细节防水数据调控优化方法

Similar Documents

Publication Publication Date Title
CN107086944B (zh) 一种异常检测方法和装置
US10387900B2 (en) Methods and apparatus for self-adaptive time series forecasting engine
CN109587001B (zh) 一种性能指标异常检测方法及装置
US10452983B2 (en) Determining an anomalous state of a system at a future point in time
CN111045894B (zh) 数据库异常检测方法、装置、计算机设备和存储介质
US20180329977A1 (en) Cluster evaluation in unsupervised learning of continuous data
JP2019537115A (ja) ユーザー異常行動検出方法、装置及びシステム
US8015276B2 (en) Method to identify performance and capacity bottlenecks of complex systems
CN111144941A (zh) 商户评分的生成方法、装置、设备及可读存储介质
US20140379310A1 (en) Methods and Systems for Evaluating Predictive Models
CN104572795B (zh) 规则的自动生成和动态更新
JP5933386B2 (ja) データ管理装置及びプログラム
US20120191442A1 (en) Operations management apparatus, operations management method and program
US7809781B1 (en) Determining a time point corresponding to change in data values based on fitting with respect to plural aggregate value sets
US9116804B2 (en) Transient detection for predictive health management of data processing systems
CN115168159A (zh) 异常检测方法、装置、电子设备及存储介质
CN114365094A (zh) 使用倒排索引的时序异常检测
CN110795324B (zh) 一种数据处理方法及装置
US11036701B2 (en) Data sampling in a storage system
JP5771317B1 (ja) 異常診断装置及び異常診断方法
CN111752481A (zh) 一种基于spd的内存监控及寿命预测方法和系统
CN117237126A (zh) 一种保险平台及保险数据处理方法
US7783509B1 (en) Determining that a change has occured in response to detecting a burst of activity
CN116380228A (zh) 衡器运行监测方法、系统、终端及存储介质
JP2007164346A (ja) 決定木変更方法、異常性判定方法およびプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination