CN110032670A - 时序数据的异常检测方法、装置、设备及存储介质 - Google Patents
时序数据的异常检测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN110032670A CN110032670A CN201910308733.4A CN201910308733A CN110032670A CN 110032670 A CN110032670 A CN 110032670A CN 201910308733 A CN201910308733 A CN 201910308733A CN 110032670 A CN110032670 A CN 110032670A
- Authority
- CN
- China
- Prior art keywords
- time series
- data
- series data
- value
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
Abstract
本申请公开了一种时序数据的异常检测方法、装置、设备及存储介质,属于互联网技术领域。方法包括:获取不同业务的时序数据;对获取到的各项时序数据的时序曲线进行分类,时序曲线描述了时序数据随时间的变化趋势;对于任意一项时序数据,确定与该时序数据的时序曲线的分类类别匹配的目标预测方式,基于目标预测方式对时序数据进行预测,得到预测数据,将时序数据与预测数据进行比对,得到时序数据中包括的异常数据值。本申请实现了针对不同的曲线形态自动地选择相应的方式进行异常点检测,由于对不同类型的时序曲线进行了分类,充分考虑了不同曲线的形态,因此适用于对任意一个业务的时序数据进行异常检测,提升了异常检测的准确性,效果较佳。
Description
技术领域
本申请涉及互联网技术领域,特别涉及一种时序数据的异常检测方法、装置、设备及存储介质。
背景技术
时序数据,也称时间序列数据,是针对同一业务按照时间顺序记录的数据集合。即,在时序数据中数据值与时间一一对应,时序数据可以用来描述某一业务随时间的变化趋势。目前时序数据已被应用在多个领域,比如游戏领域、工业生产领域、农业生产领域、气象领域、经济学领域等。以游戏领域为例,不同的游戏业务对应不同的时序数据,比如可以通过时序数据来记录在线活跃用户数随时间的变化趋势。
在形成时序数据后,相关技术一般通过对时序数据进行检测分析,来判断某一业务是否存在异常。比如,随着游戏业务的快速发展,通过时序数据来检测某一游戏业务是否存在异常,已经成为游戏日常维护中进行异常监控的重要手段之一。
发明内容
本申请实施例提供了一种时序数据的异常检测方法、装置、设备及存储介质,能够精确地检测时序数据是否存在异常。所述技术方案如下:
一方面,提供了一种时序数据的异常检测方法,所述方法包括:
获取不同业务的时序数据;
对获取到的各项时序数据的时序曲线进行分类,所述时序曲线描述了所述时序数据随时间的变化趋势;
对于任意一项时序数据,确定与所述时序数据的时序曲线的分类类别匹配的目标预测方式,基于所述目标预测方式对所述时序数据进行预测,得到预测数据,将所述时序数据与所述预测数据进行比对,得到所述时序数据中包括的异常数据值。
另一方面,提供了一种时序数据的异常检测装置,所述装置包括:
第一获取模块,用于获取不同业务的时序数据;
分类模块,用于对获取到的各项时序数据的时序曲线进行分类,所述时序曲线描述了所述时序数据随时间的变化趋势;
检测模块,用于对于任意一项时序数据,确定与所述时序数据的时序曲线的分类类别匹配的目标预测方式,基于所述目标预测方式对所述时序数据进行预测,得到预测数据,将所述时序数据与所述预测数据进行比对,得到所述时序数据中包括的异常数据值。
在一种可能的实现方式中,所述分类模块,还用于获取各个时序曲线的波动值,所述波动值反应所述时序曲线的波动频繁度;对所述各个时序曲线的波动值进行聚类,得到多个初始分类;在所述多个初始分类中确定数据值最大的第一分类;将所述多个初始分类中除所述第一分类之外的剩余分类进行合并,得到第二分类,所述第一分类的曲线平缓度大于所述第二分类的曲线平缓度,所述第一分类的曲线周期性大于所述第二分类的曲线周期性。
在一种可能的实现方式中,所述分类模块,还用于对于任意一个时序曲线,获取相应的时序数据的差分序列;确定所述差分序列的第一四分位数和第三四分位数;根据所述第一四分位数和所述第三四分位数,分别确定所述差分序列的高点阈值和低点阈值;获取所述差分序列中大于所述高点阈值以及小于所述低点阈值的数据值个数,将所述数据值个数作为所述时序曲线的波动值。
在一种可能的实现方式中,所述检测模块,还用于当所述时序曲线的分类类别为第一分类时,基于与所述第一分类匹配的第一预测算法对所述时序数据进行预测,得到所述预测数据;或,当所述时序曲线的分类类别为第二分类时,基于与所述第二分类匹配的第二预测算法对所述时序数据进行预测,得到所述预测数据。
在一种可能的实现方式中,所述检测模块,还用于对于所述时序数据,获取当前时间窗口内各个数据值的平均值,得到一个预测值;按照第一预设步长滑动时间窗口,获取下一个时间窗口内各个数据值的平均值,得到另一个预测值;重复执行滑动时间窗口并获取平均值的步骤,直至最后一个时间窗口,得到所述预测数据。
在一种可能的实现方式中,所述检测模块,还用于对于所述时序数据,获取当前时间窗口内各个数据值的指数加权平均值,得到一个预测值;按照第二预设步长滑动时间窗口,获取下一个时间窗口内各个数据值的指数加权平均值,得到另一个预测值;重复执行滑动时间窗口并获取指数加权平均值的步骤,直至最后一个时间窗口,得到所述预测数据。
在一种可能的实现方式中,所述检测模块获取所述指数加权平均值的方式为:
其中,EMA指代所述指数加权平均值,α为常数,α的取值为(0,1)之间的小数,P1至P4指代一个时间窗口内包括的数据值。
在一种可能的实现方式中,所述检测模块,还用于对于所述时序数据中的任意一个数据值,将所述数据值与所述预测数据中相应时刻的预测值进行比对;当所述数据值与所述预测值之差大于目标阈值时,将所述数据值作为所述异常数据值,所述目标阈值为N倍的所述时序数据的方差,N的取值大于0。
在一种可能的实现方式中,所述装置还包括:
第二获取模块,用于获取所述时序数据中每个所述异常数据值的异常分值;
过滤模块,用于根据每个所述异常数据值的异常分值,对所述时序数据中包括的异常数据值进行过滤,得到目标异常数据值;
告警模块,用于对所述目标异常数据值进行告警处理。
另一方面,提供了一种存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现上述的时序数据的异常检测方法。
另一方面,提供了一种时序数据的异常检测设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现上述的时序数据的异常检测方法。
本申请实施例提供的技术方案带来的有益效果是:
针对多个业务的多个时序数据,本申请实施例首先对多个时序数据的时序曲线进行分类;之后,针对归属于不同分类类别的时序曲线,采用不同的方式进行异常检测,即本申请实施例实现了针对不同的曲线形态自动地选择相应的方式进行异常点判别,由于对不同类型的时序曲线进行了分类,充分考虑了不同曲线的形态,因此本申请实施例适用于对任意一个业务的时序数据进行异常检测,提升了异常检测的准确性,能够帮助运营人员及时发现问题,该种异常检测方式的效果较佳。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种时序曲线的示意图;
图2是本申请实施例提供的另一种时序曲线的示意图;
图3是本申请实施例提供的另一种时序曲线的示意图;
图4是本申请实施例提供的另一种时序曲线的示意图;
图5是本申请实施例提供的一种时序数据的异常检测方法涉及的实施环境的示意图;
图6是本申请实施例提供的一种时序数据的异常检测方法的执行流程图;
图7是本申请实施例提供的一种时序数据的异常检测方法的流程图;
图8是本申请实施例提供的一种时序数据的异常检测方法的流程图;
图9是本申请实施例提供的一种时序数据的异常检测方法的流程图;
图10是本申请实施例提供的一种指数递减形式示意图;
图11是本申请实施例提供的一种时序数据的异常检测方法的流程图;
图12是本申请实施例提供的另一种时序曲线的示意图;
图13是本申请实施例提供的另一种时序曲线的示意图;
图14是本申请实施例提供的另一种时序曲线的示意图;
图15是本申请实施例提供的另一种时序曲线的示意图;
图16是本申请实施例提供的另一种时序曲线的示意图;
图17是本申请实施例提供的另一种时序曲线的示意图;
图18是本申请实施例提供的另一种时序曲线的示意图;
图19是本申请实施例提供的另一种时序曲线的示意图;
图20是本申请实施例提供的一种时序数据的异常检测方法的整体流程图。
图21是本申请实施例提供的一种时序数据的异常检测装置的结构示意图;
图22是本申请实施例提供的一种时序数据的异常检测装置的结构示意图;
图23是本申请实施例提供的一种时序数据的异常检测设备的结构示意图;
图24是本申请实施例提供的一种时序数据的异常检测设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
在对本申请实施例进行详细地解释说明之前,先对本申请实施例涉及到的一些名词进行解释说明。
时序数据:也称时间序列数据,是针对同一业务按照时间顺序记录的数据集合。即,在时序数据中数据值与时间一一对应,时序数据可以用来描述某一业务随时间的变化趋势。
同一数据集合中包括的各个数据还需是同口径的,即具有可比性。在日常工作生活中,会经常接触到需要对某些业务按照时间顺序进行统计和分析的场景,比如股票大盘走势、气象变化、内存监控、游戏监控等。
这些依赖于时间而变化,可以用具体数值来反映其变化程度的数据即为时序数据。其中,时序数据具有两个关键指标,分别为监测时间和监测数据。
而分析时序数据的目的通常是找出某一业务在一段时间内的发展规律和统计特性。
异常检测:是指对数据集合中不符合预期的模式、事件或观测值的异常数据(也称之为异常点)进行识别。
其中,异常点通常也被称之为离群点、新奇点、噪声点、或偏差点等。异常检测的目的即是通过一定方法来自动检测出数据集合中存在的异常点。
曲线分类:是指对不同类型的曲线进行分类,按照预期要求将相似曲线归为一个类别。
作为一个示例,上述提及的曲线可以为时序数据的时序曲线,其中,时序曲线描述了时序数据随时间的变化趋势。
以游戏业务为例,由于游戏业务多种多样,不同游戏业务的时序曲线通常具有不同的曲线形态,所以为了更好地进行对时序数据进行异常检测,还需对时序曲线进行分类,并对不同分类类别的时序曲线采取不同的处理方式,比如对不同类别的时序曲线采取不同的预测方式进行预测。
在一种可能的实现方式中,本申请实施例将时序曲线分为两类。
图1至图4为随机筛选出来的部分时序曲线,由图1至图4示出的四个时序曲线可以看出,时序曲线大致可以被分为两类:第一类是曲线比较平缓且有周期性的,例如图1和图2;第二类是曲线波动较多且周期性不强的,例如图3和图4。因此,在类别上将时序曲线人工定义为两类,第一类是波动平缓且具有周期性的曲线,第二类是突增突降且周期性不强的曲线。即,第一分类的曲线平缓度大于第二分类的曲线平缓度,且第一分类的曲线周期性大于第二分类的曲线周期性。
差分序列:指代时序数据的差分序列,将一项时序数据中相邻元素(数据值)之间进行差分运算,即可得到该时序数据的差分序列。
作为一个示例,上述差分运算通常指代的是上一个时间点的数据值减去下一个时间点的数据值。
以游戏业务为例,随着游戏业务的迅猛发展,异常监控在游戏日常维护中作用巨大。相关技术中在对时序数据进行异常检测时,通常基于3σ准则实现。其中,3σ准则又称为拉依达准则,即是先假设一组检测数据仅含有随机误差,对其进行计算处理得到标准偏差,按照一定概率确定一个区间,认为超过这个区间的误差不属于随机误差而属于粗大误差,含有该误差的数据应予以剔除。
3σ准则为:数据分布在(μ-σ,μ+σ)中的概率为0.6827、分布在(μ-2σ,μ+2σ)中的概率为0.9545、分布在(μ-3σ,μ+3σ)中的概率为0.9973。即,数据几乎全部集中在(μ-3σ,μ+3σ)区间内,超出这个区间范围的可能性仅占不到0.3%。一旦有数据超出这个区间,则认为该数据异常。其中,μ指代平均值,σ指代标准偏差。
然而,利用3σ准则对时序数据进行异常检测,还需数据分布符合正态分布或近似符合正态分布,但在实际的应用场景中,时序数据并不完全都符合正态分布,因此该种异常检测的精准度较差,在进行告警时会产生很多误报。换一种表达方式,不同游戏业务的时序曲线形态通常各不相同,相关技术提供的异常检测方法由于自身的局限性不能适用于所有游戏业务,产生的大量误报会对运营人员造成干扰。
基于此,本申请实施例提供了一种新的时序数据异常检测方法,能够对不同游戏业务的时序数据进行实时异常检测并进行告警。
下面对本申请实施例提供的一种时序数据的异常检测方法的实施环境进行介绍说明。
本申请实施例提供的一种时序数据的异常检测方法应用于智能告警系统。参见图5,智能告警系统可包括:异常检测设备501。其中,异常检测设备501为具有机器学习能力的计算机设备,比如,该计算机设备可以是个人电脑、服务器等固定式计算机设备,还可以是平板电脑、智能手机等移动式计算机设备,本申请实施例对此不进行具体限定。异常检测设备501在检测到异常数据后,会向运营人员进行及时告警。
在本申请实施例中,参见图6,时序数据的异常检测方法可分为三个步骤,分别为:时序曲线分类、异常点判别、告警收敛以及告警发出。
1、时序曲线分类
作为一个示例,本申请提及的时序数据均来源于游戏业务。
针对该步骤,首先对时序数据进行差分运算,得到时序数据的差分序列;然后基于该差分序列进行关键指标筛选完成聚类,实现时序曲线的自动分类。
2、异常点判别
对于归属于不同分类类别的时序曲线,本申请实施例采用不同的方式进行异常点的判别。
以将时序曲线分为前述的两个类别为例,针对第一类波动平缓且周期性强的时序曲线,可采用第一预测算法和改进的3σ准则进行异常点判别。作为一个示例,第一预测算法可为滑动平均算法,本申请实施例对此不进行具体限定。
针对第二类突增突降且周期不强的时序曲线,可采用第二预测算法和改进的3σ准则进行异常点判别。作为一个示例,第二预测算法可为指数加权移动算法,本申请实施例对此同样不进行具体限定。
3、告警收敛以及告警发出
经过步骤2完成异常点判别后,最后进行告警收敛以及发出告警。
作为一个示例,可采用孤立森林算法完成告警收敛,本申请实施例对此同样不进行具体限定。
综上所述,本申请实施例针对多个游戏业务的多个时序数据,首先对多个时序数据的时序曲线进行分类,分类为上述第一类和第二类两个类别;之后,针对归属于不同分类类别的时序曲线,采用不同的方式进行异常点判别;最后,利用告警收敛算法找出最终需要进行告警的异常点。
本申请实施例提供的时序数据的异常检测方法,适用于对任意一款游戏业务的时序数据进行异常检测,不但可以实时进行检测并智能告警,提升告警准确性,进而帮助运营人员及时发现问题,无需人工设置收敛规则,而且还能够根据曲线形态自动地选择相应的方式进行异常点判别。
图7是本申请实施例提供的一种时序数据的异常检测方法的流程图。该方法的执行主体可以为图5中的异常检测设备,参见图7,本申请实施例提供的方法流程包括:
701、获取不同业务的时序数据。
以游戏业务为例,游戏业务可涉及周流失率、付费流失率、丢包率、每日流失用户数等,本申请实施例对此不进行具体限定。
针对每一种游戏业务来说,可获取该游戏业务一段时长内的时序数据。
示例性地,该时长的取值可依据业务类型而设置。比如,针对统计周流失率的业务,可以获取最近3个月或半年内的时序数据;或,针对统计丢包率的业务,可以获取最近1天或2天内的时序数据。
另外,该时长的取值还可人工设置,本申请实施例对此不进行具体限定。
702、对获取到的各项时序数据的时序曲线进行分类,时序曲线描述了时序数据随时间的变化趋势。
参见图1至图4,分别了示出了四种时序曲线。在本申请实施例中,对时序曲线进行分类,包括下述三个步骤:计算波动值、波动值聚类以及合并分类,即,参见图8,对获取到的各项时序数据的时序曲线进行分类,包括如下步骤:
计算波动值
7021、获取各个时序曲线的波动值,每个时序曲线的波动值反应了相应的时序曲线的波动频繁度。
在本申请实施例中,假设波动区间可以通过时序数据的差分值来确定,则越是波动剧烈的时序曲线,相应的时序数据的差分值越大,通常会超出该时序数据的高点阈值和低点阈值。
基于上述描述,获取各个时序曲线的波动值,包括但不限于采取下述方式:
对于任意一个时序曲线,获取相应的时序数据的差分序列;确定该差分序列的第一四分位数和第三四分位数;根据第一四分位数和第三四分位数,分别确定该差分序列的高点阈值和低点阈值;获取该差分序列中大于高点阈值以及小于低点阈值的数据值个数,将该数据值个数作为该时序曲线的波动值。
作为一个示例,以任意一个游戏业务的时序数据的差分序列为dtimei、四分位数为Quantile、差分序列的高点阈值分别为highi和低点阈值为lowi、波动值为lenthi为例,则:
dtimei=diff(xi)
diff(xi)=Δf(xk)
Δf(xk)=f(xk+1)-f(xk)
xk=x0+kh(k=0,1……n)
其中,xi指代任意一个游戏业务的时序数据,Δf(xk)指代该时序数据中数据值xk+1和数据值xk的差分值,xk指代该时序数据中第k个数据值,x0指代该时序数据中第0个数据值,h为常数。
在一种可能的实现方式中,高点阈值highi和低点阈值lowi的计算方式为:
首先,将差分序列四等分,得到第一四分位数和第三四分位数。
其中,四分位数即是将差分序列中包括的所有数据值由小到大进行排列并分成四等份,处于三个分割点位置的数据值即是四分位数。第一四分位数指代排列在第25%的数据值,第三四分位数指代排列在第75%的数据值。第三四分位数与第一四分位数之间的差距又称为四分位距。
在一种可能的实现方式中,高点阈值和低点阈值的取值均为1.5倍四分位距之外,即:
td=Quantile(dtimei)
highi=td['75%']+1.5*(td['75%']-td['25%'])
lowi=td['25%']-1.5*(td['75%']-td['25%'])
其中,td['75%']指代第三四分位数,td['25%']指代第一四分位数。
在本申请实施中,将差分序列中包括的数据值超出高点阈值和低点阈值的次数作为该时序曲线的波动值。
作为一个示例,假设差分序列为dtimei=[-10,-5,0,1,2,3,4,4,5,6,15],则:
td['75%']=5
td['25%']=0
highi=td['75%']+1.5*(td['75%']-td['25%'])=5+1.5*5=12.5
lowi=td['25%']-1.5*(td['75%']-td['25%'])=0-1.5*5=-7.5
在上述差分序列[-10,-5,0,1,2,3,4,4,5,6,15]中,超出高点阈值12.5和低点阈值-7.5的数据值总共有2个,分别为-10和15,因此波动值Lenth的取值为2。
波动值聚类
7022、对各个时序曲线的波动值进行聚类,得到多个初始分类。
在本申请实施例中,将各个时序曲线的波动值作为特征值,并对各个特征值进行聚类,得到多个初始分类。
在一种可能的实现方式中,本申请实施例采用DBSCAN(Density-Based SpatialClustering of Applications with Noise,具有噪声的基于密度的聚类方法)进行聚类。该类密度聚类算法通常假定类别可以通过样本分布的紧密程度决定,即同一类别的样本之间是紧密相连的,也就是说,在某类别中任意一个样本的周围不远处一定存在同类别的其他样本。通过将紧密相连的样本划为一类,便得到了一个聚类类别。通过将所有紧密相连的样本划分为各个不同的类别,即得到了最终的所有聚类类别。
换一种表达方式,DBSCAN聚类即是由密度可达关系导出最大密度相连的样本集合,即得到最终聚类的一个类别。其中,在一个类别里可以有一个或者多个核心对象。若仅有一个核心对象,则该类别中其他的非核心对象均在这个核心对象的Eps邻域内;若有多个核心对象,则该类别中的任意一个核心对象的Eps邻域内一定有一个其他的核心对象,否则这两个核心对象无法密度可达。而这些核心对象的Eps邻域内的所有样本组成了一个聚类类别。
在本申请实施例中,聚类过程可为:选择任意一个没有类别的核心对象作为种子,然后寻找这个核心对象能够密度可达的样本集合,即形成一个聚类类别。接着,继续选择另一个没有类别的核心对象作为种子并寻找密度可达的样本集合,即形成另一个聚类类别,一直运行到所有核心对象都有类别为止。
在一种可能的实现方式中,以多个时序曲线的特征值形成序列(q0,q1,…,qn)为例,如果任意一点(指代一个特征值)的所有相邻点(任意qi,qi-1)均为直接密度可达,则表示q0和qn为密度可达。对于序列(q0,q1,…,qn)中的不同点,根据Eps邻域进行划分,首先寻找核心点,然后利用密度可达来找另一个点。同样不断迭代后形成不同的类别,最后完成分类。
作为一个示例,以四个不同的游戏业务的波动值组成{107,124,132,788}序列为例,则在完成DBSCAN聚类后,将107和124划分为一类,150划分为一类,300划分为一类。
合并分类
7023、在多个初始分类中确定数据值最大的第一分类;将多个初始分类中除第一分类之外的剩余分类进行合并,得到第二分类。
在一种可能的实现方式中,在得到多个初始分类后,本申请实施例还会对多个初始分类进行合并。作为一个示例,在进行分类合并时,可选出初始类别中数据值最大的类别,将该类别确定是第二类突增突降且周期性不强的曲线类别,而将其他剩下的类别进行合并,将其确定是第一类波动平缓且具有强周期性的曲线类别。
继续以四个不同的游戏业务的波动值组成{107,124,132,788}序列为例,则初始分类结果是将107和124归属于一类,150归属于一类,300归属于一类,在合并分类后,300独自归为一类,确定相应的时序曲线为第二类突增突降且周期性不强的曲线,其余三个归为另一类,确定相应的时序曲线为波动平缓且具有强周期性的曲线。
综上所述,通过以上三个步骤便完成了时序曲线的自动分类。
703、对于任意一项时序数据,确定与该时序数据的时序曲线的分类类别匹配的目标预测方式,基于目标预测方式对该时序数据进行预测,得到预测数据,将该时序数据与预测数据进行比对,得到该时序数据中包括的异常数据值。
本步骤即是在时序数据中进行异常点(异常数据值)判别。
其中,异常点判别是针对归属于不同分类类别的时序曲线,选择不同的预测方式对相应的时序数据进行预测,然后将真实值与预测值进行对比,最后利用改进的3σ准则来判断各个数据点是否是异常点。
作为一个示例,异常点判别过程分为两个步骤,分别为预测方式选择和异常点触发。参见图9,该步骤包括:
预测方式选择
在本申请实施中,预测方式选择的原则是基于前述的曲线分类结果。
7031、当某一项时序曲线的分类类别为第一分类时,基于与第一分类匹配的第一预测算法对相应的时序数据进行预测,得到预测数据。
作为一个示例,针对第一类曲线平缓且周期性强的曲线,考虑该类曲线的数据分布更接近于正态分布,因此可采用滑动平均算法进行预测,即:
对于一项时序数据,获取当前时间窗口内各个数据值的平均值,得到一个预测值;按照第一预设步长滑动时间窗口,获取下一个时间窗口内各个数据值的平均值,得到另一个预测值;重复执行滑动时间窗口并获取平均值的步骤,直至最后一个时间窗口,得到预测数据。
其中,滑动平均算法的基本思想是:根据时序数据进行逐项推移,依次计算包含一定项数的时序数据的平均值,以反映长期变化趋势,公式如下:
其中,SMA指代一个时间窗口内的平均值,P1至Pn指代该时间窗口内的数据值,n指代该时间窗口内包括的数据值个数。
当时序数据的数值由于受周期变动和随机波动的影响,起伏较大,不易显示出业务的发展趋势时,利用滑动平均算法可以消除这些因素的影响,显示出业务的发展方向与趋势(即趋势线),然后依据趋势线分析预测数据的长期趋势。
举例来说,假设某业务在一个时间窗口内的数据值为{200,300,400,500},则SMA=(200+300+400+500)/4=350,即预测下一个时间点的数据值为350。
7032、当该时序曲线的分类类别为第二分类时,基于与第二分类匹配的第二预测算法对相应的时序数据进行预测,得到预测数据。
针对第二类突增突降且周期性不强的曲线,可采用EWMA(ExponentiallyWeighted Moving Average,指数加权移动平均)算法进行预测,即:
对于一项时序数据,获取当前时间窗口内各个数据值的指数加权平均值,得到一个预测值;按照第二预设步长滑动时间窗口,获取下一个时间窗口内各个数据值的指数加权平均值,得到另一个预测值;重复执行滑动时间窗口并获取指数加权平均值的步骤,直至最后一个时间窗口,得到预测数据。
其中,第二预设步长的大小既可以和第一预设步长一致,也可以不一致,本申请实施例对此不进行具体限定。
在一种可能的实现方式中,指数加权平均值的获取方式为:
其中,EMA指代指数加权平均值,α为常数,α的取值为(0,1)之间的小数,P1至P4指代一个时间窗口内包括的数据值。理论上这一公式是一个无穷级数,但由于1-α小于1,因此各项的数值会越来越细,可以被忽略。
基于上述公式可知,EWMA算法是以指数式递减加权的移动平均。其中,各数据值的加权而随时间而指数式递减,越近期的数据值加权越重,但较远期的数据值也给予一定的加权,其中,指数加权移动平均后图形应该呈现如图10所示的指数递减形式。
另外,相较于滑动平均算法而言,由于指数加权求解是个递推过程,因此能够平滑掉突然波动对预测结果的影响,对于突增突降且周期性不强的数据能够实现更好的效果。
假设某业务在一个时间窗口范围内的数据值为{200,800,100,700},α=0.2,则EMA=(700+100*0.8+0.64*800+0.512*200)/(1+0.7+0.64+0.512)=488.92,即预测下一个时间点的数据值为488.92。
综上所述,预测方式的选择是根据曲线分类结果完成的,针对波动平缓且周期性强的第一类曲线,利用滑动平均算法进行预测;针对突增突降且周期性不强的第二类曲线,利用指数加权移动平均算法进行预测效果。
在得到预测数据后,本申请实施例通过下述的异常点触发过程确定异常点。
异常点触发
7033、对于该时序数据中的任意一个数据值,将该数据值与得到的预测数据中相应时刻的预测值进行比对;当该数据值与该预测值之差大于目标阈值时,将该数据值作为异常数据值。
在一种可能的实现方式中,目标阈值为N倍的该时序数据的方差,其中,N的取值大于0。作为一个示例,N的取值既可以为正整数,也可以为非正整数,本申请实施例对此不进行具体限定。
在本申请实施例中,异常点触发过程利用改进的3σ准则,将真实值与预测值进行对比,再与N倍的方差相比较,超出N倍方差,则确定相应的数据点为该时序数据中的异常点。
作为一个示例,N的取值可以为3,即真实值与预测值之差超过3倍方差,则确定相应的数据点为异常点。
本申请实施例提供的方法,针对多个业务的多个时序数据,首先对多个时序数据的时序曲线进行分类;之后,针对归属于不同分类类别的时序曲线,采用不同的方式进行异常点判别,即本申请实施例实现了针对不同的曲线形态自动地选择相应的方式进行异常点判别,由于对不同类型的时序曲线进行了分类,充分考虑了不同曲线的形态,因此本申请实施例适用于对任意一个业务的时序数据进行异常检测,提升了异常检测的准确性,能够帮助运营人员及时发现问题,该种异常检测方式的效果较佳。
上述实施例通过曲线分类以及异常点判别两步已经初步寻找到异常数据,在另一个实施例中,本申请实施例还包括告警收敛以及告警发出步骤。即,参见图11,本申请实施例还包括:
704、获取该时序数据中每个异常数据值的异常分值;根据每个异常数据值的异常分值,对该时序数据中包括的异常数据值进行过滤,得到目标异常数据值;对目标异常数据值进行告警处理。
在一种可能的实现方式中,本申请实施例利用孤立森林算法进行告警收敛。
其中,与有监督的决策树算法不同,孤立森林算法是无监督学习的分类算法。针对孤立森林算法,其不需要输入训练集,该算法的基本思想是:假设用一个随机超平面来切割数据空间,切一次可以生成两个子空间。之后,再继续用一个随机超平面来切割每个子空间,循环下去,直到每子空间里面仅有一个数据点为止。
作为一个示例,孤立森林算法可以由t个孤立树组成,每个孤立树是一个二叉树结构,其实现步骤如下:
1.随机选择Ψ个样本作为subsample,放入树的根节点。
2.随机选择一个特征维度,在当前节点数据中随机产生一个切割点p,其中,切割点p产生于当前节点数据中指定维度的最大值和最小值之间。
3.以此切割点p生成了一个超平面,然后将当前节点数据空间划分为2个子空间:将该特征维度里小于切割点p的数据放在当前节点的左孩子,将大于或等于切割点p的数据放在当前节点的右孩子。
4.在孩子节点中递归步骤2和3,不断构造新的孩子节点,直到孩子节点中仅有一个数据(无法再继续切割),或,孩子节点已到达限定高度。
基于上述描述可知,孤立森林算法主要目的是寻找到那些孤立的数据点。即,该算法不需要初始输入几个类别,而是能够自动建立二叉树寻找孤立点,计算公式如下:
h(x)=e+C(T.size)
其中,score(x)指代数据x的异常分值,h(x)指代数据x在二叉树上的路径长度,C(n)指代用T.size条数据构建的二叉树的平均路径长度。
在本申请实施例中,针对步骤703中得到的异常点,对每一个异常点进行异常分值计算,异常分值的取值越接近于0,表明对应的数据点越正常。
作为一个示例,假设某业务的时序数据为{100,200,300,1000},则根据孤立森林算法进行计算后,1000的数据点会被作为异常点寻找出来。
通常上述孤立森林算法可以收敛掉一些经常波动的数据点,更加贴合业务侧想要的异常。
在一种可能的实现方式中,本申请实施例也可加入时间检测机制,例如,一个异常点的告警发出后预设时长后才能发出新的告警。作为一个示例,预设时长的取值可为5分钟,本申请实施例对此不进行具体限定。
作为一个示例,告警方式可如下述所示:
{**业务丢包率告警}
[影响时间]:2018-10-2405:02:00
[影响业务]:XX业务
[影响地区]:某地区
[房间类型]:小房间
[异常人次/总人次]:346.0人次/3598.0人次
[最新三分钟影响情况]:异常占比9.62%,经判断为异常波动
在另一个实施例中,图12至图19示出了不同预测方式的预测效果展示。
作为一个示例,前述图1至图4随机选择的时序曲线在通过曲线分类后,利用前面2天的时序数据作为历史数据,来对第三天的数据进行预测。
其中,图12和图13示出了利用滑动平均算法对图1和图2所示的时序曲线进行预测的预测效果展示图;图14和图15示出了利用指数加权移动平均算法对图3和图4所示的时序曲线进行预测的预测效果展示图;图16和图19示出了利用3σ准则对图1至图4所示的时序曲线进行预测的预测效果展示图。
由图12至图19可以看出,在曲线分类后采用不同的预测方式进行预测效果更好,通过计算均方根误差(RMSE或RMSD)也可以证实上述结论。其中,均方根误差的计算公式如下:
其中,T指代观测次数,和yt指代观测值和真实值,t的取值为正整数。
下述表1示出了利用不同预测方式对多业务的时序数据进行预测的预测值与真实值之间的偏差:
表1
由上述表1可知,在曲线分类后选择不同预测方式进行预测,得到的预测结果更加精准。
在另一个实施例中,参见图20,下面对本申请实施例提供的时序数据的异常检测方法的整体执行流程进行介绍:
2001、获取多个业务的时序曲线。
2002、对多个时序曲线进行关键指标筛选,完成对多个时序曲线自动分类。
如前文所述,关键指标指代时序曲线的波动值。
2003、针对变化平缓、波动不大的第一类曲线,采用滑动平均算法和改进的3σ准则进行异常点判别。
2004、针对突增突降、波动剧烈的第二类曲线,采用指数加权移动平均算法和改进的3σ准则进行异常点判别。
2005、利用孤立森林算法进行告警收敛。
2006、触发告警。
综上所述,本申请实施例针对多个业务的多个时序数据,首先对多个时序数据的时序曲线进行分类;之后,针对归属于不同分类类别的时序曲线,采用不同的方式进行异常点判别;最后,利用告警收敛算法找出最终需要进行告警的异常点。
本申请实施例提供的时序数据的异常检测方法,适用于对任意一款业务的时序数据进行异常检测,不但可以实时进行检测并智能告警,提升告警准确性,进而帮助运营人员及时发现问题,无需人工设置收敛规则,而且还能够根据曲线形态自动地选择相应的方式进行异常点判别。
在另一个实施例中,如果有训练集,则上述实施例中利用孤立森林算法进行告警收敛,还可以替换为利用有监督的决策树算法进行告警收敛,本申请实施例对此不进行具体限定。
另外,在曲线分类过程中,作为特征值的波动值Lenth在上述实施例中是基于四分位距计算的,除此之外,还可以替换为用中位数或平均值替换,本申请实施例对此同样不进行具体限定。
另外,上述实施例除了利用DBSCAN聚类方式对特征值进行聚类之外,还可以直接采用阈值进行聚类,本申请实施例对此同样不进行具体限定。
图21是本申请实施例提供的一种时序数据的异常检测装置的结构示意图。参见图21,该装置包括:
第一获取模块2101,用于获取不同业务的时序数据;
分类模块2102,用于对获取到的各项时序数据的时序曲线进行分类,所述时序曲线描述了所述时序数据随时间的变化趋势;
检测模块2103,用于对于任意一项时序数据,确定与所述时序数据的时序曲线的分类类别匹配的目标预测方式,基于所述目标预测方式对所述时序数据进行预测,得到预测数据,将所述时序数据与所述预测数据进行比对,得到所述时序数据中包括的异常数据值。
本申请实施例提供的装置,针对多个业务的多个时序数据,首先对多个时序数据的时序曲线进行分类;之后,针对归属于不同分类类别的时序曲线,采用不同的方式进行异常点判别,即本申请实施例实现了针对不同的曲线形态自动地选择相应的方式进行异常点判别,由于对不同类型的时序曲线进行了分类,充分考虑了不同曲线的形态,因此本申请实施例适用于对任意一个业务的时序数据进行异常检测,提升了异常检测的准确性,能够帮助运营人员及时发现问题,该种异常检测方式的效果较佳。
在一种可能的实现方式中,分类模块2102,还用于获取各个时序曲线的波动值,所述波动值反应所述时序曲线的波动频繁度;对所述各个时序曲线的波动值进行聚类,得到多个初始分类;在所述多个初始分类中确定数据值最大的第一分类;将所述多个初始分类中除所述第一分类之外的剩余分类进行合并,得到第二分类,所述第一分类的曲线平缓度大于所述第二分类的曲线平缓度,所述第一分类的曲线周期性大于所述第二分类的曲线周期性。
在一种可能的实现方式中,分类模块2102,还用于对于任意一个时序曲线,获取相应的时序数据的差分序列;确定所述差分序列的第一四分位数和第三四分位数;根据所述第一四分位数和所述第三四分位数,分别确定所述差分序列的高点阈值和低点阈值;获取所述差分序列中大于所述高点阈值以及小于所述低点阈值的数据值个数,将所述数据值个数作为所述时序曲线的波动值。
在一种可能的实现方式中,检测模块2103,还用于当所述时序曲线的分类类别为第一分类时,基于与所述第一分类匹配的第一预测算法对所述时序数据进行预测,得到所述预测数据;或,当所述时序曲线的分类类别为第二分类时,基于与所述第二分类匹配的第二预测算法对所述时序数据进行预测,得到所述预测数据。
在一种可能的实现方式中,检测模块2103,还用于对于所述时序数据,获取当前时间窗口内各个数据值的平均值,得到一个预测值;按照第一预设步长滑动时间窗口,获取下一个时间窗口内各个数据值的平均值,得到另一个预测值;重复执行滑动时间窗口并获取平均值的步骤,直至最后一个时间窗口,得到所述预测数据。
在一种可能的实现方式中,检测模块2103,还用于对于所述时序数据,获取当前时间窗口内各个数据值的指数加权平均值,得到一个预测值;按照第二预设步长滑动时间窗口,获取下一个时间窗口内各个数据值的指数加权平均值,得到另一个预测值;重复执行滑动时间窗口并获取指数加权平均值的步骤,直至最后一个时间窗口,得到所述预测数据。
在一种可能的实现方式中,检测模块2103获取所述指数加权平均值的方式为:
其中,EMA指代所述指数加权平均值,α为常数,α的取值为(0,1)之间的小数,P1至P4指代一个时间窗口内包括的数据值。
在一种可能的实现方式中,检测模块2103,还用于对于所述时序数据中的任意一个数据值,将所述数据值与所述预测数据中相应时刻的预测值进行比对;当所述数据值与所述预测值之差大于目标阈值时,将所述数据值作为所述异常数据值,所述目标阈值为N倍的所述时序数据的方差,N的取值大于0。
在一种可能的实现方式中,参见图22,该装置还包括:
第二获取模块2104,用于获取所述时序数据中每个所述异常数据值的异常分值;
过滤模块2105,用于根据每个所述异常数据值的异常分值,对所述时序数据中包括的异常数据值进行过滤,得到目标异常数据值;
告警模块2106,用于对所述目标异常数据值进行告警处理。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
需要说明的是:上述实施例提供的时序数据的异常检测装置在进行时序数据的异常检测时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的时序数据的异常检测装置与时序数据的异常检测方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图23示出了本申请一个示例性实施例提供的时序数据的异常检测设备2300的结构框图。该设备2300可以是便携式移动终端,比如:智能手机、平板电脑、MP3播放器(MovingPicture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。设备2300还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,设备2300包括有:处理器2301和存储器2302。
处理器2301可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器2301可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器2301也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器2301可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器2301还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器2302可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器2302还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器2302中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器2301所执行以实现本申请中方法实施例提供的时序数据的异常检测方法。
在一些实施例中,设备2300还可选包括有:外围设备接口2303和至少一个外围设备。处理器2301、存储器2302和外围设备接口2303之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口2303相连。具体地,外围设备包括:射频电路2304、触摸显示屏2305、摄像头2306、音频电路2307、定位组件2308和电源2309中的至少一种。
外围设备接口2303可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器2301和存储器2302。在一些实施例中,处理器2301、存储器2302和外围设备接口2303被集成在同一芯片或电路板上;在一些其他实施例中,处理器2301、存储器2302和外围设备接口2303中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路2304用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路2304通过电磁信号与通信网络以及其他通信设备进行通信。射频电路2304将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路2304包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路2304可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路2304还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏2305用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏2305是触摸显示屏时,显示屏2305还具有采集在显示屏2305的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器2301进行处理。此时,显示屏2305还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏2305可以为一个,设置设备2300的前面板;在另一些实施例中,显示屏2305可以为至少两个,分别设置在设备2300的不同表面或呈折叠设计;在再一些实施例中,显示屏2305可以是柔性显示屏,设置在设备2300的弯曲表面上或折叠面上。甚至,显示屏2305还可以设置成非矩形的不规则图形,也即异形屏。显示屏2305可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件2306用于采集图像或视频。可选地,摄像头组件2306包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件2306还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路2307可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器2301进行处理,或者输入至射频电路2304以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在设备2300的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器2301或射频电路2304的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路2307还可以包括耳机插孔。
定位组件2308用于定位设备2300的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件2308可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。
电源2309用于为设备2300中的各个组件进行供电。电源2309可以是交流电、直流电、一次性电池或可充电电池。当电源2309包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,设备2300还包括有一个或多个传感器2310。该一个或多个传感器2310包括但不限于:加速度传感器2311、陀螺仪传感器2312、压力传感器2313、指纹传感器2314、光学传感器2315以及接近传感器2316。
加速度传感器2311可以检测以设备2300建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器2311可以用于检测重力加速度在三个坐标轴上的分量。处理器2301可以根据加速度传感器2311采集的重力加速度信号,控制触摸显示屏2305以横向视图或纵向视图进行用户界面的显示。加速度传感器2311还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器2312可以检测设备2300的机体方向及转动角度,陀螺仪传感器2312可以与加速度传感器2311协同采集用户对设备2300的3D动作。处理器2301根据陀螺仪传感器2312采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器2313可以设置在设备2300的侧边框和/或触摸显示屏2305的下层。当压力传感器2313设置在设备2300的侧边框时,可以检测用户对设备2300的握持信号,由处理器2301根据压力传感器2313采集的握持信号进行左右手识别或快捷操作。当压力传感器2313设置在触摸显示屏2305的下层时,由处理器2301根据用户对触摸显示屏2305的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器2314用于采集用户的指纹,由处理器2301根据指纹传感器2314采集到的指纹识别用户的身份,或者,由指纹传感器2314根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器2301授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器2314可以被设置设备2300的正面、背面或侧面。当设备2300上设置有物理按键或厂商Logo时,指纹传感器2314可以与物理按键或厂商Logo集成在一起。
光学传感器2315用于采集环境光强度。在一个实施例中,处理器2301可以根据光学传感器2315采集的环境光强度,控制触摸显示屏2305的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏2305的显示亮度;当环境光强度较低时,调低触摸显示屏2305的显示亮度。在另一个实施例中,处理器2301还可以根据光学传感器2315采集的环境光强度,动态调整摄像头组件2306的拍摄参数。
接近传感器2316,也称距离传感器,通常设置在设备2300的前面板。接近传感器2316用于采集用户与设备2300的正面之间的距离。在一个实施例中,当接近传感器2316检测到用户与设备2300的正面之间的距离逐渐变小时,由处理器2301控制触摸显示屏2305从亮屏状态切换为息屏状态;当接近传感器2316检测到用户与设备2300的正面之间的距离逐渐变大时,由处理器2301控制触摸显示屏2305从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图23中示出的结构并不构成对设备2300的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
图24是本申请实施例提供的一种时序数据的异常检测设备的结构示意图,该服务器2400可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)2401和一个或一个以上的存储器2402,其中,所述存储器2402中存储有至少一条指令,所述至少一条指令由所述处理器2401加载并执行以实现上述各个方法实施例提供的时序数据的异常检测方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括指令的存储器,上述指令可由终端中的处理器执行以完成上述实施例中的时序数据的异常检测方法。例如,所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (12)
1.一种时序数据的异常检测方法,其特征在于,所述方法包括:
获取不同业务的时序数据;
对获取到的各项时序数据的时序曲线进行分类,所述时序曲线描述了所述时序数据随时间的变化趋势;
对于任意一项时序数据,确定与所述时序数据的时序曲线的分类类别匹配的目标预测方式,基于所述目标预测方式对所述时序数据进行预测,得到预测数据,将所述时序数据与所述预测数据进行比对,得到所述时序数据中包括的异常数据值。
2.根据权利要求1所述的方法,其特征在于,所述对获取到的各项时序数据的时序曲线进行分类,包括:
获取各个时序曲线的波动值,所述波动值反应所述时序曲线的波动频繁度;
对所述各个时序曲线的波动值进行聚类,得到多个初始分类;
在所述多个初始分类中确定数据值最大的第一分类;
将所述多个初始分类中除所述第一分类之外的剩余分类进行合并,得到第二分类,所述第一分类的曲线平缓度大于所述第二分类的曲线平缓度,所述第一分类的曲线周期性大于所述第二分类的曲线周期性。
3.根据权利要求2所述的方法,其特征在于,所述获取各个时序曲线的波动值,包括:
对于任意一个时序曲线,获取相应的时序数据的差分序列;
确定所述差分序列的第一四分位数和第三四分位数;
根据所述第一四分位数和所述第三四分位数,分别确定所述差分序列的高点阈值和低点阈值;
获取所述差分序列中大于所述高点阈值以及小于所述低点阈值的数据值个数,将所述数据值个数作为所述时序曲线的波动值。
4.根据权利要求1所述的方法,其特征在于,所述确定与所述时序数据的时序曲线的分类类别匹配的目标预测方式,基于所述目标预测方式对所述时序数据进行预测,包括:
当所述时序曲线的分类类别为第一分类时,基于与所述第一分类匹配的第一预测算法对所述时序数据进行预测,得到所述预测数据;或,
当所述时序曲线的分类类别为第二分类时,基于与所述第二分类匹配的第二预测算法对所述时序数据进行预测,得到所述预测数据。
5.根据权利要求4所述的方法,其特征在于,所述基于与所述第一分类匹配的第一预测算法对所述时序数据进行预测,得到所述预测数据,包括:
对于所述时序数据,获取当前时间窗口内各个数据值的平均值,得到一个预测值;
按照第一预设步长滑动时间窗口,获取下一个时间窗口内各个数据值的平均值,得到另一个预测值;
重复执行滑动时间窗口并获取平均值的步骤,直至最后一个时间窗口,得到所述预测数据。
6.根据权利要求4所述的方法,其特征在于,所述基于与所述第二分类匹配的第二预测算法对所述时序数据进行预测,得到所述预测数据,包括:
对于所述时序数据,获取当前时间窗口内各个数据值的指数加权平均值,得到一个预测值;
按照第二预设步长滑动时间窗口,获取下一个时间窗口内各个数据值的指数加权平均值,得到另一个预测值;
重复执行滑动时间窗口并获取指数加权平均值的步骤,直至最后一个时间窗口,得到所述预测数据。
7.根据权利要求6所述的方法,其特征在于,所述指数加权平均值的获取方式为:
其中,EMA指代所述指数加权平均值,α为常数,α的取值为(0,1)之间的小数,P1至P4指代一个时间窗口内包括的数据值。
8.根据权利要求1所述的方法,其特征在于,所述将所述时序数据与所述预测数据进行比对,得到所述时序数据中包括的异常数据值,包括:
对于所述时序数据中的任意一个数据值,将所述数据值与所述预测数据中相应时刻的预测值进行比对;
当所述数据值与所述预测值之差大于目标阈值时,将所述数据值作为所述异常数据值,所述目标阈值为N倍的所述时序数据的方差,N的取值大于0。
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述时序数据中每个所述异常数据值的异常分值;
根据每个所述异常数据值的异常分值,对所述时序数据中包括的异常数据值进行过滤,得到目标异常数据值;
对所述目标异常数据值进行告警处理。
10.一种时序数据的异常检测装置,其特征在于,所述装置包括:
第一获取模块,用于获取不同业务的时序数据;
分类模块,用于对获取到的各项时序数据的时序曲线进行分类,所述时序曲线描述了所述时序数据随时间的变化趋势;
检测模块,用于对于任意一项时序数据,确定与所述时序数据的时序曲线的分类类别匹配的目标预测方式,基于所述目标预测方式对所述时序数据进行预测,得到预测数据,将所述时序数据与所述预测数据进行比对,得到所述时序数据中包括的异常数据值。
11.一种存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如权利要求1至9中任一个权利要求所述的时序数据的异常检测方法。
12.一种时序数据的异常检测设备,其特征在于,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如权利要求1至9中任一个权利要求所述的时序数据的异常检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910308733.4A CN110032670B (zh) | 2019-04-17 | 2019-04-17 | 时序数据的异常检测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910308733.4A CN110032670B (zh) | 2019-04-17 | 2019-04-17 | 时序数据的异常检测方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110032670A true CN110032670A (zh) | 2019-07-19 |
CN110032670B CN110032670B (zh) | 2022-11-29 |
Family
ID=67238719
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910308733.4A Active CN110032670B (zh) | 2019-04-17 | 2019-04-17 | 时序数据的异常检测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110032670B (zh) |
Cited By (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110442657A (zh) * | 2019-08-05 | 2019-11-12 | 北京远舢智能科技有限公司 | 一种基于大数据的智能管理平台 |
CN110597879A (zh) * | 2019-09-17 | 2019-12-20 | 第四范式(北京)技术有限公司 | 时序数据的处理方法和装置 |
CN110750429A (zh) * | 2019-09-06 | 2020-02-04 | 平安科技(深圳)有限公司 | 运维管理系统的异常检测方法、装置、设备及存储介质 |
CN110751371A (zh) * | 2019-09-20 | 2020-02-04 | 苏宁云计算有限公司 | 基于统计四分位距的商品库存风险预警方法、系统及计算机可读存储介质 |
CN110837874A (zh) * | 2019-11-18 | 2020-02-25 | 上海新炬网络信息技术股份有限公司 | 基于时间序列分类的业务数据异常检测方法 |
CN110851505A (zh) * | 2019-11-20 | 2020-02-28 | 鹏城实验室 | 一种数据处理框架、方法及系统 |
CN110889597A (zh) * | 2019-11-08 | 2020-03-17 | 北京宝兰德软件股份有限公司 | 业务时序指标异常检测方法及装置 |
CN111092891A (zh) * | 2019-12-20 | 2020-05-01 | 杭州安恒信息技术股份有限公司 | 一种网络中异常点的检测方法、检测系统及相关装置 |
CN111125195A (zh) * | 2019-12-25 | 2020-05-08 | 亚信科技(中国)有限公司 | 一种数据异常检测方法及装置 |
CN111145895A (zh) * | 2019-12-24 | 2020-05-12 | 中国科学院深圳先进技术研究院 | 异常数据的检测方法及终端设备 |
CN111277459A (zh) * | 2020-01-16 | 2020-06-12 | 新华三信息安全技术有限公司 | 一种设备异常检测方法、装置和机器可读存储介质 |
CN111276247A (zh) * | 2020-01-16 | 2020-06-12 | 山东超越数控电子股份有限公司 | 一种基于大数据处理的飞参数据健康评估方法,设备及可读存储介质 |
CN111324639A (zh) * | 2020-02-11 | 2020-06-23 | 京东数字科技控股有限公司 | 数据监测方法、装置及计算机可读存储介质 |
CN111563073A (zh) * | 2020-04-20 | 2020-08-21 | 杭州市质量技术监督检测院 | Nqi信息共享的方法、平台、服务器及可读存储介质 |
CN111726341A (zh) * | 2020-06-02 | 2020-09-29 | 五八有限公司 | 一种数据检测方法、装置、电子设备及存储介质 |
CN112084893A (zh) * | 2020-08-24 | 2020-12-15 | 中国银联股份有限公司 | 生物识别终端异常检测方法、装置、设备及存储介质 |
CN112445832A (zh) * | 2019-08-28 | 2021-03-05 | 北京达佳互联信息技术有限公司 | 数据异常检测方法、装置、电子设备及存储介质 |
CN112465646A (zh) * | 2021-01-21 | 2021-03-09 | 深圳华锐金融技术股份有限公司 | 证券数据监控方法、装置、计算机设备和存储介质 |
CN112541016A (zh) * | 2020-11-26 | 2021-03-23 | 南方电网数字电网研究院有限公司 | 用电异常检测方法、装置、计算机设备和存储介质 |
CN113079129A (zh) * | 2020-01-06 | 2021-07-06 | 阿里巴巴集团控股有限公司 | 数据异常检测方法、装置、系统及电子设备 |
CN113297195A (zh) * | 2021-07-28 | 2021-08-24 | 云智慧(北京)科技有限公司 | 一种时间序列异常检测方法、装置及设备 |
CN113420652A (zh) * | 2021-06-22 | 2021-09-21 | 中冶赛迪重庆信息技术有限公司 | 一种时序信号片段异常识别方法、系统、介质及终端 |
CN113536042A (zh) * | 2021-07-28 | 2021-10-22 | 云智慧(北京)科技有限公司 | 一种时间序列异常检测方法、装置及设备 |
CN113782187A (zh) * | 2021-09-10 | 2021-12-10 | 平安国际智慧城市科技股份有限公司 | 指标数据处理方法、相关设备及介质 |
CN114579827A (zh) * | 2022-05-06 | 2022-06-03 | 昆仑智汇数据科技(北京)有限公司 | 一种工业设备数据性能曲线的处理方法、装置及设备 |
CN116125325A (zh) * | 2022-12-06 | 2023-05-16 | 北汽福田汽车股份有限公司 | 电池的电芯一致性的检测方法及装置、车辆和存储介质 |
CN117353751A (zh) * | 2023-12-06 | 2024-01-05 | 山东万辉新能源科技有限公司 | 基于大数据的无人充电桩交易数据智能管理系统 |
CN117391481A (zh) * | 2023-12-11 | 2024-01-12 | 阿尔卑斯系统集成(大连)有限公司 | 一种基于大数据的电力数据监视方法及系统 |
CN112084893B (zh) * | 2020-08-24 | 2024-05-17 | 中国银联股份有限公司 | 生物识别终端异常检测方法、装置、设备及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002215163A (ja) * | 2001-01-17 | 2002-07-31 | Yamaha Corp | 波形データ解析方法、波形データ解析装置および記録媒体 |
US20080292201A1 (en) * | 2003-08-13 | 2008-11-27 | Adriana Dumitras | Pre-processing method and system for data reduction of video sequences and bit rate reduction of compressed video sequences using spatial filtering |
CN104992050A (zh) * | 2015-06-12 | 2015-10-21 | 哈尔滨工业大学 | 基于统计信号处理的时间序列特性评价的预测模型选择方法 |
CN105760895A (zh) * | 2016-03-18 | 2016-07-13 | 中国电力科学研究院 | 一种光伏出力波动类型的划分方法 |
CN106872657A (zh) * | 2017-01-05 | 2017-06-20 | 河海大学 | 一种多变量水质参数时序数据异常事件检测方法 |
JP2017151497A (ja) * | 2016-02-22 | 2017-08-31 | 東京電力ホールディングス株式会社 | 時系列モデルパラメータの推定方法 |
CN109241133A (zh) * | 2018-08-14 | 2019-01-18 | 北京粉笔未来科技有限公司 | 数据监测方法、装置、计算设备及存储介质 |
CN109493979A (zh) * | 2018-10-23 | 2019-03-19 | 平安科技(深圳)有限公司 | 一种基于智能决策的疾病预测方法和装置 |
CN109542740A (zh) * | 2017-09-22 | 2019-03-29 | 阿里巴巴集团控股有限公司 | 异常检测方法及装置 |
-
2019
- 2019-04-17 CN CN201910308733.4A patent/CN110032670B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002215163A (ja) * | 2001-01-17 | 2002-07-31 | Yamaha Corp | 波形データ解析方法、波形データ解析装置および記録媒体 |
US20080292201A1 (en) * | 2003-08-13 | 2008-11-27 | Adriana Dumitras | Pre-processing method and system for data reduction of video sequences and bit rate reduction of compressed video sequences using spatial filtering |
CN104992050A (zh) * | 2015-06-12 | 2015-10-21 | 哈尔滨工业大学 | 基于统计信号处理的时间序列特性评价的预测模型选择方法 |
JP2017151497A (ja) * | 2016-02-22 | 2017-08-31 | 東京電力ホールディングス株式会社 | 時系列モデルパラメータの推定方法 |
CN105760895A (zh) * | 2016-03-18 | 2016-07-13 | 中国电力科学研究院 | 一种光伏出力波动类型的划分方法 |
CN106872657A (zh) * | 2017-01-05 | 2017-06-20 | 河海大学 | 一种多变量水质参数时序数据异常事件检测方法 |
CN109542740A (zh) * | 2017-09-22 | 2019-03-29 | 阿里巴巴集团控股有限公司 | 异常检测方法及装置 |
CN109241133A (zh) * | 2018-08-14 | 2019-01-18 | 北京粉笔未来科技有限公司 | 数据监测方法、装置、计算设备及存储介质 |
CN109493979A (zh) * | 2018-10-23 | 2019-03-19 | 平安科技(深圳)有限公司 | 一种基于智能决策的疾病预测方法和装置 |
Non-Patent Citations (2)
Title |
---|
JOHN PAPARRIZOS等: "Fast and Accurate Time-Series Clustering", 《ACM TRANSACTIONS ON DATABASE SYSTEMS》 * |
吴振强等: "雷达PRI调制样式特性曲线的识别", 《四川兵工学报 》 * |
Cited By (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110442657A (zh) * | 2019-08-05 | 2019-11-12 | 北京远舢智能科技有限公司 | 一种基于大数据的智能管理平台 |
CN112445832A (zh) * | 2019-08-28 | 2021-03-05 | 北京达佳互联信息技术有限公司 | 数据异常检测方法、装置、电子设备及存储介质 |
CN112445832B (zh) * | 2019-08-28 | 2024-02-23 | 北京达佳互联信息技术有限公司 | 数据异常检测方法、装置、电子设备及存储介质 |
CN110750429A (zh) * | 2019-09-06 | 2020-02-04 | 平安科技(深圳)有限公司 | 运维管理系统的异常检测方法、装置、设备及存储介质 |
CN110597879B (zh) * | 2019-09-17 | 2022-01-14 | 第四范式(北京)技术有限公司 | 时序数据的处理方法和装置 |
CN110597879A (zh) * | 2019-09-17 | 2019-12-20 | 第四范式(北京)技术有限公司 | 时序数据的处理方法和装置 |
CN110751371A (zh) * | 2019-09-20 | 2020-02-04 | 苏宁云计算有限公司 | 基于统计四分位距的商品库存风险预警方法、系统及计算机可读存储介质 |
CN110889597A (zh) * | 2019-11-08 | 2020-03-17 | 北京宝兰德软件股份有限公司 | 业务时序指标异常检测方法及装置 |
CN110837874B (zh) * | 2019-11-18 | 2023-05-26 | 上海新炬网络信息技术股份有限公司 | 基于时间序列分类的业务数据异常检测方法 |
CN110837874A (zh) * | 2019-11-18 | 2020-02-25 | 上海新炬网络信息技术股份有限公司 | 基于时间序列分类的业务数据异常检测方法 |
CN110851505B (zh) * | 2019-11-20 | 2023-12-22 | 鹏城实验室 | 一种数据处理框架、方法及系统 |
CN110851505A (zh) * | 2019-11-20 | 2020-02-28 | 鹏城实验室 | 一种数据处理框架、方法及系统 |
CN111092891A (zh) * | 2019-12-20 | 2020-05-01 | 杭州安恒信息技术股份有限公司 | 一种网络中异常点的检测方法、检测系统及相关装置 |
CN111092891B (zh) * | 2019-12-20 | 2022-04-01 | 杭州安恒信息技术股份有限公司 | 一种网络中异常点的检测方法、检测系统及相关装置 |
CN111145895B (zh) * | 2019-12-24 | 2023-10-20 | 中国科学院深圳先进技术研究院 | 异常数据的检测方法及终端设备 |
CN111145895A (zh) * | 2019-12-24 | 2020-05-12 | 中国科学院深圳先进技术研究院 | 异常数据的检测方法及终端设备 |
CN111125195B (zh) * | 2019-12-25 | 2023-09-08 | 亚信科技(中国)有限公司 | 一种数据异常检测方法及装置 |
CN111125195A (zh) * | 2019-12-25 | 2020-05-08 | 亚信科技(中国)有限公司 | 一种数据异常检测方法及装置 |
CN113079129B (zh) * | 2020-01-06 | 2023-08-08 | 阿里巴巴集团控股有限公司 | 数据异常检测方法、装置、系统及电子设备 |
CN113079129A (zh) * | 2020-01-06 | 2021-07-06 | 阿里巴巴集团控股有限公司 | 数据异常检测方法、装置、系统及电子设备 |
CN111276247B (zh) * | 2020-01-16 | 2023-12-19 | 超越科技股份有限公司 | 一种基于大数据处理的飞参数据健康评估方法及设备 |
CN111276247A (zh) * | 2020-01-16 | 2020-06-12 | 山东超越数控电子股份有限公司 | 一种基于大数据处理的飞参数据健康评估方法,设备及可读存储介质 |
CN111277459A (zh) * | 2020-01-16 | 2020-06-12 | 新华三信息安全技术有限公司 | 一种设备异常检测方法、装置和机器可读存储介质 |
CN111324639B (zh) * | 2020-02-11 | 2023-11-03 | 京东科技控股股份有限公司 | 数据监测方法、装置及计算机可读存储介质 |
CN111324639A (zh) * | 2020-02-11 | 2020-06-23 | 京东数字科技控股有限公司 | 数据监测方法、装置及计算机可读存储介质 |
CN111563073B (zh) * | 2020-04-20 | 2023-07-07 | 杭州市质量技术监督检测院 | Nqi信息共享的方法、平台、服务器及可读存储介质 |
CN111563073A (zh) * | 2020-04-20 | 2020-08-21 | 杭州市质量技术监督检测院 | Nqi信息共享的方法、平台、服务器及可读存储介质 |
CN111726341A (zh) * | 2020-06-02 | 2020-09-29 | 五八有限公司 | 一种数据检测方法、装置、电子设备及存储介质 |
CN112084893B (zh) * | 2020-08-24 | 2024-05-17 | 中国银联股份有限公司 | 生物识别终端异常检测方法、装置、设备及存储介质 |
CN112084893A (zh) * | 2020-08-24 | 2020-12-15 | 中国银联股份有限公司 | 生物识别终端异常检测方法、装置、设备及存储介质 |
CN112541016A (zh) * | 2020-11-26 | 2021-03-23 | 南方电网数字电网研究院有限公司 | 用电异常检测方法、装置、计算机设备和存储介质 |
CN112465646A (zh) * | 2021-01-21 | 2021-03-09 | 深圳华锐金融技术股份有限公司 | 证券数据监控方法、装置、计算机设备和存储介质 |
CN113420652B (zh) * | 2021-06-22 | 2023-07-14 | 中冶赛迪信息技术(重庆)有限公司 | 一种时序信号片段异常识别方法、系统、介质及终端 |
CN113420652A (zh) * | 2021-06-22 | 2021-09-21 | 中冶赛迪重庆信息技术有限公司 | 一种时序信号片段异常识别方法、系统、介质及终端 |
CN113536042A (zh) * | 2021-07-28 | 2021-10-22 | 云智慧(北京)科技有限公司 | 一种时间序列异常检测方法、装置及设备 |
CN113297195A (zh) * | 2021-07-28 | 2021-08-24 | 云智慧(北京)科技有限公司 | 一种时间序列异常检测方法、装置及设备 |
CN113297195B (zh) * | 2021-07-28 | 2022-03-15 | 云智慧(北京)科技有限公司 | 一种时间序列异常检测方法、装置及设备 |
CN113782187B (zh) * | 2021-09-10 | 2023-06-27 | 深圳平安智慧医健科技有限公司 | 指标数据处理方法、相关设备及介质 |
CN113782187A (zh) * | 2021-09-10 | 2021-12-10 | 平安国际智慧城市科技股份有限公司 | 指标数据处理方法、相关设备及介质 |
CN114579827A (zh) * | 2022-05-06 | 2022-06-03 | 昆仑智汇数据科技(北京)有限公司 | 一种工业设备数据性能曲线的处理方法、装置及设备 |
CN114579827B (zh) * | 2022-05-06 | 2022-08-05 | 昆仑智汇数据科技(北京)有限公司 | 一种工业设备数据性能曲线的处理方法、装置及设备 |
CN116125325A (zh) * | 2022-12-06 | 2023-05-16 | 北汽福田汽车股份有限公司 | 电池的电芯一致性的检测方法及装置、车辆和存储介质 |
CN117353751A (zh) * | 2023-12-06 | 2024-01-05 | 山东万辉新能源科技有限公司 | 基于大数据的无人充电桩交易数据智能管理系统 |
CN117353751B (zh) * | 2023-12-06 | 2024-02-23 | 山东万辉新能源科技有限公司 | 基于大数据的无人充电桩交易数据智能管理系统 |
CN117391481A (zh) * | 2023-12-11 | 2024-01-12 | 阿尔卑斯系统集成(大连)有限公司 | 一种基于大数据的电力数据监视方法及系统 |
CN117391481B (zh) * | 2023-12-11 | 2024-03-01 | 阿尔卑斯系统集成(大连)有限公司 | 一种基于大数据的电力数据监视方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110032670B (zh) | 2022-11-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110032670A (zh) | 时序数据的异常检测方法、装置、设备及存储介质 | |
Reddy et al. | Using mobile phones to determine transportation modes | |
CN110163380B (zh) | 数据分析方法、模型训练方法、装置、设备及存储介质 | |
CN110083791B (zh) | 目标群组检测方法、装置、计算机设备及存储介质 | |
CN110795625B (zh) | 推荐方法、装置、计算机设备及存储介质 | |
CN109389162B (zh) | 样本图像筛选方法和装置、电子设备及存储介质 | |
CN110262947A (zh) | 阈值告警方法、装置、计算机设备及存储介质 | |
CN107773214A (zh) | 一种最佳唤醒策略的方法、计算机可读介质和系统 | |
CN109784351B (zh) | 行为数据分类方法、分类模型训练方法及装置 | |
CN108304758A (zh) | 人脸特征点跟踪方法及装置 | |
CN110147805A (zh) | 图像处理方法、装置、终端及存储介质 | |
CN109213732A (zh) | 一种改善相册分类的方法、移动终端及计算机可读存储介质 | |
CN109189950A (zh) | 多媒体资源分类方法、装置、计算机设备及存储介质 | |
CN110942046B (zh) | 图像检索方法、装置、设备及存储介质 | |
KR20220092629A (ko) | IoT 디바이스의 알람 규칙 구성 방법 및 장치, 디바이스, 및 저장 매체 | |
CN110162956A (zh) | 确定关联账户的方法和装置 | |
CN105190474B (zh) | 用于功率效率分类的经应用控制的粒度 | |
CN113505256B (zh) | 特征提取网络训练方法、图像处理方法及装置 | |
CN110166275B (zh) | 信息处理方法、装置及存储介质 | |
CN110490389A (zh) | 点击率预测方法、装置、设备及介质 | |
CN108876614A (zh) | 用于贵金属领域的数据预测方法、装置及存储介质 | |
CN114897158A (zh) | 数据处理模型的训练方法、数据处理方法、装置及设备 | |
CN112232890A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN109671425A (zh) | 音频分类方法、装置及存储介质 | |
CN112116480A (zh) | 虚拟资源确定方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |