CN112989271A - 时间序列分解 - Google Patents

时间序列分解 Download PDF

Info

Publication number
CN112989271A
CN112989271A CN202011138773.8A CN202011138773A CN112989271A CN 112989271 A CN112989271 A CN 112989271A CN 202011138773 A CN202011138773 A CN 202011138773A CN 112989271 A CN112989271 A CN 112989271A
Authority
CN
China
Prior art keywords
component
time series
series data
periodic
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011138773.8A
Other languages
English (en)
Inventor
文青松
高靖昆
宋晓旻
孙亮
许欢
印卧涛
姚韬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of CN112989271A publication Critical patent/CN112989271A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/064Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/065Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Debugging And Monitoring (AREA)

Abstract

提供时间序列分解方法和系统。接收至少包括周期性分量的时间序列数据,去噪滤波器可应用于所述时间序列数据。此外,从所述时间序列数据中提取趋势分量和所述周期性分量。随后可以基于所述趋势分量和所述周期性分量从所述时间序列数据中提取残差分量。然后可以对所述趋势分量或所述残差分量执行异常测试,以确定所述时间序列数据中是否存在异常。

Description

时间序列分解
背景
时间序列是按时间顺序索引的一系列数据点。时间序列的例子可以包括每天访问某个网站的用户数量、每天某个股票指数的收盘值、每天通过某条道路的车辆数量等。这些时间序列包含了对异常检测、预测和分类等时间序列任务有价值和有用的信息。然而,时间序列通常表现出复杂的模式,例如,可能包括与趋势、季节性(或周期性)、异常值和噪声相关的分量。为了改进和提升如上所述的后续时间序列任务的性能,在执行时间序列任务(例如异常测试)之前,通常需要将时间序列稳定而准确地分解为各种分量(例如趋势分量、周期性分量、噪声分量等)。
提出了各种方法来分解时间序列,例如标准STL(使用拟合的周期趋势组件)。然而,这些方法要么计算量大,要么太不灵活,无法适应时间序列的各种情况(如长时间周期、高噪声、异常值、趋势变化等)。此外,这些时间序列分解方法可能基于对实际时间序列不适用的模型(例如,高斯噪声模型)。
发明内容
本发明内容介绍了时间序列分解系统的简化概念,下面将在具体实施方式中进一步描述。该发明内容不旨在确定所要求保护的权利要求的区别技术特征,也不旨在用于限制所要求保护的权利要求的范围。
本发明描述了时间序列分解系统的实施示例。在实施中,接收至少包括具有已知周期长度的周期性分量的时间序列数据。在实施中,所述时间序列数据可以进一步包括可能是恒定的(例如,没有趋势)的趋势分量,或者可以是缓慢变化或具有突变的趋势分量。去噪滤波器可应用于所述时间序列数据。进一步的,从所述时间序列中提取所述趋势分量和所述周期性分量。随后可以基于所述趋势分量和所述周期性分量从所述时间序列数据中提取残差分量。然后可以对所述趋势分量或所述残差分量执行异常测试,以确定所述时间序列数据中是否存在异常。
附图说明
根据附图进行详细说明。在附图中,参考编号最左边的数字表示该参考编号的附图首次出现。在不同的附图中使用相同的参考编号,表明项目相似或相同。
图1示出了可以使用时间序列分解系统的环境示例。
图2更详细地示出了时间序列分解系统示例。
图3示出了时间序列分解的方法示例。
图4示出了在线异常测试的方法示例。
图5示出了ADMM算法、PDHG算法以及提出的GADMM算法的实验性能示例。
具体实施方式
综述
如上所述,现有的时间序列分解方法要么计算量大,要么不灵活,无法适应时间序列的各种条件(如长时间段、高噪声、异常值、趋势变化等)。
本发明披露了一个示例性时间序列分解系统。所述时间序列分解系统可以接收时间序列数据,并去除所述时间序列数据中的噪声和异常值。然后,所述时间序列分解系统可以基于特定的分解方法将所述时间序列数据分解为各种分量,例如,趋势分量、周期性分量和残差分量。在实施中,所述趋势分量可以包括变化(缓慢或突然)的趋势,以及所述周期性分量可以包括周期性变化或波动。
在获取所述各种分量后,所述时间序列分解系统可以对所述趋势分量或所述残差分量进行异常测试,以确定所述时间序列数据中是否存在异常。或者,所述时间序列分解系统可以基于所述趋势分量、所述周期性分量和所述残差分量预测所述时间序列数据的未来数据点。由于所述时间序列分解系统能够有效地实时地执行上述分解,因此所述时间序列分解系统可以在线上模式执行时间序列的分解,因此也适用于流式时间序列数据的处理。
在实施中,本文描述的由时间序列分解系统执行的功能可以由多个独立的单元或服务器来执行。例如,接收服务器可以接收时间序列数据,而过滤服务器可以从所述时间序列数据中去除异常值和噪声。分解服务器将时间序列数据分解为趋势分量、周期性分量和残差分量,以及测试服务器可以基于所述趋势分量和/或所述残差分量来确定所述时间序列数据中是否存在异常。在实施中,预测服务器可以基于所述趋势分量、所述周期性分量和所述残差分量来预测所述时间序列数据的未来数据点。
此外,尽管在本文描述的示例中,所述时间序列分解系统可以被实现为安装在单个设备中的软件和硬件的组合,但是在其他示例中,所述时间序列分解系统可以在多个设备中实施和分布,或者作为网络和/或在云计算架构中的一个或多个计算设备所提供的服务。
本申请描述了多种不同的实施例和实施过程。下一部分描述了一个适用于实践各种实施过程的示例框架。接下来,本申请描述用于实施时间序列分解系统的示例系统、设备和流程。
示例环境
图1示出了可用于实施时间序列分解系统的示例性环境100。所述环境100可以包括时间序列分解系统102。在该示例中,所述时间序列分解系统102被描述为作为单个实体或装置存在。在一些实例中,所述时间序列分解系统102可以包括在诸如客户端设备104的计算设备中。在其它实例中,所述时间序列分解系统102可以包括在一个或多个服务器中,例如云中的一个或多个服务器106。例如,所述时间序列分解系统102的部分或全部功能可以包括在经由网络108连接和通信的客户端设备104和/或一个或多个服务器106中或由其提供。
在实施中,客户端设备104可以作为各种计算设备中的任何一种进行实施,包括但不限于台式计算机、笔记本或便携式计算机、手持设备、上网本、互联网设备、平板电脑或平板计算机、移动设备(例如,移动电话、个人数字助理、智能手机等)、服务器等,或其组合。
所述网络108可以是无线或有线网络,或其组合。所述网络108可以是相互连接并作为单一的大型网络(例如,因特网或内联网)运行的个人网络的集合。此类个人网络的示例包括但不限于电话网络、有线网络、局域网(lan)、广域网(wan)和城域网(man)。此外,各个网络可以是无线或有线网络,或其组合。有线网络可包括电载波连接(如通信电缆等)和/或光载波或连接(例如光纤连接等)。无线网络可包括例如WiFi网络、其他射频网络(例如,
Figure BDA0002737541450000031
Zigbee等)等。
在实施中,所述时间序列分解系统102可以接收时间序列数据,并从所述时间序列数据中去除噪声和异常值。然后,所述时间序列分解系统102可以将所述时间序列数据分解为各种分量,例如趋势分量、周期性分量和残差分量。在获得所述各种分量之后,所述时间序列分解系统102可以对所述趋势分量或所述残差分量执行异常测试,以确定所述时间序列数据中是否存在异常。此外或可选地,所述时间序列分解系统102可以基于所述趋势分量、所述周期性分量和所述残差分量为所述时间序列数据预测未来数据点。
时间序列分解系统示例
图2更详细地示出了所述时间序列分解系统102。在实施中,所述时间序列分解系统102可以包括但不限于一个或多个处理器202、存储器204和程序数据206。在实施中,所述时间序列分解系统102可进一步包括输入/输出(I/O)接口208和/或网络接口210。在实施中,所述时间序列分解系统102的一些功能可以使用硬件来实现,例如,ASIC(即,特定应用的集成电路)、FPGA(即,现场可编程门阵列)和/或其他硬件。
在实施中,所述处理器202可以被配置成用于执行存储在所述存储器204中的指令,和/或从输入/输出接口208和/或网络接口210接收的指令。在实施中,所述处理器202可以作为一个或多个硬件处理器进行实施,例如,微处理器、特定应用的指令集处理器、物理处理单元(PPU)、中央处理单元(CPU)、图形处理单元、数字信号处理器、张量处理单元等,此外或可选地,本文所描述的功能可以至少部分地由一个或多个硬件逻辑组件来执行。例如,并且不限于,可以使用的硬件逻辑组件的说明性类型包括现场可编程门阵列(FPGAs)、专用集成电路(ASICs)、特定于应用的标准产品(ASSPs)、系统级芯片系统(SOCs)、复杂可编程逻辑器件(CPLDs)等。
所述存储器204可以包括易失性存储器形式的计算机可读存储介质,例如随机存取存储器(RAM)和/或非易失性存储器,例如只读存储器(ROM)或闪存RAM。所述存储器204是计算机可读存储介质的一个示例。
所述计算机可读存储介质可以包括易失性或非易失性类型、可移动或不可移动介质,其可以使用任何方法或技术来实现信息的存储。该信息可以包括计算机可读指令、数据结构、程序模块或其他数据。计算机可读存储介质的示例包括但不限于相变存储器(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其它类型的随机存取存储器(RAM)、只读存储器(ROM)、电子可擦除可编程只读存储器(EEPROM),快速闪存或其他内部存储技术、光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光盘存储器、盒式磁带、磁盘存储器或其他磁存储设备,或任何其他非传输介质,它可以用来存储计算设备可以访问的信息。如本文所定义,计算机可读介质不包括任何临时介质,例如调制数据信号和载波。
虽然在这个例子中,在所述时间序列分解系统102中只描述了硬件组件,但是在其他实例中,所述时间序列分解系统102还可以包括其他硬件组件和/或其他软件组件,例如用于执行存储器204中存储的用于执行各种操作的指令的程序单元。例如,所述时间序列分解系统102可以进一步包括存储时间序列数据的时间序列数据库212。
方法示例
图3示出了描述时间序列分解的方法示例的示意图。图4示出了描述在线异常测试的方法示例的示意图。图3和图4的方法可以但不必在图1的环境中使用图2的系统进行实施。为了便于解释,参考图1和图2描述方法300和400。然而,方法300和400可择一地在其他环境中和/或使用其他系统来实施。
在计算机可执行指令的一般情况下描述所述方法300和方法400。通常,计算机可执行指令可以包括例程、程序、对象、分量、数据结构、规程、模块、函数以及执行特定函数或实施特定抽象数据类型的类。此外,每个方法示例被表示为逻辑流程图中表示操作序列的框的集合,所述逻辑流程图表示可在硬件、软件、固件或其组合中实施的操作序列。所描述的方法的顺序不打算被解释为一种限制,并且可以以任何顺序组合任意数量的所述方法的框来实施所述方法或替代该方法。另外,在不脱离本文所描述主题的精神和范围的情况下,可以从方法中省略各个框。在软件情况下,所述框表示计算机指令,当由一个或多个处理器执行时,执行所列举的操作。在硬件情况下,所述部分或全部框可以表示执行所列举操作的专用集成电路芯片(ASICs)或其它物理部件。
回到图3,在框302中,所述时间序列分解系统102可以接收时间序列数据(即,与时间序列相关联的数据或数据点),所述时间序列数据至少包括一个周期性分量。
在实施中,所述时间序列分解系统102可以从客户端设备104或一个或多个服务器106中的一个服务器接收所述时间序列数据(即,与时间序列相关联的数据或数据点)。所述时间序列数据可以包括按时间顺序排列的一系列数据点。在实施中,所述时间序列数据可以对应于某个实际应用,例如每日或每小时访问某个网站的用户数量、每日或每小时某个股票指数的收盘值、每日或每小时通过某条道路的车辆的数量等。在实施中,所述时间序列数据可以至少包括具有可能已知或可能未知的周期性长度的周期性分量,例如每天或每周的周期性长度。在实施中,所述时间序列数据可以进一步包括可能是恒量(即,没有趋势)的趋势分量,或者趋势分量可以是缓慢变化的或突变的。
在框304中,所述时间序列分解系统102可以对所述时间序列数据应用去噪滤波器。
在实施中,所述时间序列数据可以包括多个不同的分量,例如趋势分量、周期性分量、残差分量、异常值分量和噪声分量。作为示例而非限制,所述时间序列数据(y1,…,yN)可以分解为或表述为以下形式:
yt=stt+rt t=1,2,…,N (1)
其中yt表示时间t的观测值,st表示具有周期长度(周期性长度)T的周期性分量,τt表示趋势分量,以及rt表示残差分量。
在实施中,所述趋势分量可以包括缓慢增加或减少的趋势分量,或者具有突变趋势的趋势分量,例如趋势中的水平突变。
在实施中,所述周期性分量可以包括在基线附近波动的周期性模式。另外或可选地,周期性分量可包括随时间缓慢变化或保持恒定的重复模式。此外或可选地,所述周期性分量可以包括在特定时间段内有规律地重复的模式,或者从一个时间段切换到另一个时间段的模式。
在实施中,所述残差分量可以包括所述时间序列数据中与所述趋势分量和所述周期性分量相关联的信号之外的信号。在实施中,该残差分量可进一步分解为两个分量,即,与异常值(例如,上升或下降)相关联的分量和与噪声相关联的分量(例如,高斯噪声)。作为示例而非限制,所述残差分量可以表示为:
rt=at+nt (2)
其中,at表示异常值(例如,上升或下降),以及nt表示噪声,例如白噪声。
在实施中,所述时间序列分解系统102可以对所述时间序列数据应用去噪滤波器,以去除包含在所述时间序列数据中的噪声,以获得滤波后的时间序列数据,例如
Figure BDA0002737541450000071
同时保存所述趋势分量τt中趋势的任何变化或波动(例如趋势的突然变化)和at中的上升或下降。所述去噪滤波器的示例可包括但不限于双边滤波器。
作为示例而非限制,在应用诸如双边滤波器的去噪滤波器之后,获得滤波后的时间序列数据,即
Figure BDA0002737541450000072
并表示为:
Figure BDA0002737541450000073
其中J表示长度为2H+1的滤波窗口,滤波器权重由两个高斯函数给出:
Figure BDA0002737541450000074
其中
Figure BDA0002737541450000075
是归一化因子,
Figure BDA0002737541450000076
Figure BDA0002737541450000077
是两个参数,它们控制过滤后的时间序列的平滑程度。
在应用所述去噪滤波器后,y′t=stt+r′t,其中
Figure BDA0002737541450000078
其中
Figure BDA0002737541450000079
表示过滤后的噪声。
在框306中,所述时间序列分解系统102可以从所述时间序列数据中提取所述趋势分量。
在实施中,所述时间序列分解系统102可以使用(但不限于)具有稀疏正则化的鲁棒的最小绝对偏差(LAD)回归来提取所述趋势分量。例如,gt表示周期性差分信号,即,
Figure BDA00027375414500000710
其中,
Figure BDA00027375414500000711
是一阶差分运算,并且后两个周期差分变量可以假设接近于零。在这种情况下,提取所述趋势分量可以表述为最小化以下加权和目标函数:
Figure BDA00027375414500000712
其中,
Figure BDA00027375414500000713
表示二阶差分运算。
由于LAD对异常值具有鲁棒性,方程(5)中的所述第一项对应于使用所述LAD的经验误差。方程(5)中的所述第二项和所述第三项分别是趋势分量τt的一阶和二阶差分算子约束。在实施中,方程(5)中的所述第二项可以假设趋势差
Figure BDA00027375414500000714
变化缓慢,并且可能出现一个或多个水平突变(即,所述趋势分量中趋势值的跳跃或下降)。方程(5)中的所述第三项可以假设所述趋势分量中的趋势是平滑的和分段线性的,因此,
Figure BDA00027375414500000715
是稀疏的。通过设计这种实施,所述趋势分量τt可以捕捉到水平突变和平缓的趋势变化。
在实施例中,所述目标函数I方程(5)可重写为如下所示的等效矩阵形式:
Figure BDA00027375414500000716
其中,‖x‖1=∑i|xi|表示向量x的l1范数,g和
Figure BDA00027375414500000717
是对应的向量形式,如下所示:
g=[gT+1,gT+2,…,gN]T (7)
Figure BDA0002737541450000081
其中M和D分别是(N-T)×(N-1)和(N-2)×(N-1)Toeplitz矩阵,其形式如下:
Figure BDA0002737541450000082
在实施中,为了便于求解提取所述趋势分量的过程,方程(6)中的所述三个l1范数可以被表示为单个l1范数,即:
f(x):=‖Ax-b‖1 (10)
其中x表示
Figure BDA0002737541450000083
以及矩阵A和向量b表示为:
Figure BDA0002737541450000084
在实施中,可以使用线性规划(LP)求解方程(10)中的最小化l1损耗。或者,对于大规模l1损耗最小化,可以使用ADMM算法。在实施中,方程(10)可改写为如下等效形式:
Figure BDA0002737541450000085
可以获得如下增广拉格朗日式:
Figure BDA0002737541450000086
其中u是对偶变量,ρ是惩罚参数。使用ADMM程序,可以获得如下更新步骤:
Figure BDA0002737541450000087
Figure BDA0002737541450000088
ut+1=arg minuLρ(x,y,u)=ut+ρ(Axt+1-yt+1-b) (15)
其中Sk(x)是软阈值算子,其被定义为:
Sκ(x)=(1-κ/|x|+x.
在实施中,由于方程(9)中所示特殊的矩阵结构,基于相应向量的累积求和和位移差,可以通过分别等效实施矩阵向量乘法获得yt+1和ut+1的更新步骤的
Figure BDA0002737541450000089
复杂性。此外,方程(13)中的(ATA)-1AT可以计算一次,然后存储更新步骤,以节省复杂性。上述ADMM算法可以带来比LP算法更快的运算速度,并且由于xt+1更新步骤中矩阵乘法的
Figure BDA0002737541450000091
运算,ADMM算法的每次迭代都是
Figure BDA0002737541450000092
在实施中,所述时间序列分解系统102可以设计和使用所提出的GADMM算法来提取趋势分量。在实施中,所述提出的GADMM算法可以利用矩阵M和D中的特殊结构,并且可以进一步将每次迭代的复杂度从
Figure BDA0002737541450000093
降低到
Figure BDA0002737541450000094
同时在迭代次数方面与ADMM算法的收敛性大概相同。
在实施中,由于矩阵M和D很像循环矩阵,并且循环矩阵对于线性系统具有良好属性,因此可以将
Figure BDA0002737541450000095
Figure BDA0002737541450000096
相加,得到对应的循环矩阵
Figure BDA0002737541450000097
Figure BDA0002737541450000098
如下所示:
Figure BDA0002737541450000099
Figure BDA00027375414500000910
在实施中,
Figure BDA00027375414500000911
其中
Figure BDA00027375414500000912
类似于方程(10)中的A,其结构如下:
Figure BDA00027375414500000913
在实施中,H和ATA之间的差可以表示为
Figure BDA00027375414500000914
其可以通过
Figure BDA00027375414500000915
Figure BDA00027375414500000916
进行计算。方程(13)中xt+1的更新步骤可通过增加一个额外的近端项
Figure BDA00027375414500000917
进行估算,以降低其复杂性,即:
Figure BDA00027375414500000918
其中v表示为:
Figure BDA0002737541450000101
在实施中,由于矩阵向量乘法中的特殊矩阵结构,可以获得针对计算v的
Figure BDA0002737541450000102
复杂度,类似于方程(14)和(15)中针对yt+1和ut+1的更新步骤。此外,由于
Figure BDA0002737541450000103
Figure BDA0002737541450000104
为循环矩阵,因此
Figure BDA0002737541450000105
也是循环矩阵。因此,可以采用离散傅立叶变换(DFT)和傅立叶逆变换(IDFT)来加快方程(17)中的矩阵运算H-1v。作为示例而非限制,如果F是(N-1)×(N-1)DFT变换矩阵,并且h是H的第一列,则可以获得以下关系:
H=F-1diag(Fh)F
因此,方程(17)中针对xt+1的更新步骤可简化为:
xt+1≈H-1v=F-1diag-1(Fh)Fv
=IDFT(DFT(v)./DFT(h)) (19)
其中,./表示点除法。
由于DFT/IDFT可以通过快速傅立叶变换(FFT)算法和
Figure BDA0002737541450000106
运算进行有效地计算,因此方程(19)中针对xt+1的更新步骤的复杂度也为
Figure BDA0002737541450000107
因此,基于上述分析,所述提出的GADMM算法(基于例如方程(14)、方程(15)和方程(19))针对每个迭代/更新步骤可以实现总体
Figure BDA0002737541450000108
复杂度。在实施中,所述提出的GADMM算法的最优性差距的收敛性通过以下定理进行理论支持:
定理1:设z表示变量(x,y,u)的串联向量,并设x*和y*是方程(12)的最优解。设
Figure BDA0002737541450000109
是通过所述提出的GADMM算法生成的一系列解,其中u0=0,以及一些给定的x0和y0。设
Figure BDA00027375414500001010
为相应的遍历平均值。如果
Figure BDA00027375414500001011
Figure BDA00027375414500001012
其中M是矩阵A中的行数。特别是,如果
Figure BDA00027375414500001013
Figure BDA00027375414500001014
由于
Figure BDA00027375414500001015
是半正定,所述提出的GADMM的收敛性由定理1可知。此外,定理1概括了所述ADMM算法应用于方程(12)时的收敛结果。所述ADMM算法是所述提出的GADMM算法在
Figure BDA00027375414500001016
时的一个特例。在这种情况下,意味着针对所述ADMM算法的方程(20)为
Figure BDA00027375414500001017
下表1示出了所述提出的GADMM算法与ADMM算法和PDHG算法的复杂度和收敛性的比较结果。
Figure BDA0002737541450000111
表1
从表中可以看出,如果
Figure BDA0002737541450000112
这会导致在实践中
Figure BDA0002737541450000113
通常比
Figure BDA0002737541450000114
小得多。因此,所述提出的GADMM所需的实际迭代次数通常为
Figure BDA0002737541450000115
因此,在总的计算成本方面,所述提出的GADMM通常以
Figure BDA0002737541450000116
倍优于ADMM,并且以
Figure BDA0002737541450000117
倍优于PDHG。
利用所述提出的GADMM,可以获得方程(12)的解,并表示为
Figure BDA0002737541450000118
如果
Figure BDA0002737541450000119
(后续估计的),基于τ1的对应的趋势输出可以为:
Figure BDA00027375414500001110
在框308中,所述时间序列分解系统102可以从所述时间序列中提取所述周期性分量。
在实施中,在从所述时间序列数据中提取和估计所述趋势分量之后,所述时间序列分解系统102可以对所述时间序列数据应用非局部周期性滤波。例如,
Figure BDA00027375414500001111
表示提取或删除所述趋势分量后的时间序列数据。在这种情况下,所述非局部周期性滤波可以考虑预定数量的以y″t-kT,…,y″t-T为中心的周期性邻域(例如,在先的K个周期性邻域),其中每个邻域可以包括2H+1个数据点,而不是考虑预定数量的(例如,K)个数据点(即,y″t-kT,…,y″t-T),K和H是大于或等于1的正整数。例如,某个特定数据点y″t-kT的邻域可以包括2H+1个邻居,即y″t-kT-H,y″t-kT-H+1,…,y″t-kT,y″t-kT+1,…,y″t-kT+H.。
在实施中,所述周期性分量可进一步建模为y″j的加权线性组合,其中y″j位于上述确定的邻域中。在实施中,y″t和y″j之间的权重可以不仅仅取决于这两个数据点在时间维度上的分隔距离(例如,各自指数t和j之间的区别),还取决于y″t和y″j有多近。直观地说,在一个邻域中具有相似周期性的携带y″t的数据点可被赋予更大的权重。用这种方法,就可以找到周期性相似的点,从而解决周期性变化的问题。在实施中,异常点可以被赋予较小的权重,因此所述非局部周期性滤波可以是鲁棒的或对异常值包容的。
在实施中,通过所述非局部周期性滤波提取所述周期性分量可以表述为如下:
Figure BDA0002737541450000121
其中,
Figure BDA0002737541450000122
和Ω被确定为:
Figure BDA0002737541450000123
Figure BDA0002737541450000124
考虑在先的K个周期性邻域,每个邻域包含2H+1个数据点。
在框310中,所述时间序列分解系统102可以获得残差分量。
在实施中,所述时间序列分解系统102可以通过从所述时间序列数据中减去所述噪声分量、所述趋势分量和所述周期性分量来获得所述残差分量。例如,在从所述时间序列数据中去除所述噪声分量、所述趋势分量和所述周期性分量之后,所述残差分量可以表示为:
Figure BDA0002737541450000125
在实施中,所述时间序列分解系统102可以使用单个周期内所有周期性元素之和为零的约束来进一步调整所述周期性分量,即
Figure BDA0002737541450000126
在实施中,所述时间序列分解系统102可以去除上述获得的周期性分量的平均值,其也对应于方程(22)中趋势点τ1的估值。具体而言,估计的趋势点可以表示为如下:
Figure BDA0002737541450000127
在实施中,所述周期性分量、所述趋势分量和所述残差分量的各自的估值可以更新为如下:
Figure BDA0002737541450000128
Figure BDA0002737541450000129
Figure BDA00027375414500001210
在实施中,可以进一步推导出所述估计的残差分量
Figure BDA00027375414500001211
的各要素,例如,
Figure BDA00027375414500001212
上述方程表明,所述残差分量
Figure BDA0002737541450000131
可包括残差周期性分量
Figure BDA0002737541450000132
和残差趋势分量
Figure BDA0002737541450000133
此外,在估计所述趋势分量时,可以使用gt来估计
Figure BDA0002737541450000134
在实施中,所述时间序列分解系统102可以使用交替算法来获得所述趋势分量、所述周期性分量和所述残差分量的更精确的估计值。作为示例而非限制,在获得如框304-310中所描述的所述趋势分量、所述周期性分量和所述残差分量的估计值之后,所述时间序列分解系统102可以对所述残差分量重复或迭代地执行操作,以进一步提取如上述框304-310中所描述的所述趋势分量、所述周期性分量以及所述残差分量,直到所述残差分量收敛或所述残差分量的连续估计之间的变化或差小于预定阈值或百分比。
在框312中,所述时间序列分解系统102可以对所述趋势分量或所述残差分量执行异常测试,以确定所述时间序列数据中是否存在异常。
在实施中,在获得所述趋势分量、所述周期性分量和所述残差分量的各自的估计值之后,所述时间序列分解系统102可以对所述时间序列数据的不同分量应用一个或多个统计测试,以测试对应的异常类型。例如,所述时间序列分解系统102可以对所述趋势分量应用一个或多个统计测试,以确定在所述时间序列数据的所述趋势分量中是否存在异常类型。在实施中,所述异常类型可包括但不限于长期单调趋势或平均值变化。相应地,所述一个或多个统计测试可包括但不限于对均值变化的t测试或对长期不变化的趋势的MK测试。
在实施中,所述时间序列分解系统102可以对所述残差分量应用一个或多个统计测试,以确定在所述时间序列数据的所述残差分量中是否存在异常类型。在实施中,所述异常类型可以包括但不限于方差的变化或骤起和骤落类型。相应地,所述一个或多个统计测试可包括但不限于针对所述方差变化的方差齐性检验的F测试,或针对所述骤起和骤落类型的极端学生化偏差(ESD)测试。
在框314中,所述时间序列分解系统102可以至少部分地基于从所述分解中获得的所述趋势分量、所述周期性分量和所述残差分量、预测所述时间序列在未来某个时间点的数据点。
在实施中,在估计所述趋势分量、所述周期性分量和所述残差分量之后,所述时间序列分解系统102可以基于所述趋势分量、所述周期性分量和所述残差分量,使用预测方法预测所述时间序列在未来某个时间点的数据点。所述预测方法的例子可以包括但不限于外推法、回归法等。所述时间序列分解系统102可以将所述预估的数据点发送给所述时间序列数据的发送者(例如,客户端设备104或一个或多个服务器106中的一个服务器),用于基于所述预测的数据点做出决策,例如在所述未来某个时间点分配资源量等。
回到图4,在框402中,所述时间序列分解系统102可以接收数据流,所述数据流包括多个数据点。
在实施中,所述时间序列分解系统102可以连续地或在一定时间段内接收与时间序列相关联的数据流。在实施中,所述数据流可以包括在一定时间段内的多个数据点。
在框404中,所述时间序列分解系统102可以在线上模式下通过滑动或移动时间窗口对所述数据流的多个数据点的子集应用去噪滤波器。
在实施中,在一个在线节点或实时,所述时间序列分解系统102可以考虑宽度为
Figure BDA0002737541450000141
的滑动窗口内的多个数据点的子集,例如,
Figure BDA0002737541450000142
并应用去噪滤波器(例如,之前说明中描述的所述双边滤波器,或任何其他合适的去噪滤波器),以生成去噪信号
Figure BDA0002737541450000143
Figure BDA0002737541450000144
其中,w是时间序列中的数据点的总数。然后,所述时间序列分解系统102可将
Figure BDA0002737541450000145
与来自时刻t-1获得的Y′t-1的剩余的点
Figure BDA0002737541450000146
相结合,以粗滤估计在时刻t的完整去噪信号Y′t
在框406中,所述时间序列分解系统102可以从固定时间间隔的所述时间序列中提取或估计趋势分量。
在实施中,所述时间序列分解系统102可以在固定的时间间隔(例如,针对所述时间序列,在接收到诸如5、10等预定数量的新数据点之后)使用所述提出的GADMM算法执行趋势提取操作,而不是连续地使用,从而节省了通过所述提出的GADMM算法求解优化问题的计算成本。此外,所述时间序列分解系统102可以考虑在滑动窗口(例如,
Figure BDA0002737541450000147
)内接收到的流式时间序列的多个最新数据点,而不是考虑用整个时间序列(例如,w)来估计趋势差(例如,
Figure BDA0002737541450000148
),并且使用已经在时间t–1估计的趋势分量作为在时间t使用所述提出的GADMM算法求解最优化问题时的初始解,从而导致更快的收敛速度。
在框408中,所述时间序列分解系统102可以从流式时间序列中以固定的时间间隔提取或估计周期性分量和残差分量。
在实施中,与所述趋势提取相类似,所述时间序列分解系统102可以在固定时间间隔内从流式时间序列中提取或估计周期性分量和残差分量。
在框410中,所述时间序列分解系统102可以基于一个或多个相应的统计测试,对所述流式时间序列执行异常测试,以测试所述时间序列中是否存在任何异常。
在实施中,所述时间序列分解系统102可以测试所述时间序列中是否存在一种或多种类型的异常。所述异常类型的例子可能包括但不限于骤起和骤落(SD)、平均值变化(COM)和方差变化(COV)。在实施中,所述骤起和骤落(SD)是指在预定时间段(例如,相对于所述时间序列的总时间段而言非常短的时间段)内观测值的突然增加或减少,这可能取决于所述时间序列的采样率和所述时间序列的数据类型。例如,如果所述时间序列对应于在一段时间内每分钟访问某个网站的用户数,则所述预定时间段可以是1或2分钟。或者,如果所述时间序列对应于某一股票的股票价值,则所述预定时间段可以是1-10秒。
在实施中,所述平均值的变化(COM)是指在预定时间段(例如,相对于所述时间序列的所述总时间段而言,相对较长的时间段)的平均水平变化,这也可能取决于所述时间序列的采样率和所述时间序列的数据类型。在实施中,方差变化(COV)是指波动模式的突变,其可以通过方差测出。
在实施中,所述一个或多个相应的统计测试可以包括但不限于,针对骤起和骤落的异常类型,对所述时间序列的残差分量进行ESD测试,针对方差变化的异常类型,对所述时间序列的残差分量进行F测试,以及针对均值变化,对所述时间序列的趋势分量进行t测试。
尽管上述方法的框被描述为以特定顺序执行,但是在一些实施中,部分或所有所述方法的框可以以其他顺序执行,或者并行执行。
不同趋势提取算法之间的比较
由于所述时间序列分解中最耗时和最昂贵的操作是与所述趋势提取相关联的操作,为了进一步说明本发明中提出的所述趋势提取方法相对于现有技术的改进,本文提供了将所述提出的GADMM算法与其他趋势提取算法进行比较。通过示例而非限定,将所述提出的GADMM算法与PDHG算法(原对偶混合梯度算法)和ADMM算法(交替方向乘子法)的性能进行了比较。在本示例中,使用了在2.3GHZ Intel i5CP和8GB RAM的苹果笔记本上采用Python3.7编写的数值实验。记录了实现1%最优性差距所需的平均处理时间和平均迭代次数,以供比较。
图5示出了所述ADMM算法、所述PDHG算法和所述提出的GADMM算法在代表性信号(N=2160和T=576,其中N是时间序列中的数据点的数目,T是时间序列中周期性分量的时间段)上的实验性能。所有算法以相同的速率
Figure BDA0002737541450000161
收敛。然而,所述提出的GADMM算法中每次迭代所需的时间比ADMM算法中每次迭代所需的时间短,并且所提出的GADMM算法的迭代次数比PDHG算法少,因此所述提出的GADMM算法具有更快的速度。
此外,为了说明所述提出的GADMM算法相对于所述ADMM算法的O(N/logN)改进,N(即,时间序列中的数据点的数量)是变化的,同时保持N/T的比率固定在16。例如,下表2表明,与所述ADMM算法相比,在不同的N上,所述提出的GADMM算法的速度快10-144倍,并且所述提出的GADMM算法所需的迭代次数几乎相同,而所述PDHG算法所需的迭代次数与N成线性关系。
表2:ADMM、PDHG和提出的GADMM在不同N的值下的比较结果。
Figure BDA0002737541450000171
此外,为了说明所述提出的GADMM算法相对于所述PDHG的O(N/logN)改进,T(时间序列中周期性分量的时间段)在保持N不变的情况下变化。如表3中所示,PDHG算法的迭代次数与T成线性关系,而所述提出的GADMM算法对T不敏感。当T值较大时,所述提出的GADMM算法比ADMM算法的优势更为明显。
表3:ADMM、PDHG和提出的GADMM在不同T值下的比较结果。
Figure BDA0002737541450000181
从上面可以看出,与所述ADMM算法和所述PDHG算法等现有技术相比,用于趋势提取的所述提出的GADMM算法提供了实质性的改进。
结论
虽然已经用针对结构特征和/或方法行为的语言描述了实施,但是应该理解的是,所述权利要求不一定局限于所描述的具体特征或行为。相反,所述具体特征和动作被公开为实施所要求保护的权利要求的示范形式。此外或可选地,部分或全部所述操作可由一个或多个ASICS、FPGAs、或其他硬件实施。
使用以下条款可以进一步理解本发明。
第1条:一种由一个或多个计算设备实施的方法,所述方法包括:接收至少包含一个周期性分量的时间序列数据;对所述时间序列数据应用去噪滤波器;从所述时间序列数据中提取趋势分量;从所述时间序列数据中提取所述周期性分量;基于所述趋势分量和所述周期性分量从所述时间序列数据中获取残差分量,并对所述趋势分量或所述残差分量执行异常测试,以确定所述时间序列数据中是否存在异常。
第2条:如第1条所述的方法,其中,所述去噪滤波器包括双边滤波器。
第3条:如第1条所述的方法,其中,从所述时间序列数据中提取所述周期性分量,包括:通过非局部周期性滤波从所述时间序列数据中提取所述周期性分量。
第4条:如第3条所述的方法,其中,所述非局部周期性滤波包括考虑预定数量的在先周期性邻域,每个邻域包含预定数量的数据点。
第5条:如第1条所述的方法,其中,从所述时间序列数据中提取所述趋势分量,包括:根据至少一个循环矩阵对所述趋势分量进行建模;以及使用快速傅立叶变换的GADMM算法计算所述建模的趋势分量。
第6条:如第1条所述的方法,其中,对所述趋势分量执行异常测试,包括:对所述趋势分量应用一个或多个统计测试,以确定所述时间序列数据的所述趋势分量中是否存在异常类型,异常类型包括单调趋势或均值变化,以及所述一个或多个统计测试至少包含t测试或MK测试。
第7条:如第1条所述的方法,其中,对所述残差分量进行异常测试,包括:对所述残差分量应用一个或多个统计测试,以确定所述时间序列数据的残差分量中是否存在异常类型,所述异常类型至少包括方差变化或骤起和骤落中的一种类型,以及所述一个或多个统计测试至少包括F测试或极端学生化偏差(ESD)测试。
第8条:如第1条所述的方法,其中,所述周期性分量包括具有在特定时间段内有规律地重复的模式的周期性分量,或具有从一个时间段切换到另一个时间段的模式的周期性分量。
第9条:存储可执行指令的一个或多个计算机可读存储介质,当被一个或多个处理器执行时,使所述一个或多个处理器执行动作,包括:接收至少包含一个周期性分量的时间序列数据;对所述时间序列数据应用去噪滤波器;从所述时间序列数据中提取趋势分量;从所述时间序列数据中提取所述周期性分量;基于所述趋势分量和所述周期性分量从所述时间序列数据中获取残差分量,并对所述趋势分量或所述残差分量执行异常测试,以确定所述时间序列数据中是否存在异常。
第10条:如第9条所述的一个或多个计算机可读存储介质,其中,所述去噪滤波器包括双边滤波器。
第11条:如第9条所述的一个或多个计算机可读存储介质,其中,从所述时间序列数据中提取所述周期性分量,包括:通过非局部周期性滤波从所述时间序列数据中提取所述周期性分量。
第12条:如第11条所述的一个或多个计算机可读存储介质,其中,所述非局部周期性滤波包括考虑预定数量的在先周期性邻域,每个邻域包含预定数量的数据点。
第13条:如第9条所述的一个或多个计算机可读存储介质,其中,从所述时间序列数据中提取所述趋势分量包括根据至少一个循环矩阵对所述趋势分量进行建模;以及使用具有快速傅立叶变换的GADMM算法计算所述建模的趋势分量。
第14条:如第9条所述的一个或多个计算机可读存储介质,其中,对所述趋势分量执行异常测试,包括:对所述趋势分量应用一个或多个统计测试,以确定所述时间序列数据的所述趋势分量中是否存在异常类型,异常类型包括单调趋势或均值变化,以及所述一个或多个统计测试至少包含t测试或MK测试。
第15条:如第9条所述的一个或多个计算机可读存储介质,其中,对所述残差分量进行异常测试,包括:对所述残差分量应用一个或多个统计测试,以确定所述时间序列数据的残差分量中是否存在异常类型,所述异常类型至少包括方差变化或骤起和骤落中的一种类型,以及所述一个或多个统计测试至少包括F测试或极端学生化偏差(ESD)测试。
第16条:如第9条所述的一个或多个计算机可读存储介质,其中,所述周期性分量包括具有在特定时间段内有规律地重复的模式的周期性分量,或具有从一个时间段切换到另一个时间段的模式的周期性分量。
第17条:一种系统,包括一个或多个处理器以及存储可执行指令的存储器,所述可执行指令在被所述一个或多个处理器执行时,使所述一个或多个处理器执行动作,包括:接收至少包含一个周期性分量的时间序列数据;对所述时间序列数据应用去噪滤波器;从所述时间序列数据中提取趋势分量;从所述时间序列数据中提取所述周期性分量;基于所述趋势分量和所述周期性分量从所述时间序列数据中获取残差分量,并对所述趋势分量或所述残差分量执行异常测试,以确定所述时间序列数据中是否存在异常。
第18条:如第17条所述的系统,其中,从所述时间序列数据中提取所述周期性分量包括通过非局部周期性滤波从所述时间序列数据中提取所述周期性分量,所述非局部周期性滤波包括考虑预定数量的在先周期性邻域,每个邻域包含预定数量的数据点。
第19条:如第17条所述的系统,其中,从所述时间序列数据中提取所述趋势分量包括根据至少一个循环矩阵对所述趋势分量进行建模;以及使用具有快速傅立叶变换的GADMM算法计算所述建模的趋势分量。
第20条:如第17条所述的系统,其中,对所述趋势分量执行异常测试包括对所述趋势分量应用一个或多个统计测试,以确定所述时间序列数据的所述趋势分量中是否存在异常类型,异常类型包括单调趋势或均值变化,以及所述一个或多个统计测试至少包含t测试或MK测试;以及对所述残差分量进行异常测试包括对所述残差分量应用一个或多个统计测试,以确定所述时间序列数据的残差分量中是否存在异常类型,所述异常类型至少包括方差变化或骤起和骤落中的一种类型,以及所述一个或多个统计测试至少包括F测试或极端学生化偏差(ESD)测试。

Claims (12)

1.一种由一个或多个计算设备实施的方法,所述方法包括:
接收至少包含一个周期性分量的时间序列数据;
对所述时间序列数据应用去噪滤波器;
从所述时间序列数据中提取趋势分量;
从所述时间序列数据中提取所述周期性分量;
基于所述趋势分量和所述周期性分量从所述时间序列数据中获取残差分量;以及,
对所述趋势分量或所述残差分量执行异常测试,以确定所述时间序列数据中是否存在异常。
2.如权利要求1所述的方法,其中,所述去噪滤波器包括双边滤波器。
3.如权利要求1所述的方法,其中,从所述时间序列数据中提取所述周期性分量,包括:通过非局部周期性滤波从所述时间序列数据中提取所述周期性分量。
4.如权利要求3所述的方法,其中,所述非局部周期性滤波包括考虑预定数量的在先周期性邻域,每个邻域包含预定数量的数据点。
5.如权利要求1所述的方法,其中,从所述时间序列数据中提取所述趋势分量,包括:
根据至少一个循环矩阵对所述趋势分量进行建模;以及,
使用快速傅立叶变换的GADMM算法计算所述建模的趋势分量。
6.如权利要求1所述的方法,其中,对所述趋势分量执行异常测试,包括:对所述趋势分量应用一个或多个统计测试,以确定所述时间序列数据的所述趋势分量中是否存在异常类型,异常类型包括单调趋势或均值变化,以及所述一个或多个统计测试至少包含t测试或MK测试。
7.如权利要求1所述的方法,其中,对所述残差分量进行异常测试,包括:对所述残差分量应用一个或多个统计测试,以确定所述时间序列数据的残差分量中是否存在异常类型,所述异常类型至少包括方差变化或者骤起和骤落中的一种类型,以及所述一个或多个统计测试至少包括F测试或极端学生化偏差(ESD)测试。
8.如权利要求1所述的方法,其中,所述周期性分量包括具有在特定时间段内有规律地重复的模式的周期性分量,或具有从一个时间段切换到另一个时间段的模式的周期性分量。
9.存储可执行指令的一个或多个计算机可读存储介质,当被一个或多个处理器执行时,使所述一个或多个处理器执行动作,包括:
接收至少包含一个周期性分量的时间序列数据;
对所述时间序列数据应用去噪滤波器;
从所述时间序列数据中提取趋势分量;
从所述时间序列数据中提取所述周期性分量;
基于所述趋势分量和所述周期性分量从所述时间序列数据中获取残差分量;以及
对所述趋势分量或所述残差分量执行异常测试,以确定所述时间序列数据中是否存在异常。
10.一种系统,包括:
一个或多个处理器;以及,
存储可执行指令的存储器,所述可执行指令在被所述一个或多个处理器执行时,使所述一个或多个处理器执行下述动作,包括:
接收至少包含一个周期性分量的时间序列数据;
对所述时间序列数据应用去噪滤波器;
从所述时间序列数据中提取趋势分量;
从所述时间序列数据中提取所述周期性分量;
基于所述趋势分量和所述周期性分量从所述时间序列数据中获取残差分量;
以及,
对所述趋势分量或所述残差分量执行异常测试,以确定所述时间序列数据中是否存在异常。
11.如权利要求10所述的系统,其中,从所述时间序列数据中提取所述周期性分量包括通过非局部周期性滤波从所述时间序列数据中提取所述周期性分量,所述非局部周期性滤波包括考虑预定数量的在先周期性邻域,每个邻域包含预定数量的数据点。
12.如权利要求10所述的系统,其中,从所述时间序列数据中提取所述趋势分量,包括:根据至少一个循环矩阵对所述趋势分量进行建模;以及使用快速傅立叶变换的GADMM算法计算所述建模的趋势分量。
CN202011138773.8A 2019-12-02 2020-10-22 时间序列分解 Pending CN112989271A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/700,931 2019-12-02
US16/700,931 US11146445B2 (en) 2019-12-02 2019-12-02 Time series decomposition

Publications (1)

Publication Number Publication Date
CN112989271A true CN112989271A (zh) 2021-06-18

Family

ID=76091266

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011138773.8A Pending CN112989271A (zh) 2019-12-02 2020-10-22 时间序列分解

Country Status (2)

Country Link
US (1) US11146445B2 (zh)
CN (1) CN112989271A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113792931A (zh) * 2021-09-18 2021-12-14 北京京东振世信息技术有限公司 数据预测方法、装置、物流货量预测方法、介质和设备
CN113915153A (zh) * 2021-09-30 2022-01-11 山东浪潮通软信息科技有限公司 一种矿用通风机异常检测的方法、系统、设备和存储介质
CN114944831A (zh) * 2022-05-12 2022-08-26 中国科学技术大学先进技术研究院 多周期时间序列数据分解方法、装置、设备及存储介质
CN115659284A (zh) * 2022-12-27 2023-01-31 河北新龙科技集团股份有限公司 一种大数据融合平台
CN115964620A (zh) * 2023-03-15 2023-04-14 阿里巴巴(中国)有限公司 数据处理方法、存储介质和电子设备
CN118445654A (zh) * 2024-07-08 2024-08-06 苏州普康智慧养老产业科技有限公司 一种iot智能服务平台数据的智能分析方法

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220012651A1 (en) * 2020-07-10 2022-01-13 United Parcel Service Of America, Inc. Using randomness compensating factors to improve forecast accuracy
CN114362793B (zh) * 2020-10-13 2024-06-14 中兴通讯股份有限公司 信号处理装置及信号处理方法
US12039554B2 (en) * 2021-03-31 2024-07-16 Caterpillar Inc. Systems and methods for probabilistic parts forecasting based on machine utilization patterns
CN114235652A (zh) * 2021-11-30 2022-03-25 国网北京市电力公司 烟尘颗粒浓度异常识别方法、装置、存储介质及设备
CN115935296B (zh) * 2023-03-09 2023-06-23 国网山东省电力公司营销服务中心(计量中心) 一种电能数据计量方法及系统
CN115994248B (zh) * 2023-03-24 2023-06-20 青岛精锐机械制造有限公司 阀门故障的数据检测方法及系统
CN116418882B (zh) * 2023-06-09 2023-08-04 北京国旺盛源智能终端科技有限公司 基于hplc双模载波通信的存储器数据压缩方法
CN116662864B (zh) * 2023-06-14 2024-04-23 同济大学 一种面向在线水质、水动力监测数据的滚动数据清洗方法
CN117057517B (zh) * 2023-10-12 2024-01-12 国网吉林省电力有限公司长春供电公司 基于数字孪生的电力数据高效处理方法及系统
CN117310348B (zh) * 2023-11-23 2024-03-12 东莞市时实电子有限公司 一种电源适配器故障实时监测方法及系统
CN117540193A (zh) * 2024-01-10 2024-02-09 飞特质科(北京)计量检测技术有限公司 一种风机传导干扰测试曲线特征数据的提取方法
CN117708764B (zh) * 2024-02-06 2024-05-03 青岛天高智慧科技有限公司 基于校园一卡通的学生消费数据智能分析方法
CN117871466B (zh) * 2024-03-12 2024-05-24 苏州安易得安全科技有限公司 一种监测数据自检的激光甲烷探测器
CN117861296B (zh) * 2024-03-13 2024-06-04 晋江艺森建筑工程有限公司 一种污水站固体杂质拦截过滤装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10205640B2 (en) * 2013-04-11 2019-02-12 Oracle International Corporation Seasonal trending, forecasting, anomaly detection, and endpoint prediction of java heap usage
US9563806B2 (en) * 2013-12-20 2017-02-07 Alcatel Lucent Methods and apparatuses for detecting anomalies using transform based compressed sensing matrices
US9684951B2 (en) * 2014-03-31 2017-06-20 Los Alamos National Security, Llc Efficient convolutional sparse coding
US20160140584A1 (en) * 2014-11-17 2016-05-19 Ebay Inc. EMD-Spectral Prediction (ESP)
ES2898868T3 (es) * 2015-06-23 2022-03-09 Torino Politecnico Método y dispositivo para la búsqueda de imágenes
US10635565B2 (en) * 2017-10-04 2020-04-28 Servicenow, Inc. Systems and methods for robust anomaly detection
US10789684B2 (en) * 2018-06-12 2020-09-29 Carl Zeiss Ag Method, apparatus, and system for multilevel bilateral noise filtering
US20200027046A1 (en) * 2018-07-17 2020-01-23 International Business Machines Corporation Smart monitoring
US10784974B2 (en) * 2018-07-24 2020-09-22 Spectrum Effect Inc. Method and system for isolating related events in the presence of seasonal variations

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113792931A (zh) * 2021-09-18 2021-12-14 北京京东振世信息技术有限公司 数据预测方法、装置、物流货量预测方法、介质和设备
CN113915153A (zh) * 2021-09-30 2022-01-11 山东浪潮通软信息科技有限公司 一种矿用通风机异常检测的方法、系统、设备和存储介质
CN114944831A (zh) * 2022-05-12 2022-08-26 中国科学技术大学先进技术研究院 多周期时间序列数据分解方法、装置、设备及存储介质
CN115659284A (zh) * 2022-12-27 2023-01-31 河北新龙科技集团股份有限公司 一种大数据融合平台
CN115659284B (zh) * 2022-12-27 2023-07-18 河北新龙科技集团股份有限公司 一种大数据融合平台
CN115964620A (zh) * 2023-03-15 2023-04-14 阿里巴巴(中国)有限公司 数据处理方法、存储介质和电子设备
CN115964620B (zh) * 2023-03-15 2023-12-12 阿里巴巴(中国)有限公司 数据处理方法、存储介质和电子设备
CN118445654A (zh) * 2024-07-08 2024-08-06 苏州普康智慧养老产业科技有限公司 一种iot智能服务平台数据的智能分析方法

Also Published As

Publication number Publication date
US11146445B2 (en) 2021-10-12
US20210168019A1 (en) 2021-06-03

Similar Documents

Publication Publication Date Title
CN112989271A (zh) 时间序列分解
Wen et al. RobustSTL: A robust seasonal-trend decomposition algorithm for long time series
JP6743934B2 (ja) 観測変数間の因果関係を推定するための方法、装置、およびシステム
JP6952058B2 (ja) メモリ使用量判断技術
CN112989266B (zh) 时间序列中的周期性检测和周期长度估计
Yildirim et al. An online expectation–maximization algorithm for changepoint models
US8874409B2 (en) Multi-step time series prediction in complex instrumented domains
CA3088689A1 (en) Finite rank deep kernel learning for robust time series forecasting and regression
CA3119533C (en) Finite rank deep kernel learning with linear computational complexity
CN110020739B (zh) 用于数据处理的方法、装置、电子设备及计算机可读介质
US20160140584A1 (en) EMD-Spectral Prediction (ESP)
CA3119351C (en) Extending finite rank deep kernel learning to forecasting over long time horizons
CN113496080A (zh) 方差变点检测方法和系统及计算机可读存储介质
Markovsky et al. Applications of polynomial common factor computation in signal processing
Kofnov et al. Moment-based invariants for probabilistic loops with non-polynomial assignments
Park et al. Data based segmentation and summarization for sensor data in semiconductor manufacturing
Hanias et al. Deterministic chaos and forecasting in Amazon? s share prices
Tobar et al. Design of covariance functions using inter-domain inducing variables
Tadic et al. Asymptotic properties of recursive maximum likelihood estimation in non-linear state-space models
Bautista et al. A frequency-structure approach for link stream analysis
Romero-Medrano et al. Multinomial sampling of latent variables for hierarchical change-point detection
CN110879575B (zh) 灵敏度分析的计算机实现方法及灵敏度分析系统
Dutra Uncertainty estimation in equality-constrained MAP and maximum likelihood estimation with applications to system identification and state estimation
Gozuyilmaz et al. Mathematical optimization for time series decomposition
McElroy Forecasting continuous-time processes with applications to signal extraction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination