CN107949840B - 用于检测和表征季节的系统 - Google Patents

用于检测和表征季节的系统 Download PDF

Info

Publication number
CN107949840B
CN107949840B CN201780003022.5A CN201780003022A CN107949840B CN 107949840 B CN107949840 B CN 107949840B CN 201780003022 A CN201780003022 A CN 201780003022A CN 107949840 B CN107949840 B CN 107949840B
Authority
CN
China
Prior art keywords
instances
seasonal
season
time series
instance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780003022.5A
Other languages
English (en)
Other versions
CN107949840A (zh
Inventor
D·加尔威
U·沙福特
L·王
A·加内什
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oracle International Corp
Original Assignee
Oracle International Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oracle International Corp filed Critical Oracle International Corp
Publication of CN107949840A publication Critical patent/CN107949840A/zh
Application granted granted Critical
Publication of CN107949840B publication Critical patent/CN107949840B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2477Temporal data queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/55Detecting local intrusion or implementing counter-measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06315Needs-based resource requirements planning or analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Databases & Information Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Resources & Organizations (AREA)
  • Pure & Applied Mathematics (AREA)
  • Operations Research (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computer Security & Cryptography (AREA)
  • Computational Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Hardware Design (AREA)
  • Algebra (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Fuzzy Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

描述了用于表征和总结在时间序列内检测到的季节模式的技术。根据实施例,时间序列数据的集合被分析,以识别季节的多个实例,其中每个实例与季节内的相应子时段对应。来自多个实例的第一实例集合与特定的季节模式类相关联。在对第一实例集合进行分类之后,第二实例集合可以保持未分类,或者以其它方式不能与该特定的季节模式类相关联。基于第一实例集合和第二实例集合,可以生成识别与该特定的季节模式类相关联的一个或多个时间区段的总结。这一个或多个时间区段可以跨越与第二实例集合中的至少一个实例对应的至少一个子时段。

Description

用于检测和表征季节的系统
技术领域
本公开涉及检测和表征时间序列数据内的季节(season)。本公开更具体地涉及用于识别季节的实例、将实例与不同的季节类相关联并且生成季节类的总结(summary)的计算机实现的技术。
背景技术
本节中描述的方法是可以追求的方法,但不一定是先前已经构想或追求的方法。因此,除非另有说明,否则不应当假定本节中描述的任何方法仅仅因为它们被纳入本节中就被当作现有技术。
时间序列是通常通过在一段时间内捕获来自一个或多个源的测量而获得的一系列数据点。作为示例,企业可以连续地或者在预定的时间间隔内收集用于在数据中心环境内部署的软件和硬件资源的各种性能度量。分析师经常将预测模型应用于时间序列数据,以试图基于观测到的测量结果来预测未来的事件。一个这种模型是Holt-Winters预测算法,也被称为三重指数平滑。
Holt-Winters预测算法考虑到了时间序列数据中的趋势和季节性二者,以便制定关于未来值的预测。此上下文中的趋势是指时间序列数据随时间而增加或减少的趋势,而季节性是指时间序列数据表现出周期性自我重复的行为的趋势。季节一般是指表现出的行为开始自我重复之前的时间段。加性季节模型由以下公式给出:
Lt=α(Xt-St-p)+(1-α)(Lt-1+Tt-1) (1)
Tt=γ(Lt-Lt-1)+(1-γ)Tt-1 (2)
St=δ(Xt-Lt)+(1-δ)St-p (3)
其中Xt、Lt、Tt和St分别表示在时间t处的观测到的水平、局部平均水平、趋势和季节指标。参数α、γ、δ分别表示用于更新平均水平、趋势和季节指标的平滑参数,并且p表示季节模式的持续时间。预测如下给出:
Ft+k=Lt+k Tt+St+k-p (4)
其中Ft+k表示在未来时间t+k处的预测。
当季节性波动与时间序列数据的整体水平无关时,通常应用加性季节模型。如果季节性波动的大小基于时间序列数据的整体水平而变化,那么常常应用被称为乘性模型的替代方案。乘性模型由以下公式给出:
Lt=α(Xt/St-p)+(1-α)(Lt-1+Tt-1) (5)
Tt=γ(Lt-Lt-1)+(1-γ)Tt-1 (6)
St=δ(Xt/Lt)+(1-δ)St-p (7)
与前面一样,其中Xt、Lt、Tt和St分别表示在时间t处的观测到的水平、局部平均水平、趋势和季节指标。于是预测由以下公式给出:
Ft+k=(Lt+k Tt)St+k-p (8)
预测模型(诸如三重指数平滑)主要集中在生成关于未来事件的预测。虽然Holt-Winter加性模型和乘性模型考虑了季节指标来生成预测,但是这些模型仅提供关于时间序列数据中可能存在的任何季节模式的有限信息。具体而言,由等式(3)和(7)表示的季节指标通常被实现为在它们绑定到的预测模型的界限内操作的内部结构。因此,由这些公式输出的季节数据无助于在(针对其而生成了该季节数据的)具体预测模型之外的上下文中的有意义解释。另外,最终用户对于在生成预测中所使用的任何季节数据可能只有很少或没有基本概念。
附图说明
在附图的图示中通过示例而非限制示出了各种实施例,并且其中相同的标号指代相似的元件,并且其中:
图1示出了用于检测和总结从时间序列数据推断的季节模式的特点的示例处理;
图2示出了用于检测和表征时间序列数据内的季节模式的示例系统;
图3示出了用于确定在时间序列数据的集合内是否存在季节模式的示例处理;
图4示出了用于对在时间序列数据的集合内识别出的季节模式进行分类的示例处理;
图5示出了对季节的实例进行分类的示例分类结果集合;
图6示出了用于基于季节内的分类实例的集合生成和均匀化(homogenize)分段的集合并且使用经均匀化的分段来生成用于一个或多个季节模式类的总结数据的示例处理;
图7示出了通过基于分类实例的集合生成并均匀化分段的集合而获得的示例总结;
图8示出了用于已经被分类为复发性每周高点和复发性每周低点的季节模式的示例总结;
图9示出了用于选择时间序列中的复发性高值和低值的示例监督处理;
图10示出了用于选择时间序列中的复发性高值和低值的示例无监督处理;
图11示出了稀疏模式与密集模式被分开提取和注释的示例总结;
图12是示出可以在其上实现一些实施例的计算机系统的框图。
具体实施方式
在下面的描述中,出于解释的目的,阐述了许多具体细节以提供对本公开的透彻理解。然而,将认识到的是,本发明可以在没有这些具体细节的情况下实践。在其它情况下,结构和设备以框图形式示出,以避免不必要地模糊本发明。
一般概述
在各种实施例中,描述了用于检测和表征时间序列内的季节模式的计算机系统、存储的指令和技术步骤。可以通过分析跨时间序列内的不同季节时段收集的数据点(在本文中也被称为“样本”)来检测季节模式。如果分析检测到时间序列内按季节重现的值,那么检测到了季节模式。如果检测到季节模式,那么进一步分析数据点,以对季节模式进行分类。例如,数据点可以被分类为时间序列内的复发性高点或复发性低点。一旦被分类,就可以生成总结,其中该总结识别在时间序列内检测到的一个或多个季节模式类。总结可以被显示、存储或以其它方式输出,以向最终用户或应用暴露时间序列的分类季节模式。
在一些实施例中,用于对季节模式进行分类的技术包括通过将时间序列数据分割成实例的集合来预处理时间序列数据,其中该实例的集合中的每个实例与季节内的不同相应子时段对应。在预处理期间,分析该实例集合,以确定哪些实例应当与特定的季节类相关联。季节内的不同实例可以与不同的相应类相关联或者可以保持未分类。例如,来自实例集合的第一组实例可以与第一类相关联,并且来自实例集合的第二组实例可以与第二类相关联,而来自实例集合的第三组实例可以保持未分类。基于哪一组实例与特定的类相关联,可以生成总结以表征时间序列内的季节模式。
为了表征可以存在于时间序列中的季节模式的类,总结可以识别与该类相关联的一个或多个时间区段。作为示例,“每周高点”季节类可以指定在其中检测到了复发性每周高点模式的天和/或小时。作为另一个示例,“每月低点”季节类可以识别在其中检测到了复发性每月低点的周、天和/或小时。其它季节类也可以被包括在总结中,以识别和表征时间序列中的季节模式。总结可以通过程序集成到各种复杂的分析方案中。例如,在信息技术(IT)的上下文中,总结数据可以被处理以执行季节感知(seasonal-aware)的异常检测、维护计划、硬件和软件整合以及容量计划。
通过合并季节中的共享相同类的相邻实例,可以识别用于特定季节类的时间区段。该时间区段也可以被扩展成包括未分类的相邻实例。通过填充相邻的未分类的值,可以减少不同季节时段上模式的随机变化,由此在底层模式基本没有改变时在延长的时间帧内提供一致的结果。
图1示出了用于检测和总结从时间序列数据推断的季节模式的特点的示例处理。在框102处,在一个或多个计算设备上执行的应用检索或以其它方式接收时间序列数据的集合。在框104处,该应用识别该时间序列数据的集合内的季节的多个实例。如前面所提到的,季节的不同实例可以与该季节内不同的相应子时段对应。在框106处,应用将来自季节的该多个实例的第一实例集合与用于表征季节模式的特定类相关联。在将第一实例集合与季节类相关联之后,来自该多个实例的第二实例集合保持未分类或以其它方式不与该特定类相关联。在框108处,应用生成总结,该总结识别属于该特定类的一个或多个时间区段,使得这一个或多个时间区段跨越与第一实例集合对应的子时段和与第二实例集合中的至少一个实例对应的至少一个子时段。在框110处,应用通过执行将总结存储在非易失性存储器中、将总结提供给分开的应用或者使总结显示给最终用户中的一个或多个,来输出用于该特定类的总结。
在时间序列数据的一些集合中,稀疏模式可以叠加在密集模式上,或者在数据内可以只存在稀疏模式或密集模式。由等式(3)和(7)表示的加性和乘性Holt-Winter季节指标不能对稀疏模式和密集模式二者都提供有意义的处理。一般而言,Holt-Winters等式对时间序列数据进行平滑,使得稀疏分量被有效地移除和忽略。平滑防止噪声对季节指标产生显著影响,从而替代地依靠密集数据中的趋势来产生预测。然而,移除信号的稀疏分量会造成本质上稀疏的有意义的季节模式被忽视。
为了考虑密集模式和稀疏模式二者,时间序列数据的集合可以被分解成密集信号和噪声信号(在本文中也被称为“稀疏信号”)。通过将时间序列拆分成分开的分量,可以对密集信号和噪声信号二者执行独立的分析。这允许时间序列数据内的密集特征和稀疏特征被独立地考虑和分类。例如,噪声信号可以被分析,以便为季节的多个实例生成第一分类,其中第一分类将来自该多个实例的一个或多个实例的第一集合与特定的季节模式类相关联。密集信号可以被分开和独立地分析,以生成将一个或多个实例的第二集合与特定的季节模式类相关联的第二分类。一个或多个实例的第一集合与一个或多个实例的第二集合可以重叠,因为至少一个实例可以在两者中被分类为相同。一个或多个实例在第一和第二分类之间可以被不同地分类或保持为未分类。然后可以将这些分类组合,以生成第三分类,第三分类可以被用于总结季节类的密集特征和稀疏特征。
根据一些实施例,有监督方法被用于识别和分类稀疏季节模式和密集季节模式。在有监督方法中,领域知识作为输入被接收并用于对密集季节模式和稀疏季节模式进行分类。可以利用领域知识来更可靠和准确地表征在时间序列数据集合中重现的季节模式。例如,可以至少部分地基于用户提供的阈值的集合来执行将实例分类为稀疏信号或密集信号内的季节性高点或季节性低点的确定。这个用户提供的阈值可以被选择为使得统计上不重要的实例被过滤掉以最小化或消除噪声的影响,同时仍然检测和分类稀疏季节模式和密集季节模式。
由于许多系统和操作的规模,为被分析的每个时间序列数据集合接收领域知识作为输入可能是不可行的。在这种情况下,可以使用无监督方法来识别和分类稀疏季节模式和密集季节模式。无监督方法将经处理的稀疏信号与密集信号组合以创建经组合的总信号,该总信号捕获密集特征和显著的稀疏特征。无监督方法在没有任何领域知识或其它外部输入的情况下生成经组合的总信号,由此减少配置开销并提高方案的可扩展性。
时间序列数据源
时间序列包括随时间捕获信息的数据点的汇集(collection)。时间序列数据的源和被捕获的信息的类型可以因实现方式而异。例如,可以从一个或多个软件和/或硬件资源收集时间序列,并捕获从中收集了数据的资源的各种性能属性。作为另一个示例,可以使用测量物体或环境的物理特性(诸如温度、压力、运动、流量流或其它属性)的一个或多个传感器来收集时间序列。
可以从单个源或多个源收集时间序列数据。参考图2,例如,图2示出了用于检测和表征时间序列数据内的季节模式的示例系统200。系统200包括主机210a至210n、网络220、分析服务230、储存库240以及客户端250a至250n。取决于特定的实现方式,系统200的部件可以在一个或多个云或其它联网环境中操作的一个或多个主机机器中实现。
主机210a至210n表示一个或多个网络主机的集合,并且一般包括目标212a至212n和代理214a至214n。在这个上下文中,“目标”是指时间序列数据的源。例如,目标可以是软件部署,诸如数据库服务器实例、执行中间件或在网络主机上执行的某个其它应用。作为另一个示例,目标可以是对硬件资源或者网络主机部署在其内的某种环境进行监视的传感器。代理从对应的目标收集数据点并将数据发送到分析服务230。在这个上下文中,代理可以是在对应的主机机器上执行和/或监视一个或多个相应目标的进程(诸如服务或守护进程(daemon))。虽然图2中每个主机仅示出一个代理和目标,但是每个主机的代理和/或目标的数量可以因实现方式而异。可以在给定的主机上安装多个代理,以监视时间序列数据的不同目标源。
代理214a至214n经由网络220与分析服务230通信地耦合。网络220表示一个或多个互连的数据通信网络(诸如互联网)。代理214a至214n可以根据一个或多个通信协议通过网络220向分析服务230发送收集的时间序列数据点。可以用于在代理和分析服务230之间运输数据的示例通信协议包括但不限于超文本传输协议(HTTP)、简单网络管理协议(SNMP)以及互联网协议(IP)套件的其它通信协议。
分析服务230包括可被调用以处理时间序列数据的服务集合。分析服务230可以由主机210a至210n中的一个或多个执行,或者由一个或多个分开的主机(诸如服务器装置)执行。分析服务230一般包括收集逻辑232、季节模式识别逻辑234、季节模式分类逻辑236和总结生成逻辑238。每个逻辑单元实现用于处理时间序列数据的不同功能或功能集合。
储存库240包括用于存储时间序列数据242和总结数据244的易失性存储器和/或非易失性存储器。时间序列数据242包括由收集逻辑232从代理214a至214n中的一个或多个收集的数据点的集合。收集逻辑232可以聚集从不同代理接收的所收集的数据点,使得数据点被记录或以其它方式存储以指示基于时间的顺序次序。可替代地,收集逻辑232可以将从一个代理接收的数据点维护为与从另一个代理接收的数据分开的时间序列。因此,时间序列数据242可以包括从单个代理或从多个代理收集的数据点。另外,时间序列数据242可以包括单个时间序列或多个时间序列。总结数据244存储表征在时间序列数据242内检测到的季节模式的数据。下面进一步详细描述用于检测时间序列数据内的季节模式的技术。储存库240可以驻留在不同的主机机器(诸如物理上与分析服务230分开的存储服务器)上,或者可以从同一主机上的易失性存储装置或非易失性存储装置中分配。
客户端250a至250n表示可以访问分析服务230以检测和表征时间序列数据的一个或多个客户端。在这个上下文中,“客户端”可以是人类用户(诸如管理员)、客户端程序或某种其它应用接口。客户端可以在与分析服务230相同的主机上本地执行,或者可以在不同的机器上执行。如果在不同的机器上执行,那么客户端可以根据客户端-服务器模型经由网络220与分析服务230通信,诸如通过提交调用一个或多个服务的HTTP请求并且接收包括由一个或多个服务生成的结果的HTTP响应。客户端可以提供用于与分析服务230交互的用户接口。示例用户接口可以包括但不限于图形化用户接口(GUI)、应用编程接口(API)、命令行接口(CLI)或允许用户调用分析服务230中的一个或多个来处理时间序列数据的某种其它接口。
季节模式识别
分析服务230包括季节模式识别逻辑234,季节模式识别逻辑234用于识别可能存在于输入的时间序列数据的集合内的季节模式(如果有的话)。当分析服务230从客户端250a至250n之一接收到对于指定的时间序列检测和/或分类季节模式的请求时,季节模式识别逻辑234处理对应的时间序列数据的集合以搜索季节模式。例如,客户端可以请求查看对于特定资源存在什么旺季(high season)和/或淡季(low season)(如果有的话)。作为响应,分析服务230可以如下面进一步详细描述的那样分析从该特定资源收集的时间序列数据,并且向用户提供检测到的季节模式(如果有的话)的总结。
季节模式识别逻辑234可以分析单个持续时间或变化的持续时间的季节,以检测季节模式。作为示例,可以针对每日模式、周度模式、月度模式、季度模式、年度模式等对时间序列数据进行分析。被分析的季节可以属于用户指定的持续时间、预定义的持续时间,或者是基于一组标准或规则而被选择的。例如,如果从客户端接收的请求将季节的长度指定为L个时段,那么季节模式识别逻辑234分析时间序列数据,以确定是否存在每L个时段重现的任何行为。如果没有检测到模式,那么季节模式识别逻辑234可以输出消息,以提供没有检测到模式的通知。否则,可以根据下面进一步详细描述的技术对检测到的模式进行分类。
参考图3,图3绘出了用于确定时间序列数据的集合内是否存在季节模式的示例处理。框302至306表示基于自回归的分析,并且框308至316表示频域分析。虽然在图3中绘出的示例处理中两个分析被组合使用以确定是否存在季节模式,但是在其它实施例中,可以执行一个分析而不执行另一个分析,或者可以切换执行分析的次序。除了基于自回归的分析和基于频域的分析之外或作为其替代,其它实施例还可以采用其它随机(stochastic)方法来检测时间序列数据内复发性模式的存在。
对于基于自回归的分析,处理从框302开始,其中时间序列数据被分块成季节持续时间的块。作为示例,如果试图检测周度模式,那么每个数据块可以包括在一周的时间段内收集的数据点。类似地,如果试图检测月度模式,那么每个数据块可以包括在一个月的时间段内收集的数据点。
在框304处,计算在时间上相邻的块之间的相关系数。存在可以计算相关系数的许多不同的方式。在一些实施例中,季节持续时间的时间上相邻的块被叠加,并且时间序列数据的重叠信号被比较,以确定两个函数之间是否存在强关联。作为示例,当试图检测周度模式时,包含第一周的时间序列数据的一个块可以与包含时间上相邻的一周的时间序列数据的第二个块叠加。将信号进行比较,以计算指示季节时段内的时间点与这些时间点处的观测值之间的相关性的强度的相关系数。可以通过估计叠加数据之间的最小平方(例如,通过使用普通的最小平方过程)或使用另一个自相关函数以导出指示时间上相邻的块之间的相关性的强度,来计算来自不同块/季节时段的时间序列数据之间的系数。
在框306处,处理基于相关系数的比较来确定不同时间块之间的相关性是否满足阈值。该阈值可以取决于特定实现方式而变化,并且可以暴露为用户可配置的值。如果相关系数的数不满足阈值,那么处理前进到框308,并且执行频域分析。否则,处理继续到框318以指示已经检测到季节模式。
对于频域分析,处理在框308处开始,并且生成时间序列的功率谱密度数据。功率谱密度可以通过对时间序列数据应用快速傅立叶变换以将数据分解成谱分量的集合而生成,其中每个相应的谱分量表示在时间序列数据内观测到的对应值的相应频率。
在框310处,处理从功率谱密度数据中识别主导频率。在这个上下文中,主导频率表示时间序列数据内最频繁出现的值。如果频繁出现的值在季节时段重现,那么这些值可以指示季节模式。
在框312处,处理确定主导频率是否表示整个信号的振幅的阈值百分比。阈值可以取决于特定实现方式而变化,并且可以暴露为用户可配置的值。表示整个信号的非显著部分的值不可能与时间序列内的复发性模式相关联。因此,如果主导频率不表示整个时间序列数据的阈值百分比,那么处理继续到框320。否则,处理继续到框314。
在框314处,处理确定主导频率是否在阈值时间段内重现。例如,如果搜索周度模式,那么处理可以确定该值是否以加上或减去阈值小时数的容差每周地重现。如果主导频率在时间序列数据内的阈值时间段不重现,那么处理可以确定未识别出季节模式,并且处理前进到框316。否则,处理继续到框318,并且处理确定已经检测到季节模式。
在框316处,处理确定是否分析功率谱密度数据内的下一个主导频率。在一些实现方式中,可以设置阈值,使得前n个频率被分析。如果前n个频率没有导致检测到季节模式,那么处理可以前进到框320,在那里处理确定在时间序列数据内不存在季节模式。在其它实现方式中,可以分析构成超过信号的阈值百分比的所有频率。如果存在要分析剩余的频率,那么处理返回到框310,并且对于下一个最主导的频率重复这些步骤。
基于上述分析,处理分别在框318和320处确定时间序列数据内是否存在季节模式。如果检测到季节模式,那么处理可以继续对季节模式进行分类,如下面进一步讨论的那样。否则,处理可以输出通知以指示在时间序列数据内没有检测到以指定的季节持续时间重现的季节模式。
图3的处理可以被重复,以检测不同持续时间的季节中的模式。作为示例,时间序列数据可以首先被分成包含每周数据的块并被分析,以检测是否存在周度模式。然后可以将时间序列数据分成包含每月数据的块,并分析以检测是否存在月度模式。附加地或可替代地,时间序列数据可以基于用户有兴趣分析的季节或者基于一组预定的规则或标准而跨其它季节时段被分块和分析。
季节模式分类
时间序列可以包括一个或多个季节模式的类。季节模式的示例类可以包括但不限于复发性季节性高点和复发性季节性低点。这些类中的每一类还可以被拆分为子类,包括但不限于复发性稀疏季节性高点、复发性稀疏季节性低点、复发性密集季节性高点和复发性密集季节性低点。取决于特定的实现方式,其它类和子类也可以用于表征时间序列数据内的季节模式。如本文所使用的,术语“类”可以包括季节模式的类和子类二者。
分析服务230包括季节模式分类逻辑236,季节模式分类逻辑236对时间序列数据242进行预处理,并对在时间序列数据内检测到的季节模式进行分类。参考图4,图4绘出了可以由季节模式分类逻辑236实现以对季节模式进行分类的示例处理。
在框402处,通过生成数据块来对时间序列数据进行预处理,其中每个数据块表示时间序列内的一个季节时段或季节样本,并且包括来自时间序列的跨越季节持续时间的时间段的数据。作为示例,如果时间序列包括跨越二十五周的数据并且季节的长度是一周时间,那么该时间序列数据可以被分成二十五个块,其中第一块包括在第一周期间收集的数据点,第二块包括在第二周期间收集的数据点,等等。
在框404处,该处理为每个数据块生成子块的集合,其中每个数据子块表示季节的一个实例并且包括跨越实例持续时间的子时段的时间序列数据。实例的持续时间可以因实现方式而异。作为示例,对于周度季节(weekly season),每个实例可以表示这周内的不同小时时间。因此,表示一整周的数据的块可以被分段成表示一百六十八个不同实例的一百六十八个子块。如果实例被定义为表示两个小时持续时间的子时段,那么表示一周的块可以被分段成八十四个子块。作为另一个示例,对于月度季节,实例可以与一个月中的一天对应。于是,取决于一个月中的天数,表示一个月的块可以被分段成二十八至三十一个子块。还可以选择其它子时段来调节时间序列数据被分析和总结的方式。
在框406处,该处理选择要分析的季节实例,以确定它应当如何被分类。处理可以选择季节中的第一实例并递增地前进,或根据任何其它例程或标准选择实例。
在框408处,处理部分地基于来自一个或多个季节样本/时段的实例的时间序列数据来确定是否对所选择的实例进行分类以及如何对所选择的实例进行分类。例如,在每周的块的上下文中,特定的实例可以表示一周中的第一个小时。如前面所指示的,时间序列数据的每个块表示季节的不同季节时段/样本,并且可以具有表示季节的不同实例的子块集合。每个季节样本可以包括存储用于由实例表示的子时段的时间序列数据的相应子块。处理可以将代表每周第一个小时的子块内的时间序列数据与该周剩余部分的时间序列数据进行比较,以确定如何对特定实例进行分类。如果检测到实例的复发性模式,那么处理继续到框410。否则处理继续到框412。
在框410处,处理将季节的所选择的实例与季节模式类相关联。如果基于在先前的块中执行的分析而检测到复发性高点模式,那么该实例可以与表示复发性季节性高点的对应类相关联。类似地,如果处理从相关联的子块内的时间序列数据中检测到复发性低点模式,那么该实例可以与表示复发性低点模式的类相关联。在其它实施例中,取决于在子块内检测到的复发性模式,相应的实例可以与不同的季节模式相关联。为了将实例与特定季节类相关联,处理可以更新与季节类对应的位向量中的与该实例对应的位,如下面进一步详细描述的那样。
在一些情况下,处理可能无法将实例与季节模式类相关联。例如,如果对应子时段内的时间序列数据跨不同的季节时段不遵循明确的复发性模式,那么会发生这种情况。在这种场景中,处理可以使该实例不分类。当实例保持未分类时,处理可以简单地继续分析季节的下一个实例(如果有的话),或者可以更新标志(诸如位向量中的位),该标志识别在第一遍中处理没有对哪些实例进行分类。
在框412处,处理确定是否存在季节的任何剩余实例要分析以进行分类。如果存在季节的剩余实例要分析,那么处理选择季节的下一个剩余实例并返回到框406,以确定如何对该下一个实例进行分类。否则,处理继续到框414。
在框414处,处理基于在先前的块中执行的分析来存储分类结果的集合。分类结果可以因实现方式而异,并且一般包括识别季节的实例已经与哪个季节类相关联的数据(如果有的话)。作为示例,对于给定的实例,分类结果可以识别给定实例是复发性高点、复发性低点还是被保持为未分类。
在一些实施例中,实例的集合的分类可以被存储为一个或多个位向量的集合(在本文也被称为数组)。参考图5,例如,图5绘出了在时间序列数据的集合内检测到的季节的实例的示例分类。为了获得分类结果,时间序列数据500被分块成季节样本510a至510n。季节样本510a至510n中的每一个根据由块520a至520n表示的季节的实例(其表示季节内的n个实例)被进一步分块。在周度季节的上下文中,每个季节样本可以代表一周的时间序列数据,并且每个实例可以表示在周度季节内的一小时子时段或者其它持续时间的子时段。取决于特定的实现方式,季节样本可以表示其它季节持续时间和/或实例可以表示其它子时段。位向量的集合对季节的实例进行分类,并且包括表示季节性高点的第一类的位向量530和表示季节性低点的第二类的位向量540。位向量内的不同位与季节的不同实例对应,并充当指示对应实例是否与类相关联的布尔值。例如,前七位可以在位向量530中被设置为“1”并且在位向量540中被设置为“0”,以指示季节的前七个实例跨季节样本510a至510n是旺季。在位向量530和位向量540二者中,后续的位序列都可以被设置为“0”,以指示季节的对应实例未分类。类似地,后续的位序列可以在位向量530中被设置为“0”并且在位向量540中被设置为“1”,以指示该季节的对应实例序列跨季节样本510a至510n是淡季。
位向量的长度可以取决于季节内的实例的数量而变化。在例如一周长度的季节的上下文中,位向量530和540可以各自存储表示季节内的一小时子时段的168个位。然而,当季节中存在较少的实例时,位向量的长度可以较短,或者当分析更大数量的实例时,位向量的长度可以较长。这允许对季节实例进行分析和分类的粒度的灵活性。
基于投票的分类
当确定如何对季节的实例进行分类时,根据一些实施例,季节模式分类逻辑236可以实现基于投票的方法。投票可以跨不同的分类函数和/或不同的季节时段发生。基于投票,可以为季节的实例确定最终的基于共识(consensus-based)的分类。
分类函数是指对季节的实例进行分类的过程或操作。分类函数可以采用各种技术(诸如量化、聚类、令牌计数、机器学习、随机分析或其某种组合)来对季节的实例进行分类。虽然一些实现方式可以采用单个分类函数来对季节的实例进行分类,但是其它实现方式可以使用多个分类函数。某些分类函数可以为包括季节时段内或跨不同季节时段的大幅波动的易变的时间序列数据的集合生成更优化的分类。其它分类函数对于不太易变的时间序列数据中的实例的分类可能是更优的。通过使用分类函数的组合,其中每个分类函数对如何对季节实例进行分类进行“投票”,可以减小错误分类的风险,并且可以实现更可靠的最终分类。
在一些实施例中,分类可以使用令牌计数来对季节的实例进行分类。通过使用令牌计数,跨不同的季节时段/样本分析季节的实例,以确定是将实例分类为高点还是低点。例如,在周度季节的上下文中,分析由每周内的不同实例表示的子时段(在本文被称为“目标子时段”)。如果由实例表示的目标子时段内的时间序列数据的平均值高于第一阈值百分比,那么该子时段对于该周可以被分类为高点。如果该值低于第二阈值百分比,那么该子时段对于该周可以被分类为低点。一旦目标子时段已经跨不同的周被分类,那么,如果阈值数(或阈值百分比)的目标子时段已经被分类为高,那么该实例就可以被分类为高点,或者,如果阈值数(或阈值百分比)的目标子时段已经被分类为低,那么该实例就可以被分类为低点。
作为令牌计数的附加或替代,一些实施例可以使用k均值聚类(k-meansclustering)来对季节实例进行分类。通过使用k均值聚类,数据点被分组为集群,其中不同的数据点表示季节的不同实例并且不同的集群表示季节的不同类。作为示例,第一集群可以表示复发性高点并且第二集群可以表示复发性低点。表示季节的特定实例的给定数据点可以被指派给具有最近均值或最近欧几里得距离的集群。
在一些实施例中,可以使用谱聚类来对季节的实例进行分类。通过使用谱聚类,基于季节时段内的实例定义相似性矩阵或图。相似性矩阵内的行或列表示确定季节时段的特定实例与该季节时段的其它实例有多相似的比较。例如,如果在周度季节时段内有168个实例,那么可以生成168×168的相似性矩阵,其中行或列指示特定实例相对于该季节时段内其它实例之间的距离。一旦创建了相似性矩阵,就可以使用该相似性矩阵的一个或多个特征向量来将实例指派给集群。在一些情况下,特征向量的中值可以基于其在相似性矩阵内的相应分量来计算。与特征向量中的高于中值的分量对应的实例可以被指派给表示季节性高点的集群,并且与低于均值的分量对应的实例可以被指派给表示季节性低点的第二集群。
当使用多个分类函数时,每个分类函数可以生成对属于特定季节的实例进行分类的对应结果(或结果集合)。作为示例,第一分类函数可以生成识别将哪些实例分类为复发性高点的第一位向量结果以及识别将哪些实例分类为复发性低点的第二位向量,其中位向量中的每个相应位与季节的不同实例对应。其它分类函数可以类似地生成将实例分类为高点或低点的位向量集合。取决于季节类的数量和分类中所涉及的函数的数量,所生成的分类结果的数量可以因实现方式而异。
不同分类函数的结果集合可以作为“投票”被处理,以便以某种方式对实例的集合进行分类。例如,位向量的第一位可以作为投票被处理,以将季节的第一实例与特定的季节类相关联,第二位可以作为投票被处理,以将季节的第二实例与特定季节类相关联,等等。结果可以被组合,以确定季节的每个实例的最终分类。结果被组合的方式可以基于投票规则的集合来确定,如下面进一步详细描述的那样。
投票也可以跨不同的季节时段/样本发生。例如,如果将时间序列分块成与n个不同季节时段对应的n个块,其中n表示大于1的整数值,那么分类函数可以针对特定的季节类生成n个位向量结果。参考图5,例如,可以生成多个位向量,以便跨不同的季节样本510a至510n对季节性高点子时段进行分类,其中每个位向量与不同的季节样本对应。在这种情况下,每个位向量内的特定位置处的位将基于针对相应季节时段所分析的那个实例的特点来对季节的对应实例进行分类。因此,第一位向量中的第一位可以基于对季节样本510a的分析来对季节的第一实例进行分类,第二位向量的第一位可以基于季节样本510b的特点来表征季节的第一实例,等等。类似地,不同位向量中的每一个位向量的第二位可以基于季节时段510a和510n的相应特点来对季节的第二实例进行分类,第三位对第三实例进行分类,等等。因此,位充当“投票”以基于对对应季节时段的分析而将实例与特定类相关联。然后可以基于投票规则的集合来组合来自不同季节时段的位向量,以生成对季节的实例进行分类的最终的有共识的位向量结果。
对于给定的时间序列数据集合,可以基于一个或多个投票规则对季节的实例进行分类,其中投票规则可以因实现方式而异。例如,通过使用多数投票规则,可以将实例指派给具有多数投票的季节类。换句话说,实例与如下的季节类相关联,即,分类函数中的大多数已经将该实例与该季节类相关联和/或该实例跨大多数季节时段与该季节类相关联。如果分类函数或季节时段已将该实例与不同的季节类相关联并且属于少数,那么它被大多数投票否决。在其它实现方式中,可以使用其它投票阈值。例如,如果对应的子时段以超过阈值百分比被分类为高点,那么可以将实例分类为高点,并且,如果对应的子时段以超过阈值百分比被分类为低点,那么可以将实例分类为低点。作为另一个示例,最终的有共识的分类可以基于全体一致的投票。如果没有达到全体一致的投票,那么实例可能保持未分类。不同的分类函数也可以被赋予相等或不同的投票权重。因此,趋于更可靠的分类函数可以被赋予对季节的最终分类的更强大的投票影响。
分段创建和均匀化
一旦季节的实例已经被初始地分类,季节模式分类逻辑236就基于分类生成分段的集合。在这个上下文中,分段是指如下的数据对象,即,该数据对象与和特定季节类相关联的时间区段对应,或者以其它方式识别与特定季节类相关联的时间区段。表示时间上相邻的子时段并且共享相同分类的实例被合并到同一分段中或者以其它方式与同一分段相关联。指派给分段的实例在本文中被称为“属于”该分段。由分段表示的时间区段覆盖由属于特定分段的一个或多个实例表示的一个或多个子时段。
在一些实施例中,可以通过开始时间和结束时间来定义分段。例如,在周度季节的上下文中,可以通过与特定类相关联的一天以及该天中的开始小时/结束小时来定义分段。因此,第一分段可以将周一的上午9点到下午5点(其可以写为M 9-17)识别为旺季,第二分段可以将周二的上午1点到上午8点(其可以写为T 1-8)识别为淡季,等等。在月度季节的上下文中,可以以相同的方式定义分段,或者可以将分段定义为周以及该周中的开始日/结束日。因此,分段识别时间区段的粒度可以取决于特定实现方式而变化。
在一些实施例中,与特定季节类相关联的分段可以用一个或多个未分类的实例“填充”。用未分类的实例填充分段可以包括指派或以其它方式将未分类的实例与分段相关联。当未分类的实例被填充到特定的分段时,该未分类的实例属于该分段,并且由此与属于该分段的分类实例的相同季节类相关联。换句话说,由该分段表示的时间区段被扩展为除了由属于该分段的(一个或多个)分类实例表示的(一个或多个)子时段之外,还覆盖由(一个或多个)未分类实例表示的(一个或多个)子时段。扩展分段以覆盖未分类的实例允许创建直观且容易处理的季节分类,其提供对时段间(inter-period)模式的类似描述。作为示例,可以通过查找跨工作周的每一天的旺季的共同开始小时/结束小时或者一个月的每个第二个周五出现的旺季的开始小时/结束小时来扩展分段并将其与其它分段进行均匀化。基于共性(commonality)跨不同分段进行均匀化也会导致更一致的并且表示比简单的高/低分类更高级别综合的复发性模式的输出。
图6绘出了用于基于分类实例的集合生成并均匀化分段的集合的示例处理,其中经均匀化的分段的集合用于生成一个或多个季节模式类的总结数据。在框602处,处理接收分类实例的集合作为输入。作为示例,如前所述,输入可以包括布尔数组/位向量的集合,其中数组与特定的季节类对应并且识别季节的哪些实例与该类相关联。在周度季节的上下文中,实例可以被建模为具有168个元素的布尔数组,其中每个元素指示小时是否跨不同的季节时段一直为高或低。
在框604处,基于分类来合并数组内的实例。作为示例,当数组内的实例位于该数组的共享相同分类的两个其他实例之间、这两个其他的实例在数组内彼此在规定的或阈值数量的实例内(如由数组中的位位置所确定的),并且要合并的实例不与冲突的分类相关联时,该实例可以被合并。例如,在周度季节性和检测的上下文中,如果两个小时被分类为相同(高点或低点),那么,如果这两个小时之间没有冲突的分类(低点或高点),那么这两个小时之间的未分类的小时也可以被重新分类为高点或低点。
在框606处,为合并的实例生成分段的集合。对于已经被合并的给定实例集合,可以生成对应分段,该对应分段表示由合并的实例覆盖的时间区段。在周度季节性检测的上下文中,可以通过根据属于该分段的合并的实例集合所确定的一天以及开始小时/结束小时来定义分段。因此,如果合并的实例表示跨越周一上午9点到下午5点的一小时的子时段,那么创建识别该时间区段的对应分段。一旦生成,分段就可以被存储在易失性存储装置和/或非易失性存储装置中。
在框608处,处理确定是否对分段的集合进行均匀化。该确定可以基于一个或多个标准,这些标准可以因实现方式而异。在一些实施例中,均匀化可以递归地发生,直到所创建的分段达到阈值均匀化水平。在其它实施例中,均匀化可以递归地发生指定的次数。在其它实施例中,均匀化可以被完全跳过。
在框610处,处理计算已经为给定季节创建的不同分段之间的相似性。两个分段之间的相似性可以基于不同分段之间的共性来确定,诸如跨与不同日期或不同季节时段相关联的分段的共同开始小时/结束小时。例如,可以根据重叠实例的数量与分段长度的最大值之比来确定相似性。更具体而言,如果i1和i2是由两个分段描述的两个实例集合,那么它们之间的相似性是s=|i1∩i2|/max(|i1|,|i2|)。在这里,|ii|计算集合ii的势(cardinality)或长度,并且∩是交集。例如,分段周一5-8与周二4-7的相似性是|{5,6,7,8}∩{4,5,6,7}|/max({5,6,7,8},{4,5,6,7})=3/4。这个框处的相似性计算可以作为框608的一部分来执行以确定分段是否已经满足相似性/经均匀化的阈值水平,或者可以作为分开且独立的步骤来执行。
在框612处,处理基于分段相似性来均匀化和过滤分段。通过调节被分段覆盖的时间区段,相似且共享共性的分段可以被均匀化。均匀化可以包括将分段开始时间/结束时间设置为两个分段的相应的最小/最大值和/或校正与相反类型的分段的任何重叠。例如,如果存在与时间区段周一5-8和周二4-9对应的“高”分段以及与时间区段周一9-12对应的“低”分段,那么可以更新高分段以表示时间区段周一4-8和周二4-8。因此,周一5-8的高分段将扩展成覆盖表示周一4-5的实例。由于与低分段重叠,所以表示周二4-9的高分段将收缩成4-8。在集合中的相似分段已经被均匀化之后,一个或多个分段可以或者与另一个分段完全相同或者完全包含在另一个分段中。这些分段可以通过从用于总结季节的集合中移除它们而被过滤。
在框612之后,处理返回到框608,并且处理确定是否对经更新的分段重复均匀化。在周度季节性检测和表征的上下文中,一种技术是对高点模式和低点模式执行两次均匀化。然而,如前所述,均匀化可以递归地发生任何次数。一旦均匀化和过滤完成,处理就继续到框614。
在框614处,处理基于(经均匀化或未经均匀化的)分段集合生成总结并将其存储在易失性存储装置或非易失性存储装置中。在这个上下文中,总结是指识别表示至少一个季节模式类的一个或多个时间区段的一个或多个数据对象。例如,在周度季节的上下文中,处理可以生成识别与特定季节类相关联的天和小时的总结数据,如根据均匀化(如果应用的话)之后的分段所确定的那样。处理可以合并时段间分段,以创建更直观且易于处理的总结。例如,如果分段周一9-17、周二9-17、周三9-17、周四9-17和周五9-17与相同的季节类相关联,那么季节模式可以被总结为周一至周五9-17。
图7绘出了通过基于分类实例的集合生成并均匀化分段的集合而获得的示例总结数据。图表702绘出了一周内被分类为季节性高点的实例。图表704绘出了从这周内的实例生成的结果分段以及用于总结季节性高点模式的分段的两遍均匀化。如图所示,所生成的分段的初始集合包括周一21-23、周二0-5、周二20-23等等。在第一遍均匀化中,这些分段中的一些被扩展以覆盖未分类的实例。例如,周一21-23被均匀化成周一20-23,以包括先前未分类的实例周一20-21。类似地,周五0-6被扩展成包括两个附加的相邻且未分类的实例,从而导致该分段被扩展到周五0-8。第二遍均匀化进一步修改这些段,在此之后,生成季节模式的总结。该总结合并具有重叠的子时段分类的时段间分段。因此,总结数据将周一至周五20-23和周二至周六0-8识别为一周内的旺季。
总结视图和界面
为给定的时间序列数据的集合生成的总结数据可以提供用于分析分类的季节模式的一个或多个视图或其它界面。例如,总结生成逻辑238可以生成GUI对象、界面控件、文本数据和/或其它数据对象,以显示检测到什么复发性模式以及它们如何被分类的总结。参考图8,图8绘出了用于已经被分类为复发性每周高点和复发性每周低点的季节模式的示例总结。该总结包括识别季节类以及属于该季节类的时间区段/分段的数据。在本示例中,对于周度数据库登录(logon),季节类与重现的季节性高点和重现的季节性低点对应。总结数据包括周度简档视图,该视图允许用户可视化典型的周度季节。周度简档视图中的数据点可以基于提取出的稀疏/密集季节分量、在时间序列数据内检测到的标称值和/或推断的趋势点而生成。
总结生成逻辑238可以生成允许用户导航到不同总结视图和/或下钻取(drill-down)以查看关于季节简档的更多细节的界面。在数据库登录的上下文中,例如,用户可以导航到具体的一周,以查看历史和/或预测的数据库登录。当基于从多个主机收集的数据生成分类时,用户可以向下钻取到具体的主机,以查看针对该具体主机数据库的季节模式。因此,用户可以查看针对个体目标硬件或软件资源以及针对一组目标硬件和/或软件资源的分类季节模式和趋势。例如,对于数据库登录,用户可以查看针对个体数据库服务器实例的季节登录模式以及针对一组数据库服务器实例的季节登录模式。这允许用户针对跨多个数据库服务器的整体数据库使用来分析季节模式,以及针对具体数据库服务器来分析季节模式。
附加地或可替代地,总结生成逻辑238可以生成允许用户在用于不同数据类的季节模式之间导航的界面。作为示例,在数据中心或其它联网环境内,可以监视环境内的硬件和/或软件资源的各种属性。被监视的时间序列数据可以跟踪各个时间点的资源使用和/或消耗。可以在环境内被监视的示例时间序列数据可以包括但不限于数据库登录、数据库活动会话、数据库事务响应时间、HTTP请求的数量、主机盘输入/输出操作、虚拟机堆使用、主机机器存储器使用,等等。上述季节模式检测和分类技术可以应用于不同类的时间序列数据,以便针对不同的被监视的硬件和/或软件资源对季节模式进行分类。然后,用户可以在针对不同资源的分类的季节模式之间导航。例如,用户可以首先查看针对数据库登录对旺季和淡季进行分类的总结,然后查看针对数据库活动会话对旺季和淡季进行分类的总结,等等。因此,可以向系统管理员或其他用户提供直观的显示,从而允许用户快速分析针对被监视的环境内的各种资源的季节性使用模式。
所生成的总结数据可以基于请求被集成到一个或多个应用中或者以其他方式提供给一个或多个应用。可以生成和/或访问总结数据以执行各种季节感知操作的示例应用可以包括但不限于:
·季节感知的异常检测和训练系统,该系统使用总结数据来训练和评估异常检测器,从而考虑季节性高点、季节性低点和/或其它季节模式。例如,数据库登录的突然尖峰看起来可以是异常的高点,但实际上可以是季节稀疏高点。异常检测器可以基于这种季节模式来训练,以在识别和分类异常时减少虚警(false flag)。
·维护计划系统,该系统使用总结数据在最佳时间调度和执行维护。例如,对于正在被监视的目标软件或硬件部署,可以针对与季节性低点具有最大重叠的时间窗口来设置维护。
·作业调度系统,该系统在对统计信息的收集、存储器压缩或其它类似的批处理作业进行调度时使用总结数据。处理可以调度批处理作业,以与季节性低点重叠。
·整合系统,该系统使用总结数据来推荐资源整合或自动整合资源。例如,具有不重叠的季节的一组目标硬件和/或软件资源可以被整合到单个硬件或软件资源中。
·容量计划系统,该系统使用总结数据来隔离并确定旺季的趋势,以确定所部署的软件和/或硬件资源是否足以满足使用需求。
诸如以上列出的那些的应用可以与分析服务230交互,以请求和/或接收总结数据。当向分析服务230提交请求时,应用可以指定一个或多个参数(诸如季节的长度、要分析的时间序列数据的集合、阈值,等等)以生成总结。基于这些参数,分析服务230可以基于先前描述的技术来分析并生成用于一个或多个时间序列的总结数据。
时间序列数据内的稀疏特征和密集特征
如前面所指示的,给定的时间序列数据的集合可以包括稀疏季节模式和/或密集季节模式。如果特征/模式在季节内的持续时间小于阈值,那么它被认为是稀疏的,由此指示所表现出的行为是离群值(outlier)。稀疏特征一般显现为隔离的数据点或远离时间序列内的平均数据点的一小组数据点。相反,如果特征/模式在季节内的持续时间满足阈值(例如,落入阈值内或高于阈值),那么它被认为是密集的,从而指示所表现出的行为不是离群值。
存在造成在时间序列数据的集合内的稀疏信号的许多可能的原因。作为示例,稀疏信号可以与特定目标资源的使用中的突然激增(稀疏高点)或下降(稀疏低点)对应。在一些情况下,稀疏信号可能是噪声(诸如由异常事件造成的活动)。在其它情况下,激增或下降可以由复发性季节事件(诸如周期性维护操作)造成。
对于给定的时间序列数据的集合,噪声信号可以具有相比较小密集模式的量值占优势的量值。在没有对时间序列数据中的稀疏特征和密集特征进行分开处理的情况下,由于叠加的噪声的量值,密集模式可能会被忽视。为了防止密集模式不被分类,季节模式分类逻辑236可以在时间序列内从密集数据中过滤掉或分离出噪声数据。当选择季节的复发性高点和复发性低点时,季节模式分类逻辑236还可以提供用于时间序列的稀疏特征和密集特征的分开的处理。
在下面的章节中,描述在时间序列内对复发性高点和复发性低点进行分类的有监督方法和无监督方法。有监督方法和无监督方法二者都将时间序列拆分或“分解”成噪声信号和密集信号。噪声信号(在本文中也被称为稀疏信号或稀疏分量)捕获时间序列中以其它方式具有密集分布的数据的稀疏分布。相比之下,密集信号(在本文中也被称为密集分量)使用平滑或平均来捕获密集分布,使得噪声信号被过滤掉和移除。
时间序列数据集合被分解成稀疏分量和密集分量的方式可以取决于具体实现方式而变化。在一些实施例中,可以从加性Holt-Winters模型的季节因子中获得密集分量。如前面所指示的,Holt-Winters模型采用三重指数平滑来获得季节指标。所应用的平滑实际上移除了原始时间序列信号的稀疏分量。结果是包括原始时间序列的密集特征的时间序列。虽然可以使用加性Holt-Winters模型来生成时间序列的密集信号,但是在其它实施例中,可以使用其它技术(诸如其它局部平均或平滑函数)来获得密集信号。一旦已经生成并存储了密度分量,就可以通过取原始时间序列数据的集合并从原始信号中减去密集分量来确定噪声分量。所得到的噪声信号是包括来自原始时间序列的噪声特征的时间序列。
通过将时间序列分解成密集分量和噪声分量,可以独立地处理密集特征和稀疏特征。对于季节的给定实例,该实例的分类可以基于对密集分量、稀疏分量或其某种组合的处理。例如,在周度季节的上下文中,可以基于针对表示周一9-10的实例而分析的稀疏特征和/或密集特征,将该实例选择为复发性高点或复发性低点。
处理分量信号可以包括但不限于应用平滑函数、过滤器、分类函数等等。可以以考虑密集信号和噪声信号的特点的差异的方式来执行处理。作为示例,噪声信号可以以与密集信号不同的方式被过滤和平滑,因为两种信号之间的变化会显著不同。作为另一个示例,所应用的分类函数在稀疏分量与密集分量之间可以是不同的。下面在对复发性高点模式和复发性低点模式的有监督和无监督的选择的描述中进一步提供示例处理。
用于选择时间序列数据中的复发性高点模式和复发性低点模式的有监督方法
在用于选择时间序列中的复发性高点模式和复发性低点模式的有监督方法中,季节模式分类逻辑236接收领域知识作为输入,以辅助对季节模式进行分类。在这个上下文中的领域知识包括与具体领域相关联的数据(诸如具体的目标资源、目标资源的集合、时间序列或时间序列的集合)。例如,针对特定软件资源的领域知识可以包括指定用于将季节的特定实例分类为高点或低点的参数的数据。在分析用于一个软件资源或软件资源集合的时间序列时输入的领域知识/参数可以不同于在分析另一个软件资源或软件资源集合的时间序列时输入的领域知识/参数。可以基于针对不同资源的不同预期或观测到的使用模式来选择参数。
图9绘出了用于选择时间序列数据中的复发性高值和低值的示例有监督处理。在框902处,由季节分类逻辑236接收时间序列。时间序列数据可以如前所述地起源于一个或多个数据源。作为示例,时间序列可以包括随时间跟踪特定资源或资源集合的使用或性能信息的数据点的汇集。
在框904处,季节模式分类逻辑236将时间序列分解为密集分量和噪声分量。密集分量和噪声分量可以如前所述的那样获得。例如,在周度季节性检测和表征的上下文中,可以通过计算在框902处接收到的时间序列与该时间序列的平滑版本之间的差异来获得稀疏时间序列。密集时间序列可以从来自经平滑的时间序列的加性Holt-Winters分解的季节因子中获得。
响应于分解原始时间序列,分别在框906和框912处将稀疏时间序列和密集时间序列存储在易失性存储装置和/或非易失性存储装置中。然后一个或多个处理的集合可以独立地分析并处理这两个分量。框908和框910绘出了可以应用于时间序列的稀疏分量的示例处理,而框914和框916绘出了可以应用于密集分量的示例处理。
在框908处,季节模式分类逻辑236通过从具有稀疏特征的时间序列中选择复发性高实例和复发性低实例来生成季节的实例的第一分类。季节模式分类逻辑236可以应用如前所述的一个或多个分类函数,以对季节的实例进行分类。在具有跨越一小时子时段的实例的周度季节的上下文中,可以与多数投票共识一起使用分类函数(诸如谱聚类、K均值分析等等)的集合,以对季节的168个实例进行分类。然而,分类函数和在这个框处被分类的实例的数量可以取决于特定的实现方式而变化。季节模式分类逻辑236可以为具有稀疏特征的时间序列生成一个或多个位向量的集合,这一个或多个位向量指示哪些实例被选择为高点并且哪些实例被选择为低点。
在框914处,季节模式分类逻辑236从具有密集特征的时间序列中选择复发性高实例和复发性低实例。季节模式分类逻辑236可以应用应用于具有稀疏特征的时间序列的相同分类函数,或者应用不同的分类函数,这取决于特定的实现方式。例如,季节模式分类逻辑可以使用谱聚类、K均值分析、令牌计数等等。季节模式分类逻辑236可以为具有密集特征的时间序列生成一个或多个位向量的集合,这一个或多个位向量指示哪些实例被选择为高并且哪些实例被选择为低。
在框918处,季节模式分类逻辑236接收用于过滤所选择的实例的领域知识。领域知识可以由人类用户(诸如管理员)、一个或多个客户端250a至250n、应用或者通过某种其它接口输入。在一些实施例中,领域知识包括用户提供的最小变化,用于过滤掉和忽略所选择的实例。例如,领域知识可以指定具有低于阈值的规格化量值(诸如与标称量值相比小于阈值百分比的变化)的实例被过滤掉和忽略。在这个上下文中,“规格化量值”是指用于实例的稀疏信号的量值与标称量值之比。在另一个示例中,领域知识可以指定具有落在用户指定的阈值量值以下的量值的实例被过滤掉和忽略。例如,在数据库会话的上下文中,用户可以指定忽略其中存在低于十个活动会话的实例。
在框910处,季节模式分类逻辑236基于接收到的领域知识从具有稀疏特征的时间序列中过滤非显著的实例。如前面所指示的,季节模式分类逻辑236可以过滤掉其量值低于用户指定的值或者其规格化量值(量值与标称量值之比)低于用户指定的值的所选择的高实例。如下面进一步描述的,当为实例获取复发性高点和低点的最终选择时,被过滤的实例不被赋予权重。
在框916处,季节模式分类逻辑236基于接收到的领域知识从具有密集特征的时间序列中过滤非显著的实例。用于从稀疏信号中过滤实例的相同阈值变化也可以被用于从密集信号中过滤实例,或者可以使用不同的阈值,这取决于输入的领域知识。
在框920处,将来自稀疏数据的所选择的实例与来自密集数据的所选择的实例融合。为了融合数据,如果所选择的高点是从稀疏时间序列或者密集时间序列中选择的,那么季节模式分类逻辑236可以保留这些所选择的高点,并且,如果所选择的低点是从密集时间序列中选择的并且从稀疏时间序列中没有被选择为高点,那么保留这些所选择的低点。被过滤掉的所选择的实例在这一步被忽略。因此,最初从稀疏时间序列中被选择为高点的被过滤掉的实例在这一步不被保留。
在框922处,从经融合的数据中获得所选择的实例的最终集合。季节模式分类逻辑236可以在易失性存储装置或非易失性存储装置中存储一个或多个位向量的集合,以识别所选择的实例。例如,在周度季节的上下文中,第一位向量可以包括识别一周中的每个一小时实例是否已经被分类为高点的168个位,第二位向量可以识别每个一小时实例是否被分类为低点,并且第三位向量可以识别哪些实例是稀疏高点。一旦已经获得了所选择的实例的最终集合,就可以基于位向量的集合如上所述地生成并均匀化分段的集合。
用于选择时间序列数据中的复发性高点模式和复发性低点模式的无监督方法
在一些实施例中,季节分类逻辑236可以支持用于选择时间序列中的复发性高点模式和低点模式的无监督方法。无监督方法允许自动选择复发性高点季节模式和复发性低点季节模式,而不需要接收关于高点模式和低点模式应当是什么的详细规范。换言之,无监督方法提供了允许来自用户的最小输入的操作模式,因为季节模式的显著性是被隐式地推断出的。
无监督方法可以用于如下的应用,即,在该应用中,分析的规模阻碍由有监督方法使用的领域信息的可靠捕获和注入。季节分类逻辑236可以在分析给定的时间序列数据的集合时确定这种领域信息是否可用。如果不可用,那么季节分类逻辑236可以使用无监督方法而不是有监督方法。例如,如果用户想要为数百个单独的软件目标制定季节感知的计划决策,那么用户可能无法为每个应用提供指定高点模式和低点模式看起来是什么样子的领域信息。因此,可以使用无监督处理来对季节模式进行分类。
图10绘出了用于选择时间序列数据中的复发性高值和低值的示例无监督处理。在框1002处,由季节分类逻辑236接收时间序列。如前所述,时间序列数据可以源自一个或多个数据源。作为示例,时间序列可以包括对于特定资源或资源集合跟踪随时间的使用或性能信息的数据点的集合。
在框1004处,季节模式分类逻辑236将时间序列分解为密集分量和噪声分量。密集分量和噪声分量可以如前面对有监督方法以及上面其它章节所描述的那样获得。例如,在周度季节性检测和表征的上下文中,可以通过计算在框902处接收到的时间序列与该时间序列的平滑版本之间的差异来获得稀疏时间序列。密集时间序列可以从来自经平滑的时间序列的加性Holt-Winters分解的季节因子中获得。
响应于分解原始时间序列,分别在框1006和框1008处将稀疏时间序列和密集时间序列存储在易失性和/或非易失性存储装置中。然后,一个或多个处理的集合可以独立地分析并处理这两个分量。框1010绘出了可以应用于时间序列的稀疏分量的示例处理。
在框1010处,季节模式分类逻辑236从具有稀疏数据的时间序列中选择显著且一致的稀疏特征。为了选择统计上显著的稀疏特征,可以使用最大浓度间隔(maximumconcentration interval)来保留位于规定覆盖范围(例如,99%)之外的特征。最大浓度间隔的阈值可以取决于特定间隔而变化。具有不落在阈值之外的量值的稀疏特征被确定为不表示候选稀疏高点并且被过滤掉。
为了选择一致的特征,季节模式分类逻辑236可以在规定的时段内执行对统计上显著的实例(在本文中被称为“候选稀疏特征”)的有条件平均(conditional averaging),其中执行调节(conditioning)以抑制或消除不重现的特征的影响。例如,可以从稀疏数据中过滤掉在阈值数量的季节样本中不重现的候选稀疏特征。在周度季节性检测和表征的上下文中,一致的特征的选择可以通过在从候选集合中移除最小和最大稀疏特征的情况下计算候选稀疏特征每小时平均值来实现。这一步的输出是用于典型一周的特征。为了得到在后续步骤中使用的经组合的时间序列,用于典型一周的稀疏特征具有与原始时间序列相同的统计上显著且一致的稀疏特征。这一步的输出可以被用于注释季节的哪些实例或子时段已经被识别为稀疏特征。
在框1012处,通过将经处理的稀疏时间序列与具有密集特征的(经处理的或未经处理的)时间序列进行组合来生成经修改的、重建的时间序列。在一些实施例中,可以在重组经修改的时间序列之前从原始时间序列移除一个或多个密集特征,使得经修改的时间序列不包括这些密集特征。例如,在将密集信号与经处理的稀疏信号进行组合之前,可以应用平滑函数或者可以以其它方式过滤掉非显著的密集特征。在其它实施例中,经处理的稀疏信号可以与未处理的密集信号组合,由此保留原始时间序列中的每个密集特征。在任一种情况下,经更新的时间序列都捕获原始时间序列的显著/一致稀疏特征以及来自原始时间序列的密集特征的至少子集。经更新的时间序列不捕获非显著和/或不一致的稀疏特征以及已经被过滤的密集特征(如果有的话)。
在框1014处,经修改的、重建的时间序列被存储在易失性或非易失性存储装置中。通过过滤掉不被认为统计上显著或一致的稀疏特征,噪声信号对密集分布的影响可以显著降低。同时,通过保留统计上显著和一致的特征,可以从重建的时间序列中检测可以表示季节模式的稀疏特征并对其进行分类。
在框1016处,季节模式分类逻辑236从重建的时间序列数据中选择复发性高实例和低实例。季节模式分类逻辑236可以应用如前所述的一个或多个分类函数,以对季节的实例进行分类。在具有跨越一小时子时段的实例的周度季节的上下文中,可以与多数投票共识一起使用分类函数(诸如谱聚类、K均值分析等等)的集合,以对季节的168个实例进行分类。然而,分类函数和在这个框中被分类的实例的数量可以取决于特定的实现方式而变化。季节模式分类逻辑236可以为具有稀疏特征的时间序列生成一个或多个位向量的集合,这一个或多个位向量指示哪些实例被选择为高点并且哪些实例被选择为低点。
在框1018处,将在框1016处确定的所选择的实例的最终集合存储在易失性或非易失性存储装置中。如前所述,分类结果可以包括一个或多个位向量的集合,以识别所选择的实例。例如,在周度季节的上下文中,第一位向量可以包括识别一周中的每个一小时实例是否已经被分类为高点的168个位,第二位向量可以识别每个一小时实例是否被分类为低点,并且第三位向量可以识别哪些实例是稀疏高点。一旦已经获得了所选择的实例的最终集合,就可以基于位向量的集合如上所述地生成并均匀化分段的集合。
基于稀疏数据和密集数据来注释总结视图
在一些实施例中,使用稀疏复发性高实例和/或低实例来注释和提取包含在密集季节内的稀疏季节模式。例如,如果稀疏复发性实例被反映在周一-周五12,那么总结数据可以包括注解,使得如果从周六-周日12-20密集季节内提取出周六-周日15稀疏实例,那么实例/子时段周六-周日15被标记为是稀疏的。这种注释为用户提供了以不同方式处理稀疏/密集的机会。对于某些用例,基于稀疏模式与密集模式之间的区别进一步处理。
图11绘出了稀疏模式与密集模式分开被提取和注释的示例总结。如可以看出的,这个时间序列中存在两个季节模式。一个是小的密集模式,其在每周一早间发生,而另一个是非常大的稀疏模式,其在时间序列的后半部分中出现。在没有稀疏/密集特征的分开处理并且不过滤的情况下,选择方法可能只挑出稀疏模式,因为它的量值相对于较小的密集模式占优势。相反,如果离群值被完全过滤,那么选择方法将只挑出较小的密集模式。通过提供对稀疏特征和密集特征的详细考虑,可以准确地检测和注释这两种模式。
硬件实现
根据一个实施例,本文所描述的技术由一个或多个专用计算设备实现。专用计算设备可以是硬连线的以执行所述技术,或者可以包括诸如被永久性地编程以执行所述技术的一个或多个专用集成电路(ASIC)或现场可编程门阵列(FPGA)的数字电子设备,或者可以包括编程为按照固件、存储器、其它储存器或者其组合中的程序指令执行所述技术的一个或多个通用硬件处理器。这种专用计算设备还可以合并定制的硬连线逻辑、ASIC或FPGA与定制的编程来实现所述技术。专用计算设备可以是台式计算机系统、便携式计算机系统、手持式设备、联网设备或者结合硬连线和/或程序逻辑来实现所述技术的任何其它设备。
例如,图12是示出本发明的实施例可以在其上实现的计算机系统1200的框图。计算机系统1200包括总线1202或者用于传送信息的其它通信机制,以及与总线1202耦合用于处理信息的硬件处理器1204。硬件处理器1204可以是例如通用微处理器。
计算机系统1200还包括耦合到总线1202用于存储信息和要由处理器1204执行的指令的主存储器1206(诸如随机存取存储器(RAM)或其它动态存储设备)。主存储器1206还可以用于在要由处理器1204执行的指令执行期间存储临时变量或其它中间信息。当存储在处理器1204可访问的非暂态存储介质中时,这种指令使计算机系统1200变成为执行指令中所规定的操作而定制的专用机器。
计算机系统1200还包括只读存储器(ROM)1208或者耦合到总线1202的其它静态存储设备,用于为处理器1204存储静态信息和指令。提供了存储设备1210(诸如磁盘、光盘或固态驱动器),并且将其耦合到总线1202,用于存储信息和指令。
计算机系统1200可以经由总线1202耦合到显示器1212(诸如液晶显示器(LCD)或发光二极管(LED)显示器),用于向计算机用户显示信息。输入设备1214(包括字母数字和其它键)耦合到总线1202,用于向处理器1204传送信息和命令选择。另一种类型的用户输入设备是游标控制1216(诸如鼠标、轨迹球或者游标方向键),用于向处理器1204传送方向信息和命令选择并且用于控制显示器1212上的游标运动。这种输入设备通常具有在两个轴(第一个轴(例如,x)和第二个轴(例如,y))中的两个自由度,这允许设备在平面内规定位置。
计算机系统1200可以利用定制的硬连线逻辑、一个或多个ASIC或FPGA、固件和/或程序逻辑来实现本文所述的技术,这些与计算机系统相结合,使计算机系统1200成为或者把计算机系统1200编程为专用机器。根据本发明的一个实施例,本文的技术由计算机系统1200响应于一个或多个序列的处理器1204执行包含在主存储器1206中的一个或多个指令的而执行。这种指令可以从另一个存储介质(诸如存储设备1210)读到主存储器1206中。包含在主存储器1206中的指令序列的执行使处理器1204执行本文所述的过程步骤。在替代实施例中,硬连线的电路系统可以代替软件指令或者与其结合使用。
如在本文所使用的,术语“存储介质”指存储使机器以特定方式操作的数据和/或指令的任何非暂态介质。这种存储介质可以包括非易失性介质和/或易失性介质。非易失性介质包括例如光盘或磁盘,诸如存储设备1210。易失性介质包括动态存储器,诸如主存储器1206。存储介质的常见形式包括,例如,软盘、柔性盘、硬盘、固态驱动器、磁带,或者任何其它磁性数据存储介质,CD-ROM,任何其它光学数据存储介质,任何具有孔模式的物理介质,RAM、PROM和EPROM、FLASH-EPROM、NVRAM,任何其它存储器芯片或盒式磁带。
如本文所使用的,术语“逻辑”包括计算机或(一个或多个)电子硬件部件、固件、存储指令的非瞬态计算机可读介质,和/或被配置为执行一个或多个功能或动作和/或造成来自另一个逻辑、方法和/或系统一个或多个功能或动作的这些部件的组合。逻辑可以包括由可执行代码控制的微处理器、离散逻辑(例如,ASIC)、模拟电路、数字电路、编程逻辑器件、包含在被执行时执行算法的指令的存储器设备,等等。逻辑可以包括一个或多个门、门的组合或其它电路部件。在描述多个逻辑单元时,可以有可能将多个逻辑单元结合到一个物理逻辑部件中。类似地,在描述单个逻辑时,可以有可能在多个物理逻辑部件之间分配单个逻辑单元。
存储介质与传输介质截然不同但是可以与其结合使用。传输介质参与在存储介质之间传送信息。例如,传输介质包括同轴电缆、铜线和光纤,包括包含总线1202的配线。传输介质还可以采取声或光波的形式,诸如在无线电波和红外线数据通信中产生的那些。
各种形式的介质可以参与把一个或多个指令的一个或多个序列携带到处理器1204以供执行。例如,指令最初可以携带在远端计算机的磁盘或固态驱动器上。远端计算机可以把指令加载到其动态存储器中并且利用调制解调器经电话线发送指令。位于计算机系统1200本地的调制解调器可以在电话线上接收数据并且使用红外线发送器把数据转换成红外线信号。红外线检测器可以接收在红外线信号中携带的数据并且适当的电路系统可以把数据放在总线1202上。总线1202把数据携带到主存储器1206,处理器1204从该主存储器1206检索并执行指令。由主存储器1206接收的指令可以可选地在被处理器1204执行之前或之后存储在存储设备1210上。
计算机系统1200还包括耦合到总线1202的通信接口1218。通信接口1218提供耦合到网络链路1220的双向数据通信,其中网络链路1220连接到本地网络1222。例如,通信接口1218可以是综合业务数字网络(ISDN)卡、电缆调制解调器、卫星调制解调器,或者提供到对应类型的电话线的数据通信连接的调制解调器。作为另一个示例,通信接口1218可以是提供到兼容的局域网(LAN)的数据通信连接的LAN卡。也可以实现无线链路。在任何此类实现方式中,通信接口1218都发送和接收携带表示各种类型信息的数字信号流的电信号、电磁信号或光学信号。
网络链路1220通常通过一个或多个网络向其它数据设备提供数据通信。例如。网络链路1220可以通过本地网络1222提供到主机计算机1224或者到由互联网服务提供商(ISP)1226操作的数据设备的连接。ISP 1226又通过现在通常称为“互联网”1228的全球分组数据通信网络提供数据通信服务。本地网络1222和互联网1228都使用携带数字数据流的电信号、电磁信号或光学信号。通过各种网络的信号以及在网络链路1220上并通过通信接口1218的信号是传输介质的示例形式,其中信号把数字数据带到计算机系统1200或者携带来自计算机系统1200的数字数据。
计算机系统1200可以通过(一个或多个)网络、网络链路1220和通信接口1218发送消息和接收数据,包括程序代码。在互联网示例中,服务器1230可以通过互联网1228、ISP1226、本地网络1222和通信接口1218发送对应于程序的所请求代码。
所接收的代码可以在其被接收时由处理器1204执行,和/或存储在存储设备1210或其它非易失性储存器中,以供随后执行。
云计算概述
本文描述的技术是使用一个或多个处理方案来实现的,其示例包括分布式系统、集群式计算系统和云计算系统。在实施例中,上述的一个或多个逻辑块是云计算系统的一部分。云计算系统实现以下一个或多个:云存储、云处理、云通信以及任何其它类型的云计算服务。另外,云计算系统可以依据现用现付模型、依据固定订阅模型等等操作。在基于云的环境中,上述功能的任何部分(或整体)可以经由在云计算系统处暴露的接口来控制。
扩展和替代方案
在前面的说明书中,已经参考各种具体细节描述了本发明的实施例,这些细节可以因实现方式而异。因而,说明书和附图应当被认为是说明性的而不是限制性的。本发明的范围的唯一且排他的指标以及申请人预期作为本发明的范围的内容是从本申请中发出的权利要求集合的字面和等同范围,这是以这种权利要求发出的具体形式,包括任何后续的更正。

Claims (13)

1.一种计算机实现的方法,包括:
使用一个或多个计算设备来识别时间序列数据集合内的季节的多个实例,其中所述时间序列数据集合跟踪至少一个计算资源的至少一个性能度量;
其中所述多个实例中的每个实例与所述季节内的不同的相应子时段对应;
使用一个或多个计算设备将来自所述季节的所述多个实例的第一实例集合与针对所述至少一个性能度量的季节模式类相关联;
其中在将来自所述季节的所述多个实例的第一实例集合与所述季节模式类相关联之后,来自所述多个实例的第二实例集合不与针对所述至少一个性能度量的该季节模式类相关联;
使用一个或多个计算设备基于所述多个实例中的第一实例集合和第二实例集合来生成总结,所述总结识别与所述季节模式类相关联的一个或多个时间区段;
其中所述一个或多个时间区段跨越与第二实例集合中的至少一个实例对应的至少一个子时段以及与第一实例集合中的至少一个实例对应的至少一个子时段;
其中,第二实例集合中的所述至少一个实例对应于未被分类的至少一个子时段;
执行至少一个季节感知操作,所述至少一个季节感知操作访问识别出与针对所述至少一个性能度量的所述季节模式类相关联的所述一个或多个时间区段的数据。
2.如权利要求1所述的计算机实现的方法,其中所述季节模式类是以下各项中的一个:用于在经平滑的信号中重现的季节性高点的第一类、用于在噪声信号中重现的稀疏季节性高点的第二类、用于在经平滑的信号中重现的季节性低点的第三类、或用于在噪声信号中重现的稀疏季节性低点的第四类,其中季节性高点和稀疏季节性高点表示对应信号中具有高于指定阈值的度量的实例,而季节性低点和稀疏季节性低点表示对应信号中具有低于指定阈值的度量的实例。
3.如权利要求1所述的计算机实现的方法,其中来自所述季节的所述多个实例的第一实例集合与第一季节模式类相关联;所述计算机实现的方法还包括:
使用一个或多个计算设备将来自所述季节的所述多个实例的第三实例集合与第二季节模式类相关联;
其中表示在经平滑的信号中重现的模式的第一季节模式类不同于表示在噪声信号中重现的模式的第二季节模式类。
4.如权利要求1所述的计算机实现的方法,其中由一个或多个计算设备基于所述多个实例中的第一实例集合和第二实例集合生成识别与所述季节模式类相关联的一个或多个时间区段的总结包括:
识别跨越与第一实例集合中的相应实例对应的一个或多个子时段的一个或多个时间分段的第一集合;
将所述一个或多个分段的第一集合中的至少一个分段扩展为包括与第二实例集合中的至少一个实例对应的至少一个子时段。
5.如权利要求4所述的计算机实现的方法,还包括:
基于来自所述一个或多个分段的第一集合的至少两个分段,确定跨越所述季节内的多个子时段的时段间模式;
其中所述总结识别跨越所述季节内的多个子时段的所述时段间模式。
6.如权利要求1所述的计算机实现的方法,其中使用一个或多个计算设备将来自所述季节的所述多个实例的第一实例集合与季节模式类相关联包括使用一个或多个分类函数的集合来确定将所述多个实例中的哪些实例分类为季节性高点以及将实例中的哪些实例分类为季节性低点,并且其中具有高于指定阈值的度量的实例被分类为季节性高点,而具有低于指定阈值的度量的实例被分类为季节性低点。
7.如权利要求6所述的计算机实现的方法,其中使用所述一个或多个分类函数的集合确定将所述多个实例中的哪些实例分类为季节性高点以及将实例中的哪些实例分类为季节性低点包括:
使用多个不同的分类函数多次对所述多个实例中的实例进行分类;
基于所述分类函数中的多数如何对所述实例进行分类,将所述实例与季节模式类相关联。
8.如权利要求1所述的计算机实现的方法,其中使用一个或多个计算设备将来自所述季节的所述多个实例的第一实例集合与季节模式类相关联包括:
为所述季节模式类生成识别来自所述多个实例的第一实例集合的位向量;
其中所述位向量中的相应位与所述多个实例中的相应实例对应;
其中用于相应位的位值指示所述相应实例是否与所述季节模式类相关联。
9.如权利要求1所述的计算机实现的方法,还包括由一个或多个计算设备显示识别与所述季节模式类相关联的一个或多个时间区段的总结。
10.如权利要求1所述的计算机实现的方法,其中所述多个实例中的每一个实例与周度季节内的一小时子时段对应。
11.存储指令的一个或多个非瞬态计算机可读介质,其中所述指令使得如权利要求1-10中任一项所述的方法被执行。
12.一种包括一个或多个硬件处理器和存储指令的一个或多个非瞬态计算机可读介质的系统,所述指令在由所述一个或多个硬件处理器执行时使得如权利要求1-10中任一项所述的方法被执行。
13.一种包括用于执行如权利要求1-10中任一项所述的方法的构件的装置。
CN201780003022.5A 2016-02-29 2017-02-27 用于检测和表征季节的系统 Active CN107949840B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/057,065 US10331802B2 (en) 2016-02-29 2016-02-29 System for detecting and characterizing seasons
US15/057,065 2016-02-29
PCT/US2017/019613 WO2017151475A1 (en) 2016-02-29 2017-02-27 System for detecting and characterizing seasons

Publications (2)

Publication Number Publication Date
CN107949840A CN107949840A (zh) 2018-04-20
CN107949840B true CN107949840B (zh) 2023-06-30

Family

ID=58358830

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780003022.5A Active CN107949840B (zh) 2016-02-29 2017-02-27 用于检测和表征季节的系统

Country Status (4)

Country Link
US (2) US10331802B2 (zh)
EP (1) EP3423954A1 (zh)
CN (1) CN107949840B (zh)
WO (1) WO2017151475A1 (zh)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015094315A1 (en) * 2013-12-20 2015-06-25 Hewlett-Packard Development Company, L.P. Discarding data points in a time series
US11113852B2 (en) 2016-02-29 2021-09-07 Oracle International Corporation Systems and methods for trending patterns within time-series data
US10885461B2 (en) 2016-02-29 2021-01-05 Oracle International Corporation Unsupervised method for classifying seasonal patterns
US10331802B2 (en) 2016-02-29 2019-06-25 Oracle International Corporation System for detecting and characterizing seasons
US11263566B2 (en) 2016-06-20 2022-03-01 Oracle International Corporation Seasonality validation and determination of patterns
US11023577B2 (en) * 2016-08-04 2021-06-01 Adobe Inc. Anomaly detection for time series data having arbitrary seasonality
US11082439B2 (en) 2016-08-04 2021-08-03 Oracle International Corporation Unsupervised method for baselining and anomaly detection in time-series data for enterprise systems
EP3559808A1 (en) * 2016-12-21 2019-10-30 Telefonaktiebolaget LM Ericsson (PUBL) Allocation of resources for a plurality of hosts
US20190197413A1 (en) * 2017-12-27 2019-06-27 Elasticsearch B.V. Forecasting for Resource Allocation
US11188917B2 (en) * 2018-03-29 2021-11-30 Paypal, Inc. Systems and methods for compressing behavior data using semi-parametric or non-parametric models
CN108985380B (zh) * 2018-07-25 2021-08-03 西南交通大学 一种基于聚类集成的转辙机故障识别方法
US11361105B2 (en) * 2018-08-27 2022-06-14 Koninklijke Philips N.V. Time blocking noising for de-identification
US11138090B2 (en) * 2018-10-23 2021-10-05 Oracle International Corporation Systems and methods for forecasting time series with variable seasonality
US12001926B2 (en) * 2018-10-23 2024-06-04 Oracle International Corporation Systems and methods for detecting long term seasons
CN109558905A (zh) * 2018-11-23 2019-04-02 北京信息科技大学 一种基于K-means的能耗感知的数据分类方法
US11537940B2 (en) 2019-05-13 2022-12-27 Oracle International Corporation Systems and methods for unsupervised anomaly detection using non-parametric tolerance intervals over a sliding window of t-digests
US11256719B1 (en) * 2019-06-27 2022-02-22 Amazon Technologies, Inc. Ingestion partition auto-scaling in a time-series database
WO2021001815A1 (en) * 2019-06-30 2021-01-07 Saferide Technologies Ltd. Sub-field identification system and method
CN115114307A (zh) * 2019-07-03 2022-09-27 深圳市速腾聚创科技有限公司 一种多传感器状态估计方法、装置及终端设备
US11887015B2 (en) * 2019-09-13 2024-01-30 Oracle International Corporation Automatically-generated labels for time series data and numerical lists to use in analytic and machine learning systems
JP7058254B2 (ja) * 2019-10-11 2022-04-21 京セラ株式会社 情報処理装置、情報処理方法、及びプログラム
US11948051B2 (en) * 2020-03-23 2024-04-02 Oracle International Corporation System and method for ensuring that the results of machine learning models can be audited
US20210342290A1 (en) * 2020-04-30 2021-11-04 International Business Machines Corporation Technique selection for file system utilization prediction
CN111680398B (zh) * 2020-05-06 2023-06-27 北京航空航天大学 一种基于Holt-Winters模型的单机性能退化预测方法
US20210406732A1 (en) * 2020-06-25 2021-12-30 Unisys Corporation Method for building machine learning models for artificial intelligence based information technology operations
US11768915B1 (en) 2020-08-03 2023-09-26 Amdocs Development Limited System, method, and computer program for anomaly detection in time-series data with mixed seasonality
US20220164744A1 (en) * 2020-11-20 2022-05-26 International Business Machines Corporation Demand forecasting of service requests volume
US20230123573A1 (en) * 2021-10-18 2023-04-20 Oracle International Corporation Automatic detection of seasonal pattern instances and corresponding parameters in multi-seasonal time series
CN114239743B (zh) * 2021-12-22 2023-12-15 电子科技大学 一种基于稀疏时间序列数据的天气事件发生时间预测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1097829A (zh) * 1993-06-17 1995-01-25 东芝株式会社 配水流量预测装置
CN101482944A (zh) * 2000-11-09 2009-07-15 Spss公司 构建时间序列模型的系统与方法
CN103984938A (zh) * 2014-05-30 2014-08-13 中国科学院遥感与数字地球研究所 一种遥感时间序列异常检测方法
CN105144112A (zh) * 2013-04-11 2015-12-09 甲骨文国际公司 Java堆使用的季节趋势、预报、异常检测和端点预测

Family Cites Families (174)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6104717A (en) 1995-11-03 2000-08-15 Cisco Technology, Inc. System and method for providing backup machines for implementing multiple IP addresses on multiple ports
US6438592B1 (en) 1998-02-25 2002-08-20 Michael G. Killian Systems for monitoring and improving performance on the world wide web
US6597777B1 (en) 1999-06-29 2003-07-22 Lucent Technologies Inc. Method and apparatus for detecting service anomalies in transaction-oriented networks
AU2001240144A1 (en) 2000-03-27 2001-10-08 Ramot University Authority For Applied Research And Industrial Development Ltd. Method and system for clustering data
US6996599B1 (en) 2000-06-21 2006-02-07 Microsoft Corporation System and method providing multi-tier applications architecture
US20020092004A1 (en) 2000-07-26 2002-07-11 Lee John Michael Methods and systems for automatically generating software applications
US20020019860A1 (en) 2000-08-02 2002-02-14 Lee Gene F. Method and apparatus for distributed administration of thin client architecture
US6609083B2 (en) 2001-06-01 2003-08-19 Hewlett-Packard Development Company, L.P. Adaptive performance data measurement and collections
US7454751B2 (en) 2001-06-07 2008-11-18 Intel Corporation Fault-tolerant system and methods with trusted message acknowledgement
WO2003005279A1 (en) 2001-07-03 2003-01-16 Altaworks Corporation System and methods for monitoring performance metrics
US20030149603A1 (en) * 2002-01-18 2003-08-07 Bruce Ferguson System and method for operating a non-linear model with missing data for use in electronic commerce
US7634423B2 (en) 2002-03-29 2009-12-15 Sas Institute Inc. Computer-implemented system and method for web activity assessment
US20050119982A1 (en) 2002-05-10 2005-06-02 Masato Ito Information processing apparatus and method
US8635328B2 (en) 2002-10-31 2014-01-21 International Business Machines Corporation Determining time varying thresholds for monitored metrics
US8572249B2 (en) 2003-12-10 2013-10-29 Aventail Llc Network appliance for balancing load and platform services
US6996502B2 (en) 2004-01-20 2006-02-07 International Business Machines Corporation Remote enterprise management of high availability systems
JP3922375B2 (ja) 2004-01-30 2007-05-30 インターナショナル・ビジネス・マシーンズ・コーポレーション 異常検出システム及びその方法
US7343375B1 (en) 2004-03-01 2008-03-11 The Directv Group, Inc. Collection and correlation over time of private viewing usage data
US7672814B1 (en) 2004-03-03 2010-03-02 Emc Corporation System and method for baseline threshold monitoring
US7774485B2 (en) 2004-05-21 2010-08-10 Bea Systems, Inc. Dynamic service composition and orchestration
US7450498B2 (en) 2004-10-27 2008-11-11 Morgan Stanley Fault tolerant network architecture
US7519564B2 (en) 2004-11-16 2009-04-14 Microsoft Corporation Building and using predictive models of current and future surprises
US7526461B2 (en) 2004-11-17 2009-04-28 Gm Global Technology Operations, Inc. System and method for temporal data mining
US20060161485A1 (en) * 2005-01-18 2006-07-20 Meldahl Robert A Financial analysis tree software engine
US7739143B1 (en) 2005-03-24 2010-06-15 Amazon Technologies, Inc. Robust forecasting techniques with reduced sensitivity to anomalous data
US7739284B2 (en) 2005-04-20 2010-06-15 International Business Machines Corporation Method and apparatus for processing data streams
US7716022B1 (en) 2005-05-09 2010-05-11 Sas Institute Inc. Computer-implemented systems and methods for processing time series data
US7676539B2 (en) 2005-06-09 2010-03-09 International Business Machines Corporation Methods, apparatus and computer programs for automated problem solving in a distributed, collaborative environment
US20060287848A1 (en) * 2005-06-20 2006-12-21 Microsoft Corporation Language classification with random feature clustering
US8463899B2 (en) 2005-07-29 2013-06-11 Bmc Software, Inc. System, method and computer program product for optimized root cause analysis
US8335720B2 (en) * 2005-08-10 2012-12-18 American Express Travel Related Services Company, Inc. System, method, and computer program product for increasing inventory turnover using targeted consumer offers
US8185423B2 (en) 2005-12-22 2012-05-22 Canon Kabushiki Kaisha Just-in time workflow
US9037698B1 (en) 2006-03-14 2015-05-19 Amazon Technologies, Inc. Method and system for collecting and analyzing time-series data
US7987106B1 (en) 2006-06-05 2011-07-26 Turgut Aykin System and methods for forecasting time series with multiple seasonal patterns
US7788127B1 (en) 2006-06-23 2010-08-31 Quest Software, Inc. Forecast model quality index for computer storage capacity planning
US7529991B2 (en) 2007-01-30 2009-05-05 International Business Machines Corporation Scoring method for correlation anomalies
US20080221974A1 (en) 2007-02-22 2008-09-11 Alexander Gilgur Lazy Evaluation of Bulk Forecasts
US8046086B2 (en) 2007-05-15 2011-10-25 Fisher-Rosemount Systems, Inc. Methods and systems for batch processing and execution in a process system
US8200454B2 (en) 2007-07-09 2012-06-12 International Business Machines Corporation Method, data processing program and computer program product for time series analysis
US7865389B2 (en) * 2007-07-19 2011-01-04 Hewlett-Packard Development Company, L.P. Analyzing time series data that exhibits seasonal effects
US20090030752A1 (en) 2007-07-27 2009-01-29 General Electric Company Fleet anomaly detection method
US20080215576A1 (en) 2008-03-05 2008-09-04 Quantum Intelligence, Inc. Fusion and visualization for multiple anomaly detection systems
US9323837B2 (en) 2008-03-05 2016-04-26 Ying Zhao Multiple domain anomaly detection system and method using fusion rule and visualization
EP2316071A4 (en) 2008-06-19 2011-08-17 Servicemesh Inc CLOUD DATA PROCESSING GATEWAY, CLOUD DATA PROCESSING HYPERVISOR, AND METHOD FOR IMPLEMENTING THEM
US8472328B2 (en) 2008-07-31 2013-06-25 Riverbed Technology, Inc. Impact scoring and reducing false positives
US8271949B2 (en) 2008-07-31 2012-09-18 International Business Machines Corporation Self-healing factory processes in a software factory
US9245000B2 (en) * 2008-08-05 2016-01-26 Vmware, Inc. Methods for the cyclical pattern determination of time-series data using a clustering approach
US8606379B2 (en) 2008-09-29 2013-12-10 Fisher-Rosemount Systems, Inc. Method of generating a product recipe for execution in batch processing
US20100082697A1 (en) 2008-10-01 2010-04-01 Narain Gupta Data model enrichment and classification using multi-model approach
US8363961B1 (en) 2008-10-14 2013-01-29 Adobe Systems Incorporated Clustering techniques for large, high-dimensionality data sets
US8583649B2 (en) 2008-11-10 2013-11-12 Google Inc. Method and system for clustering data points
US8234236B2 (en) 2009-06-01 2012-07-31 International Business Machines Corporation System and method for efficient allocation of resources in virtualized desktop environments
US9280436B2 (en) 2009-06-17 2016-03-08 Hewlett Packard Enterprise Development Lp Modeling a computing entity
US7992031B2 (en) 2009-07-24 2011-08-02 International Business Machines Corporation Automated disaster recovery planning
US9070096B2 (en) 2009-08-11 2015-06-30 Mckesson Financial Holdings Appliance and pair device for providing a reliable and redundant enterprise management solution
US8229876B2 (en) 2009-09-01 2012-07-24 Oracle International Corporation Expediting K-means cluster analysis data mining using subsample elimination preprocessing
US20110126197A1 (en) 2009-11-25 2011-05-26 Novell, Inc. System and method for controlling cloud and virtualized data centers in an intelligent workload management system
US8776066B2 (en) 2009-11-30 2014-07-08 International Business Machines Corporation Managing task execution on accelerators
US8819701B2 (en) 2009-12-12 2014-08-26 Microsoft Corporation Cloud computing monitoring and management system
US8645769B2 (en) 2010-01-08 2014-02-04 Nec Corporation Operation management apparatus, operation management method, and program storage medium
US8874749B1 (en) 2010-02-03 2014-10-28 Citrix Systems, Inc. Network fragmentation and virtual machine migration in a scalable cloud computing environment
WO2011128922A1 (en) 2010-04-15 2011-10-20 Neptuny S.R.L. Automated upgrading method for capacity of it system resources
US8627426B2 (en) 2010-04-26 2014-01-07 Vmware, Inc. Cloud platform architecture
US8725891B2 (en) 2010-07-01 2014-05-13 Red Hat, Inc. Aggregation across cloud providers
US8442067B2 (en) * 2010-08-30 2013-05-14 International Business Machines Corporation Using gathered system activity statistics to determine when to schedule a procedure
US20130226320A1 (en) * 2010-09-02 2013-08-29 Pepperdash Technology Corporation Policy-driven automated facilities management system
US8677004B2 (en) 2010-09-10 2014-03-18 International Business Machines Corporation Migration of logical partitions between two devices
US9135586B2 (en) 2010-10-28 2015-09-15 Sap Se System for dynamic parallel looping of repetitive tasks during execution of process-flows in process runtime
US8621058B2 (en) 2010-10-28 2013-12-31 Hewlett-Packard Development Company, L.P. Providing cloud-based computing services
CN103339613B (zh) 2011-01-24 2016-01-06 日本电气株式会社 操作管理装置、操作管理方法和程序
US8862933B2 (en) 2011-02-09 2014-10-14 Cliqr Technologies, Inc. Apparatus, systems and methods for deployment and management of distributed computing systems and applications
US20120240072A1 (en) 2011-03-18 2012-09-20 Serious Materials, Inc. Intensity transform systems and methods
US9195563B2 (en) 2011-03-30 2015-11-24 Bmc Software, Inc. Use of metrics selected based on lag correlation to provide leading indicators of service performance degradation
US9218232B2 (en) 2011-04-13 2015-12-22 Bar-Ilan University Anomaly detection methods, devices and systems
US20120265881A1 (en) * 2011-04-14 2012-10-18 Yuan Chen Provisioning data center resources
US20120296696A1 (en) * 2011-05-17 2012-11-22 International Business Machines Corporation Sustaining engineering and maintenance using sem patterns and the seminal dashboard
US9075659B2 (en) 2011-06-16 2015-07-07 Kodak Alaris Inc. Task allocation in a computer network
US8666916B2 (en) * 2011-07-07 2014-03-04 Yahoo! Inc. Method for summarizing event-related texts to answer search queries
US9047559B2 (en) 2011-07-22 2015-06-02 Sas Institute Inc. Computer-implemented systems and methods for testing large scale automatic forecast combinations
WO2013016584A1 (en) 2011-07-26 2013-01-31 Nebula, Inc. Systems and methods for implementing cloud computing
JP5710417B2 (ja) 2011-08-05 2015-04-30 株式会社東芝 無線受信装置
EP2759938B1 (en) 2011-09-19 2019-09-11 Nec Corporation Operations management device, operations management method, and program
US9292408B2 (en) 2011-09-21 2016-03-22 Hewlett Packard Enterprise Development Lp Automated detection of a system anomaly
US9002774B2 (en) 2011-09-23 2015-04-07 Aol Advertising Inc. Systems and methods for generating a forecasting model and forecasting future values
US9355357B2 (en) 2011-10-21 2016-05-31 Hewlett Packard Enterprise Development Lp Computing predicted data according to weighted peak preservation and time distance biasing
US9141914B2 (en) 2011-10-31 2015-09-22 Hewlett-Packard Development Company, L.P. System and method for ranking anomalies
US10554077B2 (en) 2011-12-13 2020-02-04 Schneider Electric USA, Inc. Automated monitoring for changes in energy consumption patterns
JP5831558B2 (ja) 2012-01-23 2015-12-09 日本電気株式会社 運用管理装置、運用管理方法、及びプログラム
WO2013136739A1 (ja) 2012-03-14 2013-09-19 日本電気株式会社 運用管理装置、運用管理方法、及び、プログラム
US8880525B2 (en) 2012-04-02 2014-11-04 Xerox Corporation Full and semi-batch clustering
US20130282891A1 (en) * 2012-04-20 2013-10-24 Kevin E. Davis Resource Usage Pattern Matching
US8949677B1 (en) 2012-05-23 2015-02-03 Amazon Technologies, Inc. Detecting anomalies in time series data
US20130326202A1 (en) 2012-05-30 2013-12-05 Roi Rosenthal Load test capacity planning
JP6049314B2 (ja) 2012-06-11 2016-12-21 キヤノン株式会社 放射線撮像装置及び画像処理方法
CN104428808A (zh) 2012-07-03 2015-03-18 惠普发展公司,有限责任合伙企业 管理混合云服务
WO2014007813A1 (en) 2012-07-03 2014-01-09 Hewlett-Packard Development Company, L.P. Managing a multitenant cloud service
WO2014007810A1 (en) 2012-07-03 2014-01-09 Hewlett-Packard Development Company, L.P. Managing a cloud service
US9569804B2 (en) 2012-08-27 2017-02-14 Gridium, Inc. Systems and methods for energy consumption and energy demand management
US11185241B2 (en) 2014-03-05 2021-11-30 Whoop, Inc. Continuous heart rate monitoring and interpretation
US10586189B2 (en) 2012-09-28 2020-03-10 Quest Software Inc. Data metric resolution ranking system and method
US9495220B2 (en) 2012-09-28 2016-11-15 Sap Se Self-management of request-centric systems
US9712402B2 (en) 2012-10-10 2017-07-18 Alcatel Lucent Method and apparatus for automated deployment of geographically distributed applications within a cloud
WO2014075108A2 (en) 2012-11-09 2014-05-15 The Trustees Of Columbia University In The City Of New York Forecasting system using machine learning and ensemble methods
US9147167B2 (en) 2012-11-19 2015-09-29 Oracle International Corporation Similarity analysis with tri-point data arbitration
US9146777B2 (en) 2013-01-25 2015-09-29 Swarm Technology Llc Parallel processing with solidarity cells by proactively retrieving from a task pool a matching task for the solidarity cell to process
US9710493B2 (en) 2013-03-08 2017-07-18 Microsoft Technology Licensing, Llc Approximate K-means via cluster closures
US9514213B2 (en) 2013-03-15 2016-12-06 Oracle International Corporation Per-attribute data clustering using tri-point data arbitration
US9507718B2 (en) 2013-04-16 2016-11-29 Facebook, Inc. Intelligent caching
US9692775B2 (en) 2013-04-29 2017-06-27 Telefonaktiebolaget Lm Ericsson (Publ) Method and system to dynamically detect traffic anomalies in a network
US10163034B2 (en) 2013-06-19 2018-12-25 Oracle International Corporation Tripoint arbitration for entity classification
WO2014208002A1 (ja) 2013-06-25 2014-12-31 日本電気株式会社 システム分析装置、システム分析方法、及びシステム分析プログラム
WO2015009310A1 (en) 2013-07-19 2015-01-22 Ge Intelligent Platforms, Inc. Model change boundary on time series data
US10324942B2 (en) 2013-07-26 2019-06-18 Snap Inc. Segment data visibility and management in a distributed database of time stamped records
US9558056B2 (en) 2013-07-28 2017-01-31 OpsClarity Inc. Organizing network performance metrics into historical anomaly dependency data
US10229104B2 (en) * 2013-08-01 2019-03-12 Sonicwall Inc. Efficient DFA generation for non-matching characters and character classes in regular expressions
US9280372B2 (en) 2013-08-12 2016-03-08 Amazon Technologies, Inc. Request processing techniques
US9319911B2 (en) 2013-08-30 2016-04-19 International Business Machines Corporation Adaptive monitoring for cellular networks
US10503732B2 (en) 2013-10-31 2019-12-10 Micro Focus Llc Storing time series data for a search query
US20160299961A1 (en) 2014-02-04 2016-10-13 David Allen Olsen System and method for grouping segments of data sequences into clusters
US9323574B2 (en) 2014-02-21 2016-04-26 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Processor power optimization with response time assurance
US9740402B2 (en) 2014-03-28 2017-08-22 Vmware, Inc. Migrating workloads across host computing systems based on remote cache content usage characteristics
CN105095614A (zh) 2014-04-18 2015-11-25 国际商业机器公司 更新预测模型的方法和装置
US9374389B2 (en) 2014-04-25 2016-06-21 Intuit Inc. Method and system for ensuring an application conforms with security and regulatory controls prior to deployment
US9727533B2 (en) 2014-05-20 2017-08-08 Facebook, Inc. Detecting anomalies in a time series
US9779361B2 (en) 2014-06-05 2017-10-03 Mitsubishi Electric Research Laboratories, Inc. Method for learning exemplars for anomaly detection
US20150371144A1 (en) * 2014-06-24 2015-12-24 Garett Engle Cyclic predictions machine
US9658910B2 (en) 2014-07-29 2017-05-23 Oracle International Corporation Systems and methods for spatially displaced correlation for detecting value ranges of transient correlation in machine data of enterprise systems
US10069900B2 (en) 2014-08-05 2018-09-04 Oracle International Corporation Systems and methods for adaptive thresholding using maximum concentration intervals
US20160092516A1 (en) 2014-09-26 2016-03-31 Oracle International Corporation Metric time series correlation by outlier removal based on maximum concentration interval
US11087263B2 (en) 2014-10-09 2021-08-10 Splunk Inc. System monitoring with key performance indicators from shared base search of machine data
US9811394B1 (en) 2014-10-12 2017-11-07 Workato, Inc. Application programming interface recipe cloning
US9977699B2 (en) 2014-11-17 2018-05-22 Mediatek, Inc. Energy efficient multi-cluster system and its operations
WO2016103650A1 (ja) 2014-12-22 2016-06-30 日本電気株式会社 運用管理装置、運用管理方法、及び、運用管理プログラムが記録された記録媒体
US9529630B1 (en) 2015-01-21 2016-12-27 Pivotal Software, Inc. Cloud computing platform architecture
US10747188B2 (en) 2015-03-16 2020-08-18 Nec Corporation Information processing apparatus, information processing method, and, recording medium
US20160283533A1 (en) 2015-03-26 2016-09-29 Oracle International Corporation Multi-distance clustering
JP6384590B2 (ja) 2015-03-26 2018-09-05 日本電気株式会社 学習モデル生成システム、方法およびプログラム
US9794229B2 (en) 2015-04-03 2017-10-17 Infoblox Inc. Behavior analysis based DNS tunneling detection and classification framework for network security
JP6313730B2 (ja) 2015-04-10 2018-04-18 タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited 異常検出システムおよび方法
US10410155B2 (en) 2015-05-01 2019-09-10 Microsoft Technology Licensing, Llc Automatic demand-driven resource scaling for relational database-as-a-service
US10453007B2 (en) 2015-05-18 2019-10-22 International Business Machines Corporation Automatic time series exploration for business intelligence analytics
US20160357674A1 (en) 2015-06-07 2016-12-08 Cloud Physics, Inc. Unified Online Cache Monitoring and Optimization
US10997176B2 (en) 2015-06-25 2021-05-04 International Business Machines Corporation Massive time series correlation similarity computation
US9323599B1 (en) 2015-07-31 2016-04-26 AppDynamics, Inc. Time series metric data modeling and prediction
US11010196B2 (en) 2015-08-31 2021-05-18 Vmware, Inc. Capacity analysis using closed-system modules
US9961571B2 (en) 2015-09-24 2018-05-01 Futurewei Technologies, Inc. System and method for a multi view learning approach to anomaly detection and root cause analysis
US20200034745A1 (en) 2015-10-19 2020-01-30 Nutanix, Inc. Time series analysis and forecasting using a distributed tournament selection process
CN105426411B (zh) 2015-10-31 2019-05-28 南京南瑞继保电气有限公司 基于访问趋势预测的时间序列数据库缓存管理方法
US9471778B1 (en) 2015-11-30 2016-10-18 International Business Machines Corporation Automatic baselining of anomalous event activity in time series data
US10885461B2 (en) 2016-02-29 2021-01-05 Oracle International Corporation Unsupervised method for classifying seasonal patterns
US11113852B2 (en) 2016-02-29 2021-09-07 Oracle International Corporation Systems and methods for trending patterns within time-series data
US10699211B2 (en) 2016-02-29 2020-06-30 Oracle International Corporation Supervised method for classifying seasonal patterns
US10331802B2 (en) 2016-02-29 2019-06-25 Oracle International Corporation System for detecting and characterizing seasons
US10754573B2 (en) 2016-03-11 2020-08-25 EMC IP Holding Company LLC Optimized auto-tiering, wherein subset of data movements are selected, utilizing workload skew point, from a list that ranks data movements based on criteria other than I/O workload
CN107203891A (zh) 2016-03-17 2017-09-26 阿里巴巴集团控股有限公司 一种自动多阀值特征过滤方法及装置
US10073906B2 (en) 2016-04-27 2018-09-11 Oracle International Corporation Scalable tri-point arbitration and clustering
US10198339B2 (en) 2016-05-16 2019-02-05 Oracle International Corporation Correlation-based analytic for time-series data
US11263566B2 (en) 2016-06-20 2022-03-01 Oracle International Corporation Seasonality validation and determination of patterns
US10334334B2 (en) 2016-07-22 2019-06-25 Intel Corporation Storage sled and techniques for a data center
US10635563B2 (en) 2016-08-04 2020-04-28 Oracle International Corporation Unsupervised method for baselining and anomaly detection in time-series data for enterprise systems
US20180053207A1 (en) 2016-08-16 2018-02-22 Adobe Systems Incorporated Providing personalized alerts and anomaly summarization
US20180081629A1 (en) 2016-09-16 2018-03-22 Sevone, Inc. Method and apparatus for providing ordered sets of arbitrary percentile estimates for varying timespans
US11546080B2 (en) 2016-10-07 2023-01-03 Cable Television Laboratories, Inc. Systems and methods for DOCSIS profile management
US10375098B2 (en) 2017-01-31 2019-08-06 Splunk Inc. Anomaly detection based on relationships between multiple time series
US10915830B2 (en) 2017-02-24 2021-02-09 Oracle International Corporation Multiscale method for predictive alerting
US10452998B2 (en) 2017-03-19 2019-10-22 International Business Machines Corporation Cognitive blockchain automation and management
US10872000B2 (en) 2017-05-05 2020-12-22 Workato, Inc. Late connection binding for bots
US10917419B2 (en) 2017-05-05 2021-02-09 Servicenow, Inc. Systems and methods for anomaly detection
US20180330433A1 (en) 2017-05-12 2018-11-15 Connect Financial LLC Attributing meanings to data concepts used in producing outputs
US10212024B2 (en) 2017-06-02 2019-02-19 Sas Institute Inc. Techniques for multi-stage analysis of measurement data with event stream processing
US10817803B2 (en) 2017-06-02 2020-10-27 Oracle International Corporation Data driven methods and systems for what if analysis
US10621005B2 (en) 2017-08-31 2020-04-14 Oracle International Corporation Systems and methods for providing zero down time and scalability in orchestration cloud services
CN109359763A (zh) 2018-09-03 2019-02-19 华南理工大学 基于季节差异的乳制品冷链运输路径规划方法
US12001926B2 (en) 2018-10-23 2024-06-04 Oracle International Corporation Systems and methods for detecting long term seasons

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1097829A (zh) * 1993-06-17 1995-01-25 东芝株式会社 配水流量预测装置
CN101482944A (zh) * 2000-11-09 2009-07-15 Spss公司 构建时间序列模型的系统与方法
CN105144112A (zh) * 2013-04-11 2015-12-09 甲骨文国际公司 Java堆使用的季节趋势、预报、异常检测和端点预测
CN103984938A (zh) * 2014-05-30 2014-08-13 中国科学院遥感与数字地球研究所 一种遥感时间序列异常检测方法

Also Published As

Publication number Publication date
WO2017151475A1 (en) 2017-09-08
EP3423954A1 (en) 2019-01-09
US11232133B2 (en) 2022-01-25
US20170249376A1 (en) 2017-08-31
US20190228022A1 (en) 2019-07-25
US10331802B2 (en) 2019-06-25
CN107949840A (zh) 2018-04-20

Similar Documents

Publication Publication Date Title
CN107949840B (zh) 用于检测和表征季节的系统
CN108292296B (zh) 用于利用复发性模式创建时间序列数据的时段分布图的方法
US11836162B2 (en) Unsupervised method for classifying seasonal patterns
US10699211B2 (en) Supervised method for classifying seasonal patterns
US11481665B2 (en) Systems and methods for determining machine learning training approaches based on identified impacts of one or more types of concept drift
US11263566B2 (en) Seasonality validation and determination of patterns
CN110362612B (zh) 由电子设备执行的异常数据检测方法、装置和电子设备
US10467533B2 (en) System and method for predicting response time of an enterprise system
US10171335B2 (en) Analysis of site speed performance anomalies caused by server-side issues
US12001926B2 (en) Systems and methods for detecting long term seasons
US11138090B2 (en) Systems and methods for forecasting time series with variable seasonality
US20180039898A1 (en) Anomaly detection for time series data having arbitrary seasonality
US8965830B2 (en) Systems and methods for self-adaptive episode mining under the threshold using delay estimation and temporal division
US20160255109A1 (en) Detection method and apparatus
US10504026B2 (en) Statistical detection of site speed performance anomalies
Bhushan et al. Incremental principal component analysis based outlier detection methods for spatiotemporal data streams
Salamanis et al. Evaluating the effect of time series segmentation on STARIMA-based traffic prediction model
CN116401604B (zh) 进行冷头状态分类检测和寿命预测的方法
US20170303014A1 (en) System for providing functionality based on sensor data
Song et al. A robust and accurate multivariate time series anomaly detection in fluctuating cloud-edge computing systems
WO2009090944A1 (ja) ルールベース管理システム、ルールベース管理方法およびルールベース管理用プログラム
Saitoh et al. IT resource trend analysis by component decomposition based on non-negative matrix factorization
JP2024504021A (ja) 降雨林における違法伐採のためのセンサ融合を伴う動的音響シグネチャシステム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant