CN115668170A - 时间序列预测 - Google Patents

时间序列预测 Download PDF

Info

Publication number
CN115668170A
CN115668170A CN202180036340.8A CN202180036340A CN115668170A CN 115668170 A CN115668170 A CN 115668170A CN 202180036340 A CN202180036340 A CN 202180036340A CN 115668170 A CN115668170 A CN 115668170A
Authority
CN
China
Prior art keywords
time series
data
query
prediction
series prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180036340.8A
Other languages
English (en)
Inventor
程曦
丽萨·尹
阿米尔·霍马提
奥马尔·赛义德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN115668170A publication Critical patent/CN115668170A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2477Temporal data queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/221Column-oriented storage; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24568Data stream processing; Continuous queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Linguistics (AREA)
  • Human Resources & Organizations (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种用于时间序列预测的方法,包括接收来自请求数据处理硬件(144)执行多个时间序列预测(22)的用户(12)的时间序列预测查询(20)。每个时间序列预测是基于相应当前数据(152)的未来数据(162)的预测。同时,对于由所述时间序列预测查询请求的所述多个时间序列预测的每个时间序列预测,所述方法包括训练用于相应所述时间序列预测的多个模型(212)。所述方法还包括确定所述多个模型中哪一个模型最佳拟合相应所述时间序列预测,并基于所述确定的最佳拟合模型和相应所述当前数据预测未来数据。所述方法还包括向所述用户返回由所述定时器序列预测查询所请求的对所述多个时间序列预测中的每个时间序列预测的预测的未来数据。

Description

时间序列预测
技术领域
本公开涉及时间序列预测。
背景技术
基于历史数据预测未来趋势可以为许多不同的应用提供有用的信息。随着大量数据变得容易获得,对未来趋势的准确预测的需求已经增长,用户寻求利用准确的预测来获得竞争优势。当预测未来数据趋势时,几个根本组件可能影响数据的变化。这些变化会使时间组分非常难于精确预测。许多机器学习模型旨在准确地预测包含时间组分的未来趋势。
发明内容
本公开的一个方面提供了一种用于时间序列预测的方法。该方法包括在数据处理硬件处接收来自用户的时间序列预测查询。时间序列预测查询请求数据处理硬件进行多个时间序列预测。每个时间序列预测是基于相应当前数据的未来数据的预测。对于时间序列预测查询所请求的多个时间序列预测的每个时间序列预测,该方法包括由数据处理硬件同时训练用于相应时间序列预测的多个模型。该方法还包括同时确定多个模型中哪一个模型最佳拟合相应时间序列预测,并基于所确定的最佳拟合模型和相应当前数据同时预测未来数据。该方法还包括由数据处理硬件向用户返回时间序列预测查询所请求的多个时间序列预测中的每个时间序列预测的预测的未来数据。
本公开的实现可以包括更多的以下可选的特征。在一些实施例中,时间序列预测请求仅包括单个查询。在一些实施方式中,单个查询可以包括结构化查询语言(SQL)查询。附加地或替代地,单个查询还包括对表的三列的引用。在实施例中,表的三列包括具有时间戳数据的第一列,包括当前数据的第二列,以及包括时间序列预测标识数据的第三列。
在一些实施例中,用于每个相应时间序列预测的多个模型中的每个模型包括自动回归综合移动平均模型。训练多个模型可以包括执行超参数调整。在一些实例中,预测未来数据包括建模季节性效应。任选地,预测未来数据包括建模假日效应。在另外的例子中,预测未来数据包括建模漂移。在一些实施例中,预测未来数据包括执行异常检测。在实施例中,确定多个模型中哪一个模型最佳拟合相应时间序列预测包括确定哪一个模型具有最低的赤池信息量准则(AIC)。
本公开的另一方面提供了一种用于时间序列预测的系统。该系统包括数据处理硬件和与数据处理硬件通信的存储器硬件。存储器硬件存储指令,当指令在数据处理硬件上执行时使数据处理硬件执行操作。操作包括接收来自用户的时间序列预测查询。时间序列预测查询请求数据处理硬件进行多个时间序列预测。每个时间序列预测是基于相应当前数据的未来数据的预测。对于由时间序列预测查询请求的多个时间序列预测的每个时间序列预测,操作包括同时训练用于相应时间序列预测的多个模型。操作还包括同时确定多个模型中的哪一个模型最佳拟合相应时间序列预测,以及基于所确定的最佳拟合模型和相应当前数据同时预测未来数据。该操作还包括向用户返回时间序列预测查询所请求的多个时间序列预测中的每个时间序列预测的预测的未来数据。
本公开的实现可以包括更多的以下可选特征。在一些实施例中,时间序列预测请求仅包括单个查询。在这些实现中,单个查询可以包括结构化查询语言(SQL)查询。附加地或替代地,单个查询还包括对表的三列的引用。在一些实施例中,表的三列包括包括时间戳数据的第一列,包括当前数据的第二列,以及包括时间序列预测标识数据的第三列。
在一些实施例中,用于每个相应时间序列预测的多个模型中的每个模型包括自动回归综合移动平均模型。训练多个模型可以包括执行超参数调整。在一些实例中,预测未来数据包括建模季节性效应。可选地,预测未来数据可以包括建模假日效应。在另外的例子中,预测未来数据包括建模漂移。在一些实施例中,预测未来数据包括执行异常检测。在一些实施例中,确定多个模型中哪一个模型最佳拟合相应时间序列预测包括确定哪一个模型具有最低的赤池信息量准则(AIC)。
本公开的一个或多个实现的细节在附图和以下描述中阐述。从说明书和附图以及从权利要求书中,其它方面,特征和优点将是显而易见的。
附图说明
图1是用于生成时间序列预测的示例系统的示意图。
图2是图1的系统的示例性组件的示意。
图3是包括时间序列标识列的表的示意图。
图4是时间序列和时间序列的相应分解组件的曲线图。
图5是图1的示例性系统的附加示例性组件的示意图。
图6是用于生成时间序列预测的方法的操作的示例布置的流程图。
图7是可用于实现本文所述的系统和方法的示例性计算设备的示意图。
在各个附图中相同的附图标记表示相同的元件。
具体实施方式
时间序列是时间序列中的一系列数据点(通常以规则的间隔)。对时间序列的分析可以应用于随时间变化的任何变量(例如,工业过程或商业度量)。时间序列预测是基于过去的数据值预测(即外推)未来数据值的实践。因为如此多的预测问题涉及时间组分,所以时间序列预测是感兴趣的活动区域。具体地说,时间序列预测已经成为机器学习的重要领域。然而,由于固有的非平稳性和不确定性,时间序列预测仍然是一个具有挑战性的问题。
对于典型的机器学习挑战,训练模型直到该模型提供令人满意的结果。然后,该模型被用于在一段时间内对新数据进行预测,直到有足够的新数据来保证用附加的新数据重新训练该模型。然而,利用时间序列预测,在甚至接收到单个新数据点时重新训练模型可能是有益的。从实际的观点来看,部署静态模型(与许多机器学习模型一样)对于时间序列预测是无效的。
这里的实现针对能够执行“大规模”时间序列预测的时间序列预测系统。也就是说,系统允许用户通过提交单个查询来并行地拟合和预测许多时间序列。系统接收来自用户的时间序列预测请求,该时间序列预测请求请求系统执行多个时间序列预测。对于多个时间序列预测中的每一个,系统同时训练多个模型并确定多个模型中哪一个模型最佳拟合相应时间序列预测。系统基于所确定的最佳拟合模型中的每一个来预测未来数据,并将针对每个所请求的时间序列预测的预测的未来数据返回用户。
现在参考图1,在一些实施例中,实施例时间序列预测系统100包括经由网络112与一个或多个用户设备10通信的远程系统140。远程系统140可以是单个计算机,多个计算机或具有可伸缩/弹性资源142的分布式系统(例如,云环境),可伸缩/弹性资源142包括计算资源144(例如,数据处理硬件)和/或存储资源146(例如,存储器硬件)。数据存储150(即,远程存储设备)可以覆盖在存储资源146上,以允许一个或多个客户机(例如,用户设备10)或计算资源144可缩放地使用存储资源146。数据存储器150经配置以在一个或一个以上表158、表158a-n(即,云数据库)内存储多个数据块152、数据块152a-n,表158、表158a-n各自包括多个行和列300、列300a-n(图3)。数据存储器150可以在任何时间点存储任何数量的表158。
远程系统140被配置为经由例如网络112从与相应用户12相关联的用户设备10接收时间序列预测查询20。用户设备10可以对应于任何计算设备,诸如台式工作站,便携式电脑工作站或移动设备(即,智能电话)。用户设备10包括计算资源18(例如,数据处理硬件)和/或存储资源16(例如,存储器硬件)。用户12可以使用结构化查询语言(SQL)接口14来构造查询20。每个时间序列预测查询20请求一个或多个时间序列预测22、时间序列预测22a-n。具体地,查询20所请求的每个时间序列预测22与对远程系统140的请求相关联,以基于当前数据152生成未来数据162的预测。
远程系统140执行时间序列预测器160,用于预测预测的未来数据162并将其返回用户设备10。时间序列预测器160被配置为接收查询20。如下面更详细讨论的,模型训练器210同时为每个预测请求22生成并训练多个预测模型212、训练模型212a-n。如这里所使用的,条件预测请求22和时间序列预测22可以互换地使用。模型训练器210可以在当前数据152(即,数据块152)上训练预测模型212,当前数据152是从存储在数据存储器150上的与所请求的时间序列预测22相关联的一个或多个表158检索的。也就是说,查询20可以包括多个时间序列预测22,每个时间序列预测22请求远程系统140基于位于存储在数据存储150上的一个或多个表158中的当前数据152来预测将来的数据。或者,查询20可以包括当前数据152。也就是说,当当前数据152通过数据存储器150不可用时,用户12(通过用户设备10)可以提供当前数据152。
模型训练器210可以用不同的参数生成和/或训练每个模型212。例如,模型训练器210可以生成并训练多个自回归综合移动平均模型(ARIMA)模型,其具有不同阶数的自回归模型(即,时间延迟的数目,并且通常表示为参数p),不同程度的差异(即,数据已经过去的值减去的次数,并且通常表示为参数d)。以及移动平均模型的阶数(即移动平均窗口的大小,通常表示为参数q)。使用不同参数(例如,参数p、d和q)的组合,模型训练器210为每个组合生成相应预测模型212。使用相同的数据152训练每个模型212。一个或多个参数可以由用户12配置或部分配置。
当生成和训练多个模型212时,模型训练器210可以执行超参数调整(也称为超参数优化)。超参数是控制或调整实际学习过程同时学习其它参数(例如,节点权重)的参数。例如,模型训练器210可以对数据频率和非季节性顺序参数执行超参数调整。如下面更详细讨论的,模型训练器210可以生成和训练能够建模时间序列的许多不同方面的预测模型212。例如,预测模型212可以考虑季节性效应、假日效应、建模漂移和异常。
模型选择器220接收每个经过训练的模型212,以确定哪个模型212最佳拟合数据152。通常,在训练数据集中训练机器学习模型,然后在测试数据集中评估。然而,因为时间序列数据经常具有非常有限的数据集,所以时间序列预测器160可以使用相同的数据来训练模型212和评估模型212(即,预测未来数据162)。因此,在一些实施例中,模型选择器220确定哪个模型212导致最低的赤池信息量准则(AIC)。AIC是样本外预测误差的估计器,因此可以表示在相同数据152上训练的相应模型212相对于每个其它模型212的相对质量。模型选择器220选择最佳拟合模型212S(例如,具有最低AIC的模型212),并将模型212S发送到预测器230。这允许模型选择器220分析性地确定最佳拟合模型212,而不依赖于经验方法(例如,单独的测试数据集)。
预测器230使用所选择的模型212S,基于当前数据152预测将来的数据162。预测器230将预测的未来数据162返回到用户12(经由用户设备10)。用户设备10将预测数据162显示为例如图形。查询20所请求的每个时间序列可以显示在具有用户可配置过滤器的同一图上,该过滤器用于控制显示哪个时间序列的哪些部分。例如,查询20包括对十个时间序列预测22的请求。在接收到将来的数据162之后,用户设备10可以同时在图形上显示所有十个时间序列预测。用户可以根据需要选择哪些时间序列是可视的和数据的放大或缩小。
现在参考图2,在一些实施例中,查询20请求远程系统140执行多个时间序列预测22。在这种情况下,模型训练器210同时训练多个时间序列前台22中的每一个的多个模型212。例如,当查询20包括十个时间序列预测22并且模型训练器210每个时间序列预测22训练四十个模型212时,模型训练器210同时生成并训练四百个(即,40乘以10)模型212。如图2所示,时间序列预测器160可以针对查询20所请求的每个时间序列预测22(即,针对十个预测请求22的模型训练器210的十次复制)来复制模型训练器210。模型选择器220同样从每组模型212中同时(例如,通过复制)确定用于相应预测请求22的最佳拟合模型212S。预测器230还可以基于所选择的模型212S中的每一个同时(例如,经由复制)来预测未来数据162。来自所选模型212S中的每个预测的未来数据162可以被包括在经由用户设备10返回到用户12的查询响应164内。因此,仅具有单个查询20的用户12可以请求多个时间序列预测22,并且时间序列预测器160并行地处理每个时间序列预测22,大大减少了响应查询20所需的时间量。
现在参考图3,在一些实施例中,查询20包括对存储在数据存储150上的表158的三个列300、列300a-c的引用。例如,一列300a包括时间序列标识信息,另一列300b包括时间序列时间戳数据,而第三列300c包括时间序列数据。时间序列时间戳列300b包括时间序列的必要时间组分。时间序列时间戳列300b的每个数据元素310表示与来自时间序列数据列300c的相应时间序列数据元素310相关联的时间点。时间序列预测器160使用时间序列时间戳列300b和时间序列数据列300c来训练预测模型212并预测未来数据162。
在一些实施例中,时间序列时间戳列300b和时间序列数据列300c与时间序列标识(ID)列300a相关联。时间序列ID列300a标识时间序列时间戳列300b和时间序列数据列300c的哪些部分对应于查询20所请求的多个时间序列预测22中的每一个。即,时间序列ID列300a基于查询20所请求的多个时间序列预测22来分界时间序列时间戳列300b和时间序列数据列300c。
在所示的例子中,”ID1”的时间序列ID分界一系列时间戳和数据元素310。与”ID1”的时间序列ID相关联的每个时间戳和数据元素310对应于查询20所请求的时间序列预测22之一。类似地,”ID2”的时间序列ID为第二时间序列数据请求22定界一系列时间戳和数据元素310,而“ID3”的时间序列ID为第三时间序列定界一系列时间戳和数据元素310。以这种方式,时间序列ID列300a标识查询20所请求的各个单独时间序列预测22的边界。因此,用户12可以生成单个查询(例如,使用SQL接口14),该查询提供存储在数据存储150上的表158的三个列300的标识符,这些表对应于时间序列ID列300a,时间序列时间戳列300b和时间序列数据列300c,以标识单个查询20内的多个所请求的时间序列预测22。
尽管图3示出了提供清楚示例的显式标识列300a,但是表中的任何列300可以用作时间序列标识列300a。例如,包括表示多个不同办公室的度量的数据的表158可以使用办公室位置列作为时间序列标识列300a来为每个办公室位置生成多个时间序列预测22。作为另一个例子,包括表示不同国家的天气统计的数据的表158可以使用表示该国家的列作为时间序列标识列300a来为每个国家生成多个时间序列数据预测22。也就是说,用户12可以基于表158中的任何预先存在的列300来生成多个时间序列预测22,而不需要为了划分期望的时间序列而显式地生成列300。
现在参考图4,曲线400示出示例性时间序列410和时间序列410的对应组件412a-c。时间序列410包括关于时间(x轴)的一系列数据点(y轴)。这里,数据表示在大约60和140之间的y轴上,而x轴的范围大约从1995年到2015年。时间序列410被分解为趋势组件412a,季节性组件412b和剩余部分412c。趋势组件412a表示以合理可预测的模式向上或向下移动的数据中的趋势。这里,趋势组件412a还包括对应于循环(例如,超涨超跌循环)的循环变化。季节性组件412b示出了在特定时期(例如,一天,一周,一个月等)上重复的变化。例如,12月的销售量增加代表季节性组件412b的季节性效应。余数组件412c表示看起来随机的剩余波动,其不落入其它组件412的分类下。
现在参考图5,在一些实施例中,端到端时间序列预测器500接收多个输入时间序列502(例如,由存储在数据存储150上的数据152组成)。端到端时间序列预测器500可以包括三个主要阶段:预处理阶段510、训练阶段520和预测阶段530。预处理级510接收输入时间序列502并执行数据频率处理512,NULL输入514(即,确定和/或拒绝输入时间序列502中的任何空值),假日效应建模516和异常检测518。
假日效应在时间序列预测中可能起着重要作用。例如,代表在线零售商的销售的时间序列可能在“黑色星期五”时经历显著的销售浪潮。然而,黑色星期五没有固定的时期,因为它在感恩节之后的当天,这是11月的第四周四。因此,如果不是不可能考虑季节性建模,则该效果是困难的。另外,假日效应可能被错误用于可能导致假日效应的不希望的平滑的异常。假日效应建模模块516考虑这些效果,否则这些效果被季节性建模漏掉或者被异常检测错误平滑。
在预处理之后,训练阶段520开始于使用局部回归(STL)模块522的季节性和趋势分解,该局部回归模块522生成去季节性组件523a和季节性组件523b。STL模块522估计非线性关系并将时间序列分解成多个组件412a-c(图4)。通过克亚特科维奇-菲利普斯-施密特-申(Kwiatkowsi-Phillips-Schmidt-Shin)(KPSS)测试模块524处理去调味的组件523a,并在526并行地生成多个ARIMA模型。季节性组件523b被传递到双指数平滑模块528。在预测阶段530中,由预测模块532a预测来自ARIMA模型的已解调组件523a,而由预测模块532b预测来自双指数平滑模块528的季节性组件523b。来自预测模块532a和预测模块532b的结果被组合以创建预测结果534。预测器500可以经由用户设备10将预测结果534返回到用户12。端到端时间序列预测器500为每个输入时间序列502复制阶段510、阶段520、阶段530,使得同时并行预测每个输入时间序列。
图6是用于执行时间序列预测的方法600的操作的示例性布置的流程图。在操作602,方法600包括在数据处理硬件144从用户12接收时间序列预测查询20,该时间序列预测查询20请求数据处理硬件144执行多个时间序列预测22。每个时间序列预测22是基于相应当前数据152的未来数据162的预测。
对于多个时间序列预测22的每个时间序列预测22,在操作604,方法600包括由数据处理硬件144同时训练用于多个时间序列预测22的相应时间序列预测22的多个模型212。在操作606,方法600包括由数据处理硬件144同时确定多个模型212中的哪一个模型212S最佳拟合多个时间序列预测22的相应时间序列预测22。在操作608,方法600包括由数据处理硬件144基于所确定的最佳拟合模型212S和相应当前数据152同时预测未来数据162。在操作610,方法600包括由数据处理硬件144向用户12返回由时间序列预测查询20请求的多个时间序列预测22中的每个时间序列预测22的预测的未来数据162。
图7是可用于实现本文档中描述的系统和方法的示例性计算设备700的示意图。计算设备700用于表示各种形式的数字计算机,例如便携式电脑计算机、台式计算机、工作站、个人数字助理、服务器、刀片式服务器、大型机和其它适当的计算机。这里所示的组件,它们的连接和关系以及它们的功能仅仅是示例性的,而不是要限制在本文件中描述和/或要求保护的本发明的实现。
计算设备700包括处理器710、存储器720、存储设备730、连接到存储器720和高速扩展端口750的高速接口/控制器740,以及连接到低速总线770和存储设备730的低速接口/控制器760。组件710、组件720、组件730、组件740、组件750和组件760中的每一个使用各种总线互连,并且可以适当地安装在公共母板上或以其它方式安装。处理器710可以处理用于在计算设备700内执行的指令,包括存储在存储器720中或存储设备730上的指令,以在外部输入/输出设备(例如耦合到高速接口740的显示器780)上显示图形用户界面(GUI)的图形信息。在其它实现中,可以适当地使用多个处理器和/或多个总线以及多个存储器和存储器类型。此外,多个计算设备700可以被连接,其中每个设备提供必要操作的部分(例如,作为服务器库、一组刀片服务器,或多处理器系统)。
存储器720在计算设备700内非瞬时地存储信息。存储器720可以是计算机可读介质,易失性存储器单元或非易失性存储器单元。非暂时性存储器720可以是用于临时或永久地存储由计算设备700使用的程序(例如,指令序列)或数据(例如,程序状态信息)的物理设备。非易失性存储器的实例包括(但不限于)快闪存储器和只读存储器(ROM)/可编程只读存储器(PROM)/可擦除可编程只读存储器(EPROM)/电可擦除可编程只读存储器(EEPROM)(例如,通常用于固件,例如引导程序)。易失性存储器的示例包括但不限于随机存取存储器(RAM),动态随机存取存储器(DRAM),静态随机存取存储器(SRAM),相变存储器(PCM)以及磁盘或磁带。
存储设备730能够为计算设备700提供大容量存储。在一些实施例中,存储设备730是计算机可读介质。在各种不同的实现中,存储设备730可以是软盘设备、硬盘设备、光盘设备,或磁带设备,闪存或其它类似的固态存储器设备,或设备阵列,包括存储区域网络中的设备或其它配置。在另外的实现中,计算机程序产品被有形地包含在信息载体中。计算机程序产品包含指令,指令在被执行时执行一个或多个方法,例如上述的那些方法。信息载体是计算机或机器可读介质,例如存储器720、存储设备730或处理器710上的存储器。
高速控制器740管理计算设备700的带宽密集操作,而低速控制器760管理较低的带宽密集操作。这种职责的分配仅是示例性的。在一些实施例中,高速控制器740耦合到存储器720,显示器780(例如,通过图形处理器或加速器)以及高速扩展端口750,高速扩展端口750可接受各种扩展卡(未示出)。在一些实施例中,低速控制器760耦合到存储设备730和低速扩展端口790。可以包括各种通信端口(例如,USB、蓝牙、以太网、无线以太网)的低速扩展端口790可以例如通过网络适配器耦合到一个或多个输入/输出设备,例如键盘、定点设备、扫描仪或联网设备,例如交换机或路由器。
计算设备700可以以多种不同的形式来实现,如图中所示。例如,它可以被实现为标准服务器700a或在一组这样的服务器700a中多次实现为便携式电脑计算机700b,或者实现为机架服务器系统700c的一部分。
在此描述的系统和技术的各种实现可以在数字电子和/或光学电路,集成电路,专门设计的ASIC(专用集成电路),计算机硬件,固件,软件和/或其组合中实现。这些各种实现可以包括在可编程系统上可执行和/或可解释的一个或多个计算机程序中的实现,可编程系统包括至少一个可编程处理器,可编程处理器可以是专用的或通用的,被耦合以从存储系统,至少一个输入设备和至少一个输出设备接收数据和指令,以及向存储系统,至少一个输入设备和至少一个输出设备发送数据和指令。
软件应用(即,软件资源)可以指使计算设备执行任务的计算机软件。在一些实例中,软件应用程序可被称为“应用程序”、“应用程序”或“程序”。示例应用包括但不限于系统诊断应用、系统管理应用、系统维护应用、字处理应用、电子表格应用、消息传递应用、媒体流应用、社交网络应用和游戏应用。
这些计算机程序(也称为程序,软件,软件应用或代码)包括用于可编程处理器的机器指令,并且可以用高级过程和/或面向对象的编程语言和/或用汇编/机器语言来实现。如本文所用,术语“机器可读介质”和“计算机可读介质”是指用于向可编程处理器提供机器指令和/或数据的任何计算机程序产品,非暂时性计算机可读介质,设备和/或设备(例如,磁盘、光盘、存储器,可编程逻辑设备(PLD)),包括接收机器指令作为机器可读信号的机器可读介质。术语“机器可读信号”是指用于向可编程处理器提供机器指令和/或数据的任何信号。
本说明书中描述的过程和逻辑流程可以由一个或多个可编程处理器(也称为数据处理硬件)执行,执行一个或多个计算机程序以通过对输入数据进行操作并生成输出来执行功能。过程和逻辑流程也可以由专用逻辑电路执行,例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)。例如,适于执行计算机程序的处理器包括通用和专用微处理器,以及任何类型的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是用于执行指令的处理器和用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括或被可操作地耦合以从一个或多个大容量存储设备接收数据或向一个或多个大容量存储设备传送数据,大容量存储设备用于存储数据,例如磁盘,磁光盘或光盘。然而,计算机不必具有这样的设备。适于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器,介质和存储器设备,包括例如半导体存储器设备,例如EPROM、EEPROM和闪存设备;磁盘,例如内部硬盘或可移动磁盘;磁光盘;CDROM和DVD-ROM盘。处理器和存储器可以由专用逻辑电路补充或结合在专用逻辑电路中。
为了提供与用户的交互,本公开的一个或多个方面可以在具有显示设备的计算机上实现,显示设备例如CRT(阴极射线管)、LCD(液晶显示器)监视器,或者用于向用户显示信息的触摸屏,并且可选地还具有键盘和定点设备,例如鼠标或轨迹球,通过定点设备用户可以向计算机提供输入。也可以使用其他类型的设备来提供与用户的交互;例如,提供给用户的反馈可以是任何形式的感觉反馈,例如视觉反馈、听觉反馈或触觉反馈;并且可以以任何形式接收来自用户的输入,包括声音、语音或触觉输入。此外,计算机可以通过向用户使用的设备发送文档和从用户使用的设备接收文档来与用户交互;例如,通过响应于从web浏览器接收的请求向用户的客户端设备上的web浏览器发送网页。
已经描述了多种实现方式。然而,应当理解,在不脱离本公开的精神和范围的情况下,可以进行各种修改。因此,其它实施方式也在所附权利要求的范围内。

Claims (24)

1.一种方法(600),其特征在于,包括:
在数据处理硬件(144)处接收来自用户(12)的时间序列预测查询(20),所述时间序列预测查询(20)请求所述数据处理硬件(144)执行多个时间序列预测(22),每个时间序列预测(22)是基于相应当前数据(152)的未来数据(162)的预测;
对于由所述时间序列预测查询(20)请求的所述多个时间序列预测(22)中的每个时间序列预测(22),同时地:
由所述数据处理硬件(144)训练用于所述相应时间序列预测(22)的多个模型(212);
由所述数据处理硬件(144)确定所述多个模型(212)中的哪一个模型(212)最佳拟合所述相应时间序列预测(22);以及
由所述数据处理硬件(144)基于确定的最佳拟合模型(212)和所述相应当前数据(152)来预测所述未来数据(162);以及
由所述数据处理硬件(144)向所述用户(12)返回所述时间序列预测查询(20)所请求的所述多个时间序列预测(22)中的每个时间序列预测(22)的预测的所述未来数据(162)。
2.根据权利要求1所述的方法(600),其特征在于,所述时间序列预测查询(20)仅包括单个查询(20)。
3.根据权利要求2所述的方法(600),其特征在于,所述单个查询(20)包括结构化查询语言(SQL)查询(20)。
4.根据权利要求2或3所述的方法(600),其特征在于,所述单个查询(20)包括对表(158)的三列(300)的引用。
5.根据权利要求4所述的方法(600),其特征在于,所述表(158)的所述三列(300)包括:
包含时间戳数据的第一列(300a);
包含所述当前数据(152)的第二列(300b);
和包含时间序列预测标识数据的第三列(300c)。
6.根据权利要求1-5中任一项所述的方法(600),其特征在于,用于每个相应时间序列预测(22)的所述多个模型(212)中的每个模型(212)包括自回归综合移动平均模型(212)。
7.根据权利要求6所述的方法(600),其特征在于,训练所述多个模型(212)包括执行超参数调整。
8.根据权利要求1-7中任一项所述的方法(600),其特征在于,预测所述未来数据(162)包括建模季节性效应。
9.根据权利要求1-8中任一项所述的方法(600),其特征在于,预测所述未来数据(162)包括建模假日效应。
10.根据权利要求1-9中任一项所述的方法(600),其特征在于,预测所述未来数据(162)包括建模漂移。
11.根据权利要求1-10中任一项所述的方法(600),其特征在于,预测所述未来数据(162)包括执行异常检测(518)。
12.根据权利要求1-11中任一项所述的方法(600),其特征在于,确定所述多个模型(212)中的哪一个模型(212)最佳拟合所述相应时间序列预测(22)包括确定哪一个模型(212)具有最低的赤池信息量准则(AIC)。
13.一种系统(100),其特征在于,包括:
数据处理硬件(144);以及
存储器硬件(146),所述存储器硬件(146)与所述数据处理硬件(144)通信,所述存储器硬件(146)存储指令,当所述指令在所述数据处理硬件(144)上执行时使得所述数据处理硬件(144)执行以下操作:
接收来自用户(12)的时间序列预测查询(20),所述时间序列预测查询(20)请求所述数据处理硬件(144)执行多个时间序列预测(22),每个时间序列预测(22)是基于相应当前数据(152)的未来数据(162)的预测;
对于由所述时间序列预测查询(20)请求的所述多个时间序列预测(22)中的每个时间序列预测(22),同时地:
训练用于所述相应时间序列预测(22)的多个模型(212);
确定所述多个模型(212)中哪一个模型(212)最佳拟合所述相应时间序列预测(22);以及
基于确定的最佳拟合模型(212)和所述相应当前数据(152)来预测所述未来数据(162);以及
向所述用户(12)返回所述时间序列预测查询(20)所请求的所述多个时间序列预测(22)中的每个时间序列预测(22)的预测的所述未来数据(162)。
14.根据权利要求13所述的系统(100),其特征在于,所述时间序列预测查询(20)仅包括单个查询(20)。
15.根据权利要求14所述的系统(100),其特征在于,所述单个查询(20)包括结构化查询语言(SQL)查询(20)。
16.根据权利要求14或15所述的系统(100),其特征在于,所述单个查询(20)包括对表(158)的三列(300)的引用。
17.根据权利要求16所述的系统(100),其特征在于,所述表(158)的所述三列(300)包括:
包含时间戳数据的第一列(300a);
包含所述当前数据(152)的第二列(300b);
和包含时间序列预测标识数据的第三列(300c)。
18.根据权利要求13-17中任一项所述的系统(100),其特征在于,用于每个相应时间序列预测(22)的所述多个模型(212)中的每个模型(212)包括自回归综合移动平均模型(212)。
19.根据权利要求18所述的系统(100),其特征在于,训练所述多个模型(212)包括执行超参数调整。
20.根据权利要求13-19中任一项所述的系统(100),其特征在于,预测所述未来数据(162)包括建模季节性效应。
21.根据权利要求13-20中任一项所述的系统(100),其特征在于,预测所述未来数据(162)包括建模假日效应。
22.根据权利要求13-21中任一项所述的系统(100),其特征在于,预测所述未来数据(162)包括建模漂移。
23.根据权利要求13-22中任一项所述的系统(100),其特征在于,预测所述未来数据(162)包括执行异常检测(518)。
24.根据权利要求13-23中任一项所述的系统(100),其特征在于,确定所述多个模型(212)中的哪一个模型(212)最佳拟合所述相应时间序列预测(22)包括确定哪一个模型(212)具有最低的赤池信息量准则(AIC)。
CN202180036340.8A 2020-05-18 2021-05-06 时间序列预测 Pending CN115668170A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063026573P 2020-05-18 2020-05-18
US63/026,573 2020-05-18
US16/986,861 US11693867B2 (en) 2020-05-18 2020-08-06 Time series forecasting
US16/986,861 2020-08-06
PCT/US2021/031090 WO2021236344A1 (en) 2020-05-18 2021-05-06 Time series forecasting

Publications (1)

Publication Number Publication Date
CN115668170A true CN115668170A (zh) 2023-01-31

Family

ID=78512437

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180036340.8A Pending CN115668170A (zh) 2020-05-18 2021-05-06 时间序列预测

Country Status (6)

Country Link
US (2) US11693867B2 (zh)
EP (1) EP4154128A1 (zh)
JP (1) JP2023526823A (zh)
KR (1) KR20230003303A (zh)
CN (1) CN115668170A (zh)
WO (1) WO2021236344A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220076848A1 (en) * 2020-09-09 2022-03-10 Optum, Inc. Seasonally adjusted predictive data analysis
US20230274180A1 (en) * 2022-02-28 2023-08-31 Google Llc Machine Learning Super Large-Scale Time-series Forecasting
CN116582702B (zh) * 2023-07-11 2023-09-15 成都工业职业技术学院 一种基于大数据的网络视频播放量预测方法、系统及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130238399A1 (en) * 2009-11-03 2013-09-12 Sas Institute Inc. Computer-Implemented Systems and Methods for Scenario Analysis
US20160300252A1 (en) * 2015-01-29 2016-10-13 Affectomatics Ltd. Collection of Measurements of Affective Response for Generation of Crowd-Based Results
CN107358317A (zh) * 2017-06-28 2017-11-17 北京优特捷信息技术有限公司 通过机器学习进行时序预测的方法及装置
US20190121566A1 (en) * 2017-10-19 2019-04-25 Pure Storage, Inc. Data transformation offloading in an artificial intelligence infrastructure
US20190384762A1 (en) * 2017-02-10 2019-12-19 Count Technologies Ltd. Computer-implemented method of querying a dataset
US20200143246A1 (en) * 2018-06-26 2020-05-07 Sas Institute Inc. Demand classification based pipeline system for time-series data forecasting

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170193371A1 (en) * 2015-12-31 2017-07-06 Cisco Technology, Inc. Predictive analytics with stream database
US11120361B1 (en) * 2017-02-24 2021-09-14 Amazon Technologies, Inc. Training data routing and prediction ensembling at time series prediction system
CN111639247B (zh) * 2019-03-01 2023-08-01 百度在线网络技术(北京)有限公司 用于评估评论的质量的方法、装置、设备以及计算机可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130238399A1 (en) * 2009-11-03 2013-09-12 Sas Institute Inc. Computer-Implemented Systems and Methods for Scenario Analysis
US20160300252A1 (en) * 2015-01-29 2016-10-13 Affectomatics Ltd. Collection of Measurements of Affective Response for Generation of Crowd-Based Results
US20190384762A1 (en) * 2017-02-10 2019-12-19 Count Technologies Ltd. Computer-implemented method of querying a dataset
CN107358317A (zh) * 2017-06-28 2017-11-17 北京优特捷信息技术有限公司 通过机器学习进行时序预测的方法及装置
US20190121566A1 (en) * 2017-10-19 2019-04-25 Pure Storage, Inc. Data transformation offloading in an artificial intelligence infrastructure
US20200143246A1 (en) * 2018-06-26 2020-05-07 Sas Institute Inc. Demand classification based pipeline system for time-series data forecasting

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
DAVID SHAUB: "Fast and accurate yearly time series forecasting with forecast combinations", INTERNATIONAL JOURNAL OF FORECASTING, vol. 36, no. 1, pages 116 - 120, XP085895920, DOI: 10.1016/j.ijforecast.2019.03.032 *

Also Published As

Publication number Publication date
JP2023526823A (ja) 2023-06-23
EP4154128A1 (en) 2023-03-29
KR20230003303A (ko) 2023-01-05
US20210357402A1 (en) 2021-11-18
US11693867B2 (en) 2023-07-04
US20230297583A1 (en) 2023-09-21
WO2021236344A1 (en) 2021-11-25

Similar Documents

Publication Publication Date Title
US11670021B1 (en) Enhanced graphical user interface for representing events
CN115668170A (zh) 时间序列预测
US10884891B2 (en) Interactive detection of system anomalies
US20210365643A1 (en) Natural language outputs for path prescriber model simulation for nodes in a time-series network
US20180123918A1 (en) Automatically detecting latency bottlenecks in asynchronous workflows
JP2022008497A (ja) 出現した関係におけるスタックセグメント強度の相関
US20160125157A1 (en) Systems and Methods to Monitor Health of Online Social Communities
US20150278706A1 (en) Method, Predictive Analytics System, and Computer Program Product for Performing Online and Offline Learning
US10373071B2 (en) Automated intelligent data navigation and prediction tool
CN111143686A (zh) 资源推荐方法及装置
US11163783B2 (en) Auto-selection of hierarchically-related near-term forecasting models
US20210365611A1 (en) Path prescriber model simulation for nodes in a time-series network
US20180121311A1 (en) Identifying request-level critical paths in multi-phase parallel tasks
RU2622850C2 (ru) Метод и сервер для обработки идентификаторов продукта и машиночитаемый носитель данных
US11010237B2 (en) Method and system for detecting and preventing an imminent failure in a target system
CN111460384A (zh) 策略的评估方法、装置和设备
US20230011954A1 (en) Device, method, and system for business plan management
Sha et al. Development of a regression-based method with case-based tuning to solve the due date assignment problem
US20220382857A1 (en) Machine Learning Time Series Anomaly Detection
US11004007B2 (en) Predictor management system, predictor management method, and predictor management program
US11636377B1 (en) Artificial intelligence system incorporating automatic model updates based on change point detection using time series decomposing and clustering
US11651271B1 (en) Artificial intelligence system incorporating automatic model updates based on change point detection using likelihood ratios
US20200265071A1 (en) Mixed initiative feature engineering
EP3855316A1 (en) Optimizing breakeven points for enhancing system performance
US20230274180A1 (en) Machine Learning Super Large-Scale Time-series Forecasting

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination