CN108596398B - 基于条件随机场与Stacking算法的时间序列预测方法和装置 - Google Patents

基于条件随机场与Stacking算法的时间序列预测方法和装置 Download PDF

Info

Publication number
CN108596398B
CN108596398B CN201810413123.6A CN201810413123A CN108596398B CN 108596398 B CN108596398 B CN 108596398B CN 201810413123 A CN201810413123 A CN 201810413123A CN 108596398 B CN108596398 B CN 108596398B
Authority
CN
China
Prior art keywords
conditional random
random field
field model
converged
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810413123.6A
Other languages
English (en)
Other versions
CN108596398A (zh
Inventor
王宏志
魏延杰
齐志鑫
高宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN201810413123.6A priority Critical patent/CN108596398B/zh
Publication of CN108596398A publication Critical patent/CN108596398A/zh
Application granted granted Critical
Publication of CN108596398B publication Critical patent/CN108596398B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Biomedical Technology (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Operations Research (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开实施例涉及一种基于条件随机场与Stacking算法的时间序列预测方法、装置、计算机存储介质和电子设备。该方法包括:获得多个基预测器中每个基预测器预测的不同维度的预测数据;将所述多个基预测器的一部分预测数据作为验证集,输入条件随机场模型;根据所述验证集中的预测数据,初始化所述条件随机场模型;在所述条件随机场模型未收敛期间,结合Stacking算法,进行多次迭代,直到所述条件随机场模型收敛为止,得到收敛的条件随机场模型;将所述收敛的条件随机场模型的输出确定为时间序列预测结果。

Description

基于条件随机场与Stacking算法的时间序列预测方法和装置
技术领域
本公开的实施例涉及计算机技术领域,尤其涉及一种基于条件随机场与Stacking算法的时间序列预测方法、装置、计算机存储介质和电子设备。
背景技术
相比于简单时间序列,复杂时间序列具有维度更高、更复杂的特点,这使得复杂时间序列的预测比简单时间序列的预测更加困难。然而相比于简单时间序列,复杂时间序列更多地源于生活与生产中,例如:音频、视频以及工业生产系统中的各个运行参数。
针对复杂时间序列,常见的一种预测方法是扩展已经成功应用于简单时间序列数据上的方法,诸如文献《Vector Autoregressive Models for Multivariate TimeSeries》与文献《MARSS:Multivariate Autoregressive State-space Models forAnalyzing Time-series Data》都扩展了自回归模型,使其适应高维度的时间序列;而文献《A Serial Approach to Handling High-Dimensional Measurements in the Sigma-Point Kalman Filter》则针对高维度的时间序列改进了卡尔曼滤波器。
除了传统的机器学习方法之外,近年来深度学习方法也慢慢涉足时间序列预测,文献《A review of unsupervised feature learning and deep learning for time-series modeling》对此进行了一个回顾;《Deep Learning in Finance》一文则对深度学习方法在金融方面的应用进行了回顾与探讨。长短期记忆网络(LSTM)作为循环神经网络(RNN)中一个重要的模型,也广泛应用于时间序列的挖掘中。
发明内容
本公开至少一个实施例的主要目的在于提供一种一种基于条件随机场与Stacking算法的时间序列预测方法、装置、计算机存储介质和电子设备。
第一方面,本公开的实施例提供了一种基于条件随机场与Stacking算法的时间序列预测方法,所述方法包括:
获得多个基预测器中每个基预测器预测的不同维度的预测数据;
将所述多个基预测器的一部分预测数据作为验证集,输入条件随机场模型;
根据所述验证集中的预测数据,初始化所述条件随机场模型;
在所述条件随机场模型未收敛期间,结合Stacking算法,进行多次迭代,直到所述条件随机场模型收敛为止,得到收敛的条件随机场模型;
将所述收敛的条件随机场模型的输出确定为时间序列预测结果。
可选地,在将所述收敛的条件随机场模型的输出确定为时间序列预测结果之前,所述方法还包括:
将所述多个基预测器的另一部分预测数据作为测试集,输入所述收敛的条件随机场模型,得到所述收敛的条件随机场模型的预测准确度;
将所述收敛的条件随机场模型的输出确定为时间序列预测结果,包括:
在所述预测准确度大于所述预设阈值的情况下,将所述收敛的条件随机场模型的输出确定为时间序列预测结果。
可选地,将所述多个基预测器的另一部分预测数据作为测试集,输入所述收敛的条件随机场模型,得到所述收敛的条件随机场模型的预测准确度,包括:
将所述多个基预测器的另一部分预测数据作为测试集,输入所述收敛的条件随机场模型,将交叉熵作为损失函数,利用Adam算法进行训练,得到所述收敛的条件随机场模型的预测准确度。
可选地,在所述条件随机场模型未收敛期间,结合Stacking算法,进行多次迭代,包括:
在所述条件随机场模型未收敛期间,以单个维度为粒度,通过CUDA和TensorFlow并行执行多次迭代。
第二方面,本公开的实施例提供了一种基于条件随机场与Stacking算法的时间序列预测装置,所述装置包括:
获得模块,用于获得多个基预测器中每个基预测器预测的不同维度的预测数据;
第一输入模块,用于将所述多个基预测器的一部分预测数据作为验证集,输入条件随机场模型;
初始化模块,用于根据所述验证集中的预测数据,初始化所述条件随机场模型;
迭代模块,用于在所述条件随机场模型未收敛期间,结合Stacking算法,进行多次迭代,直到所述条件随机场模型收敛为止,得到收敛的条件随机场模型;
确定模块,用于将所述收敛的条件随机场模型的输出确定为时间序列预测结果。
可选地,所述装置还包括:
第二输入模块,用于将所述多个基预测器的另一部分预测数据作为测试集,输入所述收敛的条件随机场模型,得到所述收敛的条件随机场模型的预测准确度;
所述确定模块包括:
确定子模块,用于在所述预测准确度大于所述预设阈值的情况下,将所述收敛的条件随机场模型的输出确定为时间序列预测结果。
可选地,所述第二输入模块包括:
输入子模块,用于将所述多个基预测器的另一部分预测数据作为测试集,输入所述收敛的条件随机场模型,将交叉熵作为损失函数,利用Adam算法进行训练,得到所述收敛的条件随机场模型的预测准确度。
可选地,所述迭代模块包括:
迭代子模块,用于在所述条件随机场模型未收敛期间,以单个维度为粒度,通过CUDA和TensorFlow并行执行多次迭代。
第三方面,本公开的实施例提供了一种计算机存储介质,所述计算机存储介质中存储有可被计算机设备执行的指令代码;所述指令代码在被计算机设备执行时,执行第一方面任一项所述的方法。
第四方面,本公开的实施例提供了一种电子设备,所述电子设备包括至少一个处理器和一个存储器,所述存储器耦接至所述处理器;所述处理器用于执行所述存储器中存储的计算机指令;所述存储器在执行所述计算机指令时,执行第一方面任一项所述的方法。
采用上述技术方案,在多个基预测器的预测基础上,利用本公开实施例提供的方法进行模型融合,融合后的效果相比基预测器结果的简单平均有了2%以上的提升,由于所选用的都已经是集成学习的算法,能力已经很强,这样的提升是非常可观的。
此外,利用条件随机场作为Stacking过程的上层预测器,既利用了已有预测器的结果,又刻画了不同维度之间的关系。由于可以利用神经网络中的方法对这个上层预测器进行实现,也可以通过反向传播利用这个上层预测器对神经网络的结果进行微调,以达到更好的效果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的基于条件随机场与Stacking算法的时间序列预测方法的流程图。
图2是本发明实施例提供的基于条件随机场与Stacking算法的时间序列预测装置的示意图。
图3是本发明实施例提供的电子设备的示意图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本发明实施例提供了一种基于条件随机场与Stacking算法的时间序列预测方法,通过模型融合的方式对复杂时间序列进行预测。图1是本发明实施例提供的基于条件随机场与Stacking算法的时间序列预测方法的流程图,如图1所示,该方法包括以下步骤:
步骤S11:获得多个基预测器中每个基预测器预测的不同维度的预测数据;
步骤S12:将所述多个基预测器的一部分预测数据作为验证集,输入条件随机场模型;
步骤S13:根据所述验证集中的预测数据,初始化所述条件随机场模型;
步骤S14:在所述条件随机场模型未收敛期间,结合Stacking算法,进行多次迭代,直到所述条件随机场模型收敛为止,得到收敛的条件随机场模型;
步骤S15:将所述收敛的条件随机场模型的输出确定为时间序列预测结果。
首先,执行步骤S11,通过多个基列预测器,可以预测出复杂时间序列的各个维度的预测数据。以分类问题为例,获得基预测器预测的第i维度数据属于第k类的概率。或者,以天气预报为例,通过抓取天气后报网站(http://tianqihoubao.com/)的数据,选用Adaboost、GBDT、随机森林等算法,得到基预测器,然后获得基预测预测的位置为
Figure BDA0001648626230000051
的城市第二天的天气情况
Figure BDA0001648626230000052
然后,执行步骤S12,将多个基预测器的一部分预测数据作为验证集,输入条件随机场模型。示例地,执行Qi,k←Pi,k,其中,Pi,k表示验证集中的预测数据,例如:第i维度数据属于第k类的概率,Qi,k表示条件随机场模型的输入,其中,i和k分别为大于0的整数。
接着,执行步骤S13,根据条件随机场模型的输入,初始化条件随机场模型。示例地,执行Ui,k←-logPi,k,其中,Ui,k表示表示条件随机场模型收敛之前的初始能量,产生于多个基预测器预测的不同维度的预测数据。
接着,执行步骤S14。示例地,步骤S14的执行过程如以下代码所示:
Figure BDA0001648626230000053
其中,第1行语句while not converged do直至最后一个行语句end,表示这两个语句之间的各行循环执行。步骤S13中,进入平均场迭代,使得条件随机场模型最终收敛。
κm函数是一个核函数,用以刻画不同的两个维度之间的关系,可以设置多个这样的函数。示例地,以天气预报为例,κm符合以下公式:
Figure BDA0001648626230000061
Figure BDA0001648626230000062
这里
Figure BDA0001648626230000063
表示基预测器预测的维度i的预测数据,
Figure BDA0001648626230000064
Figure BDA0001648626230000065
构成了
Figure BDA0001648626230000066
θα和θβ是需要学习的参数,distancei,j表示维度i与维度j之间的距离。
wm是与核函数对应的权值,用以调整核函数所刻画的关系对最终的预测结果的影响,是需要学习的参数。函数μ用以刻画预测数据之间的关系。示例地,以分类问题为例,函数μ符合以下公式:
Figure BDA0001648626230000067
即,只有同一类别的中间结果会对最终的预测结果产生影响。上述公式可适用于天气预报。
在具体实施时,利用一维的卷积层来实现第3行语句,而利用神经网络中常用的softmax层来实现最后一行语句。最后一行语句对结果进行一个柔性最大传递函数(softmax),起到正则化的作用,其中,
Figure BDA0001648626230000068
在一种实施方式中,步骤S14包括:在所述条件随机场模型未收敛期间,以单个维度为粒度,通过CUDA和TensorFlow并行执行多次迭代。
在具体实施时,上述循环部分是可以并行的,于是使用CUDA这一基于GPU的计算框架进行实现。以单个维度为粒度,对循环部分进行并行,并且利用Grid Search的方式进行参数的估计。
上述循环部分往往在循环一定轮数之后达到收敛,因而可以通过循环神经网络的结构实现,上述代码中的第2行语句可替换为:
Figure BDA0001648626230000069
以避免产生数量巨大的向量(Tensor),从造成巨大的内存(显存)负担。
其中,
Figure BDA0001648626230000071
维度间的距离可以由欧式距离这样的物理意义得到,也可以由Pearson系数这样的相关系数得到,利用一个作为超参数的阈值以定义远近。这样定义的作用类似一个截断的高斯过滤器。
在执行完步骤S14之后,得到收敛的条件随机场模型。最后,将收敛的条件随机场模型的输出确定为时间序列预测结果。
在一种实施方式中,在步骤S15之前,所述方法还包括:
将所述多个基预测器的另一部分预测数据作为测试集,输入所述收敛的条件随机场模型,得到所述收敛的条件随机场模型的预测准确度;
相应地,步骤S15包括:
在所述预测准确度大于所述预设阈值的情况下,将所述收敛的条件随机场模型的输出确定为时间序列预测结果。
为了保证最终的预测结果的准确度,在得到收敛的条件随机场模型之后,首先利用验证集数据,使用交叉熵为损失函数,使用Adam方法进行训练,得到收敛的条件随机场模型的预测准确度。在收敛的条件随机场模型的预测准确度大于预设阈值的条件下,认为收敛的条件随机场模型的输出是可信的,因而将收敛的条件随机场模型的输出确定为时间序列预测结果。其中,预设阈值根据对准确度的需求确定,要求准确度高,可以将预设阈值设置为一较大值。
采用上述技术方案,在多个基预测器的预测基础上,利用本公开实施例提供的方法进行模型融合,融合后的效果相比基预测器结果的简单平均有了2%以上的提升,由于所选用的都已经是集成学习的算法,能力已经很强,这样的提升是非常可观的。
此外,利用条件随机场作为Stacking过程的上层预测器,既利用了已有预测器的结果,又刻画了不同维度之间的关系。由于可以利用神经网络中的方法对这个上层预测器进行实现,也可以通过反向传播利用这个上层预测器对神经网络的结果进行微调,以达到更好的效果。
基于同一发明构思,本发明实施例提供了一种基于条件随机场与Stacking算法的时间序列预测装置。图2是本发明实施例提供的种基于条件随机场与Stacking算法的时间序列预测装置的示意图。如图2所示,装置包括:
获得模块201,用于获得多个基预测器中每个基预测器预测的不同维度的预测数据;
第一输入模块202,用于将所述多个基预测器的一部分预测数据作为验证集,输入条件随机场模型;
初始化模块203,用于根据所述验证集中的预测数据,初始化所述条件随机场模型;
迭代模块204,用于在所述条件随机场模型未收敛期间,结合Stacking算法,进行多次迭代,直到所述条件随机场模型收敛为止,得到收敛的条件随机场模型;
确定模块205,用于将所述收敛的条件随机场模型的输出确定为时间序列预测结果。
可选地,所述装置还包括:
第二输入模块,用于将所述多个基预测器的另一部分预测数据作为测试集,输入所述收敛的条件随机场模型,得到所述收敛的条件随机场模型的预测准确度;
所述确定模块包括:
确定子模块,用于在所述预测准确度大于所述预设阈值的情况下,将所述收敛的条件随机场模型的输出确定为时间序列预测结果。
可选地,所述第二输入模块包括:
输入子模块,用于将所述多个基预测器的另一部分预测数据作为测试集,输入所述收敛的条件随机场模型,将交叉熵作为损失函数,利用Adam算法进行训练,得到所述收敛的条件随机场模型的预测准确度。
可选地,所述迭代模块包括:
迭代子模块,用于在所述条件随机场模型未收敛期间,以单个维度为粒度,通过CUDA和TensorFlow并行执行多次迭代。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本发明实施例提供了一种电子设备,包括:至少一个处理器、至少一个存储器以及存储在存储器中的计算机程序指令,当计算机程序指令被处理器执行时实现如上述实施方式中基于条件随机场与Stacking算法的时间序列预测方法。
本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序指令,当计算机程序指令被处理器执行时实现如上述实施方式中基于条件随机场与Stacking算法的时间序列预测方法。
结合图1描述的本发明实施例的基于条件随机场与Stacking算法的时间序列预测方法可以由电子设备来实现。图3示出了本发明实施例提供的电子设备的示意图。
电子设备可以包括处理器301以及存储有计算机程序指令的存储器302。
具体地,上述处理器301可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本发明实施例的一个或多个集成电路。
存储器302可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器302可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器302可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器302可在数据处理装置的内部或外部。在特定实施例中,存储器302是非易失性固态存储器。在特定实施例中,存储器302包括只读存储器(ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
处理器301通过读取并执行存储器302中存储的计算机程序指令,以实现上述实施例中的任意一种基于条件随机场与Stacking算法的时间序列预测方法。
在一个示例中,电子设备还可包括通信接口303和总线310。其中,如图3所示,处理器301、存储器302、通信接口303通过总线310连接并完成相互间的通信。
通信接口303,主要用于实现本发明实施例中各模块、装置、单元和/或设备之间的通信。
总线310包括硬件、软件或两者,将执行基于条件随机场与Stacking算法的时间序列预测方法的设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线310可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。
另外,结合上述实施例中的基于条件随机场与Stacking算法的时间序列预测方法,本发明实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种基于条件随机场与Stacking算法的时间序列预测方法。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种用于天气预报的基于条件随机场与Stacking算法的时间序列预测方法,其特征在于,所述方法包括:
获得多个基预测器中每个基预测器预测的不同维度的预测数据;其中抓取天气后报网站的数据,选用Adaboost、GBDT、随机森林算法得到基预测器,然后获得基预测器预测的位置为
Figure FDA0002689013820000011
的城市第二天的天气情况
Figure FDA0002689013820000012
作为预测数据;
将所述多个基预测器的一部分预测数据作为验证集,输入条件随机场模型;
根据所述验证集中的预测数据,初始化所述条件随机场模型;
在所述条件随机场模型未收敛期间,结合Stacking算法,进行多次迭代,直到所述条件随机场模型收敛为止,得到收敛的条件随机场模型;其中核函数κm符合以下公式:
Figure FDA0002689013820000013
Figure FDA0002689013820000014
式中
Figure FDA0002689013820000015
表示基预测器预测的维度i的预测数据,位置
Figure FDA0002689013820000016
与该城市第二天的天气情况
Figure FDA0002689013820000017
构成了
Figure FDA0002689013820000018
Figure FDA0002689013820000019
表示基预测器预测的维度j的预测数据,位置
Figure FDA00026890138200000110
与该城市第二天的天气情况
Figure FDA00026890138200000111
构成了
Figure FDA00026890138200000112
θα和θβ是需要学习的参数,θγ是需要学习的参数,distancei,j表示维度i与维度j之间的距离;
将所述收敛的条件随机场模型的输出确定为时间序列预测结果。
2.根据权利要求1所述的方法,其特征在于,在将所述收敛的条件随机场模型的输出确定为时间序列预测结果之前,所述方法还包括:
将所述多个基预测器的另一部分预测数据作为测试集,输入所述收敛的条件随机场模型,得到所述收敛的条件随机场模型的预测准确度;
将所述收敛的条件随机场模型的输出确定为时间序列预测结果,包括:
在所述预测准确度大于预设阈值的情况下,将所述收敛的条件随机场模型的输出确定为时间序列预测结果。
3.根据权利要求2所述的方法,其特征在于,将所述多个基预测器的另一部分预测数据作为测试集,输入所述收敛的条件随机场模型,得到所述收敛的条件随机场模型的预测准确度,包括:
将所述多个基预测器的另一部分预测数据作为测试集,输入所述收敛的条件随机场模型,将交叉熵作为损失函数,利用Adam算法进行训练,得到所述收敛的条件随机场模型的预测准确度。
4.根据权利要求1所述的方法,其特征在于,在所述条件随机场模型未收敛期间,结合Stacking算法,进行多次迭代,包括:
在所述条件随机场模型未收敛期间,以单个维度为粒度,通过CUDA和TensorFlow并行执行多次迭代。
5.一种用于天气预报的基于条件随机场与Stacking算法的时间序列预测装置,其特征在于,所述装置包括:
获得模块,用于获得多个基预测器中每个基预测器预测的不同维度的预测数据;其中抓取天气后报网站的数据,选用Adaboost、GBDT、随机森林算法得到基预测器,然后获得基预测器预测的位置为
Figure FDA0002689013820000021
的城市第二天的天气情况
Figure FDA0002689013820000022
作为预测数据;
第一输入模块,用于将所述多个基预测器的一部分预测数据作为验证集,输入条件随机场模型;
初始化模块,用于根据所述验证集中的预测数据,初始化所述条件随机场模型;
迭代模块,用于在所述条件随机场模型未收敛期间,结合Stacking算法,进行多次迭代,直到所述条件随机场模型收敛为止,得到收敛的条件随机场模型;其中核函数κm符合以下公式:
Figure FDA0002689013820000023
Figure FDA0002689013820000024
式中
Figure FDA0002689013820000025
表示基预测器预测的维度i的预测数据,位置
Figure FDA0002689013820000026
与该城市第二天的天气情况
Figure FDA0002689013820000027
构成了
Figure FDA0002689013820000028
Figure FDA0002689013820000029
表示基预测器预测的维度j的预测数据,位置
Figure FDA00026890138200000210
与该城市第二天的天气情况
Figure FDA00026890138200000211
构成了
Figure FDA00026890138200000212
θα和θβ是需要学习的参数,θγ是需要学习的参数,distancei,j表示维度i与维度j之间的距离;
确定模块,用于将所述收敛的条件随机场模型的输出确定为时间序列预测结果。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
第二输入模块,用于将所述多个基预测器的另一部分预测数据作为测试集,输入所述收敛的条件随机场模型,得到所述收敛的条件随机场模型的预测准确度;
所述确定模块包括:
确定子模块,用于在所述预测准确度大于预设阈值的情况下,将所述收敛的条件随机场模型的输出确定为时间序列预测结果。
7.根据权利要求6所述的装置,其特征在于,所述第二输入模块包括:
输入子模块,用于将所述多个基预测器的另一部分预测数据作为测试集,输入所述收敛的条件随机场模型,将交叉熵作为损失函数,利用Adam算法进行训练,得到所述收敛的条件随机场模型的预测准确度。
8.根据权利要求5所述的装置,其特征在于,所述迭代模块包括:
迭代子模块,用于在所述条件随机场模型未收敛期间,以单个维度为粒度,通过CUDA和TensorFlow并行执行多次迭代。
9.一种计算机存储介质,其特征在于,所述计算机存储介质中存储有可被计算机设备执行的指令代码;
所述指令代码在被计算机设备执行时,执行权利要求1-4任一所述的方法。
10.一种电子设备,其特征在于,包括:
至少一个处理器和一个存储器,所述存储器耦接至所述处理器;
所述处理器用于执行所述存储器中存储的计算机指令;
所述存储器在执行所述计算机指令时,执行权利要求1-4任一所述的方法。
CN201810413123.6A 2018-05-03 2018-05-03 基于条件随机场与Stacking算法的时间序列预测方法和装置 Active CN108596398B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810413123.6A CN108596398B (zh) 2018-05-03 2018-05-03 基于条件随机场与Stacking算法的时间序列预测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810413123.6A CN108596398B (zh) 2018-05-03 2018-05-03 基于条件随机场与Stacking算法的时间序列预测方法和装置

Publications (2)

Publication Number Publication Date
CN108596398A CN108596398A (zh) 2018-09-28
CN108596398B true CN108596398B (zh) 2021-02-19

Family

ID=63619729

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810413123.6A Active CN108596398B (zh) 2018-05-03 2018-05-03 基于条件随机场与Stacking算法的时间序列预测方法和装置

Country Status (1)

Country Link
CN (1) CN108596398B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110347760B (zh) * 2019-05-30 2021-07-09 中国地质大学(武汉) 一种用于失踪人群时空定位服务的数据分析方法
CN110334275B (zh) * 2019-05-31 2020-12-04 北京中科闻歌科技股份有限公司 一种新闻流行度预测方法、设备和存储介质
CN110348624B (zh) * 2019-07-04 2020-12-29 内蒙古工业大学 一种基于Stacking集成策略的沙尘暴等级预测方法
CN111784071B (zh) * 2020-07-14 2024-05-07 北京月新时代科技股份有限公司 一种基于Stacking集成的许可占用与预测方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106598950A (zh) * 2016-12-23 2017-04-26 东北大学 一种基于混合层叠模型的命名实体识别方法
CN107895283A (zh) * 2017-11-07 2018-04-10 重庆邮电大学 一种基于时间序列分解的商家客流量大数据预测方法
CN107944550A (zh) * 2017-12-14 2018-04-20 清华大学 一种基于探测式深度网络的时空大数据预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106598950A (zh) * 2016-12-23 2017-04-26 东北大学 一种基于混合层叠模型的命名实体识别方法
CN107895283A (zh) * 2017-11-07 2018-04-10 重庆邮电大学 一种基于时间序列分解的商家客流量大数据预测方法
CN107944550A (zh) * 2017-12-14 2018-04-20 清华大学 一种基于探测式深度网络的时空大数据预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Any-time Methods For Time-series Prediction With Missing Observations;Yanjie Wei 等;《2017 IEEE 6th International Congress on Big Data》;20170630;第427-430页 *
Sequential Click Prediction for Sponsored Search with Recurrent Neural Networks;Zhang Yuyu 等;《Association for the Advancement of Artificial》;20140428;第1-8页 *
基于组合条件随机场的极化SAR图像监督地物分类;邹焕新 等;《雷达学报》;20171031;第6卷(第5期);第541-553页 *

Also Published As

Publication number Publication date
CN108596398A (zh) 2018-09-28

Similar Documents

Publication Publication Date Title
CN108596398B (zh) 基于条件随机场与Stacking算法的时间序列预测方法和装置
US11734319B2 (en) Question answering method and apparatus
US11537852B2 (en) Evolving graph convolutional networks for dynamic graphs
CN108280542B (zh) 一种用户画像模型的优化方法、介质以及设备
US10769551B2 (en) Training data set determination
CN110263824B (zh) 模型的训练方法、装置、计算设备及计算机可读存储介质
US20200184312A1 (en) Apparatus and method for generating sampling model for uncertainty prediction, and apparatus for predicting uncertainty
US20180314978A1 (en) Learning apparatus and method for learning a model corresponding to a function changing in time series
US20200334557A1 (en) Chained influence scores for improving synthetic data generation
CN109993183B (zh) 网络故障评估方法、装置、计算设备及存储介质
CN116150125A (zh) 结构化数据生成模型的训练方法、装置、设备及存储介质
CN117041017A (zh) 数据中心的智能运维管理方法及系统
CN109615080B (zh) 无监督模型评估方法、装置、服务器及可读存储介质
Berberidis et al. Data-adaptive active sampling for efficient graph-cognizant classification
US20230326191A1 (en) Method and Apparatus for Enhancing Performance of Machine Learning Classification Task
CN116166967A (zh) 基于元学习与残差网络的数据处理方法、设备和存储介质
CN111612022A (zh) 用于分析数据的方法、设备和计算机存储介质
CN115860856A (zh) 一种数据处理方法、装置、电子设备及存储介质
CN114741690A (zh) 网络安全监测方法、装置、设备及计算机存储介质
US20230259619A1 (en) Inference apparatus, inference method and computer-readable storage medium
US20240103920A1 (en) Method and system for accelerating the convergence of an iterative computation code of physical parameters of a multi-parameter system
CN114238658A (zh) 时序知识图谱的链接预测方法、装置及电子设备
CN114417830A (zh) 风险评价方法、装置、设备及计算机可读存储介质
US11593621B2 (en) Information processing apparatus, information processing method, and computer program product
CN109996274B (zh) Lte小区参数的调整方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant