CN106709588A - 预测模型构建方法和设备以及实时预测方法和设备 - Google Patents

预测模型构建方法和设备以及实时预测方法和设备 Download PDF

Info

Publication number
CN106709588A
CN106709588A CN201510778908.XA CN201510778908A CN106709588A CN 106709588 A CN106709588 A CN 106709588A CN 201510778908 A CN201510778908 A CN 201510778908A CN 106709588 A CN106709588 A CN 106709588A
Authority
CN
China
Prior art keywords
data
association
various different
mode
modes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510778908.XA
Other languages
English (en)
Other versions
CN106709588B (zh
Inventor
祁仲昂
刘博�
胡卫松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to CN201510778908.XA priority Critical patent/CN106709588B/zh
Publication of CN106709588A publication Critical patent/CN106709588A/zh
Application granted granted Critical
Publication of CN106709588B publication Critical patent/CN106709588B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开涉及预测模型构建方法和设备以及实时预测方法和设备。所述预测模型构建方法包括:识别待训练数据中的多种不同的关联模式,其中多种不同的关联模式描述待训练数据中的影响因素与目标数据之间的多种不同的关联关系;利用与多种不同的关联模式相对应的多组数据分别进行训练,以得到适用于多种不同的关联模式的多个子预测模型;以及根据待训练数据构建多种不同的关联模式之间的关联模式转移模型,其中关联模式转移模型用于在预测过程中确定多个不同的子预测模型与待预测数据之间的匹配度。根据本公开的实施方式,可以得到与多种数据特征对应的多个预测模型,因此在预测时可以基于数据自身特征动态调整各个预测模型的权重,从而提高预测精度。

Description

预测模型构建方法和设备以及实时预测方法和设备
技术领域
本公开涉及预测技术领域,更特别地涉及一种用于构建预测模型的方法和设备以及用于执行实时预测的方法和设备。
背景技术
预测技术是当下的一个热点研究问题。预测技术可以在各个领域得到广泛应用,诸如空气质量预测、气候预测、交通流量预测等。根据数据的特点和预测的问题的不同,已经提出了各种不同的预测模型,例如基于参数的时间序列预测、神经网络、回归分析等。
传统的预测模型通常采用全局建模的方式,即利用一个统一的模型涵盖各种预测过程,并对自变量与因变量之间的关系进行建模。然而,数据中变量间的关联模式随着时间、空间的不同通常有着较大变化,而这类统一的模型难以涵盖数据中的所有情况,尤其是数据中的稀有事件。而这些事件往往会是预测中需要特别关注的重点,例如空气质量预测中的重度污染预测、交通流中的事故预测等。
传统的预测方法,如神经网络、回归分析等方法,通常首先采集一些真实数据作为样本,以用于训练模型,然后用训练好的模型进行预测。这样预测的准确度非常依赖于训练时所用样本数据的数量和质量。而且待预测的数据与训练样本特征差异较大时,其预测结果往往是不准确的。
多模型预测是传统的空气质量预测多采用的预测方式,这种预测方式已经被证明是有效的。例如,在US6535817B1中公开了一种基于多回归模型的气候预测方式。根据该专利中提出的技术方案,在训练过程中,首先针对历史气候数据执行预处理,以使其满足模型的输入和输出形式;接着随机地将数据划分为N个分组;然后,针对这N个分组进行训练以得到相应的N个预测模型;随后,基于历史气候数据针对这N个相应的预测模型进行评估,以便获得他们各自的历史性能。而在预测过程中,针对实时数据采用N个预测模型进行预测,以得到N个预测结果;然后,基于各个预测模型的历史性能对这N个预测结果进行加权平均;最后,将得到的平均结果作为最终预测结果进行存储。
在上述的美国专利所提出的技术中,采用了历史性能作为模型性能的度量。然而,实时预测是一个相当复杂的问题,例如对于空气质量而言,它不但受到最近历史空气质量因素和交通因素的影响,而且还受到实时气象因素的影响。因而,包括上述专利在内的现有技术中基于多模型的预测方法目前对于实时预测而言有效性仍然不太理想,其预测结果的准确性和可靠性依然较低。
为此,在现有技术中存在针对实时预测技术的方案进行改进的需要。
发明内容
有鉴于此,本公开公开了一种用于构建预测模型的方法和设备以及用于执行实时预测的方法和设备,以至少部分上消除或者缓解上述问题。
根据本公开的第一方面,提供了一种用于构建预测模型的方法。该方法包括:识别待训练数据中的多种不同的关联模式,其中所述多种不同的关联模式描述所述待训练数据中的影响因素与目标数据之间的多种不同的关联关系;利用与所述多种不同的关联模式相对应的多组数据分别进行训练,以得到适用于所述多种不同的关联模式的多个子预测模型;以及根据所述待训练数据构建所述多种不同的关联模式之间的关联模式转移模型。所述关联模式转移模型用于在预测过程中确定所述多个不同的子预测模型与待预测数据之间的匹配度。
在根据本公开的第一方面的实施方式中,所述识别待训练数据中的多种不同的关联模式包括:将所述待训练数据按照时间划分为多个数据分段;学习所述多个数据分段中的各个数据分段的关联模式;以及通过合并相似的关联模式和对应的数据分段来确定所述多种不同的关联模式。
在根据本公开的第一方面的另一实施方式中,所述确定所述多种不同的关联模式包括:基于层次聚类对所述各个数据分段的关联模式进行聚类。
在根据本公开的第一方面的另一实施方式中,所述关联模式转移模型描述所述多种不同的关联模式之间的模式转移的概率。
在根据本公开的第一方面的另一实施方式中,根据所述待训练数据构建所述多种不同的关联模式之间的关联模式转移模型包括:利用马尔科夫链模型按照最大似然性原则根据所述待训练数据来确定所述多种不同的关联模式之间的转移矩阵。
根据本公开的第二方面,提供了一种用于执行实时预测的方法。所述方法包括:利用多个不同的子预测模型针对实时数据执行预测,以得到多个初始预测结果,其中所述多个不同的子预测模型分别适用于多种不同的关联模式;基于所述多种不同的关联模式之间的关联模式转移模型确定所述实时数据与所述多个不同的子预测模型之间的匹配度;以及基于所述匹配度对所述多个初始预测结果进行加权平均,以确定针对所述实时数据的预测结果。
在根据本公开的第一方面的实施方式中,所述多个不同的子预测模型是通过识别待训练数据中的所述多种不同的关联模式并且利用与所述多种不同的关联模式相对应的多组数据分别进行训练而得到的。
在根据本公开的第一方面的另一实施方式中,所述关联模式转移模型描述所述多种不同的关联模式之间的模式转移的概率。
在根据本公开的第一方面的再一实施方式中,所述基于关联模式转移模型确定所述实时数据与所述多个不同的子预测模型之间的匹配度包括:通过根据所述实时数据之前的数据的关联模式以及所述多种不同的关联模式之间的模式转移的概率计算所述实时数据处于所述多种不同的关联模式的各个关联模式的概率,来确定所述匹配度。
根据本公开的第三方面,提供了一种用于构建预测模型的设备。所述设备包括:模式识别模块、模型训练模块和模型构建模块。所述模式识别模块被配置用于识别待训练数据中的多种不同的关联模式,其中所述多种不同的关联模式描述所述待训练数据中的影响因素与目标数据之间的多种不同的关联关系。所述模型训练模块被配置用于利用与所述多种不同的关联模式相对应的多组数据分别进行训练,以得到适用于所述多种不同的关联模式的多个子预测模型。所述模型构建模块被配置用于根据所述待训练数据构建所述多种不同的关联模式之间的关联模式转移模型,其中所述关联模式转移模型用于在预测过程中确定所述多个不同的子预测模型与待预测数据之间的匹配度。
根据本公开的第四方面,提供了一种用于执行实时预测的设备。所述设备包括:预测执行模块、匹配度确定模块和结果平均模块。所述预测执行模块被配置用于利用多个不同的子预测模型针对实时数据执行预测,以得到多个初始预测结果,其中所述多个不同的子预测模型分别适用于多种不同的关联模式。所述匹配度确定模块被配置用于基于所述多种不同的关联模式之间的关联模式转移模型确定所述实时数据与所述多个不同的子预测模型之间的匹配度。所述结果平均模块被配置用于基于所述匹配度对所述多个初始预测结果进行加权平均,以确定针对所述实时数据的预测结果。
根据本公开的第五方面,提供了一种计算程序产品,其上包括有计算机程序代码,当被加载到计算机设备中时,其可以使得该计算机设备执行根据本公开的第一方面的方法。
根据本公开的第六方面,提供了一种计算程序产品,其上包括有计算机程序代码,当被加载到计算机设备中时,其可以使得该计算机设备执行根据本公开的第二方面的方法。
根据本公开的第七方面,还提供一种用于构建预测模型的设备,所述设备包括存储器,和处理器,所述处理器可以被配置为执行根据本公开的第一方面的方法。
根据本公开的第八方面,还提供一种用于执行实时预测的设备,所述设备包括存储器,和处理器,所述处理器可以被配置为执行根据本公开的第二方面的方法。
根据本公开的实施方式,可以得到与多个关联模式对应的多个预测子模型,而所述关联模式能够反应数据本身的特征。因此在实时预测时,就可以基于实时数据本身的数据特征来动态调整各个预测子模型的权重,因而预测精度可以得到提高。
附图说明
通过对结合附图所示出的实施方式进行详细说明,本公开的上述以及其他特征将更加明显,本公开的附图中相同的标号表示相同或相似的部件。在附图中:
图1示意性地示出了根据本公开的一个实施方式的用于构建预测模型的方法的流程图;
图2示意性地示出了根据本公开的一个实施方式的样本集形成的示意图;
图3示意性地示出了根据本公开的一个实施方式的关联模式识别的流程图;
图4示意性地示出了根据本公开的一个实施方式的数据分段划分的示意图;
图5示意性地示出了根据本公开的一个实施方式的关联模式学习的示意图;
图6示意性地示出了根据本公开的一个实施方式的相似关联模式合并的示意图;
图7示意性地示出了根据本公开的一个实施方式的模型训练的示意图;
图8示意性地示出了根据本公开的一个实施方式的关联模式转移模型构建的示意图;
图9示意性地示出了根据本公开的一个实施方式的用于执行实时预测的方法的流程图;
图10示意性地示出了根据本公开的一个实施方式的用于匹配度计算的示意图;
图11示意性地示出了根据本公开的一个实施方式的预测结果平均的示意图;
图12示意性地示出了根据本公开的一个实施方式的预测系统的整体架构的方框图;
图13示意性地示出了根据本公开的一个实施方式的用于构建预测模型的设备的方框图;以及
图14示意性地示出了根据本公开的一个实施方式的用于执行实时预测的设备的方框图。
具体实施方式
在下文中,将参考附图详细描述本公开的各个示例性实施方式。应当注意,这些附图和描述涉及的仅仅是作为示例的优选实施方式。可以应该指出的是,根据随后的描述,很容易设想出此处公开的结构和方法的替换实施方式,并且可以在不脱离本公开要求保护的公开的原理的情况下使用这些替代实施方式。
应当理解,给出这些示例性实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本公开,而并非以任何方式限制本公开的范围。此外在附图中,出于说明的目的,将可选的步骤、模块、模块等以虚线框示出。
在此使用的术语“包括”、“包含”及类似术语应该被理解为是开放性的术语,即“包括/包含但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”。其他术语的相关定义将在下文描述中给出。
如前所述,在现有技术中,基于多模型的预测方法目前对于实时预测而言有效性仍然不太理想,其预测结果的准确性和可靠性依然较低。针对此问题,在本公开中提出一种新的技术方案,该方案是一种基于数据中的关联模式划分并组合使用多个预测模型的方法。根据该方案,将构建针对多种关联模式的多个预测模型,同时在实时预测时,将根据实时数据与预测模型之间的匹配程度动态调整各个预测模型的权重,以便提高预测精度。
在下文中,将参考附图对根据本公开的实施方式的用于预测模型构建和实时预测的方法和设备进行详细描述。然而,需要说明的是,这些描述是仅仅是出于说明的目的,本公开并不局限于这些实施方式和附图中的细节。此外,在下面的描述中,将主要参考空气质量预测对本公开的实施方式进行描述。然而需要说明的是,本公开也可能应用在其他预测场合,例如气候预测、交通流量预测等。
图1示意性地示出了根据本公开的一个实施方式的用于构建预测模型的方法的流程图。如图1所示,首先在步骤S101,识别待训练数据中的多种不同的关联模式。如图2所示,待训练数据可以是从整个历史时间序列数据中采样得到的数据,例如包括目标数据以及影响因素数据。目标数据是与预测对象对应的数据,例如在PM2.5预测的场景下,目标数据是PM2.5。影响因素是影响目标数据的因素,例如在PM2.5预测的场景下,影响因素可以是空气质量因素诸如CO、SO2,交通状况等。
目标数据及其影响因素的时间序列是由数据监测设备采集的一系列数据,诸如是气象数据、空气质量数据、交通数据、人口密度数据、污染源数据等的时间序列。可以清楚的是,对于不同的数据,不同时间序列通常具有不同的尺度、采集间隔等。因此,首先可以对采集得到的数据进行预处理,以便将其转化为待训练的样本集。例如,可以将在不同的时间(时间)和不同的位置(空间)采集得到的数据归一化为具有相同时间尺度的数据序列,从而得到样本集。Si=(Xi,Yi),即待训练数据,其中Xi代表影响因素,Yi代表目标数据。由于在预测时,影响因素是输入,目标数据是输出,所以在下文中也将Xi称为输入,将Yi称为输出。
影响因素Xi可以包括两个部分,即历史序列部分和未来序列部分。在给定预测索引y和时间步长L的情况下,可以将Xi表示如下:
(式1)
该式代表可以获得时刻i+R+1时刻的数据来预测Yi,并且其中代表第p个输入变量(例如空气质量,交通因素,比如CO和交通流量)在(i+t)时刻的历史序列部分;代表第q个输入变量(例如气象因素,诸如风力,湿度)在(i+t+L)时刻的未来序列部分。
Yi=yi+R-1+L代表在(i+R-1+L)时刻的预测项,其中L是在Xi之后的时间步长;R是输入变量的范围,R通常大于时间步长L。需要注意的是,在i+R-1时刻,空气质量和交通数据均是检测数据,因此,只能够使用截止到时刻i+R-1的历史数据;而气象数据可以是预测数据,因此可以使用直到(i+R-1+L)时刻的未来数据。
接着,可以针对训练的样本集Si=(Xi,Yi),执行关联模式识别。此处的术语“关联模式”指代在一个特定时段内的待训练数据中的影响因素与目标数据之间的关联关系。多种不同的关联模式将描述待训练数据中的影响因素与目标数据之间的多种不同的关联关系。以PM2.5预测为例,第一种关联模式可以指示一氧化碳CO对于PM2.5具有较大影响,第二种关联模式可以指示交通情况对于PM2.5具有较大影响,第三种关联模式可以指示温度对于PM2.5具有较大影响等等。相同的关联模式中的样本数据将具有共同的特征,因此这些样本将会形成一个特定的关联模式。
在下文中,将参考一个示例实施方式对关联模式识别进行详细描述,在该示例实施方式中,将基于Granger Lasso方法和层次聚类来实现关联模式识别。然而需要说明的是,这仅仅是出于说明的目的,本公开也有可能采用任何其他适当的手段和算法来定义和学习关联模式。
参考图3,首先在步骤S1011,将所述待训练数据按照时间划分为多个数据分段。这里如可以通过一个滑动时间窗口来实现。图4示意性地示出了根据本公开的一个实施方式的分段划分的示意图。如图4所示,该滑动时间窗口具有固定的长度Len例如为8,每次分段划分例如移动一个样本。这样就可以得到例如P个分段Seci,其中i=1至P。然而需要说明的是,分段长度和移动步长是为了说明的目的而给出的,本公开并不局限于此。
对于给定的窗口长度Len和样本集(S1,S2,...,Sn},样本集可以被划分为n-len+1个分段,其中Seci={Si,Si+1,...,Si+len-1}。
接着,在步骤S1012,学习所述多个数据分段中的各个数据分段的关联模式。换句话讲,针对每个数据分段,学习该组数据的关联模式。图5中示出了根据本公开的一个实施方式的关联模式学习的示意图。在该图中,采用的是Granger Lasso图模型方法。该GrangerLasso图模型方法的目标函数可以通过下面的式子来表示:
(式2)
其中为输入数据的向量,其由各个时间序列变量xi的一段数据组成;y为对应的输出;为系数向量,其反映了特定的输入xi与输出y之间的关联;n为待训练的各个数据分段的样本数目,λ为正则项系数。
将Granger Lasso方法应用于各个数据分段Seci,以便学习输入与输出之间的关联关系。结果将针对每个数据分段Seci得到一个对应的权重向量Wi,其中如图5所示。此处将Seci的关联模式表示为Pi,并使用该权重向量Wi作为关联模式Pi的特征空间。
然后,在步骤S1013,通过合并相似的关联模式和对应的数据分段来确定所述多种不同的关联模式。针对图5中得到的多个关联模式,可以确定他们之间的相似度,并基于相似阈值,来对这些关联模式进行合并,最终得到多种不同的关联模式PA-PQ
在根据本公开的一个实施方式中,关联模式之间的相似度可以通过特征空间中的每个元素的权重来计算。例如可以通过下面给出的式子来度量相似度:
(式3)
通过该式子可以确定出两个关联模式Wi和Wj之间的相似度。
在根据本公开的一个实施方式中,使用层次聚类对关联模式进行聚类。特别地,在初始状态时,每个关联模式Pi单独为一类,即Ci=Pi。此后,逐层地构造聚类树,在每一层将当前最相似的两个类聚为一个新的模式类,如图6所示。两个类Ca和Cb之间的相似度可以定义如下:
Sim_Ca,b=max{Sim_Pi,j|Pi∈Ca,Pj∈Cb}
(式4)
需要说明的是,按照上述定义,Sim_Ca,b越小,类Ca和Cb越相似。对于一个预定的相似度阈值δ,当某层出现min{Sim_Ca,b}>δ时,则该层聚类停止,这表示此时各个类之间已足够不相似。假设两个类Ca、Cb合并为新类Cab(对应的新关联模式记为Pab),则两个类对应的样本数据也被合并在一起,并且样本对应的关联模式也被更新为Pab
最终,假设我们得到了K个关联模式的聚类,记为对每一个聚类中的数据,重新用Granger Lasso方法计算出一个新的权重向量。这样将会得到K个对应的权重向量这K个权重向量就是对应的关联模式的特征空间。
这样,通过例如图3中所示的方法,就可以识别出待训练数据中的多个不同的关联模式。
现在返回继续参考图1。如图1所示,在识别出待训练数据中的多种不同的关联模式之后,可以在步骤S102,利用所述多种不同的关联模式相对应的对组数据分组分别进行训练,以得到适用于所述多种不同的关联模式的多个子预测模型。例如,可以针对得到的K个关联模式及其对应的K个数据分组,分别训练K个预测模型,如图7所示。预测模型可以根据数据情况进行不同的选择,如果分组中的数据量较小则使用Lasso回归模型,数据量较大,则可以使用深度神经网络模型。在下面将以Lasso回归模型为例进行说明。对于K种关联模式,可以学习K个Lasso回归模型。对于样本集为Seti={Si1,Si2,...,Sim}的Lasso回归模型的目标函数可以表示为:
(式5)
在选定的预测模型的情况下,利用待训练数据来训练模型可以采用本领域任何适当的方法,这对于本领域技术人员而言是已知的。因此,此处为了简化起见不再进行详细说明。
接下来,在步骤S103,根据所述待训练的数据构建多种不同的关联模式之间的关联模式转移模型。关联模式转移模型描述所述多种不同的关联模式之间的模式转移规律的模型,例如可以描述所述多种不同的关联模式之间的模式转移的概率。基于该模型,可以确定例如一个关联模式在下一步转移到各个关联模式的概率。
在本公开的一个实施方式中,利用马尔科夫链模型按照最大似然性原则根据所述待训练数据来确定所述多种不同的关联模式之间的转移矩阵。然而需要说明的是,也可以采用任何其他适当的技术来构建关联模式转移模型。特别地,对于每个历史样本,都存在一个对应的关联模式,这样可以针对样本集和得到关联模式的序列:
{S1,S2,...,Sn}→{P(1),P(2),...,P(n)},
(式6)
其中St为t时刻的样本;P(t)为t时刻的关联模式。根据Markov链模型,一阶转移矩阵A可以按最大似然估计原则计算如下:
(式7)
其中表示转移到的次数。这样就得到了关联模式转移模型,例如如图8所示。然而需要说明的是,尽管在上式5中给出了一阶转移矩阵,但是本公开不仅限于此,也有可能采用更高阶矩阵。
这样,通过上面给出的方法,可以得到适用于多种不同模式的子预测模型,并且获得了多种不同的关联模式之间的模式转移模型。该模式转移模型可以用于在预测过程中确定所述多个不同的子预测模型与待预测数据之间的匹配度。这样,执行预测时,就可以基于待预测的实时数据与各个子预测模型的匹配度来动态调整各个预测子模型的权重。在下文中,将继续参考图9至图11来描述本公开中提供的一种用于执行实时预测的方法。
参考图9,首先在步骤S901,利用多个不同的子预测模型针对实时数据执行预测,以得到多个初始预测结果。所述多个不同的子预测模型分别适用于多种不同的关联模式。因此,在该步骤使用的子预测模型与传统方法中使用的多个预测模型是不同的。传统方法中使用的多个预测模型是通过训练随机划分的数据分组而得到的多个预测模型,而本公开中的多个子预测模型,是针对各个不同的关联模式的子模型。当监测的实时数据输入时,可以利用在训练阶段得到的多个不同的子预测模型分别执行预测,这样可以得到多个初始预测结果。
接着,在步骤S902可以基于所述多种不同的关联模式之间的关联模式转移模型确定所述实时数据与所述多个不同的子预测模型之间的匹配度。例如,对于t时刻的实时数据St,时刻t之前一段时间的数据序列为{St-k,...,St-1},对应的关联模式序列为{P{t-k},...,P(t-1)}。此处使用idx(t)指示P(t)的下标,例如则idx(t-k)=3);使用f(j)指示的转移概率,则f(j)可以被表示为:
(式8)
其中A(t-i)为(t-i)-阶转移矩阵,且其可以被计算为C-K函数A(n)=A(n-1)A。这样,对于实时数据St,其属于各个关联模式的概率为f(i)。
在根据本公开的一个方式中,直接使用该概率f(i)来表示实时数据St与关联模式之间的匹配度Di,即Di=f(i)。然而,需要说明的是,本公开并不局限于此。事实上,匹配度Di也可以是基于该概率f(i)通过其他方式计算得到的值。换言之匹配度Di可以是概率f(i)的函数。匹配度Di反映了实时数据St属于一个特定的关联模式的概率的大小。Di越大,则该实时数据与该关联模式越为匹配。因此,Di越大,也就意味着该实时数据与适用于该关联模式的预测模型更为匹配,该预测模型的可靠性越高。在下面将参考图10来描述匹配度计算的是一个示例。
参考图10,该图示意性地示出了根据本公开的一个实施方式的用于匹配度计算的示意图。如图10所示,对于实时数据S100,其之前时间最近的三个样本S99,S98和S97的关联模式分别为P2、P3和P1。基于这三个样本的关联模式和转移概率矩阵,并利用式6中示出的转移概率计算公式,可以确定出实时样本S100与P1、P2、P3和P4的匹配度分别为0.79、1.08、0.47和0.66。也就是说,该实时数据S100与关联模式P2具有最大的匹配度而与关联模式P3具有最小的匹配度。
返回参考图9,然后在步骤S903,基于所述匹配度对上面所述的多个初始预测结果进行加权平均,以确定出针对所述实时数据的最终预测结果。例如,对于K个初始预测结果,可以利用K个对应的关联模式匹配度对初始预测结果进行加权平均。
该预测结果平均例如可以通过以下方式来执行。首先,可以针对得到的K个匹配度执行归一化,该归一化可以通过下面的式子给出:
(式9)
然后利用归一化后的匹配度执行加权平均,因此最后的输出结过可以通过下面的式子表示:
Rfinal=ΣD_normi·Ri
其中Ri指示利用多个预测模型得到的多个预测结果。
出于说明的目的,在图11中示出了根据本公开的一个实施方式的预测结果加权平均的示意图。如图11所示,其中初始的预测结果A至Q分别利用对应的匹配度值(0.79,0.47,…,1.08)进行加权平均,进而将加权平均后的输出作为最终预测结果。最后,可以实时存储最终的预测结果。
需要说明的是,在上面的描述中,将步骤S901描述为在S902之前进行操作。然而,本公开并不局限于此,实际上步骤S902也有可能在步骤S901之前执行,或者并行地执行两个步骤。
下面将参考图12来描述根据本公开的一个实施方式的预测系统的整体架构的方框图,以使得本领域技术人员对于本公开的预测系统的总体架构有个更加深入的理解。如图12所示,该预测系统架构可以被划分为训练过程和预测过程,其中在训练过程中将使用历史数据进行训练,以确定出针对多个不同的关联模式的多个子预测模型以及多个不同的关联模式之间的关联转移模型。在预测阶段中,将基于训练过程中得到的预测模型和关联模式转移模型执行预测。
具体地,如图12所示,在训练过程中,首先针对历史数据执行预处理,以便对各种数据执行归一化。接着,执行关联模式识别,例如可以通过滑动时间窗间该数据划分为P个数据分段,然后学习每个数据分段的关联模式;接着对相似的关联模式进行合并,进而得到K种关联模式。然后针对每种关联模式,利用对应的数据分组执行训练,进而得到多个预测模型,即预测模型A至K。与此同时,可以根据历史数据构建K种不同的关联模式之间的关联模式转移模型。在预测过程中,针对采集到的实时数据,基于在训练阶段得到多个预测模型执行实时预测,进而得到多个初始预测结果,即预测结果A至预测结果K。同时,可以例如基于式5和关联模式转移模型计算出该实时数据与多个预测模型之间的匹配度。然后基于计算的匹配度对预测结果A至预测结果K进行加权平均,并最终将经过加权平均的预测结果作为最终预测结果输出。
从上文中针对本公开的实施方式的描述可以看出,在本公开中,可以得到与多个关联模式对应的多个预测子模型,而所述关联模式能够反应出数据本身的特征。因此在实时预测时,就可以基于实时数据本身的数据特征来动态调整各个预测子模型的权重,因而预测精度可以得到提高。
在上文中,针对本公开中提供过的用于构建预测模型的方法和用于实时预测的方法进行了描述。此外,本公开中还提供了一种用于构建预测模型的设备和一种用于执行实时预测的设备。在下文中将参考图13和图14对这些设备进行详细地描述。
图13示出了根据本公开的一个实施方式的用于构建预测模型的设备的方框图。该设备1300包括模式识别模块1310、模型训练模块1320以及模型构建模块1330。所述模式识别模块1310可以被配置用于识别待训练数据中的多种不同的关联模式,其中所述多种不同的关联模式描述所述待训练数据中的影响因素与目标数据之间的多种不同的关联关系。所述模型训练模块1320可以被配置用于利用与所述多种不同的关联模式相对应的多组数据分别进行训练,以得到适用于所述多种不同的关联模式的多个子预测模型。所述模型构建模块1330可以被配置用于根据所述待训练数据构建所述多种不同的关联模式之间的关联模式转移模型,其中所述关联模式转移模型用于在预测过程中确定所述多个不同的子预测模型与待预测数据之间的匹配度。所述关联模式转移模型可以描述所述多种不同的关联模式之间的模式转移规律。特别地,在一个实施方式中,所述关联模式转移模型可以描述所述多种不同的关联模式之间的模式转移的概率。
此外,所述模式识别模块1310可以进一步包括数据划分模块1312、模式学习模块1314和模式确定模块1316。所述数据划分模块1312可以被配置用于将所述待训练数据按照时间划分为多个数据分段。所述模式学习模块1314可以被配置用于学习所述多个数据分段中的各个数据分段的关联模式。所述模式确定模块1316可以被配置用于通过合并相似的关联模式和对应的数据分段来确定所述多种不同的关联模式。
另外,所述模式确定模块1316进一步被配置用于通过基于层次聚类对所述各个数据分段的关联模式进行聚类来确定出所述多种不同的关联模式。
在一个实施方式中,所述模型构建模块1330可以被配置用于:利用马尔科夫链模型按照最大似然性原则根据所述待训练数据,来确定所述多种不同的关联模式之间的转移矩阵。
接着参考图14,图14示意性地示出了根据本公开的一个实施方式的用于实时预测的设备的方框图。如图14所示,设备1400包括结果预测模块1410、匹配度确定模块1420和结果平均模块1430。所述结果预测模块1410可以被配置用于利用多个不同的子预测模型针对实时数据执行预测,以得到多个初始预测结果,其中所述多个不同的子预测模型分别适用于多种不同的关联模式。所述匹配度确定模块1420可以被配置用于基于所述多种不同的关联模式之间的关联模式转移模型确定所述实时数据与所述多个不同的子预测模型之间的匹配度。所述结果平均模块1430可以被配置用于基于所述匹配度对所述多个初始预测结果进行加权平均,以确定针对所述实时数据的预测结果。所述多个不同的子预测模型可以是通过识别待训练数据中的所述多种不同的关联模式并且利用与所述多种不同的关联模式相对应的多组数据分别进行训练而得到的。另外,所述关联模式转移模型可以描述所述多种不同的关联模式之间的模式转移规律。特别地,在一个实施方式中,所述关联模式转移模型可以描述所述多种不同的关联模式之间的模式转移的概率。
此外,所述匹配度确定模块1420可以被配置为:通过根据所述实时数据之前的数据的关联模式以及所述多种不同的关联模式之间的模式转移的概率计算所述实时数据处于所述多种不同的关联模式的各个关联模式的概率,来确定所述匹配度。
需要说明的是,上面参考图13和14所描述的设备1300和1400中的各个模块可以被配置为执行与参考图1至图12所描述的方法相对应的操作。因此,此处不再详细描述设备1300和1400的各个模块的具体操作。关于这些模块的具体操作的细节,可以参考结合图1至图12针对相应方法的各个步骤进行的描述。
另外还需理解的是,本公开的实施方式可以以软件、硬件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的方法和设备可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本实施例的设备及其组件可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。
虽然已经参考目前考虑到的实施方式描述了本公开,但是应该理解本公开不限于所公开的实施方式。相反,本公开旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。以下权利要求的范围符合最广泛解释,以便包含所有这样的修改及等同结构和功能。

Claims (18)

1.一种用于构建预测模型的方法,包括:
识别待训练数据中的多种不同的关联模式,其中所述多种不同的关联模式描述所述待训练数据中的影响因素与目标数据之间的多种不同的关联关系;
利用与所述多种不同的关联模式相对应的多组数据分别进行训练,以得到适用于所述多种不同的关联模式的多个子预测模型;以及
根据所述待训练数据构建所述多种不同的关联模式之间的关联模式转移模型,其中所述关联模式转移模型用于在预测过程中确定所述多个不同的子预测模型与待预测数据之间的匹配度。
2.根据权利要求1所述的方法,其中所述识别待训练数据中的多种不同的关联模式包括:
将所述待训练数据按照时间划分为多个数据分段;
学习所述多个数据分段中的各个数据分段的关联模式;以及
通过合并相似的关联模式和对应的数据分段来确定所述多种不同的关联模式。
3.根据权利要求2所述的方法,其中所述确定所述多种不同的关联模式包括:基于层次聚类对所述各个数据分段的关联模式进行聚类。
4.根据权利要求1至3任一项所述的方法,其中所述关联模式转移模型描述所述多种不同的关联模式之间的模式转移的概率。
5.根据权利要求4所述的方法,其中根据所述待训练数据构建所述多种不同的关联模式之间的关联模式转移模型包括:利用马尔科夫链模型按照最大似然性原则根据所述待训练数据来确定所述多种不同的关联模式之间的转移矩阵。
6.一种用于执行实时预测的方法,包括:
利用多个不同的子预测模型针对实时数据执行预测,以得到多个初始预测结果,其中所述多个不同的子预测模型分别适用于多种不同的关联模式;
基于所述多种不同的关联模式之间的关联模式转移模型确定所述实时数据与所述多个不同的子预测模型之间的匹配度;以及
基于所述匹配度对所述多个初始预测结果进行加权平均,以确定针对所述实时数据的预测结果。
7.根据权利要求6所述的方法,其中所述多个不同的子预测模型是通过识别待训练数据中的所述多种不同的关联模式并且利用与所述多种不同的关联模式相对应的多组数据分别进行训练而得到的。
8.根据权利要求6或7所述的方法,其中所述关联模式转移模型描述所述多种不同的关联模式之间的模式转移的概率。
9.根据权利要求8所述的方法,其中所述基于关联模式转移模型确定所述实时数据与所述多个不同的子预测模型之间的匹配度包括:通过根据所述实时数据之前的数据的关联模式以及所述多种不同的关联模式之间的模式转移的概率计算所述实时数据处于所述多种不同的关联模式的各个关联模式的概率,来确定所述匹配度。
10.一种用于构建预测模型的设备,包括:
模式识别模块,被配置用于识别待训练数据中的多种不同的关联模式,其中所述多种不同的关联模式描述所述待训练数据中的影响因素与目标数据之间的多种不同的关联关系;
模型训练模块,被配置用于利用与所述多种不同的关联模式相对应的多组数据分别进行训练,以得到适用于所述多种不同的关联模式的多个子预测模型;以及
模型构建模块,被配置用于根据所述待训练数据构建所述多种不同的关联模式之间的关联模式转移模型,其中所述关联模式转移模型用于在预测过程中确定所述多个不同的子预测模型与待预测数据之间的匹配度。
11.根据权利要求10所述的设备,其中所述模式识别模块进一步包括:
数据划分模块,被配置用于将所述待训练数据按照时间划分为多个数据分段;
模式学习模块,被配置用于学习所述多个数据分段中的各个数据分段的关联模式;以及
模式确定模块,被配置用于通过合并相似的关联模式和对应的数据分段来确定所述多种不同的关联模式。
12.根据权利要求11所述的设备,其中所述模式确定模块进一步被配置用于:基于层次聚类对所述各个数据分段的关联模式进行聚类。
13.根据权利要求10至12任一项所述的设备,其中所述关联模式转移模型描述所述多种不同的关联模式之间的模式转移的概率。
14.根据权利要求13所述的设备,其中所述模型构建模块被配置用于:利用马尔科夫链模型按照最大似然性原则根据所述待训练数据来确定所述多种不同的关联模式之间的转移矩阵。
15.一种用于执行实时预测的设备,包括:
结果预测模块,被配置用于利用多个不同的子预测模型针对实时数据执行预测,以得到多个初始预测结果,其中所述多个不同的子预测模型分别适用于多种不同的关联模式;
匹配度确定模块,被配置用于基于所述多种不同的关联模式之间的关联模式转移模型确定所述实时数据与所述多个不同的子预测模型之间的匹配度;以及
结果平均模块,被配置用于基于所述匹配度对所述多个初始预测结果进行加权平均,以确定针对所述实时数据的预测结果。
16.根据权利要求15所述的设备,其中所述多个不同的子预测模型是通过识别待训练数据中的所述多种不同的关联模式并且利用与所述多种不同的关联模式相对应的多组数据分别进行训练而得到的。
17.根据权利要求15或16所述的设备,其中所述关联模式转移模型描述所述多种不同的关联模式之间的模式转移的概率。
18.根据权利要求17所述的设备,其中所述匹配度确定模块被配置为:通过根据所述实时数据之前的数据的关联模式以及所述多种不同的关联模式之间的模式转移的概率计算所述实时数据处于所述多种不同的关联模式的各个关联模式的概率,来确定所述匹配度。
CN201510778908.XA 2015-11-13 2015-11-13 预测模型构建方法和设备以及实时预测方法和设备 Active CN106709588B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510778908.XA CN106709588B (zh) 2015-11-13 2015-11-13 预测模型构建方法和设备以及实时预测方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510778908.XA CN106709588B (zh) 2015-11-13 2015-11-13 预测模型构建方法和设备以及实时预测方法和设备

Publications (2)

Publication Number Publication Date
CN106709588A true CN106709588A (zh) 2017-05-24
CN106709588B CN106709588B (zh) 2022-05-17

Family

ID=58931354

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510778908.XA Active CN106709588B (zh) 2015-11-13 2015-11-13 预测模型构建方法和设备以及实时预测方法和设备

Country Status (1)

Country Link
CN (1) CN106709588B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019037260A1 (zh) * 2017-08-20 2019-02-28 平安科技(深圳)有限公司 预测模型建立装置、方法及计算机可读存储介质
CN110414713A (zh) * 2019-06-27 2019-11-05 电子科技大学 一种基于同步数据流压缩的径流实时预测方法
CN110968889A (zh) * 2018-09-30 2020-04-07 中兴通讯股份有限公司 一种数据保护方法、设备、装置和计算机存储介质
CN111000544A (zh) * 2019-11-22 2020-04-14 北京航空航天大学 基于ppg波形的混合式连续血压测量模型构建方法及系统
CN111197838A (zh) * 2018-10-31 2020-05-26 Tcl集团股份有限公司 一种空调节能控制方法、装置及服务器
CN111242280A (zh) * 2020-01-06 2020-06-05 北京拙河科技有限公司 一种深度强化学习模型的组合方法、装置及计算机设备
CN115576502A (zh) * 2022-12-07 2023-01-06 苏州浪潮智能科技有限公司 一种数据存储的方法、装置、电子设备以及存储介质
CN117688501A (zh) * 2024-02-03 2024-03-12 南京创蓝科技有限公司 一种矫正空气质量预报系统的误差方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009086706A (ja) * 2007-09-27 2009-04-23 Fujitsu Ltd モデル作成支援システム、モデル作成支援方法、モデル作成支援プログラム
CN103426026A (zh) * 2013-09-10 2013-12-04 信阳师范学院 一种混合神经网络预测及识别景区气象要素的方法
CN103473460A (zh) * 2013-09-16 2013-12-25 华东理工大学 液化石油气裂解关键产品收率预测及原料优化方法
CN104714977A (zh) * 2013-12-17 2015-06-17 日本电气株式会社 一种实体与知识库项的关联方法及装置
CN104850531A (zh) * 2014-02-19 2015-08-19 日本电气株式会社 一种建立数学模型的方法和装置
CN104866932A (zh) * 2015-06-12 2015-08-26 哈尔滨工业大学 基于预测模型适用性判断的时间序列预测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009086706A (ja) * 2007-09-27 2009-04-23 Fujitsu Ltd モデル作成支援システム、モデル作成支援方法、モデル作成支援プログラム
CN103426026A (zh) * 2013-09-10 2013-12-04 信阳师范学院 一种混合神经网络预测及识别景区气象要素的方法
CN103473460A (zh) * 2013-09-16 2013-12-25 华东理工大学 液化石油气裂解关键产品收率预测及原料优化方法
CN104714977A (zh) * 2013-12-17 2015-06-17 日本电气株式会社 一种实体与知识库项的关联方法及装置
CN104850531A (zh) * 2014-02-19 2015-08-19 日本电气株式会社 一种建立数学模型的方法和装置
CN104866932A (zh) * 2015-06-12 2015-08-26 哈尔滨工业大学 基于预测模型适用性判断的时间序列预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
许辉: "基于数据挖掘的空气质量预测模型研究与实现", 《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019037260A1 (zh) * 2017-08-20 2019-02-28 平安科技(深圳)有限公司 预测模型建立装置、方法及计算机可读存储介质
CN110968889A (zh) * 2018-09-30 2020-04-07 中兴通讯股份有限公司 一种数据保护方法、设备、装置和计算机存储介质
CN111197838A (zh) * 2018-10-31 2020-05-26 Tcl集团股份有限公司 一种空调节能控制方法、装置及服务器
CN110414713A (zh) * 2019-06-27 2019-11-05 电子科技大学 一种基于同步数据流压缩的径流实时预测方法
CN111000544A (zh) * 2019-11-22 2020-04-14 北京航空航天大学 基于ppg波形的混合式连续血压测量模型构建方法及系统
CN111242280A (zh) * 2020-01-06 2020-06-05 北京拙河科技有限公司 一种深度强化学习模型的组合方法、装置及计算机设备
CN115576502A (zh) * 2022-12-07 2023-01-06 苏州浪潮智能科技有限公司 一种数据存储的方法、装置、电子设备以及存储介质
CN117688501A (zh) * 2024-02-03 2024-03-12 南京创蓝科技有限公司 一种矫正空气质量预报系统的误差方法

Also Published As

Publication number Publication date
CN106709588B (zh) 2022-05-17

Similar Documents

Publication Publication Date Title
CN106709588A (zh) 预测模型构建方法和设备以及实时预测方法和设备
CN110164128B (zh) 一种城市级智能交通仿真系统
Hong et al. A hybrid deep learning-based neural network for 24-h ahead wind power forecasting
Zhang et al. Temperature forecasting via convolutional recurrent neural networks based on time-series data
CN111148118B (zh) 基于时间序列的流量预测和载波关断方法和系统
CN107909206B (zh) 一种基于深层结构循环神经网络的pm2.5预测方法
CN108596327B (zh) 一种基于深度学习的地震速度谱人工智能拾取方法
Salehin et al. An Artificial intelligence based rainfall prediction using LSTM and neural network
CA2821103A1 (en) Method and system for adaptive forecast of wind resources
CN114139760B (zh) 一种预测台风路径的方法、系统、存储介质及设备
Tong et al. Short-term prediction of the intensity and track of tropical cyclone via ConvLSTM model
CN107798431A (zh) 一种基于改进Elman神经网络的中长期径流预报方法
CN113988263A (zh) 工业物联网边缘设备中基于知识蒸馏的空时预测方法
CN111884867A (zh) 基于循环生成式对抗网络的机会网络拓扑预测方法及装置
CN114565187A (zh) 一种基于图时空自编码网络的交通路网数据预测方法
Patel et al. Precipitation nowcasting: Leveraging bidirectional lstm and 1d cnn
Raimundo et al. Prediction of weather forecast for smart agriculture supported by machine learning
Viswanath et al. Deep learning based LSTM and SeqToSeq models to detect monsoon spells of India
CN109829583A (zh) 基于概率编程技术的山火风险预测方法
CN113240219A (zh) 一种土地利用模拟及预测方法
CN117394350A (zh) 短期电力负荷预测方法、装置、设备及介质
Alam Recurrent neural networks in electricity load forecasting
Sharma et al. Deep Learning Based Prediction Of Weather Using Hybrid_stacked Bi-Long Short Term Memory
CN115017990B (zh) 一种交通流量预测方法、装置、设备及存储介质
Hoomod et al. Temperature Prediction Using Recurrent Neural Network for Internet of Things Room Controlling Application

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant