CN111915082A

CN111915082A - 一种预测方法、装置、存储介质及设备

Info

Publication number: CN111915082A
Application number: CN202010767379.4A
Authority: CN
Inventors: 朴松梅
Original assignee: Shenzhen Jizhi Digital Technology Co Ltd
Current assignee: Shenzhen Jizhi Digital Technology Co Ltd
Priority date: 2020-08-03
Filing date: 2020-08-03
Publication date: 2020-11-10
Anticipated expiration: 2040-08-03
Also published as: CN111915082B

Abstract

本申请公开了一种预测方法、装置、存储介质及设备，在获取待预测事件在预设时间范围内的初始值以及所述初始值对应的属性值后，先根据初始值与初始值对应的属性值之间的相关系数，确定i个有效属性值，然后对这i个有效属性值进行降维处理，并从这i个有效属性值中筛选得到j个降维后的有效属性值，进而，可以将这j个降维后的有效属性值输入预先构建的事件预测模型，得到待预测事件的预测结果；其中，事件预测模型是根据历史时间下的事件初始值和历史时间下的事件初始值对应的属性值构建的。从而使得该事件预测模型能够准确地预测出任一时刻下待预测事件的结果，提高了待预测事件的预测准确性和效率(例如提高了电力负荷预测的准确性和效率)。

Description

一种预测方法、装置、存储介质及设备

技术领域

本申请涉及数据处理技术领域，尤其涉及一种预测方法、装置、存储介质及设备。

背景技术

电力市场需求预测工作是国家能源主管部门和电网企业的一项重要基础性工作，为国家能源监测与管理、电网企业生产计划与经营管理提供重要的支撑依据。其中，电力负荷预测一直是困扰电力供应的难题。然而，如何准确地预测需求(例如，电力负荷等需求)是一个亟待解决的技术问题。

发明内容

为解决上述技术问题，本申请实施例提供一种预测方法及装置，能够准确地预测电力市场需求(例如，供电量和/或电价)。本发明的主要思路是基于与待预测电力网络(例如新兴的太阳能或风电发电网络)相近似的其他类型电力网络(例如传统火电或水电发电网络)的各种属性(地理位置、所属区域等) 与待预测量之间已有的数据，以及不同类型电力网络之间的关联系数，完成所述预测工作。

第一方面，本申请实施例提供了一种预测方法，包括：

获取待预测事件在预设时间范围内的初始值以及所述初始值对应的属性值；

根据所述初始值与所述初始值对应的属性值之间的相关系数，确定i个有效属性值；其中，所述i为大于0的正整数；

对所述i个有效属性值进行降维处理，从所述i个有效属性值中筛选得到 j个降维后的有效属性值；其中，所述j为大于0的正整数，所述j小于所述i；

将所述j个降维后的有效属性值输入预先构建的事件预测模型，得到所述待预测事件的预测结果；其中，所述事件预测模型是根据所述历史时间下的事件初始值和所述历史时间下的事件初始值对应的属性值构建的。

一种可能的实现方式中，所述根据所述初始值与所述初始值对应的属性值之间的相关系数，确定i个有效属性值，包括：

利用所述初始值与所述初始值对应的属性值之间的最大相关系数，构建线性回归模型，并确定所述线性回归模型对应的第一拟合优度；以及将所述最大相关系数对应的属性值作为有效属性值；

将所述初始值与所述初始值对应的属性值之间的非最大相关系数，输入所述线性回归模型，得到所述线性回归模型对应的第二拟合优度；

当所述第二拟合优度小于所述第一拟合优度时，将所述非最大相关系数对应的属性值作为有效属性值。

将大于预设阈值的相关系数对应的属性值作为有效属性值。

一种可能的实现方式中，所述对所述i个有效属性值进行降维处理，从所述i个有效属性值中筛选得到j个降维后的有效属性值，包括：

利用主成分分析PCA降维方法，对所述i个有效属性值进行降维处理，从所述i个有效属性值中筛选得到j个降维后的有效属性值。

一种可能的实现方式中，所述将所述j个降维后的有效属性值输入预先构建的事件预测模型，得到所述待预测事件的预测结果，包括：

将所述j个降维后的有效属性值输入预先构建的N种事件预测模型，得到所述待预测事件的N种预测结果；其中，所述N为大于0的正整数；

从所述N种预测结果中选择综合得分最高的预测结果作为所述待预测事件的预测结果。

一种可能的实现方式中，所述N为3；所述N种事件预测模型为3种事件预测模型；所述3种事件预测模型分别为套索LASSO回归模型、岭Ridge 回归模型和Elastic Net回归模型。

第二方面，本申请实施例还提供了一种预测装置，包括：

获取单元，用于获取待预测事件在预设时间范围内的初始值以及所述初始值对应的属性值；

确定单元，用于根据所述初始值与所述初始值对应的属性值之间的相关系数，确定i个有效属性值；其中，所述i为大于0的正整数；

降维单元，用于对所述i个有效属性值进行降维处理，从所述i个有效属性值中筛选得到j个降维后的有效属性值；其中，所述j为大于0的正整数，所述j小于所述i；

获得单元，用于将所述j个降维后的有效属性值输入预先构建的事件预测模型，得到所述待预测事件的预测结果；其中，所述事件预测模型是根据所述历史时间下的事件初始值和所述历史时间下的事件初始值对应的属性值构建的。

一种可能的实现方式中，所述确定单元包括：

构建子单元，用于利用所述初始值与所述初始值对应的属性值之间的最大相关系数，构建线性回归模型，并确定所述线性回归模型对应的第一拟合优度；以及将所述最大相关系数对应的属性值作为有效属性值；

输入子单元，用于将所述初始值与所述初始值对应的属性值之间的非最大相关系数，输入所述线性回归模型，得到所述线性回归模型对应的第二拟合优度；

作为子单元，用于当所述第二拟合优度小于所述第一拟合优度时，将所述非最大相关系数对应的属性值作为有效属性值。

一种可能的实现方式中，所述确定单元具体用于：

将大于预设阈值的相关系数对应的属性值作为有效属性值。

一种可能的实现方式中，所述降维单元具体用于：

一种可能的实现方式中，所述获得单元包括：

获得子单元，用于将所述j个降维后的有效属性值输入预先构建的N种事件预测模型，得到所述待预测事件的N种预测结果；其中，所述N为大于0 的正整数；

选择子单元，用于从所述N种预测结果中选择综合得分最高的预测结果作为所述待预测事件的预测结果。

一种可能的实现方式中，所述N种事件预测模型为3种事件预测模型；所述3种事件预测模型分别为套索LASSO回归模型、岭Ridge回归模型和 Elastic Net回归模型。

本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行上述的预测方法。

本申请实施例还提供了一种预测设备，包括：存储器，处理器，及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时，实现上述的预测方法。

本申请实施例提供的一种预测方法、装置、存储介质及设备，首先获取待预测事件在预设时间范围内的初始值以及所述初始值对应的属性值，然后，根据初始值与初始值对应的属性值之间的相关系数，确定i个有效属性值；其中，i为大于0的正整数，接着，对这i个有效属性值进行降维处理，并从这i个有效属性值中筛选得到j个降维后的有效属性值；其中，j为大于0的正整数，且j小于i，进而，可以将这j个降维后的有效属性值输入预先构建的事件预测模型，得到待预测事件的预测结果；其中，事件预测模型是根据历史时间下的事件初始值和历史时间下的事件初始值对应的属性值构建的。从而使得该事件预测模型能够准确地预测出任一时刻下待预测事件的结果，提高了待预测事件的预测准确性和效率(例如提高了电力负荷预测的准确性和效率)。

并且，由于本申请是先利用待预测事件在预设时间范围内的初始值与对应的属性值之间的相关系数，确定出了i个有效属性值，再将对这i个有效属性值进行降维处理后得到的j个降维后的有效属性值作为事件预测模型的输入数据进行预测，从而能够消除模型的过拟合问题，进一步提高了待预测事件的预测准确性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种预测方法的流程示意图；

图2为本申请实施例提供的碎石图的示意图；

图3为本申请实施例提供的另一种预测方法的流程图；

图4为本申请实施例提供的又一种预测方法的流程图；

图5为本申请实施例提供的一种预测装置的结构示意图。

具体实施方式

发明人经过研究发现，目前的预测方法通常较为繁琐，且效率低下，较为依赖人工进行预测，主观性强、难以量化，不仅预测的效率低，预测的准确性也不高。

以城市圈层未来的房价为例，当前业界判断城市圈层未来房价的方法通常是考虑与房价相关的各个因素(如带看量、流拍率等)对房价的影响程度及滞后月份，来预测城市圈层未来房价。其中，以将带看量设置为例，二手房带看数据代表着市场火热程度，带看量越高，说明市场越火热，对价格是正向作用，所以可以通过监控圈层二手房带看量来预测房价。类似的，土拍溢价率越高说明市场越火热，对价格也是正向作用，所以可以通过监控土拍溢价率来预测房价。而流拍率越高说明开发商对市场不看好，对房价是反向作用，同样可以通过监控流拍率来预测房价。依次类推，在考虑到一系列与房价相关的各个因素之后，可以根据各个影响因素的正向作用或负向作用来判断未来房价的涨跌。

但目前大都通过人工进行预测，无法定量地判断哪些因素影响程度高，哪些因素影响程度低，以及影响的具体时间等，即，对每个因素的正/负向程度无法量化。比如，假设二手房带看量为100，但不清楚该数值是正向作用还是负向作用，作用程度也不好衡量。并且，各个因素与房价之间关系也无法量化。比如，假设一个因素的涨幅为10％，那对应的房价的涨幅或者降幅却是无法确定的。另外，各个因素之间的影响权重也无法量化。比如，一个具有正向作用的因素，叠加一个具有负向作用的因素，得到的结果对房价是正向作用还是负向作用也是无法确定的。全都依靠人工来判断，主观性太强且难以量化，不仅预测的效率低，预测的准确性也不高，无法达到很好的预测效果。

为解决上述缺陷，本申请实施例提供了一种预测方法，首先获取待预测事件在预设时间范围内的初始值以及所述初始值对应的属性值，然后，根据初始值与初始值对应的属性值之间的相关系数，确定i个有效属性值；其中，i为大于0的正整数，接着，对这i个有效属性值进行降维处理，并从这i个有效属性值中筛选得到j个降维后的有效属性值；其中，j为大于0的正整数，且j 小于i，进而，可以将这j个降维后的有效属性值输入预先构建的事件预测模型，得到待预测事件的预测结果；其中，事件预测模型是根据历史时间下的事件初始值和历史时间下的事件初始值对应的属性值构建的。从而使得该事件预测模型能够准确地预测出任一时刻下待预测事件的结果，提高了待预测事件的预测准确性和效率(例如提高了电力负荷预测的准确性和效率)。

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

第一实施例

参见图1，为本实施例提供的一种预测方法的流程示意图，该方法包括以下步骤：

S101：获取待预测事件在预设时间范围内的初始值以及所述初始值对应的属性值。

本申请实施例中，待预测事件可以是在应用场景下参与预测的事件。当应用场景为电力市场时，则待预测事件可以是新兴的太阳能供电量或者风力发电网络的供电量；或者，当应用场景为城市圈层新房交易场景时，则待预测事件可以为城市新房的成交月均价等。

预设时间范围是指预先设置的待预测事件之前的事件曾经发生的一段时间，而且，预设时间范围可以包括几年、几月和几日中的至少一个。例如，预设时间范围可以为待预测事件之前的3个月。

待预测事件在预设时间范围内的初始值指的是事件在预设时间范围内发生时对应的值，例如，可以是过去三个月中城市新房的成交月均价。

待预测事件在预设时间范围内的初始值对应的属性值指的是用于表征在应用场景下预设时间范围内参与预测的事件的属性信息(或者是影响因素)。例如，应用场景为电力市场需求预测时，则待预测事件在预设时间范围内的对应的属性值可以为过去三个月中城市的月均电价；或者，应用场景为城市圈层新房交易场景，待预测事件在预设时间范围内的初始值是过去三个月中城市新房的成交月均价，则待预测事件在预设时间范围内的初始值对应的属性值可以是过去三个月中的成交量(万/平米)、成交价格(元)、取证量、预售证价、出清周期、带看量、总成交套数、供求比、流拍率等。

S102：根据初始值与所述初始值对应的属性值之间的相关系数，确定i个有效属性值；其中，i为大于0的正整数。

在本实施例中，通过步骤S101获取到待预测事件在预设时间范围内的初始值以及所述初始值对应的属性值后，首先需要计算初始值与所述初始值对应的属性值之间的相关系数，具体计算公式如下：

其中，Y表示待预测事件在预设时间范围内的初始值；X表示该初始值Y 对应的属性值；cov(X,Y)表示X和Y的协方差；Var[X]表示X的方差；Var[Y]表示Y的方差；r(X,Y)表示X和Y的相关系数。

然后，利用现有或未来出现的数据处理方法，对每一属性值对应的相关系数进行处理，以确定出i个有效属性值，用以执行后续步骤S102，以解决后续预测过程可能存在的过拟合问题。其中，i为大于0的正整数。

具体来讲，一种可选的实现方式是，本步骤S102的具体实现过程可以包括下述步骤A1-A3：

步骤A1：利用初始值与所述初始值对应的属性值之间的最大相关系数，构建线性回归模型，并确定线性回归模型对应的第一拟合优度；以及将最大相关系数对应的属性值作为有效属性值。

在本实现方式中，为了确定出有效属性值，首先需要将初始值与所述初始值对应的属性值之间的相关系数进行排序，并选择出其中最大的相关系数，然后利用该最大的相关系数及其对应属性值(此处将其定义为X₁)进行线性回归建模，以构建线性回归模型，具体构建过程与现有方法一致，在此不再赘述。并且，此处可以将该线性回归模型的方程表示为f(x)＝ax+c。其中，a和c 表示方程的系数。进而可以确定出该线性回归方程对应的拟合优度的计算公式如下：

其中，J(X)表示属性值X对应的拟合优度，用于表征上述线性回归方程 f(X)对观测值(即属性值)X的拟合程度，J(X)越小，表明线性回归方程f(X) 对观测值(即属性值)X的拟合程度越好，误差率越低，反之，J(X)越大，表明线性回归方程f(X)对观测值(即属性值)X的拟合程度越差，误差率越高。

将最大的相关系数对应的属性值X₁代入上述公式(2)，可得到拟合优度 J(X₁)，此处将其定义为第一拟合优度，用以执行后续步骤A3。

需要说明的是，由于属性值X₁与初始值的相关系数最高，表明属性值X₁对初始值的影响程度最高，进而可以将最大相关系数对应的属性值X₁作为一个有效属性值。

步骤A2：将初始值与所述初始值对应的属性值之间的非最大相关系数，输入线性回归模型，得到线性回归模型对应的第二拟合优度。

在本实现方式中，通过步骤A1利用最大的相关系数及其对应的属性值 X₁构建了线性回归模型以及对应的模型方程f(x)＝ax+c后，进一步可以将其它非最大相关系数及其对应的属性值X₂输入线性回归模型，并通过上述公式 (2)计算线性回归模型对应的拟合优度(此处将其定义为第二拟合优度 J(X₂))，用以执行后续步骤A3。

步骤A3：当第二拟合优度小于所述第一拟合优度时，将非最大相关系数对应的属性值作为有效属性值。

在本实现方式中，通过步骤A2得到第二拟合优度J(X₂)后，进一步需要判断第二拟合优度J(X₂)是否小于第一拟合优度J(X₁)，若是，则表明属性值X₂对应的误差率较低，利用该属性值X₂可以提高模型的拟合优度，进一步有助于提高后续预测结果的准确性，由此，可以将属性值X₂作为一个有效属性值。但若第二拟合优度J(X₂)不小于第一拟合优度J(X₁)，则表明属性值X₂对应的误差率高于属性值X₁对应的误差率，利用该属性值X₂不能提高模型的拟合优度，进一步也不会提高后续预测结果的准确性，由此，不能将属性值X₂作为一个有效属性值。

举例说明：假设最大相关系数为0.8，其对应的第一拟合优度J(0.8)，非最大相关系数为0.7，其对应的第一拟合优度J(0.7)，则若J(0.7)小于J(0.8)，则可以将0.7对应的属性值作为有效属性值，反之，若J(0.7)不小于J(0.8)，则不能将0.7对应的属性值作为有效属性值。

此外，另一种可选的实现方式是，本步骤S102的具体实现过程还可以包括：将大于预设阈值的相关系数对应的属性值作为有效属性值。

在本实现方式中，预设阈值指的是预先设定一个相关系数的临界值，若相关系数大于该临界值，则表明该相关系数对应的属性值能够提高模型的拟合优度，进一步也能够提高后续预测结果的准确性，所以可以将大于预设阈值的相关系数对应的属性值作为有效属性值。反之，若相关系数不大于该临界值，则表明该相关系数对应的属性值不能够提高模型的拟合优度，进一步也不能提高后续预测结果的准确性，所以不能将不大于预设阈值的相关系数对应的属性值作为有效属性值。

举例说明：假设预设阈值为0.7，则可以将所有大于0.7的相关系数对应的属性值均作为有效属性值。

这样，通过上述步骤S102可以从获取到的所有属性值中初步确定出i个有效属性值，以初步消除过拟合的问题。比如，假设获取到的所有属性值为 70个，则可以通过步骤S102确定出其中的35个有效属性值，用以执行后续步骤S103。

S103：对i个有效属性值进行降维处理，从i个有效属性值中筛选得到j 个降维后的有效属性值；其中，j为大于0的正整数，j小于i。

在本实施例中，为了进一步消除过拟合的问题，通过步骤S102初步确定出i个有效属性值后，进一步，还需要对这i个有效属性值进行降维处理，以从这i个有效属性值中筛选得到j个降维后的有效属性值；其中，j为大于0 的正整数，j小于i。

具体来讲，一种可选的实现方式是，可以利用主成分分析PCA降维方法，对i个有效属性值进行降维处理，从i个有效属性值中筛选得到j个降维后的有效属性值。

在本实现方式中，将获取到的待预测事件的相关数据条目定义为m条，并将每一有效属性值定义为一个维度，从而可以这些数据构成m条i维的矩阵，并将该矩阵定义为Z，再将Z的每一维属性归一化，然后，计算协方差矩阵

及特征值、特征向量。接着，将特征向量对应特征值从大到小排列成矩阵，取前k行组成矩阵P。然后通过公式Y＝PZ计算出降维后的新数据。

其中，k的取值能够直接影响模型的拟合效果。可通过如图2所示的碎石图来确定k的取值。如图2所示，在主轴因素法中，公共因素的方差贡献等于该因素对应的特征根的值，计算累积方差贡献率可用计算累积特征根百分比来代替。据此，可从中选择出贡献度平稳的拐点来确定k值。如图2所示，可选择31、33或35作为k值。

需要说明的是，利用PCA进行降维的具体的实现过程，与现有方法一致，在此不再赘述。

这样，通过上述步骤S103可以从i个有效属性值椎间盘每个筛选得到j 个降维后的有效属性值，用以执行后续步骤S104，以初进一步消除过拟合的问题。比如，假设通过步骤S102初步确定出35个有效属性值，则可以通过步骤S103确定出其中的20个降维后的有效属性值，用以执行后续步骤S104。

S104：将j个降维后的有效属性值输入预先构建的事件预测模型，得到待预测事件的预测结果；其中，事件预测模型是根据历史时间下的事件初始值和历史时间下的事件初始值对应的属性值构建的。

在本实施例中，通过步骤S103得到j个降维后的有效属性值后，进一步可将其作为输入数据，输入预先构建的事件预测模型，以通过模型输出待预测事件的预测结果。

其中，事件预测模型是根据历史时间下的事件初始值和历史时间下的事件初始值对应的属性值构建的，具体构建过程与现有模型构建过程一致，在此不再赘述，例如，可以根据过去三个月内城市新房的成交月均价和该均价对应的成交量(万/平米)、成交价格(元)、取证量、预售证价、出清周期、带看量、总成交套数、供求比、流拍率等影响因素，构建预测未来城市新房成交月均价的预测模型。且本申请对该模型的具体结构不做限制，可以是支持向量回归模型、集成梯度下降回归模型(gradient boosting regressor)、贝叶斯回归模型 (Bayes)、岭(Ridge)回归模型或套索(LASSO)回归模型等。

具体来讲，为了提高预测结果的准确性，一种可选的实现方式是，本步骤 S104的具体实现过程可以包括下述步骤B1-B2：

步骤B1：将j个降维后的有效属性值输入预先构建的N种事件预测模型，得到待预测事件的N种预测结果；其中，N为大于0的正整数。

在本实现方式中，为了提高预测结果的准确性，进一步消除模型过拟合的问题，可以预先构建N种事件预测模型，进而可以将得到的j个降维后的有效属性值分别输入这N种事件预测模型，以确定出待预测事件的N种预测结果，用以执行后续步骤B2。

其中，一种可选的实现方式是，可以将N取值为3，则预先构建的3种事件预测模型分别可以为套索(LASSO)回归模型、岭(Ridge)回归模型和Elastic Net回归模型。

基于此，在将得到的j个降维后的有效属性值分别输入这些事件预测模型后，可以利用模型输出的预测结果，确定每一事件预测模型对应的拟合优度、预测误差率以及预设时间范围内(如近三个月内)的预测准确率。其中，模型对应的拟合优度表示模型对预设时间范围内历史数据的拟合效果；预测误差率表示模型对未来的预测效果；预设时间范围内的预测准确率表示对预设时间范围内的预测效果，以待预测事件为预测房价为例，过于近期(如近三个月内) 的预测准确率相较于过于久远(如2年前)的预测准确率更有参考价值。

步骤B2：从N种预测结果中选择综合得分最高的预测结果作为待预测事件的预测结果。

通过步骤B1不仅能够得到待预测事件的N种预测结果，还可以根据模型输出的预测结果，确定每一事件预测模型对应的拟合优度、预测误差率以及预设时间范围内的预测准确率，则进一步可以对每一事件预测模型对应的拟合优度、预测误差率以及预设时间范围内的预测准确率分别进行打分，并可以利用预设的统计方式(如直接求和、或加权求和等方式)计算出每一事件预测模型的综合得分，该综合得分越高，表明该模型的预测效果越好，进而可以从这N 种预测结果中选择出综合得分最高的预测结果作为待预测事件的预测结果。

举例说明：假设N取值为3，预先构建的3种事件预测模型分别可以为 LASSO回归模型、Ridge回归模型和Elastic Net回归模型。且计算出的LASSO 回归模型对应的拟合优度、预测误差率以及预设时间范围内的预测准确率的得分为70、80、75；Ridge回归模型对应的拟合优度、预测误差率以及预设时间范围内的预测准确率的得分为78、75、82；ElasticNet回归模型对应的拟合优度、预测误差率以及预设时间范围内的预测准确率的得分为74、77、88，以及预设的统计方式为直接求和，则可以计算出LASSO回归模型、Ridge回归模型和Elastic Net回归模型输出的3中预测结果对应的综合得分分别为：225 (即70+80+75＝225)、235(即78+75+82＝235)、239(即74+77+88＝239)。可见得分最高的是Elastic Net回归模型对应的239，从而可以将该模型输出的预测结果作为待预测事件的预测结果。

综上，本实施例提供的一种预测方法，首先获取待预测事件在预设时间范围内的初始值以及所述初始值对应的属性值，然后，根据初始值与初始值对应的属性值之间的相关系数，确定i个有效属性值；其中，i为大于0的正整数，接着，对这i个有效属性值进行降维处理，并从这i个有效属性值中筛选得到j 个降维后的有效属性值；其中，j为大于0的正整数，且j小于i，进而，可以将这j个降维后的有效属性值输入预先构建的事件预测模型，得到待预测事件的预测结果；其中，事件预测模型是根据历史时间下的事件初始值和历史时间下的事件初始值对应的属性值构建的。从而使得该事件预测模型能够准确地预测出任一时刻下待预测事件的结果，提高了待预测事件的预测准确性和效率(例如提高了电力负荷预测的准确性和效率)。

第二实施例

本实施例将结合具体的应用场景对本申请第一实施例提供的一种预测方法进行详细说明。以下将以城市新房的成交月均价作为待预测事件为例进行说明，参见图3，为本申请实施例提供的另一种预测方法的流程图，该预测方法可以包括以下步骤：

S301：获取城市新房在预设时间范围内的成交月均价以及所述成交月均价对应的属性值。

本申请实施例中，应用场景为城市圈层新房交易场景，待预测事件为城市新房的成交月均价，城市新房在预设时间范围内的成交月均价指的是过去预设时间范围内城市新房的成交月均价，比如，可以是过去三个月内每个月城市新房的成交月均价。

而该成交月均价对应的属性值指的是过去预设时间范围内对城市新房的成交月均价产生影响的因素。需要说明的是，一种可选的实现方式是，本实施例中，可以将每个月影响城市新房成交月均价的因素确定为以下25个因素：成交量(万/平米)、成交价格(元)、取证量、预售证价、出清周期、带看量、总成交套数、成交均价、挂牌量、存量(万平米)、供求比、二手房调价房源总套数、二手房降价房源占调价房源总套数比例、平均参拍家数、平均竞拍轮次、平均成交土地溢价率、流拍率、成交土地规划建面(万㎡)、1级总客储量、2级总客储量、1转2转化率、2转认购转换率、当月新供(套)-开盘套数和、当月去化(套)-认购套数和新供去化率(认购套数和/开盘套数和)。

S302：根据城市新房在预设时间范围内的成交月均价与所述成交月均价对应的属性值之间的相关系数，确定i个有效属性值；其中，i为大于0 的正整数。

在本实施例中，通过步骤S301获取到城市新房在预设时间范围内(如近 3个月中每一个月)的成交月均价以及所述成交月均价对应的属性值后，首先需要利用上述第一实施例中的公式(1)计算出预设时间范围内的成交月均价与其对应的各个属性值之间的相关系数。

然后，利用现有或未来出现的数据处理方法，对每一属性值对应的相关系数进行处理，以确定出i个有效属性值，用以执行后续步骤S302，以解决后续预测过程可能存在的过拟合问题。其中，i为大于0的正整数。

具体来讲，一种可选的实现方式是，本步骤S302的具体实现过程可以包括下述步骤S3021-S3023：

S3021：利用城市新房在预设时间范围内的成交月均价与所述成交月均价对应的属性值之间的相关系数，构建线性回归模型，并确定线性回归模型对应的第一拟合优度；以及将最大相关系数对应的属性值作为有效属性值。

在本实现方式中，为了确定出有效属性值，首先需要将城市新房在预设时间范围内的成交月均价与所述成交月均价对应的属性值之间的相关系数进行排序，并选择出其中最大的相关系数，然后利用该最大的相关系数及其对应属性值(此处将其定义为X’₁)进行线性回归建模，以构建线性回归模型，具体构建过程与现有方法一致，在此不再赘述。并且，此处可以将该线性回归模型的方程表示为f'(x)＝a'x+c'。其中，a'和c表示方程的系数。进而可以利用上述第一实施例中的公式(2)确定出该线性回归方程对应的拟合优度。

进而将最大的相关系数对应的属性值X’₁代入上述公式(2)，可得到拟合优度J(X’₁)，此处将其定义为第一拟合优度，用以执行后续步骤A3。

需要说明的是，由于属性值X’₁与城市新房在预设时间范围内的成交月均价的相关系数最高，表明属性值X’₁对城市新房在预设时间范围内的成交月均价的影响程度最高，进而可以将属性值X’₁作为一个有效属性值。

S3022：将城市新房在预设时间范围内的成交月均价与所述成交月均价对应的属性值之间的非最大相关系数，输入线性回归模型，得到线性回归模型对应的第二拟合优度。

在本实现方式中，通过步骤S3021利用最大的相关系数及其对应的属性值 X’₁构建了线性回归模型以及对应的模型方程f'(x)＝a'x+c'后，进一步可以将其它非最大相关系数及其对应的属性值X’₂输入线性回归模型，并计算出对应的拟合优度(此处将其定义为第二拟合优度J(X’₂))，用以执行后续步骤S3023。

S3023：当第二拟合优度小于所述第一拟合优度时，将非最大相关系数对应的属性值作为有效属性值。

在本实现方式中，通过步骤S3022得到第二拟合优度J(X’₂)后，进一步需要判断第二拟合优度J(X’₂)是否小于第一拟合优度J(X’₁)，若是，则表明属性值X’₂对应的误差率较低，利用该属性值X’₂可以提高模型的拟合优度，进一步有助于提高后续预测结果的准确性，由此，可以将属性值X’₂作为一个有效属性值。但若第二拟合优度X’₂不小于第一拟合优度J(X’₁)，则表明属性值X’₂对应的误差率高于属性值X’₁对应的误差率，利用该属性值X’₂不能提高模型的拟合优度，进一步也不会提高后续预测结果的准确性，由此，不能将属性值X’₂作为一个有效属性值。

举例说明：假设最大相关系数为0.9，其对应的第一拟合优度J(0.9)，非最大相关系数为0.8，其对应的第一拟合优度J(0.8)，则若J(0.8)小于J(0.9)，则可以将0.8对应的属性值作为有效属性值，反之，若J(0.8)不小于J(0.9)，则不能将0.8对应的属性值作为有效属性值。

此外，另一种可选的实现方式是，本步骤S302的具体实现过程还可以包括：将大于预设阈值的相关系数对应的属性值作为有效属性值。

举例说明：假设预设阈值为0.6，则可以将所有大于0.6的相关系数对应的属性值均作为有效属性值。

这样，通过上述步骤S302可以从获取到的所有属性值中初步确定出i个有效属性值，以初步消除过拟合的问题。比如，假设获取到的所有属性值为 70个，则可以通过步骤S302确定出其中的35个有效属性值，用以执行后续步骤S303。

S303：对i个有效属性值进行降维处理，从i个有效属性值中筛选得到 j个降维后的有效属性值；其中，j为大于0的正整数，j小于i。

在本实施例中，为了进一步消除过拟合的问题，通过步骤S302初步确定出i个有效属性值后，进一步，还需要对这i个有效属性值进行降维处理，以从这i个有效属性值中筛选得到j个降维后的有效属性值；其中，j为大于0 的正整数，j小于i。

具体来讲，一种可选的实现方式是，可以利用PCA降维方法，对i个有效属性值进行降维处理，从i个有效属性值中筛选得到j个降维后的有效属性值。

在本实现方式中，将获取到的待预测事件的相关数据条目定义为m条，并将每一有效属性值定义为一个维度，从而可以这些数据构成m条i维的矩阵，并将该矩阵定义为Z₁，再将Z₁的每一维属性归一化，然后，计算协方差矩阵

及特征值、特征向量。接着，将特征向量对应特征值从大到小排列成矩阵，取前k₁行组成矩阵P₁。然后通过公式Y＝P₁Z₁计算出降维后的新数据。

其中，k₁的取值能够直接影响模型的拟合效果。可通过如图2所示的碎石图来确定k₁的取值。即，可选择31、33或35作为k值。

这样，通过上述步骤S303可以从i个有效属性值椎间盘每个筛选得到j 个降维后的有效属性值，用以执行后续步骤S304，以初进一步消除过拟合的问题。比如，假设通过步骤S302初步确定出35个有效属性值，则可以通过步骤S303确定出其中的20个降维后的有效属性值，用以执行后续步骤S304。

S304：将j个降维后的有效属性值输入预先构建的房价预测模型，得到城市新房成交月均价的预测结果；其中，房价预测模型是根据历史时间下的城市新房的成交月均价和历史时间下的城市新房的成交月均价对应的属性值构建的。

在本实施例中，通过步骤S303得到j个降维后的有效属性值后，进一步可将其作为输入数据，输入预先构建的房价预测模型，以通过模型输出城市新房成交月均价的预测结果。

其中，房价预测模型是根据历史时间下的城市新房的成交月均价和历史时间下的城市新房的成交月均价对应的属性值构建的，具体构建过程与现有模型构建过程一致，在此不再赘述，例如，可以根据过去三个月内每个月城市新房的成交月均价和该均价对应的成交量(万/平米)、成交价格(元)、取证量、预售证价、出清周期、带看量、总成交套数、供求比、流拍率等25个影响因素，构建预测未来城市新房成交月均价的房价预测模型。且本申请对该房价预测模型的具体结构不做限制，可以是Ridge回归模型或LASSO回归模型等。

具体来讲，为了提高预测结果的准确性，一种可选的实现方式是，本步骤 S304的具体实现过程可以包括下述步骤S3041-S3042：

S3041：将j个降维后的有效属性值输入预先构建的N种房价预测模型，得到城市新房成交月均价的N种预测结果；其中，N为大于0的正整数。

在本实现方式中，为了提高预测结果的准确性，进一步消除模型过拟合的问题，可以预先构建N种房价预测模型，进而可以将得到的j个降维后的有效属性值分别输入这N种房价预测模型，以确定出城市新房成交月均价的N种预测结果，用以执行后续步骤S3042。

其中，一种可选的实现方式是，可以将N取值为3，且预先构建的3种事件预测模型分别为LASSO回归模型、Ridge回归模型和Elastic Net回归模型。

基于此，在将得到的j个降维后的有效属性值分别输入这些房价预测模型后，可以利用模型输出的预测结果，确定每一房价预测模型对应的拟合优度、预测误差率以及预设时间范围内(如近三个月内)的预测准确率。其中，模型对应的拟合优度表示模型对预设时间范围内城市新房成交月均价的拟合效果；预测误差率表示模型对未来城市新房成交月均价的预测效果；预设时间范围内的预测准确率表示对预设时间范围内城市新房成交月均价的预测效果，需要说明的是，对于城市新房成交月均价的预测来说，过于近期(如近三个月内)的预测准确率相较于过于久远(如2年前)的预测准确率更有参考价值。

S3042：从N种预测结果中选择综合得分最高的预测结果作为城市新房成交月均价的预测结果。

通过步骤S3041不仅能够得到城市新房成交月均价的N种预测结果，还可以根据模型输出的预测结果，确定每一房价预测模型对应的拟合优度、预测误差率以及预设时间范围内的预测准确率，则进一步可以对每一房价预测模型对应的拟合优度、预测误差率以及预设时间范围内的预测准确率分别进行打分，并可以利用预设的统计方式(如直接求和、或加权求和等方式)计算出每一房价预测模型的综合得分，该综合得分越高，表明该模型的预测效果越好，进而可以从这N种预测结果中选择出综合得分最高的模型输出的预测结果作为城市新房成交月均价的预测结果。

综上，本实施例提供的一种城市新房的成交月均价预测方法，首先获取城市新房在预设时间范围内的成交月均价以及所述成交月均价对应的属性值，然后，根据城市新房在预设时间范围内的成交月均价与所述成交月均价对应的属性值之间的相关系数，确定i个有效属性值；其中，i为大于0的正整数，接着，对这i个有效属性值进行降维处理，并从这i个有效属性值中筛选得到j 个降维后的有效属性值；其中，j为大于0的正整数，且j小于i，进而，可以将j个降维后的有效属性值输入预先构建的房价预测模型，得到城市新房成交月均价的预测结果；其中，房价预测模型是根据历史时间下的城市新房的成交月均价和历史时间下的城市新房的成交月均价对应的属性值构建的。从而使得该房价预测模型能够准确地预测出任一月份城市新房的成交月均价，提高了城市新房的成交月均价的预测准确性和效率。

并且，由于本申请是先利用城市新房在预设时间范围内的成交月均价以及所述成交月均价对应的属性值之间的相关系数，确定出了i个有效属性值，再将对这i个有效属性值进行降维处理后得到的j个降维后的有效属性值作为房价预测模型的输入数据进行预测，从而能够消除模型的过拟合问题，进一步提高了城市新房的成交月均价的预测准确性。

第三实施例

本实施例将结合具体的应用场景对本申请第一实施例提供的一种预测方法进行详细说明。以下将以城市的月均供电量作为待预测事件为例进行说明，参见图4，为本申请实施例提供的又一种预测方法的流程图，该预测方法可以包括以下步骤：

S401：获取城市在预设时间范围内的月均供电量以及所述月均供电量对应的属性值。

其中，城市在预设时间范围内的月均供电量对应的属性值指的是过去预设时间范围内对城市的月均供电量产生影响的因素。如城市的气温、人口等。

S402：根据城市在预设时间范围内的月均供电量与所述成交月均价对应的属性值之间的相关系数，确定i个有效属性值；其中，i为大于0的正整数。

S403：对i个有效属性值进行降维处理，从i个有效属性值中筛选得到j个降维后的有效属性值；其中，j为大于0的正整数，j小于i。

S404：将j个降维后的有效属性值输入预先构建的供电量预测模型，得到城市月均供电量的预测结果；其中，供电量预测模型是根据历史时间下的城市的月均供电量和历史时间下的城市的月均供电量对应的属性值构建的。

需要说明的是，因本申请实施例提供的城市的月均供电量方法与上述第二实施例提供的城市新房的成交月均价预测方法类似，为了简要起见，S401可以采用上述方法实施例二中S301的具体实施方式、S402可以采用上述方法实施例二中S302的具体实施方式、以及S403可以采用上述方法实施例二中S303的具体实施方式，只需将城市新房的成交月均价替换为城市的月均供电量，将房价替换为供电量即可。

还需要说明的是，本申请提供的预测方法不仅可以应用于城市新房交易市场需求预测场景或电力市场需求预测场景，还可以应用于其他应用场景。

第四实施例

本实施例将对一种预测装置进行介绍，相关内容请参见上述方法实施例。

参见图5，为本实施例提供的一种预测装置的组成示意图，该装置包括：

获取单元501，用于获取待预测事件在预设时间范围内的初始值以及所述初始值对应的属性值；

确定单元502，用于根据所述初始值与所述初始值对应的属性值之间的相关系数，确定i个有效属性值；其中，所述i为大于0的正整数；

降维单元503，用于对所述i个有效属性值进行降维处理，从所述i个有效属性值中筛选得到j个降维后的有效属性值；其中，所述j为大于0的正整数，所述 j小于所述i；

获得单元504，用于将所述j个降维后的有效属性值输入预先构建的事件预测模型，得到所述待预测事件的预测结果；其中，所述事件预测模型是根据所述历史时间下的事件初始值和所述历史时间下的事件初始值对应的属性值构建的。

在本实施例的一种实现方式中，所述确定单元502包括：

在本实施例的一种实现方式中，所述确定单元502具体用于：

将大于预设阈值的相关系数对应的属性值作为有效属性值。

在本实施例的一种实现方式中，所述降维单元503具体用于：

在本实施例的一种实现方式中，所述获得单元504包括：

在本实施例的一种实现方式中，所述N种事件预测模型为3种事件预测模型；所述3种事件预测模型分别为套索LASSO回归模型、岭Ridge回归模型和Elastic Net回归模型。

综上，本实施例提供的一种预测装置，首先获取待预测事件在预设时间范围内的初始值以及所述初始值对应的属性值，然后，根据初始值与初始值对应的属性值之间的相关系数，确定i个有效属性值；其中，i为大于0的正整数，接着，对这i个有效属性值进行降维处理，并从这i个有效属性值中筛选得到 j个降维后的有效属性值；其中，j为大于0的正整数，且j小于i，进而，可以将这j个降维后的有效属性值输入预先构建的事件预测模型，得到待预测事件的预测结果；其中，事件预测模型是根据历史时间下的事件初始值和历史时间下的事件初始值对应的属性值构建的。从而使得该事件预测模型能够准确地预测出任一时刻下待预测事件的结果，提高了待预测事件的预测准确性和效率 (例如提高了电力负荷预测的准确性和效率)。

另外，本申请实施例还提供了一种计算机可读存储介质，所述机算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行上述的预测方法。

本申请实施例还提供了一种预测设备，包括：存储器，处理器，及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时，实现如上述的预测方法。

本申请实施例还提供了一种计算机程序产品，所述计算机程序产品在终端设备上运行时，使得所述终端设备执行所述的预测方法。

当介绍本申请的各种实施例的元件时，冠词“一”、“一个”、“这个”和“所述”都意图表示有一个或多个元件。词语“包括”、“包含”和“具有”都是包括性的并意味着除了列出的元件之外，还可以有其它元件。

需要说明的是，本领域普通技术人员可以理解实现上述方法实施例中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法实施例的流程。其中，所述存储介质可为磁碟、光盘、只读存储记忆体 (Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory, RAM)等。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元及模块可以是或者也可以不是物理上分开的。另外，还可以根据实际的需要选择其中的部分或者全部单元和模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述仅是本申请的具体实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

1.一种预测方法，其特征在于，包括：

对所述i个有效属性值进行降维处理，从所述i个有效属性值中筛选得到j个降维后的有效属性值；其中，所述j为大于0的正整数，所述j小于所述i；

2.根据权利要求1所述的方法，其特征在于，所述根据所述初始值与所述初始值对应的属性值之间的相关系数，确定i个有效属性值，包括：

3.根据权利要求1所述的方法，其特征在于，所述根据所述初始值与所述初始值对应的属性值之间的相关系数，确定i个有效属性值，包括：

将大于预设阈值的相关系数对应的属性值作为有效属性值。

4.根据权利要求1所述的方法，其特征在于，所述对所述i个有效属性值进行降维处理，从所述i个有效属性值中筛选得到j个降维后的有效属性值，包括：

5.根据权利要求1至4任一项所述的方法，其特征在于，所述将所述j个降维后的有效属性值输入预先构建的事件预测模型，得到所述待预测事件的预测结果，包括：

6.根据权利要求5所述的方法，其特征在于，所述N为3；所述N种事件预测模型为3种事件预测模型；所述3种事件预测模型分别为套索LASSO回归模型、岭Ridge回归模型和Elastic Net回归模型。

7.一种预测装置，其特征在于，包括：

8.根据权利要求7所述的装置，其特征在于，所述确定单元包括：

9.根据权利要求7所述的装置，其特征在于，所述确定单元具体用于：

将大于预设阈值的相关系数对应的属性值作为有效属性值。

10.根据权利要求7所述的装置，其特征在于，所述降维单元具体用于：

11.根据权利要求7至10任一项所述的装置，其特征在于，所述获得单元包括：

获得子单元，用于将所述j个降维后的有效属性值输入预先构建的N种事件预测模型，得到所述待预测事件的N种预测结果；其中，所述N为大于0的正整数；

12.根据权利要求11所述的装置，其特征在于，所述N为3；所述N种事件预测模型为3种事件预测模型；所述3种事件预测模型分别为套索LASSO回归模型、岭Ridge回归模型和Elastic Net回归模型。

13.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行权利要求1-6任一项所述的预测方法。

14.一种预测设备，其特征在于，包括：存储器，处理器，及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时，实现如权利要求1-6任一项所述的预测方法。