CN111160663A

CN111160663A - 一种预测方法及装置

Info

Publication number: CN111160663A
Application number: CN201911415641.2A
Authority: CN
Inventors: 李增阳
Original assignee: Shenzhen Jizhi Digital Technology Co Ltd
Current assignee: Shenzhen Jizhi Digital Technology Co Ltd
Priority date: 2019-12-31
Filing date: 2019-12-31
Publication date: 2020-05-15
Anticipated expiration: 2039-12-31
Also published as: CN111160663B

Abstract

本申请实施例公开了一种预测方法及装置，可以通过两个训练完成的模型去分别计算第一预测属性和预测系数，第一预测属性由待预测事件的初始属性以及关联事件的属性预测规律确定，预测系数能够体现待预测事件和关联事件的相关性，因此本申请能够为自动对待预测事件的属性进行预测，为待预测事件的属性预测提供统一的运算方式，提高待预测事件的属性预测准确性和效率(例如提高了电力负荷预测的准确性和效率)。

Description

一种预测方法及装置

技术领域

本发明涉及数据处理技术领域，特别是涉及一种预测方法及装置。

背景技术

电力市场需求预测工作是国家能源主管部门和电网企业的一项重要基础性工作，为国家能源监测与管理、电网企业生产计划与经营管理提供重要的支撑依据。其中，电力负荷预测一直是困扰电力供应的难题。然而，如何准确地预测需求(例如，电力负荷等需求)是一个亟待解决的技术问题。

发明内容

为解决上述技术问题，本申请实施例提供一种预测方法及装置，能够准确地预测电力市场需求(例如，供电量和/或电价)。本发明的主要思路是基于与待预测电力网络(例如新兴的太阳能或风电发电网络)相近似的其他类型电力网络(例如传统火电或水电发电网络)的各种属性(地理位置、所属区域等)与待预测量之间已有的数据，以及不同类型电力网络之间的关联系数，完成所述预测工作。

本申请实施例提供了一种预测方法，包括：

将所述待预测事件的初始属性输入第一模型，得到所述第一模型输出的所述待预测事件的第一预测属性；所述第一模型基于所述待预测事件的关联事件的初始属性和实际属性训练得到；

将所述待预测事件的初始属性输入第二模型，得到所述第二模型输出的所述待预测事件相对于所述关联事件的预测系数；所述第二模型基于与所述待测事件对应的历史事件的初始属性，以及所述历史事件相对于所述关联事件的相关系数训练得到；

利用所述预测系数和所述第一预测属性，得到所述待预测事件的第二预测属性。

可选的，所述历史事件相对于所述关联事件的相关系数为，所述历史事件的实际属性和所述历史事件的第一预测属性的比值；所述历史事件的第一预测属性为将所述历史事件的初始属性输入所述第一模型得到的。

可选的，在所述将所述待预测事件的初始属性输入第一模型，得到第一模型输出的所述待预测事件的第一预测属性之前，所述方法还包括：

将所述待预测事件的初始属性输入聚类模型，根据所述聚类模型输出的聚类结果，确定所述待预测事件所属的类别，并确定相应类别的第一模型和关联事件。

可选的，所述将所述待预测事件的初始属性输入第二模型，得到所述第二模型输出的所述待预测事件相对于所述关联事件的预测系数，包括：

将所述待预测事件的初始属性，以及所述待预测事件的第一预测属性和/或所述待预测事件所属的类别输入第二模型，得到所述第二模型输出的所述待预测事件相对于所述关联事件的预测系数。

可选的，所述聚类模型为kmeans聚类模型。

可选的，所述第一模型为套索回归模型，所述第一模型通过十折交叉验证的方式训练得到。

可选的，所述第二模型为支持向量回归模型、集成梯度下降回归模型、贝叶斯回归模型、岭回归模型、套索回归模型中的至少一种。

本申请实施例提供了一种预测装置，包括：

第一预测属性获取单元，用于将所述待预测事件的初始属性输入第一模型，得到所述第一模型输出的所述待预测事件的第一预测属性；所述第一模型基于所述待预测事件的关联事件的初始属性和实际属性训练得到；

预测系数获取单元，用于将所述待预测事件的初始属性输入第二模型，得到所述第二模型输出的所述待预测事件相对于所述关联事件的预测系数；所述第二模型基于与所述待测事件对应的历史事件的初始属性，以及所述历史事件相对于所述关联事件的相关系数训练得到；

第二预测属性获取单元，用于利用所述预测系数和所述第一预测属性，得到所述待预测事件的第二预测属性。

可选的，所述装置还包括：

分类单元，用于在所述将所述待预测事件的初始属性输入第一模型，得到第一模型输出的所述待预测事件的第一预测属性之前，将所述待预测事件的初始属性输入聚类模型，根据所述聚类模型输出的聚类结果，确定所述待预测事件所属的类别，并确定相应类别的第一模型和关联事件。

可选的，所述预测系数获取单元具体用于：

可选的，所述聚类模型为kmeans聚类模型。

本申请实施例提供了一种预测方法及装置，可以将待预测事件的初始属性输入第一模型，得到第一模型输出的待预测事件的第一预测属性，第一模型基于待预测事件的关联事件的初始属性和实际属性训练得到，也就是说，待预测事件的第一预测属性实际上是将待预测事件作为待预测事件的关联事件而具有的预测属性，而实际上待预测事件和待预测事件的关联事件的属性之间还存在差异。

因此可以将待预测事件的初始属性输入训练完成的第二模型，得到第二模型输出的待预测事件相对于关联事件的预测系数，这样可以根据预测系数将待预测事件作为关联事件而具有的第一预测属性转换为待预测事件本身所具有的第二预测属性。其中第二模型可以基于与待预测事件对应的历史事件的初始属性，以及历史事件相对于关联事件的相关系数训练得到，历史事件的第一预测属性为利用第一模型基于历史事件的初始属性得到的，因此第二模型可以基于初始属性得到待预测事件相对于关联事件的预测系数，计算结果较准确。

本申请实施例中，可以通过两个训练完成的模型去分别计算第一预测属性和预测系数，第一预测属性由待预测事件的初始属性以及关联事件的属性预测规律确定，预测系数能够体现待预测事件和关联事件的相关性，因此本申请能够为自动对待预测事件的属性进行预测，为待预测事件的属性预测提供统一的运算方式，提高待预测事件的属性预测准确性和效率(例如提高了电力负荷预测的准确性和效率)。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种预测方法的流程图；

图2为本申请实施例提供的另一种预测方法的流程图；

图3为本申请实施例提供的又一种预测方法的流程图；

图4为本申请实施例提供的一种预测装置的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

发明人经过研究发现，目前的预测方法通常较为繁琐，且效率低下，有时较为依赖人工，带有一定的主观成分，往往不够准确。

以待出租房屋为例，当前业界针对待出租房屋的租金，通常根据附近竞品房屋的价格以及为待出租房屋人工设置的溢价率得到，溢价率可以体现待出租房屋和竞品房屋的差异，例如可以在附近3km范围内寻找竞品房屋，采集竞品房屋的出租信息，包括位置、价格、房型和配套设置等，若待出租房屋的品牌级别高于竞品房屋，可以人为设置1.1的系数作为溢价率，这样可以将与待出租房屋具有同样配置的竞品房屋的价格与溢价率的乘积作为待出租房屋的预测租金。然而，并不是每个待出租房屋周围都会出现竞品房屋，竞品房屋的数据收集过程较为繁琐，效率低下，而且人为设置的溢价率不能合理表征待出租房屋和竞品房屋之间的差异，溢价率的设置过于主观，导致最终确定的待出租房屋的预测租金也带有主观成分，不能够构成稳定的价值体系，也不够客观合理。

基于以上技术问题，本申请实施例提供了一种预测方法及装置，可以将待预测事件的初始属性输入第一模型，得到第一模型输出的待预测事件的第一预测属性，第一模型基于待预测事件的关联事件的初始属性和实际属性训练得到，也就是说，待预测事件的第一预测属性实际上是将待预测事件作为待预测事件的关联事件而具有的预测属性，而实际上待预测事件和待预测事件的关联事件的属性之间还存在差异。

下面结合附图，通过实施例来详细说明本申请实施例提供的一种预测方法及装置的具体实现方式。

参考图1所示为本申请实施例提供的一种预测方法的流程图，可以包括以下步骤。

S101，将待预测事件的初始属性输入训练完成的第一模型，得到第一模型输出的待预测事件的第一预测属性。

本申请实施例中，待预测事件可以是在应用场景下参与预测的事件。当应用场景为电力市场需求预测时，则待预测事件可以是新兴的太阳能或者风力发电网络；或者，当应用场景为租房市场需求预测时，则待预测事件可以为待出租的房屋；或者，当应用场景为房屋出售市场需求预测时，则待预测事件可以为待出售的房屋。

待预测事件的初始属性是待预测事件本身携带的属性，是待预测事件区别于其他事件的属性，例如太阳能或风力发电网络的地理位置、所属区域等，或者待出租房屋的面积、配套设施信息、周边设施信息、待出租房屋的户型等，或者待出售房屋的面积、配套设施信息、周边设施信息、待出售房屋的户型等。

待预测事件的第一预测属性是对待预测事件的预测结果，与待预测事件的初始属性具有对应关系，例如太阳能或风力发电网络的供电量或电价，或者待出租房屋的租金，或者待出售房屋的售价等。

第一模型可以是基于待预测事件的关联事件训练得到的，待预测事件的关联事件是与待预测事件相关的事件，二者可以有类似的初始属性，以及二者可以有类似的预测属性的计算方式。待预测事件的关联事件例如可以是与待预测电力网络相近似的其他类型的电力网络，例如传统火力发电或水力发电网络等；或者与待出售房屋的距离小于预设距离的已出售民居，二者具有类似的周边设施信息，且都是房屋的定价问题，可以具有类似的预测算法；或者与待出租房屋的距离小于预设距离的已出租民居等。

具体的，第一模型可以基于关联事件的初始属性和实际属性训练得到，其中与待预测事件的初始属性类似，关联事件的初始属性也可以是关联事件本身携带有的属性，例如其他类型的电力网络的地理位置、所属区域等，或者已出租民居的面积、配套设施信息、周边设施信息、已出租民居的户型等，或者已出售民居的面积、配套设施信息、周边设施信息、已出售民居的户型等。关联事件的实际属性为基于关联事件的初始属性确定出的实际属性，通常为历史确定出的符合事件规律的属性，例如其他类型的电力网络的供电量或电价，或者已出租民居的租金，或者已出售民居的售价。

关联事件的初始属性和实际属性是通过数据采集得到的，例如可以采集全国不同城市的小区内的已出租民居的面积、配套设施信息、周边设施信息、户型、出租价格等信息，从而利用采集到的数据对第一模型进行训练。

具体实施时，可以将关联事件的初始属性和实际属性采用十折交叉验证的方式对第一模型进行训练，即，将关联事件的初始属性和实际属性分为十份，轮流将其中九份作为训练数据，将另外一份作为测试数据，通过调整第一模型的参数，以最小化测试数据中的实际属性与第一模型的输出结果之间的差距，实现对第一模型的训练。其中，第一模型可以是套索回归模型。

以房屋出租的场景为例，对于第一模型而言，基于第一模型的各个参数可以输出多个民居拟合租金，民居实际租金和民居拟合租金的差值作为第一模型的误差，选择最小误差对应的参数即为最优参数，将具有最优参数的第一模型作为训练完成的第一模型。

在对第一模型训练完成后，由于第一模型是基于关联事件的初始属性和实际属性训练得到的，第一模型中隐含了关联事件的初始属性和实际属性之间的关联关系，因此具有根据关联事件的初始属性确定关联事件的实际属性的能力，也就是说，将关联事件的初始属性作为输入，则输出结果为关联事件的预测属性。而在将待预测事件的初始属性作为第一模型的输入数据时，第一模型可以将待预测事件的初始属性当作关联事件的初始属性进行处理，输出的第一预测结果实际上是利用基于待预测事件的初始属性以及关联事件的计算规律得到的，是将待预测事件作为关联事件的而计算得到的预测属性。以待出租房屋为例，可以将待出租房屋的周边设施信息、面积输入第一模型，得到待出租房屋作为民居的出租价格。

然而，即使待预测事件和关联事件具有类似的属性预测方式，二者的预测结果也不会完全一致，第一预测属性可以说明具有和待预测事件同样初始属性的关联事件可以具有第一预测属性，因此这里的第一预测属性实际上并不能作为待预测事件的最终预测结果。事实上，由于待预测事件和关联事件具有类似的属性预测方式，待预测事件和关联事件的预测结果之间通常会相差一个系数，该系数即为后续计算的预测系数，从而得到待预测事件的最终预测结果。在待预测事件为待出租房屋时，预测系数可以是溢价率。

具体操作时，发明人经过研究发现，由于各个待预测事件的初始属性不尽相同，在待预测事件的初始属性差距较大时，可能存在预测属性的确定方式也有所不同，因此可以分别对关联事件和待预测事件进行聚类。具体的，在利用关联事件进行模型训练时，可以对关联事件进行聚类，分别基于各类的关联事件来训练该类的预测模型，这样可以得到多个类别对应的多个预测模型，这些预测模型仅依据该类别的关联事件训练，针对性较强，准确性较高。在计算待预测事件的预测属性时，可以先确定待预测事件的类别，然后将待预测事件输入该类别对应的模型中，从而得到准确的第一预测属性。

本申请实施例中，待预测事件所属的类别可以是多个类别中的目标类别，而输入待预测事件的初始属性的第一模型可以作为训练得到的与多个类别对应的多个预测模型中的一个，且第一模型对应目标类别。

具体的，可以根据关联事件的初始属性和实际属性对关联事件进行聚类，聚类的方式可以是利用kmeans聚类模型，这样可以将初始属性或实际属性相似的关联事件作为同一类别，从而得到多个类别的关联事件，例如可以将关联事件分为9类，对于各个类别对应的预测模型，可以分别进行训练，得到对应于各个类别的预测模型。

由于待出租房屋和待出售房屋的价格还和城市相关，因此可以将民居基于城市分组，再对各个城市的民居进行聚类，从而得到多个类别对应的预测模型，在需要对待出租房屋进行租金预测或对待出售房屋进行售价预测时，可以先确定待出租房屋或待出售房屋所在的城市，再确定待出租房屋或待出售房屋所属的类别，从而将待出租房屋或待出售房屋的初始属性输入所属类别对应的模型中。

S102，将待预测事件的初始属性输入训练完成的第二模型，得到第二模型输出的待预测事件相对于关联事件的预测系数。

本申请实施例中，待预测事件和关联事件是相关的，二者可以具有类似的预测属性的计算方式，例如对民居的租金预测和对待出租房屋的租金预测可以有类似的预测方式，然而民居和待出租房屋之间纵然整体规律一致，却并不一定会有完全一致的预测方式，通常可以令待出租房屋的租金相对于民居的租金有一定的系数，即具有一定的预测系数，具体为溢价率。其中，溢价率可以大于1，也可以小于1，当然也可以等于1，可以理解的是，在溢价率小于1时，说明相同条件的待出租房屋的租金低于民居的租金。

实际操作中，对于具有不同初始属性或不同第一预测属性的待预测事件，可能相对于关联事件具有不同的预测系数。例如80平米两室一厅的待出租房屋相对于80平米两室一厅的民居可以具有第一溢价率，而50平米开间的待出租房屋相对于50平米开间的民居可以具有第二溢价率，第一溢价率和第二溢价率可以不一致。

因此，可以基于初始属性和预测系数的对应关系确定出待预测事件相对于关联事件的预测系数，或者可以基于第一预测属性和预测系数的对应关系确定出待预测事件相对于关联事件的预测系数。因此，可以基于初始属性和预测系数的对应关系对第二模型进行训练，从而使第二模型具有利用待预测事件的初始属性得到待预测事件相对于关联事件的预测系数的能力。

这样，将待预测事件的初始属性输入训练完成的第二模型，可以利用第二模型对待预测事件的初始属性进行处理得到输出结果，输出结果为待预测事件相对于关联事件的预测系数，此时，对第二模型进行训练，可以将待预测事件的历史事件的初始属性，以及历史事件相对于关联事件的相关系数训练得到；或者，可以将待预测事件的初始属性和第一预测属性输入训练完成的第二模型，可以利用第二模型对待预测事件的初始属性和第一预测属性进行处理得到输出结果，输出结果为待预测事件相对于关联事件的预测系数。此时，对第二模型进行训练，可以将待预测事件的历史事件的初始属性，或初始属性和历史事件的第一预测属性，以及历史事件相对于关联事件的相关系数训练得到；或者，可以将待预测事件的初始属性和所属类别输入训练完成的第二模型，或者将待预测事件的初始属性、所属类别、第一预测属性输入训练完成的第二模型，则对第二模型进行训练的训练数据可以根据历史事件的相关数据训练得到。

其中，历史事件和待预测事件具有大致一致的计算规律，因此待预测事件相对于关联事件的相关系数与待预测事件相对于关联事件的预测系数的相关度较高，利用历史事件相对于关联事件的相关系数训练得到的第二模型可以具有计算待预测事件相对于关联事件的预测系数的能力。

待预测事件的历史事件的初始属性是历史事件本身携带的属性，是历史事件区别于其他事件的属性，历史事件发生的时间要早于待预测事件的发生时间，实际上是已经发生过的待预测事件，历史事件的初始属性例如可以是待预测电力网络的历史地理位置、历史所属区域等，或者已出租房屋的面积、配套设施信息、周边设施信息、户型等，或者已出售房屋的面积、户型、配套设施信息、周边设施信息等。

历史事件相对于关联事件的相关系数可以为历史事件的实际属性与历史事件的第一预测属性的比值，其中，历史事件的实际属性是基于历史事件的初始属性确定出的实际属性，通常为历史确定出的符合事件规律的属性，例如待预测电力网络的历史实际供电量和/或电价，或者已出租房屋的实际租金，或者已出售房屋的实际售价。待预测事件的历史事件的初始属性和实际属性，可以基于数据采集得到，例如可以获取待预测事件的历史成交数据，例如历史出租数据。历史事件的第一预测属性可以是将历史事件的初始属性输入第一模型后得到的，也就是说，历史事件的第一预测属性实际上是将历史事件作为关联事件得到的预测属性，该预测属性可以体现历史事件的初始属性特征，也可以体现第一模型的数据处理过程的特征。

在利用历史事件的初始属性以及相关系数对第二模型进行训练时，还可以利用递归特征消除模型从初始属性中确定出目标属性作为训练数据；在利用历史事件的初始属性和第一预测属性，以及相关系数对第二模型进行训练时，还可以利用递归特征消除模型从初始属性和第一预测属性中选择训练数据，具体的，可以从利用历史事件的初始属性和第一预测属性中选择和相关系数的相关度较高的属性，作为历史事件的训练属性，将历史事件的训练属性和相关系数作为训练数据，从而对第二模型进行训练。当然，在利用历史事件的初始属性、所属类别，以及相关系数对第二模型进行训练时，或者在利用历史事件的初始属性、所属类别、第一预测属性对第二模型进行训练时，也可以利用递归特征消除模型从中确定训练数据，在此不做一一举例。

具体实施时，也可以将历史事件的初始属性和相关系数采用十折交叉验证的方式对第二模型进行训练，即，将历史事件的初始属性和相关系数对应分为十份，轮流将其中九份作为训练数据，将另外一份作为测试数据，通过调整第二模型的参数，以最小化测试数据中的相关系数与第二模型的输出结果之间的差距，实现对第二模型的训练。

其中，第二模型可以是支持向量回归模型、集成梯度下降回归模型(gradientboosting regressor)、贝叶斯回归模型(Bayes)、岭回归模型(ridge)、套索回归模型(lasso)中的至少一种，而最终训练完成的第二模型是以上这些模型中误差最小的一个，也就是说，可以分别对这多个模型进行训练，在对各个模型中选择误差最小的模型作为第二模型。

S103，利用预测系数和第一预测属性，得到待预测事件的第二预测属性。

本申请实施例中，第一预测属性是待预测事件作为关联事件得到的预测属性，而预测系数是待预测事件相对于关联事件的预测系数，因此根据第一预测属性和预测系数就可以得到待预测事件的第二预测属性，第二预测属性可以作为对待预测事件的最终预测结果。具体的，可以将第一预测属性和预测系数的乘积作为待预测事件的第二预测属性。

本申请实施例提供了一种预测方法，可以将待预测事件的初始属性输入训练完成的第一模型，得到第一模型输出的待预测事件的第一预测属性，第一模型基于待预测事件的关联事件的初始属性和实际属性训练得到，也就是说，待预测事件的第一预测属性实际上是将待预测事件作为待预测事件的关联事件而具有的预测属性，而实际上待预测事件和待预测事件的关联事件的属性之间还存在差异。

因此可以将待预测事件的初始属性输入训练完成的第二模型，得到第二模型输出的待预测事件相对于关联事件的预测系数，这样可以根据预测系数将待预测事件作为关联事件而具有的第一预测属性转换为待预测事件本身所具有的第二预测属性。其中第二模型可以基于待预测事件的历史事件的初始属性，以及历史事件相对于关联事件的相关系数训练得到，历史事件的第一预测属性为利用第一模型基于历史事件的初始属性得到的，因此第二模型可以基于初始属性得到待预测事件相对于关联事件的预测系数，计算结果较准确。

下面结合具体的应用场景对本申请实施例提供的一种预测方法进行详细说明。以下将以待出租房屋作为待预测事件为例进行说明，其中待预测事件的关联事件为待出租房屋周围预测范围内的已出租民居，待预测事件的历史事件为已出租房屋，参考图2所示，为本申请实施例提供的另一种预测方法的流程图，该预测方法可以包括以下步骤：

S201，将待出租房屋的初始属性输入第一模型，得到第一模型输出的待出租房屋作为民居的拟合租金。

待出租房屋的初始属性可以包括待出租房屋的面积、配套设施信息、周边设施信息、待出租房屋的户型等能够体现待出租房屋的特性的属性，这些属性会影响待出租房屋的租金，例如待出租房屋的面积越大，配套设施越齐全，周边设施越便利，相应的待出租房屋的租金也越高。

第一模型可以是基于待出租房屋周边的已出租民居训练得到的，由于已出租民居和待出租房屋具有类似的初始属性，例如都具有面积属性，配套设施属性和周边设施属性等，已出租民居和待出租房屋具有类似的预测租金的计算方式，例如面积越大，配套设施越齐全，周边设施越便利，相应的租金也越高。已出租民居可以是与待出租房屋的距离小于预设距离民居，减少了地域属性对租金的影响，已出租民居可以以小区为单位进行训练，这是因为同一小区中的民居的户型和面积基本一致，租金也基本一致。

具体的，第一模型可以基于已出租民居的初始属性和实际租金训练得到，其中已出租民居的初始属性可以包括已出租民居的面积、配套设施信息、周边设施信息、已出租民居的户型等。第一模型可以是套索回归模型，对第一模型的训练方式可以是十折交叉验证的方式。

举例来说，可以利用已出租民居的面积、周边设施信息和实际租金作为训练数据，对第一模型进行训练。其中，已出租民居的周边设施信息可以通过兴趣点(point ofinterest，POI)信息表示，其中POI可以包括交通设施、购物场所、餐饮场所、娱乐场所等，交通设施可以包括地铁、公交、火车等。

其中，POI信息可以利用POI能级表示，对于第j个POI，其能级可以通过以下公式表示：

或，

其中，POI_j为一个城市中所有POI的集合中第j个POI，i为POIj周围2公里内民居小区集合中的第i个民居小区，民居坪效_i为第i个小区中的民居每平米的租金/出售价，distance_i为第i个小区距离第j个POI的距离，n为POI_j周围2公里内出租/出售民居小区个数，alpha为计算能级参数。这样基于POI周围的出租/出售民居小区的情况可以计算得到各个POI的能级，由于民居的覆盖度较高，因此可以得到较准确的POI能级。

由于POI能级是根据POI周围的已出租民居小区的情况而确定的，由公式可以看出，距离较近的民居小区的坪效越高，得到的POI能级也越高，而越高的POI能级，会使具有该POI的待出租房屋的价格也越高，也就是会对待出租房屋的预测属性产生一定的影响。

也就是说，可以将已出租民居的面积和POI能级作为对第一模型进行训练时的输入，将已出租民居的实际租金作为对第一模型进行训练时的输出，从而得到在某一面积和某一POI能级下的实际租金。这样，将待预测房屋的面积和POI能级输入第一模型，可以得到待预测房屋作为民居的拟合租金。

具体实现时，还可以先对已出租民居进行聚类，这是因为已出租民居的初始属性差距较大时，租金预测方式也可能不一致，因此可以先对已出租民居进行聚类，分别基于各类的已出租民居训练该类的预测模型。例如可以将不同地区的已出租民居归为不同类，也可以将不同面积范围的已出租民居归为不同类，还可以将地铁站附近的已出租民居和非地铁站附近的已出租民居归为不同类，还可以将不同租金范围的已出租民居归为不同类。聚类的方式可以是利用kmeans聚类模型，已出租民居可以分为9类。

这样，在对待出租房屋的租金进行预测时，可以先对待出租房屋的类别进行判断，确定待出租房屋的类别为目标类别，再将待出租房屋的初始属性输入目标类别对应的第一模型。具体的，可以基于与待出租房屋的距离小于预设距离的民居的面积和租金计算得到民居的租金坪效(每平米的租金)，将民居的租金坪效和POI能级输入聚类模型，从而对待出租房屋进行聚类，得到待出租房屋所属的类别。

由于待出租房屋的价格还和城市相关，因此可以将民居基于城市分组，再对各个城市的民居进行聚类，从而得到多个类别对应的预测模型，在需要对待出租房屋进行租金预测或时，可以先确定待出租房屋所在的城市，再确定待出租房屋所属的类别，从而将待出租房屋的初始属性输入所属类别对应的模型中。

S202，将待出租房屋的初始属性输入第二模型，得到第二模型输出的待出租房屋相对于民居的溢价率。

在本申请实施例中，待出租房屋的租金和民居的租金是相关的，二者具有类似的预测方式，然而待出租房屋的设置或服务可能相对民居较好或较差，因此可以相对于已出租民居具有一定的溢价率，在溢价率小于1时，说明相同条件的待出租房屋的租金低于民居的租金。

实际操作中，对于不同的初始属性的待出租房屋，可能相对已出租房屋具有不同的溢价率，因此可以基于初始属性和溢价率的对应关系确定出待出租房屋相对于已出租民居的溢价率，或者可以基于初始属性以及拟合租金，和溢价率的对应关系确定出待出租房屋相对于已出租民居的溢价率。

因此第二模型可以基于待出租房屋的历史房屋的初始属性和历史房屋相对于已出租民居的溢价率进行训练，其中，历史房屋的初始属性可以为已出租房屋的面积、配套设施信息、周边设施信息、户型等，历史房屋的拟合租金可以是将历史房屋的初始属性输入第一模型得到的，历史房屋相对于已出租民居的溢价率可以通过历史房屋的实际租金和历史房屋的拟合租金的比值得到。

在对第二模型进行训练时，还可以利用递归特征消除模型从初始属性和已出租民居的拟合价格中选择训练属性，具体的，可以从已出租民居的面积、户型、配套设置、拟合价格等中确定中至少一个作为训练属性，将确定出的训练属性和相关系数作为训练数据，从而对第二模型进行训练。

具体实施时，可以采用十折交叉验证的方式对第二模型进行训练，通过调整第二模型的参数，以最小化第二模型的误差。其中，第二模型可以是支持向量回归模型、集成梯度下降回归模型(gradient boosting regressor)、贝叶斯回归模型(Bayes)、岭回归模型(ridge)、套索回归模型(lasso)中的至少一种，而最终训练完成的第二模型是以上这些模型中误差最小的一个，也就是说，可以分别对这多个模型进行训练，在对各个模型中选择误差最小的模型作为第二模型。例如在完成训练后得到贝叶斯回归模型的误差最小，则可以将贝叶斯回归模型作为第二模型。

需要说明的是，第二模型可以包括多个，分别对应不同的城市，在一个城市和另一个城市的坪效接近时，可以将其中一个城市中的历史房屋作为另一个城市对应的溢价率模型的训练数据，从而对另一个城市对应的溢价率模型进行训练，得到另一个城市对应的第二模型。例如在历史房屋较少的城市，可以使用其他与该城市的坪效接近的城市的历史房屋作为训练数据，从而完成各个城市对应的第二模型的训练。

S203，利用待出租房屋作为民居的拟合租金和溢价率，得到待出租房屋的预测租金。

在本申请实施例中，可以得到待出租房屋作为民居的拟合租金，以及待出租房屋相对与已出租民居的溢价率，因此可以根据拟合租金和溢价率计算得到待出租房屋的预测租金，实现待出租房屋的租金预测。具体的，可以将待出租房屋的拟合租金和溢价率的乘积作为待出租房屋的预测租金。

本申请实施例提供了一种待出租房屋的租金预测方法，可以将待出租房屋的初始属性输入第一模型，得到第一模型输出的待出租房屋作为民居的拟合租金，将待出租房屋的初始属性输入第二模型，得到待出租房屋相对于已出租民居的预测系数，这样可以通过计算得到待出租房屋的预测租金，因此本申请实施例能够通过对已出租房屋和历史房屋的数据进行采集从而自动预测待出租房屋的租金，为租金预测提供了统一的运算方式，提高租金预测的准确性和效率。

以下将以待预测电力网络作为待预测事件为例进行说明，其中待预测事件的关联事件为与待预测电力网络相近似的其他类型的电力网络，待预测事件的历史事件为实际发生过的待预测事件，参考图3所示，预测方法可以包括以下步骤：

S301，将待预测电力网络的初始属性输入第一模型，得到第一模型输出的待预测电力网络的拟合供电量。

待预测电力网络可以为新兴的太阳能或者风力发电网络，待预测电力网络的初始属性可以为太阳能或风力发电网络的地理位置、所属区域等，这些属性会影响待预测电力网络的实际供电量或电价，通常而言，工业区的用电量通常较大，此时预测供电量也应该较大。

第一模型可以是基于与待预测电力网络相近似的其他类型的电力网络训练得到的，由于二者较为近似，因此具有类似的初始属性，以及具有类似的预测规律。与待预测电力网络相近似的其他类型的电力网络例如传统火力发电或水力发电网络等。

具体的，第一模型可以是基于其他类型的电力网络的初始属性和实际供电量训练得到的，其中，其他类型的电力网络的初始属性可以为其他类型的网络的地理位置、所属区域等。第一模型可以是套索回归模型，对第一模型的训练方式可以是十折交叉验证的方式。

具体实施时，还可以先对其他类型的电力网络进行聚类，这是因为具有不同初始属性的电力网络，其预测方式可能不同，这样可以先对其他类型的电力网络进行聚类，然后分别基于各类的电力网络训练该类的预测模型。这样，在对待预测电力网络的供电量进行预测时，可以先对待预测电力网络的类别进行判断，确定了待预测电力网络的类别，然后确定出该类别的第一模型。

S302，将待预测电力网络的初始属性输入第二模型，得到第二模型输出的待预测电力网络相对于其他类型的电力网络的相关系数。

在本申请实施例中，第二模型可以基于待预测电力网络对应的历史事件的初始属性以及历史事件相对于关联事件的历史相关系数训练得到，其中待预测电力网络对应的历史事件的初始属性可以为待预测电力网络的历史属性，例如待预测电力网络的历史地理位置、历史所属区域等。

历史事件相对于关联事件的历史相关系数可以为历史事件的实际属性与历史事件的第一预测属性的比值，历史事件的实际属性可以为待预测电力网络历史实际供电量，历史事件的第一预测属性为将历史事件的初始属性输入第一模型后得到的。

举例来说，可以将待预测电力网络的历史属性输入第一模型，得到待预测电力网络的历史拟合供电量，利用待预测电力网络的历史实际供电量与待预测电力网络的历史拟合供电量可以得到待预测电力网网络相对于其他类型的电力网络的历史相关系数，进而根据待预测电力网络的历史属性和相对于其他类型的电力网络的历史相关系数训练得到第二模型。

对第二模型进行训练的方可以是十折交叉验证，第二模型可以是支持向量回归模型、集成梯度下降回归模型(gradient boosting regressor)、贝叶斯回归模型(Bayes)、岭回归模型(ridge)、套索回归模型(lasso)中的至少一种，而最终训练完成的第二模型是以上这些模型中误差最小的一个，也就是说，可以分别对这多个模型进行训练，在对各个模型中选择误差最小的模型作为第二模型。

S303，利用相关系数和待预测电力网络的拟合供电量，得到待预测电力网络的预测供电量。

具体的，可以得到待预测电力网络作为其他类型的电力网络的拟合供电量，以及待预测电力网络相对于其他类型的电力网络的相关系数，因此可以根据拟合供电量，以及相关系数计算待预测电力网络的预测供电量。具体的，可以将待预测电力网络的拟合供电量，与相关系数的乘积作为待预测电力网络的预测供电量。

当然，本申请实施例中，也可以利用相同的方式得到待预测电力网络的预测电价，在此不做举例说明。

本申请实施例提供了一种待预测电力网络的预测方法，可以将待预测电力网络的初始属性输入第一模型，得到第一模型输出的待预测电力网络作为其他类型的电力网络的拟合电量，将待预测电力网络的初始属性输入第二模型，得到待预测电力网络相对于其他类型的电力网络的相关系数，这样可以通过计算得到待预测电力网络的预测电量，因此本申请实施例能够通过对待预测电力网络的历史数据以及待预测电力网络的相关联的其他类型的电力预测网络的数据进行采集，从而自动预测待预测电力网络的预测电量，为电量预测预测提供了统一的运算方式，提供了预测的准确性和效率。

基于以上一种预测方法，本申请实施例还提供了一种预测装置，参考图4所示，为本申请实施例提供的一种预测装置的结构框图，所述装置包括：

第一预测属性获取单元110，用于将所述待预测事件的初始属性输入第一模型，得到所述第一模型输出的所述待预测事件的第一预测属性；所述第一模型基于所述待预测事件的关联事件的初始属性和实际属性训练得到；

预测系数获取单元120，用于将所述待预测事件的初始属性输入第二模型，得到所述第二模型输出的所述待预测事件相对于所述关联事件的预测系数；所述第二模型基于与所述待测事件对应的历史事件的初始属性，以及所述历史事件相对于所述关联事件的相关系数训练得到；

第二预测属性获取单元130，用于利用所述预测系数和所述第一预测属性，得到所述待预测事件的第二预测属性。

可选的，所述装置还包括：

可选的，所述预测系数获取单元具体用于：

可选的，所述聚类模型为kmeans聚类模型。

本申请实施例提供了一种预测装置，可以将待预测事件的初始属性输入第一模型，得到第一模型输出的待预测事件的第一预测属性，第一模型基于待预测事件的关联事件的初始属性和实际属性训练得到，也就是说，待预测事件的第一预测属性实际上是将待预测事件作为待预测事件的关联事件而具有的预测属性，而实际上待预测事件和待预测事件的关联事件的属性之间还存在差异。

本申请实施例中提到的“第一……”、“第一……”等名称中的“第一”只是用来做名字标识，并不代表顺序上的第一。该规则同样适用于“第二”等。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加通用硬件平台的方式来实现。基于这样的理解，本申请的技术方案可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如只读存储器(英文：read-only memory，ROM)/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者诸如路由器等网络通信设备)执行本申请各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的设备及系统实施例仅仅是示意性的，其中作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述仅是本申请的优选实施方式，并非用于限定本申请的保护范围。应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请的前提下，还可以作出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

1.一种预测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述历史事件相对于所述关联事件的相关系数为，所述历史事件的实际属性和所述历史事件的第一预测属性的比值；所述历史事件的第一预测属性为将所述历史事件的初始属性输入所述第一模型得到的。

3.根据权利要求1所述的方法，其特征在于，在所述将所述待预测事件的初始属性输入第一模型，得到第一模型输出的所述待预测事件的第一预测属性之前，所述方法还包括：

4.根据权利要求3所述的方法，其特征在于，所述将所述待预测事件的初始属性输入第二模型，得到所述第二模型输出的所述待预测事件相对于所述关联事件的预测系数，包括：

5.根据权利要求3所述的方法，其特征在于，所述聚类模型为kmeans聚类模型。

6.根据权利要求1所述的方法，其特征在于，所述第一模型为套索回归模型，所述第一模型通过十折交叉验证的方式训练得到。

7.根据权利要求1所述的方法，其特征在于，所述第二模型为支持向量回归模型、集成梯度下降回归模型、贝叶斯回归模型、岭回归模型、套索回归模型中的至少一种。

8.一种预测装置，其特征在于，包括：

9.根据权利要求8所述的装置，其特征在于，所述历史事件相对于所述关联事件的相关系数为，所述历史事件的实际属性和所述历史事件的第一预测属性的比值；所述历史事件的第一预测属性为将所述历史事件的初始属性输入所述第一模型得到的。

10.根据权利要求8所述的装置，其特征在于，所述装置还包括：

11.根据权利要求10所述的装置，其特征在于，所述预测系数获取单元具体用于：

12.根据权利要求10所述的装置，其特征在于，所述聚类模型为kmeans聚类模型。

13.根据权利要求8所述的装置，其特征在于，所述第一模型为套索回归模型，所述第一模型通过十折交叉验证的方式训练得到。

14.根据权利要求8所述的装置，其特征在于，所述第二模型为支持向量回归模型、集成梯度下降回归模型、贝叶斯回归模型、岭回归模型、套索回归模型中的至少一种。