WO2022252630A1

WO2022252630A1 - 基于模型集合的数据预测方法、装置、设备及存储介质

Info

Publication number: WO2022252630A1
Application number: PCT/CN2022/071836
Authority: WO
Inventors: 张春玲; 彭琛
Original assignee: 平安科技（深圳）有限公司
Priority date: 2021-05-31
Filing date: 2022-01-13
Publication date: 2022-12-08
Also published as: CN113205230A

Abstract

本申请实施例公开了一种基于模型集合的数据预测方法、装置、计算机设备及存储介质。方法包括：首先获取目标行业因子数据；然后将目标行业因子数据分别输入预设的模型集合中的目标回归模型以及目标分类模型进行结果预测，分别得到回归预测结果以及分类预测结果；再确定回归预测结果与分类预测结果的方向是否一致；若回归预测结果与分类预测结果的方向一致，则根据目标预测类型从回归预测结果以及分类预测结果中确定目标预测结果；若回归预测结果与分类预测结果的方向不一致，则根据预设的校正规则确定目标预测结果。本申请实施例结合了分类模型以及回归模型对预测结果进行预测，从多角度分析同一个目标问题，可以提高预测结果的准确性。

Description

基于模型集合的数据预测方法、装置、设备及存储介质

本申请要求于2021年5月31日提交中国专利局、申请号为202110600017.0，申请名称为“基于模型集合的数据预测方法、装置、设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能的数据预测技术领域，尤其涉及一种基于模型集合的数据预测方法、装置、计算机设备及存储介质。

背景技术

在经济研究中通常需要对工业增加值或者产能产值等未来的变化趋势进行一定的预判。

除传统的根据专家经验对未来的变化趋势进行预判以外，通常会使用可量化的经济因子对未来经济走势进行预测。发明人发现目前经济研究中一般使用的预测模型都是较为传统的模拟推演或简单的线性回归等机器学习模型，预测的结果出错不易被发现，导致预测结果不准确。

发明内容

本申请实施例提供了一种基于模型集合的数据预测方法、装置、计算机设备及存储介质，可以提高预测结果的准确性。

第一方面，本申请实施例提供了一种基于模型集合的数据预测方法，其包括：

获取目标行业因子数据；

将所述目标行业因子数据分别输入预设的模型集合中的目标回归模型以及目标分类模型进行结果预测，分别得到回归预测结果以及分类预测结果，所述模型集合包括多个分类模型以及多个回归模型，所述目标分类模型以及所述目标回归模型分别为所述模型集合中质量分数最高的分类模型以及质量分数最高的回归模型；

确定所述回归预测结果与所述分类预测结果的方向是否一致；

若所述回归预测结果与所述分类预测结果的方向一致，则根据目标预测类型从所述回归预测结果以及所述分类预测结果中确定目标预测结果；

若所述回归预测结果与所述分类预测结果的方向不一致，则根据预设的校正规则确定目标预测结果。

第二方面，本申请实施例还提供了一种基于模型集合的数据预测装置，其包：

获取单元，用于获取目标行业因子数据；

输入单元，用于将所述目标行业因子数据分别输入预设的模型集合中的目标回归模型以及目标分类模型进行结果预测，分别得到回归预测结果以及分类预测结果，所述模型集合包括多个分类模型以及多个回归模型，所述目标分类模型以及所述目标回归模型分别为所述模型集合中质量分数最高的分类模型以及质量分数最高的回归模型；

第一确定单元，用于确定所述回归预测结果与所述分类预测结果的方向是否一致；

第二确定单元，用于当所述回归预测结果与所述分类预测结果的方向一致时，根据目标预测类型从所述回归预测结果以及所述分类预测结果中确定目标预测结果；

第三确定单元，用于当所述回归预测结果与所述分类预测结果的方向不一致时，根据预设的校正规则确定目标预测结果。

第三方面，本申请实施例还提供了一种计算机设备，其包括存储器及处理器，所述存储器上存储有计算机程序，所述处理器执行所述计算机程序时执行以下步骤：

获取目标行业因子数据；

第四方面，本申请实施例还提供了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时执行以下步骤：

获取目标行业因子数据；

本申请实施例提供了一种基于模型集合的数据预测方法、装置、计算机设备及存储介质。本申请实施例结合了分类模型以及回归模型对预测结果进行预测，从多角度分析同一个目标问题，可以提高预测结果的准确性。

附图说明

为了更清楚地说明本申请实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的基于模型集合的数据预测方法的应用场景示意图；

图2为本申请实施例提供的基于模型集合的数据预测方法的一流程示意图；

图3为本申请实施例提供的基于模型集合的数据预测方法的一子流程示意图；

图4为本申请实施例提供的基于模型集合的数据预测方法的另一子流程示意图；

图5为本申请实施例提供的基于模型集合的数据预测方法的另一子流程示意图；

图6为本申请实施例提供的基于模型集合的数据预测方法的另一子流程示意图；

图7为本申请另一实施例提供的基于模型集合的数据预测方法的一流程示意图；

图8为本申请实施例提供的基于模型集合的数据预测装置的一示意性框图；

图9为本申请另一实施例提供的基于模型集合的数据预测装置的一示意性框图；

图10为本申请实施例提供的计算机设备的示意性框图。

具体实施方式

本申请实施例提供了一种基于模型集合的数据预测方法、装置、计算机设备及存储介质。

该基于模型集合的数据预测方法的执行主体可以是本申请实施例提供的基于模型集合的数据预测装置，或者集成了该基于模型集合的数据预测装置的计算机设备，其中，该基于模型集合的数据预测装置可以采用硬件或者软件的方式实现，该计算机设备可以为终端或服务器，该终端可以是智能手机、平板电脑、掌上电脑、或者笔记本电脑等。

请参阅图1，图1为本申请实施例提供的基于模型集合的数据预测方法的应用场景示意图。该基于模型集合的数据预测方法应用于图1中的计算机设备10中，该计算机设备10中存储有与目标业务对应的模型集合，该模型集合包括多个分类模型以及多个回归模型，其中，分类模型中质量分数最高的模型为目标分类模型，回归模型中质量分数最高的模型为目标回归模型，本实施例中，当计算机设备10获取未经处理的第一行业因子数据之后，会对第一行业因子数据进行包括缺失值处理、频率转换等的数据预处理，得到第二行业因子数据，并对第二行业因子数据进行特征工程处理，得到需要输入模型集合中的模型的目标行业因子数据，然后将该目标行业因子数据分别输入预设的模型集合中的目标回归模型以及目标分类模型，得到回归预测结果以及分类预测结果，最后根据回归预测结果与分类预测结果的方向是否一致，若一致，则根据目标预测类型从回归预测结果以及分类预测结果中确定目标预测结果，若不一致，则根据预设的校正规则确定目标预测结果。

请参阅图2，图2是本申请实施例提供的基于模型集合的数据预测方法的流程示意图。如图2所示，该方法包括以下步骤S110-150。

S110、获取目标行业因子数据。

本实施例中，目标行业因子数据可以为根据行业特征，产业逻辑等构建数据，其中行业特征可以包括这个行业的营收，市值，市场规模等数据，产业逻辑即分析该行业的上下游具体是什么，上游的原材料会是哪些，原材料具体的价格产量，下游的需求规模等数据，比如汽车行业，上游的钢材产量，橡胶价格等，下游的主要车型销售量，车载电器销售额等，本实施例将选取该行业特征以及产业逻辑对应的数据作为行业因子数据。

具体地，本实施例中的计算机设备可以从对应的数据库中自动提取行业因子数据，或者通过用户手动输入该行业因子数据。

在一些实施例中，如图3所示，步骤S110包括：

S111、获取第一行业因子数据。

本实施例中，第一行业因子数据为未经处理的行业因子数据，即从数据库中获取的原始的行业因子数据，如汽车行业原始的上游原料价格数据、下游需求数据、营收数据以及市值数据等。

S112、对第一行业因子数据进行数据预处理，得到第二行业因子数据。

本实施例中，数据预处理包括第一行业因子数据的缺失值处理以及第一行业因子数据的频率转换处理，其中，可以使用数据模拟的方法进行数据的缺失值处理，例如，数据在某个时间段的值是缺失的，可以模拟上一年同一时间段的数据的变化曲线进行数据的填补，从而实现数据的缺失值处理，在一些实施例中，本实施中的频率转换处理可以为将以天、周等单位的数据统一转换成以月为单位的数据等，步骤S112实现对所有的因子进行结构化的有效处理。

S113、对第二行业因子数据进行特征工程处理，得到目标行业因子数据。

本实施例中，该步骤主要是对结构化后的因子(第二行业因子)做特征工程处理，结合因子重要性，时效性等特征，评估因子有效性权重，或通过处理合成新型有效因子。

本实施例中，以X因子为行业因子数据，Y为预测结果为例进行说明，即X为输入模型的数据，Y为模型输出的数据，其中，本实施例中的Y值具体可以为工业增加值或产能产值等，具体可以根据目标进行调整。

针对汽车行业景气度有效因子的评估，主要进行评估X因子的数据披露质量(更新时间和发布周期的时间差，顺序周期的更新时间差是否稳定)，数据缺失程度(近期是否有稳定正常更新)，X因子与Y相关性，X因子间相关性(是否存在大量同类因子)，X因子过多时需进行主成分分析(Principal Component Analysis，PCA)处理，保留主成分或有效合成的新因子，进行初步的因子筛选，最终保留的X因子为本实施例中需要输入模型集合中模型的行业因子数据。

S120、将该目标行业因子数据分别输入预设的模型集合中的目标回归模型以及目标分类模型，分别得到回归预测结果以及分类预测结果。

其中，该模型集合包括多个分类模型以及多个回归模型，该目标分类模型以及该回归模型分别为该模型集合中质量分数最高的分类模型以及质量分数最高的回归模型。

本实施例中，目标回归模型以及目标分类模型为n个，n为大于或等于1的整数，当n大于1时，目标回归模型为回归模型中分数最高的前n个模型，目标分类模型也为分类模型中分数最高的前n个模型，此时，回归预测结果可以为n个回归预测结果的均值，或者去除n个回归预测结果中的最高值以及最低值之后的均值，分类预测结果可以为n个分类预测结果的均值，或者去除n个分类预测结果中的最高值以及最低值之后的均值。

在一些实施例中，当构建模型集合并根据对应的历史行业因子及历史结果确定了模型集合中每个模型的质量分数之后，会将目标行业因子数据分别输入目标回归模型以及目标分类模型中，不需同时进行模型集合中所有模型的预测，当后面回归预测结果与该分类预测结果的方向不一致时，再触发其他模型的预测，降低计算机设备的功耗。

在一些实施例中，当构建模型集合并根据对应的历史行业因子及历史结果确定了模型集合中每个模型的质量分数之后，会将目标行业因子数据分别输入模型结合中的所有模型中，获取模型集合中所有模型的预测结果，方便后续当回归预测结果与该分类预测结果的方向不一致时，根据校正规则进行预测结果的调用，提高预测速度。

S130、确定回归预测结果与分类预测结果的方向是否一致，若是，则执行步骤S140，若否，则执行步骤S150。

本实施例中，若通过分类预测结果预估2021年6月汽车行业的Y值上涨，而回归预测结果预估2021年6月的Y值较上一期的Y值真实值下跌，或者通过分类预测结果预估2021年6月汽车行业的Y值下跌，而回归预测结果预估2021年6月的Y值较上一期的Y值真实值上涨，此时，则说明回归预测结果与该分类预测结果的方向不一致。

若通过分类预测结果预估2021年6月汽车行业的Y值上涨，并且回归预测结果预估2021年6月的Y值较上一期的Y值真实值上涨，或者通过分类预测结果预估2021年6月汽车行业的Y值下跌，并且回归预测结果预估2021年6月的Y值较上一期真实值下跌，此时，则说明回归预测结果与该分类预测结果的方向一致。

S140、根据目标预测类型从该回归预测结果以及该分类预测结果中确定目标预测结果。

当回归预测结果与分类预测结果的方向一致，若此时目标预测类型为回归类型，则此时将该回归预测结果确定为目标预测结果，本实施例中通过分类模型的分类预测结果辅助验证了回归预测结果的准确度，从而提高了最终预测结果的准确性。

若此时目标预测类型为分类类型，则此时将该分类预测结果确定为目标预测结果，本实施例中通过回归模型的回归预测结果辅助验证了分类预测结果的准确度，从而提高了最终预测结果的准确性。

S150、根据预设的校正规则确定目标预测结果。

本实施例中，当回归预测结果与分类预测结果的方向不一致时，这种情况下会触发矫正规则，放大调整Y值预测结果。

在一些实施例中，如图4所示，步骤S150包括：

S151、若目标预测类型为回归类型，且该目标分类模型的质量分数大于该目标回归模型的质量分数，则根据该分类预测结果校正该回归预测结果，得到校正后的回归预测结果。

其中，当目标分类模型以及目标回归分类模型均有多个时，此时目标分类模型的质量分数可以为多个目标分类模型对应的质量分数的总分或平均分，同理，目标回归模型的质量分数可以为多个目标回归模型对应的质量分数的总分或平均分。

具体地，在一些实施例中，请参阅图5，步骤S151包括：

S1511、根据模型集合中回归模型的质量分数更改目标回归模型，得到更改后的目标回归模型。

本实施例中，当回归预测结果与分类预测结果的方向不一致，且目标预测类型为回归，该目标分类模型的质量分数大于该目标回归模型的质量分数时，此时需要根据分类结果更正回归结果的预测方向。

具体地，可以根据回归模型质量分数的高低重新选取目标回归模型，抛弃全部或部分(若目标回归模型有多个时，此时可以抛弃部分)的目标分类模型，选取质量分数仅低于原目标分类模型的回归模型作为新的目标回归模型。

S1512、将目标行业因子数据输入更改后的目标回归模型，得到更改后的回归预测结果。

在一些实施例中，若之前只对目标回归模型以及目标分类模型进行了预测，则此时需要再将目标行业因子数据输入更改后的目标回归模型中，得到更改后的回归预测结果。

在另一些实施例中，若之前已经根据目标行业因子数据对模型集合中所有的模型进行了结果的预测，则此时直接获取对应模型的回归预测结果即可，无须再将目标行业因子数据输入更改后的目标回归模型中。

S1513、确定更改后的回归预测结果与分类预测结果的方向是否一致，若是，则执行步骤S1514，若否，则返回执行步骤S1511。

S1514、将更改后的回归预测结果确定为校正后的回归预测结果。

如果更改后的回归预测结果与分类预测结果的方向一致，则此时将更改后的回归预测结果确定为校正后的回归预测结果，此时，本实施例通过分类预测结果对回归预测结果进行了校正，提高了预测结果的准确性。

本实施例中，如果更改后的回归预测结果与分类预测结果的方向还是不一致，则此时返回执行步骤S1511，直到更改后的回归预测结果与分类预测结果的方向一致，输出校正后的回归预测结果。

需要说明的是，若存在有遍历了所有的回归模型之后，还是没有得到回归预测结果与分类预测结果的方向一致的回归预测结果，此时，可以参考往年同期的历史增长率确定目标预测结果。

S152、将该校正后的回归预测结果确定为该目标预测结果。

本实施例中，当根据该分类预测结果校正该回归预测结果，得到校正后的回归预测结果之后，将会输出该校正后的回归预测结果作为目标预测结果。

S153、若目标预测类型为分类类型，且该目标回归模型的质量分数大于该目标分类模型的质量分数，则根据该回归预测结果校正该分类预测结果，得到校正后的分类预测结果。

具体地，在一些实施例中，请参阅图6，步骤S153包括：

S1531、根据模型集合中分类模型的质量分数更改目标分类模型，得到更改后的目标分类模型。

本实施例中，当回归预测结果与分类预测结果的方向不一致，且目标预测类型为分类，该目标回归模型的质量分数大于该目标分类模型的质量分数时，此时需要根据回归结果更正分类结果的预测方向。

具体地，可以根据分类模型质量分数的高低重新选取目标分类模型，抛弃全部或部分(若目标分类模型有多个时，此时可以抛弃部分)的目标分类模型，选取质量分数仅低于原目标分类模型的分类模型作为新的目标分类模型。

S1532、将目标行业因子数据输入更改后的目标分类模型，得到的更改后的分类预测结果。

在一些实施例中，若之前只对目标回归模型以及目标分类模型进行了预测，则此时则需要将目标行业因子数据输入更改后的目标分类模型中，得到更改后的分类预测结果。

在另一些实施例中，若之前已经根据目标行业因子数据对模型集合中所有的模型进行了结果的预测，则此时直接获取对应模型的分类预测结果即可，无须再将目标行业因子数据输入更改后的目标分类模型中。

S1533、确定更改后的分类预测结果与回归预测结果的方向是否一致，若是，则执行步骤S1534，若否，则返回执行步骤S1531。

S1534、将更改后的分类预测结果确定为校正后的分类预测结果。

如果更改后的回归预测结果与分类预测结果的方向一致，则此时将更改后的分类预测结果确定为校正后的分类预测结果，此时，本实施例通过回归预测结果对分类预测结果进行了校正，提高了预测结果的准确性。

本实施例中，如果更改后的回归预测结果与分类预测结果的方向还是不一致，则此时返回执行步骤S1531，直到更改后的回归预测结果与分类预测结果的方向一致，输出校正后的分类预测结果。

需要说明的是，若存在有遍历了所有的分类模型之后，还是没有得到回归预测结果与分类预测结果的方向一致的回归预测结果，此时，可以参考往年同期的历史增长趋势确定目标预测结果。

S154、将该校正后的分类预测结果确定为该目标预测结果。

本实施例中，当根据该回归预测结果校正该分类预测结果，得到校正后的分类预测结果之后，将会输出该校正后的分类预测结果作为目标预测结果。

需要说明的是，本实施例中，如果回归预测结果与分类预测结果的方向不一致，当目标预测类型为回归类型，并且此时目标回归模型的质量分数高于目标分类模型的质量分数时，此时可以直接输出回归预测结果作为目标预测结果。

同理，如果回归预测结果与分类预测结果的方向不一致，当目标预测类型为分类类型，并且此时目标分类模型的质量分数高于目标回归模型的质量分数时，此时可以直接输出分类预测结果作为目标预测结果。

图7是本申请另一实施例提供的一种基于模型集合的数据预测方法的流程示意图。如图7所示，本实施例的基于模型集合的数据预测方法包括步骤S210-S270。其中步骤S230-S270与上述实施例中的步骤S110-S150类似，在此不再赘述。下面详细说明本实施例中所增加的步骤S210-S220。

S210、构建模型集合。

本实施例中，在实现步骤将目标行业因子数据分别输入预设的模型集合中的目标回归模型以及目标分类模型之前，需要进行模型集合的构建，模型集合中包括多个分类模型以及多个回归模型，其中，分类模型包括支持向量机和随机森林等模型，回归模型包括有线性回归和岭回归等模型，本实施例中计算机设备获取到多个分类模型以及多个回归模型之后，将会根据该多个分类模型以及多个回归模型构建模型集合。

S220、根据历史行业因子数据以及历史结果确定模型集合中每个模型的质量分数。

具体地，该步骤包括将历史行业因子数据输入模型集合中每个模型中，得到每个模型分别对应的预测结果；然后根据预测结果以及历史结果分别确定模型集合中每个模型的质量分数。

其中，本实施例中的历史行业因子数据与目标行业相对应，例如，本实施例需要对汽车行业的工业增加进行预测，则此时历史行业因子数据为该汽车行业的历史因子数据，具体地，本实施例使用回测的方法进行模型集合中每个模型的质量分数的评估，如下：

设置验证期，回测同等条件下的分类模型以及回归模型的预测效果，将单期分类模型的准确率，回归模型的误差偏离程度等量化为模型的评估因子。以目标为预测2021年6月汽车行业的工业增加值为例，当下为2021年5月31日，则此时可以设置2021年6月往前的6个月为验证期(即验证期为2020-12、2021-01、2021-02、2021-03、2021-04以及2021-05)，然后针对每个模型在验证期的表现做量化评估，如验证期内的分类模型的准确率(根据模型输出的Y值与实际Y值做比对得到)，回归模型的误差偏离率(根据模型输出的Y值与实际Y值做比对得到)，模型执行性能(得到结果的速度等)，模型结果的稳定性(多次测量的偏差程度等)等。

需要说明的是，本实施例中的历史行业因子数据在输入模型集合中的模型进行检验之前，需要对历史行业因子数据做数据预处理以及特征工程处理，具体处理方式可参考步骤S112以及S113，具体此处不做赘述。

需要说明的是，本实施例中的模型可以进行错期预测，例如，如果2021年4月及5月的数据存在数据量少，数据更新滞后等问题，此时可以利用2021年3月的数据对2021年6月的Y值进行预测。解决了因经济类数据普遍存在频率低、数据量少、更新滞后以及不定时缺失等，导致的预测结果的可信度存疑，更导致结果的可解释性略弱的问题。

综上所述，本申请实施例中，首先获取目标行业因子数据；然后将目标行业因子数据分别输入预设的模型集合中的目标回归模型以及目标分类模型进行结果预测，分别得到回归预测结果以及分类预测结果，模型集合包括多个分类模型以及多个回归模型，目标分类模型以及回归模型分别为模型集合中质量分数最高的分类模型以及回归模型；再确定回归预测结果与分类预测结果的方向是否一致；若回归预测结果与分类预测结果的方向一致，则根据目标预测类型从回归预测结果以及分类预测结果中确定目标预测结果；若回归预测结果与分类预测结果的方向不一致，则根据预设的校正规则确定目标预测结果。本申请实施例结合了分类模型以及回归模型对预测结果进行预测，从多角度分析同一个目标问题，可以提高预测结果的准确性。

此外，本申请的有益效果还包括：本申请提供的基于模型集合的数据预测方法涵盖尽可能多的适用于经济结构化因子的分类或回归模型，避免了单一模型的异常偏差；不管是分类或回归模型，都进行两种类型模型的预测，从多角度分析同一个目标问题，提高预测加过的准确性；通过评估模型效果，量化评估因子，用模型来训练选择当前情况下最适合的模型，考虑不同模型适用于不同的场景，并且融合矫正规则，让模型的预测结果更合理。

图8是本申请实施例提供的一种基于模型集合的数据预测装置的示意性框图。如图8所示，对应于以上基于模型集合的数据预测方法，本申请还提供一种基于模型集合的数据预测装置。该基于模型集合的数据预测装置包括用于执行上述基于模型集合的数据预测方法的单元，该装置可以被配置于台式电脑、平板电脑、手提电脑、等终端中。具体地，请参阅图8，该基于模型集合的数据预测装置包括获取单元801、输入单元802、第一确定单元803、第二确定单元804以及第三确定单元805。

获取单元801，用于获取目标行业因子数据；

输入单元802，用于将所述目标行业因子数据分别输入预设的模型集合中的目标回归模型以及目标分类模型进行结果预测，分别得到回归预测结果以及分类预测结果，所述模型集合包括多个分类模型以及多个回归模型，所述目标分类模型以及所述目标回归模型分别为所述模型集合中质量分数最高的分类模型以及质量分数最高的回归模型；

第一确定单元803，用于确定所述回归预测结果与所述分类预测结果的方向是否一致；

第二确定单元804，用于当所述回归预测结果与所述分类预测结果的方向一致时，根据目标预测类型从所述回归预测结果以及所述分类预测结果中确定目标预测结果；

第三确定单元805，用于当所述回归预测结果与所述分类预测结果的方向不一致时，根据预设的校正规则确定目标预测结果。

在一些实施例中，所述第三确定单元805具体用于：

若所述目标预测类型为回归类型，且所述目标分类模型的质量分数大于所述目标回归模型的质量分数，则根据所述分类预测结果校正所述回归预测结果，得到校正后的回归预测结果；

将所述校正后的回归预测结果确定为所述目标预测结果；

若所述目标预测类型为分类类型，且所述目标回归模型的质量分数大于所述目标分类模型的质量分数，则根据所述回归预测结果校正所述分类预测结果，得到校正后的分类预测结果；

将所述校正后的分类预测结果确定为所述目标预测结果。

在一些实施例中，更具体地，所述第三确定单元805用于：

根据模型集合中回归模型的质量分数更改目标回归模型，得到更改后的目标回归模型；

将所述目标行业因子数据输入所述更改后的目标回归模型，得到更改后的回归预测结果；

若所述更改后的回归预测结果与所述分类预测结果的方向一致，则将所述更改后的回归预测结果确定为所述校正后的回归预测结果；

若所述更改后的回归预测结果与所述分类预测结果的方向不一致，则返回执行所述根据模型集合中回归模型的质量分数更改目标回归模型的步骤。

在一些实施例中，更具体地，所述第三确定单元805用于：

根据模型集合中分类模型的质量分数更改目标分类模型，得到更改后的目标分类模型；

将所述目标行业因子数据输入所述更改后的目标分类模型，得到更改后的分类预测结果；

若所述更改后的分类预测结果与所述回归预测结果的方向一致，则将所述更改后的分类预测结果确定为所述校正后的分类预测结果；

若所述更改后的分类预测结果与所述回归预测结果的方向不一致，则返回执行所述根据模型集合中分类模型的质量分数更改目标分类模型的步骤。

在一些实施例中，所述获取单元801具体用于：

获取第一行业因子数据，所述第一行业因子数据为未经处理的行业因子数据；

对所述第一行业因子数据进行数据预处理，得到第二行业因子数据；

对所述第二行业因子数据进行特征工程处理，得到所述目标行业因子数据。

图9是本申请另一实施例提供的一种基于模型集合的数据预测装置的示意性框图。如图9所示，本实施例的基于模型集合的数据预测装置是上述实施例的基础上增加了构建单元806以及第四确定单元807。

构建单元806，用于构建所述模型集合；

第四确定单元807，用于根据历史行业因子数据以及历史结果确定所述模型集合中每个模型的质量分数。

在一些实施例中，所述第四确定单元807具体用于：

将所述历史行业因子数据输入所述模型集合中每个模型中，得到每个模型分别对应的预测结果；

根据所述预测结果以及所述历史结果分别确定所述模型集合中每个模型的质量分数。

需要说明的是，所属领域的技术人员可以清楚地了解到，上述基于模型集合的数据预测装置和各单元的具体实现过程，可以参考前述方法实施例中的相应描述，为了描述的方便和简洁，在此不再赘述。

上述基于模型集合的数据预测装置可以实现为一种计算机程序的形式，该计算机程序可以在如图10所示的计算机设备上运行。

请参阅图10，图10是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备1000可以是终端，也可以是服务器，其中，终端可以是智能手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等具有通信功能的电子设备。服务器可以是独立的服务器，也可以是多个服务器组成的服务器集群。

参阅图10，该计算机设备1000包括通过系统总线1001连接的处理器1002、存储器和网络接口1005，其中，存储器可以包括非易失性存储介质1003和内存储器1004。

该非易失性存储介质1003可存储操作系统10031和计算机程序10032。该计算机程序10032包括程序指令，该程序指令被执行时，可使得处理器1002执行一种基于模型集合的数据预测方法。

该处理器1002用于提供计算和控制能力，以支撑整个计算机设备1000的运行。

该内存储器1004为非易失性存储介质1003中的计算机程序10032的运行提供环境，该计算机程序10032被处理器1002执行时，可使得处理器1002执行一种基于模型集合的数据预测方法。

该网络接口1005用于与其它设备进行网络通信。本领域技术人员可以理解，图10中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备1000的限定，具体的计算机设备1000可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

其中，所述处理器1002用于运行存储在存储器中的计算机程序10032，以实现如下步骤：

获取目标行业因子数据；

在一实施例中，处理器1002在实现所述根据预设的校正规则确定目标预测结果步骤时，具体实现如下步骤：

将所述校正后的回归预测结果确定为所述目标预测结果；

将所述校正后的分类预测结果确定为所述目标预测结果。

在一实施例中，处理器1002在实现所述根据所述分类预测结果校正所述回归预测结果，得到校正后的回归预测结果步骤时，具体实现如下步骤：

在一实施例中，处理器1002在实现所述根据所述回归预测结果校正所述分类预测结果，得到校正后的分类预测结果步骤时，具体实现如下步骤：

在一实施例中，处理器1002在实现所述获取目标行业因子数据步骤时，具体实现如下步骤：

在一实施例中，处理器1002在实现所述将所述目标行业因子数据分别输入预设的模型集合中的目标回归模型以及目标分类模型进行结果预测步骤之前，还实现如下步骤：

构建所述模型集合；

根据历史行业因子数据以及历史结果确定所述模型集合中每个模型的质量分数。

在一实施例中，处理器1002在实现所述根据历史行业因子数据以及历史结果确定所述模型集合中每个模型的质量分数步骤时，具体实现如下步骤：

应当理解，在本申请实施例中，处理器1002可以是中央处理单元(Central Processing Unit，CPU)，该处理器1002还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令，计算机程序可存储于一存储介质中，该存储介质为计算机可读存储介质。该程序指令被该计算机系统中的至少一个处理器执行，以实现上述方法的实施例的流程步骤。

因此，本申请还提供一种存储介质。该存储介质可以为计算机可读存储介质，所述计算机可读存储介质可以是非易失性，也可以是易失性。该存储介质存储有计算机程序，其中计算机程序包括程序指令。该程序指令被处理器执行时使处理器执行如下步骤：

获取目标行业因子数据；

在一实施例中，所述处理器在执行所述程序指令而实现所述根据预设的校正规则确定目标预测结果步骤时，具体实现如下步骤：

将所述校正后的回归预测结果确定为所述目标预测结果；

将所述校正后的分类预测结果确定为所述目标预测结果。

在一实施例中，所述处理器在执行所述程序指令而实现所述根据所述分类预测结果校正所述回归预测结果，得到校正后的回归预测结果步骤时，具体实现如下步骤：

在一实施例中，所述处理器在执行所述程序指令而实现所述根据所述回归预测结果校正所述分类预测结果，得到校正后的分类预测结果步骤时，具体实现如下步骤：

在一实施例中，所述处理器在执行所述程序指令而实现所述获取目标行业因子数据步骤时，具体实现如下步骤：

在一实施例中，所述处理器在执行所述程序指令而实现所述将所述目标行业因子数据分别输入预设的模型集合中的目标回归模型以及目标分类模型进行结果预测步骤之前，还实现如下步骤：

构建所述模型集合；

在一实施例中，所述处理器在执行所述程序指令而实现所述根据历史行业因子数据以及历史结果确定所述模型集合中每个模型的质量分数步骤时，具体实现如下步骤：

所述存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的。例如，各个单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。

本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本申请实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。

该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，终端，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

一种基于模型集合的数据预测方法，包括：

获取目标行业因子数据；

将所述目标行业因子数据分别输入预设的模型集合中的目标回归模型以及目标分类模型进行结果预测，分别得到回归预测结果以及分类预测结果，所述模型集合包括多个分类模型以及多个回归模型，所述目标分类模型以及所述目标回归模型分别为所述模型集合中质量分数最高的分类模型以及质量分数最高的回归模型；

确定所述回归预测结果与所述分类预测结果的方向是否一致；

若所述回归预测结果与所述分类预测结果的方向一致，则根据目标预测类型从所述回归预测结果以及所述分类预测结果中确定目标预测结果；

若所述回归预测结果与所述分类预测结果的方向不一致，则根据目标预测类型以及预设的校正规则确定目标预测结果。
根据权利要求1所述的方法，其中，所述根据目标预测类型以及预设的校正规则确定目标预测结果，包括：

若所述目标预测类型为回归类型，且所述目标分类模型的质量分数大于所述目标回归模型的质量分数，则根据所述分类预测结果校正所述回归预测结果，得到校正后的回归预测结果；

将所述校正后的回归预测结果确定为所述目标预测结果；

若所述目标预测类型为分类类型，且所述目标回归模型的质量分数大于所述目标分类模型的质量分数，则根据所述回归预测结果校正所述分类预测结果，得到校正后的分类预测结果；

将所述校正后的分类预测结果确定为所述目标预测结果。
根据权利要求2所述的方法，其中，所述根据所述分类预测结果校正所述回归预测结果，得到校正后的回归预测结果，包括：

根据模型集合中回归模型的质量分数更改目标回归模型，得到更改后的目标回归模型；

将所述目标行业因子数据输入所述更改后的目标回归模型，得到更改后的回归预测结果；

若所述更改后的回归预测结果与所述分类预测结果的方向一致，则将所述更改后的回归预测结果确定为所述校正后的回归预测结果；

若所述更改后的回归预测结果与所述分类预测结果的方向不一致，则返回执行所述根据模型集合中回归模型的质量分数更改目标回归模型的步骤。
根据权利要求2所述的方法，其中，所述根据所述回归预测结果校正所述分类预测结果，得到校正后的分类预测结果，包括：

根据模型集合中分类模型的质量分数更改目标分类模型，得到更改后的目标分类模型；

将所述目标行业因子数据输入所述更改后的目标分类模型，得到更改后的分类预测结果；

若所述更改后的分类预测结果与所述回归预测结果的方向一致，则将所述更改后的分类预测结果确定为所述校正后的分类预测结果；

若所述更改后的分类预测结果与所述回归预测结果的方向不一致，则返回执行所述根据模型集合中分类模型的质量分数更改目标分类模型的步骤。
根据权利要求1所述的方法，其中，所述获取目标行业因子数据，包括：

获取第一行业因子数据，所述第一行业因子数据为未经处理的行业因子数据；

对所述第一行业因子数据进行数据预处理，得到第二行业因子数据；

对所述第二行业因子数据进行特征工程处理，得到所述目标行业因子数据。
根据权利要求1所述的方法，其中，所述将所述目标行业因子数据分别输入预设的模型集合中的目标回归模型以及目标分类模型进行结果预测之前，所述方法还包括：

构建所述模型集合；

根据历史行业因子数据以及历史结果确定所述模型集合中每个模型的质量分数。
根据权利要求6所述的方法，其中，所述根据历史行业因子数据以及历史结果确定所述模型集合中每个模型的质量分数，包括：

将所述历史行业因子数据输入所述模型集合中每个模型中，得到每个模型分别对应的预测结果；

根据所述预测结果以及所述历史结果分别确定所述模型集合中每个模型的质量分数。
一种基于模型集合的数据预测装置，包括：

获取单元，用于获取目标行业因子数据；

输入单元，用于将所述目标行业因子数据分别输入预设的模型集合中的目标回归模型以及目标分类模型进行结果预测，分别得到回归预测结果以及分类预测结果，所述模型集合包括多个分类模型以及多个回归模型，所述目标分类模型以及所述目标回归模型分别为所述模型集合中质量分数最高的分类模型以及质量分数最高的回归模型；

第一确定单元，用于确定所述回归预测结果与所述分类预测结果的方向是否一致；

第二确定单元，用于当所述回归预测结果与所述分类预测结果的方向一致时，根据目标预测类型从所述回归预测结果以及所述分类预测结果中确定目标预测结果；

第三确定单元，用于当所述回归预测结果与所述分类预测结果的方向不一致时，根据预设的校正规则确定目标预测结果。
一种计算机设备，其中，所述计算机设备包括存储器及处理器，所述存储器上存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

获取目标行业因子数据；

将所述目标行业因子数据分别输入预设的模型集合中的目标回归模型以及目标分类模型进行结果预测，分别得到回归预测结果以及分类预测结果，所述模型集合包括多个分类模型以及多个回归模型，所述目标分类模型以及所述目标回归模型分别为所述模型集合中质量分数最高的分类模型以及质量分数最高的回归模型；

确定所述回归预测结果与所述分类预测结果的方向是否一致；

若所述回归预测结果与所述分类预测结果的方向一致，则根据目标预测类型从所述回归预测结果以及所述分类预测结果中确定目标预测结果；

若所述回归预测结果与所述分类预测结果的方向不一致，则根据目标预测类型以及预设的校正规则确定目标预测结果。
根据权利要求9所述的计算机设备，其中，所述根据目标预测类型以及预设的校正规则确定目标预测结果，包括：

若所述目标预测类型为回归类型，且所述目标分类模型的质量分数大于所述目标回归模型的质量分数，则根据所述分类预测结果校正所述回归预测结果，得到校正后的回归预测结果；

将所述校正后的回归预测结果确定为所述目标预测结果；

若所述目标预测类型为分类类型，且所述目标回归模型的质量分数大于所述目标分类模型的质量分数，则根据所述回归预测结果校正所述分类预测结果，得到校正后的分类预测结果；

将所述校正后的分类预测结果确定为所述目标预测结果。
根据权利要求10所述的计算机设备，其中，所述根据所述分类预测结果校正所述回归预测结果，得到校正后的回归预测结果，包括：

根据模型集合中回归模型的质量分数更改目标回归模型，得到更改后的目标回归模型；

将所述目标行业因子数据输入所述更改后的目标回归模型，得到更改后的回归预测结果；

若所述更改后的回归预测结果与所述分类预测结果的方向一致，则将所述更改后的回归预测结果确定为所述校正后的回归预测结果；

若所述更改后的回归预测结果与所述分类预测结果的方向不一致，则返回执行所述根据模型集合中回归模型的质量分数更改目标回归模型的步骤。
根据权利要求10所述的计算机设备，其中，所述根据所述回归预测结果校正所述分类预测结果，得到校正后的分类预测结果，包括：

根据模型集合中分类模型的质量分数更改目标分类模型，得到更改后的目标分类模型；

将所述目标行业因子数据输入所述更改后的目标分类模型，得到更改后的分类预测结果；

若所述更改后的分类预测结果与所述回归预测结果的方向一致，则将所述更改后的分类预测结果确定为所述校正后的分类预测结果；

若所述更改后的分类预测结果与所述回归预测结果的方向不一致，则返回执行所述根据模型集合中分类模型的质量分数更改目标分类模型的步骤。
根据权利要求9所述的计算机设备，其中，所述获取目标行业因子数据，包括：

获取第一行业因子数据，所述第一行业因子数据为未经处理的行业因子数据；

对所述第一行业因子数据进行数据预处理，得到第二行业因子数据；

对所述第二行业因子数据进行特征工程处理，得到所述目标行业因子数据。
根据权利要求9所述的计算机设备，其中，所述将所述目标行业因子数据分别输入预设的模型集合中的目标回归模型以及目标分类模型进行结果预测之前，所述方法还包括：

构建所述模型集合；

根据历史行业因子数据以及历史结果确定所述模型集合中每个模型的质量分数。
根据权利要求14所述的计算机设备，其中，所述根据历史行业因子数据以及历史结果确定所述模型集合中每个模型的质量分数，包括：

将所述历史行业因子数据输入所述模型集合中每个模型中，得到每个模型分别对应的预测结果；

根据所述预测结果以及所述历史结果分别确定所述模型集合中每个模型的质量分数。
一种计算机可读存储介质，其中，所述存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时实现以下步骤：

获取目标行业因子数据；

将所述目标行业因子数据分别输入预设的模型集合中的目标回归模型以及目标分类模型进行结果预测，分别得到回归预测结果以及分类预测结果，所述模型集合包括多个分类模型以及多个回归模型，所述目标分类模型以及所述目标回归模型分别为所述模型集合中质量分数最高的分类模型以及质量分数最高的回归模型；

确定所述回归预测结果与所述分类预测结果的方向是否一致；

若所述回归预测结果与所述分类预测结果的方向一致，则根据目标预测类型从所述回归预测结果以及所述分类预测结果中确定目标预测结果；

若所述回归预测结果与所述分类预测结果的方向不一致，则根据目标预测类型以及预设的校正规则确定目标预测结果。
根据权利要求16所述的存储介质，其中，所述根据目标预测类型以及预设的校正规则确定目标预测结果，包括：

若所述目标预测类型为回归类型，且所述目标分类模型的质量分数大于所述目标回归模型的质量分数，则根据所述分类预测结果校正所述回归预测结果，得到校正后的回归预测结果；

将所述校正后的回归预测结果确定为所述目标预测结果；

若所述目标预测类型为分类类型，且所述目标回归模型的质量分数大于所述目标分类模型的质量分数，则根据所述回归预测结果校正所述分类预测结果，得到校正后的分类预测结果；

将所述校正后的分类预测结果确定为所述目标预测结果。
根据权利要求17所述的存储介质，其中，所述根据所述分类预测结果校正所述回归预测结果，得到校正后的回归预测结果，包括：

根据模型集合中回归模型的质量分数更改目标回归模型，得到更改后的目标回归模型；

将所述目标行业因子数据输入所述更改后的目标回归模型，得到更改后的回归预测结果；

若所述更改后的回归预测结果与所述分类预测结果的方向一致，则将所述更改后的回归预测结果确定为所述校正后的回归预测结果；

若所述更改后的回归预测结果与所述分类预测结果的方向不一致，则返回执行所述根据模型集合中回归模型的质量分数更改目标回归模型的步骤。
根据权利要求17所述的存储介质，其中，所述根据所述回归预测结果校正所述分类预测结果，得到校正后的分类预测结果，包括：

根据模型集合中分类模型的质量分数更改目标分类模型，得到更改后的目标分类模型；

将所述目标行业因子数据输入所述更改后的目标分类模型，得到更改后的分类预测结果；

若所述更改后的分类预测结果与所述回归预测结果的方向一致，则将所述更改后的分类预测结果确定为所述校正后的分类预测结果；

若所述更改后的分类预测结果与所述回归预测结果的方向不一致，则返回执行所述根据模型集合中分类模型的质量分数更改目标分类模型的步骤。
根据权利要求16所述的存储介质，其中，所述获取目标行业因子数据，包括：

获取第一行业因子数据，所述第一行业因子数据为未经处理的行业因子数据；

对所述第一行业因子数据进行数据预处理，得到第二行业因子数据；

对所述第二行业因子数据进行特征工程处理，得到所述目标行业因子数据。