CN114519307A

CN114519307A - 信息预测方法、装置、系统、存储介质及电子设备

Info

Publication number: CN114519307A
Application number: CN202210155642.3A
Authority: CN
Inventors: 马晓雯; 庄晓天
Original assignee: Beijing Jingdong Zhenshi Information Technology Co Ltd
Current assignee: Beijing Jingdong Zhenshi Information Technology Co Ltd
Priority date: 2022-02-21
Filing date: 2022-02-21
Publication date: 2022-05-20

Abstract

本公开涉及数据处理领域，具体涉及一种信息预测方法、装置、系统、存储介质及电子设备。该信息预测方法包括获取预测对象的历史数据，并基于所述预测对象的历史数据中的时序数据确定所述预测对象的时序类别；基于预设的时序类别与模型集合的映射关系提取与所述预测对象的时序类别对应的模型集合；其中，所述模型集合包括至少一个预测模型；根据所述预测对象的历史数据利用所述模型集合中所述预测模型对所述预测对象进行模型预测，得到所述预测对象的模型预测值。本公开提供的信息预测方法能够根据预测对象的特性进行合理预测以提高信息预测的精度。

Description

信息预测方法、装置、系统、存储介质及电子设备

技术领域

本公开涉及数据处理领域，具体涉及一种信息预测方法、信息预测装置、信息预测系统、存储介质及电子设备。

背景技术

在现实场景中，通常会根据历史数据进行预测得到预测值，再基于预测值进行相关决策。例如在物流场景中，零售企业在进行库存管理，需要对未来一段时间的商品销量进行估计，进而制定商品采购以及补货等策略。

现有技术中的信息预测往往是采用统一的预测思路，基于单一的模型预测，也没有区分预测对象的不同特性，预测结果的精度较低，进而会导致业务决策不够科学，造成实际损失。

需要说明的是，在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本公开的目的在于提供一种信息预测方法、信息预测装置、信息预测系统、存储介质及电子设备，旨在根据预测对象的特性进行合理预测以提高信息预测的精度。

本公开的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本公开的实践而习得。

根据本公开实施例的一方面，提供了信息预测方法，包括：获取预测对象的历史数据，并基于所述预测对象的历史数据中的时序数据确定所述预测对象的时序类别；基于预设的时序类别与模型集合的映射关系提取与所述预测对象的时序类别对应的模型集合；其中，所述模型集合包括至少一个预测模型；根据所述预测对象的历史数据利用所述模型集合中所述预测模型对所述预测对象进行模型预测，得到所述预测对象的模型预测值。

根据本公开的一些实施例，基于前述方案，所述基于所述预测对象的历史数据中的时序数据确定所述预测对象的时序类别，包括：在所述时序数据满足第一时序条件时，根据所述时序数据的季节性分类结果和间歇性分类结果确定所述时序类别；或者在所述时序数据满足第二时序条件时，根据所述时序数据的季节性分类结果和趋势性分类结果确定所述时序类别。

根据本公开的一些实施例，基于前述方案，所述根据所述预测对象的历史数据利用所述模型集合中所述预测模型对所述预测对象进行模型预测，得到所述预测对象的模型预测值，包括：在所述模型集合包括多个所述预测模型时，根据所述预测对象的历史数据利用各所述预测模型对所述预测对象分别进行模型预测，得到各所述预测模型分别对应的模型预测值；将所述各所述预测模型分别对应的模型预测值的平均值作为所述预测对象的模型预测值；或者在所述模型集合包括一个所述预测模型时，根据所述预测对象的历史数据利用该所述预测模型对所述预测对象进行模型预测，得到所述预测对象的模型预测值。

根据本公开的一些实施例，基于前述方案，所述方法还包括：预设时序类别与模型集合的映射关系，所述预设时序类别与模型集合的映射关系，包括：基于历史对象的时序数据确定所述历史对象的时序类别，并将所述时序类别相同的所述历史对象划分至同一类别集合；以及根据所述历史对象的历史数据，利用模型池中各所述预测模型对所述历史对象分别进行模型预测，得到各模型预测对应的预测值和回测误差；基于所述预测值和所述回测误差从所述模型池中进行模型筛选得到所述类别集合对应的模型集合；创建所述类别集合对应的时序类别与所述类别集合对应的模型集合之间的映射关系。

根据本公开的一些实施例，基于前述方案，所述根据所述历史对象的历史数据，利用模型池中各所述预测模型对所述历史对象分别进行模型预测，得到各模型预测对应的预测值和回测误差，包括：将所述历史数据划分成训练集和验证集；根据所述训练集利用模型池中各所述预测模型对所述历史对象进行模型预测，得到各模型预测对应的所述预测值；基于所述预测值和所述验证集计算各模型预测对应的所述回测误差。

根据本公开的一些实施例，基于前述方案，所述基于所述预测值和所述验证集计算各模型预测对应的所述回测误差，包括：基于所述预测值和所述验证集利用一所述预测模型对一所述历史对象进行模型预测以确定最优预测参数；根据所述最优预测参数中的回测误差衡量指标计算该历史对象对应该预测模型的所述回测误差；遍历所述预测模型和所述历史对象得到各所述预测模型分别预测所述历史对象的所述回测误差。

根据本公开的一些实施例，基于前述方案，所述基于所述预测值和所述验证集利用一所述预测模型对一所述历史对象进行模型预测以确定最优预测参数，包括：配置多组预测参数；其中，一组预测参数包括验证集大小、回测误差衡量指标和模型权重计算策略；基于各组预测参数、所述预测值和所述验证集利用一所述预测模型对一所述历史对象进行模型预测，并基于预设的准确率指标计算各组预测参数分别对应的准确率；将所述准确率最高值对应的一组预测参数配置为所述最优预测参数。

根据本公开的一些实施例，基于前述方案，所述基于所述预测值和所述回测误差从所述模型池中进行模型筛选得到所述类别集合对应的模型集合，包括：将所述模型池配置为所述类别集合对应的初始模型集合；

基于所述回测误差从所述初始模型集合中选择目标预测模型；基于所述预测值确定所述目标预测模型的筛选结果；根据所述筛选结果更新所述初始模型集合；重复上述模型筛选过程，直至所述模型池中各所述预测模型均被考虑过目标预测模型或所述初始模型集合包括一个所述预测模型时，将更新后的所述初始模型集合作为所述类别集合对应的模型集合。

根据本公开的一些实施例，基于前述方案，所述基于所述回测误差从所述初始模型集合中选择目标预测模型，包括：基于所述回测误差计算所述模型池中各所述预测模型的综合误差；将所述初始模型集合中未考虑过目标预测模型且所述综合误差最大的预测模型确定为所述目标预测模型。

根据本公开的一些实施例，基于前述方案，所述基于所述回测误差计算所述模型池中各所述预测模型的综合误差，包括：针对一所述预测模型，从所述回测误差中提取该预测模型分别预测所述历史对象的回测误差；将该预测模型分别预测所述历史对象的回测误差的平均值作为所述综合误差；遍历所述模型池中各所述预测模型，以得到各所述预测模型的综合误差。

根据本公开的一些实施例，基于前述方案，所述基于所述预测值确定所述目标预测模型的筛选结果，包括：基于所述预测值计算未剔除所述目标预测模型时的第一组合模型的第一平均误差，以及剔除所述目标预测模型时的第二组合模型的第二平均误差；根据所述第一平均误差与所述第二平均误差的关系确定所述筛选结果。

根据本公开的一些实施例，基于前述方案，所述基于所述预测值计算未剔除所述目标预测模型时的第一组合模型的第一平均误差，包括：针对所述类别集合中一所述历史对象，从所述预测值中提取所述第一组合模型中各所述预测模型分别预测该历史对象的预测值，以及获取该历史对象的验证集；基于所述第一组合模型中各所述预测模型分别预测该历史对象的预测值和该历史对象的验证集，计算所述第一组合模型中该历史对象的第一组合回测误差；在所述类别集合包括多个所述历史对象时，将各所述历史对象的第一组合回测误差的平均值作为所述第一平均误差；或者在述类别集合包括一个历史对象时，将所述历史对象的第一组合回测误差作为所述第一平均误差。

根据本公开的一些实施例，基于前述方案，所述根据所述第一平均误差与所述第二平均误差的关系确定所述筛选结果，包括：在所述第二平均误差小于或等于所述第一平均误差时，确定所述筛选结果为删除所述目标预测模型；在所述第二平均误差大于所述第一平均误差时，确定所述筛选结果为不删除所述目标预测模型。

根据本公开的一些实施例，基于前述方案，所述方法还包括：计算所述模型池中各所述预测模型的权重，以根据所述权重计算所述第一组合回测误差；所述计算所述模型池中各所述预测模型的权重，包括：基于一所述预测模型对一所述历史对象进行模型预测的预测准确率确定模型预测的最优预测参数；根据所述最优预测参数中的回测误差衡量指标计算回测误差；根据所述回测误差和所述最优预测参数中的模型权重计算策略计算该历史对象对应的该预测模型的初始权重；将所述初始权重进行归一化处理得到各模型预测对应的权重。

根据本公开的一些实施例，基于前述方案，在所述根据所述预测对象的历史数据利用所述模型集合中所述预测模型对所述预测对象进行模型预测，得到所述预测对象的模型预测值之后，所述方法还包括：根据所述预测对象的历史数据利用朴素法进行预测得到朴素预测值；根据所述朴素预测值与所述模型预测值的比较结果进行比例调整，以得到所述预测对象的最终预测值。

根据本公开的一些实施例，基于前述方案，所述根据所述朴素预测值与所述模型预测值的比较结果进行比例调整，以得到所述预测对象的最终预测值，包括：在所述比较结果满足第一比较条件时，基于预设的缩小比例、所述朴素预测值和所述模型预测值计算所述最终预测值；在所述比较结果满足第二比较条件时，基于预设的放大比例、所述朴素预测值和所述模型预测值计算所述最终预测值；或者在所述比较结果满足第三比较条件时，则将所述模型预测值作为所述最终预测值。

根据本公开实施例的第二方面，提供了一种信息预测系统，包括：预处理模块，用于预设时序类别与模型集合的映射关系；组合预测模块，用于基于预测对象的历史数据中的时序数据确定所述预测对象的时序类别，并基于所述映射关系提取与所述预测对象的时序类别对应的模型集合以进行模型预测，得到所述预测对象的模型预测值。

根据本公开的一些实施例，基于前述方案，所述预处理模块还包括：对象处理单元，所述对象处理单元包括时序分类单元、预测回测单元、第一存储单元；其中，所述时序分类单元，用于基于历史对象的时序数据确定所述历史对象的时序类别；所述预测回测单元，用于根据所述历史对象的历史数据获取所述历史对象的验证集、各预测模型对所述历史对象分别进行模型预测的预测值和回测误差；所述第一存储单元，用于将所述历史对象的时序类别、验证集、各预测模型分别进行模型预测的预测值和回测误差存储至对象数据库中。

根据本公开的一些实施例，基于前述方案，所述预处理模块还包括：分类筛选单元，所述分类筛选单元包括模型筛选单元和第二存储单元；其中，所述模型筛选单元，用于基于对象数据库进行模型筛选得到时序类别与模型集合的映射关系；所述第二存储单元，用于根据所述映射关系将时序类别以及所述时序类别对应的模型集合存储至模型集合数据库中。

根据本公开的一些实施例，基于前述方案，所述组合预测模块还包括后处理单元；其中，所述后处理单元，用于根据所述预测对象的历史数据利用朴素法进行预测得到朴素预测值，并根据所述朴素预测值与所述模型预测值的比较结果进行比例调整，以得到所述预测对象的最终预测值。

根据本公开实施例的第三方面，提供了一种信息预测装置，包括：分类模块，用于获取预测对象的历史数据，并基于所述预测对象的历史数据中的时序数据确定所述预测对象的时序类别；提取模块，用于基于预设的时序类别与模型集合的映射关系提取与所述预测对象的时序类别对应的模型集合；其中，所述模型集合包括至少一个预测模型；预测模块，用于根据所述预测对象的历史数据利用所述模型集合中所述预测模型对所述预测对象进行模型预测，得到所述预测对象的模型预测值。

根据本公开实施例的第四方面，提供了一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现如上述实施例中的信息预测方法。

根据本公开实施例的第五方面，提供了一种电子设备，其特征在于，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如上述实施例中的信息预测方法。

本公开示例性实施例可以具有以下部分或全部有益效果：

在本公开的一些实施例所提供的技术方案中，本公开提供的信息预测方法能够根据预测对象历史数据中的时序数据进行时序类别划分，再根据时序类别选择对应的模型集合进行预测。相较于采用同一模型进行预测的技术方案，一方面能够区分预测对象的时序特性，利用不同模型集合中的预测模型进行预测，提高模型预测的准确性；另一方面，当模型集合中过包括多个预测模型时，也能够综合各预测模型的预测结果，进一步提高模型预测的准确性。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1示意性示出本公开示例性实施例中一种信息预测方法的流程示意图；

图2示意性示出本公开示例性实施例中一种预设映射关系方法的流程示意图；

图3示意性示出本公开示例性实施例中一种模型筛选方法的流程示意图；

图4示意性示出本公开示例性实施例中一种预测后处理方法的流程示意图；

图5示意性示出本公开示例性实施例中一种信息预测系统框架示意图；

图6示意性示出本公开示例性实施例中一种信息预测装置的组成示意图；

图7示意性示出本公开示例性实施例中一种计算机可读存储介质的示意图；

图8示意性示出本公开示例性实施例中一种电子设备的计算机系统的结构示意图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本公开将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。

此外，所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中，提供许多具体细节从而给出对本公开的实施例的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而没有特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。

附图中所示的方框图仅仅是功能实体，不一定必须与物理上独立的实体相对应。即，可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

附图中所示的流程图仅是示例性说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解，而有的操作/步骤可以合并或部分合并，因此实际执行的顺序有可能根据实际情况改变。

在现有技术中，利用WEOSM模型(Weighted ensemble of statistical models)进行模型预测表现较佳，但也存在一些问题。

一方面，在预测过程中没有考虑预测对象的时序特性，存在趋势性与不存在趋势性的对应的模型分类结果并没有显著差异，反而增加了模型筛选的复杂度，预测精度也较差。

另一方面，WEOSM模型中使用

(朴素法)方法对预测结果进行后处理，导致最近一期销量对预测结果的影响较大，很容易造成预测结果偏高或偏低。例如以下情况：

(1)预测偏高：例如假设某SKU(Stock Keeping Unit，商品最小单位)的历史销量数据为[0，1，0，0，1，0，0，0，0，1]，将前六期[0，1，0，0，1，0]作为训练集，后四期作为测试集[0，0，0，1]，使用

方法对测试集的拟合结果为[0，0，0，0]，与测试集相比拟合误差较低，但若使用

方法做最终的预测，则预测值为[1，1，1，1]，根据对历史销量数据的分析，该商品的间歇性较强，出现上述持续有销量的概率极低，因此预测值偏高。

(2)预测偏低：例如假设某SKU历史销量数据为[6，4，5，3，4，4，4，5，4，2]，将前六期[6，4，5，3，4，4]作为训练集，后四期作为测试集[4，5，4，2]，使用

方法对测试集的拟合结果为[4，4，4，4]，与测试集相比拟合误差较低，但若使用

方法做最终的预测，则预测值为[2，2，2，2]，根据对历史销量数据的分析，该商品的销量均值在4附近，出现上述持续低销量的概率极低，因此预测值偏低。

再一方面，WEOSM模型并没有明确的适用于分布式系统的计算框架，而在企业实际的销量预测场景，销量数据可能被分布式地存储，并且对模型的运行时间也有一定的限制，因此需要一个合适的分布式计算框架将WEOSM模型拓展到分布式系统中。

因此，基于上述WEOSM模型的缺点，本公开提供了一种信息预测方法，能够考虑预测对象的时序特性，提高预测精度，并且进行合理的后处理，同时提供一种合适的分布式计算框架用于解决现有技术中存在的技术问题。

以下对本公开实施例的技术方案的实现细节进行详细阐述。

图1示意性示出本公开示例性实施例中一种信息预测方法的流程示意图。如图1所示，该信息预测方法包括步骤S11至步骤S13：

步骤S11，获取预测对象的历史数据，并基于所述预测对象的历史数据中的时序数据确定所述预测对象的时序类别；

步骤S12，基于预设的时序类别与模型集合的映射关系提取与所述预测对象的时序类别对应的模型集合；其中，所述模型集合包括至少一个预测模型；

步骤S13，根据所述预测对象的历史数据利用所述模型集合中所述预测模型对所述预测对象进行模型预测，得到所述预测对象的模型预测值。

下面，将结合附图及实施例对本示例实施方式中的信息预测方法的各个步骤进行更详细的说明。

在步骤S11中，获取预测对象的历史数据，并基于所述预测对象的历史数据中的时序数据确定所述预测对象的时序类别。

其中，预测对象为需要进行信息预测的对象，在不同的预测场景中预测对象以及预测对象的历史数据不同。以零售业务进行商品销量预测为例，预测对象是商品SKU(StockKeeping Unit，商品最小单位)，预测对象的历史数据是历史记录中该商品各时间点对应的销量值，其中历史记录中的时间点则为该预测对象的时序数据。

进一步地，所述基于所述预测对象的历史数据中的时序数据确定所述预测对象的时序类别，包括：在所述时序数据满足第一时序条件时，根据所述时序数据的季节性分类结果和间歇性分类结果确定所述时序类别；或者在所述时序数据满足第二时序条件时，根据所述时序数据的季节性分类结果和趋势性分类结果确定所述时序类别。

具体而言，对于历史对象SKU的一条时间序列，引入间歇性分类标准，对于整体间歇性较强的数据集，根据数据的季节性和间歇性进行分类，而对于整体间歇性较弱的数据集，根据数据的季节性和趋势性进行分类。

因此，首先根据时序数据进行预判断，当时序数据满足第一时序条件，即整体间歇性较强时，基于时序数据判断是否存在季节性和间歇性，根据判断结果可以将历史对象划分为存在季节性且存在间歇性、存在季节性但不存在间歇性、不存在季节性但存在间歇性、不存在季节性且不存在间歇性四个种类。

而当时序数据满足二时序条件，即整体间歇性较弱时，基于时序数据判断是否存在季节性和趋势性，根据判断结果可以将历史对象划分为存在季节性且存在趋势性、存在季节性但不存在趋势性、不存在季节性但存在趋势性、不存在季节性且不存在趋势性四个种类。

因此，基于上述描述，历史对象的时序种类共有八类，基于预测对象的历史数据中的时序数据确定该预测对象属于这八类时序种类中的哪一种类。

其中，在进行分类时涉及到基于时序数据判断SKU的整体间歇性以及是否存在季节性、间歇性、趋势性，具体方法如下：

(1)整体间歇性：若无数据的连续时间超过一定比例时，判断为整体间歇性强，否则为整体间歇性弱；例如计算历史销量数据中的零占比，若所有SKU的零占比均值高于预设阈值0.5，则判断为整体间歇性强，否则为整体间歇性弱；

(2)季节性：采用置信度为90％的自相关检验；

(3)间歇性：若时间序列中0需求所占的比例超过0.5，则定义其存在间歇性，否则不存在间歇性；

(4)趋势性：采用置信度为95％的Mann-Kendall趋势性检验；

在步骤S12中，基于预设的时序类别与模型集合的映射关系提取与所述预测对象的时序类别对应的模型集合；其中，所述模型集合包括至少一个预测模型。

具体地，提前预设了时序类别与模型集合的映射关系。在获取到预测对象的时序类别后，根据映射关系获取该时序类别对应的模型集合。

需要说明的是，模型集合至少一个预测模型，也就是包括一个或多个预测模型。预测模型可以是现有技术中的常规预测模型，例如趋势外推预测模型、回归预测模型、卡尔曼滤波预测模型、BP神经网络预测模型等等。

在步骤S13中，根据所述预测对象的历史数据利用所述模型集合中所述预测模型对所述预测对象进行模型预测，得到所述预测对象的模型预测值。

其中，在模型集合中包括一个或多个预测模型时，得到模型预测值的过程存在一些差异，具体如下：

在所述模型集合包括多个所述预测模型时，根据所述预测对象的历史数据利用各所述预测模型对所述预测对象分别进行模型预测，得到各所述预测模型分别对应的模型预测值；将所述各所述预测模型分别对应的模型预测值的平均值作为所述预测对象的模型预测值；或者

在所述模型集合包括一个所述预测模型时，根据所述预测对象的历史数据利用该所述预测模型对所述预测对象进行模型预测，得到所述预测对象的模型预测值。

具体而言，当模型集合中包括多个预测模型时，每一个预测模型都可以根据预测对象的历史数据进行模型预测得到一个模型预测值，所以需要将各预测模型得到的模型预测值求平均以得到最终的模型预测值。当然，也可以预设各预测模型的权重进行加权求和，或者其他方式综合各预测模型的预测值得到最终的模型预测值，本公开在此不做限定。

而当模型集合中只包括一个预测模型时，就不存在综合的问题，可以直接将该预测模型进行模型预测得到的预测值作为预测对象的模型预测值。

在本公开的一个实施例中，所述方法还包括：预设时序类别与模型集合的映射关系。图2示意性示出本公开示例性实施例中一种预设映射关系方法的流程示意图。如图2所示，该预设映射关系方法包括步骤S21至步骤S24：

步骤S21，基于历史对象的时序数据确定所述历史对象的时序类别，并将所述时序类别相同的所述历史对象划分至同一类别集合；以及

步骤S22，根据所述历史对象的历史数据，利用模型池中各所述预测模型对所述历史对象分别进行模型预测，得到各模型预测对应的预测值和回测误差；

步骤S23，基于所述预测值和所述回测误差从所述模型池中进行模型筛选得到所述类别集合对应的模型集合；

步骤S24，创建所述类别集合对应的时序类别与所述类别集合对应的模型集合之间的映射关系。

接下来，对以上预设映射关系方法中的步骤S21至步骤S24进行详细解释。

在步骤S21中，基于历史对象的时序数据确定所述历史对象的时序类别，并将所述时序类别相同的所述历史对象划分至同一类别集合。

其中，历史对象与预测对象相似。比如在商品销量预测场景中，历史对象也是商品SKU。与确定预测对象的时序类别相似，同样是首先基于历史对象的时序数据进行整体间歇性的预判，然后在根据相应的原则对季节性、间歇性或季节性和趋势性进行判断，最终得到该历史对象的时序类别，所以此处不再赘述。

在确定了所有SKU的时序类别之后，对SKU进行分类，将时序类别相同的SKU划分为一类，形成类别集合，以方便后续根据类别集合进行模型筛选，进而得到该时序类别对应的模型集合。

在步骤S22中，根据所述历史对象的历史数据，利用模型池中各所述预测模型对所述历史对象分别进行模型预测，得到各模型预测对应的预测值和回测误差。

为了更直观地描述，假设共有i个历史对象，表示为SKU_i，模型池中共有j个预测模型，表示为M_j。根据SKU_i的历史数据利用M_j对SKU_i进行模型预测，得到预测值表示为

其回测误差表示为E_ij。

进一步地，所述所述根据所述历史对象的历史数据，利用模型池中各所述预测模型对所述历史对象分别进行模型预测，得到各模型预测对应的预测值和回测误差，包括：

步骤S221，将所述历史数据划分成训练集和验证集；

步骤S222，根据所述训练集利用模型池中各所述预测模型对所述历史对象进行模型预测，得到各模型预测对应的所述预测值；

步骤S223，基于所述预测值和所述验证集计算各模型预测对应的所述回测误差。

具体而言，为了能够对预测结果的误差进行计算，将SKU_i的历史数据分割成训练集和验证集，训练集用于预测模型M_j进行模型预测得到预测值

然后根据预测值

和验证集Y_i计算回测误差E_ij。

划分之后，预测模型基于训练集进行模型训练，模型训练完成后利用训练好的模型得到验证集上的预测值，最后根据验证集上的预测值以及验证集上的真实值计算回测误差。

以商品销量预测为例，假设历史数据包括A商品100天的销量数据，将前80天的销量数据划分为训练集，将后20天的销量数据划分为验证集。预测模型利用前80天的销量数据进行模型训练，训练完成后对后20天的销量数据进行预测得到后20天每一天的销量预测值，即

其中h代表时间点。然后根据后20天的销量预测值

以及验证集中后20天的真实销量值Y_ih进行比较计算得到回测误差E_ij。

回测误差E_ij的衡量指标有两种：sMAPE和wMAPE，当i和j确定时，计算公式分别为：

其中，h代表验证集上的时间点；H为验证集大小，在本例中，H＝20。

在本公开的一个实施例中，回测误差衡量指标的选择需要根据准确率指标进行模型参数调节来确定。因此，对于步骤S223，所述基于所述预测值和所述验证集计算各模型预测对应的所述回测误差，包括：

步骤S2231，基于所述预测值和所述验证集利用一所述预测模型对一所述历史对象进行模型预测以确定最优预测参数。

进一步地，步骤S2231包括：配置多组预测参数；其中，一组预测参数包括验证集大小、回测误差衡量指标和模型权重计算策略；基于各组预测参数、所述预测值和所述验证集利用一所述预测模型对一所述历史对象进行模型预测，并基于预设的准确率指标计算各组预测参数分别对应的准确率；将所述准确率最高值对应的一组预测参数配置为所述最优预测参数。

具体而言，在模型参数调节过程中，改变模型输入的预测参数，包括验证集大小、回测误差衡量指标和模型权重计算策略等，对于外部给定的准确率指标，记录下不同预测参数输入时模型预测结果的准确率，最终选择准确率最高的情况下的预测参数作为模型的最终输入，即确定了最优预测参数。

举例而言，例如外部给定的准确率指标是1-sMAPE，那么改变模型输入参数，并计算各组参数对应的1-sMAPE值，选择1-sMAPE较大的情况对应的预测参数作为最优参数。

步骤S2232，根据所述最优预测参数中的回测误差衡量指标计算该历史对象对应该预测模型的所述回测误差。

具体而言，最优预测参数中包括了准确率最高时对应的回测误差衡量指标，根据该回测误差衡量指标确定选择sMAPE或wMAPE作为该模型预测的回测误差。

步骤S2233，遍历所述预测模型和所述历史对象得到各所述预测模型分别预测所述历史对象的所述回测误差。

将所有历史对象和模型池中所有预测模型依次两两组合，对于每个历史对象SKU_i利用每个预测模型M_j分别预测，最终得到各模型预测的回测误差E_ij。

需要说明的是，本公开不限定步骤S21和步骤S22的执行顺序，即对历史对象进行类别划分以及得到历史对象的各预测模型的预测值和回测误差可以同时进行，也可以具有先后顺序。

在步骤S23中，基于所述预测值和所述回测误差从所述模型池中进行模型筛选得到所述类别集合对应的模型集合。

进一步地，所述基于所述预测值和所述回测误差从所述模型池中进行模型筛选得到所述类别集合对应的模型集合，包括：

步骤S231，将所述模型池配置为所述类别集合对应的初始模型集合；

步骤S232，基于所述回测误差从所述初始模型集合中选择目标预测模型；

步骤S233，基于所述预测值确定所述目标预测模型的筛选结果；

步骤S234，根据所述筛选结果更新所述初始模型集合；

步骤S235，重复上述模型筛选过程，直至所述模型池中各所述预测模型均被考虑过目标预测模型或所述初始模型集合包括一个所述预测模型时，将更新后的所述初始模型集合作为所述类别集合对应的模型集合。

在本公开的一个实施例中，对于步骤S231，具体而言，在初始条件下，一个类别集合对应的模型集合为模型池中所有预测模型的集合，之后通过依次考虑是否筛选目标预测模型来循环更新模型集合，在满足循环结束的条件时筛选结束的模型集合作为该类别集合的模型聚合。

在本公开的一个实施例中，对于步骤S232，基于所述回测误差从所述初始模型集合中选择目标预测模型，其具体过程如下：

步骤S2321，基于所述回测误差计算所述模型池中各所述预测模型的综合误差。

具体地，首先计算各预测模型M_j对应的综合误差E_j，包括：针对一所述预测模型，从所述回测误差中提取该预测模型分别预测所述历史对象的回测误差；将该预测模型分别预测所述历史对象的回测误差的平均值作为所述综合误差；遍历所述模型池中各所述预测模型，以得到各所述预测模型的综合误差。

以第j个预测模型M_j为例，获取该模型分别预测历史对象SKU_i的回测误差E_ij(i＝1,2,3,…I)，对各回测误差求平均值得到预测模型M_j的综合误差E_j，即：

其中，I表示历史对象的总数。

最后，遍历模型池中所以的预测模型，得到各预测模型M_j的综合误差E_j。

步骤S2322，将所述初始模型集合中未考虑过目标预测模型且所述综合误差最大的预测模型确定为所述目标预测模型。

具体而言，在第一次循环中，初始模型集合中包括模型池中所有的预测模型，所有的测模型均未被确定为目标预测模型，因此直接根据综合误差E_j的结果，将综合误差值最大的预测模型M_j确定为目标预测模型。

在将预测模型M_j确定为目标预测模型后会为该模型加上标识，以标识该模型被考虑过目标预测模型。在后续的循环步骤中，确定目标预测模型时，就从不包含标识的预测模型中选择综合误差最大的预测模型作为目标预测模型。

在本公开的一个实施例中，对于步骤S233，基于所述预测值确定所述目标预测模型的筛选结果，包括：

步骤S2331，基于所述预测值计算未剔除所述目标预测模型时的第一组合模型的第一平均误差，以及剔除所述目标预测模型时的第二组合模型的第二平均误差。

其中，组合模型是指历史对象SKU_i与当前模型集合中的预测模型M_j组成的组合模型。因此，第一组合模型中模型集合中未剔除目标预测模型，第二组合模型中模型集合中已经剔除了目标预测模型。

具体地，以计算第一平均误差为例，其过程包括：针对所述类别集合中一所述历史对象，从所述预测值中提取所述第一组合模型中各所述预测模型分别预测该历史对象的预测值，以及获取该历史对象的验证集；基于所述第一组合模型中各所述预测模型分别预测该历史对象的预测值和该历史对象的验证集，计算所述第一组合模型中该历史对象的第一组合回测误差；在所述类别集合包括多个所述历史对象时，将各所述历史对象的第一组合回测误差的平均值作为所述第一平均误差；或者在述类别集合包括一个历史对象时，将所述历史对象的第一组合回测误差作为所述第一平均误差。

计算第二平均误差与上述过程类似，只是模型集合中缺少了该目标预测模型，同样也是先计算第二组合回测误差，再根据第二组合回测误差计算最终的第二平均误差。

对于计算第一组合回测误差或第二组合回测误差，同样都是计算组合回测误差。在计算组合回测误差时，首先针对类别集合中一历史对象SKU_i，获取各预测模型分别预测该历史对象的预测值

以及该历史对象的验证集Y_i，然后根据预测值

和验证集Y_i计算组合回测误差E_i，即

其中，J*表示当前模型集合的预测模型M_j的总数，E()表示回测误差函数，可选择sMAPE或wMAPE，计算回测误差与步骤S223中的计算过程相同，此处就不在赘述。

当然，在本公开中另外的实施例中，各个预测模型M_j还可以具有自身的权重w_j，在计算组合回测误差E_i时，按照各模型的权重进行加权求和，组合回测误差的精度更高，即：

在得到组合回测误差之后，根据类别集合中历史对象的个数计算最终的平均误差。当同一类别集合中包括多个历史对象时，则对各组合回测误差E_i求平均值得到最终的平均误差，而当同一类别集合中只包括一个历史对象时，将组合回测误差E_i作为最终的平均误差。为了将目标预测模型剔除前后的组合回测误差进行区别，将未剔除目标预测模型对应的第一平均误差表记为E，将剔除目标预测模型对应的第二平均误差表记为E*。

步骤S2332，根据所述第一平均误差与所述第二平均误差的关系确定所述筛选结果。

进一步地，在所述第二平均误差小于或等于所述第一平均误差时，确定所述筛选结果为删除所述目标预测模型；在所述第二平均误差大于所述第一平均误差时，确定所述筛选结果为不删除所述目标预测模型。

当计算出第一平均误差表E和第二平均误差表记为E*后，将E与E*进行比较，如果E*≤E，则说明剔除目标预测模型后平均误差没有增加，那么就可以将该目标预测模型从模型集合中删除；而如果E*＞E，也就是剔除目标预测模型后平均误差增大了，那么就不能剔除该目标预测模型，将目标预测模型继续保留在模型集合中。

在本公开的一个实施例中，对于步骤S234，根据所述筛选结果更新所述初始模型集合。

根据步骤S2332中的筛选结果更新模型集合。如果筛选结果为删除，那么就将该预测模型从模型集合中剔除，反之则保留该预测模型。

在本公开的一个实施例中，对于步骤S235，重复上述模型筛选过程，直至所述模型池中各所述预测模型均被考虑过目标预测模型或所述初始模型集合包括一个所述预测模型时，将更新后的所述初始模型集合作为所述类别集合对应的模型集合。

模型筛选是一个重复循环的过程，其循环结束的条件是模型集合中国所有预测模型均被考虑过作为目标预测模型，或者模型集合中只剩下了一个预测模型，此时结束模型筛选，将结束时候的筛选结果中的模型集合输出，便得到该类别集合对应的模型集合了。

在步骤S24中，创建所述类别集合对应的时序类别与所述类别集合对应的模型集合之间的映射关系。

具体而言，类别集合中包括的是同一时序类别的历史对象，因此类别集合对应该时序类别，将时序类别与其对应的模型集合之间创建映射关系，并预留查询接口以用于根据时序类别来查询相应的模型集合。

在本公开的一个实施例中，所述方法还包括：计算所述模型池中各所述预测模型的权重，以根据所述权重计算所述第一组合回测误差；

进一步地，所述计算所述模型池中各所述预测模型的权重，包括：基于一所述预测模型对一所述历史对象进行模型预测的预测准确率确定模型预测的最优预测参数；根据所述最优预测参数中的回测误差衡量指标计算回测误差；根据所述回测误差和所述最优预测参数中的模型权重计算策略计算该历史对象对应的该预测模型的初始权重；将所述初始权重进行归一化处理得到各模型预测对应的权重。

其中，确定模型预测的最优预测参数与步骤S2231中的过程相同，因此此处不再赘述。最优预测参数中包括验证集大小、回测误差衡量指标和模型权重计算策略。

其中，回测误差衡量指标可以用于选择sMAPE或wMAPE以计算回测误差。模型权重计算策略可用于选择g_inv(E_i)、g_sqr(E_i)、g_exp(E_i)以计算预测模型的权重。

需要说明的是，预先配置了g_inv(E_i)、g_sqr(E_i)、g_exp(E_i)三种模型权重计算策略，计算过程分别如下：

g_inv(E_ij)＝1/(E_ij+ε) (6)

g_sqr(E_ij)＝g_inv ²(E_ij) (7)

g_exp(E_ij)＝exp(g_inv(E_ij)) (8)

其中，E_ij为各预测模型M_j对各历史对象SKU_i进行模型预测的回测误差，ε为一个接近于0的数。

因此，可以得到各预测模型M_j对各历史对象SKU_i进行模型预测的权重w_ij ^*。

最后将权重w_ij ^*进行归一化处理，例如把权重w_ij ^*映射到0～1范围之内，变为(0，1)之间的小数，得到最终的各模型预测对应的权重w_ij。

接下来，以一个销量预测的实际场景对上述步骤进行详细介绍。在本公开的一个实施例中，一个类别集合包括两个历史对象，分别为SKU_A和SKU_B，拟采用模型池中三个预测模型进行预测，分别为M₁、M₂、M₃。

首先对数据进行处理，计算模型筛选所需的数据。表1示出了数据预处理的结果。参考表1所示，获取SKU_A和SKU_B验证集中的真实值Y_A和Y_B，并计算M₁、M₂、M₃分别对SKU_A和SKU_B进行模型预测得到的预测值、回测误差以及权重数据，填入表1。

表1数据预处理结果

接着进行模型筛选。图3示意性示出本公开示例性实施例中一种模型筛选方法的流程示意图。参考图3所示，模型筛选的过程包括：

步骤S301，选择目标预测模型。

预先将模型池中所有的预测模型配置为该类别集合对应的模型集合，然后从当前模型集合中选择目标预测模型。

计算各预测模型的综合误差：E₁＝(E_A-1+E_B-1)/2；E₂＝(E_A-2+E_B-2)/2；E₃＝(E_A-3+E_B-3)/2。然后将综合误差进行比较并排序得到E₂＞E₃＞E₁。

根据综合误差的排序结果，E₂值最大，则首先将M₂确定为目标预测模型，考虑从模型集合中剔除M₂。

步骤S302，计算第一平均误差和第二平均误差。

具体地，首先计算第一组合模型{SKU_A、SKU_B、M₁、M₂、M₃}的第一平均误差E。对于SKU_A来说，

对于SKU_B来说，

那么第一平均误差E＝(E_A+E_B)/2。

并计算剔除M₂后的第二组合模型{SKU_A、SKU_B、M₁、M₃}的第二平均误差E*。对于SKU_A来说，

对于SKU_B来说，

那么第二平均误差E^*＝(E_A ^*+E_B ^*)/2。

步骤S303，比较第一平均误差和第二平均误差。

若E^*＞E，则执行步骤S304，之后再执行步骤S305；若E^*≤E，则重复执行步骤S305。

步骤S304，将M₂从当前的模型集合中剔除以更新模型集合。

步骤S305，判断是否结束筛选。

步骤S306，输出当前模型集合作为该类别集合对应的模型集合。具体而言，若模型集合中所有的预测模型均被考虑过目标预测模型，或者此时模型集合中只包括一个预测模型，则判断为满足结束筛选条件，满足结束筛选条件时执行步骤S306，输出当前模型集合作为该类别集合对应的模型集合；若不满足结束筛选条件，则重复执行步骤S301，直至筛选结束。

基于上述预测方法，采用分类选型的方法，将时间序列数据根据是否存在明显的间歇性、节性和趋势性分为不同的类别，然后对不同类别的数据分别进行模型筛选得到各类别对应的模型集合，最后根据预测对象对应的类别，找到其所对应的模型集合进行预测。能够区分预测对象的时序特性，采用更合理的模型分类方法，提高预测精度，进而能够根据预测结果科学地制定业务目标。尤其是在面对已有一定销售记录的寿命较短、消费速度较快的消费品，其预测方法更加科学，预测结果精度更高。

图4示意性示出本公开示例性实施例中一种预测后处理方法的流程示意图。参考图4所示，该预测后处理方法包括：

步骤S41，根据所述预测对象的历史数据利用朴素法进行预测得到朴素预测值；

步骤S42，根据所述朴素预测值与所述模型预测值的比较结果进行比例调整，以得到所述预测对象的最终预测值。

在步骤S41中，根据所述预测对象的历史数据利用朴素法进行预测得到朴素预测值。

其中，朴素法即

方法，也就是用最近的观测值作为预测值。在获取到预测对象SKU对应的历史数据后，可以将其划分为训练集和验证集，并利用朴素法计算验证集上的朴素预测值。

举例来说，假设历史数据包括A商品100天的销量数据，得到预测A商品后20天的销量模型预测值

后，利用朴素法计算A商品后20天销量数据的均值

其中：

其中，h为验证集上的时间点；H为验证集大小，在本例中，H＝20；Y_h为验证集上第h天A商品销量的真实值。

在步骤S42中，根据所述朴素预测值与所述模型预测值的比较结果进行比例调整，以得到所述预测对象的最终预测值。

进一步地，步骤S4，具体过程包括：在所述比较结果满足第一比较条件时，基于预设的缩小比例、所述朴素预测值和所述模型预测值计算所述最终预测值；在所述比较结果满足第二比较条件时，基于预设的放大比例、所述朴素预测值和所述模型预测值计算所述最终预测值；或者在所述比较结果满足第三比较条件时，则将所述模型预测值作为所述最终预测值。

具体地，对预测结果进行均值调整，如果整体预测偏高或偏低，则按照一定比例放缩。

若

即满足第一比较条件，则最终预测值Y：

若

即满足第二比较条件，则最终预测值Y：

其他情况即满足第三比较条件，则模型预测值不变，将其作为最终预测值Y。

基于上述的预测后处理方法，对模型预测值进行按比例缩放处理，能够解决WEOSM模型后处理中最近一期销量对预测结果的影响过大，而容易造成的预测结果偏高或偏低等问题。

在本公开的一个实施例中，还提供了一种信息预测系统，包括预处理模块，用于预设时序类别与模型集合的映射关系；组合预测模块，用于基于预测对象的历史数据中的时序数据确定所述预测对象的时序类别，并基于所述映射关系提取与所述预测对象的时序类别对应的模型集合以进行模型预测，得到所述预测对象的模型预测值。

图5示意性示出本公开示例性实施例中一种信息预测系统框架示意图。参考图5所示，该信息预测系统包括预处理模块51和组合预测模块52。

进一步地，预处理模块51包括对象处理单元511、分类筛选单元512。其中，所述对象处理单元包括时序分类单元5111、预测回测单元5112、第一存储单元5113；所述分类筛选单元包括模型筛选单元5121和第二存储单元5122。另外，预处理模块51还包括对象数据库513和模型集合数据库514。

所述时序分类单元5111，用于基于历史对象的时序数据确定所述历史对象的时序类别；所述预测回测单元5112，用于根据所述历史对象的历史数据获取所述历史对象的验证集、各预测模型对所述历史对象分别进行模型预测的预测值和回测误差；所述第一存储单元5113，用于将所述历史对象的时序类别、验证集、各预测模型分别进行模型预测的预测值和回测误差存储至对象数据库513中。

所述模型筛选单元5121，用于基于对象数据库进行模型筛选得到时序类别与模型集合的映射关系；所述第二存储单元5122，用于根据所述映射关系将时序类别以及所述时序类别对应的模型集合存储至模型集合数据库514中。

表2示出了对象数据库513的部分数据。参考表2所示，对象数据库可以采用如下的模式进行数据存储。

表2对象数据库

SKU	类别	真实值	预测值	误差
					SKU<sub>A</sub>	类别1	Y<sub>A</sub>	Y<sub>A-1</sub>、Y<sub>A-2</sub>、...	E<sub>A-1</sub>、E<sub>A-2</sub>、...
SKU<sub>B</sub>	类别2	Y<sub>B</sub>	Y<sub>B-1</sub>、Y<sub>B-2</sub>、...	E<sub>B-1</sub>、E<sub>B-2</sub>、...
					SKU<sub>C</sub>	类别1	Y<sub>C</sub>	Y<sub>C-1</sub>、Y<sub>C-2</sub>、...	E<sub>C-1</sub>、E<sub>C-2</sub>、...
…	…	…	…	…

表3示出了模型集合数据库514的部分数据。参考表3所示，模型集合数据库可以采用如下的模式进行数据存储。

表3模型集合数据库

类别	模型集合
		类别1	M<sub>1</sub>、M<sub>2</sub>、M<sub>3</sub>
类别2	M<sub>1</sub>、M<sub>2</sub>
		…	…

进一步地，组合预测模块52包括预测单元521和后处理单元522。

其中，预测单元521用于基于预测对象的历史数据中的时序数据确定所述预测对象的时序类别，并基于所述映射关系提取与所述预测对象的时序类别对应的模型集合以进行模型预测，得到所述预测对象的模型预测值。

而后处理单元522用于根据所述预测对象的历史数据利用朴素法进行预测得到朴素预测值，并根据所述朴素预测值与所述模型预测值的比较结果进行比例调整，以得到所述预测对象的最终预测值。

基于上述的信息预测系统，可以利用分布式计算框架分别将计算出来的数据存储至对象数据库，以及将模型筛选的结果存储在模型集合数据库中，不仅可以方便地处理分布式存储的数据，还可以大大减少模型预处理的运行时间，进而提高模型的预测效率。

图6示意性示出本公开示例性实施例中一种信息预测装置的组成示意图，如图6所示，该信息预测装置600可以包括分类模块601、提取模块602以及预测模块603。其中：

分类模块601，用于获取预测对象的历史数据，并基于所述预测对象的历史数据中的时序数据确定所述预测对象的时序类别；

提取模块602，用于基于预设的时序类别与模型集合的映射关系提取与所述预测对象的时序类别对应的模型集合；其中，所述模型集合包括至少一个预测模型；

预测模块603，用于根据所述预测对象的历史数据利用所述模型集合中所述预测模型对所述预测对象进行模型预测，得到所述预测对象的模型预测值。

根据本公开的示例性实施例，所述分类模块601用于在所述时序数据满足第一时序条件时，根据所述时序数据的季节性分类结果和间歇性分类结果确定所述时序类别；或者在所述时序数据满足第二时序条件时，根据所述时序数据的季节性分类结果和趋势性分类结果确定所述时序类别。

根据本公开的示例性实施例，所述预测模块603用于在所述模型集合包括多个所述预测模型时，根据所述预测对象的历史数据利用各所述预测模型对所述预测对象分别进行模型预测，得到各所述预测模型分别对应的模型预测值；将所述各所述预测模型分别对应的模型预测值的平均值作为所述预测对象的模型预测值；或者在所述模型集合包括一个所述预测模型时，根据所述预测对象的历史数据利用该所述预测模型对所述预测对象进行模型预测，得到所述预测对象的模型预测值。

根据本公开的示例性实施例，所述信息预测装置600还包括预设模块(图中均未示出)，用于预设时序类别与模型集合的映射关系，所述预设模块包括预处理单元、模型筛选单元和映射单元；所述预处理单元用于基于历史对象的时序数据确定所述历史对象的时序类别，并将所述时序类别相同的所述历史对象划分至同一类别集合；以及根据所述历史对象的历史数据，利用模型池中各所述预测模型对所述历史对象分别进行模型预测，得到各模型预测对应的预测值和回测误差；所述模型筛选单元用于基于所述预测值和所述回测误差从所述模型池中进行模型筛选得到所述类别集合对应的模型集合；所述映射单元用于创建所述类别集合对应的时序类别与所述类别集合对应的模型集合之间的映射关系。

根据本公开的示例性实施例，所述预处理单元还用于将所述历史数据划分成训练集和验证集；根据所述训练集利用模型池中各所述预测模型对所述历史对象进行模型预测，得到各模型预测对应的所述预测值；基于所述预测值和所述验证集计算各模型预测对应的所述回测误差。

根据本公开的示例性实施例，所述预处理单元还用于基于所述预测值和所述验证集利用一所述预测模型对一所述历史对象进行模型预测以确定最优预测参数；根据所述最优预测参数中的回测误差衡量指标计算该历史对象对应该预测模型的所述回测误差；遍历所述预测模型和所述历史对象得到各所述预测模型分别预测所述历史对象的所述回测误差。

根据本公开的示例性实施例，所述预处理单元还用于配置多组预测参数；其中，一组预测参数包括验证集大小、回测误差衡量指标和模型权重计算策略；基于各组预测参数、所述预测值和所述验证集利用一所述预测模型对一所述历史对象进行模型预测，并基于预设的准确率指标计算各组预测参数分别对应的准确率；将所述准确率最高值对应的一组预测参数配置为所述最优预测参数。

根据本公开的示例性实施例，所述模型筛选单元用于将所述模型池配置为所述类别集合对应的初始模型集合；基于所述回测误差从所述初始模型集合中选择目标预测模型；基于所述预测值确定所述目标预测模型的筛选结果；根据所述筛选结果更新所述初始模型集合；重复上述模型筛选过程，直至所述模型池中各所述预测模型均被考虑过目标预测模型或所述初始模型集合包括一个所述预测模型时，将更新后的所述初始模型集合作为所述类别集合对应的模型集合。

根据本公开的示例性实施例，所述模型筛选单元还用于基于所述回测误差计算所述模型池中各所述预测模型的综合误差；将所述初始模型集合中未考虑过目标预测模型且所述综合误差最大的预测模型确定为所述目标预测模型。

根据本公开的示例性实施例，所述模型筛选单元还用于针对一所述预测模型，从所述回测误差中提取该预测模型分别预测所述历史对象的回测误差；将该预测模型分别预测所述历史对象的回测误差的平均值作为所述综合误差；遍历所述模型池中各所述预测模型，以得到各所述预测模型的综合误差。

根据本公开的示例性实施例，所述模型筛选单元还用于基于所述预测值计算未剔除所述目标预测模型时的第一组合模型的第一平均误差，以及剔除所述目标预测模型时的第二组合模型的第二平均误差；根据所述第一平均误差与所述第二平均误差的关系确定所述筛选结果。

根据本公开的示例性实施例，所述模型筛选单元还用于针对所述类别集合中一所述历史对象，从所述预测值中提取所述第一组合模型中各所述预测模型分别预测该历史对象的预测值，以及获取该历史对象的验证集；基于所述第一组合模型中各所述预测模型分别预测该历史对象的预测值和该历史对象的验证集，计算所述第一组合模型中该历史对象的第一组合回测误差；在所述类别集合包括多个所述历史对象时，将各所述历史对象的第一组合回测误差的平均值作为所述第一平均误差；或者在述类别集合包括一个历史对象时，将所述历史对象的第一组合回测误差作为所述第一平均误差。

根据本公开的示例性实施例，所述模型筛选单元还用于在所述第二平均误差小于或等于所述第一平均误差时，确定所述筛选结果为删除所述目标预测模型；在所述第二平均误差大于所述第一平均误差时，确定所述筛选结果为不删除所述目标预测模型。

根据本公开的示例性实施例，所述模型筛选单元还包括权重单元，所述权重单元用于计算所述模型池中各所述预测模型的权重，用于基于一所述预测模型对一所述历史对象进行模型预测的预测准确率确定模型预测的最优预测参数；根据所述最优预测参数中的回测误差衡量指标计算回测误差；根据所述回测误差和所述最优预测参数中的模型权重计算策略计算该历史对象对应的该预测模型的初始权重；将所述初始权重进行归一化处理得到各模型预测对应的权重。

根据本公开的示例性实施例，信息预测装置600还包括后处理模块(图中未示出)，用于根据所述预测对象的历史数据利用朴素法进行预测得到朴素预测值；根据所述朴素预测值与所述模型预测值的比较结果进行比例调整，以得到所述预测对象的最终预测值。

根据本公开的示例性实施例，所述后处理模块还用于在所述比较结果满足第一比较条件时，基于预设的缩小比例、所述朴素预测值和所述模型预测值计算所述最终预测值；在所述比较结果满足第二比较条件时，基于预设的放大比例、所述朴素预测值和所述模型预测值计算所述最终预测值；或者在所述比较结果满足第三比较条件时，则将所述模型预测值作为所述最终预测值。

上述的信息预测装置600中各模块的具体细节已经在对应的信息预测方法中进行了详细的描述，因此此处不再赘述。

应当注意，尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本公开的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

在本公开的示例性实施例中，还提供了一种能够实现上述方法的存储介质。图7示意性示出本公开示例性实施例中一种计算机可读存储介质的示意图。如图7所示，描述了根据本公开的实施方式的用于实现上述方法的程序产品700，其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在终端设备，例如手机上运行。然而，本公开的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

在本公开的示例性实施例中，还提供了一种能够实现上述方法的电子设备。图8示意性示出本公开示例性实施例中一种电子设备的计算机系统的结构示意图。

需要说明的是，图8示出的电子设备的计算机系统800仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图8所示，计算机系统800包括中央处理单元(Central Processing Unit，CPU)801，其可以根据存储在只读存储器(Read-Only Memory，ROM)802中的程序或者从存储部分808加载到随机访问存储器(Random Access Memory，RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中，还存储有系统操作所需的各种程序和数据。CPU 801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(Input/Output，I/O)接口805也连接至总线804。

以下部件连接至I/O接口805：包括键盘、鼠标等的输入部分806；包括诸如阴极射线管(Cathode Ray Tube，CRT)、液晶显示器(Liquid Crystal Display，LCD)等以及扬声器等的输出部分807；包括硬盘等的存储部分808；以及包括诸如LAN(Local Area Network，局域网)卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器810上，以便于从其上读出的计算机程序根据需要被安装入存储部分808。

特别地，根据本公开的实施例，下文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分809从网络上被下载和安装，和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(CPU)801执行时，执行本公开的系统中限定的各种功能。

需要说明的是，本公开实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory，EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory，CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、有线等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现，所描述的单元也可以设置在处理器中。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定。

作为另一方面，本公开还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该电子设备执行时，使得该电子设备实现上述实施例中所述的方法。

通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本公开实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本公开实施方式的方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种信息预测方法，其特征在于，包括：

获取预测对象的历史数据，并基于所述预测对象的历史数据中的时序数据确定所述预测对象的时序类别；

基于预设的时序类别与模型集合的映射关系提取与所述预测对象的时序类别对应的模型集合；其中，所述模型集合包括至少一个预测模型；

根据所述预测对象的历史数据利用所述模型集合中所述预测模型对所述预测对象进行模型预测，得到所述预测对象的模型预测值。

2.根据权利要求1所述的信息预测方法，其特征在于，所述基于所述预测对象的历史数据中的时序数据确定所述预测对象的时序类别，包括：

在所述时序数据满足第一时序条件时，根据所述时序数据的季节性分类结果和间歇性分类结果确定所述时序类别；或者

在所述时序数据满足第二时序条件时，根据所述时序数据的季节性分类结果和趋势性分类结果确定所述时序类别。

3.根据权利要求1所述的信息预测方法，其特征在于，所述根据所述预测对象的历史数据利用所述模型集合中所述预测模型对所述预测对象进行模型预测，得到所述预测对象的模型预测值，包括：

在所述模型集合包括多个所述预测模型时，根据所述预测对象的历史数据利用各所述预测模型对所述预测对象分别进行模型预测，得到各所述预测模型分别对应的模型预测值；

将所述各所述预测模型分别对应的模型预测值的平均值作为所述预测对象的模型预测值；或者

4.根据权利要求1所述的信息预测方法，其特征在于，所述方法还包括：预设时序类别与模型集合的映射关系，所述预设时序类别与模型集合的映射关系，包括：

基于历史对象的时序数据确定所述历史对象的时序类别，并将所述时序类别相同的所述历史对象划分至同一类别集合；以及

根据所述历史对象的历史数据，利用模型池中各所述预测模型对所述历史对象分别进行模型预测，得到各模型预测对应的预测值和回测误差；

基于所述预测值和所述回测误差从所述模型池中进行模型筛选得到所述类别集合对应的模型集合；

创建所述类别集合对应的时序类别与所述类别集合对应的模型集合之间的映射关系。

5.根据权利要求4所述的信息预测方法，其特征在于，所述根据所述历史对象的历史数据，利用模型池中各所述预测模型对所述历史对象分别进行模型预测，得到各模型预测对应的预测值和回测误差，包括：

将所述历史数据划分成训练集和验证集；

根据所述训练集利用模型池中各所述预测模型对所述历史对象进行模型预测，得到各模型预测对应的所述预测值；

基于所述预测值和所述验证集计算各模型预测对应的所述回测误差。

6.根据权利要求5所述的信息预测方法，其特征在于，所述基于所述预测值和所述验证集计算各模型预测对应的所述回测误差，包括：

基于所述预测值和所述验证集利用一所述预测模型对一所述历史对象进行模型预测以确定最优预测参数；

根据所述最优预测参数中的回测误差衡量指标计算该历史对象对应该预测模型的所述回测误差；

遍历所述预测模型和所述历史对象得到各所述预测模型分别预测所述历史对象的所述回测误差。

7.根据权利要求6所述的信息预测方法，其特征在于，所述基于所述预测值和所述验证集利用一所述预测模型对一所述历史对象进行模型预测以确定最优预测参数，包括：

配置多组预测参数；其中，一组预测参数包括验证集大小、回测误差衡量指标和模型权重计算策略；

基于各组预测参数、所述预测值和所述验证集利用一所述预测模型对一所述历史对象进行模型预测，并基于预设的准确率指标计算各组预测参数分别对应的准确率；

将所述准确率最高值对应的一组预测参数配置为所述最优预测参数。

8.根据权利要求4所述的信息预测方法，其特征在于，所述基于所述预测值和所述回测误差从所述模型池中进行模型筛选得到所述类别集合对应的模型集合，包括：

将所述模型池配置为所述类别集合对应的初始模型集合；

基于所述回测误差从所述初始模型集合中选择目标预测模型；

基于所述预测值确定所述目标预测模型的筛选结果；

根据所述筛选结果更新所述初始模型集合；

重复上述模型筛选过程，直至所述模型池中各所述预测模型均被考虑过目标预测模型或所述初始模型集合包括一个所述预测模型时，将更新后的所述初始模型集合作为所述类别集合对应的模型集合。

9.根据权利要求8所述的信息预测方法，其特征在于，所述基于所述回测误差从所述初始模型集合中选择目标预测模型，包括：

基于所述回测误差计算所述模型池中各所述预测模型的综合误差；

将所述初始模型集合中未考虑过目标预测模型且所述综合误差最大的预测模型确定为所述目标预测模型。

10.根据权利要求9所述的信息预测方法，其特征在于，所述基于所述回测误差计算所述模型池中各所述预测模型的综合误差，包括：

针对一所述预测模型，从所述回测误差中提取该预测模型分别预测所述历史对象的回测误差；

将该预测模型分别预测所述历史对象的回测误差的平均值作为所述综合误差；

遍历所述模型池中各所述预测模型，以得到各所述预测模型的综合误差。

11.根据权利要求8所述的信息预测方法，其特征在于，所述基于所述预测值确定所述目标预测模型的筛选结果，包括：

基于所述预测值计算未剔除所述目标预测模型时的第一组合模型的第一平均误差，以及剔除所述目标预测模型时的第二组合模型的第二平均误差；

根据所述第一平均误差与所述第二平均误差的关系确定所述筛选结果。

12.根据权利要求11所述的信息预测方法，其特征在于，所述基于所述预测值计算未剔除所述目标预测模型时的第一组合模型的第一平均误差，包括：

针对所述类别集合中一所述历史对象，从所述预测值中提取所述第一组合模型中各所述预测模型分别预测该历史对象的预测值，以及获取该历史对象的验证集；

基于所述第一组合模型中各所述预测模型分别预测该历史对象的预测值和该历史对象的验证集，计算所述第一组合模型中该历史对象的第一组合回测误差；

在所述类别集合包括多个所述历史对象时，将各所述历史对象的第一组合回测误差的平均值作为所述第一平均误差；或者

在述类别集合包括一个历史对象时，将所述历史对象的第一组合回测误差作为所述第一平均误差。

13.根据权利要求11所述的信息预测方法，其特征在于，所述根据所述第一平均误差与所述第二平均误差的关系确定所述筛选结果，包括：

在所述第二平均误差小于或等于所述第一平均误差时，确定所述筛选结果为删除所述目标预测模型；

在所述第二平均误差大于所述第一平均误差时，确定所述筛选结果为不删除所述目标预测模型。

14.根据权利要求12所述的信息预测方法，其特征在于，所述方法还包括：计算所述模型池中各所述预测模型的权重，以根据所述权重计算所述第一组合回测误差；

所述计算所述模型池中各所述预测模型的权重，包括：

基于一所述预测模型对一所述历史对象进行模型预测的预测准确率确定模型预测的最优预测参数；

根据所述最优预测参数中的回测误差衡量指标计算回测误差；

根据所述回测误差和所述最优预测参数中的模型权重计算策略计算该历史对象对应的该预测模型的初始权重；

将所述初始权重进行归一化处理得到各模型预测对应的权重。

15.根据权利要求1所述的信息预测方法，其特征在于，在所述根据所述预测对象的历史数据利用所述模型集合中所述预测模型对所述预测对象进行模型预测，得到所述预测对象的模型预测值之后，所述方法还包括：

根据所述预测对象的历史数据利用朴素法进行预测得到朴素预测值；

根据所述朴素预测值与所述模型预测值的比较结果进行比例调整，以得到所述预测对象的最终预测值。

16.根据权利要求15所述的信息预测方法，其特征在于，所述根据所述朴素预测值与所述模型预测值的比较结果进行比例调整，以得到所述预测对象的最终预测值，包括：

在所述比较结果满足第一比较条件时，基于预设的缩小比例、所述朴素预测值和所述模型预测值计算所述最终预测值；

在所述比较结果满足第二比较条件时，基于预设的放大比例、所述朴素预测值和所述模型预测值计算所述最终预测值；或者

在所述比较结果满足第三比较条件时，则将所述模型预测值作为所述最终预测值。

17.一种信息预测系统，其特征在于，包括：

预处理模块，用于预设时序类别与模型集合的映射关系；

组合预测模块，用于基于预测对象的历史数据中的时序数据确定所述预测对象的时序类别，并基于所述映射关系提取与所述预测对象的时序类别对应的模型集合以进行模型预测，得到所述预测对象的模型预测值。

18.根据权利要求17所述的信息预测系统，其特征在于，所述预处理模块还包括：对象处理单元，所述对象处理单元包括时序分类单元、预测回测单元、第一存储单元；其中，

所述时序分类单元，用于基于历史对象的时序数据确定所述历史对象的时序类别；

所述预测回测单元，用于根据所述历史对象的历史数据获取所述历史对象的验证集、各预测模型对所述历史对象分别进行模型预测的预测值和回测误差；

所述第一存储单元，用于将所述历史对象的时序类别、验证集、各预测模型分别进行模型预测的预测值和回测误差存储至对象数据库中。

19.根据权利要求17所述的信息预测系统，其特征在于，所述预处理模块还包括：分类筛选单元，所述分类筛选单元包括模型筛选单元和第二存储单元；其中，

所述模型筛选单元，用于基于对象数据库进行模型筛选得到时序类别与模型集合的映射关系；

所述第二存储单元，用于根据所述映射关系将时序类别以及所述时序类别对应的模型集合存储至模型集合数据库中。

20.根据权利要求17所述的信息预测系统，其特征在于，所述组合预测模块还包括后处理单元；其中，

所述后处理单元，用于根据所述预测对象的历史数据利用朴素法进行预测得到朴素预测值，并根据所述朴素预测值与所述模型预测值的比较结果进行比例调整，以得到所述预测对象的最终预测值。

21.一种信息预测装置，其特征在于，包括：

分类模块，用于获取预测对象的历史数据，并基于所述预测对象的历史数据中的时序数据确定所述预测对象的时序类别；

提取模块，用于基于预设的时序类别与模型集合的映射关系提取与所述预测对象的时序类别对应的模型集合；其中，所述模型集合包括至少一个预测模型；

预测模块，用于根据所述预测对象的历史数据利用所述模型集合中所述预测模型对所述预测对象进行模型预测，得到所述预测对象的模型预测值。

22.一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现如权利要求1至16任一项所述的信息预测方法。

23.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如权利要求1至16任一项所述的信息预测方法。