CN112749845A

CN112749845A - 模型训练方法、资源数据预测方法、装置和计算设备

Info

Publication number: CN112749845A
Application number: CN202110042805.2A
Authority: CN
Inventors: 殷璋琦; 陆晟; 瞿伟; 孙雷
Original assignee: Industrial and Commercial Bank of China Ltd ICBC
Current assignee: Industrial and Commercial Bank of China Ltd ICBC
Priority date: 2021-01-13
Filing date: 2021-01-13
Publication date: 2021-05-04

Abstract

本说明书实施例公开了一种模型训练方法、资源数据预测方法、装置和计算设备。所述资源数据预测方法包括：获取时序数据，所述时序数据包括多个业务时段内的资源数据；对所述时序数据进行小波分解，得到多个小波分解后的时序数据；将小波分解后的时序数据输入至预先训练的时序数据预测模型；对时序数据预测模型的输出进行小波重构，得到未来业务时段内的资源数据。本说明书实施例可以提高时序数据预测的准确性。

Description

模型训练方法、资源数据预测方法、装置和计算设备

技术领域

本说明书实施例涉及人工智能技术领域，特别涉及一种模型训练方法、资源数据预测方法、装置和计算设备。

背景技术

时序数据预测在实际应用中具有非常大的实用价值。在目前的很多应用场景中，通常需要根据时序数据来预测未来业务时段内的资源数据。例如，在财务场景中，根据多个历史业务时段内的财务收支数据来预测未来业务时段内的财务收支数据。

在人工智能领域的相关技术中，通常使用移动平均算法(MA)、自回归差分移动平均算法(ARIMA)、指数平滑算法(Holt-Winters)等来对时序数据进行预测。由于时序数据本身具有高复杂、非线性和信噪比低等特点，使得上述相关技术的预测效果较差。

需要提供更为准确地的方案来对时序数据进行预测。

发明内容

本说明书实施例提供一种模型训练方法、资源数据预测方法、装置和计算设备，以提高时序数据预测的准确性。本说明书实施例的技术方案如下。

本说明书实施例的第一方面，提供了一种模型训练方法，包括：

获取训练集和测试集，所述训练集和所述测试集包括时序数据；

对训练集中的时序数据进行小波分解，得到多个小波分解后的训练集；

根据小波分解后的训练集，对多个候选模型进行训练；

根据测试集，计算训练后的多个候选模型的评价指标；

根据评价指标，从训练后的多个候选模型中选取时序数据预测模型。

本说明书实施例的第二方面，提供了一种资源数据预测方法，包括：

获取时序数据，所述时序数据包括多个业务时段内的资源数据；

对所述时序数据进行小波分解，得到多个小波分解后的时序数据；

将小波分解后的时序数据输入至预先训练的时序数据预测模型；

对时序数据预测模型的输出进行小波重构，得到未来业务时段内的资源数据。

本说明书实施例的第三方面，提供了一种模型训练装置，包括：

获取单元，用于获取训练集和测试集，所述训练集和所述测试集包括时序数据；

分解单元，用于对训练集中的时序数据进行小波分解，得到多个小波分解后的训练集；

训练单元，用于根据小波分解后的训练集，对多个候选模型进行训练；

计算单元，用于根据测试集，计算训练后的多个候选模型的评价指标；

选取单元，用于根据评价指标，从训练后的多个候选模型中选取时序数据预测模型。

本说明书实施例的第四方面，提供了一种资源数据预测装置，包括：

获取单元，用于获取时序数据，所述时序数据包括多个业务时段内的资源数据；

分解单元，用于对所述时序数据进行小波分解，得到多个小波分解后的时序数据；

输入单元，用于将小波分解后的时序数据输入至预先训练的时序数据预测模型；

重构单元，用于对时序数据预测模型的输出进行小波重构，得到未来业务时段内的资源数据。

本说明书实施例的第五方面，提供了一种计算设备，包括：

至少一个处理器；

存储有程序指令的存储器，其中，所述程序指令被配置为适于由所述至少一个处理器执行，所述程序指令包括用于执行如第一方面或者第二方面所述方法的指令。

本说明书实施例提供的技术方案，将小波变换引入到时序数据场景下的模型训练过程、以及模型预测过程，可以提高模型的训练效果和预测效果。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，下面描述中的附图仅仅是本说明书中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本说明书实施例中模型训练方法的流程示意图；

图2为本说明书实施例中资源数据预测方法的流程示意图；

图3为本说明书实施例中时间卷积网络模型的结构示意图；

图4为本说明书实施例中模型训练装置的结构示意图；

图5为本说明书实施例中资源数据预测装置的结构示意图；

图6为本说明书实施例中计算设备的结构示意图。

具体实施方式

下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本说明书保护的范围。

由于受到各种因素的影响，时序数据往往具有高复杂、非线性和信噪比低等特点，使得传统的移动平均算法(MA)、自回归差分移动平均算法(ARIMA)、指数平滑算法(Holt-Winters)等时序数据预测方法，预测效果不佳。

发明人发现，小波变换具有自适应的特点，利用小波变换对时序数据进行处理，可以使得时序数据更为平滑。为此，若将小波变换引入到时序数据场景下的模型训练过程、以及模型预测过程，可以提高模型的训练效果和预测效果。

本说明书实施例提供一种模型训练方法。所述模型训练方法可以应用于任意计算设备，例如应用于单个服务器、由多个服务器构成的服务器集群、或者部署在云端的服务器等。

请参阅图1和图3，所述模型训练方法可以包括以下步骤。

步骤S11：获取训练集和测试集。

在一些实施例中，所述训练集和所述测试集均可以包括一个或多个时序数据。所述时序数据(又称为时间序列数据)可以为将同类型的数据元素按其发生的时间先后顺序排列而形成的数据元素序列。具体地，所述时序数据可以包括多个业务时段内的资源数据。所述业务时段的跨度大小可以根据实际需要灵活设定，例如可以为1天、1个月、1个季度、1年、或者3年等等。所述资源数据可以为财务收支数据、外汇交易量数据、或者基金价格数据等。

在一些实施例中，每个所述时序数据可以理解为一个样本数据。使得，每个所述时序数据可以包括特征数据和标签数据。所述特征数据可以包括时序数据中一个或多个业务时段内的资源数据，所述标签数据可以包括时序数据内一个或多个业务时段内的资源数据。

在实际应用中，所述计算设备可以获取多个时序数据作为样本数据；可以以时序数据中较早业务时段内的资源数据作为样本数据的特征数据，以时序数据中较晚业务时段内的资源数据作为样本数据的标签数据；可以按照预设划分规则，将所述多个时序数据划分为训练集和测试集。这样所述训练集和所述测试集可以包括多个样本数据。

例如，在财务场景中，所述计算设备可以获得500家银行网点2019年第一季度至2019年第四季度的财务收支数据T＝{t₁,t₂,t₃,…,t_i,…,t₅₀₀}。其中，t_i可以为时序数据。具体地，t_i表示第i家银行网点2019年第一季度至2019年第四季度的财务收支数据，t_i＝{q₁,q₂,q₃,q₄}，q₁表示2019年第一季度的财务收支数据，q₂表示2019年第二季度的财务收支数据，q₃表示2019年第三季度的财务收支数据，q₄表示2019年第四季度的财务收支数据。

针对第i家银行网点2019年第一季度至2019年第四季度的财务收支数据t_i，所述计算设备可以将其中3个较早业务时段内的财务收支数据x_i＝{q₁,q₂,q₃}作为特征数据，可以将其中1个较晚业务时段内的财务收支数据y_i＝{q₄}作为标签数据。这样t_i＝{x_i,y_i}。

所述计算设备可以按照4:1的比例将财务收支数据T＝{t₁,t₂,t₃,…,t_i,…,t₅₀₀}划分为训练集和测试集，使得所述训练集包括400个样本数据，所述测试集包括100个样本数据。

步骤S13：对训练集中的时序数据进行小波分解，得到多个小波分解后的训练集。

在一些实施例中，由于各种因素的影响，使得时序数据中存在许多的噪声，这些噪声会影响到模型的训练效果，因而需要对时序数据进行去噪处理。时序数据具有高复杂、非线性和信噪比低的特点，传统的去噪方法(例如高斯滤波)无法适用于时序数据，不能很好地去除噪声。考虑到根据时-频局部化要求发展起来的小波变换(Wavelet Transform)，具有自适应和数学显微镜的性质，因而可以利用小波变换对时序数据进行去噪处理。

设函数φ(t)∈L²(R)，其傅里叶变换为

当

满足条件

时，φ(t)可以称为一个基本小波。对基本小波进行平移或伸缩后可以获得一组小波序列。

小波变换的思想是以尺度空间V_j和小波空间W_j来表示L²(R)(L²(R)表示平方可积的函数空间)上的一列闭子空间。小波空间W_(j)是V_(j+1)与V_(j)之差，

在实际应用中，小波变换可以包括小波分解和小波重构。所述小波分解可以表示为c_j+1＝Hc_j，d_j+1＝Gc_j，j＝0,1,...,J；所述小波重构可以表示为

j＝J-1,J-2,...,0。其中，H为分解低通滤波器；G为分解高通滤波器；

为重构低通滤波器；

为重构高通滤波器；J为尺度数；c₀为原始的时间序列；{c_j}和{d_j}分别为原始的时间序列的低频成分和高频成分。

在一些实施例中，所述多个小波分解后的训练集对应不同的小波尺度。在实际应用中，所述计算设备可以对训练集中的时序数据进行小波分解，得到多个小波尺度下的分解后的时序数据；可以将每个小波尺度下的分解后的时序数据，计入与该小波尺度的尺度数相对应的训练集。小波分解后的训练集可以包括时序数据在该训练集所对应小波尺度下的低频成分。

例如，在财务场景中，所述训练集可以包括时序数据c。所述计算设备可以对时序数据c进行小波分解，得到多个小波尺度下的分解后的时序数据。具体地，所述计算设备可以得到与尺度数1相对应的小波分解后的时序数据c₁；可以得到与尺度数2相对应的小波分解后的时序数据c₂；可以得到与尺度数3相对应的小波分解后的时序数据c₃。所述计算设备可以将小波分解后的时序数据c₁计入小波分解后的训练集A1；可以将小波分解后的时序数据c₂计入小波分解后的训练集A2；可以将小波分解后的时序数据c₃计入小波分解后的训练集A3。其中，小波分解后的训练集A1对应尺度数1，小波分解后的训练集A2对应尺度数2，小波分解后的训练集A3对应尺度数3。

步骤S15：根据小波分解后的训练集，对多个候选模型进行训练。

在一些实施例中，所述候选模型可以包括时间卷积网络模型。所述时间卷积网络模型可以包括卷积层、长短时记忆网络层、以及线性变换层。其中，所述卷积层可以的输入为时序数据，用于从所述时序数据中提取特征。所述长短时记忆网络层能够学习数据在时间上的依赖关系，用于根据所述卷积层的输出进行预测。所述线性变换层用于对所述长短时记忆网络层的输出进行线性变换，实现将所述长短时记忆网络层的输出转换为模型的输出。

相较于传统的循环神经网络模型(RNN)、长短时记忆网络模型(LSTM)等，由于所述时间卷积网络模型同时包括卷积层和长短时记忆网络层，使得所述时间卷积网络模型既具备了卷积神经网络在低参数下的特征提取能力，又具备了长短时记忆网络对于时序数据的预测能力。这样将所述时间卷积网络模型应用于时序数据的预测时，可以具有较好的表现力。

在一些实施例中，所述多个候选模型对应不同的超参数。在实际应用中，所述计算设备可以设置多组超参数；可以根据所述多组超参数，构建多个候选模型，每组超参数可以包括迭代次数、卷积层输入序列的长度、模型学习率等。所述计算设备可以根据多个小波分解后的训练集，利用梯度下降法或者牛顿法对所述多个候选模型进行训练。例如，可以预先设置3组超参数，每组超参数可以包括代次数、卷积层输入序列的长度、模型学习率等。根据所述3组超参数，可以构建3个候选模型。针对每个候选模型，所述计算设备可以根据多个小波分解后的训练集，利用梯度下降法或者牛顿法对该候选模型进行训练。

步骤S17：根据测试集，计算训练后的多个候选模型的评价指标。

在一些实施例中，所述评价指标可以用于表示模型的预测效果。

所述评价指标可以包括以下至少之一：平均绝对误差(MAE)、平均绝对百分比误差(MAPE)、均方根误差(RMSE)、纳什模型效率指数(NSE)。其中，所述平均绝对误差、所述平均绝对百分比误差、以及所述均方根误差越小，表示模型的预测效果越好。所述纳什模型效率指数越接近于1，表示模型的预测效果越好。

其中，Y_i为样本数据中的标签数据，

为预测结果，

为测试集中各样本数据的标签数据的平均值，N为测试集中样本数据的数量。

在一些实施例中，所述计算设备可以对测试集中的时序数据进行小波分解，得到多个小波分解后的测试集，所述多个小波分解后的测试集对应不同的小波尺度。针对每个训练后的候选模型，所述计算设备可以将多个小波分解后的测试集输入至该候选模型，得到该候选模型的多个输出；可以对所述多个输出进行小波重构，得到预测结果；可以根据预测结果，计算该候选模型的评价指标。其中，所述计算设备对测试集中的时序数据进行小波分解的过程，可以与训练集中的时序数据进行小波分解的过程，对照解释。

步骤S19：根据评价指标，从训练后的多个候选模型中选取时序数据预测模型。

在一些实施例中，所述计算设备可以根据评价指标，从训练后的多个候选模型中选取预测效果最好的候选模型，作为时序数据预测模型。

本说明书实施例的模型训练方法，可以对训练集中的时序数据进行小波分解，得到多个小波分解后的训练集；可以根据小波分解后的训练集，对多个候选模型进行训练；可以从训练后的多个候选模型中选取时序数据预测模型。通过将小波变换引入到时序数据模型的训练过程中，可以提高模型的训练效果，使得训练后的模型具有较高的预测效果。

本说明书实施例提供一种资源数据预测方法。所述资源数据预测方法可以应用于任意计算设备，例如单个服务器、由多个服务器构成的服务器集群、或者部署在云端的服务器等。

请参阅图2和图3，所述资源数据预测方法可以包括以下步骤。

步骤S21：获取时序数据，所述时序数据包括多个业务时段内的资源数据。

步骤S23：对所述时序数据进行小波分解，得到多个小波分解后的时序数据。

步骤S25：将小波分解后的时序数据输入至预先训练的时序数据预测模型。

步骤S27：对时序数据预测模型的输出进行小波重构，得到未来业务时段内的资源数据。

在一些实施例中，所述业务时段的跨度大小可以根据实际需要灵活设定，例如可以为1天、1个月、1个季度、1年、或者3年等等。所述资源数据可以为财务收支数据、外汇交易量数据、或者基金价格数据等。所述时序数据预测模型可以包括时间卷积网络模型。关于所述时间卷积网络模型的详细介绍可以参见步骤S15。

所述时序数据预测模型可以基于图1所对应的实施例得到。

在一些实施例中，所述多个小波分解后的时序数据对应不同的小波尺度。所述计算设备可以对所述时序数据进行小波分解，得到多个小波尺度下的分解后的时序数据；可以将多个小波尺度下的分解后的时序数据输入至预先训练后的时序数据预测模型，得到所述时序数据预测模型在多个小波尺度下的预测结果。所述计算设备可以对时序数据预测模型在多个小波尺度下的预测结果进行小波重构，得到未来业务时段内的资源数据。

本说明书实施例的资源数据预测方法，可以获取时序数据，所述时序数据包括多个业务时段内的资源数据；可以对所述时序数据进行小波分解，得到多个小波分解后的时序数据；可以将小波分解后的时序数据输入至预先训练的预测模型；可以对预测模型的输出进行小波重构，得到未来业务时段内的资源数据。通过将小波变换引入到时序数据模型的预测过程中，可以提高资源数据预测的准确性。

以下介绍本说明书实施例的一个场景示例。

在财务场景中，由于系统信息流分散、断裂，未形成有效闭环，系统财务管理信息缺失，财务分析决策功能成为“无源之水”。此外，目前系统归集维度单一，成本管理较为粗放，影响费用资源配置效果。随着业务类型的复杂化和多元化，需进行财务开支数据的时序分析，为经营决策提供精细、精准的开支管理信息，有效支撑费用预算和经营考核。

为此，可以获取某一年份前3个季度的财务收支数据作为时序数据；可以对所述时序数据进行小波分解，得到多个小波分解后的时序数据；可以将小波分解后的时序数据输入至预先训练的时序数据预测模型；可以对时序数据预测模型的输出进行小波重构，得到该年份下一季度的财务收支数据，从而为相关决策部门提供数据上的支持。

例如，所述计算设备可以获取某一银行网点2020年第一季度的财务收支数据q₁、2020年第二季度的财务收支数据q₂、以及2020年第三季度的财务收支数据q₃，作为时序数据；可以对所述时序数据c进行小波分解，得到小波分解后的时序数据c₁、小波分解后的时序数据c₂、以及小波分解后的时序数据c₃。其中，小波分解后的时序数据c₁对应尺度数1，具体包括q₁₁、q₂₁、q₃₁。所述q₁₁为2020年第一季度的财务收支数据q₁在尺度数1下的低频成分，所述q₂₁为2020年第二季度的财务收支数据q₂在尺度数1下的低频成分，所述q₃₁为2020年第三季度的财务收支数据q₃在尺度数1下的低频成分。小波分解后的时序数据c₂对应尺度数2，具体包括q₁₂、q₂₂、q₃₂。所述q₁₂为2020年第一季度的财务收支数据q₁在尺度数2下的低频成分，所述q₂₂为2020年第二季度的财务收支数据q₂在尺度数2下的低频成分，所述q₃₂为2020年第三季度的财务收支数据q₃在尺度数2下的低频成分。小波分解后的时序数据c₃对应尺度数3，具体包括q₁₃、q₂₃、q₃₃。所述q₁₃为2020年第一季度的财务收支数据q₁在尺度数3下的低频成分，所述q₂₃为2020年第二季度的财务收支数据q₂在尺度数3下的低频成分，所述q₃₃为2020年第三季度的财务收支数据q₃在尺度数3下的低频成分。

所述计算设备可以将小波分解后的时序数据c₁、小波分解后的时序数据c₂、以及小波分解后的时序数据c₃输入至预先训练的预测模型，得到预测模型的输出q₄₁、q₄₂、q₄₃；可以对预测模型的输出q₄₁、q₄₂、q₄₃进行小波重构，得到2020年第四季度的财务收支数据q₄。其中，所述q₄₁可以理解为2020年第四季度的财务收支数据q₄在尺度数1下的低频成分，所述q₄₂可以理解为2020年第四季度的财务收支数据q₄在尺度数2下的低频成分，所述q₄₃可以理解为2020年第四季度的财务收支数据q₄在尺度数3下的低频成分。

这样可以根据上一个或多个季度的财务收支数据，对下一季度的财务收支数据进行预测，为经营决策提供精细、精准的财务收支信息，有效支撑费用预算和经营考核。

请参阅图4。本说明书还提供模型训练装置的一个实施例。所述模型训练装置可以应用于计算设备，具体可以包括以下单元。

获取单元41，用于获取训练集和测试集，所述训练集和所述测试集包括时序数据；

分解单元43，用于对训练集中的时序数据进行小波分解，得到多个小波分解后的训练集；

训练单元45，用于根据小波分解后的训练集，对多个候选模型进行训练；

计算单元47，用于根据测试集，计算训练后的多个候选模型的评价指标；

选取单元49，用于根据评价指标，从训练后的多个候选模型中选取时序数据预测模型。

请参阅图5。本说明书还提供资源数据预测装置的一个实施例。所述资源数据预测装置可以应用于计算设备，具体可以包括以下单元。

获取单元51，用于获取时序数据，所述时序数据包括多个业务时段内的资源数据；

分解单元53，用于对所述时序数据进行小波分解，得到多个小波分解后的时序数据；

输入单元55，用于将小波分解后的时序数据输入至预先训练的时序数据预测模型；

重构单元57，用于对时序数据预测模型的输出进行小波重构，得到未来业务时段内的资源数据。

请参阅图6。本说明书实施例还提供一种计算设备。

所述计算设备可以包括存储器和处理器。

在本实施例中，所述存储器包括但不限于动态随机存取存储器(Dynamic RandomAccess Memory，DRAM)和静态随机存取存储器(Static Random Access Memory，SRAM)等。所述存储器可以用于存储计算机指令。

在本实施例中，所述处理器可以按任何适当的方式实现。例如，所述处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。所述处理器可以用于执行所述计算机指令以实现图1或者图2所对应的实施例。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同或相似的部分互相参见即可，每个实施例重点说明的都是与其它实施例的不同之处。尤其，对于单侧实施的方法实施例、装置实施例、和计算设备实施例而言，由于其基本相似于模型训练方法实施例，所以描述的比较简单，相关之处参见模型训练方法实施例的部分说明即可。

另外，可以理解的是，本领域技术人员在阅读本说明书文件之后，可以无需创造性劳动想到将本说明书列举的部分或全部实施例进行任意组合，这些组合也在本说明书公开和保护的范围内。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本说明书的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。

本说明书可用于众多通用或专用的计算机系统环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

虽然通过实施例描绘了本说明书，本领域普通技术人员知道，本说明书有许多变形和变化而不脱离本说明书的精神，希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。

Claims

1.一种模型训练方法，包括：

根据小波分解后的训练集，对多个候选模型进行训练；

根据测试集，计算训练后的多个候选模型的评价指标；

2.如权利要求1所述的方法，所述获取训练集和测试集，包括：

获取多个时序数据作为样本数据，所述时序数据包括多个业务时段内的资源数据；

以时序数据中较早业务时段内的资源数据作为样本数据的特征数据，以时序数据中较晚业务时段内的资源数据作为样本数据的标签数据，按照预设划分规则，将所述多个时序数据划分为训练集和测试集，所述训练集和所述测试集包括多个样本数据。

3.如权利要求1所述的方法，所述多个小波分解后的训练集对应不同的尺度数；

所述对训练集中的时序数据进行小波分解，包括：

对训练集中的时序数据进行小波分解，得到多个小波尺度下的分解后的时序数据；

将每个小波尺度下的分解后的时序数据，计入与该小波尺度的尺度数相对应的训练集。

4.如权利要求1所述的方法，所述候选模型包括时间卷积网络模型；所述时间卷积网络模型包括卷积层、长短时记忆网络层、线性变换层；其中，所述卷积层用于从输入至候选模型的时序数据中提取特征，所述长短时记忆网络层用于利用卷积层提取的特征进行预测，所述线性变换层用于将长短时记忆网络层的预测结果变换为候选模型的输出。

5.如权利要求1所述的方法，所述多个候选模型通过如下方式获得：

设置多组超参数；

根据所述多组超参数，构建多个候选模型。

6.如权利要求1所述的方法，所述评价指标包括以下至少之一：平均绝对误差、平均绝对百分比误差、均方根误差、纳什模型效率指数。

7.一种资源数据预测方法，包括：

8.如权利要求7所述的方法，所述对所述时序数据进行小波分解，包括：

对所述时序数据进行小波分解，得到多个小波尺度下的分解后的时序数据；

相应地，所述时序数据预测模型的输出包括所述时序数据预测模型在多个小波尺度下的预测结果，所述对时序数据预测模型的输出进行小波重构，包括：

对时序数据预测模型在多个小波尺度下的预测结果进行小波重构。

9.如权利要求7所述的方法，所述预测模型包括时间卷积网络模型；所述时间卷积网络模型包括卷积层、长短时记忆网络层、线性变换层；其中，所述卷积层用于从输入的小波分解后的时序数据中提取特征，所述长短时记忆网络层用于利用卷积层提取的特征进行预测，所述线性变换层用于将长短时记忆网络层的预测结果变换为时序数据预测模型的输出。

10.一种模型训练装置，包括：

11.一种资源数据预测装置，包括：

12.一种计算设备，包括：

至少一个处理器；

存储有程序指令的存储器，其中，所述程序指令被配置为适于由所述至少一个处理器执行，所述程序指令包括用于执行如权利要求1-9中任一项所述方法的指令。