CN112749845A - 模型训练方法、资源数据预测方法、装置和计算设备 - Google Patents
模型训练方法、资源数据预测方法、装置和计算设备 Download PDFInfo
- Publication number
- CN112749845A CN112749845A CN202110042805.2A CN202110042805A CN112749845A CN 112749845 A CN112749845 A CN 112749845A CN 202110042805 A CN202110042805 A CN 202110042805A CN 112749845 A CN112749845 A CN 112749845A
- Authority
- CN
- China
- Prior art keywords
- data
- time
- time sequence
- sequence data
- wavelet
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 95
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 77
- 238000012360 testing method Methods 0.000 claims description 32
- 238000011156 evaluation Methods 0.000 claims description 17
- 230000015654 memory Effects 0.000 claims description 16
- 230000009466 transformation Effects 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 description 14
- 230000008569 process Effects 0.000 description 11
- 230000006872 improvement Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000007787 long-term memory Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013499 data model Methods 0.000 description 2
- 238000011478 gradient descent method Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/12—Accounting
- G06Q40/125—Finance or payroll
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Technology Law (AREA)
- Human Resources & Organizations (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本说明书实施例公开了一种模型训练方法、资源数据预测方法、装置和计算设备。所述资源数据预测方法包括:获取时序数据,所述时序数据包括多个业务时段内的资源数据;对所述时序数据进行小波分解,得到多个小波分解后的时序数据;将小波分解后的时序数据输入至预先训练的时序数据预测模型;对时序数据预测模型的输出进行小波重构,得到未来业务时段内的资源数据。本说明书实施例可以提高时序数据预测的准确性。
Description
技术领域
本说明书实施例涉及人工智能技术领域,特别涉及一种模型训练方法、资源数据预测方法、装置和计算设备。
背景技术
时序数据预测在实际应用中具有非常大的实用价值。在目前的很多应用场景中,通常需要根据时序数据来预测未来业务时段内的资源数据。例如,在财务场景中,根据多个历史业务时段内的财务收支数据来预测未来业务时段内的财务收支数据。
在人工智能领域的相关技术中,通常使用移动平均算法(MA)、自回归差分移动平均算法(ARIMA)、指数平滑算法(Holt-Winters)等来对时序数据进行预测。由于时序数据本身具有高复杂、非线性和信噪比低等特点,使得上述相关技术的预测效果较差。
需要提供更为准确地的方案来对时序数据进行预测。
发明内容
本说明书实施例提供一种模型训练方法、资源数据预测方法、装置和计算设备,以提高时序数据预测的准确性。本说明书实施例的技术方案如下。
本说明书实施例的第一方面,提供了一种模型训练方法,包括:
获取训练集和测试集,所述训练集和所述测试集包括时序数据;
对训练集中的时序数据进行小波分解,得到多个小波分解后的训练集;
根据小波分解后的训练集,对多个候选模型进行训练;
根据测试集,计算训练后的多个候选模型的评价指标;
根据评价指标,从训练后的多个候选模型中选取时序数据预测模型。
本说明书实施例的第二方面,提供了一种资源数据预测方法,包括:
获取时序数据,所述时序数据包括多个业务时段内的资源数据;
对所述时序数据进行小波分解,得到多个小波分解后的时序数据;
将小波分解后的时序数据输入至预先训练的时序数据预测模型;
对时序数据预测模型的输出进行小波重构,得到未来业务时段内的资源数据。
本说明书实施例的第三方面,提供了一种模型训练装置,包括:
获取单元,用于获取训练集和测试集,所述训练集和所述测试集包括时序数据;
分解单元,用于对训练集中的时序数据进行小波分解,得到多个小波分解后的训练集;
训练单元,用于根据小波分解后的训练集,对多个候选模型进行训练;
计算单元,用于根据测试集,计算训练后的多个候选模型的评价指标;
选取单元,用于根据评价指标,从训练后的多个候选模型中选取时序数据预测模型。
本说明书实施例的第四方面,提供了一种资源数据预测装置,包括:
获取单元,用于获取时序数据,所述时序数据包括多个业务时段内的资源数据;
分解单元,用于对所述时序数据进行小波分解,得到多个小波分解后的时序数据;
输入单元,用于将小波分解后的时序数据输入至预先训练的时序数据预测模型;
重构单元,用于对时序数据预测模型的输出进行小波重构,得到未来业务时段内的资源数据。
本说明书实施例的第五方面,提供了一种计算设备,包括:
至少一个处理器;
存储有程序指令的存储器,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如第一方面或者第二方面所述方法的指令。
本说明书实施例提供的技术方案,将小波变换引入到时序数据场景下的模型训练过程、以及模型预测过程,可以提高模型的训练效果和预测效果。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书实施例中模型训练方法的流程示意图;
图2为本说明书实施例中资源数据预测方法的流程示意图;
图3为本说明书实施例中时间卷积网络模型的结构示意图;
图4为本说明书实施例中模型训练装置的结构示意图;
图5为本说明书实施例中资源数据预测装置的结构示意图;
图6为本说明书实施例中计算设备的结构示意图。
具体实施方式
下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
由于受到各种因素的影响,时序数据往往具有高复杂、非线性和信噪比低等特点,使得传统的移动平均算法(MA)、自回归差分移动平均算法(ARIMA)、指数平滑算法(Holt-Winters)等时序数据预测方法,预测效果不佳。
发明人发现,小波变换具有自适应的特点,利用小波变换对时序数据进行处理,可以使得时序数据更为平滑。为此,若将小波变换引入到时序数据场景下的模型训练过程、以及模型预测过程,可以提高模型的训练效果和预测效果。
本说明书实施例提供一种模型训练方法。所述模型训练方法可以应用于任意计算设备,例如应用于单个服务器、由多个服务器构成的服务器集群、或者部署在云端的服务器等。
请参阅图1和图3,所述模型训练方法可以包括以下步骤。
步骤S11:获取训练集和测试集。
在一些实施例中,所述训练集和所述测试集均可以包括一个或多个时序数据。所述时序数据(又称为时间序列数据)可以为将同类型的数据元素按其发生的时间先后顺序排列而形成的数据元素序列。具体地,所述时序数据可以包括多个业务时段内的资源数据。所述业务时段的跨度大小可以根据实际需要灵活设定,例如可以为1天、1个月、1个季度、1年、或者3年等等。所述资源数据可以为财务收支数据、外汇交易量数据、或者基金价格数据等。
在一些实施例中,每个所述时序数据可以理解为一个样本数据。使得,每个所述时序数据可以包括特征数据和标签数据。所述特征数据可以包括时序数据中一个或多个业务时段内的资源数据,所述标签数据可以包括时序数据内一个或多个业务时段内的资源数据。
在实际应用中,所述计算设备可以获取多个时序数据作为样本数据;可以以时序数据中较早业务时段内的资源数据作为样本数据的特征数据,以时序数据中较晚业务时段内的资源数据作为样本数据的标签数据;可以按照预设划分规则,将所述多个时序数据划分为训练集和测试集。这样所述训练集和所述测试集可以包括多个样本数据。
例如,在财务场景中,所述计算设备可以获得500家银行网点2019年第一季度至2019年第四季度的财务收支数据T={t1,t2,t3,…,ti,…,t500}。其中,ti可以为时序数据。具体地,ti表示第i家银行网点2019年第一季度至2019年第四季度的财务收支数据,ti={q1,q2,q3,q4},q1表示2019年第一季度的财务收支数据,q2表示2019年第二季度的财务收支数据,q3表示2019年第三季度的财务收支数据,q4表示2019年第四季度的财务收支数据。
针对第i家银行网点2019年第一季度至2019年第四季度的财务收支数据ti,所述计算设备可以将其中3个较早业务时段内的财务收支数据xi={q1,q2,q3}作为特征数据,可以将其中1个较晚业务时段内的财务收支数据yi={q4}作为标签数据。这样ti={xi,yi}。
所述计算设备可以按照4:1的比例将财务收支数据T={t1,t2,t3,…,ti,…,t500}划分为训练集和测试集,使得所述训练集包括400个样本数据,所述测试集包括100个样本数据。
步骤S13:对训练集中的时序数据进行小波分解,得到多个小波分解后的训练集。
在一些实施例中,由于各种因素的影响,使得时序数据中存在许多的噪声,这些噪声会影响到模型的训练效果,因而需要对时序数据进行去噪处理。时序数据具有高复杂、非线性和信噪比低的特点,传统的去噪方法(例如高斯滤波)无法适用于时序数据,不能很好地去除噪声。考虑到根据时-频局部化要求发展起来的小波变换(Wavelet Transform),具有自适应和数学显微镜的性质,因而可以利用小波变换对时序数据进行去噪处理。
小波变换的思想是以尺度空间Vj和小波空间Wj来表示L2(R)(L2(R)表示平方可积的函数空间)上的一列闭子空间。小波空间W(j)是V(j+1)与V(j)之差, 在实际应用中,小波变换可以包括小波分解和小波重构。所述小波分解可以表示为cj+1=Hcj,dj+1=Gcj,j=0,1,...,J;所述小波重构可以表示为j=J-1,J-2,...,0。其中,H为分解低通滤波器;G为分解高通滤波器;为重构低通滤波器;为重构高通滤波器;J为尺度数;c0为原始的时间序列;{cj}和{dj}分别为原始的时间序列的低频成分和高频成分。
在一些实施例中,所述多个小波分解后的训练集对应不同的小波尺度。在实际应用中,所述计算设备可以对训练集中的时序数据进行小波分解,得到多个小波尺度下的分解后的时序数据;可以将每个小波尺度下的分解后的时序数据,计入与该小波尺度的尺度数相对应的训练集。小波分解后的训练集可以包括时序数据在该训练集所对应小波尺度下的低频成分。
例如,在财务场景中,所述训练集可以包括时序数据c。所述计算设备可以对时序数据c进行小波分解,得到多个小波尺度下的分解后的时序数据。具体地,所述计算设备可以得到与尺度数1相对应的小波分解后的时序数据c1;可以得到与尺度数2相对应的小波分解后的时序数据c2;可以得到与尺度数3相对应的小波分解后的时序数据c3。所述计算设备可以将小波分解后的时序数据c1计入小波分解后的训练集A1;可以将小波分解后的时序数据c2计入小波分解后的训练集A2;可以将小波分解后的时序数据c3计入小波分解后的训练集A3。其中,小波分解后的训练集A1对应尺度数1,小波分解后的训练集A2对应尺度数2,小波分解后的训练集A3对应尺度数3。
步骤S15:根据小波分解后的训练集,对多个候选模型进行训练。
在一些实施例中,所述候选模型可以包括时间卷积网络模型。所述时间卷积网络模型可以包括卷积层、长短时记忆网络层、以及线性变换层。其中,所述卷积层可以的输入为时序数据,用于从所述时序数据中提取特征。所述长短时记忆网络层能够学习数据在时间上的依赖关系,用于根据所述卷积层的输出进行预测。所述线性变换层用于对所述长短时记忆网络层的输出进行线性变换,实现将所述长短时记忆网络层的输出转换为模型的输出。
相较于传统的循环神经网络模型(RNN)、长短时记忆网络模型(LSTM)等,由于所述时间卷积网络模型同时包括卷积层和长短时记忆网络层,使得所述时间卷积网络模型既具备了卷积神经网络在低参数下的特征提取能力,又具备了长短时记忆网络对于时序数据的预测能力。这样将所述时间卷积网络模型应用于时序数据的预测时,可以具有较好的表现力。
在一些实施例中,所述多个候选模型对应不同的超参数。在实际应用中,所述计算设备可以设置多组超参数;可以根据所述多组超参数,构建多个候选模型,每组超参数可以包括迭代次数、卷积层输入序列的长度、模型学习率等。所述计算设备可以根据多个小波分解后的训练集,利用梯度下降法或者牛顿法对所述多个候选模型进行训练。例如,可以预先设置3组超参数,每组超参数可以包括代次数、卷积层输入序列的长度、模型学习率等。根据所述3组超参数,可以构建3个候选模型。针对每个候选模型,所述计算设备可以根据多个小波分解后的训练集,利用梯度下降法或者牛顿法对该候选模型进行训练。
步骤S17:根据测试集,计算训练后的多个候选模型的评价指标。
在一些实施例中,所述评价指标可以用于表示模型的预测效果。
所述评价指标可以包括以下至少之一:平均绝对误差(MAE)、平均绝对百分比误差(MAPE)、均方根误差(RMSE)、纳什模型效率指数(NSE)。其中,所述平均绝对误差、所述平均绝对百分比误差、以及所述均方根误差越小,表示模型的预测效果越好。所述纳什模型效率指数越接近于1,表示模型的预测效果越好。
在一些实施例中,所述计算设备可以对测试集中的时序数据进行小波分解,得到多个小波分解后的测试集,所述多个小波分解后的测试集对应不同的小波尺度。针对每个训练后的候选模型,所述计算设备可以将多个小波分解后的测试集输入至该候选模型,得到该候选模型的多个输出;可以对所述多个输出进行小波重构,得到预测结果;可以根据预测结果,计算该候选模型的评价指标。其中,所述计算设备对测试集中的时序数据进行小波分解的过程,可以与训练集中的时序数据进行小波分解的过程,对照解释。
步骤S19:根据评价指标,从训练后的多个候选模型中选取时序数据预测模型。
在一些实施例中,所述计算设备可以根据评价指标,从训练后的多个候选模型中选取预测效果最好的候选模型,作为时序数据预测模型。
本说明书实施例的模型训练方法,可以对训练集中的时序数据进行小波分解,得到多个小波分解后的训练集;可以根据小波分解后的训练集,对多个候选模型进行训练;可以从训练后的多个候选模型中选取时序数据预测模型。通过将小波变换引入到时序数据模型的训练过程中,可以提高模型的训练效果,使得训练后的模型具有较高的预测效果。
本说明书实施例提供一种资源数据预测方法。所述资源数据预测方法可以应用于任意计算设备,例如单个服务器、由多个服务器构成的服务器集群、或者部署在云端的服务器等。
请参阅图2和图3,所述资源数据预测方法可以包括以下步骤。
步骤S21:获取时序数据,所述时序数据包括多个业务时段内的资源数据。
步骤S23:对所述时序数据进行小波分解,得到多个小波分解后的时序数据。
步骤S25:将小波分解后的时序数据输入至预先训练的时序数据预测模型。
步骤S27:对时序数据预测模型的输出进行小波重构,得到未来业务时段内的资源数据。
在一些实施例中,所述业务时段的跨度大小可以根据实际需要灵活设定,例如可以为1天、1个月、1个季度、1年、或者3年等等。所述资源数据可以为财务收支数据、外汇交易量数据、或者基金价格数据等。所述时序数据预测模型可以包括时间卷积网络模型。关于所述时间卷积网络模型的详细介绍可以参见步骤S15。
所述时序数据预测模型可以基于图1所对应的实施例得到。
在一些实施例中,所述多个小波分解后的时序数据对应不同的小波尺度。所述计算设备可以对所述时序数据进行小波分解,得到多个小波尺度下的分解后的时序数据;可以将多个小波尺度下的分解后的时序数据输入至预先训练后的时序数据预测模型,得到所述时序数据预测模型在多个小波尺度下的预测结果。所述计算设备可以对时序数据预测模型在多个小波尺度下的预测结果进行小波重构,得到未来业务时段内的资源数据。
本说明书实施例的资源数据预测方法,可以获取时序数据,所述时序数据包括多个业务时段内的资源数据;可以对所述时序数据进行小波分解,得到多个小波分解后的时序数据;可以将小波分解后的时序数据输入至预先训练的预测模型;可以对预测模型的输出进行小波重构,得到未来业务时段内的资源数据。通过将小波变换引入到时序数据模型的预测过程中,可以提高资源数据预测的准确性。
以下介绍本说明书实施例的一个场景示例。
在财务场景中,由于系统信息流分散、断裂,未形成有效闭环,系统财务管理信息缺失,财务分析决策功能成为“无源之水”。此外,目前系统归集维度单一,成本管理较为粗放,影响费用资源配置效果。随着业务类型的复杂化和多元化,需进行财务开支数据的时序分析,为经营决策提供精细、精准的开支管理信息,有效支撑费用预算和经营考核。
为此,可以获取某一年份前3个季度的财务收支数据作为时序数据;可以对所述时序数据进行小波分解,得到多个小波分解后的时序数据;可以将小波分解后的时序数据输入至预先训练的时序数据预测模型;可以对时序数据预测模型的输出进行小波重构,得到该年份下一季度的财务收支数据,从而为相关决策部门提供数据上的支持。
例如,所述计算设备可以获取某一银行网点2020年第一季度的财务收支数据q1、2020年第二季度的财务收支数据q2、以及2020年第三季度的财务收支数据q3,作为时序数据;可以对所述时序数据c进行小波分解,得到小波分解后的时序数据c1、小波分解后的时序数据c2、以及小波分解后的时序数据c3。其中,小波分解后的时序数据c1对应尺度数1,具体包括q11、q21、q31。所述q11为2020年第一季度的财务收支数据q1在尺度数1下的低频成分,所述q21为2020年第二季度的财务收支数据q2在尺度数1下的低频成分,所述q31为2020年第三季度的财务收支数据q3在尺度数1下的低频成分。小波分解后的时序数据c2对应尺度数2,具体包括q12、q22、q32。所述q12为2020年第一季度的财务收支数据q1在尺度数2下的低频成分,所述q22为2020年第二季度的财务收支数据q2在尺度数2下的低频成分,所述q32为2020年第三季度的财务收支数据q3在尺度数2下的低频成分。小波分解后的时序数据c3对应尺度数3,具体包括q13、q23、q33。所述q13为2020年第一季度的财务收支数据q1在尺度数3下的低频成分,所述q23为2020年第二季度的财务收支数据q2在尺度数3下的低频成分,所述q33为2020年第三季度的财务收支数据q3在尺度数3下的低频成分。
所述计算设备可以将小波分解后的时序数据c1、小波分解后的时序数据c2、以及小波分解后的时序数据c3输入至预先训练的预测模型,得到预测模型的输出q41、q42、q43;可以对预测模型的输出q41、q42、q43进行小波重构,得到2020年第四季度的财务收支数据q4。其中,所述q41可以理解为2020年第四季度的财务收支数据q4在尺度数1下的低频成分,所述q42可以理解为2020年第四季度的财务收支数据q4在尺度数2下的低频成分,所述q43可以理解为2020年第四季度的财务收支数据q4在尺度数3下的低频成分。
这样可以根据上一个或多个季度的财务收支数据,对下一季度的财务收支数据进行预测,为经营决策提供精细、精准的财务收支信息,有效支撑费用预算和经营考核。
请参阅图4。本说明书还提供模型训练装置的一个实施例。所述模型训练装置可以应用于计算设备,具体可以包括以下单元。
获取单元41,用于获取训练集和测试集,所述训练集和所述测试集包括时序数据;
分解单元43,用于对训练集中的时序数据进行小波分解,得到多个小波分解后的训练集;
训练单元45,用于根据小波分解后的训练集,对多个候选模型进行训练;
计算单元47,用于根据测试集,计算训练后的多个候选模型的评价指标;
选取单元49,用于根据评价指标,从训练后的多个候选模型中选取时序数据预测模型。
请参阅图5。本说明书还提供资源数据预测装置的一个实施例。所述资源数据预测装置可以应用于计算设备,具体可以包括以下单元。
获取单元51,用于获取时序数据,所述时序数据包括多个业务时段内的资源数据;
分解单元53,用于对所述时序数据进行小波分解,得到多个小波分解后的时序数据;
输入单元55,用于将小波分解后的时序数据输入至预先训练的时序数据预测模型;
重构单元57,用于对时序数据预测模型的输出进行小波重构,得到未来业务时段内的资源数据。
请参阅图6。本说明书实施例还提供一种计算设备。
所述计算设备可以包括存储器和处理器。
在本实施例中,所述存储器包括但不限于动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)和静态随机存取存储器(Static Random Access Memory,SRAM)等。所述存储器可以用于存储计算机指令。
在本实施例中,所述处理器可以按任何适当的方式实现。例如,所述处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。所述处理器可以用于执行所述计算机指令以实现图1或者图2所对应的实施例。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其它实施例的不同之处。尤其,对于单侧实施的方法实施例、装置实施例、和计算设备实施例而言,由于其基本相似于模型训练方法实施例,所以描述的比较简单,相关之处参见模型训练方法实施例的部分说明即可。
另外,可以理解的是,本领域技术人员在阅读本说明书文件之后,可以无需创造性劳动想到将本说明书列举的部分或全部实施例进行任意组合,这些组合也在本说明书公开和保护的范围内。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。
本说明书可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
虽然通过实施例描绘了本说明书,本领域普通技术人员知道,本说明书有许多变形和变化而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。
Claims (12)
1.一种模型训练方法,包括:
获取训练集和测试集,所述训练集和所述测试集包括时序数据;
对训练集中的时序数据进行小波分解,得到多个小波分解后的训练集;
根据小波分解后的训练集,对多个候选模型进行训练;
根据测试集,计算训练后的多个候选模型的评价指标;
根据评价指标,从训练后的多个候选模型中选取时序数据预测模型。
2.如权利要求1所述的方法,所述获取训练集和测试集,包括:
获取多个时序数据作为样本数据,所述时序数据包括多个业务时段内的资源数据;
以时序数据中较早业务时段内的资源数据作为样本数据的特征数据,以时序数据中较晚业务时段内的资源数据作为样本数据的标签数据,按照预设划分规则,将所述多个时序数据划分为训练集和测试集,所述训练集和所述测试集包括多个样本数据。
3.如权利要求1所述的方法,所述多个小波分解后的训练集对应不同的尺度数;
所述对训练集中的时序数据进行小波分解,包括:
对训练集中的时序数据进行小波分解,得到多个小波尺度下的分解后的时序数据;
将每个小波尺度下的分解后的时序数据,计入与该小波尺度的尺度数相对应的训练集。
4.如权利要求1所述的方法,所述候选模型包括时间卷积网络模型;所述时间卷积网络模型包括卷积层、长短时记忆网络层、线性变换层;其中,所述卷积层用于从输入至候选模型的时序数据中提取特征,所述长短时记忆网络层用于利用卷积层提取的特征进行预测,所述线性变换层用于将长短时记忆网络层的预测结果变换为候选模型的输出。
5.如权利要求1所述的方法,所述多个候选模型通过如下方式获得:
设置多组超参数;
根据所述多组超参数,构建多个候选模型。
6.如权利要求1所述的方法,所述评价指标包括以下至少之一:平均绝对误差、平均绝对百分比误差、均方根误差、纳什模型效率指数。
7.一种资源数据预测方法,包括:
获取时序数据,所述时序数据包括多个业务时段内的资源数据;
对所述时序数据进行小波分解,得到多个小波分解后的时序数据;
将小波分解后的时序数据输入至预先训练的时序数据预测模型;
对时序数据预测模型的输出进行小波重构,得到未来业务时段内的资源数据。
8.如权利要求7所述的方法,所述对所述时序数据进行小波分解,包括:
对所述时序数据进行小波分解,得到多个小波尺度下的分解后的时序数据;
相应地,所述时序数据预测模型的输出包括所述时序数据预测模型在多个小波尺度下的预测结果,所述对时序数据预测模型的输出进行小波重构,包括:
对时序数据预测模型在多个小波尺度下的预测结果进行小波重构。
9.如权利要求7所述的方法,所述预测模型包括时间卷积网络模型;所述时间卷积网络模型包括卷积层、长短时记忆网络层、线性变换层;其中,所述卷积层用于从输入的小波分解后的时序数据中提取特征,所述长短时记忆网络层用于利用卷积层提取的特征进行预测,所述线性变换层用于将长短时记忆网络层的预测结果变换为时序数据预测模型的输出。
10.一种模型训练装置,包括:
获取单元,用于获取训练集和测试集,所述训练集和所述测试集包括时序数据;
分解单元,用于对训练集中的时序数据进行小波分解,得到多个小波分解后的训练集;
训练单元,用于根据小波分解后的训练集,对多个候选模型进行训练;
计算单元,用于根据测试集,计算训练后的多个候选模型的评价指标;
选取单元,用于根据评价指标,从训练后的多个候选模型中选取时序数据预测模型。
11.一种资源数据预测装置,包括:
获取单元,用于获取时序数据,所述时序数据包括多个业务时段内的资源数据;
分解单元,用于对所述时序数据进行小波分解,得到多个小波分解后的时序数据;
输入单元,用于将小波分解后的时序数据输入至预先训练的时序数据预测模型;
重构单元,用于对时序数据预测模型的输出进行小波重构,得到未来业务时段内的资源数据。
12.一种计算设备,包括:
至少一个处理器;
存储有程序指令的存储器,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如权利要求1-9中任一项所述方法的指令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110042805.2A CN112749845A (zh) | 2021-01-13 | 2021-01-13 | 模型训练方法、资源数据预测方法、装置和计算设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110042805.2A CN112749845A (zh) | 2021-01-13 | 2021-01-13 | 模型训练方法、资源数据预测方法、装置和计算设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112749845A true CN112749845A (zh) | 2021-05-04 |
Family
ID=75651090
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110042805.2A Pending CN112749845A (zh) | 2021-01-13 | 2021-01-13 | 模型训练方法、资源数据预测方法、装置和计算设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112749845A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109948452A (zh) * | 2019-02-22 | 2019-06-28 | 中国电子科技集团公司第三十六研究所 | 一种时序信号预测方法和装置 |
WO2020000715A1 (zh) * | 2018-06-29 | 2020-01-02 | 平安科技(深圳)有限公司 | 基于指数特征提取的股指预测方法、服务器及存储介质 |
CN111695791A (zh) * | 2020-05-29 | 2020-09-22 | 腾讯科技(深圳)有限公司 | 一种业务指标预测方法及装置 |
CN111859264A (zh) * | 2020-07-09 | 2020-10-30 | 北京工商大学 | 一种基于贝叶斯优化及小波分解的时序预测方法及装置 |
-
2021
- 2021-01-13 CN CN202110042805.2A patent/CN112749845A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020000715A1 (zh) * | 2018-06-29 | 2020-01-02 | 平安科技(深圳)有限公司 | 基于指数特征提取的股指预测方法、服务器及存储介质 |
CN109948452A (zh) * | 2019-02-22 | 2019-06-28 | 中国电子科技集团公司第三十六研究所 | 一种时序信号预测方法和装置 |
CN111695791A (zh) * | 2020-05-29 | 2020-09-22 | 腾讯科技(深圳)有限公司 | 一种业务指标预测方法及装置 |
CN111859264A (zh) * | 2020-07-09 | 2020-10-30 | 北京工商大学 | 一种基于贝叶斯优化及小波分解的时序预测方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2021232839B2 (en) | Updating Attribute Data Structures to Indicate Trends in Attribute Data Provided to Automated Modelling Systems | |
Kim et al. | Time series prediction using deep echo state networks | |
Pal et al. | Practical time series analysis: master time series data processing, visualization, and modeling using python | |
Wei | A hybrid ANFIS model based on empirical mode decomposition for stock time series forecasting | |
Sornette et al. | Clarifications to questions and criticisms on the Johansen–Ledoit–Sornette financial bubble model | |
CN107358247B (zh) | 一种确定流失用户的方法及装置 | |
US20210303970A1 (en) | Processing data using multiple neural networks | |
CN109934697A (zh) | 一种基于图结构模型的信用风险控制方法、装置以及设备 | |
WO2022062193A1 (zh) | 基于时序归因分析的个人信用评估与解释方法、装置、设备及存储介质 | |
CN111612628A (zh) | 一种非平衡数据集的分类方法及系统 | |
Valencia et al. | Generalized additive model with embedded variable selection for bankruptcy prediction: Prediction versus interpretation | |
Schoch et al. | CS-Shapley: class-wise Shapley values for data valuation in classification | |
CN113934851A (zh) | 用于文本分类的数据增强方法、装置及电子设备 | |
Gan | Signal processing and image processing for acoustical imaging | |
Hirata et al. | Parsimonious description for predicting high-dimensional dynamics | |
Shekar et al. | A combined deep CNN-RNN network for rainfall-runoff modelling in Bardha Watershed, India | |
CN109255368B (zh) | 随机选取特征的方法、装置、电子设备及存储介质 | |
Yusof et al. | Financial time series forecasting using prophet | |
Wolter et al. | Sequence prediction using spectral RNNs | |
Elliott et al. | A hidden Markov regime-switching smooth transition model | |
Otero et al. | EMD-based data augmentation method applied to handwriting data for the diagnosis of Essential Tremor using LSTM networks | |
CN115936196A (zh) | 基于时序卷积网络的月降水模型预测方法 | |
CN112749845A (zh) | 模型训练方法、资源数据预测方法、装置和计算设备 | |
Bingham | Modelling and prediction of financial time series | |
Chaudhari | Forecasting cryptocurrency prices using machine learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |