CN114363193A

CN114363193A - 资源预测模型的训练方法和装置、资源预测方法和装置

Info

Publication number: CN114363193A
Application number: CN202210002993.0A
Authority: CN
Inventors: 陈均奕; 王文韬; 王方舟
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2022-01-04
Filing date: 2022-01-04
Publication date: 2022-04-15
Anticipated expiration: 2042-01-04
Also published as: CN114363193B

Abstract

本公开关于一种资源预测模型的训练方法和装置、资源预测方法和装置，资源预测模型的训练方法包括：获取目标对象在预设历史周期内的历史虚拟资源值和目标对象在预测时间点的真实虚拟资源值，预测时间点是预设历史周期的终点经过预设时长后的时间点；将历史虚拟资源值输入资源预测模型，得到在预测时间点的预测虚拟资源值，其中，资源预测模型为一次指数平滑模型；根据预测虚拟资源值和真实虚拟资源值确定资源预测模型的损失函数的值；根据损失函数的值调整资源预测模型的平滑系数，得到训练后的资源预测模型，可利用训练所得的模型较为准确地预测目标对象可能获得的虚拟资源值。

Description

资源预测模型的训练方法和装置、资源预测方法和装置

技术领域

本公开涉及计算机技术领域，尤其涉及一种资源预测模型的训练方法和装置、资源预测方法和装置。

背景技术

随着互联网技术的发展，越来越多的用户通过互联网中的互动平台(如直播平台)与其他用户进行交流和互动。并且，用户通过交流和互动可以获得虚拟资源值。

为了便于运营人员对互动平台中的用户进行管理和维护，需要对用户可能获得的虚拟资源值进行预测。相关技术中，通常采用用户在过去一段时间内获得的虚拟资源值的均值或中位数，作为用户的预测虚拟资源值。然而，对于周期较长的场景，容易纳入过多历史数据，以致于得到的结果不能够正确反映用户现阶段的虚拟资源值水平，造成虚拟资源值的预测准确度较低。

发明内容

本公开提供一种资源预测模型的训练方法和装置、资源预测方法和装置，以至少解决相关技术中的虚拟资源值的预测准确度较低的问题，也可不解决任何上述问题。

根据本公开的第一方面，提供了一种资源预测模型的训练方法，包括：获取目标对象在预设历史周期内的历史虚拟资源值和所述目标对象在预测时间点的真实虚拟资源值，所述预测时间点是所述预设历史周期的终点经过预设时长后的时间点；将所述历史虚拟资源值输入所述资源预测模型，得到在所述预测时间点的预测虚拟资源值，其中，所述资源预测模型为一次指数平滑模型；根据所述预测虚拟资源值和所述真实虚拟资源值确定所述资源预测模型的损失函数的值；根据所述损失函数的值调整所述资源预测模型的平滑系数，得到训练后的所述资源预测模型。

可选地，所述预设历史周期包括多个连续的第一子周期，每个所述第一子周期包括多个连续的第二子周期，其中，获取目标对象在预设历史周期内的历史虚拟资源值的步骤，包括：获取所述目标对象在所述预设历史周期内的每个所述第二子周期的单期虚拟资源值；针对每个所述第一子周期，确定所述第一子周期对应的至少部分所述单期虚拟资源值的平均值，得到每个所述第一子周期的子周期虚拟资源值，所述预设历史周期内的全部所述第一子周期的所述子周期虚拟资源值构成所述历史虚拟资源值。

可选地，确定所述第一子周期对应的至少部分所述单期虚拟资源值的平均值的步骤，包括：确定所述第一子周期对应的全部所述单期虚拟资源值去除最大值后的平均值。

可选地，确定所述第一子周期对应的至少部分所述单期虚拟资源值的平均值的步骤，包括：响应于所述第一子周期对应的全部所述单期虚拟资源值的数量大于或等于预设数量，确定所述第一子周期对应的全部所述单期虚拟资源值去除最大值后的平均值；响应于所述第一子周期对应的全部所述单期虚拟资源值的数量小于预设数量，确定所述第一子周期对应的全部所述单期虚拟资源值的平均值。

可选地，所述预设时长是一个所述第一子周期的时长。

可选地，所述预设历史周期的时长大于或等于参考时长，所述参考时长通过以下步骤确定：选取任意时间点作为第一时间点，将在所述第一时间点时处于预设生命周期的全部对象标记为参考对象；监测所述参考对象在所述第一时间点之后的生命周期变化，针对每种生命周期，确定处于所述生命周期的参考对象在全部参考对象中占比的变化率；确定全部所述变化率的绝对值均小于预设变化率的时间点，作为第二时间点；确定所述第一时间点到所述第二时间点经历的时长，作为所述参考时长。

根据本公开的第二方面，提供了一种资源预测方法，包括：获取目标对象在预设历史周期内的历史虚拟资源值；将所述历史虚拟资源值输入所述目标对象对应的资源预测模型，得到在预测时间点的预测虚拟资源值，其中，所述预测时间点是所述预设历史周期的终点经过预设时长后的时间点，其中，所述资源预测模型是使用上述的训练方法训练得到的。

根据本公开的第三方面，提供了一种资源预测模型的训练装置，包括：获取单元，被配置为：获取目标对象在预设历史周期内的历史虚拟资源值和所述目标对象在预测时间点的真实虚拟资源值，所述预测时间点是所述预设历史周期的终点经过预设时长后的时间点；预测单元，被配置为：将所述历史虚拟资源值输入所述资源预测模型，得到在所述预测时间点的预测虚拟资源值，其中，所述资源预测模型为一次指数平滑模型；计算单元，被配置为：根据所述预测虚拟资源值和所述真实虚拟资源值确定所述资源预测模型的损失函数的值；调参单元，被配置为：根据所述损失函数的值调整所述资源预测模型的平滑系数，得到训练后的所述资源预测模型。

可选地，所述预设历史周期包括多个连续的第一子周期，每个所述第一子周期包括多个连续的第二子周期，所述获取单元还被配置为：获取所述目标对象在所述预设历史周期内的每个所述第二子周期的单期虚拟资源值；针对每个所述第一子周期，确定所述第一子周期对应的至少部分所述单期虚拟资源值的平均值，得到每个所述第一子周期的子周期虚拟资源值，所述预设历史周期内的全部所述第一子周期的所述子周期虚拟资源值构成所述历史虚拟资源值。

可选地，所述获取单元还被配置为：确定所述第一子周期对应的全部所述单期虚拟资源值去除最大值后的平均值。

可选地，所述获取单元还被配置为：响应于所述第一子周期对应的全部所述单期虚拟资源值的数量大于或等于预设数量，确定所述第一子周期对应的全部所述单期虚拟资源值去除最大值后的平均值；响应于所述第一子周期对应的全部所述单期虚拟资源值的数量小于预设数量，确定所述第一子周期对应的全部所述单期虚拟资源值的平均值。

可选地，所述预设时长是一个所述第一子周期的时长。

根据本公开的第四方面，提供了一种资源预测装置，包括：获取单元，被配置为：获取目标对象在预设历史周期内的历史虚拟资源值；预测单元，被配置为：将所述历史虚拟资源值输入所述目标对象对应的资源预测模型，得到在预测时间点的预测虚拟资源值，其中，所述预测时间点是所述预设历史周期的终点经过预设时长后的时间点，其中，所述资源预测模型是使用上述的训练方法训练得到的。

根据本公开的第五方面，提供了一种电子设备，所述电子设备包括：至少一个处理器；至少一个存储计算机可执行指令的存储器，其中，所述计算机可执行指令在被所述至少一个处理器运行时，促使所述至少一个处理器执行根据本公开的资源预测模型的训练方法或资源预测方法。

根据本公开的第六方面，提供了一种计算机可读存储介质，当所述计算机可读存储介质中的指令被至少一个处理器运行时，促使所述至少一个处理器执行根据本公开的资源预测模型的训练方法或资源预测方法。

根据本公开的第七方面，提供了一种计算机程序产品，包括计算机指令，所述计算机指令被至少一个处理器执行时实现根据本公开的资源预测模型的训练方法或资源预测方法。

本公开的实施例提供的技术方案至少带来以下有益效果：

根据本公开的实施例的资源预测模型的训练方法和装置、资源预测方法和装置，提出一种基于指数平滑预测的资源预测模型，可结合目标对象的历史虚拟资源值和预测时间点的真实虚拟资源值，训练出适合目标对象的资源预测模型，能够为目标对象的历史虚拟资源值数据配置合理的权重，减少久远的历史数据对预测结果的影响，从而利用该模型较为准确地预测目标对象可能获得的虚拟资源值。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是示出根据本公开的实施例的资源预测模型的训练方法的流程图。

图2是示出根据本公开的实施例的资源预测方法的流程图。

图3是示出根据本公开的一个具体实施例的平台全体成熟主播生命周期变化示意图。

图4是示出根据本公开的一个具体实施例的资源预测模型的应用方法的流程图。

图5是示出根据本公开的一个具体实施例的历史虚拟资源值缩放前后对比示意图。

图6是示出根据本公开的一个具体实施例的数据缩放的流程图。

图7是示出根据本公开的一个具体实施例的资源预测数据示意图。

图8是示出根据本公开的实施例的资源预测模型的训练装置的框图。

图9是示出根据本公开的实施例的资源预测装置的框图。

图10是根据本公开的示例性实施例的电子设备的框图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

在此需要说明的是，在本公开中出现的“若干项之中的至少一项”均表示包含“该若干项中的任意一项”、“该若干项中的任意多项的组合”、“该若干项的全体”这三类并列的情况。例如“包括A和B之中的至少一个”即包括如下三种并列的情况：(1)包括A；(2)包括B；(3)包括A和B。又例如“执行步骤一和步骤二之中的至少一个”，即表示如下三种并列的情况：(1)执行步骤一；(2)执行步骤二；(3)执行步骤一和步骤二。

还需要说明的是，本公开所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等)，均为经用户授权或者经过各方充分授权的信息和数据。

为了便于运营人员对互动平台中的用户进行管理和维护，需要对用户可能获得的虚拟资源值进行预测。相关技术中对虚拟资源值的预测方法较为笼统，例如采用用户在过去一段时间内获得的虚拟资源值的均值或中位数，作为用户的预测虚拟资源值。然而对于周期较长的场景，相关技术容易纳入过多历史数据，以致于得到的结果不能够正确反映用户现阶段的虚拟资源值水平。再者，在某些特殊时间段(特殊节假日、平台活动期等)用户获得的虚拟资源值会相对平时出现突增，受环境因素影响而偶尔出现的极值并不能代表用户日常获得的虚拟资源值的水平，造成取得的均值或中位数与用户的日常水平不符。此外，平台中的用户随着使用平台的时间增长，其互动行为往往具有阶段性特点，因此可以划分出不同的生命周期，例如包括新生期、成长期、成熟期、衰退期、休眠期，对于在统计周期内跨阶段的用户，例如从成熟期到衰退期，其获得的虚拟资源值也会出现衰减现象，本身并不稳定，此时取均值或中位数同样无法反映用户的日常水平。综上，相关技术由于受极值和历史因素的影响，虚拟资源值的预测准确度较低。

本公开的示例性实施例利用了数据分析及数据挖掘技术，对目标对象(例如某个直播平台主播)获得的历史虚拟资源值进行了分析，总结出一种基于一次指数平滑预测目标对象可能获得的虚拟资源值的方案。该方案通过结合历史虚拟资源值确定出一次指数平滑预测的平滑系数，能够为目标对象的历史虚拟资源值数据配置合理的权重，减少久远的历史数据对预测结果的影响，提升预测准确度。

下面，将参照图1至图10具体描述根据本公开的示例性实施例的资源预测模型的训练方法和训练装置以及资源预测方法和资源预测装置。

图1是示出根据本公开的实施例的资源预测模型的训练方法的流程图。应理解，根据本公开的示例性实施例的资源预测模型的训练方法可以在诸如智能手机、平板电脑、个人电脑(PC)的终端设备中实现，也可以在诸如服务器的设备中实现训练。

参照图1，在步骤101，获取目标对象在预设历史周期内的历史虚拟资源值和目标对象在预测时间点的真实虚拟资源值。其中，预测时间点是预设历史周期的终点经过预设时长后的时间点。通过获取需预测其可能获得的虚拟资源值的目标对象的虚拟资源值时序数据，可为资源预测模型的训练提供样本，进而得到适合目标对象的资源预测模型。

其中，获取的虚拟资源值时序数据包括预设历史周期内的一系列带有时间戳的虚拟资源值数据，可作为预测所依据的数据。可以理解的是，在模型的训练阶段，可先确定一个历史时间点作为假定的当前时间点，预设历史周期就是从这个假定的当前时间点向前回溯一定时长所得到的时段，这个假定的当前时间点就是预设历史周期的终点。在模型的应用阶段，预设历史周期的终点就是真实的当前时间点。

可选地，预设历史周期的时长大于或等于参考时长，参考时长通过以下步骤确定：选取任意时间点作为第一时间点，将在第一时间点时处于预设生命周期的全部对象标记为参考对象；监测参考对象在第一时间点之后的生命周期变化，针对每种生命周期，确定处于生命周期的参考对象在全部参考对象中占比的变化率(占比本身是一个比率，这里的变化率可以直接使用占比的变化量，也可以使用占比变化曲线的斜率，只要可以反映变化程度即可，本公开不做限制)；确定全部变化率的绝对值均小于预设变化率的时间点，作为第二时间点；确定第一时间点到第二时间点经历的时长，作为参考时长。也就是说，参考时长是在参考时间点处于预设生命周期的参考对象在参考时间点之后生命周期变化趋于稳定所花费的时长。参考时长是参考对象的生命周期浮动变化最为陡峭的一段时期，经过该时期后，参考对象的生命周期变化就趋于稳定了。由于本公开的目的在于，在对象群体的量级较大的情况下获得每个目标对象的预测虚拟资源值，所以本公开期望使用尽可能短、但包含了对象生命周期浮动变化的历史周期。假设预测窗口(即预设历史周期)恰好落在这个浮动最大的时间段内，且模型依旧能带来较好的预测效果的话，则自然也能保证在平稳的周期内的效果。也就是说，通过分析确定出参考时长，再保证预设历史周期的时长不小于参考时长，就能较为可靠地保证训练出的资源预测模型的预测能力。可选地，预设生命周期可以是目标对象当前所处的生命周期，以提高针对性；也可以统一采用相同的生命周期，例如成熟期，可对全部目标对象采用统一的参考时长，既能够基本满足目标对象的预测需要，又不必专门判定当前目标对象所处的生命周期，有助于减少计算负荷。

具体来说，尽量缩短预设历史周期的时长，可以削弱历史信息过度参与的影响，使得预测结果更加符合目标对象在现阶段的水平。然而预设历史周期过短，可能导致历史虚拟资源值的数据量过小，不便于执行预测计算。基于此，可以结合能够获取到的历史虚拟资源值的数据量和参考时长确定预设历史时长。在预设历史周期的时长等于参考时长时，若能够获取到的历史虚拟资源值的数据量足够满足预测计算需要，则将参考时长作为预设历史周期的时长，若不能满足预测计算需要，则根据所需数据量适当延长预设历史周期的时长。例如，若参考时长为3个月，但数据量不足，可以适当将预设历史周期的时长延长为4个月或5个月。

可选地，预设历史周期包括多个连续的第一子周期，每个第一子周期又进一步包括多个连续的第二子周期。相应地，步骤101中的获取目标对象在预设历史周期内的历史虚拟资源值，具体可执行为，先获取目标对象在预设历史周期内的每个第二子周期的单期虚拟资源值，也就是将第二子周期作为统计目标对象的历史虚拟资源值的最小统计周期。以第二子周期是天为例，就是获取目标对象在预设历史周期内每天的虚拟资源值数据，作为单期虚拟资源值。此后，针对每个第一子周期，确定第一子周期对应的至少部分单期虚拟资源值的平均值，得到子周期虚拟资源值，也就是以相对更长的第一子周期为统计周期，对第一子周期内的单期虚拟资源值做进一步统计，得到每个第一子周期的虚拟资源值统计值(即子周期虚拟资源值)，预设历史周期内的全部第一子周期的子周期虚拟资源值汇总在一起，就构成了历史虚拟资源值。经过上述的数据缩放操作，一方面可以减少历史虚拟资源值的数据量，降低计算负荷，另一方面，在确定每个第一子周期的子周期虚拟资源值时，通过合理选取单期虚拟资源值以求取平均值，可以过滤掉明显偏离目标对象获得虚拟资源值能力的单期虚拟资源值，尽量去除环境因素带来的影响，使得预测结果更符合目标对象在现阶段的水平。应理解，由于预设历史周期内的全部第一子周期的子周期虚拟资源值共同构成历史虚拟资源值，所以后续的步骤102是将构成历史虚拟资源值的全部子周期虚拟资源值输入资源预测模型。

进一步地，确定第一子周期对应的至少部分单期虚拟资源值的平均值的步骤，包括：确定第一子周期对应的全部单期虚拟资源值去除最大值后的平均值。也就是说，针对每个第一子周期，在选取单期虚拟资源值时，可选取最大值以外剩余的所有单期虚拟资源值，以去除环境因素带来的极值影响。

进一步地，确定第一子周期对应的至少部分单期虚拟资源值的平均值的步骤，包括：响应于第一子周期对应的全部单期虚拟资源值的数量大于或等于预设数量，确定第一子周期对应的全部单期虚拟资源值去除最大值后的平均值；响应于第一子周期对应的全部单期虚拟资源值的数量小于预设数量，确定第一子周期对应的全部单期虚拟资源值的平均值。由于目标对象的活动频率(例如主播进行直播的频率)往往不会始终保持在一个较高的频率，所以并非每个第一子周期内都有大量的单期虚拟资源值。通过先判断当前分析的第一子周期内的单期虚拟资源值的数量是否充足，能够在数据充足时才去除最大值，数据较少时则使用全部单期虚拟资源值，能够降低计算平均值所使用的数据量过少时反而强化了个别单期虚拟资源值的影响的风险。

获取的虚拟资源值时序数据还包括在预设历史周期结束后经过预设时长的预测时间点的真实虚拟资源值数据，可作为比对模型预测准确程度的数据，以便于据此调整模型参数。

可选地，预设时长是一个第一子周期的时长。也就是预测时间点为预设历史周期结束后的下一个第一子周期，使得预测所依据的历史虚拟资源值的数据统计周期与预测的周期相一致，便于进行周期性的数据预测，有助于提升预测结果的准确度。

在步骤102，将历史虚拟资源值输入资源预测模型，得到在预测时间点的预测虚拟资源值。其中，资源预测模型为一次指数平滑模型。此类模型对数据的需求量小，只需少量数据即可对未来进行预测，适用于小周期的预测场景。并且该模型可根据时期的远近对数据取权重进行指数衰减，以达到保留历史信息的同时向近期的实际情况靠拢，能更好地兼容数据的波动情况。此外，此类模型的建模操作相对简单，运行成本低，适合应用到每个目标对象身上，从而对每个目标对象进行个性化的预测。

具体地，一次指数平滑模型的公式如下：

其中，t代表各个时刻，α代表平滑系数，

表示在t时刻的预测虚拟资源值，y_t表示在t时刻的真实虚拟资源值。对于y₁，即第一个时刻(例如第一个第一子周期)的预测虚拟资源值，可以基于现有的真实虚拟资源值近似得到，例如可使用第一个时刻的真实虚拟资源值，也可以使用前面若干时刻的真实虚拟资源值的平均值。对于生命时长(从目标对象在平台注册或开播到预设历史周期终点的时长)小于预设历史周期的时长的情况，可以将不足的部分用0填充，也可仅使用有生命的区间进行预测。

在步骤103，根据预测虚拟资源值和真实虚拟资源值确定资源预测模型的损失函数的值。通过根据预测虚拟资源值和真实虚拟资源值计算损失函数的值，可以反映预测结果的准确程度，以便据此调整模型参数。损失函数例如可选用均方根误差、均方误差、平均绝对误差等，本公开对此不作限制。

在步骤104，根据损失函数的值调整资源预测模型的平滑系数，得到训练后的资源预测模型。参考前述的一次指数平滑模型的公式，此步骤可结合损失函数的值调整其中的平滑系数，调整的参数少，计算量小，有助于降低计算负担和运行成本，适合应用于每个目标对象。可选地，调整平滑系数时可先在0到1之间选取一组数据作为备选，分别计算出相应的预测虚拟资源值和损失函数的值，选取其中损失函数的值最小的结果，得到训练出的资源预测模型。

图2是示出根据本公开的实施例的资源预测方法的流程图。应理解，根据本公开的示例性实施例的资源预测方法可以在诸如智能手机、平板电脑、个人电脑(PC)的终端设备中实现，也可以在诸如服务器的设备中实现。

参照图2，在步骤201，获取目标对象在预设历史周期内的历史虚拟资源值。历史虚拟资源值具体是预设历史周期内的一系列带有时间戳的虚拟资源值数据，通过获取需预测其可能获得的虚拟资源值的目标对象的历史虚拟资源值，可作为预测目标对象在未来某一时间点能获取到的虚拟资源值的数据依据。其中，预设历史周期的时长与模型训练阶段可保持一致，在此不再赘述。

可选地，预设历史周期包括多个连续的第一子周期，每个第一子周期又进一步包括多个连续的第二子周期。相应地，步骤201具体可执行为，先获取目标对象在预设历史周期内的每个第二子周期的单期虚拟资源值，也就是将第二子周期作为统计目标对象的历史虚拟资源值的最小统计周期。以第二子周期是天为例，就是获取目标对象在预设历史周期内每天的虚拟资源值数据，作为单期虚拟资源值。此后，针对每个第一子周期，确定第一子周期对应的至少部分单期虚拟资源值的平均值，得到子周期虚拟资源值，也就是以相对更长的第一子周期为统计周期，对第一子周期内的单期虚拟资源值做进一步统计，得到每个第一子周期的虚拟资源值统计值(即子周期虚拟资源值)，预设历史周期内的全部第一子周期的子周期虚拟资源值汇总在一起，就构成了历史虚拟资源值。经过上述的数据缩放操作，一方面可以减少历史虚拟资源值的数据量，降低计算负荷，另一方面，在确定每个第一子周期的子周期虚拟资源值时，通过合理选取单期虚拟资源值以求取平均值，可以过滤掉明显偏离目标对象获得虚拟资源值能力的单期虚拟资源值，尽量去除环境因素带来的影响，使得预测结果更符合目标对象在现阶段的水平。应理解，由于预设历史周期内的全部第一子周期的子周期虚拟资源值共同构成历史虚拟资源值，所以后续的步骤202是将构成历史虚拟资源值的全部子周期虚拟资源值输入资源预测模型。

可以理解的是，在模型的训练阶段和应用阶段，获取历史虚拟资源值的具体方式可以相同，也可以不同，即步骤101和步骤201的具体执行方式可以相同，也可以不同，只要能够分别满足模型训练需要和应用需要即可。

在步骤202，将历史虚拟资源值输入目标对象对应的资源预测模型，得到在预测时间点的预测虚拟资源值。其中，预测时间点是预设历史周期的终点经过预设时长后的时间点，也就是可以预测目标对象在预设历史周期结束预设时长后的时间点获得虚拟资源值的能力。资源预测模型是利用该目标对象的虚拟资源值时序数据作为样本，并使用如图1所示的资源预测模型的训练方法训练得到的，因而具备该训练方法的全部有益效果，在此不再赘述。

接下来结合图3至图7，分阶段描述本公开的一个具体实施例的资源预测模型的训练和应用方法。具体地，可运用HiveSQL、Python中的pandas库做数据准备、数据分析相关工作，并可运用Python中的统计模型库statmodels进行时序模型预测工作。

第一阶段，目标对象虚拟资源值时序数据获取与分析。

通过时间序列预测的方式预测目标对象可能获得的虚拟资源值的一个关键点在于历史数据能否正确囊括了我们所需要信息，主要体现在所选的预设历史周期是否恰好覆盖了目标对象在各个时期的变化趋势。在此分析了平台全体成熟期对象(即参考对象)在未来6个月的生命周期变化(如图3所示)，发现前3个月生命周期发生变化的参考对象的比例趋势较为陡峭，且在第4个月开始趋于稳定。因此选取3个月作为预设历史周期的时长来进行预测。

确定好预设历史周期的时长后，就可开始执行如图4所示的模型训练和应用流程，先按照该周期获取目标对象的天级历史虚拟资源值时序数据(即获取预设历史周期内的每个第二子周期的单期虚拟资源值)。

第二阶段，对时序数据进行缩放处理。

在确定了3个月为预设历史周期的时长以后，如图5所示，对单个目标对象在预设历史周期内的虚拟资源值情况按时间序列进行展开，可得到目标对象的每日虚拟资源值折线图。由于获取的是天级别的数据，数据抖动较为频繁且伴随有局部峰值，这些峰值包括了由外部环境因素所带来的极值情况。针对这类极值情况，对数据进行周期缩放，将数据缩放为周级别且去除周期内的极值，得到历史虚拟资源值(具体方法见图6)。图5还展示了对每日虚拟资源值进行周级别缩放后得到的过去一周日均虚拟资源值折线，其中标记的圆点代表的是目标对象每周去极值后的日均虚拟资源值(对应于前文中每个第一子周期的子周期虚拟资源值)。

第三阶段，构建指数平滑模型，优化模型参数并输出最终预测结果。

基于上一步得到的缩放后的历史虚拟资源值数据建立模型来计算预测时间点的预测虚拟资源值。使用一次指数平滑模型来对目标对象第13周的缩放数值进行预测，公式参见前文。

该模型可通过控制平滑系数参数来决定历史数据中新数据对预测数据的贡献比重，比重越大，引入模型的目标对象早期虚拟资源值数据的权重越小，获得的预测值越接近最近一个时间节点的真实值。在当前场景下，模型的训练过程可以理解为是在拟合目标对象在过去12周的虚拟资源值，每一周的预测值是对上一个周的预测值及真实值的加权求和结果，其中平滑系数决定了权重。因此要对未来一周(第13周)的日均虚拟资源值进行预测，即通过对第12周的预测结果与真实结果进行加权求和得到。整个过程如图7所示，虚线折线表示了一次指数平滑模型对目标对象过去12周的日均虚拟资源值的拟合过程，实线折线表示周缩放后的目标对象虚拟资源值真实值，竖直的虚线代表当前周。可以理解的是，在模型的训练阶段，当前周是假定的“当前”。当前周之后的虚线折线部分则为对第13周日均虚拟资源值的预测结果，当前周之后的实线折线是第13周的日均虚拟资源值的真实值。

通过尝试一系列不同的平滑系数来对模型进行优化，对比目标对象第13周的预测虚拟资源值与真实虚拟资源值的均方根误差(均方根误差公式为

n代表模型预测的次数，

和y_i代表在第i次预测下的预测值和实际值)以后，得到最小误差的模型便可作为最优解，其预测出的结果即可作为目标对象可能获得的虚拟资源值。

图8是示出根据本公开的实施例的资源预测模型的训练装置的框图。应理解，根据本公开的示例性实施例的资源预测模型的训练装置可以在诸如智能手机、平板电脑、个人电脑(PC)的终端设备中以软件、硬件或软件硬件结合的方式实现，也可以在诸如服务器的设备中实现训练。

参照图8，资源预测模型的训练装置800包括获取单元801、预测单元802、计算单元803、调参单元804。

参照图8，获取单元801可获取目标对象在预设历史周期内的历史虚拟资源值和目标对象在预测时间点的真实虚拟资源值。其中，预测时间点是预设历史周期的终点经过预设时长后的时间点。通过获取需预测其可能获得的虚拟资源值的目标对象的虚拟资源值时序数据，可为资源预测模型的训练提供样本，进而得到适合目标对象的资源预测模型。

其中，获取单元801获取的虚拟资源值时序数据包括预设历史周期内的一系列带有时间戳的虚拟资源值数据，可作为预测所依据的数据。可以理解的是，在模型的训练阶段，可先确定一个历史时间点作为假定的当前时间点，预设历史周期就是从这个假定的当前时间点向前回溯一定时长所得到的时段，这个假定的当前时间点就是预设历史周期的终点。在模型的应用阶段，预设历史周期的终点就是真实的当前时间点。

可选地，预设历史周期包括多个连续的第一子周期，每个第一子周期又进一步包括多个连续的第二子周期。相应地，获取单元801可获取目标对象在预设历史周期内的历史虚拟资源值，具体可执行为，先获取目标对象在预设历史周期内的每个第二子周期的单期虚拟资源值，也就是将第二子周期作为统计目标对象的历史虚拟资源值的最小统计周期。以第二子周期是天为例，就是获取目标对象在预设历史周期内每天的虚拟资源值数据，作为单期虚拟资源值。此后，针对每个第一子周期，确定第一子周期对应的至少部分单期虚拟资源值的平均值，得到子周期虚拟资源值，也就是以相对更长的第一子周期为统计周期，对第一子周期内的单期虚拟资源值做进一步统计，得到每个第一子周期的虚拟资源值统计值(即子周期虚拟资源值)，预设历史周期内的全部第一子周期的子周期虚拟资源值汇总在一起，就构成了历史虚拟资源值。经过上述的数据缩放操作，一方面可以减少历史虚拟资源值的数据量，降低计算负荷，另一方面，在确定每个第一子周期的子周期虚拟资源值时，通过合理选取单期虚拟资源值以求取平均值，可以过滤掉明显偏离目标对象获得虚拟资源值能力的单期虚拟资源值，尽量去除环境因素带来的影响，使得预测结果更符合目标对象在现阶段的水平。应理解，由于预设历史周期内的全部第一子周期的子周期虚拟资源值共同构成历史虚拟资源值，所以后续预测单元802是将构成历史虚拟资源值的全部子周期虚拟资源值输入资源预测模型。

进一步地，获取单元801可确定第一子周期对应的全部单期虚拟资源值去除最大值后的平均值。也就是说，针对每个第一子周期，获取单元801在选取单期虚拟资源值时，可选取最大值以外剩余的所有单期虚拟资源值，以去除环境因素带来的极值影响。

进一步地，获取单元801可执行为：响应于第一子周期对应的全部单期虚拟资源值的数量大于或等于预设数量，确定第一子周期对应的全部单期虚拟资源值去除最大值后的平均值；响应于第一子周期对应的全部单期虚拟资源值的数量小于预设数量，确定第一子周期对应的全部单期虚拟资源值的平均值。由于目标对象的活动频率(例如主播进行直播的频率)往往不会始终保持在一个较高的频率，所以并非每个第一子周期内都有大量的单期虚拟资源值。通过先判断当前分析的第一子周期内的单期虚拟资源值的数量是否充足，能够在数据充足时才去除最大值，数据较少时则使用全部单期虚拟资源值，能够降低计算平均值所使用的数据量过少时反而强化了个别单期虚拟资源值的影响的风险。

获取单元801获取的虚拟资源值时序数据还包括在预设历史周期结束后经过预设时长的预测时间点的真实虚拟资源值数据，可作为比对模型预测准确程度的数据，以便于据此调整模型参数。

预测单元802可将历史虚拟资源值输入资源预测模型，得到在预测时间点的预测虚拟资源值。其中，资源预测模型为一次指数平滑模型。此类模型对数据的需求量小，只需少量数据即可对未来进行预测，适用于小周期的预测场景。并且该模型可根据时期的远近对数据取权重进行指数衰减，以达到保留历史信息的同时向近期的实际情况靠拢，能更好地兼容数据的波动情况。此外，此类模型的建模操作相对简单，运行成本低，适合应用到每个目标对象身上，从而对每个目标对象进行个性化的预测。

具体地，一次指数平滑模型的公式如下：

其中，t代表各个时刻，α代表平滑系数，

计算单元803可根据预测虚拟资源值和真实虚拟资源值确定资源预测模型的损失函数的值。通过根据预测虚拟资源值和真实虚拟资源值计算损失函数的值，可以反映预测结果的准确程度，以便据此调整模型参数。损失函数例如可选用均方根误差、均方误差、平均绝对误差等，本公开对此不作限制。

调参单元804可根据损失函数的值调整资源预测模型的平滑系数，得到训练后的资源预测模型。参考前述的一次指数平滑模型的公式，调参单元804可结合损失函数的值调整其中的平滑系数，调整的参数少，计算量小，有助于降低计算负担和运行成本，适合应用于每个目标对象。可选地，调整平滑系数时可先在0到1之间选取一组数据作为备选，分别计算出相应的预测虚拟资源值和损失函数的值，选取其中损失函数的值最小的结果，得到训练出的资源预测模型。

图9是示出根据本公开的实施例的资源预测装置的框图。应理解，根据本公开的示例性实施例的资源预测装置可以在诸如智能手机、平板电脑、个人电脑(PC)的终端设备中以软件、硬件或软件硬件结合的方式实现，也可以在诸如服务器的设备中实现。

参照图9，资源预测装置900包括获取单元901和预测单元902。

获取单元901可获取目标对象在预设历史周期内的历史虚拟资源值。历史虚拟资源值具体是预设历史周期内的一系列带有时间戳的虚拟资源值数据，通过获取需预测其可能获得的虚拟资源值的目标对象的历史虚拟资源值，可作为预测目标对象在未来某一时间点能获取到的虚拟资源值的数据依据。其中，预设历史周期的时长与模型训练阶段可保持一致，在此不再赘述。

可选地，预设历史周期包括多个连续的第一子周期，每个第一子周期又进一步包括多个连续的第二子周期。相应地，获取单元901具体可执行为，先获取目标对象在预设历史周期内的每个第二子周期的单期虚拟资源值，也就是将第二子周期作为统计目标对象的历史虚拟资源值的最小统计周期。以第二子周期是天为例，就是获取目标对象在预设历史周期内每天的虚拟资源值数据，作为单期虚拟资源值。此后，针对每个第一子周期，确定第一子周期对应的至少部分单期虚拟资源值的平均值，得到子周期虚拟资源值，也就是以相对更长的第一子周期为统计周期，对第一子周期内的单期虚拟资源值做进一步统计，得到每个第一子周期的虚拟资源值统计值(即子周期虚拟资源值)，预设历史周期内的全部第一子周期的子周期虚拟资源值汇总在一起，就构成了历史虚拟资源值。经过上述的数据缩放操作，一方面可以减少历史虚拟资源值的数据量，降低计算负荷，另一方面，在确定每个第一子周期的子周期虚拟资源值时，通过合理选取单期虚拟资源值以求取平均值，可以过滤掉明显偏离目标对象获得虚拟资源值能力的单期虚拟资源值，尽量去除环境因素带来的影响，使得预测结果更符合目标对象在现阶段的水平。应理解，由于预设历史周期内的全部第一子周期的子周期虚拟资源值共同构成历史虚拟资源值，所以后续预测单元902是将构成历史虚拟资源值的全部子周期虚拟资源值输入资源预测模型。

进一步地，获取单元901可确定第一子周期对应的全部单期虚拟资源值去除最大值后的平均值。也就是说，针对每个第一子周期，获取单元901在选取单期虚拟资源值时，可选取最大值以外剩余的所有单期虚拟资源值，以去除环境因素带来的极值影响。

进一步地，获取单元901可执行为：响应于第一子周期对应的全部单期虚拟资源值的数量大于或等于预设数量，确定第一子周期对应的全部单期虚拟资源值去除最大值后的平均值；响应于第一子周期对应的全部单期虚拟资源值的数量小于预设数量，确定第一子周期对应的全部单期虚拟资源值的平均值。由于目标对象的活动频率(例如主播进行直播的频率)往往不会始终保持在一个较高的频率，所以并非每个第一子周期内都有大量的单期虚拟资源值。通过先判断当前分析的第一子周期内的单期虚拟资源值的数量是否充足，能够在数据充足时才去除最大值，数据较少时则使用全部单期虚拟资源值，能够降低计算平均值所使用的数据量过少时反而强化了个别单期虚拟资源值的影响的风险。

可以理解的是，在模型的训练阶段和应用阶段，获取历史虚拟资源值的具体方式可以相同，也可以不同，即获取单元801和获取单元901的具体执行方式可以相同，也可以不同，只要能够分别满足模型训练需要和应用需要即可。

预测单元902可将历史虚拟资源值输入目标对象对应的资源预测模型，得到在预测时间点的预测虚拟资源值。其中，预测时间点是预设历史周期的终点经过预设时长后的时间点，也就是可以预测目标对象在预设历史周期结束预设时长后的时间点获得虚拟资源值的能力。资源预测模型是利用该目标对象的虚拟资源值时序数据作为样本，并使用如图1所示的资源预测模型的训练方法训练得到的，因而具备该训练方法的全部有益效果，在此不再赘述。

图10是根据本公开的实施例的电子设备的框图。

参照图10，电子设备1000包括至少一个存储器1001和至少一个处理器1002，所述至少一个存储器1001中存储有计算机可执行指令集合，当计算机可执行指令集合被至少一个处理器1002执行时，执行根据本公开的示例性实施例的资源预测模型的训练方法或资源预测方法。

作为示例，电子设备1000可以是PC计算机、平板装置、个人数字助理、智能手机、或其他能够执行上述指令集合的装置。这里，电子设备1000并非必须是单个的电子设备，还可以是任何能够单独或联合执行上述指令(或指令集)的装置或电路的集合体。电子设备1000还可以是集成控制系统或系统管理器的一部分，或者可被配置为与本地或远程(例如，经由无线传输)以接口互联的便携式电子设备。

在电子设备1000中，处理器1002可包括中央处理器(CPU)、图形处理器(GPU)、可编程逻辑装置、专用处理器系统、微控制器或微处理器。作为示例而非限制，处理器还可包括模拟处理器、数字处理器、微处理器、多核处理器、处理器阵列、网络处理器等。

处理器1002可运行存储在存储器1001中的指令或代码，其中，存储器1001还可以存储数据。指令和数据还可经由网络接口装置而通过网络被发送和接收，其中，网络接口装置可采用任何已知的传输协议。

存储器1001可与处理器1002集成为一体，例如，将RAM或闪存布置在集成电路微处理器等之内。此外，存储器1001可包括独立的装置，诸如，外部盘驱动、存储阵列或任何数据库系统可使用的其他存储装置。存储器1001和处理器1002可在操作上进行耦合，或者可例如通过I/O端口、网络连接等互相通信，使得处理器1002能够读取存储在存储器中的文件。

此外，电子设备1000还可包括视频显示器(诸如，液晶显示器)和用户交互接口(诸如，键盘、鼠标、触摸输入装置等)。电子设备1000的所有组件可经由总线和/或网络而彼此连接。

根据本公开的示例性实施例，还可提供一种计算机可读存储介质，当计算机可读存储介质中的指令被至少一个处理器运行时，促使至少一个处理器执行根据本公开的示例性实施例的资源预测模型的训练方法或资源预测方法。这里的计算机可读存储介质的示例包括：只读存储器(ROM)、随机存取可编程只读存储器(PROM)、电可擦除可编程只读存储器(EEPROM)、随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)、闪存、非易失性存储器、CD-ROM、CD-R、CD+R、CD-RW、CD+RW、DVD-ROM、DVD-R、DVD+R、DVD-RW、DVD+RW、DVD-RAM、BD-ROM、BD-R、BD-R LTH、BD-RE、蓝光或光盘存储器、硬盘驱动器(HDD)、固态硬盘(SSD)、卡式存储器(诸如，多媒体卡、安全数字(SD)卡或极速数字(XD)卡)、磁带、软盘、磁光数据存储装置、光学数据存储装置、硬盘、固态盘以及任何其他装置，所述任何其他装置被配置为以非暂时性方式存储计算机程序以及任何相关联的数据、数据文件和数据结构并将所述计算机程序以及任何相关联的数据、数据文件和数据结构提供给处理器或计算机使得处理器或计算机能执行所述计算机程序。上述计算机可读存储介质中的计算机程序可在诸如客户端、主机、代理装置、服务器等计算机设备中部署的环境中运行，此外，在一个示例中，计算机程序以及任何相关联的数据、数据文件和数据结构分布在联网的计算机系统上，使得计算机程序以及任何相关联的数据、数据文件和数据结构通过一个或多个处理器或计算机以分布式方式存储、访问和执行。

根据本公开的示例性实施例，还可提供一种计算机程序产品，该计算机程序产品包括计算机指令，计算机指令被至少一个处理器运行时，促使至少一个处理器执行根据本公开的示例性实施例的资源预测模型的训练方法或资源预测方法。

根据本公开的示例性实施例的资源预测模型的训练方法和装置以及资源预测方法和装置，通过结合历史虚拟资源值确定出一次指数平滑预测的平滑系数，能够为目标对象的历史虚拟资源值数据配置合理的权重，减少久远的历史数据对预测结果的影响，提升预测准确度。通过采用经过缩放处理的历史虚拟资源值，可以在缩放过程中过滤掉明显偏离目标对象获得虚拟资源值能力的数据，尽量去除环境因素带来的影响，使得预测结果更符合目标对象在现阶段的水平。通过选取用户生命周期浮动变化最为陡峭的一段时期的时长，作为获取历史虚拟资源值的预设历史周期，能够保障训练出的模型适应用户生命周期浮动剧烈的时段，自然也能适应用户生命周期较平稳的时段，可靠地保证训练出的资源预测模型的预测能力。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种资源预测模型的训练方法，其特征在于，包括：

获取目标对象在预设历史周期内的历史虚拟资源值和所述目标对象在预测时间点的真实虚拟资源值，所述预测时间点是所述预设历史周期的终点经过预设时长后的时间点；

将所述历史虚拟资源值输入所述资源预测模型，得到在所述预测时间点的预测虚拟资源值，其中，所述资源预测模型为一次指数平滑模型；

根据所述预测虚拟资源值和所述真实虚拟资源值确定所述资源预测模型的损失函数的值；

根据所述损失函数的值调整所述资源预测模型的平滑系数，得到训练后的所述资源预测模型。

2.如权利要求1所述的训练方法，其特征在于，所述预设历史周期包括多个连续的第一子周期，每个所述第一子周期包括多个连续的第二子周期，

其中，获取目标对象在预设历史周期内的历史虚拟资源值的步骤，包括：

获取所述目标对象在所述预设历史周期内的每个所述第二子周期的单期虚拟资源值；

针对每个所述第一子周期，确定所述第一子周期对应的至少部分所述单期虚拟资源值的平均值，得到每个所述第一子周期的子周期虚拟资源值，所述预设历史周期内的全部所述第一子周期的所述子周期虚拟资源值构成所述历史虚拟资源值。

3.如权利要求2所述的训练方法，其特征在于，确定所述第一子周期对应的至少部分所述单期虚拟资源值的平均值的步骤，包括：

确定所述第一子周期对应的全部所述单期虚拟资源值去除最大值后的平均值。

4.如权利要求2所述的训练方法，其特征在于，确定所述第一子周期对应的至少部分所述单期虚拟资源值的平均值的步骤，包括：

响应于所述第一子周期对应的全部所述单期虚拟资源值的数量大于或等于预设数量，确定所述第一子周期对应的全部所述单期虚拟资源值去除最大值后的平均值；

响应于所述第一子周期对应的全部所述单期虚拟资源值的数量小于预设数量，确定所述第一子周期对应的全部所述单期虚拟资源值的平均值。

5.一种虚拟资源值预测方法，其特征在于，包括：

获取目标对象在预设历史周期内的历史虚拟资源值；

将所述历史虚拟资源值输入所述目标对象对应的资源预测模型，得到在预测时间点的预测虚拟资源值，其中，所述预测时间点是所述预设历史周期的终点经过预设时长后的时间点，

其中，所述资源预测模型是使用如权利要求1到4中的任一权利要求所述的训练方法训练得到的。

6.一种资源预测模型的训练装置，其特征在于，包括：

获取单元，被配置为：获取目标对象在预设历史周期内的历史虚拟资源值和所述目标对象在预测时间点的真实虚拟资源值，所述预测时间点是所述预设历史周期的终点经过预设时长后的时间点；

预测单元，被配置为：将所述历史虚拟资源值输入所述资源预测模型，得到在所述预测时间点的预测虚拟资源值，其中，所述资源预测模型为一次指数平滑模型；

计算单元，被配置为：根据所述预测虚拟资源值和所述真实虚拟资源值确定所述资源预测模型的损失函数的值；

调参单元，被配置为：根据所述损失函数的值调整所述资源预测模型的平滑系数，得到训练后的所述资源预测模型。

7.一种资源预测装置，其特征在于，包括：

获取单元，被配置为：获取目标对象在预设历史周期内的历史虚拟资源值；

预测单元，被配置为：将所述历史虚拟资源值输入所述目标对象对应的资源预测模型，得到在预测时间点的预测虚拟资源值，其中，所述预测时间点是所述预设历史周期的终点经过预设时长后的时间点，

8.一种电子设备，其特征在于，包括：

至少一个处理器；

至少一个存储计算机可执行指令的存储器，

其中，所述计算机可执行指令在被所述至少一个处理器运行时，促使所述至少一个处理器执行如权利要求1到4中的任一权利要求所述的资源预测模型的训练方法或如权利要求5所述的资源预测方法。

9.一种计算机可读存储介质，其特征在于，当所述计算机可读存储介质中的指令被至少一个处理器运行时，促使所述至少一个处理器执行如权利要求1到4中的任一权利要求所述的资源预测模型的训练方法或如权利要求5所述的资源预测方法。

10.一种计算机程序产品，包括计算机指令，其特征在于，所述计算机指令被至少一个处理器执行时实现如权利要求1到4中的任一权利要求所述的资源预测模型的训练方法或如权利要求5所述的资源预测方法。