CN112948763A

CN112948763A - 件量预测方法、装置、电子设备及存储介质

Info

Publication number: CN112948763A
Application number: CN201911269853.4A
Authority: CN
Inventors: 闵炎华; 魏昊卿; 丁宇; 王飞; 湛长兰; 张朝东; 刘子恒; 汤芬斯蒂
Original assignee: SF Technology Co Ltd
Current assignee: SF Technology Co Ltd
Priority date: 2019-12-11
Filing date: 2019-12-11
Publication date: 2021-06-11
Anticipated expiration: 2039-12-11
Also published as: CN112948763B

Abstract

本申请公开了一种件量预测方法、装置、电子设备及存储介质，所述方法包括：采集训练样本，所述训练样本包括历史时段内的历史件量数据；将所述历史件量数据输入第一参考模型中进行处理，以得到第一预测数据，将所述第一预测数据作为所述训练样本的第一特征数据；获取所述训练样本的第二特征数据，所述第二特征数据包括件量规模特征、时序特征和时滞信息特征；将所述训练样本的第一特征数据和第二特征数据输入第二参考模型中进行学习训练，以生成预测模型；根据所述预测模型进行件量预测。本申请实施例在时序数据的周期性、趋势性不明显的情况下，通过多特征的融合进行件量预测，以提高件量预测的预测精度。

Description

件量预测方法、装置、电子设备及存储介质

技术领域

本申请实施例涉及物流领域，具体涉及一种件量预测方法、装置、电子设备及存储介质。

背景技术

在物流领域，关于揽收端的件量预测，对于一线业务端如何应对揽收件量的高峰，如何安排人力、物力等，都具有重要的影响。日常中的件量数据是典型的时序数据，其与时间密切相关，因此在现实应用场景中，主要采用时序模型来对件量进行预测。但是对于实际应用场景中的时序而言，数据往往很难呈现明显的趋势与周期，在此情况下，如果仅用时序模型来进行件量预测，则很难拟合到真实件量。

因此，现有技术存在缺陷，有待改进与发展。

发明内容

本申请实施例提供一种件量预测方法、装置、电子设备及存储介质，可以在时序数据的周期性、趋势性不明显的情况下，提高件量预测的预测精度。

本申请实施例提供一种件量预测方法，所述方法包括：

采集训练样本，所述训练样本包括历史时段内的历史件量数据；

将所述历史件量数据输入第一参考模型中进行处理，以得到第一预测数据，将所述第一预测数据作为所述训练样本的第一特征数据；

获取所述训练样本的第二特征数据，所述第二特征数据包括件量规模特征、时序特征和时滞信息特征；

将所述训练样本的第一特征数据和第二特征数据输入第二参考模型中进行学习训练，以生成预测模型；

根据所述预测模型进行件量预测。

本申请实施例还提供一种件量预测装置，所述装置包括：

采集模块，用于采集训练样本，所述训练样本包括历史时段内的历史件量数据；

第一获取模块，用于将所述历史件量数据输入第一参考模型中进行处理，以得到第一预测数据，将所述第一预测数据作为所述训练样本的第一特征数据；

第二获取模块，用于获取所述训练样本的第二特征数据，所述第二特征数据包括件量规模特征、时序特征和时滞信息特征；

训练模块，用于将所述训练样本的第一特征数据和第二特征数据输入第二参考模型中进行学习训练，以生成预测模型；

预测模块，用于根据所述预测模型进行件量预测。

本申请实施例还提供一种电子设备，所述电子设备包括处理器和存储器，所述存储器中存储有计算机程序，所述处理器通过调用所述存储器中存储的所述计算机程序，用于执行本申请任一实施例所述的件量预测方法。

本申请实施例还提供一种存储介质，所述存储介质存储有多条指令，所述指令适于处理器进行加载，执行本申请实施例所提供的任一种所述的件量预测方法中的步骤。

本申请实施例通过采集训练样本，所述训练样本包括历史时段内的历史件量数据；将所述历史件量数据输入第一参考模型中进行处理，以得到第一预测数据，将所述第一预测数据作为所述训练样本的第一特征数据；获取所述训练样本的第二特征数据，所述第二特征数据包括件量规模特征、时序特征和时滞信息特征；将所述训练样本的第一特征数据和第二特征数据输入第二参考模型中进行学习训练，以生成预测模型；根据所述预测模型进行件量预测。本申请实施例在时序数据的周期性、趋势性不明显的情况下，通过多特征的融合进行件量预测，以提高件量预测的预测精度。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种件量预测装置的系统示意图。

图2为本申请实施例提供的一种件量预测方法的流程示意图。

图3为本申请实施例提供的一种件量预测方法的应用场景示意图。

图4为本申请实施例提供的一种件量预测方法的另一流程示意图。

图5为本申请实施例提供的第二参考模型的网络拓扑结构图。

图6为本申请实施例提供的一种件量预测方法的模型训练流程示意图。

图7为本申请实施例提供的一种件量预测装置的结构示意图。

图8为本申请实施例提供的一种件量预测装置的另一结构示意图。

图9为本申请实施例提供的一种服务器的结构示意图。

图10为本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请中的术语“第一”和“第二”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、系统、产品或设备没有限定于已列出的步骤或模块，而是可选地还包括没有列出的步骤或模块，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或模块。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

在物流领域，关于揽收端的件量预测，对于一线业务端如何应对揽收件量的高峰，如何安排人力、物力等，都具有重要的影响。日常中的件量数据是典型的时序数据，其与时间密切相关，因此在现实应用场景中，主要采用时序模型来对件量进行预测。在实际应用中，主要的时序模型可以包括ARIMA模型和Prophet模型等。

ARIMA(Autoregressive Integrated Moving Average model，差分整合移动平均自回归模型)，又称整合移动平均自回归模型，原理在于将非平稳时间序列转换为平稳时间序列，然后将因变量仅对它滞后值(阶数)以及随机误差项的现值和滞后值进行回归所建立的模型；ARIMA模型比较简单，只需要内生变量而不需要其他外部参数，就可以实现预测，但是ARIMA模型需要时序数据比较稳定，然而，在现实应用场景中，数据一般是不稳定的，而是随着时间呈周期性波动。

时序序列模型Prophet是目前普遍采用的件量预测方法。Prophet模型为预测商业数据的时序模型，是一种典型的加法模型，Prophet模型预测对象为三个子模型之和：趋势，周期，节假日，然后利用拟牛顿法对三个子模型进行拟合，因此，Prophet模型对于周期，趋势较为明显的数据预测效果较好，并且Prophet模型能够通过设置节假日表，以适应不同节假日的影响，但是，Prophet模型对于趋势和周期性不明显的时序数据的预测效果不理想。

但是对于实际应用场景中的时序而言，数据往往很难呈现明显的趋势与周期，或者一直保持较好的周期性和趋势性，在此情况下，如果仅用时序模型来进行件量预测，则很难拟合到真实件量。因而，本申请实施例提供了一种件量预测方法、装置、电子设备及存储介质，采集训练样本，所述训练样本包括历史时段内的历史件量数据；将所述训练样本输入第一参考模型中进行处理，以得到所述训练样本的第一特征数据；获取所述训练样本的第二特征数据，所述第二特征数据包括件量规模特征、时序特征和时滞信息特征；将所述训练样本的第一特征数据和第二特征数据输入第二参考模型中进行学习训练，以生成预测模型；根据所述预测模型进行件量预测。本申请实施例在时序数据的周期性、趋势性不明显的情况下，通过多特征的融合进行件量预测，以提高件量预测的预测精度。

本申请实施例提供的件量预测方法，可实现在件量预测装置中，该件量预测装置具体可以集成在电子设备中，电子设备包括但不限于物流终端机、计算机、手机等设备。

请参阅图1，图1为本申请实施例提供的一种件量预测装置的系统示意图。该件量预测装置包括训练过程和预测过程，主要用于：在训练过程中，采集训练样本，所述训练样本包括历史时段内的历史件量数据；然后进行特征信息的提取，具体为将所述历史件量数据输入第一参考模型中进行处理，以得到第一预测数据，将所述第一预测数据作为所述训练样本的第一特征数据，以及获取所述训练样本的第二特征数据，所述第二特征数据包括件量规模特征、时序特征和时滞信息特征；然后将所述训练样本的第一特征数据和第二特征数据输入第二参考模型中进行学习训练，以生成预测模型；在预测过程中，将待预测数据输入预测模型中进行件量预测，以输出件量预测的预测结果。本申请实施例在时序数据的周期性、趋势性不明显的情况下，通过多特征的融合进行件量预测，以提高件量预测的预测精度。

需要说明的是，第二参考模型的训练过程可以在服务器端也可以在电子设备端完成。当第二参考模型的训练过程、实际预测过程都在服务器端完成时，需要使用由训练后的第二参考模型形成的预测模型时，可以将待预测数据输入到服务器，服务器实际预测完成后，将预测结果发送至电子设备端，电子设备再根据预测结果中的揽收件量排配对应揽收工作的人力、物力等。

当第二参考模型的训练过程、实际预测过程都在电子设备端完成时，需要使用由训练后的第二参考模型形成的预测模型时，可以将待预测数据输入到电子设备，电子设备实际预测完成后，电子设备再根据预测结果中的揽收件量排配对应揽收工作的人力、物力等。

当第二参考模型的训练过程在服务器端完成，第二参考模型的实际预测过程在电子设备端完成时，需要使用由训练后的第二参考模型形成的预测模型时，可以将待预测数据输入到电子设备，电子设备实际预测完成后，电子设备再根据预测结果中的揽收件量排配对应揽收工作的人力、物力等。可选的，可以将训练好的预测模型文件(model文件)移植到电子设备上，若需要对输入的待预测数据进行件量预测，则将待预测数据输入到训练好的预测模型文件(model文件)，通过计算即可得到预测结果。

以下将分别进行详细说明，以下各个实施例的描述先后顺序并不构成对具体实施先后顺序的限定。

请参阅图2至图6，图2、图4均为本申请实施例提供的一种件量预测方法的流程示意图，图3为本申请实施例提供的一种件量预测方法的应用场景示意图，图5为本申请实施例提供的第二参考模型的网络拓扑结构图，图6为本申请实施例提供的一种件量预测方法的模型训练流程示意图。所述方法包括：

步骤101，采集训练样本，所述训练样本包括历史时段内的历史件量数据。

例如，可以连续采集历史时段内每一天的件量数据，具体可以连续采集历史时段内目标揽收区域或者目标揽收点对应的每一天的件量数据，历史时段内每一天的件量数据组成的数据集合构成所述历史时段内的历史件量数据。

例如，可以利用2015年1月1日至2019年9月1日的历史件量数据来预测2019年10月份揽收的件量数据。

其中，所述历史件量数据包含了历史时段内每天的件量数据的特征信息，在进行模型建立及预测件量之前，首先要提取出相关的特征信息。

步骤102，将所述历史件量数据输入第一参考模型中进行处理，以得到第一预测数据，将所述第一预测数据作为所述训练样本的第一特征数据。

在一些实施例中，所述第一参考模型可以为时间序列模型，可以将所述历史件量数据输入时间序列模型中进行处理，得到第一预测数据，将所述第一预测数据作为所述训练样本的第一特征数据。

其中，所述第一预测数据为历史件量数据经过时间序列模型处理后得到的粗略的关于预测件量的预测结果，对于趋势和周期性不明显的历史件量数据，所述预测结果的误差较大，但是时间序列模型对于趋势和周期性较为明显的历史件量数据的预测效果较好，可以很好地捕获件量的节假日特性。因此，可以将所述第一预测数据作为第一特征数据，再结合训练样本中的其他特征数据一起输入到第二参考模型中进行数据处理。其中，所述第一特征数据可以用于捕获件量的节假日特性。

例如，所述时间序列模型为Prophet模型，先将采集到的历史件量数据输入Prophet模型进行处理，Prophet模型输出的数据为第一预测数据。当单独使用Prophet模型时，也可以得到粗略的预测件量的预测结果(第一预测数据)，但是得到的预测结果误差较大，因此将所述第一预测数据作为后续训练第二参考模型的第一特征数据。

步骤103，获取所述训练样本的第二特征数据，所述第二特征数据包括件量规模特征、时序特征和时滞信息特征。

在一些实施例中，可以根据所述历史件量数据组成的序列数据、以及所述序列数据的均值和标准差，获取所述件量规模特征。

其中，所述件量规模特征可以用于捕获所要预测的件量是高件量揽收区域还是低件量揽收区域；还可以用来区分不同的揽收区域。

例如，每个目标揽收区域都有一条由历史件量数据组成的序列数据，该序列数据是按照时间先后顺序排列的。首先，取每条序列数据的中位数，组成序列S，根据以下公式一可以得出件量规模Z。公式一为：

其中，Z表示件量规模，S_mean表示序列S的均值，S_std表示序列S的标准差。

在一些实施例中，可以根据所述历史件量数据中的时间序列自相关性，获取所述时序特征。

其中，所述时序特征可以用来捕获件量随时间变化所呈现出的不同规律。

例如，所述时间序列自相关性可以为年度自相关性，也可以为季度自相关性。

具体的，可以对历史件量数据进行处理，得到每个目标揽收区域时序件量的年度自相关性或者季度自相关性等时序特征，该年度自相关性或者季度自相关性作为训练样本的时序特征，该时序特征作为训练样本的第二特征数据之一。

其中，每一条历史件量数据的时序特征，如年度自相关性、季度自相关性均可以利用公式计算得出。比如，计算某一个目标揽收区域在2015年1月1日至2019年9月1日的年度自相关性，步骤如下：

(1)首先取2015年1月1日至2019年9月1日的历史件量数据为序列S₁，再取2016年1月1日至2019年9月1日(滞后一年)的历史件量数据为序列S₂。

(2)通过以下公式二计算两条序列(S₁和S₂)的相关性，从而就得到整个序列S的年度自相关性，公式二为：

其中，R表示序列S的年度自相关性，

表示序列S₁的均值，

表示序列S₂的均值。

例如，计算某一个目标揽收区域在2015年1月1日至2019年9月1日的季度自相关性时，可以选择2015年1月1日至2019年6月1日的历史件量数据为序列S₁，再取2015年4月1日至2019年9月1日(滞后一个季度)的历史件量数据为序列S₂，按照以上公式二计算即可得出季度自相关性。

在一些实施例中，可以根据从所述历史时段内的至少一个预设固定时间节点开始至所述历史时段的结束时间对应的件量数据，从所述历史件量数据中提取所述时滞信息特征。

其中，所述时滞信息特征可以用来捕获较远时间点的信息，以及可以用来降低模型的复杂度。

例如，在利用长达数年的数据来预测未来的件量时，循环神经网络RNN模型一般利用上一个时间步进行训练，随着使用的时间步越来越多，整个RNN模型会逐渐“遗忘”早期的信息。因此，本申请实施例利用同一个目标揽收区域从历史件量数据起始时间开始到结束时间内预设固定时间节点的件量数据作为编码器和解码器的一个特征信息(时滞信息特征)，以此保留对历史件量数据的“记忆”。例如，预设固定时间节点可以为将待预测日期一个季度之前、半年前、一年前、一年半前以及两年前等。该预设固定时间节点可以根据历史件量数据的历史时段的时长来自定义设定。

比如，在利用2015年1月1日至2019年9月1日的历史件量数据来预测2019年10月份揽收的件量时，可以将待预测日期(比如2019年10月1日)一个季度之前的件量、半年前的件量、一年前的件量、一年半前的件量以及两年前的件量作为编码器和解码器的一个特征信息。

在一些实施例中，所述训练样本还包括历史时段内的揽收区域数据，所述获取所述训练样本的第二特征数据，还包括：

对所述揽收区域数据进行聚类处理，以得到揽收区域特征，所述第二特征数据还包括所述揽收区域特征。

其中，所述揽收区域数据包括揽收区域在历史时段内的人均收入信息、GDP信息、百度指数信息、人口数量信息中的一种或多种。

其中，所述揽收区域特征可以用来表征每个揽收区域所特有的特征，不同的揽收区域具有不同的特征。比如人口数量不一样，GDP不一样等，比如揽收区域A和揽收区域B的人口和经济都不一样，所以揽收区域A和揽收区域B的寄件量是不一样的。

例如，所述历史时段内的揽收区域数据为关于揽收区域的自由数据，比如揽收区域数据包括某个目标揽收区域在历史时段内的人均收入信息、GDP信息、百度指数、人口数量信息等。其中，百度指数是以百度海量网民行为数据为基础的数据分享平台，通过关键词搜索趋势、洞察网民兴趣和需求、监测舆情动向、定位受众特征等，例如通过分析与揽收区域相关的关键词，来获取与揽收区域相应的数据特征。

可以利用k均值聚类算法(k-means clustering algorithm)进行聚类。例如，需要把所有的揽收区域聚类为4类时，聚类处理步骤如下：

(1)首先随机选择4个揽收区域作为聚类中心，计算其余揽收区域与聚类中心的欧式距离。欧式距离公式为如以下公式三：

其中，d_1,2表示其余揽收区域与聚类中心的欧式距离，(x₁，y₁)表示聚类中心的特征参数；(x₂，y₂)表示其余揽收区域的特征参数。

(2)根据欧式距离划分将训练样本中的数据划分到各自的聚类中心中。例如，区域1与聚类中心A距离最近，就将区域1划分到聚类中心A中。

(3)重新计算每个聚类中的聚类中心，重复步骤2)，直到聚类中心不发生大的改变。

(4)将每个揽收区域都划分到对应的聚类中心，以得到对应的聚类标签，进而完整对所述揽收区域数据的聚类处理，以得到揽收区域特征。

步骤104，将所述训练样本的第一特征数据和第二特征数据输入第二参考模型中进行学习训练，以生成预测模型。

其中，进行模型训练的目的在于通过已标注的训练样本的学习，以建立一个预测结果与标注的真实结果最靠近的模型。

在一些实施例中，在所述将所述训练样本的第一特征数据和第二特征数据输入第二参考模型中进行学习训练，以生成预测模型之前，还包括：

根据预测窗口的长度，将所述训练样本的第一特征数据和第二特征数据划分为训练集和验证集，所述训练集相比于所述验证集滞后一个预测窗口的长度；

所述将所述训练样本的第一特征数据和第二特征数据输入第二参考模型中进行学习训练，以生成预测模型，包括：

分别将所述训练集和验证集先后输入所述第二参考模型中进行学习训练，以生成预测模型。

例如，在完成了所有特征信息(第一特征数据和第二特征数据)的制作后，然后需要将训练样本的特征信息(第一特征数据和第二特征数据)分割为训练集和验证集。训练集用于训练模型，验证集用于选择效果最好的模型。本申请实施例将所有的特征信息数据同时应用于训练与验证。但是，验证集会比训练集滞后一个预测窗口。例如，如图3所示，假设预测窗口的长度为2个月，采集到的训练样本为2018年1月1日至2019年9月1日的训练样本数据，则将2018年1月1日至2019年6月30日的训练样本数据对应的特征信息作为训练集，将2018年3月1日至2019年9月1日的训练样本数据对应的特征信息为验证集，该验证集会比训练集整体滞后两个月。通过将所述训练样本的第一特征数据和第二特征数据划分为训练集和验证集，可以保持件量的时序相关性。在选定第二参考模型后，初始化第二参考模型的初始状态变量及初始网络权重，然后将训练集输入第二参考模型中进行训练，然后再将验证集输入所述利用训练集处理后的第二参考模型中进行验证，在验证过程中根据训练结果和验证结果的误差来不同更新网络权重，以对第二参考模型进行优化，使得最后得到的预测结果逐渐趋近真实值，最终生成预测模型。

例如，可以选择Seq2Seq模型作为第二参考模型，Seq2Seq模型包括编码器(Encoder)和解码器(Decoder)两个部分，Seq2Seq模型的输入是一个序列，Seq2Seq模型的输出也是一个序列，编码器将一个可变长度的信号序列变为固定长度的向量表达，解码器将这个固定长度的向量变成可变长度的目标的信号序列。

如图4及图5所示，所述第二参考模型包括编码器和解码器，编码器和解码器结构相同，都由若干个门循环单元(RNN节点)构成，图5中的GRU节点为RNN的一种结构。步骤104可以通过步骤1041至步骤1045来实现，具体为：

步骤1041，将所述第二特征数据输入所述编码器进行处理，以输出状态向量。

在一些实施例中，所述编码器包括多个用于编码的门循环单元，所述将所述第二特征数据输入所述编码器进行处理，以输出编码状态向量，包括：

将所述历史时段中第1个采样时间点对应的第二特征数据输入第1个用于编码的门循环单元，计算所述第1个采样时间点对应的编码状态向量；

将所述历史时段中第n个采样时间点对应的第二特征数据与第n-1个采样时间点对应的编码状态向量输入第n个用于编码的门循环单元，计算所述第n个采样时间点对应的编码状态向量，其中，n为大于1的自然数。

例如，将每一天作为一个采样时间点对历史时段中的训练样本进行采样。

例如，现有历史时段2015年1月1日至2019年8月1日的训练样本数据，该训练样本数据可以包括历史件量数据和揽收区域数据，需要预测2019年10月的件量数据。此时，编码器部分的每个用于编码的门循环单元(GRU节点)的输入x为2019年01月01日至2019年8月1日每天的特征信息(x₁，x₂，……，x_n-1，x_n)和状态向量C，其中，n表示历史时段内的天数。输入编码器中的特征信息为训练样本中每天的第二特征数据，所述第二特征数据可以包括件量规模特征、时序特征、时滞信息特征和揽收区域特征，编码器中输入第二个GRU节点的编码状态向量为第一个GRU节点的输出编码状态向量，后面的节点的编码状态向量以次类推，每个GRU节点的输出为一个新的编码状态向量。整个编码器的输出为状态向量Encoderstate。编码器中每个GRU节点的输出编码状态向量计算公式如以下公式四：

C^(t)＝tanh(b+WC^(t-1)+Ux^(t))；

其中，C^(t)表示编码器中第t个GRU节点的输出编码状态向量，C^(t-1)表示编码器中第t-1个GRU节点的输出编码状态向量，C^(t-1)作为输入编码器中第t个GRU节点的编码状态向量，b、W、U均为第二参考模型的网络权重，tanh函数为双曲正切函数。

步骤1042，将所述第一特征数据、所述第二特征数据和所述状态向量输入所述解码器中进行处理，以输出预测值。

在一些实施例中，所述解码器包括多个用于解码的门循环单元，所述将所述第一特征数据、所述第二特征数据和所述编码状态向量输入所述解码器中进行处理，以输出预测值，包括：

将所述历史时段中第1个采样时间点对应的第一特征数据、第二特征数据以及所述编码器输出的最后一个采样时间点对应的编码状态向量输入第1个用于解码的门循环单元，计算第1个采样时间点对应的解码状态向量和预测值；

将所述历史时段中第n个采样时间点对应的第一特征数据、第二特征数据以及第n-1个采样时间点对应的解码状态向量输入第n个用于解码的门循环单元，计算第n个采样时间点对应的解码状态向量和预测值，其中，n为大于1的自然数。

例如，解码器部分的每个用于解码的门循环单元(GRU节点)的输入x为2019-10月之前(比如为2019年01月01日至2019年8月1日)每天的特征信息和状态向量C，输入解码器中的特征信息为训练样本中每天的第二特征数据和第一特征数据，所述第二特征数据包括件量规模特征、时序特征、时滞信息特征和揽收区域特征，所述第一特征数据包括Prophet模型输出的第一预测数据。解码器中输入第一个GRU节点的状态向量整个编码器最终输出的状态向量Encoder state，即为最后一个GRU节点输出的状态向量Encoder state，第二个GRU节点的输入的状态向量为第一个节点的输出解码状态向量，后面的节点的解码状态向量以此类推。其中，每个GRU节点均输出一天的预测值y。

解码器中每个GRU节点的输出解码状态向量的计算公式沿用公式四，公式四为：

C^(t)＝tanh(b+WC^(t-1)+Ux^(t))；

其中，C^(t)表示解码器中第t个GRU节点的输出状态向量，C^(t-1)表示解码器中第t-1个GRU节点的输出解码状态向量，C^(t-1)作为输入解码器中第t个GRU节点的解码状态向量，b、W、U均为第二参考模型的网络权重，tanh函数为双曲正切函数。

解码器中每个GRU节点输出的预测值的计算公式如以下公式五：

y^(t)＝softmax(c+VC^(t))；

其中，y^(t)表示解码器中第t个GRU节点的预测值，C^(t)表示解码器中第t个GRU节点的输出解码状态向量，c、V均为第二参考模型的网络权重，softmax函数为归一化指数函数。

其中，b、W、U、c、V均为第二参考模型的网络权重，在选定第二参考模型后，可以给每一网络权重任意赋予一个初始值，在后续训练过程中逐步调整网络权重，使得最后得到的预测结果逐渐趋近真实值。其中，上述每个GRU节点的b、W、U、V等网络权重是共享的，即整个第二参考模型只有一份b、W、U、V，这些网络权重在各个节点之间共享。

步骤1043，根据所述预测值与真实值之间的误差，计算所述第二参考模型的损失函数。

损失函数用来表示预测值与真实值之间的误差，通过不断减小损失函数的值，使得预测不断优化。损失函数可以选择平方损失函数，损失函数的计算公式如以下公式六：

J＝(y_tru-y_pre)²；

其中，y_pre表示第二参考模型输出的预测值，y_tru表示与预测值对应的真实值。

步骤1044，对所述损失函数进行训练，以得到训练后的所述第二参考模型的优化参数。

其中，优化算法可以选择梯度下降法，通过梯度下降法对损失函数J进行优化训练，其优点在于简单高效，梯度下降法的计算公式如以下公式七：

其中，η表示学习率，即η为学习步长，η是一个常数，比如η可以设置为0.001；x⁽ⁱ⁾表示第i天的特征信息x，即为输入每个GRU节点的值；y⁽ⁱ⁾表示第i天的真实值；

表示J对w求偏导所得出的值，J为损失函数。

步骤1045，根据所述优化参数生成预测模型。

其中，所述预测模型可以由训练后的参考模型与其对应的优化参数组成，训练样本的第二特征数据和第一特征数据经过训练后的所述参考模型处理后得到的输出数据，可以作为该预测模型的预测结果。

例如，一段待测数据经过特征信息的提取，模型的预测，模型的输出后处理之后得到一个预测值。第二参考模型采用不同优化参数时，会导致最后得到的预测值存在不同的情况。该优化参数用于表示第二参考模型中的网络权重。

如图6示出的模型训练流程示意图，具体训练流程如下：

首先，采集训练样本，训练样本可以包括历史件量数据和揽收区域数据。

其次，提取特征信息，具体为：

将历时件量数据输入第一参考模型中处理后得到误差较大的第一预测数据，将该第一预测数据作为训练样本的第一特征数据；

从历史件量数据中提取出件量规模特征、时序特征和时滞信息特征，并从揽收区域数据中提取出揽收区域特征，将所述件量规模特征、时序特征、时滞信息特征和揽收区域特征作为所述训练样本的第二特征数据。

然后，设定第二参考模型的初始状态变量及初始网络权重。

然后，将特征信息中的第二特征数据输入第二参考模型的编码器进行处理，以得出状态向量，且所述第一特征数据、所述第二特征数据和所述状态向量输入所述解码器中进行处理，以输出预测结果。

然后，比较预测结果与真实结果之间的误差是否小于阈值或者训练次数是否满足预设次数。若预测结果与真实结果之间的误差小于阈值或者训练次数满足预设次数，则训练结束。若预测结果与真实结果之间的误差不小于阈值或者训练次数不满足预设次数，则采用梯度下降法进行处理，更新网络权重后再次将特征信息输入第二参考模型中的编码器和解码器中进行处理，以对第二参考模型进行优化，使得最后得到的预测结果逐渐趋近真实值，最终生成预测模型。

步骤105，根据所述预测模型进行件量预测。

例如，可以利用2015年1月1日至2019年9月1日的训练样本来预测2019年10月份揽收的件量数据。

将从2015年1月1日至2019年9月1日的训练样本中提取的特征信息输入所述预测模型中，输出的预测结果为2019年10月份揽收的件量预测值。该特征信息包括通过第一参考模型处理后得到的第一特征数据，以及从训练样本中提取的第二特征数据。

上述所有的技术方案，可以采用任意结合形成本申请的可选实施例，在此不再一一赘述。

本申请实施例提供的件量预测方法，通过采集训练样本，所述训练样本包括历史时段内的历史件量数据；将所述历史件量数据输入第一参考模型中进行处理，以得到第一预测数据，将所述第一预测数据作为所述训练样本的第一特征数据；获取所述训练样本的第二特征数据，所述第二特征数据包括件量规模特征、时序特征和时滞信息特征；将所述训练样本的第一特征数据和第二特征数据输入第二参考模型中进行学习训练，以生成预测模型；根据所述预测模型进行件量预测。本申请实施例在时序数据的周期性、趋势性不明显的情况下，通过多特征的融合进行件量预测，以提高件量预测的预测精度。

本申请实施例还提供一种件量预测装置，如图7所示，图7为本申请实施例提供的一种件量预测装置的结构示意图。所述件量预测装置40可以包括采集模块41，第一获取模块42，第二获取模块43，训练模块44和预测模块45。

其中，所述采集模块41，用于采集训练样本，所述训练样本包括历史时段内的历史件量数据；

所述第一获取模块42，用于将所述历史件量数据输入第一参考模型中进行处理，以得到第一预测数据，将所述第一预测数据作为所述训练样本的第一特征数据；

所述第二获取模块43，用于获取所述训练样本的第二特征数据，所述第二特征数据包括件量规模特征、时序特征和时滞信息特征；

所述训练模块44，用于将所述训练样本的第一特征数据和第二特征数据输入第二参考模型中进行学习训练，以生成预测模型；

所述预测模块45，用于根据所述预测模型进行件量预测。

在一些实施例中，所述第二获取模块42包括：

第一获取单元421，用于根据所述历史件量数据组成的序列数据、以及所述序列数据的均值和标准差，获取所述件量规模特征；

第二获取单元422，用于根据所述历史件量数据中的时间序列自相关性，获取所述时序特征；

第三获取单元423，用于根据所述历史时段内的至少一个预设固定时间节点开始至所述历史时段的结束时间对应的件量数据，从所述历史件量数据中提取所述时滞信息特征。

在一些实施例中，所述训练样本还包括揽收区域数据，所述第二获取模块42还包括：

第四获取单元424，用于对所述揽收区域数据进行聚类处理，以得到揽收区域特征，所述第二特征数据还包括所述揽收区域特征。

在一些实施例中，所述训练模块44包括：

编码单元441，用于将所述第二特征数据输入所述编码器进行处理，以输出状态向量；

解码单元442，用于将所述第一特征数据、所述第二特征数据和所述状态向量输入所述解码器中进行处理，以输出预测值；

计算单元443，用于根据所述预测值与真实值之间的误差，计算所述第二参考模型的损失函数；

训练单元444，用于对所述损失函数进行训练，以得到训练后的所述第二参考模型的优化参数；

生成单元445，用于根据所述优化参数生成预测模型。

在一些实施例中，所述编码器包括多个用于编码的门循环单元，所述编码单元441，用于：

在一些实施例中，所述解码器包括多个用于解码的门循环单元，所述解码单元442，用于：

在一些实施例中，所述第一参考模型可以为时间序列模型，所述第一获取模块42，用于将所述历史件量数据输入时间序列模型中进行处理，得到第一预测数据，将所述第一预测数据作为所述训练样本的第一特征数据。

如图8所示，图8为本申请实施例提供的一种件量预测装置的另一结构示意图。图8与图7的区别在于：所述件量预测装置40还包括划分模块46。

其中，所述划分模块46，用于根据预测窗口的长度，将所述训练样本的第一特征数据和第二特征数据划分为训练集和验证集，所述训练集相比于所述验证集滞后一个预测窗口的长度；

所述训练模块44，还用于分别将所述训练集和验证集先后输入所述第二参考模型中进行学习训练，以生成预测模型。

本申请实施例提供的件量预测装置40，通过采集模块41采集训练样本，所述训练样本包括历史时段内的历史件量数据；第一获取模块42将所述历史件量数据输入第一参考模型中进行处理，以得到第一预测数据，将所述第一预测数据作为所述训练样本的第一特征数据；第二获取模块43获取所述训练样本的第二特征数据，所述第二特征数据包括件量规模特征、时序特征和时滞信息特征；训练模块44将所述训练样本的第一特征数据和第二特征数据输入第二参考模型中进行学习训练，以生成预测模型；预测模块45根据所述预测模型进行件量预测。本申请实施例在时序数据的周期性、趋势性不明显的情况下，通过多特征的融合进行件量预测，以提高件量预测的预测精度。

本申请实施例还提供一种服务器，如图9所示，其示出了本申请实施例所涉及的服务器的结构示意图，具体来讲：

该服务器可以包括一个或者一个以上处理核心的处理器501、一个或一个以上计算机可读存储介质的存储器502、电源503和输入单元504等部件。本领域技术人员可以理解，图9中示出的服务器结构并不构成对服务器的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

其中：

处理器501是该服务器的控制中心，利用各种接口和线路连接整个服务器的各个部分，通过运行或执行存储在存储器502内的软件程序和/或模块，以及调用存储在存储器502内的数据，执行服务器的各种功能和处理数据，从而对服务器进行整体监控。可选的，处理器501可包括一个或多个处理核心；优选的，处理器501可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器501中。

存储器502可用于存储软件程序以及模块，处理器501通过运行存储在存储器502的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器502可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据服务器的使用所创建的数据等。此外，存储器502可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器502还可以包括存储器控制器，以提供处理器501对存储器502的访问。

服务器还包括给各个部件供电的电源503，优选的，电源503可以通过电源管理系统与处理器501逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源503还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

该服务器还可包括输入单元504，该输入单元504可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出，服务器还可以包括显示单元等，在此不再赘述。具体在本实施例中，服务器中的处理器501会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器502中，并由处理器501来运行存储在存储器502中的应用程序，从而实现各种功能，如下：

采集训练样本，所述训练样本包括历史时段内的历史件量数据；将所述历史件量数据输入第一参考模型中进行处理，以得到第一预测数据，将所述第一预测数据作为所述训练样本的第一特征数据；获取所述训练样本的第二特征数据，所述第二特征数据包括件量规模特征、时序特征和时滞信息特征；将所述训练样本的第一特征数据和第二特征数据输入第二参考模型中进行学习训练，以生成预测模型；根据所述预测模型进行件量预测。

以上操作具体可参见前面的实施例，在此不作赘述。

由上可知，本实施例提供的服务器，通过采集训练样本，所述训练样本包括历史时段内的历史件量数据；将所述历史件量数据输入第一参考模型中进行处理，以得到第一预测数据，将所述第一预测数据作为所述训练样本的第一特征数据；获取所述训练样本的第二特征数据，所述第二特征数据包括件量规模特征、时序特征和时滞信息特征；将所述训练样本的第一特征数据和第二特征数据输入第二参考模型中进行学习训练，以生成预测模型；根据所述预测模型进行件量预测。本申请实施例在时序数据的周期性、趋势性不明显的情况下，通过多特征的融合进行件量预测，以提高件量预测的预测精度。

相应的，本申请实施例还提供一种电子设备，如图10所示，该电子设备可以包括射频(RF，Radio Frequency)电路601、包括有一个或一个以上计算机可读存储介质的存储器602、输入单元603、显示单元604、传感器605、音频电路606、无线保真(WiFi，WirelessFidelity)模块607、包括有一个或者一个以上处理核心的处理器608、以及电源609等部件。本领域技术人员可以理解，图10中示出的电子设备结构并不构成对电子设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

RF电路601可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，交由一个或者一个以上处理器608处理；另外，将涉及上行的数据发送给基站。通常，RF电路601包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM，Subscriber Identity Module)卡、收发信机、耦合器、低噪声放大器(LNA，Low Noise Amplifier)、双工器等。此外，RF电路601还可以通过无线通信与网络和其他设备通信。所述无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯系统(GSM，Global System of Mobile communication)、通用分组无线服务(GPRS，GeneralPacket Radio Service)、码分多址(CDMA，Code Division Multiple Access)、宽带码分多址(WCDMA，Wideband Code Division Multiple Access)、长期演进(LTE，Long TermEvolution)、电子邮件、短消息服务(SMS，Short Messaging Service)等。

存储器602可用于存储软件程序以及模块，处理器608通过运行存储在存储器602的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器602可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据电子设备的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器602可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器602还可以包括存储器控制器，以提供处理器608和输入单元603对存储器602的访问。

输入单元603可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地，在一个具体的实施例中，输入单元603可包括触敏表面以及其他输入设备。触敏表面，也称为触摸显示屏或者触控板，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面上或在触敏表面附近的操作)，并根据预先设定的程式驱动相应的连接装置。可选的，触敏表面可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器608，并能接收处理器608发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面。除了触敏表面，输入单元603还可以包括其他输入设备。具体地，其他输入设备可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元604可用于显示由用户输入的信息或提供给用户的信息以及电子设备的各种图形用户接口，这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元604可包括显示面板，可选的，可以采用液晶显示器(LCD，Liquid CrystalDisplay)、有机发光二极管(OLED，Organic Light-Emitting Diode)等形式来配置显示面板。进一步的，触敏表面可覆盖显示面板，当触敏表面检测到在其上或附近的触摸操作后，传送给处理器608以确定触摸事件的类型，随后处理器608根据触摸事件的类型在显示面板上提供相应的视觉输出。虽然在图10中，触敏表面与显示面板是作为两个独立的部件来实现输入和输入功能，但是在某些实施例中，可以将触敏表面与显示面板集成而实现输入和输出功能。

电子设备还可包括至少一种传感器605，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板的亮度，接近传感器可在电子设备移动到耳边时，关闭显示面板和/或背光。作为运动传感器的一种，重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于电子设备还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

音频电路606、扬声器，传声器可提供用户与电子设备之间的音频接口。音频电路606可将接收到的音频数据转换后的电信号，传输到扬声器，由扬声器转换为声音信号输出；另一方面，传声器将收集的声音信号转换为电信号，由音频电路606接收后转换为音频数据，再将音频数据输出处理器608处理后，经RF电路601以发送给比如另一电子设备，或者将音频数据输出至存储器602以便进一步处理。音频电路606还可能包括耳塞插孔，以提供外设耳机与电子设备的通信。

WiFi属于短距离无线传输技术，电子设备通过WiFi模块607可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图10示出了WiFi模块607，但是可以理解的是，其并不属于电子设备的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

处理器608是电子设备的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在存储器602内的软件程序和/或模块，以及调用存储在存储器602内的数据，执行电子设备的各种功能和处理数据，从而对手机进行整体监控。可选的，处理器608可包括一个或多个处理核心；优选的，处理器608可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器608中。

电子设备还包括给各个部件供电的电源609(比如电池)，优选的，电源可以通过电源管理系统与处理器608逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源609还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

尽管未示出，电子设备还可以包括摄像头、蓝牙模块等，在此不再赘述。具体在本实施例中，电子设备中的处理器608会按照如下的指令，将一个或一个以上的计算机程序的进程对应的可执行文件加载到存储器602中，并由处理器608来运行存储在存储器602中的计算机程序，从而实现各种功能：

以上操作具体可参见前面的实施例，在此不作赘述。

由上可知，本实施例提供的电子设备，通过采集训练样本，所述训练样本包括历史时段内的历史件量数据；将所述历史件量数据输入第一参考模型中进行处理，以得到第一预测数据，将所述第一预测数据作为所述训练样本的第一特征数据；获取所述训练样本的第二特征数据，所述第二特征数据包括件量规模特征、时序特征和时滞信息特征；将所述训练样本的第一特征数据和第二特征数据输入第二参考模型中进行学习训练，以生成预测模型；根据所述预测模型进行件量预测。本申请实施例在时序数据的周期性、趋势性不明显的情况下，通过多特征的融合进行件量预测，以提高件量预测的预测精度。

本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过指令来完成，或通过指令控制相关的硬件来完成，该指令可以存储于一计算机可读存储介质中，并由处理器进行加载和执行。

为此，本申请实施例提供一种存储介质，其中存储有多条指令，该指令能够被处理器进行加载，以执行本申请实施例所提供的任一种件量预测方法中的步骤。例如，该指令可以执行如下步骤：

以上各个操作的具体实施可参见前面的实施例，在此不再赘述。

其中，该存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，Random Access Memory)、磁盘或光盘等。

由于该存储介质中所存储的指令，可以执行本申请实施例所提供的任意一种件量预测方法中的步骤，因此，可以实现本申请实施例所提供的任意一种件量预测方法所能实现的有益效果，详见前面的实施例，在此不再赘述。

以上对本申请实施例所提供的一种件量预测方法、装置、电子设备及存储介质进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种件量预测方法，其特征在于，所述方法包括：

根据所述预测模型进行件量预测。

2.如权利要求1所述的件量预测方法，其特征在于，所述获取所述训练样本的第二特征数据，包括：

根据所述历史件量数据组成的序列数据、以及所述序列数据的均值和标准差，获取所述件量规模特征；

根据所述历史件量数据中的时间序列自相关性，获取所述时序特征；

根据从所述历史时段内的至少一个预设固定时间节点开始至所述历史时段的结束时间对应的件量数据，从所述历史件量数据中提取所述时滞信息特征。

3.如权利要求1所述的件量预测方法，其特征在于，所述训练样本还包括历史时段内的揽收区域数据，所述获取所述训练样本的第二特征数据，还包括：

4.如权利要求1或3所述的件量预测方法，其特征在于，所述第二参考模型包括编码器和解码器，所述将所述训练样本的第一特征数据和第二特征数据输入第二参考模型中进行学习训练，以生成预测模型，包括：

将所述第二特征数据输入所述编码器进行处理，以输出编码状态向量；

将所述第一特征数据、所述第二特征数据和所述编码状态向量输入所述解码器中进行处理，以输出预测值；

根据所述预测值与真实值之间的误差，计算所述第二参考模型的损失函数；

对所述损失函数进行训练，以得到训练后的所述第二参考模型的优化参数；

根据所述优化参数生成预测模型。

5.如权利要求4所述的件量预测方法，其特征在于，所述编码器包括多个用于编码的门循环单元，所述将所述第二特征数据输入所述编码器进行处理，以输出编码状态向量，包括：

6.如权利要求5所述的件量预测方法，其特征在于，所述解码器包括多个用于解码的门循环单元，所述将所述第一特征数据、所述第二特征数据和所述编码状态向量输入所述解码器中进行处理，以输出预测值，包括：

7.如权利要求1所述的件量预测方法，其特征在于，在所述将所述训练样本的第一特征数据和第二特征数据输入第二参考模型中进行学习训练，以生成预测模型之前，还包括：

8.一种件量预测装置，其特征在于，所述装置包括：

预测模块，用于根据所述预测模型进行件量预测。

9.一种电子设备，其特征在于，所述电子设备包括处理器和存储器，所述存储器中存储有计算机程序，所述处理器通过调用所述存储器中存储的所述计算机程序，用于执行如权利要求1至7任一项所述的件量预测方法。

10.一种存储介质，其特征在于，所述存储介质存储有多条指令，所述指令适于处理器进行加载，以执行权利要求1至7任一项所述的件量预测方法中的步骤。