CN113743969A

CN113743969A - 用于销量数据预测的方法、装置、设备及存储介质

Info

Publication number: CN113743969A
Application number: CN202010477825.8A
Authority: CN
Inventors: 秦慧玲; 詹仙园; 郑宇�
Original assignee: Beijing Jingdong Intelligent City Big Data Research Institute
Current assignee: Beijing Jingdong Intelligent City Big Data Research Institute
Priority date: 2020-05-29
Filing date: 2020-05-29
Publication date: 2021-12-03

Abstract

本公开提供了一种用于销量数据预测的方法、装置、设备及存储介质，涉及计算机技术领域。该方法包括：获取不同区域的区域信息数据及各区域的不同时间段的销售数据及意向销售数据；基于预配置的目标销量，分别对各区域的各时间段的销售数据及意向销售数据进行处理，获得各区域的各时间段的时间特征值数据集；分别对各区域的区域信息数据进行特征值聚合，获得各区域的空间特征值数据集；基于各区域的各时间段的时间特征值数据集及各区域的空间特征值数据集对第一模型进行训练，以获得时空表示数据集；其中，时空表示数据集用于训练销量数据预测模型。该方法可以结合时间特征和空间特征，可以提高销量数据预测模型的准确性。

Description

用于销量数据预测的方法、装置、设备及存储介质

技术领域

本公开涉及计算机技术领域，尤其涉及一种用于销量数据预测的方法、装置、设备及存储介质。

背景技术

销量预测对于在线和在线零售行业优化供应链，降低运营成本和提高收入至关重要。在购物节庆期间的销量预测，对于购物中心和以用户为中心的在线零售平台而言至关重要。促销推动的突然销售激增对零售商构成了巨大挑战，导致缺货甚至系统崩溃等问题，给消费者带来不良的购物体验。对于大型购物中心和在线零售平台，准确预测不同类别的产品，以更好地准备其库存并设计适当的产品促销策略至关重要。

相关技术中的销量数据预测模型包括：传统时序预测模型、数据驱动的机器学习模型、基于大数据的深度学习模型。

其中，传统时序预测模型只能捕捉到数据的线性模式，而忽略数据的非线性模型；数据驱动的机器学习模型对特征提取要求较高，很难学习到不同特征之间的相互关系；基于大数据的深度学习模型，对时序数据内部的时序关系进行建模和数据挖掘，忽略了数据的时空特性。

需要说明的是，在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本公开的目的在于提供一种用于销量数据预测的方法、装置、设备及存储介质，可以结合时间特征和空间特征，可以提高销量数据预测模型的准确性。

本公开的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本公开的实践而习得。

根据本公开的一个方面，提供一种用于销量数据预测的方法，包括：获取不同区域的区域信息数据及各区域的不同时间段的销售数据及意向销售数据；基于预配置的目标销量，分别对各区域的各时间段的销售数据及意向销售数据进行处理，获得各区域的各时间段的时间特征值数据集；分别对各区域的区域信息数据进行特征值聚合，获得各区域的空间特征值数据集；基于各区域的各时间段的时间特征值数据集及各区域的空间特征值数据集对第一模型进行训练，以获得时空表示数据集；其中，时空表示数据集用于训练销量数据预测模型。

在本公开一个实施例中，上述方法还包括：获取当前区域信息数据、当前区域的当前时间段的销售数据及意向销售数据；基于时空表示数据集、当前区域信息数据、当前区域的当前时间段的销售数据及意向销售数据对第二模型进行训练，以获得销量数据预测模型。

在本公开一个实施例中，基于预配置的目标销量，分别对各区域的各时间段的销售数据及意向销售数据进行处理，获得各区域的各时间段的时间特征值数据集，包括：基于长短期记忆网络LSTM，分别得到各区域的各时间段的销售数据的多个不同周期的第一时间特征值数据集，及各区域的各时间段的意向销售数据的多个不同周期的第一时间特征值数据集；分别对各区域的各时间段的销售数据的多个不同周期的第一时间特征值数据集进行聚合，生成各区域的各时间段的销售数据的第二时间特征值数据集，及分别对各区域的各时间段的意向销售数据的多个不同周期的第一时间特征值数据集进行聚合，生成各区域的各时间段的意向销售数据的第二时间特征值数据集；基于时间注意力机制，分别对目标销量和各区域的各时间段的销售数据的第二时间特征值数据集进行学习，以获得各区域的各时间段的销售数据的第三时间特征值数据集，及基于时间注意力机制，分别对目标销量和各区域的各时间段的意向销售数据的第二时间特征值数据集进行学习，以获得各区域的各时间段的意向销售数据的第三时间特征值数据集；基于特征注意力机制，分别对目标销量、各区域的各时间段的销售数据的第三时间特征值数据集与各区域的各时间段的意向销售数据的第三时间特征值数据集进行学习，以获得各区域的各时间段的时间特征值数据集。

在本公开一个实施例中，基于各区域的各时间段的时间特征值数据集及各区域的空间特征值数据集对第一模型进行训练，以获得时空表示数据集，包括：分别对各区域的各时间段的销售数据及意向销售数据进行线性变换，获得各区域的各时间段的销售数据的线性数据及意向销售数据的线性数据；基于各区域的各时间段的销售数据的线性数据及意向销售数据的线性数据，各区域的各时间段的时间特征值数据集及各区域的空间特征值数据集对第一模型进行训练，以获得时空表示数据集。

在本公开一个实施例中，基于各区域的各时间段的时间特征值数据集及各区域的空间特征值数据集对第一模型进行训练，以获得时空表示数据集，还包括：对时空表示数据集进行池化处理，以获得最终的时空表示数据集。

在本公开一个实施例中，基于各区域的各时间段的时间特征值数据集及各区域的空间特征值数据集对第一模型进行训练，以获得时空表示数据集，包括：分别基于各区域的各时间段的时间特征值数据集及各区域的空间特征值数据集，依次对第一模型进行训练并训练至模型收敛，以获得时空表示数据集。

在本公开一个实施例中，区域信息数据包括：地理空间信息数据及人群分布信息数据。

在本公开一个实施例中，分别对各区域的区域信息数据进行特征值聚合，获得各区域的空间特征值数据集，包括：基于三个两层全连接网络，分别学习各区域的地理空间信息数据、人群分布信息数据及预配置的间隔时间在各自的两层全连接网络中的嵌入；通过地理空间信息数据、人群分布信息数据及预配置的间隔时间在各自的两层全连接网络中的嵌入，分别获得各区域的空间特征值数据集。

在本公开一个实施例中，上述方法还包括：获取待预测区域的区域信息数据及待预测区域的待预测时间段的销售数据及意向销售数据；将待预测区域的区域信息数据及待预测区域的待预测时间段之前的预设时间的销售数据及意向销售数据输入到数据预测模型中进行预测，获得销量数据预测结果。

根据本公开的另一个方面，提供一种用于销量数据预测的装置，包括：数据获取模块，用于获取不同区域的区域信息数据及各区域的不同时间段的销售数据及意向销售数据；数据处理模块，用于基于预配置的目标销量，分别对各区域的各时间段的销售数据及意向销售数据进行处理，获得各区域的各时间段的时间特征值数据集；特征值聚合模块，用于分别对各区域的区域信息数据进行特征值聚合，获得各区域的空间特征值数据集；模型训练模块，用于基于各区域的各时间段的时间特征值数据集及各区域的空间特征值数据集对第一模型进行训练，以获得时空表示数据集；其中，时空表示数据集用于训练销量数据预测模型。

本公开实施例提供的用于销量数据预测的方法，通过对不同区域的区域信息数据及各区域的不同时间段的销售数据及意向销售数据进行处理，可以获得各区域的各时间段的时间特征值数据集及各区域的空间特征值数据集，基于各区域的各时间段的时间特征值数据集及各区域的空间特征值数据集对第一模型进行训练，可以获得时空表示数据集。该方法结合了时间特征和空间特征，获得的时空表示数据集可以用于训练销量数据预测模型，可以提高销量数据预测模型的准确性。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本公开一个示例性实施例提供的系统结构及交互的流程图。

图2是根据一示例性实施方式示出的一种用于销量数据预测的方法的流程图。

图3是根据一示例性实施方式示出的另一种用于销量数据预测的方法的流程图。

图4是根据一示例性实施方式示出的一种神经网络结构的示意图。

图5是根据一示例性实施方式示出的另一种用于销量数据预测的方法的流程图。

图6是根据一示例性实施方式示出的另一种用于销量数据预测的方法的流程图。

图7是根据一示例性实施方式示出的另一种用于销量数据预测的方法的流程图。

图8是根据一示例性示出的一种第二模型的结构示意图。

图9是根据一示例性示出的一种神经网络结构的示意图。

图10是根据一示例性实施方式示出的另一种用于销量数据预测的方法的流程图。

图11是根据一示例性实施方式示出的一种用于销量数据预测的装置。

图12根据一示例性实施方式示出的一种计算机系统的结构示意图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本公开将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。

此外，附图仅为本公开的示意性图解，并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

图1是本公开一个示例性实施例提供的系统架构的示意图。

如图1所示，系统架构100可以包括用户终端101、102，网络103和服务器104。网络103用以在用户终端101、102和服务器104之间提供通信链路的介质。网络103可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用用户终端101、102通过网络103与服务器104交互，以接收或发送消息等。其中，用户终端101、102可以是具有显示屏并且支持连接到网络103能力的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机、台式计算机、可穿戴设备、虚拟现实设备、增强现实设备，游戏手柄，智能家居等等。

服务器104可例如获取不同区域的区域信息数据及各区域的不同时间段的销售数据及意向销售数据；服务器104可例如基于预配置的目标销量，分别对各区域的各时间段的销售数据及意向销售数据进行处理，获得各区域的各时间段的时间特征值数据集；服务器104可例如分别对各区域的区域信息数据进行特征值聚合，获得各区域的空间特征值数据集；服务器104可例如基于各区域的各时间段的时间特征值数据集及各区域的空间特征值数据集对第一模型进行训练，以获得时空表示数据集。

应该理解，图1中的用户终端、网络和服务器的数目仅仅是示意性的，服务器104可以是一个实体的服务器，还可以为多个服务器组成的服务器集群，还可以是云端服务器，根据实际需要，可以具有任意数目的用户终端、网络和服务器。

相关技术中的销售数据预测模型存在以下缺点：

(1)传统时序预测模型：

传统的时序预测模型认为时间序列是线性的，只能捕捉到数据的线性模式，而忽略数据的非线性模型。但是真实情况下的销量曲线是复杂的，其中包含了线性模式以及非线性模式。

传统的时序预测模型不适用于非稳定的时间序列，而真实情况下大多数销量预测问题都是基于非稳定的时间序列。

传统的时序预测模型不能在同一时间处理多个时间序列以及其他特征。销量预测并不是一个单一序列预测问题，销量是基于各种因素而存在的。不能同一时间处理多个时间序列及特征将会在预测途中损失大量有用的信息，从而导致预测精度较低。

传统的时序预测模型不能表现真实商业环境下的需求。

(2)数据驱动的机器学习模型

对特征提取要求较高，不能对序列的内部关联关系进行自主学习，需要对时序特征进行特征提取操作后再进行预测。同时很难学习到不同特征之间的相互关系，此类模型没有考虑数据特征之间的依赖关系，仅将特征独立考虑来进行预测。

数据驱动的机器学习模型需要人类专家的参与进行学习。在人类专家提供可靠的行业知识后进行建模才能较好的提高模型预测的准确率。

(3)基于大数据的深度学习模型

基于深度学习进行销量预测的模型专注于在大量历史数据积累下，对时序数据内部的时序关系进行建模和数据挖掘，忽略了数据的宏观时空特性，例如要预测销量的区域，以及所处的时间段等。这些宏观的时空特性提供了额外的信息，仅通过时序模型是很难同时进行考虑的。

下面，将结合附图及实施例对本公开示例实施例中的用于销量数据预测的方法方法的各个步骤进行更详细的说明。

图2是根据一示例性实施方式示出的一种用于销量数据预测的方法的流程图。本公开实施例提供的方法可以由如图1所示的服务器104执行。

如图2所示，用于销量数据预测的方法10包括：

在步骤S102中，获取不同区域的区域信息数据及各区域的不同时间段的销售数据及意向销售数据。

不同区域例如可以为A区域、B区域、C区域。

在一些实施例中，区域信息数据包括：地理空间信息数据及人群分布信息数据。

地理空间信息数据例如可以为居民楼、写字楼的地理位置，道路的分布，快递投放点的地理位置。

人群分布信息数据例如可以为各年龄段的人口数量、性别比例。

区域信息数据例如可以为A区域的居民楼的地理位置及人口数量。

不同时间段的销售数据例如可以为近一个月、近半年或近一年的历史销售数据。

意向销售数据例如可以为用户的购物车的数据。

通过对不同区域的区域信息数据及各区域的不同时间段的销售数据及意向销售数据进行处理，可以获得不同区域不同时间段的数据特征，可以综合考虑空间信息和时间信息对销售数据的影响。

在步骤S104中，基于预配置的目标销量，分别对各区域的各时间段的销售数据及意向销售数据进行处理，获得各区域的各时间段的时间特征值数据集。

预配置的目标销量例如可以根据实际情况预先设置。

例如可以基于LSTM(Long Short-Term Memory，长短期记忆网络)，分别得到各区域的各时间段的销售数据及意向销售数据的多个不同周期的第一时间特征值数据集。

例如可以分别对各区域的各时间段的销售数据及意向销售数据的多个不同周期的第一时间特征值数据集进行聚合，生成各区域的各时间段的销售数据及意向销售数据的第二时间特征值数据集。

例如可以基于时间注意力机制，分别对目标销量和各区域的各时间段的销售数据及意向销售数据的第二时间特征值数据集进行学习，获得各区域的各时间段的销售数据及意向销售数据的第三时间特征值数据集。

例如可以基于特征注意力机制，分别对目标销量、各区域的各时间段的销售数据及意向销售数据的第三时间特征值数据集与各区域的各时间段的意向销售数据及意向销售数据的第三时间特征值数据集进行学习，获得各区域的各时间段的时间特征值数据集。

在步骤S106中，分别对各区域的区域信息数据进行特征值聚合，获得各区域的空间特征值数据集。

例如可以基于三个两层全连接网络，分别学习各区域的地理空间信息数据、人群分布信息数据及预配置的间隔时间在各自的两层全连接网络中的嵌入；通过地理空间信息数据、人群分布信息数据及预配置的间隔时间在各自的两层全连接网络中的嵌入，分别获得各区域的空间特征值数据集。

在步骤S108中，基于各区域的各时间段的时间特征值数据集及各区域的空间特征值数据集对第一模型进行训练，以获得时空表示数据集。

其中，时空表示数据集用于训练销量数据预测模型。

第一模型例如可以为神经网络模型。

第一模型例如可以为摊销网络模型。

例如可以分别对各区域的各时间段的销售数据及意向销售数据进行线性变换，获得各区域的各时间段的销售数据的线性数据及意向销售数据的线性数据；例如可以基于各区域的各时间段的销售数据的线性数据及意向销售数据的线性数据，各区域的各时间段的时间特征值数据集及各区域的空间特征值数据集对第一模型进行训练，获得时空表示数据集。

在一些实施例中，可以分别基于各区域的各时间段的所述时间特征值数据集及各区域的空间特征值数据集，依次对第一模型进行训练并训练至模型收敛，以获得时空表示数据集。

例如可以基于多视图学习的训练策略——时空训练策略，可以获得目标区域和时间段的更好的时空表示。

时空训练可以通过数据的时空视图中学习来训练模型。空间视图可以由对应于不同区域的多个类别组成，时间视图可以由对应于不同时间段的多个类别组成。每个数据集可以使用相同的功能集进行描述，可以来自不同的空间或时间类别，提供了有关数据集的不同补充信息。通过使用一个视图来补充另一个视图以改进类的表示形式，可以解决由于每个视图不相互独立产生的无法仅在每个视图上单独准确地预测数据的表示的问题。训练操作可以将空间或时间元表示提供给生成模型，从而使生成模型即使在某些区域或时间段的历史数据量有限的情况下，也可以学习不同区域或时间段之间的转换。

训练过程可以为：首先为一个视图随机选择一批数据，然后训练第一模型以适应给定验证数据的最佳预测。当第一模型在设置下收敛，更改训练视图，以使第一模型适应数据的另一个视图。重复此交替训练过程，第一模型将收敛到两个视图的更兼容条件，从而可以更好地反映数据中的时空表示形式。

与图2所示的用于销量数据预测的方法10不同的是，图3所示的用于销量数据预测的方法进一步提供了如何基于预配置的目标销量，分别对各区域的各时间段的销售数据及意向销售数据进行处理，获得各区域的各时间段的时间特征值数据集，也即提供了上述步骤S104的一种实施例。

参考图3，步骤S104包括：

在步骤S1042中，基于长短期记忆网络LSTM，分别得到各区域的各时间段的销售数据的多个不同周期的第一时间特征值数据集，及各区域的各时间段的意向销售数据的多个不同周期的第一时间特征值数据集。

不同周期例如可以为一个周、一个月、一个季度等。

LSTM是一种时间循环神经网络，是为了解决一般的RNN(Recurrent NeuralNetwork，循环神经网络)存在的长期依赖问题而专门设计出来的，RNN具有一种重复神经网络模块的链式形式。在标准RNN中，这个重复的结构模块只有一个非常简单的结构，例如一个tanh(激活函数)层。

LSTM是一种含有LSTM区块(blocks)的一种类神经网络，LSTM区块可以被描述成智能网络单元，可以记忆不定时间长度的数值，区块中有一个门可以决定输入是否重要到能被记住及能不能被输出。

如图4所示，特征提取模块例如可以包括LSTM、时间注意力机制、线性变换，特征融合模块例如可以包括动态特征整合器、特征注意力机制、全连接层、静态特征整合器。

如图4所示，例如可以将各区域的各时间段的销售数据及意向销售数据输入到周期性跳变LSTM中，分别得到各区域的各时间段的销售数据的多个不同周期的第一时间特征值数据集，及各区域的各时间段的意向销售数据的多个不同周期的第一时间特征值数据集。

在销量预测任务中的数据大多采用时间序列的形式，可以包括购买订单和购物车记录。在购买方案中，多个购物模式可能隐藏在同一系列中。例如，有的用户会在周末购买生活用品，有的用户每月购买一次消耗品。传统的LSTM依赖于从前一个时间段学习到的隐藏状态的依赖关系，关注相邻时间段。

本公开提供的实施例中，通过引入了周期性跳变LSTM，可以从单个时间序列数据中了解日、周和月的周期性模式。例如可以给定时间序列

作为输入，周期性跳跃LSTM可以将

编码为隐藏状态

h_t＝f(x_t，h_t-p)，其中，f为非线性映射函数。将周期性跳跃LSTM公式如下，可以捕获远程依赖性以及时间序列数据的周期性。

f_t＝σ(W_fxx_t+W_fhh_t-p+b_f)

i_t＝σ(W_ixx_t+W_ihh_t-p+b_i)

c_t＝f_t⊙c_t-1+i_t⊙tanh(W_cxx_t+W_chh_t-p+b_c)

o_t＝σ(W_oxx_t+W_ohh_t-p+b_o)

h_t＝o_t⊙tanh(c_t)

其中σ是激活函数，⊙表示逐元素相乘。i，f，o和c分别是输入门，忘记门，输出门和单元状态向量。p是控制隐藏状态跳变的跳变大小的周期性时间长度，例如每周7个，每月30个。为了表示方便，可以将周期性跳跃LSTM网络表示为h_t＝LSTN(x_t，h_t-p)。

周期性跳跃的LSTM可以很好地学习时间序列数据的短期表示，同时能够捕获数据的周期性。当p＝1时，周期性跳跃LSTM减小为原始LSTM：h_t＝LSTM(x_t，h_t-1)。

在步骤S1044中，分别对各区域的各时间段的销售数据的多个不同周期的第一时间特征值数据集进行聚合，生成各区域的各时间段的销售数据的第二时间特征值数据集，及分别对各区域的各时间段的意向销售数据的多个不同周期的第一时间特征值数据集进行聚合，生成各区域的各时间段的意向销售数据的第二时间特征值数据集。

如图4所示，例如可以将各区域的各时间段的销售数据及意向销售数据的多个不同周期的第一时间特征值数据集输入到动态特征整合器中进行聚合，生成各区域的各时间段的销售数据及意向销售数据的第二时间特征值数据集。

使用动态特征聚合器可以进一步融合来自不同数据源的信息。对于动态特征聚合器，可以使用两层完全连接的网络对每个周期性跳跃LSTM单元的每日，每周和每月输出进行聚合，生成每个时间段的聚合时间嵌入。这合并了数据中的短期依赖性和长期周期性特征的信息。

在步骤S1046中，基于时间注意力机制，分别对目标销量和各区域的各时间段的销售数据的第二时间特征值数据集进行学习，以获得各区域的各时间段的销售数据的第三时间特征值数据集，及基于时间注意力机制，分别对目标销量和各区域的各时间段的意向销售数据的第二时间特征值数据集进行学习，以获得各区域的各时间段的意向销售数据的第三时间特征值数据集。

如图4所示，例如可以将目标销量和各区域的各时间段的销售数据及意向销售数据的第二时间特征值数据集输入到时间注意力机制模块进行学习，获得各区域的各时间段的销售数据及意向销售数据的第三时间特征值数据集。

在实际生活中，由于外部环境和个人利益的变化，用户的购买数据有可能会随时间变化。例如，由于家庭收入的增加，比起具有基本特征，价格较低的产品，用户更可能选择质量更高、价格更贵的产品。购买的频率也可能会增加。为了更准确地了解不断发展的购买模式，本公开利用时间注意机制来进行购买预测。时间注意机制学习到的注意力分数可以反映预测购买和输入之间的关系，更强的关系可以导致更大的注意分数。

在步骤S1048中，基于特征注意力机制，分别对目标销量、各区域的各时间段的销售数据的第三时间特征值数据集与各区域的各时间段的意向销售数据的第三时间特征值数据集进行学习，以获得各区域的各时间段的时间特征值数据集。

如图4所示，例如可以将目标销量、各区域的各时间段的销售数据的第三时间特征值数据集与各区域的各时间段的意向销售数据的第三时间特征值数据集输入到特征注意力机制模块中进行学习，获得各区域的各时间段的时间特征值数据集。

在销量预测问题中，不同数据特征可能对预测结果产生不同的影响，并且这种影响可能随时间变化。本公开通过特征注意力机制，可以学习不同特征的相对权重，注意分数可以反映目标销量和输入特征之间的关系，更强的关系可以导致更大的注意分数。

与图2所示的用于销量数据预测的方法10不同的是，图5所示的用于销量数据预测的方法进一步提供了如何基于各区域的各时间段的时间特征值数据集及各区域的空间特征值数据集对第一模型进行训练，以获得时空表示数据集，也即提供了上述步骤S108的一种实施例。

参考图5，步骤S108包括：

在步骤S1082中，分别对各区域的各时间段的销售数据及意向销售数据进行线性变换，获得各区域的各时间段的销售数据的线性数据及意向销售数据的线性数据。

图3所示的方法中，通过神经网络模型对销售数据及意向销售数据进行处理，由于神经网络模型对数据中的非线性关系更加敏感，为了提高模型性能，本公开加入线性变换模块，如图4所示，分别对各区域的各时间段的销售数据及意向销售数据进行线性变换，获得各区域的各时间段的销售数据的线性数据及意向销售数据的线性数据。

线性变换可以对各区域各时间段的销售数据及购物车数据进行粗略而稳定的估算，神经网络模型可以估算对各区域各时间段的销售数据及购物车数据的非线性变化。

在STMP(Simple Mail Transfer Protocol，电子邮件协议)框架中，可以采用经典的线性自回归模型进行线性变换。

本领域技术人员也可以根据实际需求采用其他回归模型进行线性变换，本公开对此不做限制。

在步骤S1084中，基于各区域的各时间段的销售数据的线性数据及意向销售数据的线性数据，各区域的各时间段的时间特征值数据集及各区域的空间特征值数据集对第一模型进行训练，以获得时空表示数据集。

如图4所示，例如可以将各时间段的销售数据的线性数据及意向销售数据的线性数据，各区域的各时间段的时间特征值数据集及各区域的空间特征值数据集输入到第一模型中进行训练，获得时空表示数据集。

第一模型例如可以包括图4所示的全连接层、池化层，也可以包括其他图中未示出的神经网络结构。

在步骤S1086中，对时空表示数据集进行池化处理，以获得最终的时空表示数据集。

如图4所示，例如可以通过池化层对时空表示数据集进行池化处理，获得最终的时空表示数据集。

池化层例如可以对输入数据

进行池化处理，获得池化处理结果

其中，h表示隐藏状态编码，c表示单元状态向量。

例如使用置换不变实例池操作来平均训练数据集的数量，可以获得空间或时间类别(即特定区域或时间段)的可靠表示。来自同一个类别的实例池操作可以为数据集生成更具代表性的时空嵌入，有助于消除节日期间用于销量预测的有限参考样本的问题。

与图2所示的用于销量数据预测的方法10不同的是，图6所示的用于销量数据预测的方法进一步提供了如何分别对各区域的区域信息数据进行特征值聚合，获得各区域的空间特征值数据集，也即提供了上述步骤S106的一种实施例。

参考图6，步骤S106包括：

在步骤S1062中，基于三个两层全连接网络，分别学习各区域的地理空间信息数据、人群分布信息数据及预配置的间隔时间在各自的两层全连接网络中的嵌入。

如图4所示，例如可以基于静态特征整合器，使用三个两层全连接网络分别学习各区域的地理空间信息数据、人群分布信息数据及预配置的间隔时间在各自的两层全连接网络中的嵌入。

各区域的地理空间信息数据例如可以为各区域的POI(Point of Information，信息点)。

预配置的时间间隔例如可以为各节日之际的时间间隔。

例如，在某些购物节中，大型购物中心或在线平台会针对不同的人群推出有针对性的促销活动，由于人口结构的不同，可能会对区域产生不同的影响。区域的空间特征和人口统计资料可以为销量预测提供重要信息。

在步骤S1064中，通过地理空间信息数据、人群分布信息数据及预配置的间隔时间在各自的两层全连接网络中的嵌入，分别获得各区域的空间特征值数据集。

通过完全连接的层聚合生成的三个嵌入，可以输出静态特征的最终嵌入。这种处理可以平衡不同数据的静态特征的相对权重，这有助于数据生成更好的静态表示。

在图2所示的用于销量数据预测的方法10的基础上，图7所示的用于销量数据预测的方法20还包括：

在步骤S202中，获取当前区域信息数据、当前区域的当前时间段的销售数据及意向销售数据。

当前区域例如可以为D区域，当前区域信息数据例如可以为D区域的地理空间信息数据及人群分布信息数据。

当前时间段例如可以为近一周。

当前区域的当前时间段的销售数据及意向销售数据例如可以为D区域近一周的销售数据及购物车数据。

在步骤S204中，基于时空表示数据集、当前区域信息数据、当前区域的当前时间段的销售数据及意向销售数据对第二模型进行训练，以获得销量数据预测模型。

第二模型例如可以为生成模型。

生成模型例如可以是在给定某些隐含参数的条件下，能够随机生成观测数据的模型。生成模型例如可以给观测值和标注数据序列指定一个联合概率分布。在机器学习中，生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样)，也可以用来建立变量间的条件概率分布。条件概率分布可以由生成模型根据贝叶斯定理形成。

图8是根据一示例性示出的一种第二模型的结构示意图。

如图8所示，时空表示数据集可以通过第一模型得到，第二模型可以包括特征提取模块、特征融合模块及全连接层，其中，特征提取模块例如可以包括图4所示的LSTM、时间注意力机制、线性变换，特征融合模块例如可以包括图4所示的动态特征整合器、特征注意力机制、全连接层、静态特征整合器。

例如可以对当前区域信息数据、当前区域的当前时间段的销售数据及意向销售数据进行特征提取、特征融合，将特征融合后的数据及时空表示数据集输入到第二模型的全连接层中进行训练，可以获得销量数据预测模型。

图9是根据一示例性示出的一种神经网络结构的示意图。

如图9所示，结合方法10及方法20，该神经网络结构包括两个子框架：摊销网络及生成模型。首先，摊销网络中具有学习能力的元学习框架可以用于捕获数据的时空表示。其次，生成模型可以用于基于提取的时空表示和输入数据对预测结果进行概率推断。

学习系统可以包括一个用来学习经验的(adapt with experience)学习子系统。通过利用提取的元知识获得经验：在单个数据集的预先学习和/或来自不同的领域的问题。

例如可以通过跳跃LSTM，线性变换模块，时间注意力机制对不同时间段的销量数据，购物车数据进行时间数据特征的提取；例如可以利用特征注意力机制，动静态的时间整合器对动态以及静态的特征进行特征融合；例如可以采用池化操作对学习到的特征进行整合。

摊销网络可以包括数据特征提取模块及数据融合模块，可以采用变分自编码器的编码部分对时空特征进行学习。

可以基于时空训练策略进行模型训练以得到目标区域已经以及目标时间段的销量特征表示。生成模型可以接受来自摊销网络的时空表示，并结合当前的销量表示，对未来的销量进行预测。

用于销量数据预测的方法20与用于销量数据预测的方法10相同的步骤在此不再赘述。

在图2所示的用于销量数据预测的方法10的基础上，图10所示的用于销量数据预测的方法30还包括：

在步骤S302中，获取待预测区域的区域信息数据及待预测区域的待预测时间段之前的预设时间的销售数据及意向销售数据。

预设时间段例如可以购物节时间段。

预设时间的销售数据及意向销售数据例如可以是一周或一个月的销售数据及意向销售数据。

例如对A区域购物节的销售数据进行预测，可以获取A区域的区域信息数据及A区域的该购物节之前一周或一个月的销售数据及意向销售数据。

在步骤S304中，将待预测区域的区域信息数据及待预测区域的待预测时间段的销售数据及意向销售数据输入到数据预测模型中进行预测，获得销量数据预测结果。

例如可以将A区域的区域信息数据及A区域的上个节日的销售数据及意向销售数据输入到上述任一用于销量数据预测的方法得到的数据预测模型中进行预测，可以得到A区域下个节日的销量数据预测结果。

用于销量数据预测的方法30与用于销量数据预测的方法10相同的步骤在此不再赘述。

本公开实施例提供的用于销量数据预测的方法，可以针对特定地区、特定时间段内的销量进行准确的预测，可以更好地准备产品的库存并设计更好的产品促销策略。根据销量预测结果，在线销售平台可以采取相应的技术对策，以避免系统过载故障，提高客户满意度；了解不同类别产品购买的空间分布有助于设计有效的临时运输策略，确保在城市中不同地区的仓库之间更高效地分配产品，从而可以在特定时间段内更快地交付产品。

需要注意的是，上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明，而不是限制目的。易于理解，上述附图所示的处理并不表明或限制这些处理的时间顺序。另外，也易于理解，这些处理可以是例如在多个模块中同步或异步执行的。

下述为本公开装置实施例，可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节，请参照本公开方法实施例。

如图11所示，用于销量数据预测的装置40包括：数据获取模块402、数据处理模块404、特征值聚合模块406及模型训练模块408。

其中，数据获取模块402用于获取不同区域的区域信息数据及各区域的不同时间段的销售数据及意向销售数据；数据处理模块404用于基于预配置的目标销量，分别对各区域的各时间段的销售数据及意向销售数据进行处理，获得各区域的各时间段的时间特征值数据集；特征值聚合模块406用于分别对各区域的区域信息数据进行特征值聚合，获得各区域的空间特征值数据集；模型训练模块408用于基于各区域的各时间段的时间特征值数据集及各区域的空间特征值数据集对第一模型进行训练，以获得时空表示数据集；其中，时空表示数据集用于训练销量数据预测模型。

在一些实施例中，用于销量数据预测的装置40还包括：第二数据获取模块，用于获取当前区域信息数据、当前区域的当前时间段的销售数据及意向销售数据；第二模型训练模块，用于基于时空表示数据集、当前区域信息数据、当前区域的当前时间段的销售数据及意向销售数据对第二模型进行训练，以获得销量数据预测模型。

在一些实施例中，数据处理模块404包括：第一时间特征值数据集获得模块，用于基于长短期记忆网络LSTM，分别得到各区域的各时间段的销售数据的多个不同周期的第一时间特征值数据集，及各区域的各时间段的意向销售数据的多个不同周期的第一时间特征值数据集；第二时间特征值数据集获得模块，用于分别对各区域的各时间段的销售数据的多个不同周期的第一时间特征值数据集进行聚合，生成各区域的各时间段的销售数据的第二时间特征值数据集，及分别对各区域的各时间段的意向销售数据的多个不同周期的第一时间特征值数据集进行聚合，生成各区域的各时间段的意向销售数据的第二时间特征值数据集；第三时间特征值数据集获得模块，用于基于时间注意力机制，分别对目标销量和各区域的各时间段的销售数据的第二时间特征值数据集进行学习，以获得各区域的各时间段的销售数据的第三时间特征值数据集，及基于时间注意力机制，分别对目标销量和各区域的各时间段的意向销售数据的第二时间特征值数据集进行学习，以获得各区域的各时间段的意向销售数据的第三时间特征值数据集；时间特征值数据集获得模块，用于基于特征注意力机制，分别对目标销量、各区域的各时间段的销售数据的第三时间特征值数据集与各区域的各时间段的意向销售数据的第三时间特征值数据集进行学习，以获得各区域的各时间段的时间特征值数据集。

在一些实施例中，模型训练模块408包括：线性数据获得模块，用于分别对各区域的各时间段的销售数据及意向销售数据进行线性变换，获得各区域的各时间段的销售数据的线性数据及意向销售数据的线性数据；时空表示数据集获得模块，用于基于各区域的各时间段的销售数据的线性数据及意向销售数据的线性数据，各区域的各时间段的时间特征值数据集及各区域的空间特征值数据集对第一模型进行训练，以获得时空表示数据集。

在一些实施例中，模型训练模块408还包括：池化处理模块，用于对时空表示数据集进行池化处理，以获得最终的时空表示数据集。

在一些实施例中，模型训练模块408包括：第一模型训练模块，用于分别基于各区域的各时间段的时间特征值数据集及各区域的空间特征值数据集，依次对第一模型进行训练并训练至模型收敛，以获得时空表示数据集。

在一些实施例中，特征值聚合模块406包括：嵌入学习模块，用于基于三个两层全连接网络，分别学习各区域的地理空间信息数据、人群分布信息数据及预配置的间隔时间在各自的两层全连接网络中的嵌入；空间特征值数据集获得模块，用于通过地理空间信息数据、人群分布信息数据及预配置的间隔时间在各自的两层全连接网络中的嵌入，分别获得各区域的空间特征值数据集。

在一些实施例中，装置40还包括：带预测数据获取模块，用于获取待预测区域的区域信息数据及待预测区域的待预测时间段之前的预设时间的销售数据及意向销售数据；数据预测模块，用于将待预测区域的区域信息数据及待预测区域的待预测时间段的销售数据及意向销售数据输入到数据预测模型中进行预测，获得销量数据预测结果。

本公开实施例提供的用于销量数据预测的装置，通过对不同区域的区域信息数据及各区域的不同时间段的销售数据及意向销售数据进行处理，可以获得各区域的各时间段的时间特征值数据集及各区域的空间特征值数据集，基于各区域的各时间段的时间特征值数据集及各区域的空间特征值数据集对第一模型进行训练，可以获得时空表示数据集。该装置结合了时间特征和空间特征，获得的时空表示数据集可以用于训练销量数据预测模型，可以提高销量数据预测模型的准确性。

需要注意的是，上述附图中所示的框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

图12是根据一示例性实施方式示出的一种计算机设备的结构示意图。需要说明的是，图12示出的计算机设备仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图12所示，计算机设备800包括中央处理单元(CPU)801，其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中，还存储有系统800操作所需的各种程序和数据。CPU 801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。

以下部件连接至I/O接口805：包括键盘、鼠标等的输入部分806；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807；包括硬盘等的存储部分808；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器810上，以便于从其上读出的计算机程序根据需要被安装入存储部分808。

特别地，根据本发明的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本发明的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分809从网络上被下载和安装，和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(CPU)801执行时，执行本发明的系统中限定的上述功能。

需要说明的是，本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中，例如，可以描述为：一种处理器包括发送单元、获取单元、确定单元和第一处理单元。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定，例如，发送单元还可以被描述为“向所连接的服务端发送图片获取请求的单元”。

作为另一方面，本发明还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的设备中所包含的；也可以是单独存在，而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该设备执行时，使得该设备包括：

获取不同区域的区域信息数据及各区域的不同时间段的销售数据及意向销售数据；

基于预配置的目标销量，分别对各区域的各时间段的销售数据及意向销售数据进行处理，获得各区域的各时间段的时间特征值数据集；

分别对各区域的区域信息数据进行特征值聚合，获得各区域的空间特征值数据集；

基于各区域的各时间段的时间特征值数据集及各区域的空间特征值数据集对第一模型进行训练，以获得时空表示数据集；

其中，时空表示数据集用于训练销量数据预测模型。

以上具体地示出和描述了本发明的示例性实施方式。应可理解的是，本发明不限于这里描述的详细结构、设置方式或实现方法；相反，本发明意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效设置。

Claims

1.一种用于销量数据预测的方法，其特征在于，包括：

基于预配置的目标销量，分别对各区域的各时间段的所述销售数据及所述意向销售数据进行处理，获得各区域的各时间段的时间特征值数据集；

分别对各区域的所述区域信息数据进行特征值聚合，获得各区域的空间特征值数据集；

基于各区域的各时间段的所述时间特征值数据集及各区域的所述空间特征值数据集对第一模型进行训练，以获得时空表示数据集；

其中，所述时空表示数据集用于训练销量数据预测模型。

2.根据权利要求1所述的方法，其特征在于，还包括：

获取当前区域信息数据、当前区域的当前时间段的销售数据及意向销售数据；

基于所述时空表示数据集、当前区域信息数据、所述当前区域的当前时间段的销售数据及意向销售数据对第二模型进行训练，以获得销量数据预测模型。

3.根据权利要求1所述的方法，其特征在于，基于预配置的目标销量，分别对各区域的各时间段的所述销售数据及所述意向销售数据进行处理，获得各区域的各时间段的时间特征值数据集，包括：

基于长短期记忆网络LSTM，分别得到各区域的各时间段的所述销售数据的多个不同周期的第一时间特征值数据集，及各区域的各时间段的所述意向销售数据的多个不同周期的第一时间特征值数据集；

分别对各区域的各时间段的所述销售数据的多个不同周期的第一时间特征值数据集进行聚合，生成各区域的各时间段的所述销售数据的第二时间特征值数据集，及分别对各区域的各时间段的所述意向销售数据的多个不同周期的第一时间特征值数据集进行聚合，生成各区域的各时间段的所述意向销售数据的第二时间特征值数据集；

基于时间注意力机制，分别对所述目标销量和各区域的各时间段的所述销售数据的第二时间特征值数据集进行学习，以获得各区域的各时间段的所述销售数据的第三时间特征值数据集，及基于时间注意力机制，分别对所述目标销量和各区域的各时间段的所述意向销售数据的第二时间特征值数据集进行学习，以获得各区域的各时间段的所述意向销售数据的第三时间特征值数据集；

基于特征注意力机制，分别对所述目标销量、各区域的各时间段的所述销售数据的第三时间特征值数据集与各区域的各时间段的所述意向销售数据的第三时间特征值数据集进行学习，以获得各区域的各时间段的所述时间特征值数据集。

4.根据权利要求1所述的方法，其特征在于，基于各区域的各时间段的所述时间特征值数据集及各区域的所述空间特征值数据集对第一模型进行训练，以获得时空表示数据集，包括：

分别对各区域的各时间段的所述销售数据及所述意向销售数据进行线性变换，获得各区域的各时间段的所述销售数据的线性数据及所述意向销售数据的线性数据；

基于各区域的各时间段的所述销售数据的线性数据及所述意向销售数据的线性数据，各区域的各时间段的所述时间特征值数据集及各区域的所述空间特征值数据集对第一模型进行训练，以获得所述时空表示数据集。

5.根据权利要求4所述的方法，其特征在于，基于各区域的各时间段的所述时间特征值数据集及各区域的所述空间特征值数据集对第一模型进行训练，以获得时空表示数据集，还包括：

对所述时空表示数据集进行池化处理，以获得最终的时空表示数据集。

6.根据权利要求1所述的方法，其特征在于，基于各区域的各时间段的所述时间特征值数据集及各区域的所述空间特征值数据集对第一模型进行训练，以获得时空表示数据集，包括：

分别基于各区域的各时间段的所述时间特征值数据集及各区域的所述空间特征值数据集，依次对所述第一模型进行训练并训练至模型收敛，以获得所述时空表示数据集。

7.根据权利要求1所述的方法，其特征在于，所述区域信息数据包括：地理空间信息数据及人群分布信息数据。

8.根据权利要求7所述的方法，其特征在于，分别对各区域的所述区域信息数据进行特征值聚合，获得各区域的空间特征值数据集，包括：

基于三个两层全连接网络，分别学习各区域的所述地理空间信息数据、所述人群分布信息数据及预配置的间隔时间在各自的所述两层全连接网络中的嵌入；

通过所述地理空间信息数据、所述人群分布信息数据及预配置的间隔时间在各自的所述两层全连接网络中的嵌入，分别获得各区域的所述空间特征值数据集。

9.根据权利要求1-8任一项所述的方法，其特征在于，还包括：

获取待预测区域的区域信息数据及所述待预测区域的待预测时间段的销售数据及意向销售数据；

将所述待预测区域的区域信息数据及所述待预测区域的待预测时间段之前的预设时间的销售数据及意向销售数据输入到所述数据预测模型中进行预测，获得销量数据预测结果。

10.一种用于销量数据预测的装置，其特征在于，包括：

数据获取模块，用于获取不同区域的区域信息数据及各区域的不同时间段的销售数据及意向销售数据；

数据处理模块，用于基于预配置的目标销量，分别对各区域的各时间段的所述销售数据及所述意向销售数据进行处理，获得各区域的各时间段的时间特征值数据集；

特征值聚合模块，用于分别对各区域的所述区域信息数据进行特征值聚合，获得各区域的空间特征值数据集；

模型训练模块，用于基于各区域的各时间段的所述时间特征值数据集及各区域的所述空间特征值数据集对第一模型进行训练，以获得时空表示数据集；

其中，所述时空表示数据集用于训练销量数据预测模型。

11.一种计算机设备，包括：存储器、处理器及存储在所述存储器中并可在所述处理器中运行的可执行指令，其特征在于，所述处理器执行所述可执行指令时实现如权利要求1-9任一项所述的方法。

12.一种计算机可读存储介质，其上存储有计算机可执行指令，其特征在于，所述可执行指令被处理器执行时实现如权利要求1-9任一项所述的方法。