CN113780479A

CN113780479A - 周期预测模型的训练方法及装置、周期预测方法、设备

Info

Publication number: CN113780479A
Application number: CN202111272810.9A
Authority: CN
Inventors: 吴长发; 仲济源
Original assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Wodong Tianjun Information Technology Co Ltd
Current assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Wodong Tianjun Information Technology Co Ltd
Priority date: 2021-10-29
Filing date: 2021-10-29
Publication date: 2021-12-10

Abstract

本公开是关于一种周期预测模型的训练方法及装置、周期预测方法、设备，涉及机器学习技术领域，该方法包括：根据历史用户数据计算历史用户的历史订单行为序列以及历史订单中所包括的历史物品的实际复购周期；根据所述历史物品、实际复购周期、历史订单行为序列以及所述历史用户数据中的历史用户画像，构建数据集；将所述数据集中包括的历史物品、历史订单行为序列以及历史用户画像输入至待训练的周期预测模型中，得到所述历史物品的预测复购周期；根据所述数据集中的实际复购周期以及预测复购周期构建第一损失函数，并利用所述第一损失函数对所述待训练的周期预测模型进行训练，得到训练完成的周期预测模型。该方法提高了周期预测模型的精确度。

Description

周期预测模型的训练方法及装置、周期预测方法、设备

技术领域

本公开实施例涉及机器学习技术领域，具体而言，涉及一种周期预测模型的训练方法、周期预测模型的训练装置、周期预测方法、计算机可读存储介质以及电子设备。

背景技术

在现有的周期预测模型中，其可以采用具有三层全连接神经网络结构的DNN(DeepNeural Networks，深度神经网络)模型来实现。具体的，在训练过程中，可以将用户信息特征和对应的物品信息特征(例如物品标识、物品价格、物品数量)作为DNN模型的输入，经过神经网络的计算得到用户对物品的复购周期。

同时，在对DNN模型进行训练时，可以根据用户-商品复购周期模型的输出结果和复购周期真实值，构造损失函数，并对损失函数取最小值进行优化以更新网络权值参数，从而得到训练后的周期预测模型。

但是，在上述周期预测模型的训练方法中，并未考虑用户的历史订单行为序列，进而使得复购周期模型的输出结果的准确率较低，进而导致模型的精确度较低。

因此，需要提供一种新的周期预测模型的训练方法及装置。

需要说明的是，在上述背景技术部分发明的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本公开的目的在于提供一种周期预测模型的训练方法、周期预测模型的训练装置、周期预测方法、计算机可读存储介质以及电子设备，进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的周期预测模型的精确度较低的问题。

根据本公开的一个方面，提供一种周期预测模型的训练方法，包括：

根据历史用户数据计算历史用户的历史订单行为序列以及历史订单中所包括的历史物品的实际复购周期；

根据所述历史物品、实际复购周期、历史订单行为序列以及所述历史用户数据中的历史用户画像，构建数据集；

将所述数据集中包括的历史物品、历史订单行为序列以及历史用户画像输入至待训练的周期预测模型中，得到所述历史物品的预测复购周期；

根据所述数据集中的实际复购周期以及预测复购周期构建第一损失函数，并利用所述第一损失函数对所述待训练的周期预测模型进行训练，得到训练完成的周期预测模型。

在本公开的一种示例性实施例中，根据历史用户数据计算历史用户的历史订单行为序列，包括：

根据历史用户的用户标识，获取所述历史用户在第一预设时间段内的历史用户数据；

提取所述历史用户数据中包括的历史物品，并根据历史物品所属的类目标识，对所述历史物品进行聚合处理，得到所述历史物品所属的不同层级的类目；

对所述历史物品的数量进行求和运算，得到所述历史物品的购买数量，并根据所述历史物品的起始购买时间以及终止购买时间，计算所述历史物品的时间位置特征；

根据所述历史物品所属的不同层级的类目、购买数量以及时间位置特征，生成所述历史订单行为序列。

在本公开的一种示例性实施例中，根据历史用户数据计算历史订单中所包括的历史物品的实际复购周期，包括：

从所述历史用户数据中提取所述历史订单中包括的历史物品的第一购买时间节点以及与第一购买时间节点对应的上一购买时间节点；

根据所述第一购买时间节点以及与第一购买时间节点对应的上一购买时间节点，计算所述历史物品的当前购买周期；

对所述当前购买周期进行归一化处理，得到所述历史物品的实际复购周期。

在本公开的一种示例性实施例中，所述待训练的周期预测模型包括第一词嵌入层、第二词嵌入层、注意力机制层以及逻辑回归层；

其中，将所述数据集中包括的历史物品、历史订单行为序列以及历史用户画像输入至待训练的周期预测模型中，得到所述历史物品的预测复购周期，包括：

利用所述第一词嵌入层对所述历史物品以及历史订单行为序列进行编码，得到物品特征以及行为序列特征，并利用所述第二词嵌入层对所述历史用户画像进行编码，得到用户特征；

利用所述注意力机制层对所述行为序列特征以及所述物品特征进行处理，得到所述历史用户对所述历史物品的复购行为向量；

利用所述逻辑回归层对所述复购行为向量、物品特征以及用户特征进行逻辑回归处理，得到所述预测复购周期。

在本公开的一种示例性实施例中，对所述行为序列特征以及所述物品特征进行处理，得到所述历史用户对所述历史物品的复购行为向量，包括：

对所述行为序列特征以及所述物品特征进行第一操作，得到第一输出结果；其中，所述第一操作包括内积操作以及相减操作；

对所述第一输出结果、所述行为序列特征以及所述物品特征进行拼接得到第一拼接结果；

利用所述注意力机制层中包括的第一多层全连接神经网络对所述第一拼接结果进行处理，得到所述历史物品的注意力权重；

对所述注意力权重以及所述物品特征进行加权求和，得到所述复购行为向量。

在本公开的一种示例性实施例中，所述周期预测模型的训练方法还包括：

基于Word2vec对所述历史物品所属的不同层级的类目、购买数量以及时间位置特征进行编码，得到第一子向量、第二子向量以及第三子向量；

对所述第一子向量、第二子向量以及第三子向量进行特征拼接，得到所述历史用户的订单序列，并对所述订单序列中的任一子向量进行随着遮盖，得到待处理序列；

通过待训练的Bert模型对所述待处理序列进行预测，得到第一预测结果，并通过所述第一预测结果以及遮盖的子向量对所述Bert模型构建第二损失函数；

利用所述第二损失函数对所述待训练的Bert模型进行训练，并将训练完成的Bert模型融合至第二词嵌入层中，得到所述第一词嵌入层。

在本公开的一种示例性实施例中，所述Bert模型包括多个Transformer模型；

其中，通过待训练的Bert模型对所述待处理序列进行预测，得到第一预测结果，包括：

将所述待处理序列输入至第一个Transformer模型，生成第一文本语义向量，并将所述第一文本语义向量输入至其他Transformer模型，得到与其他Transformer模型对应的文本语义向量；其中，在所述其他Transformer模型中，上一个Transformer模型的输出，是与其对应的下一个Transformer模型的输入；

计算各所述Transformer模型对所述待处理序列的重要程度，并根据各所述重要程度以及各所述文本语义向量，得到所述第一预测结果。

在本公开的一种示例性实施例中，对所述复购行为向量、物品特征以及用户特征进行逻辑回归处理，得到所述预测复购周期，包括：

对所述复购行为向量、物品特征以及用户特征进行拼接以及平铺处理，得到第二拼接结果；

利用所述逻辑回归层中包括的第二多层全连接神经网络将所述第二拼接结果投影到高维空间，得到高维投影结果；

对所述高维投影结果进行非线性激活，得到所述预测复购周期。

根据本公开的一个方面，提供一种周期预测方法，包括：

根据目标用户的用户标识，获取目标用户的目标用户数据，并根据所述目标用户数据计算所述目标用户的目标订单行为序列；

从所述目标订单中确定目标物品，并将所述目标物品、目标订单行为序列以及所述目标用户数据中包括的目标用户画像输入至训练完成的周期预测模型中，得到所述目标用户对所述目标物品的复购周期；其中，所述训练完成的周期预测模型为通过上述任意一项所述的周期预测模型的训练方法对待训练的周期预测模型进行训练得到的；

基于所述复购周期以及所述目标用户对所述目标物品最后一次的购买时间，计算所述目标物品的下一次推荐时间，并基于所述下一次的推荐时间对所述目标物品进行推荐。

根据本公开的一个方面，提供一种周期预测模型的训练装置，包括：

第一计算模块，用于根据历史用户数据计算历史用户的历史订单行为序列以及历史订单中所包括的历史物品的实际复购周期；

数据集构建模块，用于根据所述历史物品、实际复购周期、历史订单行为序列以及所述历史用户数据中的历史用户画像，构建数据集；

复购周期预测模块，用于将所述数据集中包括的历史物品、历史订单行为序列以及历史用户画像输入至待训练的周期预测模型中，得到所述历史物品的预测复购周期；

周期预测模型训练模块，用于根据所述数据集中的实际复购周期以及预测复购周期构建第一损失函数，并利用所述第一损失函数对所述待训练的周期预测模型进行训练，得到训练完成的周期预测模型。

根据本公开的一个方面，提供一种周期预测装置，包括：

第二计算模块，用于根据目标用户的用户标识，获取目标用户的目标用户数据，并根据所述目标用户数据计算所述目标用户的目标订单行为序列；

复购周期预测模块，用于从所述目标订单中确定目标物品，并将所述目标物品、目标订单行为序列以及所述目标用户数据中包括的目标用户画像输入至训练完成的周期预测模型中，得到所述目标用户对所述目标物品的复购周期；其中，所述训练完成的周期预测模型为通过上述任意一项所述的周期预测模型的训练方法对待训练的周期预测模型进行训练得到的；

物品推荐模块，用于基于所述复购周期以及所述目标用户对所述目标物品最后一次的购买时间，计算所述目标物品的下一次推荐时间，并基于所述下一次的推荐时间对所述目标物品进行推荐。

根据本公开的一个方面，提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任意一项所述的周期预测模型的训练方法以及上述所述的周期预测方法。

根据本公开的一个方面，提供一种电子设备，包括：

处理器；以及

存储器，用于存储所述处理器的可执行指令；

其中，所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的周期预测模型的训练方法以及上述所述的周期预测方法。

本公开实施例提供的一种周期预测模型的训练方法，一方面，由于在周期预测模型的训练过程中，考虑到了历史订单行为序列，进而解决了现有技术中由于未考虑用户的历史订单行为序列，进而使得复购周期模型的输出结果的准确率较低，进而导致模型的精确度较低的问题；另一方面，通过根据历史用户数据计算历史用户的历史订单行为序列以及历史订单中所包括的历史物品的实际复购周期；并根据历史物品、实际复购周期、历史订单行为序列以及历史用户数据中的历史用户画像，构建数据集；再将数据集中包括的历史物品、历史订单行为序列以及历史用户画像输入至待训练的周期预测模型中，得到历史物品的预测复购周期；最后根据数据集中的实际复购周期以及预测复购周期构建第一损失函数，并利用第一损失函数对待训练的周期预测模型进行训练，得到训练完成的周期预测模型，进而提升了周期预测模型的拟合能力，进一步的提升了周期预测模型的精确度。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示意性示出根据本公开示例实施例的一种周期预测模型的训练方法的流程图。

图2示意性示出根据本公开示例实施例的一种周期预测模型的机构示例图。

图3示意性示出根据本公开示例实施例的一种将所述数据集中包括的历史物品、历史订单行为序列以及历史用户画像输入至待训练的周期预测模型中，得到所述历史物品的预测复购周期的方法流程图。

图4示意性示出根据本公开示例实施例的一种第一词嵌入层的生成方法的流程图。

图5示意性示出根据本公开示例实施例的一种Bert模型的结构示例图。

图6示意性示出根据本公开示例实施例的另一种周期预测模型的训练方法的流程图。

图7示意性示出根据本公开示例实施例的一种周期预测方法的流程图。

图8示意性示出根据本公开示例实施例的一种周期预测模型的训练装置的框图。

图9示意性示出根据本公开示例实施例的一种周期预测装置的框图。

图10示意性示出根据本公开示例实施例的一种用于实现上述周期预测模型的训练方法以及周期预测方法的电子设备。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本公开将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中，提供许多具体细节从而给出对本公开的实施方式的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而省略所述特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。

此外，附图仅为本公开的示意性图解，并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

随着电商发展的日趋成熟，电商愈加重视精细化运营每一个客户，以增强老用户粘性为主，挖掘新用户为辅的方法，逐步成为电商平台持续稳定增长的必要条件；因此，为用户精准推荐商品，增强用户体验，是实现这一条件的不可或缺的手段。而复购问题作为推荐系统中用户体验问题之一，亟待解决。

具体的，复购问题指电商场景下，推荐系统倾向于推荐用户近期已买过的相似商品，例如用户在电商平台购物时经常反馈近期已经购买过“油烟机”、“电动车”等商品，但电商平台继续推荐“油烟机”、“电动车”相关商品，并可稳定复现，严重影响了用户体验，易造成用户流失。

解决复购问题的常见方法为构建用户的复购周期画像。其中，复购周期指用户对某类商品的复购时间间隔，例如某用户稳定30天购买一次牛奶，则该用户对牛奶的复购周期为30天。推荐系统分别在召回和排序两个阶段解决复购问题。在召回阶段，使用用户复购周期对近期已买商品进行过滤；在排序阶段，复购周期作为精排模型特征，输入机器学习模型进行训练，并根据复购周期提权用户复购日期临近商品，且给近期已买商品降权，从而影响排序结果，提升用户体验。

现有复购周期画像常见可以包括：基于正态分布计算用户复购周期。具体的，该方法首先针对用户对复购商品的历史订单信息进行降序排列，计算用户对复购商品的每相邻两次购买的时间差值；根据购买间隔计算时间差值的均值和方差；通过时间差值的均值和方差计算筛选区间，筛选区间为[均值-方差，均值+方差]；将时间差值不属于筛选区间的数据剔除，得到筛选后的时间差值；通过对时间差值求平均值，得到用户对复购商品的复购周期。

但是，基于正态分布的方案虽然考虑历史订单间隔，但受限于统计模型，无法统计相似商品，例如商品为洗衣粉和洗衣液，在统计模型会作为两类商品，因此使得统计模型的表达能力较为欠缺；并且，现有方案在计算用户真实复购周期时均采用时间间隔作为基础数据，并未考虑用户购买数量，易造成预测结果不精确。以牛奶举例，购买两箱牛奶与购买五箱牛奶的时间间隔若均作为该用户对牛奶的单次复购间隔，会导致基础数据不够精确。同时，用户囤货行为对用户下一次购买时间影响较大，不考虑会使预测结果造成偏差。

基于此，本示例实施方式中首先提供了一种周期预测模型的训练方法，该方法可以运行于服务器、服务器集群或云服务器等；当然，本领域技术人员也可以根据需求在其他平台运行本公开的方法，本示例性实施例中对此不做特殊限定。参考图1所示，该周期预测模型的训练方法可以包括以下步骤：

步骤S110.根据历史用户数据计算历史用户的历史订单行为序列以及历史订单中所包括的历史物品的实际复购周期；

步骤S120.根据所述历史物品、实际复购周期、历史订单行为序列以及所述历史用户数据中的历史用户画像，构建数据集；

步骤S130.将所述数据集中包括的历史物品、历史订单行为序列以及历史用户画像输入至待训练的周期预测模型中，得到所述历史物品的预测复购周期；

步骤S140.根据所述数据集中的实际复购周期以及预测复购周期构建第一损失函数，并利用所述第一损失函数对所述待训练的周期预测模型进行训练，得到训练完成的周期预测模型。

上述周期预测模型的训练方法中，一方面，由于在周期预测模型的训练过程中，考虑到了历史订单行为序列，进而解决了现有技术中由于未考虑用户的历史订单行为序列，进而使得复购周期模型的输出结果的准确率较低，进而导致模型的精确度较低的问题；另一方面，通过根据历史用户数据计算历史用户的历史订单行为序列以及历史订单中所包括的历史物品的实际复购周期；并根据历史物品、实际复购周期、历史订单行为序列以及历史用户数据中的历史用户画像，构建数据集；再将数据集中包括的历史物品、历史订单行为序列以及历史用户画像输入至待训练的周期预测模型中，得到历史物品的预测复购周期；最后根据数据集中的实际复购周期以及预测复购周期构建第一损失函数，并利用第一损失函数对待训练的周期预测模型进行训练，得到训练完成的周期预测模型，进而提升了周期预测模型的拟合能力，进一步的提升了周期预测模型的精确度。

以下，将结合附图对本公开示例实施例周期预测模型的训练方法进行详细的解释以及说明。

首先，对本公开示例实施例的发明目的进行解释以及说明。具体的，为了解决现有技术的不足，本公开提出一种基于Attention机制的用户复购周期预测方法实现方案，精细化预测用户-商品复购周期，从而解决推荐系统中推荐用户近期已买商品导致的用户体验问题。本技术方案以用户近三年历史下单商品序列、购买数量序列、购买时间序列为特征，首先基于预训练方法提取商品、购买数量、购买时间等特征语义信息；之后，在整体模型中，首先基于Self-attention机制学习用户个性化复购习惯，然后基于Attention机制提取用户历史购买序列中与目标商品相关的购买信息，然后与用户画像和目标商品一同输入到MLP网络中，从而预测用户复购周期，在提高周期预测模型的精确度的基础上，提升了用户体验。

在本公开示例实施例提供的一种周期预测模型的训练方法中：

在步骤S110中，根据历史用户数据计算历史用户的历史订单行为序列以及历史订单中所包括的历史物品的实际复购周期。

在本示例实施例中，首先，根据历史用户数据计算历史用户的历史订单行为序列，具体的，可以包括：首先，根据历史用户的用户标识，获取所述历史用户在第一预设时间段内的历史用户数据；其次，提取所述历史用户数据中包括的历史物品，并根据历史物品所属的类目标识，对所述历史物品进行聚合处理，得到所述历史物品所属的不同层级的类目；然后，对所述历史物品的数量进行求和运算，得到所述历史物品的购买数量，并根据所述历史物品的起始购买时间以及终止购买时间，计算所述历史物品的时间位置特征；最后，根据所述历史物品所属的不同层级的类目、购买数量以及时间位置特征，生成所述历史订单行为序列。

举例来说，可以根据历史用户的用户标识(用户标识可以是电话号码、邮箱或者姓名等等，本示例对此不做特殊限制)，获取该历史用户近三年(1095天)的历史用户数据；然后，提取该历史用户数据中包括的历史物品，也即该历史用户在近三年内购买的历史物品，并基于天维度构建用户购买序列，对用户当天购买的相同类目下商品数据进行聚合，具体方式为对用户当天购买商品以cid4、cid3、cid2、cid1为聚合字段做聚合(group by)，进而得到历史物品所属的不同层级的类目。其中，cid4、cid3、cid2、cid1为商品所属类目标识，分别对应四级类目、三级类目、二级类目、一级类目；例如，以某发夹为例，该物品对应的cid4、cid3、cid2、cid1分别为碎发夹、发夹、发饰、首饰。进一步的，历史物品的数量进行求和运算，得到所述历史物品的购买数量；同时，对于时间位置特征(也即购买时间特征)，可以将当前购买日期与训练数据最小购买日期做差值，从而得到时间位置(position)特征，范围为[0,1095]；最后，即可根据历史物品所属的不同层级的类目、购买数量以及时间位置特征，生成历史订单行为序列。

其次，根据历史用户数据计算历史订单中所包括的历史物品的实际复购周期。具体的，可以包括：首先，从所述历史用户数据中提取所述历史订单中包括的历史物品的第一购买时间节点以及与第一购买时间节点对应的上一购买时间节点；其次，根据所述第一购买时间节点以及与第一购买时间节点对应的上一购买时间节点，计算所述历史物品的当前购买周期；最后，对所述当前购买周期进行归一化处理，得到所述历史物品的实际复购周期。具体的，在模型训练过程中，可以以随机预测历史用户购买序列中下一次复购间隔为目标，训练样本提取规则为随机选取历史用户购买序列中某复购商品为历史物品(targetitem)，发生复购时间(repruchase_day)与上一次购买该cid4类历史物品的时间间隔作为真实复购间隔(label)，用户购买序列截断到pruchase_day之前；然后，对真实复购间隔做归一化处理得到训练样本真实值(实际复购周期)y。其中，具体的归一化处理公式可以如下公式(1)所示：

其中max为label中最大值，min为label中最小值。

在步骤S120中，根据所述历史物品、实际复购周期、历史订单行为序列以及所述历史用户数据中的历史用户画像，构建数据集。

具体的，当得到实际复购周期以及历史订单行为序列以后，即可根据历史物品、实际复购周期、历史订单行为序列以及用户画像构建数据集；并将该数据集中的数据样本按比例划分8：1：1，其中8份用于模型训练，1份用于模型验证，1份用于模型测试评估。其中，用户画像可以包括该历史用户的性别、年龄、职业等。

在步骤S130中，将所述数据集中包括的历史物品、历史订单行为序列以及历史用户画像输入至待训练的周期预测模型中，得到所述历史物品的预测复购周期。

在本示例实施例中，首先，周期预测模型进行解释以及说明。具体的，参考图2所示，该周期预测模型可以包括输入层210、第一词嵌入层220、第二词嵌入层230、注意力机制层240、逻辑回归层250以及输出层260；其中，输入层与第一词嵌入层以及第二词嵌入层连接，第一词嵌入层通过注意力机制层与逻辑回归层连接，第二词嵌入层通过逻辑回归层与输出层连接。

其次，参考图3所示，将所述数据集中包括的历史物品、历史订单行为序列以及历史用户画像输入至待训练的周期预测模型中，得到所述历史物品的预测复购周期，可以包括以下步骤：

步骤S310，利用所述第一词嵌入层对所述历史物品以及历史订单行为序列进行编码，得到物品特征以及行为序列特征，并利用所述第二词嵌入层对所述历史用户画像进行编码，得到用户特征。

在本示例实施例中，首先，对第一词嵌入层的生成过程进行解释以及说明。具体的，参考图4所示，该第一词嵌入层的生成过程可以包括以下步骤：

步骤S410，基于Word2vec对所述历史物品所属的不同层级的类目、购买数量以及时间位置特征进行编码，得到第一子向量、第二子向量以及第三子向量；

步骤S420，对所述第一子向量、第二子向量以及第三子向量进行特征拼接，得到所述历史用户的订单序列，并对所述订单序列中的任一子向量进行随着遮盖，得到待处理序列；

步骤S430，通过待训练的Bert模型对所述待处理序列进行预测，得到第一预测结果，并通过所述第一预测结果以及遮盖的子向量对所述Bert模型构建第二损失函数；其中，所述Bert模型包括多个Transformer模型；

具体的，通过待训练的Bert模型对所述待处理序列进行预测，得到第一预测结果，可以包括：首先，将所述待处理序列输入至第一个Transformer模型，生成第一文本语义向量，并将所述第一文本语义向量输入至其他Transformer模型，得到与其他Transformer模型对应的文本语义向量；其中，在所述其他Transformer模型中，上一个Transformer模型的输出，是与其对应的下一个Transformer模型的输入；其次，计算各所述Transformer模型对所述待处理序列的重要程度，并根据各所述重要程度以及各所述文本语义向量，得到所述第一预测结果。

步骤S440，利用所述第二损失函数对所述待训练的Bert模型进行训练，并将训练完成的Bert模型融合至第二词嵌入层中，得到所述第一词嵌入层。

以下，将对步骤S410-步骤S440进行解释以及说明。具体的，预训练是指通过自监督学习方法从大规模数据中获得与具体任务无关的预训练模型，引入预训练可以较好的获得cid4、cid3、cid2、cid1、购买数量、购买时间position等特征语义表示的embedding向量。在本示例实施例中，可以基于包括多个Transformer模型的Bert模型完成预训练，其中，Bert模型的架构图可以参考图5所示，在该Bert模型中，可以包括12个Transformer模型，例如，Transformer 1，Transformer 2，……，Transformer Encoder L等等。

进一步的，由于cid4较为稀疏，数据量高达几十万，Transformer在现有机器条件限制下(4卡GPU)很难完成预训练，因此在本示例实施例中，使用word2Vec+Transformer两阶段预训练的方式对Transformer进行预训练，缓解cid4稀疏性问题并加快预训练速度。具体的，首先，基于Word2vec对用户购买的物品cid4序列、cid3序列、cid2序列、cid1序列、购买数量序列、购买时间position序列进行训练，得到与cid4、cid3、cid2、cid1对应的第一子向量、与购买数量对应的第二子向量和与时间位置对应的第三子向量；其次，由于基于Word2vec训练的embedding仅可以将限定窗口大小内的相似特征进行聚合，缺失更多上下文信息，且没有利用商品属性进行预测，缺少自身属性信息；因此，可以将Word2vec得到的embedding向量作为Transformer模型中的初始input embedding，然后进行第二阶段预训练从而得到更好的特征语义表示(embedding)。

例如，可以将与cid4序列、cid3序列、cid2序列、cid1序列对应的第一子向量、与购买数量序列对应的第二子向量、与时间位置序列对应的第三子向量进行特征拼接得到历史用户的订单序列，其中用户的每条购买记录将包括cid1、cid2、cid3、cid4、购买数量、购买时间特征；进一步的，采用MLM训练方法训练模型。其中，MLM的具体原理为：将用户订单序列输入到Transformer模型中，MLM训练方法将随机遮盖住(mask)购买记录的任意特征(特征包括cid1、cid2、ci3、cid4、购买数量以及时间位置特征等)得到待处理序列，然后使用模型去预测待处理序列中被遮盖住的特征，得到第一预测结果；再基于该预测结果以及实际遮盖的特征构建损失函数，以完成对待训练的Bert模型的训练；最后，可以将训练完成的Bert模型融合至第二词嵌入层中，得到第一词嵌入层。

此处需要补充说明的是，该训练方法不仅可以使用最近的购买记录去预测，也可以用当前购买记录的其他特征去预测(cid1、cid2、cid3、cid4等)，从而使得不同特征的embedding能够在语义空间上对齐，进而提高行为序列特征的精确度，从而提高周期预测模型的精确度。并且，本示例将预训练以后的Bert模型引入融合至第二词嵌入层中得到的第一词嵌入层，可以将作用于历史用户的历史购买序列中的每一个物品，例如针对序列中的商品“衬衫”，在学习衬衫的embedding表示时，购买过的T恤、背心等相关品类的特征应该得到加权，从而可以更好地学到“衬衫”的语义信息，并且由于购买时间、购买数量特征的加入，更是可以学到用户针对“衬衫”物品的个性化复购习惯信息，增强模型的学习能力。

最后，当得到第一词嵌入层以后，即可利用第一词嵌入层对所述历史物品以及历史订单行为序列进行编码，得到物品特征以及行为序列特征，再利用第二词嵌入层对历史用户画像进行编码，得到用户特征。此处需要补充说明的是，此处所记载的第二词嵌入层，可以是常用的词嵌入层，也即常规的Embedding层。

步骤S320，利用所述注意力机制层对所述行为序列特征以及所述物品特征进行处理，得到所述历史用户对所述历史物品的复购行为向量。

在本公开的一种示例性实施例中，首先，对所述行为序列特征以及所述物品特征进行第一操作，得到第一输出结果；其中，所述第一操作包括内积操作以及相减操作；其次，对所述第一输出结果、所述行为序列特征以及所述物品特征进行拼接得到第一拼接结果；然后，利用所述注意力机制层中包括的第一多层全连接神经网络对所述第一拼接结果进行处理，得到所述历史物品的注意力权重；最后，对所述注意力权重以及所述物品特征进行加权求和，得到所述复购行为向量。

具体的，首先，对行为序列特征以及物品特征做内积、相减操作，得到第一输出结果；并将第一输出结果与行为序列特征以及物品特征拼接到一起，一同输入到第一多层全连接神经网络(MLP)中，从而学习到attention权重w，最后采用weighted sum pooling得到购买序列中与当前商品相关的复购行为向量。其中，weighted sum pooling公式可以如下公式(2)所示：

其中，v_a表示历史物品的embedding向量(物品特征)，e₁,e₂,...,e_n表示第二词嵌入层输出的物品embedding向量(行为序列特征)，a(e_j,v_a)表示注意力机制层attention操作，w_j表示学习到的attention权重，U(A)表示历史用户对历史物品的复购行为向量。

此处需要补充说明的是，注意力(Attention)机制层能很好的聚焦用户历史上购买的与当前商品相关的商品。例如，当计算用户“电脑”商品的复购周期时，在用户之前购买的商品中，曾经购买过的笔记本电脑、台式机等相关品类的特征应该得到加权；而如衣服，零食等这些购买行为则相对而言应降权。Attention机制就是为了聚焦与目标商品相关的历史购买行为。

步骤S330，利用所述逻辑回归层对所述复购行为向量、物品特征以及用户特征进行逻辑回归处理，得到所述预测复购周期。

在本示例实施例中，首先，对所述复购行为向量、物品特征以及用户特征进行拼接以及平铺处理，得到第二拼接结果；其次，利用所述逻辑回归层中包括的第二多层全连接神经网络将所述第二拼接结果投影到高维空间，得到高维投影结果；最后，对所述高维投影结果进行非线性激活，得到所述预测复购周期。

具体的，逻辑回归Regressor层中将Attention层输出的复购行为向量U(A)、历史物品的embedding向量(物品特征)v_a以及用户画像向量(用户特征)做拼接及平铺操作，然后通过第二多层全连接神经网络MLP投影到高维空间，通过激活函数relu进行非线性激活，最终通过Sigmoid函数得到模型输出结果y^pred，也即预测复购周期。

在步骤S140中，根据所述数据集中的实际复购周期以及预测复购周期构建第一损失函数，并利用所述第一损失函数对所述待训练的周期预测模型进行训练，得到训练完成的周期预测模型。

具体的，可以根据实际复购周期以及预测复购周期构建第一MAPE损失函数，进而通过该第一MAPE损失函数对待训练的周期预测模型进行训练。其中，损失函数可以如下公式(3)所示：

其中，L为第一MAPE损失函数，y_i为第i个训练样本的真实值，也即实际复购周期，

为第i个训练样本的模型预测值，也即预测复购周期，N为样本总数，也即历史物品的个数。

进一步的，当得到训练完成的周期预测模型以后，还需要对该训练完成的周期预测模型进行效果评估。具体的，在效果评估阶段，y^pred首先需要经过反归一化得到最终复购周期预测结果period，反归一化公式为y^pred*(max-min)+min，其中max为label中最大值，min为label中最小值，y^pred为步骤D中Rgressor层的输出，也即预测复购周期。

同时，对测试集进行模型的预测以及反归一化之后，采用MAPE、SMAPE等指标综合评价模型的效果。积累多次的模型评估结果，计算模型的平均指标。复购周期离线实验中，测试集评估SMAPE为0.198，MAPE为0.1392，效果十分明显。在线上实际使用时，当模型的指标处于平均水平时，或高于平均水平时，可定时更新模型文件至线上模型库。若模型评价指标低于模型的平均水平时不更新。离线模型的训练与评估周期为周级别，即每周训练及评估模型效果。

以下，结合图6对本公开示例实施例周期预测模型的训练方法进行进一步的解释以及说明。参考图6所示，该周期预测模型的训练方法可以包括以下步骤：

步骤S601，Embedding层首先将输入的历史物品、用户历史购买序列(包括商品、购买时间、购买数量等特征)、用户画像(性别、年龄等)转化为embedding向量；

步骤S602，将目标商品的embedding向量以及用户历史购买序列的embedding向量一同输入到attention网络中，得到该历史用户对历史物品的复购习惯；

步骤S603，将历史物品、复购习惯以及用户画像的embedding向量做拼接，一同输入到Regressor层中，从而获得用户的预测复购周期；

步骤S604，根据预测复购周期以及实际复购周期构建第一损失函数，并基于该第一损失函数对待训练的周期预测模型进行训练，进而得到训练完成的周期预测模型。

本公开示例实施例提供的一种基于Attention机制的周期预测模型的训练方法，一方面，针对复购周期画像独特的特征设计：除cid4序列、cid3序列、cid2序列、cid1序列以及用户画像特征等常规特征外，还加入购买数量序列和时间position序列，从而精准预测复购间隔，解决相似商品以及囤货问题带来的对复购周期的影响；另一方面，为增强泛化能力，还采用了在用户历史购买序列中随机预测下一次复购间隔为训练目标的训练方法，提升了模型的拟合能力。

本公开示例实施例还提供了一种周期预测方法。参考图7所示，该周期预测方法可以包括以下步骤：

步骤S710，根据目标用户的用户标识，获取目标用户的目标用户数据，并根据所述目标用户数据计算所述目标用户的目标订单行为序列；

步骤S720，从所述目标订单中确定目标物品，并将所述目标物品、目标订单行为序列以及所述目标用户数据中包括的目标用户画像输入至训练完成的周期预测模型中，得到所述目标用户对所述目标物品的复购周期；其中，所述训练完成的周期预测模型为通过前述所述的周期预测模型的训练方法对待训练的周期预测模型进行训练得到的；

步骤S730，基于所述复购周期以及所述目标用户对所述目标物品最后一次的购买时间，计算所述目标物品的下一次推荐时间，并基于所述下一次的推荐时间对所述目标物品进行推荐。

图7所示出的周期预测方法中，一方面，由于在周期预测过程中，考虑到了目标订单行为序列，进而解决了现有技术中由于未考虑用户的目标订单行为序列，进而复购周期的预测结果的精确度较低的问题；另一方面，可以基于复购周期以及目标用户对所述目标物品最后一次的购买时间以及购买数量，计算目标物品的下一次推荐时间，并基于所述下一次的推荐时间对所述目标物品进行推荐，进而提高了推荐结果的精确度，同时提升了用户体验。

本公开示例实施例还提供了一种周期预测模型的训练装置。参考图8所示，该周期预测模型的训练装置可以包括第一计算模块810、数据集构建模块820、复购周期预测模块830以及周期预测模型训练模块840。其中：

第一计算模块810可以用于根据历史用户数据计算历史用户的历史订单行为序列以及历史订单中所包括的历史物品的实际复购周期；

数据集构建模块820可以用于根据所述历史物品、实际复购周期、历史订单行为序列以及所述历史用户数据中的历史用户画像，构建数据集；

复购周期预测模块830可以用于将所述数据集中包括的历史物品、历史订单行为序列以及历史用户画像输入至待训练的周期预测模型中，得到所述历史物品的预测复购周期；

周期预测模型训练模块840可以用于根据所述数据集中的实际复购周期以及预测复购周期构建第一损失函数，并利用所述第一损失函数对所述待训练的周期预测模型进行训练，得到训练完成的周期预测模型。

在本公开的一种示例性实施例中，所述周期预测模型的训练装置还可以包括：

编码模块，可以用于基于Word2vec对所述历史物品所属的不同层级的类目、购买数量以及时间位置特征进行编码，得到第一子向量、第二子向量以及第三子向量；

特征拼接模块，可以用于对所述第一子向量、第二子向量以及第三子向量进行特征拼接，得到所述历史用户的订单序列，并对所述订单序列中的任一子向量进行随着遮盖，得到待处理序列；

损失函数构建模块，可以用于通过待训练的Bert模型对所述待处理序列进行预测，得到第一预测结果，并通过所述第一预测结果以及遮盖的子向量对所述Bert模型构建第二损失函数；

Bert模型训练模块，可以用于利用所述第二损失函数对所述待训练的Bert模型进行训练，并将训练完成的Bert模型融合至第二词嵌入层中，得到所述第一词嵌入层。

本公开示例实施例还提供了一种周期预测装置。参考图9所示，该周期预测装置可以包括第二计算模块910、复购周期预测模块920以及物品推荐模块930。其中：

第二计算模块910，可以用于根据目标用户的用户标识，获取目标用户的目标用户数据，并根据所述目标用户数据计算所述目标用户的目标订单行为序列；

复购周期预测模块920，可以用于从所述目标订单中确定目标物品，并将所述目标物品、目标订单行为序列以及所述目标用户数据中包括的目标用户画像输入至训练完成的周期预测模型中，得到所述目标用户对所述目标物品的复购周期；其中，所述训练完成的周期预测模型为通过上述任意一项所述的周期预测模型的训练方法对待训练的周期预测模型进行训练得到的；

物品推荐模块930，可以用于基于所述复购周期以及所述目标用户对所述目标物品最后一次的购买时间，计算所述目标物品的下一次推荐时间，并基于所述下一次的推荐时间对所述目标物品进行推荐。

上述周期预测模型的训练装置以及周期预测装置中各模块的具体细节已经在对应的周期预测模型的训练方法以及周期预测方法中进行了详细的描述，因此此处不再赘述。

应当注意，尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本公开的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

此外，尽管在附图中以特定顺序描述了本公开中方法的各个步骤，但是，这并非要求或者暗示必须按照该特定顺序来执行这些步骤，或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的，可以省略某些步骤，将多个步骤合并为一个步骤执行，以及/或者将一个步骤分解为多个步骤执行等。

在本公开的示例性实施例中，还提供了一种能够实现上述方法的电子设备。

所属技术领域的技术人员能够理解，本公开的各个方面可以实现为系统、方法或程序产品。因此，本公开的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“系统”。

下面参照图10来描述根据本公开的这种实施方式的电子设备1000。图10显示的电子设备1000仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图10所示，电子设备1000以通用计算设备的形式表现。电子设备1000的组件可以包括但不限于：上述至少一个处理单元1010、上述至少一个存储单元1020、连接不同系统组件(包括存储单元1020和处理单元1010)的总线1030以及显示单元1040。

其中，所述存储单元存储有程序代码，所述程序代码可以被所述处理单元1010执行，使得所述处理单元1010执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。例如，所述处理单元1010可以执行如图1中所示的步骤S110：根据历史用户数据计算历史用户的历史订单行为序列以及历史订单中所包括的历史物品的实际复购周期；步骤S120：根据所述历史物品、实际复购周期、历史订单行为序列以及所述历史用户数据中的历史用户画像，构建数据集；步骤S130：将所述数据集中包括的历史物品、历史订单行为序列以及历史用户画像输入至待训练的周期预测模型中，得到所述历史物品的预测复购周期；步骤S140：根据所述数据集中的实际复购周期以及预测复购周期构建第一损失函数，并利用所述第一损失函数对所述待训练的周期预测模型进行训练，得到训练完成的周期预测模型。

所述处理单元1010可以执行如图7中所示的步骤S710：根据目标用户的用户标识，获取目标用户的目标用户数据，并根据所述目标用户数据计算所述目标用户的目标订单行为序列；步骤S720：从所述目标订单中确定目标物品，并将所述目标物品、目标订单行为序列以及所述目标用户数据中包括的目标用户画像输入至训练完成的周期预测模型中，得到所述目标用户对所述目标物品的复购周期；其中，所述训练完成的周期预测模型为通过前述所述的周期预测模型的训练方法对待训练的周期预测模型进行训练得到的；步骤S730：基于所述复购周期以及所述目标用户对所述目标物品最后一次的购买时间，计算所述目标物品的下一次推荐时间，并基于所述下一次的推荐时间对所述目标物品进行推荐。

存储单元1020可以包括易失性存储单元形式的可读介质，例如随机存取存储单元(RAM)10201和/或高速缓存存储单元10202，还可以进一步包括只读存储单元(ROM)10203。

存储单元1020还可以包括具有一组(至少一个)程序模块10205的程序/实用工具10204，这样的程序模块10205包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线1030可以为表示几类总线结构中的一种或多种，包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备1000也可以与一个或多个外部设备1100(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与该电子设备1000交互的设备通信，和/或与使得该电子设备1000能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1050进行。并且，电子设备1000还可以通过网络适配器1060与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器1060通过总线1030与电子设备1000的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备1000使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本公开实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。

在本公开的示例性实施例中，还提供了一种计算机可读存储介质，其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中，本公开的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在终端设备上运行时，所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。

根据本公开的实施方式的用于实现上述方法的程序产品，其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本公开的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

此外，上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明，而不是限制目的。易于理解，上述附图所示的处理并不表明或限制这些处理的时间顺序。另外，也易于理解，这些处理可以是例如在多个模块中同步或异步执行的。

本领域技术人员在考虑说明书及实践这里发明的发明后，将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未发明的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由权利要求指出。

Claims

1.一种周期预测模型的训练方法，其特征在于，包括：

2.根据权利要求1所述的周期预测模型的训练方法，其特征在于，根据历史用户数据计算历史用户的历史订单行为序列，包括：

3.根据权利要求1所述的周期预测模型的训练方法，其特征在于，根据历史用户数据计算历史订单中所包括的历史物品的实际复购周期，包括：

4.根据权利要求1所述的周期预测模型的训练方法，其特征在于，所述待训练的周期预测模型包括第一词嵌入层、第二词嵌入层、注意力机制层以及逻辑回归层；

5.根据权利要求4所述的周期预测模型的训练方法，其特征在于，对所述行为序列特征以及所述物品特征进行处理，得到所述历史用户对所述历史物品的复购行为向量，包括：

6.根据权利要求4所述的周期预测模型的训练方法，其特征在于，所述周期预测模型的训练方法还包括：

7.根据权利要求6所述的周期预测模型的训练方法，其特征在于，所述Bert模型包括多个Transformer模型；

8.根据权利要求4所述的周期预测模型的训练方法，其特征在于，对所述复购行为向量、物品特征以及用户特征进行逻辑回归处理，得到所述预测复购周期，包括：

9.一种周期预测方法，其特征在于，包括：

从所述目标订单中确定目标物品，并将所述目标物品、目标订单行为序列以及所述目标用户数据中包括的目标用户画像输入至训练完成的周期预测模型中，得到所述目标用户对所述目标物品的复购周期；其中，所述训练完成的周期预测模型为通过权利要求1-8任一项所述的周期预测模型的训练方法对待训练的周期预测模型进行训练得到的；

10.一种周期预测模型的训练装置，其特征在于，包括：

11.一种周期预测装置，其特征在于，包括：

12.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1-8任一项所述的周期预测模型的训练方法以及权利要求9所述的周期预测方法。

13.一种电子设备，其特征在于，包括：

处理器；以及

存储器，用于存储所述处理器的可执行指令；

其中，所述处理器配置为经由执行所述可执行指令来执行权利要求1-8任一项所述的周期预测模型的训练方法以及权利要求9所述的周期预测方法。