CN108305094B

CN108305094B - 一种用户行为预测方法及装置，电子设备

Info

Publication number: CN108305094B
Application number: CN201711367670.7A
Authority: CN
Inventors: 朱凯; 周高磊; 魏旭杰; 范殊文; 李世斌
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2017-12-18
Filing date: 2017-12-18
Publication date: 2021-07-23
Anticipated expiration: 2037-12-18
Also published as: CN108305094A

Abstract

本申请用户行为预测方法，属于计算机技术领域，解决现有技术中预测结果不准确的问题。所述方法包括：根据目标用户在t时刻以前的行为数据，构建所述目标用户的t时刻行为转移概率矩阵；基于所述t时刻行为转移概率矩阵和预设行为影响因素，迭代训练所述目标用户的行为预估模型；通过所述行为预估模型，基于所述t时刻行为转移概率矩阵、所述预设行为影响因素和前一时刻所述目标用户行为预测结果，预测所述目标用户的下一行为。本申请实施例公开的用户行为预测方法，通过结合用户行为相关的因素和用户的行为转换关系进行行为预测，细化用户的行为粒度，全面考虑用户行为，并结合行为转化概率进行模型训练，有效提升了模型预测的准确性。

Description

一种用户行为预测方法及装置，电子设备

技术领域

本申请涉及计算机技术领域，特别是涉及一种用户行为预测方法及装置，电子设备。

背景技术

用户行为预测，即根据用户的现有行为来预测用户的下一行为。用户行为预测在广告在线投放、推荐系统等很多领域都有着广泛应用。以O2O场景下以餐饮美食举例，通过预测用户的下一行为，可以针对该用户做精准的优惠券或者商家促销活动推送。现有的用户行为预测方法，一般是收集上报用户的操作日志，基于用户的操作日志进行数据的清洗过滤，然后按照点击、浏览、曝光等粗粒度的划分来记录用户的行为序列，以进行行为预测。然而，不同的业务场景中关注的用户行为不同，基于这种粗粒度的用户行为进行预测，并不能真正体现出具体的业务价值，难以达到准确的预测效果。另一方面，由于个体的行为数据有限，训练样本的覆盖度不够，现有技术中基于操作日志训练预测模型进行用户行为预测时，也会出现预测不准确的现象。并且，基于用户已有的偏好来进行预测时，使得在O2O场景中进行用户行为预测时具有局限性，难以在预测中发掘用户新的行为。

可见，现有技术中的用户行为预测方法，至少存在预测结果不准确的缺陷。

发明内容

本申请提供一种用户行为预测方法，解决现有技术中的用户行为预测方法的至少一个问题。

为了解决上述问题，第一方面，本申请实施例提供了一种用户行为预测方法包括：

根据目标用户在t时刻以前的行为数据，构建所述目标用户的t时刻行为转移概率矩阵；

基于所述t时刻行为转移概率矩阵和预设行为影响因素，迭代训练所述目标用户的行为预估模型；

通过所述行为预估模型，基于所述t时刻行为转移概率矩阵、所述预设行为影响因素和前一时刻所述目标用户行为预测结果，预测所述目标用户的下一行为；

其中，所述t时刻为所述目标用户行为发生的时刻；所述前一时刻所述目标用户行为预测结果为迭代训练之前所述行为预估模型对所述目标用户在t时刻的行为的预测结果。

第二方面，本申请实施例提供了一种用户行为预测装置，包括：

目标用户行为转移概率矩阵构建模块，用于根据目标用户在t时刻以前的行为数据，构建所述目标用户的t时刻行为转移概率矩阵；

模型训练模块，用于基于所述t时刻行为转移概率矩阵和预设行为影响因素，迭代训练所述目标用户的行为预估模型；

行为预测模块，用于通过所述行为预估模型，基于所述t时刻行为转移概率矩阵、所述预设行为影响因素和前一时刻所述目标用户行为预测结果，预测所述目标用户的下一行为；

第三方面，本申请实施例还公开了一种电子设备，包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现本申请实施例所述的用户行为预测方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时本申请实施例公开的用户行为预测方法的步骤。

本申请实施例公开的用户行为预测方法，通过根据目标用户在t时刻以前的行为数据，构建所述目标用户的t时刻行为转移概率矩阵；基于所述t时刻行为转移概率矩阵和预设行为影响因素，迭代训练所述目标用户的行为预估模型；通过所述行为预估模型，基于所述t时刻行为转移概率矩阵、所述预设行为影响因素和前一时刻所述目标用户行为预测结果，预测所述目标用户的下一行为，解决了现有技术中存在预测结果不准确的问题。通过结合用户行为相关的因素和用户的行为转换关系进行行为预测，细化用户的行为粒度，全面考虑用户行为，并结合行为转化概率进行模型训练，有效提升了模型预测的准确性。通过结合用户的实时数据进行迭代训练，得到预测模型，可以不断修正模型的预测结果，进一步提升预测结果的准确性。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例一的用户行为预测方法流程图；

图2是本申请实施例二的用户行为预测方法流程图；

图3是本申请实施例三的用户行为预测装置的结构示意图之一；

图4是本申请实施例三的用户行为预测装置的结构示意图之二；

图5是本申请实施例三的用户行为预测装置的结构示意图之三。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

实施例一

本实施例公开的一种用户行为预测方法，如图1所示，该方法包括：步骤110至步骤130。

步骤110，根据目标用户在t时刻以前的行为数据，构建所述目标用户的t时刻行为转移概率矩阵。

其中，所述t时刻为所述目标用户行为发生的时刻。具体实施时，实时获取目标用户的行为数据，并在目标用户发生预设行为时，记录发生所述预设行为的时刻t，并进一步获取t时刻以前所述目标用户的行为数据。然后，基于获取的所述目标用户的行为数据构建所述目标用户的t时刻行为转移概率矩阵。其中，所述预设行为包括：浏览、分享、收藏、下单、签到、写点评等等用户行为。

例如，用户U在11月1日发生了购买产品行为，具体实施时，可以获取用户U在11月1日之前预设时间段(如三个月)内的所有行为数据，然后，按照行为的发生时间顺序，生成行为链路，所述行为链路为按照时间顺序先后排列的行为。然后，根据所述行为链路，确定用户在t时刻以前预设时间段内发生的所有行为，以及，两两行为之间的转换次数。进一步的，根据所述所有行为和两两行为之间的转换次数，构建所述目标用户的t时刻行为转移概率矩阵。其中，所述行为转移概率矩阵的行和列是所述目标用户已经发生的行为，所述行为转移概率矩阵表示该行对应的行为和该列对应的行为之间的转移概率。

步骤120，基于所述t时刻行为转移概率矩阵和预设行为影响因素，迭代训练所述目标用户的行为预估模型。

本申请具体实施时，根据实时获取的用户行为数据迭代训练行为预估模型。训练所述行为预估模型的输入至少包括：当前时刻的行为转移概率矩阵和预设行为影响因素。其中，所述预设行为影响因素包括但不限于以下任意一项或多项行为影响因素：时间因素，如：早、中、晚、周六、周日、节假日；地点因素，如：家、工作地、商场、地铁、火车站、异地；网络因素，如：WiFi环境、4G环境、3G环境；性别因素，如：男性、女性、未知性别；婚恋状态，如：两口之家、恋爱、单身、家有萌娃等。具体实施时，根据业务需求，可能还会提取出更多硬性用户行为的因素，此处不一一例举。

本申请具体实施时，将从行为影响因素中提取的特征、行为转移概率矩阵，构建成一个多维张量，作为模型的输入参数，训练行为预估模型。

当首次训练行为预估模型时，模型的内部变量可以设置为初始值。首次训练之后，将首次训练得到的模型的内部变量值，作为下一次迭代训练的模型的内部变量的初始值，依次根据最新的数据逐渐完善模型。

具体实施时，采用有记忆性的神经网络模型，训练行为预估模型，如LSTM(LongShort Term Memory)长短时记忆循环神经网络。

步骤130，通过所述行为预估模型，基于所述t时刻行为转移概率矩阵、所述预设行为影响因素和前一时刻所述目标用户行为预测结果，预测所述目标用户的下一行为。

其中，所述前一时刻所述目标用户行为预测结果为迭代训练之前所述行为预估模型对所述目标用户在t时刻的行为的预测结果。

具体实施时，根据t时刻获取的用户行为数据执行完所述行为预估模型的迭代训练之后，进一步根据训练后的所述行为预估模型、t时刻行为转移概率矩阵、所述预设行为影响因素和前一时刻所述目标用户行为预测结果，预测所述目标用户的下一行为，即预测用户在t时刻之后的下一个可能行为。

实施例二

如图2所示，在本申请另一实施例公开的用户行为预测方法，包括：步骤210至步骤260。

步骤210，根据目标用户在t时刻以前的行为数据，构建所述目标用户的t时刻行为转移概率矩阵。

具体实施时，所述t时刻为所述目标用户任一行为发生的时刻。例如，在实时获取目标用户的行为数据时，获取到目标用户发生了购买行为，则将所述目标用户发生购买行为的时刻作为“t时刻”，然后，获取所述目标用户在t时刻以前的行为数据。具体实施时，为了提高运算效率，减小运算量，获取所述t时刻之前预设时间段(如三个月)内的所有行为数据进行预测和模型训练。所述所有行为包括但不限于以下任意一项或多项：浏览、分享、收藏、下单、签到、写点评。通常，用户在一段时间内会有多条行为数据，每条行为数据会对应一种行为。因此，可以根据目标用户在t时刻以前的行为数据，构建所述目标用户的t时刻行为转移概率矩阵。

具体实施时，根据用户在t时刻以前的行为数据，构建所述用户的t时刻行为转移概率矩阵，包括：根据用户在t时刻以前的行为数据，确定所述用户在t时刻以前的所有已发生行为；根据所述已发生行为的发生时间顺序，构建所述用户的t时刻行为转移概率矩阵。

首先，根据目标用户在t时刻以前的行为数据，获取所述目标用户在t时刻以前的所有已发生行为。

因为每条行为数据会对应一种行为，所以，对于目标用户，如用户U,按照行为数据的生成时间(即用户行为的发生时间)先后顺序，对用户U的行为数据中的行为进行排列，可以得到所述用户U的行为序列。所述行为序列中每个行为都是所述用户U在t时刻之前的预设时间段内已经发生的行为。

然后，根据所述已发生行为的发生时间顺序，构建所述用户的t时刻行为转移概率矩阵。

进一步的，所述行为序列中后一个行为由前一个行为转换而来，通过遍历所述行为序列，可以确定所述行为序列中包括的两两行为的转换次数，以及，某种行为转化至其他行为的总次数。本实施例中，为了便于描述，假设用户U在t时刻之前共发生了四种行为，分别表示为行为1、2、3和4，每种行为的发生次数分别记为：n₁,n₂,n₃和n₄，用户U的行为序列表示为A(1,3,1,2,1,2,3,4)。则根据所述行为序列可以确定行为i转化到行为j的转换次数num(i,j)，以及，行为i转换到其他所有行为的转换次数num(i)。例如，行为1转换到行为2的转换次数num(1,2)＝2，行为1转换到行为3的转换次数num(1,3)＝1，行为1转换到行为2、3和4的总转换次数num(1)＝3。具体实施时，可以将行为i转移到行为j的转移次数与行为i转移到其他行为的总次数的比值作为行为i转移到行为j的转移概率。例如，通过公式：

计算行为行为i转移到行为j的转移概率P_ij(U)；其中，num(i,j)表示行为i转移到行为j的次数，num(i,)表示行为i转移到其他行为的总次数；i和j表示用户行为。本例中，i和j的取值为1至4。

最后，构建用户U的t时刻行为转移概率矩阵。例如，以所述行为序列A中用户U的所有已发生行为分别作为所述行为转移概率矩阵的行索引和列索引，以行为i转移到行为j的转移概率作为矩阵第i行第j列的元素值，构建矩阵。其中，行为i转移到行为j的转移概率等于行为i转移到行为j的次数与行为i转移到所有行为的总次数的比值。本实施例中，根据行为序列A构建的用户U的行为转移概率矩阵为：

具体实施时，对于行为序列A中的最后一个行为，因为其没有下一个行为，可以认为它转移到其他行为的概率是相等的。所述行为转移概率矩阵中每一行的元素值之和为1。

但是基于用户已经发生的行为得到的行为转移概率矩阵在真实预测中会存在一个问题，即用户的所有行为状态构成的是一个闭环，在没有新行为引入的情况下，对于用户潜在的行为是无法预测的。为了避免在预测时陷入历史行为的闭环中，需要对待预测用户的行为进行一定的扩展，将一些用户尚未发生但是存在潜在可能的行为加入进来，以提升行为预测的准确率。优选的，所述根据目标用户在t时刻以前的行为数据，构建所述目标用户的t时刻行为转移概率矩阵之后，还包括：根据所述目标用户的相似用户在t时刻以前的行为数据，构建所述相似用户的t时刻行为转移概率矩阵；通过所述相似用户的t时刻行为转移概率矩阵，扩展所述目标用户的t时刻行为转移概率矩阵。

具体实施时，根据行为特征相似度，确定所述目标用户的相似用户，然后，根据所述目标用的相似用户的已发生行为的转移概率，扩展所述目标用户的行为转移概率矩阵。

步骤220，根据行为特征相似度，确定所述目标用户的相似用户。

所述根据行为特征相似度，确定所述目标用户的相似用户，包括：对于每个用户，将t时刻以前各自的已发生行为的发生次数按照行为发生的时间顺序排列，作为自身的行为特征；通过计算每个用户的行为特征之间的相似度，确定与所述目标用户相似度最高的用户为所述目标用户的相似用户。

首先，按照前述方法分别确定每个用户的在t时刻以前各自的已发生行为。然后，将每个用户的行为的发生次数，按照行为发生时间的先后顺序进行排列，将得到的次数序列作为自身的行为特征。通过将所述目标用户的行为特征和其他用户的行为特征进行相似度比对，确定与所述目标用户相似度最高的用户。

具体实施时，假设用户U₁在t时刻之前共发生了四种行为，分别表示为行为1、2、3和4，每种行为的发生次数分别记为：n₁,n₂,n₃和n₄，用户U₁的行为特征表示为α＝(n₁,n₂,n₃,n₄)；用户U₂在t时刻之前共发生了五种行为，分别表示为行为1、2、4、5和6，每种行为的发生次数分别记为：m₁,m₂,m₄,m₅和m₆，用户U₂的行为特征可以表示为β＝(m₁,m₂,m₄,m₅,m₆)。然后，根据行为特征确定用户U₁和U₂的相似度。

本申请具体实施时，通过余弦距离度量用户相似度。所谓余弦距离也称余弦相似度，是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异大小的算法，同时在进行相似度计算时为了保证计算的精确合理，本申请按照行为数量对用户U₁和U₂的行为特征向量进行对齐，对齐之后用户U₁的的行为特征向量α′＝(n₁,n₂,n₃,n₄,0,0)，用户U₂的行为特征向量β′＝(m₁,m₂,0,m₄,m₅,m₆)，则用户U₁和U₂的相似度Sim(u₁,u₂)可以如下表示：

其中，i和j为行为数量，对行为特征向量进行补齐后，i＝j，本实施例中i＝j＝6。

通过上述方法，分别确定所述目标用户和其他用户的相似度，并选择相似度最高(即Sim()最大)的用户作为所述目标用户的相似用户。

步骤230，根据所述目标用户的相似用户在t时刻以前的行为数据，构建所述相似用户的t时刻行为转移概率矩阵。

有了用户相似度之后，可以利用基于用户相似度的协同过滤方法扩充可能的行为集合，具体做法是，对于用户U₁，利用前文的方法计算所述用户U₁和其他用户的相似度，并取和用户U₁相似度最高的用户U₂作为用户U₁的最近邻居，相似度记为Sim(u₁,u₂)，同时将用户U₂行为集中存在的行为而用户U₁行为集中没有的行为加入用户U₁的行为转移概率矩阵中。本实施例中，以用户U₁的相似用户为用户为U₂为例，首先需要构建用户U₂的t时刻行为转移概率矩阵。

获取用户U₂在t时刻以前的行为数据，以及构建用户U₂的t时刻行为转移概率矩阵的具体实施方式与构建用户U₁的t时刻行为转移概率矩阵的方式相同，此处不再赘述。不同的是，用户U₂的t时刻以前的行为数据中已发生行为包括m种，因此，得到的用户U₂的t时刻行为转移概率矩阵为m*m的矩阵，例如，表示为：

而用户U₁的t时刻以前的行为数据中已发生行为包括n种，因此，得到的用户U₁的t时刻行为转移概率矩阵为n*n的矩阵，例如，表示为:

当m大于n时，即用户U₂的已发生行为多于用户U₁的已发生行为时，则可以根据用户U₂的t时刻行为转移概率矩阵扩展用户U₁的t时刻行为转移概率矩阵。

步骤240，通过所述相似用户的t时刻行为转移概率矩阵，扩展所述目标用户的t时刻行为转移概率矩阵。

所述t时刻行为转移概率矩阵的第i行第j列的元素为：在t时刻以前，第i行对应的所述已发生行为与第j列对应的所述已发生行为之间的转移概率；所述通过所述相似用户的t时刻行为转移概率矩阵，扩展所述目标用户的t时刻行为转移概率矩阵，包括：通过所述相似用户的t时刻行为转移概率矩阵中的扩展行为、所述扩展行为对应的转移概率，扩展所述目标用户的t时刻行为转移概率矩阵；其中，所述扩展行为是所述目标用户在t时刻以前未发生的行为。

下面以通过用户U₂的t时刻行为转移概率矩阵扩展用户U₁的t时刻行为转移概率矩阵为例，详细说明矩阵扩展方案。矩阵扩展具体做法如下：首先将用户U₂前n行后m-n列的转移概率乘以用户U₁和用户U₂的相似度Sim(u₁,u₂)，然后，填充到用户U₁的行为转移概率矩阵的前n行后m-n列中，再将用户U₂的后m-n行填充到用户U₁的行为转移概率矩阵的n+1到m行中。从而得到用户U₁的m阶行为转移概率矩阵，表示为：

其中，m为所述相似用户在t时刻以前的已发生行为行为数量，n为所述目标用户在t时刻以前的已发生行为数量，m大于n，m和n为正整数。

具体实施时，由于在所述目标用户的t时刻行为转移概率矩阵的一些行补入的新行为对应的转移概率，导致矩阵的相应行的和大于1，因此需要对矩阵进行归一化处理。以前述矩阵

为例，其前n行的和大于1，因此，需要至少对前n行进行归一化处理。具体实施时，可以通过公式

对扩展后的矩阵进行归一化处理，其中，m为扩展后的矩阵的列数，i为矩阵行索引，j为矩阵列索引，i和j为小于m的正整数。

扩展后的行为转移概率矩阵为丰富了预测从行为的行为转移概率矩阵，通过扩展后的行为转移概率矩阵作为行为预估模型的训练样本或预测输入，可以预测到用户之前未发生过的行为，进一步提升预测结果的准确性，并提升了行为预测的实用性。

步骤250，基于扩展后的所述t时刻行为转移概率矩阵和预设行为影响因素，迭代训练所述目标用户的行为预估模型。

具体实施时，所述基于所述t时刻行为转移概率矩阵和预设行为影响因素，迭代训练所述目标用户的行为预估模型，包括：基于所述t时刻行为转移概率矩阵和预设行为影响因素，构建所述目标用户的特征张量；将所述特征张量作为长短记忆型递归神经网络的输入，迭代训练所述目标用户的行为预估模型。

LSTM包括遗忘门(f_t)，输入门(i_t)，单元状态(c_t)，输出门(o_t)，输出(h_t)这五个向量值。其中，遗忘门决定了上一时刻的单元状态c_t-1有多少保留到当前时刻c_t，计算公式为：f_t＝σ(W_f·[h_t-1,x_t]+b_f)；输入门决定了当前时刻网络的输入x_t有多少保留到单元状态c_t，计算公式为：i_t＝σ(W_i·[h_t-1,x_t]+b_i)；当前时刻单元状态的计算公式为：

；输出门，它控制了长期记忆c_t对当前输出的影响，计算公式为：o_t＝σ(W_o·[h_t-1,x_t]+b_o)；LSTM最终的输出是由输出门和单元状态共同确定的，计算公式为：h_t＝o_t.tanh(c_t)。具体实施时，基于输入的特征张量，通过LSTM的反向训练和权重梯度的计算可以推算出以上公式中的权重矩阵W和偏置项b。激活函数σ和tanh的实现求解过程参见现有技术，本申请实施例中不再赘述。LSTM的训练过程参见现有技术，本申请实施例中不再赘述。

步骤260，通过所述行为预估模型，基于扩展后的所述t时刻行为转移概率矩阵、所述预设行为影响因素和前一时刻所述目标用户行为预测结果，预测所述目标用户的下一行为。

以目标用户为用户U₁为例，用户U₁的t时刻行为转移概率矩阵为

所述预设行为影响因素包括：时间因素d_t,地点因素a_t,性别因素s_t，则所述t时刻行为转移概率矩阵、所述预设行为影响因素构成的特征张量表示为：

前一时刻所述目标用户U₁行为预测结果表示为h_t-1，则通过公式h_t＝o_t.tanh(c_t)预估目标用户U₁的下一行为。其中，o_t为训练得到的行为预估模型的输出门，c_t为训练得到的行为预估模型在当前时刻的单元状态，

，f_t为训练得到的行为预估模型的遗忘门，i_t为训练得到的行为预估模型的输入门；本实施例中，f_t＝σ(W_f·[h_t-1,x_t]+b_f)，i_t＝σ(W_i·[h_t-1,x_t]+b_i)。

本申请实施例公开的用户行为预测方法，通过根据目标用户在t时刻以前的行为数据，构建所述目标用户的t时刻行为转移概率矩阵；同时，构建所述目标用户的相似用户的t时刻行为转移概率矩阵，并通过所述相似用户的行为转移概率矩阵扩展所述目标用户的行为转移概率矩阵，最后，再基于所述扩展后所述目标用户的t时刻行为转移概率矩阵和预设行为影响因素，迭代训练所述目标用户的行为预估模型；通过所述行为预估模型，基于扩展后的所述t时刻行为转移概率矩阵、所述预设行为影响因素和前一时刻所述目标用户行为预测结果，预测所述目标用户的下一行为，解决了现有技术中存在预测结果不准确的问题。通过结合相似用户的行为，对待预测用户的行为进行扩展，并基于扩展后的行为进行模型训练和行为预测，可以预测到用户未发生的行为，不仅提升了预测结果的准确性，同时提高了预测结果的实用性。

通过采用LSTM模型，在预测过程中能够考虑到每个用户行为的周期性，更加的合理，预测结果更准确。同时，采用LSTM模型进行预测，基于时间序列的事件预测中，具备更高的准确性，更快的速度，提升了预测效率。

实施例三

本实施例公开的一种用户行为预测装置，如图3所示，所述装置包括：

目标用户行为转移概率矩阵构建模块310，用于根据目标用户在t时刻以前的行为数据，构建所述目标用户的t时刻行为转移概率矩阵；

模型训练模块320，用于基于所述t时刻行为转移概率矩阵和预设行为影响因素，迭代训练所述目标用户的行为预估模型；

行为预测模块330，用于通过所述行为预估模型，基于所述t时刻行为转移概率矩阵、所述预设行为影响因素和前一时刻所述目标用户行为预测结果，预测所述目标用户的下一行为；

可选的，如图4所示，所述装置还包括：

相似用户行为转移概率矩阵构建模块340，用于根据所述目标用户的相似用户在t时刻以前的行为数据，构建所述相似用户的t时刻行为转移概率矩阵；

矩阵扩展模块350，用于通过所述相似用户的t时刻行为转移概率矩阵，扩展所述目标用户的t时刻行为转移概率矩阵。

可选的，所述t时刻行为转移概率矩阵的第i行第j列的元素为：在t时刻以前，第i行对应的所述已发生行为与第j列对应的所述已发生行为之间的转移概率；所述矩阵扩展模块350进一步用于：

通过所述相似用户的t时刻行为转移概率矩阵中的扩展行为、所述扩展行为对应的转移概率，扩展所述目标用户的t时刻行为转移概率矩阵；

其中，所述扩展行为是所述目标用户在t时刻以前未发生的行为。

可选的，所述装置还包括：

相似用户确定模块360，用于根据行为特征相似度，确定所述目标用户的相似用户。

可选的，所述根据行为特征相似度，确定所述目标用户的相似用户，包括：对于每个用户，将t时刻以前各自的已发生行为的发生次数按照行为发生的时间顺序排列，作为自身的行为特征；

通过计算每个用户的行为特征之间的相似度，确定与所述目标用户相似度最高的用户为所述目标用户的相似用户。

可选的，根据用户在t时刻以前的行为数据，构建所述用户的t时刻行为转移概率矩阵，包括：

根据用户在t时刻以前的行为数据，确定所述用户在t时刻以前的所有已发生行为；

根据所述已发生行为的发生时间顺序，构建所述用户的t时刻行为转移概率矩阵。

可选的，所述基于所述t时刻行为转移概率矩阵和预设行为影响因素，迭代训练所述目标用户的行为预估模型，包括：

基于所述t时刻行为转移概率矩阵和预设行为影响因素，构建所述目标用户的特征张量；

将所述特征张量作为长短记忆型递归神经网络的输入，迭代训练所述目标用户的行为预估模型。

可选的，所述预设行为影响因素包括以下任意一项或多项：时间因素、地点因素、性别因素。

本申请实施例公开的用户行为预测装置，通过根据目标用户在t时刻以前的行为数据，构建所述目标用户的t时刻行为转移概率矩阵；基于所述t时刻行为转移概率矩阵和预设行为影响因素，迭代训练所述目标用户的行为预估模型；通过所述行为预估模型，基于所述t时刻行为转移概率矩阵、所述预设行为影响因素和前一时刻所述目标用户行为预测结果，预测所述目标用户的下一行为，解决了现有技术中存在预测结果不准确的问题。通过结合用户行为相关的因素和用户的行为转换关系进行行为预测，细化用户的行为粒度，全面考虑用户行为，并结合行为转化概率进行模型训练，有效提升了模型预测的准确性。通过结合用户的实时数据进行迭代训练，得到预测模型，可以不断修正模型的预测结果，进一步提升预测结果的准确性。

通过结合相似用户的行为，对待预测用户的行为进行扩展，并基于扩展后的行为进行模型训练和行为预测，可以预测到用户未发生的行为，不仅提升了预测结果的准确性，同时提高了预测结果的实用性。通过采用LSTM模型，在预测过程中能够考虑到每个用户行为的周期性，更加的合理，预测结果更准确。同时，采用LSTM模型进行预测，基于时间序列的事件预测中，具备更高的准确性，更快的速度，提升了预测效率。

相应的，本申请还公开了一种电子设备，包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如本申请实施例一和实施例二所述的用户行为预测方法。所述电子设备可以为PC机、移动终端、个人数字助理、平板电脑等。

本申请还公开了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本申请实施例一和实施例二所述的用户行为预测方法的步骤。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上对本申请提供的一种用户行为预测方法及装置进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件实现。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

Claims

1.一种用户行为预测方法，其特征在于，包括：

根据目标用户在t时刻以前的行为数据，构建所述目标用户的t时刻行为转移概率矩阵，所述行为转移概率矩阵的行和列是所述目标用户已经发生的行为，所述行为转移概率矩阵表示该行对应的行为和该列对应的行为之间的转移概率；

基于所述t时刻行为转移概率矩阵和预设行为影响因素，将从所述预设行为影响因素中提取的特征、所述t时刻行为转移概率矩阵，构建成一个多维张量，并将所述多维张量作为有记忆性的神经网络模型的输入参数，迭代训练所述目标用户的行为预估模型；

2.根据权利要求1所述的方法，其特征在于，所述根据目标用户在t时刻以前的行为数据，构建所述目标用户的t时刻行为转移概率矩阵的步骤之后，还包括：

根据所述目标用户的相似用户在t时刻以前的行为数据，构建所述相似用户的t时刻行为转移概率矩阵；

通过所述相似用户的t时刻行为转移概率矩阵，扩展所述目标用户的t时刻行为转移概率矩阵。

3.根据权利要求2所述的方法，其特征在于，所述t时刻行为转移概率矩阵的第i行第j列的元素为：在t时刻以前，第i行对应的已发生行为与第j列对应的所述已发生行为之间的转移概率；

所述通过所述相似用户的t时刻行为转移概率矩阵，扩展所述目标用户的t时刻行为转移概率矩阵的步骤，包括：

4.根据权利要求2所述的方法，其特征在于，所述根据所述目标用户的相似用户在t时刻以前的行为数据，构建所述相似用户的t时刻行为转移概率矩阵的步骤之前，还包括：

根据行为特征相似度，确定所述目标用户的相似用户。

5.根据权利要求4所述的方法，其特征在于，所述根据行为特征相似度，确定所述目标用户的相似用户的步骤，包括：

对于每个用户，将t时刻以前各自的已发生行为的发生次数按照行为发生的时间顺序排列，作为自身的行为特征；

6.根据权利要求1至5任一项所述的方法，其特征在于，根据用户在t时刻以前的行为数据，构建所述用户的t时刻行为转移概率矩阵的步骤，包括：

7.根据权利要求1至5任一项所述的方法，其特征在于，所述基于所述t时刻行为转移概率矩阵和预设行为影响因素，迭代训练所述目标用户的行为预估模型的步骤，包括：

8.根据权利要求1至5任一项所述的方法，其特征在于，所述预设行为影响因素包括以下任意一项或多项：时间因素、地点因素、性别因素。

9.一种用户行为预测装置，其特征在于，包括：

目标用户行为转移概率矩阵构建模块，用于根据目标用户在t时刻以前的行为数据，构建所述目标用户的t时刻行为转移概率矩阵，所述行为转移概率矩阵的行和列是所述目标用户已经发生的行为，所述行为转移概率矩阵表示该行对应的行为和该列对应的行为之间的转移概率；

模型训练模块，用于基于所述t时刻行为转移概率矩阵和预设行为影响因素，将从所述预设行为影响因素中提取的特征、所述t时刻行为转移概率矩阵，构建成一个多维张量，并将所述多维张量作为有记忆性的神经网络模型的输入参数，迭代训练所述目标用户的行为预估模型；

10.根据权利要求9所述的装置，其特征在于，还包括：

相似用户行为转移概率矩阵构建模块，用于根据所述目标用户的相似用户在t时刻以前的行为数据，构建所述相似用户的t时刻行为转移概率矩阵；

矩阵扩展模块，用于通过所述相似用户的t时刻行为转移概率矩阵，扩展所述目标用户的t时刻行为转移概率矩阵。

11.根据权利要求10所述的装置，其特征在于，所述t时刻行为转移概率矩阵的第i行第j列的元素为：在t时刻以前，第i行对应的已发生行为与第j列对应的所述已发生行为之间的转移概率；

所述矩阵扩展模块进一步用于：

12.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至8任意一项所述的用户行为预测方法。

13.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1至8任意一项所述的用户行为预测方法的步骤。