CN112700277A

CN112700277A - 用户行为数据的处理方法和多行为序列转化模型训练方法

Info

Publication number: CN112700277A
Application number: CN202011622521.2A
Authority: CN
Inventors: 卢剑锋
Original assignee: Beijing Aibee Technology Co Ltd
Current assignee: Beijing Aibee Technology Co Ltd
Priority date: 2020-12-30
Filing date: 2020-12-30
Publication date: 2021-04-23

Abstract

本申请涉及一种用户行为数据的处理方法、装置、计算机设备和存储介质。该方法包括：对第一特征向量序列进行特征学习，得到预估行为对象的目标行为对应的第二特征向量；第一特征向量序列是基于用户行为转化关系和行为时间依赖关系构建的用户特征向量序列；根据第二特征向量和预设的激活函数，得到第二特征向量中包含的目标行为对应的各行为对象的概率值，作为目标行为对应的行为对象预估结果。采用本方法可以提高行为对象的推荐准确性。

Description

用户行为数据的处理方法和多行为序列转化模型训练方法

技术领域

本申请涉及信息处理技术领域，特别是涉及一种用户行为数据的处理方法、多行为序列转化模训练方法、装置、计算机设备和存储介质。

背景技术

随着网络和电子商务技术的发展，商品信息的数据量飞速增长，在大量的数据信息中用户很难做出决策，基于此，出现了基于历史用户行为的商品推荐技术，该技术获取用户在信息平台的用户行为等相关信息进行用户行为分析，根据得到的用户行为分析结果的不同，为不同类型的用户投放不同的商品或者针对同一商品使用不同的营销策略。

传统的商品推荐技术中，提供了多种对用户行为进行分析的方法。但是，该用户行为分析方法通常只是针对用户的一个行为进行分析，其结果是获得了用户的行为特征。但是未能考虑用户的多种行为，以及多种行为间的转化关系，因此，也就造成了传统的方法推荐的商品不准确。

发明内容

基于此，有必要针对上述技术问题，提供一种用户行为数据的处理方法、装置、计算机设备和存储介质。

一种用户行为数据的处理方法，其特征在于，所述方法包括：

对第一特征向量序列进行特征学习，得到预估行为对象的目标行为对应的第二特征向量；所述第一特征向量序列是基于用户行为转化关系和行为时间依赖关系构建的用户特征向量序列；

根据所述第二特征向量和预设的激活函数，得到所述第二特征向量中包含的目标行为对应的各行为对象的概率值，作为所述目标行为对应的行为对象预估结果。

在其中一个实施例中，所述对第一特征向量序列进行特征学习，得到预估行为对象的目标行为对应的第二特征向量，包括：

根据多行为序列转化模型中的编码层，对第一特征向量序列进行编码处理，学习第一特征向量序列中包含的用户行为转化关系和行为时间依赖关系，得到预估行为对象的目标行为对应的第二特征向量。

根据多行为序列转化模型中的注意力神经网络层，对第一特征向量序列中包含的用户行为转化关系和行为时间依赖关系进行特征学习，得到预估行为对象的目标行为对应的第二特征向量。

在其中一个实施例中，在所述对第一特征向量序列进行编码处理之前，所述方法还包括：

获取目标用户行为序列并输入训练好的多行为序列转化模型，根据所述多行为序列转化模型的嵌入层的转化规则将所述目标用户行为序列转化为对应的第一参数向量序列；

在所述多行为序列转化模型的图网络学习层中抽取所述目标用户行为序列中包含的目标用户的用户行为转化关系集合和行为时间依赖关系集合；

分别根据所述用户行为转化关系集合和所述行为时间依赖关系集合中的每一条关系，得到有向图数据，并根据所述有向图数据计算得到所述每一条关系对应的出度归一化邻接矩阵和入度归一化邻接矩阵；

分别根据所述用户行为转化关系集合和所述行为时间依赖关系集合中的每一条关系对应的第一参数向量，对应的出度归一化邻接矩阵和入度归一化邻接矩阵，结合所述多行为序列转化模型图网络学习层预设的模型参数进行融合计算，得到更新后的第一特征向量序列。

在其中一个实施例中，所述获取用户行为序列，所述在所述多行为序列转化模型的图网络学习层中抽取所述目标用户行为序列中包含的目标用户的用户行为转化关系集合和行为时间依赖关系集合，包括：

通过遍历所述目标用户行为序列中每一目标用户行为数据，确定所述目标用户行为序列中包含的各用户行为间的用户行为转化关系，得到用户行为转化关系集合；

通过识别所述目标用户行为序列中目标行为对应的目标用户行为数据，确定距离最近的两次目标行为间的行为时间依赖关系，得到行为时间依赖关系集合。

在其中一个实施例中，所述分别根据所述用户行为转化关系集合和所述行为时间依赖关系集合中的每一条关系，得到有向图数据，包括：

在所述用户行为转化关系集合中，针对每一条用户行为转化关系，统计所述目标用户行为序列中包含的所述用户行为转化关系的转化次数，将所述用户行为转化关系以及所述转化次数作为第一有向图数据；

根据所述每一条用户行为转化关系对应的所述第一有向图数据中包含的用户行为和所述转化次数，通过归一化计算得到第一出度归一化邻接矩阵和第一入度归一化邻接矩阵；

在所述行为时间依赖关系集合中，针对每一条行为时间依赖关系，统计所述目标用户行为序列中包含的目标行为对应的所述行为时间依赖关系的出现次数，将所述行为时间依赖关系以及所述出现次数作为第二有向图数据；

根据所述每一条行为时间依赖关系对应的所述第二有向图数据中包含的目标行为和所述出现次数，通过归一化计算得到第二出度归一化邻接矩阵和第二入度归一化邻接矩阵。

在其中一个实施例中，提供了一种多行为序列转化模型训练方法，所述方法还包括：

在用户行为序列日志中，获取用户行为序列的训练样本；

将所述用户行为序列的训练样本输入多行为序列转化模型，根据所述多行为序列转化模型的嵌入层的转化规则将所述用户行为序列的训练样本数据转化为对应的第一训练参数向量序列；

在所述多行为序列转化模型的图网络学习层中抽取所述用户行为序列的训练样本中包含的用户行为转化关系训练集合和行为时间依赖关系训练集合；

分别根据所述用户行为转化关系训练集合和所述行为时间依赖关系训练集合中的每一条关系，得到训练有向图数据，并根据所述训练有向图数据计算得到所述每一条关系对应的训练出度归一化邻接矩阵和训练入度归一化邻接矩阵；

分别根据所述每一条关系对应的第一训练参数向量，对应的训练出度归一化邻接矩阵和训练入度归一化邻接矩阵，结合所述图网络学习层中预设的模型参数进行更新融合计算，得到更新后的第一训练特征向量序列；

对所述第一训练特征向量序列进行编码处理，得到预估行为对象的目标行为对应的第二训练特征向量；

根据所述第二训练特征向量和预设的激活函数，得到所述第二训练特征向量中包含的目标行为对应的各行为对象的概率值，作为所述目标行为对应的行为对象的训练预估结果；

根据所述训练预估结果与对照结果及预设的交叉熵损失函数，得到所述训练预估结果的训练评价结果，并根据所述训练评价结果对所述多行为序列转化模型的所述模型参数进行调整。

在其中一个实施例中，所述在用户行为序列日志中，获取用户行为序列的训练样本，包括：

在用户行为序列日志中，依次选取用户行为数据构成的训练样本，每次所选取的训练样本中的用户行为数据是由上一次选取训练样本中的用户行为数据加上本次选取预设数量的用户行为数据合并得到的。

在其中一个实施例中，所述对所述第一训练特征向量序列进行编码处理，得到预估行为对象的目标行为对应的第二训练特征向量，包括：

在所述第一训练特征向量序列前添加辅助的第二训练参数向量，得到更新的第一训练特征向量序列；

对所述更新的第一训练特征向量序列进行编码处理，建立所述第二训练参数向量与所述第一训练特征向量序列中除所述第二训练参数向量外其他第一训练特征向量之间的用户行为转化关系和行为时间依赖关系，得到预估行为对象的目标行为对应的第二训练特征向量。

一种用户行为数据的处理装置，所述装置包括：

特征学习模块，用于对第一特征向量序列进行编码处理，得到预估行为对象的目标行为对应的第二特征向量；所述第一特征向量序列是基于用户行为转化关系和时间依赖关系构建的用户特征向量序列；

输出模块，用于根据所述第二特征向量和预设的激活函数，得到所述第二特征向量中包含的目标行为对应的各行为对象的概率值，作为所述目标行为对应的行为对象预估结果。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

对第一特征向量序列进行编码处理，得到预估行为对象的目标行为对应的第二特征向量；所述第一特征向量序列是基于用户行为转化关系和时间依赖关系构建的用户特征向量序列；

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

上述用户行为数据的处理方法、装置、计算机设备和存储介质，该方法包括：对第一特征向量序列进行编码处理，得到预估行为对象的目标行为对应的第二特征向量；所述第一特征向量序列是基于用户行为转化关系和时间依赖关系构建的用户特征向量序列；根据所述第二特征向量和预设的激活函数，得到所述第二特征向量中包含的目标行为对应的各行为对象的概率值，作为所述目标行为对应的行为对象预估结果。采用本方法通过学习用户行为序列中的用户行为转化关系和行为时间依赖关系，对用户目标行为的行为对象进行预测，提高了行为对象的推荐准确性。

附图说明

图1为一个实施例中用户行为数据的处理方法的流程示意图；

图2为一个实施例中获取用户行为序列的步骤的流程示意图；

图3为一个实施例中在用户行为序列中抽取关系的步骤的流程示意图；

图4为一个实施例中求解有向图数据的具体步骤的流程示意图；

图5为一个实施例中用户行为转化关系集合对应的第一有向图；

图6为一个实施例中行为时间依赖关系集合对应的第二有向图；

图7为一个实施例中训练多行为序列转化模型的流程示意图；

图8为一个实施例中编码层对第一训练特征向量序列编码的流程示意图；

图9为一个实施例中用户行为数据的处理装置的结构框图；

图10为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

在一个实施例中，如图1所示，提供了一种用户行为数据的处理方法，本实施例以该方法应用于终端进行举例说明，可以理解的是，该方法也可以应用于服务器，还可以应用于包括终端和服务器的系统，并通过终端和服务器的交互实现。本实施例中，该方法包括以下步骤：

步骤101，对第一特征向量序列进行特征学习，得到预估行为对象的目标行为对应的第二特征向量；第一特征向量序列是基于用户行为转化关系和时间依赖关系构建的用户特征向量序列。

在实施中，用户行为序列中包含用户行为转化关系和行为时间依赖关系，因此，计算机设备可以得到基于用户行为转化关系和行为时间依赖关系的第一特征向量序列，然后，计算机设备对第一特征向量序列进行特征学习，可以得到学习了第一特征向量中包含的用户行为转化关系和行为时间依赖关系信息的预估行为对象的目标行为对应的第二特征向量。

步骤102，根据第二特征向量和预设的激活函数，得到第二特征向量中包含的目标行为对应的各行为对象的概率值，作为目标行为对应的行为对象预估结果。

在实施中，在多行为序列转化模型的输出层中，计算机设备根据第二特征向量u₀和预设的激活函数softmax，得到第二特征向量中包含的目标行为对应的各行为对象的概率值，作为目标行为对应的行为对象预估结果。其中，目标行为对应的行为对象可以为用户所处平台内包含的全部行为对象，不局限于用户行为序列中的行为对象类型。

可选的，输出层可以直接是一层softmax激活网络层，也可以包含一个或者多个隐藏层，本申请实施例不做限定。

可选的，若用户所处平台对应的行为对象种类较多，为了提高计算的效率，多行为序列转化模型的输出层可以选择Hierarchical softmax霍夫曼树方法。

上述用户行为数据的处理方法中，对第一特征向量序列进行编码处理，得到预估行为对象的目标行为对应的第二特征向量；第一特征向量序列是基于用户行为转化关系和行为时间依赖关系构建的用户特征向量序列；根据第二特征向量和预设的激活函数，得到第二特征向量中包含的目标行为对应的各行为对象的概率值，作为目标行为对应的行为对象预估结果。采用本方法通过学习用户行为序列中的用户行为转化关系和行为时间依赖关系，对用户目标行为的行为对象进行预测，提高了行为对象的推荐准确性，进而提高用户行为的转化率。

在一个实施例中，步骤101的具体处理过程为：根据多行为序列转化模型中的编码层，对第一特征向量序列进行编码处理，学习第一特征向量序列中包含的用户行为转化关系和行为时间依赖关系，得到预估行为对象的目标行为对应的第二特征向量。

具体地，计算机设备基于多行为序列转化模型中的transformer编码层(即Transformer encoder层)，对第一特征向量序列进行transformer编码处理，得到预估行为对象的目标行为对应的第二特征向量。

在另一个实施例中，步骤101的具体处理过程为：根据多行为序列转化模型中的注意力神经网络层，对第一特征向量序列中包含的用户行为转化关系和行为时间依赖关系进行特征学习，得到预估行为对象的目标行为对应的第二特征向量。

具体地，根据多行为序列转化模型中的attention网络层，对第一特征向量序列中包含的用户行为转化关系和行为时间依赖关系进行学习，将第一特征向量序列：[v(p_s1,e_s1),v(p_s2,e_s2),...,v(p_sn,p_sn)]输入attention层，根据attention层的计算输出u₀＝∑_iα_iv(p_si,e_si)，其中，α_i为attention层的权重系数，具体计算公式为

α_i＝g(v(p_si,e_si))

在一个实施例中，如图2所示，在步骤101之前，该方法还包括：

步骤201，获取目标用户行为序列并输入训练好的多行为序列转化模型，根据多行为序列转化模型的嵌入层的转化规则将目标用户行为序列转化为对应的第一参数向量序列。

在实施中，计算机设备获取目标用户行为序列，然后将目标用户行为序列输入训练好的多行为序列转化模型中，根据该多行为序列转化模型中嵌入层的转化规则，将目标用户行为序列中的每一条用户行为数据(或称为用户行为与行为对象的行为组)转化为对应的第一参数向量，得到第一参数向量序列，其中，第一参数向量为多行为序列转化模型可识别的用户行为与行为对象组成的二维参数向量，第一参数向量序列中第一参数向量按照时间逆序进行排序。

具体地，获取的目标用户行为序列的时长根据不同推荐场景进行具体限定，可以但不限于为一天、一个小时或者一周。

例如，获取到的用户行为序列如下所示：

user_id,event_type,item_id,time

U_001,click,P_001,2020-07-20 15:20:30

U_001,click,P_003,2020-07-20 15:21:50

U_001,click,P_004,2020-07-20 15:22:11

U_001,click,P_003,2020-07-20 15:22:36

U_001,collect,P_003,2020-07-20 15:22:43

U_001,click,P_004,2020-07-20 15:23:32

U_001,click,P_005,2020-07-20 15:23:51

U_001,collect,P_001,2020-07-20 15:24:13

U_001,buy,P_003,2020-07-20 15:25:40

U_001,click,P_002,2020-07-21 14:20:21

U_001,click,P_003,2020-07-21 14:20:35

U_001,buy,P_001,2020-07-21 14:21:10

U_001,click,P_004,2020-07-21 14:21:55

U_001,collect,P_004,2020-07-21 14:22:31

U_001,click,P_001,2020-07-21 14:23:32

U_001,click,P_003,2020-07-21 14:23:52

U_001,click,P_005,2020-07-21 14:24:13

U_001,buy,P_005,2020-07-21 14:25:41

其中，该用户行为序列中的user(用户指标)下U_001表示目标用户， event_type(事件类型指标)下的用户行为包括：click(点击)、collect(收藏) 和buy(购买)；item_id,(商品标识)下的行为对象包括：P_001,P_002,P_003, P_004,P_005；time(时间指标)下为每条用户行为数据对应的时间戳信息。

计算机设备将目标用户(U_001)的行为序列输入训练好的多行为序列转化模型的Item embedding层(嵌入层)中，其中，针对用户行为序列中每一条用户行为数据，都对应一组用户行为组(p_si,e_si)，则用户行为序列对应一个行为组序列，例如，用户行为序列对应的行为组可以表示为：[(p_s1,e_s1),(p_s2,e_s2),...,(p_sn,e_sn)]，其中，p_sn表示行为对象标识(如，商品id)，e_sn表示用户行为(如，购买行为)，下角标sn表示该用户行为序列的序列数目。行为组(p_s1,e_s1)含义为对行为对象p_s1执行e_s1行为。具体地，用户行为e_s1为“点击”，行为对象p_s1为“商品1”，则其含义为目标用户对商品1进行点击操作。计算机设备在该Item embedding层的参数词典中查询并转化每一个行为组为对应的模型可识别的第一参数向量v(p_i,e_i)，其中，p_i与p_si的对应关系，即为表示相同的行为对象，e_i与e_si的对应关系，即为表示相同的用户行为。

可选的，参数词典为包含用户所处应用平台的所有用户可执行行为与该平台所有行为对象组成的参数向量的可查询词典，例如，以某一商品平台为例，在该商品平台用户所有可执行的用户行为有：点击、收藏、购买；该商品平台包含的商品种类(行为对象)为10000种，则该商品平台对应的参数词典的参数向量容量即为30000个，每一参数向量即对应唯一的一组用户行为和行为对象。

步骤202，在多行为序列转化模型的图网络学习层中抽取目标用户行为序列中包含的目标用户的用户行为转化关系集合和行为时间依赖关系集合。

在实施中，计算机设备在多行为序列转化模型的图网络学习层(Gated-GNN，Gated-Gated Graph Neural Network)中抽取目标用户行为序列中包含的目标用户的用户行为转化关系集合和行为时间依赖关系集合。

具体地，计算机设备的图网络学习层(Gated-GNN)中，在由该目标用户行为序列中进行抽取，获取其中包含的全部用户行为转化关系，其中，例如，目标用户行为序列中：第一条用户行为数据中包含的：click,P_001与第五条用户行为数据中包含的collect,P_003之间的用户行为转化关系为click→collect。按照同样的方法，计算机设备可以获取到用户行为转化关系click→buy和collect→buy。由于click和collect行为都存在到buy的转化关系，因此，在该用户行为序列中 buy行为之前的连续的每一条用户行为数据中的click和collect行为都对应符合 click→buy和collect→buy的转化关系，由此该用户行为序列对应的包含3种类型的用户行为转化关系，得到用户行为序列转化关系集合。

然后，计算机设备以用户行为中的buy(购买)行为作为目标行为，则第九条用户行为数据中包含的目标行为buy与第十二条用户行为数据中包含目标行为(buy)间存在时间依赖关系，表示为buy→buy。

步骤203，分别根据用户行为转化关系集合和行为时间依赖关系集合中的每一条关系，得到有向图数据，并根据有向图数据计算得到每一条关系对应的出度归一化邻接矩阵和入度归一化邻接矩阵。

在实施中，计算机设备分别根据用户行为转化关系集合和行为时间依赖关系集合中的每一条关系，得到有向图数据，并根据有向图数据计算得到每一条关系对应的出度归一化邻接矩阵和入度归一化邻接矩阵。

步骤204，分别根据用户行为转化关系集合和行为时间依赖关系集合中的每一条关系对应的第一参数向量，对应的出度归一化邻接矩阵和入度归一化邻接矩阵，结合多行为序列转化模型图网络学习层预设的模型参数进行融合计算，得到更新后的第一特征向量序列。

在实施中，计算机设备基于多行为转化序列模型中的图网络学习层 (Gated-GNN层)，分别根据用户行为转化关系集合和行为时间依赖关系集合中的每一条关系对应的第一参数向量，对应的出度归一化邻接矩阵和入度归一化邻接矩阵，结合预设的模型参数进行融合计算，得到更新后的第一特征向量序列。

具体地，计算机设备根据每一条关系对应的第一参数向量v(p_i，e_i)，出度归一化邻接矩阵Aout_rk和入度归一化邻接矩阵Ain结合预设的模型参数

和

得到更新后的第一特征向量序列，结合融合函数得到如下融合结果：

其中，

表示融合结果，

为对应出度归一化邻接矩阵对应的权重系数，

为入度归一化邻接矩阵对应的权重系数，b_e为常量偏置权重系数；t和t-1表示对应的迭代次数。

然后，计算机设备将该融合结果

输入Gated-GNN模型，该Gated-GNN 模型具体可以采用RNN(Recurrent Neural Network,RNN，循环神经网络层)方法，RNN层将该融合结果根据预设的更新函数进行更新，可以得到每一参数向量v(p_i,e_i)对应的第一特征向量v′(p_i,e_i)。具体的更新函数如下所示：

可选的，RNN层的应用方法还可以选择LSTM(长短期记忆网络，Long Short-TermMemory networks)或GRU(门控循环单元网络，Gated Recurrent Unit networks)，本申请实施例不做限定。

在一个实施例中，如图3所示，步骤202的具体处理过程如下所示：

步骤301，通过遍历目标用户行为序列中每一目标用户行为数据，确定目标用户行为序列中包含的各用户行为间的用户行为转化关系，得到用户行为转化关系集合；

在实施中，计算机设备通过遍历用户行为序列中每一目标用户行为数据，确定目标用户行为序列中包含的各用户行为间的用户行为转化关系，得到用户行为转化关系集合。

例如，用户行为序列中第一条用户行为数据(行为组)为：点击—商品1；第二条用户行为数据为：收藏—商品2；第三条用户行为数据为：点击—商品3。则抽取得到其中包含的一条用户行为转化关系为：点击—收藏(click→collect)，由此，用户行为序列包含的全部用户行为转化关系对应得到用户行为转化关系集合。

步骤302，通过识别目标用户行为序列中目标行为对应的目标用户行为数据，确定距离最近的两次目标行为间的行为时间依赖关系，得到行为时间依赖关系集合。

在实施中，计算机设备通过识别目标用户行为序列(原始输入的用户行为序列)中目标行为对应的目标用户行为数据，确定距离(例如，序列的时间间隔距离)最近的两次目标行为(click点击行为)为一条行为时间依赖关系 (click-click)，进而全部的行为时间依赖关系得到行为时间依赖关系集合。

具体地，若需要预估用户下一次点击行为对应的行为对象(商品)，则点击行为即为目标行为，故目标行为间的时间依赖关系为：购买—购买，表示为前一次购买操作与后一次购买操作存在时间依赖关系。由此，可以得到行为时间依赖关系集合。

在一个实施例中，如图4所示，步骤203的具体处理过程如下所示：

步骤401，在用户行为转化关系集合中，针对每一条用户行为转化关系，统计目标用户行为序列中包含的用户行为转化关系的转化次数，将用户行为转化关系以及转化次数作为第一有向图数据。

在实施中，在用户行为转化关系集合中，计算机设备针对每一条用户行为转化关系(例如，click→collect)，统计目标用户行为序列中包含的该用户行为转化关系的转化次数，将用户行为转化关系以及转化次数作为第一有向图数据。

具体地，如图5所示，计算机设备根据用户行为转化关系集合中某一条用户行为转化关系(如，click→collect)可以得到第一有向图。第一有向图中的用户行为间的转化关系可以根据该用户行为关系中对应的行为对象进行指向，第一有向图中每条指向箭头上的数字代表该行为对象间对应的用户行为转化关系的转化次数。进而根据该第一有向图中的转化次数和行为对象，可以确定出第一有向图数据。

步骤402，根据每一条用户行为转化关系对应的第一有向图数据中包含的用户行为和转化次数，通过归一化计算得到第一出度归一化邻接矩阵和第一入度归一化邻接矩阵。

在实施中，计算机设备根据每一条用户行为转化关系对应的第一有向图数据中包含的用户行为和转化次数，通过归一化计算得到第一出度归一化邻接矩阵和第一入度归一化邻接矩阵。

具体地，根据上述步骤301中的一条用户行为转化关系，即click(点击操作)-collect(收藏操作)的第一有向图数据经过归一化算法得到的第一出度归一化邻接矩阵Aout₁和第一入度归一化邻接矩阵Ain₁分别为：

(第一出度归一化邻接矩阵)

(第一入度归一化邻接矩阵)

可选地，对于用户行为转化关系集合中其他行为转化关系例如，click→buy，均可以对应得到出度归一化邻接矩阵和入度归一化邻接矩阵，本实施例不再赘述。

步骤403，在行为时间依赖关系集合中，针对每一条行为时间依赖关系，统计目标用户行为序列中包含的目标行为对应的行为时间依赖关系的出现次数，将行为时间依赖关系以及出现次数作为第二有向图数据。

在实施中，计算机设备在行为时间依赖关系集合中，针对每一条行为时间依赖关系，统计目标用户行为序列中包含的目标行为对应的该行为时间依赖关系的出现次数，将行为时间依赖关系以及统计的出现次数，作为第二有向图数据。

具体的，如图6所示，计算机设备根据行为时间依赖关系集合中的某一条行为时间依赖关系(click-click)可以得到第二有向图。第二有向图中的行为时间依赖关系可以根据行为时间依赖关系对应的行为对象进行指向，第二有向图中每条指向箭头上的数字代表行为时间依赖关系出现的次数。进而根据该第二有向图中的行为时间依赖关系的出现次数和行为对象，可以确定出第二有向图数据。

步骤404，根据每一条行为时间依赖关系对应的第二有向图数据中包含的目标行为和出现次数，通过归一化计算得到第二出度归一化邻接矩阵和第二入度归一化邻接矩阵。

在实施中，计算机设备根据每一条行为时间依赖关系对应的第二有向图数据中包含的目标行为和出现次数，通过归一化计算得到第二出度归一化邻接矩阵和第二入度归一化邻接矩阵。

具体地，根据上述步骤302中的一条行为时间依赖关系的第二有向图数据经过归一化算法得到的第二出度归一化邻接矩阵Aout₂和第二入度归一化邻接矩阵Ain₂分别为：

(第二出度归一化邻接矩阵)

(第二入度归一化邻接矩阵)

在一个实施例中，如图7所示，提供了一种多行为序列转化模型的模型训练方法，该方法还包括：

步骤701，在用户行为序列日志中，获取用户行为序列的训练样本。

在实施中，在用户行为序列日志中，获取用户行为序列的训练样本，其中，用户行为序列日志中包含全网不同用户历史行为序列数据。

步骤702，将用户行为序列的训练样本输入多行为序列转化模型，根据多行为序列转化模型的嵌入层的转化规则将用户行为序列的训练样本数据转化为对应的第一训练参数向量序列。

在实施中，计算机设备将用户行为序列的训练样本输入多行为序列转化模型中，根据多行为序列转化模型的嵌入层的转化规则将用户行为序列的训练样本数据转化为对应的第一训练参数向量序列，具体的处理过程与上述201中将目标用户行为序列中的数据转化为第一参数向量序列相同，本实施例不再赘述。

步骤703，在多行为序列转化模型的图网络学习层中抽取用户行为序列的训练样本中包含的用户行为转化关系训练集合和行为时间依赖关系训练集合。

在实施中，计算机设备在多行为序列转化模型的图网络学习层(Gated-CNN 层)中抽取用户行为序列的训练样本中包含的用户行为转化关系(训练)集合和行为时间依赖关系(训练)集合，具体关系抽取过程，与上述步骤202相同，该步骤703与步骤202的区别仅为是模型训练过程，而非模型应用过程，但是多行为序列转化模型对于训练数据和应用数据的处理过程是相同的，故本实施例不再赘述。

步骤704，分别根据用户行为转化关系训练集合和行为时间依赖关系训练集合中的每一条关系，得到训练有向图数据，并根据训练有向图数据计算得到每一条关系对应的训练出度归一化邻接矩阵和训练入度归一化邻接矩阵。

在实施中，计算机设备分别根据用户行为转化关系训练集合和行为时间依赖关系训练集合中的每一条关系，得到训练有向图数据，并根据训练有向图数据计算得到每条关系对应的训练出度归一化邻接矩阵和入度归一化邻接矩阵。 (用户行为转化关系对应的：第一训练出度归一化邻接矩阵和第一入度归一化邻接矩阵；行为时间依赖关系对应的：第二训练出度归一化邻接矩阵和第二入度归一化邻接矩阵)。

步骤705，分别根据每一条关系对应的第一训练参数向量，对应的训练出度归一化邻接矩阵和训练入度归一化邻接矩阵，结合图网络学习层中预设的模型参数进行更新融合计算，得到更新后的第一训练特征向量序列。

在实施中，计算机设备分别根据每一条关系对应的第一训练参数向量，对应的训练出度归一化邻接矩阵和训练入度归一化邻接矩阵，结合图网络学习层中预设的模型参数进行更新融合计算，得到更新后的第一训练特征向量序列。

步骤706，对第一训练特征向量序列进行编码处理，得到预估行为对象的目标行为对应的第二训练特征向量。

在实施中，计算机设备对第一训练特征向量序列进行编码处理，得到预估行为对象的目标行为对应的第二训练特征向量。

可选的，本实施例中对于第一特征向量序列的特征学习选用的是transformer 编码层的编码处理，得到预估行为对象的目标行为对应的第二训练特征向量，也可以选用attention网络层进行第一特征向量序列的特征学习，本实施例不做限定。

步骤707，根据第训练二特征向量和预设的激活函数，得到第二训练特征向量中包含的目标行为对应的各行为对象的概率值，作为目标行为对应的行为对象的训练预估结果。

在实施中，计算机设备根据第二训练特征向量和预设的激活函数，得到第二训练特征向量中包含的目标行为对应的各行为对象的概率值，作为目标行为对应的行为对象的训练预估结果。

步骤708，根据训练预估结果与对照结果及预设的交叉熵损失函数，得到训练预估结果的训练评价结果，并根据训练评价结果对多行为序列转化模型的模型参数进行调整。

在实施中，计算机设备根据训练预估结果(或称为训练推荐结果)与对照结果及预设的交叉熵损失函数(Multiclass cross entropy)，得到训练预估结果的训练评价结果，并根据训练评价结果对多行为序列转化模型的模型参数或模型迭代次数进行调整。

具体地，预设的交叉熵损失函数L如下所示：

其中，y_i代表真实用户行为序列日志中用户是否购买(目标行为)第i个行为对象的行为结果，取值为0(未购买)或者1(购买)，

代表多行为转化序列模型的训练预估结果。

本实施例中，计算机设备通过构建包含用户行为转化关系、行为时间依赖关系的训练样本作为多行为序列转化模型的输入值，用于多行为序列转化模型学习用户行为间的转化关系和行为时间依赖关系，提高模型对目标行为的行为对象的推荐准确性，进而提高用户行为的转化率。

在一个实施例中，步骤701的具体处理过程如下所示：

在实施中，在用户行为序列日志中，计算机设备依次选取用户行为数据构成的训练样本，每次所选取的训练样本中的用户行为数据是由上一次选取训练样本汇总的用户行为数据加上本次选取预设数量的用户行为数据合并得到的。

具体地，例如，每一训练样本中除去作为因变量的用户行为数据外，作为自变量的用户行为数据不能少于1条(即第二预设数目为1)，则设最小训练样本的样本容量(仅以自变量数据计算)ns＝1，按照每一训练样本为连续的用户行为序列构成的样本为原则，则可以得到n-ns个训练样本，具体的，ns＝1时，构建的训练样本为：训练样本1：{X＝[(P_001,click)],Y＝(P_003,buy)}，训练样本 2：{X＝[(P_001,click)、(P_003,click)],Y＝(P_003,buy)}；训练样本3： {X＝[(P_001,click)、(P_003,click)、(P_004,click)],Y＝(P_003,buy)}…以此类推，得到预设数目n-ns个训练样本。

在一个实施例中，如图8所示，步骤706的具体处理过程如下所示：

步骤801，在第一训练特征向量序列前添加辅助的第二训练参数向量，得到更新的第一训练特征向量序列。

在实施中，计算机设备在第一训练特征向量序列v(p_s1,e_s1),v(p_s2,e_s2),...,v(p_sn,e_sn) 之前添加辅助第二训练参数向量(也称为虚拟参数向量)v₀，得到更新后的第一训练特征向量序列[v₀,v(p_s1,e_s1),v(p_s2,e_s2),...,v(p_sn,e_sn)]。

具体的，计算机设备根据Gated-GNN层输出的第一训练特征向量序列以及预设的虚拟向量v₀，得到编码层(Transformer encoder层)的输入向量序列(也即更新的第一特征向量序列)：[v₀,v(p_s1,e_s1),v(p_s2,e_s2),...,v(p_sn,e_sn)]。

步骤802，对更新的第一训练特征向量序列进行编码处理，建立第二训练参数向量与第一训练特征向量序列中除第二训练参数向量外其他第一训练特征向量之间的用户行为转化关系和行为时间依赖关系，得到预估行为对象的目标行为对应的第二训练特征向量。

在实施中，计算机设备对更新的第一训练特征向量序列进行编码处理，建立第二训练参数向量与第一训练特征向量序列中除第二训练参数向量外其他第一训练特征向量之间的用户行为转化关系和行为时间依赖关系，得到预估行为对象的目标行为对应的第二训练特征向量u₀。可选地，该目标行为对应的第二训练特征向量u₀中包含目标行为和用户所处平台全部的商品类型信息。

应该理解的是，虽然图1-4,7-8的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图1-4,7-8中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图9所示，提供了一种用户行为数据的处理装置900，包括：特征学习模块910和输出模块920，其中：

特征学习模块910，用于对第一特征向量序列进行特征学习，得到预估行为对象的目标行为对应的第二特征向量；所述第一特征向量序列是基于用户行为转化关系和时间依赖关系构建的用户特征向量序列。

输出模块920，用于根据所述第二特征向量和预设的激活函数，得到所述第二特征向量中包含的目标行为对应的各行为对象的概率值，作为所述目标行为对应的行为对象预估结果。

在其中一个实施例中，特征学习模块910具体用于根据多行为序列转化模型中的编码层，对第一特征向量序列进行编码处理，学习第一特征向量序列中包含的用户行为转化关系和行为时间依赖关系，得到预估行为对象的目标行为对应的第二特征向量。

在其中一个实施例中，特征学习模块910具体用于根据多行为序列转化模型中的注意力神经网络层，对第一特征向量序列中包含的用户行为转化关系和行为时间依赖关系进行特征学习，得到预估行为对象的目标行为对应的第二特征向量。

在其中一个实施例中，该装置900还包括：

获取模块，用于获取目标用户行为序列并输入训练好的多行为序列转化模型，根据所述多行为序列转化模型的嵌入层的转化规则将所述目标用户行为序列转化为对应的第一参数向量序列；

关系抽取模块，用于在所述多行为序列转化模型的图网络学习层中抽取所述目标用户行为序列中包含的目标用户的用户行为转化关系集合和行为时间依赖关系集合；

数据处理模块，用于分别根据所述用户行为转化关系集合和所述行为时间依赖关系集合中的每一条关系，得到有向图数据，并根据所述有向图数据计算得到所述每一条关系对应的出度归一化邻接矩阵和入度归一化邻接矩阵；

更新模块，用于分别根据所述用户行为转化关系集合和所述行为时间依赖关系集合中的每一条关系对应的第一参数向量，对应的出度归一化邻接矩阵和入度归一化邻接矩阵，结合所述多行为序列转化模型图网络学习层预设的模型参数进行融合计算，得到更新后的第一特征向量序列。

在其中一个实施例中，关系抽取模块具体用于通过遍历所述目标用户行为序列中每一目标用户行为数据，确定目标用户行为序列中包含的各用户行为间的用户行为转化关系，得到用户行为转化关系集合；

在其中一个实施例中，数据处理模块具体用于在所述用户行为转化关系集合中，针对每一条用户行为转化关系，统计所述目标用户行为序列中包含的所述用户行为转化关系的转化次数，将所述用户行为转化关系以及所述转化次数作为第一有向图数据；

上述用户行为数据的处理装置900，特征学习模块910，用于对第一特征向量序列进行特征学习，得到预估行为对象的目标行为对应的第二特征向量；所述第一特征向量序列是基于用户行为转化关系和时间依赖关系构建的用户特征向量序列。输出模块920，用于根据所述第二特征向量和预设的激活函数，得到所述第二特征向量中包含的目标行为对应的各行为对象的概率值，作为所述目标行为对应的行为对象预估结果。采用本装置通过学习用户行为序列中的用户行为转化关系和行为时间依赖关系，对用户目标行为的行为对象进行预测，提高了行为对象的推荐准确性，进而提高用户行为的转化率。

在其中一个实施例中，提供了一种多行为序列转化模型的训练装置，该装置包括：

获取模块，还用于在用户行为序列日志中，获取用户行为序列的训练样本；

查询转化模块，用于将所述用户行为序列的训练样本输入多行为序列转化模型，根据所述多行为序列转化模型的嵌入层的转化规则将所述用户行为序列的训练样本数据转化为对应的第一训练参数向量序列；

关系抽取模块，还用于在所述多行为序列转化模型的图网络学习层中抽取所述用户行为序列的训练样本中包含的用户行为转化关系训练集合和行为时间依赖关系训练集合；

数据处理模块，还用于分别根据所述用户行为转化关系训练集合和所述行为时间依赖关系训练集合中的每一条关系，得到训练有向图数据，并根据所述训练有向图数据计算得到所述每一条关系对应的训练出度归一化邻接矩阵和训练入度归一化邻接矩阵；

更新模块，还用于分别根据所述每一条关系对应的第一训练参数向量，对应的训练出度归一化邻接矩阵和训练入度归一化邻接矩阵，结合所述图网络学习层中预设的模型参数进行更新融合计算，得到更新后的第一训练特征向量序列；

特征学习模块，还用于对所述第一训练特征向量序列进行编码处理，得到预估行为对象的目标行为对应的第二训练特征向量；

输出模块，还用于根据所述第二特征向量和预设的激活函数，得到所述第二特征向量中包含的目标行为对应的各行为对象的概率值，作为所述目标行为对应的行为对象的训练预估结果；

训练调整模块，用于根据所述训练预估结果与对照结果及预设的交叉熵损失函数，得到所述训练预估结果的训练评价结果，并根据所述训练评价结果对所述多行为序列转化模型的所述模型参数进行调整。

在其中一个实施例中，获取模块，具体用于在用户行为序列日志中，依次选取用户行为数据构成的训练样本，每次所选取的训练样本中的用户行为数据是由上一次选取训练样本中的用户行为数据加上本次选取预设数量的用户行为数据合并得到的。

在其中一个实施例中，特征学习模块具体用于在所述第一训练特征向量序列前添加辅助的第二训练参数向量，得到更新的第一训练特征向量序列；

关于用户行为数据的处理装置900的具体限定可以参见上文中对于用户行为数据的处理方法的限定，在此不再赘述。上述用户行为数据的处理装置900 中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信，无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种用户行为数据的处理方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图10中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现以下步骤：

对第一特征向量序列进行特征学习，得到预估行为对象的目标行为对应的第二特征向量；第一特征向量序列是基于用户行为转化关系和行为时间依赖关系构建的用户特征向量序列；

根据第二特征向量和预设的激活函数，得到第二特征向量中包含的目标行为对应的各行为对象的概率值，作为目标行为对应的行为对象预估结果。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：

获取目标用户行为序列并输入训练好的多行为序列转化模型，根据多行为序列转化模型的嵌入层的转化规则将目标用户行为序列转化为对应的第一参数向量序列；

在多行为序列转化模型的图网络学习层中抽取目标用户行为序列中包含的目标用户的用户行为转化关系集合和行为时间依赖关系集合；

分别根据用户行为转化关系集合和行为时间依赖关系集合中的每一条关系，得到有向图数据，并根据有向图数据计算得到每一条关系对应的出度归一化邻接矩阵和入度归一化邻接矩阵；

分别根据用户行为转化关系集合和行为时间依赖关系集合中的每一条关系对应的第一参数向量，对应的出度归一化邻接矩阵和入度归一化邻接矩阵，结合多行为序列转化模型图网络学习层预设的模型参数进行融合计算，得到更新后的第一特征向量序列。

通过遍历目标用户行为序列中每一目标用户行为数据，确定目标用户行为序列中包含的各用户行为间的用户行为转化关系，得到用户行为转化关系集合；

通过识别目标用户行为序列中目标行为对应的目标用户行为数据，确定距离最近的两次目标行为间的行为时间依赖关系，得到行为时间依赖关系集合。

在用户行为转化关系集合中，针对每一条用户行为转化关系，统计目标用户行为序列中包含的用户行为转化关系的转化次数，将用户行为转化关系以及转化次数作为第一有向图数据；

根据每一条用户行为转化关系对应的第一有向图数据中包含的用户行为和转化次数，通过归一化计算得到第一出度归一化邻接矩阵和第一入度归一化邻接矩阵；

在行为时间依赖关系集合中，针对每一条行为时间依赖关系，统计目标用户行为序列中包含的目标行为对应的行为时间依赖关系的出现次数，将行为时间依赖关系以及出现次数作为第二有向图数据；

根据每一条行为时间依赖关系对应的第二有向图数据中包含的目标行为和出现次数，通过归一化计算得到第二出度归一化邻接矩阵和第二入度归一化邻接矩阵。

在用户行为序列日志中，获取用户行为序列的训练样本；

将用户行为序列的训练样本输入多行为序列转化模型，根据多行为序列转化模型的嵌入层的转化规则将用户行为序列的训练样本数据转化为对应的第一训练参数向量序列；

在多行为序列转化模型的图网络学习层中抽取用户行为序列的训练样本中包含的用户行为转化关系训练集合和行为时间依赖关系训练集合；

分别根据用户行为转化关系训练集合和行为时间依赖关系训练集合中的每一条关系，得到训练有向图数据，并根据训练有向图数据计算得到每一条关系对应的训练出度归一化邻接矩阵和训练入度归一化邻接矩阵；

分别根据每一条关系对应的第一训练参数向量，对应的训练出度归一化邻接矩阵和训练入度归一化邻接矩阵，结合图网络学习层中预设的模型参数进行更新融合计算，得到更新后的第一训练特征向量序列；

对第一训练特征向量序列进行编码处理，得到预估行为对象的目标行为对应的第二训练特征向量；

根据第二特征向量和预设的激活函数，得到第二特征向量中包含的目标行为对应的各行为对象的概率值，作为目标行为对应的行为对象的训练预估结果；

根据训练预估结果与对照结果及预设的交叉熵损失函数，得到训练预估结果的训练评价结果，并根据训练评价结果对多行为序列转化模型的模型参数进行调整。

在第一训练特征向量序列前添加辅助的第二训练参数向量，得到更新的第一训练特征向量序列；

对更新的第一训练特征向量序列进行编码处理，建立第二训练参数向量与第一训练特征向量序列中除第二训练参数向量外其他第一训练特征向量之间的用户行为转化关系和行为时间依赖关系，得到预估行为对象的目标行为对应的第二训练特征向量。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时可以实现上述方法记载的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory，ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic Random Access Memory，DRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种用户行为数据的处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述对第一特征向量序列进行特征学习，得到预估行为对象的目标行为对应的第二特征向量，包括：

根据多行为序列转化模型中的编码层，对第一特征向量序列进行编码处理，学习第一特征向量序列中包含的用户行为转化关系和行为时间依赖关系，得到预估行为对象的目标行为对应的第二特征向量；

或，根据多行为序列转化模型中的注意力神经网络层，对第一特征向量序列中包含的用户行为转化关系和行为时间依赖关系进行特征学习，得到预估行为对象的目标行为对应的第二特征向量。

3.根据权利要求1所述的方法，其特征在于，在所述对第一特征向量序列进行编码处理之前，所述方法还包括：

4.根据权利要求3所述的方法，其特征在于，所述在所述多行为序列转化模型的图网络学习层中抽取所述目标用户行为序列中包含的目标用户的用户行为转化关系集合和行为时间依赖关系集合，包括：

5.根据权利要求3所述的方法，其特征在于，所述分别根据所述用户行为转化关系集合和所述行为时间依赖关系集合中的每一条关系，得到有向图数据，包括：

在所述用户行为转化关系集合中，针对每一条用户行为转化关系，统计所述目标用户行为中包含的所述用户行为转化关系的转化次数，将所述用户行为转化关系以及所述转化次数作为第一有向图数据；

6.一种多行为序列转化模型的训练方法，其特征在于，所述方法还包括：

在用户行为序列日志中，获取用户行为序列的训练样本；

7.根据权利要求6所述的方法，其特征在于，所述在用户行为序列日志中，获取用户行为序列的训练样本，包括：

8.根据权利要求6所述的方法，其特征在于，所述对所述第一训练特征向量序列进行编码处理，得到预估行为对象的目标行为对应的第二训练特征向量，包括：

9.一种用户行为数据的处理装置，其特征在于，所述装置包括：

特征学习模块，用于对第一特征向量序列进行特征学习，得到预估行为对象的目标行为对应的第二特征向量；所述第一特征向量序列是基于用户行为转化关系和时间依赖关系构建的用户特征向量序列；

10.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。

11.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。