CN111523682A

CN111523682A - 训练交互预测模型、预测交互对象的方法及装置

Info

Publication number: CN111523682A
Application number: CN202010631311.3A
Authority: CN
Inventors: 文剑烽; 常晓夫; 宋乐; 刘旭钦
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2020-07-03
Filing date: 2020-07-03
Publication date: 2020-08-11
Anticipated expiration: 2040-07-03
Also published as: CN111523682B

Abstract

本说明书实施例提供一种交互预测模型的训练和使用方法及装置。在该方法中，首先基于交互事件序列构建动态交互图，从中确定出属于第一类对象的第一样本节点和属于第二类对象的备选节点。利用表征网络，分别确定各节点的节点向量。然后，将第一样本节点的向量输入生成网络，生成网络从备选节点中选择预测节点。将第一样本节点和预测节点输入判别网络，以确定二者交互的第一概率；还将第一样本节点和对应的第二样本节点输入判别网络，以确定二者交互的第二概率。以增大第二概率，减小第一概率为目标，训练表征网络和判别网络；以增大第一概率为目标，训练表征网络和生成网络。训练后的表征网络和生成网络作为用于预测交互对象的交互预测模型。

Description

训练交互预测模型、预测交互对象的方法及装置

技术领域

本说明书一个或多个实施例涉及机器学习领域，尤其涉及训练交互预测模型，以及利用训练的交互预测模型来预测交互对象的方法和装置。

背景技术

在许多场景下，需要对用户交互事件进行分析和处理。交互事件是互联网事件的基本组成元素之一，例如，用户浏览页面时的点击行为，可以视为用户与页面内容区块之间的交互事件，电商中的购买行为可以视为用户与商品之间的交互事件，账户间转账行为则是用户与用户之间的交互事件。用户的一系列交互事件中蕴含了用户的细粒度习惯偏好等特点，以及交互对象的特点，是机器学习模型的重要特征来源。因此，在许多场景下，希望根据交互事件对交互参与方进行特征表达和建模，进而对交互对象和事件进行分析，特别是对交互事件的安全性进行分析，从而保障交互平台的安全性。

然而，交互事件涉及交互双方，并且各个参与方本身的状态可以是动态变化的，因此，综合考虑交互参与方的多方面特点对其进行准确的特征表达非常困难。由此，希望能有改进的方案，更为有效地对交互对象和交互事件进行分析处理。

发明内容

本说明书一个或多个实施例描述了一种交互预测模型的训练方法和装置，其中基于动态交互图，利用生成对抗的方式，训练得到交互预测模型，从而可以更准确地针对目标对象预测其接下来的交互对象。

根据第一方面，提供了一种训练交互预测模型的方法，所述方法包括：

获取反映交互事件关联关系的动态交互图，其中包括多个节点对，每个节点对包括参与一个交互事件的一个第一类对象和一个第二类对象，任意节点通过连接边指向该节点所代表的对象参与的上一交互事件对应的两个节点；

从所述动态交互图中确定出第一样本节点和多个备选节点，所述第一样本节点属于第一类对象，所述多个备选节点均属于第二类对象，且包括与所述第一样本节点构成节点对的第二样本节点；

利用表征网络，分别确定所述第一样本节点对应的第一节点向量，和所述多个备选节点各自对应的节点向量；

将所述第一节点向量输入生成网络，所述生成网络从所述多个备选节点中选择一个节点作为预测节点；

将所述第一节点向量和所述预测节点对应的节点向量输入判别网络，以确定所述第一样本节点和所述预测节点参与同一交互事件的第一概率；

将所述第一节点向量和所述第二样本节点对应的第二节点向量输入所述判别网络，以确定所述第一样本节点和所述第二样本节点参与同一交互事件的第二概率；

以增大所述第二概率，减小所述第一概率为目标，训练所述表征网络和判别网络；

以增大所述第一概率为目标，训练所述表征网络和所述生成网络；训练后的表征网络和生成网络作为用于预测交互对象的交互预测模型。

在不同实施例中，所述多个备选节点可以是所述动态交互图中所有属于第二类对象的节点；或者，可以是所述动态交互图中距离所述第一样本节点第一范围，且属于第二类对象的节点。

根据一种实施方式，利用表征网络，确定所述第一样本节点对应的第一节点向量的具体过程包括：以所述第一样本节点为根节点，在所述动态交互图中确定出从根节点出发，经由连接边到达的预定范围的节点所形成的第一子图；将所述第一子图输入所述表征网络，所述表征网络根据第一子图中各个节点的节点属性特征以及节点之间的连接关系，输出根节点的隐向量作为所述第一节点向量。

进一步的，上述预定范围的节点可以包括，预设数目K的连接边之内的K阶子节点；和/或交互时间在预设时间范围内的子节点。

在一个实施例中，所述表征网络包括LSTM层，所述LSTM层将输入子图中从叶节点到根节点的各个节点分别作为当前节点，依次迭代处理各个节点，所述迭代处理包括，至少根据当前节点的节点属性特征，以及当前节点通过连接边指向的两个节点的隐向量，确定该当前节点的隐向量。

在一个具体实施例中，所述第一类对象和第二类对象分别为用户和物品；所述各个节点的节点属性特征包括，用户节点对应的用户属性特征，以及物品节点对应的物品属性特征，其中，用户属性特征包括以下中的至少一项：年龄、职业、教育程度、所在地区、注册时长、人群标签；物品属性特征包括以下中的至少一项：物品类别、上架时间、评论数、销量。

根据一种实施方式，在利用表征网络，分别确定所述第一样本节点对应的第一节点向量，和所述多个备选节点各自对应的节点向量之前，所述表征网络通过最大似然估计率方式进行预训练。

在一个实施例中，生成网络从所述多个备选节点中选择一个节点作为预测节点，具体包括：所述生成网络根据所述多个备选节点各自的节点向量，拟合得到各个备选节点与所述第一样本节点交互的概率分布；从所述概率分布中选择概率最大的节点作为所述预测节点。

进一步的，在一个例子中，所述生成网络利用Gumbel-softmax函数，拟合得到所述概率分布。

根据一个实施例，将所述第一节点向量，所述预测节点对应的节点向量和所述第一时刻输入判别网络，具体包括：对所述第一节点向量和所述预测节点向量进行融合操作，得到第一交互向量；将所述第一交互向量输入所述判别网络。

进一步的，上述融合操作可以包括以下之一：向量拼接，按位相乘，加权组合。

根据一种实施方式，训练所述表征网络和判别网络，具体包括：确定第一损失，所述第一损失与第二概率负相关，与第一概率正相关；在第一损失减小的方向，调整所述表征网络和所述判别网络的参数。

根据第二方面，提供了一种预测交互对象的方法，所述方法包括：

获取根据第一方面的方法训练得到的交互预测模型，所述交互预测模型包括表征网络和生成网络；

获取有待分析的第一目标对象，该第一目标对象属于第一类对象；

在所述动态交互图中构建与所述第一目标对象对应的第一目标节点，以及确定属于第二类对象的多个备选节点；

利用所述表征网络，分别确定所述第一目标节点对应的第一目标向量，和所述多个备选节点各自对应的节点向量；

将所述第一目标向量输入所述生成网络，所述生成网络从所述多个备选节点中选择一个节点作为预测节点；

将所述预测节点对应的对象，作为所述第一目标对象即将发生交互的对象。

根据第三方面，提供了一种训练交互预测模型的装置，所述装置包括：

交互图获取单元，配置为获取反映交互事件关联关系的动态交互图，其中包括多个节点对，每个节点对包括参与一个交互事件的一个第一类对象和一个第二类对象，任意节点通过连接边指向该节点所代表的对象参与的上一交互事件对应的两个节点；

样本节点确定单元，配置为从所述动态交互图中确定出第一样本节点和多个备选节点，所述第一样本节点属于第一类对象，所述多个备选节点均属于第二类对象，且包括与所述第一样本节点构成节点对的第二样本节点；

节点向量确定单元，配置为利用表征网络，分别确定所述第一样本节点对应的第一节点向量，和所述多个备选节点各自对应的节点向量；

生成单元，配置为将所述第一节点向量输入生成网络，所述生成网络从所述多个备选节点中选择一个节点作为预测节点；

第一判别单元，配置为将所述第一节点向量和所述预测节点对应的节点向量输入判别网络，以确定所述第一样本节点和所述预测节点参与同一交互事件的第一概率；

第二判别单元，配置为将所述第一节点向量和所述第二样本节点对应的第二节点向量输入所述判别网络，以确定所述第一样本节点和所述第二样本节点参与同一交互事件的第二概率；

第一训练单元，配置为以增大所述第二概率，减小所述第一概率为目标，训练所述表征网络和判别网络；

第二训练单元，配置为以增大所述第一概率为目标，训练所述表征网络和所述生成网络；训练后的表征网络和生成网络作为用于预测交互对象的交互预测模型。

根据第四方面，提供了一种预测交互对象的装置，所述装置包括：

模型获取单元，配置为获取根据第三方面的装置训练得到的交互预测模型，所述交互预测模型包括表征网络和生成网络；

目标对象获取单元，配置为获取有待分析的第一目标对象，该第一目标对象属于第一类对象；

目标节点确定单元，配置为在所述动态交互图中构建与所述第一目标对象对应的第一目标节点，以及确定属于第二类对象的多个备选节点；

节点向量确定单元，配置为利用所述表征网络，分别确定所述第一目标节点对应的第一目标向量，和所述多个备选节点各自对应的节点向量；

生成单元，配置为将所述第一目标向量输入所述生成网络，所述生成网络从所述多个备选节点中选择一个节点作为预测节点；

交互对象确定单元，配置为将所述预测节点对应的对象，作为所述第一目标对象即将发生交互的对象。

根据第五方面，提供了一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行第一方面或第二方面的方法。

根据第六方面，提供了一种计算设备，包括存储器和处理器，其特征在于，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现第一方面或第二方面的方法。

根据本说明书实施例提供的方法和装置，基于交互事件序列构建动态交互图，并基于这样的动态交互图训练表征网络和对抗生成网络GAN。GAN中的生成网络，通过对抗式训练过程，可以很好地学习和拟合真实交互事件的数据分布。因此，训练后的表征网络和生成网络即构成用于预测交互对象的交互预测模型。利用这样的交互预测模型，可以针对目标对象更加准确地预测其即将发生交互的交互对象。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1示出根据一个实施例的实施场景示意图；

图2示出根据一个实施例的训练交互预测模型的方法流程图；

图3示出根据一个实施例的动态交互序列和由此构建的动态交互图；

图4示出在一个实施例中第一子图的示例；

图5示出LSTM层的工作示意图；

图6示出训练GAN网络的示意图；

图7示出根据一个实施例预测交互对象的方法流程图；

图8示出根据一个实施例的交互预测模型的训练装置的示意性框图；

图9示出根据一个实施例的预测交互对象的装置的示意性框图。

具体实施方式

下面结合附图，对本说明书提供的方案进行描述。

如前所述，希望能够基于交互对象发生的一系列交互事件，对交互对象以及交互事件进行特征表达和建模。

在一种方案中，基于历史交互事件构建静态的交互关系网络图，从而基于该交互关系网络图，分析各个交互对象和各个交互事件。具体地，可以以各个历史事件的参与者作为节点，在存在交互关系的节点之间建立连接边，从而形成交互网络图。在一个例子中，可以基于用户和商品之间的交互形成一个二部图作为交互关系网络图。该二部图中包含用户节点和商品节点，如果某个用户购买过某件商品，则在该用户和该商品之间构建一条连接边。在另一例子中，可以基于用户之间的转账记录形成一个用户转账关系图，其中每个节点代表一个用户，发生过转账记录的两个用户之间存在连接边。

然而，以上例子中的静态网络图，尽管可以示出对象之间的交互关系，但是没有包含这些交互事件的时序信息。简单地基于这样的交互关系网络图进行图嵌入，获得的特征向量也没有表达出交互事件的时间信息对节点的影响。并且，这样的静态图可扩展性不够强，对于新增交互事件和新增节点的情况，难以灵活进行处理。

考虑到以上因素，根据本说明书的一个或多个实施例，将动态变化的交互事件序列构建成动态交互图，其中各个交互事件中涉及的各个交互对象对应于该动态交互图中的各个节点。这样的动态交互图可以反映出各个交互对象所经历的交互事件的时序信息。进一步地，为了基于上述动态交互图进行交互事件的分析和预测，在本说明书的实施例中，利用表征网络对动态交互图中的节点进行表征，并利用对抗生成网络GAN（GenerativeAdversarial Networks），学习发生交互的对象之间的联合概率分布，据此分析和预测交互对象和交互事件。

图1示出根据一个实施例的实施场景示意图。如图1所示，可以将依次发生的多个交互事件按时间顺序组织成动态交互序列<E₁,E₂,…,E_N>，其中每个元素E_i表示一个交互事件，可以表示为交互特征组的形式E_i=(a_i,b_i,t_i)，其中a_i和b_i是事件E_i的两个交互对象，t_i是交互时间。

根据本说明书的实施例，基于该动态交互序列构建动态交互图100。在图100中，将各个交互事件中的各个交互对象a_i,b_i用节点表示，并在包含同一对象的连续事件的节点之间建立父子关系连接边。动态交互图100的结构将在后续进行更具体的描述。

为了更有效地进行节点分析和事件分析，首先通过表征网络将动态交互图中各个节点表征为节点向量。基于表征得到的节点向量，通过对抗训练的方式，训练一个对抗生成网络GAN。对抗生成网络GAN具体包括生成网络和判别网络，其中生成网络用于针对目标节点，生成或预测与该目标节点交互的另一节点。判别网络用于区分生成网络生成的预测节点，和与目标节点发生真实交互的真实节点。生成网络和判别网络交替对抗训练。训练完成后，表征网络和生成网络即可作为交互预测模型，针对特定对象，预测接下来与其发生交互的另一对象。

下面描述以上构思的具体实现方式。

图2示出根据一个实施例的训练交互预测模型的方法流程图。可以理解，该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。下面结合具体实施例，对如图2所示的训练方法中的各个步骤进行描述。

首先，在步骤21，获取用于反映交互事件关联关系的动态交互图。

一般地，可以如前所述将依次发生的多个交互事件按时间顺序组织成交互事件序列，基于这样的交互事件序列构建动态交互图，以此反映交互事件的关联关系。交互事件序列，例如表示为<E₁,E₂,…,E_N>，可以包括按照时间顺序排列的多个交互事件，其中每个交互事件E_i可以表示为一个交互特征组E_i=(a_i,b_i,t_i)，其中a_i和b_i是事件E_i的两个交互对象，t_i是交互时间。

在一个实施例中，每个交互事件涉及的两个交互对象分属于两类对象，以下称为第一类对象和第二类对象。例如，在电商平台中，交互事件可以是用户的购买行为，其中的两个对象可以是用户对象（第一类对象）和商品对象（第二类对象）。在另一例子中，交互事件可以是用户对页面区块的点击行为，其中的两个对象可以是用户对象（第一类对象）和页面区块对象（第二类对象）。在又一例子中，交互事件可以是推荐事件，例如一个用户（第一类对象）接受了向其推送的推荐内容（第二类对象），推荐内容具体可以是各种可以推送的内容，例如，一部电影，一件商品，一篇文章，等等。在其他业务场景中，交互事件还可以是其他在两个不同类的对象之间发生的交互行为。需要理解，尽管以上例子中，都是将用户对象作为第一类对象，但是这并不是必然的，第一类对象和第二类对象的设定可以根据交互事件而定，有些交互事件并不包含用户对象，而在包含用户对象的交互事件中，也可以将用户对象作为第二类对象。

在一个实施例中，每个交互事件对应的交互特征组还可以包括事件特征或行为特征f，如此，每个交互特征组可以表示为X_i=(a_i,b_i,t_i,f)。具体的，事件特征或行为特征f可以包括交互事件发生的背景和上下文信息，交互行为的一些属性特征，等等。

例如，在交互事件为用户点击事件的情况下，事件特征f可以包括，用户进行点击所使用的终端的类型，浏览器类型，app版本，等等；在交互事件为交易事件的情况下，事件特征f可以包括，例如，交易类型（商品购买交易、转账交易等），交易金额，交易渠道等等。

对于以上所述的动态交互序列，可以构建动态交互图。具体的，用一对节点（两个节点）表示一个交互事件涉及的、分属于第一类对象和第二类对象的两个对象，将动态交互序列中各个交互事件中的各个对象分别用节点表示。如此，一个节点可以对应到一个交互事件中的一个对象，但是同一物理对象可能对应到多个节点。例如，如果用户U1在t1时刻购买了商品A1，在t2时刻购买了商品A2，那么存在两个交互事件的特征组(U1,A1,t1)和（U1，A2，t2），那么则根据这两个交互事件分别为用户U1创建两个节点U1(t1)，U1（t2）。因此可以认为，动态交互图中的节点对应于一个交互对象在一次交互事件中的状态。

对于动态交互图中的每个节点，按照以下方式构建连接边：对于任意节点i，假定其对应于交互事件i（交互时间为t），那么在动态交互序列中，从交互事件i向前回溯，也就是向早于交互时间t的方向回溯，将第一个同样包含节点i代表的对象的交互事件j（交互时间为t-，t-早于t）确定为该对象参与的上一交互事件。于是，建立从节点i指向该上一交互事件j中的两个节点的连接边。于是，这两个被指向的节点也称为节点i的关联节点。

下面结合具体例子进行描述。图3示出根据一个实施例的动态交互序列和由此构建的动态交互图。具体的，图3左侧示出按照时间顺序组织的动态交互序列，其中示例性示出分别在t₁,t₂,…,t₆时刻发生的交互事件E₁,E₂,…,E₆，每个交互事件包含交互涉及的两个交互对象以及交互时间（为了图示的清楚，省去了事件特征），其中第一列对象为用户类对象，例如David，Lucy等，第二列对象为物品类对象，例如可以是一些电影名字，在图中用M1到M4表示。图3右侧示出根据左侧的动态交互序列构建的动态交互图，其中，将各个交互事件中的两个交互对象分别作为节点。下面以节点u(t₆)为例，描述连接边的构建。

如图所示，该节点u（t₆）代表交互事件E₆中的一个用户对象David。于是，从交互事件E₆出发向前回溯，找到的第一个同样包含交互对象David的交互事件为E₄，也就是说，E₄是David参与的上一交互事件，相应的，E₄的两个交互对象对应的两个节点u(t₄)和w(t₄)，为节点u（t₆）的两个关联节点。于是，建立从节点u（t₆）指向E₄对应的两个节点u(t₄)和w(t₄)的连接边。类似的，从u（t₄）（对应于交互事件E₄）继续向前回溯，可以继续找到对象u也就是David参与的上一交互事件E₂，于是建立从u（t₄）指向E₂对应的两个节点的连接边，其他节点执行类似的过程。如此，在节点之间构建连接边，从而形成图3的动态交互图。

在一个实施例中，在动态交互图中，通过节点的相对位置来区分两类对象，例如对于各个交互事件中的节点，将第一类对象布置在左侧，第二类对象布置在右侧。换而言之，将节点相应的划分为左节点和右节点。例如在图3中，左节点为用户节点，右节点为物品节点。当然，在另一些实施例中，也可以不区分节点的位置。

以上描述了基于动态交互序列构建动态交互图的方式和过程。对于图2所示的训练过程而言，构建动态交互图的过程可以预先进行也可以现场进行。相应地，在一个实施例中，在步骤21，根据动态交互序列现场构建动态交互图。构建方式如以上所述。在另一实施例中，可以预先基于动态交互序列构建形成动态交互图。在步骤21，读取或接收已形成的动态交互图。

在获取到上述动态交互图的基础上，在步骤22，从动态交互图中确定出第一样本节点，以及多个备选节点；其中，第一样本节点属于第一类对象，所述多个备选节点均属于第二类对象，且包括与所述第一样本节点构成节点对的第二样本节点。

需要理解，第一样本节点是为了训练模型而选取的已知其相关交互事件的节点，这里将第一样本节点所属的事件称为第一事件，假定其发生于第一时刻，并将第一样本节点所属于的对象类别认为是第一类对象。由于交互事件发生在第一类对象和第二类对象之间，因此相应的，从动态交互图中确定出一些第二类对象对应的节点作为备选节点，即潜在的有可能与第一样本节点发生交互的节点。一般地，所选取的备选节点中包括与第一样本节点实际交互从而构成节点对的第二样本节点，该节点对即对应于第一事件。

在一个实施例中，在选取备选节点时，可以将动态交互图中所有属于第二类对象的节点均认为是备选节点。在另一实施例中，在动态交互图比较庞大，节点数目超过一定阈值时，将动态交互图中距离第一样本节点一定范围内的、属于第二类对象的节点作为备选节点。上述一定范围例如可以是，距离第一样本节点所在交互事件的发生时刻一定时间范围内的节点。

延续图3的例子进行说明。假定选取节点u（t₆）为第一样本节点，相应的，第一事件为E₆，第一时刻为t₆。该节点表示的是对象David，为用户对象，因此可以选取动态交互图中的物品类对象对应的节点作为备选节点。在一个例子中，将图3中所有物品类对象（M1到M4）对应的节点均作为备选节点，其中包括了与第一样本节点u（t₆）形成节点对（共同参与了事件E₆）的节点v（t₆），该节点即作为第二样本节点。

接着，在步骤23，利用表征网络，分别确定第一样本节点对应的第一节点向量，和上述多个备选节点各自对应的节点向量。

具体地，表征网络可以有多种实现方式。

在一个实施例中，表征网络根据待分析节点代表的对象的属性特征，以及参与事件的事件特征，得到该节点的向量表示。利用这样的方式，可以分别确定出第一样本节点的向量表示为第一节点向量，并确定各个备选节点各自对应的节点向量。

在另一实施例中，表征网络为图处理网络，根据待分析节点代表对象的属性特征，以及该节点在动态交互图中的图连接关系，得到节点对应的向量表示。

下面以待分析节点是第一样本节点为例进行说明。

在一个例子中，可以以第一样本节点为根节点，在动态交互图中确定出出从根节点出发，经由连接边到达的预定范围的节点所形成的第一子图。然后，将该第一子图输入用于图处理的表征网络，表征网络根据第一子图中各个节点的节点属性特征以及节点之间的连接关系，输出根节点的隐向量作为第一节点向量。

在一个实施例中，上述预定范围内的节点可以是，至多经过预设数目K的连接边可达的子节点。这里数目K为预设的超参数，可以根据业务情况选取。可以理解，该预设数目K体现了，从根节点向前回溯的历史交互事件的步数，也就是子节点的阶数。数目K越大，则考虑越久的历史交互信息。

在另一实施例中，上述预定范围内的节点还可以是，交互时间在预定时间范围内的子节点。例如，从根节点的交互时间向前回溯T时长（例如一天），在该时长范围内、且可通过连接边达到的子节点。

在又一实施例中，上述预定范围既考虑连接边的数目，又考虑时间范围。换而言之，该预定范围内的节点是指，至多经过预设数目K的连接边可达、且交互时间在预定时间范围内的子节点。

下面延续以上示例并结合具体例子进行描述。图4示出在一个实施例中第一子图的示例。在图4的例子中，假定u（t₆）为第一样本节点，于是，以该节点u（t₆）为根节点，确定其对应的第一子图，并假定子图是由至多经由预设数目K=2的连接边到达的子节点构成。那么，从当前根节点u（t₆）出发，沿父子关系的指向进行遍历，经由2条连接边可以达到的节点如图中虚线区域所示。该区域中的节点和连接关系即为节点u（t₆）对应的子图，即第一子图。

然后，将上述第一子图输入到用于图处理的表征网络，在其中根据第一子图中各个节点的节点属性特征以及节点之间的连接关系，输出根节点的隐向量作为第一节点向量。

在一个例子中，表征网络可以是通过图嵌入的方式进行图处理的神经网络。在图嵌入过程中，根据节点之间的连接关系，将输入子图中各个节点作为根节点的K阶邻居节点，进行邻居节点聚合，得到根节点的节点向量。

在另一例子中，表征网络可以包含时间递归层，例如循环神经网络RNN层，或长短期记忆LSTM层，从而通过递归迭代的方式进行图处理。具体的，在一个实施例中，表征网络包括LSTM层，LSTM层将输入子图中从叶节点到根节点的各个节点分别作为当前节点，依次迭代处理各个节点，所述迭代处理包括，至少根据当前节点的节点属性特征，以及当前节点通过连接边指向的两个节点的隐向量，确定该当前节点的隐向量。

图5示出LSTM层的工作示意图。假定节点Q的两个子节点为节点J₁和节点J₂。如图5所示，在T时刻，LSTM层分别处理得到节点J₁和节点J₂的表征向量H1和H2，其中表征向量可以包括隐含向量和用于辅助运算的中间向量；在接下来的T+时刻，LSTM层根据节点Q的节点属性特征，之前处理得到的J₁和J₂的表征向量H1和H2，得到节点Q的表征向量H_Q。可以理解，该节点Q的表征向量可以在后续时刻，连同节点Q的相对节点（同一事件中的另一节点）的表征向量一起，用于处理得到节点Q的父节点的表征向量，如此实现迭代处理。

当将图4所示的第一子图输入以上如图5所示的LSTM处理层，LSTM处理层于是根据第一子图中节点之间的指向关系，依次迭代地处理各个节点，从而可以得到第一子图中各个节点的中间向量和隐含向量。例如，在图4所示的第一子图的例子中，对于最底层的节点，可以基于节点属性特征，以及通过缺省、填补等方式确定出的关联节点，得到最底层节点的中间向量和隐含向量，然后逐层向上迭代，得到各个节点的中间向量和隐含向量。例如，当将节点u（t₄）作为当前节点时，根据节点u（t₄）的属性特征，该节点指向的两个关联节点u（t₂）和节点r(t₂)各自的中间向量和隐含向量，得到当前节点u（t₄）的中间向量和隐含向量。类似的得到节点w（t₄）的中间向量和隐含向量后，将第一样本节点u（t₆）作为当前节点，根据节点u（t₆）的属性特征，两个关联节点u（t₄）和节点w(t₄)各自的中间向量和隐含向量，得到节点u（t₆）的中间向量和隐含向量。如此得到第一子图中根节点的隐含向量作为第一节点向量。

以上提及的节点属性特征根据节点代表的不同类对象而有所不同。例如，在节点表示用户的情况下，节点属性特征可以包括用户的属性特征，例如年龄、职业、教育程度、所在地区、注册时长、人群标签等等；在节点表示物品的情况下，节点属性特征可以包括物品的属性特征，例如物品类别、上架时间、销量、评论数等等。在节点表示其他交互对象的情况下，可以相应的基于交互对象自身的属性，得到节点属性特征。

以上以第一样本节点对应的第一子图为例，描述了表征网络对其的图处理和向量表征。可以理解，对于步骤22确定的多个备选节点，可以分别将各个备选节点作为根节点，在动态交互图中进行遍历，得到各个备选节点各自对应的备选子图。然后将各个备选子图输入到表征网络。表征网络于是基于各个备选子图中节点的属性特征和连接关系，分别确定出各个备选子图的根节点对应的向量表示，作为各个备选节点的节点向量。

在一个实施例中，步骤23中的表征网络可以是未经训练的网络，其网络参数可以是初始参数，有待在后续步骤中，与GAN网络联合训练。

在另一实施例中，也可以预先对表征网络进行预训练。此时，步骤23中的表征网络可以是预训练的网络。该预训练的表征网络可以在后续步骤中，与GAN网络一起进行进一步训练或微调。

更具体的，在一个例子中，表征网络可以通过最大似然估计MLE（MaximumLikelihood Estimate）的方式进行预训练。例如，可以通过表征网络对各个交互事件中的各个节点的表征，得到各个交互事件的数据分布，然后，通过优化交互事件数据的真实分布与学习得到的数据分布之间的交叉熵，来调整表征网络，以此实现对表征网络的预训练。对表征网络进行预训练有助于加快整个网络模型的训练过程。

在以上通过表征网络得到第一样本节点的第一节点向量，和各个备选节点对应的节点向量的基础上，可以基于节点向量的表征，训练对抗生成网络GAN。

图6示出训练GAN网络的示意图。如图6所示，GAN网络包括生成网络610和判别网络620，这两个网络可以基于相同的网络结构实现，例如，同为深度神经网络DNN。生成网络610用于根据输入节点的节点向量，生成与该输入节点对应的预测节点；判别网络620用于判别，输入的节点组合是真实交互的节点对，还是基于生成网络生成的预测节点形成的节点组合。下面结合图6描述GAN网络的训练过程。

为了训练上述GAN网络，在步骤24，将第一节点向量输入生成网络，该生成网络从多个备选节点中选择一个节点作为预测节点。

具体的，如图6所示，用节点u表示第一样本节点。当把节点u的向量表示输入生成网络610，生成网络610可以将前述的多个备选节点v_i作为采样空间V，构建该采样空间的数据分布，根据该数据分布，从采样空间中采样出预测节点v’。更具体的，在一个实施例中，生成网络根据多个备选节点v_i各自的节点向量，拟合得到各个备选节点与第一样本节点交互的概率分布，从该概率分布中选择概率最大的节点作为生成的预测节点v’。

在一个例子中，生成网络采用以下公式（1），拟合备选节点v_i与第一样本节点u交互的概率p(v_i|u)：

（1）

其中，v_j为属于采样空间V的任意备选节点，f（u,v_i）为计算节点u和节点v_i交互可能性的函数。

在另一例子中，在以上公式（1）基础上，采用softmax函数，拟合备选节点v与第一样本节点u交互的概率p(v_i|u)：

(2)

在又一例子中，利用Gumbel-softmax函数，拟合得到各个备选节点与第一样本节点u交互的概率分布。Gumbel-softmax函数，是在softmax拟合的基础上，进一步引入Gumbel分布下的随机采样，从而避免从离散分布中进行采样导致的可能的梯度断开问题，更加有利于网络的训练和调参。

在生成网络610选择或者说生成预测节点v’之后，在步骤25，将第一样本节点u对应的第一节点向量Hu和预测节点v’对应的预测节点向量Hv’输入判别网络620，以确定第一样本节点u和预测节点v’参与同一交互事件的第一概率P1。

具体而言，可以将第一节点向量Hu和所述预测节点向量Hv’进行融合操作，该融合操作具体可以是，将Hu和Hv’进行向量拼接，按位相乘，或加权组合，等等。通过融合操作，将第一节点向量Hu和预测节点向量Hv’融合成为一个向量，称为第一交互向量，将该第一交互向量输入判别网络620。

判别网络620根据输入的交互向量，确定该交互向量对应的节点组合是否对应于真实的交互事件，即是否为动态交互图中真实的节点对。对于第一交互向量，判别网络620即判别，第一样本节点和预测节点的组合是否为同一事件中的两个节点。在一个例子中，判别网络620输出节点组合是真实节点对的概率，如此，可以直接将判别网络针对第一交互向量的输出作为上述第一概率。在另一例子中，判别网络620输出节点组合是生成组合的概率，如此，可以在得到判别网络输出概率后，将1减去该输出概率的值作为上述第一概率。

另一方面，在步骤26，将第一节点向量Hu和第二样本节点v对应的第二节点向量Hv输入判别网络，以确定第一样本节点u和第二样本节点v参与同一交互事件的第二概率P2。

如前所述，第二样本节点v是在动态交互图中，与第一样本节点参与同一交互事件，因而构成节点对的另一节点。可以采用与以上相同的融合操作，将第一节点向量Hu和第二节点向量Hv进行融合，得到第二交互向量，输入到判别网络620。判别网络620于是根据第二交互向量，判定该交互向量对应的节点组合，即第一样本节点和第二样本节点的组合是否为同一交互事件中的两个节点。根据判别网络620针对第二交互向量的输出，可以得到第一样本节点u和第二样本节点v参与同一交互事件的第二概率P2。

接着，在步骤27，以增大第二概率P2，减小第一概率P2为目标，训练表征网络和判别网络。需要理解，判别网络的训练目标是，尽可能区分出真实交互事件对应的节点组合，和基于生成网络生成的节点组合。因此，对于生成网络610生成的预测节点v’和第一样本节点u构成的节点组合来说，其对应的第一概率P1应尽量小；对于动态交互图中真实节点对包含的结合组合u和v来说，其对应的第二概率应尽量大。

在一个实施例中，定义以下的第一损失L1：

(3)

即，第一损失与第二概率P2负相关，与第一概率P1正相关。在第一损失L1减小的方向，调整表征网络和判别网络的参数。如此，表征网络和判别网络的更新会使得第一损失L1下降，这也就意味着，增大第二概率P2，减小第一概率P1。

此外，在步骤28，以增大第一概率为目标，训练所述表征网络和所述生成网络。需要理解，生成网络的训练目标是，混淆或者欺骗判别网络，使得判别网络无法区分出真实交互事件对应的节点组合，和基于生成网络生成的节点组合。因此，对于生成网络610生成的预测节点v’和第一样本节点u构成的节点组合来说，生成网络610希望判别网络对其预测不准确，也就是使得判别网络对其预测的第一概率P1尽量大。

在一个实施例中，定义以下的第二损失L2：

(4)

即第二损失与第一概率P1负相关。在第二损失L2减小的方向，调整表征网络和生成网络的参数。如此，表征网络和生成网络的更新会使得第二损失L2下降，这也就意味着，增大第一概率P1。

可以看到，步骤27和步骤28中关于第一概率，生成网络和判别网络的训练目标相反，由此两者形成对抗。实践中，步骤27中对判别网络的训练，和步骤28中对生成网络的训练，可以交替进行，也可以同时进行。例如，在一个实施例中，可以在开始的若干轮训练迭代中，只训练判别网络，在其达到一定的判别能力后，再训练生成网络。之后两者交替迭代训练。或者，也可以在某些轮次的迭代中，同时训练生成网络和判别网络。

通过生成网络和判别网络的对抗训练，在最终达到收敛条件时，认为完成了模型的训练。如此训练得到的表征网络和生成网络可以构成交互预测模型，用于对交互对象进行预测。

下面描述利用交互预测模型进行交互对象预测的过程。

图7示出根据一个实施例预测交互对象的方法流程图。该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。如图7所示，首先在步骤71，获取根据上述方法训练得到的交互预测模型，所述交互预测模型包括表征网络和生成网络。换而言之，判别网络用于以对抗方式辅助生成网络的训练，在完成训练之后的预测阶段，可以不再使用判别网络，而是由表征网络和生成网络构成交互预测模型。

然后，在步骤72，获取反映交互事件关联关系的动态交互图，该步骤与图2的步骤21相似，不再赘述。

接着，在步骤73，获取有待分析的第一目标对象。假定该第一目标对象属于第一类对象。

然后，在步骤74，在动态交互图中构建与第一目标对象对应的第一目标节点，并确定出属于第二类对象的多个备选节点。

需要理解，第一目标对象是有待分析的目标对象，其接下来的交互对象和交互事件是未知的，也是当前要预测的内容。因此，可以在动态交互图中构建出与第一目标对象对应的节点作为第一目标节点。具体的，可以在动态交互图中新增单个节点，该单个节点表示第一目标对象。与其他节点类似的，在该单个节点与第一目标对象参与的上一交互事件（即最近一次交互事件）对应的两个节点之间建立连接边，从而使得该单个节点通过连接边指向上一交互事件的两个节点。但是与其他节点不同的是，由于交互对象未知，该单个节点独立存在，尚不具有对应的形成节点对的节点。

此外，与步骤22中确定备选节点类似的，可以从动态交互图中确定出属于第二类对象的多个备选节点。

接着，在步骤75，利用表征网络，分别确定第一目标节点对应的第一目标向量，和所述多个备选节点各自对应的节点向量。表征网络确定节点向量的过程与图2步骤23的过程相似，不再赘述。

然后，在步骤76，将第一目标向量输入生成网络，于是生成网络从多个备选节点中选择一个节点作为预测节点。该过程与图2中步骤24相似。

在得到生成网络输出的预测节点后，在步骤77，将该预测节点对应的对象，确定为第一目标对象即将发生交互的对象。如此，实现了交互对象的预测。

回顾以上过程，在本说明书实施例的方案中，基于交互事件序列构建动态交互图，并基于这样的动态交互图，训练表征网络和对抗生成网络GAN。GAN中的生成网络，通过对抗式训练过程，可以很好地学习和拟合真实交互事件的数据分布。因此，训练后的表征网络和生成网络即构成用于预测交互对象的交互预测模型。利用这样的交互预测模型，可以针对目标对象更加准确地预测其即将发生交互的交互对象。对交互对象的预测，可以用于物品推荐，内容推荐等多种场景。

根据另一方面的实施例，提供了一种训练交互预测模型的装置，该装置可以部署在任何具有计算、处理能力的设备、平台或设备集群中。图8示出根据一个实施例的交互预测模型的训练装置的示意性框图。如图8所示，该训练装置800包括：

交互图获取单元81，配置为获取反映交互事件关联关系的动态交互图，其中包括多个节点对，每个节点对包括参与一个交互事件的一个第一类对象和一个第二类对象，任意节点通过连接边指向该节点所代表的对象参与的上一交互事件对应的两个节点；

样本节点确定单元82，配置为从所述动态交互图中确定出第一样本节点和多个备选节点，所述第一样本节点属于第一类对象，所述多个备选节点均属于第二类对象，且包括与所述第一样本节点构成节点对的第二样本节点；

节点向量确定单元83，配置为利用表征网络，分别确定所述第一样本节点对应的第一节点向量，和所述多个备选节点各自对应的节点向量；

生成单元84，配置为将所述第一节点向量输入生成网络，所述生成网络从所述多个备选节点中选择一个节点作为预测节点；

第一判别单元85，配置为将所述第一节点向量和所述预测节点对应的节点向量输入判别网络，以确定所述第一样本节点和所述预测节点参与同一交互事件的第一概率；

第二判别单元86，配置为将所述第一节点向量和所述第二样本节点对应的第二节点向量输入所述判别网络，以确定所述第一样本节点和所述第二样本节点参与同一交互事件的第二概率；

第一训练单元87，配置为以增大所述第二概率，减小所述第一概率为目标，训练所述表征网络和判别网络；

第二训练单元88，配置为以增大所述第一概率为目标，训练所述表征网络和所述生成网络；训练后的表征网络和生成网络作为用于预测交互对象的交互预测模型。

根据一种实施方式，节点向量确定单元83具体配置为：以所述第一样本节点为根节点，在所述动态交互图中确定出从根节点出发，经由连接边到达的预定范围的节点所形成的第一子图；将所述第一子图输入所述表征网络，所述表征网络根据第一子图中各个节点的节点属性特征以及节点之间的连接关系，输出根节点的隐向量作为所述第一节点向量。

根据一种实施方式，所述表征网络通过最大似然估计率方式进行预训练。

在一个实施例中，所述生成网络用于，根据所述多个备选节点各自的节点向量，拟合得到各个备选节点与所述第一样本节点交互的概率分布；从所述概率分布中选择概率最大的节点作为所述预测节点。

根据一个实施例，第一判别单元85具体配置为：对所述第一节点向量和所述预测节点向量进行融合操作，得到第一交互向量；将所述第一交互向量输入所述判别网络。

根据一种实施方式，第一训练单元87具体配置为：确定第一损失，所述第一损失与第二概率负相关，与第一概率正相关；在第一损失减小的方向，调整所述表征网络和所述判别网络的参数。

根据又一方面的实施例，提供了一种预测交互对象的装置，该装置可以部署在任何具有计算、处理能力的设备、平台或设备集群中。图9示出根据一个实施例的预测交互对象的装置的示意性框图。如图9所示，该预测装置900包括：

模型获取单元91，配置为获取前述方式训练得到的交互预测模型，所述交互预测模型包括表征网络和生成网络；

交互图获取单元92，配置为获取反映交互事件关联关系的动态交互图，其中包括多个节点对，每个节点对包括参与一个交互事件的一个第一类对象和一个第二类对象，任意节点通过连接边指向该节点所代表的对象参与的上一交互事件对应的两个节点；

目标对象获取单元93，配置为获取有待分析的第一目标对象，该第一目标对象属于第一类对象；

目标节点确定单元94，配置为在所述动态交互图中构建与所述第一目标对象对应的第一目标节点，以及确定属于第二类对象的多个备选节点；

节点向量确定单元95，配置为利用所述表征网络，分别确定所述第一目标节点对应的第一目标向量，和所述多个备选节点各自对应的节点向量；

生成单元96，配置为将所述第一目标向量输入所述生成网络，所述生成网络从所述多个备选节点中选择一个节点作为预测节点；

交互对象确定单元97，配置为将所述预测节点对应的对象，确定为所述第一目标对象即将发生交互的对象。

通过以上训练装置800，基于动态交互图，训练得到交互预测模型；通过以上预测装置900，可以利用训练得到的交互预测模型，对目标对象的交互对象进行预测和评估。

根据另一方面的实施例，还提供一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行结合图2和图7所描述的方法。

根据再一方面的实施例，还提供一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现结合图2和图7所述的方法。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本发明的保护范围之内。

Claims

1.一种训练交互预测模型的方法，所述方法包括：

2.根据权利要求1所述的方法，其中，所述多个备选节点为：

所述动态交互图中所有属于第二类对象的节点；或者，

所述动态交互图中距离所述第一样本节点第一范围，且属于第二类对象的节点。

3.根据权利要求1所述的方法，其中，利用表征网络，分别确定所述第一样本节点对应的第一节点向量，和所述多个备选节点各自对应的节点向量，包括：

以所述第一样本节点为根节点，在所述动态交互图中确定出从根节点出发，经由连接边到达的预定范围的节点所形成的第一子图；

将所述第一子图输入所述表征网络，所述表征网络根据第一子图中各个节点的节点属性特征以及节点之间的连接关系，输出根节点的隐向量作为所述第一节点向量。

4.根据权利要求3所述的方法，其中，所述预定范围的节点包括：

预设数目K的连接边之内的K阶子节点；和/或

交互时间在预设时间范围内的子节点。

5.根据权利要求3所述的方法，其中，所述表征网络包括LSTM层，所述LSTM层将输入子图中从叶节点到根节点的各个节点分别作为当前节点，依次迭代处理各个节点，所述迭代处理包括，至少根据当前节点的节点属性特征，以及当前节点通过连接边指向的两个节点的隐向量，确定该当前节点的隐向量。

6.根据权利要求3所述的方法，其中，所述第一类对象和第二类对象分别为用户和物品；

所述各个节点的节点属性特征包括，用户节点对应的用户属性特征，以及物品节点对应的物品属性特征，其中，用户属性特征包括以下中的至少一项：年龄、职业、教育程度、所在地区、注册时长、人群标签；物品属性特征包括以下中的至少一项：物品类别、上架时间、评论数、销量。

7.根据权利要求1所述的方法，其中，在利用表征网络，分别确定所述第一样本节点对应的第一节点向量，和所述多个备选节点各自对应的节点向量之前，所述表征网络通过最大似然估计的方式进行预训练。

8.根据权利要求1所述的方法，其中，所述生成网络从所述多个备选节点中选择一个节点作为预测节点，具体包括：

所述生成网络根据所述多个备选节点各自的节点向量，拟合得到各个备选节点与所述第一样本节点交互的概率分布；

从所述概率分布中选择概率最大的节点作为所述预测节点。

9.根据权利要求8所述的方法，其中，所述生成网络根据所述多个备选节点各自的节点向量，拟合得到各个备选节点与所述第一样本节点交互的概率分布，具体包括：

利用Gumbel-softmax函数，拟合得到所述概率分布。

10.根据权利要求1所述的方法，其中，将所述第一节点向量和所述预测节点对应的节点向量输入判别网络，包括：

对所述第一节点向量和所述预测节点对应的节点向量进行融合操作，得到第一交互向量；

将所述第一交互向量输入所述判别网络。

11.根据权利要求10所述的方法，其中，所述融合操作包括以下之一：

向量拼接，按位相乘，加权组合。

12.根据权利要求1所述的方法，其中，训练所述表征网络和判别网络，包括：

确定第一损失，所述第一损失与第二概率负相关，与第一概率正相关；

在第一损失减小的方向，调整所述表征网络和所述判别网络的参数。

13.一种预测交互对象的方法，所述方法包括：

获取根据权利要求1的方法训练得到的交互预测模型，所述交互预测模型包括表征网络和生成网络；

在所述动态交互图中构建与所述第一目标对象对应的第一目标节点，并确定属于第二类对象的多个备选节点；

将所述预测节点对应的对象，确定为所述第一目标对象即将发生交互的对象。

14.根据权利要求13所述的方法，其中，在所述动态交互图中构建与所述第一目标对象对应的第一目标节点，包括：

在所述动态交互图中新增用于表示所述第一目标对象的单个节点，该单个节点作为所述第一目标节点；

在该单个节点与第一目标对象参与的最近一次交互事件对应的两个节点之间建立连接边。

15.一种训练交互预测模型的装置，所述装置包括：

16.一种预测交互对象的装置，所述装置包括：

模型获取单元，配置为获取根据权利要求15的装置训练得到的交互预测模型，所述交互预测模型包括表征网络和生成网络；

交互对象确定单元，配置为将所述预测节点对应的对象，确定为所述第一目标对象即将发生交互的对象。

17.一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行权利要求1-14中任一项的所述的方法。

18.一种计算设备，包括存储器和处理器，其特征在于，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现权利要求1-14中任一项所述的方法。