CN109002488B

CN109002488B - 一种基于元路径上下文的推荐模型训练方法及装置

Info

Publication number: CN109002488B
Application number: CN201810669341.6A
Authority: CN
Inventors: 石川; 胡斌斌
Original assignee: Beijing University of Posts and Telecommunications
Current assignee: Beijing University of Posts and Telecommunications
Priority date: 2018-06-26
Filing date: 2018-06-26
Publication date: 2020-10-02
Anticipated expiration: 2038-06-26
Also published as: CN109002488A

Abstract

本发明实施例提供了一种基于元路径上下文的推荐模型训练方法及装置。该方法包括：在样本信息平台中获得多个用户信息对；针对每个用户信息对，获得该用户信息对所对应的路径实例，并生成该用户信息对所对应样本用户表征信息、样本对象表征信息和元路径上下文表征信息；针对每个用户信息对，将上述三种信息进行拼接得到训练样本；将得到的多个训练样本作为输入，对预设神经网络模型进行训练，直至通过损失函数计算得到的函数值小于预设阈值时，完成神经网络模型的训练。与现有技术相比，应用本发明实施例提供的方案，训练得到的基于元路径上下文的推荐模型可以学习到更优化的特征，进而，可以提高基于该模型得到的推荐结果的准确性。

Description

一种基于元路径上下文的推荐模型训练方法及装置

技术领域

本发明涉及计算机软件技术领域，特别是涉及一种基于元路径上下文的推荐模型训练方法、装置及电子设备。

背景技术

当前，随着网络技术的不断发展，越来越多的用户选择在互联网上进行各种日常活动，例如，购买商品、观看电影、阅读书籍等。伴随着网络技术发展，随之而来的是信息超载问题，用户感受到了的信息量过大，从而导致用户需要花费更多的时间和精力来获得自己想要的信息。以购买商品为例，随着电子商务规模的不断扩大，商品的种类在快速增长，用户需要花费大量的时间才能找到自己想买的商品。而这种需要浏览大量无关信息才能获得自身需要的信息的过程会极大地降低用户体验，进而，导致用户流失。

为了解决上述问题，各种推荐系统应用而生。现有技术中，常见的推荐系统通常使用基于异质信息网络(Heterogeneous Information Network，HIN)的推荐算法进行建模，并通过训练得到的推荐模型为用户提供个性化的推荐信息。

所谓HIN是一个有向图G＝(V，ε)，其定义了一个实体类型映射Φ：V→A，以及一个边类型映射

其中A和R分别代表预定义的实体类型集合以及边类型集合，且|A|+|R|＞2。

在HIN中，网络模式用于描述网络中的一个元结构，即对象类型以及他们之间的交互关系。以电影推荐系统中的对应网络模式为例，对异质信息网络进行说明。如图1所示，在网络中包括多种不同类型的对象(如User，Movie，Director)，以及他们之间的语义关系(如User和Movie间的观看关系，User之间的朋友关系，以及Movie和Director之间的导演关系)。

在HIN中，两个对象可以通过不同的语义路径连接起来，即元路径。同样以图1为例，对元路径进行说明。在图1中，可见User(用户)u1和Movie(电影)m2可以由多条元路径相连，如“u₁-m₁-u₃-m₂″(UMUM)“u₁-m₁-t₁-m₂″(UMTM)UMUM和UMTM路径均可以表示User u1看过Movie m2，因为UMUM表示有着相同观影记录的User u3看过Movie m2，UMTM表示User u1看过与Movie m2相同类型的Movie m1。

而现有技术中，在使用基于HIN的推荐算法训练推荐模型时，是在样本信息平台中，根据用户与对象的历史交互记录，直接提取用户与对象之间的交互特征，从而根据生成的用户表征信息和对象表征信息建模用户对对象的偏好，进而完成针对用户的个性化对象推荐。

仍然以图1为例中的User u1和Movie m2为例，在现有技术中，仅考虑了User u1和Movie m2的交互关系，即Useru1看过Movie m2。显然，Useru1和Movie m2的交互关系可以通过多个元路径来表示，而这些不同的元路径会影响User u1和Movie m2的交互关系。

因此，由于现有技术中在训练推荐模型时，没有考虑到用户与对象之间的不同元路径对用户与对象的交互的影响，因此，现有技术中在训练推荐模型时会导致学习到的特征可能不是最优的，得到的推荐结果的准确性较低。

发明内容

本发明实施例的目的在于提供一种基于元路径上下文的推荐模型训练方法及装置，以提高推荐结果的准确性。具体技术方案如下：

第一方面，本发明实施例提供了一种基于元路径上下文的推荐模型训练方法，所述方法包括：

在样本信息平台中获得多个用户信息对，其中，每个用户信息对包括一个样本用户向量和一个样本对象向量，所述样本用户向量对应的样本用户与所述样本对象向量对应的样本对象具有交互关系；

针对每个用户信息对，获得该用户信息对所对应的路径实例，作为样本路径实例，其中，所述路径实例为：该用户信息对所对应的样本用户访问样本对象的访问路径；

针对每个用户信息对，生成样本用户向量对应的样本用户表征信息和样本对象向量对应的样本对象表征信息；

针对每个用户信息对，利用与该用户信息对所对应的样本路径实例，生成该用户信息对所对应的元路径上下文表征信息；

针对每个用户信息对，拼接该用户信息对所对应的样本用户表征信息、样本对象表征信息和元路径上下文表征信息，得到训练样本；

将得到的多个训练样本作为输入，对预设神经网络模型进行训练，直至通过损失函数计算得到的函数值小于预设阈值时，完成所述神经网络模型的训练；

其中，针对任一训练样本，所述神经网络模型的输出为：向该训练样本所对应样本用户，推荐的各个样本对象的推荐排行顺序。

第二方面，本发明实施例提供了一种向用户推荐信息的方法，所述方法包括：

在目标信息平台中，获取与目标用户对应的多个目标信息对，其中，所述目标信息对包括所述目标用户对应的用户向量和一个对象向量，每个目标信息对包括的对象向量不同；

针对每个目标信息对，获得与该用户信息对所对应的路径实例；

将所述多个目标信息对和与每个目标信息对所对应的路径实例输入到预设的推荐模型中进行检测，得到向所述目标用户推荐的、所述多个目标信息对所对应的对象中每个对象的推荐排行顺序，其中，所述推荐模型通过上述第一方面提供的一种基于元路径上下文的推荐模型训练方法中任一项所述的方法训练得到。

第三方面，本发明实施例提供了一种基于元路径上下文的推荐模型训练装置，所述装置包括：

信息获取模块，用于在样本信息平台中获得多个用户信息对，其中，每个用户信息对包括一个样本用户向量和一个样本对象向量，所述样本用户向量对应的样本用户与所述样本对象向量对应的样本对象具有交互关系；

路径获取模块，用于针对每个用户信息对，获得该用户信息对所对应的路径实例，作为样本路径实例，其中，所述路径实例为：该用户信息对所对应的样本用户访问样本对象的访问路径；

第一表征信息生成模块，用于针对每个用户信息对，生成样本用户向量对应的样本用户表征信息和样本对象向量对应的样本对象表征信息；

第二表征信息生成模块，用于针对每个用户信息对，利用与该用户信息对所对应的样本路径实例，生成该用户信息对所对应的元路径上下文表征信息；

样本获得模块，用于针对每个用户信息对，拼接该用户信息对所对应的样本用户表征信息、样本对象表征信息和元路径上下文表征信息，得到训练样本；

模型训练模块，用于将得到的多个训练样本作为输入，对预设神经网络模型进行训练，直至通过损失函数计算得到的函数值小于预设阈值时，完成所述神经网络模型的训练；其中，针对任一训练样本，所述神经网络模型的输出为：向该训练样本所对应样本用户，推荐的各个样本对象的推荐排行顺序。

第四方面，本发明实施例提供了一种向用户推荐信息的装置，所述装置包括：

目标信息获取模块，用于在目标信息平台中，获取与目标用户对应的多个目标信息对，其中，所述目标信息对包括所述目标用户对应的用户向量和一个对象向量，每个目标信息对包括的对象向量不同；

目标路径获得模块，用于针对每个目标信息对，获得与该用户信息对所对应的路径实例；

推荐信息获得模块，用于将所述多个目标信息对和与每个目标信息对所对应的路径实例输入到预设的推荐模型中进行检测，得到向所述目标用户推荐的、所述多个目标信息对所对应的对象中每个对象的推荐排行顺序，其中，所述推荐模型通过上述第一方面提供的一种基于元路径上下文的推荐模型训练方法中任一项所述的方法训练得到。

第五方面，本发明实施例提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现上述第一方面提供的一种基于元路径上下文的推荐模型训练方法中任一所述的方法步骤。

第六方面，本发明实施例还提供了另一种电子设备包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现上述第二方面提供的一种向用户推荐信息的方法中任一所述的方法步骤。

第七方面，本发明实施例提供了一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述第一方面提供的一种基于元路径上下文的推荐模型训练方法中任一所述的方法步骤。

第八方面，本发明实施例还提供了另一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述第二方面提供的一种向用户推荐信息的方法中任一所述的方法步骤。

以上可见，本发明实施例提供的基于元路径上下文的推荐模型训练方法，在样本信息平台中获得多个用户信息对后，针对每个用户信息对，确定该用户信息对所对应的样本用户表征信息和样本对象表征信息，并根据获得的样本用户与样本对象之间的路径实例，确定样本用户与样本对象之间的元路径上下文表征信息。进而根据上述样本用户表征信息、样本对象表征信息和元路径上下文表征信息确定每个用户信息对所对应的训练样本，并利用训练样本对模型进行训练。由于获得的训练样本中融入了样本用户与样本对象之间的元路径上下文表征信息，也就是说，在获得训练样本时考虑了样本用户与样本对象之间不同元路径对样本用户与样本对象的交互的影响。因此，训练得到的基于元路径上下文的推荐模型可以学习到更优化的特征，进而，可以提高基于该模型得到的推荐结果的准确性。

另外，本发明实施例所提供的一种向用户推荐信息的方法，由于在向用户推荐信息时，采用的推荐模型为通过本发明实施例所提供的训练方法所训练得到的，因此，可以提高推荐结果的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为一种对应于电影推荐系统网络模式的异质信息网络的结构示意图；

图2为本发明实施例提供了一种基于元路径上下文的推荐模型训练方法的流程示意图；

图3为本发明实施例提供的另一种基于元路径上下文的推荐模型训练方法的流程示意图；

图4为本发明实施例提供的一种向用户推荐信息的方法的流程示意图；

图5为本发明实施例提供了一种基于元路径上下文的推荐模型训练装置的结构示意图；

图6为本发明实施例提供的一种向用户推荐信息的装置的结构示意图；

图7为本发明实施例提供的一种电子设备的结构示意图；

图8为本发明实施例提供的另一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

当前，现有技术中在训练推荐模型时，没有考虑到用户与对象之间的不同元路径对用户与对象的交互的影响，导致推荐模型学习到的特征可能不是最优的，进而，使基于该推荐模型得到的推荐结果的准确性较低。

为了解决现有技术中存在的问题，本发明实施例提供了一种基于元路径上下文的推荐模型训练方法、装置及电子设备。

下面，首先对本发明实施例提供的一种基于元路径上下文的推荐模型训练方法进行介绍。

本发明实施例所提供的一种基于元路径上下文的推荐模型训练方法可以应用于任意电子设备，例如，可以手机、平板电脑、笔记本电脑、台式电脑等，在此不做具体限定。

图2为本发明实施例提供了一种基于元路径上下文的推荐模型训练方法的流程示意图。如图2所示，本发明实施例提供了一种基于元路径上下文的推荐模型训练方法，可以包括如下步骤：

S201：在样本信息平台中获得多个用户信息对。

其中，每个用户信息对包括一个样本用户向量和一个样本对象向量，样本用户向量对应的样本用户与样本对象向量对应的样本对象具有交互关系。

在本发明实施例中，样本信息平台可以是任一能够为用户提供某类信息对象，并且可以记录用户与各信息对象之间的交互关系的信息平台，也可以是这些信息平台中的某个子平台。为了描述方便，可以将信息对象简称为对象。

例如，样本信息平台可以为音乐网站，用户可以登录该音乐网站收听音乐，该音乐网站可以记录用户的收听历史、收藏的音乐、关注的歌手等信息；

又例如，样本信息平台可以为视频网站中电影频道，用户可以登录该视频网站观看电影频道提供的电影，同时电影频道的相关功能模块可以记录用户的观看历史、收藏的电影、关注的导演等信息。

可以理解的，样本信息平台中可以包括多个用户和多个对象，这些用户与对象具有交互关系。此外，样本信息平台中还可以包括用户与用户之间的关系，以及对象与对象之间的关系，例如，用户A与用户B为相互关注的好友，对象a与对象b为同一类型的信息等。

需要说明的是，在本发明实施例中，用户与对象之间的交互关系不仅可以是直接的交互关系，即用户与对象之间直接进行联系，例如，用户A观看了电影a，也可以是间接的交互关系，即用户与对象之间通过其他信息建立联系，例如，用户A与用户B为相互关注的好友，用户B观看了电影b，则可以认为用户A与电影b之间也具有交互关系，又例如，用户A观看了电影a，电影a与电影b为同一导演执导的电影，则可以认为用户A与电影b之间也具又交互关系。

根据样本信息平台中包括的多个用户、多个对象、用户与用户之间的关系、对象与对象之间的关系和用户与对象之间的交互关系，电子设备便可以执行上述步骤S201，在样本信息平台中获得多个用户信息对。其中，每个用户信息对包括一个样本用户向量和一个样本对象向量，且样本用户向量对应的样本用户与样本对象向量对应的样本对象具有交互关系。

可选的，一种具体实现方式中，可以首先对样本信息平台中的用户和对象进行编号，通过用户和对象的编号对用户和对象进行区分。

例如，将用户编号为：用户1、用户2、……、用户n；将对象编号为：对象1、对象2、……、对象m；其中，n为样本信息平台中用户的数量，m为样本信息平台中对象的数量。

需要说明的是，本发明实施例不对用户和对象的编号规则和方式进行具体限定。此外，对用户和对象进行编号可以是电子设备执行的，也可以是与电子设备建立通信连接的其他设备执行的，这些设备在对用户和对象进行编号后，可以将编号结果发送给电子设备。

可选的，一种具体实现方式中，样本用户向量与样本对象向量可以通过如下方式表示：

样本用户向量可以表示为：u＝(u₁，u₂，…，u_a，…，u_n)，其中，u_a表示用户a的第一数字标识，第一数字标识用于表征用户a是否为样本用户，1≤a≤n，|u|为样本信息平台中的用户的数量；

样本对象向量可以表示为：i＝(i₁，i₂，…，i_b，…，i_m)，其中，i_b表示对象b的第二数字标识，第二数字标识用于保证信息b是否为样本对象，1≤b≤m，|i|为样本信息网络中的对象的数量。

例如，在样本信息对(u1，i1)中，样本用户向量为：u1＝(0，0，1，0，0，0，0，0，0，0)，则该样本用户向量可以表征样本信息平台中的用户3为样本用户，该样本信息平台中用户的数量为10。样本对象向量为：i1＝(0，0，0，0，0，0，0，1，0，0，0，0，0，0，0)可以表征样本信息平台中的对象8为样本对象，该样本信息平台中对象的数量为15。该样本信息平台中，用户3与对象8具有交互关系。

需要说明的是，在本发明实施例中，电子设备获得的样本信息对的数量，可以根据实际应用中对推荐排行准确性的需求确定，当对准确性的需求较高时，电子设备获得的样本信息对的数量就较多，反之，则较少。

电子设备可以选择与其他用户或对象具有较多联系的用户和对象作为样本用户和样本对象，从而可以获得更丰富的交互关系，从而使最终确定的训练样本的特征更明显，更具代表性，进而，使最终得到的推荐模型可以学习到更优化的特征，提高基于该模型得到的推荐结果的准确性。

S202：针对每个用户信息对，获得该用户信息对所对应的路径实例，作为样本路径实例。

其中，路径实例为：该用户信息对所对应的样本用户访问样本对象的访问路径。

在获得多个用户信息对后，针对每个用户信息对，电子设备便可以根据样本信息平台中包括的多个用户、多个对象、用户与用户之间的关系、对象与对象之间的关系和用户与对象之间的交互关系，确定该用户信息对所对应的样本用户与样本对象之间的交互关系，也就是，电子设备可以确定该样本用户与样本对象之间是通过怎样的路径联系在一起的。

以图1为例，假设某个样本信息对所对应的样本样本为u1，样本对象为m2，则该用户信息对所对应的路径实例可以为：u1-u2-m2，也可以为：u1-m1-d1-m2，还可以为：u1-m1-u3-m2，当然根据图1可以发现，该存在其他的该用户信息对所对应的路径实例。

需要说明的是，电子设备在获得用户信息对所对应的路径实例时，可以获得用户信息对所对应的全部路径实例，也可以仅获得预设数量的路径实例，这些预设数量的路径实例具有更高的可能性，从而可以更好地保证训练得到的基于元路径上下文的推荐模型可以学习到更优化的特征，进而，可以提高基于该模型得到的推荐结果的准确性。当然，对于电子设备获得的用户信息对所对应的路径实例的具体数量，本发明实施例不做具体限定。

为了描述方面可以将电子设备获得的用户信息对所对应的路径实例简称为样本路径实例。同时，为了行文清晰，后续将会对上述步骤S202针对每个用户信息对，获得该用户信息对所对应的路径实例，作为样本路径实例的实现方式进行举例说明。

S203：针对每个用户信息对，生成样本用户向量对应的样本用户表征信息和样本对象向量对应的样本对象表征信息。

电子设备在获得每个用户信息对所对应的路径实例后，可以针对每个用户信息对，生成样本用户向量对应的样本用户表征信息和样本对象向量对应的样本对象表征信息。

可选地，在一种具体实现方式中，上述步骤S203可以包括：

针对每个用户信息对，利用第一预设公式，生成样本用户向量对应的样本用户表征信息和样本对象向量对应的样本对象表征信息；其中，第一预设公式为：

x_u＝P^T·p_u

y_i＝Q^T·q_i

其中，x_u为样本用户表征信息，P∈R^|u|×d，p_u∈R^|u|×1，y_i为样本对象表征信息，Q∈R^|i|×d，Q_i∈R^|i|×1，d为预设维度；

R为样本信息平台的隐形反馈矩阵，R∈R^n×m，n为样本信息平台中用户的数量，m为样本信息平台中对象的数量，n≥1，m≥1；

u为样本用户向量，u＝(u₁，u₂，…，u_a，…，u_n)，u_a表示用户a的第一数字标识，所述第一数字标识用于表征用户a是否为样本用户，1≤a≤n，|u|为所述样本信息平台中的用户的数量；

i为样本对象向量为：i＝(i₁，i₂，…，i_b，…，i_m)，i_b表示对象b的第二数字标识，所述第二数字标识用于保证信息b是否为样本对象，1≤b≤m，|i|为所述样本信息网络中的对象的数量。

需要说明的是，在本实现方式中，生成样本用户向量对应的样本用户表征信息和样本对象向量对应的样本对象表征信息可以称为样本用户向量和样本对象向量的嵌入。所谓嵌入是指：建立一个“查询层”来将样本用户和样本对象的独热码降维为稠密向量。

具体的，在本实现方式中，针对每个用户信息对，上述p_u∈R^|u|×1和Q_i∈R^|i|×1可以分别代表样本用户和样本对象的独热码表示。查询层则可以用上述参数矩阵P∈R^|u|×d和Q∈R^|i|×d表示，具体的查询操作则可以为上述第一预设公式的计算操作。

S204：针对每个用户信息对，利用与该用户信息对所对应的样本路径实例，生成该用户信息对所对应的元路径上下文表征信息。

针对每个用户信息对，在获得该用户信息对所对应的样本路径实例后，电子设备利用这些样本路径实例生成该用户信息对所对应的元路径上下文表征信息。生成用户信息对所对应的元路径上下文表征信息也可以称为用户信息对所对应的元路径上下文嵌入。

其中，元路径上下文是指在HIN中以某个特定元路径的方式链接元路径的两个节点的全部元路径实例的集合簇。

以图1为例。用户u1和电影m2可以由多条元路径相连，如“u₁-m₁-u₃-m₂″(UMUM)“u₁-m₁-t₁-m₂″(UMTM)这组成了交互u1-m2的上下文，不同的元路径通常代表了二者之间不同的交互语义。例如UMUM和UMTM路径均可以表示用户u1看过电影m2，因为UMUM表示有着相同观影记录的用户u3看过电影m2，UMTM表示用户u1看过与电影m2相同类型的Movie m1。这些元路径上下文通过聚合不同的元路径，表示了不同的交互语义。

可选地，在一种具体实现方式中，上述步骤S204可以包括：

步骤A1：针对每个用户信息对，确定该用户信息对所对应的样本路径中的元路径；

根据上述对步骤S202的说明，可以发现一个元路径实例可以产生多个路径实例，同样的，电子设备在上述步骤S202中确定的用户信息对所对应的样本路径实例可能属于不同的元路径。因此，针对每个用户信息对，电子设备可以确定该用户信息对所对应的样本路径中的元路径。

步骤A2：针对每个用户信息对，利用第二预设公式，生成与所该用户信息对所对应的每个样本路径实例的路径表征信息；其中，第二预设公式为：

h_p＝CNN(X^p；Θ)

其中，p为一个样本路径实例，X^p为表示样本路径实例p的矩阵，X^p∈R^L×d，CNN为卷积神经网络，Θ为CNN中的所有相关参数，h_p为样本路径实例p的路径表征信息，d为预设维度，L为所确定的元路径中每条元路径包括的样本路径实例的数量。

需要说明的是，生成用户信息对所对应的每个样本路径实例的路径表征信息可以称为样本路径实例的嵌入。可以理解的，一个样本路径实例是一些实体节点的序列，这些序列的长度可以改变。所谓样本路径实例的嵌入就是将该样本路径实例所对应的节点序列嵌入到低维向量中。在本实现方式中采用常用的CNN来处理这些可变长度的节点序列。其中，CNN包括一层卷积层和一层池化层。

步骤A3：针对每个用户信息对，利用第三预设公式，生成确定的每个元路径的元路径表征信息；其中，第三预设公式为：

其中，

为属于元路径ρ的K条样本路径实例的路径表征信息，c_ρ为元路径ρ的元路径表征信息；

需要说明的是，生成元路径的元路径表征信息可以称为元路径的嵌入。在本实现方式中，可以使用max池化的操作来获得元路径的嵌入。所谓max池化就是，针对每一个维度，将元路径ρ的K条样本路径实例的路径表征信息中的该维度的数值的最大值提取出来，并按照提取出来的每个最大值对应的维度，组成元路径ρ的元路径表征信息。

步骤A4：针对每个用户信息对，利用第四预设公式，生成该用户信息对所对应的元路径上下文表征信息；其中，第四预设公式为：

其中，c_u→i为该用户信息对所对应的元路径上下文表征信息，M_u→i为所确定的该用户信息对所对应的样本路径实例中的元路径的集合，|M_u→i|为集合中元素的数量。

需要说明的是，生成用户信息对所对应的元路径上下文表征信息可以称为用户信息对所对应的元路径上下文的嵌入。在上述步骤A4中，用户信息对所对应的每条元路径都受到了同等关注，而每条路径实例是根据用户信息对所对应的样本路径实例确定的，因此，元路径上下文的表征可以完全取决于确定的用户信息对所对应的路径实例。

在本实现方式所提供的针对每个用户信息对，利用与该用户信息对所对应的样本路径实例，生成该用户信息对所对应的元路径上下文表征信息的方式中，采用了“单路径实例的嵌入→单元路径实例的嵌入→元路径集的嵌入”的分层结构，可以使得到的样本信息对所对应的元路径实例上下文保证信息更有效。

需要说明的是，在本发明实施例中，上述步骤S203和步骤S204的执行顺序可以是步骤S203在步骤S204之前执行，也可以步骤S203在步骤S204之后执行，还可以是步骤S203和步骤S204同时执行，对此，本发明实施例不作具体限定，只要保证步骤S203和步骤204均在步骤S205之前执行即可。

S205：针对每个用户信息对，拼接该用户信息对所对应的样本用户表征信息、样本对象表征信息和元路径上下文表征信息，得到训练样本。

可以理解的，电子设备在执行步骤S201时，获得每个用户信息对均为由两个向量构成的向量对，而针对每个用户信息对，电子设备在执行上述步骤S202时，获得的该用户信息对所对应的路径实例均为如上述u1-m1-u3-m2所示的路径关系。也就是说，在本发明实施例中，用户信息对和用户信息对所对应的路径实例具有完全不同的表示方式。

因此，为了能够利用用户信息对和用户信息对所对应的路径实例生成训练样本，电子设备可以执行上述步骤S203与步骤S204，针对每个用户信息对，生成样本用户向量对应的样本用户表征信息、样本对象向量对应的样本对象表征信息和该用户信息对所对应的元路径上下文表征信息。进而，可以执行上述步骤S205，针对每个用户信息对，通过拼接操作处理，将该用户信息对所对应的样本用户表征信息、样本对象表征信息和元路径上下文表征信息拼接在一起，得到训练样本。

可选地，在一种具体实现方式中，上述步骤S205可以包括：

针对每个用户信息对，利用第五预设公式，拼接该用户信息所对应的样本用户表征信息、样本对象表征信息和元路径上下文表征信息，得到训练样本；其中，第五预设公式为：

其中，x_u，i为训练样本，

为向量的拼接操作。

例如，x_u＝(0，0，1)、c_u→i＝(1，2，3)、y_i＝(1，1，0)时，利用上述第五预设公式，得到拼接后的x_u，i＝(0，0，1，1，2，3，1，1，0)。

S206：将得到的多个训练样本作为输入，对预设神经网络模型进行训练，直至通过损失函数计算得到的函数值小于预设阈值时，完成神经网络模型的训练。

其中，针对任一训练样本，神经网络模型的输出为：向该训练样本所对应样本用户，推荐的各个样本对象的推荐排行顺序。为了描述方便，将向该训练样本所对应样本用户，推荐的各个样本对象的推荐排行顺序简称为：样本推荐排行顺序。

在得到多个训练样本之后，电子设备可以将多个训练样本作为输入，对预设神经网络模型进行训练。在训练过程中，预设神经网络模型可以学习训练样本的特点，并针对任一训练样本，输出向该训练样本所对应的样本用户，推荐的各个样本对象的推荐排行顺序。经过大量的训练样本的学习，方面挖掘模型可以建立训练样本与样本推荐排行顺序的对应关系。进而，当通过损失函数计算得到的函数值小于预设阈值时，完成神经网络模型的训练。

其中，预设阈值可以根据实际应用中对推荐排行顺序的准确性的需求确定，当对准确性的需求较高时，预设阈值可以较低，反之，则较高。

可选的，一种具体实现方式中，上述预设神经网络模型可以是MLP(multi-layerperceptron，多层感知机)，从而电子设备可以使用一个非线性函数来建模。如下式所示：

其中，

为预设神经网络模型的输出。MLP部分使用了两层带有ReLU作为激活函数的隐藏层，以及一个带有Sigmoid激活函数的输出层。由于神经网络模型可以通过使用窄而深的结构来抽取更强的抽象特征，因此，可以为MLP部分构建为一种塔结构，每高一层都减少一半层大小。

可选的，一种具体实现方式中，损失函数可以为：

其中，l_u，i为损失函数，

为观测到的交互，

为从噪声分布P_neg中提取的负反馈，在本实现方式中，可以将造成分布设为均匀分布，从而可以将其扩展为其他有偏分布，例如，基于流行度的分布。

需要说明的是，在本发明实施例中，上述步骤S206中的预设神经网络模型只是本发明实施例所训练的推荐模型的组成部分，而并不是完整的推荐模型。而本发明实施例所提供的完整的推荐模型还包括执行上述步骤202-S205，生成训练样本的模块。

因此，本发明实施例提供的完整的推荐模型，在训练过程中可以学习用户信息对和用户信息对所对应的样本路径实例的特征，输出样本推荐排行顺序。经过大量的用户信息对和用户信息对所对应的样本路径实例的学习，推荐模型可以逐步建立用户信息对、用户信息对所对应的样本路径实例和样本推荐排行顺序的对应关系。

以上可见，本发明实施例提供的方案，在样本信息平台中获得多个用户信息对后，针对每个用户信息对，确定该用户信息对所对应的样本用户表征信息和样本对象表征信息，并根据获得的样本用户与样本对象之间的路径实例，确定样本用户与样本对象之间的元路径上下文表征信息。进而根据上述样本用户表征信息、样本对象表征信息和元路径上下文表征信息确定每个用户信息对所对应的训练样本，并利用训练样本对模型进行训练。由于获得的训练样本中融入了样本用户与样本对象之间的元路径上下文表征信息，也就是说，在获得训练样本时考虑了样本用户与样本对象之间不同元路径样本用户与样本对象的交互的影响。因此，训练得到的基于元路径上下文的推荐模型可以学习到更优化的特征，进而，可以提高基于该模型得到的推荐结果的准确性。

在图2所示的实施例基础上，本发明实施例还提供了另一种基于元路径上下文的推荐模型训练方法。

图3为本发明实施例提供的另一种基于元路径上下文的推荐模型训练方法的流程示意图。如图3所示，本发明实施例提供的另一种基于元路径上下文的推荐模型训练方法，可以包括：

S301：在样本信息平台中获得多个用户信息对。

S302：针对每个用户信息对，获得该用户信息对所对应的路径实例，作为样本路径实例。

S303：针对每个用户信息对，生成样本用户向量对应的样本用户表征信息和样本对象向量对应的样本对象表征信息。

S304：针对每个用户信息对，利用与该用户信息对所对应的样本路径实例，生成该用户信息对所对应的元路径上下文表征信息。

需要说明的是，上述步骤S301-S304与上述步骤S201-S204相同，这里不再赘述。

S305：针对每个用户信息对，对该用户信息对所对应的样本用户表征信息、样本对象表征信息和元路径上下文表征信息进行增强处理。

可以理解的，由于用户的对各类对象的喜好以及对各类信息的获取方式可以不同，因此，用于对元路径可以有不同的偏好。即使对同一用户而言，元路径在其与不同的对象的交互中也可以有着不同的语义。

因此，一个能够较好的生成用户信息对所对应的样本用户表征信息、样本对象表征信息和元路径上下文表征信息的方法应该是面向交互的，能够在各种复杂的推荐场景中提供不同的语义。此外，在一个用户信息对所对应的样本用户和样本对象的交互中，元路径可以提供重要的上下文信息，而该用户信息对所对应的样本用户和样本对象也可以受到这种交互的上下文的影响。

基于上述原因，电子设备在获得用户信息对所对应的样本用户表征信息、样本对象表征信息和元路径上下文表征信息后，可以执行上述步骤S205，根据co-attention(Collaborative attention mechanism，协同注意力机)机制，以相互增强的方式改进得到的用户信息对所对应的样本用户表征信息、样本对象表征信息和元路径上下文表征信息，从而开发出一种更有效的生成用户信息对所对应的样本用户表征信息、样本对象表征信息和元路径上下文表征信息的方法。

可选地，在一种具体实现方式中，上述步骤S305可以包括：

步骤B1：针对每个用户信息对，利用第六预设公式，增强该用户信息对所对应的元路径上下文表征信息；其中，第六预设公式为：

其中，c′_u→i为增强后的元路径上下文表征信息；

α_u，i，ρ是针对交互产生的权值，

为利用两层架构对元路径上下文表征信息进行增强时，第一层的用户权重矩阵，

为利用两层架构对元路径上下文表征信息进行增强时，第一层的元路径权重矩阵，b⁽¹⁾为利用两层架构对元路径上下文表征信息进行增强时，第一层的偏置矩阵，w⁽²⁾为利用两层架构对元路径上下文表征信息进行增强时，第二层的权值向量，b⁽²⁾为利用两层架构对元路径上下文表征信息进行增强时，第二层的偏置矩阵，f为ReLU函数，ρ′为上述步骤A1中针对每个用户信息对确定的元路径中的任一元路径。

可以理解的，

可以通过下面的公式计算得到：

其中，

需要说明的是，由于不同的元路径在交互中可以有不同的语义，因此，在对用户信息对所对应的元路径上下文表征信息进行增强时，可以学习用户信息对所对应的样本用户的样本用户表征信息和样本对象的样本对象表征信息上对元路径在特定的交互中的权值，该权值也可以称为attention权值。

在本实现方式中，可以采用两层架构来实现增强。

步骤B2：针对每个用户信息对，利用第七预设公式，增强该用户信息对所对应的样本用户表征信息和样本对象表征信息；其中，第七预设公式为：

其中，

为增强后的样本用户表征信息，

为增强后的样本对象表征信息，⊙为内积计算符号；

β_u＝f(W_ux_u+W_u→ic′_u→i+b_u)

β_i＝f(W′_iy_i+W′_u→ic′_u→i+b′_i)

W_u为针对用户的增强层的用户权重矩阵，W_u→i为针对用户的增强层的元路径上下文权重矩阵，b_u为针对用户的偏置向量，W′_i为针对信息的增强层的信息权重矩阵，W′_u→i为针对信息的增强层的信息权重矩阵，b′_i为针对信息的偏置矩阵。

需要说明的是，在本实现方式中，可以采用单层网络来计算上述β_u和β_i。

S306：针对每个用户信息对，拼接该用户信息对所对应的增强后的样本用户表征信息、样本对象表征信息和元路径上下文表征信息，得到训练样本。

针对每个用户信息对，电子设备在对该用户信息对所对应的样本用户表征信息、样本对象表征信息和元路径上下文表征信息进行增强处理后，可以执行上述步骤S306，针对每个用户信息对，拼接该用户信息对所对应的增强后的样本用户表征信息、样本对象表征信息和元路径上下文表征信息，得到训练样本。

可选地，在一种具体实现方式中，上述步骤S306可以包括：

针对每个用户信息对，利用第八预设公式，拼接该用户信息所对应的增强后的样本用户表征信息、样本对象表征信息和元路径上下文表征信息，得到训练样本；其中，第八预设公式为：

其中，

为训练样本，

为向量的拼接操作。

在本实现方式中，拼接操作与上述步骤S205中相同，这里不再赘述。

S307：将得到的多个训练样本作为输入，对预设神经网络模型进行训练，直至通过损失函数计算得到的函数值小于预设阈值时，完成神经网络模型的训练。

其中，针对任一训练样本，神经网络模型的输出为：向该训练样本所对应样本用户，推荐的各个样本对象的推荐排行顺序。

需要说明的是，上述步骤S307与上述步骤S206相同，这里不再赘述。

下面，对上述步骤S202针对每个用户信息对，获得该用户信息对所对应的路径实例，作为样本路径实例的具体实现方式进行举例说明。

可选的，在一种具体实现方式中，上述步骤S202可以包括：

步骤C1：根据样本信息平台中存在的交互关系，建立交互网络，其中，交互网络中的每个节点标识该样本信息平台中的一个信息项目，两个相连的节点标识该两个节点标识的信息项目之间具有直接交互关系。

在样本信息平台中，用户与对象之间的交互关系不仅可以是直接的交互关系，即用户与对象之间直接进行联系，也可以是间接的交互关系，即用户与对象之间通过其他信息建立联系。因此，在样本信息平台中，参与交互的信息项目除了用户和对象外，还可以有其他类型的信息项目，例如，对象类型、对象作者等。以图1为例，信息项目可以包括用户、电影、电影类型和电影导演。

因此，电子设备在建立样本信息平台所对应的交互网络时，可以将参与该样本信息平台交互的每一个信息项目作为一个节点，当两个信息项目之间不需要第三方的参与，可以直接进行交互时，便可以用线段连接标识这两个信息项目的节点。当该样本信息平台中存在的所有直接交互关系均通过节点与连线标识出后，则生成该样本信息平台的交互网络。

步骤C2：利用预先建立的SVDFeature模型，获得交互网络中每个节点对应的节点向量。

可以理解的，上述得到的交互网络不能直接用来获得用户信息对所对应的路径实例，为了避免噪声干扰，得到得到高质量的用户信息对所对应的路径实例，则需要对用户信息对所对应的路径实例进行选择。显然，不能直接通过上述得到的交互网络来获得高质量的用户信息对所对应的路径实例。

因此，在交互网络建立完成后，电子设备可以利用建立的SVDFeature模型，获得交互网络中每个节点对应的节点向量。这样，就可以将直观的交互网络从图形表达方式转换为数学表达方式，进而，便于获得高质量的用户信息对所对应的路径实例。

可以理解的，上述交互网络可以转化为交互矩阵，在该矩阵中，当两个节点之间具有直接的交互关系时，则矩阵中与这两个节点对应的元素的数值可以为1，当两个节点之间不具有直接的交互关系时，则矩阵中与这两个节点对应的元素的数值可以为0。

因此，SVDFeature模型可以将上述交互矩阵分解为低秩的用户矩阵和对象矩阵，并在矩阵分解的基础上增加特征信息。

步骤C3：计算交互网络中任意两个相连的节点对应的节点向量的内积，作为由该两个节点中的一个节点转移到另一个节点的转移概率。

在获得交互网络中每个节点对应的节点向量后，电子设备可以计算交互网络中任意两个相连的节点对应的节点向量的内积，作为由该两个节点中的一个节点转移到另一个节点的转移概率。

可以理解的，在交互网络中，一个节点可以通过线段与多个节点相互连接，也就是说，一个节点标识的信息项目在实际的交互关系中可以与多个信息项目形成多条路径实例。在实际的交互关系中，一个信息项目与多个信息项目进行交互的概率是不同的，也就是说，在交互网络中，确定一个节点后，该节点转移到与其相连的所有节点中每个节点的概率是不同的，这个概率可以称为由该节点转移到与其相连的另一节点的转移概率。

步骤C4：针对每个用户信息对，确定与该用户信息对所对应的所有路径实例，并确定所有路径实例中的每一个路径实例对应的节点转移路线。

针对每个用户信息对，电子设备可以确定与该用户信息对所对应的所有路径实例，进而，根据上述路径实例确定每一个路径实例对应的节点转移路线。

可以理解的，每一个路径实例中涉及到的信息项目都可以在交互网络中找到对应的节点，则这些节点和节点间用来连接节点的线段就可以构成该路径实例对应的节点转移路线。

步骤C5：针对每个用户信息对所对应的每个节点转移路线，计算从该节点转移路线中的第一个节点转移到最后一个节点的过程中，所涉及的转移概率的和。

针对每个用户信息对所对应的每个节点转移路线，电子设备可以计算从该节点转移路线中的第一个节点转移到最后一个节点的过程中，所涉及的转移概率的和。

可以理解的，针对每个节点转移路线，从第一个节点到最后一个节点之间可以包括多个节点，这些节点之间，每从一个节点转移到另外一个节点，都存在一个转移概率，进而，电子设备可以计算这些转移概率的和，计算得到的转移概率的和可以表征该节点转移路线所对应的交互关系在实际中出现的可能性。当然，每个节点转移路线也可以只包括两个节点，那么这两个节点之间的转移概率即为该节点转移路线的转移概率的和。

步骤C6：针对每个用户信息对，按照计算得到的转移概率的和，由大到小获取预设数量的节点转移路线对应的路径实例，作为样本路径实例。

为了得到高质量的用户信息对所对应的路径实例，针对每个用户信息对，电子设备可以按照计算得到的转移概率的和，由大到小获取预设数量的节点转移路线对应的路径实例，作为样本路径实例。

可以理解的，计算得到的转移概率的和越大，则可以说明该节点转移路线所对应的交互关系在实际中出现的可能性越高，进而，可以说明该节点转移路线对应的路径实例质量越高，因此，可以电子设备可以从转移概率的和最大的节点转移路线开始，按照转移概率的和由大到小的顺序，获取预设数量的节点转移路线，并确定所获取的节点转移路线对应的路径实例作为样本路径实例。其中，预设数量的大小可以根据实际应用中对推荐排行的准确性的需求确定，当对准确性的需求较高时，预设数量可以较大，反之，则较小。

对应于上述基于元路径上下文的推荐模型训练方法，本发明实施例提供了一种向用户推荐信息的方法。

本发明实施例所提供的一种向用户推荐信息的方法可以应用于任意电子设备，例如，可以手机、平板电脑、笔记本电脑、台式电脑等，在此不做具体限定。为了描述方面，将用于向用户推荐信息的电子设备简称为推荐电子设备。

图4为本发明实施例提供的一种向用户推荐信息的方法的流程示意图。如图4所示，本发明实施例提供的一种向用户推荐信息的方法，可以包括如下步骤：

S401：在目标信息平台中，获取与目标用户对应的多个目标信息对。

其中，目标信息对包括目标用户对应的用户向量和一个对象向量，每个目标信息对包括的对象向量不同。

在本发明实施例中，目标信息平台是与上述样本信息平台类似的信息平台，即其可以是任一能够为用户提供某类信息对象，并且可以记录用户与各信息对象之间的交互关系的信息平台，或者也可以是这些信息平台中的某个子平台。因此，目标信息平台与上述样本信息平台可以为相同的信息平台，也可以为不同的信息平台。为了描述方便，可以将信息对象简称为对象。

在本发明实施例中，当需要向某个用户推荐信息时，该用户可以作为目标用户，进而，根据向目标用户推荐的信息所在的目标信息平台的相关情况，推荐电子设备便可以在目标信息平台中，获取与目标用户对应的多个目标信息对。

可以理解的，本发明实施例提供的方法是向目标用户提供其所在目标信息平台中包括的对象，因此，每个目标信息对中的目标用户向量是相同的，而不同的对象向量是不同的。可以理解的，本发明实施例中的目标用户向量与上述样本用户向量的表达方式以及向量中各元素所表征的含义是相同的，同理，本发明实施例中的对象向量与上述样本对象向量的表达方式以及向量中各元素所表征的含义也是相同的。

需要说明的是，在本发明实施例中，推荐电子设备获得的目标信息对的数量，可以根据实际应用中对推荐信息的准确性需求确定，当对准确性的需求较高时，推荐电子设备获得的目标信息对的数量就较多，反之，则较少。

S402：针对每个目标信息对，获得与该用户信息对所对应的路径实例。

在获得多个目标信息对后，针对每个目标信息对，推荐电子设备便可以根据目标信息平台中包括的多个用户、多个对象、用户与用户之间的关系、对象与对象之间的关系和用户与对象之间的交互关系，确定该目标信息对所对应的目标用户与对象之间的交互关系，也就是，推荐电子设备可以确定该目标用户与对象之间是通过怎样的路径联系在一起的。

需要说明的是，推荐电子设备在获得目标信息对所对应的路径实例时，可以获得目标信息对所对应的全部路径实例，也可以仅获得预设数量的路径实例。

在本发明实施例中，针对每个目标信息对，推荐电子设备获得与该用户信息对所对应的路径实例的方法可以与上述步骤S202中，针对每个用户信息对，电子设备获得该用户信息对所对应的路径实例的方法相同，在此不再赘述。

S403：将多个目标信息对和与每个目标信息对所对应的路径实例输入到预设的推荐模型中进行检测，得到向目标用户推荐的、多个目标信息对所对应的对象中每个对象的推荐排行顺序。

其中，推荐模型通过上述第一方面提供的一种基于元路径上下文的推荐模型训练方法中任一项的方法训练得到。

在获得多个目标信息对和与每个目标信息对所对应的路径实例后，推荐电子设备可以将上述多个目标信息对和与每个目标信息对所对应的路径实例输入预设的推荐模型中进行检测，进而，该预设的推荐模型可以输出向目标用户推荐的、多个目标信息对所对应的对象中每个对象的推荐排行顺序。

由于预设的推荐模型是通过上述一种基于元路径上下文的推荐模型训练方法训练得到的，也就是基于用户信息对和用户信息对所对应的样本路径实例对推荐模型进行训练，在训练过程中，推荐模型可以用户信息对和用户信息对所对应的样本路径实例，逐步建立用户信息对、用户信息对所对应的样本路径实例和样本推荐排行顺序的对应关系，进而得到训练完成的推荐模型。因此，训练得到的推荐模型也就可以用于对目标用户的多个目标信息对和与每个目标信息对所对应的路径实例进行检测，输出向目标用户推荐的、多个目标信息对所对应的对象中每个对象的推荐排行顺序。

也就是在上述步骤S403中，预设的推荐模型在对目标用户的多个目标信息对和与每个目标信息对所对应的路径实例进行检测时，根据多个目标信息对和与每个目标信息对所对应的路径实例，以及已建立的用户信息对、用户信息对所对应的样本路径实例和样本推荐排行顺序的对应关系的对应关系，确定向目标用户推荐的、多个目标信息对所对应的对象中每个对象的推荐排行顺序并输出，推荐电子设备也就可以确定向目标用户推荐的、多个目标信息对所对应的对象中每个对象的推荐排行顺序。

以上可见，本发明实施例提供的方案，通过预设的推荐模型对向目标用户推荐的、多个目标信息对所对应的对象中每个对象的推荐排行顺序进行确定。由于在训练过程中，该推荐模型考虑了用户与对象和之间的不同元路径对用户与对象的交互的影响，使该预设的推荐模型可以学习到更优化的特征。因此，在本发明实施例提供的方案中，基于该预设的推荐模型确定的向目标用户推荐的、多个目标信息对所对应的对象中每个对象的推荐排行顺序的准确性较高，也就是该预设的推荐模型得到的推荐结果的准确性较高。

对应于上述一种基于元路径上下文的推荐模型训练方法，本发明实施例还提供了一种基于元路径上下文的推荐模型训练装置。

下面，对本发明实施例提供的一种基于元路径上下文的推荐模型训练装置进行介绍。

图5为本发明实施例提供的一种基于元路径上下文的推荐模型训练装置的结构示意图。如图5所示，本发明实施例提供的一种基于元路径上下文的推荐模型训练装置，可以包括如下模块：

信息获取模块510，用于在样本信息平台中获得多个用户信息对，其中，每个用户信息对包括一个样本用户向量和一个样本对象向量，样本用户向量对应的样本用户与样本对象向量对应的样本对象具有交互关系；

路径获取模块520，用于针对每个用户信息对，获得该用户信息对所对应的路径实例，作为样本路径实例，其中，路径实例为：该用户信息对所对应的样本用户访问样本对象的访问路径；

第一表征信息生成模块530，用于针对每个用户信息对，生成样本用户向量对应的样本用户表征信息和样本对象向量对应的样本对象表征信息；

第二表征信息生成模块540，用于针对每个用户信息对，利用与该用户信息对所对应的样本路径实例，生成该用户信息对所对应的元路径上下文表征信息；

样本获得模块550，用于针对每个用户信息对，拼接该用户信息对所对应的样本用户表征信息、样本对象表征信息和元路径上下文表征信息，得到训练样本；

模型训练模块560，用于将得到的多个训练样本作为输入，对预设神经网络模型进行训练，直至通过损失函数计算得到的函数值小于预设阈值时，完成神经网络模型的训练；其中，针对任一训练样本，神经网络模型的输出为：向该训练样本所对应样本用户，推荐的各个样本对象的推荐排行顺序。

作为本发明实施例的一种实施方式，上述装置还可以包括：

表征信息增强模块(图5中未示出)，用于在针对每个用户信息对，利用与该用户信息对所对应的样本路径实例，生成该用户信息对所对应的元路径上下文表征信息之后，针对每个用户信息对，对该用户信息对所对应的样本用户表征信息、样本对象表征信息和元路径上下文表征信息进行增强处理；

则在本实施方式中，样本获得模块450可以包括样本获得子模块(图5中未示出)，该样本获得子模块用于针对每个用户信息对，拼接该用户信息对所对应的增强后的样本用户表征信息、样本对象表征信息和元路径上下文表征信息，得到训练样本。

作为本发明实施例的一种实施方式，上述第一表征信息生成模块430，可以具体用于针对每个用户信息对，利用第一预设公式，生成样本用户向量对应的样本用户表征信息和样本对象向量对应的样本对象表征信息；其中，第一预设公式为：

x_u＝P^T·p_u

y_i＝Q^T·q_i

作为本发明实施例的一种实施方式，上述路径获取模块420可以包括：

网络建立子模块(图5中未示出)，用于根据样本信息平台中存在的交互关系，建立交互网络，其中，交互网络中的每个节点标识该样本信息平台中的一个信息项目，两个相连的节点标识该两个节点标识的信息项目之间具有直接交互关系；

向量获得子模块(图5中未示出)，用于利用预先建立的SVDFeature模型，获得交互网络中每个节点对应的节点向量；

概率计算子模块(图5中未示出)，用于计算交互网络中任意两个相连的节点对应的节点向量的内积，作为由该两个节点中的一个节点转移到另一个节点的转移概率；

路线确定子模块(图5中未示出)，用于针对每个用户信息对，确定与该用户信息对所对应的所有路径实例，并确定所有路径实例中的每一个路径实例对应的节点转移路线；

概率和计算子模块(图5中未示出)，用于针对每个用户信息对所对应的每个节点转移路线，计算从该节点转移路线中的第一个节点转移到最后一个节点的过程中，所涉及的转移概率的和；

路径获取子模块(图5中未示出)，用于针对每个用户信息对，按照计算得到的转移概率的和，由大到小获取预设数量的节点转移路线对应的路径实例，作为样本路径实例。

作为本发明实施例的一种实施方式，上述第二表征信息生成模块440可以包括：

元路径确定子模块(图5中未示出)，用于针对每个用户信息对，确定该用户信息对所对应的样本路径中的元路径；

第一计算子模块(图5中未示出)，用于针对每个用户信息对，利用第二预设公式，生成与所该用户信息对所对应的每个样本路径实例的路径表征信息；其中，第二预设公式为：

h_p＝CNN(X^p；Θ)

其中，p为一个样本路径实例，X^p为表示样本路径实例p的矩阵，X^p∈R^L×d，CNN为卷积神经网络，Θ为CNN中的所有相关参数，h_p为样本路径实例p的路径表征信息，d为预设维度，L为所确定的元路径中每条元路径包括的样本路径实例的数量；

第二计算子模块(图5中未示出)，用于针对每个用户信息对，利用第三预设公式，生成确定的每个元路径的元路径表征信息；其中，第三预设公式为：

其中，

第三计算子模块(图5中未示出)，用于针对每个用户信息对，利用第四预设公式，生成该用户信息对所对应的元路径上下文表征信息；其中，第四预设公式为：

作为本发明实施例的一种实施方式，上述样本获得模块450可以具体用于：

其中，x_u，i为训练样本，

为向量的拼接操作。

作为本发明实施例的一种实施方式，上述表征信息增强模块(图5中未示出)可以包括：

第一增强模块(图5中未示出)，用于针对每个用户信息对，利用第六预设公式，增强该用户信息对所对应的元路径上下文表征信息；其中，第六预设公式为：

其中，c′_u→i为增强后的元路径上下文表征信息；

为利用两层架构对元路径上下文表征信息进行增强时，第一层的元路径权重矩阵，b⁽¹⁾为利用两层架构对元路径上下文表征信息进行增强时，第一层的偏置矩阵，w⁽²⁾为利用两层架构对元路径上下文表征信息进行增强时，第二层的权值向量，b⁽²⁾为利用两层架构对元路径上下文表征信息进行增强时，第二层的偏置矩阵，f为ReLU函数，ρ′为所确定的该用户信息对所对应的样本路径中的元路径中的任一元路径；

第二增强模块(图5中未示出)，用于针对每个用户信息对，利用第七预设公式，增强该用户信息对所对应的样本用户表征信息和样本对象表征信息；其中，第七预设公式为：

其中，

为增强后的样本用户表征信息，

为增强后的样本对象表征信息，⊙为内积计算符号；

β_u＝f(W_ux_u+W_u→ic′_u→i+b_u)

β_i＝f(W′_iy_i+W′_u→ic′_u→i+b′_i)

作为本发明实施例的一种实施方式，上述样本获得子模块(图5中未示出)可以包括样本获得单元(图5中未示出)，样本获得单元可以用于：

其中，

为训练样本，

为向量的拼接操作。

对应于上述一种用户推荐信息的方法，本发明实施例提供了一种向用户推荐信息的装置。

下面，对本发明实施例提供的一种向用户推荐信息的装置进行介绍。

图6为本发明实施例提供的一种向用户推荐信息的装置的结构示意图。如图6所示，本发明实施例所提供的一种向用户推荐信息的装置，可以包括如下模块：

目标信息获取模块610，用于在目标信息平台中，获取与目标用户对应的多个目标信息对，其中，目标信息对包括目标用户对应的用户向量和一个对象向量，每个目标信息对包括的对象向量不同；

目标路径获得模块620，用于针对每个目标信息对，获得与该用户信息对所对应的路径实例；

推荐信息获得模块630，用于将多个目标信息对和与每个目标信息对所对应的路径实例输入到预设的推荐模型中进行检测，得到向目标用户推荐的、多个目标信息对所对应的对象中每个对象的推荐排行顺序，其中，推荐模型通过上述第一方面提供的一种基于元路径上下文的推荐模型训练方法中任一项的方法训练得到。

对应于上述一种基于元路径上下文的推荐模型训练方法，本发明实施例还提供了一种电子设备，如图7所示，包括处理器701、通信接口702、存储器703和通信总线704，其中，处理器701，通信接口702，存储器703通过通信总线704完成相互间的通信，

存储器703，用于存放计算机程序；

处理器701，用于执行存储器703上所存放的程序时，实现上述本发明实施例提供的一种基于元路径上下文的推荐模型训练方法的方法步骤。

对应于上述一种向用户推荐信息的方法，本发明实施例还提供了另一种电子设备，如图8所示，包括处理器801、通信接口802、存储器803和通信总线804，其中，处理器801，通信接口802，存储器803通过通信总线804完成相互间的通信，

存储器803，用于存放计算机程序；

处理器801，用于执行存储器803上所存放的程序时，实现上述本发明实施例提供的一种向用户推荐信息的方法的方法步骤。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，PCI)总线或扩展工业标准结构(Extended IndustryStandardArchitecture，EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital SignalProcessing，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable GateArray，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

对应于上述本发明实施例提供的一种基于元路径上下文的推荐模型训练方法，本发明实施例还提供了一种计算机可读存储介质，该计算机可读存储介质为服务器中的存储介质，其中存储有计算机程序，该计算机程序被处理器执行时实现本发明实施例提供的一种基于元路径上下文的推荐模型训练方法的方法步骤。

对应于上述本发明实施例提供的一种向用户推荐信息的方法，本发明实施例还提供了另一种计算机可读存储介质，该计算机可读存储介质为服务器中的存储介质，其中存储有计算机程序，该计算机程序被处理器执行时实现本发明实施例提供的一种向用户推荐信息的方法的方法步骤。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个......”限定的要素，并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例、电子设备实施例、计算机可读存储介质实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种基于元路径上下文的推荐模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，在所述针对每个用户信息对，利用与该用户信息对所对应的样本路径实例，生成该用户信息对所对应的元路径上下文表征信息的步骤之后，所述方法还包括：

针对每个用户信息对，对该用户信息对所对应的样本用户表征信息、样本对象表征信息和元路径上下文表征信息进行增强处理；

所述针对每个用户信息对，拼接该用户信息对所对应的样本用户表征信息、样本对象表征信息和元路径上下文表征信息，得到训练样本的步骤，包括：

针对每个用户信息对，拼接该用户信息对所对应的增强后的样本用户表征信息、样本对象表征信息和元路径上下文表征信息，得到训练样本。

3.根据权利要求1所述的方法，其特征在于，所述针对每个用户信息对，生成样本用户向量对应的样本用户表征信息和样本对象向量对应的样本对象表征信息的步骤，包括：

针对每个用户信息对，利用第一预设公式，生成样本用户向量对应的样本用户表征信息和样本对象向量对应的样本对象表征信息；其中，所述第一预设公式为：

x_u＝P^T·p_u

y_i＝Q^T·q_i

R为所述样本信息平台的隐形反馈矩阵，R∈R^n×m，n为所述样本信息平台中用户的数量，m为所述样本信息平台中对象的数量，n≥1，m≥1；

4.根据权利要求1所述的方法，其特征在于，所述针对每个用户信息对，获得该用户信息对所对应的路径实例，作为样本路径实例的步骤，包括：

根据所述样本信息平台中存在的交互关系，建立交互网络，其中，所述交互网络中的每个节点标识该样本信息平台中的一个信息项目，两个相连的节点标识该两个节点标识的信息项目之间具有直接交互关系；

利用预先建立的SVDFeature模型，获得所述交互网络中每个节点对应的节点向量；

计算所述交互网络中任意两个相连的节点对应的节点向量的内积，作为由该两个节点中的一个节点转移到另一个节点的转移概率；

针对每个用户信息对，确定与该用户信息对所对应的所有路径实例，并确定所述所有路径实例中的每一个路径实例对应的节点转移路线；

针对每个用户信息对所对应的每个节点转移路线，计算从该节点转移路线中的第一个节点转移到最后一个节点的过程中，所涉及的转移概率的和；

针对每个用户信息对，按照计算得到的转移概率的和，由大到小获取预设数量的节点转移路线对应的路径实例，作为样本路径实例。

5.根据权利要求4所述的方法，其特征在于，所述针对每个用户信息对，利用与该用户信息对所对应的样本路径实例，生成与该用户信息对所对应的元路径上下文表征信息的步骤，包括：

针对每个用户信息对，确定该用户信息对所对应的样本路径中的元路径；

针对每个用户信息对，利用第二预设公式，生成与所该用户信息对所对应的每个样本路径实例的路径表征信息；其中，所述第二预设公式为：

h_p＝CNN(X^p；Θ)

针对每个用户信息对，利用第三预设公式，生成确定的每个元路径的元路径表征信息；其中，所述第三预设公式为：

其中，

针对每个用户信息对，利用第四预设公式，生成该用户信息对所对应的元路径上下文表征信息；其中，所述第四预设公式为：

其中，c_u→i为该用户信息对所对应的元路径上下文表征信息，M_u→i为所确定的该用户信息对所对应的样本路径实例中的元路径的集合，|M_u→i|为所述集合中元素的数量。

6.根据权利要求3-5任一项所述的方法，其特征在于，所述针对每个用户信息对，拼接该用户信息对所对应的样本用户表征信息、样本对象表征信息和元路径上下文表征信息，得到训练样本的步骤，包括：

针对每个用户信息对，利用第五预设公式，拼接该用户信息所对应的样本用户表征信息、样本对象表征信息和元路径上下文表征信息，得到训练样本；其中，所述第五预设公式为：

其中，x_u，i为训练样本，

为向量的拼接操作。

7.根据权利要求2-5任一项所述的方法，其特征在于，所述针对每个用户信息对，增强该用户信息对所对应的样本用户表征、样本对象表征和元路径上下文表征的步骤，包括：

针对每个用户信息对，利用第六预设公式，增强该用户信息对所对应的元路径上下文表征信息；其中，所述第六预设公式为：

其中，c′_u→i为增强后的元路径上下文表征信息；

为利用两层架构对元路径上下文表征信息进行增强时，第一层的元路径权重矩阵，b⁽¹⁾为利用两层架构对元路径上下文表征信息进行增强时，第一层的偏置矩阵，w⁽²⁾为利用两层架构对元路径上下文表征信息进行增强时，第二层的权值向量，b⁽²⁾为利用两层架构对元路径上下文表征信息进行增强时，第二层的偏置矩阵，f为ReLU(Rectified Linear Unit)线性整流函数，ρ′为针对每个用户信息对，所确定的该用户信息对所对应的样本路径中的元路径中的任一个；

针对每个用户信息对，利用第七预设公式，增强该用户信息对所对应的样本用户表征信息和样本对象表征信息；其中，所述第七预设公式为：

其中，

为增强后的样本用户表征信息，

为增强后的样本对象表征信息，⊙为内积计算符号；

β_u＝f(W_ux_u+W_u→ic＇_u→i+b_u)

β_i＝f(W＇_iy_i+W＇_u→ic＇_u→i+b′_i)

W_u为针对用户的增强层的用户权重矩阵，W_u→i为针对用户的增强层的元路径上下文权重矩阵，b_u为针对用户的偏置向量，W′_i为针对信息的增强层的信息权重矩阵，W＇_u→i为针对信息的增强层的信息权重矩阵，b＇_i为针对信息的偏置矩阵。

8.根据权利要求7所述的方法，其特征在于，所述针对每个用户信息对，拼接该用户信息对所对应的增强后的样本用户表征信息、样本对象表征信息和元路径上下文表征信息，得到训练样本的步骤，包括：

针对每个用户信息对，利用第八预设公式，拼接该用户信息所对应的增强后的样本用户表征信息、样本对象表征信息和元路径上下文表征信息，得到训练样本；其中，所述第八预设公式为：

其中，

为训练样本，

为向量的拼接操作。

9.一种向用户推荐信息的方法，其特征在于，所述方法包括：

将所述多个目标信息对和与每个目标信息对所对应的路径实例输入到预设的推荐模型中进行检测，得到向所述目标用户推荐的、所述多个目标信息对所对应的对象中每个对象的推荐排行顺序，其中，所述推荐模型通过权利要求1-8任一项所述的方法训练得到。

10.一种基于元路径上下文的推荐模型训练装置，其特征在于，所述装置包括：