CN113095901A

CN113095901A - 推荐方法和相关模型的训练方法、电子设备、存储装置

Info

Publication number: CN113095901A
Application number: CN202110193662.5A
Authority: CN
Inventors: 赵鑫; 王辉; 周昆; 付瑞吉; 王士进; 胡国平; 刘挺
Original assignee: iFlytek Co Ltd
Current assignee: iFlytek Co Ltd
Priority date: 2021-02-20
Filing date: 2021-02-20
Publication date: 2021-07-09
Anticipated expiration: 2041-02-20
Also published as: CN113095901B

Abstract

本申请公开了一种推荐方法和相关模型的训练方法、电子设备、存储装置，其中推荐模型的训练方法包括：获取多个样本路径实例；其中，多个样本路径实例属于至少一种元路径，样本路径实例包含多个顺序连接的样本节点，且样本路径实例的起点为样本对象，样本路径实例的终点为样本物品；融合起点和终点满足预设条件的样本路径实例，得到至少一个第一样本路径图；利用至少一个第一样本路径图训练推荐模型。上述方案，能够提高推荐准确性。

Description

推荐方法和相关模型的训练方法、电子设备、存储装置

技术领域

本申请涉及人工智能领域，特别是涉及一种推荐方法和相关模型的训练方法、电子设备、存储装置。

背景技术

随着互联网技术的飞速发展，越来越多的用户选择在互联网平台与诸如商品、影片等物品进行交互，以实现网上购物、网上观影等休闲娱乐活动。因此，准确地为用户推荐物品是提高用户体验，甚至提高平台营业额的关键所在。有鉴于此，如何提高推荐准确性成为极具研究价值的课题。

发明内容

本申请主要解决的技术问题文本是提供一种推荐方法和相关模型的训练方法、电子设备、存储装置，能够提高推荐准确性。

为了解决上述问题文本，本申请第一方面提供了一种推荐模型的训练方法，包括：获取多个样本路径实例；其中，多个样本路径实例属于至少一种元路径，样本路径实例包含多个顺序连接的样本节点，且样本路径实例的起点为样本对象，样本路径实例的终点为样本物品；融合起点和终点满足预设条件的样本路径实例，得到至少一个第一样本路径图；利用至少一个第一样本路径图训练推荐模型。

为了解决上述问题文本，本申请第二方面提供了一种推荐方法，包括：获取多个路径实例；其中，多个路径实例属于至少一种元路径，路径实例包含多个顺序连接的节点，且路径实例的起点为目标对象，路径实例的终点为目标物品；融合多个路径实例，得到路径图；利用推荐模型处理路径图，得到目标对象与目标物品之间可能发生交互的预测结果；基于预测结果，确定是否向目标对象推荐目标物品。

为了解决上述问题文本，本申请第三方面提供了一种电子设备，包括相互耦接的存储器和处理器，存储器中存储有程序指令，处理器用于执行程序指令以实现上述第一方面中的推荐模型的训练方法，或实现上述第二方面中的推荐方法。

为了解决上述问题文本，本申请第四方面提供了一种存储装置，存储有能够被处理器运行的程序指令，程序指令用于实现上述第一方面中的推荐模型的训练方法，或实现上述第二方面中的推荐方法。

上述方案，获取多个样本路径实例，其中多个样本路径实例属于至少一种元路径，样本路径实例包含多个顺序连接的样本节点，且样本路径实例的起点为样本对象，样本路径实例的终点为样本物品，在此基础上，融合起点和终点满足预设条件的样本路径实例，得到至少一个第一样本路径图，并利用至少一个第一样本路径图训练推荐模型，故此推荐模型不仅能够建模第一样本路径图中单个样本路径实例中各个样本节点，还进一步考虑与第一样本路径图中其他样本路径实例中的样本节点之间的联系，从而能够有利于提高推荐模型的准确性，进而能够有利于提高推荐准确性。

附图说明

图1是本申请推荐模型的训练方法一实施例的流程示意图；

图2是融合样本路径实例一实施例的状态示意图；

图3是图1中步骤S13一实施例的流程示意图；

图4是本申请推荐模型的训练方法一实施例的状态示意图；

图5是本申请推荐模型的训练方法另一实施例的流程示意图；

图6是本申请推荐方法一实施例的流程示意图；

图7是本申请电子设备一实施例的框架示意图；

图8是本申请存储装置一实施例的框架示意图。

具体实施方式

下面结合说明书附图，对本申请实施例的方案进行详细说明。

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、接口、技术之类的具体细节，以便透彻理解本申请。

本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。此外，本文中的“多”表示两个或者多于两个。

请参阅图1，图1是本申请推荐模型的训练方法一实施例的流程示意图。具体而言，可以包括如下步骤：

步骤S11：获取多个样本路径实例。

本公开实施例中，多个样本路径实例属于至少一种元路径，样本路径实例包含多个顺序连接的样本节点，且样本路径实例的起点为样本对象，样本路径实例的终点为样本物品。

在一个实施场景中，多个样本路径实例可以根据实际推荐场景采集。例如，在实际推荐场景为影片推荐的情况下，多个样本路径实例可以与影片相关；或者，在实际推荐场景为购物推荐的情况下，多个样本路径实例可以与购物相关，其他场景可以以此类推，在此不再一一举例。

在另一个实施场景中，元路径可以包括但不限于：UIUI、UIAI等等，在此不做限定。需要说明的是，U表示对象，I表示物品，A表示对象、物品之外的事物。以影片推荐场景为例，I具体可以表示影片，A可以包括但不限于：导演、主演、影片类型(如，动画片、儿童片、喜剧片、灾难片等)等等，在此不做限定。请结合参阅图2，图2是融合样本路径实例一实施例的状态示意图。如图2所示，对于UIUI的元路径，其对应的样本路径实例为：用户1→影片1→用户2→影片2，为了便于描述，在图2中，用户1以男性头像表示，用户2以女性头像用户表示，影片1和影片2分别以不同影片海报表示；类似地，对于UIAI的元路径，其对应的样本路径实例为：用户1→影片3→儿童片→影片2，用户1→影片3→动画片→影片2，其中，“儿童片”、“动画片”表示影片类型，为了便于描述，在图2中，影片3也以影片海报表示。此外，样本路径实例所包含的样本节点不限于4个，也可以是3个、5个等等，在此不做限定。例如，元路径还可以包括但不限于：UUI等，在此不做限定。在其他推荐场景中，样本路径实例可以以此类推，在此不再一一举例。

需要说明的是，不同元路径代表了起点所表示的样本对象与终点表示的样本物品之间不同的语义联系。仍以影片推荐场景为例，元路径UIUI(即用户→影片→用户→影片)表示观看相同影片的用户之间相似性，会再次观看相同的影片，而元路径UIAI(即用户→影片→类型→影片)表示观看某种类型影片的用户会观看同类影片，即若用户u与影片i之间存在元路径UIAI，则表示用户U可能因为类型偏好而喜好影片i。其他场景可以以此类推，在此不再一一举例。

在又一个实施场景中，上述多个样本路径实例具体可以是从与推荐场景相关的异质信息网络(Heterogeneous Information Network，HIN)中采集得到的。具体地，异质信息网络中包括多个节点，节点之间可以相互连接或不连接，相互连接的节点之间存在某种直接关系，而相互不连接的节点之间不存在直接联系。仍以影片推荐场景为例，异质信息网络可以包括诸多对象(如，对象1、对象2、对象3等)、影片(如，影片1、影片2、影片3)及其类型、导演、主演等属性以及上述对象、影片及其属性之间的相关关系，例如，对象1与对象2均看过影片1，影片1的类型为喜剧片，对象3看过影片3，影片3的类型为剧情片，而影片1和影片3均由导演1执导，影片2和影片3均由演员1主演，由此可见，异质信息网络能够建模丰富且复杂的数据，从而可以保留更为全面的语义及结构信息。在此基础上，可以利用预设映射方式将异质信息网络中的节点进行映射得到节点向量表示，之后可以在异质信息网络中以表示对象的节点为起点，并以表示物品的节点为终点，采用预设采样策略在异质信息网络中进行路径采样，得到样本路径实例。仍以前述影片推荐场景为例，可以分别以对象1、对象2和对象3为起点，以影片1、影片2和影片3为终点进行路径采样，得到以对象1为起点且以影片1为终点的样本路径实例，以对象1为起点且以影片2为终点的样本路径实例，以对象1为起点且以影片3为终点的样本路径实例，以此类推，可以得到以对象2为起点且分别以影片1、影片2、影片3为终点的样本路径实例，以及以对象3为起点且分别为影片1、影片2、影片3为终点的样本路径实例。其他情况可以以此类推，在此不再一一举例。

在一个具体的实施场景中，上述预设映射方式可以包括但不限于：Metapath2vec、HIN2Vec等等，在此不做限定。HIN2Vec的核心是一个神经网络模型，不仅能够学习网络中节点的表示，同时还学习关系(元路径)的表示，具体映射过程在此不再赘述；此外，Metapath2vec的目标是最大化保留一个异构网络的结构和语义信息的似然，其具体映射过程在此也不再赘述。

在另一个具体实施场景中，在以表示对象的节点为起点的基础上，可以利用起点的节点向量表示，以及与该起点相连的其他节点的节点向量表示，获取起点分别与其相连的其他节点之间的相似度(如余弦相似度)，在此基础上，可以基于相似度在与该起点连接的节点中选择其中一个节点，作为下一跳节点。例如，可以选择最高相似度对应的节点，作为下一跳节点。在此基础上，可以以下一跳节点为起点，并重新执行上述过程直至选择到表示终点的节点为止，得到样本元路径实例。

在又一个具体的实施场景中，也可以预先设置需要采样的元路径，如可以预先设置需要采样的元路径包括：UIUI、UIAI等，具体设置的元路径在此不做限定。在此基础上，在选择下一跳节点时，可以基于相似度选择节点类型符合元路径的节点，作为下一跳节点。例如，在预先设置需要采样的元路径为UIUI的情况下，在首次选择下一跳节点时，可以选择相似度最高且类型为物品(如，影片)的节点，作为下一跳节点。其他情况可以以此类推，在此不再一一举例。

在又一个具体的实施场景中，针对每种预先设置需要采样的元路径可以采样得到若干个样本路径实例，在此基础上，可以基于样本路径实例中各个样本节点对应的相似度，得到每个样本路径实例的重要度，然后可以针对每种预先设置需要采样的元路径执行下述操作：按照重要度由高到低的顺序，将上述若干样本路径实例进行排序，并选择位于前预设序位的样本路径实例，作为该种元路径对应的样本路径实例。具体地，预设序位可以根据实际应用情况进行设置。例如，可以设置为第1位，或者，也可以设置为前2位等等，在此不做限定。此外，可以将样本路径实例中各个样本节点对应的相似度的平均值，作为该样本路径实例的重要度。具体可以表示为：

上述公式(1)和公式(2)中，v_i、v_j分别表示样本路径实例中第i个样本节点的节点向量表示和第j个样本节点的节点向量表示，||v_i||表示节点向量表示v_i的模，||v_j||表示节点向量表示v_j的模，cos_sim(v_i,v_j)表示第i个样本节点和第j个样本节点之间的余弦相似度，avg_cos_sim表示样本路径实例中各个样本节点对应的相似度的平均值，即样本路径实例的重要度。

步骤S12：融合起点和终点满足预设条件的样本路径实例，得到至少一个第一样本路径图。

具体地，可以将满足预设条件的样本路径实例作为候选路径实例，在此基础上，可以基于候选路径实例的起点，得到第一样本路径图的起点，并基于候选路径实例的终点，得到第一样本路径图的终点，从而可以利用候选路径实例的起点和终点之间的样本节点，构建第一样本路径图的起点和终点之间的样本节点，且候选路径实例中样本节点至候选路径实例的起点为第一样本距离，第一样本路径图中对应样本节点在至第一样本路径图的起点为第二样本距离，第一样本距离与第二样本距离相同。上述方式，通过将满足预设条件的样本路径实例作为候选路径实例，并基于候选路径实例构建得到第一样本路径图，且由于第一样本距离与第二样本距离相同，故在构建得到第一样本路径图之后，并不改变样本节点在样本路径实例的固有连接关系，还能够进一步地引入其他相关的样本路径实例，从而能够有利于大大提升信息丰富度，进而能够有利于提高推荐模型的准确性。

需要说明的是，本公开实施例以及下述公开实施例中，如无特别说明，样本节点至起点的距离均表示样本节点至起点的最短距离。

在一个实施场景中，预设条件具体可以包括：样本路径实例的起点为同一样本对象且样本路径实例的终点为同一样本物品。请结合参阅图2，仍以影片推荐场景为例，如图2所示的三个样本路径实例的起点为同一样本对象，且三个样本路径实例的终点为同一样本物品，即图2所示的三个样本路径实例满足预设条件，故可以将图2所示的三个样本路径实例进行融合，得到第一样本路径图。进一步地，如前所述，获取到的样本路径实例的起点、终点可以不尽相同，如可以获取到分别以对象1、对象2、对象3为起点，且分别以影片1、影片2、影片3为终点的样本路径实例，在此情况下，可以基于以对象1为起点且以影片1为终点的样本路径实例，构建一个第一样本路径图；基于以对象1为起点且以影片2为终点的样本路径实例，构建一个第一样本路径图；基于以对象1为起点且以影片3为终点的样本路径实例，构建一个第一样本路径图，以此类推，一共可以构建得到9个第一样本路径图。其他情况可以以此类推，在此不再一一举例。上述方式，通过将预设条件设置为包括样本路径实例的起点为同一样本对象且样本路径实例的终点为同一样本物品，能够有利于提高构建第一样本路径图所采用的候选路径实例之间的关联性，从而能够有利于降低引入无关噪声的概率，进而能够有利于进一步提高推荐模型的准确性。

在另一个实施场景中，在预设条件包括样本路径实例的起点为同一样本对象且样本路径实例的终点为同一样本物品的情况下，可以将候选路径实例的起点合并得到第一样本路径图的起点，并将候选路径实例的终点合并得到第一样本路径图的终点。请继续结合参阅图2，图2所示的三个候选路径实例的起点可以合并得到第一样本路径图的起点，图2所示的三个候选路径实例的终点可以合并到第一样本路径图的终点。其他情况可以以此类推，在此不再一一举例。

在又一个实施场景中，在不同候选路径实例中样本节点相同且对应的第一样本距离也相同的情况下，可以将样本节点合并，得到第一样本路径图中的样本节点。请继续结合参阅图2，属于元路径UIAI的两个候选路径实例中第二个样本节点相同且两者对应的第一样本距离均为1(即至起点的距离均为1)，故可以将这两个样本节点合并，得到第一样本路径图中的样本节点。其他情况可以以此类推，在此不再一一举例。上述方式，在不同候选路径实例中样本节点相同且对应的第一样本距离也相同的情况下，将样本节点合并，得到第一样本路径图中的样本节点，能够有利于降低第一样本路径图的复杂度，从而能够有利于降低计算负荷。

在又一个实施场景中，在不同候选路径实例中样本节点不同或者对应的第一样本距离不同的情况下，可以将不同候选路径实例中样本节点分别作为第一样本路径图中的样本节点。请继续结合参阅图2，属于元路径UIAI的两个候选路径实例中第三个样本节点不同，故可以将两者分别作为第一样本路径图中的样本节点。其他情况可以以此类推，在此不再一一举例。

步骤S13：利用至少一个第一样本路径图训练推荐模型。

在一个实施场景中，推荐模型具体可以包括编码网络和预测网络，编码网络具体用于对第一样本路径图中的样本节点进行编码，得到样本节点的样本编码表示，而预测网络具体可以用于对第一样本路径图的起点的样本编码表示和终点的样本编码表示进行处理，以预测得到第一样本路径图的起点所表示的样本对象和终点所表示的样本物品之间存在交互的可能性。具体训练过程可以参阅下述公开实施例中的步骤，在此暂不赘述。

在一个具体的实施场景中，编码网络可以包括但不限于：多层transformer等，在此不做限定。

在另一个具体的实施场景中，预测网络可以包括但不限于：多层感知机((Multi-Layer Perceptron，MLP)等，在此不做限定。

在一个实施场景中，可以利用第一样本路径图对推荐模型进行若干次训练，以调整推荐模型的网络参数，使得推荐模型后续能够为对象推荐物品。具体训练过程以及推荐过程可以参阅下述公开实施例中的步骤，在此暂不赘述。

在另一个实施例中，为了进一步提高推荐模型的准确性，在利用至少一个第一样本路径图训练推荐模型之后，可以进一步在第一样本路径图的起点所表示的样本对象与终点所表示的样本物品之间存在交互的情况下，选择第一样本路径图作为第二样本路径图，并利用第二样本路径图再次训练推荐模型。具体训练过程可以参阅下述公开实施例中的步骤，在此暂不赘述。

请参阅图3，图3是图1中步骤S13一实施例的流程示意图。本公开实施例中，如前所述推荐模型具体可以包括编码网络。具体地，本公开实施例可以包括如下步骤：

步骤S31：利用编码网络对第一样本路径图进行编码，得到第一样本路径图中样本节点的样本编码表示。

具体地，针对第一样本路径图中的各个样本节点，可以分别将样本节点的至少一种属性信息进行映射，得到至少一种属性信息的属性向量表示，并将至少一种属性信息的属性向量表示进行融合，得到样本节点的组合向量表示，在此基础上，利用编码网络对第一样本路径图中样本节点的组合向量表示进行编码，得到样本编码表示。上述方式，通过针对第一样本路径图中的各个样本节点，分别将样本节点的至少一种属性信息进行映射，得到至少一种属性信息的属性向量表示，并将至少一种属性信息的属性向量表示进行融合，得到样本节点的组合向量表示，能够有利于使得样本节点的组合向量表示融合不同维度的属性信息，提高组合向量表示的准确性，在此基础上再利用编码网络对第一样本路径图中样本节点的组合向量表示进行编码，得到样本编码表示，能够有利于提高样本节点的样本编码表示的准确性。

在一个实施场景中，属性信息具体可以包括：节点标识信息、节点类型信息、节点位置信息、节点连接信息，其中，节点标识信息为样本节点的唯一标识，节点位置信息表示样本节点至第一样本路径图的起点的距离(即前述公开实施例所述的第二样本距离)，节点连接信息包括样本节点的邻接节点(如样本节点在第一样本路径图中前一跳样本节点等)的节点标识信息。上述方式，通过将属性信息设置为包括：节点标识信息、节点类型信息、节点位置信息、节点连接信息，能够有利于大大提升样本节点的信息丰富度，有利于提升样本节点的样本编码表示的准确性。

在一个具体的实施场景中，如前述公开实施例所述，样本节点具体可以来源于异质信息网络，异质信息网络中每个样本节点可以标识有区别于其他样本节点的标识符，该标识符即可作为样本节点的节点标识信息。请结合参阅图4，图4是本申请推荐模型的训练方法一实施例的状态示意图。如图4所示，节点标识信息经映射可以得到属性向量表示，为了便于描述可以称之为节点嵌入表示(如，图4中E₀,E₁等)。

在另一个具体的实施场景中，如前述公开实施例所述，样本路径实例可以属于诸如UIUI、UIAI等元路径，对应地，样本路径实例中的样本节点可以分别属于诸如用户、物品、类型等节点类型。仍以影片推荐场景为例，请结合参阅图2，如图2所示，第一样本路径图的起点的节点类型为“用户”，而第一样本路径图的终点的节点类型为“影片”，其他情况可以以此类推，在此不再一一举例。请结合参阅图4，如图4所示，节点类型信息经映射可以得到属性向量表示，为了便于描述可以称之为节点类型嵌入表示(如，图4中E_U,E_I,E_A等)通过在属性信息中设置为包括节点类型信息，能够有利于保留样本节点在异质信息网络中的异质信息。

在又一个具体的实施场景中，请继续结合参阅图2，如图2所示，第一样本路径图的起点对应的第二样本距离为0，故其节点位置信息可以为0，第一样本路径图中“儿童片”、“动画片”和以女性头像表示的样本节点其对应的第二样本距离均为2，故其节点位置信息可以均为2，其他情况可以以此类推，在此不再一一举例。请结合参阅图4，如图4所示，若样本节点对应的第二样本距离相同，即可将样本节点归为同一槽位，如可以样本节点0归入槽0，样本节点1和样本节点2归入槽1，样本节点3、4和5归入槽2，样本节点6归入槽3，经映射可以得到属性向量表示，为了便于描述可以称之为槽位嵌入表示(如，图4中E₀,E₁等)。通过在属性信息中设置为包括节点位置信息，能够有利于保留第一样本路径图中样本节点的绝对位置信息。

在又一个具体的实施场景中，邻接节点具体包括以下至少一者：样本节点在第一样本路径图中前一跳的样本节点，样本节点在第一样本路径图中后一跳的样本节点等，在此不做限定。以邻接节点包括样本节点在第一样本路径图中前一跳的样本节点为例，请继续结合参阅图2，对于第一样本路径图的终点而言，其邻接节点可以包括样本节点“儿童片”、样本节点“动画片”，以及以女性头像表示的样本节点。其他情况可以以此类推，在此不再一一举例。请结合参阅图4，如图4所示，在邻接节点包括样本节点在第一样本路径图中前一跳的样本节点的情况下，可以将节点连接信息经映射得到的属性向量表示称之为前驱位置嵌入表示，如样本节点1和2的前驱位置嵌入表示均可以记为E₀，其他样本节点具体可以参阅图4。通过在属性信息中设置为包括节点连接信息，能够有利于保留第一样本路径图中样本节点之间的相对位置信息。

在另一个实施场景中，如图4所示，可以将至少一种属性信息的属性向量表示进行相加，得到样本节点的组合向量表示。具体可以表示为：

E＝E_V+E_A+E_S+E_P……(3)

上述公式(3)中，E_V、E_A、E_S和E_P均为d维实数向量，E_V表示节点标识信息映射得到的属性向量表示，E_A表示节点类型信息映射得到的属性向量表示，E_S表示节点位置信息映射得到的属性向量表示，E_P表示节点连接信息映射得到的属性向量表示，E表示样本节点的组合向量表示。上述方式，通过将将至少一种属性信息的属性向量表示进行相加，得到样本节点的组合向量表示，能够有利于降低融合属性向量表示的复杂度。

在又一个实施场景中，如前所述，编码网络可以包括但不限于多层transformer等，在此不做限定。以编码网络为多层transformer为例，每个transformer包含一个多头注意力(multi-head self-attention，MHAttn)层和一个前馈全连接(Feed-ForwardNetwork，FFN)层。

在一个具体的实施场景中，多头注意力层可以表示为：

MHAttn(F^l)＝[head₁,head₂,…,head_h]W^O……(4)

上述公式(4)和公式(5)中，F^l表示第l层transformer的输入，h表示注意力头的个数，在l为0的情况下，F⁰＝E，即第1层transformer输入的是第一样本路径图中各个样本节点的组合向量表示。此外，在l大于0的情况下，F^l为第l-1层transformer的输出。

和W^O均表示映射矩阵，其中，

均为d*d/h维的实数矩阵，W^O为d*d维的实数矩阵，编码网络的网络参数可以包括上述映射矩阵，即可以在训练过程中调整上述映射矩阵。此外，对于各个注意力头而言，其注意力函数可以表示为：

上述公式(6)中，

即Q、K、V均是对F^l的线性变换，此外，

是为了避免过大的内积而引入的缩放因子。

在另一个具体的实施场景中，在经过多头注意力层之后，可以使用FNN对多头注意力层的输出进行处理，使其具有非线性特质。具体可以表示为：

FFN(x)＝(Relu(xW₁+b₁))W₂+b₂……(8)

上述公式(7)和公式(8)中，

表示第一样本路径图中各个样本节点(如第1个…第n个)经第l层transformer的多头注意力层处理后的输出，W₁,W₂,b₁,b₂均为FFN的网络参数，具体可以在训练过程进行调整。

在编码网络共包含L层transformer的情况下，最终可以将第L层transformer的输出作为样本节点的样本编码表示。

步骤S32：利用第一样本路径图的起点的样本编码表示和终点的样本编码表示，预测得到连接第一样本路径图的起点与终点的样本元路径。

如前述公开实施例所述，元路径有助于提高推荐的解释性，不同的元路径往往代表了对象u和物品i之间不同的语义联系，具体可以参阅前述公开实施例中的相关描述，在此不再赘述。

在一个实施场景中，为了提高预测效率，可以将第一样本路径图的起点的样本编码表示和终点的样本编码表示输入元路径预测网络，得到连接第一样本路径图的起点和终点的样本元路径。

在一个具体的实施场景中，元路径预测网络可以包括但不限于多层感知机等，在此不做限定。

在另一个具体的实施场景中，将第一样本路径图的起点的样本编码表示和终点的样本编码表示输入元路径预测网络，具体可以得到第一样本路径图的起点和终点被元路径集合P中各种元路径连接的预测概率值。具体可以表示为：

上述公式(9)中，

表示第一样本路径图的起点(即样本用户u)的样本编码表示，

表示第一样本路径图的终点(即样本物品i)的样本编码表示，Pr(p|u,i)表示第一样本路径图的起点和终点被元路径集合P中元路径p连接的预测概率值。此外，

表示向量拼接，σ表示sigmoid函数。

步骤S33：基于样本路径实例所属的元路径，获取连接第一样本路径图的起点与终点的实际元路径。

具体地，可以将样本路径实例所属的元路径，作为连接第一样本路径图的起点和终点的实际元路径。请继续结合参阅图2，如图2所示，第一样本路径图是由元路径UIUI的样本路径实例和元路径UIAI的样本路径实例融合得到的，故连接第一样本路径图的起点和终点的实际元路径为UIUI和UIAI。其他情况可以以此类推，在此不再一一举例。

步骤S34：基于样本元路径和实际元路径之间的差异，调整推荐模型的网络参数。

在一个实施场景中，可以基于样本元路径和实际元路径，得到推荐模型的第一损失值，从而可以利用第一损失值调整推荐模型的网络参数。具体可以表示为：

L(u,i)＝-∑_p∈P(y_u,i,p·logPr(p|u,i)+(1-y_u,i,p)·log(1-Pr(p|u,i)))……(10)

上述公式(10)中，y_u,i,p表示第一样本路径图的起点u和终点i被元路径p连接的实际概率值，在起点u和终点i存在元路径p的情况下，y_u,i,p为1，在起点u和终点i不存在元路径p的情况下，y_u,i,p为0，Pr(p|u,i)表示预测概率值。

在另一个实施场景中，为了加强样本节点与其上下文信息之间的联系，可以将第一样本路径图中至少一个样本节点进行掩盖，作为掩盖节点，如图4所示，可以将第一样本路径图中位于左下位置的样本节点进行掩盖，作为掩盖节点(Mask)。在此基础上，可以将第一样本路径图中所包含的样本节点记为[v₁,…,v_t,…,v_n]，并将样本节点v_t进行掩盖，从而掩盖后的样本节点可以记为[v₁,…,Mask,…,v_n]，从而将掩盖后的第一样本路径图输入编码网络进行编码，得到[v₁,…,Mask,…,v_n]中各个节点的样本编码表示，进而可以利用掩盖节点的样本编码表示和掩盖节点的组合向量表示预测得到掩盖节点所对应的第一样本节点，并利用掩盖节点的样本编码表示和其他样本节点的组合向量表示预测得到掩盖节点所对应的第二样本节点，在此基础上，可以基于预测得到的第一样本节点和第二样本节点，得到推荐模型的第二损失值，从而可以利用上述第一损失值和第二损失值，调整推荐模型的网络参数。具体地，第二损失值可以表示为：

上述公式(11)中，L(F_t,v_t)表示第二损失值，F_t表示掩盖节点的样本编码表示，

表示掩盖节点的组合向量表示，

表示第一样本路径图中除掩盖节点之外的其他任一样本节点的样本编码表示，σ表示sigmoid函数。此外，上述第一样本节点和第二样本节点具体可以是利用节点预测网络(如，MLP等)预测得到的，从而可以利用节点预测网络预测得到第一样本节点分别为若干样本节点的概率值(即公式11中

)，并利用节点预测网络预测得到第二样本节点分别为若干样本节点的概率值(即公式11中

)，其中，W_N表示节点预测网络的网络参数。上述方式，通过对掩盖节点进行预测，并基于预测结果调整推荐模型的网络参数，能够使推荐模型在训练过程中学习到样本节点的上下文信息，有利于提高推荐准确性。

在又一个实施场景中，为了使推荐模型在训练过程中学习到邻接节点之间的信息联系，还可以将第一样本路径图中至少一条连接边进行掩盖，作为掩盖边，如图4所示，可以将第一样本路径图中左上位置的样本节点与样本节点“动画片”之间的连接边进行掩盖，作为掩盖边。在此基础上，可以将掩盖后的第一样本路径图输入编码网络，得到第一样本路径图中各个样本节点的样本编码表示，为了便于描述可以将掩盖边所连接的两个样本节点分别称之为第一节点(如可以记为v_j)和第二节点(如可以记为v_k)，从而可以利用第一节点的样本编码表示和第二节点的样本编码表示预测得到第一节点与第二节点存在连接边的第一概率值，并利用第一节点的样本编码表示和不与第一节点邻接的第三节点(如，可以记为v_k′)的样本编码表示预测得到第一节点与第三节点存在连接边的第二概率值，进而可以利用第一概率值和第二概率值，得到推荐模型的第三损失值，并利用上述第一损失值、第二损失值和第三损失值，调整推荐模型的网络参数。具体地，第三损失值可以表示为：

上述公式(12)中，L(v_j,v_k)表示第三损失值，F_j,F_k,F_k′分别表示第一节点的样本编码表示、第二节点的样本编码表示和第三节点的样本编码表示。此外，上述第一概率值和第二概率值具体是可以利用连接边预测网络(如，MLP等)预测得到的，W_E即为连接边预测网络的网络参数，

表示第一概率值，

表示第二概率值，σ表示sigmoid函数。上述方式，通过对掩盖边所连接的两个样本节点间是否存在连接边进行预测，并基于预测结果调整推荐模型的网络参数，能够使推荐模型在训练过程中学习到样本节点间的信息联系，有利于提高推荐准确性。

区别于前述实施例，通过利用编码网络对第一样本路径图进行编码，得到第一样本路径图中样本节点的样本编码表示，在此基础上，利用第一样本路径图的起点的样本编码表示和终点的样本编码表示，预测得到连接第一样本路径图的起点与终点的样本元路径，并基于样本路径实例所属的元路径，获取连接第一样本路径图的起点与终点的实际元路径，从而基于样本元路径和实际元路径之间的差异，调整推荐模型的网络参数，进而能够使得推荐模型在训练过程学习元路径级别的语义信息，由于元路径有助于提高推荐的解释性，故能够有利于进一步提高推荐模型的准确性。

请参阅图5，图5是本申请推荐模型的训练方法另一实施例的流程示意图。具体而言，本公开实施例具体可以包括如下步骤：

步骤S51：获取多个样本路径实例。

本公开实施例中，多个样本路径实例属于至少一种元路径，样本路径实例包含多个顺序连接的样本节点，且样本路径实例的起点为样本对象，样本路径实例的终点为样本物品。具体可以参阅前述公开实施例中相关描述，在此不再赘述。

步骤S52：融合起点和终点满足预设条件的样本路径实例，得到至少一个第一样本路径图。

具体可以参阅前述公开实施例中相关描述，在此不再赘述。

步骤S53：利用至少一个第一样本路径图训练推荐模型。

具体可以参阅前述公开实施例中相关描述，在此不再赘述。

步骤S54：在第一样本路径图的起点所表示的样本对象与终点所表示的样本物品之间存在交互的情况下，选择第一样本路径图作为第二样本路径图。

请结合参阅图2，如图2所示，在第一样本路径图中以男性头像所表示的样本对象和第一样本路径图的终点所表示的样本物品(如，图2中影片)之间存在交互(如，样本对象点播过该影片)的情况下，可以选择该第一样本路径图作为第二样本路径图。其他情况可以以此类推，例如，在购物推荐场景中，可以在样本对象与样本物品存在交互(如，购买、浏览等)的情况下，可以将第一样本路径图作为第二样本路径图，在此不再一一举例。

在一个实施场景中，如前述公开实施例所述，可以构建得到分别以对象1、对象2、对象2为起点，并分别以影片1、影片2、影片3为终点的第一样本路径图，则在对象1与影片1存在交互(如，点播)的情况下，可以将以对象1为起点且以影片1为终点的第一样本路径图，作为第二样本路径图，其他第一样本路径图可以以此类推，在此不再一一举例。

步骤S55：利用第二样本路径图训练推荐模型。

在一个实施场景中，推荐模型具体可以包括编码网络和预测网络，编码网络具体可以参阅前述公开实施例中相关描述，在此不再赘述；此外，预测网络具体可以包括但不限于MLP等，在此不做限定。在此基础上，可以利用预测网络处理第二样本路径图的起点的样本编码表示和终点的样本编码表示，得到第二样本路径图的起点所表示的样本对象与终点所表示的样本物品之间存在交互的第一样本概率值，并利用预测网络处理第二样本路径图的起点的样本编码表示和负例物品的样本编码表示，得到第二样本路径图的起点所表示的样本对象与负例物品之间存在交互的第二样本概率值；样本编码表示是利用编码网络编码得到的，且负例物品是与第二样本路径图的起点所表示的样本对象之间不存在交互的样本物品，从而可以基于第一样本概率值和第二样本概率值，调整推荐模型的网络参数。上述方式，通过预测第二样本路径图的起点所表示的样本对象与终点所表示的样本物品之间存在交互的第一样本概率值，并预测第二样本路径图的起点所表示的样本对象与负例物品之间存在交互的第二样本概率值，且负例物品是与第二样本路径图的起点所表示的样本对象之间不存在交互的样本物品，在此基础上，基于第一样本概率值和第二样本概率值，调整推荐模型的网络参数，能够使推荐模型在训练过程中学习到存在交互的样本对象和样本物品之间的联系信息，有利于提高推荐模型的准确性。

在一个具体的实施场景中，为了便于描述，第一样本概率值可以表示为：

上述公式(13)中，Pr(u,i)表示第一样本概率值，

表示第二样本路径图的起点的样本编码表示，

表示第二样本路径图的终点的样本编码表示。

在另一个具体的实施场景中，为了便于描述，第二样本概率值可以表示为：

上述公式(14)中，Pr(u,i′)表示第二样本概率值，

表示负例物品的样本编码表示。

在又一个具体的实施场景中，可以基于第一样本概率值和第二样本概率值，得到推荐模型的第四损失值，从而可以利用第四损失值调整推荐模型的网络参数。具体地，第四损失值可以表示为：

L(u,i)＝-log Pr(u,i)-log(1-Pr(u,i′))……(15)

由此可见，通过最小化第四损失值L(u,i)，可以使得第一样本概率值趋近于1，第二样本概率值趋近于0，即可以使得预测网络能够准确地分辨出样本物品是否与样本对象存在交互，故能够使得推荐模型学习到存在交互的样本对象和样本物品之间的联系信息。

区别于前述实施例，在利用第一样本路径图训练推荐模型之后，进一步在第一样本路径图的起点所表示的样本对象与终点所表示的样本物品之间存在交互的情况下，选择第一样本路径图作为第二样本路径图，并利用第二样本路径图训练推荐模型，从而能够有利于通过第一样本路径图对推荐模型进行预训练，在此基础上再利用第二样本路径图对推荐模型进行微调，有利于缓解数据稀疏可能导致的过拟合等问题，进而能够提高推荐模型的准确性。

请参阅图6，图6是本申请推荐方法一实施例的流程示意图。具体可以包括如下步骤：

步骤S61：获取多个路径实例。

本公开实施例中，多个路径实例属于至少一种元路径，路径实例包含多个顺序连接的节点，且路径实例的起点为目标对象，路径实例的终点为目标物品。具体可以参阅前述公开实施例中关于样本路径实例的相关描述，在此不再赘述。

需要说明的是，目标对象和目标物品可以根据实际应用场景进行选择。以购物推荐场景为例，目标对象可以是购物平台的注册用户，目标物品可以是购物平台的上新商品等，在此不做限定；或者，以影片推荐场景为例，目标对象可以是视频网站的注册用户，目标物品可以是视频网站的上新影片等，在此不做限定。其他场景可以以此类推，在此不再一一举例。

步骤S62：融合多个路径实例，得到路径图。

具体可以参阅前述公开实施例中关于融合多个样本路径实例的相关描述，在此不再赘述。

步骤S63：利用推荐模型处理路径图，得到目标对象与目标物品之间可能发生交互的预测结果。

在一个实施场景中，推荐模型具体可以包括编码网络和预测网络，从而可以将路径图输入编码网络，得到路径图的起点的编码表示和终点的编码表示，在此基础上，可以利用预测网络对起点的编码表示和终点的编码表示进行预测处理，得到目标对象与目标物品之间可能发生交互的预测结果。

在一个具体的实施场景中，推荐模型具体可以是利用上述任一推荐模型的训练方法实施例中的步骤训练得到的。具体可以参阅前述公开实施例中相关描述，在此不再赘述。

在另一个具体的实施场景中，可以将起点的编码表示和终点的编码表示输入预测网络，得到目标对象和目标物品可能发生交互的推荐概率值，预测结果可以包括上述推荐概率值。

步骤S64：基于预测结果，确定是否向目标对象推荐目标物品。

在一个实施场景中，在预测结果包括推荐概率值的情况下，可以在推荐概率值大于预设阈值的情况下，确定向目标对象推荐目标物品；或者，也可以在推荐概率值不大于预设阈值的情况下，确定不向目标对象推荐目标物品。

在一个具体的实施场景中，预设阈值可以根据实际应用需要进行设置，例如，在推荐精准性要求较高的情况下，可以将预设阈值设置地稍大一些，如可以设置为0.9、0.95等等；或者，在推荐精度要求相对宽松的情况下，可以将预设阈值设置地稍小一些，如可以设置为0.8、0.85等，在此不做限定。

上述方案，获取多个路径实例，其中多个路径实例属于至少一种元路径，路径实例包含多个顺序连接的节点，且路径实例的起点为目标对象，路径实例的终点为目标物品，在此基础上，融合多个路径实例，得到路径图，并利用推荐模型处理路径图，得到目标对象与目标物品之间可能发生交互的预测结果，并基于预测结果，确定是否向目标对象推荐目标物品，故此推荐模型不仅能够利用路径图中单个路径实例进行推荐，还进一步考虑与路径图中其他路径实例中的节点之间的联系，从而能够有利于提高推荐准确性。

请参阅图7，图7是本申请电子设备70一实施例的框架示意图。电子设备70包括相互耦接的存储器71和处理器72，存储器71中存储有程序指令，处理器72用于执行程序指令以实现上述任一推荐模型的训练方法实施例中的步骤，或实现上述任一推荐方法实施例中的步骤。具体地，电子设备70可以包括但不限于：服务器、台式计算机、笔记本电脑、平板电脑、学习机、手机等等，在此不做限定。

具体而言，处理器72用于控制其自身以及存储器71以实现上述任一推荐模型的训练方法实施例中的步骤，或实现上述任一推荐方法实施例中的步骤。处理器72还可以称为CPU(Central Processing Unit，中央处理单元)。处理器72可能是一种集成电路芯片，具有信号的处理能力。处理器72还可以是通用处理器、数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外，处理器72可以由集成电路芯片共同实现。

在一些公开实施例中，处理器72用于获取多个样本路径实例；其中，多个样本路径实例属于至少一种元路径，样本路径实例包含多个顺序连接的样本节点，且样本路径实例的起点为样本对象，样本路径实例的终点为样本物品；处理器72用于融合起点和终点满足预设条件的样本路径实例，得到至少一个第一样本路径图；处理器72用于利用至少一个第一样本路径图训练推荐模型。

在一些公开实施例中，处理器72用于将满足预设条件的样本路径实例作为候选路径实例；处理器72用于基于候选路径实例的起点，得到第一样本路径图的起点，并基于候选路径实例的终点，得到第一样本路径图的终点；处理器72用于利用候选路径实例的起点和终点之间的样本节点，构建第一样本路径图的起点和终点之间的样本节点；其中，候选路径实例中样本节点至候选路径实例的起点为第一样本距离，第一样本路径图中对应样本节点在至第一样本路径图的起点为第二样本距离，且第一样本距离与第二样本距离相同。

区别于前述实施例，通过将满足预设条件的样本路径实例作为候选路径实例，并基于候选路径实例构建得到第一样本路径图，且由于第一样本距离与第二样本距离相同，故在构建得到第一样本路径图之后，并不改变样本节点在样本路径实例的固有连接关系，还能够进一步地引入其他相关的样本路径实例，从而能够有利于大大提升信息丰富度，进而能够有利于提高推荐模型的准确性。

在一些公开实施例中，处理器72用于在不同候选路径实例中样本节点相同且对应的第一样本距离也相同的情况下，将样本节点合并，作为第一样本路径图的样本节点。

区别于前述实施例，在不同候选路径实例中样本节点相同且对应的第一样本距离也相同的情况下，将样本节点合并，得到第一样本路径图中的样本节点，能够有利于降低第一样本路径图的复杂度，从而能够有利于降低计算负荷。

在一些公开实施例中，预设条件包括：样本路径实例的起点为同一样本对象且样本路径实例的终点为同一样本物品。

区别于前述实施例，通过将预设条件设置为包括样本路径实例的起点为同一样本对象且样本路径实例的终点为同一样本物品，能够有利于提高构建第一样本路径图所采用的候选路径实例之间的关联性，从而能够有利于降低引入无关噪声的概率，进而能够有利于进一步提高推荐模型的准确性。

在一些公开实施例中，推荐模型包括：编码网络；处理器72用于利用编码网络对第一样本路径图进行编码，得到第一样本路径图中样本节点的样本编码表示；处理器72用于利用第一样本路径图的起点的样本编码表示和终点的样本编码表示，预测得到连接第一样本路径图的起点与终点的样本元路径；以及，处理器72用于基于样本路径实例所属的元路径，获取连接第一样本路径图的起点与终点的实际元路径；处理器72用于基于样本元路径和实际元路径之间的差异，调整推荐模型的网络参数。

在一些公开实施例中，处理器72用于针对第一样本路径图中各个样本节点：分别将样本节点的至少一种属性信息进行映射，得到至少一种属性信息的属性向量表示，并将至少一种属性信息的属性向量表示进行融合，得到样本节点的组合向量表示；处理器72用于利用编码网络对第一样本路径图中样本节点的组合向量表示进行编码，得到样本编码表示。

区别于前述实施例，通过针对第一样本路径图中的各个样本节点，分别将样本节点的至少一种属性信息进行映射，得到至少一种属性信息的属性向量表示，并将至少一种属性信息的属性向量表示进行融合，得到样本节点的组合向量表示，能够有利于使得样本节点的组合向量表示融合不同维度的属性信息，提高组合向量表示的准确性，在此基础上再利用编码网络对第一样本路径图中样本节点的组合向量表示进行编码，得到样本编码表示，能够有利于提高样本节点的样本编码表示的准确性。

在一些公开实施例中，属性信息包括：节点标识信息、节点类型信息、节点位置信息、节点连接信息；其中，节点标识信息为样本节点的唯一标识，节点位置信息表示样本节点至第一样本路径图的起点的距离，节点连接信息包括样本节点的邻接节点的节点标识信息。

区别于前述实施例，通过将属性信息设置为包括：节点标识信息、节点类型信息、节点位置信息、节点连接信息，能够有利于大大提升样本节点的信息丰富度，有利于提升样本节点的样本编码表示的准确性。

在一些公开实施例中，处理器72用于将至少一种属性信息的属性向量表示进行相加，得到样本节点的组合向量表示。

区别于前述实施例，通过将将至少一种属性信息的属性向量表示进行相加，得到样本节点的组合向量表示，能够有利于降低融合属性向量表示的复杂度。

在一些公开实施例中，推荐模型包括编码网络和预测网络；处理器72用于在第一样本路径图的起点所表示的样本对象与终点所表示的样本物品之间存在交互的情况下，选择第一样本路径图作为第二样本路径图；处理器72用于利用第二样本路径图训练推荐模型。

在一些公开实施例中，推荐模型包括编码网络和预测网络；处理器72用于利用预测网络处理第二样本路径图的起点的样本编码表示和终点的样本编码表示，得到第二样本路径图的起点所表示的样本对象与终点所表示的样本物品之间存在交互的第一样本概率值；以及，处理器72用于利用预测网络处理第二样本路径图的起点的样本编码表示和负例物品的样本编码表示，得到第二样本路径图的起点所表示的样本对象与负例物品之间存在交互的第二样本概率值；样本编码表示是利用编码网络编码得到的，负例物品是与第二样本路径图的起点所表示的样本对象之间不存在交互的样本物品；处理器72用于基于第一样本概率值和第二样本概率值，调整推荐模型的网络参数。

区别于前述实施例，通过预测第二样本路径图的起点所表示的样本对象与终点所表示的样本物品之间存在交互的第一样本概率值，并预测第二样本路径图的起点所表示的样本对象与负例物品之间存在交互的第二样本概率值，且负例物品是与第二样本路径图的起点所表示的样本对象之间不存在交互的样本物品，在此基础上，基于第一样本概率值和第二样本概率值，调整推荐模型的网络参数，能够使推荐模型在训练过程中学习到存在交互的样本对象和样本物品之间的联系信息，有利于提高推荐模型的准确性。

在一些公开实施例中，处理器72用于获取多个路径实例；其中，多个路径实例属于至少一种元路径，路径实例包含多个顺序连接的节点，且路径实例的起点为目标对象，路径实例的终点为目标物品；处理器72用于融合多个路径实例，得到路径图；处理器72用于利用推荐模型处理路径图，得到目标对象与目标物品之间可能发生交互的预测结果；处理器72用于基于预测结果，确定是否向目标对象推荐目标物品。

区别于前述实施例，获取多个路径实例，其中多个路径实例属于至少一种元路径，路径实例包含多个顺序连接的节点，且路径实例的起点为目标对象，路径实例的终点为目标物品，在此基础上，融合多个路径实例，得到路径图，并利用推荐模型处理路径图，得到目标对象与目标物品之间可能发生交互的预测结果，并基于预测结果，确定是否向目标对象推荐目标物品，故此推荐模型不仅能够利用路径图中单个路径实例进行推荐，还进一步考虑与路径图中其他路径实例中的节点之间的联系，从而能够有利于提高推荐准确性。

在一些公开实施例中，推荐模型是利用上述任一推荐模型的训练方法实施例中的步骤训练得到的。

区别于前述实施例，目标对象与目标物品之间可能发生交互的预测结果是利用上述任一推荐模型的训练方法实施例中的步骤训练得到的推荐模型所预测得到的，能够有利于进一步提高预测结果的准确性，从而能够提高推荐准确性。

请参阅图8，图8是本申请存储装置80一实施例的框架示意图。存储装置80存储有能够被处理器运行的程序指令81，程序指令81用于实现上述任一推荐模型的训练方法实施例中的步骤，或实现上述任一推荐方法实施例中的步骤。

上述方案，能够提高推荐准确性。

在一些实施例中，本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法，其具体实现可以参照上文方法实施例的描述，为了简洁，这里不再赘述。

上文对各个实施例的描述倾向于强调各个实施例之间的不同之处，其相同或相似之处可以互相参考，为了简洁，本文不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的方法和装置，可以通过其它的方式实现。例如，以上所描述的装置实施方式仅仅是示意性的，例如，模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性、机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims

1.一种推荐模型的训练方法，其特征在于，包括：

获取多个样本路径实例；其中，所述多个样本路径实例属于至少一种元路径，所述样本路径实例包含多个顺序连接的样本节点，且所述样本路径实例的起点为样本对象，所述样本路径实例的终点为样本物品；

融合所述起点和所述终点满足预设条件的样本路径实例，得到至少一个第一样本路径图；

利用所述至少一个第一样本路径图训练推荐模型。

2.根据权利要求1所述的方法，其特征在于，所述融合所述起点和所述终点满足预设条件的样本路径实例，得到至少一个第一样本路径图，包括：

将满足所述预设条件的样本路径实例作为候选路径实例；

基于所述候选路径实例的起点，得到所述第一样本路径图的起点，并基于所述候选路径实例的终点，得到所述第一样本路径图的终点；

利用所述候选路径实例的所述起点和所述终点之间的样本节点，构建所述第一样本路径图的所述起点和所述终点之间的样本节点；

其中，所述候选路径实例中所述样本节点至所述候选路径实例的起点为第一样本距离，所述第一样本路径图中对应所述样本节点在至所述第一样本路径图的起点为第二样本距离，且所述第一样本距离与所述第二样本距离相同。

3.根据权利要求2所述的方法，其特征在于，所述利用所述候选路径实例的所述起点和所述终点之间的样本节点，构建所述第一样本路径图的所述起点和所述终点之间的样本节点，包括：

在不同所述候选路径实例中所述样本节点相同且对应的第一样本距离也相同的情况下，将所述样本节点合并，作为所述第一样本路径图的样本节点。

4.根据权利要求1至3任一项所述的方法，其特征在于，所述预设条件包括：所述样本路径实例的起点为同一所述样本对象且所述样本路径实例的终点为同一所述样本物品。

5.根据权利要求1所述的方法，其特征在于，所述推荐模型包括：编码网络；所述利用所述至少一个第一样本路径图训练推荐模型，包括：

利用所述编码网络对所述第一样本路径图进行编码，得到所述第一样本路径图中所述样本节点的样本编码表示；

利用所述第一样本路径图的起点的样本编码表示和终点的样本编码表示，预测得到连接所述第一样本路径图的起点与终点的样本元路径；以及，

基于所述样本路径实例所属的元路径，获取连接所述第一样本路径图的起点与终点的实际元路径；

基于所述样本元路径和实际元路径之间的差异，调整所述推荐模型的网络参数。

6.根据权利要求5所述的方法，其特征在于，所述利用所述编码网络对所述第一样本路径图进行编码，得到所述第一样本路径图中所述样本节点的样本编码表示，包括：

针对所述第一样本路径图中各个所述样本节点：分别将所述样本节点的至少一种属性信息进行映射，得到所述至少一种属性信息的属性向量表示，并将所述至少一种属性信息的属性向量表示进行融合，得到所述样本节点的组合向量表示；

利用所述编码网络对所述第一样本路径图中所述样本节点的组合向量表示进行编码，得到所述样本编码表示。

7.根据权利要求6所述的方法，其特征在于，所述属性信息包括：节点标识信息、节点类型信息、节点位置信息、节点连接信息；

其中，所述节点标识信息为所述样本节点的唯一标识，所述节点位置信息表示所述样本节点至所述第一样本路径图的起点的距离，所述节点连接信息包括所述样本节点的邻接节点的节点标识信息。

8.根据权利要求6所述的方法，其特征在于，所述将所述至少一种属性信息的属性向量表示进行融合，得到所述样本节点的组合向量表示，包括：

将所述至少一种属性信息的属性向量表示进行相加，得到所述样本节点的组合向量表示。

9.根据权利要求1所述的方法，其特征在于，所述推荐模型包括编码网络和预测网络；在所述利用所述至少一个第一样本路径图训练推荐模型之后，所述方法还包括：

在所述第一样本路径图的起点所表示的样本对象与终点所表示的样本物品之间存在交互的情况下，选择所述第一样本路径图作为第二样本路径图；

利用所述第二样本路径图训练所述推荐模型。

10.根据权利要求6所述的方法，其特征在于，所述推荐模型包括编码网络和预测网络；所述利用所述第二样本路径图训练所述推荐模型，包括：

利用所述预测网络处理所述第二样本路径图的起点的样本编码表示和终点的样本编码表示，得到所述第二样本路径图的起点所表示的样本对象与终点所表示的样本物品之间存在交互的第一样本概率值；以及，

利用所述预测网络处理所述第二样本路径图的起点的样本编码表示和负例物品的样本编码表示，得到所述第二样本路径图的起点所表示的样本对象与所述负例物品之间存在交互的第二样本概率值；所述样本编码表示是利用所述编码网络编码得到的，所述负例物品是与所述第二样本路径图的起点所表示的样本对象之间不存在交互的样本物品；

基于所述第一样本概率值和所述第二样本概率值，调整所述推荐模型的网络参数。

11.一种推荐方法，其特征在于，包括：

获取多个路径实例；其中，所述多个路径实例属于至少一种元路径，所述路径实例包含多个顺序连接的节点，且所述路径实例的起点为目标对象，所述路径实例的终点为目标物品；

融合所述多个路径实例，得到路径图；

利用所述推荐模型处理所述路径图，得到所述目标对象与所述目标物品之间可能发生交互的预测结果；

基于所述预测结果，确定是否向所述目标对象推荐所述目标物品。

12.根据权利要求11所述的方法，其特征在于，所述推荐模型是利用权利要求1至10任一项所述的推荐模型的训练方法训练得到的。

13.一种电子设备，其特征在于，包括相互耦接的存储器和处理器，所述存储器中存储有程序指令，所述处理器用于执行所述程序指令以实现权利要求1至10任一项所述的推荐模型的训练方法，或实现权利要求11至12任一项所述的推荐方法。

14.一种存储装置，其特征在于，存储有能够被处理器运行的程序指令，所述程序指令用于实现权利要求1至10任一项所述的推荐模型的训练方法，或实现权利要求11至12任一项所述的推荐方法。