CN116821512A

CN116821512A - 推荐模型训练方法及装置、推荐方法及装置

Info

Publication number: CN116821512A
Application number: CN202311077667.7A
Authority: CN
Inventors: 周智欣; 张笑海; 陈超斌
Original assignee: Shenzhen Weiai Zhiyun Technology Co ltd
Current assignee: Shenzhen Weiai Zhiyun Technology Co ltd
Priority date: 2023-08-25
Filing date: 2023-08-25
Publication date: 2023-09-29
Anticipated expiration: 2043-08-25
Also published as: CN116821512B

Abstract

本申请提供推荐模型训练方法及装置、推荐方法及装置，其中所述推荐模型训练方法包括：获取训练样本集；根据训练样本在各预设周期内的转化结果，确定各预设周期内训练样本的样本类型；针对各预设周期，根据该预设周期内训练样本的样本类型，确定异质图；根据异质图，确定该预设周期内各训练样本对应的用户节点特征和物品节点特征，并将用户节点特征和物品节点特征进行信息传递；根据信息传递结果和各训练样本的标签信息，计算损失值，并基于损失值调整推荐模型的参数。提高了推荐模型的鲁棒性和可信度，进而可以提高推荐的准确率。

Description

推荐模型训练方法及装置、推荐方法及装置

技术领域

本申请涉及计算机技术领域，特别涉及一种推荐模型训练方法。本申请同时涉及一种推荐方法，一种推荐模型训练装置，一种推荐装置，一种计算设备，以及一种计算机可读存储介质。

背景技术

随着计算机技术与互联网技术的不断发展，各种各样的网络平台层出不穷，其中以推荐平台和社交平台最为流行。而推荐平台和社交平台进一步优化，离不开推荐系统，因此需要提高推荐系统的时效性和准确性。

目前，大量的推荐系统采用在线学习的思想，以获得更好的时效性和准确性。然而，受限于系统性能和服务器开销，大多数的推荐系统无法等待所有样本完成回传，导致部分回传延迟过长的正样本被错误标记为负样本，进入训练流中，制约了推荐系统的准确性，影响电商平台、社交媒体等平台的收益。

发明内容

有鉴于此，本申请实施例提供了一种推荐模型训练方法。本申请同时涉及一种推荐方法，一种推荐模型训练装置，一种推荐装置，一种计算设备，以及一种计算机可读存储介质，以解决现有技术中存在的技术缺陷。

根据本申请实施例的第一方面，提供了一种推荐模型训练方法，包括：获取训练样本集，其中，训练样本集包括多个训练样本，训练样本包括用户和物品组成的样本对；根据训练样本在各预设周期内的转化结果，确定各预设周期内训练样本的样本类型，其中，预设周期包括等待周期、延时周期和超时周期，样本类型包括正样本、负样本和未知样本；针对各预设周期，根据该预设周期内训练样本的样本类型，确定异质图，其中，异质图表征训练样本中用户与物品之间的关系；根据异质图，确定该预设周期内各训练样本对应的用户节点特征和物品节点特征，并将用户节点特征和物品节点特征进行信息传递；根据信息传递结果和各训练样本的标签信息，计算损失值，并基于损失值调整推荐模型的参数。

根据本申请实施例的第二方面，提供了一种推荐方法，包括：获取待推荐用户和物品集合，其中，物品集合中包括至少一个物品；将待推荐用户和物品集合输入训练好的推荐模型，得到各物品的推荐值，其中，推荐模型通过上述推荐模型训练方法得到；将各推荐值从大到小排列，将排列前K个的推荐值对应的物品推荐给待推荐用户，其中，K为正整数。

根据本申请实施例的第三方面，提供了一种推荐模型训练装置，包括：第一获取模块，被配置为获取训练样本集，其中，训练样本集包括多个训练样本，训练样本包括用户和物品组成的样本对；第一确定模块，被配置为根据训练样本在各预设周期内的转化结果，确定各预设周期内训练样本的样本类型，其中，预设周期包括等待周期、延时周期和超时周期，样本类型包括正样本、负样本和未知样本；第二确定模块，被配置为针对各预设周期，根据该预设周期内训练样本的样本类型，确定异质图，其中，异质图表征训练样本中用户与物品之间的关系；第三确定模块，被配置为根据异质图，确定该预设周期内各训练样本对应的用户节点特征和物品节点特征，并将用户节点特征和物品节点特征进行信息传递；调整模块，被配置为根据信息传递结果和各训练样本的标签信息，计算损失值，并基于损失值调整推荐模型的参数。

根据本申请实施例的第四方面，提供了一种推荐装置，包括：第二获取模块，被配置为待推荐用户和物品集合，其中，物品集合中包括至少一个物品；输入模块，被配置为将待推荐用户和物品集合输入训练好的推荐模型，得到各物品的推荐值，其中，推荐模型通过上述推荐模型训练方法得到；推荐模块，被配置为将各推荐值从大到小排列，将排列前K个的推荐值对应的物品推荐给待推荐用户，其中，K为正整数。

根据本申请实施例的第五方面，提供了一种计算设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令，处理器执行计算机指令时实现上述推荐模型训练方法或推荐方法。

根据本申请实施例的第六方面，提供了一种计算机可读存储介质，其存储有计算机指令，该计算机指令被处理器执行时实现上述推荐模型训练方法或推荐方法。

本申请提供的推荐模型训练方法，获取训练样本集，所述训练样本集包括多个训练样本，所述训练样本包括用户和物品组成的样本对；根据训练样本在各预设周期内的转化结果，确定所述各预设周期内训练样本的样本类型，所述预设周期包括等待周期、延时周期和超时周期，所述样本类型包括正样本、负样本和未知样本；针对所述各预设周期，根据该预设周期内训练样本的样本类型，确定异质图，所述异质图表征所述训练样本中用户与物品之间的关系；根据所述异质图，确定该预设周期内各训练样本对应的用户节点特征和物品节点特征，并将所述用户节点特征和所述物品节点特征进行信息传递；根据信息传递结果和各训练样本的标签信息，计算损失值，并基于所述损失值调整所述推荐模型的参数。本申请一实施例实现了通过设置等待周期、延时周期和超时周期，使训练样本能用足够长的时间进行转化，避免了将用户延迟反馈的正样本错误标记为负样本，从而避免了错误训练推荐模型，提高了推荐模型的鲁棒性和可信度。应用广泛，能够解决推荐系统中存在的延迟问题。进而可以提高基于推荐模型进行推荐的准确度，一定程度上提高用户粘度，从而提高推荐模型对应的推荐平台的收益。

附图说明

图1是本申请一实施例提供的一种推荐模型训练方法的流程图。

图2是本申请一实施例提供的一种推荐模型训练方法中训练样本的示意图。

图3是本申请一实施例提供的一种推荐模型训练方法中异质图的示意图。

图4是本申请一实施例提供的另一种推荐模型训练方法中异质图的示意图。

图5是本申请一实施例提供的再一种推荐模型训练方法中异质图的示意图。

图6是本申请一实施例提供的一种推荐方法的流程图。

图7是本申请一实施例提供的另一种推荐方法的流程图。

图8是本申请一实施例提供的一种应用于商品推荐的推荐方法的处理流程图。

图9是本申请一实施例提供的一种推荐模型训练装置的结构示意图。

图10是本申请一实施例提供的一种推荐装置的结构示意图。

图11是本申请一实施例提供的一种计算设备的结构框图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本申请内涵的情况下做类似推广，因此本申请不受下面公开的具体实施的限制。

在本申请一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本申请一个或多个实施例。在本申请一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本申请一个或多个实施例中使用的术语“和/或”是指包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本申请一个或多个实施例中可能采用术语第一、第二等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本申请一个或多个实施例范围的情况下，第一也可以被称为第二，类似地，第二也可以被称为第一。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

首先，对本申请一个或多个实施例的推荐模型训练方法进行简要说明。

目前，大量的推荐系统采用在线学习的思想，以获得更好的时效性和准确性，如将用户和物品形成的二分图和用户间的社交网络进行融合，形成异质图；若存在新加入的用户或者项目，则在异质图上生成新边以增加节点之间的关联度，使用图神经网络，基于异质图更新用户和项目的嵌入特征，后使用双线性解码器得到每个关系的可能分布，最终形成推荐列表。

然而，上述方法受限于系统性能和服务器开销，大多数的推荐系统无法等待所有样本完成回传，导致部分回传延迟过长的正样本被错误标记为负样本，进入训练流中，制约了推荐系统的准确性，影响电商平台、社交媒体等平台的收益。

图1示出了根据本申请一实施例提供的一种推荐模型训练方法的流程图，具体包括以下步骤102-110。

步骤102：获取训练样本集，所述训练样本集包括多个训练样本，所述训练样本包括用户和物品组成的样本对。

具体的，推荐模型是指用于预测的、用数学语言或公式所描述的事物间的数量关系的模型，推荐模型可以是预测模型、评价模型，可以是其他用于预测的模型，也可以是对未知数据进行预测的算法，本申请对此不做限定。训练样本集是指将用于训练推荐模型的样本组成的集合，其中训练样本集包含多个训练样本，每个训练样本为用户与物品组成的样本对，也即每个训练样本中包含用户以及与用户关联的物品。

机器学习是设计和分析让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律，并利用规律对未知数据进行预测的算法。机器学习的主要流程为：获取训练样本集、训练推荐模型、推荐模型应用阶段。其中，训练样本集通过从数据源收集并整理数据形成训练样本集；训练推荐模型通过将训练样本集输入至为训练的推荐模型进行训练，从而获得训练好的推荐模型；推荐模型应用阶段通过将应用数据集、即待推荐数据集输入至训练好的推荐模型，使推荐模型进行处理并输出应用结果，也即推荐结果。

例如，某购物网站需要给用户推荐用户感兴趣的商品，可以根据大量用户的购物记录与各种个人数据制作数据集，根据一定的机器学习算法（推荐模型）训练得到训练好的推荐模型。当需要给某个用户推荐商品时，把该用户以及商品的信息作为应用数据集输入到训练好的模型，推荐模型会给出相应到推荐结果，该推荐结果即推荐的商品。

步骤104：根据训练样本在各预设周期内的转化结果，确定所述各预设周期内训练样本的样本类型，所述预设周期包括等待周期、延时周期和超时周期，所述样本类型包括正样本、负样本和未知样本。

在获取训练样本集的基础上，进一步地，需要基于预设周期对训练样本的样本类型进行识别。

具体的，预设周期是指预先设置的周期，可以根据时间长度进行划分得到；转化结果是指在预设周期内，某训练样本中用户对商品是否进行转化，当某训练样本中的用户对物品发生深度行为，如购买、注册、下载等，即说明该训练样本的转化结果为已转化，若某训练样本中的用户对物品未发生深度行为，即说明该训练样本的转化结果为未转化；等待周期是指正常等待训练样本进行转化的时间长度对应的周期；延时周期是指在等待周期之后设置的延长时间段，用于继续等待训练样本进行转化；超时周期是指超过等待周期、延时周期之后的时间段，进入超时周期，表征训练样本转化超时。

实际应用中，推荐系统所使用的训练样本，也即数据流需要具有高准确性和低延时性。预设周期是按照等待周期、延时周期和超时周期的顺序进行排列的，因此，可以先确定等待周期内各训练样本的转化结果，然后基于转化结果确定各训练样本的样本类型；接着确定延时周期内各训练样本的转化结果，然后基于转化结果确定各训练样本的样本类型；最后，确定超时周期内各训练样本的转化结果，然后基于转化结果确定各训练样本的样本类型。

在本说明书一个或多个可选的实施例中，针对等待周期，可以将转化结果为已转化的训练样本确定为第一正样本，未转化的训练样本确定为第一未知样本。也即根据训练样本在各预设周期内的转化结果，确定所述各预设周期内训练样本的样本类型，具体实现过程可以包括：将在所述等待周期内发生转化的训练样本确定为第一正样本、未发生转化的训练样本确定为第一未知样本。

实际应用中，训练样本可以在等待周期内发生转化，也可以未发生转化。若某个训练样本在等待周期内发生转化，也即该训练样本在等待周期内的转化结果为已转化，将该训练样本确定为第一正样本；若某个训练样本在等待周期结束时未发生转化，也即该训练样本在等待周期内的转化结果为未转化，将该训练样本确定为第一未知样本。如此，可以在等待周期及时地确定正样本，对于未发生转化，由于用户反馈的延迟，暂时标记为未知样本，避免了将用户延迟反馈的正样本错误标记为负样本，从而避免了错误训练推荐模型，提高了推荐模型的鲁棒性和可信度。

例如，有训练样本集中有五个训练样本，其中训练样本一和训练样本三在等待周期内发生转化，训练样本二、训练样本四和训练样本五未发生转化，则将训练样本一和训练样本三确定为第一正样本，将训练样本二、训练样本四和训练样本五确定为第一未知样本。

在本说明书一个或多个可选的实施例中，针对延时周期，可以将转化结果为已转化的第一未知训练样本确定为第二正样本，未转化的第一未知训练样本确定为第二未知样本。也即根据训练样本在各预设周期内的转化结果，确定所述各预设周期内训练样本的样本类型，具体实现过程可以包括：将在所述延时周期内发生转化的第一未知样本确定为第二正样本、未发生转化的第一未知样本确定为第二未知样本，所述第一未知样本为在所述等待周期内未发生转化的训练样本。

实际应用中，由于等待周期在延时周期之前，且可能有部分训练样本在等待周期内发生转化，因此，避免冗余处理训练样本，在延时周期内，可以只针对等待周期内未发生转化的训练样本，也即第一未知样本进行处理。第一未知样本可以在延时周期内发生转化，也可以未发生转化。若某个第一未知样本在延时周期内发生转化，也即该第一未知样本在延时周期内的转化结果为已转化，将该第一未知样本确定为第二正样本；若某个第一未知样本在延时周期结束时未发生转化，也即该第一未知样本在延时周期内的转化结果为未转化，将该第一未知样本确定为第二未知样本。如此，可以在延时周期及时地确定正样本，对于未发生转化，由于用户反馈的延迟，暂时标记为未知样本，避免了将用户延迟反馈的正样本错误标记为负样本，从而避免了错误训练推荐模型，提高了推荐模型的鲁棒性和可信度。此外，延时周期只对第一未知样本进行处理，降低了数据处理量，从而可以提高训练推荐模型的效率。

沿用上例，有训练样本集中有五个训练样本，其中训练样本一和训练样本三为第一正样本，训练样本二、训练样本四和训练样本五为第一未知样本。则对于延时周期，只针对训练样本二、训练样本四和训练样本五的样本类型进行识别，若其中训练样本二和训练样本五在延时周期内发生转化，训练样本四未发生转化，则将训练样本二和训练样本五确定为第二正样本，将训练样本四确定为第二未知样本。

在本说明书一个或多个可选的实施例中，针对超时周期，可以将在等待周期和延时周期均未转化的训练样本确定为负样本，由于等待周期和所述延时周期构成归因周期，因此针对超时周期，可以将在归因周期内未转化的训练样本确定为负样本。也即在所述等待周期和所述延时周期构成归因周期的情况下，根据训练样本在各预设周期内的转化结果，确定所述各预设周期内训练样本的样本类型，具体实现过程可以包括：将在所述归因周期内未转化的训练样本，确定为负样本。

具体的，归因周期为等待训练样本转化的最长的周期，在若训练样本在归因周期内发生转化，则该训练样本为正样本，将以正样本的形式下发进训练流中；如训练样本的等待时间超过归因周期，则将作为负样本下发进训练流中。

实际应用中，由于归因周期在超时周期之前，且可能有部分训练样本在归因周期内发生转化，因此，避免冗余处理训练样本，在超时周期内，可以只针对归因周期内未发生转化的训练样本，也即第二未知样本进行处理。第二未知样本的等待时间超过归因周期，也即进入了归因周期，可以将第二未知样本直接确定为负样本。如此，可以在超时周期及时地确定负样本，也即对于长时间未发生转化，标记为负样本，如此，可以基于正样本和负样本对推荐模型进行训练，提高了推荐模型的鲁棒性和可信度。

沿用上例，训练样本四在等待周期和延时周期均未发生转化，也即在归因周期内未发生转化，则将训练样本四确定为负样本。

参见图2，图2示出了本申请一实施例提供的一种推荐模型训练方法中训练样本的示意图。其中[t0，t1]为等待周期，[t1，t2]为延时周期，[t2，+∞）为超时周期，则[t0，t2]为归因周期，且A、B和C为三个不同的训练样本。如图2所示，在等待周期内，训练样本A、B、C中只有训练样本B发生转化，因此将训练样本B确定为第一正样本，将训练样本A和C确定为第一未知样本，也即A~和C~；在等待周期内，第一未知样本A~发生转化，因此将第一未知样本A~确定为第二正样本，也即A，第一未知样本C~未发生转化，因此将第一未知样本C~确定为第二未知样本；在归因周期内，训练样本C中未发生转化，将训练样本C，也即在第一未知样本C~，确定为负样本，即C。对于第一正样本B，也即非延迟正样本B，在等待周期内观察转化后，将立刻以正样本形式进入训练流。对于第二正样本A，也即延迟正样本A，其于超时周期转化后，将以正样本形式进入训练流。对于负样本C，其于归因周期结束后，将以负样本形式进入训练流。

步骤106：针对所述各预设周期，根据该预设周期内训练样本的样本类型，确定异质图，所述异质图表征所述训练样本中用户与物品之间的关系。

在基于预设周期对训练样本的样本类型进行识别的基础上，进一步地，针对各预设周期，根据该预设周期内训练样本的样本类型，确定异质图。

具体的，异质图是指包括多种类型的图结构，也即将不同属性的数据或物质合到一起的图结构。本申请中，异质图为以用户与物品为节点对应的图结构。

实际应用中，预设周期是按照等待周期、延时周期和超时周期的顺序进行排列的，基于预设周期对训练样本的样本类型进行识别也是按照等待周期、延时周期和超时周期的顺序进行的，因此，在确定异质图时，也可以在按照等待周期、延时周期和超时周期的顺序进行，也即可以先在等待周期结束时，根据等待周期内训练样本的样本类型构建等待周期对应的异质图；然后先在延时周期结束时，根据延时周期内训练样本的样本类型更新异质图，得到延时周期对应的异质图；进一步地，根据超时周期内训练样本的样本类型更新异质图，得到超时周期对应的异质图。

此外，还可以每当一个训练样本发生转化，就根据该训练样本更新异质图，直到超时周期结束，根据未发生转发的训练样本更新异质图。例如，有三个训练样本：yb1、yb2和yb3。在超时周期结束前，训练样本yb3和训练样本yb1依次发生了转化，训练样本yb2在超时周期结束以及之前未发生转化。则在训练样本yb3发生转化时，以训练样本yb3为正样本、训练样本yb1和yb2为未知样本确定异质图；在训练样本yb2发生转化时，以训练样本yb1和yb3为正样本、训练样本yb2为未知样本更新异质图；在超时周期结束后，以训练样本yb1和yb3为正样本、训练样本yb2为负样本更新异质图。

在本说明书一个或多个可选的实施例中，针对等待周期，可以将在等待周期发生转化的第一正样本和未转化的第一未知样本构建异质图。也即针对所述各预设周期，根据该预设周期内训练样本的样本类型，确定异质图，包括：根据所述第一正样本和所述第一未知样本，构建所述等待周期对应的第一异质图。

具体的，第一异质图是指等待周期对应的异质图。

实际应用中，由于将在等待周期内发生转化的训练样本确定为第一正样本、未发生转化的训练样本确定为第一未知样本，进一步地，可以基于第一正样本和第一未知样本构建等待周期对应的第一异质图。如此，可以快速构建第一异质图，有利于基于第一正样本和第一异质图对推荐模型进行训练，提高模型训练效率。

如图3所示，图3示出了本申请一实施例提供的一种推荐模型训练方法中异质图的示意图，也即第一异质图：有三个训练样本，训练样本a、b和c，其中训练样本a、b和c中的用户为同一用户，物品分别为A、B和C。假设在等待周期，训练样本b发生转化，则训练样本b为第一正样本，训练样本a和c未发生转化，则训练样本a和c为第一未知样本，即基于正样本和未知样本构建第一异质图，其中，用户表示用户节点，由于训练样本a、b和c中的用户为同一用户，所以训练样本a、b和c在第一异质图中公用同一个用户节点；实线的边表示通过训练样本确定的用户和物品关系，如发生转化、未发生转化、暂时未知，虚线的边表示推荐模型需要预测的用户和物品之间的关系，用于监督推荐模型训练；实线的节点表示正样本，虚线的节点表示未知样本。

需要说明的是，有两种特殊情况：一是在等待周期内所有的训练样本均发生转化，也即所有的训练样本均为第一正样本，此时没有未发生转化的训练样本，也即没有第一未知样本，此时基于第一正样本构建第一异质图即可，由于所有训练样本均在等待周期内发生转化，因此，此时不存在之后针对延时周期和超时周期的操作：二是在等待周期内所有的训练样本均未发生转化，也即所有的训练样本均为第一未知样本，此时没有发生转化的训练样本，也即没有第一正样本，此时基于第一未知样本构建第一异质图即可。

在本说明书一个或多个可选的实施例中，针对延时周期，可以将在延时周期发生转化的第二正样本和未转化的第二未知样本以及等待周期发生转化的第一正样本确定异质图。也即针对所述各预设周期，根据该预设周期内训练样本的样本类型，确定异质图，包括：根据第一正样本、所述第二正样本和所述第二未知样本，更新第一异质图，得到所述延时周期对应的第二异质图，所述第一正样本为在所述等待周期内发生转化的训练样本，所述第一异质图为所述等待周期对应的异质图。

具体的，第二异质图是指延时周期对应的异质图。

实际应用中，由于将在延时周期内发生转化的第一未知样本确定为第二正样本、未发生转化的第一未知样本确定为第二未知样本，其中第一未知样本为在所述等待周期内未发生转化的训练样本，进一步地，可以基于等待周期内发生转化的第一正样本、第二正样本和第二未知样本更新等待周期对应的异质图，也即更新第一异质图，得到延时周期对应的第二异质图。如此，可以快速确定第二异质图，有利于基于第二正样本和第二异质图对推荐模型进行训练，提高模型训练效率。

如图4所示，图4示出了本申请一实施例提供的另一种推荐模型训练方法中异质图的示意图，也即第二异质图：有三个训练样本，训练样本a、b和c，其中训练样本a、b和c中的用户为同一用户，物品分别为A、B和C。假设在等待周期，训练样本b发生转化，则训练样本b为第一正样本，在延时周期，训练样本a发生转化，则训练样本a为第二正样本，训练样本c未发生转化，则训练样本c为第二未知样本，即基于正样本和未知样本确定第二异质图，其中，用户表示用户节点，由于训练样本a、b和c中的用户为同一用户，所以训练样本a、b和c在第一异质图中公用同一个用户节点；实线的边表示通过训练样本确定的用户和物品关系，如发生转化、未发生转化、暂时未知，虚线的边表示推荐模型需要预测的用户和物品之间的关系，用于监督推荐模型训练；实线的节点表示正样本，虚线的节点表示未知样本。

需要说明的是，有两种特殊情况：一是在延时周期内所有的第一未知样本均发生转化，也即所有的第一未知样本均为第一正样本，此时没有未发生转化的第一未知样本，也即没有第二未知样本，此时基于第一正样本和第二正样本确定第二异质图即可，由于所有第一未知样本均在等待周期内发生转化，因此，此时不存在之后针对超时周期的操作：二是在延时周期内所有的第一未知样本均未发生转化，也即所有的第一未知样本均为第二未知样本，此时没有发生转化的第一未知样本，也即没有第二正样本，此时基于第一正样本和第二未知样本确定第二异质图即可。

在本说明书一个或多个可选的实施例中，针对超时周期，可以将在归因周期未发生转化的训练样本确定为负样本，然后基于归因周期内发生转化的正样本和负样本确定异质图。也即针对所述各预设周期，根据该预设周期内训练样本的样本类型，确定异质图，包括：根据第三正样本和所述负样本，更新第二异质图，得到所述超时周期对应的第三异质图，所述第三正样本为在所述归因周期内发生转化的训练样本，所述第二异质图为所述延时周期对应的异质图。

具体的，第三异质图是指超时周期对应的异质图。第三正样本包括在等待周期内发生转化的第一正样本和在延时周期内发生转化的第二正样本。

实际应用中，由于将在归因周期内未转化的训练样本，确定为负样本，也即将在等待周期和延时周期均为发生转化的训练样本确定为负样本，进一步地，可以基于等待周期内发生转化的第一正样本、延时周期内发生转化的第二正样本和超时周期内的负样本更新延时周期对应的异质图，也即更新第二异质图，得到超时周期对应的第三异质图。如此，可以快速更新第三异质图，有利于基于负样本和第三异质图对推荐模型进行训练，提高模型训练效率。

如图5所示，图5示出了本申请一实施例提供的再一种推荐模型训练方法中异质图的示意图，也即第三异质图：有三个训练样本，训练样本a、b和c，其中训练样本a、b和c中的用户为同一用户，物品分别为A、B和C。假设在等待周期，训练样本b发生转化，则训练样本b为第一正样本，在延时周期，训练样本a发生转化，则训练样本a为第二正样本，进入超时周期时，训练样本c未发生转化，也即训练样本c的转化时长超过归因周期，则训练样本c为负样本，即基于正样本和负样本确定第三异质图，其中，用户表示用户节点，由于训练样本a、b和c中的用户为同一用户，所以训练样本a、b和c在第一异质图中公用同一个用户节点；实线的边表示通过训练样本确定的用户和物品关系，如发生转化、未发生转化、暂时未知，虚线的边表示推荐模型需要预测的用户和物品之间的关系，用于监督推荐模型训练；白色的节点表示正样本，黑色的节点代表负样本。

步骤108：根据所述异质图，确定该预设周期内各训练样本对应的用户节点特征和物品节点特征，并将所述用户节点特征和所述物品节点特征进行信息传递。

在针对各预设周期，根据该预设周期内训练样本的样本类型，确定异质图的基础上，进一步地，根据所述异质图，确定该预设周期内各训练样本对应的用户节点特征和物品节点特征，并将用户节点特征和物品节点特征进行信息传递。

具体的，用户节点特征是指异质图中训练样本中用户对应的节点的特征；物品节点特征是指异质图中训练样本中物品对应的节点的特征；信息传递，也即消息传递，是指基于异质图的图机构，使节点之间进行节点特征的传递。

实际应用中，针对各预设周期，当确定该预设周期对应的异质图后，可以根据异质图，使用特征嵌入矩阵构建异质图中各训练样本的用户节点特征和物品节点特征。通过信息传递方式，更新用户节点特征和物品节点特征，也即将用户节点特征和物品节点特征进行信息传递，每次信息传递都将聚合邻居节点特征，用户节点或者物品节点直接通过边相连的其他节点。通常将执行多次信息传递，以获得使更用户节点特征和物品节点特征更丰富、精准。

例如，针对等待周期，将各训练样本和等待周期对应的第一异质图输入至推荐模型，推荐模型根据第一异质图，确定各训练样本对应的用户节点特征与物品节点特征，并基于第一异质图，将用户节点特征和物品节点特征进行信息传递；针对延时周期，将各训练样本和延时周期对应的第二异质图输入至推荐模型，推荐模型根据第二异质图，确定各训练样本对应的用户节点特征与物品节点特征，并基于第二异质图，将用户节点特征和物品节点特征进行信息传递；针对超时周期，将各训练样本和超时周期对应的第三异质图输入至推荐模型，推荐模型根据第三异质图，确定各训练样本对应的用户节点特征与物品节点特征，并基于第三异质图，将用户节点特征和物品节点特征进行信息传递。

需要说明的是，确定该预设周期内各训练样本对应的用户节点特征和物品节点特征时，可以通过特征嵌入矩阵Emb构建异质图中各训练样本对应的用户节点特征和物品节点特征。如基于用户和物品的唯一标识，例如ID，即使以uid代表用户节点、iid代表物品节点构建，用户节点特征和物品节点特征，如式1所示。

（式1）

式1中，E_u为用户节点特征，E_i为物品节点特征。

其后，将用户节点特征和所述物品节点特征进行信息传递时，可以使用如图卷积神经网络（GCN，Graph Convolutional Network）、图神经网络算法（GraphSage，GraphSAmple and aggreGatE）等常见的图神经网络模型进行节点间的特征消息传递。例如，可以通过式2所示的消息传递方式进行信息传递。

（式2）

式2中，其中i和j表示异质图中的节点，用户节点或者物品节点；（K）表示第K次信息传递；E_i ^(k)为第K次信息传递后的节点特征；N(i)为节点的邻居集合，τ和/>包括多层感知机在内的神经网络模型。σ为一种聚合方式，包括平均值和求和操作等。

在本说明书一个或多个可选的实施例中，由推荐模型的特征提取层确定各训练样本对应的初始用户节点特征与初始物品节点特征，由推荐模型的信息传递层信息传递层进行信息传递，确定目标用户节点特征与目标物品节点特征。也即根据所述异质图，确定该预设周期内各训练样本对应的用户节点特征和物品节点特征，并将所述用户节点特征和所述物品节点特征进行信息传递，具体实现过程可以包括：将各训练样本和所述异质图输入至所述推荐模型的特征提取层，根据所述异质图进行特征提取处理，获得各训练样本对应的初始用户节点特征与初始物品节点特征；将所述异质图、各训练样本对应的所述初始用户节点特征与所述初始物品节点特征输入至所述推荐模型的信息传递层，基于所述异质图，将各训练样本对应的所述用户节点特征与物品节点特征进行信息传递，得到各训练样本对应的目标用户节点特征与目标物品节点特征。

具体的，特征提取层是指用于提取异质图中各训练样本对应的用户节点特征与物品节点特征；初始用户节点特征与初始物品节点特征分别为基于异质图直接提取到训练样本对应的用户节点特征与物品节点特征；目标用户节点特征与目标物品节点特征为经过信息传递后，训练样本对应的用户节点特征与物品节点特征。

实际应用中，先将各训练样本和异质图输入至推荐模型，由特征提取层基于异质图，通过特征嵌入矩阵构建异质图中各训练样本对应的用户节点特征与物品节点特征，也即构建各训练样本对应的初始用户节点特征与初始物品节点特征；然后由信息传递层，基于异质图的图结构，对初始用户节点特征与初始物品节点特征进行多次信息传递，得到各训练样本对应的目标用户节点特征与目标物品节点特征。如此，可以提高模型训练的效率。

步骤110：根据信息传递结果和各训练样本的标签信息，计算损失值，并基于所述损失值调整所述推荐模型的参数。

在根据所述异质图，确定该预设周期内各训练样本对应的用户节点特征和物品节点特征，并将用户节点特征和物品节点特征进行信息传递的基础上，进一步地，根据信息传递结果和各训练样本的标签信息，计算损失值，并基于损失值调整所述推荐模型的参数。

具体的，标签信息是指正样本和负样本所携带的用于验证推荐模型而设置的标签；计算损失值的损失函数有很多，如交叉熵损失函数、L1范数损失函数、最大损失函数、均方误差损失函数、对数损失函数等，在本申请中，不对计算损失值的损失函数的选择做限定。参数是指推荐模型中的参数，如特征提取层的参数、信息传递层的参数，又如特征嵌入矩阵Emb的参数、τ和包括多层感知机在内的神经网络模型的参数。

实际应用中，可以根据信息传递结果，确定推荐模型的预测结果，或者直接将信息传递结果作为推荐模型的预测结果然后基于预测结果和各训练样本的标签信息，计算推荐模型的损失值，进一步地基于损失值调整推荐模型的参数。

在本申请一个或多个可选的实施例中，根据信息传递结果和各训练样本的标签信息，计算损失值，具体实现过程可以包括：根据各训练样本对应的所述目标用户节点特征与所述目标物品节点特征，确定所述推荐模型的预测结果；根据所述预测结果和各训练样本的标签信息，计算损失值。

具体的，预测结果是指推荐模型针对各训练样本输出的结果。

实际应用中，信息传递结果为消息传递后各训练样本对应的目标用户节点特征与目标物品节点特征，此时可以基于目标用户节点特征与目标物品节点特征，确定推荐模型的预测结果，进一步地，基于预测结果和各训练样本的标签信息直接的差异性，计算损失值。如此，可以提高损失值的准确定，进而在调整参数时，可以是参数迅速收敛，提高模型训练效率。

需要说明的是，可以基于目标用户节点特征与目标物品节点特征的相似度，来确定预测结果，也即根据各训练样本对应的所述目标用户节点特征与所述目标物品节点特征，确定所述推荐模型的预测结果，具体实现过程可以包括：计算各训练样本对应的所述目标用户节点特征与所述目标物品节点特征的相似度；根据所述相似度与预设排列规则，确定预测结果。

具体的，预设排列规则是指预先设置的对多个相似度进行排列的方式，可以是从大到小的排列规则，还可以是从小到大的排列规则。

实际应用中，在获得了消息传递结果的基础上，也即获得各训练样本对应的的目标用户节点特征与目标物品节点特征后，计算各训练样本对应的目标用户节点特征与目标物品节点特征之间的相似度，判断用户对物品的偏好：将各相似度从大到小排列，将排列在前Q位的相似度对应的训练样本的预测结果确定为偏好，将排列在Q位之后的相似度对应的训练样本的预测结果确定为非偏好，其中Q为正整数。或者将各相似度从小到大排列，将排列在P位之后的相似度对应的训练样本的预测结果确定为偏好，将排列前P位的相似度对应的训练样本的预测结果确定为非偏好，其中P为正整数。

可选地，在得到了各训练样本对应的目标用户节点特征与目标物品节点特征之间的相似度之后，还可以根据所述相似度与预设排相似度阈值，确定预测结果，也即判断用户对物品的偏好：在所述相似度大于或等于所述预设相似度阈值，确定所述预测结果为偏好；在所述相似度小于所述预设相似度阈值，确定所述预测结果为非偏好。

此外，根据所述目标用户节点特征与所述目标物品节点特征，确定所述推荐模型的预测结果时，还可以拼接目标用户节点特征与目标物品节点特征，得到拼接节点特征，然后通过多层感知机计算拼接节点特征的预测得分，将预测得分作为预测结果。例如，通过式3对目标用户节点特征与目标物品节点特征进行拼接，通过式4对计算拼接节点特征的预测得分。

（式3）

（式4）

式3中，E_u为目标用户节点特征，E_i为目标物品节点特征，E_u,i为拼接节点特征，concat表示拼接函数；式4中，E_u,i为拼接节点特征，S_u,i为推荐模型的预测得分，MLP为多层感知机。

为了提高损失值的精确度，进一步提高模型训练的效率，优选地，利用交叉熵损失函数计算损失值，也即利用交叉熵损失函数，基于所述预测结果和各训练样本的标签信息，计算损失值。例如，通过式5，计算损失值。

（式5）

式5中，y_u,i是指训练样本的标签信息，也即用户对物品的反馈信息，则对于正样本y_u,i=1，对于负样本y_u,i=-1；u表示用户节点，i表示物品节点；S_u,i为预测得分，也即预测结果，L为损失值，使用交叉熵损失函数L来监督模型学习。

在本实施例的一个或多个实施方式中，训练所述推荐模型的训练停止条件为：可以为所述损失值小于目标值；可以为所述损失值停止下降；还可以为当推荐模型的迭代次数达到目标迭代次数。

在本实施例中，预先设置了目标值，当所述推荐模型的损失值低于预设的目标值时，或者当所述损失值停止下降时，又或者，当所述推荐模型的迭代次数达到目标迭代次数时，说明所述推荐模型达到推荐标准或者一定的推荐水平，即达到了训练停止条件，因此，停止训练所述推荐模型。

此外，还可以实时训练推荐模型，也即不断地训练推荐模型，只要有训练样本，就实时训练推荐，以便于不断地完善推荐模型。

需要说明的是，训练推荐模型时，先基于等待周期的各训练样本和第一异质图训练推荐模型，之后，若不存在第一未知样本，则可以从更新获取训练样本集对推荐模型进行训练；若存在第一未知样本，则进入延迟周期，基于各训练样本和第二异质图训练推荐模型，之后，若不存在第二未知样本，则可以从更新获取训练样本集对推荐模型进行训练；若存在第二未知样本，则进入超时周期，基于各训练样本和第三异质图训练推荐模型，之后从更新获取训练样本集对推荐模型进行训练，直至达到训练停止条件，或者实时训练推荐模型。

图6示出了根据本申请一实施例提供的一种推荐方法的流程图，具体包括以下步骤602-606。

步骤602：获取待推荐用户和物品集合，所述物品集合中包括至少一个物品。

具体的，待推荐用户是指需要进行物品推荐的用户；物品集合中包含所有可以进行推荐的物品。

实际应用中，在检测到用户登录或者进入推荐平台时，即可以确定该用户为待推荐用户，并获取推荐平台上所有的物品，也即物品集合。

步骤604：将所述待推荐用户和物品集合输入训练好的推荐模型，得到各物品的推荐值，所述推荐模型为通过上述推荐模型训练方法得到的。

具体的，推荐值是指推荐模型输出的结果，如基于用户为每个物品进行打分的分值。

实际应用中，将待推荐用户和物品集合输入训练好的推荐模型，得到各物品的推荐值。

例如，将待推荐用户和物品集合输入训练好的推荐模型后，推荐模型基于用户和物品集合确定异质图，然后基于异质图，确定目标用户节点特征和各目标物品节点特征，分别将各目标物品节点特征与目标用户节点特征进行拼接，如式6所示，得到拼接节点特征，然后通过多层感知机计算拼接节点特征的得分，将得分作为推荐值，如式7所示。

（式6）

（式7）

式6中，E_u为目标用户节点特征，E_i为目标物品节点特征，E_u,i为拼接节点特征，concat表示拼接函数；式7中，E_u,i为拼接节点特征，I表示物品集合，S_u,i表示第i个物品的推荐值。

步骤606：将各推荐值从大到小排列，将排列前K个的推荐值对应的物品推荐给所述待推荐用户，K为正整数。

实际应用中，在得到各物品的推荐值的基础上，进一步地，将各推荐值从大到小排列，将排列前K个的推荐值对应的物品推荐给所述待推荐用户。

实际应用中，在得到各物品的推荐值的基础上，将推荐值最大的前K个物品推荐给待推荐用户，其中K为正整数。例如，将按照推荐值从大到小的顺序，将各物品进行排列，将前K个物品推荐给待推荐用户，又如，将按照推荐值从小到大的顺序，将各物品进行排列，将最后N个物品推荐给待推荐用户。

此外，还可以将推荐值大于预设推荐值的物品作为目标物品推荐给待推荐用户。

由于延迟反馈是由用户反馈的延迟导致正样本作为负样本下发的问题，即训练样本的转化时间长于设置的等待时间，导致无法观察到训练样本转化情况。这一问题广泛影响了在使用推荐模型的推荐系统的性能。因此本申请针对现有推荐系统中存在的延迟反馈问题，提出基于图神经网络的延迟建模解决方案。其核心包括针对延迟反馈场景构建相应的数据流和推荐模型，参见图7，图7示出了本申请一实施例提供的另一种推荐方法的流程图：先构建延迟数据流，也即根据训练样本在各预设周期内的转化结果，确定各预设周期内训练样本的样本类型；然后确定异质图，也即针对各预设周期，根据该预设周期内训练样本的样本类型，确定异质图；接着初始化特征与信息传播，也即根据异质图确定该预设周期内各训练样本对应的用户节点特征和物品节点特征，并将用户节点特征和物品节点特征进行信息传递；然后训练推荐模型，也即根据信息传递结果和各训练样本的标签信息，计算损失值，并基于损失值调整所述推荐模型的参数。最后，推荐物品，也即将待推荐用户和物品集合输入训练好的推荐模型，得到各物品的推荐值，将推荐值最大的前K个物品推荐给待推荐用户。

本申请提供的推荐方法，获取待推荐用户和物品集合，所述物品集合中包括至少一个物品；将所述待推荐用户和物品集合输入训练好的推荐模型，得到各物品的推荐值，所述推荐模型为通过上述推荐模型训练方法得到的；将各推荐值从大到小排列，将排列前K个的推荐值对应的物品推荐给所述待推荐用户，K为正整数。本申请一实施例实现了通过设置等待周期、延时周期和超时周期，使训练样本能用足够长的时间进行转化，避免了将用户延迟反馈的正样本错误标记为负样本，从而避免了错误训练推荐模型，提高了推荐模型的鲁棒性和可信度。应用广泛，能够解决推荐系统中存在的延迟问题。进而可以提高基于推荐模型进行推荐的准确度，一定程度上提高用户粘度，从而提高推荐模型对应的推荐平台的收益。

下述结合附图8，以本申请提供的推荐方法在商品推荐的应用为例，对所述商品推荐方法进行进一步说明。其中，图8示出了本申请一实施例提供的一种应用于商品推荐的推荐方法的处理流程图，具体包括以下步骤802-862。

步骤802：获取训练样本集，训练样本集包括多个训练样本，训练样本包括用户和商品组成的样本对。

步骤804：将在等待周期内发生转化的训练样本确定为第一正样本、未发生转化的训练样本确定为第一未知样本。

步骤806：根据第一正样本和第一未知样本，构建等待周期对应的第一异质图。

步骤808：将各训练样本和第一异质图输入至推荐模型的特征提取层。

步骤810：根据第一异质图进行特征提取处理，获得各训练样本对应的第一初始用户节点特征与第一初始商品节点特征。

步骤812：将第一异质图、各训练样本对应的第一初始用户节点特征与第一初始商品节点特征输入至推荐模型的信息传递层，基于第一异质图，将第一用户节点特征与第一商品节点特征进行信息传递，得到第一目标用户节点特征与第一目标商品节点特征。

步骤814：计算各训练样本对应的第一目标用户节点特征与第一目标商品节点特征的第一相似度。

步骤816：根据第一相似度与预设排列规则，确定第一预测结果。

步骤818：利用交叉熵损失函数，基于第一预测结果和各训练样本的标签信息，计算第一损失值。

步骤820：基于第一损失值调整推荐模型的参数。

步骤822：将在延时周期内发生转化的第一未知样本确定为第二正样本、未发生转化的第一未知样本确定为第二未知样本。

步骤824：根据第一正样本、第二正样本和第二未知样本，更新第一异质图，得到延时周期对应的第二异质图。

步骤826：将各训练样本和第二异质图输入至推荐模型的特征提取层。

步骤828：根据第二异质图进行特征提取处理，获得各训练样本对应的第二初始用户节点特征与第二初始商品节点特征。

步骤830：将第二异质图、各训练样本对应的第二初始用户节点特征与第二初始商品节点特征输入至推荐模型的信息传递层，基于第二异质图，将第二用户节点特征与第二商品节点特征进行信息传递，得到第二目标用户节点特征与第二目标商品节点特征。

步骤832：计算各训练样本对应的第二目标用户节点特征与第二目标商品节点特征的第二相似度。

步骤834：根据第二相似度与预设排列规则，确定第二预测结果。

步骤836：利用交叉熵损失函数，基于第二预测结果和各训练样本的标签信息，计算第二损失值。

步骤838：基于第二损失值调整推荐模型的参数。

步骤840：将在延时周期内未转化的第二未知样本，确定为负样本。

步骤842：根据第一正样本、第二正样本和负样本，更新第二异质图，得到超时周期对应的第三异质图。

步骤844：将各训练样本和第三异质图输入至推荐模型的特征提取层。

步骤846：根据第三异质图进行特征提取处理，获得各训练样本对应的第三初始用户节点特征与第三初始商品节点特征。

步骤848：将第三异质图、各训练样本对应的第三初始用户节点特征与第三初始商品节点特征输入至推荐模型的信息传递层，基于第三异质图，将第三用户节点特征与第三商品节点特征进行信息传递，得到第三目标用户节点特征与第三目标商品节点特征。

步骤850：计算各训练样本对应的第三目标用户节点特征与第三目标商品节点特征的第三相似度。

步骤852：根据第三相似度与预设排列规则，确定第三预测结果。

步骤854：利用交叉熵损失函数，基于第三预测结果和各训练样本的标签信息，计算第三损失值。

步骤856：基于第三损失值调整推荐模型的参数，得到训练好的推荐模型。

步骤858：获取待推荐用户和商品集合，商品集合中包括至少一个商品；

步骤860：将待推荐用户和商品集合输入训练好的推荐模型，得到各商品的推荐值；

步骤862：将各推荐值从大到小排列，将排列前K个的推荐值对应的物品推荐给待推荐用户，K为正整数。

本申请提供的推荐方法，获取训练样本集，所述训练样本集包括多个训练样本，所述训练样本包括用户和物品组成的样本对；根据训练样本在各预设周期内的转化结果，确定所述各预设周期内训练样本的样本类型，所述预设周期包括等待周期、延时周期和超时周期，所述样本类型包括正样本、负样本和未知样本；针对所述各预设周期，根据该预设周期内训练样本的样本类型，确定异质图，所述异质图表征所述训练样本中用户与物品之间的关系；根据所述异质图，确定该预设周期内各训练样本对应的用户节点特征和物品节点特征，并将所述用户节点特征和所述物品节点特征进行信息传递；根据信息传递结果和各训练样本的标签信息，计算损失值，并基于所述损失值调整所述推荐模型的参数。本申请一实施例实现了通过设置等待周期、延时周期和超时周期，使训练样本能用足够长的时间进行转化，避免了将用户延迟反馈的正样本错误标记为负样本，从而避免了错误训练推荐模型，提高了推荐模型的鲁棒性和可信度。应用广泛，能够解决推荐系统中存在的延迟问题。进而可以提高基于推荐模型进行推荐的准确度，一定程度上提高用户粘度，从而提高推荐模型对应的推荐平台的收益。

与上述方法实施例相对应，本申请还提供了推荐模型训练装置实施例，图9示出了本申请一实施例提供的一种推荐模型训练装置的结构示意图。如图9所示，该装置包括：第一获取模块902、第一确定模块904、第二确定模块906、第三确定模块908和调整模块910。

第一获取模块902，被配置为获取训练样本集，所述训练样本集包括多个训练样本，所述训练样本包括用户和物品组成的样本对。

第一确定模块904，被配置为根据训练样本在各预设周期内的转化结果，确定所述各预设周期内训练样本的样本类型，所述预设周期包括等待周期、延时周期和超时周期，所述样本类型包括正样本、负样本和未知样本。

第二确定模块906，被配置为针对所述各预设周期，根据该预设周期内训练样本的样本类型，确定异质图，所述异质图表征所述训练样本中用户与物品之间的关系。

第三确定模块908，被配置为根据所述异质图，确定该预设周期内各训练样本对应的用户节点特征和物品节点特征，并将所述用户节点特征和所述物品节点特征进行信息传递。

调整模块910，被配置为根据信息传递结果和各训练样本的标签信息，计算损失值，并基于所述损失值调整所述推荐模型的参数。

可选地，所述第一确定模块904，被配置为：将在所述等待周期内发生转化的训练样本确定为第一正样本、未发生转化的训练样本确定为第一未知样本。

可选地，所述第二确定模块906，被配置为：根据所述第一正样本和所述第一未知样本，构建所述等待周期对应的第一异质图。

可选地，所述第一确定模块904，被配置为：将在所述延时周期内发生转化的第一未知样本确定为第二正样本、未发生转化的第一未知样本确定为第二未知样本，所述第一未知样本为在所述等待周期内未发生转化的训练样本。

可选地，所述第二确定模块906，被配置为：根据第一正样本、所述第二正样本和所述第二未知样本，更新第一异质图，得到所述延时周期对应的第二异质图，所述第一正样本为在所述等待周期内发生转化的训练样本，所述第一异质图为所述等待周期对应的异质图。

可选地，所述等待周期和所述延时周期构成归因周期；所述第一确定模块904，被配置为：将在所述归因周期内未转化的训练样本，确定为负样本。

可选地，所述第二确定模块906，被配置为：根据第三正样本和所述负样本，更新第二异质图，得到所述超时周期对应的第三异质图，所述第三正样本为在所述归因周期内发生转化的训练样本，所述第二异质图为所述延时周期对应的异质图。

可选地，所述第三确定模块908，被配置为：将各训练样本和所述异质图输入至所述推荐模型的特征提取层，根据所述异质图进行特征提取处理，获得各训练样本对应的初始用户节点特征与初始物品节点特征；将所述异质图、各训练样本对应的所述初始用户节点特征与所述初始物品节点特征输入至所述推荐模型的信息传递层，基于所述异质图，将各训练样本对应的所述用户节点特征与物品节点特征进行信息传递，得到各训练样本对应的目标用户节点特征与目标物品节点特征。

可选地，所述调整模块910，被配置为：根据各训练样本对应的所述目标用户节点特征与所述目标物品节点特征，确定所述推荐模型的预测结果；根据所述预测结果和各训练样本的标签信息，计算损失值。

可选地，所述调整模块910，被配置为：计算各训练样本对应的所述目标用户节点特征与所述目标物品节点特征的相似度；根据所述相似度与预设排列规则，确定预测结果。

可选地，所述调整模块910，被配置为：利用交叉熵损失函数，基于所述预测结果和各训练样本的标签信息，计算损失值。

本申请提供的推荐模型训练装置，获取训练样本集，所述训练样本集包括多个训练样本，所述训练样本包括用户和物品组成的样本对；根据训练样本在各预设周期内的转化结果，确定所述各预设周期内训练样本的样本类型，所述预设周期包括等待周期、延时周期和超时周期，所述样本类型包括正样本、负样本和未知样本；针对所述各预设周期，根据该预设周期内训练样本的样本类型，确定异质图，所述异质图表征所述训练样本中用户与物品之间的关系；根据所述异质图，确定该预设周期内各训练样本对应的用户节点特征和物品节点特征，并将所述用户节点特征和所述物品节点特征进行信息传递；根据信息传递结果和各训练样本的标签信息，计算损失值，并基于所述损失值调整所述推荐模型的参数。本申请一实施例实现了通过设置等待周期、延时周期和超时周期，使训练样本能用足够长的时间进行转化，避免了将用户延迟反馈的正样本错误标记为负样本，从而避免了错误训练推荐模型，提高了推荐模型的鲁棒性和可信度。应用广泛，能够解决推荐系统中存在的延迟问题。进而可以提高基于推荐模型进行推荐的准确度，一定程度上提高用户粘度，从而提高推荐模型对应的推荐平台的收益。

上述为本实施例的一种推荐模型训练装置的示意性方案。需要说明的是，该推荐模型训练装置的技术方案与上述的推荐模型训练方法的技术方案属于同一构思，推荐模型训练装置的技术方案未详细描述的细节内容，均可以参见上述推荐模型训练方法的技术方案的描述。

与上述方法实施例相对应，本申请还提供了推荐装置实施例，图10示出了本申请一实施例提供的一种推荐装置的结构示意图。如图10所示，该装置包括：第二获取模块1002、输入模块1004和推荐模块1006。

第二获取模块1002，被配置为待推荐用户和物品集合，所述物品集合中包括至少一个物品。

输入模块1004，被配置为将所述待推荐用户和物品集合输入训练好的推荐模型，得到各物品的推荐值，所述推荐模型为通过上述推荐模型训练方法得到的。

推荐模块1006，被配置为将各推荐值从大到小排列，将排列前K个的推荐值对应的物品推荐给所述待推荐用户，K为正整数。

本申请提供的推荐装置，获取待推荐用户和物品集合，所述物品集合中包括至少一个物品；将所述待推荐用户和物品集合输入训练好的推荐模型，得到各物品的推荐值，所述推荐模型为通过上述推荐模型训练方法得到的；将所述推荐值大于预设推荐值的物品推荐给所述待推荐用户。本申请一实施例实现了通过设置等待周期、延时周期和超时周期，使训练样本能用足够长的时间进行转化，避免了将用户延迟反馈的正样本错误标记为负样本，从而避免了错误训练推荐模型，提高了推荐模型的鲁棒性和可信度。应用广泛，能够解决推荐系统中存在的延迟问题。进而可以提高基于推荐模型进行推荐的准确度，一定程度上提高用户粘度，从而提高推荐模型对应的推荐平台的收益。

上述为本实施例的一种推荐装置的示意性方案。需要说明的是，该推荐装置的技术方案与上述的推荐方法的技术方案属于同一构思，推荐装置的技术方案未详细描述的细节内容，均可以参见上述推荐方法的技术方案的描述。

图11示出了根据本申请一实施例提供的一种计算设备的结构框图。该计算设备1100的部件包括但不限于存储器1110和处理器1120。处理器1120与存储器1110通过总线1130相连接，数据库1150用于保存数据。

计算设备1100还包括接入设备1140，接入设备1140使得计算设备1100能够经由一个或多个网络1160通信。这些网络的示例包括公用交换电话网（PSTN，Public SwitchedTelephone Network）、局域网（LAN，Local Area Network）、广域网（WAN，Wide AreaNetwork）、个域网（PAN，Personal Area Network）或诸如因特网的通信网络的组合。接入设备1140可以包括有线或无线的任何类型的网络接口（例如，网络接口卡（NIC，NetworkInterface Controller））中的一个或多个，诸如IEEE802.11无线局域网（WLAN，WirelessLocal Area Network）无线接口、全球微波互联接入（Wi-MAX，WorldwideInteroperability for Microwave Access）接口、以太网接口、通用串行总线（USB，Universal Serial Bus）接口、蜂窝网络接口、蓝牙接口、近场通信（NFC，Near FieldCommunication）接口，等等。

在本申请的一个实施例中，计算设备1100的上述部件以及图11中未示出的其他部件也可以彼此相连接，例如通过总线。应当理解，图11所示的计算设备结构框图仅仅是出于示例的目的，而不是对本申请范围的限制。本领域技术人员可以根据需要，增添或替换其他部件。

计算设备1100可以是任何类型的静止或移动计算设备，包括移动计算机或移动计算设备（例如，平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等）、移动电话（例如，智能手机）、可佩戴的计算设备（例如，智能手表、智能眼镜等）或其他类型的移动设备，或者诸如台式计算机或PC的静止计算设备。计算设备1100还可以是移动式或静止式的服务器。

其中，处理器1120执行所述计算机指令时实现所述的推荐模型训练方法或推荐方法的步骤。

上述为本实施例的一种计算设备的示意性方案。需要说明的是，该计算设备的技术方案与上述的推荐模型训练方法或推荐方法的技术方案属于同一构思，计算设备的技术方案未详细描述的细节内容，均可以参见上述推荐模型训练方法或推荐方法的技术方案的描述。

本申请一实施例还提供一种计算机可读存储介质，其存储有计算机指令，该计算机指令被处理器执行时实现如前所述推荐模型训练方法或推荐方法的步骤。

上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是，该存储介质的技术方案与上述的推荐模型训练方法或推荐方法的技术方案属于同一构思，存储介质的技术方案未详细描述的细节内容，均可以参见上述推荐模型训练方法或推荐方法的技术方案的描述。

上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

所述计算机指令包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、电载波信号、电信信号以及软件分发介质等。

需要说明的是，对于前述的各方法实施例，为了简便描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其它顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定都是本申请所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其它实施例的相关描述。

以上公开的本申请优选实施例只是用于帮助阐述本申请。可选实施例并没有详尽叙述所有的细节，也不限制该发明仅为所述的具体实施方式。显然，根据本申请的内容，可作很多的修改和变化。本申请选取并具体描述这些实施例，是为了更好地解释本申请的原理和实际应用，从而使所属技术领域技术人员能很好地理解和利用本申请。本申请仅受权利要求书及其全部范围和等效物的限制。

Claims

1.一种推荐模型训练方法，其特征在于，包括：

获取训练样本集，其中，所述训练样本集包括多个训练样本，所述训练样本包括用户和物品组成的样本对；

根据训练样本在各预设周期内的转化结果，确定所述各预设周期内训练样本的样本类型，其中，所述预设周期包括等待周期、延时周期和超时周期，所述样本类型包括正样本、负样本和未知样本；

针对所述各预设周期，根据该预设周期内训练样本的样本类型，确定异质图，其中，所述异质图表征所述训练样本中用户与物品之间的关系；

根据所述异质图，确定该预设周期内各训练样本对应的用户节点特征和物品节点特征，并将所述用户节点特征和所述物品节点特征进行信息传递；

根据信息传递结果和各训练样本的标签信息，计算损失值，并基于所述损失值调整所述推荐模型的参数。

2.根据权利要求1所述的方法，其特征在于，根据训练样本在各预设周期内的转化结果，确定所述各预设周期内训练样本的样本类型，包括：

将在所述等待周期内发生转化的训练样本确定为第一正样本、未发生转化的训练样本确定为第一未知样本。

3.根据权利要求2所述的方法，其特征在于，针对所述各预设周期，根据该预设周期内训练样本的样本类型，确定异质图，包括：

根据所述第一正样本和所述第一未知样本，构建所述等待周期对应的第一异质图。

4.根据权利要求1所述的方法，其特征在于，根据训练样本在各预设周期内的转化结果，确定所述各预设周期内训练样本的样本类型，包括：

将在所述延时周期内发生转化的第一未知样本确定为第二正样本、未发生转化的第一未知样本确定为第二未知样本，其中，所述第一未知样本为在所述等待周期内未发生转化的训练样本。

5.根据权利要求4所述的方法，其特征在于，针对所述各预设周期，根据该预设周期内训练样本的样本类型，确定异质图，包括：

根据第一正样本、所述第二正样本和所述第二未知样本，更新第一异质图，得到所述延时周期对应的第二异质图，其中，所述第一正样本为在所述等待周期内发生转化的训练样本，所述第一异质图为所述等待周期对应的异质图。

6.根据权利要求1所述的方法，其特征在于，所述等待周期和所述延时周期构成归因周期；

根据训练样本在各预设周期内的转化结果，确定所述各预设周期内训练样本的样本类型，包括：

将在所述归因周期内未转化的训练样本，确定为负样本。

7.根据权利要求6所述的方法，其特征在于，针对所述各预设周期，根据该预设周期内训练样本的样本类型，确定异质图，包括：

根据第三正样本和所述负样本，更新第二异质图，得到所述超时周期对应的第三异质图，其中，所述第三正样本为在所述归因周期内发生转化的训练样本，所述第二异质图为所述延时周期对应的异质图。

8.根据权利要求1所述的方法，其特征在于，根据所述异质图，确定该预设周期内各训练样本对应的用户节点特征和物品节点特征，并将所述用户节点特征和所述物品节点特征进行信息传递，包括：

将各训练样本和所述异质图输入至所述推荐模型的特征提取层，根据所述异质图进行特征提取处理，获得各训练样本对应的初始用户节点特征与初始物品节点特征；

将所述异质图、各训练样本对应的所述初始用户节点特征与所述初始物品节点特征输入至所述推荐模型的信息传递层，基于所述异质图，将各训练样本对应的所述用户节点特征与物品节点特征进行信息传递，得到各训练样本对应的目标用户节点特征与目标物品节点特征。

9.根据权利要求8所述的方法，其特征在于，根据信息传递结果和各训练样本的标签信息，计算损失值，包括：

根据各训练样本对应的所述目标用户节点特征与所述目标物品节点特征，确定所述推荐模型的预测结果；

根据所述预测结果和各训练样本的标签信息，计算损失值。

10.根据权利要求9所述的方法，其特征在于，根据各训练样本对应的所述目标用户节点特征与所述目标物品节点特征，确定所述推荐模型的预测结果，包括：

计算各训练样本对应的所述目标用户节点特征与所述目标物品节点特征的相似度；

根据所述相似度与预设排列规则，确定预测结果。

11.根据权利要求9或10所述的方法，其特征在于，根据所述预测结果和各训练样本的标签信息，计算损失值，包括：

利用交叉熵损失函数，基于所述预测结果和各训练样本的标签信息，计算损失值。

12.一种推荐方法，其特征在于，包括：

获取待推荐用户和物品集合，其中，所述物品集合中包括至少一个物品；

将所述待推荐用户和物品集合输入训练好的推荐模型，得到各物品的推荐值，其中，所述推荐模型通过如权利要求1-11中任意一项所述推荐模型训练方法得到；

将各推荐值从大到小排列，将排列前K个的推荐值对应的物品推荐给所述待推荐用户，其中，K为正整数。

13.一种推荐模型训练装置，其特征在于，包括：

第一获取模块，被配置为获取训练样本集，其中，所述训练样本集包括多个训练样本，所述训练样本包括用户和物品组成的样本对；

第一确定模块，被配置为根据训练样本在各预设周期内的转化结果，确定所述各预设周期内训练样本的样本类型，其中，所述预设周期包括等待周期、延时周期和超时周期，所述样本类型包括正样本、负样本和未知样本；

第二确定模块，被配置为针对所述各预设周期，根据该预设周期内训练样本的样本类型，确定异质图，其中，所述异质图表征所述训练样本中用户与物品之间的关系；

第三确定模块，被配置为根据所述异质图，确定该预设周期内各训练样本对应的用户节点特征和物品节点特征，并将所述用户节点特征和所述物品节点特征进行信息传递；

调整模块，被配置为根据信息传递结果和各训练样本的标签信息，计算损失值，并基于所述损失值调整所述推荐模型的参数。

14.一种推荐装置，其特征在于，包括：

第二获取模块，被配置为待推荐用户和物品集合，其中，所述物品集合中包括至少一个物品；

输入模块，被配置为将所述待推荐用户和物品集合输入训练好的推荐模型，得到各物品的推荐值，所述推荐模型通过如权利要求1-11中任意一项所述推荐模型训练方法得到；

推荐模块，被配置为将各推荐值从大到小排列，将排列前K个的推荐值对应的物品推荐给所述待推荐用户，其中，K为正整数。

15.一种计算设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令，其特征在于，所述处理器执行所述计算机指令时实现权利要求1-11或12任意一项所述的方法。

16.一种计算机可读存储介质，其存储有计算机指令，其特征在于，该计算机指令被处理器执行时实现权利要求1-11或12任意一项所述的方法。