CN117454956A

CN117454956A - 项目推荐模型的训练方法、项目推荐方法及相关设备

Info

Publication number: CN117454956A
Application number: CN202311615617.XA
Authority: CN
Inventors: 王国瑞
Original assignee: Tencent Music Entertainment Technology Shenzhen Co Ltd
Current assignee: Tencent Music Entertainment Technology Shenzhen Co Ltd
Priority date: 2023-11-28
Filing date: 2023-11-28
Publication date: 2024-01-26

Abstract

本申请涉及一种项目推荐模型的训练方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括：获取至少一个训练批次的训练样本数据集；所述训练样本数据集包括针对多个推荐场景下多个不同推荐目标的训练样本数据；对于所述训练样本数据集中的任一样本特征对，将所述任一样本特征对输入至待训练的项目推荐模型中的目标专家网络；根据所述公共专家网络、所述场景独有专家网络和所述目标独有专家网络针对所述任一样本特征对的输出结果，确定所述任一样本特征对的推荐预测信息；根据所述任一样本特征对的推荐预测信息，对所述待训练的项目推荐模型进行训练。采用本方法能够训练得到准确的项目推荐模型，以准确地对用户进行项目推荐。

Description

项目推荐模型的训练方法、项目推荐方法及相关设备

技术领域

本申请涉及人工智能技术领域，特别是涉及一种项目推荐模型的训练方法、项目推荐方法、装置、计算机设备、存储介质和计算机程序产品。

背景技术

随着互联网技术的发展，出现了越来越多视频直播软件。

目前，用户在视频直播软件观看直播时，常常会对正在直播的主播账号进行关注、评论或互动。然而，由于视频直播软件包括较多直播场景，平台常常无法精准地对选择不同场景的用户进行精准地项目推送，使得用户减少了在平台上的互动，并容易造成视频直播软件平台的用户流失。

因此，传统技术中存在对用户的项目推荐不够准确的问题。

发明内容

基于此，有必要针对上述技术问题，提供一种能够向用户进行准确的项目推荐的项目推荐模型的训练方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

一种项目推荐模型的训练方法，包括：

获取训练样本数据集；训练样本数据集包括针对多个推荐场景的训练样本数据；训练样本数据包括待推荐项目和样本用户之间的样本特征对；

使用训练样本数据集中的任一样本特征对执行下述训练过程，以训练项目推荐模型：

将任一样本特征对输入至项目推荐模型中的目标专家网络；目标专家网络包括公共专家网络，以及，与任一样本特征对匹配的场景独有专家网络和目标独有专家网络；由公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对输出结果；

根据公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对的输出结果，确定任一样本特征对的推荐预测信息；

根据任一样本特征对的推荐预测信息，对项目推荐模型进行训练。

在其中一个实施例中，每个推荐场景的训练样本数据包括多个不同推荐目标的训练样本数据，将任一样本特征对输入至项目推荐模型中的目标专家网络，包括：

确定任一样本特征对中的推荐场景标识和推荐目标标识；

根据推荐场景标识和推荐目标标识，确定项目推荐模型中的目标专家网络；目标专家网络包括公共专家网络、与推荐场景标识匹配的场景独有专家网络、与推荐场景标识和推荐目标标识匹配的目标独有专家网络；

将任一样本特征对输入至目标专家网络。

在其中一个实施例中，根据公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对的输出结果，确定任一样本特征对的推荐预测信息，包括：

将任一样本特征对输入至项目推荐模型中的目标门控网络，得到门控网络输出结果；目标门控网络为与样本特征对关联的推荐场景匹配的门控网络；

基于门控网络输出结果，对公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对的输出结果进行加权融合，得到任一样本特征对的推荐预测信息。

在其中一个实施例中，将任一样本特征对输入至项目推荐模型中的目标门控网络，得到门控网络输出结果，包括：

将任一样本特征对输入至项目推荐模型中的目标门控网络，得到公共专家网络、场景独有专家网络和目标独有专家网络分别针对任一样本特征对各自的门控值；

将公共专家网络、场景独有专家网络和目标独有专家网络分别针对任一样本特征对各自的门控值作为门控网络输出结果。

在其中一个实施例中，基于门控网络输出结果，对公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对的输出结果进行加权融合，得到任一样本特征对的推荐预测信息，包括：

按照门控网络输出结果，对公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对的输出结果进行加权融合，得到加权融合结果；

将加权融合结果输入至项目推荐模型中的目标多层感知器，得到目标多层感知器输出结果；

根据目标多层感知器输出结果，确定任一样本特征对的推荐预测信息。

在其中一个实施例中，根据目标多层感知器输出结果，确定任一样本特征对的推荐预测信息，包括：

将任一样本特征对输入至项目推荐模型中的场景记忆网络，得到场景记忆权重信息；

按照场景记忆权重信息对目标多层感知器输出结果进行加权融合，得到任一样本特征对的推荐预测信息。

一种项目推荐方法，包括：

响应于目标用户针对目标推荐场景触发的推荐事件，获取至少一个待推荐项目与目标用户间的特征对；

将各特征对输入至预训练的项目推荐模型，得到目标用户间针对各待推荐项目的推荐预测信息；

根据各待推荐项目的推荐预测信息，在目标推荐场景下为目标用户针对目标推荐场景进行项目推荐；

其中，预训练的项目推荐模型为根据至少一个训练批次的训练样本数据集中的各样本特征对的推荐预测信息，对待训练的项目推荐模型进行训练得到的；训练样本数据集包括针对多个推荐场景下多个不同推荐目标的样本特征对；训练样本数据集中的任一样本特征对的推荐预测信息为根据待训练的项目推荐模型中的目标专家网络针对任一样本特征对的输出结果确定得到的；目标专家网络包括公共专家网络，以及，与任一样本特征对匹配的场景独有专家网络和目标独有专家网络。

一种计算机设备，包括存储器和处理器，存储器存储有计算机程序，处理器执行计算机程序时实现上述的方法的步骤。

一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述的方法的步骤。

一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现上述的方法的步骤。

上述项目推荐模型的训练方法、装置、计算机设备、存储介质和计算机程序产品，通过获取训练样本数据集；训练样本数据集包括针对多个推荐场景的训练样本数据；训练样本数据包括待推荐项目和样本用户之间的样本特征对；使用训练样本数据集中的任一样本特征对执行下述训练过程，以训练项目推荐模型：将任一样本特征对输入至项目推荐模型中的目标专家网络；目标专家网络包括公共专家网络，以及，与任一样本特征对匹配的场景独有专家网络和目标独有专家网络；由公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对输出结果；目标独有专家网络为与任一样本特征对关联的推荐目标相匹配的专家网络；根据公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对的输出结果，确定任一样本特征对的推荐预测信息；根据任一样本特征对的推荐预测信息，对项目推荐模型进行训练；如此，能够同时对各个类型的专家网络进行训练，从而高效地训练出一个可用于在不同推荐场景下对用户进行项目推荐的项目推荐模型，从而能够精确地对用户进行项目推荐。

附图说明

图1为一个实施例中一种项目推荐模型的训练方法的应用环境图；

图2为一个实施例中一种项目推荐模型的训练方法的流程示意图；

图3为一个实施例中一种样本特征对的生成方法；

图4为一个实施例中一种项目推荐模型的模型结果示意图；

图5为另一个实施例中一种项目推荐模型的训练方法的流程示意图；

图6为一个实施例中一种项目推荐方法的流程示意图；

图7为一个实施例中一种项目推荐模型的训练装置的结构框图；

图8为一个实施例中一种项目推荐装置的结构框图；

图9为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是本公开的一些方面相一致的装置和方法的例子。

本申请实施例提供的项目推荐模型的训练方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上，也可以放在云上或其他网络服务器上。服务器104获取训练样本数据集；训练样本数据集包括针对多个推荐场景下的训练样本数据；训练样本数据包括待推荐项目和样本用户之间的样本特征对；服务器104使用训练样本数据集中的任一样本特征对执行下述训练过程，以训练项目推荐模型：将任一样本特征对输入至项目推荐模型中的目标专家网络；目标专家网络包括公共专家网络，以及，与任一样本特征对匹配的场景独有专家网络和目标独有专家网络；由公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对输出结果；服务器104根据公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对的输出结果，确定任一样本特征对的推荐预测信息；服务器104根据任一样本特征对的推荐预测信息，对项目推荐模型进行训练。其中，终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备，物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中，如图2所示，提供了一种项目推荐模型的训练方法，以该方法应用于图1中的服务器104为例进行说明，包括以下步骤：

步骤S210，获取训练样本数据集；训练样本数据集包括针对多个推荐场景的训练样本数据；训练样本数据包括待推荐项目和样本用户之间的样本特征对。

其中，推荐场景可以是音乐APP中的直播场景、关注场景、同城场景。

其中，待推荐项目可以是指待向用户推荐的推荐项目(item)。

其中，推荐项目(item)可以是向用户实施的推荐操作所推荐的对象。例如，推荐项目(item)可以是音乐APP中的主播账号、音乐视频、推文等。

实际应用中，不同的推荐场景对应不同的待推荐项目。例如，在直播场景下，待推荐项目为正在直播的主播账号，在关注场景下，待推荐项目为用户账户所关注的主播账号，在同城场景下，待推荐项目为与用户账户所在城市相同的主播账号。在音乐APP的直播场景下，待推荐项目可以是正在音乐APP进行音乐直播的任一主播账号。

其中，样本特征对可以是由用户账号、用户账号当前所处场景、该场景下每个待推荐项目三项信息组成的特征对。例如，样本特征对可以是由用户账号、用户账号当前所处场景、该场景下每个主播账号三项信息组成的特征对。

其中，样本用户可以是训练样本数据集中任一训练样本对应的用户。

其中，训练样本数据集可以包括多个推荐场景对应的训练样本数据，例如，训练样本数据集中包括直播场景、关注场景、同城场景对应的训练样本数据。采用包括多个推荐场景对应的训练样本数据能够训练得到用于预测不同推荐场景下的推荐预测信息的模型。

具体实现中，服务器获取训练样本数据集。

实际应用中，一个训练批次的训练样本数据集中包括多个推荐场景对应的训练样本数据，同一个推荐场景对应的训练样本数据中包括多个推荐目标对应的训练样本数据，同一个推荐场景对应的训练样本数据可以训练得到用于预测不同推荐目标推荐值的模型。例如，一个训练批次的训练样本数据集中包括直播场景、关注场景、同城场景对应的训练样本数据，而直播场景对应的训练样本数据中包括点击目标、观看目标、付费目标、互动目标对应的训练样本数据。当采用直播场景对应的点击目标训练样本数据时，可以训练得到用于预测用户在直播场景下对各直播账号的点击预测值的推荐预测模型，而采用关注场景对应的观看目标训练样本数据时，可以训练得到用于预测用户在关注场景下观看各直播账号的观看预测值的推荐预测模型。

步骤S220，使用训练样本数据集中的任一样本特征对执行下述训练过程，以训练项目推荐模型：

步骤S222，将任一样本特征对输入至项目推荐模型中的目标专家网络；目标专家网络包括公共专家网络，以及，与任一样本特征对匹配的场景独有专家网络和目标独有专家网络；由所述公共专家网络、所述场景独有专家网络和所述目标独有专家网络针对所述任一样本特征对输出结果。

其中，项目推荐模型可以是用于确定用户最有可能感兴趣的项目的模型，根据该模型输出的推荐预测信息，可以对用户进行项目推荐。

例如，项目推荐模型可以是直播账号推荐模型，该模型用于确定用户对某一直播账号进行点击的概率的模型，服务器可以根据该模型输出的用户对各直播账号进行点击的概率预测信息，确定用户最有可能感兴趣的主播账号，从而将用户最有可能感兴趣的主播账号推送给用户。

其中，推荐预测信息可以是指待推荐项目对应的推荐值。

例如，推荐预测信息可以是某一主播账号对应的推荐值，根据不同主播账号对应的推荐值，可以确定用户最感兴趣的主播账号。实际应用中，推荐值可以是表征用户对某一主播账号进行关注的概率大小，当该主播账号对应的推荐值较大时，说明用户对该主播账号进行关注的概率较大，可以优先向用户推送该主播账号。

其中，目标专家网络可以是公共专家网络、场景独有专家网络和目标独有专家网络组合得到的神经网络。

其中，公共专家网络可以是适用于各个推荐场景下确定各个待推荐项目对应的推荐预测信息的神经网络。例如，公共专家网络可以是用于确定关注场景、直播场景下用户针对各个待推荐直播账号进行点击、互动、观看或付费的概率(对应于推荐预测信息)的神经网络。

其中，场景独有专家网络可以是用于在特定推荐场景下确定各个待推荐项目的推荐预测信息的预测网络。例如，场景独有专家网络可以是用于在关注场景下确定用户针对各个待推荐主播账号进行交互的概率的神经网络，但该网络只能适用于关注场景，无法适用于直播场景。

其中，目标独有专家网络可以是用于在特定推荐场景下确定各个待推荐项目的特定推荐目标的推荐预测信息的预测网络。例如，目标独有专家网络可以是用于在关注场景下确定用户针对各个待推荐主播账号进行点击这一目标的概率的神经网络，其无法用于在关注场景下确定用户针对各个待推荐主播账号进行互动、观看或付费的概率，也无法用于在其他推荐场景(如直播场景)针对各个待推荐主播账号进行各个目标(如点击、互动、观看或付费)的概率确定。

其中，特定推荐目标可以是任一推荐目标。

其中，推荐目标可以是指向用户实施的推荐操作所期望达成的目的。实际应用中，推荐目标可以是指在向用户推荐完推荐项目后，该用户与该推荐项目产生交互的目标。其中，交互可以是点击、观看、付费、互动、分享等。

举例来说，推荐目标可以是点击目标、观看目标、付费目标、互动目标。实际应用中，不同推荐场景可以分别关联多个不同的推荐目标。例如，在关注场景下，推荐目标可以为点击、观看、付费、互动等目标，在直播场景下，推荐目标可以为有效点击、关注、付费、互动等目标。其中，互动可以是根据用户账号的送花记录、评论记录和分享记录的汇总信息确定的。

具体实现中，服务器将任一样本特征对输入至项目推荐模型中的公共专家网络，以及，服务器将任一样本特征对输入至与该样本特征对匹配的场景独有专家网络和目标独有专家网络，由公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对输出结果。

步骤S224，根据公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对的输出结果，确定任一样本特征对的推荐预测信息。

其中，输出结果可以是各个类型的专家网络输出的数值、向量等。

其中，推荐预测信息可以是待推荐项目对应的推荐值，实际应用中，可以根据各个待推荐项目对应的推荐值，对用户账号推送相应的项目。

具体实现中，服务器根据公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对的输出结果，确定任一样本特征对对应的推荐预测信息。

步骤S226，根据任一样本特征对的推荐预测信息，对项目推荐模型进行训练。

具体实现中，服务器根据任一样本特征对的推荐预测信息，对项目推荐模型的模型参数进行调整，以对项目推荐模型进行新一轮训练。

实际应用中，可以将同一个训练批次的训练样本数据集进行分类，并分别输入至待训练的项目推荐模型中各类专家网络，从而能够利用同一个训练批次的训练样本同时训练各个类型的专家网络，以得到适用于在不同推荐场景下针对不同的推荐目标对用户进行项目推荐的项目推荐模型。

上述项目推荐模型的训练方法中，通过获取训练样本数据集；训练样本数据集包括针对多个推荐场景的训练样本数据；训练样本数据包括待推荐项目和样本用户之间的样本特征对；使用训练样本数据集中的任一样本特征对执行下述训练过程，以训练项目推荐模型：将任一样本特征对输入至项目推荐模型中的目标专家网络；目标专家网络包括公共专家网络，以及，与任一样本特征对匹配的场景独有专家网络和目标独有专家网络；由公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对输出结果；根据公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对的输出结果，确定任一样本特征对的推荐预测信息；根据任一样本特征对的推荐预测信息，对项目推荐模型进行训练；如此，能够同时对各个类型的专家网络进行训练，从而高效地训练出一个可用于在不同推荐场景下对用户进行项目推荐的项目推荐模型，从而能够精确地对用户进行项目推荐。

在另一个实施例中，每个推荐场景的训练样本数据包括多个不同推荐目标的训练样本数据，将任一样本特征对输入至项目推荐模型中的目标专家网络，包括：确定任一样本特征对中的推荐场景标识和推荐目标标识；根据推荐场景标识和推荐目标标识，确定项目推荐模型中的目标专家网络；目标专家网络包括公共专家网络、与推荐场景标识匹配的场景独有专家网络、与推荐场景标识和推荐目标标识匹配的目标独有专家网络；将任一样本特征对输入至目标专家网络。

其中，推荐场景标识可以是样本特征对中携带的场景标识，实际应用中，服务器可以根据样本特征对中的特征数据，确定推荐场景标识，从而确定该样本特征对是属于哪个推荐场景下的样本特征对。

其中，推荐目标标识可以是样本特征对中携带的目标标识，实际应用中，目标标识可以是点击标识、观看标识、付费标识、互动标识。

具体实现中，服务器确定任一样本特征对中的推荐场景标识和推荐目标标识，从而确定该样本特征对对应的推荐场景和推荐目标，服务器根据推荐场景和推荐目标，在项目推荐模型中确定该样本特征对所需输入的各个网络，包括公共专家网络、与该推荐场景匹配的场景独有专家网络、与推荐场景和推荐目标匹配的目标独有专家网络，服务器将任一样本特征对输入至与该推荐场景匹配的场景独有专家网络、与推荐场景和推荐目标匹配的目标独有专家网络和公共专家网络。

实际应用中，服务器可以根据样本特征对中的特征数据(例如，推荐场景标识和推荐目标标识)，确定该样本特征对是属于哪个推荐场景、哪个推荐目标的样本特征对，从而确定该样本特征对是作为项目推荐模型中的哪些网络的训练样本数据。例如，服务器根据样本特征对中的特征数据(例如，推荐场景标识)，确定该样本特征对是属于关注场景下的样本特征对，从而确定该样本特征对应当输入至项目推荐模型中的关注场景独有专家网络，同时，服务器根据样本特征对中的特征数据(例如，推荐目标标识)，确定该样本特征对是属于关注场景下的点击目标的样本特征对，从而确定该样本特征对应当同时输入至项目推荐模型中的关注场景下点击目标独有专家网络，同时，服务器将该样本特征对输入至所有样本特征对都应当输入的公共专家网络。

本实施例的技术方案，通过确定任一样本特征对中的推荐场景标识和推荐目标标识；根据推荐场景标识和推荐目标标识，确定项目推荐模型中的目标专家网络；目标专家网络包括公共专家网络、与推荐场景标识匹配的场景独有专家网络、与推荐场景标识和推荐目标标识匹配的目标独有专家网络；将任一样本特征对输入至目标专家网络；如此，能够根据样本特征对的推荐场景标识和推荐目标标识，准确地确定样本特征对需要输入至项目推荐模型中的目标专家网络，从而实现灵活、精准而高效地对相应的专家网络进行训练，有利于训练得到较为准确的项目推荐模型。

为了便于本领域技术人员理解，图3示例性地提供了一种样本特征对的生成方法，该方法即可以基于原始的样本数据生成样本特征对。其中，根据用户(u)进入关注场景(scene)时发起的相应的用户请求，服务器可以确定，用户当前对应的推荐场景为关注场景，则进入关注场景对应的在线主播池(在线主播池中的主播账号均为用户所关注的主播账号i1、i2、……、iN)，进而确定主播集合，同时，服务器还根据用户请求，通过用户账号对应的关系链接口获取用户的关系链信息，从而确定用户账号对应的好友序列和关注序列；服务器根据用户账号、推荐场景及用户所关注的各个主播账号，生成各个请求对{请求对1(u，scene，i1)，请求对2(u，scene，i2)，……，请求对N(u，scene，iN)}；服务器根据各个请求对，在特征平台进行查询，从而得到用户账号、推荐场景和主播账号对应的特征对{特征对1(u，us，scene，i1)，特征对2(u，us，scene，i2)，……，特征对N(u，us，scene，iN)}，其中，us包括用户账号、主播账号的基础画像(包括用户身份信息等)、统计特征(包括用户观看时长数据、用户送花记录数据和用户付费数据等)、实时特征(包括直播间的观看用户数，直播间类型、直播播放时长等)；样本特征对实际上与样本请求对一一对应；服务器结合各个特征对、用户账号对应的好友序列和关注序列，向项目推荐模型请求各个主播账号(i1、i2、……、iN)对应的推荐目标打分信息，从而得到各个特征对的各个推荐目标得分{特征对1：推荐目标1得分、推荐目标2得分、……、推荐目标M得分；特征对2：推荐目标1得分、推荐目标2得分、……、推荐目标M得分；……；特征对N：推荐目标1得分、推荐目标2得分、……、推荐目标M得分}，推荐目标i(i＝1，2，……，M)可以是点击、互动、付费、观看等目标；服务器根据各个推荐目标对应的权重，对同一特征对对应的各个推荐目标得分进行加权融合，得到各个特征对对应的推荐评分值；服务器根据各个特征对对应的推荐评分值，对各个特征对进行排序，以对用户所关注的主播账号进行排序，即实现对关注场景下的主播账号进行排序，得到排序结果。具体地，若排序结果按照推荐评分值从高到底为{i2、i1、i5、……、iN}，则后续服务器按照该排序结果，将主播账号i2、i1、i5优先推送给用户。

在另一个实施例中，根据公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对的输出结果，确定任一样本特征对的推荐预测信息，包括：将任一样本特征对输入至项目推荐模型中的目标门控网络，得到门控网络输出结果；目标门控网络为与样本特征对关联的推荐场景匹配的门控网络；基于门控网络输出结果，对公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对的输出结果进行加权融合，得到任一样本特征对的推荐预测信息。

其中，目标门控网络可以是用于确定公共专家网络的输出结果、场景独有专家网络的输出结果和目标独有专家网络的输出结果各自对应的权重值的神经网络。

其中，门控输出结果可以是目标门控网络输出的权重向量，该权重向量表征各个类型专家网络的输出结果在加权融合过程中的权重。

具体实现中，服务器将任一样本特征对输入至项目推荐模型中的目标门控网络，得到门控网络输出结果，服务器基于门控网络输出结果，对公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征的输出结果进行加权融合，得到任一样本特征对的推荐预测信息。

本实施例的技术方案，通过将任一样本特征对输入至项目推荐模型中的目标门控网络，得到门控网络输出结果；目标门控网络为与样本特征对关联的推荐场景匹配的门控网络；基于门控网络输出结果，对公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对的输出结果进行加权融合，得到任一样本特征对的推荐预测信息；如此，能够准确地融合公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对的输出结果，从而准确地确定任一样本特征对的推荐预测信息，能够高效地对项目推荐模型进行训练，从而得到较为准确的项目推荐模型。

在另一个实施例中，将任一样本特征对输入至项目推荐模型中的目标门控网络，得到门控网络输出结果，包括：将任一样本特征对输入至项目推荐模型中的目标门控网络，得到公共专家网络、场景独有专家网络和目标独有专家网络分别针对任一样本特征对各自的门控值；将公共专家网络、场景独有专家网络和目标独有专家网络分别针对任一样本特征对各自的门控值作为门控网络输出结果。

其中，门控值可以是权重值。

具体实现中，服务器将任一样本特征对输入至项目推荐模型中的目标门控网络，得到公共专家网络、场景独有专家网络和目标独有专家网络分别针对任一样本特征对各自的门控值，服务器将公共专家网络、场景独有专家网络和目标独有专家网络分别针对任一样本特征对各自的门控值作为门控网络输出结果。

本实施例的技术方案，通过将任一样本特征对输入至项目推荐模型中的目标门控网络，得到公共专家网络、场景独有专家网络和目标独有专家网络分别针对任一样本特征对各自的门控值；将公共专家网络、场景独有专家网络和目标独有专家网络分别针对任一样本特征对各自的门控值作为门控网络输出结果；如此，能够准确地根据不同的样本特征对，确定相应的门控值，得到准确的门控网络输出结果，有利于准确地对公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对的输出结果进行融合。

在另一个实施例中，基于门控网络输出结果，对公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对的输出结果进行加权融合，得到任一样本特征对的推荐预测信息，包括：按照门控网络输出结果，对公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对的输出结果进行加权融合，得到加权融合结果；将加权融合结果输入至项目推荐模型中的目标多层感知器，得到目标多层感知器输出结果；根据目标多层感知器输出结果，确定任一样本特征对的推荐预测信息。

其中，加权融合结果可以是加权融合后得到的数值或向量。

其中，目标多层感知器可以是一个推荐目标对应的MLP网络(一种前馈人工神经网络)，其用于根据输入信息确定推荐目标对应的预测结果。

其中，目标多层感知器输出结果可以是预测值或预测向量。

具体实现中，服务器按照门控网络输出结果，对公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对的输出结果进行加权融合，得到加权融合结果，服务器再将加权融合结果输入至项目推荐模型中的目标多层感知器，得到目标多层感知器的输出结果，服务器根据目标多层感知器输出结果，确定任一样本特征对的推荐预测信息。

本实施例的技术方案，通过按照门控网络输出结果，对公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对的输出结果进行加权融合，得到加权融合结果；将加权融合结果输入至项目推荐模型中的目标多层感知器，得到目标多层感知器输出结果；根据目标多层感知器输出结果，确定任一样本特征对的推荐预测信息；如此，能够实现将加权融合结果输入至目标多层感知器，准确地确定样本特征对的推荐预测信息。

在另一个实施例中，根据目标多层感知器输出结果，确定任一样本特征对的推荐预测信息，包括：将任一样本特征对输入至项目推荐模型中的场景记忆网络，得到场景记忆权重信息；按照场景记忆权重信息对目标多层感知器输出结果进行加权融合，得到任一样本特征对的推荐预测信息。

其中，场景记忆网络可以是能够在历史数据中发现特征之间的相关性的神经网络。项目推荐模型中的场景记忆网络能够学习并利用历史数据中的特征，当场景记忆网络发现与历史数据相似的典型特征时，其增大输出的权重，以对特征进行记忆。

其中，场景记忆权重信息可以是场景记忆网络输出的权值。

具体实现中，服务器将任一样本特征对输入至项目推荐模型中的场景记忆网络，得到场景记忆权重信息，服务器按照场景记忆权重信息对目标多层感知器输出结果进行加权融合，得到任一样本特征对的推荐预测信息。

本实施例的技术方案，通过将任一样本特征对输入至项目推荐模型中的场景记忆网络，得到场景记忆权重信息；按照场景记忆权重信息对目标多层感知器输出结果进行加权融合，得到任一样本特征对的推荐预测信息；如此，能够对大量训练样本数据集的特征信息进行处理和记忆，训练得到具有较强表达能力的场景记忆网络，从而有利于训练得到较为准确的项目推荐模型。

为了便于本领域技术人员的理解，图4示例性地提供了一种项目推荐模型的模型结构示意图。

其中，项目推荐模型包括Wide Model模块(记忆网络)、Bottom DNN Layer(特征提取网络)模块、专家网络模块、多层感知器(MLP)模块和门控网络模块。服务器在对项目推荐模型进行训练时，该模型中各个模块之间的数据交互过程为：

步骤1：将样本特征对输入至项目推荐模型，其中，样本特征对需要转换成特征向量(Embedding)，然后输入至Bottom DNN Layer(特征提取网络)模块提取高阶信息。

步骤2：将样本特征对对应的高阶信息输入到目标专家网络。

例如，当样本特征对属于关注场景的样本数据时，该样本特征对对应的高阶信息进入公共专家网络、关注场景独有公共专家网络，同时，当该样本特征对是用于训练用于确定用户点击的预测值的模型时，该样本特征对对应的高阶信息还需进入关注场景下点击目标独有专家网络；当样本特征对属于关注场景的样本数据时，该样本特征对对应的高阶信息进入公共专家网络、关注场景独有公共专家网络，同时，当该样本特征对是用于训练用于确定用户观看的预测值的模型时，该样本特征对对应的高阶信息还需进入关注场景下观看目标独有专家网络；当样本特征对属于直播场景的样本数据时，该样本特征对对应的高阶信息进入公共专家网络、直播场景独有公共专家网络，同时，当该样本特征对是用于训练用于确定用户点击的预测值的模型时，该样本特征对对应的高阶信息还需进入直播场景下点击目标独有专家网络。

步骤3：将该样本特征对的高阶信息输入至相应的目标门控网络，得到门控网络输出结果。

例如，当样本特征对是用于训练用于确定关注场景下用户点击的预测值的模型时，目标门控网络根据输入的样本特征对的高阶信息，确定公共专家网络、关注场景独有公共专家网络和关注场景下点击目标独有专家网络各自对应的权重信息。

步骤4：按照门控网络输出结果对公共专家网络、场景独有专家网络、目标独有专家网络的输出结果进行加权融合，得到加权融合结果。

例如，当样本特征对是用于训练用于确定关注场景下用户点击的预测值的模型时，目标门控网络根据输入的样本特征对的高阶信息，确定公共专家网络、关注场景独有公共专家网络和关注场景下点击目标独有专家网络对应的权重信息，按照公共专家网络、关注场景独有公共专家网络和关注场景下点击目标独有专家网络对应的权重信息，对公共专家网络、关注场景独有公共专家网络和关注场景下点击目标独有专家网络的输出结果进行加权融合，得到加权融合结果。

其中，目标门控网络的个数取决于推荐目标的个数，即不同的推荐目标具有相应的目标门控网络。

步骤5：将加权融合结果输入至多层感知器(MLP)，得到多层感知器输出结果。

步骤6：将样本特征对输入至Wide Model，Wide Model基于每个特征利用One-Hot编码(一位有效编码，其方法是使用N位状态寄存器来对N个状态进行编码，每个状态都由他独立的寄存器位，并且在任意时候，其中只有一位有效)生成一维向量，并为每个编码生成一个权重，即生成场景记忆权重信息。Wide Model实际上是为每个推荐场景生成一套权重以用于学习推荐场景内在信息。

步骤7：将多层感知器输出结果和场景记忆权重信息进行加权融合，得到样本特征对对应的推荐预测信息。

例如，将多层感知器输出结果和场景记忆权重信息进行加权融合，得到该样本特征对对应的点击预测信息。

本申请中的项目推荐模型的训练方法，能够基于同一个训练批次同时包含多个不同场景的训练样本数据集，训练可以用于确定不同推荐场景下不同推荐目标的推荐预测信息的项目推荐模型。该模型在训练过程中，可以实现场景协同，无需交替使用不同场景的训练样本数据集，只需采用同一训练批次的训练样本数据集便能够学习到多推荐场景的信息，从而发现推荐场景之间的差异，充分利用推荐场景的特征。并且，在实现多场景协同训练的基础上，能够实现不同场景的多目标结合训练，使得训练得到的模型更为灵活、适用范围更广(由于不同细分场景可能考虑的目标有所不同，例如关注场景主要关注点击目标、直播场景主要关注有效观看目标)。

下述提供了采用本申请训练得到的项目推荐模型进行主播账号推荐时对应的效果测评数据。其中，针对直播场景和关注场景做了联合多目标预估，采用的四个目标分别为点击目标，付费目标，互动目标，有效观看目标。表一为单个推荐场景多目标的项目推荐模型与本申请实施例的多个推荐场景多目标的项目推荐模型在直播场景下的效果对比信息，表二为单个推荐场景多目标的项目推荐模型与本申请实施例的多个推荐场景多目标的项目推荐模型在关注场景下的效果对比信息，表三为采用该项目推荐模型后音乐APP对应的业务效果提升情况。其中，ClickAuc为点击预测目标对应的模型评价指标、PayAuc为付费预测目标对应的模型评价指标、InterAuc为互动预测目标对应的模型评价指标、ValidWatchAuc为有效观看目标对应的模型评价指标。

表1直播场景

方法	ClickAuc	PayAuc	InterAuc	ValidWatchAuc
					本申请	0.8810	0.9729	0.9325	0.9047
单场景	0.8784	0.9703	0.9321	0.9031

表2关注场景

方法	ClickAuc	PayAuc	InterAuc	ValidWatchAuc
					本申请	0.8919	0.9640	0.9387	0.9096
单场景	0.8895	0.9622	0.9361	0.9076

表3业务效果

场景	点击率	付费率	互动率	有效观看率
					推荐场景	+2.87％	+2.23％	+3.14％	+1.29％
关注场景	+1.96％	+2.01％	+2.33％	+1.12％

在另一个实施例中，如图5所示，提供了一种项目推荐模型的训练方法，以该方法应用于图1中的服务器104为例进行说明，包括以下步骤：

步骤S510，获取训练样本数据集；训练样本数据集包括针对多个推荐场景的训练样本数据；训练样本数据包括待推荐项目和样本用户之间的样本特征对。

步骤S520，使用训练样本数据集中的任一样本特征对执行下述训练过程，以训练项目推荐模型：

步骤S522，将任一样本特征对输入至项目推荐模型中的目标专家网络；目标专家网络包括公共专家网络，以及，与任一样本特征对匹配的场景独有专家网络和目标独有专家网络；由公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对输出结果；目标独有专家网络为与任一样本特征对关联的推荐目标相匹配的专家网络。

步骤S524，将任一样本特征对输入至项目推荐模型中的目标门控网络，得到门控网络输出结果；目标门控网络为与样本特征对关联的推荐场景匹配的门控网络。

步骤S526，基于门控网络输出结果，对公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对的输出结果进行加权融合，得到任一样本特征对的推荐预测信息。

步骤S528，根据任一样本特征对的推荐预测信息，对项目推荐模型进行训练。

需要说明的是，上述步骤的具体限定可以参见上文对一种项目推荐模型的训练方法的具体限定。

在一个实施例中，如图6所示，提供了一种项目推荐方法，以该方法应用于图1中的服务器104为例进行说明，包括以下步骤：

步骤S602，响应于目标用户针对目标推荐场景触发的推荐事件，获取至少一个待推荐项目与目标用户间的特征对。

其中，目标用户可以是使用目标应用的任一用户。例如，目标用户可以是音乐APP中的任一用户。

其中，目标推荐场景可以是当前用户打开目标应用时所在的实际场景。例如，目标推荐场景可以是当前用户打开音乐APP时所在的推荐场景。

具体实现中，目标用户在进入目标推荐场景时，会触发相应的推荐事件，以向服务器发起请求，服务器响应于目标用户在目标推荐场景中触发的推荐事件，确定目标推荐场景对应的待推荐项目，从而获取各个待推荐项目与目标用户的特征对。

步骤S604，将各特征对输入至预训练的项目推荐模型，得到目标用户针对各待推荐项目的推荐预测信息。

具体实现中，服务器将各特征对输入至预训练的项目推荐模型，得到目标用户在目标推荐场景下的各个待推荐项目对应的推荐预测信息。

步骤S606，根据各待推荐项目的推荐预测信息，在所述目标推荐场景下为目标用户针对目标推荐场景进行项目推荐；其中，预训练的项目推荐模型为根据至少一个训练批次的训练样本数据集中的各样本特征对的推荐预测信息，对待训练的项目推荐模型进行训练得到的；训练样本数据集包括针对多个推荐场景下多个不同推荐目标的样本特征对；训练样本数据集中的任一样本特征对的推荐预测信息为根据待训练的项目推荐模型中的目标专家网络针对任一样本特征对的输出结果确定得到的；目标专家网络包括公共专家网络，以及，与任一样本特征对匹配的场景独有专家网络和目标独有专家网络。

具体实现中，服务器根据各待推荐项目的推荐预测信息，为目标用户在目标推荐场景下进行项目推荐。

实际应用中，服务器可以根据各待推荐项目的推荐值，确定各个待推荐项目对应的推荐排序，进而服务器根据各个待推荐项目对应的推荐排序，向用户推荐项目。

上述项目推荐方法，通过响应于目标用户针对目标推荐场景触发的推荐事件，获取至少一个待推荐项目与目标用户间的特征对；将各特征对输入至预训练的项目推荐模型，得到目标用户间针对各待推荐项目的推荐预测信息；根据各待推荐项目的推荐预测信息，为目标用户针对目标推荐场景进行项目推荐；其中，预训练的项目推荐模型为根据至少一个训练批次的训练样本数据集中的各样本特征对的推荐预测信息，对待训练的项目推荐模型进行训练得到的；训练样本数据集包括针对多个推荐场景下多个不同推荐目标的样本特征对；训练样本数据集中的任一样本特征对的推荐预测信息为根据待训练的项目推荐模型中的目标专家网络针对任一样本特征对的输出结果确定得到的；目标专家网络包括公共专家网络，以及，与任一样本特征对匹配的场景独有专家网络和目标独有专家网络；如此，能够准确地根据目标用户所在的推荐场景，准确地向用户推荐项目，从而增加用户与各待推荐项目的互动频率。

应该理解的是，虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

基于同样的发明构思，本申请实施例还提供了一种用于实现上述所涉及的项目推荐模型的训练方法的项目推荐模型的训练装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似，故下面所提供的一个或多个项目推荐模型的训练装置实施例中的具体限定可以参见上文中对于项目推荐模型的训练方法的限定，在此不再赘述。

在一个实施例中，如图7所示，提供了一种项目推荐模型的训练装置，包括：

获取模块702，用于获取训练样本数据集；训练样本数据集包括针对多个推荐场景的训练样本数据；训练样本数据包括待推荐项目和样本用户之间的样本特征对；

训练模块704，用于使用训练样本数据集中的任一样本特征对执行下述训练过程，以训练项目推荐模型：将任一样本特征对输入至待训练的项目推荐模型中的目标专家网络；目标专家网络包括公共专家网络，以及，与任一样本特征对匹配的场景独有专家网络和目标独有专家网络；由公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对输出结果；根据公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对的输出结果，确定任一样本特征对的推荐预测信息；根据任一样本特征对的推荐预测信息，对项目推荐模型进行训练。

在其中一个实施例中，训练模块704，具体用于确定任一样本特征对中的推荐场景标识和推荐目标标识；根据推荐场景标识和推荐目标标识，确定待训练的项目推荐模型中的目标专家网络；目标专家网络包括公共专家网络、与推荐场景标识匹配的场景独有专家网络、与推荐场景标识和推荐目标标识匹配的目标独有专家网络；将任一样本特征对输入至目标专家网络。

在其中一个实施例中，训练模块704，具体用于将任一样本特征对输入至待训练的项目推荐模型中的目标门控网络，得到门控网络输出结果；目标门控网络为与样本特征对关联的推荐场景匹配的门控网络；基于门控网络输出结果，对公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对的输出结果进行加权融合，得到任一样本特征对的推荐预测信息。

在其中一个实施例中，训练模块704，具体用于将任一样本特征对输入至待训练的项目推荐模型中的目标门控网络，得到公共专家网络、场景独有专家网络和目标独有专家网络分别针对任一样本特征对各自的门控值；将公共专家网络、场景独有专家网络和目标独有专家网络分别针对任一样本特征对各自的门控值作为门控网络输出结果。

在其中一个实施例中，训练模块704，具体用于按照门控网络输出结果，对公共专家网络、场景独有专家网络和目标独有专家网络针对任一样本特征对的输出结果进行加权融合，得到加权融合结果；将加权融合结果输入至待训练的项目推荐模型中的目标多层感知器，得到目标多层感知器输出结果；根据目标多层感知器输出结果，确定任一样本特征对的推荐预测信息。

在其中一个实施例中，训练模块704，具体用于将任一样本特征对输入至待训练的项目推荐模型中的场景记忆网络，得到场景记忆权重信息；按照场景记忆权重信息对目标多层感知器输出结果进行加权融合，得到任一样本特征对的推荐预测信息。

在一个实施例中，如图8所示，提供了一种项目推荐装置，包括：

响应模块802，用于响应于目标用户针对目标推荐场景触发的推荐事件，获取至少一个待推荐项目与目标用户间的特征对；

预测模块804，将各特征对输入至预训练的项目推荐模型，得到目标用户间针对各待推荐项目的推荐预测信息；

推荐模块806，用于根据各待推荐项目的推荐预测信息，为目标用户针对目标推荐场景进行项目推荐；

上述项目推荐模型的训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储项目推荐模型的训练数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种项目推荐模型的训练方法。

本领域技术人员可以理解，图9中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器存储有计算机程序，计算机程序被处理器执行时，使得处理器执行上述一种项目推荐模型的训练方法的步骤。此处一种项目推荐模型的训练方法的步骤可以是上述各个实施例的一种项目推荐模型的训练方法中的步骤。

在一个实施例中，提供了一种计算机可读存储介质，存储有计算机程序，计算机程序被处理器执行时，使得处理器执行上述一种项目推荐模型的训练方法的步骤。此处一种项目推荐模型的训练方法的步骤可以是上述各个实施例的一种项目推荐模型的训练方法中的步骤。

在一个实施例中，提供了一种计算机程序产品，包括计算机程序，计算机程序被处理器执行时，使得处理器执行上述一种项目推荐模型的训练方法的步骤。此处一种项目推荐模型的训练方法的步骤可以是上述各个实施例的一种项目推荐模型的训练方法中的步骤。

需要说明的是，本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)，均为经用户授权或者经过各方充分授权的信息和数据。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory，ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory，MRAM)、铁电存储器(Ferroelectric Random Access Memory，FRAM)、相变存储器(Phase Change Memory，PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器等。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory，DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等，不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等，不限于此。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请的保护范围应以所附权利要求为准。

Claims

1.一种项目推荐模型的训练方法，其特征在于，包括：

获取训练样本数据集；所述训练样本数据集包括针对多个推荐场景的训练样本数据；所述训练样本数据包括待推荐项目和样本用户间之间的样本特征对；

使用所述训练样本数据集中的任一样本特征对执行下述训练过程，以训练项目推荐模型：

将所述任一样本特征对输入至所述项目推荐模型中的目标专家网络；所述目标专家网络包括公共专家网络，以及，与所述任一样本特征对匹配的场景独有专家网络和目标独有专家网络；由所述公共专家网络、所述场景独有专家网络和所述目标独有专家网络针对所述任一样本特征对输出结果；

根据所述公共专家网络、所述场景独有专家网络和所述目标独有专家网络针对所述任一样本特征对的输出结果，确定所述任一样本特征对的推荐预测信息；

根据所述任一样本特征对的推荐预测信息，对所述项目推荐模型进行训练。

2.根据权利要求1所述的方法，其特征在于，每个所述推荐场景的训练样本数据包括多个不同推荐目标的训练样本数据，所述将所述任一样本特征对输入至所述项目推荐模型中的目标专家网络，包括：

确定所述任一样本特征对中的推荐场景标识和推荐目标标识；

根据所述推荐场景标识和所述推荐目标标识，确定所述项目推荐模型中的目标专家网络；所述目标专家网络包括所述公共专家网络、与所述推荐场景标识匹配的场景独有专家网络、与所述推荐场景标识和所述推荐目标标识匹配的目标独有专家网络；

将所述任一样本特征对输入至所述目标专家网络。

3.根据权利要求1所述的方法，其特征在于，所述根据所述公共专家网络、所述场景独有专家网络和所述目标独有专家网络针对所述任一样本特征对的输出结果，确定所述任一样本特征对的推荐预测信息，包括：

将所述任一样本特征对输入至所述项目推荐模型中的目标门控网络，得到门控网络输出结果；所述目标门控网络为与所述样本特征对关联的推荐场景匹配的门控网络；

基于所述门控网络输出结果，对所述公共专家网络、所述场景独有专家网络和所述目标独有专家网络针对所述任一样本特征对的输出结果进行加权融合，得到所述任一样本特征对的推荐预测信息。

4.根据权利要求3所述的方法，其特征在于，所述将所述任一样本特征对输入至所述项目推荐模型中的目标门控网络，得到门控网络输出结果，包括：

将所述任一样本特征对输入至所述项目推荐模型中的目标门控网络，得到所述公共专家网络、所述场景独有专家网络和所述目标独有专家网络分别针对所述任一样本特征对各自的门控值；

将所述公共专家网络、所述场景独有专家网络和所述目标独有专家网络分别针对所述任一样本特征对各自的门控值作为所述门控网络输出结果。

5.根据权利要求3所述的方法，其特征在于，所述基于所述门控网络输出结果，对所述公共专家网络、所述场景独有专家网络和所述目标独有专家网络针对所述任一样本特征对的输出结果进行加权融合，得到所述任一样本特征对的推荐预测信息，包括：

按照所述门控网络输出结果，对所述公共专家网络、所述场景独有专家网络和所述目标独有专家网络针对所述任一样本特征对的输出结果进行加权融合，得到加权融合结果；

将所述加权融合结果输入至所述项目推荐模型中的目标多层感知器，得到目标多层感知器输出结果；

根据所述目标多层感知器输出结果，确定所述任一样本特征对的推荐预测信息。

6.根据权利要求5所述的方法，其特征在于，所述根据所述目标多层感知器输出结果，确定所述任一样本特征对的推荐预测信息，包括：

将所述任一样本特征对输入至所述项目推荐模型中的场景记忆网络，得到场景记忆权重信息；

按照所述场景记忆权重信息对所述目标多层感知器输出结果进行加权融合，得到所述任一样本特征对的推荐预测信息。

7.一种项目推荐方法，其特征在于，包括：

响应于目标用户针对目标推荐场景触发的推荐事件，获取至少一个待推荐项目与所述目标用户间的特征对；

将各所述特征对输入至预训练的项目推荐模型，得到所述目标用户针对各所述待推荐项目的推荐预测信息；

根据各所述待推荐项目的推荐预测信息，在所述目标推荐场景下为所述目标用户进行项目推荐；

其中，所述预训练的项目推荐模型为根据至少一个训练批次的训练样本数据集中的各样本特征对的推荐预测信息，对待训练的项目推荐模型进行训练得到的；所述训练样本数据集包括针对多个推荐场景的样本特征对；所述训练样本数据集中的任一样本特征对的推荐预测信息为根据所述待训练的项目推荐模型中的目标专家网络针对所述任一样本特征对的输出结果确定得到的；所述目标专家网络包括公共专家网络，以及，与所述任一样本特征对匹配的场景独有专家网络和目标独有专家网络。

8.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。

10.一种计算机程序产品，包括计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。