CN113553448A

CN113553448A - 一种推荐模型训练方法、装置、电子设备及存储介质

Info

Publication number: CN113553448A
Application number: CN202110871644.8A
Authority: CN
Inventors: 廖一桥; 骆明楠
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2021-07-30
Filing date: 2021-07-30
Publication date: 2021-10-26

Abstract

本公开关于一种推荐模型训练方法、装置、电子设备及存储介质。所述方法包括：获取训练数据；训练数据包括用户数据和对应的多媒体资源，以及推荐标注结果；获取待训练推荐模型；待训练推荐模型用于向用户推荐多媒体资源；待训练推荐模型包括嵌入层和特征输入层；嵌入层的输出与特征输入层的输入之间存在第一级联关系集合；第一级联关系集合中任一第一级联关系包含特征交叉单元；特征交叉单元的输入为嵌入层输出特征中的至少2个特征，特征交叉单元的输出为所输入的至少2个特征的交叉特征；将用户数据和对应的多媒体资源输入待训练推荐模型，得到预测推荐结果；根据预测推荐结果和推荐标注结果，确定损失信息；基于损失信息训练待训练推荐模型。

Description

一种推荐模型训练方法、装置、电子设备及存储介质

技术领域

本公开涉及推荐技术领域，尤其涉及一种推荐模型训练方法、装置、电子设备及存储介质。

背景技术

目前，推荐模型已经被广泛应用于各类业务平台。例如，短视频平台、社交平台等。推荐模型主要用于向平台用户推荐不同的内容，例如，短视频平台可以为用户推荐感兴趣的短视频；社交平台可以向用户推荐兴趣爱好相近的用户。

其中，针对向用户推荐多媒体资源的推荐模型，例如向用户推荐视频、文本、图像等的推荐模型，在训练过程中通常需要获取用户特征和多媒体资源的特征进行训练，但是，目前的推荐模型的推荐效果难以进一步提高。

发明内容

本公开提供一种推荐模型训练方法、装置、电子设备及存储介质，以至少解决相关技术中推荐模型的推荐效果难以提高的问题。本公开的技术方案如下：

根据本公开实施例的第一方面，提供一种推荐模型训练方法，包括：

获取训练数据；所述训练数据包括用户数据和对应的多媒体资源，以及推荐标注结果；

获取待训练推荐模型；所述待训练推荐模型用于向用户推荐多媒体资源；所述待训练推荐模型包括嵌入层和特征输入层；所述嵌入层的输出与所述特征输入层的输入之间存在第一级联关系集合；所述第一级联关系集合中包括一个或多个第一级联关系；

所述第一级联关系集合中任一第一级联关系用于将所述嵌入层输出的至少2个特征级联至单个特征交叉单元的输入，并将该特征交叉单元的输出级联至所述特征输入层的输入；所述特征交叉单元的输入为所述嵌入层输出特征中的至少2个特征，所述特征交叉单元的输出为所输入的至少2个特征的交叉特征；

将所述用户数据和对应的多媒体资源输入所述待训练推荐模型，得到预测推荐结果；

根据所述预测推荐结果和所述推荐标注结果，确定损失信息；

基于所述损失信息训练所述待训练推荐模型。

可选地，所述获取待训练推荐模型，包括：

获取业务平台当前部署的推荐模型副本作为旧推荐模型；所述旧推荐模型包括嵌入层和特征输入层；

在所述旧推荐模型的嵌入层的输出与特征输入层的输入之间存在第一级联关系集合的情况下，更新所述旧推荐模型的第一级联关系集合，得到待训练推荐模型；

在所述旧推荐模型的嵌入层的输出与特征输入层的输入之间不存在第一级联关系集合的情况下，创建第一级联关系集合，得到待训练推荐模型。

可选地，所述更新所述旧推荐模型的第一级联关系集合，包括：

在所述旧推荐模型的第一级联关系集合中新增一个或多个第一级联关系；

和/或

在所述旧推荐模型的第一级联关系集合中修改一个或多个第一级联关系；

和/或

在所述旧推荐模型的第一级联关系集合中删除一个或多个第一级联关系。

可选地，在得到待训练推荐模型之后，所述方法还包括：

调整所得到的待训练推荐模型的参数，使得所述旧推荐模型和调整参数后的待训练推荐模型在输入相同的情况下，输出也相同。

可选地，所述训练数据包括历史训练数据，所述历史训练数据包括训练过所述旧推荐模型的训练数据；所述基于所述损失信息训练所述待训练推荐模型，包括：

在保持所述待训练推荐模型的嵌入层参数不变的情况下，基于所述历史训练数据对应的损失信息训练所述待训练推荐模型。

可选地，所述特征交叉单元包括多层感知器；

所述多层感知器用于：针对待交叉的至少2个特征，将其中1个特征作为输入，将其他特征作为所述多层感知器的参数，计算得到所述待交叉的至少2个特征的交叉特征。

可选地，所述特征交叉单元还包括维度扩展层；所述维度扩展层输出维度固定的特征，且所述维度扩展层输入特征数量与输出特征数量相同；

所述特征交叉单元用于：将输入的至少2个特征输入所述维度扩展层，并将所述维度扩展层输出的至少2个特征作为待交叉的至少2个特征，由所述多层感知器计算得到交叉特征。

可选地，所述特征交叉单元还包括缓冲层；所述缓冲层的输入和输出维度相同，且初始化后的缓冲层的输入输出保持一致；

所述特征交叉单元用于：将输入的至少2个特征输入所述缓冲层，并将所述缓冲层输出的至少2个特征作为待交叉的2个特征，由所述多层感知器计算得到交叉特征。

可选地，所述嵌入层的输出与所述特征输入层的输入之间还存在第二级联关系集合；

所述第二级联关系集合中任一第二级联关系用于将所述嵌入层的1个输出级联至所述特征输入层的输入。

可选地，所述推荐模型训练方法还包括：

在训练后的待训练推荐模型的推荐效果优于业务平台当前部署的推荐模型的情况下，利用训练后的待训练推荐模型替换所述业务平台当前部署的推荐模型。

根据本公开实施例的第二方面，提供一种推荐模型训练装置，包括：

训练数据获取单元，被配置为执行：获取训练数据；所述训练数据包括用户数据和对应的多媒体资源，以及推荐标注结果；

模型获取单元，被配置为执行：获取待训练推荐模型；所述待训练推荐模型用于向用户推荐多媒体资源；所述待训练推荐模型包括嵌入层和特征输入层；所述嵌入层的输出与所述特征输入层的输入之间存在第一级联关系集合；所述第一级联关系集合中包括一个或多个第一级联关系；

训练单元，被配置为执行：将所述用户数据和对应的多媒体资源输入所述待训练推荐模型，得到预测推荐结果；根据所述预测推荐结果和所述推荐标注结果，确定损失信息；基于所述损失信息训练所述待训练推荐模型。

可选地，所述模型获取单元，包括：

旧模型获取子单元，被配置为执行：获取业务平台当前部署的推荐模型副本作为旧推荐模型；所述旧推荐模型包括嵌入层和特征输入层；

模型更新子单元，被配置为执行：在所述旧推荐模型的嵌入层的输出与特征输入层的输入之间存在第一级联关系集合的情况下，更新所述旧推荐模型的第一级联关系集合，得到待训练推荐模型；在所述旧推荐模型的嵌入层的输出与特征输入层的输入之间不存在第一级联关系集合的情况下，创建第一级联关系集合，得到待训练推荐模型。

可选地，所述模型更新子单元，包括：

集合更新子单元，被配置为执行：

在所述旧推荐模型的嵌入层的输出与特征输入层的输入之间存在第一级联关系集合的情况下，在所述旧推荐模型的第一级联关系集合中新增一个或多个第一级联关系；和/或在所述旧推荐模型的第一级联关系集合中修改一个或多个第一级联关系；和/或在所述旧推荐模型的第一级联关系集合中删除一个或多个第一级联关系。

可选地，所述模型更新子单元还包括：

模型调整子单元，被配置为执行：在得到待训练推荐模型之后，调整所得到的待训练推荐模型的参数，使得所述旧推荐模型和调整参数后的待训练推荐模型在输入相同的情况下，输出也相同。

可选地，所述训练数据包括历史训练数据，所述历史训练数据包括训练过所述旧推荐模型的训练数据；所述训练单元包括：

历史训练子单元，被配置为执行：在保持所述待训练推荐模型的嵌入层参数不变的情况下，基于所述历史训练数据对应的损失信息训练所述待训练推荐模型。

可选地，所述特征交叉单元包括多层感知器；

可选地，所述推荐模型训练装置还包括：

替换单元，被配置为执行：在训练后的待训练推荐模型的推荐效果优于所述业务平台当前部署的推荐模型的情况下，利用训练后的待训练推荐模型替换所述业务平台当前部署的推荐模型。

根据本公开实施例的第三方面，提出了一种电子设备，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现上述任一实施例所述的一种推荐模型训练方法。

根据本公开实施例的第四方面，提出一种计算机可读存储介质，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行上述任一实施例所述的一种推荐模型训练方法。

根据本公开实施例的第五方面，提出一种计算机程序产品，包括计算机程序/指令，所述计算机程序/指令被处理器执行时实现上述任一实施例所述的一种推荐模型训练方法。

本公开的实施例提供的技术方案通过在多媒体推荐模型中引入特征之间的交叉特征，利用交叉特征扩展特征表示的维度，可以更好地利用训练数据提高多媒体推荐模型的训练效果，从而提高多媒体推荐模型的推荐效果，提高用户获取推荐的多媒体资源的体验。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种推荐模型训练方法的流程图；

图2是根据一示例性实施例示出的一种推荐模型的结构图；

图3是根据一示例性实施例示出的一种多层感知器的原理图；

图4是根据一示例性实施例示出的一种推荐模型训练装置框图；

图5是根据本公开的实施例示出的一种电子设备的示意框图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

为了解决上述问题，本公开提供了一种推荐模型训练方法。

目前的推荐模型的训练过程，通常是直接将独立的用户特征和多媒体资源的特征输入推荐模型，再利用对应的推荐标注结果进行训练，导致所训练的推荐模型难以反映出特征与推荐标注结果之间的非线性关系。并且，可能存在部分特征组合比独立的特征本身与推荐标注结果的关系更强。

例如，在推荐短视频时，25-35岁的女性由于多数正处于育儿阶段，通常会对育儿类视频感兴趣。而其他年龄段的女性由于多数不处于育儿阶段、或者25-35岁的男性由于较少参与育儿阶段，这些用户对育儿类视频往往不感兴趣。因此，年龄特征“25-35岁”和性别特征“女性”的组合比独立的这2个特征与标签“育儿类”的关系更强。往往需要只针对同时满足年龄特征“25-35岁”和性别特征“女性”这一组合的用户推荐育儿类视频。

但如果在训练推荐模型时，只存在独立的年龄特征和性别特征，则会因为存在25-35岁女性用户对育儿类视频感兴趣的较多样本，提高向年龄特征满足“25-35岁”的用户或性别特征为“女性”的用户推荐育儿类视频的概率，从而向同为“女性”的其他年龄段的用户推荐育儿类视频，或者向同为“25-35岁”的男性用户推荐育儿类视频，导致推荐效果较差。

为了进一步提高多媒体推荐模型的推荐效果，在本公开提供的一种推荐模型训练方法中，可以通过引入多个独立特征的交叉特征，使得可以基于现有的用户特征和多媒体资源的特征，进一步扩展特征表示的维度，从而更好地利用训练数据，简单高效地提高多媒体推荐模型的训练效果，进而提高多媒体推荐模型的推荐效果，使得多媒体推荐模型可以更准确地向用户推荐多媒体资源，提高了推荐的精准度，也提高用户获取推荐的多媒体资源的体验。

例如，可以在推荐短视频时，引入性别特征与年龄特征的交叉特征，从而可以利用交叉特征与推荐标注结果之间的线性关系，基于训练数据确定出25-35岁的女性通常会对育儿类视频感兴趣，而其他用户对育儿类视频往往不感兴趣。所训练得到的新的多媒体推荐模型在进行推荐时，可以根据输入的性别特征和年龄特征，确定交叉特征是否表征25-35岁的女性，如果是，则可以推荐育儿类视频；如果不是，则不推荐育儿类视频，从而提高多媒体推荐模型的推荐效果，提高了推荐的精准度，也提高用户获取推荐的多媒体资源的体验。

此外，由于多媒体推荐模型通常部署在业务平台上进行多媒体资源的推荐，而业务平台本身通常需要根据当前的需求，针对多媒体推荐模型进行迭代优化，进一步提高推荐效果。

当需要迭代推荐模型时，例如，需要迭代推荐模型的算法或者结构等，业务平台往往会构建一个新的推荐模型，利用存储的历史样本集进行训练。如果训练后的新推荐模型的效果优于线上的旧推荐模型，则可以将训练后的新推荐模型替换旧推荐模型。

但是，受数据存储能力的限制，业务平台所存储的历史样本集中样本数量有限，新推荐模型的训练数据较少；而旧推荐模型可以利用线上的实际用户数据不断训练优化，使得旧推荐模型的训练数据不断增多；因此，新推荐模型的训练数据通常远远少于线上的旧推荐模型，导致新推荐模型的效果往往比旧推荐模型差，难以替换旧推荐模型。

例如，线上的推荐模型已经部署了半年，训练数据至少包括半年的用户数据。而业务平台往往只能存储一个月的历史用户数据作为历史样本集，从而难以替换旧推荐模型。

可选地，针对这一问题，本公开提供的一种推荐模型训练方法中，可以直接获取当前在业务平台上部署的多媒体推荐模型副本或拷贝作为旧推荐模型，在旧推荐模型的基础上进行算法或者结构上的迭代优化，并通过进一步的训练得到新推荐模型。

由于是在旧推荐模型所学习到的参数基础上进行迭代和训练，得到新推荐模型，而旧推荐模型本身已经趋于收敛，因此，迭代前后的旧推荐模型的推荐效果相同或相差较小，再针对迭代后的旧推荐模型训练得到新推荐模型，即使利用较少的训练数据也容易使得新推荐模型的效果优于旧推荐模型，从而替换旧推荐模型。

例如，在旧推荐模型的基础上进行迭代时，可以增加部分特征，同时通过调整模型参数，消除新增部分特征对输出的影响，使得迭代前和迭代后的旧推荐模型，在输入相同的情况下输出也保持一致。此时迭代前后的旧推荐模型的效果相同。之后再利用较少的训练数据训练迭代后的旧推荐模型，得到新推荐模型，新推荐模型的效果也可以优于迭代前的旧推荐模型的效果。

由于本公开提供的上述方法不需要从头开始训练推荐模型，也不需要提前存储较多的历史训练数据，因此可以提高推荐模型训练和迭代的速度，并且减轻数据存储的压力。

下面进一步解释特征交叉。

特征交叉具体指的是对至少2种特征进行交叉处理，得到一个新的交叉特征。特征交叉的方式可以包括：计算笛卡尔积；以及基于co-action network技术方案的方式。

其中，co-action network的特征交叉方式包括：针对需要交叉的2个特征，将其中一个特征作为输入，另一个特征作为多层感知器的参数，用多层感知器的输出表示交叉特征。进一步地，针对需要交叉的至少2个特征，可以将其中一个特征作为输入，其他特征都作为多层感知器的参数，用多层感知器的输出表示交叉特征。

而在针对至少2个特征进行交叉时，通常特征交叉是针对推荐模型的嵌入层的输入特征进行交叉，而在本公开提供的上述方法中，特征交叉可以是针对推荐模型的嵌入层的输出特征进行交叉。下面进行详细的解释。

首先解释推荐模型。多媒体推荐模型通常是基于神经网络模型构建的，通常包括嵌入层和dense层。

其中，嵌入层的输入通常是one-hot编码的稀疏特征，维度较高，而嵌入层主要用于学习特征的表示，将输入的特征映射到另一个向量空间中。通常可以降低输入特征的维度，实现特征的降维，输出维度较低的特征。

而dense层用于将输入的特征经过非线性变化，提取这些特征之间的关联，最后映射到输出空间上。具体而言，dense层可以包括特征输入层、池化层、全连接层、softmax层等。其中，嵌入层的输出可以级联至特征输入层。

通常特征交叉时，是针对嵌入层的输入进行交叉，但这种交叉方式会导致交叉特征的计算速度较慢，存储资源的占用也较多。

例如，在针对嵌入层的输入中的2个特征计算笛卡尔积时，由于嵌入层的输入往往维度较高，则在计算笛卡尔积时需要占用较多内容，计算速度也较慢。具体可以是32维特征与100维特征计算笛卡尔积时，需要将32维特征和100维特征读取到内存中，并额外设置存储3200个计算结果的存储空间，计算至少3200次。

又例如，在使用co-action network的技术方案时，需要遵循参数独立假设，将嵌入层的输入中的2个特征的维度进一步扩展，具体可以是将32维特征扩展为100维特征，再针对需要交叉的2个特征，将其中一个特征作为输入，另一个特征作为多层感知器的参数，用多层感知器的输出表示交叉特征。

并且，使用co-action network的技术方案需要预先将嵌入层的输入特征扩展维度并将扩展后的特征存储下来，再从存储中查询特征计算交叉特征。因此，需要额外存储多个扩展维度后的特征，例如，在参数服务器中存储多个被扩展为100维的特征，占用了较多存储资源，并且针对维度较高的特征计算多层感知器的输出，显然计算速度较慢。

由于本公开针对的是多媒体推荐的场景，而多媒体资源的特征通常情况下维数较多。例如，视频特征通常可以包含几百个维度。因此，针对多媒体资源特征进行特征交叉时，存储资源耗费的问题较为严重。

可选地，为了解决上述问题，本公开提供的上述方法中，可以针对嵌入层的输出执行特征交叉。

由于嵌入层可以实现特征的降维，即使采用笛卡尔积的交叉方式，针对降维后的特征计算笛卡尔积，显然可以提高计算速度，减少内存占用。

例如，32维特征和100维特征经过嵌入层的降维后，得到4维特征和5维特征，显然，计算4维特征和5维特征的笛卡尔积与计算32维特征和100维特征的笛卡尔积相比，计算速度较高，内容占用较少。

此外，由于是针对嵌入层的输出计算交叉特征，并不需要通过查询方式确定特征，即使采用co-action network的技术方案，需要针对嵌入层的输出扩展维度，也不需要将扩展维度后的特征存储下来再查询，而是可以直接实时计算多层感知器的输出，并实时释放扩展维度后的特征，从而节省了内存占用。换言之，co-action network的技术方案是存储扩展维度后的特征再查询，而本公开提供的上述方法是通过计算，实时扩展维度，从而避免占用过多存储资源。

同时，由于是实时扩展维度并计算，无需从存储中查询特征，也就进一步节省了获取特征的时间，提高了计算速度。

例如，32维特征和100维特征经过嵌入层的降维后，得到4维特征和5维特征，再针对4维特征和5维特征，分别都扩展为100维的特征，进一步将一个100维特征作为多层感知器的输入，另一个100维特征作为多层感知器的参数，最终得到多层感知器的输出作为交叉的特征，其中扩展得到的2个100维特征可以在计算得到交叉特征后实时从存储中释放，节约存储资源。

需要注意的是，由于多媒体推荐模型部署在线上时，通常需要较快地为用户计算得出推荐结果，向用户发送所推荐的多媒体资源。因此，常用的针对嵌入层输入进行特征交叉的方式往往会拖慢推荐模型计算的速度，并且会占用较多存储资源。而使用本公开提供的上述方法，针对嵌入层的输出进行特征交叉，则可以提高推荐模型计算的速度，节约存储资源，便于多媒体推荐模型在线上的业务开展，可以更快地得出推荐结果。

下面通过具体实施例并结合具体的应用场景对技术方案进行描述。

如图1所示，图1是根据一示例性实施例示出的一种推荐模型训练方法的流程图。该方法可以应用于服务器或与业务平台相关的电子设备。该方法可以包括以下步骤。

S101：获取训练数据。

其中，训练数据可以包括用户数据和对应的多媒体资源，以及推荐标注结果。

在一种可选的实施例中，一条训练数据中可以包括用于表征用户特征的用户数据、对应的多媒体资源、以及推荐标注结果。

可选地，推荐标注结果可以用于表征是否向训练数据中的用户数据对应的用户推荐对应的多媒体资源。具体可以是向训练数据中的用户数据对应的用户推荐对应的多媒体资源的概率。

可选地，用户数据可以包含一种或多种表征用户特征的数据。例如，用户数据可以包含表征用户喜好的内容标签的数据、表征用户历史浏览的内容的数据、表征用户身份的数据、和表征用户职业的数据等。

可选地，多媒体资源可以包含一种或多种表征多媒体特征的数据。例如，多媒体资源可以包含表征多媒体内容标签的数据、表征多媒体内容发布者的数据、表征多媒体内容热度的数据等。

S102：获取待训练推荐模型。

其中，待训练推荐模型可以用于向用户推荐多媒体资源。例如，通过向待训练推荐模型输入用户数据和多媒体资源，可以得出推荐概率，从而根据推荐概率是否大于预设概率阈值确定是否向所输入的用户数据对应的用户，推荐所输入的多媒体资源。

在输出的推荐概率大于预设概率阈值的情况下，可以向所输入的用户数据对应的用户，推荐所输入的多媒体资源。否则，确定不会向所输入的用户数据对应的用户，推荐所输入的多媒体资源。

待训练推荐模型可以包括嵌入层和特征输入层；嵌入层的输出与特征输入层的输入之间可以存在第一级联关系集合；第一级联关系集合中可以包括一个或多个第一级联关系。

第一级联关系集合中任一第一级联关系可以用于将嵌入层输出的至少2个特征级联至单个特征交叉单元的输入，并将该特征交叉单元的输出级联至特征输入层的输入；特征交叉单元的输入可以是嵌入层输出特征中的至少2个特征，特征交叉单元的输出可以是所输入的至少2个特征的交叉特征。

S103：将用户数据和对应的多媒体资源输入待训练推荐模型，得到预测推荐结果；根据预测推荐结果和推荐标注结果，确定损失信息；基于损失信息训练待训练推荐模型。

针对S102中获取待训练推荐模型，可选地，可以由业务平台构造一个新的推荐模型，作为待训练推荐模型；也可以获取业务平台当前部署的推荐模型副本进行迭代优化，将迭代后的推荐模型作为待训练推荐模型。

可选地，针对推荐模型副本进行迭代优化，可以引入交叉特征，或者在已经存在交叉特征的情况下，根据需求更新交叉特征，以提高推荐效果。其中，交叉特征具体可以是根据第一级联关系集合确定的。

在一种可选的实施例中，获取待训练推荐模型，可以包括以下步骤。

具体可以获取业务平台当前部署的推荐模型副本作为旧推荐模型；旧推荐模型可以包括嵌入层和特征输入层。

在旧推荐模型的嵌入层的输出与特征输入层的输入之间存在第一级联关系集合的情况下，可以更新旧推荐模型的第一级联关系集合，得到待训练推荐模型。

在旧推荐模型的嵌入层的输出与特征输入层的输入之间不存在第一级联关系集合的情况下，创建第一级联关系集合，得到待训练推荐模型。

其中，为了避免影响原本业务平台推荐业务的执行，上述方法流程在迭代推荐模型时，可以获取业务平台当前部署的推荐模型的拷贝或副本进行迭代，使得业务平台当前部署的推荐模型本身可以继续执行推荐业务。

本实施例中，由于是在旧推荐模型所学习到的参数基础上进行迭代优化和训练，得到新推荐模型，而旧推荐模型本身已经趋于收敛，因此，迭代前后的旧推荐模型的推荐效果相同或相差较小，再针对迭代后的旧推荐模型训练得到新推荐模型，即使利用较少的训练数据也容易使得新推荐模型的效果优于旧推荐模型，从而替换旧推荐模型。

因此，本实施例通过在业务平台当前部署的推荐模型的基础上进行迭代优化和训练，即使使用较少的训练数据也能够在业务平台当前部署的推荐模型的基础上提高推荐效果，并且，由于当前部署的推荐模型通常是接近收敛的，也可以加快推荐模型的训练速度，更快地接近收敛，从而可以提高推荐模型训练和迭代的速度，并且减轻数据存储的压力。

下面针对第一级联关系集合进行解释。

其中，第一级联关系可以通过特征交叉单元，针对嵌入层输出的至少2个特征进行特征交叉，并将得到的交叉特征输出到特征输入层，作为扩展的特征表示维度，进行后续的处理。

而针对特征交叉单元，可以用于将输入的至少2个特征交叉，得到所输入的至少2个特征的交叉特征。

在一种可选的实施例中，特征交叉单元具体可以用于计算输入的至少2个特征的笛卡尔积。

在另一种可选的实施例中，可以采用co-action network的技术方案。特征交叉单元可以包括多层感知器。多层感知器可以用于：针对待交叉的至少2个特征，将其中1个特征作为输入，将其他特征作为多层感知器的参数，计算得到待交叉的至少2个特征的交叉特征。多层感知器计算得到的交叉特征可以作为特征交叉单元的输出。

由于特征交叉单元中待交叉的特征是嵌入层的输出特征，因此，特征的维数较小，可以节约存储资源和计算资源，提高计算交叉特征的效率。

例如，当多媒体推荐模型具体用于推荐视频时，特征交叉单元需要交叉的特征可以包含视频特征。视频特征原本可以包含几百维，经过嵌入层降维后，可以得到包含几十维的视频特征。特征交叉单元可以针对几十维的视频特征进行计算。

可选地，多层感知器的参数可以包括每层节点的权重矩阵和偏置矩阵。具体可以将1个特征的各个维度组合成权重矩阵和偏置矩阵，用于多层感知器的计算。

为了便于理解，如图2所示，图2是根据一示例性实施例示出的一种多层感知器的原理图。

图2中待交叉的2个特征分别为特征一(i1，i2)和特征二(j1，j2，...，j6)，可以将特征一作为多层感知器的输入，将特征二作为多层感知器的参数。

具体可以是将特征二的各个维度重新组合成2个矩阵，分别是权重矩阵{j1，j2；j3，j4}和偏置矩阵{j5，j6}。多层感知器的输出就可以是(i1*j1+i2*j2+j5，i1*j3+i2*j4+j6)。

可选地，为了提高多层感知器的交叉效果，同时尽量避免增加内存占用，可以实时针对嵌入层的输出特征扩展维度。具体可以在得到多层感知器输出的交叉特征后释放扩展维度后的特征，并不需要存储到存储空间中。

其中，多层感知器对于特征维度存在需求，例如，作为参数的特征维度需要足够组合成矩阵；或者基于co-action network技术方案的需求，需要扩展出较多维度。因此，可以根据多层感知器的需求针对嵌入层的输出扩展维度。

在一种可选的实施例中，特征交叉单元还可以包括维度扩展层；维度扩展层可以用于输出维度固定的特征，且所述维度扩展层输入特征数量与输出特征数量相同。

特征交叉单元可以用于：将输入的至少2个特征输入维度扩展层，并将维度扩展层输出的至少2个特征作为待交叉的至少2个特征，由多层感知器计算得到交叉特征。

更为具体地，维度扩展层可以具体是输出维度较大的线性层，可以将维度较小的输入特征变换为维度较大的特征。

例如，维度扩展层可以是输入维度为8，输出维度为100的线性层。在初始化时，维度扩展层可以在输出的100维特征中保留8维特征为输入特征，其他92维特征为0。当然，在后续训练推荐模型时，可以更新维度扩展层的参数。

在本实施例中，特征交叉单元可以利用维度扩展层，满足扩展特征维度进行特征交叉的需求，同时，由于实时扩展维度后的特征可以直接用于特征交叉，无需先存储扩展维度后的特征，再从存储空间中查询扩展维度后的特征，提高了特征交叉的效率，节约了存储资源。

并且在得到交叉特征后，实施扩展维度的特征可以直接释放或者删除，可以进一步节约存储资源。

可选地，为了避免交叉特征的引入对嵌入层的独立特征的表示学习造成影响，还可以通过为第一级联关系设置模型参数更新的缓冲，使得在后续训练推荐模型时，从第一级联关系反向传递的梯度可以被设置的缓冲减小，从而减小交叉特征对嵌入层的参数的影响。

在一种可选的实施例中，特征交叉单元还可以包括缓冲层。缓冲层可以用于减小模型训练时反向传递的梯度。

可选地，缓冲层的输入和输出的维度可以相同。缓冲层具体可以是输入输出维度相同的线性层，在初始化时，可以使得初始化后的缓冲层的输入输出保持一致。当然，在后续训练推荐模型时，可以更新缓冲层的参数。

特征交叉单元可以用于：将输入的至少2个特征输入缓冲层，并将缓冲层输出的至少2个特征作为待交叉的至少2个特征，由多层感知器计算得到交叉特征。

可选地，基于上述2个实施例中解释的维度扩展层和缓冲层，特征交叉单元可以同时包括维度扩展层和缓冲层，具体可以用于将输入的至少2个特征输入缓冲层，并将缓冲层输出的至少2个特征输入到维度扩展层中，将维度扩展层输出的至少2个特征作为待交叉的至少2个特征，由多层感知器计算得到交叉特征。

或者，特征交叉单元可以用于：将输入的至少2个特征输入维度扩展层，并将维度扩展层输出的至少2个特征输入到缓冲层，将缓冲层输出的至少2个特征作为待交叉的至少2个特征，由多层感知器计算得到交叉特征。

由于在基于旧推荐模型获取待训练推荐模型时，需要针对旧推荐模型进行迭代优化。具体可以是迭代优化旧推荐模型中的第一级联关系集合。

可选地，在旧推荐模型的嵌入层的输出与特征输入层的输入之间存在第一级联关系集合的情况下，更新旧推荐模型的第一级联关系集合，可以包括：在旧推荐模型的第一级联关系集合中新增一个或多个第一级联关系；和/或在旧推荐模型的第一级联关系集合中修改一个或多个第一级联关系；和/或在旧推荐模型的第一级联关系集合中删除一个或多个第一级联关系。

由于第一级联关系集合反映了交叉特征的特征组合，因此，针对第一级联关系集合的更新可以视为针对推荐模型中交叉特征组合的迭代。

而根据需求调整交叉特征的组合，例如，将与推荐标注结果关系较小的交叉特征删除，可以节约计算资源；针对业务上出现的新的特征组合，认为这一新的特征组合与推荐标注结果关系较强，可以新增这一新的特征组合进行特征交叉，以便于提高推荐效果。

在本公开推荐多媒体资源的场景中，推荐模型的输入通常包括用户数据和多媒体资源。其中用户数据中的不同用户特征可以进行特征交叉，多媒体资源中的不同多媒体特征可以进行特征交叉，用户数据中的用户特征也可以与多媒体资源中的多媒体特征进行特征交叉。

例如，用户数据中的年龄特征和性别特征可以进行特征交叉；多媒体资源中的内容标签特征和发布者特征可以进行特征交叉；用户数据中的职业特征和多媒体资源中的内容标签特征可以进行特征交叉。

因此，更新第一级联关系集合可以优化推荐模型中的交叉特征，以便于更准确地确定出与推荐标注结果关系较大的交叉特征的特征组合，从而提高推荐模型的推荐效果。

可选地，修改第一级联关系，可以是修改第一级联关系中所输入的嵌入层输出特征，具体可以是新增、删除或者替换所输入的嵌入层输出特征；也可以是修改第一级联关系中的特征交叉单元，具体可以是调整特征交叉单元中的参数。

可选地，在旧推荐模型的嵌入层的输出与特征输入层的输入之间不存在第一级联关系集合的情况下，创建旧推荐模型的第一级联关系集合，具体可以是根据需求，新增一个或多个第一级联关系作为所创建的第一级联关系集合。

为了使得迭代后的旧推荐模型在后续训练时尽快收敛，在一种可选的实施例中，在旧推荐模型的基础上更新或者创建第一级联关系集合之后，还可以调整所得到的待训练推荐模型的参数，使得旧推荐模型和调整参数后的待训练推荐模型在输入相同的情况下，输出也相同。

因此，迭代前后的旧推荐模型在推荐效果上也相同。进一步地，可以基于较少的训练数据训练迭代后的旧推荐模型，得到更优的推荐效果。此外，由于迭代前的旧推荐模型已经收敛，因此，迭代后的旧推荐模型也接近收敛，可以通过较少次训练达到收敛，提高了推荐模型的训练效率。

对应于S101中的第一级联关系集合，在一种可选的实施例中，由于推荐模型也需要利用独立的特征进行训练，因此，嵌入层的输出与特征输入层的输入之间还可以存在第二级联关系集合；第二级联关系集合中任一第二级联关系可以用于将嵌入层的1个输出级联至特征输入层的输入。

在本实施例中，可以通过第二级联关系集合，进一步增加推荐模型中的特征表示的维度，提高推荐模型的推荐效果。

可选地，第二级联关系集合可以用于将嵌入层的每个输出级联至特征输入层的输入。

可选地，在上述第一级联关系的解释中，由于交叉特征可能影响独立特征正常的表示学习，从而设置了针对反向传递的梯度的缓冲。而从第二级联关系反向传递的梯度属于独立特征正常的表示学习，可以不设置针对反向传递的梯度的缓冲。

为了便于理解，如图3所示，图3是根据一示例性实施例示出的一种推荐模型的结构图。其中包括嵌入层和dense层，dense层中包括特征输入层。

嵌入层存在4个输出特征，分别为特征1-4。嵌入层与特征输入层之间存在2个第一级联关系和4个第二级联关系。

其中，2个第一级联关系分别用于交叉特征1和特征2、以及用于交叉特征3和特征4，分别包括特征交叉单元1和特征交叉单元2。而4个第二级联关系分别用于将特征1-4级联至特征输入层的输入。

特征输入层存在6个输入。

需要注意的是，可选地，特征输入层的输入维度可以随着第一级联关系集合或第二级联关系集合的变化而变化。例如，当新增一个第一级联关系后，特征输入层可以扩展相应的输入维度，使得新增的第一级联关系可以级联至扩展的输入维度，具体可以是新增的第一级联关系中，特征交叉单元输出10维的交叉特征，则特征输入层可以扩展10维用于输入该交叉特征；当删除一个第一级联关系后，特征输入层可以删除相应的输入维度。

针对S103中的训练，在一种可选的实施例中，训练数据可以包括历史训练数据。历史训练数据可以包括训练过旧推荐模型的训练数据。

由于修改前的旧推荐模型已经利用历史训练数据集训练过，因此，历史训练数据集对于嵌入层的特征表示学习作用较小。为了避免嵌入层学习到的特征表示被交叉特征影响，可以在保持嵌入层参数不变的情况下，基于历史训练数据训练待训练推荐模型。具体可以是只更新dense层和特征交叉单元中的参数。

因此，可选地，具体基于损失信息训练待训练推荐模型，可以包括：在保持待训练推荐模型的嵌入层参数不变的情况下，基于历史训练数据对应的损失信息训练待训练推荐模型。

可选地，历史训练数据对应的损失信息，可以是将历史训练数据中的用户数据和对应的多媒体资源输入待训练推荐模型，得到预测推荐结果，再根据所得到的预测推荐结果和历史训练数据中的推荐标注结果，确定的损失信息。

在一种可选的实施例中，待训练推荐模型的输出可以是布尔型数值，用于表征推荐或者不推荐，也可以是推荐概率，以便于后续根据预设概率阈值判断是否进行推荐。

在将训练数据中的用户数据和对应的多媒体资源输入待训练推荐模型后，可以输出预测推荐结果，进一步可以将预测推荐结果与推荐标注结果进行对比，确定损失信息。

可选地，在待训练推荐模型的输出是布尔型数值的情况下，确定的损失信息可以表征预测推荐结果与推荐标注结果相同或者不同。在待训练推荐模型的输出是推荐概率的情况下，确定的损失信息可以是预测推荐结果与推荐标注结果的差值。

针对训练后的待训练推荐模型，由于在业务上，需要利用训练后的待训练推荐模型开展推荐业务。因此，在一种可选的实施例中，可以在业务平台上直接部署训练后的待训练推荐模型。

而在业务平台上已经部署有多媒体推荐模型的情况下，可以判断能否利用训练后的待训练推荐模型替换业务平台当前部署的推荐模型。

具体可以是根据训练后的待训练推荐模型和业务平台当前部署的推荐模型之间推荐效果进行判断。本实施例并不限定具体确定推荐效果的方法。

可选地，可以利用AB测试，将部分真实用户数据和真实多媒体资源导向训练后的待训练推荐模型，将其他真实用户数据和真实多媒体资源导向当前部署的推荐模型，从而对比2个推荐模型的推荐效果。如果训练后的待训练推荐模型的推荐效果更优，则可以利用训练后的待训练推荐模型替换当前部署的推荐模型。

可选地，也可以使用测试数据集，分别测试训练后的待训练推荐模型和业务平台当前部署的推荐模型，从而对比2个推荐模型的推荐效果。如果训练后的待训练推荐模型的推荐效果更优，则可以利用训练后的待训练推荐模型替换当前部署的推荐模型。

因此，在一种可选的实施例中，在训练后的待训练推荐模型的推荐效果优于业务平台当前部署的推荐模型的情况下，可以利用训练后的待训练推荐模型替换业务平台当前部署的推荐模型，实现业务平台上部署的推荐模型的迭代优化，以便于提高业务平台的多媒体推荐业务的推荐效果，提高用户获取推荐的多媒体的体验。

上述方法流程通过在多媒体推荐模型中引入特征之间的交叉特征，利用交叉特征扩展特征表示的维度，可以更好地利用训练数据提高多媒体推荐模型的训练效果，从而提高多媒体推荐模型的推荐效果，提高用户获取推荐的多媒体资源的体验。

同时，还通过利用业务平台当前部署的推荐模型副本进行修改和训练，保留了当前部署的推荐模型的推荐效果，使得可以利用较少的训练数据训练出效果更好的推荐模型，从而可以方便利用训练后的待训练推荐模型替换旧推荐模型，加快模型训练和迭代的速度。同时，也不需要提前存储较多的历史训练数据，减轻了数据存储的压力。

在针对特征交叉进行改进时，利用嵌入层的输出进行特征交叉，提高特征交叉的计算速度，并节约了存储资源。

本公开还提供了对应的装置实施例如下。

图4是根据一示例性实施例示出的一种推荐模型训练装置框图。参照图4，该装置包括训练数据获取单元201、模型获取单元202和训练单元203。

训练数据获取单元201，被配置为执行：获取训练数据；所述训练数据包括用户数据和对应的多媒体资源，以及推荐标注结果。

模型获取单元202，被配置为执行：获取待训练推荐模型；所述待训练推荐模型用于向用户推荐多媒体资源；所述待训练推荐模型包括嵌入层和特征输入层；所述嵌入层的输出与所述特征输入层的输入之间存在第一级联关系集合；所述第一级联关系集合中包括一个或多个第一级联关系。

所述第一级联关系集合中任一第一级联关系用于将所述嵌入层输出的至少2个特征级联至单个特征交叉单元的输入，并将该特征交叉单元的输出级联至所述特征输入层的输入；所述特征交叉单元的输入为所述嵌入层输出特征中的至少2个特征，所述特征交叉单元的输出为所输入的至少2个特征的交叉特征。

训练单元203，被配置为执行：将所述用户数据和对应的多媒体资源输入所述待训练推荐模型，得到预测推荐结果；根据所述预测推荐结果和所述推荐标注结果，确定损失信息；基于所述损失信息训练所述待训练推荐模型。

可选地，所述模型获取单元202，包括：旧模型获取子单元202a，被配置为执行：获取业务平台当前部署的推荐模型副本作为旧推荐模型；所述旧推荐模型包括嵌入层和特征输入层。

模型更新子单元202b，被配置为执行：在所述旧推荐模型的嵌入层的输出与特征输入层的输入之间存在第一级联关系集合的情况下，更新所述旧推荐模型的第一级联关系集合，得到待训练推荐模型；在所述旧推荐模型的嵌入层的输出与特征输入层的输入之间不存在第一级联关系集合的情况下，创建第一级联关系集合，得到待训练推荐模型。

可选地，所述模型更新子单元202b，包括：集合更新子单元202b1，被配置为执行：在所述旧推荐模型的嵌入层的输出与特征输入层的输入之间存在第一级联关系集合的情况下，在所述旧推荐模型的第一级联关系集合中新增一个或多个第一级联关系；和/或在所述旧推荐模型的第一级联关系集合中修改一个或多个第一级联关系；和/或在所述旧推荐模型的第一级联关系集合中删除一个或多个第一级联关系。

可选地，所述模型更新子单元202b还包括：模型调整子单元202b2，被配置为执行：在得到待训练推荐模型之后，调整所得到的待训练推荐模型的参数，使得所述旧推荐模型和调整参数后的待训练推荐模型在输入相同的情况下，输出也相同。

可选地，所述训练数据包括历史训练数据，所述历史训练数据包括训练过所述旧推荐模型的训练数据；所述训练单元203包括：历史训练子单元203a，被配置为执行：在保持所述待训练推荐模型的嵌入层参数不变的情况下，基于所述历史训练数据对应的损失信息训练所述待训练推荐模型。

可选地，所述特征交叉单元包括多层感知器；所述多层感知器用于：针对待交叉的至少2个特征，将其中1个特征作为输入，将其他特征作为所述多层感知器的参数，计算得到所述待交叉的至少2个特征的交叉特征。

可选地，所述特征交叉单元还包括维度扩展层；所述维度扩展层输出维度固定的特征，且所述维度扩展层输入特征数量与输出特征数量相同；所述特征交叉单元用于：将输入的至少2个特征输入所述维度扩展层，并将所述维度扩展层输出的至少2个特征作为待交叉的至少2个特征，由所述多层感知器计算得到交叉特征。

可选地，所述特征交叉单元还包括缓冲层；所述缓冲层的输入和输出维度相同，且初始化后的缓冲层的输入输出保持一致；所述特征交叉单元用于：将输入的至少2个特征输入所述缓冲层，并将所述缓冲层输出的至少2个特征作为待交叉的2个特征，由所述多层感知器计算得到交叉特征。

可选地，所述嵌入层的输出与所述特征输入层的输入之间还存在第二级联关系集合；所述第二级联关系集合中任一第二级联关系用于将所述嵌入层的1个输出级联至所述特征输入层的输入。

可选地，所述推荐模型训练装置还包括：替换单元204，被配置为执行：在训练后的待训练推荐模型的推荐效果优于所述业务平台当前部署的推荐模型的情况下，利用训练后的待训练推荐模型替换所述业务平台当前部署的推荐模型。

关于上述实施例中的装置，其中各个单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

本公开的实施例还提出一种电子设备，包括：处理器；用于存储处理器可执行指令的存储器。

其中，处理器被配置为执行指令，以实现如上述任一实施例所述的一种推荐模型训练方法。

本公开的实施例还提出一种计算机可读存储介质，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行上述任一实施例所述的一种推荐模型训练方法。

本公开的实施例还提出一种计算机程序产品，包括计算机程序/指令，所述计算机程序/指令被处理器执行时实现上述任一实施例所述的一种推荐模型训练方法。

图5是根据本公开的实施例示出的一种电子设备的示意框图。参照图5，电子设备500可以包括以下一个或多个组件：处理组件502，存储器504，电源组件506，多媒体组件508，音频组件510，输入/输出(I/O)的接口512，传感器组件514，以及通信组件518。上述电子设备/服务器可以采用类似的硬件架构。

处理组件502通常控制电子设备500的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件502可以包括一个或多个处理器520来执行指令，以完成上述一种推荐模型训练方法的全部或部分步骤。此外，处理组件502可以包括一个或多个模块，便于处理组件502和其他组件之间的交互。例如，处理组件502可以包括多媒体模块，以方便多媒体组件508和处理组件502之间的交互。

存储器504被配置为存储各种类型的数据以支持在电子设备500的操作。这些数据的示例包括用于在电子设备500上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件506为电子设备500的各种组件提供电力。电源组件506可以包括电源管理系统，一个或多个电源，及其他与为电子设备500生成、管理和分配电力相关联的组件。

多媒体组件508包括在电子设备500和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件508包括一个前置摄像头和/或后置摄像头。当电子设备500处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的或具有焦距和光学变焦能力的光学透镜系统。

音频组件510被配置为输出和/或输入音频信号。例如，音频组件510包括一个麦克风(MIC)，当电子设备500处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器504或经由通信组件518发送。在一些实施例中，音频组件510还包括一个扬声器，用于输出音频信号。

I/O接口512为处理组件502和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件514包括一个或多个传感器，用于为电子设备500提供各个方面的状态评估。例如，传感器组件514可以检测到电子设备500的打开/关闭状态，组件的相对定位，例如所述组件为电子设备500的显示器和小键盘，传感器组件514还可以检测电子设备500或电子设备500一个组件的位置改变，用户与电子设备500接触的存在或不存在，电子设备500方位或加速/减速和电子设备500的温度变化。传感器组件514可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件514还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件514还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件518被配置为便于电子设备500和其他设备之间有线或无线方式的通信。电子设备500可以接入基于通信标准的无线网络，如WiFi，运营商网络(如2G、3G、4G或5G)，或它们的组合。在一个示例性实施例中，通信组件518经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件518还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在本公开一实施例中，电子设备500可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述一种推荐模型训练方法。

在本公开一实施例中，还提供了一种包括指令的计算机可读存储介质，例如包括指令的存储器504，上述指令可由电子设备500的处理器520执行以完成上述一种推荐模型训练方法。例如，所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本领域技术人员在考虑说明书及实践这里公开的公开后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

需要说明的是，在本公开中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本公开实施例所提供的方法和装置进行了详细介绍，本文中应用了具体个例对本公开的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本公开的方法及其核心思想；同时，对于本领域的一般技术人员，依据本公开的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本公开的限制。

Claims

1.一种推荐模型训练方法，其特征在于，包括：

基于所述损失信息训练所述待训练推荐模型。

2.根据权利要求1所述的方法，其特征在于，所述获取待训练推荐模型，包括：

3.根据权利要求2所述的方法，其特征在于，所述更新所述旧推荐模型的第一级联关系集合，包括：

和/或

4.根据权利要求2所述的方法，其特征在于，在得到待训练推荐模型之后，所述方法还包括：

5.根据权利要求1所述的方法，其特征在于，所述特征交叉单元包括多层感知器；

6.根据权利要求1所述的方法，其特征在于，还包括：

7.一种推荐模型训练装置，其特征在于，包括：

8.一种电子设备，其特征在于，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如权利要求1至6中任一项所述的一种推荐模型训练方法。

9.一种计算机可读存储介质，其特征在于，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如权利要求1至6中任一项所述的一种推荐模型训练方法。

10.一种计算机程序产品，包括计算机程序/指令，其特征在于，所述计算机程序/指令被处理器执行时实现如权利要求1至6中任一项所述的一种推荐模型训练方法。