CN114637926A

CN114637926A - 内容推荐方法、装置、电子设备及存储介质

Info

Publication number: CN114637926A
Application number: CN202210327284.XA
Authority: CN
Inventors: 王晓伟; 杨森
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2022-03-30
Filing date: 2022-03-30
Publication date: 2022-06-17

Abstract

本公开关于一种内容推荐方法、装置、电子设备及存储介质，包括：获取候选内容的内容特征、用户账户的用户账户特征和与用户账户特征对应的第一预测结果，第一预测结果包括用户账户对候选内容执行每种预设操作的第一预测概率；从多个预先训练的簇变换网络中确定出与用户账户特征最匹配的目标簇变换网络，并利用目标簇变换网络从第一预测结果中提取出目标中间特征；将目标中间特征和内容特征，输入预先训练的预测网络中，预测网络用于输出第二预测结果，根据第二预测结果，从候选内容中确定出用户账户对应的推荐内容。本公开可以使得预测模型中的部分参数能够满足小样本用户的推荐需求，有效提升预测模型的鲁棒性。

Description

内容推荐方法、装置、电子设备及存储介质

技术领域

本公开涉及深度学习技术领域，尤其涉及一种内容推荐方法、装置、电子设备及存储介质。

背景技术

目前，推荐系统通过顺序执行召回、粗排、精排、排序、重排等多个环节，完成内容推荐任务。通常，在每个环节都是根据内容和用户账户的行为习惯，预测用户账户对内容执行某种操作的概率，如对内容执行点赞操作和评论操作的概率，再根据用户账户对内容执行某种操作的概率向用户账户推荐内容。其中，前述内容可以是音乐、短视频、图文等。

相关技术中，推荐系统通过训练好的预测模型完成上述预测过程。根据二八定律可知，预测模型的大多数训练数据往往来源于少量的用户账户数据。这就意味着，预测模型仅能学习到小部分用户账户的行为偏好，而忽略大部分用户账户(即小样本用户)的行为偏好。这样，将导致推荐系统无法满足小样本用户的推荐需求，鲁棒性较差。

发明内容

本公开提供一种内容推荐方法、装置、电子设备及存储介质，可以使得预测模型满足小样本用户的推荐需求，提升预测模型的鲁棒性。

本公开实施例的技术方案如下：

根据本公开实施例的第一方面，提供一种内容推荐方法，包括：获取候选内容的内容特征、用户账户的用户账户特征和与用户账户特征对应的第一预测结果，第一预测结果包括用户账户对候选内容执行每种预设操作的第一预测概率；从多个预先训练的簇变换网络中确定出与用户账户特征最匹配的目标簇变换网络，并利用目标簇变换网络从第一预测结果中提取出目标中间特征；将目标中间特征和内容特征，输入预先训练的预测网络中，预测网络用于输出第二预测结果，第二预测结果包括用户账户对候选内容执行每种预设操作的第二预测概率；根据第二预测结果，从候选内容中确定出用户账户对应的推荐内容。

可选的，从多个预先训练的簇变换网络中确定出与用户账户特征最匹配的目标簇变换网络，并利用目标簇变换网络从第一预测结果中提取出目标中间特征，包括：

确定用户账户特征与每个簇变换网络对应的簇向量之间的相似度，簇变换网络对应的簇向量为簇变换网络的向量表示；

将与用户账户特征相似度最大的簇向量对应的簇变换网络，作为与用户账户特征最匹配的目标簇变换网络；

将第一预测结果输入目标簇变换网络，获得输出的目标中间特征。

分别将第一预测结果输入到多个并列的簇变换网络中，得到每个簇变换网络输出的中间特征；

将与用户账户特征相似度最大的簇向量对应的簇变换网络作为与用户账户特征最匹配的目标簇变换网络，将目标簇变换网络输出的中间特征作为目标中间特征。

可选的，确定用户账户特征与每个簇变换网络对应的簇向量之间的相似度，包括：

根据用户账户特征生成对应的用户账户特征向量；

确定用户账户特征向量与每个簇变换网络对应的簇向量之间的相似度。

可选的，预测模型还包括转换网络，多个预先训练的簇变换网络均与转换网络连接，从多个预先训练的簇变换网络中确定出与用户账户特征最匹配的目标簇变换网络之前，还包括：

将单位向量分别输入到多个簇变换网络中，以使簇变换网络输出用于表示簇变换网络的数值特征；

将每个数值特征输入到转换网络中，得到每个数值特征对应的簇向量。

根据本公开实施例的第二方面，提供一种应用于内容推荐系统的预测模型的训练方法。预测模型包括多个簇变换网络和预测网络，方法包括：获取样本特征、样本特征对应的标签信息及第一预测结果，样本特征包括内容的内容特征和用户账户的用户账户特征，标签信息表征用户账户是否对内容执行过预设操作，第一预测结果包括用户账户对内容执行每种预设操作的第一预测概率；从多个簇变换网络中确定出与用户账户特征最匹配的目标簇变换网络，并利用目标簇变换网络从第一预测结果中提取出目标中间特征；将内容的内容特征和目标中间特征输入到预测网络，获得预测网络输出的第二预测结果，第二预测结果包括用户账户对内容执行每种预设操作的第二预测概率；根据第二预测概率和标签信息对预测网络和多个簇变换网络进行训练。

可选的，推荐模型还包括转换网络，多个簇变换网络均与转换网络连接，转换网络用于对每个簇变换网络对应的数值特征进行处理，以得到每个簇变换网络对应的簇向量，簇变换网络对应的簇向量为簇变换网络的向量表示；与用户账户特征最匹配的目标簇变换网络为对应簇向量与用户账户特征的相似度最大的簇变换网络。

可选的，根据第二预测概率和标签信息对预测网络和多个簇变换网络进行训练，包括：根据第二预测概率、标签信息和第一损失函数，确定第一损失值，第一损失函数为交叉熵函数；通过第一损失值对预测网络、多个簇变换网络及转换网络进行更新。

可选的，该方法还包括：确定任意两个簇变换网络对应的簇向量之间的相似度；根据确定的所有相似度中的最大值和第二损失函数确定第二损失值，第二损失函数为正则函数；根据第二损失值对转换网络进行更新。

根据本公开实施例的第三方面，提供一种内容推荐装置。该装置可以包括：特征获取单元，被配置为执行获取候选内容的内容特征、用户账户的用户账户特征和与用户账户特征对应的第一预测结果，第一预测结果包括用户账户对候选内容执行每种预设操作的第一预测概率；特征提取单元，被配置为执行从多个预先训练的簇变换网络中确定出与用户账户特征最匹配的目标簇变换网络，并利用目标簇变换网络从第一预测结果中提取出目标中间特征；结果预测单元，被配置为执行将目标中间特征和内容特征，输入预先训练的预测网络中，预测网络用于输出第二预测结果，第二预测结果包括用户账户对候选内容执行每种预设操作的第二预测概率；内容确定单元，被配置为执行根据第二预测结果，从候选内容中确定出用户账户对应的推荐内容。

可选的，特征提取单元，具体被配置为执行：确定用户账户特征与每个簇变换网络对应的簇向量之间的相似度，簇变换网络对应的簇向量为簇变换网络的向量表示；将与用户账户特征相似度最大的簇向量对应的簇变换网络，作为与用户账户特征最匹配的目标簇变换网络；将第一预测结果输入目标簇变换网络，获得输出的目标中间特征。

可选的，特征提取单元，具体被配置为执行：分别将第一预测结果输入到多个并列的簇变换网络中，得到每个簇变换网络输出的中间特征；确定用户账户特征与每个簇变换网络对应的簇向量之间的相似度，簇变换网络对应的簇向量为簇变换网络的向量表示；将与用户账户特征相似度最大的簇向量对应的簇变换网络作为与用户账户特征最匹配的目标簇变换网络，将目标簇变换网络输出的中间特征作为目标中间特征。

可选的，特征提取单元，具体被配置为执行：根据用户账户特征生成对应的用户账户特征向量；确定用户账户特征向量与每个簇变换网络对应的簇向量之间的相似度。

可选的，预测模型还包括转换网络，多个预先训练的簇变换网络均与转换网络连接，装置还包括：簇向量生成单元，被配置为执行将单位向量分别输入到多个簇变换网络中，以使簇变换网络输出用于表示簇变换网络的数值特征；将每个数值特征输入到转换网络中，得到每个数值特征对应的簇向量。

根据本公开实施例的第四方面，提供一种应用于内容推荐系统的预测模型的训练装置，预测模型包括多个簇变换网络和预测网络，装置包括：特征获取单元，被配置为执行获取样本特征、样本特征对应的标签信息及第一预测结果，样本特征包括内容的内容特征和用户账户的用户账户特征，标签信息表征用户账户是否对内容执行过预设操作，第一预测结果包括用户账户对内容执行每种预设操作的第一预测概率；特征提取单元，被配置为执行从多个簇变换网络中确定出与用户账户特征最匹配的目标簇变换网络，并利用目标簇变换网络从第一预测结果中提取出目标中间特征；结果预测单元，被配置为执行将内容的内容特征和目标中间特征输入到预测网络，获得预测网络输出的第二预测结果，第二预测结果包括用户账户对内容执行每种预设操作的第二预测概率；模型训练单元，被配置为执行根据第二预测概率和标签信息对预测网络和多个簇变换网络进行训练。

可选的，模型训练单元，具体被配置为执行：根据第二预测概率、标签信息和第一损失函数，确定第一损失值，第一损失函数为交叉熵函数；通过第一损失值对预测网络、多个簇变换网络及转换网络进行更新。

可选的，模型训练单元，还被配置为执行：确定任意两个簇变换网络对应的簇向量之间的相似度；根据确定的所有相似度中的最大值和第二损失函数确定第二损失值，第二损失函数为正则函数；根据第二损失值对转换网络进行更新。

根据本公开实施例的第五方面，提供一种电子设备，可以包括：处理器和用于存储处理器可执行指令的存储器；其中，处理器被配置为执行指令，以实现上述第一方面中任一种可选地内容推荐方法或上述第二方面中的预测模型的训练方法。

根据本公开实施例的第六方面，提供一种计算机可读存储介质，计算机可读存储介质上存储有指令，当计算机可读存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行上述第一方面中任一种可选地内容推荐方法或上述第二方面中的预测模型的训练方法。

根据本公开实施例的第七方面，提供一种计算机程序产品，该计算机程序产品包括计算机指令，当计算机指令在电子设备上运行时，使得电子设备执行如第一方面中任一种可选地实现方式的内容推荐方法或上述第二方面中的预测模型的训练方法。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

本公开的实施例提供的技术方案至少带来以下有益效果：

基于上述任一方面，本公开中，获取候选内容的内容特征、用户账户的用户账户特征和与用户账户特征对应的第一预测结果，第一预测结果包括用户账户对候选内容执行每种预设操作的第一预测概率；从多个预先训练的簇变换网络中确定出与用户账户特征最匹配的目标簇变换网络，并利用目标簇变换网络从第一预测结果中提取出目标中间特征；将目标中间特征和内容特征，输入预先训练的预测网络中，预测网络用于输出第二预测结果，第二预测结果包括用户账户对候选内容执行每种预设操作的第二预测概率；根据第二预测结果，从候选内容中确定出用户账户对应的推荐内容。

通过根据用户特征和多个簇向量，确定当前用户所属的簇变换网络。对当前用户账户的第一预测结果通过簇变换网络进行变换，得到对应的目标中间特征，通过目标中间特征和内容特征对预测模型进行训练，得到预测模型，通过将用户分配给不同的簇，并根据与每一用户相匹配的簇对应的参数分别进行训练，使得预测模型中的部分参数能够满足小样本用户的推荐需求，有效提升预测模型的鲁棒性。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1示出了本公开实施例提供的一种推荐系统的结构示意图；

图2示出了本公开实施例提供的一种模型架构的结构示意图；

图3示出了本公开实施例提供的一种预测模型训练方法的流程示意图；

图4示出了本公开实施例提供的又一种预测模型训练方法的流程示意图；

图5示出了本公开实施例提供的又一种模型架构的结构示意图；

图6示出了本公开实施例提供的又一种预测模型训练方法的流程示意图；

图7示出了本公开实施例提供的又一种模型架构的结构示意图；

图8示出了本公开实施例提供的一种内容推荐方法的流程示意图；

图9示出了本公开实施例提供的一种内容推荐装置的结构示意图；

图10示出了本公开实施例提供的一种预测模型训练装置的结构示意图；

图11示出了本公开实施例提供的一种电子设备的结构示意图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

另外，在本公开实施例的描述中，除非另有说明，“/”表示或的意思，例如，A/B可以表示A或B；本文中的“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，在本公开实施例的描述中，“多个”是指两个或多于两个。

还应当理解的是，术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其他特征、整体、步骤、操作、元素和/或组件的存在或添加。

本公开所涉及的数据可以为经用户授权或者经过各方充分授权的数据。

同时，由于我们无法探查其内部，无法对预测结果进行合理解释，无法确保推荐内容满足用户偏好，影响用户的使用体验。

例如，在一些的实际场景(如快手应用)中，用户行为往往会存在一些固定行为模式，例如：有些用户观看多媒体资源时，偏好多次反复观看，有些用户偏好对多媒体资源进行点赞、评论、转发等互动操作。这些具有相同行为模式的用户可以自然地形成一个簇(原型)，通过原型学习，可以构建多个簇变换网络，将一个用于全体用户的模型，改进为对于不同簇变换网络对应的簇，分别对应有不同参数的模型。这样可以保证：即使对于只有少量用户的簇，也有针对他们的参数，缓解小样本问题。当将模型用于线上预测时，用户可能会变，但是行为模式会较为固定，能够有效提高模型的鲁棒性；同时，由于不同簇有对应的行为模式，也会相应向用户推荐更多符合该行为模式的内容，使得结果具有一定的可解释性。

基于此，本申请实施例提供了一种内容推荐方法，包括：获取候选内容的内容特征、用户账户的用户账户特征和与用户账户特征对应的第一预测结果，第一预测结果包括用户账户对候选内容执行每种预设操作的第一预测概率；从多个预先训练的簇变换网络中确定出与用户账户特征最匹配的目标簇变换网络，并利用目标簇变换网络从第一预测结果中提取出目标中间特征；将目标中间特征和内容特征，输入预先训练的预测网络中，预测网络用于输出第二预测结果，根据第二预测结果，从候选内容中确定出用户账户对应的推荐内容。本公开可以使得预测模型中的部分参数能够满足小样本用户的推荐需求，有效提升预测模型的鲁棒性。

以下对本公开实施例提供的预测模型训练方法的应用场景进行示例性说明：

参考图1，其示出本公开实施例提供的一种推荐系统的结构示意图。如图1所示，该推荐系统可以包括服务器101和多个终端设备(如终端设备102a、终端设备102b、终端设备102c和终端设备102d)，多个终端设备具体可以通过有线网络或者无线网络与服务器101连接。

示例性的，本公开实施例中的终端设备可以是手机、平板电脑、桌面型、膝上型、手持计算机、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer，UMPC)、上网本，以及蜂窝电话、个人数字助理(personal digital assistant，PDA)、增强现实(augmented reality，AR)\虚拟现实(virtual reality，VR)设备等可以安装即时通讯应用，并使用即时通讯应用通信的设备，本公开实施例对该电子设备的具体形态不做特殊限制。

其中，服务器101可以是用于向用户推荐内容(如图像、视频、文字、业务等)的服务器。服务器101可以利用本公开所提供的技术方案，训练预测模型，并根据预测模型确定向各用户推荐的内容，然后通过有线或者无线的方式发送至多个终端设备中该用户所使用的终端设备。

在一些实施例中，推荐系统中包括如图2所示的模型架构210。如图2所示，该模型架构210中包括多个簇变换网络201、第一神经网络202、第二神经网络203、预测模型204。

上述模型架构210的输入包括三部分，分别为用户账户行为特征、内容特征和预先确定的与用户账户行为特征对应的第一预测结果。其中，第一预测结果可以是推荐系统的精排模型的输出结果，精排模型的输入至少包括前述用户账户行为特征和内容特征，通过精排模型对输入的用户账户行为特征和内容特征进行处理，输出多个内容对应的预估分数。再对该预估分数进行处理得到第一预测结果。对预估分数的处理包括非线性变换、分数交叉、数组连接等。

上述第一预测结果包括该用户账户对内容执行每种预设操作的第一预测概率。示例的，用户账户行为特征用于表征对应的性质特征，“性质特征”具体指用户的某一类性质的特征。例如：性质特征可以为用户的历史使用习惯的特征；性质特征也可以为观看内容的平均时长的特征，等等。例如，某用户账户的用户账户行为特征：[30,20,8,57]，其中，第一项是用户的年龄(30岁)，第二项是用户观看视频后进行转发的比例为(20％)，第三项可以是用户感兴趣的内容类型(假设8代表足球运动类，则说明用户对足球运动类内容感兴趣)，第四项为用户观看视频后进行点赞的比例为(57％)。内容特征可以是多媒体资源的标识或时长等，当推荐的内容为多媒体资源时，预设操作可以是对多媒体资源的有效播放、长播、完播、点赞、评论、分享等。

上述模型架构210，每个簇变换网络201分别具有不同的预设规则，用于根据预设规则将输入的预设向量转换成对应的数值特征，第一神经网络202用于将数值特征转换为簇向量，簇向量为其对应的簇变换网络的向量表示。可选地，预设向量可以为单位向量。

上述模型架构210，每个簇变换网络201的输入为上述第一预测结果，用于根据输入的第一预测结果输出对应的中间特征，该中间特征由用户账户行为特征根据不同簇变换网络对应的预设变换规则确定。具体的，预设变换规则可以有多种，例如：预设变换规则可以为取log变换、sigmoid变换、tanh变换等。

第二神经网络203的输入为用户账户行为特征，用于将用户账户行为特征转化为对应的用户账户特征向量。

进而，通过比较用户账户特征向量与每个簇向量对应的相似度，确定该用户账户相匹配的簇变换网络，通过将该簇变换网络对应的中间特征和待推荐内容特征输入预测模型204，输出第二预测结果。第二预测结果包括用户账户对内容执行每种预设操作的第二预测概率。

基于上述模型架构210，对本公开实施例提供的预测模型训练方法的具体实现方式进行介绍。

在一些实施例中，本公开提供的预测模型训练方法的执行主体可以为预测模型的训练装置或内容推荐装置。内容推荐装置可以是服务器或者电子设备，此处不予限制。例如，内容推荐装置可以上述服务器101。当该方法应用于内容推荐装置的情况下，如图3所示，该预测模型训练方法可以包括以下步骤S301-S304：

S301、获取样本特征、样本特征对应的标签信息及第一预测结果，样本特征包括内容的内容特征和用户账户的用户账户特征，标签信息表征用户账户是否对内容执行过预设操作，第一预测结果包括用户账户对内容执行每种预设操作的第一预测概率。

其中，用户账户行为特征可以包括用户账户标识、等级、用户账户最近观看的内容有关的特征(如内容标识、内容时长)以及用户账户对其观看的内容所执行的操作数据。

内容特征可以是内容的标识、时长等，当内容为多媒体资源时，内容则为多媒体资源的标识、时长等。需要说明的是，这里的内容特征的标签是已知的，该标签即为训练的目标。训练预测模型时，通过比较预测模型的输出结果与输入的内容特征的标签的差异性，来更新预测模型内部的参数。

上述第一预测结果为根据用户账户行为特征和某些内容特征输入推荐系统中的精排模型得到的，第一预测结果包括：用户账户对输入的内容特征所对应内容，执行每种预设操作的第一预测概率。例如，当前述内容为多媒体资源时，预设操作可以为有效播放、长播、完播、点赞、评论、分享等，当预设操作点赞对应的预测概率为60％时，说明该用户账户点对前述内容执行点赞操作的概率是60％。

需要说明的是，上述输入到精排模型中的“某些内容特征”可以是S301中获取的内容特征，也可以是其他内容的特征。

S302、从多个簇变换网络中确定出与用户账户特征最匹配的目标簇变换网络，并利用目标簇变换网络从第一预测结果中提取出目标中间特征。

根据用户账户行为特征与多个簇向量之间的相似度，从预先构建的多个簇变换网络中确定出与用户账户行为特征相匹配的目标簇变换网络，和，利用目标簇变换网络从第一预测结果中提取出的目标中间特征，该多个簇向量分别为该多个簇变换网络的向量表示。

如图4所示，上述S302中，根据用户账户特征向量与预先构建的多个簇变换网络对应的簇向量之间的相似度，确定与用户账户行为特征相匹配的目标簇变换网络，和，利用目标簇变换网络从第一预测结果中提取出的目标中间特征，具体包括：

S401、根据用户账户行为特征确定对应的用户账户特征向量，并确定用户账户特征向量与每个簇向量之间的相似度。

具体的，通过余弦相似度或者相对熵(KL散度)衡量用户账户特征向量与每个簇向量的相似度，并以此为依据进行采样操作，确定与用户账户特征向量相匹配的簇变换网络。其中，采样操作通过gumbel softmax采样方法实现，由于采样操作不可导，这里通过使用gumbel softmax采样方法，可以通过控制温度参数，模拟离散采样，使得采样操作连续可导。

在一些实施例中，每个用户账户只匹配一个簇变换网络，保证行为习惯类型较为特殊或数量较少的用户账户，也能分配到与该用户账户相匹配的一个簇变换网络进行学习，防止所有簇变换网络都被某一种行为习惯类型的用户账户对应的参数确定对应的目标内容。

S402、将与用户账户特征向量相似度最大的簇向量对应的簇变换网络，作为与用户账户行为特征相匹配的簇变换网络。

S403将第一预测结果输入至与用户账户行为特征相匹配的簇变换网络，得到目标中间特征。

示例性的，参见图5，当簇变换网络的数量为3个时，对应的簇向量的数量为3个，将当前用户账户对应的第一预测结果输入簇A、簇B和簇C对应的簇变换网络，得到对应的中间特征a、中间特征b、中间特征c。分别确定用户账户特征向量与簇A、簇B和簇C的相似度，分别得到对应的相似度a＝0.15、相似度b＝0.45、相似度c＝0.20，相似度b的数值最大，将簇B对应的簇变换网络作为目标簇变换网络。此时，将中间特征b作为目标中间向量。

由上述S401-S403可知，本实现方式提供了一种获取目标中间特征的具体实现方式，根据用户特征和簇向量之间的相似度确定该用户相匹配的簇变换网络，通过将用户特征对应的第一预测结果输入该用户相匹配的簇变换网络，得到目标中间特征。由于该目标中间特征是根据与该用户相匹配的簇变换网络变换得到的，通过对目标中间特征用于后续预测模型训练，能够使得预测模型中的部分参数能够满足小样本用户的推荐需求，有效提升预测模型的鲁棒性。

在另一种实现方式中，参见图6，上述S302中，根据用户账户行为特征与预先构建的多个簇变换网络对应的簇向量之间的相似度，确定与用户账户行为特征相匹配的目标簇变换网络，和，利用目标簇变换网络从第一预测结果中提取出的目标中间特征，具体包括：

S601、分别将第一预测结果输入到多个并列的簇变换网络中，每个簇变换网络用于根据预设规则从第一预测结果中提取出中间特征，多个簇变换网络对应的预设规则不同；

S602、根据用户账户行为特征确定对应的用户账户特征向量，并确定用户账户特征向量与每个簇向量之间的相似度；

S603、将与用户账户特征向量相似度最大的簇向量对应的簇变换网络作为与用户账户行为特征相匹配的簇变换网络，将与用户账户行为特征相匹配的簇变换网络对应的中间特征作为目标中间特征。

示例性的，参见图7，当簇变换网络的数量为3个时，对应的簇向量的数量为3个，分别确定用户账户特征向量与簇A、簇B和簇C的相似度，分别得到对应的相似度a＝0.15、相似度b＝0.45和相似度c＝0.25，其中，相似度b的数值最大，将簇b对应的簇变换网络b作为目标簇变换网络。将当前用户账户对应的第一预测结果输入簇b对应的簇变换网络，得到对应的目标中间特征。

由上述S601-S603可知，本实现方式提供了一种获取目标中间特征的具体实现方式，通过将用户对应的第一预测结果分别输入到多个簇变换网络中，得到多个中间特征，然后根据用户特征和簇向量之间的相似度确定该用户相匹配的簇变换网络，在多个中间特征中选择与用户相匹配的簇变换网络对应的中间特征作为目标中间特征。由于该目标中间特征是根据与该用户相匹配的簇变换网络变换得到的，通过对目标中间特征用于后续预测模型训练，能够使得预测模型中的部分参数能够满足小样本用户的推荐需求，有效提升预测模型的鲁棒性。

在一些实施例中，上述S302步骤之前，还包括：

将预设向量分别输入到多个簇变换网络中，以根据每个簇变换网络对应的预设规则得到每个簇变换网络对应的数值特征，数值特征用于表示簇变换网络对应的数值特征；将每个数值特征输入到神经网络中，得到每个数值特征对应的簇向量。

具体的，该预设向量可以为单位向量，通过将单位向量分别输入不同的簇变换网络，得到不同的数值特征，再将每个数值特征输入到神经网络中，得到每个簇变换网络对应的簇向量。

由上述实施例可知，由于每个簇变换网络分别具有不同的预设变换规则，通过将预设向量输入到每个簇变换网络，根据不同的预设变换规则得到对应的簇向量，因此，通过簇向量实现了对不同簇变换网络的有效划分。同时，通过用簇向量表示对应的簇变换网络能够有效减少网络参数数量，有效较低了成本。由于该目标中间特征是根据与该用户相匹配的簇变换网络变换得到的，通过对目标中间特征用于后续预测模型训练，能够使得预测模型中的部分参数能够满足小样本用户的推荐需求，有效提升预测模型的鲁棒性。

S303、将内容的内容特征和目标中间特征输入到预测网络，获得预测网络输出的第二预测结果，第二预测结果包括用户账户对内容执行每种预设操作的第二预测概率。

S304、根据第二预测概率和标签信息对预测网络和多个簇变换网络进行训练。

在一些实施例中，根据第二预测概率和标签信息对预测网络和多个簇变换网络进行训练，包括：

根据第二预测概率、标签信息和第一损失函数，确定第一损失值，第一损失函数为交叉熵函数；

通过第一损失值对预测网络、多个簇变换网络及转换网络进行更新。

在一些实施例中，推荐模型还包括转换网络，多个簇变换网络均与转换网络连接，转换网络用于对每个簇变换网络对应的数值特征进行处理，以得到每个簇变换网络对应的簇向量，簇变换网络对应的簇向量为簇变换网络的向量表示；与用户账户特征最匹配的目标簇变换网络为对应簇向量与用户账户特征的相似度最大的簇变换网络。

在一些实施例中，该方法还包括：确定任意两个簇变换网络对应的簇向量之间的相似度；根据确定的所有相似度中的最大值和第二损失函数确定第二损失值，第二损失函数为正则函数；根据第二损失值对转换网络进行更新。

具体的，根据第二预测结果和损失函数对预测模型和转换网络进行更新，损失函数为交叉熵损失函数和正则损失函数的加和。对预测模型的更新为反向梯度更新。

具体的，损失函数Loss的计算公式为：

Loss＝Loss₁+α*Loss₂；

其中Loss₁为交叉熵损失函数，Loss₂为正则损失函数，α为权重超参数，权重超参数的数值可以根据实际情况进行调整，此处不予限制。

其中，交叉熵损失函数用于衡量第二预测分数与用户实际操作的差异，正则损失函数用于避免各个簇学习到不同的用户模式，避免两个最接近的簇输出的中间特征之间的相似度超过预设相似度阈值。用户实际操作通过目标标签进行表征，例如：当用户账户完成该多媒体资源的播放时，此时操作记录中完成播放的目标标签对应的值为1，当用户未完成该多媒体资源的播放时，此时操作记录中完成播放的目标标签对应的值为0。

具体的，根据目标中间特征和内容特征得到第二预测结果后，通过损失函数计算损失，进而进行反向梯度更新和转换网络，而不对用户账户对应的簇变换网络进行反向更新，簇变换网络对应的簇向量也不会因为预测模型的训练而改变，由于簇变换网络具有特有的提取和处理信息的方式，用于得到更能满足用户喜好的预测结果，不会根据用户特征进行调整。同时，该预测模型的训练过程采用在线流式训练，实时训练样本产生后即输入到预测模型进行训练。通过设置损失函数对预测模型进行反向梯度更新，能有效提升预测模型的准确性和可解释性。

而结合本公开方案，由S301-S304可知，通过根据用户特征和多个簇向量，确定当前用户所属的簇变换网络。对当前用户的第一预测结果通过簇变换网络进行变换，得到对应的目标中间特征，通过目标中间特征和用户关联的内容特征对预测模型进行训练，得到预测模型，通过将用户分配给不同的簇，并根据不同的簇对应的参数分别进行训练，使得预测模型中的部分参数能够满足小样本用户的推荐需求，有效提升预测模型的鲁棒性和可解释性。

本公开还提供一种内容推荐方法，该内容推荐方法具体可以通过一种内容推荐装置来执行。其中，内容推荐装置可以是各类电子设备。例如内容推荐装置可以为图1中的服务器101。当该方法应用于一种内容推荐装置的情况下，结合图2，如图8所示，该内容推荐方法可以包括以下步骤S801-S804：

S801、获取候选内容的内容特征、用户账户的用户账户特征和与用户账户特征对应的第一预测结果，第一预测结果包括用户账户对候选内容执行每种预设操作的第一预测概率。

S802、从多个预先训练的簇变换网络中确定出与用户账户特征最匹配的目标簇变换网络，并利用目标簇变换网络从第一预测结果中提取出目标中间特征。

在一些实施例中，上述S802步骤包括：

具体的，确定用户账户特征与每个簇变换网络对应的簇向量之间的相似度，包括：根据用户账户特征生成对应的用户账户特征向量；确定用户账户特征向量与每个簇变换网络对应的簇向量之间的相似度。

S803、将目标中间特征和内容特征，输入预先训练的预测网络中，预测网络用于输出第二预测结果，第二预测结果包括用户账户对候选内容执行每种预设操作的第二预测概率。

S804、根据第二预测结果，从候选内容中确定出用户账户对应的推荐内容。

具体的，根据第二预测结果确定用户账号对应的推荐内容，将该推荐内容发送给该用户账户。预测模型是按上述的训练方法训练得到的。

示例性的，第二预测结果包括用户账户对内容执行每种预设操作的第二预测概率。例如，当推荐的内容为多媒体资源时，预设操作可以为有效播放、长播、完播、点赞、评论、分享等，当此时按照点赞概率为相应的用户账户推荐内容时，根据每一内容对应的点赞的预测概率对上述候选内容进行排序，将排序靠前的预设数量的候选内容作为推荐内容，发送给对应的用户账户。

在一些实施例中，预测模型还包括转换网络，多个预先训练的簇变换网络均与转换网络连接，从多个预先训练的簇变换网络中确定出与用户账户特征最匹配的目标簇变换网络之前，还包括：

而结合本公开方案，由S801-S804可知，通过根据用户特征和多个簇向量，确定当前用户所属的簇变换网络。对当前用户的第一预测结果通过簇变换网络进行变换，得到对应的目标中间特征，根据目标中间特征和用户关联的内容特征通过预测模型进行预测，得到第二预测结果，通过将用户分配给不同的簇，并根据不同的簇对应的中间特征输入预测模型，得到的第二预测结果能够满足小样本用户的推荐需求，有效提升预测模型的鲁棒性。

基于这样的理解，本公开实施例还对应提供一种内容推荐装置。图9示出了本公开实施例提供的预测模型训练装置的结构示意图。如图9所示，该预测模型训练装置可以包括：特征获取单元901、特征提取单元902、结果预测单元903和内容确定单元904；特征获取单元，被配置为执行获取候选内容的内容特征、用户账户的用户账户特征和与用户账户特征对应的第一预测结果，第一预测结果包括用户账户对候选内容执行每种预设操作的第一预测概率；特征提取单元，被配置为执行从多个预先训练的簇变换网络中确定出与用户账户特征最匹配的目标簇变换网络，并利用目标簇变换网络从第一预测结果中提取出目标中间特征；结果预测单元，被配置为执行将目标中间特征和内容特征，输入预先训练的预测网络中，预测网络用于输出第二预测结果，第二预测结果包括用户账户对候选内容执行每种预设操作的第二预测概率；内容确定单元，被配置为执行根据第二预测结果，从候选内容中确定出用户账户对应的推荐内容。

可选的，特征提取单元902，具体被配置为执行：确定用户账户特征与每个簇变换网络对应的簇向量之间的相似度，簇变换网络对应的簇向量为簇变换网络的向量表示；将与用户账户特征相似度最大的簇向量对应的簇变换网络，作为与用户账户特征最匹配的目标簇变换网络；将第一预测结果输入目标簇变换网络，获得输出的目标中间特征。

可选的，特征提取单元902，具体被配置为执行：分别将第一预测结果输入到多个并列的簇变换网络中，得到每个簇变换网络输出的中间特征；确定用户账户特征与每个簇变换网络对应的簇向量之间的相似度，簇变换网络对应的簇向量为簇变换网络的向量表示；将与用户账户特征相似度最大的簇向量对应的簇变换网络作为与用户账户特征最匹配的目标簇变换网络，将目标簇变换网络输出的中间特征作为目标中间特征。

可选的，特征提取单元902，具体被配置为执行：根据用户账户特征生成对应的用户账户特征向量；确定用户账户特征向量与每个簇变换网络对应的簇向量之间的相似度。

可选的，预测模型还包括转换网络，多个预先训练的簇变换网络均与转换网络连接，内容推荐装置还包括：簇向量生成单元905，被配置为执行将单位向量分别输入到多个簇变换网络中，以使簇变换网络输出用于表示簇变换网络的数值特征；将每个数值特征输入到转换网络中，得到每个数值特征对应的簇向量。

关于上述实施例中的内容推荐装置，其中各个模块执行操作的具体方式、以及具备的有益效果，均已经在前述方法实施例中进行了详细描述，此处不再赘述。

基于这样的理解，本公开实施例还对应提供一种应用于内容推荐系统的预测模型的训练装置。图10示出了本公开实施例提供的内容推荐装置的结构示意图。如图10所示，该内容推荐装置可以包括：特征获取单元1001、特征提取单元1002、结果预测单元1003和模型训练单元1004，预测模型包括多个簇变换网络和预测网络，特征获取单元1001，被配置为执行获取样本特征、样本特征对应的标签信息及第一预测结果，样本特征包括内容的内容特征和用户账户的用户账户特征，标签信息表征用户账户是否对内容执行过预设操作，第一预测结果包括用户账户对内容执行每种预设操作的第一预测概率；特征提取单元1002，被配置为执行从多个簇变换网络中确定出与用户账户特征最匹配的目标簇变换网络，并利用目标簇变换网络从第一预测结果中提取出目标中间特征；结果预测单元1003，被配置为执行将内容的内容特征和目标中间特征输入到预测网络，获得预测网络输出的第二预测结果，第二预测结果包括用户账户对内容执行每种预设操作的第二预测概率；模型训练单元1004，被配置为执行根据第二预测概率和标签信息对预测网络和多个簇变换网络进行训练。

可选的，模型训练单元1004，具体被配置为执行：根据第二预测概率、标签信息和第一损失函数，确定第一损失值，第一损失函数为交叉熵函数；通过第一损失值对预测网络、多个簇变换网络及转换网络进行更新。

可选的，模型训练单元1004，还被配置为执行：确定任意两个簇变换网络对应的簇向量之间的相似度；根据确定的所有相似度中的最大值和第二损失函数确定第二损失值，第二损失函数为正则函数；根据第二损失值对转换网络进行更新。

本公开实施例还提供一种电子设备。图11示出了本公开实施例提供的电子设备的结构示意图。该电子设备可以是内容推荐装置可以包括至少一个处理器111，通信总线112，存储器113以及至少一个通信接口114。

处理器111可以是一个处理器(central processing units，CPU)，微处理单元，ASIC，或一个或多个用于控制本公开方案程序执行的集成电路。作为一个示例，结合图9和图10，电子设备中的结果预测单元903和模型训练单元1004实现的功能与图11中的处理器111实现的功能相同。

通信总线112可包括一个通路，在上述组件之间传送信息。

通信接口114，使用任何收发器一类的装置，用于与其他设备或通信网络通信，如服务器、以太网，无线接入网(radio access network，RAN)，无线局域网(wireless localarea networks，WLAN)等。作为一个示例，

存储器113可以是只读存储器(read-only memory，ROM)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(random access memory，RAM)或者可存储信息和指令的其他类型的动态存储设备，也可以是电可擦可编程只读存储器(electricallyerasable programmable read-only memory，EEPROM)、只读光盘(compact disc read-only memory，CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。存储器可以是独立存在，通过总线与处理单元相连接。存储器也可以和处理单元集成在一起。

其中，存储器113用于存储执行本公开方案的应用程序代码，并由处理器111来控制执行。处理器111用于执行存储器113中存储的应用程序代码，从而实现本公开方法中的功能。

在具体实现中，作为一种实施例，处理器111可以包括一个或多个CPU，例如图11中的CPU0和CPU1。

在具体实现中，作为一种实施例，电子设备可以包括多个处理器，例如图11中的处理器111和处理器115。这些处理器中的每一个可以是一个单核(single-CPU)处理器，也可以是一个多核(multi-CPU)处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。

在具体实现中，作为一种实施例，电子设备还可以包括输入设备116和输出设备117。输入设备116和输出设备117通信，可以以多种方式接受用户的输入。例如，输入设备116可以是鼠标、键盘、触摸屏设备或传感设备等。输出设备117和处理器111通信，可以以多种方式来显示信息。例如，输出设备111可以是液晶显示器(liquid crystal display，LCD)，发光二极管(light emitting diode，LED)显示设备等。

本领域技术人员可以理解，图11中示出的结构并不构成对电子设备的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

本公开实施例还提供一种电子设备。该电子设备可以是内容推荐装置。该电子设备可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器和一个或一个以上的存储器。其中，存储器中存储有至少一条指令，至少一条指令由处理器加载并执行以实现上述各个方法实施例提供的预测模型训练方法或内容推荐方法。当然，该电子设备还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该电子设备还可以包括其他用于实现设备功能的部件，在此不做赘述。

本公开还提供了一种包括指令的计算机可读存储介质，计算机可读存储介质上存储有指令，当计算机可读存储介质中的指令由计算机设备的处理器执行时，使得计算机能够执行上述所示实施例提供的预测模型训练方法或内容推荐方法。例如，计算机可读存储介质可以为包括指令的存储器113，上述指令可由终端的处理器111执行以完成上述方法。又例如，计算机可读存储介质可以为包括指令的存储器，上述指令可由电子设备的处理器执行以完成上述方法。可选地，计算机可读存储介质可以是非临时性计算机可读存储介质，例如，非临时性计算机可读存储介质可以是ROM、RAM、CD-ROM、磁带、软盘和光数据存储设备等。

本公开还提供了一种计算机程序产品，该计算机程序产品包括计算机指令，当计算机指令在电子设备上运行时，使得所述电子设备执行上述图1至图8任一附图所示的内容推荐方法和模型训练方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其他实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种内容推荐方法，其特征在于，包括：

获取候选内容的内容特征、用户账户的用户账户特征和与所述用户账户特征对应的第一预测结果，所述第一预测结果包括所述用户账户对所述候选内容执行每种预设操作的第一预测概率；

从多个预先训练的簇变换网络中确定出与用户账户特征最匹配的目标簇变换网络，并利用所述目标簇变换网络从所述第一预测结果中提取出目标中间特征；

将所述目标中间特征和所述内容特征，输入预先训练的预测网络中，所述预测网络用于输出第二预测结果，所述第二预测结果包括所述用户账户对候选内容执行每种所述预设操作的第二预测概率；

根据所述第二预测结果，从所述候选内容中确定出所述用户账户对应的推荐内容。

2.根据权利要求1所述的内容推荐方法，其特征在于，所述从多个预先训练的簇变换网络中确定出与用户账户特征最匹配的目标簇变换网络，并利用所述目标簇变换网络从所述第一预测结果中提取出目标中间特征，包括：

确定所述用户账户特征与每个所述簇变换网络对应的簇向量之间的相似度，所述簇变换网络对应的簇向量为所述簇变换网络的向量表示；

将与所述用户账户特征相似度最大的簇向量对应的簇变换网络，作为与所述用户账户特征最匹配的目标簇变换网络；

将所述第一预测结果输入所述目标簇变换网络，获得输出的所述目标中间特征。

3.根据权利要求1所述的内容推荐方法，其特征在于，所述从多个预先训练的簇变换网络中确定出与用户账户特征最匹配的目标簇变换网络，并利用所述目标簇变换网络从所述第一预测结果中提取出目标中间特征，包括：

分别将所述第一预测结果输入到多个并列的所述簇变换网络中，得到每个所述簇变换网络输出的中间特征；

将与所述用户账户特征相似度最大的簇向量对应的簇变换网络作为与所述用户账户特征最匹配的目标簇变换网络，将所述目标簇变换网络输出的中间特征作为所述目标中间特征。

4.根据权利要求2或3所述内容推荐方法，其特征在于，所述确定所述用户账户特征与每个所述簇变换网络对应的簇向量之间的相似度，包括：

根据所述用户账户特征生成对应的用户账户特征向量；

确定所述用户账户特征向量与每个所述簇变换网络对应的簇向量之间的相似度。

5.根据权利要求2或3所述的内容推荐方法，其特征在于，所述预测模型还包括转换网络，所述多个预先训练的簇变换网络均与所述转换网络连接，所述从多个预先训练的簇变换网络中确定出与用户账户特征最匹配的目标簇变换网络之前，还包括：

将单位向量分别输入到多个所述簇变换网络中，以使所述簇变换网络输出用于表示所述簇变换网络的数值特征；

将每个所述数值特征输入到转换网络中，得到每个所述数值特征对应的簇向量。

6.一种应用于内容推荐系统的预测模型的训练方法，其特征在于，所述预测模型包括多个簇变换网络和预测网络，所述方法包括：

获取样本特征、所述样本特征对应的标签信息及第一预测结果，所述样本特征包括内容的内容特征和用户账户的用户账户特征，所述标签信息表征所述用户账户是否对所述内容执行过预设操作，所述第一预测结果包括所述用户账户对所述内容执行每种所述预设操作的第一预测概率；

从所述多个簇变换网络中确定出与用户账户特征最匹配的目标簇变换网络，并利用所述目标簇变换网络从所述第一预测结果中提取出目标中间特征；

将所述内容的内容特征和所述目标中间特征输入到所述预测网络，获得所述预测网络输出的第二预测结果，所述第二预测结果包括所述用户账户对所述内容执行每种所述预设操作的第二预测概率；

根据所述第二预测概率和所述标签信息对所述预测网络和所述多个簇变换网络进行训练。

7.根据权利要求6所述的预测模型的训练方法，其特征在于，所述推荐模型还包括转换网络，所述多个簇变换网络均与所述转换网络连接，所述转换网络用于对每个所述簇变换网络对应的数值特征进行处理，以得到每个所述簇变换网络对应的簇向量，所述簇变换网络对应的簇向量为所述簇变换网络的向量表示；所述与用户账户特征最匹配的目标簇变换网络为对应簇向量与所述用户账户特征的相似度最大的簇变换网络。

8.一种电子设备，其特征在于，包括：处理器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为执行所述指令，以实现如权利要求1至5中任一项所述的内容推荐方法，或权利要求6至7中任一项所述的预测模型的训练方法。

9.一种计算机可读存储介质，其特征在于，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行如权利要求1至5中任一项所述的内容推荐方法，或权利要求6至7中任一项所述的预测模型的训练方法。

10.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的内容推荐方法，或权利要求6至7中任一项所述的预测模型的训练方法。