CN112989179B

CN112989179B - 模型训练、多媒体内容推荐方法和装置

Info

Publication number: CN112989179B
Application number: CN201911286273.6A
Authority: CN
Inventors: 陈国章
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2019-12-13
Filing date: 2019-12-13
Publication date: 2023-07-28
Anticipated expiration: 2039-12-13
Also published as: CN112989179A

Abstract

本公开涉及一种模型训练、多媒体内容推荐方法和装置。所述方法包括：获取登录平台的真实账户的行为日志；所述行为日志记录有所述真实账户在访问所述平台的页面的过程中对所述页面上展示的内容所进行的账户行为；基于所述真实账户的账户行为，生成与所述真实账户关联的至少两个虚拟账户各自的账户行为；基于生成的虚拟账户生成训练样本；采用所述训练样本对推荐模型进行训练。采用本方法能够将用户真正感兴趣的内容推荐给用户，解决了相关技术中推荐给用户的内容不符合用户需求的问题。

Description

模型训练、多媒体内容推荐方法和装置

技术领域

本公开涉及计算机技术，尤其涉及一种模型训练、多媒体内容推荐方法和装置。

背景技术

目前，通常通过召回算法向用户推荐感兴趣的视频、音频等多媒体内容。其中一种常见的召回算法是基于用户的协同过滤算法，协同过滤算法通过构建协同过滤模型提取出反映用户兴趣的行为特征，并基于行为特征的相似度预测用户的兴趣之间是否相似，兴趣相似的用户可以作为相似用户，并根据相似用户曾经观看的内容进行内容推荐。

为了向用户推荐符合其兴趣的多媒体内容，需要协同过滤模型可以从用户过往的行为中，提取出可以反映用户兴趣的行为特征。因此，需要采用大量用户的行为作为训练样本对协同过滤模型进行训练，以提升协同过滤模型的表现。

相关技术中，通常采用用户个人的行为作为训练样本，基于该训练样本对协同过滤模型进行训练，以使协同过滤模型学习用户个人的行为与多媒体内容之间的关联关系。然而，通过上述训练方法所得到的协同过滤模型，其在进行内容推荐时，该协同过滤模型所提取出的行为特征并无法准确反映用户的真实兴趣，因此，基于该协同过滤模型所提取出的行为特征进行相似用户的搜索，并无法准确地搜索出相似用户。因此，相关技术存在着无法准确地搜索出相似用户的问题。

发明内容

本公开提供一种模型训练、多媒体内容推荐方法和装置，以至少解决相关技术存在着的推荐的内容不符合用户需求的问题。本公开的技术方案如下：

根据本公开实施例的第一方面，提供一种用于进行内容推荐的模型训练方法，包括：

获取登录平台的真实账户的行为日志；所述行为日志记录有所述真实账户在访问所述平台的页面的过程中对所述页面上展示的内容所进行的账户行为；

基于所述真实账户的账户行为，生成与所述真实账户关联的至少两个虚拟账户各自的账户行为；

基于生成的虚拟账户生成训练样本，其中，所述训练样本包括正样本和负样本，所述正样本中的样本对基于相似虚拟账户的账户行为而生成；所述负样本中的样本对基于不相似虚拟账户的账户行为而生成；所述相似虚拟账户为与同一个真实账户关联的虚拟账户；所述不相似虚拟账户为与不同的真实账户关联的虚拟账户；

采用所述训练样本对推荐模型进行训练，其中，所述推荐模型用于搜索待推荐账户的相似账户，并根据所述相似账户的账户行为向所述待推荐账户进行内容推荐。

可选地，所述真实账户包括第一真实账户和第二真实账户，所述基于生成的虚拟账户生成训练样本，包括：

确定均与所述第一真实账户关联的至少两个所述虚拟账户，得到相似虚拟账户；

采用所述相似虚拟账户的账户行为组成所述正样本中的样本对；

确定与所述第一真实账户关联的虚拟账户和与所述第二真实账户关联的虚拟账户，得到不相似虚拟账户；

采用所述不相似虚拟账户的账户行为组成所述负样本中的样本对；

将所述正样本和所述负样本组成所述训练样本。

可选地，与所述真实账户关联的虚拟账户具有N个，N≥2，所述基于所述真实账户的账户行为，生成与所述真实账户关联的至少两个虚拟账户各自的账户行为，包括：

将所述真实账户的账户行为均分成N份，分别作为与所述真实账户关联的N个所述虚拟账户的账户行为。

可选地，所述真实账户的账户行为具有多个，所述账户行为具有行为时间，多个所述账户行为形成按照所述行为时间排序的有序行为序列，所述基于所述真实账户的账户行为，生成与所述真实账户关联的至少两个虚拟账户各自的账户行为，包括：

对所述有序行为序列中的多个所述账户行为的排序进行调整，形成无序行为序列；所述无序行为序列中的多个所述账户行为的行为时间之间无序；

将所述无序行为序列分割成子序列；

将所述子序列所包含的账户行为，作为所述虚拟账户的账户行为。

可选地，所述训练样本具有对应的期望相似度，所述采用所述训练样本对推荐模型进行训练，包括：

将所述训练样本输入至所述推荐模型；所述推荐模型包括第一模型和第二模型，所述第一模型和所述第二模型共享权重参数；所述第一模型和所述第二模型根据共享的所述权重参数输出行为特征；

得到所述第一模型输出的第一行为特征和所述第二模型输出的第一行为特征；

计算所述第一行为特征和所述第二行为特征之间的预测相似度；

根据所述预测相似度与所述期望相似度之间的差异，调整所述权重参数，得到优化推荐模型。

可选地，还包括：

将所述待推荐账户的账户行为输入至所述优化推荐模型；

获取所述优化推荐模型输出的第三行为特征，并根据所述第三行为特征搜索所述待推荐账户的相似账户；

根据所述相似账户的账户行为，向所述待推荐账户推荐多媒体内容。

可选地，所述根据所述第三行为特征搜索所述待推荐账户的相似账户的步骤，包括：

确定P个候选账户；

分别计算P个所述候选账户的行为特征与所述第三行为特征之间的预测相似度；

按照所述预测相似度对P个所述候选账户进行降序排序，将排序前K个所述候选账户，作为所述相似账户；其中，P＞K≥1。

根据本公开实施例的第二方面，提供一种多媒体内容推荐方法，包括：

获取登录平台的真实账户的行为日志；所述行为日志记录有所述真实账户在访问所述平台的页面的过程中对所述页面上展示的多媒体内容所进行的账户行为；

采用所述训练样本对推荐模型进行训练，得到优化推荐模型；

获取待推荐账户的账户行为，并将所述待推荐账户的账户行为输入至所述优化推荐模型；

获取所述优化推荐模型输出的行为特征，并根据所述行为特征搜索所述待推荐账户的相似账户；

根据本公开实施例的第三方面，提供一种用于进行内容推荐的模型训练装置，包括：

日志获取单元，被配置为执行获取登录平台的真实账户的行为日志；所述行为日志记录有所述真实账户在访问所述平台的页面的过程中对所述页面上展示的内容所进行的账户行为；

虚拟账户行为生成单元，被配置为执行基于所述真实账户的账户行为，生成与所述真实账户关联的至少两个虚拟账户各自的账户行为；

样本生成单元，被配置为执行基于生成的虚拟账户生成训练样本，其中，所述训练样本包括正样本和负样本，所述正样本中的样本对基于相似虚拟账户的账户行为而生成；所述负样本中的样本对基于不相似虚拟账户的账户行为而生成；所述相似虚拟账户为与同一个真实账户关联的虚拟账户；所述不相似虚拟账户为与不同的真实账户关联的虚拟账户；

模型训练单元，被配置为执行采用所述训练样本对推荐模型进行训练，其中，所述推荐模型用于搜索待推荐账户的相似账户，并根据所述相似账户的账户行为向所述待推荐账户进行内容推荐。

可选地，所述真实账户包括第一真实账户和第二真实账户，所述样本生成单元，被配置为执行：

确定均与所述第一真实账户关联的至少两个所述虚拟账户，得到相似虚拟账户；采用所述相似虚拟账户的账户行为组成所述正样本；确定与所述第一真实账户关联的虚拟账户和与所述第二真实账户关联的虚拟账户，得到不相似虚拟账户；采用所述不相似虚拟账户的账户行为组成所述负样本；将所述正样本和所述负样本组成所述训练样本。

可选地，与所述真实账户关联的虚拟账户具有N个，N≥2，所述虚拟账户行为生成单元，被配置为执行：

可选地，所述真实账户的账户行为具有多个，所述账户行为具有行为时间，多个所述账户行为形成按照所述行为时间排序的有序行为序列，所述虚拟账户行为生成单元，被配置为执行：

对所述有序行为序列中的多个所述账户行为的排序进行调整，形成无序行为序列；所述无序行为序列中的多个所述账户行为的行为时间之间无序；将所述无序行为序列分割成子序列；将所述子序列所包含的账户行为，作为所述虚拟账户的账户行为。

可选地，所述训练样本具有对应的期望相似度，所述模型训练单元，被配置为执行：

将所述训练样本输入至所述推荐模型；所述推荐模型包括第一模型和第二模型，所述第一模型和所述第二模型共享权重参数；所述第一模型和所述第二模型根据共享的所述权重参数输出行为特征；得到所述第一模型输出的第一行为特征和所述第二模型输出的第一行为特征；计算所述第一行为特征和所述第二行为特征之间的预测相似度；根据所述预测相似度与所述期望相似度之间的差异，调整所述权重参数，得到优化推荐模型。

可选地，所述装置还包括：

输入单元，被配置为执行将所述待推荐账户的账户行为输入至所述优化推荐模型；

特征提取单元，被配置为执行获取所述优化推荐模型输出的第三行为特征，并根据所述第三行为特征搜索所述待推荐账户的相似账户；

推荐单元，被配置为执行根据所述相似账户的账户行为，向所述待推荐账户推荐多媒体内容。

作为本公开一个可选实施方式，所述特征提取单元，被配置为执行：

确定P个候选账户；分别计算P个所述候选账户的行为特征与所述第三行为特征之间的预测相似度；按照所述预测相似度对P个所述候选账户进行降序排序，将排序前K个所述候选账户，作为所述相似账户；其中，P＞K≥1。

根据本公开实施例的第四方面，提供一种多媒体内容推荐装置，包括：

日志获取单元，被配置为执行获取登录平台的真实账户的行为日志；所述行为日志记录有所述真实账户在访问所述平台的页面的过程中对所述页面上展示的多媒体内容所进行的账户行为；

模型训练单元，被配置为执行采用所述训练样本对推荐模型进行训练，得到优化推荐模型；

输入单元，被配置为执行获取待推荐账户的账户行为，并将所述待推荐账户的账户行为输入至所述优化推荐模型；

特征提取单元，被配置为执行获取所述优化推荐模型输出的行为特征，并根据所述行为特征搜索所述待推荐账户的相似账户；

根据本公开实施例的第五方面，提供一种计算机设备，包括：处理器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为执行所述指令，以实现如第一方面、第二方面或第一方面的任一种可能的实施方式中的方法。

据本公开实施例的第六方面，提供一种存储介质，当所述存储介质中的指令由计算机设备的处理器执行时，使得计算机设备能够执行如第一方面、第二方面或第一方面的任一种可能的实施方式中的方法。

根据本公开实施例的第七方面，提供一种计算机程序产品，包括：计算机程序代码，当所述计算机程序代码被计算机运行时，使得所述计算机执行上述各方面中的方法。

本公开的实施例提供的技术方案至少带来以下有益效果：

通过获取登录平台的真实账户的行为日志，利用行为日中所记录的账户行为，生成多个虚拟账户的账户行为，将与同一个真实账户关联的虚拟账户确定为相似虚拟账户，作为代表具有相似用户兴趣的虚拟账户，采用相似虚拟账户的账户行为生成正样本中的样本对；将与不同的真实账户关联的虚拟账户确定为不相似虚拟账户，作为代表具有不相似用户兴趣的虚拟账户，采用不相似虚拟账户的账户行为生成负样本中的样本对。由此，采用上述正样本和负样本对推荐模型进行训练，使得推荐模型学习到更多的账户行为之间的正相关关系和负相关关系，从而，推荐模型可以基于更多的账户行为之间的正相关关系和负相关关系，提取出可以准确反映用户真实兴趣的行为特征，基于可以准确反映用户真实兴趣的行为特征进行相似用户的搜索，则可以准确地搜索出相似用户，解决了相关技术中无法准确搜索出相似用户的问题。

而且，在准确地搜索出相似用户后，可以将用户真正感兴趣的内容推荐给用户，解决了相关技术中推荐给用户的内容不符合用户需求的问题。

进一步，上述模型训练方法所构造的样本，不再局限于个人真实账户的账户行为，而是引入了全局真实账户的账户行为，采用引入了全局真实账户的账户行为的负样本对推荐模型进行训练，使得推荐模型可以学习到大量的多样化的账户行为之间的关系，在进行内容推荐时，推荐模型可以基于多样化的账户行为之间的关系，可以搜索出多样化的相似账户，从而可以向用户推荐多样化的内容，提升了内容推荐的探索性。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种模型训练方法的流程图；

图2是一种应用一种模型训练方法的应用环境的示意图；

图3是根据一示例性实施例示出的一种拆分账户行为步骤的流程图；

图4是根据一示例性实施例示出的一种生成训练样本步骤的流程图；

图5是根据一示例性实施例示出的一种训练模型步骤的流程图；

图6是根据一示例性实施例示出的一种双塔结构的协同过滤模型的示意图；

图7是根据一示例性实施例示出的一种多媒体内容推荐方法的流程图；

图8是根据一示例性实施例示出的一种多媒体内容推荐系统的框架示意图；

图9是根据一示例性实施例示出的一种模型训练装置的框图；

图10是根据一示例性实施例示出的一种多媒体内容推荐装置的框图；

图11是根据一示例性实施例示出的一种计算机设备的框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

图1是根据一示例性实施例示出的一种用于进行内容推荐的模型训练方法的流程图，该模型训练方法可以应用于如图2所示的应用环境中。其中，该应用环境中可以包括服务器21和终端22。该模型训练方法可以由服务器21执行。服务器21和终端22通过网络连接。服务器21可以用独立的服务器或者是多个服务器组成的服务器集群来实现。终端22具体可以是台式终端或移动终端，移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。终端22可以用于播放视频、音频等的多媒体内容。本实施例主要以该方法应用于上述图2中的服务器21来举例说明。

需要说明的是，该模型训练方法可以应用于内容推荐的应用场景。服务器21可以通过该模型训练方法对推荐模型进行训练，并基于训练后的推荐模型，得到某个账户的行为特征，根据该行为特征搜索出登录该账户的用户所感兴趣的视频、音频、页面等内容，并向该账户推荐，用户可以通过终端22观看所推荐的视频、音频、页面等内容。

如图1所示，该方法包括以下步骤：

在步骤S11中，获取登录平台的真实账户的行为日志；所述行为日志记录有所述真实账户在访问所述平台的页面的过程中对所述页面上展示的内容所进行的账户行为。

其中，真实账户可以为真实存在的用户在用于展示各种内容的平台上所注册的账户。

其中，账户行为可以为登录平台的账户针对多媒体内容以及其相关内容进行操作的行为。账户行为可以具体包括内容链接点击行为、内容标记行为、账户标记行为、内容链接标记行为中的至少一种。

其中，内容链接点击行为可以为对多媒体内容的链接进行点击的行为，例如，用户登录平台的账户后，对平台上某个视频的简介感兴趣，用户点击该视频的链接以请求播放完整视频，用户点击视频链接的行为，可以作为上述的账户行为。

其中，内容标记行为可以为对多媒体内容进行标记的行为。例如，用户观看完某个视频后，对该视频很感兴趣，对该视频的“点赞”按钮进行点击，以对该视频进行标记，用户点击“点赞”按钮的行为，可以作为上述的账户行为。

其中，账户标记行为可以为对账户进行标记的行为。例如，用户对发布某类型视频的账户感兴趣，用户可以点击该账户的“关注”按钮，以对该账户进行标记，以便在被标记的账户发布新的视频时通知用户，用户点击“关注”按钮的行为，可以作为上述的账户行为。

其中，内容链接标记行为可以为对多媒体内容的链接进行标记的行为。例如，用户对某个视频感兴趣，希望以后再次观看，用户可以点击视频链接的“收藏”按钮，该视频链接则会记录至用户的账户，以便用户查阅，用户点击“收藏”按钮的行为，可以作为上述的账户行为。

其中，行为日志可以为记录有真实账户在访问平台的页面的过程中对页面上展示的内容所进行的账户行为的日志。

具体实现中，用户可以在平台上注册账户，通过所注册的账户登录平台，相应地，可以生成该账户对应的行为日志，以记录用户在该平台上浏览各种多媒体内容的过程中所进行的行为。因此，在每个真实账户的行为日志中，可以记录有该真实账户在浏览页面上的多媒体内容的过程中、对多媒体内容以及其相关内容进行操作的账户行为。

例如，在某个真实账户的kafka(一种分布式发布订阅消息系统)日志中，包括有链接点击行为列表clicklist和内容标记行为列表likelist，链接点击行为列表clicklist中记录有click1、click2、click3和click4该四个内容链接点击行为，内容标记行为列表likelist记录有like1、like2、like3和like4该四个内容标记行为。将click1、click2、click3和click4该四个内容链接点击行为和like1、like2、like3和like4该四个内容标记行为提取出作为上述的账户行为。

服务器21可以从大量的真实账户的行为日志中，分别提取出多个真实账户的账户行为。由此，通过真实账户的行为日志，可以得到真实账户的账户行为，以便后续基于真实账户的账户行为，生成虚拟账户的账户行为。

在步骤S12中，基于所述真实账户的账户行为，生成与所述真实账户关联的至少两个虚拟账户各自的账户行为。

其中，虚拟账户可以为并非真实存在的账户。每个真实账户可以具有对应的多个虚拟账户。

具体实现中，服务器21可以生成与真实账户具有关联关系的虚拟账户。例如，真实账户的账户ID(Identity，标识值)为user01，则可以生成账户ID分别为user01_a和user01_b的两个虚拟账户，或者，可以生成账户ID分别为user01_a、user01_b、user01_c等多个虚拟账户。

针对于与真实账户关联的虚拟账户，可以将真实账户的一部分账户行为提取出作为虚拟账户的账户行为。具体地，可以将真实账户的账户行为进行拆分，形成多个账户行为，将拆分出的多个账户行为，分配给真实账户所关联的多个虚拟账户，作为虚拟账户的账户行为。

生成虚拟账户的账户行为的方式可以有多种。其中一种拆分方式中，可以按照账户行为的行为时间将多个账户行为排序，形成有序行为序列，然后按照虚拟账户的数量将有序行为序列分割为若干条子序列，将每条子序列所包含的账户行为作为每个虚拟账户的账户行为。

例如，对于真实账户user01，具有click1、click2、click3和click4该四个点击行为，click1、click2、click3和click4形成按照行为时间排序的有序行为序列，真实账户user01具有user01_a和user01_b两个虚拟账户。因此，可以将click1、click2作为虚拟账户user01_a的账户行为，将click3、click4作为虚拟账户user01_b的账户行为。

其中另一种拆分方式中，还可以将有序行为序列的排序进行随机调整，形成无序行为序列，再将无序行为序列分割为若干条子序列，将每条子序列所包含的账户行为作为每个虚拟账户的账户行为。

例如，对于真实账户user01，具有click1、click2、click3和click4该四个点击行为，click1、click2、click3和click4形成按照行为时间排序的有序行为序列，进行随机调整后形成无序行为序列click3、click2、click1和click4，可以将click3、click2作为虚拟账户user01_a的账户行为，将click1、click4作为虚拟账户user01_b的账户行为。

当然，本领域技术人员可以根据实际需要采用各种生成方式，本实施例对具体的生成方式不作限制。

通过基于真实账户的账户行为生成虚拟账户的账户行为，使得后续可以采用虚拟账户的账户行为组成正样本和负样本。

在步骤S13中，基于生成的虚拟账户生成训练样本，其中，所述训练样本包括正样本和负样本，所述正样本中的样本对基于相似虚拟账户的账户行为而生成；所述负样本中的样本对基于不相似虚拟账户的账户行为而生成；所述相似虚拟账户为与同一个真实账户关联的虚拟账户；所述不相似虚拟账户为与不同的真实账户关联的虚拟账户。

其中，训练样本可以为用于对推荐模型进行机器训练的样本。

其中，正样本可以为由与同一个真实账户关联的两个以上的虚拟账户的账户行为所组成的训练样本。

其中，负样本可以为根据不相同的两个以上的真实账户的账户行为所得到的训练样本。

具体实现中，服务器21可以从大量的虚拟账户中，选取与同一个真实账户关联的多个虚拟账户，并采用所选取虚拟账户的账户行为，组成上述的正样本。

例如，user01_a和user01_b两个虚拟账户均对应于同一个真实账户user01，虚拟账户user01_a的账户行为[click1、click2]和虚拟账户user01_b的账户行为[click3、click4]组成正样本。

需要说明的是，由于与同一个真实账户关联的虚拟账户的账户行为，是从同一个真实账户的账户行为拆分得到的，因此，虚拟账户的账户行为之间具有相似性，即，虚拟账户之间存在正相关的关系。由与同一个真实账户关联的虚拟账户的账户行为所组成的样本，为反映账户之间具有相似性的正样本，从而，利用一个真实账户的多个账户行为构造出正样本。

实际应用中，通常是在账户每次访问页面时生成新的行为日志，并将账户本次访问所进行的所有的账户行为记录在该行为日志中。因此，真实账户的每个行为日志记录有账户在每次访问页面时所进行的账户行为。由于账户在每次访问时页面的一段时间内时，通常是针对某一特定类型的相关内容进行点击、浏览、收藏等的账户行为，因此，在该真实账户同一个行为日志中所记录的一段时间内的账户行为，所反映的是具有相似性的用户兴趣。

因此，对于行为日志中记录有账户每次访问页面时所进行的账户行为的情况，则可以对该真实账户的在同一个行为日志中所记录的账户行为进行拆分，作为多个虚拟账户的账户行为，由此，使得多个虚拟账户的账户行为可以反映出具有相似性的用户兴趣。将真实账户的同一个行为日志中所记录的账户行为拆分为多个虚拟账户的账户行为，从而，利用一个真实账户构造出虚拟的具有相似的用户兴趣的多个账户。

此外，服务器21还可以根据不相同的至少两个真实账户各自的账户行为，生成负样本。其中一种构造负样本的具体方式中，可以将两个不相同的真实账户各自的账户行为，组成负样本。

需要说明的是，由于不同的真实账户的用户兴趣之间通常不具有相似性，即，两个真实账户之间存在负相关的关系。因此，可以采用两个不同的真实账户的账户行为组成负样本。

另一种构造负样本的具体方式中，可以从大量的虚拟账户中，选取分别与不同的真实账户关联的虚拟账户，并采用所选取虚拟账户的账户行为，组成上述的负样本。

例如，虚拟账户user01_a对应于真实账户user01，虚拟账户user02_a对应于真实账户user02，虚拟账户user01_a的账户行为[click1、click2]和虚拟账户user02_a的账户行为[click5、click6]组成负样本。

需要说明的是，由于与不同的真实账户关联的虚拟账户的账户行为，是从不同的真实账户的账户行为中拆分得到的，因此，虚拟账户的账户行为之间不具有相似性，即，虚拟账户之间存在负相关的关系。由关联于不同真实账户的虚拟账户的账户行为所组成的样本，为反映账户之间不具有相似性的负样本。

服务器21得到正样本和负样本，可以作为上述训练样本。

通过将正样本和负样本作为训练样本，采用该训练样本对推荐模型进行训练，使得训练后的推荐模型可以建立起不同的账户行为与反映用户兴趣的行为特征之间的关联关系，从而可以针对账户行为提取出准确、全面反映用户兴趣的行为特征。

在步骤S14中，采用所述训练样本对推荐模型进行训练，其中，所述推荐模型用于搜索待推荐账户的相似账户，并根据所述相似账户的账户行为向所述待推荐账户进行内容推荐。

其中，推荐模型可以为基于协同过滤算法构建的用于提取行为特征的神经网络模型，推荐模型也可以称为协同过滤模型。例如，推荐模型可以具体为DNN(Deep NeuralNetworks，深度神经网络)模型。

其中，行为特征可以为反映用户兴趣的特征向量。例如，行为特征可以为DNN模型输出的embedding(嵌入层输出特征)向量。

其中，待推荐账户可以为当前需要进行内容推荐的账户。

其中，相似账户可以为用户兴趣与待推荐账户相似的账户。

具体实现中，服务器21可以将训练样本输入至推荐模型。其中，每个训练样本可以包括有至少两个虚拟账户的账户行为，推荐模型针对每个虚拟账户的账户行为输出embedding vetcor(向量)，作为上述的行为特征。对于至少两个虚拟账户的账户行为，则得到相对应的至少两个行为特征。

然后，计算所输出的行为特征之间的预测相似度，并将计算得到的预测相似度与该训练样本所对应的期望相似度进行比较，得到预测相似度与期望相似度之间的差异，针对该差异通过反向传播的方式调整推荐模型的权重参数，直至推荐模型收敛。

例如，一个正样本由虚拟账户user01_a的账户行为[click1、click2]和虚拟账户user01_b的账户行为[click3、click4]组成，将正样本输入至推荐模型，推荐模型针对虚拟账户user01_a的账户行为[click1、click2]输出一个行为特征vector_A，针对虚拟账户user01_b的账户行为[click3、click4]输出一个行为特征vector_B，计算vector_A和vector_B之间的预测相似度，正样本的期望相似度为1，如果预测相似度不为1，通过预测相似度与期望相似度之间的差值，通过反向传播的方式调整推荐模型的权重参数，直至计算得到的预测相似度无限接近于1，即推荐模型收敛。

当采用优化推荐模型进行在线的实时推荐时，可以确定当前的待推荐账户，从待推荐账户的行为日志中提取出其账户行为，将提取出的账户行为输入至优化推荐模型，优化推荐模型从输入的账户行为中提取出行为特征。根据行为特征与多个账户的行为特征进行相似度的计算，将与待推荐账户的相似度较高的账户作为相似账户，并根据相似账户的账户行为，即根据相似账户的内容链接点击行为、进行内容标记行为、账户标记行为、内容链接标记行所关联的多媒体内容，向待推荐账户进行推荐。

上述模型训练方法中，通过获取登录平台的真实账户的行为日志，利用行为日中所记录的账户行为，生成多个虚拟账户的账户行为，将与同一个真实账户关联的虚拟账户确定为相似虚拟账户，作为代表具有相似用户兴趣的虚拟账户，采用相似虚拟账户的账户行为生成正样本中的样本对；将与不同的真实账户关联的虚拟账户确定为不相似虚拟账户，作为代表具有不相似用户兴趣的虚拟账户，采用不相似虚拟账户的账户行为生成负样本中的样本对。由此，采用上述正样本和负样本对推荐模型进行训练，使得推荐模型学习到更多的账户行为之间的正相关关系和负相关关系，从而，推荐模型可以基于更多的账户行为之间的正相关关系和负相关关系，提取出可以准确反映用户真实兴趣的行为特征，基于可以准确反映用户真实兴趣的行为特征进行相似用户的搜索，则可以准确地搜索出相似用户，解决了相关技术中无法准确搜索出相似用户的问题。

作为本公开一个可选实施方式，所述真实账户包括第一真实账户和第二真实账户，如图4所示，所述步骤S13可以包括以下步骤：

在步骤S131中，确定均与所述第一真实账户关联的至少两个所述虚拟账户，得到所述相似虚拟账户；采用所述相似虚拟账户的账户行为组成所述正样本中的样本对。

具体实现中，服务器21在基于生成的虚拟账户生成训练样本时，可以首先在多个真实账户中，确定第一真实账户和第二真实账户，然后确定第一真实账户所关联的多个虚拟账户。服务器21可以将同样地关联于第一真实账户的两个或多个的虚拟账户的账户行为，组成正样本。

实际应用中，服务器21还可以将同样地关联于第二真实账户的两个或多个的第二虚拟账户的账户行为，组成正样本。

在步骤S132中，确定与所述第一真实账户关联的虚拟账户和与所述第二真实账户关联的虚拟账户，得到所述不相似虚拟账户；采用所述不相似虚拟账户的账户行为组成所述负样本中的样本对。

具体实现中，服务器21可以将关联于第一真实账户的虚拟账户的账户行为，与关联于第二真实账户的虚拟账户的账户行为，组成负样本。

例如，user01_a和user01_b两个虚拟账户均关联同一个真实账户user01，虚拟账户user01_a的账户行为[click1、click2]和虚拟账户user01_b的账户行为[click3、click4]组成正样本。虚拟账户user01_a关联真实账户user01，虚拟账户user02_a关联真实账户user02，虚拟账户user01_a的账户行为[click1、click2]和虚拟账户user02_a的账户行为[click5、click6]组成负样本。

在步骤S133中，将所述正样本和所述负样本组成所述训练样本。

具体实现中，将上述正样本和负样本，作为上述的训练样本。

作为本公开一个可选实施方式，与所述真实账户关联的虚拟账户具有N个，N≥2，步骤S12可以包括以下步骤：

具体实现中，可以统计真实账户所对应的虚拟账户的数量，作为上述的账户数量N。按照给账户数量N，将真实账户的多个账户行为划分成N份，将N份账户行为分别作为N个虚拟账户的账户行为。

在实际应用中，可以生成真实账户的两个虚拟账户，因此，可以将真实账户的行为均分为两份，将两份账户行为分别作为两个虚拟账户的账户行为。

例如，真实账户的虚拟账户具有2个，该真实账户的账户行为有10个，则将10个账户行为均分为两份账户行为，每份账户行为均包含有5个账户行为，作为虚拟账户的账户行为。

上述模型训练方法中，通过根据虚拟账户的账户数量将真实账户的账户行为均分，得到N个虚拟账户的账户行为，使得正样本和负样本中不同虚拟账户的账户行为的数量一致，避免由于数量的差异导致推荐模型提取的行为特征有较大差异、而最终导致将相似的账户错判为不相似或者将不相似的账户错判为相似，从而提升了对推荐模型的训练效果。

作为本公开一个可选实施方式，所述真实账户的账户行为具有多个，所述账户行为具有行为时间，多个所述账户行为形成按照所述行为时间排序的有序行为序列，如图3所示，步骤S12可以包括以下步骤：

在步骤S121中，对所述有序行为序列中的多个所述账户行为的排序进行调整，形成无序行为序列；所述无序行为序列中的多个所述账户行为的行为时间之间无序。

其中，行为时间可以为真实账户进行账户行为的时间。

其中，有序行为序列可以为按照行为时间排序的多个账户行为的序列。

其中，无序行为序列可以为未按照行为时间排序的多个账户行为的序列

具体实现中，由于行为日志中通常是按照账户行为的行为时间进行记录，因此，行为日志中的多个账户行为是按照行为时间排序，形成有序行为序列。服务器21在从行为日志提取出多个账户行为形成的有序行为序列时，可以对有序行为序列中的多个账户行为的排序进行调整，形成多个账户行为的行为时间并非按序排列的无序行为序列。例如，对于点击行为的按照行为时间排序的有序行为序列[click1、click2、click3、click4]，将多个账户行为随机打乱，形成无序行为序列[click3、click2、click1、click4]，使得多个账户行为不再按照行为时间有序地排列。

在步骤S122中，将所述无序行为序列分割成子序列。

在步骤S123中，将所述子序列所包含的账户行为，作为所述虚拟账户的账户行为。

其中，子序列可以为序列中的部分账户行为所形成的序列。

具体实现中，服务器21在得到无序行为序列之后，可以将无序行为序列分割为若干条子序列，将子序列中所包含的账户行为作为虚拟账户的账户行为。

例如，无序行为序列为[click3、click2、click1、click4]，分割该序列得到两条子序列[click3、click2]和[click1、click4]，将click3、click2作为一个虚拟账户user01_a的账户行为，将click1、click4作为另一个虚拟账户user01_b的账户行为。

上述模型训练方法中，通过将有序行为序列中的账户行为的有序排序调整为无须排序，基于无须行为序列分割出的子序列得到虚拟账户的账户行为，使得虚拟账户的账户行为在行为时间上具有分散性，避免出现某个虚拟账户的账户行为均为真实账户较早期的账户行为、而无法准确反映真实的用户兴趣的问题。

作为本公开一个可选实施方式，所述训练样本具有对应的期望相似度，如图5所示，所述步骤S14可以包括以下步骤：

在步骤S141中，将所述训练样本输入至所述推荐模型；所述推荐模型包括第一模型和第二模型，所述第一模型和所述第二模型共享权重参数；所述第一模型和所述第二模型根据共享的所述权重参数输出行为特征。

具体实现中，服务器21可以构建具有双塔结构的推荐模型。双塔结构的推荐模型可以由两个推荐模型组成。两个推荐模型可以共享权重参数，即，采用相同的权重参数计算行为特征。为了便于描述，两个推荐模型分别命名为第一模型和第二模型。

服务器21可以将训练样本输入至双塔结构的推荐模型，双塔结构的推荐模型中的其中一个推荐模型，针对训练样本中的其中一个虚拟账户的账户行为计算出行为特征embedding01并输出，双塔结构的推荐模型中的另一个推荐模型，针对训练样本中的另一个虚拟账户的账户行为计算出行为特征embedding02并输出。

在步骤S142中，得到所述第一模型输出的第一行为特征和所述第二模型输出的第一行为特征。

在步骤S143中，计算所述第一行为特征和所述第二行为特征之间的预测相似度。

具体实现中，服务器21可以得到第一模型和第二模型分别输出的第一行为特征embedding01和第二行为特征embedding02，并计算第一行为特征embedding01和第二行为特征embedding02之间的相似度，作为上述的预测相似度。

实际应用中，由于行为特征为向量，因此可以通过sigmoid函数(一种S型激活函数)计算出两个向量之间的相似度。

在步骤S144中，根据所述预测相似度与所述期望相似度之间的差异，调整所述权重参数，得到优化推荐模型。

具体实现中，可以针对每个训练样本生成对应的期望相似度，例如，正样本对应的期望相似度为1，即两个虚拟账户之间相似。又例如，负样本对应的期望相似度为0，即两个虚拟账户之间不相似。

服务器21可以将计算得到的预测相似度与期望相似度进行比较，得到两者之间的差异，根据该差异调整推荐模型中的权重参数，得到上述的优化推荐模型。

如图6所示，是一个实施例的一种双塔结构的协同过滤模型。如图所示，双塔结构的协同过滤模型包括有两个深度神经网络模型，两个深度神经网络模型共享权重参数。输入训练样本至该双塔结构的协同过滤模型，将一个虚拟账户A的账户行为输入至左侧的深度神经网络模型，将另一个虚拟账户B的账户行为输入至右侧的深度神经网络模型，两个深度神经网络模型分别输出行为特征embedding的向量，然后计算两个向量的预测相似度。根据预测相似度与该训练样本对应的期望相似度的差异，通过反向传播的方法调整权重参数，直至双塔结构的协同过滤模型收敛。

作为本公开一个可选实施方式，在所述步骤S14之后，所述方法可以还包括以下步骤：

将所述待推荐账户的账户行为输入至所述优化推荐模型；获取所述优化推荐模型输出的第三行为特征，并根据所述第三行为特征搜索所述待推荐账户的相似账户；根据所述相似账户的账户行为，向所述待推荐账户推荐多媒体内容。

具体实现中，当采用优化推荐模型进行在线的实时推荐时，可以确定当前的待推荐账户，从待推荐账户的行为日志中提取出其账户行为，将提取出的账户行为输入至优化推荐模型，优化推荐模型从输入的账户行为中提取出行为特征。为了区分说明，从待推荐账户的账户行为提取出的行为特征命名为第三行为特征。

服务器21可以根据第三行为特征与多个账户的行为特征进行相似度的计算，将与待推荐账户的相似度较高的账户作为相似账户，并根据相似账户的账户行为，向待推荐账户进行推荐。

上述模型训练方法中，通过获取登录平台的真实账户的行为日志，利用行为日中所记录的账户行为，生成多个虚拟账户的账户行为，将与同一个真实账户关联的虚拟账户确定为相似虚拟账户，作为代表具有相似用户兴趣的虚拟账户，采用相似虚拟账户的账户行为生成正样本中的样本对；将与不同的真实账户关联的虚拟账户确定为不相似虚拟账户，作为代表具有不相似用户兴趣的虚拟账户，采用不相似虚拟账户的账户行为生成负样本中的样本对。由此，采用上述正样本和负样本对推荐模型进行训练，使得推荐模型学习到账户行为与准确反映用户兴趣的行为特征之间的关系，在进行内容推荐时，推荐模型可以基于账户行为与行为特征之间的关系，从账户行为中提取出更准确反映用户兴趣的行为特征，基于更准确反映用户兴趣的行为特征进行内容推荐，可以将用户真正感兴趣的内容推荐给用户，解决了相关技术中推荐给用户的内容不符合用户需求的问题。

作为本公开一个可选实施方式，所述根据所述第三行为特征搜索所述待推荐账户的相似账户的步骤，可以包括以下步骤：

具体实现中，服务器21可以从P个候选账户中召回得到K个相似账户。具体地，可以将P个候选账户的行为特征分别与第三行为特征进行相似度的计算，得到P个候选账户相应的预测相似度，按照预测相似度对候选账户进行降序排序，并将排序前K个候选账户作为相似账户。

实际应用中，可以通过采用kNN(k-NearestNeighbor，k近邻算法)算法的如annoy(一种实现近邻算法的程序)树结构等的工具实现上述搜索相似账户的过程。

图7是根据一示例性实施例示出的一种多媒体内容推荐方法的流程图，如图7所示，该方法包括以下步骤：

在步骤S71中，获取登录平台的真实账户的行为日志；所述行为日志记录有所述真实账户在访问所述平台的页面的过程中对所述页面上展示的多媒体内容所进行的账户行为；

在步骤S72中，基于所述真实账户的账户行为，生成与所述真实账户关联的至少两个虚拟账户各自的账户行为；

在步骤S73中，基于生成的虚拟账户生成训练样本，其中，所述训练样本包括正样本和负样本，所述正样本中的样本对基于相似虚拟账户的账户行为而生成；所述负样本中的样本对基于不相似虚拟账户的账户行为而生成；所述相似虚拟账户为与同一个真实账户关联的虚拟账户；所述不相似虚拟账户为与不同的真实账户关联的虚拟账户；

在步骤S74中，采用所述训练样本对推荐模型进行训练，得到优化推荐模型；

在步骤S75中，获取待推荐账户的账户行为，并将所述待推荐账户的账户行为输入至所述优化推荐模型；

在步骤S76中，获取所述优化推荐模型输出的行为特征，并根据所述行为特征搜索所述待推荐账户的相似账户；

在步骤S77中，根据所述相似账户的账户行为，向所述待推荐账户推荐多媒体内容。

由于上述各个步骤已经在前述实施例中有详细说明，在此不再赘述。

上述多媒体内容推荐方法中，通过获取登录平台的真实账户的行为日志，利用行为日中所记录的账户行为，生成多个虚拟账户的账户行为，将与同一个真实账户关联的虚拟账户确定为相似虚拟账户，作为代表具有相似用户兴趣的虚拟账户，采用相似虚拟账户的账户行为生成正样本中的样本对；将与不同的真实账户关联的虚拟账户确定为不相似虚拟账户，作为代表具有不相似用户兴趣的虚拟账户，采用不相似虚拟账户的账户行为生成负样本中的样本对。由此，采用上述正样本和负样本对推荐模型进行训练，使得推荐模型学习到账户行为与准确反映用户兴趣的行为特征之间的关系，在进行内容推荐时，推荐模型可以基于账户行为与行为特征之间的关系，从账户行为中提取出更准确反映用户兴趣的行为特征，基于更准确反映用户兴趣的行为特征进行相似用户的搜索，则可以准确地搜索出相似用户，解决了相关技术中无法准确搜索出相似用户的问题。

而且，进行内容推荐，在准确地搜索出相似用户后，可以将用户真正感兴趣的内容推荐给用户，解决了相关技术中推荐给用户的内容不符合用户需求的问题。

图8是根据一示例性实施例示出的一种多媒体内容推荐系统的框架示意图。在一个多媒体内容推荐系统80中，可以包含有实时训练模块81和在线推荐服务模块82，实时训练模块81可以对通过分布式发布订阅消息系统kafka得到的行为日志进行清洗、去重等的日志加工，形成真实账户的行为日志，然后，读取该行为日志，得到真实账户的账户行为。实时训练模块81还可以将真实账户的账户行为拆分形成多个虚拟账户的账户行为，采用虚拟账户的账户行为形成正样本和负样本，利用正样本和负样本对用于进行行为特征提取的协同过滤模型进行训练。在需要进行多媒体内容推荐时，可以将待推荐账户的账户行为以及该待推荐账户的上下文特征(账户的联系方式、地理位置等)、自然属性、社会属性等一同输入至训练好后的协同过滤模型，协同过滤模型输出行为特征embedding，将该发送给在线推荐服务模块82，在线推荐服务模块82使用该embedding构建annoy树结构，并利用kNN算法搜索出相似度排序前K个相似账户，最后根据排序前K个相似账户的近期账户行为，向待推荐账户推荐视频、音频等的多媒体内容。

图9是根据一示例性实施例示出的一种用于进行内容推荐的模型训练装置框图。参照图9，该装置包括：

日志获取单元91，被配置为执行获取登录平台的真实账户的行为日志；所述行为日志记录有所述真实账户在访问所述平台的页面的过程中对所述页面上展示的内容所进行的账户行为；

虚拟账户行为生成单元92，被配置为执行基于所述真实账户的账户行为，生成与所述真实账户关联的至少两个虚拟账户各自的账户行为；

样本生成单元93，被配置为执行基于生成的虚拟账户生成训练样本，其中，所述训练样本包括正样本和负样本，所述正样本中的样本对基于相似虚拟账户的账户行为而生成；所述负样本中的样本对基于不相似虚拟账户的账户行为而生成；所述相似虚拟账户为与同一个真实账户关联的虚拟账户；所述不相似虚拟账户为与不同的真实账户关联的虚拟账户；

模型训练单元94，被配置为执行采用所述训练样本对推荐模型进行训练，其中，所述推荐模型用于搜索待推荐账户的相似账户，并根据所述相似账户的账户行为向所述待推荐账户进行内容推荐。

作为本公开一个可选实施方式，所述真实账户包括第一真实账户和第二真实账户，所述样本生成单元93，被配置为执行：

作为本公开一个可选实施方式，与所述真实账户关联的虚拟账户具有N个，N≥2，所述虚拟账户行为生成单元92，被配置为执行：

作为本公开一个可选实施方式，所述真实账户的账户行为具有多个，所述账户行为具有行为时间，多个所述账户行为形成按照所述行为时间排序的有序行为序列，所述虚拟账户行为生成单元92，被配置为执行：

作为本公开一个可选实施方式，所述训练样本具有对应的期望相似度，所述模型训练单元94，被配置为执行：

作为本公开一个可选实施方式，所述装置还包括：

图10是根据一示例性实施例示出的一种多媒体内容推荐装置的框图。参照图10，该装置包括：

日志获取单元101，被配置为执行获取登录平台的真实账户的行为日志；所述行为日志记录有所述真实账户在访问所述平台的页面的过程中对所述页面上展示的多媒体内容所进行的账户行为；

虚拟账户行为生成单元102，被配置为执行基于所述真实账户的账户行为，生成与所述真实账户关联的至少两个虚拟账户各自的账户行为；

样本生成单元103，被配置为执行基于生成的虚拟账户生成训练样本，其中，所述训练样本包括正样本和负样本，所述正样本中的样本对基于相似虚拟账户的账户行为而生成；所述负样本中的样本对基于不相似虚拟账户的账户行为而生成；所述相似虚拟账户为与同一个真实账户关联的虚拟账户；所述不相似虚拟账户为与不同的真实账户关联的虚拟账户；

模型训练单元104，被配置为执行采用所述训练样本对推荐模型进行训练，得到优化推荐模型；

输入单元105，被配置为执行获取待推荐账户的账户行为，并将所述待推荐账户的账户行为输入至所述优化推荐模型；

特征提取单元106，被配置为执行获取所述优化推荐模型输出的行为特征，并根据所述行为特征搜索所述待推荐账户的相似账户；

推荐单元107，被配置为执行根据所述相似账户的账户行为，向所述待推荐账户推荐多媒体内容。

关于上述的模型训练、多媒体内容推荐装置的具体限定可以参见上文中对于模型训练、多媒体内容推荐方法的限定，在此不再赘述。上述装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

上述提供的装置可用于执行上述任意实施例提供的模型训练、多媒体内容推荐方法，具备相应的功能和有益效果。

图11是根据一示例性实施例示出的一种计算机设备，该计算机设备可以是终端或者服务器，其内部结构图可以如图11所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种模型训练方法和多媒体内容推荐方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图11中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

本公开还提供一种计算机程序产品，包括：计算机程序代码，当所述计算机程序代码被计算机运行时，使得所述计算机执行上述的模型训练方法和多媒体内容推荐方法。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

需要说明的是，本公开涉及的账户/用户信息均为经用户/账户授权之后采集并进行后续处理分析的。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种用于进行内容推荐的模型训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述真实账户包括第一真实账户和第二真实账户，所述基于生成的虚拟账户生成训练样本，包括：

确定均与所述第一真实账户关联的至少两个所述虚拟账户，得到所述相似虚拟账户；

确定与所述第一真实账户关联的虚拟账户和与所述第二真实账户关联的虚拟账户，得到所述不相似虚拟账户；

将所述正样本和所述负样本组成所述训练样本。

3.根据权利要求1所述的方法，其特征在于，与所述真实账户关联的虚拟账户具有N个，N≥2，所述基于所述真实账户的账户行为，生成与所述真实账户关联的至少两个虚拟账户各自的账户行为，包括：

4.根据权利要求1所述的方法，其特征在于，所述真实账户的账户行为具有多个，所述账户行为具有行为时间，多个所述账户行为形成按照所述行为时间排序的有序行为序列，所述基于所述真实账户的账户行为，生成与所述真实账户关联的至少两个虚拟账户各自的账户行为，包括：

将所述无序行为序列分割成子序列；

5.根据权利要求1所述的方法，其特征在于，所述训练样本具有对应的期望相似度，所述采用所述训练样本对推荐模型进行训练，包括：

得到所述第一模型输出的第一行为特征和所述第二模型输出的第二行为特征；

6.根据权利要求5所述的方法，其特征在于，还包括：

将所述待推荐账户的账户行为输入至所述优化推荐模型；

7.根据权利要求6所述的方法，其特征在于，所述根据所述第三行为特征搜索所述待推荐账户的相似账户的步骤，包括：

确定P个候选账户；

8.一种多媒体内容推荐方法，其特征在于，包括：

9.一种用于进行内容推荐的模型训练装置，其特征在于，包括：

10.根据权利要求9所述的装置，其特征在于，所述真实账户包括第一真实账户和第二真实账户，所述样本生成单元，被配置为执行：

采用所述相似虚拟账户的账户行为组成所述正样本；

采用所述不相似虚拟账户的账户行为组成所述负样本；

将所述正样本和所述负样本组成所述训练样本。

11.根据权利要求9所述的装置，其特征在于，与所述真实账户关联的虚拟账户具有N个，N≥2，所述虚拟账户行为生成单元，被配置为执行：

12.根据权利要求9所述的装置，其特征在于，所述真实账户的账户行为具有多个，所述账户行为具有行为时间，多个所述账户行为形成按照所述行为时间排序的有序行为序列，所述虚拟账户行为生成单元，被配置为执行：

对所述有序行为序列中的多个所述账户行为的排序进行调整，形成无序行为序列；

所述无序行为序列中的多个所述账户行为的行为时间之间无序；

将所述无序行为序列分割成子序列；

13.根据权利要求9所述的装置，其特征在于，所述训练样本具有对应的期望相似度，所述模型训练单元，被配置为执行：

14.根据权利要求13所述的装置，其特征在于，所述装置还包括：

15.根据权利要求14所述的装置，其特征在于，所述特征提取单元，被配置为执行：

确定P个候选账户；

16.一种多媒体内容推荐装置，其特征在于，包括：

17.一种计算机设备，其特征在于，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如权利要求1至7中任一项所述的方法，或者，以实现如权利要求8所述的方法。

18.一种存储介质，当所述存储介质中的指令由计算机设备的处理器执行时，使得计算机设备能够执行如权利要求1至7中任一项所述的方法，或者，使得计算机设备能够执行如权利要求8所述的方法。