CN110555131B

CN110555131B - 内容推荐方法、内容推荐装置和电子设备

Info

Publication number: CN110555131B
Application number: CN201810258812.4A
Authority: CN
Inventors: 刘荣
Original assignee: Alibaba China Co Ltd
Current assignee: Alibaba China Co Ltd
Priority date: 2018-03-27
Filing date: 2018-03-27
Publication date: 2023-04-07
Anticipated expiration: 2038-03-27
Also published as: CN110555131A

Abstract

本申请涉及一种内容推荐方法、内容推荐装置和电子设备。该内容推荐方法包括：获取用户对于第一内容和第二内容的行为数据，所述第一内容和所述第二内容具有相同类型和不同子类型；确定所述第一内容的至少一个第一标签和所述第二内容的至少一个第二标签；计算所述至少一个第一标签中的每个第一标签的第一词向量和所述至少一个第二标签中的每个第二标签的第二词向量；计算所述第一词向量和所述第二词向量之间的距离作为所述第一标签和所述第二标签之间的标签相似度；以及，基于所述标签相似度向用户提供内容。这样，可以利用用户的异构数据进行用户的画像迁移，提高用户兴趣预测的准确度，优化用户体验。

Description

内容推荐方法、内容推荐装置和电子设备

技术领域

本申请总的来说涉及数据处理领域，且更为具体地，涉及一种内容推荐方法、内容推荐装置和电子设备。

背景技术

随着文化产业的发展，越来越多的内容被生产出来，以满足人们日益增长的需求。并且，随着内容表现形式的丰富，越来越多的内容被以诸如多媒体的形式表现出来。

当用户需要获取自己所需的内容时，针对网络上的海量内容，用户需要花费大量的时间才能找到自己想要的内容。如果用户需要浏览大量无关的内容，这个过程显然会使得用户感到不便。

尤其是，即使对于相同类型的内容，例如视频，随着其类型的进一步细分，也出现了更精细的子类型。例如，许多平台将视频分类为UGC(用户生产内容)、PGC(专业生产内容)和OGC(品牌生产内容)。

因此，需要根据用户的兴趣特点，向用户推荐用户可能感兴趣的内容。特别是，当仅掌握用户对于某一子类型的内容的兴趣特点时，也需要据此向用户推荐其它子类型的内容。

因此，需要改进的内容推荐方案。

发明内容

为了解决上述技术问题，提出了本申请。本申请的实施例提供了一种内容推荐方法、内容推荐装置和电子设备，其可以利用用户的异构数据进行用户的画像迁移，提高用户兴趣预测的准确度，优化用户体验。

根据本申请的一方面，提供了一种内容推荐方法，包括：获取用户对于第一内容和第二内容的行为数据，所述第一内容和所述第二内容具有相同类型和不同子类型；确定所述第一内容的至少一个第一标签和所述第二内容的至少一个第二标签；计算所述至少一个第一标签中的每个第一标签的第一词向量和所述至少一个第二标签中的每个第二标签的第二词向量；通过所述第一词向量和所述第二词向量计算所述第一标签和所述第二标签之间的标签相似度；以及，基于所述标签相似度向用户提供内容。

在上述内容推荐方法中，获取用户对于第一内容和第二内容的行为数据包括：获取用户在预定时段内对于所述第一内容和所述第二内容的行为数据。

在上述内容推荐方法中，计算所述至少一个第一标签中的每个第一标签的第一词向量和所述至少一个第二标签中的每个第二标签的第二词向量包括：通过神经网络语言模型计算所述至少一个第一标签中的每个第一标签的第一词向量和所述至少一个第二标签中的每个第二标签的第二词向量，所述神经网络语言模型中标签向量的维度是50维。

在上述内容推荐方法中，通过所述第一词向量和所述第二词向量计算所述第一标签和所述第二标签之间的标签相似度包括：通过所述第一词向量和所述第二词向量的余弦函数计算所述第一标签和所述第二标签之间的标签相似度；以及，通过所述第一词向量和所述第二词向量之间的距离计算所述第一标签和所述第二标签之间的标签相似度。

在上述内容推荐方法中，所述第一内容和所述第二内容是视频内容；所述第一内容是用户生产内容、专业生产内容和品牌生产内容中的一个；以及，所述第二内容是用户生产内容、专业生产内容和品牌生产内容中的另一个。

根据本申请的另一方面，提供了一种内容推荐装置，包括：数据获取单元，用于获取用户对于第一内容和第二内容的行为数据，所述第一内容和所述第二内容具有相同类型和不同子类型；标签确定单元，用于确定所述第一内容的至少一个第一标签和所述第二内容的至少一个第二标签；词向量计算单元，用于计算所述至少一个第一标签中的每个第一标签的第一词向量和所述至少一个第二标签中的每个第二标签的第二词向量；相似度计算单元，用于通过所述第一词向量和所述第二词向量计算所述第一标签和所述第二标签之间的标签相似度；以及，内容提供单元，用于基于所述标签相似度向用户提供内容。

在上述内容推荐装置中，所述数据获取单元用于获取用户在预定时段内对于所述第一内容和所述第二内容的行为数据。

在上述内容推荐装置中，所述词向量计算单元用于通过神经网络语言模型计算所述至少一个第一标签中的每个第一标签的第一词向量和所述至少一个第二标签中的每个第二标签的第二词向量，所述神经网络语言模型中标签向量的维度是50维。

在上述内容推荐装置中，所述相似度计算单元用于以下的其中之一：通过所述第一词向量和所述第二词向量的余弦函数计算所述第一标签和所述第二标签之间的标签相似度；以及，通过所述第一词向量和所述第二词向量之间的距离计算所述第一标签和所述第二标签之间的标签相似度。

在上述内容推荐装置中，所述第一内容和所述第二内容是视频内容；所述第一内容是用户生产内容、专业生产内容和品牌生产内容中的一个；以及，述第二内容是用户生产内容、专业生产内容和品牌生产内容中的另一个。

根据本申请的又一方面，提供了一种电子设备，包括：处理器；以及，存储器，在所述存储器中存储有计算机程序指令，所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的内容推荐方法。

本申请提供的内容推荐方法、内容推荐装置和电子设备可以利用用户的异构数据进行用户的画像迁移，提高用户兴趣预测的准确度，优化用户体验。

附图说明

通过阅读下文优选的具体实施方式中的详细描述，本申请各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。说明书附图仅用于示出优选实施方式的目的，而并不认为是对本申请的限制。显而易见地，下面描述的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。而且在整个附图中，用相同的附图标记表示相同的部件。

图1图示了根据本申请实施例的内容推荐方法的流程图；

图2图示了根据本申请实施例的内容推荐装置的框图；

图3图示了根据本申请实施例的电子设备的框图。

具体实施方式

下面，将参考附图详细地描述根据本申请的示例实施例。显然，所描述的实施例仅仅是本申请的一部分实施例，而不是本申请的全部实施例，应理解，本申请不受这里描述的示例实施例的限制。

申请概述

如上所述，随着内容形式的不断丰富，即使对于某一类型的内容，比如视频，各个视频平台在视频内容上也会出现不同的视频子类型(比如，UGC视频、PGC视频或者OGC视频)。并且，在视频平台上，既会向用户推荐UGC视频，也会给用户推荐PGC视频，从而满足用户的不同需求。但是，在推荐策略上，不同子类型的视频，例如UGC视频和PGC视频在视频内容上有一定的区别，从而使得用于推荐视频的内容标签和内容分布上的差异较大。这种不同子类型的内容数据也可以被称为异构数据。

因此，如何在内容平台内利用用户对于某一子类型的内容的行为，推荐出用户感兴趣的另一子类型的内容，满足用户对不同子类型的内容的需求，显得尤为重要。

针对上述技术问题，本申请的基本构思是收集用户对于不同子类型的内容的行为数据，例如观看不同子类型的视频的观看行为数据，并基于上述观看行为数据获取与所述内容对应的标签，并计算所述标签的词向量，以词向量之间的距离作为标签之间的标签相似度，以向用户推荐内容。因此，在获得了不同子类型的内容的标签之间的标签相似度之后，就可以针对某一子类型的内容的用户标签画像计算出用户对于另一子类型的内容的标签画像，从而实现用户的画像迁移，以推荐出用户感兴趣的内容。

基于此，本申请提出了一种内容推荐方法、内容推荐装置和电子设备，其首先获取用户对于不同子类型的内容的行为数据，再确定内容对应的标签，并以获得每个标签的词向量，计算词向量之间的距离作为标签的相似度，从而向用户推荐内容。因此，可以利用用户针对不同子类型的内容的行为数据进行用户的画像迁移，提高预测用户对于不同子类型的内容的喜好的准确度，提高用户体验。

需要说明的是，本申请的上述基本构思可以应用于各种用于推荐内容的推荐系统和相应的产品，包括视频内容、音频内容、文字内容以及其它内容的推荐系统和相应的产品等。

在介绍了本申请的基本原理之后，下面将参考附图来具体介绍本申请的各种非限制性实施例。

示例性方法

图1图示了根据本申请实施例的内容推荐方法的流程图。

如图1所示，根据本申请实施例的内容推荐方法包括：S110，获取用户对于第一内容和第二内容的行为数据，所述第一内容和所述第二内容具有相同类型和不同子类型；S120，确定所述第一内容的至少一个第一标签和所述第二内容的至少一个第二标签；S130，计算所述至少一个第一标签中的每个第一标签的第一词向量和所述至少一个第二标签中的每个第二标签的第二词向量；S140，通过所述第一词向量和所述第二词向量计算所述第一标签和所述第二标签之间的标签相似度；以及S150，基于所述标签相似度向用户提供内容。

在步骤S110中，获取用户对于第一内容和第二内容的行为数据，所述第一内容和所述第二内容具有相同类型和不同子类型。如上所述，由于内容的进一步细分，即使对于同一类型的内容，例如视频，也可以细分为不同的子类型。例如，各个视频平台向用户提供的视频可以细分为UGC(用户生产内容)、PGC(专业生产内容)和OGC(品牌生产内容)。

具体地，UGC指的是用户原创内容，是伴随着以提倡个性化为主要特点的网络2.0(Web2.0)概念而兴起的。UGC反映的不仅是某一种具体的业务，也是一种用户使用互联网的新方式，即由原来的以下载为主变成下载和上传并重。PGC指的是专业生产内容(例如，视频网站)或者专家生产内容(例如，微博)。其特点时内容个性化、视角多元化、传播民主化、社会关系虚拟化。OGC指的是品牌生产内容，主要通过具有一定知识和专业背景的行业人士生产内容，并且这些人士会领取相应的报酬。例如，媒体平台的记者、编辑等，既有新闻的专业背景，也以写稿为职业领取报酬。

因此，在根据本申请实施例的内容推荐方法中，所述第一内容和所述第二内容是类型相同的内容，例如，都属于视频、音频或者文本等，但是其进一步细分的子类型不同，例如，在所述第一内容和所述第二内容都是视频的情况下，所述第一内容可以是如上所述的UGC、PGC和OGC视频中的一个，且所述第二内容是UGC、PGC和OGC视频中的另一个。

此外，现在的内容平台除了向用户提供内容以外，也会向用户推送广告，例如，视频平台会向用户推送视频广告。并且，为了提升广告推送的精确性，也会对广告设置标签。因此，在根据本申请实施例的内容推荐方法中，所述第一内容和所述第二内容也可以是一般内容和广告。

在根据本申请实施例的内容推荐方法中，用户对于第一内容和第二内容的行为数据指的是用户基于推荐系统的推荐选择特定内容的行为，以视频为例，是用户观看特定视频的行为。以用户对UGC和PGC视频的观看行为为例，可以用uv代表UGC视频，pv代表PGC视频，则用户的行为数据可以表示为h＝{pv1,pv2,…,pvN,uv1,uv2,…,uvM}。

这里，为了准确地反映用户的行为，用户对于第一内容和第二内容的行为数据指的是使用内容平台的所有用户的行为数据。即，内容平台可以获取在一段时间内所有用户的行为数据，例如视频平台获取近15天内所有用户观看特定视频的行为数据。

但是，由于用户对于内容的行为数据反映了用户对于内容的兴趣，且用户对于内容的兴趣并不是一成不变的。举例来说，如果用户在一个视频网站上观看视频，一个月前观看动漫相关视频，但是一个月后可能开始观看游戏相关视频。为了能够获得用户相对稳定的兴趣，在根据本申请实施例的内容推荐方法中，通过时间的切分获取用户的短时稳定兴趣。也就是说，假定用户的兴趣在短时间内是稳定的，但是在长时间上是变化的。因此，可以根据用户一段时期内针对内容的行为，将此行为按照时间切分为多个行为序列。

也就是说，在根据本申请实施例的内容推荐方法中，获取用户对于第一内容和第二内容的行为数据包括：获取用户在预定时段内对于所述第一内容和所述第二内容的行为数据。

这里，所述预定时段可以是12个小时，即，将用户针对内容的行为按照12个小时的间隔进行切分，划分为多个行为序列，例如视频观看序列，并记为hs。

在步骤S120中，确定所述第一内容的至少一个第一标签和所述第二内容的至少一个第二标签。例如，针对上述视频观看序列hs＝{pv1,pv2,…,pvN,uv1,uv2,…,uvM}，确定相应的标签序列，例如表示为hst＝{pt1,pt2,…,ptN,ut1,ut2,…,utM}，其中pt表示PGC视频标签，ut表示UGC视频标签。

在步骤S130中，计算所述至少一个第一标签中的每个第一标签的第一词向量和所述至少一个第二标签中的每个第二标签的第二词向量。这里，本领域技术人员可以理解，在根据本申请实施例的内容推荐方法中，可以以各种方式计算标签的词向量。具体地，可以使用word2vec模型获得标签的词向量，且设定标签向量的维度为50。例如，将上述标签序列hst＝{pt1,pt2,…,ptN,ut1,ut2,…,utM}输入word2vec模型中，从而得到每一标签的词向量pt1_vec,pt2_vec,…,ptN_vec和ut1_vec,ut2_vec,…,utM_vec。这里，pt1_vec,pt2_vec,…,ptN_vec表示PGC视频的标签的词向量，且ut1_vec,ut2_vec,…,utM_vec表示UGC视频的标签的词向量。

因此，在根据本申请实施例的内容推荐方法中，计算所述至少一个第一标签中的每个第一标签的第一词向量和所述至少一个第二标签中的每个第二标签的第二词向量包括：通过神经网络语言模型计算所述至少一个第一标签中的每个第一标签的第一词向量和所述至少一个第二标签中的每个第二标签的第二词向量，所述神经网络语言模型中标签向量的维度是50维。

在步骤S140中，通过所述第一词向量和所述第二词向量计算所述第一标签和所述第二标签之间的标签相似度。例如，针对如上所述在步骤S130获得的PGC视频的标签的词向量pt1_vec,pt2_vec,…,ptN_vec和PGC视频的标签的词向量ut1_vec,ut2_vec,…,utM_vec，可以计算p(ut|pt)＝cosin(ut_vec,pt_vec)，其中cosin(ut_vec,pt_vec)是标签向量ut_vec和pt_vec的余弦函数。另外，还可以通过标签向量ut_vec和pt_vec之间的距离来计算两个标签之间的相似度。这里，两个标签向量之间的距离可以是欧氏距离或者曼哈顿距离。

因此，在根据本申请实施例的内容推荐方法中，通过所述第一词向量和所述第二词向量计算所述第一标签和所述第二标签之间的标签相似度包括以下的其中之一：通过所述第一词向量和所述第二词向量的余弦函数计算所述第一标签和所述第二标签之间的标签相似度；以及，通过所述第一词向量和所述第二词向量之间的距离计算所述第一标签和所述第二标签之间的标签相似度。

最后，在步骤S150中，基于所述标签相似度向用户提供内容。

这里，虽然在上文中，以视频平台向用户推荐视频为例进行了说明。但是，本领域技术人员可以理解，根据本申请实施例的内容推荐方法可以应用于各种内容平台向用户推荐内容，也因此用于通过其它类型的异构数据进行针对特定内容的用户画像的迁移。本申请并不意在对此进行任何限制。

示例性装置

图2图示了根据本申请实施例的内容推荐装置的框图。

如图2所示，根据本申请实施例的内容推荐装置200包括：数据获取单元210，用于获取用户对于第一内容和第二内容的行为数据，所述第一内容和所述第二内容具有相同类型和不同子类型；标签确定单元220，用于确定所述数据获取单元210所获取的第一内容的至少一个第一标签和第二内容的至少一个第二标签；词向量计算单元230，用于计算所述标签确定单元220所确定的至少一个第一标签中的每个第一标签的第一词向量和至少一个第二标签中的每个第二标签的第二词向量；相似度计算单元240，用于通过所述词向量计算单元230所计算的第一词向量和第二词向量计算所述第一标签和所述第二标签之间的标签相似度；以及，内容提供单元250，用于基于所述相似度计算单元240所计算的标签相似度向用户提供内容。

在一个示例中，在上述内容推荐装置200中，所述数据获取单元210用于获取用户在预定时段内对于所述第一内容和所述第二内容的行为数据。

在一个示例中，在上述内容推荐装置200中，所述词向量计算单元230用于通过神经网络语言模型计算所述至少一个第一标签中的每个第一标签的第一词向量和所述至少一个第二标签中的每个第二标签的第二词向量，所述神经网络语言模型中标签向量的维度是50维。

在一个示例中，在上述内容推荐装置200中，所述相似度计算单元240用于以下的其中之一：通过所述第一词向量和所述第二词向量的余弦函数计算所述第一标签和所述第二标签之间的标签相似度；以及，通过所述第一词向量和所述第二词向量之间的距离计算所述第一标签和所述第二标签之间的标签相似度。

在一个示例中，在上述内容推荐装置200中，所述第一内容和所述第二内容是视频内容；所述第一内容是用户生产内容、专业生产内容和品牌生产内容中的一个；以及，述第二内容是用户生产内容、专业生产内容和品牌生产内容中的另一个。

这里，本领域技术人员可以理解，上述内容推荐装置200中的各个单元和模块的具体功能和操作已经在上面参考图1描述的内容推荐方法中详细介绍，并因此，将省略其重复描述。

如上所述，根据本申请实施例的内容推荐装置200可以实现在各种终端设备中，例如各种内容平台的服务器。在一个示例中，根据本申请实施例的内容推荐装置200可以作为一个软件模块和/或硬件模块而集成到所述终端设备中。例如，该内容推荐装置200可以是该终端设备的操作系统中的一个软件模块，或者可以是针对于该终端设备所开发的一个应用程序；当然，该内容推荐装置200同样可以是该终端设备的众多硬件模块之一。

替换地，在另一示例中，该内容推荐装置200与该终端设备也可以是分立的设备，并且该内容推荐装置200可以通过有线和/或无线网络连接到该验证设备，并且按照约定的数据格式来传输交互信息。

替代实施例

这里，本领域技术人员可以理解，本申请的实质在于以标签的词向量之间的距离来计算不同内容的标签之间的相似度。因此，通过以上方式得到的标签相似度除了用于推荐内容以外，还可以用于计算其它参数或者实现其它功能，例如间接判定内容的相似性以实现内容聚类等。

因此，在替代实施例中，本申请实施例的提供了一种标签相似度计算方法，包括：获取用户对于第一内容和第二内容的行为数据，所述第一内容和所述第二内容具有相同类型和不同子类型；确定所述第一内容的至少一个第一标签和所述第二内容的至少一个第二标签；计算所述至少一个第一标签中的每个第一标签的第一词向量和所述至少一个第二标签中的每个第二标签的第二词向量；以及，计算所述第一词向量和所述第二词向量之间的距离作为所述第一标签和所述第二标签之间的标签相似度。

在上述标签相似度计算方法中，获取用户对于第一内容和第二内容的行为数据包括：获取用户在预定时段内对于所述第一内容和所述第二内容的行为数据。

在上述标签相似度计算方法中，计算所述至少一个第一标签中的每个第一标签的第一词向量和所述至少一个第二标签中的每个第二标签的第二词向量包括：通过神经网络语言模型计算所述至少一个第一标签中的每个第一标签的第一词向量和所述至少一个第二标签中的每个第二标签的第二词向量，所述神经网络语言模型中标签向量的维度是50维。

在上述标签相似度计算方法中，所述第一词向量和所述第二词向量之间的距离是所述第一词向量和所述第二词向量之间的欧氏距离或者曼哈顿距离。

在上述标签相似度计算方法中，所述第一内容和所述第二内容是视频内容；所述第一内容是用户生产内容、专业生产内容和品牌生产内容中的一个；以及，所述第二内容是用户生产内容、专业生产内容和品牌生产内容中的另一个。

根据本申请的另一方面，提供了一种标签相似度计算装置，包括：数据获取单元，用于获取用户对于第一内容和第二内容的行为数据，所述第一内容和所述第二内容具有相同类型和不同子类型；标签确定单元，用于确定所述第一内容的至少一个第一标签和所述第二内容的至少一个第二标签；词向量计算单元，用于计算所述至少一个第一标签中的每个第一标签的第一词向量和所述至少一个第二标签中的每个第二标签的第二词向量；以及，相似度计算单元，用于计算所述第一词向量和所述第二词向量之间的距离作为所述第一标签和所述第二标签之间的标签相似度。

在上述标签相似度计算装置中，所述数据获取单元用于获取用户在预定时段内对于所述第一内容和所述第二内容的行为数据。

在上述标签相似度计算装置中，所述词向量计算单元用于通过神经网络语言模型计算所述至少一个第一标签中的每个第一标签的第一词向量和所述至少一个第二标签中的每个第二标签的第二词向量，所述神经网络语言模型中标签向量的维度是50维。

在上述标签相似度计算装置中，所述第一词向量和所述第二词向量之间的距离是所述第一词向量和所述第二词向量之间的欧氏距离或者曼哈顿距离。

在上述标签相似度计算装置中，所述第一内容和所述第二内容是视频内容；所述第一内容是用户生产内容、专业生产内容和品牌生产内容中的一个；以及，述第二内容是用户生产内容、专业生产内容和品牌生产内容中的另一个。

示例性电子设备

下面，参考图3来描述根据本申请实施例的电子设备。

图3图示了根据本申请实施例的电子设备的框图。

如图3所示，电子设备10包括一个或多个处理器11和存储器12。

处理器11可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元，并且可以控制电子设备10中的其他组件以执行期望的功能。

存储器12可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器11可以运行所述程序指令，以实现上文所述的本申请的各个实施例的内容推荐方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如内容数据、标签数据等各种内容。

在一个示例中，电子设备10还可以包括：输入装置13和输出装置14，这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。

例如，该输入装置13可以是例如键盘、鼠标等等。

该输出装置14可以向外部输出各种信息，包括向用户推荐的内容等。该输出设备14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。

当然，为了简化，图3中仅示出了该电子设备10中与本申请有关的组件中的一些，省略了诸如总线、输入/输出接口等等的组件。除此之外，根据具体应用情况，电子设备10还可以包括任何其他适当的组件。

示例性计算机程序产品和计算机可读存储介质

除了上述方法和设备以外，本申请的实施例还可以是计算机程序产品，其包括计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的内容推荐方法中的步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码，所述程序设计语言包括面向对象的程序设计语言，诸如Java、C++等，还包括常规的过程式程序设计语言，诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外，本申请的实施例还可以是计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的内容推荐方法中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本申请的基本原理，但是，需要指出的是，在本申请中提及的优点、优势、效果等仅是示例而非限制，不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外，上述公开的具体细节仅是为了示例的作用和便于理解的作用，而非限制，上述细节并不限制本申请为必须采用上述具体的细节来实现。

本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的，可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇，指“包括但不限于”，且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”，且可与其互换使用，除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”，且可与其互换使用。

还需要指出的是，在本申请的装置、设备和方法中，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的，并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此，本申请不意图被限制到在此示出的方面，而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外，此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例，但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims

1.一种内容推荐方法，包括：

获取用户对于第一内容和第二内容的行为数据，所述行为数据是由至少一个所述第一内容和至少一个所述第二内容组成的序列，且所述第一内容和所述第二内容具有相同类型和不同子类型；

确定所述行为数据中的所述至少一个第一内容的至少一个第一标签和所述至少一个第二内容的至少一个第二标签；

计算所述至少一个第一标签中的每个第一标签的第一词向量和所述至少一个第二标签中的每个第二标签的第二词向量；

基于所述第一词向量和所述第二词向量计算所述第一标签和所述第二标签之间的标签相似度；以及

基于所述标签相似度向用户提供内容。

2.根据权利要求1所述的内容推荐方法，其中，获取用户对于第一内容和第二内容的行为数据包括：

获取用户在预定时段内对于所述第一内容和所述第二内容的行为数据。

3.根据权利要求1所述的内容推荐方法，其中，计算所述至少一个第一标签中的每个第一标签的第一词向量和所述至少一个第二标签中的每个第二标签的第二词向量包括：

通过神经网络语言模型计算所述至少一个第一标签中的每个第一标签的第一词向量和所述至少一个第二标签中的每个第二标签的第二词向量，所述神经网络语言模型中标签向量的维度是50维。

4.根据权利要求1所述的内容推荐方法，其中，基于所述第一词向量和所述第二词向量计算所述第一标签和所述第二标签之间的标签相似度包括以下的其中之一：

通过所述第一词向量和所述第二词向量的余弦函数计算所述第一标签和所述第二标签之间的标签相似度；以及

通过所述第一词向量和所述第二词向量之间的距离计算所述第一标签和所述第二标签之间的标签相似度。

5.根据权利要求1到4中任意一项所述的内容推荐方法，其中，

所述第一内容和所述第二内容是视频内容；

所述第一内容是用户生产内容、专业生产内容和品牌生产内容中的一个；以及

所述第二内容是用户生产内容、专业生产内容和品牌生产内容中的另一个。

6.一种内容推荐装置，包括：

数据获取单元，用于获取用户对于第一内容和第二内容的行为数据，所述行为数据是由至少一个所述第一内容和至少一个所述第二内容组成的序列，且所述第一内容和所述第二内容具有相同类型和不同子类型；

标签确定单元，用于确定所述行为数据中的所述至少一个第一内容的至少一个第一标签和所述至少一个第二内容的至少一个第二标签；

词向量计算单元，用于计算所述至少一个第一标签中的每个第一标签的第一词向量和所述至少一个第二标签中的每个第二标签的第二词向量；

相似度计算单元，用于通过所述第一词向量和所述第二词向量计算所述第一标签和所述第二标签之间的标签相似度；以及

内容提供单元，用于基于所述标签相似度向用户提供内容。

7.根据权利要求6所述的内容推荐装置，其中，所述数据获取单元用于获取用户在预定时段内对于所述第一内容和所述第二内容的行为数据。

8.根据权利要求6所述的内容推荐装置，其中，所述词向量计算单元用于通过神经网络语言模型计算所述至少一个第一标签中的每个第一标签的第一词向量和所述至少一个第二标签中的每个第二标签的第二词向量，所述神经网络语言模型中标签向量的维度是50维。

9.根据权利要求6所述的内容推荐装置，其中，所述相似度计算单元用于以下的其中之一：

10.根据权利要求6到9任意一项所述的内容推荐装置，其中，

所述第一内容和所述第二内容是视频内容；

11.一种电子设备，包括：

处理器；以及

存储器，在所述存储器中存储有计算机程序指令，所述计算机程序指令在被所述处理器运行时使得所述处理器执行如权利要求1-5中任一项所述的内容推荐方法。