CN110309414A

CN110309414A - 内容推荐方法、内容推荐装置和电子设备

Info

Publication number: CN110309414A
Application number: CN201810218067.0A
Authority: CN
Inventors: 刘荣
Original assignee: Youku Network Technology Beijing Co Ltd
Current assignee: Alibaba China Co Ltd
Priority date: 2018-03-16
Filing date: 2018-03-16
Publication date: 2019-10-08
Anticipated expiration: 2038-03-16
Also published as: CN110309414B

Abstract

本申请涉及一种内容推荐方法、内容推荐装置和电子设备。该内容推荐方法包括：获取新用户的外部画像数据；选择用于推荐内容的推荐标签；基于预定算法计算推荐标签中每个标签的预测值，该预定算法包括表示外部画像数据与推荐标签之间的映射关系的映射模型；基于预测值确定推荐标签中的特定标签；以及，向新用户提供与特定标签对应的内容。这样，可以基于新用户的外部数据匹配用于推荐的内部标签，从而提高推荐精准度。

Description

内容推荐方法、内容推荐装置和电子设备

技术领域

本申请总的来说涉及数据处理领域，且更为具体地，涉及一种内容推荐方法、内容推荐装置和电子设备。

背景技术

随着文化产业的发展，越来越多的内容被生产出来，以满足人们日益增长的需求。并且，随着内容表现形式的丰富，越来越多的内容被以诸如多媒体的形式表现出来。

当用户需要获取自己所需的内容时，针对网络上的海量内容，用户需要花费大量的时间才能找到自己想要的内容。如果用户需要浏览大量无关的内容，这个过程显然会使得用户感到不便。

因此，需要根据用户的兴趣特点，向用户推荐用户可能感兴趣的内容，这对于新用户尤其重要。

因此，需要适用于新用户的改进的内容推荐方案。

发明内容

为了解决上述技术问题，提出了本申请。本申请的实施例提供了一种内容推荐方法、内容推荐装置和电子设备，其可以基于新用户的外部数据匹配用于推荐的内部标签，从而提高推荐精准度。

根据本申请的一方面，提供了一种内容推荐方法，包括：获取新用户的外部画像数据；选择用于推荐内容的推荐标签；基于预定算法计算所述推荐标签中每个标签的预测值，所述预定算法包括表示所述外部画像数据与所述推荐标签之间的映射关系的映射模型；基于所述预测值确定所述推荐标签中的特定标签；以及，向所述新用户提供与所述特定标签对应的内容。

在上述内容推荐方法中，选择用于推荐内容的推荐标签包括：按照与全部内部标签对应的内容被选中的数目对所述全部内部标签进行降序排序；以及，选择序列头部预定数目的头部标签。

在上述内容推荐方法中，选择用于推荐内容的推荐标签进一步包括：建立不推荐的内部标签的列表；以及，通过头部标签与所述列表的关键词匹配来过滤所述预定数目的头部标签。

在上述内容推荐方法中，所述映射模型基于用户的内容选择行为的历史数据训练获得，所述训练过程包括：获取用户的内容选择行为的历史数据，所述历史数据包括用户、向用户推荐的内容和所述用户选中的内容；对所述历史数据进行特征提取以获取所述用户的画像数据、所述向用户推荐的内容和所述用户选中的内容的标签数据；基于所述画像数据和所述标签数据以及用户是否选中所述内容来生成正负样本；以及，以所述正负样本对线性模型进行训练。

在上述内容推荐方法中，基于所述预测值确定所述推荐标签中的特定标签包括：确定所述推荐标签的预测值是否大于预定阈值；以及，响应于所述预测值大于预定阈值，将与所述预测值对应的推荐标签确定为所述特定标签。

在上述内容推荐方法中，所述内容是视频。

根据本申请的另一方面，提供了一种内容推荐装置，包括：数据获取单元，用于获取新用户的外部画像数据；标签选择单元，用于选择用于推荐内容的推荐标签；预测值计算单元，用于基于预定算法计算所述推荐标签中每个标签的预测值，所述预定算法包括表示所述外部画像数据与所述推荐标签之间的映射关系的映射模型；标签确定单元，用于基于所述预测值确定所述推荐标签中的特定标签；以及，内容推荐单元，用于向所述新用户提供与所述特定标签对应的内容。

在上述内容推荐装置中，所述标签选择单元用于：按照与全部内部标签对应的内容被选中的数目对所述全部内部标签进行降序排序；以及，选择序列头部预定数目的头部标签。

在上述内容推荐装置中，所述标签选择单元进一步用于：建立不推荐的内部标签的列表；以及，通过头部标签与所述列表的关键词匹配来过滤所述预定数目的头部标签。

在上述内容推荐装置中，所述映射模型基于用户的内容选择行为的历史数据训练获得，所述训练过程包括：获取用户的内容选择行为的历史数据，所述历史数据包括用户、向用户推荐的内容和所述用户选中的内容；对所述历史数据进行特征提取以获取所述用户的画像数据、所述向用户推荐的内容和所述用户选中的内容的标签数据；基于所述画像数据和所述标签数据以及用户是否选中所述内容来生成正负样本；以及，以所述正负样本对线性模型进行训练。

在上述内容推荐装置中，所述标签确定单元用于：确定所述推荐标签的预测值是否大于预定阈值；以及，响应于所述预测值大于预定阈值，将与所述预测值对应的推荐标签确定为所述特定标签。

在上述内容推荐装置中，所述内容是视频。

根据本申请的又一方面，提供了一种电子设备，包括：处理器；以及，存储器，在所述存储器中存储有计算机程序指令，所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的内容推荐方法。

本申请提供的内容推荐方法、内容推荐装置和电子设备可以基于新用户的外部数据匹配用于推荐的内部标签，从而提高推荐精准度。

附图说明

通过阅读下文优选的具体实施方式中的详细描述，本申请各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。说明书附图仅用于示出优选实施方式的目的，而并不认为是对本申请的限制。显而易见地，下面描述的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。而且在整个附图中，用相同的附图标记表示相同的部件。

图1图示了根据本申请实施例的内容推荐方法的流程图；

图2图示了根据本申请实施例的内容推荐方法中选择推荐标签的流程图；

图3图示了根据本申请实施例的内容推荐方法中训练映射模型的流程图；

图4图示了根据本申请实施例的内容推荐装置的框图；

图5图示了根据本申请实施例的电子设备的框图。

具体实施方式

下面，将参考附图详细地描述根据本申请的示例实施例。显然，所描述的实施例仅仅是本申请的一部分实施例，而不是本申请的全部实施例，应理解，本申请不受这里描述的示例实施例的限制。

申请概述

如上所述，当用户第一次使用推荐系统关联的产品时，无任何用户行为可作为如何为用户推荐感兴趣的内容的参考，这通常被称为推荐系统中的用户冷启动。并且，推荐系统中的用户冷启动对新用户的留存问题非常重要，即关系着如何留住新用户。而且，在任何的产品和app中，提高新用户的留存都是非常重要的事情，因为它关乎产品用户的增长。

具体来说，在推荐系统中，比较常用的推荐方法，比如协同过滤方法等由于都需要用户行为，无法适应无行为的用户。对于新用户来说，因为没有用户针对已有产品的用户数据，就需要找到其对应的其它用户数据并转化为与产品对应的推荐数据。

针对上述技术问题，本申请的基本构思是收集这些新用户的外部数据(如年龄、性别或其它产品的行为数据)，然后将这些数据与现有的产品内容进行对应，从而找到这些新用户的感兴趣的内容。目前，已经有很多渠道来获取用户的外部数据，因此，如何将这些外部数据转换为推荐系统的内部数据是非常重要的。

基于此，本申请提出了一种内容推荐方法、内容推荐装置和电子设备，其首先选定用于推荐内容的备选标签，再基于预定算法来根据采集到的用户的外部数据确定体现用户对备选标签的兴趣度的预测值，从而根据标签的预测值向用户推荐内容。这样，可以有效地利用用户在推荐系统以外的数据，将用户的外部数据迁移到内部内容上，提高新用户的推荐精准度，提高用户留存和体验。

需要说明的是，本申请的上述基本构思可以应用于各种用于推荐内容的推荐系统和相应的产品，包括视频内容、音频内容、文字内容以及其它内容的推荐系统和相应的产品等。

在介绍了本申请的基本原理之后，下面将参考附图来具体介绍本申请的各种非限制性实施例。

示例性方法

图1图示了根据本申请实施例的内容推荐方法的流程图。

如图1所示，根据本申请实施例的内容推荐方法包括：S110，获取新用户的外部画像数据；S120，选择用于推荐内容的推荐标签；S130，基于预定算法计算所述推荐标签中每个标签的预测值，所述预定算法包括表示所述外部画像数据与所述推荐标签之间的映射关系的映射模型；S140，基于所述预测值确定所述推荐标签中的特定标签；以及S150，向所述新用户提供与所述特定标签对应的内容。

在步骤S110中，获取新用户的外部画像数据。这里，用户的外部画像数据表征用户可利用的外部数据，如其他平台的用户数据、用户的年龄性别等静态数据。用户的外部画像数据可以g(u)＝{a1,a2,a3,..,an}表示,其中a为外部画像标签。例如，用户u的外部画像为g(u)＝{男，24岁，山东人，看过《歌手2》}。

与此相对的，在比如推荐系统的产品中，存在用户的内部画像数据。用户的内部画像数据表征用户在与推荐系统关联的产品上消费内容而产生的数据。例如，针对视频播放产品，则用户的内部画像数据主要是针对特定用户的视频标签。用户的内部画像数据可以h(u)＝{t1,t2,..,tm}表示，其中中t为内部画像标签。例如，用户u的内部画像为h(u)＝{搞笑，吃播}。

在实际实现方面，可以通过用户的登录信息，例如用户ID来获取对应的用户外部画像数据，表示为g(u)＝{a1,a2,a3,..,an}。因此，通过充分利用与新用户有关的生态数据，可以弥补新用户信息不足的情况。

在步骤S120中，选择用于推荐内容的推荐标签。也就是说，针对新用户，需要选择优质的内部标签作为新用户冷启动时下发的候选标签，这种标签通常也被称为头部标签。筛选头部内部标签的目的是保证冷启动用户的下发内容的质量，因为对于新用户而言，用户第一次访问app的体验显得尤为重要，所以保证下发内容的质量是必要的。这里，可以为筛选头部标签设置以下的一些准则：

首先，选择积极向上的标签而排除涉及低俗内容的标签，以保证内容的调性。另外，所选的标签最好为大众标签(用户观看量大的)，从而能够覆盖绝大部分用户的兴趣。

因此，基于以上准则，在根据本申请实施例的内容推荐方法中，选择用于推荐内容的推荐标签包括：按照与全部内部标签对应的内容被选中的数目对所述全部内部标签进行降序排序；以及，选择序列头部预定数目的头部标签。

例如，可以按照与标签对应的视频的观看次数对标签进行排序。这里，观看次数可以是最近一段时间内的视频的观看次数。并且，也可以按照需要设置所选的头部标签的预定数目。在一个实例中，可以获取视频平台7天观看量最大的标签，并按照倒序排序选取头部1000个标签。

并且，在获取了头部标签之外，可以进一步对获取的头部标签进行筛选。

也就是说，在根据本申请实施例的内容推荐方法中，选择用于推荐内容的推荐标签进一步包括：建立不推荐的内部标签的列表；以及，通过头部标签与所述列表的关键词匹配来过滤所述预定数目的头部标签。

具体来说，不推荐的内部标签可以是如上所述涉及低俗内容的标签，或者是涉及敏感内容的标签。通过建立不推荐的标签列表，可以通过关键词匹配的方式过滤掉部分头部标签，以获得用于推荐内容的推荐标签。

图2图示了根据本申请实施例的内容推荐方法中选择推荐标签的流程图。如图2所示，在根据本申请实施例的内容推荐方法中，选择推荐标签的过程包括：S210，按照与全部内部标签对应的内容被选中的数目对所述全部内部标签进行降序排序；S220，选择序列头部预定数目的头部标签；S230，建立不推荐的内部标签的列表；以及S240，通过头部标签与所述列表的关键词匹配来过滤所述预定数目的头部标签。

这样，通过如上所述的标签筛选机制来限制冷启动内容的推荐范围，可以提高新用户的观看体验。

当然，本领域技术人员可以理解，在根据本申请实施例的内容推荐方法中，也可以通过其它方式选择用于推荐内容的推荐标签。例如，建立包含作为推荐标签的候选的固定的标签库，或者，选择对于产品本身希望推荐的标签等。本申请并不意在对此进行任何限制。

接下来，在步骤S130中，基于预定算法计算所述推荐标签中每个标签的预测值，所述预定算法包括表示所述外部画像数据与所述推荐标签之间的映射关系的映射模型。

也就是说，所述映射模型的目标是通过外部画像数据预测用户对内部标签的兴趣度。这可以通过预先设置相应的映射关系来实现，例如，在用户的外部画像是g(u)＝{男，26，it男}的情况下，可以设置所述用户可能喜欢看的内容的内部标签f(u)＝{科技，房产}。

在一个优选方案中，根据本申请实施例的内容推荐方法通过利用历史新用户在产品上的消费行为建立模型，从而获得相对准确的映射模型。

首先，获取用户行为数据，即，获取用户在与推荐系统关联的产品上的行为数据。例如，针对视频平台，可以获取用户在观看视频信息流时的请求和点击行为。比如，用户请求一次视频信息流req，返回3个视频，表示为history(u,req)＝{v1,v2,v3}。其中，用户点击了视频v2，表示为click(u,req)＝{v2}。这里，req为用户的视频请求表示。

接下来，抽取特征，也就是说，在获取了以上用户的请求和点击行为后，需要将用户行为转换为标签特征，提供给后续模块进行训练。假设表示为history(u,v)＝{a1,a2,a3,…,an,t1,t2,t3,…,tm}，其中a1,a2,a3,…,an为用户的外部画像标签，t1,t2,t3,…,tm为用户的内部画像标签。例如，用户u在视频平台上观看了视频“如何画好眼线”，同时这个用户的外部画像为{女生，24岁，行政}，且视频对应的内部标签为{眼线，化妆}。则对应的history(u,v)＝{女生，24岁，行政，眼线，化妆}。以此类推，用户每观看一个视频，就能得到一个样本。上面用户history(u,req)＝{v1,v2,v3}可以获得3个用户样本，

之后，生成训练样本，也就是说，在获取了用户行为和对应的特征后，生成正负样本，提供给模型学习。举例说明，如用户请求一次信息流，history(u,req)＝{v1,v2,v3}，且用户点击了视频v2，即click(u,req)＝{v2}，则生成的正负样本为：{history(u,v1)0}；{history(u,v2)1}；{history(u,v3)0}。

最后，在获得了正负样本后，就可以进行模型训练了，具体来说，采用线性模型。通过以上模型的训练，在输入用户的外部画像标签和所选的用于推荐内容的推荐标签之后，就可以得到每个推荐标签对应的预测值，例如表示为score(u,t)＝f(g(u),t)。

也就是说，在获得了映射模型之后，就通过基于预定算法，例如如上所述的score(u,t)＝f(g(u),t)，通过映射模型预测新用户感兴趣的内部标签，即计算每个推荐标签的预测值。

因此，在根据本申请实施例的内容推荐方法中，所述映射模型基于用户的内容选择行为的历史数据训练获得，所述训练过程包括：获取用户的内容选择行为的历史数据，所述历史数据包括用户、向用户推荐的内容和所述用户选中的内容；对所述历史数据进行特征提取以获取所述用户的画像数据、所述向用户推荐的内容和所述用户选中的内容的标签数据；基于所述画像数据和所述标签数据以及用户是否选中所述内容来生成正负样本；以及，以所述正负样本对线性模型进行训练。

图3图示了根据本申请实施例的内容推荐方法中训练映射模型的流程图。如图3所示，在根据本申请实施例的内容推荐方法中，训练映射模型的过程包括：S310，获取用户的内容选择行为的历史数据，所述历史数据包括用户、向用户推荐的内容和所述用户选中的内容；S320，对所述历史数据进行特征提取以获取所述用户的画像数据、所述向用户推荐的内容和所述用户选中的内容的标签数据；S330，基于所述画像数据和所述标签数据以及用户是否选中所述内容来生成正负样本；以及S340，以所述正负样本对线性模型进行训练。

这样，在根据本申请实施例的内容推荐方法中，通过利用已有的新用户的行为，可以增强外部画像到内部标签的预测的准确度，提高对新用户兴趣预测的准确度。

在步骤S140中，基于所述预测值确定所述推荐标签中的特定标签。也就是说，根据上面计算的针对新用户的所选的推荐标签的预测值，可以根据预测值的大小，选取预测值较大的标签。例如，可以预先设置用于选择标签的阈值，在预测值大于预定阈值的情况下，说明用户可能对所对应的标签比较感兴趣。

因此，在根据本申请实施例的内容推荐方法中，基于所述预测值确定所述推荐标签中的特定标签包括：确定所述推荐标签的预测值是否大于预定阈值；以及，响应于所述预测值大于预定阈值，将与所述预测值对应的推荐标签确定为所述特定标签。

最后，在步骤S150中，向所述新用户提供与所述特定标签对应的内容。

这里，虽然在上文中，以视频平台向新用户推荐视频为例进行了说明。但是，本领域技术人员可以理解，根据本申请实施例的内容推荐方法可以应用于各种内容平台向用户推荐内容。本申请并不意在对此进行任何限制。

示例性装置

图4图示了根据本申请实施例的内容推荐装置的示意性框图。

如图4所示，根据本申请实施例的内容推荐装置400包括：数据获取单元410，用于获取新用户的外部画像数据；标签选择单元420，用于选择用于推荐内容的推荐标签；预测值计算单元430，用于基于预定算法计算所述推荐标签中每个标签的预测值，所述预定算法包括表示所述数据获取单元410所获取的外部画像数据与所述标签选择单元420所选的推荐标签之间的映射关系的映射模型；标签确定单元440，用于基于所述预测值计算单元430所计算的预测值确定所述推荐标签中的特定标签；以及，内容推荐单元450，用于向所述新用户提供与所述标签确定单元440所确定的特定标签对应的内容。

在一个示例中，在上述内容推荐装置400中，所述标签选择单元420用于：按照与全部内部标签对应的内容被选中的数目对所述全部内部标签进行降序排序；以及，选择序列头部预定数目的头部标签。

在一个示例中，在上述内容推荐装置400中，所述标签选择单元420进一步用于：建立不推荐的内部标签的列表；以及，通过头部标签与所述列表的关键词匹配来过滤所述预定数目的头部标签。

在一个示例中，在上述内容推荐装置400中，所述映射模型基于用户的内容选择行为的历史数据训练获得，所述训练过程包括：获取用户的内容选择行为的历史数据，所述历史数据包括用户、向用户推荐的内容和所述用户选中的内容；对所述历史数据进行特征提取以获取所述用户的画像数据、所述向用户推荐的内容和所述用户选中的内容的标签数据；基于所述画像数据和所述标签数据以及用户是否选中所述内容来生成正负样本；以及，以所述正负样本对线性模型进行训练。

在一个示例中，在上述内容推荐装置400中，所述标签确定单元440用于：确定所述推荐标签的预测值是否大于预定阈值；以及，响应于所述预测值大于预定阈值，将与所述预测值对应的推荐标签确定为所述特定标签。

在一个示例中，在上述内容推荐装置400中，所述内容是视频。

这里，本领域技术人员可以理解，上述内容推荐装置400中的各个单元和模块的具体功能和操作已经在上面参考图1到图3描述的内容推荐方法中详细介绍，并因此，将省略其重复描述。

如上所述，根据本申请实施例的内容推荐装置400可以实现在各种终端设备中，例如各种内容平台的服务器。在一个示例中，根据本申请实施例的内容推荐装置400可以作为一个软件模块和/或硬件模块而集成到所述终端设备中。例如，该内容推荐装置400可以是该终端设备的操作系统中的一个软件模块，或者可以是针对于该终端设备所开发的一个应用程序；当然，该内容推荐装置400同样可以是该终端设备的众多硬件模块之一。

替换地，在另一示例中，该内容推荐装置400与该终端设备也可以是分立的设备，并且该内容推荐装置400可以通过有线和/或无线网络连接到该验证设备，并且按照约定的数据格式来传输交互信息。

示例性电子设备

下面，参考图5来描述根据本申请实施例的电子设备。

图5图示了根据本申请实施例的电子设备的框图。

如图5所示，电子设备10包括一个或多个处理器11和存储器12。

处理器11可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元，并且可以控制电子设备10中的其他组件以执行期望的功能。

存储器12可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器11可以运行所述程序指令，以实现上文所述的本申请的各个实施例的内容推荐方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如用户的外部画像数据，推荐系统的内部标签等各种内容。

在一个示例中，电子设备10还可以包括：输入装置13和输出装置14，这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。

例如，该输入装置13可以是例如键盘、鼠标等等。

该输出装置14可以向外部输出各种信息，包括向用户推荐的内容等。该输出设备14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。

当然，为了简化，图5中仅示出了该电子设备10中与本申请有关的组件中的一些，省略了诸如总线、输入/输出接口等等的组件。除此之外，根据具体应用情况，电子设备10还可以包括任何其他适当的组件。

示例性计算机程序产品和计算机可读存储介质

除了上述方法和设备以外，本申请的实施例还可以是计算机程序产品，其包括计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的内容推荐方法中的步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码，所述程序设计语言包括面向对象的程序设计语言，诸如Java、C++等，还包括常规的过程式程序设计语言，诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外，本申请的实施例还可以是计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的内容推荐方法中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本申请的基本原理，但是，需要指出的是，在本申请中提及的优点、优势、效果等仅是示例而非限制，不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外，上述公开的具体细节仅是为了示例的作用和便于理解的作用，而非限制，上述细节并不限制本申请为必须采用上述具体的细节来实现。

本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的，可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇，指“包括但不限于”，且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”，且可与其互换使用，除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”，且可与其互换使用。

还需要指出的是，在本申请的装置、设备和方法中，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的，并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此，本申请不意图被限制到在此示出的方面，而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外，此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例，但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims

1.一种内容推荐方法，包括：

获取新用户的外部画像数据；

选择用于推荐内容的推荐标签；

基于预定算法计算所述推荐标签中每个标签的预测值，所述预定算法包括表示所述外部画像数据与所述推荐标签之间的映射关系的映射模型；

基于所述预测值确定所述推荐标签中的特定标签；以及

向所述新用户提供与所述特定标签对应的内容。

2.根据权利要求1所述的内容推荐方法，其中，选择用于推荐内容的推荐标签包括：

按照与全部内部标签对应的内容被选中的数目对所述全部内部标签进行降序排序；以及

选择序列头部预定数目的头部标签。

3.根据权利要求2所述的内容推荐方法，其中，选择用于推荐内容的推荐标签进一步包括：

建立不推荐的内部标签的列表；以及

通过头部标签与所述列表的关键词匹配来过滤所述预定数目的头部标签。

4.根据权利要求1所述的内容推荐方法，其中，所述映射模型基于用户的内容选择行为的历史数据训练获得，所述训练过程包括：

获取用户的内容选择行为的历史数据，所述历史数据包括用户、向用户推荐的内容和所述用户选中的内容；

对所述历史数据进行特征提取以获取所述用户的画像数据、所述向用户推荐的内容和所述用户选中的内容的标签数据；

基于所述画像数据和所述标签数据以及用户是否选中所述内容来生成正负样本；以及

以所述正负样本对线性模型进行训练。

5.根据权利要求1所述的内容推荐方法，其中，基于所述预测值确定所述推荐标签中的特定标签包括：

确定所述推荐标签的预测值是否大于预定阈值；以及

响应于所述预测值大于预定阈值，将与所述预测值对应的推荐标签确定为所述特定标签。

6.根据权利要求1到5中任意一项所述的内容推荐方法，其中，所述内容是视频。

7.一种内容推荐装置，包括：

数据获取单元，用于获取新用户的外部画像数据；

标签选择单元，用于选择用于推荐内容的推荐标签；

预测值计算单元，用于基于预定算法计算所述推荐标签中每个标签的预测值，所述预定算法包括表示所述外部画像数据与所述推荐标签之间的映射关系的映射模型；

标签确定单元，用于基于所述预测值确定所述推荐标签中的特定标签；以及

内容推荐单元，用于向所述新用户提供与所述特定标签对应的内容。

8.根据权利要求7所述的内容推荐装置，其中，所述标签选择单元用于：

选择序列头部预定数目的头部标签。

9.根据权利要求8所述的内容推荐装置，其中，所述标签选择单元进一步用于：

建立不推荐的内部标签的列表；以及

10.根据权利要求7所述的内容推荐装置，其中，所述映射模型基于用户的内容选择行为的历史数据训练获得，所述训练过程包括：

以所述正负样本对线性模型进行训练。

11.根据权利要求7所述的内容推荐装置，其中，所述标签确定单元用于：

确定所述推荐标签的预测值是否大于预定阈值；以及

12.根据权利要求7到11中任意一项所述的内容推荐装置，其中，所述内容是视频。

13.一种电子设备，包括：

处理器；以及

存储器，在所述存储器中存储有计算机程序指令，所述计算机程序指令在被所述处理器运行时使得所述处理器执行如权利要求1-6中任一项所述的内容推荐方法。