CN116541588A

CN116541588A - 内容推荐方法、装置、电子设备和存储介质

Info

Publication number: CN116541588A
Application number: CN202210094606.0A
Authority: CN
Inventors: 刘冰
Original assignee: TCL Technology Group Co Ltd
Current assignee: TCL Technology Group Co Ltd
Priority date: 2022-01-26
Filing date: 2022-01-26
Publication date: 2023-08-04

Abstract

本申请实施例公开了内容推荐方法、装置、电子设备和存储介质，该方法包括：响应于推荐触发操作，获取待处理数据；基于至少两个预设策略，对所述待处理数据进行处理，得到与每个预设策略对应的候选内容；对所有所述候选内容进行融合得到待推荐的目标内容。通过使用至少两个预设策略对待处理数据进行处理，得到不同的候选内容，再对候选内容进行融合得到待推荐的目标内容，在行为数据稀疏的情况下，融合多种不同的策略对应的候选内容，使得每次得到的目标内容变化程度增大，避免推荐内容的单一，以提升用户的点击率，具有较好的推荐效果。

Description

内容推荐方法、装置、电子设备和存储介质

技术领域

本申请涉及推荐领域，具体涉及内容推荐方法、装置、电子设备和存储介质。

背景技术

随着网络的迅猛发展，人们的日常生活越来越离不开网络，随着网上各种资讯内容(例如新闻、文章以及视频内容等)的爆炸性增长，用户越来越难以从众多的影视作品中挑选自己喜欢的影视内容，因此，给用户主动推荐感兴趣的影视内容，以此来帮助用户减轻因为数据量过大而带来的负担。

然而，目前的内容推荐策略，均是基于大量的用户行为数据进行推荐，在用户行为稀疏的场景下，难以实现较好的推荐效果。

发明内容

本申请实施例提供内容推荐方法、装置、电子设备和存储介质，可以提升在用户行为稀疏的场景下的推荐效果。

本申请实施例提供一种内容推荐方法，包括：响应于推荐触发操作，获取待处理数据；基于至少两个预设策略，对所述待处理数据进行处理，得到与每个预设策略对应的候选内容；对所有所述候选内容进行融合得到待推荐的目标内容。

本申请实施例还提供一种内容推荐装置，包括：获取模块，用于响应于推荐触发操作，获取待处理数据；处理模块，用于基于至少两个预设策略，对所述待处理数据进行处理，得到与每个预设策略对应的候选内容；融合模块，用于对所有所述候选内容进行融合得到待推荐的目标内容。

本申请实施例还提供一种电子设备，包括存储器存储有多条指令；所述处理器从所述存储器中加载指令，以执行本申请实施例所提供的任一种内容推荐方法中的步骤。

本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有多条指令，所述指令适于处理器进行加载，以执行本申请实施例所提供的任一种内容推荐方法中的步骤。

目前，在用户行为数据稀疏的情况下，若采用一种固定的推荐策略，由于用户行为数据稀疏，导致用户画像在一定的时间周期内变化极小，使得无论采用哪种推荐策略，针对同一用户的推荐结果在时间维度上的变化很小，难以实现较好的推荐效果。

在本申请中，响应于推荐触发操作，获取待处理数据；基于至少两个预设策略，对待处理数据进行处理，得到与每个预设策略对应的候选内容；对得到的所有候选内容进行融合得到待推荐的目标内容。通过使用至少两个预设策略对待处理数据进行处理，得到不同的候选内容，再对候选内容进行融合得到待推荐的目标内容，在行为数据稀疏的情况下，融合多种不同的策略对应的候选内容，使得每次得到的目标内容变化程度增大，避免推荐内容的单一，以提升用户的点击率，具有较好的推荐效果。并且在对数据处理时也融合了行为数据，也可以提升推荐内容的准确性。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的内容推荐方法的应用场景示意图；

图2是本申请实施例提供的内容推荐方法的流程示意图；

图3是本申请实施例提供的推荐关系图数据的示意图；

图4是本申请实施例提供的内容-类型的图数据的示意图；

图5是本申请另一实施例提供的内容推荐方法的流程示意图；

图6是本申请实施例提供的内容推荐方法的框架图；

图7是本申请实施例提供的内容推荐装置的结构示意图；

图8是本申请实施例提供的电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供内容推荐方法、装置、电子设备和存储介质。

其中，该内容推荐装置具体可以集成在电子设备中，该电子设备可以为终端、服务器等设备。其中，终端可以为手机、平板电脑、智能蓝牙设备、笔记本电脑、或者个人电脑(Personal Computer，PC)等设备；服务器可以是单一服务器，也可以是由多个服务器组成的服务器集群。

在一些实施例中，该内容推荐装置还可以集成在多个电子设备中，比如，内容推荐装置可以集成在多个服务器中，由多个服务器来实现本申请的内容推荐方法。

在一些实施例中，服务器也可以以终端的形式来实现。

例如，参考图1，示出了内容推荐方法的应用场景示意图。以电子设备为服务器为例，其中，服务器101与终端设备102进行连接，终端设备102可以接收到推荐触发操作，并将推荐触发操作转发给服务器101，服务器101可响应于推荐触发操作，获取媒资数据以及行为数据；基于至少两个预设策略，对所述媒资数据以及行为数据进行处理，得到与每个预设策略对应的候选内容；

对所有所述候选内容进行融合得到待推荐的目标内容；最后输出目标内容至终端设备102，以便终端设备102可以展示出目标内容，以供用户查阅或选择。

以下分别进行详细说明。需说明的是，以下实施例的序号不作为对实施例优选顺序的限定。

在本实施例中，提供了一种内容推荐方法，如图2所示，该内容推荐方法的具体流程可以包括以下步骤：S110至S140。

S110、响应于推荐触发操作，获取待处理数据。

推荐触发操作是指用于触发推荐的操作。推荐触发操作可以是指刷新操作、启动操作等等。例如，在电影推荐场景中，可以显示推荐列表，触发操作可以是指进入推荐列表的操作，也可以是指对推荐列表的刷新操作。再例如，在智能电视机启动之后，主页面内通常会显示推荐的电影或者电视剧，此时的推荐触发操作可以是指智能电视机的启动操作。

在一些实施方式中，推荐触发操作还可以是在满足一定的条件自动触发的，例如，展示了推荐列表之后的一定时间内，并未检测到任何用户操作，可自动进行推荐触发操作。具体的，推荐触发操作可根据实际的需要进行设置，在此不做具体限定。

待处理数据可以是包括媒资数据以及行为数据。其中，媒资数据是指从各种媒体数据资源库中获取到的。例如，可以从视频网站中获取到视频数据、可以从图像网站中获取到图像数据、可以从音乐网站中获取到音乐数据、可以从阅读网站中获取到书籍数据。下面仅以视频网站中获取到视频数据为例进行详细说明，这些媒资数据可以包括视频名称、视频的上映时间、视频的中的演员、导演、播放量、视频和视频之间的关系等等。

行为数据是指用户行为数据，例如，用户的观看某个媒体对象的行为、收藏媒体对象的行为、或者搜索媒体对象的行为、观看某个媒体对象的时长等等。其中，基于行为数据可以构建用户画像，或者提取用户的长期行为特征和短期行为特征等等，以供后续使用。其中，行为数据可以从用户日志中获取到。

其中，行为数据中可以包括发出推荐触发操作的终端所对应的用户的行为数据，也可以是指所有用户的行为数据。

S120、基于至少两个预设策略，对所述待处理数据进行处理，得到与每个预设策略对应的候选内容。

电子设备内可以预先存储有至少两个预设策略，该预设策略用于对获取到的媒资数据和行为数据中的至少一个进行处理，以得到对应的候选内容。

其中，候选内容可以是指使用预设策略对媒资数据和行为数据进行处理后，筛选得到的多个媒体对象，也就是说，预测策略可以通过对媒资数据和/或行为数据进行处理，得到用户可能感兴趣的多个媒体对象，将该多个媒体对象作为该预设策略对应的候选内容。

电子设备内存储的至少两个预设策略，可以包括第一策略、第二策略、第三策略和第四策略，其中，第一策略、第二策略、第三策略和第四策略为对待处理数据进行不同的处理，以产生不同的候选内容。

可以理解的是，若预先设置有4种预设策略，在对待处理数据进行处理时，可以是从这4种预设策略中任意选取至少两个预设策略，每一种预设策略，对待处理数据进行处理后，可以得到与该预设策略对应候选内容，由于是随机选取了至少两个预设策略，因而可得到与至少两个预设策略对应的候选内容。例如，至少两个预设策略为策略1和策略2，可以得到与策略1对应的候选内容1，与策略2对应的候选内容2。

在一些实施方式中，预设策略的数量为至少两个，具体的数量可以根据实际的需要进行设置，在此不做具体限定。下面以本申请设置了4种预设策略为例，对每一种预设策略的具体处理流程进行详细说明。若至少两个预设策略为两个预设策略，这两个预设策略可以是这4个预设策略中任意两个，若至少两个预设策略为三个预设策略，这三个预设策略可以是这4个预设策略中任意三个。

在一些实施方式中，至少两个预设策略可以包括第一策略，第一策略是基于媒体对象相似度的召回策略。采用第一策略对媒资数据和行为数据进行处理，可以得到和第一策略对应的候选内容。

具体的，使用第一策略对媒资数据和行为数据的处理，可以包括：从所述媒资数据中提取媒体对象，以及媒体对象之间的推荐关系；根据所述媒体对象以及媒体对象之间的推荐关系，得到每个媒体对象对应的第一向量；根据所述第一向量计算任意两个媒体对象之间的相似度，并根据所述相似度确定出每个媒体对象对应的第一媒体对象；从所述行为数据中提取第二媒体对象，并根据每个媒体对象对应的第一媒体对象，将与所述第二媒体对应第一媒体对象确定为目标媒体对象；利用牛顿冷却定律计算所述第二媒体对象对应的第一得分；根据所述第二媒体对象对应的第一得分，计算所述目标媒体对象的第二得分；基于所述第二得分，得到与所述第一策略对应的候选内容。

媒资数据是从多个媒体数据资源库中得到的数据，可以基于媒资数据构建推荐关系图数据，其中，推荐关系图数据中的节点表示媒体对象，边表示媒体对象与媒体对象的推荐关系。例如，请参考图3，示出了推荐关系图数据的示意图。在图数据中，包括节点A、节点B、节点C和节点D，其中节点A分别与节点D、节点B之间存在边，表明节点A表示的媒体对象和节点D表示的媒体对象之间具有推荐关系、节点A表示的媒体对象和节点B表示的媒体对象之间具有推荐关系。在构建得到数据后，即可以得到媒体对象以及媒体对象之间的推荐关系，采用Node2Vec模型学习媒体对象的嵌入表示，即将每个媒体对象映射到同一空间向量，每个媒体对象最终被表示为一个向量即第一向量。

其中，Node2Vec模型是用来产生网络中节点向量的模型，输入的网络结构，输出是每个节点的向量。具体的，可以采用特定的游走方式进行采样，对于每个节点都会生成对应的序列，再将这些序列视为文本导入Word2Vec中的cbow模型或skip-gram模型，即可得到每个节点对应的向量。如前所述，以媒体对象为节点，以媒体对象和媒体对象之间的推荐关系为边，可以得到图数据，将该图数据输入Node2Vec模型，即可得到的每个媒体对象对应的第一向量。

在得到每个媒体对象对应的第一向量后，可以根据第一向量计算每个媒体对象之间的相似度，并根据相似度确定出每个媒体对象对应的第一媒体对象。作为一种实施方式，可以是每个媒体对象对应的第一向量存储在第一向量数组中，从第一向量数组中选择一个第一向量为目标第一向量，第一向量数组中除目标第一向量的第一向量为其他第一向量；计算目标第一向量与其他第一向量的点积得到目标第一向量与其他第一向量之间的相似度；根据相似度对其他第一向量排序，选取第一预设数量个其他第一向量，并将该第一预设数量个其他第一向量所表示的媒体对象确定为第一媒体对象；重复执行上述过程，直到第一向量数组中的每个第一向量均被确定为目标第一向量，以得到每个媒体对象对应的第一媒体对象。

例如，若得到4个第一向量分别为向量a(表示媒体对象A)、向量b(表示媒体对象B)、向量c(表示媒体对象C)和向量d(表示媒体对象D)，可以先将向量a确定为目标第一向量，计算向量a和向量b的点积得到相似度b`，计算向量a和向量c的点积得到相似度c`，计算向量a和向量d的点积得到相似度d`，若相似度b`>相似度c`>相似度d`，若第一预设数量为2，可确定媒体对象A对应的第一媒体对象为媒体对象B和媒体对象C，由此，可分别得到媒体对象B、媒体对象C和媒体对象D对应的第一媒体对象。

从行为数据中提取出第二媒体对象时，可以是从用户的播放记录中，提取出用户最近观看的第一预设数量个媒体对象。具体的，可以是提取出用户的播放记录中的媒体对象对应的观看时间；分别计算每个媒体对象对应的观看时间和当前时间的时间间隔，以时间间隔从小到大的顺序选择第一预设数量个媒体对象为第二媒体对象，以得到第二媒体对象。

前述已经得到任意两个媒体对象之间的相似度，并基于该相似度确定出每个媒体对象的对应的第一媒体对象。从而可以根据每个媒体对象对应的第一媒体对象，将与所述第二媒体对象对应的第一媒体对象确定为目标媒体对象，并且可以获取到第二媒体对象与目标媒体对象之间的相似度。

可以理解的是，该第二媒体对象为用户最近观看的第一预设数量个媒体对象，在确定出第二媒体对象后，可以基于牛顿冷却定律计算第二媒体对象对应的第一得分。

牛顿冷却定律定义了温度随时间变化的规律，可以按照以下公式计算第二媒体对象的第一得分：第一得分＝完播率*exp(-(冷却系数)*间隔的时间)，其中冷却系数可以为一个常数，可根据实际的需要进行设置，完播率为从媒资数据中获取到的媒体对象的当前的完播率，间隔的时间为观看该媒体对象的时间至当前时间的时间间隔，以此可得到第二媒体对象对应的第一得分。

完播率是指完整播放该媒体对象的播放量与该媒体对象的总播放量的比值，通常可以直接从媒资数据中获取到。

在计算目标媒体对象的第二得分时，可以是获取第二媒体对象与目标媒体对象之间的相似度，将第二媒体对象的第一得分与相似度相乘，得到第二得分。例如，将第二媒体对象A对应的目标媒体对象的相似度以向量表示(A1，A2……An)，第二媒体对象B对应的目标媒体对象的相似度以向量表示(B1，B2……Bn)，若第二媒体对象A的第一得分为x1，第二媒体对象B的第一得分为x2，可以将x1和向量(A1，A2……An)相乘，得到第二媒体对象A对应的目标媒体对象的第二得分，将x2和向量(B1，B2……Bn)相乘，得到第二媒体对象B对应的目标媒体对象的第二得分。

其中，基于第二媒体对象的第一得分，计算目标媒体对象的第二得分，可以将行为数据和媒资数据进行融合，以更好的找到和用户行为相似的媒体对象。

从计算了第二得分的目标媒体对象中过滤掉用户已经观看过的媒体对象，得到过滤结果。根据第二得分，对过滤结果中的目标媒体对象进行排序，即第二得分最高的目标媒体对象排在第一位，第二得分最低的目标媒体对象排在最后一位。选取前预设数量个目标媒体对象，作为与第一策略对应的候选内容。

在一些实施方式中，至少两个预设策略还可以包括第二策略，第二策略是基于用户的长期兴趣的召回策略。若采用第二策略对媒资数据和行为数据进行处理，可以得到和第二策略对应的候选内容。

具体的，使用第二策略对媒资数据和行为数据进行处理，可以包括：基于所述媒资数据构建媒体对象画像，并对所述媒体对象画像中的每个特征进行编码，得到媒体对象画像对应的第二向量；从所述行为数据中提取用户的长期行为特征；按照预设规则计算所述长期行为特征对应的权重，得到第一用户画像对应的第三向量；计算所述第二向量和第三向量的点积，得到第一用户画像和媒体对象画像之间的相似度；基于所述相似度，得到所述第二策略对应的候选内容。

基于媒资数据构建媒体对象画像，并对媒体对象画像中的每个特征进行编码，得到媒体对象画像对应的第二向量。媒体对象画像可以是由媒体对象的特征组成，这些特征可以是媒体对象的类型、媒体对象的标签、以及媒体对象中的演员等等，这些特征共同构成媒体对象画像。对得到的媒体对象画像中的每个特征进行独热编码，得到媒体对象画像对应的第二向量。

例如，媒体对象的类型有40个，某个媒体对象的类型为[剧情，动作]，经过独热编码后，可以得到一个长度为40，剧情和动作对应encoder为1，其余位置为0的向量，将该媒体对象画像中的每个特征都按照上述方式进行独热编码，可以得到每个特征对应的特征向量，将这些特征向量拼接在一起则可以得到媒体对象画像对应的第二向量。

从行为数据中提取用户的长期行为特征，并按照预设规则计算每个长期行为特征对应的权重，得到第一用户画像对应的第三向量。具体的，可以是从单个用户的行为数据中提取历史时段内的观看记录，并从观看记录中提取媒体对象，将这些媒体对象的特征例如类型、标签、演员等作为第一用户画像中的长期行为特征。

长期行为特征构成第一用户画像，可以对每个长期行为特征进行独热编码，得到每个长期行为特征对应的长期特征向量。再为每个长期特征向量进行权重计算，可以得到带有权重的长期特征向量，将带有权重的长期特征向量拼接在一起，以得到和第一用户画像对应的第三向量。

其中，计算每个长期特征向量的权重时，可以是计算所述长期行为特征对应的词频-逆文本频率；根据所述长期行为特征确定待处理媒体对象；根据所述待处理媒体对象的第一完播率计算第二完播率，所述第一完播率为当前时刻所述待处理媒体对象的完播率，所述第二完播率为用户播放所述待处理媒体对象时的完播率，所述完播率为完整播放待处理媒体对象的次数与播放待处理媒体对象的总次数的比值；基于所述词频-逆文本频率、第二完播率计算所述长期行为特征对应的权重；将所述长期行为特征对应的权重和所述长期行为特征转换为所述第三向量。

其中，词频-逆文本频率(Term Frequency-Inverse Document Frequency，TF-IDF)由词频(TF)和逆文本频率(IDF)两部分组成，用于评估一个词或一个文件集或一个数据库中的其中一个文件的重要程度。

确定具有该长期行为特征的媒体对象为待处理媒体对象，并获取待处理媒体对象对应的第一完播率，其中，第一完播率为当前时刻所述待处理媒体对象的完播率，根据牛顿冷却定律和第一完播率，可以计算得到用户观看待处理媒体对象时对应的第二完播率。

在一些实施方式中，可以按照以下方式计算第二完播率：第一完播率＝第二完播率*exp(-(冷却系数)*间隔的时间)，其中，间隔的时间为当前时间与用户观看该待处理媒体对象之间的时间间隔，冷却系数可以是预先设置的，第一完播率为从媒资数据中获取到的，由此可以得到第二完播率。

可以理解的是，待处理媒体对象可能有多个，可以分别计算得到每个待处理媒体对象对应的第二完播率，将这些第二完播率相加得到总完播率；再将总完播率和对应的TF-IDF值相乘，得到该长期行为特征对应的权重，对这些权重进行归一化处理得到最终的权重值，从而长期行为特征和最终的权重值共同构成第三向量。

计算媒体对象画像对应的第二向量和第一用户画像对应的第三向量之间的点积，作为该用户对该媒体对象的偏好得分。

基于该偏好得分可以召回top K的媒体对象，得到和第二策略对应候选内容。具体的，可以为媒资数据中的每个媒体对象构建对应媒体对象画像，计算每个媒体对象画像对应的第二向量和第一用户画像对应的第三向量之间的点积，可以得到用户对每个媒体对象的偏好得分，以偏好得分从大到小的顺序，对媒体对象进行排序，选择前预设数量个媒体对象，即为第二策略对应的候选内容。

在一些实施方式中，至少两个预设策略还可以包括第三策略，第三策略是基于热点的用户画像的召回策略。若采用第三策略对媒资数据和行为数据进行处理，可以得到和第三策略对应的候选内容。

具体的，使用第三策略对媒资数据和行为数据进行处理，可以包括：从所有用户的行为数据中提取热门媒体对象；从所述媒资数据中获取所述热门媒体对象的媒体特征值，并根据媒体特征值计算所述热门媒体对象的热度值；根据单个用户的行为数据构建第二用户画像，所述第二用户画像包括短期行为特征以及与所述短期行为特征对应的权重；根据所述热门媒体对象的热度值以及短期行为特征对应的权重，计算所述热门媒体对象的热度得分；基于所述热门媒体对象的热度得分，得到与所述第三策略对应的候选内容。

从所有用户的行为数据中提取出热门媒体对象，其中，热门媒体对象是指在当前时间之前的预设时间段内所有用户观看过的媒体对象。例如，从每个用户行为数据中提取最近两天的观看记录，从该观看记录中获取观看的媒体对象，将该媒体对象确定为热门媒体对象。

根据媒资数据，可以获取到热门媒体对象对应的媒体特征值，这些媒体特征值可以是指媒体对象的完播率、评分、当前播放量、发布时间等等。下面仅以媒体对象的完播率、评分、播放量、发布时间为例进行详细说明。

首先可以是根据热门媒体对象对应的完播率、当前播放量、上一次统计得到的播放量以及预设基准值，计算热门媒体对象对应的贝叶斯平均得分。具体的，可使用以下公式进行计算：

WR＝(v+(v-v1))/(v+m)*10*R+m/(v+m)；

其中，WR表示热门媒体对象对应的贝叶斯平均得分，v表示热门媒体对象的当前播放量，v1表示上一次统计得到的热门媒体对象的播放量，R表示平均完播率，m表示预设基准值。

其中，预设基准值为假设每个热门媒体对象都至少有m次曝光，那么，所有的热门媒体对象就具备了同等的筛选条件。

根据所述热门媒体对象的媒体特征值、预设冷却系数，计算所述热门媒体对象对应的冷却得分。即根据牛顿冷却定律计算出热门媒体对象对应的冷却得分，根据牛顿冷却定律可以使得最新发布的媒体对象具有较高的得分，以确定出热度较高的媒体对象中的较新的热门媒体对象。

具体的，可采用以下公式计算热门媒体对象对应的冷却得分：

冷却得分＝start_hot*exp(-(冷却系数)*间隔的时间)；

其中，冷却系数可以通过预先计算得到，例如在本申请实施例中，假设start_hot为10，end_hot为0.01，间隔的时间为50，表示初始热度为10，在经过50h后，热度衰减为0.01，以此可以计算出冷却系数为0.13815510557964272，从而，可以根据该冷却系数，计算出热门媒体对象对应的冷却得分。其中，start_hot表示热门媒体内容发布时对应的热度，间隔的时间为热门媒体内容从发布时间和当前时间之间的时间间隔。

最后，根据热门媒体对象对应的评分、贝叶斯平均得分以及冷却得分进行加权运算，得到热门媒体对象对应的热度值。具体的，可按照以下公式进行计算：

热度值＝bayes_score*y1+avg_score*y2+publish_year_diff_score*y3；

其中，bayes_score为热门媒体对象对应的贝叶斯平均得分，y1为贝叶斯平均得分对应的权重；avg_score为热门媒体对象的平均评分，y2为平均评分对应的权重；publish_year_diff_score为冷却得分，y3为冷却得分对应的权重。Y1、y2、y3可以根据实际的需要进行设置，在本申请实施例中，可以将y1设置为0.6、y2设置为0.2、y3设置为0.2。

媒资数据中可以包括多个媒体数据资源库中的数据，在不同的媒体资源库中，同一热门媒体对象的评分可能是不同的，例如，存在4个媒体数据资源库，某一热门媒体对象的评分分别z1、z2、z3和z4，那么该热门媒体对象对应的平均评分为(z1+z2+z3+z4)/4。

基于单个用户的行为数据构建第二用户画像，第二用户画像由短期行为特征和短期行为特征对应的权重共同组成。该单个用户的行为数据可以是指当前需要被推荐的用户。具体的，该过程可以包括：

基于媒资数据对媒体对象的类型构建内容-类型的图数据，基于媒资数据对媒体对象的标签构建内容-标签的图数据；根据内容-类型的图数据和内容-标签的图数据计算每个热门媒体对象在类型以及标签下的相关度得分；从单个用户的行为数据中提取用户的短期行为特征，并利用相关度得分计算每个短期行为特征对应的权重，构建得到第二用户画像。

下面以内容-类型的图数据为例进行说明，在内容-类型的图数据中，节点可以表示媒体对象和媒体对象的类型，边表示媒体对象包括的媒体对象的类型，边的权重为该媒体对象的类型对应的词频-逆文本频率，这些节点、边以及权重共同构成内容-类型的图数据。具体可以参阅图4，节点1、节点2、节点3表示媒体对象，节点4和节点5表示不同的媒体对象的类型，其中，节点1、节点2和节点3均与节点4和节点5之间有边，表示节点1、节点2和节点3所表示的媒体对象均包含节点4和节点5所表示的媒体对象的类型。

然后将内容-类型的图数据输入Node2Vec模型，分别得到媒体对象对应的向量和类型对应的向量，计算媒体对象对应的向量和类型的向量之间的点积，得到每个媒体对象与该类型的相关度得分。同理，可构建出内容-标签的图数据，并计算得到每个媒体对象与该标签的相关度得分。

其中，标签是指媒体对象的标签，类型是指媒体对象的类型，标签和类型可以统称为媒体对象的类别，这些类别还可以包括演员、导演等等，即可以将媒体对象可以归属于这些类别，并得到该媒体对象和这些类别的相关度。按照上述的方式，可以得到每个媒体对象与每个类别的相关度。例如媒体对象1[类型1:0.3，类型2：0.5]表示媒体对象1与类型1的相关度为0.3，与类型2的相关度为0.5。

可以理解的是，每个类别下都具有多个元素，例如，类型下具有类型1、类型2等等，标签下具有标签1、标签2等等，演员下具有演员1、演员2等等。

从单个用户的行为数据中提取短期行为特征，具体可以是从行为数据中提取在当前时间之前的预设时段内的观看记录，并从观看记录中提取媒体对象，将这些媒体对象的类型、标签、演员、导演等作为第二用户画像中的短期行为特征。

根据前述计算得到的每个媒体对象和类别的相关度得分以及衰减策略，计算每个短期行为特征的权重，该权重表示用户对该短期行为特征的偏好得分,从而可以得到第二用户画像。

例如，假设媒体对象1[类型1：0.8，类型2：0.7]，假设媒体对象2[类型2：0.5，类型3：0.3]，用户11月1号观看过这两个媒体对象后，他11月2号画像里就会出现[类型1：0.8，类型2：1.2，类型3：0.3]。

假设11月2号没有观看过媒体对象，那11月3号的画像即为11月2号画像里的得分进行时间衰减，衰减系数可根据实际情况规定，假设衰减后用户画像最后为[类型1：0.64，类型2：0.96，类型3：0.24]。

假设11月2号观看了新的媒体对象3[类型4：0.4，类型1：0.2]，则在用户画像的基础上[类型1：0.64，类型2：0.96，类型2：0.24]，同类型得分相加后，11月3号的画像为[类型1：0.84，类型2：0.96，类型3：0.24，类型4：0.4]。

在得到热门媒体对象对应的热度值和第二用户画像后，可以计算每个热门媒体对象的热度得分。具体的，可以是获取热门媒体对象的类别，使用该热门媒体对象热度值乘以第二用户画像中，该类别对应的权重。例如，某一短期热门媒体对象的类别为类型1，热度值为90，第二用户画像为[类型1：0.84，类型2：0.96，类型3：0.24，类型4：0.4]，则90*0.84＝75.6，即为该热门媒体对象在类型1下的热度得分。

由此可以计算得到所有的热门媒体对象在每个短期行为特征下的热度得分，按照该热度得分可以在每个短期行为特征下召回一定数量的热门媒体对象，当一个热门媒体对象被多次召回时，可以保留得分最高的召回结果。

例如，短期行为特征为类型1和演员1，其中，在类型1和演员1下均召回了热门媒体对象2，其在演员1下的热度得分大于在类型1下的热度得分，则在类型1下剔除热门媒体对象2，保留在演员1下的热门媒体对象2。

在一些实施方式中，至少两个预设策略还可以包括第四策略，第四策略是基于用户的搜索收藏的召回策略。具体的，可以是从用户行为数据中提取预设时间段内搜索的媒体对象以及收藏的媒体对象；将提取到的所述媒体对象作为所述第四策略对应的候选内容。

例如，可以是直接获取用户在前一天的搜索日志收藏日志，其中，搜索收藏日志中包括了搜索日志和收藏日志，从搜索日志和收藏日志中提取出媒体对象，直接提取出的媒体对象作为和第四策略对应的候选内容。

S130、对所有所述候选内容进行融合得到待推荐的目标内容。

通过前述描述可知，在进行内容推荐时，可以选取上述4种预设策略中的至少两个对行为数据和媒资数据进行处理，可以得到对应的候选内容。

为了确保推荐的准确性，可以将所有的候选内容进行融合，以得到待推荐的目标内容。

在一些实施方式中，可以是获取所有的候选内容，计算候选内容的交集，例如，若选取了两个预设策略可以对应得到两个候选内容，将每个候选内容作为一个集合，求两个集合的交集，将该交集作为待推荐的目标内容。

在一些实施方式中，每个候选内容中的媒体对象都具有对应的排名，可以对所有候选内容中的排名进行融合，对所述候选内容中媒体对象进行排序，得到待推荐的目标内容。

例如，其中一个候选内容中为：1_媒体对象2、2_媒体对象1、3_媒体对象4、4_媒体对象3；另一个候选内容中为：1_媒体对象2、2_媒体对象3、3_媒体对象5、4_媒体对象6。其中，1_媒体对象2中的1表示排名第一。

可以计算每个媒体对象的总排名，可以得到每个媒体对象的新的排名：2_媒体对象2、2_媒体对象1、3_媒体对象4、3_媒体对象5、4_媒体对象6、6_媒体对象3。

在一些实施方式中，可以是对每个候选内容进行简单的拼接，以得到待推荐的目标内容。例如，一个候选内容为：媒体对象1、媒体对象2，另一个候选内容为：媒体对象2、媒体对象4，那么待推荐的目标内容为：媒体对象1、媒体对象2、媒体对象4。

需要说明的是，上述预设策略均需要对行为数据进行处理，得到对应的候选内容，然而，在一些情况下，利用冷启动时，无法获取到行为数据，则无法采用上述4种预设策略得到对应的候选内容。

可以采用以下步骤得到待推荐的目标内容：从所有用户的行为数据中提取热门媒体对象；从媒资数据中获取所述热门媒体对象对应的媒体特征值；根据所述热门媒体对象的媒体特征值以及预设基准值，计算热门媒体对象对应的贝叶斯平均得分；根据所述热门媒体对象的媒体特征值以及预设冷却系数，计算所述热门媒体对象对应的冷却得分；根据热门媒体对象对应的评分、贝叶斯平均得分以及冷却得分，计算所述热门媒体对象的热度值；根据所述热门媒体对象对应的热度值，得到所述待推荐的目标内容。

上述计算热门媒体对象对应的热度值的方式可以参照前述第三策略时的对应内容，为避免重复，在此不再赘述。在得到热门媒体对象对应的热度值后，可以按照热度值对热门媒体对象进行排序，选取排序靠前的预设数量个热门媒体对象，作为待推荐的目标内容。

需要说明的是，在一些实施方式中，在利用预设策略对媒资数据和行为数据进行处理之前，可以是根据获取到的数据，确定采用的处理策略。例如，将没有获取到行为数据时的处理策略称为第五策略，可以是确定是否获取到该用户对应的行为数据；若获取到该用户的行为数据，可以任意选择第一策略、第二策略、第三策略和第四策略中的至少两个；若没有获取到该用户的行为数据，采用第五策略对数据进行处理。

作为一种实施方式，在任意选择两个预设策略之前，可以制定对应的选择策略，例如随机选择等。在对候选内容进行融合时，也可以采用任意一种融合方式，从而，不同选择策略可以对应得到不同的待推荐的目标内容，以便每次得到的待推荐的目标内容的变化程度较大，以便提升用户的点击率。

在得到待推荐的目标内容后，可以输出待推荐的目标内容，以便向用户展示待推荐的目标内容，例如，将待推荐的目标内容发送至发出推荐触发操作的终端设备，以便在该终端设备上展示待推荐的目标内容。

本申请实施例提供的内容推荐方案可以应用在各种推荐场景中。比如，以电影推荐为例，融合多种不同的预设策略可以得到不同的候选内容，对不同的候选内容进行融合，以得到待推荐的目标内容。采用本申请实施例提供的方案可以在行为数据稀疏的情况下，融合多种不同的策略对应的候选内容，使得每次得到的目标内容变化程度增大，避免推荐内容的单一，以提升用户的点击率，具有较好的推荐效果。并且在对数据处理时也融合了行为数据，也可以提升推荐内容的准确性。

根据上述实施例所描述的方法，以下将作进一步详细说明。

在本实施例中，将以智能电视机中的电影推荐为例，对本申请实施例的方法进行详细说明。

如图5所示，一种内容推荐方法具体流程如下：

S210、接收智能电视机发送的推荐触发操作。

S220、响应于推荐触发操作，获取媒资数据以及行为数据。

S230、基于至少两个预设策略，对所述媒资数据以及行为数据进行处理，得到与每个预设策略对应的候选电影。

S240、对所有所述候选电影进行融合得到待推荐的目标电影。

S250、向智能电视机发送所述待推荐的目标电影。

在接收到智能电视机发送的推荐触发操作时，可以获取媒资数据以及行为数据；基于至少两个预设策略，对媒资数据以及行为数据进行处理，得到与每个预设策略对应的候选电影。

其中，预设策略可以包括前述实施例中提到的第一策略、第二策略、第三策略和第四策略，可以随机选取至少两个预设策略，例如，选取第一策略和第二策略，可以得到和第一策略对应的候选电影，和第二策略对应的候选电影。将第一策略对应的候选电影和第二策略对应的候选电影进行融合处理，可以得到待推荐的目标内容，最后将目标内容发送至智能电视机，以便在智能电视机上显示目标内容。

具体的，该处理过程可同时参阅图6，示出了整个内容推荐方法的框架图。其中得到候选电影的方式有四种，融合方式有三种，均可以任意选择，以得到不同的目标内容。本申请实例中各个步骤的具体实现方式可与前述实施例中的内容相互参照。

由上可知，本申请实施例通过使用至少两个预设策略对待处理数据进行处理，得到不同的候选内容，再对候选内容进行融合得到待推荐的目标内容，在行为数据稀疏的情况下，融合多种不同的策略对应的候选内容，使得每次得到的目标内容变化程度增大，避免推荐内容的单一，以提升用户的点击率，具有较好的推荐效果。并且在对数据处理时也融合了行为数据，也可以提升推荐内容的准确性。

为了更好地实施以上方法，本申请实施例还提供一种内容推荐装置，该内容装置具体可以集成在电子设备中，该电子设备可以为终端、服务器等设备。其中，终端可以为手机、平板电脑、智能蓝牙设备、笔记本电脑、个人电脑等设备；服务器可以是单一服务器，也可以是由多个服务器组成的服务器集群。

比如，在本实施例中，将以内容推荐装置具体集成在服务器中为例，对本申请实施例的方法进行详细说明。

例如，如图7所示，该内容推荐装置300可以包括获取模块310、处理模块320、以及融合模块330。

获取模块310，用于响应于推荐触发操作，获取待处理数据；处理模块320，用于基于至少两个预设策略，对所述待处理数据进行处理，得到与每个预设策略对应的候选内容；融合模块330，用于对所有所述候选内容进行融合得到待推荐的目标内容。

在一些实施例中，所述待处理数据包括媒资数据以及行为数据，所述至少两个预设策略包括第一策略，处理模块320还用于：从所述媒资数据中提取媒体对象，以及媒体对象之间的推荐关系；根据所述媒体对象以及媒体对象之间的推荐关系，得到每个媒体对象对应的第一向量；根据所述第一向量计算任意两个媒体对象之间的相似度，并根据所述相似度确定出每个媒体对象对应的第一媒体对象；从所述行为数据中提取第二媒体对象，并根据每个媒体对象对应的第一媒体对象，将与所述第二媒体对应第一媒体对象确定为目标媒体对象；利用牛顿冷却定律计算所述第二媒体对象对应的第一得分；根据所述第二媒体对象对应的第一得分，计算所述目标媒体对象的第二得分；基于所述第二得分，得到与所述第一策略对应的候选内容。

在一些实施例中，所述待处理数据包括媒资数据以及行为数据，处理模块320还用于：基于所述媒资数据构建媒体对象画像，并对所述媒体对象画像中的每个特征进行编码，得到媒体对象画像对应的第二向量；从所述行为数据中提取用户的长期行为特征，所述长期行为特征为用户在历史时段内观看的媒体对象的特征；按照预设规则计算所述长期行为特征对应的权重，得到第一用户画像对应的第三向量；计算所述第二向量和第三向量的点积，得到偏好得分；基于所述偏好得分，得到所述第二策略对应的候选内容。

在一些实施例中，处理模块320还用于：计算所述长期行为特征对应的词频-逆文本频率；

根据所述长期行为特征确定待处理媒体对象；根据所述待处理媒体对象的第一完播率计算第二完播率，所述第一完播率为当前时刻所述待处理媒体对象的完播率，所述第二完播率为用户播放所述待处理媒体对象时的完播率，所述完播率为完整播放待处理媒体对象的次数与播放待处理媒体对象的总次数的比值；基于所述词频-逆文本频率、第二完播率计算所述长期行为特征对应的权重；将所述权重和长期行为特征转换为所述第三向量。

在一些实施例中，所述至少两个预设策略还包括第三策略，处理模块320还用于：从所有用户的行为数据中提取热门媒体对象；从所述媒资数据中获取所述热门媒体对象的媒体特征值，并根据媒体特征值计算所述热门媒体对象的热度值；根据单个用户的行为数据构建第二用户画像，所述第二用户画像包括短期行为特征以及与所述短期行为特征对应的权重，所述短期行为特征为用户在预设时段内观看的媒体对象的特征；根据所述热门媒体对象的热度值以及短期行为特征对应的权重，计算所述热门媒体对象的热度得分；基于所述热门媒体对象的热度得分，得到与所述第三策略对应的候选内容。

在一些实施例中，处理模块320还用于：根据所述热门媒体对象的媒体特征值以及预设基准值，计算热门媒体对象对应的贝叶斯平均得分；根据所述热门媒体对象的媒体特征值以及预设冷却系数，计算所述热门媒体对象对应的冷却得分；根据热门媒体对象对应的评分、贝叶斯平均得分以及冷却得分，计算所述热门媒体对象的热度值。

在一些实施例中，所述至少两个预设策略还包括第四策略，处理模块320还用于：从所述行为数据中提取预设时间段内的搜索的媒体对象，以及收藏的媒体对象；将提取到的所述媒体对象作为所述第四策略对应的候选内容。

具体实施时，以上各个模块可以作为独立的实体来实现，也可以进行任意组合，作为同一或若干个实体来实现，以上各个模块的具体实施可参见前面的方法实施例，在此不再赘述。

由上可知，本实施例的内容推荐装置通过使用至少两个预设策略对媒资数据和行为数据进行处理，得到不同的候选内容，再对候选内容进行融合得到待推荐的目标内容，在行为数据稀疏的情况下，融合多种不同的策略对应的候选内容，使得每次得到的目标内容变化程度增大，避免推荐内容的单一，以提升用户的点击率，具有较好的推荐效果。并且在对数据处理时也融合了行为数据，也可以提升推荐内容的准确性。

相应的，本申请实施例还提供一种电子设备，该电子设备可以为终端或服务器，该终端可以为智能手机、平板电脑、笔记本电脑、触控屏幕、游戏机、个人计算机、个人数字助理(Personal Digital Assistant，PDA)等终端设备。

如图8所示，图8为本申请实施例提供的电子设备的结构示意图，该电子设备400包括有一个或者一个以上处理核心的处理器401、有一个或一个以上计算机可读存储介质的存储器402及存储在存储器402上并可在处理器上运行的计算机程序。其中，处理器401与存储器402电性连接。本领域技术人员可以理解，图中示出的电子设备结构并不构成对电子设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

处理器401是电子设备400的控制中心，利用各种接口和线路连接整个电子设备400的各个部分，通过运行或加载存储在存储器402内的软件程序和/或模块，以及调用存储在存储器402内的数据，执行电子设备400的各种功能和处理数据，从而对电子设备400进行整体监控。

在本申请实施例中，电子设备400中的处理器401会按照如下的步骤，将一个或一个以上的应用程序的进程对应的指令加载到存储器402中，并由处理器401来运行存储在存储器402中的应用程序，从而实现各种功能：

响应于推荐触发操作，获取待处理数据；

基于至少两个预设策略，对所述待处理数据进行处理，得到与每个预设策略对应的候选内容；

对所有所述候选内容进行融合得到待推荐的目标内容。

以上各个操作的具体实施可参见前面的实施例，在此不再赘述。

可选的，如图8所示，电子设备400还包括：触控显示屏403、射频电路404、音频电路405、输入单元406以及电源407。其中，处理器401分别与触控显示屏403、射频电路404、音频电路405、输入单元406以及电源407电性连接。本领域技术人员可以理解，图8中示出的电子设备结构并不构成对电子设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

触控显示屏403可用于显示图形用户界面以及接收用户作用于图形用户界面产生的操作指令。触控显示屏403可以包括显示面板和触控面板。其中，显示面板可用于显示由用户输入的信息或提供给用户的信息以及电子设备的各种图形用户接口，这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。可选的，可以采用液晶显示器(LCD，Liquid Crystal Display)、有机发光二极管(OLED，Organic Light-Emitting Diode)等形式来配置显示面板。触控面板可用于收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作)，并生成相应的操作指令，且操作指令执行对应程序。可选的，触控面板可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器401，并能接收处理器401发来的命令并加以执行。触控面板可覆盖显示面板，当触控面板检测到在其上或附近的触摸操作后，传送给处理器401以确定触摸事件的类型，随后处理器401根据触摸事件的类型在显示面板上提供相应的视觉输出。在本申请实施例中，可以将触控面板与显示面板集成到触控显示屏403而实现输入和输出功能。但是在某些实施例中，触控面板与触控面板可以作为两个独立的部件来实现输入和输出功能。即触控显示屏403也可以作为输入单元406的一部分实现输入功能。

射频电路404可用于收发射频信号，以通过无线通信与网络设备或其他电子设备建立无线通讯，与网络设备或其他电子设备之间收发信号。

音频电路405可以用于通过扬声器、传声器提供用户与电子设备之间的音频接口。音频电路405可将接收到的音频数据转换后的电信号，传输到扬声器，由扬声器转换为声音信号输出；另一方面，传声器将收集的声音信号转换为电信号，由音频电路405接收后转换为音频数据，再将音频数据输出处理器401处理后，经射频电路404以发送给比如另一电子设备，或者将音频数据输出至存储器402以便进一步处理。音频电路405还可能包括耳塞插孔，以提供外设耳机与电子设备的通信。

输入单元406可用于接收输入的数字、字符信息或用户特征信息(例如指纹、虹膜、面部信息等)，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

电源407用于给电子设备400的各个部件供电。可选的，电源407可以通过电源管理系统与处理器401逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源407还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

尽管图8中未示出，电子设备400还可以包括摄像头、传感器、无线保真模块、蓝牙模块等，在此不再赘述。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

由上可知，本实施例提供的电子设备可以通过使用至少两个预设策略对媒资数据和行为数据进行处理，得到不同的候选内容，再对候选内容进行融合得到待推荐的目标内容，在行为数据稀疏的情况下，融合多种不同的策略对应的候选内容，使得每次得到的目标内容变化程度增大，避免推荐内容的单一，以提升用户的点击率，具有较好的推荐效果。并且在对数据处理时也融合了行为数据，也可以提升推荐内容的准确性。

本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过指令来完成，或通过指令控制相关的硬件来完成，该指令可以存储于一计算机可读存储介质中，并由处理器进行加载和执行。

为此，本申请实施例提供一种计算机可读存储介质，其中存储有多条计算机程序，该计算机程序能够被处理器进行加载，以执行本申请实施例所提供的任一种内容推荐方法中的步骤。例如，该计算机程序可以执行如下步骤：

响应于推荐触发操作，获取待处理数据；

对所有所述候选内容进行融合得到待推荐的目标内容。

其中，该存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，Random Access Memory)、磁盘或光盘等。

由于该存储介质中所存储的计算机程序，可以执行本申请实施例所提供的任一种内容推荐方法中的步骤，因此，可以实现本申请实施例所提供的任一种内容推荐方法所能实现的有益效果，详见前面的实施例，在此不再赘述。

以上对本申请实施例所提供的一种内容推荐方法、装置、存储介质及电子设备进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种内容推荐方法，其特征在于，包括：

响应于推荐触发操作，获取待处理数据；

对所有所述候选内容进行融合得到待推荐的目标内容。

2.根据权利要求1所述的方法，其特征在于，所述待处理数据包括媒资数据以及行为数据，所述至少两个预设策略包括第一策略，所述基于至少两个预设策略，对所述待处理数据进行处理，得到与每个预设策略对应的候选内容，包括：

从所述媒资数据中提取媒体对象，以及媒体对象之间的推荐关系；

根据所述媒体对象以及媒体对象之间的推荐关系，得到每个媒体对象对应的第一向量；

根据所述第一向量计算任意两个媒体对象之间的相似度，并根据所述相似度确定出每个媒体对象对应的第一媒体对象；

从所述行为数据中提取第二媒体对象，并根据每个媒体对象对应的第一媒体对象，将与所述第二媒体对应的第一媒体对象确定为目标媒体对象；

利用牛顿冷却定律计算所述第二媒体对象对应的第一得分；

根据所述第二媒体对象对应的第一得分，计算所述目标媒体对象的第二得分；

基于所述第二得分，得到与所述第一策略对应的候选内容。

3.根据权利要求2所述的方法，其特征在于，所述至少两个预设策略还包括第二策略，所述基于至少两个预设策略，对所述待处理数据进行处理，得到与每个预设策略对应的候选内容，包括：

基于所述媒资数据构建媒体对象画像，并对所述媒体对象画像中的每个特征进行编码，得到媒体对象画像对应的第二向量；

从所述行为数据中提取用户的长期行为特征，所述长期行为特征为用户在历史时段内观看的媒体对象的特征；

按照预设规则计算所述长期行为特征对应的权重，得到第一用户画像对应的第三向量；

计算所述第二向量和第三向量的点积，得到偏好得分；

基于所述偏好得分，得到所述第二策略对应的候选内容。

4.根据权利要求3所述的方法，其特征在于，所述按照预设规则计算所述长期行为特征对应的权重，得到第一用户画像对应的第三向量，包括：

计算所述长期行为特征对应的词频-逆文本频率；

根据所述长期行为特征确定待处理媒体对象；

根据所述待处理媒体对象的第一完播率计算第二完播率，所述第一完播率为当前时刻所述待处理媒体对象的完播率，所述第二完播率为用户播放所述待处理媒体对象时的完播率，所述完播率为完整播放待处理媒体对象的次数与播放待处理媒体对象的总次数的比值；

基于所述词频-逆文本频率、第二完播率计算所述长期行为特征对应的权重；

将所述长期行为特征对应的权重和长期行为特征转换为所述第三向量。

5.根据权利要求3或4所述的方法，其特征在于，所述至少两个预设策略还包括第三策略，所述基于至少两个预设策略，对所述待处理数据进行处理，得到与每个预设策略对应的候选内容，包括：

从所有用户的行为数据中提取热门媒体对象；

从所述媒资数据中获取所述热门媒体对象的媒体特征值，并根据媒体特征值计算所述热门媒体对象的热度值；

根据单个用户的行为数据构建第二用户画像，所述第二用户画像包括短期行为特征以及与所述短期行为特征对应的权重，所述短期行为特征为用户在预设时段内观看的媒体对象的特征；

根据所述热门媒体对象的热度值以及短期行为特征对应的权重，计算所述热门媒体对象的热度得分；

基于所述热门媒体对象的热度得分，得到与所述第三策略对应的候选内容。

6.根据权利要求5所述的方法，其特征在于，从所述媒资数据中获取所述热门媒体对象的媒体特征值，并根据媒体特征值计算所述热门媒体对象的热度值，包括：

根据所述热门媒体对象的媒体特征值以及预设基准值，计算热门媒体对象对应的贝叶斯平均得分；

根据所述热门媒体对象的媒体特征值以及预设冷却系数，计算所述热门媒体对象对应的冷却得分；

根据热门媒体对象对应的评分、贝叶斯平均得分以及冷却得分，计算所述热门媒体对象的热度值。

7.根据权利要求5所述的方法，其特征在于，所述至少两个预设策略还包括第四策略，所述基于至少两个预设策略，对所述媒资数据以及行为数据进行处理，得到与每个预设策略对应的候选内容，包括：

从所述行为数据中提取预设时间段内的搜索的媒体对象，以及收藏的媒体对象；

将提取到的所述媒体对象作为所述第四策略对应的候选内容。

8.一种内容推荐装置，其特征在于，包括：

获取模块，用于响应于推荐触发操作，获取待处理数据；

处理模块，用于基于至少两个预设策略，对所述待处理数据进行处理，得到与每个预设策略对应的候选内容；

融合模块，用于对所有所述候选内容进行融合得到待推荐的目标内容。

9.一种电子设备，其特征在于，包括处理器和存储器，所述存储器存储有多条指令；所述处理器从所述存储器中加载指令，以执行如权利要求1～7任一项所述的内容推荐方法中的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有多条指令，所述指令适于处理器进行加载，以执行权利要求1～7任一项所述的内容推荐方法中的步骤。