CN110263189A

CN110263189A - 媒体内容的推荐方法、装置、存储介质和计算机设备

Info

Publication number: CN110263189A
Application number: CN201910548910.6A
Authority: CN
Inventors: 张新宇; 张伸正
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Shenzhen Yayue Technology Co ltd
Priority date: 2019-06-24
Filing date: 2019-06-24
Publication date: 2019-09-20
Anticipated expiration: 2039-06-24
Also published as: CN110263189B

Abstract

本申请涉及一种媒体内容的推荐方法、装置、存储介质和计算机设备，所述方法包括：获取待选媒体内容的观看评价信息；观看评价信息根据待选媒体内容的第一观看行为数据确定；根据观看评价信息，从待选媒体内容中确定有效观看媒体内容；从有效观看媒体内容中确定与目标用户的兴趣相匹配的推荐媒体内容；向目标用户输出推荐媒体内容。本申请提供的方案，解决了文章推荐的准确性不高的问题。在滤除了无效阅读媒体内容的基础上，向目标用户输出推荐媒体内容，有效提高媒体内容推荐的准确性。

Description

媒体内容的推荐方法、装置、存储介质和计算机设备

技术领域

本申请涉及互联网技术领域，特别是涉及一种媒体内容的推荐方法、装置、存储介质和计算机设备。

背景技术

随着互联网技术的发展以及人们生活节奏的加快，用户往往希望在最短的时间内看到自己感兴趣的文章、视频等媒体内容，因此，出现了自动为用户推荐媒体内容的方法。在媒体内容推荐方法中，主要是给用户推荐曾经喜欢物品的相似物品，或者，根据相似用户喜欢的物品进行交叉推荐，比如用户的某一朋友喜欢文学类文章，那么就给该用户推荐文学类文章。

但是，目前这种媒体内容推荐方法会使得媒体内容间的相似性存在较大的噪声，比如用户可能会因为标题的迷惑性而“误”点某些文章，而这些“误”点的文章也会作为推荐文章。这就使得推荐的媒体内容并不是用户真正感兴趣的，造成媒体内容推荐的准确性不高。

发明内容

基于此，有必要针对媒体内容推荐的准确性不高的技术问题，提供一种媒体内容的推荐方法、装置、计算机可读存储介质和计算机设备。

一方面，本发明实施例提供一种媒体内容的推荐方法，包括以下步骤：获取待选媒体内容的观看评价信息；所述观看评价信息根据所述待选媒体内容的第一观看行为数据确定；根据所述观看评价信息，从所述待选媒体内容中确定有效观看媒体内容；从所述有效观看媒体内容中确定与目标用户的兴趣相匹配的推荐媒体内容；向所述目标用户输出所述推荐媒体内容。

另一方面，本发明实施例提供一种媒体内容的推荐装置，包括：评价信息获取模块，用于获取待选媒体内容的观看评价信息；所述观看评价信息根据所述待选媒体内容的第一观看行为数据确定；第一内容确定模块，用于根据所述观看评价信息，从所述待选媒体内容中确定有效观看媒体内容；第二内容确定模块，用于从所述有效观看媒体内容中确定与目标用户的兴趣相匹配的推荐媒体内容；以及，推荐内容输出模块，用于向所述目标用户输出所述推荐媒体内容。

再一方面，本发明实施例提供一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：获取待选媒体内容的观看评价信息；所述观看评价信息根据所述待选媒体内容的第一观看行为数据确定；根据所述观看评价信息，从所述待选媒体内容中确定有效观看媒体内容；从所述有效观看媒体内容中确定与目标用户的兴趣相匹配的推荐媒体内容；向所述目标用户输出所述推荐媒体内容。

又一方面，本发明实施例提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：获取待选媒体内容的观看评价信息；所述观看评价信息根据所述待选媒体内容的第一观看行为数据确定；根据所述观看评价信息，从所述待选媒体内容中确定有效观看媒体内容；从所述有效观看媒体内容中确定与目标用户的兴趣相匹配的推荐媒体内容；向所述目标用户输出所述推荐媒体内容。

上述媒体内容的推荐方法、装置、计算机可读存储介质和计算机设备，根据用户观看待选媒体内容的第一观看行为数据从待选媒体内容中过滤无效观看媒体内容，选出准确的有效观看媒体内容，进而根据用户特征信息针对性地向目标用户输出推荐媒体内容，有效提高媒体内容推荐的准确性。

附图说明

图1为一个实施例中媒体内容的推荐方法的应用环境图；

图2为一个实施例中媒体内容的推荐方法的流程示意图；

图3为一个实施例中新闻列表刷新前后的界面示意图；

图4为一个实施例中新闻列表滤除无效新闻前后的电脑端界面示意图；

图5为一个实施例中新闻列表滤除无效新闻前后的手机端界面示意图；

图6为一个实施例中新闻列表排序前后的手机端界面示意图；

图7为另一个实施例中媒体内容的推荐方法的流程示意图；

图8为再一个实施例中媒体内容的推荐方法的流程示意图；

图9为又一个实施例中媒体内容的推荐方法的流程示意图；

图10为一个实施例中新闻推荐系统的结构框图；

图11为一个实施例中媒体内容的推荐装置的结构框图；

图12为一个实施例中计算机设备的结构框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

图1为一个实施例中媒体内容的推荐方法的应用环境图。参照图1，该媒体内容的推荐方法应用于媒体内容的推荐系统(也可称为媒体内容推荐系统)。该媒体内容的推荐系统包括终端102和服务器104，终端102可以是目标用户使用的设备。终端102和服务器104通过网络连接。终端102具体可以是台式终端或移动终端，移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

推荐系统是一种以海量数据挖掘为基础的关联用户和物品的一种工具，它能够在信息过载的环境中帮助用户筛选他们感兴趣的信息，为用户提供个性化的决策支持和信息服务。媒体内容推荐系统可以指为用户进行媒体内容推荐的系统，例如：文章推荐系统指的是为用户进行文章推荐的系统，该文章推荐系统可以借助应用程序(如：腾讯新闻)等文章阅读平台实现。为便于描述，以下以媒体内容推荐系统为例阐述媒体内容的推荐方法，需要理解的是，本发明实施例并不限于媒体内容推荐系统，还可以应用于其他的推荐系统中。

如图2所示，在一个实施例中，提供了一种媒体内容的推荐方法。本实施例主要以该方法应用于上述图1中的服务器104来举例说明。参照图2，该媒体内容的推荐方法具体包括如下步骤：

S202，获取待选媒体内容的观看评价信息；观看评价信息根据待选媒体内容的第一观看行为数据确定。其中，媒体内容可以指通过网络媒体播放或显示的内容，可以包括文章、视频等。

用户通过电子设备(手机、电脑、平板等)观看待选媒体内容时，一般会经过点击-查看-点赞/踩-评论/分享中的某个或某些步骤，而在这个过程中电子设备会采集用户的行为数据，这个行为数据就可以认为是第一观看行为数据。进一步地，第一观看行为数据可以指用户在观看媒体内容过程产生的各种数据。而观看评价信息指的是根据第一观看行为数据确定的对待选媒体内容进行用户感兴趣度评价的数据，可以表征用户对某一待选媒体内容的感兴趣程度。

在文章推荐、商品推荐等场景中，基于协同过滤的推荐算法被大量应用。这种算法以大量用户对物的打分数据为基础，主要分为两个大的方向：基于用户和基于项的推荐。基于用户的推荐是基于用户间的相似性，将相似用户喜欢物品进行交叉推荐，例如：某一用户的朋友A喜欢文学类资讯，那么就会推荐给该用户推荐朋友A阅读过的相关文学类资讯。基于项的推荐是利用物品间的相似性，向用户推进其已经购买或喜欢物品的相似物品。具体的，媒体内容推荐可以包括新闻个性化推荐，在这种推荐场景下，协同过滤利用用户的交互数据，提取用户的兴趣特点，为不同用户推荐其感兴趣的新闻资讯。

因此，在一些实施例中，可以通过协同过滤算法来计算待选媒体内容的观看评价信息，进而从待选媒体内容中确定有效观看媒体内容。进一步地，观看评价信息的确定过程可以是：根据协同过滤算法对第一观看行为数据进行处理，根据处理结果确定各个用户对某一待选媒体内容的感兴趣程度，即得到观看评价信息。这个观看评价信息可以通过具体的数值来体现，数值高的观看评价信息可以表征用户对某一待选媒体内容的感兴趣程度高。

S204，根据观看评价信息，从待选媒体内容中确定有效观看媒体内容。

其中，有效观看媒体内容指的是参考用户真正感兴趣的媒体内容。参考用户可以指查看某一媒体内容推荐系统的所有用户(即根据众多参考用户的观看行为数据确定有效观看媒体内容，进而对目标用户进行媒体内容推荐)；进一步地，有效观看媒体内容可以是该媒体内容推荐系统中大部分参考用户都感兴趣的媒体内容。所确定的有效观看媒体内容可以为一个、两个、甚至多个，该有效观看媒体内容的数量可以动态确定，也可以是某一固定数量。具体的，有效观看媒体内容的数量可以根据当前正在使用媒体内容推荐系统的目标用户数量来动态确定。

在目标用户选择进入某一媒体内容展示平台后，电子设备的屏幕上往往会以列表的形式显示媒体内容的标题，目标用户通过浏览标题来确定是否进行点击观看操作；如果用户看到某个标题觉得有兴趣，就会点击该媒体内容对应的触发区域，电子设备的界面就会切换到对应底层页的媒体内容，此时用户开始观看媒体内容，如果该媒体内容确实是用户感兴趣的，则用户可能会从头到尾看下去，如果该媒体内容与标题内容不符(即指标题党)或者该内容对用户没有吸引力，则用户可能会在没有进行有效观看的情况下很快地退出媒体内容界面。对于被用户点击但并非用户真正感兴趣的“误”点媒体内容，可以认为是无效观看媒体内容，如果仅仅因为用户点击了某一媒体内容A，就将该无效观看媒体内容推荐给对应的用户，则被推荐的用户不一定会感兴趣，这就导致媒体内容推荐的准确性低。

S206，从所述有效观看媒体内容中确定与目标用户的兴趣相匹配的推荐媒体内容。

目标用户可以指正在使用媒体内容推荐系统的用户，该目标用户正在通过媒体内容推荐系统观看媒体内容，因此需要向该目标用户输出媒体内容。在进行媒体内容输出时，可以先确定用户特征信息，根据该用户特征信息针对性地选择推荐媒体内容。

其中，用户特征信息可以理解为用户画像，可以包括用户基本信息(例如：年龄、性别、职业)、所在城市、长期兴趣、短期兴趣、历史观看记录等，这些信息可以表征目标用户对不同媒体内容的感兴趣程度。不同特征的用户对媒体内容的选择可能不同，例如：律师偏向于观看法律方面的媒体内容，而软件工程师偏向于观看软件、电子设备等方面的媒体内容。

可以根据媒体内容具体展示的内容、用户给予的评价等，确定其媒体内容特征信息(可以理解为标签)。如果某一有效观看媒体内容的媒体内容特征信息与用户特征信息相匹配，则可以将该有效观看媒体内容确定为对应目标用户的推荐媒体内容。进一步地，推荐媒体内容的数量可以是一个、两个、甚至多个。推荐媒体内容的具体数量可以根据目标用户的历史观看时长(例如：前一天、上一周等)确定，例如：某一目标用户每天会花1小时来观看媒体内容，则推荐媒体内容的数量可以为50个；如果某一目标用户每天仅花10分钟来观看媒体内容，则推荐媒体内容的数量可以为10个。

S208，向目标用户输出推荐媒体内容。

向目标用户输出推荐媒体内容可以指向目标用户当前正在使用的电子设备输出推荐媒体内容。

进一步地，推荐媒体内容的输出可以是有选择性的，例如：先输出其中的部分，如果用户点击刷新，则可以按顺序显示剩下的推荐媒体内容。因此，除了确定准备推荐媒体内容，还可以确定一些候选媒体内容；在推荐媒体内容展示完毕(目标用户持续刷新界面，导致推荐媒体内容展示完毕)后，可以向目标用户展示候选媒体内容。当然，在推荐媒体内容展示完毕后，也可以重新确定新的推荐媒体内容并向目标用户输出。

再进一步地，推荐媒体内容的显示顺序可以根据观看评价信息来确定；例如：按照观看评价信息的数值高低来对推荐媒体内容排序，在电子设备的文章显示框中按顺序显示对应的推荐媒体内容。以新闻推荐为例，如图3所示，手机界面最初显示的新闻列表如图3(a)，其中显示了排序在前的新闻，用户点击手机界面下端的刷新按键后，界面切换为图3(b)，其中显示了排序在后的新闻。这样的方式既能保证目标用户看到自己最感兴趣的新闻，又能为用户提供足够数量的新闻。

上述实施例提供的媒体内容的推荐方法，根据用户观看待选媒体内容的行为数据从待选媒体内容中过滤标题党文章等无效媒体内容，准确选出有效观看媒体内容，进而针对性地向目标用户输出其感兴趣的推荐媒体内容，能有效提高媒体内容推荐的准确性。

在一个实施例中，获取待选媒体内容的观看评价信息的步骤，包括：获取参考用户观看待选媒体内容时生成的第一观看行为数据；通过已训练的编码向量转换模型对第一观看行为数据进行编码向量转换，得到评价编码向量；根据评价编码向量，确定待选媒体内容的观看评价信息。

编码向量转换模型可以通过深度神经网络的方式来构建。在一些实施例中，通过已训练的编码向量转换模型对第一观看行为数据进行编码向量转换的步骤之前，还包括：构建编码向量转换模型；根据L2范数和梯度下降法，对所构建的编码向量转换模型进行训练，得到已训练的编码向量转换模型。

在一些实施例中，媒体内容为文章，对应的，待选媒体内容可以指待选文章。其中，待选文章是指的是文章推荐系统的文章池中的文章，即可以推荐给用户的文章。需要说明的是，这个文章可以指任何通过文本展示的内容，例如新闻、资讯、短文等，文章中还可以包含图片、视频、商品信息等。另外，待选文章可以指多篇文章，本发明实施例对待选文章的具体数量不做限制。

具体的，根据深度神经网络构建好编码向量转换模型之后，结合正则项的梯度下降法进行模型学习训练。在训练时，先获取观看行为数据，依据word2vec的方法从该数据中提取用户数据、文章数据以及观看状态，将所提取的数据输入到已经构建好的编码向量转换模型中进行监督学习，该监督学习结合正则项的梯度下降法，其中正则项使用编码的L2范数，避免了陷入局部最优，而对于梯度下降，则是对目标函数采用步长乘以梯度的方式，以降低目标函数，当模型的输出准确率达到95％(也可以为其他值)时，认为模型已训练完成。已训练的编码向量转换模型即可以用于对第一观看行为数据进行编码向量的转换。

其中，用户数据指的是用于标识某一用户的数据，可以是用户ID、用户特征信息等；文章数据指的是用于标识某一文章的数据，可以是文章ID、文章类别、文章特征信息等；观看状态指的是参考用户在观看某一文章时所达到的状态，可以是点击状态(可以仅指点击标题，也可以指点击标题之后短暂的阅读)、阅读状态(可以指有效阅读，即阅读时长大于预设的阈值)、点赞状态、评论状态、转发状态等。用户数据和文章数据可以是具体的编号，而观看状态可以根据用户对文章的观看深度来确定，例如：某一用户对某一文章的观看深度为点击，则将观看状态确定为0，如果观看深度为阅读，则将观看状态确定为1，另外，点赞状态可以用2表示，评论状态可以用3表示，转发状态可以用4表示。

确定好的用户数据、文章数据以及观看状态可以如下表1所示：

表1观看行为数据提取示例

进一步地，所确定的用户数据、文章数据以及观看状态可以如下：

{'user_id':645331,'items':{570:1,14607:1,16942:1,11177:1,12962:1,21432:1,21464:1,747:1,3010:1,21681:1,9079:1,16391:1,1271:1,17328:1,24033:1,10845:1}}

其中，'user_id'表示用户数据；'items'中包含两项内容，以下以“570:1”为例进行说明，第一项中的“570”可以指待选文章的文章数据，第二项中的“1”可以指该待选文章的观看状态为阅读状态。

再进一步地，确定好用户数据、文章数据以及观看状态后，将这些数据输入编码向量转换模型中。该编码向量转换模型的最终目标函数可以为：

其中，代表正样例集，即用户u对于文章i到达的阶段所组成的集合；代表负样例集，即用户u对于文章i不能到达的阶段所组成的集合；P_ui′，l*+1代表到达负样例的概率，即用户u对于文章i能到达l阶段，但不能到达l+1，此处为到达l+1阶段(考虑单调行为链上的各个阶段，因此可以直接用l和l+1来区分两个阶段)的概率值；p_ui，l*代表到达正样例的概率，即用户u对于文章i到达l阶段的概率值，p_ui，l*可以通过如下公式计算：

(映射到0--1)

其中，(引入三个偏执项)，(激活函数，便于学习非线性部分)，(基于用户数据、文章数据以及观看状态的原始数值)。

p_ui，∩为PMI(Pointwise Mutual Information)值，用来衡量事务相关性的一个指标，计算过程如下：

基于协调过滤的算法在近年来有一些新的思路和方法被引进。比如矩阵分解、自然语言处理等方式，使得基于协调过滤算法所计算的相似性越来越准确。但是，传统算法存在以下问题：1)这些算法的基础是打分矩阵或者相关性矩阵，基于矩阵进行各个用户间、项间的相似性评价，这就使得算法验证完全依赖于矩阵，并且没有一个有效的校正机制。2)用户的“误”点击行为也影响了文章推荐系统的参数，导致召回阶段(确定有效阅读文章的阶段)对强噪声做校正，进而使得用户不感兴趣的文章被推荐。3)大量标题党的内容被用户诱导点击，在协同过滤计算后，仅考虑点击这一单个过程，使得这些被“误”点击的文章持续存在在矩阵中，且仍然会以较高的热度存在于文章池中，造成恶性循环。以上这些原因都导致依照传统算法推荐的文章良莠不齐，大量劣质文章被推荐。

为解决这些问题，本发明实施例考虑文章阅读单调行为链的协同过滤推荐方法。在进行相似性的统计矩阵中考虑观看行为数据。由于用户的行为是严格单调的，所以仅需要一个矩阵即可完成对矩阵的统计记录工作，如上表1所示，用户U1对文章A1仅仅进行了点击并没有有效阅读，用户U3对文章A2不仅进行了点击还进行了有效阅读。包含有观看阶段的观看行为数据反映了用对文章的感兴趣程度，实现了对点击行为的修正。

进一步地，通过已训练的编码向量转换模型对第一观看行为数据进行编码向量转换，得到评价编码向量的步骤，包括：根据第一观看行为数据确定用户数据、文章数据以及观看状态，并输入到编码向量转换模型中；根据编码向量转换模型的输出，确定用户数据对应的第一编码向量、文章数据对应的第二编码向量以及观看状态对应的第三编码向量；根据第一编码向量、第二编码向量和第三编码向量整合得到评价编码向量。

编码向量转换模型输出的第一编码向量、第二编码向量以及第三编码向量的维度可以相同，也可以不同。在维度都相同的情形下，他们的维度可以为k维，k可以取值为16、64、128等。16维的第一编码向量举例如下：

上述实施例提供了编码向量转换模型的构建以及训练过程，结合正则项的梯度下降法，能得到可靠的编码向量转换模型，进而可以得到准确的评价编码向量，实现了对行为数据的量化，有利于提高文章推荐的效率。

在一个实施例中，根据评价编码向量，确定待选媒体内容的观看评价信息的步骤，包括：计算第一编码向量和第二编码向量的哈达玛积(hadamard)值；将计算得到的哈达玛积值与第三编码向量进行内积运算；根据内积运算的结果确定待选媒体内容所到达的观看阶段，得到观看评价信息。观看评价信息可以理解为各个用户、各个文章以及各个观看阶段间的相似度，根据该相似度即可以确定某一用户对某一文章的感兴趣程度。

对第一、第二以及第三编码向量进行运算得到观看评价信息可以通过如下公式计算：I(S_t)＝f(U_i,I_j,S_t)＝(U_i·I_j,S_t)，其中，I(S_t)表示计算得到的观看评价信息，Ui表示用户数据，Ij表示文章数据，St表示观看状态。需要说明的是，(U_i·I_j,S_t)中的点代表对应位相乘(即hadamard乘积)，()代表内积运算。

计算得到的内积运算结果，可以表征用户对某一待选文章到达各个阶段的分数，据此可以获得用户对该待选文章的喜好程度。比如通过计算用户U_i对文章I_j达到点击阶段的分数很低，则代表用户U_i对文章I_j的感兴趣程度非常低，这类似于传统的协同过滤方法。如果用户U_i对文章I_j达到点击阶段的分数较高，而到达有效阅读阶段的分数很低，则代表这篇文章I_j可能是一篇标题党文章，用户虽然会因题目或者其他原因进行点击，但实际上用户对文章的兴趣度不高，这种情况可以通过内积运算结果直观地展现出来。

本实施例，在对文章进行编码时，不再将仅用户对文章的阅读行为作为一个评分值，而是将阶段这一变量作为一个隐变量参与到编码中，有效避免评分机制中分数评价尺度(分数评价尺度指的是通过对某一对象进行1/2/3/4/5的等级打分，这种情况往往会受打分人主观因素的影响，导致评价结果不够准确)的影响。通过编码向量转换模型对用户数据、文章数据以及阅读状态进行统一编码，得到易于进行数值计算的编码向量，之后再对编码向量转换模型输出的第一、第二以及第三编码向量进行运算，得到的观看评价信息更为直观。

点击和阅读行为存在严谨的单调关系，用户只能先点击，才能进一步阅读。在一个实施例中，观看状态包括点击状态和阅读状态；观看阶段包括处于同一单调行为链的点击阶段和阅读阶段(对于不是文章的媒体内容，观看状态可以包括点击状态和查看状态，观看阶段可以包括点击阶段和查看阶段)；根据内积运算的结果确定待选媒体内容所到达的观看阶段的步骤，包括：根据内积运算的结果，确定某一待选评估文章处于点击状态的第一分值和处于阅读状态的第二分值；其中，待选评估文章从待选文章中选择；当第一分值低于预设的点击阈值时，或者，当第一分值高于点击阈值且第二分值低于预设的阅读阈值时，判定待选评估文章到达点击阶段；当第一分值高于点击阈值且第二分值高于阅读阈值时，判定待选评估文章到达阅读阶段。需要说明的是，每一篇待选评估文章都可以对应有第一分值和第二分值，如果用户点击了某一待选评估文章后选择快速退出(即没有进行阅读)，则可以认为其第二分值为0或者为一个很低的值。另外，在某些情况下，也可以将第一分值低于点击阈值但第二分值高于阅读阈值的待选评估文章判定为到达阅读阶段。其中，点击阈值和阅读阈值可以根据实际情况确定，本发明实施例对这两个阈值的具体数值不做限制。

在一些实施例中，根据观看评价信息，从待选媒体内容中确定有效观看媒体内容的步骤，包括：根据观看评价信息，确定各个待选媒体内容所到达的观看阶段；将观看阶段为阅读阶段的待选媒体内容，确定为有效阅读文章(也可以认为是召回文章)，作为有效观看媒体内容。另外，对于观看阶段为点击阶段的待选文章，可以认为是无效阅读文章。

在一些实施例中，根据第一观看行为数据确定用户数据、文章数据以及观看状态的步骤，包括：根据第一观看行为数据，确定某一待选参考文章被参考用户观看时的阅读时长；其中，待选参考文章从待选文章中选择；当阅读时长大于或等于设定的时长阈值时，判定待选参考文章的观看状态为阅读状态；当阅读时长小于设定的时长阈值时，判定待选参考文章的观看状态为点击状态。本发明实施例认为用户对一篇文章进行一段时间深入的阅读才可以认为用户真正对文章感兴趣，即属于阅读状态而并不是简单的点击。

时长阈值可以通过以下方式来确定：使用统计学中人类阅读文章的速度作为基准进行确定。对于上报的用户阅读数据中，如果用户对一篇文章的阅读时间达到人类平均阅读速度(对应的阅读时间可以认为是标准时间)下80％(比例可以根据实际情况调整)的时长，则认为该用户对该文章进行了有效阅读，即观看状态为阅读状态。其中，人类平均阅读速度可以根据文章中包含的内容确定，考虑其中包含的文字数量、字体大小、图片形式、图片数量、视频时长等。

进一步地，时长阈值也可以细化为多个，即将观看状态分为多个状态，例如：阅读时长分别达到标准时间的0-20％，21％-40％，41％-60％，61％-80％，81％-100％时，观看状态确定为闪退状态、轻度点击状态、深度点击状态、浅度阅读状态、深度阅读状态。在这种情况下，观看阶段也可以进行相应调整，例如调整为：闪退阶段、轻度点击阶段、深度点击阶段、浅度阅读阶段、深度阅读阶段；进一步地，编码向量转换模型的训练以及观看评价信息的确定也需做适应性调整。

现在主流的协同过滤算法主要利用了用户一个阶段的交互数据，比如新闻推荐中利用用户的点击数据计算新闻资讯间的相似性。仅仅考虑单个行为不能很好地反映用户或资讯间的相似性，用户的点击数据会被标题党资讯和标题内容不一致的资讯影响，这会使得新闻间的相似性存在较大的噪声，使得推荐给用户的资讯并不是用户希望的，影响用户的体验。用户对新闻的阅读行为存在一个单调的行为链，点击新闻-观看新闻-评论/分享新闻，这个行为链条表达了用户对所阅读新闻的感兴趣程度。图4和图5分别表示电脑端和手机端展示的新闻，图4的热点精选部分以及图5的推荐部分指的是目标推荐新闻。图4(a)以及图5(a)指的是根据传统协同过滤算法确定的目标推荐新闻，其中“网红直播卸妆，XXXXXX”以及“每天坚持做这三个动作，让你月瘦20斤！”并不是目标用户真正感兴趣的新闻，如果持续推荐给该目标用户，则会影响其体验。

本实施例考虑了用户进行文章阅读时两个典型的单调行为：点击和阅读，对用户和文章进行了单调行为链编码，进而计算用户、文章以及阶段之间的相似性。用户点击后会根据文章的质量决定是否在文章底层页进行深入阅读，如果文章是标题党或者图文与标题不符，用户会很快离开页面。两阶段的单调行为引入，使得文章间的相似性不是仅仅依赖于用户点击的数据，而是通过用户的阅读数据为点击数据提供一个较好的校正，基于编码完成基于文章的召回方法，使得文章推荐的准确率得到提高。将第一分值和第二分值均高于设定阈值的待选评估文章确定为到达阅读阶段的文章，能很好地对用户观看文章所达到的阶段进行区分，进而确定出用户真正感兴趣的有效阅读文章。如图4(b)以及图5(b)为依据本发明实施例确定的目标推荐新闻，其中剔除了“标题党”新闻，使用目标用户看到的都是自己感兴趣的内容，有效提高用户体验。

本发明实施例提供的文章推荐方法可以用于腾讯新闻的推荐系统中。在进行协同过滤的相似性计算之前，将用户的对新闻的行为标定为两个二值过程，即点击和有效阅读。显然，有效阅读行为包含点击行为。因此数据被处理为用户对单篇新闻阅读所处的程度(是到达有效阅读还是仅仅点击)。然后基于这两个行为对用户和新闻编码，实现基于项(基于文章)的推荐。上述实施例方法去掉了大量“误”点击数据，使得相似性度量准确，提高了新闻召回的质量。

在一个实施例中，向目标用户输出推荐媒体内容的步骤，包括：当有效观看媒体内容的数量小于预设的文章展示数量时，从观看阶段为点击阶段的待选文章中选择替补文章，以使有效阅读文章和替补文章的总数量与文章展示数量一致；将有效阅读文章和替补文章确定为目标推荐文章，作为推荐媒体内容；向目标用户输出推荐媒体内容。

其中，文章展示数量可以根据实际情况确定，例如，为10篇、20篇、50篇等。另外，不同目标用户的文章展示数量可以相同也可以不同。同一目标用户在不同时间段的文章展示数量可以相同也可以不同。

另一方面，向目标用户输出推荐媒体内容的步骤，包括：当有效阅读文章的数量大于或等于文章展示数量时，选择与文章展示数量对应数量的有效阅读文章，作为推荐媒体内容；向目标用户输出推荐媒体内容。

假设文章展示数量为N，将到达有效阅读阶段的且分数位于前N位的待选文章作为推荐媒体内容(此时可称目标推荐文章)，将这些推荐媒体内容列为文章序列存入服务器。在目标用户请求文章(可以指目标用户打开文章阅读平台的应用程序)时，将文章序列进行精排排名和文章位置调整后输出给该目标用户。进一步地，如果可到达有效阅读阶段的文章多于N篇，则从可到达有效阅读阶段的文章中直接选择N篇进行召回；如果可到达有效阅读阶段的文章不足N篇，则考虑从可到达点击阶段的分数较高的文章中选择一部分文章进行召回。

在某些情况下，如果目标推荐文章均被阅读完，则可以将相似用户S对应的目标推荐文章作为目标用户的新的目标推荐文章，或者，将与之前确定的目标推荐文章的同类型文章作为该目标用户的新的目标推荐文章。

本实施例，根据文章展示数量来确定目标推荐文章，在目标推荐文章数量不够的情况下从点击阶段的待选文章中选择，能在保证目标用户文章阅读需求的基础上，尽可能为用户推荐感兴趣的文章，提高目标用户的使用体验。

在一个实施例中，从有效观看媒体内容中确定与目标用户的兴趣相匹配的推荐媒体内容的步骤，包括：获取目标用户的用户特征信息；用户特征信息用于表征目标用户对推荐媒体内容的感兴趣程度；获取推荐媒体内容的媒体内容特征信息；根据用户特征信息、媒体内容特征信息以及第二分值，从有效观看媒体内容中确定与目标用户的兴趣相匹配的推荐媒体内容。

其中，媒体内容特征信息可以指媒体内容的类型、所包含的内容、编号等。具体到文章中，文章特征信息可以指文章类型、文章编号、上下文信息等。

此外，可以确定用户特征信息与媒体内容特征信息的匹配度，根据匹配度和第二分值对推荐媒体内容进行排序。将匹配度高且第二分值高的推荐媒体内容排在前面，并向目标用户输出排序后的推荐媒体内容(可以先输出排序在前的推荐媒体内容，也可以先输出排序在后的推荐媒体内容)。

在一些实施例中，向目标用户输出排序后的推荐媒体内容之前，还可以包括对推荐媒体内容进行去重的操作，这个去重操作可以是去除内容完全一样或者相似度较高的媒体内容。

在一些实施例中，媒体内容在返回给用户时会进行相似性排重，媒体内容列表多样性优化，降低同质媒体内容的大量出现。

本实施例，结合多种特征信息以及观看评价信息中的分值来对推荐媒体内容进行排序输出，能优先输出目标用户最感兴趣的媒体内容。

在一个实施例中，向目标用户输出推荐媒体内容的步骤之后，还包括：获取目标用户观看推荐媒体内容时生成的第二观看行为数据；根据第二观看行为数据，更新观看评价信息和用户特征信息。

进一步地，可以根据第二观看行为数据对编码向量转换模型中的参数(例如：深度学习网络的参数)进行更新。

以媒体内容为文章为例，更新观看评价信息和用户特征信息后，当需要再次向该目标用户进行文章推荐时，就可以按照更新后的观看评价信息和用户特征信息来确定目标推荐文章；更新相关性文章列表，新的文章会加到现有的召回中，老的会删除。如图6所示，(a)表示信息更新前推荐的新闻，(b)表示信息更新后推荐的新闻，从两个图的变化可以看出，该目标用户由之前的关注股票和外交新闻转变为关注外交和汽车新闻。

对观看评价信息和用户特征信息的更新可以实时进行，也可以定期(更新周期可以为一天、一周、一月等)进行。

本实施例提供的文章推荐方法，根据用户对目标推荐文章的反馈进行信息调整，此时用户的观看行为数据会以固定的格式快速上报到服务器。这些观看行为数据会影响用户画像，使得画像反应用户实时的兴趣点。同时，服务器会根据最新的上报数据进行编码的更新，并基于更新后的编码进行文章推荐。准确地对用户的需求进行响应，在用户感兴趣的点发生变化时及时调整，实现智能化的文章推荐。算法会如此往复，不断的更新参数，进行推荐，这使得算法能够迅速地获得处于不断变化的用户兴趣以及文章池内容间的关系，达到良好的推荐效果。

如图7所示，以下以文章为例详细阐述一个本发明媒体内容的推荐方法的应用实例，该应用实例中包含有服务器702以及终端704。

S702、服务器从文章池的待选文章中确定有效阅读文章，并根据目标用户的用户特征信息确定目标推荐文章。

S704、服务器将该目标推荐文章输出给目标用户正在使用的终端。

S706、终端对目标推荐文章进行显示，并采集目标用户在查看目标推荐文章时的观看行为数据。

S708、终端将观看行为数据反馈给服务器。

S710、服务器根据该观看行为数据确定新的目标推荐文章，并发送给终端。

S712、终端对新的目标推荐文章进行显示。

本实施例提供的文章推荐方法，在召回文章时，会根据用户的反馈进行更新，实现对用户兴趣的捕捉，提高文章推荐的准确性与智能性。

在一个实施例中，如图8所示，以下以文章为例详细阐述另一个本发明媒体内容的推荐方法的应用实例。

S802、构建编码向量转换模型；根据L2范数和梯度下降法，对所构建的编码向量转换模型进行训练，得到已训练的编码向量转换模型。

S804、获取参考用户查阅待选文章时生成的第一观看行为数据；根据第一观看行为数据确定用户数据、文章数据以及观看状态，并输入到已训练的编码向量转换模型中。

S806、根据编码向量转换模型的输出，确定用户数据对应的第一编码向量、文章数据对应的第二编码向量以及观看状态对应的第三编码向量。

S808、计算第一编码向量和第二编码向量的哈达玛积值；将计算得到的哈达玛积值与第三编码向量进行内积运算。

S810、根据内积运算的结果，确定某一待选评估文章处于点击状态的第一分值和处于阅读状态的第二分值；其中，待选评估文章从待选文章中选择。

S812、当第一分值低于预设的点击阈值时，或者，当第一分值高于点击阈值且第二分值低于预设的阅读阈值时，判定待选评估文章到达点击阶段；当第一分值高于点击阈值且第二分值高于阅读阈值时，判定待选评估文章到达阅读阶段；根据待选文章所到达的观看阶段，得到观看评价信息。

S814、根据观看评价信息，确定各个待选文章所到达的观看阶段；将观看阶段为阅读阶段的待选文章，确定为有效阅读文章。

S816、当有效阅读文章的数量大于或等于预设的文章展示数量时，选择与文章展示数量对应数量的有效阅读文章，作为目标推荐文章；当有效阅读文章的数量小于预设的文章展示数量时，从观看阶段为点击阶段的待选文章中选择替补文章，以使有效阅读文章和替补文章的总数量与文章展示数量一致；将有效阅读文章和替补文章确定为目标推荐文章。

S818、获取目标用户的用户特征信息；获取目标推荐文章的文章特征信息；根据用户特征信息、文章特征信息以及第二分值，对目标推荐文章进行排序。

S820、向目标用户输出排序后的目标推荐文章。

S822、获取目标用户查阅目标推荐文章时生成的第二观看行为数据；根据第二观看行为数据，更新观看评价信息和用户特征信息。

本实施例提供的文章推荐方法，提出体重增加考虑用户行为的协同过滤推荐算法，有效地利用上报的观看行为数据，这不但使得召回文章的准确率和覆盖率得到提升，同时也有效的提升了用户画像的精确性和用户的阅读体验。

在一个实施例中，如图9所示，以下以用户使用手机观看新闻为例，详细阐述再一个本发明媒体内容的推荐方法的应用实例。

S902、构建编码向量转换模型；结合正则项的梯度下降法对所构建的编码向量转换模型进行训练，得到已训练的编码向量转换模型。

S904、接收多个参考用户观看新闻时生成的行为数据；从行为数据中提取用户数据、文章数据以及观看状态，并输入到已训练的编码向量转换模型中进行统一编码，分别得到用户数据对应的第一编码向量、文章数据对应的第二编码向量以及观看状态对应的第三编码向量。

S906、对第一编码向量、第二编码向量以及第三编码向量进行运算，得到新闻池中各个新闻到达点击阶段和到达阅读阶段对应的第一分值和第二分值；根据第一分值和第二分值将其中阅读阶段的新闻确定为有效阅读新闻，将点击阶段的新闻确定为无效阅读新闻。

S908、对新闻池中可到达阅读阶段且第二分值位于前N位的新闻存入服务器的数据库中；如果可到达阅读阶段的新闻不足N篇，则从到达点击阶段且第一分值较高的新闻中选择一部分新闻进行召回，存入服务器的数据库中。其中，召回的新闻存储数据库可以采用redis存储的方式，当然使用缓存等其他方式也可以实现相同的功能，但思想一致，也应纳入本发明的保护范围。

S910、在目标用户请求阅读新闻时，确定目标用户的用户特征信息，根据该用户特征信息从数据库的N篇新闻中确定目标推荐新闻。

S912、通过rank模块和rerank模块对目标推荐新闻进行排名和新闻位置调整后，输出至目标用户所使用的手机界面上。

本实施例提供的文章推荐方法，将用户单调的行为数据引入到用户对新闻的相似性评价中，有效阅读行为为点击行为提供校正，使得为用户推荐的新闻更加符合用户的兴趣。推荐后的点击和阅读行为数据联合使用，提高了召回新闻的准确率，使得用户真正感兴趣的新闻被体检，提高了用户体验。

在一个实施例中，如图10所示，新闻推荐系统可以包含四个模块：用户画像服务模块、召回服务模块(包括协同过滤类召回和其他召回)、rank服务模块和rerank服务模块。其中，画像服务会影响推荐系统的各个方面。召回服务模块包括协同过滤类召回模块和其他召回模块，协同过滤类召回模块可以实现前述实施例中确定有效阅读新闻的功能，在召回阶段根据用户兴趣尽可能地召回新闻，而其他召回模块可以根据热点、用户所在地域等信息进行待选新闻的筛选；本发明实施例可以结合协同过滤类召回模块和其他召回模块，基于用户的兴趣从海量待选新闻中，较准确地挖掘出用户的潜在喜欢新闻，得到召回新闻。rank服务模块根据用户画像对召回文件进行精细排序，rerank服务模块对精排后的新闻进行合理的排版和呈现。rank服务模块和rerank服务模块对召回新闻进行分析并结合用户画像服务模块发送的用户特征信息对召回新闻进行精细排序并分发到用户。其中，rerank服务模块主要考虑美观和多样性，比如对于美观，不能出现连续的两个大图新闻，对于多样性，同类型的新闻最多不能超过2条。

在进行目标推荐新闻的展示之后，用户阅读推荐新闻，电子设备将其行为进行统计并上报，新闻推荐系统根据用户的反馈进行画像更新，同时也会更新当前的召回模块。所以不准确的召回会使得rank服务模块和rerank服务模块无法获取用户喜欢的新闻，不准确的新闻排序后显然也不会获得用户的兴趣，并且还会影响画像的准确。本发明实施例提供的新闻推荐方法，使得用户的画像越来越准确，也使得rank服务模块和rerank服务模块能更好地基于用户的兴趣对召回的新闻进行精细排名。

应该理解的是，虽然本发明实施例的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以其它的顺序执行。而且，流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

需要说明的是，对于前述的各方法实施例，为了简便描述，将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其它顺序或者同时进行。

基于与上述实施例中的媒体内容的推荐方法相同的思想，本发明还提供媒体内容的推荐装置，该装置可用于执行上述媒体内容的推荐方法。为了便于说明，媒体内容的推荐装置实施例的结构示意图中，仅仅示出了与本发明实施例相关的部分，本领域技术人员可以理解，图示结构并不构成对装置的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图11所示，媒体内容的推荐装置包括评价信息获取模块1102、第一内容确定模块1104、第二内容确定模块1106和推荐内容输出模块1108，详细说明如下：评价信息获取模块1102，用于获取待选媒体内容的观看评价信息；观看评价信息根据待选媒体内容的第一观看行为数据确定；第一内容确定模块1104，用于根据观看评价信息，从待选媒体内容中确定有效观看媒体内容；第二内容确定模块1106，用于从有效观看媒体内容中确定与目标用户的兴趣相匹配的推荐媒体内容；以及，推荐内容输出模块1108，用于向目标用户输出推荐媒体内容。本实施例，根据用户观看待选媒体内容的第一观看行为数据从待选媒体内容中过滤无效媒体内容，选出准确的有效观看媒体内容，进而根据用户特征信息针对性地向目标用户输出推荐媒体内容，有效提高媒体内容推荐的准确性。

在一个实施例中，评价信息获取模块1102，包括：行为数据获取子模块，用于获取参考用户观看待选媒体内容时生成的第一观看行为数据；编码向量转换子模块，用于通过已训练的编码向量转换模型对第一观看行为数据进行编码向量转换，得到评价编码向量；评价信息确定子模块，用于根据评价编码向量，确定待选媒体内容的观看评价信息。

在一个实施例中，编码向量转换子模块，包括：模型输入单元，用于根据第一观看行为数据确定用户数据、文章数据以及观看状态，并输入到编码向量转换模型中；模型输出单元，用于根据编码向量转换模型的输出，确定用户数据对应的第一编码向量、文章数据对应的第二编码向量以及观看状态对应的第三编码向量；编码向量确定单元，用于根据第一编码向量、第二编码向量和第三编码向量整合得到评价编码向量。

在一个实施例中，评价信息确定子模块，包括：哈达玛积计算单元，用于计算第一编码向量和第二编码向量的哈达玛积值；内积运算单元，用于将计算得到的哈达玛积值与第三编码向量进行内积运算；观看阶段确定单元，用于根据内积运算的结果确定待选媒体内容所到达的观看阶段，得到观看评价信息。

在一个实施例中，待选媒体内容包括待选文章；观看状态包括点击状态和阅读状态；观看阶段包括处于同一单调行为链的点击阶段和阅读阶段；观看阶段确定单元，包括：分值确定子单元，用于根据内积运算的结果，确定某一待选评估文章处于点击状态的第一分值和处于阅读状态的第二分值；其中，待选评估文章从待选文章中选择；点击阶段判断子单元，用于当第一分值低于预设的点击阈值时，或者，当第一分值高于点击阈值且第二分值低于预设的阅读阈值时，判定待选评估文章到达点击阶段；阅读阶段判断子单元，用于当第一分值高于点击阈值且第二分值高于阅读阈值时，判定待选评估文章到达阅读阶段。

在一个实施例中，第一内容确定模块1104，包括：观看阶段确定子模块，用于根据观看评价信息，确定各个待选媒体内容所到达的观看阶段；文章确定子模块，用于将观看阶段为阅读阶段的待选文章，确定为有效阅读文章，作为所述有效观看媒体内容。

在一个实施例中，推荐内容输出模块1108，包括：替补文章选择子模块，用于当有效观看媒体内容的数量小于预设的文章展示数量时，从观看阶段为点击阶段的待选媒体内容中选择替补文章，以使有效观看媒体内容和替补文章的总数量与文章展示数量一致；推荐文章确定子模块，用于将有效观看媒体内容和替补文章确定为目标推荐文章，作为推荐媒体内容；第一推荐文章输出子模块，用于向目标用户输出推荐媒体内容。

在一个实施例中，推荐内容输出模块1108，包括：推荐文章选择子模块，用于当有效观看媒体内容的数量大于或等于预设的文章展示数量时，选择与文章展示数量对应数量的有效观看媒体内容，作为推荐媒体内容；第二推荐文章输出子模块，用于向目标用户输出推荐媒体内容。

在一个实施例中，模型输入单元，包括：阅读时长确定子单元，用于根据第一观看行为数据，确定某一待选参考文章被参考用户观看时的阅读时长；其中，待选参考文章从待选媒体内容中选择；阅读状态判断子单元，用于当阅读时长大于或等于设定的时长阈值时，判定待选参考文章的观看状态为阅读状态；点击状态判断子单元，用于当阅读时长小于设定的时长阈值时，判定待选参考文章的观看状态为点击状态。

在一个实施例中，第二内容确定模块1106，包括：第一特征获取子模块，用于获取目标用户的用户特征信息；用户特征信息用于表征目标用户对推荐媒体内容的感兴趣程度；第二特征获取子模块，用于获取推荐媒体内容的媒体内容特征信息；媒体内容确定子模块，用于根据用户特征信息、媒体内容特征信息以及第二分值，从有效观看媒体内容中确定与目标用户的兴趣相匹配的推荐媒体内容。

在一个实施例中，还包括：行为数据获取模块，用于获取目标用户观看推荐媒体内容时生成的第二观看行为数据；信息更新模块，用于根据第二观看行为数据，更新观看评价信息和用户特征信息。

在一个实施例中，评价信息获取模块1102，还包括：模型构建子模块，用于构建编码向量转换模型；模型训练子模块，用于根据L2范数和梯度下降法，对所构建的编码向量转换模型进行训练，得到已训练的编码向量转换模型。

图12示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的服务器104。如图12所示，该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中，存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统，还可存储有计算机程序，该计算机程序被处理器执行时，可使得处理器实现媒体内容的推荐方法。该内存储器中也可储存有计算机程序，该计算机程序被处理器执行时，可使得处理器执行媒体内容的推荐方法。该显示屏可以是液晶显示屏或者电子墨水显示屏，该输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。本领域技术人员可以理解，图12中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，本申请提供的媒体内容的推荐装置可以实现为一种计算机程序的形式，计算机程序可在如图12所示的计算机设备上运行。计算机设备的存储器中可存储组成该媒体内容的推荐装置的各个程序模块，比如，图11所示的评价信息获取模块、第一内容确定模块、第二内容确定模块和推荐内容输出模块。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的媒体内容的推荐方法中的步骤。

例如，图12所示的计算机设备可以通过如图11所示的媒体内容的推荐装置中的评价信息获取模块执行获取待选媒体内容的观看评价信息的步骤；可通过第一内容确定模块执行根据所述观看评价信息，从待选媒体内容中确定有效观看媒体内容的步骤；可通过第二内容确定模块执行从有效观看媒体内容中确定与目标用户的兴趣相匹配的推荐媒体内容的步骤；可通过推荐内容输出模块执行向所述目标用户输出所述推荐媒体内容的步骤。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器存储有计算机程序，计算机程序被处理器执行时，使得处理器执行上述媒体内容的推荐方法的步骤。此处媒体内容的推荐方法的步骤可以是上述各个实施例的媒体内容的推荐方法中的步骤。

在一个实施例中，提供了一种计算机可读存储介质，存储有计算机程序，计算机程序被处理器执行时，使得处理器执行上述媒体内容的推荐方法的步骤。此处媒体内容的推荐方法的步骤可以是上述各个实施例的媒体内容的推荐方法中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种媒体内容的推荐方法，包括：

获取待选媒体内容的观看评价信息；所述观看评价信息根据所述待选媒体内容的第一观看行为数据确定；

根据所述观看评价信息，从所述待选媒体内容中确定有效观看媒体内容；

从所述有效观看媒体内容中确定与目标用户的兴趣相匹配的推荐媒体内容；

向所述目标用户输出所述推荐媒体内容。

2.根据权利要求1所述的方法，其特征在于，所述获取待选媒体内容的观看评价信息的步骤，包括：

获取参考用户观看所述待选媒体内容时生成的第一观看行为数据；

通过已训练的编码向量转换模型对所述第一观看行为数据进行编码向量转换，得到评价编码向量；

根据所述评价编码向量，确定所述待选媒体内容的观看评价信息。

3.根据权利要求2所述的方法，其特征在于，所述媒体内容包括文章；

所述通过已训练的编码向量转换模型对所述第一观看行为数据进行编码向量转换，得到评价编码向量的步骤，包括：

根据所述第一观看行为数据确定用户数据、文章数据以及观看状态，并输入到所述编码向量转换模型中；

根据所述编码向量转换模型的输出，确定用户数据对应的第一编码向量、文章数据对应的第二编码向量以及观看状态对应的第三编码向量；

根据所述第一编码向量、第二编码向量和所述第三编码向量整合得到所述评价编码向量。

4.根据权利要求3所述的方法，其特征在于，所述根据所述评价编码向量，确定所述待选媒体内容的观看评价信息的步骤，包括：

计算所述第一编码向量和第二编码向量的哈达玛积值；

将计算得到的哈达玛积值与所述第三编码向量进行内积运算；

根据内积运算的结果确定所述待选媒体内容所到达的观看阶段，得到所述观看评价信息。

5.根据权利要求4所述的方法，其特征在于，所述待选媒体内容包括待选文章；所述观看状态包括点击状态和阅读状态；所述观看阶段包括处于同一单调行为链的点击阶段和阅读阶段；

所述根据内积运算的结果确定所述待选媒体内容所到达的观看阶段的步骤，包括：

根据所述内积运算的结果，确定某一待选评估文章处于点击状态的第一分值和处于阅读状态的第二分值；其中，所述待选评估文章从所述待选文章中选择；

当所述第一分值低于预设的点击阈值时，或者，当所述第一分值高于所述点击阈值且所述第二分值低于预设的阅读阈值时，判定所述待选评估文章到达点击阶段；

当所述第一分值高于所述点击阈值且所述第二分值高于所述阅读阈值时，判定所述待选评估文章到达阅读阶段。

6.根据权利要求5所述的方法，其特征在于，所述根据所述观看评价信息，从所述待选媒体内容中确定有效观看媒体内容的步骤，包括：

根据所述观看评价信息，确定各个待选文章所到达的观看阶段；

将观看阶段为阅读阶段的待选文章，确定为有效阅读文章，作为所述有效观看媒体内容。

7.根据权利要求6所述的方法，其特征在于，所述向所述目标用户输出所述推荐媒体内容的步骤，包括：

当所述有效阅读文章的数量小于预设的文章展示数量时，从观看阶段为点击阶段的待选文章中选择替补文章，以使所述有效阅读文章和所述替补文章的总数量与所述文章展示数量一致；

将所述有效阅读文章和所述替补文章确定为目标推荐文章，作为所述推荐媒体内容；

向所述目标用户输出所述推荐媒体内容。

8.根据权利要求6所述的方法，其特征在于，所述向所述目标用户输出所述推荐媒体内容的步骤，包括：

当所述有效阅读文章的数量大于或等于预设的文章展示数量时，选择与所述文章展示数量对应数量的有效阅读文章，作为所述推荐媒体内容；

向所述目标用户输出所述推荐媒体内容。

9.根据权利要求5所述的方法，其特征在于，所述根据所述第一观看行为数据确定用户数据、文章数据以及观看状态的步骤，包括：

根据所述第一观看行为数据，确定某一待选参考文章被参考用户观看时的阅读时长；其中，所述待选参考文章从所述待选文章中选择；

当所述阅读时长大于或等于设定的时长阈值时，判定所述待选参考文章的观看状态为阅读状态；

当所述阅读时长小于所述设定的时长阈值时，判定所述待选参考文章的观看状态为点击状态。

10.根据权利要求5所述的方法，其特征在于，所述从所述有效观看媒体内容中确定与目标用户的兴趣相匹配的推荐媒体内容的步骤，包括：

获取所述目标用户的用户特征信息；所述用户特征信息用于表征所述目标用户对所述推荐媒体内容的感兴趣程度；

获取所述推荐媒体内容的媒体内容特征信息；

根据所述用户特征信息、所述媒体内容特征信息以及所述第二分值，从所述有效观看媒体内容中确定所述目标用户感兴趣的推荐媒体内容。

11.根据权利要求10所述的方法，其特征在于，所述向所述目标用户输出所述推荐媒体内容的步骤之后，还包括：

获取所述目标用户观看所述推荐媒体内容时生成的第二观看行为数据；

根据所述第二观看行为数据，更新所述观看评价信息和所述用户特征信息。

12.根据权利要求2至11任一项所述的方法，其特征在于，所述通过已训练的编码向量转换模型对所述第一观看行为数据进行编码向量转换的步骤之前，还包括：

构建编码向量转换模型；

根据L2范数和梯度下降法，对所构建的编码向量转换模型进行训练，得到所述已训练的编码向量转换模型。

13.一种媒体内容的推荐装置，其特征在于，所述装置包括：

评价信息获取模块，用于获取待选媒体内容的观看评价信息；所述观看评价信息根据所述待选媒体内容的第一观看行为数据确定；

第一内容确定模块，用于根据所述观看评价信息，从所述待选媒体内容中确定有效观看媒体内容；

第二内容确定模块，用于从所述有效观看媒体内容中确定目标用户感兴趣的推荐媒体内容；

以及，推荐内容输出模块，用于向所述目标用户输出所述推荐媒体内容。

14.一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如权利要求1至12中任一项所述方法的步骤。

15.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如权利要求1至12中任一项所述方法的步骤。