CN110418171B

CN110418171B - 媒体资源的推送方法和装置、存储介质及电子装置

Info

Publication number: CN110418171B
Application number: CN201910668507.7A
Authority: CN
Inventors: 刘鹏
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Shenzhen Yayue Technology Co ltd
Priority date: 2019-07-23
Filing date: 2019-07-23
Publication date: 2022-07-29
Anticipated expiration: 2039-07-23
Also published as: CN110418171A

Abstract

本发明公开了一种媒体资源的推送方法和装置、存储介质及电子装置。其中，该方法包括：在推送给客户端的第一媒体资源被点击的情况下，获取第一媒体资源在第一类别上的第一embedding向量、第一媒体资源在第二类别上的第二embedding向量、第一媒体资源的标签对应的第三embedding向量，其中，第二类别为第一类别的子类别，确定第一媒体资源在第一类别上的第四兴趣分布向量、第一媒体资源在第二类别上的第五兴趣分布向量、以及第一媒体资源的标签对应的第六兴趣分布向量，确定目标媒体资源，向客户端推送目标媒体资源。本发明解决了相关技术中推送的视频不准确的技术问题。

Description

媒体资源的推送方法和装置、存储介质及电子装置

技术领域

本发明涉及计算机领域，具体而言，涉及一种媒体资源的推送方法和装置、存储介质及电子装置。

背景技术

相关技术中，在确定向客户端推送的视频内容时，通常是获取用户已经点击的视频内容在第一类别上的第一embedding向量、在第二类别上的第二embedding向量、和与标签对应的第三embedding向量，然后将上述三个向量输入到预估模型中，由预估模型输出待推送视频的推送分数，根据待推送视频的推送分数确定向客户端推送的视频。

然而，若是采用上述方法，则由于直接使用视频的第一embedding向量、第二embedding向量与第三embedding向量获取推送分数，造成确定的推送分数不准确，进而确定的推送的视频不准确。

针对上述的问题，目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种媒体资源的推送方法和装置、存储介质及电子装置，以至少解决相关技术中推送的视频不准确的技术问题。

根据本发明实施例的一个方面，提供了一种媒体资源的推送方法，包括：在推送给客户端的第一媒体资源被点击的情况下，获取上述第一媒体资源在第一类别上的第一embedding向量、上述第一媒体资源在第二类别上的第二embedding向量、上述第一媒体资源的标签对应的第三embedding向量，其中，上述第二类别为上述第一类别的子类别；使用上述第一embedding向量、上述第二embedding向量与上述第三embedding向量、以及第二媒体资源在上述第一类别上的第一兴趣分布向量、上述第二媒体资源在上述第二类别上的第二兴趣分布向量与上述第二媒体资源的标签对应的第三兴趣分布向量确定上述第一媒体资源在上述第一类别上的第四兴趣分布向量、上述第一媒体资源在上述第二类别上的第五兴趣分布向量、以及上述第一媒体资源的标签对应的第六兴趣分布向量，其中，上述第二媒体资源是上述客户端上位于上述第一媒体资源前一个被点击的媒体资源；在待推送的媒体资源集合中确定出与上述第四兴趣分布向量、上述第五兴趣分布向量和上述第六兴趣分布向量匹配的目标媒体资源；向上述客户端推送目标媒体资源。

根据本发明实施例的另一方面，还提供了一种媒体资源的推送装置，包括：获取单元，用于在推送给客户端的第一媒体资源被点击的情况下，获取上述第一媒体资源在第一类别上的第一embedding向量、上述第一媒体资源在第二类别上的第二embedding向量、上述第一媒体资源的标签对应的第三embedding向量，其中，上述第二类别为上述第一类别的子类别；第一确定单元，用于使用上述第一embedding向量、上述第二embedding向量与上述第三embedding向量、以及第二媒体资源在上述第一类别上的第一兴趣分布向量、上述第二媒体资源在上述第二类别上的第二兴趣分布向量与上述第二媒体资源的标签对应的第三兴趣分布向量确定上述第一媒体资源在上述第一类别上的第四兴趣分布向量、上述第一媒体资源在上述第二类别上的第五兴趣分布向量、以及上述第一媒体资源的标签对应的第六兴趣分布向量，其中，上述第二媒体资源是上述客户端上位于上述第一媒体资源前一个被点击的媒体资源；第二确定单元，用于在待推送的媒体资源集合中确定出与上述第四兴趣分布向量、上述第五兴趣分布向量和上述第六兴趣分布向量匹配的目标媒体资源；推送单元，用于向上述客户端推送目标媒体资源。

作为一种可选的示例，上述第一确定单元包括：第一确定模块，用于确定上述第一embedding向量与上述第一兴趣分布向量的第一相似度权重，使用上述第一相似度权重、上述第一embedding向量与上述第一兴趣分布向量确定出上述第四兴趣分布向量；第二确定模块，用于确定上述第二embedding向量与上述第二兴趣分布向量的第二相似度权重，使用上述第二相似度权重、上述第二embedding向量与上述第二兴趣分布向量确定出上述第五兴趣分布向量；第三确定模块，用于确定上述第三embedding向量与上述第三兴趣分布向量的第三相似度权重，使用上述第三相似度权重、上述第三embedding向量与上述第三兴趣分布向量确定出上述第六兴趣分布向量。

作为一种可选的示例，上述第一确定模块包括：通过如下公式确定上述第一相似度权重：

其中，上述a_n+1为上述第一相似度权重，上述Vcate1_n为上述客户端播放完上述第二媒体资源后，上述第二媒体资源的第一兴趣分布向量，上述Icate1_n+1为上述第一媒体资源的第一embedding向量，上述|Vcate1_n|为上述第二媒体资源的第一兴趣分布向量的模，上述|Icate1_n+1|为上述第一媒体资源的第一embedding向量的模。

作为一种可选的示例，上述第一确定模块还包括：通过如下公式确定上述第四兴趣分布向量：

Vcate1_n+1＝(1-λ_cate1σ(t_n+1)a_n+1)Vcate1_n+λ_cate1σ(t_n+1)a_n+1Icate1_n+1 (2)

其中，上述σ(t_n+1)通过以下公式获取：

上述Vcate1_n+1为上述第四兴趣分布向量，上述λ_cate1大于0且小于1，上述λ大于0，上述t_n+1为上述第一媒体资源的播放时长。

作为一种可选的示例，上述第二确定模块包括：通过如下公式确定上述第二相似度权重：

其中，上述b_n+1为上述第二相似度权重，上述Vcate2_n为上述客户端播放完上述第二媒体资源后，上述第二媒体资源的第二兴趣分布向量，上述Icate2_n+1为上述第一媒体资源的第二embedding向量，上述|Vcate2_n|为上述第二媒体资源的第二兴趣分布向量的模，上述|Icate2_n+1|为上述第一媒体资源的第二embedding向量的模。

作为一种可选的示例，上述第二确定模块还包括：通过如下公式确定上述第五兴趣分布向量：

Vcate2_n+1＝(1-λ_cate2σ(t_n+1)b_n+1)Vcate2_n+λ_cate2σ(t_n+1)a_n+1Icate2_n+1 (5)

其中，上述σ(t_n+1)通过以下公式获取：

上述Vcate2_n+1为上述第五兴趣分布向量，上述λ_cate2大于0且小于1，上述λ大于0，上述t_n+1为上述第一媒体资源的播放时长。

作为一种可选的示例，上述第三确定模块包括：通过如下公式确定上述第二相似度权重：

其中，上述c_n+1为上述第三相似度权重，上述Vcate3_n为上述客户端播放完上述第二媒体资源后，上述第二媒体资源的第三兴趣分布向量，上述Icate3_n+1为上述第一媒体资源的第三embedding向量，上述|Vcate3_n|为上述第二媒体资源的第三兴趣分布向量的模，上述|Icate3_n+1|为上述第一媒体资源的第三embedding向量的模。

作为一种可选的示例，上述第三确定模块还包括：通过如下公式确定上述第一媒体资源的第六兴趣分布向量：

Vcate3_n+1＝(1-λ_cate3σ(t_n+1)b_n+1)Vcate3_n+λ_cate3σ(t_n+1)a_n+1Icate3_n+1 (8)

其中，上述σ(t_n+1)通过以下公式获取：

上述Vcate3_n+1为上述第六兴趣分布向量，上述λ_cate3大于0且小于1，上述λ大于0，上述t_n+1为上述第一媒体资源的播放时长。

根据本发明实施例的又一方面，还提供了一种存储介质，该存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述媒体资源的推送方法。

根据本发明实施例的又一方面，还提供了一种电子装置，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，上述处理器通过计算机程序执行上述的媒体资源的推送方法。

在本发明实施例中，在获取到第一媒体资源在第一类别上的第一embedding向量、上述第一媒体资源在第二类别上的第二embedding向量、上述第一媒体资源的标签对应的第三embedding向量之后，使用获取到的第二媒体资源在上述第一类别上的第一兴趣分布向量、上述第二媒体资源在上述第二类别上的第二兴趣分布向量与上述第二媒体资源的标签对应的第三兴趣分布向量和上述向量确定出第一媒体资源在上述第一类别上的第四兴趣分布向量、上述第一媒体资源在上述第二类别上的第五兴趣分布向量、以及上述第一媒体资源的标签对应的第六兴趣分布向量，并使用获取到的第四兴趣分布向量、第五兴趣分布向量与第六兴趣分布向量来确定向客户端推送的目标媒体文件，从而使用更精确的向量确定目标媒体资源，提高了获取目标媒体资源的准确度，进而解决了相关技术中推送的视频不准确的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明实施例的一种可选的媒体资源的推送方法的应用环境的示意图；

图2是根据本发明实施例的一种可选的媒体资源的推送方法的流程示意图；

图3是根据本发明实施例的一种可选的媒体资源的推送方法的示意图；

图4是根据本发明实施例的另一种可选的媒体资源的推送方法的示意图；

图5是根据本发明实施例的又一种可选的媒体资源的推送方法的示意图；

图6是根据本发明实施例的又一种可选的媒体资源的推送方法的示意图；

图7是根据本发明实施例的一种可选的媒体资源的推送装置的结构示意图；

图8是根据本发明实施例的一种可选的电子装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本发明实施例的一个方面，提供了一种媒体资源的推送方法，可选地，作为一种可选的实施方式，上述媒体资源的推送方法可以但不限于应用于如图1所示的环境中。

图1中用户102与用户设备104之间可以进行人机交互。用户设备104中包含有存储器106，用于存储交互数据、处理器108，用于处理交互数据。用户设备104可以通过网络110与服务器112之间进行数据交互。服务器112中包含有数据库114，用于存储交互数据、处理引擎116，用于处理交互数据。服务器112可以获取在客户端上被点击的第一媒体资源在第一类别上的第一embedding向量、所述第一媒体资源在第二类别上的第二embedding向量、所述第一媒体资源的标签对应的第三embedding向量，然后获取在第一媒体资源的上一个被点击的第二媒体资源的在所述第一类别上的第一兴趣分布向量、所述第二媒体资源在所述第二类别上的第二兴趣分布向量与所述第二媒体资源的标签对应的第三兴趣分布向量，根据上述向量，确定出第一媒体资源在所述第一类别上的第四兴趣分布向量、所述第一媒体资源在所述第二类别上的第五兴趣分布向量、以及所述第一媒体资源的标签对应的第六兴趣分布向量。根据上述第四分布向量、第五分布向量与第六分布向量确定出向客户端推送的目标媒体资源。

需要说明的是，相关技术中，在确定目标媒体文件时，通常使用第一媒体资源在第一类别上的第一embedding向量、所述第一媒体资源在第二类别上的第二embedding向量、所述第一媒体资源的标签对应的第三embedding向量来确定目标媒体资源，然而，上述确定方法确定出的目标媒体资源的准确度低。而本方案在获取到上述向量之后，使用获取到的第二媒体资源在所述第一类别上的第一兴趣分布向量、所述第二媒体资源在所述第二类别上的第二兴趣分布向量与所述第二媒体资源的标签对应的第三兴趣分布向量和上述向量确定出第一媒体资源在所述第一类别上的第四兴趣分布向量、所述第一媒体资源在所述第二类别上的第五兴趣分布向量、以及所述第一媒体资源的标签对应的第六兴趣分布向量，并使用获取到的第四兴趣分布向量、第五兴趣分布向量与第六兴趣分布向量来确定向客户端推送的目标媒体文件，从而使用更精确的向量确定目标媒体资源，提高了获取目标媒体资源的准确度。

可选地，上述媒体资源的推送方法可以但不限于应用于可以计算数据的终端上，例如手机、平板电脑、笔记本电脑、PC机等终端上，或者应用于可以进行数据计算的服务器中，上述网络可以包括但不限于无线网络或有线网络。其中，该无线网络包括：WIFI及其他实现无线通信的网络。上述有线网络可以包括但不限于：广域网、城域网、局域网。上述服务器可以包括但不限于任何可以进行计算的硬件设备。

可选地，作为一种可选的实施方式，如图2所示，上述媒体资源的推送方法包括：

S202，在推送给客户端的第一媒体资源被点击的情况下，获取所述第一媒体资源在第一类别上的第一embedding向量、所述第一媒体资源在第二类别上的第二embedding向量、所述第一媒体资源的标签对应的第三embedding向量，其中，所述第二类别为所述第一类别的子类别；

S204，使用所述第一embedding向量、所述第二embedding向量与所述第三embedding向量、以及第二媒体资源在所述第一类别上的第一兴趣分布向量、所述第二媒体资源在所述第二类别上的第二兴趣分布向量与所述第二媒体资源的标签对应的第三兴趣分布向量确定所述第一媒体资源在所述第一类别上的第四兴趣分布向量、所述第一媒体资源在所述第二类别上的第五兴趣分布向量、以及所述第一媒体资源的标签对应的第六兴趣分布向量，其中，所述第二媒体资源是所述客户端上位于所述第一媒体资源前一个被点击的媒体资源；

S206，在待推送的媒体资源集合中确定出与所述第四兴趣分布向量、所述第五兴趣分布向量和所述第六兴趣分布向量匹配的目标媒体资源；

S208，向所述客户端推送目标媒体资源。

可选地，上述媒体资源的推送方法可以但不限于应用于推送视频、音频、推送广告等推送各个媒体资源的领域。以推送视频为例，在客户端上显示的第一视频被点击后，获取该第一视频在第一类别上的第一embedding向量、该第一视频在第二类别上的第二embedding向量、该第一视频的标签对应的第三embedding向量，并获取客户端上位于该视频之前的一个被点击的第二视频在所述第一类别上的第一兴趣分布向量、该第二视频在所述第二类别上的第二兴趣分布向量与该第二视频的标签对应的第三兴趣分布向量，通过上述向量确定出第一视频在所述第一类别上的第四兴趣分布向量、第一视频在所述第二类别上的第五兴趣分布向量、以及第一视频的标签对应的第六兴趣分布向量，并根据第一视频在所述第一类别上的第四兴趣分布向量、第一视频在所述第二类别上的第五兴趣分布向量、以及第一视频的标签对应的第六兴趣分布向量确定出目标媒体资源。通过上述方法，提高了确定目标媒体资源的准确度。

可选地，本方案中的上述第一类别可以为给第一媒体资源划分的类别，如第一类别为军事、科技、教育、人文、景观等，第一媒体资源与第二媒体资源可以为上述第一类别中的一个，如第一媒体资源属于科技，第二媒体资源属于军事，第二类别可以为第一类别下的子类别，如军事下的武器、训练、协作等，或者科技下的公式、机器人、高铁、或者教育下的课程、演示等等，第一媒体资源与第二媒体资源可以为上述第二类别中的一个，如第一媒体资源属于公式，第二媒体资源属于训练。上述标签可以标识第一媒体资源或第二媒体资源的对应内容。如第一媒体资源的标签为军人、射击等，第二媒体资源的标签可以为三年级、数学等。标签可以为一个或多个。

可选地，本实施例中，所述确定所述第一媒体资源在所述第一类别上的第四兴趣分布向量、所述第一媒体资源在所述第二类别上的第五兴趣分布向量、以及所述第一媒体资源的标签对应的第六兴趣分布向量包括：确定所述第一embedding向量与所述第一兴趣分布向量的第一相似度权重，使用所述第一相似度权重、所述第一embedding向量与所述第一兴趣分布向量确定出所述第四兴趣分布向量；确定所述第二embedding向量与所述第二兴趣分布向量的第二相似度权重，使用所述第二相似度权重、所述第二embedding向量与所述第二兴趣分布向量确定出所述第五兴趣分布向量；确定所述第三embedding向量与所述第三兴趣分布向量的第三相似度权重，使用所述第三相似度权重、所述第三embedding向量与所述第三兴趣分布向量确定出所述第六兴趣分布向量。

可选地，在获取到上述第四兴趣分布向量、第五兴趣分布向量与第六兴趣分布向量之后，将上述第四兴趣分布向量、第五兴趣分布向量与第六兴趣分布向量输入到预估模型中，由预估模型根据上述第四兴趣分布向量、第五兴趣分布向量与第六兴趣分布向量为媒体资源集合中的待推送媒体资源打分，分数最高的一个或几个待推送媒体资源将被推送。上述预估模型会获取待推送的媒体资源集合，上述待推送的媒体资源集合中包括可以推送给用户的媒体资源。预估模型根据输入的第四兴趣分布向量、第五兴趣分布向量与第六兴趣分布向量为媒体资源集合中的媒体资源进行打分，得到媒体资源的打分结果，然后将分数最高的一个或多个媒体资源推送给客户端。

以下结合图3进行说明。内容数据库302中保存有待推送的媒体资源，根据用户画像与上下文304，从内容数据库302中选择出部分候选内容306，然后由预估模型308冲候选内容306中确定出目标媒体文件，并将目标媒体文件重排打散后，推送给客户端310。根据客户端310的反馈生成训练样本312，根据训练样本310训练模型314，得到成熟的模型316，客户端310还可以提取实时特征318给预估程序308，模型316与预估程序3008实现CTR预估过程。首先使用基于物品的协同过滤(Item-based Collaborative Filtering)，基于用户的协同过滤(User-based Collaborative Filtering)，基于hot的召回等多种策略快速在内容数据库中选出大约2000-3000个与用户相关的内容(item),然后，将这些内容提交给CTR预估模块。CTR预估模块，根据使用的用户和item等特征，对本次排序的每个item进行精细的打分，预估用户点击的CTR。并使用item的预估CTR和打散规则，选出10-20条内容推荐给用户。在客户端，用户的点击等行为日志将实时上报到后台服务器。线上CTR预估和离线模型训练，可以使用这些实时上报的用户日志，生成线上排序所需的实时特征和离线模型训练样本。

上述媒体资源可以为推荐给用户的内容(Item)，包括图文，短视频等，上述第一类别可以为一级兴趣(categoryL1)，即表示一个较大范围的兴趣，比如，“美食”，“经济”，“军事”等。通常在推荐系统中，包括几十个一级兴趣，上述第二类别可以为二级兴趣(categoryL2)，表示在某个一级兴趣下的子兴趣，比如，一级兴趣“体育”包括“篮球”，“足球”等多个二级兴趣。在推荐系统中，一般包括几百个二级兴趣。上述标签(tag)为通过自动提取或人工标注等方法，给item标注的标签。比如，“大学”，“苹果”。一个item可以对应一个或多个标签。在推荐系统中，一般包括几万到几十万个标签。

本方案中的模型结构可以如图4所示。本文的CTR预估模型基于DNN实现，包括输入层，隐藏层和输出层。其中，在输入层，高维稀疏特征将由one-hot编码将采用Embedding的方法，转换为低维稠密向量。比如，一个采用one-hot编码的categoryL1特征，可以使用Embedding的方法转换为一个d维的低维稠密向量。对于连续特征，可以使用原始值，也可以进行数值转换后，作为DNN的输入特征。在一个客户端上，用户的兴趣可能不断变化。因此，本文提出一种使用用户一次连续访问中点击item的categoryL1，categoryL2和Tag的embedding向量以及用户的item消费时长函数，对用户的兴趣分布向量进行加权计算的方法。

其中，Vcate1n+1，表示用户完成第n+1个item消费后，用户的categoryL1实时兴趣分布向量。Vcate2n+1，表示用户完成第n+1个item消费后，用户的categoryL2实时兴趣分布向量。Vtagn+1，表示用户完成第n+1个item消费后，用户的Tag实时兴趣分布向量。Icate1n+1,表示用户消费的第n+1个item的categoryL1的embedding向量。Icate2n+1，表示用户消费的第n+1个item的categoryL2的embedding向量。Itagn+1，表示用户消费的第n+1个item的一个或多个Tag embedding向量的均值。tn+1，表示用户的第n+1个item的消费时长，使用用户消费的秒数计算。Vcate1nIcate1n+1，表示向量Vcate1n与Icate1n+1的内积。|Vcate1n|，表示用户categoryL1兴趣分布向量的模。|Icate1n+1|，表示向量Icate1n+1的模。Vcate2nIcate2n+1，表示向量Vcate2n与Icate2n+1的内积。|Vcate2n|，表示用户categoryL2兴趣分布向量的模。|Icate2n+1|，表示向量Icate2n+1的模。VtagnItagn+1，表示向量Vtagn与Itagn+1的内积。|Vtagn|，表示用户Tag兴趣分布向量的模。|Itagn+1|，表示向量Itagn+1的模。

用户对不同item的消费时长，可以用于表示用户对不同item的喜好程度。假设用户对于第n+1个item消费时长是tn+1，那么用户对item喜好权重的计算，如下公式所示。其中，λ表示一个超参，取值大于0。

用户的Vcate1n与Icate1n+1的相似度权重计算，如下公式所示。

用户的Vcate2n与Icate2n+1的相似度权重计算，如下公式所示。

用户的Vtagn与Itagn+1的相似度权重计算，如下公式所示。

用户在完成第n+1个item消费后，用户的categoryL1兴趣分布向量的计算，如下公式所示。其中，λ_cate1是一个超参数，在0-1取值。

Vcate1_n+1＝(1-λ_cate1σ(t_n+1)a_n+1)Vcate1_n+λ_cate1σ(t_n+1)a_n+1Icate1_n+1 (14)

用户在完成第n+1个item消费后，用户的categoryL2兴趣分布向量的计算，如下公式所示。其中，λ_cate2是一个超参数，在0-1取值。

Vcate2_n+1＝(1-λ_cate2σ(t_n+1)b_n+1)Vcate2_n+λ_cate2σ(t_n+1)a_n+1Icate2_n+1 (15)

用户在完成第n+1个item消费后，用户的tag兴趣分布向量的计算，如下公式所示。其中，λ_tag是一个超参数，在0-1取值。

Vcate3_n+1＝(1-λ_cate3σ(t_n+1)b_n+1)Vcate3_n+λ_cate3σ(t_n+1)a_n+1Icate3_n+1 (16)

通过采用上述公式的用户categoryL1，categoryL2和Tag兴趣分布向量计算方法，可以分别根据相似度和用户消费时长函数，快速调整用户的兴趣分布向量。比如，在Vcate1n与Icate1n+1相似时，Icate1n+1使用较小的权重。如果Icate1n+1与Vcate1n不相似，用户的Itemn+1消费时长较长，在计算Vcate1n+1时，Icate1n+1将使用较大的权重。通过这种方法，在用户兴趣发生变化时，可以快速调整用户的兴趣分布向量，更好的表示用户当前的真实兴趣分布。在本文提出的方法中，计算用户新的兴趣分布时，也需要考虑用户的item消费时长，作为权重系数的一部分。通过这种方法，可以很好的描述用户对item的喜好程度，避免在训练和预测时引入噪声，提高线上推荐效果。

对DNN模型稀疏特征的embedding向量，连续特征转换值和用户的categoryL1，categoryL2和tag兴趣分布向量进行拼接，作为DNN隐藏层的输入数据。DNN的隐藏层包括3层的全连接网络，分别包含1024，512，256个使用ReLU激活函数的神经元，对输入的数据进行交叉计算。DNN的输出层使用sigmoid函数对隐藏层的输出向量进行计算，给出用户对item的预估CTR。

本方案中的模型训练时，基于用户实时兴趣的DNN预估模型，离线训练样本使用客户端上报的用户曝光和点击等日志生成。训练样本的格式：Label:feature1，feature2,…feature N。Label，表示用户是否点击item。使用“1”表示用户点击了item。否则，使用“0”表示。在实践中，可以使用用户的item消费时长的转换值，比如，可以计算消费时长的对数值或分数次方，作为Label的权重。在实践中，这种方法具有很好的线上效果。Feature1,feaute2，…feature N，分别表示用户，item等相关的特征。

模型训练包括离线模型训练和小时级模型训练两部分。其中，离线模型训练，需要收集一段时间的训练样本，比如，3-4个周，进行模型训练。本方案提出的DNN预估模型，使用交叉熵作为损失函数，采用小批量梯度下降法(Mini-batch Gradient Descent,)进行优化。对于DNN模型的正则化项，Dropout和公式的超参数，需要采用搜索的方法，选取合适的值。在完成DNN预估模型的离线训练后，将模型发布到线上服务器，然后采用小时级增量模型训练的方法，对DNN模型进行训练，以更新特征的权重，保证线上排序效果。

CTR预估模型在完成训练后，将同步到线上服务器，并且加载到服务器的内存。CTR预估服务，在接收到排序请求后，将读取内存中的DNN权重，使用用户和item的相关特征，对用户点击item的CTR进行预估计算。在完成请求中的所有item的CTR预估后，将其发送给重排模块。

如图5所示，图5为一种可选的客户端的显示界面。图5中包括媒体资源502，用户点击了其中的媒体资源504，则将媒体资源504作为第一媒体资源。如图6所示，在服务器确定出目标媒体资源之后，将目标媒体资源602显示在客户端上，以供客户端观看。

通过本实施例，通过上述方法确定向客户端推送的目标媒体文件，从而使用更精确的向量确定目标媒体资源，提高了获取目标媒体资源的准确度。

作为一种可选的实施方案，所述确定所述第一媒体资源在所述第一类别上的第四兴趣分布向量、所述第一媒体资源在所述第二类别上的第五兴趣分布向量、以及所述第一媒体资源的标签对应的第六兴趣分布向量包括：

S1，确定所述第一embedding向量与所述第一兴趣分布向量的第一相似度权重，使用所述第一相似度权重、所述第一embedding向量与所述第一兴趣分布向量确定出所述第四兴趣分布向量；

S2，确定所述第二embedding向量与所述第二兴趣分布向量的第二相似度权重，使用所述第二相似度权重、所述第二embedding向量与所述第二兴趣分布向量确定出所述第五兴趣分布向量；

S3，确定所述第三embedding向量与所述第三兴趣分布向量的第三相似度权重，使用所述第三相似度权重、所述第三embedding向量与所述第三兴趣分布向量确定出所述第六兴趣分布向量。

通过本实施例，通过上述方法分别确定出第一相似度权重、第二相似度权重与第三相似度权重，进一步根据第一相似度权重确定出第四兴趣分布向量，根据第二相似度权重确定出第五兴趣分布向量，根据第三相似度权重确定出第六兴趣分布向量，提高了确定第一媒体资源的兴趣分布向量的准确性。

作为一种可选的实施方案，所述确定所述第一embedding向量与所述第一兴趣分布向量的第一相似度权重包括：

S1，通过如下公式确定所述第一相似度权重：

其中，所述a_n+1为所述第一相似度权重，所述Vcate1_n为所述客户端播放完所述第二媒体资源后，所述第二媒体资源的第一兴趣分布向量，所述Icate1_n+1为所述第一媒体资源的第一embedding向量，所述|Vcate1_n|为所述第二媒体资源的第一兴趣分布向量的模，所述|Icate1_n+1|为所述第一媒体资源的第一embedding向量的模。

通过本实施例，通过上述公式来计算第一相似度权重，从而计算得到的第一相似度权重是与第一媒体资源与第二媒体资源相关的第一相似度权重，进而根据上述第一相似度权重确定出的第四兴趣分布向量是与第一媒体资源与第二媒体资源相关的兴趣分布向量，提高了确定目标媒体资源的准确度。

作为一种可选的实施方案，所述使用所述第一相似度权重、所述第一embedding向量与所述第一兴趣分布向量确定出所述第四兴趣分布向量包括：

S1，通过如下公式确定所述第四兴趣分布向量：

Vcate1_n+1＝(1-λ_cate1σ(t_n+1)a_n+1)Vcate1_n+λ_cate1σ(t_n+1)a_n+1Icate1_n+1 (18)

其中，所述σ(t_n+1)通过以下公式获取：

所述Vcate1_n+1为所述第四兴趣分布向量，所述λ_cate1大于0且小于1，所述λ大于0，所述t_n+1为所述第一媒体资源的播放时长。

通过本实施例，通过上述公式确定第四兴趣分布向量，从而使确定出的第四兴趣分布向量是与第一媒体资源与第二媒体资源相关的兴趣分布向量，进而提高了确定的目标媒体资源的准确度。

作为一种可选的实施方案，所述确定所述第二embedding向量与所述第二兴趣分布向量的第二相似度权重包括：

S1，通过如下公式确定所述第二相似度权重：

其中，所述b_n+1为所述第二相似度权重，所述Vcate2_n为所述客户端播放完所述第二媒体资源后，所述第二媒体资源的第二兴趣分布向量，所述Icate2_n+1为所述第一媒体资源的第二embedding向量，所述|Vcate2_n|为所述第二媒体资源的第二兴趣分布向量的模，所述|Icate2_n+1|为所述第一媒体资源的第二embedding向量的模。

通过本实施例，通过上述公式来计算第二相似度权重，从而计算得到的第二相似度权重是与第一媒体资源与第二媒体资源相关的第二相似度权重，进而根据上述第二相似度权重确定出的第五兴趣分布向量是与第一媒体资源与第二媒体资源相关的兴趣分布向量，提高了确定目标媒体资源的准确度。

作为一种可选的实施方案，所述使用所述第二相似度权重、所述第二embedding向量与所述第二兴趣分布向量确定出所述第五兴趣分布向量包括：

S1，通过如下公式确定所述第五兴趣分布向量：

Vcate2_n+1＝(1-λ_cate2σ(t_n+1)b_n+1)Vcate2_n+λ_cate2σ(t_n+1)a_n+1Icate2_n+1 (21)

其中，所述σ(t_n+1)通过以下公式获取：

所述Vcate2_n+1为所述第五兴趣分布向量，所述λ_cate2大于0且小于1，所述λ大于0，所述t_n+1为所述第一媒体资源的播放时长。

通过本实施例，通过上述公式确定第五兴趣分布向量，从而使确定出的第五兴趣分布向量是与第一媒体资源与第二媒体资源相关的兴趣分布向量，进而提高了确定的目标媒体资源的准确度。

作为一种可选的实施方案，所述确定所述第三embedding向量与所述第三兴趣分布向量的第三相似度权重包括：

S1，通过如下公式确定所述第二相似度权重：

其中，所述c_n+1为所述第三相似度权重，所述Vcate3_n为所述客户端播放完所述第二媒体资源后，所述第二媒体资源的第三兴趣分布向量，所述Icate3_n+1为所述第一媒体资源的第三embedding向量，所述|Vcate3_n|为所述第二媒体资源的第三兴趣分布向量的模，所述|Icate3_n+1|为所述第一媒体资源的第三embedding向量的模。

通过本实施例，通过上述公式来计算第三相似度权重，从而计算得到的第三相似度权重是与第一媒体资源与第二媒体资源相关的第三相似度权重，进而根据上述第三相似度权重确定出的第六兴趣分布向量是与第一媒体资源与第二媒体资源相关的兴趣分布向量，提高了确定目标媒体资源的准确度。

作为一种可选的实施方案，所述使用所述第三相似度权重、所述第三embedding向量与所述第三兴趣分布向量确定出所述第六兴趣分布向量包括：

S1，通过如下公式确定所述第一媒体资源的第六兴趣分布向量：

Vcate3_n+1＝(1-λ_cate3σ(t_n+1)b_n+1)Vcate3_n+λ_cate3σ(t_n+1)a_n+1Icate3_n+1 (24)

其中，所述σ(t_n+1)通过以下公式获取：

所述Vcate3_n+1为所述第六兴趣分布向量，所述λ_cate3大于0且小于1，所述λ大于0，所述t_n+1为所述第一媒体资源的播放时长。

通过本实施例，通过上述公式确定第六兴趣分布向量，从而使确定出的第六兴趣分布向量是与第一媒体资源与第二媒体资源相关的兴趣分布向量，进而提高了确定的目标媒体资源的准确度。

作为一种可选的实施方案，所述在待推送的媒体资源集合中确定出与所述第四兴趣分布向量、所述第五兴趣分布向量和所述第六兴趣分布向量匹配的目标媒体资源包括：

获取所述待推送的媒体资源集合，其中，所述待推送的媒体资源集合中包括所述目标媒体资源；

获取预估模型输出的所述待推送的媒体资源集合中每一个待推送媒体资源的分值；

将所述分值最高的待推送媒体资源作为所述目标媒体资源。

可选地，上述待推荐的媒体资源集合中的待推送媒体资源可以为所有媒体资源的部分内容，具体可以根据多种方法确认得到。如根据用户的观看习惯，历史记录，或者根据用户的标签与视频的标签之间的关联度等。

通过本实施例，通过上述方法确定目标媒体资源，从而提高了确定的目标媒体资源的准确度。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

根据本发明实施例的另一个方面，还提供了一种用于实施上述媒体资源的推送方法的媒体资源的推送装置。如图7所示，该装置包括：

(1)获取单元702，用于在推送给客户端的第一媒体资源被点击的情况下，获取所述第一媒体资源在第一类别上的第一embedding向量、所述第一媒体资源在第二类别上的第二embedding向量、所述第一媒体资源的标签对应的第三embedding向量，其中，所述第二类别为所述第一类别的子类别；

(2)第一确定单元704，用于使用所述第一embedding向量、所述第二embedding向量与所述第三embedding向量、以及第二媒体资源在所述第一类别上的第一兴趣分布向量、所述第二媒体资源在所述第二类别上的第二兴趣分布向量与所述第二媒体资源的标签对应的第三兴趣分布向量确定所述第一媒体资源在所述第一类别上的第四兴趣分布向量、所述第一媒体资源在所述第二类别上的第五兴趣分布向量、以及所述第一媒体资源的标签对应的第六兴趣分布向量，其中，所述第二媒体资源是所述客户端上位于所述第一媒体资源前一个被点击的媒体资源；

(3)第二确定单元706，用于在待推送的媒体资源集合中确定出与所述第四兴趣分布向量、所述第五兴趣分布向量和所述第六兴趣分布向量匹配的目标媒体资源；

(4)推送单元708，用于向所述客户端推送目标媒体资源。

可选地，上述媒体资源的推送装置可以但不限于应用于推送视频、音频、推送广告等推送各个媒体资源的领域。以推送视频为例，在客户端上显示的第一视频被点击后，获取该第一视频在第一类别上的第一embedding向量、所述第一媒体资源在第二类别上的第二embedding向量、所述第一媒体资源的标签对应的第三embedding向量，并获取客户端上位于该视频之前的一个被点击的第二视频在所述第一类别上的第一兴趣分布向量、所述第二媒体资源在所述第二类别上的第二兴趣分布向量与所述第二媒体资源的标签对应的第三兴趣分布向量，通过上述向量确定出第二视频在所述第一类别上的第四兴趣分布向量、所述第一媒体资源在所述第二类别上的第五兴趣分布向量、以及所述第一媒体资源的标签对应的第六兴趣分布向量，并根据第二视频的上述在所述第一类别上的第四兴趣分布向量、所述第一媒体资源在所述第二类别上的第五兴趣分布向量、以及所述第一媒体资源的标签对应的第六兴趣分布向量确定出目标媒体资源。通过上述方法，提高了确定目标媒体资源的准确度。

作为一种可选的实施方案，上述第一确定单元包括：

(1)第一确定模块，用于确定所述第一embedding向量与所述第一兴趣分布向量的第一相似度权重，使用所述第一相似度权重、所述第一embedding向量与所述第一兴趣分布向量确定出所述第四兴趣分布向量；

(2)第二确定模块，用于确定所述第二embedding向量与所述第二兴趣分布向量的第二相似度权重，使用所述第二相似度权重、所述第二embedding向量与所述第二兴趣分布向量确定出所述第五兴趣分布向量；

(3)第三确定模块，用于确定所述第三embedding向量与所述第三兴趣分布向量的第三相似度权重，使用所述第三相似度权重、所述第三embedding向量与所述第三兴趣分布向量确定出所述第六兴趣分布向量。

作为一种可选的实施方案，上述第一确定模块包括：

S1，通过如下公式确定所述第一相似度权重：

作为一种可选的实施方案，上述第一确定模块还包括：

S1，通过如下公式确定所述第四兴趣分布向量：

Vcate1_n+1＝(1-λ_cate1σ(t_n+1)a_n+1)Vcate1_n+λ_cate1σ(t_n+1)a_n+1Icate1_n+1 (27)

其中，所述σ(t_n+1)通过以下公式获取：

作为一种可选的实施方案，上述第二确定模块包括：

S1，通过如下公式确定所述第二相似度权重：

作为一种可选的实施方案，上述第二确定模块还包括：

S1，通过如下公式确定所述第五兴趣分布向量：

Vcate2_n+1＝(1-λ_cate2σ(t_n+1)b_n+1)Vcate2_n+λ_cate2σ(t_n+1)a_n+1Icate2_n+1 (30)

其中，所述σ(t_n+1)通过以下公式获取：

作为一种可选的实施方案，上述第三确定模块包括：

S1，通过如下公式确定所述第二相似度权重：

作为一种可选的实施方案，上述第三确定模块还包括：

Vcate3_n+1＝(1-λ_cate3σ(t_n+1)b_n+1)Vcate3_n+λ_cate3σ(t_n+1)a_n+1Icate3_n+1 (33)

其中，所述σ(t_n+1)通过以下公式获取：

作为一种可选的实施方案，上述第二确定单元包括：

(1)第一获取模块，用于获取所述待推送的媒体资源集合，其中，所述待推送的媒体资源集合中包括所述目标媒体资源；

(2)第二获取模块，用于获取预估模型输出的所述待推送的媒体资源集合中每一个待推送媒体资源的分值；

(3)第四确定模块，用于将所述分值最高的待推送媒体资源作为所述目标媒体资源。

根据本发明实施例的又一个方面，还提供了一种用于实施上述媒体资源的推送方法的电子装置，如图8所示，该电子装置包括存储器802和处理器804，该存储器802中存储有计算机程序，该处理器804被设置为通过计算机程序执行上述任一项方法实施例中的步骤。

可选地，在本实施例中，上述电子装置可以位于计算机网络的多个网络设备中的至少一个网络设备。

可选地，在本实施例中，上述处理器可以被设置为通过计算机程序执行以下步骤：

S1，在推送给客户端的第一媒体资源被点击的情况下，获取第一媒体资源在第一类别上的第一embedding向量、第一媒体资源在第二类别上的第二embedding向量、第一媒体资源的标签对应的第三embedding向量，其中，第二类别为第一类别的子类别；

S2，使用第一embedding向量、第二embedding向量与第三embedding向量、以及第二媒体资源在第一类别上的第一兴趣分布向量、第二媒体资源在第二类别上的第二兴趣分布向量与第二媒体资源的标签对应的第三兴趣分布向量确定第一媒体资源在第一类别上的第四兴趣分布向量、第一媒体资源在第二类别上的第五兴趣分布向量、以及第一媒体资源的标签对应的第六兴趣分布向量，其中，第二媒体资源是客户端上位于第一媒体资源前一个被点击的媒体资源；

S3，在待推送的媒体资源集合中确定出与第四兴趣分布向量、第五兴趣分布向量和第六兴趣分布向量匹配的目标媒体资源；

S4，向客户端推送目标媒体资源。

可选地，本领域普通技术人员可以理解，图8所示的结构仅为示意，电子装置也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices，MID)、PAD等终端设备。图8其并不对上述电子装置的结构造成限定。例如，电子装置还可包括比图8中所示更多或者更少的组件(如网络接口等)，或者具有与图8所示不同的配置。

其中，存储器802可用于存储软件程序以及模块，如本发明实施例中的媒体资源的推送方法和装置对应的程序指令/模块，处理器804通过运行存储在存储器802内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的媒体资源的推送方法。存储器802可包括高速随机存储器，还可以包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器802可进一步包括相对于处理器804远程设置的存储器，这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中，存储器802具体可以但不限于用于存储目标媒体资源等信息。作为一种示例，如图8所示，上述存储器802中可以但不限于包括上述媒体资源的推送装置中的获取单元702、第一确定单元704、第二确定单元706与推送单元708。此外，还可以包括但不限于上述媒体资源的推送装置中的其他模块单元，本示例中不再赘述。

可选地，上述的传输装置806用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中，传输装置806包括一个网络适配器(Network Interface Controller，NIC)，其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中，传输装置806为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

此外，上述电子装置还包括：显示器808，用于显示目标媒体资源；和连接总线810，用于连接上述电子装置中的各个模块部件。

根据本发明的实施例的又一方面，还提供了一种存储介质，该存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

可选地，在本实施例中，上述存储介质可以被设置为存储用于执行以下步骤的计算机程序：

S4，向客户端推送目标媒体资源。

可选地，在本实施例中，本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器(Read-Only Memory，ROM)、随机存取器(Random Access Memory，RAM)、磁盘或光盘等。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在上述计算机可读取的存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在存储介质中，包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的客户端，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种媒体资源的推送方法，其特征在于，包括：

在推送给客户端的第一媒体资源被点击的情况下，获取所述第一媒体资源在第一类别上的第一embedding向量、所述第一媒体资源在第二类别上的第二embedding向量、所述第一媒体资源的标签对应的第三embedding向量，其中，所述第二类别为所述第一类别的子类别；

使用所述第一embedding向量和第二媒体资源在所述第一类别上的第一兴趣分布向量，确定所述第一媒体资源在所述第一类别上的第四兴趣分布向量，其中，所述第二媒体资源是所述客户端上位于所述第一媒体资源前一个被点击的媒体资源；

使用所述第二embedding向量和所述第二媒体资源在所述第二类别上的第二兴趣分布向量，确定所述第一媒体资源在所述第二类别上的第五兴趣分布向量；

使用所述第三embedding向量和所述第二媒体资源的标签对应的第三兴趣分布向量，确定所述第一媒体资源的标签对应的第六兴趣分布向量；

在待推送的媒体资源集合中确定出与所述第四兴趣分布向量、所述第五兴趣分布向量和所述第六兴趣分布向量匹配的目标媒体资源；

向所述客户端推送目标媒体资源。

2.根据权利要求1所述的方法，其特征在于，所述确定所述第一媒体资源在所述第一类别上的第四兴趣分布向量、所述第一媒体资源在所述第二类别上的第五兴趣分布向量、以及所述第一媒体资源的标签对应的第六兴趣分布向量包括：

确定所述第一embedding向量与所述第一兴趣分布向量的第一相似度权重，使用所述第一相似度权重、所述第一embedding向量与所述第一兴趣分布向量确定出所述第四兴趣分布向量；

确定所述第二embedding向量与所述第二兴趣分布向量的第二相似度权重，使用所述第二相似度权重、所述第二embedding向量与所述第二兴趣分布向量确定出所述第五兴趣分布向量；

确定所述第三embedding向量与所述第三兴趣分布向量的第三相似度权重，使用所述第三相似度权重、所述第三embedding向量与所述第三兴趣分布向量确定出所述第六兴趣分布向量。

3.根据权利要求2所述的方法，其特征在于，所述确定所述第一embedding向量与所述第一兴趣分布向量的第一相似度权重包括：

通过如下公式确定所述第一相似度权重：

4.根据权利要求3所述的方法，其特征在于，所述使用所述第一相似度权重、所述第一embedding向量与所述第一兴趣分布向量确定出所述第四兴趣分布向量包括：

通过如下公式确定所述第四兴趣分布向量：

Vcate1_n+1＝(1-λ_cate1σ(t_n+1)a_n+1)Vcate1_n+λ_cate1σ(t_n+1)a_n+1Icate1_n+1

其中，所述σ(t_n+1)通过以下公式获取：

5.根据权利要求2所述的方法，其特征在于，所述确定所述第二embedding向量与所述第二兴趣分布向量的第二相似度权重包括：

通过如下公式确定所述第二相似度权重：

6.根据权利要求5所述的方法，其特征在于，所述使用所述第二相似度权重、所述第二embedding向量与所述第二兴趣分布向量确定出所述第五兴趣分布向量包括：

通过如下公式确定所述第五兴趣分布向量：

Vcate2_n+1＝(1-λ_cate2σ(t_n+1)b_n+1)Vcate2_n+λ_cate2σ(t_n+1)a_n+1Icate2_n+1

其中，所述σ(t_n+1)通过以下公式获取：

7.根据权利要求2所述的方法，其特征在于，所述确定所述第三embedding向量与所述第三兴趣分布向量的第三相似度权重包括：

通过如下公式确定所述第二相似度权重：

8.根据权利要求7所述的方法，其特征在于，所述使用所述第三相似度权重、所述第三embedding向量与所述第三兴趣分布向量确定出所述第六兴趣分布向量包括：

通过如下公式确定所述第一媒体资源的第六兴趣分布向量：

Vcate3_n+1＝(1-λ_cate3σ(t_n+1)b_n+1)Vcate3_n+λ_cate3σ(t_n+1)a_n+1Icate3_n+1

其中，所述σ(t_n+1)通过以下公式获取：

9.根据权利要求1至8任意一项所述的方法，其特征在于，所述在待推送的媒体资源集合中确定出与所述第四兴趣分布向量、所述第五兴趣分布向量和所述第六兴趣分布向量匹配的目标媒体资源包括：

将所述分值最高的待推送媒体资源作为所述目标媒体资源。

10.一种媒体资源的推送装置，其特征在于，包括：

获取单元，用于在推送给客户端的第一媒体资源被点击的情况下，获取所述第一媒体资源在第一类别上的第一embedding向量、所述第一媒体资源在第二类别上的第二embedding向量、所述第一媒体资源的标签对应的第三embedding向量，其中，所述第二类别为所述第一类别的子类别；

第一确定单元，用于使用所述第一embedding向量和第二媒体资源在所述第一类别上的第一兴趣分布向量，确定所述第一媒体资源在所述第一类别上的第四兴趣分布向量，其中，所述第二媒体资源是所述客户端上位于所述第一媒体资源前一个被点击的媒体资源；使用所述第二embedding向量和所述第二媒体资源在所述第二类别上的第二兴趣分布向量，确定所述第一媒体资源在所述第二类别上的第五兴趣分布向量；使用所述第三embedding向量和所述第二媒体资源的标签对应的第三兴趣分布向量，确定所述第一媒体资源的标签对应的第六兴趣分布向量；

第二确定单元，用于在待推送的媒体资源集合中确定出与所述第四兴趣分布向量、所述第五兴趣分布向量和所述第六兴趣分布向量匹配的目标媒体资源；

推送单元，用于向所述客户端推送目标媒体资源。

11.根据权利要求10所述的装置，其特征在于，所述第一确定单元包括：

第一确定模块，用于确定所述第一embedding向量与所述第一兴趣分布向量的第一相似度权重，使用所述第一相似度权重、所述第一embedding向量与所述第一兴趣分布向量确定出所述第四兴趣分布向量；

第二确定模块，用于确定所述第二embedding向量与所述第二兴趣分布向量的第二相似度权重，使用所述第二相似度权重、所述第二embedding向量与所述第二兴趣分布向量确定出所述第五兴趣分布向量；

第三确定模块，用于确定所述第三embedding向量与所述第三兴趣分布向量的第三相似度权重，使用所述第三相似度权重、所述第三embedding向量与所述第三兴趣分布向量确定出所述第六兴趣分布向量。

12.根据权利要求11所述的装置，其特征在于，所述第一确定模块包括：

通过如下公式确定所述第一相似度权重：

13.根据权利要求10至12任意一项所述的装置，其特征在于，所述第二确定单元包括：

第一获取模块，用于获取所述待推送的媒体资源集合，其中，所述待推送的媒体资源集合中包括所述目标媒体资源；

第二获取模块，用于获取预估模型输出的所述待推送的媒体资源集合中每一个待推送媒体资源的分值；

第四确定模块，用于将所述分值最高的待推送媒体资源作为所述目标媒体资源。

14.一种存储介质，所述存储介质存储有计算机程序，其特征在于，所述计算机程序运行时执行所述权利要求1至9任一项中所述的方法。

15.一种电子装置，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为通过所述计算机程序执行所述权利要求1至9任一项中所述的方法。