CN114996486A

CN114996486A - 一种数据推荐方法、装置、服务器以及存储介质

Info

Publication number: CN114996486A
Application number: CN202110232245.7A
Authority: CN
Inventors: 刘刚
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2021-03-02
Filing date: 2021-03-02
Publication date: 2022-09-02

Abstract

本申请实施例公开了一种数据推荐方法、装置、服务器以及存储介质，其中方法包括：响应于目标账户发送的数据获取请求，获取与目标账户具有关联关系的关联账户对应的关联账户信息，关联账户信息包括目标关联关系和目标画像数据；基于目标关联关系确定关联账户对应的关联嵌入式向量，并基于目标画像数据确定关联账户对应的画像嵌入式向量；对关联嵌入式向量和画像嵌入式向量进行融合，得到目标嵌入式向量，并基于目标嵌入式向量从账户集合中筛选得到相似账户集合；获取相似账户集合中各个相似账户下的多媒体数据，并基于多媒体数据对目标账户进行数据推荐，可以充分利用针对账户的行为数据以及账户的画像数据，从而有助于提升数据推荐的效率。

Description

一种数据推荐方法、装置、服务器以及存储介质

技术领域

本申请涉及计算机技术领域，尤其涉及一种数据推荐方法、装置、服务器以及存储介质。

背景技术

随着电子技术和互联网技术的快速发展，多媒体数据越来越多，推荐系统也得到了很快的发展，推荐系统可以从海量的多媒体数据中提取出用户需要的数据或当前社会热点数据。其中，多媒体数据的内容生产者可以包括原创账户。随着用户需求和要求越来越高，多媒体平台越来越期望优质且具有潜力的原创账户的出现，但是对于原创账户而言，都需要有一个冷启动的过程，也就是说对于原创账户所拥有的被关注量，或者原创账户所发布的多媒体数据的阅读量、播放量，转发量等均需要一段时间的积累才能达到一定数量。目前，推荐系统通常是根据账户的热度进行推荐，即推荐系统会优先推荐高热度的账户，而对于低热度的账户或者新账户，推荐系统往往会忽略。因此，对于自媒体平台，如何加速账户的冷启动并与推荐系统有效的结合，以提高数据推荐效率成为了当前数据推荐的研究热点。

发明内容

本申请实施例提供了一种数据推荐方法、装置、服务器以及存储介质，通过实施上述方法，可以充分利用针对账户的行为数据以及账户的画像数据，从而可以提升账户对应的多媒体数据分发冷启动的速度，提高数据推荐效率，提升用户体验。

本申请实施例第一方面公开了一种数据推荐方法，所述方法包括：

响应于目标账户发送的数据获取请求，获取与所述目标账户具有关联关系的关联账户对应的关联账户信息，所述关联账户信息包括目标关联关系和目标画像数据，所述目标关联关系包括所述关联账户与账户集合中各个账户之间的关联关系，所述目标画像数据用于指示所述关联账户的类别特征；

基于所述目标关联关系确定所述关联账户对应的关联嵌入式向量，并基于所述目标画像数据确定所述关联账户对应的画像嵌入式向量；

对所述关联嵌入式向量和所述画像嵌入式向量进行融合，得到目标嵌入式向量，并基于所述目标嵌入式向量从所述账户集合中筛选得到相似账户集合；

获取所述相似账户集合中各个相似账户下的多媒体数据，并基于所述多媒体数据对所述目标账户进行数据推荐。

本申请实施例第二方面公开了一种数据推荐装置，所述装置包括：

获取单元，用于响应于目标账户发送的数据获取请求，获取与所述目标账户具有关联关系的关联账户对应的关联账户信息，所述关联账户信息包括目标关联关系和目标画像数据，所述目标关联关系包括所述关联账户与账户集合中各个账户之间的关联关系，所述目标画像数据用于指示所述关联账户的类别特征；

第一确定单元，用于基于所述目标关联关系确定所述关联账户对应的关联嵌入式向量，并基于所述目标画像数据确定所述关联账户对应的画像嵌入式向量；

第二确定单元，用于对所述关联嵌入式向量和所述画像嵌入式向量进行融合，得到目标嵌入式向量，并基于所述目标嵌入式向量从所述账户集合中筛选得到相似账户集合；

推荐单元，用于获取所述相似账户集合中各个相似账户下的多媒体数据，并基于所述多媒体数据对所述目标账户进行数据推荐。

本申请实施例第三方面公开了一种服务器，包括处理器、存储器和网络接口，所述处理器、存储器和网络接口相互连接，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行上述第一方面的方法。

本申请实施例第四方面公开了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行上述第一方面的方法。

本申请实施例第五方面公开了一种计算机程序产品或计算机程序，所述计算机程序产品或计算机程序包括计算机指令，所述计算机指令存储在计算机可读存储介质中。服务器的处理器从计算机可读存储介质读取所述计算机指令，处理器执行所述计算机指令，使得所述服务器执行上述第一方面的方法。

本申请实施例中，服务器可以响应于目标账户发送的数据获取请求，获取与目标账户具有关联关系的关联账户对应的关联账户信息，关联账户信息包括目标关联关系和目标画像数据，目标关联关系包括关联账户与账户集合中各个账户之间的关联关系，目标画像数据用于指示关联账户的类别特征，接着，基于目标关联关系确定关联账户对应的关联嵌入式向量，并基于目标画像数据确定关联账户对应的画像嵌入式向量，然后，对关联嵌入式向量和画像嵌入式向量进行融合，得到目标嵌入式向量，并基于目标嵌入式向量从账户集合中筛选得到相似账户集合，进一步的，获取相似账户集合中各个相似账户下的多媒体数据，并基于多媒体数据对目标账户进行数据推荐。通过实施上述方法，可以充分利用用户与账户之间的行为数据以及账户的画像数据，并根据行为数据和画像数据共同确定账户的嵌入式向量，以基于该嵌入式向量召回账户的相似账户，从而可以提升账户对应的多媒体数据分发冷启动的速度，提高数据推荐效率，提升用户体验。

附图说明

为了更清楚地说明本申请实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1a是本申请实施例提供的一种数据推荐系统的架构示意图；

图1b是本申请实施例提供的一种数据推荐系统的架构示意图；

图2是本申请实施例提供的一种数据推荐方法的流程示意图；

图3a是本申请实施例提供的一种确定关联嵌入式向量的流程示意图；

图3b是本申请实施例提供的一种相似账户集合的结构示意图；

图3c是本申请实施例提供的一种相似账户集合的结构示意图；

图3d是本申请实施例提供的一种确定目标嵌入式向量的流程示意图；

图4是本申请实施例提供的一种数据推荐方法的流程示意图；

图5a是本申请实施例提供的一种确定第一向量化模型的流程示意图；

图5b是本申请实施例提供的一种带有权重的参考账户关系图的结构示意图；

图5c是本申请实施例提供的一种确定关联嵌入式向量的流程示意图；

图6是本申请实施例提供的一种数据推荐装置的结构示意图；

图7是本申请实施例提供的一种服务器的结构示意图。

具体实施方式

人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

机器学习(Machine Learning，ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

本申请实施例提供的方案涉及人工智能的机器学习等技术，具体通过如下实施例进行说明：

目前，对于多媒体平台，加速潜力账户的冷启动，并将潜力账户与推荐系统进行结合的方案通常是由多媒体平台的相关工作人员预先配置白名单，以给白名单中的潜力账户定额的流量来尝试冷启动，或者是通过的画像数据来召回潜力账户。但是对于潜力账户而言，潜力账户所发布的多媒体数据并不是很多，那么潜力账户对应的画像数据也就较少，并且在多媒体平台中，由于无法快速找到精准的潜力账户，流量的使用效率很低，而头部效应的原因，大量的流量会被高热度的账户分流，也会降低优质的潜力账户内容分发和用户感知，上述可知，用户与账户之间的消费行为数据及账户的画像数据没有被充分利用。并且，潜力账户冷启动度收敛速度较慢，如果通过内容试探不断的收集账户画像数据，再通过账户画像数据召回相似账户的方法，可能会导致数据推荐效率较低，还可能导致潜力账户的流失，从而导致潜力账户留存率的下降。

针对上述问题，本申请实施例提供了一种数据推荐的方法，服务器可以响应于目标账户发送的数据获取请求，获取与目标账户具有关联关系的关联账户对应的关联账户信息，关联账户信息包括目标关联关系和目标画像数据，目标关联关系包括关联账户与账户集合中各个账户之间的关联关系，目标画像数据用于指示关联账户的类别特征，接着，基于目标关联关系确定关联账户对应的关联嵌入式向量，并基于目标画像数据确定关联账户对应的画像嵌入式向量，然后，对关联嵌入式向量和画像嵌入式向量进行融合，得到目标嵌入式向量，并基于目标嵌入式向量从账户集合中筛选得到相似账户集合，进一步的，获取相似账户集合中各个相似账户下的多媒体数据，并基于多媒体数据对目标账户进行数据推荐。通过实施上述方法，可以充分利用用户与账户之间的行为数据以及账户的画像数据，并根据行为数据和画像数据共同确定账户的嵌入式向量，以基于该嵌入式向量召回账户的相似账户，从而可以提升账户对应的多媒体数据分发冷启动的速度，提高数据推荐效率，提升用户体验。

需要说明的是，本方案提供的数据推荐的方法具体可应用于数据推荐的系统中，请参阅图1a，图1a是本申请实施例提供的一种数据推荐系统的架构示意图。本申请涉及终端101和服务器102，数据推荐的方法具体可以由服务器102进行执行。

以终端101为例，终端101获取目标账户通过终端101发起的数据获取请求，将该数据获取请求发送至服务器102。服务器102根据数据获取请求获取与目标账户具有关联关系的关联账户对应的关联账户信息，其中，该关联账户信息可以包括目标关联关系和目标画像数据，该目标关联关系可以包括关联账户与账户集合中各个账户之间的关联关系，该目标画像数据可以用于指示关联账户的类别特征。服务器102基于目标关联关系确定关联账户对应的关联嵌入式向量，并基于目标画像数据确定所述关联账户对应的画像嵌入式向量，然后对关联嵌入式向量和画像嵌入式向量进行融合，得到目标嵌入式向量，并基于目标嵌入式向量从账户集合中筛选得到相似账户集合。服务器102获取相似账户集合中各个相似账户下的多媒体数据，并基于多媒体数据对目标账户进行数据推荐。后续，服务器102将确定的多媒体数据发送给终端101，由终端101展示多媒体数据，以使得目标账户获取到所需的多媒体数据。

图1a所示的终端101可以是手机、平板电脑、笔记本电脑、掌上电脑、移动互联网设备(MID，Mobile Internet Device)、可穿戴设备等智能设备。终端101与服务器102可以通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。

在一种实现场景中，本方案还提供了另一种应用该数据推荐方法的数据推荐系统，如图1b是本申请实施例提供的一种数据推荐系统的架构示意图。本申请实施例所描述的数据推荐系统，其中，数据推荐的方法具体可以由推荐模块进行执行，其中，该推荐模块可以包括账户嵌入式向量化模块、相似账户召回模块、推荐召回模块以及推荐排序模块。

在一种实现方式中，可以通过账户嵌入式向量化模块确定关联账户的目标嵌入式向量。具体的，账户嵌入式向量化模块可以获取与目标账户具有关联关系的关联账户对应的关联账户信息，关联账户信息包括目标关联关系和目标画像数据，目标关联关系包括关联账户与账户集合中各个账户之间的关联关系，目标画像数据用于指示关联账户的类别特征，接着，基于目标关联关系确定关联账户对应的关联嵌入式向量，并基于目标画像数据确定关联账户对应的画像嵌入式向量，进一步的，对关联嵌入式向量和画像嵌入式向量进行融合，得到目标嵌入式向量。而在账户嵌入式向量化模块确定目标嵌入式向量之后，可以将该目标嵌入式向量上传至相似账户召回模块，以使得该相似账户召回模块召回以关联账户的相似账户，其中，召回的具体实施方式可以是计算关联账户的目标嵌入式向量与账户集合中各个账户的嵌入式向量之间的相似度，以根据相似度来确定关联账户的相似账户集合。那么，在相似账户召回模块确定相似账户集合之后，可以将该相似账户集合上传给推荐召回模块，推荐召回模块在接收到相似账户集合之后，可以从内容数据库中获取相似账户集合中各个相似账户下的多媒体数据，并将多媒体数据发送至推荐排序模块，而推荐排序模块可以将多媒体数据包括的至少一个多媒体文件进行排序，以根据排序结果进行数据推荐。具体地，推荐排序模块接收推荐召回模块发送的多媒体数据，并对多媒体数据进行排序，以根据排序结果将多媒体数据展示给用户。其中，对多媒体数据的排序方式在本申请不做限定，可以依照任意排序规则对多媒体数据进行排序，例如，可以通过多媒体数据的历史点击次数来对多媒体数据进行排序，并依据排序结果输出多媒体数据。

在一种实现方式中，该数据推荐系统还可以包括内容生产端、内容消费端、上下行内容接口模块、内容分发出口模块、内容数据库、调度中心模块、审核模块、排重模块、统计上报接口模块、统计数据库。其中：

内容生产端，用于提供多媒体平台所需的多媒体数据，该多媒体数据例如可以是图文或者视频等，视频可以包括短视频和小视频等。内容生产者(可理解为账户)可以上传多媒体数据，其中，内容生产者可以包括专业生产内容(Professional GeneratedContent，PGC)或者用户生成内容(User Generated Content，UGC)或者多渠道网络(Multi-Channel Network，MCN)或者专业用户生产内容(Professional User Generated Content，PUGC)的内容生产者，内容生产端可以通过与上下行内容接口模块的通信连接，先获取上传模块器接口地址，然后再通过该接口地址上传所要发布的多媒体数据。

内容消费端，用于和上下行内容接口模块进行通信连接，以获取访问多媒体数据的索引信息，然后与上下行内容接口模块以及内容出口模块通信，以获取多媒体数据。还可以将用户对多媒体数据的各种消费行为上报给统计上报接口模块，其中，例如，对于多媒体数据为视频而言，消费行为可以包括视频的播放时长，缓存时间，以及用户与视频内容的各种互动行为，例如评论、转发、分享、收藏、点赞、举报等。

上下行内容接口模块，用于和内容生产端直接通信，可以获取内容生产端提供的多媒体数据，其中，可以获取与多媒体数据的相关信息，可以将多媒体数据的相关信息称之为元信息，例如，元信息可以包括多媒体数据的大小、封面图链接、标题、发布时间、发布者、来源渠道等等，还可以包括对多媒体数据的分类，例如，对多媒体数据的级别分类以及标签信息，比如多媒体数据为一篇关于手表的文章，该文章的一级分类可以是科技，二级分类可以是智能手表，三级分类可以是国内手表，标签信息具体可以是该手表的品牌以及型号。可以将多媒体数据以及多媒体数据的元信息存储于内容数据库中。还可以向统计上报接口模块上报每个账户的发文流水信息，其中，发文流水信息可以包括每个账户所发布的多媒体数据的发文时间、内容类型等。还可以将内容生产端上传的多媒体数据发送至调度模块中心，以使得调度模块中心根据接收到的多媒体数据进行调度。

内容分发出口模块，用于与推荐排序模块进行通信，获取推荐排序模块提供的多媒体数据，以将多媒体数据下发至内容消费端，并将多媒体数据展示在用户终端的消息来源列表中。

内容数据库，用于接收上下行内容接口模块上传的多媒体数据以及多媒体数据的元信息，并存储。例如，账户嵌入式向量化模块确定关联账户的目标嵌入式向量时所需的关联账户的目标画像数据可以从内容数据库中获取，该目标画像数据具体可以从内容数据库中所存储的多媒体数据的元信息中获取。还用于将审核模块提供的审核结果进行存储，还用于将排重模块提供的排重结果进行存储。

调度中心模块，用于负责多媒体数据在数据推荐系统中流转的整个调度过程，通过上下行内容接口模块接收需要存储于内容数据库的多媒体数据，并将接收到的多媒体数据以及多媒体数据的元信息发送至内容数据库，可以实时更新内容数据库中的数据。还用于调度排重模块，以对重复存储于内容数据库的多媒体数据进行标记和过滤。还用于调度审核模块，以实现对多媒体数据的审核处理，从而解决比如数据安全等问题。

审核模块，用于通过调度模块中心读取内容数据库中的多媒体数据，并对多媒体数据进行审核，以确保数据推荐系统推送的多媒体数据符合指定规范，例如该指定规范可以是法律或政策，以将不符合指定规范的多媒体数据进行过滤。而审核模块的审核结果也可以通过调度模块中心写入内容数据库中。

排重模块，用于通过调度模块中心对重复存储于内容数据库的多媒体数据进行排重处理，以对多媒体数据进行过滤。其中，排重处理可以包括对多媒体数据的标题去重，多媒体数据的封面图的图片去重，多媒体数据的内容正文去重，以及视频指纹和音频指纹去重。排重模块通常是将图文内容标题和正文向量化。

统计上报接口模块，用于接收内容消费端上报的用户对多媒体数据的各种消费行为数据，还用于接收上下行内容接口模块上报的发文流水信息，还用于将上报的数据写入统计数据库中。

统计数据库，用于接收内容消费端的统计数据的上报，为后续的统计分析和挖掘提供数据支撑，与账户嵌入式向量化模块建立通信，并向账户嵌入式向量化模块提供确定账户的嵌入式向量所需的数据，还用于接收接收内容生产端的发文信息的上报，以统计账户发布的多媒体数据的类别标签等信息。例如，上述账户嵌入式向量化模块确定关联账户的目标嵌入式向量时所需的关联账户信息可以从统计数据库中获取。

请参阅图2，图2是本申请实施例提供的一种数据推荐方法的流程示意图。该方法应用于服务器，可由服务器执行，如图所示，该数据推荐方法可包括：

S201：响应于目标账户发送的数据获取请求，获取与目标账户具有关联关系的关联账户对应的关联账户信息。

在一种实现方式中，服务器可以接收目标账户发送的数据获取请求，并获取与目标账户具有关联关系的关联账户对应的关联账户信息，其中，目标账户可以理解为当前在多媒体平台比如某个阅读应用进行阅读的用户，那么，关联账户可以是用户当前所阅读的多媒体数据对应的账户。该关联账户信息可以包括目标关联关系和目标画像数据，该目标关联关系可以包括关联账户与账户集合中各个账户之间的关联关系，例如，关联账户为账户A，账户集合中包括账户B、账户C、账户D，那么，账户A与账户B的关联关系可以理解为目标账户阅读了账户A发布的多媒体数据，紧接着目标账户又阅读了账户A发布的多媒体数据。该目标画像数据可以用于指示关联账户的类别特征，该类别特征可以包括关联账户下的目标多媒体数据的类别特征、关联账户的指向群体特征等等。

S202：基于目标关联关系确定关联账户对应的关联嵌入式向量，并基于目标画像数据确定关联账户对应的画像嵌入式向量。

在一种实现方式中，基于目标关联关系确定关联账户对应的关联嵌入式向量的具体实施方式可以如图3a所示的流程示意图，如图3a所示，可以先基于目标关联关系构建目标账户关系图，其中，目标账户关系图中包括至少一个账户节点。在构建目标账户关系图之后，可以在目标账户关系图中进行节点随机游走，以得到目标账户关系图对应的目标随机游走序列，接着，调用第一向量化模型对该目标随机游走序列进行处理，即可得到关联账户对应的关联嵌入式向量。

在一种实现方式中，目标画像数据可以包括关联账户下的多种类别标签，例如，该类别标签可以包括目标多媒体数据的类别标签、关联账户的类别标签和关联账户的指向群体标签等等。那么，基于目标画像数据确定关联账户对应的画像嵌入式向量的具体实施方式可以是调用第二向量化模型对关联账户下的多种类别标签分别进行处理，以得到各个类别标签对应的画像嵌入式向量。具体地，假设类别标签包括目标多媒体数据的类别标签、关联账户的类别标签和关联账户的指向群体标签，可以调用第二向量化模型关联账户下的目标多媒体数据的类别标签进行处理，得到第一画像嵌入式向量，调用第二向量化模型对关联账户的类别标签进行处理，得到第二画像嵌入式向量，调用第二向量化模型对关联账户的指向群体标签进行处理，得到第三画像嵌入式向量。那么，在得到第一画像嵌入式向量、第二画像嵌入式向量和第三画像嵌入式向量之后，即可根据第一画像嵌入式向量、第二画像嵌入式向量和第三画像嵌入式向量，构建关联账户对应的画像嵌入式向量。其中，上述构建关联账户对应的画像嵌入式向量可以理解为关联账户对应的画像嵌入式向量包括第一画像嵌入式向量、第二画像嵌入式向量和第三画像嵌入式向量。

可选的，上述第一向量化模型可以是相关的词向量模型，例如Skip-gram模型，第二向量模型也可以是相关的词向量模型，其中，第一向量化模型与第二向量模型可以相同，也可以不相同。

S203：对关联嵌入式向量和画像嵌入式向量进行融合，得到目标嵌入式向量，并基于目标嵌入式向量从账户集合中筛选得到相似账户集合。

在一种实现方式中，服务器可以将关联嵌入式向量和画像嵌入式向量进行融合，以得到关联账户对应的目标嵌入式向量，那么在得到该目标嵌入式向量之后，即可基于该目标嵌入式向量从账户集合中筛选得到关联账户对应的相似账户集合。

举例来说，如图3b和图3c所示为本申请实施例提供的一种关联账户对应的相似账户集合的结构示意图。如图3b所示中的各个账户是账户A(唐老师讲数学)对应的相似账户集合中的部分相似账户，可以看出，相似账户与账户A的类型和风格上均很相似，相似账户均是关于数学讲解方面的。例如，账户A对应的相似账户可以是账户A1(罗老师数学课堂)。如图3c所示中的各个账户是账户B(XXX美食)对应的相似账户集合中的部分相似账户，可以看出，相似账户与账户B的类型和风格上均很相似，相似账户均是关于美食方面的。还可以看出，在相似账户中，部分相似账户的关注量比较少，即通过本申请实施例的方式，可以召回关注量较少的相似账户，在这种情况下，可以通过账户对应的目标嵌入式向量将关注量较多的高热度账户的关注量，作为账户召回相似潜力账户的目标关注量，从而实现关注量的迁移和潜力账户的冷启动，可以有效减少试探新账户需要的流量和加快收敛的速度。可以看出，通过用户对账户的消费行为数据以及账户本身的画像数据更好的促进账户对应的多媒体数据的分发，潜力账户也能够优先得到定向的流量，流量的利用效率可以得到提升。

在一种实现方式中，上述在将关联嵌入式向量和画像嵌入式向量进行融合，得到目标嵌入式向量时，融合的方式可以是加权求和。那么，在得到目标嵌入式向量的具体实施方式可以是先获取关联嵌入式向量对应的关联权重和画像嵌入式向量对应的画像权重。其中，关联权重和画像权重分别表示在构建目标嵌入式向量时，关联嵌入式向量和画像嵌入式向量的重要程度，关联权重和画像权重可以通过模型的不断学习中获得。在确定关联权重和画像权重之后，可以基于关联权重对关联嵌入式向量进行加权处理，以得到关联嵌入式向量对应的加权关联嵌入式向量，同理，可以基于画像权重对画像嵌入式向量进行加权处理，以得到画像嵌入式向量对应的加权画像嵌入式向量，那么，在确定加权关联嵌入式向量和加权画像嵌入式向量之后，即可对加权关联嵌入式向量和加权画像嵌入式向量进行拼接，其中，拼接可以理解为向量的求和，也就是将加权关联嵌入式向量和加权画像嵌入式向量进行求和处理，则求和结果即是目标嵌入式向量。

举例来说，如图3d所示为本申请实施例提供的一种确定目标嵌入式向量的流程示意图，如图3d所示，稀疏特征可以理解为包括上述的目标关联关系以及目标画像数据，嵌入式向量可以理解为包括基于目标关联关系确定的关联嵌入式向量，以及基于目标画像数据确定的画像嵌入式向量，将各个嵌入式向量与对应的权重进行相乘，并对各个相乘结果求和即可得到目标嵌入式向量。图3d中的a0、a1…an即是各个嵌入式向量对应的权重。

在一种实现方式中，确定相似账户集合的具体实施方式可以是根据目标嵌入式向量与账户集合中各个账户对应的嵌入式向量之间的相似度来确定。具体地，可以获取账户集合对应的嵌入式向量集合，该嵌入式向量集合包括账户集合中每个账户对应的嵌入式向量。那么，在获取到嵌入式向量集合之后，可以确定目标嵌入式向量和嵌入式向量集合中各个嵌入式向量之间的相似度，其中，相似度可以计算两个向量之间的余弦距离获得。在确定目标嵌入式向量和各个嵌入式向量之间的相似度之后，将各个相似度与预设相似度进行大小比较，筛选出与目标嵌入式向量之间相似度大于预设相似度的相似度，可以将与目标嵌入式向量之间相似度大于预设相似度的相似度称之为相似嵌入式向量，通过上述删选过程，可以得到至少一个相似嵌入式向量。那么，在得到至少一个相似嵌入式向量之后，则可以获取至少一个相似嵌入式向量中各个相似嵌入式向量对应的账户，可以将相似嵌入式向量对应的账户称之为相似账户，即可以得到至少一个相似账户，然后，基于该至少一个相似账户构建相似账户集合。

可选的，在上述基于该至少一个相似账户构建相似账户集合时，可以将该至少一个相似账户均添加到相似账户集合中，以得到相似账户集合，还可以将该至少一个相似账户进行进一步删选，并将删选后得到的相似账户添加到相似账户集合中，以得到相似账户集合。其中，上述在对相似账户进行删选时，可以是基于目标账户对相似账户的消费行为进行删选，例如，如果目标账户针对某个相似账户的消费数据量高于预设消费数据量，则将该相似账户保留，如果目标账户针对某个相似账户的消费数据量低于预设消费数据量，则将该相似账户删除，那么，根据上述的删选过程，可以将保留的相似账户添加到相似账户集合中，以得到相似账户集合。其中，上述的消费数据量可以是指目标账户对账户的消费行为的数据量，消费行为可以是指对账户的比如浏览，播放，评论，收藏，转发，分享，点赞等等行为，如果账户是视频账户，消费行为还可以包括对该视频账户中视频内容的平均播放完成度，如果账户是图文账户，消费行为还可以包括该图文账户中图文内容的平均阅读完成度。

S204：获取相似账户集合中各个相似账户下的多媒体数据，并基于多媒体数据对目标账户进行数据推荐。

在一种实现方式中，可以从内容数据库中获取相似账户集合中各个相似账户下的多媒体数据，该多媒体数据中包括至少一个多媒体文件，其中，各个多媒体文件由可以是各个相似账户通过如图1b所示的上下行内容接口服务上传的，并通过审核处理以及排重处理后得到。在获取到各个相似账户下的多媒体数据之后，可以根据预设排序规则对多媒体数据中各个多媒体文件进行排序，得到针对各个多媒体文件对应的排序结果，并根据排序结果对目标账户进行数据推荐。其中，预设排序规则可以是依照各个多媒体文件对应的历史点击次数比对各个多媒体文件进行排序。具体地，可以获取各个多媒体文件对应的历史点击次数，对各个多媒体文件对应的历史点击次数进行降序排序，得到排序结果，将排序结果中前N位的多媒体文件作为待推荐数据，并将该前N位的多媒体文件对目标账户进行数据推荐。

在一种实现方式中，可以获取相似账户集合中各个相似账户下的多媒体数据，以基于获取到的多媒体数据对目标账户进行数据推荐。可选的，在基于获取到的多媒体数据对目标账户进行数据推荐时，可以将获取到的多媒体数据均对目标账户进行数据推荐，而考虑到获取到的多媒体数量的数据量可能比较大，还可以将获取到的多媒体数据进行进一步的删选，以根据删选后的多媒体数据对目标账户进行数据推荐。

可选的，可以根据多媒体数据的时间进行删选，例如，该时间可以是发布时间。具体地，可以获取各个多媒体数据的发布时间，然后，将各个多媒体数据的发布时间与预设时间条件进行比较，当多媒体数据的发布时间满足预设时间条件时，将该多媒体数据保留，对应的，当多媒体数据的发布时间不满足预设时间条件时，将该多媒体数据删除。其中，该预设时间条件可以预先设置，预设时间条件具体可以是多媒体的发布时间与当前目标用户的数据获取请求的时间之差不超过预设时间，该预设时间可以设置较短，例如，该预设时间可以是2小时，或1小时等等。可以看出，通过上述预设时间条件的设置，可以尽可能保证目标用户获取的多媒体数据是最新数据，更加符合用户意图，而不是较为陈旧的数据，从而可以提高数据推荐效率，也可以提高用户体验。

可选的，在上述根据多媒体数据的时间进行删选的同时，还可以设定数据推荐的数量，以根据数据推荐的数量进一步的对多媒体数据进行删选，以减低数据的冗余，提高数据推荐效率。具体的，可以根据上述根据多媒体数据的时间进行删选，得到删选后的多媒体数据之后，获取删选后的多媒体数据的数量，如果该数量大于预设数量，还可以删除部分多媒体数据，以使得多媒体数据的数量小于或等于预设数量。

可选的，可以根据多媒体数据的热度进行删选，例如，该热度可以是指被点击次数。具体地，可以先获取各个多媒体数据的被点击次数，其中，可以获取预设时间段内每个多媒体数据的被点击次数，该预设时间段可以预先设置，例如，该预设时间段可以是当前目标账户的数据获取请求时间之前的24小时，或12小时等等。在确定每个多媒体数据的被点击次数之后，可以按照被点击次数从高到低的顺序来对多媒体数据进行排序，得到排序结果，可以将排序结果中前K个多媒体数据保留，其余的多媒体数据可以删除。其中，K值可以预先设定，例如，可以是10或15等等。

需要说明的是，本申请实施例在将获取到的多媒体数据进行进一步的删选，以根据删选后的多媒体数据对目标账户进行数据推荐时，可以包括上述描述的方式对获取到的多媒体数据进行进一步的删选，也可以基于其他方式对获取到的多媒体数据进行进一步的删选，在本申请不做限定。

在本申请实施例中，可以响应于目标账户发送的数据获取请求，获取与目标账户具有关联关系的关联账户对应的关联账户信息，关联账户信息包括目标关联关系和目标画像数据，目标关联关系包括关联账户与账户集合中各个账户之间的关联关系，目标画像数据用于指示关联账户的类别特征，接着，基于目标关联关系确定关联账户对应的关联嵌入式向量，并基于目标画像数据确定关联账户对应的画像嵌入式向量，然后，对关联嵌入式向量和画像嵌入式向量进行融合，得到目标嵌入式向量，并基于目标嵌入式向量从账户集合中筛选得到相似账户集合，进一步的，获取相似账户集合中各个相似账户下的多媒体数据，并基于多媒体数据对目标账户进行数据推荐。通过实施上述方法，可以充分利用用户与账户之间的行为数据以及账户的画像数据，并根据行为数据和画像数据共同确定账户的嵌入式向量，以基于该嵌入式向量召回账户的相似账户，从而可以提升账户对应的多媒体数据分发冷启动的速度，提高数据推荐效率，提升用户体验。

请参阅图4，图4是本申请实施例提供的一种数据推荐方法的流程示意图。该方法应用于服务器，可由服务器执行，如图所示，该数据推荐方法可包括：

S401：响应于目标账户发送的数据获取请求，获取与目标账户具有关联关系的关联账户对应的关联账户信息。

S402：基于目标关联关系构建目标账户关系图。

S403：在目标账户关系图中进行节点随机游走，得到目标账户关系图对应的目标随机游走序列。

在步骤S402和步骤S403中，可以基于目标关联关系构建目标账户关系图，该目标关联关系可以包括关联账户与账户集合中各个账户之间的关联关系，该目标账户关系图可以是如图3a中所示的目标账户关系图，目标账户关系图中所包括的账户节点为账户集合中与关联账户存在关联关系的账户对应的节点。例如，针对某一用户而言，该用户播放了关联账户发布的一个视频，同时紧接着又播放了账户集合中账户B发布的一个视频，那么关联账户与账户B是具有关联关系的。在构建目标账户关系图，即可目标账户关系图中进行节点随机游走，得到目标账户关系图对应的目标随机游走序列。

S404：调用第一向量化模型对目标随机游走序列进行处理，得到关联账户对应的关联嵌入式向量。

在一种实现方式中，获得第一向量化模型的具体实施方式可以是先获取待训练数据，待训练数据可以包括账户集合中各个账户之间的关联关系。而在获取待训练数据之后，即可基于账户集合中各个账户之间的关联关系构建参考账户关系图，该参考账户关系图中可以包括至少一个账户节点。接着，在参考账户关系图中进行节点随机游走，得到参考账户关系图对应的参考随机游走序列。那么，在得到参考随机游走序列之后，就可以基于参考随机游走序列对初始向量化模型进行训练，以得到第一向量化模型。

例如，图5a所示为本申请实施例提供的一种确定第一向量化模型的流程示意图，其具体实现过程可以包括如下步骤：

S1：获取待训练数据。

其中，获取待训练数据可以包括用户与各个账户之间的消费行为，例如，对某个账户而言，用户对该账户的消费行为可以包括对该账户的关注，，还可以包括对该账户所发布的多媒体数据的消费行为，例如，以多媒体数据为视频而言，消费行为可以包括视频的播放时长，缓存时间，以及用户与视频内容的各种互动行为，例如评论、转发、分享、收藏、点赞、举报等。

S2：构建参考账户关系图。

其中，参考账户关系图包括账户节点以及账户节点之间的连接边，账户节点可以是如图5a中参考账户关系图中的各个圆圈，连接边可以是各个圆圈之间的连接线。对于连接边而言，如果一个用户消费了账户A发布的一个多媒体数据Page1，同时紧接着又消费了账户B发布的一个多媒体数据Page2，那么账户A对应的账户节点和账户B对应的账户节点之间可以存在连接边。其中，该消费可以理解为阅读或播放，需要理解的是，该消费可以为有效消费，该有效消费具体可以是指消费时长达到预设值，例如，对于一篇文章而言，文章阅读时长要达到预设值，又如，对于一个视频而言，视频时长要达到预设值。下述的S2.1-S2.4是对连接边的各个属性的解释说明。可选的，上述参考账户关系图可以包括两种类型，该两种类型可以分别为同构图和异构图，同构图中的账户节点可以是同一行为类型的节点，异构图中的账户节点可以是多种类型的节点，例如，可以是关注行为类型的节点、评论行为类型的节点以及分享行为类型的节点。

S2.1：连接边的来源：对于多媒体数据为视频而言，可以利用用户对视频有效播放来构建参考账户关系图，对于多媒体数据为图文而言，可以利用用户对图文有效阅读来构建参考账户关系图。

S2.2：连接边的时间窗口：用来指定所获取的待训练数据所对应的时间段，例如时间窗口可以为15天，也就是指获取的待训练数据为过去15天之内的数据。

S2.3：连接边的截断：用于控制下述参考随机游走序列的长度，可以以半个小时之内用户的消费行为产生的序列作为一个参考随机游走序列。

S2.4：连接边的删除：可以对参考账户关系图中的部分连接边进行删除，以确保连接边的有效性，可以防止账户例如搬运账户或者数据推荐不准确导致用户行为异常的情况。那么，在构建参考账户关系图时，可以利用账户节点对应的关联信息设置过滤条件，以保证构建的参考账户关系图可以表示用户对账户的真实消费行为。

S3：确定参考随机游走序列。

其中，可以在参考账户关系图中进行节点随机游走，那么，针对参考账户关系图中的每个账户节点，可以得到多个参考随机游走序列。例如，以账户节点A为起点为例，在进行节点随机游走，可以得到参考随机游走序列A-B-E-F、A-B-E-C-B等等。可选的，在参考账户关系图中进行节点随机游走时，可以依照加权随机游走的方式进行随机游走，也就是说基于边的权重进行游走，例如，图5b所示为本申请实施例提供的一种带有权重的参考账户关系图的结构示意图，权重可以衡量两个账户节点之间连接边的重要程度，如图5b所示，账户节点A与账户节点B之间的连接边对应的权重W1＝0.1，账户节点A与账户节点C之间的连接边对应的权重W2＝0.7，那么，以账户节点A为起点进行游走时，可以优先选择权重高的连接边的方向进行游走，也就是会向账户节点C进行游走。其中，可以根据得到的参考随机游走序列，确定账户节点之间的相似度。具体的，当2个账户节点之间的公共账户节点越多，那么，该2个账户节点之间的相似度越高，该2个账户节点越相似，或者，当2个账户节点的参考随机游走序列的长度越短，该2个账户节点越相似。

S4：训练初始向量化模型。

其中，该初始向量化模型可以为Skip-gram模型。具体地，可以将上述得到的参考随机游走序列输入Skip-gram模型，以对Skip-gram模型进行训练，从而得到训练后的初始向量化模型，该训练后的初始向量化模型也就是第一向量化模型。

在一种实现方式中，在确定第一向量化模型之后，即可通过该第一向量化模型确定各个账户对应的关联嵌入式向量。如图5c所示是一种确定关联嵌入式向量的流程示意图，其中关联关系具体为关注行为，从图5c中可以看出，可以获取各个账户之间的关注行为，然后再根据各个账户之间的关注行为构建基于关注行为的参考账户关系图。在确定参考账户关系图之后，可以在参考账户关系图中进行节点随机游走，得到参考账户关系图对应的参考随机游走序列。那么，在得到参考随机游走序列之后，将参考随机游走序列输入到该参考账户关系图即可得到各个账户对应的关联嵌入式向量。

S405：基于目标画像数据确定关联账户对应的画像嵌入式向量。

在一种实现方式中，上述在确定关联嵌入式向量的过程，主要使用的是用户与关联账户之间的交互行为信息，但是，若对于一个新账户而言，新账户发布的内容需要经过一个冷启动的过程，这个过程当中，用户与新账户之间的交互行为信息，比如关注量和消费行为的数据非常稀疏，那么，在通过上述确定该新账户的关联嵌入式向量所需要的目标关联关系的信息量太少，在这种情况下，可以引入账户的画像数据，以得到的目标嵌入式向量可以更好的表征账户的特征。

在一种实现方式中，目标画像数据可以包括关联账户下的目标多媒体数据的类别标签、关联账户的类别标签、关联账户的指向群体标签等等，也可以包括其他用于表征关联账户的数据，在本申请不做限定。本申请以目标画像数据包括关联账户下的目标多媒体数据的类别标签、关联账户的类别标签和关联账户的指向群体标签中的至少一种为例进行说明。

其中，关联账户下的目标多媒体数据的类别标签具体可以是指关联账户在预设时间段内所发布的多媒体数据所属的类别标签在类别标签排序中处于前L的类别标签。例如，预设时间段可以是指当前时间的前3个月之内的时间段，关联账户在过去3个月所发布的多媒体数据的类别有社会类、财经类等等，其中，社会类还可以包括三农、工业、安全事故等类别，财经类还可以包括房价、物价、通货膨胀等类别。那么，上述的三农，工业，安全事故、房价、物价、通货膨胀均可为类别标签，其中，上述各个类别标签具体可以用one-hot编码来表示。具体的，以关联账户为账户A为例，可以通过统计服务器统计该账户A在当前时间之内的过去3个月时间内，各个类别标签对应的多媒体数据的数量，然后依照各个类别标签对应的多媒体数据的数量对各个类别标签从高到低进行排序，将排序结果中的前L个类别标签作为账户A下的目标多媒体数据的类别标签。其中，上述L可以是预先设置，例如，可以是3或20等等。例如，假设L为3，账户A下的目标多媒体数据的类别标签可以包括工业，安全事故、房价。

其中，关联账户的类别标签具体可以包括一级类别标签、二级类别标签、三级类别标签，一级类别标签、二级类别标签、三级类别标签均可以用one-hot编码来表示。具体的，对于一个账户而言，该账户可以发布各种不同的多媒体数据，可以理解的是，多媒体数据存在对应的一级分类(一级类别标签)，例如，以多媒体数据为一篇文章为例进行说明，该文章的一级分类有社会，科技，财经，教育，体育等，而每个一级分类下也可以存在二级分类(二级类别标签)，例如科技的二级分类可以包括互联网科技，移动科技，机械科技，人工智能等，而每个二级分类下也可以存在三级分类(三级类别标签)，例如人工智能的三级分类可以包括机器学习，深度学习，计算机视觉，自然语言处理等。

在一种实现方式中，本申请实施例中关联账户的类别标签可以包括N1个一级类别标签、N2个二级类别标签、N3个三级类别标签，其中，N1个一级类别标签是在关联账户所发布的多媒体数据对应的一级类别标签中累计标签数为前N1的一级类别标签，N2个二级类别标签是在关联账户所发布的多媒体数据对应的二级类别标签中累计标签数为前N2的二级类别标签，N3个三级类别标签是在关联账户所发布的多媒体数据对应的三级类别标签中累计标签数为前N3的三级类别标签，N1、N2、N3可以预先设置。具体的，假设N1、N2、N3可以均为5，可以统计关联账户所发布的多媒体数据对应的一级类别标签的数量、二级类别标签的数量和三级类别标签的数量，并根据一级类别标签的数量对一级类别标签进行降序排序得到第一排序结果，根据二级类别标签的数量对二级类别标签进行降序排序得到第二排序结果，根据三级类别标签的数量对三级类别标签进行降序排序得到第三排序结果，进一步的，从第一排序结果中获取前5个一级类别标签，从第二排序结果中获取前5个二级类别标签，从第三排序结果中获取前5个三级类别标签。

其中，关联账户的指向群体可以包括少年群体，青年群体，中年群体，老年群体中的任意一种，也可以按照年龄段来划分不同指向群体，例如，年龄段在10-15或16-20等等。那么关联账户的指向群体标签可以是上述的指向群体对应的标签，可以将每一个指向群体分配一个标签，该标签具体可以用one-hot编码来表示。指向群体标签可以理解为该关联账户更加适合关注或消费的账户。

在一种实现方式中，如果在具体实现场景中，关联账户下的目标多媒体数据的类别标签对应的向量以及关联账户的类别标签对应的向量可能存在多个，例如，如果关联账户下的目标多媒体数据的类别标签的数量设定20个，那么关联账户下的目标多媒体数据的类别标签对应的向量存在20个、如果关联账户的类别标签的数量设定15个，那么关联账户的类别标签对应的向量存在15个，但是在输入上述的第二向量化模型的过程中，考虑到同一个类别标签对应的向量在不同账户下是相同的，可以将关联账户下的目标多媒体数据的类别标签对应的向量作为整体构建为一个向量，以及将关联账户的类别标签对应的向量作为整体构建为一个向量，通过上述处理，可以增加类别标签的覆盖度，也可以不受类别标签的输入顺序的影响。还可以将目标关联关系对应的向量、关联账户下的目标多媒体数据的类别标签对应的向量和关联账户的类别标签对应的向量各自增加以一个指定向量，该向量可以为全为0的向量，该指定向量可以作为空的输入占位符，当第二向量化模型的输入存在空向量时，最后得到的目标嵌入式向量不被空值影响。

在一种实现方式中，可以先获取关联账户的目标画像数据，其中，该目标画像数据可以包括关联账户下的目标多媒体数据的类别标签、关联账户的类别标签和关联账户的指向群体标签中的至少一种。在获取到该目标画像数据之后，则可以调用第二向量化模型对目标画像数据进行处理，以得到关联账户对应的画像嵌入式向量。

举例来说，如果目标画像数据包括关联账户下的目标多媒体数据的类别标签、关联账户的类别标签和关联账户的指向群体标签中的一种。假设该目标画像数据为关联账户下的目标多媒体数据的类别标签，则可以调用第二向量化模型对关联账户下的目标多媒体数据的类别标签进行处理，得到的嵌入式向量即是画像嵌入式向量。

举例又说，如果目标画像数据包括关联账户下的目标多媒体数据的类别标签、关联账户的类别标签和关联账户的指向群体标签中的任意两种。假设该目标画像数据为关联账户下的目标多媒体数据的类别标签和关联账户的类别标签，则可以调用第二向量化模型对关联账户下的目标多媒体数据的类别标签进行处理，得到第一画像嵌入式向量，并调用该第二向量化模型对关联账户的类别标签进行处理，得到第二画像嵌入式向量。那么，在得到第一画像嵌入式向量和第二画像嵌入式向量之后，即可根据第一画像嵌入式向量和第二画像嵌入式向量，构建关联账户对应的画像嵌入式向量。其中，上述构建关联账户对应的画像嵌入式向量可以理解为关联账户对应的画像嵌入式向量包括第一画像嵌入式向量和第二画像嵌入式向量。

举例再说，如果目标画像数据包括关联账户下的目标多媒体数据的类别标签、关联账户的类别标签和关联账户的指向群体标签，则可以调用第二向量化模型对关联账户下的目标多媒体数据的类别标签进行处理，得到第一画像嵌入式向量，调用第二向量化模型对关联账户的类别标签进行处理，得到第二画像嵌入式向量，调用第二向量化模型对关联账户的指向群体标签进行处理，得到第三画像嵌入式向量；那么，在得到第一画像嵌入式向量、第二画像嵌入式向量和第三画像嵌入式向量之后，即可根据第一画像嵌入式向量、第二画像嵌入式向量和第三画像嵌入式向量，构建关联账户对应的画像嵌入式向量。其中，上述构建关联账户对应的画像嵌入式向量可以理解为关联账户对应的画像嵌入式向量包括第一画像嵌入式向量、第二画像嵌入式向量和第三画像嵌入式向量。

S406：对关联嵌入式向量和画像嵌入式向量进行融合，得到目标嵌入式向量，并基于目标嵌入式向量从账户集合中筛选得到相似账户集合。

S407：获取相似账户集合中各个相似账户下的多媒体数据，并基于多媒体数据对目标账户进行数据推荐。

其中，步骤S401、S406和S407的具体实施方式可以参见上述实施例步骤S201、S203和S204的具体描述，此处不再赘述。

在本申请实施例中，响应于目标账户发送的数据获取请求，获取与目标账户具有关联关系的关联账户对应的关联账户信息。基于目标关联关系构建目标账户关系图。在目标账户关系图中进行节点随机游走，得到目标账户关系图对应的目标随机游走序列。调用第一向量化模型对目标随机游走序列进行处理，得到关联账户对应的关联嵌入式向量。基于目标画像数据确定关联账户对应的画像嵌入式向量。对关联嵌入式向量和画像嵌入式向量进行融合，得到目标嵌入式向量，并基于目标嵌入式向量从账户集合中筛选得到相似账户集合。获取相似账户集合中各个相似账户下的多媒体数据，并基于多媒体数据对目标账户进行数据推荐。通过实施上述方法，可以充分利用用户与账户之间的行为数据以及账户的画像数据，并根据行为数据和画像数据共同确定账户的嵌入式向量，以基于该嵌入式向量召回账户的相似账户，从而可以提升账户对应的多媒体数据分发冷启动的速度，提高数据推荐效率，提升用户体验。

请参阅图6，图6是本申请实施例提供的一种基于数据推荐装置的结构示意图。本实施例中所描述的数据推荐装置，包括：

获取单元601，用于响应于目标账户发送的数据获取请求，获取与所述目标账户具有关联关系的关联账户对应的关联账户信息，所述关联账户信息包括目标关联关系和目标画像数据，所述目标关联关系包括所述关联账户与账户集合中各个账户之间的关联关系，所述目标画像数据用于指示所述关联账户的类别特征；

第一确定单元602，用于基于所述目标关联关系确定所述关联账户对应的关联嵌入式向量，并基于所述目标画像数据确定所述关联账户对应的画像嵌入式向量；

第二确定单元603，用于对所述关联嵌入式向量和所述画像嵌入式向量进行融合，得到目标嵌入式向量，并基于所述目标嵌入式向量从所述账户集合中筛选得到相似账户集合；

推荐单元604，用于获取所述相似账户集合中各个相似账户下的多媒体数据，并基于所述多媒体数据对所述目标账户进行数据推荐。

在一种实现方式中，所述第一确定单元602，具体用于：

基于所述目标关联关系构建目标账户关系图，所述目标账户关系图中包括至少一个账户节点；

在所述目标账户关系图中进行节点随机游走，得到所述目标账户关系图对应的目标随机游走序列；

调用第一向量化模型对所述目标随机游走序列进行处理，得到所述关联账户对应的关联嵌入式向量。

在一种实现方式中，所述目标画像数据包括所述关联账户下的目标多媒体数据的类别标签、所述关联账户的类别标签和所述关联账户的指向群体标签中的至少一种；所述第一确定单元602，具体用于：

调用第二向量化模型对关联账户下的目标多媒体数据的类别标签进行处理，得到第一画像嵌入式向量；

调用所述第二向量化模型对所述关联账户的类别标签进行处理，得到第二画像嵌入式向量；

调用所述第二向量化模型对所述关联账户的指向群体标签进行处理，得到第三画像嵌入式向量；

基于所述第一画像嵌入式向量、所述第二画像嵌入式向量和所述第三画像嵌入式向量，构建所述关联账户对应的画像嵌入式向量。

在一种实现方式中，所述装置还包括训练单元605，所述训练单元605，具体用于：

获取待训练数据，所述待训练数据包括所述账户集合中各个账户之间的关联关系；

基于所述账户集合中各个账户之间的关联关系构建参考账户关系图，所述参考账户关系图中包括至少一个账户节点；

在所述参考账户关系图中进行节点随机游走，得到所述参考账户关系图对应的参考随机游走序列；

基于所述参考随机游走序列对初始向量化模型进行训练，得到第一向量化模型。

在一种实现方式中，所述第二确定单元603，具体用于：

获取所述关联嵌入式向量对应的关联权重和所述画像嵌入式向量对应的画像权重；

基于所述关联权重确定所述关联嵌入式向量对应的加权关联嵌入式向量，并基于所述画像权重确定所述画像嵌入式向量对应的加权画像嵌入式向量；

对所述加权关联嵌入式向量和所述加权画像嵌入式向量进行拼接，得到目标嵌入式向量。

在一种实现方式中，所述第二确定单元603，具体用于：

获取所述账户集合对应的嵌入式向量集合，所述嵌入式向量集合包括所述账户集合中每个账户对应的嵌入式向量；

确定所述目标嵌入式向量和所述嵌入式向量集合中各个嵌入式向量之间的相似度，并筛选出与所述目标嵌入式向量之间相似度大于预设相似度的至少一个相似嵌入式向量；

获取所述至少一个相似嵌入式向量中各个相似嵌入式向量对应的账户，得到至少一个相似账户；

基于所述至少一个相似账户构建相似账户集合。

在一种实现方式中，所述推荐单元604，具体用于：

从内容数据库中获取所述相似账户集合中各个相似账户下的多媒体数据；其中，所述多媒体数据中包括至少一个多媒体文件，各个多媒体文件由所述各个相似账户通过上下行内容接口服务上传，并通过审核处理以及排重处理后得到；

根据预设排序规则对所述多媒体数据中各个多媒体文件进行排序，得到所述各个多媒体文件对应的排序结果；

将排序为前N位的多媒体文件向所述目标账户进行推荐，所述N为正整数。

可以理解，本申请实施例中对单元的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。本申请实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

请参阅图7，图7是本申请实施例提供的一种服务器的结构示意图。本实施例中所描述的服务器，包括：处理器701、存储器702以及网络接口703。上述处理器701、存储器702以及网络接口703之间可以交互数据。

上述处理器701可以是中央处理单元(Central Processing Unit，CPU)，该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

上述存储器702可以包括只读存储器和随机存取存储器，并向处理器701提供程序指令和数据。存储器702的一部分还可以包括非易失性随机存取存储器。其中，所述处理器701调用所述程序指令时用于执行：

在一种实现方式中，所述处理器701，具体用于：

在一种实现方式中，所述目标画像数据包括所述关联账户下的目标多媒体数据的类别标签、所述关联账户的类别标签和所述关联账户的指向群体标签中的至少一种；所述处理器701，具体用于：

在一种实现方式中，所述处理器701，还用于：

在一种实现方式中，所述处理器701，具体用于：

基于所述至少一个相似账户构建相似账户集合。

在一种实现方式中，所述处理器701，具体用于：

本申请实施例还提供了一种计算机存储介质，该计算机存储介质中存储有程序指令，所述程序执行时可包括如图2或者图4对应实施例中的数据推荐方法的部分或全部步骤。

需要说明的是，对于前述的各个方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某一些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器(Read-Only Memory，ROM)、随机存取器(Random AccessMemory，RAM)、磁盘或光盘等。

本申请实施例还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。服务器的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该服务器执行上述各方法的实施例中所执行的步骤。

以上对本申请实施例所提供的一种数据推荐方法、装置、服务器以及存储介质进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种数据推荐方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述目标关联关系确定所述关联账户对应的关联嵌入式向量，包括：

3.根据权利要求1所述的方法，其特征在于，所述目标画像数据包括所述关联账户下的目标多媒体数据的类别标签、所述关联账户的类别标签和所述关联账户的指向群体标签中的至少一种；所述基于所述目标画像数据确定所述关联账户对应的画像嵌入式向量，包括：

4.根据权利要求2所述的方法，其特征在于，所述方法还包括：

5.根据权利要求1所述的方法，其特征在于，所述对所述关联嵌入式向量和所述画像嵌入式向量进行融合，得到目标嵌入式向量，包括：

6.根据权利要求1所述的方法，其特征在于，所述基于所述目标嵌入式向量从所述账户集合中筛选得到相似账户集合，包括：

基于所述至少一个相似账户构建相似账户集合。

7.根据权利要求1所述的方法，其特征在于，所述获取所述相似账户集合中各个相似账户下的多媒体数据，并基于所述多媒体数据对所述目标账户进行数据推荐，包括：

根据预设排序规则对所述多媒体数据中各个多媒体文件进行降序排序，得到所述各个多媒体文件对应的排序结果；

8.一种数据推荐装置，其特征在于，包括：

9.一种服务器，其特征在于，包括处理器、存储器和网络接口，所述处理器、存储器和网络接口相互连接，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行如权利要求1-7任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行如权利要求1-7任一项所述的方法。