CN116069959A

CN116069959A - 确定展示数据的方法和装置

Info

Publication number: CN116069959A
Application number: CN202111268191.6A
Authority: CN
Inventors: 谭斌
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2021-10-29
Filing date: 2021-10-29
Publication date: 2023-05-05

Abstract

本公开提供了一种确定展示数据的方法及装置、计算机可读存储介质以及计算机程序产品。该方法包括：从推荐数据数据库中获取召回推荐数据集以及历史精选推荐数据集；确定所述召回推荐数据集中多条候选推荐数据的粗选分数，对所述多条候选推荐数据的粗选分数进行排序以确定粗选推荐数据集；将所述粗选推荐数据集和所述历史精选推荐数据集进行合并以确定候选推荐数据集；确定所述候选推荐数据集中各条候选推荐数据的精选分数，并对所述候选推荐数据的精选分数进行排序以确定精选推荐数据集；以及基于所述精选推荐数据集，确定用于在显示屏幕上显示的展示数据。本公开减少了候选推荐数据被误判的可能性，提高了展示数据的精准度，提高平台收益。

Description

确定展示数据的方法和装置

技术领域

本公开涉及多媒体领域，并且更具体地，涉及一种确定展示数据的方法、装置、设备、计算机可读存储介质以及计算机程序产品。

背景技术

目前，推荐数据投放平台已经可以基于用户群体的不同或者广告主的出价不同而展示不同的推荐数据。推荐数据的每次展示又称为推荐数据的曝光。对于每次推荐数据的曝光，需要依次经过召回、粗排、精排、和展示四个流程，以从所有候选推荐数据中筛选出一个推荐数据展示给用户。其中，召回流程负责找到所有候选推荐数据；粗排流程负责初次筛选候选推荐数据以降低精排流程的处理复杂度；精排流程则负责找到最优推荐数据；展示流程则负责展示该最优推荐数据。

然而，粗排流程往往会为了尽快完成对候选推荐数据的筛选而不使用高精度的排序/截断算法，从而导致对一部分候选推荐数据被误判，进而导致推荐数据投放平台不能向用户展示价值更高的推荐数据并获得更高的推荐数据收益。因此，需要对当前的推荐数据投放平台进行进一步的改进，以提高推荐数据投放平台确定展示数据的精准度，提高平台收益。

发明内容

为了解决上述问题，本公开提供了一种确定展示数据的方法及装置、计算机可读存储介质以及计算机程序产品。

根据本公开实施例的一个方面，提供了一种确定展示数据的方法，其由处理器执行，所述方法包括：从推荐数据数据库中获取包括第一数量的候选推荐数据的召回推荐数据集以及历史精选推荐数据集；确定所述召回推荐数据集中多条候选推荐数据的粗选分数，对所述多条候选推荐数据的粗选分数进行排序以确定包括第二数量的候选推荐数据的粗选推荐数据集；将所述粗选推荐数据集和所述历史精选推荐数据集进行合并以确定候选推荐数据集；确定所述候选推荐数据集中各条候选推荐数据的精选分数，并对所述候选推荐数据的精选分数进行排序以确定包括第三数量的候选推荐数据的精选推荐数据集；以及基于所述精选推荐数据集，确定用于在显示屏幕上显示的展示数据。

例如，所述展示数据对应于用户访问请求，所述获取包括第一数量的候选推荐数据的召回推荐数据集以及历史精选推荐数据集还包括：所述基于与用户访问请求对应的用户信息，获取包括第一数量的候选推荐数据的召回推荐数据集以及与所述用户信息对应的历史精选推荐数据集。

例如，所述确定与所述用户信息对应的历史精选推荐数据集还包括：基于所述用户信息对应的至少一个历史访问请求，获取所述至少一个历史访问请求对应的精选推荐数据集；以及基于所述至少一个历史访问请求对应的精选推荐数据集，确定与所述用户信息对应的历史精选推荐数据集。

例如，所述基于所述至少一个历史访问请求对应的精选推荐数据集，确定与所述用户信息对应的历史精选推荐数据集还包括：基于所述用户信息，确定与所述用户信息对应的多个标签，所述多个标签中的每个标签对应于多条候选推荐数据，所述多条候选推荐数据中的每条候选推荐数据为所述用户信息的历史访问请求对应的精选推荐数据集的元素；以及基于所述多个标签，确定与所述多个标签对应的多个候选推荐数据，并将所述多个候选推荐数据添加至所述历史精选推荐数据集。

例如，所述与用户信息对应的多个标签的生成包括：基于所述用户信息对应的历史访问请求，获取所述至少一个历史访问请求对应的精选推荐数据集；基于所述至少一个历史访问请求对应的精选推荐数据集，生成用户推荐数据键值对，所述用户推荐数据键值对以用户标识符为键，以所述至少一个历史访问请求对应的精选推荐数据集中的各个候选推荐数据的各个推荐数据标识符为值；基于所述用户推荐数据键值对，生成用户标签键值对和推荐数据标签键值对，其中，所述用户标签键值对以所述用户标识符为键并以标签为值，所述推荐数据标签键值对以推荐数据标识符为键以所述标签为值。

例如，所述用户标签键值对被存储于实时分布式表格中，所述推荐数据标签键值对被存储于持久化存储器中。

例如，所述确定包括第一数量的候选推荐数据的召回推荐数据集还包括以下各项中的至少一项：响应于所述用户信息与推荐数据数据库中的候选推荐数据的推荐数据匹配信息相匹配，将所述候选推荐数据添加至所述召回推荐数据集；以及响应于所述用户信息对应的第一用户特征向量与所述推荐数据数据库中的候选推荐数据的第一推荐数据特征向量相匹配，将所述候选推荐数据添加至所述召回推荐数据集。

例如，所述确定所述召回推荐数据集中多条候选推荐数据的粗选分数，对所述多条候选推荐数据的粗选分数进行排序以确定包括第二数量的候选推荐数据的粗选推荐数据集还包括：从所述召回推荐数据集中筛选出符合预设条件的多条候选推荐数据，并获取所述符合预设条件的多条候选推荐数据的第二推荐数据特征向量；基于所述用户信息对应的第二用户特征向量以及所述多条候选推荐数据的第二推荐数据特征向量，确定所述符合预设条件的多条候选推荐数据的粗选分数，其中每个粗选分数指示所述第二用户特征向量与多个第二推荐数据特征向量中的一个第二推荐数据特征向量间的距离；以及将所述多条候选推荐数据的粗选分数按照由高到低的顺序进行排序，以确定包括第二数量的候选推荐数据的粗选推荐数据集。

例如，确定所述候选推荐数据集中各条候选推荐数据的精选分数，并对所述候选推荐数据的精选分数进行排序以确定包括第三数量的候选推荐数据的精选推荐数据集还包括：获取所述候选推荐数据集中各条候选推荐数据的第三推荐数据特征向量；基于所述用户信息对应的第三用户特征向量以及所述候选推荐数据集中各条候选推荐数据的第三推荐数据特征向量，确定所述各条候选推荐数据的精选分数，其中，每个精选分数指示基于所述第三用户特征向量而计算的各个第三推荐数据特征向量的排序信息；以及将所述各条候选推荐数据的精选分数按照由高到低的顺序进行排序，以确定包括第三数量的候选推荐数据的精选推荐数据集。

例如，由召回模型确定所述用户信息对应的第一用户特征向量以及所述推荐数据数据库中的候选推荐数据的第一推荐数据特征向量；由粗排模型确定所述用户信息对应的第二用户特征向量以及所述多条候选推荐数据的第二推荐数据特征向量；由精排模型确定所述用户信息对应的第三用户特征向量以及所述候选推荐数据集中各条候选推荐数据的第三推荐数据特征向量；其中，所述第一用户特征向量的信息量低于所述第二用户特征向量的信息量低于所述第三用户特征向量，所述第一推荐数据特征向量的信息量低于第二推荐数据特征向量低于第三推荐数据特征向量。

例如，所述召回模型、所述粗排模型和所述精排模型的训练样本为采样后的实时日志数据，所述实时日志数据包括用户访问请求、以及所述用户访问请求对应的展示数据。

例如，所述第三数量为预设值，所述第二数量为可变值，所述第二数量由所述第三数量与历史精选推荐数据集中的候选推荐数据的数量的差值而确定。

根据本公开实施例的一个方面，提供了一种确定展示数据的装置，包括：召回模块，被配置为从推荐数据数据库中获取包括第一数量的候选推荐数据的召回推荐数据集以及历史精选推荐数据集；粗排模块，被配置为确定所述召回推荐数据集中多条候选推荐数据的粗选分数，对所述多条候选推荐数据的粗选分数进行排序以确定包括第二数量的候选推荐数据的粗选推荐数据集；合并模块，被配置为将所述粗选推荐数据集和所述历史精选推荐数据集进行合并以确定候选推荐数据集；精排模块，被配置为确定所述候选推荐数据集中各条候选推荐数据的精选分数，并对所述候选推荐数据的精选分数进行排序以确定包括第三数量的候选推荐数据的精选推荐数据集；以及展示模块，被配置为基于所述精选推荐数据集，确定用于在显示屏幕上显示的展示数据。

根据本公开实施例的一个方面，提供了一种确定展示数据的装置，包括：一个或多个处理器；以及一个或多个存储器，其中所述存储器中存储有计算机可读代码，所述计算机可读代码在由所述一个或多个处理器运行时，使得所述一个或多个处理器执行如本公开上述各个方面中任一项所述的方法。

根据本公开实施例的另一方面，提供了一种计算机可读存储介质，其上存储有计算机可读指令，所述计算机可读指令在被处理器执行时，使得所述处理器执行如本公开上述各个方面中任一项所述的方法。

根据本公开实施例的另一方面，提供了一种计算机程序产品，其包括计算机可读指令，所述计算机可读指令在被处理器执行时，使得所述处理器执行如本公开上述各个方面中任一项所述的方法。

利用根据本公开上述各个方面的确定展示数据的方法、装置、计算机可读存储介质以及计算机程序产品，能够利用历史精选推荐数据集作为一路新增的推荐数据召回支路，减少了候选推荐数据被误判的可能性，提高推荐数据投放平台确定展示数据的精准度，提高平台收益。

附图说明

通过结合附图对本公开实施例进行更详细的描述，本公开实施例的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解，并且构成说明书的一部分，与本公开实施例一起用于解释本公开，并不构成对本公开的限制。在附图中，相同的参考标号通常代表相同部件或步骤。

图1示出了根据本公开实施例的应用场景的示意图。

图2示出了根据本公开实施例的确定展示数据的方法的流程图。

图3示出了根据本公开实施例的确定展示数据的方法的示意图。

图4示出了根据本公开实施例的部分精选推荐数据集记录的示例。

图5示出了根据本公开实施例的用户标签键值对的示例。

图6示出了根据本公开实施例的推荐数据标签键值对的示例。

图7示出了根据本公开实施例的粗排模型的示意图。

图8示出了根据本公开实施例的示例性计算设备的架构的示意图。

具体实施方式

下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本公开一部分的实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例，都属于本公开保护的范围。

本公开的实施例可以是基于人工智能(Artificial intelligence，AI)的。人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。例如，对于本公开的实施例而言，其能够以类似于人类判断在海量中选择达人/用户感兴趣的商品推荐给达人/用户的方式，向用户推荐某个推荐物。人工智能通过研究各种智能机器的设计原理与实现方法，使本公开实施例具有理解用户行为，并推理和处理用户喜好的功能。人工智能技术涉及领域广泛，既有硬件层面的技术也有软件层面的技术。其中，人工智能软件技术主要包括计算机视觉技术、自然语言处理和机器学习/深度学习、自动驾驶、智慧交通等几大方向。随着人工智能技术研究和进步，人工智能技术在多个领域展开研究和应用，例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服、车联网、自动驾驶、智慧交通等，相信随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值。

此外本公开的实施例还涉及云计算技术。云计算(cloud computing)是一种计算模式，它将计算任务分布(例如，计算多种方案中的每种方案的用户偏好)在大量计算机构成的资源池上，使各种应用系统能够根据需要获取计算力、存储空间和信息服务。提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的，并且可以随时获取，按需使用，随时扩展，按使用付费。

本公开提供了一种确定展示数据的方法、装置、设备、计算机可读存储介质以及计算机程序产品。本公开的实施例利用历史精选推荐数据集作为一路新增的推荐数据召回支路，减少了候选推荐数据被误判的可能性，提高推荐数据投放平台确定展示数据的精准度，提高平台收益。

首先参照图1描述根据本公开实施例的确定展示数据的方法以及相应的装置等的应用场景。图1示出了根据本公开实施例的应用场景100的示意图，其中示意性地示出了服务器110和多个终端120。

根据本公开实施例的确定展示数据的方法以及相应的装置等可以搭载在服务器110上，以确定待展示的推荐数据。这里的服务器110可以是用于确定待展示的推荐数据的独立的服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、定位服务以及大数据和人工智能平台等基础云计算服务的云服务器，本公开实施例对此不作具体限制。多个终端120中的每个终端可以是诸如台式计算机等的固定终端，诸如智能手机、平板电脑、便携式计算机、手持设备、个人数字助理、智能可穿戴设备、车载终端等具有网络功能的移动终端，或者它们的任意组合，本公开实施例对此不作具体限制。

可选地，图1中的多个终端120中的一个或多个可以作为发出用户访问请求的终端。其中，用户访问请求可以是一种页面访问(page view，PV)请求，其指示用户对某个页面的一次访问。服务器110响应于该页面访问请求将向终端120反馈用户请求的页面。该页面上通常包括一个或多个广告位，用于展示推荐数据。例如，推荐数据例如可以是以图片、文字、视频或者其任意组合的方式的信息。例如，假设用户访问请求指示请求播放某个视频。广告位则可以是该视频开头、中间和结尾的贴片广告。贴片广告包括多种形式。通常视频开头的贴片广告被称为前贴片广告，一般90s，每15s一个广告，每个广告是一个贴片。又例如，假设用户访问请求指示请求打开某个软件应用(APP)，广告位则可以是闪屏广告，其为APP打开时出现的广告。本公开的实施例并不限制推荐数据的形式。

服务器110可以作为推荐数据投放平台。例如，在推荐数据投放领域，广告主(advertisers)通常是通过推荐数据投放平台来辅助自身投放其推出的产品相关的推荐数据，从而达到通过曝光大量的推荐数据来吸引用户关注相应产品的目的。

在当前的互联网市场上，按照产品形态的不同，广告主投放的推荐数据可以分为合约广告和竞价广告两种类型。

合约广告就是在预定时间段按照预定价格投放预定数量的推荐数据。合约广告是最早的在线推荐数据售卖方式，它是指媒体和广告主约定在某一时间段内、在某些广告位上固定投放该广告主的广告，相应的结算方式为按照一个时间段进行展示来费用(CostPer Time，简称cpt)，后来又陆续演化出担保式投送(Guaranteed Delivery)，媒体和广告主约定在某一时间段内、在某些广告位上为某些用户投放一定数量的该广告主的推荐数据，相应的结算方式为千次推荐数据展现的费用(Cost Per Mille，简称cpm)，如果媒体投放的推荐数据数量超出了广告主的预定数量，则超出的部分不会被计费，而如果媒体投放的推荐数据数量少于广告主的预定数量，则将需要进行相应的经济赔偿。其中，广告主的预定数量又称为预定量，其是广告主预定推荐数据的曝光量，通常为推荐数据被播放的天数、小时数等等。根据某个推荐数据的预定量还可以计算出该推荐数据的最大可播量、最小应播量、超播量和缺量。其中，最大可播量指示通过预定量计算出的该天最大可播放量；最小应播量指示通过预定量计算出的该天最小应该播放量；超播量指示超过最大可播的播放量；缺量指示少于最小应播的播放量。

竞价广告，又称效果广告，合约广告是指按照广告主的推荐数据出价进行选择性投放的推荐数据。由广告主自主出价，并按照效果计费，常见的计费方式包括按照推荐数据被点击的次数来计费(Cost Per Click，简称cpc)和按照用户行为来计费(cost perAction，简称cpa)，近年来又演化出优化点击付费(Optimized Cost per Click，简称ocpc)和优化行为出价(Optimized Cost per Action，简称ocpa)等形式。与合约广告不同，媒体和效果广告主并未约定推荐数据的投放数量。对于媒体方的流量，效果广告主之间需要出价进行竞争，常见的流量拍卖方式为竞价机制(Generalized Second-Price，简称GSP)。

本公开的实施例不仅适用于合约广告也适用于竞价广告。目前，对于每次推荐数据的曝光，需要依次经过召回、粗排、精排、和展示四个流程，以从所有候选推荐数据中筛选出一个推荐数据展示给用户。其中，召回流程负责找到所有候选推荐数据；粗排流程负责初次筛选候选推荐数据以降低精排流程的处理复杂度；精排流程则负责找到最优推荐数据；展示流程则负责展示该最优推荐数据。然而，粗排流程往往会为了尽快完成对候选推荐数据的筛选而不使用高精度的排序/截断算法，从而导致对一部分候选推荐数据被误判，进而导致推荐数据投放平台不能向用户展示价值更高的推荐数据并获得更高的推荐数据收益。为此，本公开对当前的推荐数据投放平台进行了进一步的改进，以提高推荐数据投放平台确定展示数据的精准度，提高平台收益。

下面参照图2至图3描述根据本公开实施例的确定展示数据的方法。作为一个示例，该方法由上述的服务器或服务器集群中的处理器执行。图2示出了根据本公开实施例的确定展示数据的方法200的流程图。图3示出了根据本公开实施例的确定展示数据的方法200的示意图。

如图2所示，根据本公开实施例的确定展示数据的方法200示例性地包括步骤S210至步骤S250，本公开并不以此为限。方法200可以在服务器110在线时实时执行，以在尽量短的时间响应用户访问请求。

首先，参见图2，在步骤S210中从推荐数据数据库中获取包括第一数量的候选推荐数据的召回推荐数据集以及历史精选推荐数据集。

可选地，所述推荐数据数据库可以是一种云存储(cloud storage)器。云存储以其扩展性强、性价比高、容错性好等优势得到了业界的广泛认同。例如，所述推荐数据数据库还可以是应用在基于云存储的分布式系统(distributed system)。云存储是在云计算概念上延伸和发展出来的一个新的概念，分布式云存储系统(以下简称存储系统)则是指通过集群应用、网格技术以及分布存储文件系统等功能，将网络中大量各种不同类型的存储设备(存储设备也称之为存储节点)通过应用软件或应用接口集合起来协同工作，共同对外提供推荐数据存储和访问功能的一个存储系统。当然，本公开并不以此为限。

可选地，服务器可以基于与用户访问请求对应的用户信息来获取包括第一数量的候选推荐数据的召回推荐数据集以及与所述用户信息对应的历史精选推荐数据集。用户信息包括用于标识用户的用户标识符。通常情况下，用户标识符与用户相关联，其仅用于代表用户的真实存在，并且不能通过用户标识符反推出用户的隐私信息。例如，用户标识可以使用系统内部的序列号、经过掩码处理的设备号、社交标识、或能跨终端标识用户身份的账号等等。

可选地，第一数量可能是一个较大值。当解析出某个用户访问请求对应的响应页面中包括可用于展示数据的广告位时，推荐数据投放系统提供出大量的候选推荐数据作为召回推荐数据集。例如，第一数量可能是5万左右。

参见图3，可以使用召回模块来执行步骤S210。可以以多种方式来确定包括第一数量的候选推荐数据的召回推荐数据集。例如，推荐数据投放系统可以响应于所述用户信息与推荐数据数据库中的候选推荐数据的推荐数据匹配信息相匹配，将所述候选推荐数据添加至所述召回推荐数据集。这样的方式又称为原始定向。广告主会给定一些人群定向，其中每个人群定向指示广告主设定某个推荐数据只给这某类人群播放。比如“上海男性30岁以下人群”就是一个人群定向。或者广告主会给定一些确定的人群包，人群包中的每条数据都是一个用户。或者广告主会给定一个人群范围，其中包括多个关键词，例如，“上海”、“女性”、“30以上”，等等。

又例如，推荐数据投放系统还可以响应于所述用户信息对应的第一用户特征向量与所述推荐数据数据库中的候选推荐数据的第一推荐数据特征向量相匹配，将所述候选推荐数据添加至所述召回推荐数据集。例如，参见图3，可以离线训练一个召回模型。召回模型将用于确定所述用户信息对应的第一用户特征向量以及所述推荐数据数据库中的候选推荐数据的第一推荐数据特征向量，以帮助广告主匹配更适合他的推荐数据的人群。如果当前的用户访问请求是来自该推荐数据感兴趣的用户或高相关性的用户，则可以将这个候选推荐数据添加至上述的召回推荐数据集。

例如，召回模型可以是一种查询(Query)神经网络模型，其用于查询与第一用户特征向量相匹配的第一推荐数据特征向量。随着机器学习的发展，可以使用各种神经网络模型来完成上述的机器学习的任务，例如可以采用深度神经网络(DNN)模型、因子分解机(FM)模型等等。这些神经网络模型可以被实现为无环图，其中神经元布置在不同的层中。通常，神经网络模型包括输入层和输出层，输入层和输出层通过至少一个隐藏层分开。隐藏层将由输入层接收到的输入变换为对在输出层中生成输出有用的表示。网络节点经由边全连接至相邻层中的节点，并且每个层内的节点之间不存在边。在神经网络的输入层的节点处接收的数据经由隐藏层、激活层、池化层、卷积层等中的任意一项被传播至输出层的节点。神经网络模型的输入输出可以采用各种形式，本公开对此不作限制。

为简化召回模型，第一用户特征向量和第一推荐数据特征向量中的信息量可能较少。例如，第一用户特征向量可以包括用户标识符信息、用户地址信息、用户年龄信息、用户性别信息等易获取的信息。例如，第一用户特征向量可以包括多个主成分分析(PAC)维度。PAC维度利用主成分分析方来确定每个用户访问请求的特征维度。PAC维度主要由特征表示，比如某个请求是上海30岁男性，那么他的示例PAC特征就是(上海，男性，30岁)。又例如，第一推荐数据特征向量可以是推荐数据标识符信息、广告主标识符信息、推荐数据投放时间信息、推荐数据定向信息等等。本公开对此不进行限制。

作为一个示例，第一用户特征向量和第一推荐数据特征向量可以被存储于各种检索数据库中。例如，检索数据库可以是近似最近邻(Approximate Nearest Neighbor，ANN)检索数据库。在近似最近邻检索库中可以采取近似最近邻检索的方式快速地找到与查询键相似的一个或多个数据。具体地，近似最近邻检索可以利用海量数据之间形成的簇状聚集分布的特性，通过对数据分析聚类的方法对检索数据库中的第一用户特征向量和第一推荐数据特征向量进行分类或编码。接着，近似最近邻检索可以根据查询键预测其所属的数据类别，返回类别中的部分或全部作为检索结果。可选地，检索数据库可以利用Annoy、Faiss等工具被构建为近似最近邻检索库。当然，还可以使用其他工具来构建近似最近邻检索库，本公开对此不作限制。

继续参考图3，为了避免后续的粗排流程带来的候选推荐数据的准确性的降低，本公开还设计了一个准实时层作为新增的推荐数据召回支路。其中，准实时层记录精排流程对于该用户的历史访问请求曾计算的历史精选推荐数据集。用户的偏好在短时间内并不会改变，因此历史精选推荐数据集中的候选推荐数据往往也适用与该用户本次发送的用户访问请求。例如，用户对于某个app或者某个商品的喜好，不会短时间变化，比如用户A喜欢买裙子，大概率在一段时间之内，裙子和帽子两个推荐数据，推裙子是更优的选择。之后该历史精选推荐数据集将直接进入精排流程，避免这个推荐数据被粗排流程过滤掉。之后将参考图4至图6进一步说明确定历史精选推荐数据集的示例，在此就不再赘述。

接着，在步骤S220中，确定所述召回推荐数据集中多条候选推荐数据的粗选分数，对所述多条候选推荐数据的粗选分数进行排序以确定包括第二数量的候选推荐数据的粗选推荐数据集。在步骤S230中，将所述粗选推荐数据集和所述历史精选推荐数据集进行合并以确定候选推荐数据集。

可选地，第二数量为可变值，所述第二数量至少部分地基于所述历史精选推荐数据集中的候选推荐数据的数量而确定。由于推荐数据系统延迟要求非常严格，在接收到用户访问请求轴，需要在几个毫秒内就要返回一个推荐数据。正如步骤S210中介绍的，第一数量的单位可能是万条。而为了后续的精排流程给出精准推荐，要求精排模型足够复杂，但是复杂带来的就是延迟过高，无法满足毫秒级别的返回要求。通常情况下，精排流程处理的候选推荐数据集的候选推荐数据的数量为预设恒定值，例如300条。因此需要将召回推荐数据集中的候选推荐数据进行进一步筛选，以从几万个候选推荐数据中选出几百个候选推荐数据，以使得粗选推荐数据集与历史精选推荐数据集合并后得到的推荐数据数量为满足上述示例的300条的要求。例如，当用户访问请求到来后，推荐数据投放系统查询该用户信息是否有预存的与所述用户信息对应的历史精选推荐数据集。如果有，召回历史精选推荐数据集，并将所述粗选推荐数据集和所述历史精选推荐数据集进行合并以确定候选推荐数据集，同时会降低粗选推荐数据集对应的第二数量，例如，假设预设的粗选推荐数据集的推荐数据量为300条，现在将其动态调整为290，另外10个是历史精选推荐数据集中的推荐数据。

参考图3，可以使用粗排模块来执行步骤S220，也即执行粗排流程。粗排流程涉及是一套复杂的计算逻辑，其大致可以分为三个子流程。本领域技术人员应当理解这三个子流程不一定是必须的，可以随着业务的不同而不同。

例如，在第一子流程(又称为预选流程)中，推荐数据投放系统可以从所述召回推荐数据集中筛选出符合预设条件的多条候选推荐数据。召回推荐数据集中可能包括一些不合规的候选推荐数据，或者包括一些广告主故意设置的重复推荐数据。比如广告主为了推荐数据获得更多的曝光量，可能会创建大量一样的推荐数据，挤占其他广告主的推荐数据召回空间。在第一子流程中，将过滤掉这些候选推荐数据，以减少后续流程的计算量。

例如，在第二子流程(又称为打分流程)中，推荐数据投放系统可以获取所述符合预设条件的多条候选推荐数据的第二推荐数据特征向量，然后，基于所述用户信息对应的第二用户特征向量以及所述多条候选推荐数据的第二推荐数据特征向量，确定所述符合预设条件的多条候选推荐数据的粗选分数，其中每个粗选分数指示所述第二用户特征向量与多个第二推荐数据特征向量中的一个第二推荐数据特征向量间的距离。可选地，该距离可以是第二用户特征向量和第二推荐数据特征向量之间的内积。此时，将保留300-500个粗选分数最高的候选推荐数据，降低后续流程的压力。

可选地，可以由粗排模型来确定所述用户信息对应的第二用户特征向量以及所述多条候选推荐数据的第二推荐数据特征向量。

例如，所述第二用户特征向量的信息量大于所述第一用户特征向量的信息量。例如，第二用户特征向量可以进一步包括根据用户以往浏览记录得到的用户的兴趣特征，或者用户点击各个对象的频次的特征等。类似地，例如，所述第二推荐数据特征向量的信息量大于所述第一推荐数据特征向量的信息量。所述第二推荐数据特征向量可以进一步包括推荐数据的曝光量特征或点击率特征、推荐数据的标签特征等。作为一个示例，第二用户特征向量和第二推荐数据特征向量也可以被存储于上述各种检索数据库中，本公开对此不进行限制。

粗排模型也可以是一种查询神经网络模型，其可通过多次训练得到。例如，粗排模型可以是一种双塔结构的神经网络模型。参见图7，其示出了一种示例粗排模型。例如，可以进一步地离线训练粗排模型的离线子模型并实时地使用在线子模型。例如，在训练时，可以分别对用户信息和推荐数据信息分别构建两个多层神经网络模型，最后分别输出第二用户特征向量和第二推荐数据特征向量，分别作为该用户和该推荐数据的低维语义表征，然后通过相似度函数如余弦相似度来计算两者的距离，作为粗选分数。在训练时，可以进一步通过计算与训练标签(如是否点击、是否购买、是否下载等)对应的损失，进行后向传播优化上述两个多层神经网络模型参数。作为一个示例，推荐数据投放平台中的服务器可能会通过持续调用用于计算第二推荐数据特征向量的多层神经网络模型来计算第二推荐数据特征向量，并将更新后的第二推荐数据特征向量保存到持久化存储器(例如，HDFS或Faiss)中，供实时查询使用。可选地，推荐数据投放平台针对每个用户访问请求可能实时计算第二用户特征向量，然后将该实时计算的第二用户特征向量作为查询键在上述的持久化存储器中查询粗选分数高的第二推荐数据特征向量。本领域技术人员应当理解，图7仅为示例，随着粗选模型的进一步改进，粗排模型还可以有其它的结构和形式，本公开并不以此为限。

例如，在第三子流程(又称为业务逻辑流程)中，可以根据推荐数据投放平台中预先设置的业务逻辑对上述的300-500个候选推荐数据进行进一步筛选，以筛选出300个左右的、满足广告主各种需求的候选推荐数据。例如，在第三子流程之后，可以确定包括排序靠前的第二数量的候选推荐数据的粗选推荐数据集。

接着，在步骤S240中，确定所述候选推荐数据集中各条候选推荐数据的精选分数，并对所述候选推荐数据的精选分数进行排序以确定包括第三数量的候选推荐数据的精选推荐数据集。可选地，第一数量大于第二数量大于第三数量。

例如，可以使用精排模块/精排模型来执行步骤S240，也即执行精排流程。精排模型一般比较复杂，会从300个候选推荐数据中精选出最优的第三数量的候选推荐数据作为精选集。由于推荐数据投放平台延迟要求非常严格，用户在访问广告位到看到推荐数据要在毫秒级完成，而精排模型为了足够的准确性需要非常复杂，因此，通常情况下，精排模块仅能处理包括至多300条候选推荐数据的候选推荐数据集。

例如，第三数量可以被设置为10(条)。如图3所示，由于从精排流程到展示流程中可能会有一些业务逻辑和人为策略，最终展示的推荐数据不一定是精选模型认为最优的。此外，推荐数据投放平台对同一个用户还有新鲜度控制。例如，如果用户喜欢裙子，推荐数据投放平台不能对该用户一直推送同一裙子(例如，裙子A)的推荐数据，其会导致用户疲劳。因此，推荐数据投放平台往往还会要展示其他的裙子推荐数据(例如裙子B的推荐数据)，即使裙子B的推荐数据的精选分数低于裙子A。当然本公开并不以此为限。

例如，在步骤S240中，推荐数据投放平台可以获取所述候选推荐数据集中各条候选推荐数据的第三推荐数据特征向量；基于所述用户信息对应的第三用户特征向量以及所述候选推荐数据集中各条候选推荐数据的第三推荐数据特征向量，确定所述各条候选推荐数据的精选分数，其中，每个精选分数指示基于所述各个第三用户特征向量而计算的各个第三推荐数据特征向量的排序信息；以及将所述各条候选推荐数据的精选分数按照由高到低的顺序进行排序，以确定包括第三数量的候选推荐数据的精选推荐数据集。例如，所述精选推荐数据集包括排序靠前的第三数量的候选推荐数据。

例如，推荐数据投放平台可以利用精排模型来确定所述用户信息对应的第三用户特征向量以及所述候选推荐数据集中各条候选推荐数据的第三推荐数据特征向量。

例如，为保证精选模型计算的精选分数尽量准确，所述第三用户特征向量的信息量大于所述第二用户特征向量的信息量。例如，第三用户特征向量可以进一步包括根据用户以往浏览记录得到的用户的行为特征，兴趣特征，偏好特征(例如偏好性价比高的产品还是偏好新潮/奢侈的产品)等等。类似地，例如，所述第三推荐数据特征向量的信息量大于所述第二推荐数据特征向量的信息量。所述第三推荐数据特征向量可以进一步包括同一广告主的优先级特征、推荐数据的优惠力度特征、推荐数据的排序特征等。在一些情况下，所述第三用户特征向量/第三推荐数据特征向量的特征空间大于所述第二用户特征向量/第三推荐数据特征向量。精排模型可以是一种排序神经网络模型，其可通过多次训练得到。

例如，精排模型可以是学习排序(learning to rank，LTR)的机器学习模型、点击率(click through rate，CTR)二分类模型、概率模型等的一项或多项的混合。学习排序的机器学习模型可以是PointWise、PairWise和ListWise中的一项或多项的混合。作为一个示例，精排模型可以以上述第三用户特征向量以及候选推荐数据集中的300条候选推荐数据的第三推荐数据特征向量为输入，以这300条候选推荐数据的排序编号为输出。其中，排序编号越靠前的候选推荐数据，精选分数越高。当然，本公开并不以此为限。

作为一个示例，所述召回模型、所述粗排模型和所述精排模型的训练样本为采样后的实时日志数据，所述实时日志数据包括用户访问请求、以及所述用户访问请求对应的展示数据。通常情况下，实时日志数据的数据量非常庞大，需要采样才能存下，一般采样比例为1/256。值得注意的是，所述召回模型、所述粗排模型和所述精排模型的训练样本虽然都是来自于实时日志数据，但是三者在训练过程的使用的日志数据中的字段可能是不同的，并且三者的损失函数的计算方式也可能不同，本公开并不以此为限。

接着，在步骤S250中，基于所述精选推荐数据集，确定用于在显示屏幕上显示的展示数据。可选地，所述展示数据对应于用户访问请求。最后，推荐数据投放系统还可以将该展示数据作为用户访问请求的响应发送给用户终端，最后在用户终端的显示屏幕上进行显示。

可选地，步骤S250中还可以进一步包括根据业务逻辑来进一步筛选出展示数据。例如，针对合约广告，如果精选分数最高的推荐数据的超播量已经大于预定值，那么将不再展示该推荐数据，而是展示精选分数为第二名的推荐数据。有些合约广告可能会采用联投的方式。联投是一种合约广告的预定方式，比如闪屏联投，就是在多个app的闪屏广告位一起投放，预定量为x，所有广告位的播放之和与预定量相等就可以满足合约。那么在一些情况中，如果合约满足，那么某个广告主的推荐数据都不会被选中作为展示数据。

又例如，为了新鲜度控制，还可以对精选推荐数据集中的各个候选推荐数据设置播放概率(Rate)。播放概率是一种控制推荐数据播放的参数。rate＝0.5表示这个推荐数据有50％的几率被展示。针对合约广告，还可以进一步根据合约广告播放概率(Theta)来筛选展示数据。合约广告播放概率可用于表征合约广告播放概率的参数，只在合约广告内部排序使用，比如合约广告A和B都匹配到了某个用户访问请求，A的Theta是0.3，B的Theta是0.6，那么就A的播放概率是0.3，B的播放概率是0.6。Theta可以认为是已知量，计算方式如下：theta＝Dj/Sj，其中Dj是该推荐数据的预定量，Sj是该推荐数据目前的库存量。库存量指的是这个推荐数据能够匹配上的所有用户的访问量。因为用户可能会访问不止一次，用户的每一次访问都会被计入库存。

此外，步骤S250中还可以进一步包括根据应用场景来进一步筛选出展示数据。例如针对基于社交属性的推荐数据投放平台(又称为XQ，其主要包括QQ空间、手机QQ、QQ音乐，全民k歌等推荐数据投放平台)，步骤S250将选中社交属性更强的推荐数据作为展示数据。例如，针对基于新闻属性的推荐数据投放平台(又称为XS，主要包括腾讯新闻，腾讯视频等)，步骤S250将选中新闻属性更强的推荐数据作为展示数据。

又例如，步骤S250还可以根据每千次展示费用、每千次曝光的期望收益和预测点击率中的一项或多项来筛选出展示数据。其中，每千次展示费用(CPM)可以用作一种计算成本的单位，其指示按照千次展示进行推荐数据计费。由于CPM体现了推荐数据每展现给一千个人所需花费的成本，所以又叫千人展现成本。例如媒体方(平台方)展示某个广告位千次将收取广告主10元，则CPM＝10。每千次曝光的期望收益(expected cost pert mile，ECPM)可以用作一种计算收益的单位，其指示推荐数据被千次展示后得到的收入。由于ECPM体现了推荐数据每展现给一千个人所得到的收益，所以又叫千人展现收益。例如，如果某个推荐数据千次曝光后广告主的收益为40元，则ECPM＝40。预测点击率(Pctr)指的是预测一个推荐数据被用户点击的概率。每个推荐数据对每个用户访问请求都会有一个不同的pctr。

本领域技术人员应当理解上述描述仅是步骤S250的一些示例，本公开并不限于此。

对应地，根据本公开实施例的一个方面，还提供了一种确定展示数据的装置，包括：召回模块，被配置为从推荐数据数据库中获取包括第一数量的候选推荐数据的召回推荐数据集以及历史精选推荐数据集；粗排模块，被配置为确定所述召回推荐数据集中多条候选推荐数据的粗选分数，对所述多条候选推荐数据的粗选分数进行排序以确定包括第二数量的候选推荐数据的粗选推荐数据集；合并模块，被配置为将所述粗选推荐数据集和所述历史精选推荐数据集进行合并以确定候选推荐数据集；精排模块，被配置为确定所述候选推荐数据集中各条候选推荐数据的精选分数，并对所述候选推荐数据的精选分数进行排序以确定包括第三数量的候选推荐数据的精选推荐数据集，以及展示模块，被配置为基于所述精选推荐数据集，确定用于在显示屏幕上显示的展示数据。可选地，第一数量大于第二数量大于第三数量。

接下来参考图4至图6进一步描述步骤S210中获取历史精选推荐数据集的方法。图4示出了根据本公开实施例的部分精选推荐数据集记录的示例。图5示出了根据本公开实施例的用户标签键值对的示例。图6示出了根据本公开实施例的推荐数据标签键值对的示例。

由于用户访问请求、用户信息、候选推荐数据、精选推荐数据集等数据往往是海量的，上述步骤S210可以进一步采取大数据(Big data)技术。例如可以通过Spark、Hadoop、MPI等大数据处理框架，整合推荐数据和成交数据，得到转化数据。大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。随着云时代的来临，大数据也吸引了越来越多的关注。基于大数据需要特殊的技术，以有效地实施本实施例所提供的媒体信息处理方法，其中适用于大数据的技术，包括大规模并行处理数据库、数据挖掘、分布式文件系统、分布式数据库、以及云计算等。

例如，步骤S210可以进一步包括：基于所述用户信息对应的至少一个历史访问请求，获取所述至少一个历史访问请求对应的精选推荐数据集；以及基于所述至少一个历史访问请求对应的精选推荐数据集，确定与所述用户信息对应的历史精选推荐数据集。

参见图4，每个历史访问请求(以访问请求标识符标识)经过精选模块后都将得到精选推荐数据集。作为示例，精选推荐数据集中记录了每个候选推荐数据的推荐数据标识符。作为一个示例，所述历史精选推荐数据集也可以被确定为距离本次用户访问请求的提交时间最近的多个(例如10个)历史访问请求对应的展示数据。例如，对于用户USER1而言，距离本次用户访问请求的提交时间最近的历史访问请求包括QUERY1和QUERY2。其中QUERY1对应的展示数据可能是精选分数排名第5的AD5，QUERY2对应的展示数据可能是精选分数排名第1的AD3。那么在该示例中，AD3和AD5均会被确定为所述用户信息对应的历史精选推荐数据集的元素。

然而，考虑到从精排流程到展示流程可能会有一些业务逻辑和人为策略，最终展示的不一定是精排模型认为最优的。另外，考虑到新鲜度控制，推荐数据投放平台也不会一直展示相同的推荐数据。因此，作为另一个示例，所述历史精选推荐数据集还可以直接被确定为距离本次用户访问请求的提交时间最近的多个(例如10个)历史访问请求对应的精选推荐数据集，每个精选推荐数据集中包括多个(例如10个)候选推荐数据。例如，对于用户USER1而言，距离本次用户访问请求的提交时间最近的历史访问请求包括QUERY1和QUERY2。其中QUERY1对应的候选推荐数据包括AD1、AD2、AD3、AD4、AD5…，QUERY2对应候选推荐数据包括AD3、AD4、AD5、AD6、AD7…。那么在该示例中，AD1、AD2、AD3、AD4、AD5、AD6和AD7均会被确定为所述用户信息对应的历史精选推荐数据集的元素。值得注意的是，在实际应用过程，需要对历史精选推荐数据集进行去重处理，以减少运算量。

例如，为了便于后续可能的用户画像、推荐数据画像和业务逻辑并减少存储器的存储压力，所述基于所述至少一个历史访问请求对应的精选推荐数据集，确定与所述用户信息对应的历史精选推荐数据集还包括：基于所述用户信息，确定与所述用户信息对应的多个标签，所述多个标签中的每个标签对应于多条候选推荐数据，所述多条候选推荐数据中的每条候选推荐数据为所述用户信息的历史访问请求对应的精选推荐数据集的元素；以及基于所述多个标签，确定与所述多个标签对应的多个候选推荐数据，并将所述多个候选推荐数据添加至所述历史精选推荐数据集。

图4所示的存储表格对于大数据平台而言往往是难以存储和解析的。参考图5和图6的示例，其示出了根据图4的表格而生成的用户对应的标签信息(以表格的形式示出)以及推荐数据对应的标签信息。

例如，可以对图4中的表格进行进一步的数据挖掘以生成用户对应的标签和推荐数据对应的标签。例如，可以使用神经网络模型来对应地生成图5和图6所示的表格中的标签，每个标签用于表征某个用户与可能作为精选推荐数据集中的候选推荐数据的对应关系。其中，每个标签既可以对应多个候选推荐数据，也可以对应多个用户。

例如，为简化处理流程，可以进一步以以下方式来生成图5和图6中的标签。例如，所述与用户信息对应的多个标签的生成包括：基于所述用户信息对应的历史访问请求，获取所述至少一个历史访问请求对应的精选推荐数据集；基于所述至少一个历史访问请求对应的精选推荐数据集，生成用户推荐数据键值对，所述用户推荐数据键值对以用户标识符为键，以所述至少一个历史访问请求对应的精选推荐数据集中的各个候选推荐数据的各个推荐数据标识符为值；基于所述用户推荐数据键值对，生成用户标签键值对和推荐数据标签键值对，其中，所述用户标签键值对以所述用户标识符为键并以标签为值，所述推荐数据标签键值对以推荐数据标识符为键以所述标签为值。

参见图4，每个历史访问请求都会得到一个用户推荐数据键值对。例如，针对QUREY1，可以得到用户推荐数据键值对{USER1：[AD1、AD2、AD3、AD4、AD5…]}；针对QUREY2，可以得到用户推荐数据键值对{USER1：[AD3、AD4、AD5、AD6、AD7…]}；针对QUREY3，可以得到用户推荐数据键值对{USER2：[AD1、AD2、AD3、AD4、AD6…]}；等等。

然后，可以将QUERY1中的USER1和AD1、AD2、AD3、AD4、AD5…均打上标签TAG1。由此，得到了用户标签键值对{USER1：TAG1}和推荐数据标签键值对{AD1：TAG1}、{AD2：TAG1}、{AD3：TAG1}、{AD4：TAG1}、{AD5：TAG1}。然后将QUERY2中的USER1和AD3、AD4、AD5、AD6、AD7…均打上标签TAG2，然后将上述标签与QUERY1对应的用户标签键值对进行整合，可以得到用户标签键值对{USER1：[TAG1、TAG2]}和{AD1：TAG1}、{AD2：TAG1}、{AD3：[TAG1,TAG2]}、{AD4：[TAG1,TAG2]}、{AD5：[TAG1,TAG2]}、{AD6：TAG2}、{AD7：TAG2}。以类似地处理QUERY3，即可得到图5和图6中的用户标签信息和推荐数据标签信息对应的用户标签键值对和推荐数据标签键值对。

通过上述方案，推荐数据投放平台可以将图4中以用户标识符来查询推荐数据标识符的方式转换为，以用户标识符来查询标签和以推荐数据标识符来查询标签，推荐数据标识符和用户标识符通过一个标签关联，可以进一步应用于更多种场景。例如，在并行处理多个不同的用户的访问请求时，如果多个用户都具有相同的标签，那么推荐数据投放平台就可以很快的召回同一批推荐数据。如果一个推荐数据被匹配上多个用户，也可以据此进一步挖掘推荐数据的匹配和定向信息。如果一个用户向召回多个推荐数据，仅依靠一个标签就可以直接返回多个推荐数据。

例如，所述用户标签键值对可以被存储于实时分布式表格中。实时分布式表格例如是HIVE，其可以较快的更新和查询，因此推荐数据投放系统将更新频繁的用户标签键值对存放于此。又例如，所述推荐数据标签键值对可以被存储于持久化存储器中。持久化存储器例如是HDFS中，其支持的量非常大，但是更新不够迅速，查询速度较慢，因此推荐数据投放系统将更新不那么频繁的推荐数据标签键值对存放于此。

由此，本公开的实施例利用历史精选推荐数据集作为一路新增的推荐数据召回支路，减少了候选推荐数据被误判的可能性，提高推荐数据投放平台确定展示数据的精准度，提高平台收益。此外，本公开还进一步提高了运算速度、减少了存储器对应的存储压力。

如图8所示，计算设备1100可以包括总线1110、一个或多个CPU 1120、只读存储器(ROM)1130、随机存取存储器(RAM)1140、连接到网络的通信端口1150、输入/输出组件1160、硬盘1170等。计算设备1100中的存储设备，例如ROM 1130或硬盘1170可以存储计算机处理和/或通信使用的各种数据或文件以及CPU所执行的程序指令。计算设备1100还可以包括用户界面1180。当然，图8所示的架构只是示例性的，在实现不同的设备时，根据实际需要，可以省略图8示出的计算设备中的一个或多个组件。

本公开的实施例也可以被实现为计算机可读存储介质。根据本公开实施例的计算机可读存储介质上存储有计算机可读指令。当计算机可读指令由处理器运行时，可以执行参照以上附图描述的根据本公开实施例的推荐信息处理方法以及推荐信息排序方法。计算机可读存储介质包括但不限于例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。

根据本公开的实施例，还提供了一种计算机程序产品或计算机程序，该计算机程序产品或者计算机程序包括计算机可读指令，该计算机可读指令存储在计算机可读存储介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机可读指令，处理器执行该计算机可读指令，使得该计算机设备执行上述各个实施例中描述的方法。

本公开实施例的一个方面，还提供了一种确定展示数据的装置，包括：一个或多个处理器；以及一个或多个存储器，其中所述存储器中存储有计算机可读代码，所述计算机可读代码在由所述一个或多个处理器运行时，使得所述一个或多个处理器执行如本公开上述各个方面中任一项所述的方法。

根据本公开实施例的另一方面，还提供了一种计算机可读存储介质，其上存储有计算机可读指令，所述计算机可读指令在被处理器执行时，使得所述处理器执行如本公开上述各个方面中任一项所述的方法。

根据本公开实施例的另一方面，还提供了一种计算机程序产品，其包括计算机可读指令，所述计算机可读指令在被处理器执行时，使得所述处理器执行如本公开上述各个方面中任一项所述的方法。

本领域技术人员能够理解，本公开所披露的内容可以出现多种变型和改进。例如，以上所描述的各种设备或组件可以通过硬件实现，也可以通过软件、固件、或者三者中的一些或全部的组合实现。此外，如本公开和权利要求书中所示，除非上下文明确提示例外情形，“一”、“一个”、“一种”和/或“该”等词并非特指单数，也可包括复数。本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性，而只是用来区分不同的组成部分。同样，“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同，而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接，而是可以包括电性的连接，不管是直接的还是间接的。

此外，本公开中使用了流程图用来说明根据本公开实施例的实施例的系统所执行的操作。应当理解的是，前面或下面操作不一定按照顺序来精确地执行。相反，可以按照倒序或同时处理各种步骤。同时，也可以将其他操作叠加到这些过程中，或从这些过程移除某一步或数步操作。

除非另有定义，这里使用的所有术语(包括技术和科学术语)具有与本公开所属领域的普通技术人员共同理解的相同含义。还应当理解，诸如在通常字典里定义的那些术语应当被解释为具有与它们在相关技术的上下文中的含义相一致的含义，而不应用理想化或极度形式化的意义来解释，除非这里明确地这样定义。

以上对本公开进行了详细说明，但对于本领域技术人员而言，显然，本公开并非限定于本说明书中说明的实施方式。本公开在不脱离由权利要求书的记载所确定的本公开的宗旨和范围的前提下，可以作为修改和变更方式来实施。因此，本说明书的记载是以示例说明为目的，对本公开而言并非具有任何限制性的意义。

Claims

1.一种确定展示数据的方法，其由处理器执行，所述方法包括：

从推荐数据数据库中获取包括第一数量的候选推荐数据的召回推荐数据集以及历史精选推荐数据集；

确定所述召回推荐数据集中多条候选推荐数据的粗选分数，对所述多条候选推荐数据的粗选分数进行排序以确定包括第二数量的候选推荐数据的粗选推荐数据集；

将所述粗选推荐数据集和所述历史精选推荐数据集进行合并以确定候选推荐数据集；

确定所述候选推荐数据集中各条候选推荐数据的精选分数，并对所述候选推荐数据的精选分数进行排序以确定包括第三数量的候选推荐数据的精选推荐数据集；以及

基于所述精选推荐数据集，确定用于在显示屏幕上显示的展示数据。

2.如权利要求1所述的方法，其中，所述展示数据对应于用户访问请求，所述获取包括第一数量的候选推荐数据的召回推荐数据集以及历史精选推荐数据集还包括：

基于与用户访问请求对应的用户信息，获取包括第一数量的候选推荐数据的召回推荐数据集以及与所述用户信息对应的历史精选推荐数据集。

3.如权利要求2所述的方法，其中，所述确定历史精选推荐数据集还包括：

基于所述用户信息对应的至少一个历史访问请求，获取所述至少一个历史访问请求对应的精选推荐数据集；以及

基于所述至少一个历史访问请求对应的精选推荐数据集，确定与所述用户信息对应的历史精选推荐数据集。

4.如权利要求3所述的方法，其中，所述基于所述至少一个历史访问请求对应的精选推荐数据集，确定与所述用户信息对应的历史精选推荐数据集还包括：

基于所述用户信息，确定与所述用户信息对应的多个标签，所述多个标签中的每个标签对应于多条候选推荐数据，所述多条候选推荐数据中的每条候选推荐数据为所述用户信息的历史访问请求对应的精选推荐数据集的元素；以及

基于所述多个标签，确定与所述多个标签对应的多个候选推荐数据，并将所述多个候选推荐数据添加至所述历史精选推荐数据集。

5.如权利要求4所述的方法，其中，所述与用户信息对应的多个标签的生成包括：

基于所述用户信息对应的历史访问请求，获取所述至少一个历史访问请求对应的精选推荐数据集；

基于所述至少一个历史访问请求对应的精选推荐数据集，生成用户推荐数据键值对，所述用户推荐数据键值对以用户标识符为键，以所述至少一个历史访问请求对应的精选推荐数据集中的各个候选推荐数据的各个推荐数据标识符为值；

基于所述用户推荐数据键值对，生成用户标签键值对和推荐数据标签键值对，其中，所述用户标签键值对以所述用户标识符为键并以标签为值，所述推荐数据标签键值对以推荐数据标识符为键以所述标签为值。

6.如权利要求5所述的方法，其中，所述用户标签键值对被存储于实时分布式表格中，所述推荐数据标签键值对被存储于持久化存储器中。

7.如权利要求2所述的方法，其中，所述获取包括第一数量的候选推荐数据的召回推荐数据集还包括以下各项中的至少一项：

响应于所述用户信息与推荐数据数据库中的候选推荐数据的推荐数据匹配信息相匹配，将所述候选推荐数据添加至所述召回推荐数据集；以及

响应于所述用户信息对应的第一用户特征向量与所述推荐数据数据库中的候选推荐数据的第一推荐数据特征向量相匹配，将所述候选推荐数据添加至所述召回推荐数据集。

8.如权利要求7所述的方法，其中，所述确定所述召回推荐数据集中多条候选推荐数据的粗选分数，对所述多条候选推荐数据的粗选分数进行排序以确定包括第二数量的候选推荐数据的粗选推荐数据集还包括：

从所述召回推荐数据集中筛选出符合预设条件的多条候选推荐数据，并获取所述符合预设条件的多条候选推荐数据的第二推荐数据特征向量；

基于所述用户信息对应的第二用户特征向量以及所述多条候选推荐数据的第二推荐数据特征向量，确定所述符合预设条件的多条候选推荐数据的粗选分数，其中每个粗选分数指示所述第二用户特征向量与多个第二推荐数据特征向量中的一个第二推荐数据特征向量间的距离；以及

将所述多条候选推荐数据的粗选分数按照由高到低的顺序进行排序，以确定包括第二数量的候选推荐数据的粗选推荐数据集。

9.如权利要求8所述的方法，其中，确定所述候选推荐数据集中各条候选推荐数据的精选分数，并对所述候选推荐数据的精选分数进行排序以确定包括第三数量的候选推荐数据的精选推荐数据集还包括：

获取所述候选推荐数据集中各条候选推荐数据的第三推荐数据特征向量；

基于所述用户信息对应的第三用户特征向量以及所述候选推荐数据集中各条候选推荐数据的第三推荐数据特征向量，确定所述各条候选推荐数据的精选分数，其中，每个精选分数指示基于所述各条第三用户特征向量而计算的各个第三推荐数据特征向量的排序信息；以及

将所述各条候选推荐数据的精选分数按照由高到低的顺序进行排序，以确定包括第三数量的候选推荐数据的精选推荐数据集。

10.如权利要求9所述的方法，其中，

由召回模型确定所述用户信息对应的第一用户特征向量以及所述推荐数据数据库中的候选推荐数据的第一推荐数据特征向量；

由粗排模型确定所述用户信息对应的第二用户特征向量以及所述多条候选推荐数据的第二推荐数据特征向量；

由精排模型确定所述用户信息对应的第三用户特征向量以及所述候选推荐数据集中各条候选推荐数据的第三推荐数据特征向量；

其中，所述第一用户特征向量的信息量低于所述第二用户特征向量的信息量低于所述第三用户特征向量的信息量，所述第一推荐数据特征向量的信息量低于第二推荐数据特征向量低于第三推荐数据特征向量。

11.如权利要求10所述的方法，其中，所述召回模型、所述粗排模型和所述精排模型的训练样本为采样后的实时日志数据，所述实时日志数据包括用户访问请求、以及所述用户访问请求对应的展示数据。

12.如权利要求1所述的方法，其中，所述第二数量为可变值，所述第二数量至少部分地基于所述历史精选推荐数据集中的候选推荐数据的数量而确定。

13.一种确定展示数据的装置，包括：

召回模块，被配置为从推荐数据数据库中获取包括第一数量的候选推荐数据的召回推荐数据集以及历史精选推荐数据集；

粗排模块，被配置为确定所述召回推荐数据集中多条候选推荐数据的粗选分数，对所述多条候选推荐数据的粗选分数进行排序以确定包括第二数量的候选推荐数据的粗选推荐数据集；

合并模块，被配置为将所述粗选推荐数据集和所述历史精选推荐数据集进行合并以确定候选推荐数据集；

精排模块，被配置为确定所述候选推荐数据集中各条候选推荐数据的精选分数，并对所述候选推荐数据的精选分数进行排序以确定包括第三数量的候选推荐数据的精选推荐数据集；以及

展示模块，被配置为基于所述精选推荐数据集，确定用于在显示屏幕上显示的展示数据。

14.一种确定展示数据的装置，包括：

一个或多个处理器；以及

一个或多个存储器，其中所述存储器中存储有计算机可读代码，所述计算机可读代码在由所述一个或多个处理器运行时，使得所述一个或多个处理器执行如权利要求1-12中任一项所述的方法。

15.一种计算机可读存储介质，其上存储有计算机可读指令，所述计算机可读指令在被处理器执行时，使得所述处理器执行如权利要求1-12中任一项所述的方法。

16.一种计算机程序产品，其包括计算机可读指令，所述计算机可读指令在被处理器执行时，使得所述处理器执行如权利要求1-12中任一项所述的方法。