CN117994002A - 多路召回方法及设备 - Google Patents

多路召回方法及设备 Download PDF

Info

Publication number
CN117994002A
CN117994002A CN202410163583.3A CN202410163583A CN117994002A CN 117994002 A CN117994002 A CN 117994002A CN 202410163583 A CN202410163583 A CN 202410163583A CN 117994002 A CN117994002 A CN 117994002A
Authority
CN
China
Prior art keywords
recall
user
results
scene
recommended
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410163583.3A
Other languages
English (en)
Inventor
郭进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202410163583.3A priority Critical patent/CN117994002A/zh
Publication of CN117994002A publication Critical patent/CN117994002A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书实施例提供的多路召回方法及设备,响应于用户针对待推荐场景的访问请求,确定与用户对应的待推荐场景的多路召回策略中各路召回策略的召回参数,各路召回策略的召回参数通过对照实验确定;基于各路召回策略对应的召回参数,获取与用户对应的待推荐场景的各路召回策略的召回结果;在待推荐场景下展示各路召回策略的召回结果。根据本说明书实施例的技术方案,能够针对用户科学合理地设置各路召回策略的召回比例,从而能够提高召回的转化率以及推荐的准确性。

Description

多路召回方法及设备
技术领域
本说明书涉及互联网技术领域,尤其涉及一种多路召回方法及多路召回设备。
背景技术
随着互联网技术的发展,越来越多的用户通过网络平台进行各种业务活动例如购物或观看多媒体等。因此,如何从海量的商品或服务中寻找出用户感兴趣的内容成为了关注的焦点。
在相关技术方案中,在推荐系统中通过召回的方式帮助用户在大型物料库中快速找到感兴趣的内容,例如,采用随机召回的方式从物料库中选择部分用户可能感兴趣的物品。然而,随机召回没有考虑用户兴趣的多样性,召回的物品可能不是用户感兴趣的物品,导致召回的转化率低。
背景技术部分的内容仅仅是发明人个人所知晓的信息,并不代表上述信息在本公开申请日之前已经进入公共领域,也不代表其可以成为本公开的现有技术。
发明内容
本说明书提供一种多路召回方法和设备,能够科学合理地设置多路召回中各路召回策略的召回比例,进而提高召回的转化率。
第一方面,本说明书提供一种多路召回方法,包括:
响应于用户针对待推荐场景的访问请求,确定与所述用户对应的所述待推荐场景的多路召回策略中各路所述召回策略的召回参数,其中,各路所述召回策略的所述召回参数通过对照实验确定;
基于各路所述召回策略对应的所述召回参数,获取与所述用户对应的所述待推荐场景的各路所述召回策略的召回结果;
在所述待推荐场景下展示各路所述召回策略的所述召回结果。
在一些示例实施例中,基于上述方案,所述对照实验包括对照组和实验组,所述方法还包括:
通过所述对照实验确定所述对照组的对照观测指标的指标值和所述实验组的实验观测指标的指标值,所述对照观测指标和所述实验观测指标具有相同的观测指标;
基于所述对照观测指标与所述实验观测指标之间的指标值差值,调整所述待推荐场景的各路所述召回策略的所述召回参数。
在一些示例实施例中,基于上述方案,所述通过所述对照实验确定所述对照组的对照观测指标的指标值和所述实验组的实验观测指标的指标值,包括:
确定所述对照组对应的对照分桶和所述实验组的实验分桶;
基于所述对照分桶和所述实验分桶对应的请求流量,分别对所述对照组的所述对照观测指标的指标值和所述实验组的所述实验观测指标的指标值进行统计。
在一些示例实施例中,基于上述方案,所述基于所述对照观测指标与所述实验观测指标之间的指标值差值,调整所述待推荐场景的各路所述召回策略的所述召回参数,包括:
确定所述对照组对应的各路所述召回策略的召回参数和所述实验组对应的各路所述召回策略的召回参数之间的参数差值;
基于所述参数差值与所述指标值差值,调整所述待推荐场景的各路所述召回策略的所述召回参数。
在一些示例实施例中,基于上述方案,所述基于各路所述召回策略对应的所述召回参数,获取与所述用户对应的所述待推荐场景的各路所述召回策略的召回结果,包括:
基于各路所述召回策略对应的所述召回参数,从分布式缓存中获取预先存储的与所述用户对应的所述待推荐场景的各路所述召回策略的离线召回结果。
在一些示例实施例中,基于上述方案,在所述获取与所述用户对应的所述待推荐场景的各路所述召回策略的召回结果之前,所述方法还包括:
基于所述用户的用户特征和权益特征,通过定时任务调度的方式离线执行多路召回策略,得到与所述用户对应的所述待推荐场景的各路所述召回策略的所述离线召回结果;
将与所述用户对应的所述待推荐场景的各路所述召回策略的所述离线召回结果存储到所述分布式缓存。
在一些示例实施例中,基于上述方案,所述将与所述用户对应的所述待推荐场景的各路所述召回策略的所述离线召回结果存储到所述分布式缓存,包括:
对所述用户对应的所述待推荐场景的各路所述召回策略的所述离线召回结果进行分组打标,其中,每个所述召回策略的所述离线召回结果中各召回项的分组标记相同;
将打标后的各路所述召回策略的所述离线召回结果以键值对的形式存储到所述分布式缓存。
在一些示例实施例中,基于上述方案,所述从分布式缓存中获取预先存储的与所述用户对应的所述待推荐场景的各路所述召回策略的离线召回结果,包括:
基于所述用户的用户标识、所述待推荐场景的标识以及各路所述召回策略的分组标记,从所述分布式缓存中获取预先存储的与所述用户对应的所述待推荐场景的各路所述召回策略的离线召回结果。
在一些示例实施例中,基于上述方案,各路所述召回策略对应的所述召回参数包括各路所述召回策略对应的召回比例。
在一些示例实施例中,基于上述方案,在所述获取与所述用户对应的所述待推荐场景的各路所述召回策略的召回结果之后,所述方法还包括:
针对各路所述召回策略构建召回过滤条件;
基于所述召回过滤条件对各路所述召回策略的所述召回结果进行过滤,将过滤结果作为各路所述召回策略的召回结果。
在一些示例实施例中,基于上述方案,在所述待推荐场景下展示各路所述召回策略的所述召回结果之前,所述方法还包括:
对各路所述召回策略的召回结果添加扩展信息,所述扩展信息包括召回策略标识和权益信息。
在一些示例实施例中,基于上述方案,所述方法还包括:
基于所述用户的用户特征、权益特征以及所述扩展信息,对各路所述召回策略的所述召回结果进行打分;
根据打分结果对各路所述召回策略的所述召回结果进行排序。
第二方面,本说明书还提供一种多路召回设备,包括:至少一个存储介质,存储有至少一个指令集,用于进行多路召回处理;以及至少一个处理器,同所述至少一个存储介质通信连接,其中,当所述多路召回设备运行时,所述至少一个处理器读取所述至少一个指令集,并且根据所述至少一个指令集的指示执行本说明书第一方面所述的多路召回方法。
由以上技术方案可知,本说明书实施例提供的多路召回方法和设备,一方面,通过对照实验确定用户对应的待推荐场景的各路召回策略的召回参数,能够针对用户科学合理地设置多路召回中各路召回策略的召回比例;另一方面,基于各路召回策略对应的召回参数,获取与用户对应的待推荐场景的各路召回策略的召回结果,对召回结果进行排序并展示,由于能够针对用户科学合理地设置多路召回中各路召回策略的召回比例,从而能够提高召回的转化率以及推荐的准确性。
本说明书提供的多路召回方法和设备的其他功能将在以下说明中部分列出。根据描述,以下数字和示例介绍的内容将对那些本领域的普通技术人员显而易见。本说明书提供的多路召回方法和设备的创造性方面可以通过实践或使用下面详细示例中所述的方法、装置和组合得到充分解释。
附图说明
为了更清楚地说明本说明书实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本说明书实施例提供的一种多路召回方法的实施环境的示意图;
图2示出了根据本说明书的实施例提供的一种多路召回设备200的硬件结构图;
图3示出了根据本说明书的一些实施例提供的一种多路召回方法的流程图;
图4示出了根据本说明书的一些实施例提供的显示各路召回策略的召回结果的示意图;
图5示出了根据本说明书的一些实施例提供的确定召回策略的召回参数的流程示意图;
图6示出了根据本说明书的实施例提供的离线召回处理的流程示意图;以及
图7示出了根据本说明书的一些实施例提供的多路召回方法的软件架构示意图。
具体实施方式
以下描述提供了本说明书的特定应用场景和要求,目的是使本领域技术人员能够制造和使用本说明书中的内容。对于本领域技术人员来说,对所公开的实施例的各种局部修改是显而易见的,并且在不脱离本说明书的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用。因此,本说明书不限于所示的实施例,而是与权利要求一致的最宽范围。
这里使用的术语仅用于描述特定示例实施例的目的,而不是限制性的。比如,除非上下文另有明确说明,这里所使用的,单数形式“一”,“一个”和“该”也可以包括复数形式。当在本说明书中使用时,术语“包括”、“包含”和/或“含有”意思是指所关联的整数,步骤、操作、元素和/或组件存在,但不排除一个或多个其他特征、整数、步骤、操作、元素、组件和/或组的存在或在该系统/方法中可以添加其他特征、整数、步骤、操作、元素、组件和/或组。
考虑到以下描述,本说明书的这些特征和其他特征、以及结构的相关元件的操作和功能、以及部件的组合和制造的经济性可以得到明显提高。参考附图,所有这些形成本说明书的一部分。然而,应该清楚地理解,附图仅用于说明和描述的目的,并不旨在限制本说明书的范围。还应理解,附图未按比例绘制。
本说明书中使用的流程图示出了根据本说明书中的一些实施例的系统实现的操作。应该清楚地理解,流程图的操作可以不按顺序实现。相反,操作可以以反转顺序或同时实现。此外,可以向流程图添加一个或多个其他操作。可以从流程图中移除一个或多个操作。
首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
物料库:包括大量待推荐的物料(如商品、权益或服务等)数据的数据库。
召回:采用召回模型从海量物料库中选择部分用户可能感兴趣的物品或品项(一般称为Item)。
召回策略:一种在推荐系统中用于获取用户感兴趣的物品或项目的策略,主要用于从大量数据中筛选出可能符合用户兴趣的物品,召回策略一般包括功能性召回策略、热门召回策略、业务召回策略以及个性化召回策略等。
粗排:采用较为复杂的排序模型对召回的项目Item进行排序,而后选择排序在前的N个项目Item进入精排环节。
精排:通过复杂的排序模型对粗排后选取的N个项目Item进行打分排序,取排序在前的M个项目Item进入重排环节。
重排:考虑新颖性、多样性、时效性、商业收益等多个条件,对精排结果进行重排。
在相关技术方案中,采用多路召回的方式从物料库中选择用户可能感兴趣的物品,即针对每次访问请求,基于召回总链路数限制、用户特征及行为序列构建多个召回条件,同时执行多个召回条件进行多路召回,然后合并召回结果。例如,多路召回包括以下步骤:步骤-1.数据准备及预处理:采集、处理用户特征、用户历史行为、待召回的物料特征等数据。步骤-2.构建N个召回策略执行召回。N个召回策略所采用的召回方法通常包括热门召回、协同过滤召回、深度网络召回、相似召回等。步骤-3.结果合并,即将N个召回策略召回的结果合并,得到召回结果集。然而,在这种技术方案中,各路召回策略的召回比例主要依靠经验预先设置,没有科学的依据。举例而言,假设有A、B、C、D、E共5个召回策略,总共需召回100个物品,那么,每一召回策略召回多少个物品通常根据业务场景和业务目标来人为指定,不合适再调整,缺乏科学依据。
基于上述内容,本说明书实施例提供了一种多路召回方法和多路召回设备,一方面,通过对照实验确定用户对应的待推荐场景的各路召回策略的召回参数,能够针对用户科学合理地设置多路召回中各路召回策略的召回比例;另一方面,基于各路召回策略对应的召回参数,获取与用户对应的待推荐场景的各路召回策略的召回结果,对召回结果进行排序并展示,由于能够针对用户科学合理地设置多路召回中各路召回策略的召回比例,从而能够提高召回的转化率以及推荐的准确性。
下面,将结合附图对本说明书实施例的技术方案进行详细的说明。
图1示出了本说明书实施例提供的一种多路召回方法的实施环境的示意图。
参见图1所示,该实施环境100可以包括终端110、服务器130以及数据库140。
终端110通过无线网络或有线网络120与服务器130相连。终端110可以是平板电脑、笔记本电脑或台式计算机等,但并不局限于此。
终端110可以存储有执行本说明书描述的多路召回方法的数据或指令。终端110可以包括具有数据信息处理能力的硬件设备和驱动该硬件设备工作所需必要的程序。
服务器130是独立的物理服务器,或者是多个物理服务器构成的服务器集群或者分布式系统,或者是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、分发网络(Content Delivery Network,CDN),以及大数据和人工智能平台等基础云计算服务的云服务器等。服务器130为终端110上运行的应用程序提供后台服务。
服务器130上搭载有集成开发平台。集成开发平台,也称集成开发环境(IDE,Integrated Development Environment),集成开发平台是用于提供程序开发环境的应用程序,一般包括代码编辑器、编译器、调试器和图形用户界面等工具。开发人员可以在集成开发平台上进行程序代码的编写(即程序开发)。集成开发平台服务器可以是集成开发平台专门用来实施多路召回方法的计算设备。服务器130可以分别与终端110以及数据库140进行数据通信。
此外,服务器130可以存储有执行本说明书描述的多路召回方法的数据或指令。服务器130可以包括具有数据信息处理能力的硬件设备和驱动该硬件设备工作所需必要的程序。当然,服务器130也可以仅为具有数据处理能力的硬件设备,或者,仅为运行在硬件设备中的程序。在一些实施例中,服务器130也可以作为插件,并部署在终端110,此时,服务器130存储有执行本说明书描述的终端110对应的多路召回方法的数据或指令。
数据库140可以存储数据和/或指令。在一些实施例中,数据库140可以存储离线得到的待推荐场景对应的各路召回策略的召回结果。在另一些实施例中,数据库140可以作为分布式缓存存储离线得到的待推荐场景对应的各路召回策略的召回结果。在一些实施例中,数据库140可以存储服务器130执行或用于执行本说明书中描述的多路召回方法的数据和/或指令。终端110和服务器130具有访问数据库140的权限,终端110和服务器130可以通过网络访问存储在数据库140中的数据或指令。在一些实施例中,数据库140可以直接连接到终端110和服务器130。在一些实施例中,数据库140可以是服务器130的一部分。在一些实施例中,数据库140可以包括大容量存储、可移动存储、易失性读写存储器、只读存储器(ROM)或类似内容,或其任意组合。示例性大容量存储可能包括磁盘、光盘、固态驱动器等非暂时性存储介质(non transitory storage medium)。示例可移动存储可能包括闪存驱动器、软盘、光盘、存储卡、zip磁盘、磁带等。典型的易失性读写内存可能包括随机存取存储器(RAM)。示例RAM可能包括动态RAM(DRAM)、双日期速率同步动态RAM(DDRSDRAM)、静态RAM(SRAM)、晶闸管RAM(T-RAM)和零电容RAM(Z-RAM)等。示例性ROM可包括掩码ROM(MROM)、可编程ROM(PROM)、可虚拟可编程ROM(PEROM)、电子可编程ROM(EEPROM)、光盘(CD ROM)和数字多功能磁盘ROM等。
本领域技术人员可以知晓,上述终端的数量可以更多或更少。比如上述终端仅为一个,或者上述终端为几十个或几百个,或者更多数量,此时上述实施环境中还包括其他终端。本说明书实施例对终端的数量和设备类型不加以限定。
在介绍完本说明书实施例的实施环境之后,下面将结合上述实施环境对本说明书实施例的应用场景进行介绍,在下述说明过程中,终端也即是上述实施环境中的终端110,服务器也即是上述实施环境中的服务器130。本说明书实施例提供的技术方案能够应用在各种网络平台的推荐场景中,例如购物网站的推荐场景等。
以本说明书实施例提供的技术方案应用在购物网站的推荐场景中为例,用户为登录购物网站的用户,响应于用户针对待推荐页面的访问请求,确定与该用户对应的待推荐页面的多路召回策略中各路召回策略的召回参数,例如各路召回策略的召回比例参数,其中,各路召回策略的召回参数通过对照实验确定;基于各路召回策略对应的召回参数,获取与该用户对应的待推荐页面的各路召回策略的召回结果;对各路召回策略的召回结果进行排序,在待推荐页面下展示排序结果。
需要说明的是,上述是以本说明书实施例提供的技术方案应用在购物网站的推荐场景中为例进行说明的,本说明书实施例提供的技术方案还可以应用在其他适当的场景下例如,搜索场景或者多媒体网站的推荐场景等,实现过程与上述描述属于同一发明构思,在此不再赘述。
需要说明的是,本说明书的示例实施例中的多路召回方法中的步骤可以部分由客户端执行,部分由服务器执行,也可以全部由服务器或者全部由客户端执行,本说明书对此不进行特殊限定。
基于图1所示的实施环境,下面将结合图2-图7,对本说明书实施例提供的多路召回方法和多路召回设备进行详细介绍。需要注意的是,上述实施环境仅是为了便于理解本说明书的精神和原理而示出,本说明书的实施例在此方面不受任何限制。相反,本说明书的实施例可以应用于适用的任何场景。
图2是根据本说明书的一些实施例提供的一种多路召回设备200的结构示意图。上述多路召回设备200可以执行本说明书描述的多路召回方法。上述多路召回方法在本说明书中的其他部分介绍。上述多路召回设备200可以是通用计算机或专用计算机。例如,上述多路召回设备200可以是服务器、个人电脑、便携式电脑(比如笔记本计算机、平板电脑等),也可以是其他有计算能力的多路召回设备。当然,上述多路召回设备可以是图1中终端110或服务器130,也可以是多个开发人员用来在集成开发平台上进行程序开发的终端设备。
本说明书中的多路召回设备可以包括一个或多个如下部件:处理器210、存储器220、输入装置230、输出装置240和总线250。处理器210、存储器220、输入装置230和输出装置240之间可以通过总线250连接。
处理器210可以包括一个或者多个处理核心。处理器210利用各种接口和线路连接整个多路召回设备内的各个部分,通过运行或执行存储在存储器220内的指令、程序、代码集或指令集,以及调用存储在存储器220内的数据,执行本说明书描述的多路召回方法。可选地,处理器210可以采用数字信号处理(digital signal processing,DSP)、现场可编程门阵列(field-programmable gate array,FPGA)、可编程逻辑阵列(programmable logicArray,PLA)中的至少一种硬件形式来实现。处理器210可集成中心处理器(centralprocessing unit,CPU)、图像处理器(graphics processing unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器210中,单独通过一块通信芯片进行实现。
存储器220可以包括随机存储器(random Access Memory,RAM),也可以包括只读存储器(read-only memory,ROM)。可选地,该存储器220包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器220可用于存储指令、程序、代码、代码集或指令集。存储器220可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(例如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等,该操作系统可以是安卓(Android)系统,包括基于Android系统深度开发的系统、IOS系统,包括基于IOS系统深度开发的系统或其它系统。
为了使操作系统能够区分第三方应用程序的具体应用场景,需要打通第三方应用程序与操作系统之间的数据通信,使得操作系统能够随时获取第三方应用程序当前的场景信息,进而基于当前场景进行针对性的系统资源适配。
其中,输入装置230用于接收输入的指令或数据,输入装置230包括但不限于键盘、鼠标、摄像头、麦克风或触控设备。输出装置240用于输出指令或数据,输出装置240包括但不限于显示设备和扬声器等。在一个示例中,输入装置230和输出装置240可以合设,输入装置230和输出装置240为触摸显示屏。
除此之外,本领域技术人员可以理解,上述附图所示出的多路召回设备的结构并不构成对多路召回设备的限定,多路召回设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。比如,多路召回设备中还包括射频电路、输入单元、传感器、音频电路、无线保真(Wireless Fidelity,WiFi)模块、电源、蓝牙模块等部件,在此不再赘述。
图3示出了根据本说明书的实施例提供的一种多路召回方法的流程图。如前,多路召回设备200可以执行本说明书实施例的多路召回方法。具体地,处理器210可以读取存储在其本地存储介质中的指令集,然后根据指令集的规定,执行本说明书实施例的多路召回方法。下面,将结合附图对多路召回方法中的步骤S310至步骤S330进行详细的说明。
如图3所示,在步骤S310中,响应于用户针对待推荐场景的访问请求,确定与用户对应的待推荐场景的多路召回策略中各路召回策略的召回参数,其中,各路召回策略的召回参数通过对照实验确定。
在示例实施例中,待推荐场景为某一类资源的集合,待推荐场景包括首页推荐场景、购物车推荐场景、我的主页推荐场景等。不同的待推荐场景存在不同的资源属性,比如购物车推荐场景,需要结合购物车已经加购的商品来进行推荐;我的主页推荐场景,需要结合用户的用户特征例如用户画像和历史行为特征来进行推荐。因此,不同的待推荐场景对应的召回策略或者召回策略不同。
进一步地,待推荐场景对应多路召回策略即召回策略,可以根据用户特征以及待推荐场景确定待推荐场景对应的多路召回策略。多路召回策略可以包括热度召回策略、类目扩散召回策略、协同过滤召回策略等,各路召回策略的召回参数通过对照实验确定。对照实验也称为AB实验,通常是为同一目标制定两个方案,在同一时间维度,保证其他条件一致的情况下,分析实验组跟对照组的区别。在本说明书实施例中,对照实验的目的是为了确定各路召回策略的召回参数,例如,各路召回策略的召回比例。
举例而言,假设对照实验包括对照组A和实验组B,对照组A和实验组B各占50%的流量,待推荐场景对应的多路召回策略包括兑换热门召回、点击热门召回以及随机召回。对照组A对应的各路召回策略的召回参数为:兑换热门召回占比20%,点击热门召回占比20%,随机召回占比30%,新品召回占比15%。实验组B对应的各路召回策略的召回参数为:兑换热门召回占比25%,点击热门召回占比20%,随机召回占比30%,新品召回占比15%,经过预定时间的AB实验,统计对照组A和实验组B的指标数据发现,实验组B的兑换UV(unique visitor,独立访客)量的指标明显高于对照组A,提升兑换热门召回的召回比例,可以提升兑换UV量,因此,可以设置较高的兑换热门召回的召回比例。
通过对照实验确定用户对应的待推荐场景的各路召回策略的召回参数,能够针对用户科学合理地设置多路召回中各路召回策略的召回比例。
进一步地,在示例实施例中,多路召回设备200响应于用户针对待推荐场景的访问请求,确定与用户对应的待推荐场景的多路召回策略中各路召回策略的召回参数。以待推荐场景为首页推荐场景为例,预先配置首页推荐场景对应的多路召回策略,多路召回策略包括兑换热门召回、点击热门召回以及随机召回,多路召回设备200响应于用户针对首页推荐场景的访问请求,从访问请求中提取用户的用户标识以及首页推荐场景的场景标识,根据用户的用户标识以及首页推荐场景的场景标识确定与用户对应的首页推荐场景的各路召回策略的召回参数,例如预先设置用户的用户标识、首页推荐场景的场景标识以及召回策略的召回参数之间的对应关系,根据该对应关系,确定与用户对应的首页推荐场景的多路召回策略中各路召回策略的召回参数。
此外,在一些示例实施例中,用户标识包括用户等级标识,不同用户等级对应各路召回策略的召回参数不同,例如新用户等级较低,历史点击相似权益召回的召回比例较低,点击热门召回策略的召回比例较高。通过设置用户等级标识,能够针对用户更准确地进行个性化召回,进一步提高召回的转化率。
需要说明的是,虽然以召回参数包括召回比例为例进行了说明,但是本领域普通技术人员应该理解的是,召回参数还可以包括其他适当的参数例如召回策略对应的模型参数等,这同样在本说明书实施例的范围内。
在步骤S320中,基于各路召回策略对应的召回参数,获取与用户对应的待推荐场景的各路召回策略的召回结果。
在一些示例实施例中,预先存储与待推荐场景对应的各路召回策略的离线召回结果,各路召回策略对应的召回参数包括各路召回策略对应的召回比例,多路召回设备200基于各路召回策略对应的召回比例,获取与用户对应的待推荐场景的各路召回策略的离线召回结果。
举例而言,待推荐场景为首页推荐场景,首页推荐场景对应的各路召回策略的召回比例为:兑换热门占比25%,点击热门占比20%,随机占比30%,新品占比15%。多路召回设备200基于用户标识、首页推荐场景的场景标识以及各路召回策略对应的召回比例,从数据库中获取与用户对应的首页推荐场景的各路召回策略的离线召回结果。
在一些示例实施例中,多路召回设备200基于各路召回策略对应的召回参数例如召回比例,从分布式缓存中获取预先存储的与用户对应的待推荐场景的各路召回策略的离线召回结果。分布式缓存可以为Redis(Remote Dictionary Server,远程字典服务器)分布缓存,是以字典结构将数据存储在内存中,应用可直接到内存读写Redis存储的数据。
此外,在一些示例实施例中,用户标识包括用户等级标识,不同用户等级对应不同的离线召回结果,多路召回设备200基于用户等级标识、首页推荐场景的场景标识以及各路召回策略对应的召回比例,从数据库中获取与用户对应的待推荐场景的各路召回策略的离线召回结果。
在步骤S330中,在待推荐场景下展示各路召回策略的召回结果。
在示例实施例中,多路召回设备200通过排序模型对各路召回策略的召回结果进行排序,基于排序结果在待推荐场景下展示各路召回策略的召回结果。举例而言,预先设置各路召回策略在待推荐场景下的展示位置,多路召回设备200基于用户的用户特征以及权益特征,对各路召回策略的召回结果进行打分;根据打分结果对各路召回策略的召回结果进行排序,根据各路召回策略在待推荐场景下的展示位置,在推荐场景下展示排序后的各路召回策略的召回结果。用户特征包括用户画像特征和用户历史行为特征等,权益特征包括待推荐对象特征以及用户优惠特征等。
举例而言,设待推荐场景为首页推荐场景,首页推荐场景对应的多路召回策略包括:兑换热门召回、点击热门召回、新品召回以及随机召回,在获取到与用户对应的首页推荐场景的各路召回策略的召回结果之后,根据预先设置的各路召回策略在首页推荐场景下的展示位置,在首页推荐场景下展示排序后的各路召回策略的召回结果。参照图4所示,在展示位置1展示点击热门召回策略的召回结果中排序前4位,在展示位置2展示兑换热门召回策略的召回结果中排序前4位,在展示位置3展示新品召回策略的召回结果中排序前4位,在展示位置4展示随机召回策略的召回结果中排序前4位。
根据图3的示例实施例中的技术方案,一方面,通过对照实验确定用户对应的待推荐场景的各路召回策略的召回参数,能够科学合理地设置多路召回中各路召回策略的召回比例;另一方面,基于各路召回策略对应的召回参数,获取与用户对应的待推荐场景的各路召回策略的召回结果,对召回结果进行排序并展示,由于能够科学合理地设置多路召回中各路召回策略的召回比例,从而能够提高召回的转化率以及推荐的准确性。
进一步地,在一些示例实施例中,多路召回设备200在获取与待推荐场景对应的各路召回策略的召回结果之后,针对各路召回策略构建召回过滤条件;基于召回过滤条件对各路召回策略的召回结果进行过滤,将过滤结果作为各路召回策略的召回结果。举例而言,召回过滤条件可以包括库存、人群、投放渠道、城市限制等条件,针对各路召回策略构建对应的召回过滤条件,例如针对点击热门召回策略构建的召回过滤条件包括库存、人群、城市限制等条件,多路召回设备200基于召回过滤条件对各路召回策略的召回结果进行过滤,将过滤结果作为各路召回策略的召回结果。
根据上述示例实施例中的技术方案,针对各路召回策略构建对应的召回过滤条件,基于召回过滤条件对各路召回策略的召回结果进行过滤,能够进一步提高各路召回策略的召回结果的转化率。
此外,在一些示例实施例中,多路召回设备200在待推荐场景下展示各路召回策略的召回结果之前,对各路召回策略的召回结果添加扩展信息,扩展信息包括召回策略标识和权益信息,权益信息包括补贴金额或者优惠信息。进一步地,在待推荐场景下展示各路召回策略的召回结果时,同时展示各路召回策略的召回结果对应的扩展信息,例如展示召回结果对应的补贴金额。
需要说明的是,虽然以扩展信息包括召回策略标识和权益信息为例进行了说明,但是本领域技术人员应该理解的是,扩展信息还可以包括其他适当的信息,例如热度分等,这同样在本说明书实施例的范围内。
根据上述示例实施例中的技术方案,通过对各路召回策略的召回结果添加扩展信息并进行展示,使得用户能够感知召回结果对应的优惠信息,进而能够进一步提高召回的转化率。
进一步地,在一些示例实施例中,多路召回设备200基于用户的用户特征、权益特征以及扩展信息,通过排序模型对各路召回策略的召回结果进行打分;根据打分结果对各路召回策略的召回结果进行排序。排序模型可以包括比较类排序模型和非比较类排序模型,比较类排序通过比较来决定元素间的相对次序来对召回结果进行排序。比较排序包括交换排序、插入排序和选择排序。在调用排序模型之前,多路召回设备200为待排序的召回结果即权益补充召回链路来源、补贴金额等扩展信息,结合用户特征、权益特征以及扩展信息通过排序模型对各路召回策略的召回结果进行打分。
根据上述示例实施例中的技术方案,一方面,由于在召回结果中增加了扩展信息,排序算法模型能够感知待排序的召回结果即召回权益的召回链路等特征;另一方面,通过在召回结果中增加扩展信息,在调用算法排序之前,为待排序的权益补充召回链路来源、补贴金额等扩展信息,使算法排序有更多的特征输入,从而能够优化排序结果。
图5示出了根据本说明书的一些实施例提供的确定召回策略的召回参数的流程示意图。
参照图5所示,在步骤S510中,通过对照实验确定对照组的对照观测指标的指标值和实验组的实验观测指标的指标值,对照观测指标和实验观测指标具有相同的观测指标。
在示例实施例中,对照实验包括对照组和实验组,对照组的对照观测指标和实验组的实验观测指标均包括:点击率、兑换率、独立访客量等。需要说明的是,观测指标还可以包括其他适当的指标例如购买转化率或人均点击数等,这同样在本说明书实施例的范围内。
进一步地,多路召回设备200确定对照组对应的对照分桶和实验组的实验分桶;基于对照分桶和实验分桶对应的请求流量,分别对对照组的对照观测指标的指标值和实验组的实验观测指标的指标值进行统计。举例而言,对照组对应的对照分桶和实验组的实验分桶均包含M个分桶,例如M=1,对照组对应的对照分桶为分桶A和实验组的实验分桶为分桶B,分桶A占50%的请求流量,分桶B占50%的请求流量,对请求流量的访问用户进行哈希处理,将访问用户均匀分配到分桶A和分桶B,基于分桶A和分桶B对应的请求流量,分别对对照组的对照观测指标的指标值和实验组的实验观测指标的指标值进行统计。为了降低用户分布偏差导致的结果偏差,需要保证分桶的用户在关键特征上的分布是一致的,例如用户活跃度一致,用户兴趣类目一致,用户点击率,用户成交率等关键特征的分布是一致的。
在步骤S520中,基于对照观测指标与实验观测指标之间的指标值差值,调整待推荐场景的各路召回策略的召回参数。
在示例实施例中,多路召回设备200确定对照组对应的各路召回策略的召回参数和实验组对应的各路召回策略的召回参数之间的参数差值;基于参数差值与指标值差值,调整待推荐场景的各路召回策略的召回参数。
举例而言,设对照组A对应的各路召回策略的召回参数为:兑换热门召回占比20%,点击热门召回占比20%,随机召回占比30%,新品召回占比15%。实验组B对应的各路召回策略的召回参数为:兑换热门召回占比25%,点击热门召回占比20%,随机召回占比30%,新品召回占比15%,经过预定时间的AB实验,多路召回设备200统计对照组A和实验组B的指标数据发现,实验组B的兑换UV(unique visitor,独立访客)量的指标明显高于对照组A,提升兑换热门召回的召回比例,可以提升兑换UV量,因此,可以设置较高的兑换热门召回的召回比例。
根据图5的示例实施例中的技术方案,通过AB实验平台设置多个实验分桶,并设置可以评判召回效果的观测指标例如点击率,兑换率等,能够科学验证不同召回参数的业务效果,从而能够更准确地进行召回参数调优。
图6示出了根据本说明书的一些实施例提供的离线召回处理的流程示意图。
参照图6所示,在步骤S610中,基于用户的用户特征和权益特征,通过定时任务调度的方式离线执行多路召回策略,得到与用户对应的待推荐场景各路召回策略的离线召回结果。
在示例实施例中,用户特征包括用户画像和用户历史行为特征,权益特征包括权益属性特征以及统计类特征等,属性特征包括商品标识、类目、价格、库存、上架时间等,统计类特征包括点击率、转化率等特征。多路召回策略包括兑换热门召回、点击热门召回以及随机召回。
进一步地,多路召回设备200通过定时任务调度的方式离线执行多路召回策略,得到与用户对应的待推荐场景的各路召回策略的离线召回结果,并将与用户对应的待推荐场景的各路召回策略的离线召回结果存储到数据库。设待推荐场景为首页推荐场景,首页推荐场景对应的多路召回策略包括:兑换热门召回、点击热门召回、新品召回以及随机召回,以24小时为周期定时离线执行多路召回策略,得到与用户对应的首页推荐场景的各路召回策略的离线召回结果。
在步骤S620中,将与用户对应的待推荐场景的各路召回策略的离线召回结果存储到分布式缓存。
在示例实施例中,分布式缓存是指在分布式环境或系统下,把一些热门数据存储到离用户近、离应用近的位置,并尽量存储到更快的设备,以减少远程数据传输的延迟,让用户和应用可以很快访问到想要的数据。分布式缓存可以为Redis(Remote DictionaryServer,远程字典服务器)分布缓存,是以字典结构将数据存储在内存中,应用可直接到内存读写Redis存储的数据。
进一步地,多路召回设备200从数据库中获取与用户对应的待推荐场景对应的各路召回策略的离线召回结果,将与用户对应的待推荐场景的各路召回策略的离线召回结果存储到分布式缓存,例如,将与待推荐场景对应的各路召回策略的离线召回结果存储到Redis分布式缓存。
此外,在一些示例实施例中,多路召回设备200对各路召回策略的离线召回结果进行过滤处理,得到各路召回策略的离线过滤结果;对各路召回策略的离线召回结果进行链路分组打标,其中,每个召回策略的离线召回结果中各召回项的链路标记相同,并且每个链路分组的链路标记唯一;将打标后的各路召回策略的离线召回结果存储到分布式缓存。
根据图6的示例实施例中的技术方案,通过离线执行复杂且耗时的多路召回,将用户维度的召回结果预先写入分布式缓存中,当接收到用户的访问请求时,直接从分布式缓存中读取多路召回结果,从而能够提高响应速度,降低响应耗时。
进一步地,在一些示例实施例中,多路召回设备200基于用户的用户标识、待推荐场景的标识以及各路召回策略的分组标记,从分布式缓存中获取预先存储的与用户对应的待推荐场景的各路召回策略的离线召回结果。举例而言,预先设置用户标识、待推荐场景的标识以及各路召回策略的分组标记之间的对应关系,根据该对应关系从分布式缓存中获取预先存储的与用户对应的待推荐场景的各路召回策略的离线召回结果。
根据上述示例实施例中的技术方案,当接收到用户的访问请求时,直接从分布式缓存中获取与用户对应的待推荐场景的各路召回策略的离线召回结果,能够提升数据查询效率,极大地减少了响应耗时,节省了在线计算资源。
图7示出了根据本说明书的一些实施例提供的多路召回方法的软件架构的示意图。
参照图7所示,该多路召回方法的软件架构包括:离线召回模块710、缓存加载模块720、在线处理模块730以及排序调优模块740。离线召回模块710用于基于用户画像、用户历史行为数据、权益配置等数据,经过特征处理,获得结构化的用户特征、权益特征数据。在上述特征数据的基础上,通过定时任务执行多路召回策略例如热门召回、协同过滤召回、深度网络召回等,并将各路召回策略的召回结果写入数据库,存储起来备用。缓存加载模块720用于将各路召回策略的离线召回结果写入分布式缓存,例如,在接收到用户针对待推荐场景的访问请求时,从分布式缓存中查询用户对应的待推荐场景的各路召回策略的召回结果,如果从分布式缓存中查询到该用户对应的召回结果即缓存命中,则直接从分布式缓存中获取与用户对应的该待推荐场景的各路召回策略的召回结果;如果从分布式缓存中未查询到该用户对应的召回结果即缓存未命中,则将该用户对应的该待推荐场景的各路召回策略的离线召回结果写入分布式缓存。在线处理模块730包括在线多路召回模块和AB实验平台,其中,在线多路召回模块用于在线获取用户对应的该待推荐场景的各路召回策略的召回结果。AB实验平台用于科学验证多路召回的效果。在AB实验平台中,可以设置观测指标例如如权益点击率、兑换率、兑换总量等指标。此外,针对对照组和实验组可预设M个分桶,每个分桶的召回参数可调整。基于AB实验平台,可以科学判断各路召回策略的不同召回参数的效果,进而不断调整召回参数,进行优化。例如,当接收到用户针对待推荐场景的访问请求时,通过AB实验平台对用户进行分流,命中M个分桶中一个分桶。然后,根据分桶配置的召回参数构建多路召回条件,通过搜索引擎执行召回条件,得到用户可见且可用的召回结果即权益集合。排序调优模块740用于通过调用推荐算法服务对多路召回的权益集合打分排序,之后确定对照组和实验组的观测指标的指标值,根据对照组和实验组的观测指标的指标值差值即实验效果调整各个分桶对应的召回策略的召回参数,进而对召回策略的召回参数进行调优。
其中,离线召回模块710包括特征单元块712、召回策略单元714、离线召回单元716以及数据存储单元718。特征单元712基于用户画像、用户历史行为、权益配置信息等数据,经过特征处理,获得结构化的用户特征以及权益特征。召回策略单元714用于配置多路召回策略,例如,热度召回策略、类目扩散召回策略、协同过滤召回策略、深度网络召回策略以及高佣金召回策略等。离线召回单元716通过定时任务执行多路召回策略例如热门召回、协同过滤召回、深度网络召回等,得到多路召回策略对应的召回结果即权益集合。数据存储单元718将各路召回策略对应的召回结果写入数据库,存储起来备用,例如将离线召回结果写入MySQL等数据库。
缓存加载模块720包括全量召回单元722、过滤单元724、分组打标单元726以及分布式缓存单元728。全量召回单元722用于从数据库中全量读取离线召回模块710得到的各路召回策略的召回结果即召回权益集合。过滤单元724用于通过搜索引擎中的正排索引和倒排索引结合过滤条件对各路召回策略的召回结果进行过滤,例如过滤条件包括库存、人群、状态、投放渠道、城市限制等过滤条件。分组打标单元726对各路召回策略的离线召回结果进行链路分组打标,其中,每路召回策略的离线召回结果中各召回项的链路标记相同,并且每路召回策略一个链路分组,每个链路分组的链路标记唯一。分布式缓存单元728用于将各路召回策略对应的召回结果以键值对的形式存储到分布式缓存,其中,键为链路分组的分布标记,值为对应的链路分组的召回结合即权益数据集合。
在线处理模块730包括请求处理单元7302、AB实验单元7304、召回参数确定单元7306、召回处理单元7308、召回条件构建单元7310、过滤单元7312以及合并去重单元7314。其中,请求处理单元7303用于接收客户端发送的用户针对待推荐场景的访问请求。AB实验单元7304用于对多个客户端的请求流量进行分组,例如将请求流量分为实验组A和对照组B,每个分组可以灵活配置召回参数和观测指标。召回参数确定单元7306用于配置各个分组的召回参数,例如,配置各个分组对应的多路召回策略的召回比例参数集合。举例而言,设多路召回策略包括点击热门召回策略、兑换热门召回策略、相似品召回策略、点击相似权益召回策略以及兑换相似权益召回策略等,则配置各个分组对应的点击热门召回比例、兑换热门召回比例、相似品召回比例、点击相似权益召回比例以及兑换相似权益召回比例等。
进一步地,召回处理单元7308根据配置的各路召回策略的召回比例参数,从分布式缓存中获取各路召回策略对应的候选召回结果集合。例如,根据各个分组对应的点击热门召回比例、兑换热门召回比例、相似品召回比例、点击相似权益召回比例以及兑换相似权益召回比例,从分布式缓存中获取各路召回策略对应的候选召回结果集合。
召回条件构建单元7310用于构建各路召回策略对应的召回过滤条件,例如,针对不同的召回策略,选取与该召回策略对应的召回过滤条件。以点击热门召回策略为例,召回过滤条件可以包括库存、人群、投放渠道等条件。过滤单元7312用于通过搜索引擎执行召回过滤条件对各路召回策略对应的候选召回结果进行过滤,例如搜索引擎通过正排索引和倒排索引实现库存、人群、投放渠道、城市限制等条件过滤,经过滤的结果即为对应召回策略的召回结果。合并去重单元7314用于对不同召回策略对应的召回结果中存储的重复结合进行合并去重处理。
排序条件模块740包括扩展信息填充单元742、算法排序单元744、效果检测单元746以及召回调优单元748。其中,扩展信息填充单元742用于为各路召回策略的召回结果补充扩展信息,例如补充召回策略标识、补贴金额、热度分等信息。算法排序单元744用于基于用户的用户特征、权益特征以及扩展信息,对各路召回策略的召回结果进行打分;根据打分结果对各路召回策略的召回结果进行排序。效果检测单元746用于通过AB实验平台获取对照组和实验组的观测指标,根据对照组和实验组的观测指标确定实验决策是否符合业务预期。召回调优单元748用于基于对照组和实验组的观测指标之间的指标值差值以及对应的召回参数的参数差值,调整各个分桶的召回参数,从而调整各个召回链路的召回比例,进而进行召回参数调优。
举例而言,待推荐场景对应的多路召回策略包括兑换热门召回、点击热门召回以及随机召回。对照组A对应的各路召回策略的召回参数为:兑换热门召回占比20%,点击热门召回占比20%,随机召回占比30%,新品召回占比15%。实验组B对应的各路召回策略的召回参数为:兑换热门召回占比25%,点击热门召回占比20%,随机召回占比30%,新品召回占比15%,经过预定时间的AB实验,统计对照组A和实验组B的指标数据发现,实验组B的兑换UV(unique visitor,独立访客)量的指标明显高于对照组A,提升兑换热门召回的召回比例,可以提升兑换UV量,因此,可以设置较高的兑换热门召回的召回比例。
根据图7的示例实施例中的技术方案,一方面,通过AB实验平台设置多个实验分桶,并设置可以评判召回效果的观测指标例如点击率,兑换率等,从而能够科学验证召回策略的不同召回参数的业务效果,从而对召回策略的召回参数进行调优;另一方面,通过离线执行复杂且耗时的算法模型召回,将用户维度的召回结果预先写入分布式缓存中,当接收到用户访问请求时,直接从分布式缓存中读取多路召回策略的召回结果,能够提升数据查询效率,极大地减少了响应耗时,节省了在线计算资源;再一方面,针对各路召回策略的召回结果添加扩展信息,算法模型能够感知待排序的召回结果的召回链路等特征。通过针对召回结果增加扩展信息,在调用算法排序之前,为待排序的召回结果补充召回链路来源、补贴金额等扩展信息,使算法排序能够有更多的特征输入,从而优化排序结果。
本说明书另一方面提供一种非暂时性存储介质,存储有至少一组用来进行人群扩散的可执行指令。当所述可执行指令被处理器执行时,所述可执行指令指导所述处理器实施本说明书所述的多路召回方法的步骤。在一些可能的实施方式中,本说明书的各个方面还可以实现为一种程序产品的形式,其包括程序代码。当所述程序产品在多路召回设备200上运行时,所述程序代码用于使多路召回设备200执行本说明书描述的多路召回方法的步骤。用于实现上述方法的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)包括程序代码,并可以在多路召回设备200上运行。然而,本说明书的程序产品不限于此,在本说明书中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统使用或者与其结合使用。所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。可以以一种或多种程序设计语言的任意组合来编写用于执行本说明书操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在多路召回设备200上执行、部分地在多路召回设备200上执行、作为一个独立的软件包执行、部分在多路召回设备200上部分在远程计算设备上执行、或者完全在远程计算设备上执行。
上述对本说明书特定实施例进行了描述。其他实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者是可能有利的。
综上所述,在阅读本详细公开内容之后,本领域技术人员可以明白,前述详细公开内容可以仅以示例的方式呈现,并且可以不是限制性的。尽管这里没有明确说明,本领域技术人员可以理解本说明书需求囊括对实施例的各种合理改变,改进和修改。这些改变,改进和修改旨在由本说明书提出,并且在本说明书的示例性实施例的精神和范围内。
此外,本说明书中的某些术语已被用于描述本说明书的实施例。例如,“一个实施例”,“实施例”和/或“一些实施例”意味着结合该实施例描述的特定特征,结构或特性可以包括在本说明书的至少一个实施例中。因此,可以强调并且应当理解,在本说明书的各个部分中对“实施例”或“一个实施例”或“替代实施例”的两个或更多个引用不一定都指代相同的实施例。此外,特定特征,结构或特性可以在本说明书的一个或多个实施例中适当地组合。
应当理解,在本说明书的实施例的前述描述中,为了帮助理解一个特征,出于简化本说明书的目的,本说明书将各种特征组合在单个实施例、附图或其描述中。然而,这并不是说这些特征的组合是必须的,本领域技术人员在阅读本说明书的时候完全有可能将其中一部分设备标注出来作为单独的实施例来理解。也就是说,本说明书中的实施例也可以理解为多个次级实施例的整合。而每个次级实施例的内容在于少于单个前述公开实施例的所有特征的时候也是成立的。
本文引用的每个专利,专利申请,专利申请的出版物和其他材料,例如文章,书籍,说明书,出版物,文件,物品等,可以通过引用结合于此。用于所有目的全部内容,除了与其相关的任何起诉文件历史,可能与本文件不一致或相冲突的任何相同的,或者任何可能对权利要求的最宽范围具有限制性影响的任何相同的起诉文件历史。现在或以后与本文件相关联。举例来说,如果在与任何所包含的材料相关联的术语的描述、定义和/或使用与本文档相关的术语、描述、定义和/或之间存在任何不一致或冲突时,使用本文件中的术语为准。
最后,应理解,本文公开的申请的实施方案是对本说明书的实施方案的原理的说明。其他修改后实施例也在本说明书的范围内。因此,本说明书披露的实施例仅仅作为示例而非限制。本领域技术人员可以根据本说明书中的实施例采取替代配置来实现本说明书中的申请。因此,本说明书的实施例不限于申请中被精确地描述过的实施例。

Claims (13)

1.一种多路召回方法,包括:
响应于用户针对待推荐场景的访问请求,确定与所述用户对应的所述待推荐场景的多路召回策略中各路所述召回策略的召回参数,其中,各路所述召回策略的所述召回参数通过对照实验确定;
基于各路所述召回策略对应的所述召回参数,获取与所述用户对应的所述待推荐场景的各路所述召回策略的召回结果;
在所述待推荐场景下展示各路所述召回策略的所述召回结果。
2.根据权利要求1所述的方法,其中,所述对照实验包括对照组和实验组,所述方法还包括:
通过所述对照实验确定所述对照组的对照观测指标的指标值和所述实验组的实验观测指标的指标值,所述对照观测指标和所述实验观测指标具有相同的观测指标;
基于所述对照观测指标与所述实验观测指标之间的指标值差值,调整所述待推荐场景的各路所述召回策略的所述召回参数。
3.根据权利要求2所述的方法,其中,所述通过所述对照实验确定所述对照组的对照观测指标的指标值和所述实验组的实验观测指标的指标值,包括:
确定所述对照组对应的对照分桶和所述实验组对应的实验分桶;
基于所述对照分桶和所述实验分桶对应的请求流量,分别对所述对照组的所述对照观测指标的指标值和所述实验组的所述实验观测指标的指标值进行统计。
4.根据权利要求3所述的方法,其中,所述基于所述对照观测指标与所述实验观测指标之间的指标值差值,调整所述待推荐场景的各路所述召回策略的所述召回参数,包括:
确定所述对照组对应的各路所述召回策略的召回参数和所述实验组对应的各路所述召回策略的召回参数之间的参数差值;
基于所述参数差值与所述指标值差值,调整所述待推荐场景的各路所述召回策略的所述召回参数。
5.根据权利要求1所述的方法,其中,所述基于各路所述召回策略对应的所述召回参数,获取与所述用户对应的所述待推荐场景的各路所述召回策略的召回结果,包括:
基于各路所述召回策略对应的所述召回参数,从分布式缓存中获取预先存储的与所述用户对应的所述待推荐场景的各路所述召回策略的离线召回结果。
6.根据权利要求5所述的方法,其中,在所述获取与所述用户对应的所述待推荐场景的各路所述召回策略的召回结果之前,所述方法还包括:
基于所述用户的用户特征和权益特征,通过定时任务调度的方式离线执行多路召回策略,得到与所述用户对应的所述待推荐场景的各路所述召回策略的所述离线召回结果;
将与所述用户对应的所述待推荐场景的各路所述召回策略的所述离线召回结果存储到所述分布式缓存。
7.根据权利要求6所述的方法,其中,所述将与所述用户对应的所述待推荐场景的各路所述召回策略的所述离线召回结果存储到所述分布式缓存,包括:
对所述用户对应的所述待推荐场景的各路所述召回策略的所述离线召回结果进行分组打标,其中,每个所述召回策略的所述离线召回结果中各召回项的分组标记相同;
将打标后的各路所述召回策略的所述离线召回结果以键值对的形式存储到所述分布式缓存。
8.根据权利要求5所述的方法,其中,所述从分布式缓存中获取预先存储的与所述用户对应的所述待推荐场景的各路所述召回策略的离线召回结果,包括:
基于所述用户的用户标识、所述待推荐场景的标识以及各路所述召回策略的分组标记,从所述分布式缓存中获取预先存储的与所述用户对应的所述待推荐场景的各路所述召回策略的离线召回结果。
9.根据权利要求5所述的方法,其中,各路所述召回策略对应的所述召回参数包括各路所述召回策略对应的召回比例。
10.根据权利要求1所述的方法,其中,在所述获取与所述用户对应的所述待推荐场景的各路所述召回策略的召回结果之后,所述方法还包括:
针对各路所述召回策略构建召回过滤条件;
基于所述召回过滤条件对各路所述召回策略的所述召回结果进行过滤,将过滤结果作为各路所述召回策略的召回结果。
11.根据权利要求1所述的方法,其中,在所述待推荐场景下展示各路所述召回策略的所述召回结果之前,所述方法还包括:
对各路所述召回策略的召回结果添加扩展信息,所述扩展信息包括召回策略标识和权益信息。
12.根据权利要求11所述的方法,其中,所述方法还包括:
基于所述用户的用户特征、权益特征以及所述扩展信息,对各路所述召回策略的所述召回结果进行打分;
根据打分结果对各路所述召回策略的所述召回结果进行排序。
13.一种多路召回设备,包括:
至少一个存储介质,存储有至少一个指令集,用于进行多路召回处理;以及
至少一个处理器,同所述至少一个存储介质通信连接,
其中,当所述多路召回设备运行时,所述至少一个处理器读取所述至少一个指令集,并且根据所述至少一个指令集的指示执行权利要求1-12中任一项所述的多路召回方法。
CN202410163583.3A 2024-02-05 2024-02-05 多路召回方法及设备 Pending CN117994002A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410163583.3A CN117994002A (zh) 2024-02-05 2024-02-05 多路召回方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410163583.3A CN117994002A (zh) 2024-02-05 2024-02-05 多路召回方法及设备

Publications (1)

Publication Number Publication Date
CN117994002A true CN117994002A (zh) 2024-05-07

Family

ID=90902051

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410163583.3A Pending CN117994002A (zh) 2024-02-05 2024-02-05 多路召回方法及设备

Country Status (1)

Country Link
CN (1) CN117994002A (zh)

Similar Documents

Publication Publication Date Title
US11995112B2 (en) System and method for information recommendation
US11907240B2 (en) Method and system for presenting a search result in a search result card
US9450771B2 (en) Determining information inter-relationships from distributed group discussions
US9699490B1 (en) Adaptive filtering to adjust automated selection of content using weightings based on contextual parameters of a browsing session
US20150066586A1 (en) Evaluation calculating device, evaluation calculating method, and recording medium
CN101859425A (zh) 一种提供应用列表的方法及装置
US9767417B1 (en) Category predictions for user behavior
JP2014532235A (ja) グラフの推奨
US20140278799A1 (en) Automated identification of marketing opportunities based on stored marketing data
US9767204B1 (en) Category predictions identifying a search frequency
US9881065B2 (en) Selecting supplemental content for inclusion in a search results page
US20130246432A1 (en) Providing content based on online topical trends
US10474670B1 (en) Category predictions with browse node probabilities
US20160323232A1 (en) Aggregating content associated with topics in a social network
US10636076B2 (en) Search result enhancement component for interest queues
CN104915357A (zh) 页面资源管理方法及装置
US10242069B2 (en) Enhanced template curating
US10387934B1 (en) Method medium and system for category prediction for a changed shopping mission
US10915597B2 (en) Systems and methods for multiobjective optimization
US9158809B2 (en) Grid queries
CN108595395B (zh) 一种昵称的生成方法、装置及设备
CN114756758B (zh) 一种混合推荐方法和系统
US9230022B1 (en) Customizable result sets for application program interfaces
CN117994002A (zh) 多路召回方法及设备
US10437818B2 (en) Search result enhancement component for item documents

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination