CN115375339A - 多媒体信息推荐方法、装置和设备及计算机存储介质 - Google Patents

多媒体信息推荐方法、装置和设备及计算机存储介质 Download PDF

Info

Publication number
CN115375339A
CN115375339A CN202110549661.XA CN202110549661A CN115375339A CN 115375339 A CN115375339 A CN 115375339A CN 202110549661 A CN202110549661 A CN 202110549661A CN 115375339 A CN115375339 A CN 115375339A
Authority
CN
China
Prior art keywords
recommendation
target
information
multimedia information
tail
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110549661.XA
Other languages
English (en)
Inventor
姚刚
石鑫
陈宇清
陈新荃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202110549661.XA priority Critical patent/CN115375339A/zh
Publication of CN115375339A publication Critical patent/CN115375339A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0263Targeted advertisements based upon Internet or website rating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种多媒体信息推荐方法、装置和设备及计算机存储介质,涉及信息推荐技术领域,用于提升多媒体信息召回准确度以及精排队列的利用率,从而提升推荐系统的整体准确率。在该方法中,基于目标账户的目标推荐请求,获取目标账户的至少一个历史尾部集合;基于至少一个历史尾部集合以及设定的过滤策略,构造包含至少一个多媒体信息的信息过滤集合;针对目标推荐请求,获取包含多个多媒体信息的召回集合,并从召回集合中筛除信息过滤集合包括的多媒体信息;基于筛除后的召回集合,获得目标推荐请求对应的候选推荐集合,并从候选推荐集合中,确定出为目标账户推荐的目标多媒体信息。

Description

多媒体信息推荐方法、装置和设备及计算机存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及信息推荐技术领域,提供一种多媒体信息推荐方法、装置和设备及计算机存储介质。
背景技术
推荐系统一般包括召回-粗排-精排三个阶段。在进行多媒体信息推荐时,对于每次推荐请求都会独立的进行召回和粗排环节,召回是指从整个多媒体信息库中,采用多路召回的方式从不同角度检索召回用户可能感兴趣的多媒体信息,粗排是指对召回的多媒体信息在较粗的粒度上,进而高效和轻量级的排序,从而从召回的多媒体信息中,快速筛选出少量相对优质的多媒体信息,作为精排阶段的输入,在精排阶段,则在较细的粒度上进行精细排序,最终从各个广告中选取最优多媒体信息,推荐给用户。
因此,针对每次推荐请求,在进入精排阶段之前,都需要经过召回和粗排环节,因而召回和粗排环节直接决定了哪些多媒体信息能够进入精排阶段,从而在一定程度上决定了最终所要推荐的多媒体信息,因而召回和粗排环节的准确度,一定程度上决定了推荐系统的整体准确率。
发明内容
本申请实施例提供一种多媒体信息推荐方法、装置和设备及计算机存储介质,用于提升多媒体信息召回准确度以及精排队列的利用率,从而提升推荐系统的整体准确率。
一方面,提供一种多媒体信息推荐方法,所述方法包括:
基于目标账户的目标推荐请求,获取所述目标账户的至少一个历史尾部集合;其中,每个所述历史尾部集合包括一个历史推荐请求对应的候选推荐集合中,按照推荐度由高到低进行排序时的最后N个多媒体信息,N为正整数;
基于所述至少一个历史尾部集合以及设定的过滤策略,构造包含至少一个多媒体信息的信息过滤集合;
针对所述目标推荐请求,获取包含多个多媒体信息的召回集合,并从所述召回集合中筛除所述信息过滤集合包括的多媒体信息;
基于筛除后的召回集合,获得所述目标推荐请求对应的候选推荐集合,并
所述候选推荐集合中,确定出为所述目标账户推荐的目标多媒体信息。
一方面,提供一种多媒体信息推荐装置,所述装置包括:
获取单元,用于基于目标账户的目标推荐请求,获取所述目标账户的至少一个历史尾部集合;其中,每个所述历史尾部集合包括一个历史推荐请求对应的候选推荐集合中,按照推荐度由高到低进行排序时的最后N个多媒体信息,N为正整数;
构造单元,用于基于所述至少一个历史尾部集合以及设定的过滤策略,构造包含至少一个多媒体信息的信息过滤集合;
筛除单元,用于针对所述目标推荐请求,获取包含多个多媒体信息的召回集合,并从所述召回集合中筛除所述信息过滤集合包括的多媒体信息;
推荐单元,用于基于筛除后的召回集合,获得所述目标推荐请求对应的候选推荐集合,并从所述候选推荐集合中,确定出为所述目标账户推荐的目标多媒体信息。
可选的,所述构造单元,具体用于:
基于设定的时长阈值,确定所述至少一个历史尾部集合中处于有效状态的历史尾部集合;其中,当一个历史尾部集合对应的历史推荐请求的生成时刻与当前时刻之间的时间差不大于所述时长阈值时,所述一个历史尾部集合处于有效状态;
基于所述目标账户或者所述目标推荐请求的推荐属性信息,获取所述过滤策略中与所述推荐属性信息对应的各个过滤参数的取值;
基于获得的各个过滤参数的取值,从处于有效状态的历史尾部集合中选取所述至少一个多媒体信息,构成所述信息过滤集合。
可选的,所述构造单元,具体用于:
根据所述目标推荐请求所属的推荐维度信息,获取所述过滤策略中与所述推荐维度信息对应的各个过滤参数的取值;其中,所述推荐维度信息用于表征所述目标推荐请求对应的信息展示位的来源信息;
根据所述目标账户的第一推荐频率,获取所述过滤策略中与所述第一推荐频率对应的各个过滤参数的取值;
根据所述目标账户在所述目标推荐请求所属推荐维度的第二推荐频率,获取所述过滤策略中与所述第二推荐频率对应的各个过滤参数的取值。
可选的,所述各个过滤参数包括历史尾部集合对应的历史推荐请求的数量Z,以及从每个历史尾部集合选取的多媒体信息的数量M,其中,M为正整数,且M≤N;则所述构造单元,具体用于:
从处于有效状态的历史尾部集合中,选取按照时间差由大到小进行排序后,最后Z个历史推荐请求对应的历史尾部集合;其中,所述时间差为各个历史尾部集合对应的历史推荐请求的生成时刻与当前时刻之间的时间差;
分别在所述最后Z个历史尾部集合中,各自选取按照推荐度由高到低进行排序后的最后M个多媒体信息;
基于分别从所述Z个历史尾部集合中各自获得的M个多媒体信息,构造所述信息过滤集合。
可选的,所述获取单元,具体用于:
对所述目标推荐请求进行协议识别,确定发送所述目标推荐请求的目标站点;
基于所述目标站点对应的解析方式,对所述目标推荐请求进行数据解析,获得所述目标推荐请求对应的信息展示位的来源信息;
基于所述信息展示位的来源信息,确定目标推荐请求所属的推荐维度,并从所述推荐维度对应的历史尾部集合中,获取所述至少一个历史尾部集合。
可选的,所述推荐单元,具体用于:
采用已训练的互动率获取模型,分别基于所述候选推荐集合中各个多媒体信息的资源属性信息,获得各个多媒体信息各自对应的预估互动率;
分别基于获得的各个预估互动率,确定各个多媒体信息在信息展示位上进行设定次数的展示后,所能获得的预估电子资源量;
基于获得的各个预估电子资源量由高到低的顺序,对所述多个多媒体信息进行排序;
根据排序结果,从所述候选推荐集合中确定出所述目标多媒体信息。
可选的,所述装置还包括集合更新单元,用于:
基于排序结果,从所述候选推荐集合选取排序最后的N个多媒体信息,构成所述目标推荐请求对应的目标尾部集合;
将所述目标尾部集合作为历史尾部集合,添加至所述目标账户的历史尾部集合库中。
可选的,所述集合更新单元,还用于:
将所述目标尾部集合的相关信息,添加至所述目标账户的历史尾部集合库中;其中,所述相关信息,包括如下信息中的一种或者多种的组合:
所述目标账户的账户标识;
所述目标推荐请求的生成时刻;
所述目标推荐请求对应的信息展示位标识;
所述目标推荐请求对应的信息展示场景标识;
所述目标推荐请求对应的目标站点标识。
一方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一种方法的步骤。
一方面,提供一种计算机存储介质,其上存储有计算机程序指令,该计算机程序指令被处理器执行时实现上述任一种方法的步骤。
一方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述任一种方法的步骤。
本申请实施例中,收集目标账户的历史尾部集合,每个历史尾部集合包括历史推荐请求对应的候选推荐集合中的尾部多媒体信息,在向目标账户进行多媒体信息推荐时,基于至少一个历史尾部集合以及设定的过滤策略,构造信息过滤集合,进而再进行召回之后,从召回集合中筛除信息过滤集合包括的多媒体信息,并基于筛除之后的召回集合进行推荐。这样,由于候选推荐集合中的尾部是通常是没有机会推荐给用户的,通过将尾部多媒体信息过滤,避免这些尾部多媒体信息长期占用候选推荐集合名额,给予其他多媒体信息能够进入候选推荐集合的机会,提升候选推荐集合的利用率,同时,尾部多媒体信息的产生可能是召回或者粗排阶段对于这些多媒体信息的推荐度的高估造成的,将这些过滤之后,实质上是对召回或者粗排阶段的预估校正,从而提升了多媒体信息召回准确度,进而提升了推荐系统的整体准确率。
附图说明
为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的应用场景图;
图2为本申请实施例提供的推荐服务器的系统架构示意图;
图3为本申请实施例提供的多媒体信息推荐方法的流程示意图;
图4为本申请实施例提供的信息展示位的示意图;
图5为本申请实施例提供的尾部集合的存储结构示意图;
图6为本申请实施例提供的获取构造信息过滤集合的流程示意图;
图7为本申请实施例提供的获得的信息过滤集合的示意图;
图8为本申请实施例提供的精排过程的流程示意图;
图9为本申请实施例提供的进行广告推荐的流程示意图;
图10为本申请实施例提供的多媒体信息推荐装置的一种结构示意图;
图11为本申请实施例提供的计算机设备的一种结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚明白,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
为便于理解本申请实施例提供的技术方案,这里先对本申请实施例使用的一些关键名词进行解释:
多媒体信息:是指可通过应用内页面或者网页页面中的信息展示位进行展示,用户可与之进行互动的信息,例如可以为广告或者网页页面链接等。以广告为例,网页页面或者应用内页面设置有相应的广告展示位,广告可通过这些广告展示位进行展示,用户可点击广告进入相应广告页面,并进行相应的操作,如下载广告页面中的应用或者购买广告推荐的商品等。
历史尾部集合:尾部的含义是指排序的最后几个,对于一个推荐请求而言,会为其筛选得到多个多媒体信息,这多个多媒体信息构成候选推荐集合,继而按照一定的排序策略,对这些多媒体信息进行排序,最终排序靠前的多媒体信息才会被推荐给用户,而排序最后的多媒体信息并不会被推荐给用户,这些多媒体信息则构成一个推荐集合对应的历史尾部集合,例如当候选推荐集合包括100个多媒体信息时,设置将最后10个作为每次的尾部,那么100个中后10个则可以构成一个历史尾部集合。
召回集合:召回集合是指采用召回方法,从多媒体信息库中召回的多媒体信息所构成的集合。
候选推荐集合:候选推荐集合是指进入到精排阶段的少量优质的多媒体信息所构成的集合。
推荐属性信息:是指与多媒体信息推荐有关的属性信息,可基于用户的历史推荐信息以及当前推荐场景信息中获得,例如可以包括推荐维度信息以及推荐频率等信息。
推荐维度信息:用于表征推荐请求对应的信息展示位的来源信息。具体而言,推荐系统可以是面向多个应用程序(application,APP)的,例如对于一个广告推荐系统而言,其功能是进行广告推荐,但是在多个APP中都可能涉及广告推荐,因此广告推荐系统可以接入这些APP,那么来源信息则可以是指具体来源于哪个APP;针对一个APP中,其包含不同的广告推荐场景,例如对于一个新闻APP而言,可以在娱乐版块进行广告推荐,也可以在体育板块进行广告推荐,那么来源信息则可以是指具体来源于哪个推荐场景;而一个APP或者一个推荐场景中也可以包含多个不同的广告展示位,那么来源信息还可以是指具体来源于哪个广告展示位。
广告主:广告主是广告活动的发起者,是在网上销售或宣传自己产品和服务的商家,任何推广、销售其产品或服务的商家都可以作为广告主。广告主发布广告活动,并按照广告平台完成的广告活动中规定的营销效果的总数量及单位效果价格向网站主支付费用。
智能出价广告:是一种新的出价方式,广告主设置优化目标,如移动应用的下载、激活或者付费等,以及愿意为优化目标付出的转化成本,广告平台在存在曝光机会时自动进行出价,使得广告的实际转化成本接近广告主预期的转化成本。其中,在存在一个曝光机会时,广告平台为多个广告自动出价,并根据各个广告的出价来决定广告的排序,从而决定广告是否能够获取此次曝光。该过程也会影响到广告获得曝光之后实际转化成本是否符合广告主预期的转化成本。例如对于优化行为出价(optimized cost per action,ocpa)方案而言,将每千次曝光的总扣费(effective cost per mille,ecpm)作为广告竞价排序的指标,通过计算获得各个广告的ecpm,ecpm高的广告优先进行曝光。
下面对本申请实施例的设计思想进行简要介绍。
在推荐系统中,召回和粗排环节的准确度,一定程度上决定了推荐系统的整体准确率。在每次进行推荐时,都需要进行召回、粗排以及精排过程,而召回、粗排以及精排过程可能采用不同的排序方式,因此在召回、粗排以及精排过程对于多媒体信息的排序是可能存在偏差的,举例来讲,某个多媒体信息在召回阶段的推荐度较高,但是有可能在精排阶段其推荐度并不高,但是召回、粗排决定了能够进入精排阶段的多媒体信息。经过对相关技术中的推荐过程进行研究发现,在为每个账户进行多媒体信息推荐时,短时间内能够进入候选推荐集合的多个多媒体信息都是大致相同的,而精排模型对进入到精排阶段的多媒体信息预估出来的推荐度存在较高的一致性,也就是说,上一次位于候选推荐集合尾部的多媒体信息在下一次推荐时,较大机会仍然位于尾部,相当于这些多媒体信息并不会被推荐给用户,但是候选推荐集合的数量通常是有限的,这些多媒体信息却长期占据着候选推荐集合的名额,导致精排队列利用率降低,并且当召回以及粗排阶段的误差较大时,使得有可能被推荐给用户的其他多媒体信息无法进入候选推荐集合,这些多媒体信息无法被准确的推荐给用户,使得推荐系统准确率相对较低。
基于此,本申请实施例提供一种多媒体信息推荐方法,在该方法中,收集目标账户的历史尾部集合,每个历史尾部集合包括历史推荐请求对应的候选推荐集合中的尾部多媒体信息,在向目标账户进行多媒体信息推荐时,基于至少一个历史尾部集合以及设定的过滤策略,构造信息过滤集合,进而再进行召回之后,从召回集合中筛除信息过滤集合包括的多媒体信息,并基于筛除之后的召回集合进行推荐。这样,由于候选推荐集合中的尾部是通常是没有机会推荐给用户的,通过将尾部多媒体信息过滤,避免这些尾部多媒体信息长期占用候选推荐集合名额,给予其他多媒体信息能够进入候选推荐集合的机会,提升候选推荐集合的利用率,同时,尾部多媒体信息的产生可能是召回或者粗排阶段对于这些多媒体信息的推荐度的高估造成的,将这些过滤之后,实质上是对召回或者粗排阶段的预估校正,从而提升了多媒体信息召回准确度,进而提升了推荐系统的整体准确率。
本申请实施例中,针对不同的推荐维度,分别进行尾部集合的收集以及过滤,并针对不同的推荐维度,可采用不同的过滤策略参数,使得该方法更能够适用于不同推荐维度,进而使得各个推荐维度的准确率得以提升。
在介绍完本申请实施例的设计思想之后,下面对本申请实施例的技术方案能够适用的应用场景做一些简单介绍,需要说明的是,以下介绍的应用场景仅用于说明本申请实施例而非限定。在具体实施过程中,可以根据实际需要灵活地应用本申请实施例提供的技术方案。
本申请实施例提供的方案可以适用于大多数多媒体信息推荐场景中,例如广告推荐场景。如图1所示,为本申请实施例提供的一种应用场景图,在该场景中,包括终端设备101、后台服务器102和推荐服务器103。
终端设备101例如可以为手机、平板电脑(PAD)、笔记本电脑、台式电脑、智能电视以及智能可穿戴设备等。终端设备101可以安装有可以进行多媒体信息展示的应用,例如浏览器、视频应用、新闻应用或者社交应用等,用户可以通过在应用上进行浏览的同时查看到为其推荐的多媒体信息。本申请实施例涉及的应用可以是软件客户端,也可以是网页、小程序等客户端,不限制客户端的具体类型。
服务器102可以为终端设备101上安装的应用所对应的后台服务器,推荐服务器103为用于进行多媒体信息推荐的专用服务器。后台服务器102和推荐服务器103例如可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器,但并不局限于此。
在一种可能的实施方式中,用户在终端设备101上进行浏览时,可触发进行多媒体信息推荐的推荐请求。例如当用户打开某个视频页面时,则终端设备101向后台服务器102发起视频页面请求,而该视频页面包含信息展示位,那么则会触发后台服务器102向推荐服务器103发送推荐请求,以请求在该信息展示位展示的多媒体信息。
在另一种可能的实施方式中,用户在终端设备101上进行浏览时,可触发直接向推荐服务器103发送进行多媒体信息推荐的推荐请求,并向后台服务器102发起请求视频页面的其他内容的视频页面请求。
推荐服务器103可以包括一个或多个处理器1031、存储器1032以及与终端交互的I/O接口1033等。此外,推荐服务器103还可以配置数据库1034,数据库1034可以用于存储各个账户的历史推荐尾部集合以及所有的多媒体信息等。其中,推荐服务器103的存储器1032中还可以存储本申请实施例提供的多媒体信息推荐方法的程序指令,这些程序指令被处理器1031执行时能够用以实现本申请实施例提供的多媒体信息推荐方法的步骤,以确定向用户推荐的多媒体信息,进而将该多媒体信息推送给目标账户。
在具体实施时,后台服务器102和推荐服务器103可以是分别独立的服务器,也可以是部署于同一物理服务器的不同功能部分,还可以是后台服务器102和推荐服务器103为同一服务器,即多媒体信息推荐过程可以由终端设备101上应用的后台服务器来实现,那么终端设备101可直接向终端设备101发起推荐请求。对于具体的部署方式,本申请实施例并不进行限制。
终端设备101、后台服务器102和推荐服务器103之间可以通过一个或者多个网络104进行直接或间接的通信连接。该网络104可以是有线网络,也可以是无线网络,例如无线网络可以是移动蜂窝网络,或者可以是无线保真(Wireless-Fidelity,WIFI)网络,当然还可以是其他可能的网络,本申请实施例对此不做限制。
需要说明的是,在本申请实施例中,终端设备101的数量可以为一个,也可以为多个,同样的,推荐服务器103的数量也可以为一个,也可以为多个,也就是说对于终端设备101或者推荐服务器103的数量并不进行限制。
参见图2所示,为推荐服务器103的系统架构示意图。其中,推荐服务器103包括接入层模块103a、精排和过滤(Mixer)模块103b、召回模块103c、粗排模块103d以及数据存储模块103e。
(1)接入层模块103a
接入层模块103a负责推荐服务器103的请求接入工作,用于获取用户的推荐请求,并对推荐请求进行一定的协议处理,以识别推荐请求内容以及协议转换。
(2)Mixer模块103b
Mixer模块103b可进一步包括数据获取子模块103b1、信息过滤集合构造子模块103b2、精排子模块103b3和数据处理子模块103b4,数据获取子模块103b1用于从数据存储模块103e中获取推荐请求对应的目标账户的历史尾部集合,并将历史尾部集合传递给信息过滤集合构造子模块103b2,信息过滤集合构造子模块103b2基于历史尾部集合构造信息过滤集合,精排子模块103b3用于实现推荐过程中的精排过程,数据处理子模块103b4用于对本次推荐请求的尾部集合进行数据处理后,存储至数据存储模块103e中。
(3)召回模块103c和粗排模块103d分别用于实现推荐过程中的召回和粗排过程。
(4)数据存储模块103e
数据存储模块103e用于存储推荐相关的各种信息,例如各个账户的历史尾部集合等信息。数据存储模块103e存储每个账户在最近X小时内发起的请求经过精排后的尾部集合,且最多存储Y次历史推荐请求的尾部集合。
上述各个模块执行的方法步骤将在后续的实施例中具体进行介绍,因此在此先不过多赘述。
在一种可能的应用场景中,本申请实施例中推荐相关的各种数据可以采用云存储技术进行存储。云存储(cloudstorage)是在云计算概念上延伸和发展出来的一个新的概念,分布式云存储系统是指通过集群应用、网格技术以及分布存储文件系统等功能,将网络中大量各种不同类型的存储设备(或称存储节点)通过应用软件或应用接口集合起来协同工作,共同对外提供数据存储和业务访问功能的一个存储系统。
在一种可能的应用场景中,为了便于降低通信时延,可以在各个地区部署推荐服务器103,或为了负载均衡,可以由不同的推荐服务器103分别去服务各个终端设备101对应的地区。多个推荐服务器103以通过区块链实现数据的共享,多个推荐服务器103相当于多个推荐服务器103组成的数据共享系统。例如终端设备101位于地点a,其对应的推荐服务器103为第一推荐服务器103,则第一推荐服务器103为地点a的终端设备101提供推荐服务,终端设备101位于地点b,其对应的推荐服务器103为第二推荐服务器103,则第二推荐服务器103为地点b的终端设备101提供推荐服务。
对于数据共享系统中的每个推荐服务器103,均具有与该推荐服务器103对应的节点标识,数据共享系统中的每个推荐服务器103均可以存储有数据共享系统中其他推荐服务器103的节点标识,以便后续根据其他推荐服务器103的节点标识,将生成的区块广播至数据共享系统中的其他推荐服务器103。每个推荐服务器103中可维护一个如下表所示的节点标识列表,将推荐服务器103名称和节点标识对应存储至该节点标识列表中。其中,节点标识可为网络之间互联的协议(InternetProtocol,IP)地址以及其他任一种能够用于标识该节点的信息,表1中仅以IP地址为例进行说明。
服务器名称 节点标识
节点1 119.115.151.174
节点2 118.116.189.145
节点N 119.124.789.258
表1
当然,本申请实施例提供的方法并不限用于图1或图2所示的应用场景中,还可以用于其他可能的应用场景,本申请实施例并不进行限制。对于图1或图2所示的应用场景的各个设备所能实现的功能将在后续的方法实施例中一并进行描述,在此先不过多赘述。
请参见图3,为本申请实施例提供的多媒体信息推荐方法的流程示意图,该方法可以通过图1或图2中的推荐服务器103或者终端设备101来执行,这里主要以推荐服务器103来执行为例进行介绍,该方法的流程介绍如下。
步骤301:基于目标账户的目标推荐请求,获取目标账户的至少一个历史尾部集合;其中,每个历史尾部集合包括一个历史推荐请求对应的候选推荐集合中,按照推荐度由高到低进行排序时的最后N个多媒体信息,N为正整数。
本申请实施例中,步骤301的过程例如可以通过上述Mixer模块103b包括的数据获取子模块103b1来实现。
具体的,当用户在终端设备上进行页面浏览时,由于页面中可能存在信息展示位,因而则会触发发起针对该信息展示位的推荐请求。
参见图4所示,当用户在进行视频播放时,视频播放页面存在信息展示位,那么终端设备会向后台服务器发起视频播放请求,以请求视频播放页面的数据。其中,视频播放请求中可以携带请求信息展示位所要展示的多媒体信息的目标推荐请求,进而后台服务器可以向推荐服务器发送目标推荐请求;当然,终端设备也可以在向后台服务器发起视频播放请求时,还向推荐服务器发起目标推荐请求,以获取该信息展示位所要展示的多媒体信息。
当然,图4的视频播放页面的信息展示位只是一种可能的展示多媒体信息的情况,在其他场景或者应用中,同样可以存在展示多媒体信息的信息展示位,如新闻应用中新闻信息页面、社交平台应用中的动态分享页面以及音乐应用中的音乐播放页面。
考虑到在为每个账户进行多媒体信息推荐时,短时间内能够进入候选推荐集合的多个多媒体信息都是大致相同的,也就是说,上一次位于候选推荐集合尾部的多媒体信息在下一次推荐时,较大机会仍然位于尾部,相当于这些多媒体信息并不会被推荐给用户,但是候选推荐集合的数量通常是有限的,这些多媒体信息却长期占据着候选推荐集合的名额,使得有可能被推荐给用户的其他多媒体信息无法进入候选推荐集合。因此,在每次进行精排之后,可以将候选推荐集合中的尾部多媒体信息进行存储,参见图2所示,将包含每个推荐集合的尾部多媒体信息的尾部集合存储至数据存储模块103e中,每个历史尾部集合包括一个历史推荐请求对应的候选推荐集合中,按照推荐度由高到低进行排序时的最后N个多媒体信息,N的数值可根据具体的情况进行设置,本申请实施例对此不做限制。
本申请实施例中,在进行尾部集合的存储时,可以是按照预设的存储参数进行存储,存储参数可以包括所需要存储的历史推荐请求的数量Y和每个历史推荐请求对应的尾部集合中多媒体信息的数量,也就是上述的N。其中,存储参数可以是用户自行设定的,也可以是推荐系统根据推荐属性信息设置的。
参见图5所示,为尾部集合的存储结构示意图。图5中具体以一个账户的尾部集合存储为例,每个账户包括Y个历史推荐请求对应的尾部集合,也就是说Y个尾部集合,且每个尾部集合包括精排时排序最靠后的N个多媒体信息。当然,数据存储模块也可以存储每个历史推荐请求对应的精排队列中所有的多媒体信息。
在一种可能的实施方式中,推荐属性信息可以为向目标账户的推荐频率,例如,在推荐频率较高时,可以将历史推荐请求的数量设置的较大,且每个尾部集合中多媒体信息的数量设置的较大。
在另一种可能的实施方式中,推荐属性信息可以为推荐维度信息,那么可以按照推荐维度的不同分别存储尾部集合。
例如,当推荐系统向不同的APP进行多媒体信息的推荐时,那么推荐维度则可以为各个APP,那么对于一个账户而言,可以将不同APP对应的历史推荐请求的尾部集合分别进行存储,并可基于不同APP设置对应的存储参数Y和N,那么在进行存储时,可以获取所在推荐维度所对应的存储参数Y和N的值,并基于存储参数Y和N的值进行存储。
又例如,推荐维度还可以为同一APP内不同的推荐场景,例如对于社交APP而言,可以在个人动态分享页面和游戏动态分享页面分别设置信息展示位,那么个人动态分享页面和游戏动态分享页面属于不同的推荐场景,属于不同的推荐维度,那么也可以基于不同推荐场景设置对应存储参数Y和N。
当然,推荐维度还可以具体到各个信息展示位,即一个推荐维度可以为一个信息展示位,继而可以根据不同的信息展示位设置对应存储参数Y和N。
本申请实施例中,以目标账户为例,目标账户可以为推荐系统中的任一账户,当接收到目标账户的推荐请求时,则可以基于目标账户的账户标识以及推荐属性信息,从对应的历史尾部集合中获取目标账户的历史尾部集合。
示例性的,当每个账户的历史尾部集合按照账户分别进行存储时,针对目标账户,则可以基于目标账户的账户标识,获取历史尾部集合;当每个账户的历史尾部集合按照不同的APP分别进行存储时,则可以基于目标推荐请求的来源APP,获取该APP对应的历史尾部集合。
具体的,由于目标推荐请求可能来自不同的APP,而不同的APP所使用的协议可能不同,因此在接收到目标推荐请求后,可以先对目标推荐请求进行协议识别,确定出发送目标推荐请求的目标站点,即目标APP,从而可以基于目标站点对应的解析方式,对目标推荐请求进行数据解析,获得目标推荐请求对应的信息展示位的来源信息,进而,基于信息展示位的来源信息,确定目标推荐请求所属的推荐维度,并从该推荐维度对应的历史尾部集合中,获取至少一个历史尾部集合。
步骤302:基于至少一个历史尾部集合以及设定的过滤策略,构造包含至少一个多媒体信息的信息过滤集合。
本申请实施例中,步骤302的过程例如可以通过上述Mixer模块103b包括的信息过滤集合构造子模块103b2来执行。
在每次进行推荐时,都需要进行召回、粗排以及精排过程,而召回、粗排以及精排过程可能采用不同的排序方式,因此在召回、粗排以及精排过程对于多媒体信息的排序是可能存在偏差的,举例来讲,某个多媒体信息在召回阶段的推荐度较高,但是有可能在精排阶段其推荐度并不高,但是召回、粗排决定了能够进入精排阶段的多媒体信息。因此,在本申请实施例中,在获取目标账户的至少一个历史尾部集合后,则可以基于设定的过滤策略,为本次推荐过程构造信息过滤集合,信息过滤集合是本次推荐过程中,在进行召回之后需要过滤的多媒体信息。
具体的,过滤策略指示了信息过滤集合中多媒体信息的选取方式,例如选取方式可以是将所有尾部集合的多媒体信息作为信息过滤集合所包括的多媒体信息的方式;或者,选取方式还可以是按照一定的排序方式对各个多媒体信息进行排序后,从中选取满足条件的多媒体信息的方式;或者,选取方式还可以是从每个尾部集合选取部分多媒体信息,构成信息过滤集合的方式。
本申请实施例中,过滤策略具体包括多个过滤参数,过滤参数可以包括如下参数的一种或者多种:
(1)尾部集合的有效时长阈值
考虑到用户的页面浏览频率并不是固定的,因此有可能在一段时间内浏览频率很高,那么在这段时间内历史尾部集合的更新相应很频繁,那么数据存储模块中存储的历史尾部集合始终是近期时间段内的,而在另一段时间段,用户的浏览频率又可能很低,那么在这段时间内可能很久都不会对历史尾部集合进行更新,那么数据存储模块中存储的历史尾部集合就有可能包含较长时间以前的尾部集合,而这些尾部集合对于本次推荐过程的参考意义并不大,因此可以不使用这些尾部集合,基于此,设置了有效时长阈值,用于帮助判断尾部集合是否处于有效状态,当一个历史尾部集合对应的历史推荐请求的生成时刻与当前时刻之间的时间差不大于所述时长阈值时,该历史尾部集合就处于有效状态,否则处于无效状态,在构造信息过滤集合时,不再使用该历史尾部集合。
(2)历史尾部集合的数量Z
即在构造信息过滤集合时,获取最近Z条历史推荐请求对应的历史尾部集合作为构造基础。
(3)需要获取的多媒体信息的数量M。
即在构造信息过滤集合时,选取每个尾部集合包括的M个多媒体信息作为构造基础。
当然,过滤策略的设置可以依据具体情况进行调整,例如过滤策略还可以是获取最近Z条历史推荐请求中每条历史推荐请求的尾部M个广告,由这Z*M个多媒体信息组成信息过滤集合。
在具体实施过程中,由于不同业务不同流量天然存在差异,例如不同推荐场景或者不同APP的推荐频率都不同,因此,在每个流量的最优过滤参数也可能不一样,进而,针对不同的推荐属性信息,可以采取不同的过滤策略或者过滤参数。例如,当向用户的推荐频率不同时,过滤策略中的过滤参数值可以不同,或者,当推荐维度信息不同时,过滤策略中的过滤参数值也可以不同。
具体的,针对不同的推荐属性信息的最佳过滤参数,可以通过在实验阶段设置多组不同的过滤参数,对比多组实验的线上实际效果确定每个流量的最优过滤参数。当然,也可以根据经验值进行设定。
在具体实施时,可以根据目标推荐请求所对应的推荐属性信息,确定目标推荐请求所对应的过滤策略以及过滤参数,进而根据确定的过滤策略以及过滤参数,构造信息过滤集合。此外,考虑到选取的各个历史尾部集合中,可能存在重复的多媒体信息,因此,还可以对构造的信息过滤集合进行去重操作,最后将去重之后的信息过滤集合提供给召回模块。
步骤303:针对目标推荐请求,获取包含多个多媒体信息的召回集合,并从召回集合中筛除信息过滤集合包括的多媒体信息。
本申请实施例中,步骤303的过程可以通过图2所示的召回模块来进行。具体的,在进行多媒体信息的召回时,针对目标推荐请求,可以选取不同的召回方式对其进行多媒体信息的召回,并根据召回的多个多媒体信息构成召回集合。
其中,召回方式可以为任何可能的召回方式,例如基于用户与多媒体信息的协同过滤方式以及基于当前信息展示位所在页面显示的内容与多媒体信息的协同过滤方式等。
在每次进行推荐时,召回、粗排决定了能够进入精排阶段的多媒体信息,为避免尾部多媒体信息长期占据进入精排的候选推荐集合,给其他可能在精排阶段能够得到较高推荐的多媒体信息进入精排的机会,在获得召回集合之后,则会将召回集合中将信息过滤集合包括的多媒体信息筛除,从而其余多媒体信息则可以有机会进入到精排阶段。例如,每次召回的多媒体信息数量为10000个,经过粗排之后选取1000个作为候选推荐集合进入精排阶段,那么在召回之后,将信息过滤集合中的多媒体信息进行过滤之后,这些原本是会位于候选推荐集合的1000个之中,但是经过过滤之后,则会选取其他较为优质的多媒体信息加入候选推荐集合,这些新的多媒体信息在精排阶段有可能会获得更好的排序,进而被推荐给用户。
步骤304:基于筛除后的召回集合,获得目标推荐请求对应的候选推荐集合,并从候选推荐集合中,确定出为目标账户推荐的目标多媒体信息。
本申请实施例中,将信息过滤集合中的多媒体信息进行过滤之后,则可以从筛除后的召回集合中,通过粗排排序过程,选取一定的数量的多媒体信息,作为本次推荐过程的候选推荐集合,进而在基于精排过程,从候选推荐集合中,确定出为目标账户推荐的目标多媒体信息。
本申请实施例中,步骤302可以通过如图6的流程来实现,图6为构造信息过滤集合的流程示意图,该流程介绍如下。
步骤3021:基于设定的时长阈值,确定目标账户的至少一个历史尾部集合中处于有效状态的历史尾部集合。
本申请实施例中,判断一个历史尾部集合是否还处于有效期时,可以基于该历史尾部集合对应的历史推荐请求的生成时刻,也就是用户发起历史推荐请求的时刻,获取生成时刻与当前时刻之间的时间差,当时间差不大于时长阈值时,则确定该历史尾部集合处于有效状态,否则,当时间差大于时长阈值时,则确定该历史尾部集合处于无效状态,在后续进行信息过滤集合的构建时,不使用该历史尾部集合。
步骤3022:基于目标账户或者目标推荐请求的推荐属性信息,获取过滤策略中与推荐属性信息对应的各个过滤参数的取值。
具体的,在确定各个过滤参数的取值是,可以采用如下方式中的任意一种:
在一种可能的实施方式中,预先针对各个推荐维度信息设置好对应的过滤参数信息,那么可以首先确定目标推荐请求所属的推荐维度信息,进而,获取过滤策略中与推荐维度信息对应的各个过滤参数的取值。
在另一种可能的实施方式中,预先针对不同的推荐频率设置好对应的过滤参数信息,那么可以首先确定目标账户的第一推荐频率,进而,获取过滤策略中与第一推荐频率对应的各个过滤参数的取值。第一推荐频率可以是指目标账户整体的推荐频率,可以通过推荐系统中所有历史为该账户推荐的记录计算得到。
在又一种可能的实施方式中,可以根据目标账户在目标推荐请求所属推荐维度的第二推荐频率,获取过滤策略中与第二推荐频率对应的各个过滤参数的取值。在该实施方式中,针对不同的推荐维度分别统计账户的推荐频率,进而根据确定的推荐频率,获取相对应的过滤参数信息。
步骤3023:基于获得的各个过滤参数的取值,从处于有效状态的历史尾部集合中选取至少一个多媒体信息,构成信息过滤集合。
这里以过滤参数包括历史推荐请求的数量Z,以及从每个历史尾部集合选取的多媒体信息的数量M为例,那么则可以从处于有效状态的历史尾部集合中,选取按照时间差由大到小进行排序后,最后Z个历史推荐请求对应的历史尾部集合,也就是选取有效状态的历史尾部集合中最近Z个历史尾部集合,并从这Z个历史尾部集合中,各自选取按照推荐度由高到低进行排序后的最后M个多媒体信息,进而基于分别从Z个历史尾部集合中各自获得的M个多媒体信息,构造信息过滤集合。
参见图7所示,在数据存储模块中存储了目标账户的Y条历史推荐请求对应的历史尾部集合,每个历史尾部集合包括N个多媒体信息,则当过滤策略中的过滤参数为选取最近Z条历史推荐请求的后M个多媒体信息时,如图7所示,从处于有效状态的历史尾部集合中选取最近的Z个历史尾部集合,并从每个历史尾部集合中选取M个多媒体信息,从而得到Z*M个多媒体信息,对其进行去重后,则得到信息过滤集合。
本申请实施例中,步骤304中选取目标多媒体信息的过程可以通过如图8的流程来实现,图8为精排过程的流程示意图,该流程可以利用如图2所示的精排子模块103b3来执行,该流程介绍如下。
步骤3041:采用已训练的互动率获取模型,分别基于所述候选推荐集合中各个多媒体信息的资源属性信息,获得各个多媒体信息各自对应的预估互动率。
互动率获取模型是利用大量已标注的训练样本训练得到的,每个训练样本包含了账户信息、多媒体信息的资源属性信息以及信息展示位相关信息,并为该训练样本标注了该账户是否点击该多媒体信息的标签。在具体实施时,这些训练样本可以从历史数据库中获取。
其中,资源属性信息为多媒体信息相关的属性信息,例如当多媒体信息为广告时,资源属性信息可以包括广告名称、广告所属的广告主、广告的优化目标、广告涉及的商品等信息。
步骤3042:分别基于获得的各个预估互动率,确定各个多媒体信息在信息展示位上进行设定次数的展示后,所能获得的预估电子资源量。
这里是以智能出价广告中ocpa方案为例,预估电子资源量可以为ecpm,ecpm的计算公式如下:
ecpm=bid×pCTR×pCVR×lambda
其中,bid为广告主设置的预期转化成本,pCTR为通过点击率精准预估模型得到的预估点击率,pCVR为通过转化率精准预估模型得到的预估转化率,lambda为实时调节因子,用于调节广告的平均转化成本。
当然,根据所采用的排序方式不同时,预估电子资源量也可以为其他对应的参数,本申请实施例对此不做限制。
步骤3043:基于获得的各个预估电子资源量由高到低的顺序,对所述多个多媒体信息进行排序。
步骤3044:根据排序结果,从候选推荐集合中确定出所述目标多媒体信息。
具体的,可以根据排序结果,从候选推荐集合中选取预估电子资源量较高的一个或者多个多媒体信息作为目标多媒体信息,并推荐给目标账户。
本申请实施例中,通过图8所示的流程对候选推荐集合中各个多媒体信息进行排序之后,还可以从本次精排过程中的候选推荐集合中选取尾部集合,并存储到数据存储模块,以供后续的推荐过程使用,该过程可以通过图2所示的Mixer模块103b中数据处理子模块103b4来执行。
具体的,根据精排获得的排序结果,从候选推荐集合选取排序最靠后的N个多媒体信息,构成目标推荐请求对应的目标尾部集合,从而将目标尾部集合作为历史尾部集合,添加至目标账户的历史尾部集合库中。
在存储历史尾部集合时,可以基于目标推荐请求所对应的推荐属性信息,将目标推荐请求对应的目标尾部集合存储至相应的目标尾部集合中,例如按照推荐维度信息划分历史尾部集合库,进而可以确定目标推荐请求所对应的推荐维度,并将目标尾部集合添加至相应推荐维度的历史尾部集合库。
本申请实施例中,在存储历史尾部集合时,还可以存储每个尾部集合的相关信息,相关信息可以包括如下信息中的一种或者多种的组合:
(1)目标账户的账户标识。
(2)目标推荐请求的生成时刻,可用于帮助判断历史尾部集合是否过期。
(3)目标推荐请求对应的信息展示位标识,可用于帮助确定目标推荐请求在信息展示位所在维度的推荐维度信息。
(4)目标推荐请求对应的信息展示场景标识,可用于帮助确定目标推荐请求在推荐场景所在维度的推荐维度信息。
(5)目标推荐请求对应的目标站点标识,可用于帮助确定目标推荐请求在站点所在维度的推荐维度信息,目标站点标识表明目标推荐请求来自哪个站点,也就是APP。
下面,结合图2所示的架构,以广告推荐为例,对本申请实施例的技术方案过程进行介绍,参见图9所示,为进行广告推荐的流程示意图。
在进行广告推荐之前,需要预先设置好相关的参数,相关的参数可以包括存储参数和过滤策略的过滤参数,存储参数包括存储的历史广告推荐请求的队列长度以及存储的每次请求精排后尾部广告的个数。过滤参数包括有效时长阈值、获取的历史广告推荐请求队列的最大长度以及需要获取的尾部广告的个数。
S1:用户侧触发向推荐服务器的接入层模块发起广告推荐请求。
S2:接入层模块对广告推荐请求进行协议转化,转化为采用合法的内部协议的内部推荐请求,然后向Mixer模块发起内部推荐请求。
S3:Mixer模块的数据获取子模块会根据当前请求的目标账户的身份标识(identity,ID),去数据存储模块获取相应的历史尾部广告集合。
其中,数据存储模块存储了每个账户在最近X小时内发起的广告推荐请求,经过精排阶段后的尾部广告集合,这些广告按照ecpm排序,且最多存储Y次广告推荐请求的信息。
S4:数据获取子模块将历史尾部广告集合发送给信息过滤集合构造子模块。
S5:信息过滤集合构造子模块将获取到的尾部广告集合,根据设置的时间阈值判断每个尾部广告集合是否过期,再按照指定的过滤参数获取最近Z条请求,及每条请求的尾部M个广告,基于这Z*M个广告去重后组成广告过滤集合,并将构造好的广告过滤集合传给广告召回模块。
S6:进行广告召回流程后,对召回集合进行一次遍历,对在召回集合中且在广告过滤集合中的广告在召回集合进行筛除。
S7:粗排后将候选广告集合返回给Mixer模块。
S8:精排过程完成后,将本次精排过程的尾部广告集合信息发送给数据处理模块。
其中,广告集合信息可以包括账户id、广告推荐请求的请求时间戳、广告位id、场景id、站点id、按ecpm排序的每个广告的广告id等信息。
其中,在精排阶段对各个广告按照设定的排序方式,如基于ecpm进行排序,选择排序最靠前的广告返回给接入层,由接入层发送到用户侧,以将选取的广告展示给用户。
S9:数据存储模块将尾部广告集合信息更新到数据存储模块,并且判断原先存储的尾部广告集合有无过期情况,如有数据过期则将对应数据删除,保证当前存储队列中的数据都在有效期内,且最多有Y次请求的信息。
针对广告推荐系统,由于对历史尾部广告进行了过滤,使得其他广告有进入精排队列的机会,而这些广告可能在召回或者粗排阶段无法取得较好的得分,但是在精排有可能获得较好的得分,有可能会被推荐给用户,从而提升广告平台的推荐准确率,进而提升平台的流量网站成交金额(Gross Merchandise Volume,GMV)。
请参见图10,基于同一发明构思,本申请实施例还提供了一种多媒体信息推荐装置100,该装置包括:
获取单元1001,用于基于目标账户的目标推荐请求,获取目标账户的至少一个历史尾部集合;其中,每个历史尾部集合包括一个历史推荐请求对应的候选推荐集合中,按照推荐度由高到低进行排序时的最后N个多媒体信息,N为正整数;
构造单元1002,用于基于至少一个历史尾部集合以及设定的过滤策略,构造包含至少一个多媒体信息的信息过滤集合;
筛除单元1003,用于针对目标推荐请求,获取包含多个多媒体信息的召回集合,并从召回集合中筛除信息过滤集合包括的多媒体信息;
推荐单元1004,用于基于筛除后的召回集合,获得目标推荐请求对应的候选推荐集合,并从候选推荐集合中,确定出为目标账户推荐的目标多媒体信息。
可选的,构造单元1002,具体用于:
基于设定的时长阈值,确定至少一个历史尾部集合中处于有效状态的历史尾部集合;其中,当一个历史尾部集合对应的历史推荐请求的生成时刻与当前时刻之间的时间差不大于时长阈值时,一个历史尾部集合处于有效状态;
基于目标账户或者目标推荐请求的推荐属性信息,获取过滤策略中与推荐属性信息对应的各个过滤参数的取值;
基于获得的各个过滤参数的取值,从处于有效状态的历史尾部集合中选取至少一个多媒体信息,构成信息过滤集合。
可选的,构造单元1002,具体用于:
根据目标推荐请求所属的推荐维度信息,获取过滤策略中与推荐维度信息对应的各个过滤参数的取值;其中,推荐维度信息用于表征目标推荐请求对应的信息展示位的来源信息;
根据目标账户的第一推荐频率,获取过滤策略中与第一推荐频率对应的各个过滤参数的取值;
根据目标账户在目标推荐请求所属推荐维度的第二推荐频率,获取过滤策略中与第二推荐频率对应的各个过滤参数的取值。
可选的,各个过滤参数包括历史尾部集合对应的历史推荐请求的数量Z,以及从每个历史尾部集合选取的多媒体信息的数量M,其中,M为正整数,且M≤N;则构造单元1002,具体用于:
从处于有效状态的历史尾部集合中,选取按照时间差由大到小进行排序后,最后Z个历史推荐请求对应的历史尾部集合;其中,时间差为各个历史尾部集合对应的历史推荐请求的生成时刻与当前时刻之间的时间差;
分别在最后Z个历史尾部集合中,各自选取按照推荐度由高到低进行排序后的最后M个多媒体信息;
基于分别从Z个历史尾部集合中各自获得的M个多媒体信息,构造信息过滤集合。
可选的,获取单元1001,具体用于:
对目标推荐请求进行协议识别,确定发送目标推荐请求的目标站点;
基于目标站点对应的解析方式,对目标推荐请求进行数据解析,获得目标推荐请求对应的信息展示位的来源信息;
基于信息展示位的来源信息,确定目标推荐请求所属的推荐维度,并从推荐维度对应的历史尾部集合中,获取至少一个历史尾部集合。
可选的,推荐单元1004,具体用于:
采用已训练的互动率获取模型,分别基于候选推荐集合中各个多媒体信息的资源属性信息,获得各个多媒体信息各自对应的预估互动率;
分别基于获得的各个预估互动率,确定各个多媒体信息在信息展示位上进行设定次数的展示后,所能获得的预估电子资源量;
基于获得的各个预估电子资源量由高到低的顺序,对多个多媒体信息进行排序;
根据排序结果,从候选推荐集合中确定出目标多媒体信息。
可选的,该装置还包括集合更新单元1005,用于:
基于排序结果,从候选推荐集合选取排序最后的N个多媒体信息,构成目标推荐请求对应的目标尾部集合;
将目标尾部集合作为历史尾部集合,添加至目标账户的历史尾部集合库中。
可选的,集合更新单元1005,还用于:
将目标尾部集合的相关信息,添加至目标账户的历史尾部集合库中;其中,相关信息,包括如下信息中的一种或者多种的组合:
目标账户的账户标识;
目标推荐请求的生成时刻;
目标推荐请求对应的信息展示位标识;
目标推荐请求对应的信息展示场景标识;
目标推荐请求对应的目标站点标识。
该装置可以用于执行图3~图9所示的实施例中所示的方法,因此,对于该装置的各功能模块所能够实现的功能等可参考图3~图9所示的实施例的描述,不多赘述。
请参见图11,基于同一技术构思,本申请实施例还提供了一种计算机设备110,可以包括存储器1101和处理器1102。
所述存储器1101,用于存储处理器1102执行的计算机程序。存储器1101可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据计算机设备的使用所创建的数据等。处理器1102,可以是一个中央处理单元(central processing unit,CPU),或者为数字处理单元等等。本申请实施例中不限定上述存储器1101和处理器1102之间的具体连接介质。本申请实施例在图11中以存储器1101和处理器1102之间通过总线1103连接,总线1103在图11中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。所述总线1103可以分为地址总线、数据总线、控制总线等。为便于表示,图11中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器1101可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器1101也可以是非易失性存储器(non-volatilememory),例如只读存储器,快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD)、或者存储器1101是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器1101可以是上述存储器的组合。
处理器1102,用于调用所述存储器1101中存储的计算机程序时执行如图3~图9所示的实施例中设备所执行的方法。
在一些可能的实施方式中,本申请提供的方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在计算机设备上运行时,所述程序代码用于使所述计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的方法中的步骤,例如,所述计算机设备可以执行如图3~图9所示的实施例中设备所执行的方法。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (11)

1.一种多媒体信息推荐方法,其特征在于,所述方法包括:
基于目标账户的目标推荐请求,获取所述目标账户的至少一个历史尾部集合;其中,每个所述历史尾部集合包括一个历史推荐请求对应的候选推荐集合中,按照推荐度由高到低进行排序时的最后N个多媒体信息,N为正整数;
基于所述至少一个历史尾部集合以及设定的过滤策略,构造包含至少一个多媒体信息的信息过滤集合;
针对所述目标推荐请求,获取包含多个多媒体信息的召回集合,并从所述召回集合中筛除所述信息过滤集合包括的多媒体信息;
基于筛除后的召回集合,获得所述目标推荐请求对应的候选推荐集合,并从所述候选推荐集合中,确定出为所述目标账户推荐的目标多媒体信息。
2.如权利要求1所述的方法,其特征在于,所述基于所述至少一个历史尾部集合以及设定的过滤策略,构造包含至少一个多媒体信息的信息过滤集合,包括:
基于设定的时长阈值,确定所述至少一个历史尾部集合中处于有效状态的历史尾部集合;其中,当一个历史尾部集合对应的历史推荐请求的生成时刻与当前时刻之间的时间差不大于所述时长阈值时,所述一个历史尾部集合处于有效状态;
基于所述目标账户或者所述目标推荐请求的推荐属性信息,获取所述过滤策略中与所述推荐属性信息对应的各个过滤参数的取值;
基于获得的各个过滤参数的取值,从处于有效状态的历史尾部集合中选取所述至少一个多媒体信息,构成所述信息过滤集合。
3.如权利要求2所述的方法,其特征在于,基于所述目标账户或者所述目标推荐请求的推荐属性信息,获取所述过滤策略中与所述推荐属性信息对应的各个过滤参数的取值,包括如下方式中的任意一种:
根据所述目标推荐请求所属的推荐维度信息,获取所述过滤策略中与所述推荐维度信息对应的各个过滤参数的取值;其中,所述推荐维度信息用于表征所述目标推荐请求对应的信息展示位的来源信息;
根据所述目标账户的第一推荐频率,获取所述过滤策略中与所述第一推荐频率对应的各个过滤参数的取值;
根据所述目标账户在所述目标推荐请求所属推荐维度的第二推荐频率,获取所述过滤策略中与所述第二推荐频率对应的各个过滤参数的取值。
4.如权利要求2所述的方法,其特征在于,所述各个过滤参数包括历史尾部集合对应的历史推荐请求的数量Z,以及从每个历史尾部集合选取的多媒体信息的数量M,其中,M为正整数,且M≤N;
则所述基于获得的各个过滤参数的取值,从处于有效状态的历史尾部集合中选取所述至少一个多媒体信息,构成所述信息过滤集合,包括:
从处于有效状态的历史尾部集合中,选取按照时间差由大到小进行排序后,最后Z个历史推荐请求对应的历史尾部集合;其中,所述时间差为各个历史尾部集合对应的历史推荐请求的生成时刻与当前时刻之间的时间差;
分别在所述最后Z个历史尾部集合中,各自选取按照推荐度由高到低进行排序后的最后M个多媒体信息;
基于分别从所述Z个历史尾部集合中各自获得的M个多媒体信息,构造所述信息过滤集合。
5.如权利要求1~4任一所述的方法,其特征在于,所述基于目标账户的目标推荐请求,获取所述目标账户的至少一个历史尾部集合,包括:
对所述目标推荐请求进行协议识别,确定发送所述目标推荐请求的目标站点;
基于所述目标站点对应的解析方式,对所述目标推荐请求进行数据解析,获得所述目标推荐请求对应的信息展示位的来源信息;
基于所述信息展示位的来源信息,确定目标推荐请求所属的推荐维度,并从所述推荐维度对应的历史尾部集合中,获取所述至少一个历史尾部集合。
6.如权利要求1~4任一所述的方法,其特征在于,从所述候选推荐集合中,确定出为所述目标账户推荐的目标多媒体信息,包括:
采用已训练的互动率获取模型,分别基于所述候选推荐集合中各个多媒体信息的资源属性信息,获得各个多媒体信息各自对应的预估互动率;
分别基于获得的各个预估互动率,确定各个多媒体信息在信息展示位上进行设定次数的展示后,所能获得的预估电子资源量;
基于获得的各个预估电子资源量由高到低的顺序,对所述多个多媒体信息进行排序;
根据排序结果,从所述候选推荐集合中确定出所述目标多媒体信息。
7.如权利要求6所述的方法,其特征在于,在根据获得的各个电子资源量,对所述多个多媒体信息进行排序之后,所述方法还包括:
基于排序结果,从所述候选推荐集合选取排序最后的N个多媒体信息,构成所述目标推荐请求对应的目标尾部集合;
将所述目标尾部集合作为历史尾部集合,添加至所述目标账户的历史尾部集合库中。
8.如权利要求7所述的方法,其特征在于,所述方法还包括:
将所述目标尾部集合的相关信息,添加至所述目标账户的历史尾部集合库中;其中,所述相关信息,包括如下信息中的一种或者多种的组合:
所述目标账户的账户标识;
所述目标推荐请求的生成时刻;
所述目标推荐请求对应的信息展示位标识;
所述目标推荐请求对应的信息展示场景标识;
所述目标推荐请求对应的目标站点标识。
9.一种多媒体信息推荐装置,其特征在于,所述装置包括:
获取单元,用于基于目标账户的目标推荐请求,获取所述目标账户的至少一个历史尾部集合;其中,每个所述历史尾部集合包括一个历史推荐请求对应的候选推荐集合中,按照推荐度由高到低进行排序时的最后N个多媒体信息,N为正整数;
构造单元,用于基于所述至少一个历史尾部集合以及设定的过滤策略,构造包含至少一个多媒体信息的信息过滤集合;
筛除单元,用于针对所述目标推荐请求,获取包含多个多媒体信息的召回集合,并从所述召回集合中筛除所述信息过滤集合包括的多媒体信息;
推荐单元,用于基于筛除后的召回集合,获得所述目标推荐请求对应的候选推荐集合,并从所述候选推荐集合中,确定出为所述目标账户推荐的目标多媒体信息。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,
所述处理器执行所述计算机程序时实现权利要求1至8任一项所述方法的步骤。
11.一种计算机存储介质,其上存储有计算机程序指令,其特征在于,
该计算机程序指令被处理器执行时实现权利要求1至8任一项所述方法的步骤。
CN202110549661.XA 2021-05-20 2021-05-20 多媒体信息推荐方法、装置和设备及计算机存储介质 Pending CN115375339A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110549661.XA CN115375339A (zh) 2021-05-20 2021-05-20 多媒体信息推荐方法、装置和设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110549661.XA CN115375339A (zh) 2021-05-20 2021-05-20 多媒体信息推荐方法、装置和设备及计算机存储介质

Publications (1)

Publication Number Publication Date
CN115375339A true CN115375339A (zh) 2022-11-22

Family

ID=84058464

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110549661.XA Pending CN115375339A (zh) 2021-05-20 2021-05-20 多媒体信息推荐方法、装置和设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN115375339A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115760296A (zh) * 2022-11-24 2023-03-07 阿里巴巴(中国)有限公司 页面数据处理与浏览方法、终端设备及存储介质
CN116382926A (zh) * 2023-06-05 2023-07-04 支付宝(杭州)信息技术有限公司 针对推荐系统的算力优化的方法和装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115760296A (zh) * 2022-11-24 2023-03-07 阿里巴巴(中国)有限公司 页面数据处理与浏览方法、终端设备及存储介质
CN115760296B (zh) * 2022-11-24 2023-10-17 阿里巴巴(中国)网络技术有限公司 页面数据处理与浏览方法、终端设备及存储介质
CN116382926A (zh) * 2023-06-05 2023-07-04 支付宝(杭州)信息技术有限公司 针对推荐系统的算力优化的方法和装置
CN116382926B (zh) * 2023-06-05 2023-08-22 支付宝(杭州)信息技术有限公司 针对推荐系统的算力优化的方法和装置

Similar Documents

Publication Publication Date Title
CN109241425B (zh) 一种资源推荐方法、装置、设备及存储介质
US10803495B2 (en) Advertising creative processing method, advertising creative processing apparatus, and storage medium
JP2022043222A (ja) オンラインメディアインプレッションデータを共有するための装置、記憶媒体及び方法
CN110807655B (zh) 一种广告竞价方法、装置及设备
US20080183561A1 (en) Marketplace for interactive advertising targeting events
CN108154379B (zh) 媒体信息的发布方法和装置
US10282758B1 (en) Pricing control in a real-time network-based bidding environment
US20140074851A1 (en) Dynamic data acquisition method and system
US20200051131A1 (en) Analyzing the advertisement bidding-cha
US11514479B1 (en) Adaptive bidding for networked advertising
CN115375339A (zh) 多媒体信息推荐方法、装置和设备及计算机存储介质
JP4948573B2 (ja) 広告課金装置及び方法
US20230325878A1 (en) Systems and methods for leveraging social queuing to simulate ticket purchaser behavior
CN111054078B (zh) 对象信息获取方法及装置
CN108965360B (zh) 一种推荐数据处理方法及服务器、计算机存储介质
US9306958B2 (en) Methods, systems and media for detecting non-intended traffic using co-visitation information
KR102297814B1 (ko) 홍보영상제작 의뢰인과 크리에이터를 매칭시키는 시스템 및 그 방법
US10304081B1 (en) Yielding content recommendations based on serving by probabilistic grade proportions
CN111865753B (zh) 媒体信息的参数确定方法和装置、存储介质、电子装置
CN112862544A (zh) 对象信息的获取方法、装置以及存储介质
CN113139826A (zh) 广告位的分配权限确定方法、装置、计算机设备
CN113408817B (zh) 流量分发方法、装置、设备及存储介质
CN112073454B (zh) 资源分发方法、装置、电子设备
CN115700699A (zh) 推广信息调价方法、装置、存储介质及计算机设备
CN112491939B (zh) 多媒体资源调度方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination