CN115482023A - 内容投放方法、装置、服务器及存储介质 - Google Patents

内容投放方法、装置、服务器及存储介质 Download PDF

Info

Publication number
CN115482023A
CN115482023A CN202110666354.XA CN202110666354A CN115482023A CN 115482023 A CN115482023 A CN 115482023A CN 202110666354 A CN202110666354 A CN 202110666354A CN 115482023 A CN115482023 A CN 115482023A
Authority
CN
China
Prior art keywords
target
content
time period
user
exposure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110666354.XA
Other languages
English (en)
Inventor
张金蕾
陈明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202110666354.XA priority Critical patent/CN115482023A/zh
Publication of CN115482023A publication Critical patent/CN115482023A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Marketing (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种内容投放方法、装置、服务器及存储介质。该方法包括:确定目标内容在后一个目标时间段内的目标用户量;根据目标用户量以及目标用户确定策略,确定目标内容在后一个目标时间段内关联的目标用户;对目标内容在后一个目标时间段内关联的目标用户进行筛选,得到待投放用户,将目标内容发送给待投放用户;在后一个目标时间段结束时,利用目标内容在待投放用户中的真实曝光量,对目标内容对应的前一个目标时间段结束时的当前真实曝光量进行更新,返回第一个步骤,直到后一个目标时间段结束时的真实曝光量累计达到目标曝光量或者直到后一个目标时间段结束时对应的累积时长达到目标时长。该方法能够减少内容投放过程中超发的曝光量。

Description

内容投放方法、装置、服务器及存储介质
技术领域
本申请涉及互联网信息处理技术领域,更具体地,涉及一种内容投放方法、装置、服务器及存储介质。
背景技术
伴随移动互联网和信息流产品的飞速发展,用户能够接触和获取到丰富多样的信息和内容。在信息流场景中,通常需要将各类信息和内容定向投递给对应的用户,即内容投放。
相关技术的内容投放方法中,在对需求较小曝光量的内容进行投放时,是直接用实时曝光量数据来对内容投放过程进行控制,然而,由于曝光量统计延迟,导致在对内容进行投放时存在曝光量超发的问题,且由于投放系统中存在大量的待投放内容,进而单个内容投放任务的曝光量超发会导致整个投放系统中曝光量的大量超发。
发明内容
鉴于上述问题,本申请实施例提出了一种内容投放方法、装置、服务器及存储介质,以改善上述问题。
第一方面,本申请实施例提供了一种内容投放方法,方法包括:基于目标内容对应的目标曝光量、筛选率以及前一个目标时间段结束时的当前真实曝光量,确定目标内容在后一个目标时间段内的目标用户量,前一个目标时间段与后一个目标时间段为相邻的两个时间段;根据目标用户量以及目标用户确定策略,确定目标内容在后一个目标时间段内关联的目标用户;对目标内容在后一个目标时间段内关联的目标用户进行筛选,得到待投放用户,并将目标内容发送给待投放用户;在后一个目标时间段结束时,利用目标内容在待投放用户中的真实曝光量,对目标内容对应的前一个目标时间段结束时的当前真实曝光量进行更新,并返回步骤:基于目标内容对应的目标曝光量、筛选率以及前一个目标时间段结束时的当前真实曝光量,确定目标内容在后一个目标时间段内的目标用户量,直到后一个目标时间段结束时的真实曝光量累计达到目标曝光量或者直到后一个目标时间段结束时对应的累积时长达到目标时长。
第二方面,本申请实施例提供了一种内容投放装置,装置包括:目标用户量确定模块、目标用户确定模块、筛选发送模块以及循环执行模块。其中,目标用户量确定模块,用于基于目标内容对应的目标曝光量、筛选率以及前一个目标时间段结束时的当前真实曝光量,确定目标内容在后一个目标时间段内的目标用户量,前一个目标时间段与后一个目标时间段为相邻的两个时间段;目标用户确定模块,用于根据目标用户量以及目标用户确定策略,确定目标内容在后一个目标时间段内关联的目标用户;筛选发送模块,用于对目标内容在后一个目标时间段内关联的目标用户进行筛选,得到待投放用户,并将目标内容发送给待投放用户;循环执行模块,用于在后一个目标时间段结束时,利用目标内容在待投放用户中的真实曝光量,对目标内容对应的前一个目标时间段结束时的当前真实曝光量进行更新,并返回步骤:基于目标内容对应的目标曝光量、筛选率以及前一个目标时间段结束时的当前真实曝光量,确定目标内容在后一个目标时间段内的目标用户量,直到后一个目标时间段结束时的真实曝光量累计达到目标曝光量或者直到后一个目标时间段结束时对应的累积时长达到目标时长。
可选地,目标用户确定模块包括:关联用户确定子模块以及目标用户确定子模块。
关联用户确定子模块,用于根据目标内容的第一特征信息以及内容请求用户的第二特征信息,从内容请求用户中确定关联用户。
目标用户确定子模块,用于将前目标用户量个关联用户,作为目标内容在后一个目标时间段内关联的目标用户。
可选地,第一特征信息包括第一属性信息以及点击目标内容的用户的第一历史行为信息,第二特征信息包括第二属性信息以及内容请求用户的第二历史行为信息,关联用户确定子模块还用于在第二属性信息与第一属性信息匹配的情况下,确定内容请求用户为候选用户;对候选用户的第二历史行为信息进行特征提取,得到候选用户对应的第二特征向量,以及对点击目标内容的用户的第一历史行为信息进行特征提取,得到第一特征向量;基于第一特征向量与第二特征向量之间的相似度以及相似度阈值,从候选用户中确定关联用户。
可选地,循环执行模块,还用于在后一个目标时间段结束时,对相似度阈值进行更新。
可选地,目标内容为关联用户对应的多个候选内容中相似度排序靠前的预设数量个候选内容中的一个,候选内容为待投放内容中相似度满足相似度阈值的待投放内容。
可选地,目标内容为冷启动内容,关联用户确定子模块还用于获取与目标内容的第一属性信息匹配的第二属性信息;获取目标数量个具有第二属性信息的历史用户作为点击目标内容的用户。
可选地,关联用户确定子模块还用于记录待投放用户中、对目标内容进行点击的用户,并利用对目标内容进行点击的用户对点击目标内容的用户进行更新。
可选地,第一属性信息通过以下步骤得到:获取目标内容对应的描述性信息;通过神经网络模型对描述性信息进行属性预测,得到神经网络模型输出的第一属性信息,神经网络模型通过携带属性信息标签的描述性信息训练得到。
可选地,关联用户确定子模块,还用于获取内容请求用户对应的活跃时间;从活跃时间不满足时间阈值的内容请求用户中确定候选关联用户;根据目标内容的第一特征信息以及候选关联用户的第二特征信息,从候选关联用户中确定关联用户。
可选地,前一个目标时间段结束时的当前真实曝光量为前一个目标时间段结束时的真实曝光量累积,循环执行模块还用于将后一个目标时间段结束时、目标内容在待投放用户中的真实曝光量与当前真实曝光量的累积,作为更新后的前一个目标时间段结束时的当前真实曝光量。
可选地,目标用户量确定模块还用于获取历史曝光量分布数据,历史曝光量分布数据表征历史曝光量在时间维度上的分布情况;基于历史曝光量分布数据以及目标曝光量,确定目标内容在各个目标时间段内的子目标曝光量;基于前一个目标时间段内的子目标曝光量以及当前真实曝光量,确定曝光量误差,前一个目标时间段结束时的当前真实曝光量为前一个目标时间段内的真实曝光量;基于目标内容在后一个目标时间段内的子目标曝光量、曝光量误差以及筛选率,确定目标内容在后一个目标时间段内的目标用户量。对应地,循环执行模块还用于在后一个目标时间段结束时,将目标内容在待投放用户中的真实曝光量,作为目标内容对应的前一个目标时间段结束时的当前真实曝光量。
可选地,装置还包括目标曝光量确定模块,用于基于曝光量兑换信息以及曝光量兑换信息对应的换算比例,确定目标内容对应的目标曝光量。
第三方面,本申请实施例提供了一种服务器,包括处理器以及存储器;一个或多个程序被存储在存储器中并被配置为由处理器执行以实现上述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质中存储有程序代码,其中,在程序代码被处理器运行时执行上述的方法。
第五方面,本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述的方法。
本申请实施例提供的一种内容投放方法、装置、服务器及存储介质,通过后一个目标时间段内的目标用户量来对目标内容在后一个目标时间段内关联的目标用户进行控制,由于对目标用户进行了控制,因此,可以避免持续投放内容,减少投放内容总量,从而减少超发的曝光量,同时,以目标时间段的时间间隔来统计真实曝光量,相当于对真实曝光量的获取起到了一定的等待效果,可以减轻由于延时带来的影响,进一步减少超发的曝光量。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本申请实施例提出的一种内容投放系统的架构示意图;
图2示出了本申请实施例提出的一种显示信息流显示界面的过程示意图;
图3示出了本申请实施例提出的另一种显示信息流显示界面的过程示意图;
图4示出了本申请实施例提出的一种内容投放方法的流程图;
图5示出了本申请实施例提出的一种内容投放方法中S110的一种实施方式的流程图;
图6示出了本申请实施例提出的另一种内容投放方法的流程图;
图7示出了本申请实施例提出的一种内容投放方法中S220的一种实施方式的流程图;
图8示出了本申请实施例提出的另一种内容投放方法的流程图;
图9示出了本申请实施例提出的一种第一属性信息的获取过程流程图;
图10示出了本申请实施例提出的一种获取点击目标内容的用户的第一历史行为信息的流程图;
图11示出了本申请实施例提出的另一种内容投放方法的流程图;
图12示出了本申请实施例提出的一种内容投放装置的框图;
图13示出了用于执行根据本申请实施例的内容投放方法的服务器的结构框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在以下的描述中,所涉及的术语“第一\第二”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
需要说明的是,本申请实施例公开的内容投放方法中的待投放内容,即目标内容,或者目标内容的第一特征信息等数据可保存于区块链上。
对本申请实施例进行进一步详细说明之前,对本申请实施例中涉及的部分名词和术语进行说明,本申请实施例中涉及的名词和术语适用于如下的解释:
1)内容:一般由标题和正文组成。标题可以由文字标题和封面图组成,引导用户点击进入阅读正文;正文可以由文字、图片、视频等组成,以对内容中的信息进行全面展示。
2)信息流:是指利用多个内容,组成可以滚动浏览的信息流,在信息流中,具有多个内容显示子区域,这些内容显示子区域依次排列,每一个内容显示子区域中都显示有一条内容的标题,用户点击标题之后,可以跳转到正文页面。
3)曝光量:在一个内容在信息流里展示给用户的过程中,当该内容在信息流中出现一次时,就记这个内容被曝光过一次,即记录一次曝光量。
4)点击量:当一个内容在信息流曝光给用户之后,用户点击标题进入正文页面阅读,则记这个内容被点击过一次,记录一次点击量。
5)筛选率:也可以称为漏斗率,投放后台初步确定可以将某个内容投放给某个用户之后,会将内容以及关联的用户返回给上游,上游的各类筛选后台经过设置的加权、打分、排序、内容多样性控制策略等对内容进行筛选,从而确定真正需要发送到用户客户端的内容,因此,最终客户端真实的曝光量和投放后台初步确定的返回量之间有一层筛选率。
伴随移动互联网和信息流产品的飞速发展,用户能够接触和获取到丰富多样的信息和内容。信息流产品通常会根据用户在平台上的行为和兴趣,通过机器学习的方式训练推荐模型,建立一套推荐系统,向用户推荐其他更多的可能感兴趣的内容。
但是,推荐模型和结果,在某些特定场景下,需要通过投放的方式实现对推荐结果进行干预。因此,信息流产品通常还会建立一套内容投放系统,利用人工选定的条件,将各类信息和内容定向投递给对应的用户,即内容投放。
然而,发明人发现,相关技术的内容投放方法中,在对需求较小曝光量的内容进行投放时,是直接用实时曝光量数据来对内容投放过程进行控制,然而,一方面由于用户的上报流水和计算的服务是异步的,是准实时的,有几分钟时间差;另一方面由于投放服务更新全部投放任务的列表是定时更新的,几分钟分钟更新一次,也有时间差;再一方面由于用户的每一次刷新会有10条以上的内容,但是终端屏幕每次漏出只有部分篇数的内容,如果投放的内容不在当前显示界面,那么只有用户向下滑动,漏出后面的内容,才会被计入实时曝光量,这里也会产生时间差,因此,在上述几类时间差的影响下,存在曝光量统计延迟,即在实时统计的曝光量达到目标曝光量并停止内容投放之后,还可能会陆续存在曝光量,从而导致在对内容进行投放时存在曝光量超发的问题,即实际产生的曝光量大于设定的目标曝光量,且由于投放系统中存在大量的待投放内容,进而单个内容投放任务的曝光量超发会导致整个投放系统中曝光量的大量超发。
为了解决上述问题,发明人提出了本申请提供的内容投放方法、装置、服务器及存储介质,通过后一个目标时间段内的目标用户量来对目标内容在后一个目标时间段内关联的目标用户进行控制,由于对目标用户进行了控制,因此,可以避免持续投放内容,减少投放内容总量,从而减少超发的曝光量,同时,以目标时间段的时间间隔来统计真实曝光量,相当于对真实曝光量的获取起到了一定的等待效果,可以减轻由于延时带来的影响,进一步减少超发的曝光量。
在对本申请实施例进行进一步详细说明之前,对本申请实施例中涉及一种应用环境进行介绍。
参见图1,图1是本申请实施例提供的内容投放系统的一个可选的架构示意图;如图1所示,为支撑一个信息流产品应用,可以设置内容投放系统10,在内容投放系统10中,终端400(客户端设备,示例性示出了终端401以及终端402)通过网络300连接服务器200,网络300可以是广域网或者局域网,又或者是二者的组合。另外,该内容投放系统100中还包括数据库500,通过数据库500向服务器200提供数据服务,以支持服务器200进行内容投放。
其中,数据库500中可以存储有各个待投放内容对应的数据以及各个终端对应的用户数据。
终端401,用于在图形界面4011上显示信息流显示界面4012。其中,显示信息流显示界面4012的具体过程如图2所示,在终端401的图形界面4011上先显示应用程序列表,应用程序列表中包括信息流产品应用D,当接收到作用在信息流产品应用D上的信息流显示操作时,进入应用A的信息流显示界面4012。在进入应用A的显示界面4012的过程中便可以生成内容获取请求,此时,终端401对应的用户即成为内容请求用户,进而可以从终端401中获取内容请求用户对应的第二特征数据。
终端402,用于在图形界面4021上显示信息流显示界面4024。其中,显示信息流显示界面4024的具体过程如图3所示,先在图形界面4021上显示其他非信息流功能界面,例如聊天界面4022,同时在聊天界面底部显示有界面切换区域,其中包括信息流显示控件4023,当接收到作用在信息流显示控件4023上的信息流显示操作时,响应于信息流显示操作,进入信息流显示界面4024,在进入信息流显示界面4024的过程中便可以生成内容获取请求,此时,终端402对应的用户即成为内容请求用户,进而可以从终端402中获取内容请求用户对应的第二特征数据。
服务器200,用于基于目标内容对应的目标曝光量、筛选率以及前一个目标时间段结束时的当前真实曝光量,确定目标内容在后一个目标时间段内的目标用户量,同时,通过网络300接收后一个目标时间段内各个终端400所发起的内容获取请求,并根据目标用户量以及目标用户确定策略,确定目标内容在后一个目标时间段内关联的目标用户,然后对目标内容在后一个目标时间段内关联的目标用户进行筛选,得到待投放用户,并通过网络300将目标内容发送给待投放用户,以及在后一个目标时间段结束时,检测真实曝光量累计是否达到目标曝光量或者目标时间段的累积时长是否达到目标时长,若其中任一条件均未达到,则利用目标内容在待投放用户中的真实曝光量,对目标内容对应的前一个目标时间段结束时的当前真实曝光量进行更新,并返回步骤:基于目标内容对应的目标曝光量、筛选率以及前一个目标时间段结束时的当前真实曝光量,确定目标内容在后一个目标时间段内的目标用户量,若其中任一条件达到,则结束对目标内容的投放过程。
在一些实施方式中,服务器200可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content DeliveryNetwork,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。
终端400可以为智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、可穿戴设备、智能机器人、车载终端等,但并不局限于此。
下面将结合附图具体描述本申请的各实施例。
请参阅图4,图4所示为本申请一实施例提出的一种内容投放方法的流程图,该方法可以应用于服务器(例如图1中的服务器200),该方法包括:
S110,基于目标内容对应的目标曝光量、筛选率以及前一个目标时间段结束时的当前真实曝光量,确定目标内容在后一个目标时间段内的目标用户量,前一个目标时间段与后一个目标时间段为相邻的两个时间段。
结合前述内容可知,投放系统中存在多个待投放内容,这多个待投放内容中的任一个待投放内容均可以成为目标内容,也即,当针对某个待投放内容进行投放时,该待投放内容即为目标内容。
其中,待投放内容可以是运营人员根据实事热点或者优秀内容排行等选取进行投放的内容,也可以是广告主或者内容发布者申请进行投放推广的内容。可以理解的是,本申请实施例中的内容投放方法可以是针对任一个目标内容的投放方法,也即,该内容投放方法适用于任一个目标内容。
其中,目标曝光量可以理解为某个目标内容实际需要曝光的量,即实际需要在客户端信息流中出现的次数。
作为一种实施方式,目标内容的目标曝光量可以是运营人员根据运营需要设置的,例如,运营人员可以预先设置目标内容1的目标曝光量为5000次。
作为另外一种实施方式,某些目标内容可能携带有曝光量兑换信息,例如携带代币、点赞数、收藏数等曝光量兑换信息,这种情况下,基于目标内容对应的目标曝光量、筛选率以及前一个目标时间段结束时的当前真实曝光量,确定目标内容在后一个目标时间段内的目标用户量之前,还包括:基于曝光量兑换信息以及曝光量兑换信息对应的换算比例,确定目标内容对应的目标曝光量。
其中,代币可以看做是一种虚拟的兑换币,可以用于兑换目标曝光量,目标内容对应的代币可以由信息流平台的用户进行投币获得,除了代币之外,在一些情况下,点赞数或者收藏数等也可以用于兑换目标曝光量。其中,每类曝光量兑换信息具有不同的换算比例,因此,在目标内容携带曝光量兑换信息的情况下,还可以根据曝光量兑换信息以及曝光量兑换信息对应的换算比例,确定目标内容对应的目标曝光量。
例如,目标内容携带代币100个,每个代币可以兑换50个曝光量,则该内容总共可以对应有5000个目标曝光量。
目标用户量可以理解为投放后台初步确定可以将目标内容投放给的用户的数量,也即投放后台需要发送给上游的各类筛选后台的用户的数量。由于存在筛选率,因此,需要目标用户量大于目标曝光量,才有可能最终真实的曝光量达到目标曝光量。
目标时间段是指使用本实施例的内容投放方法进行内容投放时对应的时间段。本实施例中,为了能够降低延时带来的曝光量超发问题,可以通过不同的目标时间段来对目标用户量进行控制。因此,本实施例中,可以事先根据不同需要设置目标时间段的时长,例如1小时、3小时或者6小时等。
可以理解的是,若是初次使用本实施例的内容投放方法对某个目标内容进行投放,那么当前时刻的后一个目标时间段是第一个目标时间段,从而在当前时刻之前,不存在前一个目标时间段,或者也可以看做是在前一个目标时间段结束时不存在当前真实曝光量,即在前一个目标时间段结束时当前真实曝光量为0。
S120,根据目标用户量以及目标用户确定策略,确定目标内容在后一个目标时间段内关联的目标用户。
其中,目标内容关联的目标用户即为前述投放后台初步确定的可以将目标内容投放给的用户。可以理解的是,在信息流产品应用中,服务器在当前时刻的后一个目标时间段内接收到的内容请求用户的数量较大,大于目标用户量,因此,可以预先设置目标用户确定策略,对接收到的内容请求用户进行筛选,筛选后确定的内容请求用户即为目标内容在后一个目标时间段内关联的用户。例如,可以选择目标内容更适宜或者倾向于投放的用户,从而提高目标内容的投放效果。
S130,对目标内容在后一个目标时间段内关联的目标用户进行筛选,得到待投放用户,并将目标内容发送给待投放用户。
其中,待投放用户可以理解为目标内容真正会发送给的用户。
可以理解的是,一方面,考虑到推荐系统可能已经向关联的某个目标用户推荐了过多的类似内容了,如果再向关联的某个目标用户推荐目标内容的话可能会造成某个用户的反感,也不利于某个用户查看内容的多样性扩展,从而降低某个用户体验,另一方面,考虑到内容在投放给某个目标用户之后,可能会对曝光量大盘数据造成影响,因此,如果某个目标内容在投放给关联的某个用户之后可能对曝光量大盘数据造成较大的影响,也不会将目标内容投放给关联的某个目标用户。
因此,本申请实施例中,目标内容并不会发送给当前时刻的后一个目标时间段内所有关联的目标用户,也即服务器会对目标内容在后一个目标时间段内关联的目标用户进行筛选,得到待投放用户,然后再将目标内容发送给各个待投放用户。例如,可以通过上游的各类筛选后台经过设置的加权、打分、排序、内容多样性控制策略等对内容进行筛选。
S140,在后一个目标时间段结束时,利用目标内容在待投放用户中的真实曝光量,对目标内容对应的前一个目标时间段结束时的当前真实曝光量进行更新,并返回步骤:基于目标内容对应的目标曝光量、筛选率以及前一个目标时间段结束时的当前真实曝光量,确定目标内容在后一个目标时间段内的目标用户量,直到后一个目标时间段结束时的真实曝光量累计达到目标曝光量或者直到后一个目标时间段结束时对应的累积时长达到目标时长。
目标时长可以理解为对目标内容的投放任务的有效投放时长,超过目标时长,可以停止对目标内容的投放。
可以理解的是,经过上述步骤S110-S130,可以完成目标内容在当前时刻的后一个目标时间段内的内容投放过程,然而,针对某个目标内容的投放任务而言,是需要使得目标内容投放后在待投放用户中的真实曝光量达到目标曝光量的,或者使得目标内容投放的时长达到了目标时长,这样才算是完成了对目标内容的投放任务,因此,若目标内容投放后的真实曝光量未达到目标曝光量,或者目标内容在后一个目标时间段结束时,前面已经进行目标内容投放的所有目标时间段对应的累积时长未达到目标时长,还需要继续进行目标内容的投放。例如,假设目标时间段的时长为6小时,在后一个目标时间段结束时,包括后一个目标时间段在内共有3个目标时间段进行了内容投放,那么后一个目标时间段结束时对应的累积时长为18小时,若目标时长设置为24小时,且目标内容投放后的真实曝光量未达到目标曝光量,则此时还需要执行步骤S140。
在后一个目标时间段结束时,若不满足结束条件,则为了准确确定后续对目标内容进行投放过程中的目标用户量,可以先利用目标内容在待投放用户中的真实曝光量,对目标内容对应的前一个目标时间段结束时的当前真实曝光量进行更新,然后再返回步骤:基于目标内容对应的目标曝光量、筛选率以及前一个目标时间段结束时的当前真实曝光量,确定目标内容在后一个目标时间段内的目标用户量。
需要说明的是,本实施例中,前一个目标时间段结束时的当前真实曝光量可以有多种形式。
在一些实施方式中,前一个目标时间段结束时的当前真实曝光量可以是前一个目标时间段结束时的真实曝光量累积,即前一个目标时间段结束时刻之前的所有目标时间段内的真实曝光量累积,这种情况下,利用目标内容在待投放用户中的真实曝光量,对目标内容对应的前一个目标时间段结束时的当前真实曝光量进行更新,包括:将后一个目标时间段结束时、目标内容在待投放用户中的真实曝光量与当前真实曝光量的累积,作为更新后的前一个目标时间段结束时的当前真实曝光量。
本实施例中,在后一个目标时间段结束时,目标内容在待投放用户中的真实曝光量是指后一个目标时间段内目标内容在待投放用户中的真实曝光量,且由于前一个目标时间段结束时的当前真实曝光量是前一个目标时间段结束时刻之前的所有目标时间段内的真实曝光量累积,因此,在后一个目标时间段结束时,后一个目标时间段相较于再后一个目标时间段,成为了再后一个目标时间段的前一个时间段,此时,在更新前一个目标时间段结束时的当前真实曝光量时,需要将再后一个目标时间段的相邻的前一个目标时间段的真实曝光量统计进去,即将后一个目标时间段结束时、目标内容在待投放用户中的真实曝光量与当前真实曝光量的累积,作为更新后的前一个目标时间段结束时的当前真实曝光量。
示例性地,假设共存在4个依次相邻的目标时间段,第一目标时间段、第二目标时间段、第三目标时间段以及第四目标时间段,当前时刻位于第二目标时间段与第三目标时间段分界处,此时,前一个目标时间段为第二目标时间段,后一个目标时间段为第三目标时间段,在后一个目标时间段(即第三目标时间段)结束时,若要返回步骤:基于目标内容对应的目标曝光量、筛选率以及前一个目标时间段结束时的当前真实曝光量,确定目标内容在后一个目标时间段内的目标用户量的话,此时,第三目标时间段成为更新后的前一个目标时间段,第四目标时间段成为更新后的后一个目标时间段,那么在返回步骤之后,应该使用更新后的前一个目标时间段(第三目标时间段)结束时的当前真实曝光量,具体为第三目标时间段结束时,将第三目标时间段内,目标内容在待投放用户中的真实曝光量、第一目标时间段内,目标内容在待投放用户中的真实曝光量,以及第二目标时间段内,目标内容在待投放用户中的真实曝光量的累积,作为更新后的前一个目标时间段(第三目标时间段)结束时的当前真实曝光量。也即,在第三个目标时间段结束之后,若要进入第四个目标时间段并返回步骤,是将前三个目标时间段内的真实曝光量的累积作为前一个目标时间段结束时的当前真实曝光量。
此外,考虑到客户端真实曝光量与确定的目标用户量是成正比的,并且在同一时间段内的多个待投放内容之间,对于内容请求用户的流量是有竞争关系的。如果某个待投放内容设置了较宽松的投放参数,会使得更多的内容请求用户能够命中投放条件,那么该待投放内容会在过快的时间内达到内容的目标曝光量。这会导致该待投放内容提前停止,过早的结束对后期的内容请求用户流量的竞争,无法触达更优质的用户流量,也会使得多个待投放内容之间对流量的竞争不够平稳,投放的前期流量竞争较激烈,投放的后期竞争不足。相反的,如果设置比较严格的打分阈值,那么当待投放内容到有效期(即累积时长达到目标时长)结束投放后,可能仍然没有达到目标曝光量。也会影响投放效果。
因此,为了使得真实曝光量更精准,更符合内容请求用户间的实际竞争关系,在另一些实施方式中,前一个目标时间段结束时的当前真实曝光量也可以是当前时刻的前一个目标时间段的真实曝光量。这种情况下,如图5所示,基于目标内容对应的目标曝光量、筛选率以及当前真实曝光量,确定目标内容在后一个目标时间段内的目标用户量,包括以下步骤:
S111,获取历史曝光量分布数据,历史曝光量分布数据表征历史曝光量在时间维度上的分布情况。
可以理解的是,本实施例中,历史曝光量分布数据可以是基于不同的时间长度的分布数据,例如,一天、一周或者一个月等。而具体选择哪个时间长度可以根据目标内容的时效性进行确定,例如,对于时效性较强的目标内容,可以选择一天作为时间长度,对应的,历史曝光量分布数据则获取历史曝光量在一天内的分布情况,而对于时效性较弱的目标内容,可以选择一周或者一个月等作为时间长度,对应的,历史曝光量分布数据则获取历史曝光量在一周内或者一个月内的分布情况。
示例性地,示出了一个历史曝光量分布数据为历史曝光量在一天内的分布情况,假设获取的历史上某天的总曝光量为1000万,再按照小时细分,假设一天内从0点-23点,每小时的曝光量分别是10万、2万、2万、2万、2万、2万、5万、5万、10万、20万、30万、40万、40万、50万、50万、50万、50万、50万、60万、80万、100万、140万、130万以及70万。
S112,基于历史曝光量分布数据以及目标曝光量,确定目标内容在各个目标时间段内的子目标曝光量。
作为一种实施方式,在获取到历史曝光量分布数据之后,可以进一步获取时间长度内每个目标时间段对应的曝光量的比例,从而根据每个目标时间段对应的曝光量的比例,对应计算曝光总量为目标曝光量时,各个目标时间段对应的子目标曝光量。
沿用上述示例,若目标曝光量为10000,目标内容对应的时效性为一天,则基于历史曝光量分布数据可以得到每个目标时间段(从0点-23点)对应的曝光量的比例,即10、2、2、2、2、2、5、5、10、20、30、40、40、50、50、50、50、50、60、80、100、140、130以及70,然后再结合目标曝光量,得到目标内容在各个目标时间段(从0点-23点)内的子目标曝光量分别为100、20、20、20、20、20、50、50、100、200、300、400、400、500、500、500、500、500、600、800、1000、1400、1300以及700。
需要说明的是,上述示例中是以一个小时作为目标时间段的时间长度,在一些实施方式中,目标时间段的时间长度可以是两个或者多个小时,具体根据实际需要进行设置。
S113,基于前一个目标时间段内的子目标曝光量以及当前真实曝光量,确定曝光量误差,前一个目标时间段结束时的当前真实曝光量为前一个目标时间段内的真实曝光量。
作为一种实施方式,可以实时统计目标内容的曝光量,从而可以得到前一个目标时间段内的真实曝光量,即前一个目标时间段结束时的当前真实曝光量,然后将前一个目标时间段结束时的当前真实曝光量与前一个目标时间段内的子目标曝光量的差,作为曝光量误差。
曝光量误差可以反映前一个目标时间段内目标内容是过多曝光还是过少曝光,具体地,当曝光量误差大于0时,表明前一个目标时间段内目标内容过多曝光,而当曝光量误差小于0时,表明前一个目标时间段内目标内容过少曝光。
S114,基于目标内容在后一个目标时间段内的子目标曝光量、曝光量误差以及筛选率,确定目标内容在后一个目标时间段内的目标用户量。
结合前述内容可知,过多曝光或者过少曝光均会影响目标内容在内容请求用户之间的正常竞争关系,并且,长期累积的话,在目标时长的后期带来的影响更大,因此,可以在前一个目标时间段结束的时候,对后一个目标时间段内的目标用户量进行修正,从而控制后一个目标时间段结束时的当前真实曝光量,以减少过多曝光或者过少曝光对目标内容在内容请求用户之间的正常竞争关系的影响。
作为一种实施方式,可以先计算目标内容在后一个目标时间段内的子目标曝光量与曝光量误差的差值,然后再将差值与筛选率相除,得到目标内容在后一个目标时间段内目标用户量。
示例性地,继续沿用上述示例,假设筛选率为0.5,且当前时刻为1点,那么当前时刻的的前一个目标时间段为0-1点,前一个目标时间段内的子目标曝光量为100,当前时刻的后一个目标时间段为1-2点,后一个目标时间段内的子目标曝光量为20,且假设前一个目标时间段0-1点内的真实曝光量(即前一个目标时间段0-1点结束时,1点时刻的当前真实曝光量)为90,此时,可以计算曝光量误差为-10,进而可以计算得到目标内容在后一个目标时间段(1-2点)内的目标用户量为60。
相应地,在前一个目标时间段结束时的当前真实曝光量是当前时刻的前一个目标时间段的真实曝光量的情况下,利用目标内容在待投放用户中的真实曝光量,对目标内容对应的前一个目标时间段结束时的当前真实曝光量进行更新,包括步骤:在后一个目标时间段结束时,将目标内容在待投放用户中的真实曝光量,作为目标内容对应的前一个目标时间段结束时的当前真实曝光量。
本实施例中,由于前一个目标时间段结束时的当前真实曝光量是当前时刻的前一个目标时间段的真实曝光量,因此,在后一个目标时间段结束时,后一个目标时间段相较于再后一个目标时间段成为前一个目标时间段,此时,若要返回步骤:基于目标内容对应的目标曝光量、筛选率以及前一个目标时间段结束时的当前真实曝光量,确定目标内容在后一个目标时间段内的目标用户量,便可以在后一个目标时间段结束时,将后一个目标时间段内,目标内容在待投放用户中的真实曝光量作为再后一个目标时间段相邻的前一个目标时间段结束时的当前真实曝光量。
示例性地,假设共存在4个依次相邻的目标时间段,第一目标时间段、第二目标时间段、第三目标时间段以及第四目标时间段,当前时刻位于第二目标时间段与第三目标时间段分界处,此时,前一个目标时间段为第二目标时间段,后一个目标时间段为第三目标时间段,在后一个目标时间段(即第三目标时间段)结束时,若要返回步骤:基于目标内容对应的目标曝光量、筛选率以及前一个目标时间段结束时的当前真实曝光量,确定目标内容在后一个目标时间段内的目标用户量的话,此时,第三目标时间段成为更新后的前一个目标时间段,第四目标时间段成为更新后的后一个目标时间段,那么在返回步骤之后,应该使用更新后的前一个目标时间段(第三目标时间段)内的真实曝光量,具体为第三目标时间段结束时,将第三目标时间段内,目标内容在待投放用户中的真实曝光量,作为更新后的前一个目标时间段(第三目标时间段)结束时的当前真实曝光量。也即,在第三个目标时间段结束之后,若要进入第四个目标时间段并返回步骤,是将第三个目标时间段内的真实曝光量作为前一个目标时间段结束时的当前真实曝光量。
本实施例提供的内容投放方法,通过后一个目标时间段内的目标用户量来对目标内容在后一个目标时间段内关联的目标用户进行控制,由于对目标用户进行了控制,因此,可以避免持续投放内容,减少投放内容总量,从而减少超发的曝光量,同时,以目标时间段的时间间隔来统计真实曝光量,相当于对真实曝光量的获取起到了一定的等待效果,可以减轻由于延时带来的影响,进一步减少超发的曝光量。
请参阅图6,图6所示为本申请另一实施例提出的一种内容投放方法的流程图,该方法可以应用于服务器(例如图1中的服务器200),该方法包括:
S210,基于目标内容对应的目标曝光量、筛选率以及前一个目标时间段结束时的当前真实曝光量,确定目标内容在后一个目标时间段内的目标用户量,前一个目标时间段与后一个目标时间段为相邻的两个时间段。
其中,步骤S210的具体实现方式可以参照S110的具体描述,这里不再赘述。
S220,根据目标内容的第一特征信息以及内容请求用户的第二特征信息,从内容请求用户中确定关联用户。
其中,第一特征信息是指目标内容对应的特征信息,是与目标内容相关的信息。可选地,第一特征信息可以由人为添加标签得到,也可以对目标内容进行识别得到,还可以根据目标内容对应的历史信息得到。
第二特征信息是指内容请求用户对应的特征信息,是与内容请求用户相关的内容。可选地,第二特征信息可以由内容请求用户自动添加得到,还可以由用户历史行为收集统计得到。
关联用户可以理解为目标内容适宜或者倾向于曝光给的用户。可以理解的是,内容请求用户众多,但是对于目标内容而言,并不是适宜或者倾向于曝光给每个内容请求用户,因此,本实施例中,可以采用特征信息匹配的方式来从内容请求用户中初步筛选得到目标内容适宜或者倾向于曝光给的关联用户,其中,当内容请求用户的第二特征信息与目标内容的第一特征信息匹配时,可以认为内容请求用户是目标内容适宜或者倾向于曝光给的关联用户。
在一些实施方式中,考虑到内容请求用户存在不同的类型,例如,包括经常性使用信息流产品应用的中、深度用户,以及偶尔使用或者从未使用过信息流产品应用的新浅度用户。相关技术的投放系统中的内容投放方法是根据待投放内容携带的标签,将待投放内容定向投放给携带对应标签的用户。例如,待投放内容的标签为体育,就将该待投放内容投放给携带有体育标签的用户。
然而,通常情况下,携带有标签的用户多为中深度用户,然而中深度用户并不太需要投放系统进行投放,而是需要推荐系统进行推荐,投放系统投放太多的内容可能会对推荐系统带来影响,反而是对于新浅度用户,由于缺少用户历史行为信息,因此,推荐系统并不能够太准确的向其推荐内容,因此,需要投放系统进行投放,这就导致相关技术中的投放方法投放效果差,不能够满足实际投放需求。因此,为了能够提高信息流产品应用的投放效果,在一些实施方式中,如图7所示,根据目标内容的第一特征信息以及内容请求用户的第二特征信息,从内容请求用户中确定关联用户,包括以下步骤:
S221,获取内容请求用户对应的活跃时间。
S222,从活跃时间不满足时间阈值的内容请求用户中确定候选关联用户。
S223,根据目标内容的第一特征信息以及候选关联用户的第二特征信息,从候选关联用户中确定关联用户。
其中,内容请求用户对应的活跃时间可以指内容请求用户使用信息流产品应用的时间,可以是总时长,也可以是使用频率,例如,每天/每周/每月使用信息流产品应用的时间。
候选关联用户可以是前述内容中提到的新浅度用户。
本实施例中,服务器内可以统计并记录有每个内容请求用户对应的活跃时间,然后根据活跃时间来确定用户是中深度用户,还是新浅度用户。可选地,在活跃时间为总时长的情况下,可以是将活跃时间不满足时间阈值的内容请求用户确定为候选关联用户,即确定为新浅度用户。可选地,在活跃时间为使用频率的情况下,可以是将活跃时间不满足时间频率阈值的内容请求用户确定为候选关联用户,即确定为新浅度用户。
从而在确定候选关联用户之后,便可以根据目标内容的第一特征信息以及候选关联用户的第二特征信息,从候选关联用户中确定关联用户。
本实施例中,由于目标内容是由于运营人员选取的内容或者其它申请进行投放推广的内容,为优质内容的可能性较大,因此,采用本实施例的内容投放方法,能够起到将更多的优质内容投放给新浅度用户,提高曝光给新浅度用户优质内容的占比,进而提高新浅度用户的使用体验的效果。
S230,将前目标用户量个关联用户,作为目标内容在后一个目标时间段内关联的目标用户。
可以理解的是,在当前时刻的后一个目标时间段内,确定的关联用户的数量可能很多,然而本实施例中,只选择前目标用户量个关联用户,作为目标内容在后一个目标时间段内关联的目标用户。
作为一种实施方式,服务器内部可以设置一个计数器,计数器的计数目标是目标用户量,也就是说,每确定一个关联用户,就将该关联用户作为目标用户,并且计数器计数就自增1,直到计数器的计数达到目标用户量,此时,后续再确定关联用户之后,便不再作为目标用户,或者,后续在继续接收到内容请求用户之后,便不再根据目标内容的第一特征信息以及内容请求用户的第二特征信息,从内容请求用户中确定关联用户。
S240,对目标内容在后一个目标时间段内关联的目标用户进行筛选,得到待投放用户,并将目标内容发送给待投放用户。
S250,在后一个目标时间段结束时,利用目标内容在待投放用户中的真实曝光量,对目标内容对应的前一个目标时间段结束时的当前真实曝光量进行更新,并返回步骤:基于目标内容对应的目标曝光量、筛选率以及前一个目标时间段结束时的当前真实曝光量,确定目标内容在后一个目标时间段内的目标用户量,直到后一个目标时间段结束时的真实曝光量累计达到目标曝光量或者直到后一个目标时间段结束时对应的累积时长达到目标时长。
其中,步骤S240-S250的具体实现方式可以参照S130-S140的具体描述,这里不再赘述。
本申请实施例的内容投放方法,通过特征信息匹配的方式确定关联用户,便于确定目标内容适宜或者倾向于投放给的用户,提高内容投放准确性,此外,将前目标用户量个所述关联用户,作为所述目标内容在后一个目标时间段内关联的目标用户,能够在目标时间段内迅速将目标内容发送给待投放用户,从而等待收集目标时间段内的真实曝光量,减轻由于延时带来的影响,进一步减少超发的曝光量。
在一些实施方式中,前述实施例中的第一特征信息可以包括第一属性信息以及点击目标内容的用户的第一历史行为信息,第二特征信息可以包括第二属性信息以及内容请求用户的第二历史行为信息,这种情况下,请参阅图8,图8所示为本申请另一实施例提出的一种内容投放方法的流程图,该方法可以应用于服务器(例如图1中的服务器200),该方法包括:
S310,基于目标内容对应的目标曝光量、筛选率以及前一个目标时间段结束时的当前真实曝光量,确定目标内容在后一个目标时间段内的目标用户量,前一个目标时间段与后一个目标时间段为相邻的两个时间段。
其中,步骤S310的具体实现方式可以参照S110的具体描述,这里不再赘述。
S320,在第二属性信息与第一属性信息匹配的情况下,确定内容请求用户为候选用户。
结合前述内容可知,第一特征信息包括包括第一属性信息以及点击目标内容的用户的第一历史行为信息。其中,第一属性信息也可以理解为目标内容对应的标签信息,例如,第一属性信息可以包括目标内容对应的年龄段/性别/分类/标签/兴趣画像等,其中,目标内容对应的年龄段/性别/分类/标签/兴趣画像等可以解释为目标内容适宜或者倾向于曝光给的用户的年龄段/性别/分类/标签/兴趣画像等。
其中,目标内容的第一属性信息可以有多种获得方式。
可选地,第一属性信息可以由人工进行确定,例如,选择待投放内容的运营人员或者推广人员等可以根据待投放内容的标题或者正文,人为确定并为该待投放内容添加对应的第一属性信息,从而在某个待投放内容成为目标内容时,该目标内容便能够携带第一属性信息。
可选地,第一属性信息还可以由神经网络模型预测得到。这种情况下,如图9所示,第一属性信息具体可以通过以下步骤得到:
S321,获取目标内容对应的描述性信息。
S322,通过神经网络模型对描述性信息进行属性预测,得到神经网络模型输出的第一属性信息,神经网络模型通过携带属性信息标签的描述性信息训练得到。
其中,目标内容对应的描述性信息可以是目标内容的标题或者正文,其中,正文可以包括文字、图片或者视频等。
在获取到目标内容对应的描述性信息之后,便可以将描述性信息输入神经网络模型,从而通过神经网络模型对描述性信息进行属性预测,得到神经网络模型输出的第一属性信息。
其中,在神经网络模型训练过程中,可以将携带属性信息标签的描述性信息输入初始神经网络模型,初始神经网络模型可以输出针对描述性信息的预测属性信息,并计算预测属性信息和该描述性信息的属性信息标签之间的损失(loss),根据损失对初始神经网络模型的模型参数进行调节,从而可以得到训练后的神经网络模型。
第二属性信息也可以理解为内容请求用户的标签信息,例如,可以包括内容请求用户对应的年龄段/性别/分类/标签/兴趣画像等。其中,内容请求用户对应的年龄段/性别/分类/标签/兴趣画像等可以是内容请求用户在注册信息流账号时主动填写的,还可以是内容请求用户在使用信息流应用的过程中收集统计得到的。
候选用户可以理解为目标内容适宜或者倾向于曝光给的用户,由于第一属性信息可以解释为目标内容适宜或者倾向于曝光给的用户的信息,而第二属性信息可以理解为目标用户的标签信息,因此,若第二属性信息与第一属性信息匹配,则表明目标内容适宜或者倾向于曝光给具有该第二属性信息的内容请求用户,即候选用户。
示例性地,假设某个目标内容的第一属性信息为<18-20岁,男性,体育,...>,而存在两个内容请求用户,分别为用户甲和乙,其中,用户甲的第二属性信息为<19岁,男性,体育>,用户乙的第二属性信息为<19岁,女性,娱乐>,此时,判断该用户甲的第二属性信息与目标内容的第一属性信息匹配,从而确定用户甲为候选用户。
S330,对候选用户的第二历史行为信息进行特征提取,得到候选用户对应的第二特征向量,以及对点击目标内容的用户的第一历史行为信息进行特征提取,得到第一特征向量。
候选用户的第二历史行为信息可以包括候选用户的曝光和点击行为对应的历史信息。
点击目标内容的用户的第一历史行为信息可以包括点击目标内容的用户的曝光和点击行为对应的历史信息。
作为一种实施方式,可以使用特征提取算法来进行特征提取。
可选地,特征提取算法可以是LDA(Linear Discriminant Analysis,线性判别式分析)算法。具体地,可以将候选用户的第二历史行为信息作为LDA算法的输入参数,得到LDA算法输出的256维的特征向量,即第二特征向量,以及分别将点击目标内容的各个用户的第一历史行为信息作为LDA算法的输入参数,得到各个点击目标内容的用户分别对应的的256维子特征向量,然后将各个子特征向量进行pooling(池化)合并,从而得到第一特征向量。
可以理解的是,对于某些待投放内容而言,其在被选择为待投放内容之前,已经被曝光点击过,例如,运营人员选择的一些点击率较集中的内容进行进一步推广,增加其曝光量,又例如,推广人员选择的一些已经被推荐系统推荐,但是曝光量较少的内容进行推广,以进一步增加其曝光量。这种情况下,这些待投放内容是已经被点击过的,因此,服务器是可以存储有点击该待投放内容的用户的第一历史行为信息的,因此,在该待投放内容被确定为目标内容时,可以直接获取到第一特征信息包括第一属性信息以及点击目标内容的用户的第一历史行为信息。
而在另一些情况下,待投放内容可以是冷启动内容,其中,冷启动内容是指不存在历史曝光或者点击数据的内容,因此,对于某些待投放内容而言,其在被选择为待投放内容之前,可能不存在历史曝光或者点击数据,例如,新生成的内容,因此,在该待投放内容被确定为目标内容时,未携带有点击目标内容的用户的第一历史行为信息,此时,为了能够对点击目标内容的用户的第一历史行为信息进行特征提取,得到第一特征向量,需要先获取点击目标内容的用户的第一历史行为信息,在一些实施方式中,如图10所示,图10示出了获取点击目标内容的用户的第一历史行为信息的流程图,即在对点击目标内容的用户的第一历史行为信息进行特征提取之前,还可以包括以下步骤:
S331,获取与目标内容的第一属性信息匹配的第二属性信息。
S332,获取目标数量个具有第二属性信息的历史用户作为点击目标内容的用户。
可以理解的是,服务器可以获取到大量的历史用户数据,例如可以是从与服务器连接的数据库获取,考虑到具有与目标内容的第一属性信息匹配的第二属性信息的历史用户,有较大的概率在目标内容曝光之后会进行点击,因此,针对事先不存在点击用户的冷启动的目标内容,本实施例中,在初始阶段,可以选择与冷启动的目标内容的第一属性信息匹配的第二属性信息的历史用户,从而将这些用户看做是点击冷启动的目标内容的用户,从而对于冷启动的目标内容,也能够执行后续对点击目标内容的用户的第一历史行为信息进行特征提取的步骤。其中,历史用户是指历史上使用该信息流产品应用的用户,这些用户可以携带有第二属性信息。
S340,基于第一特征向量与第二特征向量之间的相似度以及相似度阈值,从候选用户中确定关联用户。
可以理解的是,在后一个目标时间段内,即使通过属性信息匹配的方式已经对内容请求用户的数量做了一定程度的限制,但是剩余的候选用户数量依然较大,因此,可以进一步对候选用户的数量进行限制,从而从候选用户中确定关联用户。
本实施例中,可以通过相似度以及预先设置的相似度阈值的方式来进行限制,即计算第一特征向量与第二特征向量之间的相似度,然后将计算出的相似度与预先设置的相似度阈值比较,若某个候选用户的第二特征向量与目标内容的第一特征向量之间的相似度大于相似度阈值,则将该候选用户确定为关联用户,从而可以从候选用户中确定关联用户。可选地,相似度阈值可以根据经验进行设置。
可选地,第一特征向量与第二特征向量之间的相似度可以是余弦距离,在得到余弦距离之后,对余弦距离进行归一化处理,得到相似度分数,取值范围为[0,1],相似度分数越大表示第一特征向量与第二特征向量越近似。
此外,可以理解的是,在获取到内容请求用户的时候,才会判断是否将某个待投放内容发送给该内容请求用户,从而确定某个待投放内容为目标内容。因此,当服务器获取到一个内容请求用户的时候,可以根据内容请求用户确定目标内容。在一些实施方式中,目标内容为关联用户对应的多个候选内容中相似度排序靠前的预设数量个候选内容中的一个,候选内容为待投放内容中相似度满足相似度阈值的待投放内容。
本实施例中,当获取到内容请求用户的时候,首先从所有的待投放内容中查找与该内容请求用户的第二属性信息相匹配的第一属性信息对应的待投放内容,然后将这些对应的待投放内容的第一特征向量与内容请求用户的第二特征向量进行相似度计算,然后将相似度大于相似度阈值的待投放内容确定为内容请求用户对应的候选内容,然后再从候选内容中选取相似度排序靠前的预设数量个候选内容,作为与内容请求用户关联的目标内容,此时,该内容请求用户也成为目标内容的关联用户,也即,每当获取到一个内容请求用户时,可以确定与内容请求用户关联的目标内容,而目标内容为关联用户对应的多个候选内容中相似度排序靠前的预设数量个候选内容中的一个,候选内容为待投放内容中相似度满足相似度阈值的待投放内容。
S350,将前目标用户量个关联用户,作为目标内容在后一个目标时间段内关联的目标用户。
其中,步骤S350的具体实现方式可以参照S230的具体描述,这里不再赘述。
S360,对目标内容在后一个目标时间段内关联的目标用户进行筛选,得到待投放用户,并将目标内容发送给待投放用户。
S370,在后一个目标时间段结束时,利用目标内容在待投放用户中的真实曝光量,对目标内容对应的前一个目标时间段结束时的当前真实曝光量进行更新,并返回步骤:基于目标内容对应的目标曝光量、筛选率以及前一个目标时间段结束时的当前真实曝光量,确定目标内容在后一个目标时间段内的目标用户量,直到后一个目标时间段结束时的真实曝光量累计达到目标曝光量或者直到后一个目标时间段结束时对应的累积时长达到目标时长。
其中,步骤S360-S370的具体实现方式可以参照S130-S140的具体描述,这里不再赘述。
此外,一方面,考虑到在不同的时间节点,可能存在相同的内容投放任务ID,然而这些相同的任务ID对应的任务不同,这就导致相同的任务ID之间可能存在竞争关系,因此,在实际任务中,是希望在前一个目标时间段就完成对目标内容的投放任务的,若前一个目标时间段未完成对目标内容的投放任务,即真实曝光量累积未达到目标曝光量,也是尽量希望在后一个目标时间段能够完成对目标内容的投放任务。另一方面,结合前述内容可知,为了使得真实曝光量更精准,更符合内容请求用户间的实际竞争关系,在一些实施方式中,可以基于目标内容在后一个目标时间段内的子目标曝光量、曝光量误差以及筛选率,确定目标内容在后一个目标时间段内的目标用户量,这种情况下,后一个目标时间段内的目标用户量可能后一个目标时间段内的子目标用户量的基础上进行调整,因此,是希望在后一个目标时间段的真实曝光量能够适应调整后的目标用户量。
因此,不管是基于上述哪方面的考虑,都可以通过对相似度阈值的调整来改变曝光量产生的速度,可以理解的是,相似度阈值设置的越小,满足相似度阈值的内容请求用户越多,从而曝光量增加的越快。也即,在一些实施方式中,返回步骤:基于目标内容对应的目标曝光量、筛选率以及当前真实曝光量,确定目标内容在后一个目标时间段内的目标用户量之前,还包括步骤:在后一个目标时间段结束时,对相似度阈值进行更新。
可选地,若是希望尽量在后一个目标时间段能够完成对目标内容的投放任务,这种情况下,在后一个目标时间段结束时,对相似度阈值进行更新具体可以是在后一个目标时间段结束时,调小相似度阈值,从而使得满足相似度阈值的内容请求用户越多,从而曝光量增加的越快,以在后一个目标时间段迅速完成对投放任务所需剩余曝光量的补充。
可选地,若是希望在后一个目标时间段结束时,与后一个目标时间段相邻的再后一个目标时间段的真实曝光量能够适应调整后的目标用户量,这种情况下,在后一个目标时间段结束时,对相似度阈值进行更新具体可以是根据目标内容在后一个目标时间段结束时的曝光量误差的大小,确定相似度阈值的大小。具体地,若曝光量误差大于0,则增大相似度阈值,若曝光量误差小于0,则减小相似度阈值。
此外,可以理解的是,在将目标内容发送给待投放用户之后,可能会有待投放用户对目标内容进行点击,这种情况下,在一些实施方式中,将目标内容发送给待投放用户之后,还可以包括步骤:记录待投放用户中、对目标内容进行点击的用户,并利用对目标内容进行点击的用户对点击目标内容的用户进行更新。
在将目标内容发送给待投放用户之后,待投放用户的终端设备中可能会对目标内容进行曝光,此时,待投放用户中可能会有对该目标内容感兴趣的用户,从而对目标内容进行点击,在用户对目标内容进行点击之后,服务器便可以记录下该对目标内容进行点击的用户,从而服务器便可以对点击目标内容的用户进行更新,并且还可以从数据库获取更新后的点击目标内容的用户的历史行为信息,至此,即使是冷启动的目标内容,在本实施例的内容投放方法中也能够获得准确点击目标内容的用户的第一历史行为信息。
本申请实施例提供的内容投放方法,通过计算候选用户的第二历史行为信息与点击目标内容的用户的第一历史行为信息之间的特征相似度,并设置相似度阈值来对内容请求用户进行筛选,一方面可以筛选更适宜发送的用户,进一步提高内容投放准确性,另一方面可以对目标内容发送给待投放用户的速度进行控制,避免过快将目标内容发送给待投放用户,提高优质用户的占比,或者快速适应后一个目标时间段所需的真实曝光量。
下面,将说明本申请实施例在一个实际的应用场景中的示例性应用。
本发明实施例应用在社交软件的看点功能中,建立一套投放系统为一些需要较小曝光量的内容进行投放。
通常情况下,投放系统内会存储一定数量的待投放内容,本实施例中假设为1000个(包括待投放内容X、Y、Z……),其中,每个待投放内容对应有目标曝光量、目标时间段以及目标时长等任务信息,还对应有第一属性信息(例如年龄段/性别/分类/标签/兴趣画像等)以及点击待投放内容的用户的第一历史行为信息。
接着,投放系统可以实时监测并获取内容请求用户发起的内容请求,例如在获取到某个内容请求用户A之后,可以进一步获取到内容请求用户A对应的活跃时间以及对应的第二属性信息(例如年龄段/性别/分类/标签/兴趣画像等)以及第二历史行为信息。
接着,投放系统可以根据内容请求用户A对应的活跃时间与时间阈值进行比较,若小于时间阈值,则判断内容请求用户A为候选关联用户,然后将1000个待投放内容的第一属性信息分别与内容请求用户A的第二属性信息进行匹配,获取匹配的待投放内容,例如匹配的待投放内容有50个。
然后,针对这50个待投放内容中的每个待投放内容,分别将对应的点击待投放内容的用户的第一历史行为信息输入到LDA算法,得到每个待投放内容对应的第一特征向量,以及将内容请求用户A对应的第二历史行为信息输入到LDA算法,得到内容请求用户A对应的第二特征向量,并计算各个待投放内容对应的第一特征向量分别与内容请求用户A对应的第二特征向量之间的相似度,并从中选择相似度大于相似度阈值(例如0.75)的待投放用户,例如还剩下15个,此时可以进一步从剩下的15个待投放内容中选择相似度排序靠前的N个待投放内容,例如选择相似度排序靠前的3个待投放内容。此时,这3个待投放内容则可以成为目标内容。
上面步骤实现了投放系统在获取到内容请求用户A时确定目标内容的过程,投放系统在获取到其他内容请求用户之后确定目标内容的过程可以参考上述过程。
在确定内容请求用户A对应的目标内容(例如,目标内容X、Y、Z)之后,由于内容请求用户A命中了目标内容X、Y、Z,此时,可以分别为目标内容X、Y、Z的计数器自增1,并将目标内容X、Y、Z发送给筛选后台,经由筛选后台通过加权、打分、排序、内容多样性控制策略等对目标内容X、Y、Z进行筛选,从而将筛选通过的目标内容(例如目标内容X、Y)发送给内容请求用户A。
由于目标内容X、Y、Z的投放过程类似,下面以目标内容X的投放过程进行说明。
持续循环上述过程,在一段时间之后,例如2小时(小于目标内容对应的目标时间段,例如6小时)之后,假设目标内容X的计数器计数达到计数目标,即目标用户量,例如2000,其中,当是初次对目标内容X进行投放,那么前一个目标时间段的当前真实曝光量为0,则投放系统可以根据目标内容X的目标曝光量、筛选率以及前一个目标时间段的当前真实曝光量,计算出目标内容的目标用户量(假设目标内容X的目标曝光量为1000,筛选率为0.5,则目标用户量=(1000-0)/0.5=2000),也即目标内容X需要通过前述步骤成为2000个内容请求用户对应的目标内容。
在目标内容X的计数器计数达到计数目标则暂停处理目标内容X,即在再次获取到内容请求用户之后,不再将待投放内容X确定为内容请求用户对应的目标内容。直到经过目标时间段,即经过了6小时之后,统计目标内容X在6小时内对应的当前真实曝光量,假设为800。
由于目标内容X在6小时内对应的当前真实曝光量800,小于目标内容X的目标曝光量1000,因此,还需要为目标内容X补充曝光,此时,需要重新设置目标内容X的计数器计数目标,即目标用户量,具体计算过程为目标用户量=(1000-800)/0.5=400。同时,由于后续为对目标内容X进行曝光量补充,是希望能够尽快达到目标用户量400,因此,可以调小相似度阈值(例如从0.75调整到0.7)。
在一段时间之后,例如0.5小时(小于目标内容对应的目标时间段,例如6小时)之后,假设目标内容X的计数器计数达到计数目标,即目标用户量,例如400,也即目标内容X需要通过前述步骤成为400个内容请求用户对应的目标内容。直到再次经过目标时间段,即再次经过了6小时之后,统计目标内容X在前两个6小时内对应的当前真实曝光量,假设达到了1000,之后便可以结束对目标内容X的投放过程。
此外,若循环上述过程,直到目标时长(例如24小时,即4个目标时间段)之后,目标内容X在4个目标时间段内对应的当前真实曝光量累计依然没有达到1000,则同样结束对目标内容X的投放过程。
下面再以一个用户请求到来时,即服务器接收到内容请求用户时,对本申请实施例提供的内容投放方法进行详细说明。如图11所示,本申请的内容投放方法包括以下步骤:
S410,获取数据。
其中,数据包括待投放内容对应的目标曝光量、目标时间段以及目标时长等任务数据,第一属性信息以及点击待投放内容的用户的第一历史行为信息,内容请求用户对应的第二属性信息以及第二历史行为信息,以及内容请求用户对应的活跃时长。
S420,判断内容请求用户是否为新浅度用户,若是新浅度用户,则执行步骤S430,若不是新浅度用户则结束针对该内容请求用户的流程。
新浅度用户可以理解为候选关联用户。内容请求用户的活跃时长小于时间阈值则确定为新浅度用户。
S430,特征相似度打分。
对第一历史行为信息以及第二历史行为信息进行数据特征化,并对第一历史行为信息对应的特征与第二历史行为信息对应的特征进行相似度打分。
S440,相似度打分是否超过相似度阈值,若超过,则执行步骤S450,若未超过,则结束。
S450,获取相似度打分排序靠前的N个待投放内容,作为内容请求用户对应的目标内容。
S460,判断内容请求用户是否超过目标内容对应的计数器计数上限,若是,则执行步骤S470,若否,则执行步骤S480。
其中,计数器计数上限可以理解为目标内容对应的目标用户量。
S470,判断目标时间段是否结束,若是,则执行步骤S490,若否,则结束。
S480,目标内容对应的计数器加1,并结束。
S490,目标内容对应的计数器计数上限以及计数值更新,并结束。
需要说明的是,本申请提供以上一些具体可实施方式的示例,在互不抵触的前提下,各个实施例示例之间可任意组合,以形成新一种内容投放方法。应当理解的,对于由任意示例所组合形成的新一种内容投放方法,均应落入本申请的保护范围。
另外需要说明的是,在有些作为替换的实现方式中,本发明实施例中部分流程的执行顺序也可以以不同于前述具体实施例中所记载的执行顺序进行执行。例如,两个连续的流程实际上可以并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。
请参阅图12,图12示出了本申请一实施例提出的一种内容投放装置500的框图,该装置500包括:目标用户量确定模块510、目标用户确定模块520、筛选发送模块530以及循环执行模块540。
目标用户量确定模块510,用于基于目标内容对应的目标曝光量、筛选率以及前一个目标时间段结束时的当前真实曝光量,确定目标内容在后一个目标时间段内的目标用户量,前一个目标时间段与后一个目标时间段为相邻的两个时间段。
目标用户确定模块520,用于根据目标用户量以及目标用户确定策略,确定目标内容在后一个目标时间段内关联的目标用户。
筛选发送模块530,用于对目标内容在后一个目标时间段内关联的目标用户进行筛选,得到待投放用户,并将目标内容发送给待投放用户。
循环执行模块540,用于在后一个目标时间段结束时,利用目标内容在待投放用户中的真实曝光量,对目标内容对应的前一个目标时间段结束时的当前真实曝光量进行更新,并返回步骤:基于目标内容对应的目标曝光量、筛选率以及前一个目标时间段结束时的当前真实曝光量,确定目标内容在后一个目标时间段内的目标用户量,直到后一个目标时间段结束时的真实曝光量累计达到目标曝光量或者直到后一个目标时间段结束时对应的累积时长达到目标时长。
作为一种实施方式,目标用户确定模块520包括:关联用户确定子模块以及目标用户确定子模块。
关联用户确定子模块,用于根据目标内容的第一特征信息以及内容请求用户的第二特征信息,从内容请求用户中确定关联用户。
目标用户确定子模块,用于将前目标用户量个关联用户,作为目标内容在后一个目标时间段内关联的目标用户。
作为一种实施方式,第一特征信息包括第一属性信息以及点击目标内容的用户的第一历史行为信息,第二特征信息包括第二属性信息以及内容请求用户的第二历史行为信息,关联用户确定子模块还用于在第二属性信息与第一属性信息匹配的情况下,确定内容请求用户为候选用户;对候选用户的第二历史行为信息进行特征提取,得到候选用户对应的第二特征向量,以及对点击目标内容的用户的第一历史行为信息进行特征提取,得到第一特征向量;基于第一特征向量与第二特征向量之间的相似度以及相似度阈值,从候选用户中确定关联用户。
作为一种实施方式,循环执行模块540,还用于在后一个目标时间段结束时,对相似度阈值进行更新。
作为一种实施方式,目标内容为关联用户对应的多个候选内容中相似度排序靠前的预设数量个候选内容中的一个,候选内容为待投放内容中相似度满足相似度阈值的待投放内容。
作为一种实施方式,目标内容为冷启动内容,关联用户确定子模块还用于获取与目标内容的第一属性信息匹配的第二属性信息;获取目标数量个具有第二属性信息的历史用户作为点击目标内容的用户。
作为一种实施方式,关联用户确定子模块还用于记录待投放用户中、对目标内容进行点击的用户,并利用对目标内容进行点击的用户对点击目标内容的用户进行更新。
作为一种实施方式,第一属性信息通过以下步骤得到:获取目标内容对应的描述性信息;通过神经网络模型对描述性信息进行属性预测,得到神经网络模型输出的第一属性信息,神经网络模型通过携带属性信息标签的描述性信息训练得到。
作为一种实施方式,关联用户确定子模块,还用于获取内容请求用户对应的活跃时间;从活跃时间不满足时间阈值的内容请求用户中确定候选关联用户;根据目标内容的第一特征信息以及候选关联用户的第二特征信息,从候选关联用户中确定关联用户。
作为一种实施方式,前一个目标时间段结束时的当前真实曝光量为前一个目标时间段结束时的真实曝光量累积,循环执行模块540还用于将后一个目标时间段结束时、目标内容在待投放用户中的真实曝光量与当前真实曝光量的累积,作为更新后的前一个目标时间段结束时的当前真实曝光量。
作为一种实施方式,目标用户量确定模块510还用于获取历史曝光量分布数据,历史曝光量分布数据表征历史曝光量在时间维度上的分布情况;基于历史曝光量分布数据以及目标曝光量,确定目标内容在各个目标时间段内的子目标曝光量;基于前一个目标时间段内的子目标曝光量以及当前真实曝光量,确定曝光量误差,前一个目标时间段结束时的当前真实曝光量为前一个目标时间段内的真实曝光量;基于目标内容在后一个目标时间段内的子目标曝光量、曝光量误差以及筛选率,确定目标内容在后一个目标时间段内的目标用户量。对应地,循环执行模块540还用于在后一个目标时间段结束时,将目标内容在待投放用户中的真实曝光量,作为目标内容对应的前一个目标时间段结束时的当前真实曝光量。
作为一种实施方式,装置500还包括目标曝光量确定模块,用于基于曝光量兑换信息以及曝光量兑换信息对应的换算比例,确定目标内容对应的目标曝光量。
本申请实施例提供的内容投放装置,通过后一个目标时间段内的目标用户量来对目标内容在后一个目标时间段内关联的目标用户进行控制,由于对目标用户进行了控制,因此,可以避免持续投放内容,减少投放内容总量,从而减少超发的曝光量,同时,以目标时间段的时间间隔来统计真实曝光量,相当于对真实曝光量的获取起到了一定的等待效果,可以减轻由于延时带来的影响,进一步减少超发的曝光量。
需要说明的是,本申请中装置实施例与前述方法实施例是相互对应的,装置实施例中具体的原理可以参见前述方法实施例中的内容,此处不再赘述。
下面将结合图13对本申请提供的一种服务器进行说明。
请参阅图13,基于上述的内容投放方法,本申请实施例还提供的另一种包括可以执行前述方法的处理器102的服务器100。
服务器100还包括存储器104。其中,该存储器104中存储有可以执行前述实施例中内容的程序,而处理器102可以执行该存储器104中存储的程序。
其中,处理器102可以包括一个或者多个用于处理数据的核以及消息矩阵单元。处理器102利用各种接口和线路连接整个服务器100内的各个部分,通过运行或执行存储在存储器104内的指令、程序、代码集或指令集,以及调用存储在存储器104内的数据,执行服务器100的各种功能和处理数据。可选地,处理器102可以采用数字信号处理(Digital SignalProcessing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。处理器102可集成中央处理器(Central Processing Unit,CPU)、图像处理器(Graphics ProcessingUnit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器102中,单独通过一块通信芯片进行实现。
存储器104可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。存储器104可用于存储指令、程序、代码、代码集或指令集。存储器104可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令、用于实现下述各个方法实施例的指令等。存储数据区还可以存储服务器100在使用中所获取的数据(如,待推荐数据以及操作方式)等。
服务器100还可以包括网络模块以及屏幕,网络模块用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯,例如和音频播放设备进行通讯。网络模块可包括各种现有的用于执行这些功能的电路元件,例如,天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(SIM)卡、存储器等等。网络模块可与各种网络如互联网、企业内部网、无线网络进行通讯或者通过无线网络与其他设备进行通讯。上述的无线网络可包括蜂窝式电话网、无线局域网或者城域网。屏幕可以进行界面内容的显示以及进行数据交互。
在一些实施例中,服务器100还可以包括有:外设接口和至少一个外围设备。处理器102、存储器104和外设接口106之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外设接口连接。具体地,外围设备包括:射频组件108、定位组件112、摄像头114、音频组件116、显示屏118以及电源122等中的至少一种
外设接口106可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器102和存储器104。在一些实施例中,处理器102、存储器104和外设接口106被集成在同一芯片或电路板上;在一些其他实施例中,处理器102、存储器104和外设接口106中的任意一个或两个可以在单独的芯片或电路板上实现,本申请实施例对此不加以限定。
射频组件108用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频组件108通过电磁信号与通信网络以及其他通信设备进行通信。射频组件108将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频组件108包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频组件108可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频组件108还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
定位组件112用于定位服务器的当前地理位置,以实现导航或LBS(LocationBasedService,基于位置的服务)。定位组件112可以是基于美国的GPS(GlobalPositioningSystem,全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。
摄像头114用于采集图像或视频。可选地,摄像头114包括前置摄像头和后置摄像头。通常,前置摄像头设置在服务器100的前面板,后置摄像头设置在服务器100的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头114还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频组件116可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器102进行处理,或者输入至射频组件108以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在服务器100的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器102或射频组件108的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频组件114还可以包括耳机插孔。
显示屏118用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏118是触摸显示屏时,显示屏118还具有采集在显示屏118的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器102进行处理。此时,显示屏118还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏118可以为一个,设置服务器100的前面板;在另一些实施例中,显示屏118可以为至少两个,分别设置在服务器100的不同表面或呈折叠设计;在又一些实施例中,显示屏118可以是柔性显示屏,设置在服务器100的弯曲表面上或折叠面上。甚至,显示屏118还可以设置成非矩形的不规则图形,也即异形屏。显示屏118可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,机发光二极管)等材质制备。
电源122用于为服务器100中的各个组件进行供电。电源122可以是交流电、直流电、一次性电池或可充电电池。当电源122包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
本申请实施例还提供一种计算机可读存储介质。该计算机可读介质中存储有程序代码,程序代码可被处理器调用执行上述方法实施例中所描述的方法。
计算机可读存储介质可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地,计算机可读存储介质包括非易失性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储介质具有执行上述方法中的任何方法步骤的程序代码的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码可以例如以适当形式进行压缩。
本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现方式中描述的方法。
综上,本申请实施例提供的一种内容投放方法、装置、服务器、存储介质及计算机程序产品或计算机程序,通过后一个目标时间段内的目标用户量来对目标内容在后一个目标时间段内关联的目标用户进行控制,由于对目标用户进行了控制,因此,可以避免持续投放内容,减少投放内容总量,从而减少超发的曝光量,同时,以目标时间段的时间间隔来统计真实曝光量,相当于对真实曝光量的获取起到了一定的等待效果,可以减轻由于延时带来的影响,进一步减少超发的曝光量。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (15)

1.一种内容投放方法,其特征在于,包括:
基于目标内容对应的目标曝光量、筛选率以及前一个目标时间段结束时的当前真实曝光量,确定所述目标内容在后一个目标时间段内的目标用户量,所述前一个目标时间段与所述后一个目标时间段为相邻的两个时间段;
根据所述目标用户量以及目标用户确定策略,确定所述目标内容在后一个目标时间段内关联的目标用户;
对所述目标内容在后一个目标时间段内关联的目标用户进行筛选,得到待投放用户,并将所述目标内容发送给所述待投放用户;
在后一个目标时间段结束时,利用所述目标内容在所述待投放用户中的真实曝光量,对所述目标内容对应的前一个目标时间段结束时的当前真实曝光量进行更新,并返回步骤:基于所述目标内容对应的目标曝光量、筛选率以及前一个目标时间段结束时的当前真实曝光量,确定所述目标内容在后一个目标时间段内的目标用户量,直到所述后一个目标时间段结束时的真实曝光量累计达到所述目标曝光量或者直到所述后一个目标时间段结束时对应的累积时长达到目标时长。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标用户量以及目标用户确定策略,确定所述目标内容在后一个目标时间段内关联的目标用户,包括:
根据所述目标内容的第一特征信息以及内容请求用户的第二特征信息,从内容请求用户中确定关联用户;
将前目标用户量个所述关联用户,作为所述目标内容在后一个目标时间段内关联的目标用户。
3.根据权利要求2所述的方法,其特征在于,所述第一特征信息包括第一属性信息以及点击所述目标内容的用户的第一历史行为信息,所述第二特征信息包括第二属性信息以及所述内容请求用户的第二历史行为信息,所述根据所述目标内容的第一特征信息以及内容请求用户的第二特征信息,从内容请求用户中确定关联用户,包括:
在所述第二属性信息与所述第一属性信息匹配的情况下,确定所述内容请求用户为候选用户;
对所述候选用户的第二历史行为信息进行特征提取,得到所述候选用户对应的第二特征向量,以及对所述点击所述目标内容的用户的第一历史行为信息进行特征提取,得到第一特征向量;
基于所述第一特征向量与所述第二特征向量之间的相似度以及相似度阈值,从所述候选用户中确定所述关联用户。
4.根据权利要求3所述的方法,其特征在于,所述返回步骤:基于所述目标内容对应的目标曝光量、筛选率以及当前真实曝光量,确定所述目标内容在后一个目标时间段内的目标用户量之前,所述方法还包括:
在所述后一个目标时间段结束时,对所述相似度阈值进行更新。
5.根据权利要求3所述的方法,其特征在于,所述目标内容为所述关联用户对应的多个候选内容中相似度排序靠前的预设数量个候选内容中的一个,所述候选内容为待投放内容中相似度满足相似度阈值的待投放内容。
6.根据权利要求3所述的方法,其特征在于,所述目标内容为冷启动内容,所述对所述点击所述目标内容的用户的第一历史行为信息进行特征提取之前,所述方法还包括:
获取与所述目标内容的第一属性信息匹配的第二属性信息;
获取目标数量个具有所述第二属性信息的历史用户作为所述点击所述目标内容的用户。
7.根据权利要求6所述的方法,其特征在于,所述将所述目标内容发送给所述待投放用户之后,所述方法还包括:
记录所述待投放用户中、对所述目标内容进行点击的用户,并利用所述对所述目标内容进行点击的用户对所述点击所述目标内容的用户进行更新。
8.根据权利要求3所述的方法,其特征在于,所述第一属性信息通过以下步骤得到:
获取所述目标内容对应的描述性信息;
通过神经网络模型对所述描述性信息进行属性预测,得到所述神经网络模型输出的第一属性信息,所述神经网络模型通过携带属性信息标签的描述性信息训练得到。
9.根据权利要求2所述的方法,其特征在于,所述根据所述目标内容的第一特征信息以及内容请求用户的第二特征信息,从内容请求用户中确定关联用户,包括:
获取所述内容请求用户对应的活跃时间;
从所述活跃时间不满足时间阈值的内容请求用户中确定候选关联用户;
根据所述目标内容的第一特征信息以及所述候选关联用户的第二特征信息,从所述候选关联用户中确定关联用户。
10.根据权利要求1-9任一项所述的方法,其特征在于,所述前一个目标时间段结束时的当前真实曝光量为前一个目标时间段结束时的真实曝光量累积,所述利用所述目标内容在所述待投放用户中的真实曝光量,对所述目标内容对应的前一个目标时间段结束时的当前真实曝光量进行更新,包括:
将所述后一个目标时间段结束时、目标内容在所述待投放用户中的真实曝光量与所述当前真实曝光量的累积,作为更新后的前一个目标时间段结束时的当前真实曝光量。
11.根据权利要求1-9任一项所述的方法,其特征在于,所述基于目标内容对应的目标曝光量、筛选率以及当前真实曝光量,确定所述目标内容在后一个目标时间段内的目标用户量,包括:
获取历史曝光量分布数据,所述历史曝光量分布数据表征历史曝光量在时间维度上的分布情况;
基于所述历史曝光量分布数据以及所述目标曝光量,确定所述目标内容在各个目标时间段内的子目标曝光量;
基于前一个目标时间段内的子目标曝光量以及所述当前真实曝光量,确定曝光量误差,所述前一个目标时间段结束时的当前真实曝光量为所述前一个目标时间段内的真实曝光量;
基于目标内容在后一个目标时间段内的子目标曝光量、曝光量误差以及筛选率,确定所述目标内容在后一个目标时间段内的目标用户量;
所述利用所述目标内容在所述待投放用户中的真实曝光量,对所述目标内容对应的前一个目标时间段结束时的当前真实曝光量进行更新,包括:
在所述后一个目标时间段结束时,将所述目标内容在所述待投放用户中的真实曝光量,作为所述目标内容对应的前一个目标时间段结束时的当前真实曝光量。
12.根据权利要求1所述的方法,其特征在于,所述目标内容携带曝光量兑换信息,所述基于目标内容对应的目标曝光量、筛选率以及前一个目标时间段结束时的当前真实曝光量,确定所述目标内容在后一个目标时间段内的目标用户量之前,所述方法还包括:
基于所述曝光量兑换信息以及所述曝光量兑换信息对应的换算比例,确定所述目标内容对应的目标曝光量。
13.一种内容投放装置,其特征在于,包括:
目标用户量确定模块,用于基于目标内容对应的目标曝光量、筛选率以及前一个目标时间段结束时的当前真实曝光量,确定所述目标内容在后一个目标时间段内的目标用户量,所述前一个目标时间段与所述后一个目标时间段为相邻的两个时间段;
目标用户确定模块,用于根据所述目标用户量以及目标用户确定策略,确定所述目标内容在后一个目标时间段内关联的目标用户;
筛选发送模块,用于对所述目标内容在后一个目标时间段内关联的目标用户进行筛选,得到待投放用户,并将所述目标内容发送给所述待投放用户;
循环执行模块,用于在后一个目标时间段结束时,利用所述目标内容在所述待投放用户中的真实曝光量,对所述目标内容对应的前一个目标时间段结束时的当前真实曝光量进行更新,并返回步骤:基于所述目标内容对应的目标曝光量、筛选率以及前一个目标时间段结束时的当前真实曝光量,确定所述目标内容在后一个目标时间段内的目标用户量,直到所述后一个目标时间段结束时的真实曝光量累计达到所述目标曝光量或者直到所述后一个目标时间段结束时对应的累积时长达到目标时长。
14.一种服务器,其特征在于,包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行如权利要求1-12中任一项所述的方法。
15.一种计算机可读取存储介质,其特征在于,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行如权利要求1-12中任一项所述的方法。
CN202110666354.XA 2021-06-16 2021-06-16 内容投放方法、装置、服务器及存储介质 Pending CN115482023A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110666354.XA CN115482023A (zh) 2021-06-16 2021-06-16 内容投放方法、装置、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110666354.XA CN115482023A (zh) 2021-06-16 2021-06-16 内容投放方法、装置、服务器及存储介质

Publications (1)

Publication Number Publication Date
CN115482023A true CN115482023A (zh) 2022-12-16

Family

ID=84419141

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110666354.XA Pending CN115482023A (zh) 2021-06-16 2021-06-16 内容投放方法、装置、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN115482023A (zh)

Similar Documents

Publication Publication Date Title
CN108900923B (zh) 推荐直播模板的方法和装置
CN109347722B (zh) 交互系统、方法、客户端及后台服务器
CN107992604B (zh) 一种任务条目的分发方法及相关装置
CN109040766B (zh) 直播视频处理方法、装置及存储介质
US20170118298A1 (en) Method, device, and computer-readable medium for pushing information
CN113422988B (zh) 直播封面生成方法、装置、电子设备及存储介质
CN112118460A (zh) 资源处理方法、装置、终端及服务器
CN109831690A (zh) 弹幕消息的显示、发送方法、装置、终端及服务器
CN108900924A (zh) 直播间中推荐好友的方法和装置
CN113365086B (zh) 直播数据互动方法、装置、电子设备、服务器及存储介质
CN111898037B (zh) 排行榜数据的更新方法、装置及服务器
WO2023109037A1 (zh) 基于直播间的互动方法及电子设备
CN112232854A (zh) 业务处理方法、装置、设备及存储介质
CN113727200A (zh) 一种视频摘要信息确定方法、装置、电子设备及存储介质
CN114173143A (zh) 直播处理方法、装置、计算机设备及介质
CN111435377A (zh) 应用推荐方法、装置、电子设备以及存储介质
CN111930287B (zh) 基于虚拟对象的交互方法、装置、电子设备及存储介质
CN112767053A (zh) 信息处理方法、装置、电子设备及存储介质
CN112328895A (zh) 用户画像生成方法、装置、服务器及存储介质
CN112019890A (zh) 直播分发方法、装置、服务器及介质
CN115482023A (zh) 内容投放方法、装置、服务器及存储介质
WO2022183940A1 (zh) 推荐内容资源的获取方法、装置、设备、介质及程序产品
CN110636363A (zh) 多媒体信息播放方法及装置、电子设备和存储介质
CN113553509B (zh) 一种内容推荐方法、装置、电子设备及存储介质
CN113515336B (zh) 直播间加入方法、创建方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination