CN109840782A - 点击率预测方法、装置、服务器以及存储介质 - Google Patents
点击率预测方法、装置、服务器以及存储介质 Download PDFInfo
- Publication number
- CN109840782A CN109840782A CN201711194193.9A CN201711194193A CN109840782A CN 109840782 A CN109840782 A CN 109840782A CN 201711194193 A CN201711194193 A CN 201711194193A CN 109840782 A CN109840782 A CN 109840782A
- Authority
- CN
- China
- Prior art keywords
- content item
- user
- behavior
- predicted
- behavioural characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种点击率预测方法、装置、服务器以及存储介质,属于网络技术领域。所述方法包括:确定待预测用户;根据所述待预测用户的历史时序行为特征和待预测的多个内容项,获取所述待预测用户的目标时序行为特征,所述目标时序行为特征包括所述多个内容项对应的时序行为特征;根据所述待预测用户的目标时序行为特征和点击率预测模型,获取所述多个内容项的点击率。本发明通过基于时序数据生成的时序行为特征以及使用时序行为特征训练得到的点击率预测模型,对内容项进行点击率预测,提高了点击率的预测准确率。
Description
技术领域
本发明涉及网络技术领域,尤其涉及一种点击率预测方法、装置、服务器以及存储介质。
背景技术
随着互联网的发展,内容项的展示方式发生了很大改变,通过在线的方式来展示内容项日益普遍,该内容项可以为图片、新闻、广告等。以广告为例,在线广告日益成为互联网经济的一个主要组成部分。广告的点击率是指广告展示后被点击的概率,点击率的高低可以反映当前展示的广告是否符合用户的兴趣。目前的广告平台一般通过预测广告的点击率,对广告进行排序并投放,以提高平台的整体收益。
目前,预测广告点击率的方法可以包括:统计过去一段时间(如过去一周)用户对某个广告的曝光次数与点击次数,得到历史统计值,将该历史统计值作为该用户的行为特征对模型进行训练。在预测点击率时,服务器获取到的该用户的行为特征一直都是该用户的历史统计值。这样,每次预测点击率时,向模型输入的该用户的行为特征都是用一个值,导致模型输出的点击率也是一个固定不变的值。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
上述技术仅仅考虑过去一段时间的历史行为统计量,导致用户即使进行若干次行为,统计值并不会改变,该用户的行为特征仍然是同一个值,但实际上用户的每次行为都会导致统计值的实时变化,上述技术在预测点击率时并没有考虑这种实时变化所带来的影响,导致点击率的预测准确率低。
发明内容
本发明实施例提供了一种点击率预测方法、装置、服务器以及存储介质,可以解决现有技术预测准确率低的问题。所述技术方案如下:
一方面,提供了一种点击率预测方法,所述方法包括:
确定待预测用户;
根据所述待预测用户的历史时序行为特征和待预测的多个内容项,获取所述待预测用户的目标时序行为特征,所述目标时序行为特征包括所述多个内容项对应的时序行为特征;
根据所述待预测用户的目标时序行为特征和点击率预测模型,获取所述多个内容项的点击率,所述点击率预测模型基于多个样本用户的时序行为特征以及各个时序行为特征对应的实际点击率训练得到;
其中,时序行为特征基于内容项的点击行为时序数据和曝光行为时序数据生成。
另一方面,提供了一种点击率预测装置,所述装置包括:
确定模块,用于确定待预测用户;
获取模块,用于根据所述待预测用户的历史时序行为特征和待预测的多个内容项,获取所述待预测用户的目标时序行为特征,所述目标时序行为特征包括所述多个内容项对应的时序行为特征;
所述获取模块,还用于根据所述待预测用户的目标时序行为特征和点击率预测模型,获取所述多个内容项的点击率,所述点击率预测模型基于多个样本用户的时序行为特征以及各个时序行为特征对应的实际点击率训练得到;
其中,时序行为特征基于内容项的点击行为时序数据和曝光行为时序数据生成。
又一方面,提供了一种服务器,所述服务器包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、至少一段程序、代码集或指令集由所述处理器加载并执行以实现上述点击率预测方法所执行的操作。
再一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如上述点击率预测方法所执行的操作。
本发明提供的技术方案,在实际预测时,可以通过能够体现用户历史行为的时序行为特征来获取用户对多个待预测的内容项的时序行为特征,最终基于获取到的时序行为特征以及基于实时行为构建的点击率预测模型来进行点击率预测,由于用户的实时行为会对点击率带来影响,因此,基于该点击率预测模型进行的预测,大大提高了点击率的预测准确率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种曝光频次对点击率的影响示意图;
图2是本发明实施例提供的一种点击频次对点击率的影响示意图;
图3是本发明实施例提供的一种点击率预测方法的实施环境示意图;
图4是本发明实施例提供的一种点击率预测方法的流程图;
图5是本发明实施例提供的一种点击率预测方法的流程图;
图6是本发明实施例提供的一种基于实时流式的计算架构示意图;
图7是本发明实施例提供的一种实际点击率和预测点击率的变化示意图;
图8是本发明实施例提供的一种点击率预测装置的结构示意图;
图9是本发明实施例提供的一种点击率预测装置的结构示意图;
图10是本发明实施例提供的一种点击率预测装置的结构示意图;
图11是本发明实施例提供的一种服务器1100的框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
相关技术将历史统计值作为用户的行为特征,这种特征并没有考虑用户的实时行为对点击率预测所带来的影响,导致点击率的预测准确率低。针对上述问题,本发明提供的技术方案,通过对用户行为的时序数据进行分析,挖掘和设计出与点击率相关性很高的时序行为特征,并利用其对点击率预测模型进行训练,使得该模型有能力更精确的拟合点击率的实际分布。下面以内容项为广告为例,介绍一下本发明进行特征挖掘和设计的过程。
下面,对一些术语的概念进行说明,其中,频次是指某种行为在时间上的发生次序,即行为第几次发生。例如,曝光频次是指曝光行为第几次发生,点击频次是指点击行为第几次发生。曝光行为是指被展示给用户的行为,点击行为是指被用户点击的行为。
发明人通过对广告的大量业务数据分析发现,广告的曝光行为或点击行为随着其频次上的变化,会对广告的点击率预测有较大影响,且上述曝光行为或点击行为在频次上随时间也会呈现有规律性的表现。具体分析过程如下:
在进行数据分析与特征挖掘时,可以通过分析不同频次下的实际点击率(ctr),来验证频次对点击率有很明显的影响。基于<用户,广告主>维度的部分分析结果如图1和图2所示,其中,图1是曝光频次对点击率的影响示意图,图2是点击频次对点击率的影响示意图。
从图1可以看到,对于同一个广告主的广告,随着曝光频次的增加,用户对广告的点击率逐次降低,表明短时间内连续曝光导致用户的点击意愿降低。
从图2可以看到,对于同一个广告主的广告,随着点击频次的增加,用户对广告的点击率逐次增加,表明上一次的点击行为很大程度上揭示了用户对此类广告的偏好倾向,也即用户点击较多的广告一般是用户比较偏好的。
同时,通过实际点击率(ctr)与预测点击率(avg-pctr)曲线的对比,可以看到原模型在预测广告的点击率时没有捕捉到广告的点击频次或曝光频次等信息,导致预测点击率与实际点击率有明显的差距。其中,预测点击率是利用模型计算得到的点击率,实际点击率是根据用户的实际行为统计得到的。
本发明将利用用户的实时行为对点击率预测模型进行训练,以该点击率预测模型为逻辑回归模型为例,该点击率预测模型的特征拟合函数可以如下式(1)所示:
x=w0+w1*x1+……+wn*xn(1)
其中,n为正整数;x1至xn是各个特征;w1至wn为每个特征对应的权重,其通过点击率预测模型训练学习得到。原模型中可以含有多个特征,例如,用户年龄特征、用户性别特征、内容项展示区域特征、联网方式特征、终端型号特征等等,这些特征可以通过预设特征变换方式变成一个实数值,带入该特征拟合函数。例如,用户性别特征基于用户性别生成,性别可以经过编码转换成数字,如性别为男时编码成1,性别为女时编码成2。而本发明设计的点击率预测模型除了含有x1和x2两个特征以外,还可以含有频次特征、时间间隔特征等时序行为特征。
点击率预测模型的点击率预测函数(如sigmod函数)可以如下式(2)所示:
其中,x由上式(1)计算得到。
服务器将时序行为特征输入该点击率预测模型,通过该点击率预测模型中的上式(1)所示的特征拟合函数和上式(2)所示的点击率预测函数进行计算,从而得到预测的点击率。
需要说明的是,本发明实施例是以点击率预测模型为逻辑回归模型(包括特征拟合函数和点击率预测函数)为例进行说明,实际上,点击率预测模型也可以是其他可进行点击率预测的模型,本发明实施例对此不做限定。
图3是本发明实施例提供的一种点击率预测方法的实施环境示意图,参见图3,该实施环境中可以包括:至少一个服务器301和至少一个终端302。
其中,服务器301用于为终端302提供内容项服务,该内容项服务可以是广告服务、新闻服务或游戏服务等,具体地,服务器301可以根据终端302发送的内容项请求,为终端302提供内容项服务。
例如,终端302可以向服务器301发送内容项展示请求,服务器301可以在接收到该内容项展示请求后,向终端302发送内容项,使得终端302可以实现对内容项的展示。
另外,该服务器301还可以配置至少一个数据库,如,内容项数据库、用户数据库等等。该内容项数据库用于存储内容项相关的各种数据,该用户数据库用于存储该服务器301所服务的用户的人口属性(年龄、性别、地域)、用户画像以及行为数据等。
本发明实施例中,终端可以在检测到对内容项的实时行为时,向服务器发送内容项日志,该内容项日志用于记录该实时行为,服务器每次接收到该内容项日志时,可以根据该内容项日志生成时序行为特征,并利用该时序行为特征对已有的点击率预测模型进行更新。当需要进行点击率预测时,服务器可以通过当前最新的点击率预测模型进行计算,从而得到预测的点击率。下面将在图4所示的实施例中对点击率预测模型的更新过程进行说明,在图5所示的实施例中对点击率的预测过程进行说明。
图4是本发明实施例提供的一种点击率预测方法的流程图。基于图3所示实施例中服务器和终端之间的交互,参见图4,该方法包括如下步骤:
401、服务器生成点击率预测模型。
在一种可能实现方式中,服务器可以基于多个样本用户的时序行为特征以及各个时序行为特征对应的实际点击率进行训练,得到点击率预测模型。例如,服务器可以维护一个用户行为数据库,该数据库中记录了各个用户对已展示过或已点击过的内容项的历史时序数据。服务器可以从用户行为数据库中抽取多个样本用户的历史时序数据作为样本数据,并基于该样本数据获取每个样本用户的时序行为特征以及对应的实际点击率,进而基于获取到的各个时序行为特征以及对应的实际点击率训练得到点击率预测模型,本发明实施例对模型训练所采用的具体算法不做限定。
通过从己有的用户行为数据中抽取样本数据,来生成点击率预测模型,提供了一种生成点击率预测模型的可能实现方式。服务器生成点击率预测模型后,可以通过后续步骤402至步骤404对其进行更新。
402、终端向服务器发送用户的内容项日志,该内容项日志用于记录该用户对内容项的实时行为,该实时行为包括曝光行为和点击行为。
本发明实施例中,当终端检测到用户对任一个内容项的实时行为时,可以生成该用户的内容项日志。在一种可能实现方式中,终端可以根据该用户的用户标识、该内容项以及该实时行为生成内容项日志,并向服务器发送该内容项日志。以内容项为广告为例,当终端展示某个广告,或终端根据用户对网页滚动条的下拉操作展示相应广告时,终端可以将对该广告的曝光行为以实时广告日志流的形式发送给服务器,例如,本次广告日志可以记录用户标识、该广告以及曝光行为。当用户对该展示的广告进行点击操作时,终端可以将用户对该广告的点击行为以广告日志的形式实时发送给服务器,例如,本次广告日志可以记录用户标识、该广告以及点击行为。
通过终端向服务器提供用户对广告的实时行为,使得服务器可以根据用户的实时行为,统计得到用户的时序数据,进而根据时序数据生成时序行为特征。
403、当接收到该用户的内容项日志时,服务器根据该内容项日志,生成该用户的内容项对应的时序行为特征。
由于内容项日志能够体现用户对内容项的实时行为,因此,可以基于该内容项日志生成对应的时序行为特征,以通过至少一个维度的特征来表示用户对内容项的偏好。该至少一个维度可以包括<用户,内容项>、<用户,归属用户>、<用户,内容项类型>中的至少一项。
在一种可能实现方式中,服务器根据该内容项日志,生成该用户的内容项对应的时序行为特征可以包括如下步骤a至步骤c:
步骤a、服务器根据内容项日志中记录的内容项,确定该内容项的各个属性,该内容项的各个属性包括该内容项、该内容项的归属用户以及该内容项的内容项类型。
在一种可能实现方式中,服务器确定该内容项的各个属性可以包括:服务器根据该内容项以及预先存储的多个内容项的属性信息,确定该内容项的各个属性。例如,服务器可以维护一个内容项数据库,该数据库用于存储服务器可以提供给用户的内容项。对于数据库中的每个内容项,服务器还可以存储该内容项的属性信息,包括该内容项、该内容项的归属用户以及该内容项的内容项类型。其中,归属用户可以是指提供内容项的用户,如提供广告的广告主;内容项类型可以是指内容项所属行业,如广告所属行业。以广告为例,各个广告主可以将希望投放的广告以广告订单的形式提交给服务器,服务器可以将这些广告存储在数据库中。广告主提交给服务器的广告订单中可以包括广告的属性信息。
步骤b、服务器按照<用户,内容项>、<用户,归属用户>、<用户,内容项类型>3个维度,实时统计该用户的该内容项对应的点击行为时序数据和曝光行为时序数据。
其中,点击行为时序数据可以包括点击频次,曝光行为时序数据可以包括曝光频次。
针对点击频次,服务器统计该内容项对应的点击频次的过程可以包括:根据当前接收到的内容项日志以及之前接收到的内容项日志,统计该用户对该内容项的点击行为的第一频次、该用户对第一指定内容项的点击行为的第二频次以及用户对第二指定内容项的点击行为的第三频次。其中,第一指定内容项包括与该内容项属于同一个归属用户的所有内容项,该第二指定内容项包括与该内容项属于同一个内容项类型的所有内容项。
针对曝光频次,服务器统计该内容项对应的曝光频次的过程可以包括:根据当前接收到的内容项日志以及之前接收到的内容项日志,统计该用户对该内容项的曝光行为的第四频次、该用户对第一指定内容项的曝光行为的第五频次以及用户对第二指定内容项的曝光行为的第六频次。
在一种可能实现方式中,点击行为时序数据还包括点击行为距离上一次点击行为的时间间隔,曝光行为时序数据还包括曝光行为距离上一次曝光行为的时间间隔。
针对时间间隔,服务器统计该内容项对应的时间间隔的过程可以包括:
服务器根据当前接收到的内容项日志以及之前接收到的内容项日志,统计该用户对该内容项的点击行为或曝光行为距离上一次同类行为的第一时间间隔、该用户对第一指定内容项的点击行为或曝光行为距离上一次同类行为的第二时间间隔以及用户对第二指定内容项的点击行为或曝光行为距离上一次同类行为的第三时间间隔。
在一种可能实现方式中,如果当前接收到的内容项日志中记录的是点击行为,则服务器获取第一时间间隔的过程可以包括:服务器每次接收到内容项日志时,对该内容项日志中记录的点击行为或曝光行为的时间进行记录,得到该点击行为或曝光行为的时间戳,相应地,服务器可以根据当前接收到的内容项日志中该用户对该内容项的点击行为的第一时间戳,获取该用户对该内容项的上一次点击行为的第二时间戳,根据该第一时间戳和该第二时间戳获取该第一时间间隔。例如,第一时间戳指示的时间为T1,第二时间戳指示的时间为T2,则第一时间间隔T=T1-T2。其中,该上一次点击行为是之前接收到的内容项日志中时间戳与该第一时间戳最接近的点击行为。
步骤c、根据该点击行为时序数据和曝光行为时序数据,生成该用户的该内容项对应的时序行为特征。
其中,该时序行为特征可以包括频次特征。针对该频次特征,服务器生成该用户的该内容项对应的频次特征的过程可以包括:服务器基于步骤b中统计得到的该内容项对应的曝光频次和点击频次,生成该用户的该内容项对应的频次特征。例如,频次特征可以由点击频次和曝光频次组合得到,如频次特征的计算方式可以是:10×X+Y,其中,X是曝光频次,Y是点击频次。可选地,当曝光频次大于10时,X均取值为10,当点击频次大于5时,Y均取值为5。需要说明的是,上述频次特征的计算方式仅是一种示例,还可以是其他计算方式,例如,上述计算方式中,可以根据点击频次和曝光频次对点击率的影响程度来设置具体算法中X和Y的系数,也即是,X的系数可以是除10以外的其他数值,Y的系数可以是除1以外的其他数值,本发明实施例对频次特征的计算方式不做限定。
针对上述步骤b中内容项对应的点击频次包括第一频次、第二频次和第三频次,内容项对应的曝光频次包括第四频次、第五频次和第六频次,服务器生成该用户的该内容项对应的频次特征的过程包括:服务器按照上述频次特征的计算方式,基于第一频次和第四频次,生成该用户的该内容项的频次特征;基于第二频次和第五频次,生成该用户的该内容项的归属用户的频次特征;基于第三频次和第六频次,生成该用户的该内容项的内容项类型的频次特征。
通过用户的实时行为,统计得到点击频次和曝光频次等时序数据,并根据该时序数据生成频次特征,由于考虑了用户的实时行为对时序数据的影响,使得生成的频次特征可以反映用户实时行为的频次,从而将频次特征应用于点击率预测中,可以提高点击率预测的准确率。
在一种可能实现方式中,该时序行为特征还可以包括时间间隔特征。针对时间间隔特征,服务器生成该用户的该内容项对应的时间间隔特征的过程可以包括:服务器基于步骤b中统计得到的该内容项对应的时间间隔,生成该用户的该内容项对应的时间间隔特征。例如,服务器可以将该时间间隔直接获取为该时间间隔特征,如时间间隔为T=T1-T2,则时间间隔特征为T。
针对上述步骤b中内容项对应的时间间隔特征包括第一时间间隔、第二时间间隔和第三时间间隔,服务器生成该用户的该内容项对应的时间间隔特征的过程包括:服务器基于该第一时间间隔生成该用户的该内容项的时间间隔特征;基于第二时间间隔生成该用户的该内容项的归属用户的时间间隔特征;基于第三时间间隔生成该用户的该内容项的内容项类型的时间间隔特征。
通过用户的实时行为,统计得到点击行为或曝光行为距离上一次同类行为的时间间隔等时序数据,并根据该时序数据生成时间间隔特征,由于考虑了用户的实时行为对时序数据的影响,使得生成的时间间隔特征可以反映用户实时行为的时间间隔,从而将时间间隔特征和频次特征应用于点击率预测中,可以提高点击率预测的准确率。
上述步骤402至步骤403是服务器对终端实时发送的内容项日志进行实时处理,生成时序行为特征的过程。通过用户对内容项的实时行为生成时序行为特征,从而可以将时序行为特征应用于点击率预测中,提高点击率预测的准确率。
需要说明的是,针对时序行为特征中的频次特征,服务器每次生成频次特征后,可以存储该频次特征,具体地,服务器可以使用当前生成的频次特征更新已存储的频次特征,这样服务器下次可以根据实时接收到的广告日志中记录的曝光行为或点击行为以及已存储的频次特征生成频次特征,例如将频次特征加1,得到新的频次特征。
针对时序行为特征中的时间间隔特征,服务器可以每次生成时间间隔特征时,存储该时间间隔特征对应的时间戳,即当前接收到的内容项日志中记录的点击行为或曝光行为的时间戳,如上述步骤b中的第一时间戳,具体地,服务器可以使用该第一时间戳更新已存储的第二时间戳,这样服务器下次可以根据实时接收到的广告日志中记录的曝光行为或点击行为的时间戳以及已存储的上一次同类行为的时间戳来生成时间间隔特征。
404、服务器使用该用户的内容项对应的时序行为特征,对该点击率预测模型进行更新。
本发明实施例中,服务器每次生成时序行为特征后,都可以基于当前生成的时序行为特征对该点击率预测模型进行更新,例如,对点击率预测模型的特征拟合函数进行更新,如更新特征拟合函数中每个特征的权重。
本发明实施例提供的方法,通过用户的实时行为统计得到时序数据,并根据该时序数据生成时序行为特征,进而使用时序行为特征对击率预测模型进行更新,使得服务器可以在需要进行点击率预测时,通过当前最新的点击率预测模型进行计算得到预测的点击率,从而提高点击率的预测准确率。
上述图4所示实施例是服务器利用时序行为特征对点击率预测模型进行更新的过程。当需要进行点击率预测时,服务器可以通过当前最新的点击率预测模型进行计算,从而得到预测的点击率,具体过程参见图5所示的实施例。
图5是本发明实施例提供的一种点击率预测方法的流程图。基于图3所示实施例中服务器和终端之间的交互,参见图5,该方法包括如下步骤:
501、服务器确定待预测用户。
在一种可能实现方式中,服务器确定待预测用户的过程包括:当接收到内容项展示请求时,将该内容项展示请求对应的用户确定为待预测用户。其中,该内容项展示请求携带用户标识。其中,该内容项展示请求可以由待预测用户的终端发送给服务器,例如,当待预测用户通过相应操作触发该内容项展示请求时,终端可以将该待预测用户的用户标识携带在该内容项展示请求中发送给服务器。其中,该内容项展示请求可以由用户对浏览器或网页的打开操作触发,本发明实施例对内容项展示请求的触发条件不做限定。
502、服务器获取该待预测用户的多个内容项。
在一种可能实现方式中,服务器可以为不同的待预测用户提供不同的内容项集合,该内容项集合中包括内容项数据库中的多个内容项。具体地,服务器可以存储有用户标识与内容项集合之间的对应关系,服务器可以根据该待预测用户的用户标识,确定该待预测用户的内容项集合,将该内容项集合中的内容项获取为该待预测用户的多个内容项。每个待预测用户的内容项集合由服务器根据该待预测用户对内容项的历史行为分析得到。通过为不同用户提供不同的内容项集合,使得内容项的展示更具有针对性。
需要说明的是,服务器也可以为不同的待预测用户提供相同的内容项集合,例如,对于每个待预测用户,服务器均可以将内容项数据库中的所有内容项获取为该待预测用户对应的多个内容项,本发明实施例对此不做限定。
503、服务器根据该待预测用户的历史时序行为特征和该多个内容项,获取该待预测用户的目标时序行为特征,该目标时序行为特征包括该多个内容项对应的时序行为特征。
本发明实施例中,服务器可以存储有各个待预测用户的历史时序行为特征,每个待预测用户的历史时序行为特征包括<用户,内容项>、<用户,归属用户>和<用户,内容项类型>3个维度的时序行为特征。其中,该历史时序行为特征基于待预测用户对已展示过或已点击过的内容项的时序数据生成,具体的生成过程在图4所示实施例中的步骤402至步骤403中已有详细描述,在此不做赘述。
在一种可能实现方式中,服务器根据该待预测用户的历史时序行为特征和多个内容项,获取该待预测用户的目标时序行为特征,包括下述步骤a和b:
步骤a、根据待预测用户的用户标识,获取该待预测用户的历史时序行为特征。
该待预测用户的历史时序行为特征包括该待预测用户的所有内容项对应的时序行为特征,该待预测用户的每个内容项对应的时序行为特征可以包括该待预测用户的该内容项的频次特征、该待预测用户的该内容项的归属用户的频次特征以及该待预测用户的该内容项的内容项类型的频次特征。
在一种可能实现方式中,该待预测用户的每个内容项对应的时序行为特征还可以包括该待预测用户的该内容项的时间间隔特征、该待预测用户的该内容项的归属用户的时间间隔特征以及该待预测用户的该内容项的内容项类型的时间间隔特征。上述频次特征和时间间隔特征的获取过程在图4所示实施例中的步骤402至步骤403中已有详细说明,在此不再赘述。
步骤b、根据该待预测用户的历史时序行为特征,获取该待预测用户的该多个内容项对应的时序行为特征。
考虑到该待预测用户当前可能未对任一个内容项进行实时行为,为此,服务器可以根据之前存储的该待预测用户的历史时序行为特征,获取该多个内容项对应的时序行为特征。
具体地,对于该多个内容项中的每个内容项,服务器可以确定该内容项的各个属性,根据该内容项的各个属性,从该待预测用户的历史时序行为特征中获取该待预测用户的该内容项对应的时序行为特征。
通过从用户标识的历史时序行为特征中获取多个内容项对应的时序行为特征,提供了一种获取该多个内容项对应的时序行为特征的可能实现方式。
504、服务器根据该待预测用户的目标时序行为特征和点击率预测模型,获取该多个内容项的点击率。
本发明实施例中,服务器在获取待预测用户的目标时序行为特征后,可以利用点击率预测模型和该目标时序行为特征中每个内容项对应的时序行为特征,对每个内容项进行点击率预测。例如,对于每个内容项,服务器可以将该内容项对应的时序行为特征输入该点击率预测模型,将该点击率预测模型的输出获取为该内容项的点击率。在一种可能实现方式中,服务器可以通过该点击率预测模型的特征拟合函数和点击率预测函数计算得到该内容项的点击率,具体地,通过点击率预测模型的特征拟合函数得到x后,再将x带入点击率预测函数计算得到该内容项的点击率。
本发明实施例以特征拟合函数中的n为8为例对点击率的预测进行说明,当n为8时,特征拟合函数可以如下式(3)所示:
x=w0+w1*x1+w2*x2+w3*x3+w4*x4+w5*x5+w6*x6+w7*x7+w8*x8 (3)
其中,x1可以是用户年龄特征;x2可以是用户性别特征;x3可以是<用户标识,内容项>的频次特征;x4可以是<用户标识,归属用户>的频次特征;x5可以是<用户标识,内容项类型>的频次特征;x6可以是<用户标识,内容项>的时间间隔特征;x7可以是<用户标识,归属用户>的时间间隔特征;x8可以是<用户标识,内容项类型>的时间间隔特征。
其中,用户年龄特征和用户性别特征可以基于用户标识对应的用户信息生成,例如,服务器可以根据待预测用户的用户标识,查询用户数据库得到该待预测用户的年龄和性别等用户信息,其中,用户数据库用于存储各个用户的用户标识、年龄、性别等个人信息。
上述步骤501至步骤504是服务器利用点击率预测模型进行点击率预测的过程。服务器对待展示的多个内容项进行点击率预测后,可以根据预测结果,对各个内容项进行排序并展示,详见后续步骤505至步骤507。
505、服务器根据获取到的该多个内容项的点击率,对该多个内容项进行排序。
本发明实施例中,考虑到点击率的高低可以反映用户对内容项的兴趣,服务器可以按照点击率从大到小的顺序,对该多个内容项进行排序,点击率越高的内容项越靠前。
506、服务器将排序后的内容项发送给终端。
通过将排序后的内容项发送给终端展示,由于该排序是按照点击率进行的,在前面显示的是用户很有可能点击的内容项,可以提高用户对内容项的点击率,从而提高内容项平台的整体收益。
507、当接收到排序后的内容项时,终端展示该排序后的内容项。
通过对含有用户实时行为的内容项日志进行数据分析,生成与用户点击率相关性很高的强信号特征(时序行为特征),从而在预测点击率时,在点击率预测模型中引入实时生成的时序行为特征,使得点击率预测模型能够更精确的拟合用户点击率的实际分布,提高点击率预测的准确性,从而对内容项订单进行更准确的排序,提高内容项平台的整体收益。
本发明实施例提供的方法,在实际预测时,可以通过能够体现用户历史行为的时序行为特征来获取用户对多个待预测的内容项的时序行为特征,最终基于获取到的时序行为特征以及基于实时行为构建的点击率预测模型来进行点击率预测,由于用户的实时行为会对点击率带来影响,因此,基于该点击率预测模型进行的预测,大大提高了点击率的预测准确率。
为了便于更直观的理解本发明实施例提供的点击率预测方法,下面将结合图6所示的基于实时流式的计算架构,以内容项为广告为例,对图4和5所示实施例提供的技术方案进行解释说明。
如图6所示,终端可以向服务器发送广告日志,当接收到该广告日志时,服务器可以通过Storm计算引擎按照<用户,广告>、<用户,广告主>和<用户,广告所属行业>3个维度统计得到点击频次、曝光频次以及曝光行为或点击行为距离上一次同类行为的时间间隔等时序数据,并根据统计得到的时序数据生成时序行为特征,如图6中的频次特征和时间间隔特征。除了Storm计算引擎以外,服务器也可以通过Spark Streaming等支持实时计算的引擎生成时序行为特征,本发明实施例对此不做限定。
服务器生成时序行为特征后,可以将时序行为特征中的频次特征存储至Redis(REmote DIctionary Server,远程服务器)中,如使用实时生成的频次特征更新Redis中已有的频次特征,特征的更新延迟在10秒以内。当然,服务器也可以将频次特征存储至Redis以外的其他数据存储中,例如,服务器将点击行为或曝光行为的时间戳存储至Redis中,这样服务器可以根据当前接收到的广告日志中记录的曝光行为或点击行为的时间戳以及Redis中存储的上一次同类行为的时间戳来生成时间间隔特征,同时,服务器可以使用当前接收到的广告日志中记录的曝光行为或点击行为的时间戳更新Redis中存储的上一次同类行为的时间戳。
服务器可以从Redis中获取频次特征,并结合时间间隔特征、用户年龄特征、用户性别特征等其他特征作为训练日志提供给在线学习系统,通过在线学习系统对点击率预测模型进行更新,点击率预测模型更新后,可以提供给点击率预测服务进行点击率的预测。本公开实施例不对上述其他特征进行具体限定。
当服务器接收到终端发送的广告展示请求时,可以通过广告投放引擎确定待预测用户以及多个广告,再通过点击率预测服务从Redis中获取时序行为特征,用于点击率预测模型获取该多个广告的点击率,进而通过广告投放引擎对该多个广告进行排序,并将排序后的广告发送给终端,从而实现广告的投放。
通过基于实时流式的计算架构,按照<用户,内容项>、<用户,归属用户>和<用户,内容项类型>3个维度实时统计得到时序数据,并基于时序数据生成时序行为特征,并以内存型键值(Key-Value)存储系统存储该时序行为特征,提供给线上预测系统使用。这种基于实时流式计算技术的系统设计方案,使得用户每次行为都能得到及时反馈,更精细的捕捉到用户实时行为的变化,从而提高点击率预测的准确率。
参见图7,提供了一种实际点击率和预测点击率的变化示意图,以内容项为广告为例,通过对广告的业务数据分析使用本发明提供的方案后的效果。图7中的2194算法表示不含时序行为特征的原模型,4054表示加入时序行为特征的新模型。
如图7所示,加入了基于时序数据生成的时序行为特征后,新模型的预测点击率与实际点击率分布的相似程度已经远远好于没有时序行为特征的模型。
从产品收益角度看,本发明实施例提供的点击率预测方法使得预测点击率与实际点击率拟合的更加准确,提高点击率预测的准确率,使得广告的排序更准确,可以提高广告的整体点击率以及广告平台的收益。
图8是本发明实施例提供的一种点击率预测装置的结构示意图。参照图8,该装置包括:
确定模块801,用于确定待预测用户;
获取模块802,用于根据该待预测用户的历史时序行为特征和待预测的多个内容项,获取该待预测用户的目标时序行为特征,该目标时序行为特征包括该多个内容项对应的时序行为特征;
该获取模块802,还用于根据该待预测用户的目标时序行为特征和点击率预测模型,获取该多个内容项的点击率,该点击率预测模型基于多个样本用户的时序行为特征以及各个时序行为特征对应的实际点击率训练得到;
其中,时序行为特征基于内容项的点击行为时序数据和曝光行为时序数据生成。
可选地,该获取模块802用于根据该待预测用户,获取该待预测用户的历史时序行为特征,该历史时序行为特征基于该待预测用户对已曝光过或已点击过的内容项的时序数据生成;根据该待预测用户的历史时序行为特征,获取该待预测用户的该多个内容项对应的时序行为特征。
可选地,该获取模块802用于对于该多个内容项中的每个内容项,根据该内容项的各个属性,从该待预测用户的历史时序行为特征中获取与该内容项的各个属性对应的时序行为特征,将获取到的时序行为特征作为该内容项的时序行为特征。
可选地,点击行为时序数据包括点击频次,曝光行为时序数据包括曝光频次,相应地,该待预测用户的每个内容项对应的时序行为特征包括:该待预测用户的该内容项的频次特征,该内容项的频次特征基于该内容项的点击频次和曝光频次生成;该待预测用户的该内容项的归属用户的频次特征,该内容项的归属用户的频次特征基于第一指定内容项的点击频次和曝光频次生成,该第一指定内容项包括与该内容项属于同一个归属用户的所有内容项;
该待预测用户的该内容项的内容项类型的频次特征,该内容项的内容项类型的频次特征基于第二指定内容项的点击频次和曝光频次生成,该第二指定内容项包括与该内容项属于同一个内容项类型的所有内容项。
可选地,点击行为时序数据还包括点击行为距离上一次点击行为的时间间隔,曝光行为时序数据还包括曝光行为距离上一次曝光行为的时间间隔,相应地,该待预测用户的每个内容项对应的时序行为特征还包括:该待预测用户的该内容项的时间间隔特征,该内容项的时间间隔特征基于该内容项的点击行为或曝光行为距离上一次同类行为的时间间隔生成;该待预测用户的该内容项的归属用户的时间间隔特征,该内容项的归属用户的时间间隔特征基于该内容项的点击行为或曝光行为距离上一次该第一指定内容项的同类行为的时间间隔生成;该待预测用户的该内容项的内容项类型的时间间隔特征,该内容项的内容项类型的时间间隔特征基于该内容项的点击行为或曝光行为距离上一次该第二指定内容项的同类行为的时间间隔生成。
可选地,参见图9,该装置还包括:
接收模块803,还用于接收该待预测用户对应的内容项日志,该内容项日志用于记录对内容项的实时行为,该实时行为包括曝光行为和点击行为;
生成模块804,用于根据该内容项日志,生成该待预测用户的内容项对应的时序行为特征;
存储模块805,用于存储该待预测用户的内容项对应的时序行为特征。
可选地,内容项对应的时序行为特征包括内容项对应的频次特征,
相应地,该生成模块804用于根据该内容项日志,统计内容项对应的曝光频次和点击频次;基于内容项对应的曝光频次和点击频次,生成内容项对应的频次特征。
可选地,内容项对应的时序行为特征还包括内容项对应的时间间隔特征,
相应地,该生成模块804还用于根据该内容项日志,统计内容项对应的点击行为或曝光行为距离上一次同类行为的时间间隔;基于内容项对应的点击行为或曝光行为距离上一次同类行为的时间间隔,生成内容项对应的时间间隔特征。
可选地,参见图10,该装置还包括:
排序模块806,用于根据预测到的该多个内容项的点击率,对该多个内容项进行排序;
展示模块807,用于展示排序后的内容项。
本发明实施例提供的装置,在实际预测时,可以通过能够体现用户历史行为的时序行为特征来获取用户对多个待预测的内容项的时序行为特征,最终基于获取到的时序行为特征以及基于实时行为构建的点击率预测模型来进行点击率预测,由于用户的实时行为会对点击率带来影响,因此,基于该点击率预测模型进行的预测,大大提高了点击率的预测准确率。
需要说明的是:上述实施例提供的点击率预测装置在点击率预测时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的点击率预测装置与点击率预测方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图11是本发明实施例提供的一种服务器1100的框图。参照图11,服务器1100包括处理组件1122,其进一步包括一个或多个处理器,以及由存储器1132所代表的存储器资源,用于存储可由处理组件1122的执行的指令,例如应用程序。存储器1132中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1122被配置为执行指令,以执行上述点击率预测方法。
服务器1100还可以包括一个电源组件1126被配置为执行服务器1100的电源管理,一个有线或无线网络接口1150被配置为将服务器1100连接到网络,和一个输入输出(I/O)接口1158。服务器1100可以操作基于存储在存储器1132的操作系统,例如WindowsServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括至少一条指令、至少一段程序、代码集或指令集的存储器,上述至少一条指令、至少一段程序、代码集或指令集可由处理器加载并执行以完成上述图4或图5所示实施例中的点击率预测方法。例如,计算机可读存储介质可以是只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random-Access Memory,RAM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)、磁带、软盘和光数据存储设备等。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (15)
1.一种点击率预测方法,其特征在于,所述方法包括:
确定待预测用户;
根据所述待预测用户的历史时序行为特征和待预测的多个内容项,获取所述待预测用户的目标时序行为特征,所述目标时序行为特征包括所述多个内容项对应的时序行为特征;
根据所述待预测用户的目标时序行为特征和点击率预测模型,获取所述多个内容项的点击率,所述点击率预测模型基于多个样本用户的时序行为特征以及各个时序行为特征对应的实际点击率训练得到;
其中,时序行为特征基于内容项的点击行为时序数据和曝光行为时序数据生成。
2.根据权利要求1所述的方法,其特征在于,所述根据所述待预测用户的历史时序行为特征和待预测的多个内容项,获取所述待预测用户的目标时序行为特征,包括:
根据所述待预测用户的用户标识,获取所述待预测用户的历史时序行为特征,所述历史时序行为特征基于所述待预测用户对已曝光过或已点击过的内容项的时序数据生成;
根据所述待预测用户的历史时序行为特征,获取所述待预测用户的所述多个内容项对应的时序行为特征。
3.根据权利要求2所述的方法,其特征在于,所述根据所述待预测用户的历史时序行为特征,获取所述待预测用户的所述多个内容项对应的时序行为特征,包括:
对于所述多个内容项中的每个内容项,根据所述内容项的各个属性,从所述待预测用户的历史时序行为特征中获取与所述内容项的各个属性对应的时序行为特征,将获取到的时序行为特征作为所述内容项对应的时序行为特征。
4.根据权利要求1所述的方法,其特征在于,点击行为时序数据包括点击频次,曝光行为时序数据包括曝光频次;
相应地,所述待预测用户的每个内容项对应的时序行为特征包括:
所述待预测用户的所述内容项的频次特征,所述内容项的频次特征基于所述内容项的点击频次和曝光频次生成;
所述待预测用户的所述内容项的归属用户的频次特征,所述内容项的归属用户的频次特征基于第一指定内容项的点击频次和曝光频次生成,所述第一指定内容项包括与所述内容项属于同一个归属用户的所有内容项;
所述待预测用户的所述内容项的内容项类型的频次特征,所述内容项的内容项类型的频次特征基于第二指定内容项的点击频次和曝光频次生成,所述第二指定内容项包括与所述内容项属于同一个内容项类型的所有内容项。
5.根据权利要求4所述的方法,其特征在于,点击行为时序数据还包括点击行为距离上一次点击行为的时间间隔,曝光行为时序数据还包括曝光行为距离上一次曝光行为的时间间隔;
相应地,所述待预测用户的每个内容项对应的时序行为特征还包括:
所述待预测用户的所述内容项的时间间隔特征,所述内容项的时间间隔特征基于所述内容项的点击行为或曝光行为距离上一次同类行为的时间间隔生成;
所述待预测用户的所述内容项的归属用户的时间间隔特征,所述内容项的归属用户的时间间隔特征基于所述内容项的点击行为或曝光行为距离上一次所述第一指定内容项的同类行为的时间间隔生成;
所述待预测用户的所述内容项的内容项类型的时间间隔特征,所述内容项的内容项类型的时间间隔特征基于所述内容项的点击行为或曝光行为距离上一次所述第二指定内容项的同类行为的时间间隔生成。
6.根据权利要求1所述的方法,其特征在于,所述确定待预测用户之前,所述方法还包括:
接收所述待预测用户的内容项日志,所述内容项日志用于记录所述待预测用户对内容项的实时行为,所述实时行为包括曝光行为和点击行为;
根据所述内容项日志,生成所述待预测用户的内容项对应的时序行为特征;
存储所述待预测用户的内容项对应的时序行为特征。
7.根据权利要求6所述的方法,其特征在于,内容项对应的时序行为特征包括内容项对应的频次特征;
相应地,所述根据所述内容项日志,生成所述待预测用户的内容项对应的时序行为特征包括:
根据所述内容项日志,统计内容项对应的曝光频次和点击频次;
基于内容项对应的曝光频次和点击频次,生成内容项对应的频次特征。
8.根据权利要求7所述的方法,其特征在于,内容项对应的时序行为特征还包括内容项对应的时间间隔特征;
相应地,所述根据所述内容项日志,生成所述待预测用户的内容项对应的时序行为特征还包括:
根据所述内容项日志,统计内容项对应的点击行为或曝光行为距离上一次同类行为的时间间隔;
基于内容项对应的点击行为或曝光行为距离上一次同类行为的时间间隔,生成内容项对应的时间间隔特征。
9.根据权利要求1所述的方法,其特征在于,所述获取所述多个内容项的点击率之后,所述方法还包括:
根据获取到的所述多个内容项的点击率,对所述多个内容项进行排序;
展示排序后的内容项。
10.一种点击率预测装置,其特征在于,所述装置包括:
确定模块,用于确定待预测用户;
获取模块,用于根据所述待预测用户的历史时序行为特征和待预测的多个内容项,获取所述待预测用户的目标时序行为特征,所述目标时序行为特征包括所述多个内容项对应的时序行为特征;
所述获取模块,还用于根据所述待预测用户的目标时序行为特征和点击率预测模型,获取所述多个内容项的点击率,所述点击率预测模型基于多个样本用户的时序行为特征以及各个时序行为特征对应的实际点击率训练得到;
其中,时序行为特征基于内容项的点击行为时序数据和曝光行为时序数据生成。
11.根据权利要求10所述的装置,其特征在于,点击行为时序数据包括点击频次,曝光行为时序数据包括曝光频次;
相应地,所述待预测用户的每个内容项对应的时序行为特征包括:
所述待预测用户的所述内容项的频次特征,所述内容项的频次特征基于所述内容项的点击频次和曝光频次生成;
所述待预测用户的所述内容项的归属用户的频次特征,所述内容项的归属用户的频次特征基于第一指定内容项的点击频次和曝光频次生成,所述第一指定内容项包括与所述内容项属于同一个归属用户的所有内容项;
所述待预测用户的所述内容项的内容项类型的频次特征,所述内容项的内容项类型的频次特征基于第二指定内容项的点击频次和曝光频次生成,所述第二指定内容项包括与所述内容项属于同一个内容项类型的所有内容项。
12.根据权利要求11所述的装置,其特征在于,点击行为时序数据还包括点击行为距离上一次点击行为的时间间隔,曝光行为时序数据还包括曝光行为距离上一次曝光行为的时间间隔;
相应地,所述待预测用户的每个内容项对应的时序行为特征还包括:
所述待预测用户的所述内容项的时间间隔特征,所述内容项的时间间隔特征基于所述内容项的点击行为或曝光行为距离上一次同类行为的时间间隔生成;
所述待预测用户的所述内容项的归属用户的时间间隔特征,所述内容项的归属用户的时间间隔特征基于所述内容项的点击行为或曝光行为距离上一次所述第一指定内容项的同类行为的时间间隔生成;
所述待预测用户的所述内容项的内容项类型的时间间隔特征,所述内容项的内容项类型的时间间隔特征基于所述内容项的点击行为或曝光行为距离上一次所述第二指定内容项的同类行为的时间间隔生成。
13.根据权利要求10所述的装置,其特征在于,所述装置还包括:
接收模块,用于接收所述待预测用户的内容项日志,所述内容项日志用于记录所述待预测用户对内容项的实时行为,所述实时行为包括曝光行为和点击行为;
生成模块,用于根据所述内容项日志,生成所述待预测用户的内容项对应的时序行为特征;
存储模块,用于存储所述待预测用户的内容项对应的时序行为特征。
14.一种服务器,其特征在于,所述服务器包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、至少一段程序、代码集或指令集由所述处理器加载并执行以实现如权利要求1至9任一项所述的点击率预测方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如权利要求1至9任一项所述的点击率预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711194193.9A CN109840782B (zh) | 2017-11-24 | 2017-11-24 | 点击率预测方法、装置、服务器以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711194193.9A CN109840782B (zh) | 2017-11-24 | 2017-11-24 | 点击率预测方法、装置、服务器以及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109840782A true CN109840782A (zh) | 2019-06-04 |
CN109840782B CN109840782B (zh) | 2023-03-24 |
Family
ID=66877463
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711194193.9A Active CN109840782B (zh) | 2017-11-24 | 2017-11-24 | 点击率预测方法、装置、服务器以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109840782B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110532465A (zh) * | 2019-08-16 | 2019-12-03 | 北京齐尔布莱特科技有限公司 | 一种网站内容的推荐方法及推荐系统 |
CN110602531A (zh) * | 2019-08-28 | 2019-12-20 | 四川长虹电器股份有限公司 | 一种给智能电视推荐广告的系统 |
CN110674406A (zh) * | 2019-09-29 | 2020-01-10 | 百度在线网络技术(北京)有限公司 | 推荐方法、装置、电子设备及存储介质 |
CN111046240A (zh) * | 2019-11-26 | 2020-04-21 | 金蝶软件(中国)有限公司 | 网关流量统计方法、装置、计算机设备和存储介质 |
CN111340561A (zh) * | 2020-03-04 | 2020-06-26 | 深圳前海微众银行股份有限公司 | 信息点击率的计算方法、装置、设备及可读存储介质 |
CN111932309A (zh) * | 2020-08-13 | 2020-11-13 | 北京达佳互联信息技术有限公司 | 资源参考信息确定方法、装置、服务器和存储介质 |
CN112000570A (zh) * | 2020-07-29 | 2020-11-27 | 北京达佳互联信息技术有限公司 | 应用测试方法、装置、服务器及存储介质 |
CN112633916A (zh) * | 2020-12-09 | 2021-04-09 | 深圳前海微众银行股份有限公司 | 一种需求预测方法及装置、设备、存储介质 |
WO2021114919A1 (zh) * | 2019-12-12 | 2021-06-17 | 华为技术有限公司 | 内容获取方法、系统、用户终端及内容服务器 |
CN113254759A (zh) * | 2020-02-12 | 2021-08-13 | 北京沃东天骏信息技术有限公司 | 点击率预测方法、装置、介质及电子设备 |
CN113269577A (zh) * | 2020-02-17 | 2021-08-17 | 北京达佳互联信息技术有限公司 | 数据获取方法、装置、服务器及存储介质 |
CN114217745A (zh) * | 2021-12-15 | 2022-03-22 | 有半岛(北京)信息科技有限公司 | 数据存储方法、装置、设备、存储介质及程序产品 |
WO2023197910A1 (zh) * | 2022-04-12 | 2023-10-19 | 华为技术有限公司 | 一种用户行为预测方法及其相关设备 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102541892A (zh) * | 2010-12-22 | 2012-07-04 | 北京凯思昊鹏软件工程技术有限公司 | 记录和分析用户行为特征的方法 |
CN103310003A (zh) * | 2013-06-28 | 2013-09-18 | 华东师范大学 | 一种基于点击日志的新广告点击率预测方法及系统 |
CN103489117A (zh) * | 2012-06-12 | 2014-01-01 | 深圳市腾讯计算机系统有限公司 | 信息投放方法和系统 |
CN103761266A (zh) * | 2014-01-02 | 2014-04-30 | 北京集奥聚合网络技术有限公司 | 基于多级逻辑回归的点击率预测方法和系统 |
CN105447724A (zh) * | 2015-12-15 | 2016-03-30 | 腾讯科技(深圳)有限公司 | 内容项推荐方法及装置 |
CN105631711A (zh) * | 2015-12-30 | 2016-06-01 | 合一网络技术(北京)有限公司 | 一种广告投放方法及装置 |
CN105631707A (zh) * | 2015-12-23 | 2016-06-01 | 北京奇虎科技有限公司 | 基于决策树的广告点击率预估方法与应用推荐方法及装置 |
CN105654200A (zh) * | 2015-12-30 | 2016-06-08 | 上海珍岛信息技术有限公司 | 一种基于深度学习的广告点击率预测方法及装置 |
US20160188734A1 (en) * | 2014-12-30 | 2016-06-30 | Socialtopias, Llc | Method and apparatus for programmatically synthesizing multiple sources of data for providing a recommendation |
CN106548364A (zh) * | 2016-09-27 | 2017-03-29 | 腾讯科技(北京)有限公司 | 信息发送方法及装置 |
CN106709739A (zh) * | 2015-07-13 | 2017-05-24 | 银橙(上海)信息技术有限公司 | 一种定向广告投放方法及系统 |
CN106803190A (zh) * | 2017-01-03 | 2017-06-06 | 北京掌阔移动传媒科技有限公司 | 一种广告个性化推送系统及方法 |
-
2017
- 2017-11-24 CN CN201711194193.9A patent/CN109840782B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102541892A (zh) * | 2010-12-22 | 2012-07-04 | 北京凯思昊鹏软件工程技术有限公司 | 记录和分析用户行为特征的方法 |
CN103489117A (zh) * | 2012-06-12 | 2014-01-01 | 深圳市腾讯计算机系统有限公司 | 信息投放方法和系统 |
CN103310003A (zh) * | 2013-06-28 | 2013-09-18 | 华东师范大学 | 一种基于点击日志的新广告点击率预测方法及系统 |
CN103761266A (zh) * | 2014-01-02 | 2014-04-30 | 北京集奥聚合网络技术有限公司 | 基于多级逻辑回归的点击率预测方法和系统 |
US20160188734A1 (en) * | 2014-12-30 | 2016-06-30 | Socialtopias, Llc | Method and apparatus for programmatically synthesizing multiple sources of data for providing a recommendation |
CN106709739A (zh) * | 2015-07-13 | 2017-05-24 | 银橙(上海)信息技术有限公司 | 一种定向广告投放方法及系统 |
CN105447724A (zh) * | 2015-12-15 | 2016-03-30 | 腾讯科技(深圳)有限公司 | 内容项推荐方法及装置 |
CN105631707A (zh) * | 2015-12-23 | 2016-06-01 | 北京奇虎科技有限公司 | 基于决策树的广告点击率预估方法与应用推荐方法及装置 |
CN105631711A (zh) * | 2015-12-30 | 2016-06-01 | 合一网络技术(北京)有限公司 | 一种广告投放方法及装置 |
CN105654200A (zh) * | 2015-12-30 | 2016-06-08 | 上海珍岛信息技术有限公司 | 一种基于深度学习的广告点击率预测方法及装置 |
CN106548364A (zh) * | 2016-09-27 | 2017-03-29 | 腾讯科技(北京)有限公司 | 信息发送方法及装置 |
CN106803190A (zh) * | 2017-01-03 | 2017-06-06 | 北京掌阔移动传媒科技有限公司 | 一种广告个性化推送系统及方法 |
Non-Patent Citations (1)
Title |
---|
鸿杰等: "美团DSP广告策略实践,URL:https://tech.meituan.com/2017/05/05/mt-dsp.html", 《美团技术团队》 * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110532465A (zh) * | 2019-08-16 | 2019-12-03 | 北京齐尔布莱特科技有限公司 | 一种网站内容的推荐方法及推荐系统 |
CN110602531B (zh) * | 2019-08-28 | 2021-06-22 | 四川长虹电器股份有限公司 | 一种给智能电视推荐广告的系统 |
CN110602531A (zh) * | 2019-08-28 | 2019-12-20 | 四川长虹电器股份有限公司 | 一种给智能电视推荐广告的系统 |
CN110674406A (zh) * | 2019-09-29 | 2020-01-10 | 百度在线网络技术(北京)有限公司 | 推荐方法、装置、电子设备及存储介质 |
CN111046240A (zh) * | 2019-11-26 | 2020-04-21 | 金蝶软件(中国)有限公司 | 网关流量统计方法、装置、计算机设备和存储介质 |
CN111046240B (zh) * | 2019-11-26 | 2024-03-08 | 金蝶软件(中国)有限公司 | 网关流量统计方法、装置、计算机设备和存储介质 |
CN112995246B (zh) * | 2019-12-12 | 2022-09-23 | 花瓣云科技有限公司 | 内容获取方法、系统、用户终端及内容服务器 |
WO2021114919A1 (zh) * | 2019-12-12 | 2021-06-17 | 华为技术有限公司 | 内容获取方法、系统、用户终端及内容服务器 |
CN112995246A (zh) * | 2019-12-12 | 2021-06-18 | 华为技术有限公司 | 内容获取方法、系统、用户终端及内容服务器 |
CN113254759A (zh) * | 2020-02-12 | 2021-08-13 | 北京沃东天骏信息技术有限公司 | 点击率预测方法、装置、介质及电子设备 |
CN113269577A (zh) * | 2020-02-17 | 2021-08-17 | 北京达佳互联信息技术有限公司 | 数据获取方法、装置、服务器及存储介质 |
CN113269577B (zh) * | 2020-02-17 | 2023-10-13 | 北京达佳互联信息技术有限公司 | 数据获取方法、装置、服务器及存储介质 |
CN111340561A (zh) * | 2020-03-04 | 2020-06-26 | 深圳前海微众银行股份有限公司 | 信息点击率的计算方法、装置、设备及可读存储介质 |
CN112000570A (zh) * | 2020-07-29 | 2020-11-27 | 北京达佳互联信息技术有限公司 | 应用测试方法、装置、服务器及存储介质 |
CN111932309A (zh) * | 2020-08-13 | 2020-11-13 | 北京达佳互联信息技术有限公司 | 资源参考信息确定方法、装置、服务器和存储介质 |
CN112633916A (zh) * | 2020-12-09 | 2021-04-09 | 深圳前海微众银行股份有限公司 | 一种需求预测方法及装置、设备、存储介质 |
CN112633916B (zh) * | 2020-12-09 | 2024-05-31 | 深圳前海微众银行股份有限公司 | 一种需求预测方法及装置、设备、存储介质 |
CN114217745A (zh) * | 2021-12-15 | 2022-03-22 | 有半岛(北京)信息科技有限公司 | 数据存储方法、装置、设备、存储介质及程序产品 |
WO2023197910A1 (zh) * | 2022-04-12 | 2023-10-19 | 华为技术有限公司 | 一种用户行为预测方法及其相关设备 |
Also Published As
Publication number | Publication date |
---|---|
CN109840782B (zh) | 2023-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109840782A (zh) | 点击率预测方法、装置、服务器以及存储介质 | |
US10715962B2 (en) | Systems and methods for predicting lookalike mobile devices | |
US20180349949A1 (en) | System, method and computer program product for fractional attribution using online advertising information | |
WO2020248508A1 (zh) | 广告渠道的评估方法、装置、设备和存储介质 | |
JP5072160B2 (ja) | ワールドワイドウェブのディジタルコンテントの普及を見積もるシステム及び方法 | |
US10037543B2 (en) | Estimating conversion rate in display advertising from past performance data | |
JP5810452B2 (ja) | インパクト分析や影響追跡を含むマルチメディアのためのデータ収集、追跡及び分析手法 | |
US7594189B1 (en) | Systems and methods for statistically selecting content items to be used in a dynamically-generated display | |
US20160210657A1 (en) | Real-time marketing campaign stimuli selection based on user response predictions | |
CN111915366B (zh) | 一种用户画像构建方法、装置、计算机设备及存储介质 | |
CN111177544B (zh) | 一种基于用户行为数据和用户画像数据的运营系统及方法 | |
US20140006963A1 (en) | Dynamically generating aggregate tables | |
US20030149586A1 (en) | Method and system for root cause analysis of structured and unstructured data | |
US20060293950A1 (en) | Automatic ad placement | |
CN106997549A (zh) | 一种广告信息的推送方法及系统 | |
US20100312884A1 (en) | System and method for aggregating analytics data | |
US20160210656A1 (en) | System for marketing touchpoint attribution bias correction | |
KR20110116150A (ko) | 컨버전 크레디팅 | |
US9858526B2 (en) | Method and system using association rules to form custom lists of cookies | |
CN110472154A (zh) | 一种资源推送方法、装置、电子设备及可读存储介质 | |
CN109977296A (zh) | 一种信息推送方法、装置、设备及存储介质 | |
JP4948573B2 (ja) | 広告課金装置及び方法 | |
US10672035B1 (en) | Systems and methods for optimizing advertising spending using a user influenced advertisement policy | |
WO2019075120A1 (en) | SYSTEMS AND METHODS FOR USING GEOBLOCS AND GEOBARRIERS TO DISCOVER SIMILAR MOBILE DEVICES | |
CN101140582A (zh) | 用户偏好生成系统和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |