CN110502715B - 点击概率的预测方法及装置 - Google Patents

点击概率的预测方法及装置 Download PDF

Info

Publication number
CN110502715B
CN110502715B CN201910802930.1A CN201910802930A CN110502715B CN 110502715 B CN110502715 B CN 110502715B CN 201910802930 A CN201910802930 A CN 201910802930A CN 110502715 B CN110502715 B CN 110502715B
Authority
CN
China
Prior art keywords
content
user
feature
feature vector
click probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910802930.1A
Other languages
English (en)
Other versions
CN110502715A (zh
Inventor
马文晔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910802930.1A priority Critical patent/CN110502715B/zh
Publication of CN110502715A publication Critical patent/CN110502715A/zh
Application granted granted Critical
Publication of CN110502715B publication Critical patent/CN110502715B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Theoretical Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请是关于一种点击概率的预测方法及装置,属于人工智能领域。所述方法包括:获取第一特征向量,所述第一特征向量包括向第一用户待显示的第一内容的至少一个内容属性特征和所述第一用户的至少一个用户属性特征;将所述第一特征向量输入到点击概率预测模型,所述点击概率预测模型用于通过对所述第一特征向量进行卷积运算得到至少一个第一特征组合,第一特征组合包括对象属性特征和用户属性特征,基于所述至少一个第一特征组合预测所述第一用户点击所述第一内容的点击概率;获取所述点击概率预测模型输出的所述点击概率。本申请能够减小运算复杂度。

Description

点击概率的预测方法及装置
技术领域
本申请涉及人工智能领域,特别涉及一种点击概率的预测方法及装置。
背景技术
在用户终端上显示一个内容,用户可能会点击该内容,以查看该内容的详细信息。点击概率是在显示该内容后,被用户点击的可能性。通过该点击概率可以评估显示的内容对应的价值。
目前在向用户显示内容之前,可以预测用户点击该内容的点击概率,基于该点击概率确定是否显示该内容。目前可以采集待显示的内容的至少一个特征以及用户的至少一个特征,将采集的内容的特征与该用户的特征进行两两组合,得到多个特征组合。根据该多个特征组合预测待显示的内容被用户点击的概率。
目前的方法需要将内容的特征以及用户的特征进行两两组合,导致特征组合呈指数增加,使得运算复杂度也呈指数增加。
发明内容
本申请实施例提供了一种点击概率的预测方法及装置,以减小计算点击概率的运算复杂度。所述技术方案如下:
一方面,本申请实施例提供了一种点击概率的预测方法,所述方法包括:
获取第一特征向量,所述第一特征向量包括向第一用户待显示的第一内容的至少一个内容属性特征和所述第一用户的至少一个用户属性特征;
将所述第一特征向量输入到点击概率预测模型,所述点击概率预测模型用于通过对所述第一特征向量进行卷积运算得到至少一个第一特征组合,所述第一特征组合包括内容属性特征和用户属性特征,基于所述至少一个第一特征组合预测所述第一用户点击所述第一内容的点击概率;
获取所述点击概率预测模型输出的所述点击概率。
可选的,上述卷积运算可以为快速傅立叶变换,快速傅立叶变换的运算复杂度较低,从而可以减小获取点击概率的运算复杂。
另一方面,本申请实施例提供了一种点击概率的预测装置,所述装置包括:
获取模块,用于获取第一特征向量,所述第一特征向量包括向第一用户待显示的第一内容的至少一个内容属性特征和所述第一用户的至少一个用户属性特征;
输入模块,用于将所述第一特征向量输入到点击概率预测模型,所述点击概率预测模型用于通过对所述第一特征向量进行卷积运算得到至少一个第一特征组合,所述第一特征组合包括内容属性特征和用户属性特征,基于所述至少一个第一特征组合预测所述第一用户点击所述第一内容的点击概率;
所述获取模块,用于获取所述点击概率预测模型输出的所述点击概率。
另一方面,本申请实施例提供了一种电子设备,包括至少一个处理器和至少一个存储器,所述至少一个存储器用于存储至少一个指令,所述至少一个指令被所述至少一个处理器加载并运行,以实现上述方法。
另一方面,本申请实施例提供了一种计算机可读存储介质,用于存储至少一个指令,所述至少一个指令被处理器加载并运行,以实现上述方法。
本申请实施例提供的技术方案可以包括以下有益效果:
通过获取第一特征向量,第一特征向量包括向第一用户待显示的第一内容的至少一个内容属性特征和第一用户的至少一个用户属性特征,向点击概率预测模型输入第一特征向量。由于点击概率预测模型对第一特征向量进行卷积运算,可以降低运算复杂度,进而减小了计算点击概率的运算复杂度。点击概率预测模型可以采用快速傅立叶卷积运算方式,进一步减小了计算点击概率的运算复杂度。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1是本申请实施例提供的一种训练系统的示意图;
图2是本申请实施例提供的一种训练点击概率预测模型的方法流程图;
图3是本申请实施例提供的点击概率的预测方法流程图;
图4是本申请实施例提供的点击概率的预测装置结构示意图;
图5是本申请实施例提供的一种服务器的结构示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
本申请实施例提供了一种点击概率预测模型,该点击概率预测模型是通过对深度学习网络进行训练得到的,该深度学习网络可以包括一层网络。训练出的点击概率预测模型如下第一公式所示。
第一公式为:
Figure BDA0002182842280000031
或者,/>
Figure BDA0002182842280000032
其中,P为点击概率,x为第一特征向量,w为点击概率预测模型的第一网络参数,v为点击概率预测模型的第二网络参数,*为卷积运算,e为预设的数值。第一特征向量包括向第一用户待显示的第一内容的至少一个内容属性特征和第一用户的至少一个用户属性特征。
上述卷积运算可以为快速傅立叶变换,快速傅立叶变换的运算复杂度较低,从而可以减小获取点击概率的运算复杂。
训练深度学习网络的过程是就是不断地调整深度学习网络第一网络参数w和第二网络参数v的值,通过不断地调整深度学习网络第一网络参数w和第二网络参数v的值,提高第一公式所示的点击概率预测模型预测点击概率的精度。
为了能够训练深度学习网络,得到点击概率预测模型。参见图1,本申请实施例提供了一种训练系统,该训练系统包括:
参数服务器1和多个计算节点2,每个计算节点2与参数服务器1之间建立有网络连接。参数服务器1中保存有训练样本,每个计算节点2用于使用该训练样本训练点击概率预测模型。
在实现时,参数服务器1用于保存第一网络参数w和第二网络参数v,获取多个训练样本,将该多个计算节点2中的每个计算节点2发送训练样本,向每个计算节点2发送的训练样本不同。
该训练样本包括第二特征向量和第二用户与第二内容之间的点击值,第二内容为已向第二用户显示的内容,该点击值用于表示第二用户是否点击第二内容,第二特征向量包括第二内容的至少一个内容属性特征和第二用户的至少一个用户属性特征。
可选的,该点击值可以为数值0或1,数值0可以用于表示第二用户点击第二内容,数值1可以用于表示第二用户没有点击第二内容。或者,数值1可以用于表示第二用户点击第二内容,数值0可以用于表示第二用户没有点击第二内容。
对于该多个计算节点2中的每个计算节点2,该计算节点2,用于接收参数服务器1发送的训练样本,从参数服务器1获取第一网络参数w和第二网络参数v。根据该训练样本中的第二特征向量、获取的第一网络参数w和第二网络参数v,通过上述第一公式所示的点击概率预测模型获取第二用户点击第二内容的点击概率。根据训练样本中的点击值和该点击概率调整第一网络参数w和第二网络参数v,将参数服务器1中保存的第一网络参数w和第二网络参数v分别更新为调整后的第一网络参数w和第二网络参数v。
可选的,计算节点2可以为服务器,也可以为终端。计算节点2可以为计算机等终端。
在本申请实施例中,由于内容服务器获取的采集数据的数据量较大,这样参数服务器获取的训练样本的数据量较大,所以上述训练系统将大量的训练样本分散到不同的计算节点,由不同的计算节点训练点击概率预测模型的第一网络参数和第二网络参数,可以提高训练的效率。
参见图2,本申请实施例提供了一种训练点击概率预测模型的方法,该方法可以应用于图1所示的训练系统,包括:
在步骤101:参数服务器获取训练样本,该训练样本包括第二特征向量和第二用户与第二内容之间的点击值,第二内容是已显示给第二用户的内容,第二特征量包括第二内容的至少一个内容属性特征和第二用户的至少一个用户属性特征。
内容服务器可以向第二用户对应的终端发送内容,第二用户对应的终端接收并显示该内容。该内容可以为广告或物品等,为了便于说明在本申请中将已在第二用户对应的终端上显示的内容称为第二内容。
第二用户对应的终端在显示第二内容后,第二用户可能点击第二内容进行详细查看,也可能不点击第二内容,而是关闭显示的第二内容。第二用户对应的终端可以向内容服务器发送通知消息,该通知消息包括第二用户的用户标识、第二内容的内容标识和用于标示第二用户是否点击第二内容的指示信息。
内容服务器可以接收该通知消息,获取第二内容的至少一个内容属性特征和第二用户的至少一个用户属性特征,向参数服务器发送采集数据,该采集数据包括第二内容的至少一个内容属性特征、第二用户的至少一个用户属性特征和该通知消息中的指示信息。
第二内容的至少一个内容属性特征可以包括内容类别等,例如,假设第二内容为新闻,则第二内容的内容类别可以为体育新闻、财经新闻、时政新闻等。第二用户的用户属性特征可以包括第二用户的性别和年龄等。
可选的,由于第二内容保存在内容服务器中,所以内容服务器中也保存有第二内容的内容属性特征。所以内容服务器可以根据该通知消息中的第二内容的内容标识直接获取第二内容的内容属性特征。
可选的,在内容服务器向第二用户对应的终端发送第二内容之前,第二用户需要在内容服务器中注册自己的用户属性特征,该用户属性特征包括第二用户的性别和年龄等信息。内容服务器将第二用户的用户标识和用户属性特征之间的对应关系。
所以在内容服务器接收到通知消息后,内容服务器可以根据该通知消息中的第二用户的用户标识,从用户标识与用户属性特征的对应关系中获取第二用户的用户属性特征。
在本步骤中,参数服务器接收该采集数据,根据该采集数据获取训练样本。在实现时,可以通过如下1011至1014的操作来实现。该1011至1014的操作分别为:
1011:获取第二内容的内容特征向量,该内容特征向量包括第二内容的至少一个内容属性特征。
对于第二内容中的每个内容属性特征,该内容属性特征可能包括多个种类。例如,假设该内容属性特征为内容类别,则该内容属性特征可以包括体育新闻、财经新闻和时政新闻等多个种类。可以使用数值化的第一向量来表示该内容属性特征。第一向量包括的元素数目等于该内容属性特征包括的种类数目。第一向量包括该内容属性特征中的每个种类对应的元素。在第一向量中该内容属性特征所属的种类对应的元素为第一数值,第一向量的其他元素为第二数值。第一数值可以为数值1,第二数值可以为数值0。或者,第一数值可以为数值0,第二数值可以为数值0。
例如,假设该内容属性特征是内容类别,以及假设内容类别包括体育新闻、财经新闻和时政新闻三种,则表示该内容类别的第一向量包括的元素有三个,第一向量可以包括体育新闻对应的元素、财经新闻对应的元素和时政新闻对应的元素。假设该内容属性特征属于的类别为财经新闻,则第一向量可以表示为[0,1,0],第一向量的第一个元素0是体育新闻对应的元素,第二个元素1是财经新闻对应的元素,第三个元素0是时政新闻对应的元素。或者,第一向量可以表示为[1,0,1],第一向量的第一个元素1是体育新闻对应的元素,第二个元素0是财经新闻对应的元素,第三个元素1是时政新闻对应的元素。
按上述方式可以得到第二内容的每个内容属性特征对应的第一向量,将每个内容属性特征对应的第一向量拼接成内容特征向量。该内容特征向量包括每个内容属性特征对应的第一向量中的元素。
假设,第二内容有两个内容属性特征,其中一个内容属性特征对应的第一向量为[0,1,0],另一个内容属性特征对应的第一向量为[0,0,0,1,0]。将该两个内容属性特征对应的第一向量拼接成内容特征向量,该内容特征向量为[0,1,0,0,0,0,1,0]。
1022:获取第一用户的用户特征向量,该用户特征向量包括用户的至少一个用户属性特征。
对于第二用户的每个用户属性特征,该用户属性特征可能包括多种特征。例如,假设该用户属性特征为性别,则该内容属性特征可以包括男性和女性两种。再例如,假设将年龄分成十个年龄段,前九个年段的年龄跨度为十岁,即前九个年龄段是每十岁为一个年龄段,即0至10岁为一个年龄段,10至20岁为一个年龄段,20至30岁为一个年龄段,……,80至90岁为一个年龄段,大于90岁为第十个年龄段。
可以使用数值化的第二向量来表示该用户属性特征。第二向量包括的元素数目等于该用户属性特征包括的种类数目。第二向量包括该用户属性特征中的每个种类对应的元素。在第二向量中该用户属性特征所属的种类对应的元素为第一数值,第二向量的其他元素为第二数值。第一数值可以为数值1,第二数值可以为数值0。或者,第一数值可以为数值0,第二数值可以为数值0。
例如,假设第二用户的用户属性特征包括性别,则表示该性别的第一向量包括的元素有两个,第一向量可以包括男性的元素、女性对应的元素。假设,第二用户的性别为男性,则性别对应的第一向量可以为[1,0]。假设,第二用户的用户属性特征包括年龄,且该年龄为15岁,则确定第二用户所在的年龄段为第二个年龄段,第二个年龄段为10至20,则年龄对应的第一向量可以为[0,1,0,0,0,0,0,0,0,0]。
按上述方式可以得到第二用户的每个用户属性特征对应的第二向量,将每个用户属性特征对应的第二向量拼接成用户特征向量。该用户特征向量包括每个用户属性特征对应的第二向量中的元素。
假设,第二用户的用户属性特征包括性别“男性”和年龄“15”岁,将性别对应的第二向量为[1,0]和年龄对应的第二向量为[0,1,0,0,0,0,0,0,0,0]。将该两个第二向量拼接成用户特征向量,该用户特征向量为[1,0,0,1,0,0,0,0,0,0,0,0]。
1013:将第二用户的用户特征向量和第二内容的内容特征向量拼接成第二特征向量,第二特征向量包括第二用户的用户特征向量中的每个元素和第二内容的内容特征向量中的每个元素。
例如,可以将第二用户的用户特征向量[1,0,0,1,0,0,0,0,0,0,0,0]和第二内容的内容特征向量[0,1,0,0,0,0,1,0],拼接成第二特征向量,第二特征向量为[1,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,1,0]。
1014:根据该采集数据中包括的指示信息确定第二用户与第二内容之间的点击值,训练样本包括该第二特征向量和该点击值。
根据在该采集信息中的指示信息可以确定第二用户是否点击第二内容,根据确定的结果设置第二用户与第二内容之间的点击值。例如,可以设置点击值为1,表示第二用户点击第二内容,设置点击值为0,表示第二用户没有点击第二内容。或者,可以设置点击值为0,表示第二用户点击第二内容,设置点击值为1,表示第二用户没有点击第二内容。
步骤102:参数服务器从该多个计算节点中选择计算节点,向该计算节点发送该训练样本。
在本步骤中,该训练系统训练点击概率预测模型的方式可以包括在线训练方式或离线训练方式。
所谓在线训练方式是指参数服务器每接收到一个第二用户的终端发送的采集数据,基于该采集数据产生训练样本,从该多个计算节点中选择一个计算节点,向该计算节点发送该训练样本,以使该计算节点基于该训练样本训练点击概率预测模型。
所述离线训练方式是指参数服务器每接收到一个第二用户的终端发送的采集数据,基于该采集数据产生训练样本并保存该训练样本。参数服务器保存大量的训练样本达到数目阈值时,从保存的训练样本中选择至少一个训练,从该多个计算节点中选择一个计算节点,向该计算节点发送至少一个训练样本。重复上述过程,参数服务器向每个计算节点发送至少一个训练样本。
对于接收到训练样本的每个计算节点可以通过如下步骤进行训练,分别为:
步骤103:计算节点接收该训练样本,将该训练样本中的第二特征向量输入到智能模型,该智能模型用于通过对第二特征向量进行卷积运算得到至少一个第二特征组合,第二特征组合包括对象属性特征和用户属性特征,基于至少一个第二特征组合预测第二用户点击第二内容的点击概率。
智能模型可以是包括一层网络的深度学习网络。
在本步骤中,计算节点接收到训练样本后,从参数服务器中获取第一网络参数w和第二网络参数v,将该训练样本中的第二特征向量、第一网络参数w和第二网络参数v,通过如上第一公式所示的智能模型计算出第二用户点击第二内容的点击概率。
步骤104:计算节点根据第二特征向量和第二用户与第二内容之间的点击值和第二用户点击第二内容的点击概率,调整该智能模型的网络参数。
在本步骤中,在该点击概率超过概率阈值时,确定第二用户点击第二内容,在该点击概率未超过概率阈值时,确定第二用户未点击第二内容。将确定的结果与该点击值表示的内容进行比较,根据比较的结果调整第一网络参数w和第二网络参数v。
步骤105:计算节点将参数服务器中保存的第一网络参数w和第二网络参数v分别为更新为调整后的第一网络参数w和第二网络参数v。
在采用在线训练方式,计算节点接收到的训练样本数目为1个,所以基于该训练样本得到调整后的第一网络参数w和第二网络参数v后,向参数服务器发送更新请求,该更新请求包括调整后的第一网络参数w和第二网络参数v。参数服务器接收该更新请求,将保存的第一网络参数w和第二网络参数v分别更新调整后的第一网络参数w和第二网络参数v。
在采用离线训练方式,计算节点接收到至少一个训练样本,所以基于该至少一个训练样本得到调整后的第一网络参数w和第二网络参数v,向参数服务器发送更新请求,该更新请求包括调整后的第一网络参数w和第二网络参数v。参数服务器接收该更新请求,将保存的第一网络参数w和第二网络参数v分别更新调整后的第一网络参数w和第二网络参数v。参数服务器可以再从保存的训练样本中选择至少一个训练样本,向该计算节点发送该至少一个训练样本,然后继续执行步骤103。
在连续得到x个第一网络参数w和第二网络参数v,以及在该x个第一网络参数w的变化值和该x个第二网络参数v的变化值均未超过预设变化值时停止训练,并将智能模型作为点击概率预测模型,x为大于1的预设数值。
参见图3,本申请实施例提供了一种点击概率的预测方法,该方法可以使用点击概率预测模型预测点击概率。该方法包括:
步骤202:获取第一特征向量,第一特征向量包括向第一用户待显示的第一内容的至少一个内容属性特征和第一用户的至少一个用户属性特征。
在本步骤中,内容服务器在向第一用户待显示第一内容之前,向参数服务器发送第一内容的至少一个内容属性特片和第一用户的至少一个用户属性特征。然后参数服务器根据第一内容的至少一个内容属性特片和第一用户的至少一个用户属性特征,生成第一特征向量。
在本步骤中,生成第一特征向量的详细过程,可以参见图2所示实施例的步骤101生成第一特征向量的详细过程,在此不再详细说明。
步骤202:将第一特征向量输入到点击概率预测模型,该点击概率预测模型用于通过对第一特征向量进行卷积运算得到至少一个第一特征组合,第一特征组合包括内容属性特征和用户属性特征,基于至少一个第一特征组合预测第一用户点击第一内容的点击概率。
在本步骤中,将第一特征向量输入到上述第一公式所示的点击概率预测模型,通过第一公式所示的点击概率预测模型,获取第一用户点击所述第一内容的点击概率。
步骤203:获取该点击概率预测模型输出的该点击概率。
在本步骤中,参数服务器可以向内容服务器发送该点击概率,以让内容服务器基于该点击概率确定是否向第一用户显示第一内容。
在本申请实施例中,获取第一特征向量,第一特征向量包括向第一用户待显示的第一内容的至少一个内容属性特征和第一用户的至少一个用户属性特征,向点击概率预测模型输入第一特征向量。由于点击概率预测模型对第一特征向量进行卷积运算,便可以产生至少一个包括用户属性特征和内容属性特征的第一特征组合,而卷积运算的运算复杂度较低,从而可以降低组成特征组合的运算复杂度,进而减小了计算点击概率的运算复杂度。点击概率预测模型可以采用快速傅立叶卷积运算方式,进一步减小了计算点击概率的运算复杂度。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
参见图4,本申请实施例提供了一种点击概率的预测装置300,所述装置300包括:
获取模块301,用于获取第一特征向量,所述第一特征向量包括向第一用户待显示的第一内容的至少一个内容属性特征和所述第一用户的至少一个用户属性特征;
输入模块302,用于将所述第一特征向量输入到点击概率预测模型,所述点击概率预测模型用于通过对所述第一特征向量进行卷积运算得到至少一个第一特征组合,第一特征组合包括内容属性特征和用户属性特征,基于至少一个第一特征组合预测所述第一用户点击所述第一内容的点击概率;
所述获取模块303,用于获取所述点击概率预测模型输出的所述点击概率。
可选的,所述获取模块301,用于:
获取第一内容的内容特征向量,所述内容特征向量包括所述第一内容的至少一个内容属性特征;
获取第一用户的用户特征向量,所述用户特征向量包括所述第用户的至少一个用户属性特征;
将所述内容特征向量和所述用户属性特征拼接成所述第一特征向量。
可选的,所述装置300还包括:训练模块,
所述获取模块,还用于获取第二特征向量,第二用户与第二内容之间的点击值,所述第二内容为已向所述第二用户显示的内容,所述点击值用于表示所述第二用户是否点击所述第二内容,所述第二特征向量包括所述第二内容的至少一个内容属性特征和所述第二用户的至少一个用户属性特征;
所述训练模块,用于根据所述第二特征向量和所述点击值训练智能模型,得到点击概率预测模型。
可选的,所述训练模块,用于:
将所述第二特征向量输入到智能模型,所述智能模型用于通过对所述第二特征向量进行卷积运算得到至少一个第二特征组合,第二特征组合包括第二内容的内容属性特征和第二用户的用户属性特征的特征组合,基于至少一个第二特征组合预测所述第二用户点击所述第二内容的点击概率;
根据所述点击值和所述第二用户点击所述第二内容的点击概率,调整所述智能模型的网络参数。
可选的,所述点击概率预测模型为:
Figure BDA0002182842280000111
其中,P为点击概率,x为第一特征向量,w为点击概率预测模型的第一网络参数,v为点击概率预测模型的第二网络参数,*为卷积运算。关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
在本申请实施例中,获取模块获取第一特征向量,第一特征向量包括向第一用户待显示的第一内容的至少一个内容属性特征和第一用户的至少一个用户属性特征,向点击概率预测模型输入第一特征向量。由于点击概率预测模型对第一特征向量进行卷积运算,可以降低运算复杂度,进而减小了计算点击概率的运算复杂度。点击概率预测模型可以采用快速傅立叶卷积运算方式,进一步减小了计算点击概率的运算复杂度。
图5是根据一示例性实施例示出的一种点击概率的预测装置400的框图。例如,装置400可以被提供为一服务器,例如,可以为上述参数服务器。参照图5,装置400包括处理组件422,其进一步包括一个或多个处理器,以及由存储器432所代表的存储器资源,用于存储可由处理部件422执行的指令,例如应用程序。存储器432中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件422被配置为执行指令,以执行上述点击概率的预测方法。
装置400还可以包括一个电源组件426被配置为执行装置400的电源管理,一个有线或无线网络接口450被配置为将装置400连接到网络,和一个输入输出(I/O)接口458。装置400可以操作基于存储在存储器432的操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本领域技术人员在考虑说明书及实践这里公开的申请后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (10)

1.一种点击概率的预测方法,其特征在于,所述方法包括:
获取第一特征向量,所述第一特征向量包括向第一用户待显示的第一内容的至少一个内容属性特征和所述第一用户的至少一个用户属性特征;
将所述第一特征向量输入到点击概率预测模型,所述点击概率预测模型用于通过对所述第一特征向量进行卷积运算得到至少一个第一特征组合,所述第一特征组合包括内容属性特征和用户属性特征,基于所述至少一个第一特征组合预测所述第一用户点击所述第一内容的点击概率;
获取所述点击概率预测模型输出的所述点击概率。
2.如权利要求1所述的方法,其特征在于,所述获取第一特征向量,包括:
获取第一内容的内容特征向量,所述内容特征向量包括所述第一内容的至少一个内容属性特征;
获取第一用户的用户特征向量,所述用户特征向量包括所述第一用户的至少一个用户属性特征;
将所述内容特征向量和所述用户特征向量拼接成所述第一特征向量。
3.如权利要求1所述的方法,其特征在于,所述方法还包括:
获取第二特征向量,第二用户与第二内容之间的点击值,所述第二内容为已向所述第二用户显示的内容,所述点击值用于表示所述第二用户是否点击所述第二内容,所述第二特征向量包括所述第二内容的至少一个内容属性特征和所述第二用户的至少一个用户属性特征;
根据所述第二特征向量,所述点击值训练智能模型,得到点击概率预测模型。
4.如权利要求3所述的方法,其特征在于,所述根据所述第二特征向量,所述点击值训练智能模型,包括:
将所述第二特征向量输入到智能模型,所述智能模型用于通过对所述第二特征向量进行卷积运算得到至少一个第二特征组合,所述第二特征组合包括所述第二内容的内容属性特征和所述第二用户的用户属性特征,基于至少一个第二特征组合预测所述第二用户点击所述第二内容的点击概率;
根据所述点击值和所述第二用户点击所述第二内容的点击概率,调整所述智能模型的网络参数。
5.如权利要求1至4任一项所述的方法,其特征在于,所述点击概率预测模型为:
Figure FDA0002182842270000021
其中,p为点击概率,x为第一特征向量,w为点击概率预测模型的第一网络参数,v为点击概率预测模型的第二网络参数,*为卷积运算。
6.一种点击概率的预测装置,其特征在于,所述装置包括:
获取模块,用于获取第一特征向量,所述第一特征向量包括向第一用户待显示的第一内容的至少一个内容属性特征和所述第一用户的至少一个用户属性特征;
输入模块,用于将所述第一特征向量输入到点击概率预测模型,所述点击概率预测模型用于通过对所述第一特征向量进行卷积运算得到至少一个第一特征组合,所述第一特征组合包括内容属性特征和用户属性特征,基于所述至少一个第一特征组合预测所述第一用户点击所述第一内容的点击概率;
所述获取模块,用于获取所述点击概率预测模型输出的所述点击概率。
7.如权利要求6所述的装置,其特征在于,所述获取模块,用于:
获取第一内容的内容特征向量,所述内容特征向量包括所述第一内容的至少一个内容属性特征;
获取第一用户的用户特征向量,所述用户特征向量包括所述第一用户的至少一个用户属性特征;
将所述内容特征向量和所述用户属性特征拼接成所述第一特征向量。
8.如权利要求6所述的装置,其特征在于,所述装置还包括:训练模块,
所述获取模块,还用于获取第二特征向量,第二用户与第二内容之间的点击值,所述第二内容为已向所述第二用户显示的内容,所述点击值用于表示所述第二用户是否点击所述第二内容,所述第二特征向量包括所述第二内容的至少一个内容属性特征和所述第二用户的至少一个用户属性特征;
所述训练模块,用于根据所述第二特征向量,所述点击值训练智能模型,得到点击概率预测模型。
9.一种电子设备,其特征在于,包括至少一个处理器和至少一个存储器,所述至少一个存储器用于存储至少一个指令,所述至少一个指令被所述至少一个处理器加载并运行,以实现如权利要求1至5任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,用于存储至少一个指令,所述至少一个指令被处理器加载并运行,以实现如权利要求1至5任一项所述的方法。
CN201910802930.1A 2019-08-28 2019-08-28 点击概率的预测方法及装置 Active CN110502715B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910802930.1A CN110502715B (zh) 2019-08-28 2019-08-28 点击概率的预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910802930.1A CN110502715B (zh) 2019-08-28 2019-08-28 点击概率的预测方法及装置

Publications (2)

Publication Number Publication Date
CN110502715A CN110502715A (zh) 2019-11-26
CN110502715B true CN110502715B (zh) 2023-07-14

Family

ID=68588682

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910802930.1A Active CN110502715B (zh) 2019-08-28 2019-08-28 点击概率的预测方法及装置

Country Status (1)

Country Link
CN (1) CN110502715B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112288554B (zh) * 2020-11-27 2023-09-29 腾讯科技(深圳)有限公司 商品推荐方法和装置、存储介质及电子装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105046515A (zh) * 2015-06-26 2015-11-11 深圳市腾讯计算机系统有限公司 广告排序方法及装置
CN109145245A (zh) * 2018-07-26 2019-01-04 腾讯科技(深圳)有限公司 预测点击率的方法、装置、计算机设备及存储介质
CN109359247A (zh) * 2018-12-07 2019-02-19 广州市百果园信息技术有限公司 内容推送方法及存储介质、计算机设备
CN109408724A (zh) * 2018-11-06 2019-03-01 北京达佳互联信息技术有限公司 多媒体资源预估点击率的确定方法、装置及服务器
CN109460513A (zh) * 2018-10-31 2019-03-12 北京字节跳动网络技术有限公司 用于生成点击率预测模型的方法和装置
CN109711883A (zh) * 2018-12-26 2019-05-03 西安电子科技大学 基于U-Net网络的互联网广告点击率预估方法
CN109919670A (zh) * 2019-02-27 2019-06-21 重庆金窝窝网络科技有限公司 广告点击概率的预测方法、装置、服务器和存储介质
CN110046952A (zh) * 2019-01-30 2019-07-23 阿里巴巴集团控股有限公司 一种推荐模型的训练方法及装置、一种推荐方法及装置
CN110162690A (zh) * 2018-10-23 2019-08-23 腾讯科技(深圳)有限公司 确定用户对物品的兴趣度的方法与装置、设备和存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8484077B2 (en) * 2010-07-21 2013-07-09 Yahoo! Inc. Using linear and log-linear model combinations for estimating probabilities of events
WO2016201631A1 (en) * 2015-06-17 2016-12-22 Yahoo! Inc. Systems and methods for online content recommendation
US20190258933A1 (en) * 2018-02-19 2019-08-22 International Business Machines Corporation Deep Forecasted Human Behavior from Digital Content

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105046515A (zh) * 2015-06-26 2015-11-11 深圳市腾讯计算机系统有限公司 广告排序方法及装置
CN109145245A (zh) * 2018-07-26 2019-01-04 腾讯科技(深圳)有限公司 预测点击率的方法、装置、计算机设备及存储介质
CN110162690A (zh) * 2018-10-23 2019-08-23 腾讯科技(深圳)有限公司 确定用户对物品的兴趣度的方法与装置、设备和存储介质
CN109460513A (zh) * 2018-10-31 2019-03-12 北京字节跳动网络技术有限公司 用于生成点击率预测模型的方法和装置
CN109408724A (zh) * 2018-11-06 2019-03-01 北京达佳互联信息技术有限公司 多媒体资源预估点击率的确定方法、装置及服务器
CN109359247A (zh) * 2018-12-07 2019-02-19 广州市百果园信息技术有限公司 内容推送方法及存储介质、计算机设备
CN109711883A (zh) * 2018-12-26 2019-05-03 西安电子科技大学 基于U-Net网络的互联网广告点击率预估方法
CN110046952A (zh) * 2019-01-30 2019-07-23 阿里巴巴集团控股有限公司 一种推荐模型的训练方法及装置、一种推荐方法及装置
CN109919670A (zh) * 2019-02-27 2019-06-21 重庆金窝窝网络科技有限公司 广告点击概率的预测方法、装置、服务器和存储介质

Also Published As

Publication number Publication date
CN110502715A (zh) 2019-11-26

Similar Documents

Publication Publication Date Title
CN111950638B (zh) 基于模型蒸馏的图像分类方法、装置和电子设备
US11694109B2 (en) Data processing apparatus for accessing shared memory in processing structured data for modifying a parameter vector data structure
US20190147361A1 (en) Learned model provision method and learned model provision device
CN114265979B (zh) 确定融合参数的方法、信息推荐方法和模型训练方法
CN112668608B (zh) 一种图像识别方法、装置、电子设备及存储介质
CN111783810A (zh) 用于确定用户的属性信息的方法和装置
CN113919923B (zh) 直播推荐模型训练方法、直播推荐方法及相关设备
CN110502715B (zh) 点击概率的预测方法及装置
CN111489196B (zh) 基于深度学习网络的预测方法、装置、电子设备及介质
CN110262906B (zh) 接口标签推荐方法、装置、存储介质和电子设备
CN111161238A (zh) 图像质量评价方法及装置、电子设备、存储介质
CN114492370B (zh) 网页识别方法、装置、电子设备和介质
CN116028715A (zh) 内容推荐方法、装置、存储介质及电子设备
CN114528973A (zh) 业务处理模型的生成方法、业务处理方法和装置
CN112749005B (zh) 资源数据处理方法、装置、计算机设备和存储介质
CN112417260B (zh) 本地化推荐方法、装置及存储介质
CN113392249A (zh) 图文信息分类方法、图文分类模型训练方法、介质及设备
CN114519593A (zh) 资源召回模型更新方法、装置、电子设备及存储介质
CN113596528B (zh) 视频推送模型的训练方法、装置、服务器及存储介质
CN111309875B (zh) 问题应答的方法、装置、设备和存储介质
WO2023166564A1 (ja) 推定装置
CN112906732B (zh) 目标检测方法、装置、电子设备及存储介质
US20230140148A1 (en) Methods for community search, electronic device and storage medium
CN117648993A (zh) 标签生成模型的训练、标签生成方法、装置及存储介质
CN116028714A (zh) 资源推荐方法、训练方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant