CN110415006B

CN110415006B - 广告点击率预估方法和装置

Info

Publication number: CN110415006B
Application number: CN201810398125.2A
Authority: CN
Inventors: 赵磊; 张秀武; 姚春念
Original assignee: Alibaba China Co Ltd
Current assignee: Alibaba China Co Ltd
Priority date: 2018-04-28
Filing date: 2018-04-28
Publication date: 2022-03-08
Anticipated expiration: 2038-04-28
Also published as: CN110415006A

Abstract

本发明提供一种广告点击率预估方法和装置，通过接收请求消息，请求消息中包含离散特征，根据离散特征以及映射关系表进行特征抽取，得到离散特征对应的连续值表达向量，加载第一深度神经网络模型以及连续值表达向量至分类器，得到连续值表达向量对应的广告点击率，由于映射关系表中存储离散特征与连续值表达向量的对应关系，因此，可以直接通过映射关系表查找到离散特征对应的连续值表达向量，提高了广告点击率预估的准确性。

Description

广告点击率预估方法和装置

技术领域

本发明涉及计算机技术，尤其涉及一种广告点击率预估方法和装置。

背景技术

广告点击率预估(Click-Through Rate Prediction，CRP)是通过对用户搜索与点击行为的历史数据进行分析，预测当前的特定状态下，用户点击特定广告的概率。

现有技术中，通常采用简单的线性判别模型进行广告点击率预估，例如：逻辑斯特回归(Logistics Regression，LR)模型、因子分解(Factorization Machines，FM)模型、矩阵分解(Matrix Factorization，MF)模型或梯度提升决策树(Gradient Boost DecisionTree，GBDT)模型等。

然而，采用现有技术的线性判别模型进行广告点击率预估，由于模型简单，表达能力有限，广告点击率预估的准确性不高。

发明内容

本发明提供一种广告点击率预估方法和装置，以提高广告点击率预估的准确性。

第一方面，本发明提供一种广告点击率预估方法，包括：

接收请求消息，所述请求消息中包含离散特征，所述请求消息用于请求预估所述离散特征对应的广告点击率；

根据所述离散特征以及映射关系表进行特征抽取，得到所述离散特征对应的连续值表达向量，所述映射关系表用于将所述离散特征映射为连续值表达向量；

加载第一深度神经网络模型以及所述连续值表达向量至分类器，得到所述连续值表达向量对应的广告点击率。

可选地，所述接收请求消息之前，还包括：

根据离散特征样本、至少两个插件以及第二深度神经网络模型，训练得到所述映射关系表以及所述第一深度神经网络模型，所述至少两个插件对应至少两个不同的线性判别模型。

可选地，所述根据离散特征样本、至少两个插件以及第二深度神经网络模型，训练得到所述映射关系表，包括：

将所述离散特征样本分别输入所述至少两个插件，得到至少两个第一表达向量；

将所述至少两个第一表达向量输入所述第二深度神经网络模型，得到第二表达向量，所述第二表达向量为连续值表达向量；

根据所述离散特征样本和所述第二表达向量得到所述映射关系表。

可选地，所述根据离散特征样本、至少两个插件以及第二深度神经网络模型，训练得到所述第一深度神经网络模型，包括：

根据

J(θ)＝argmaxL(θ)、θ_t＝αθ_t-1-ηg_t以及

更新所述至少两个插件以及所述第二深度神经网络模型的参数；

其中，

表示第二深度神经网络模型的输出，x_i表示第二深度神经网络的模型的输入，y_i＝0表示离散特征样本未被点击，y_i＝1表示离散特征样本被点击，P(Y＝1|x)表示离散特征样本被点击的概率，P(Y＝0|x)表示离散特征样本未被点击的概率；α表示动量值，η代表学习率，θ_t表示t时刻参数θ的值，g_t表示t时刻第二深度神经网络模型回传至所述插件的梯度值。

可选地，所述插件为下述任一种：

逻辑斯特回归LR模型；

因子分解FM模型；

矩阵分解MF模型；

梯度提升决策树GBDT模型。

第二方面，本发明提供一种广告点击率预估装置，包括：

接收模块，用于接收请求消息，所述请求消息中包含离散特征，所述请求消息用于请求预估所述离散特征对应的广告点击率；

处理模块，用于根据所述离散特征以及映射关系表进行特征抽取，得到所述离散特征对应的连续值表达向量，所述映射关系表用于将所述离散特征映射为连续值表达向量；

所述处理模块，还用于加载第一深度神经网络模型以及所述连续值表达向量至分类器，得到所述连续值表达向量对应的广告点击率。

可选地，还包括：

训练模块，用于根据离散特征样本、至少两个插件以及第二深度神经网络模型，训练得到所述映射关系表以及所述第一深度神经网络模型，所述至少两个插件对应至少两个不同的线性判别模型。

可选地，所述训练模块具体用于将所述离散特征样本分别输入所述至少两个插件，得到至少两个第一表达向量；

将所述至少两个第一表达向量输入所述第二深度神经网络模型，得到第二表达向量，所述第二表达向量为连续值表达向量；根据所述离散特征样本和所述第二表达向量得到所述映射关系表。

可选地，所述训练模块具体用于

根据

J(θ)＝argmaxL(θ)、θ_t＝αθ_t-1-ηg_t以及

其中，

可选地，所述插件为下述任一种：逻辑斯特回归LR模型；

因子分解FM模型；

矩阵分解MF模型；

梯度提升决策树GBDT模型。

本发明提供的广告点击率预估方法和装置，通过接收请求消息，请求消息中包含离散特征，根据离散特征以及映射关系表进行特征抽取，得到离散特征对应的连续值表达向量，加载第一深度神经网络模型以及连续值表达向量至分类器，得到连续值表达向量对应的广告点击率，由于映射关系表中存储离散特征与连续值表达向量的对应关系，因此，可以直接通过映射关系表查找到离散特征对应的连续值表达向量，提高了广告点击率预估的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明广告点击率预估系统的示意图；

图2为本发明提供的一种广告点击率预估方法实施例一的流程示意图；

图3为本发明提供的另一种广告点击率预估方法实施例二的流程示意图；

图4为本发明提供的再一种广告点击率预估方法实施例三的流程示意图；

图5为本发明提供的又一种广告点击率预估方法实施例四的流程示意图；

图6为本发明提供的一种广告点击率预估装置实施例一的结构示意图；

图7为本发明提供的另一种广告点击率预估装置实施例二的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

在广告点击率预估方法中，不同的广告对应的特征不同，这些特征包括但不限于用户特征和广告内容特征等，用户特征例如用户标识(Identification，ID)，广告内容特征例如广告ID，这些特征通常都是离散特征，这些离散特征可以通过字符串表达；并且，这些离散特征的数量巨大，且分布具有稀疏性，例如：在几百万条用户广告点击记录中可能只有一两条记录包含了同一用户ID。

本发明提供一种广告点击率预估方法，通过在离线系统中将不同的线性判别模型作为不同的插件；将每一个离散特征输入到不同的插件，以通过不同的插件将离散特征转化为不同的表达向量，通过插件将离散特征转化为不同的表达向量，大幅度降低了数据计算复杂度；再将不同的表达向量输入到深度神经网络模型，深度神经网络模型输出连续值表达向量，通过对插件和深度神经网络模型进行联合优化，从而，得到离散特征与连续值表达向量的映射关系表以及深度神经网络模型。由于不同的插件具有各自的优点，通过结合多个插件的优点，使得模型表达更加丰富；在线分析通过利用上述得到的映射关系表以及深度神经网络模型，提高广告点击率预估的准确性。

并且，上述映射关系表以及深度神经网络模型的可移植性高，因此，可以横向扩展在线分析系统，提高广告点击率预估的效率。

在线分析系统中，可以通过使用专用数学计算库对矩阵运算进行深度优化，进一步提高广告点击率预估的效率。

下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例不再赘述。

图1为本发明广告点击率预估系统的示意图，如图1所示，本发明的广告点击率预估系统包括：离线系统和在线分析系统，其中，离线系统包括：至少两个插件(图1中以三个为例示出)和第二深度神经网络模型；在线分析系统包括：映射关系表、特征抽取器、第一深度神经网络模型以及分类器等。

其中，在线分析系统可以横向扩展，以提高广告点击率预估的效率。

在线分析系统可以使用专用数学计算库对矩阵运算进行深度优化，进一步提高广告点击率预估的效率。

图2为本发明提供的一种广告点击率预估方法实施例一的流程示意图，如图2所示，本实施例应用于在线分析系统，包括：

S201：接收请求消息。

所述请求消息中包含离散特征，所述请求消息用于请求预估所述离散特征对应的广告点击率。

结合图1的在线分析系统，请求消息作为特征抽取器的输入。

S202：根据所述离散特征以及映射关系表进行特征抽取，得到所述离散特征对应的连续值表达向量。

所述映射关系表用于将所述离散特征映射为连续值表达向量；

特征抽取器加载映射关系表，根据映射关系表得到离散特征对应的连续值表达向量。

由于映射关系表是根据离线系统中的多个插件以及第二深度神经网络模型联合优化训练得到的，因此，根据映射关系表得到的离散特征对应的连续值表达向量更加准确。

S203：加载第一深度神经网络模型以及连续值表达向量至分类器，得到连续值表达向量对应的广告点击率。

其中，第一深度神经网络模型通过离线系统中的多个插件以及第二深度神经网络模型联合优化训练得到的，因此，第一深度神经网络模型的表达能力更丰富，将连续值表达向量作为分类器的输入，分类器加载第一深度神经网络模型，输出连续值表达向量对应的广告点击率，得到的广告点击率更加准确。

本实施例，通过接收请求消息，请求消息中包含离散特征，根据离散特征以及映射关系表进行特征抽取，得到离散特征对应的连续值表达向量，加载第一深度神经网络模型以及连续值表达向量至分类器，得到连续值表达向量对应的广告点击率，由于映射关系表中存储离散特征与连续值表达向量的对应关系，因此，可以直接通过映射关系表查找到离散特征对应的连续值表达向量，提高了广告点击率预估的准确性。

图3为本发明提供的另一种广告点击率预估方法实施例二的流程示意图，图3是在图2所示实施例的基础上，通过离线系统得到映射关系表以及第一深度神经网络模型的过程；在S201之前，还包括：

S200：根据离散特征样本、至少两个插件以及第二深度神经网络模型，训练得到所述映射关系表以及所述第一深度神经网络模型。

其中，所述至少两个插件对应至少两个不同的线性判别模型。

其中，插件为下述任一种：

LR模型；

FM模型；

MF模型；

GBDT模型。

通过将每一个离散特征输入到不同的插件，以通过不同的插件将离散特征转化为不同的表达向量，通过插件将离散特征转化为不同的表达向量，大幅度降低了数据计算复杂度；由于不同的插件具有各自的优点，通过结合多个插件的优点，使得模型表达更加丰富。

本实施例，通过离线系统根据离散特征样本、至少两个插件以及第二深度神经网络模型，训练得到所述映射关系表以及所述第一深度神经网络模型，使得映射关系表的映射关系更加准确，第一深度神经网络模型的表达能力更加丰富，提高了广告点击率预估的准确性。

图4为本发明提供的再一种广告点击率预估方法实施例三的流程示意图，图4是在3所示实施例的基础上，S200中得到映射关系表的一种可能的实现方式，如图4所示：

S2001a：将所述离散特征样本分别输入至少两个插件，得到至少两个第一表达向量。

通过将同一离散特征输入不同的插件，可以得到不同的表达向量，从而可以利用不同的插件具有的优点。

S2002a：将所述至少两个第一表达向量输入所述第二深度神经网络模型，得到第二表达向量，所述第二表达向量为连续值表达向量。

S2003a：根据所述离散特征样本和所述第二表达向量得到所述映射关系表。

本实施例，通过所述离散特征样本分别输入至少两个插件，得到至少两个第一表达向量，将所述至少两个第一表达向量输入所述第二深度神经网络模型，得到第二表达向量，所述第二表达向量为连续值表达向量，据所述离散特征样本和所述第二表达向量得到所述映射关系表。由于不同的插件具有不同的优点，因此，通过结合多个插件以及第二深度神经网络模型训练得到的映射关系表更加准确。

图5为本发明提供的又一种广告点击率预估方法实施例四的流程示意图，图5是在3所示实施例的基础上，S200中得到第一深度神经网络模型的一种可能的实现方式，如图5所示：

S200b：

根据

J(θ)＝argmaxL(θ)、θ_t＝αθ_t-1-ηg_t以及

其中，

本实施例，通过离线系统根据离散特征样本、至少两个插件以及第二深度神经网络模型，训练得到第一深度神经网络模型，第一深度神经网络模型的表达能力更加丰富，提高了广告点击率预估的准确性。

图6为本发明提供的一种广告点击率预估装置实施例一的结构示意图，本实施例的装置包括：接收模块601和处理模块602，其中，接收模块601用于接收请求消息，所述请求消息中包含离散特征，所述请求消息用于请求预估所述离散特征对应的广告点击率；处理模块602用于根据所述离散特征以及映射关系表进行特征抽取，得到所述离散特征对应的连续值表达向量，所述映射关系表用于将所述离散特征映射为连续值表达向量；所述处理模块602还用于加载第一深度神经网络模型以及所述连续值表达向量至分类器，得到所述连续值表达向量对应的广告点击率。

本实施例的装置，对应地可用于执行图2所示方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

图7为本发明提供的另一种广告点击率预估装置实施例二的结构示意图，图7是在图6所示实施例的基础上，进一步地还包括：训练模块603用于根据离散特征样本、至少两个插件以及第二深度神经网络模型，训练得到所述映射关系表以及所述第一深度神经网络模型，所述至少两个插件对应至少两个不同的线性判别模型。

其中，插件为下述任一种：

逻辑斯特回归LR模型；

因子分解FM模型；

矩阵分解MF模型；

梯度提升决策树GBDT模型。

本实施例的装置，对应地可用于执行图3所示方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

本发明还提供一种广告点击率预估装置实施例，在图7所示实施例的基础上，所述训练模块603具体用于将所述离散特征样本分别输入所述至少两个插件，得到至少两个第一表达向量；

本实施例的装置，对应地可用于执行图4所示方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

本发明还提供一种广告点击率预估装置实施例，在图7所示实施例的基础上，所述训练模块603具体用于

根据

J(θ)＝argmaxL(θ)、θ_t＝αθ_t-1-ηg_t以及

其中，

本实施例的装置，对应地可用于执行图5所示方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

本发明还提供一种计算机可读存储介质，应用于广告点击率预估装置中，所述计算机可读存储介质存储有指令，当所述指令被计算装置执行时，使得广告点击率预估装置执行如图2～图5任一所述的方法。

本发明还提供一种程序产品，所述程序产品包括计算机程序，所述计算机程序存储在计算机可读存储介质中，广告点击率预估装置的至少一个处理器从所述计算机可读存储介质中读取所述计算机程序，所述至少一个处理执行所述计算机程序使得所述广告点击率预估装置执行图2～图5任一所述的方法。

在本发明的实施例中，处理模块用于实现对数据的处理。处理模块可以是处理电路，也可以是处理器。其中，处理器可以是中央处理器(central processing unit，CPU)，网络处理器(network processor，NP)或者CPU和NP的组合。处理器还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(application-specific integrated circuit，ASIC)，可编程逻辑器件(programmable logic device，PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(complex programmable logic device,CPLD)，现场可编程逻辑门阵列(field-programmable gate array，FPGA)，通用阵列逻辑(Generic Array Logic，GAL)或其任意组合。

处理模块也可以包括多个处理单元或者处理单元包括多个子数据处理单元。具体的，处理器可以是一个单核(single-CPU)处理器，也可以是一个多核(multi-CPU)处理器。

本实施例中的对象的运动轨迹的确定装置还可以包括存储单元。存储模块用于存储处理模块执行的计算机指令。存储模块可以是存储电路也可以是存储器。存储器可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(read-only memory，ROM)、可编程只读存储器(programmableROM，PROM)、可擦除可编程只读存储器(erasable PROM，EPROM)、电可擦除可编程只读存储器(electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(randomaccess memory，RAM)，其用作外部高速缓存。存储模块可以是独立于处理模块的单元，也可以是处理模块中的存储单元，在此不做限定。对象的运动轨迹的确定装置可以包括多个存储模块或者存储模块包括多个子存储模块。

发送模块和接收模块以及处理模块可以是在物理上相互分离的单元，也可以是集成到一个或者多个物理单元中，在此不做限定。

在本发明所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种广告点击率预估方法，其特征在于，包括：

根据离散特征样本、至少两个插件以及第二深度神经网络模型，训练得到映射关系表以及第一深度神经网络模型，所述至少两个插件对应至少两个不同的线性判别模型；

根据所述离散特征以及所述映射关系表进行特征抽取，得到所述离散特征对应的连续值表达向量，所述映射关系表用于将所述离散特征映射为连续值表达向量；

加载所述第一深度神经网络模型以及所述连续值表达向量至分类器，得到所述连续值表达向量对应的广告点击率。

2.根据权利要求1所述的方法，其特征在于，所述根据离散特征样本、至少两个插件以及第二深度神经网络模型，训练得到所述映射关系表，包括：

3.根据权利要求2所述的方法，其特征在于，所述插件为下述任一种：

逻辑斯特回归LR模型；

因子分解FM模型；

矩阵分解MF模型；

梯度提升决策树GBDT模型。

4.一种广告点击率预估装置，其特征在于，包括：

训练模块，用于根据离散特征样本、至少两个插件以及第二深度神经网络模型，训练得到映射关系表以及第一深度神经网络模型，所述至少两个插件对应至少两个不同的线性判别模型；

处理模块，用于根据所述离散特征以及所述映射关系表进行特征抽取，得到所述离散特征对应的连续值表达向量，所述映射关系表用于将所述离散特征映射为连续值表达向量；

所述处理模块，还用于加载所述第一深度神经网络模型以及所述连续值表达向量至分类器，得到所述连续值表达向量对应的广告点击率。

5.根据权利要求4所述的装置，其特征在于，所述训练模块具体用于将所述离散特征样本分别输入所述至少两个插件，得到至少两个第一表达向量；将所述至少两个第一表达向量输入所述第二深度神经网络模型，得到第二表达向量，所述第二表达向量为连续值表达向量；根据所述离散特征样本和所述第二表达向量得到所述映射关系表。

6.根据权利要求5所述的装置，其特征在于，所述插件为下述任一种：

逻辑斯特回归LR模型；

因子分解FM模型；

矩阵分解MF模型；

梯度提升决策树GBDT模型。