CN109919670A

CN109919670A - 广告点击概率的预测方法、装置、服务器和存储介质

Info

Publication number: CN109919670A
Application number: CN201910145500.7A
Authority: CN
Inventors: 花远肖
Original assignee: Chongqing Golden Nest Network Technology Co Ltd
Current assignee: Chongqing Golden Nest Network Technology Co Ltd
Priority date: 2019-02-27
Filing date: 2019-02-27
Publication date: 2019-06-21

Abstract

本发明提供了一种广告点击概率的预测方法、装置、服务器和存储介质，获取包括待预测用户的用户特征向量和待预测广告的广告特征向量在内的多个特征向量后，计算特征向量中的任意两个特征向量对应的交互特征向量，然后将特征向量与交互特征向量合并，得到特征矩阵，并利用特征矩阵，计算得到待预测用户点击待预测广告的概率。其中，用户特征向量与待预测用户的用户特征对应，广告特征向量与待预测广告的广告特征对应。本发明提供的技术方案，将特征向量，以及根据特征向量计算得到的交互特征向量合并得到特征矩阵，并基于特征矩阵计算点击概率，能够综合考虑用户特征和广告特征，以及这些特征间的内在联系，有效的提高预测结果的准确性。

Description

广告点击概率的预测方法、装置、服务器和存储介质

技术领域

本发明涉及数据处理领域，特别涉及一种广告点击概率的预测方法、装置、服务器和存储介质。

背景技术

随着互联网技术的发展，现代的企业往往会选择在各种网站上投放广告。在网站上投放广告时，为了提高广告的宣传作用，需要根据具体情况下，不同用户对不同类型的广告的偏爱程度进行投放。

达到上述目的的一种有效方法是，预测广告的点击概率，也就是，根据用户特征和不同广告的特征，计算某一用户在特定情况下点击不同类型的广告的概率，选取点击概率最大的广告类型进行投放。

现有的广告点击概率的预测方法，直接利用从用户信息和广告信息中提取的用户特征向量和广告特征向量计算广告点击概率，而没有考虑这些特征之间的内在联系，导致预测的准确度不高。

发明内容

基于上述现有技术的不足，本发明提出一种广告点击概率的预测方法、装置、服务器和存储介质，以提高广告点击概率的预测结果的准确性。

为解决上述问题，现提出的方案如下：

本发明第一方面公开一种广告点击概率的预测方法，包括：

获取多个特征向量，所述多个特征向量包括：与待预测用户的用户特征对应的用户特征向量，以及与待预测广告的广告特征对应的广告特征向量；

计算所述多个特征向量中的任意两个特征向量对应的交互特征向量；

将所述用户特征向量、所述广告特征向量与所述交互特征向量合并，得到特征矩阵；

利用所述特征矩阵，计算得到所述待预测用户点击所述待预测广告的概率。

可选的，所述获取多个特征向量，包括：

获取待预测样本，所述待预测样本包括待预测用户的用户特征和待预测广告的广告特征；

对所述待预测样本进行编码，得到与所述用户特征对应的初始用户特征向量、以及与所述广告特征对应的初始广告特征向量；

对所述初始用户特征向量和所述初始广告特征向量分别进行嵌入处理，得到用户特征向量和广告特征向量。

可选的，所述计算所述特征向量中的任意两个特征向量对应的交互特征向量，包括：

对所述特征向量的任意两个特征向量，按下述公式计算对应的交互特征向量：

Z_i＝X_i×Y_i

其中，X_i和Y_i分别表示特征向量X和特征向量Y的第i个元素，Z_i表示与所述特征向量X和Y对应的交互特征向量Z的第i个元素，i是大于或等于1，且小于或等于m的正整数，m表示向量X和向量Y的维数。

可选的，所述利用所述特征矩阵，计算得到所述待预测用户点击所述待预测广告的概率，包括：

基于卷积神经网络，根据所述特征矩阵计算得到所述待预测用户点击所述待预测广告的概率。

可选的，所述基于卷积神经网络，根据所述特征矩阵计算得到所述待预测用户点击所述待预测广告的概率，包括：

利用卷积神经网络的卷积层从所述特征矩阵中提取卷积特征矩阵；

通过池化层压缩所述卷积特征矩阵，得到压缩后的特征矩阵；

通过平坦层将所述压缩后的特征矩阵转换成点击率预测向量；

通过全连接层将所述点击率预测向量转换成点击率预测值；

根据所述点击率预测值，利用sigmiod函数计算所述待预测用户点击所述待预测广告的概率。

可选的，所述卷积层包括5个卷积核；

所述利用所述卷积层从所述特征矩阵中提取卷积特征矩阵，包括：

分别利用所述卷积层中的5个卷积核从所述特征矩阵中提取5个卷积特征矩阵。

本发明第二方面公开一种广告点击概率的预测装置，包括：

特征向量获取单元，用于获取多个特征向量，所述多个特征向量包括：与待预测用户的用户特征对应的用户特征向量，以及与待预测广告的广告特征对应的广告特征向量；

特征向量交互单元，用于计算所述多个特征向量中的任意两个特征向量对应的交互特征向量；

特征矩阵获取单元，用于将所述用户特征向量、所述广告特征向量与所述交互特征向量合并，得到特征矩阵；

点击概率计算单元，用于利用所述特征矩阵，计算得到所述待预测用户点击所述待预测广告的概率。

可选的，所述特征向量获取单元包括：

样本获取单元，用于获取待预测样本，所述待预测样本包括待预测用户的用户特征和待预测广告的广告特征；

样本编码单元，用于对所述待预测样本进行编码，得到与所述用户特征对应的初始用户特征向量、以及与所述广告特征对应的初始广告特征向量；

嵌入单元，用于对所述初始用户特征向量和所述初始广告特征向量分别进行嵌入处理，得到用户特征向量和广告特征向量。

本发明第三方面公开一种服务器，包括处理器和存储器；其中：

所述存储器同于存储计算机指令；

所述处理器用于执行所述存储器存储的计算机指令，具体执行如上述本发明第一方面任意一项公开的广告点击概率的预测方法。

本发明第四方面公开一种存储介质，用于存储程序，所述程序被执行时，用于实现如上述本发明第一方面任意一项公开的广告点击概率的预测方法。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1是本发明实施例公开的广告点击概率的预测方法的流程图；

图2是本发明另一实施例公开的广告点击概率的预测方法的流程图；

图3是本发明实施例公开的计算卷积特征矩阵的示意图；

图4a是本发明实施例公开的压缩卷积特征矩阵的示意图；

图4b是本发明实施例公开的另一压缩卷积特征矩阵的示意图；

图5是本发明实施例公开的广告点击概率的预测装置的结构示意图；

图6是本发明实施例公开的服务器的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本申请实施例提供了一种广告点击概率的预测方法，请参考图1，所述方法包括以下步骤：

S101、获取多个特征向量。

上述多个特征向量包括：与待预测用户的用户特征对应的用户特征向量，以及与待预测广告的广告特征对应的广告特征向量。

S102、计算多个特征向量中的任意两个特征向量对应的交互特征向量。

可选的，计算两个特征向量对应的交互特征向量，可以是：将两个特征向量同一位置的元素相乘或者相加，得到的结果作为交互特征向量的对应位置的元素。

S103、将用户特征向量、广告特征向量与交互特征向量合并，得到特征矩阵。

其中，将用户特征向量、广告特征向量和交互特征向量，采用分别作为特征矩阵中的一行的形式进行合并，构成特征矩阵。

S104、利用特征矩阵，计算得到待预测用户点击待预测广告的概率。

可选的，可以将特征矩阵输入卷积神经网络，通过卷积神经网络对特征矩阵进行处理，得到待预测用户点击待预测广告的概率。

本申请实施例提供的广告点击概率的预测方法，获取包括待预测用户的用户特征向量和待预测广告的广告特征向量在内的多个特征向量后，计算特征向量中的任意两个特征向量对应的交互特征向量，然后将特征向量与交互特征向量合并，得到特征矩阵，并利用特征矩阵，计算得到待预测用户点击待预测广告的概率。其中，用户特征向量与待预测用户的用户特征对应，广告特征向量与待预测广告的广告特征对应。本实施例提供的方法，将特征向量，以及根据特征向量计算得到的交互特征向量合并得到特征矩阵，并基于特征矩阵计算点击概率，能够综合考虑用户特征和广告特征，以及这些特征间的内在联系，有效的提高预测结果的准确性。

本申请另一实施例还提供了一种广告点击概率的预测方法，请参考图2，所述方法包括：

S201、获取待预测样本。

待预测样本包括一个用户的至少一个用户特征和一个广告的至少一个广告特征。待预测样本中的用户特征的类型互不相同，且待预测样本中的广告特征的类型也不相同，例如：用户特征的类型包括性别、所在城市、经常浏览的网站类型和时间等，广告特征的类型包括广告形式，涉及领域等。

一个待预测样本中，每个特征由类型和特征值构成。并且，每个类型的特征至多只有一个。一个特征的特征值可以从其取值范围中选取，特征值的取值范围与类型对应，例如：性别对应的取值范围是男和女，时间对应的取值范围是星期一至星期日，广告形式对应的取值范围是视频、图片和文字。

需要说明的是，在本申请其他实施例提供的方法中，一个类型对应的取值范围，可以与本实施例提供的方法中公开的同一类型对应的取值范围不同。例如，在其他实施例中，时间对应的取值范围可以是以月份表示的1月至12月，或者是以日期表示的1月1日至12月31日。

下面结合一个待预测样本X的实例进行说明。待预测样本X：性别，男；时间，星期二；所在城市，A市；经常浏览的网站类型，音乐论坛；广告形式，短视频；涉及领域，网络游戏。

在待预测样本X中，有四个用户特征，包括：性别，男；时间，星期二；所在城市，A市；经常浏览的网站类型，音乐论坛。其中的“性别”，“时间”，“所在城市”和“经常浏览的网站类型”属于这四个特征的类型，“男”，“星期二”，“A市”和“音乐论坛”则是这四个特征的特征值。

本实施例提供的方法预测的广告点击概率，就是待预测用户，看到待预测广告时，点击该广告的概率，其中，待预测用户是指任意一个符合待预测样本中的所有用户特征的用户，待预测广告是指任意一个符合待预测样本中所有广告特征的广告。

S202、对待预测样本进行编码，得到与每一个用户特征对应的初始用户特征向量、以及与待预测样本中的每一个广告特征对应的初始广告特征向量。

初始用户特征向量和初始广告特征向量，都属于初始特征向量。

具体的，上述编码，是对待预测样本中的每个特征分别进行编码，编码完成后，每个特征都会有一个对应的初始特征向量。根据每个特征的特征值的不同，对应的初始特征向量的值也不同。

可选的，对用户特征和广告特征的编码，可以采用独热编码。独热编码是指，若某个类型的特征对应的取值范围中有N个特征值，那么编码得到的初始特征向量的维数也设为N，初始特征向量中的每个分量对应一个该特征的取值范围中的一个特征值，每个分量的取值只能是0或1。然后根据样本中该特征的特征值，将初始特征向量中对应的分量设为1，其他所有分量设为0。

例如，性别类型的特征，其取值范围中包括“男”和“女”两个特征值，那么对应的初始特征向量设置为2维向量(a，b)，其中的a和b是两个一位二进制数，a对应“男”，b对应“女”。若一个样本中，性别类型的特征的特征值为“男”，则编码后得到的初始特征向量为(1,0)。

如步骤S201中提及的样本X中，时间类型的特征的初始特征向量可以是(0，1，0，0，0，0，0)，即一个七维向量，每个分量从前到后依次对应于星期一至星期日。广告形式类型的特征对应的初始特征向量可以是(1，0，0)，三个分量依次对应视频、文字和图片。

S203、对初始用户特征向量和初始广告特征向量进行嵌入处理，得到用户特征向量和广告特征向量。

用户特征向量和广告特征向量，都属于特征向量。

从上述步骤S202可以看出，编码得到的初始用户特征向量和初始广告特征向量，一般情况下是多个维数各不相同的向量，为了后续进行的交互特征向量的计算和基于卷积神经网络的处理，需要将这些初始特征向量转换成同一维数的向量，也就是对初始用户特征向量和初始广告特征向量进行嵌入处理。

可选的，上述转换可以通过将每个初始特征向量与一个对应的转换矩阵相乘得到。具体的，对于一个N维的初始特征向量，可以通过以下公式将这个初始特征向量转换成M维的特征向量。

feature＝enc×w

其中，enc表示N维的初始特征向量，feature表示M维的特征向量，w表示N行M列的转换矩阵。

需要说明的是，在上述转换过程中，转换矩阵与初始特征向量是一一对应的，每个初始特征向量只能使用与该向量对应的转换矩阵进行转换。

构建上述转换矩阵时，可以基于历史数据对转换矩阵进行训练，从而确定其中每个元素的取值。其中，历史数据包括，多个用户的用户特征，已投放的多个广告的广告特征，以及各个用户对上述已投放的每个广告的点击频率。具体的，可以预先设定初始转换矩阵，然后将用户特征和已投放的广告的广告特征作为历史样本提供给本实施例公开的方法，计算出结果后，根据计算结果和这个历史样本对应的点击频率的误差对上述预设的初始转换矩阵中元素的取值进行修正，然后重复上述过程，直到计算结果与历史样本对应的点击频率之间的误差在可接受范围内为止。

上述历史样本对应的点击频率是指，该历史样本中的用户特征对应的用户群体点击已投放的广告的次数，与已投放的广告被投放的次数的比值。具体的，假设一个历史样本中的用户特征对应于用户群体A，该历史样本中的广告特征对应的已投放的广告为B，那么对应的点击频率就是，用户群体A点击广告B的次数，除以广告B的总投放次数得到的结果。

S204、针对用户特征向量和广告特征向量中的任意两个特征向量，计算得到其对应的交互特征向量。

需要说明的是，计算交互特征向量是指：对于特征向量X和Y，将这两个特征向量的元素对应的相乘，得到的所有乘积构成的向量就是这两个特征向量对应的交互特征向量。

具体的，假设有M维特征向量X(X₁，X₂……X_M)，和M维特征向量Y(Y₁，Y₂……Y_M)，经过上述方法处理后得到交互特征向量Z(Z₁，Z₂……Z_M)，交互特征向量的任一元素Z_i等于特征向量X的元素X_i和特征向量Y的元素Y_i的乘积，i是大于或等于1，小于或等于M的正整数。显然，得到的交互特征向量也是M维向量。

实际上，本实施例提供的方法中，步骤S204是对待预测样本对应的特征向量中的任意两个特征向量分别进行计算，得到两个特征向量的交互特征向量。其中，待预测样本对应的特征向量包括用户特征向量和广告特征向量。

也就是说，假设一个待预测样本包括两个用户特征和一个广告特征，对应的特征向量则包括两个用户特征向量A和B，以及一个广告特征向量C，那么待预测样本对应的特征向量中的任意两个特征向量的组合共有3种，即A和B，A和C，B和C，因此经过步骤S204可以计算出上述这3种组合方式对应的交互特征向量。

S205、将用户特征向量、广告特征向量和交互特征向量合并构成特征矩阵。

具体的，对于步骤S204中提及的总共有3个特征向量的样本，经过步骤S204后，得到3个交互特征向量，合计共6个向量，每个向量可以看成是特征矩阵中的一行，向量中的每个分量都是矩阵中的一个元素。假设该样本中的特征向量和交互特征向量的维数为M，合并后即可得到一个6行M列的特征矩阵。

S206、利用卷积神经网络的卷积层对特征矩阵进行特征提取，得到卷积特征矩阵。

卷积神经网络中的卷积层，由多个N阶方阵构成，这些方阵一般被称为卷积核，方阵的阶数N可以预先设定，一般设置为大于1的奇数，每个方阵中各元素的取值可以利用历史数据进行预先训练得到，其过程与步骤S203中训练转换矩阵的过程基本一致，也就是根据计算结果与实际值的偏差不断修正初始取值，最终获得可信度较高的卷积核。

在本实施例提供的方法中，卷积层共设置了5个卷积核，卷积核的大小是5×5，也就是设置了5个5阶方阵。步骤S206的具体实现过程，就是对输入卷积层的特征矩阵，分别利用上述5个卷积核对该特征矩阵进行卷积计算，最后得到5个卷积特征矩阵。

下面简要介绍利用卷积核对一个矩阵进行卷积计算的过程。以步骤S205中提及的6行M列的特征矩阵为例，假设M的取值为7，也就是说特征矩阵是一个6行7列的矩阵，记为矩阵P，用P_ij表示矩阵中的元素，i表示行数，j表示列数，卷积核用矩阵J表示，J_ij，i表示行数，j表示列数。

首先将卷积核中心的元素与P₁₁对齐，对于本实施例中的5阶方阵，就是将J₃₃与P₁₁对齐，请参考图3，其中的黑色节点表示特征矩阵中的元素，5×5的表格表示卷积核，此时卷积核中部分元素与特征矩阵中的部分元素对应，而其他元素则在特征矩阵外。然后，将卷积核中的每个元素都与其对应的特征矩阵中的元素相乘，若卷积核中的元素在特征矩阵外而没有对应的特征矩阵中的元素，则将这个元素乘以0，使得卷积核中的每个元素都对应于一个乘积，在本实施例中，总共得到了与卷积核中25个元素对应的25个乘积。最后，将上述得到的所有乘积相加，得到的和，就是卷积计算得到的卷积特征矩阵中第一行第一列的元素。

可选的，在本申请其他实施例提供的方法中，上述卷积特征矩阵中的元素，也可以是上述所有乘积相加后得到的和与一个预设的偏置常数相加的结果，每个卷积核对应一个预设的偏置常数，不同卷积核的偏置常数可以相同，也可以不同。

可选的，在本申请其他实施例提供的方法中，可以为卷积特征矩阵中的元素设置一个激活函数，先用这个激活函数处理上述所有乘积相加后得到的和，然后将处理结果确定为这个元素的取值。

一种可选的激活函数是：relu(x)＝max(0，x)。该函数表示，当输入的数字大于0时，直接输出该数字作为处理结果，当输入的数字小于或等于0时，输出0作为处理结果。

以此类推，通过移动卷积核，使卷积核的中心元素逐个与特征矩阵中的元素对齐，然后按照上述方法逐个计算出卷积特征矩阵中的对应元素的值，最终得到整个卷积特征矩阵。

显然，经过卷积处理后得到的卷积特征矩阵，其行数和列数与输入卷积层的特征矩阵是一致的。

结合上述例子，若输入的特征矩阵是6行7列的矩阵，经过卷积层处理后得到的卷积特征矩阵也是6行7列的矩阵。

显然，对于同一个特征矩阵，通过改变卷积核，可以得到不同的卷积特征矩阵，本实施例中，卷积层共设置了5个卷积核，因此会得到5个不同的卷积特征矩阵。

S207、通过池化层处理卷积特征矩阵，得到池化特征矩阵。

步骤S207提出的通过池化层处理卷积特征矩阵，具体是指，将卷积特征矩阵分为多个区域，然后按一个特定的标准从每个划分的区域提取出一个元素，作为这个区域处理后的结果，所有区域的处理结果，按各区域之间的相对位置关系排列，构成一个新的矩阵，就是池化特征矩阵。

可选的，本实施例提供的方法中，池化层使用的是最大池化网络。也就是说，将卷积特征矩阵划分后，选取每个区域的最大值作为该区域的处理结果。在本实施例提供的方法中，划分区域时，可以采用3X3的池化窗口进行划分，请参考图4a，其中的黑色节点表示卷积特征矩阵，3X3的表格表示池化窗口，通过移动池化窗口即可将卷积特征矩阵划分为多个3X3的区域，然后选取每个3X3的区域的9个元素中的最大值作为该区域的处理结果即可。

需要说明的是，划分得到的多个区域之间是不重叠的，对于上述3X3的池化窗口，按图4a所示划分出第一个区域后，要划出下一个区域就需要向下移动3行或向右移动3列，以使划分的下一个区域与上一个区域不重合。

在划分过程中，可能出现池化窗口部分未能完全覆盖卷进特征矩阵的情况。结合步骤S207中提及的例子，若输入池化层的是一个6行7列的卷积特征矩阵，并用上述3X3的池化窗口进行划分，当该窗口向右移动一次后，卷积特征矩阵中只剩第7列未被划分，此时再将池化窗口向右移动3列，就会导致池化窗口的一部分被移至卷积特征矩阵外。这种情况下，可以用0对卷积特征矩阵进行扩充，使得卷积特征矩阵恰好能被池化窗口划分完。

具体在上述例子中，可以在6行7列的卷积特征矩阵的右侧增加两列0，如图4b所示，其中的黑色节点表示卷积特征矩阵，从而构成一个扩充后的6行9列的卷积特征矩阵，使得池化窗口恰好能完全分割扩充后的卷积特征矩阵。

在本实施例中，由于卷积层包括5个卷积核，经过卷积层处理后得到5个卷积特征矩阵，对应的经过池化层处理后得到的池化特征矩阵也有5个。

S208、通过平坦层将池化特征矩阵转换成点击率预测向量。

可以采用多种方式将池化特征矩阵转换成点击率预测向量，这里给出两种实现方式。

第一种方式，对一个池化特征矩阵中的一列元素求和，得到的结果作为点击率预测向量中对应位置的分量，最终转换得到的点击率预测向量，是一个维数等于池化特征矩阵的列数的向量。

例如，假设有一个3行4列的池化特征矩阵，可以将第一列的3个元素相加，得到的和作为点击率预测向量的第一个分量，然后将第二列3个元素的和作为第二个分量，以此类推，最后得到整个点击率预测向量。

第二种方式，为每个池化特征矩阵分配一个预先设置的转换向量，转换向量的维数等于池化特征矩阵的行数，对于池化特征矩阵中的每一列元素，将其中的元素与转换向量中对应位置的元素相乘，然后将这一列的所有乘积相加，得到的和作为点击率预测向量对应位置的分量。

F<sub>11</sub>	F<sub>12</sub>	F<sub>13</sub>
			F<sub>21</sub>	F<sub>22</sub>	F<sub>23</sub>
F<sub>31</sub>	F<sub>32</sub>	F<sub>33</sub>

表1

表1是一个池化特征矩阵的示意，对应的转换向量记为E(E₁，E₂，E₃)，点击率预测向量记为G(G₁，G₂，G₃)，按照上述第二种方式，可以根据以下公式计算点击率预测向量。

其中，j可以取1、2或3，分别对应点击率预测向量的G₁，G₂和G₃。

当存在多个池化特征矩阵时，可以先按照上述任一方式计算出每个池化特征矩阵对应的点击率预测向量，然后将多个点击率预测向量连接得到整体的点击率预测向量。

例如，在本实施例中，共有5个池化特征矩阵，对应的可以得到5个点击率预测向量，可以记为A₁(A₁₁，A₁₂……A_1m)，A₂(A₂₁，A₂₂……A_2m)，A₃(A₃₁，A₃₂……A_3m)，A₄(A₄₁，A₄₂……A_4m)，A₅(A₅₁，A₅₂……A_5m)，然后可以将这5个点击率预测向量合并得到整体的点击率预测向量A(A₁₁……A_1m，A₂₁……A_2m，A₃₁……A_3m，A₄₁……A_4m，A₅₁……A_5m)，将向量A作为平坦层的输出结果。

需要说明的是，上述转换向量也可以利用历史数据进行预先训练得到，其过程与步骤S203中训练转换矩阵的过程基本一致，也就是根据计算结果与实际值的偏差不断修正转换向量的初始值，最终获得可信度较高的转换向量。

S209、根据点击率预测向量计算得到待预测用户点击待预测广告的概率。

需要说明的是，步骤S209中的计算，依据的点击率预测向量，是平坦层最终输出的点击率预测向量。也就是说，若输入平坦层的池化特征矩阵只有一个，则根据这个池化特征矩阵计算得到的点击率预测向量会直接被平坦层输出，然后进入步骤S209；若输入平坦层的是多个池化特征矩阵，例如在本实施例中输入了5个池化特征矩阵，参考步骤S208中的例子，此时平坦层输出的点击率预测向量是整体的点击率预测向量，即步骤S208中提及的将向量A₁至A₅合并得到的向量A，对应的步骤S209中的计算依据的是合并得到的向量A。

可选的，步骤S209包括以下两步：

S2091、根据点击率预测向量计算预测值；

S2092、用转换函数将预测值转换为与广告信息对应的广告的概率。

上述计算预测值，可以直接将点击率预测向量中的所有分量求和得到，也可以先将每个分量乘以一个对应的预设的权重，在对所有乘积求和得到预测值。

每个分量对应的权重，也可以利用历史数据进行预先训练得到，其过程与步骤S203中训练转换矩阵的过程基本一致，也就是根据计算结果与实际值的偏差不断修正转换初始权重，最终获得可信度较高的权重。

用于将预测值转换为概率的函数可以有多种选择，在本实施例中，可以使用sigmiod函数，函数的具体表达式如下所示。

其中，x表示函数的输入，也就是预测值，sigmiod(x)表示函数的输出，也就是待预测用户点击待预测广告的概率。

本申请实施例提供的广告点击概率的预测方法，利用卷积神经网络对特征向量以及根据特征向量计算得到的交互特征向量进行处理，得到待预测用户点击待预测广告的概率。相对于现有的广告点击概率的预测方法中常用的决策树和支持向量机等线性模型，本实施例使用的卷积神经网络，作为一种非线性模型，更符合真实的应用场景，因此预测的点击概率准确度更高。

基于上述广告点击概率的预测方法，本申请实施例还提供了一种广告点击概率的预测装置，请参考图5，该装置包括以下单元，

特征向量获取单元501，用于获取多个特征向量。

可选的，特征向量获取单元包括：

样本获取单元，用于获取待预测样本，待预测样本包括待预测用户的用户特征和待预测广告的广告特征；

样本编码单元，用于对待预测样本进行编码，得到与用户特征对应的初始用户特征向量、以及与广告特征对应的初始广告特征向量；

嵌入单元，用于对初始用户特征向量和初始广告特征向量分别进行嵌入处理，得到用户特征向量和广告特征向量。

特征向量交互单元502，用于计算多个特征向量中的任意两个特征向量对应的交互特征向量。

可选的，特征向量交互单元，可以通过以下方式计算多个特征向量中的任意两个特征向量对应的交互特征向量：

对多个特征向量中的任意两个特征向量，按下述公式计算对应的交互特征向量

Z_i＝X_i×Y_i

特征矩阵获取单元503，用于将用户特征向量、广告特征向量与交互特征向量合并，得到特征矩阵。

点击概率计算单元504，用于利用特征矩阵，计算得到待预测用户点击待预测广告的概率。

可选的，点击概率计算单元包括卷积神经网络和输出单元，其中，卷积神经网络用于根据特征矩阵计算点击率预测值，输出单元用于根据点击率预测值计算待预测用户点击待预测广告的概率。

其中，卷积神经网络包括：

卷积层，用于从特征矩阵中提取卷积特征矩阵；

池化层，用于压缩卷积特征矩阵，得到压缩后的特征矩阵；

平坦层，用于将压缩后的特征矩阵转换成点击率预测向量；

全连接层，用于将点击率预测向量转换成点击率预测值。

可选的，卷积神经网络中的卷积层包括5个卷积核，卷积层通过5个卷积核可以分别从特征矩阵中提取出5个卷积特征矩阵。

输出单元，具体用于根据点击率预测值，利用sigmiod函数计算待预测用户点击待预测广告的概率。

本申请实施例提供的广告点击概率的预测装置，通过特征向量获取单元获取包括待预测用户的用户特征向量和待预测广告的广告特征向量在内的多个特征向量后，由特征向量交互单元计算特征向量中的任意两个特征向量对应的交互特征向量，然后在特征矩阵获取单元中将特征向量与交互特征向量合并，得到特征矩阵，最后通过点击概率计算单元，根据特征矩阵，计算得到待预测用户点击待预测广告的概率。其中，用户特征向量与待预测用户的用户特征对应，广告特征向量与待预测广告的广告特征对应。本实施例提供的装置，将特征向量，以及根据特征向量计算得到的交互特征向量合并得到特征矩阵，并基于特征矩阵计算点击概率，能够综合考虑用户特征和广告特征，以及这些特征间的内在联系，有效的提高预测结果的准确性。

本申请实施例提供了一种服务器，请参考图6，包括存储器601和处理器602，其中：

存储器601同于存储计算机指令；

处理器602用于执行所述存储器存储的计算机指令，具体执行如本申请任一实施例提供的广告点击概率的预测方法。

本申请实施例提供了一种存储介质，用于存储程序，存储的程序被执行时，用于实现如本申请任一实施例提供的广告点击概率的预测方法。

专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种广告点击概率的预测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述获取多个特征向量，包括：

3.根据权利要求1所述的方法，其特征在于，所述计算所述特征向量中的任意两个特征向量对应的交互特征向量，包括：

Z_i＝X_i×Y_i

4.根据权利要求1所述的方法，其特征在于，所述利用所述特征矩阵，计算得到所述待预测用户点击所述待预测广告的概率，包括：

5.根据权利要求4所述的方法，其特征在于，所述基于卷积神经网络，根据所述特征矩阵计算得到所述待预测用户点击所述待预测广告的概率，包括：

通过全连接层将所述点击率预测向量转换成点击率预测值；

6.根据权利要求5所述的方法，其特征在于，所述卷积层包括5个卷积核；

7.一种广告点击概率的预测装置，其特征在于，包括：

8.根据权利要求7所述的装置，其特征在于，所述特征向量获取单元包括：

9.一种服务器，其特征在于，包括处理器和存储器；其中：

所述存储器同于存储计算机指令；

所述处理器用于执行所述存储器存储的计算机指令，具体执行如权利要求1-6中任意一项所述的广告点击概率的预测方法。

10.一种存储介质，其特征在于，用于存储程序，所述程序被执行时，用于实现如权利要求1-6任意一项所述的广告点击概率的预测方法。