CN110020877A

CN110020877A - 点击率的预测方法、点击率的确定方法及服务器

Info

Publication number: CN110020877A
Application number: CN201810018869.7A
Authority: CN
Inventors: 马文晔; 荣钰
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2018-01-09
Filing date: 2018-01-09
Publication date: 2019-07-16
Anticipated expiration: 2038-01-09
Also published as: CN110020877B

Abstract

本发明公开一种点击率的确定方法，包括：获取第一待训练数据，其中，第一待训练数据包含多个样本数据，第一待训练数据对应于第一时刻；根据第一待训练数据确定第一待训练数据对应的梯度；采用第一加权系数对第一待训练数据中每个样本数据所对应的梯度进行加权平均处理，得到第一加权平均梯度；通过第一预测模型以及第一加权平均梯度确定第二时刻所对应的第一模型学习参数，其中，第二时刻为第一时刻之后的一个相邻时刻；通过第二预测模型以及第一模型学习参数确定第二时刻所对应的点击率。本发明还提供一种点击率的确定方法及服务器。本发明在模型训练的过程中充分考虑到随着时间变化而变化的用户偏好和点击内容，使得模型具有更好的预测性能。

Description

点击率的预测方法、点击率的确定方法及服务器

技术领域

本发明涉及计算机技术领域，尤其涉及点击率的预测方法、点击率的确定方法及服务器。

背景技术

点击率通常是指网站页面上某一内容被点击的次数与被显示次数之比，点击率表示为百分比，用于反映网页上某一内容的受关注程度，经常用来衡量广告的吸引程度。为了预测某个内容的受关注程度，可以采用点击率预测模型进行预测。

目前，对于大型的在线内容(广告和新闻等)推荐系统而言，大部分是基于逻辑回归(Logistic Regression，LR)训练得到的点击率预测模型，将待预测的相关数据输入至模型后，可以输出相应的预测结果。

然而，由于在模型训练的过程中并未考虑到用户偏好和点击内容会随时间的变化而变化，因此并不适用于在线内容推荐的场景中，利用上述模型得到的预测结果与实际情况具有较大偏差性，从而降低了模型的性能

发明内容

本发明实施例提供了一种点击率的预测方法、点击率的确定方法及服务器，可以在模型训练的过程中充分考虑到随着时间变化而变化的用户偏好和点击内容，使得模型具有更好的预测性能。

有鉴于此，本发明第一方面提供了一种点击率的预测方法，包括：

获取待预测的用户数据；

通过第一预测模型确定所述待预测的用户数据所对应的目标模型学习参数，其中，所述第一预测模型表示加权平均梯度与模型学习参数之间的函数关系，所述加权平均梯度与时刻具有关联关系；

通过第二预测模型确定所述目标模型学习参数所对应的目标点击率，其中，所述第二预测模型表示所述模型学习参数与点击率之间的函数关系；

向客户端发送所述目标点击率，其中，所述客户端用于展示所述目标点击率。

本发明第二方面提供了一种点击率的确定方法，包括：

获取第一时刻所对应的第一待训练数据；

根据所述第一待训练数据确定所述第一待训练数据对应的梯度；

采用第一加权系数对所述第一待训练数据对应的梯度进行加权平均处理，得到第一加权平均梯度；

通过第一预测模型以及所述第一加权平均梯度确定第二时刻所对应的第一模型学习参数，其中，所述第二时刻为所述第一时刻之后的一个相邻时刻；

通过第二预测模型以及所述第一模型学习参数确定所述第二时刻所对应的点击率。

本发明第三方面提供了一种服务器，包括：

获取模块，用于获取第一时刻所对应的第一待训练数据；

确定模块，用于根据所述获取模块获取的所述第一待训练数据确定所述第一待训练数据对应的梯度；

处理模块，用于采用第一加权系数对所述确定模块确定的所述第一待训练数据对应的梯度进行加权平均处理，得到第一加权平均梯度；

所述确定模块，用于通过第一预测模型以及所述处理模块处理得到的所述第一加权平均梯度确定第二时刻所对应的第一模型学习参数，其中，所述第二时刻为所述第一时刻之后的一个相邻时刻；

所述确定模块，用于通过第二预测模型以及所述第一模型学习参数确定所述第二时刻所对应的点击率。

本发明第四方面提供了一种服务器，所述服务器包括：存储器、收发器、处理器以及总线系统；

其中，所述存储器用于存储程序；

所述处理器用于执行所述存储器中的程序，包括如下步骤：

获取第一时刻所对应的第一待训练数据；

通过第二预测模型以及所述第一模型学习参数确定所述第二时刻所对应的点击率；

所述总线系统用于连接所述存储器以及所述处理器，以使所述存储器以及所述处理器进行通信。

本发明的第五方面提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述各方面所述的方法。

从以上技术方案可以看出，本发明实施例具有以下优点：

本发明实施例中，提供了一种点击率的确定方法，首先服务器获取第一时刻所对应的第一待训练数据，然后根据第一待训练数据确定第一待训练数据对应的梯度，再采用第一加权系数对第一待训练数据对应的梯度进行加权平均处理，得到第一加权平均梯度，最后通过第一预测模型以及第一加权平均梯度确定第二时刻所对应的第一模型学习参数，通过第二预测模型以及第一模型学习参数确定第二时刻所对应的点击率，其中，第二时刻为第一时刻之后的一个相邻时刻。采用上述方式，对待训练数据产生的梯度进行加权后能够反映出数据的时序特性，在模型训练的过程中能够考虑到随着时间变化而变化的用户偏好和点击内容，从而使得模型具有更好的预测性能。

附图说明

图1为本发明实施例中点击率预测系统的一个架构示意图；

图2为本发明实施例中点击率预测系统的一个拓扑示意图；

图3为本发明实施例中模型训练模块的一个拓扑示意图；

图4为本发明实施例中点击率的预测方法的一个实施例示意图；

图5为本发明实施例中点击率的确定方法的一个实施例示意图；

图6为本发明实施例中服务器一个实施例示意图；

图7为本发明实施例中服务器另一个实施例示意图；

图8为本发明实施例中服务器一个结构示意图。

具体实施方式

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

应理解，本方案可以应用于数字广告营销领域，主要用于预测广告的点击率(Click Through Rate，CTR)，在预测CTR时通常基于历史广告的点击数据以及询问各种特征，通过机器学习模型来预测CTR。预测CTR之前还需要主要包括两大步骤，即为离线步骤和在线步骤，其中离线步骤的目标主要是用于训练出可用模型，而在线部分则考虑模型上线后，性能可能随时间而出现下降，为了弱出现这种情况，可选择使用在线学习来在线更新模型。在线学习算法的特点是，每来一个训练数据，就用该训练数据产生的损失和梯度对模型迭代一次，对一个一个的训练数据地进行训练，因此可以处理大数据量训练和在线训练。而本方案主要也是基于在线学习训练得到用于预测CTR的模型。

请参阅图1，图1为本发明实施例中点击率预测系统的一个架构示意图，如图所示，用户通过终端设备(如手机、平板电脑、掌上电脑以及个人电脑等)向服务器发送用户数据(包括用户的基本信息以及是否点击广告等)，这些用户数据作为待训练数据用于进行模型训练，即服务器对待训练数据进行训练，再根据训练得到的模型预测广告的点击率。

进一步地，请参阅图2，图2为本发明实施例中点击率预测系统的一个拓扑示意图，如图所示，用户向推荐平台发送用户数据，推荐平台即为一个客户端，可以根据用户数据向用户展示广告推荐的结果。首先，用户数据先发送至特征提取模块，该特征提取模块接收内容平台发送的内容数据，内容数据可以是指广告内容，特征提取模块根据用户数据和内容数据生成特征数据，再将特征数据发送至分布式文件系统(Hadoop Distributed FileSystem，HDFS)，HDFS能提供高吞吐量的数据访问，非常适合大规模数据集上的应用。HDFS向模型训练模块提供特征数据，由模型训练模块对特征数据进行训练，并得到相应的模型，该模型通过HDFS发送至推送平台，推荐平台采用该模型可以预测推荐结果，推荐结果可以是CTR。

更进一步地，模型训练模块包括了分布式训练平台，请参阅图3，图3为本发明实施例中模型训练模块的一个拓扑示意图，如图所示，分布式训练平台具体包括了服务器和至少一个计算节点(如计算机)，计算节点用户对按照时间先后顺序流入的待训练数据进行加权平均计算，并向服务器发送计算结果，使得服务器根据计算结果训练得到相应的模型，该模型也是随时间变化更新的。

为了便于理解，下面将结合图4对本发明中点击率的预测的流程进行说明，请参阅图4，图4为本发明实施例中点击率的预测方法的一个实施例示意图，具体地：

101、获取待预测的用户数据；

本实施例中，服务器在当前时刻获取待预测的用户数据，该用户数据包括但不限于用户的性别、年龄、常住地、经济情况和职业等，这些用户数据可以来源于用户填写的资料，也可以来源于广告主提供的材料。

102、通过第一预测模型确定待预测的用户数据所对应的目标模型学习参数，其中，第一预测模型表示加权平均梯度与模型学习参数之间的函数关系，加权平均梯度与时刻具有关联关系；

本实施例中，服务器通过第一预测模型确定待预测的用户数据所对应的目标模型学习参数，其中，第一预测模型是一个随时间变化而发生变化的模型，用于表示加权平均梯度与模型学习参数之间的函数关系，而加权平均梯度则与时刻具有关联关系。

103、通过第二预测模型确定目标模型学习参数所对应的目标点击率，其中，第二预测模型表示模型学习参数与点击率之间的函数关系；

本实施例中，服务器获取到目标模型学习参数之后，将计算得到的当前时刻的目标模型学习参数输入至第二预测模型，由第二预测模型输出下一个时刻的目标点击率，其中，第二预测模型用于表示模型学习参数与点击率之间的函数关系。

104、向客户端发送目标点击率，其中，客户端用于展示目标点击率。

本实施例中，服务器向客户端发送预测得到的目标点击率，客户端可以向用户(如广告主)展示该目标点击率。

下面将从服务器的角度，对本发明中点击率的确定方法进行介绍，请参阅图5，本发明实施例中点击率的确定方法一个实施例包括：

201、获取第一时刻所对应的第一待训练数据；

本实施例中，服务器先获取第一时刻所对应的第一待训练数据，其中，第一时刻即为当前时刻，第一待训练数据中包括多个样本数据，具体地，每个样本数据对应于一个特征向量，

我们可以对用户和内容(新闻或者广告)的交互信息进行量化并且用多维向量进行表示，特征指的是该多维向量中的各个分量。比如样本数据为，“用户A——25岁——女——工程师——点击甲广告”，这一组样本数据可以在数学上表示成一个特征向量，因此第一待训练数据也就包含了多个特征向量。

202、根据第一待训练数据确定第一待训练数据对应的梯度；

本实施例中，服务器根据第一待训练数据中的特征向量进行计算，从而得到第一待训练数据对应的梯度，该梯度也与时间具有关联关系。其中，梯度表示在给定的样本中，预先定义好的函数下降(或上升)最快的方向。

203、采用第一加权系数对第一待训练数据对应的梯度进行加权平均处理，得到第一加权平均梯度；

本实施例中，服务器采用第一加权系数对第一待训练数据对应的梯度进行加权平均处理，并得到第一时刻所对应的第一加权平均梯度。第一加权系数与时间也具有关联关系。

204、通过第一预测模型以及第一加权平均梯度确定第二时刻所对应的第一模型学习参数，其中，第二时刻为第一时刻之后的一个相邻时刻；

本实施例中，服务器将第一时刻所对应的第一加权平均梯度输入至第一预测模型后可以得到第一模型学习参数，其中，第一预测模型表示加权平均梯度与模型学习参数之间的函数关系，加权平均梯度与时刻具有关联关系，而第二时刻为第一时刻之后的一个相邻时刻。

205、通过第二预测模型以及第一模型学习参数确定第二时刻所对应的点击率。

本实施例中，服务器将计算得到的第一模型学习参数和用户数据输入至第二预测模型，第二预测模型可以输出第二时刻所对应的点击率，其中，第二预测模型用于表示模型学习参数与点击率之间的函数关系。至此，完成了点击率的预测。

可选地，在上述图3对应的实施例的基础上，本发明实施例提供的点击率的确定方法第一个可选实施例中，根据第一待训练数据确定第一待训练数据对应的梯度，可以包括：

获取第一待训练数据中样本数据所对应的点击结果；

根据第一待训练数据中样本数据所对应的点击结果计算目标损失函数，其中，目标损失函数与第一时刻的点击率具有关联关系；

根据目标损失函数确定第一待训练数据对应的梯度。

本实施例中，服务器可以获取第一待训练数据中各个样本数据所对应的点击结果，可以用“1”表示用户进行了点击操作，而用“0”表示用户未进行点击操作。接下来服务器根据这些样本数据对应的点击结果来计算目标损失函数，目标损失函数与第一时刻的点击率具有关联关系，其中，目标损失函数是由各个样本数据对应的损失函数加和后的得到的，服务器得到了目标损失函数后，对该目标损失函数求导后即可得到第一待训练数据对应的梯度。下面将以一个简单的示例说明如何得到梯度。

具体地，假设共计有3个时刻的待训练数据，分别对应于第一秒、第二秒和第三秒，在第一秒的时候计算该时刻对应损失函数的梯度为a，此时的目标损失函数的梯度等于第一秒对应的损失函数的梯度a。在第二秒的时候计算该时刻对应的损失函数的梯度为b，此时的目标损失函数的梯度为a+b，其中，a无需再计算一次，而是直接使用第一秒计算得到的损失函数的梯度为a。在第三秒的时候计算该时刻对应损失函数的梯度为c，此时的目标损失函数的梯度为a+b+c，其中，a和b分别在第一秒和第二秒的时候都已进行计算，a和b也就无需再计算一次。

其次，本发明实施例中，介绍了一种根据第一待训练数据确定第一待训练数据对应的梯度的方式，可以获取第一待训练数据中样本数据所对应的点击结果，并根据第一待训练数据中样本数据所对应的点击结果计算目标损失函数，最后对目标损失函数求导以得到梯度。通过上述方式，在计算目标损失函数的时候采用了增量更新的策略，从而降低了计算复杂度，提升了模型训练的效率。

可选地，在上述图3对应的第一个实施例的基础上，本发明实施例提供的点击率的确定方法第二个可选实施例中，根据第一待训练数据中每个样本数据所对应的因变量计算目标损失函数，可以包括：

通过如下方式计算目标损失函数：

l_t(w)＝-y_t log(p_t)+(1-y_t)log(1-p_t)；

其中，L(w)表示目标损失函数，s表示第s个时刻，s为1至第一时刻中的任意时刻，y_t表示第一待训练数据中样本数据所对应的点击结果，l_t(w)表示样本数据的损失函数，p_t表示第一时刻的点击率，t表示第一时刻。

本实施例中，目标损失函数L(w)为多个时刻对应的损失函数加和后得到的，假设第一时刻为第100秒，计算目标损失函数为L(w)，对L(w)求导后得到梯度，然后将梯度与之前99秒得到的梯度进行加权求和，即可得到第1秒至第100秒所对应的梯度。

具体地，l_t(w)还与样本数据所对应的点击结果具有关联关系，其中，样本数据可以如下面表1所示的内容。

表1

其中，用户数据xⁱ表示为m维的特征向量，即y表示点击结果，y等于0的时候表示未点击，y等于1的时候表示已点击。

再次，本发明实施例中，介绍了一种计算目标损失函数的方式，通过具体的计算公式可以计算得到第一时刻对应的目标损失函数。通过上述方式，能够为方案的实现提供可行的方式，从而提升了方案的实用性。

可选地，在上述图3对应的第二个实施例的基础上，本发明实施例提供的点击率的确定方法第三个可选实施例中，采用第一加权系数对第一待训练数据中每个样本数据所对应的梯度进行加权平均处理，得到第一加权平均梯度，可以包括：

通过如下方式计算第一加权平均梯度：

其中，表示第一时刻的第一加权平均梯度，g_s表示第s个时刻第一待训练数据对应的梯度，p_ts表示第一时刻对应的第一加权系数，θ_t表示目标参数，t表示第一时刻。

本实施例中，服务器还会对第一待训练数据对应的梯度g_s进行加权平均，加权平均后得到的结果通常可以反映一组数据的一般水平，可以从横向和纵向两个方面对事物进行分析比较，从而得出结论。在服务器求解第一加权平均梯度之前，还需要获取第一时刻对应的第一加权系数。

其中，第一加权系数与时间具有关联关系，即表示为如下关系：

其中，p_ts表示第一时刻对应的第一加权系数，θ_t表示目标参数，t表示第一时刻。

进一步地，本发明实施例中，介绍了一种计算第一加权平均梯度的方式，通过具体的计算公式可以计算得到第一加权平均梯度。通过上述方式，能够为方案的实现提供可行的方式，从而提升了方案的实用性。

可选地，在上述图3对应的第三个实施例的基础上，本发明实施例提供的点击率的确定方法第四个可选实施例中，θ_t满足如下条件：

或，

其中，θ_t表示目标参数，t表示第一时刻，m表示超参数，m为非0正数。

本实施例中，将介绍两种计算θ_t的方式，且这两种方式可以应用于不同的情形。

情形一、针对一般函数，可以采用如下方式进行计算：

θ_t表示目标参数，t表示第一时刻，m表示超参数，m为非0正数。

情形二、针对强凸函数，可以采用如下方式进行计算：

更进一步地，本发明实施例中，介绍了两种针对不同情况的目标参数计算方式，通过上述方式，一方面可以融入时间参数，得到具有时间意义的目标参数，另一方面提升方案的实用性和灵活性，从能能够根据实际情况对目标参数进行计算。

可选地，在上述图3以及图3对应的第一至第四个实施例中任一项的基础上，本发明实施例提供的点击率的确定方法第五个可选实施例中，通过第一预测模型以及第一加权平均梯度确定第二时刻所对应的第一模型学习参数，可以包括：

通过第一预测模型计算第一模型学习参数：

其中，w_t+1表示第二时刻所对应的第一模型学习参数，w表示第一时刻所对应的模型学习参数，表示第一时刻的第一加权平均梯度，Φ_t(w)表示模型的时序稳定项，R_t(w)表示正则项。

本实施例中，服务器可以采用第一预测模型计算第一模型学习参数，第一预测模型用于表示下一个时刻模型学习参数与当前时刻模型学习参数以及加权平均梯度之间的函数关系。

具体地，服务器通过第一预测模型计算第一模型学习参数：

其中，表示第一时刻的第一加权平均梯度，因此，第一预测模型还可以变形为：

而第一预测模型中的时序稳定项和正则项可以根据实际情况见设置，此处不做限定。

再进一步地，本发明实施例中，介绍了一种计算第一模型学习参数的方式，通过具体的计算公式可以计算得到第二时刻对应的第一模型学习参数。通过上述方式，能够为方案的实现提供可行的方式，从而提升了方案的实用性。

可选地，在上述图3对应的第五个实施例的基础上，本发明实施例提供的点击率的确定方法第六个可选实施例中，通过第二预测模型以及第一模型学习参数确定第二时刻所对应的点击率，可以包括：

通过第二预测模型计算第二时刻所对应的点击率：

其中，p_t+1表示第二时刻所对应的点击率，p_t+1为大于或等于0且小于或等于1的正数，w_t+1表示第二时刻所对应的第一模型学习参数，x_t+1表示第二时刻样本数据中的用户数据。

本实施例中，可以通过第二预测模型确定下一个时刻对应的点击率，其中，第二预测模型用于表示点击率和模型学习参数之间的函数关系。

具体地，服务器需要获取第二时刻样本数据中的用户数据，比如用户的性别、年龄以及常住地等，将这些用户数据表示为特征数据，然后结合第二时刻所对应的第一模型学习参数，即可预测得到第二时刻所对应的点击率。

又进一步地，本发明实施例中，介绍了一种计算第二时刻所对应的点击率的方式，通过具体的计算公式可以计算得到第二时刻对应的点击率。通过上述方式，能够为方案的实现提供可行的方式，从而提升了方案的实用性。

可选地，在上述图3对应的实施例的基础上，本发明实施例提供的点击率的确定方法第七个可选实施例中，还可以包括：

获取第二待训练数据，其中，第二待训练数据包含多个样本数据，第二待训练数据对应于第二时刻；

根据第二待训练数据确定第二待训练数据中样本数据所对应的梯度；

采用第二加权系数对第二待训练数据中样本数据所对应的梯度进行加权平均处理，得到第二加权平均梯度；

根据第二加权平均梯度对第一预测模型以及第二预测模型进行更新，其中，更新后的第二预测模型用于确定第三时刻所对应的点击率，第三时刻为第二时刻之后的一个相邻时刻。

本实施例中，服务器除了可以预测下一个时刻对应点击率，还应该实时地更新第一预测模型和第二预测模型。

具体地，在预测到第二时刻的点击率时，对第二时刻所对应的第二待训练数据进行训练，其中，第二待训练数据包含多个样本数据，且每个样本数据同样包括用户数据以及点击结果，样本数据可采用特征数据进行表示。服务器根据第二待训练数据确定第二待训练数据中样本数据所对应的梯度，再采用第二加权系数对第二待训练数据中样本数据所对应的梯度进行加权平均处理，得到第二加权平均梯度。最后，服务器根据第二加权平均梯度对第一预测模型以及第二预测模型进行更新，其中，更新后的第二预测模型用于确定第三时刻所对应的点击率，第三时刻为第二时刻之后的一个相邻时刻。

其次，本发明实施例中，服务器可以根据当前时刻获取到的待训练数据来更新第一预测模型和第二预测模型。通过上述方式，能够进行在线训练，根据时间的变化来更新预测模型，从而使得模型更趋于合理化和准确化。

下面对本发明中的服务器进行详细描述，请参阅图6，图6为本发明实施例中服务器一个实施例示意图，服务器30包括：

获取模块301，用于获取第一时刻所对应的第一待训练数据；

确定模块302，用于根据所述获取模块301获取的所述第一待训练数据确定所述第一待训练数据对应的梯度；

处理模块303，用于采用第一加权系数对所述确定模块302确定的所述第一待训练数据对应的梯度进行加权平均处理，得到第一加权平均梯度；

所述确定模块302，用于通过第一预测模型以及所述处理模块303处理得到的所述第一加权平均梯度确定第二时刻所对应的第一模型学习参数，其中，所述第二时刻为所述第一时刻之后的一个相邻时刻；

所述确定模块302，用于通过第二预测模型以及所述第一模型学习参数确定所述第二时刻所对应的点击率。

本实施例中，获取模块301获取第一时刻所对应的第一待训练数据，确定模块302根据所述获取模块301获取的所述第一待训练数据确定所述第一待训练数据对应的梯度，处理模块303采用第一加权系数对所述确定模块302确定的所述第一待训练数据对应的梯度进行加权平均处理，得到第一加权平均梯度，所述确定模块302通过第一预测模型以及所述处理模块303处理得到的所述第一加权平均梯度确定第二时刻所对应的第一模型学习参数，其中，所述第二时刻为所述第一时刻之后的一个相邻时刻，所述确定模块302通过第二预测模型以及所述第一模型学习参数确定所述第二时刻所对应的点击率。

可选地，在上述图6所对应的实施例的基础上，本发明实施例提供的服务器30的另一实施例中，

所述确定模块302，具体用于获取所述第一待训练数据中样本数据所对应的点击结果；

根据所述第一待训练数据中样本数据所对应的点击结果计算目标损失函数，其中，所述目标损失函数与所述第一时刻的点击率具有关联关系；

根据所述目标损失函数确定所述第一待训练数据对应的梯度。

所述确定模块302，具体用于通过如下方式计算所述目标损失函数：

l_t(w)＝-y_t log(p_t)+(1-y_t)log(1-p_t)；

其中，所述L(w)表示所述目标损失函数，所述s表示第s个时刻，所述s为1至所述第一时刻的任意时刻，所述y_t表示所述第一待训练数据中样本数据所对应的点击结果，所述l_t(w)表示样本数据的损失函数，所述p_t表示所述第一时刻的点击率，所述t表示所述第一时刻。

所述确定模块302，具体用于通过如下方式计算所述第一加权平均梯度：

其中，所述表示第一时刻的所述第一加权平均梯度，所述g_s表示所述第s个时刻所述第一待训练数据对应的梯度，所述p_ts表示所述第一时刻对应的所述第一加权系数，所述θ_t表示目标参数，所述t表示所述第一时刻。

可选地，在上述图6所对应的实施例的基础上，本发明实施例提供的服务器30的另一实施例中，θ_t满足如下条件：

或，

其中，所述θ_t表示目标参数，所述t表示所述第一时刻，所述m表示超参数，所述m为非0正数。

所述确定模块302，具体用于通过所述第一预测模型计算所述第一模型学习参数：

其中，所述w_t+1表示所述第二时刻所对应的第一模型学习参数，所述w表示所述第一时刻所对应的模型学习参数，所述表示第一时刻的所述第一加权平均梯度，所述Φ_t(w)表示模型的时序稳定项，所述R_t(w)表示正则项。

所述确定模块302，具体用于通过所述第二预测模型计算所述第二时刻所对应的点击率：

其中，所述p_t+1表示所述第二时刻所对应的点击率，所述p_t+1为大于或等于0且小于或等于1的正数，所述w_t+1表示所述第二时刻所对应的所述第一模型学习参数，所述x_t+1表示所述第二时刻样本数据中的用户数据。

可选地，在上述图6所对应的实施例的基础上，请参阅图7，本发明实施例提供的服务器30的另一实施例中，服务器30还包括更新模块304；

所述获取模块301，还用于获取第二待训练数据，其中，所述第二待训练数据包含多个样本数据，所述第二待训练数据对应于所述第二时刻；

所述确定模块302，还用于根据所述获取模块获取的所述第二待训练数据确定所述第二待训练数据中样本数据所对应的梯度；

所述处理模块303，还用于采用第二加权系数对所述确定模块确定的所述第二待训练数据中样本数据所对应的梯度进行加权平均处理，得到第二加权平均梯度；

更新模块304，用于根据所述处理模块303处理得到的所述第二加权平均梯度对所述第一预测模型以及所述第二预测模型进行更新，其中，更新后的所述第二预测模型用于确定第三时刻所对应的点击率，所述第三时刻为所述第二时刻之后的一个相邻时刻。

图8是本发明实施例提供的一种服务器结构示意图，该服务器400可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(central processingunits，CPU)422(例如，一个或一个以上处理器)和存储器432，一个或一个以上存储应用程序442或数据444的存储介质430(例如一个或一个以上海量存储设备)。其中，存储器432和存储介质430可以是短暂存储或持久存储。存储在存储介质430的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器422可以设置为与存储介质430通信，在服务器400上执行存储介质430中的一系列指令操作。

服务器400还可以包括一个或一个以上电源426，一个或一个以上有线或无线网络接口450，一个或一个以上输入输出接口458，和/或，一个或一个以上操作系统441，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等等。

上述实施例中由服务器所执行的步骤可以基于该图8所示的服务器结构。

其中，处理器422用于执行如下步骤：

获取第一时刻所对应的第一待训练数据；

其中，处理器422具体用于执行如下步骤：

获取所述第一待训练数据中样本数据所对应的点击结果；

其中，处理器422还用于执行如下步骤：

获取第二待训练数据，其中，所述第二待训练数据包含多个样本数据，所述第二待训练数据对应于所述第二时刻；

根据所述第二待训练数据确定所述第二待训练数据中样本数据所对应的梯度；

采用第二加权系数对所述第二待训练数据中样本数据所对应的梯度进行加权平均处理，得到第二加权平均梯度；

根据所述第二加权平均梯度对所述第一预测模型以及所述第二预测模型进行更新，其中，更新后的所述第二预测模型用于确定第三时刻所对应的点击率，所述第三时刻为所述第二时刻之后的一个相邻时刻。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本发明所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种点击率的预测方法，其特征在于，包括：

获取待预测的用户数据；

2.一种点击率的确定方法，其特征在于，包括：

获取第一时刻所对应的第一待训练数据；

3.根据权利要求2所述的方法，其特征在于，所述根据所述第一待训练数据确定所述第一待训练数据对应的梯度，包括：

获取所述第一待训练数据中样本数据所对应的点击结果；

4.根据权利要求3所述的方法，其特征在于，所述根据所述第一待训练数据中每个样本数据所对应的因变量计算目标损失函数，包括：

通过如下方式计算所述目标损失函数：

l_t(w)＝-y_t log(p_t)+(1-y_t)log(1-p_t)；

5.根据权利要求4所述的方法，其特征在于，所述采用第一加权系数对所述第一待训练数据中每个样本数据所对应的梯度进行加权平均处理，得到第一加权平均梯度，包括：

通过如下方式计算所述第一加权平均梯度：

6.根据权利要求5所述的方法，其特征在于，所述θ_t满足如下条件：

或，

7.根据权利要求2至6中任一项所述的方法，其特征在于，所述通过第一预测模型以及所述第一加权平均梯度确定第二时刻所对应的第一模型学习参数，包括：

通过所述第一预测模型计算所述第一模型学习参数：

8.根据权利要求7所述的方法，其特征在于，所述通过第二预测模型以及所述第一模型学习参数确定第二时刻所对应的点击率，包括：

通过所述第二预测模型计算所述第二时刻所对应的点击率：

9.根据权利要求2所述的方法，其特征在于，所述方法还包括：

10.一种服务器，其特征在于，包括：

获取模块，用于获取第一时刻所对应的第一待训练数据；

11.根据权利要求10所述的服务器，其特征在于，所述服务器还包括更新模块；

所述获取模块，还用于获取第二待训练数据，其中，所述第二待训练数据包含多个样本数据，所述第二待训练数据对应于所述第二时刻；

所述确定模块，还用于根据所述获取模块获取的所述第二待训练数据确定所述第二待训练数据中样本数据所对应的梯度；

所述处理模块，还用于采用第二加权系数对所述确定模块确定的所述第二待训练数据中样本数据所对应的梯度进行加权平均处理，得到第二加权平均梯度；

更新模块，用于根据所述第二加权平均梯度对所述第一预测模型以及所述第二预测模型进行更新，其中，更新后的所述第二预测模型用于确定第三时刻所对应的点击率，所述第三时刻为所述第二时刻之后的一个相邻时刻。

12.一种服务器，其特征在于，所述服务器包括：存储器、收发器、处理器以及总线系统；

其中，所述存储器用于存储程序；

所述处理器用于执行所述存储器中的程序，包括如下步骤：

获取第一时刻所对应的第一待训练数据；

13.根据权利要求12所述的服务器，其特征在于，所述处理器具体用于执行如下步骤：

获取所述第一待训练数据中样本数据所对应的点击结果；

14.根据权利要求12所述的服务器，其特征在于，所述处理器还用于执行如下步骤：

15.一种计算机可读存储介质，包括指令，当其在计算机上运行时，使得计算机执行如权利要求2至9中任一项所述的方法。