CN113763000A

CN113763000A - 对象点击量的确定方法及装置

Info

Publication number: CN113763000A
Application number: CN202010840747.3A
Authority: CN
Inventors: 唐晔; 韩卫召
Original assignee: Beijing Wodong Tianjun Information Technology Co Ltd
Current assignee: Beijing Wodong Tianjun Information Technology Co Ltd
Priority date: 2020-08-20
Filing date: 2020-08-20
Publication date: 2021-12-07

Abstract

本申请实施例提供一种对象点击量的确定方法及装置，该方法包括：获取第一时段和第一对象在第一时段的属性信息。确定属性信息对应的特征向量。将第一时段和特征向量输入至第一模型，以使第一模型输出第一对象在第一时段内的点击量。通过获取第一时段和第一对象在第一时段的属性信息，并且通过根据多组样本学习得到的第一模型对第一时段和属性信息对应的特征向量进行处理，从而得到第一模型预测的第一对象在第一时段内的点击量，通过学习后的模型进行处理，从而能够有效保证预测得到的点击量的准确性。

Description

对象点击量的确定方法及装置

技术领域

本申请实施例涉及计算机领域，尤其涉及一种对象点击量的方法及装置。

背景技术

互联网广告是在广告平台上，通过图片、文本、视频等各种形式，对广告进行展示的一种广告运作方式。

目前，广告主在投放广告之前，都会对广告位进行一定的了解，从而制定投放策略，例如现有技术中可以获取广告位的历史点击量，并人工的对未来的点击量进行预测，例如某个广告位的历史点击量较多，广告主可能就预测该广告位未来的点击量也比较多。

然而，人工的根据历史点击量进行预测的实现方式，无法保证预测的点击量的准确性。

发明内容

本申请实施例提供一种对象点击量的方法及装置，以克服无法保证预测的点击量的准确性的问题。

第一方面，本申请实施例提供一种对象点击量的确定方法，包括：

获取第一时段和第一对象在所述第一时段的属性信息；

确定所述属性信息对应的特征向量；

将所述第一时段和所述特征向量输入至所述第一模型，以使所述第一模型输出所述第一对象在所述第一时段内的点击量；

其中，所述第一模型为对多组样本进行学习得到的，每组样本包括样本对象的样本属性信息和所述样本对象在样本时段内的样本点击量。

在一种可能的设计中，所述第一对象在所述第一时段的属性信息包括如下信息中的至少一种：

所述第一对象在至少一个第二时段的点击量，所述第二时段为位于所述第一时段之前的时段；

所述第一对象对应的第一预算信息；

所述第一对象在第三时段的第二预算信息，所述第三时段为所述第一时段之前的时段；

所述第一对象在前一天的所述第一时段的点击量；

所述第一对象在前两天的所述第一时段的点击量；

所述第一时段的类型，所述第一时段的类型为促销时段和非促销时段。

在一种可能的设计中，所述第一模型的生成步骤至少包括：

获取多个样本对象的历史数据，所述历史数据包括如下信息中的至少一种：所述样本对象在多个历史时段内的点击量、所述样本对象在所述多个历史时段内的预算信息、多个历史时段的类型；

根据所述多个样本对象的历史数据确定多组样本；

对所述多组样本进行学习，得到所述第一模型。

在一种可能的设计中，针对所述多个样本对象中的任意一个第一样本对象；根据所述第一样本对象的历史数据确定所述第一样本对象对应的多组样本，包括：

确定多个样本时段；

在所述第一样本对象的历史数据中，分别获取每个样本时段对应的样本属性信息和所述第一样本对象在每个样本时段的样本点击量；

根据每个样本时段对应的样本属性信息和所述第一样本对象在每个样本时段的样本点击量，确定所述第一样本对象对应的多组样本。

在一种可能的设计中，对所述多组样本进行学习，得到所述第一模型，包括：

确定每组样本中的样本属性信息对应的样本特征向量；

将每组样本中的样本属性信息更新为对应的样本特征向量，得到更新后的多组样本；

对更新后的多组样本进行学习，得到所述第一模型。

通过初始模型对所述多组样本中的样本属性信息进行处理，得到每个样本属性信息对应的预测点击量；

根据每个样本属性信息对应的预测点击量和样本点击量对所述初始模型的模型参数进行调整处理；

重复执行上述两个步骤，直至所述初始模型满足收敛条件时，得到所述第一模型。

在一种可能的设计中，根据每个样本属性信息对应的预测点击量和样本点击量对所述初始模型的模型参数进行调整处理，包括：

根据每个样本属性信息对应的预测点击量和样本点击量，对所述模型参数并行的进行多种调整，得到多个目标模型参数。

在一种可能的设计中，所述方法还包括：

获取通过第一模型确定得到的至少一个对象在至少一个时段内的多个预测点击量；

获取所述至少一个对象在所述至少一个时段内的真实点击量；

根据所述多个预测点击量和所述多个真实点击量，确定所述第一模型的精确度。

在一种可能的设计中，根据所述多个预测点击量和所述多个真实点击量，确定所述第一模型的精确度之后，还包括：

在所述第一模型的精确度小于预设阈值时，更新所述第一模型。

第二方面，本申请实施例提供一种对象点击量的确定装置，包括：

获取模块，用于获取第一时段和第一对象在所述第一时段的属性信息；

处理模块，用于确定所述属性信息对应的特征向量；

所述处理模块，还用于将所述第一时段和所述特征向量输入至所述第一模型，以使所述第一模型输出所述第一对象在所述第一时段内的点击量；

所述第一对象对应的第一预算信息；

所述第一对象在前一天的所述第一时段的点击量；

所述第一对象在前两天的所述第一时段的点击量；

在一种可能的设计中，所述第一模型的生成步骤至少包括：

根据所述多个样本对象的历史数据确定多组样本；

对所述多组样本进行学习，得到所述第一模型。

在一种可能的设计中，针对所述多个样本对象中的任意一个第一样本对象；所述处理模块还用于：

确定多个样本时段；

在一种可能的设计中，所述处理模块还用于：

确定每组样本中的样本属性信息对应的样本特征向量；

对更新后的多组样本进行学习，得到所述第一模型。

在一种可能的设计中，所述处理模块还用于：

在一种可能的设计中，所述处理模块具体用于：

在一种可能的设计中，所述获取模块还用于：

所述处理模块还用于：

在一种可能的设计中，所述处理模块还用于：

在根据所述多个预测点击量和所述多个真实点击量，确定所述第一模型的精确度之后，在所述第一模型的精确度小于预设阈值时，更新所述第一模型。

第三方面，本申请实施例提供一种对象点击量的确定设备，包括：

存储器，用于存储程序；

处理器，用于执行所述存储器存储的所述程序，当所述程序被执行时，所述处理器用于执行如上第一方面以及第一方面各种可能的设计中任一所述的方法。

第四方面，本申请实施例提供一种计算机可读存储介质，包括指令，当其在计算机上运行时，使得计算机执行如上第一方面以及第一方面各种可能的设计中任一所述的方法。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的广告位的实现方式示意图；

图2为本申请实施例提供的对象点击量的确定方法的流程图；

图3为本申请又一实施例提供的对象点击量的确定方法的流程图；

图4为本申请实施例提供的确定第一模型的精确度的流程图；

图5为本申请实施例提供的对象点击量的确定方法的流程示意图；

图6为本申请实施例提供的对象点击量的确定装置的结构示意图；

图7为本申请实施例提供的对象点击量的确定设备的硬件结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

为了便于理解，首先，对本申请所涉及的概念进行说明。

互联网广告：是指通过网站、网页、互联网应用程序等互联网媒介，以文字、图片、音频、视频或者其他形式，直接或者间接地推销商品或者服务的商业广告，其中，互联网广告是通过在广告平台上投放广告，从而触达互联网用户的一种新型的广告运作方式。

广告主：广告主是广告活动的发起者，是在网上销售或宣传自己产品和服务的商家，是联盟营销广告的提供者。任何推广、销售其产品或服务的商家都可以作为广告主。通俗的理解，广告主就是在广告位中投放广告的一方。

svm：支持向量机(Support Vector Machine，svm)是一类按监督学习方式对数据进行二元分类的广义线性分类器，其决策边界是对学习样本求解的最大边距超平面。在人像识别、文本分类等模式识别问题中有得到应用。将svm由分类问题推广至回归问题可以得到支持向量回归。

核函数：用于svm通过某非线性变换

将输入空间映射到高维特征空间。其中，特征空间的维数可能非常高，如果svm的求解只用到内积运算，而在低维输入空间又存在某个函数K(x,x′)，它恰好等于在高维空间中这个内积，即

那么svm就不用计算复杂的非线性变换，而由这个函数K(x,x′)直接得到非线性变换的内积，从而在很大程度上简化了计算，其中，上述介绍的K(x,x′)这样的函数即称为核函数。

下面结合图1对广告位的一种可能的实现方式进行介绍，图1为本申请实施例提供的广告位的实现方式示意图。

如图1所示，当前图1示例性的给出了一个网站的页面，在该网站的页面中包括页面的内容，以及包括至少一个广告位，在各个广告位中可以显示广告主投放的广告，或者在某个广告位没有投放的广告时，可以显示广告位招租的信息。

上述图1介绍的是网页中的广告位，在另一种可能的实现方式中，目前的应用程序的界面中也可以包括至少一个广告位，本实施例对广告位的具体实现方式不做限制，凡是图形用户界面中用于投放和显示广告的控件，均可以作为本实施例中的广告位。

目前，广告主在投放广告之前，都会对网站或者应用内的广告位的广告效果进行大体的了解，从而制定自己的投放策略。

在显示广告的过程中，用户可以对广告位中的信息进行点击，其中，广告位上的每次点击能充分体现真实的流量，和潜在的订单量，从而影响广告主的投放策略。因此为了帮助广告主进行投放策略的分析，从而进行精准的进行广告的投放，增大广告投放的效果，现有技术通常会采取一定的策略，对未来时间节点的广告位的点击量进行预估，以便于广告主针对性的进行广告投放。

目前，现有技术在对广告位的点击量进行预估时，通常是获取广告位的历史点击量，并通过人工的方式对未来的点击量进行预测，例如某个广告位的历史点击量较多，广告主可能就预测该广告位未来的点击量也比较多，从而在该广告位进行广告的投放。然而，人工预测的方式无法保证预测的点击量的准确性。

针对现有技术中的问题，本申请提出了如下技术构思：通过第一模型根据广告位的各个时段的属性信息进行预估处理，以得到预测的点击量，其中第一模型是根据历史点击数据训练得到的，因此可以有效保证预测的点击量的准确性。

下面结合具体的实施例对本申请提供的对象点击量的确定方法进行介绍，需要说明的是，本申请中各实施例的执行主体可以为服务器、处理器等具有数据处理功能的组件，本实施例对此不做限制，只要可以进行数据处理即可。

图2为本申请实施例提供的对象点击量的确定方法的流程图。

如图2所示，该方法包括：

S201、获取第一时段和第一对象在第一时段的属性信息。

在本实施例中，第一对象可以为上述介绍的广告位，或者在其余可能的实现方式中，第一对象还可以为网页中的可点击的元素，或者第一对象还可以为应用程序中的可点击的元素。

本实施例可以预测在未来时段内对第一对象的点击量，因此只要是可点击的元素，就都可以作为本实施例中的第一对象，此处对第一对象的具体实现方式不做特别限制。

下面以第一对象是广告位为例，在一种可能的实现方式中，可以按照时段统计广告位的点击量和相关信息，例如以半个小时为单位，统计各个时段内的广告位的点击量和相关信息，或者还可以为一个小时为单位等，或者还可以划分时长不等的多个时段，本实施例对时段划分的具体实现方式不做限制，其可以根据实际需求进行安泽。

可以理解的是，广告主在投放广告的时候，会确定投放广告的广告位，同时还会确定投放广告的时段，例如广告主确定投放广告位A，其例如可投放点击量最高的时段；或者出于成本考虑，其还可以选择投放点击量居中的时段，因此本实施例中在预测广告位的点击量时，应该是预测某个目标时段的点击量。

本实施例中的第一时段是需要预测第一对象的点击量的目标时段，第一时段可以是多个时段中的任意一个，其是根据实际需求选择的，例如当前需要预测13:00:00-13:09:59这一时段的点击量，则第一时段就可以是13:00:00-13:09:59。

在本实施例中，第一对象在第一时段的属性信息用于指示第一对象在第一时段的相关属性，其例如可以包括第一对象在第一时段对应的至少一个历史时段的点击量，从而可以根据历史时段的点击量确定当前第一时段的点击量；或者，第一时段的属性信息还例如可以包括第一时段的预算信息，预算信息例如可以为广告主的投入预算，或者第一时段的属性信息还可以包括第一时段的类型，第一时段的类型例如可以为促销时段或者非促销时段。

在实际时段过程中，第一对象的属性信息可以根据实际需求包括上述信息中的至少一种，或者第一对象的属性信息还可以包括任意的可以指示第一对象的点击量的信息，本实施例对第一对象的属性信息不做限制。

S202、确定属性信息对应的特征向量。

在本实施例中，属性信息例如可以包括如下信息中的至少一种：

d：第一对象在至少一个第二时段的点击量，第二时段为位于第一时段之前的时段；

b₁：第一对象对应的第一预算信息；

c₁：第一对象在第三时段的第二预算信息，第三时段为第一之前的时段；

y₁：第一对象在前一天的第一时段的点击量；

y₂：第一对象在前两天的第一时段的点击量；

p₁：第一时段的类型，第一时段的类型为促销时段和非促销时段。

i₁：第一时段的前一个时段中第一对象中的广告展示数。

下面以第一对象是广告位为例，对第一对象的属性信息的可能的实现方式进行介绍：

上述介绍的至少一个第二时段例如可以包括第一时段之前相邻的4个时段，则d可以包括d₁，d₂，d₃，d₄，分别用于表示第一对象在第一时段相邻的前4个时段的点击量，其中第一预算信息例如可以为广告主的广告预算，则b₁表示广告主的广告预算，其中第三时段例如可以为第一时段相邻的前一个时段，第二预算信息例如可以为投放消耗，则c₁可以表示第一时段的前一个时段广告主的投放消耗，其中p₁表示第一时段的类型。例如0表示第一时段的类型为非促销时段，1表示第一时段的类型为促销时段，以及上述的i₁表示的广告展示数可以理解为第一对象中展示的广告被浏览的次数。

在本实施例中，第一模型例如可以为svm模型，基于广告系统中的数据的特征，以及根据svm模型的特征向量的设计模式，可以确定属性信息对应的特征向量，以便于之后svm模型根据特征向量进行数据处理。

上述介绍的属性信息包括b₁，c₁，y₁，y₂，d₁，d₂，d₃，d₄，p₁，i₁，则特征向量的实现方式例如可以为：x_i＝{b₁，c₁，y₁，y₂，d₁，d₂，d₃，d₄，p₁，i₁}，其中，x_i为特征向量。

下面结合一个具体的示例对确定属性信息对应的特征向量的实现方式进行介绍：

例如，当前的第一对象为广告位A，第一时段为13:00:00-13:09:59，假设该时段处于促销阶段，则第一时段的类型为促销时段，则p₁为1。

其中，第一时段的前4个时段该广告位A的点击量为：

d₁：12:50:00-12:59:59的点击量为224210次；

d₂：12:40:00-12:49:59的点击量为261523次；

d₃：12:30:00-12:39:59的点击量为246819次；

d₄：12:30:00-12:39:59的点击量为238449次；

以及，假设当前广告主对于广告位A的广告预算为2067446元，则b₁为2067446。

以及，假设在第一时段的前一时段12:50:00-12:59:59的实际消耗为89684元，则c₁为89684。

以及，假设前一天广告位A在第一时段13:00:00-13:09:59的点击量为269454次，则y₁为269454。

以及，假设前两天广告位A在第一时段13:00:00-13:09:59的点击量为261617次，则y₂为269454。

以及，前一个时间段12:50:00-12:59:59广告位A中的广告展示数23205583次，可以表明在12:50:00-12:59:59这个时段内广告位A中的战术的广告被浏览了23205583次，可以理解的是，一个用户看到一次这个广告位，即可以即为一次展示数，则i₁为23205583。

基于上述内容，可以得出当前属性信息对应的特征向量为：

x_i＝{2067446,89684,269454,261617,224210,261523,246819,238449,1,23205583}

在实际实现过程中，属性信息所包括的内容可以根据实际需求进行选择，例如属性信息还可以包括第一对象在前三天的第一时段的点击量等，则对应的特征向量所包括的内容也可以进行适应性的扩展，以及特征向量中各个数据的顺序同样可以根据实际需求进行选择，本实施例对此不做限制。

S203、将第一时段和特征向量输入至第一模型，以使第一模型输出第一对象在第一时段内的点击量。

在本实施例中，第一模型为根据第一时段和属性信息预测点击量的模型，则可以通过第一模型对第一时段和属性信息进行处理，从而得到第一对象在第一时段内的点击量。

其中，第一模型为对多组样本进行学习得到的，每组样本包括样本对象的样本属性信息和样本对象在样本时段内的样本点击量。

样本属性信息与上述介绍的第一对象的属性信息类似，不同之处在于，样本属性信息是用于对第一模型进行训练的，而第一对象的属性信息是用于第一模型进行处理以输出预测点击量的，以及本实施例中的每组样本中还包括样本对象在样本时段内样本点击量，可以理解的是，样本点击量是样本对象在样本时段的实际的点击量，通过根据样本对象在原本时段的历史点击量供第一模型进行学习，从而能够有效保证第一模型输出的预测点击量的准确率和可靠性。

在本实施例中，在得到特征向量之后，可以将第一时段和特征向量输入至第一模型，第一模型可以根据特征向量进行处理，从而输出第一对象在第一时段内的点击量。

在一种可能的实现方式中，本实施例中的第一模型例如可以为svm模型，则上述介绍的特征向量例如可以为svm_node，最终输出的预测的点击量可以为标签label。

或者，第一模型还可以为任意的根据属性信息和第一时段输出预测的点击量的模型，本实施例中对第一模型中的具体执行逻辑不做限制，只要第一模型可以根据属性信息和第一时段输出预测的点击量即可。

本申请实施例提供的对象点击量的确定方法，包括：获取第一时段和第一对象在第一时段的属性信息。确定属性信息对应的特征向量。将第一时段和特征向量输入至第一模型，以使第一模型输出第一对象在第一时段内的点击量。通过获取第一时段和第一对象在第一时段的属性信息，并且通过根据多组样本学习得到的第一模型对第一时段和属性信息对应的特征向量进行处理，从而得到第一模型预测的第一对象在第一时段内的点击量，通过学习后的模型进行处理，从而能够有效保证预测得到的点击量的准确性。

以及，其中确定特征向量能够有效的保证输入至第一模型的数据的规范性和可处理性，从而有效提升第一模型输出的点击量的准确性和效率。

在上述实施例的基础上，本实施例中的第一模型是对多组样本进行学习从而生成的，下面结合具体的实施例对第一模型的生成的可能的实现方式进行介绍，图3为本申请又一实施例提供的对象点击量的确定方法的流程图。

如图3所示，该方法包括：

S301、获取多个样本对象的历史数据，历史数据包括如下信息中的至少一种：样本对象在多个历史时段内的点击量、样本对象在多个历史时段内的预算信息、多个历史时段的类型。

在本实施例中，在第一模型进行学习时，需要多组样本作为训练数据，因此在本实施例中，可以获取多个样本对象的历史数据，其中多个样本对象例如可以为多个广告位，通过获取多个样本对象的历史数据，从而能够保证样本数据的充足。

在一种可能的实现方式中，例如可以从广告系统中获取多个样本对象的历史数据，或者还可以从相关的数据网站上获取用于模型训练的历史数据。

其中，样本对象的历史数据与上述介绍的属性信息类似，样本对象的历史数据例如可以包括样本对象在多个历史时段内的点击量、样本对象在多个历史时段内的预算信息，多个历史时段的类型。

或者，样本对象的历史数据还可以包括任意的与样本对象相关的数据，凡是与样本对象相关的，并且是在当前时刻之前产生的数据，均可以作为本实施例中的历史数据，此处对历史数据的具体实现方式不做特别限制。

在一种可能的实现方式中，在获取到历史数据之后，可以对历史数据进行清洗和预处理，其中清洗和预处理的操作例如可以包括如下操作中的至少一种：归类处理、缺失值填补处理、异常噪声数据的分辨、剔除处理。

通过对获取的样本对象的历史数据进行清洗和预处理，能够有效保证数据的规范性，从而提升后续数据处理的效率。

S302、根据多个样本对象的历史数据确定多组样本。

在本实施例中，要对第一模型进行训练，则需要确定训练数据，例如可以确定多组样本。

当前存在多个样本对象，其中针对每一个样本对象均可以确定至少一个样本，从而确定多组样本，下面针对多组样本对象中的任意一个第一样本对象为例，对确定样本的实现方式进行说明，各个样本对象的实现方式类似。

其中，针对第一样本对象，可以确定多个样本时段，其中样本时段与上述介绍的第一时段类似，不同之处在于，此处的样本时段是用于第一模型进行学习的，其中确定的样本时段的数量，以及确定的样本时段的时间等，均可以根据实际需求进行选择。

在确定多个样本时段之后，可以在第一样本对象的历史数据中，分别获取每个样本时段对应的样本属性信息和第一样本对象在每个样本时段的样本点击量。

其中，样本属性信息与上述介绍的属性信息类似，此处不再赘述，以及本实施例中，因为获取的是第一样本对象的历史数据，因此可以确定第一样本对象在每个样本时段的样本点击量，也就是实际发生的点击量，以便第一模型根据此进行模型的学习。

在得到上述介绍的样本属性信息和样本点击量之后，就可以根据每个样本时段对应的样本属性信息和第一样本对象在每个样本时段的样本点击量，确定第一样本对象对应的多组样本。

其中，每组样本中即包括样本属性信息和样本点击量。

在一种可能的实现方式中，第一模型可以为svm模型，则多组样本例如可以为多个svm_node，因为svm模型支持特征向量，因此本实施例中还可以确定样本属性信息对应的样本特征向量，其实现方式与上述S202介绍的确定属性信息对应的特征向量的实现方式类似，此处不再赘述。

在确定特征向量之后，可以将样本中的样本属性信息更新为对应的特征向量，从而得到多组样本，即多个svm_node，此时每个svm_node包括一个特征向量和一个特征标签。

其中特征向量例如可以为上述介绍的：

x_i＝{b₁，c₁，y₁，y₂，d₁，d₂，d₃，d₄，p₁，i₁}

以及特征标签例如可以用label表示，在一个示例性的介绍中，若广告位A在样本时段13:00:00-13:09:59实际发生的点击量为278467次，则svm_node中的的特征标签可以为label＝278467。

S303、对多组样本进行学习，得到第一模型。

在得到多组样本之后，就可以将得到的多组样本作为训练数据进行小背心，从而得到训练后的第一模型。

下面对第一模型学习的一种可能的实现方式进行说明，对多组样本进行学习，得到第一模型例如可以包括：

通过初始模型对多组样本中的样本属性信息进行处理，得到每个样本属性信息对应的预测点击量。

根据每个样本属性信息对应的预测点击量和样本点击量对初始模型的模型参数进行调整处理。

重复执行上述初始模型处理和对模型参数进行调整处理的步骤，直至初始模型满足收敛条件时，得到第一模型。

其中，收敛条件例如可以为预测点击量和样本点击量的差值小于预设阈值，或者收敛条件还可以为第一模型输出的准确率大于预设阈值，其中收敛条件是用于指示模型是否训练完成的，其具体实现方式可以根据实际需求进行选择。

本实施例中会对初始模型的模型参数进行调整处理，以提升初始模型输出的结构的准确性，在一种可能的实现方式中，例如可以对svm模型的惩罚因子C进行调整；或者，在另一种可能的实现方式中，例如可以对核函数以及核函数的参数进行调整。

下面首先对核函数和核函数的参数进行说明：

基于上述介绍可以确定的是，svm模型在处理数据的过程中会运用到核函数，在一种可能的实现方式中，在模型训练的过程中，本申请可以对多个核函数均进行试验，通过对比第一模型的训练过程中的输出结果，从而选取表现最优的核函数，例如可以选取输出的点击量的准确率最高的核函数。

其中，核函数例如可以分为线性核函数、高斯核函数、以及多项式核函数，例如本实施例中经过试验之后可以选取高斯核函数，其中高斯核函数例如可以满足如下公式一：

其中，x表示空间中的点，z表示核函数中心，γ为高斯核函数的参数，e为运算符号，K(x，z)为高斯核函数的函数值。

本实施例中通过试验对比选取表现最优的核函数，从而能够有效提高svm模型的预测准确度，同时对于试验选定的核函数类型，还可以进行svm模型的参数调优，例如对上述的高斯核函数的参数γ进行调整试验，以得到表现最优的目标参数，从而得出最优的预测准确度。

基于上述介绍可以确定的是，本实施例中可以对svm模型的惩罚因子C进行调整，还可以对核函数进行调整，还可以对核函数的参数γ进行调整。

其中，例如将惩罚因子C调整为1，测试模型输出的准确率，还可以将惩罚因子C调整为2，再测试模型输出的准确率，核函数以及核函数的参数类似，为了提升模型的处理效率，本实施例中可以对多个不同的模型参数取值进行并行的调整，从而得到多个目标模型参数。

例如针对C取值为1、C取值为2、C取值为3、…，以及γ取值为1、γ取值为2、γ取值为3、…，等多种情况，可以将多种模型参数的取值并行的进行处理，以提升模型的处理效率，在一种可能的实现方式中，例如可以通过基于spark的处理单元实现模型参数的调整过程，因为spark支持并行处理，从而能够有效的实现并行的调整模型参数。

本申请实施例提供的对象点击量的确定方法，包括：获取多个样本对象的历史数据，历史数据包括如下信息中的至少一种：样本对象在多个历史时段内的点击量、样本对象在多个历史时段内的预算信息、多个历史时段的类型。根据多个样本对象的历史数据确定多组样本。对多组样本进行学习，得到第一模型。通过得到多组样本，从而能够保证第一模型学习的样本的充足，以及在得到多组样本之后，通过对对组样本进行学习，从而得到第一模型，可以有效保证第一模型输出的预测点击量的准确性，本实施例中还通过对核函数进行试验和选择，以及对核函数的参数和模型的参数进行并行化的调整，以在提升模型处理速度的同时，从而得出最优的预测准确度。

在上述实施例的基础上，本申请提供的对象点击量的确定方法中，在第一模型输出第一对象在第一时段内的点击量之后，还可以在第一时段的时间过去之后，对第一模型输出的结果的精确度进行判断，下面对确定第一模型的精确度的实现方式进行说明。

图4为本申请实施例提供的确定第一模型的精确度的流程图，如图4所示，该方法包括：

S401、获取通过第一模型确定得到的至少一个对象在至少一个时段内的多个预测点击量。

在本实施例中，第一模型可以输出第一对象在第一时段内的点击量，以及本实施例中的第一模型可以对多个第一时段和多个第一对象的点击量进行预估，从而可以获取第一模型确定得到的多个预测点击量。

S402、获取至少一个对象在至少一个时段内的真实点击量。

在本实施例中，在对第一模型的精确度进行判断时，上述获取的多个预测点击量对应的第一时段以及过去了，例如在今天开始的时候预测了多个第一对象和多个第一时段的点击量，则可以在今天结束的时候获取这些第一对象在第一时段的真实的点击量，从而可以根据预测点击量和真实点击量得到第一模型的精确度。

S403、根据多个预测点击量和多个真实点击量，确定第一模型的精确度。

在本实施例中，可以根据多个预测点击量和多个真实点击量，得到至少一个指标，用至少一个指标确定第一模型的精确度。

下面对指标的可能的实现方式进行介绍：

在一种可能的实现方式中，可以采用平均相对误差指示第一模型的精确度，其中，平均相对误差例如可以满足如下的公式二：

其中，N为获取的预测点击量的数量，L(i)为真实点击量，L`(i)为预测点击量，e_MRE为平均相对误差。

在另一种可能的实现方式中，可以采用均方根相对误差指示第一模型的精确度，其中，平均相对误差例如可以满足如下的公式三：

其中，N为获取的预测点击量的数量，L(i)为真实点击量，L`(i)为预测点击量，e_RMSE为平均相对误差。

在再一种可能的实现方式中，可以采用根据单个时刻预测结果的误差得到的合格率指示第一模型的精确度，其中，单个时刻预测结果的误差例如可以满足如下的公式四：

其中，L(i)为真实点击量，L`(i)为预测点击量，e_single为单个时刻预测结果的误差。

在得到e_single之后，例如可以确定10％为e_single的判别标准，将一个预测点击量作为一个点，即某个点对应的的e_single>10％，则判定该点对应的预测点击量为不合格，例如可以定义r为本次第一模型输出的预测点击量的合格率，其中合格率r例如可以满足如下公式五：

其中，r为预测结果合格率，P`为e_single≤10％的点的个数，也就是判定预测结果合格的点的个数，P为总的预测点的个数。

在实际实现过程中，例如可以选取上述介绍的预测结果合格率r，平均相对误差e_MRE和均方根相对误差e_RMSE三个指标中的一个或多个作为确定第一模型的精确度的依据；或者还可以根据上述介绍的三个指标各自对应的权重，综合得到一个精确度值，该精确度值用于指示第一模型的精确度。

在一种可能的实现方式中，若第一模型的精确度小于预设阈值，例如上述介绍的三个指标中的任一个小于对应的预设阈值，或者上述介绍的精确度值小于预设阈值，则可以确定当前第一模型输出的准确率不满足要求，则可以更新第一模型。

在更新第一模型的一种可能的实现方式中，例如可以对第一模型中的模型参数进行调整，例如通过基于spark的处理单元对第一模型进行模型参数的调整，以提升第一模型输出的预测点击量的准确性，其实现方式与上述图4实施例中介绍的调整模型参数的实现方式类似，此处不再赘述。

本申请实施例提供的对象点击量的确定方法，包括：获取通过第一模型确定得到的至少一个对象在至少一个时段内的多个预测点击量。获取至少一个对象在至少一个时段内的真实点击量。根据多个预测点击量和多个真实点击量，确定第一模型的精确度。在第一模型的精确度小于预设阈值时，更新第一模型。通过根据真实点击量和预测点击量，可以有效的确定第一模型输出的结果的精确度，从而可以在确定第一模型的精确度小于预设阈值时，及时的对第一模型进行更新，从而保证第一模型输出的预测点击量的准确性。

在上述实施例的基础上，下面结合图5对本申请的数据获取、模型训练、模型处理的实现过程进行一个整体的介绍，图5为本申请实施例提供的对象点击量的确定方法的流程示意图。

如图5所示：

图5中以第一模型是svm模型为例进行说明，其余处理模型的实现过程类似，

其中，数据处理单元对广告系统中的相关数据进行收集，其中收集的数据例如可以为属性信息、真实点击量等，并针对收集数据进行归类，缺失值填补和异常噪声数据的分辨，剔除，从而完成对广告数据的数据清洗和预处理。

针对预处理和清洗后的数据，可以基于广告系统数据的特征，以及根据svm的特征向量设计模式，对数据进行相应的封装，从而构造得到多个样本用于后续svm模型的训练或者预测，其中各个样本可以包括特征向量svm_node和特征标签label。

数据处理单元可以将构造的多个样本提供给模型训练单元，以使得模型训练单元对svm模型进行训练，其中，模型训练单元可以首先进行模型构造，例如构造svm的问题模型svm_problem对象，其中，svm_problem对象可以理解为svm_node集合，其用于指示svm_node中包括的内容。

以及模型训练单元可以进行参数调整，主要是选定核函数的类型，核函数的参数，以及svm模型的惩罚因子，在完成模型的创建后，可以根据构造的svm_node进行模型的训练，得出svm算法模型，其训练过程在上述实施例中进行了详细的介绍，此处不再赘述，接着将训练完成的模型进行保存。

之后模型训练单元可以将训练完成的模型提供给模型处理单元，以对第一样本和第一时段的点击量进行预测。

其中，模型处理单元可以加载模型，以及模型处理单元还可以从数据处理单元获取待预测的数据，例如可以获取封装完成的特征向量。

模型处理单元根据特征向量和第一时段进行处理，可以输出第一时段对应的预测点击量。例如可以输出标签label，其中标签label即为预测结果，之后还可以对预测的结果进行收集，分析，统计。

在一种可能的实现方式中，可以获取第一模型输出的预测点击量以及各个预测点击量对应的真实点击量，从而得到上述介绍的指标：预测结果合格率r，平均相对误差e_MRE和均方根相对误差e_RMSE三个指标，之后可以将分析计算得出的各项结果和相关统计指标封装并保存。

以及本实施例中还包括数据预测展示单元，其中，数据预测展示单元负责svm模型的预测结果的保存，和结果的展示。

其中，结果的保存可以是将svm预测的未来时间节点的广告位点击量结果整理，存入关系型数据库或者保存成文件，以及结果的展示可以是通过广告主投放端页面展示预测的结果，例如可以通过报表的方式展示。

以及本实施例中的处理单元是基于spark的处理单元，其中，基于spark的处理单元可以在模型训练过程中，或者模型处理过程中，对svm的模型参数实现并行化的调整，从而有效提升模型的处理效率。

在一种可能的实现方式中，基于spark的处理单元可以首先构造待调整的多个参数，接着可以构建弹性分布式数据集(Resilient Distributed DataSet，rdd)，基于构建的rdd进行处理和结果统计，其中的处理例如可以为map(映射)处理，结果统计可以为reduce(归约)结果统计。

其中，MapReduce是一种编程模型，用于大规模数据集的并行运算，在一种可能的实现方式中，可以指定一个Map(映射)函数，用来把一组键值对映射成一组新的键值对，指定并发的Reduce(归约)函数，用来保证所有映射的键值对中的每一个共享相同的键组。

以及本实施例中的服务监控日志处理单元，可以用于负责监控各个单元服务的状态，进行异常的监测、报警，收集各个业务单元的日志，记录整个系统的运行状态。

综上所述，本申请实施例提供的对象点击量的确定方法，通过预测未来时间段的广告位点击量，从而能够为广告主提供可靠的的投放数据参考，有效提升了广告的智能化，以及本申请提供的方法充分利用svm的回归预测特性，基于广告系统产生的历史数据，预测未来时间段的广告位点击量，实现了对广告历史数据的有价值利用，并且相较于现有技术中人工预测的方式，可以有效提升预测的点击量的准确性。

图6为本申请实施例提供的对象点击量的确定装置的结构示意图。如图6所示，该装置60包括：获取模块601、处理模块602。

获取模块601，用于获取第一时段和第一对象在所述第一时段的属性信息；

处理模块602，用于确定所述属性信息对应的特征向量；

所述处理模块602，还用于将所述第一时段和所述特征向量输入至所述第一模型，以使所述第一模型输出所述第一对象在所述第一时段内的点击量；

所述第一对象对应的第一预算信息；

所述第一对象在前一天的所述第一时段的点击量；

所述第一对象在前两天的所述第一时段的点击量；

在一种可能的设计中，所述第一模型的生成步骤至少包括：

根据所述多个样本对象的历史数据确定多组样本；

对所述多组样本进行学习，得到所述第一模型。

在一种可能的设计中，针对所述多个样本对象中的任意一个第一样本对象；所述处理模块602还用于：

确定多个样本时段；

在一种可能的设计中，所述处理模块602还用于：

确定每组样本中的样本属性信息对应的样本特征向量；

对更新后的多组样本进行学习，得到所述第一模型。

在一种可能的设计中，所述处理模块602还用于：

在一种可能的设计中，所述处理模块602具体用于：

在一种可能的设计中，所述获取模块601还用于：

所述处理模块602还用于：

在一种可能的设计中，所述处理模块602还用于：

本实施例提供的装置，可用于执行上述方法实施例的技术方案，其实现原理和技术效果类似，本实施例此处不再赘述。

图7为本申请实施例提供的对象点击量的确定设备的硬件结构示意图，如图7所示，本实施例的对象点击量的确定设备70包括：处理器701以及存储器702；其中

存储器702，用于存储计算机执行指令；

处理器701，用于执行存储器存储的计算机执行指令，以实现上述实施例中对象点击量的确定方法所执行的各个步骤。具体可以参见前述方法实施例中的相关描述。

可选地，存储器702既可以是独立的，也可以跟处理器701集成在一起。

当存储器702独立设置时，该对象点击量的确定设备还包括总线703，用于连接所述存储器702和处理器701。

本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如上对象点击量的确定设备所执行的对象点击量的确定方法。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。例如，以上所描述的设备实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

上述以软件功能模块的形式实现的集成的模块，可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(英文：processor)执行本申请各个实施例所述方法的部分步骤。

应理解，上述处理器可以是中央处理单元(英文：Central Processing Unit，简称：CPU)，还可以是其他通用处理器、数字信号处理器(英文：Digital Signal Processor，简称：DSP)、专用集成电路(英文：Application Specific Integrated Circuit，简称：ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。

存储器可能包含高速RAM存储器，也可能还包括非易失性存储NVM，例如至少一个磁盘存储器，还可以为U盘、移动硬盘、只读存储器、磁盘或光盘等。

总线可以是工业标准体系结构(Industry Standard Architecture，ISA)总线、外部设备互连(Peripheral Component，PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture，EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，本申请附图中的总线并不限定仅有一根总线或一种类型的总线。

上述存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上各实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述各实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims

1.一种对象点击量的确定方法，其特征在于，包括：

获取第一时段和第一对象在所述第一时段的属性信息；

确定所述属性信息对应的特征向量；

将所述第一时段和所述特征向量输入至第一模型，以使所述第一模型输出所述第一对象在所述第一时段内的点击量；

2.根据权利要求1所述的方法，其特征在于，所述第一对象在所述第一时段的属性信息包括如下信息中的至少一种：

所述第一对象对应的第一预算信息；

所述第一对象在前一天的所述第一时段的点击量；

所述第一对象在前两天的所述第一时段的点击量；

3.根据权利要求1-2任一项所述的方法，其特征在于，所述第一模型的生成步骤至少包括：

根据所述多个样本对象的历史数据确定多组样本；

对所述多组样本进行学习，得到所述第一模型。

4.根据权利要求3所述的方法，其特征在于，针对所述多个样本对象中的任意一个第一样本对象；根据所述第一样本对象的历史数据确定所述第一样本对象对应的多组样本，包括：

确定多个样本时段；

5.根据权利要求3或4所述的方法，其特征在于，对所述多组样本进行学习，得到所述第一模型，包括：

确定每组样本中的样本属性信息对应的样本特征向量；

对更新后的多组样本进行学习，得到所述第一模型。

6.根据权利要求3-5任一项所述的方法，其特征在于，对所述多组样本进行学习，得到所述第一模型，包括：

7.根据权利要求6所述的方法，其特征在于，根据每个样本属性信息对应的预测点击量和样本点击量对所述初始模型的模型参数进行调整处理，包括：

8.根据权利要求1-7任一项所述的方法，其特征在于，所述方法还包括：

9.根据权利要求8所述的方法，其特征在于，根据所述多个预测点击量和所述多个真实点击量，确定所述第一模型的精确度之后，还包括：

10.一种对象点击量的确定装置，其特征在于，包括：

处理模块，用于确定所述属性信息对应的特征向量；

所述处理模块，还用于将所述第一时段和所述特征向量输入至第一模型，以使所述第一模型输出所述第一对象在所述第一时段内的点击量；

11.根据权利要求10所述的装置，其特征在于，所述第一对象在所述第一时段的属性信息包括如下信息中的至少一种：

所述第一对象对应的第一预算信息；

所述第一对象在前一天的所述第一时段的点击量；

所述第一对象在前两天的所述第一时段的点击量；

12.根据权利要求10-11任一项所述的装置，其特征在于，所述第一模型的生成步骤至少包括：

根据所述多个样本对象的历史数据确定多组样本；

对所述多组样本进行学习，得到所述第一模型。

13.根据权利要求12所述的装置，其特征在于，针对所述多个样本对象中的任意一个第一样本对象；所述处理模块还用于：

确定多个样本时段；

14.根据权利要求12或13所述的装置，其特征在于，所述处理模块还用于：

确定每组样本中的样本属性信息对应的样本特征向量；

对更新后的多组样本进行学习，得到所述第一模型。

15.根据权利要求12-14任一项所述的装置，其特征在于，所述处理模块还用于：

16.根据权利要求15所述的装置，其特征在于，所述处理模块具体用于：

17.根据权利要求10-16任一项所述的装置，其特征在于，所述获取模块还用于：

所述处理模块还用于：

18.根据权利要求17所述的装置，其特征在于，所述处理模块还用于：

19.一种对象点击量的确定设备，其特征在于，包括：

存储器，用于存储程序；

处理器，用于执行所述存储器存储的所述程序，当所述程序被执行时，所述处理器用于执行如权利要求1至9中任一所述的方法。

20.一种计算机可读存储介质，其特征在于，包括指令，当其在计算机上运行时，使得计算机执行如权利要求1至9中任一所述的方法。