CN113763000A - 对象点击量的确定方法及装置 - Google Patents

对象点击量的确定方法及装置 Download PDF

Info

Publication number
CN113763000A
CN113763000A CN202010840747.3A CN202010840747A CN113763000A CN 113763000 A CN113763000 A CN 113763000A CN 202010840747 A CN202010840747 A CN 202010840747A CN 113763000 A CN113763000 A CN 113763000A
Authority
CN
China
Prior art keywords
sample
model
click
time period
attribute information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010840747.3A
Other languages
English (en)
Inventor
唐晔
韩卫召
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Wodong Tianjun Information Technology Co Ltd
Original Assignee
Beijing Wodong Tianjun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Wodong Tianjun Information Technology Co Ltd filed Critical Beijing Wodong Tianjun Information Technology Co Ltd
Priority to CN202010840747.3A priority Critical patent/CN113763000A/zh
Publication of CN113763000A publication Critical patent/CN113763000A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0249Advertisements based upon budgets or funds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供一种对象点击量的确定方法及装置,该方法包括:获取第一时段和第一对象在第一时段的属性信息。确定属性信息对应的特征向量。将第一时段和特征向量输入至第一模型,以使第一模型输出第一对象在第一时段内的点击量。通过获取第一时段和第一对象在第一时段的属性信息,并且通过根据多组样本学习得到的第一模型对第一时段和属性信息对应的特征向量进行处理,从而得到第一模型预测的第一对象在第一时段内的点击量,通过学习后的模型进行处理,从而能够有效保证预测得到的点击量的准确性。

Description

对象点击量的确定方法及装置
技术领域
本申请实施例涉及计算机领域,尤其涉及一种对象点击量的方法及装置。
背景技术
互联网广告是在广告平台上,通过图片、文本、视频等各种形式,对广告进行展示的一种广告运作方式。
目前,广告主在投放广告之前,都会对广告位进行一定的了解,从而制定投放策略,例如现有技术中可以获取广告位的历史点击量,并人工的对未来的点击量进行预测,例如某个广告位的历史点击量较多,广告主可能就预测该广告位未来的点击量也比较多。
然而,人工的根据历史点击量进行预测的实现方式,无法保证预测的点击量的准确性。
发明内容
本申请实施例提供一种对象点击量的方法及装置,以克服无法保证预测的点击量的准确性的问题。
第一方面,本申请实施例提供一种对象点击量的确定方法,包括:
获取第一时段和第一对象在所述第一时段的属性信息;
确定所述属性信息对应的特征向量;
将所述第一时段和所述特征向量输入至所述第一模型,以使所述第一模型输出所述第一对象在所述第一时段内的点击量;
其中,所述第一模型为对多组样本进行学习得到的,每组样本包括样本对象的样本属性信息和所述样本对象在样本时段内的样本点击量。
在一种可能的设计中,所述第一对象在所述第一时段的属性信息包括如下信息中的至少一种:
所述第一对象在至少一个第二时段的点击量,所述第二时段为位于所述第一时段之前的时段;
所述第一对象对应的第一预算信息;
所述第一对象在第三时段的第二预算信息,所述第三时段为所述第一时段之前的时段;
所述第一对象在前一天的所述第一时段的点击量;
所述第一对象在前两天的所述第一时段的点击量;
所述第一时段的类型,所述第一时段的类型为促销时段和非促销时段。
在一种可能的设计中,所述第一模型的生成步骤至少包括:
获取多个样本对象的历史数据,所述历史数据包括如下信息中的至少一种:所述样本对象在多个历史时段内的点击量、所述样本对象在所述多个历史时段内的预算信息、多个历史时段的类型;
根据所述多个样本对象的历史数据确定多组样本;
对所述多组样本进行学习,得到所述第一模型。
在一种可能的设计中,针对所述多个样本对象中的任意一个第一样本对象;根据所述第一样本对象的历史数据确定所述第一样本对象对应的多组样本,包括:
确定多个样本时段;
在所述第一样本对象的历史数据中,分别获取每个样本时段对应的样本属性信息和所述第一样本对象在每个样本时段的样本点击量;
根据每个样本时段对应的样本属性信息和所述第一样本对象在每个样本时段的样本点击量,确定所述第一样本对象对应的多组样本。
在一种可能的设计中,对所述多组样本进行学习,得到所述第一模型,包括:
确定每组样本中的样本属性信息对应的样本特征向量;
将每组样本中的样本属性信息更新为对应的样本特征向量,得到更新后的多组样本;
对更新后的多组样本进行学习,得到所述第一模型。
在一种可能的设计中,对所述多组样本进行学习,得到所述第一模型,包括:
通过初始模型对所述多组样本中的样本属性信息进行处理,得到每个样本属性信息对应的预测点击量;
根据每个样本属性信息对应的预测点击量和样本点击量对所述初始模型的模型参数进行调整处理;
重复执行上述两个步骤,直至所述初始模型满足收敛条件时,得到所述第一模型。
在一种可能的设计中,根据每个样本属性信息对应的预测点击量和样本点击量对所述初始模型的模型参数进行调整处理,包括:
根据每个样本属性信息对应的预测点击量和样本点击量,对所述模型参数并行的进行多种调整,得到多个目标模型参数。
在一种可能的设计中,所述方法还包括:
获取通过第一模型确定得到的至少一个对象在至少一个时段内的多个预测点击量;
获取所述至少一个对象在所述至少一个时段内的真实点击量;
根据所述多个预测点击量和所述多个真实点击量,确定所述第一模型的精确度。
在一种可能的设计中,根据所述多个预测点击量和所述多个真实点击量,确定所述第一模型的精确度之后,还包括:
在所述第一模型的精确度小于预设阈值时,更新所述第一模型。
第二方面,本申请实施例提供一种对象点击量的确定装置,包括:
获取模块,用于获取第一时段和第一对象在所述第一时段的属性信息;
处理模块,用于确定所述属性信息对应的特征向量;
所述处理模块,还用于将所述第一时段和所述特征向量输入至所述第一模型,以使所述第一模型输出所述第一对象在所述第一时段内的点击量;
其中,所述第一模型为对多组样本进行学习得到的,每组样本包括样本对象的样本属性信息和所述样本对象在样本时段内的样本点击量。
在一种可能的设计中,所述第一对象在所述第一时段的属性信息包括如下信息中的至少一种:
所述第一对象在至少一个第二时段的点击量,所述第二时段为位于所述第一时段之前的时段;
所述第一对象对应的第一预算信息;
所述第一对象在第三时段的第二预算信息,所述第三时段为所述第一时段之前的时段;
所述第一对象在前一天的所述第一时段的点击量;
所述第一对象在前两天的所述第一时段的点击量;
所述第一时段的类型,所述第一时段的类型为促销时段和非促销时段。
在一种可能的设计中,所述第一模型的生成步骤至少包括:
获取多个样本对象的历史数据,所述历史数据包括如下信息中的至少一种:所述样本对象在多个历史时段内的点击量、所述样本对象在所述多个历史时段内的预算信息、多个历史时段的类型;
根据所述多个样本对象的历史数据确定多组样本;
对所述多组样本进行学习,得到所述第一模型。
在一种可能的设计中,针对所述多个样本对象中的任意一个第一样本对象;所述处理模块还用于:
确定多个样本时段;
在所述第一样本对象的历史数据中,分别获取每个样本时段对应的样本属性信息和所述第一样本对象在每个样本时段的样本点击量;
根据每个样本时段对应的样本属性信息和所述第一样本对象在每个样本时段的样本点击量,确定所述第一样本对象对应的多组样本。
在一种可能的设计中,所述处理模块还用于:
确定每组样本中的样本属性信息对应的样本特征向量;
将每组样本中的样本属性信息更新为对应的样本特征向量,得到更新后的多组样本;
对更新后的多组样本进行学习,得到所述第一模型。
在一种可能的设计中,所述处理模块还用于:
通过初始模型对所述多组样本中的样本属性信息进行处理,得到每个样本属性信息对应的预测点击量;
根据每个样本属性信息对应的预测点击量和样本点击量对所述初始模型的模型参数进行调整处理;
重复执行上述两个步骤,直至所述初始模型满足收敛条件时,得到所述第一模型。
在一种可能的设计中,所述处理模块具体用于:
根据每个样本属性信息对应的预测点击量和样本点击量,对所述模型参数并行的进行多种调整,得到多个目标模型参数。
在一种可能的设计中,所述获取模块还用于:
获取通过第一模型确定得到的至少一个对象在至少一个时段内的多个预测点击量;
获取所述至少一个对象在所述至少一个时段内的真实点击量;
所述处理模块还用于:
根据所述多个预测点击量和所述多个真实点击量,确定所述第一模型的精确度。
在一种可能的设计中,所述处理模块还用于:
在根据所述多个预测点击量和所述多个真实点击量,确定所述第一模型的精确度之后,在所述第一模型的精确度小于预设阈值时,更新所述第一模型。
第三方面,本申请实施例提供一种对象点击量的确定设备,包括:
存储器,用于存储程序;
处理器,用于执行所述存储器存储的所述程序,当所述程序被执行时,所述处理器用于执行如上第一方面以及第一方面各种可能的设计中任一所述的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行如上第一方面以及第一方面各种可能的设计中任一所述的方法。
本申请实施例提供一种对象点击量的确定方法及装置,该方法包括:获取第一时段和第一对象在第一时段的属性信息。确定属性信息对应的特征向量。将第一时段和特征向量输入至第一模型,以使第一模型输出第一对象在第一时段内的点击量。通过获取第一时段和第一对象在第一时段的属性信息,并且通过根据多组样本学习得到的第一模型对第一时段和属性信息对应的特征向量进行处理,从而得到第一模型预测的第一对象在第一时段内的点击量,通过学习后的模型进行处理,从而能够有效保证预测得到的点击量的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的广告位的实现方式示意图;
图2为本申请实施例提供的对象点击量的确定方法的流程图;
图3为本申请又一实施例提供的对象点击量的确定方法的流程图;
图4为本申请实施例提供的确定第一模型的精确度的流程图;
图5为本申请实施例提供的对象点击量的确定方法的流程示意图;
图6为本申请实施例提供的对象点击量的确定装置的结构示意图;
图7为本申请实施例提供的对象点击量的确定设备的硬件结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了便于理解,首先,对本申请所涉及的概念进行说明。
互联网广告:是指通过网站、网页、互联网应用程序等互联网媒介,以文字、图片、音频、视频或者其他形式,直接或者间接地推销商品或者服务的商业广告,其中,互联网广告是通过在广告平台上投放广告,从而触达互联网用户的一种新型的广告运作方式。
广告主:广告主是广告活动的发起者,是在网上销售或宣传自己产品和服务的商家,是联盟营销广告的提供者。任何推广、销售其产品或服务的商家都可以作为广告主。通俗的理解,广告主就是在广告位中投放广告的一方。
svm:支持向量机(Support Vector Machine,svm)是一类按监督学习方式对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面。在人像识别、文本分类等模式识别问题中有得到应用。将svm由分类问题推广至回归问题可以得到支持向量回归。
核函数:用于svm通过某非线性变换
Figure BDA0002641295100000072
将输入空间映射到高维特征空间。其中,特征空间的维数可能非常高,如果svm的求解只用到内积运算,而在低维输入空间又存在某个函数K(x,x′),它恰好等于在高维空间中这个内积,即
Figure BDA0002641295100000071
那么svm就不用计算复杂的非线性变换,而由这个函数K(x,x′)直接得到非线性变换的内积,从而在很大程度上简化了计算,其中,上述介绍的K(x,x′)这样的函数即称为核函数。
下面结合图1对广告位的一种可能的实现方式进行介绍,图1为本申请实施例提供的广告位的实现方式示意图。
如图1所示,当前图1示例性的给出了一个网站的页面,在该网站的页面中包括页面的内容,以及包括至少一个广告位,在各个广告位中可以显示广告主投放的广告,或者在某个广告位没有投放的广告时,可以显示广告位招租的信息。
上述图1介绍的是网页中的广告位,在另一种可能的实现方式中,目前的应用程序的界面中也可以包括至少一个广告位,本实施例对广告位的具体实现方式不做限制,凡是图形用户界面中用于投放和显示广告的控件,均可以作为本实施例中的广告位。
目前,广告主在投放广告之前,都会对网站或者应用内的广告位的广告效果进行大体的了解,从而制定自己的投放策略。
在显示广告的过程中,用户可以对广告位中的信息进行点击,其中,广告位上的每次点击能充分体现真实的流量,和潜在的订单量,从而影响广告主的投放策略。因此为了帮助广告主进行投放策略的分析,从而进行精准的进行广告的投放,增大广告投放的效果,现有技术通常会采取一定的策略,对未来时间节点的广告位的点击量进行预估,以便于广告主针对性的进行广告投放。
目前,现有技术在对广告位的点击量进行预估时,通常是获取广告位的历史点击量,并通过人工的方式对未来的点击量进行预测,例如某个广告位的历史点击量较多,广告主可能就预测该广告位未来的点击量也比较多,从而在该广告位进行广告的投放。然而,人工预测的方式无法保证预测的点击量的准确性。
针对现有技术中的问题,本申请提出了如下技术构思:通过第一模型根据广告位的各个时段的属性信息进行预估处理,以得到预测的点击量,其中第一模型是根据历史点击数据训练得到的,因此可以有效保证预测的点击量的准确性。
下面结合具体的实施例对本申请提供的对象点击量的确定方法进行介绍,需要说明的是,本申请中各实施例的执行主体可以为服务器、处理器等具有数据处理功能的组件,本实施例对此不做限制,只要可以进行数据处理即可。
图2为本申请实施例提供的对象点击量的确定方法的流程图。
如图2所示,该方法包括:
S201、获取第一时段和第一对象在第一时段的属性信息。
在本实施例中,第一对象可以为上述介绍的广告位,或者在其余可能的实现方式中,第一对象还可以为网页中的可点击的元素,或者第一对象还可以为应用程序中的可点击的元素。
本实施例可以预测在未来时段内对第一对象的点击量,因此只要是可点击的元素,就都可以作为本实施例中的第一对象,此处对第一对象的具体实现方式不做特别限制。
下面以第一对象是广告位为例,在一种可能的实现方式中,可以按照时段统计广告位的点击量和相关信息,例如以半个小时为单位,统计各个时段内的广告位的点击量和相关信息,或者还可以为一个小时为单位等,或者还可以划分时长不等的多个时段,本实施例对时段划分的具体实现方式不做限制,其可以根据实际需求进行安泽。
可以理解的是,广告主在投放广告的时候,会确定投放广告的广告位,同时还会确定投放广告的时段,例如广告主确定投放广告位A,其例如可投放点击量最高的时段;或者出于成本考虑,其还可以选择投放点击量居中的时段,因此本实施例中在预测广告位的点击量时,应该是预测某个目标时段的点击量。
本实施例中的第一时段是需要预测第一对象的点击量的目标时段,第一时段可以是多个时段中的任意一个,其是根据实际需求选择的,例如当前需要预测13:00:00-13:09:59这一时段的点击量,则第一时段就可以是13:00:00-13:09:59。
在本实施例中,第一对象在第一时段的属性信息用于指示第一对象在第一时段的相关属性,其例如可以包括第一对象在第一时段对应的至少一个历史时段的点击量,从而可以根据历史时段的点击量确定当前第一时段的点击量;或者,第一时段的属性信息还例如可以包括第一时段的预算信息,预算信息例如可以为广告主的投入预算,或者第一时段的属性信息还可以包括第一时段的类型,第一时段的类型例如可以为促销时段或者非促销时段。
在实际时段过程中,第一对象的属性信息可以根据实际需求包括上述信息中的至少一种,或者第一对象的属性信息还可以包括任意的可以指示第一对象的点击量的信息,本实施例对第一对象的属性信息不做限制。
S202、确定属性信息对应的特征向量。
在本实施例中,属性信息例如可以包括如下信息中的至少一种:
d:第一对象在至少一个第二时段的点击量,第二时段为位于第一时段之前的时段;
b1:第一对象对应的第一预算信息;
c1:第一对象在第三时段的第二预算信息,第三时段为第一之前的时段;
y1:第一对象在前一天的第一时段的点击量;
y2:第一对象在前两天的第一时段的点击量;
p1:第一时段的类型,第一时段的类型为促销时段和非促销时段。
i1:第一时段的前一个时段中第一对象中的广告展示数。
下面以第一对象是广告位为例,对第一对象的属性信息的可能的实现方式进行介绍:
上述介绍的至少一个第二时段例如可以包括第一时段之前相邻的4个时段,则d可以包括d1,d2,d3,d4,分别用于表示第一对象在第一时段相邻的前4个时段的点击量,其中第一预算信息例如可以为广告主的广告预算,则b1表示广告主的广告预算,其中第三时段例如可以为第一时段相邻的前一个时段,第二预算信息例如可以为投放消耗,则c1可以表示第一时段的前一个时段广告主的投放消耗,其中p1表示第一时段的类型。例如0表示第一时段的类型为非促销时段,1表示第一时段的类型为促销时段,以及上述的i1表示的广告展示数可以理解为第一对象中展示的广告被浏览的次数。
在本实施例中,第一模型例如可以为svm模型,基于广告系统中的数据的特征,以及根据svm模型的特征向量的设计模式,可以确定属性信息对应的特征向量,以便于之后svm模型根据特征向量进行数据处理。
上述介绍的属性信息包括b1,c1,y1,y2,d1,d2,d3,d4,p1,i1,则特征向量的实现方式例如可以为:xi={b1,c1,y1,y2,d1,d2,d3,d4,p1,i1},其中,xi为特征向量。
下面结合一个具体的示例对确定属性信息对应的特征向量的实现方式进行介绍:
例如,当前的第一对象为广告位A,第一时段为13:00:00-13:09:59,假设该时段处于促销阶段,则第一时段的类型为促销时段,则p1为1。
其中,第一时段的前4个时段该广告位A的点击量为:
d1:12:50:00-12:59:59的点击量为224210次;
d2:12:40:00-12:49:59的点击量为261523次;
d3:12:30:00-12:39:59的点击量为246819次;
d4:12:30:00-12:39:59的点击量为238449次;
以及,假设当前广告主对于广告位A的广告预算为2067446元,则b1为2067446。
以及,假设在第一时段的前一时段12:50:00-12:59:59的实际消耗为89684元,则c1为89684。
以及,假设前一天广告位A在第一时段13:00:00-13:09:59的点击量为269454次,则y1为269454。
以及,假设前两天广告位A在第一时段13:00:00-13:09:59的点击量为261617次,则y2为269454。
以及,前一个时间段12:50:00-12:59:59广告位A中的广告展示数23205583次,可以表明在12:50:00-12:59:59这个时段内广告位A中的战术的广告被浏览了23205583次,可以理解的是,一个用户看到一次这个广告位,即可以即为一次展示数,则i1为23205583。
基于上述内容,可以得出当前属性信息对应的特征向量为:
xi={2067446,89684,269454,261617,224210,261523,246819,238449,1,23205583}
在实际实现过程中,属性信息所包括的内容可以根据实际需求进行选择,例如属性信息还可以包括第一对象在前三天的第一时段的点击量等,则对应的特征向量所包括的内容也可以进行适应性的扩展,以及特征向量中各个数据的顺序同样可以根据实际需求进行选择,本实施例对此不做限制。
S203、将第一时段和特征向量输入至第一模型,以使第一模型输出第一对象在第一时段内的点击量。
在本实施例中,第一模型为根据第一时段和属性信息预测点击量的模型,则可以通过第一模型对第一时段和属性信息进行处理,从而得到第一对象在第一时段内的点击量。
其中,第一模型为对多组样本进行学习得到的,每组样本包括样本对象的样本属性信息和样本对象在样本时段内的样本点击量。
样本属性信息与上述介绍的第一对象的属性信息类似,不同之处在于,样本属性信息是用于对第一模型进行训练的,而第一对象的属性信息是用于第一模型进行处理以输出预测点击量的,以及本实施例中的每组样本中还包括样本对象在样本时段内样本点击量,可以理解的是,样本点击量是样本对象在样本时段的实际的点击量,通过根据样本对象在原本时段的历史点击量供第一模型进行学习,从而能够有效保证第一模型输出的预测点击量的准确率和可靠性。
在本实施例中,在得到特征向量之后,可以将第一时段和特征向量输入至第一模型,第一模型可以根据特征向量进行处理,从而输出第一对象在第一时段内的点击量。
在一种可能的实现方式中,本实施例中的第一模型例如可以为svm模型,则上述介绍的特征向量例如可以为svm_node,最终输出的预测的点击量可以为标签label。
或者,第一模型还可以为任意的根据属性信息和第一时段输出预测的点击量的模型,本实施例中对第一模型中的具体执行逻辑不做限制,只要第一模型可以根据属性信息和第一时段输出预测的点击量即可。
本申请实施例提供的对象点击量的确定方法,包括:获取第一时段和第一对象在第一时段的属性信息。确定属性信息对应的特征向量。将第一时段和特征向量输入至第一模型,以使第一模型输出第一对象在第一时段内的点击量。通过获取第一时段和第一对象在第一时段的属性信息,并且通过根据多组样本学习得到的第一模型对第一时段和属性信息对应的特征向量进行处理,从而得到第一模型预测的第一对象在第一时段内的点击量,通过学习后的模型进行处理,从而能够有效保证预测得到的点击量的准确性。
以及,其中确定特征向量能够有效的保证输入至第一模型的数据的规范性和可处理性,从而有效提升第一模型输出的点击量的准确性和效率。
在上述实施例的基础上,本实施例中的第一模型是对多组样本进行学习从而生成的,下面结合具体的实施例对第一模型的生成的可能的实现方式进行介绍,图3为本申请又一实施例提供的对象点击量的确定方法的流程图。
如图3所示,该方法包括:
S301、获取多个样本对象的历史数据,历史数据包括如下信息中的至少一种:样本对象在多个历史时段内的点击量、样本对象在多个历史时段内的预算信息、多个历史时段的类型。
在本实施例中,在第一模型进行学习时,需要多组样本作为训练数据,因此在本实施例中,可以获取多个样本对象的历史数据,其中多个样本对象例如可以为多个广告位,通过获取多个样本对象的历史数据,从而能够保证样本数据的充足。
在一种可能的实现方式中,例如可以从广告系统中获取多个样本对象的历史数据,或者还可以从相关的数据网站上获取用于模型训练的历史数据。
其中,样本对象的历史数据与上述介绍的属性信息类似,样本对象的历史数据例如可以包括样本对象在多个历史时段内的点击量、样本对象在多个历史时段内的预算信息,多个历史时段的类型。
或者,样本对象的历史数据还可以包括任意的与样本对象相关的数据,凡是与样本对象相关的,并且是在当前时刻之前产生的数据,均可以作为本实施例中的历史数据,此处对历史数据的具体实现方式不做特别限制。
在一种可能的实现方式中,在获取到历史数据之后,可以对历史数据进行清洗和预处理,其中清洗和预处理的操作例如可以包括如下操作中的至少一种:归类处理、缺失值填补处理、异常噪声数据的分辨、剔除处理。
通过对获取的样本对象的历史数据进行清洗和预处理,能够有效保证数据的规范性,从而提升后续数据处理的效率。
S302、根据多个样本对象的历史数据确定多组样本。
在本实施例中,要对第一模型进行训练,则需要确定训练数据,例如可以确定多组样本。
当前存在多个样本对象,其中针对每一个样本对象均可以确定至少一个样本,从而确定多组样本,下面针对多组样本对象中的任意一个第一样本对象为例,对确定样本的实现方式进行说明,各个样本对象的实现方式类似。
其中,针对第一样本对象,可以确定多个样本时段,其中样本时段与上述介绍的第一时段类似,不同之处在于,此处的样本时段是用于第一模型进行学习的,其中确定的样本时段的数量,以及确定的样本时段的时间等,均可以根据实际需求进行选择。
在确定多个样本时段之后,可以在第一样本对象的历史数据中,分别获取每个样本时段对应的样本属性信息和第一样本对象在每个样本时段的样本点击量。
其中,样本属性信息与上述介绍的属性信息类似,此处不再赘述,以及本实施例中,因为获取的是第一样本对象的历史数据,因此可以确定第一样本对象在每个样本时段的样本点击量,也就是实际发生的点击量,以便第一模型根据此进行模型的学习。
在得到上述介绍的样本属性信息和样本点击量之后,就可以根据每个样本时段对应的样本属性信息和第一样本对象在每个样本时段的样本点击量,确定第一样本对象对应的多组样本。
其中,每组样本中即包括样本属性信息和样本点击量。
在一种可能的实现方式中,第一模型可以为svm模型,则多组样本例如可以为多个svm_node,因为svm模型支持特征向量,因此本实施例中还可以确定样本属性信息对应的样本特征向量,其实现方式与上述S202介绍的确定属性信息对应的特征向量的实现方式类似,此处不再赘述。
在确定特征向量之后,可以将样本中的样本属性信息更新为对应的特征向量,从而得到多组样本,即多个svm_node,此时每个svm_node包括一个特征向量和一个特征标签。
其中特征向量例如可以为上述介绍的:
xi={b1,c1,y1,y2,d1,d2,d3,d4,p1,i1}
以及特征标签例如可以用label表示,在一个示例性的介绍中,若广告位A在样本时段13:00:00-13:09:59实际发生的点击量为278467次,则svm_node中的的特征标签可以为label=278467。
S303、对多组样本进行学习,得到第一模型。
在得到多组样本之后,就可以将得到的多组样本作为训练数据进行小背心,从而得到训练后的第一模型。
下面对第一模型学习的一种可能的实现方式进行说明,对多组样本进行学习,得到第一模型例如可以包括:
通过初始模型对多组样本中的样本属性信息进行处理,得到每个样本属性信息对应的预测点击量。
根据每个样本属性信息对应的预测点击量和样本点击量对初始模型的模型参数进行调整处理。
重复执行上述初始模型处理和对模型参数进行调整处理的步骤,直至初始模型满足收敛条件时,得到第一模型。
其中,收敛条件例如可以为预测点击量和样本点击量的差值小于预设阈值,或者收敛条件还可以为第一模型输出的准确率大于预设阈值,其中收敛条件是用于指示模型是否训练完成的,其具体实现方式可以根据实际需求进行选择。
本实施例中会对初始模型的模型参数进行调整处理,以提升初始模型输出的结构的准确性,在一种可能的实现方式中,例如可以对svm模型的惩罚因子C进行调整;或者,在另一种可能的实现方式中,例如可以对核函数以及核函数的参数进行调整。
下面首先对核函数和核函数的参数进行说明:
基于上述介绍可以确定的是,svm模型在处理数据的过程中会运用到核函数,在一种可能的实现方式中,在模型训练的过程中,本申请可以对多个核函数均进行试验,通过对比第一模型的训练过程中的输出结果,从而选取表现最优的核函数,例如可以选取输出的点击量的准确率最高的核函数。
其中,核函数例如可以分为线性核函数、高斯核函数、以及多项式核函数,例如本实施例中经过试验之后可以选取高斯核函数,其中高斯核函数例如可以满足如下公式一:
Figure BDA0002641295100000141
其中,x表示空间中的点,z表示核函数中心,γ为高斯核函数的参数,e为运算符号,K(x,z)为高斯核函数的函数值。
本实施例中通过试验对比选取表现最优的核函数,从而能够有效提高svm模型的预测准确度,同时对于试验选定的核函数类型,还可以进行svm模型的参数调优,例如对上述的高斯核函数的参数γ进行调整试验,以得到表现最优的目标参数,从而得出最优的预测准确度。
基于上述介绍可以确定的是,本实施例中可以对svm模型的惩罚因子C进行调整,还可以对核函数进行调整,还可以对核函数的参数γ进行调整。
其中,例如将惩罚因子C调整为1,测试模型输出的准确率,还可以将惩罚因子C调整为2,再测试模型输出的准确率,核函数以及核函数的参数类似,为了提升模型的处理效率,本实施例中可以对多个不同的模型参数取值进行并行的调整,从而得到多个目标模型参数。
例如针对C取值为1、C取值为2、C取值为3、…,以及γ取值为1、γ取值为2、γ取值为3、…,等多种情况,可以将多种模型参数的取值并行的进行处理,以提升模型的处理效率,在一种可能的实现方式中,例如可以通过基于spark的处理单元实现模型参数的调整过程,因为spark支持并行处理,从而能够有效的实现并行的调整模型参数。
本申请实施例提供的对象点击量的确定方法,包括:获取多个样本对象的历史数据,历史数据包括如下信息中的至少一种:样本对象在多个历史时段内的点击量、样本对象在多个历史时段内的预算信息、多个历史时段的类型。根据多个样本对象的历史数据确定多组样本。对多组样本进行学习,得到第一模型。通过得到多组样本,从而能够保证第一模型学习的样本的充足,以及在得到多组样本之后,通过对对组样本进行学习,从而得到第一模型,可以有效保证第一模型输出的预测点击量的准确性,本实施例中还通过对核函数进行试验和选择,以及对核函数的参数和模型的参数进行并行化的调整,以在提升模型处理速度的同时,从而得出最优的预测准确度。
在上述实施例的基础上,本申请提供的对象点击量的确定方法中,在第一模型输出第一对象在第一时段内的点击量之后,还可以在第一时段的时间过去之后,对第一模型输出的结果的精确度进行判断,下面对确定第一模型的精确度的实现方式进行说明。
图4为本申请实施例提供的确定第一模型的精确度的流程图,如图4所示,该方法包括:
S401、获取通过第一模型确定得到的至少一个对象在至少一个时段内的多个预测点击量。
在本实施例中,第一模型可以输出第一对象在第一时段内的点击量,以及本实施例中的第一模型可以对多个第一时段和多个第一对象的点击量进行预估,从而可以获取第一模型确定得到的多个预测点击量。
S402、获取至少一个对象在至少一个时段内的真实点击量。
在本实施例中,在对第一模型的精确度进行判断时,上述获取的多个预测点击量对应的第一时段以及过去了,例如在今天开始的时候预测了多个第一对象和多个第一时段的点击量,则可以在今天结束的时候获取这些第一对象在第一时段的真实的点击量,从而可以根据预测点击量和真实点击量得到第一模型的精确度。
S403、根据多个预测点击量和多个真实点击量,确定第一模型的精确度。
在本实施例中,可以根据多个预测点击量和多个真实点击量,得到至少一个指标,用至少一个指标确定第一模型的精确度。
下面对指标的可能的实现方式进行介绍:
在一种可能的实现方式中,可以采用平均相对误差指示第一模型的精确度,其中,平均相对误差例如可以满足如下的公式二:
Figure BDA0002641295100000161
其中,N为获取的预测点击量的数量,L(i)为真实点击量,L`(i)为预测点击量,eMRE为平均相对误差。
在另一种可能的实现方式中,可以采用均方根相对误差指示第一模型的精确度,其中,平均相对误差例如可以满足如下的公式三:
Figure BDA0002641295100000162
其中,N为获取的预测点击量的数量,L(i)为真实点击量,L`(i)为预测点击量,eRMSE为平均相对误差。
在再一种可能的实现方式中,可以采用根据单个时刻预测结果的误差得到的合格率指示第一模型的精确度,其中,单个时刻预测结果的误差例如可以满足如下的公式四:
Figure BDA0002641295100000171
其中,L(i)为真实点击量,L`(i)为预测点击量,esingle为单个时刻预测结果的误差。
在得到esingle之后,例如可以确定10%为esingle的判别标准,将一个预测点击量作为一个点,即某个点对应的的esingle>10%,则判定该点对应的预测点击量为不合格,例如可以定义r为本次第一模型输出的预测点击量的合格率,其中合格率r例如可以满足如下公式五:
Figure BDA0002641295100000172
其中,r为预测结果合格率,P`为esingle≤10%的点的个数,也就是判定预测结果合格的点的个数,P为总的预测点的个数。
在实际实现过程中,例如可以选取上述介绍的预测结果合格率r,平均相对误差eMRE和均方根相对误差eRMSE三个指标中的一个或多个作为确定第一模型的精确度的依据;或者还可以根据上述介绍的三个指标各自对应的权重,综合得到一个精确度值,该精确度值用于指示第一模型的精确度。
在一种可能的实现方式中,若第一模型的精确度小于预设阈值,例如上述介绍的三个指标中的任一个小于对应的预设阈值,或者上述介绍的精确度值小于预设阈值,则可以确定当前第一模型输出的准确率不满足要求,则可以更新第一模型。
在更新第一模型的一种可能的实现方式中,例如可以对第一模型中的模型参数进行调整,例如通过基于spark的处理单元对第一模型进行模型参数的调整,以提升第一模型输出的预测点击量的准确性,其实现方式与上述图4实施例中介绍的调整模型参数的实现方式类似,此处不再赘述。
本申请实施例提供的对象点击量的确定方法,包括:获取通过第一模型确定得到的至少一个对象在至少一个时段内的多个预测点击量。获取至少一个对象在至少一个时段内的真实点击量。根据多个预测点击量和多个真实点击量,确定第一模型的精确度。在第一模型的精确度小于预设阈值时,更新第一模型。通过根据真实点击量和预测点击量,可以有效的确定第一模型输出的结果的精确度,从而可以在确定第一模型的精确度小于预设阈值时,及时的对第一模型进行更新,从而保证第一模型输出的预测点击量的准确性。
在上述实施例的基础上,下面结合图5对本申请的数据获取、模型训练、模型处理的实现过程进行一个整体的介绍,图5为本申请实施例提供的对象点击量的确定方法的流程示意图。
如图5所示:
图5中以第一模型是svm模型为例进行说明,其余处理模型的实现过程类似,
其中,数据处理单元对广告系统中的相关数据进行收集,其中收集的数据例如可以为属性信息、真实点击量等,并针对收集数据进行归类,缺失值填补和异常噪声数据的分辨,剔除,从而完成对广告数据的数据清洗和预处理。
针对预处理和清洗后的数据,可以基于广告系统数据的特征,以及根据svm的特征向量设计模式,对数据进行相应的封装,从而构造得到多个样本用于后续svm模型的训练或者预测,其中各个样本可以包括特征向量svm_node和特征标签label。
数据处理单元可以将构造的多个样本提供给模型训练单元,以使得模型训练单元对svm模型进行训练,其中,模型训练单元可以首先进行模型构造,例如构造svm的问题模型svm_problem对象,其中,svm_problem对象可以理解为svm_node集合,其用于指示svm_node中包括的内容。
以及模型训练单元可以进行参数调整,主要是选定核函数的类型,核函数的参数,以及svm模型的惩罚因子,在完成模型的创建后,可以根据构造的svm_node进行模型的训练,得出svm算法模型,其训练过程在上述实施例中进行了详细的介绍,此处不再赘述,接着将训练完成的模型进行保存。
之后模型训练单元可以将训练完成的模型提供给模型处理单元,以对第一样本和第一时段的点击量进行预测。
其中,模型处理单元可以加载模型,以及模型处理单元还可以从数据处理单元获取待预测的数据,例如可以获取封装完成的特征向量。
模型处理单元根据特征向量和第一时段进行处理,可以输出第一时段对应的预测点击量。例如可以输出标签label,其中标签label即为预测结果,之后还可以对预测的结果进行收集,分析,统计。
在一种可能的实现方式中,可以获取第一模型输出的预测点击量以及各个预测点击量对应的真实点击量,从而得到上述介绍的指标:预测结果合格率r,平均相对误差eMRE和均方根相对误差eRMSE三个指标,之后可以将分析计算得出的各项结果和相关统计指标封装并保存。
以及本实施例中还包括数据预测展示单元,其中,数据预测展示单元负责svm模型的预测结果的保存,和结果的展示。
其中,结果的保存可以是将svm预测的未来时间节点的广告位点击量结果整理,存入关系型数据库或者保存成文件,以及结果的展示可以是通过广告主投放端页面展示预测的结果,例如可以通过报表的方式展示。
以及本实施例中的处理单元是基于spark的处理单元,其中,基于spark的处理单元可以在模型训练过程中,或者模型处理过程中,对svm的模型参数实现并行化的调整,从而有效提升模型的处理效率。
在一种可能的实现方式中,基于spark的处理单元可以首先构造待调整的多个参数,接着可以构建弹性分布式数据集(Resilient Distributed DataSet,rdd),基于构建的rdd进行处理和结果统计,其中的处理例如可以为map(映射)处理,结果统计可以为reduce(归约)结果统计。
其中,MapReduce是一种编程模型,用于大规模数据集的并行运算,在一种可能的实现方式中,可以指定一个Map(映射)函数,用来把一组键值对映射成一组新的键值对,指定并发的Reduce(归约)函数,用来保证所有映射的键值对中的每一个共享相同的键组。
以及本实施例中的服务监控日志处理单元,可以用于负责监控各个单元服务的状态,进行异常的监测、报警,收集各个业务单元的日志,记录整个系统的运行状态。
综上所述,本申请实施例提供的对象点击量的确定方法,通过预测未来时间段的广告位点击量,从而能够为广告主提供可靠的的投放数据参考,有效提升了广告的智能化,以及本申请提供的方法充分利用svm的回归预测特性,基于广告系统产生的历史数据,预测未来时间段的广告位点击量,实现了对广告历史数据的有价值利用,并且相较于现有技术中人工预测的方式,可以有效提升预测的点击量的准确性。
图6为本申请实施例提供的对象点击量的确定装置的结构示意图。如图6所示,该装置60包括:获取模块601、处理模块602。
获取模块601,用于获取第一时段和第一对象在所述第一时段的属性信息;
处理模块602,用于确定所述属性信息对应的特征向量;
所述处理模块602,还用于将所述第一时段和所述特征向量输入至所述第一模型,以使所述第一模型输出所述第一对象在所述第一时段内的点击量;
其中,所述第一模型为对多组样本进行学习得到的,每组样本包括样本对象的样本属性信息和所述样本对象在样本时段内的样本点击量。
在一种可能的设计中,所述第一对象在所述第一时段的属性信息包括如下信息中的至少一种:
所述第一对象在至少一个第二时段的点击量,所述第二时段为位于所述第一时段之前的时段;
所述第一对象对应的第一预算信息;
所述第一对象在第三时段的第二预算信息,所述第三时段为所述第一时段之前的时段;
所述第一对象在前一天的所述第一时段的点击量;
所述第一对象在前两天的所述第一时段的点击量;
所述第一时段的类型,所述第一时段的类型为促销时段和非促销时段。
在一种可能的设计中,所述第一模型的生成步骤至少包括:
获取多个样本对象的历史数据,所述历史数据包括如下信息中的至少一种:所述样本对象在多个历史时段内的点击量、所述样本对象在所述多个历史时段内的预算信息、多个历史时段的类型;
根据所述多个样本对象的历史数据确定多组样本;
对所述多组样本进行学习,得到所述第一模型。
在一种可能的设计中,针对所述多个样本对象中的任意一个第一样本对象;所述处理模块602还用于:
确定多个样本时段;
在所述第一样本对象的历史数据中,分别获取每个样本时段对应的样本属性信息和所述第一样本对象在每个样本时段的样本点击量;
根据每个样本时段对应的样本属性信息和所述第一样本对象在每个样本时段的样本点击量,确定所述第一样本对象对应的多组样本。
在一种可能的设计中,所述处理模块602还用于:
确定每组样本中的样本属性信息对应的样本特征向量;
将每组样本中的样本属性信息更新为对应的样本特征向量,得到更新后的多组样本;
对更新后的多组样本进行学习,得到所述第一模型。
在一种可能的设计中,所述处理模块602还用于:
通过初始模型对所述多组样本中的样本属性信息进行处理,得到每个样本属性信息对应的预测点击量;
根据每个样本属性信息对应的预测点击量和样本点击量对所述初始模型的模型参数进行调整处理;
重复执行上述两个步骤,直至所述初始模型满足收敛条件时,得到所述第一模型。
在一种可能的设计中,所述处理模块602具体用于:
根据每个样本属性信息对应的预测点击量和样本点击量,对所述模型参数并行的进行多种调整,得到多个目标模型参数。
在一种可能的设计中,所述获取模块601还用于:
获取通过第一模型确定得到的至少一个对象在至少一个时段内的多个预测点击量;
获取所述至少一个对象在所述至少一个时段内的真实点击量;
所述处理模块602还用于:
根据所述多个预测点击量和所述多个真实点击量,确定所述第一模型的精确度。
在一种可能的设计中,所述处理模块602还用于:
在根据所述多个预测点击量和所述多个真实点击量,确定所述第一模型的精确度之后,在所述第一模型的精确度小于预设阈值时,更新所述第一模型。
本实施例提供的装置,可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,本实施例此处不再赘述。
图7为本申请实施例提供的对象点击量的确定设备的硬件结构示意图,如图7所示,本实施例的对象点击量的确定设备70包括:处理器701以及存储器702;其中
存储器702,用于存储计算机执行指令;
处理器701,用于执行存储器存储的计算机执行指令,以实现上述实施例中对象点击量的确定方法所执行的各个步骤。具体可以参见前述方法实施例中的相关描述。
可选地,存储器702既可以是独立的,也可以跟处理器701集成在一起。
当存储器702独立设置时,该对象点击量的确定设备还包括总线703,用于连接所述存储器702和处理器701。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上对象点击量的确定设备所执行的对象点击量的确定方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
上述以软件功能模块的形式实现的集成的模块,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本申请各个实施例所述方法的部分步骤。
应理解,上述处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application Specific Integrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器,还可以为U盘、移动硬盘、只读存储器、磁盘或光盘等。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
上述存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (20)

1.一种对象点击量的确定方法,其特征在于,包括:
获取第一时段和第一对象在所述第一时段的属性信息;
确定所述属性信息对应的特征向量;
将所述第一时段和所述特征向量输入至第一模型,以使所述第一模型输出所述第一对象在所述第一时段内的点击量;
其中,所述第一模型为对多组样本进行学习得到的,每组样本包括样本对象的样本属性信息和所述样本对象在样本时段内的样本点击量。
2.根据权利要求1所述的方法,其特征在于,所述第一对象在所述第一时段的属性信息包括如下信息中的至少一种:
所述第一对象在至少一个第二时段的点击量,所述第二时段为位于所述第一时段之前的时段;
所述第一对象对应的第一预算信息;
所述第一对象在第三时段的第二预算信息,所述第三时段为所述第一时段之前的时段;
所述第一对象在前一天的所述第一时段的点击量;
所述第一对象在前两天的所述第一时段的点击量;
所述第一时段的类型,所述第一时段的类型为促销时段和非促销时段。
3.根据权利要求1-2任一项所述的方法,其特征在于,所述第一模型的生成步骤至少包括:
获取多个样本对象的历史数据,所述历史数据包括如下信息中的至少一种:所述样本对象在多个历史时段内的点击量、所述样本对象在所述多个历史时段内的预算信息、多个历史时段的类型;
根据所述多个样本对象的历史数据确定多组样本;
对所述多组样本进行学习,得到所述第一模型。
4.根据权利要求3所述的方法,其特征在于,针对所述多个样本对象中的任意一个第一样本对象;根据所述第一样本对象的历史数据确定所述第一样本对象对应的多组样本,包括:
确定多个样本时段;
在所述第一样本对象的历史数据中,分别获取每个样本时段对应的样本属性信息和所述第一样本对象在每个样本时段的样本点击量;
根据每个样本时段对应的样本属性信息和所述第一样本对象在每个样本时段的样本点击量,确定所述第一样本对象对应的多组样本。
5.根据权利要求3或4所述的方法,其特征在于,对所述多组样本进行学习,得到所述第一模型,包括:
确定每组样本中的样本属性信息对应的样本特征向量;
将每组样本中的样本属性信息更新为对应的样本特征向量,得到更新后的多组样本;
对更新后的多组样本进行学习,得到所述第一模型。
6.根据权利要求3-5任一项所述的方法,其特征在于,对所述多组样本进行学习,得到所述第一模型,包括:
通过初始模型对所述多组样本中的样本属性信息进行处理,得到每个样本属性信息对应的预测点击量;
根据每个样本属性信息对应的预测点击量和样本点击量对所述初始模型的模型参数进行调整处理;
重复执行上述两个步骤,直至所述初始模型满足收敛条件时,得到所述第一模型。
7.根据权利要求6所述的方法,其特征在于,根据每个样本属性信息对应的预测点击量和样本点击量对所述初始模型的模型参数进行调整处理,包括:
根据每个样本属性信息对应的预测点击量和样本点击量,对所述模型参数并行的进行多种调整,得到多个目标模型参数。
8.根据权利要求1-7任一项所述的方法,其特征在于,所述方法还包括:
获取通过第一模型确定得到的至少一个对象在至少一个时段内的多个预测点击量;
获取所述至少一个对象在所述至少一个时段内的真实点击量;
根据所述多个预测点击量和所述多个真实点击量,确定所述第一模型的精确度。
9.根据权利要求8所述的方法,其特征在于,根据所述多个预测点击量和所述多个真实点击量,确定所述第一模型的精确度之后,还包括:
在所述第一模型的精确度小于预设阈值时,更新所述第一模型。
10.一种对象点击量的确定装置,其特征在于,包括:
获取模块,用于获取第一时段和第一对象在所述第一时段的属性信息;
处理模块,用于确定所述属性信息对应的特征向量;
所述处理模块,还用于将所述第一时段和所述特征向量输入至第一模型,以使所述第一模型输出所述第一对象在所述第一时段内的点击量;
其中,所述第一模型为对多组样本进行学习得到的,每组样本包括样本对象的样本属性信息和所述样本对象在样本时段内的样本点击量。
11.根据权利要求10所述的装置,其特征在于,所述第一对象在所述第一时段的属性信息包括如下信息中的至少一种:
所述第一对象在至少一个第二时段的点击量,所述第二时段为位于所述第一时段之前的时段;
所述第一对象对应的第一预算信息;
所述第一对象在第三时段的第二预算信息,所述第三时段为所述第一时段之前的时段;
所述第一对象在前一天的所述第一时段的点击量;
所述第一对象在前两天的所述第一时段的点击量;
所述第一时段的类型,所述第一时段的类型为促销时段和非促销时段。
12.根据权利要求10-11任一项所述的装置,其特征在于,所述第一模型的生成步骤至少包括:
获取多个样本对象的历史数据,所述历史数据包括如下信息中的至少一种:所述样本对象在多个历史时段内的点击量、所述样本对象在所述多个历史时段内的预算信息、多个历史时段的类型;
根据所述多个样本对象的历史数据确定多组样本;
对所述多组样本进行学习,得到所述第一模型。
13.根据权利要求12所述的装置,其特征在于,针对所述多个样本对象中的任意一个第一样本对象;所述处理模块还用于:
确定多个样本时段;
在所述第一样本对象的历史数据中,分别获取每个样本时段对应的样本属性信息和所述第一样本对象在每个样本时段的样本点击量;
根据每个样本时段对应的样本属性信息和所述第一样本对象在每个样本时段的样本点击量,确定所述第一样本对象对应的多组样本。
14.根据权利要求12或13所述的装置,其特征在于,所述处理模块还用于:
确定每组样本中的样本属性信息对应的样本特征向量;
将每组样本中的样本属性信息更新为对应的样本特征向量,得到更新后的多组样本;
对更新后的多组样本进行学习,得到所述第一模型。
15.根据权利要求12-14任一项所述的装置,其特征在于,所述处理模块还用于:
通过初始模型对所述多组样本中的样本属性信息进行处理,得到每个样本属性信息对应的预测点击量;
根据每个样本属性信息对应的预测点击量和样本点击量对所述初始模型的模型参数进行调整处理;
重复执行上述两个步骤,直至所述初始模型满足收敛条件时,得到所述第一模型。
16.根据权利要求15所述的装置,其特征在于,所述处理模块具体用于:
根据每个样本属性信息对应的预测点击量和样本点击量,对所述模型参数并行的进行多种调整,得到多个目标模型参数。
17.根据权利要求10-16任一项所述的装置,其特征在于,所述获取模块还用于:
获取通过第一模型确定得到的至少一个对象在至少一个时段内的多个预测点击量;
获取所述至少一个对象在所述至少一个时段内的真实点击量;
所述处理模块还用于:
根据所述多个预测点击量和所述多个真实点击量,确定所述第一模型的精确度。
18.根据权利要求17所述的装置,其特征在于,所述处理模块还用于:
在根据所述多个预测点击量和所述多个真实点击量,确定所述第一模型的精确度之后,在所述第一模型的精确度小于预设阈值时,更新所述第一模型。
19.一种对象点击量的确定设备,其特征在于,包括:
存储器,用于存储程序;
处理器,用于执行所述存储器存储的所述程序,当所述程序被执行时,所述处理器用于执行如权利要求1至9中任一所述的方法。
20.一种计算机可读存储介质,其特征在于,包括指令,当其在计算机上运行时,使得计算机执行如权利要求1至9中任一所述的方法。
CN202010840747.3A 2020-08-20 2020-08-20 对象点击量的确定方法及装置 Pending CN113763000A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010840747.3A CN113763000A (zh) 2020-08-20 2020-08-20 对象点击量的确定方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010840747.3A CN113763000A (zh) 2020-08-20 2020-08-20 对象点击量的确定方法及装置

Publications (1)

Publication Number Publication Date
CN113763000A true CN113763000A (zh) 2021-12-07

Family

ID=78785598

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010840747.3A Pending CN113763000A (zh) 2020-08-20 2020-08-20 对象点击量的确定方法及装置

Country Status (1)

Country Link
CN (1) CN113763000A (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070198343A1 (en) * 2006-02-17 2007-08-23 Derek Collison Assessing advertiser charges for manual user insertion of one or more ads into a document to be made available to another user or users, for distribution of such documents and/or for user actions on such distributed ads
US20140058827A1 (en) * 2012-08-27 2014-02-27 Andrey SVIRSKY Method and apparatus for optimizing the delivery of display advertising impressions
CN104268644A (zh) * 2014-09-23 2015-01-07 新浪网技术(中国)有限公司 广告位上的广告的点击次数预估方法和装置
CN105160548A (zh) * 2015-08-20 2015-12-16 北京奇虎科技有限公司 对广告点击率进行预测的方法及装置
CN105654200A (zh) * 2015-12-30 2016-06-08 上海珍岛信息技术有限公司 一种基于深度学习的广告点击率预测方法及装置
CN107767174A (zh) * 2017-10-19 2018-03-06 厦门美柚信息科技有限公司 一种广告点击率的预测方法及装置
CN108122122A (zh) * 2016-11-29 2018-06-05 腾讯科技(深圳)有限公司 广告投放方法和系统
CN109992710A (zh) * 2019-02-13 2019-07-09 网易传媒科技(北京)有限公司 点击率预估方法、系统、介质和计算设备
CN110796477A (zh) * 2019-09-23 2020-02-14 北京三快在线科技有限公司 广告展示方法、装置、电子设备及可读存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070198343A1 (en) * 2006-02-17 2007-08-23 Derek Collison Assessing advertiser charges for manual user insertion of one or more ads into a document to be made available to another user or users, for distribution of such documents and/or for user actions on such distributed ads
US20140058827A1 (en) * 2012-08-27 2014-02-27 Andrey SVIRSKY Method and apparatus for optimizing the delivery of display advertising impressions
CN104268644A (zh) * 2014-09-23 2015-01-07 新浪网技术(中国)有限公司 广告位上的广告的点击次数预估方法和装置
CN105160548A (zh) * 2015-08-20 2015-12-16 北京奇虎科技有限公司 对广告点击率进行预测的方法及装置
CN105654200A (zh) * 2015-12-30 2016-06-08 上海珍岛信息技术有限公司 一种基于深度学习的广告点击率预测方法及装置
CN108122122A (zh) * 2016-11-29 2018-06-05 腾讯科技(深圳)有限公司 广告投放方法和系统
CN107767174A (zh) * 2017-10-19 2018-03-06 厦门美柚信息科技有限公司 一种广告点击率的预测方法及装置
CN109992710A (zh) * 2019-02-13 2019-07-09 网易传媒科技(北京)有限公司 点击率预估方法、系统、介质和计算设备
CN110796477A (zh) * 2019-09-23 2020-02-14 北京三快在线科技有限公司 广告展示方法、装置、电子设备及可读存储介质

Similar Documents

Publication Publication Date Title
US20180278640A1 (en) Selecting representative metrics datasets for efficient detection of anomalous data
US10129274B2 (en) Identifying significant anomalous segments of a metrics dataset
US11902114B2 (en) System and method for predicting and reducing subscriber churn
JP5662446B2 (ja) リアルタイム広告入札に対して競争評価モデルを使用するための学習システム
CN111401777B (zh) 企业风险的评估方法、装置、终端设备及存储介质
JP6547070B2 (ja) プッシュ情報粗選択ソーティングの方法、デバイス、およびコンピュータ記憶媒体
CA2915242A1 (en) Inference-based behavioral personalization and targeting
US20160210656A1 (en) System for marketing touchpoint attribution bias correction
CN107578270A (zh) 一种金融标签的构建方法、装置及计算设备
CN116452261B (zh) 一种基于跨境电商服务平台的广告投放数据处理方法
US20200065876A1 (en) Item line assignment systems and methods
CN111754287A (zh) 物品筛选方法、装置、设备和存储介质
US20220114607A1 (en) Method, apparatus and computer readable storage medium for data processing
US10360582B2 (en) Social commerce return on investment
CN113763000A (zh) 对象点击量的确定方法及装置
US20220351223A1 (en) System and method for predicting prices for commodities in a computing environment
US11657409B2 (en) System and method for product demand transfer estimation through machine learning
CN113987186A (zh) 一种基于知识图谱生成营销方案的方法和装置
Chong et al. Customer Churn Prediction of Telecom Company Using Machine Learning Algorithms
CN113435748A (zh) 网点状态确定方法、装置、电子设备以及存储介质
Henriques et al. A novel evaluation framework for recommender systems in big data environments
US20230177588A1 (en) System and method for providing one or more recommendations
CN113469374B (zh) 数据预测方法、装置、设备及介质
CN117195061B (zh) 事件响应预测模型处理方法、装置和计算机设备
US20230162214A1 (en) System and method for predicting impact on consumer spending using machine learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination