CN108122122A - 广告投放方法和系统 - Google Patents

广告投放方法和系统 Download PDF

Info

Publication number
CN108122122A
CN108122122A CN201611073761.5A CN201611073761A CN108122122A CN 108122122 A CN108122122 A CN 108122122A CN 201611073761 A CN201611073761 A CN 201611073761A CN 108122122 A CN108122122 A CN 108122122A
Authority
CN
China
Prior art keywords
advertisement
parameter
prediction
characteristic parameter
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611073761.5A
Other languages
English (en)
Inventor
周琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201611073761.5A priority Critical patent/CN108122122A/zh
Publication of CN108122122A publication Critical patent/CN108122122A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • G06Q30/0244Optimization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • G06Q30/0256User search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种广告投放方法,包括:获取在预定历史时间段内的预定历史投放广告的点击率特征参数;将所述特征参数中至少两种特征类型的特征参数进行交叉组合得到组合特征参数,对特征参数及组合特征参数进行数字化,得到特征参数集合;对所述特征参数集合进行特征选择得到目标特征参数;基于所述目标特征参数对预测模型进行训练,通过所述预测模型对待预测广告的点击率进行预测计算。本申请还提供一种广告投放系统,通过在对广告点击率预测过程中对特征参数进行组合和数字化之后再进行特征选择可以提高特征选择的质量,最大程度上可以避免误删除有信息量的特征,同时减小计算压力和减小响应时间,确保广告投放的实时性和点击率预测精度。

Description

广告投放方法和系统
技术领域
本发明涉及互联网广告技术领域,特别是涉及一种广告投放方法和系统。
背景技术
目前在互联网领域,点击率预测是计算广告投放成本的重要环节,如:点击率预测可以应用于给用户个性化推送广告,从而提升广告的整体点击率、转换率,从而提高广告的价值。其次点击率预测也可以用于估算曝光的价格,使得广告主在广告网络中实时竞价或者曝光,从而以合适的价格买到自己所需的曝光。
现在业界常见的点击率预测方法有如下几种:第一种平均点击率预测,即根据对某个广告的平均点击率作为任何一个人对这个广告点击率的预测值。第二种分人群点击率预测,即根据某个人群对某个广告的平均点击率作为任何该人群对该广告的点击率预测值,如男性人群对某广告的点击率为0.01,那么针对任何男性预测其对该广告的点击率预测值为0.01。第三种基于模型的点击率预测,如目前常用的逻辑回归模型,模型包含广告投放的特征,如用户特征(用户搜索关键词、网页流量记录、广告点击记录等)、网页特征(网页分类、网页关键词等)、广告特征(广告类别、广告引导页、广告关键词等),利用逻辑回归模型进行点击率预测。
然而,以上点击率预测方式存在以下问题:
平均点击率预测和分人群点击率预测对于人群划分过粗,无法应用到更多特征,所以这两种方法的点击率预测精度低。基于模型的点击率预测,考虑的广告投放特征过多,可能加入一些没有信息量的特征,从而影响整体点击率预测的精度,也会导致广告投放服务器的计算压力过大、响应时间长,降低了广告投放的速度,对广告投放的实时性造成影响。
发明内容
基于此,有必要提供一种可以提高投放精确率和实时性的广告投放方法和系统。
一种广告投放方法,包括:
获取在预定历史时间段内的预定历史投放广告的点击率特征参数;
将所述特征参数中至少两种特征类型的特征参数进行交叉组合得到组合特征参数,将所述特征参数及所述组合特征参数进行数字化,得到特征参数集合;
对所述特征参数集合进行特征选择得到目标特征参数;
基于所述目标特征参数对预测模型进行训练,通过所述预测模型对待预测广告的点击率进行预测计算。
一种广告投放系统,包括:
参数获取模块,用于获取在预定历史时间段内的预定历史投放广告的点击率特征参数;
组合模块,用于将所述特征参数中至少两种特征类型的特征参数进行交叉组合得到组合特征参数,将所述特征参数及所述组合特征参数进行数字化,得到特征参数集合;
筛选模块,用于对所述特征参数集合进行特征选择得到目标特征参数;
预测模块,用于基于所述目标特征参数对预测模型进行训练,通过所述预测模型对待预测广告的点击率进行预测计算。
上述广告投放方法和系统,通过获取历史投放广告的点击率特征参数,并对特征参数进行组合和数字化之后再进行特征选择得到目标特征参数,进行特征选择之前包括对特征参数进行交叉组合的步骤,以特征参数及组合特征参数作共同为待选择对象进行特征选择可以提高特征选择的质量,最大程度上可以避免误删除有信息量的特征,在同时确保有效保留有价值的特征与删除无信息量的特征的基础上进行预测模型训练,得到预测精度更高的点击率预测模型,减小计算压力和减小响应时间,确保广告投放的实时性和点击率预测精度。
附图说明
图1为一实施例中广告投放方法的系统架构图;
图2为一实施例中服务器的内部结构示意图;
图3为一实施例中广告投放方法的流程图;
图4为另一实施例中广告投放方法的流程图;
图5为又一实施例中广告投放方法的流程图;
图6为再一实施例中广告投放方法的流程图;
图7为一实施例中广告投放系统的结构示意图;
图8为另一实施例中广告投放系统的结构示意图;
图9为又一实施例中广告投放系统的结构示意图;
图10为再一实施例中广告投放系统的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
本发明实施例提供的广告投放方法可应用于图1所示的系统中,如图1所示,终端100通过网络与服务器200进行通信,服务器将广告投放到终端,终端获取用户点击广告的指令并返回用户已点击指令给服务器,服务器根据终端返回的用户已点击指令获取所投放广告的点击率特征参数,该点击率特征参数包括点击所投放广告的终端对应的用户的属性参数及对应广告的各维度特征参数。其中,终端可以为智能手机、平板电脑、个人数字助理(PDA)及个人计算机等。服务器可以为独立的物理服务器或者物理服务器集群。
图1中的服务器200的内部结构如图2所示,该服务器200包括通过系统总线链接的处理器、存储介质、内存和网络接口。其中,该服务器200的存储介质存储有操作系统、数据库和一种广告投放系统。数据库用于存储数据,如待投放广告、历史投放广告及与其对应的点击率特征参数等。该服务器200的处理器用于提供计算和控制能力,支撑整个接入服务器200的运行。该服务器200的内存为存储介质中的广告投放系统的运行提供环境。该服务器200的网络接口用于与外部的终端100通过网络连接通信,比如接收终端100发送的已点击相关指令等。
如图3所示,为本申请一实施例提供的一种广告投放方法,包括以下步骤。
步骤101,获取在预定历史时间段内的预定历史投放广告的点击率特征参数。
特征是指在机器学习或者模式识别中对某个事件的一种可度量的性质。广告的点击率特征参数是指能够反映广告被点击的概率的特征。通常,广告被点击的概率与广告所适应的人群、广告的位置及广告自身内容等相关,因而广告的点击率特征参数主要包括点击所投放广告的用户的用户特征、承载所投放广告的网页的网页特征及反映所投放广告自身内容的广告特征。其中用户特征包括用户属性、用户搜索关键词、网页浏览记录、广告点击记录等。网页特征包括网页分类、网页关键词等。广告特征包括广告类别、广告引导页及广告关键词等。
预定历史时间段、预定历史投放广告可以根据不同的需求进行设置,如预定历史时间段以天为单位,预定历史投放广告以金融类历史投放广告为例,获取前30天的金融类历史投放广告的点击率特征参数。其中,预定历史投放广告的范围不限于某一类别的广告,也可以是多种类别广告的组合。在另一优选的实施例中,获取在预定历史时间段内的预定历史投放广告的点击率特征参数的步骤中,还可以分别选定不同类型的历史投放广告,并针对不同类型的历史投放广告分别设置不同的历史时间段,如针对金融类历史投放广告的历史时间段设置为30天,针对教育类历史投放广告设定为40天,从而获取前30天的金融类历史投放广告及前40天的教育类历史投放广告,以获取满足不同分析需求的点击率特征参数。
步骤103,将特征参数中至少两种特征类型的特征参数进行交叉组合得到组合特征参数,将特征参数和组合特征参数进行数字化,得到特征参数集合。
特征类型是指特征的种类,如用户属性通常包括性别、年龄、学历等,性别、年龄和学历为三种不同种类的特征;广告类别包括教育类广告、金融类广告等,教育类广告和金融类广告为两种不同种类的特征。将特征参数中至少两种特征类型的特征参数进行交叉组合是指将多个不同种类的特征通过与的形式合并在一起,表示一种并且的关系,其中组合的方式可以是任意两种不同类型或者两种以上不同类型的特征进行组合。如将性别和年龄两种类型的特征进行组合,或者将性别、年龄和广告类别三种类型的特征进行组合,其中,年龄特征划分为0~20岁、20岁以上两个特征,性别特征分为男和女两个特征,将性别和年龄进行组合得到组合特征参数分别为性别_男_年龄_0~20、性别_男_年龄_20以上、性别_女_年龄_0~20、性别_女_年龄_20以上;将广告类别特征分别教育类广告和金融类广告两个特征,将性别、年龄和广告类别进行组合得到组合特征参数分别为性别_男_年龄_0~20_广告类别_教育、性别_男_年龄_0~20_广告类别_金融、性别_男_年龄_20以上_广告类别_教育、性别_男_年龄_20以上_广告类别_金融、性别_女_年龄_0~20_广告类别_教育、性别_女_年龄_0~20_广告类别_金融、性别_女_年龄_20以上_广告类别_教育、性别_女_年龄_20以上_广告类别_金融。
数字化是指将特征类型的表示用0和1数字化,满足相应特征条件用1表示,不满足则用0表示,从而用0和1数字化表示所有特征参数和组合特征参数,如根据历史投放广告的点击率特征参数,针对金融类的历史投放广告,广告类别_金融这一特征参数相应为1,而针对不满足该类型的历史投放广告则相应为0;针对年龄为25岁男士点击金融类广告的历史投放广告,性别_男_年龄_20以上_广告类别_金融这一组合特征参数相应为1,而针对不满足的组合特征参数则相应为0。以此类推,可以将预定历史时间段内的预定历史投放广告的点击率参数全部通过数字化表示。
步骤105,对特征参数集合进行特征选择得到目标特征参数。
特征选择是指从已有的M个特征中选择N个特征使得系统的特定指标最优化,是从原始特征中选择出一些最有效特征以降低数据集维度的过程。特征选择是提高学习算法性能的一个重要手段,通过特征选择,将与广告点击率呈明显正相关的的特征参数及组合特征参数选择作为目标特征参数,从而保留有用的特征同时过滤掉无用的特征,以提升预测精度。其中,同时以特征参数及组合特征参数作为特征选择的原始特征,可以避免误删除有信息量的特征,同时尽可能减小计算压力和减小响应时间,确保广告投放的实时性和点击率的预测精度。以特征参数及组合特征参数作为特征选择的原始特征,相对于先经过特征选择之后再进行不同类型的特征组合得到组合特征参数的手段而言,某特征单独作为判断是否为与广告点击率呈明显正相关的判断结果可能出现误差,如针对历史投放广告的点击率的特征参数的获取和分析,发现地域这一特征参数与广告点击率是否呈正相关关系非常小,并不具有参考价值,然而将地域和广告类型两种类型特征进行组合后形成组合特征参数进行分析,发现针对某金融类广告的点击率上海和香港两地具有非常明显的关系,如地域_上海_广告类型_金融、地域_香港_广告类型_金融,从而可以保留“地域_香港,地域_上海”的广告,其它地域相关的特征则过滤掉,从而避免直接过滤掉地域这一特征参数所带来的分析误差。
步骤107,基于目标特征参数对预测模型进行训练,通过预测模型对待预测广告的点击率进行预测计算。
机器学习中,从数据产生决策树的机器学习即是对预测模型进行训练的过程。以目标特征参数作为输入训练预测模型以确定模型训练参数。提取待预测广告的特征参数,基于该模型训练参数及待预测广告的特征参数对该待预测广告的点击率进行预测计算。
本实施例所提供的广告投放方法中,通过获取历史投放广告的点击率特征参数,并对特征参数进行组合和数字化之后再进行特征选择,可以提高特征选择的质量,最大程度上可以避免误删除有信息量的特征,同时减小计算压力和减小响应时间,确保广告投放的实时性和点击率预测精度。
优选的,步骤105,对特征参数集合进行特征选择得到目标特征参数的步骤具体为:基于信息增益的特征选择方法对特征参数集合进行特征选择得到目标特征参数。
其中,特征参数集合内的待选择特征包括单个特征参数及不同特征类型组合得到的组合特征参数,相对现有技术中仅对单个特征参数进行特征选择的方案而言待选择特征的数量相对较多,采用基于信息增益的特征选择方法进行特征选择,可以运用特征出现概率计算信息增益权值并使用离散度分析特征的信息增益值,降低低频词对特征选择的干扰及高频词中的冗余特征,避免了现有技术中仅对单个特征参数进行特征选择而导致误删除有信息量的特征,且可从大量的待选特征当中高效筛选出有信息量的特征,以获得更有价值、更准确的待选特征作为目标特征参数。
请参阅图4,在另一个实施例中,步骤105,对特征参数集合进行特征选择得到目标特征参数的步骤包括:
步骤1051,通过基于信息增益的特征选择方法分别获取特征参数集合中所述特征参数及组合特征参数的信息增益,选择信息增益大于预设值的特征参数及组合特征参数作为目标特征参数。
信息增益是指表示某个特征参数或组合特征参数具有的信息量,其计算公式如下:
IG(T,a)=H(T)-H(T|a);
其中,T表示训练数据,a表示某特征,H(T)表示训练数据的熵,H(T|a)表示训练数据在特征a下的条件熵,这两者之差就是特征a的信息增益。信息增益越大,则表示相应的特征越具有信息量,通过分别计算单个特征参数及组合特征参数的信息增益并将计算结果与预设值进行比较,获取信息增益大于预设值的单个特征参数及组合特征参数作为目标特征参数,可以将相对最具有信息量的单个特征参数及组合特征参数筛选出来,越使得点击率预测更准确。可以理解的,也可以采用已知的其它特征选择方法,如基于Wrapper评价策略的特征选择方法、基于Filter评价策略的特征选择方法等对组合特征参数进行选择得到目标特征参数。
优选的,步骤107,基于目标特征参数对预测模型进行训练,通过预测模型对待预测广告的点击率进行预测计算的步骤包括:
步骤1071,基于目标特征参数对逻辑回归模型进行训练得到点击率预测模型;
步骤1073,提取待预测广告的各维度特征参数,通过点击率预测模型对待预测广告的点击率进行预测计算。
本实施例中,以逻辑回归模型作为待训练的预测模型,以目标特征参数作为逻辑回归模型的输入进行训练,确定最优化的模型特征参数,得到点击率预测模型。逻辑回归模型是一种基于判别式的方法,它假定类的实例是线性可分的,通过直接估计判别式的参数,获取最终的预测模型,具体的,逻辑回归模型的建模如下:
其中P(C1|φ)代表在特征φ下,φ为类别1的概率。那么φ为类别0的概率为通过梯度下降法我们可以估计出判别式的参数w。
待预测广告的各维度特征参数主要包括广告特征,如广告类别、广告引导液和广告关键词等。可以理解的,根据待预测广告的预投放对象和位置等的不同,待预测广告的各维度特征参数包含的特征类型也可以不同。通过提取待预测广告的各维度特征参数,基于逻辑回归模型的模型特征参数和该待预测广告的各维度特征参数可实现对待预测广告的点击率进行预测计算。
优选的,请参阅图5,步骤107,基于目标特征参数对预测模型进行训练,通过预测模型对待预测广告的广告点击率进行预测计算的步骤之后,还包括:
步骤108,根据所述预测计算的结果将所述待预测广告投放至对应的终端。
对待预测广告的广告点击率的预测计算可以根据不同的预测需求得到相应的最佳结果。如预测需求为针对某待投放广告寻求最佳投放对象,通过提取待预测广告的特征参数,根据待预测广告的特征参数通过预测模型获取包含该待预测广告的特征参数的单个特征参数和组合特征参数的信息增益,选取信息增益大于预设值的单个特征参数和组合特征参数,根据信息增益大于预设值的单个特征参数和组合特征参数确定针对该类型待投放广告点击率较大的用户特征,根据用户特征确定最佳的待投放对象,具体以某待投放广告为金融类广告为例,提取该待投放广告的广告特征,并通过预测模型获取与该广告特征相关的单个特征参数及组合特征参数的信息增益,信息增益越大,表示具备该单个特征参数及组合特征参数的投放广告的被点击率越大,选取信息增益大于预设值的单个特征参数及组合特征参数以根据这些单个特征参数及组合特征参数确定用户性别、年龄、所属区域等关联的用户特征,从而将符合该用户性别、年龄、所属区域的条件的对象确定为该待投放广告的待投放对象,如符合年龄_20岁以上_性别_男_地域_香港这一条件的对象确定为该金融类广告的投放对象。通过对待预测广告的广告点击率进行预测计算后将待预测广告的投放对象,以提升广告的整体点击率、转换率,从而可以提升广告的价值。
优选的,请参阅图6,步骤107,基于目标特征参数对预测模型进行训练,通过预测模型对待预测广告的广告点击率进行预测计算的步骤之后,还包括:
步骤109,根据预测计算的结果对待预测广告的曝光进行估价。
估价的计算方式是预测点击率与转化率的乘积。通过预测模型对待预测广告的广告点击率进行预测计算获取预测点击率,通过该预测点击率及广告投放的转化率对曝光进行估价,通过估算曝光的价格,使得广告主在广告网络中可实时竞价或者曝光,从而可以合适的价格买到自己所需的曝光。
优选的,步骤103,将特征参数中至少两种特征类型的特征参数进行交叉组合得到组合特征参数,将特征参数及组合特征参数进行数字化,得到特征参数集合的步骤的之前,还包括将所述特征参数进行离散化的步骤。其中离散化是指将连续型数据进行切分,其中切分的原则有等距、等频、优化等,根据不同特征参数数据的特点而确定。如用户属性中包含的学历特征可以有小学、中学、专科、本科、硕士、博士等。将学历特征离散化后对应形成六个特征,即学历_小学、学历_中学、学历_专科、学历_本科、学历_硕士、学历_博士。通过将特征参数离散化,可以有效地克服数据中隐藏的缺陷,使得模型结果更加稳定。
上述广告投放方法,通过获取历史投放广告的点击率特征参数,并对特征参数进行组合和数字化之后,通过基于信息增益的方法对单个特征参数及组合特征参数进行特征选择,如单独地域这一类型特征参数,可能与广告的点击与否没有关系,然而地域与年龄、性别等形成组合参数特征就可以是比较有信息量的特征,通过对同时对单个特征参数及组合特征参数进行特征选择,可以提高特征选择的质量,最大程度上避免误删除有信息量的特征,同时筛选掉信息量不足的特征减小计算压力和减少响应时间,确保广告投放的实时性和点击率预测精度。通过对待投放广告的点击率预测中提高特征选择的质量,从而可以有效的提高广告投放中点击率预测的精度,可以给用户推荐更为精准的广告,实现个性化推荐,提高广告价值。对于实时竞价广告系统中,可以提高对一次广告曝光价值的估计,从而减小广告投放成本。
如图7所示,在一个实施例中,提供了一种广告投放系统,包括参数获取模块10、组合模块13、筛选模块15和预测模块17。参数获取模块10用于获取在预定历史时间段内的预定历史投放广告的点击率特征参数。组合模块13用于将特征参数中至少两种特征类型的特征参数进行交叉组合得到组合特征参数,将特征参数及组合特征参数进行数字化,得到特征参数集合。筛选模块15用于对特征参数集合进行特征选择得到目标特征参数。预测模块17用于基于目标特征参数对预测模型进行训练,通过预测模型对待预测广告的点击率进行预测计算。
优选的,筛选模块15具体用于通过基于信息增益的特征选择方法对特征参数集合进行特征选择得到目标特征参数。在一个实施例中,筛选模块15具体用于通过基于信息增益的特征选择方法分别获取特征参数集合中所述特征参数及组合特征参数的信息增益,选择信息增益大于预设值的特征参数及组合特征参数作为目标特征参数。
优选的,在另一个实施例中,请参阅图8,预测模块17包括训练单元171和预测单元173。训练单元171用于基于目标特征参数对逻辑回归模型进行训练得到点击率预测模型。预测单元173用于提取待预测广告的各维度特征参数,通过点击率预测模型对待预测广告的点击率进行预测计算。
优选的,请参阅图9,广告投放系统还包括投放模块18。投放模块18用于根据预测计算的结果将待预测广告投放至对应的终端。
优选的,请参阅图10,广告投放系统还包括估价模块19。估价模块19用于根据预测计算的结果对待预测广告的曝光进行估价。
上述广告投放系统,通过参数获取模块获取历史投放广告的点击率特征参数,组合模块对特征参数进行组合和数字化之后形成特征参数集合,筛选模块采用基于信息增益的方法对组合特征参数及单个特征参数进行特征选择,如,单独地域这一类型特征参数,可能与广告的点击与否没有关系,然而地域与年龄、性别等形成组合参数特征就可以是比较有信息量的特征,通过筛选模块同时对单个特征参数及组合特征参数进行特征选择,可以提高特征选择的质量,最大程度上避免误删除有信息量的特征,同时筛选掉信息量不足的特征减小计算压力和减少响应时间,确保广告投放的实时性和点击率预测精度。通过对待投放广告的点击率预测中提高特征选择的质量,从而可以有效的提高广告投放中点击率预测的精度,给用户推荐更为精准的广告,实现个性化推荐,提高广告价值。对于实时竞价广告系统中,可以提高对一次广告曝光价值的估计,从而减小广告投放成本。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述实施例仅库达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

Claims (10)

1.一种广告投放方法,包括:
获取在预定历史时间段内的预定历史投放广告的点击率特征参数;
将所述特征参数中至少两种特征类型的特征参数进行交叉组合得到组合特征参数,将所述特征参数及所述组合特征参数进行数字化,得到特征参数集合;
对所述特征参数集合进行特征选择得到目标特征参数;
基于所述目标特征参数对预测模型进行训练,通过所述预测模型对待预测广告的点击率进行预测计算。
2.如权利要求1所述的广告投放方法,其特征在于:所述对所述特征参数集合进行特征选择得到目标特征参数的步骤包括:
通过基于信息增益的特征选择方法分别获取所述特征参数集合中所述特征参数及组合特征参数的信息增益,选择所述信息增益大于预设值的所述特征参数及组合特征参数作为目标特征参数。
3.如权利要求1所述的广告投放方法,其特征在于:所述基于所述目标特征参数对预测模型进行训练,通过所述预测模型对待预测广告的点击率进行预测计算的步骤包括:
基于所述目标特征参数对逻辑回归模型进行训练得到点击率预测模型;
提取待预测广告的各维度特征参数,通过所述点击率预测模型对待预测广告的点击率进行预测计算。
4.如权利要求1所述的广告投放方法,其特征在于:所述基于所述目标特征参数对预测模型进行训练,通过所述预测模型对待预测广告的广告点击率进行预测计算的步骤之后,还包括:
根据所述预测计算的结果将所述待预测广告投放至对应的终端。
5.如权利要求1所述的广告投放方法,其特征在于:所述基于所述目标特征参数对预测模型进行训练,通过所述预测模型对待预测广告的广告点击率进行预测计算的步骤之后,还包括:
根据所述预测计算的结果对所述待预测广告的曝光进行估价。
6.一种广告投放系统,包括:
参数获取模块,用于获取在预定历史时间段内的预定历史投放广告的点击率特征参数;
组合模块,用于将所述特征参数中至少两种特征类型的特征参数进行交叉组合得到组合特征参数,将所述特征参数及所述组合特征参数进行数字化,得到特征参数集合;
筛选模块,用于对所述特征参数集合进行特征选择得到目标特征参数;
预测模块,用于基于所述目标特征参数对预测模型进行训练,通过所述预测模型对待预测广告的点击率进行预测计算。
7.如权利要求6所述的广告投放系统,其特征在于:所述筛选模块具体用于通过基于信息增益的特征选择方法分别获取所述特征参数集合中所述特征参数及组合特征参数的信息增益,选择所述信息增益大于预设值的所述特征参数及组合特征参数作为目标特征参数。
8.如权利要求6所述的广告投放系统,其特征在于:所述预测模块包括:
训练单元,用于基于所述目标特征参数对逻辑回归模型进行训练得到点击率预测模型;
预测单元,用于提取待预测广告的各维度特征参数,通过所述点击率预测模型对待预测广告的点击率进行预测计算。
9.如权利要求6所述的广告投放系统,其特征在于:还包括:
投放模块,用于根据所述预测计算的结果将所述待预测广告投放至对应的终端。
10.如权利要求6所述的广告投放系统,其特征在于:还包括:
估价模块,用于根据所述预测计算的结果对所述待预测广告的曝光进行估价。
CN201611073761.5A 2016-11-29 2016-11-29 广告投放方法和系统 Pending CN108122122A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611073761.5A CN108122122A (zh) 2016-11-29 2016-11-29 广告投放方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611073761.5A CN108122122A (zh) 2016-11-29 2016-11-29 广告投放方法和系统

Publications (1)

Publication Number Publication Date
CN108122122A true CN108122122A (zh) 2018-06-05

Family

ID=62225848

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611073761.5A Pending CN108122122A (zh) 2016-11-29 2016-11-29 广告投放方法和系统

Country Status (1)

Country Link
CN (1) CN108122122A (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108428161A (zh) * 2018-06-20 2018-08-21 北京奇艺世纪科技有限公司 广告的可投放量的预测方法、装置及电子设备
CN109102321A (zh) * 2018-07-09 2018-12-28 北京奇艺世纪科技有限公司 一种预算撞线预测方法及装置
CN109360020A (zh) * 2018-09-29 2019-02-19 北京奇虎科技有限公司 一种广告的生成方法及装置
CN109711885A (zh) * 2018-12-27 2019-05-03 上海旺翔文化传媒股份有限公司 激励视频广告智能投放方法
CN109858942A (zh) * 2018-11-06 2019-06-07 北京奇虎科技有限公司 推广信息展示方法、装置、电子设备及可读存储介质
CN109902849A (zh) * 2018-06-20 2019-06-18 华为技术有限公司 用户行为预测方法及装置、行为预测模型训练方法及装置
CN110009429A (zh) * 2019-04-10 2019-07-12 金瓜子科技发展(北京)有限公司 一种预测流量数据的方法、装置和计算机设备
CN110189171A (zh) * 2019-05-27 2019-08-30 北京金山安全软件有限公司 特征数据的生成方法、装置及设备
CN111091400A (zh) * 2018-10-23 2020-05-01 第四范式(北京)技术有限公司 广告转化预测模型的生成以及投放广告的方法和装置
CN111144957A (zh) * 2020-04-07 2020-05-12 腾讯科技(深圳)有限公司 信息投放方法、装置、服务器及存储介质
CN111310988A (zh) * 2020-01-23 2020-06-19 湖南快乐阳光互动娱乐传媒有限公司 广告流量预测方法及装置
CN111523939A (zh) * 2020-04-23 2020-08-11 腾讯科技(深圳)有限公司 一种推广内容的投放方法、装置、存储介质和电子设备
CN111566684A (zh) * 2020-04-13 2020-08-21 支付宝(杭州)信息技术有限公司 用于优化广告的用户分组的方法和系统
CN111860986A (zh) * 2020-07-07 2020-10-30 北京明略昭辉科技有限公司 一种预测模型的训练方法、广告点击预测方法及装置
CN112465558A (zh) * 2020-12-08 2021-03-09 上海明略人工智能(集团)有限公司 用于预测区域广告触达率的方法、装置及设备
CN112541776A (zh) * 2019-09-20 2021-03-23 北京达佳互联信息技术有限公司 数据处理方法、装置、电子设备及存储介质
CN112749997A (zh) * 2018-10-11 2021-05-04 广东聚宝屋传媒有限公司 基于快递包裹的广告投放管理方法及装置
CN112966577A (zh) * 2021-02-23 2021-06-15 北京三快在线科技有限公司 一种模型训练以及信息提供的方法及装置
CN113222656A (zh) * 2021-04-29 2021-08-06 西安点告网络科技有限公司 一种程序化广告投放方法、系统、装置、设备及存储介质
CN113763035A (zh) * 2021-08-12 2021-12-07 苏宁易购集团股份有限公司 广告投放的效果预测方法、装置、计算机设备和存储介质
CN113763000A (zh) * 2020-08-20 2021-12-07 北京沃东天骏信息技术有限公司 对象点击量的确定方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103310003A (zh) * 2013-06-28 2013-09-18 华东师范大学 一种基于点击日志的新广告点击率预测方法及系统
CN103440584A (zh) * 2013-07-31 2013-12-11 北京亿赞普网络技术有限公司 一种广告投放方法和系统
CN104239351A (zh) * 2013-06-20 2014-12-24 阿里巴巴集团控股有限公司 一种用户行为的机器学习模型的训练方法及装置
CN104318255A (zh) * 2014-11-17 2015-01-28 成都品果科技有限公司 一种移动拍照类app用户的性别识别方法及系统
CN105160548A (zh) * 2015-08-20 2015-12-16 北京奇虎科技有限公司 对广告点击率进行预测的方法及装置
CN105631707A (zh) * 2015-12-23 2016-06-01 北京奇虎科技有限公司 基于决策树的广告点击率预估方法与应用推荐方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239351A (zh) * 2013-06-20 2014-12-24 阿里巴巴集团控股有限公司 一种用户行为的机器学习模型的训练方法及装置
CN103310003A (zh) * 2013-06-28 2013-09-18 华东师范大学 一种基于点击日志的新广告点击率预测方法及系统
CN103440584A (zh) * 2013-07-31 2013-12-11 北京亿赞普网络技术有限公司 一种广告投放方法和系统
CN104318255A (zh) * 2014-11-17 2015-01-28 成都品果科技有限公司 一种移动拍照类app用户的性别识别方法及系统
CN105160548A (zh) * 2015-08-20 2015-12-16 北京奇虎科技有限公司 对广告点击率进行预测的方法及装置
CN105631707A (zh) * 2015-12-23 2016-06-01 北京奇虎科技有限公司 基于决策树的广告点击率预估方法与应用推荐方法及装置

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109902849A (zh) * 2018-06-20 2019-06-18 华为技术有限公司 用户行为预测方法及装置、行为预测模型训练方法及装置
US11531867B2 (en) 2018-06-20 2022-12-20 Huawei Technologies Co., Ltd. User behavior prediction method and apparatus, and behavior prediction model training method and apparatus
CN108428161B (zh) * 2018-06-20 2022-06-03 北京奇艺世纪科技有限公司 广告的可投放量的预测方法、装置及电子设备
CN108428161A (zh) * 2018-06-20 2018-08-21 北京奇艺世纪科技有限公司 广告的可投放量的预测方法、装置及电子设备
CN109102321A (zh) * 2018-07-09 2018-12-28 北京奇艺世纪科技有限公司 一种预算撞线预测方法及装置
CN109360020A (zh) * 2018-09-29 2019-02-19 北京奇虎科技有限公司 一种广告的生成方法及装置
CN109360020B (zh) * 2018-09-29 2023-12-15 三六零科技集团有限公司 一种广告的生成方法及装置
CN112749997A (zh) * 2018-10-11 2021-05-04 广东聚宝屋传媒有限公司 基于快递包裹的广告投放管理方法及装置
CN112749997B (zh) * 2018-10-11 2023-10-20 广东聚宝屋传媒有限公司 基于快递包裹的广告投放管理方法及装置
CN111091400A (zh) * 2018-10-23 2020-05-01 第四范式(北京)技术有限公司 广告转化预测模型的生成以及投放广告的方法和装置
CN109858942B (zh) * 2018-11-06 2023-12-15 三六零科技集团有限公司 推广信息展示方法、装置、电子设备及可读存储介质
CN109858942A (zh) * 2018-11-06 2019-06-07 北京奇虎科技有限公司 推广信息展示方法、装置、电子设备及可读存储介质
CN109711885A (zh) * 2018-12-27 2019-05-03 上海旺翔文化传媒股份有限公司 激励视频广告智能投放方法
CN110009429B (zh) * 2019-04-10 2021-04-16 金瓜子科技发展(北京)有限公司 一种预测流量数据的方法、装置和计算机设备
CN110009429A (zh) * 2019-04-10 2019-07-12 金瓜子科技发展(北京)有限公司 一种预测流量数据的方法、装置和计算机设备
CN110189171A (zh) * 2019-05-27 2019-08-30 北京金山安全软件有限公司 特征数据的生成方法、装置及设备
CN112541776A (zh) * 2019-09-20 2021-03-23 北京达佳互联信息技术有限公司 数据处理方法、装置、电子设备及存储介质
CN111310988B (zh) * 2020-01-23 2023-04-07 湖南快乐阳光互动娱乐传媒有限公司 广告流量预测方法及装置
CN111310988A (zh) * 2020-01-23 2020-06-19 湖南快乐阳光互动娱乐传媒有限公司 广告流量预测方法及装置
CN111144957B (zh) * 2020-04-07 2021-03-19 腾讯科技(深圳)有限公司 信息投放方法、装置、服务器及存储介质
CN111144957A (zh) * 2020-04-07 2020-05-12 腾讯科技(深圳)有限公司 信息投放方法、装置、服务器及存储介质
CN111566684B (zh) * 2020-04-13 2022-05-27 支付宝(杭州)信息技术有限公司 用于优化广告的用户分组的方法和系统
CN111566684A (zh) * 2020-04-13 2020-08-21 支付宝(杭州)信息技术有限公司 用于优化广告的用户分组的方法和系统
CN111523939B (zh) * 2020-04-23 2023-11-28 腾讯科技(深圳)有限公司 一种推广内容的投放方法、装置、存储介质和电子设备
CN111523939A (zh) * 2020-04-23 2020-08-11 腾讯科技(深圳)有限公司 一种推广内容的投放方法、装置、存储介质和电子设备
CN111860986A (zh) * 2020-07-07 2020-10-30 北京明略昭辉科技有限公司 一种预测模型的训练方法、广告点击预测方法及装置
CN113763000A (zh) * 2020-08-20 2021-12-07 北京沃东天骏信息技术有限公司 对象点击量的确定方法及装置
CN112465558A (zh) * 2020-12-08 2021-03-09 上海明略人工智能(集团)有限公司 用于预测区域广告触达率的方法、装置及设备
CN112465558B (zh) * 2020-12-08 2024-01-23 上海明略人工智能(集团)有限公司 用于预测区域广告触达率的方法、装置及设备
CN112966577A (zh) * 2021-02-23 2021-06-15 北京三快在线科技有限公司 一种模型训练以及信息提供的方法及装置
CN113222656B (zh) * 2021-04-29 2023-11-24 西安点告网络科技有限公司 一种程序化广告投放方法、系统、装置、设备及存储介质
CN113222656A (zh) * 2021-04-29 2021-08-06 西安点告网络科技有限公司 一种程序化广告投放方法、系统、装置、设备及存储介质
CN113763035A (zh) * 2021-08-12 2021-12-07 苏宁易购集团股份有限公司 广告投放的效果预测方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN108122122A (zh) 广告投放方法和系统
Popescu et al. Augmented reality shopping experiences, retail business analytics, and machine vision algorithms in the virtual economy of the metaverse
CN109345302A (zh) 机器学习模型训练方法、装置、存储介质和计算机设备
CN109189904A (zh) 个性化搜索方法及系统
CN106709040B (zh) 一种应用搜索方法和服务器
CN111898031B (zh) 一种获得用户画像的方法及装置
CN107330023A (zh) 基于关注点的文本内容推荐方法和装置
CN104268292B (zh) 画像系统的标签词库更新方法
CN109934619A (zh) 用户画像标签建模方法、装置、电子设备及可读存储介质
CN104778186B (zh) 将商品对象挂载到标准产品单元的方法及系统
CN108133013A (zh) 信息处理方法、装置、计算机设备和存储介质
CN106982256A (zh) 信息推送方法、装置、设备及存储介质
CN111046294A (zh) 点击率预测方法、推荐方法、模型、装置及设备
CN106339510A (zh) 基于人工智能的点击预估方法及装置
CN110263235A (zh) 信息推送对象更新方法、装置和计算机设备
CN109582876A (zh) 旅游行业用户画像构造方法、装置和计算机设备
CN110246007A (zh) 一种商品推荐方法及装置
Abbasimehr et al. A new framework for predicting customer behavior in terms of RFM by considering the temporal aspect based on time series techniques
CN110135893A (zh) 潜在用户的确定方法、装置、计算机设备及存储介质
CN110515904B (zh) 媒体文件的质量预测模型训练方法、质量预测方法及装置
CN108920521A (zh) 基于伪本体的用户画像-项目推荐系统及方法
CN112818218A (zh) 信息推荐方法、装置、终端设备及计算机可读存储介质
WO2023000491A1 (zh) 一种应用推荐方法、装置、设备及计算机可读存储介质
CN107767152A (zh) 产品购买倾向分析方法及服务器
CN112801425A (zh) 信息点击率的确定方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination