CN113763035A - 广告投放的效果预测方法、装置、计算机设备和存储介质 - Google Patents

广告投放的效果预测方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN113763035A
CN113763035A CN202110924782.8A CN202110924782A CN113763035A CN 113763035 A CN113763035 A CN 113763035A CN 202110924782 A CN202110924782 A CN 202110924782A CN 113763035 A CN113763035 A CN 113763035A
Authority
CN
China
Prior art keywords
target
sample
score
weight
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110924782.8A
Other languages
English (en)
Inventor
张林兵
贾泽玭
孙迁
李成
张志强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SuningCom Co ltd
Original Assignee
SuningCom Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SuningCom Co ltd filed Critical SuningCom Co ltd
Priority to CN202110924782.8A priority Critical patent/CN113763035A/zh
Publication of CN113763035A publication Critical patent/CN113763035A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2113Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种广告投放的效果预测方法、装置、计算机设备和存储介质,所述方法包括:识别待投放广告的目标人群包;获取用于预测目标人群包的目标效果分值的目标特征信息;将目标特征信息输入到预测分数模型中,得到目标效果分值,目标效果分值用于预测将待投放广告投放到目标人群包时的广告投放效果;其中,预测分数模型通过样本特征信息以及样本效果分值训练得到,样本特征信息为用于预测样本人群包的样本效果分值的特征信息,样本效果分值为将待投放广告投放到样本人群包时得到的效果分值。上述方法能够在广告投放前对广告投放的效果进行预测以提高广告投放的人群包的管理效率。

Description

广告投放的效果预测方法、装置、计算机设备和存储介质
技术领域
本申请涉及数据处理技术领域,特别是涉及一种广告投放的效果预测方法、装置、计算机设备和存储介质。
背景技术
随着互联网和电商的不断发展,基于互联网大数据对电商人群进行活动推广是非常常见的广告/营销方式。目前,主流的方法是针对活动选择人群包进行广告投放,而人群包投放的实际效果需要等活动结束后才能获取。因此,造成广告投放的效果数据的获取滞后,导致广告投放的人群包的管理效率低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够在广告投放前对广告投放的效果进行预测以提高广告投放的人群包的管理效率的广告投放的效果预测方法、装置、计算机设备和存储介质。
一种广告投放的效果预测方法,包括:识别待投放广告的目标人群包;获取用于预测目标人群包的目标效果分值的目标特征信息;将目标特征信息输入到预测分数模型中,得到目标效果分值,目标效果分值用于预测将待投放广告投放到目标人群包时的广告投放效果;其中,预测分数模型通过样本特征信息以及样本效果分值训练得到,样本特征信息为用于预测样本人群包的样本效果分值的特征信息,样本效果分值为将待投放广告投放到样本人群包时得到的效果分值。
在其中一个实施例中,一种广告投放的效果预测方法还包括:获取将待投放广告投放到样本人群包时的效果数据;确定用于计算效果分值的计算公式;根据效果数据和计算公式确定样本效果分值;获取样本特征信息;通过样本效果分值和样本特征信息对预测分数模型进行模型训练。
在其中一个实施例中,效果数据包括下单转化率、点击率、投资回报率以及1/平均点击成本,一种广告投放的效果预测方法还包括:获取第一权重、第二权重、第三权重以及第四权重,第一权重为下单转化率对应的权重、第二权重为点击率对应的权重、第三权重为投资回报率对应的权重、第四权重为1/平均点击成本对应的权重;根据效果数据和计算公式确定样本效果分值,包括:根据下单转化率以及第一权重、点击率和第二权重、投资回报率以及第三权重、1/平均点击成本以及第四权重,以及计算公式确定样本效果分值。
在其中一个实施例中,一种广告投放的效果预测方法还包括:获取行业标杆值;分别将下单转化率、点击率、投资回报率以及1/平均点击成本与行业标杆值进行对比;若下单转化率、点击率、投资回报率以及1/平均点击成本中任一指标值小于或等于行业标杆值,则采用
Figure BDA0003208855160000021
计算任一指标值对应的指标分值,其中x*表示指标分值,x表示任一指标值的当前值,min表示任一指标值的最小值,max表示任一指标值的最大值,L表示行业标杆值;若下单转化率、点击率、投资回报率以及1/平均点击成本中任一指标值大于行业标杆值,则采用
Figure BDA0003208855160000022
计算任一指标值对应的指标分值;根据下单转化率以及第一权重、点击率和第二权重、投资回报率以及第三权重、1/平均点击成本以及第四权重,以及计算公式确定样本效果分值,包括:根据下单转化率的指标分值以及第一权重、点击率的指标分值和第二权重、投资回报率的指标分值以及第三权重、1/平均点击成本的指标分值以及第四权重,以及计算公式确定样本效果分值。
在其中一个实施例中,样本特征信息包括样本人群包中各个用户的用户标签特征信息、各个用户在特定参数下对应的行为特征信息、各个用户在目标产品上的购物行为特征信息以及各个用户在目标产品对应的竞品上的购物行为特征信息,目标产品为投放待投放广告的产品。
在其中一个实施例中,获取用于预测目标人群包的目标效果分值的目标特征信息,包括:识别目标人群包的待选特征集合,待选特征集合中包含多个待选特征;根据互信息的特征选择算法从待选特征集合的多个待选特征中筛选出目标特征;获取目标特征的目标特征信息。
在其中一个实施例中,根据互信息的特征选择算法从待选特征集合的多个待选特征中筛选出目标特征,包括:根据互信息的特征选择算法中的平均互信息算法从待选特征集合的多个待选特征中筛选出平均互信息最大的待选特征,将平均互信息最大的待选特征作为第一被挑选特征存入已选特征集合中;从待选特征集合中剔除第一被挑选特征,得到子待选集合;根据互信息的特征选择算法中的最大相关最小冗余算法从子待选集合中筛选第二被挑选特征,将第二被挑选特征存入已选特征集合中,其中最大相关最小冗余算法用于计算子待选集合中各待选特征与子待选集合的最大相关度以及各待选特征与已选特征集合的最小冗余度;将已选特征集合中的第一被挑选特征和第二被挑选特征作为目标特征。
一种广告投放的效果预测装置,包括:识别模块,用于识别待投放广告的目标人群包;获取模块,用于获取用于预测目标人群包的目标效果分值的目标特征信息;预测模块,用于将目标特征信息输入到预测分数模型中,得到目标效果分值,目标效果分值用于预测将待投放广告投放到目标人群包时的广告投放效果;其中,预测分数模型通过样本特征信息以及样本效果分值训练得到,样本特征信息为用于预测样本人群包的样本效果分值的特征信息,样本效果分值为将待投放广告投放到样本人群包时得到的效果分值。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述任一实施例方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一实施例方法的步骤。
上述广告投放的效果预测方法、装置、计算机设备和存储介质,识别待投放广告的目标人群包,获取用于预测目标人群包的目标效果分值的目标特征信息,将目标特征信息输入到预测分数模型中,得到目标效果分值,目标效果分值用于预测将待投放广告投放到目标人群包时的广告投放效果;其中,预测分数模型通过样本特征信息以及样本效果分值训练得到,样本特征信息为用于预测样本人群包的样本效果分值的特征信息,样本效果分值为将待投放广告投放到样本人群包时得到的效果分值。因此,通过预测分数模型能够预测将待投放广告投放到目标人群包时的广告投放效果,无需等待广告投放活动结束即可获得广告投放效果,从而能够在广告投放前对广告投放的效果进行预测以提高广告投放的人群包的管理效率。
附图说明
图1为一个实施例中一种广告投放的效果预测方法的应用环境图;
图2为一个实施例中一种广告投放的效果预测方法的流程示意图;
图3为一个实施例中用户标签特征信息的特征详情图;
图4为一个实施例中用户具体品牌下行为特征的特征详情图;
图5为一个具体实施例中一种广告投放的效果预测方法的流程示意图;
图6为一个实施例中一种广告投放的效果预测装置的结构框图;
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的一种广告投放的效果预测方法,应用于如图1所示的应用环境中。如图1所示,服务器集群102用于实现本申请的一种广告投放的效果预测方法。其中,数据库104中存储有待投放广告的目标人群包的相关信息,相关信息包括用于预测目标人群包的目标效果分值的目标特征信息。服务器集群102实现一种广告投放的效果预测方法时,识别待投放广告的目标人群包,从数据库104中获取用于预测目标人群包的目标效果分值的目标特征信息,将目标特征信息输入到预测分数模型中,得到目标效果分值,目标效果分值用于预测将待投放广告投放到目标人群包时的广告投放效果。其中,预测分数模型通过样本特征信息以及样本效果分值训练得到,样本特征信息为用于预测样本人群包的样本效果分值的特征信息,样本效果分值为将待投放广告投放到样本人群包时得到的效果分值。也即是,预测分数模型为预先通过样本数据集训练得到并存储在服务器集群102中或存储在数据库104中。因此,通过预测分数模型能够预测将待投放广告投放到目标人群包时的广告投放效果,无需等待广告投放活动结束即可获得广告投放效果,从而能够在广告投放前对广告投放的效果进行预测以提高广告投放的人群包的管理效率。
在一个实施例中,如图2所示,提供了一种广告投放的效果预测方法,以该方法应用于图1中的服务器集群102为例进行说明,包括以下步骤:
S202,识别待投放广告的目标人群包。
本实施例中,数据库中存储有多个人群包的相关信息,各人群包中包含有多个用户。服务器集群接收到待投放广告的广告投放效果预测的指令时,识别出待投放广告的目标人群包。识别的方式可以是:接收用户输入的人群包的标识信息,从数据库中获取与人群包的标识信息匹配的目标人群包的标识信息,进而根据匹配结果识别出待投放广告的目标人群包。
S204,获取用于预测目标人群包的目标效果分值的目标特征信息。
本实施例中,数据库中存储有目标人群包的多个特征,多个特征中包含目标特征。目标特征的目标特征信息用于预测目标人群包的目标效果分值。
S206,将目标特征信息输入到预测分数模型中,得到目标效果分值,目标效果分值用于预测将待投放广告投放到目标人群包时的广告投放效果;其中,预测分数模型通过样本特征信息以及样本效果分值训练得到,样本特征信息为用于预测样本人群包的样本效果分值的特征信息,样本效果分值为将待投放广告投放到样本人群包时得到的效果分值。
本实施例中,服务器集群预先通过样本特征信息以及样本效果分值对预测分数模型进行模型训练。样本特征信息为用于预测样本人群包的样本效果分值的特征信息,样本效果分值为将待投放广告投放到样本人群包时得到的效果分值。在对待投放广告投入到目标人群包进行效果预测时,服务器集群获取已训练的预测分数模型,并将目标特征信息输入到预测分数模型中,得到预测分数模型输出的目标效果分值。其中,目标效果分值用于预测将待投放广告投放到目标人群包时的广告投放效果。也即是,通过目标效果分值可以直观地预测将待投放广告投放到目标人群包时的广告投放效果。预测分数模型可以是支持向量机算法(SVM)的模型。
上述广告投放的效果预测方法,识别待投放广告的目标人群包,获取用于预测目标人群包的目标效果分值的目标特征信息,将目标特征信息输入到预测分数模型中,得到目标效果分值,目标效果分值用于预测将待投放广告投放到目标人群包时的广告投放效果;其中,预测分数模型通过样本特征信息以及样本效果分值训练得到,样本特征信息为用于预测样本人群包的样本效果分值的特征信息,样本效果分值为将待投放广告投放到样本人群包时得到的效果分值。因此,通过预测分数模型能够预测将待投放广告投放到目标人群包时的广告投放效果,无需等待广告投放活动结束即可获得广告投放效果,从而能够在广告投放前对广告投放的效果进行预测以提高广告投放的人群包的管理效率。
在一个实施例中,一种广告投放的效果预测方法还包括预测分数模型的模型训练流程。预测分数模型的模型训练流程,包括:获取将待投放广告投放到样本人群包时的效果数据;确定用于计算效果分值的计算公式;根据效果数据和计算公式确定样本效果分值;获取样本特征信息;通过样本效果分值和样本特征信息对预测分数模型进行模型训练。
该实施例中,确定样本人群包以及用于计算效果分值的计算公式。从历史数据中采集将待投放广告投放到样本人群包时的效果数据,通过计算公式和效果数据计算出样本人群包的样本效果分值。样本效果分值用于表征历史将待投放广告投放到样本人群包时的广告投放效果。此外,获取样本人群包的样本特征信息,样本特征信息用于预测样本人群包的样本效果分值。进而,将样本效果分值和样本特征信息输入到预测分数模型,以对预测分数模型进行模型训练。因此,可使得训练得到的预测分数模型能够精确地预测待投放广告投放到目标人群包的广告投放效果。
在一个实施例中,效果数据包括下单转化率、点击率、投资回报率以及1/平均点击成本。上述根据效果数据和计算公式确定样本效果分值的步骤之前,还包括:获取第一权重、第二权重、第三权重以及第四权重,第一权重为下单转化率对应的权重、第二权重为点击率对应的权重、第三权重为投资回报率对应的权重、第四权重为1/平均点击成本对应的权重。上述根据效果数据和计算公式确定样本效果分值的步骤,包括:根据下单转化率以及第一权重、点击率和第二权重、投资回报率以及第三权重、1/平均点击成本以及第四权重,以及计算公式确定样本效果分值。
该实施例中,效果数据的具体维度包括:
下单转化率=买家数/点击数;
点击率=点击数/发送成功数;
投资回报率ROI=付款金额/营销费用;
平均点击成本=营销费用/点击数。
其中,每个维度设置对应的权重。例如,下单转化率对应的第一权重为40%,点击率对应的第二权重为30%,投资回报率ROI对应的第三权重为20%,平均点击成本对应的第四权重为10%。
此时,根据据下单转化率以及第一权重、点击率和第二权重、投资回报率以及第三权重、1/平均点击成本以及第四权重,以及计算公式确定样本效果分值的方式:
样本效果分值=下单转化率得分*40%+点击率得分*30%+投资回报率ROI得分*20%+(1/平均点击成本得分)*10%。
在一个实施例中,上述根据下单转化率以及第一权重、点击率和第二权重、投资回报率以及第三权重、1/平均点击成本以及第四权重,以及计算公式确定样本效果分值的步骤之前,还包括:获取行业标杆值;分别将下单转化率、点击率、投资回报率以及1/平均点击成本与行业标杆值进行对比;若下单转化率、点击率、投资回报率以及1/平均点击成本中任一指标值小于或等于行业标杆值,则采用
Figure BDA0003208855160000081
计算任一指标值对应的指标分值,其中x*表示指标分值,x表示任一指标值的当前值,min表示任一指标值的最小值,max表示任一指标值的最大值,L表示行业标杆值;若下单转化率、点击率、投资回报率以及1/平均点击成本中任一指标值大于行业标杆值,则采用
Figure BDA0003208855160000082
计算任一指标值对应的指标分值。此时,上述根据下单转化率以及第一权重、点击率和第二权重、投资回报率以及第三权重、1/平均点击成本以及第四权重,以及计算公式确定样本效果分值的步骤包括:根据下单转化率的指标分值以及第一权重、述点击率的指标分值和第二权重、投资回报率的指标分值以及第三权重、1/平均点击成本的指标分值以及第四权重,以及计算公式确定样本效果分值。
该实施例中,需计算下单转化率、点击率、投资回报率以及1/平均点击成本对应的指标分值,进而根据各指标分值及其对应的权重以及计算公式计算样本效果分值。具体地,确定行业标杆值。行业标杆值可以是下单转化率、点击率、投资回报率ROI和1/平均点击成本四个维度数据的中位数。将下单转化率、点击率、投资回报率ROI和1/平均点击成本分别与行业标杆值对比,进而根据对比结果确定对应的指标分值的计算方式。例如:将下单转化率、点击率、投资回报率ROI和1/平均点击成本的这四个指标值分别与行业标杆值作对比,如果小于或等于行业标杆值,则该指标值的指标分值的计算公式为
Figure BDA0003208855160000091
反之,该指标值的指标分值的计算公式为
Figure BDA0003208855160000092
在具体指标分值计算时,可以是max为该指标值的最大值,min为该指标值的最小值,x为指标值,x小于min时按照min计算,x大于max时,按照max计算。因此,可以提高样本效果分值的准确度。
在一个实施例中,样本特征信息包括样本人群包中各个用户的用户标签特征信息、各个用户在特定参数下对应的行为特征信息、各个用户在目标产品上的购物行为特征信息以及各个用户在目标产品对应的竞品上的购物行为特征信息,目标产品为投放待投放广告的产品。
该实施例中,用户标签特征信息包括事实标签信息和规则标签信息。用户标签特征信息通过基于用户个人基本信息以及用户购物行为信息对用户进行打标签得到。用户标签特征信息还可参见图3所示。
各个用户在特定参数下对应的行为特征信息为用户在具体参数下的购物表现行为特征的信息。特定参数下对应的行为特征信息包括购买维度下的特征信息、加入购物车维度下的特征信息、收藏维度下的特征信息、浏览维度下的特征信息以及评价维度下的特征信息、投诉维度下的特征信息。各个维度下的特征信息如下:
购买维度:
购物间隔(最近一次购买距离上次购买间隔);
购买天次(365天/180天/90天/21天/14天/7天);
购买金额(365天/180天/90天/21天/14天/7天);
购买频次(365天/180天/90天/21天/14天/7天);
客单价(365天/180天/90天/21天/14天/7天);
退货频次(365天/180天/90天/21天/14天/7天);
加入购物车维度:
加购次数(90天/30天/15天/7天/3天/1天);
收藏维度:
收藏次数(90天/30天/15天/7天/3天/1天);
浏览维度:
浏览次数(90天/30天/15天/7天/3天/1天);
浏览天次(90天/30天/15天/7天/3天/1天);
浏览商品数(90天/30天/15天/7天/3天/1天);
评价维度:
商品平均评价星级(365天/180天/90天/21天/14天/7天);
商品评价数(365天/180天/90天/21天/14天/7天);
投诉维度:
投诉次数(365天/180天/90天/21天/14天/7天)。
特定参数下对应的行为特征信息还可参见图4所示。
各个用户在目标产品上的购物行为特征信息以及各个用户在目标产品对应的竞品上的购物行为特征信息表现为用户在目标产品以及目标产品对应的竞品上的购物行为表现出的特征信息。在目标产品上的购物行为特征信息包括在目标产品上对各个品类的购物行为特征信息,包括但不限于以下品类:空调、冰洗、黑电、数码、电脑、通讯、小家电、厨卫、百货、个护家清、母婴、美妆、进口保健生鲜、冲调酒水、医药馆医药馆事业部、粮油休食、酒类、生鲜、家居、极物、家装、拼购等。例如,以下为在目标产品上的部分购物行为特征:
购物间隔(最近一次购买需要预测具体品牌时间与上一次购买该品牌所属品类的时间间隔);
购买天次(90天/30天/14天);
购买金额(90天/30天/14天);
购买频次(90天/30天/14天)。
在目标产品对应的竞品上的购物行为特征信息包括用户在需要预测具体品牌/品类等参数下竞争品牌/品类的行为特征。具体如下:
购买维度:
购物间隔(最近一次与上次购买商品的时间间隔);
购买天次(90天/30天/14天/7天);
购买金额(90天/30天/14天/7天);
购买频次(90天/30天/14天/7天);
客单价(90天/30天/14天/7天);
退货频次(90天/30天/14天/7天);
加入购物车维度:
加购次数(30天/15天/7天/3天/1天);
收藏维度:
收藏次数(30天/15天/7天/3天/1天);
浏览维度:
浏览次数(30天/15天/7天/3天/1天);
浏览天次(30天/15天/7天/3天/1天);
浏览商品数(30天/15天/7天/3天/1天)。
在一个实施例中,上述获取用于预测目标人群包的目标效果分值的目标特征信息,包括:识别目标人群包的待选特征集合,待选特征集合中包含多个待选特征;根据互信息的特征选择算法从待选特征集合的多个待选特征中筛选出目标特征;获取目标特征的目标特征信息。
该实施例中,互信息的特征选择算法为基于特征之间的互信息进行特征选择的算法。通过互信息的特征选择算法从待选特征集合的多个待选特征中筛选出目标特征,进而获取目标特征的目标特征信息。因此,能够提高目标特征的目标特征信息的准确性。
在一个实施例中,上述根据互信息的特征选择算法从待选特征集合的多个待选特征中筛选出目标特征,包括:根据互信息的特征选择算法中的平均互信息算法从待选特征集合的多个待选特征中筛选出平均互信息最大的待选特征,将平均互信息最大的待选特征作为第一被挑选特征存入已选特征集合中;从待选特征集合中剔除第一被挑选特征,得到子待选集合;根据互信息的特征选择算法中的最大相关最小冗余算法从子待选集合中筛选第二被挑选特征,将第二被挑选特征存入已选特征集合中,其中最大相关最小冗余算法用于计算子待选集合中各待选特征与子待选集合的最大相关度以及各待选特征与已选特征集合的最小冗余度;将已选特征集合中的第一被挑选特征和第二被挑选特征作为目标特征。
该实施例中,设置待选特征集合A和已选特征集合B。初始状态下,已选特征集合B为空集。待选特征集合A中包含多个待选特征。计算多个待选特征的平均互信息,筛选出平均互信息最大的待选特征b1,将待选特征b1作为第一被挑选特征存入已选特征集合B,从待选特征集合A中剔除筛选出的待选特征b1,剔除后得到子待选集合C。进一步地,根据互信息的特征选择算法中的最大相关最小冗余算法从子待选集合C中筛选第二被挑选特征b2,将第二被挑选特征b2存入已选特征集合B中。最后,将已选特征集合B中的待选特征b1和第二被挑选特征b2作为目标特征。其中,第二被挑选特征b2为一个或多个,各第二被挑选特征b2均基于互信息的特征选择算法中的最大相关最小冗余算法进行选取。
最大相关最小冗余算法用于计算子待选集合中各待选特征与子待选集合的最大相关度以及各待选特征与已选特征集合的最小冗余度。例如,子待选集合C中包含第二被挑选特征b2、待选特征b3、待选特征b4、待选特征b5和待选特征b6。已选特征集合B包含待选特征b1。基于最大相关最小冗余算法筛选出第二被挑选特征b2的方式为:计算第二被挑选特征b2、待选特征b3、待选特征b4、待选特征b5和待选特征b6中各待选特征与子待选集合C的最大相关度,以及计算第二被挑选特征b2、待选特征b3、待选特征b4、待选特征b5和待选特征b6中各待选特征与已选特征集合B的最小冗余度,筛选出其中计算出的最大值对应的待选特征,筛选出的待选特征为第二被挑选特征b2。以下做具体的说明:
封装基于互信息的特征选择算法进行特征处理,该算法的处理步骤如下:
①计算待选特征集合中每个待选特征的平均互信息,然后挑选平均互信息最大的一个待选特征加入到已选特征集合中,作为第一个已选特征,即最重要的特征。
②接下来是挑选第n个特征(n≥2):从待选特征集合中选择已选特征的标准是:取最大相关-最小冗余(该待选特征与待选特征集合的相关度-该待选特征与已选特征集合的冗余度)的最大值所对应的待选特征作为第n个已选特征,此处的第n个已选特征为上述第二被挑选特征。
③当第n个待选特征与已选特征集合中已选特征的冗余度大于第n个待选特征与待选特征集合中待选特征的相关度时(即最大相关-最小冗余为负数时),待选特征选择过程结束,此时,已选特征集合为最优特征子集。最优特征子集中的已选特征即可挑选出的目标特征。
在一个实施例中,上述将已选特征集合中的第一被挑选特征和第二被挑选特征作为目标特征的步骤之后,还包括:根据第一被挑选特征和第二被挑选特征中各被挑选特征对应的基于最大相关最小冗余算法计算得到的值确定各被挑选特征的权重。上述将目标特征信息输入到预测分数模型中,包括:将第一被挑选特征的权重、第一被挑选特征的特征信息、第二被挑选特征的权重和第二被挑选特征的特征信息输入到预测分数模型中。
该实施例中,筛选出目标特征之后,还可基于最大相关最小冗余算法计算出各被挑选特征的权重,进而将各被挑选特征的特征信息及其对应的权重输入到预测分数模型中,得到目标效果分值。需要说明的是,在预测分数模型的模型训练过程,采取同样的方式处理样本特征信息及其对应的权重,进而采用样本特征信息及其对应的权重对预测分数模型进行模型训练。
例如,根据最优特征子集中每个已选特征在上述步骤计算得到的最大相关-最小冗余的值来确定各已选特征的权重值。具体确定权重值的方法是:假设最优特征子集中有m个已选特征,m个已选特征的最大相关-最小冗余的值分别为F1~Fm,以F1为例,F1的权重为F1/(F1+…Fm)。
因此,可提高目标效果分值的准确度,进而提高待投放广告的预测效果。
在一个实施例中,上述识别目标人群包的待选特征集合的步骤之前,还包括:获取目标人群包的多个特征数据,根据预设的数据清洗规则对多个特征数据进行数据清洗,按照预设数据转换方式对数据清洗后的多个特征数据进行数据转换,从数据转换后的多个特征数据中筛选出目标人群包的待选特征集合的多个待选特征。
具体地,预设的数据清洗规包括业务层数据清洗规则和数据层清洗规则。业务层清洗规则为:剔除退款定单的特征数据、剔除刷单的特征数据、剔除公共会员卡的特征数据、剔除异常浏览数据的特征数据。其中,一个会员编码对应很大量级订单时业务系统判断为公共会员卡。一个公共会员卡或设备对应很大量级数时业务系统判断为疑似爬虫用户,将其设定为异常浏览数据的特征数据。数据层清洗规则:需要根据特征涉及的具体字段采取不同的缺失值填充方法。具体的方法包括但不限于就近补齐、平均数填充、线性填充等。
预设数据转换方式包括字符型和类别型特征转化处理方式。例如,字符型和类别型特征转化处理:需要将字符型变量转化为int型和double型,将类别变量进行one-hot编码处理。
因此,可提高目标效果分值的准确度,进而提高待投放广告的预测效果。
以下给出一具体实施例,以详述上述实施例所述的一种广告投放的效果预测方法,具体参见图5所示:
第一步:计算历史已使用的相关人群包得分,包括:用户输入包含但不限于品牌、品类、商品组、店铺、场景等入参,系统捞取已被使用的以该参数为入参的所有人群包明细数据以及人群包的使用效果数据,根据人群包的效果数据和得分计算公式,计算已被使用的人群包得分。
第二步:明确用于预测人群包得分的特征集合,包括:某人群包中用户标签特征分布、某人群包中所有用户在具体参数下购物行为、某人群包中所有用户苏宁整站购物行为、某人群包中所有用户竞品下购物行为,其中,用户的购物行为包括但不限于购买、加购、浏览、点击、搜索、收藏、评价、投诉等。
第三步:数据清洗及特征选择,数据清洗包括:底层数据的异常值和缺失值处理,数值型变量、字符型变量、类别型变量的转化与计算。封装基于互信息的特征选择算法从未选特征集合中逐个选取特征到已选特征集合中去,最后按照平均互信息值的大小对已选特征进行赋权。
第四步:将第一步中已使用人群包的特征值和得分输入到支持向量机算法(SVM)进行模型训练并固化模型,然后将未使用人群包的特征值输入到固化好的模型中,得到预测得分。
本申请提供一种广告投放的效果预测方法,通过预测人群包使用效果得分,对人群包进行统一管理和使用,该解决方案的优点如下:
①根据人群包的预测效果对人群包进行统一管理,完善人群包主数据信息;
②提升业务筛选人群包过程体验,降低筛选门槛,用户通过筛选预测的优质人群包进行活动投放可以提高人群包的实际投放效果;
③通过预测人群包使用效果得分,为人群包再营销提供技术支撑,提高人群包使用效率,节约计算资源。
④本特征选择算法结合具体的数据情况来选择最优特征子集,而避免人为因素干扰算法结果,相较于传统人为设定最优特征子集特征数量更为科学。
此外,本申请提供一种广告投放的效果预测方法,解决了传统广告投放存在的技术问题,如:
1、目前,行业中人群包主要是基于一定的逻辑/算法生产后使用,往往实际使用效果不好。针对此问题,本申请提出了针对生产好的人群包先进行效果预测(下单转化率、点击率、ROI、平均点击成本)再投放,从而提高人群包的使用效果,降低人群包的使用成本。
2、由于初始提取的特征是高维特征,在机器学习中常用降维来解决此问题,业内常用的方法是利用一些算法逻辑给特征排序,然后人为制定挑选特征的数量或者挑选特征的比例,这就造成了最终特征的选取量受人为影响因素比较大。为此,本申请提出了基于互信息的最大相关-最小冗余算法进行特征筛选,并创新性的制定相应的特征选择数量规则,得到最优特征子集,同时提出了按照平均互信息值来选取特征和确定特征权重值。
应该理解的是,虽然流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,附图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
本申请还提供一种广告投放的效果预测装置,如图6所示,该装置包括识别模块602、获取模块604以及预测模块606。识别模块602,用于识别待投放广告的目标人群包;获取模块604,用于获取用于预测目标人群包的目标效果分值的目标特征信息;预测模块606,用于将目标特征信息输入到预测分数模型中,得到目标效果分值,目标效果分值用于预测将待投放广告投放到目标人群包时的广告投放效果;其中,预测分数模型通过样本特征信息以及样本效果分值训练得到,样本特征信息为用于预测样本人群包的样本效果分值的特征信息,样本效果分值为将待投放广告投放到样本人群包时得到的效果分值。
在其中一个实施例中,一种广告投放的效果预测装置还包括训练模块。训练模块用于获取将待投放广告投放到样本人群包时的效果数据;确定用于计算效果分值的计算公式;根据效果数据和计算公式确定样本效果分值;获取样本特征信息;通过样本效果分值和样本特征信息对预测分数模型进行模型训练。
在其中一个实施例中,效果数据包括下单转化率、点击率、投资回报率以及1/平均点击成本。一种广告投放的效果预测装置还包括权重获得模块,用于获取第一权重、第二权重、第三权重以及第四权重,第一权重为下单转化率对应的权重、第二权重为点击率对应的权重、第三权重为投资回报率对应的权重、第四权重为所述1/平均点击成本对应的权重;上述根据效果数据和计算公式确定样本效果分值,包括:根据下单转化率以及第一权重、点击率和第二权重、投资回报率以及第三权重、1/平均点击成本以及第四权重,以及计算公式确定样本效果分值。
在其中一个实施例中,一种广告投放的效果预测装置还包括计算模块。计算模块用于获取行业标杆值;分别将下单转化率、点击率、投资回报率以及1/平均点击成本与行业标杆值进行对比;若下单转化率、点击率、投资回报率以及1/平均点击成本中任一指标值小于或等于行业标杆值,则采用
Figure BDA0003208855160000171
计算任一指标值对应的指标分值,其中x*表示指标分值,x表示任一指标值的当前值,min表示任一指标值的最小值,max表示任一指标值的最大值,L表示行业标杆值;若下单转化率、点击率、投资回报率以及1/平均点击成本中任一指标值大于行业标杆值,则采用
Figure BDA0003208855160000172
计算任一指标值对应的指标分值。上述根据下单转化率以及第一权重、点击率和第二权重、投资回报率以及第三权重、1/平均点击成本以及第四权重,以及计算公式确定样本效果分值,包括:根据下单转化率的指标分值以及第一权重、点击率的指标分值和第二权重、投资回报率的指标分值以及第三权重、1/平均点击成本的指标分值以及第四权重,以及计算公式确定样本效果分值。
在其中一个实施例中,样本特征信息包括样本人群包中各个用户的用户标签特征信息、各个用户在特定参数下对应的行为特征信息、各个用户在目标产品上的购物行为特征信息以及各个用户在目标产品对应的竞品上的购物行为特征信息,目标产品为投放待投放广告的产品。
在其中一个实施例中,上述获取用于预测目标人群包的目标效果分值的目标特征信息,包括:识别目标人群包的待选特征集合,待选特征集合中包含多个待选特征;根据互信息的特征选择算法从待选特征集合的多个待选特征中筛选出目标特征;获取目标特征的目标特征信息。
在其中一个实施例中,上述根据互信息的特征选择算法从待选特征集合的多个待选特征中筛选出目标特征,包括:根据互信息的特征选择算法中的平均互信息算法从待选特征集合的多个待选特征中筛选出平均互信息最大的待选特征,将平均互信息最大的待选特征作为第一被挑选特征存入已选特征集合中;从待选特征集合中剔除第一被挑选特征,得到子待选集合;根据互信息的特征选择算法中的最大相关最小冗余算法从子待选集合中筛选第二被挑选特征,将第二被挑选特征存入已选特征集合中,其中最大相关最小冗余算法用于计算子待选集合中各待选特征与子待选集合的最大相关度以及各待选特征与已选特征集合的最小冗余度;将已选特征集合中的第一被挑选特征和第二被挑选特征作为目标特征。
关于广告投放的效果预测装置的具体限定可以参见上文中对于广告投放的效果预测方法的限定,在此不再赘述。上述广告投放的效果预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部终端连接,以接收外部终端的配置信息。该计算机程序被处理器执行时以实现一种广告投放的效果预测方法。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:识别待投放广告的目标人群包;获取用于预测目标人群包的目标效果分值的目标特征信息;将目标特征信息输入到预测分数模型中,得到目标效果分值,目标效果分值用于预测将待投放广告投放到目标人群包时的广告投放效果;其中,预测分数模型通过样本特征信息以及样本效果分值训练得到,样本特征信息为用于预测样本人群包的样本效果分值的特征信息,样本效果分值为将待投放广告投放到样本人群包时得到的效果分值。
在其中一个实施例中,处理器执行计算机程序时实现以下步骤:获取将待投放广告投放到样本人群包时的效果数据;确定用于计算效果分值的计算公式;根据效果数据和计算公式确定样本效果分值;获取样本特征信息;通过样本效果分值和样本特征信息对预测分数模型进行模型训练。
在其中一个实施例中,效果数据包括下单转化率、点击率、投资回报率以及1/平均点击成本。处理器执行计算机程序时实现以下步骤:获取第一权重、第二权重、第三权重以及第四权重,第一权重为下单转化率对应的权重、第二权重为点击率对应的权重、第三权重为投资回报率对应的权重、第四权重为所述1/平均点击成本对应的权重;处理器执行计算机程序实现上述的根据效果数据和计算公式确定样本效果分值步骤时,具体实现以下步骤:根据下单转化率以及第一权重、点击率和第二权重、投资回报率以及第三权重、1/平均点击成本以及第四权重,以及计算公式确定样本效果分值。
在其中一个实施例中,处理器执行计算机程序时实现以下步骤:获取行业标杆值;分别将下单转化率、点击率、投资回报率以及1/平均点击成本与行业标杆值进行对比;若下单转化率、点击率、投资回报率以及1/平均点击成本中任一指标值小于或等于行业标杆值,则采用
Figure BDA0003208855160000201
计算任一指标值对应的指标分值,其中x*表示指标分值,x表示任一指标值的当前值,min表示任一指标值的最小值,max表示任一指标值的最大值,L表示行业标杆值;若下单转化率、点击率、投资回报率以及1/平均点击成本中任一指标值大于行业标杆值,则采用
Figure BDA0003208855160000202
计算任一指标值对应的指标分值。处理器执行计算机程序实现上述的根据下单转化率以及第一权重、点击率和第二权重、投资回报率以及第三权重、1/平均点击成本以及第四权重,以及计算公式确定样本效果分值步骤时,具体实现以下步骤:根据下单转化率的指标分值以及第一权重、点击率的指标分值和第二权重、投资回报率的指标分值以及第三权重、1/平均点击成本的指标分值以及第四权重,以及计算公式确定样本效果分值。
在其中一个实施例中,样本特征信息包括样本人群包中各个用户的用户标签特征信息、各个用户在特定参数下对应的行为特征信息、各个用户在目标产品上的购物行为特征信息以及各个用户在目标产品对应的竞品上的购物行为特征信息,目标产品为投放待投放广告的产品。
在其中一个实施例中,处理器执行计算机程序实现上述的获取用于预测目标人群包的目标效果分值的目标特征信息步骤时,具体实现以下步骤:识别目标人群包的待选特征集合,待选特征集合中包含多个待选特征;根据互信息的特征选择算法从待选特征集合的多个待选特征中筛选出目标特征;获取目标特征的目标特征信息。
在其中一个实施例中,处理器执行计算机程序实现上述的根据互信息的特征选择算法从待选特征集合的多个待选特征中筛选出目标特征步骤时,具体实现以下步骤:根据互信息的特征选择算法中的平均互信息算法从待选特征集合的多个待选特征中筛选出平均互信息最大的待选特征,将平均互信息最大的待选特征作为第一被挑选特征存入已选特征集合中;从待选特征集合中剔除第一被挑选特征,得到子待选集合;根据互信息的特征选择算法中的最大相关最小冗余算法从子待选集合中筛选第二被挑选特征,将第二被挑选特征存入已选特征集合中,其中最大相关最小冗余算法用于计算子待选集合中各待选特征与子待选集合的最大相关度以及各待选特征与已选特征集合的最小冗余度;将已选特征集合中的第一被挑选特征和第二被挑选特征作为目标特征。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:识别待投放广告的目标人群包;获取用于预测目标人群包的目标效果分值的目标特征信息;将目标特征信息输入到预测分数模型中,得到目标效果分值,目标效果分值用于预测将待投放广告投放到目标人群包时的广告投放效果;其中,预测分数模型通过样本特征信息以及样本效果分值训练得到,样本特征信息为用于预测样本人群包的样本效果分值的特征信息,样本效果分值为将待投放广告投放到样本人群包时得到的效果分值。
在其中一个实施例中,计算机程序被处理器执行时实现以下步骤:获取将待投放广告投放到样本人群包时的效果数据;确定用于计算效果分值的计算公式;根据效果数据和计算公式确定样本效果分值;获取样本特征信息;通过样本效果分值和样本特征信息对预测分数模型进行模型训练。
在其中一个实施例中,效果数据包括下单转化率、点击率、投资回报率以及1/平均点击成本。计算机程序被处理器执行时实现以下步骤:获取第一权重、第二权重、第三权重以及第四权重,第一权重为下单转化率对应的权重、第二权重为点击率对应的权重、第三权重为投资回报率对应的权重、第四权重为所述1/平均点击成本对应的权重;计算机程序被处理器执行实现上述的根据效果数据和计算公式确定样本效果分值步骤时,具体实现以下步骤:根据下单转化率以及第一权重、点击率和第二权重、投资回报率以及第三权重、1/平均点击成本以及第四权重,以及计算公式确定样本效果分值。
在其中一个实施例中,计算机程序被处理器执行时实现以下步骤:获取行业标杆值;分别将下单转化率、点击率、投资回报率以及1/平均点击成本与行业标杆值进行对比;若下单转化率、点击率、投资回报率以及1/平均点击成本中任一指标值小于或等于行业标杆值,则采用
Figure BDA0003208855160000221
计算任一指标值对应的指标分值,其中x*表示指标分值,x表示任一指标值的当前值,min表示任一指标值的最小值,max表示任一指标值的最大值,L表示行业标杆值;若下单转化率、点击率、投资回报率以及1/平均点击成本中任一指标值大于行业标杆值,则采用
Figure BDA0003208855160000222
计算任一指标值对应的指标分值。计算机程序被处理器执行实现上述的根据下单转化率以及第一权重、点击率和第二权重、投资回报率以及第三权重、1/平均点击成本以及第四权重,以及计算公式确定样本效果分值步骤时,具体实现以下步骤:根据下单转化率的指标分值以及第一权重、点击率的指标分值和第二权重、投资回报率的指标分值以及第三权重、1/平均点击成本的指标分值以及第四权重,以及计算公式确定样本效果分值。
在其中一个实施例中,样本特征信息包括样本人群包中各个用户的用户标签特征信息、各个用户在特定参数下对应的行为特征信息、各个用户在目标产品上的购物行为特征信息以及各个用户在目标产品对应的竞品上的购物行为特征信息,目标产品为投放待投放广告的产品。
在其中一个实施例中,计算机程序被处理器执行实现上述的获取用于预测目标人群包的目标效果分值的目标特征信息步骤时,具体实现以下步骤:识别目标人群包的待选特征集合,待选特征集合中包含多个待选特征;根据互信息的特征选择算法从待选特征集合的多个待选特征中筛选出目标特征;获取目标特征的目标特征信息。
在其中一个实施例中,计算机程序被处理器执行实现上述的根据互信息的特征选择算法从待选特征集合的多个待选特征中筛选出目标特征步骤时,具体实现以下步骤:根据互信息的特征选择算法中的平均互信息算法从待选特征集合的多个待选特征中筛选出平均互信息最大的待选特征,将平均互信息最大的待选特征作为第一被挑选特征存入已选特征集合中;从待选特征集合中剔除第一被挑选特征,得到子待选集合;根据互信息的特征选择算法中的最大相关最小冗余算法从子待选集合中筛选第二被挑选特征,将第二被挑选特征存入已选特征集合中,其中最大相关最小冗余算法用于计算子待选集合中各待选特征与子待选集合的最大相关度以及各待选特征与已选特征集合的最小冗余度;将已选特征集合中的第一被挑选特征和第二被挑选特征作为目标特征。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种广告投放的效果预测方法,所述方法包括:
识别待投放广告的目标人群包;
获取用于预测所述目标人群包的目标效果分值的目标特征信息;
将所述目标特征信息输入到预测分数模型中,得到所述目标效果分值,所述目标效果分值用于预测将所述待投放广告投放到所述目标人群包时的广告投放效果;
其中,所述预测分数模型通过样本特征信息以及样本效果分值训练得到,所述样本特征信息为用于预测样本人群包的样本效果分值的特征信息,所述样本效果分值为将所述待投放广告投放到所述样本人群包时得到的效果分值。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取将所述待投放广告投放到所述样本人群包时的效果数据;
确定用于计算效果分值的计算公式;
根据所述效果数据和所述计算公式确定所述样本效果分值;
获取所述样本特征信息;
通过所述样本效果分值和所述样本特征信息对所述预测分数模型进行模型训练。
3.根据权利要求2所述的方法,其特征在于,所述效果数据包括下单转化率、点击率、投资回报率以及1/平均点击成本,所述方法还包括:
获取第一权重、第二权重、第三权重以及第四权重,所述第一权重为所述下单转化率对应的权重、所述第二权重为所述点击率对应的权重、所述第三权重为所述投资回报率对应的权重、所述第四权重为所述1/平均点击成本对应的权重;
所述根据所述效果数据和所述计算公式确定所述样本效果分值,包括:
根据所述下单转化率以及所述第一权重、所述点击率和所述第二权重、所述投资回报率以及所述第三权重、所述1/平均点击成本以及所述第四权重,以及所述计算公式确定所述样本效果分值。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取行业标杆值;
分别将所述下单转化率、所述点击率、所述投资回报率以及所述1/平均点击成本与所述行业标杆值进行对比;
若所述下单转化率、所述点击率、所述投资回报率以及所述1/平均点击成本中任一指标值小于或等于所述行业标杆值,则采用
Figure FDA0003208855150000021
计算所述任一指标值对应的指标分值,其中x*表示所述指标分值,x表示所述任一指标值的当前值,min表示所述任一指标值的最小值,max表示所述任一指标值的最大值,L表示所述行业标杆值;
若所述下单转化率、所述点击率、所述投资回报率以及所述1/平均点击成本中任一指标值大于所述行业标杆值,则采用
Figure FDA0003208855150000022
计算所述任一指标值对应的指标分值;
所述根据所述下单转化率以及所述第一权重、所述点击率和所述第二权重、所述投资回报率以及所述第三权重、所述1/平均点击成本以及所述第四权重,以及所述计算公式确定所述样本效果分值,包括:
根据所述下单转化率的指标分值以及所述第一权重、所述点击率的指标分值和所述第二权重、所述投资回报率的指标分值以及所述第三权重、所述1/平均点击成本的指标分值以及所述第四权重,以及所述计算公式确定所述样本效果分值。
5.根据权利要求2所述的方法,其特征在于,所述样本特征信息包括所述样本人群包中各个用户的用户标签特征信息、各个用户在特定参数下对应的行为特征信息、各个用户在目标产品上的购物行为特征信息以及各个用户在所述目标产品对应的竞品上的购物行为特征信息,所述目标产品为投放所述待投放广告的产品。
6.根据权利要求1所述的方法,其特征在于,所述获取用于预测所述目标人群包的目标效果分值的目标特征信息,包括:
识别所述目标人群包的待选特征集合,所述待选特征集合中包含多个待选特征;
根据互信息的特征选择算法从所述待选特征集合的多个待选特征中筛选出目标特征;
获取所述目标特征的目标特征信息。
7.根据权利要求6所述的方法,其特征在于,所述根据互信息的特征选择算法从所述待选特征集合的多个待选特征中筛选出目标特征,包括:
根据所述互信息的特征选择算法中的平均互信息算法从所述待选特征集合的多个待选特征中筛选出平均互信息最大的待选特征,将所述平均互信息最大的待选特征作为第一被挑选特征存入已选特征集合中;
从所述待选特征集合中剔除所述第一被挑选特征,得到子待选集合;
根据所述互信息的特征选择算法中的最大相关最小冗余算法从所述子待选集合中筛选第二被挑选特征,将所述第二被挑选特征存入所述已选特征集合中,其中所述最大相关最小冗余算法用于计算所述子待选集合中各待选特征与所述子待选集合的最大相关度以及所述各待选特征与所述已选特征集合的最小冗余度;
将所述已选特征集合中的所述第一被挑选特征和所述第二被挑选特征作为所述目标特征。
8.一种广告投放的效果预测装置,其特征在于,所述装置包括:
识别模块,用于识别待投放广告的目标人群包;
获取模块,用于获取用于预测所述目标人群包的目标效果分值的目标特征信息;
预测模块,用于将所述目标特征信息输入到预测分数模型中,得到所述目标效果分值,所述目标效果分值用于预测将所述待投放广告投放到所述目标人群包时的广告投放效果;
其中,所述预测分数模型通过样本特征信息以及样本效果分值训练得到,所述样本特征信息为用于预测样本人群包的样本效果分值的特征信息,所述样本效果分值为将所述待投放广告投放到所述样本人群包时得到的效果分值。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述方法的步骤。
CN202110924782.8A 2021-08-12 2021-08-12 广告投放的效果预测方法、装置、计算机设备和存储介质 Pending CN113763035A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110924782.8A CN113763035A (zh) 2021-08-12 2021-08-12 广告投放的效果预测方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110924782.8A CN113763035A (zh) 2021-08-12 2021-08-12 广告投放的效果预测方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN113763035A true CN113763035A (zh) 2021-12-07

Family

ID=78789161

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110924782.8A Pending CN113763035A (zh) 2021-08-12 2021-08-12 广告投放的效果预测方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN113763035A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114565409A (zh) * 2022-03-01 2022-05-31 北京派瑞威行互联技术有限公司 一种广告运营智能预警方法及系统
CN114638646A (zh) * 2022-03-25 2022-06-17 广州华多网络科技有限公司 广告投放推荐方法及其装置、设备、介质、产品
CN117273831A (zh) * 2023-11-23 2023-12-22 苏州极易科技股份有限公司 广告投放方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107977859A (zh) * 2017-11-14 2018-05-01 广州优视网络科技有限公司 广告投放方法、装置、计算设备及存储介质
CN108122122A (zh) * 2016-11-29 2018-06-05 腾讯科技(深圳)有限公司 广告投放方法和系统
CN108256893A (zh) * 2016-12-29 2018-07-06 北京国双科技有限公司 广告投放效果的分析方法及装置
CN111178981A (zh) * 2020-01-02 2020-05-19 众安在线财产保险股份有限公司 一种广告投放方法、装置、计算机设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108122122A (zh) * 2016-11-29 2018-06-05 腾讯科技(深圳)有限公司 广告投放方法和系统
CN108256893A (zh) * 2016-12-29 2018-07-06 北京国双科技有限公司 广告投放效果的分析方法及装置
CN107977859A (zh) * 2017-11-14 2018-05-01 广州优视网络科技有限公司 广告投放方法、装置、计算设备及存储介质
CN111178981A (zh) * 2020-01-02 2020-05-19 众安在线财产保险股份有限公司 一种广告投放方法、装置、计算机设备及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114565409A (zh) * 2022-03-01 2022-05-31 北京派瑞威行互联技术有限公司 一种广告运营智能预警方法及系统
CN114638646A (zh) * 2022-03-25 2022-06-17 广州华多网络科技有限公司 广告投放推荐方法及其装置、设备、介质、产品
CN117273831A (zh) * 2023-11-23 2023-12-22 苏州极易科技股份有限公司 广告投放方法、装置、电子设备及存储介质
CN117273831B (zh) * 2023-11-23 2024-01-23 苏州极易科技股份有限公司 广告投放方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN111080398B (zh) 商品推荐方法、装置、计算机设备和存储介质
CN113763035A (zh) 广告投放的效果预测方法、装置、计算机设备和存储介质
CN108665329A (zh) 一种基于用户浏览行为的商品推荐方法
CN109582876B (zh) 旅游行业用户画像构造方法、装置和计算机设备
US7577579B2 (en) Method of predicting sales based on triple-axis mapping of customer value
JP7043786B2 (ja) 営業活動支援システム、営業活動支援方法および営業活動支援プログラム
CN107360222A (zh) 商品信息推送方法、装置、存储介质以及服务器
CN111445134B (zh) 商品的销量预测方法、装置、计算机设备和存储介质
CN108009897A (zh) 一种商品的实时推荐方法、系统及可读存储介质
CN107169806B (zh) 用于确定商品属性对于购买决策的影响度的方法及装置
TW201426592A (zh) 投放資訊搜索的方法和裝置
WO2022151923A1 (zh) 一种商品文案处理方法、装置、电子设备、介质和程序
CN109978292B (zh) 门店的智能管理方法及装置
WO2022095701A1 (zh) 一种对象推荐方法及装置、设备、存储介质
CN112001754A (zh) 用户画像生成方法、装置、设备及计算机可读介质
CN106469392A (zh) 选择及推荐展示对象的方法及装置
CN109242654A (zh) 一种物品推荐方法及系统
CN110298707A (zh) 一种用于资费套餐场景定价的方法及装置
CN113689259A (zh) 基于用户行为的商品个性化推荐方法及系统
CN109711866B (zh) 一种银行广告投放方法、装置及系统
CN106919995A (zh) 一种判断用户群体流失倾向的方法及装置
Zheng et al. A scalable purchase intention prediction system using extreme gradient boosting machines with browsing content entropy
WO2019040451A1 (en) COMPUTER SYSTEM AND METHOD FOR PREDICTING CLIENT BEHAVIOR BASED ON INFLUENCES BETWEEN CUSTOMERS AND CONTROLLING DISTRIBUTION OF ELECTRONIC MESSAGES
CN113689258A (zh) 一种商品推荐热度生成方法及系统
CN111626864A (zh) 信息推送方法和装置、存储介质和电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination