CN110992091A - 一种基于分类模型评估投放权益的方法和装置 - Google Patents

一种基于分类模型评估投放权益的方法和装置 Download PDF

Info

Publication number
CN110992091A
CN110992091A CN201911192858.1A CN201911192858A CN110992091A CN 110992091 A CN110992091 A CN 110992091A CN 201911192858 A CN201911192858 A CN 201911192858A CN 110992091 A CN110992091 A CN 110992091A
Authority
CN
China
Prior art keywords
classification model
delivery
days
coupon
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911192858.1A
Other languages
English (en)
Inventor
戴红斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN201911192858.1A priority Critical patent/CN110992091A/zh
Publication of CN110992091A publication Critical patent/CN110992091A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0207Discounts or incentives, e.g. coupons or rebates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0203Market surveys; Market polls

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本说明书实施例提供了一种基于分类模型评估投放权益的方法和装置,所述方法包括:获取与第一投放权益对应的特征数据,所述特征数据包括:第一投放权益的属性特征、所述第一投放权益的应用对象的特征、以及所述第一投放权益的投放人群的特征;将所述特征数据输入预先训练的分类模型,其中,所述分类模型为基于监督学习训练的模型;基于所述分类模型的输出获取所述第一投放权益的评估值。

Description

一种基于分类模型评估投放权益的方法和装置
技术领域
本说明书实施例涉及机器学习技术领域,更具体地,涉及一种基于分类模型评估投放权益的方法和装置。
背景技术
在平台商户优惠券运营或推荐场景中,如何提供更优质的优惠券给用户,会直接影响用户在平台的用户体验,提供劣质的优惠券会让用户对这个平台失去信任,而对提供优惠券的商户来说,领取和使用优惠券的用户越多,则表示平台对商户的带客能力越强,并且会增加商户交易的客单价,甚至会带来更多的交易笔数和金额。如果商户提供的优惠券低劣,用户不感兴趣,平台流量对商户价值就大打折扣。从而,提供一种衡量优惠券质量的方法就非常重要。
传统的优惠券质量衡量方法,通常通过统计的方法来得出,例如优惠金额多少,优惠门槛多少,优惠天数多少等,用这些指标来排序,排在前面的优惠券质量高。然而,这种指标排序的方法并不能正确的反映优惠券质量,运营人员在优惠券招商,或者商家在配置优惠券的时候,很难比较和衡量多个影响优惠券质量的因素究竟哪个更重要,便无法在排序时优先选择这些因素,当影响因素成百上千时,人工来挑选和比较这些因素变得非常困难。
因此,需要一种更有效的评估优惠券的方案。
发明内容
本说明书实施例旨在提供一种更有效的评估优惠券的方案,以解决现有技术中的不足。
为实现上述目的,本说明书一个方面提供一种基于分类模型评估投放权益的方法,包括
获取与第一投放权益对应的特征数据,所述特征数据包括:第一投放权益的属性特征、所述第一投放权益的应用对象的特征、以及所述第一投放权益的投放人群的特征;
将所述特征数据输入预先训练的分类模型,其中,所述分类模型为基于监督学习训练的模型;
基于所述分类模型的输出获取所述第一投放权益的评估值。
在一个实施例中,所述第一投放权益的属性特征包括权益静态属性特征和权益价值特征。
在一个实施例中,所述第一投放权益为优惠券,所述权益静态属性特征包括以下至少一项特征:行业标签数量、券行业标签、券展示天数。
在一个实施例中,所述权益价值特征包括以下至少一项特征:优惠类型、优惠金额、优惠门槛金额、优惠力度、优惠权益天数。
在一个实施例中,所述应用对象为营销平台中的商户,所述应用对象的特征包括以下至少一项特征:商户收藏数、商户近30天流量、商户近30天交易笔数、商户近30天均客单价、商户近30天笔单价。
在一个实施例中,所述投放人群特征包括以下至少一项特征:近30天按性别分类的消费人群数量、近30天按年龄段分类的消费人群数量、近30天按职业分类的消费人群数量、近30天按收入分类的人群数量、近30天按客单价分类的人群数量。
在一个实施例中,所述特征数据还包括以下至少一项:所述投放的时间、所述投放的地理区域。
在一个实施例中,所述评估值与以下至少一项相对应:核销率、点击率、领取率、用券交易金额。
在一个实施例中,所述分类模型中预设了预定数目的等级,每个等级与预设的数值区间相对应,其中,基于所述分类模型的输出获取所述第一投放权益的评估值包括,通过所述分类模型输出所述第一投放权益在各个等级的概率,确定概率最大的等级作为所述第一投放权益的评估等级,基于所述评估等级的预设数值区间与该评估等级相应的概率,计算所述第一投放权益的评估值。
在一个实施例中,所述评估值与核销率相对应,所述预定数目的等级基于通过统计预定数目的样本获取的平均核销率和二八核销率而设定。
在一个实施例中,所述分类模型为树模型,所述方法还包括,基于所述树模型的模型结构,对所述第一投放权益的评估值进行预测解释。
在一个实施例中,所述特征数据中包括的特征基于所述分类模型的模型结构确定。
在一个实施例中,所述分类模型基于多个训练样本得到训练,每个训练样本与一个投放权益相对应,并且,每个训练样本包括:相应投放权益的特征数据、该投放权益的标签值。
在一个实施例中,所述每个训练样本对应的投放权益的领取量大于预定数值。
本说明书另一方面提供一种基于分类模型评估投放权益的装置,包括
第一获取单元,配置为,获取与第一投放权益对应的特征数据,所述特征数据包括:第一投放权益的属性特征、所述第一投放权益的应用对象的特征、以及所述第一投放权益的投放人群的特征;
输入单元,配置为,将所述特征数据输入预先训练的分类模型,其中,所述分类模型为基于监督学习训练的模型;
第二获取单元,配置为,基于所述分类模型的输出获取所述第一投放权益的评估值。
在一个实施例中,其中,所述分类模型中预设了预定数目的等级,每个等级与预设的数值区间相对应,其中,所述第二获取单元包括,输出子单元,配置为,通过所述分类模型输出所述投放权益在各个等级的概率;确定子单元,配置为,确定概率最大的等级作为所述投放权益的评估等级;及计算子单元,配置为,基于所述评估等级的预设数值区间与该评估等级相应的概率,计算所述投放权益的评估值。
在一个实施例中,所述装置还包括,解释单元,配置为,基于所述树模型的模型结构,对所述第一投放权益的评估值进行预测解释。
本说明书另一方面提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行上述任一项方法。
本说明书另一方面提供一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现上述任一项方法。
通过根据本说明书实施例的基于分类模型评估投放权益的方案,利用分类模型预测优惠券的等级和分数,可以得到更准确的预测结果和更合理的预测解释,并且可基于模型参数或模型结构确定优惠券各特征的重要性,并且还可以确定各特征相关性,即可确定可将哪些特征放在一个分组里进行对优惠券的评估,另外,通过在分类模型中包括softmax算法,并基于该分类概率来计算优惠券的评估值,进一步提高了预测准确率。
附图说明
通过结合附图描述本说明书实施例,可以使得本说明书实施例更加清楚:
图1示出根据本说明书实施例的优惠券评估系统的示意图;
图2示出根据本说明书一个实施例的一种训练用于评估投放权益的分类模型的方法流程图;
图3示出在图1中的数据处理模块中进行数据处理以获取训练样本集和评估样本集的过程示意图;
图4示出了基于多个样本获取的样本核销率分布;
图5示出根据本说明书一个实施例的一种基于分类模型评估投放权益的方法流程图;
图6示出根据本说明书实施例的一种基于分类模型评估投放权益的装置600。
具体实施方式
下面将结合附图描述本说明书实施例。
图1示出根据本说明书实施例的优惠券评估系统的示意图。如图1中所示,该系统中包括数据处理模块11、训练模块12、评估模块13、分类模型14和应用模块15。该分类模型14用于对投放权益进行评估。所述投放权益例如为平台向特定人群投放的用于特定商户的优惠券。平台可通过数据处理模块11采集与多个优惠券分别对应的多个样本,每个样本包括相应优惠券对应的特征,以及该优惠券的标签值,所述特征例如包括优惠券的属性特征、该优惠券应用的商户的特征以及投放人群的特征等,该优惠券的标签值为该优惠券的预定指标的标注值,所述预定指标例如如核销率,该标注值例如为核销率的等级。在获取多个样本之后,可将该多个样本以一定比例划分为训练样本集和评估样本集,例如,以70%的样本构成训练样本集,以30%的样本构成评估样本集。从而,数据处理模块11可将训练样本集发送给训练模块12,从而,训练模块12基于该训练样本集进行对分类模型14的训练。在经过训练之后,可由评估模块13基于上述评估样本集对该训练的分类模型进行评估,以进行对该模型的优化迭代。在基于训练模块12和评估模块13获取优化的分类模型14之后,可使用该分类模型14在线进行优惠券的评估,在该情况中,通过数据处理模块11在线获取待评估优惠券的特征数据x,并将该特征数据输入分类模型14,从而由分类模型14输出对该优惠券的评估值。在该优惠券还未发行时,所述应用模块15例如为优惠券发行模块,该模块可基于该分类模型对该优惠券的评估值来确定是否发行该优惠券。在该优惠券已经发行的情况中,该应用模块15例如为优惠券推送模型,该推送模型可使用所述评估值作为输入特征,以确定是否向特定用户推送该优惠券,或者,该推送模型可基于该分类模型中的特征参数获取该优惠券的重要特征作为输入特征,以进行优惠券推送。
可以理解,上述参考图1的描述仅仅是示意性的,而不是限制性的。例如,所述投放权益不限于为商户投放的优惠券,其也可以为特定机构向特定人群投放的实体物品或虚拟物品等等,在此不作限定,下文中将以优惠券为例进行示例说明。另外,所述样本的标签值不限于核销率等级,而可以为其它多种物理量的标注值,如点击率等级、领取率等级等等,在此不作限定,下文中将以核销率为例进行示例说明。下文将详细描述上述分类模型的训练和使用过程。
图2示出根据本说明书一个实施例的一种训练用于评估投放权益的分类模型的方法流程图,包括
步骤S202,获取多个训练样本,其中,每个训练样本与一个投放权益相对应,并包括:相应投放权益的特征数据、该投放权益的标签值,所述特征数据包括:所述相应投放权益的属性特征、所述相应投放权益的应用对象的特征、以及所述相应投放权益的投放人群的特征;
步骤S204,通过所述多个训练样本训练所述分类模型。
首先,在步骤S202,获取多个训练样本,其中,每个训练样本与一个投放权益相对应,并包括:相应投放权益的特征数据、该投放权益的标签值,所述特征数据包括:所述相应投放权益的属性特征、所述相应投放权益的应用对象的特征、以及所述相应投放权益的投放人群的特征。
下文中将以优惠券作为所述投放权益的示例进行描述。
图3示出在图1中的数据处理模块中进行数据处理以获取训练样本集和评估样本集的过程示意图。如图3中所示,在数据处理模块中包括数据抽取层和样本生成层。在数据抽取层示意示出了两个过程:从离线获取的多个优惠券数据中确定适于用作样本的优惠券,例如,挑选预定时段内领取量大于预定数目(例如100)的券,从而避免例如领取一张核销一张,核销率为100%的噪声数据;从特定优惠券的各类券信息中抽取特征数据和标签数据的过程,例如,从券基本信息中抽取券投放时间、券行业标签、券优惠价值等特征的特征值,从券投放商户信息中抽取投放商户的各个特征的特征值等,另外,从券核销信息中抽取与样本标签值相关的标签数据,如券点击量、券领取量、券核销量等。在通过数据抽取层获取各个样本的特征数据和标签值之后,可通过样本生成层生成多个样本。在样本生成层中,例如对于样本中的缺失特征以默认值填充,对各个特征进行独热编码(one-hot)等。并以与各个券对应的特征数据和标签值生成各个样本。在生成多个样本之后,可以以一定比例将该多个样本划分为训练样本集和评估样本集,以分别进行训练和评估过程。
图3中仅示意示出了在特征抽取层中所抽取的部分特征,实际抽取的特征包括更多的特征。在本说明书实施例中,例如,样本的标签值为核销率,从而基于如下的公式来确定样本特征:券核销率=券吸引力(券静态属性+券利益价值)*消费者用券偏好性(商户特征+消费者特征+时间、地区特征等),对于其他的样本标签值,也可以使用类似的公式来确定样本特征。从而,可确定与优惠券对应的样本特征包括以下几类特征:优惠券的属性特征、优惠券对应商户的特征、以及优惠券的投放人群的特征。
其中,优惠券的属性特征可包括优惠券的静态属性特征和价值特征。优惠券的静态属性特征例如包括:行业标签数量、券行业标签、券展示天数等。所述行业标签即该优惠券对应的行业标签,例如,用于化妆品商户的优惠券的行业标签包括百货、美容化妆等多个行业标签。可以理解,所述静态属性特征不限于为上述特征,在一个实施例中,优惠券的静态属性还可以包括资产提供方、资产类型、出资方、券图片数量等等。优惠券的价值特征例如包括:优惠类型、优惠金额、优惠门槛金额、优惠力度、优惠天数等等。在一个实施例中,所述价值特征还可以包括优惠折扣等等。
优惠券对应商户的特征例如包括以下特征:商户收藏数、商户近30天流量、商户近30天交易笔数、商户近30天均客单价、商户近30天笔单价等等。可以理解,所述商户的特征不限于上述特征,例如,商户的特征还可以包括以下特征:商户标签数量、商户评论数、重要客户类型、商户所属行业、商户人流数量、商户标签特征向量、商户环境图数量、商家推荐数量、特色服务数量、商户评星数等等。
投放人群特征例如包括以下特征:近30天按性别分类的消费人群数量、近30天按年龄段分类的消费人群数量、近30天按职业分类的消费人群数量、近30天按收入分类的人群数量、近30天按客单价分类的人群数量。所述按年龄段分类例如可以是,按照以下几个年龄段对人群进行分类:20以下、20-30、30-40、40-50、50以上。所述按收入分类例如可以是,按照以下几个收入范围对人群进行分类:1万以下、1万-2万、2万以上等等。
在一个实施例中,优惠券的特征数据中还包括优惠券的投放时间,如优惠券的投放月份,优惠券的投放区域,如投放国家、投放城市、投放商圈等等。
优惠券的标签值可以为对以下至少一项的标注值:核销率、点击率、领取率、用券交易金额,等等。例如,该标签值可以为上述任一项的标注值,或者,该标签值可以为综合上述至少一项的标注值。例如,所述标签值为优惠券的核销率的等级。图4示出了基于多个样本获取的样本核销率分布。如图4中所示,该图中的横坐标为核销率,该图中的纵坐标为核销券数,基于该多个样本,可计算多个样本的平均核销率为0.06,二八核销率为0.24(即,如图中箭头所示,该核销率分布左侧面积/右侧面积=8:2),从而可基于该平均核销率和二八核销率将样本核销率分为若干个(例如7个)等级。
表1示出了核销率的7个等级,如表1中所示,按照优惠券的核销率,可以分为三个档次,其中,低于平均核销率0.6的券为低档,高于平均核销率0.6且低于二八核销率0.24的券为中档,高于二八核销率0.24的券为高档,通过在各个档次中平均划分,例如将低档平均划分为两个核销率区间,将中档平均划分为三个核销率区间,将高档平均划分为两个核销率区间,从而将优惠券的核销率划分为表中的0~6共七个等级。
券档位 券等级 核销率区间
0 [0,0.03)
1 [0.03,0.06)
2 [0.06,0.12)
3 [0.12,0.18)
4 [0.18,0.24)
5 [0.24,0.48)
6 [0.48,1)
表1
参考图3中所示,可从券核销信息中统计各券曝光渠道中对该优惠券的领取数量和营销平台中对该券的核销数量,从而可基于所述券领取数量和券核销数量计算该券的核销率。可以理解,在一个实施例中,所述优惠券的核销不限于该营销平台中的核销,还可以通过其他平台的关联核销等,在此不一一详述。在计算出该优惠券的核销率之后,判断该核销率落入表1中的哪个核销率区间,从而可确定该优惠券的核销率等级,从而可获取该优惠券的标签值。
在步骤S204,通过所述多个训练样本训练所述分类模型。
所述分类模型例如为Xgboost模型,可以理解,所述分类模型不限于为Xgboost模型,而可以为各种基于监督学习的分类模型,如基于神经网络的分类模型、决策树模型、随机森林模型等等,在此不一一列出。
所述分类模型的模型函数中例如包括softmax函数,从而在针对样本特征进行预测时可输出各个类别的概率,从而该分类模型可将概率最大的类别确定为针对样本预测的类别。
从而,基于该分类模型对样本的预测以及该样本的标签值,以模型对至少一个样本的预测损失作为损失函数,通过例如梯度下降法的模型优化算法训练所述分类模型。
在一个实施例中,在如上所述对分类模型进行训练之后,还可以使用上述评估样本集对该训练的分类模型进行评估。如上文所述,评估样本与训练样本包括的内容相同,即包括样本特征数据和样本标签值。通过将各个样本的特征数据输入上述训练的分类模型,从而获取模型预测值,并基于各个样本的模型预测值和标签值可计算对该分类模型的评估指标。所述评估指标例如为模型的预测准确率、召回率、精确率、AUC等等,对此不作限定。通过以评估样本集评估训练的分类模型是否优于训练前的分类模型,从而在训练的分类模型更优的情况中,进行对分类模型的更新,在训练的分类模型并不优于训练前的分类模型的情况中,则不进行对分类模型的更新,并重新获取训练样本集以进行对模型的下一次训练,从而对模型进行优化迭代。
在如上所述对所述分类模型进行优化迭代之后,可使用该训练好的分类模型进行对投放权益(例如优惠券)的评估,或者基于该模型的参数用于例如优惠券推送模型的特征选择,等等。下面将详细描述对该训练好的分类模型的使用过程。
图5示出根据本说明书一个实施例的一种基于分类模型评估投放权益的方法流程图,包括
步骤S502,获取与第一投放权益对应的特征数据,所述特征数据包括:第一投放权益的属性特征、所述第一投放权益的应用对象的特征、以及所述第一投放权益的投放人群的特征;
步骤S504,将所述特征数据输入预先训练的分类模型,其中,所述分类模型为基于监督学习训练的模型;
步骤S506,基于所述分类模型的输出获取所述第一投放权益的评估值。
所述第一投放权益即为待评估的投放权益,在一个实施例中,所述步骤S502中的与第一投放权益的特征数据可参考上文中在步骤S202中对训练样本中的特征数据的描述。在一个实施例中,所述分类模型为树模型,例如Xgboos t模型,对于这几类特征中各自包括的多个特征,可基于该树模型中包括的特征来确定需要包括的特征类型。例如,在模型训练中,样本的优惠券的静态属性特征中可能包括以下多个特征,行业标签数量、券行业标签、券展示天数、资产提供方、资产类型、出资方、券图片数量等等,而通过训练Xgboost,基于该模型训练过程中的例如剪枝等过程,可确定模型中仅包括行业标签数量、券行业标签、券展示天数,或者可基于该树模型的结构确定模型中的行业标签数量、券行业标签、券展示天数特征的权重较高,从而,在模型预测时,输入的待预测优惠券的特征仅需要包括行业标签数量、券行业标签、券展示天数。
通过步骤S504和步骤S506,从而可通过所述分类模型基于所述第一投放权益的特征数据输出模型预测值。如上文所述,例如,所述第一投放权益为优惠券,所述模型预测值与该优惠券的核销率相对应。在一个实施例中,所述分类模型例如输出该优惠券的等级,该等级例如为如表1所示的7个等级中的一个。在一个实施例中,所述分类模型例如输出该优惠券的等级、及该优惠券属于该等级的概率。如上文所述,该分类模型可计算优惠券属于各个等级的概率,并将概率最高的一个等级确定为该优惠券所述的等级。因此,针对表1中的7个等级,该优惠券所属等级的概率应大于100/7=14%。假设通过模型确定该优惠券所属等级为等级2,概率为30%,从而该分类模型针对该优惠券可例如输出“2,30%”。基于该分类模型的输出,可进一步计算该优惠券的评估分数,如表1中所示,等级2的核销率区间为[0.06,0.12),从而,可如下面的公式(1)所示计算该优惠券的评估分数
Figure BDA0002294014630000111
Figure BDA0002294014630000112
其中,Si为与所述等级2对应的基础分,例如,该基础分为该核销率区间的平均核销率,例如为0.09,Pi为该优惠券属于该等级的概率,即30%。通过以该评估分数作为优惠券的评估值,可以对同等级的优惠券进行进一步的比较。
在一个实施例中,例如商户在发行优惠券之前使用所述分类模型对该优惠券进行评估,从而基于模型输出的评估值确定是否发行该优惠券。
在一个实施例中,商户可在发行优惠券之后使用所述分类模型对该优惠券进行评估,从而将该分类模型输出的评估值作为特征输入例如优惠券推送模型,以确定是否对特定用户推送该优惠券。
所述分类模型中各个特征的参数示出了各个特征的重要性程度,从而,在一个实施例中,商户可基于该分类模型中各个特征的参数来选择输入推送模型的优惠券的特征类型。
在一个实施例中,所述分类模型为树模型,例如Xgboost模型,所述方法还包括,基于所述树模型的模型结构,对所述第一投放权益的评估值进行预测解释。例如,根据树模型中的特定特征在树中的位置,可确定该特征的重要性,根据树模型中各棵树分别包括的特征,可确定特征之间的相关性、以及特征的分组等等。
图6示出根据本说明书实施例的一种基于分类模型评估投放权益的装置600,包括
第一获取单元61,配置为,获取与第一投放权益对应的特征数据,所述特征数据包括:第一投放权益的属性特征、所述第一投放权益的应用对象的特征、以及所述第一投放权益的投放人群的特征;
输入单元62,配置为,将所述特征数据输入预先训练的分类模型,其中,所述分类模型为基于监督学习训练的模型;
第二获取单元63,配置为,基于所述分类模型的输出获取所述第一投放权益的评估值。
在一个实施例中,其中,所述分类模型中预设了预定数目的等级,每个等级与预设的数值区间相对应,其中,所述第二获取单元63包括,输出子单元631,配置为,通过所述分类模型输出所述投放权益在各个等级的概率;确定子单元632,配置为,确定概率最大的等级作为所述投放权益的评估等级;及计算子单元633,配置为,基于所述评估等级的预设数值区间与该评估等级相应的概率,计算所述投放权益的评估值。
在一个实施例中,所述装置还包括,解释单元64,配置为,基于所述树模型的模型结构,对所述第一投放权益的评估值进行预测解释。
本说明书另一方面提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行上述任一项方法。
本说明书另一方面提供一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现上述任一项方法。
通过根据本说明书实施例的基于分类模型评估投放权益的方案,利用分类模型预测优惠券的等级和分数,可以得到更准确的预测结果和更合理的预测解释,并且可基于模型参数或模型结构确定优惠券各特征的重要性,并且还可以确定各特征相关性,即可确定可将哪些特征放在一个分组里进行对优惠券的评估,另外,通过在分类模型中包括softmax算法,并基于该分类概率来计算优惠券的评估值,进一步提高了预测准确率。
需要理解,本文中的“第一”,“第二”等描述,仅仅为了描述的简单而对相似概念进行区分,并不具有其他限定作用。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本领域普通技术人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执轨道,取决于技术方案的特定应用和设计约束条件。本领域普通技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执轨道的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (30)

1.一种基于分类模型评估投放权益的方法,包括
获取与第一投放权益对应的特征数据,所述特征数据包括:第一投放权益的属性特征、所述第一投放权益的应用对象的特征、以及所述第一投放权益的投放人群的特征;
将所述特征数据输入预先训练的分类模型,其中,所述分类模型为基于监督学习训练的模型;
基于所述分类模型的输出获取所述第一投放权益的评估值。
2.根据权利要求1所述的方法,其中,所述第一投放权益的属性特征包括权益静态属性特征和权益价值特征。
3.根据权利要求2所述的方法,其中,所述第一投放权益为优惠券,所述权益静态属性特征包括以下至少一项特征:行业标签数量、券行业标签、券展示天数。
4.根据权利要求3所述的方法,其中,所述权益价值特征包括以下至少一项特征:优惠类型、优惠金额、优惠门槛金额、优惠力度、优惠权益天数。
5.根据权利要求1所述的方法,其中,所述应用对象为营销平台中的商户,所述应用对象的特征包括以下至少一项特征:商户收藏数、商户近30天流量、商户近30天交易笔数、商户近30天均客单价、商户近30天笔单价。
6.根据权利要求5所述的方法,其中,所述投放人群特征包括以下至少一项特征:近30天按性别分类的消费人群数量、近30天按年龄段分类的消费人群数量、近30天按职业分类的消费人群数量、近30天按收入分类的人群数量、近30天按客单价分类的人群数量。
7.根据权利要求1所述的方法,其中,所述特征数据还包括以下至少一项:所述投放的时间、所述投放的地理区域。
8.根据权利要求1所述的方法,其中,所述评估值与以下至少一项相对应:核销率、点击率、领取率、用券交易金额。
9.根据权利要求8所述的方法,其中,所述分类模型中预设了预定数目的等级,每个等级与预设的数值区间相对应,其中,基于所述分类模型的输出获取所述第一投放权益的评估值包括,通过所述分类模型输出所述第一投放权益在各个等级的概率,确定概率最大的等级作为所述第一投放权益的评估等级,基于所述评估等级的预设数值区间与该评估等级相应的概率,计算所述第一投放权益的评估值。
10.根据权利要求9所述的方法,其中,所述评估值与核销率相对应,所述预定数目的等级基于通过统计预定数目的样本获取的平均核销率和二八核销率而设定。
11.根据权利要求1所述的方法,其中,所述分类模型为树模型,所述方法还包括,基于所述树模型的模型结构,对所述第一投放权益的评估值进行预测解释。
12.根据权利要求11所述的方法,其中,所述特征数据中包括的特征基于所述分类模型的模型结构确定。
13.根据权利要求8所述的方法,其中,所述分类模型基于多个训练样本得到训练,每个训练样本与一个投放权益相对应,并且,每个训练样本包括:相应投放权益的特征数据、该投放权益的标签值。
14.根据权利要求11所述的方法,其中,所述每个训练样本对应的投放权益的领取量大于预定数值。
15.一种基于分类模型评估投放权益的装置,包括
第一获取单元,配置为,获取与第一投放权益对应的特征数据,所述特征数据包括:第一投放权益的属性特征、所述第一投放权益的应用对象的特征、以及所述第一投放权益的投放人群的特征;
输入单元,配置为,将所述特征数据输入预先训练的分类模型,其中,所述分类模型为基于监督学习训练的模型;
第二获取单元,配置为,基于所述分类模型的输出获取所述第一投放权益的评估值。
16.根据权利要求15所述的装置,其中,所述第一投放权益的属性特征包括权益静态属性特征和权益价值特征。
17.根据权利要求16所述的装置,其中,所述第一投放权益为优惠券,所述权益静态属性特征包括以下至少一项特征:行业标签数量、券行业标签、券展示天数。
18.根据权利要求17所述的装置,其中,所述权益价值特征包括以下至少一项特征:优惠类型、优惠金额、优惠门槛金额、优惠力度、优惠权益天数。
19.根据权利要求15所述的装置,其中,所述应用对象为营销平台中的商户,所述应用对象的特征包括以下至少一项特征:商户收藏数、商户近30天流量、商户近30天交易笔数、商户近30天均客单价、商户近30天笔单价。
20.根据权利要求19所述的装置,其中,所述投放人群特征包括以下至少一项特征:近30天按性别分类的消费人群数量、近30天按年龄段分类的消费人群数量、近30天按职业分类的消费人群数量、近30天按收入分类的人群数量、近30天按客单价分类的人群数量。
21.根据权利要求15所述的装置,其中,所述特征数据还包括以下至少一项:所述投放的时间、所述投放的地理区域。
22.根据权利要求15所述的装置,其中,所述评估值与以下至少一项相对应:核销率、点击率、领取率、用券交易金额。
23.根据权利要求22所述的装置,其中,所述分类模型中预设了预定数目的等级,每个等级与预设的数值区间相对应,其中,所述第二获取单元包括,输出子单元,配置为,通过所述分类模型输出所述第一投放权益在各个等级的概率;确定子单元,配置为,确定概率最大的等级作为所述第一投放权益的评估等级;及计算子单元,配置为,基于所述评估等级的预设数值区间与该评估等级相应的概率,计算所述第一投放权益的评估值。
24.根据权利要求23所述的装置,其中,所述评估值与核销率相对应,所述预定数目的等级基于通过统计预定数目的样本获取的平均核销率和二八核销率而设定。
25.根据权利要求15所述的装置,其中,所述分类模型为树模型,所述装置还包括,解释单元,配置为,基于所述树模型的模型结构,对所述第一投放权益的评估值进行预测解释。
26.根据权利要求25所述的装置,其中,所述特征数据中包括的特征基于所述分类模型的模型结构确定。
27.根据权利要求22所述的装置,其中,所述分类模型基于多个训练样本得到训练,每个训练样本与一个投放权益相对应,并且,每个训练样本包括:相应投放权益的特征数据、该投放权益的标签值。
28.根据权利要求27所述的装置,其中,所述每个训练样本对应的投放权益的领取量大于预定数值。
29.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-14中任一项的所述的方法。
30.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-14中任一项所述的方法。
CN201911192858.1A 2019-11-28 2019-11-28 一种基于分类模型评估投放权益的方法和装置 Pending CN110992091A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911192858.1A CN110992091A (zh) 2019-11-28 2019-11-28 一种基于分类模型评估投放权益的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911192858.1A CN110992091A (zh) 2019-11-28 2019-11-28 一种基于分类模型评估投放权益的方法和装置

Publications (1)

Publication Number Publication Date
CN110992091A true CN110992091A (zh) 2020-04-10

Family

ID=70088101

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911192858.1A Pending CN110992091A (zh) 2019-11-28 2019-11-28 一种基于分类模型评估投放权益的方法和装置

Country Status (1)

Country Link
CN (1) CN110992091A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117952675A (zh) * 2024-03-27 2024-04-30 山东鼎信数字科技有限公司 一种权益产品动态发放方法、系统、装置及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117952675A (zh) * 2024-03-27 2024-04-30 山东鼎信数字科技有限公司 一种权益产品动态发放方法、系统、装置及存储介质

Similar Documents

Publication Publication Date Title
Neslin et al. Defection detection: Measuring and understanding the predictive accuracy of customer churn models
KR101871747B1 (ko) 유사성향 기반 사용자-관광상품 추천 방법 및 시스템
Bose et al. Quantitative models for direct marketing: A review from systems perspective
US20190019213A1 (en) Predicting the effectiveness of a marketing campaign prior to deployment
CN109189904A (zh) 个性化搜索方法及系统
US20200234218A1 (en) Systems and methods for entity performance and risk scoring
CN108885624A (zh) 信息推荐系统及方法
CN110033120A (zh) 用于为商户提供风险预测赋能服务的方法及装置
CN115131101A (zh) 一种保险产品个性化智能推荐系统
CN108171530B (zh) 一种用于客单价和复购率的提升方法及装置
Prahiawan et al. The effect of supply chain quality perception and country of origin on Smartphones purchase intention of Indonesian consumers
Qi et al. Forecasting consumer credit card adoption: what can we learn about the utility function?
CN110992091A (zh) 一种基于分类模型评估投放权益的方法和装置
Sun et al. Predictive modeling of potential customers based on the customers clickstream data: A field study
WO2020150597A1 (en) Systems and methods for entity performance and risk scoring
Mzoughia et al. An improved customer lifetime value model based on Markov chain
Leventhal Predictive Analytics for Marketers: Using Data Mining for Business Advantage
CN110555168A (zh) 信息推送的方法及装置
CN114595323A (zh) 画像构建、推荐、模型训练方法、装置、设备及存储介质
CN113935529A (zh) 客户生命周期价值的确定方法、装置、设备及介质
CN114119107A (zh) 一种钢贸企业交易测评方法、装置、设备及存储介质
Bhattacharyya et al. Exploring the factors impacting seller performance during online sales events in the e-Commerce marketplace in India
CN113254775A (zh) 一种基于客户浏览行为序列的信用卡产品推荐方法
Noor et al. Telecom Customer’s Segmentation Using Decision Tree to Increase Active Electronic Money Subscribers
Arjmand et al. The impact of customer clubs on lifetime value of banking customers

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200410

RJ01 Rejection of invention patent application after publication