CN115063178A - 目标群体对于业务场景敏感程度的确定方法及其装置 - Google Patents

目标群体对于业务场景敏感程度的确定方法及其装置 Download PDF

Info

Publication number
CN115063178A
CN115063178A CN202210761623.5A CN202210761623A CN115063178A CN 115063178 A CN115063178 A CN 115063178A CN 202210761623 A CN202210761623 A CN 202210761623A CN 115063178 A CN115063178 A CN 115063178A
Authority
CN
China
Prior art keywords
sample
model
sensitivity
population
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210761623.5A
Other languages
English (en)
Inventor
李倩颖
徐思昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qunar Software Technology Co Ltd
Original Assignee
Beijing Qunar Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qunar Software Technology Co Ltd filed Critical Beijing Qunar Software Technology Co Ltd
Priority to CN202210761623.5A priority Critical patent/CN115063178A/zh
Publication of CN115063178A publication Critical patent/CN115063178A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0207Discounts or incentives, e.g. coupons or rebates
    • G06Q30/0211Determining the effectiveness of discounts or incentives
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0207Discounts or incentives, e.g. coupons or rebates
    • G06Q30/0208Trade or exchange of goods or services in exchange for incentives or rewards

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Software Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种目标群体对于业务场景敏感程度的确定方法及其装置。其中,该方法包括:获取目标群体中每个样本的特征信息;将特征信息输入第一模型中,以利用第一模型得到与特征信息对应的第一敏感度;响应于当前业务场景的触发,采集目标群体中每个样本的当前特征信息,其中,当前特征信息至少包括:每个样本的当前业务程度信息以及每个样本的当前消费习惯信息,当前业务程度信息为当前对每个样本施加促进样本执行消费动作的程度;通过当前特征信息与第一敏感度对预定神经网络进行训练,以获取第二模型;利用第二模型获取第二敏感度。本发明解决了针对相关技术中在预估目标用户对于优惠券敏感度时的处理方法精准性不足的技术问题。

Description

目标群体对于业务场景敏感程度的确定方法及其装置
技术领域
本发明涉及数据处理领域,具体而言,涉及一种目标群体对于业务场景敏感程度的确定方法及其装置。
背景技术
营销类业务,会根据用户是否购买和是否发券分成四类,如图1(图1是根据现有技术的消费者画像的示意图)所示:
(1)如果发券就购买,如果不发券就不购买。
(2)无论是否发券,都会购买。
(3)无论是否发券,都不会购买。
(4)如果发券就不购买,如果不发券就购买。
现有技术中,商家营销时更多的是想给那些发券就购买、不发券不买单的人来发券,才能最大化实现我们的营销目标,降低成本或提高ROI,因此在现有技术中找出这部分人,就需要使用因果推断模型评估每个用户的ITE(用户对于消费券的敏感程度代表值),给ITE大的营销敏感用户发券。其中,ITE的计算公式为:ITE=E[Y|X=x,T=1]-E[Y|X=x,T=0],其中,X表示特征,T=1表示受到Treatment影响,T=0表示没有受到Treatment影响,Y表示目标值。在上面发券的例子中,这个公式计算的是这个用户给优惠券时的下单率减去不给优惠券的下单率的差值,该差值越大,说明给券对他下单有较大的正向影响,相比于另一个发券不发券对下单没有影响的用户,给这个用户发券能达到提升订单量的目的。
现有技术中,行业内已有因果效应ITE估计的方法,这类方法统称为upliftmodel。主要的建模方法有:(1)uplift树模型类,优点是针对ATE(average treatmenteffect)建模,泛化性好,缺点是用ATE近似ITE,估计的精准度较差(2)元学习类,分成双模型,单模型。双模型效果较差,所以业界主要使用单模型,也就是把Treatment(发放优惠券)当成特征,进行模型学习,该方法优点是数据利用的充分,建模简单,直接计算ITE的值,但泛化能力较差,结果不稳定。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种目标群体对于业务场景敏感程度的确定方法及其装置,以至少解决针对相关技术中在预估目标用户对于优惠券敏感度时的处理方法精准性不足的技术问题。
根据本发明实施例的一个方面,提供了一种目标群体对于业务场景敏感程度的确定方法,包括:获取目标群体中每个样本的特征信息,其中,所述特征信息至少包括:所述每个样本的业务程度信息以及所述每个样本的消费习惯信息,所述业务程度信息为对所述每个样本施加促进所述样本执行消费动作的程度;将所述特征信息输入第一模型中,以利用所述第一模型得到与所述特征信息对应的第一敏感度,其中,所述第一模型为使用多组训练数据通过机器学习训练得到的,所述多组训练数据中的每一组均包括:所述目标群体中每个样本的历史特征信息以及与所述历史特征信息对应的历史第一敏感度;响应于当前业务场景的触发,采集所述目标群体中每个样本的当前特征信息,其中,所述当前特征信息至少包括:所述每个样本的当前业务程度信息以及所述每个样本的当前消费习惯信息,所述当前业务程度信息为当前对所述每个样本施加促进所述样本执行消费动作的程度;通过所述当前特征信息与所述第一敏感度对预定神经网络进行训练,以获取第二模型;利用所述第二模型获取第二敏感度,其中,所述第二敏感度为所述目标群体中每个样本对于所述当前业务场景的敏感程度。
可选地,在获取目标群体中每个样本的特征信息之前,所述方法还包括:对所述每个样本进行人为干预处理,确定所述目标群体中的第一群体和第二群体,其中,所述人为干预处理至少包括:发放优惠券,所述第一群体为未执行对所述每个样本施加促进所述样本执行消费动作的群体,所述第二群体为已执行对所述每个样本施加促进所述样本执行消费动作的群体;基于所述第一群体和所述第二群体,获取所述目标群体中每个样本的特征信息。
可选地,利用所述第二模型获取第二敏感度,包括:基于所述当前特征信息构造第一损失函数,其中,所述第一损失函数至少包括:Logloss分类损失函数;基于所述当前特征信息和所述第一敏感度构造第二损失函数,其中,所述第二损失函数至少包括:mse回归损失函数;通过所述第一损失函数与所述第二损失函数对所述第二模型进行优化,得到优化后的第二模型;利用所述优化后的第二模型获取所述目标群体的第二敏感度。
可选地,利用所述第二模型获取第二敏感度,包括:将所述目标群体的特征信息输入所述第二模型或所述优化后的第二模型,以利用所述第二模型或所述优化后的第二模型对所述特征信息进行处理;获取所述第二模型或所述优化后的第二模型的输出,以得到所述第二敏感度。
可选地,利用所述第二模型获取第二敏感度,包括:将第一群体的当前特征信息输入所述第二模型中,以获取与所述第一群体的特征信息对应的第一结果,其中,所述第一群体为未执行对所述每个样本施加促进所述样本执行消费动作的群体;将第二群体的当前特征信息输入所述第二模型中,以获取与所述第二群体的特征信息对应的第二结果,其中,所述第二群体为已执行对所述每个样本施加促进所述样本执行消费动作的群体;基于所述第一结果与所述第二结果的差值,确定所述第二敏感度。
根据本发明实施例的另外一个方面,还提供了一种目标群体对于业务场景敏感程度的确定装置,包括:第一获取模块,用于获取目标群体中每个样本的特征信息,其中,所述特征信息至少包括:所述每个样本的业务程度信息以及所述每个样本的消费习惯信息,所述业务程度信息为对所述每个样本施加促进所述样本执行消费动作的程度;生成模块,用于将所述特征信息输入第一模型中,以利用所述第一模型得到与所述特征信息对应的第一敏感度,其中,所述第一模型为使用多组训练数据通过机器学习训练得到的,所述多组训练数据中的每一组均包括:所述目标群体中每个样本的历史特征信息以及与所述历史特征信息对应的历史第一敏感度;采集模块,用于响应于当前业务场景的触发,采集所述目标群体中每个样本的当前特征信息,其中,所述当前特征信息至少包括:所述每个样本的当前业务程度信息以及所述每个样本的当前消费习惯信息,所述当前业务程度信息为当前对所述每个样本施加促进所述样本执行消费动作的程度;第二获取模块,用于通过所述当前特征信息与所述第一敏感度对预定神经网络进行训练,以获取第二模型;第三获取模块,用于利用所述第二模型获取第二敏感度,其中,所述第二敏感度为所述目标群体中每个样本对于所述当前业务场景的敏感程度。
可选地,所述装置还包括:确定模块,用于在获取目标群体中每个样本的特征信息之前,对所述每个样本进行人为干预处理,确定所述目标群体中的第一群体和第二群体,其中,所述人为干预处理至少包括:发放优惠券,所述第一群体为未执行对所述每个样本施加促进所述样本执行消费动作的群体,所述第二群体为已执行对所述每个样本施加促进所述样本执行消费动作的群体;第四获取模块,用于基于所述第一群体和所述第二群体,获取所述目标群体中每个样本的特征信息。
可选地,所述第三获取模块,包括:第一构造单元,用于基于所述当前特征信息构造第一损失函数,其中,所述第一损失函数至少包括:Logloss分类损失函数;第二构造单元,用于基于所述当前特征信息和所述第一敏感度构造第二损失函数,其中,所述第二损失函数至少包括:mse回归损失函数;优化单元,用于通过所述第一损失函数与所述第二损失函数对所述第二模型进行优化,得到优化后的第二模型;第一获取单元,用于利用所述优化后的第二模型获取所述目标群体的第二敏感度。
可选地,所述第三获取模块,包括:处理单元,用于将所述目标群体的特征信息输入所述第二模型或所述优化后的第二模型,以利用所述第二模型或所述优化后的第二模型对所述特征信息进行处理;第二获取单元,用于获取所述第二模型或所述优化后的第二模型的输出,以得到所述第二敏感度。
可选地,所述第三获取模块,包括:第三获取单元,用于将第一群体的当前特征信息输入所述第二模型中,以获取与所述第一群体的特征信息对应的第一结果,其中,所述第一群体为未执行对所述每个样本施加促进所述样本执行消费动作的群体;第四获取单元,用于将第二群体的当前特征信息输入所述第二模型中,以获取与所述第二群体的特征信息对应的第二结果,其中,所述第二群体为已执行对所述每个样本施加促进所述样本执行消费动作的群体;确定单元,用于基于所述第一结果与所述第二结果的差值,确定所述第二敏感度。
根据本发明实施例的另外一个方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序被处理器运行时控制所述计算机可读存储介质所在设备执行上述中任一种所述的目标群体对于业务场景敏感程度的确定方法。
根据本发明实施例的另外一个方面,还提供了一种处理器,所述处理器用于运行计算机程序,其中,所述计算机程序运行时执行上述中任一种所述的目标群体对于业务场景敏感程度的确定方法。
在本发明实施例中,获取目标群体中每个样本的特征信息,其中,特征信息至少包括:每个样本的业务程度信息以及每个样本的消费习惯信息,业务程度信息为对每个样本施加促进样本执行消费动作的程度;将特征信息输入第一模型中,以利用第一模型得到与特征信息对应的第一敏感度,其中,第一模型为使用多组训练数据通过机器学习训练得到的,多组训练数据中的每一组均包括:目标群体中每个样本的历史特征信息以及与历史特征信息对应的历史第一敏感度;响应于当前业务场景的触发,采集目标群体中每个样本的当前特征信息,其中,当前特征信息至少包括:每个样本的当前业务程度信息以及每个样本的当前消费习惯信息,当前业务程度信息为当前对每个样本施加促进样本执行消费动作的程度;通过当前特征信息与第一敏感度对预定神经网络进行训练,以获取第二模型;利用第二模型获取第二敏感度,其中,第二敏感度为目标群体中每个样本对于当前业务场景的敏感程度。通过本发明实施例提供的目标群体对于业务场景敏感程度的确定方法,首先获取对目标群体的优惠动作施加程度以及目标群体的消费习惯,并且用此数据训练出第一模型并且用第一模型获取第一优惠券敏感度,接着当新场景触发后,基于目标群体的对目标群体的当前优惠动作施加程度以及目标群体的当前消费习惯,用此数据与之前获取的第一敏感度来训练第二模型,最后利用第二模型来获取第二敏感度,从而实现了提升用户对于业务场景的敏感度计算的准确性的技术效果,进而解决了针对相关技术中在预估目标用户对于优惠券敏感度时的处理方法精准性不足的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据现有技术的消费者画像的示意图;
图2是根据本发明实施例的目标群体对于业务场景敏感程度的确定方法的流程图;
图3是根据本发明实施例的知识蒸馏的因果效应估计方法的示意图
图4是根据本发明实施例的目标群体对于业务场景敏感程度的确定装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本发明实施例,提供了一种目标群体对于业务场景敏感程度的确定方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图2是根据本发明实施例的目标群体对于业务场景敏感程度的确定方法的流程图,如图2所示,该方法包括如下步骤:
步骤S202,获取目标群体中每个样本的特征信息,其中,特征信息至少包括:每个样本的业务程度信息以及每个样本的消费习惯信息,业务程度信息为对每个样本施加促进样本执行消费动作的程度;
可选的,在上述步骤中,首先获取目标群体中的每个样本的特征信息,每个样本的特征信息包括但不限于:每个样本的性别、年龄、是否已经发放了优惠券以及消费习惯等可能对是否产生消费行为产生影响的特征信息。
需要说明的是,业务程度信息为通过某个场景、手段以及途径促进了每个样本执行多少消费程度的信息,例如,对每个样本发放了多少优惠券,执行了多少打折促销活动,需要说明的是,本发明实施例的应用场景不限于上述场景;消费习惯信息指的是该用户属于何种消费习惯的大类,例如,有的用户属于不论业务程度为多少,该用户均不会受到影响其消费/不消费。
步骤S204,将特征信息输入第一模型中,以利用第一模型得到与特征信息对应的第一敏感度,其中,第一模型为使用多组训练数据通过机器学习训练得到的,多组训练数据中的每一组均包括:目标群体中每个样本的历史特征信息以及与历史特征信息对应的历史第一敏感度;
可选的,将获取的每个样本的特征信息输入都第一模型中,以获取到与特征信息对应的第一敏感度,其中,第一模型包括但不限于:upl ift树模型,主要包括uber的python包causalml中任意树模型。
需要说明的是,第一模型也即知识蒸馏技术中心的teacher模型。
步骤S206,响应于当前业务场景的触发,采集目标群体中每个样本的当前特征信息,其中,当前特征信息至少包括:每个样本的当前业务程度信息以及每个样本的当前消费习惯信息,当前业务程度信息为当前对每个样本施加促进样本执行消费动作的程度;
可选的,在上述步骤中,在训练出第一模型后,等待当前新的业务场景的触发后,采集目标群体中每个样本在当前业务场景下的特征信息(即当前特征信息),当前特征信息至少包括:每个样本的当前消费习惯以及当前业务程度信息。
步骤S208,通过当前特征信息与第一敏感度对预定神经网络进行训练,以获取第二模型;
可选的,将之前得出的第一敏感度与特征信息一起对预定的神经网络进行训练,该模型可以是任意结构的神经网络模型。
步骤S210,利用第二模型获取第二敏感度,其中,第二敏感度为目标群体中每个样本对于当前业务场景的敏感程度。
由上可知,在本发明实施例中,首先可以获取目标群体中每个样本的特征信息,其中,特征信息至少包括:每个样本的业务程度信息以及每个样本的消费习惯信息,业务程度信息为对每个样本施加促进样本执行消费动作的程度;接着将特征信息输入第一模型中,以利用第一模型得到与特征信息对应的第一敏感度,其中,第一模型为使用多组训练数据通过机器学习训练得到的,多组训练数据中的每一组均包括:目标群体中每个样本的历史特征信息以及与历史特征信息对应的历史第一敏感度;接着响应于当前业务场景的触发,采集目标群体中每个样本的当前特征信息,其中,当前特征信息至少包括:每个样本的当前业务程度信息以及每个样本的当前消费习惯信息,当前业务程度信息为当前对每个样本施加促进样本执行消费动作的程度;接着通过当前特征信息与第一敏感度对预定神经网络进行训练,以获取第二模型;最后利用第二模型获取第二敏感度,其中,第二敏感度为目标群体中每个样本对于当前业务场景的敏感程度。通过本发明实施例提供的目标群体对于业务场景敏感程度的确定方法,首先获取对目标群体的优惠动作施加程度以及目标群体的消费习惯,并且用此数据训练出第一模型并且用第一模型获取第一优惠券敏感度,接着当新场景触发后,基于目标群体的对目标群体的当前优惠动作施加程度以及目标群体的当前消费习惯,用此数据与之前获取的第一敏感度来训练第二模型,最后利用第二模型来获取第二敏感度,从而实现了提升用户对于业务场景的敏感度计算的准确性的技术效果,进而解决了针对相关技术中在预估目标用户对于优惠券敏感度时的处理方法精准性不足的技术问题。
作为一种可选的实施例,在获取目标群体中每个样本的特征信息之前,方法还包括:对每个样本进行人为干预处理,确定目标群体中的第一群体和第二群体,其中,人为干预处理至少包括:发放优惠券,第一群体为未执行对每个样本施加促进样本执行消费动作的群体,第二群体为已执行对每个样本施加促进样本执行消费动作的群体;基于第一群体和第二群体,获取目标群体中每个样本的特征信息。
在上述可选的实施例中,首先可以对目标群体中的每个样本进行人为干预处理,包括但不限于发放优惠券,然后将目标群体进行分组,分为进行发放优惠券的消费群体(即第二群体)和未发放优惠券的消费群体(即第一群体),并且记录下每个群体的优惠券发放情况。
作为一种可选的实施例,利用第二模型获取第二敏感度,包括:基于当前特征信息构造第一损失函数,其中,第一损失函数至少包括:Logloss分类损失函数;基于当前特征信息和第一敏感度构造第二损失函数,其中,第二损失函数至少包括:mse回归损失函数;通过第一损失函数与第二损失函数对第二模型进行优化,得到优化后的第二模型;利用优化后的第二模型获取目标群体的第二敏感度。
在上述可选的实施例中,首先可以分别只基于当前特征信息以及基于当前特征信息与第一敏感度构造第一损失函数和第二损失函数,并且通过第一损失函数和第二损失函数对第二模型进行优化,利用优化后的第二模型获取目标群体的最终敏感度(即第二敏感度),以使得结果更加精确。
作为一种可选的实施例,利用第二模型获取第二敏感度,包括:将目标群体的特征信息输入第二模型或优化后的第二模型,以利用第二模型或优化后的第二模型对特征信息进行处理;获取第二模型或优化后的第二模型的输出,以得到第二敏感度。
在上述可选的实施例中,首先可以将目标群体的当前特征信息输入第二模型或者优化后的第二模型中后来对当前特征信息进行处理后获取第二敏感度。
作为一种可选的实施例,利用第二模型获取第二敏感度,包括:将第一群体的当前特征信息输入第二模型中,以获取与第一群体的特征信息对应的第一结果,其中,第一群体为未执行对每个样本施加促进样本执行消费动作的群体;将第二群体的当前特征信息输入第二模型中,以获取与第二群体的特征信息对应的第二结果,其中,第二群体为已执行对每个样本施加促进样本执行消费动作的群体;基于第一结果与第二结果的差值,确定第二敏感度。
图3是根据本发明实施例的知识蒸馏的因果效应估计方法的示意图,如图3所示,
步骤一、收集样本数据:进行在线AB实验,按用户维度进行随机分流,分成Control组和Treatment组;对分到Treatment组的用户进行干预(比如发券);收集Control组和Treatment组用户的特征、反馈(比如是否下单)数据,每条数据样式为(x,y,T),其中x表示特征,比如用户性别、年龄、购买习惯等;y表示用户反馈(比如是否下单),值为0或者1;T表示是否在Treatment组,值为1或者0。
步骤二、训练Teacher模型,得到每个样本的ITE值:选定所使用的upl ift树模型,可以选择uber的python包causalml中任意树模型;使用103中收集的样本数据(x,y,T),将所有数据放入201选择的模型中进行模型训练,得到每个样本ITE的估计值;收集202中每个样本的输出结果,将样本构造成(x,y,T,ITE)形式;
步骤三、训练Student模型,学习目的为准确预估目标y和Teacher得到的ITE目标:选定Student模型,该模型可以是任意结构的神经网络模型,记为F(x,T);进行Student模型的知识蒸馏学习,目标是准确预估目标y和Teacher模型得到的ITE。学习的损失函数为Loss=Logloss(F(x,T),y)+mse(F(x,1)-F(x,0),ITE)。其中Logloss是交叉熵损失,是常用的分类损失函数;mse是Mean-Squared error,均方误差,是回归常用的损失函数;得到训练好的Student模型F(x,T)。线上预估时使用F(x,1)-F(x,0)(即第一结果与第二结果的差值)得到ITE值。
由上可知,通过本发明实施例提供的目标群体对于优惠券敏感程度的确定方法,利用知识蒸馏技术将树模型(Teacher模型)和单模型(Student模型)各自在精准度和泛化性的优势结合,得到一种新的因果效应估计方法,提出了一种新的模型框架,Teacher模型和Student模型可以根据业务场景进行选择,此处并不局限。
实施例2
根据本发明实施例的另外一个方面,还提供了一种目标群体对于业务场景敏感程度的确定装置,图4是根据本发明实施例的目标群体对于业务场景敏感程度的确定装置的示意图,如图4所示,包括:第一获取模块41、生成模块43、采集模块45、第二获取模块47以及第三获取模块49。下面对该目标群体对于业务场景敏感程度的确定装置进行说明。
第一获取模块41,用于获取目标群体中每个样本的特征信息,其中,特征信息至少包括:每个样本的业务程度信息以及每个样本的消费习惯信息,业务程度信息为对每个样本施加促进样本执行消费动作的程度;
生成模块43,用于将特征信息输入第一模型中,以利用第一模型得到与特征信息对应的第一敏感度,其中,第一模型为使用多组训练数据通过机器学习训练得到的,多组训练数据中的每一组均包括:目标群体中每个样本的历史特征信息以及与历史特征信息对应的历史第一敏感度;
采集模块45,用于响应于当前业务场景的触发,采集目标群体中每个样本的当前特征信息,其中,当前特征信息至少包括:每个样本的当前业务程度信息以及每个样本的当前消费习惯信息,当前业务程度信息为当前对每个样本施加促进样本执行消费动作的程度;
第二获取模块47,用于通过当前特征信息与第一敏感度对预定神经网络进行训练,以获取第二模型;
第三获取模块49,用于利用第二模型获取第二敏感度,其中,第二敏感度为目标群体中每个样本对于当前业务场景的敏感程度。
此处需要说明的是,上述第一获取模块41、生成模块43、采集模块45、第二获取模块47以及第三获取模块49对应于实施例1中的步骤S202至S210,上述模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
由上可知,在本发明实施例中,首先可以借助第一获取模块41获取目标群体中每个样本的特征信息,其中,特征信息至少包括:每个样本的业务程度信息以及每个样本的消费习惯信息,业务程度信息为对每个样本施加促进样本执行消费动作的程度;接着可以借助生成模块43将特征信息输入第一模型中,以利用第一模型得到与特征信息对应的第一敏感度,其中,第一模型为使用多组训练数据通过机器学习训练得到的,多组训练数据中的每一组均包括:目标群体中每个样本的历史特征信息以及与历史特征信息对应的历史第一敏感度;接着可以借助采集模块45响应于当前业务场景的触发,采集目标群体中每个样本的当前特征信息,其中,当前特征信息至少包括:每个样本的当前业务程度信息以及每个样本的当前消费习惯信息,当前业务程度信息为当前对每个样本施加促进样本执行消费动作的程度;接着可以借助第二获取模块47通过当前特征信息与第一敏感度对预定神经网络进行训练,以获取第二模型;最后可以借助第三获取模块49利用第二模型获取第二敏感度,其中,第二敏感度为目标群体中每个样本对于当前业务场景的敏感程度。通过本发明实施例提供的目标群体对于业务场景敏感程度的确定装置,首先获取对目标群体的优惠动作施加程度以及目标群体的消费习惯,并且用此数据训练出第一模型并且用第一模型获取第一优惠券敏感度,接着当新场景触发后,基于目标群体的对目标群体的当前优惠动作施加程度以及目标群体的当前消费习惯,用此数据与之前获取的第一敏感度来训练第二模型,最后利用第二模型来获取第二敏感度,从而实现了提升用户对于业务场景的敏感度计算的准确性的技术效果,进而解决了针对相关技术中在预估目标用户对于优惠券敏感度时的处理方法精准性不足的技术问题。
作为一种可选的实施例,装置还包括:确定模块,用于在获取目标群体中每个样本的特征信息之前,对每个样本进行人为干预处理,确定目标群体中的第一群体和第二群体,其中,人为干预处理至少包括:发放优惠券,第一群体为未执行对每个样本施加促进样本执行消费动作的群体,第二群体为已执行对每个样本施加促进样本执行消费动作的群体;第四获取模块,用于基于第一群体和第二群体,获取目标群体中每个样本的特征信息。
作为一种可选的实施例,第三获取模块,包括:第一构造单元,用于基于当前特征信息构造第一损失函数,其中,第一损失函数至少包括:Logloss分类损失函数;第二构造单元,用于基于当前特征信息和第一敏感度构造第二损失函数,其中,第二损失函数至少包括:mse回归损失函数;优化单元,用于通过第一损失函数与第二损失函数对第二模型进行优化,得到优化后的第二模型;第一获取单元,用于利用优化后的第二模型获取目标群体的第二敏感度。
作为一种可选的实施例,第三获取模块,包括:处理单元,用于将目标群体的特征信息输入第二模型或优化后的第二模型,以利用第二模型或优化后的第二模型对特征信息进行处理;第二获取单元,用于获取第二模型或优化后的第二模型的输出,以得到第二敏感度。
作为一种可选的实施例,第三获取模块,包括:第三获取单元,用于将第一群体的当前特征信息输入第二模型中,以获取与第一群体的特征信息对应的第一结果,其中,第一群体为未执行对每个样本施加促进样本执行消费动作的群体;第四获取单元,用于将第二群体的当前特征信息输入第二模型中,以获取与第二群体的特征信息对应的第二结果,其中,第二群体为已执行对每个样本施加促进样本执行消费动作的群体;确定单元,用于基于第一结果与第二结果的差值,确定第二敏感度。
实施例3
根据本发明实施例的另外一个方面,还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的计算机程序,其中,在计算机程序被处理器运行时控制计算机可读存储介质所在设备执行上述中任一种的目标群体对于业务场景敏感程度的确定方法。
实施例4
根据本发明实施例的另外一个方面,还提供了一种处理器,处理器用于运行计算机程序,其中,计算机程序运行时执行上述中任一种的目标群体对于业务场景敏感程度的确定方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种目标群体对于业务场景敏感程度的确定方法,其特征在于,包括:
获取目标群体中每个样本的特征信息,其中,所述特征信息至少包括:所述每个样本的业务程度信息以及所述每个样本的消费习惯信息,所述业务程度信息为对所述每个样本施加促进所述样本执行消费动作的程度;
将所述特征信息输入第一模型中,以利用所述第一模型得到与所述特征信息对应的第一敏感度,其中,所述第一模型为使用多组训练数据通过机器学习训练得到的,所述多组训练数据中的每一组均包括:所述目标群体中每个样本的历史特征信息以及与所述历史特征信息对应的历史第一敏感度;
响应于当前业务场景的触发,采集所述目标群体中每个样本的当前特征信息,其中,所述当前特征信息至少包括:所述每个样本的当前业务程度信息以及所述每个样本的当前消费习惯信息,所述当前业务程度信息为当前对所述每个样本施加促进所述样本执行消费动作的程度;
通过所述当前特征信息与所述第一敏感度对预定神经网络进行训练,以获取第二模型;
利用所述第二模型获取第二敏感度,其中,所述第二敏感度为所述目标群体中每个样本对于所述当前业务场景的敏感程度。
2.根据权利要求1所述的方法,其特征在于,在获取目标群体中每个样本的特征信息之前,所述方法还包括:
对所述每个样本进行人为干预处理,确定所述目标群体中的第一群体和第二群体,其中,所述人为干预处理至少包括:发放优惠券,所述第一群体为未执行对所述每个样本施加促进所述样本执行消费动作的群体,所述第二群体为已执行对所述每个样本施加促进所述样本执行消费动作的群体;
基于所述第一群体和所述第二群体,获取所述目标群体中每个样本的特征信息。
3.根据权利要求1所述的方法,其特征在于,利用所述第二模型获取第二敏感度,包括:
基于所述当前特征信息构造第一损失函数,其中,所述第一损失函数至少包括:Logloss分类损失函数;
基于所述当前特征信息和所述第一敏感度构造第二损失函数,其中,所述第二损失函数至少包括:mse回归损失函数;
通过所述第一损失函数与所述第二损失函数对所述第二模型进行优化,得到优化后的第二模型;
利用所述优化后的第二模型获取所述目标群体的第二敏感度。
4.根据权利要求1或3所述的方法,其特征在于,利用所述第二模型获取第二敏感度,包括:
将所述目标群体的特征信息输入所述第二模型或所述优化后的第二模型,以利用所述第二模型或所述优化后的第二模型对所述特征信息进行处理;
获取所述第二模型或所述优化后的第二模型的输出,以得到所述第二敏感度。
5.根据权利要求1或3所述的方法,其特征在于,利用所述第二模型获取第二敏感度,包括:
将第一群体的当前特征信息输入所述第二模型中,以获取与所述第一群体的特征信息对应的第一结果,其中,所述第一群体为未执行对所述每个样本施加促进所述样本执行消费动作的群体;
将第二群体的当前特征信息输入所述第二模型中,以获取与所述第二群体的特征信息对应的第二结果,其中,所述第二群体为已执行对所述每个样本施加促进所述样本执行消费动作的群体;
基于所述第一结果与所述第二结果的差值,确定所述第二敏感度。
6.一种目标群体对于业务场景敏感程度的确定装置,其特征在于,包括:
第一获取模块,用于获取目标群体中每个样本的特征信息,其中,所述特征信息至少包括:所述每个样本的业务程度信息以及所述每个样本的消费习惯信息,所述业务程度信息为对所述每个样本施加促进所述样本执行消费动作的程度;
生成模块,用于将所述特征信息输入第一模型中,以利用所述第一模型得到与所述特征信息对应的第一敏感度,其中,所述第一模型为使用多组训练数据通过机器学习训练得到的,所述多组训练数据中的每一组均包括:所述目标群体中每个样本的历史特征信息以及与所述历史特征信息对应的历史第一敏感度;
采集模块,用于响应于当前业务场景的触发,采集所述目标群体中每个样本的当前特征信息,其中,所述当前特征信息至少包括:所述每个样本的当前业务程度信息以及所述每个样本的当前消费习惯信息,所述当前业务程度信息为当前对所述每个样本施加促进所述样本执行消费动作的程度;
第二获取模块,用于通过所述当前特征信息与所述第一敏感度对预定神经网络进行训练,以获取第二模型;
第三获取模块,用于利用所述第二模型获取第二敏感度,其中,所述第二敏感度为所述目标群体中每个样本对于所述当前业务场景的敏感程度。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
确定模块,用于在获取目标群体中每个样本的特征信息之前,对所述每个样本进行人为干预处理,确定所述目标群体中的第一群体和第二群体,其中,所述人为干预处理至少包括:发放优惠券,所述第一群体为未执行对所述每个样本施加促进所述样本执行消费动作的群体,所述第二群体为已执行对所述每个样本施加促进所述样本执行消费动作的群体;
第四获取模块,用于基于所述第一群体和所述第二群体,获取所述目标群体中每个样本的特征信息。
8.根据权利要求6所述的装置,其特征在于,所述第三获取模块,包括:
第一构造单元,用于基于所述当前特征信息构造第一损失函数,其中,所述第一损失函数至少包括:Logloss分类损失函数;
第二构造单元,用于基于所述当前特征信息和所述第一敏感度构造第二损失函数,其中,所述第二损失函数至少包括:mse回归损失函数;
优化单元,用于通过所述第一损失函数与所述第二损失函数对所述第二模型进行优化,得到优化后的第二模型;
第一获取单元,用于利用所述优化后的第二模型获取所述目标群体的第二敏感度。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序被处理器运行时控制所述计算机可读存储介质所在设备执行上述权利要求1至5中任一项所述的目标群体对于业务场景敏感程度的确定方法。
10.一种处理器,其特征在于,所述处理器用于运行计算机程序,其中,所述计算机程序运行时执行上述权利要求1至5中任一项所述的目标群体对于业务场景敏感程度的确定方法。
CN202210761623.5A 2022-06-30 2022-06-30 目标群体对于业务场景敏感程度的确定方法及其装置 Pending CN115063178A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210761623.5A CN115063178A (zh) 2022-06-30 2022-06-30 目标群体对于业务场景敏感程度的确定方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210761623.5A CN115063178A (zh) 2022-06-30 2022-06-30 目标群体对于业务场景敏感程度的确定方法及其装置

Publications (1)

Publication Number Publication Date
CN115063178A true CN115063178A (zh) 2022-09-16

Family

ID=83204114

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210761623.5A Pending CN115063178A (zh) 2022-06-30 2022-06-30 目标群体对于业务场景敏感程度的确定方法及其装置

Country Status (1)

Country Link
CN (1) CN115063178A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115905624A (zh) * 2022-10-18 2023-04-04 支付宝(杭州)信息技术有限公司 一种用户行为状态的确定方法、装置及设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115905624A (zh) * 2022-10-18 2023-04-04 支付宝(杭州)信息技术有限公司 一种用户行为状态的确定方法、装置及设备

Similar Documents

Publication Publication Date Title
CN110033314B (zh) 广告数据处理方法及装置
JP7105700B2 (ja) サービス対象のための時分割推薦方法及び装置
JP6059123B2 (ja) 顧客データ分析・検証システム
CN108805598B (zh) 相似度信息确定方法、服务器及计算机可读存储介质
US20110082718A1 (en) Analyzing Patterns within Transaction Data
US11810151B2 (en) Predictive recommendation system using tiered feature data
CN105335518A (zh) 生成用户偏好信息的方法及装置
CN111695938B (zh) 产品推送方法及系统
CN111882420A (zh) 响应率的生成方法、营销方法、模型训练方法及装置
CN111311332A (zh) 用户数据的处理方法和装置
US20120197712A1 (en) method and system for determining effectiveness of marketing
JP6840446B2 (ja) データ処理装置及びデータ処理方法
CN115063178A (zh) 目标群体对于业务场景敏感程度的确定方法及其装置
CN111881365A (zh) 内容推荐方法及装置
Ming et al. Consumer equilibrium, demand effects, and efficiency in group buying
CN112330373A (zh) 用户行为分析方法、装置及计算机可读存储介质
CN111553542A (zh) 一种用户优惠券核销率预测方法
CN111815351A (zh) 一种基于协同过滤与关联规则的服装推荐方法
CN110889716A (zh) 识别潜在注册用户的方法及装置
CN110428281A (zh) 针对多种关联产品联合确定对等资源量的方法和装置
CN116127184A (zh) 产品的推荐方法及装置、非易失性存储介质、电子设备
CN116228274A (zh) 标签信息处理方法、装置、存储介质、电子设备及系统
CN110738521B (zh) 一种多电商品牌的客户销售方法和装置
CN110796379A (zh) 业务渠道的风险评估方法、装置、设备及存储介质
CN111881355B (zh) 对象的推荐方法、装置、存储介质和处理器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination