CN111309994A - 用户匹配方法、装置、电子设备及可读存储介质 - Google Patents

用户匹配方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN111309994A
CN111309994A CN202010075813.2A CN202010075813A CN111309994A CN 111309994 A CN111309994 A CN 111309994A CN 202010075813 A CN202010075813 A CN 202010075813A CN 111309994 A CN111309994 A CN 111309994A
Authority
CN
China
Prior art keywords
user
activity
users
test
comparison
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010075813.2A
Other languages
English (en)
Inventor
范聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CN202010075813.2A priority Critical patent/CN111309994A/zh
Publication of CN111309994A publication Critical patent/CN111309994A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供了一种用户匹配方法、装置、电子设备及可读存储介质,所述方法包括:根据是否检测到对目标对象的操作,将各个用户分为候选测试类用户和候选对照类用户;确定候选测试类用户中每个用户的活跃度,得到第一活跃度分布曲线,以及,确定候选对照类用户中每个用户的活跃度,得到第二活跃度分布曲线;对比第一活跃度分布曲线和第二活跃度分布曲线,从所述候选测试类用户中确定测试类用户,以及,从所述候选对照类用户中确定对照类用户;根据所述测试类用户和所述对照类用户各自的活跃度,确定与每个测试类用户匹配的对照类用户。本申请实现了依据用户自身的活跃度特征进行用户匹配,使得AB分组的结果更为稳定,提高了评估的可靠性。

Description

用户匹配方法、装置、电子设备及可读存储介质
技术领域
本申请实施例涉及数据处理技术领域,尤其涉及一种用户匹配方法、装置、电子设备及可读存储介质。
背景技术
随着互联网的广泛普及,各类互联网产品应运而生,目前,互联网产品的种类繁多,例如,包括:各类社交APP、网络购物APP、网约车APP。在每一个互联网产品中均可以包括多种服务形态的子产品,以帮助该互联网产品赢得较多的用户群体,从而增加收益。实际中,一般会对新推出的这些子产品进行产品评估,以方便运营人员根据评估结果确定是否继续上线该新推出的产品。
相关技术中,一般是通过AB实验对新推出的产品的效果进行评估,即,将用户划分为A组和B组,通过对比新推出的产品在A组用户和B组用户中的效果来进行评估。在采用该方法时,是将用户聚类为不同的簇,以不同的簇作为AB分组的依据。但是,对于聚类而言,聚类点的多寡对于AB分组的结果影响较大,比如,选择用户的职业、性别等聚类点与选择用户的年龄、身高、性别等聚类点,所得到的AB分组结果差别较大,因而使得评估的可靠性较差。
发明内容
本申请实施例提供一种用户匹配方法、装置、电子设备及可读存储介质,以解决相关技术中存在的将用户聚类为不同的簇,以不同的簇作为AB分组的依据所带来的评估的可靠性较差的问题。
本申请实施例第一方面提供了一种用户匹配方法,所述方法包括:
根据是否检测到对目标对象的操作,将各个用户分为候选测试类用户和候选对照类用户;
确定所述候选测试类用户中每个用户的活跃度,得到第一活跃度分布曲线,以及,确定所述候选对照类用户中每个用户的活跃度,得到第二活跃度分布曲线;
对比所述第一活跃度分布曲线和所述第二活跃度分布曲线,从所述候选测试类用户中确定测试类用户,以及,从所述候选对照类用户中确定对照类用户,所述对照类用户的活跃度的分布范围与所述测试类用户的活跃度的分布范围相同;
根据所述测试类用户和所述对照类用户各自的活跃度,确定与每个测试类用户匹配的对照类用户。
可选地,确定所述候选测试类用户中每个用户的活跃度,包括:
将所述候选测试类用户中每个用户的行为特征序列输入活跃度预测模型,得到所述候选测试类用户中每个用户的活跃度;
其中,所述活跃度预测模型是以多个样本用户各自的行为特征序列为训练样本,对长短期记忆模型进行训练所得到的。
可选地,所述活跃度为预设周期内活跃度;根据是否检测到对目标对象的操作,将各个用户分为候选测试类用户和候选对照类用户,包括:
根据在所述预设周期内是否检测到对目标对象的操作,将各个用户分为候选测试类用户和候选对照类用户。
可选地,在确定与每个测试类用户匹配的对照类用户之后,所述方法还包括:
对每个测试类用户和该测试类用户对应的对照类用户各自产生的预设类型的数据进行统计;
将统计得到各个测试类用户的所述预设类型的数据和各个对照类用户的所述预设类型的数据进行对比,得到所述目标对象对应的增量。
可选地,在得到所述目标对象对应的增量之后,所述方法还包括:
在所述目标对象对应的增量大于预设阈值的情况下,向多个其他用户的用户终端推送所述目标对象的推荐信息。
本申请实施例第二方面提供了一种用户匹配装置,所述装置包括:
用户划分模块,用于根据是否检测到对目标对象的操作,将各个用户分为候选测试类用户和候选对照类用户;
活跃度分布曲线获得模块,用于确定所述候选测试类用户中每个用户的活跃度,得到第一活跃度分布曲线,以及,确定所述候选对照类用户中每个用户的活跃度,得到第二活跃度分布曲线;
用户确定模块,用于对比所述第一活跃度分布曲线和所述第二活跃度分布曲线,从所述候选测试类用户中确定测试类用户,以及,从所述候选对照类用户中确定对照类用户,所述对照类用户的活跃度的分布范围与所述测试类用户的活跃度的分布范围相同;
用户匹配模块,用于根据所述测试类用户和所述对照类用户各自的活跃度,确定与每个测试类用户匹配的对照类用户。
可选地,所述活跃度分布曲线获得模块,包括:
活跃度确定单元,用于将所述候选测试类用户中每个用户的行为特征序列输入活跃度预测模型,得到所述候选测试类用户中每个用户的活跃度;
其中,所述活跃度预测模型是以多个样本用户各自的行为特征序列为训练样本,对长短期记忆模型进行训练所得到的。
可选地,所述活跃度为预设周期内活跃度;所述用户划分模块,具体用于根据在所述预设周期内是否检测到对目标对象的操作,将各个用户分为候选测试类用户和候选对照类用户。
可选地,所述装置还包括:
统计模块,用于对每个测试类用户和该测试类用户对应的对照类用户各自产生的预设类型的数据进行统计;
增量确定模块,用于将统计得到各个测试类用户的所述预设类型的数据和各个对照类用户的所述预设类型的数据进行对比,得到所述目标对象对应的增量。
可选地,所述装置还包括:
推荐信息发送模块,用于在所述目标对象对应的增量大于预设阈值的情况下,向多个其他用户的用户终端推送所述目标对象的推荐信息。
本申请实施例第三方面提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请第一方面所述的方法中的步骤。
本申请实施例第四方面提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行时实现本申请第一方面所述的方法的步骤。
采用本申请实施例提供的用户匹配方法,可以根据用户是否对目标对象进行操作,将各个用户分为候选测试类用户及候选对照类用户,进而得到候选测试类用户的第一活跃度分布曲线和候选对照类用户的第二活跃度分布曲线,之后,对比所述第一活跃度分布曲线和所述第二活跃度分布曲线,从所述候选测试类用户中确定测试类用户,并从所述候选对照类用户中确定对照类用户,最后,确定与测试类用户的活跃度匹配的对照类用户,得到适于AB实验的测试类用户和与该测试类用户匹配的对照类用户。
本申请实施例由于根据是否操作目标对象对用户进行初步聚类,进而再根据各用户的活跃度对初步聚类后的用户进行再次筛选,以得到测试类用户和对照类用户,再根据各测试类用户和对照类用户各自的活跃度,确定与测试类用户匹配的对照类用户。一方面,使得得到的候选测试类用户、候选对照类用户与用户对目标对象进行的操作紧密关联,提高了评估的可控性。另一方面,由于是根据每个用户的活跃度对初步聚类后的结果进行精筛,实现了依据用户自身的活跃度特征进行用户匹配,使得AB分组的结果更为稳定,进而提高了评估的可靠性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提出的用户匹配方法的整体流程示意图;
图2是本申请一实施例提出的用户匹配方法的步骤流程图;
图3是本申请一实施例中提出的活跃度分布曲线的示意图;
图4是本申请一实施例提出的确定所述候选测试类用户中每个用户的活跃度的整体流程示意图;
图5是本申请一实施例提出的用户匹配装置的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请发明人为了解决相关技术中存在的将用户聚类为不同的簇,以不同的簇作为AB分组的依据所带来的评估的可靠性较差的问题,提出了如下的发明构思:以用户的活跃度作为分配因子,对用户进行分组匹配,从而进行AB试验,以解决相关技术中设置不同的聚类点造成分组结果差异大,评估不可靠的问题。
参照图1所示,示出了本申请一实施例提出的用户匹配方法的整体流程示意图,下面,结合图1,对该用户匹配方法进行详细介绍。
参考图2,图2是本申请一实施例提出的用户匹配方法的步骤流程图。如图2所示,该方法具体可以包括以下步骤:
步骤S21:根据是否检测到对目标对象的操作,将各个用户分为候选测试类用户和候选对照类用户。
本实施例中,目标对象可以是指运行在应用服务程序上的指定应用,具体地,该目标对象具体可以理解为是需要进行评估的应用对象。例如,需要对运行在购物APP上的抢优惠券应用进行评估,则可以将抢优惠券应用作为目标对象。
实际中,根据是否检测到对目标对象的操作,将各个用户分为候选测试类用户和候选对照类用户之前,可以将目标对象推送给各个用户。以便后期评估目标对象在对各个用户中产生的影响。例如,目标对象运行在购物APP上的抢优惠券应用,则可以预先将该抢优惠券应用发送给各用户。
本实施例中,对目标对象的操作可以是指各个用户对目标对象的开启操作,实际中,用户可以通过点击“打开”控制键开启目标对象,或者用户可以直接点击目标对象以开启目标对象。
实际中,对于每一个用户而言,检测到对目标对象的操作,即可以表示发送给该用户的目标对象被该用户所触发,此种情况下,可以将该确定为候选测试类用户。未检测到对目标对象的操作,即可以表示发送给该用户的目标对象未被该用户所触发或被该用户直接关闭,此种情况下,可以将该用户确定为候选对照类用户。以此类推,可以实现对各个用户的分类。
以图1为例,是否检测到对目标对象的操作对应于图1中的今日是否触达,即是检测到了对目标对象的操作便是指今日触达,未检测到对目标对象的操作便是指今日未触达。进而,可以在各个用户中,将今日触达的用户划分到实验组中作为候选实验类用户,将今日未触达的用户划分到候选对照组中作为候选对照类用户。
步骤S22:确定所述候选测试类用户中每个用户的活跃度,得到第一活跃度分布曲线,以及,确定所述候选对照类用户中每个用户的活跃度,得到第二活跃度分布曲线。
以图1为例对本步骤进行说明,在根据今日是否触达对用户进行了划分后,便可以确定实验组中每个用户的活跃度,以及侯选对照组中每个用户的活跃度。进而相应地,得到了实验组的概率分布(即第一活跃度分布曲线)和对照组的概率分布(即第二活跃度分布曲线)。
本实施例中,活跃度可以表征用户触发所述目标对象的概率,通过该活跃度可以预测一个用户在当前时间之后触发所述目标对象的概率。实际中,该活跃度可以用0-1之间的值表示,值越大活跃度越高,用户在当前时间之后触发所述目标对象的概率越高。
实际中,每个用户的活跃度可以根据该用户的历史实际活跃度进行确定,历史实际活跃度即为该用户在当前时间之前触发应用对象的实际概率。该应用对象可以是指目标对象也可以是指其他应用对象,本申请实施例对此不做限制。
在确定所述候选测试类用户中每个用户的活跃度及所述候选对照类用户中每个用户的活跃度后,进而便得到了候选测试类用户的第一活跃度分布曲线和候选对照类用户的第二活跃度分布曲线。其中,第一活跃度分布曲线可以反映候选测试类用户的活跃度的分布情况,同理,第二活跃度分布曲线可以反映候选对照类用户的活跃度的分布情况。
参照图3所示,示出了本申请一实施例中提出的活跃度分布曲线的示意图,图3中,X轴表示活跃度,Y轴表示用户的数量,实线所示的曲线为第一活跃度分布曲线,虚线所示的曲线为第二活跃度分布曲线。由图3的第一活跃度分布曲线可以很直观地看出候选测试类用户的活跃度的分布情况,同理,通过图3所示的第二活跃度分布曲线可以很直观地看出候选对照类用户的活跃度的分布情况。
步骤S23:对比所述第一活跃度分布曲线和所述第二活跃度分布曲线,从所述候选测试类用户中确定测试类用户,以及,从所述候选对照类用户中确定对照类用户。
其中,所述对照类用户的活跃度的分布范围与所述测试类用户的活跃度的分布范围相同。
本实施例中,通过所述第一活跃度分布曲线可以确定候选测试类用户的活跃度分布范围,通过所述第二活跃度分布曲线可以确定候选对照类用户的活跃度分布范围。进而,可以对比候选测试类用户的活跃度分布范围和候选对照类用户的活跃度分布范围,确定二者重合的活跃度分布范围。进而,可以根据该重合的活跃度分布范围,从候选测试类用户中确定测试类用户,以及,从候选对照类用户中确定对照类用户,以使对照类用户的活跃度的分布范围与测试类用户的活跃度的分布范围相同。
以图1为例对本步骤进行说明,在得到实验组的概率分布(即第一活跃度分布曲线)和对照组的概率分布(即第二活跃度分布曲线)后,可以通过计算common support(确定两个概率分布中共同的概率分布),进而得到测试类用户和对照类用户,经过计算commonsupport后,使得测试类用户和对照类用户具有共同的概率分布,即具有相同的活跃度分布范围。
示例地,如图3所示,第一活跃度分布曲线的活跃度最低值为0.2、最高值为0.95,则可以确定候选测试类用户的活跃度分布范围为0.2至0.95。第二活跃度分布曲线的活跃度最低值为0.15、最高值为0.88,则可以确定候选对照类用户的活跃度分布范围为0.15至0.88。进而确定二者重合的活跃度分布范围为:0.2-0.88。因此,可以从候选测试类用户中筛选出活跃度为0.2-0.88的用户作为实验类用户,从候选对照类用户中也筛选出活跃度为0.2-0.88的用户作为对照类用户。确定后的实验类用户的活跃度分布范围与对照类用户的活跃度分布范围相同。
步骤S24:根据所述测试类用户和所述对照类用户各自的活跃度,确定与每个测试类用户匹配的对照类用户。
本实施例中,对测试类用户中的每个用户而言,可以以该用户的活跃度为基准,从对照类用户中确定与该用户的活跃度的差值小于预设阈值的用户,将该活跃度的差值小于预设阈值的用户确定为与该用户匹配的对照类用户。这样,对一个与测试类用户匹配的对照类用户而言,该对照类用户的活跃度与该测试类用户的活跃度相同,或者与该测试类用户的活跃度不同,但是二者的差值小于预设阈值。
实际中,与每个测试类用户匹配的对照类用户的数量可以为1个或多个。
以图1为例对本步骤进行说明,在经过计算common support后,得到测试类用户和对照类用户后,便可以按照最临近匹配,得到与一个实验组用户A(即实验类用户)对应的对照组用户B(即对照类用户)。其中,最临近匹配即可以是指实验组用户A的活跃度与对照组用户B的活跃度之间的差值小于预设阈值。
示例地,如图3所示,以预设阈值为0.04为例,对活跃度为0.5测试类用户而言,在各个对照类用户中,则可以将活跃度分布在0.46至0.54之间的对照类用户确定为与该测试类用户匹配的对照类用户。若符合上述要求的对照类用户为1个,则与该测试类用户匹配的对照类用户的数量为1,若符合上述要求的对照类用户为2个,则与该测试类用户匹配的对照类用户的数量为2。
本申请实施例中,由于根据是否操作目标对象对用户进行初步聚类,并根据每个用户的活跃度,对初步聚类得到的候选测试类用户与候选对照类用户进行筛选,得到测试类用户和对照类用户,并根据活跃度确定与每个测试类用户匹配的对照类用户。一方面,使得得到的候选测试类用户与候选对照类用户与目标对象可以紧密关联,由于目标对象为待评估的应用,使得最终对测试类用户和对照类用户进行评估时,提高了评估的可控性,使得对目标对象的评估结果更为可靠。另一方面,由于是根据每个用户的活跃度对初步聚类后的结果进行精筛,即是依据用户自身的行为特点进行用户匹配,优化了聚类点的选取,相比于根据用户的年龄、身高、性别等作为聚类得到的分组结果差别较大的问题而言,本申请可以在用户具有不同的年龄、性别、身高等情况下,依然能保证分组结果的稳定性,进而提高了评估的可靠性。
参照图4所示,示出了本申请提出的一实施例中确定所述候选测试类用户中每个用户的活跃度的整体流程示意图,具体可以包括以下步骤:
步骤S221:将所述候选测试类用户中每个用户的行为特征序列输入活跃度预测模型,得到所述候选测试类用户中每个用户的活跃度。
其中,所述活跃度预测模型是以多个样本用户各自的行为特征序列为训练样本,对长短期记忆模型(long-shorttermmemory,长短期记忆模型)进行训练所得到的。
本实施例中,该行为特征序列可以是该用户操作所述目标对象时产生的特征序列,也可以是指该用户操作其他应用对象时产生的特征序列。
在一种实施例中,每个用户的行为特征序列可以是该用户在当前时间之前的预设时间段内的行为特征序列。这样,由于获得的行为特征序列是在预设时间段获得的,进而提高了活跃度的准确性。即,可以准确预测一个用户在当前时间之后触发该目标对象的概率。
示例地,参照图4所示,以预设时间段为30天、目标对象为抢优惠券应用为例,将用户在30天中每天抢优惠券的次数、每张优惠券对对应的大额度、小额度、分享优惠券的次数作为行为特征序列,这样,该行为特征序列中便可以包括最近30天内用户触发抢优惠券应用的特征。如,该行为特征序列可以表示为{d1(1、50、3、2),d2(3、20、1、3)、、},其中,d1(1、50、3、2)表示用户一天抢抵优惠券的次数、大额度、小额度、分享优惠券的次数。
本实施例中,可以将每个用户的行为特征序列输入到活跃度预测模型中,得到该用户的活跃度。如图4所示,可以将每个用户的行为特征序列输入到活跃度预测模型的输入层,经活跃度预测模型的输出层得到该用户的活跃度。
其中,活跃度预测模型可以是对长短期记忆模型进行预先训练后得到的模型。图4中示出了该活跃度预测模型的结构图。其中,如图4所示,活跃度预测模型包括输入层、长短期记忆层、注意力层(Attention layer)、全连接层(Full collection layer)和输出层。
具体地,对长短期记忆模型进行训练得到活跃度预测模型的过程可以是如下的过程:
获得多个样本用户各自的行为特征序列,例如,如上述示例中所述的行为特征序列。其中,样本用户可以是与上述的候选测试类用户和候选对照类用户不同的用户。
以多个样本用户各自的行为特征序列为输入,对长短期记忆模型进行训练,得到活跃度预测模型。
需要说明的是:确定所述候选对照类用户中每个用户的活跃度的过程也可以参照上述步骤S221的过程。
采用本实施方式时,由于可以通过活跃度预测模型确定每个用户的活跃度,进而可以提高确定每个用户的活跃度的效率,以从整体上提高用户匹配的效率。
结合以上实施例,在本申请提出的一种实施例中,每个用户的活跃度可以为预设周期内活跃度,即每个用户的活跃度可以为该用户在所述预设周内的活跃度。例如,可以是用户在1天内的活跃度,或者是该用户在1周内的活跃度。如此,便可以根据该预设周期内活跃度,预测一个用户在预设周期内触发目标对象的概率。例如,预设周期为1天,活跃度为0.58,则在一天内用户触发目标对象的概率为58%。
相应地,在根据是否检测到对目标对象的操作,将各个用户分为候选测试类用户和候选对照类用户时,可以是根据在所述预设周期内是否检测到对目标对象的操作,将各个用户分为候选测试类用户和候选对照类用户。
本实施例中,在活跃度为预设周期内活跃度时,对各个用户分类的过程也可以是:在预设周期内检测到用户对目标对象的操作,则将该用户划分到候选测试类用户中,在预设周期内未检测到用户对目标对象的操作,则将该用户划分到候选对照类用户中。
示例地,以图1为例,今日是否触达,便可以理解为是以一天作为预设周期,则相应的活跃度便为一天内的活跃度。具体地,检测用户在当前时间之前的24小时内是否对目标对象进行了操作,若用户在当前时间之前的24小时内对目标对象进行了操作,则可以将该用户划分到实验组。反之,则将该用户划分到候选对照组。之后,可以确定一个用户在当前时间之后的24小时内的活跃度。
在获得每个测试类用户,以及与每个测试类用户匹配的对照类用户后,便可以将测试类用户作为A组用户,将与之匹配的对照类用户作为B组用户,进而进行AB试验,以对所述目标对象进行评估。如图1所示,在得到实验组用户A和对照组用户B后,可以统计AB实验效果。
基于此,在本申请提出的一实施例中,在确定与每个测试类用户匹配的对照类用户之后,还可以对所述目标对象进行评估,具体可以包括以下步骤:
步骤S25:对每个测试类用户和该测试类用户对应的对照类用户各自产生的预设类型的数据进行统计。
本实施例中,其中,预设类型可以是收益类型,这样,每个用户的预设类型的数据可以是指该用户下发的订单带来的收益值,在一种应用场景中,用户下发的订单可以是指该用户在目标对象所运行的平台上下发的所有订单,则,预设类型的数据便可以是该用户下发的全部订单为平台带来的收益值。
例如,目标对象是抢优惠券应用,目标对象运行在外卖服务平台上,该优惠券可以在该外卖平台上全场使用,则可以将用户在该外卖平台上下发的所有订单所产生的收益进行统计。
在另一种应用场景中,用户下发的订单可以是与目标对象具有关联关系的订单。
例如,目标对象是抢优惠券应用,购买餐巾纸、衣服、鞋袜可以享受优惠券,则将餐巾纸、衣服、鞋袜确定为与抢优惠券应用具有关联关系的商品。进而,可以对用户对餐巾纸、衣服、鞋袜下发的订单所产生的收益进行统计。
步骤S26:将统计得到各个测试类用户的预设类型的数据和各个对照类用户的预设类型的数据进行对比,得到所述目标对象对应的增量。
本实施例中,可以将各个测试类用户的预设类型的数据减去对照类用户的预设类型的数据所得到的值,作为所述目标对象对应的增量。
例如,测试类用户的预设类型的数据为200,对照类用户的预设类型的数据为150,则目标对象对应的增量为50。
其中,目标对象对应的增量可以反映投放该目标对象时,对照类用户和实验类用户所带来的收益值的差距,增量越大,则可以确定该实验类用户受目标对象的影响较大,可以带来更大的收益,则可以继续推广目标对象。增量越小甚至为负,则可以确定实验类用户收目标对象的影响与对照类用户受目标对象的影响相差不大,不能带来较大的收益,可以停止对其的推广。
在一种实施例中,也可以确定每个测试类用户和该测试类用户对应的对照类用户各自产生的预设类型的数据的增量,进而可以根据得到的各个增量,确定平均增量,将该平均增量作为所述目标对象对应的增量。这样,可以对各个增量进行平滑,使得得到对应的增量更为客观,继而提高评估的可靠性。
相应地,在一种应用场景中,为了可以在收益增量较高的情况下,可以自动在用户群中推广该目标对象,在得到所述目标对象对应的增量之后,还可以包括以下步骤:
步骤S27:在所述目标对象对应的增量大于预设阈值的情况下,向多个其他用户的用户终端推送所述目标对象的推荐信息。
本实施例中,其他用户可以是指不同于候选测试类用户和候选对照类用户的用户,也可以是指不同于测试类用户和对照类用户的用户。其他用户的用户终端可以是但是不限于手机、电脑、平板电脑、机顶盒等。
其中,预设阈值可以由运营人员根据实际情况进行设定。推荐信息可以是指推荐所述目标对象的信息,在该推荐信息中可以包括目标对象的二维码、链接等。
实际中,也可以根据增量得到ROI((Return On Investment,投资回报率)指标,ROI是指通过投资而应返回的价值,并通过ROI指标评估目标对象的影响。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
基于同一发明构思,本申请一实施例提供一种用户匹配装置。参考图5,图5是本申请一实施例提供的用户匹配装置的示意图。如图5所示,该装置具体可以包括以下模块:
用户划分模块51,用于根据是否检测到对目标对象的操作,将各个用户分为候选测试类用户和候选对照类用户;
活跃度分布曲线获得模块52,用于确定所述候选测试类用户中每个用户的活跃度,得到第一活跃度分布曲线,以及,确定所述候选对照类用户中每个用户的活跃度,得到第二活跃度分布曲线;
用户确定模块53,用于对比所述第一活跃度分布曲线和所述第二活跃度分布曲线,从所述候选测试类用户中确定测试类用户,以及,从所述候选对照类用户中确定对照类用户,所述对照类用户的活跃度的分布范围与所述测试类用户的活跃度的分布范围相同;
用户匹配模块54,用于根据所述测试类用户和所述对照类用户各自的活跃度,确定与每个测试类用户匹配的对照类用户。
可选地,所述活跃度分布曲线获得模块,具体可以包括以下单元:
活跃度确定单元,用于将所述候选测试类用户中每个用户的行为特征序列输入活跃度预测模型,得到所述候选测试类用户中每个用户的活跃度;
其中,所述活跃度预测模型是以多个样本用户各自的行为特征序列为训练样本,对长短期记忆模型进行训练所得到的。
可选地,所述活跃度为预设周期内活跃度;所述用户划分模块,具体可以用于根据在所述预设周期内是否检测到对目标对象的操作,将各个用户分为候选测试类用户和候选对照类用户。
可选地,所述装置还可以包括以下模块:
统计模块,用于对每个测试类用户和该测试类用户对应的对照类用户各自产生的预设类型的数据进行统计;
增量确定模块,用于将统计得到各个测试类用户的所述预设类型的数据和各个对照类用户的所述预设类型的数据进行对比,得到所述目标对象对应的增量。
可选地,所述装置还可以包括以下模块:
推荐信息发送模块,用于在所述目标对象对应的增量大于预设阈值的情况下,向多个其他用户的用户终端推送所述目标对象的推荐信息。
基于同一发明构思,本申请另一实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请上述任一实施例所述的方法中的步骤。
基于同一发明构思,本申请另一实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行时实现本申请上述任一实施例所述的方法中的步骤。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本申请实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本申请所提供的一种用户匹配方法、装置、存储介质和电子设备,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种用户匹配方法,其特征在于,所述方法包括:
根据是否检测到对目标对象的操作,将各个用户分为候选测试类用户和候选对照类用户;
确定所述候选测试类用户中每个用户的活跃度,得到第一活跃度分布曲线,以及,确定所述候选对照类用户中每个用户的活跃度,得到第二活跃度分布曲线;
对比所述第一活跃度分布曲线和所述第二活跃度分布曲线,从所述候选测试类用户中分别确定测试类用户,并从所述候选对照类用户确定对照类用户,所述对照类用户的活跃度的分布范围与所述测试类用户的活跃度的分布范围相同;
根据所述测试类用户和所述对照类用户各自的活跃度,确定与每个测试类用户匹配的对照类用户。
2.根据权利要求1所述的方法,其特征在于,确定所述候选测试类用户中每个用户的活跃度,包括:
将所述候选测试类用户中每个用户的行为特征序列输入活跃度预测模型,得到所述候选测试类用户中每个用户的活跃度;
其中,所述活跃度预测模型是以多个样本用户各自的行为特征序列为训练样本,对长短期记忆模型进行训练所得到的。
3.根据权利要求1所述的方法,其特征在于,在确定与每个测试类用户匹配的对照类用户之后,所述方法还包括:
对每个测试类用户和该测试类用户对应的对照类用户各自产生的预设类型的数据进行统计;
将统计得到各个测试类用户的所述预设类型的数据和各个对照类用户的所述预设类型的数据进行对比,得到所述目标对象对应的增量。
4.根据权利要求3所述的方法,其特征在于,在得到所述目标对象对应的增量之后,所述方法还包括:
在所述目标对象对应的增量大于预设阈值的情况下,向多个其他用户的用户终端推送所述目标对象的推荐信息。
5.一种用户匹配装置,其特征在于,所述装置包括:
用户划分模块,用于根据是否检测到对目标对象的操作,将各个用户分为候选测试类用户和候选对照类用户;
活跃度分布曲线获得模块,用于确定所述候选测试类用户中每个用户的活跃度,得到第一活跃度分布曲线,以及,确定所述候选对照类用户中每个用户的活跃度,得到第二活跃度分布曲线;
用户确定模块,用于对比所述第一活跃度分布曲线和所述第二活跃度分布曲线,从所述候选测试类用户中确定测试类用户,以及,从所述候选对照类用户中确定对照类用户,所述对照类用户的活跃度的分布范围与所述测试类用户的活跃度的分布范围相同;
用户匹配模块,用于根据所述测试类用户和所述对照类用户各自的活跃度,确定与每个测试类用户匹配的对照类用户。
6.根据权利要求5所述的装置,其特征在于,所述活跃度分布曲线获得模块,包括:
活跃度确定单元,用于将所述候选测试类用户中每个用户的行为特征序列输入活跃度预测模型,得到所述候选测试类用户中每个用户的活跃度;
其中,所述活跃度预测模型是以多个样本用户各自的行为特征序列为训练样本,对长短期记忆模型进行训练所得到的。
7.根据权利要求5所述的装置,其特征在于,所述装置还包括:
统计模块,用于对每个测试类用户和该测试类用户对应的对照类用户各自产生的预设类型的数据进行统计;
增量确定模块,用于将统计得到各个测试类用户的预设类型的数据和各个对照类用户的预设类型的数据进行对比,得到所述目标对象对应的增量。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
推荐信息发送模块,用于在所述目标对象对应的增量大于预设阈值的情况下,向多个其他用户的用户终端推送所述目标对象的推荐信息。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4任一所述的方法中的步骤。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行时实现如权利要求1-4任一所述的方法的步骤。
CN202010075813.2A 2020-01-22 2020-01-22 用户匹配方法、装置、电子设备及可读存储介质 Pending CN111309994A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010075813.2A CN111309994A (zh) 2020-01-22 2020-01-22 用户匹配方法、装置、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010075813.2A CN111309994A (zh) 2020-01-22 2020-01-22 用户匹配方法、装置、电子设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN111309994A true CN111309994A (zh) 2020-06-19

Family

ID=71148272

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010075813.2A Pending CN111309994A (zh) 2020-01-22 2020-01-22 用户匹配方法、装置、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN111309994A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112612826A (zh) * 2020-12-21 2021-04-06 北京达佳互联信息技术有限公司 数据处理方法和装置
CN112686690A (zh) * 2020-12-21 2021-04-20 北京达佳互联信息技术有限公司 数据处理方法、装置、电子设备及计算机可读存储介质
CN114781496A (zh) * 2022-04-01 2022-07-22 北京百度网讯科技有限公司 一种寻优抽样方法、装置及电子设备

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112612826A (zh) * 2020-12-21 2021-04-06 北京达佳互联信息技术有限公司 数据处理方法和装置
CN112686690A (zh) * 2020-12-21 2021-04-20 北京达佳互联信息技术有限公司 数据处理方法、装置、电子设备及计算机可读存储介质
CN112612826B (zh) * 2020-12-21 2024-02-06 北京达佳互联信息技术有限公司 数据处理方法和装置
CN112686690B (zh) * 2020-12-21 2024-03-15 北京达佳互联信息技术有限公司 数据处理方法、装置、电子设备及计算机可读存储介质
CN114781496A (zh) * 2022-04-01 2022-07-22 北京百度网讯科技有限公司 一种寻优抽样方法、装置及电子设备
CN114781496B (zh) * 2022-04-01 2023-11-07 北京百度网讯科技有限公司 一种寻优抽样方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN110413877B (zh) 一种资源推荐方法、装置及电子设备
CN110163647B (zh) 一种数据处理方法及装置
CN110532479A (zh) 一种信息推荐方法、装置及设备
WO2015120798A1 (en) Method for processing network media information and related system
CN111309994A (zh) 用户匹配方法、装置、电子设备及可读存储介质
CN105225135B (zh) 潜力客户识别方法以及装置
CN107153656B (zh) 一种信息搜索方法和装置
CN110069545B (zh) 一种行为数据评估方法及装置
WO2020135642A1 (zh) 一种基于生成对抗网络的模型训练方法及设备
CN113344647B (zh) 一种信息推荐的方法及装置
CN109003091A (zh) 一种风险防控处理方法、装置及设备
CN113656699B (zh) 用户特征向量确定方法、相关设备及介质
CN110717509A (zh) 基于树分裂算法的数据样本分析方法及装置
CN112070559A (zh) 状态获取方法和装置、电子设备和存储介质
KR20090000232A (ko) 상황인식 사례기반 음악추천시스템 및 그 방법
US20220129754A1 (en) Utilizing machine learning to perform a merger and optimization operation
CN109460474B (zh) 用户偏好趋势挖掘方法
CN111444930A (zh) 一种确定二分类模型的预测效果的方法及装置
CN117194779A (zh) 基于人工智能的营销系统优化方法、装置及设备
CN116883179A (zh) 金融产品投资策略的确定方法、装置、处理器及电子设备
CN108388652B (zh) 一种发送歌单标识的方法和装置
CN115311001A (zh) 一种基于多重投票算法的预测用户换机倾向的方法及系统
CN115439180A (zh) 一种目标对象确定方法、装置、电子设备及存储介质
CN107291722B (zh) 一种描述词的分类方法及设备
CN114741592A (zh) 一种基于多模型融合的产品推荐方法、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination