CN107437199A - 平台收益预测方法及装置 - Google Patents

平台收益预测方法及装置 Download PDF

Info

Publication number
CN107437199A
CN107437199A CN201710459126.9A CN201710459126A CN107437199A CN 107437199 A CN107437199 A CN 107437199A CN 201710459126 A CN201710459126 A CN 201710459126A CN 107437199 A CN107437199 A CN 107437199A
Authority
CN
China
Prior art keywords
user
predicted
cluster
period
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710459126.9A
Other languages
English (en)
Inventor
殷良鹰
张振虎
蒋凡
闾小琛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaodu Information Technology Co Ltd
Original Assignee
Beijing Xiaodu Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaodu Information Technology Co Ltd filed Critical Beijing Xiaodu Information Technology Co Ltd
Priority to CN201710459126.9A priority Critical patent/CN107437199A/zh
Publication of CN107437199A publication Critical patent/CN107437199A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供的平台收益预测方法及装置。平台收益预测方法包括:根据待预测用户的属性信息,获取与待预测用户关联的用户集群;统计待预测用户在当前时段以及N个历史时段内的消费特征,N是正整数;根据用户集群中各用户的消费特征,统计用户集群在当前时段以及N个历史时段内的消费特征;结合待预测用户和用户集群在当前时段以及N个历史时段内的消费特征,预测待预测用户在将来时段产生的平台收益。采用本申请实施例可以提高预测结果的准确性,进而提高预测出的平台收益对互联网应用的运营策略的指导价值。

Description

平台收益预测方法及装置
技术领域
本申请涉及互联网技术领域,尤其涉及一种平台收益预测方法及装置。
背景技术
随着互联网技术的快速发展,基于互联网的应用越来越多,例如外卖类应用、购物类应用。基于这些应用,用户足不出户即可获取自己所需的物品。
这些互联网应用是用户与商户之间的链接纽带。商户通过互联网应用向用户提供服务和/或商品,用户通过互联网应用享受商户提供的服务和/或商品。其中,用户在享受商户提供的服务和/或商品的过程中会给互联网应用带来收益,称为平台收益。
平台收益对互联网应用的运营策略有着较为重要的指导意义,因此,很有必要预先获知互联网应用的平台收益,以便指导互联网应用在未来时段的运营策略。有在现有技术中,一般是利用用户之前一个月或多个月给互联网应用带来的平台收益,预测用户在未来时段会给互联网应用带来的平台收益。这种方法的预测结果往往与实际结果偏差较大,对互联网应用的运营指导意义不大。
发明内容
针对现有技术存在的问题,本申请发明人研究了现有平台收益预测方式效果不理想的原因,并针对研究出的原因提供一种解决方案,其主要原理是:同时结合待预测用户在当前时段以及历史时段内的消费特征以及与待预测用户关联的用户集群在当前时段以及历史时段内的消费特征,预测待预测用户在将来时段产生的平台收益,这可以解决单个用户数据稀疏以及单个用户的随机性行为问题,可以为平台收益预测提供更为丰富的信息,有利于提高预测结果的准确性。
基于上述,本申请实施例提供一种平台收益预测方法,包括:
根据待预测用户的属性信息,获取与所述待预测用户关联的用户集群;
统计所述待预测用户在当前时段以及N个历史时段内的消费特征,N是正整数;
根据所述用户集群中各用户的消费特征,统计所述用户集群在当前时段以及N个历史时段内的消费特征;
结合所述待预测用户和所述用户集群在当前时段以及N个历史时段内的消费特征,预测所述待预测用户在将来时段产生的平台收益。
在一可选实施方式中,根据待预测用户的属性信息,获取与所述待预测用户关联的用户集群,包括:
从所述待预测用户的属性信息中,选择行为属性和/或画像属性作为聚类属性;
由所述聚类属性与所述待预测用户相同的用户,形成所述用户集群。
在一可选实施方式中,从所述待预测用户的属性信息中,选择行为属性作为所述聚类属性,包括:
从所述待预测用户的属性信息中,选择下单行为对应的商圈属性作为所述聚类属性;和/或
从所述待预测用户的属性信息中,选择评论行为对应的商户属性作为所述聚类属性;和/或
从所述待预测用户的属性信息中,选择评论行为对应的商品属性作为所述聚类属性。
在一可选实施方式中,从所述待预测用户的属性信息中,选择画像属性作为所述聚类属性,包括:
从所述待预测用户的属性信息中,选择用户年龄属性作为所述聚类属性;和/或
从所述待预测用户的属性信息中,选择平台年龄属性作为所述聚类属性;和/或
从所述待预测用户的属性信息中,选择生命周期属性作为所述聚类属性。
在一可选实施方式中,结合所述待预测用户和所述用户集群在当前时段以及N个历史时段内的消费特征,预测所述待预测用户在将来时段产生的平台收益,包括:
将所述待预测用户和所述用户集群在当前时段以及N个历史时段内的消费特征作为入口参数,运行所述待预测用户对应的预测模型,以获得所述待预测用户在将来时段产生的平台收益;
其中,N的取值由所述预测模型的阶数确定,所述预测模型反应消费特征与平台收益之间的预测关系。
在一可选实施方式中,运行所述待预测用户对应的预测模型之前,所述方法还包括:
根据所述预测模型的阶数,确定训练所述预测模型所需的历史时段的个数M,M是正整数;
统计所述待预测用户在M个历史时段内的消费特征;
根据所述用户集群中各用户的消费特征,统计所述用户集群在M个历史时段内的消费特征;
以所述待预测用户在目标历史时段产生的平台收益作为训练目标,对所述待预测用户在M个历史时段内的消费特征与所述用户集群在M个历史时段内的消费特征进行模型训练,以获得所述预测模型,所述目标历史时段与所述M个历史时段相对应;
其中,所述M个历史时段与所述N个历史时段完全不同,或部分相同。
在一可选实施方式中,根据所述预测模型的阶数,确定训练所述预测模型所需的历史时段的个数M之前,所述方法还包括:
根据所述待预测用户在多个历史时段内的消费特征,确定所述待预测用户的消费行为变化频度;
根据所述待预测用户的消费行为变化频度,确定所述预测模型的阶数。
在一可选实施方式中,结合所述待预测用户和所述用户集群在当前时段以及N个历史时段内的消费特征,预测所述待预测用户在将来时段产生的平台收益,包括:
结合所述待预测用户和所述用户集群在当前时段以及N个历史时段内的消费特征以及所述待预测用户的画像属性,预测所述待预测用户在将来时段产生的平台收益。
本申请实施例还提供一种平台收益预测装置,包括:
获取模块,用于根据待预测用户的属性信息,获取与所述待预测用户关联的用户集群;
第一统计模块,用于统计所述待预测用户在当前时段以及N个历史时段内的消费特征,N是正整数;
第二统计模块,用于根据所述用户集群中各用户的消费特征,统计所述用户集群在当前时段以及N个历史时段内的消费特征;
预测模块,用于结合所述待预测用户和所述用户集群在当前时段以及N 个历史时段内的消费特征,预测所述待预测用户在将来时段产生的平台收益。
在一可选实施方式中,所述获取模块具体用于:
从所述待预测用户的属性信息中,选择行为属性和/或画像属性作为聚类属性;
由所述聚类属性与所述待预测用户相同的用户,形成所述用户集群。
在一可选实施方式中,所述获取模块在选择行为属性作为所述聚类属性时,具体用于:
从所述待预测用户的属性信息中,选择下单行为对应的商圈属性作为所述聚类属性;和/或
从所述待预测用户的属性信息中,选择评论行为对应的商户属性作为所述聚类属性;和/或
从所述待预测用户的属性信息中,选择评论行为对应的商品属性作为所述聚类属性。
在一可选实施方式中,所述获取模块在选择画像属性作为所述聚类属性时,具体用于:
从所述待预测用户的属性信息中,选择用户年龄属性作为所述聚类属性;和/或
从所述待预测用户的属性信息中,选择平台年龄属性作为所述聚类属性;和/或
从所述待预测用户的属性信息中,选择生命周期属性作为所述聚类属性。
在一可选实施方式中,所述预测模块具体用于:
将所述待预测用户和所述用户集群在当前时段以及N个历史时段内的消费特征作为入口参数,运行所述待预测用户对应的预测模型,以获得所述待预测用户在将来时段产生的平台收益;
其中,N的取值由所述预测模型的阶数确定,所述预测模型反应消费特征与平台收益之间的预测关系。
在一可选实施方式中,所述装置还包括:确定模块和训练模块;
所述确定模块,用于根据所述预测模型的阶数,确定训练所述预测模型所需的历史时段的个数M,M是正整数;
所述第一统计模块还用于:统计所述待预测用户在M个历史时段内的消费特征;
所述第二统计模块还用于:根据所述用户集群中各用户的消费特征,统计所述用户集群在M个历史时段内的消费特征;
所述训练模块,用于以所述待预测用户在目标历史时段产生的平台收益作为训练目标,对所述待预测用户在M个历史时段内的消费特征与所述用户集群在M个历史时段内的消费特征进行模型训练,以获得所述预测模型,所述目标历史时段与所述M个历史时段相对应;
其中,所述M个历史时段与所述N个历史时段完全不同,或部分相同。
在一可选实施方式中,所述确定模块还用于:根据所述待预测用户在多个历史时段内的消费特征,确定所述待预测用户的消费行为变化频度;根据所述待预测用户的消费行为变化频度,确定所述预测模型的阶数。
在一可选实施方式中,所述预测模块具体用于:结合所述待预测用户和所述用户集群在当前时段以及N个历史时段内的消费特征以及所述待预测用户的画像属性,预测所述待预测用户在将来时段产生的平台收益。
本申请实施例还提供一种电子设备,包括存储器和处理器;所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时能够实现上述方法实施例提供的方法中的步骤。
本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,所述计算机程序被计算机执行时实现上述方法实施例提供的方法中的步骤。
在本申请实施例中,同时结合待预测用户在当前时段以及历史时段内的消费特征以及与待预测用户关联的用户集群在当前时段以及历史时段内的消费特征,预测待预测用户在将来时段产生的平台收益,解决了单个用户的数据稀疏以及单个用户的消费行为存在随机性等的问题,可基于更为丰富的信息预测待预测用户在将来时段产生的平台收益,提高了预测结果的准确性,进而提高了预测出的平台收益对互联网应用的运营策略的指导价值。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请一实施例提供的平台收益预测方法的流程示意图;
图2为本申请另一实施例提供的平台收益预测方法的流程示意图;
图3a为本申请又一实施例提供的训练预测模型的方法的流程示意图;
图3b为本申请又一实施例提供的训练预测模型的方法的流程示意图;
图3c为本申请又一实施例提供的结合时间序列图对模型训练阶段和预测阶段进行举例说明的示意图;
图4为本申请又一实施例提供的平台收益预测方法的流程示意图;
图5为本申请又一实施例提供的基于预测结果对用户分类的示意图;
图6为本申请又一实施例提供的平台收益预测装置的结构示意图;
图7为本申请又一实施例提供的平台收益预测装置的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
互联网应用是用户与商户之间的链接纽带。商户通过互联网应用向用户提供服务和/或商品,用户通过互联网应用享受商户提供的服务和/或商品。在互联网应用的运营过程中,凡是通过互联网应用下单购买商户提供的服务和/或商品的用户都可以为互联网应用带来平台收益。一般来说,不同用户为互联网应用带来的平台收益会有所不同。
在本申请以下实施例中,将平台收益可以定义为用户在一定时间段内为互联网应用带来的净利润。根据应用场景的不同,所述一定时间段也会有所不同。
例如,所述一定时间段可以是一个月,相应地,平台收益可以表示为用户在一个月内为互联网应用带来的净利润;或者,平台收益也可以表示为用户在一个月内为互联网应用带来的净利润与相应月内订单量的比值,称为月单均利润。
又例如,所述一定时间段可以是一周,相应地,平台收益可以表示为用户在一周内为互联网应用带来的净利润;或者,平台收益也可以表示为用户在一周内为互联网应用带来的净利润与相应周内订单量的比值,称为周单均利润。
又例如,所述一定时间段可以是一个季度,相应地,平台收益可以表示为用户在一个季度内为互联网应用带来的净利润;或者,平台收益也可以表示为用户在一个季度内为互联网应用带来的净利润与相应季度内订单量的比值,称为季度单均利润。
根据应用场景以及互联网应用的不同,上述用户为互联网带来的净利润的定义也会有所不同。
在一些应用场景中,互联网应用会为商户提供配送服务,当用户通过互联网应用下单购买商户提供的服务和/或商品时,商户可以选择使用互联网应用提供的配送服务为用户配送订单。在该应用场景中,用户为互联网带来的净利润可表示为:用户通过互联网应用下单购买商户提供服务和/或商品时商户所需付出的使用费(简称为佣金)+商户在使用互联网应用提供的配送服务时所需付出的配送费-互联网应用为商户配送订单消耗的配送成本-互联网应用给商户的补贴。
在另一些应用场景中,在用户通过互联网应用下单购买商户提供的服务和/ 或商品候,商户可以自行为用户配送订单。在该应用场景中,用户为互联网带来的净利润可表示为:用户通过互联网应用下单购买商户提供服务和/或商品时商户所需付出的使用费(简称为佣金)-互联网应用给商户的补贴。
基于上述对平台收益的定义,考虑到预先获知用户可能在将来时段为互联网应用带来的平台收益对互联网应用的运营策略有着重要的指导意义,于是本申请以下实施例提供一种预测平台收益的方案。
图1为本申请一实施例提供的平台收益预测方法的流程示意图。如图1所示,所述方法包括:
101、根据待预测用户的属性信息,获取与待预测用户关联的用户集群。
102、统计待预测用户在当前时段以及N个历史时段内的消费特征,N是正整数。
103、根据用户集群中各用户的消费特征,统计用户集群在当前时段以及N 个历史时段内的消费特征。
104、结合待预测用户和所述用户集群在当前时段以及N个历史时段内的消费特征,预测待预测用户在将来时段产生的平台收益。
本申请实施提供的方法主要用于为互联网应用预测平台收益,本申请并不限定互联网应用的具体实现,凡是可以将用户与商户联系起来的互联网应用均适用于本申请实施例。例如,互联网应用可以是外卖类应用或购物类应用等。
在本实施例中,将需要预测可能在将来时段为互联网应用带来的平台收益的用户称为待预测用户。待预测用户可以是通过所述互联网应用下单购买商户提供的服务和/或商品的用户中的任意用户。
在现有技术中,一般是根据待预测用户的历史消费特征,预测待预测用户在将来时段产生的平台收益。例如,可以根据待预测用户在上一个月的历史消费特征,预测待预测用户在当月可能产生的平台收益。又例如,可以根据待预测用户在上两个月的历史消费特征,预测待预测用户在当月可能产生的平台收益。在现有技术方案中,仅考虑了待预测用户自身的历史消费特征,由于待预测用户自身行为量有限,随机性较高,很容易出现数据稀疏、信息量较少等问题,这会导致基于待预测用户自身的历史消费特征的预测结果不准确,降低预测结果对互联网应用的指导价值。
在本实施例中,根据待预测用户的属性信息,确定与待预测用户关联的用户集群。与待预测用户关联的用户集群包括至少一个与待预测用户具有一定关系的用户。例如,可以是与待预测用户具有某个或某些相同属性的用户。进而,根据用户集群中各用户的消费特征,统计用户集群在当前时段以及N个历史时段内的消费特征。例如,可以对用户集群中各用户在当前时段的消费特征进行加权求和,获得用户集群在当前时段内的消费特征;相应的,对用户集群中各用户在某个历史时段的消费特征进行加权求和,获得用户集群在相应历史时段内的消费特征。
另外,统计待预测用户在当前时段以及N个历史时段内的消费特征。进而,结合待预测用户在当前时段以及N个历史时段内的消费特征以及与待预测用户关联的用户集群在当前时段以及N个历史时段内的消费特征,预测待预测用户在将来时段为互联网应用产生的平台收益。
值得说明的是,本实施例不限定统计待预测用户在当前时段以及N个历史时段内的消费特征的操作与统计用户集群在当前时段以及N个历史时段内的消费特征的操作之间的执行顺序,可以先执行一个统计操作再执行另一个统计操作,也可以并行执行两个统计操作。
上述历史时段是指当前时段之前的时间段;相应的,将来时段是指当前时段之后的时间段。例如,以一月为一个时段,假设当前时段为5月份,则历史时段可以是2月份、3月份、4月份等,相应的,将来时段可以是6月份。
值得说明的是,上述当前时段、历史时段以及将来时段的时间长度可以相同,也可以不相同。优选地,上述当前时段、历史时段以及将来时段的时间长度相同。例如,上述当前时段、历史时段以及将来时段都是一周、一个季度、一个月、一天等。另外,优选地,将来时段可以是当前时段的下一个时段,相应的,N个历史时段可以依次是当前时段的上一个历史时段、上两个历史时段、…上N个历史时段。
上述消费特征主要是指待预测用户的消费信息中与计算平台收益相关的一些消费信息,例如订单量、每单的利润、每单的客单价、每单的优惠额度以及每单用户评分的分布情况等。
以一个月为一个时段,假设当前时段为5月份,则可以结合待预测用户在3 月份、4月份以及5月份的消费特征以及与待预测用户关联的用户集群在3月份、 4月份以及5月份的消费特征,预测待预测用户在6月份的平台收益。
在本实施例中,除了利用待预测用户在当前时段以及历史时段内的消费特征之外,同时利用与待预测用户关联的用户集群在当前时段以及历史时段的消费特征,预测待预测用户在将来时段产生的平台收益,可以克服待预测用户自身数据稀疏以及消费行为存在的随机性等问题,可基于更为丰富的信息预测平台收益,提高了预测结果的准确性,进而提高了预测出的平台收益对互联网应用的运营策略的指导价值。
在上述实施例或下述实施例中,需要根据待预测用户的属性信息,确定与待预测用户关联的用户集群。可选地,考虑到待预测用户的属性信息比较多,则可以从待预测用户的属性信息中,选择聚类属性;由聚类属性与待预测用户相同的用户,形成用户集群。这样可以提高确定用户集群的效率,提高用户集群的精度。
上述待预测用户的属性信息主要包括可以从某个角度或维度反应待预测用户的信息,例如,可以包括待预测用户的行为属性和/或画像属性等。行为属性主要是指可以反映待预测用户的网络行为的属性信息,所述网络行为可以包括但不限于:下单行为、评论行为、浏览行为、加购物车行为等。画像属性主要是指可以反映待预测用户的消费习惯的一些用户维度的信息,例如可以包括但不限于:用户年龄、用户的平台年龄、用户生命周期、用户对于优惠的敏感度等等。
基于上述,可以从待预测用户的属性信息中,选择行为属性作为聚类属性;和/或,从待预测用户的属性信息中,选择画像属性作为聚类属性。
更进一步,在选择行为属性作为聚类属性时,可以从待预测用户的属性信息中,选择下单行为对应的商圈属性作为聚类属性,和/或,从待预测用户的属性信息中,选择评论行为对应的商户属性作为聚类属性,和/或,从待预测用户的属性信息中,选择评论行为对应的商品属性作为聚类属性。
上述下单行为对应的商圈属性主要是指待预测用户的订单所属的商圈。若选择下单行为对应的商圈属性作为聚类属性,则可以选择与待预测用户在同一商圈范围内下单的用户,形成用户集群。
上述评论行为对应的商户属性主要是指待预测用户评论的商户。若选择评论行为对应的商户属性作为聚类属性,则可以选择与待预测用户评论过相同商户的用户,形成用户集群。
上述评论行为对应的商品属性主要是指待预测用户评论的商品。若选择评论行为对应的商品属性作为聚类属性,则可以选择与待预测用户评论过相同商品的用户,形成用户集群。
若同时选择下单行为对应的商圈属性以及评论行为对应的商户属性作为聚类属性,则可以选择与待预测用户在同一商圈范围内下单、并且评论过相同商户的用户,形成用户集群。
若同时选择下单行为对应的商圈属性以及评论行为对应的商品属性作为聚类属性,则可以选择与待预测用户在同一商圈范围内下单、并且评论过相同商品的用户,形成用户集群。
由上述可见,基于待预测用户的行为属性,可以确定与待预测用户具有相同或相似网络行为的用户形成用户集群,用户集群的消费特征一定程度上也会类似待预测用户的消费特征。因此,用户集群的消费特征可以作为待预测用户自身消费特征的替代品,结合待预测用户自身的消费特征预测待预测用户在将来时段产生的平台收益,进而在待预测用户个人的消费特征稀疏或随机性较大的情况下,可由用户集群的消费特征作为替代品,弥补待预测用户个人的消费特征稀疏或随机性较大引起的数据不足,保证预测结果的准确性。
更进一步,在选择画像属性作为聚类属性时,可以从待预测用户的属性信息中,选择用户年龄属性作为聚类属性,和/或,从待预测用户的属性信息中,选择平台年龄属性作为聚类属性,和/或,从待预测用户的属性信息中,选择生命周期属性作为聚类属性。
上述用户年龄属性主要是指待预测用户的年龄,一般由待预测用户进行注册时填写。若选择用户年龄属性作为聚类属性,则可以选择与待预测用户具有相同年龄或属于同一年龄段的用户,形成用户集群。相同年龄或同一年龄段的用户在消费习惯上具有一定共性。
上述平台年龄属性主要是指待预测用户使用互联网应用的时间长度。若选择平台年龄属性作为聚类属性,则可以选择与待预测用户具有相同平台年龄的用户,形成用户集群。同理,平台年龄相同的用户在消费习惯上也具有一定共性。
上述生命周期属性主要是指待预测用户使用互联网应用的趋势。若选择生命周期属性作为聚类属性,则可以选择与待预测用户处于相同生命周期的用户,形成用户集群。同理,处于相同生命周期的用户在消费习惯上也具有一定共性。
由上述可见,基于待预测用户的画像属性,可以确定与待预测用户具有相同或相似画像属性的用户形成用户集群,用户集群的消费特征一定程度上也会类似待预测用户的消费特征。因此用户集群的消费特征可以作为待预测用户自身消费特征的替代品,结合待预测用户自身的消费特征预测待预测用户在将来时段产生的平台收益,进而在待预测用户个人的消费特征稀疏或随机性较大的情况,可由用户集群的历史消费特征作为替代品,弥补待预测用户个人的消费特征稀疏或随机性较大引起的数据不足,保证预测结果的准确性。
图2为本申请另一实施例提供的平台收益预测方法的流程示意图。如图2 所示,所述方法包括:
201、预先训练待预测用户对应的预测模型,所述预测模型反映消费特征与平台收益之间的预测关系。
202、根据待预测用户的属性信息,获取与待预测用户关联的用户集群。
203、统计待预测用户在当前时段以及N个历史时段内的消费特征,N是正整数。
204、根据用户集群中各用户的消费特征,统计用户集群在当前时段以及N 个历史时段内的消费特征,N的取值由所述预测模型的阶数确定。
205、将待预测用户和用户集群在当前时段以及N个历史时段内的消费特征作为入口参数,运行所述预测模型,以获得待预测用户在将来时段产生的平台收益。
在本实施例中,预先训练得到待预测用户对应的预测模型,然后待预测用户和用户集群在当前时段以及N个历史时段内的消费特征作为入口参数,运行预测模型,从而获得待预测用户在将来时段产生的平台收益。基于预测模型的预测过程效率较高、预测结果更为精确。
可选地,一种训练上述基于时间序列的预测模型的方式,如图3a所示包括:
2011、根据预测模型的阶数,确定训练预测模型所需的历史时段的个数M, M是正整数。
2012、统计待预测用户在M个历史时段内的消费特征。
2013、根据与待预测用户关联的用户集群中各用户的消费特征,统计用户集群在M个历史时段内的消费特征。
2014、以待预测用户在目标历史时段产生的平台收益作为训练目标,对待预测用户在M个历史时段内的消费特征与用户集群在M个历史时段内的消费特征进行模型训练,以获得预测模型,所述目标历史时段与M个历史时段相对应。
目标历史时段与M个历史时段相对应可以理解为:目标历史时段与M个历史时段之间存在预测关系,即通过待预测用户以及用户集群在M个历史时段内的消费特征可以预测出待预测用户在目标历史时段的平台收益。
进一步,如图3b所示,另一种训练上述基于时间序列的预测模型的方式,在步骤2014之后,还包括:
2015、根据预测模型的阶数,确定验证预测模型所需的历史时段的个数P, P是正整数。
2016、统计待预测用户在P个历史时段内的消费特征。
2017、根据与待预测用户关联的用户集群中各用户的消费特征,统计用户集群在P个历史时段内的消费特征。
2018、将待预测用户和用户集群在P个历史时段内的消费特征作为入口参数,运行所述预测模型,以获得待预测用户在待验证历史时段的平台收益,待验证历史时段与P个历史时段相对应。
2019、根据预测出的待预测用户在待验证历史时段产生的平台收益与待预测用户在待验证历史时段实际的平台收益,验证所述预测模型的正确性。
待验证历史时段与P个历史时段相对应可以理解为:待验证历史时段与P 个历史时段之间存在预测关系,即通过待预测用户以及用户集群在P个历史时段内的消费特征可以预测出待预测用户在待验证历史时段的平台收益。
值得说明的是,在真实预测阶段使用的N个历史时段与模型训练阶段使用的M个历史时段完全不同,或者部分相同。相应地,在模型训练阶段使用的M 个历史时段与模型验证阶段使用的P个历史时段完全不同,或者部分相同。N=预测模型的阶数-1;M=预测模型的阶数;P=预测模型的阶数。
以一天为一个时段,假设当前时段是5月20日,则在模型训练阶段可以以 5月17日作为目标历史时段,以待预测用户在5月17日的平台收益为训练目标,使用5月15日、5月16日的消费特征进行模型训练,从而得到预测模型;在模型验证阶段可以以5月19日作为待验证历史时段,以待预测用户在5月19日的平台收益为验证目标,使用5月17日、5月18日的消费特征做验证;在实际预测阶段可以使用5月19日、5月20日预测待预测用户在5月21日产生的平台收益,5月21日是未来时段。
其中,预测模型的阶数表示在预测将来时段产生的平台收益时所需的时段个数。例如,预测模型的阶数为2,这意味着需要根据待预测用户以及用户集群在2个时段内的消费特征,即当前时段以及1个历史周期内的消费特征,预测待预测用户在将来时段产生的平台收益。又例如,预测模型的阶数为3,这意味着需要根据待预测用户以及用户集群在3时段内的消费特征,即当前时段以及2 个历史时段内的消费特征,预测待预测用户在将来时段产生的平台收益。
例如,以周期长度为一个月,预测模型的阶数为2,则结合图3c所示的时间序列图,可以以待预测用户在3月的平台收益为训练目标,使用待预测用户以及用户集群在1月、2月内的消费特征作为训练样本集进行模型训练,以获得预测模型;进而以待预测用户在4月的平台收益为验证目标,使用待预测用户以及用户集群在2月、3月内的消费特征作为验证样本集,验证预测模型的正确性。
上述验证过程为:将待预测用户以及用户集群在2月、3月的消费特征作为入参,运行预测模型,以获得待预测用户在4月产生的平台收益,同时,根据待预测用户在4月的消费特征计算待预测用户在4月实际的平台收益,将预测模型预测出的平台收益与实际的平台收益进行比较;若两者的误差在允许误差范围内,确定预测模型正确;反之,确定预测模型错误。
进一步,还可以一待预测用户在2月的平台收益为训练目标,使用待预测用户以及用户集群在12月、1月内的消费特征作为训练样本集进行模型训练,以获得预测模型;进而以待预测用户在3月的平台收益为验证目标,使用待预测用户以及用户集群在1月、2月内的消费特征作为验证样本集,验证预测模型的正确性。
当预测模型通过正确性验证后,可以基于预测模型预测待预测用户在将来时段产生的平台收益。例如,假设预测模型的阶数为2,结合图3c所示时间序列图,当前时段为4月,将来时段为5月,即需要预测待预测用户在5月产生的平台收益。则可以获取待预测用户以及用户集群在2月、4月内的消费特征,将待预测用户以及用户集群在2月、4月内的消费特征作为入参,运行预测模型,获得待预测用户在5月产生的平台收益。又例如,可以获取待预测用户以及用户集群在3月、4月内的消费特征,将待预测用户以及用户集群在3月、4月内的消费特征作为入参,运行预测模型,获得待预测用户在5月产生的平台收益。
可选地,在根据待预测用户在M个历史时段的消费特征以及用户集群在M 个历史时段的消费特征训练预测模型之前,可以根据经验值,或者,根据待预测用户的消费行为变化频度,确定预测模型的阶数。一般来说,待预测用户的消费行为变化频度越大,可以设置预测模型的阶数为较小的值;反之,待预测用户的消费行为变化频度越小,可以设置预测模型的阶数为较大的值。
进一步,在训练预测模型之前,可以根据待预测用户在多个历史时段内的消费特征,确定待预测用户的消费行为变化频度;进而根据待预测用户的消费行为变化频度,确定预测模型的阶数。
例如,可以根据待预测用户在模型训练阶段所需的每个历史时段内的消费特征,计算待预测用户在每个历史时段内产生的平台收益;进而计算相邻历史时段内产生的平台收益之间的差异,若差异较大,表明待预测用户的消费行为变化频度较大;反之,表明待预测用户的消费行为变化频度较小。在具体实现上,可以设置差异值或差异范围与消费行为变化频度之间的对应关系,基于该对应关系,确定待预测用户的消费行为变化频度。
在上述实施例中,同时结合待预测用户以及与待预测用户关联的用户集群在当前时段以及N个历史时段内的消费特征,预测待预测用户在将来时段产生的平台收益。除此之外,在预测待预测用户在将来时段产生的平台收益时,还可以进一步结合待预测用户的画像属性。用户的画像属性包括但不限于:用户年龄、用户的平台年龄、用户生命周期、用户对于优惠的敏感度等等。这些画像属性一定程度上可以反映用户的消费习惯。
基于上述,本申请又一实施例提供的平台收益预测方法,如图4所示,包括以下步骤:
401、根据待预测用户的属性信息,获取与待预测用户关联的用户集群。
402、统计待预测用户在当前时段以及N个历史时段内的消费特征,N是正整数。
403、根据用户集群中各用户的消费特征,统计用户集群在当前时段以及N 个历史时段内的消费特征。
404、获取待预测用户的画像属性。
405、结合待预测用户和用户集群在当前时段以及N个历史时段内的消费特征以及待预测用户的画像属性,预测待预测用户在将来时段产生的平台收益。
值得说明的是,本实施例不限定步骤402、步骤403和步骤404的执行顺序,可以如图4所示,依次执行各步骤,也可以并行执行各步骤。
在步骤405中,可选地,可以将待预测用户和用户集群在当前时段以及N 个历史时段内的消费特征以及待预测用户的画像属性作为入口参数,运行预先训练得到的预测模型,以获得待预测用户在将来时段产生的平台收益。基于预测模型的预测过程效率较高、预测结果更为精确。
本实施例中的预测模型与前述实施例的预测模型不同,这里的预测模型是指同时考虑待预测用户的消费特征、与待预测用户关联的用户集群的消费特征以及待预测用户的画像属性的预测模型。
在一可选实施方式中,上述同时考虑待预测用户的消费特征、与待预测用户关联的用户集群的消费特征以及待预测用户的画像属性的预测模型可以是基于时间序列的周期预测模型。例如,基于该周期预测模型,可以根据待预测用户和用户集群在当前时段以及N个历史时段内的消费特征以及待预测用户的画像属性,预测待预测用户在当前周期内产生的平台收益。
进一步,上述同时考虑待预测用户的消费特征、与待预测用户关联的用户集群的消费特征以及待预测用户的画像属性的预测模型也具有阶数。这里预测模型的阶数表示在预测将来时段产生的平台收益时所需的时段个数。例如,预测模型的阶数为2,这意味着需要根据待预测用户和用户集群在2时段(即当前时段和1个历史时段)内的消费特征以及待预测用户的画像属性,预测待预测用户在将来时段产生的平台收益。又例如,预测模型的阶数为3,这意味着需要根据待预测用户和用户集群在3时段(即当前时段和2个历史时段)内的消费特征以及待预测用户的画像属性,预测待预测用户在将来时段产生的平台收益。
可选地,一种训练上述基于时间序列的周期预测模型的方式,包括:根据预测模型的阶数,确定训练预测模型所需的历史时段的个数M,M是正整数;统计待预测用户在M个历史时段内的消费特征;根据用户集群中各用户的消费特征,统计用户集群在M个历史时段内的消费特征;获取待预测用户的画像属性;以待预测用户在目标历史时段产生的平台收益为训练目标,对待预测用户在M个历史时段内的消费特征、用户集群在M个历史时段内的消费特征以及待预测用户的画像属性进行模型训练,以获得所述预测模型,目标历史时段与M个历史时段对应。
进一步,在训练出预测模型之后,还可以对该预测模型进行验证。例如,可以根据预测模型的阶数,确定验证预测模型所需的历史时段的个数P,P是正整数;统计待预测用户在P个历史时段内的消费特征;根据与待预测用户关联的用户集群中各用户的消费特征,统计用户集群在P个历史时段内的消费特征;获取待预测用户的画像属性;将待预测用户和用户集群在P个历史时段内的消费特征以及待预测用户的画像属性作为入口参数,运行所述预测模型,以获得待预测用户在待验证历史时段的平台收益,待验证历史时段与P个历史时段对应;根据预测出的待预测用户在待验证历史时段产生的平台收益与待预测用户在待验证历史时段实际的平台收益,验证所述预测模型的正确性。例如,将预测出的待预测用户在待验证历史时段产生的平台收益与待预测用户在待验证历史时段实际的平台收益进行比较;若两者的误差在允许误差范围内,确定预测模型正确;反之,确定预测模型错误。
例如,以周期长度为一个月,预测模型的阶数为2,则结合图3c所示的时间序列图,可以以待预测用户在3月的平台收益为训练目标,使用待预测用户以及用户集群在1月、2月内的消费特征;将待预测用户的画像属性、预测用户以及用户集群在1月、2月内的消费特征作为训练样本集进行模型训练,以获得预测模型;进而以待预测用户在4月的平台收益为验证目标,使用待预测用户以及用户集群在2月、3月内的消费特征;将待预测用户的画像属性、待预测用户以及用户集群在2月、3月内的消费特征作为验证样本集验证预测模型的正确性。
上述验证过程为:将待预测用户的画像属性、待预测用户以及用户集群在2 月、3月的消费特征作为入参,运行预测模型,以获得待预测用户在4月产生的平台收益,同时,根据待预测用户在4月的消费特征计算待预测用户在4月实际产生的平台收益,将预测模型预测出的平台收益与实际的平台收益进行比较;若两者的误差在允许误差范围内,确定预测模型正确;反之,确定预测模型错误。
进一步,还可以以待预测用户在2月的平台收益为训练目标,使用待预测用户以及用户集群在度12月、1月内的消费特征;将待预测用户的画像属性、预测用户以及用户集群在12月、1月内的消费特征作为训练样本集进行模型训练,以获得预测模型;进而以待预测用户在3月的平台收益为验证目标,使用待预测用户以及用户集群在1月、2月内的消费特征;将待预测用户的画像属性、待预测用户以及用户集群在1月、2月内的消费特征作为验证样本集验证预测模型的正确性。
当预测模型通过正确性验证后,可以基于预测模型预测待预测用户在将来时段产生的平台收益。例如,假设预测模型的阶数为2,结合图3c所示时间序列图,当前时段为4月,将来时段为5月,即需要预测待预测用户在5月产生的平台收益。则可以获取待预测用户的画像属性、待预测用户以及用户集群在2 月、4月内的消费特征;将待预测用户的画像属性、待预测用户以及用户集群在 2月、4月内的消费特征作为入参,运行预测模型,获得待预测用户在5月产生的平台收益。又例如,可以获取待预测用户的画像属性、待预测用户以及用户集群在3月、4月内的消费特征;将待预测用户的画像属性、待预测用户以及用户集群在3月、4月内的消费特征作为入参,运行预测模型,获得待预测用户在 5月产生的平台收益。
可选地,在根据待预测用户的画像属性、待预测用户的用于训练的历史消费特征以及用户集群的用户训练的历史消费特征训练预测模型之前,也可以根据经验值,或者,根据待预测用户的消费行为变化频度,确定预测模型的阶数。值得说明的是,这里确定预测模型的阶数的实施方式与前述实施例中确定预测模型的阶数的实施方式的相同,具体可参见前述实施例中的描述,在此不再赘述。
对互联网应用来说,可以采用本申请上述实施例提供的方法预测出任何一个使用互联网的用户在将来时段可能为互联网应用产生的平台收益。在上述实施例的预测结果具有较高准确性的基础上,考虑到用户在将来时段可能为互联网应用产生的平台收益决定了用户对互联网应用的价值和重要性,因此可基于预测结果,结合用户的生命周期,进一步将用户分类,以便于对不同类别的用户,制订不同运营策略,进而提高互联网应用的盈利能力。如图5所示,结合预测结果和用户的生命周期,可以将用户划分为以下几类:
进入期的高潜力用户、进入期的潜力用户、进入期的低潜力用户;
成长期的高潜力用户、成长期的潜力用户、成长期的低潜力用户;
稳定期的稳定盈利用户、稳定期的低盈利用户;
衰退期的高优用户、衰退期的召回用户、衰退期的低盈利用户;
流失期的高优用户、流失期的召回用户、流失期的流失用户。
关于进入期和成长期的潜力用户、高潜力用户属于重点培养用户,可给予不同额度满赠、满减活动吸引用户。关于稳定期的稳定盈利用户需要维持,给予适度的定时推送通知,以保持该部分用户的稳定性。关于衰退期和流失期的高优用户、召回用户是重点召回的对象,可结合用户在将来时段可能为互联网应用产生的平台收益,给予不同额度满减券对用户进行召回。关于衰退期的低盈利用户以及流失期的流失用户,平台价值较低,则需要节约成本,则可推送通知,进行低成本唤醒。
需要说明的是,上述实施例所提供方法的各步骤的执行主体均可以是同一设备,或者,该方法也由不同设备作为执行主体。比如,步骤101至步骤102 的执行主体可以为设备A;又比如,步骤101的执行主体可以为设备A,步骤 102的执行主体可以为设备B;等等。
图6为本申请又一实施例提供的平台收益预测装置的结构示意图。如图6 所示,装置包括:获取模块61、第一统计模块62、第二统计模块63和预测模块64。
获取模块61,用于根据待预测用户的属性信息,获取与待预测用户关联的用户集群。
第一统计模块62,用于统计待预测用户在当前时段以及N个历史时段内的消费特征,N是正整数。
第二统计模块63,用于根据用户集群中各用户的消费特征,统计用户集群在当前时段以及N个历史时段内的消费特征。
预测模块64,用于结合待预测用户和用户集群在当前时段以及N个历史时段内的消费特征,预测待预测用户在将来时段产生的平台收益。
在一可选实施方式中,获取模块61具体用于:从待预测用户的属性信息中,选择行为属性和/或画像属性作为聚类属性;由聚类属性与待预测用户相同的用户,形成用户集群。
在一可选实施方式中,获取模块61具体用于:从待预测用户的属性信息中,选择行为属性和/或画像属性作为聚类属性;由聚类属性与待预测用户相同的用户,形成用户集群。
在一可选实施方式中,获取模块61在选择行为属性作为聚类属性时,具体用于:
从待预测用户的属性信息中,选择下单行为对应的商圈属性作为聚类属性;和/或
从待预测用户的属性信息中,选择评论行为对应的商户属性作为聚类属性;和/或
从待预测用户的属性信息中,选择评论行为对应的商品属性作为聚类属性。
在一可选实施方式中,获取模块61在选择画像属性作为聚类属性时,具体用于:
从待预测用户的属性信息中,选择用户年龄属性作为聚类属性;和/或
从待预测用户的属性信息中,选择平台年龄属性作为聚类属性;和/或
从待预测用户的属性信息中,选择生命周期属性作为聚类属性。
在一可选实施方式中,预测模块64具体用于:将待预测用户和用户集群在当前时段以及N个历史时段内的消费特征作为入口参数,运行待预测用户对应的预测模型,以获得待预测用户在将来时段产生的平台收益;
其中,N的取值由预测模型的阶数确定,预测模型反应消费特征与平台收益之间的预测关系。
在一可选实施方式中,如图7所示,装置还包括:确定模块65和训练模块 66。
确定模块65,用于根据预测模型的阶数,确定训练预测模型所需的历史时段的个数M,M是正整数。相应地,第一统计模块62还用于:统计待预测用户在M个历史时段内的消费特征。第二统计模块63还用于:根据用户集群中各用户的消费特征,统计用户集群在M个历史时段内的消费特征。训练模块66,用于以所述待预测用户在目标历史时段产生的平台收益作为训练目标,对待预测用户在M个历史时段内的消费特征与用户集群在M个历史时段内的消费特征进行模型训练,以获得预测模型,所述目标历史时段与所述M个历史时段相对应;其中,M个历史时段与N个历史时段完全不同,或部分相同。
在一可选实施方式中,确定模块65还用于:根据待预测用户在多个历史时段内的消费特征,确定待预测用户的消费行为变化频度;根据待预测用户的消费行为变化频度,确定预测模型的阶数。
在一可选实施方式中,预测模块64具体用于:结合待预测用户和用户集群在当前时段以及N个历史时段内的消费特征以及待预测用户的画像属性,预测待预测用户在将来时段产生的平台收益。
本实施例提供的平台收益预测装置可用于执行上述方法实施例中的流程,其具体工作原理不再赘述,详见方法实施例的描述。
本实施例提供的平台收益预测装置,同时结合待预测用户在当前时段以及历史时段内的消费特征以及与待预测用户关联的用户集群在当前时段以及历史时段内的消费特征,预测待预测用户在将来时段产生的平台收益,解决了单个用户的数据稀疏以及单个用户的消费行为存在随机性等的问题,可基于更为丰富的信息预测待预测用户在将来时段产生的平台收益,提高了预测结果的准确性,进而提高了预测出的平台收益对互联网应用的运营策略的指导价值。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、 CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/ 或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器 (RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存 (PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
本申请实施例公开A1、一种平台收益预测方法,包括:
根据待预测用户的属性信息,获取与所述待预测用户关联的用户集群;
统计所述待预测用户在当前时段以及N个历史时段内的消费特征,N是正整数;
根据所述用户集群中各用户的消费特征,统计所述用户集群在当前时段以及N个历史时段内的消费特征;
结合所述待预测用户和所述用户集群在当前时段以及N个历史时段内的消费特征,预测所述待预测用户在将来时段产生的平台收益。
A2、如A1所述的方法中,根据待预测用户的属性信息,获取与所述待预测用户关联的用户集群,包括:
从所述待预测用户的属性信息中,选择行为属性和/或画像属性作为聚类属性;
由所述聚类属性与所述待预测用户相同的用户,形成所述用户集群。
A3、如A2所述的方法中,从所述待预测用户的属性信息中,选择行为属性作为所述聚类属性,包括:
从所述待预测用户的属性信息中,选择下单行为对应的商圈属性作为所述聚类属性;和/或
从所述待预测用户的属性信息中,选择评论行为对应的商户属性作为所述聚类属性;和/或
从所述待预测用户的属性信息中,选择评论行为对应的商品属性作为所述聚类属性。
A4、如A2所述的方法中,从所述待预测用户的属性信息中,选择画像属性作为所述聚类属性,包括:
从所述待预测用户的属性信息中,选择用户年龄属性作为所述聚类属性;和/或
从所述待预测用户的属性信息中,选择平台年龄属性作为所述聚类属性;和/或
从所述待预测用户的属性信息中,选择生命周期属性作为所述聚类属性。
A5、如A1所述的方法中,结合所述待预测用户和所述用户集群在当前时段以及N个历史时段内的消费特征,预测所述待预测用户在将来时段产生的平台收益,包括:
将所述待预测用户和所述用户集群在当前时段以及N个历史时段内的消费特征作为入口参数,运行所述待预测用户对应的预测模型,以获得所述待预测用户在将来时段产生的平台收益;
其中,N的取值由所述预测模型的阶数确定,所述预测模型反应消费特征与平台收益之间的预测关系。
A6、如A5所述的方法中,运行所述待预测用户对应的预测模型之前,所述方法还包括:
根据所述预测模型的阶数,确定训练所述预测模型所需的历史时段的个数M,M是正整数;
统计所述待预测用户在M个历史时段内的消费特征;
根据所述用户集群中各用户的消费特征,统计所述用户集群在M个历史时段内的消费特征;
以所述待预测用户在目标历史时段产生的平台收益作为训练目标,对所述待预测用户在M个历史时段内的消费特征与所述用户集群在M个历史时段内的消费特征进行模型训练,以获得所述预测模型,所述目标历史时段与所述M个历史时段相对应;
其中,所述M个历史时段与所述N个历史时段完全不同,或部分相同。
A7、如A6所述的方法中,根据所述预测模型的阶数,确定训练所述预测模型所需的历史时段的个数M之前,所述方法还包括:
根据所述待预测用户在多个历史时段内的消费特征,确定所述待预测用户的消费行为变化频度;
根据所述待预测用户的消费行为变化频度,确定所述预测模型的阶数。
A8、如A1-A7任一项所述的方法中,结合所述待预测用户和所述用户集群在当前时段以及N个历史时段内的消费特征,预测所述待预测用户在将来时段产生的平台收益,包括:
结合所述待预测用户和所述用户集群在当前时段以及N个历史时段内的消费特征以及所述待预测用户的画像属性,预测所述待预测用户在将来时段产生的平台收益。
本申请实施例还公开B9、一种平台收益预测装置,包括:
获取模块,用于根据待预测用户的属性信息,获取与所述待预测用户关联的用户集群;
第一统计模块,用于统计所述待预测用户在当前时段以及N个历史时段内的消费特征,N是正整数;
第二统计模块,用于根据所述用户集群中各用户的消费特征,统计所述用户集群在当前时段以及N个历史时段内的消费特征;
预测模块,用于结合所述待预测用户和所述用户集群在当前时段以及N 个历史时段内的消费特征,预测所述待预测用户在将来时段产生的平台收益。
B10、如B9所述的装置中,所述获取模块具体用于:
从所述待预测用户的属性信息中,选择行为属性和/或画像属性作为聚类属性;
由所述聚类属性与所述待预测用户相同的用户,形成所述用户集群。
B11、如B10所述的装置中,所述获取模块在选择行为属性作为所述聚类属性时,具体用于:
从所述待预测用户的属性信息中,选择下单行为对应的商圈属性作为所述聚类属性;和/或
从所述待预测用户的属性信息中,选择评论行为对应的商户属性作为所述聚类属性;和/或
从所述待预测用户的属性信息中,选择评论行为对应的商品属性作为所述聚类属性。
B12、如B10所述的装置中,所述获取模块在选择画像属性作为所述聚类属性时,具体用于:
从所述待预测用户的属性信息中,选择用户年龄属性作为所述聚类属性;和/或
从所述待预测用户的属性信息中,选择平台年龄属性作为所述聚类属性;和/或
从所述待预测用户的属性信息中,选择生命周期属性作为所述聚类属性。
B13、如B9所述的装置中,所述预测模块具体用于:
将所述待预测用户和所述用户集群在当前时段以及N个历史时段内的消费特征作为入口参数,运行所述待预测用户对应的预测模型,以获得所述待预测用户在将来时段产生的平台收益;
其中,N的取值由所述预测模型的阶数确定,所述预测模型反应消费特征与平台收益之间的预测关系。
B14、如B13所述的装置,还包括:确定模块和训练模块;
所述确定模块,用于根据所述预测模型的阶数,确定训练所述预测模型所需的历史时段的个数M,M是正整数;
所述第一统计模块还用于:统计所述待预测用户在M个历史时段内的消费特征;
所述第二统计模块还用于:根据所述用户集群中各用户的消费特征,统计所述用户集群在M个历史时段内的消费特征;
所述训练模块,用于以所述待预测用户在目标历史时段产生的平台收益作为训练目标,对所述待预测用户在M个历史时段内的消费特征与所述用户集群在M个历史时段内的消费特征进行模型训练,以获得所述预测模型,所述目标历史时段与所述M个历史时段相对应;
其中,所述M个历史时段与所述N个历史时段完全不同,或部分相同。
B15、如B14所述的装置中,所述确定模块还用于:
根据所述待预测用户在多个历史时段内的消费特征,确定所述待预测用户的消费行为变化频度;
根据所述待预测用户的消费行为变化频度,确定所述预测模型的阶数。
B16、如B9-B15任一项所述的装置中,所述预测模块具体用于:
结合所述待预测用户和所述用户集群在当前时段以及N个历史时段内的消费特征以及所述待预测用户的画像属性,预测所述待预测用户在将来时段产生的平台收益。
本申请实施例还公开C17、一种电子设备,包括存储器和处理器;所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时能够实现上述A1-A8任一项所述的方法中的步骤。
本申请实施例还公开D18、一种存储有计算机程序的计算机可读存储介质,所述计算机程序被计算机执行时实现上述A1-A8任一项所述的方法中的步骤。

Claims (10)

1.一种平台收益预测方法,其特征在于,包括:
根据待预测用户的属性信息,获取与所述待预测用户关联的用户集群;
统计所述待预测用户在当前时段以及N个历史时段内的消费特征,N是正整数;
根据所述用户集群中各用户的消费特征,统计所述用户集群在当前时段以及N个历史时段内的消费特征;
结合所述待预测用户和所述用户集群在当前时段以及N个历史时段内的消费特征,预测所述待预测用户在将来时段产生的平台收益。
2.根据权利要求1所述的方法,其特征在于,根据待预测用户的属性信息,获取与所述待预测用户关联的用户集群,包括:
从所述待预测用户的属性信息中,选择行为属性和/或画像属性作为聚类属性;
由所述聚类属性与所述待预测用户相同的用户,形成所述用户集群。
3.根据权利要求2所述的方法,其特征在于,从所述待预测用户的属性信息中,选择行为属性作为所述聚类属性,包括:
从所述待预测用户的属性信息中,选择下单行为对应的商圈属性作为所述聚类属性;和/或
从所述待预测用户的属性信息中,选择评论行为对应的商户属性作为所述聚类属性;和/或
从所述待预测用户的属性信息中,选择评论行为对应的商品属性作为所述聚类属性。
4.根据权利要求2所述的方法,其特征在于,从所述待预测用户的属性信息中,选择画像属性作为所述聚类属性,包括:
从所述待预测用户的属性信息中,选择用户年龄属性作为所述聚类属性;和/或
从所述待预测用户的属性信息中,选择平台年龄属性作为所述聚类属性;和/或
从所述待预测用户的属性信息中,选择生命周期属性作为所述聚类属性。
5.根据权利要求1-4任一项所述的方法,其特征在于,结合所述待预测用户和所述用户集群在当前时段以及N个历史时段内的消费特征,预测所述待预测用户在将来时段产生的平台收益,包括:
将所述待预测用户和所述用户集群在当前时段以及N个历史时段内的消费特征作为入口参数,运行所述待预测用户对应的预测模型,以获得所述待预测用户在将来时段产生的平台收益;
其中,N的取值由所述预测模型的阶数确定,所述预测模型反应消费特征与平台收益之间的预测关系。
6.根据权利要求5所述的方法,其特征在于,运行所述待预测用户对应的预测模型之前,所述方法还包括:
根据所述预测模型的阶数,确定训练所述预测模型所需的历史时段的个数M,M是正整数;
统计所述待预测用户在M个历史时段内的消费特征;
根据所述用户集群中各用户的消费特征,统计所述用户集群在M个历史时段内的消费特征;
以所述待预测用户在目标历史时段产生的平台收益作为训练目标,对所述待预测用户在M个历史时段内的消费特征与所述用户集群在M个历史时段内的消费特征进行模型训练,以获得所述预测模型,所述目标历史时段与所述M个历史时段相对应;
其中,所述M个历史时段与所述N个历史时段完全不同,或部分相同。
7.根据权利要求6所述的方法,其特征在于,根据所述预测模型的阶数,确定训练所述预测模型所需的历史时段的个数M之前,所述方法还包括:
根据所述待预测用户在多个历史时段内的消费特征,确定所述待预测用户的消费行为变化频度;
根据所述待预测用户的消费行为变化频度,确定所述预测模型的阶数。
8.一种平台收益预测装置,其特征在于,包括:
获取模块,用于根据待预测用户的属性信息,获取与所述待预测用户关联的用户集群;
第一统计模块,用于统计所述待预测用户在当前时段以及N个历史时段内的消费特征,N是正整数;
第二统计模块,用于根据所述用户集群中各用户的消费特征,统计所述用户集群在当前时段以及N个历史时段内的消费特征;
预测模块,用于结合所述待预测用户和所述用户集群在当前时段以及N个历史时段内的消费特征,预测所述待预测用户在将来时段产生的平台收益。
9.一种电子设备,其特征在于,包括存储器和处理器;所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时能够实现权利要求1-7任一项所述方法中的步骤。
10.一种存储有计算机程序的计算机可读存储介质,其特征在于,所述计算机程序被计算机执行时实现权利要求1-7任一项所述方法中的步骤。
CN201710459126.9A 2017-06-16 2017-06-16 平台收益预测方法及装置 Pending CN107437199A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710459126.9A CN107437199A (zh) 2017-06-16 2017-06-16 平台收益预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710459126.9A CN107437199A (zh) 2017-06-16 2017-06-16 平台收益预测方法及装置

Publications (1)

Publication Number Publication Date
CN107437199A true CN107437199A (zh) 2017-12-05

Family

ID=60458635

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710459126.9A Pending CN107437199A (zh) 2017-06-16 2017-06-16 平台收益预测方法及装置

Country Status (1)

Country Link
CN (1) CN107437199A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108460630A (zh) * 2018-02-12 2018-08-28 广州虎牙信息科技有限公司 基于用户数据进行分类分析的方法和装置
CN109034880A (zh) * 2018-07-09 2018-12-18 麒麟合盛网络技术股份有限公司 收入预测方法及装置
CN110288115A (zh) * 2019-04-11 2019-09-27 上海拉扎斯信息科技有限公司 配送方案预测方法、装置、服务器及存储介质
CN110555537A (zh) * 2018-05-30 2019-12-10 微软技术许可有限责任公司 多因素多时间点相关的预测
CN111913940A (zh) * 2020-06-20 2020-11-10 武汉海云健康科技股份有限公司 一种温度会员标签预测方法、装置、电子设备及存储介质
CN112862527A (zh) * 2021-02-04 2021-05-28 北京嘀嘀无限科技发展有限公司 用户类型确定方法、装置、设备及存储介质
CN113422978A (zh) * 2021-07-14 2021-09-21 北京达佳互联信息技术有限公司 休眠预警模型的训练方法和装置及休眠预警方法和装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108460630A (zh) * 2018-02-12 2018-08-28 广州虎牙信息科技有限公司 基于用户数据进行分类分析的方法和装置
CN110555537A (zh) * 2018-05-30 2019-12-10 微软技术许可有限责任公司 多因素多时间点相关的预测
CN109034880A (zh) * 2018-07-09 2018-12-18 麒麟合盛网络技术股份有限公司 收入预测方法及装置
CN110288115A (zh) * 2019-04-11 2019-09-27 上海拉扎斯信息科技有限公司 配送方案预测方法、装置、服务器及存储介质
CN111913940A (zh) * 2020-06-20 2020-11-10 武汉海云健康科技股份有限公司 一种温度会员标签预测方法、装置、电子设备及存储介质
CN111913940B (zh) * 2020-06-20 2024-04-26 武汉海云健康科技股份有限公司 一种温度会员标签预测方法、装置、电子设备及存储介质
CN112862527A (zh) * 2021-02-04 2021-05-28 北京嘀嘀无限科技发展有限公司 用户类型确定方法、装置、设备及存储介质
CN113422978A (zh) * 2021-07-14 2021-09-21 北京达佳互联信息技术有限公司 休眠预警模型的训练方法和装置及休眠预警方法和装置
CN113422978B (zh) * 2021-07-14 2022-08-26 北京达佳互联信息技术有限公司 休眠预警模型的训练方法和装置及休眠预警方法和装置

Similar Documents

Publication Publication Date Title
CN107437199A (zh) 平台收益预测方法及装置
CN108537568A (zh) 一种信息推荐方法和装置
US11301794B2 (en) Machine for labor optimization for efficient shipping
TWI714113B (zh) 外匯交易量預測方法和裝置
CN108596652A (zh) 活跃用户数预测方法及装置
Lu et al. Show me the money: Dynamic recommendations for revenue maximization
CN107292661A (zh) 计算机实现的基于数据分析辅助制定价格的方法及设备
Schutte et al. A proposed benchmark model using a modularised approach to calculate IFRS 9 expected credit loss
CN108230140A (zh) 推送信息的方法和装置、确定输入默认值的方法和装置
CN102890799A (zh) 业务成效权衡仿真器
CN109741177A (zh) 用户信用的评估方法、装置及智能终端
CN110245980A (zh) 基于神经网络模型确定目标用户激励形式的方法和设备
CN108734469A (zh) 确定待定用户风险标签的方法和装置
CN110175916A (zh) 资金流核对方法及装置
CN106096854A (zh) 一种数据处理方法和装置
CN107066518A (zh) 数据处理方法及系统
US20140289007A1 (en) Scenario based customer lifetime value determination
CN109976975A (zh) 一种磁盘容量预测方法、装置、电子设备及存储介质
CN110489418A (zh) 一种数据聚合方法和系统
CN110134860A (zh) 用户画像生成方法、装置和设备
CN107464152A (zh) 数据处理方法、客户端和服务端
CN108446738A (zh) 一种聚类方法、装置及电子设备
CN108492112A (zh) 判定虚假资源转移及虚假交易的方法、装置及电子设备
CN115936875A (zh) 金融产品挂单处理方法和装置
CN110008386A (zh) 一种数据生成、处理、评价方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171205