CN114742569A - 用户生命阶段预测方法、装置、计算机设备及存储介质 - Google Patents

用户生命阶段预测方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN114742569A
CN114742569A CN202110025561.7A CN202110025561A CN114742569A CN 114742569 A CN114742569 A CN 114742569A CN 202110025561 A CN202110025561 A CN 202110025561A CN 114742569 A CN114742569 A CN 114742569A
Authority
CN
China
Prior art keywords
user
predicted
sample
determining
behavior data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110025561.7A
Other languages
English (en)
Inventor
黄昕虹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Shiyuan Electronics Thecnology Co Ltd
Original Assignee
Guangzhou Shiyuan Electronics Thecnology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Shiyuan Electronics Thecnology Co Ltd filed Critical Guangzhou Shiyuan Electronics Thecnology Co Ltd
Priority to CN202110025561.7A priority Critical patent/CN114742569A/zh
Publication of CN114742569A publication Critical patent/CN114742569A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种用户生命阶段预测方法、装置、计算机设备及存储介质,该方法包括:确定待预测用户的特征向量;分别确定待预测用户的特征向量与预先确定的每个用户集合的特征向量的相似度,其中,不同用户集合所属的生命阶段不同,用户集合的特征向量是根据用户集合包括的样本用户的特征向量确定的,用户集合包括的样本用户是根据多个样本用户的第一行为数据确定的;将对应的相似度满足预设条件的用户集合所属的生命阶段,确定为待预测用户的生命阶段。在该用户生命阶段预测方法中,确定出的用户集合的特征向量较为准确,从而,实现了准确性较高的用户生命阶段预测。

Description

用户生命阶段预测方法、装置、计算机设备及存储介质
技术领域
本发明实施例涉及计算机领域,尤其涉及一种用户生命阶段预测方法、装置、计算机设备及存储介质。
背景技术
在应用程序(Application,APP)的运营过程中,随着APP的用户量的不断提升,用户运营变得尤为重要,特别是精细化运营的需求大大加强。这时需要对整体用户进行分层,根据用户特征将用户划分到不同的生命阶段,以实现精细化、精准化运营。
目前,可以根据相关业务专家或者资深产品经理的经验理论,提取用户关键行为与关键指标,再根据结合历史经验与实际的用户数据分布定义的关键行为特征与关键指标的值,预测用户的生命阶段。
但是,上述过程中,由于结合历史经验与实际的用户数据分布定义的关键行为特征与关键指标的值并不准确,导致预测出的用户的生命阶段的准确性较低。
发明内容
本发明提供一种用户生命阶段预测方法、装置、计算机设备及存储介质,以解决目前的用户生命阶段预测方法准确性较低的技术问题。
第一方面,本发明实施例提供一种用户生命阶段预测方法,包括:
确定待预测用户的特征向量;
分别确定所述待预测用户的特征向量与预先确定的每个用户集合的特征向量的相似度;其中,不同用户集合所属的生命阶段不同,所述用户集合的特征向量是根据所述用户集合包括的样本用户的特征向量确定的,所述用户集合包括的样本用户是根据多个所述样本用户的第一行为数据确定的;
将对应的相似度满足预设条件的用户集合所属的生命阶段,确定为所述待预测用户的生命阶段。
第二方面,本发明实施例还提供一种用户生命阶段预测装置,包括:
第一确定模块,用于确定待预测用户的特征向量;
第二确定模块,用于分别确定所述待预测用户的特征向量与预先确定的每个用户集合的特征向量的相似度;其中,不同用户集合所属的生命阶段不同,所述用户集合的特征向量是根据所述用户集合包括的样本用户的特征向量确定的,所述用户集合包括的样本用户是根据多个所述样本用户的第一行为数据确定的;
第三确定模块,用于将对应的相似度满足预设条件的用户集合所属的生命阶段,确定为所述待预测用户的生命阶段。
第三方面,本发明实施例还提供了一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面提供的用户生命阶段预测方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面提供的用户生命阶段预测方法。
本实施例提供一种用户生命阶段预测方法、装置、计算机设备及存储介质,该方法包括:确定待预测用户的特征向量;分别确定待预测用户的特征向量与预先确定的每个用户集合的特征向量的相似度,其中,不同用户集合所属的生命阶段不同,用户集合的特征向量是根据用户集合包括的样本用户的特征向量确定的,用户集合包括的样本用户是根据多个样本用户的第一行为数据确定的;将对应的相似度满足预设条件的用户集合所属的生命阶段,确定为待预测用户的生命阶段。在该用户生命阶段预测方法中,预先结合样本用户的第一行为数据以及样本用户的特征向量,确定用户集合的特征向量,再基于待预测用户的特征向量以及用户集合的特征向量,确定待预测用户的生命阶段,相较于相关技术,本实施例中确定出的用户集合的特征向量较为准确,使得基于该用户集合的特征向量以及待预测用户的特征向量确定出的待预测用户的生命阶段较为准确,从而,实现了准确性较高的用户生命阶段预测。
附图说明
图1为本发明提供的一种用户生命阶段预测方法实施例的流程示意图;
图2为本发明提供的另一种用户生命阶段预测方法实施例中的流程示意图;
图3为本发明提供的用户生命阶段预测方法实施例中确定用户集合的特征向量的过程示意图;
图4为本发明提供的用户生命阶段预测方法实施例中确定每个样本用户的特征向量的流程示意图;
图5为本发明提供的用户生命阶段预测方法实施例中确定样本用户的第二行为数据对应的第一子向量的过程示意图;
图6为本发明提供的又一种用户生命阶段预测方法实施例中的流程示意图;
图7为本发明提供的用户生命阶段预测方法实施例中确定待预测用户的行为数据对应的第一子向量的过程示意图;
图8为本发明提供的一种用户生命阶段预测装置的结构示意图;
图9为本发明提供的另一种用户生命阶段预测装置的结构示意图;
图10为本发明提供的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
图1为本发明提供的一种用户生命阶段预测方法实施例的流程示意图。本实施例适用于对APP的用户的生命阶段进行预测的场景。本实施例可以由用户生命阶段预测装置来执行,该用户生命阶段预测装置可以由软件和/或硬件的方式实现,该用户生命阶段预测装置可以集成于计算机设备中。如图1所示,本实施例提供的用户生命阶段预测方法包括如下步骤:
步骤101:确定待预测用户的特征向量。
具体地,本实施例中的待预测用户为APP的用户。示例性地,本实施例中的APP可以为课堂管理APP中的家长用户。
一种实现方式中,可以根据待预测用户的行为数据,确定待预测用户的特征向量。这里的行为数据可以为待预测用户在APP中的预设类型的行为的数据,例如,对某个页面或者某个项目的点击操作。这里的项目可以为页面中的某个模块。
在获取到待预测用户的行为数据后,可以将行为数据转换为向量形式,这个向量就是待预测用户的特征向量。
另一种实现方式中,可以根据待预测用户的行为数据以及该待预测用户的基础特征,确定待预测用户的特征向量。这里的待预测用户的基础特征可以为该用户的属性信息。在待预测用户为课堂管理APP中的家长用户的场景中,待预测用户的基础特征可以包括以下至少一项:待预测用户对应的学生的学段、年级、待预测用户的注册时间以及待预测用户的登录相关特征。其中,登录相关特征可以为登录的时间、登录的设备类型等。
在获取到待预测用户的行为数据以及该待预测用户的基础特征后:可以将行为数据转换为向量形式;将基础特征中的离散特征进行编码,例如,采用独热(one-hot)编码,将离散特征数字化,对基础特征中的连续变量进行归一化,从而将基础特征转换为向量形式;拼接行为数据对应的向量以及基础特征对应的向量,形成待预测用户的特征向量。
再一种实现方式中,可以根据待预测用户的行为数据、该待预测用户的基础特征以及该待预测用户的关联用户的行为数据,确定该待预测用户的特征向量。在待预测用户为课堂管理APP中的家长用户的场景中,待预测用户的关联用户可以为教师用户。该实现方式将在后文的实施例中进行详细描述。
步骤102:分别确定待预测用户的特征向量与预先确定的每个用户集合的特征向量的相似度。
其中,不同用户集合所属的生命阶段不同。用户集合的特征向量是根据用户集合包括的样本用户的特征向量确定的。用户集合包括的样本用户是根据多个样本用户的第一行为数据确定的。
具体地,本实施例中,在步骤102之前,可以先根据样本用户的第一行为数据,对样本用户进行分类,将其分为多个用户集合。再针对每个用户集合,基于该用户集合包括的样本用户的特征向量,预先确定出用户集合的特征向量。本实施例中样本用户的特征向量的确定过程与步骤101中确定待预测用户的特征向量的过程类似,此处不再赘述。
本实施例中的用户集合可以有自身所属的生命阶段,不同用户集合所属的生命阶段不同。
可选地,本实施例中,用户集合的数量为4个,所有用户集合所属的生命阶段包括:新手期、成长期、成熟期以及衰退期。
示例性地,本实施例中的样本用户可以为课堂管理APP中的家长用户。
可选地,样本用户的第一行为数据可以包括以下至少一项:消费行为数据、注册行为数据以及登录行为数据。
这种确定用户集合的特征向量的方式,结合了样本用户的第一行为数据以及样本用户的特征向量,使得确定出的用户集合的特征向量较为准确性,从而,使得基于该用户集合的特征向量以及待预测用户的特征向量确定出的待预测用户的生命阶段较为准确,预测的准确性较高。
在预先确定出用户集合的特征向量之后,本实施例中,可以分别确定待预测用户的特征向量与用户集合的特征向量的相似度。
本实施例中的相似度确定的方式可以采用以下至少一种相似度确定算法:内积相似度、余弦相似度或者欧几里德相似度等。
可以理解的是,用户集合的数量有几个,就可以确定出相应数量的相似度。
步骤103:将对应的相似度满足预设条件的用户集合所属的生命阶段,确定为待预测用户的生命阶段。
具体地,在分别确定出待预测用户的特征向量与各用户集合的特征向量的相似度之后,可以将对应的相似度满足预设条件的用户集合所属的生命阶段,确定为待预测用户的生命阶段。
可选地,这里的预设条件可以为相似度最大。相对应地,步骤103具体可以为:将对应的相似度最大的用户集合对应的生命阶段,确定为待预测用户的生命阶段。
本实施例中在确定出待预测用户的生命阶段之后,可以根据该预测用户的生命阶段,对该待预测用户进行精细化、精准化运营,用最小的成本获得最高的投资回报率(Return On Investment)。
可选地,在步骤103之后,本实施例提供的用户生命阶段预测方法还可以包括如下步骤:根据用户的生命阶段与运营消息的映射关系,以及,待预测用户的生命阶段,确定待预测用户对应的运营消息;向待预测用户发送待预测用户对应的运营消息。其中,可以通过APP、短信、即时通信软件或者邮件等方式向待预测用户发送该待预测用户对应的运营消息。
以下以一个具体的例子说明本实施例提供的用户生命阶段预测方法。本实施例中,预先确定了四个用户集合:新手期用户集合(该集合所属的生命阶段为新手期)、成长期用户集合(该集合所属的生命阶段为成长期)、成熟期用户集合(该集合所属的生命阶段为成熟期)以及衰退期用户集合(该集合所属的生命阶段为衰退期),并且,针对每个用户集合包括的样本用户的特征向量,确定出用户集合的特征向量:新手期用户集合的特征向量A、成长期用户集合的特征向量B、成熟期用户集合的特征向量C以及衰退期用户集合的特征向量D。首先,执行步骤101,确定出待预测用户的特征向量;之后,执行步骤102,分别确定待预测用户的特征向量与新手期用户集合的特征向量A、成长期用户集合的特征向量B、成熟期用户集合的特征向量C以及衰退期用户集合的特征向量D的相似度;之后,执行步骤103,假设预设条件为相似度最大,并且,假设待预测用户的特征向量与成长期用户集合的特征向量B之间的相似度最大,则将成长期用户集合所属的生命阶段确定为该待预测用户的生命阶段,即该待预测用户的生命阶段为成长期。在上述过程中,由于结合样本用户的第一行为数据以及样本用户的特征向量,确定用户集合的特征向量,使得确定出的用户集合的特征向量较为准确性,从而,使得基于该用户集合的特征向量以及待预测用户的特征向量确定出的待预测用户的生命阶段较为准确,预测的准确性较高。
本实施例提供一种用户生命阶段预测方法,包括:确定待预测用户的特征向量;分别确定待预测用户的特征向量与预先确定的每个用户集合的特征向量的相似度,其中,不同用户集合所属的生命阶段不同,用户集合的特征向量是根据用户集合包括的样本用户的特征向量确定的,用户集合包括的样本用户是根据多个样本用户的第一行为数据确定的;将对应的相似度满足预设条件的用户集合所属的生命阶段,确定为待预测用户的生命阶段。在该用户生命阶段预测方法中,预先结合样本用户的第一行为数据以及样本用户的特征向量,确定用户集合的特征向量,再基于待预测用户的特征向量以及用户集合的特征向量,确定待预测用户的生命阶段,相较于相关技术,本实施例中确定出的用户集合的特征向量较为准确,使得基于该用户集合的特征向量以及待预测用户的特征向量确定出的待预测用户的生命阶段较为准确,从而,实现了准确性较高的用户生命阶段预测。
图2为本发明提供的另一种用户生命阶段预测方法实施例中的流程示意图。本实施例提供的用户生命阶段预测方法在图1所示实施例及各种可选的实现方式的基础上,对如何确定每个用户集合的特征向量的过程作一详细说明。如图2所示,本实施例提供的用户生命阶段预测方法包括如下步骤:
步骤201:根据多个样本用户的第一行为数据,将样本用户划分为多个用户集合。
从人类的生命阶段来看,分为幼年期、青年期、中壮年期以及老年期,每个生命阶段的人类在每一天内对应着完全不同的行为模式与行为特征,但处于同一时期的行为模式与特征又大致相同。比如说,人在幼年时期时,每一天的行为基本都是哭泣-喝奶-睡觉-哭泣-喝奶-睡觉。人在青年时期时,则变为起床-上学-听课-放学-写作业。到了中壮年期,每天则是起床-通勤-工作-加班-娱乐。步入老年又变了完全不一样的养花-遛鸟-广场舞。将上述想法映射到用户生命阶段预测上,在用户数量以及行为足够丰富的情况下,会发现不同生命阶段的用户的行为模式也会不尽相同,而处于同一生命阶段内的用户行为也会大致相似。
本实施例中,可以结合多个样本用户的第一行为数据,将样本用户划分为多个用户集合。
示例性地,本实施例中的样本用户的第一行为数据包括以下至少一种数据:消费行为数据、注册行为数据以及登录行为数据。其中,消费行为数据可以包括:样本用户最近一次交易时间、样本用户的交易频率以及样本用户平均单次交易金额。注册行为数据可以包括注册时间距离当前时间的时长。登录行为数据可以包括最近一次登录时间距离当前时间的时长以及最近预设时长(例如,最近K天)内的登录时长等。
可选地,可以确定出样本用户的消费行为数据、注册行为数据以及登录行为数据与样本用户的生命阶段的映射关系。之后,针对每个样本用户,根据样本用户的消费行为数据、注册行为数据和登录行为数据,以及,该映射关系,确定出该样本用户对应的生命阶段。将对应的生命阶段相同的样本用户,确定为一个用户集合。从而,实现将样本用户划分为多个用户集合。
举例来说,某个样本用户的注册至今天数小于预设注册天数阈值、该样本用户在APP上消费小于预设消费阈值或者最近一次消费的时间距离当前时间的时长小于预设消费时长阈值或者消费频率小于预设频率阈值、该样本用户最近一次登录距今天数小于预设登录时长阈值,可以认为该样本用户是典型的新手期用户。
可选地,可以对样本用户进行选择,以确保每个用户集合中包括的样本用户的数量的差值在预设范围内。
步骤202:确定每个样本用户的特征向量。
需要说明的是,步骤201与步骤202之间没有时序关系。
图4为本发明提供的用户生命阶段预测方法实施例中确定每个样本用户的特征向量的流程示意图。如图4所示,步骤202可以包括如下步骤。
步骤2021:根据样本用户的第二行为数据,确定样本用户的第二行为数据对应的第一子向量。
示例性地,样本用户的第二行为数据可以包括以下至少一种数据:预设页面的操作数据以及预设项目的操作数据。这里的预设页面可以为首页。在APP为课堂管理APP的场景中,预设项目可以为课程、成长手册等。
更具体地,确定样本用户的第二行为数据对应的第一子向量的过程可以为:将样本用户的第二行为数据以预设时间间隔为时间单位,形成每个时间单位的行为序列;确定每个时间单位的行为序列映射的高维向量;将样本用户的所有时间单位的行为序列对应的高维向量,乘以不同的时间衰减因子,拼接成样本用户的第二行为数据对应的第一子向量。其中,距离当前时间越近的时间单位的行为序列映射的高维向量所乘的时间衰减因子越大,距离当前时间越远的时间单位的行为序列映射的高维向量所乘的时间衰减因子越小。
示例性地,预设时间间隔可以为天。
图5为本发明提供的用户生命阶段预测方法实施例中确定样本用户的第二行为数据对应的第一子向量的过程示意图。如图5所示,以样本用户11为例进行说明。获取到样本用户11的第二行为数据,示例性地,第二行为数据可以为打开首页、点击课程、打开成长手册等。图5中,假设样本用户11的第二行为数据包括行为数据h1、行为数据h2、……、行为数据hh。
之后,将样本用户11的第二行为数据以预设时间间隔为时间单位,形成每个时间单位的行为序列。在预设时间间隔可以为天的场景中,可以以天为单位,形成每天的行为序列。图5中,时间单位e1的行为序列包括:行为数据h1、行为数据h2、……、行为数据ht。时间单位e2的行为序列包括:行为数据h8、行为数据h9、……、行为数据hw。……,时间单位ey的行为序列包括:行为数据h7、行为数据h6、……、行为数据hx。
然后,确定每个时间单位的行为序列映射的高维向量。示例性地,可以采用Word2Vec方法,确定出每个时间单位的行为序列映射的高维向量。Word2Vec方法可以考虑到上下文信息,训练出行为数据的相似度,以更好地表示样本用户行为序列的相似度,从而,提高确定出的样本用户的第二行为数据对应的第一子向量的准确性。图5中,时间单位e1的行为序列映射的高维向量为e11,时间单位e2的行为序列映射的高维向量为e12,……,时间单位ey的行为序列映射的高维向量为e1y。
之后,将样本用户11的所有时间单位的行为序列对应的高维向量,乘以对应的时间衰减因子,拼接成样本用户的第二行为数据对应的第一子向量。距离当前时间越近的时间单位的行为序列映射的高维向量所乘的时间衰减因子越大,距离当前时间越远的时间单位的行为序列映射的高维向量所乘的时间衰减因子越小。
可选地,在拼接时,可以按照时间单位的前后顺序进行拼接,即,越靠前的时间单位的行为序列映射的高维向量在第一子向量中的位置越靠前。当然,也可以采用其他规则进行拼接,只要所有样本用户的第一子向量的拼接规则一致即可。
需要时间衰减因子的原因在于:样本用户的第二行为数据有可能跨越了多个生命阶段,本实施例中,在计算单个样本用户的第二行为数据对应的第一子向量的时候加入注意力(ATTENTION)机制,也即时间衰减因子。可以理解为给越新(即越靠近当前时间)的行为序列赋予更大的权重,保证越靠近当前时间的行为序列的重要程度越高。这样在确定样本用户的第二行为数据对应的第一子向量的时候,可以更关注在最近的行为序列上,忽略距离较远的行为序列(因为距离较远行为序列的可能处于上一个生命阶段)。也即,在确定样本用户的第二行为数据对应的第一子向量中考虑到时间衰减因子,可以提高确定出的样本用户的第二行为数据对应的第一子向量的准确性,以保证后续确定出的用户集合的特征向量的准确性,进而,保证用户生命阶段预测的准确性。
步骤2022:根据样本用户的基础特征,确定样本用户的基础特征对应的第二子向量。
本实施例中的样本用户的基础特征可以从样本用户的用户画像中获取。
示例性地,在样本用户为课堂管理APP中的家长用户的场景中,样本用户的基础特征包括以下至少一项:样本用户对应的学生的学段、年级、样本用户的注册时间以及样本用户的登录相关特征。
在步骤2022中,可以将基础特征中的离散特征进行编码,例如,采用one-hot编码,将离散特征数字化;对基础特征中的连续变量进行归一化。从而,将基础特征转换为向量形式,形成样本用户的基础特征对应的第二子向量。
示例性地,对离散特征one-hot编码的过程可以为:例如,学段特征有小学、初中、高中三个取值,那么对应的编码向量则为[1 0 0],[0 1 0],[0 0 1]。在将连续变量归一化时,可以将连续变量归一化至0至1之间。
在将基础特征中的每个特征转化为数字形式或者归一化后,拼接成样本用户的基础特征对应的第二子向量。
可选地,在拼接过程中,可以对不同的特征赋予不同的权重,以提高确定出的第二子向量的准确性。
步骤2023:根据样本用户的关联用户的行为数据,确定样本用户的关联用户对应的第三子向量。
示例性地,在APP为课堂管理APP,样本用户为课堂管理APP中的家长用户的场景中,样本用户的关联用户可以为教师用户。样本用户的关联用户的行为数据可以包括以下至少一项:教师用户发送点评的时间、教师用户对该样本用户发送点评的次数等数据。
在步骤2023中,与步骤2022中类似,将样本用户的关联用户的行为数据中的离散数据进行编码,例如,采用one-hot编码,将离散数据数字化;对样本用户的关联用户的行为数据的连续数据进行归一化。从而,将样本用户的关联用户的行为数据转换为向量形式,形成样本用户的关联用户对应的第三子向量。
步骤2024:按照预设规则,拼接样本用户的第二行为数据对应的第一子向量、样本用户的基础特征对应的第二子向量以及样本用户的关联用户对应的第三子向量,形成样本用户的特征向量。
这里的预设规则可以包括拼接时不同子向量的权重、拼接的顺序等。该预设规则可以根据实际需求进行设置。
在本实施例确定样本用户的特征向量的过程中,综合考虑了样本用户的第二行为数据、样本用户的基础特征以及样本用户的关联用户的行为数据,使得确定出的样本用户的特征向量较为全面及准确,有效地提升了不同生命阶段的用户的区分度,进一步提高了用户生命阶段预测的准确性。
可选地,在将样本用户的第二行为数据以预设时间间隔为时间单位,形成每个时间单位的行为序列之前,还可以包括:获取样本用户不再登陆前预设时间段的第二行为数据。这种实现方式是为了保证每个样本用户都有行为数据,所以提取的是该样本用户不再登陆前预设时间段的第二行为数据,而不是距离当前时间之前预设时间段的第二行为数据,以提高确定出的样本用户的特征向量的准确性。
一种实现方式中,可以通过预定义样本用户的关键核心行为的埋点数据(即第二行为数据),便于在用户行为日志提取中减少无效的行为噪声,且可以减少计算量以提升计算速度。本实施例中,在提取出用户行为日志后,可以清洗用户行为日志。
步骤203:针对每个用户集合,根据用户集合包括的样本用户的特征向量,确定用户集合的特征向量。
可选地,步骤203可以包括:对用户集合包括的样本用户的特征向量进行聚类,获取用户集合包括的多个样本用户类;根据用户集合包括的多个样本用户类中,最大的样本用户类包括的样本用户的特征向量,确定用户集合的特征向量。
一种实现方式中,本实施例可以采用目前已有的聚类算法,对用户集合包括的样本用户的特征向量直接进行聚类。通过聚类结果清洗掉一部分游离的样本用户的特征向量。
另一种实现方式中,本实施例可以采用目前已有的聚类算法以及降维算法,对用户集合包括的样本用户的特征向量降维后再进行聚类。
示例性地,在步骤203中,可以将最大的样本用户类包括的样本用户的特征向量的平均值,确定为该用户集合的特征向量。
以下以一个具体的例子说明上述步骤201至步骤203。图3为本发明提供的用户生命阶段预测方法实施例中确定用户集合的特征向量的过程示意图。执行步骤201后,如图3所示,形成了四个用户集合:新手期用户集合、成长期用户集合、成熟期用户集合以及衰退期用户集合。其中,新手期用户集合包括:样本用户11、样本用户12、……、样本用户m。成长期用户集合包括:样本用户21、样本用户22、……、样本用户n。成熟期用户集合包括:样本用户31、样本用户32、……、样本用户r。衰退期用户集合包括:样本用户41、样本用户42、……、样本用户t。执行步骤202后,确定出了每个样本用户的特征向量。之后,执行步骤203:根据新手期用户集合包括的样本用户的特征向量,确定新手期用户集合的特征向量;根据成长期用户集合包括的样本用户的特征向量,确定成长期用户集合的特征向量;根据成熟期用户集合包括的样本用户的特征向量,确定成熟期用户集合的特征向量;根据衰退期用户集合包括的样本用户的特征向量,确定衰退期用户集合的特征向量。
步骤204:确定待预测用户的特征向量。
步骤205:分别确定待预测用户的特征向量与预先确定的每个用户集合的特征向量的相似度。
其中,不同用户集合所属的生命阶段不同。用户集合的特征向量是根据用户集合包括的样本用户的特征向量确定的。用户集合包括的样本用户是根据多个样本用户的第一行为数据确定的。
步骤206:将对应的相似度满足预设条件的用户集合所属的生命阶段,确定为待预测用户的生命阶段。
步骤204与步骤101、步骤205与步骤102、步骤206与步骤103实现过程和技术原理类似,此处不再赘述。
本实施例提供的用户生命阶段预测方法,先根据样本用户的第一行为数据,形成多个用户集合,之后,根据用户集合包括的样本用户的特征向量,确定用户集合的特征向量,实现了根据样本用户的第一行为数据对用户集合进行标注,再基于样本用户的特征向量,确定用户集合的特征向量,上述过程结合了样本用户的第一行为数据以及样本用户的特征向量,确定用户集合的特征向量,相较于相关技术,本实施例中确定出的用户集合的特征向量较为准确,使得基于该用户集合的特征向量以及待预测用户的特征向量确定出的待预测用户的生命阶段较为准确,从而,实现了准确性较高的用户生命阶段预测。
图6为本发明提供的又一种用户生命阶段预测方法实施例中的流程示意图。本实施例提供的用户生命阶段预测方法在图1所示实施例、图2所示实施例及各种可选的实现方式的基础上,对如何确定待预测用户的特征向量的过程作一详细说明。如图6所示,本实施例提供的用户生命阶段预测方法包括如下步骤:
步骤601:根据待预测用户的行为数据,确定待预测用户的行为数据对应的第一子向量。
示例性地,这里的待预测用户的行为数据可以为待预测用户的第二行为数据。待预测用户的第二行为数据可以包括以下至少一种数据:预设页面的操作数据以及预设项目的操作数据。这里的预设页面可以为首页。在APP为课堂管理APP的场景中,预设项目可以为课程、成长手册等。
需要说明的是,待预测用户的第一行为数据可以包括以下至少一种数据:消费行为数据、注册行为数据以及登录行为数据。
一种场景中,待预测用户可能不存在第一行为数据,本实施例提供的用户生命阶段预测方法可以实现基于待预测用户的第二行为数据,预测该待预测用户的生命阶段。
更具体地,确定待预测用户的行为数据对应的第一子向量的过程可以为:将待预测用户的行为数据以预设时间间隔为时间单位,形成每个时间单位的行为序列;确定每个时间单位的行为序列映射的高维向量;将待预测用户的所有时间单位的行为序列对应的高维向量,乘以不同的时间衰减因子,拼接成待预测用户的行为数据对应的第一子向量。其中,距离当前时间越近的时间单位的行为序列映射的高维向量所乘的时间衰减因子越大,距离当前时间越远的时间单位的行为序列映射的高维向量所乘的时间衰减因子越小。
图7为本发明提供的用户生命阶段预测方法实施例中确定待预测用户的行为数据对应的第一子向量的过程示意图。如图7所示,获取到待预测用户的行为数据,示例性地,行为数据可以为打开首页、点击课程、打开成长手册等。图7中,假设待预测用户的行为数据包括行为数据d1、行为数据d2、……、行为数据dh。
之后,将待预测用户的行为数据以预设时间间隔为时间单位,形成每个时间单位的行为序列。在预设时间间隔可以为天的场景中,可以以天为单位,形成每天的行为序列。图7中,时间单位j1的行为序列包括:行为数据d1、行为数据d2、……、行为数据dt。时间单位j2的行为序列包括:行为数据d8、行为数据d9、……、行为数据dw。……,时间单位jy的行为序列包括:行为数据d7、行为数据d6、……、行为数据dx。
然后,确定每个时间单位的行为序列映射的高维向量。示例性地,可以采用Word2Vec方法,确定出每个时间单位的行为序列映射的高维向量。Word2Vec方法可以考虑到上下文信息,训练出行为数据的相似度,以更好地表示待预测用户行为序列的相似度,从而,提高确定出的待预测用户的行为数据对应的第一子向量的准确性。图7中,时间单位j1的行为序列映射的高维向量为j11,时间单位j2的行为序列映射的高维向量为j12,……,时间单位jy的行为序列映射的高维向量为j1y。
之后,将待预测用户的所有时间单位的行为序列对应的高维向量,乘以不同的时间衰减因子,拼接成待预测用户的行为数据对应的第一子向量。距离当前时间越近的时间单位的行为序列映射的高维向量所乘的时间衰减因子越大,距离当前时间越远的时间单位的行为序列映射的高维向量所乘的时间衰减因子越小。
在确定待预测用户的行为数据对应的第一子向量中考虑到时间衰减因子,可以提高确定出的待预测用户的行为数据对应的第一子向量的准确性,进而,保证用户生命阶段预测的准确性。
步骤602:根据待预测用户的基础特征,确定待预测用户的基础特征对应的第二子向量。
本实施例中的待预测用户的基础特征可以从待预测用户的用户画像中获取。
在步骤602中,可以将待预测用户的基础特征中的离散特征进行编码,将离散特征数字化;对基础特征中的连续变量进行归一化。从而,将基础特征转换为向量形式,形成待预测用户的基础特征对应的第二子向量。
在将基础特征中的每个特征转化为数字形式或者归一化后,拼接成待预测用户的基础特征对应的第二子向量。
可选地,在拼接过程中,可以对不同的特征赋予不同的权重,以提高确定出的第二子向量的准确性。
步骤603:根据待预测用户的关联用户的行为数据,确定待预测用户的关联用户对应的第三子向量。
示例性地,在APP为课堂管理APP,待预测用户为课堂管理APP中的家长用户的场景中,待预测用户的关联用户可以为教师用户。待预测用户的关联用户的行为数据可以包括以下至少一项:教师用户发送点评的时间、教师用户对该样本用户发送点评的次数等数据。
在步骤603中,与步骤602中类似,将待预测用户的关联用户的行为数据中的离散数据进行编码,将离散数据数字化;对待预测用户的关联用户的行为数据的连续数据进行归一化。从而,将待预测用户的关联用户的行为数据转换为向量形式,形成待预测用户的关联用户对应的第三子向量。
步骤604:按照预设规则,拼接待预测用户的行为数据对应的第一子向量、待预测用户的基础特征对应的第二子向量以及待预测用户的关联用户对应的第三子向量,形成待预测用户的特征向量。
这里的预设规则可以包括拼接时不同子向量的权重、拼接的顺序等。该预设规则可以根据实际需求进行设置。
在本实施例确定待预测用户的特征向量的过程中,综合考虑了待预测用户的行为数据、待预测用户的基础特征以及待预测用户的关联用户的行为数据,使得确定出的待预测用户的特征向量较为全面及准确,进一步提高了用户生命阶段预测的准确性。
步骤605:分别确定待预测用户的特征向量与预先确定的每个用户集合的特征向量的相似度。
其中,不同用户集合所属的生命阶段不同。用户集合的特征向量是根据用户集合包括的样本用户的特征向量确定的。用户集合包括的样本用户是根据多个样本用户的第一行为数据确定的。
步骤606:将对应的相似度满足预设条件的用户集合所属的生命阶段,确定为待预测用户的生命阶段。
步骤605与步骤102、步骤606与步骤103的实现过程和技术原理类似,此处不再赘述。
本实施例提供一种用户生命阶段预测方法中,确定待预测用户的特征向量的过程包括:根据待预测用户的行为数据,确定待预测用户的行为数据对应的第一子向量;根据待预测用户的基础特征,确定待预测用户的基础特征对应的第二子向量;根据待预测用户的关联用户的行为数据,确定待预测用户的关联用户对应的第三子向量;按照预设规则,拼接待预测用户的行为数据对应的第一子向量、待预测用户的基础特征对应的第二子向量以及待预测用户的关联用户对应的第三子向量,形成待预测用户的特征向量。本实施例提供的用户生命阶段预测方法中,在确定待预测用户的特征向量时,综合考虑了待预测用户的行为数据、待预测用户的基础特征以及待预测用户的关联用户的行为数据,使得确定出的待预测用户的特征向量较为全面及准确,进一步提高了用户生命阶段预测的准确性。
图8为本发明提供的一种用户生命阶段预测装置的结构示意图。本实施例提供的用户生命阶段预测装置包括如下模块:第一确定模块81、第二确定模块82以及第三确定模块83。
第一确定模块81,用于确定待预测用户的特征向量。
可选地,第一确定模块81具体用于:根据待预测用户的行为数据,确定待预测用户的行为数据对应的第一子向量;根据待预测用户的基础特征,确定待预测用户的基础特征对应的第二子向量;根据待预测用户的关联用户的行为数据,确定待预测用户的关联用户对应的第三子向量;按照预设规则,拼接待预测用户的行为数据对应的第一子向量、待预测用户的基础特征对应的第二子向量以及待预测用户的关联用户对应的第三子向量,形成待预测用户的特征向量。
第二确定模块82,用于分别确定待预测用户的特征向量与预先确定的每个用户集合的特征向量的相似度。
其中,不同用户集合所属的生命阶段不同。用户集合的特征向量是根据用户集合包括的样本用户的特征向量确定的。用户集合包括的样本用户是根据多个样本用户的第一行为数据确定的。
可选地,本实施例中,用户集合的数量为4个。所有用户集合所属的生命阶段包括:新手期、成长期、成熟期以及衰退期。
第三确定模块83,用于将对应的相似度满足预设条件的用户集合所属的生命阶段,确定为待预测用户的生命阶段。
可选地,第三确定模块83具体用于:将对应的相似度最大的用户集合对应的生命阶段,确定为待预测用户的生命阶段。
进一步地,该装置可以包括:第四确定模块以及发送模块。其中,第四确定模块,用于根据用户的生命阶段与运营消息的映射关系,以及,待预测用户的生命阶段,确定待预测用户对应的运营消息。发送模块,用于向待预测用户发送待预测用户对应的运营消息。
可选地,样本用户及待预测用户均为课堂管理应用程序中的家长用户。待预测用户的关联用户为教师用户。
可选地,待预测用户的基础特征包括以下至少一项:待预测用户对应的学生的学段、年级、待预测用户的注册时间以及待预测用户的登录相关特征。
可选地,待预测用户的行为数据包括以下至少一种数据:预设页面的操作数据以及预设项目的操作数据。
本发明实施例所提供的用户生命阶段预测装置可执行本发明任意实施例所提供的用户生命阶段预测方法,具备执行方法相应的功能模块和有益效果。
图9为本发明提供的另一种用户生命阶段预测装置的结构示意图。本实施例在图8所示实施例及各种可选的实现方式的基础上,对用户生命阶段预测装置的其他模块作一详细说明。如图9所示,本实施例提供的用户生命阶段预测装置还包括如下模块:划分模块91、第五确定模块92以及第六确定模块93。
划分模块91,用于根据多个样本用户的第一行为数据,将样本用户划分为多个用户集合。
可选地,样本用户的第一行为数据包括以下至少一种数据:消费行为数据、注册行为数据以及登录行为数据。
第五确定模块92,用于确定每个样本用户的特征向量。
可选地,第五确定模块92具体用于:根据样本用户的第二行为数据,确定样本用户的第二行为数据对应的第一子向量;根据样本用户的基础特征,确定样本用户的基础特征对应的第二子向量;根据样本用户的关联用户的行为数据,确定样本用户的关联用户对应的第三子向量;按照预设规则,拼接样本用户的第二行为数据对应的第一子向量、样本用户的基础特征对应的第二子向量以及样本用户的关联用户对应的第三子向量,形成样本用户的特征向量。
在根据样本用户的第二行为数据,确定样本用户的第二行为数据对应的第一子向量的方面,第五确定模块92具体用于:将样本用户的第二行为数据以预设时间间隔为时间单位,形成每个时间单位的行为序列;确定每个时间单位的行为序列映射的高维向量;将样本用户的所有时间单位的行为序列对应的高维向量,乘以不同的时间衰减因子,拼接成样本用户的第二行为数据对应的第一子向量;其中,距离当前时间越近的时间单位的行为序列映射的高维向量所乘的时间衰减因子越大,距离当前时间越远的时间单位的行为序列映射的高维向量所乘的时间衰减因子越小。
一种实现方式中,本实施例提供的装置还包括获取模块,用于获取样本用户不再登陆前预设时间段的第二行为数据。
第六确定模块93,用于针对每个用户集合,根据用户集合包括的样本用户的特征向量,确定用户集合的特征向量。
可选地,第六确定模块93具体用于:对用户集合包括的样本用户的特征向量进行聚类,获取用户集合包括的多个样本用户类;根据用户集合包括的多个样本用户类中,最大的样本用户类包括的样本用户的特征向量,确定用户集合的特征向量。
本发明实施例所提供的用户生命阶段预测装置可执行本发明任意实施例所提供的用户生命阶段预测方法,具备执行方法相应的功能模块和有益效果。
图10为本发明提供的一种计算机设备的结构示意图。如图10所示,该计算机设备包括处理器110以及存储器111。该计算机设备中处理器110的数量可以是一个或多个,图10中以一个处理器110为例;该计算机设备的处理器110和存储器111可以通过总线或其他方式连接,图10中以通过总线连接为例。
存储器111作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的用户生命阶段预测方法对应的程序指令以及模块(例如,用户生命阶段预测装置中的第一确定模块81、第二确定模块82以及第三确定模块83)。处理器110通过运行存储在存储器111中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述的用户生命阶段预测方法。
存储器111可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器111可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器111可进一步包括相对于处理器110远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备。上述网络的实施例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本发明还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种用户生命阶段预测方法,该方法包括:
确定待预测用户的特征向量;
分别确定所述待预测用户的特征向量与预先确定的每个用户集合的特征向量的相似度;其中,不同用户集合所属的生命阶段不同,所述用户集合的特征向量是根据所述用户集合包括的样本用户的特征向量确定的,所述用户集合包括的样本用户是根据多个所述样本用户的第一行为数据确定的;
将对应的相似度满足预设条件的用户集合所属的生命阶段,确定为所述待预测用户的生命阶段。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的用户生命阶段预测方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述用户生命阶段预测装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (17)

1.一种用户生命阶段预测方法,其特征在于,包括:
确定待预测用户的特征向量;
分别确定所述待预测用户的特征向量与预先确定的每个用户集合的特征向量的相似度;其中,不同用户集合所属的生命阶段不同,所述用户集合的特征向量是根据所述用户集合包括的样本用户的特征向量确定的,所述用户集合包括的样本用户是根据多个所述样本用户的第一行为数据确定的;
将对应的相似度满足预设条件的用户集合所属的生命阶段,确定为所述待预测用户的生命阶段。
2.根据权利要求1所述的方法,其特征在于,所述分别确定所述待预测用户的特征向量与预先确定的每个用户集合的特征向量的相似度之前,所述方法还包括:
根据多个样本用户的第一行为数据,将所述样本用户划分为多个用户集合;
确定每个样本用户的特征向量;
针对每个用户集合,根据所述用户集合包括的样本用户的特征向量,确定所述用户集合的特征向量。
3.根据权利要求2所述的方法,其特征在于,所述样本用户的第一行为数据包括以下至少一种数据:消费行为数据、注册行为数据以及登录行为数据。
4.根据权利要求2所述的方法,其特征在于,所述确定每个样本用户的特征向量,包括:
根据所述样本用户的第二行为数据,确定所述样本用户的第二行为数据对应的第一子向量;
根据所述样本用户的基础特征,确定所述样本用户的基础特征对应的第二子向量;
根据所述样本用户的关联用户的行为数据,确定所述样本用户的关联用户对应的第三子向量;
按照预设规则,拼接所述样本用户的第二行为数据对应的第一子向量、所述样本用户的基础特征对应的第二子向量以及所述样本用户的关联用户对应的第三子向量,形成所述样本用户的特征向量。
5.根据权利要求4所述的方法,其特征在于,所述根据所述样本用户的第二行为数据,确定所述样本用户的第二行为数据对应的第一子向量,包括:
将所述样本用户的第二行为数据以预设时间间隔为时间单位,形成每个时间单位的行为序列;
确定每个时间单位的行为序列映射的高维向量;
将所述样本用户的所有时间单位的行为序列对应的高维向量,乘以不同的时间衰减因子,拼接成所述样本用户的第二行为数据对应的第一子向量;其中,距离当前时间越近的时间单位的行为序列映射的高维向量所乘的时间衰减因子越大,距离当前时间越远的时间单位的行为序列映射的高维向量所乘的时间衰减因子越小。
6.根据权利要求5所述的方法,其特征在于,所述将所述样本用户的第二行为数据以预设时间间隔为时间单位,形成每个时间单位的行为序列之前,所述方法还包括:
获取所述样本用户不再登陆前预设时间段的第二行为数据。
7.根据权利要求2所述的方法,其特征在于,所述根据所述用户集合包括的样本用户的特征向量,确定所述用户集合的特征向量,包括:
对所述用户集合包括的样本用户的特征向量进行聚类,获取所述用户集合包括的多个样本用户类;
根据所述用户集合包括的多个样本用户类中,最大的样本用户类包括的样本用户的特征向量,确定所述用户集合的特征向量。
8.根据权利要求1至7任一项所述的方法,其特征在于,所述确定待预测用户的特征向量,包括:
根据所述待预测用户的行为数据,确定所述待预测用户的行为数据对应的第一子向量;
根据所述待预测用户的基础特征,确定所述待预测用户的基础特征对应的第二子向量;
根据所述待预测用户的关联用户的行为数据,确定所述待预测用户的关联用户对应的第三子向量;
按照预设规则,拼接所述待预测用户的行为数据对应的第一子向量、所述待预测用户的基础特征对应的第二子向量以及所述待预测用户的关联用户对应的第三子向量,形成所述待预测用户的特征向量。
9.根据权利要求1至7任一项所述的方法,其特征在于,所述将对应的相似度满足预设条件的用户集合所属的生命阶段,确定为所述待预测用户的生命阶段,包括:
将对应的相似度最大的用户集合对应的生命阶段,确定为所述待预测用户的生命阶段。
10.根据权利要求1至7任一项所述的方法,其特征在于,所述将对应的相似度满足预设条件的用户集合所属的生命阶段,确定为所述待预测用户的生命阶段之后,所述方法包括:
根据用户的生命阶段与运营消息的映射关系,以及,所述待预测用户的生命阶段,确定所述待预测用户对应的运营消息;
向所述待预测用户发送所述待预测用户对应的运营消息。
11.根据权利要求1至7任一项所述的方法,其特征在于,所述用户集合的数量为4个,所有所述用户集合所属的生命阶段包括:新手期、成长期、成熟期以及衰退期。
12.根据权利要求8所述的方法,其特征在于,所述样本用户及所述待预测用户均为课堂管理应用程序中的家长用户,所述待预测用户的关联用户为教师用户。
13.根据权利要求12所述的方法,其特征在于,所述待预测用户的基础特征包括以下至少一项:所述待预测用户对应的学生的学段、年级、所述待预测用户的注册时间以及所述待预测用户的登录相关特征。
14.根据权利要求8所述的方法,其特征在于,所述待预测用户的行为数据包括以下至少一种数据:预设页面的操作数据以及预设项目的操作数据。
15.一种用户生命阶段预测装置,其特征在于,包括:
第一确定模块,用于确定待预测用户的特征向量;
第二确定模块,用于分别确定所述待预测用户的特征向量与预先确定的每个用户集合的特征向量的相似度;其中,不同用户集合所属的生命阶段不同,所述用户集合的特征向量是根据所述用户集合包括的样本用户的特征向量确定的,所述用户集合包括的样本用户是根据多个所述样本用户的第一行为数据确定的;
第三确定模块,用于将对应的相似度满足预设条件的用户集合所属的生命阶段,确定为所述待预测用户的生命阶段。
16.一种计算机设备,其特征在于,所述计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至14中任一所述的用户生命阶段预测方法。
17.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至14中任一所述的用户生命阶段预测方法。
CN202110025561.7A 2021-01-08 2021-01-08 用户生命阶段预测方法、装置、计算机设备及存储介质 Pending CN114742569A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110025561.7A CN114742569A (zh) 2021-01-08 2021-01-08 用户生命阶段预测方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110025561.7A CN114742569A (zh) 2021-01-08 2021-01-08 用户生命阶段预测方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN114742569A true CN114742569A (zh) 2022-07-12

Family

ID=82273916

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110025561.7A Pending CN114742569A (zh) 2021-01-08 2021-01-08 用户生命阶段预测方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN114742569A (zh)

Citations (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104759100A (zh) * 2015-03-23 2015-07-08 小米科技有限责任公司 游戏生命周期的预测方法、装置及游戏运营商服务器
CN104794635A (zh) * 2015-04-17 2015-07-22 南京大学 基于协同过滤推荐算法的机型推荐系统
US9462313B1 (en) * 2012-08-31 2016-10-04 Google Inc. Prediction of media selection consumption using analysis of user behavior
CN106203679A (zh) * 2016-06-27 2016-12-07 武汉斗鱼网络科技有限公司 一种用户流失预测方法及系统
CN106250403A (zh) * 2016-07-19 2016-12-21 北京奇艺世纪科技有限公司 用户流失预测方法及装置
WO2016203652A1 (ja) * 2015-06-19 2016-12-22 株式会社Ubic データ分析に係るシステム、制御方法、制御プログラム、および、その記録媒体
CN106951611A (zh) * 2017-03-07 2017-07-14 哈尔滨工业大学 一种基于使用者行为的严寒地区建筑节能设计优化方法
CN106960354A (zh) * 2016-01-11 2017-07-18 中国移动通信集团河北有限公司 一种基于客户生命周期的精准化推荐方法及装置
US9710767B1 (en) * 2013-12-20 2017-07-18 EMC IP Holding Company LLC Data science project automated outcome prediction
CN107566358A (zh) * 2017-08-25 2018-01-09 腾讯科技(深圳)有限公司 一种风险预警提示方法、装置、介质及设备
CN107832581A (zh) * 2017-12-15 2018-03-23 百度在线网络技术(北京)有限公司 状态预测方法和装置
CN107944915A (zh) * 2017-11-21 2018-04-20 北京深极智能科技有限公司 一种游戏用户行为分析方法及计算机可读存储介质
US20180174224A1 (en) * 2016-12-20 2018-06-21 Wal-Mart Stores, Inc. Vector-based characterizations of products and individuals with respect to personal partialities
CN108369665A (zh) * 2015-12-10 2018-08-03 爱维士软件有限责任公司 (移动)应用程序使用流失的预测
CN108376028A (zh) * 2018-01-09 2018-08-07 北京大学 基于用户行为和系统状态预测移动设备电池续航的方法
CN108446350A (zh) * 2018-03-09 2018-08-24 华中科技大学 一种基于主题模型分析与用户长短兴趣的推荐方法
CN108537587A (zh) * 2018-04-03 2018-09-14 广州优视网络科技有限公司 流失用户预警方法、装置、计算机可读存储介质和服务器
CN108572984A (zh) * 2017-03-13 2018-09-25 阿里巴巴集团控股有限公司 一种实时用户兴趣识别方法及装置
CN108596652A (zh) * 2018-03-28 2018-09-28 麒麟合盛网络技术股份有限公司 活跃用户数预测方法及装置
CN108648000A (zh) * 2018-04-24 2018-10-12 腾讯科技(深圳)有限公司 对用户留存生命周期进行评估的方法及装置、电子设备
CN109034861A (zh) * 2018-06-04 2018-12-18 挖财网络技术有限公司 基于移动端日志行为数据的用户流失预测方法及装置
CN109087124A (zh) * 2018-07-02 2018-12-25 麒麟合盛网络技术股份有限公司 一种应用程序价值预测方法及装置
CN109409963A (zh) * 2018-11-12 2019-03-01 平安科技(深圳)有限公司 客户生命周期的预测方法及装置、存储介质、计算机设备
CN109507535A (zh) * 2018-12-10 2019-03-22 国网河南省电力公司电力科学研究院 变电站接地网运行阶段及运行寿命预测方法及装置
CN109543107A (zh) * 2018-11-21 2019-03-29 网易无尾熊(杭州)科技有限公司 数据处理方法、介质、装置和计算设备
CN109729376A (zh) * 2019-01-02 2019-05-07 广州虎牙信息科技有限公司 一种生命周期的处理方法、装置、设备和存储介质
CN109754290A (zh) * 2019-01-15 2019-05-14 网易(杭州)网络有限公司 一种游戏数据的处理方法和装置
CN109784959A (zh) * 2017-11-10 2019-05-21 广州腾讯科技有限公司 一种目标用户预测方法、装置、后台服务器及存储介质
US10325285B1 (en) * 2013-06-28 2019-06-18 Groupon, Inc. Predictive recommendation system
CN109979190A (zh) * 2017-12-27 2019-07-05 中国移动通信集团公司 一种道路交通状态的预测方法及装置
CN110032750A (zh) * 2018-12-18 2019-07-19 阿里巴巴集团控股有限公司 一种模型构建、数据生命周期预测方法、装置及设备
CN110148011A (zh) * 2019-04-15 2019-08-20 平安科技(深圳)有限公司 基于大数据的活跃量下降分析方法、装置、设备及介质
CN110197389A (zh) * 2019-03-04 2019-09-03 腾讯科技(深圳)有限公司 一种用户识别方法及装置
CN110322281A (zh) * 2019-06-06 2019-10-11 阿里巴巴集团控股有限公司 相似用户的挖掘方法及装置
CN110781407A (zh) * 2019-10-21 2020-02-11 腾讯科技(深圳)有限公司 用户标签生成方法、装置及计算机可读存储介质
CN110795570A (zh) * 2019-10-11 2020-02-14 上海上湖信息技术有限公司 一种用户时序行为特征提取方法及装置
CN110888945A (zh) * 2019-11-28 2020-03-17 上海风秩科技有限公司 用户行为预测方法、装置、电子设备及存储介质
CN110991875A (zh) * 2019-11-29 2020-04-10 广州市百果园信息技术有限公司 一种平台用户质量评估系统
JP2020071680A (ja) * 2018-10-31 2020-05-07 ヤフー株式会社 予測装置、予測方法、及び予測プログラム
CN111258593A (zh) * 2020-01-08 2020-06-09 恒安嘉新(北京)科技股份公司 应用程序预测模型的建立方法、装置、存储介质及终端
CN111291936A (zh) * 2020-02-21 2020-06-16 北京金山安全软件有限公司 产品生命周期预估模型生成方法、装置及电子设备
CN111340605A (zh) * 2020-05-22 2020-06-26 支付宝(杭州)信息技术有限公司 训练用户行为预测模型、用户行为预测的方法和装置
CN111475392A (zh) * 2020-04-08 2020-07-31 北京字节跳动网络技术有限公司 生成预测信息的方法、装置、电子设备和计算机可读介质
CN111489003A (zh) * 2019-01-25 2020-08-04 华为技术有限公司 生命周期的预测方法及装置
CN111539512A (zh) * 2020-03-31 2020-08-14 北京三快在线科技有限公司 行为预测方法、装置、电子设备及可读存储介质
CN111542831A (zh) * 2017-12-04 2020-08-14 感知自动机股份有限公司 预测人类与车辆交互的系统和方法
CN111833110A (zh) * 2020-07-23 2020-10-27 北京思特奇信息技术股份有限公司 客户生命周期定位方法、装置、电子设备及存储介质
CN111882039A (zh) * 2020-07-28 2020-11-03 平安科技(深圳)有限公司 物理机销售数据预测方法、装置、计算机设备及存储介质
CN111949887A (zh) * 2020-08-31 2020-11-17 华东理工大学 物品推荐方法、装置及计算机可读存储介质
CN112070559A (zh) * 2020-09-17 2020-12-11 贝壳技术有限公司 状态获取方法和装置、电子设备和存储介质
CN112819520A (zh) * 2021-01-27 2021-05-18 北京思特奇信息技术股份有限公司 一种运营商客户生命周期计算方法及系统
CN113269370A (zh) * 2021-06-18 2021-08-17 腾讯科技(成都)有限公司 一种活跃用户预测方法、装置、电子设备及可读存储介质
CN113626705A (zh) * 2021-08-10 2021-11-09 广州虎牙科技有限公司 用户留存分析方法、装置、电子设备和存储介质
WO2023203963A1 (ja) * 2022-04-20 2023-10-26 Toto株式会社 女性ライフステージ予測方法、女性ライフステージ予測プログラム及び女性ライフステージ予測システム

Patent Citations (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9462313B1 (en) * 2012-08-31 2016-10-04 Google Inc. Prediction of media selection consumption using analysis of user behavior
US10325285B1 (en) * 2013-06-28 2019-06-18 Groupon, Inc. Predictive recommendation system
US9710767B1 (en) * 2013-12-20 2017-07-18 EMC IP Holding Company LLC Data science project automated outcome prediction
CN104759100A (zh) * 2015-03-23 2015-07-08 小米科技有限责任公司 游戏生命周期的预测方法、装置及游戏运营商服务器
CN104794635A (zh) * 2015-04-17 2015-07-22 南京大学 基于协同过滤推荐算法的机型推荐系统
WO2016203652A1 (ja) * 2015-06-19 2016-12-22 株式会社Ubic データ分析に係るシステム、制御方法、制御プログラム、および、その記録媒体
CN108369665A (zh) * 2015-12-10 2018-08-03 爱维士软件有限责任公司 (移动)应用程序使用流失的预测
CN106960354A (zh) * 2016-01-11 2017-07-18 中国移动通信集团河北有限公司 一种基于客户生命周期的精准化推荐方法及装置
CN106203679A (zh) * 2016-06-27 2016-12-07 武汉斗鱼网络科技有限公司 一种用户流失预测方法及系统
CN106250403A (zh) * 2016-07-19 2016-12-21 北京奇艺世纪科技有限公司 用户流失预测方法及装置
US20180174224A1 (en) * 2016-12-20 2018-06-21 Wal-Mart Stores, Inc. Vector-based characterizations of products and individuals with respect to personal partialities
CN106951611A (zh) * 2017-03-07 2017-07-14 哈尔滨工业大学 一种基于使用者行为的严寒地区建筑节能设计优化方法
CN108572984A (zh) * 2017-03-13 2018-09-25 阿里巴巴集团控股有限公司 一种实时用户兴趣识别方法及装置
CN107566358A (zh) * 2017-08-25 2018-01-09 腾讯科技(深圳)有限公司 一种风险预警提示方法、装置、介质及设备
CN109784959A (zh) * 2017-11-10 2019-05-21 广州腾讯科技有限公司 一种目标用户预测方法、装置、后台服务器及存储介质
CN107944915A (zh) * 2017-11-21 2018-04-20 北京深极智能科技有限公司 一种游戏用户行为分析方法及计算机可读存储介质
CN111542831A (zh) * 2017-12-04 2020-08-14 感知自动机股份有限公司 预测人类与车辆交互的系统和方法
CN107832581A (zh) * 2017-12-15 2018-03-23 百度在线网络技术(北京)有限公司 状态预测方法和装置
CN109979190A (zh) * 2017-12-27 2019-07-05 中国移动通信集团公司 一种道路交通状态的预测方法及装置
CN108376028A (zh) * 2018-01-09 2018-08-07 北京大学 基于用户行为和系统状态预测移动设备电池续航的方法
CN108446350A (zh) * 2018-03-09 2018-08-24 华中科技大学 一种基于主题模型分析与用户长短兴趣的推荐方法
CN108596652A (zh) * 2018-03-28 2018-09-28 麒麟合盛网络技术股份有限公司 活跃用户数预测方法及装置
CN108537587A (zh) * 2018-04-03 2018-09-14 广州优视网络科技有限公司 流失用户预警方法、装置、计算机可读存储介质和服务器
CN108648000A (zh) * 2018-04-24 2018-10-12 腾讯科技(深圳)有限公司 对用户留存生命周期进行评估的方法及装置、电子设备
CN109034861A (zh) * 2018-06-04 2018-12-18 挖财网络技术有限公司 基于移动端日志行为数据的用户流失预测方法及装置
CN109087124A (zh) * 2018-07-02 2018-12-25 麒麟合盛网络技术股份有限公司 一种应用程序价值预测方法及装置
JP2020071680A (ja) * 2018-10-31 2020-05-07 ヤフー株式会社 予測装置、予測方法、及び予測プログラム
CN109409963A (zh) * 2018-11-12 2019-03-01 平安科技(深圳)有限公司 客户生命周期的预测方法及装置、存储介质、计算机设备
CN109543107A (zh) * 2018-11-21 2019-03-29 网易无尾熊(杭州)科技有限公司 数据处理方法、介质、装置和计算设备
CN109507535A (zh) * 2018-12-10 2019-03-22 国网河南省电力公司电力科学研究院 变电站接地网运行阶段及运行寿命预测方法及装置
CN110032750A (zh) * 2018-12-18 2019-07-19 阿里巴巴集团控股有限公司 一种模型构建、数据生命周期预测方法、装置及设备
CN109729376A (zh) * 2019-01-02 2019-05-07 广州虎牙信息科技有限公司 一种生命周期的处理方法、装置、设备和存储介质
CN109754290A (zh) * 2019-01-15 2019-05-14 网易(杭州)网络有限公司 一种游戏数据的处理方法和装置
CN111489003A (zh) * 2019-01-25 2020-08-04 华为技术有限公司 生命周期的预测方法及装置
CN110197389A (zh) * 2019-03-04 2019-09-03 腾讯科技(深圳)有限公司 一种用户识别方法及装置
CN110148011A (zh) * 2019-04-15 2019-08-20 平安科技(深圳)有限公司 基于大数据的活跃量下降分析方法、装置、设备及介质
CN110322281A (zh) * 2019-06-06 2019-10-11 阿里巴巴集团控股有限公司 相似用户的挖掘方法及装置
CN110795570A (zh) * 2019-10-11 2020-02-14 上海上湖信息技术有限公司 一种用户时序行为特征提取方法及装置
CN110781407A (zh) * 2019-10-21 2020-02-11 腾讯科技(深圳)有限公司 用户标签生成方法、装置及计算机可读存储介质
CN110888945A (zh) * 2019-11-28 2020-03-17 上海风秩科技有限公司 用户行为预测方法、装置、电子设备及存储介质
CN110991875A (zh) * 2019-11-29 2020-04-10 广州市百果园信息技术有限公司 一种平台用户质量评估系统
CN111258593A (zh) * 2020-01-08 2020-06-09 恒安嘉新(北京)科技股份公司 应用程序预测模型的建立方法、装置、存储介质及终端
CN111291936A (zh) * 2020-02-21 2020-06-16 北京金山安全软件有限公司 产品生命周期预估模型生成方法、装置及电子设备
CN111539512A (zh) * 2020-03-31 2020-08-14 北京三快在线科技有限公司 行为预测方法、装置、电子设备及可读存储介质
CN111475392A (zh) * 2020-04-08 2020-07-31 北京字节跳动网络技术有限公司 生成预测信息的方法、装置、电子设备和计算机可读介质
CN111340605A (zh) * 2020-05-22 2020-06-26 支付宝(杭州)信息技术有限公司 训练用户行为预测模型、用户行为预测的方法和装置
CN111833110A (zh) * 2020-07-23 2020-10-27 北京思特奇信息技术股份有限公司 客户生命周期定位方法、装置、电子设备及存储介质
CN111882039A (zh) * 2020-07-28 2020-11-03 平安科技(深圳)有限公司 物理机销售数据预测方法、装置、计算机设备及存储介质
CN111949887A (zh) * 2020-08-31 2020-11-17 华东理工大学 物品推荐方法、装置及计算机可读存储介质
CN112070559A (zh) * 2020-09-17 2020-12-11 贝壳技术有限公司 状态获取方法和装置、电子设备和存储介质
CN112819520A (zh) * 2021-01-27 2021-05-18 北京思特奇信息技术股份有限公司 一种运营商客户生命周期计算方法及系统
CN113269370A (zh) * 2021-06-18 2021-08-17 腾讯科技(成都)有限公司 一种活跃用户预测方法、装置、电子设备及可读存储介质
CN113626705A (zh) * 2021-08-10 2021-11-09 广州虎牙科技有限公司 用户留存分析方法、装置、电子设备和存储介质
WO2023203963A1 (ja) * 2022-04-20 2023-10-26 Toto株式会社 女性ライフステージ予測方法、女性ライフステージ予測プログラム及び女性ライフステージ予測システム

Non-Patent Citations (10)

* Cited by examiner, † Cited by third party
Title
人人都是产品经理社区: "客户生命周期管理 从阿里88VIP会员卡说起,产品经理需要学习的5个客户模型", Retrieved from the Internet <URL:https://www.163.com/dy/article/DPTPC7QU0511805E.html> *
刘晴;王建平;: "基于BIM技术的建设工程生命周期管理研究", 土木建筑工程信息技术, no. 03, 15 September 2010 (2010-09-15) *
姚雨虹;杨小兵;: "基于多指标加权分析的航空客户价值预测模型", 中国计量大学学报, no. 01, 15 March 2020 (2020-03-15) *
曹裕;陈晓红;王傅强;: "我国上市公司生命周期划分方法实证比较研究", 系统管理学报, no. 03, 15 June 2010 (2010-06-15) *
李佳琪;刘红岩;何军;王蓓;杜小勇;: "应用商城中用户年龄的推断及在推荐中的应用", 计算机科学与探索, no. 11, 2 April 2018 (2018-04-02) *
舒文丽;卓可秋;: "IPTV中基于使用体验的用户流失预测和挽留方法", 信息通信, no. 08, 15 August 2020 (2020-08-15) *
蓝娅萍;: "信息生态理论视角下移动社交媒体使用行为生命周期画像研究", 情报探索, no. 12, 15 December 2019 (2019-12-15) *
谢建中;杨育;陈倩;李斐;: "基于改进BASS模型的短生命周期产品需求预测模型", 计算机集成制造系统, no. 01, 15 January 2015 (2015-01-15) *
赵宏田: "用户画像:方法论与工程化解决方案", 31 October 2019, 机械工业出版社, pages: 114 *
陈俊宇;王濛;周刚;: "微博用户行为活跃度的衰减窗口分析方法", 中原工学院学报, no. 04, 25 August 2013 (2013-08-25) *

Similar Documents

Publication Publication Date Title
CN111729305B (zh) 地图场景预加载方法、模型训练方法、设备及存储介质
CN110377804A (zh) 培训课程数据的推送方法、装置、系统及存储介质
CN111222305A (zh) 一种信息结构化方法和装置
CN111198970A (zh) 一种匹配简历方法、装置、电子设备及存储介质
CN109767045A (zh) 一种流失用户的预测方法、装置、计算设备及介质
CN111858898A (zh) 基于人工智能的文本处理方法、装置及电子设备
CN111199469A (zh) 用户还款模型生成方法、装置及电子设备
CN111563158A (zh) 文本排序方法、排序装置、服务器和计算机可读存储介质
CN117520503A (zh) 基于llm模型的金融客服对话生成方法、装置、设备及介质
CN116703682B (zh) 一种基于深度学习的政务数据平台
CN115982646B (zh) 一种基于云平台的多源测试数据的管理方法及系统
CN114742569A (zh) 用户生命阶段预测方法、装置、计算机设备及存储介质
CN113742495B (zh) 基于预测模型的评级特征权重确定方法及装置、电子设备
CN113343713A (zh) 意图识别方法、装置、计算机设备及存储介质
CN113298353A (zh) 一种基于用户生存模型的资源调整方法、装置和系统
CN112905792A (zh) 基于非文本场景的文本聚类方法、装置、设备及存储介质
CN111523681A (zh) 全局特征重要性表征方法、装置、电子设备和存储介质
CN111597453A (zh) 用户画像方法、装置、计算机设备及计算机可读存储介质
CN112465035B (zh) 物流配送任务分配方法、系统、设备及存储介质
CN117235629B (zh) 一种基于知识域检测的意图识别方法、系统及计算机设备
CN116702775B (zh) 文本处理方法、文本处理装置及计算机可读存储介质
CN112364642B (zh) 一种文本处理方法及装置
CN116841650B (zh) 样本构建方法、装置、设备以及存储介质
CN114648019A (zh) 事件关系识别方法、装置、计算机设备以及存储介质
CN114513578A (zh) 外呼方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination