CN109784959B - 一种目标用户预测方法、装置、后台服务器及存储介质 - Google Patents

一种目标用户预测方法、装置、后台服务器及存储介质 Download PDF

Info

Publication number
CN109784959B
CN109784959B CN201711105506.9A CN201711105506A CN109784959B CN 109784959 B CN109784959 B CN 109784959B CN 201711105506 A CN201711105506 A CN 201711105506A CN 109784959 B CN109784959 B CN 109784959B
Authority
CN
China
Prior art keywords
user
application
sample
target
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711105506.9A
Other languages
English (en)
Other versions
CN109784959A (zh
Inventor
王星雅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Tencent Technology Co Ltd
Original Assignee
Guangzhou Tencent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Tencent Technology Co Ltd filed Critical Guangzhou Tencent Technology Co Ltd
Priority to CN201711105506.9A priority Critical patent/CN109784959B/zh
Publication of CN109784959A publication Critical patent/CN109784959A/zh
Application granted granted Critical
Publication of CN109784959B publication Critical patent/CN109784959B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供一种目标用户预测方法、装置、后台服务器及存储介质,该方法包括:确定待测用户的用户特征,所述用户特征至少包括:待测用户的用户画像数据,待测用户及好友分别在多个第一类型应用的各第一类型应用的行为特征,待测用户在至少一个非第一类型应用的行为特征;根据待测用户的用户特征与目标第一类型应用的应用特征,生成待测用户的预测特征;将待测用户的预测特征输入预构建的目标用户预测模型,通过所述目标用户预测模型预测得到待测用户为目标第一类型应用的目标用户的概率。本发明实施例可提升目标用户的预测准确性,并且实现目标用户的及时预测和不同第一类型应用的目标用户的预测。

Description

一种目标用户预测方法、装置、后台服务器及存储介质
技术领域
本发明涉及数据处理技术领域,具体涉及一种目标用户预测方法、装置、后台服务器及存储介质。
背景技术
应用(如游戏、网络购物等应用)的流失用户预测和潜在用户预测,对于延长应用的生命周期具有重要意义。其中,应用的流失用户是指曾经使用过应用,但由于对应用失去兴趣等原因,不再使用应用的用户;对应用的流失用户进行预测,可以合理的规划应用运营,以挽留即将流失的用户,延长应用的生命周期。应用的潜在用户是指未使用过应用,但可能对应用感兴趣的用户;对应用的潜在用户进行预测,可以针对潜在用户进行精准的应用推荐,增加应用的使用人数,对延长应用的生命周期具有重要意义。
此处可称应用的流失用户或潜在用户为应用的目标用户,可见对应用的目标用户进行准确的预测,对于延长应用的生命周期具有重要意义。然而,目前应用的目标用户预测方式,判定应用的目标用户的因素较为单一,存在应用的目标用户的预测准确性较低的问题;因此,如何改进应用的目标用户预测方法,以提高应用的目标用户的预测准确性,成为了本领域技术人员需要考虑的问题。
发明内容
有鉴于此,本发明实施例提供一种目标用户预测方法、装置、后台服务器及存储介质,以提高应用的目标用户的预测准确性。
为实现上述目的,本发明实施例提供如下技术方案:
一种目标用户预测方法,包括:
确定待测用户的用户特征,所述用户特征至少包括:待测用户的用户画像数据,待测用户及待测用户的好友分别在多个第一类型应用的各第一类型应用的行为特征,待测用户在至少一个非第一类型应用的行为特征;
根据待测用户的用户特征与目标第一类型应用的应用特征,生成待测用户的预测特征;目标第一类型应用为所述多个第一类型应用的任一第一类型应用;
将待测用户的预测特征输入预构建的目标用户预测模型,通过所述目标用户预测模型预测得到待测用户为目标第一类型应用的目标用户的概率。
本发明实施例还提供一种目标用户预测装置,包括:
用户特征确定模块,用于确定待测用户的用户特征,所述用户特征至少包括:待测用户的用户画像数据,待测用户及待测用户的好友分别在多个第一类型应用的各第一类型应用的行为特征,待测用户在至少一个非第一类型应用的行为特征;
预测特征确定模块,用于根据待测用户的用户特征与目标第一类型应用的应用特征,生成待测用户的预测特征;目标第一类型应用为所述多个第一类型应用的任一第一类型应用;
目标用户概率确定模块,用于将待测用户的预测特征输入预构建的目标用户预测模型,通过所述目标用户预测模型预测得到待测用户为目标第一类型应用的目标用户的概率。
本发明实施例还提供一种后台服务器,包括:至少一个存储器和至少一个处理器;所述存储器存储有程序,所述处理器调用所述存储器存储的程序,所述程序用于:
确定待测用户的用户特征,所述用户特征至少包括:待测用户的用户画像数据,待测用户及待测用户的好友分别在多个第一类型应用的各第一类型应用的行为特征,待测用户在至少一个非第一类型应用的行为特征;
根据待测用户的用户特征与目标第一类型应用的应用特征,生成待测用户的预测特征;目标第一类型应用为所述多个第一类型应用的任一第一类型应用;
将待测用户的预测特征输入预构建的目标用户预测模型,通过所述目标用户预测模型预测得到待测用户为目标第一类型应用的目标用户的概率。
本发明实施例还提供一种存储介质,所述存储介质存储有适于处理器执行的程序,所述程序用于:
确定待测用户的用户特征,所述用户特征至少包括:待测用户的用户画像数据,待测用户及待测用户的好友分别在多个第一类型应用的各第一类型应用的行为特征,待测用户在至少一个非第一类型应用的行为特征;
根据待测用户的用户特征与目标第一类型应用的应用特征,生成待测用户的预测特征;目标第一类型应用为所述多个第一类型应用的任一第一类型应用;
将待测用户的预测特征输入预构建的目标用户预测模型,通过所述目标用户预测模型预测得到待测用户为目标第一类型应用的目标用户的概率。
基于上述技术方案,本发明实施例提供的目标用户预测方法,可预先构建目标用户预测模型,在判断待测用户是否为目标第一类型应用的目标用户时,可引入待测用户的用户画像数据、待测用户及好友分别在各第一类型应用的行为特征,以及待测用户在非第一类型应用的行为特征,来确定待测用户的用户特征;然后根据待测用户的用户特征与目标第一类型应用的应用特征,生成用于预测待测用户是否为目标第一类型应用的目标用户的预测特征,使得预测特征所涉及的判定目标用户的因素更为全面;后续,将待测用户的预测特征,输入预构建的目标用户预测模型,通过目标用户预测模型的处理,可得到待测用户为目标第一类型应用的目标用户的概率,从而基于判定目标用户的因素更为全面的预测特征,实现更为准确的待测用户为目标第一类型应用中的目标用户的概率的确定,提升了目标用户的预测准确性;
并且,基于本发明实施例提供的目标用户预测方法,可通过收集任一用户的用户特征,实现目标用户的及时预测;另外,通过替换应用特征,可实现待测用户在不同第一类型应用中是否属于目标用户的预测,实现不同第一类型应用的目标用户的预测。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的目标用户预测系统的结构框图;
图2为本发明实施例提供的目标用户预测方法的流程图;
图3为目标用户预测方法的处理示意图;
图4为本发明实施例提供的构建流失用户预测模型的方法流程图;
图5为本发明实施例提供的构建潜在用户预测模型的方法流程图;
图6为目标用户预测模型的构建示意图;
图7为本发明实施例提供的构建目标用户预测模型的方法流程图;
图8为目标用户预测模型的另一构建示意图;
图9为本发明实施例提供的目标用户预测方法的另一流程图;
图10为目标用户预测方法的另一处理示意图;
图11为本发明实施例提供的目标用户预测系统的另一结构框图;
图12为本发明实施例提供的目标用户预测装置的结构框图;
图13为本发明实施例提供的目标用户预测装置的另一结构框图;
图14为后台服务器的硬件结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的目标用户预测系统的结构框图,本发明实施例提供的目标用户预测方法可基于图1所示系统实施,参照图1,该系统可以包括:后台服务器1,多个第一类型应用的应用服务器2,至少一个非第一类型应用的应用服务器3;
可选的,多个第一类型应用可以属于第一类型应用平台,即第一类型应用平台为多个第一类型应用所属的应用平台,该多个第一类型应用的应用类型均为第一类型,每一第一类型应用均对应有提供服务的应用服务器;如图1所示,多个第一类型应用的应用服务器2如:第一类型应用21的应用服务器,第一类型应用22的应用服务器等,每一第一类型应用均对应有应用服务器;
在本发明实施例中,对于同一用户而言,用户可使用同一账号登录各第一类型应用;如用户可使用社交账号登录各第一类型应用;
可选的,作为一种示例,第一类型应用可以是游戏应用(即第一类型为游戏);若多个第一类型应用属于第一类型应用平台,则第一类型应用平台可以是游戏平台,游戏平台下具有多款游戏应用,每一游戏应用均对应有各自的游戏服务器,且用户可通过社交账号登录游戏平台下的各款游戏应用。
至少一个非第一类型应用的应用服务器3可以包括:应用类型不为第一类型的至少一个应用的应用服务器;如图1所示,至少一个非第一类型应用的应用服务器3可以包括:第二类型应用31的应用服务器,第三类型应用32的应用服务器等;第二类型和第三类型不同,且第二类型和第三类型均与第一类型不同;
在本发明实施例中,对于同一用户而言,用户可使用同一账号登录各第一类型应用,也可使用该同一账号登录该至少一个非第一类型应用;例如,用户可使用社交账号登录各第一类型应用,也可使用社交账号登录该至少一个非第一类型应用;
可选的,作为一种示例,第一类型应用可以是游戏应用,至少一个非第一类型应用可以如社交应用,第三方支付应用,阅读应用等非游戏应用;相应的,至少一个非第一类型应用的应用服务器3可以如,社交应用的应用服务器,第三方支付应用的应用服务器等;
可选的,在本发明实施例中,用户也可通过社交账号登录社交应用、第三方支付应用,阅读应用等;即本发明实施例中,各第一类型应用和各非第一类型应用均可支持社交账号登录机制。
后台服务器为本发明实施例设置的用于进行应用的目标用户预测的服务设备;具体的,后台服务器可与多个第一类型应用的应用服务器2,至少一个非第一类型应用的应用服务器3进行数据交互,对各第一类型应用的目标用户进行预测;可选的,若多个第一类型应用属于第一类型应用平台,则后台服务器可通过与第一类型应用平台进行数据交互,实现与多个第一类型应用的应用服务器的数据交互。
基于图1所示系统,本发明实施例可实现待测用户是否为目标第一类型应用的目标用户的预测,其中,目标第一类型应用可以为任一第一类型应用,待测用户为目标第一类型应用中需判断是否为目标用户的用户;
可选的,图2示出了本发明实施例提供的目标用户预测方法的流程图,该方法可应用于后台服务器,参照图2,目标用户预测方法的流程可以包括:
步骤S100、确定待测用户的用户特征,所述用户特征至少包括:待测用户的用户画像数据,待测用户及待测用户的好友分别在多个第一类型应用的各第一类型应用的行为特征,待测用户在至少一个非第一类型应用的行为特征。
在指定待测用户后,后台服务器可至少进行如下信息的收集,实现待测用户的用户特征的确定:
待测用户的用户画像数据;用户画像数据可包括用户基本的年龄、性别、注册第一类型应用平台的累计时长、地理位置等个人信息;
待测用户在多个第一类型应用的每一第一类型应用的行为特征(可选的,若多个第一类型应用属于第一类型应用平台,则可收集待测用户在第一类型应用平台下的每一第一类型应用的行为特征);作为一种示例,以第一类型应用为游戏应用为例,可收集待测用户在游戏平台下的每一游戏应用的游戏时长、付费金额,礼包领取,活动点击等行为数据;可选的,待测用户在每一第一类型应用的行为特征可按时序统计提取,如依时序的提取待测用户在每一第一类型应用的行为特征,以分别提取出待测用户最近一年、最近半年、最近一月、最近两周、及最近一周在每一第一类型应用的行为特征等;相应的,本发明实施例可依时序的提取待测用户在每一第一类型应用的行为特征,将提取的行为特征加入到待测用户的用户特征中;
这里需要说明的是,目标第一类型应用包含于该多个第一类型应用中,所收集的待测用户在每一第一类型应用的行为特征可包含,待测用户在目标第一类型应用的行为特征;如果目标用户为流失用户,则所收集的待测用户在目标第一类型应用的行为特征不为空(即具有具体的数据);而如果目标用户为潜在用户,由于潜在用户还未使用过目标第一类型应用,因此所收集的待测用户在目标第一类型应用的行为特征为空;
待测用户的好友在每一第一类型应用的行为特征;作为一种示例,以第一类型应用为游戏应用为例,可收集待测用户的好友在游戏平台下的每一游戏应用的游戏时长、付费金额,礼包领取,活动点击等行为数据;可选的,此处的待测用户的好友在每一第一类型应用的行为特征的内容形式,可与上文的待测用户在每一第一类型应用的行为特征的内容形式相一致;可选的,待测用户的好友可以认为是,待测用户的社交好友,即在社交应用中待测用户的好友;
待测用户在至少一个非第一类型应用的行为特征;作为一种示例,可收集待测用户在社交应用的社交行为,在第三方支付应用的支付行为,在阅读应用的阅读行为等。
步骤S110、根据待测用户的用户特征与目标第一类型应用的应用特征,生成待测用户的预测特征。
可选的,目标第一类型应用可以认为是,第一类型应用平台下的任一需预测目标用户的第一类型应用;目标第一类型应用的应用特征可以包括:应用ID、在第一类型中所属的类别、应用上线时间、发行商、应用大小等刻画应用属性的数据;
可选的,若目标用户为流失用户,则应用特征中还可以加入应用月活跃人数、应用的月用户流失率等数据;可选的,应用的月用户流失率可基于应用的历史数据实现,如通过统计历史时间应用的目标用户数,得出应用的月用户流失率;可选的,第一类型中可进一步细分类别,如游戏可进一步细分休闲游戏、竞技游戏等,应用在第一类型中所属的类别可以认为是,应用在第一类型的细分类别中所属的类别;
可选的,若目标用户为潜在用户,则应用特征中还可以加入应用月转化用户数等,当然也可添加应用月活跃人数、应用的月用户流失率等数据。
可选的,作为一种可选实现,本发明实施例可将待测用户的用户特征与目标第一类型应用的应用特征相拼接,生成待测用户的预测特征;即在确定待测用户的用户特征,目标第一类型应用的应用特征后,可将待测用户的用户特征与目标第一类型应用的应用特征相拼接,得到待测用户的预测特征;若设U为待测用户的预测特征,则U={待测用户的用户特征+目标第一类型应用的应用特征},即将待测用户的用户特征与目标第一类型应用的应用特征相叠加;
可选的,作为另一种可选实现,由于对于第一类型应用平台中的不同第一类型应用,同一用户的用户特征是不变的(即对于同一用户而言,该用户在不同的第一类型应用的用户特征均是至少由该用户的用户画像数据,该用户及该用户的好友分别在每一第一类型应用的行为特征,该用户在至少一个非第一类型应用的行为特征构成),因此对于不同的第一类型应用,同一用户的用户特征并无法体现出不同应用的差异;
基于此,本发明实施例可对待测用户的用户特征进行进一步的处理,以突显出待测用户的用户特征在目标第一类型应用上,相比于其他第一类型应用的差异,将处理后的待测用户的用户特征与目标第一类型应用的应用特征相拼接,得到待测用户的预测特征。
步骤S120、将待测用户的预测特征输入预构建的目标用户预测模型,通过所述目标用户预测模型预测得到待测用户为目标第一类型应用的目标用户的概率。
本发明实施例可预先构建出目标用户预测模型,通过目标用户预测模型可实现某一用户是否为第一类型应用平台下的任一第一类型应用的目标用户的预测。
可选的,如果目标用户为应用的流失用户,则可预先构建流失用户预测模型(目标用户预测模型的一种形式),如果目标用户为应用的潜在用户,则可预先构建潜在用户预测模型(目标用户预测模型的另一种形式);这里需要说明的是,流失用户预测模型和潜在用户预测模型所基于的训练样本是不同的;
若进行流失用户预测模型的训练,则训练所使用的正样本用户为应用的流失用户,负样本用户为应用的非流失用户;可选的,某一应用的流失用户和非流失用户可通过应用的历史数据进行记录;
若进行潜在用户预测模型的训练,则训练所使用的正样本用户为应用的转化用户,负样本用户为应用的未转化用户,这里应用的转化用户是指经应用推荐等营销手段,由未使用应用转化为使用应用的用户;应用的未转化用户是指经应用推荐等营销手段,仍然未使用应用的用户;可选的,某一应用的转化用户和未转化用户可通过应用的历史数据进行记录;
无论目标用户是流失用户还是潜在用户,在确定各第一类型应用的正样本用户和负样本用户,得到各第一类型应用的样本用户后;可选的,目标用户预测模型可至少根据各第一类型应用分别相应的各样本用户的训练特征构建;对于某一第一类型应用而言,该第一类型应用的某一样本用户的训练特征可根据,该样本用户的样本特征和该第一类型应用的应用特征确定;且样本特征至少包括:该样本用户的用户画像数据,该样本用户及该样本用户的好友分别在每一第一类型应用的行为特征,该样本用户在至少一个非第一类型应用的行为特征等。
本发明实施例提供的目标用户预测方法包括:确定待测用户的用户特征,所述用户特征包括:待测用户的用户画像数据,待测用户及待测用户的好友分别在多个第一类型应用的各第一类型应用的行为特征,待测用户在至少一个非第一类型应用的行为特征;根据待测用户的用户特征与目标第一类型应用的应用特征,生成待测用户的预测特征;将待测用户的预测特征,输入预构建的目标用户预测模型,得到待测用户在目标第一类型应用中属于目标用户的概率。
本发明实施例提供的目标用户预测方法,可预先构建目标用户预测模型,在判断待测用户是否为目标第一类型应用的目标用户时,可引入待测用户的用户画像数据、待测用户及好友分别在各第一类型应用的行为特征,以及待测用户在非第一类型应用的行为特征,来确定待测用户的用户特征;然后根据待测用户的用户特征与目标第一类型应用的应用特征,生成用于预测待测用户是否为目标第一类型应用的目标用户的预测特征,使得预测特征所涉及的判定目标用户的因素更为全面;后续,将待测用户的预测特征,输入预构建的目标用户预测模型,通过目标用户预测模型的处理,可得到待测用户为目标第一类型应用的目标用户的概率,从而基于判定目标用户的因素更为全面的预测特征,实现更为准确的待测用户为目标第一类型应用中的目标用户的概率的确定,提升了目标用户的预测准确性;
可见,本发明实施例提供的目标用户预测方法,判定目标用户的因素除使用待测用户的自身特征和在第一类型应用的行为外,还可结合好友在第一类型应用的行为,和待测用户在非第一类型应用的行为;从而结合好友行为对待测用户行为的影响,以及,待测用户在非第一类型应用的行为,对在第一类型应用的行为的影响,使得判定目标用户的因素更为全面、准确,提升了后续目标用户的预测准确性。
并且,基于本发明实施例提供的目标用户预测方法,可通过收集任一用户的用户特征,实现目标用户的及时预测;另外,通过替换应用特征,可实现待测用户在不同第一类型应用中是否属于目标用户的预测,实现不同第一类型应用的目标用户的预测。
可选的,图3示出了目标用户预测方法的一种可选处理示意图,如图3所示:
对于待测用户,可确定待测用户的用户画像数据,待测用户在每一第一类型应用的行为特征,待测用户的好友在每一第一类型应用的行为特征,待测用户在至少一个非第一类型应用的行为特征,得到待测用户的用户特征;
将待测用户的用户特征,与目标第一类型应用的应用特征相拼接,得到待测用户的预测特征;
将待测用户的预测特征输入预先构建的目标用户预测模型,由目标用户预测模型输出待测用户为目标第一类型应用的目标用户的概率。
图3所示方法可实现待测用户是否为目标第一类型应用中的流失用户,或潜在用户的预测;只不过在进行待测用户是否为目标第一类型应用中的流失用户的预测时,所使用的目标用户预测模型为流失用户预测模型,且待测用户在目标第一类型应用的行为特征不为空;
在进行待测用户是否为目标第一类型应用中的潜在用户的预测时,所使用的目标用户预测模型为潜在用户预测模型,且待测用户在目标第一类型应用的行为特征为空;此时通过结合待测用户的好友在目标第一类型应用的行为,对待测用户使用目标第一类型应用的影响,以及,待测用户在其他应用类型相同的第一类型应用的行为和非第一类型应用的行为,对待测用户使用目标第一类型应用的影响,可预测出待测用户转化为目标第一类型应用的用户的可能,实现准确的潜在用户的预测。
以目标用户为流失用户为例,所构建的目标用户预测模型为流失用户预测模型;相应的,为实现流失用户的预测,本发明实施例可预先构建流失用户预测模型,通过流失用户预测模型来实现某一用户是否为任一第一类型应用的流失用户的预测,如实现某一用户是否为第一类型应用平台下的任一第一类型应用的流失用户的预测;
可选的,本发明实施例构建流失用户预测模型的过程可如图4所示,图4示出了本发明实施例提供的构建流失用户预测模型的方法流程,该方法可应用于后台服务器,参照图4,构建流失用户预测模型的方法流程可以包括:
步骤S200、分别确定各第一类型应用的正样本用户和负样本用户,得到各第一类型应用的样本用户,其中,正样本用户为流失用户,负样本用户为非流失用户。
可选的,如对于第一类型应用平台下的每一第一类型应用,本发明实施例可分别确定出正样本用户和负样本用户,得到各第一类型应用的样本用户;即对于第一类型应用平台下的任一第一类型应用,本发明实施例所确定的该第一类型应用的样本用户包括了,该第一类型应用的正样本用户和负样本用户;
在本发明实施例中,对于第一类型应用平台下的某一第一类型应用,可基于该第一类型应用的历史数据,确定出该第一类型应用的流失用户,得到该第一类型应用的正样本用户(数量为多个),确定出该第一类型应用的非流失用户,得到该第一类型应用的负样本用户(数量为多个),从而得到该第一类型应用的样本用户;进而对于每一第一类型应用,均确定出流失用户和非流失用户,则可得到各第一类型应用的样本用户。
可选的,作为一种可选实现,本发明实施例可选取连续的两个时间段(如选取两个时间上连续的时间窗),该连续的两个时间段可分为第一时间段和第二时间段,则对于第一类型应用平台下的任一第一类型应用,正样本用户可以认为是该第一类型应用的用户中,在第一时间段活跃但在第二时间段不活跃的用户,负样本用户可以认为是该第一类型应用的用户中,在第一时间段和第二时间段均活跃的用户;
可选的,对于任一第一类型应用,判断一个用户在一个时间段内是否活跃,可通过判断该用户在该时间段内使用该第一类型应用的时长是否大于时长阈值确定,若是,则判断该用户在该时间段内活跃,若否,则判断该用户在该时间段内不活跃;
可选的,为保障流失用户预测模型的泛化性,样本用户的抽取可根据第一时间段和第二时间段的活跃时长依照条件分段按比例抽取,使得正样本用户在第一时间段和第二时间段的抽取数量比例,与第一时间段和第二时间段的真实流失用户数量的比例相对应,负样本用户在第一时间段和第二时间段的抽取数量比例,与第一时间段和第二时间段的真实非流失用户数量的比例相应;例如,某一第一类型应用,9月份的活跃时长大于100小时,且流失的用户有200人,而10月份的活跃时长小于100小时,且流失的用户有100人,若对该第一类型应用抽取15人的正样本用户,则可在大于100小时的时间窗抽取10人,在小于100小时的时间窗抽取5人,保障后续模型训练时,正样本用户的分布与真实情况相对应;负样本用户的抽取同理。
需要说明的是,由于每一第一类型应用的具体情况不同,不同的第一类型应用所确定的正样本用户并不相同(如某一用户在某一第一类型应用中为流失用户,而在另一第一类型应用中为非流失用户),不同的第一类型应用所确定的负样本用户也并不相同(如某一用户在某一第一类型应用中为非流失用户,而在另一第一类型应用中为流失用户)。
步骤S210、分别确定各第一类型应用的各样本用户的样本特征。
可选的,对于某一第一类型应用,可对每一样本用户(包括该第一类型应用的正样本用户和负样本用户)至少进行如下信息的收集,得到该第一类型应用的每一样本用户的样本特征:
样本用户的用户画像数据,用户画像数据可包括用户基本的年龄、性别、注册第一类型应用平台的累计时长、地理位置等个人信息;
样本用户在每一第一类型应用(如第一类型应用平台下的每一第一类型应用)的行为特征;作为一种示例,以第一类型应用为游戏应用为例,可收集样本用户在游戏平台下的每一游戏应用的游戏时长、付费金额,礼包领取,活动点击等行为数据;
样本用户的好友在每一第一类型应用的行为特征;作为一种示例,以第一类型应用为游戏应用为例,可收集样本用户的好友在游戏平台下的每一游戏应用的游戏时长、付费金额,礼包领取,活动点击等行为数据;
样本用户在至少一个非第一类型应用的行为特征;作为一种示例,可收集样本用户在社交应用的社交行为,在第三方支付应用的支付行为,在阅读应用的阅读行为等。
即,对于某一第一类型应用而言,该第一类型应用的某一样本用户的样本特征可以包括:该样本用户的用户画像数据,该样本用户及好友分别在第一类型应用平台下的每一第一类型应用的行为特征,该样本用户在至少一个非第一类型应用的行为特征。
具体的,对于某一第一类型应用而言,针对每一正样本用户,所确定的样本特征可以包括:该正样本用户的用户画像数据,该正样本用户在第一类型应用平台下的每一第一类型应用的行为特征,该正样本用户的好友在第一类型应用平台下的每一第一类型应用的行为特征,该正样本用户在至少一个非第一类型应用的行为特征;
对于某一第一类型应用而言,针对每一负样本用户,所确定的样本特征可以包括:该负样本用户的用户画像数据,该负样本用户在第一类型应用平台下的每一第一类型应用的行为特征,该负样本用户的好友在第一类型应用平台下的每一第一类型应用的行为特征,该负样本用户在至少一个非第一类型应用的行为特征。
显然,对于某一第一类型应用而言,样本用户的样本特征的内容并不限于上述描述,还可在上述基础上增加其他维度的内容。
可选的,对于样本用户在第一类型应用平台下的每一第一类型应用的行为特征,本发明实施例可将每一样本用户的该行为特征按时序统计提取,如分别统计样本用户最近一年在每一第一类型应用的行为特征,样本用户最近半年在每一第一类型应用的行为特征,样本用户最近一月在每一第一类型应用的行为特征,样本用户最近两周在每一第一类型应用的行为特征,样本用户最近一周在每一第一类型应用的行为特征等。可选的,对于样本用户的好友在第一类型应用平台下的每一第一类型应用的行为特征,也可按此进行按时序的统计提取。
步骤S220、对于各第一类型应用,根据应用特征与各样本用户的样本特征,生成各第一类型应用的各样本用户的训练特征。
可选的,作为一种可选实现,在得到各第一类型应用的各样本用户的样本特征后(即对于第一类型应用平台下的每一第一类型应用,均确定了各样本用户的样本特征),则对于某一第一类型应用,可将该第一类型应用的应用特征,分别与该第一类型应用的各样本用户的样本特征相拼接,得到该第一类型应用的各样本用户的训练特征;从而对于第一类型应用平台下的每一第一类型应用均作此处理,可得到各第一类型应用的各样本用户的训练特征。
若对于某一第一类型应用,确定了该第一类型应用的某一样本用户的样本特征,则该第一类型应用的该样本用户的训练特征可以表示为:该样本用户的样本特征+该第一类型应用的应用特征。
可选的,作为另一种实现,为突显同一样本用户的样本特征在不同第一类型应用上的差异,本发明实施例可在各第一类型应用下,分别处理各样本用户的样本特征,得到各第一类型应用下处理后的各样本用户的样本特征,从而对于某一第一类型应用,将相应处理后的各样本用户的样本特征,与该第一类型应用的应用特征相拼接,得到该第一类型应用的各样本用户的训练特征。
需要注意的是,在本发明实施例中,待测用户的预测特征与样本用户的训练特征的内容形式基本相同,所不同的是,预测特征是用于进行输入预构建的流失用户预测模型,进行流失用户的预测;而训练特征是用于进行流失用户预测模型的训练。
步骤S230、将各第一类型应用的各样本用户的训练特征,作为神经网络的训练输入,训练得到流失用户预测模型。
可选的,本发明实施例可使用神经网络,以各第一类型应用的各样本用户的训练特征作为训练数据,训练得到流失用户预测模型;可选的,神经网络可以选用全连接神经网络(如MLP网络,MLP表示Multi-layer Perceptron,是多层感知器的意思),也可以选用其他形式的神经网络(如卷积神经网络、深度神经网络等);
可选的,本发明实施例可将各第一类型应用的各样本用户的训练特征,输入神经网络,利用反向传播梯度下降算法进行神经网络的参数更新,实现神经网络的迭代训练和收敛,得到流失用户预测模型;
可选的,本发明实施例可设置测试集(测试集中记录有预先确定的流失用户和非流失用户),以所训练的流失用户预测模型对测试集中的流失用户和非流失用户进行预测,通过反向传播梯度下降算法不断的迭代更新神经网络的参数。
可见,在构建流失用户预测模型时,本发明实施例对于每一第一类型应用的每一样本用户,可均引入用户画像数据、样本用户及好友在第一类型应用平台的各第一类型应用的行为特征、以及样本用户在非第一类型应用的行为特征,确定样本用户的样本特征;然后根据每一第一类型应用的每一样本用户的样本特征,与相应的第一类型应用的应用特征,生成各第一类型应用的各样本用户的训练特征;以各第一类型应用的各样本用户的训练特征,通过神经网络,实现流失用户预测模型的训练,使得流失用户预测模型的训练可基于更为全面的判定用户流失的因素的训练数据实现,提升所构建的流失用户预测模型的预测准确性。
需要说明的是,本发明实施例可将流失用户的预测看作是一个分类问题,即预测某一用户是否为某一第一类型应用的流失用户时,可认为是使用流失用户预测模型所进行的对该用户的分类处理;具体在预测该用户是否为某一第一类型应用的流失用户时,可将该用户的预测特征,导入流失用户预测模型,得出该用户为该第一类型应用的流失用户的概率,若所得出的概率高于概率阈值,则认为该用户在该第一类型应用中属于流失用户。
以目标用户为潜在用户为例,则所构建的用户预测模型可以为潜在用户预测模型;相应的,为实现潜在用户的预测,本发明实施例可预先构建潜在用户预测模型,通过潜在用户预测模型来实现某一用户是否为任一第一类型应用的潜在用户的预测;
这里需要说明的是,潜在用户预测模型的构建过程的原理,与图4所示流失用户预测模型的构建原理类似,只是潜在用户预测模型构建所使用的正样本用户与负样本用户,和流失用户预测模型所使用的正样本用户与负样本用户不同;
可选的,图5示出了本发明实施例提供的构建潜在用户预测模型的方法流程,该方法可应用于后台服务器,参照图5,该方法可以包括:
步骤S300、分别确定各第一类型应用的正样本用户和负样本用户,得到各第一类型应用的样本用户,其中,正样本用户为转化用户,负样本用户为未转化用户。
在进行潜在用户预测模型的构建时,本发明实施例可对于第一类型应用平台下的每一第一类型应用,分别确定出正样本用户和负样本用户,得到各第一类型应用的样本用户;即对于任一第一类型应用,本发明实施例可基于该第一类型应用的历史数据,确定出该第一类型应用的转化用户,得到该第一类型应用的正样本用户(数量为多个),确定出该第一类型应用的未转化用户,得到该第一类型应用的负样本用户(数量为多个),从而得到该第一类型应用的样本用户;进而对于每一第一类型应用,均确定出转化用户和未转化用户,可得到各第一类型应用的样本用户。
步骤S310、分别确定各第一类型应用的各样本用户的样本特征。
可选的,一样本用户的样本特征的内容形式可与步骤S210所示部分类似,可相互参照;
即对于某一第一类型应用,一样本用户(可能是正样本用户也可能是负样本用户)的样本特征可以包括:样本用户的用户画像数据,样本用户及其好友在每一第一类型应用的行为特征,样本用户在至少一个非第一类型应用的行为特征;
这里需要说明的是,对于某一第一类型应用的某一样本用户而言,该样本用户可能并非在所有的第一类型应用中均存在行为特征,因此该样本用户可能在一些第一类型应用中存在行为特征为空的情况,该样本用户的好友的情况类似。
步骤S320、对于各第一类型应用,根据应用特征与各样本用户的样本特征,生成各第一类型应用的各样本用户的训练特征。
可选的,步骤S320的处理可参照步骤S220部分所示。
步骤S330、将各第一类型应用的各样本用户的训练特征,作为神经网络的训练输入,训练得到潜在用户预测模型。
需要注意的是,在本发明实施例中,待测用户的预测特征与样本用户的训练特征的内容形式基本相同,所不同的是,预测特征是用于进行输入预构建的潜在用户预测模型,进行潜在用户的预测;而训练特征是用于进行潜在用户预测模型的训练。
可见,图4所示构建流失用户预测模型和图5所示构建潜在用户预测模型的原理是类似的,只是正、负样本用户的选取会根据所需构建的模型类型进行适应调整;作为归纳,目标用户预测模型(可能是流失用户预测模型,也可能是潜在用户预测模型)的构建过程,可如下述所示:
S1、分别确定各第一类型应用的正样本用户和负样本用户,得到各第一类型应用的样本用户。
其中,如果目标用户预测模型包括流失用户预测模型,则正样本用户为流失用户,负样本用户为非流失用户;如果目标用户预测模型包括潜在用户预测模型,则正样本用户为转化用户,负样本用户为未转化用户。
S2、分别确定各第一类型应用的各样本用户的样本特征。
S3、对于各第一类型应用,根据应用特征与各样本用户的样本特征,生成各第一类型应用的各样本用户的训练特征。
S4、将各第一类型应用的各样本用户的训练特征,作为神经网络的训练输入,训练得到目标用户预测模型。
可选的,在上述实现根据应用特征与各样本用户的样本特征,生成各第一类型应用的各样本用户的训练特征的过程中,对于任一第一类型应用,本发明实施例可将该第一类型应用的各样本用户的样本特征,分别与该第一类型应用的应用特征相拼接;作为一种可选示例,图6示出了目标用户预测模型的构建示意图,如图6所示:
对于第一类型应用平台下的某一第一类型应用,本发明实施例可确定出该第一类型应用的正样本用户和负样本用户;
针对该第一类型应用,分别确定出各正样本用户的样本特征和各负样本用户的样本特征;其中,一正样本用户的样本特征包括:该正样本用户的用户画像数据,该正样本用户在每一第一类型应用的行为特征,该正样本用户的好友在每一第一类型应用的行为特征,该正样本用户在至少一个非第一类型应用的行为特征;负样本用户的样本特征的内容与此同理;
进而,将该第一类型应用的各正样本用户的样本特征,分别与该第一类型应用的应用特征相拼接,将该第一类型应用的各负样本用户的样本特征,分别与该第一类型应用的应用特征相拼接,得到该第一类型应用的各样本用户的训练特征;
以上述方式分别对各第一类型应用进行处理,则可对得到各第一类型应用的各样本用户的训练特征;
将各第一类型应用的各样本用户的训练特征,输入到神经网络,利用反向传播梯度下降算法进行神经网络的参数更新,训练得到目标用户预测模型。
可以理解的是,在上述的目标用户预测模型的训练过程中,对于第一类型应用平台中的不同的第一类型应用,同一样本用户的样本特征是不变的(即对于同一样本用户而言,该样本用户在不同的第一类型应用的样本特征均是至少由该样本用户的用户画像数据,该样本用户及该样本用户的好友分别在每一第一类型应用的行为特征,该样本用户在至少一个非第一类型应用的行为特征构成),这使得所训练的目标用户预测模型并不能针对不同的第一类型应用取得很好的差异性;因此为体现目标用户预测模型对于不同的第一类型应用具有差异性的表现,使得目标用户预测模型对于同一用户,在面对不同的第一类型应用时有不同的预测结果,本发明实施例可进行样本用户的样本特征与应用的应用特征的交叉工作;
但若假设一个样本用户的样本特征为m维(即样本特征由m维度的向量构成),一个第一类型应用的应用特征为k维(即应用特征由k维度的向量构成),那么所进行的样本特征和应用特征的交叉工作,将涉及大量的特征交叉,工作量将极大;基于此,本发明的发明人考虑利用深度兴趣网络学习得到的样本特征与应用特征之间的兴趣关联,降低样本特征和应用特征的交叉工作的工作量,并以此改进目标用户预测模型的训练过程;
可选的,图7示出了本发明实施例提供的构建目标用户预测模型的方法流程,该方法可应用于后台服务器,图7所示方法可适用于流失用户预测模型的构建,也可适用于潜在用户预测模型的构建,只是在构建流失用户预测模型和潜在用户预测模型时,所使用的样本存在差异;
参照图7,该方法流程可以包括:
步骤S400、分别确定第一类型应用平台下的各第一类型应用的正样本用户和负样本用户,得到各第一类型应用的样本用户。
可选的,如果所构建的是流失用户预测模型,则正样本用户为流失用户,负样本用户为非流失用户;如果所构建的是潜在用户预测模型,则正样本用户为转化用户,负样本用户为未转化用户。
步骤S410、分别确定各第一类型应用的各样本用户的样本特征。
步骤S420、根据样本特征与应用特征的相关性参数,分别确定各第一类型应用的应用特征与相应的各样本用户的样本特征的相关性;对于各第一类型应用,以相应确定的相关性,处理相应的各样本用户的样本特征,得到各第一类型应用的各样本用户的相关样本特征。
可选的,样本特征与应用特征的相关性参数可利用深度兴趣网络学习得到;需要说明的是,在进行相关性的处理时,一开始所使用的相关性参数可以是初始化的相关性参数,后续经过模型训练,对相关性参数进行更新后,则可使用前次更新后的相关性参数进行当前次相关性的处理;这里模型训练需要经过多次的迭代,每一次迭代会得到相应更新后的相关性参数,则在当前次迭代所进行的相关性的处理时,可使用前次更新后的相关性参数进行当前次相关性的处理。
可选的,在本发明实施例中,样本特征、应用特征、相关性参数均可由多个维度的向量构成,且应用特征的向量维度数与相关性参数的向量维度数相同,即应用特征与相关性参数具有相同数量的维度,而样本特征的向量维度数与应用特征的向量维度数不一定相同;本发明实施例可利用深度兴趣网络,构建样本用户的样本特征和应用特征之间的兴趣关联,对于样本用户的样本特征的每一维度的向量,可通过深度兴趣网络学习确定出相关性参数相应的相关维度的向量,应用特征相应的相关维度的向量;深度兴趣网络可以认为是利用了兴趣信息的深度学习网络;
在本发明实施例中,对于某一第一类型应用的某一样本用户而言,本发明实施例可根据相关性参数,确定该第一类型应用的应用特征,与该第一类型应用的该样本用户的样本特征的相关性;以所确定的相关性,处理该样本用户的样本特征,得到该第一类型应用的该样本用户的相关样本特征;以此对各第一类型应用的各样本用户的样本特征进行处理,则可得到各第一类型应用的各样本用户的相关样本特征;可选的,具体实现过程可以如下:
分别针对该第一类型应用的该样本用户的样本特征的每一维度的向量,确定相关维度的应用特征的向量和相关性参数的向量;
对于该样本特征的每一维度的向量,将所确定的相关维度的应用特征的向量和相关性参数的向量相结合,得到样本特征的每一维度的向量相应的结合结果;至此,可根据相关性参数,确定该第一类型应用的应用特征,与该样本用户的样本特征的相关性;
将样本特征的每一维度的向量,分别与相应的结合结果相乘,得到每一维度的相关样本特征的向量,以每一维度的相关样本特征的向量形成该第一类型应用的该样本用户的相关样本特征。
从而对于各第一类型应用的各样本用户均进行上述方式的处理,则可得到各第一类型应用的各样本用户的相关样本特征。
可选的,设样本特征的维度为m维(即样本特征由m维的向量构成),则样本特征可表示为f=[f1,f2,f3...fm];设应用特征的维度为k维(即应用特征由k维的向量构成,应用特征的向量来源可基于应用的one-hot形式或者基于应用图谱生成的向量表示),则应用特征可表示为G=[g1,g2,g3...gk];样本特征与应用特征的相关性参数的维度可与应用特征的维度相同,均为k维(即相关性参数的维度可由k维的向量构成),则相关性参数可表示为w=[w1,w2,w3...wk];
则对于样本特征的第i维的向量fi,本发明实施例可确定fi相关维度的应用特征的向量(gi至gk,即对于样本特征的当前维向量fi,fi相关维度的应用特征的向量是:应用特征中与样本特征的当前维维度相同的向量,至应用特征的最高维的向量),和fi相关维度的相关性参数的向量(wi至wk,即对于样本特征的当前维向量fi,fi相关维度的相关性参数的向量是:相关性参数中与样本特征的当前维维度相同的向量,至相关性参数的最高维的向量);从而将fi相关维度的应用特征的向量和相关性参数的向量中,同维度的应用特征的向量和相关性参数的向量进行相乘,然后再将各相乘结果相加,得到fi相应的结合结果;
即fi相应的结合结果为
Figure BDA0001464241900000201
从而以上述方式确定出样本特征的每一维度的向量相应的结合结果;将样本特征的每一维度的向量,分别与相应的结合结果相乘,得到每一维度的相关样本特征的向量;即设相关样本特征为m维,且表示为F=[F1,F2,F3...Fm],则相关样本特征第i维的向量Fi的确定可由下述公式实现:
Figure BDA0001464241900000202
即本发明实施例可通过公式
Figure BDA0001464241900000203
确定该第一类型应用的该样本用户的每一维度的相关样本特征的向量,从而集合形成该第一类型应用的该样本用户的相关样本特征。
步骤S430、对于各第一类型应用,将应用特征与各样本用户的相关样本特征相拼接,得到各第一类型应用的各样本用户的训练特征。
在确定出各第一类型应用的各样本用户的相关样本特征后,对于某一第一类型应用,则可将该第一类型应用的应用特征,与该第一类型应用的各样本用户的相关样本特征相拼接,得到该第一类型应用的各样本用户的训练特征;对于每一第一类型应用均作此处理,则可得到各第一类型应用的各样本用户的训练特征。
步骤S440、将各第一类型应用的各样本用户的训练特征,作为神经网络的训练输入,训练得到目标用户预测模型。
可选的,本发明实施例可将各第一类型应用的各样本用户的训练特征,输入神经网络,利用反向传播梯度下降算法进行神经网络的参数更新(参数更新除更新神经网络的参数外,还可更新所述相关性参数),实现神经网络的迭代训练,得到收敛的目标用户预测模型。
相应的,图8示出了目标用户预测模型的另一构建示意图,如图8所示:
对于每一第一类型应用的每一样本用户的样本特征中的每一维度的向量,可通过相关维度的应用特征的向量,和相关维度的相关性参数的向量进行激活,形成适应的相关样本特征中的每一维度的向量,生成每一第一类型应用的每一样本用户的相关样本特征;
从而对于每一第一类型应用,将该第一类型应用的应用特征,可与该第一类型应用的各样本用户的相关样本特征相拼接,得到各第一类型应用的各样本用户的训练特征;
将各第一类型应用的各样本用户的训练特征,输入到神经网络,利用反向传播梯度下降算法进行神经网络的参数更新和所述相关性参数的更新,训练得到目标用户预测模型。
可选的,基于图7所构建的目标用户预测模型,本发明实施例实现目标用户预测的方法流程可图9所示,图9为本发明实施例提供的目标用户预测方法的另一流程图,参照图9,该方法流程可以包括:
步骤S500、确定待测用户的用户特征,所述用户特征至少包括:待测用户的用户画像数据,待测用户在每一第一类型应用的行为特征,待测用户的好友在每一第一类型应用的行为特征,待测用户在至少一个非第一类型应用的行为特征。
步骤S510、根据深度兴趣网络学习得到的用户特征与应用特征的相关性参数,确定目标第一类型应用的应用特征与待测用户的用户特征的相关性;以所确定的相关性,处理待测用户的用户特征,得到待测用户的相关用户特征。
可选的,步骤S510的一种可选实现可以为:
对于待测用户的用户特征的每一维度的向量,确定相关维度的目标第一类型应用的应用特征的向量和相关性参数的向量;
对于待测用户的用户特征的每一维度的向量,将所确定的相关维度的应用特征的向量和相关性参数的向量相结合,得到用户特征的每一维度的向量相应的结合结果;至此,可确定出目标第一类型应用的应用特征与待测用户的用户特征的相关性;
将用户特征的每一维度的向量分别与相应的结合结果相乘,得到每一维度的相关用户特征的向量,以每一维度的相关用户特征的向量形成该待测用户的相关用户特征。
可选的,与步骤S420处所示公式同理,待测用户的相关用户特征的确定实现也可参照公式
Figure BDA0001464241900000221
其中,在此处,上述公式中的fi可视为是用户特征的第i维的向量,gj可视为是目标第一类型应用的应用特征中的第j维的向量,wj可视为是相关性参数的第j维的向量;
具体的,对于用户特征的当前维向量,确定相关维度的目标第一类型应用的应用特征的向量为:目标第一类型应用的应用特征中与当前维维度相同的向量,至最高维的向量;对于用户特征的当前维向量,确定相关维度的相关性参数的向量为:相关性参数中与当前维维度相同的向量,至最高维的向量;
基于此,可对于待测用户的用户特征的每一维度的向量,将所确定的相关维度的目标第一类型应用的应用特征的向量和相关性参数的向量中,同维度的应用特征的向量和相关性参数的向量进行相乘,将各相乘结果相加,得到待测用户的用户特征的每一维度的向量相应的结合结果。
可选的,步骤S510所使用的相关性参数可以是模型训练完成后,所更新的相关性参数。
步骤S520、将待测用户的相关用户特征,与目标第一类型应用的应用特征相拼接,生成待测用户的预测特征。
步骤S530、将待测用户的预测特征,输入预构建的目标用户预测模型,通过所述目标用户预测模型预测得到待测用户为目标第一类型应用的目标用户的概率。
可以理解的是,在进行流失用户的预测时,在获取待测用户的预测特征后,可输入预构建的流失用户预测模型,实现待测用户为目标第一类型应用的流失用户的概率的确定;这个过程中,待测用户在各第一类型应用的行为特征可以包括:待测用户在目标第一类型应用的行为特征,且不为空;
而在进行潜在用户的预测时,在获取待测用户的预测特征后,可输入预构建的潜在用户预测模型,实现待测用户为目标第一类型应用的潜在用户的概率的确定;这个过程中,由于待测用户还未使用目标第一类型应用,因此,待测用户在目标第一类型应用的行为特征为空;此时可基于待测用户的好友在各第一类型应用的行为特征(这之中,好友在目标第一类型应用的行为特征可能不为空)、待测用户在相同类型的其他第一类型应用的行为特征、待测用户的画像数据、和待测用户在非第一类型应用的行为特征,对待测用户使用第一类型应用的影响,实现待测用户是否在目标第一类型应用的潜在用户的预测。
可选的,图10示出了目标用户预测方法的另一种可选处理示意图,如图10所示:
对于待测用户,可确定待测用户的画像数据,待测用户在每一第一类型应用的行为特征,待测用户的好友在每一第一类型应用的行为特征,待测用户在至少一个非第一类型应用的行为特征,得到待测用户的用户特征;
根据样本特征与应用特征的相关性参数,处理待测用户的用户特征,得到待测用户的相关用户特征;将待测用户的相关用户特征与目标第一类型应用的应用特征相拼接,得到待测用户的预测特征;
将待测用户的预测特征输入预先构建的目标用户预测模型,由目标用户预测模型输出待测用户为目标第一类型应用中的目标用户的概率。
在本发明实施例中,目标用户的预测可采用公式y=H(x)表示,其中,H表示所预测的目标用户预测模型(可以是一个用于分类的预测网络模型),x是待测用户的预测特征(可以是基于深度兴趣网络,输出的将待测用户的相关用户特征与目标第一类型应用的应用特征相拼接的预测特征),y是目标用户预测模型所预测的待测用户属于第一类型应用的目标用户的概率。
进一步,本发明实施例还可通过线上数据,不断的收集各第一类型应用的正样本用户和负样本用户的数据,不断优化调整目标用户预测模型的参数。
本发明实施例在预测第一类型应用的目标用户时,通过引入用户在非第一类型应用的行为特征,并且将第一类型应用的应用特征,用户及好友在第一类型应用平台下的行为特征,用户在非第一类型应用的行为特征相结合,形成用户特征;然后通过深度兴趣网络(一种类似注意力模型的新增网络结构)进行用户特征与需预测的第一类型应用的相关性匹配,这样使得输入目标用户预测模型的预测特征可以根据匹配度赋予权重,从而使得模型预测的输入特征更加合理和精简,效果也得到有效提升,提高了目标用户的预测准确性。
本发明实施例提供的目标用户预测方法可应用于游戏应用中,实现游戏平台下任一游戏的目标用户的预测;相应的,在游戏应用场景下,图1所示目标用户预测系统可相应调整为如图11所示,图11为本发明实施例提供的目标用户预测系统的另一结构框图,参照图11,该系统可以包括:后台服务器10,游戏平台20,至少一个非游戏应用的应用服务器30;
其中,游戏平台20下具有多款游戏应用,例如游戏应用201,游戏应用202等,用户可通过社交账号登录游戏平台20下的不同的游戏应用;至少一个非游戏应用的应用服务器30可以包括:社交应用的服务器,第三方支付应用的服务器等;且用户除可通过社交账号登录游戏应用外,还可实现在社交应用,第三方支付应用、阅读应用等非游戏应用的登录。
作为一种可选应用示例,以进行游戏应用的目标用户预测为例,本发明实施例提供的目标用户预测方法的过程可以如下,下述过程可由后台服务器执行实现:
1、对于游戏平台内的每一游戏应用,确定每一游戏应用的正样本用户和负样本用户;
2、对于每一游戏应用的正样本用户和负样本用户,均需进行如下信息的收集,得到样本特征:
用户画像数据,包括用户基本的年龄性别,注册游戏平台的累计时长,地理位置等个人信息;
用户在游戏平台的每一游戏应用中的游戏行为数据,包括用户在每个游戏上的游戏时长,付费金额,礼包领取,活动点击等数据;为了体现时效性,将这些数据分别按时序统计提取,如分别统计最近一年数据,最近半年数据,最近一月数据,最近两周数据,最近一周数据等;这个过程中,如果用户未使用过某一游戏应用则数据为0;
用户好友在游戏平台的每一游戏应用中的游戏行为数据,具体涉及内容可参照上段描述;
用户在非游戏应用中的行为数据,包括但不局限于社交行为,支付行为,阅读行为等。
3、对于每一游戏应用的正样本用户和负样本用户(统称为样本用户)的样本特征,利用与各游戏应用之间的相关性进行激活处理,得到每一游戏应用的样本用户的相关样本特征;
此处设f=[f1,f2,f3...fm]为某一游戏应用的某一样本用户的样本特征,G=[g1,g2,g3...gk]为某一游戏应用的应用特征,w=[w1,w2,w3...wk]为基于深度兴趣网络学习得到的样本特征与游戏应用的应用特征的相关性参数;
则对于某一游戏应用的某一样本用户的样本特征,可通过如下公式处理得到相关样本特征F=[F1,F2,F3...Fm];
其中,
Figure BDA0001464241900000251
3、对于每一游戏应用,将各样本用户的相关样本特征,分别与该游戏应用的应用特征进行拼接,得到该游戏应用的每一样本用户的训练特征。
4、将各游戏应用的各样本用户的训练特征,作为神经网络的训练输入,训练得到目标用户预测模型。
5、在训练得到目标用户预测模型后,对于某一游戏应用的某一用户进行是否为目标用户的预测时,可获取该用户的用户特征,用户特征至少包括:待测用户的用户画像数据,待测用户在第一类型应用平台下的每一第一类型应用的行为特征,待测用户的好友在第一类型应用平台下的每一第一类型应用的行为特征,待测用户在至少一个非第一类型应用的行为特征;
以上述公式
Figure BDA0001464241900000261
根据相关性参数和需预测的游戏应用的应用特征,同理处理该用户特征,得到该用户的相关用户特征;
将该用户的相关用户特征与需预测的游戏应用的应用特征相拼接,生成该用户的预测特征。
6、将该用户的预测特征,输入到所构建的目标用户预测模型,由目标用户预测模型预测得到该用户为需预测的游戏应用的目标用户的概率。
上述示例中,目标用户可以是流失用户,通过确定每一游戏应用的流失用户,作为正样本用户,确定每一游戏应用的非流失用户,作为负样本用户,实现流失用户预测模型的构建,进而以待测用户的预测特征,输入所构建的流失用户预测模型,实现待测用户的是否为需预测的游戏应用的流失用户的预测;
上述示例中,目标用户也可以是潜在用户,通过确定每一游戏应用的转化用户,作为正样本用户,确定每一游戏应用的未转化用户,作为负样本用户,实现潜在用户预测模型的构建,进而以待测用户的预测特征,输入所构建的潜在用户预测模型,实现待测用户的是否为需预测的游戏应用的潜在用户的预测。
本发明实施例提供的目标用户预测方法,可基于判定目标用户的因素更为全面的预测特征,实现更为准确的待测用户为目标第一类型应用中的目标用户的概率的确定,提升了目标用户的预测准确性;并且可实现目标用户的及时预测,第一类型应用平台下不同应用的目标用户的预测;同时,通过深度兴趣网络进行用户特征与需预测的第一类型应用的相关性匹配,这样使得输入目标用户预测模型的预测特征可以根据匹配度赋予权重,使得模型预测的输入特征更加合理和精简,效果也得到有效提升,提高了目标用户的预测准确性。
下面对本发明实施例提供的目标用户预测装置进行介绍,下文描述的目标用户预测装置可以认为是,后台服务器为实现本发明实施例提供的目标用户预测方法所需设置的程序模块;下文描述的目标用户预测装置内容,可与上文描述的目标用户预测方法内容相互对应参照。
图12为本发明实施例提供的目标用户预测装置的结构框图,该目标用户预测装置可应用于后台服务器,参照图12,该装置可以包括:
用户特征确定模块100,用于确定待测用户的用户特征,所述用户特征至少包括:待测用户的用户画像数据,待测用户及待测用户的好友分别在多个第一类型应用的各第一类型应用的行为特征,待测用户在至少一个非第一类型应用的行为特征;
预测特征确定模块200,用于根据待测用户的用户特征与目标第一类型应用的应用特征,生成待测用户的预测特征;目标第一类型应用为所述多个第一类型应用的任一第一类型应用;
目标用户概率确定模块300,用于将待测用户的预测特征输入预构建的目标用户预测模型,通过所述目标用户预测模型预测得到待测用户为目标第一类型应用的目标用户的概率。
可选的,图13示出了本发明实施例提供的目标用户预测装置的另一结构框图,结合图12和图13所示,该装置还可以包括:
模型训练模块400,用于分别确定各第一类型应用的正样本用户和负样本用户,得到各第一类型应用的样本用户;分别确定各第一类型应用的各样本用户的样本特征;一样本用户的样本特征至少包括:该样本用户的用户画像数据,该样本用户及该样本用户的好友分别在各第一类型应用的行为特征,该样本用户在至少一个非第一类型应用的行为特征;对于各第一类型应用,根据应用特征与各样本用户的样本特征,生成各第一类型应用的各样本用户的训练特征;将各第一类型应用的各样本用户的训练特征,作为神经网络的训练输入,训练得到目标用户预测模型。
可选的,本发明实施例可实现流失用户的预测,相应的,目标用户可以是流失用户,所构建的目标用户预测模型可以是流失用户预测模型;相应的,模型训练模块400用于分别确定各第一类型应用的正样本用户和负样本用户,得到各第一类型应用的样本用户,具体包括:
分别确定各第一类型应用的流失用户,得到各第一类型应用的正样本用户,分别确定各第一类型应用的非流失用户,得到各第一类型应用的负样本用户,以确定出各第一类型应用的样本用户;
相应的,目标用户概率确定模块300,用于将待测用户的预测特征输入预构建的目标用户预测模型,通过所述目标用户预测模型预测得到待测用户为目标第一类型应用的目标用户的概率,可具体包括:
将待测用户的预测特征输入预构建的流失用户预测模型,通过所述流失用户预测模型预测得到待测用户为目标第一类型应用的流失用户的概率。
可选的,本发明实施例也可实现潜在用户的预测,相应的,目标用户可以是潜在用户,所构建的目标用户预测模型可以是潜在用户预测模型;由于潜在用户未使用过目标第一类型应用,因此待测用户在各第一类型应用的行为特征可以包括:待测用户在目标第一类型应用的行为特征,且待测用户在目标第一类型应用的行为特征为空;
相应的,模型训练模块400用于分别确定各第一类型应用的正样本用户和负样本用户,得到各第一类型应用的样本用户,具体包括:
分别确定各第一类型应用的转化用户,确定出各第一类型应用的正样本用户,分别确定各第一类型应用的未转化用户,确定出各第一类型应用的负样本用户,以得到各第一类型应用的样本用户;
相应的,目标用户概率确定模块300,用于将待测用户的预测特征输入预构建的目标用户预测模型,通过所述目标用户预测模型预测得到待测用户为目标第一类型应用的目标用户的概率,可具体包括:
将待测用户的预测特征输入预构建的潜在用户预测模型,通过所述潜在用户预测模型预测得到待测用户为目标第一类型应用的潜在用户的概率。
可选的,无论是进行流失用户的预测,还是进行潜在用户的预测,在一种可选实现上,预测特征确定模块200,用于根据待测用户的用户特征与目标第一类型应用的应用特征,生成待测用户的预测特征,具体包括:
将待测用户的用户特征与目标第一类型应用的应用特征相拼接,生成待测用户的预测特征;
相应的,模型训练模块400,用于对于各第一类型应用,根据应用特征与各样本用户的样本特征,生成各第一类型应用的各样本用户的训练特征,具体包括:
对于一第一类型应用,将该第一类型应用的应用特征,分别与该第一类型应用的各样本用户的样本特征相拼接,得到该第一类型应用的各样本用户的训练特征,以此得到各第一类型应用的各样本用户的训练特征。
可选的,无论是进行流失用户的预测,还是进行潜在用户的预测,在另一种可选实现上,预测特征确定模块200,用于根据待测用户的用户特征与目标第一类型应用的应用特征,生成待测用户的预测特征,具体包括:
根据深度兴趣网络学习得到的用户特征与应用特征的相关性参数,确定目标第一类型应用的应用特征与待测用户的用户特征的相关性;
以所确定的相关性,处理待测用户的用户特征,得到待测用户的相关用户特征;
将待测用户的相关用户特征,与目标第一类型应用的应用特征相拼接,生成待测用户的预测特征。
可选的,预测特征确定模块200,用于根据深度兴趣网络学习得到的用户特征与应用特征的相关性参数,确定目标第一类型应用的应用特征与待测用户的用户特征的相关性,具体包括:
对于待测用户的用户特征的每一维度的向量,确定相关维度的目标第一类型应用的应用特征的向量和相关性参数的向量;
对于待测用户的用户特征的每一维度的向量,将所确定的相关维度的应用特征的向量和相关性参数的向量相结合,得到用户特征的每一维度的向量相应的结合结果;
相应的,预测特征确定模块200,用于以所确定的相关性,处理待测用户的用户特征,得到待测用户的相关用户特征,具体包括:
将用户特征的每一维度的向量分别与相应的结合结果相乘,得到每一维度的相关用户特征的向量,以每一维度的相关用户特征的向量形成该待测用户的相关用户特征。
可选的,预测特征确定模块200,用于对于待测用户的用户特征的每一维度的向量,确定相关维度的目标第一类型应用的应用特征的向量和相关性参数的向量,具体包括:
对于用户特征的当前维向量,确定相关维度的目标第一类型应用的应用特征的向量为,目标第一类型应用的应用特征中与当前维维度相同的向量,至最高维的向量;及对于用户特征的当前维向量,确定相关维度的相关性参数的向量为,相关性参数中与当前维维度相同的向量,至最高维的向量;
相应的,预测特征确定模块200,用于对于待测用户的用户特征的每一维度的向量,将所确定的相关维度的应用特征的向量和相关性参数的向量相结合,得到用户特征的每一维度的向量相应的结合结果,具体包括:
对于待测用户的用户特征的每一维度的向量,将所确定的相关维度的目标第一类型应用的应用特征的向量和相关性参数的向量中,同维度的应用特征的向量和相关性参数的向量进行相乘,将各相乘结果相加,得到待测用户的用户特征的每一维度的向量相应的结合结果。
可选的,无论是进行流失用户的预测,还是进行潜在用户的预测,模型训练模块400,用于对于各第一类型应用,根据应用特征与各样本用户的样本特征,生成各第一类型应用的各样本用户的训练特征,具体包括:
根据样本特征与应用特征的相关性参数,分别确定各第一类型应用的应用特征与相应的各样本用户的样本特征的相关性;
对于各第一类型应用,以相应确定的相关性,处理相应的各样本用户的样本特征,得到各第一类型应用的各样本用户的相关样本特征;
对于各第一类型应用,将应用特征与各样本用户的相关样本特征相拼接,得到各第一类型应用的各样本用户的训练特征。
可选的,无论是进行流失用户的预测,还是进行潜在用户的预测,模型训练模块400,用于将各第一类型应用的各样本用户的训练特征,作为神经网络的训练输入,训练得到目标用户预测模型,具体包括:
将各第一类型应用的各样本用户的训练特征,输入神经网络,利用反向传播梯度下降算法更新神经网络的参数及所述相关性参数,以迭代训练得到收敛的目标用户预测模型。
可选的,在进行流失用户的预测,构建流失用户预测模型时,模型训练模块400,用于分别确定各第一类型应用的流失用户,得到各第一类型应用的正样本用户,具体包括:
选取连续的第一时间窗和第二时间窗;
对于第一类型应用平台下的一第一类型应用,确定该第一类型应用的用户中,在第一时间段活跃但在第二时间段不活跃的用户为流失用户,得到该第一类型应用的正样本用户;
相应的,模型训练模块400,用于分别确定各第一类型应用的非流失用户,得到各第一类型应用的负样本用户,具体包括:
对于第一类型应用平台下的一第一类型应用,确定该第一类型应用的用户中,在第一时间段和第二时间段均活跃的用户为非流失用户,得到该第一类型应用的负样本用户。
上述描述的目标用户预测装置可应用于后台服务器,以程序模块的形式装载于后台服务器中,可选的该程序模块的功能可由后台服务器的处理器调用程序执行实现;可选的,图14示出了后台服务器的硬件结构框图,参照图14,该后台服务器可以包括:至少一个处理器01,至少一个通信接口02,至少一个存储器03和至少一个通信总线04;
在本发明实施例中,处理器01、通信接口02、存储器03、通信总线04的数量为至少一个,且处理器01、通信接口02、存储器03通过通信总线04完成相互间的通信;
可选的,处理器01可能是一个中央处理器CPU,或者是特定集成电路ASIC(Application Specific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路;
存储器03可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器;
在本发明实施例中,存储器存储有程序,处理器调用存储器所存储的程序,所述程序用于:
确定待测用户的用户特征,所述用户特征至少包括:待测用户的用户画像数据,待测用户及待测用户的好友分别在多个第一类型应用的各第一类型应用的行为特征,待测用户在至少一个非第一类型应用的行为特征;
根据待测用户的用户特征与目标第一类型应用的应用特征,生成待测用户的预测特征;目标第一类型应用为所述多个第一类型应用的任一第一类型应用;
将待测用户的预测特征输入预构建的目标用户预测模型,通过所述目标用户预测模型预测得到待测用户为目标第一类型应用的目标用户的概率。
可选的,所述程序的细化功能和扩展功能可参照上文相应部分描述。
可选的,本发明实施例还提供一种存储介质,该存储介质存储有适于处理器执行的程序,所述程序用于:
确定待测用户的用户特征,所述用户特征至少包括:待测用户的用户画像数据,待测用户及待测用户的好友分别在多个第一类型应用的各第一类型应用的行为特征,待测用户在至少一个非第一类型应用的行为特征;
根据待测用户的用户特征与目标第一类型应用的应用特征,生成待测用户的预测特征;目标第一类型应用为所述多个第一类型应用的任一第一类型应用;
将待测用户的预测特征输入预构建的目标用户预测模型,通过所述目标用户预测模型预测得到待测用户为目标第一类型应用的目标用户的概率。
可选的,所述程序的细化功能和扩展功能可参照上文相应部分描述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的核心思想或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (15)

1.一种目标用户预测方法,其特征在于,包括:
确定待测用户的用户特征,所述用户特征至少包括:待测用户的用户画像数据,待测用户及待测用户的好友分别在多个第一类型应用的各第一类型应用的行为特征,待测用户在至少一个非第一类型应用的行为特征;
根据待测用户的用户特征与目标第一类型应用的应用特征,生成待测用户的预测特征;目标第一类型应用为所述多个第一类型应用的任一第一类型应用;
将待测用户的预测特征输入预构建的目标用户预测模型,通过所述目标用户预测模型预测得到待测用户为目标第一类型应用的目标用户的概率,其中,所述目标用户预测模型为流失用户预测模型或潜在用户预测模型。
2.根据权利要求1所述的目标用户预测方法,其特征在于,所述方法还包括:
分别确定各第一类型应用的正样本用户和负样本用户,得到各第一类型应用的样本用户;
分别确定各第一类型应用的各样本用户的样本特征;一样本用户的样本特征至少包括:该样本用户的用户画像数据,该样本用户及该样本用户的好友分别在各第一类型应用的行为特征,该样本用户在至少一个非第一类型应用的行为特征;
对于各第一类型应用,根据应用特征与各样本用户的样本特征,生成各第一类型应用的各样本用户的训练特征;
将各第一类型应用的各样本用户的训练特征,作为神经网络的训练输入,训练得到目标用户预测模型。
3.根据权利要求2所述的目标用户预测方法,其特征在于,所述目标用户为流失用户;所述分别确定各第一类型应用的正样本用户和负样本用户,得到各第一类型应用的样本用户包括:
分别确定各第一类型应用的流失用户,得到各第一类型应用的正样本用户,分别确定各第一类型应用的非流失用户,得到各第一类型应用的负样本用户,以确定出各第一类型应用的样本用户。
4.根据权利要求2所述的目标用户预测方法,其特征在于,所述目标用户为潜在用户;其中,所述待测用户在各第一类型应用的行为特征包括:待测用户在目标第一类型应用的行为特征,且待测用户在目标第一类型应用的行为特征为空;
所述分别确定各第一类型应用的正样本用户和负样本用户,得到各第一类型应用的样本用户包括:
分别确定各第一类型应用的转化用户,确定出各第一类型应用的正样本用户,分别确定各第一类型应用的未转化用户,确定出各第一类型应用的负样本用户,以得到各第一类型应用的样本用户。
5.根据权利要求2-4任一项所述的目标用户预测方法,其特征在于,所述根据待测用户的用户特征与目标第一类型应用的应用特征,生成待测用户的预测特征包括:
将待测用户的用户特征与目标第一类型应用的应用特征相拼接,生成待测用户的预测特征;
所述对于各第一类型应用,根据应用特征与各样本用户的样本特征,生成各第一类型应用的各样本用户的训练特征包括:
对于一第一类型应用,将该第一类型应用的应用特征,分别与该第一类型应用的各样本用户的样本特征相拼接,得到该第一类型应用的各样本用户的训练特征,以此得到各第一类型应用的各样本用户的训练特征。
6.根据权利要求1-4任一项所述的目标用户预测方法,其特征在于,所述根据待测用户的用户特征与目标第一类型应用的应用特征,生成待测用户的预测特征包括:
根据深度兴趣网络学习得到的用户特征与应用特征的相关性参数,确定目标第一类型应用的应用特征与待测用户的用户特征的相关性;
以所确定的相关性,处理待测用户的用户特征,得到待测用户的相关用户特征;
将待测用户的相关用户特征,与目标第一类型应用的应用特征相拼接,生成待测用户的预测特征。
7.根据权利要求6所述的目标用户预测方法,其特征在于,所述根据深度兴趣网络学习得到的用户特征与应用特征的相关性参数,确定目标第一类型应用的应用特征与待测用户的用户特征的相关性包括:
对于待测用户的用户特征的每一维度的向量,确定相关维度的目标第一类型应用的应用特征的向量和相关性参数的向量;
对于待测用户的用户特征的每一维度的向量,将所确定的相关维度的应用特征的向量和相关性参数的向量相结合,得到用户特征的每一维度的向量相应的结合结果;
所述以所确定的相关性,处理待测用户的用户特征,得到待测用户的相关用户特征包括:
将用户特征的每一维度的向量分别与相应的结合结果相乘,得到每一维度的相关用户特征的向量,以每一维度的相关用户特征的向量形成该待测用户的相关用户特征。
8.根据权利要求7所述的目标用户预测方法,其特征在于,所述对于待测用户的用户特征的每一维度的向量,确定相关维度的目标第一类型应用的应用特征的向量和相关性参数的向量包括:
对于用户特征的当前维向量,确定相关维度的目标第一类型应用的应用特征的向量为,目标第一类型应用的应用特征中与当前维度相同的向量,至最高维的向量;及对于用户特征的当前维向量,确定相关维度的相关性参数的向量为,相关性参数中与当前维度相同的向量,至最高维的向量;
所述对于待测用户的用户特征的每一维度的向量,将所确定的相关维度的应用特征的向量和相关性参数的向量相结合,得到用户特征的每一维度的向量相应的结合结果包括:
对于待测用户的用户特征的每一维度的向量,将所确定的相关维度的目标第一类型应用的应用特征的向量和相关性参数的向量中,同维度的应用特征的向量和相关性参数的向量进行相乘,将各相乘结果相加,得到待测用户的用户特征的每一维度的向量相应的结合结果。
9.根据权利要求2-4任一项所述的目标用户预测方法,其特征在于,所述对于各第一类型应用,根据应用特征与各样本用户的样本特征,生成各第一类型应用的各样本用户的训练特征包括:
根据样本特征与应用特征的相关性参数,分别确定各第一类型应用的应用特征与相应的各样本用户的样本特征的相关性;
对于各第一类型应用,以相应确定的相关性,处理相应的各样本用户的样本特征,得到各第一类型应用的各样本用户的相关样本特征;
对于各第一类型应用,将应用特征与各样本用户的相关样本特征相拼接,得到各第一类型应用的各样本用户的训练特征。
10.根据权利要求3所述的目标用户预测方法,其特征在于,所述分别确定各第一类型应用的流失用户,得到各第一类型应用的正样本用户包括:
选取连续的第一时间窗和第二时间窗;
对于第一类型应用平台下的一第一类型应用,确定该第一类型应用的用户中,在第一时间段活跃但在第二时间段不活跃的用户为流失用户,得到该第一类型应用的正样本用户;
所述分别确定各第一类型应用的非流失用户,得到各第一类型应用的负样本用户包括:
对于第一类型应用平台下的一第一类型应用,确定该第一类型应用的用户中,在第一时间段和第二时间段均活跃的用户为非流失用户,得到该第一类型应用的负样本用户。
11.一种目标用户预测装置,其特征在于,包括:
用户特征确定模块,用于确定待测用户的用户特征,所述用户特征至少包括:待测用户的用户画像数据,待测用户及待测用户的好友分别在多个第一类型应用的各第一类型应用的行为特征,待测用户在至少一个非第一类型应用的行为特征;
预测特征确定模块,用于根据待测用户的用户特征与目标第一类型应用的应用特征,生成待测用户的预测特征;目标第一类型应用为所述多个第一类型应用的任一第一类型应用;
目标用户概率确定模块,用于将待测用户的预测特征输入预构建的目标用户预测模型,通过所述目标用户预测模型预测得到待测用户为目标第一类型应用的目标用户的概率,其中,所述目标用户预测模型为流失用户预测模型或潜在用户预测模型。
12.根据权利要求11所述的目标用户预测装置,其特征在于,还包括:
模型训练模块,用于分别确定各第一类型应用的正样本用户和负样本用户,得到各第一类型应用的样本用户;分别确定各第一类型应用的各样本用户的样本特征;一样本用户的样本特征至少包括:该样本用户的用户画像数据,该样本用户及该样本用户的好友分别在各第一类型应用的行为特征,该样本用户在至少一个非第一类型应用的行为特征;对于各第一类型应用,根据应用特征与各样本用户的样本特征,生成各第一类型应用的各样本用户的训练特征;将各第一类型应用的各样本用户的训练特征,作为神经网络的训练输入,训练得到目标用户预测模型;
其中,所述目标用户为流失用户,所述目标用户预测模型为流失用户预测模型;或,所述目标用户为潜在用户,所述目标用户预测模型为潜在用户预测模型。
13.根据权利要求11或12所述的目标用户预测装置,其特征在于,所述预测特征确定模块,用于根据待测用户的用户特征与目标第一类型应用的应用特征,生成待测用户的预测特征,具体包括:
根据深度兴趣网络学习得到的用户特征与应用特征的相关性参数,确定目标第一类型应用的应用特征与待测用户的用户特征的相关性;
以所确定的相关性,处理待测用户的用户特征,得到待测用户的相关用户特征;
将待测用户的相关用户特征,与目标第一类型应用的应用特征相拼接,生成待测用户的预测特征。
14.一种后台服务器,其特征在于,包括:至少一个存储器和至少一个处理器;所述存储器存储有程序,所述处理器调用所述存储器存储的程序,所述程序用于:
确定待测用户的用户特征,所述用户特征至少包括:待测用户的用户画像数据,待测用户及待测用户的好友分别在多个第一类型应用的各第一类型应用的行为特征,待测用户在至少一个非第一类型应用的行为特征;
根据待测用户的用户特征与目标第一类型应用的应用特征,生成待测用户的预测特征;目标第一类型应用为所述多个第一类型应用的任一第一类型应用;
将待测用户的预测特征输入预构建的目标用户预测模型,通过所述目标用户预测模型预测得到待测用户为目标第一类型应用的目标用户的概率,其中,所述目标用户预测模型为流失用户预测模型或潜在用户预测模型。
15.一种存储介质,其特征在于,所述存储介质存储有适于处理器执行的程序,所述程序用于:
确定待测用户的用户特征,所述用户特征至少包括:待测用户的用户画像数据,待测用户及待测用户的好友分别在多个第一类型应用的各第一类型应用的行为特征,待测用户在至少一个非第一类型应用的行为特征;
根据待测用户的用户特征与目标第一类型应用的应用特征,生成待测用户的预测特征;目标第一类型应用为所述多个第一类型应用的任一第一类型应用;
将待测用户的预测特征输入预构建的目标用户预测模型,通过所述目标用户预测模型预测得到待测用户为目标第一类型应用的目标用户的概率,其中,所述目标用户预测模型为流失用户预测模型或潜在用户预测模型。
CN201711105506.9A 2017-11-10 2017-11-10 一种目标用户预测方法、装置、后台服务器及存储介质 Active CN109784959B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711105506.9A CN109784959B (zh) 2017-11-10 2017-11-10 一种目标用户预测方法、装置、后台服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711105506.9A CN109784959B (zh) 2017-11-10 2017-11-10 一种目标用户预测方法、装置、后台服务器及存储介质

Publications (2)

Publication Number Publication Date
CN109784959A CN109784959A (zh) 2019-05-21
CN109784959B true CN109784959B (zh) 2023-04-18

Family

ID=66484414

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711105506.9A Active CN109784959B (zh) 2017-11-10 2017-11-10 一种目标用户预测方法、装置、后台服务器及存储介质

Country Status (1)

Country Link
CN (1) CN109784959B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110633421B (zh) * 2019-09-09 2020-08-11 北京瑞莱智慧科技有限公司 特征提取、推荐以及预测方法、装置、介质和设备
CN114223012A (zh) * 2019-10-31 2022-03-22 深圳市欢太科技有限公司 推送对象确定方法、装置、终端设备及存储介质
CN111222026B (zh) * 2020-01-09 2023-07-14 支付宝(杭州)信息技术有限公司 用户类别识别模型的训练方法和用户类别识别方法
CN111445282B (zh) * 2020-03-20 2023-02-10 支付宝(杭州)信息技术有限公司 基于用户行为的业务处理方法、装置及设备
CN111475392B (zh) * 2020-04-08 2022-05-20 北京字节跳动网络技术有限公司 生成预测信息的方法、装置、电子设备和计算机可读介质
CN111489196B (zh) * 2020-04-08 2022-08-12 支付宝(杭州)信息技术有限公司 基于深度学习网络的预测方法、装置、电子设备及介质
CN114742569A (zh) * 2021-01-08 2022-07-12 广州视源电子科技股份有限公司 用户生命阶段预测方法、装置、计算机设备及存储介质
CN114022202B (zh) * 2021-11-03 2022-11-01 中南大学 基于深度学习的用户流失预测方法及系统
CN114330866B (zh) * 2021-12-24 2023-11-24 江苏微皓智能科技有限公司 数据处理方法、装置、电子设备及计算机可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103635923A (zh) * 2011-06-30 2014-03-12 微软公司 利用社交连接和引导的共享电子激励和优惠券
CN106066873A (zh) * 2016-05-30 2016-11-02 哈尔滨工程大学 一种基于本体的旅游信息推荐方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012083696A1 (zh) * 2011-07-30 2012-06-28 华为技术有限公司 信息推荐方法、推荐引擎及网络系统
US20160253688A1 (en) * 2015-02-24 2016-09-01 Aaron David NIELSEN System and method of analyzing social media to predict the churn propensity of an individual or community of customers
CN105005918B (zh) * 2015-07-24 2018-07-17 金鹃传媒科技股份有限公司 一种基于用户行为数据和潜在用户影响力分析的在线广告推送评估方法
CN105096170A (zh) * 2015-09-18 2015-11-25 车智互联(北京)科技有限公司 基于bbd或/和rf模型获取潜客级别的方法和系统
US20170169345A1 (en) * 2015-12-10 2017-06-15 AVG Netherlands B.V. Predicting churn for (mobile) app usage
CN105550903B (zh) * 2015-12-25 2021-07-30 腾讯科技(深圳)有限公司 目标用户确定方法及装置
US10853784B2 (en) * 2016-01-04 2020-12-01 Bank Of America Corporation Real-time determination of resource availability for usage
CN105869022B (zh) * 2016-04-07 2020-10-23 腾讯科技(深圳)有限公司 一种应用流行度预测方法和装置
CN106250403A (zh) * 2016-07-19 2016-12-21 北京奇艺世纪科技有限公司 用户流失预测方法及装置
CN107093084A (zh) * 2016-08-01 2017-08-25 北京小度信息科技有限公司 潜在用户预测转化方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103635923A (zh) * 2011-06-30 2014-03-12 微软公司 利用社交连接和引导的共享电子激励和优惠券
CN106066873A (zh) * 2016-05-30 2016-11-02 哈尔滨工程大学 一种基于本体的旅游信息推荐方法

Also Published As

Publication number Publication date
CN109784959A (zh) 2019-05-21

Similar Documents

Publication Publication Date Title
CN109784959B (zh) 一种目标用户预测方法、装置、后台服务器及存储介质
US11659050B2 (en) Discovering signature of electronic social networks
CN108364195B (zh) 用户留存概率预测方法、装置、预测服务器及存储介质
CN110033314B (zh) 广告数据处理方法及装置
CN108665159A (zh) 一种风险评估方法、装置、终端设备及存储介质
CN108038711B (zh) 用户流失预测方法、装置以及计算机设备
WO2018157808A1 (zh) 互联网征信评估方法和系统
US20200074498A1 (en) Systems and methods for improving social media advertising efficiency
CN106776925B (zh) 一种移动终端用户性别的预测方法、服务器和系统
CN112380449B (zh) 信息推荐方法、模型训练方法及相关装置
CN113538070B (zh) 用户生命价值周期检测方法、装置和计算机设备
CN111626767B (zh) 资源数据的发放方法、装置及设备
CN114417174B (zh) 内容推荐方法、装置、设备及计算机存储介质
CN110555749B (zh) 基于神经网络的信用行为预测方法以及装置
CN109087124A (zh) 一种应用程序价值预测方法及装置
Fang et al. Quasi-reliable estimates of effective sample size
US20180341873A1 (en) Adaptive prior selection in online experiments
Inoue et al. Estimating customer impatience in a service system with unobserved balking
CN111957053A (zh) 游戏玩家匹配方法、装置、存储介质与电子设备
CN110717653A (zh) 风险识别方法及装置和电子设备
CN112950258B (zh) 活动分析方法、装置和电子设备
CN114625894A (zh) 鉴赏力评估、模型训练方法、装置、介质和计算设备
CN117370215B (zh) 寻优抽样方法、装置、电子设备及存储介质
CN117217852B (zh) 一种基于行为识别购买意愿度预测方法及装置
CN113705682B (zh) 用户行为特征的处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant