CN110166498A - 用户类别确定方法及装置、计算机设备及存储介质 - Google Patents
用户类别确定方法及装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN110166498A CN110166498A CN201810141042.5A CN201810141042A CN110166498A CN 110166498 A CN110166498 A CN 110166498A CN 201810141042 A CN201810141042 A CN 201810141042A CN 110166498 A CN110166498 A CN 110166498A
- Authority
- CN
- China
- Prior art keywords
- period
- user
- active
- retention
- reference period
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 80
- 230000014759 maintenance of location Effects 0.000 claims abstract description 263
- 230000000717 retained effect Effects 0.000 claims abstract description 20
- 238000004590 computer program Methods 0.000 claims description 14
- 230000002085 persistent effect Effects 0.000 claims description 9
- 230000002045 lasting effect Effects 0.000 abstract description 6
- 230000000694 effects Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 230000002688 persistence Effects 0.000 description 5
- 230000003068 static effect Effects 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 4
- 230000004083 survival effect Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- ZLIBICFPKPWGIZ-UHFFFAOYSA-N pyrimethanil Chemical compound CC1=CC(C)=NC(NC=2C=CC=CC=2)=N1 ZLIBICFPKPWGIZ-UHFFFAOYSA-N 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/535—Tracking the activity of the user
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Hardware Design (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种用户类别确定方法及装置、计算机设备及存储介质,方法包括获取各用户分别在基准周期以及基准周期后的连续预设数目个周期内对应的用户登录状态信息;统计在基准周期内活跃且在第一个周期依次至各周期内分别连续活跃的各持续活跃用户数,获得持续活跃用户数集;根据持续活跃用户数集以及在基准周期内活跃用户总数,确定基准周期下各周期分别对应的持续留存概率;根据各持续留存概率,获取各用户分别在各周期下对应的留存概率;根据各用户分别在各周期下对应的留存概率以及预设基准留存概率,确定各用户分别在基准周期对应的各周期下的类别。采用本方法能够提高类别确定准确性。
Description
技术领域
本申请涉及计算机技术领域,特别涉及一种用户类别确定方法及装置、计算机设备及存储介质。
背景技术
随着计算机技术和移动互联网技术的发展,应用程序的种类也不断增多,比如,游戏应用程序、社交应用程序等。用户使用情况是衡量其性能的重要指标,在使用应用程序的过程中,难免会出现用户流失现象。目前,常采用对用户流失率进行预测以确定流失用户,进而针对流失用户进行相应的维护措施,如此,可减少用户流失。
然而,现有确定流失用户的过程中,一般根据用户在应用程序中的静态指标特征(例如,用户信息、登录次数以及登录时长等)对用户进行分类以预测用户是否为流失用户,如此,容易导致准确性低。
发明内容
基于此,有必要针对分类准确性低的问题,提出一种用户类别确定方法及装置、计算机设备及存储介质。
一种用户类别确定方法,包括:
获取各用户分别在基准周期以及所述基准周期后的连续预设数目个周期内对应的用户登录状态信息;
根据所述用户登录状态信息,统计在所述基准周期内活跃且在第一个周期依次至各所述周期内分别连续活跃的各持续活跃用户数,获得持续活跃用户数集;所述第一个周期为预设数目个所述周期中与所述基准周期相邻的周期;
根据所述持续活跃用户数集以及在所述基准周期内活跃用户总数,确定所述基准周期后各所述周期分别对应的持续留存概率;
根据各所述持续留存概率,获取各所述用户分别在各所述周期下对应的留存概率;
根据各所述用户分别在各所述周期下对应的留存概率以及预设基准留存概率,确定各所述用户分别在基准周期后各所述周期下的类别。
一种用户类别确定方法装置,包括:
信息获取模块,用于获取各用户分别在基准周期以及所述基准周期后的连续预设数目个周期内对应的用户登录状态信息;
用户数统计模块,用于根据所述用户登录状态信息,统计在所述基准周期内活跃且在第一个周期依次至各所述周期内分别连续活跃的各持续活跃用户数,获得持续活跃用户数集;所述第一个周期为预设数目个所述周期中与所述基准周期相邻的周期;
概率确定模块,用于根据所述持续活跃用户数集以及在所述基准周期内活跃用户总数,确定所述基准周期后各所述周期分别对应的持续留存概率;
概率获取模块,用于根据各所述持续留存概率,获取各所述用户分别在各所述周期下对应的留存概率;
类别确定模块,用于根据各所述用户分别在各所述周期下对应的留存概率以及预设基准留存概率,确定各所述用户分别在基准周期后各所述周期下的类别。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,处理器执行计算机程序时实现以下步骤:
获取各用户分别在基准周期以及所述基准周期后的连续预设数目个周期内对应的用户登录状态信息;
根据所述用户登录状态信息,统计在所述基准周期内活跃且在第一个周期依次至各所述周期内分别连续活跃的各持续活跃用户数,获得持续活跃用户数集;所述第一个周期为预设数目个所述周期中与所述基准周期相邻的周期;
根据所述持续活跃用户数集以及在所述基准周期内活跃用户总数,确定所述基准周期后各所述周期分别对应的持续留存概率;
根据各所述持续留存概率,获取各所述用户分别在各所述周期下对应的留存概率;
根据各所述用户分别在各所述周期下对应的留存概率以及预设基准留存概率,确定各所述用户分别在基准周期后各所述周期下的类别。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取各用户分别在基准周期以及所述基准周期后的连续预设数目个周期内对应的用户登录状态信息;
根据所述用户登录状态信息,统计在所述基准周期内活跃且在第一个周期依次至各所述周期内分别连续活跃的各持续活跃用户数,获得持续活跃用户数集;所述第一个周期为预设数目个所述周期中与所述基准周期相邻的周期;
根据所述持续活跃用户数集以及在所述基准周期内活跃用户总数,确定所述基准周期后各所述周期分别对应的持续留存概率;
根据各所述持续留存概率,获取各所述用户分别在各所述周期下对应的留存概率;
根据各所述用户分别在各所述周期下对应的留存概率以及预设基准留存概率,确定各所述用户分别在基准周期后各所述周期下的类别。
上述用户类别确定方法及装置、计算机设备及存储介质,以各用户分别在基准周期以及基准周期后的连续预设数目个周期内对应的用户登录状态信息为依据,确定在基准周期内活跃且在第一个周期依次至各周期内分别连续活跃的各持续活跃用户数,进而确定在基准周期下各周期分别对应的持续留存概率,然后根据各持续留存概率,获取各用户分别在各周期下对应的留存概率,以此来确定用户分别在基准周期后各周期下的类别。由于上述各持续活跃用户数能准确反映以基准周期为基础,分别在第一个周期依次到各周期内用户连续活跃情况,以此可准确确定以基准周期为基础下的各周期分别对应的持续留存概率以及各用户在各周期下分别对应的留存概率,进而能准确确定用户在各周期下分别对应的类别。
附图说明
图1为一个实施例中用户类别确定方法的应用环境示意图;
图2为一个实施例中用户类别确定方法的流程示意图;
图3为一个另实施例中根据各平均留存概率,获取各用户在初始基准周期后各周期下分别对应的留存概率的步骤的流程示意图;
图4为另一个实施例中用户类别确定方法的流程示意图;
图5为一个实施例中用户类别确定装置的模块示意图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本申请,并不限定本申请的保护范围。
如图1为一个实施例中用户类别确定方法的应用环境示意图,该用户类别确定方法应用于用户类别确定方法系统。该用户类别确定方法系统包括终端10和服务器20。终端10和服务器20通过网络连接。服务器20可以用独立的服务器或者是多个服务器组成的服务器集群来实现。用户可在终端10的应用程序中进行注册,登录应用程序并使用,服务器20中可记录各用户对应用程序使用情况。上述用户类别确定方法根据用户的使用情况确定用户类别,该方法可应用于服务器20中,服务器20通过上述用户类别确定方法确定用户的类别后,可向用户发送对应的推荐信息,增加与用户的互动信息,以便提高用户的活跃度,防止用户的流失。
在一个实施例中,如图2所示,提供了一种用户类别确定方法。以该方法应用于图1中的服务器20为例进行说明,包括如下步骤:
S210:获取各用户分别在基准周期以及基准周期后的连续预设数目个周期内对应的用户登录状态信息。
用户登录应用程序过程中,服务器会记录用户的登录情况以及登录时长等信息。以周期形式记录登录情况,同一用户在不同周期内的登录情况不仅相同,不同用户在相同时期内或不同时期内的登录情况不仅相同。例如,用户A在当前周期前n个周期中的3个周期内登录过,用户B只在当前周期前n个周期中的1个周期内登录过。基准周期是从预设历史时间段内各历史周期中选择的周期,可根据实际需求或时间进行选择。用户登录状态信息表示用户的登录情况,可通过登录标记记录用户的登录状态信息,例如,用户在基准周期下有登录,则在基准周期下该用户标记已登录,已登录即表示该用户登录状态信息。可根据登录情况确定用户在对应周期内是否为活跃用户。例如,若用户A在基准周期有登录,则用户A在基准周期的用户登录状态信息为已登录状态信息,可表示用户A在基准周期下为活跃用户。若用户A在基准周期未登录,则用户A在基准周期的用户登录状态信息为非登录状态信息,可表示用户A在基准周期下为非活跃用户。
为确保后续准确确定用户类别,除需要获取各用户在基准周期的用户状态信息外,还需要获取在基准周期后的连续预设数据个周期内分别对应的用户状态信息,即还需要获取分别在各周期内对应的用户状态信息。例如,用户的数量为M,基准周期为T,预设数目可以为N,N为大于或等于1的正整数,则表示基准周期后连续N个周期,需要获取M个用户分别在基准周期T内的用户登录状态信息,比如,在基准周期T内有5个用户未登录,有M-5个用户有登录,还需获取M个用户分别在N个周期下分别对应的用户登录状态信息,则每个用户在N个周期下分别对应有用户登录状态信息。
S220:根据用户登录状态信息,统计在基准周期内活跃且在第一个周期依次至各周期内分别连续活跃的各持续活跃用户数,获得持续活跃用户数集;第一个周期为预设数目个周期中与基准周期相邻的周期。
在基准周期内活跃的用户可以理解在基准周期内有登录的用户。连续活跃表示在连续周期的每个周期中分别留存,例如,第一周期至第预设数目个周期内持续留存表示在第一个周期到第预设数目个周期中每个周期内分别留存。第一周期依次至各周期内分别持续留存也可以理解为第一周期依次至各周期内分别持续有登录。
例如,各周期包括第一个周期、第二个周期、……、第预设数目减一个周期以及第预设数目个周期,第一周期依次至各周期表示第一周期至第一周期(首末周期相同,即表示第一周期)、第一周期至第二周期、……、第一周期至第预设数目减一个周期以及第一周期至第预设数目个周期,针对单个基准周期,在第一个周期依次至各周期内分别连续活跃的各持续活跃用户数包括在第一周期留存的持续留存用户数据、第一周期至第二周期内连续活跃的持续留存用户数、……、第一周期至第预设数目减一个周期内连续活跃的持续留存用户数以及第一周期至第预设数目个周期内连续活跃的持续留存用户数。持续活跃用户数集中包括上述各持续活跃用户数。
S230:根据持续活跃用户数集以及在基准周期内活跃用户总数,确定基准周期后各周期分别对应的持续留存概率。
某周期下的持续留存概率表示在基准周期活跃,且在基准周期后第一个周期到该某周期内连续活跃的可能性。以基准周期为基础,在获得持续留存用户集后,则需要利用基准周期内活跃用户总数以确定以基准周期为基准,在各周期下分别对应的持续留存概率。例如,基准周期下各周期中第一周期下的持续留存概率表示在基准周期活跃且在第一周期内活跃的可能性,第二周期下的持续留存概率表示在基准周期活跃且在第一周期和第二周期中均活跃的可能性,依次类推,第预设数目个周期下的持续留存概率表示在基准周期活跃且在第一周期至第预设数目个周期内连续活跃的可能性。
S240:根据各持续留存概率,获取各用户分别在各周期下对应的留存概率。
上述持续留存概率反映了各用户的整体活跃情况,为确定每个用户各自对应的留存概率,需要确定各用户分别对应的留存概率,可以以上述持续留存概率为依据,确定各用户分别在各周期下对应的留存概率。
S250:根据各用户分别在各周期下对应的留存概率以及预设基准留存概率,确定各用户分别在基准周期后各周期下的类别。
由于在不同周期下,用户对应的留存概率不仅相同,在根据各用户分别在各周期下对应的留存概率以及预设基准留存概率,可确定各用户分别在各周期下的类别,即任意一个用户在每个周期下有对应的类别,表示用户在不同周期下有对应的类别,例如,若预设数目为N,则任意一个用户有N个类别。
上述用户类别确定方法,以各用户分别在基准周期以及基准周期后的连续预设数目个周期内对应的用户登录状态信息为依据,确定在基准周期内活跃且在第一个周期依次至各周期内分别连续活跃的各持续活跃用户数,进而确定在基准周期下各周期分别对应的持续留存概率,然后根据各持续留存概率,获取各用户分别在各周期下对应的留存概率,以此来确定用户分别在基准周期后各周期下的类别。由于上述各持续活跃用户数能准确反映以基准周期为基础,分别在第一个周期依次到各周期内用户连续活跃情况,以此可准确确定以基准周期为基础下的各周期分别对应的持续留存概率以及各用户在各周期下分别对应的留存概率,进而能准确确定用户在各周期下分别对应的类别。另外,通过上述用户类别确定方法不再只是确定用户的单一类别,容易导致确定的类别结果存在偶然性,而是可确定用户在不同周期下分别对应的类别,提高用户类别识别的稳定性。且可避免通过机器学习方法进行用户类别确定时需要进行大量的训练且处理过程复杂繁琐导致的效率低的问题,可提高类别识别效率且可节省存储资源。
在一个实施例中,基准周期包括连续的至少两个目标基准周期,任意一个目标基准周期对应有目标基准周期后的连续预设数目个周期,其中,各目标基准周期中最前的周期为初始基准周期;
持续活跃用户数集包括分别在各目标基准周期内活跃且在对应目标基准周期后的第一个周期依次至各周期内分别连续活跃的各持续活跃用户数;在基准周期内活跃用户总数包括分别在各目标基准周期内活跃的用户总数;基准周期后各周期分别对应的持续留存概率包括分别在各目标基准周期后各周期分别对应的持续留存概率;各用户分别在在各周期下的类别为各用户分别在初始基准周期后的连续的各周期下分别对应的类别。
在本实施例中,针对每个目标基准周期,统计在该目标基准周期内活跃且在该目标基准周期后的第一个周期依次至各周期内分别连续活跃的各持续活跃用户数,对每个目标基准周期对应的各持续活跃用户数做并集处理,则得到上述持续活跃用户数集。
可以理解,针对一个目标基准周期,其对应的各持续活跃用户数的数目为预设数目,例如,预设数目为N,则需要统计N次持续留存用户数,即在该目标基准周期内活跃且在第一个周期活跃的持续活跃用户数,在该目标基准周期内活跃且在第一个周期至第二个周期内连续活跃的持续活跃用户数,一直到在该目标基准周期内活跃且在第一个周期至第预设数目个周期内连续活跃的持续活跃用户数,则会有N个数目的持续活跃用户数,单个的持续活跃用户数可以有多个。由于基准周期有多个目标基准周期,以K个目标基准周期为例,一个目标基准周期对应有N个数目的持续活跃用户数,则K个目标基准周期对应有K*N个数目的持续活跃用户数,如此,上述持续活跃用户数集中包括K*N个持续留存用户数。
各目标基准周期内分别对应活跃的用户总数不仅相同,在分别以不同目标基准周期为基准的情况下,需要以对应目标基准周期下活跃用户的总数为依据获取在该目标基准周期下各周期分别对应的持续留存概率,在本实施例中,在基准周期内活跃用户总数则包括分别在各目标基准周期内活跃的用户总数,为后续处理提供依据。
针对任意一个目标基准周期,可获取在该目标基准周期下各周期分别对应的持续留存概率,基准周期包括至少两个目标基准周期,则基准周期下各单个周期分别对应的持续留存概率包括分别在各目标基准周期下各单个周期分别对应的持续留存概率。例如,一个目标基准周期后对应连续N个周期,则一个目标基准周期对应有N个持续留存概率,目标基准周期的数量为K,则对应有K*N个持续留存概率。
在本实施例中,以至少两个目标基准周期为基础,获取分别在各目标基准周期下各单个周期分别对应的持续留存概率,以此可准确获取各用户分别在各周期下分别对应的类别。
在一个实施例中,各目标基准周期包括初始基准周期以及初始基准周期后的连续预设个数个周期。其中,预设个数为各目标基准周期的数量减一。即各目标基准周期是连续的,能准确地反映用户在连续的时间段内用户留存情况,提高用户的留存概率的准确性,进而提高用户识别准确性。
在一个实施例中,根据各持续留存概率,获取各用户分别在各周期下对应的留存概率,包括:根据分别在各目标基准周期后各周期分别对应的持续留存概率,确定在初始基准周期后各周期下分别对应的平均留存概率;根据各平均留存概率,获取各用户在初始基准周期后各周期下分别对应的留存概率。
在获得每个目标基准周期下各周期分别对应的持续留存概率后,为提高用户对应留存率的准确性,可对各目标基准周期对应各周期下的留存概率,根据各周期相对于目标基准周期的位置,对应求周期下留存概率的平均值,得到在初始基准周期后各周期下分别对应的平均留存概率。例如,初始基准周期选择周期T,预设数目为N,即各周期的数量为N,各目标基准周期的数量为K,每个目标基准周期下有N个周期分别对应的留存概率,即在各目标基准周期中的第一个目标基准周期(即初始基准周期)下,对应有N个持续留存概率,即包括第一个目标基准周期后第一个周期对应的持续留存率到第N个周期对应的持续留存率。第二个目标基准周期下,对应有N个持续留存概率,即包括第二个目标基准周期后第一个周期对应的持续留存概率到第N个周期对应的持续留存概率。依次类推,第K个目标基准周期下,对应有N个持续留存概率,即包括第N个目标基准周期后第一个周期对应的持续留存率到第N个周期对应的持续留存率。针对每个目标基准周期下N个周期分别对应的持续留存概率,根据目标基准周期后的周期相对于目标基准周期的位置,对该周期下的各持续留存概率求平均值,可以将目标基准周期后的周期与该目标基准周期间隔的周期数相同的持续留存概率进行平均。以各周期中第一个周期为例(间隔一个周期),K个目标基准周期下的第一个周期分别对应有持续留存概率,对其进行求平均,即得到在初始基准周期后第一个周期下的平均留存率。如此,可确保各周期下留存概率的准确性,为后续准确获取各用户对应的留存概率提供保障。
例如,在初始基准周期后各周期下分别对应的平均留存概率包括在初始基准周期后第一个周期下的平均留存概率在初始基准周期后第二个周期下的平均留存概率……,在初始基准周期后第N个周期下的平均留存概率 其中,i=1,2,……,N。表示在各目标基准周期中的第j个目标基准周期后第i个周期对应的持续留存概率。
在一个实施例中,如图3所示,上述根据各平均留存概率,获取各用户在初始基准周期后各周期下分别对应的留存概率,包括:
S351:以初始基准周期前第预设数量个单个周期为基准,确定在第预设数量个单个周期内活跃且在第预设数量减一个单个周期依次至各单个周期内分别连续活跃的连续活跃用户集和用户连续留存率,分别获得各连续活跃用户集以及各用户连续留存率。
各单个周期为初始基准周期前的连续预设数量减一个单个周期,在第预设数量个单个周期内活跃且在第预设数量减一个单个周期依次至各单个周期内分别连续活跃的连续活跃用户集和用户连续留存率,表示在初始基准周期前第预设数量个单个周期内活跃且在初始基准周期前第预设数量减一个单个周期依次至各单个周期内分别连续活跃的连续活跃用户集和用户连续留存率。任意一个单个周期下的连续活跃用户表示以前第预设数量个单个周期为基准下(即在前第预设数量个单个周期内活跃),在第预设数量减一个单个周期至该单个周期内连续活跃的用户,可以有多个,通过连续活跃用户集表示在该单个周期下连续活跃的用户,则各连续活跃用户集表示各单个周期下分别对应的连续活跃用户集的组合。例如,在初始基准周期前第一个周期下的连续活跃用户包括用户A和用户B,用户A和用户B是从第预设数量减一个单个周期到前第一个周期中每个周期中均活跃(有登录过),则用户A和用户B组成前第一个周期下的一个连续活跃用户集,在初始基准周期前第二个周期下的连续活跃用户包括用户C和用户D,则用户C和用户D组成前第二个周期下的一个连续活跃用户集,直到初始基准周期前各单个周期下分别对应的连续活跃用户确定完毕,则可获得各连续活跃用户集。另外,各单个周期下分别对应用户连续活跃率,确定用户连续活跃率的方式与上述确定持续留存概率的方式类似,不同之处在于周期不同,上述持续留存概率依据的周期为基准周期后各周期,而上述用户连续活跃率依据的周期为初始基准周期前各单个周期,对于某单个周期的用户连续活跃率,表示在基准周期前第预设数量个单个周期活跃且在该第预设数量个周期到该某单个周期内连续活跃的可能性。
S352:分别提取各连续活跃用户集中连续活跃用户的特征,并根据各连续活跃用户集中连续活跃用户的特征以及各用户连续留存率,确定连续活跃用户的特征分别对应的特征权重。
在获得各连续活跃用户集后,即可提取各连续活跃用户集中连续活跃用户的特征。单个周期下有其对应的连续活跃用户集和用户连续活跃率,根据各连续活跃用户的特征以及各用户连续活跃率,可确定各连续活跃用户的特征分别对应的特征权重。在一个示例中,上述特征可以包括登录时长、登录次数以及登录时间段等,即可确定登录时长、登录次数以及登录时间段等特征分别对应的特征权重,以反映特征对用户连续活跃率的影响程度。可以理解,特征作为自变量,用户连续活跃率作为因变量,自变量的变化影响因变量,至于影响程度有多大,可以依赖特征与用户连续活跃率之间对应的比例系数,即特征权重。
在一个示例中,可通过最小二乘法根据各连续活跃用户的特征以及各用户连续活跃率,确定连续活跃用户的特征分别对应的特征权重。即将各连续活跃用户的特征作为最小二乘法中的输入,各用户连续活跃率作为最小二乘法与输入对应的输出,初始时,最小二乘法有对应的各初始回归系数即各初始特征权重,最小二乘法根据各连续活跃用户的特征以及各用户连续活跃率进行处理,得到最优的各回归系数,即得到各特征权重。
S353:根据各特征权重、各平均留存率以及分别在初始基准周期、初始基准周期后各周期下对应的活跃用户的特征,获取初始基准周期、初始基准周期后各周期下分别对应的活跃用户的初始调整值。
在某周期下的活跃用户可以表示在该周期下有登录的用户。在各特征权重确定后,连续活跃用户的特征与用户持续留存率之间的关系确定,如此,可根据分别在初始基准周期、初始基准周期后的各周期下对应的活跃用户的特征,确定初始基准周期、初始基准周期后的各周期下对应的活跃用户的留存率。在一个示例中,可以将初始基准周期、初始基准周期后的各周期下对应的活跃用户的留存率分别除以对应的平均留存率,即可得到初始基准周期、初始基准周期后的各周期下对应的活跃用户的初始调整值。
S354:根据各初始调整值以及各平均留存概率,获取各用户在初始基准周期后各周期下分别对应的留存概率。
在初始基准周期、初始基准周期后的各周期下分别对应的活跃用户的初始调整值确定后,可以理解,在初始基准周期、初始基准周期后的各周期下各自有对应的活跃用户,然而,在不同周期下有相同的活跃用户,例如,用户A在各周期下均活跃,如此,在各周期下分别对用户A的初始调整值进行了确定,需要对用户A在各周期下的初始调整值进行处理后确定用户A的调整值,然后再获取对用户A在各周期下分别对应的留存概率进行。如此,可根据各初始调整值以及各平均留存概率,获取各用户在初始基准周期后的各周期下分别对应的留存概率。
在一个实施例中,获取各用户在初始基准周期后各周期下分别对应的留存概率的方式包括:根据各初始调整值,确定各用户分别对应的平均调整值;根据各平均调整值以及各平均留存概率,获取各用户在初始基准周期后各周期下分别对应的留存概率。
在本实施例中,根据初始基准周期、初始基准周期后的各周期下分别对应的活跃用户的初始调整值,可对同一活跃用户在不同周期下的初始调整值求均值,如此,可确定各用户分别对应的平均调整值,以提高后续用户对应留存概率的准确性。需要说明的是,上述初始调整值为活跃用户对应的值,而后续是确定各用户分别对应的平均调整值,此处,各用户表示在初始基准周期和初始基准周期后的各周期中至少一个周期内活跃过的用户。
在一个示例中,获取各用户在初始基准周期后各周期下分别对应的留存概率的公式如下:
其中,为初始基准周期后第i个周期下的平均留存概率,ah为第h个用户对应的平均调整值,为第h个用户在初始基准周期后第i个周期下对应的留存概率,h=1,2,……,M,M为各用户的数量。
在一个实施例中,用户在初始基准周期后各周期下分别对应的留存概率为该用户对应的平均调整值分别乘以初始基准周期后各周期下分别对应的平均留存概率。
在一个实施例中,各单个周期的数量为预设数量减一。
上述方法还包括:获取各用户分别在初始基准周期前各单个周期内对应的历史登录状态信息;
确定在第预设数量个单个周期内活跃且在第预设数量减一个单个周期依次至各单个周期内分别连续活跃的连续活跃用户集和用户连续留存率的方式包括:根据历史登录状态信息,统计在初始基准周期前第预设数量个周期内活跃,且在初始基准周期前第预设数量减一个单个周期依次至前第一个单个周期内分别连续活跃的各连续活跃用户数,获得连续活跃用户数集;根据连续活跃用户数集以及在第预设数量个单个周期内活跃用户总数,确定以初始基准周期前第预设数量个单个周期为基准,分别在初始基准周期前各单个周期内对应的用户连续留存率。
在本实施例中,以分别在初始基准周期前的连续预设数量个单个周期内的用户登录状态信息为依据,能准确反映用户在初始基准周期前的连续预设数量个单个周期内的用户登录情况,进而能准确确定分别在初始基准周期前各单个周期内对应的用户连续留存率,其确定过程与上述确定基准周期下各周期分别对应的持续留存概率的过程类似,不同之处仅在于所依据的周期不同,从而依据的登录状态信息不同。其中,历史登录信息状态信息除包括上述各用户分别在初始基准周期前各单个周期内对应的登录状态信息外,还可包括各用户在前第预设数量个单个周期下的登录状态信息。
在一个实施例中,基准周期后的各周期分别对应预设基准留存概率。
在本实施例中,根据各用户分别在各周期下对应的留存概率以及预设基准留存概率,确定各用户分别在基准周期后各周期下的类别,包括:将各用户分别在基准周期后各周期下对应的留存概率分别与对应的预设留存概率进行比较;在留存概率小于对应的预设留存概率时,确定在该预设留存概率对应的周期下留存概率对应用户的类别为流失用户。
各周期分别对应预设基准留存概率可以不同,在留存概率小于对应的预设留存概率时,表示用户在对应周期留存的可能性较小,可认为该用户在该周期下为流失用户。
在一个实施例中,确定在该预设留存概率对应的周期下留存概率对应用户的类别为流失用户之后,还包括:在该预设留存概率对应的周期下,将该用户标记为流失。例如,流失的标记可以为0,则可将该用户标记为0。
在一个实施例中,还包括:在留存概率大于或等于对应的预设留存概率时,确定在该预设留存概率对应的周期下留存概率对应用户的类别为留存用户。
在留存概率大于或等于对应的预设留存概率时,表示用户在对应周期留存的可能性较大,可认为该用户在该周期下为留存用户,在一定程度上也说明该用户在各周期登录频次较高。
在一个实施例中,确定在该预设留存概率对应的周期下留存概率对应用户的类别为留存用户之后,还包括:在该预设留存概率对应的周期下,将该用户标记为留存。例如,留存的标记可以为1,则可将该用户标记为1。
又例如,在每个周期内留存标记为1,流失标记为0,那么在两个周期内持续留存则标记为11,在两个周期内前一个周期留存但后一个周期流失则标记为10,在两个周期内前一个周期流失但后一个周期留存则标记为01,在两个周期内均流失则标记为00。
在一个实施例中,确定各用户分别在基准周期后各周期下的类别之后,还包括:根据各用户分别在基准周期后各周期下的类别,确定待推荐用户;获取各待推荐用户分别对应的推荐信息并推送。
由于用户在各周期下的类别不仅相同,可通过用户在个周期下的类别确定待推荐用户。用户在各周期下的类别为流失用户的次数越多表示该用户在各周期下大部分时间为流失用户,从而可将在各周期下的类别为流失用户的次数大于预设次数的用户确定为待推荐用户。向待推荐用户推送对应的推荐信息,如此可增加向推荐用户发送的信息,以提高待推荐用户活跃度,以便挽留待推荐用户。
应该理解的是,虽然图2-3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
如图4所示,以一个实施例对上述用户类别确定方法的流程加以具体说明。以应用程序A的用户使用情况,初始基准周期为T周期、预设数目为N(即基准周期后的各周期的数量为N,可依次表示为T+1、T+2、……、T+N-1、T+N)、预设数量为N+1(即基准周期前的各单个周期的数量为N,可依次表示为T-1、T-2、……、T-N+1、T-N)、各目标基准周期的数量为K以及各用户的数量为M、各目标基准周期依次为T、T+1、T+2、……、T+K周期为例进行说明。基准周期包括各目标基准周期,基准周期以及基准周期后的连续N个周期内对应的用户登录状态信息即为T、T+1、T+2、……、T+N-1、T+N、……T+K+N周期内对应的用户登录状态信息。
首先,获取源数据:即获取各用户分别在T、T+1、T+2、……、T+N-1、T+N、……T+K+N周期对应的用户登录状态信息,和各用户分别在T-1、T-2、……、T-N+1、T-N周期内对应的历史登录状态信息。
然后,以T周期为基准,获取在T周期活跃且在T+1周期活跃的持续活跃用户数、在T周期活跃且在T+1周期和T+2周期内连续活跃的持续活跃用户数、在T周期活跃且在T+1周期、T+2周期和T+3周期内连续活跃的持续活跃用户数、……、在T周期活跃且在T+1周期至T+N周期内连续活跃的持续活跃用户数。进而可根据T周期内活跃用户总数确定T周期后连续N个周期分别对应的持续活跃概率,即以T周期为基准,在T+1周期下的持续活跃概率,T+2的周期内的持续活跃概率,T+3的周期内的持续活跃概率,……,一直到T+N的周期内的持续活跃概率。在以T周期基准情况下,T期后的连续N个周期中第一个周期即为T+1期。
以T+1周期基准,获取在T+1周期活跃且在T+2周期活跃的持续活跃用户数、在T+1周期活跃且在T+2周期和T+3周期内连续活跃的持续活跃用户数、在T+1周期活跃且在T+2周期、T+3周期和T+4周期内连续活跃的持续活跃用户数、……、在T+1周期活跃且在T+2周期至T+N周期内连续活跃的持续活跃用户数。进而可根据T+1周期内活跃用户总数确定T+1周期后连续N个周期分别对应的持续活跃概率,即在T+2周期下的持续活跃概率,T+3的周期内的持续活跃概率,T+4的周期内的持续活跃概率,……,一直到T+1+N的周期内的持续活跃概率。在以T+1周期基准情况下,T+1期后的连续N个周期中第一个周期即为T+2期,可以理解为T+1周期对应的各周期相对于T周期对应的各周期向后移了一个周期。
依次类推,直到以T+K-1周期基准,获取在T+K-1周期活跃且在T+K周期活跃的持续活跃用户数、在T+K-1周期活跃且在T+K周期和T+K+1周期内连续活跃的持续活跃用户数、在T+K-1周期活跃且在T+K周期、T+K+1周期和T+K+2周期内连续活跃的持续活跃用户数、……、在T+K-1周期活跃且在T+K周期至T+K-1+N周期内连续活跃的持续活跃用户数。进而可根据T+K-1周期内活跃用户总数确定T+K-1周期后连续N个周期分别对应的持续活跃概率,即在T+K-1周期下的持续活跃概率,T+1+K周期内的持续活跃概率,T+2+K周期内的持续活跃概率,……,一直到T+N+K-1周期内的持续活跃概率。
其次,获取分别在T-N+1、T-N、……、T-1周期内的活跃用户,以T-N+1周期(即T周期前第N+1个单个周期)为基准,获取在T-N+1周期活跃且在T-N周期活跃的连续活跃用户数、在T-N+1周期活跃且在T-N周期和T-N+1周期内连续活跃的连续活跃用户数、在T-N+1周期活跃且在T-N周期、T-N+1周期和T-N+2周期内连续活跃的连续活跃用户数、……、一直到在T-N+1周期活跃且在T-N周期至T-1周期内连续活跃的连续活跃用户数。进而可根据在T-N+1周期内的活跃用户总数确定以T-N+1周期(即T周期前第N个单个周期)为基准,在T-N+1周期活跃且在T-N周期留存的用户连续活跃率、在T-N+1周期活跃且在T-N周期和T-N+1周期内连续活跃的用户连续活跃率、在T-N+1周期活跃且在T-N周期、T-N+1周期和T-N+2周期内连续活跃的用户连续活跃率、……、在T-N+1周期活跃且在T-N周期至T-1周期内连续活跃的用户连续活跃率。
获取在T-N、T-N+1、……、T-1周期下分别对应的连续活跃用户集(以T-1周期下的连续活跃用户集为例,为在T-N+1周期活跃,且在T-N至T-1周期内连续活跃的用户)以及其中连续活跃用户对应的特征,特征可选用登录次数和登录时长。如此,可根据各连续活跃用户集中连续活跃用户的特征以及各用户连续活跃率,确定连续活跃用户的特征分别对应的特征权重,即可确定登录次数和登录时长分别对应的特征权重。在一个实施例中,可通过最小二乘法确定特征权重。
若T周期下活跃用户为用户A和用户B、T+1周期下活跃用户为用户A和用户C、……、T+N周期下活跃用户为用户C和用户D,根据各周期分别对应的活跃用户的特征,可确定分别在T+1至T+N周期下分别对应的活跃用户的留存率,再将其分别除以对应的平均留存概率,即可得到T、T+1至T+N周期下对应的活跃用户的初始调整值,例如,可得到在T周期下用户A和用户B分别对应的初始调整值,T+1周期下活跃用户为用户A和用户C分别对应的初始调整值,T+N周期下活跃用户为用户C和用户D分别对应的初始调整值,其中,一个用户在不同周期下可能活跃,则该用户在不同周期下分别对应有初始调整值,为提高准确性,可根据该用户活跃的次数进行平均处理,得到各用户分别对应的平均调整值。然后根据各平均调整值以及各平均留存概率,获取各用户在T+1至T+N周期下分别对应的留存概率。
若T+1周期对应的预设留存概率为P1,T+2周期对应的预设留存概率为P2,……,T+N周期对应的预设留存概率为PN。将各用户分别在T+1至T+N周期下对应的留存概率分别与对应的预设留存概率进行比较,即将用户在T+1周期下的留存概率与P1比较,若小于P1,则确定该用户在T+1周期下的类别为流失用户,在T+2周期下的留存概率与P2比较,若大于P2,则确定该用户在T+2周期下的类别为留存用户……,在T+N周期下的留存概率与PN比较,若小于P1,则确定该用户在T+1周期下的类别为流失用户。若用户分别在T+1至T+N周期下的类别为流失用户的次数大于预设次数,则将该用户确定为待推荐用户,向其推送推荐信息,以挽留该用户,防止该用户流失。
将上述用户类别确定方法与现有根据用户静态指标特征通过机器学习方法(例如,LR(逻辑)回归方法)确定用户类别的过程进行比较。
首先,基于现有通过机器学习方法:根据T-1期用户静态指标特征和用户分类标签数对机器学习模型进行训练得到预测模型,在根据预测模型得到基准留存概率预测值,并根据其确定用户留存概率。将50%作为临界点,以此对用户进行分类(用户留存概率<50%为流失用户,标记为0,用户留存概率>=50%为非流失用户,标记为1)。
本实施例的用户类别确定方法:分别以T、…、T+k-1为基准,分别在[T+1、…、T+N];…;[T+k、…、T+k-1+N]周期各用户持续活跃概率及平均留存概率,并根据用户的特征计算分别以T、…、T+k-1周期为基准,各用户在T周期后的N个周期中每个周期的留存概率,用户在T周期后的第i个(i=1,2,……,N)期的留存概率低于对应第i个周期的预设基准留存概率的判为预流失用户,并标记为0,大于或等于对应预设基准留存概率的判为非流失用户即留存用户,并标记为1。
另外,以应用程序A为例,确定在应用程序A上的用户的类别确定方法。基于LR回归方法,需要准备数特征,其中包括用户基础数(性别、年龄等)和用户静态指标特征(例如,用户登录类特征(登录时长、次数、天数等)、充值类特征(金额、次数、用户平均收入等)、游戏表现等共1500个特征),并选择LR模型进行训练预测,训练1501个参数(1500个特征加标签)。现有的方法需要13个python脚本,8个scala脚本完成整个干预过程,需要耗费较大的人力和物力,且训练过程需要耗费大量时间,导致整个类别确定效率低。
然而,基于本实施例的方法,使用持续活跃率,估算平均留存率,再根据用户在应用程序中的特征计算用户调整值,从而得到每个用户在应用程序A中T、T+1、…、T+N中每各周期下的留存率,T、T+1、…、T+N周期下对应的留存率分别与1对比,取最小值,更新T、T+1、…、T+N中每各周期下的留存率。最后将用户在各周期下的留存概率与分别与对应预设基准留存概率进行对比,得到用户分类。具体对比结果如表1所示。
其中,查全率表示对用户进行类别确定后得到分别在各周期下的留存用户与在对应周期下实际留存用户的交集的数量除以实际留存用户的数量。从表1中数据可知,本实施例的方法无论是查全率还是查准率均比现有方法更优,且本实施例的方法用时短所需的存储空间小。
在一个实施例中,如图5所示,提供一种用户类别确定方法装置,包括:
信息获取模块510,用于获取各用户分别在基准周期以及基准周期后的连续预设数目个周期内对应的用户登录状态信息。
用户数统计模块520,用于根据用户登录状态信息,统计在基准周期内活跃且在第一个周期依次至各周期内分别连续活跃的各持续活跃用户数,获得持续活跃用户数集。第一个周期为预设数目个周期中与基准周期相邻的周期。
概率确定模块530,用于根据持续活跃用户数集以及在基准周期内活跃用户总数,确定基准周期后各周期分别对应的持续留存概率。
概率获取模块540,用于根据各持续留存概率,获取各用户分别在各周期下对应的留存概率。
类别确定模块550,用于根据各用户分别在各周期下对应的留存概率以及预设基准留存概率,确定各用户分别在基准周期后各周期下的类别。
上述用户类别确定装置,以各用户分别在基准周期以及基准周期后的连续预设数目个周期内对应的用户登录状态信息为依据,确定在基准周期内活跃且在第一个周期依次至各周期内分别连续活跃的各持续活跃用户数,进而确定在基准周期后各周期分别对应的持续留存概率,然后根据各持续留存概率,获取各用户分别在各周期下对应的留存概率,以此来确定用户分别在基准周期后各周期下的类别。由于上述各持续活跃用户数能准确反映以基准周期为基础,分别在第一个周期依次到各周期内用户连续活跃情况,以此可准确确定以基准周期为基础下的各周期分别对应的持续留存概率以及各用户在各周期下分别对应的留存概率,进而能准确确定用户在各周期下分别对应的类别。
在一个实施例中,基准周期包括连续的至少两个目标基准周期,任意一个目标基准周期对应有目标基准周期后的连续预设数目个周期,其中,各目标基准周期中最前的周期为初始基准周期;
持续活跃用户数集包括分别在各目标基准周期内活跃且在对应目标基准周期后的第一个周期依次至各周期内分别连续活跃的各持续活跃用户数;在基准周期内活跃用户总数包括分别在各目标基准周期内活跃的用户总数;基准周期后各周期分别对应的持续留存概率包括分别在各目标基准周期后各周期分别对应的持续留存概率;各用户分别在在各周期下的类别为各用户分别在初始基准周期后的连续的各周期下分别对应的类别。
在一个实施例中,概率获取模块540包括:
平均留存概率获取模块,用于根据分别在各目标基准周期后各周期分别对应的持续留存概率,确定在初始基准周期后各周期下分别对应的平均留存概率。
留存概率获取模块,用于根据各平均留存概率,获取各用户在初始基准周期后各周期下分别对应的留存概率。
在一个实施例中,上述留存概率获取模块,包括:
确定模块,用于以初始基准周期前第预设数量个单个周期为基准,确定在第预设数量个单个周期内活跃且在第预设数量减一个单个周期依次至各单个周期内分别连续活跃的连续活跃用户集和用户连续留存率,分别获得各连续活跃用户集以及各用户连续留存率。
权重获取模块,用于分别提取各连续活跃用户集中连续活跃用户的特征,并根据各连续活跃用户集中连续活跃用户的特征以及各用户连续留存率,确定连续活跃用户的特征分别对应的特征权重。
初始调整值获取模块,用于根据各特征权重、各平均留存率以及分别在初始基准周期、初始基准周期后各周期下对应的活跃用户的特征,获取初始基准周期、初始基准周期后各周期下分别对应的活跃用户的初始调整值。
留存概率确定模块,用于根据各初始调整值以及各平均留存概率,获取各用户在初始基准周期后各周期下分别对应的留存概率。
在一个实施例中,留存概率确定模块,用于根据各初始调整值,确定各用户分别对应的平均调整值;根据各平均调整值以及各平均留存概率,获取各用户在初始基准周期后各周期下分别对应的留存概率。
在一个实施例中,各单个周期的数量为预设数量减一。
上述装置还包括:历史登录信息获取模块,用于获取各用户分别在初始基准周期前各单个周期内对应的历史登录状态信息。
上述确定模块,包括:
用户统计模块,用于根据历史登录状态信息,统计在初始基准周期前第预设数量个周期内活跃,且在初始基准周期前第预设数量减一个单个周期依次至前第一个单个周期内分别连续活跃的各连续活跃用户数,获得连续活跃用户数集。
用户连续留存率获取模块,用于根据连续活跃用户数集以及在第预设数量个单个周期内活跃用户总数,确定以初始基准周期前第预设数量个单个周期为基准,分别在初始基准周期前各单个周期内对应的用户连续留存率。
在一个实施例中,基准周期后的各周期分别对应预设基准留存概率。
上述类别确定模块,包括:
比较模块,用于将各用户分别在基准周期后各周期下对应的留存概率分别与对应的预设留存概率进行比较。
用户确定模块,用于在留存概率小于对应的预设留存概率时,确定在该预设留存概率对应的周期下留存概率对应用户的类别为流失用户。
在一个实施例中,上述用户确定模块,还用于在留存概率大于或等于对应的预设留存概率时,确定在该预设留存概率对应的周期下留存概率对应用户的类别为留存用户。
在一个实施中,上述装置还包括:
推荐用户确定模块,用于根据各用户分别在基准周期后各周期下的类别,确定待推荐用户。
推送模块,用于获取各待推荐用户分别对应的推荐信息并推送。
关于用户类别确定方法装置的具体限定可以参见上文中对于用户类别确定方法的限定,在此不再赘述。上述用户类别确定方法装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是图1中的服务器20,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种用户类别确定方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述用户类别确定方法的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述用户类别确定方法的步骤:
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (12)
1.一种用户类别确定方法,其特征在于,包括:
获取各用户分别在基准周期以及所述基准周期后的连续预设数目个周期内对应的用户登录状态信息;
根据所述用户登录状态信息,统计在所述基准周期内活跃且在第一个周期依次至各所述周期内分别连续活跃的各持续活跃用户数,获得持续活跃用户数集;所述第一个周期为预设数目个所述周期中与所述基准周期相邻的周期;
根据所述持续活跃用户数集以及在所述基准周期内活跃用户总数,确定所述基准周期后各所述周期分别对应的持续留存概率;
根据各所述持续留存概率,获取各所述用户分别在各所述周期下对应的留存概率;
根据各所述用户分别在各所述周期下对应的留存概率以及预设基准留存概率,确定各所述用户分别在基准周期后各所述周期下的类别。
2.根据权利要求1所述的用户类别确定方法,其特征在于,
所述基准周期包括连续的至少两个目标基准周期,任意一个所述目标基准周期对应有所述目标基准周期后的连续预设数目个周期,其中,各所述目标基准周期中最前的周期为初始基准周期;
所述持续活跃用户数集包括分别在各所述目标基准周期内活跃且在对应所述目标基准周期后的第一个周期依次至各所述周期内分别连续活跃的各持续活跃用户数;在所述基准周期内活跃用户总数包括分别在各所述目标基准周期内活跃的用户总数;所述基准周期后各所述周期分别对应的持续留存概率包括分别在各所述目标基准周期后各所述周期分别对应的持续留存概率;各所述用户分别在在各所述周期下的类别为各所述用户分别在所述初始基准周期后的连续的各周期下分别对应的类别。
3.根据权利要求2所述的用户类别确定方法,其特征在于,所述根据各所述持续留存概率,获取各所述用户分别在各所述周期下对应的留存概率,包括:
根据分别在各所述目标基准周期后各所述周期分别对应的持续留存概率,确定在所述初始基准周期后各所述周期下分别对应的平均留存概率;
根据各所述平均留存概率,获取各所述用户在所述初始基准周期后各所述周期下分别对应的留存概率。
4.根据权利要求3所述的用户类别确定方法,其特征在于,所述根据各所述平均留存概率,获取各所述用户在所述初始基准周期后各所述周期下分别对应的留存概率,包括:
以所述初始基准周期前第预设数量个单个周期为基准,确定在所述第预设数量个单个周期内活跃且在第预设数量减一个单个周期依次至各单个周期内分别连续活跃的连续活跃用户集和用户连续留存率,分别获得各所述连续活跃用户集以及各所述用户连续留存率;
分别提取各所述连续活跃用户集中连续活跃用户的特征,并根据各所述连续活跃用户集中连续活跃用户的特征以及各所述用户连续留存率,确定所述连续活跃用户的特征分别对应的特征权重;
根据各所述特征权重、各所述平均留存率以及分别在所述初始基准周期、所述初始基准周期后各所述周期下对应的活跃用户的特征,获取所述初始基准周期、所述初始基准周期后各所述周期下分别对应的活跃用户的初始调整值;
根据各所述初始调整值以及各所述平均留存概率,获取各所述用户在所述初始基准周期后各所述周期下分别对应的留存概率。
5.根据权利要求4所述的用户类别确定方法,其特征在于,获取各所述用户在所述初始基准周期后各所述周期下分别对应的留存概率的方式包括:
根据各所述初始调整值,确定各所述用户分别对应的平均调整值;
根据各所述平均调整值以及各所述平均留存概率,获取各所述用户在所述初始基准周期后各所述周期下分别对应的留存概率。
6.根据权利要求4所述的用户类别确定方法,其特征在于,各所述单个周期的数量为预设数量减一;
上述方法还包括:获取各用户分别在所述初始基准周期前各单个周期内对应的历史登录状态信息;
确定在所述第预设数量个单个周期内活跃且在第预设数量减一个单个周期依次至各所述单个周期内分别连续活跃的连续活跃用户集和用户连续留存率的方式包括:
根据所述历史登录状态信息,统计在所述初始基准周期前第预设数量个周期内活跃,且在所述初始基准周期前第预设数量减一个单个周期依次至前第一个单个周期内分别连续活跃的各连续活跃用户数,获得连续活跃用户数集;
根据所述连续活跃用户数集以及在所述第预设数量个单个周期内活跃用户总数,确定以所述初始基准周期前第预设数量个单个周期为基准,分别在所述初始基准周期前各单个周期内对应的用户连续留存率。
7.根据权利要求1所述的用户类别确定方法,其特征在于,
所述基准周期后的各所述周期分别对应预设基准留存概率;
根据各所述用户分别在各所述周期下对应的留存概率以及预设基准留存概率,确定各所述用户分别在基准周期后各所述周期下的类别,包括:
将各所述用户分别在所述基准周期后各所述周期下对应的留存概率分别与对应的预设留存概率进行比较;
在所述留存概率小于对应的预设留存概率时,确定在该预设留存概率对应的周期下所述留存概率对应用户的类别为流失用户。
8.根据权利要求7所述的用户类别确定方法,其特征在于,还包括:
在所述留存概率大于或等于对应的预设留存概率时,确定在该预设留存概率对应的周期下所述留存概率对应用户的类别为留存用户。
9.根据权利要求1所述的用户类别确定方法,其特征在于,确定各所述用户分别在基准周期后各所述周期下的类别之后,还包括:
根据各所述用户分别在基准周期后各所述周期下的类别,确定待推荐用户;
获取各所述待推荐用户分别对应的推荐信息并推送。
10.一种用户类别确定方法装置,其特征在于,包括:
信息获取模块,用于获取各用户分别在基准周期以及所述基准周期后的连续预设数目个周期内对应的用户登录状态信息;
用户数统计模块,用于根据所述用户登录状态信息,统计在所述基准周期内活跃且在第一个周期依次至各所述周期内分别连续活跃的各持续活跃用户数,获得持续活跃用户数集;所述第一个周期为预设数目个所述周期中与所述基准周期相邻的周期;
概率确定模块,用于根据所述持续活跃用户数集以及在所述基准周期内活跃用户总数,确定所述基准周期后各所述周期分别对应的持续留存概率;
概率获取模块,用于根据各所述持续留存概率,获取各所述用户分别在各所述周期下对应的留存概率;
类别确定模块,用于根据各所述用户分别在各所述周期下对应的留存概率以及预设基准留存概率,确定各所述用户分别在基准周期后各所述周期下的类别。
11.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-9中任意一项所述的方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现上述权利要求1-9中任意一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810141042.5A CN110166498B (zh) | 2018-02-11 | 2018-02-11 | 用户类别确定方法及装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810141042.5A CN110166498B (zh) | 2018-02-11 | 2018-02-11 | 用户类别确定方法及装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110166498A true CN110166498A (zh) | 2019-08-23 |
CN110166498B CN110166498B (zh) | 2021-09-28 |
Family
ID=67634972
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810141042.5A Active CN110166498B (zh) | 2018-02-11 | 2018-02-11 | 用户类别确定方法及装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110166498B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111461188A (zh) * | 2020-03-20 | 2020-07-28 | 腾讯科技(深圳)有限公司 | 一种目标业务控制方法、装置、计算设备及存储介质 |
CN111666535A (zh) * | 2020-04-24 | 2020-09-15 | 北京奇艺世纪科技有限公司 | 确定用户活跃时长的方法、装置、电子设备及存储介质 |
CN112085323A (zh) * | 2020-07-30 | 2020-12-15 | 北京明略软件系统有限公司 | 基于活跃度指标的关联可信度评估方法和装置 |
CN112245934A (zh) * | 2020-11-16 | 2021-01-22 | 腾讯科技(深圳)有限公司 | 虚拟场景应用中虚拟资源的数据分析方法、装置及设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104182474A (zh) * | 2014-07-30 | 2014-12-03 | 北京拓明科技有限公司 | 一种预流失用户的识别方法 |
CN104679969A (zh) * | 2013-11-29 | 2015-06-03 | 腾讯科技(深圳)有限公司 | 防止用户流失的方法及装置 |
CN105069526A (zh) * | 2015-07-31 | 2015-11-18 | 中国太平洋保险(集团)股份有限公司 | 一种计算员工留存度概率的计算方法 |
WO2016194628A1 (ja) * | 2015-05-29 | 2016-12-08 | 日本電気株式会社 | 解約予測を用いた営業活動支援装置及び営業活動支援方法 |
-
2018
- 2018-02-11 CN CN201810141042.5A patent/CN110166498B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104679969A (zh) * | 2013-11-29 | 2015-06-03 | 腾讯科技(深圳)有限公司 | 防止用户流失的方法及装置 |
CN104182474A (zh) * | 2014-07-30 | 2014-12-03 | 北京拓明科技有限公司 | 一种预流失用户的识别方法 |
WO2016194628A1 (ja) * | 2015-05-29 | 2016-12-08 | 日本電気株式会社 | 解約予測を用いた営業活動支援装置及び営業活動支援方法 |
CN105069526A (zh) * | 2015-07-31 | 2015-11-18 | 中国太平洋保险(集团)股份有限公司 | 一种计算员工留存度概率的计算方法 |
Non-Patent Citations (1)
Title |
---|
吴悦昕,赵鑫,过岩巍,闫宏飞: "在线游戏用户的流失预测:基于不平衡数据的采样方法比较和分析", 《中文信息学报》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111461188A (zh) * | 2020-03-20 | 2020-07-28 | 腾讯科技(深圳)有限公司 | 一种目标业务控制方法、装置、计算设备及存储介质 |
CN111461188B (zh) * | 2020-03-20 | 2023-09-12 | 腾讯科技(深圳)有限公司 | 一种目标业务控制方法、装置、计算设备及存储介质 |
CN111666535A (zh) * | 2020-04-24 | 2020-09-15 | 北京奇艺世纪科技有限公司 | 确定用户活跃时长的方法、装置、电子设备及存储介质 |
CN111666535B (zh) * | 2020-04-24 | 2023-09-26 | 北京奇艺世纪科技有限公司 | 确定用户活跃时长的方法、装置、电子设备及存储介质 |
CN112085323A (zh) * | 2020-07-30 | 2020-12-15 | 北京明略软件系统有限公司 | 基于活跃度指标的关联可信度评估方法和装置 |
CN112245934A (zh) * | 2020-11-16 | 2021-01-22 | 腾讯科技(深圳)有限公司 | 虚拟场景应用中虚拟资源的数据分析方法、装置及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN110166498B (zh) | 2021-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110166498B (zh) | 用户类别确定方法及装置、计算机设备及存储介质 | |
CN109308552A (zh) | 一种业务策略评估方法、装置及电子设备 | |
CN111784173B (zh) | Ab实验数据处理方法、装置、服务器及介质 | |
CN115809569B (zh) | 基于耦合竞争失效模型的可靠性评价方法和装置 | |
CN112669091A (zh) | 数据处理方法、装置及存储介质 | |
CN113869931A (zh) | 广告投放策略确定方法、装置、计算机设备和存储介质 | |
CN113946986A (zh) | 基于加速退化试验的产品平均失效前时间评估方法和装置 | |
CN115795920A (zh) | 基于多应力耦合加速模型的产品可靠性评价方法和装置 | |
CN114201626B (zh) | 多媒体推荐方法、装置、电子设备及存储介质 | |
CN110544132B (zh) | 用户常活动位置的确定方法、装置、设备和存储介质 | |
CN108900339B (zh) | 一种度量业务质量的方法、装置及电子设备 | |
CN110602207A (zh) | 基于离网预测推送信息的方法、装置、服务器和存储介质 | |
CN112435070B (zh) | 确定用户年龄的方法、装置、设备及存储介质 | |
CN116610547A (zh) | 服务器性能评估方法、装置、计算机设备和存储介质 | |
CN111783883A (zh) | 一种异常数据的检测方法及装置 | |
CN116737373A (zh) | 负载均衡方法、装置、计算机设备、存储介质 | |
CN111046240A (zh) | 网关流量统计方法、装置、计算机设备和存储介质 | |
CN111598390B (zh) | 服务器高可用性评估方法、装置、设备和可读存储介质 | |
CN112860763B (zh) | 实时流数据处理方法、装置、计算机设备和存储介质 | |
CN115473219A (zh) | 负荷预测方法、装置、计算机设备和存储介质 | |
CN110874612B (zh) | 时段预测方法、装置、计算机设备和存储介质 | |
CN110795255B (zh) | 数据批量值调整方法、装置、可读存储介质和设备 | |
CN114461895A (zh) | 医疗资讯推送方法、装置、计算机设备和存储介质 | |
CN110659269B (zh) | 用户访问数据处理方法、装置、计算机设备及存储介质 | |
CN112488528A (zh) | 数据集的处理方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |