CN112884515A - 用户流失的预测方法、装置及计算机存储介质 - Google Patents
用户流失的预测方法、装置及计算机存储介质 Download PDFInfo
- Publication number
- CN112884515A CN112884515A CN202110197291.8A CN202110197291A CN112884515A CN 112884515 A CN112884515 A CN 112884515A CN 202110197291 A CN202110197291 A CN 202110197291A CN 112884515 A CN112884515 A CN 112884515A
- Authority
- CN
- China
- Prior art keywords
- user
- model
- preset
- training
- predicted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000012549 training Methods 0.000 claims description 84
- 238000004422 calculation algorithm Methods 0.000 claims description 34
- 230000006399 behavior Effects 0.000 claims description 24
- 230000008569 process Effects 0.000 claims description 16
- 238000013528 artificial neural network Methods 0.000 claims description 8
- 238000003066 decision tree Methods 0.000 claims description 8
- 238000007477 logistic regression Methods 0.000 claims description 8
- 238000010801 machine learning Methods 0.000 claims description 8
- 238000007781 pre-processing Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 238000004891 communication Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 11
- 238000010586 diagram Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000556 factor analysis Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0645—Rental transactions; Leasing transactions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Game Theory and Decision Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供了用户流失的预测方法、装置和计算机存储介质。通过获取待预测用户的共享汽车租赁APP生成的历史数据,从历史数据中提取待预测用户的目标特征,并将目标特征输入预设模型,然后计算待预测用户的流失概率。由于目标特征准确全面反映共享汽车租赁场景,基于此模型的目标特征预测概率具有较高的准确性。并且,模型处理数据的速度较快,因此,本发明在保证预测结果的准确性的同时,提高对用户流失预测的效率,对共享汽车租赁场景具有重要的现实意义。
Description
技术领域
本申请涉及人工智能领域,尤其涉及用户流失的预测方法、装置及计算机存储介质。
背景技术
分时租赁共享汽车是互联网浪潮中的新型汽车租赁方式,用户从任意特定网点取车,并在任意特定网点还车的单向汽车租赁方式,存在经济、便捷等很多优点,因此吸引了一大批用户。
用户的生命周期存在新用户、留存用户和流失用户的阶段。在互联网经济中,维护一个老用户的成本远远小于获取一个新用户的成本,因此对用户的流失概率进行预测,并且基于用户的流失概率,在用户流失前,针对性的对其实施挽留措施,降低用户的流失率,提升用户生命周期的价值,具有非常大的意义。
目前,对用户流失的概率的预测方式包括:人工根据用户在一段时间登陆共享汽车租赁APP的次数,或者,在共享汽车租赁APP上下单次数,通过经验,确定用户流失的概率。但是,确定出的用户流失的概率的准确性低以及处理效率低。
发明内容
本申请提供了用户流失的预测方法、装置及计算机存储介质,目的在于解决确定出的用户流失的概率的准确性低以及处理效率低的问题。
为了实现上述目的,本申请提供了以下技术方案:
本申请提供了一种用户流失的预测方法,包括:
获取待预测用户的共享汽车租赁APP生成的历史数据;
从所述历史数据中提取所述待预测用户的目标特征;所述目标特征包括:基本信息特征、订单特征、消费特征和对所述APP的操作行为特征;所述订单特征、所述消费特征和所述操作行为特征分别融合了租赁共享汽车的网点信息和租赁的共享汽车的车辆信息;
将所述目标特征输入预设模型;所述预设模型计算所述待预测用户的流失概率。
可选的,所述预设模型为对预设的初始模型完成训练的模型;
对所述初始模型进行训练的过程,包括:
获取训练样本;所述训练样本包括:从预设数量用户的共享汽车租赁APP生成的历史数据中,提取的所述预设数量用户的目标特征与用于表示是否流失的标签;
采用所述训练样本对所述初始模型进行训练。
可选的,获取的训练样本是预处理后的训练样本;其中,预处理过程包括:
从预处理前的训练样本中,筛选出与对应标签间的相关性大于预设阈值的目标特征,得到筛选后的目标特征与对应的标签;
通过对所述筛选后的目标特征进行特征相关性计算,确定冗余特征;
去除所述筛选后的目标特征中的所述冗余特征,得到最终目标特征和对应的标签。
可选的,所述初始模型的类型为逻辑回归算法模型、决策树算法模型、神经网络算法模型,以及衍生机器学习算法模型中的任意一种模型;所述衍生机器学习算法模型指:由所述逻辑回归算法模型、所述决策树算法模型和所述神经网络算法模型中的至少一种算法模型衍生得到。
可选的,在所述将所述目标特征输入预设模型;所述预设模型计算所述待预测用户的流失概率之后,还包括:
依据流失概率与流失危险等级之间的预设对应关系,确定所述待预测用户的流失概率的流失危险等级;
对所述待预测用户的共享汽车租赁APP,执行所述待预测用户的流失危险等级对应的预设操作。
本申请还提供了一种用户流失的预测装置,包括:
获取模块,用于获取待预测用户的共享汽车租赁APP生成的历史数据;
提取模块,用于从所述历史数据中提取所述待预测用户的目标特征;所述目标特征包括:基本信息特征、订单特征、消费特征和对所述APP的操作行为特征;所述订单特征、所述消费特征和所述操作行为特征分别融合了租赁共享汽车的网点信息和租赁的共享汽车的车辆信息;
执行模块,用于将所述目标特征输入预设模型;所述预设模型计算所述待预测用户的流失概率。
可选的,所述预设模型为对预设的初始模型完成训练的模型;所述装置还包括:训练模块,用于对所述初始模型进行训练;
所述训练模块,用于对所述初始模型进行训练,包括:
所述训练模块,具体用于获取训练样本;所述训练样本包括:从预设数量用户的共享汽车租赁APP生成的历史数据中,提取的所述预设数量用户的目标特征与用于表示是否流失的标签;采用所述训练样本对所述初始模型进行训练。
可选的,所述训练模块获取的训练样本是预处理后的训练样本;
所述训练模块的预处理过程包括:从预处理前的训练样本中,筛选出与对应标签间的相关性大于预设阈值的目标特征,得到筛选后的目标特征与对应的标签;通过对所述筛选后的目标特征进行特征相关性计算,确定冗余特征;去除所述筛选后的目标特征中的所述冗余特征,得到最终目标特征和对应的标签。
本申请还提供了一种存储介质,所述存储介质包括存储的程序,其中,所述程序执行上述任意一项所述的用户流失的预测方法。
本申请还提供了一种设备,所述设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行上述任一项所述的用户流失的预测方法。
本申请所述的用户流失的预测方法及相关装置,获取待预测用户的共享汽车租赁APP产生的历史数据;从历史数据中提取待预测用户的目标特征,将目标特征输入预设模型;该预设模型计算待预测用户的流失概率。
一方面,在本申请中,目标特征包括:基本信息特征、订单特征、消费特征和对APP的操作行为特征。并且,订单特征、消费特征和操作行为特征分别融合了租赁共享汽车的网点信息和租赁的共享汽车的车辆信息,即包含反映共享汽车租赁场景特点的信息。即目标特征可以准确全面反映共享汽车租赁场景,因此,通过预设模型对目标特征进行预测,得到的未来该待预测用户变成流失用户的概率具有准确性。
另一方面,本申请通过模型对待预测用户的目标特征进行处理,由于模型处理数据的速度较快,因此,本申请可以提高用户流失的预测效率。
综上所述,本申请提供的用户流失的预测方案可以保证预测结果的准确性,并且,可以提高对用户流失预测的处理效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例公开的对初始模型的训练过程示意图;
图2为本申请实施例公开的一种用户流失的预测方法的流程图;
图3为本申请实施例公开的实验得到的ROC曲线示意图;
图4为本申请实施例公开的一种用户流失的预测装置的结构示意图;
图5为本申请实施例公开的一种设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请实施例中,通过获取共享汽车租赁场景中的训练样本,对预设的初始模型进行训练,得到训练后的模型。该训练后的模型对输入的待预测用户的目标特征进行计算,输出用于表征待预测用户在未来成为流失用户的概率。
图1为本申请实施例提供的对初始模型的训练过程,可以包括以下步骤:
S101、获取训练样本。
在本实施例中,训练样本可以包括:从预设数量用户的共享汽车租赁APP生成的历史数据中,提取的预设数量用户的目标特征与用于表示是否流失的结果信息。
其中,预设数量的取值可以根据实际情况确定,本实施例不作限定。
在实际中,用户使用共享汽车租赁APP时,首先进行注册,APP中生成用户的基础信息。在注册完成后,在使用共享汽车租赁APP的过程中,APP产生订单数据、用户支付订单产生的消费数据、以及用户操作APP过程中产生的行为数据等。在本实施例中,将用户的基础信息、订单数据、消费数据以及行为数据,统称为历史数据。
在本实施例中,对于预设数量用户中的每个用户,都需要从该用户的历史数据中,提取目标特征和用于表示是否流失的结果信息,得到训练样本。其中,目标特征可以包括:基本信息特征、订单特征、消费特征和对APP的操作行为特征。其中,订单特征、消费特征和操作行为特征分别融合了租赁共享汽车的网点信息和租赁的共享汽车的车辆信息。
其中,对于任意一个用户来说,基本信息特征可以包括:用户注册时间、用户年龄、用户性别、用户驾龄和用户常住地中的至少一项。
订单特征指:从该用户的历史订单数据中提取的特征。具体可以包括:一段时间内的预约车辆次数、订单次数、订单频率、取消订单次数、工作日订单次数、周末订单次数、节假日订单次数、发生订单的天数、用户最后一次订单时间等。其中,一段时间可以为一周、两周、一个月和两个月等中的一种或多种取值。
消费特征指:从该用户的历史消费数据中提取的特征。具体可以包括:一段时间的订单应付总额、订单应付均值、订单实付总额、订单实付均值、订单优惠券使用率、优惠券平均折扣率等中的一项或多项。其中,一段时间可以为一周、两周、一个月和两个月等中的一种或多种。
对APP的操作行为特征指:用户对APP的操作行为数据中的特征。具体可以包括:一段时间内打开app的次数、查看网点信息的次数、查看车辆信息的次数、押金页面查看次数、订单评价率、最后一次登陆app时间等中的一项或多项。其中,一段时间可以为一周、两周、一个月和两个月等中的一种或多种。
从该用户的历史数据中提取的用于表示该用户是否流失的结果信息可以采用0与1表示,其中,0表示流失,1表示不流失。其中,结果信息的确定方式可以包括:依据历史数据中预设时间段内产生的订单数量确定,或者,依据历史数据中预设时间段内用户登录APP的次数确定等。例如,依据历史数据中截止当前时刻的一个月内产生的订单数量是否少于预设数量阈值,如果是,则确定该用户为流失用户,该用户的结果信息则为0。例如,依据历史数据中截止当前时刻的一个月内用户登录APP的总次数是否小于预设次数阈值,如果不是,则确定该用户不是流失用户,该用户的结果信息则为1。
在本实施例中,对于预设数量用户中的每个用户来说,将用于表示该用户是否流失的结果信息,作为该用户的目标特征对应的标签,从而,得到预设数量用户分别对应的目标特征和标签,构成了训练样本。其中,训练样本包含:以用户为纽带建立的目标特征与标签间的对应关系。
S102、从训练样本中,筛选出与对应标签间的相关性大于预设阈值的目标特征,得到筛选后的目标特征与对应的标签。
在本实施例中,由于训练样本包含:以用户为纽带建立的目标特征与标签间的对应关系。其中,对于任意一个用户,该用户的目标特征中可能某些目标特征对标签的贡献较小。为了避免采用训练样本对初始模型训练出现过拟合的现象,在本步骤中,计算训练样本中每个目标特征分别与对应的标签间的相关性,并筛选出相关性大于预设阈值的目标特征,得到筛选后的目标特征,以及筛选后的目标特征对应的标签。其中,计算训练样本中每个目标特征分别与对应的标签间的相关性,可以采用单因素分析方法,具体可以为显著性检验或ROC分析。
S103、通过对筛选后的目标特征进行特征相关性计算,确定冗余特征。
在本实施例中,计算筛选后的目标特征中两两之间的皮尔逊相关系数,如果相关系数达到一定阈值,则认为该两个筛选后的目标特征间相关性较强,则保留其中ROC分析值较大的筛选后的目标特征,将另一个筛选后的目标特征作为冗余特征。
S104、去除筛选后的目标特征中的冗余特征,得到最终目标特征和对应的标签。
在本实施例中,为了进一步减少用于训练初始模型的样本特征的冗余度,减少训练初始模型出现过拟合现象的概率,在本步骤中,去除筛选后的目标特征中的冗余特征。为了描述方便,将去除筛选后的目标特征中的冗余特征,剩余的目标特征称为最终目标特征,从而,得到最终目标特征和对应的标签。
S105、采用最终目标特征和对应的标签,对初始模型进行训练。
在本实施例中,初始模型的类型为逻辑回归算法模型、决策树算法模型、神经网络算法模型以及衍生机器学习算法模型中的任意一种模型。其中,衍生机器学习算法模型指:由逻辑回归算法模型、决策树算法模型和神经网络算法模型中的至少一种算法模型衍生得到。本实施例不对初始模型的具体内容作限定。
在本步骤中,对初始模型的训练过程可以包括以下步骤A1~步骤A3:
A1、将最终目标特征和对应的标签分为训练集和验证集。
本步骤的具体实现方式为现有技术,这里不再赘述。
A2、采用训练集对初始模型进行训练,得到中间模型。
在本步骤中,可以在给定超参数下,首先初始化输入变量的权重参数,基于训练集的输入变量得到输出结果,比较输出结果与真实输出变量的损失,更新权重参数,多次迭代得到最优的权重变量,为了描述方便,将训练得到的模型,称为中间模型。
A3、采用验证集对中间模型进行测试,得到完成训练的模型。
在本步骤中,可以基于验证集验证中间模型的预测效果。基于预测结果调整超参数,对调整超参数后的初始模型,重新使用训练集进行训练,直至达到在验证集上测试的最优结果,得到完成训练的模型。
需要说明的是,上述S101~S105是对初始模型进行训练的一种具体实现方式,通过该方式对初始模型进行训练出现过拟合现象的概率会降低。
在实际中,还可以采用S101获取的训练样本直接对初始模型进行训练,其中,对初始模型进行训练的过程可以参考步骤A1~步骤A3,这里不再赘述。
图2为本申请实施例提供的用户流失的预测方法,可以包括以下步骤:
S201、获取待预测用户的共享汽车租赁APP产生的历史数据。
在本步骤中,历史数据的含义可以参考S101,这里不再赘述。
S202、从历史数据中提取待预测用户的目标特征。
在本实施例中,目标特征可以包括:基本信息特征、订单特征、消费特征和对APP的操作行为特征。其中,订单特征、消费特征和操作行为特征融合了租赁共享汽车的网点信息和租赁的共享汽车的车辆信息。
其中,目标特征中各项特征的含义可以参考S101,这里不再赘述。
S203、将目标特征输入预设模型。
在本步骤中,预设模型可以为图1对应的实施例得到的完成训练的模型。
在本步骤中,预设模型计算待预测用户的流失概率。
S204、依据流失概率与流失危险等级之间的预设对应关系,确定待预测用户的流失概率的流失危险等级。
在本实施例中,事先对流失概率进行了分级,即事先将流失概率的各种取值进行分级,其中,不同等级的流失概率表示用户流失的危险程度。
在本步骤中,依据流失概率与流失危险等级之间的预设对应关系,确定待预测用户的流失概率对应流失危险等级。
S205、对待预测用户的共享汽车租赁APP,执行待预测用户的流失危险等级对应的预设操作。
在本实施例中,对不同流失危险等级的用户,对其使用的共享租赁APP执行对应的预设操作。其中,预设操作的内容可以根据实际情况确定,本实施例不作具体限定。例如,对流失危险等级低的用户的共享汽车租赁APP发放金额小的优惠券,向流失危险等级高的用户的共享汽车租赁APP发放金额大的优惠券等。
在本实施例的分时租赁共享汽车场景中,基于用户过去一段时间的特征信息,可以预测用户在未来一段时间的流失概率。基于预测得到的用户流失概率,可以实施流失预警策略,对用户流失概率分级,对不同流失级别的用户分别实施不同的挽留策略。这种在用户流失前,针对性的对其实施挽留措施的方法,可以降低时租赁共享汽车用户的流失率,提高其用户的留存率,延长其用户的生命周期,以期望得到更高的用户生命周期价值。
需要说明的是,在实际中,上述S204~S205是可选步骤。
在本实施例中,目标特征包括:基本信息特征、订单特征、消费特征和对APP的操作行为特征。并且,订单特征、消费特征和操作行为特征融合了租赁共享汽车的网点信息和租赁的共享汽车的车辆信息,即包含反映共享汽车租赁场景特点的信息,即目标特征可以准确全面反映共享汽车租赁场景,因此,通过预设模型对目标特征进行预测,得到的未来该待预测用户变成流失用户的概率具有准确性。并且,模型处理数据的速度快,因此,本实施例提供的用户流失的预测方案适用于共享汽车租赁场景,保证预测结果的准确性的同时,还可以提高预测效率,对共享汽车租赁场景具有重要的现实意义。
在EVCARD环球车享汽车分时租赁场景中,预测流失用户概率的ROC曲线如图3所示,在图3中,横坐标表示假正率,纵坐标表示真正率。AUC(Area Under roc Curve)表示处于ROC曲线下方的那部分面积的大小,是一种用于度量分类模型好坏的一个标准,在本实施例中,AUC的取值为0.80,可见模型有明显的区分度。以流失概率0.5为分割点,判别用户是否流失,其流失用户分类召回率可达到85.32%,即真正流失的用户中,有85.32%的用户被识别出了流失,因此该流失概率预测模型可以帮助EVCARD环球车享更准确地识别即将流失的用户,对其进行针对性挽留措施,降低用户流失率,提高用户生命周期价值,以为企业带来更多的营收。
图4为本申请实施例提供的一种流失用户的预测装置,可以包括:获取模块401、提取模块402和执行模块403,其中,
获取模块401,用于获取待预测用户的共享汽车租赁APP生成的历史数据;
提取模块402,用于从所述历史数据中提取所述待预测用户的目标特征;所述目标特征包括:基本信息特征、订单特征、消费特征和对所述APP的操作行为特征;所述订单特征、所述消费特征和所述操作行为特征分别融合了租赁共享汽车的网点信息和租赁的共享汽车的车辆信息;
执行模块403,用于将所述目标特征输入预设模型;所述预设模型计算所述待预测用户的流失概率。
可选的,所述预设模型为对预设的初始模型完成训练的模型;
所述装置还可以包括:训练模块,用于对所述初始模型进行训练;
所述训练模块,用于对所述初始模型进行训练,包括:
所述训练模块,具体用于获取训练样本;所述训练样本包括:从预设数量用户的共享汽车租赁APP生成的历史数据中,提取的所述预设数量用户的目标特征与用于表示是否流失的标签;采用所述训练样本对所述初始模型进行训练。
可选的,所述训练模块获取的训练样本是预处理后的训练样本;
所述训练模块的预处理过程包括:从预处理前的训练样本中,筛选出与对应标签间的相关性大于预设阈值的目标特征,得到筛选后的目标特征与对应的标签;通过对所述筛选后的目标特征进行特征相关性计算,确定冗余特征;去除所述筛选后的目标特征中的所述冗余特征,得到最终目标特征和对应的标签。
可选的,所述初始模型的类型为逻辑回归算法模型、决策树算法模型、神经网络算法模型以及衍生机器学习算法模型中的任意一种模型;所述衍生机器学习算法模型指:由所述逻辑回归算法模型、决策树算法模型和神经网络算法模型中的至少一种算法模型衍生得到。
可选的,该装置还可以包括处理模块,用于在所述执行模块将所述目标特征输入预设模型;所述预设模型计算所述待预测用户的流失概率之后,依据流失概率与流失危险等级之间的预设对应关系,确定所述待预测用户的流失概率的流失危险等级;对所述待预测用户的共享汽车租赁APP,执行所述待预测用户的流失危险等级对应的预设操作。
流失用户的预测装置包括处理器和存储器,上述获取模块401、提取模块402和执行模块403等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来解决确定出的用户流失的概率的准确性低以及处理效率低的问题。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述用户流失的预测方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述用户流失的预测方法。
本发明实施例提供了一种设备,如图5所示,设备包括至少一个处理器、以及与处理器连接的至少一个存储器、总线;其中,处理器、存储器通过总线完成相互间的通信;处理器用于调用存储器中的程序指令,以执行上述的用户流失的预测方法。本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:
获取待预测用户的共享汽车租赁APP生成的历史数据;
从所述历史数据中提取所述待预测用户的目标特征;所述目标特征包括:基本信息特征、订单特征、消费特征和对所述APP的操作行为特征;所述订单特征、所述消费特征和所述操作行为特征分别融合了租赁共享汽车的网点信息和租赁的共享汽车的车辆信息;
将所述目标特征输入预设模型;所述预设模型计算所述待预测用户的流失概率。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
在一个典型的配置中,设备包括一个或多个处理器(CPU)、存储器和总线。设备还可以包括输入/输出接口、网络接口等。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
本申请实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本申请实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本说明书的各个实施例中记载的特征可以相互替换或者组合,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种用户流失的预测方法,其特征在于,包括:
获取待预测用户的共享汽车租赁APP生成的历史数据;
从所述历史数据中提取所述待预测用户的目标特征;所述目标特征包括:基本信息特征、订单特征、消费特征和对所述APP的操作行为特征;所述订单特征、所述消费特征和所述操作行为特征分别融合了租赁共享汽车的网点信息和租赁的共享汽车的车辆信息;
将所述目标特征输入预设模型;所述预设模型计算所述待预测用户的流失概率。
2.根据权利要求1所述的方法,其特征在于,所述预设模型为对预设的初始模型完成训练的模型;
对所述初始模型进行训练的过程,包括:
获取训练样本;所述训练样本包括:从预设数量用户的共享汽车租赁APP生成的历史数据中,提取的所述预设数量用户的目标特征与用于表示是否流失的标签;
采用所述训练样本对所述初始模型进行训练。
3.根据权利要求2所述的方法,其特征在于,获取的训练样本是预处理后的训练样本;其中,预处理过程包括:
从预处理前的训练样本中,筛选出与对应标签间的相关性大于预设阈值的目标特征,得到筛选后的目标特征与对应的标签;
通过对所述筛选后的目标特征进行特征相关性计算,确定冗余特征;
去除所述筛选后的目标特征中的所述冗余特征,得到最终目标特征和对应的标签。
4.根据权利要求2所述的方法,其特征在于,所述初始模型的类型为逻辑回归算法模型、决策树算法模型、神经网络算法模型,以及衍生机器学习算法模型中的任意一种模型;所述衍生机器学习算法模型指:由所述逻辑回归算法模型、所述决策树算法模型和所述神经网络算法模型中的至少一种算法模型衍生得到。
5.根据权利要求1所述的方法,其特征在于,在所述将所述目标特征输入预设模型;所述预设模型计算所述待预测用户的流失概率之后,还包括:
依据流失概率与流失危险等级之间的预设对应关系,确定所述待预测用户的流失概率的流失危险等级;
对所述待预测用户的共享汽车租赁APP,执行所述待预测用户的流失危险等级对应的预设操作。
6.一种用户流失的预测装置,其特征在于,包括:
获取模块,用于获取待预测用户的共享汽车租赁APP生成的历史数据;
提取模块,用于从所述历史数据中提取所述待预测用户的目标特征;所述目标特征包括:基本信息特征、订单特征、消费特征和对所述APP的操作行为特征;所述订单特征、所述消费特征和所述操作行为特征分别融合了租赁共享汽车的网点信息和租赁的共享汽车的车辆信息;
执行模块,用于将所述目标特征输入预设模型;所述预设模型计算所述待预测用户的流失概率。
7.根据权利要求6所述的装置,其特征在于,所述预设模型为对预设的初始模型完成训练的模型;所述装置还包括:训练模块,用于对所述初始模型进行训练;
所述训练模块,用于对所述初始模型进行训练,包括:
所述训练模块,具体用于获取训练样本;所述训练样本包括:从预设数量用户的共享汽车租赁APP生成的历史数据中,提取的所述预设数量用户的目标特征与用于表示是否流失的标签;采用所述训练样本对所述初始模型进行训练。
8.根据权利要求7所述的装置,其特征在于,所述训练模块获取的训练样本是预处理后的训练样本;
所述训练模块的预处理过程包括:从预处理前的训练样本中,筛选出与对应标签间的相关性大于预设阈值的目标特征,得到筛选后的目标特征与对应的标签;通过对所述筛选后的目标特征进行特征相关性计算,确定冗余特征;去除所述筛选后的目标特征中的所述冗余特征,得到最终目标特征和对应的标签。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序执行权利要求1~5任意一项所述的用户流失的预测方法。
10.一种设备,其特征在于,所述设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行如权利要求1~5中任一项所述的用户流失的预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110197291.8A CN112884515A (zh) | 2021-02-22 | 2021-02-22 | 用户流失的预测方法、装置及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110197291.8A CN112884515A (zh) | 2021-02-22 | 2021-02-22 | 用户流失的预测方法、装置及计算机存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112884515A true CN112884515A (zh) | 2021-06-01 |
Family
ID=76056740
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110197291.8A Pending CN112884515A (zh) | 2021-02-22 | 2021-02-22 | 用户流失的预测方法、装置及计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112884515A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113391988A (zh) * | 2021-06-29 | 2021-09-14 | 中国工商银行股份有限公司 | 流失用户留存的方法、装置、电子设备及存储介质 |
CN113421116A (zh) * | 2021-06-22 | 2021-09-21 | 康键信息技术(深圳)有限公司 | 用户召回分析方法、装置、设备及存储介质 |
CN113743991A (zh) * | 2021-09-03 | 2021-12-03 | 上海幻电信息科技有限公司 | 生命周期价值预测方法及装置 |
CN113827980A (zh) * | 2021-08-17 | 2021-12-24 | 杭州电魂网络科技股份有限公司 | 一种流失用户预测方法、装置及计算机可读存储介质 |
CN113947246A (zh) * | 2021-10-21 | 2022-01-18 | 腾讯科技(深圳)有限公司 | 基于人工智能的流失处理方法、装置及电子设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106250403A (zh) * | 2016-07-19 | 2016-12-21 | 北京奇艺世纪科技有限公司 | 用户流失预测方法及装置 |
CN109409963A (zh) * | 2018-11-12 | 2019-03-01 | 平安科技(深圳)有限公司 | 客户生命周期的预测方法及装置、存储介质、计算机设备 |
CN109559172A (zh) * | 2018-11-29 | 2019-04-02 | 北京车联天下信息技术有限公司 | 数据处理方法、装置、电子设备及计算机可读存储介质 |
CN109583651A (zh) * | 2018-12-03 | 2019-04-05 | 焦点科技股份有限公司 | 一种保险电商平台用户流失预测的方法和装置 |
CN109711860A (zh) * | 2018-11-12 | 2019-05-03 | 平安科技(深圳)有限公司 | 用户行为的预测方法及装置、存储介质、计算机设备 |
CN109784966A (zh) * | 2018-11-29 | 2019-05-21 | 昆明理工大学 | 一种音乐网站客户流失预测方法 |
CN110322085A (zh) * | 2018-03-29 | 2019-10-11 | 北京九章云极科技有限公司 | 一种客户流失预测方法和装置 |
CN110930192A (zh) * | 2019-11-22 | 2020-03-27 | 携程旅游信息技术(上海)有限公司 | 用户流失预测方法、系统、设备和存储介质 |
-
2021
- 2021-02-22 CN CN202110197291.8A patent/CN112884515A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106250403A (zh) * | 2016-07-19 | 2016-12-21 | 北京奇艺世纪科技有限公司 | 用户流失预测方法及装置 |
CN110322085A (zh) * | 2018-03-29 | 2019-10-11 | 北京九章云极科技有限公司 | 一种客户流失预测方法和装置 |
CN109409963A (zh) * | 2018-11-12 | 2019-03-01 | 平安科技(深圳)有限公司 | 客户生命周期的预测方法及装置、存储介质、计算机设备 |
CN109711860A (zh) * | 2018-11-12 | 2019-05-03 | 平安科技(深圳)有限公司 | 用户行为的预测方法及装置、存储介质、计算机设备 |
CN109559172A (zh) * | 2018-11-29 | 2019-04-02 | 北京车联天下信息技术有限公司 | 数据处理方法、装置、电子设备及计算机可读存储介质 |
CN109784966A (zh) * | 2018-11-29 | 2019-05-21 | 昆明理工大学 | 一种音乐网站客户流失预测方法 |
CN109583651A (zh) * | 2018-12-03 | 2019-04-05 | 焦点科技股份有限公司 | 一种保险电商平台用户流失预测的方法和装置 |
CN110930192A (zh) * | 2019-11-22 | 2020-03-27 | 携程旅游信息技术(上海)有限公司 | 用户流失预测方法、系统、设备和存储介质 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113421116A (zh) * | 2021-06-22 | 2021-09-21 | 康键信息技术(深圳)有限公司 | 用户召回分析方法、装置、设备及存储介质 |
CN113391988A (zh) * | 2021-06-29 | 2021-09-14 | 中国工商银行股份有限公司 | 流失用户留存的方法、装置、电子设备及存储介质 |
CN113827980A (zh) * | 2021-08-17 | 2021-12-24 | 杭州电魂网络科技股份有限公司 | 一种流失用户预测方法、装置及计算机可读存储介质 |
CN113743991A (zh) * | 2021-09-03 | 2021-12-03 | 上海幻电信息科技有限公司 | 生命周期价值预测方法及装置 |
CN113947246A (zh) * | 2021-10-21 | 2022-01-18 | 腾讯科技(深圳)有限公司 | 基于人工智能的流失处理方法、装置及电子设备 |
CN113947246B (zh) * | 2021-10-21 | 2023-06-13 | 腾讯科技(深圳)有限公司 | 基于人工智能的流失处理方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112884515A (zh) | 用户流失的预测方法、装置及计算机存储介质 | |
CN110348580B (zh) | 构建gbdt模型的方法、装置及预测方法、装置 | |
CN110400022B (zh) | 自助柜员机现金用量预测方法及装置 | |
CN111681051B (zh) | 购买意向度预测方法、装置、存储介质及终端 | |
CN108241984A (zh) | 一种访客分类方法及装置 | |
CN110675228B (zh) | 用户购票行为检测方法以及装置 | |
CN114462465A (zh) | 一种分类模型的训练方法、质检预测方法及对应装置 | |
CN111222994A (zh) | 客户风险评估方法、装置、介质和电子设备 | |
CN111353901A (zh) | 风险识别监控方法、装置以及电子设备 | |
CN112801456A (zh) | 资金流动性风险预警方法、装置和电子设备 | |
CN115809917A (zh) | 一种风险评级方法、装置、电子设备及存储介质 | |
CN116450951A (zh) | 业务推荐方法、装置、存储介质及电子设备 | |
CN117422306A (zh) | 基于动态神经网络的跨境电商风险控制方法及系统 | |
CN112200402A (zh) | 一种基于风险画像的风险量化方法、装置及设备 | |
CN116630020A (zh) | 风险评估方法、装置、存储介质及电子设备 | |
CN115619539A (zh) | 贷前风险评价方法以及装置 | |
CN110580634A (zh) | 基于互联网的业务推荐方法、装置及存储介质 | |
CN113919936A (zh) | 样本数据的处理方法及装置 | |
CN112905987A (zh) | 账号识别方法、装置、服务器及存储介质 | |
CN111008883A (zh) | 一种基于区块链的二手车交易方法、设备及介质 | |
KR102409019B1 (ko) | 금융 거래 위험 평가 시스템과 방법 및 이를 위한 컴퓨터 프로그램 | |
CN114676167B (zh) | 用户存留模型的训练方法、用户存留预测方法和装置 | |
CN111047438A (zh) | 数据处理方法、装置和计算机可读存储介质 | |
CN110852854A (zh) | 一种量化收益模型的生成方法和风险控制策略的评价方法 | |
Davidescu et al. | A Forecast of Brent Prices in Times of Ukrainian Crisis Using ARFIMA Models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |