CN114584601A

CN114584601A - 用户流失识别及干预方法、系统、终端及介质

Info

Publication number: CN114584601A
Application number: CN202210095446.1A
Authority: CN
Inventors: 杨磊; 吴柏威
Original assignee: Shanghai Junzheng Network Technology Co Ltd
Current assignee: Shanghai Junzheng Network Technology Co Ltd
Priority date: 2022-01-26
Filing date: 2022-01-26
Publication date: 2022-06-03

Abstract

本申请提供用户流失识别及干预方法、系统、终端及介质，包括：对平台用户进行是否流失的标记以得到对应的标记样本集；利用降维模型对所述标记样本集进行训练以生成用户流失判定系统；利用所述用户流失判定系统判断当前平台用户是否为流失用户，并对流失用户进行回流干预。本发明通过对用户行为进行是否流失的异常检测，根据用户本身的活跃行为进行流失行为识别，并通过机器学习的方法，选择最佳干预策略，降低了干预成本，减少资源浪费，提升用户体验，保证了平台用户的规模及活跃度。

Description

用户流失识别及干预方法、系统、终端及介质

技术领域

本申请涉及机器学习技术领域，特别是涉及用户流失识别及干预方法、系统、终端及介质。

背景技术

随着互联网技术的发展，网约车服务遍布于各个城市。用户的规模、活跃度是互联网公司业务增长的基石。在网约车领域，用户一般包括司机和乘客，由于种种因素，平台的司机或乘客活跃度可能出现降低的情况，甚至完全流失，具体表现为发单频率降低，完单频率降低等。当我们识别出用户流失行为时，会进行及时的干预，干预的手段一般包括短信推送，App端消息推送，优惠券发放等。如何识别出用户的流失行为并进行及时干预是十分重要的课题。

传统的用户流失识别方法通常采用固定阈值的办法，例如设置7天或30天，当用户没有活跃行为时判定用户流失并进行及时干预。这种方法存在一定弊端，因为用户本身使用App的习惯存在差异，一部分用户的活跃度高，一部分用户的活跃度低。固定阈值方法会对活跃度低的用户进行过度干预，对活跃度高的用户干预不及时，既浪费资源又影响用户体验。

因此，本领域的技术人员致力于开发一种既适用于活跃度低的用户，又适用于活跃度高的用户，避免浪费资源，提升用户体验。

发明内容

鉴于以上所述现有技术的缺点，本申请的目的在于提供用户流失识别及干预方法、系统、终端及介质，用于解决现有技术无法适用于活跃度低和活跃度高的用户的问题。

为实现上述目的及其他相关目的，本申请的第一方面提供一种用户流失识别及干预方法，包括：对平台用户进行是否流失的标记以得到标记样本集；利用降维模型对所述标记样本集进行训练以生成用户流失判定系统；利用所述用户流失判定系统判断当前平台用户是否为流失用户，若是，则对流失用户进行回流干预。

于本申请的第一方面的一些实施例中，所述对平台用户进行是否流失的标记的方式包括：获取所述平台用户最近一次活跃行为距当前时间的时间间隔，并判断所述距当前时间的时间间隔是否超过预设时间间隔；若是，则标记所述平台用户为流失用户；若否，则标记所述平台用户为非流失用户。

于本申请的第一方面的一些实施例中，所述预设时间间隔的计算过程包括：获取所述平台用户在所述平台上全部或部分的活跃行为时间节点；计算所述活跃行为时间节点之间的平均时间间隔，并以所述平均时间间隔与动态标准差的和作为所述预设时间间隔；其中，所述动态标准差为各所述活跃行为时间节点的标准差与一可调节参数的乘积。

于本申请的第一方面的一些实施例中，还包括：从多个降维模型中撷取最优降维模型来对所述标记样本集进行训练来生成所述用户流失判定系统；所述降维模型包括：切片逆回归降维模型、切片平均方差估计降维模型、方向回归降维模型、等高线回归降维模型中的部分或全部模型。

于本申请的第一方面的一些实施例中，所述从多个降维模型中撷取最优降维模型的方式包括：利用多个降维模型分别对不同类别的标记样本集进行训练；基于每个所述降维模型的训练结果，计算不同类别的标记样本集间的距离；将距离最小值所对应的降维模型作为所述最优降维模型。

于本申请的第一方面的一些实施例中，还包括：从多种干预策略中选取最优干预策略对所述当前平台用户进行回流干预；其中，所述干预策略包括：短信推送、APP端消息推送、智能客服触达、优惠券发放中的部分或全部方式。

于本申请的第一方面的一些实施例中，所述最优干预策略的选取过程包括：基于机器学习方法预测所述平台用户在各种干预策略下的非自然回流概率，并计算所述非自然回流概率与自然回流概率之间的概率差值；计算基于所述概率差值的用户利润，并选取用户利润最大值所对应的干预策略作为所述最优干预策略；其中，所述用户利润被表示为：所述概率差值和用户价值的乘积与干预成本之间的差值。

为实现上述目的及其他相关目的，本申请的第二方面提供一种用户流失识别及干预系统，包括：采集模块，用于对平台用户进行是否流失的标记以得到标记样本集；训练模块，用于利用降维模型对所述标记样本集进行训练以生成用户流失判定系统；干预模块，用于利用所述用户流失判定系统判断当前平台用户是否为流失用户，若是，则对流失用户进行回流干预。

为实现上述目的及其他相关目的，本申请的第三方面提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现所述用户流失识别及干预方法。

为实现上述目的及其他相关目的，本申请的第四方面提供一种电子终端，包括：处理器及存储器；所述存储器用于存储计算机程序，所述处理器用于执行所述存储器存储的计算机程序，以使所述终端执行所述用户流失识别及干预方法。

如上所述，本申请的用户流失识别及干预方法、系统、终端及介质，具有以下有益效果：本发明通过对用户行为进行是否流失的异常检测，根据用户本身的活跃行为进行流失行为识别，并通过机器学习的方法，选择最佳干预策略，降低了干预成本，减少资源浪费，提升用户体验，保证了平台用户的规模及活跃度。

附图说明

图1显示为本申请一实施例中用户流失识别及干预方法的流程示意图。

图2显示为本申请一实施例中用户流失识别及干预系统的结构示意图。

图3显示为本申请一实施例中电子终端的结构示意图。

具体实施方式

以下通过特定的具体实例说明本申请的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本申请的其他优点与功效。本申请还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本申请的精神下进行各种修饰或改变。需说明的是，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。

在本申请中，单数形式“一”、“一个”和“该”旨在也包括复数形式，除非上下文中有相反的指示。本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包含”、“包括”表明存在所述的特征、操作、元件、组件、项目、种类、和/或组，但不排除一个或多个其他特征、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。应当进一步理解，此处使用的术语“或”和“和/或”被解释为包括性的，或意味着任一个或任何组合。因此，“A、B或C”或者“A、B和/或C”意味着“以下任一个：A；B；C； A和B；A和C；B和C；A、B和C”。仅当元件、功能或操作的组合在某些方式下内在地互相排斥时，才会出现该定义的例外。

为了使本发明的目的、技术方案及优点更加清楚明白，通过下述实施例并结合附图，对本发明实施例中的技术方案的进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定发明。

如图1所示，展示了本发明在一实施例中用户流失识别及干预方法的流程示意图。需说明的是，本实施例提供的用户流失识别及干预方法可应用于多种硬件设备；例如 ARM(Advanced RISC Machines)控制器、FPGA(Field Programmable Gate Array)控制器、SoC(System on Chip)控制器、DSP(Digital Signal Processing)控制器、或者 MCU(Micorcontroller Unit)控制器等；还例如台式电脑、笔记本电脑、平板电脑、智能手机、智能手环、智能手表、智能头盔、智能电视、个人数字助理(Personal Digital Assistant，简称PDA)等个人电脑；再例如服务器，所述服务器可以根据功能、负载等多种因素布置在一个或多个实体服务器上，也可以由分布的或集中的服务器集群构成。

值得说明的是，本发明提供的用户流失识别及干预方法可适用于各类运营平台。所谓运营平台包括但不限于B2B运营平台、B2C运营平台、C2C运营平台、B2B2C运营平台等；B2B运营平台是指商家对商家的服务，即企业与企业之间通过平台进行产品、服务及信息的交换；B2C运营平台是指商家通过平台为用户提供服务；C2C运营平台是指用户对用户的模式，即通过用户双方提供一个交易服务平台，使用户双方可以通过平台完成相应服务或交易；B2B2C运营平台是指由一个商家将其产品或服务提供给另一个商家，再由另一个商家将产品或服务同故宫平台提供给最终用户。

示例性的，所述运营平台具体可以是公共服务类运营平台，例如预约挂号平台；还可以是商务交易类运营平台，例如阿里巴巴、淘宝、网约车(如哈罗出行、嘀嗒出行等)等；还可以是社交类运营平台，例如微信、新浪微博等。因运营平台种类甚多，故不再一一赘述。

为便于理解，下文将以网约车平台为例来进行说明，但本领域技术人员应知晓的是，出于说明性目的而提供以上示例，并且以上示例不应被理解成是限制性的。

步骤S11：对平台用户进行是否流失的标记以得到标记样本集。

在一些示例中，所述对平台用户进行是否流失的标记的方式包括：获取所述平台用户最近一次活跃行为的距当前时间的时间间隔，并判断所述距当前时间的时间间隔是否超过预设时间间隔；若是，则标记所述平台用户为流失用户；若否，则标记所述平台用户为非流失用户。

进一步地，所述预设时间间隔的计算过程包括：获取所述平台用户在所述平台上全部或部分的活跃行为时间节点；计算所述活跃行为时间节点之间的平均时间间隔；以所述平均时间间隔与动态标准差的和作为所述预设时间间隔；其中，所述动态标准差为各所述活跃行为时间节点的标准差与一可调节参数的乘积。

为便于理解，下文以网约车平台为例来进行详细的解释说明如下：网约车平台的用户主要分为司机和乘客，因此用户行为相应可分为司机行为和乘客行为。以司机行为为例，司机活跃行为包括但不限于司机发送订单、司机接起订单、司机完成订单、司机浏览网约车APP页面、司机领取优惠券、司机使用优惠券等等。

在本示例中，以天为时间单位记录各司机的活跃行为的日期，实际应用中也可选用小时、周、月等时间单位来记录司机的活跃行为。网约车平台共有N名司机，司机i表示第i个司机，i＝1,2,3,…,N；司机i在网约车平台上共有n天的活跃行为，分别表示为：t_i1,t_i2,t_i3,…,t_in，其中，t_i1<t_i2<t_i3<…<t_in。

计算司机i的各所述活跃行为时间节点之间的平均时间间隔μ_i如下：

Δt_ik＝|t_ik-t_i(k+1)|；其中,k＝1,2,3,…,n-1，i＝1,2,3,…,N；

计算司机i的各所述活跃行为时间节点之间的标准差σ_i如下：

其中，k＝1,2,3,…,n-1，i＝1,2,3,…,N；

因此，本示例中的预设时间间隔可表示为如下：

λσ_i+μ_i；其中，λ是大于0的可调节参数。

令Δt_in为用户最近一次活跃行为距今天数，因此司机i是否为流失用户的判定过程如下：

其中，T_i＝1代表用户流失，因此需要干预；T_i＝0代表用户未流失，因此不需要干预。由于λ是可调节参数，所以本示例可通过调节参数λ来获取一系列有标签的样本。

步骤S12：利用降维模型对所述标记样本集进行训练以生成用户流失判定系统。

在优选的实现方式中，从多个降维模型中撷取最优降维模型对所述标记样本集进行训练来生成所述用户流失判定系统。需说明的是，所述降维模型更具体而言是指充分降维模型，是一种能够在减少数据集中特征数量的同时，避免丢失太多信息并保持或改进模型性能的模型，其原理在于：对于一维响应变量Y(离散或连续)关于p维自变量 X＝(X1,…,Xp)的回归问题，其核心思想是对条件分布Y|X进行统计推断。而充分降维是希望在不损失任何信息的情况下，找到一个p×d的矩阵B，使得条件分布Y|X与Y|B^TX 相等。与之等价的是去找到满足下面条件独立性质的p×d矩阵B：Y

此处，符号

表示条件独立。因此，当d<<p时，降维的目的和效果就达到了。

示例性的，降维模型具体可以是切片逆回归降维模型(Sliced InverseRegression)、切片平均方差估计降维模型(Sliced Average Variance Estimates)、切片平均方差估计降维模型(Sliced Average Variance Estimates)、方向回归降维模型(Directional Regression)、等高线回归降维模型(Contour Regression)等。

进一步地，所述从多个降维模型中撷取最优降维模型的方式包括：利用多个降维模型分别对不同类别的标记样本进行训练；基于每个所述降维模型的训练结果，计算不同类别标记样本间的距离；将距离最小值所对应的降维模型作为最优降维模型。

举例来说，选取D₀维特征作为解释变量X，并分别用1和0代表用户的流失类别(1代表流失，0代表未流失)；其中，解释变量X具体可选择用户画像特征，例如用户脸部特征作为解释变量X1，用户年龄特征作为解释变量X2，用户驾龄特征作为解释变量X3 等等；也可选择用户历史活跃行为特征作为解释变量，例如用户对APP页面的访问频率、用户接单频率、用户完单频率、用户短信点击率、用户对不同面额代金券的使用率等等。

值得注意的是，上述用户历史活跃行为特征可进行进一步的优化，更加严格筛选这些历史行为，例如只认定完成完成订单作为活跃行为，而不统计用户浏览APP页面等其他行为，做此优化，可以更明确干预的方向，即只对特定行为的活跃度降低进行干预。

与此同时，可对活跃行为的筛选做进一步的优化，包括不统计特殊时段的用户活跃行为，所谓特殊时段例如节假日、自然灾害日等，在这些特殊时段内用户的行为与平时相比，规律明显不同。为了排除这一干扰，可以不将这些时段内的行为统计入内。另外，当平台用户的首次活跃行为距今时间可能长达数年，几年前的用户行为跟近期的用户行为往往差异较大，我们可以只选取用户近3个月或6个月的行为。此优化可以帮助我们更准确地判定用户是否流失，降低干预成本，提升用户体验。

选取若干条样本数据作为训练集，比较多个充分降维模型的训练效果，例如选用切片逆回归降维模型、切片平均方差估计降维模型分别对选中的若干条样本数据来进行训练。例如，先得到训练集的结构维数D₁，使用各充分降维模型对中心降维子空间进行估计，可以得到D₁个降维方向，以及降维后的β_i ^TX,i＝1,2,3,…,D₁。计算不同类别样本间的最小距离作为模型优劣指标，例如A类样本有10个数据，B类样本也有10个数据，那么理论上数据间的距离会有100个计算结果，选取其中最小的计算结果，即是A类样本与B类样本间的最小距离。因此，每种充分降维模型下都会计算得到A类样本与B 类样本间的最小距离，选取最小值对应的降维模型作为最优降维模型。

步骤S13：利用所述用户流失判定系统判断当前平台用户是否为流失用户，若是，则对流失用户进行回流干预。

在一些优选的实现方式中，从多种干预策略中选取最优干预策略对所述当前平台用户进行回流干预。较为优选的是，可根据干预后用户行为是否变化来决定是否进行下一次的干预；例如，若干预后用户行为并不变化，那么在一段时间内，不进行下一次干预，减少干预成本，提升用户体验。

进一步的，所述最优干预策略的选取过程包括：基于机器学习方法预测平台用户在各种干预策略下的非自然回流概率，并计算各所述非自然回流概率与自然回流概率之间的概率差值；计算基于所述概率差值的用户利润，并选取用户利润最大值所对应的干预策略作为所述最优干预策略；其中，所述用户利润被表示为：所述概率差值和用户价值的乘积与干预成本之间的差值。

具体来说，对于判定为流失的用户，平台会有若干种干预策略，常见的干预策略包括：短信推送、APP端消息推送、智能客服触达、优惠券发放、红包发放等。然而，事实上每一种干预策略对不同用户产生的效果是不同的，因此需要知道每一种干预策略对不同受众用户的效果到底如何。

现假设有M种干预策略，对于干预策略j，可采用机器学习的方法预测对司机i干预后的回流概率p_ij，其中p_ij＝f_j(x_i)。需说明的是，前述机器学习的方法包括但不限于使用逻辑回归模型、决策树模型(如随机森林、梯度提升树、Xgboost、Lightgbm等)、神经网络模型等。

根据历史的干预信息，可获取到一系列干预后回流与不回流的样本，将干预后回流的样本标记为1作为正样本，而将干预后不回流的样本标为0作为负样本。进一步的，为解决正负样本不均衡的问题，可采用如下任一种或多种方式的结合来解决均衡问题：

均衡方式1)通过上采样和下采样解决样本不均衡：上采样方法通过增加分类中少数类样本的数量来实现样本均衡，在少数类中加入随机噪声、干扰数据或通过一定规则产生心的合成样本，例如SMOTE算法等；下采样方法通过减少分类中多数类样本的样本数量来实现样本均衡，最直接的方法是随机去掉一些多数类样本来减小多数类的规模。

均衡方式2)通过正负样本的惩罚权重解决样本不均衡：对分类中不同样本数量的类别分别赋予不同的权重，一般是赋予小样本量类别较大权重，赋予大样本类别较小权重，然后进行计算和建模；使用这种样本均衡方式时需要在模型和算法中做基于类别参数的调整设置，以Python编程语言的机器学习库Scikit-learn中的SVM为例，通过在 class_weight:{dict,’balanced’}中针对不同类别设定不同的权重。

均衡方式3)通过组合/集成方法解决样本不均衡：组合/集成方法指的是在每次生成训练集时使用所有分类中的小样本量，同时从分类中的大样本量中随机抽取数据来与小样本量合并构成训练集，这样反复多次会得到很多训练集和训练模型，最后在应用时使用组合方法产生分类预测结果。

出于说明性目的而提供以上示例，并且以上示例不应被理解成是限制性的；事实上，现有技术中任何能够用于均衡正负样本的技术手段，都可以用于本发明的技术方案中。

在解决正负样本的均衡问题后，选去特征x_i，具体可选择用户画像特征，例如用户脸部特征作为解释变量X1，用户年龄特征作为解释变量X2，用户驾龄特征作为解释变量X3等；也可选择用户历史活跃行为特征，例如用户App首页1日内访问次数、7日内访问次数、14日内访问次数等，用户1日内接单次数、7日内接单次数、14日内接单次数等，用户1日内完单次数、7日内完单次数、14日内完单次数等，用户短信点击率，用户App消息点击率，用户不同面额代金券的使用率等等，并将是否使用干预策略j作为特征，干预记为1，不干预记为0。

使用不同模型训练，评估误差指标，选取得到最优的模型f_j。例如，对于干预策略j，得到多个模型用于预测干预后回流的概率p_ij。

求取不同模型训练结果中，用户利润最大值的计算方式如下：

j₀＝argmax(V_i(p_ij-p_i0)-C_j),j＝1,2,3,…,M；

由此得到最优的干预策略j₀，其中V_i代表用户i的价值，p_i0表示用户i的自然回流率， C_j表示干预策略j的成本；其中，用户价值可以用一段时间内的LTV估计，应理解LVT 是指用户生命周期价值，是产品从用户获取到流失所得到的全部收益的总和，用户衡量用户对产品所产生的价值，是所有用户运营手段为了改善的终极指标，同时LTV也应该是所有运营手段的最终衡量指标；目前，比较通用的LTV计算方法是：

MMR代表每月用户给平台带来的收入，churn rate代表每月的月流失率。

如图2所示，展示了本发明在一实施例中用户流失识别及干预系统的结构示意图。本实施例的用户流失识别及干预系统200包括采集模块201、训练模块202和干预模块 203。

所述采集模块201用于对平台用户进行是否流失的标记以得到标记样本集。

在一些示例中，所述采集模块201对平台用户进行是否流失的标记的方式包括：获取所述平台用户最近一次活跃行为的距当前时间的时间间隔，并将所述距当前时间的时间间隔与预设时间间隔做比较；若超过所述预设时间间隔，则标记所述平台用户为流失用户；否则，标记所述平台用户为非流失用户。

进一步地，所述预设时间间隔的计算过程包括：获取所述平台用户在所述平台上全部或部分的活跃行为时间节点；计算各所述活跃行为时间节点之间的平均时间间隔；以所述平均时间间隔与动态标准差的总和作为所述预设时间间隔；其中，所述动态标准差为各所述活跃行为时间节点的标准差与一可调节参数的乘积。

所述训练模块202用于利用降维模型对所述标记样本集进行训练以生成用户流失判定系统。

在优选的实现方式中，所述训练模块202从多个降维模型中撷取最优降维模型对所述标记样本集进行训练来生成所述用户流失判定系统。需说明的是，所述降维模型更具体而言是指充分降维模型，是一种能够在减少数据集中特征数量的同时，避免丢失太多信息并保持或改进模型性能的模型，其原理在于：对于一维响应变量Y(离散或连续) 关于p维自变量X＝(X1,…,Xp)的回归问题，其核心思想是对条件分布Y|X进行统计推断。而充分降维是希望在不损失任何信息的情况下，找到一个p×d的矩阵B，使得条件分布 Y|X与Y|B^TX相等。与之等价的是去找到满足下面条件独立性质的p×d矩阵B：Y

此处，符号

所述干预模块203用于利用所述用户流失判定系统判断当前平台用户是否为流失用户，若是，则对流失用户进行回流干预。

在一些优选的实现方式中，所述干预模块203从多种干预策略中选取最优干预策略对所述当前平台用户进行回流干预。

进一步的，所述最优干预策略的选取过程包括：基于机器学习方法预测平台用户在各种干预策略下的非自然回流概率，并计算各所述非自然回流概率与自然回流概率之间的概率差值；计算基于所述概率差值的用户利润值；选取用户利润最大值所对应的干预策略作为最优干预策略；其中，所述用户利润值被表示为：各所概率差值与用户价值之间的乘积值，与干预成本之间的差值。

应理解的是，以上装置的各个模块的划分仅仅是一种逻辑功能的划分，实际实现时可以全部或部分集成到一个物理实体上，也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现；也可以全部以硬件的形式实现；还可以部分模块通过处理元件调用软件的形式实现，部分模块通过硬件的形式实现。例如，训练模块可以为单独设立的处理元件，也可以集成在上述装置的某一个芯片中实现，此外，也可以以程序代码的形式存储于上述装置的存储器中，由上述装置的某一个处理元件调用并执行以上训练模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起，也可以独立实现。这里所述的处理元件可以是一种集成电路，具有信号的处理能力。在实现过程中，上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。

例如，以上这些模块可以是被配置成实施以上方法的一个或多个集成电路，例如：一个或多个特定集成电路(Application Specific Integrated Circuit，简称ASIC)，或，一个或多个微处理器(digital signal processor，简称DSP)，或，一个或者多个现场可编程门阵列(Field Programmable Gate Array，简称FPGA)等。再如，当以上某个模块通过处理元件调度程序代码的形式实现时，该处理元件可以是通用处理器，例如中央处理器(Central Processing Unit，简称CPU)或其它可以调用程序代码的处理器。再如，这些模块可以集成在一起，以片上系统(system-on-a-chip，简称SOC)的形式实现。

如图3所示，展示了本发明一实施例中电子终端的结构示意图。本实例提供的电子终端，包括：处理器31、存储器32、通信器33；存储器32通过系统总线与处理器31 和通信器33连接并完成相互间的通信，存储器32用于存储计算机程序，通信器33用于和其他设备进行通信，处理器31用于运行计算机程序，使电子终端执行如上用户流失识别及干预方法的各个步骤。

上述提到的系统总线可以是外设部件互连标准(Peripheral ComponentInterconnect，简称PCI)总线或扩展工业标准结构(EXtended Industry StandardArchitecture，简称EISA) 总线等。该系统总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。通信接口用于实现数据库访问装置与其他设备(例如客户端、读写库和只读库)之间的通信。存储器可能包含随机存取存储器(Random Access Memory，简称RAM)，也可能还包括非易失性存储器 (non-volatile memory)，例如至少一个磁盘存储器。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，简称 CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(Digital Signal Processing，简称DSP)、专用集成电路(Application SpecificIntegrated Circuit，简称ASIC)、现场可编程门阵列(Field－Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

本发明还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现所述用户流失识别及干预方法。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过计算机程序相关的硬件来完成。前述的计算机程序可以存储于一计算机可读存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

于本申请提供的实施例中，所述计算机可读写存储介质可以包括只读存储器、随机存取存储器、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁存储设备、闪存、U盘、移动硬盘、或者能够用于存储具有指令或数据结构形式的期望的程序代码并能够由计算机进行存取的任何其它介质。另外，任何连接都可以适当地称为计算机可读介质。例如，如果指令是使用同轴电缆、光纤光缆、双绞线、数字订户线(DSL) 或者诸如红外线、无线电和微波之类的无线技术，从网站、服务器或其它远程源发送的，则所述同轴电缆、光纤光缆、双绞线、DSL或者诸如红外线、无线电和微波之类的无线技术包括在所述介质的定义中。然而，应当理解的是，计算机可读写存储介质和数据存储介质不包括连接、载波、信号或者其它暂时性介质，而是旨在针对于非暂时性、有形的存储介质。如申请中所使用的磁盘和光盘包括压缩光盘(CD)、激光光盘、光盘、数字多功能光盘(DVD)、软盘和蓝光光盘，其中，磁盘通常磁性地复制数据，而光盘则用激光来光学地复制数据。

综上所述，本申请提供用户流失识别及干预方法、系统、终端及介质，本发明通过对用户行为进行是否流失的异常检测，选择最优干预策略，对平台用户进行更合理更及时地干预，降低了干预成本，提升了用户体验，保证了平台用户的规模及活跃度。所以，本申请有效克服了现有技术中的种种缺点而具高度产业利用价值。

上述实施例仅例示性说明本申请的原理及其功效，而非用于限制本申请。任何熟悉此技术的人士皆可在不违背本申请的精神及范畴下，对上述实施例进行修饰或改变。因此，举凡所属技术领域中具有通常知识者在未脱离本申请所揭示的精神与技术思想下所完成的一切等效修饰或改变，仍应由本申请的权利要求所涵盖。

Claims

1.一种用户流失识别及干预方法，其特征在于，包括：

对平台用户进行是否流失的标记以得到标记样本集；

利用降维模型对所述标记样本集进行训练以生成用户流失判定系统；

利用所述用户流失判定系统判断当前平台用户是否为流失用户，若是，则对流失用户进行回流干预。

2.如权利要求1所述的用户流失识别及干预方法，其特征在于，所述对平台用户进行是否流失的标记的方式包括：

获取所述平台用户最近一次活跃行为距当前时间的时间间隔，并判断所述距当前时间的时间间隔是否超过预设时间间隔；

若是，则标记所述平台用户为流失用户；

若否，则标记所述平台用户为非流失用户。

3.如权利要求2所述的用户流失识别及干预方法，其特征在于，所述预设时间间隔的计算过程包括：

获取所述平台用户在平台上全部或部分的活跃行为时间节点；

计算所述活跃行为时间节点之间的平均时间间隔，并以所述平均时间间隔与动态标准差的和作为所述预设时间间隔；其中，所述动态标准差为各所述活跃行为时间节点的标准差与一可调节参数的乘积。

4.如权利要求1所述的用户流失识别及干预方法，其特征在于，还包括：

从多个降维模型中撷取最优降维模型对所述标记样本集进行训练以生成所述用户流失判定系统；

所述降维模型包括：切片逆回归降维模型、切片平均方差估计降维模型、方向回归降维模型、等高线回归降维模型中的部分或全部模型。

5.如权利要求4所述的用户流失识别及干预方法，其特征在于，所述从多个降维模型中撷取最优降维模型的方式包括：

利用多个降维模型分别对不同类别的标记样本集进行训练；

基于所述降维模型的训练结果，计算不同类别的标记样本集间的距离；

将距离最小值所对应的降维模型作为所述最优降维模型。

6.如权利要求1所述的用户流失识别及干预方法，其特征在于，还包括：

从多种干预策略中选取最优干预策略对所述流失用户进行回流干预；

其中，所述干预策略包括：短信推送、APP端消息推送、智能客服触达、优惠券发放中的部分或全部方式。

7.如权利要求6所述的用户流失识别及干预方法，其特征在于，所述最优干预策略的选取过程包括：

基于机器学习方法预测所述平台用户在各种干预策略下的非自然回流概率，并计算所述非自然回流概率与自然回流概率之间的概率差值；

计算基于所述概率差值的用户利润，并选取用户利润最大值所对应的干预策略作为所述最优干预策略；其中，所述用户利润被表示为：所述概率差值和用户价值的乘积与干预成本之间的差值。

8.一种用户流失识别及干预系统，其特征在于，包括：

采集模块，用于对平台用户进行是否流失的标记以得到标记样本集；

训练模块，用于利用降维模型对所述标记样本集进行训练以生成用户流失判定系统；

干预模块，用于利用所述用户流失判定系统判断当前平台用户是否为流失用户，若是，则对流失用户进行回流干预。

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述用户流失识别及干预方法。

10.一种电子终端，其特征在于，包括：处理器及存储器；

所述存储器用于存储计算机程序；

所述处理器用于执行所述存储器存储的计算机程序，以使所述终端执行如权利要求1至7中任一项所述用户流失识别及干预方法。