CN112767125A - 一种客户流失的预测方法、装置及存储介质 - Google Patents
一种客户流失的预测方法、装置及存储介质 Download PDFInfo
- Publication number
- CN112767125A CN112767125A CN202110057345.0A CN202110057345A CN112767125A CN 112767125 A CN112767125 A CN 112767125A CN 202110057345 A CN202110057345 A CN 202110057345A CN 112767125 A CN112767125 A CN 112767125A
- Authority
- CN
- China
- Prior art keywords
- customers
- potential
- attrition
- list
- customer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 26
- 230000002159 abnormal effect Effects 0.000 claims description 28
- 238000012545 processing Methods 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 4
- 230000008901 benefit Effects 0.000 abstract description 5
- 238000007405 data analysis Methods 0.000 abstract description 2
- 238000003066 decision tree Methods 0.000 description 13
- 238000012549 training Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 238000005070 sampling Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 3
- 238000013138 pruning Methods 0.000 description 3
- 238000007637 random forest analysis Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 235000020068 maotai Nutrition 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Technology Law (AREA)
- Game Theory and Decision Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种客户流失的预测方法,涉及数据分析领域,解决了现有技术中,不能对流失客户进行预测,导致大量客户流失,影响该单位的效益的问题,该方法包括:获取客户的个人数据;根据个人数据,构建指标特征宽表;根据特征宽表,使用RF算法确定潜在流失客户名单;根据潜在流失客户名单以及Kmeans++算法,对潜在流失客户进行分组,确定各个组的潜在客户的特征;进而实现了实时预测潜在流失名单,根据名单进行分组,有针对性地对潜在的流失客户进行维护,最大限度地减少客户的流失。
Description
技术领域
本申请涉及数据分析技术领域,尤其涉及一种客户流失的预测方法、装置及存储介质。
背景技术
随着我国经济的发展,商业银行的竞争愈发激烈,当前我国商业银行面临更为复杂多变的经济金融环境,在经济增速放缓,监管要求不断提高的情况下,我国商业银行的业务和盈利空间在数伦酱紫的背景下逐步被压缩,民营银行政策的追捕放开和推行,银行间围绕客户的争夺越来越白热化。在当前各个银行产品比较接近的前提下,维护老客户会比发展新客户的成本低很多。
因此在竞争激烈的大环境下,如何更好地维护老客户,如何采取有效的手段防止客户的流失,成为各个银行必须面对的问题。
发明内容
本申请实施例通过提供一种客户流失的预测方法、装置及存储介质,解决了现有技术中,不能对流失客户进行预测,导致大量客户流失,影响该单位的效益的问题,实现了实时预测潜在流失名单,根据名单进行分组,有针对性地对潜在的流失客户进行维护,最大限度地减少客户的流失。
第一方面,本发明实施例提供了一种客户流失的预测方法,该方法包括:
获取客户的个人数据;
根据所述个人数据,构建指标特征宽表;
根据所述特征宽表,使用RF算法确定潜在流失客户名单;
根据所述潜在流失客户名单以及Kmeans++算法,对所述潜在流失客户进行分组,确定各个组的所述潜在客户的特征。
结合第一方面,在一种可能的实现方式中,所述构建指标特征宽表,包括,
对所述个人数据进行样本总量、流失客户以及未流失客户样本数的数量进行统计;
将异常值分为数值型异常值以及字符型异常值,对所述数值型异常值进行零填充,对所述字符型异常值进行众数填充。
结合第一方面,在一种可能的实现方式中,所述构建指标特征宽表,还包括:采用欠样技术对样本不均衡的现象进行处理。
结合第一方面,在一种可能的实现方式中,所述根据所述潜在流失客户名单以及Kmeans++算法,对所述潜在流失客户进行聚类分组,确定各个组的所述潜在客户的特征,包括:
根据所述客户的特征,对所述潜在客户提出针对性的营销策略,以使客户流失率降低。
结合第一方面,在一种可能的实现方式中,所述个人数据,包括:基本信息、资产信息、交易信息、产品持有信息以及金融信用信息。
第二方面,本发明实施例提供了一种客户流失的预测装置,该装置包括:
数据获取单元:用于获取客户个人数据;
表构建单元:用于根据所述个人数据,构建指标特征宽表;
结果确定单元:用于根据所述特征宽表,确定潜在流失客户名单;
特征分析单元:用于根据所述潜在流失客户名单以及Kmeans++算法,对所述潜在流失客户进行分组,确定各个组的所述潜在客户的特征。
结合第二方面,在一种可能的实现方式中,所述表构建单元中还包括有数据处理单元和异常处理单元,所述数据处理单元用于:对所述个人数据进行样本总量、流失客户以及未流失客户样本数的数量进行统计;所述异常处理单元用于:将异常值分为数值型异常值以及字符型异常值,对所述数值型异常值进行零填充,对所述字符型异常值进行众数填充。
结合第二方面,在一种可能的实现方式中,所述模型训练单元具体用于:采用欠样技术对样本不均衡的现象进行处理。
结合第二方面,在一种可能的实现方式中,所述特征分析单元具体用于:根据所述客户的特征,对所述潜在客户提出针对性的营销策略,以使客户流失率降低。
第三方面,本发明实施例提供了一种客户流失的预测装置,其特征在于,包括存储器和处理器;
所述存储器用于存储计算机可执行指令;
所述处理器用于执行所述计算机可执行指令,以实现一种客户流失预测的方法。
第四方面,本发明实施例还提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有可执行指令,计算机执行所述可执行指令时以实现一种客户流失预测的方法。
本发明实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
本发明实施例通过采用了获取客户的个人数据,并且根据个人数据建立指标特征宽表,指标特征宽表能够使查询和性能有较高的提高,且在一张表中能够大大提高数据挖掘模型训练过程中迭代计算时的效率问题,根据特征宽表,使用RF算法确定潜在流失客户名单,得到能够输出的未来潜在流失客户的名单,在基于Kmeans++算法,对潜在客户进行分组,确定每个组潜在客户的共同特征,针对这些每个组的共同特征提出建设性的意见;该方法有效解决了现有技术中,不能对流失客户进行预测,导致大量客户流失,影响该单位的效益的问题,进而实现了实时预测潜在流失名单,根据名单进行分组,有针对性地对潜在的流失客户进行维护,最大限度地减少客户的流失。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对本发明实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的客户流失的预测方法的步骤流程图;
图2为本申请实施例提供的客户流失的预测方法中的构建指宽表的步骤流程图;
图3为本申请实施例提供的客户流失的预测装置的示意图;
图4为本申请实施例提供的客户流失的预测实体装置的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种客户流失的预测方法,如图1所示,该方法包括以下步骤:
步骤S101:获取客户的个人数据。
步骤S102:根据个人数据,构建指标特征宽表。
步骤S103:根据特征宽表,使用RF算法确定潜在流失客户名单。
步骤S104:根据潜在流失客户名单以及Kmeans++算法,对潜在流失客户进行分组,确定各个组的潜在客户的特征。
本发明实施例通过采用了获取客户的个人数据,并且根据个人数据建立指标特征宽表,指标特征宽表能够使查询和性能有较高的提高,且在一张表中能够大大提高数据挖掘模型训练过程中迭代计算时的效率问题,根据特征宽表,使用RF算法确定潜在流失客户名单,得到能够输出的未来潜在流失客户的名单,在基于Kmeans++算法,对潜在客户进行分组,确定每个组潜在客户的共同特征,针对这些每个组的共同特征提出建设性的意见;该方法有效解决了现有技术中,不能对流失客户进行预测,导致大量客户流失,影响该单位的效益的问题,进而实现了实时预测潜在流失名单,根据名单进行分组,有针对性地对潜在的流失客户进行维护,最大限度地减少客户的流失。
在步骤S101中,个人数据,包括:基本信息、资产信息、交易信息、产品持有信息以及金融信用信息。基本信息包括客户的年龄、性别、客户的等级以及客户的年龄;资产信息包括客户近三个月日均资产、近三个月日均活期、理财占比以及活期占比;交易信息包括客户近六个月收入金额、近六个月支出金额、近六个月收入次数以及近六个月支出次数;客户的产品持有信息包括持有定期产品个数、持有理财产品个数、最近三个月是否有理财到期、最近三个也是否有定期到期、是否机接续率以及是否贷款;客户的金融信息包括信用风险次数、违约次数以及逾期次数。
在步骤S102中,构建指标特征宽表,如图2所示,包括以下步骤:
步骤S201:对个人数据进行样本总量、流失客户以及未流失客户样本数的数量进行统计。得到样本的各项统计值。
步骤S202:将异常值分为数值型异常值以及字符型异常值,对数值型异常值进行零填充,对字符型异常值进行众数填充。
在步骤S202中,针对采集的个人数据,针对异常值的问题,本实施例采用的是盒图法检测异常值,对检测出的异常值直接进行删除。
在步骤S102中,构建指标特征宽表,还包括:采用欠样技术对样本不均衡的现象进行处理。针对采集数据中的个人数据,流失客户与未流失客户的样本不均衡的问题,采用欠采样即书和SMOTE算法解决数据样本不均衡的现象。
在步骤S103中,根据特征宽表,使用RF算法确定潜在流失客户名单。
RF算法构建随机森林的过程有以下步骤:
(1)假如有N个样本,则有返回的随机选择N个样本(每次随机选择一个样本,然后返回继续选择)。这选择好了的N个样本用来训练一个决策树,作为决策树根节点处的样本。
(2)当每个样本有M个属性时,在决策树的每个节点需要分裂时,随机从这M个属性中选取出m个属性,满足条件m<<M。然后从这m个属性中采用某种策略(比如说信息增益)来选择1个属性作为该节点的分裂属性。
(3)决策树形成过程中每个节点都要按照步骤2来分裂(很容易理解,如果下一次该节点选出来的那一个属性是刚刚其父节点分裂时用过的属性,则该节点已经达到了叶子节点,无需继续分裂了)。一直到不能够再分裂为止。注意整个决策树形成过程中没有进行剪枝。
(4)按照步骤1~3建立大量的决策树,这样就构成了随机森林了。
在建立每一棵决策树的过程中,有两点需要注意采样与完全分裂。首先是两个随机采样的过程,random forest对输入的数据要进行、列的采样。对于行采样,采用有放回的方式,也就是在采样得到的样本集合中,可能有重复的样本。假设输入样本为N个,那么采样的样本也为N个。这样使得在训练的时候,每一棵树的输入样本都不是全部的样本,使得相对不容易出现over-fitting。然后进行列采样,从M个feature中,选择m个(m<<M)。之后就是对采样之后的数据使用完全分裂的方式建立出决策树,这样决策树的某一个叶子节点要么是无法继续分裂的,要么里面的所有样本的都是指向的同一个分类。一般很多的决策树算法都一个重要的步骤——剪枝,但是这里不这样干,由于之前的两个随机采样的过程保证了随机性,所以就算不剪枝,也不会出现over-fitting。根据以上步骤,确定潜在流失客户名单。
在步骤S104中,根据潜在流失客户名单以及Kmeans++算法,对潜在流失客户进行聚类分组,确定各个组的潜在客户的特征,包括:
根据客户的特征,对潜在客户提出针对性的营销策略,以使客户流失率降低。
Kmeans++算法应用分为以下步骤:
(1)初始化聚类中心,随时选取一个样本作为第一个聚类中心,计算每个样本与当前已有的聚类中心之间的距离,中医距离越大的被选取作为聚类中心的概率越大,最后,用轮盘发选出下一个聚类中心,经过多次迭代选出多个聚类中心。
(2)计算每个样本到(1)中得到的多个聚类中心的距离,将其余聚类中心最短的距离中心归属到一类,迭代多次,指导轮廓习俗大于0.85。其中距离的计算公式为:其中,Xi表示划分群的样本,Xit表示第i个样本的特征,Cj表示为第j个簇中心,Cjt表示为第j簇中心的第t个特征。
通过Kmeans++对潜在流失客户进行细分,制定针对性的营销策略,进行精准营销。
本发明实施例提供了一种客户流失的预测装置,如图3所示,该装置包括以下单元:数据获取单元301、表构建单元302、模型训练单元303以及特征分析单元304。数据获取单元301:用于获取客户个人数据;表构建单元302:用于根据个人数据,构建指标特征宽表;模型训练单元303:用于根据特征宽表,使用RF算法确定潜在流失客户名单;特征分析单元304:用于根据潜在流失客户名单以及Kmeans++算法,对潜在流失客户进行分组,确定各个组的潜在客户的特征。表构建单元302中还包括有数据处理单元和异常处理单元,数据处理单元用于:对个人数据进行样本总量、流失客户以及未流失客户样本数的数量进行统计;异常处理单元用于:将异常值分为数值型异常值以及字符型异常值,对数值型异常值进行零填充,对字符型异常值进行众数填充。模型训练单元303具体用于:采用欠样技术对样本不均衡的现象进行处理。特征分析单元304具体用于:根据客户的特征,对潜在客户提出针对性的营销策略,以使客户流失率降低。
本发明实施例提供了一种客户流失的预测装置,包括存储器401和处理器402;存储器401用于存储计算机可执行指令;处理器402用于执行计算机可执行指令,以实现客户流失的预测方法。
本申请实施例提供一种城乡协同发展分析的服务器,其特征在于,计算机可读存储介质存储有可执行指令,计算机执行可执行指令时能够实现以实现客户流失的预测方法。
上述存储介质包括但不限于随机存取存储器(英文:Random Access Memory;简称:RAM)、只读存储器(英文:Read-Only Memory;简称:ROM)、缓存(英文:Cache)、硬盘(英文:Hard Disk Drive;简称:HDD)或者存储卡(英文:Memory Card)。所述存储器可以用于存储计算机程序指令。
虽然本申请提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。本实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照本实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。
上述实施例阐明的装置或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种单元分别描述。在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。当然,也可以将实现某功能的单元由多个子单元或子单元组合实现。
本申请中所述的方法、装置或单元可以以计算机可读程序代码方式实现控制器按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(英文:Application Specific Integrated Circuit;简称:ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件单元又可以是硬件部件内的结构。
本申请所述装置中的部分单元可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序单元。一般地,程序单元包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序单元可以位于包括存储设备在内的本地和远程计算机存储介质中。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的硬件的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,也可以通过数据迁移的实施过程中体现出来。该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施方式采用递进的方式描述,各个实施方式之间相同或相似的部分互相参见即可,每个实施方式重点说明的都是与其他实施方式的不同之处。本申请的全部或者部分可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、移动通信终端、多处理器系统、基于微处理器的系统、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
以上实施例仅用以说明本申请的技术方案,而非对本申请限制;尽管参照前述实施例对本申请进行了详细的说明,本领域普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请技术方案的范围。
Claims (8)
1.一种客户流失的预测方法,其特征在于,包括
获取客户的个人数据;
根据所述个人数据,构建指标特征宽表;
根据所述特征宽表,使用RF算法确定潜在流失客户名单;
根据所述潜在流失客户名单以及Kmeans++算法,对所述潜在流失客户进行分组,确定各个组的所述潜在客户的特征。
2.根据权利要求1所述的方法,其特征在于,所述构建指标特征宽表,包括,
对所述个人数据进行样本总量、流失客户以及未流失客户样本数的数量进行统计;
将异常值分为数值型异常值以及字符型异常值,对所述数值型异常值进行零填充,对所述字符型异常值进行众数填充。
3.根据权利要求2所述的方法,其特征在于,所述构建指标特征宽表,还包括:采用欠样技术对样本不均衡的现象进行处理。
4.根据权利要求1所述的方法,其特征在于,所述根据所述潜在流失客户名单以及Kmeans++算法,对所述潜在流失客户进行聚类分组,确定各个组的所述潜在客户的特征,包括:
根据所述客户的特征,对所述潜在客户提出针对性的营销策略,以使客户流失率降低。
5.根据权利要求1所述的方法,其特征在于,所述个人数据,包括:基本信息、资产信息、交易信息、产品持有信息以及金融信用信息。
6.一种客户流失的预测装置,其特征在于,包括:
数据获取单元:用于获取客户个人数据;
表构建单元:用于根据所述个人数据,构建指标特征宽表;
结果确定单元:用于根据所述特征宽表,确定潜在流失客户名单;
特征分析单元:用于根据所述潜在流失客户名单以及Kmeans++算法,对所述潜在流失客户进行分组,确定各个组的所述潜在客户的特征。
7.一种客户流失的预测装置,其特征在于,包括存储器和处理器;
所述存储器用于存储计算机可执行指令;
所述处理器用于执行所述计算机可执行指令,以实现权利要求1-5中任一项所述的方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有可执行指令,计算机执行所述可执行指令时能够实现如权利要求1-5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110057345.0A CN112767125A (zh) | 2021-01-15 | 2021-01-15 | 一种客户流失的预测方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110057345.0A CN112767125A (zh) | 2021-01-15 | 2021-01-15 | 一种客户流失的预测方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112767125A true CN112767125A (zh) | 2021-05-07 |
Family
ID=75701996
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110057345.0A Pending CN112767125A (zh) | 2021-01-15 | 2021-01-15 | 一种客户流失的预测方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112767125A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109190796A (zh) * | 2018-08-02 | 2019-01-11 | 北京天元创新科技有限公司 | 一种电信客户流失预测方法、系统及电子设备 |
CN109636443A (zh) * | 2018-11-17 | 2019-04-16 | 南京中数媒介研究有限公司 | 客户流失预测的深度学习方法及装置 |
CN110837931A (zh) * | 2019-11-08 | 2020-02-25 | 中国农业银行股份有限公司 | 客户流失预测方法、装置及存储介质 |
KR20200053387A (ko) * | 2018-11-08 | 2020-05-18 | 김형수 | 인공지능 기반 고객이탈관리 자동화 시스템 및 방법과, 이를 위한 컴퓨터 프로그램 |
-
2021
- 2021-01-15 CN CN202110057345.0A patent/CN112767125A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109190796A (zh) * | 2018-08-02 | 2019-01-11 | 北京天元创新科技有限公司 | 一种电信客户流失预测方法、系统及电子设备 |
KR20200053387A (ko) * | 2018-11-08 | 2020-05-18 | 김형수 | 인공지능 기반 고객이탈관리 자동화 시스템 및 방법과, 이를 위한 컴퓨터 프로그램 |
CN109636443A (zh) * | 2018-11-17 | 2019-04-16 | 南京中数媒介研究有限公司 | 客户流失预测的深度学习方法及装置 |
CN110837931A (zh) * | 2019-11-08 | 2020-02-25 | 中国农业银行股份有限公司 | 客户流失预测方法、装置及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210374610A1 (en) | Efficient duplicate detection for machine learning data sets | |
US20200192894A1 (en) | System and method for using data incident based modeling and prediction | |
US9268838B2 (en) | Efficient query processing using histograms in a columnar database | |
JP6419860B2 (ja) | 特徴処理トレードオフ管理 | |
Ediger et al. | Massive streaming data analytics: A case study with clustering coefficients | |
US8775161B1 (en) | Method and apparatus for triggering the automatic generation of narratives | |
US20150356576A1 (en) | Computerized systems, processes, and user interfaces for targeted marketing associated with a population of real-estate assets | |
US20160086084A1 (en) | Method and Apparatus for Triggering the Automatic Generation of Narratives | |
US20150379429A1 (en) | Interactive interfaces for machine learning model evaluations | |
US20200311581A1 (en) | High quality pattern mining model and method based on improved multi-objective evolutionary algorithm | |
CN113435900A (zh) | 交易风险确定方法、装置和服务器 | |
CN114170002A (zh) | 一种访问频次的预测方法及装置 | |
US11256748B2 (en) | Complex modeling computational engine optimized to reduce redundant calculations | |
CN113761379A (zh) | 商品推荐方法及装置、电子设备和介质 | |
Marella et al. | Detecting fraudulent credit card transactions using outlier detection | |
Purushu et al. | Predictive analysis of financial fraud detection using azure and spark ML | |
Gardner et al. | Analyzing response time in the redundancy-d system | |
CN116862658A (zh) | 信用评估方法、装置、电子设备、介质和程序产品 | |
CN116757476A (zh) | 一种风险预测模型的构建、风险防控方法和装置 | |
CN116862641A (zh) | 信贷产品推荐方法、装置、电子设备及存储介质 | |
CN112767125A (zh) | 一种客户流失的预测方法、装置及存储介质 | |
Chen et al. | Stock market prediction using weighted inter-transaction class association rule mining and evolutionary algorithm | |
CN114722941A (zh) | 信贷违约识别方法、装置、设备和介质 | |
CN108256694A (zh) | 基于重复遗传算法的模糊时间序列预测系统、方法及装置 | |
Bhatnagar | Data mining-based big data analytics: parameters and layered framework |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |