CN112767124A - 一种个人代发业务留存率提升的方法及装置 - Google Patents
一种个人代发业务留存率提升的方法及装置 Download PDFInfo
- Publication number
- CN112767124A CN112767124A CN202110055873.2A CN202110055873A CN112767124A CN 112767124 A CN112767124 A CN 112767124A CN 202110055873 A CN202110055873 A CN 202110055873A CN 112767124 A CN112767124 A CN 112767124A
- Authority
- CN
- China
- Prior art keywords
- analysis
- customers
- determining
- data
- clustering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 230000014759 maintenance of location Effects 0.000 title claims abstract description 38
- 238000004458 analytical method Methods 0.000 claims abstract description 39
- 238000012216 screening Methods 0.000 claims abstract description 22
- 238000013145 classification model Methods 0.000 claims abstract description 19
- 230000000694 effects Effects 0.000 claims description 12
- 238000007621 cluster analysis Methods 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 6
- 230000006399 behavior Effects 0.000 claims description 5
- 238000007619 statistical method Methods 0.000 claims description 5
- 238000007405 data analysis Methods 0.000 abstract description 2
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 238000007637 random forest analysis Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000004141 dimensional analysis Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Accounting & Taxation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Finance (AREA)
- Bioinformatics & Computational Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种个人代发业务留存率提升的方法及装置,涉及大数据分析技术领域;解决了现有技术中银行客户流失的问题。该方法包括:获取多张分析基础表;根据业务关系,将多张分析基础表进行指标关联,确定数据宽表;根据数据宽表筛选与留存率关联的重要指标特征,并结合所述业务关系进行聚类分析,确定聚类分组;对聚类分组进行筛选,确定待分析组;构建分类模型,对待分析组进行分类,确定分类结果;根据所述分类结果制定不同的方案,并确定潜在营销代发客户名单。实现了有选择地面对有价值的客户,去除掉无价值的客户,节省了大量的时间和人力,并且有针对性地对原有的客户进行产品推荐,使得整体的个人代发业务留存率有较大的提升。
Description
技术领域
本申请涉及大数据分析技术领域,尤其涉及一种个人代发业务留存率提升的方法及装置。
背景技术
随着市场经济的不断发展,商业银行面临的竞争越来越激烈,并且现在社会经济增速加快,监管的要求不断地提高,我国的商业银行的业务和盈利空间在数轮降息的大背景之下已经被逐步地压缩,民营银行的政策逐步地放开与推行,使各大银行之间的竞争逐渐加剧。
目前,各银行在对代发客户进行营销时,一方面存在客户基数大,难以识别高潜力营销客户,且营销成本大的问题,另一方面,各银行没有有效的匹配产品进行人性化推荐,使得营销效果甚微。
发明内容
本申请实施例通过提供一种个人代发业务留存率提升的方法及装置,解决了现有技术中银行客户流失的问题,进而实现了有选择地面对有价值的客户,去除掉无价值的客户,节省了大量的时间和人力,并且有针对性地对原有的客户进行匹配产品推荐,使得整体的个人代发业务留存率有较大的提升。
第一方面,本发明实施例提供了一种个人代发业务留存率提升的方法,该方法包括:
获取多张分析基础表;
根据业务关系,将多张所述分析基础表进行指标关联,确定数据宽表;
根据所述数据宽表筛选与留存率关联的重要指标特征,并结合所述业务关系进行聚类分析,确定聚类分组;
对所述聚类分组进行筛选,确定待分析组;
构建分类模型,对所述待分析组进行分类,确定分类结果;
根据所述分类结果制定不同的方案,并确定潜在营销代发客户名单。
结合第一方面,在一种可能的实现方式中,所述基础分析表包括:客户基本信息表、客户产品持有表、客户资产负债表、客户交易行为表、产品服务开通表。
结合第一方面,在一种可能的实现方式中,所述确定数据宽表后,还包括:删除黑名单客户、交易违约客户、近1年无交易客户、联系方式缺失客户、非代发客户。
结合第一方面,在一种可能的实现方式中,所述根据所述数据宽表筛选与留存率关联的重要指标特征,包括:基于统计法和绘图对比法进行探查分析,确定出高留存客户与低留存客户之间的差异特征。
结合第一方面,在一种可能的实现方式中,所述聚类分析,包括:根据Kmeans方法对代发客户进行聚类分析,确定聚类分组。
结合第一方面,在一种可能的实现方式中,所述构建分类模型,包括:运用混淆矩阵和ROC曲线对模型效果进行检验,确定效果最好的所述分类模型。
第二方面,本发明实施例还提供了一种个人代发业务留存率提升的装置,包括:
数据获取单元:用于获取多张分析基础表;
数据确定单元:用于根据业务关系,将多张所述分析基础表进行指标关联,确定数据宽表;
数据聚类单元:用于根据所述数据宽表筛选与留存率关联的重要指标特征,并结合所述业务关系进行聚类分析,确定聚类分组;
筛选分组单元:用于对所述聚类分组进行筛选,确定待分析组;
模型分类单元:用于构建分类模型,对所述待分析组进行分类,确定分类结果;
结果确定单元:用于根据所述分类结果制定不同的方案,并确定潜在营销代发客户名单。
结合第二方面,在一种可能的实现方式中,所述数据获取单元具体包括获取客户基本信息表、客户产品持有表、客户资产负债表、客户交易行为表、产品服务开通表。
结合第二方面,在一种可能的实现方式中,所述数据确定单元还包括,数据处理单元,具体用于删除黑名单客户、交易违约客户、近1年无交易客户、联系方式缺失客户、非代发客户。
结合第二方面,在一种可能的实现方式中,所述数据聚类单元还包括特征分析单元,具体用于基于统计法和绘图对比法进行探查分析,确定出高留存客户与低留存客户之间的差异特征。
结合第二方面,在一种可能的实现方式中,所述筛选分类单元具体用于据Kmeans方法对代发客户进行聚类分析,确定聚类分组。
结合第二方面,在一种可能的实现方式中,所述模型分类单元还包括模型测试单元,具体用于运用混淆矩阵和ROC曲线对模型效果进行检验,确定效果最好的所述分类模型。
第三方面,本发明实施例还提供了一种个人代发业务留存率提升的设备,其特征在于,包括存储器和处理器;
所述存储器用于存储计算机可执行指令;
所述处理器用于执行所述计算机可执行指令,以实现个人代发业务留存率提升的方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有可执行指令,计算机执行所述可执行指令时能够实现个人代发业务留存率提升的方法。
本发明实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
本发明实施例通过采用了一种个人代发业务留存率提升的方法,包括获取多张基础分析表,根据业务关系,将多张分析基础表关联,形成数据宽表,这一过程,将零散个人数据进行关联,能够多维度地分析个人数据进行,得到个人数据完整的数据链;通过数据宽表进行筛选重要指标特征,并且结合业务关系进行聚类分析,确定聚类分析,在这一过程,对已经处理好的数据进行分析、分类得到度数据初步的聚类结果;通过这个聚类结果进行筛选出有价值的客户,确定出待分析组,构建细分的分类模型,分类模型可以由随机森林进行训练的,随机森林不容易陷入过拟合,且有很好的抗噪声能力,对数据集的质量要求也不高,并且实现比较简单,在分类模型训练成功之后,运用混淆矩阵,ROC曲线,模型精准度等分类评估指标进行模型效果检验,直到选出训练的最好的模型;运用模型输出留存率提升的潜在客户,并针对潜在的客户进行专业的营销,有效解决了银行客户流失的问题,进而实现了有选择地面对有价值的客户,去除掉无价值的客户,节省了大量的时间和人力,并且有针对性地对原有的客户进行产品推荐,使得整体的个人代发业务留存率有较大的提升。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对本发明实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的个人代发业务留存率提升的方法的步骤流程图;
图2为本申请实施例提供的个人代发业务留存率提升的装置结构示意图;
图3为本申请实施例提供的个人代发业务留存率提升的设备的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种个人代发业务留存率提升的方法,如图1所示,该方法包括以下步骤:
步骤S101:获取多张分析基础表。
步骤S102:根据业务关系,将多张分析基础表进行指标关联,确定数据宽表。
步骤S103:根据数据宽表筛选与留存率关联的重要指标特征,并结合业务关系进行聚类分析,确定聚类分组。
步骤S104:对聚类分组进行筛选,确定待分析组。
步骤S105:构建分类模型,对待分析组进行分类,确定分类结果。
步骤S105:根据分类结果制定不同的方案,并确定潜在营销代发客户名单。
在本申请中,通过对客户个人的基础表做关联,得出客户个人的关联表信息,并且在对表中的数据进行处理之后,得到与留存率有关的重要指标特征,结合业务关系,对数据进行聚类分析,得到聚类分组为多个组,对聚类结果中的多个组进行筛选得到后续待分析的组,构建分类模型,对待分析的组进行更加细致的分类,后根据不同的分类得到不同的定制方案。并且能够得到营销成功率较高的客户名单。
在步骤S101中,基础分析表包括:客户基本信息表、客户产品持有表、客户资产负债表、客户交易行为表、产品服务开通表,根据上述表中的一个共有的特征,一般选择客户的客户号。
在步骤S102中,确定数据宽表后,还包括:删除黑名单客户、交易违约客户、近1年无交易客户、联系方式缺失客户、非代发客户,并且根据客户的客户号对步骤S101中的多张表进行关联,形成一张宽表,一条客户信息应该至少包括年龄、性别、资产余额、交易笔数和产品开通情况等客户的全部信息。在确定好客户的宽表信息后,对宽表信息中的数据进行缺失值填充,一种具体的缺失值填充方法为:对资产以及持有资产等数值性指标进行0值填充,年龄等进行平均值填充,对性别数据进行属性变换,0代表女性,1代表男性,未知值用2代表。进一步的缺失值的处理方法常见的方法如下:人工填写缺失值、使用一个全局常量填充缺失值、使用属性的平均值填充缺失值以及使用同一类的所有样本的平均值进行缺失值填充。
在步骤S103中,根据数据宽表筛选与留存率关联的重要指标特征,包括:基于统计法和绘图对比法进行探查分析,确定出高留存客户与低留存客户之间的差异特征。
在得到高留存客户与低留存客户之间的特征差异后,结合特征进行聚类分析,包括:根据Kmeans方法对代发客户进行聚类分析,确定聚类分组。根据各条数据之间的相似性来进行聚类,聚类分为以下这几个步骤:
(1)首先输入k的值,即我们希望将数据集经过聚类得到k个分组。
(2)从数据集中随机选择k个数据点作为质心,Centroid。
(3)对集合中每一个子节点,计算与每一个质心的距离(距离的含义后面会讲),离哪个质心距离近,就跟定哪个质心。
(4)这时每一个质心下都聚集了好多子节点,通过算法选出新的质心。
(5)如果新的质心和旧的质心之间的距离小于某一个设置的阈值(表示重新计算的质心的位置变化不大,趋于稳定,或者说收敛),可以认为我们进行的聚类已经达到期望的结果,算法终止。
(6)如果新的质心和旧的质心距离变化很大,需要迭代(3)~(5)步骤。
K值主要取决于个人的经验与感觉,通常的做法是多尝试几个K值,看分成几类的结果更好解释,更符合分析目的等。或者可以把各种K值算出的SSE作比较,取最小的SSE的K值。
初始的K个质心通常是随机选,初始质心的选取对最终聚类结果有影响,多执行算法,哪个结果更合理,就用哪个结果。当然也有一些优化的方法,第一种是选择彼此距离最远的点,具体来说就是先选第一个点,然后选离第一个点最远的当第二个点,然后选第三个点,第三个点到第一、第二两点的距离之和最小,以此类推。第二种是先根据其他聚类算法(如层次聚类)得到聚类结果,从结果中每个分类选一个点。质心的距离,第一种计算方法,欧几里德距离,这个距离就是平时我们理解的距离,如果是两个平面上的点,也就是(x1,y1),和(x2,y2),两点距离是:
如果是三维空间中:
推广到高维空间公式就以此类推。可以看出,欧几里德距离真的是数学加减乘除算出来的距离,因此这就是只能用于连续型变量的原因。第二种,余弦相似度,余弦相似度用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小。相比距离度量,余弦相似度更加注重两个向量在方向上的差异,而非距离或长度上。
在得到上述的聚类结果后,使用随机森林算法进行客户的分类,再输出高、中、低等级的客户名单。多次进行聚类,得到多个聚类结果。在上述进行距离计算构建分类模型时,也可以运用混淆矩阵和ROC曲线对多个聚类结果进行检验,确定效果最好的分类模型。
虽然本申请提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。本实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或设备执行时,可以按照本实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。
本发明实施例还提供了一种个人代发业务留存率提升的装置200,如图2所示,个人代发业务留存率提升的装置200包括:数据获取单元201、数据确定单元202、数据聚类单元203、筛选分组单元204、模型分类单元205以及结果确定单元206。数据获取单元201用于获取多张分析基础表;数据确定单元202用于根据业务关系,将多张分析基础表进行指标关联,确定数据宽表;数据聚类单元203用于根据数据宽表筛选与留存率关联的重要指标特征,并结合业务关系进行聚类分析,确定聚类分组;筛选分组单元204用于对聚类分组进行筛选,确定待分析组;模型分类单元205用于构建分类模型,对待分析组进行分类,确定分类结果;结果确定单元206用于根据分类结果制定不同的方案,并确定潜在营销代发客户名单。
数据获取单元201具体包括获取客户基本信息表、客户产品持有表、客户资产负债表、客户交易行为表、产品服务开通表。数据确定单元201还包括,数据处理单元,具体用于删除黑名单客户、交易违约客户、近1年无交易客户、联系方式缺失客户以及非代发客户。
数据聚类单元203还包括特征分析单元,具体用于基于统计法和绘图对比法进行探查分析,确定出高留存客户与低留存客户之间的差异特征。
筛选分类单元204具体用于据Kmeans方法对代发客户进行聚类分析,确定聚类分组。
模型分类单元205还包括模型测试单元,具体用于运用混淆矩阵和ROC曲线对模型效果进行检验,确定效果最好的分类模型。
上述实施例阐明的装置或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种单元分别描述。在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。当然,也可以将实现某功能的单元由多个子单元或子单元组合实现。
本发明实施例还提供了一种个人代发业务留存率提升的设备,如图3所示,包括存储器301和处理器302,存储器301与处理器302之间通过系统总线303连接。存储器301用于存储计算机可执行指令;处理器302用于执行计算机可执行指令,以实现个人代发业务留存率提升的方法。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有可执行指令,计算机执行可执行指令时能够实现个人代发业务留存率提升的方法。
上述存储介质包括但不限于随机存取存储器(英文:Random Access Memory;简称:RAM)、只读存储器(英文:Read-Only Memory;简称:ROM)、缓存(英文:Cache)、硬盘(英文:Hard Disk Drive;简称:HDD)或者存储卡(英文:Memory Card)。所述存储器可以用于存储计算机程序指令。
本申请中所述的方法、装置或单元可以以计算机可读程序代码方式实现控制器按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(英文:Application Specific Integrated Circuit;简称:ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件单元又可以是硬件部件内的结构。
本申请所述装置中的部分单元可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序单元。一般地,程序单元包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序单元可以位于包括存储设备在内的本地和远程计算机存储介质中。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的硬件的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,也可以通过数据迁移的实施过程中体现出来。该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施方式采用递进的方式描述,各个实施方式之间相同或相似的部分互相参见即可,每个实施方式重点说明的都是与其他实施方式的不同之处。本申请的全部或者部分可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、移动通信终端、多处理器系统、基于微处理器的系统、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
以上实施例仅用以说明本申请的技术方案,而非对本申请限制;尽管参照前述实施例对本申请进行了详细的说明,本领域普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请技术方案的范围。
Claims (9)
1.一种个人代发业务留存率提升的方法,其特征在于,包括:
获取多张分析基础表;
根据业务关系,将多张所述分析基础表进行指标关联,确定数据宽表;
根据所述数据宽表筛选与留存率关联的重要指标特征,并结合所述业务关系进行聚类分析,确定聚类分组;
对所述聚类分组进行筛选,确定待分析组;
构建分类模型,对所述待分析组进行分类,确定分类结果;
根据所述分类结果制定不同的方案,并确定潜在营销代发客户名单。
2.根据权利要求1所述的方法,其特征在于,所述基础分析表包括:客户基本信息表、客户产品持有表、客户资产负债表、客户交易行为表、产品服务开通表。
3.根据权利要求1所述的方法,其特征在于,所述确定数据宽表后,还包括:删除黑名单客户、交易违约客户、近1年无交易客户、联系方式缺失客户、非代发客户。
4.根据权利要求1所述的方法,其特征在于,所述根据所述数据宽表筛选与留存率关联的重要指标特征,包括:基于统计法和绘图对比法进行探查分析,确定出高留存客户与低留存客户之间的差异特征。
5.根据权利要求1所述的方法,其特征在于,所述聚类分析,包括:根据Kmeans方法对代发客户进行聚类分析,确定聚类分组。
6.根据权利要求1所述的方法,其特征在于,所述构建分类模型,包括:运用混淆矩阵和ROC曲线对模型效果进行检验,确定效果最好的所述分类模型。
7.一种个人代发业务留存率提升的装置,包括:
数据获取单元:用于获取多张分析基础表;
数据确定单元:用于根据业务关系,将多张所述分析基础表进行指标关联,确定数据宽表;
数据聚类单元:用于根据所述数据宽表筛选与留存率关联的重要指标特征,并结合所述业务关系进行聚类分析,确定聚类分组;
筛选分组单元:用于对所述聚类分组进行筛选,确定待分析组;
模型分类单元:用于构建分类模型,对所述待分析组进行分类,确定分类结果;
结果确定单元:用于根据所述分类结果制定不同的方案,并确定潜在营销代发客户名单。
8.一种个人代发业务留存率提升的设备,其特征在于,包括存储器和处理器;
所述存储器用于存储计算机可执行指令;
所述处理器用于执行所述计算机可执行指令,以实现权利要求1-6中任一项所述的方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有可执行指令,计算机执行所述可执行指令时能够实现如权利要求1-6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110055873.2A CN112767124A (zh) | 2021-01-15 | 2021-01-15 | 一种个人代发业务留存率提升的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110055873.2A CN112767124A (zh) | 2021-01-15 | 2021-01-15 | 一种个人代发业务留存率提升的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112767124A true CN112767124A (zh) | 2021-05-07 |
Family
ID=75703020
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110055873.2A Pending CN112767124A (zh) | 2021-01-15 | 2021-01-15 | 一种个人代发业务留存率提升的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112767124A (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7398270B1 (en) * | 2001-01-31 | 2008-07-08 | Choi Lawrence J | Method and system for clustering optimization and applications |
CA2825742A1 (en) * | 2012-08-30 | 2014-02-28 | Accenture Global Services Limited | Marketing device, marketing method, program and recording medium |
CN106204267A (zh) * | 2016-07-06 | 2016-12-07 | 吴本刚 | 一种基于改进k‑means和神经网络聚类的客户细分系统 |
CN109583651A (zh) * | 2018-12-03 | 2019-04-05 | 焦点科技股份有限公司 | 一种保险电商平台用户流失预测的方法和装置 |
CN110135893A (zh) * | 2019-04-16 | 2019-08-16 | 深圳壹账通智能科技有限公司 | 潜在用户的确定方法、装置、计算机设备及存储介质 |
CN110232154A (zh) * | 2019-05-30 | 2019-09-13 | 平安科技(深圳)有限公司 | 基于随机森林的产品推荐方法、装置及介质 |
CN110389974A (zh) * | 2019-07-30 | 2019-10-29 | 中原银行股份有限公司 | 数据分析方法及系统 |
CN110837931A (zh) * | 2019-11-08 | 2020-02-25 | 中国农业银行股份有限公司 | 客户流失预测方法、装置及存储介质 |
CN110880082A (zh) * | 2019-11-29 | 2020-03-13 | 中国工商银行股份有限公司 | 服务评价方法、装置、系统、电子设备和可读存储介质 |
CN111047412A (zh) * | 2019-12-16 | 2020-04-21 | 武汉智领云科技有限公司 | 一种大数据电商运营平台 |
CN111325248A (zh) * | 2020-02-10 | 2020-06-23 | 深圳华策辉弘科技有限公司 | 降低贷前业务风险的方法及系统 |
CN111507395A (zh) * | 2020-04-15 | 2020-08-07 | 赛诺数据科技(南京)有限公司 | 一种营销大数据建模方法及平台 |
CN111666492A (zh) * | 2020-04-30 | 2020-09-15 | 中国平安财产保险股份有限公司 | 基于用户行为的信息推送方法、装置、设备及存储介质 |
-
2021
- 2021-01-15 CN CN202110055873.2A patent/CN112767124A/zh active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7398270B1 (en) * | 2001-01-31 | 2008-07-08 | Choi Lawrence J | Method and system for clustering optimization and applications |
CA2825742A1 (en) * | 2012-08-30 | 2014-02-28 | Accenture Global Services Limited | Marketing device, marketing method, program and recording medium |
CN106204267A (zh) * | 2016-07-06 | 2016-12-07 | 吴本刚 | 一种基于改进k‑means和神经网络聚类的客户细分系统 |
CN109583651A (zh) * | 2018-12-03 | 2019-04-05 | 焦点科技股份有限公司 | 一种保险电商平台用户流失预测的方法和装置 |
CN110135893A (zh) * | 2019-04-16 | 2019-08-16 | 深圳壹账通智能科技有限公司 | 潜在用户的确定方法、装置、计算机设备及存储介质 |
CN110232154A (zh) * | 2019-05-30 | 2019-09-13 | 平安科技(深圳)有限公司 | 基于随机森林的产品推荐方法、装置及介质 |
CN110389974A (zh) * | 2019-07-30 | 2019-10-29 | 中原银行股份有限公司 | 数据分析方法及系统 |
CN110837931A (zh) * | 2019-11-08 | 2020-02-25 | 中国农业银行股份有限公司 | 客户流失预测方法、装置及存储介质 |
CN110880082A (zh) * | 2019-11-29 | 2020-03-13 | 中国工商银行股份有限公司 | 服务评价方法、装置、系统、电子设备和可读存储介质 |
CN111047412A (zh) * | 2019-12-16 | 2020-04-21 | 武汉智领云科技有限公司 | 一种大数据电商运营平台 |
CN111325248A (zh) * | 2020-02-10 | 2020-06-23 | 深圳华策辉弘科技有限公司 | 降低贷前业务风险的方法及系统 |
CN111507395A (zh) * | 2020-04-15 | 2020-08-07 | 赛诺数据科技(南京)有限公司 | 一种营销大数据建模方法及平台 |
CN111666492A (zh) * | 2020-04-30 | 2020-09-15 | 中国平安财产保险股份有限公司 | 基于用户行为的信息推送方法、装置、设备及存储介质 |
Non-Patent Citations (3)
Title |
---|
吴丹;朱美芳;: "基于K-means聚类和神经网络的电商客户潜在价值分析", 黑龙江科技信息, no. 22, 5 August 2016 (2016-08-05), pages 151 - 152 * |
李琦: "优质代发客户识别模型的研究与应用", 电子技术与软件工程, 31 December 2019 (2019-12-31), pages 136 - 137 * |
瞿小宁: "K均值聚类算法在商业银行客户分类中的应用", 计算机仿真, vol. 28, no. 6, 30 June 2011 (2011-06-30), pages 357 - 360 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107066616B (zh) | 用于账号处理的方法、装置及电子设备 | |
CN101604363B (zh) | 基于文件指令频度的计算机恶意程序分类系统及分类方法 | |
Kočišová et al. | Discriminant analysis as a tool for forecasting company's financial health | |
CN111461180A (zh) | 样本分类方法、装置、计算机设备及存储介质 | |
WO2011133551A2 (en) | Reducing the dissimilarity between a first multivariate data set and a second multivariate data set | |
CN108197795B (zh) | 恶意团体账户识别方法、装置、终端及存储介质 | |
Sasank et al. | Credit card fraud detection using various classification and sampling techniques: a comparative study | |
CN112036476A (zh) | 基于二分类业务的数据特征选择方法、装置及计算机设备 | |
CN112437053A (zh) | 入侵检测方法及装置 | |
CN111445304A (zh) | 信息推荐方法、装置、计算机设备及存储介质 | |
CN112348685A (zh) | 信用评分方法、装置、设备及存储介质 | |
CN113641825B (zh) | 基于客观信息论的智慧法院系统大数据处理方法及装置 | |
CN115545103A (zh) | 异常数据识别、标签识别方法和异常数据识别装置 | |
CN113448955B (zh) | 数据集质量评估方法、装置、计算机设备及存储介质 | |
CN110968802A (zh) | 一种用户特征的分析方法、分析装置及可读存储介质 | |
CN112435133A (zh) | 基于图分析的医保联合欺诈检测方法、装置及设备 | |
Xiong et al. | Time irreversibility and intrinsics revealing of series with complex network approach | |
CN116821820A (zh) | 一种虚假交易识别方法、装置、电子设备及存储介质 | |
CN112767124A (zh) | 一种个人代发业务留存率提升的方法及装置 | |
CN114140246A (zh) | 模型训练方法、欺诈交易识别方法、装置和计算机设备 | |
CN114626940A (zh) | 数据分析方法、装置及电子设备 | |
CN114092216A (zh) | 企业信贷评级方法、装置、计算机设备和存储介质 | |
CN114722941A (zh) | 信贷违约识别方法、装置、设备和介质 | |
CN110472680B (zh) | 目标分类方法、装置和计算机可读存储介质 | |
JP2017084249A (ja) | データ分類システム,方法,プログラムおよびその記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |