CN117408742B - 用户筛分方法及系统 - Google Patents
用户筛分方法及系统 Download PDFInfo
- Publication number
- CN117408742B CN117408742B CN202311730351.3A CN202311730351A CN117408742B CN 117408742 B CN117408742 B CN 117408742B CN 202311730351 A CN202311730351 A CN 202311730351A CN 117408742 B CN117408742 B CN 117408742B
- Authority
- CN
- China
- Prior art keywords
- user
- asset
- amplitude reduction
- distribution table
- users
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 238000012216 screening Methods 0.000 title claims abstract description 46
- 230000009467 reduction Effects 0.000 claims abstract description 354
- 238000012549 training Methods 0.000 claims abstract description 37
- 230000015556 catabolic process Effects 0.000 claims description 56
- 238000006731 degradation reaction Methods 0.000 claims description 56
- 230000006870 function Effects 0.000 claims description 29
- 230000008569 process Effects 0.000 claims description 28
- 238000013136 deep learning model Methods 0.000 claims description 24
- 230000035772 mutation Effects 0.000 claims description 11
- 238000012163 sequencing technique Methods 0.000 claims description 9
- 230000002265 prevention Effects 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000011478 gradient descent method Methods 0.000 claims description 4
- 238000013461 design Methods 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims description 3
- 230000014759 maintenance of location Effects 0.000 abstract description 22
- 238000012545 processing Methods 0.000 abstract description 2
- 230000008859 change Effects 0.000 description 15
- 230000003247 decreasing effect Effects 0.000 description 10
- 238000007726 management method Methods 0.000 description 10
- 238000013459 approach Methods 0.000 description 9
- 230000006399 behavior Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000012804 iterative process Methods 0.000 description 2
- 238000013468 resource allocation Methods 0.000 description 2
- 238000012502 risk assessment Methods 0.000 description 2
- 238000012954 risk control Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000010923 batch production Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000008303 genetic mechanism Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Theoretical Computer Science (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Technology Law (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Game Theory and Decision Science (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及数据处理领域,特别是涉及一种用户筛分方法及系统,该方法包括:首先根据用户资产数值对用户进行等级划分,然后筛选资产负增长的用户得到用户降幅列表,根据不同月份的用户降幅列表得到第一用户资产降幅分布表与第二用户资产降幅分布表,设置阈值,基于找到的最优挽留率筛分出流失用户,训练模型预测未来的流失用户。本发明通过比较各个资产规模等级内的用户在不同月份的资产降幅幅度找到合适的资产降幅分布表,实现找到最优挽留率,确定目标资产降幅,划分流失用户。
Description
技术领域
本发明涉及数据处理领域,特别是涉及一种用户筛分方法及系统。
背景技术
随着金融体系的深度变革,商业银行正面临着一系列挑战,其中包括用户忠诚度低和产品购买率低等问题。这些问题直接影响到银行的业务发展和市场竞争力,因此,对可能流失的用户做出预警和挽回已经成为了商业银行的重要任务。
目前的技术手段主要是基于人工经验建立规则的用户流失预警方法。近年来,一些方法还引入了机器学习算法,以提高预警的精度。
然而,这些方法的输入模型仍然依赖于人工定义的流失用户标准,这些基于人工经验的规则存在一些缺点和不足。例如,这些方法通常是基于固定的特征权重和阈值来划分用户等级,这些权重和阈值往往是人为设置或者基于历史数据统计的,不能反映用户行为的实时变化和个性化差异。其次,这些方法大多基于单一或者简单组合的分类算法来构建预警模型,不能充分利用多种算法之间的优势和互补性。最后,这些方法通常是基于单次或者定期的批量处理来更新预警模型,这种处理方式往往耗时且效率低下,不能及时响应市场变化和用户需求。这些缺陷会导致输入模型的数据不符合实际分布,使模型识别效果不佳或鲁棒性差。因此,急需一种可以根据用户行为的实时变化和个性化差异进行动态调整,同时能够综合多种分类算法之间的优势和互补性,实现精确更新预警模型的方法。
发明内容
为此,本发明提供了一种用户筛分方法及系统,解决了现有技术中划分流失用户标准精度不足的问题。
为实现上述目的,本发明一方面提供一种用户筛分方法,该方法包括:
根据存储在数据库内的用户资产数值对用户进行等级划分,划分为若干资产规模等级;
开始筛选第i月的流失用户与非流失用户;
在每个所述资产规模等级内,选择i月与i-1月相比存在资产负增长的用户,并将所述用户按照降幅幅度从大到小进行排序,获取i月的用户降幅列表;
根据i月的所述用户降幅列表确定第一用户资产降幅分布表;
重复以上步骤,根据i-1月的所述用户降幅列表确定第二用户资产降幅分布表;
设置阈值;
根据所述第一用户资产降幅分布表和所述第二用户资产降幅分布表的差值与所述阈值的关系确定当前资产规模等级内的流失用户;
基于所述流失用户预测未来的流失用户。
进一步地,根据每个所述资产规模等级内的所述用户降幅列表确定的第一用户资产降幅分布表包括:分别计算在各个所述用户降幅列表中的前X%的用户的平均资产降幅,得到各个所述资产规模等级下的第一用户资产降幅分布表,所述第一用户资产降幅分布表包括若干所述平均资产降幅以及与所述平均资产降幅对应的用户百分比,所述第一用户资产降幅分布表是根据第i月和第i-1月的用户资产数据获取的,所述第一用户资产降幅分布表内的某一平均资产降幅为在所述资产规模等级内筛分最初的第i月流失用户与非流失用户的目标资产降幅。
进一步地,得到第二用户资产降幅分布表包括:在每个所述资产规模等级内,选择i-1月与i-2月存在资产负增长的用户,并将所述用户按照降幅幅度从大到小进行排序,获取各个所述资产规模等级内的用户降幅列表,计算所述用户降幅列表中降幅前X%的用户的平均资产降幅。
进一步地,根据所述第一用户资产降幅分布表和所述第二用户资产降幅分布表的差值与所述阈值的关系确定当前资产规模等级内的流失用户包括:
若所述第一用户资产降幅分布表和所述第二用户资产降幅分布表的差值大于设置的阈值,则将i更新为i-1后重复执行开始筛选后的所有步骤,若差值小于或等于设置的阈值,则向下执行;
使用从所述第一用户资产降幅分布表找到最优挽留率X%;
将所述最优挽留率X%带入该所述资产规模等级内首次产生的第一用户资产降幅分布表,查找所述最优挽留率X%在首次产生的第一用户资产降幅分布表中对应的用户平均资产降幅,该平均资产降幅为目标资产降幅;
在最初的第i月的每个所述资产规模等级内的用户降幅列表中,若用户实际资产降幅大于所述目标资产降幅,则判定该用户为当前资产规模等级内的流失用户。
进一步地,在确定流失用户后,还包括:若用户实际资产降幅小于所述目标资产降幅,则判定该用户为当前资产规模等级内的非流失用户。
进一步地,在确定所述第一用户资产降幅分布表和所述第二用户资产降幅分布表的差值与所述阈值的关系时,
初步设置所述第一用户资产降幅分布表中的用户百分比为1%-100%,所述用户百分比对应的平均资产降幅数据分别为A1-A100;
初步设置所述第二用户资产降幅分布表中的用户百分比为1%-100%,所述用户百分比对应的平均资产降幅数据分别为B1-B100;
对A1-A100求和得到结果C,对B1-B100求和得到结果D,用C-D得到结果E,用E除以C得到结果F,F为所述第一用户资产降幅分布表和所述第二用户资产降幅分布表的差值,所述用户百分比的设定根据用户实际数量化调整;
阈值初步设置为50%,所述阈值根据准确性和覆盖率进行调整。
进一步地,在寻找最优挽留率X%的过程中,初始生成一个由不同挽留率X% 值构成的数值组,随后采用选择、交叉和变异操作生成新的数值组,每个个体挽留率X的适应度通过一个基于用户资产降幅分布表和预定的目标资产降幅设计的适应度函数来评估,所述适应度的评价标准是预测未来的流失用户的准确率。
进一步地,预测未来的流失用户通过训练后的深度学习模型进行,训练后的所述深度学习模型基于筛分后的流失用户作为流失标签训练得到,将筛分出来的所述流失用户与所述非流失用户的数据作为深度学习模型的训练集,输入选定的深度学习模型进行训练,训练后的深度学习模型根据现有用户数据预测未来可能出现的流失用户。
进一步地,所述深度学习模型的训练过程中,采用了梯度下降法进行优化,且在训练过程中,应用过拟合防止技术,所述过拟合防止技术包括早期停止和正则化。
进一步地,所述适应度函数包括人工成本约束函数和收敛速度,其中,所述人工成本约束函数采用公式(1)来计算;
所述收敛速度采用公式(2)来计算;
人工成本约束函数C(t)=N(t)+D(t) (1)
收敛速度V=(N1-N2)/(t1-t2) (2)
其中,N(t)表示在选择最佳挽留率的过程中的使用的用户资产数据中的字符数量,D(t)表示在选择最佳挽留率的过程中使用的用户资产数据中的数据量,N1为在t1时刻确定的最佳挽留率,N2为t2时刻确定的最佳挽留率,t为选择最佳挽留率的过程的使用时长。
另一方面,本发明还提供一种用户筛分系统,该系统包括:用户资产划分模块,用于根据存储在数据库内的用户资产数值对用户进行等级划分,划分为若干资产规模等级;
资产负增长筛选模块,用于开始筛选第i月的流失用户与非流失用户;在每个所述资产规模等级内,选择i月与i-1月相比存在资产负增长的用户;
平均资产降幅计算模块,将所述用户按照降幅幅度从大到小进行排序,获取i月的用户降幅列表;根据i月的所述用户降幅列表确定第一用户资产降幅分布表;重复以上步骤,根据i-1月的所述用户降幅列表确定第二用户资产降幅分布表;
分布表比较模块,用于设置阈值;根据所述第一用户资产降幅分布表和所述第二用户资产降幅分布表的差值与所述阈值的关系确定当前资产规模等级内的流失用户;
流失用户识别模块,用于基于所述流失用户预测未来的流失用户;
所述分布表比较模块包括更新单元、选择单元、查找单元和判定单元:
若所述第一用户资产降幅分布表和所述第二用户资产降幅分布表的差值大于设置的阈值,则所述更新单元将i更新为i-1后重复执行开始筛选后的所有步骤,若差值小于或等于设置的阈值,则向下执行;
所述选择单元用以从所述第一用户资产降幅分布表找到最优挽留率X%;
所述查找单元用以将所述最优挽留率X%带入该所述资产规模等级内首次产生的第一用户资产降幅分布表,查找所述最优挽留率X%在首次产生的第一用户资产降幅分布表中对应的用户平均资产降幅,该平均资产降幅为目标资产降幅;
在最初的第i月的每个所述资产规模等级内的用户降幅列表中,若用户实际资产降幅大于所述目标资产降幅,则所述判定单元用以判定该用户为当前资产规模等级内的流失用户。
与现有技术相比,本发明的有益效果在于,本发明提出的用户筛分方法及系统能够显著提升识别并划分流失用户的精确度,根据实时用户行为数据,动态调整流失用户的定义,可以更准确地捕捉用户行为的实时变化和个性化需求,从而避免了人工划定流失用户标准带来的精度不足问题。
尤其,本发明优化流失用户特征权重,模拟自然选择和遗传机制,可以处理大规模参数空间,寻找最优特征权重和阈值,从而找到最佳流失用户划分方式。上述流失用户划分方式构建更准确的用户流失预警模型,突破了人工设置权重和阈值的限制,提高了流失用户的划分精度和流失用户预警的精确度和效率。
尤其,本发明能够显著提升预警模型训练集的质量,极大地降低了模型偏离正确方向的可能性,更精准地识别出流失用户群体,提升模型鲁棒性,提高识别效果。
尤其,本发明可以实时更新预警模型,迅速响应市场变化和用户需求,更快地捕捉市场变化,显著提升预警模型的时效性和适应性。
综上所述,本发明可动态优化特征权重和阈值,更加精准地划分流失用户的标准,从而提升划分流失用户的精确度。同时,利用深度学习模型预测流失用户,以及实时更新预警模型,有效提升了用户流失预警的精度、覆盖范围和实时性,为商业银行和其他金融机构提供了有力的工具,帮助他们更好地挽留用户,提升用户忠诚度,并增强市场竞争力。
附图说明
图1为本发明实施例提供的用户筛分方法的流程图;
图2为本发明另一个实施例提供的用户筛分方法的流程图;
图3为本发明实施例提供的用户筛分系统的结构图。
具体实施方式
为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
需要说明的是,在本发明的描述中,术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系,这仅仅是为了便于描述,而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,还需要说明的是,在本发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可根据具体情况理解上述术语在本发明中的具体含义。
请参阅图1所示,本发明的实施例提供的用户筛分方法包括:
步骤S100:根据存储在数据库内的用户资产数值对用户进行等级划分,划分为若干资产规模等级;
步骤S200:在每个所述资产规模等级内,选择i月与i-1月相比存在资产负增长的用户,并将所述用户按照降幅幅度从大到小进行排序,获取i月的用户降幅列表;
步骤S300:根据i月的所述用户降幅列表确定第一用户资产降幅分布表;
步骤S400:重复以上步骤,根据i-1月的所述用户降幅列表确定第二用户资产降幅分布表;
步骤S500:设置阈值;
步骤S600:根据所述第一用户资产降幅分布表和所述第二用户资产降幅分布表的差值与所述阈值的关系确定当前资产规模等级内的流失用户;
步骤S700:基于所述流失用户预测未来的流失用户。
具体而言,在步骤S100中,用户资产数值首先被送入到一个等级划分的阶段,以便按照资产规模对用户进行分类。在这个操作流程中,用户根据他们的资产数值被划分在不同的资产规模等级。例如,资产在50万以下的用户可以划分为A级,资产在50万至100万的用户划分为B级,资产在100万至150万的用户划分为C级,以此类推,每隔50万资产数值就提升一个等级,直至覆盖所有的用户。
具体而言,这是一种基于用户资产数值进行的分级策略,其核心目标在于实现对用户的分类管理,基于资产规模对用户进行差异化的分析。这种方式有利于精细化管理用户资产,从而提升资产管理的效率。
具体而言,在步骤S200中,其工作过程涉及计算每个用户在两个连续月份中的资产差额,以及将这些差额转换为降幅百分比的形式,并按照降幅幅度从大到小进行排序,得到一个用户降幅列表。例如用户甲在6月的资产数值为100万,在7月的资产数字为90万,两个之间下降了10万,资产降幅为10%。资产规模等级为A的用户甲,资产数值降幅为10%;资产规模等级为A的用户乙,资产数值降幅为70%;资产规模等级为A的用户丙,资产数值降幅为60%;那么在资产规模等级为A的用户中,用户降幅列表为:乙、丙、甲,排名顺序分先后。
具体而言,此阶段是依据用户的绝对资产降幅进行筛选,用以确定在第 i 月与第i-1 月之间资产减少的用户。它通过检测用户资产的下滑情况,旨在识别可能面临财务问题的用户。这是为了进一步区分和识别出资产减少幅度较大的用户,为后续的风险评估和用户管理提供依据。
具体而言,在步骤S300中,计算每个资产规模等级内的用户降幅列表中前X%用户的平均资产降幅,获取第 i 月较第 i-1 月资产减少的第一用户资产降幅分布表。这是一个求平均和构造分布表的过程,例如,假设在资产规模等级为A的用户中,降幅最高的前30%的用户的资产降幅百分分别比为70%、60%和50%,那么前30%用户的平均资产降幅就是(70%+60%+50%)/3=60%;降幅最高的前40%的用户的资产降幅百分比分别为70%、60%、50%、40%,那么前40%用户的平均资产降幅就是(70%+60%+50%+40%)/4=55%,以此类推分别计算各个用户百分比对应的平均资产降幅。
具体而言,其功能是为了更好地理解用户资产降幅的整体状况,通过与后边的第二用户资产降幅分布表对比,找出降幅变化稳定的一个月。其效果可以精细地探索和了解不同资产规模等级的用户在资产缩减方面的具体情况,是计算最佳挽留率的前置基础。
具体而言,在步骤S400中,所述第二用户资产降幅分布表为获取的第i-1月较第i-2月资产减少的用户的资产降幅分布表,例如,假设在i-1月,在资产规模等级为A的用户中,降幅幅度前10%的用户的平均资产降幅为70%,降幅幅度前20%的用户的平均资产降幅为60%,降幅幅度前50%的用户的平均资产降幅为50%。
具体而言,获取第二用户资产降幅分布表是为了获取历史数据,例如降幅幅度前10%的用户的平均资产降幅70%、降幅幅度前20%的用户的平均资产降幅60%、降幅幅度前50%的用户的平均资产降幅50%这些数据可以作为参考,用于与i月的所述第一用户资产降幅分布表对比降幅分布数据的差异,从而识别出资产降幅的变化趋势,以帮助确定降幅变化小于阈值的第一用户资产降幅分布表。
具体而言,在步骤S500中,阈值的初步设置为50%。
具体而言,阈值的设置是为了约束后续的循环过程,找到相较于上个月降幅变化不大的第一用户资产降幅分布表。
具体而言,在步骤S600中,将步骤S300获得的资产降幅分布表与步骤S400获得的资产降幅分布表进行比较,若结果差异大于设置的阈值,那么将i更新为i-1后重复执行步骤S200到S600,若差异小于或等于设置的阈值,则向下执行。在最后得到的第一用户资产降幅分布表中使用找到最优的挽留率X%。将找到的最优挽留率X%带入步骤S300中第一次获得的用户资产降幅分布表中,找到X%所对应的平均降幅。在初始i月的每个资产规模等级内的用户降幅列表中,若用户实际降幅大于所述平均降幅,则判定该用户为流失用户。
具体而言,这样可以根据资产降幅的变化趋势,动态调整策略,检查用户资产降幅是否存在突变的情况,如果存在,则需要重新进行用户筛选并算出资产降幅分布表。然后可以在趋于稳定的变化中确定最佳挽留率,进而可以筛分出初始月的流失用户。
具体而言,根据每个所述资产规模等级内的所述用户降幅列表确定的第一用户资产降幅分布表包括:分别计算在各个所述用户降幅列表中的前X%的用户的平均资产降幅,得到各个所述资产规模等级下的第一用户资产降幅分布表,所述第一用户资产降幅分布表包括若干所述平均资产降幅以及与所述平均资产降幅对应的用户百分比,所述第一用户资产降幅分布表是根据第i月和第i-1月的用户资产数据获取的,所述第一用户资产降幅分布表内的某一平均资产降幅为在所述资产规模等级内筛分最初的第i月流失用户与非流失用户的目标资产降幅。
具体而言,在用户降幅列表中的前X%的用户,X的取值为0-100的整数,例如,假设在资产规模等级为A的用户降幅列表中,降幅最高的前30%的用户的资产降幅百分比为70%,60%, 和50%,那么前30%用户的平均资产降幅就是(70%+60%+50%)/3=60%;降幅最高的前40%的用户的资产降幅百分比为70%、60%、50%、40%,那么前40%用户的平均资产降幅就是(70%+60%+50%+40%)/4=55%。
具体而言,这是一个求平均和构造分布表的过程,其功能是为了更好地理解用户资产降幅的整体状况。其效果可以精细地探索和了解不同资产规模等级的用户在资产缩减方面的具体情况,这对于制定具体的风险控制策略是非常有帮助的。
具体而言,得到各个所述资产规模等级下的第二用户资产降幅分布表包括:在每个所述资产规模等级内,选择i-1月与i-2月存在资产负增长的用户,并将所述用户按照降幅幅度从大到小进行排序,获取各个所述资产规模等级内的用户降幅列表,根据所述用户降幅列表得到各个所述资产规模等级下的第二用户资产降幅分布表。
具体而言,在获取过程中,假设在i-1月,在资产规模等级为A的用户中,降幅幅度前10%的用户的平均资产降幅为70%,降幅幅度前20%的用户的平均资产降幅为60%,降幅幅度前50%的用户的平均资产降幅为50%。
具体而言,第二用户资产降幅分布表的获取方式与第一用户资产降幅分布表的获取方式相同,这样才能与i月的所述第一用户资产降幅分布表进行对比,从而识别出资产降幅的变化趋势,以帮助确定降幅变化小于阈值的第一用户资产降幅分布表。
具体而言,根据所述第一用户资产降幅分布表和所述第二用户资产降幅分布表的差值与所述阈值的关系确定当前资产规模等级内的流失用户包括:
若所述第一用户资产降幅分布表和所述第二用户资产降幅分布表的差值大于设置的阈值,则将i更新为i-1后重复执行开始筛选后的所有步骤,若差值小于或等于设置的阈值,则向下执行;
使用从所述第一用户资产降幅分布表找到最优挽留率X%;
将所述最优挽留率X%带入该所述资产规模等级内首次产生的第一用户资产降幅分布表,查找所述最优挽留率X%在首次产生的第一用户资产降幅分布表中对应的用户平均资产降幅,该平均资产降幅为目标资产降幅;
在最初的第i月的每个所述资产规模等级内的用户降幅列表中,若用户实际资产降幅大于所述目标资产降幅,则判定该用户为当前资产规模等级内的流失用户。
具体而言,所述第一用户资产降幅分布表和所述第二用户资产降幅分布表的差值小于设置的阈值时,使用找从所述第一用户资产降幅分布表找到最优挽留率X%,将所述最优挽留率X%带入步骤S300中第一次获得的用户资产降幅分布表中,找到降幅前X%的用户所对应的平均降幅,该降幅为目标资产降幅。在初始i月的每个资产规模等级内的用户降幅列表中,若用户实际降幅大于目标资产降幅,则判定该用户为流失用户。例如,使用找到的最优挽留率X%为30%,在初始i月的A级用户中,降幅前30%的用户所对应的平均降幅为40%,那么这个40%就是目标资产降幅,假设用户甲的实际降幅为60%,那么用户甲被判定为流失用户。
具体而言,我们的方法中所使用的和资产降幅的比较策略能够更精确地识别和判断流失用户。例如,在我们的例子中,找到的最优挽留率X%为30%,在初始i月的A级用户中,降幅前30%的用户所对应的平均降幅为40%。我们将这个40%设置为目标资产降幅,假设用户甲的实际降幅为60%,那么用户甲被判定为流失用户。这种方法带来了诸多的优势。首先,通过这种策略,我们更加精确地找出那些存在流失风险的用户。这对于企业来说是极其重要的,因为这样可以提前采取必要的策略来挽留这些用户,减少用户流失带来的损失。其次,这种方法能够实现自动化和系统化的用户管理。比如说,我们可以设定一个阈值,根据阈值自动筛选出潜在的流失用户,这样可以大大提高工作效率,减轻人工的工作负担。最后,这种方法还为我们提供了更多的操作空间和灵活性。例如,我们可以随时调整阈值,根据实际情况和需要来更好地管理用户,实现个性化的服务。因此,以上做法的结果不仅能够帮助我们更有效地管理用户,降低用户流失率,也能够提高我们的服务质量,满足用户的个性化需求。
具体而言,在确定流失用户后,还包括:若用户实际资产降幅小于所述目标资产降幅,则判定该用户为当前资产规模等级内的非流失用户。
具体而言,当目标资产降幅为40%时,假设用户乙的实际降幅为20%,那么用户乙被判定为非流失用户。
具体而言,这个方法允许我们不仅识别出潜在的流失用户,也同样能够确定非流失用户。例如,在我们的模型中,当目标资产降幅设为40%时,如果用户乙的实际降幅为20%,则我们可以确定用户乙为非流失用户。这种确定非流失用户的方法也带来了一系列的优势。首先,这种策略让我们有可能更深入地理解用户的行为和需求。对于那些非流失用户,我们可以进一步分析他们保持相对稳定资产的原因,这些原因可能包括我们的产品或服务质量、用户的忠诚度等等,这些都是非常有价值的信息。其次,这种方法可以帮助我们更精准地进行资源配置。对于非流失用户,我们可以相对减少在他们身上的投入,而将更多的资源和注意力放在可能流失的用户上,提高整体的客户保留率。最后,这种方法提供了一个清晰的用户画像,帮助我们更好地进行用户分群。我们可以基于用户的资产降幅将用户分为流失用户和非流失用户,从而更有效地进行精细化的用户管理。总的来说,通过确定流失用户和非流失用户,我们不仅可以有效地识别出可能流失的用户,提前采取挽留措施,也可以更好地理解非流失用户的需求和行为,优化资源配置,提高客户保留率,进一步提升服务质量。
具体而言,在确定所述第一用户资产降幅分布表和所述第二用户资产降幅分布表的差值与所述阈值的关系时,
初步设置所述第一用户资产降幅分布表中的用户百分比为1%-100%,所述用户百分比对应的平均资产降幅数据分别为A1-A100;
初步设置所述第二用户资产降幅分布表中的用户百分比为1%-100%,所述用户百分比对应的平均资产降幅数据分别为B1-B100;
对A1-A100求和得到结果C,对B1-B100求和得到结果D,用C-D得到结果E,用E除以C得到结果F,F为所述第一用户资产降幅分布表和所述第二用户资产降幅分布表的差值,所述用户百分比的设定根据用户实际数量化调整;
阈值初步设置为50%,所述阈值根据准确性和覆盖率进行调整。
具体而言,用户资产降幅分布表中的用户百分比可以根据用户实际数量调整,例如,用户数量多的时候,用户百分比可以为0.01%-100%,所述用户百分比对应的平均资产降幅数据则分别为A1-A10000,用户数量少的时候,用户百分比可以为10%-100%,所述用户百分比对应的平均资产降幅数据则分别为A1-A10。阈值可以根据准确性和覆盖率调整,例如业务需求是优先保证准确性,则减小阈值提高筛选的严格程度,业务需求是优先保证覆盖率,则增大阈值提高筛选的宽松程度。这里我们假设第一用户资产降幅分布表的数据为:前10%用户平均降幅为90%、前20%用户平均降幅为80%、前30%用户平均降幅为70%、前40%用户平均降幅为40%、前50%用户平均降幅为20%、前60%用户平均降幅为15%、前70%用户平均降幅为12%、前80%用户平均降幅为8%、前90%用户平均降幅为6%、前100%用户平均降幅为5%,第二用户资产降幅分布表的数据为前10%用户平均降幅为80%、前20%用户平均降幅为75%、前30%用户平均降幅为70%、前40%用户平均降幅为30%、前50%用户平均降幅为20%、前60%用户平均降幅为15%、前70%用户平均降幅为12%、前80%用户平均降幅为8%、前90%用户平均降幅为6%、前100%用户平均降幅为5%。那么C的结果为346%,D的结果为321%,E的结果为25%,F的结果为7.78%。阈值初步设置为50%,结合用户数量调整为20%。得出结果第一用户资产降幅分布表与第二用户资产降幅分布表的差值小于阈值。
具体而言,这一步主要是为了检查是否存在突变的情况,如果存在,则需要重新进行资产等级划分和用户筛选。如果不存在,可以向下执行找出最优挽留率。该过程的一个关键作用是监控和理解用户资产降幅的整体变化趋势,以及如何适应这些变化。通过设定并比较阈值,我们可以准确地评估资产降幅的变化幅度,这在一定程度上反映了用户的财务状况的变动情况。首先,通过对两个不同用户资产降幅分布表中的数据进行求和、作差和计算百分比,我们能够得到一个清晰的数据视图,反映出用户资产降幅的变化趋势。这对我们理解用户行为,预测用户流失情况,甚至对产品或服务进行改进都具有重要意义。其次,通过动态地调整阈值,我们能够更灵活地响应不同的业务需求。例如,如果我们的业务需求是优先保证准确性,我们可以适当减小阈值,提高筛选的严格程度;如果我们的业务需求是优先保证覆盖率,我们可以适当增大阈值,提高筛选的宽松程度。这种动态调整阈值的策略使我们能够在满足不同业务需求的同时,也能保持筛选的准确性。
具体而言,在寻找最优挽留率X%的过程中,初始生成一个由不同挽留率X% 值构成的数值组,随后采用选择、交叉和变异操作生成新的数值组,每个个体挽留率X的适应度通过一个基于用户资产降幅分布表和预定的目标资产降幅设计的适应度函数来评估,所述适应度的评价标准是预测未来的流失用户的准确率。
具体而言,在使用找最优挽留率X%时,例如,我们可以随机地从范围[0%,100%]中选择50个挽留率的值作为初始数值组,适应度函数是每个挽留率X%在挽留用户时的成功率。最终我们得出,在A级用户中的最优挽留率X%为30%,在初始i月的A级用户中,降幅前30%的用户所对应的平均降幅为40%,那么这个40%就是目标资产降幅,假设用户甲的实际降幅为60%,那么用户甲被判定为流失用户。
具体而言,的第一步是初始化一个数值组。这个数值组包含了不同的挽留率X%的值,每个值可以被看作是一个个体,然后定义一个适应度函数来评估每个挽留率X%的适应度,也就是说,挽留率越高,适应度就越高。在开始的迭代后,在每次迭代中,首先根据每个个体的适应度进行选择操作,即适应度高的个体有更高的机会被选中。然后进行交叉操作,模拟生物的遗传过程,两个被选中的个体可以生成两个新的个体。最后进行突变操作,模拟生物的突变过程,随机改变一个个体的某个部分。这个迭代过程会持续多轮,直到满足某个停止准则,例如迭代次数达到一定值,或者最优解在一定轮数内没有改善。然后可以从最后的数值组中选出适应度最高的个体,即挽留率X%作为最优解。
具体而言,预测未来的流失用户通过训练后的深度学习模型进行,训练后的所述深度学习模型基于筛分后的流失用户作为流失标签训练得到,将筛分出来的所述流失用户与所述非流失用户的数据作为深度学习模型的训练集,输入选定的深度学习模型进行训练,训练后的深度学习模型根据现有用户数据预测未来可能出现的流失用户。
具体而言,比如我们可以使用一种名为"长短期记忆"(Long Short-Term Memory,简称LSTM)的深度学习模型来进行训练。我们首先将通过得出的流失用户和非流失用户的数据标注,例如,流失用户标签为1,非流失用户标签为0。这些标注数据被用作训练集,输入到LSTM模型中进行训练。训练集可能包括用户的各种行为数据,例如资产变动情况、消费习惯、登录频率等,这些数据构成了一个多维的特征向量。
在训练过程中,模型会尝试找到这些行为数据和用户流失之间的内在关联。训练完毕后,我们就得到了一个可以接受现有用户数据作为输入,预测其是否会流失的模型。
例如,我们有一位用户,他的特征向量是[0.2, 0.5, 0.3, 0.1](代表他的资产变动情况、消费习惯、登录频率等)。我们可以将这个特征向量输入到训练好的LSTM模型中,模型会输出一个值,比如0.8。这个值可以被解释为用户流失的概率。如果这个值超过了我们设定的阈值(比如0.5),那么我们就可以将这位用户标记为可能流失的用户,从而采取相应的策略来挽留他。
具体而言,此预测流失用户的方式提供了一个精准和科学的方式来理解用户的流失情况,并针对可能流失的用户制定出有效的挽留策略。这种方法提供了一种基于精确划定的流失用户与非流失用户的深度学习训练,训练结果的准确度将大大超过传统的预测模型。深度学习模型可以挖掘用户数据的深层次规律,有效提升了准确率和覆盖率。
最重要的是这个方法是动态的,它可以根据本发明的流失用户筛分方法实时划定流失用户,借此实时更新模型的预测结果。这种动态性使得模型能够准确地捕捉到用户行为的变化趋势,从而实时调整挽留策略,保持对流失用户的有效预防。
具体而言,所述深度学习模型的训练过程中,采用了梯度下降法进行优化,且在训练过程中,应用过拟合防止技术,所述过拟合防止技术包括早期停止和正则化。
具体而言,以简单的线性回归问题为例,我们的目标是最小化预测值和真实值之间的差距,即误差。我们通过迭代的方式逐步调整模型参数,以使得这个误差达到最小。每一次调整都是沿着误差函数的负梯度方向进行,也就是说,我们每次都是朝着能让误差最快减小的方向调整参数,这就是所谓的"梯度下降"。比如,在训练LSTM模型时,参数的初始值可能是随机设定的,比如权重W的初始值是0.5。在第一次迭代过程中,我们计算出了误差E和W的梯度G,然后将W更新为W-G*学习率,如此反复,直至误差E小于我们设定的阈值或者达到预设的迭代次数。早期停止是指在训练过程中,我们会持续地监控模型在验证集上的性能,一旦发现性能停止提升或者开始下降,我们就会停止训练,这就避免了模型在训练集上过度拟合。而正则化是通过在误差函数中添加一项惩罚项来抑制模型复杂度,避免模型过度依赖某些特征,也可以防止过拟合。例如,我们可以在误差函数中添加权重参数的平方和(L2正则化)或者绝对值和(L1正则化)作为惩罚项,通过调整惩罚系数来控制惩罚的程度。
具体而言,首先,梯度下降法提供了一种有效的优化工具,可以系统地调整模型参数以最小化误差,这是许多复杂的深度学习模型优化的基础。过拟合防止技术如早期停止和正则化能够帮助模型在训练和测试集上都获得好的性能,避免模型在训练集上过度拟合导致在新的数据上性能下降。
具体而言,所述适应度函数包括人工成本约束函数和收敛速度,其中,所述人工成本约束函数采用公式(1)来计算;
所述收敛速度采用公式(2)来计算;
人工成本约束函数C(t)=N(t)+D(t) (1)
收敛速度V=(N1-N2)/(t1-t2) (2)
其中,N(t)表示在选择最佳挽留率的过程中的使用的用户资产数据中的字符数量,D(t)表示在选择最佳挽留率的过程中使用的用户资产数据中的数据量,N1为在t1时刻确定的最佳挽留率,N2为t2时刻确定的最佳挽留率,t为选择最佳挽留率的过程的使用时长。
具体而言,本发明实施例通过适应度函数是用来衡量一个个体在进化算法中的适应程度的函数,适应度函数包括两个部分:人工成本约束函数和收敛速度。人工成本约束函数用来衡量选择最佳挽留率过程中的人工成本,由字符数量(N(t))和数据量(D(t))的和组成,使用公式(1)来计算。收敛速度(V)用来衡量选择最佳挽留率的过程中的收敛速度。由最佳挽留率在不同时刻N1和N2之间的差值除以选择最佳挽留率的过程的使用时长t1和t2得到,使用公式(2)来计算。公式(1)和(2)中的具体参数和计算方式可能需要根据具体应用场景进行调整。
请参阅图2所示,本发明的另一个实施例提供的用户筛分方法包括:
步骤S1000:根据用户资产数值对用户进行等级划分,划分为不同的资产规模等级;
步骤S2000:根据用户的绝对资产降幅筛选出第 i 月与第 i-1 月之间资产减少的用户;
步骤S3000:计算步骤S2000中筛选出来的用户的资产降幅百分比,并按照降幅幅度从大到小进行排序,得到用户降幅列表;
步骤S4000:计算每个资产规模等级内的用户降幅列表中前X%用户的平均资产降幅,获取第 i 月较第 i-1 月资产减少的用户的资产降幅分布表;
步骤S5000:获取第 i -1月较第 i-2 月资产减少的用户的资产降幅分布表;
步骤S6000:将步骤S4000获得的资产降幅分布表与步骤S5000获得的资产降幅分布表进行比较,若结果差异大于设置的阈值,则将i更新为i-1后重复执行步骤S2000到S6000,若差异小于或等于设置的阈值,则向下执行;
步骤S7000:在步骤S4000中得到的用户资产降幅分布表中找到最优挽留率X%;
步骤S8000:将找到的最优挽留率X%带入步骤S4000中第一次获得的用户资产降幅分布表中,找到X%所对应的平均降幅,该降幅为目标资产降幅;
步骤S9000:在初始i月的每个资产规模等级内的用户降幅列表中,若用户实际降幅大于目标资产降幅,则判定该用户为流失用户,若用户实际降幅小于目标资产降幅,则判定该用户为非流失用户;
步骤S10000:将步骤S9000中划分好的流失用户与非流失用户作为模型的训练集,输入深度学习模型进行训练,训练后的模型能够依据现有用户数据预测未来可能出现的流失用户。
具体而言,在步骤S1000中,用户资产数值首先被送入到一个等级划分的阶段,以便按照资产规模对用户进行分类。这是一种基于用户资产数值进行的分级策略,其核心目标在于实现对用户的分类管理,基于资产规模对用户进行差异化的分析。在这个操作流程中,用户根据他们的资产数值被划分在不同的资产规模等级。例如,资产在50万以下的用户可以划分为A级,资产在50万至100万的用户划分为B级,资产在100万至150万的用户划分为C级,以此类推,每隔50万资产数值就提升一个等级,直至覆盖所有的用户。这种方式有利于精细化管理用户资产,从而提升资产管理的效率。
具体而言,在步骤S2000中,此阶段是依据用户的绝对资产降幅进行筛选,用以确定在第 i 月与第 i-1 月之间资产减少的用户。它通过检测用户资产的下滑情况,旨在识别可能面临财务问题的用户。其工作过程涉及计算每个用户在两个连续月份中的资产差额,以及将这些差额转换为百分比形式,例如用户甲在6月的资产数值为100万,在7月的资产数字为90万,两个之间下降了10万,资产降幅为10%。
具体而言,在步骤S3000中,会计算步骤S2000中筛选出来的用户的资产降幅百分比,并按照降幅幅度从大到小进行排序,得到一个用户降幅列表。这是为了进一步区分和识别出资产减少幅度较大的用户,为后续的风险评估和用户管理提供依据。例如,资产规模等级为A的用户甲,资产数值降幅为50%;资产规模等级为A的用户乙,资产数值降幅为70%;资产规模等级为A的用户丙,资产数值降幅为60%;那么在资产规模等级为A的用户中,用户降幅列表为:乙、丙、甲,顺序分先后。
具体而言,在步骤S4000中,计算每个资产规模等级内的用户降幅列表中前X%用户的平均资产降幅,获取第 i 月较第 i-1 月资产减少的用户的资产降幅分布表。这是一个求平均和构造分布表的过程,其功能是为了更好地理解用户资产降幅的整体状况。其效果可以精细地探索和了解不同资产规模等级的用户在资产缩减方面的具体情况,这对于制定具体的风险控制策略是非常有帮助的。例如,假设在资产规模等级为A的用户中,降幅最高的前30%的用户的资产降幅百分比为70%,60%和50%,那么前30%用户的平均资产降幅就是(70%+60%+50%)/3=60%;降幅最高的前40%的用户的资产降幅百分比为70%、60%、50%、40%,那么前40%用户的平均资产降幅就是(70%+60%+50%+40%)/4=55%。
具体而言,在步骤S5000中,获取第i-1月较第i-2月资产减少的用户的资产降幅分布表。这一步是为了获取历史数据,与当前月份的数据进行对比,从而识别出资产降幅趋势。例如,假设在i-1月,在资产规模等级为A的用户中,降幅幅度前10%的用户的平均资产降幅为70%,降幅幅度前20%的用户的平均资产降幅为60%,降幅幅度前50%的用户的平均资产降幅为50%,那么前10%降幅70%、前20%降幅60%、前50%降幅50%这些数据可以作为一个参考,用来对比这个月的降幅分布数据。
具体而言,在步骤S6000中,将步骤S4000获得的资产降幅分布表与步骤S5000获得的资产降幅分布表进行比较,若结果差异大于设置的阈值,例如设置阈值为50%,假设步骤S400获得的资产降幅为60%,步骤S5000获得的资产降幅为50%,60%-50%=10%大于设置的阈值,那么将i更新为i-1后重复执行步骤S2000到S6000,若差异小于或等于设置的阈值,则向下执行。这样可以根据资产降幅的变化趋势,动态调整策略。这一步主要是为了检查是否存在突变的情况,如果存在,则需要重新进行资产等级划分和用户筛选。
具体而言,在步骤S7000中,在步骤S4000中得到的用户资产降幅分布表中找到最优的挽留率X%。例如,假设在资产规模等级为A的用户中,通过找出在资产降幅为60%时,挽留率能达到最优,那么这个60%就是最优挽留率。
具体而言,第一步是初始化一个数值组。这个数值组包含了不同的挽留率X%的值,每个值可以被看作是一个个体。例如,我们可以随机地从范围[0%,100%]中选择50个挽留率的值作为初始数值组。接下来定义一个适应度函数来评估每个挽留率X%的适应度。在这个案例中,适应度函数可以是每个挽留率X%在挽留用户时的成功率。也就是说,挽留率越高,适应度就越高。在开始迭代后,在每次迭代中,首先根据每个个体的适应度进行选择操作,即适应度高的个体有更高的机会被选中。然后进行交叉操作,模拟生物的遗传过程,两个被选中的个体可以生成两个新的个体。最后进行突变操作,模拟生物的突变过程,随机改变一个个体的某个部分。这个迭代过程会持续多轮,直到满足某个停止准则,例如迭代次数达到一定值,或者最优解在一定轮数内没有改善。然后可以从最后的数值组中选出适应度最高的个体,即挽留率X%,作为最优解。在这个例子中,我们得出的最优挽留率X%为60%,意味着在挽留用户时,如果我们采用60%的挽留率,可以达到最好的效果。
具体而言,在步骤S8000中,将找到的最优挽留率X%带入步骤S4000中第一次获得的用户资产降幅分布表中,找到X%所对应的平均降幅,该降幅为目标资产降幅。例如,如果在A级用户中,找到的最优挽留率为60%,在步骤S400中第一次获得的用户资产降幅分布表中找到60%所对应的平均降幅为50%,那么这个50%就是目标资产降幅。
具体而言,在步骤S9000中,在初始i月的每个资产规模等级内的用户降幅列表中,若用户实际降幅大于目标资产降幅,则判定该用户为流失用户,若用户实际降幅小于目标资产降幅,则判定该用户为非流失用户。例如,假设在A级用户中,目标降幅为50%,若用户甲的实际降幅为60%,那么用户甲被判定为流失用户;若用户乙的实际降幅为40%,那么用户乙被判定为非流失用户。
具体而言,在步骤S10000中,将步骤S9000中划分好的流失用户与非流失用户作为模型的训练集,输入深度学习模型进行训练,训练后的模型能够依据现有用户数据预测未来可能出现的流失用户。例如,模型训练完毕后,可以根据用户甲和乙的数据,预测出用户丙在未来是否可能会成为流失用户。
请参阅图3所示,本发明的实施例提供的用户筛分系统包括:用户资产划分模块、资产负增长筛选模块、平均资产降幅计算模块、分布表比较模块、执行模块、流失用户识别模块、未来流失用户预测模块。
所述用户资产划分模块10用于根据数据库内的用户资产数值,对用户进行等级划分,形成多个资产规模等级;
所述资产负增长筛选模块20用于对每个所述资产规模等级的用户,选取在特定月份资产负增长的用户,并按照降幅大小进行排序,生成各个资产规模等级内的用户降幅列表;
所述平均资产降幅计算模30块用于根据所述用户降幅列表,计算出前特定百分比用户的平均资产降幅,生成各所述资产规模等级下的用户资产降幅分布表;
所述分布表比较模块40用于对比各资产规模等级下连续两个月的所述用户资产降幅分布表的差异,若差异大于设置的阈值,则更新月份并重新执行筛选和计算操作;
所述执行模块50用于在所述差异满足阈值条件后,针对每个所述资产规模等级,寻找最优的挽留率,以及对应的目标资产降幅;
所述流失用户识别模块60用于在每个所述资产规模等级的用户降幅列表中,根据得到的所述目标资产降幅,判定实际降幅大于所述目标资产降幅的用户为流失用户,实际降幅小于所述目标资产降幅的用户为非流失用户;
所述未来流失用户预测模块70用于基于识别的所述流失用户与所述非流失用户,预测未来可能出现的流失用户。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
以上所述仅为本发明的优选实施例,并不用于限制本发明;对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种用户筛分方法,其特征在于,包括:
根据存储在数据库内的用户资产数值对用户进行等级划分,划分为若干资产规模等级;
开始筛选第i月的流失用户与非流失用户;
在每个所述资产规模等级内,选择i月与i-1月相比存在资产负增长的用户,并将所述用户按照降幅幅度从大到小进行排序,获取i月的用户降幅列表;
根据i月的所述用户降幅列表确定第一用户资产降幅分布表;
重复以上步骤,根据i-1月的所述用户降幅列表确定第二用户资产降幅分布表;
设置阈值;
根据所述第一用户资产降幅分布表和所述第二用户资产降幅分布表的差值与所述阈值的关系确定当前资产规模等级内的流失用户;
基于所述流失用户预测未来的流失用户;
预测未来的流失用户通过训练后的深度学习模型进行,训练后的所述深度学习模型基于筛分后的流失用户作为流失标签训练得到,将筛分出来的所述流失用户与所述非流失用户的数据作为深度学习模型的训练集,输入选定的深度学习模型进行训练,训练后的深度学习模型根据现有用户数据预测未来可能出现的流失用户;
根据所述第一用户资产降幅分布表和所述第二用户资产降幅分布表的差值与所述阈值的关系确定当前资产规模等级内的流失用户包括:
若所述第一用户资产降幅分布表和所述第二用户资产降幅分布表的差值大于设置的阈值,则将i更新为i-1后重复执行开始筛选后的所有步骤,若差值小于或等于设置的阈值,则向下执行;
从所述第一用户资产降幅分布表找到最优挽留率X%;
得到第一用户资产降幅分布表包括:分别计算在各个所述用户降幅列表由大到小进行排序中的前X%的用户的平均资产降幅,所述用户降幅列表按照降幅幅度从大到小进行排序,得到各个所述资产规模等级下的第一用户资产降幅分布表,所述第一用户资产降幅分布表包括若干所述平均资产降幅以及与所述平均资产降幅对应的用户百分比,所述第一用户资产降幅分布表是根据第i月和第i-1月的用户资产数据获取的,所述第一用户资产降幅分布表内的某一平均资产降幅为在所述资产规模等级内筛分最初的第i月流失用户与非流失用户的目标资产降幅;
得到第二用户资产降幅分布表包括:在每个所述资产规模等级内,选择i-1月与i-2月存在资产负增长的用户,并将所述用户按照降幅幅度从大到小进行排序,获取各个所述资产规模等级内的用户降幅列表,计算所述用户降幅列表中降幅前X%的用户的平均资产降幅;
在寻找最优挽留率X%的过程中,初始生成一个由不同挽留率X% 值构成的数值组,随后采用选择、交叉和变异操作生成新的数值组,每个个体挽留率X%的适应度通过基于用户资产降幅分布表和预定的目标资产降幅设计的适应度函数来评估,所述适应度的评价标准是预测未来的流失用户的准确率;
将所述最优挽留率X%带入该所述资产规模等级内首次产生的第一用户资产降幅分布表,查找所述最优挽留率X%在首次产生的第一用户资产降幅分布表中对应的用户平均资产降幅,该平均资产降幅为目标资产降幅;
在最初的第i月的每个所述资产规模等级内的用户降幅列表中,若用户实际资产降幅大于所述目标资产降幅,则判定该用户为当前资产规模等级内的流失用户。
2.根据权利要求1所述的用户筛分方法,其特征在于,在确定流失用户后,还包括:若用户实际资产降幅小于所述目标资产降幅,则判定该用户为当前资产规模等级内的非流失用户。
3.根据权利要求2所述的用户筛分方法,其特征在于,在确定所述第一用户资产降幅分布表和所述第二用户资产降幅分布表的差值与所述阈值的关系时,
初步设置所述第一用户资产降幅分布表中的用户百分比为1%-100%,所述用户百分比对应的平均资产降幅数据分别为A1-A100;
初步设置所述第二用户资产降幅分布表中的用户百分比为1%-100%,所述用户百分比对应的平均资产降幅数据分别为B1-B100;
对A1-A100求和得到结果C,对B1-B100求和得到结果D,用C-D得到结果E,用E除以C得到结果F,F为所述第一用户资产降幅分布表和所述第二用户资产降幅分布表的差值,所述用户百分比的设定根据用户实际数量化调整;
阈值初步设置为50%,所述阈值能够根据准确性和覆盖率进行调整。
4.根据权利要求3所述的用户筛分方法,其特征在于,所述深度学习模型的训练过程中,采用了梯度下降法进行优化,且在训练过程中,应用过拟合防止技术,所述过拟合防止技术包括早期停止和正则化。
5.根据权利要求4所述的用户筛分方法,其特征在于,所述适应度函数包括人工成本约束函数和收敛速度,其中,所述人工成本约束函数采用公式(1)来计算;
所述收敛速度采用公式(2)来计算;
人工成本约束函数C(t)=N(t)+D(t) (1)
收敛速度V=(N1-N2)/(t1-t2) (2)
其中,N(t)表示在选择最佳挽留率的过程中的使用的用户资产数据中的字符数量,D(t)表示在选择最佳挽留率的过程中使用的用户资产数据中的数据量,N1为在t1时刻确定的最佳挽留率,N2为t2时刻确定的最佳挽留率,t为选择最佳挽留率的过程的使用时长。
6.一种应用权利要求1至5任一项所述用户筛分方法的系统,其特征在于,包括:
用户资产划分模块,用于根据存储在数据库内的用户资产数值对用户进行等级划分,划分为若干资产规模等级;
资产负增长筛选模块,用于开始筛选第i月的流失用户与非流失用户;在每个所述资产规模等级内,选择i月与i-1月相比存在资产负增长的用户;
平均资产降幅计算模块,将所述用户按照降幅幅度从大到小进行排序,获取i月的用户降幅列表;根据i月的所述用户降幅列表确定第一用户资产降幅分布表;重复以上步骤,根据i-1月的所述用户降幅列表确定第二用户资产降幅分布表;
分布表比较模块,用于设置阈值;根据所述第一用户资产降幅分布表和所述第二用户资产降幅分布表的差值与所述阈值的关系确定当前资产规模等级内的流失用户;
流失用户识别模块,用于基于所述流失用户预测未来的流失用户;
所述分布表比较模块包括更新单元、选择单元、查找单元和判定单元:
若所述第一用户资产降幅分布表和所述第二用户资产降幅分布表的差值大于设置的阈值,则所述更新单元将i更新为i-1后重复执行开始筛选后的所有步骤,若差值小于或等于设置的阈值,则向下执行;
所述选择单元用以从所述第一用户资产降幅分布表找到最优挽留率X%;
所述查找单元用以将所述最优挽留率X%带入该所述资产规模等级内首次产生的第一用户资产降幅分布表,查找所述最优挽留率X%在首次产生的第一用户资产降幅分布表中对应的用户平均资产降幅,该平均资产降幅为目标资产降幅;
在最初的第i月的每个所述资产规模等级内的用户降幅列表中,若用户实际资产降幅大于所述目标资产降幅,则所述判定单元用以判定该用户为当前资产规模等级内的流失用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311730351.3A CN117408742B (zh) | 2023-12-15 | 2023-12-15 | 用户筛分方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311730351.3A CN117408742B (zh) | 2023-12-15 | 2023-12-15 | 用户筛分方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117408742A CN117408742A (zh) | 2024-01-16 |
CN117408742B true CN117408742B (zh) | 2024-04-02 |
Family
ID=89487560
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311730351.3A Active CN117408742B (zh) | 2023-12-15 | 2023-12-15 | 用户筛分方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117408742B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105760957A (zh) * | 2016-02-23 | 2016-07-13 | 国元证券股份有限公司 | 一种证券软流失客户的预测方法 |
CN106327032A (zh) * | 2015-06-15 | 2017-01-11 | 阿里巴巴集团控股有限公司 | 一种用于客户流失预警的数据分析方法和装置 |
CN110322085A (zh) * | 2018-03-29 | 2019-10-11 | 北京九章云极科技有限公司 | 一种客户流失预测方法和装置 |
CN110837931A (zh) * | 2019-11-08 | 2020-02-25 | 中国农业银行股份有限公司 | 客户流失预测方法、装置及存储介质 |
CN113902199A (zh) * | 2021-10-14 | 2022-01-07 | 上海幻电信息科技有限公司 | 用户流失预测方法及系统 |
CN114782169A (zh) * | 2022-04-24 | 2022-07-22 | 中国银行股份有限公司 | 一种客户流失率预警方法及装置 |
CN115115389A (zh) * | 2022-03-11 | 2022-09-27 | 南京邮电大学 | 一种基于价值细分和集成预测的快递客户流失预测方法 |
CN115526652A (zh) * | 2022-08-25 | 2022-12-27 | 山东大学 | 一种基于机器学习的客户流失预警方法及系统 |
CN116361542A (zh) * | 2023-01-13 | 2023-06-30 | 中国工商银行股份有限公司 | 产品推荐方法、装置、计算机设备和存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060253590A1 (en) * | 2005-04-08 | 2006-11-09 | Konaware, Inc. | Platform and methods for continuous asset location tracking and monitoring in intermittently connected environments |
US8712828B2 (en) * | 2005-12-30 | 2014-04-29 | Accenture Global Services Limited | Churn prediction and management system |
US11574361B2 (en) * | 2019-12-13 | 2023-02-07 | Paypal, Inc. | Reducing account churn rate through intelligent collaborative filtering |
-
2023
- 2023-12-15 CN CN202311730351.3A patent/CN117408742B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106327032A (zh) * | 2015-06-15 | 2017-01-11 | 阿里巴巴集团控股有限公司 | 一种用于客户流失预警的数据分析方法和装置 |
CN105760957A (zh) * | 2016-02-23 | 2016-07-13 | 国元证券股份有限公司 | 一种证券软流失客户的预测方法 |
CN110322085A (zh) * | 2018-03-29 | 2019-10-11 | 北京九章云极科技有限公司 | 一种客户流失预测方法和装置 |
CN110837931A (zh) * | 2019-11-08 | 2020-02-25 | 中国农业银行股份有限公司 | 客户流失预测方法、装置及存储介质 |
CN113902199A (zh) * | 2021-10-14 | 2022-01-07 | 上海幻电信息科技有限公司 | 用户流失预测方法及系统 |
CN115115389A (zh) * | 2022-03-11 | 2022-09-27 | 南京邮电大学 | 一种基于价值细分和集成预测的快递客户流失预测方法 |
CN114782169A (zh) * | 2022-04-24 | 2022-07-22 | 中国银行股份有限公司 | 一种客户流失率预警方法及装置 |
CN115526652A (zh) * | 2022-08-25 | 2022-12-27 | 山东大学 | 一种基于机器学习的客户流失预警方法及系统 |
CN116361542A (zh) * | 2023-01-13 | 2023-06-30 | 中国工商银行股份有限公司 | 产品推荐方法、装置、计算机设备和存储介质 |
Non-Patent Citations (4)
Title |
---|
商业银行建立客户流失预测模型的方法研究;江瑜;;商场现代化;20070125(03);全文 * |
林睿 ; 迟学芝 ; .基于人工神经网络的银行客户流失分析模型.电脑知识与技术. * |
林睿 ; 迟学芝 ; .基于人工神经网络的银行客户流失分析模型.电脑知识与技术.全文. * |
江瑜 ; .商业银行建立客户流失预测模型的方法研究.商场现代化.2007,(03),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN117408742A (zh) | 2024-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200372342A1 (en) | Systems and methods for predictive early stopping in neural network training | |
CN110571792A (zh) | 一种电网调控系统运行状态的分析评估方法及系统 | |
CN105491599B (zh) | 预测lte网络性能指标的新型回归系统 | |
CN117875724B (zh) | 一种基于云计算的采购风险管控方法及系统 | |
CN112801231B (zh) | 用于业务对象分类的决策模型训练方法和装置 | |
CN117787569B (zh) | 一种智能辅助评标方法及系统 | |
CN112363896A (zh) | 日志异常检测系统 | |
CN118228130B (zh) | 一种基于设备健康状态的监测方法、系统和存储介质 | |
CN117333290B (zh) | 一种一体化多尺度风控模型构建方法 | |
CN113656707A (zh) | 一种理财产品推荐方法、系统、存储介质及设备 | |
CN116911994B (zh) | 对外贸易风险预警系统 | |
CN117408742B (zh) | 用户筛分方法及系统 | |
Araujo et al. | Hybrid intelligent design of morphological-rank-linear perceptrons for software development cost estimation | |
CN116912016A (zh) | 一种账单稽核方法和装置 | |
CN113610575B (zh) | 一种产品销量的预测方法及预测系统 | |
CN113537759A (zh) | 一种基于权重自适应的用户体验度量模型 | |
Zaabar et al. | A two-phase part family formation model to optimize resource planning: a case study in the electronics industry | |
CN118134358B (zh) | 一种智慧物流配送数据管理平台 | |
CN114549213B (zh) | 一种基金产品的分析管理方法、装置及系统 | |
CN117539520B (zh) | 固件自适应升级方法、系统以及设备 | |
CN118296565B (zh) | 基于数据挖掘的动力电池事故溯源管控系统 | |
CN116739225B (zh) | 一种项目执行进程监控方法及系统 | |
KR102283802B1 (ko) | 결합확률분포를 이용한 보증정책 수립 장치 및 방법 | |
CN118798977A (zh) | 付费会员转化的分析方法、装置、设备、存储介质和产品 | |
CN117611364A (zh) | 投入成本预估偏差测算方法及其系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |