CN115731030A - 一种银行消费贷款客户需求挖掘方法、装置及存储介质 - Google Patents
一种银行消费贷款客户需求挖掘方法、装置及存储介质 Download PDFInfo
- Publication number
- CN115731030A CN115731030A CN202211579316.1A CN202211579316A CN115731030A CN 115731030 A CN115731030 A CN 115731030A CN 202211579316 A CN202211579316 A CN 202211579316A CN 115731030 A CN115731030 A CN 115731030A
- Authority
- CN
- China
- Prior art keywords
- model
- data
- training
- customers
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
本发明提供了一种银行消费贷款客户需求挖掘方法,其特征在于选择XGBoost模型为预测模型,选择一定时间区间的客户数据作为原始数据,根据准入规则进行数据筛选,将符合准入规则的数据筛选为训练用数据,将训练用数据划分为正样本和负样本,正样本为实际签订过消费贷款的客户,负样本为未签订消费贷款的客户,其中正样本和负样本按1:10的比例进行随机欠采样;将采样后的数据输入到选定的XGBoost进行递归训练,直到训练的模型效果达标,输出预测结果。基于该预测结果执行后外呼接通率、短信链接点击率、网捷贷成功营销率和整体贷款金额都有了非常大的提高。
Description
技术领域
本发明涉及数据分析及数据挖掘应用领域,更具体地说涉及一种银行消费贷款客户需求挖掘方法、装置及存储介质。
背景技术
个人自助小额消费贷款是银行主要以信用方式进行评估和审批,向符合特定条件的个人客户发放的,由客户自助申请、自动审批、自助用信的小额消费贷款。传统的银行消费贷款客户营销通过专家经验规则模型筛选出全量潜在借款需求较高的客户,这不仅耗费大量网点客户经理人力成本,整体营销成功率偏低,同时间接导致数据资源的浪费,无法掌握借款需求客户潜在信息。传统技术通过专家经验对高潜力客户进行预测,预测结果的精确率较低,需要耗费大量的人力来完成,且成功率极低。由于银行内符合贷款申请条件客群数量较大,实际申请消费贷款客群数量较少,导致模型训练过程中易出现过拟合现象。
发明内容
本发明所要解决的技术问题是如何解决正样本和负样本存在巨大数量差,导致模型训练出现过拟现象,并整体提高预测的准确性,提高效率。
为了解决以上问题本发明提供了一种银行消费贷款客户需求挖掘方法,其特征在于选择XGBoost模型为预测模型,选择一定时间区间的客户数据作为原始数据,根据准入规则进行数据筛选,将符合准入规则的数据筛选为训练用数据,将训练用数据划分为正样本和负样本,正样本为实际签订过消费贷款的客户,负样本为未签订消费贷款的客户,其中正样本和负样本按1:10的比例进行随机欠采样;将采样后的数据输入到选定的XGBoost进行递归训练,直到训练的模型效果达标,输出预测结果。
所述的银行消费贷款客户需求挖掘方法,其特征在于采用多模融合训练,筛选评价指标最高的模型,选定XGBoost模型。
所述的银行消费贷款客户需求挖掘方法,其特征在于训练过程中不断对递归特征进行筛选,将重要特征数据重新输入到模型中再次训练,通过交叉验证和搜参降低模型过拟合程度,并不断的对模型效果进行验证,当模型效果达标后,则输出预测结果。
一种装置,其特征在于采用了所述的银行消费贷款客户需求挖掘方法。
一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行所述的银行消费贷款客户需求挖掘方法。
实施本发明具有如下有益效果:该系统执行后外呼接通率、短信链接点击率、网捷贷成功营销率和整体贷款金额都有了非常大的提高。
附图说明
图1是XGBoost模型训练流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
XGBoost模型算法(一种高效的梯度提升决策树算法),用于整合行内资源建立的银行消费贷款客户需求挖掘模型。由于银行内符合贷款申请条件客群数量较大,实际申请消费贷款客群数量较少,导致模型训练过程中易出现过拟合现象。为了解决这个问题,本发明采用欠采样法,如:随机抽取提取2017年至2021年期间贷款客户数量10倍的客户作为入模负样本;通过整合行内专家经验的规则与多个模型融合训练,最终选择XGBoost算法,先基于行内准入规则筛选全量潜在客户,而后使用XGBoost模型算法进一步筛选借款需求较高的客群,提高营销精准度,并通过交叉验证和搜参降低模型过拟合程度。基于此方法下发模型预测出的头部客户进行智能外呼营销,采用语音确认客户身份,挂断后发送营销短信方式开展营销活动,外呼接通率达56.7%,短信链接点击率为4.4%,其中目标客户网捷贷新签约率达12.5%,网捷贷投放率达19.2%,模型应用效果良好。
样本选择,机器学习模型基础上,结合行内消费贷款的准入规则进行联合建模和样本选择。根据预先定义好的准入规则进行样本选择,选取全量历史采取区间内符合准入规则的客户作为样本;具体实施例以全量入模客户为2017年-2021年期间符合准入规则的掌银客户,其中正样本为在2017年-2022年期间签订过2笔及以上消费贷款合同的客户,正样本观察时点选取最大一次合同签订时间;负样本为未签订或签订合同数量较小客户。
通过随机欠采样方法进行采样,由于本模型中,正样本和负样本分布极度不平衡,为了均衡样本比例,减少过拟合带来的模型精度下降,先对负样本采取随机欠采样,提取正样本K倍的数据量入模,提高模型泛化能力,K>1,一般选择5~20。
进行递归特征筛选,使用银行内数据建立全量客户在自然属性、掌银行为、资产负债等特征的宽表,构建客户画像体系,并使用历史数据进行模型训练,并基于训练结果确定多个重要性高的特征,并选定特征选择阈值。如:将特征按照模型贡献度(重要性)得分由高到低进行排序,选取合适的特征选择阈值,保留重要性更高的要素入模训练。通过递归特征筛选,表1是一个实施例训练后得到的特征重要性排序前十的特征。
表1
图1是XGBoost模型训练流程图。
选定XBoost模型作为银行消费贷款客户需求挖掘模型;
根据预先定义好的准入规则,选取一定时间区间内符合准入规则的训练用数据,进行数据准备;
确定观察时点,随机欠采样负样本,根据正样本观察时点选取最大一次合同签订时间;对数据预处理,具体包括如下操作:
(1)进行数据清洗:将异常值从数据集中剔除,将全列为空或者方差为零的特征剔除;
(1)将客户号、flag标识等对于模型训练没有意义的特征也做剔除处理;
(2)以网捷贷客户样本为例,正负样本比例不平衡,此处先对正负样本按照1:10的比例进行随机欠采样;
(3)对特征宽表中的字符串类别变量进行哑变量编码。
基于专家系统及专家经验确定多模评价指标;
采用多模融合训练,筛选评价指标最高的模型,选定最优XGBoost模型;
采用经过数据预处理后的数据开始训练XGBoot模型,训练过程中不断对递归特征进行筛选,将重要特征数据重新输入到模型中再次训练,通过交叉验证和搜参降低模型过拟合程度,并不断的对模型效果进行验证,当模型效果达标后,则输出预测结果。
该预测结果即为预测出银行消费贷款客户需求为正向的清单,也就是筛选出借款需求较高的客户,基于此方法下发模型预测出的头部客户进行智能外呼营销,采用语音确认客户身份,挂断后发送营销短信方式开展营销活动,外呼接通率达56.7%,短信链接点击率为4.4%,其中目标客户网捷贷新签约率达12.5%,网捷贷投放率达19.2%,模型应用效果良好。
以上所揭露的仅为本发明一种实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解的实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。
Claims (5)
1.一种银行消费贷款客户需求挖掘方法,其特征在于选择XGBoost模型为预测模型,选择一定时间区间的客户数据作为原始数据,根据准入规则进行数据筛选,将符合准入规则的数据筛选为训练用数据,将训练用数据划分为正样本和负样本,正样本为实际签订过消费贷款的客户,负样本为未签订消费贷款的客户,其中正样本和负样本按1:10的比例进行随机欠采样;将采样后的数据输入到选定的XGBoost进行递归训练,直到训练的模型效果达标,输出预测结果。
2.根据权利要求1所述的银行消费贷款客户需求挖掘方法,其特征在于采用多模融合训练,筛选评价指标最高的模型,选定XGBoost模型。
3.根据权利要求1所述的银行消费贷款客户需求挖掘方法,其特征在于训练过程中不断对递归特征进行筛选,将重要特征数据重新输入到模型中再次训练,通过交叉验证和搜参降低模型过拟合程度,并不断的对模型效果进行验证,当模型效果达标后,则输出预测结果。
4.一种装置,其特征在于采用了如权利要求1至3任意一项所述的银行消费贷款客户需求挖掘方法。
5.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至3任一项所述的银行消费贷款客户需求挖掘方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211579316.1A CN115731030A (zh) | 2022-12-06 | 2022-12-06 | 一种银行消费贷款客户需求挖掘方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211579316.1A CN115731030A (zh) | 2022-12-06 | 2022-12-06 | 一种银行消费贷款客户需求挖掘方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115731030A true CN115731030A (zh) | 2023-03-03 |
Family
ID=85300897
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211579316.1A Pending CN115731030A (zh) | 2022-12-06 | 2022-12-06 | 一种银行消费贷款客户需求挖掘方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115731030A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117195061A (zh) * | 2023-11-07 | 2023-12-08 | 腾讯科技(深圳)有限公司 | 事件响应预测模型处理方法、装置和计算机设备 |
-
2022
- 2022-12-06 CN CN202211579316.1A patent/CN115731030A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117195061A (zh) * | 2023-11-07 | 2023-12-08 | 腾讯科技(深圳)有限公司 | 事件响应预测模型处理方法、装置和计算机设备 |
CN117195061B (zh) * | 2023-11-07 | 2024-03-29 | 腾讯科技(深圳)有限公司 | 事件响应预测模型处理方法、装置和计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108898476A (zh) | 一种贷款客户信用评分方法和装置 | |
US20100223099A1 (en) | Method and apparatus for a multi-dimensional offer optimization (mdoo) | |
CN113011884B (zh) | 账户特征的提取方法、装置、设备及可读存储介质 | |
CN107368499B (zh) | 一种客户标签建模及推荐方法及装置 | |
CN112163081A (zh) | 标签确定方法、装置、介质及电子设备 | |
Fu et al. | A sentiment-aware trading volume prediction model for P2P market using LSTM | |
CN111178701B (zh) | 一种基于特征衍生技术的风险控制方法方法、装置和电子设备 | |
CN115731030A (zh) | 一种银行消费贷款客户需求挖掘方法、装置及存储介质 | |
CN108241867A (zh) | 一种分类方法及装置 | |
De et al. | Predicting customer churn: A systematic literature review | |
CN114066622A (zh) | 一种小微企业信用评级的方法、装置 | |
CN110069686A (zh) | 用户行为分析方法、装置、计算机装置及存储介质 | |
Jinbo et al. | The application ofadaboost in customer churn prediction | |
CN115115369A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN111639494A (zh) | 案件事理关系确定方法及系统 | |
CN113688232B (zh) | 招标文本分类方法、装置、存储介质及终端 | |
CN110909753A (zh) | 数据分类方法、系统和设备 | |
CN114418604A (zh) | 一种掌银易流失客户促活成功概率预测方法、装置及存储介质 | |
CN111652713B (zh) | 权益风控建模方法和装置 | |
CN113095723A (zh) | 优惠券的推荐方法及装置 | |
CN109308565B (zh) | 人群绩效等级识别方法、装置、存储介质及计算机设备 | |
Bansal et al. | Cryptocurrency price prediction using Twitter and news articles analysis | |
CN115080732A (zh) | 投诉工单处理方法、装置、电子设备和存储介质 | |
CN112507185A (zh) | 用户肖像的确定方法和装置 | |
CN112132367A (zh) | 一种用于企业经营管理风险识别的建模方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |