CN110335134A - 一种基于woe转换实现信贷客户资质分类的方法 - Google Patents

一种基于woe转换实现信贷客户资质分类的方法 Download PDF

Info

Publication number
CN110335134A
CN110335134A CN201910298743.4A CN201910298743A CN110335134A CN 110335134 A CN110335134 A CN 110335134A CN 201910298743 A CN201910298743 A CN 201910298743A CN 110335134 A CN110335134 A CN 110335134A
Authority
CN
China
Prior art keywords
data
client
qualification
model
woe
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910298743.4A
Other languages
English (en)
Inventor
李鹏慧
侯李伟
赫汗笛
胡书瑞
李江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Information Technology (van)
Original Assignee
Information Technology (van)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Information Technology (van) filed Critical Information Technology (van)
Priority to CN201910298743.4A priority Critical patent/CN110335134A/zh
Publication of CN110335134A publication Critical patent/CN110335134A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Evolutionary Biology (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于WOE转换实现信贷客户资质分类的方法,包括以下步骤,数据的准备与预处理、模型训练、模型评测、模型部署、进件数据处理和客户资质划分模块,本发明涉及信贷技术领域。该基于WOE转换实现信贷客户资质分类的方法,达到了降低了噪声影响,同时非数值型数据转换对比ONE_HOT转换维度更少,实现模型自动学习,客户数据变化更敏感,预测准确率更高的目的。

Description

一种基于WOE转换实现信贷客户资质分类的方法
技术领域
本发明涉及信贷技术领域,具体为一种基于WOE转换实现信贷客户资质分类的方法。
背景技术
随着信贷行业的发展,对于放贷机构有越来越多的贷款申请。传统的审核方法为人工审核与评分卡相结合,传统方法效率低,对于客户数据变化不够敏感。因此就需要一种根据客户变化情况自动学习、辅助人工审核的系统来提高审批效率,优化审批流程。另外可以深度挖掘客户信息对于扩大客群有一定的帮助。
目前对于客户数据较多时,数值取值范围非常大,会产生随机噪声,对于不同资质的客户分类不够准确,不能够更大程度上提高人工审核效率,人工成本高。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种基于WOE转换实现信贷客户资质分类的方法,解决了目前对于客户数据较多时,数值取值范围非常大,会产生随机噪声,对于不同资质的客户分类不够准确,不能够更大程度上提高人工审核效率,人工成本高的问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:一种基于WOE转换实现信贷客户资质分类的方法,包括以下步骤:
步骤一、数据的准备与预处理,将自变量数据和因变量数据分为五个部分,随机选择一部分作为测试数据,其余四部分作为训练数据,对于训练数据进行WOE转换与归一化处理,并根据训练数据的WOE计算出的WOE转换规则作用于测试数据,同理将训练数据的归一化规则作用于测试数据,相应的共产生五种不同训练数据与测试数据的组合;
步骤二、模型训练,将步骤一中产生的数据其中一份输入该模块,通过该模块中的lasso特征选择功能进行特征选择,选取出对于客户资质分类有用的特征进行下一步模型训练,将步骤一中产生的五份数据分别根据特征选择结果进行特征选择后输入该模块中的模型参数优化与训练功能进行模型训练,其中模型由四种不同的模型构成分别为逻辑回归、随机森林、XGBoost及深度学习;
步骤三、模型评测,将模型参数优化与训练功能得到的四种预测结果相加求平均值,与客户实际资质进行对比评测,得到联合模型的ROC、精确率、召回率等指标,并通过这些指标进行模型选择,找出最优模型;
步骤四、模型部署,将找出的最优模型使用Django框架部署于服务器,客户进件系统发送进件客户数据,将进件客户数据通过进件数据处理模块得到处理过的客户数据,将这部分数据输入模型加载功能的模型中,最终得到客户资质评分;
步骤五、进件数据处理,新进件客户数据,首先将数据进行预处理、数据分段、WOE转换与归一化处理,具体规则与数据准备与预处理规则一样;
步骤六、客户资质划分模块,根据步骤三得出的预测结果评分划分为十段,计算不同分段的好坏资质客户的占比,参考历史平均客户的放贷金额、收益金额与损失金额计算不同分段的投资收益比,根据投资收益比及参考信贷产品政策对于不同的等级的客户赋予不同等级的信贷标准,对于不同分段的客户设定不同的放贷金额与人工审核建议,根据步骤四模块得出的客户资质评分,通过设定的放贷金额与人工审核建议,得到新进件客户的应放贷金额与人工审核建议。
优选的,所述步骤一中自变量数据包括客户申请数据、客户征信数据、客户通话记录及通过这些数据计算出的数据。
优选的,所述步骤一中,因变量为客户类别,由客户还款信息计算得出。
优选的,所述步骤一中,将原始数据进行数据预处理,对异常数据剔除且相似类别数据进行合并。
优选的,所述步骤一中,将连续数据根据合理的分段规则对数据进行分段。
优选的,所述步骤四中,根据模型预测出的客户资质评分通过客户资质划分模块得到客户的资质等级、放贷金额、人工审核建议。
(三)有益效果
本发明提供了一种基于WOE转换实现信贷客户资质分类的方法。具备以下有益效果:
(1)、该基于WOE转换实现信贷客户资质分类的方法,通过使用历史数据作为训练模型数据,输入数据准备与预处理模块;前一模块输出结果作为输入,输入模型训练与评测模块进行模型训练、优化参数、模型评测等,最终找出最优模型并输出模型文件;前一模块输出结果作为输入,输入模型部署模块;对于新进件客户,客户数据输入进件数据处理模块将结果输入部署好的模型模块,最终输出客户资质评分;将客户资质评分输入客户资质划分模块,通过模型部署模块展示客户相应的资质等级及相关信息,数据预处理环节对于数据进行了WOE转换,降低了噪声影响,且对于非数值型数据转换对比ONE_HOT转换维度更少。
(2)、基于WOE转换实现信贷客户资质分类的方法,通过使用机器学习算法对比传统评分卡模式能够实现模型自动学习,对于客户数据变化更敏感,预测准确率更高。
附图说明
图1为本发明模块结构框图。
具体实施方式
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施例,进一步阐述本发明。
实施例
一种基于WOE转换实现信贷客户资质分类的方法,包括以下步骤:
步骤一、数据的准备与预处理,将自变量数据和因变量数据分为五个部分,随机选择一部分作为测试数据,其余四部分作为训练数据,对于训练数据进行WOE转换与归一化处理,并根据训练数据的WOE计算出的WOE转换规则作用于测试数据,同理将训练数据的归一化规则作用于测试数据,相应的共产生五种不同训练数据与测试数据的组合;
步骤二、模型训练,将步骤一中产生的数据其中一份输入该模块,通过该模块中的lasso特征选择功能进行特征选择,选取出对于客户资质分类有用的特征进行下一步模型训练,将步骤一中产生的五份数据分别根据特征选择结果进行特征选择后输入该模块中的模型参数优化与训练功能进行模型训练,其中模型由四种不同的模型构成分别为逻辑回归、随机森林、XGBoost及深度学习;
步骤三、模型评测,将模型参数优化与训练功能得到的四种预测结果相加求平均值,与客户实际资质进行对比评测,得到联合模型的ROC、精确率、召回率等指标,并通过这些指标进行模型选择,找出最优模型;
步骤四、模型部署,将找出的最优模型使用Django框架部署于服务器,客户进件系统发送进件客户数据,将进件客户数据通过进件数据处理模块得到处理过的客户数据,将这部分数据输入模型加载功能的模型中,最终得到客户资质评分;
步骤五、进件数据处理,新进件客户数据,首先将数据进行预处理、数据分段、WOE转换与归一化处理,具体规则与数据准备与预处理规则一样;
步骤六、客户资质划分模块,根据步骤三得出的预测结果评分划分为十段,计算不同分段的好坏资质客户的占比,参考历史平均客户的放贷金额、收益金额与损失金额计算不同分段的投资收益比,根据投资收益比及参考信贷产品政策对于不同的等级的客户赋予不同等级的信贷标准,对于不同分段的客户设定不同的放贷金额与人工审核建议,根据步骤四模块得出的客户资质评分,通过设定的放贷金额与人工审核建议,得到新进件客户的应放贷金额与人工审核建议。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下。由语句“包括一个......限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素”。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (6)

1.一种基于WOE转换实现信贷客户资质分类的方法,其特征在于,包括以下步骤:
步骤一、数据的准备与预处理,将自变量数据和因变量数据分为五个部分,随机选择一部分作为测试数据,其余四部分作为训练数据,对于训练数据进行WOE转换与归一化处理,并根据训练数据的WOE计算出的WOE转换规则作用于测试数据,同理将训练数据的归一化规则作用于测试数据,相应的共产生五种不同训练数据与测试数据的组合;
步骤二、模型训练,将步骤一中产生的数据其中一份输入该模块,通过该模块中的lasso特征选择功能进行特征选择,选取出对于客户资质分类有用的特征进行下一步模型训练,将步骤一中产生的五份数据分别根据特征选择结果进行特征选择后输入该模块中的模型参数优化与训练功能进行模型训练,其中模型由四种不同的模型构成分别为逻辑回归、随机森林、XGBoost及深度学习;
步骤三、模型评测,将模型参数优化与训练功能得到的四种预测结果相加求平均值,与客户实际资质进行对比评测,得到联合模型的ROC、精确率、召回率等指标,并通过这些指标进行模型选择,找出最优模型;
步骤四、模型部署,将找出的最优模型使用Django框架部署于服务器,客户进件系统发送进件客户数据,将进件客户数据通过进件数据处理模块得到处理过的客户数据,将这部分数据输入模型加载功能的模型中,最终得到客户资质评分;
步骤五、进件数据处理,新进件客户数据,首先将数据进行预处理、数据分段、WOE转换与归一化处理,具体规则与数据准备与预处理规则一样;
步骤六、客户资质划分模块,根据步骤三得出的预测结果评分划分为十段,计算不同分段的好坏资质客户的占比,参考历史平均客户的放贷金额、收益金额与损失金额计算不同分段的投资收益比,根据投资收益比及参考信贷产品政策对于不同的等级的客户赋予不同等级的信贷标准,对于不同分段的客户设定不同的放贷金额与人工审核建议,根据步骤四模块得出的客户资质评分,通过设定的放贷金额与人工审核建议,得到新进件客户的应放贷金额与人工审核建议。
2.根据权利要求1所述的一种基于WOE转换实现信贷客户资质分类的方法,其特征在于:所述步骤一中自变量数据包括客户申请数据、客户征信数据、客户通话记录及通过这些数据计算出的数据。
3.根据权利要求1所述的一种基于WOE转换实现信贷客户资质分类的方法,其特征在于:所述步骤一中,因变量为客户类别,由客户还款信息计算得出。
4.根据权利要求1所述的一种基于WOE转换实现信贷客户资质分类的方法,其特征在于:所述步骤一中,将原始数据进行数据预处理,对异常数据剔除且相似类别数据进行合并。
5.根据权利要求1所述的一种基于WOE转换实现信贷客户资质分类的方法,其特征在于:所述步骤一中,将连续数据根据合理的分段规则对数据进行分段。
6.根据权利要求1所述的一种基于WOE转换实现信贷客户资质分类的方法,其特征在于:所述步骤四中,根据模型预测出的客户资质评分通过客户资质划分模块得到客户的资质等级、放贷金额、人工审核建议。
CN201910298743.4A 2019-04-15 2019-04-15 一种基于woe转换实现信贷客户资质分类的方法 Pending CN110335134A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910298743.4A CN110335134A (zh) 2019-04-15 2019-04-15 一种基于woe转换实现信贷客户资质分类的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910298743.4A CN110335134A (zh) 2019-04-15 2019-04-15 一种基于woe转换实现信贷客户资质分类的方法

Publications (1)

Publication Number Publication Date
CN110335134A true CN110335134A (zh) 2019-10-15

Family

ID=68139258

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910298743.4A Pending CN110335134A (zh) 2019-04-15 2019-04-15 一种基于woe转换实现信贷客户资质分类的方法

Country Status (1)

Country Link
CN (1) CN110335134A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150235143A1 (en) * 2003-12-30 2015-08-20 Kantrack Llc Transfer Learning For Predictive Model Development
CN106651570A (zh) * 2016-12-27 2017-05-10 中国建设银行股份有限公司 一种贷款实时审批系统和方法
US20170185904A1 (en) * 2015-12-29 2017-06-29 24/7 Customer, Inc. Method and apparatus for facilitating on-demand building of predictive models
CN107122327A (zh) * 2016-02-25 2017-09-01 阿里巴巴集团控股有限公司 一种利用训练数据训练模型的方法和训练系统
CN107301577A (zh) * 2016-04-15 2017-10-27 阿里巴巴集团控股有限公司 信用评估模型的训练方法、信用评估方法以及装置
WO2017215370A1 (zh) * 2016-06-14 2017-12-21 平安科技(深圳)有限公司 构建决策模型的方法、装置、计算机设备及存储设备
CN109087196A (zh) * 2018-08-20 2018-12-25 北京玖富普惠信息技术有限公司 信用评分方法、系统、计算机设备及可读介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150235143A1 (en) * 2003-12-30 2015-08-20 Kantrack Llc Transfer Learning For Predictive Model Development
US20170185904A1 (en) * 2015-12-29 2017-06-29 24/7 Customer, Inc. Method and apparatus for facilitating on-demand building of predictive models
CN107122327A (zh) * 2016-02-25 2017-09-01 阿里巴巴集团控股有限公司 一种利用训练数据训练模型的方法和训练系统
CN107301577A (zh) * 2016-04-15 2017-10-27 阿里巴巴集团控股有限公司 信用评估模型的训练方法、信用评估方法以及装置
WO2017215370A1 (zh) * 2016-06-14 2017-12-21 平安科技(深圳)有限公司 构建决策模型的方法、装置、计算机设备及存储设备
CN106651570A (zh) * 2016-12-27 2017-05-10 中国建设银行股份有限公司 一种贷款实时审批系统和方法
CN109087196A (zh) * 2018-08-20 2018-12-25 北京玖富普惠信息技术有限公司 信用评分方法、系统、计算机设备及可读介质

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
何飞: "中国消费金融大数据征信研究", 《中国知网数据库》 *
姚香秀: "P2P借贷平台个人信贷申请风险评估研究", 《中国优秀硕士学位论文全文数据库经济与管理科学辑》 *
熊正德等: "基于有序logistic模型的互联网金融客户违约风险研究", 《系统工程》 *
王敏佳: "基于多个分类模型的P2P借款人信贷风险评估研究", 《中国优秀硕士学位论文全文数据库经济与管理科学辑》 *
陈启伟等: "基于Ext-GBDT集成的类别不平衡信用评分模型", 《计算机应用研究》 *
高昊阳: "基于大数据的P2P金融风险控制系统的设计与实现", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
黄志刚等: "多源数据信用评级普适模型栈框架的构建与应用", 《数量经济技术经济研究》 *

Similar Documents

Publication Publication Date Title
Hijzen et al. The effects of multinational production on domestic performance: Evidence from Japanese firms
CN107544253B (zh) 基于改进模糊熵权法的大型导弹装备退役安全控制方法
CN110322335A (zh) 一种基于woe转换通过机器学习的信贷客户资质分类方法
Tripathi et al. Credit scoring model based on weighted voting and cluster based feature selection
Yin et al. Wasserstein Generative Adversarial Network and Convolutional Neural Network (WG‐CNN) for Bearing Fault Diagnosis
CN111311402A (zh) 一种基于XGBoost的互联网金融风控模型
CN106651570A (zh) 一种贷款实时审批系统和方法
CN108876034B (zh) 一种改进的Lasso+RBF神经网络组合预测方法
Mukid et al. Credit scoring analysis using weighted k nearest neighbor
CN110956273A (zh) 融合多种机器学习模型的征信评分方法及系统
CN109657978A (zh) 一种风险识别方法和系统
CN110909984B (zh) 业务数据处理模型训练方法、业务数据处理方法及装置
CN109684922A (zh) 一种基于卷积神经网络的多模型对成品菜的识别方法
CN112633337A (zh) 一种基于聚类和边界点的不平衡数据处理方法
CN109344907A (zh) 基于改进评判标准分类算法的判别方法
CN108228687A (zh) 大数据知识挖掘及精准跟踪方法与系统
CN111047193A (zh) 一种基于信用大数据标签的企业信用评分模型生成算法
CN109840843A (zh) 基于相似性合并的连续型特征自动分箱算法
CN114140013A (zh) 一种基于xgboost的评分卡生成方法、装置及设备
CN206897873U (zh) 一种基于检测产品特性的图像处理与检测系统
CN110335134A (zh) 一种基于woe转换实现信贷客户资质分类的方法
CN117132383A (zh) 一种信贷数据处理方法、装置、设备及可读存储介质
CN115205026A (zh) 信用评估方法、装置、设备及计算机存储介质
CN114880923A (zh) 一种融合电力数据的企业信用预测方法
CN111784182A (zh) 资产信息处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20191015