CN111951099A - 一种信用卡发卡模型及其运用方法 - Google Patents
一种信用卡发卡模型及其运用方法 Download PDFInfo
- Publication number
- CN111951099A CN111951099A CN202010811052.2A CN202010811052A CN111951099A CN 111951099 A CN111951099 A CN 111951099A CN 202010811052 A CN202010811052 A CN 202010811052A CN 111951099 A CN111951099 A CN 111951099A
- Authority
- CN
- China
- Prior art keywords
- credit card
- model
- credit
- card issuing
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明涉及一种信用卡发卡模型及其运用方法,包括数据准备模块,配置为分别获取训练客户和待预测客户的数据;数据预处理模块,配置为将获取的数据进行预处理;提取特征工程模块,配置为从预处理后的数据中提取特征;训练模块,配置为采用GBRT模型对提取的特征进行训练,生成信用卡发卡模型结果,训练时所采用的特征属于训练客户;模型预测模块,配置为利用信用卡发卡模型结果和提取的特征,预测出待预测客户的发卡风险,并评估发卡后的效益,预测时所采用的特征属于待预测客户。本发明在考虑发卡风险的同时,将发卡效益纳入评价体系,更为全面的反映了各信用卡业务对银行经营的影响;有助于发掘处于风险天花板内的客户的增长潜力。
Description
技术领域
本发明涉及信用卡风控技术领域,特别涉及一种信用卡发卡模型及其运用方法。
背景技术
零售业务的发展为银行业绩提升提供了新的选择,正式成为多家银行重要的收入来源,是多家银行战略转型的重中之重。相较于传统零售业务,信用卡业务模式简单,并且可开发场景和盈利模式更为多样。
信用卡业务的快速发展使得如何控制信用卡违约问题越来越重要。现有技术中建立的模型主要关注于如何加强对信用卡的监管,在信用卡审核发放前,根据对信用卡申请人的信用进行评估,决定是否发放,以降低信用卡欺诈风险。事实上,信用评估等的确能够避免业务造成的损失,但银行也需要关注业绩增长。所以,如何在防范风险的同时进一步实现业绩增长是信用卡业务亟待解决的一个问题。
因此,有必要提供一种信用卡发卡模型及其运用方法,能同时考虑发卡风险和评估发卡后的效益,既增加了银行业绩,又能预测发卡风险。
发明内容
本发明的目的在于提供一种信用卡发卡模型及其运用方法,能同时考虑发卡风险和评估发卡后的效益,既增加了银行业绩,又能预测发卡风险。
为了解决现有技术中存在的问题,本发明提供了一种信用卡发卡模型,包括:
数据准备模块,配置为分别获取训练客户和待预测客户的数据;
数据预处理模块,配置为将获取的数据进行预处理;
提取特征工程模块,配置为从预处理后的数据中提取特征,特征包括基础属性特征、欺诈风险特征、信用风险特征以及衍生信息特征;
训练模块,配置为采用GBRT模型对提取的特征进行训练,生成信用卡发卡模型结果,训练时所采用的特征属于训练客户;
模型预测模块,配置为利用信用卡发卡模型结果和提取的特征,预测出待预测客户的发卡风险,并评估发卡后的效益,预测时所采用的特征属于待预测客户。
可选的,在所述信用卡发卡模型中,获取的数据为训练客户和待预测客户的数据,包括:
客户信息表、卡信息表、发卡申请信息、人行征信表以及三方信息表。
可选的,在所述信用卡发卡模型中,训练客户的数据为多个已发信用卡客户表现期内的数据,并将各已发信用卡客户表现期内的数据作为样本数据,其中,表现期为6个月、12个月或24个月。
可选的,在所述信用卡发卡模型中,数据预处理模块包括:拼接处理单元、加和处理单元、差值处理单元、比值处理单元以及清洗处理单元,用于对获取的数据进行拼接处理、加和处理、差值处理、比值处理以及清洗处理,得到多种组合衍生特征,组合衍生特征包括信贷组合特征和还款比例特征。
可选的,在所述信用卡发卡模型中,
基础属性特征包括:客户的基础信息;
欺诈风险特征包括:客户申请信息中的地址、电话、手机、配偶是否与征信或三方信息匹配;
信用风险特征包括:偿还历史,包括房贷总笔数、贷款总笔数、当前逾期贷款、贷记卡账户个数、最大及累计逾期期数;还款能力,包括贷款笔数、贷款发放机构数、贷款金额、贷记卡账户数、授信总额及发卡机构数;信用历史,包括查询机构数、最大贷记卡账户账龄、最小贷记卡账户账龄、平均贷记卡账户账龄及贷款距今时长;
衍生信息特征包括:职业变更频率、房贷占比及车贷占比。
可选的,在所述信用卡发卡模型中,模型训练模块还配置为在训练时调整模型参数。
可选的,在所述信用卡发卡模型中,所述信用卡发卡模型还包括模型结果评估模块,所述模型结果评估模块的评估方式为:
设置两种基线,分别为:使用样本数据中的众数作为预测值形成第一基线,使用距离当前时间节点最近的一个表现期的历史样本数据均值作为预测值形成第二基线,分别计算得到的第一基线RMSE指标和第二基线RMSE指标;
根据已生成的信用卡发卡模型结果计算模型RMSE指标;
根据模型RMSE指标、第一基线RMSE指标和第二基线RMSE指标比较信用卡发卡模型结果、第一基线以及第二基线预测的准确率;
计算得出信用卡发卡模型结果预测准确率相对于第一基线或第二基线的提升均大于14%。
本发明还提供了一种信用卡发卡模型的运用方法,包括以下步骤:
分别获取训练客户和待预测客户的数据;
将获取的数据进行预处理;
从预处理后的数据中提取特征,特征包括基础属性特征、欺诈风险特征、信用风险特征以及衍生信息特征;
采用GBRT模型对提取的特征进行训练,生成信用卡发卡模型结果,训练时所采用的特征属于训练客户;
利用信用卡发卡模型结果和提取的特征,预测出待预测客户的发卡风险,并评估发卡后的效益,预测时所采用的特征属于待预测客户。
可选的,在所述信用卡发卡模型的运用方法中,获取的数据为训练客户和待预测客户的数据,包括:
客户信息表、卡信息表、发卡申请信息、人行征信表以及三方信息表。
可选的,在所述信用卡发卡模型的运用方法中,训练客户的数据为多个已发信用卡客户表现期内的数据,并将各已发信用卡客户表现期内的数据作为样本数据,其中,表现期为6个月、12个月或24个月。
可选的,在所述信用卡发卡模型的运用方法中,预处理包括以下处理方式:拼接处理、加和处理、差值处理、比值处理以及清洗处理;
以得到多种组合衍生特征,组合衍生特征包括信贷组合特征和还款比例特征。
可选的,在所述信用卡发卡模型的运用方法中,
基础属性特征包括:客户的基础信息;
欺诈风险特征包括:客户申请信息中的地址、电话、手机、配偶是否与征信或三方信息匹配;
信用风险特征包括:偿还历史,包括房贷总笔数、贷款总笔数、当前逾期贷款、贷记卡账户个数、最大及累计逾期期数;还款能力,包括贷款笔数、贷款发放机构数、贷款金额、贷记卡账户数、授信总额及发卡机构数;信用历史,包括查询机构数、最大贷记卡账户账龄、最小贷记卡账户账龄、平均贷记卡账户账龄及贷款距今时长;
衍生信息特征包括:职业变更频率、房贷占比及车贷占比。
可选的,在所述信用卡发卡模型的运用方法中,生成信用卡发卡模型结果的过程中,还包括以下步骤:调整模型参数。
可选的,在所述信用卡发卡模型的运用方法中,所述信用卡发卡模型的运用方法还包括模型结果评估步骤,所述模型结果评估步骤的评估方式为:
设置两种基线,分别为:使用样本数据中的众数作为预测值形成第一基线,使用距离当前时间节点最近的一个表现期的历史样本数据均值作为预测值形成第二基线,分别计算得到的第一基线RMSE指标和第二基线RMSE指标;
根据已生成的信用卡发卡模型结果计算模型RMSE指标;
根据模型RMSE指标、第一基线RMSE指标和第二基线RMSE指标比较信用卡发卡模型结果、第一基线以及第二基线预测的准确率;
计算得出信用卡发卡模型结果预测准确率相对于第一基线或第二基线的提升均大于14%。
本发明相对于现有技术,具有以下优点:
(1)在考虑发卡风险的同时,将发卡效益纳入评价体系,更为全面的反映了各信用卡业务对银行经营的影响。
(2)有助于发掘处于风险天花板内的客户的增长潜力。
(3)针对不同效益程度的客户,能够制定灵活多样的营销方式,进一步扩大客群。
(4)通过对现有客户的效益分析,制定更为有效的放贷额度。
附图说明
图1为本发明实施例提供的信用卡发卡模型的模块流程图;
图2为本发明实施例提供的信用卡发卡模型的运用方法的流程图。
具体实施方式
下面将结合示意图对本发明的具体实施方式进行更详细的描述。根据下列描述,本发明的优点和特征将更清楚。需说明的是,附图均采用非常简化的形式且均使用非精准的比例,仅用以方便、明晰地辅助说明本发明实施例的目的。
在下文中,如果本文所述的方法包括一系列步骤,则本文所呈现的这些步骤的顺序并非必须是可执行这些步骤的唯一顺序,且一些所述的步骤可被省略和/或一些本文未描述的其他步骤可被添加到该方法中。
现有技术中建立的模型主要关注于如何加强对信用卡的监管,在信用卡审核发放前,根据对信用卡申请人的信用进行评估,决定是否发放,以降低信用卡欺诈风险。事实上,信用评估等的确能够避免业务造成的损失,但银行也需要关注业绩增长。所以,如何在防范风险的同时进一步实现业绩增长是信用卡业务亟待解决的一个问题。
因此有必要提供一种信用卡发卡模型,如图1所示,图1为本发明实施例提供的信用卡发卡模型的模块流程图,所述信用卡发卡模型包括:
数据准备模块,配置为分别获取训练客户和待预测客户的数据;
数据预处理模块,配置为将获取的数据进行预处理;
提取特征工程模块,配置为从预处理后的数据中提取特征,特征包括基础属性特征、欺诈风险特征、信用风险特征以及衍生信息特征;
训练模块,配置为采用GBRT模型对提取的特征进行训练,生成信用卡发卡模型结果,训练时所采用的特征属于训练客户;
模型预测模块,配置为利用信用卡发卡模型结果和提取的特征,预测出待预测客户的发卡风险,并评估发卡后的效益,预测时所采用的特征属于待预测客户。
本发明在考虑发卡风险的同时,将发卡效益纳入评价体系,更为全面的反映了各信用卡业务对银行经营的影响;有助于发掘处于风险天花板内的客户的增长潜力。并且针对不同效益程度的客户和对现有客户效益的分析,能够制定灵活多样的营销方式和更为有效的放贷额度,进一步扩大客群。
具体的,获取的数据为训练客户和待预测客户的数据,涉及了与客户效益相关的28张表,总结包括以下几类:客户信息表、卡信息表、发卡申请信息、人行征信表以及三方信息表,其中,三方信息表可以包括京东审批结果信息、鹏元征信以及美团征信等。这几类表可以全方位反映持卡人的行为特质,因此可以通过评估训练客户在表现期内的累积贡献度等生成信用卡发卡模型结果。
进一步的,训练客户的数据为多个已发信用卡客户表现期内的数据,并将各已发信用卡客户表现期内的数据作为样本数据。具体的,获取样本数据的方式为:在多个已发信用卡客户中选取样本,选取样本的规则为:首先选择当前时间距发卡日期间隔大于等于表现期的已发信用卡客户,其次选择已选出的已发信用卡客户的首张信用卡作为样本,获取所述样本在表现期内的累积贡献度作为样本的效益等数据,从而得到样本数据。其中,发卡日期为已发信用卡客户的发卡日期,表现期是为生成信用卡发卡模型结果采集样本数据而设置的期限,表现期可以为6个月、12个月或24个月等,优选表现期为12个月。
较佳的,数据预处理模块包括:拼接处理单元、加和处理单元、差值处理单元、比值处理单元以及清洗处理单元,用于对获取的数据进行拼接处理、加和处理、差值处理、比值处理以及清洗处理,其中,拼接处理在客户信息表的基础上,拼接了收益信息,以及反映客户更全面信息的三方信息和征信信息等;其次,对客户的授信额度、应还款以及实还款等基础信息,进行加和、差值、比值、分类求和等的组合计算,得到多种组合衍生特征,组合衍生特征包括信贷组合特征和还款比例特征。用于提高数据质量,从而提高后续数据分析和预测分析的效率。
优选的,本发明中的提取特征工程模块通过组合计算,聚集原特征,生成新的特征,以及划定不同的时间窗口建立客户的时序类特征。从而增大特征维度(由原300个特征增加到1200多个特征),建立了完善的特征体系,便于后续模型训练。
进一步的,上述所有特征可以分为以下几大类:
基础属性特征包括:客户的基础信息;
欺诈风险特征包括:客户申请信息中的地址、电话、手机、配偶是否与征信或三方信息匹配;
信用风险特征包括:(1)偿还历史,包括房贷总笔数、贷款总笔数、当前逾期贷款、贷记卡账户个数、最大及累计逾期期数;(2)还款能力,包括贷款笔数、贷款发放机构数、贷款金额、贷记卡账户数、授信总额及发卡机构数;(3)信用历史,包括查询机构数、最大贷记卡账户账龄、最小贷记卡账户账龄、平均贷记卡账户账龄及贷款距今时长;
衍生信息特征包括:职业变更频率、房贷占比及车贷占比。
优选的,训练模块中的训练方式为在回归场景中采用GBRT模型进行训练,GBRT模型具有可解释性强,拟合能力强,对异常值不敏感等优点。通常的,回归场景常用的评价指标有平均绝对误差(MAE,Mean Absolute Error),均方根误差(RMSE,Root Mean SquaredError),平均绝对百分误差(MAPE,Mean Absolute Percentage Error)和对称平均绝对百分误差(SMAPE,Symmetric Mean Absolute Percentage Error)。一般情况下,MAPE/SMAPE这类百分比指标可以更直观的反映出模型预测结果与真实值的差距。但在本发明中,由于存在大量的非活跃客户等效益为零的样本,即零值分母导致指标爆炸,使得这类百分比指标失去意义。本发明最终选用MAE/RMSE这类绝对值指标来评价模型性能。
具体的,采用GBRT模型对提取的特征进行训练,并调整模型参数,以生成信用卡发卡模型结果;其中,训练时所采用的特征属于训练客户,模型参数可以为学习率0.05,单颗树的最大深度5,树的颗数500,L0正则系数5,L2正则系数5,叶子节点最小权重0,叶子节点最小划分增益0.00001。
进一步的,模型预测模块利用信用卡发卡模型结果和提取的特征,预测出待预测客户的发卡风险,并评估发卡后的效益,预测时所采用的特征属于待预测客户。
较佳的,所述信用卡发卡模型还包括模型结果评估模块,所述模型结果评估模块的评估方式为:
设置两种基线,分别为:使用样本数据中的众数作为预测值形成第一基线,使用距离当前时间节点最近的一个表现期的历史样本数据均值作为预测值形成第二基线,分别计算得到的第一基线RMSE指标和第二基线RMSE指标;
根据已生成的信用卡发卡模型结果计算模型RMSE指标;
根据模型RMSE指标、第一基线RMSE指标和第二基线RMSE指标比较信用卡发卡模型结果、第一基线以及第二基线预测的准确率;
计算得出信用卡发卡模型结果预测准确率相对于第一基线或第二基线的提升均大于14%,计算预测准确率提升比例的公式为:(模型RMSE-第一基线RMSE指标或第二基线RMSE指标)/第一基线RMSE指标或第二基线RMSE指标。
本发明还提供了一种信用卡发卡模型的运用方法,如图2所示,图2为本发明实施例提供的信用卡发卡模型的运用方法的流程图,所述运用方法包括以下步骤:
分别获取训练客户和待预测客户的数据;
将获取的数据进行预处理;
从预处理后的数据中提取特征,特征包括基础属性特征、欺诈风险特征、信用风险特征以及衍生信息特征;
采用GBRT模型对提取的特征进行训练,生成信用卡发卡模型结果,训练时所采用的特征属于训练客户;
利用信用卡发卡模型结果和提取的特征,预测出待预测客户的发卡风险,并评估发卡后的效益,预测时所采用的特征属于待预测客户。
本发明在考虑发卡风险的同时,将发卡效益纳入评价体系,更为全面的反映了各信用卡业务对银行经营的影响;有助于发掘处于风险天花板内的客户的增长潜力。并且针对不同效益程度的客户和对现有客户效益的分析,能够制定灵活多样的营销方式和更为有效的放贷额度,进一步扩大客群。
具体的,获取的数据为训练客户和待预测客户的数据,涉及了与客户效益相关的28张表,总结包括以下几类:客户信息表、卡信息表、发卡申请信息、人行征信表以及三方信息表,其中,三方信息表可以包括京东审批结果信息、鹏元征信以及美团征信等。这几类表可以全方位反映持卡人的行为特质,因此可以通过评估训练客户在表现期内的累积贡献度等生成信用卡发卡模型结果。
进一步的,训练客户的数据为多个已发信用卡客户表现期内的数据,并将各已发信用卡客户表现期内的数据作为样本数据。具体的,获取样本数据的方式为:在多个已发信用卡客户中选取样本,选取样本的规则为:首先选择当前时间距发卡日期间隔大于等于表现期的已发信用卡客户,其次选择已选出的已发信用卡客户的首张信用卡作为样本,获取所述样本在表现期内的累积贡献度作为样本的效益等数据,从而得到样本数据。其中,发卡日期为已发信用卡客户的发卡日期,表现期是为生成信用卡发卡模型结果采集样本数据而设置的期限,表现期可以为6个月、12个月或24个月等,优选表现期为12个月。
接着,对获取的数据进行预处理,预处理包括以下处理方式:拼接处理、加和处理、差值处理、比值处理以及清洗处理,其中,拼接处理在客户信息表的基础上,拼接了收益信息,以及反映客户更全面信息的三方信息和征信信息等;其次,对客户的授信额度、应还款以及实还款等基础信息,进行加和、差值、比值、分类求和等的组合计算,得到多种组合衍生特征,组合衍生特征包括信贷组合特征和还款比例特征。用于提高数据质量,从而提高后续数据分析和预测分析的效率。
优选的,本发明通过组合计算,聚集原特征,生成新的特征,以及划定不同的时间窗口建立客户的时序类特征。从而增大特征维度(由原300个特征增加到1200多个特征),建立了完善的特征体系,便于后续模型训练。
进一步的,上述所有特征可以分为以下几大类:
基础属性特征包括:客户的基础信息;
欺诈风险特征包括:客户申请信息中的地址、电话、手机、配偶是否与征信或三方信息匹配;
信用风险特征包括:(1)偿还历史,包括房贷总笔数、贷款总笔数、当前逾期贷款、贷记卡账户个数、最大及累计逾期期数;(2)还款能力,包括贷款笔数、贷款发放机构数、贷款金额、贷记卡账户数、授信总额及发卡机构数;(3)信用历史,包括查询机构数、最大贷记卡账户账龄、最小贷记卡账户账龄、平均贷记卡账户账龄及贷款距今时长;
衍生信息特征包括:职业变更频率、房贷占比及车贷占比。
进一步的,本方法中的训练方式为在回归场景中采用GBRT模型进行训练,GBRT模型具有可解释性强,拟合能力强,对异常值不敏感等优点。通常的,回归场景常用的评价指标有平均绝对误差(MAE,Mean Absolute Error),均方根误差(RMSE,Root Mean SquaredError),平均绝对百分误差(MAPE,Mean Absolute Percentage Error)和对称平均绝对百分误差(SMAPE,Symmetric Mean Absolute Percentage Error)。一般情况下,MAPE/SMAPE这类百分比指标可以更直观的反映出模型预测结果与真实值的差距。但在本发明中,由于存在大量的非活跃客户等效益为零的样本,即零值分母导致指标爆炸,使得这类百分比指标失去意义。本发明最终选用MAE/RMSE这类绝对值指标来评价模型性能。
具体的,采用GBRT模型对提取的特征进行训练,并调整模型参数,以生成信用卡发卡模型结果;其中,训练时所采用的特征属于训练客户,模型参数可以为学习率0.05,单颗树的最大深度5,树的颗数500,L0正则系数5,L2正则系数5,叶子节点最小权重0,叶子节点最小划分增益0.00001。
接着,在生成信用卡发卡模型结果之后,利用提取的特征,预测出待预测客户的发卡风险,并评估发卡后的效益,预测时所采用的特征属于待预测客户。
可选的,在所述信用卡发卡模型的运用方法中,所述信用卡发卡模型的运用方法还包括模型结果评估步骤,所述模型结果评估步骤的评估方式为:
设置两种基线,分别为:使用样本数据中的众数作为预测值形成第一基线,使用距离当前时间节点最近的一个表现期的历史样本数据均值作为预测值形成第二基线,分别计算得到的第一基线RMSE指标和第二基线RMSE指标;
根据已生成的信用卡发卡模型结果计算模型RMSE指标;
根据模型RMSE指标、第一基线RMSE指标和第二基线RMSE指标比较信用卡发卡模型结果、第一基线以及第二基线预测的准确率;
计算得出信用卡发卡模型结果预测准确率相对于第一基线或第二基线的提升均大于14%,计算预测准确率提升比例的公式为:(模型RMSE-第一基线RMSE指标或第二基线RMSE指标)/第一基线RMSE指标或第二基线RMSE指标。
在一个实施例中,还可以按照已发信用卡客户的首卡的真实效益降序排序,并依据其真实效益将样本分为了极高效益(约20k)/高效益(约2k)/普通效益(约500)/低效益(约0)客户,即在效益维度上进行客群分类;然后对这四个分类客群的真实效益和信用卡发卡模型结果的预测结果进行对比分析。最终,信用卡发卡模型结果对高效益客户和低效益客户的预测效果非常好;对极高效益客户和普通效益客户的预测,也有一定的指导意义。
综上,本发明相对于现有技术,具有以下优点:
(1)在考虑发卡风险的同时,将发卡效益纳入评价体系,更为全面的反映了各信用卡业务对银行经营的影响。
(2)有助于发掘处于风险天花板内的客户的增长潜力。
(3)针对不同效益程度的客户,能够制定灵活多样的营销方式,进一步扩大客群。
(4)通过对现有客户的效益分析,制定更为有效的放贷额度。
上述仅为本发明的优选实施例而已,并不对本发明起到任何限制作用。任何所属技术领域的技术人员,在不脱离本发明的技术方案的范围内,对本发明揭露的技术方案和技术内容做任何形式的等同替换或修改等变动,均属未脱离本发明的技术方案的内容,仍属于本发明的保护范围之内。
Claims (14)
1.一种信用卡发卡模型,其特征在于,包括:
数据准备模块,配置为分别获取训练客户和待预测客户的数据;
数据预处理模块,配置为将获取的数据进行预处理;
提取特征工程模块,配置为从预处理后的数据中提取特征,特征包括基础属性特征、欺诈风险特征、信用风险特征以及衍生信息特征;
训练模块,配置为采用GBRT模型对提取的特征进行训练,生成信用卡发卡模型结果,训练时所采用的特征属于训练客户;
模型预测模块,配置为利用信用卡发卡模型结果和提取的特征,预测出待预测客户的发卡风险,并评估发卡后的效益,预测时所采用的特征属于待预测客户。
2.如权利要求1所述的信用卡发卡模型,其特征在于,获取的数据为训练客户和待预测客户的数据,包括:
客户信息表、卡信息表、发卡申请信息、人行征信表以及三方信息表。
3.如权利要求2所述的信用卡发卡模型,其特征在于,训练客户的数据为多个已发信用卡客户表现期内的数据,并将各已发信用卡客户表现期内的数据作为样本数据,其中,表现期为6个月、12个月或24个月。
4.如权利要求1所述的信用卡发卡模型,其特征在于,数据预处理模块包括:拼接处理单元、加和处理单元、差值处理单元、比值处理单元以及清洗处理单元,用于对获取的数据进行拼接处理、加和处理、差值处理、比值处理以及清洗处理,得到多种组合衍生特征,组合衍生特征包括信贷组合特征和还款比例特征。
5.如权利要求1所述的信用卡发卡模型,其特征在于,
基础属性特征包括:客户的基础信息;
欺诈风险特征包括:客户申请信息中的地址、电话、手机、配偶是否与征信或三方信息匹配;
信用风险特征包括:偿还历史,包括房贷总笔数、贷款总笔数、当前逾期贷款、贷记卡账户个数、最大及累计逾期期数;还款能力,包括贷款笔数、贷款发放机构数、贷款金额、贷记卡账户数、授信总额及发卡机构数;信用历史,包括查询机构数、最大贷记卡账户账龄、最小贷记卡账户账龄、平均贷记卡账户账龄及贷款距今时长;
衍生信息特征包括:职业变更频率、房贷占比及车贷占比。
6.如权利要求1所述的信用卡发卡模型,其特征在于,模型训练模块还配置为在训练时调整模型参数。
7.如权利要求1所述的信用卡发卡模型,其特征在于,所述信用卡发卡模型还包括模型结果评估模块,所述模型结果评估模块的评估方式为:
设置两种基线,分别为:使用样本数据中的众数作为预测值形成第一基线,使用距离当前时间节点最近的一个表现期的历史样本数据均值作为预测值形成第二基线,分别计算得到的第一基线RMSE指标和第二基线RMSE指标;
根据已生成的信用卡发卡模型结果计算模型RMSE指标;
根据模型RMSE指标、第一基线RMSE指标和第二基线RMSE指标比较信用卡发卡模型结果、第一基线以及第二基线预测的准确率;
计算得出信用卡发卡模型结果预测准确率相对于第一基线或第二基线的提升均大于14%。
8.一种信用卡发卡模型的运用方法,其特征在于,包括以下步骤:
分别获取训练客户和待预测客户的数据;
将获取的数据进行预处理;
从预处理后的数据中提取特征,特征包括基础属性特征、欺诈风险特征、信用风险特征以及衍生信息特征;
采用GBRT模型对提取的特征进行训练,生成信用卡发卡模型结果,训练时所采用的特征属于训练客户;
利用信用卡发卡模型结果和提取的特征,预测出待预测客户的发卡风险,并评估发卡后的效益,预测时所采用的特征属于待预测客户。
9.如权利要求8所述的信用卡发卡模型的运用方法,其特征在于,获取的数据为训练客户和待预测客户的数据,包括:
客户信息表、卡信息表、发卡申请信息、人行征信表以及三方信息表。
10.如权利要求9所述的信用卡发卡模型的运用方法,其特征在于,训练客户的数据为多个已发信用卡客户表现期内的数据,并将各已发信用卡客户表现期内的数据作为样本数据,其中,表现期为6个月、12个月或24个月。
11.如权利要求8所述的信用卡发卡模型的运用方法,其特征在于,预处理包括以下处理方式:拼接处理、加和处理、差值处理、比值处理以及清洗处理;
以得到多种组合衍生特征,组合衍生特征包括信贷组合特征和还款比例特征。
12.如权利要求8所述的信用卡发卡模型的运用方法,其特征在于,
基础属性特征包括:客户的基础信息;
欺诈风险特征包括:客户申请信息中的地址、电话、手机、配偶是否与征信或三方信息匹配;
信用风险特征包括:偿还历史,包括房贷总笔数、贷款总笔数、当前逾期贷款、贷记卡账户个数、最大及累计逾期期数;还款能力,包括贷款笔数、贷款发放机构数、贷款金额、贷记卡账户数、授信总额及发卡机构数;信用历史,包括查询机构数、最大贷记卡账户账龄、最小贷记卡账户账龄、平均贷记卡账户账龄及贷款距今时长;
衍生信息特征包括:职业变更频率、房贷占比及车贷占比。
13.如权利要求8所述的信用卡发卡模型的运用方法,其特征在于,生成信用卡发卡模型结果的过程中,还包括以下步骤:调整模型参数。
14.如权利要求8所述的信用卡发卡模型的运用方法,其特征在于,所述信用卡发卡模型的运用方法还包括模型结果评估步骤,所述模型结果评估步骤的评估方式为:
设置两种基线,分别为:使用样本数据中的众数作为预测值形成第一基线,使用距离当前时间节点最近的一个表现期的历史样本数据均值作为预测值形成第二基线,分别计算得到的第一基线RMSE指标和第二基线RMSE指标;
根据已生成的信用卡发卡模型结果计算模型RMSE指标;
根据模型RMSE指标、第一基线RMSE指标和第二基线RMSE指标比较信用卡发卡模型结果、第一基线以及第二基线预测的准确率;
计算得出信用卡发卡模型结果预测准确率相对于第一基线或第二基线的提升均大于14%。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010811052.2A CN111951099B (zh) | 2020-08-13 | 2020-08-13 | 一种信用卡发卡模型及其运用方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010811052.2A CN111951099B (zh) | 2020-08-13 | 2020-08-13 | 一种信用卡发卡模型及其运用方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111951099A true CN111951099A (zh) | 2020-11-17 |
CN111951099B CN111951099B (zh) | 2023-08-18 |
Family
ID=73332670
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010811052.2A Active CN111951099B (zh) | 2020-08-13 | 2020-08-13 | 一种信用卡发卡模型及其运用方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111951099B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114049198A (zh) * | 2021-11-11 | 2022-02-15 | 北京道口金科科技有限公司 | 一种自动化特征工程信用风险评价系统及方法 |
CN115345726A (zh) * | 2022-08-17 | 2022-11-15 | 平安科技(深圳)有限公司 | 信用卡的自动审批方法、装置、电子设备和介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8762262B1 (en) * | 2002-09-06 | 2014-06-24 | Capital One Financial Corporation | Method and system for automatically collecting payment for a credit account |
CN106056385A (zh) * | 2016-06-06 | 2016-10-26 | 上海河广信息科技有限公司 | 信用卡防盗系统及信用卡安全系统 |
WO2017070631A1 (en) * | 2015-10-22 | 2017-04-27 | PlaceIQ, Inc. | Branching mobile-device to system-namespace identifier mappings |
CN106651570A (zh) * | 2016-12-27 | 2017-05-10 | 中国建设银行股份有限公司 | 一种贷款实时审批系统和方法 |
CN108596495A (zh) * | 2018-04-26 | 2018-09-28 | 浙江工业大学 | 一种零售信贷业务评分系统及方法 |
CN109916844A (zh) * | 2019-04-15 | 2019-06-21 | 长江大学 | 一种小麦籽粒抗性淀粉含量的快速测定方法 |
TWM582173U (zh) * | 2019-02-14 | 2019-08-11 | 中國信託商業銀行股份有限公司 | Credit card quota management system |
TWM585948U (zh) * | 2019-05-17 | 2019-11-01 | 玉山商業銀行股份有限公司 | 信用卡核發系統 |
CN111062808A (zh) * | 2019-12-24 | 2020-04-24 | 深圳市信联征信有限公司 | 信用卡额度评估方法、装置、计算机设备及存储介质 |
-
2020
- 2020-08-13 CN CN202010811052.2A patent/CN111951099B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8762262B1 (en) * | 2002-09-06 | 2014-06-24 | Capital One Financial Corporation | Method and system for automatically collecting payment for a credit account |
WO2017070631A1 (en) * | 2015-10-22 | 2017-04-27 | PlaceIQ, Inc. | Branching mobile-device to system-namespace identifier mappings |
CN106056385A (zh) * | 2016-06-06 | 2016-10-26 | 上海河广信息科技有限公司 | 信用卡防盗系统及信用卡安全系统 |
CN106651570A (zh) * | 2016-12-27 | 2017-05-10 | 中国建设银行股份有限公司 | 一种贷款实时审批系统和方法 |
CN108596495A (zh) * | 2018-04-26 | 2018-09-28 | 浙江工业大学 | 一种零售信贷业务评分系统及方法 |
TWM582173U (zh) * | 2019-02-14 | 2019-08-11 | 中國信託商業銀行股份有限公司 | Credit card quota management system |
CN109916844A (zh) * | 2019-04-15 | 2019-06-21 | 长江大学 | 一种小麦籽粒抗性淀粉含量的快速测定方法 |
TWM585948U (zh) * | 2019-05-17 | 2019-11-01 | 玉山商業銀行股份有限公司 | 信用卡核發系統 |
CN111062808A (zh) * | 2019-12-24 | 2020-04-24 | 深圳市信联征信有限公司 | 信用卡额度评估方法、装置、计算机设备及存储介质 |
Non-Patent Citations (4)
Title |
---|
MARCOS ROBERTO MACHAD: ""LightGBM:an Effective Dscision Tree Gradient Boosting Method to Predict Customer Loyalty in the Finance Industry"", 《INTERNATIONAL CONFERENCE ON COMPUTER SCIENCE& EDUCATION》, vol. 14, pages 234 - 236 * |
梁晓雯: ""基于新型模糊神经网络的信用卡审批发卡的信用评估模型研究"", 《福建商业高等专科学校学报》, no. 6, pages 26 * |
赵宝福 谢添丞: "\"基于IAPSO-RELM的信用卡用户风险评估"", 《辽宁工程技术大学学报 》, vol. 18, no. 4, pages 482 - 483 * |
陶涛: ""基于双向LSTM的Seq2Seq模型在加油站时序数据异常检测中的应用"", 《计算机应用》, no. 3, pages 924 - 925 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114049198A (zh) * | 2021-11-11 | 2022-02-15 | 北京道口金科科技有限公司 | 一种自动化特征工程信用风险评价系统及方法 |
CN115345726A (zh) * | 2022-08-17 | 2022-11-15 | 平安科技(深圳)有限公司 | 信用卡的自动审批方法、装置、电子设备和介质 |
CN115345726B (zh) * | 2022-08-17 | 2024-02-13 | 平安科技(深圳)有限公司 | 信用卡的自动审批方法、装置、电子设备和介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111951099B (zh) | 2023-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109583966B (zh) | 一种高价值客户识别方法、系统、设备及存储介质 | |
CN112102073A (zh) | 信贷风险控制方法及系统、电子设备及可读存储介质 | |
CN112950359B (zh) | 一种用户识别方法和装置 | |
CN110930038A (zh) | 一种贷款需求识别方法、装置、终端及存储介质 | |
Tater et al. | Customer adoption of banking technology in private banks of India | |
CN114078050A (zh) | 贷款逾期预测方法、装置、电子设备及计算机可读介质 | |
CN113256409A (zh) | 基于机器学习的银行零售客户流失预测方法 | |
CN111951099A (zh) | 一种信用卡发卡模型及其运用方法 | |
CN111210332A (zh) | 贷后管理策略生成方法、装置及电子设备 | |
CN115545886A (zh) | 逾期风险识别方法、装置、设备及存储介质 | |
Bach et al. | Selection of variables for credit risk data mining models: preliminary research | |
Petersone et al. | A Data-Driven Framework for Identifying Investment Opportunities in Private Equity | |
CN117194627A (zh) | 基于文本和结构化数据的用户意向识别和量化方法 | |
CN113177733B (zh) | 基于卷积神经网络的中小微企业数据建模方法及系统 | |
CN115237970A (zh) | 数据预测方法、装置、设备、存储介质及程序产品 | |
CN117455681A (zh) | 业务风险预测方法和装置 | |
Zhang | Applications of the decision tree in business field | |
CN114565450A (zh) | 一种基于逾期共债的催收策略确定方法及相关设备 | |
CN113256404A (zh) | 数据处理方法及装置 | |
CN111932018B (zh) | 银行业务绩效贡献信息预测方法及装置 | |
US20220114518A1 (en) | Computer system and computer implemented method | |
CN116308722A (zh) | 一种风控模型冷启动建模方法、装置及存储介质 | |
CN117635153A (zh) | 客户金融交易风险报告生成方法及装置 | |
Mayol | Task automation through email data analysis | |
Jiang et al. | A bank customer credit evaluation based on the decision tree and the simulated annealing algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |