CN117151869A - 一种基于深度学习的个人信用征信模型及方法 - Google Patents
一种基于深度学习的个人信用征信模型及方法 Download PDFInfo
- Publication number
- CN117151869A CN117151869A CN202311396514.9A CN202311396514A CN117151869A CN 117151869 A CN117151869 A CN 117151869A CN 202311396514 A CN202311396514 A CN 202311396514A CN 117151869 A CN117151869 A CN 117151869A
- Authority
- CN
- China
- Prior art keywords
- credit
- personal
- personal credit
- model
- comprehensive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000013135 deep learning Methods 0.000 title claims abstract description 32
- 238000011156 evaluation Methods 0.000 claims abstract description 86
- 238000011835 investigation Methods 0.000 claims abstract description 45
- 238000004458 analytical method Methods 0.000 claims abstract description 25
- 238000004364 calculation method Methods 0.000 claims description 26
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 238000007405 data analysis Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 7
- 238000012937 correction Methods 0.000 claims description 3
- 238000013136 deep learning model Methods 0.000 abstract description 3
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004140 cleaning Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了一种基于深度学习的个人信用征信模型及方法,涉及个人信用征信技术领域,包括如下步骤:收集个人信用相关数据,使用自编码器对数据进行特征提取,获得个人信用相关数据;对每个贷款或信用卡的数据进行分析,获得第一信用评价指数Dy;将个人信息数据关联形成第二信用评价指数De;依据第一信用评价指数和第二信用评价指数构建标准个人信用征信模型;计算分析标准个人信用征信模型的误差Wc,当个人信用征信模型的误差Wc超出预设阈值时,向外发出预警信号。本发明通过综合考虑贷款情况和个人资产情况,构建个人信用的深度学习模型,可以更加全面客观地评估个人信用状况,并进行误差分析,根据误差情况及时调整模型。
Description
技术领域
本发明涉及个人信用征信技术领域,具体为一种基于深度学习的个人信用征信模型及方法。
背景技术
个人信用评估是指对个人的信用状况进行评估和分析,以便于金融机构、企业等在与该个人进行交易时能够更好地了解其信用风险和还款能力。目前,个人信用评估已经成为金融行业的重要领域之一,在贷款、信用卡、租房、就业等方面都有着广泛的应用。
在申请公布号为CN104103010A的中国发明申请中,公开了一种基于个人信用报告生成信用风险指数的方法,将单一信贷产品的逾期还款记录分为不同等级后转化为一个马尔科夫链数学模型并计算其转移状态矩阵,通过转移状态矩阵的回溯运算得到期末单一信贷产品的逾期等级指数的数学期望,根据借贷人的资产配比得到该借款人的综合风险指数。
在以上发明申请中,克服了以往单一考虑信用违约的做法,最大限度的利用了信用记录中的还款信息,构建了一个体现信用风险的综合指数。但在实际应用中仅仅只考虑信用记录是不全面的,还需考虑个人资产收入等,并且随着经济的发展,例如在发生通货膨胀和通货紧缩时,相同数据的信用评估划分可能会发生变化。
为此,提供了一种基于深度学习的个人信用征信模型及方法。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种基于深度学习的个人信用征信模型及方法,本发明在基于深度学习构建了一个标准个人信用征信模型,综合考虑贷款情况和个人资产情况,更加全面客观地评估个人信用状况,并且实时对模型进行误差分析检验,依据样本和实时新增数据对模型进行实时校验,可以及时调整和改进模型参数及算法等因素,促进信用体系的建设。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:一种基于深度学习的个人信用征信方法,包括如下步骤:
通过银行和消费金融机构收集个人信用相关数据,使用自编码器对数据进行特征提取和转换,获得每个贷款或信用卡的透支金额、已还款金额/>、逾期次数/>和最长逾期时间/>,以及个人年龄Nl,月收入Sr,存款Ck和名下资产Zc;
将每个贷款或信用卡的透支金额、已还款金额/>、逾期次数/>及最长逾期时间/>进行计算处理,获得第一信用评价指数Dy;
将年龄Nl,月收入Sr,存款Ck及名下资产Zc进一步关联形成第二信用评价指数De;
使用深度学习算法构建初步个人信用征信模型,在经过样本数据训练及测试后,获得标准个人信用征信模型,并使用标准个人信用征信模型对需要进行信用评估的相关数据进行分析,确定对应的信用等级;
获取标准个人信用征信模型样本中所有的综合信用评价指标和实时计算新增的综合信用评价指标,计算分析后获得实际综合信用评价指标的方差,并将样本方差/>和实际综合信用评价指标的方差/>进行误差分析,获得标准个人信用征信模型的误差Wc,当个人信用征信模型的误差Wc超出预设阈值时,向外发出预警信号。
进一步的,通过银行和消费金融机构收集个人信用相关数据,包括个人信息、贷款记录及信用卡记录,并对收集到的原始数据进行清洗、去重及缺失值填充的预处理操作,以确保数据质量和完整性。
进一步的,将每个贷款或信用卡的透支金额、已还款金额/>、逾期次数/>及最长逾期时间/>进行归一化处理,综合后形成每个贷款或信用卡的信用分数/>,计算公式如下:
,
其中,i表示每个贷款或信用卡的顺序编号,i=1、2、3、4、…、n,n为正整数。
进一步的,获取每个贷款或信用卡的透支金额和已还款金额/>,无量纲化处理后,关联形成每个贷款或信用卡使用情况的权重/>,关联公式如下:
,
其中,,/>,且/>,/>、/>为权重,其具体值由用户调整设置。
进一步的,获取每个贷款或信用卡的信用分数和权重/>,无量纲化处理后,关联形成第一信用评价指数Dy:
,
对应的第一信用评价指数Dy的关联公式如上。
进一步的,获取年龄Nl,月收入Sr,存款Ck及名下资产Zc,关联形成第二信用评价指数De,关联公式如下:
,
其中,参数意义为:年龄影响因子,/>,月收入影响因子,存款影响因子/>,/>,名下资产影响因子/>,,C为常数修正系数。
进一步的,使用深度学习算法构建初步个人信用征信模型,将第一信用评价指数和第二信用评价指数/>作为样本数据导入初步个人信用征信模型,计算获得综合信用评价指标/>,初步个人信用征信模型依据综合信用评价指标/>的分布情况确定划分信用等级的第一阈值和第二阈值,在经过样本数据训练及测试后,将标准个人信用征信模型输出;根据中心极限定理,当样本容量足够大时,随机变量的分布将近似为正态分布,故将综合信用评价指标/>看做正态分布,取第一阈值为/>,第二阈值为/>。其中,/>为样本期望,/>为样本方差,x表示样本中每个个人信用的顺序编号,x=1、2、3、4、…、m,m为正整数。
进一步的,使用标准个人信用征信模型对需要进行信用评估的相关数据进行评估,确定对应的信用等级并输出,其中信用等级划分具体为:
当Zh≤第二阈值<第一阈值时,表示个人信用记录较差,还款能力较差;
当第二阈值<Zh≤第一阈值时,表示个人信用记录良好,还款能力一般;
当第二阈值<第一阈值时<Zh时,表示个人信用记录优秀,还款能力强。
进一步的,获取标准个人信用征信模型样本中所有的综合信用评价指标和实时计算新增的综合信用评价指标,将所有的综合信用评价指标进行顺序编号,记为,计算获得实际平均值Pj,并进一步将所有的综合信用评价指标/>和实际平均值Pj计算分析后获得实际综合信用评价指标的方差/>,其中,实际平均值Pj的计算公式如下:
,
实际综合信用评价指标的方差的计算公式如下:
,
其中,y=1、2、3、4、……、s,s为正整数,且。
进一步的,将样本方差和实际综合信用评价指标的方差/>进行误差分析,获得标准个人信用征信模型的误差Wc,个人信用征信模型的误差Wc的计算公式如下:
,
当个人信用征信模型的误差Wc超出预设阈值时,向外发出预警信号。
一种基于深度学习的个人信用征信模型,包括:
数据采集模块,通过银行和消费金融机构收集个人信用相关数据,使用自编码器对数据进行特征提取和转换,获得每个贷款或信用卡的透支金额、已还款金额/>、逾期次数/>和最长逾期时间/>,以及个人年龄Nl,月收入Sr,存款Ck和名下资产Zc;
第一数据分析模块,将每个贷款或信用卡的透支金额、已还款金额/>、逾期次数/>及最长逾期时间/>进行计算处理,获得第一信用评价指数Dy;
第二数据分析模块,将年龄Nl,月收入Sr,存款Ck及名下资产Zc进一步关联形成第二信用评价指数De;
综合评估模块,使用深度学习算法构建初步个人信用征信模型,在经过样本数据训练及测试后,获得标准个人信用征信模型,并使用标准个人信用征信模型对需要进行信用评估的相关数据进行分析,确定对应的信用等级;
误差分析模块,获取标准个人信用征信模型样本中所有的综合信用评价指标和实时计算新增的综合信用评价指标,计算分析后获得实际综合信用评价指标的方差,并将样本方差/>和实际综合信用评价指标的方差/>进行误差分析,获得标准个人信用征信模型的误差Wc,当误差Wc超过预设阈值时,向外发出预警信号。
(三)有益效果
本发明提供了一种基于深度学习的个人信用征信模型及方法,具备以下有益效果:
1、通过对收集到的原始数据进行预处理操作和特征提取,可以减少无关信息的干扰,提取出与问题相关的有效信息。有助于将不同领域、不同类型、不同来源的数据进行比较、融合和交叉验证等操作,从而实现跨领域、跨平台、跨任务等通用性应用。
2、通过综合考虑贷款情况和个人资产情况,构建个人信用的深度学习模型,可以更加全面客观地评估个人信用状况,可以避免因单一指标不足而导致的评估偏差,提高信用评估的准确性和公正性。
3、通过对标准个人信用征信模型进行误差分析,可以根据误差情况及时调整和改进模型参数及算法等因素,促进信用体系的建设,提高预测能力,为金融机构和客户之间建立起更加稳定、可靠的信任关系。
附图说明
图1为本发明一种基于深度学习的个人信用征信方法的流程示意图;
图2为本发明一种基于深度学习的个人信用征信模型的结构示意图;
图中:10、数据采集模块;20、第一数据分析模块;30、第二数据分析模块;40、综合评估模块;50、误差分析模块。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明提供一种基于深度学习的个人信用征信方法,包括如下步骤:
步骤一、通过银行和消费金融机构收集个人信用相关数据,使用自编码器对贷款记录和信用卡记录进行特征提取和转换,获得每个贷款或信用卡的透支金额、已还款金额/>、逾期次数/>及最长逾期时间/>。
所述步骤一包括如下内容:
步骤101、通过银行和消费金融机构收集个人信用相关数据,包括个人信息、贷款记录及信用卡记录,并对收集到的原始数据进行清洗、去重及缺失值填充的预处理操作,以确保数据质量和完整性。
步骤102、使用自编码器对清洗后的贷款记录和信用卡记录进行特征提取和转换,获得每个贷款或信用卡的透支金额、已还款金额/>、逾期次数/>及最长逾期时间/>。
其中,i表示每个贷款或信用卡的顺序编号,i=1、2、3、4、…、n,n为正整数。
使用时,结合步骤101及102中的内容:
通过对收集到的原始数据进行预处理操作和特征提取,可以减少无关信息的干扰,提取出与问题相关的有效信息。有助于将不同领域、不同类型、不同来源的数据进行比较、融合和交叉验证等操作,从而实现跨领域、跨平台、跨任务等通用性应用。
步骤二、将每个贷款或信用卡的透支金额、已还款金额/>、逾期次数/>及最长逾期时间/>进行计算处理,获得第一信用评价指数Dy。
所述步骤二包括如下内容:
步骤201、将每个贷款或信用卡的透支金额、已还款金额/>、逾期次数/>及最长逾期时间/>进行归一化处理,综合后形成每个贷款或信用卡的信用分数/>:
,
对应的每个贷款或信用卡的信用分数的计算公式如上。
步骤202、获取每个贷款或信用卡的透支金额和已还款金额/>,无量纲化处理后,关联形成每个贷款或信用卡使用情况的权重/>,关联公式如下:
,
其中,,/>,且/>,/>、/>为权重,其具体值由用户调整设置。
步骤203、获取每个贷款或信用卡的信用分数和权重/>,无量纲化处理后,关联形成第一信用评价指数Dy:
,
对应的第一信用评价指数Dy的关联公式如上。
使用时,结合步骤201至203中的内容:
通过对个人信用卡和贷款的相关数据进行计算获得第一信用评价指数Dy,对个人信用卡和贷款使用情况进行评估,可以识别出潜在的风险客户,预测他们可能发生违约的概率,并采取相应的风险控制措施,如限制额度、提高利率、调整还款方式等,从而降低贷款违约率和损失。
步骤三、对清洗后的个人信息数据进行特征提取和转换,获得年龄Nl,月收入Sr,存款Ck及名下资产Zc,并进一步关联形成第二信用评价指数De。
所述步骤三包括如下内容:
步骤301、使用自编码器对清洗后的个人信息数据进行特征提取和转换,获得年龄Nl,月收入Sr,存款Ck及名下资产Zc。
步骤302、获取年龄Nl,月收入Sr,存款Ck及名下资产Zc,关联形成第二信用评价指数De,关联公式如下:
,
其中,参数意义为:年龄影响因子,/>,月收入影响因子,存款影响因子/>,/>,名下资产影响因子/>,,C为常数修正系数。
使用时,结合步骤301及302中的内容:
通过对个人资产、收入情况进行评估,可以了解个人的风险承受能力,从而更好地为其提供相应的金融产品和服务,并且可以制定出合理的信贷方案,避免过度借贷和不良贷款,也能够根据客户经济状况选择适合其的还款方式和期限。
步骤四、使用深度学习算法构建初步个人信用征信模型,在经过样本数据训练及测试后,获得标准个人信用征信模型,并使用标准个人信用征信模型对需要进行信用评估的相关数据进行分析,确定对应的信用等级。
所述步骤四包括如下内容:
步骤401、使用深度学习算法构建初步个人信用征信模型,将第一信用评价指数和第二信用评价指数/>作为样本数据导入初步个人信用征信模型,计算获得综合信用评价指标/>,初步个人信用征信模型依据综合信用评价指标/>的分布情况确定划分信用等级的第一阈值和第二阈值,在经过样本数据训练及测试后,将标准个人信用征信模型输出。
根据中心极限定理,当样本容量足够大时,随机变量的分布将近似为正态分布,故将综合信用评价指标看做正态分布,取第一阈值为/>,第二阈值为/>。其中,/>为样本期望,/>为样本方差,x表示样本中每个个人信用的顺序编号,x=1、2、3、4、…、m,m为正整数。
步骤402、使用标准个人信用征信模型对需要进行信用评估的相关数据进行评估,确定对应的信用等级并输出,其中信用等级划分具体为:
当Zh≤第二阈值<第一阈值时,表示个人信用记录较差,还款能力较差,在过去一段时间内有多次逾期或欠款记录,对应地,向外输出信用差的个人信用报告,不建议再次提供贷款或银行卡服务,并且需要提供更多的担保或抵押物。
当第二阈值<Zh≤第一阈值时,表示个人信用记录良好,还款能力一般,在过去一段时间内有少量逾期或欠款记录,对应地,向外输出信用一般的个人信用报告,建议在贷款方面需要提供更多担保材料,并且在审批过程中需要进行更为严格的审核。
当第二阈值<第一阈值时<Zh时,表示个人信用记录优秀,还款能力强,无逾期或欠款记录,对应地,向外输出信用优秀的个人信用报告,建议提高其贷款和信用卡的额度,并给予更低的贷款利率或信用卡利率。
使用时,结合步骤401及402中的内容:
通过综合考虑贷款情况和个人资产情况,构建个人信用的深度学习模型,可以更加全面客观地评估个人信用状况,可以避免因单一指标不足而导致的评估偏差,提高信用评估的准确性和公正性。
步骤五、获取标准个人信用征信模型样本中所有的综合信用评价指标和实时计算新增的综合信用评价指标,计算分析后获得实际综合信用评价指标的方差,并将样本方差/>和实际综合信用评价指标的方差/>进行误差分析,获得标准个人信用征信模型的误差Wc,当个人信用征信模型的误差Wc超出预设阈值时,向外发出预警信号。
所述步骤五包括如下内容:
步骤501、获取标准个人信用征信模型样本中所有的综合信用评价指标和实时计算新增的综合信用评价指标,将所有的综合信用评价指标进行顺序编号,记为,计算获得实际平均值Pj,计算公式如下:
,
其中,y=1、2、3、4、……、s,s为正整数,且。
步骤502、依据所有的综合信用评价指标和实际平均值Pj,计算分析后获得实际综合信用评价指标的方差/>:
,
对应的实际综合信用评价指标的方差的计算公式如上。
步骤503、将样本方差和实际综合信用评价指标的方差/>进行误差分析,获得标准个人信用征信模型的误差Wc,个人信用征信模型的误差Wc的计算公式如下:
,
当个人信用征信模型的误差Wc超出预设阈值时,向外发出预警信号。
使用时,结合步骤501至503中的内容:
通过对标准个人信用征信模型进行误差分析,可以根据误差情况调整和改进模型参数及算法等因素,促进信用体系的建设,提高预测能力,为金融机构和客户之间建立起更加稳定、可靠的信任关系。
请参阅图2,本发明提供一种基于深度学习的个人信用征信模型,包括:
数据采集模块10,通过银行和消费金融机构收集个人信用相关数据,使用自编码器对数据进行特征提取和转换,获得每个贷款或信用卡的透支金额、已还款金额/>、逾期次数/>和最长逾期时间/>,以及个人年龄Nl,月收入Sr,存款Ck和名下资产Zc。
第一数据分析模块20,将每个贷款或信用卡的透支金额、已还款金额/>、逾期次数/>及最长逾期时间/>进行计算处理,获得第一信用评价指数Dy。
第二数据分析模块30,将年龄Nl,月收入Sr,存款Ck及名下资产Zc进一步关联形成第二信用评价指数De。
综合评估模块40,使用深度学习算法构建初步个人信用征信模型,在经过样本数据训练及测试后,获得标准个人信用征信模型,并使用标准个人信用征信模型对需要进行信用评估的相关数据进行分析,确定对应的信用等级。
误差分析模块50,获取标准个人信用征信模型样本中所有的综合信用评价指标和实时计算新增的综合信用评价指标,计算分析后获得实际综合信用评价指标的方差,并将样本方差/>和实际综合信用评价指标的方差/>进行误差分析,获得标准个人信用征信模型的误差Wc,当个人信用征信模型的误差Wc超出预设阈值时,向外发出预警信号。
上述实施例,可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时,上述实施例可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令或计算机程序。在计算机上加载或执行所述计算机指令或计算机程序时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以为通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质。半导体介质可以是固态硬盘。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
最后:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所作的任何修改等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于深度学习的个人信用征信方法,其特征在于:包括如下步骤:
通过银行和消费金融机构收集个人信用相关数据,使用自编码器对数据进行特征提取和转换,获得每个贷款或信用卡的透支金额、已还款金额/>、逾期次数/>和最长逾期时间/>,以及个人年龄Nl,月收入Sr,存款Ck和名下资产Zc;
将每个贷款或信用卡的透支金额、已还款金额/>、逾期次数/>及最长逾期时间/>进行计算处理,获得第一信用评价指数Dy;
将年龄Nl,月收入Sr,存款Ck及名下资产Zc进一步关联形成第二信用评价指数De;
使用深度学习算法构建初步个人信用征信模型,在经过样本数据训练及测试后,获得标准个人信用征信模型,并使用标准个人信用征信模型对需要进行信用评估的相关数据进行分析,确定对应的信用等级;
获取标准个人信用征信模型样本中所有的综合信用评价指标和实时计算新增的综合信用评价指标,计算分析后获得实际综合信用评价指标的方差,并将样本方差/>和实际综合信用评价指标的方差/>进行误差分析,获得标准个人信用征信模型的误差Wc,当个人信用征信模型的误差Wc超出预设阈值时,向外发出预警信号。
2.根据权利要求1所述的一种基于深度学习的个人信用征信方法,其特征在于:将每个贷款或信用卡的透支金额、已还款金额/>、逾期次数/>及最长逾期时间/>进行归一化处理,综合后形成每个贷款或信用卡的信用分数/>,计算公式如下:
,
其中,i表示每个贷款或信用卡的顺序编号,i=1、2、3、4、…、n,n为正整数。
3.根据权利要求2所述的一种基于深度学习的个人信用征信方法,其特征在于:获取每个贷款或信用卡的透支金额和已还款金额/>,无量纲化处理后,关联形成每个贷款或信用卡使用情况的权重/>,关联公式如下:
,
其中,,/>,且/>,/>、/>为权重,其具体值由用户调整设置。
4.根据权利要求3所述的一种基于深度学习的个人信用征信方法,其特征在于:获取每个贷款或信用卡的信用分数和权重/>,无量纲化处理后,关联形成第一信用评价指数Dy:
,
对应的第一信用评价指数Dy的关联公式如上。
5.根据权利要求1所述的一种基于深度学习的个人信用征信方法,其特征在于:获取年龄Nl,月收入Sr,存款Ck及名下资产Zc,关联形成第二信用评价指数De,关联公式如下:
,
其中,参数意义为:年龄影响因子,/>,月收入影响因子,存款影响因子/>,/>,名下资产影响因子/>,,C为常数修正系数。
6.根据权利要求5所述的一种基于深度学习的个人信用征信方法,其特征在于:使用深度学习算法构建初步个人信用征信模型,将第一信用评价指数和第二信用评价指数/>作为样本数据导入初步个人信用征信模型,计算获得综合信用评价指标/>,初步个人信用征信模型依据综合信用评价指标/>的分布情况确定划分信用等级的第一阈值和第二阈值,在经过样本数据训练及测试后,将标准个人信用征信模型输出;
根据中心极限定理,当样本容量足够大时,随机变量的分布将近似为正态分布,故将综合信用评价指标看做正态分布,取第一阈值为/>,第二阈值为/>;其中,/>为样本期望,/>为样本方差,x表示样本中每个个人信用的顺序编号,x=1、2、3、4、…、m,m为正整数。
7.根据权利要求6所述的一种基于深度学习的个人信用征信方法,其特征在于:使用标准个人信用征信模型对需要进行信用评估的相关数据进行评估,确定对应的信用等级并输出,其中信用等级划分具体为:
当Zh≤第二阈值<第一阈值时,表示个人信用记录较差,还款能力较差;
当第二阈值<Zh≤第一阈值时,表示个人信用记录良好,还款能力一般;
当第二阈值<第一阈值时<Zh时,表示个人信用记录优秀,还款能力强。
8.根据权利要求7所述的一种基于深度学习的个人信用征信方法,其特征在于:获取标准个人信用征信模型样本中所有的综合信用评价指标和实时计算新增的综合信用评价指标,将所有的综合信用评价指标进行顺序编号,记为,计算获得实际平均值Pj,并进一步将所有的综合信用评价指标/>和实际平均值Pj计算分析后获得实际综合信用评价指标的方差/>,其中,实际平均值Pj的计算公式如下:
,
实际综合信用评价指标的方差的计算公式如下:
,
其中,y=1、2、3、4、……、s,s为正整数,且。
9.根据权利要求8所述的一种基于深度学习的个人信用征信方法,其特征在于:将样本方差和实际综合信用评价指标的方差/>进行误差分析,获得标准个人信用征信模型的误差Wc,个人信用征信模型的误差Wc的计算公式如下:
,
当个人信用征信模型的误差Wc超出预设阈值时,向外发出预警信号。
10.一种基于深度学习的个人信用征信模型,其特征在于:包括:
数据采集模块(10),通过银行和消费金融机构收集个人信用相关数据,使用自编码器对数据进行特征提取和转换,获得每个贷款或信用卡的透支金额、已还款金额/>、逾期次数/>和最长逾期时间/>,以及个人年龄Nl,月收入Sr,存款Ck和名下资产Zc;
第一数据分析模块(20),将每个贷款或信用卡的透支金额、已还款金额/>、逾期次数/>及最长逾期时间/>进行计算处理,获得第一信用评价指数Dy;
第二数据分析模块(30),将年龄Nl,月收入Sr,存款Ck及名下资产Zc进一步关联形成第二信用评价指数De;
综合评估模块(40),使用深度学习算法构建初步个人信用征信模型,在经过样本数据训练及测试后,获得标准个人信用征信模型,并使用标准个人信用征信模型对需要进行信用评估的相关数据进行分析,确定对应的信用等级;
误差分析模块(50),获取标准个人信用征信模型样本中所有的综合信用评价指标和实时计算新增的综合信用评价指标,计算分析后获得实际综合信用评价指标的方差,并将样本方差/>和实际综合信用评价指标的方差/>进行误差分析,获得标准个人信用征信模型的误差Wc,当个人信用征信模型的误差Wc超出预设阈值时,向外发出预警信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311396514.9A CN117151869A (zh) | 2023-10-26 | 2023-10-26 | 一种基于深度学习的个人信用征信模型及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311396514.9A CN117151869A (zh) | 2023-10-26 | 2023-10-26 | 一种基于深度学习的个人信用征信模型及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117151869A true CN117151869A (zh) | 2023-12-01 |
Family
ID=88902944
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311396514.9A Pending CN117151869A (zh) | 2023-10-26 | 2023-10-26 | 一种基于深度学习的个人信用征信模型及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117151869A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492046A (zh) * | 2018-10-26 | 2019-03-19 | 深圳力维智联技术有限公司 | 集成模型的失效判断方法及装置和计算机可读存储介质 |
CN109525435A (zh) * | 2018-12-14 | 2019-03-26 | 哈尔滨理工大学 | 一种电网业务服务器运行状态预警方法 |
US20200027008A1 (en) * | 2019-09-27 | 2020-01-23 | Intel Corporation | Methods, systems, articles of manufacture, and apparatus to control data acquisition settings in edge-based deployments |
CN111415247A (zh) * | 2020-04-25 | 2020-07-14 | 中信银行股份有限公司 | 贷后信用风险评价方法、装置、存储介质及电子设备 |
CN113177837A (zh) * | 2021-05-12 | 2021-07-27 | 广州市全民钱包科技有限公司 | 贷款申请人的贷款额度评估方法、装置、设备及存储介质 |
-
2023
- 2023-10-26 CN CN202311396514.9A patent/CN117151869A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492046A (zh) * | 2018-10-26 | 2019-03-19 | 深圳力维智联技术有限公司 | 集成模型的失效判断方法及装置和计算机可读存储介质 |
CN109525435A (zh) * | 2018-12-14 | 2019-03-26 | 哈尔滨理工大学 | 一种电网业务服务器运行状态预警方法 |
US20200027008A1 (en) * | 2019-09-27 | 2020-01-23 | Intel Corporation | Methods, systems, articles of manufacture, and apparatus to control data acquisition settings in edge-based deployments |
CN111415247A (zh) * | 2020-04-25 | 2020-07-14 | 中信银行股份有限公司 | 贷后信用风险评价方法、装置、存储介质及电子设备 |
CN113177837A (zh) * | 2021-05-12 | 2021-07-27 | 广州市全民钱包科技有限公司 | 贷款申请人的贷款额度评估方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111652710B (zh) | 一种基于集成树特征提取和Logistic回归的个人信用风险评估方法 | |
CN108648074B (zh) | 基于支持向量机的贷款评估方法、装置及设备 | |
CN111507831A (zh) | 信贷风险自动评估方法和装置 | |
KR20010102455A (ko) | 금융 증서와 같은 자산 포트폴리오의 신속한 가치 평가 | |
CN112598500A (zh) | 一种无额度客户的授信处理方法及系统 | |
Yakob et al. | Camel rating approach to assess the insurance operators financial strength | |
Wetter et al. | Improving business failure prediction for new firms: Benchmarking financial models with human and social capital | |
CN107133862A (zh) | 动态产生增强信用评估的详细交易支付经历的方法和系统 | |
CN112232950A (zh) | 针对借贷风险的评估方法及装置、设备、计算机可读存储介质 | |
CN110991650A (zh) | 训练养卡识别模型、识别养卡行为的方法及装置 | |
Chen et al. | Credit fraud detection based on hybrid credit scoring model | |
CN112419045A (zh) | 基于过采样与随机森林的不平衡信贷用户分类方法 | |
CN112561713A (zh) | 一种保险行业理赔反欺诈识别方法及装置 | |
CN115660834B (zh) | 基于决策树的个贷风险评估方法 | |
CN117151869A (zh) | 一种基于深度学习的个人信用征信模型及方法 | |
CN113421154B (zh) | 基于控制图的信贷风险评估方法及系统 | |
CN112926989B (zh) | 一种基于多视图集成学习的银行贷款风险评估方法及设备 | |
KR102336462B1 (ko) | 신용평가정보 제공 장치 및 방법 | |
CN110570301B (zh) | 风险识别方法、装置、设备及介质 | |
Giannopoulos | The effectiveness of artificial credit scoring models in predicting NPLs using micro accounting data | |
CN111539650A (zh) | 国际争议案件抗辩方法及其装置 | |
CN113313582A (zh) | 拒客回捞模型训练方法、装置及电子设备 | |
Whalen | Are Early Warning Models Still Useful Tools for Bank Supervisors ‘ | |
Barakova et al. | Sample selection bias in acquisition credit scoring models: an evaluation of the supplemental-data approach | |
CN113610638B (zh) | 基于smaa-ds的信用等级与违约损失率相匹配的评级系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |