CN107798600A - 互联网金融小微贷款的信用风险识别方法及装置 - Google Patents
互联网金融小微贷款的信用风险识别方法及装置 Download PDFInfo
- Publication number
- CN107798600A CN107798600A CN201711270176.9A CN201711270176A CN107798600A CN 107798600 A CN107798600 A CN 107798600A CN 201711270176 A CN201711270176 A CN 201711270176A CN 107798600 A CN107798600 A CN 107798600A
- Authority
- CN
- China
- Prior art keywords
- user
- credit
- data
- loan
- small micro
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开一种互联网金融小微贷款的信用风险识别方法及装置,所述方法包括以下步骤:获取用户信用数据;根据用户的借款行为来划分用户样本;通过获取的用户信用数据以及划分的用户样本得到一个原始的数据集;将数据集分为训练集和测试集,在训练集上实现特征工程,然后将这些操作还原到测试集上,利用在测试集上的效果来衡量最终的表现;根据实际情况选择算法,算法包括逻辑回归模型和xgboost两种信用评分模型;信用评分模型根据用户信息对用户进行信用评分。本发明用户授信审核速度快,人力成本低;其从大数据和机器学习的角度来对用户进行授信审核,具备科学性,同时随着数据的积累,模型能够不断的迭代升级,其评分准确性高。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种互联网金融小微贷款的信用风险识别方法及装置。
背景技术
目前,现有的信用审核多采用规则引擎与人工授信相集合的方式,规则引擎的规则是刚性设置,这种刚性设置无法全面衡量用户的信用数据,一旦用户的某些特征不满足某条规则就很有可能会被拒绝授信,这种方式会丢失掉很多潜在的用户,同时很多规则不具备自学习功能,无法根据数据的积累进行调整。
发明内容
本发明的目的在于克服现有技术的不足,提供一种互联网金融小微贷款的信用风险识别方法及装置,旨在根据用户的信用数据,得到用户的信用评分,根据信用评分来决定最终的授信结果。
为实现上述目的,本发明的技术方案如下:
一种互联网金融小微贷款的信用风险识别方法,所述方法包括以下步骤:
1)获取用户信用数据;
2)根据用户的借款行为来划分用户样本;
3)通过获取的用户信用数据以及划分的用户样本得到一个原始的数据集;
4)将数据集分为训练集和测试集,在训练集上实现特征工程,然后将这些操作还原到测试集上,利用在测试集上的效果来衡量最终的表现;
5)根据实际情况选择算法,算法包括逻辑回归模型和xgboost两种信用评分模型;
6)信用评分模型根据用户信息对用户进行信用评分。
具体地,在步骤1)中,用户信用数据包括用户第三方数据,用户个人信息以及一些用户行为数据。
具体地,在步骤2)中,用户样本划分标准通过用户信用数据分析得到。
具体地,在步骤3)中,对全量的数据集需要进行数据清洗和数据预处理。
具体地,在步骤6)中,信用评分模型标准采用AUC评分。
一种互联网金融小微贷款的信用风险识别装置,所述识别装置包括:
数据获取模块,用于获取用户信用数据;
样本划分模块,用于根据用户的借款行为来划分用户样本;
数据集模块,用于将获取的用户信用数据以及划分的用户样本得到一个原始的数据集,该数据集包括训练集和测试集;
测试模块,用于在训练集和测试集上实现特征工程,利用在测试集上的效果来衡量最终的表现;
算法选择模块,用于根据实际情况选择算法,算法包括逻辑回归模型和xgboost两种信用评分模型;
信用评分模块,用于选择的信用评分模型根据用户信息对用户进行信用评分。
进一步地,所述用户信用数据包括用户第三方数据,用户个人信息以及一些用户行为数据。
进一步地,所述样本划分模块的用户样本划分标准通过用户信用数据分析得到。
进一步地,全量的数据集通过数据清洗和数据预处理后划分为训练集和测试集。
进一步地,所述信用评分模块的信用评分标准采用AUC评分。
相对于现有技术,本发明的有益效果在于:
1)相对于人工信用审核,加快了用户授信审核的速度,同时也减少了人力成本的开支,在大户量的情况下,该优势会更加显著;
2)与传统的风控规则相对比,从大数据和机器学习的角度来对用户进行授信审核,具备科学性,同时随着数据的积累,模型能够不断的迭代升级,其评分的准确性会越来越高。
附图说明
图1为本发明实施例一互联网金融小微贷款的信用风险识别方法的流程示意图;
图2为本发明实施例二互联网金融小微贷款的信用风险识别装置的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图和实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例一
本发明提供一种互联网金融小微贷款的信用风险识别方法。
参照图1,图1为本发明互联网金融小微贷款的信用风险识别方法的流程示意图。
该互联网金融小微贷款的信用风险识别方法包括以下步骤:
1)获取用户信用数据,主要包括用户第三方数据,用户个人信息以及一些用户行为数据;
2)根据用户的借款行为来划分用户样本,划分标准可以通过用户信用数据分析得到;
3)通过获取的用户信用数据以及划分的用户样本得到一个原始的数据集,此时针对全量的数据集需要做一些数据清洗和数据预处理的工作,例如对一些范畴有序变量做哑变量处理,对范畴非有序型做热编码处理,对连续数值型数据需要做缺失值处理,对于缺失率过高的维度可以选择删除,对缺失率较低的维度可以做一些填充,例如均值填充和中位数填充,离散型变量则采用众数填充的方式;
4)将全量的数据集分为训练集和测试集,在训练集上实现特征工程,然后将这些操作还原到测试集上,利用在测试集上的效果来衡量最终的表现;
5)根据实际情况选择算法,算法包括逻辑回归模型和xgboost两种信用评分模型,逻辑回归模型是高偏差低方差的模型,具有较强的泛化能力,适用于数据量较少的时候,而像xgboost属于高方差低偏差的模型,相比于逻辑回归,xgboost具有更强的学习能力,但是对数据量的要求高于逻辑回归,如果数据量足够大,也可以考虑引入深度学习和强化学习来进一步提高信用评分的准确性;
6)信用评分模型根据用户信息对用户进行信用评分,评价标准采用AUC评分,因为模型是信用评分模型,信用评分模型是希望尽量将好用户排在坏用户的前面,而AUC评分正好是衡量这种排序好坏的一个标准。因为模型是信用评分模型,因此在上线时需要与一些反欺诈的强规则一起配合使用,反欺诈强规则主要用户验证用户信息的真实性与有效性。
实施例二
本发明提供一种互联网金融小微贷款的信用风险识别装置。
参照图2,图2为本发明互联网金融小微贷款的信用风险识别装置的结构框图。
该互联网金融小微贷款的信用风险识别装置包括:
数据获取模块,用于获取用户信用数据,所述用户信用数据主要包括用户第三方数据,用户个人信息以及一些用户行为数据;
样本划分模块,用于根据用户的借款行为来划分用户样本,划分标准可通过用户信用数据分析得到;
数据集模块,用于将获取的用户信用数据以及划分的用户样本得到一个原始的数据集,此时针对全量的数据集需要做一些数据清洗和数据预处理的工作,例如对一些范畴有序变量做哑变量处理,对范畴非有序型做热编码处理,对连续数值型数据需要做缺失值处理,对于缺失率过高的维度可以选择删除,对缺失率较低的维度可以做一些填充,例如均值填充和中位数填充,离散型变量则采用众数填充的方式,全量的数据集通过数据清洗和数据预处理后划分为训练集和测试集;
测试模块,用于在训练集和测试集上实现特征工程,利用在测试集上的效果来衡量最终的表现;
算法选择模块,用于根据实际情况选择算法,算法包括逻辑回归模型和xgboost两种信用评分模型,逻辑回归模型是高偏差低方差的模型,具有较强的泛化能力,适用于数据量较少的时候,而像xgboost属于高方差低偏差的模型,相比于逻辑回归,xgboost具有更强的学习能力,但是对数据量的要求高于逻辑回归,如果数据量足够大,也可以考虑引入深度学习和强化学习来进一步提高信用评分的准确性;
信用评分模块,用于选择的信用评分模型根据用户信息对用户进行信用评分,信用评分模型的评价标准采用AUC评分,因为模型是信用评分模型,信用评分模型是希望尽量将好用户排在坏用户的前面,而AUC评分正好是衡量这种排序好坏的一个标准。因为模型是信用评分模型,因此在上线时需要与一些反欺诈的强规则一起配合使用,反欺诈强规则主要用户验证用户信息的真实性与有效性。
综上所述,本发明相对于人工信用审核,加快了用户授信审核的速度,同时也减少了人力成本的开支;与传统的风控规则相对比,从大数据和机器学习的角度来对用户进行授信审核,具备科学性,同时随着数据的积累,模型能够不断的迭代升级,其评分的准确性会越来越高。
以上仅为本发明的较佳实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种互联网金融小微贷款的信用风险识别方法,其特征在于,所述方法包括以下步骤:
1)获取用户信用数据;
2)根据用户的借款行为来划分用户样本;
3)通过获取的用户信用数据以及划分的用户样本得到一个原始的数据集;
4)将数据集分为训练集和测试集,在训练集上实现特征工程,然后将这些操作还原到测试集上,利用在测试集上的效果来衡量最终的表现;
5)根据实际情况选择算法,算法包括逻辑回归模型和xgboost两种信用评分模型;
6)信用评分模型根据用户信息对用户进行信用评分。
2.根据权利要求1所述的互联网金融小微贷款的信用风险识别方法,其特征在于,在步骤1)中,用户信用数据包括用户第三方数据,用户个人信息以及一些用户行为数据。
3.根据权利要求1所述的互联网金融小微贷款的信用风险识别方法,其特征在于,在步骤2)中,用户样本划分标准通过用户信用数据分析得到。
4.根据权利要求1所述的互联网金融小微贷款的信用风险识别方法,其特征在于,在步骤3)中,对全量的数据集需要进行数据清洗和数据预处理。
5.根据权利要求1所述的互联网金融小微贷款的信用风险识别方法,其特征在于,在步骤6)中,信用评分模型标准采用AUC评分。
6.一种互联网金融小微贷款的信用风险识别装置,其特征在于,所述识别装置包括:
数据获取模块,用于获取用户信用数据;
样本划分模块,用于根据用户的借款行为来划分用户样本;
数据集模块,用于将获取的用户信用数据以及划分的用户样本得到一个原始的数据集,该数据集包括训练集和测试集;
测试模块,用于在训练集和测试集上实现特征工程,利用在测试集上的效果来衡量最终的表现;
算法选择模块,用于根据实际情况选择算法,算法包括逻辑回归模型和xgboost两种信用评分模型;
信用评分模块,用于选择的信用评分模型根据用户信息对用户进行信用评分。
7.根据权利要求6所述的互联网金融小微贷款的信用风险识别装置,其特征在于,所述用户信用数据包括用户第三方数据,用户个人信息以及一些用户行为数据。
8.根据权利要求6所述的互联网金融小微贷款的信用风险识别装置,其特征在于,所述样本划分模块的用户样本划分标准通过用户信用数据分析得到。
9.根据权利要求6所述的互联网金融小微贷款的信用风险识别装置,其特征在于,全量的数据集通过数据清洗和数据预处理后划分为训练集和测试集。
10.根据权利要求6所述的互联网金融小微贷款的信用风险识别装置,其特征在于,所述信用评分模块的信用评分标准采用AUC评分。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711270176.9A CN107798600A (zh) | 2017-12-05 | 2017-12-05 | 互联网金融小微贷款的信用风险识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711270176.9A CN107798600A (zh) | 2017-12-05 | 2017-12-05 | 互联网金融小微贷款的信用风险识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107798600A true CN107798600A (zh) | 2018-03-13 |
Family
ID=61537491
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711270176.9A Pending CN107798600A (zh) | 2017-12-05 | 2017-12-05 | 互联网金融小微贷款的信用风险识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107798600A (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108648072A (zh) * | 2018-05-18 | 2018-10-12 | 深圳灰猫科技有限公司 | 基于用户信用动态评分的互联网金融放贷风险评估系统 |
CN108648074A (zh) * | 2018-05-18 | 2018-10-12 | 深圳壹账通智能科技有限公司 | 基于支持向量机的贷款评估方法、装置及设备 |
CN108648068A (zh) * | 2018-05-16 | 2018-10-12 | 长沙农村商业银行股份有限公司 | 一种信用风险评估方法及系统 |
CN109191276A (zh) * | 2018-07-18 | 2019-01-11 | 北京邮电大学 | 一种基于强化学习的p2p网络借贷机构风险评估方法 |
CN109255506A (zh) * | 2018-11-22 | 2019-01-22 | 重庆邮电大学 | 一种基于大数据的互联网金融用户贷款逾期预测方法 |
CN109949148A (zh) * | 2019-02-27 | 2019-06-28 | 四川享宇金信金融科技有限公司 | 一种用于金融信贷业务的自动化风控配置系统及方法 |
CN110097430A (zh) * | 2019-05-08 | 2019-08-06 | 厦门正北科技有限公司 | 一种基于人工智能的汽车金融产品智能匹配系统 |
CN110163743A (zh) * | 2019-04-28 | 2019-08-23 | 钛镕智能科技(苏州)有限公司 | 一种基于超参数优化的信用评分方法 |
CN110348722A (zh) * | 2019-07-01 | 2019-10-18 | 百维金科(上海)信息科技有限公司 | 一种基于XGBoost的互联网金融风控模型 |
CN110555148A (zh) * | 2018-05-14 | 2019-12-10 | 腾讯科技(深圳)有限公司 | 一种用户行为评估方法、计算设备及存储介质 |
CN110610099A (zh) * | 2018-06-15 | 2019-12-24 | 上海仪电(集团)有限公司中央研究院 | 基于fpga硬件加速的金融风险智能预警与风控系统 |
CN111768285A (zh) * | 2019-04-01 | 2020-10-13 | 杭州金智塔科技有限公司 | 信贷风控模型构建系统、方法、风控系统及存储介质 |
CN111913994A (zh) * | 2020-08-12 | 2020-11-10 | 武汉众邦银行股份有限公司 | 基于行内数据和外部数据的客户风险数据监测方法 |
CN112085595A (zh) * | 2020-09-27 | 2020-12-15 | 中国建设银行股份有限公司 | 信用评分模型的监控方法及装置 |
CN113177844A (zh) * | 2021-05-28 | 2021-07-27 | 成都新希望金融信息有限公司 | 一种信贷风险预测方法、装置、设备及存储介质 |
-
2017
- 2017-12-05 CN CN201711270176.9A patent/CN107798600A/zh active Pending
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110555148B (zh) * | 2018-05-14 | 2022-12-02 | 腾讯科技(深圳)有限公司 | 一种用户行为评估方法、计算设备及存储介质 |
CN110555148A (zh) * | 2018-05-14 | 2019-12-10 | 腾讯科技(深圳)有限公司 | 一种用户行为评估方法、计算设备及存储介质 |
CN108648068A (zh) * | 2018-05-16 | 2018-10-12 | 长沙农村商业银行股份有限公司 | 一种信用风险评估方法及系统 |
CN108648072A (zh) * | 2018-05-18 | 2018-10-12 | 深圳灰猫科技有限公司 | 基于用户信用动态评分的互联网金融放贷风险评估系统 |
CN108648074A (zh) * | 2018-05-18 | 2018-10-12 | 深圳壹账通智能科技有限公司 | 基于支持向量机的贷款评估方法、装置及设备 |
CN108648074B (zh) * | 2018-05-18 | 2023-06-09 | 深圳壹账通智能科技有限公司 | 基于支持向量机的贷款评估方法、装置及设备 |
CN110610099A (zh) * | 2018-06-15 | 2019-12-24 | 上海仪电(集团)有限公司中央研究院 | 基于fpga硬件加速的金融风险智能预警与风控系统 |
CN109191276A (zh) * | 2018-07-18 | 2019-01-11 | 北京邮电大学 | 一种基于强化学习的p2p网络借贷机构风险评估方法 |
CN109191276B (zh) * | 2018-07-18 | 2021-10-29 | 北京邮电大学 | 一种基于强化学习的p2p网络借贷机构风险评估方法 |
CN109255506A (zh) * | 2018-11-22 | 2019-01-22 | 重庆邮电大学 | 一种基于大数据的互联网金融用户贷款逾期预测方法 |
CN109949148A (zh) * | 2019-02-27 | 2019-06-28 | 四川享宇金信金融科技有限公司 | 一种用于金融信贷业务的自动化风控配置系统及方法 |
CN111768285A (zh) * | 2019-04-01 | 2020-10-13 | 杭州金智塔科技有限公司 | 信贷风控模型构建系统、方法、风控系统及存储介质 |
CN110163743A (zh) * | 2019-04-28 | 2019-08-23 | 钛镕智能科技(苏州)有限公司 | 一种基于超参数优化的信用评分方法 |
CN110097430A (zh) * | 2019-05-08 | 2019-08-06 | 厦门正北科技有限公司 | 一种基于人工智能的汽车金融产品智能匹配系统 |
CN110348722A (zh) * | 2019-07-01 | 2019-10-18 | 百维金科(上海)信息科技有限公司 | 一种基于XGBoost的互联网金融风控模型 |
CN111913994A (zh) * | 2020-08-12 | 2020-11-10 | 武汉众邦银行股份有限公司 | 基于行内数据和外部数据的客户风险数据监测方法 |
CN111913994B (zh) * | 2020-08-12 | 2023-09-15 | 武汉众邦银行股份有限公司 | 基于行内数据和外部数据的客户风险数据监测方法 |
CN112085595A (zh) * | 2020-09-27 | 2020-12-15 | 中国建设银行股份有限公司 | 信用评分模型的监控方法及装置 |
CN113177844A (zh) * | 2021-05-28 | 2021-07-27 | 成都新希望金融信息有限公司 | 一种信贷风险预测方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107798600A (zh) | 互联网金融小微贷款的信用风险识别方法及装置 | |
CN103365867B (zh) | 一种对用户评价进行情感分析的方法和装置 | |
CN103268339B (zh) | 微博消息中命名实体识别方法及系统 | |
CN107038480A (zh) | 一种基于卷积神经网络的文本情感分类方法 | |
CN110188351A (zh) | 语句通顺度及句法评分模型的训练方法及装置 | |
CN103699521B (zh) | 文本分析方法及装置 | |
CN108197109A (zh) | 一种基于自然语言处理的多语言分析方法和装置 | |
CN109034194B (zh) | 基于特征分化的交易欺诈行为深度检测方法 | |
CN107391760A (zh) | 用户兴趣识别方法、装置及计算机可读存储介质 | |
CN108628971A (zh) | 不均衡数据集的文本分类方法、文本分类器及存储介质 | |
CN106445998A (zh) | 一种基于敏感词的文本内容审核方法及系统 | |
CN107291723A (zh) | 网页文本分类的方法和装置,网页文本识别的方法和装置 | |
CN106611052A (zh) | 文本标签的确定方法及装置 | |
CN104750674B (zh) | 一种人机会话满意度预测方法及系统 | |
CN107437038A (zh) | 一种网页篡改的检测方法及装置 | |
CN110225055A (zh) | 一种基于knn半监督学习模型的网络流量异常检测方法与系统 | |
CN106503853A (zh) | 一种基于多标度卷积神经网络的外汇交易预测模型 | |
CN107578270A (zh) | 一种金融标签的构建方法、装置及计算设备 | |
CN109858034A (zh) | 一种基于注意力模型和情感词典的文本情感分类方法 | |
CN110826618A (zh) | 一种基于随机森林的个人信用风险评估方法 | |
CN109614856A (zh) | 基于卷积神经网络的真菌图像分类方法 | |
CN109145282A (zh) | 断句模型训练方法、断句方法、装置及计算机设备 | |
CN106484919A (zh) | 一种基于网页独立词的行业网站分类方法和系统 | |
CN111582450A (zh) | 一种基于参数评价的神经网络模型训练方法及相关装置 | |
CN109948148A (zh) | 一种文本信息情感判定方法和判定装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180313 |
|
RJ01 | Rejection of invention patent application after publication |