CN111311402A - 一种基于XGBoost的互联网金融风控模型 - Google Patents
一种基于XGBoost的互联网金融风控模型 Download PDFInfo
- Publication number
- CN111311402A CN111311402A CN202010237219.9A CN202010237219A CN111311402A CN 111311402 A CN111311402 A CN 111311402A CN 202010237219 A CN202010237219 A CN 202010237219A CN 111311402 A CN111311402 A CN 111311402A
- Authority
- CN
- China
- Prior art keywords
- data
- xgboost
- wind control
- model
- customers
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Technology Law (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明提供了一种基于XGBoost的互联网金融风控模型,以下步骤:S1:抽取合适的建模样本客户;S2:获取样本客户的网贷数据,提取与所述网贷数据对应的特征变量;S3:根据客户的还款行为、目标客群质量以及产品类型对建模样本的“good”和“bad”定义;S4:数据处理,包括脏数据清洗、缺失值处理、异常值处理;S5:特征工程,包括特征构建和特征筛选;S6:数据集划分,随机或跨时间划分训练集、验证集;S7:运用XGBoost算法训练,模型调参;S8:模型评估:根据评估指标评估模型的好坏。一方面,本发明增加使用了第三方数据,增加了风险识别的维度,同时通过预测能力强的XGBoost算法,使得模型算法的效率和健壮性得到优化;另一方面,本发明通过XGBoost算法调参和模型评估不断优化模型的准确性,更加适合大数据风控的需求。
Description
技术领域
本发明涉及互联网金融风控技术领域,特别涉及一种基于XGBoost的互联网金融风控模型。
背景技术
我国国内P2P发展迅速,现金贷、消费信贷等互联网金融如雨后春笋一样涌现出来,但利用大数据的互联网金融风控在国内属于一个相对新的课题,大部分互联网金融公司仍按照传统的美国FICO评分卡模型风控建模。传统的评分卡模型属于线性模型,特点在于因变量和自变量属于线性关系,简单好解释,模型表现稳定,过拟合程度低,容易并行化,可以轻松处理上亿条数据,但由于评分卡模型只能解释变量间的线性关系,学习能力十分有限,所以其需要大量的特征工程来增加模型的学习能力,预测能力也相对较低。
XGboost的全称是eXtreme Gradient Boosting,即极端梯度提升树,是梯度提升机器算法GBDT的扩展,也是boosting算法的其中一种,其可以解释复杂的多维关系,预测能力强,模型在训练数据上可以达到很好的预测表现结果。但是其缺点也很明显,其一是模型内部的逻辑关系像黑盒子一样复杂无法解释,容易出现过拟合现象,这意味着模型在预测数据上或者在实践中的预测能力会下降很快,需要不断的重新更新,稳定性不够;其二是空间消耗大,需要保存数据的特征值和特征排序的结果。
总结来说,传统的评分卡模型和机器学习模型在模型复杂度、预测性、稳定性上是两个极端。由于行业的重要性和特殊性的原因,在信贷金融行业中,对模型的表现稳定性要求要比互联网行业高,所以信贷金融行业仍然使用传统的评分卡模型做为信贷建模的方法。
发明内容
为了解决上述技术问题,本发明中披露了一种基于XGBoost的互联网金融风控模型,本发明的技术方案是这样实施的:
一种基于XGBoost的互联网金融风控模型,包括以下步骤:S1:抽取合适的建模样本客户;S2:获取样本客户的网贷数据,提取与所述网贷数据对应的特征变量;S3:根据客户的还款行为、目标客群质量以及产品类型对建模样本的“good”和“bad”定义;S4:数据处理,包括脏数据清洗、缺失值处理、异常值处理;S5:特征工程,包括特征构建和特征筛选;S6:数据集划分,随机或跨时间划分训练集、验证集;S7:运用XGBoost算法训练,模型调参;S8:模型评估:根据评估指标评估模型的好坏。
进一步地,所述步骤S1包括以下步骤:S101:获取产品的目标客群、准入拒绝率、费率期限、逾期率、滚动率、催收情况;S102:根据评分卡所用的风控节点,选取相关的客户群体,所述风控节点包括贷前申请、贷中监控、贷后管理;S103:排除特定客户,建模样本客户选取日常审批客户,排除非目标客户、白名单客户、欺诈客户、特殊客户;S104:确定样本观察期和样本表现期。
进一步地,所述网贷数据包括人行征信、银行流水、平台申请的个人基本属性数据、客户操作行为数据以及客户授权获取的第三方数据。
进一步地,所述第三方数据包括多头借贷行为、互联网、网上购物、第三方支付、反欺诈。
进一步地,所述特征构建包括以下步骤:
S501:分箱,采用等距分箱或者等频分箱或者卡方分箱或者最小熵法分箱对每个特征变量进行分箱操作;S502:WOE转换,对步骤S501每个特征变量分箱后的每组进行WOE转换,计算公式如下:
式中,WOEi表示第i个分箱的WOE值;#good(i)表示第i个分箱中标签为good的数量;#good(T)表示为所有分箱中good的总数量;#bad(i)表示为第i个分箱为bad的数量;#bad(T)表示为所有分箱中bad的总数量;
S503:根据WOEi求每个特征变量的信息增益值IV和特征变量之间的相关系数CORR,所述信息增益值IV计算公式如下:
进一步地,所述特征筛选包括,根据特征变量的信息增益值IV和相关系数CORR进行特征筛选,相关系数CORR强的变量之间,保留信息增益值IV较大的特征变量。
进一步地,所述步骤S6中数据集划分采用根据样本随机划分的方法或者根据样本的进件时间划分的方法。
进一步地,所述步骤S8中的评估指标包括混淆矩阵、ROC曲线、LIFT、KS以及GINI。
实施本发明的技术方案可解决现有技术的传统评分卡模型预测能力较低,而机器学习模型稳定性不够的问题的技术问题;实施本发明技术方案有以下有益效果:
(1)本发明增加使用了第三方数据,增加了风险识别的维度,同时通过预测能力强的XGBoost算法,使得模型算法的效率和健壮性得到优化;
(2)本发明通过XGBoost算法调参和模型评估不断优化模型的准确性,更加适合大数据风控的需求。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一种实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种基于XGBoost的互联网金融风控模型,结合图所示,包括以下步骤:S1:抽取合适的建模样本客户;S2:获取样本客户的网贷数据,提取与所述网贷数据对应的特征变量;S3:根据客户的还款行为、目标客群质量以及产品类型对建模样本的“good”和“bad”定义;S4:数据处理,包括脏数据清洗、缺失值处理、异常值处理;S5:特征工程,包括特征构建和特征筛选;S6:数据集划分,随机或跨时间划分训练集、验证集;S7:运用XGBoost算法训练,模型调参;S8:模型评估:根据评估指标评估模型的好坏。
在该实施方式中,步骤S4中所述的脏数据清洗中的脏数据是指数据不在给定的范围内或对于实际业务毫无意义的数据,脏数据清洗有利于模型的解释性和实用;所述缺失值处理主要有三种方法:其一,直接删除含有缺失率较大的样本、其二、根据样本之间的相似性填补缺失值、其三根据变量之间的相关关系填补缺失值;所述异常值处理中常见的检测方法包括单变量异常值检测、局部离群值因子检测、基于聚类的离群值检测,将异常值作为一种状态而不参与分箱。
在该实施方式中,所述步骤S7运用XGBoost算法调参中,最重要的3个参数为:其一是booster的参数,booster的参数用于控制每一步的booster,进一步可以选择gbtree或者gbtree或者darf,gbtree和drat是基于树模型,而gblinear是基于线性模型,一般来说我们使用gbtree就可以,不需要调参;其二是 n_estimators,子模型的数量,关系到XGBoost模型的复杂度,一般需要调参选择一个适中的数值;其三是objective,最小化损失函数类型,根据分类还是回归或其他问题对应的损失函数,在回归问题objective一般使用MSE均方误差,二分类问题一般使用binary:logistic,返回预测概率(p(y=1|x,w))。
实施该实施方式,将复杂的理论化的机器学习算法XGBoost应用到传统的评分卡模型中,将传统评分卡模型和更加先进的集成算法的特点融合在一起,得到的风控模型兼具两种模型的优点,同时又弥补了传统评分卡模型作为单模型的缺点。
在一种优选的实施方式中,结合图1所示,前述的步骤S1包括以下步骤:S101:获取产品的目标客群、准入拒绝率、费率期限、逾期率、滚动率、催收情况;S102:根据评分卡所用的风控节点,选取相关的客户群体,所述风控节点包括贷前申请、贷中监控、贷后管理;S103:排除特定客户,建模样本客户选取日常审批客户,排除非目标客户、白名单客户、欺诈客户、特殊客户;S104:确定样本观察期和样本表现期。
在该实施方式中,步骤S104中观察期是指用于生成客户特征的时间区间,用于收集信用历史和行为特征等信息,以提炼能预测未来信用表现的预测变量,若观察期过长可能导致大量客户无法获取相应时间长度的数据,大批样本不能进入模型;观察期过短会导致样本无法生成足够多有效时间切片的变量。
在该实施方式中,步骤S104中样本需要有足够的长度的表现期以保证样本群体分类的稳定性,使客户的逾期行为充分表现出来。但表现期过长会影响完整性(有多少个坏样本需要捕捉)和数据质量之前的平衡。
在一优选的实施方式中,结合图1所示,所述网贷数据包括人行征信、银行流水、平台申请的个人基本属性数据、客户操作行为数据以及客户授权获取的第三方数据。所述第三方数据包括多头借贷行为、互联网、网上购物、第三方支付、反欺诈。
在一种优选的实施方式中,结合图1所示,前述的特征构建包括以下步骤:
S501:分箱,采用卡方分箱对每个特征变量进行分箱操作;
S502:WOE转换,对步骤S501每个特征变量分箱后的每组进行WOE转换,计算公式如下:
式中,WOEi表示第i个分箱的WOE值;#good(i)表示第i个分箱中标签为good的数量;#good(T)表示为所有分箱中good的总数量;#bad(i)表示为第i个分箱为bad的数量;#bad(T)表示为所有分箱中bad的总数量;
S503:根据WOEi求每个特征变量的信息增益值IV和特征变量之间的相关系数CORR,所述信息增益值IV计算公式如下:
在一种优选的实施方式中,前述特征筛选包括,根据特征变量的信息增益值IV和相关系数CORR进行特征筛选,相关系数CORR强的变量之间,保留信息增益值IV较大的特征变量。
在一种优选的实施方式中,结合图1所示,前述的步骤S6中数据集划分采用根据样本随机划分的方法。
在一种优选的实施方式中,结合图1所示,前述的步骤S8中的评估指标包括混淆矩阵、ROC曲线、LIFT、KS以及GINI。
在该实施方式中,所述混淆矩阵是好坏客户模型与真实值构成的矩阵,可以衡量模型区分好坏的能力;所述ROC曲线是根据学习器的预测结果对样例进行排序,按此顺序逐个把样本作为正例进行预测,可以用来评判分类、检测结果的好坏;所述LIFT即是提升指数,指与不同模型相比,模型的预测能力“变好”了多少,如,逻辑回归和GBDT同模型XGBoost下不同参数对比;所述KS是指每个区间的累计好账户数占总好账户数比率(good%)和累计坏账户数占总坏账户数比率(bad%),指标衡量的是好坏样本累计分部之间的差值;所述GINI是衡量坏账户数在好账户数上的累积分布与随机分布曲线之间的面积,好账户与坏账户分布之间的差异越大,GINI指标越高,表明模型的风险区分能力越强。
需要指出的是,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于XGBoost的互联网金融风控模型,其特征在于,包括以下步骤:
S1:抽取合适的建模样本客户;
S2:获取样本客户的网贷数据,提取与所述网贷数据对应的特征变量;
S3:根据客户的还款行为、目标客群质量以及产品类型对建模样本的“good”和“bad”定义;
S4:数据处理,包括脏数据清洗、缺失值处理、异常值处理;
S5:特征工程,包括特征构建和特征筛选;
S6:数据集划分,随机或跨时间划分训练集、验证集;
S7:运用XGBoost算法训练,模型调参;
S8:模型评估:根据评估指标评估模型的好坏。
2.根据权利要求1所述一种基于XGBoost的互联网金融风控模型,其特征在于,所述步骤S1包括以下步骤:
S101:获取产品的目标客群、准入拒绝率、费率期限、逾期率、滚动率、催收情况;
S102:根据评分卡所用的风控节点,选取相关的客户群体,所述风控节点包括贷前申请、贷中监控、贷后管理;
S103:排除特定客户,建模样本客户选取日常审批客户,排除非目标客户、白名单客户、欺诈客户、特殊客户;
S104:确定样本观察期和样本表现期。
3.根据权利要求1所述一种基于XGBoost的互联网金融风控模型,其特征在于,所述网贷数据包括人行征信、银行流水、平台申请的个人基本属性数据、客户操作行为数据以及客户授权获取的第三方数据。
4.根据权利要求3所述一种基于XGBoost的互联网金融风控模型,其特征在于,所述第三方数据包括多头借贷行为、互联网、网上购物、第三方支付、反欺诈。
5.根据权利要求1所述一种基于XGBoost的互联网金融风控模型,其特征在于,所述特征构建包括以下步骤:
S501:分箱,采用等距分箱或者等频分箱或者卡方分箱或者最小熵法分箱对每个特征变量进行分箱操作;
S502:WOE转换,对步骤S501每个特征变量分箱后的每组进行WOE转换,计算公式如下:
式中,WOEi表示第i个分箱的WOE值;#good(i)表示第i个分箱中标签为good的数量;#good(T)表示为所有分箱中good的总数量;#bad(i)表示为第i个分箱为bad的数量;#bad(T)表示为所有分箱中bad的总数量;
S503:根据WOEi求每个特征变量的信息增益值IV和特征变量之间的相关系数CORR,所述信息增益值IV计算公式如下:
6.根据权利要求1所述一种基于XGBoost的互联网金融风控模型,其特征在于,所述特征筛选包括,根据特征变量的信息增益值IV和相关系数CORR进行特征筛选,相关系数CORR强的变量之间,保留信息增益值IV较大的特征变量。
7.根据权利要求1所述一种基于XGBoost的互联网金融风控模型,其特征在于,所述步骤S6中数据集划分采用根据样本随机划分的方法或者根据样本的进件时间划分的方法。
8.根据权利要求1所述一种基于XGBoost的互联网金融风控模型,其特征在于,所述步骤S8中的评估指标包括混淆矩阵、ROC曲线、LIFT、KS以及GINI。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010237219.9A CN111311402A (zh) | 2020-03-30 | 2020-03-30 | 一种基于XGBoost的互联网金融风控模型 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010237219.9A CN111311402A (zh) | 2020-03-30 | 2020-03-30 | 一种基于XGBoost的互联网金融风控模型 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111311402A true CN111311402A (zh) | 2020-06-19 |
Family
ID=71147375
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010237219.9A Withdrawn CN111311402A (zh) | 2020-03-30 | 2020-03-30 | 一种基于XGBoost的互联网金融风控模型 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111311402A (zh) |
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111861729A (zh) * | 2020-07-31 | 2020-10-30 | 重庆富民银行股份有限公司 | 基于lstm的行为评分系统及方法 |
CN111861703A (zh) * | 2020-07-10 | 2020-10-30 | 深圳无域科技技术有限公司 | 数据驱动的风控策略规则生成方法及系统、风险控制方法及系统 |
CN111861705A (zh) * | 2020-07-10 | 2020-10-30 | 深圳无域科技技术有限公司 | 金融风控逻辑回归特征筛选方法及系统 |
CN111899092A (zh) * | 2020-08-28 | 2020-11-06 | 上海冰鉴信息科技有限公司 | 基于二道模型的业务数据筛选方法及装置 |
CN111898675A (zh) * | 2020-07-30 | 2020-11-06 | 北京云从科技有限公司 | 信贷风控模型生成方法、装置、评分卡生成方法、机器可读介质及设备 |
CN112232950A (zh) * | 2020-12-10 | 2021-01-15 | 银联商务股份有限公司 | 针对借贷风险的评估方法及装置、设备、计算机可读存储介质 |
CN112330047A (zh) * | 2020-11-18 | 2021-02-05 | 交通银行股份有限公司 | 一种基于用户行为特征的信用卡还款概率预测方法 |
CN112634023A (zh) * | 2020-12-28 | 2021-04-09 | 四川新网银行股份有限公司 | 一种用于群体性风险监测的早期预警系统及方法 |
CN112749924A (zh) * | 2021-02-01 | 2021-05-04 | 深圳无域科技技术有限公司 | 风控模型训练方法、系统、设备及计算机可读介质 |
CN112749922A (zh) * | 2021-02-01 | 2021-05-04 | 深圳无域科技技术有限公司 | 风控模型训练方法、系统、设备及计算机可读介质 |
CN112766558A (zh) * | 2021-01-13 | 2021-05-07 | 深圳前海微众银行股份有限公司 | 建模样本生成方法、装置、设备及计算机可读存储介质 |
CN113064883A (zh) * | 2020-09-28 | 2021-07-02 | 开鑫金服(南京)信息服务有限公司 | 物流风控模型的构建方法、计算机设备和存储介质 |
CN113177585A (zh) * | 2021-04-23 | 2021-07-27 | 上海晓途网络科技有限公司 | 一种用户分类方法、装置、电子设备及存储介质 |
CN113506167A (zh) * | 2021-07-23 | 2021-10-15 | 北京淇瑀信息科技有限公司 | 基于排序的风险预测方法、装置、设备和介质 |
CN113516398A (zh) * | 2021-07-22 | 2021-10-19 | 北京淇瑀信息科技有限公司 | 基于分层抽样的风险设备识别方法、装置及电子设备 |
CN113538125A (zh) * | 2021-06-29 | 2021-10-22 | 百维金科(上海)信息科技有限公司 | 一种基于萤火虫算法优化Hopfield神经网络的风险评级方法 |
CN113554504A (zh) * | 2021-06-10 | 2021-10-26 | 浙江惠瀜网络科技有限公司 | 一种车贷风控模型生成方法、装置及评分卡生成方法 |
CN113610132A (zh) * | 2021-07-29 | 2021-11-05 | 上海淇玥信息技术有限公司 | 一种用户设备鉴别方法、装置和计算机设备 |
CN113610175A (zh) * | 2021-08-16 | 2021-11-05 | 上海冰鉴信息科技有限公司 | 一种业务策略生成方法、装置及计算机可读存储介质 |
CN113673595A (zh) * | 2021-08-20 | 2021-11-19 | 建信金融科技有限责任公司 | 一种数据处理方法、装置及设备 |
CN113888306A (zh) * | 2021-09-29 | 2022-01-04 | 中国工商银行股份有限公司 | 双轨模型的创建、征信方法、装置、设备、介质和产品 |
CN114240215A (zh) * | 2021-12-22 | 2022-03-25 | 中国建设银行股份有限公司 | 用户失联等级获取方法、装置及存储介质 |
CN114492929A (zh) * | 2021-12-23 | 2022-05-13 | 江南大学 | 一种基于XGboost的金融信贷企业信用预测方法 |
CN115423600A (zh) * | 2022-08-22 | 2022-12-02 | 前海飞算云创数据科技(深圳)有限公司 | 数据筛选方法、装置、介质及电子设备 |
CN115423603A (zh) * | 2022-08-31 | 2022-12-02 | 厦门国际银行股份有限公司 | 一种基于机器学习的风控模型建立方法、系统及存储介质 |
CN116630035A (zh) * | 2023-07-26 | 2023-08-22 | 深圳市企企通科技有限公司 | 基于企业融资的生命周期跟踪方法、装置、设备及介质 |
CN117036008A (zh) * | 2023-10-08 | 2023-11-10 | 中邮消费金融有限公司 | 一种多源数据的自动化建模方法及系统 |
CN117575757A (zh) * | 2023-11-02 | 2024-02-20 | 睿智合创(北京)科技有限公司 | 一种评分卡模型的后台数据监控方法及系统 |
-
2020
- 2020-03-30 CN CN202010237219.9A patent/CN111311402A/zh not_active Withdrawn
Cited By (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111861703B (zh) * | 2020-07-10 | 2024-05-10 | 深圳无域科技技术有限公司 | 数据驱动的风控策略规则生成方法及系统、风险控制方法及系统 |
CN111861703A (zh) * | 2020-07-10 | 2020-10-30 | 深圳无域科技技术有限公司 | 数据驱动的风控策略规则生成方法及系统、风险控制方法及系统 |
CN111861705A (zh) * | 2020-07-10 | 2020-10-30 | 深圳无域科技技术有限公司 | 金融风控逻辑回归特征筛选方法及系统 |
CN111898675B (zh) * | 2020-07-30 | 2021-04-23 | 北京云从科技有限公司 | 信贷风控模型生成方法、装置、评分卡生成方法、机器可读介质及设备 |
CN111898675A (zh) * | 2020-07-30 | 2020-11-06 | 北京云从科技有限公司 | 信贷风控模型生成方法、装置、评分卡生成方法、机器可读介质及设备 |
CN111861729A (zh) * | 2020-07-31 | 2020-10-30 | 重庆富民银行股份有限公司 | 基于lstm的行为评分系统及方法 |
CN111899092A (zh) * | 2020-08-28 | 2020-11-06 | 上海冰鉴信息科技有限公司 | 基于二道模型的业务数据筛选方法及装置 |
CN113064883A (zh) * | 2020-09-28 | 2021-07-02 | 开鑫金服(南京)信息服务有限公司 | 物流风控模型的构建方法、计算机设备和存储介质 |
CN112330047A (zh) * | 2020-11-18 | 2021-02-05 | 交通银行股份有限公司 | 一种基于用户行为特征的信用卡还款概率预测方法 |
CN112232950A (zh) * | 2020-12-10 | 2021-01-15 | 银联商务股份有限公司 | 针对借贷风险的评估方法及装置、设备、计算机可读存储介质 |
CN112634023A (zh) * | 2020-12-28 | 2021-04-09 | 四川新网银行股份有限公司 | 一种用于群体性风险监测的早期预警系统及方法 |
CN112766558A (zh) * | 2021-01-13 | 2021-05-07 | 深圳前海微众银行股份有限公司 | 建模样本生成方法、装置、设备及计算机可读存储介质 |
CN112749922A (zh) * | 2021-02-01 | 2021-05-04 | 深圳无域科技技术有限公司 | 风控模型训练方法、系统、设备及计算机可读介质 |
CN112749924A (zh) * | 2021-02-01 | 2021-05-04 | 深圳无域科技技术有限公司 | 风控模型训练方法、系统、设备及计算机可读介质 |
CN113177585A (zh) * | 2021-04-23 | 2021-07-27 | 上海晓途网络科技有限公司 | 一种用户分类方法、装置、电子设备及存储介质 |
CN113177585B (zh) * | 2021-04-23 | 2024-04-05 | 上海晓途网络科技有限公司 | 一种用户分类方法、装置、电子设备及存储介质 |
CN113554504A (zh) * | 2021-06-10 | 2021-10-26 | 浙江惠瀜网络科技有限公司 | 一种车贷风控模型生成方法、装置及评分卡生成方法 |
CN113538125A (zh) * | 2021-06-29 | 2021-10-22 | 百维金科(上海)信息科技有限公司 | 一种基于萤火虫算法优化Hopfield神经网络的风险评级方法 |
CN113516398A (zh) * | 2021-07-22 | 2021-10-19 | 北京淇瑀信息科技有限公司 | 基于分层抽样的风险设备识别方法、装置及电子设备 |
CN113506167A (zh) * | 2021-07-23 | 2021-10-15 | 北京淇瑀信息科技有限公司 | 基于排序的风险预测方法、装置、设备和介质 |
CN113610132A (zh) * | 2021-07-29 | 2021-11-05 | 上海淇玥信息技术有限公司 | 一种用户设备鉴别方法、装置和计算机设备 |
CN113610175A (zh) * | 2021-08-16 | 2021-11-05 | 上海冰鉴信息科技有限公司 | 一种业务策略生成方法、装置及计算机可读存储介质 |
CN113673595A (zh) * | 2021-08-20 | 2021-11-19 | 建信金融科技有限责任公司 | 一种数据处理方法、装置及设备 |
CN113888306A (zh) * | 2021-09-29 | 2022-01-04 | 中国工商银行股份有限公司 | 双轨模型的创建、征信方法、装置、设备、介质和产品 |
CN114240215A (zh) * | 2021-12-22 | 2022-03-25 | 中国建设银行股份有限公司 | 用户失联等级获取方法、装置及存储介质 |
CN114492929A (zh) * | 2021-12-23 | 2022-05-13 | 江南大学 | 一种基于XGboost的金融信贷企业信用预测方法 |
CN115423600B (zh) * | 2022-08-22 | 2023-08-04 | 前海飞算云创数据科技(深圳)有限公司 | 数据筛选方法、装置、介质及电子设备 |
CN115423600A (zh) * | 2022-08-22 | 2022-12-02 | 前海飞算云创数据科技(深圳)有限公司 | 数据筛选方法、装置、介质及电子设备 |
CN115423603A (zh) * | 2022-08-31 | 2022-12-02 | 厦门国际银行股份有限公司 | 一种基于机器学习的风控模型建立方法、系统及存储介质 |
CN116630035A (zh) * | 2023-07-26 | 2023-08-22 | 深圳市企企通科技有限公司 | 基于企业融资的生命周期跟踪方法、装置、设备及介质 |
CN117036008A (zh) * | 2023-10-08 | 2023-11-10 | 中邮消费金融有限公司 | 一种多源数据的自动化建模方法及系统 |
CN117036008B (zh) * | 2023-10-08 | 2024-06-18 | 中邮消费金融有限公司 | 一种多源数据的自动化建模方法及系统 |
CN117575757A (zh) * | 2023-11-02 | 2024-02-20 | 睿智合创(北京)科技有限公司 | 一种评分卡模型的后台数据监控方法及系统 |
CN117575757B (zh) * | 2023-11-02 | 2024-07-19 | 睿智合创(北京)科技有限公司 | 一种评分卡模型的后台数据监控方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111311402A (zh) | 一种基于XGBoost的互联网金融风控模型 | |
Keramati et al. | A proposed classification of data mining techniques in credit scoring | |
Bilal Zorić | Predicting customer churn in banking industry using neural networks | |
Mukid et al. | Credit scoring analysis using weighted k nearest neighbor | |
CN110866819A (zh) | 一种基于元学习的自动化信贷评分卡生成方法 | |
CN111401600A (zh) | 基于关联关系的企业信用风险评价方法和系统 | |
AU2018101523A4 (en) | A personal credit scoring model based on machine learning method | |
AU2020100708A4 (en) | A prediction method of defaulters of bank loans based on big data mining | |
Kirkos et al. | Identifying qualified auditors' opinions: a data mining approach | |
CN112700324A (zh) | 基于CatBoost与受限玻尔兹曼机结合的用户借贷违约预测方法 | |
CN104850868A (zh) | 一种基于k-means和神经网络聚类的客户细分方法 | |
CN110930038A (zh) | 一种贷款需求识别方法、装置、终端及存储介质 | |
Sasank et al. | Credit card fraud detection using various classification and sampling techniques: a comparative study | |
Qiu et al. | Credit risk scoring analysis based on machine learning models | |
Li et al. | A new oversampling method and improved radial basis function classifier for customer consumption behavior prediction | |
Raffinot et al. | Investing through economic cycles with ensemble machine learning algorithms | |
Yang | Research on financial credit evaluation and early warning system of internet of things driven by computer-aided technology | |
CN115205011A (zh) | 基于lsf-fc算法的银行用户画像模型生成方法 | |
CN114021612A (zh) | 一种新型个人信用评估方法及系统 | |
Moslehi et al. | Analyzing and investigating the use of electronic payment tools in Iran using data mining techniques | |
Hu | Overdue invoice forecasting and data mining | |
CN116821688A (zh) | 基于聚类下采样技术处理信用卡欺诈交易中数据集的方法 | |
CN107977804B (zh) | 一种保兑仓业务风险评估方法 | |
CN113822751A (zh) | 一种线上贷款的风险预测方法 | |
Sinaga et al. | Optimization of SV-kNNC using Silhouette Coefficient and LMKNN for Stock Price Prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20200619 |