CN109344998A - 一种基于医疗美容场景的客户违约概率预测方法 - Google Patents

一种基于医疗美容场景的客户违约概率预测方法 Download PDF

Info

Publication number
CN109344998A
CN109344998A CN201811036983.9A CN201811036983A CN109344998A CN 109344998 A CN109344998 A CN 109344998A CN 201811036983 A CN201811036983 A CN 201811036983A CN 109344998 A CN109344998 A CN 109344998A
Authority
CN
China
Prior art keywords
data
model
information
user
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811036983.9A
Other languages
English (en)
Inventor
韦虎
李若焱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yingying (hangzhou) Network Technology Co Ltd
Original Assignee
Yingying (hangzhou) Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yingying (hangzhou) Network Technology Co Ltd filed Critical Yingying (hangzhou) Network Technology Co Ltd
Priority to CN201811036983.9A priority Critical patent/CN109344998A/zh
Publication of CN109344998A publication Critical patent/CN109344998A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms

Abstract

本发明公开了一种基于医疗美容场景的客户违约概率预测方法。本发明包括如下步骤:步骤1、确认影响客户违约因素;步骤2、特征的采集、转化、量化和存储;步骤3、构建模型进行迭代及运算;步骤1所述的确认影响客户违约因素,其中影响因素包括客户基本信息与第三方信息两大类;步骤3所述的构建模型进行迭代及运算包括建立特征工程、建立模型和采用XGBoost算法预测客户违约概率。本发明结合目前最新的机器学习算法,对客户违约概率进行评估,并取得了良好的效果。

Description

一种基于医疗美容场景的客户违约概率预测方法
技术领域
本发明是基于女性群体在医疗美容分期信贷申请过程填写的个人基础信息、设备信息,结合运营商、第三方平台征信、电商等数据,运用相关性特征挖掘技术,通过XGBOOST算法提供一种基于医疗美容场景的客户违约概率预测方法。
背景技术
有医美服务和消费分期需求的丽人群体、力求降低用户使用成本及获客成本的医疗美容机构和依托医美机构推荐来拓展其分期业务的消费金融平台,三者共同构成了医美消费金融产业生态圈。在医疗美容市场远未达到饱和、正处于黄金发展期的同时,医美分期面临的头号难题仍然是反欺诈。而仅基于借款申请用户提交的信息预测违约概率是远远不够的,我们采用更主动的方式,基于多维度数据包括运营商数据、第三方数据、电商报告等梳理用户人群画像,判断每一笔进件为欺诈或逾期风险的可能性。依托高可用分布式大数据集群平台,进行实时的数据采集、处理与计算,快速获取丽人用户各类历史信息,结合机器学习中强大的集成学习算法,精准预判每个丽人用户的信用状况,解决了该群体信用评估难的问题。大数据规模、高维度、实时性与精准评分,成为我们的最大优势。
发明内容
本发明的目的是为解决丽人用户信用评估准确性的问题,提供一种基于医疗美容场景的客户违约概率预测方法。本发明通过采集用户基础信息、运营商信息以及第三方数据信息(包括风险评分、多头借贷、终端使用情况等等),对可能影响其违约的特征进行提取、转换、定性和量化计算,并结合XGBOOST算法,分步骤构建违约模型并进行实例验证。
本发明解决其技术问题所采用的技术方案包括如下步骤:
步骤1、用户违约因素的确认。
步骤2、构建模型进行迭代及运算。
步骤3、效果验证。
步骤1所述用户违约因素的确认,具体实现如下:
将影响用户逾期的特征分为两大类:基础信息和第三方数据信息;
1.1基础信息
基础信息包括申请人基本数据、申请设备数据以及衍生数据;申请人基本数据是指用户在申请贷款过程中填写的个人信息,包括年龄、申请项目金额、手术项目类型、医疗机构信息、借款金额、借款期限、申请地、户籍地;申请设备数据包括申请设备名称、系统、版本、设备id;衍生数据包括申请人户籍地GDP排名、申请地GPD排名、申请地与户籍地是否一致。
1.2第三方数据信息
①用户在其他借贷平台的申请借贷信息,包括个体在其他多个平台提出的借贷申请或是已借款的相关信息;
②用户常用APP活跃度信息;
③用户各类信用评分信息;
基于第三方数据公司获取用户群体在其它多个平台的借贷申请或已借款的相关信息,包括个人信息核查、不良信息扫描、多平台借贷申请、信贷逾期信息和司法不良记录。
基于用户申请时使用的终端设备,借助第三方平台获取终端设备相关信息。
基于用户申请注册用的手机号码,借助第三方平台获取手机号运营商信息。
基于用户申请注册用的姓名、手机和身份证,借助第三方平台获取用户的信用评分信息。
步骤2所述的构建模型进行迭代及运算,具体实现如下:
2-1.特征工程:
①清洗异常数据、异常样本:若采集的数据样本60%以上的特征数据为空,则剔除该样本;获取新的数据集Ⅰ;
所述的数据样本是指步骤中采集到的基础信息或通过第三方采集到的数据信息;
②针对数据集Ⅰ中的缺失值,采用随机森林插补法填充,获取数据集Ⅱ;
③特征筛选:首先将数据集Ⅱ中的所有数据进行IV值计算,将其中IV值小于设定值的数据进行删除,获得数据集Ⅲ;
④基于随机森林学习模型的特征排序(Model based ranking),对数据集Ⅲ进行排序,获取数据集Ⅳ,对数据集Ⅳ中特征重要性小于0.01的特征删除,获取数据集Ⅴ;
⑤最后利用降噪自编码器对数据集Ⅴ中的数据提取隐含特征;
2-2.构建模型
2-2-1.模型训练说明
①.基于原始特征和特征工程步成的隐含特征,采用多种特征组合构建模型,通过模型参数的调整最终选择最优模型;
所述的原始特征包括基础信息和第三方信息中的特征;
②.将所有样本的70%作为模型的训练集,用于模型训练;30%作为模型的测试集,用于评估模型的训练结果;
③.利用XGBOOST模型对样本进行训练,通过不断的迭代调参,得到模型的ROC曲线、AUC值和特征重要性;
2-2-2.建模流程:
在booster模型上选择效果更佳的树模型,学习目标上采用二分类的逻辑回归问题,损失函数如下:
公式说明:—表示预测用户逾期的概率
yi—表示用户实际是否逾期。
2.根据权利要求1所述的一种基于医疗美容场景的客户违约概率预测方法,其特征在于步骤3所述的效果验证,具体实现如下:
3-1.模型采用的评估指标
采用了最常见的AUC和KS值作为模型的评估指标;
3-1-1.AUC值
AUC值其实是ROC曲线下的面积,ROC曲线横轴是FPR(假阳率),纵轴是TPR(正阳率),这2指标的计算公式如下:
FPR=FP/(FP+TN)
TPR=TP/(TP+FN)
其中:
TP:预测类别是P(正例),真实类别也是P
FN:预测类别是N,真实类别是P
FP:预测类别是P,真实类别是N(反例)
TN:预测类别是N,真实类别也是N
AUC值介于0.1和1之间,AUC作为数值能够直观的评价分类器的好坏,值越大越好,计算公式参照如下:
公式说明:
M-正类样本的数目N-负类样本的数据
Rank-对预测的score从大到小排序,然后令最大score对应的样本的rank为n,第二大score对应的样本的rank为n-1,以此类推;
3-1-2.KS值
KS(洛伦兹曲线)-用于区分预测正负样本分隔程度的评价指标,计算公式如下:KS=MAX(TPR-FPR);
3-2.模型验证结果
其主要参数设置如下:
1.learning_rate(学习率):0.09,
2.max_depth(最大树深):3,
3.n_estimators(迭代轮数):150,
4.gamma(用于控制是否后剪枝的参数):5,
5.reg_lambda(控制模型L2正则化项参数):5,
6.reg_alpha(控制模型L1正则化项参数):5,
7.subsample(训练模型的子样本占整个样本集合的比例):0.8,
8.colsample_bytree(列采样):0.8
模型表现如下:
本发明有益效果如下:
本发明依托分布式大数据集群平台,进行实时的数据采集、处理与计算,快速获取丽人客户各类历史信息,结合机器学习中强大的集成学习算法,精准预判每个丽人客户的信用状况,解决了该群体信用评估难的问题。本发明中的大数据规模、高维度、实时性与精准评分是本发明最大优势。
附图说明
图1为本发明模型ROC曲线;
图2为本发明模型分位图;
图3为本发明正负样本分布图;
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
一种基于医疗美容场景的客户违约概率预测方法,包括如下步骤:
步骤1、用户违约因素的确认。
步骤2、构建模型进行迭代及运算。
步骤3、效果验证。
步骤1所述用户违约因素的确认,具体实现如下:
将影响用户逾期的特征大致分为两大类,基础信息和第三方数据信息。
1.1基础信息
基础信息包括申请人基本数据、申请设备数据以及衍生数据;申请人基本数据是指用户在申请贷款过程中填写的个人信息,包括年龄、申请项目金额、手术项目类型、医疗机构信息、借款金额、借款期限、申请地、户籍地等;申请设备数据包括申请设备名称、系统、版本、设备id等;衍生数据包括申请人户籍地GDP排名、申请地GPD排名、申请地与户籍地是否一致数据等,具体参看表1。其中身份证户籍地区、申请地GDP情况是根据该地区于2017年人均GDP的全国排名,将此排名作为特征项加入模型中。
表1基础信息
1.3第三方数据信息
①用户在其他借贷平台的申请借贷信息,包括个体在其他多个平台提出的借贷申请或是已借款的相关信息。
②用户常用APP活跃度信息。
③用户的各类信用评分信息。
基于第三方数据公司服务的数千家互联网金融机构,获取到用户群体在其它多个平台的借贷申请或已借款的相关信息,包括个人信息核查、不良信息扫描、多平台借贷申请、信贷逾期信息和司法不良记录等,从而有效甄别高风险人群,其具体内容如表2:
表2第三方借贷信息
基于用户申请时使用的终端设备,借助第三方平台获取终端设备相关信息,具体内容如表3:
表3第三方设备活跃度信息
基于用户申请注册用的手机号码,借助第三方平台获取手机号运营商信息,具体内容如表4:
表4第三方运营商数据信息
基于用户申请注册用的姓名、手机和身份证,借助第三方平台获取的用户的信用信息,具体内容如表5:
表5第三方数据信用信息
第三方信息的获取进一步拓宽了丽人用户的属性维度,提高违约模型的准确度和识别度。
步骤2构建模型进行迭代及运算,具体实现如下:
2-1.特征工程:
①清洗异常数据、异常样本:若采集的数据样本60%以上的特征数据为空,则剔除该样本;获取新的数据集Ⅰ;
所述的数据样本是指步骤中采集到的基础信息或通过第三方采集到的数据信息。
②针对数据集Ⅰ中的缺失值,采用随机森林插补法填充,获取数据集Ⅱ;
③特征筛选:首先将数据集Ⅱ中的所有数据进行IV值计算,将其中IV值小于设定值的数据进行删除,获得数据集Ⅲ;
④基于随机森林学习模型的特征排序(Model based ranking),对数据集Ⅲ进行排序,获取数据集Ⅳ,对数据集Ⅳ中特征重要性小于0.01的特征删除,获取数据集Ⅴ;
⑤最后利用降噪自编码器对数据集Ⅴ中的数据提取隐含特征,隐含特征为20个维度,原始输入为59个维度。
每次用以信用评分模型构建的样本都是基于已经满足之前信用评分审核标准的用户,对于审核不通过的用户,其特征信息都无法获取。自编码器是一种很好的无标签样本特征提取技术,本项目里使用该技术利用全量的申请用户提取共有的模式。降噪自编码器是一种自监督的模型可理解为一个试图去还原其原始输入的系统。
自编码器可以恢复原始信号的表达,但并不是最好的,能够对含有噪声的信息进行编码、解码,并恢复真正的原始数据,这样的特征才是好的,所以我们在原始数据基础上加入高斯噪声,对某些空缺数据直接填充为均值,然后再进行编码、解码,监督训练的误差为:
公式说明:N-每批次训练的样本量
yi-原始输入
-解码后的输出。
2-2.构建模型
2-2-1.模型训练说明
①.基于原始特征和特征工程步成的隐含特征,本项目采用多种特征组合构建模型,通过模型参数的不同的调整最终选择最优模型。
所述的原始特征包括基础信息和第三方信息中的特征;
②.将所有样本的70%作为模型的训练集,用于模型训练;30%作为模型的测试集,用于评估模型的训练结果。
③.利用XGBOOST模型对样本进行训练,通过不断的迭代调参,得到模型的ROC曲线、AUC值和特征重要性。
2-2-2.建模流程:
在booster模型上选择效果更佳的树模型(gbtree),学习目标上采用二分类的逻辑回归问题,损失函数如下:
公式说明:—表示预测用户逾期的概率
yi—表示用户实际是否逾期
XGBOOST算法的全称是eXtreme Gradient Boosting,其在GBDT算法基础上对boosting算法进行改进。XGBOOST是Gradient Boosting算法的高效实现。传统GBDT以CART作为基分类器,特指梯度提升决策树算法,而XGBOOST还支持线性分类器(GBLinear),此时XGBOOST相当于带L1和L2正则化项的Logistic回归(分类问题)或者线性回归(回归问题)。本发明预测用户的逾期概率,属于典型的分类问题,学习目标上采用二分类的逻辑回归。
如图1-3所示,步骤3所述的效果验证,具体实现如下:
3-1.模型采用的评估指标
采用了最常见的AUC和KS值作为模型的评估指标。
3-1-1.AUC值
AUC值其实是ROC曲线下的面积,ROC曲线横轴是FPR(假阳率),纵轴是TPR(正阳率),这2指标的计算公式如下:
FPR=FP/(FP+TN)
TPR=TP/(TP+FN)
其中:
TP:预测类别是P(正例),真实类别也是P
FN:预测类别是N,真实类别是P
FP:预测类别是P,真实类别是N(反例)
TN:预测类别是N,真实类别也是N
AUC值介于0.1和1之间,AUC作为数值可以直观的评价分类器的好坏,值越大越好,计算公式可以参照如下:
公式说明:
M-正类样本的数目N-负类样本的数据
Rank-对预测的score从大到小排序,然后令最大score对应的sample的rank为n,第二大score对应sample的rank为n-1,以此类推
3-1-2.KS值
KS(洛伦兹曲线)-用于区分预测正负样本分隔程度的评价指标,计算公式如下:KS=MAX(TPR-FPR)。
3-2.模型验证结果
其主要参数设置如下:
1.learning_rate(学习率):0.09,
2.max_depth(最大树深):3,
3.n_estimators(迭代轮数):150,
4.gamma(用于控制是否后剪枝的参数):5,
5.reg_lambda(控制模型L2正则化项参数):5,
6.reg_alpha(控制模型L1正则化项参数):5,
7.subsample(训练模型的子样本占整个样本集合的比例):0.8,
8.colsample_bytree(列采样):0.8
模型表现如下:

Claims (3)

1.一种基于医疗美容场景的客户违约概率预测方法,其特征在于包括如下步骤:
步骤1、用户违约因素的确认;
步骤2、构建模型进行迭代及运算;
步骤3、效果验证;
步骤1所述用户违约因素的确认,具体实现如下:
将影响用户逾期的特征分为两大类:基础信息和第三方数据信息;
1.1基础信息
基础信息包括申请人基本数据、申请设备数据以及衍生数据;申请人基本数据是指用户在申请贷款过程中填写的个人信息,包括年龄、申请项目金额、手术项目类型、医疗机构信息、借款金额、借款期限、申请地、户籍地;申请设备数据包括申请设备名称、系统、版本、设备id;衍生数据包括申请人户籍地GDP排名、申请地GPD排名、申请地与户籍地是否一致,具体参看表1;其中身份证户籍地区、申请地GDP情况是根据该地区于2017年人均GDP的全国排名,将此排名作为特征项加入模型中;
表1 基础信息
1.2第三方数据信息
①用户在其他借贷平台的申请借贷信息,包括个体在其他多个平台提出的借贷申请或是已借款的相关信息;
②用户常用APP活跃度信息;
③用户各类信用评分信息;
基于第三方数据公司获取用户群体在其它多个平台的借贷申请或已借款的相关信息,包括个人信息核查、不良信息扫描、多平台借贷申请、信贷逾期信息和司法不良记录,其具体内容如表2:
表2 第三方借贷信息
基于用户申请时使用的终端设备,借助第三方平台获取终端设备相关信息,具体内容如表3:
表3 第三方设备活跃度信息
基于用户申请注册用的手机号码,借助第三方平台获取手机号运营商信息,具体内容如表4:
表4 第三方运营商数据信息
基于用户申请注册用的姓名、手机和身份证,借助第三方平台获取用户的信用评分信息,具体内容如表5:
表5 第三方数据信用信息
2.根据权利要求1所述的一种基于医疗美容场景的客户违约概率预测方法,其特征在于步骤2所述的构建模型进行迭代及运算,具体实现如下:
2-1.特征工程:
①清洗异常数据、异常样本:若采集的数据样本60%以上的特征数据为空,则剔除该样本;获取新的数据集I;
所述的数据样本是指步骤中采集到的基础信息或通过第三方采集到的数据信息;
②针对数据集I中的缺失值,采用随机森林插补法填充,获取数据集Ⅱ;
③特征筛选:首先将数据集Ⅱ中的所有数据进行IV值计算,将其中IV值小于设定值的数据进行删除,获得数据集Ⅲ;
④基于随机森林学习模型的特征排序(Model based ranking),对数据集Ⅲ进行排序,获取数据集Ⅳ,对数据集Ⅳ中特征重要性小于0.01的特征删除,获取数据集Ⅴ;
⑤最后利用降噪自编码器对数据集Ⅴ中的数据提取隐含特征;
2-2.构建模型
2-2-1.模型训练说明
①.基于原始特征和特征工程步成的隐含特征,采用多种特征组合构建模型,通过模型参数的调整最终选择最优模型;
所述的原始特征包括基础信息和第三方信息中的特征;
②.将所有样本的70%作为模型的训练集,用于模型训练;30%作为模型的测试集,用于评估模型的训练结果;
③.利用XGBOOST模型对样本进行训练,通过不断的迭代调参,得到模型的ROC曲线、AUC值和特征重要性;
2-2-2.建模流程:
在booster模型上选择效果更佳的树模型,学习目标上采用二分类的逻辑回归问题,损失函数如下:
公式说明:—表示预测用户逾期的概率
yi—表示用户实际是否逾期。
3.根据权利要求2所述的一种基于医疗美容场景的客户违约概率预测方法,其特征在于步骤3所述的效果验证,具体实现如下:
3-1.模型采用的评估指标
采用了最常见的AUC和KS值作为模型的评估指标;
3-1-1.AUC值
AUC值其实是ROC曲线下的面积,ROC曲线横轴是FPR(假阳率),纵轴是TPR(正阳率),这2指标的计算公式如下:
FPR=FP/(FP+TN)
TPR=TP/(TP+FN)
其中:
TP:预测类别是P(正例),真实类别也是P
FN:预测类别是N,真实类别是P
FP:预测类别是P,真实类别是N(反例)
TN:预测类别是N,真实类别也是N
AUC值介于0.1和1之间,AUC作为数值能够直观的评价分类器的好坏,值越大越好,计算公式参照如下:
公式说明:
M-正类样本的数目N-负类样本的数据
Rank-对预测的score从大到小排序,然后令最大score对应的样本的rank为n,第二大score对应的样本的rank为n-1,以此类推;
3-1-2.KS值
KS(洛伦兹曲线)-用于区分预测正负样本分隔程度的评价指标,计算公式如下:KS=MAX(TPR-FPR);
3-2.模型验证结果
其主要参数设置如下:
1.learning_rate(学习率):0.09,
2.max_depth(最大树深):3,
3.n_estimators(迭代轮数):150,
4.gamma(用于控制是否后剪枝的参数):5,
5.reg_lambda(控制模型L2正则化项参数):5,
6.reg_alpha(控制模型L1正则化项参数):5,
7.subsample(训练模型的子样本占整个样本集合的比例):0.8,
8.colsample_bytree(列采样):0.8
模型表现如下:
CN201811036983.9A 2018-09-06 2018-09-06 一种基于医疗美容场景的客户违约概率预测方法 Pending CN109344998A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811036983.9A CN109344998A (zh) 2018-09-06 2018-09-06 一种基于医疗美容场景的客户违约概率预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811036983.9A CN109344998A (zh) 2018-09-06 2018-09-06 一种基于医疗美容场景的客户违约概率预测方法

Publications (1)

Publication Number Publication Date
CN109344998A true CN109344998A (zh) 2019-02-15

Family

ID=65292374

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811036983.9A Pending CN109344998A (zh) 2018-09-06 2018-09-06 一种基于医疗美容场景的客户违约概率预测方法

Country Status (1)

Country Link
CN (1) CN109344998A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110135628A (zh) * 2019-04-23 2019-08-16 上海淇玥信息技术有限公司 一种金融策略自动生成方法、装置、系统和记录介质
CN110675243A (zh) * 2019-08-30 2020-01-10 北京银联金卡科技有限公司 一种融合机器学习的信贷预测逾期方法及系统
CN110728301A (zh) * 2019-09-09 2020-01-24 北京镭文科技有限公司 一种个人用户的信用评分方法、装置、终端及存储介质
CN111861716A (zh) * 2020-07-23 2020-10-30 北京睿知图远科技有限公司 一种基于软件系统的贷中监控预警等级生成方法
CN111861099A (zh) * 2020-06-02 2020-10-30 光之树(北京)科技有限公司 联邦学习模型的模型评估方法及装置
CN112016932A (zh) * 2020-09-04 2020-12-01 中国银联股份有限公司 测试方法、装置、服务器及介质
CN112419045A (zh) * 2020-11-25 2021-02-26 苏州大学 基于过采样与随机森林的不平衡信贷用户分类方法
CN112862298A (zh) * 2020-07-09 2021-05-28 北京睿知图远科技有限公司 一种针对用户画像的信用评估方法
CN112950231A (zh) * 2021-03-19 2021-06-11 广州瀚信通信科技股份有限公司 一种基于XGBoost算法的异常用户识别方法、设备及计算机可读存储介质
CN113011624A (zh) * 2019-12-18 2021-06-22 中移(上海)信息通信科技有限公司 用户违约预测方法、装置、设备及介质
CN112016932B (zh) * 2020-09-04 2024-05-17 中国银联股份有限公司 测试方法、装置、服务器及介质

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110135628A (zh) * 2019-04-23 2019-08-16 上海淇玥信息技术有限公司 一种金融策略自动生成方法、装置、系统和记录介质
CN110675243A (zh) * 2019-08-30 2020-01-10 北京银联金卡科技有限公司 一种融合机器学习的信贷预测逾期方法及系统
CN110728301A (zh) * 2019-09-09 2020-01-24 北京镭文科技有限公司 一种个人用户的信用评分方法、装置、终端及存储介质
CN113011624A (zh) * 2019-12-18 2021-06-22 中移(上海)信息通信科技有限公司 用户违约预测方法、装置、设备及介质
CN111861099A (zh) * 2020-06-02 2020-10-30 光之树(北京)科技有限公司 联邦学习模型的模型评估方法及装置
CN112862298A (zh) * 2020-07-09 2021-05-28 北京睿知图远科技有限公司 一种针对用户画像的信用评估方法
CN112862298B (zh) * 2020-07-09 2024-02-27 北京睿知图远科技有限公司 一种针对用户画像的信用评估方法
CN111861716A (zh) * 2020-07-23 2020-10-30 北京睿知图远科技有限公司 一种基于软件系统的贷中监控预警等级生成方法
CN112016932A (zh) * 2020-09-04 2020-12-01 中国银联股份有限公司 测试方法、装置、服务器及介质
CN112016932B (zh) * 2020-09-04 2024-05-17 中国银联股份有限公司 测试方法、装置、服务器及介质
CN112419045A (zh) * 2020-11-25 2021-02-26 苏州大学 基于过采样与随机森林的不平衡信贷用户分类方法
CN112950231A (zh) * 2021-03-19 2021-06-11 广州瀚信通信科技股份有限公司 一种基于XGBoost算法的异常用户识别方法、设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN109344998A (zh) 一种基于医疗美容场景的客户违约概率预测方法
CN108665159A (zh) 一种风险评估方法、装置、终端设备及存储介质
CN112862298B (zh) 一种针对用户画像的信用评估方法
CN108898476A (zh) 一种贷款客户信用评分方法和装置
CN112819604A (zh) 基于融合神经网络特征挖掘的个人信用评估方法与系统
JP2003526139A (ja) 抱き合わせ販売マーケティング・キャンペーンの正味現在価値を最適化するための方法
CN112561598A (zh) 基于客户画像的客户流失预测及挽回方法和系统
CN105094572B (zh) 菜单自调整滚屏显示控制方法、服务器及便携式终端
CN107240033A (zh) 一种电力识别模型的构建方法及系统
CN112417294A (zh) 一种基于神经网络挖掘模型的业务智能推荐方法
CN113256315A (zh) 一种客户关系管理系统及方法
Gao et al. Style-adaptive photo aesthetic rating via convolutional neural networks and multi-task learning
CN106997371B (zh) 单用户智慧图谱的构建方法
CN111061948A (zh) 一种用户标签推荐方法、装置、计算机设备及存储介质
CN111062602A (zh) 企业信用风险评估的方法、装置及存储介质
CN114154672A (zh) 一种用于客户流失预测的数据挖掘方法
CN111813893B (zh) 基于深度迁移学习的房地产市场分析方法、装置及设备
CN116342255A (zh) 互联网消费贷反欺诈风险识别方法及系统
CN109978300B (zh) 客户风险承受力量化方法及系统、资产配置方法及系统
CN111986018A (zh) 基于预定催收系统的账单催收方法、装置及电子设备
CN110232154A (zh) 基于随机森林的产品推荐方法、装置及介质
CN114240633A (zh) 信贷风险评估方法、系统、终端设备及存储介质
CN114626940A (zh) 数据分析方法、装置及电子设备
CN109635289A (zh) 词条分类方法及审计信息抽取方法
CN112001760B (zh) 潜在用户挖掘方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190215

WD01 Invention patent application deemed withdrawn after publication