CN108876193A - 一种基于信用分的风控模型构建方法 - Google Patents

一种基于信用分的风控模型构建方法 Download PDF

Info

Publication number
CN108876193A
CN108876193A CN201810770190.3A CN201810770190A CN108876193A CN 108876193 A CN108876193 A CN 108876193A CN 201810770190 A CN201810770190 A CN 201810770190A CN 108876193 A CN108876193 A CN 108876193A
Authority
CN
China
Prior art keywords
user
data
air control
credit score
control model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810770190.3A
Other languages
English (en)
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Enjoy Financial Service Outsourcing Co Ltd Yu Jinxin
Original Assignee
Sichuan Enjoy Financial Service Outsourcing Co Ltd Yu Jinxin
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Enjoy Financial Service Outsourcing Co Ltd Yu Jinxin filed Critical Sichuan Enjoy Financial Service Outsourcing Co Ltd Yu Jinxin
Priority to CN201810770190.3A priority Critical patent/CN108876193A/zh
Publication of CN108876193A publication Critical patent/CN108876193A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Abstract

本发明公开了一种基于信用分的风控模型构建方法,其包括:获取与金融领域的行为特征相匹配的原始数据;对原始数据进行清洗得到13张表单;在数据库中构建加密的数据特区,将13张表单传输至数据特区;在数据特区中对13张表单从用户行为属性中提取用户的行为特征,通过六度空间理论、灰色理论对行为特征进行加工得到88个特征变量;建立专家经验模型,根据用户的金融数据以及88个特征变量对专家经验模型进行优化得到风控模型以及信用分评判体系;根据风控模型、信用分评判体系和预设策略对用户的信用进行风控判断生成风控报告和信用分,并利用信用分对用户进行授信。本发明能够帮助传统运营商实现数据从研究到应用的价值变现。

Description

一种基于信用分的风控模型构建方法
技术领域
本发明涉及风险评估技术领域,尤其是一种基于信用分的风控模型构建方法。
背景技术
目前金融机构大多数依然采用传统的风控模型进行风控评估,无法快速对用户行为画像。传统金融机构对优质数据及风控模型有着一致的需求,然而市面上不少同类公司均采用爬虫获取运营商数据,数据质量无法保证,数据合规性存在风险。
发明内容
本发明的发明目的在于:针对上述存在的问题,提供一种基于信用分的风控模型构建方法,能够帮助传统运营商实现数据从研究到应用的价值变现。
为解决上述技术问题,本发明采用的一个技术方案是:提供一种基于信用分的风控模型构建方法,包括以下步骤:从用户的移动通讯行为数据中获取与金融领域的行为特征相匹配的原始数据;对所述原始数据进行清洗,并将清洗后的原始数据汇总成13张表单;在数据库中构建加密的数据特区,将所述13张表单通过加密传输方式传输至所述数据特区;在所述数据特区中对所述13张表单从用户行为属性中提取用户的行为特征,并通过六度空间理论、灰色理论对所述行为特征进行加工得到用户的与金融领域相关的88个特征变量;建立专家经验模型,根据金融机构反馈的用户的金融数据以及88个特征变量对专家经验模型进行优化得到风控模型以及运用特定算法构建表现用户情况的信用分评判体系;根据所述风控模型、信用分评判体系和预设策略对用户的信用进行风控判断生成风控报告和信用分,并利用所述信用分对用户进行授信。
优选的,所述对所述原始数据进行清洗的步骤为:捕获所述原始数据中的空值字段,将所述空值字段加载或替换为特定数据。
优选的,所述对所述原始数据进行清洗的步骤为:将所述原始数据中的字段格式转换为预定义格式。
优选的,所述对所述原始数据进行清洗的步骤为:依据业务需求对所述原始数据中的字段进行分解;对分解后的字段进行数据验证。
优选的,所述对所述原始数据进行清洗的步骤为:依据业务需求将无效数据、缺失数据替换为特定数据。
优选的,所述通过六度空间理论、灰色理论对所述行为特征进行加工得到用户的与金融领域相关的88个特征变量的步骤包括:对用户联系最为紧密的6个人进行画像描述;根据画像描述结果从不同侧面反映用户的多项核心行为特征。
优选的,所述通过六度空间理论、灰色理论对所述行为特征进行加工得到用户的与金融领域相关的88个特征变量的步骤还包括:对用户的部分已知信息的逻辑加工;根据逻辑加工结果从不同维度刻画用户未知信息的轨迹和内容。
优选的,所述特定算法包括Logistic算法、线性模型算法、BP神经网络算法、EM算法、SVM算法、疏松时间序列算法和FP-Growth算法中的一种或多种。
优选的,所述风控模型构建方法还包括:根据用户的操作以API加密传输方式输出所述88个特征变量和信用分。
综上所述,由于采用了上述技术方案,本发明的基于信用分的风控模型构建方法通过API的形式调取运营商底层数据,例如客户基本信息、通话信息、消费信息、缴费信息和位置信息等,并从中提取出用户的行为特征,对行为特征进行加工得到88个特征变量,根据风控模型、信用分评判体系和预设策略对用户的信用进行风控判断生成风控报告和信用分,并利用所述信用分对用户进行授信,从而能够帮助传统运营商实现数据从研究到应用的价值变现,可以快速判断出用户的生活和工作稳定性以及是否存在欺诈行为,可以实现数据的跨界流动,深受市场的喜爱,不仅解决了金融机构风控转型的核心痛点,还解决了运营商数据变现问题,在未来有良好的发展前景。
附图说明
图1是本发明实施例的基于信用分的风控模型构建方法的流程示意图。
具体实施方式
本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。
本说明书(包括任何附加权利要求、摘要)中公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。
参阅图1,是本发明实施例的基于信用分的风控模型构建方法的流程示意图。在本发明实施例中,基于信用分的风控模型构建方法包括以下步骤:
S1:从用户的移动通讯行为数据中获取与金融领域的行为特征相匹配的原始数据。
其中,经过大量银行等金融机构的实践反馈,金融领域的行为特征主要包括四大类:基本信息(年龄、性别、学历、地址等)、行为偏好(兴趣爱好等)、生活稳定性(消费、收入、社交圈、履约等)、工作稳定性(职业、收入、工作地点,公司性质、行业等)。在获取原始数据时,在网时长可判断用户的生活稳定性、月手机消费可判断用户的月收入情况、月通话时长通话频次可判断用户社交圈稳定性、APP使用情况及频次可判断兴趣爱好。经过步骤S1后,获取的原始数据例如为用户语音通话行为数据、用户移动手机属性信息、用户网络行为数据、用户移动通讯费用信息等。
S2:对原始数据进行清洗,并将清洗后的原始数据汇总成13张表单。
其中,对原始数据进行清洗的步骤至少为以下的一种:
一.捕获原始数据中的空值字段,将空值字段加载或替换为特定数据。其中,根据空值字段可以进行不同数据库的分流。
二.将原始数据中的字段格式转换为预定义格式。其中,对于时间、数值、字符等数据,均可以转换为预定义格式。
三.依据业务需求对原始数据中的字段进行分解;对分解后的字段进行数据验证。其中,字段可以为主叫号码,例如主叫号码为13219920113,可进行区域码和电话号码分解。进一步的,进行区域码和电话号码分解后,可利用Lookup返回主叫网关或交换机记载的主叫地区,进行数据验证。
四.依据业务需求将无效数据、缺失数据替换为特定数据
S3:在数据库中构建加密的数据特区,将13张表单通过加密传输方式传输至数据特区。
其中,数据特区是加密的,设置于独立局域网,无任何接口给外部系统及外部网络环境。可以在数据特区搭建集群计算实验环境,部署一套能处理大数据、并行化、高性能的大数据处理的平台系统。
S4:在数据特区中对13张表单从用户行为属性中提取用户的行为特征,并通过六度空间理论、灰色理论对行为特征进行加工得到用户的与金融领域相关的88个特征变量。
其中,当有了真实金融表现的样本客户,对样本客户的语音通话行为数据、用户移动手机属性信息、用户网络行为数据、用户移动通讯费用信息等进行挖掘,挖掘出用户与金融相关的特征变量,如客户标识、消费情况、流量使用情况、来电稳定性、去电稳定性、蜂巢模型反欺诈等,通过特征挖掘可区分出强相关和弱相关。
六度空间理论表述为:在人际交往的脉络中,任意两个陌生人都可以通过“朋友的朋友”建立联系,这中间最多只要通过6个朋友就能达到目的。
灰色理论表述为:系统是否会出现信息不完全的情况、取决于认识的层次、信息的层次和决策的层次,低层次系统的不确定量是相当的高层次系统的确定量,要充分利用已知的信息去揭示系统的规律。
在本实施例中,通过六度空间理论、灰色理论对行为特征进行加工得到用户的与金融领域相关的88个特征变量的步骤包括:对用户联系最为紧密的6个人进行画像描述;根据画像描述结果从不同侧面反映用户的多项核心行为特征。其中,通过对用户移动通讯联系最为紧密的6个人进行画像描述,进行一系列逻辑运算加工,从不同侧面反映用户本身的多项核心指标。
通过六度空间理论、灰色理论对行为特征进行加工得到用户的与金融领域相关的88个特征变量的步骤还包括:对用户的部分已知信息的逻辑加工;根据逻辑加工结果从不同维度刻画用户未知信息的轨迹和内容。其中,通过对用户部分已知信息的逻辑加工,从多个不同维度刻画用户未知信息的轨迹和内容。
S5:建立专家经验模型,根据金融机构反馈的用户的金融数据以及88个特征变量对专家经验模型进行优化得到风控模型以及运用特定算法构建表现用户情况的信用分评判体系。
其中,金融机构反馈的用户的金融数据例如为用户的贷款表现数据,进行优化的操作包括但不限于逻辑的修改、对称值的修改等。在本实施例中,该特定算法包括Logistic算法、线性模型算法、BP神经网络算法、EM算法、SVM算法、疏松时间序列算法和FP-Growth算法中的一种或多种。该特定算法可以利用机器学习原理或深度学习原理来运行。
S6:根据风控模型、信用分评判体系和预设策略对用户的信用进行风控判断生成风控报告和信用分,并利用信用分对用户进行授信。
其中,经过风控判断后可以得到风控报告和信用分,进而根据风控报告和信用分进行风险处理,例如,风控结果为高风险等级,信用分低于200分(上限为1000分)时,可以拒绝相应的贷款申请。
在本实施例中,风控模型构建方法还包括:根据用户的操作以API加密传输方式输出88个特征变量和信用分。信用分在用户真实授权后,可视情况与脱敏后的特征变量自由组合后通过API加密传输方式输出。
本发明的风控模型构建方法根据真实申请客户数据进行测试的结果显示,判断准确度AUC可达78%以上,随机样本好坏客户的区分度KS指标达到0.38,达到行业先进水平,风控模型调用时间在毫秒级,并且通过了国家工信部金融类数据流通性标准测试,金融机构可以使用该信用分,交叉搭配已有的数据、规则、模型和策略,对客户情况进行综合判断。
通过上述方式,本发明的基于信用分的风控模型构建方法通过API的形式调取运营商底层数据,例如客户基本信息、通话信息、消费信息、缴费信息和位置信息等,并从中提取出用户的行为特征,对行为特征进行加工得到88个特征变量,根据特征变量以及用户的金融数据对专家经验模型进行训练得到风控模型和信用分评判体系,根据风控模型、信用分评判体系和预设策略对用户的信用进行风控判断生成风控报告和信用分,从而能够帮助传统运营商实现数据从研究到应用的价值变现,可以快速判断出用户的生活和工作稳定性以及是否存在欺诈行为,可以实现数据的跨界流动,深受市场的喜爱,不仅解决了金融机构风控转型的核心痛点,还解决了运营商数据变现问题,在未来有良好的发展前景。
本发明并不局限于前述的具体实施方式。本发明扩展到任何在本说明书中披露的新特征或任何新的组合,以及披露的任一新的方法或过程的步骤或任何新的组合。

Claims (9)

1.一种基于信用分的风控模型构建方法,其特征在于,包括以下步骤:
从用户的移动通讯行为数据中获取与金融领域的行为特征相匹配的原始数据;
对所述原始数据进行清洗,并将清洗后的原始数据汇总成13张表单;
在数据库中构建加密的数据特区,将所述13张表单通过加密传输方式传输至所述数据特区;
在所述数据特区中对所述13张表单从用户行为属性中提取用户的行为特征,并通过六度空间理论、灰色理论对所述行为特征进行加工得到用户的与金融领域相关的88个特征变量;
建立专家经验模型,根据金融机构反馈的用户的金融数据以及88个特征变量对专家经验模型进行优化得到风控模型以及运用特定算法构建表现用户情况的信用分评判体系;
根据所述风控模型、信用分评判体系和预设策略对用户的信用进行风控判断生成风控报告和信用分,并利用所述信用分对用户进行授信。
2.根据权利要求1所述的基于信用分的风控模型构建方法,其特征在于,所述对所述原始数据进行清洗的步骤为:
捕获所述原始数据中的空值字段,将所述空值字段加载或替换为特定数据。
3.根据权利要求1所述的基于信用分的风控模型构建方法,其特征在于,所述对所述原始数据进行清洗的步骤为:
将所述原始数据中的字段格式转换为预定义格式。
4.根据权利要求1所述的基于信用分的风控模型构建方法,其特征在于,所述对所述原始数据进行清洗的步骤为:
依据业务需求对所述原始数据中的字段进行分解;
对分解后的字段进行数据验证。
5.根据权利要求1所述的基于信用分的风控模型构建方法,其特征在于,所述对所述原始数据进行清洗的步骤为:
依据业务需求将无效数据、缺失数据替换为特定数据。
6.根据权利要求1所述的基于信用分的风控模型构建方法,其特征在于,所述通过六度空间理论、灰色理论对所述行为特征进行加工得到用户的与金融领域相关的88个特征变量的步骤包括:
对用户联系最为紧密的6个人进行画像描述;
根据画像描述结果从不同侧面反映用户的多项核心行为特征。
7.根据权利要求6所述的基于信用分的风控模型构建方法,其特征在于,所述通过六度空间理论、灰色理论对所述行为特征进行加工得到用户的与金融领域相关的88个特征变量的步骤还包括:
对用户的部分已知信息的逻辑加工;
根据逻辑加工结果从不同维度刻画用户未知信息的轨迹和内容。
8.根据权利要求1所述的基于信用分的风控模型构建方法,其特征在于,所述特定算法包括Logistic算法、线性模型算法、BP神经网络算法、EM算法、SVM算法、疏松时间序列算法和FP-Growth算法中的一种或多种。
9.根据权利要求1所述的基于信用分的风控模型构建方法,其特征在于,所述风控模型构建方法还包括:
根据用户的操作以API加密传输方式输出所述88个特征变量和信用分。
CN201810770190.3A 2018-07-13 2018-07-13 一种基于信用分的风控模型构建方法 Pending CN108876193A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810770190.3A CN108876193A (zh) 2018-07-13 2018-07-13 一种基于信用分的风控模型构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810770190.3A CN108876193A (zh) 2018-07-13 2018-07-13 一种基于信用分的风控模型构建方法

Publications (1)

Publication Number Publication Date
CN108876193A true CN108876193A (zh) 2018-11-23

Family

ID=64301890

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810770190.3A Pending CN108876193A (zh) 2018-07-13 2018-07-13 一种基于信用分的风控模型构建方法

Country Status (1)

Country Link
CN (1) CN108876193A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109583782A (zh) * 2018-12-07 2019-04-05 厦门铅笔头信息科技有限公司 支持多数据源的汽车金融风控模型
CN109784736A (zh) * 2019-01-21 2019-05-21 成都乐超人科技有限公司 一种基于大数据的分析决策系统
CN110060047A (zh) * 2019-03-28 2019-07-26 阿里巴巴集团控股有限公司 基于交易的信用风险判别方法及其装置
CN110348722A (zh) * 2019-07-01 2019-10-18 百维金科(上海)信息科技有限公司 一种基于XGBoost的互联网金融风控模型
CN111949829A (zh) * 2020-09-01 2020-11-17 辽宁振兴银行股份有限公司 一种xml解析和风控变量生成方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104408108A (zh) * 2014-11-18 2015-03-11 重庆邮电大学 基于灰色系统理论的热点话题群体影响力分析系统及方法
CN104657300A (zh) * 2013-11-18 2015-05-27 比亚迪股份有限公司 通过应用编程接口获得汽车数据的方法及系统
CN105426394A (zh) * 2015-10-18 2016-03-23 广州赛意信息科技股份有限公司 基于跨平台的移动报表生成方法和系统
CN105512465A (zh) * 2015-11-30 2016-04-20 赵鑫龙 基于改进vikor法的云平台安全性量化评估方法
CN106649714A (zh) * 2016-12-21 2017-05-10 重庆邮电大学 针对数据不均匀及数据稀疏的topN推荐系统及方法
CN106650499A (zh) * 2016-12-28 2017-05-10 江苏神州信源系统工程有限公司 一种基于安卓系统的外部数据安全保护方法
CN107644375A (zh) * 2016-07-22 2018-01-30 花生米浙江数据信息服务股份有限公司 一种专家模型与机器学习模型融合的小商户信用评估方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104657300A (zh) * 2013-11-18 2015-05-27 比亚迪股份有限公司 通过应用编程接口获得汽车数据的方法及系统
CN104408108A (zh) * 2014-11-18 2015-03-11 重庆邮电大学 基于灰色系统理论的热点话题群体影响力分析系统及方法
CN105426394A (zh) * 2015-10-18 2016-03-23 广州赛意信息科技股份有限公司 基于跨平台的移动报表生成方法和系统
CN105512465A (zh) * 2015-11-30 2016-04-20 赵鑫龙 基于改进vikor法的云平台安全性量化评估方法
CN107644375A (zh) * 2016-07-22 2018-01-30 花生米浙江数据信息服务股份有限公司 一种专家模型与机器学习模型融合的小商户信用评估方法
CN106649714A (zh) * 2016-12-21 2017-05-10 重庆邮电大学 针对数据不均匀及数据稀疏的topN推荐系统及方法
CN106650499A (zh) * 2016-12-28 2017-05-10 江苏神州信源系统工程有限公司 一种基于安卓系统的外部数据安全保护方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
伍华聪: ""Web API应用架构设计分析(2)"", 《博客园》 *
戴宗坤: "《信息安全实用技术》", 31 May 2005, 重庆大学出版社 *
本内特等: "《Visual C++5开发人员指南》", 30 June 1998, 机械工业出版社 *
朱而刚等: ""基于灰色评估的信息安全风险评估模型"", 《信息安全与通信保密》 *
杨安莲: "《中国特色电子文件管理理论体系的建构》", 31 May 2017, 上海世界图书出版公司 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109583782A (zh) * 2018-12-07 2019-04-05 厦门铅笔头信息科技有限公司 支持多数据源的汽车金融风控模型
CN109784736A (zh) * 2019-01-21 2019-05-21 成都乐超人科技有限公司 一种基于大数据的分析决策系统
CN110060047A (zh) * 2019-03-28 2019-07-26 阿里巴巴集团控股有限公司 基于交易的信用风险判别方法及其装置
CN110348722A (zh) * 2019-07-01 2019-10-18 百维金科(上海)信息科技有限公司 一种基于XGBoost的互联网金融风控模型
CN111949829A (zh) * 2020-09-01 2020-11-17 辽宁振兴银行股份有限公司 一种xml解析和风控变量生成方法

Similar Documents

Publication Publication Date Title
CN108876193A (zh) 一种基于信用分的风控模型构建方法
Fourcade et al. Seeing like a market
CN108416669A (zh) 用户行为数据处理方法、装置、电子设备及计算机可读介质
CN111260462B (zh) 一种基于异质关系网络注意力机制的交易欺诈检测方法
CN108596434A (zh) 欺诈检测和风险评估方法、系统、设备及存储介质
CN106056444A (zh) 数据处理方法和装置
CN112418520B (zh) 一种基于联邦学习的信用卡交易风险预测方法
CN107123057A (zh) 用户推荐方法及装置
CN107644279A (zh) 评价模型的建模方法及装置
CN110598982B (zh) 基于智能交互的主动风控方法和系统
CN109255536A (zh) 债权催收方法、装置、系统及存储介质
CN109063979A (zh) 一种风控模型构建方法
CN111951052B (zh) 基于知识图谱的获取潜在客户方法及装置
CN109242669A (zh) 一种基于出行轨迹的授信方法、用户终端和服务器
CN114782161A (zh) 识别风险用户的方法、装置、存储介质及电子装置
CN107835247A (zh) 一种信用认证、保障系统及方法
CN112200656A (zh) 一种房贷的线上预审批方法、装置、介质及电子设备
Yuping et al. New methods of customer segmentation and individual credit evaluation based on machine learning
Li et al. A time attention based fraud transaction detection framework
CN110457601A (zh) 社交账号的识别方法和装置、存储介质及电子装置
CN112465624A (zh) 一种基于社交媒体状态的个人信用评价方法
CN112967062B (zh) 基于谨慎度的用户身份识别方法
Kokh et al. Big Data in Public Administration
CN114004693A (zh) 一种确定消费信贷不良资产残值估值的方法
CN114971017A (zh) 银行交易数据的处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181123