CN112037013A - 人行征信变量衍生方法及装置 - Google Patents

人行征信变量衍生方法及装置 Download PDF

Info

Publication number
CN112037013A
CN112037013A CN202010861703.9A CN202010861703A CN112037013A CN 112037013 A CN112037013 A CN 112037013A CN 202010861703 A CN202010861703 A CN 202010861703A CN 112037013 A CN112037013 A CN 112037013A
Authority
CN
China
Prior art keywords
variable
variables
credit
class
basic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010861703.9A
Other languages
English (en)
Inventor
罗富潇
司明成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Ronghui Technology Co ltd
Original Assignee
Chengdu Ronghui Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Ronghui Technology Co ltd filed Critical Chengdu Ronghui Technology Co ltd
Priority to CN202010861703.9A priority Critical patent/CN112037013A/zh
Publication of CN112037013A publication Critical patent/CN112037013A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Finance (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Accounting & Taxation (AREA)
  • Fuzzy Systems (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明涉及一种人行征信变量衍生方法及装置,包括对人行征信报告中的数据进行处理,获取基础变量;根据业务需求确定所述基础变量的可衍生变量,以确定变量规划逻辑;根据变量规划逻辑对基础变量进行加工,生成衍生变量。本申请能够帮助机构整理复杂多样的人行二代征信报告信息,对人行征信报告解析结果进行加工,系统性地生成衍生变量,可以有效地帮助机构区分好坏客户的客群,本申请供机构做风控策略和建模使用,判断借贷类客户的信用风险。

Description

人行征信变量衍生方法及装置
技术领域
本发明属于人行征信技术领域,具体涉及一种人行征信变量衍生方法及装置。
背景技术
人行征信报告,是由中国人民银行征信中心出具的记载个人信用信息的记录。人行征信报告中的信息主要分为3个部分:个人信息、信用交易信息和其他信息。金融机构利用报告中的信息评估申请人的风险高低。其中机器学习是评估风险最常用也是最专业的做法,而机器学习中使用的变量是否足够完整、贴合业务是决定评估效果优劣的决定性因素。目前机构在使用人行报告的时候,也会衍生一些变量,但是局限性较大,主要包括以下几个方面:
1:开发时间和人力有限。一个标准变量需要经历逻辑的开发、代码的开发、测试、交叉验证等多个步骤,鲜少有机构能长期投入人力在开发工作中。并且由于变量逻辑的正确性验证需要验证人员和开发人员对业务逻辑高度理解并达到一致,且双方均需具备代码能力,很多机构可能需要花费大量的培训时间去做人才的培养;
2:衍生方法有限。机构在自己使用人行报告信息时,较多是针对某产品制定一些强规则,比如是否有严重逾期的信贷、是否近期有不良状态的贷款等比较简单的逻辑,使用于全部风控场景;很少会用专业的统计方法去充分衍生变量,对比各方式在各场景下的效果。
3:报告内容挖掘不全面。机构利用比较多的经常是信贷方面比较明显的字段,其他的例如公积金、公共信息或是个人信息都挖掘较少,就查询人行报告的成本来说是非常不合算的。
发明内容
有鉴于此,本发明的目的在于克服现有技术的不足,提供一种人行征信变量衍生方法及装置,以解决现有技术中人行征信变量的开发时间和人力有限、衍生方法有限、以及报告内容挖掘不全面的问题。
为实现以上目的,本发明采用如下技术方案:一种人行征信变量衍生方法,包括:
对人行征信报告中的数据进行处理,获取基础变量;
根据业务需求确定所述基础变量的可衍生变量,以确定变量规划逻辑;
根据所述变量规划逻辑对所述基础变量进行加工,生成衍生变量。
进一步的,所述人行征信报告为多个;所述对人行征信报告中的数据进行处理,获取基础变量,包括:
预配置变量列表;
提取多个所述人行征信报告中的数据,在所述数据中提取与所述变量列表对应的变量作为基础变量。
进一步的,所述根据所述变量规划逻辑对所述基础变量进行加工,生成衍生变量,包括:
根据预设时间维度、预设参数的衍生维度、统计方式组合计算所述基础变量以生成衍生变量;
根据预设变量组成逻辑获取所述基础变量的衍生变量。
其中,根据预设时间维度、预设参数的衍生维度、统计方式组合方式生成的衍生变量为配置类变量;
根据预设变量组成逻辑生成的衍生变量为非配置类变量。
进一步的,所述预设参数包括以下参数的至少一种:
第一参数、第二参数、第三参数、第四参数;
所述第一参数、第二参数、第三参数、第四参数为四种类型的衍生维度。
进一步的,还包括:
对预设参数进行校验直至所有参数校验完成;
所述统计方式包括:求和、求最大值、求最小值、求平均值、求分位数。
进一步的,采用多线程对多个所述基础变量根据预设时间、预设参数的衍生维度、统计方式执行并列计算,生成所述基础变量的多个衍生变量。
进一步的,所述衍生变量包括:变量产品类型和变量类别;
所述变量产品类型包括:查询类、基本信息类、公共信息类、信息汇总类、贷款类、信用卡类、准贷记卡类、特殊类、被追偿信息;
所述变量类别包括:账户类、还款历史类、负债类、账龄类、收入类、反欺诈类、额度类、信贷需求类、消费类、个人信息类。
进一步的,所述人行征信报告包括一代征信报告和二代征信报告,一代征信报告采用HTML格式,二代征信报告采用XML格式或JSON格式。
本申请实施例提供一种人行征信变量衍生分析装置,包括:
获取模块,用于对人行征信报告中的数据进行处理,获取基础变量;
确定模块,用于根据业务需求确定所述基础变量的可衍生变量,以确定变量规划逻辑;
生成模块,用于根据所述变量规划逻辑对所述基础变量进行加工,生成衍生变量。
进一步的,所述人行征信报告为多个;所述对人行征信报告中的数据进行处理,获取基础变量,包括:
预配置变量列表;
提取多个所述人行征信报告中的数据,在所述数据中提取与所述变量列表对应的变量作为基础变量。
本发明采用以上技术方案,能够达到的有益效果包括:
本发明提供一种人行征信变量衍生方法及装置,包括对人行征信报告中的数据进行处理,获取基础变量;根据业务需求确定所述基础变量的可衍生变量,以确定变量规划逻辑;根据变量规划逻辑对基础变量进行加工,生成衍生变量。本申请能够帮助机构整理复杂多样的人行征信报告信息,对人行征信报告解析结果进行加工,系统性地生成衍生变量,可以有效地帮助机构区分好坏客户的客群,本申请供机构做风控策略和建模使用,判断借贷类客户的信用风险。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明人行征信变量衍生方法的步骤示意图;
图2为本发明人行征信变量衍生装置的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。
下面结合附图介绍本申请实施例中提供的一个具体的人行征信变量衍生方法及装置。
如图1所示,本申请实施例中提供的人行征信变量衍生方法,包括:
S101,对人行征信报告中的数据进行处理,获取基础变量;
获取征信系统中的人行征信报告,提取人行征信报告上的征信数据。其中,人行征信报告包括一代征信报告和二代征信报告,一代征信报告采用HTML格式,二代征信报告采用XML格式或JSON格式。本申请中主要采用二代人行征信报告,人行二代征信报告与一代征信报告对比,在内容、板块方面有大量变动,信息更加丰富。其中,基础变量例如可以是最近6个月内发生过逾期的账户个数、信用卡平均使用额度、最近12个月信用卡申请查询机构数、消费金融公司发放的贷款占比、商业银行发放贷款个数(账户处于正常状态)、房贷个数、教育程度、最近一个月内按时还款的贷款账户个数。
S102,根据业务需求确定所述基础变量的可衍生变量,以确定变量规划逻辑;
根据银行的业务需求先判断基础变量可以生成的衍生变量有哪些,选择相应的变量规划逻辑。其中,变量规划逻辑为多个。
S103,根据所述变量规划逻辑对所述基础变量进行加工,生成衍生变量。
根据选择的变量规划逻辑对基础变量进行加工,从而生成衍生变量;衍生变量包括:变量产品类型和变量类别;
所述变量产品类型包括:查询类、基本信息类、公共信息类、信息汇总类、贷款类、信用卡类、准贷记卡类、特殊类、被追偿信息;
所述变量类别包括:账户类、还款历史类、负债类、账龄类、收入类、反欺诈类、额度类、信贷需求类、消费类、个人信息类。
具体的,基于人行征信报告数据,我们分析每个信息的含义,取值,在实际业务中的使用方式等去发掘该信息的可利用点,来确定可衍生的方式,是否可以和其他信息组合使用,以及使用时需要限定的条件。如公积金缴纳记录数。通过公积金的金额和缴存比例,反推出个人的工资。最终生成查询类变量、基本信息类、公共信息类、信息汇总类、贷款类、信用卡类、准贷记卡类、特殊类、被追偿信息等9种产品类型。每种产品下,又有几种变量类别。如有账户类、还款历史类、负债类、账龄类、收入类、反欺诈类、额度类、信贷需求类、消费类、个人信息类等9种类型。
其中,账户类变量主要反映用户不同产品、状态的账户数量,以二代征信报告中的信贷汇总和信贷明细信息为主构造变量。例如:变量1:非循环贷账户个数:描述用户非循环贷款账户数;变量2:用户活跃的有实际额度的卡的数目:描述用户当前正在使用的未结清贷记卡张数。
还款历史类变量主要刻画用户的历史还款表现(包括贷款、贷记卡及准贷记卡),尤其是逾期次数及金额等,以二代征信报告中的信贷明细信息模块为主构造变量。例如:变量1:非循环贷账户近5年的最大逾期金额:描述用户非循环贷账户近5年的逾期最大金额;变量2:循环额度下分账户近五年的最大逾期期数:描述用户循环额度下分账户近5年的最大逾期期数;变量3:循环贷账户最近一次逾期距今时长:描述用户循环贷账户上一次逾期举例报告查询日期间的月份长度。
负债类变量主要刻画用户的负债程度,例如,依据贷款本金余额、已使用额度等负债信息衍生出反映用户负债状况的多维度变量,以二代征信报告中的信贷汇总和信贷明细信息为主构造变量。例如:变量1:最近3个月内贷款总金额:描述用户近期贷款金额状况;变量2:未销户贷记卡应还总金额:描述用户贷记卡应还金额状况。
账龄类变量反映用户不同账户的存续时长,例如,最早信用卡开卡距今时长,信用卡平均存续时长等,以二代征信报告中的信贷明细信息为主构造变量。例如:变量1:最近贷记卡开卡距今时长:描述最近一次发卡距今时长,考察最近银行授信情况;变量2:贷记卡平均存续时长:描述贷记卡平均存续时长;变量3:贷款账户中最近一次放款距今时长:描述贷款账户中最近一次放款距今时长,考察最近新增贷款个数。
收入类变量主要刻画用户的收入状况,如最大授信额度,住房公积金、学历等信息,以二代征信报告中的信贷明细信息和住房公积金模块为主构造变量。例如:变量1:最后一次缴纳公积金距今时长:描述用户公积金是否持续缴纳;变量2:用户最大基本工资:利用用户和单位公积金缴纳比例算出工资以评估用户收入水平。
反欺诈类变量通过用户是否首期还款即逾期、处罚、强制执行、欠税等信息反映用户的欺诈风险,以二代征信报告中的信贷明细信息及公共信息为主构造变量。例如:变量1:首期即逾期且逾期180天以上的贷记卡账户数:首期即逾期欺诈风险较高;变量2:是否有强制执行信息:客户是否存在不良信息。
额度类变量主要反映用户的额度及使用情况,例如,最大额度,已使用额度占比等,以二代征信报告中的信贷汇总和信贷明细信息为主构造变量。例如:变量1:未销户贷记卡已用额度占总授信额度比:描述用户总的额度使用情况;变量2:未销户贷记卡平均使用额度占总授信额度比:描述用户平均额度使用占比情况;变量3:单张未销户贷记卡最大额度使用率:描述用户常用卡额度使用率情况。
信贷需求类主要刻画用户新增贷款和信用卡的需求,以二代征信报告中的查询记录汇总、信贷审批查询记录明细及信贷明细信息模块为主构造。例如:变量1:用户近3个月查询原因为贷款审批的次数:描述用户近3个月对新贷款申请的需求,次数越多需求越大;变量2:用户近3个月查询原因为贷款审批的机构数:反映用户申请的机构数量,对机构做了去重处理;变量3:查询原因为贷款审批距离报告日最小天数:查询原因为贷款审批距离报告日最小天数,反映用户近期贷款借款需求。
消费类变量主要描述用户贷款的类型以及发放机构,如小额贷款公司发放的个人消费贷款等,以二代征信报告中的信贷明细信息模块为主构造变量。例如:变量1:最近3个月内发放的个人消费贷款总金额:可反映用户是否具有大量消费贷款;变量2:最近2年内由商业银行发放的个人住房贷款金额:反映用户是否具有房贷以及其金额。
人行征信变量衍生方法的工作原理为:对人行征信报告中的数据进行处理,获取基础变量;根据业务需求确定所述基础变量的可衍生变量,以确定变量规划逻辑;根据所述变量规划逻辑对所述基础变量进行加工,生成衍生变量。本申请根据二代征信报告解析出的基础变量,进行加工,生成具有业务意义的衍生变量,二代衍生变量比一代衍生变量在区分好坏客户的客群上有更好的效果。
一些实施例中,所述人行征信报告为多个;所述对人行征信报告中的数据进行处理,获取基础变量,包括:
预配置变量列表;
提取多个所述人行征信报告中的数据,在所述数据中提取与所述变量列表对应的变量作为基础变量。
具体的,读取多个人行征信报告中的数据,对比数据与预设的预配置变量列表,提取预配置变量列表中的变量作为基础变量。
一些实施例中,所述根据所述变量规划逻辑对所述基础变量进行加工,生成衍生变量,包括:
根据预设时间维度、预设参数的衍生维度、统计方式组合计算所述基础变量以生成衍生变量;
根据预设变量组成逻辑获取所述基础变量的衍生变量。
其中,根据预设时间维度、预设参数的衍生维度、统计方式组合方式生成的衍生变量为配置类变量;
根据预设变量组成逻辑生成的衍生变量为非配置类变量。
具体的,将可加工的所有的变量存于数据库,称为变量池,用户可在平台操作变量池中变量的属性,变量的属性包括实时、异步、生效、失效;对变量加工的时候获取需要加工的变量列表基于用户配置的属性来筛选,也就是说当需要进行变量加工时,会去数据库提取对应的符合条件的变量列表,进行变量加工。
其中,配置类指的是同一主体可以根据不同的参数配置生成不同的变量,多个变量公用一套计算规则;非配置类指的是逻辑较为复杂,不需要在变量外围再配置各种维度出来的变量。可以理解的是,变量是否可配置主要取决于变量的复杂程度,和是否有再次配置的必要。
优选的,所述预设参数包括以下参数的至少一种:
第一参数、第二参数、第三参数、第四参数;
所述第一参数、第二参数、第三参数、第四参数为四种类型的衍生维度。
优选的,还包括:
对预设参数进行校验直至所有参数校验完成;
所述统计方式包括:求和、求最大值、求最小值、求平均值、求分位数。
本申请中通过预设参数的衍生维度、统计方式执行并列计算,生成所述基础变量的多个衍生变量。
本申请通过接口传输人行征信报告解析结果(原始变量),然后对原始变量按照不同的加工逻辑进行统计加工,生成9大类衍生变量,供机构做风控策略和建模使用,判断借贷类客户的信用风险。
如图2所示,本申请实施例提供一种人行征信变量衍生装置,包括:
获取模块201,用于对人行征信报告中的数据进行处理,获取基础变量;
确定模块202,用于根据业务需求确定所述基础变量的可衍生变量,以确定变量规划逻辑;
生成模块203,用于根据所述变量规划逻辑对所述基础变量进行加工,生成衍生变量。
优选的,所述人行征信报告为多个;所述对人行征信报告中的数据进行处理,获取基础变量,包括:
预配置变量列表;
提取多个所述人行征信报告中的数据,在所述数据中提取与所述变量列表对应的变量作为基础变量。
具体的,从人行征信报告中,提取重要数据、或加以计算后,变成一个计算对象,再以计算对象为核心,外围增加多层维度,如时间、类别等等组合的衍生设计方式。可衍生设计出上万至十几万不等的变量。解决了现有系统衍生变量少,覆盖类别不全的问题。
本申请实施例提供一种计算机设备,包括处理器,以及与处理器连接的存储器;
存储器用于存储计算机程序,计算机程序用于执行上述任一实施例提供的人行征信变量衍生方法;
处理器用于调用并执行存储器中的计算机程序。
综上所述,本发明提供一种人行征信变量衍生方法及装置,包括对人行征信报告中的数据进行处理,获取基础变量;根据业务需求确定所述基础变量的可衍生变量,以确定变量规划逻辑;根据所述变量规划逻辑对所述基础变量进行加工,生成衍生变量。本申请解决了人行征信报告信息分类较多,数据类型多样,分析整理时间和人力成本较高,并且许多机构对人行征信报告数据挖掘不深入,不能系统性的衍生变量,容易丢失重要信息的问题。能够帮助机构整理复杂多样的人行二代征信报告信息,对人行征信报告解析结果进行加工,系统性地生成衍生变量,可以有效地帮助机构区分好坏客户的客群,本申请供机构做风控策略和建模使用,判断借贷类客户的信用风险。
可以理解的是,上述提供的方法实施例与上述的装置实施例对应,相应的具体内容可以相互参考,在此不再赘述。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令方法的制造品,该指令方法实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种人行征信变量衍生方法,其特征在于,包括:
对人行征信报告中的数据进行处理,获取基础变量;
根据业务需求确定所述基础变量的可衍生变量,以确定变量规划逻辑;
根据所述变量规划逻辑对所述基础变量进行加工,生成衍生变量。
2.根据权利要求1所述的方法,其特征在于,所述人行征信报告为多个;所述对人行征信报告中的数据进行处理,获取基础变量,包括:
预配置变量列表;
提取多个所述人行征信报告中的数据,在所述数据中提取与所述变量列表对应的变量作为基础变量。
3.根据权利要求1所述的方法,其特征在于,所述根据所述变量规划逻辑对所述基础变量进行加工,生成衍生变量,包括:
根据预设时间维度、预设参数的衍生维度、统计方式组合计算所述基础变量以生成衍生变量;
根据预设变量组成逻辑获取所述基础变量的衍生变量;
其中,根据预设时间维度、预设参数的衍生维度、统计方式组合方式生成的衍生变量为配置类变量;
根据预设变量组成逻辑生成的衍生变量为非配置类变量。
4.根据权利要求3所述的方法,其特征在于,所述预设参数包括以下参数的至少一种:
第一参数、第二参数、第三参数、第四参数;
所述第一参数、第二参数、第三参数、第四参数为四种类型的衍生维度。
5.根据权利要求4所述的方法,其特征在于,还包括:
对预设参数进行校验直至所有参数校验完成;
所述统计方式包括:求和、求最大值、求最小值、求平均值、求分位数。
6.根据权利要求5所述的方法,其特征在于,
采用多线程对多个所述基础变量根据预设时间、预设参数的衍生维度、统计方式执行并列计算,生成所述基础变量的多个衍生变量。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述衍生变量包括:变量产品类型和变量类别;
所述变量产品类型包括:查询类、基本信息类、公共信息类、信息汇总类、贷款类、信用卡类、准贷记卡类、特殊类、被追偿信息;
所述变量类别包括:账户类、还款历史类、负债类、账龄类、收入类、反欺诈类、额度类、信贷需求类、消费类、个人信息类。
8.根据权利要求7所述的方法,其特征在于,
所述人行征信报告包括一代征信报告和二代征信报告,一代征信报告采用HTML格式,二代征信报告采用XML格式或JSON格式。
9.一种人行征信变量衍生装置,其特征在于,包括:
获取模块,用于对人行征信报告中的数据进行处理,获取基础变量;
确定模块,用于根据业务需求确定所述基础变量的可衍生变量,以确定变量规划逻辑;
生成模块,用于根据所述变量规划逻辑对所述基础变量进行加工,生成衍生变量。
10.根据权利要求9所述的装置,其特征在于,所述人行征信报告为多个;所述对人行征信报告中的数据进行处理,获取基础变量,包括:
预配置变量列表;
提取多个所述人行征信报告中的数据,在所述数据中提取与所述变量列表对应的变量作为基础变量。
CN202010861703.9A 2020-08-25 2020-08-25 人行征信变量衍生方法及装置 Pending CN112037013A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010861703.9A CN112037013A (zh) 2020-08-25 2020-08-25 人行征信变量衍生方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010861703.9A CN112037013A (zh) 2020-08-25 2020-08-25 人行征信变量衍生方法及装置

Publications (1)

Publication Number Publication Date
CN112037013A true CN112037013A (zh) 2020-12-04

Family

ID=73581183

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010861703.9A Pending CN112037013A (zh) 2020-08-25 2020-08-25 人行征信变量衍生方法及装置

Country Status (1)

Country Link
CN (1) CN112037013A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107424070A (zh) * 2017-03-29 2017-12-01 广州汇融易互联网金融信息服务有限公司 一种基于机器学习的贷款用户信用评级方法及系统
CN108830696A (zh) * 2018-07-02 2018-11-16 平安科技(深圳)有限公司 征信报告解析处理方法、装置、计算机设备及存储介质
CN109447787A (zh) * 2018-10-26 2019-03-08 平安科技(深圳)有限公司 征信报告自动解析方法、装置、计算机设备以及存储介质
CN109977151A (zh) * 2019-03-28 2019-07-05 北京九章云极科技有限公司 一种数据分析方法及系统
CN110399453A (zh) * 2019-05-21 2019-11-01 平安普惠企业管理有限公司 征信报告处理方法及装置、电子设备和非暂态存储介质
CN111127196A (zh) * 2019-12-31 2020-05-08 中信百信银行股份有限公司 信贷风控特征变量管理的方法及系统
CN111461875A (zh) * 2020-04-13 2020-07-28 四川新网银行股份有限公司 基于决策引擎的多场景分阶段自动化信贷的方法
CN111539532A (zh) * 2020-04-01 2020-08-14 深圳市魔数智擎人工智能有限公司 一种面向模型构建的特征自动化衍生方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107424070A (zh) * 2017-03-29 2017-12-01 广州汇融易互联网金融信息服务有限公司 一种基于机器学习的贷款用户信用评级方法及系统
CN108830696A (zh) * 2018-07-02 2018-11-16 平安科技(深圳)有限公司 征信报告解析处理方法、装置、计算机设备及存储介质
CN109447787A (zh) * 2018-10-26 2019-03-08 平安科技(深圳)有限公司 征信报告自动解析方法、装置、计算机设备以及存储介质
CN109977151A (zh) * 2019-03-28 2019-07-05 北京九章云极科技有限公司 一种数据分析方法及系统
CN110399453A (zh) * 2019-05-21 2019-11-01 平安普惠企业管理有限公司 征信报告处理方法及装置、电子设备和非暂态存储介质
CN111127196A (zh) * 2019-12-31 2020-05-08 中信百信银行股份有限公司 信贷风控特征变量管理的方法及系统
CN111539532A (zh) * 2020-04-01 2020-08-14 深圳市魔数智擎人工智能有限公司 一种面向模型构建的特征自动化衍生方法
CN111461875A (zh) * 2020-04-13 2020-07-28 四川新网银行股份有限公司 基于决策引擎的多场景分阶段自动化信贷的方法

Similar Documents

Publication Publication Date Title
Bellini IFRS 9 and CECL Credit Risk Modelling and Validation: A Practical Guide with Examples Worked in R and SAS
Siddiqi Credit risk scorecards: developing and implementing intelligent credit scoring
Finlay Credit scoring, response modeling, and insurance rating: a practical guide to forecasting consumer behavior
EP2506207A1 (en) Computer system, computer-implemented method and computer program product for managing operations of a system
CN109961368A (zh) 基于机器学习的数据处理方法及装置
CN111127200A (zh) 反洗钱可疑交易监测方法及装置
CN106651573A (zh) 一种业务数据处理方法及装置
CN110648223A (zh) 一种核给大额业务额度的方法、装置和电子设备
Bedhiye et al. Fiscal policy and private investment in developing economies: Evidence from Ethiopia
CN112766814A (zh) 一种信用风险压力测试模型的训练方法、装置及设备
Feltenstein et al. “The Impact of Micro-simulation and CGE modeling on Tax Reform and Tax Advice in Developing Countries”: A Survey of Alternative Approaches and an Application to Pakistan
Lawal Influence of bank financial soundness on the operational efficiency of deposit money banks in Nigeria
Al-Halabi et al. The impact of designing accounting information systems on the level of accounting conservatism-a field study
CN115564551A (zh) 一种金融大数据的企业信用评级方法
CN112037013A (zh) 人行征信变量衍生方法及装置
Maskus et al. Hiding Filthy Lucre in Plain Sight: Theory and Identification of Business-Based Money Laundering
Zou et al. The impact of tax policy on firm debt maturity: Evidence from China's VAT reform
KR102420952B1 (ko) 인공지능을 이용한 대출 확대 가설 검정 시스템 및 이를 이용한 방법
Tsvirko Informational technologies for the efficiency of public debt management in Russia
Parnes A spline hazard model for current expected credit losses
Vezenkoska et al. Internal audit of financial operations
Dogara et al. Analysis of the Effect of Cross Border Investments on the Nigerian Capital Market
Yilmaz VAT Treatment of Financial Institutions: Implications for the Real Economy
Vas Impact of documentary requirements of state subsidy grants on moral hazard
Kamotho M., Njoka, C.(2022). Credit lending policies and financial performance of Islamic banks in Kenya

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination