CN108389120A - 一种对互联网信贷资产进行自动评级的方法、系统及装置 - Google Patents

一种对互联网信贷资产进行自动评级的方法、系统及装置 Download PDF

Info

Publication number
CN108389120A
CN108389120A CN201810119222.3A CN201810119222A CN108389120A CN 108389120 A CN108389120 A CN 108389120A CN 201810119222 A CN201810119222 A CN 201810119222A CN 108389120 A CN108389120 A CN 108389120A
Authority
CN
China
Prior art keywords
credit
confirmation request
borrower
lending
rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810119222.3A
Other languages
English (en)
Other versions
CN108389120B (zh
Inventor
刘海滨
冯羽
胡波
陈彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Hengqin Guangdong Macao Deep Cooperation Zone Lvling Technology Co ltd
Original Assignee
Guangdong Honebay Fintech Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Honebay Fintech Information Technology Co ltd filed Critical Guangdong Honebay Fintech Information Technology Co ltd
Priority to CN201810119222.3A priority Critical patent/CN108389120B/zh
Publication of CN108389120A publication Critical patent/CN108389120A/zh
Application granted granted Critical
Publication of CN108389120B publication Critical patent/CN108389120B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Technology Law (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种对互联网信贷资产进行自动评级的方法、系统及装置,方法包括:对借款人的连续借款行为进行一致性评估;对多个借款人在多个贷款机构的审批结果进行预测;根据一致性评估和预测的结果,建立信用评级模型;根据建立的信用评级模型进行自动评级。系统包括一致性评估模块、预测模块、模型建立模块和评级模块。装置包括存储器和处理器。本发明提高了贷款机构自身的风控能力、信贷安全性以及贷款机构的信审效率,并能高效地刻画出用户之间的差异,无需耗费大量人工,工作效率高,可广泛应用于金融监管领域。

Description

一种对互联网信贷资产进行自动评级的方法、系统及装置
技术领域
本发明涉及金融监管领域,尤其是一种对互联网信贷资产进行自动评级的方法、系统及装置。
背景技术
目前互联网金融采用“先圈人、预授信、先放贷、再催收”的模式来获得资产,这种模式能够快速获得大量客户,且该模式对应的风控模型也是批量、统一的,但有时为了业务处理上的效率,这些风控模型需要牺牲一些性能,或者说这些风控模型在刻画客户的差异化方面并不高效。而一些可行的能够对客户差异化进行高效刻画的风控模型,例如贝叶斯算法模型,由于计算量过大,并没有在实际信贷业务中被广泛使用。
这也是目前大数据产业的一个现状。通过将大量客户数据汇集,通过工程可实现的算法,利用大量的算力,训练一个或多个可以识别复杂模式的模型,这些模型被部署在生产环境中,替代或辅助原本由人工完成的业务内容。在信贷领域,这些自动或半自动化的模型用在反欺诈识别、贷前审批、信用评估、预授信、贷中还款分析、催收等。这种做法的优势是一次部署后,可长期稳定使用这些模型,缺点是对客户进行针对性刻画的能力不足。
例如,甲从W银行贷款3万元用于新屋装修,四个月后,甲又向K银行申请一笔5万元贷款用于购买家用轿车,那么K银行在审批过程中,需要考虑甲之前的贷款行为,调用人行征信记录等,同时也会分析甲的其他特征变化,如收入是否增长等等,无论是征信或收入的变化,前后都是相互依赖的。但是,由于金融机构是相互独立的,W银行或K银行通常不会将贷款审批标准公布于众,在发达国家,数十家银行共同委托一家信用评级机构开发行业共享的信用评分模型,这种办法会达成银行间对同一借款人的一致性的信用评估,但是这种方法一定程度上限制了更广泛信用数据的运用,同时银行过分依赖信用评级机构,削弱了自身的风控能力,一旦发生系统性风险,会出现“一荣俱荣,一损俱损”的局面,银行的信贷安全性较低。因此,在保持不同银行风控标准独立性的前提下,如何实现不同银行对同一借款人连续借款的一致性评估,已经成为一个重要的课题。
另外,仍以K银行为例,K银行通过某种方法得到对甲借款人的多方混合判读(结合了K银行和W银行信审标准)。但是这个世界并不只有K银行和W银行两家银行,假设乙借款人也向K银行借款,而乙借款人上一次是向F银行银行借款的,如果甲和乙同时向K银行借款时,现有方法是把F银行交互到对甲的评价,把W银行交互到对乙的评价,但当借款人和银行的数量都很多的时候,这项工作将变得异常复杂,这种交叉验证对计算量的要求巨大,大大的降低了银行的信审效率。
发明内容
为解决上述技术问题,本发明的目的在于:提供一种能够高效刻画用户差异的、安全性高且效率高的,对互联网信贷资产进行自动评级的方法、系统及装置。
本发明所采取的第一技术方案是:
一种对互联网信贷资产进行自动评级的方法,包括以下步骤:
对借款人的连续借款行为进行一致性评估;
对多个借款人在多个贷款机构的审批结果进行预测;
根据一致性评估和预测的结果,建立信用评级模型;
根据建立的信用评级模型进行自动评级。
进一步,所述对借款人的连续借款行为进行一致性评估这一步骤,包括以下步骤:
获取借款人的个人征信报告;
对个人征信报告进行信息提取,得到第一结构化表格数据;
根据第一贷款机构的信贷指标判定标准,生成借款人在第一贷款机构的第一申请批准初始值,以及借款人在第二贷款机构的第二申请批准初值;
根据生成的第一申请批准初值和第二申请批准初值,生成借款人在多个贷款机构的申请批准率。
进一步,所述根据生成的第一申请批准初值和第二申请批准初值,生成借款人在多个贷款机构的申请批准率这一步骤,包括以下步骤:
将第二贷款机构的信贷指标判定标准作为隐变量,根据隐变量和第一结构化表格数据,计算对数似然函数;
将第一申请批准初始值作为当前申请批准率;
根据当前申请批准率计算隐变量的分布,并根据隐变量的分布计算对数似然函数关于隐变量的期望值;
根据计算得到的期望值,得到对应于最大化对数似然函数的申请批准率;
根据当前申请批准率和第一结构化表格数据,计算风险损失值;
判断风险损失值是否小于设定阈值,若是,则将当前申请批准率作为借款人在多个贷款机构的申请批准率;反之,则将与最大化对数似然函数对应的申请批准率作为申请批准率,并返回执行根据当前申请批准率计算隐变量的分布,并根据隐变量的分布计算对数似然函数关于隐变量的期望值的步骤,直至风险损失值小于设定阈值。
进一步,所述对多个借款人在多个贷款机构的审批结果进行预测这一步骤,包括以下步骤:
获取多个借款人在同一时期的个人征信报告;
对每个借款人在多个贷款机构的申请批准率进行计算,生成第二结构化表格数据;
对第二结构化表格数据中的缺失值进行补全,得到同一时期的多个借款人在多个贷款机构的申请批准率。
进一步,所述对第二结构化表格数据中的缺失值进行补全,得到同一时期的多个借款人在多个贷款机构的申请批准率这一步骤,包括以下步骤:
通过二阶多项式线性模型得到多个贷款机构之间的相似度;
对二阶多项式线性模型的参数进行计算,得到两个低维稠密矩阵;
根据得到的低维稠密矩阵,对第二结构化表格数据进行重构,得到第二结构化表格数据中的缺失值;
根据得到的缺失值对第二结构化表格数据进行补全,并将补全后的第二结构化表格数据作为同一时期的多个借款人在多个贷款机构的申请批准率。
进一步,所述根据一致性评估和预测的结果,建立信用评级模型这一步骤,包括以下步骤:
确定信用等级的数量;
确定评级指标,并根据信用等级的数量,对每个级别的边界的评级指标进行标识;
确定每个信用等级的最大容量;
根据实际违约情况,对系统性风险进行预测性计算;
根据预测性计算的结果,对每个级别的边界的评级指标以及每个信用等级的最大容量进行更新,得到信用评级模型。
进一步,所述根据建立的信用评级模型进行自动评级这一步骤,包括以下步骤:
将信用评级模型部署在规则引擎;
对新增借款人的信用评级结果和还款人的违约数据进行统计分析,得到相应的指标数据;
判断得到的指标数据是否大于设定的指标阈值,若是,则对信用评级模型进行修正操作;反之,则执行下一步骤;其中,所述指标阈值包括系统性风险预警阈值和分级违约金额预警阈值;
对借款人进行评级分配,对分级风险损失和系统风险损失进行预算;
根据预算结果,通过规则引擎对每个信用等级做出继续贷款、暂停贷款或终止贷款的决策。
本发明所采取的第二技术方案是:
一种对互联网信贷资产进行自动评级的系统,包括:
一致性评估模块,用于对借款人的连续借款行为进行一致性评估;
预测模块,用于对多个借款人在多个贷款机构的审批结果进行预测;
模型建立模块,用于根据一致性评估和预测的结果,建立信用评级模型;
评级模块,用于根据建立的信用评级模型进行自动评级。
进一步,所述一致性评估模块,包括:
获取单元,用于获取借款人的个人征信报告;
判定单元,用于对个人征信报告进行信息提取,得到第一结构化表格数据;
第一生成单元,用于根据第一贷款机构的信贷指标判定标准,生成借款人在第一贷款机构的第一申请批准初始值,以及借款人在第二贷款机构的第二申请批准初值;
第二生成单元,用于根据生成的第一申请批准初值和第二申请批准初值,生成借款人在多个贷款机构的申请批准率。
本发明所采取的第三技术方案是:
一种对互联网信贷资产进行自动评级的装置,包括:
存储器,用于存储程序;
处理器,用于加载所述程序,以执行如第一技术方案所述的一种对互联网信贷资产进行自动评级的方法。
本发明的有益效果是:本发明能够对借款人的连续借款行为进行一致性评估,无需依赖信用评级机构,提高了贷款机构自身的风控能力,提高了信贷安全性;通过对多个借款人在多个贷款机构的审批结果进行预测,能够针对不同的用户,得到对应于不同贷款机构的审批预测结果,大大提高了贷款机构的信审效率,并能高效地刻画出用户之间的差异;另外,本发明还能建立信用评级模型并以此进行自动评级,无需耗费大量人工,进一步提高了工作效率。
附图说明
图1为本发明一种对互联网信贷资产进行自动评级的方法的步骤流程图。
具体实施方式
下面结合说明书附图和具体实施例对本发明作进一步解释和说明。对于本发明实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
参照图1,本发明一种对互联网信贷资产进行自动评级的方法,包括以下步骤:
对借款人的连续借款行为进行一致性评估;
对多个借款人在多个贷款机构的审批结果进行预测;
根据一致性评估和预测的结果,建立信用评级模型;
根据建立的信用评级模型进行自动评级。
进一步作为优选的实施方式,所述对借款人的连续借款行为进行一致性评估这一步骤,包括以下步骤:
获取借款人的个人征信报告;
对个人征信报告进行信息提取,得到第一结构化表格数据;
根据第一贷款机构的信贷指标判定标准,生成借款人在第一贷款机构的第一申请批准初始值,以及借款人在第二贷款机构的第二申请批准初值;
根据生成的第一申请批准初值和第二申请批准初值,生成借款人在多个贷款机构的申请批准率。
其中,所述第一结构化表格数据具体是指:根据第一贷款机构的信贷指标判定标准,对借款人的信用指标进行判定,得到的相应指标数据。在本实施例中,每个指标的好坏通过(G/B)来表示。第一贷款机构是指借款人将要去申请贷款的待申请贷款机构,第二贷款机构是指除了第一贷款机构以外的其他贷款机构。所述个人征信报告包括人行征信报告。
进一步作为优选的实施方式,所述根据生成的第一申请批准初值和第二申请批准初值,生成借款人在多个贷款机构的申请批准率这一步骤,包括以下步骤:
将第二贷款机构的信贷指标判定标准作为隐变量,根据隐变量和第一结构化表格数据,计算对数似然函数;
将第一申请批准初始值作为当前申请批准率;
根据当前申请批准率计算隐变量的分布,并根据隐变量的分布计算对数似然函数关于隐变量的期望值;
根据计算得到的期望值,得到对应于最大化对数似然函数的申请批准率;
根据当前申请批准率和第一结构化表格数据,计算风险损失值;
判断风险损失值是否小于设定阈值,若是,则将当前申请批准率作为借款人在多个贷款机构的申请批准率;反之,则将与最大化对数似然函数对应的申请批准率作为申请批准率,并返回执行根据当前申请批准率计算隐变量的分布,并根据隐变量的分布计算对数似然函数关于隐变量的期望值的步骤,直至风险损失值小于设定阈值。
进一步作为优选的实施方式,所述对多个借款人在多个贷款机构的审批结果进行预测这一步骤,包括以下步骤:
获取多个借款人在同一时期的个人征信报告;
对每个借款人在多个贷款机构的申请批准率进行计算,生成第二结构化表格数据;
对第二结构化表格数据中的缺失值进行补全,得到同一时期的多个借款人在多个贷款机构的申请批准率。
其中,所述第二结构化表格数据具体是指,多个借款人在多个贷款机构的申请批准率。
进一步作为优选的实施方式,所述对第二结构化表格数据中的缺失值进行补全,得到同一时期的多个借款人在多个贷款机构的申请批准率这一步骤,包括以下步骤:
通过二阶多项式线性模型得到多个贷款机构之间的相似度;
对二阶多项式线性模型的参数进行计算,得到两个低维稠密矩阵;
根据得到的低维稠密矩阵,对第二结构化表格数据进行重构,得到第二结构化表格数据中的缺失值;
根据得到的缺失值对第二结构化表格数据进行补全,并将补全后的第二结构化表格数据作为同一时期的多个借款人在多个贷款机构的申请批准率。
其中,由于第二结构化表格数据中存在很多缺失值,因此,将第二结构化表格数据称为高维稀疏矩阵,本发明通过两个低维且不带缺失值(即稠密)的矩阵的乘积来对第二结构化表格数据进行补全。
进一步作为优选的实施方式,所述根据一致性评估和预测的结果,建立信用评级模型这一步骤,包括以下步骤:
确定信用等级的数量;
确定评级指标,并根据信用等级的数量,对每个级别的边界的评级指标进行标识;
确定每个信用等级的最大容量;
根据实际违约情况,对系统性风险进行预测性计算;
根据预测性计算的结果,对每个级别的边界的评级指标以及每个信用等级的最大容量进行更新,得到信用评级模型。
其中,所述系统性风险是指:贷款机构基于所述已经确定的信用等级数量和评级指标进行贷款,其可能导致的借款人违约风险。
进一步作为优选的实施方式,所述根据建立的信用评级模型进行自动评级这一步骤,包括以下步骤:
将信用评级模型部署在规则引擎;
对新增借款人的信用评级结果和还款人的违约数据进行统计分析,得到相应的指标数据;
判断得到的指标数据是否大于设定的指标阈值,若是,则对信用评级模型进行修正操作;反之,则执行下一步骤;其中,所述指标阈值包括系统性风险预警阈值和分级违约金额预警阈值;
对借款人进行评级分配,对分级风险损失和系统风险损失进行预算;
根据预算结果,通过规则引擎对每个信用等级做出继续贷款、暂停贷款或终止贷款的决策。
与图1的方法相对应,本发明一种对互联网信贷资产进行自动评级的系统,包括:
一致性评估模块,用于对借款人的连续借款行为进行一致性评估;
预测模块,用于对多个借款人在多个贷款机构的审批结果进行预测;
模型建立模块,用于根据一致性评估和预测的结果,建立信用评级模型;
评级模块,用于根据建立的信用评级模型进行自动评级。
进一步作为优选的实施方式,所述一致性评估模块,包括:
获取单元,用于获取借款人的个人征信报告;
判定单元,用于对个人征信报告进行信息提取,得到第一结构化表格数据;
第一生成单元,用于根据第一贷款机构的信贷指标判定标准,生成借款人在第一贷款机构的第一申请批准初始值,以及借款人在第二贷款机构的第二申请批准初值;
第二生成单元,用于根据生成的第一申请批准初值和第二申请批准初值,生成借款人在多个贷款机构的申请批准率。
与图1的方法相对应,本发明一种对互联网信贷资产进行自动评级的装置,包括:
存储器,用于存储程序;
处理器,用于加载所述程序,以执行本发明一种对互联网信贷资产进行自动评级的方法。
本发明一种对互联网信贷资产进行自动评级的方法的具体工作过程如下:
以甲借款人向W银行和K银行贷款为例,假设甲借款人在T+3时刻向W银行贷款,用于房屋装修,四个月(T+7)后甲又向K银行申请贷款,用于购车,则K银行需要对甲进行审核,即执行步骤S1:对借款人的连续借款行为进行一致性评估;
其中,所述步骤S1包括以下步骤:
S11、获取借款人的个人征信报告;
S12、对个人征信报告进行信息提取,得到第一结构化表格数据;拿到借款人的个人征信报告后,假设可以分解为I1~I9九个可量化(主观或客观)的指标,并获得每个月这九个指标的情况,为了方便演示,这里用好(G)和差(B)表示指标随时间的变化,实际上还可以使用量化值表示指标的变化。
得到上述甲的第一结构化表格数据之后,K银行看到的是T0月~T7月甲的数据,W看到的是T0月~T3月甲的数据,K银行可以基于W银行之前的判断,并结合T4月~T7月甲的新增数据,作出批准或拒绝甲的决策。这只是以K银行视角和标准作出的判断,如果K银行混合W银行的视角和标准进行综合判断,可以得到更为全面的判断,即本发明的通过多方判断来降低信贷风险,安全性更高。
在实际应用中,甲向K银行贷款的这一过程中,W银行是不可能参与到对甲的审核过程中的,K银行不会向W银行开放这样的业务,W银行也不会向K银行开放自身的信审标准。所以,本发明提供了一种新型的不依赖其他银行参与的算法,可以帮助K银行实现多方混合判断的效果,该算法的具体原理是:K银行通过学习T3月时W银行对甲的审批过程,并同时采用K银行自己的标准评估,基于T0月~T3月甲的数据,能不能批准甲的贷款申请。然后K银行和W银行共同基于T0~T7月的数据,来评估甲的这次贷款申请。
S13、根据第一贷款机构的信贷指标判定标准,生成借款人在第一贷款机构的第一申请批准初始值,以及借款人在第二贷款机构的第二申请批准初值;
在本实施例中,分别向W银行和K银行赋予批准甲贷款申请的概率值:第一申请批准初始值和第二申请批准初始值其中,这两个初始值是本发明开始阶段的假设值,需要通过后续步骤(即步骤S14)进行修正。
S14、根据生成的第一申请批准初值和第二申请批准初值,生成借款人在多个贷款机构的申请批准率。
其中,所述步骤S14包括以下步骤:
S141、将第二贷款机构的信贷指标判定标准作为隐变量,根据隐变量和第一结构化表格数据,计算对数似然函数;
其中,所述对数似然函数为:LL(θ|X)=In P(X|θ)=In∑Z P(X,Z|θ),
θ代表代表银行赋予批准贷款申请的概率值;X代表第一结构化表格数据;Z代表隐变量;LL()代表对数似然函数;LL(θ|X)代表X不变时,关于θ的一个对数似然函数;P(X|θ)代表在θ已知的情况下观察到X的概率值,因为一开始我们假设了所以可以得到P(X|θ)的概率值;P(X,Z|θ)代表θ不变时,X和Z联合分布的概率值;
另外,本函数引入∑ZP(X,Z|θ)的意义是,如果X和θ之间的关系是明确的,那就不需要引入隐变量Z,但如果X和θ都受Z的影响,则P(X|θ)的值就得通过计算∑ZP(X,Z|θ)来得到;
S142、将第一申请批准初始值作为当前申请批准率θt
S143、根据当前申请批准率θt计算隐变量Z的分布以及对数似然函数LL()关于隐变量的期望值;所述期望值Q的计算公式为:Q(θ|θt)=EZ|X,θtLL(θ|X,Z)
其中,Q(θ|θt)代表在当前θt条件下,θ映射到Q的值;EZ|X,θt代表表示在X和θt已知的情况下,计算对应的期望;LL(θ|X,Z)表示X、Z已知情况下,关于θ的对数似然函数;
S144、根据计算得到的期望值,得到对应于最大化对数似然函数的申请批准率θt+1;其计算公式为:θt+1=arg maxQ(θ|θt),
arg是最优化求解过程中的符号标示,max()代表取最大值;arg maxQ(θ|θt)代表使Q(θ|θt)达到最大值时θ的值。
S145、根据当前申请批准率和第一结构化表格数据,计算风险损失值;
S146、判断风险损失值是否小于设定阈值,若是,则将当前申请批准率作为借款人在多个贷款机构的申请批准率;反之,则将与最大化对数似然函数对应的申请批准率作为申请批准率,并返回执行根据当前申请批准率计算隐变量的分布,并根据隐变量的分布计算对数似然函数关于隐变量的期望值的步骤,直至风险损失值小于设定阈值。
整个步骤S1,代表了K银行在反复迭代过程中获得了对W银行信贷标准的学习,同时在迭代过程中也考虑到自身的信贷标准和风险承受能力,因此该过程也称为串行集成计算过程,其中串行是指连续的时间。
S2、对多个借款人在多个贷款机构的审批结果进行预测;
其中,步骤S2也可以称为并行集成算法,其具体意义是:仍以K银行为例,K银行通过步骤S1可以得到对甲借款人的结合了K银行和W银行信审标准的多方混合判读。但是这个世界并不只有K银行和W银行两家银行,假设乙借款人也向K银行借款,而乙借款人上一次是向F银行银行借款的,如果甲和乙同时向K银行借款,K银行可以用S1的方法分别得到甲和乙的但这两个值不能相互比较,因为前者是基于W银行和K银行标准的,后者是基于F银行和K银行标准的。当然,我们可以将F银行交互到对甲的评价,把W银行交互到对乙的评价,但当借款人和银行的数量都很多的时候,这项工作将变得异常复杂,这种交叉验证对算力的要求巨大,大大的降低了银行的信审效率。因此,本发明通过S2来提供一种兼顾信审效率、可以同时比较不同借款人的方法。
步骤S2包括以下步骤:
S21、获取多个借款人在同一时期的个人征信报告;
S22、对每个借款人在多个贷款机构的申请批准率进行计算,生成第二结构化表格数据;
S23、对第二结构化表格数据中的缺失值进行补全,得到同一时期的多个借款人在多个贷款机构的申请批准率。
其中,步骤S23包括以下步骤:
S231、通过二阶多项式线性模型得到多个贷款机构之间的相似度;
S232、对二阶多项式线性模型的参数进行计算,得到两个低维稠密矩阵;
S233、根据得到的低维稠密矩阵,对第二结构化表格数据进行重构,得到第二结构化表格数据中的缺失值;
S234、根据得到的缺失值对第二结构化表格数据进行补全,并将补全后的第二结构化表格数据作为同一时期的多个借款人在多个贷款机构的申请批准率。
S3、根据一致性评估和预测的结果,建立信用评级模型;
其中,步骤S3包括以下步骤:
S31、确定信用等级的数量;
关于分级数量,理论上增加分级数量会增大风险控制的精度,但分级数量的增长并不会无限制的提高风险控制的精度,一方面对于不同分级的客群,执行的是不同的风控策略,过多的分级,会造成更加复杂的策略组合,这也增加了风控管理的成本,并且分级是以某一指标(或复合指标)为划分基础的,这一指标(或复合指标)通常和待评估信贷资产总体是有相关关系的,但并不是完全线性相关的,在这种情况下,过多的评级并不会提高风险控制的精度。分级数量同时还受到贷款期限、信用波动的影响,一般来说,长期债务时间长,影响面广,信用波动大,采用级别较宽,通常分为9级;而短期债务时间短,信用波动小,级别较窄,一般分为4级。国际惯例中,债券基金的信用质量等级一般划分为7个级别。本实施例将分级数量定为6个:即AAAf、AAf、BBBf、BBf、Bf、CCCf,最高级别为AAAf,风险劣度分别是:最低风险、很低风险、一般风险、不确定风险、风险较高、风险最高。
S32、确定评级指标,并根据信用等级的数量,对每个级别的边界的评级指标进行标识;
步骤S32具体为:获得分级指标后,使用优化方法,获得最优分层点。例如以贷款额度作为分级指标,通过优化方法算得各个级别对应的边界(单位:元)是:
AAAf:≥12000;AAf:[7000,12000);BBBf:[4500,7000);
BBf:[3000,4500);Bf:[2000,3500);CCCf:<2000。
S33、确定每个信用等级的最大容量;该步骤具体为:以损失指标或以损失指标为基础的复合指标为损失度量,利用优化算法,计算每个级别的最大容量。
步骤S33的作用在于:由于不同级别的违约风险概率和违约损失期望值不同,所以,需要对每个级别预设一个最大容量。本发明从总体系统风险的角度对最大容量进行考量,这样较传统做法的优势在于,传统信用评级主要针对中长期贷款,时效性的要求不高,而更广泛的小微金融更倾向于小额高频贷款,这就对信用评级的时效性提出了更高的要求,传统信用评级方法通常是某种相当静态的方法,不足以放映小额高频的贷款特征。预设分级最大容量的目的就是,从系统风险的角度去约束每个级别的风险。例如,某信贷机构推出一款小额信用贷款(5000元~50000元),为这款产品预留的风险损失准备金是100万元,其中为最高级AAAf级预留的风险损失准备金是10万元,平均贷款金额是50000元,也就是说最高可承担两笔贷款违约,如果违约率是0.05%~0.1%,那么AAAf级的最大容量是77笔;如果为最低级CCCf级预留的风险准备金是20万元,平均贷款金额是2000元,也就是最高可承担一百笔贷款违约,如果违约率是0.3%~0.5%,那么CCCf级的最大容量是1677笔。
S34、根据实际违约情况,对系统性风险进行预测性计算;
S35、根据预测性计算的结果,对每个级别的边界的评级指标以及每个信用等级的最大容量进行更新,得到信用评级模型。
在步骤S3中,本发明完成了对信信用评级模型的设计。但在业务运行期间,仍然有许多问题需要解决。例如,某一信用级别中获批的贷款申请人数量超过了该信用级别的最大容量,需要有一个机制将该级别多出的贷款申请人自动降到下一级别,于是,本发明执行了步骤S4。
S4、根据建立的信用评级模型进行自动评级。
其中,步骤S4包括以下步骤:
S41、将信用评级模型部署在规则引擎;
S42、对新增借款人的信用评级结果和还款人的违约数据进行统计分析,得到相应的指标数据;
S43、判断得到的指标数据是否大于设定的指标阈值,若是,则对信用评级模型进行修正操作;反之,则执行下一步骤;其中,所述指标阈值包括系统性风险预警阈值和分级违约金额预警阈值;
S44、对借款人进行评级分配,对分级风险损失和系统风险损失进行预算;
S45、根据预算结果,通过规则引擎对每个信用等级做出继续贷款、暂停贷款或终止贷款的决策。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (10)

1.一种对互联网信贷资产进行自动评级的方法,其特征在于:包括以下步骤:
对借款人的连续借款行为进行一致性评估;
对多个借款人在多个贷款机构的审批结果进行预测;
根据一致性评估和预测的结果,建立信用评级模型;
根据建立的信用评级模型进行自动评级。
2.根据权利要求1所述的一种对互联网信贷资产进行自动评级的方法,其特征在于:所述对借款人的连续借款行为进行一致性评估这一步骤,包括以下步骤:
获取借款人的个人征信报告;
对个人征信报告进行信息提取,得到第一结构化表格数据;
根据第一贷款机构的信贷指标判定标准,生成借款人在第一贷款机构的第一申请批准初始值,以及借款人在第二贷款机构的第二申请批准初值;
根据生成的第一申请批准初值和第二申请批准初值,生成借款人在多个贷款机构的申请批准率。
3.根据权利要求2所述的一种对互联网信贷资产进行自动评级的方法,其特征在于:所述根据生成的第一申请批准初值和第二申请批准初值,生成借款人在多个贷款机构的申请批准率这一步骤,包括以下步骤:
将第二贷款机构的信贷指标判定标准作为隐变量,根据隐变量和第一结构化表格数据,计算对数似然函数;
将第一申请批准初始值作为当前申请批准率;
根据当前申请批准率计算隐变量的分布,并根据隐变量的分布计算对数似然函数关于隐变量的期望值;
根据计算得到的期望值,得到对应于最大化对数似然函数的申请批准率;
根据当前申请批准率和第一结构化表格数据,计算风险损失值;
判断风险损失值是否小于设定阈值,若是,则将当前申请批准率作为借款人在多个贷款机构的申请批准率;反之,则将与最大化对数似然函数对应的申请批准率作为申请批准率,并返回执行根据当前申请批准率计算隐变量的分布,并根据隐变量的分布计算对数似然函数关于隐变量的期望值的步骤,直至风险损失值小于设定阈值。
4.根据权利要求1所述的一种对互联网信贷资产进行自动评级的方法,其特征在于:所述对多个借款人在多个贷款机构的审批结果进行预测这一步骤,包括以下步骤:
获取多个借款人在同一时期的个人征信报告;
对每个借款人在多个贷款机构的申请批准率进行计算,生成第二结构化表格数据;
对第二结构化表格数据中的缺失值进行补全,得到同一时期的多个借款人在多个贷款机构的申请批准率。
5.根据权利要求4所述的一种对互联网信贷资产进行自动评级的方法,其特征在于:所述对第二结构化表格数据中的缺失值进行补全,得到同一时期的多个借款人在多个贷款机构的申请批准率这一步骤,包括以下步骤:
通过二阶多项式线性模型得到多个贷款机构之间的相似度;
对二阶多项式线性模型的参数进行计算,得到两个低维稠密矩阵;
根据得到的低维稠密矩阵,对第二结构化表格数据进行重构,得到第二结构化表格数据中的缺失值;
根据得到的缺失值对第二结构化表格数据进行补全,并将补全后的第二结构化表格数据作为同一时期的多个借款人在多个贷款机构的申请批准率。
6.根据权利要求1所述的一种对互联网信贷资产进行自动评级的方法,其特征在于:所述根据一致性评估和预测的结果,建立信用评级模型这一步骤,包括以下步骤:
确定信用等级的数量;
确定评级指标,并根据信用等级的数量,对每个级别的边界的评级指标进行标识;
确定每个信用等级的最大容量;
根据实际违约情况,对系统性风险进行预测性计算;
根据预测性计算的结果,对每个级别的边界的评级指标以及每个信用等级的最大容量进行更新,得到信用评级模型。
7.根据权利要求1所述的一种对互联网信贷资产进行自动评级的方法,其特征在于:所述根据建立的信用评级模型进行自动评级这一步骤,包括以下步骤:
将信用评级模型部署在规则引擎;
对新增借款人的信用评级结果和还款人的违约数据进行统计分析,得到相应的指标数据;
判断得到的指标数据是否大于设定的指标阈值,若是,则对信用评级模型进行修正操作;反之,则执行下一步骤;其中,所述指标阈值包括系统性风险预警阈值和分级违约金额预警阈值;
对借款人进行评级分配,对分级风险损失和系统风险损失进行预算;
根据预算结果,通过规则引擎对每个信用等级做出继续贷款、暂停贷款或终止贷款的决策。
8.一种对互联网信贷资产进行自动评级的系统,其特征在于:包括:
一致性评估模块,用于对借款人的连续借款行为进行一致性评估;
预测模块,用于对多个借款人在多个贷款机构的审批结果进行预测;
模型建立模块,用于根据一致性评估和预测的结果,建立信用评级模型;
评级模块,用于根据建立的信用评级模型进行自动评级。
9.根据权利要求8所述的一种对互联网信贷资产进行自动评级的系统,其特征在于:所述一致性评估模块,包括:
获取单元,用于获取借款人的个人征信报告;
判定单元,用于对个人征信报告进行信息提取,得到第一结构化表格数据;
第一生成单元,用于根据第一贷款机构的信贷指标判定标准,生成借款人在第一贷款机构的第一申请批准初始值,以及借款人在第二贷款机构的第二申请批准初值;
第二生成单元,用于根据生成的第一申请批准初值和第二申请批准初值,生成借款人在多个贷款机构的申请批准率。
10.一种对互联网信贷资产进行自动评级的装置,其特征在于:包括:
存储器,用于存储程序;
处理器,用于加载所述程序,以执行如权利要求1-7任一项所述的一种对互联网信贷资产进行自动评级的方法。
CN201810119222.3A 2018-02-06 2018-02-06 一种对互联网信贷资产进行自动评级的方法、系统及装置 Active CN108389120B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810119222.3A CN108389120B (zh) 2018-02-06 2018-02-06 一种对互联网信贷资产进行自动评级的方法、系统及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810119222.3A CN108389120B (zh) 2018-02-06 2018-02-06 一种对互联网信贷资产进行自动评级的方法、系统及装置

Publications (2)

Publication Number Publication Date
CN108389120A true CN108389120A (zh) 2018-08-10
CN108389120B CN108389120B (zh) 2022-03-15

Family

ID=63075239

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810119222.3A Active CN108389120B (zh) 2018-02-06 2018-02-06 一种对互联网信贷资产进行自动评级的方法、系统及装置

Country Status (1)

Country Link
CN (1) CN108389120B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255536A (zh) * 2018-09-07 2019-01-22 深圳前海微众银行股份有限公司 债权催收方法、装置、系统及存储介质
CN109523138A (zh) * 2018-10-30 2019-03-26 长威信息科技发展股份有限公司 一种基于规则引擎的信用评级计算方法
CN109727125A (zh) * 2019-01-25 2019-05-07 深圳乐信软件技术有限公司 借款金额预测方法、装置、服务器、存储介质
CN110322342A (zh) * 2019-06-27 2019-10-11 上海上湖信息技术有限公司 借贷风险预测模型的构建方法、系统及借贷风险预测方法
CN111047435A (zh) * 2019-12-23 2020-04-21 支付宝(杭州)信息技术有限公司 信贷数据处理、信贷分配方法、装置及电子设备
CN111932367A (zh) * 2020-08-13 2020-11-13 中国银行股份有限公司 贷前信用评估方法及装置
CN112200340A (zh) * 2019-08-08 2021-01-08 北京天德博源科技有限公司 预测逃废债区块链系统
CN113438075A (zh) * 2021-06-25 2021-09-24 四川新网银行股份有限公司 一种基于秘密分享算法的多头时序图计算方法及存储介质
CN116308158A (zh) * 2023-03-09 2023-06-23 广东铭太信息科技有限公司 一种国有资产监督管理系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050273406A1 (en) * 2003-04-08 2005-12-08 Lending Tree, Inc. Method and computer network for co-ordinating a loan over the internet
CN106157132A (zh) * 2016-06-20 2016-11-23 中国工商银行股份有限公司 信用风险监控系统及方法
CN107424070A (zh) * 2017-03-29 2017-12-01 广州汇融易互联网金融信息服务有限公司 一种基于机器学习的贷款用户信用评级方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050273406A1 (en) * 2003-04-08 2005-12-08 Lending Tree, Inc. Method and computer network for co-ordinating a loan over the internet
CN106157132A (zh) * 2016-06-20 2016-11-23 中国工商银行股份有限公司 信用风险监控系统及方法
CN107424070A (zh) * 2017-03-29 2017-12-01 广州汇融易互联网金融信息服务有限公司 一种基于机器学习的贷款用户信用评级方法及系统

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255536A (zh) * 2018-09-07 2019-01-22 深圳前海微众银行股份有限公司 债权催收方法、装置、系统及存储介质
CN109523138A (zh) * 2018-10-30 2019-03-26 长威信息科技发展股份有限公司 一种基于规则引擎的信用评级计算方法
CN109727125A (zh) * 2019-01-25 2019-05-07 深圳乐信软件技术有限公司 借款金额预测方法、装置、服务器、存储介质
CN110322342A (zh) * 2019-06-27 2019-10-11 上海上湖信息技术有限公司 借贷风险预测模型的构建方法、系统及借贷风险预测方法
CN110322342B (zh) * 2019-06-27 2022-05-06 上海上湖信息技术有限公司 借贷风险预测模型的构建方法、系统及借贷风险预测方法
CN112200340A (zh) * 2019-08-08 2021-01-08 北京天德博源科技有限公司 预测逃废债区块链系统
CN111047435A (zh) * 2019-12-23 2020-04-21 支付宝(杭州)信息技术有限公司 信贷数据处理、信贷分配方法、装置及电子设备
CN111932367A (zh) * 2020-08-13 2020-11-13 中国银行股份有限公司 贷前信用评估方法及装置
CN113438075A (zh) * 2021-06-25 2021-09-24 四川新网银行股份有限公司 一种基于秘密分享算法的多头时序图计算方法及存储介质
CN116308158A (zh) * 2023-03-09 2023-06-23 广东铭太信息科技有限公司 一种国有资产监督管理系统
CN116308158B (zh) * 2023-03-09 2023-10-20 广东铭太信息科技有限公司 一种国有资产监督管理系统

Also Published As

Publication number Publication date
CN108389120B (zh) 2022-03-15

Similar Documents

Publication Publication Date Title
CN108389120A (zh) 一种对互联网信贷资产进行自动评级的方法、系统及装置
Koh et al. A two-step method to construct credit scoring models with data mining techniques
Arciero et al. Exploring agent-based methods for the analysis of payment systems: A crisis model for StarLogo TNG
Ereiz Predicting default loans using machine learning (OptiML)
CN110909984A (zh) 业务数据处理模型训练方法、业务数据处理方法及装置
Bahnsen et al. Evolutionary algorithms for selecting the architecture of a MLP neural network: A credit scoring case
CN111383091A (zh) 一种资产证券化定价方法和装置
Moreno-Moreno et al. Success factors in peer-to-business (P2B) crowdlending: A predictive approach
Eddy et al. Credit scoring models: Techniques and issues
Yu et al. Prediction of systemic risk contagion based on a dynamic complex network model using machine learning algorithm
Qi et al. Application of explainable machine learning based on Catboost in credit scoring
Li et al. Application of XGBoost in P2P default prediction
Li et al. Predicting loss given default of unsecured consumer loans with time-varying survival scores
Moon et al. Survival analysis for technology credit scoring adjusting total perception
Sousa et al. Links between scores, real default and pricing: Evidence from the Freddie Mac’s loan-level dataset
Botha et al. The loss optimisation of loan recovery decision times using forecast cash flows
Weidig Risk model for venture capital funds
Haliplii et al. To mine or not to mine? the bitcoin mining paradox
Holmberg Banking and the determinants of credit crunches
Nkou Mananga et al. A network approach to interbank contagion risk in South Africa
Kim Empirical evidence of faulty credit scoring and business failure in P2P lending
US20240087033A1 (en) Systems and methods for creating and managing collateralized municipal loan obligations
Yang et al. Interbank Contagion: An Agent-Based Model (ABM) Approach to Endogenously Formed Networks
CN117788139A (zh) 信息输出模型的训练方法、装置、计算机设备、存储介质
Perkins et al. Predicting credit ratings with a GA-MLP hybrid

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220523

Address after: 519000 room 1103, building 13, No. 798, qinzheng Road, Hengqin new area, Zhuhai City, Guangdong Province

Patentee after: Guangdong Hengqin Guangdong Macao deep cooperation zone Lvling Technology Co.,Ltd.

Address before: 519000 room 101-168, building 1, Hengqin creative Valley, No. 1889, Huandao East Road, Hengqin new area, Zhuhai, Guangdong (centralized office area)

Patentee before: GUANGDONG HONEBAY FINTECH INFORMATION TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right