CN105308640A - 用于自动生成高质量不良行为通知的方法和系统 - Google Patents

用于自动生成高质量不良行为通知的方法和系统 Download PDF

Info

Publication number
CN105308640A
CN105308640A CN201480006945.2A CN201480006945A CN105308640A CN 105308640 A CN105308640 A CN 105308640A CN 201480006945 A CN201480006945 A CN 201480006945A CN 105308640 A CN105308640 A CN 105308640A
Authority
CN
China
Prior art keywords
debit
credit
variable
metavariable
central computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201480006945.2A
Other languages
English (en)
Inventor
J.W.L.默里尔
S.M.布德
J.肯迪多
L.古
F.海里
J.P.麦圭尔
D.C.默里尔
M.皮纳马内尼
M.西奈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zestfinance Inc
Original Assignee
Zestfinance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zestfinance Inc filed Critical Zestfinance Inc
Publication of CN105308640A publication Critical patent/CN105308640A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Abstract

一般来说,本发明涉及个人金融和银行领域,以及更具体来说,涉及贷款和信用通知方法及系统的领域。本发明的优选实施例提供用于在采用简单和复杂信用评分系统情况下基于识别被拒绝借方简档与批准申请人简档之间的变化、使用特定算法来自动生成高质量不良行为通知的系统和方法。

Description

用于自动生成高质量不良行为通知的方法和系统
技术领域
一般来说,本发明涉及个人金融和银行领域,以及更具体来说,涉及贷款和信用通知方法及系统的领域。
背景技术
人们每天使用信贷进行大小宗购物。贷方(例如银行和信用卡公司)使用“信用分数”来评估贷出金额所造成的潜在风险。这些措施旨在确定某人将偿还其债务的可能性。
但是,信用评分系统是最近的革新。在20世纪50年代和60年代,信贷决策由认识申请人的银行信贷职员进行。由于申请人通常生活在同一城镇,所以信贷职员基于其对申请人的了解进行主观决定。然后,在20世纪70年代,“FICO分数”的出现使信贷更为可用,从而从该过程中有效地去除信贷职员。随着使用统计计算来测量风险的思路变得流行,贷方开始使用多种其他信用评分方法和模型。示例包括简单系统(例如由Experian、Equifax、TransUnion所提供的那些系统)以及具有许多传统和非传统变量和数千个元变量的高级模型,例如本申请人在美国申请13/454970及其相关继续申请中所述的模型。
由于与贷方减少的物理交互以及计算“信贷价值”的增加计算复杂度,消费者对“推动”其信用分数的方面的可见性变小。
作为响应,诸如消费信贷保护法案和联邦平等信贷机会法案之类的法律被部分设计成确保借方不是因差别对待而被拒绝贷款。它们也被部分设计成对消费者就他们被拒绝贷款的原因进行指导。
联邦和某些州法律要求贷方向被拒申请人发送“不良行为信函”,说明那些决定的原因。在理论上,信函还应当给予借方机会以:(1)确定其记录中是否存在导致信贷拒绝的错误;以及(2)为借方提供帮助识别其信用历史的哪一(哪些)部分是有问题的信息。
但是,贷方仅做到最低遵守,常常提供其决定的一般原因。遗憾的是,这些不良行为信函对实际帮助消费者核实其信用历史和/或确定哪些行为可能增加其信贷价值(至少在涉及这些数学模型的程度上)起了很少作用。这种结果从贷款政策观点来看不是有益的,因为消费者没有得到他们所需的。
但是,生成提供有用的消费者反馈的不良行为信函不是简单的任务。将市场因素描述为拒绝原因本身就是复杂工作。但是,当与较新的数学信用评分模型的复杂度相混合时,有效传递原因的工作变得棘手得多。实际上,共同或分别地指出与增加的信用分数相互关联的一个或多个变量涉及复杂分析,鲜有贷方(即使有的话)愿意费心执行该分析,更不用说传递给其消费者了。
因而,用于生成高质量不良行为信函的改进系统和方法会是合乎需要的。
发明内容
为了对现有系统进行改进,本发明的优选实施例提供用于自动生成高质量不良行为通知的系统和方法。一种用于自动生成高质量不良行为通知的优选方法能够包括:在第一计算机输入和/或导入借方数据集和贷方信贷标准(借方数据和贷方标准);以贷方的算法处理数据集变量和/或变量集合,以识别哪些变量在被改变时引起增加的信用分数(字段选择);对借方数据集中的单独变量和/或变量集合进行评级,以产生信用分数的最大差(字段评级);以及生成表明哪些变量和/或变量集合在被改变时引起可接受信用分数的报告(原因测试生成)。如以下所述,该优选方法还能够包括将原因集合生成格式化为不良行为信函,该不良行为信函是消费者可理解和可用的(不良行为信函生成)。下面参照附图详细描述本优选实施例的系统和方法的其他变化、特征和方面。
本发明可单独使用(通过简单地生成不良行为信函),或者在备选方案中,本发明还可与用于向借方提供信贷的系统和方法相互联系并且结合使用。这类系统和方法的示例在DouglasMerrill等人的标题为“SystemandMethodforProvidingCredittoUnderservedBorrowers”的美国专利申请No.13/454970中描述,通过引用将其(“Merrill申请”)完整地结合于此。
通过研究以下附图和具体实施方式,本领域的技术人员将会清楚地知道本发明的其他系统、方法、特征和优点。预计所有这类附加系统、方法、特征和优点都包含在本描述之内,包含在本发明的范围之内,并受到所附权利要求书保护。
附图说明
为了更好地理解如何得到本发明的上述和其他优点及目的,以上概述的实施例的更具体描述将通过参照其具体实施例(实施例在附图中示出)来呈现。应当注意,附图中的组件不一定按照规定比例,重点而是在于示出本发明的原理。此外,附图中,相似参考标号在不同视图中始终表示对应部件。但是,相似部件不一定总是具有相似参考标号。此外,所有图示意在传达概念,其中相对尺寸、形状和其他详细属性可示意地而不是确切或准确地示出。
图1是按照本发明的一优选实施例、用于自动生成高质量不良行为通知的系统的简图。
图2是示出用以自动生成高质量不良行为通知的方法的一示范实施例的总流程图。
图3是示出用于重要字段选择的方法的一示范实施例的流程图。
图4是示出用于查找充分性路径的方法的一示范实施例的流程图。
图5a是示出如用于确定充分性路径的方法中所包含的简略标题为“交换代码”的一备选示范实施例的流程图。
图5b是示出如用于确定充分性路径的方法中所包含的简略标题为“根据评分选择”的一备选示范实施例的流程图。
图5c是示出如用于确定充分性路径的方法中所包含的简略标题为“变异”(mutation)的一备选示范实施例的流程图。
图5d是示出如用于确定充分性路径的方法中所包含的简略标题为“交迭”(cross-over)的一备选示范实施例的流程图。
定义
下列定义不是意在改变以下术语的平常含意,而是意在帮助读者说明以下发明概念:
如本文所使用的术语“借方装置”将一般表示台式计算机、膝上型计算机、笔记本计算机、平板计算机、移动装置(例如智能电话或个人数字助理)、智能TV、游戏控制台、流播视频播放器或者任何其他适当联网装置,该联网装置具有配置成与“中央计算机”、“用户装置”和/或优选系统10的一个或多个组件进行接口和/或接收至/自“中央计算机”、“用户装置”和/或优选系统10的一个或多个组件的任何或全部数据的网页浏览器或独立应用。
如本文所使用的术语“用户装置”将一般表示台式计算机、膝上型计算机、笔记本计算机、平板计算机、移动装置(例如智能电话或个人数字助理)、智能TV、游戏控制台、流播视频播放器或者任何其他适当联网装置,该联网装置具有配置成与“中央计算机”、“借方装置”和/或优选系统10的一个或多个组件进行接口和/或接收至/自“中央计算机”、“借方装置”和/或优选系统10的一个或多个组件的任何或全部数据的网页浏览器或独立应用。
如本文所使用的术语“中央计算机”将一般表示一个或多个子组件或机器,其配置用于接收、操纵、配置、分析、合成、传递和/或处理与借方以及贷方关联的数据。上述子组件或机器的任一个能够可选地集成到单个操作单元中,或者通过联网或者基于云的资源来分布于全部多个硬件实体。此外,中央计算机可配置成与“用户装置”、“借方装置”和/或优选系统10的一个或多个组件进行接口和/或接收至/自“用户装置”、“借方装置”和/或优选系统10的一个或多个组件的任何或全部数据,如图1所示。“中央计算机”也可以是Merrill申请中更详细描述的相同装置,通过引用将其完整地结合于此。
如本文所使用的术语“借方数据”将一般表示借方的贷款申请中如借方所输入的数据或者“借方装置”、“用户装置”或“中央计算机”中代表借方的数据。作为举例,这个数据可包括传统信用相关信息,例如借方的社保号、驾照号、出生日期或者借方所要求的其他信息。这个数据还可包括通过支付一定费用而经由私人或政府所有的数据存储器(非限制性地包括经由包含数据的馈送(feeds)、数据库或文件)所获取的专有信息。备选地,这个数据可包括经由一个或多个搜索字符串、自动化抓取或挖取,使用任何适当搜索、抓取或挖取过程、程序或协议而在因特网上可免费得到或以一定的名义成本得到的公共信息。此外,借方数据可包括与借方简档和/或社交网络上任何博客、帖子、推送(tweets)、链接、好友、喜好(likes)、联络(connections)、粉丝(followers)、关注(followings)、钉图(pins)(统称为借方的社交图谱)相关的信息。上述示例的列表不是穷尽性的。
如本文所使用的术语“贷方标准”将一般表示贷方用以决定接受或拒绝信贷申请的标准,该标准在“用户装置”或“中央计算机”中周期地设置。作为举例,这些标准可包括基于“借方数据”中的各个数据点(诸如目前居住时间长度>6个月)或者基于确定借方的信贷价值的复杂数学模型的接受或拒绝标准。
如本文所使用的术语“网络”将一般表示全球因特网、广域网(WAN)、局域网(LAN)和/或近场网络的任何适当组合以及任何适当联网软件、固件、硬件、路由器、调制解调器、电缆、收发器、天线等。优选系统10的组件的部分或全部能够通过有线或无线部件并且使用任何适当通信协议、层、地址、媒体类型、应用编程接口和/或支持通信硬件、固件和/或软件来访问网络。
如本文和权利要求书所使用的单数形式“一”、“一个”和“该”、“所述”包括复数引用,除非上下文另加明确规定。
除非另加定义,否则本文所使用的所有科技术语具有与本领域的技术人员普遍理解的相同含意。
具体实施方式
本发明的优选实施例的以下描述并不是要将本发明限制到这些优选实施例,而是要使任何本领域的技术人员能够利用和使用本发明。虽然与本文所述的相似或等效的任何方法、资料和装置能够用于实施例的实施或测试中,但是现在描述优选方法、资料和装置。
本发明涉及用于自动生成高质量不良行为通知的改进方法和系统,其中不良行为通知包括针对个体以及其他类型的实体(包括但不限于法人、公司、小企业和信托以及任何其他经过验证的金融实体)的通知。
在描述优选系统和方法之前,参照依据就绪:正如许多消费者所知道,某人的信用历史由多个变量组成,例如此人当前的负债额、其收入稳定性、其以往偿还债务历史(逾期或无法支付)以及其信贷历史的长度。但是,消费者常常不理解,现代信用评分系统的复杂度已经显著增加,现在包含许多变量,也包含元变量。
但是,信贷申请通常以相当老套的方式来保证(underwritten)。首先,从申请人处采集信息,从而生成申请。这个申请采用与该申请相关的其他数据来补充,包括公共可用数据(例如“是否有针对申请人提出的有效留置权”)或者专有数据(例如“此人在过去90天提交了多少信贷申请?”)。将所产生记录提供给“评分系统”,该评分系统向申请指配一数值分数。将这个分数与阈值进行比较,以及如果该分数超过那个阈值,则申请人收到贷款。
在给定这个过程的情况下,确定被拒绝申请的原因的问题看来是简单的:简单地仔细检查评分过程中使用的变量(又称作“信号”)的列表,并且查找可能使分数朝阈值变化的变量。这种表象可能是欺骗性的。
现代评分函数几乎从不产生单调基准信号。甚至使用单调函数、例如逻辑回归来产生其最终输出的评分系统使用中间元变量,中间元变量将主信号变换为精炼信号,精炼信号在那些主信号的值中不再是单调的。因此,认识到给定信号的小变化局部增加给定申请的申请分数无法确保该同一信号的大变化仍将必然增加申请分数。另外,由于单个变量的变化可能没有与若干变量共同的变化相同的效果,所以在搜索“更好结果”时考虑单个变量波动不一定是足够的。
因为推动申请人的分数的基本变量的检测已变得极为复杂,所以明白地报告某人的分数的不足的正确原因不仅要求复杂分析,而且还要求转化为可理解语言。实际上,正是由于这种复杂度,鲜有贷方(若有的话)会费心执行分析,更不用说传递给其消费者了。本发明的优选实施例通过用于执行分析并且明白地传递结果的自动化方法和过程来解决这个问题,如以下进一步描述:
系统:
如图1所示,按照一优选实施例、用于自动生成高质量不良行为通知的优选操作环境能够一般包括数据源(借方的申请13和贷方的信用模型15)、用户装置30、中央计算机20、网络40以及一个或多个通信装置,通过该一个或多个通信装置向借方发出不良行为信函,通信装置包括借方装置12、电子邮件服务器30和/或打印服务器40。优选系统10能够至少包括:数据源(借方的申请13和贷方的信用模型15),以及分析和处理数据源的计算机(中央计算机20和/或用户装置30),数据源和计算机用来生成高质量不良行为通知。为了清楚起见,借方申请13应当包括借方数据中的一个或多个变量,以及贷方的信用模型15应当包括来自贷方的标准的一个或多个算法。具体来说,优选系统10用来通过访问、评估、测量、量化和利用以下所述的新的独特方法来帮助借方确定其信用文件的准确度以及提供信息以改进其信贷价值。
更具体来说,本发明涉及用于自动生成高质量不良行为通知的优选方法,该优选方法在采集和/或下载借方的数据13和贷方标准15之后在中央计算机20和/或用户装置30中发生。
方法:
图2提供示出一种用于自动生成高质量不良行为通知的优选方法的流程图,该方法涉及下列步骤:(a)采集失败信贷申请的借方数据100;(b)重要字段选择200(以将借方数据与贷方标准600进行比较);(c)字段评级300;(d)原因文本生成400;以及(e)生成不良行为信函500。
在第一步骤,暂时采集来自借方的失败申请的所有数据(借方数据100),以供计算机(例如图1中的中央计算机20)收集。例如,借方数据100可包括典型金融数据,例如借方的当前薪资、最近就业时间长度和破产次数。另外,借方数据100可包括借方的其他独特方面、例如借方已经涉及或者当前涉及的组织的数量、借方具有的好友数量或者借方身份和历史的其他非传统方面(例如Merrill申请中指出的那些方面)。借方数据100的子集用来确定借方的信用分数。
为了便于说明,下面示出“A”小姐(有信誉申请人)、“B”先生(被拒申请人)、平均批准申请人和理想申请人的假想借方数据100:
又参照图2,第二步骤是重要字段选择200。重要字段选择是创建借方数据变量的列表,在那些变量被改变并且通过贷方标准600来处理时变量的值将申请的信用分数减少或增加充分可感知量。
如图3所示,重要字段选择200可通过确定借方的信贷申请与“理想申请”之间的最短路径(最短路径210)来实现。备选地,重要字段选择200可通过查找借方的申请与被批准提供资金的“充分申请”之间的最重要变化(充分性路径220)来实现。下面论述两种方法:
以第一方法开始,最短路径210:顾名思义,最短路径210是一种协议,在该协议中识别所有字段(变量)的列表,其中在借方数据与“理想”申请人的数据之间存在差异。给定“理想”申请(获得最高可能分数的申请)将始终被提供资金的情况下,构建不批准不同申请的原因的说明的一种方式是查找未提供资金申请与理想申请之间的差异集合。因此,作为初步步骤,优选方法是记录两个申请不一致的字段的列表。
作为举例,我们再次参照假想信贷申请人“B”先生,其最短路径如下:
变量 “B”先生 理想申请人 差异
所请求贷款 $7500 <$3000 $4500
收入 $65K $100K $35K
租金 $1200/月 $1000/月 $200/月
地址 7个地址 1个地址 6个地址
SSN 四(4)个 一(1)个 3个SSN
信用分数 75 100 25
重要的是要记住,借方数据100可包括数十个变量或者数十万个元变量。并且取决于贷方的信用评分系统的复杂度,那些变量和元变量的部分或者大部分可能没有用于确定借方的信用分数中。最短路径210在(1)识别其信用简档中的瑕疵以及(2)确定哪些行为对改进其信贷价值是必要的方面对申请人可能没有帮助。因此,如果申请人在“矫正”其信用简档的部分中采取选择性动作,则那些变化可能没有引起满足贷方标准600的分数改进。换言之,借方可能无法识别哪些变量是重要的以及哪些只是无价值的。
因此,最短路径210中的优选方法包括中间步骤,其消除“低影响”字段(这些字段稍后从原因文本生成400中以及又在不良行为信函500中省略,如先前在图2中所示)。
与逻辑结论相反,用于消除“低影响”字段的优选方法没有直接识别“低影响”字段。更确切地,焦点是查找重要的“信号”。并且为了查找重要的信号,优选方法是拣选要求从给定申请到具有理想分数的申请的最小变换(即,最短路径)的变量。可随机地选择单一路径,多个信号然后基于其相对影响来选择。备选地,如果多个路径是可用的,则变量的列表在可能的情况下根据频率来评级。
路径查找是图表或连续域中的机器学习方面的深入研究问题,以及存在用于查找最佳或近似最佳路径的许多深入研究算法,非限制性地包括:蚁群优化、基于群的优化技术、最陡和随机下降算法。另外,存在许多可用的多维优化算法,其自第一台计算机被构建以来已经是计算机科学中的主要研究领域。其他路径查找算法也可根据对数据集和/或预期结果的适合性来使用。因此,取决于贷方标准600中的算法的性质,这些路径查找算法可单一地或者按照混合方式来应用,这取决于贷方标准和/或借方数据100的特征是否为连续和/或离散的。
为了示出连续和离散贷方标准和/或借方数据100之间的差异,附加示例可能是有帮助的。贷方标准可能是离散的(例如,借方具有工作和支票账户?)。类似地,借方信号也可能是离散的(例如,借方已就业吗(是/否)?借方具有银行账户吗(是/否)?)相反,贷方标准能够是连续的(按照申请人每周消耗的平均酒精量对申请负面加权)。并且对应借方信号也将是连续的(在上周你喝了多少啤酒?葡萄酒杯数?混合饮料/其他蒸馏液体产品?)
最短路径210还可被“过滤”,由此对表面上假字段(例如某人在社交媒体中具有的好友数量)的拒绝可从重要字段选择200列表中消除。
图4提供说明查找最短路径210的优选方法中的第二视角。为了查找最短路径210,进行(一个或多个)已知良好申请211与(一个或多个)已知不良申请212的比较。从这个比较,可得到相同信号213和不同信号214的列表。此后,产生不同信号214的对变量/字段的递增变化将针对一系列选择测试215来运行。一个测试可确定对各个变量或者变量集合的变化是否引起充分改进的信用分数。第二测试可消除在被改变时没有引起申请人的信用分数中的充分改进—或者任何改进—的那些字段。第三测试可包括手工筛选,由此为了便于管理而消除某些变量/字段。
又参照图3,重要字段选择200的第二优选方法可通过查找至充分申请的路径(充分性路径220)中的最重要变化来实现。
与一般返回一条路径(或者取决于在确定“理想申请”中采用的测试,几条路径)的最短路径方法210不同,充分性路径220可能返回许多至可提供资金的路径。
用于生成充分性路径220的优选方法寻求从给定申请到具有超过所指定阈值的分数的申请的最短路径(其中阈值不大于评分函数的最大可能值)。这样做的方法与在最短路径210找到的方法相似,只不过不是将借方的简档与理想申请进行比较,而是将它与被接受申请人的集合进行比较。
存在比理想路径要多得多的充分性路径200。遗憾的是,可能的“可接受”申请的范围通常没有令人满意地构成。在申请的不同信号之间存在许多细小交互。这表示信号的某个集合可能发生。但是,往往存在如此多的变化集合,使得实际上不可能检查每种可能性以达到可接受申请。作为替换,本发明的优选方法用于在与先前收集的已批准申请人相比时,识别失败申请的变化的集合。
取决于贷方标准的复杂度,所交换字段的列表的子集的数量在字段的数量方面成指数增长。不可能枚举它们的全部。作为替换,优选方式是概率的:获取所交换字段的集合的随机子集,并且测量所产生分数变化。在这类情况下,优选方法是使用针对所有样本的分数变化。结果是各个字段对最终分数变化的贡献的粗略加权。
作为举例,我们再次参照假想信贷申请人“B”先生,其充分性路径如下:
又参照图2,第三步骤是字段评级300。字段评级300的优选方式将取决于重要字段选择200是通过最短路径方法210还是通过充分性路径220来实现。
如果采用最短路径方法210,则评级(虽然有可能)纯粹是理论的。实际上以及如果明确指定,则最短路径的截取实际上创建字段的长列表的“一无所有”结果。换言之,由于最短路径所指示的所有变化是使申请成为可提供资金所需的,所以不需要对重要字段选择200进行评级。
如果采用充分性路径220,则优选方法通过对字段进行评级来调节字段的数量以使得较高评级的字段对通过分数比较低评级的字段贡献更多。
因为可能存在到阈值的多于一个最短路径,所以优选评级方法将采用表决策略。在优选方法中,计算机执行对于到所指定阈值的许多路径的许多同时搜索,并且然后计算机基于出现给定字段的路径的数量进行表决。示例包括但不限于:最大数量的路径中的成员资格、具有最大影响的变化或者它们的某个组合。方法的完全枚举是不可能的。但是,优选方法将设法具有与信号影响的有意义相关性,并且在可能的情况下避免合并到任意评级或评分函数中。然而任意评级或评分函数是备选方法。
例如,假定B先生的借方数据具有26个可能的充分性路径220。以及在那些列表中,“贷款金额-收入”元变量出现21次,变量“社保号”出现16次,以及变量“地址的数量”出现4次。进一步假设字段评级300中的协议之一要求应当报告出现总体路径的至少20%(或者5次出现)的字段。在这个示例中,“贷款金额-收入”和“社保号的数量”是最高的并且按照这个顺序。
对字段评级300的备选方法是估计至最终分数差异的各路径中的各字段的“贡献”。如上所述,这样做的一种方法是获取任何给定路径的字段的随机样本,并计算产生于仅使用那些字段中的值的分数,以及获取跨包含各字段作为重要性分数的所有路径的平均差异(同时按照其重要性对字段进行评级)。
但是,用于识别“贡献”(又称作创建“加权重要性分数”)的优选方法通过使用(1)通过评分方法的评级或者(2)经过遗传算法来实现。
在本发明中,任一电子方法能够用来更有效地选择高影响变化的大多数定期发生集合,可使这些集合处于引起信贷批准的路径集合(或者路径的聚合部分)中。
通过评分方法的评级显著减少对引起可接受信用分数的充分路径(或者其部分)的搜索数量。不是使用变量的完全随机选择,而是通过评分的评级将多个项编组为小集合来按联赛风格评估。因此,通过限制可编组的集合的数量,通过评分的评级对路径的有限但不断减少的随机群体(其此后被评级)有效地评级。
简单示例可提供有帮助背景:如图5a(单个关联交换分数)所示,这发生在不完善变量的一个集合(ID301)的值被替换(交换列表303),引起新的并且优选地为可接受的所产生信用分数(分数302)时。
如图5b所示,当多个字段为不完善时,评级可通过“通过评分的评级”进行。本质上,对重要性分数评级通过将变量的初始集合的值(原始选择310)替换为第二集合的值(修改的通过评分的评级311)并且然后通过对可能的替换进行评分来实现。这个过程可能被给予有限总体(例如计算机,请选择变量的1000个随机集合),然后继续交换变量的组合—联赛风格—直到大多数有影响力的变化被识别和评级。
在通过评分的评级的备选方案中,可采用遗传算法的使用。遗传算法是计算科学的深入研究领域,其设法生成对优化和搜索问题的有用解决方案。在本发明中,遗传算法搜出最频繁并且最有效产生可接受信用分数的“路径段”。
在其核心,遗传算法使用交迭和变异的进化过程,以随机地组装来自解决方案的现有群体的新后代。父解决方案然后被“选择”成生成与其适合度成比例的后代。单独模型与取得有信誉分数越适合或匹配得越好,则它将越经常向后续代贡献其遗传信息。
在本发明中,遗传算法首先参与变异(随机地识别变量的集合并且改变变量的那些集合中的值),“交迭”变量集合(即,查找要改变的变量和值的最有效集合),并且然后“选择”比其他路径更有影响的路径的群体。这个过程通过变量集合中的许多“代”的变化迭代地重复进行和优化,以确定变化的各集合对引起通过信用分数影响有多大。在各连续代期间,现有群体的一部分被选择为繁殖新一代。各个解决方案通过基于适合度的过程来选择,其中更适合的解决方案(定量地产生信用分数的更大变化的变化集合)通常更可能被选择。
变量的最初选择集合的数量以及在传统上受到限制的代(例如,计算机请拣选变量的1000个集合或者计算机请将您的搜索限制到100代)以限制处理时间。
为了以图形方式示出该概念,变异在图5c中示出。本质上,变异在一个交换列表与另一个列表之间替换交换点320。
如图5d所示,“交迭”通过在各种可能性之间使可能替换进行变异,将变量/值的初始集合(原始选择310)替换为变量/值的第二集合(修改的通过评分的评级311)。
一般来说,平均适合度将增加,因为只有来自第一代的最佳解决方案,连同不太适合的解决方案的一小部分,被选择用于繁殖。这些不太适合的解决方案确保父解决方案的群体中的多样性,并且因此确保后一代子的遗传多样性。
换言之,变异和/或交迭进行操作以产生多个不同候选,这些候选然后根据其分数来评级(最高到最低),并且然后按照各分数采用权重来重新取样。
示例可对进一步说明变异和交迭有帮助。考虑具有五个输入信号的系统:年龄、就业状态、银行账户状态、收入以及家庭与工作之间的距离。贷方标准规定仅接受具有就业和支票账户的申请人。此外,如果申请人每年挣得少于$40000和/或申请人居住在离申请人的就业地点超过20英里,则贷方标准将引起拒绝。年龄被完全忽略。三个假设被拒申请人可具有下列数据:
申请人C 申请人D 申请人E
年龄 61 35 37
就业 否,但是…
支票账户
收入 $50000养老金 $35000 $30000
距离 0 25 27
在优选方法中,三个申请人(C、D和E)的每个的最“重要原因”将首先寻找交换的随机选择集合。那些交换的每个然后被评分。通过将各申请人与提供资金申请进行比较,优选方法生成各变量的频率集合(或者其随机选择集合)。使用各变量(或变量集合)的值的随机置换将花费过度的时间周期。因此,优选方法可单独或者成块地交换值。这个所产生集合产生排序:申请C需要工作和支票账户,申请D需要更靠近工作居住,以及申请E需要支票账户并且居住更近。
更广义来说,这些评级协议分成两个类别:连续参数和离散搜索空间。对于连续参数,算法搜索参数(例如回归和Lyapunov泛函约化)特别适合。但是,对于离散搜索空间,其他适当搜索空间算法(例如完全随机搜索、模拟退火和/或其他遗传算法)更好地适合。
为了概括和进一步示出图2中的前三个步骤(采集借方数据100、通过与贷方标准600进行比较来执行重要字段选择200以及字段评级300)的实际示例,以B先生为例并且将(1)其不满足可提供资金的阈值的评分申请与(2)可提供资金的、先前评分的其他申请进行比较。
首先,优选方法是采集B先生的借方数据以及提取具有可提供资金的分数阈值的先前申请的子集。随后,并且假定重要字段选择通过充分性路径220来实现,用于重要字段选择200的优选方法用于创建由对那个子集的索引以及与贷方标准600的特征列表相同长度的位向量所组成的样本的初始群体。各样本将通过获取B先生的未准予贷款并且采用来自子集的索引元素的值替换其中位向量为1的列表项来评分。最后,优选方法用于计算B先生的修改列表的分数。这个过程将迭代重复进行,直至达到了适当终止标准(例如已经识别至可提供资金的所有路径或者已经识别路径的方法定义最大数量)。
此后,所有重要字段选择200条目将经过字段评级300。在这个步骤,样本的新集合按照分数加权和随机选择。使B先生的重要字段选择200条目“变异”,以通过替换关联的高于阈值贷款的索引或者通过随机翻转位串中的某个数量的位,来创建那些样本的子集。此后,“交迭”B先生的“变异”的重要字段选择200条目。在这里,通过拣选多对项以获取样本的子集,对每个这种对选择样本的位串中的单个点,并且交换超过那个点的位串的内容,来实现“交迭”。过程重复进行,直到所有可能的充分性路径按照已经计算的各字段的“贡献”来评级和/或表决,并且从最有影响到最小影响来分类。
应当注意,B先生的示例是简单且直接的遗传算法,其中已经发现优选方法,群体会聚到表示产生B先生的信贷价值的显著改进(即,产生可接受风险简档以发放贷款)的字段/变量的变化的样本集合。
又参照图2,第四和第五步骤是原因文本生成400,以及生成不良行为信函500。
存在报告搜索结果的两个方面。首先报告可能是错误的变量(原因文本生成400)。其次,报告不良行为的原因(不良行为信函500)。这些不是相同的,并且解决每个方面要求不同的机制。
报告可能是错误的变量(原因文本生成400)在给定前一节中计算的加权贡献的情况下是直接的。用于原因文本生成400的优选方法涉及记录具有最大可能权重的项的列表。
信用评分系统常常采用提供关于借方的信息的第三方数据源来执行真实性检查。以及如果借方的简档与自行报告内容不一致和/或具有其他借方的“规范”范围之外的值,则那些字段将被标记,并且常常引起借方的信用分数的减除。因此,存在重要差错将显露高评级的高概率。由于将列示与那些错误关联的值以及引起错误信号的源,所以消费者将能够识别通过校正信用机构文件或者其自己的申请数据中的错误来显著改进其分数的机会。
在搜索和评级步骤结束时,我们具有用于将低于阈值贷款变换为高于阈值贷款的一个或多个“配方”。遗憾的是,那些配方的内容不易呈现给申请人,因为它们只是形式“这个信号可能与您的申请的分数的变化关联”的信息。
因此,报告不良行为信函500的可理解原因要求附加步骤和过程。不良行为信函500的创建可在深入研究机器学习范型的标准边界中解决。本质上,“筛选”字段列表然后转化成关联定性条目。例如,与“地址数量”关联的变量或元变量具有与其关联的至少一个文本条目(所谓的“报告类”),例如“您的居住地址在过去五年已经多次改变,表明您的就业不稳定”。
报告类是贷方定义的,其示例包括指示性(“建立和保持银行账户超过2年”或者“避免使您的支票账户透支并且设法安排您的基本支出,使您的账单不会逾期”)、描述性(“Lexis-Nexis报告具有与您的姓名和地址关联的多个社保号。它可能出错,以及如果是的话,则应当校正”)和/或警告(“您的申请中的一个或多个字段呈现与欺诈高度相关的特征。您应当查看您的申请所报告的项,并且校正其中的任何错误”)的消息。
优选方法生成训练样本的标记集合,该标记集合将给定申请的权重模式与和申请关联的一个或多个报告类联系起来。此后,优选实施例可使用标准分类技术,例如支持向量机器、k平均、学习向量量化或者EM,以构建标记功能。
上述过程和方法的任一个可通过任何现在或以后已知的计算装置来实现。例如,方法可在这种装置中经由计算机可读介质(例如计算机存储器、计算机存储装置或载波信号)上包含的计算机可读指令来实现。
本发明的先前所述实施例作为说明和描述来提供。它们不是要将本发明限制到所述的精确形式。具体来说,预期的是本文所述的本发明的功能实现可通过硬件、软件、固件和/或其他可用功能组件或构建块来等效地实现,以及网络可以是有线、无线或者有线和无线的组合。其他变化和实施例根据上述教导是可能的,并且因而预计本发明的范围并不受本具体实施例限制,而受以下权利要求书限制。

Claims (5)

1.一种通信上耦合到公共网络的中央计算机服务器,所述中央计算机服务器具有非暂时计算机可用介质,所述非暂时计算机可用介质具有指令序列,所述指令序列在由处理器运行时使所述处理器运行自动生成高质量不良行为通知的电子过程,所述过程包括:
收集借方的电子数据集以生成借方简档,所述电子数据集包含信用分数和描述所述借方的特定方面的多个变量和元变量;
针对贷方的信贷价值的标准,单独且共同地处理所述借方数据集中的所述多个变量和元变量;
识别所述借方简档中在被改变时引起信贷价值的改进量度的变量和元变量集合,其中所述识别步骤包括分析所述借方数据集与下列至少一个的数据集之间的至少一个最短路径:(i)理想申请人,和(ii)平均批准申请人;以及
生成将所述至少一个最短路径以及其中的变量和元变量解释为简明语言的报告,通过该简明语言,所述借方可理解如何改进所述借方的信用分数。
2.如权利要求1所述的中央计算机服务器,其中,所述贷方的信贷价值的标准通过信用分数来测量。
3.如权利要求1所述的中央计算机服务器,其中,所述过程还包括对所述借方简档中的在被改变时引起改进信用分数的变量和元变量的所识别集合进行评级,所述评级使用下列步骤的至少一个:
表决策略;以及
计算满足或超过贷方标准的所述至少一个最短路径中的相关字段的加权贡献。
4.如权利要求3所述的中央计算机服务器,其中,所述过程还包括计算所述至少一个最短路径的每个中的各相关字段对最终分数差的加权贡献,其中所述计算步骤包括下列至少一个:
随机取样;
通过评分的评级;以及
遗传算法。
5.如权利要求4所述的中央计算机服务器,其中,生成将所述至少一个最短路径以及其中的变量和元变量解释为简明语言的报告的步骤包括下列步骤的至少一个,其中通过该简明语言,所述借方可理解如何改进所述借方的信用分数:
记录加权贡献;
将包括所述加权贡献的一个或多个变量和元变量的值转化为定性文本串;
生成将给定申请的权重模式与和所述申请关联的变量和元变量的报告类联系起来的训练样本的标记集合;以及
根据训练样本的所述标记集合来生成向所述借方发出的报告。
CN201480006945.2A 2013-01-31 2014-01-31 用于自动生成高质量不良行为通知的方法和系统 Pending CN105308640A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361759081P 2013-01-31 2013-01-31
US61/759081 2013-01-31
PCT/US2014/014047 WO2014121019A1 (en) 2013-01-31 2014-01-31 Methods and systems for automatically generating high quality adverse action notifications

Publications (1)

Publication Number Publication Date
CN105308640A true CN105308640A (zh) 2016-02-03

Family

ID=51224029

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480006945.2A Pending CN105308640A (zh) 2013-01-31 2014-01-31 用于自动生成高质量不良行为通知的方法和系统

Country Status (3)

Country Link
US (3) US20140214648A1 (zh)
CN (1) CN105308640A (zh)
WO (1) WO2014121019A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109308660A (zh) * 2017-07-27 2019-02-05 财付通支付科技有限公司 一种征信评分模型评估方法、装置、设备及存储介质
WO2020143850A3 (en) * 2020-04-13 2021-01-28 Alipay (Hangzhou) Information Technology Co., Ltd. Method and system for optimizing allocation of borrowing requests
CN113128544A (zh) * 2020-01-15 2021-07-16 富士通株式会社 训练人工智能模型的方法和装置

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014160163A1 (en) * 2013-03-13 2014-10-02 Precipio, Inc. Architecture and methods for promotion optimization
US10991001B2 (en) 2013-03-13 2021-04-27 Eversight, Inc. Systems and methods for intelligent promotion design with promotion scoring
US10706438B2 (en) 2013-03-13 2020-07-07 Eversight, Inc. Systems and methods for generating and recommending promotions in a design matrix
US11288698B2 (en) 2013-03-13 2022-03-29 Eversight, Inc. Architecture and methods for generating intelligent offers with dynamic base prices
US9940640B2 (en) * 2013-03-13 2018-04-10 Eversight, Inc. Automated event correlation to improve promotional testing
US10140629B2 (en) * 2013-03-13 2018-11-27 Eversight, Inc. Automated behavioral economics patterns in promotion testing and methods therefor
US11270325B2 (en) 2013-03-13 2022-03-08 Eversight, Inc. Systems and methods for collaborative offer generation
US10445763B2 (en) * 2013-03-13 2019-10-15 Eversight, Inc. Automated promotion forecasting and methods therefor
US10438231B2 (en) * 2013-03-13 2019-10-08 Eversight, Inc. Automatic offer generation using concept generator apparatus and methods therefor
US10438230B2 (en) * 2013-03-13 2019-10-08 Eversight, Inc. Adaptive experimentation and optimization in automated promotional testing
US11138628B2 (en) 2013-03-13 2021-10-05 Eversight, Inc. Promotion offer language and methods thereof
US10636052B2 (en) 2013-03-13 2020-04-28 Eversight, Inc. Automatic mass scale online promotion testing
US10909561B2 (en) 2013-03-13 2021-02-02 Eversight, Inc. Systems and methods for democratized coupon redemption
US9940639B2 (en) * 2013-03-13 2018-04-10 Eversight, Inc. Automated and optimal promotional experimental test designs incorporating constraints
US10915912B2 (en) 2013-03-13 2021-02-09 Eversight, Inc. Systems and methods for price testing and optimization in brick and mortar retailers
US10846736B2 (en) 2013-03-13 2020-11-24 Eversight, Inc. Linkage to reduce errors in online promotion testing
US10789609B2 (en) 2013-03-13 2020-09-29 Eversight, Inc. Systems and methods for automated promotion to profile matching
US10176491B2 (en) 2013-03-13 2019-01-08 Eversight, Inc. Highly scalable internet-based randomized experiment methods and apparatus for obtaining insights from test promotion results
US10984441B2 (en) 2013-03-13 2021-04-20 Eversight, Inc. Systems and methods for intelligent promotion design with promotion selection
US11068929B2 (en) 2013-03-13 2021-07-20 Eversight, Inc. Highly scalable internet-based controlled experiment methods and apparatus for obtaining insights from test promotion results
US11288696B2 (en) 2013-03-13 2022-03-29 Eversight, Inc. Systems and methods for efficient promotion experimentation for load to card
WO2016061576A1 (en) 2014-10-17 2016-04-21 Zestfinance, Inc. Api for implementing scoring functions
US10460339B2 (en) 2015-03-03 2019-10-29 Eversight, Inc. Highly scalable internet-based parallel experiment methods and apparatus for obtaining insights from test promotion results
WO2017003747A1 (en) 2015-07-01 2017-01-05 Zest Finance, Inc. Systems and methods for type coercion
CN106534228B (zh) * 2015-09-09 2020-07-10 腾讯科技(深圳)有限公司 一种信息处理方法、客户端和服务器
JP6413205B2 (ja) * 2015-09-12 2018-10-31 スルガ銀行株式会社 事前与信枠及び推奨与信枠算出装置
US11941659B2 (en) 2017-05-16 2024-03-26 Maplebear Inc. Systems and methods for intelligent promotion design with promotion scoring
US11941650B2 (en) 2017-08-02 2024-03-26 Zestfinance, Inc. Explainable machine learning financial credit approval model for protected classes of borrowers
US11960981B2 (en) 2018-03-09 2024-04-16 Zestfinance, Inc. Systems and methods for providing machine learning model evaluation by using decomposition
US11682074B2 (en) 2018-04-13 2023-06-20 Gds Link Llc Decision-making system and method based on supervised learning
US11847574B2 (en) 2018-05-04 2023-12-19 Zestfinance, Inc. Systems and methods for enriching modeling tools and infrastructure with semantics
US11537934B2 (en) 2018-09-20 2022-12-27 Bluestem Brands, Inc. Systems and methods for improving the interpretability and transparency of machine learning models
CN109559215A (zh) * 2018-10-16 2019-04-02 深圳壹账通智能科技有限公司 业务数据核算方法、装置、设备及计算机可读存储介质
US11429976B1 (en) 2019-01-31 2022-08-30 Wells Fargo Bank, N.A. Customer as banker system for ease of banking
US11816541B2 (en) 2019-02-15 2023-11-14 Zestfinance, Inc. Systems and methods for decomposition of differentiable and non-differentiable models
JP7276757B2 (ja) 2019-03-18 2023-05-18 ゼストファイナンス,インコーポレーテッド モデル公平性のためのシステムおよび方法
US11475515B1 (en) * 2019-10-11 2022-10-18 Wells Fargo Bank, N.A. Adverse action methodology for credit risk models
US11720962B2 (en) 2020-11-24 2023-08-08 Zestfinance, Inc. Systems and methods for generating gradient-boosted models with improved fairness

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030046223A1 (en) * 2001-02-22 2003-03-06 Stuart Crawford Method and apparatus for explaining credit scores
US20030101080A1 (en) * 2001-11-28 2003-05-29 Zizzamia Frank M. Method and system for determining the importance of individual variables in a statistical model
US20040199456A1 (en) * 2000-08-01 2004-10-07 Andrew Flint Method and apparatus for explaining credit scores
CN1890686A (zh) * 2003-09-24 2007-01-03 鲁特宛有限公司 用于高效处理多个信贷申请的系统和方法
US20120066116A1 (en) * 2002-05-30 2012-03-15 Experian Information Solutions,Inc. System and method for interactively simulating a credit-worthiness score

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5222192A (en) * 1988-02-17 1993-06-22 The Rowland Institute For Science, Inc. Optimization techniques using genetic algorithms
US6941287B1 (en) * 1999-04-30 2005-09-06 E. I. Du Pont De Nemours And Company Distributed hierarchical evolutionary modeling and visualization of empirical data
US7280980B1 (en) * 2000-08-01 2007-10-09 Fair Isaac Corporation Algorithm for explaining credit scores
US7711635B2 (en) * 2001-02-22 2010-05-04 Fair Isaac Corporation System and method for helping consumers understand and interpret credit scores
US7873535B2 (en) * 2005-11-04 2011-01-18 Accenture Global Services Ltd. Method and system for modeling marketing data
CA2527538A1 (en) * 2005-11-12 2007-05-14 Matt Celano Method and apparatus for a consumer interactive credit report analysis and score reconciliation adaptive education and counseling system
US20080154809A1 (en) * 2006-10-20 2008-06-26 Genalytics, Inc. Use and construction of categorical interactions using a rule gene in a predictive model
US8515842B2 (en) * 2010-09-14 2013-08-20 Evolution Finance, Inc. Systems and methods for monitoring and optimizing credit scores
JP5099202B2 (ja) * 2010-09-30 2012-12-19 ブラザー工業株式会社 現像装置、プロセスユニットおよび画像形成装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040199456A1 (en) * 2000-08-01 2004-10-07 Andrew Flint Method and apparatus for explaining credit scores
US20030046223A1 (en) * 2001-02-22 2003-03-06 Stuart Crawford Method and apparatus for explaining credit scores
US20030101080A1 (en) * 2001-11-28 2003-05-29 Zizzamia Frank M. Method and system for determining the importance of individual variables in a statistical model
US20120066116A1 (en) * 2002-05-30 2012-03-15 Experian Information Solutions,Inc. System and method for interactively simulating a credit-worthiness score
CN1890686A (zh) * 2003-09-24 2007-01-03 鲁特宛有限公司 用于高效处理多个信贷申请的系统和方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109308660A (zh) * 2017-07-27 2019-02-05 财付通支付科技有限公司 一种征信评分模型评估方法、装置、设备及存储介质
CN109308660B (zh) * 2017-07-27 2023-03-10 财付通支付科技有限公司 一种征信评分模型评估方法、装置、设备及存储介质
CN113128544A (zh) * 2020-01-15 2021-07-16 富士通株式会社 训练人工智能模型的方法和装置
WO2020143850A3 (en) * 2020-04-13 2021-01-28 Alipay (Hangzhou) Information Technology Co., Ltd. Method and system for optimizing allocation of borrowing requests
US11257152B2 (en) 2020-04-13 2022-02-22 Alipay (Hangzhou) Information Technology Co., Ltd. Method and system for optimizing allocation of borrowing requests

Also Published As

Publication number Publication date
US20160155193A1 (en) 2016-06-02
WO2014121019A1 (en) 2014-08-07
US20140214648A1 (en) 2014-07-31
US20180365765A1 (en) 2018-12-20

Similar Documents

Publication Publication Date Title
CN105308640A (zh) 用于自动生成高质量不良行为通知的方法和系统
Bazarbash Fintech in financial inclusion: machine learning applications in assessing credit risk
US10929777B2 (en) Method of automating data science services
US20160225076A1 (en) System and method for building and validating a credit scoring function
Deller et al. Rural broadband speeds and business startup rates
US20160078367A1 (en) Data clean-up method for improving predictive model training
Marqués et al. Ranking-based MCDM models in financial management applications: analysis and emerging challenges
Musciotto et al. Detecting informative higher-order interactions in statistically validated hypergraphs
CN110892442A (zh) 用于自适应评分以检测商务卡的误用或滥用的系统、方法和设备
CN109690608A (zh) 外推信任得分中的趋势
Srinivasan et al. Multi criteria decision making in financial risk management with a multi-objective genetic algorithm
KR20210127512A (ko) 인공지능 기반 소상공인 신용대출 시스템 및 방법
CN110930038A (zh) 一种贷款需求识别方法、装置、终端及存储介质
CN111639690A (zh) 基于关系图谱学习的欺诈分析方法、系统、介质及设备
Fourné et al. Reducing uncertainty in follow‐up foreign direct investment: Imitation by family firms
Zhou Data mining for individual consumer credit default prediction under e-commence context: a comparative study
Thiprungsri Cluster analysis for anomaly detection in accounting
Ilyas et al. Predicting the future transaction from large and imbalanced banking dataset
Brito et al. A framework to improve churn prediction performance in retail banking
US20240144091A1 (en) Method of automating data science services
Bankole et al. A Comparison of SOM and K-Means Algorithms in Predicting Tax Compliance
Alma et al. Strategic decision making of micro-lenders: An innovative business model for risk management
Knyazeva et al. A graph-based data mining approach to preventing financial fraud: a case study
Lee et al. Building a core rule-based decision tree to explain the causes of insolvency in small and medium-sized enterprises more easily
Shilbayeh et al. Creditworthiness pattern prediction and detection for GCC Islamic banks using machine learning techniques

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: American California

Applicant after: ZS & Co. Ltd.

Address before: American California

Applicant before: ZESTFINANCE INC

CB02 Change of applicant information
RJ01 Rejection of invention patent application after publication

Application publication date: 20160203

RJ01 Rejection of invention patent application after publication