CN114328668A - 放款风险控制策略的生成方法、装置、终端及存储介质 - Google Patents
放款风险控制策略的生成方法、装置、终端及存储介质 Download PDFInfo
- Publication number
- CN114328668A CN114328668A CN202111652963.6A CN202111652963A CN114328668A CN 114328668 A CN114328668 A CN 114328668A CN 202111652963 A CN202111652963 A CN 202111652963A CN 114328668 A CN114328668 A CN 114328668A
- Authority
- CN
- China
- Prior art keywords
- loan account
- loan
- mining
- risk control
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明揭示了一种放款风险控制策略的生成方法、装置、终端及存储介质。本发明的方法通过使用随机森林算法对大量特征进行建模,得到包含有数百棵决策树的森林,用较浅的深度完成特征挖掘,生成数百乃至上千符合条件且能够有效识别出坏样本的组合规则。随后通过筛选分析,将样本量较大、坏样本识别能力强、符合业务实际场景及目标的组合规则进行保留,最终生成完整的放款风险控制策略。相较于现有技术,本发明的方法在特征挖掘深度、策略生成速度方面的优势显著,具有挖掘业务范围广、特征规则之间的关系挖掘更充分等优点,有助于银行提升对用户放款的风险控制能力。
Description
技术领域
本发明属于一种银行内风控策略的生成方案,具体为一种放款风险控制策略的生成方法、装置、终端及存储介质,涉及数据处理技术领域。
背景技术
在商业银行的日常运营过程中,为了保证其经营战略能够得到落实、降低运营风险,银行内部会根据不同的应用场景和目标,制定和生成相关的运营策略。而在各类运营策略中,放款风险的控制策略无疑是最为重要的一部分,其直接关乎到银行的贷款业务是否能够顺利开展。
现阶段,行业内所普遍采用的策略生成方式主要包括专家经验及决策树挖掘两种。
专家经验是指以专家对业务及行业的理解、结合其实操经验生成策略的方式。但通过这种方式所生成策略的有效性与专家的主观判断结果直接相关,对象范围较窄、缺少必要的数据验证、局限性较大,策略制定者的业务经验稍有不足就很难得到有效的策略结果。
使用决策树对规则进行挖掘、进而形成策略的方式相较于专家经验而言,其结果的准确性上虽有所提升,但这种策略生成方式同样存在着较为明显的缺陷。由于该方式中使用的是单棵决策树,策略生成速度慢且规则挖掘能力较弱,无法有效地挖掘出特征之间的关系。此外,单棵决策树可能会因为其深度过深而得到大量无效的组合特征,这些特征缺乏实际意义,由其所得到的策略也就同样缺乏实用性。
由以上描述可以看出,无论是专家经验还是决策树挖掘,在放款风险控制策略的生成过程中,局限性都很强。
综上所述,如果能够在现有技术的基础上提出一种系统化、标准化的放款风险控制策略生成方案,那么将极大地提升银行对用户放款的风险控制能力,保证银行贷款业务的顺利开展。
发明内容
鉴于现有技术存在上述缺陷,本发明的目的是提出一种放款风险控制策略的生成方法、装置、终端及存储介质,具体如下。
一种放款风险控制策略的生成方法,包括:
依次对所选取的贷款账号进行滚动率分析和账龄分析,得到样本判断标准;
利用统计和特征衍生从所选取的贷款账号的相关信息中获取建模数据变量,以贷款账号为目标、以所述建模数据变量为特征,基于随机森林算法进行建模,得到规则生成模型;
利用所述规则生成模型对所选取的另一部分贷款账号进行处理,结合所述样本判断标准,得到挖掘规则集合,依据业务开展条件从所述挖掘规则集合中筛选出相对应的挖掘规则作为放款风险控制策略。
优选地,所述依次对所选取的贷款账号进行滚动率分析和账龄分析,得到样本判断标准,包括:
从历史贷款账号数据中选取一部分贷款账号,获取该部分贷款账号的还款计划数据,选择所述还款计划数据中的任一时间点作为观察点,定义所述观察点前的一段时间为观察期、所述观察点后的一段时间为表现期;
统计贷款账号在所述观察期内的最长逾期期数、按在所述观察期内的逾期状态将贷款账号划分为多个层次,随后统计贷款账号在所述表现期内的最长逾期期数、按在所述表现期内的逾期状态将贷款账号划分为多个层次;
交叉统计观察期内每个层次的账号分别在表现期内各层次中的数量、并计算其在对应层次的表现期内账号总数中的占比,依据统计和计算结果将对应层次的账号作为样本判断观察对象;
将所述样本判断观察对象带入贷款产品中,统计所述样本判断观察对象在所述贷款产品放款周期内不同月份的逾期率,依据统计结果得到样本判断标准。
优选地,所述利用统计和特征衍生从所选取的贷款账号的相关信息中获取建模数据变量,以贷款账号为目标、以所述建模数据变量为特征,基于随机森林算法进行建模,得到规则生成模型,包括:
获取所选取的贷款账号的相关信息;
利用统计和特征衍生从所述贷款账号的相关信息中获取建模数据变量;
设置随机森林算法中决策树的深度及决策树的数量,将所选取的贷款账号作为样本带入随机森林算法中,以贷款账号为目标、以所述建模数据变量为特征,训练得到包含有多棵决策树的规则生成模型。
优选地,所述贷款账号的相关信息至少包括贷款账号的基本信息、贷款账号的申请信息、贷款账号的分析信息、贷款账号的交易信息以及贷款账号的消费信息;所述建模数据变量至少包括贷款账号在不同月份内的订单数、贷款账号在最近1个月/3个月/6个月/12个月内的订单总数、贷款账号在最近1个月/3个月/6个月/12个月内的征信查询次数以及贷款账号的负债率。
优选地,设置随机森林算法中决策树的深度及决策树的数量,将所选取的贷款账号作为样本带入随机森林算法中,以贷款账号为目标、以所述建模数据变量为特征,训练得到包含有多棵决策树的规则生成模型,包括:
将随机森林算法中决策树的深度设置为2~4,将随机森林算法中决策树的数量设置为400~1000;
将所选取的贷款账号作为样本带入随机森林算法中,算法对样本进行有放回的随机抽样,形成多个训练样本,每个训练样本作为一棵决策树根结处的样本;
在决策树的每个节点需要分裂时,随机从所述建模数据变量中进行选取,再依据信息增益确定一个所述建模数据变量作为该节点的分裂属性;
重复节点分裂操作,直至决策树上每个节点都无法再分裂,得到一颗完整的决策树;
将所得到的全部决策树进行整合,得到完整的随机森林并将其作为所述规则生成模型。
优选地,将随机森林算法中决策树的深度设置为3、将随机森林算法中决策树的数量设置为500。
优选地,所述利用所述规则生成模型对所选取的另一部分贷款账号进行处理,结合所述样本判断标准,得到挖掘规则集合,依据业务开展条件从所述挖掘规则集合中筛选出相对应的挖掘规则作为放款风险控制策略,包括:
从历史贷款账号数据中选取另一部分贷款账号、带入所述规则生成模型中进行处理,得到多棵决策树,每棵所述决策树上的一个分枝对应一条挖掘规则,将全部挖掘规则进行汇总,得到挖掘规则原始集;
结合所述样本判断标准,制定规则筛选条件,从所述挖掘规则原始集中筛选出所有符合所述规则筛选条件的挖掘规则,得到挖掘规则集合;
依据业务开展情况制定业务开展条件,从所述挖掘规则集合中筛选所有符合所述业务开展条件的挖掘规则作为放款风险控制策略,部署上线。
一种放款风险控制策略的生成装置,包括:
样本判断标准生成模块,用于依次对所选取的贷款账号进行滚动率分析和账龄分析,得到样本判断标准;
规则生成模型建模模块,用于利用统计和特征衍生从所选取的贷款账号的相关信息中获取建模数据变量,以贷款账号为目标、以所述建模数据变量为特征,基于随机森林算法进行建模,得到规则生成模型;
放款风控策略制定模块,用于利用所述规则生成模型对所选取的另一部分贷款账号进行处理,结合所述样本判断标准,得到挖掘规则集合,依据业务开展条件从所述挖掘规则集合中筛选出相对应的挖掘规则作为放款风险控制策略。
一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如前所述放款风险控制策略的生成方法中的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行所述计算机程序时实现如前所述放款风险控制策略的生成方法中的步骤。
本发明的优点主要体现在以下几个方面:
本发明所提出的一种放款风险控制策略的生成方法,通过使用随机森林算法对大量特征进行建模,得到包含有数百棵决策树的森林,用较浅的深度完成特征挖掘,生成数百乃至上千符合条件且能够有效识别出坏样本的组合规则。随后通过筛选分析,将样本量较大、坏样本识别能力强、符合业务实际场景及目标的组合规则进行保留,最终生成完整的放款风险控制策略。相较于现有的策略生成方式,本发明的方法在特征挖掘深度、策略生成速度方面的优势显著,具有挖掘业务范围广、特征规则之间的关系挖掘更充分等优点,有助于银行提升对用户放款的风险控制能力。
与上述方法相对应的,本发明所提出的一种放款风险控制策略的形成装置、终端及存储介质,能够以系统化、标准化的处理流程,高效、准确地实现策略生成作业,硬件的适配性和兼容性较高,能够切实地应用于商业银行日常的贷款业务中。
此外,本发明还为其他针对银行运营策略生成的技术方案提供了参考,可以以此为依据进行拓展延伸和深入研究,具有十分广阔的应用前景。
以下便结合实施例附图,对本发明的具体实施方式作进一步的详述,以使本发明技术方案更易于理解、掌握。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本发明实施例提供的一种放款风险控制策略的生成方法的实现流程图;
图2为本发明实施例中、按方法进行滚动率分析所得到的结果统计表;
图3为本发明实施例中、按方法进行账龄分析所得到的结果统计表;
图4为本发明实施例中、挖掘规则原始集的结果展示表;
图5为本发明实施例提供的一种放款风险控制策略的生成装置的结构示意图;
图6为本发明实施例提供的终端的示意图。
具体实施方式
本发明揭示了一种放款风险控制策略的生成方法、装置、终端及存储介质,具体方案如下。
一方面,本发明的一种放款风险控制策略的生成方法,整体流程如图1所示,包括如下步骤。
S1、依次对所选取的贷款账号进行滚动率分析和账龄分析,得到样本判断标准。进一步而言,这一步骤具体可分为滚动率分析及账龄分析两个阶段。
其中,滚动率分析阶段包括如下步骤:
S111、从银行的历史贷款账号数据中选取贷款账号,将所选取的贷款账号分为两个部分,一部分贷款账号用作分析、建模,获取这部分贷款账号的还款计划数据(如还款计划表)进行分析,另一部分贷款账号留作后续的策略生成。
在贷款账号的选取过程中需要注意,所选取的贷款账号与当前的时间间隔最好不超过5年,以保证数据的有效性及后续处理的准确性。
S112、选择所述还款计划数据中的任一时间点作为观察点,定义所述观察点前的一段时间为观察期、所述观察点后的一段时间为表现期。
在本实施例中,所述观察点选择为2018年6月30日,定义所述观察点的过去6个月为观察期、所述观察点的未来6个月为表现期。
S113、统计所选取部分的贷款账号在所述观察期内的最长逾期期数、按账号在所述观察期内的逾期状态将贷款账号划分为多个层次,随后再统计贷款账号在所述表现期内的最长逾期期数、按在所述表现期内的逾期状态将贷款账号划分为多个层次。
在两次层次划分时,可以保持两次的层次划分标准一致,在实际操作中,可将贷款账号划分为C、M1、M2、M3、M4+等几个层次,其具体的界定标准可以依据实际应用场景而确定。在本实施例中,层次的界定标准以账号的逾期时长为依据,即被定义为C层次的账号为从未逾期的贷款账号、被定义为M1层次的账号为最大逾期时长在一个月内的贷款账号、被定义为M2层次的账号为最大逾期时长大于一个月且小与两个月的贷款账号、被定义为M3层次的账号为最大逾期时长大于两个月且小与三个月的贷款账号、被定义为M4+层次的账号为最大逾期时长大于三个月的贷款账号。
S114、交叉统计观察期内每个层次的账号分别在表现期内各层次中的数量、并计算其在对应层次的表现期内账号总数中的占比,即表现期内账号数量/本阶段观察期内的账号总量(如表现期内C层次账号数量/C层次阶段观察期内的账号总量),依据统计和计算结果将对应层次的账号作为样本判断观察对象。
在本实施例中,统计和计算结果如图2所示,从图2的表格中可以确定,M4+层次(即最大逾期时长大于三个月)的贷款账号转好的概率很低,因此可以将所有M4+层次的贷款账号作为样本判断观察对象。
其中,账龄分析阶段包括如下步骤:
S121、将所述样本判断观察对象带入一款需要进行分析的贷款产品中,统计所述样本判断观察对象在所述贷款产品放款周期内不同月份的逾期率(逾期率=当月逾期订单数/总贷款订单数),依据统计结果得到样本判断标准。
在本实施例中,以一款放款期限为12期的产品为例,其账龄分析表如图3所示,从图3的表格中可以看出,以用户滚动率分析结果中所有M4+层次的贷款账号作为样本判断观察对象,观察到不同放款月份账号达到M4+层次、基本在9个月趋于稳定,因此将9个月的时间定义为账户成熟期。此时,所得到的样本判断标准为:贷款账号经过9期表现,逾期状态被划分为M4+层次的贷款账号即为坏样本;表现期不足9个月的贷款账号为不可确定。在后续流程中,样本用Y指代,坏样本被赋值为1(即Y=1),否则样本被赋值为0。
S2、利用统计和特征衍生从所选取的贷款账号的相关信息中获取建模数据变量,以贷款账号为目标、以所述建模数据变量为特征,基于随机森林算法进行建模,得到规则生成模型。进一步而言,这一步骤具体包括:
S211、获取所选取的贷款账号的相关信息,在本实施例中,所述贷款账号的相关信息至少包括贷款账号的基本信息、贷款账号的申请信息、贷款账号的分析信息、贷款账号的交易信息以及贷款账号的消费信息。
S212、利用统计和特征衍生从所选取的贷款账号的相关信息中获取建模数据变量,在本实施例中,所述建模数据变量至少包括贷款账号在不同月份内的订单数、贷款账号在最近1个月/3个月/6个月/12个月内的订单总数、贷款账号在最近1个月/3个月/6个月/12个月内的征信查询次数以及贷款账号的负债率。
此处需要说明的是,所述贷款账号的相关信息及所述建模数据变量包含众多数据,对于数据的筛选结果会因为实际的应用场景和策略目的而发生变化,本实施例中的细化仅仅是一种基础性、普适性的定义。
S221、设置随机森林算法中决策树的深度及决策树的数量,将所选取的贷款账号作为训练集样本带入随机森林算法中,以贷款账号为目标、以所述建模数据变量为特征,训练得到包含有多棵决策树的规则生成模型。
本方案中所使用的随机森林算法属于集成学习中的Bagging(BootstrapAGgregation)方法。随机森林由很多棵决策树构成的,不同决策树之间没有关联。
当利用随机森林进行分类任务时,新的输入样本进入,就让森林中的每一棵决策树分别进行判断和分类,每个决策树会得到一个自己的分类结果,决策树的分类结果中哪一个分类最多,那么随机森林就会把这个结果当做最终的结果。
为了克服现有技术中决策树唯一、深度过深所导致的挖掘效率低、挖掘规则有效性差等问题,此处限定将随机森林算法中决策树的深度设置为2~4、将随机森林算法中决策树的数量设置为400~1000。
在本实施例中,决策树的最优深度设置为3、最优数量设置为500。且在本实施例所使用的随机森林算法中,节点的划分主要依据信息增益,信息增益越大、节点划分效果越好,否则停止划分。
此处随机森林算法的建模过程与现有技术类似,主要包括四个阶段:
(1)随机抽样,训练决策树。将一个样本容量为N的样本,有放回的抽取N次,每次抽取1个,最终形成了N个训练样本。这选择好了的N个训练样本用来训练一个决策树,作为决策树根节点处的样本;
(2)随机选取特征,做节点分裂。当每个样本有M个特征时,在决策树的每个节点需要分裂时,随机从这M个特征中选取出m个特征(m≤M)。然后从这m个特征中采用预设策略(即依据信息增益)来选择1个特征作为该节点的分裂属性;
(3)重复上一步骤,直至不能再分裂。决策树形成过程中每个节点都要按照上一步骤中的流程进行分裂,一直到不能够再分裂为止,且整个决策树形成过程不会进行剪枝。
(4)建立大量决策树,形成森林。按照上述操作流程建立大量的决策树,得到完整的随机森林,进而将其作为所述规则生成模型。
S3、利用所述规则生成模型对所选取的另一部分贷款账号进行处理,结合所述样本判断标准,得到挖掘规则集合,依据业务开展条件从所述挖掘规则集合中筛选出相对应的挖掘规则作为放款风险控制策略。进一步而言,这一步骤具体包括:
S311、将所选取的另一部分贷款账号作为测试集带入所述规则生成模型中进行处理,得到多棵决策树,每棵所述决策树上的一个分枝对应一条挖掘规则,将全部挖掘规则进行汇总,得到挖掘规则原始集。
对于挖掘规则原始集的结果展示形式如图4所示,由于数据具有敏感性,图4表格中的数据均为仿制数据且均对特征部分进行了隐藏。
S312、结合所述样本判断标准,制定规则筛选条件,从所述挖掘规则原始集中筛选出所有符合所述规则筛选条件的挖掘规则,得到挖掘规则集合。
所述规则筛选条件的制定依赖于S1中所得到的所述样本判断标准,可将所述规则筛选条件定义为:单个规则中包含有坏样本(即Y=1)N1个以上、单个规则中的坏样本率达整体坏样本率(整体坏样本率=逾期订单数/总贷款订单数)的N2倍以上,其中N1、N2均为常数。在本实施例中,所述规则筛选条件为:单个规则中包含有坏样本3个以上、单个规则中的坏样本率达整体坏样本率的5倍以上。
S321、依据业务开展情况制定业务开展条件,从所述挖掘规则集合中筛选所有符合所述业务开展条件的挖掘规则作为放款风险控制策略,部署上线。
所述业务开展条件的制定同样会因为实际的应用场景和策略目的而发生变化,例如需要筛选有欺诈嫌疑的贷款账号时,根据模型组合筛选特征组合可能为:借款首月即逾期、贷款账号码段集中在特定区域如都在一个市、聚集在附近一两个小区。
在方法的实际应用时,所述业务开展条件的制定除了依据业务开展情况外,还可以参考坏样本区分度,所述坏样本区分度是指若所述挖掘规则能够满足S1中所得到的所述样本判断标准,即认定坏样本区分度较高。
综上所述,本发明所提出的一种放款风险控制策略的生成方法,通过使用随机森林算法对大量特征进行建模,得到包含有数百棵决策树的森林,用较浅的深度完成特征挖掘,生成数百乃至上千符合条件且能够有效识别出坏样本的组合规则。随后通过筛选分析,将样本量较大、坏样本识别能力强、符合业务实际场景及目标的组合规则进行保留,最终生成完整的放款风险控制策略。相较于现有的策略生成方式,本发明的方法在特征挖掘深度、策略生成速度方面的优势显著,具有挖掘业务范围广、特征规则之间的关系挖掘更充分等优点,有助于银行提升对用户放款的风险控制能力。
另一方面,本发明还涉及一种放款风险控制策略的生成装置,装置结构如图5所示,包括:
样本判断标准生成模块,用于依次对所选取的贷款账号进行滚动率分析和账龄分析,得到样本判断标准;
规则生成模型建模模块,用于利用统计和特征衍生从所选取的贷款账号的相关信息中获取建模数据变量,以贷款账号为目标、以所述建模数据变量为特征,基于随机森林算法进行建模,得到规则生成模型;
放款风控策略制定模块,用于利用所述规则生成模型对所选取的另一部分贷款账号进行处理,结合所述样本判断标准,得到挖掘规则集合,依据业务开展条件从所述挖掘规则集合中筛选出相对应的挖掘规则作为放款风险控制策略。
在一种可能的实现方式中,所述样本判断标准生成模块包括:
观察点选取单元,用于选取一部分贷款账号,获取贷款账号的还款计划数据,选择所述还款计划数据中的任一时间点作为观察点,定义所述观察点前的一段时间为观察期、所述观察点后的一段时间为表现期;
账号层次划分单元,用于统计贷款账号在所述观察期内的最长逾期期数、按在所述观察期内的逾期状态将贷款账号划分为多个层次,随后统计贷款账号在所述表现期内的最长逾期期数、按在所述表现期内的逾期状态将贷款账号划分为多个层次;
交叉统计单元,用于交叉统计观察期内每个层次的账号分别在表现期内各层次中的数量、并计算其在对应层次的表现期内账号总数中的占比,依据统计和计算结果将对应层次的账号作为样本判断观察对象;
判断标准生成单元,用于将所述样本判断观察对象带入贷款产品中,统计所述样本判断观察对象在所述贷款产品放款周期内不同月份的逾期率,依据统计结果得到样本判断标准。
在一种可能的实现方式中,所述规则生成模型建模模块内至少包括:
模型训练及生成单元,用于设置随机森林算法中决策树的深度及决策树的数量,将所选取的贷款账号作为样本带入随机森林算法中,以贷款账号为目标、以所述建模数据变量为特征,训练得到包含有多棵决策树的规则生成模型。
在一种可能的实现方式中,所述放款风控策略制定模块包括:
挖掘规则原始集生成单元,用于将所选取的另一部分贷款账号带入所述规则生成模型中进行处理,得到多棵决策树,每棵所述决策树上的一个分枝对应一条挖掘规则,将全部挖掘规则进行汇总,得到挖掘规则原始集;
挖掘规则集合生成单元,用于结合所述样本判断标准,制定规则筛选条件,从所述挖掘规则原始集中筛选出所有符合所述规则筛选条件的挖掘规则,得到挖掘规则集合;
放款风险控制策略生成单元,用于依据业务开展情况制定业务开展条件,从所述挖掘规则集合中筛选所有符合所述业务开展条件的挖掘规则作为放款风险控制策略,部署上线。
又一方面,本发明还涉及一种终端,终端结构如图6所示,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如前所述放款风险控制策略的生成方法中的步骤,例如图1所示的步骤S1~S3。或者,处理器执行计算机程序时实现上述各装置实施例中各模块/单元的功能,例如图5所示的各模块的功能。
再一方面,本发明还涉及一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行所述计算机程序时实现如前所述放款风险控制策略的生成方法中的步骤。
其中,可读存储介质可以是计算机存储介质,也可以是通信介质。通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。计算机存储介质可以是通用或专用计算机能够存取的任何可用介质。例如,可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(ApplicationSpecific Integrated Circuits,ASIC)中。另外,该ASIC可以位于用户设备中。当然,处理器和可读存储介质也可以作为分立组件存在于通信设备中。可读存储介质可以是只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
与上述方法相对应的,本发明所提出的一种放款风险控制策略的形成装置、终端及存储介质,能够以系统化、标准化的处理流程,高效、准确地实现策略生成作业,硬件的适配性和兼容性较高,能够切实地应用于商业银行日常的贷款业务中。
此外,本发明还为其他针对银行运营策略生成的技术方案提供了参考,可以以此为依据进行拓展延伸和深入研究,具有十分广阔的应用前景。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神和基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。
最后,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
Claims (10)
1.一种放款风险控制策略的生成方法,其特征在于,包括:
依次对所选取的贷款账号进行滚动率分析和账龄分析,得到样本判断标准;
利用统计和特征衍生从所选取的贷款账号的相关信息中获取建模数据变量,以贷款账号为目标、以所述建模数据变量为特征,基于随机森林算法进行建模,得到规则生成模型;
利用所述规则生成模型对所选取的另一部分贷款账号进行处理,结合所述样本判断标准,得到挖掘规则集合,依据业务开展条件从所述挖掘规则集合中筛选出相对应的挖掘规则作为放款风险控制策略。
2.根据权利要求1所述的放款风险控制策略的生成方法,其特征在于,所述依次对所选取的贷款账号进行滚动率分析和账龄分析,得到样本判断标准,包括:
从历史贷款账号数据中选取一部分贷款账号,获取该部分贷款账号的还款计划数据,选择所述还款计划数据中的任一时间点作为观察点,定义所述观察点前的一段时间为观察期、所述观察点后的一段时间为表现期;
统计贷款账号在所述观察期内的最长逾期期数、按在所述观察期内的逾期状态将贷款账号划分为多个层次,随后统计贷款账号在所述表现期内的最长逾期期数、按在所述表现期内的逾期状态将贷款账号划分为多个层次;
交叉统计观察期内每个层次的账号分别在表现期内各层次中的数量、并计算其在对应层次的表现期内账号总数中的占比,依据统计和计算结果将对应层次的账号作为样本判断观察对象;
将所述样本判断观察对象带入贷款产品中,统计所述样本判断观察对象在所述贷款产品放款周期内不同月份的逾期率,依据统计结果得到样本判断标准。
3.根据权利要求2所述的放款风险控制策略的生成方法,其特征在于,所述利用统计和特征衍生从所选取的贷款账号的相关信息中获取建模数据变量,以贷款账号为目标、以所述建模数据变量为特征,基于随机森林算法进行建模,得到规则生成模型,包括:
获取所选取的贷款账号的相关信息;
利用统计和特征衍生从所述贷款账号的相关信息中获取建模数据变量;
设置随机森林算法中决策树的深度及决策树的数量,将所选取的贷款账号作为样本带入随机森林算法中,以贷款账号为目标、以所述建模数据变量为特征,训练得到包含有多棵决策树的规则生成模型。
4.根据权利要求3所述的放款风险控制策略的生成方法,其特征在于:
所述贷款账号的相关信息至少包括贷款账号的基本信息、贷款账号的申请信息、贷款账号的分析信息、贷款账号的交易信息以及贷款账号的消费信息;
所述建模数据变量至少包括贷款账号在不同月份内的订单数、贷款账号在最近1个月/3个月/6个月/12个月内的订单总数、贷款账号在最近1个月/3个月/6个月/12个月内的征信查询次数以及贷款账号的负债率。
5.根据权利要求3所述的放款风险控制策略的生成方法,其特征在于,设置随机森林算法中决策树的深度及决策树的数量,将所选取的贷款账号作为样本带入随机森林算法中,以贷款账号为目标、以所述建模数据变量为特征,训练得到包含有多棵决策树的规则生成模型,包括:
将随机森林算法中决策树的深度设置为2~4、将随机森林算法中决策树的数量设置为400~1000;
将所选取的贷款账号作为样本带入随机森林算法中,算法对样本进行有放回的随机抽样,形成多个训练样本,每个训练样本作为一棵决策树根结处的样本;
在决策树的每个节点需要分裂时,随机从所述建模数据变量中进行选取,再依据信息增益确定一个所述建模数据变量作为该节点的分裂属性;
重复节点分裂操作,直至决策树上每个节点都无法再分裂,得到一颗完整的决策树;
将所得到的全部决策树进行整合,得到完整的随机森林并将其作为所述规则生成模型。
6.根据权利要求5所述的放款风险控制策略的生成方法,其特征在于:将随机森林算法中决策树的深度设置为3,将随机森林算法中决策树的数量设置为500。
7.根据权利要求3所述的放款风险控制策略的生成方法,其特征在于,所述利用所述规则生成模型对所选取的另一部分贷款账号进行处理,结合所述样本判断标准,得到挖掘规则集合,依据业务开展条件从所述挖掘规则集合中筛选出相对应的挖掘规则作为放款风险控制策略,包括:
从历史贷款账号数据中选取另一部分贷款账号、带入所述规则生成模型中进行处理,得到多棵决策树,每棵所述决策树上的一个分枝对应一条挖掘规则,将全部挖掘规则进行汇总,得到挖掘规则原始集;
结合所述样本判断标准,制定规则筛选条件,从所述挖掘规则原始集中筛选出所有符合所述规则筛选条件的挖掘规则,得到挖掘规则集合;
依据业务开展情况制定业务开展条件,从所述挖掘规则集合中筛选所有符合所述业务开展条件的挖掘规则作为放款风险控制策略,部署上线。
8.一种放款风险控制策略的生成装置,其特征在于,包括:
样本判断标准生成模块,用于依次对所选取的贷款账号进行滚动率分析和账龄分析,得到样本判断标准;
规则生成模型建模模块,用于利用统计和特征衍生从所选取的贷款账号的相关信息中获取建模数据变量,以贷款账号为目标、以所述建模数据变量为特征,基于随机森林算法进行建模,得到规则生成模型;
放款风控策略制定模块,用于利用所述规则生成模型对所选取的另一部分贷款账号进行处理,结合所述样本判断标准,得到挖掘规则集合,依据业务开展条件从所述挖掘规则集合中筛选出相对应的挖掘规则作为放款风险控制策略。
9.一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一所述放款风险控制策略的生成方法中的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行所述计算机程序时实现如权利要求1至7中任一所述放款风险控制策略的生成方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111652963.6A CN114328668A (zh) | 2021-12-28 | 2021-12-28 | 放款风险控制策略的生成方法、装置、终端及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111652963.6A CN114328668A (zh) | 2021-12-28 | 2021-12-28 | 放款风险控制策略的生成方法、装置、终端及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114328668A true CN114328668A (zh) | 2022-04-12 |
Family
ID=81018890
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111652963.6A Pending CN114328668A (zh) | 2021-12-28 | 2021-12-28 | 放款风险控制策略的生成方法、装置、终端及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114328668A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115271933A (zh) * | 2022-09-23 | 2022-11-01 | 天津金城银行股份有限公司 | 贷款决策方法及装置、决策设备及计算机可读存储介质 |
-
2021
- 2021-12-28 CN CN202111652963.6A patent/CN114328668A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115271933A (zh) * | 2022-09-23 | 2022-11-01 | 天津金城银行股份有限公司 | 贷款决策方法及装置、决策设备及计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107194803A (zh) | 一种p2p网贷借款人信用风险评估的装置 | |
WO2017133492A1 (zh) | 一种风险评估方法和系统 | |
CN102890803B (zh) | 电子商品异常交易过程的确定方法及其装置 | |
CN108665159A (zh) | 一种风险评估方法、装置、终端设备及存储介质 | |
CN105718490A (zh) | 一种用于更新分类模型的方法及装置 | |
CN105354210A (zh) | 移动游戏支付账户行为数据处理方法和装置 | |
CN112700325A (zh) | 一种基于Stacking集成学习的网贷回头客预测的方法 | |
CN111309788A (zh) | 一种银行客户交易网络的社区结构发现方法及系统 | |
CN113642923A (zh) | 基于历史催收数据的不良资产包价值评估方法 | |
CN114202243A (zh) | 一种基于随机森林的工程项目管理风险预警方法及系统 | |
CN114429245A (zh) | 一种工程造价数据的分析展示方法 | |
CN114328668A (zh) | 放款风险控制策略的生成方法、装置、终端及存储介质 | |
CN111583024A (zh) | 信用评估方法、装置、存储介质及服务器 | |
Zhu et al. | Loan default prediction based on convolutional neural network and LightGBM | |
CN115660834B (zh) | 基于决策树的个贷风险评估方法 | |
CN107679862B (zh) | 一种欺诈交易模型的特征值确定方法及装置 | |
CN116342255A (zh) | 互联网消费贷反欺诈风险识别方法及系统 | |
CN108805603A (zh) | 营销活动质量评估方法、服务器及计算机可读存储介质 | |
CN114581086A (zh) | 基于动态时序网络的钓鱼账户检测方法及系统 | |
CN113592140A (zh) | 电费缴纳预测模型训练系统和电费缴纳预测模型 | |
CN113469696A (zh) | 一种用户异常度评估方法、装置及计算机可读存储介质 | |
CN115034788A (zh) | 交易风险评估方法及装置、电子设备、存储介质 | |
CN112001425A (zh) | 一种数据处理方法、装置及计算机可读存储介质 | |
CN110147938A (zh) | 一种训练样本生成方法、装置、系统和记录介质 | |
Wang et al. | Application of Data Mining Technology in Financial Data Analysis Methods Under the Background of Big Data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |