CN117874654A - 基于随机森林算法的风险监控方法及系统 - Google Patents

基于随机森林算法的风险监控方法及系统 Download PDF

Info

Publication number
CN117874654A
CN117874654A CN202410282142.5A CN202410282142A CN117874654A CN 117874654 A CN117874654 A CN 117874654A CN 202410282142 A CN202410282142 A CN 202410282142A CN 117874654 A CN117874654 A CN 117874654A
Authority
CN
China
Prior art keywords
curve
ratio
fluctuation
score
loss
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410282142.5A
Other languages
English (en)
Other versions
CN117874654B (zh
Inventor
谢晔
谢明伟
刘东岳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Xiaoce Technology Co ltd
Original Assignee
Hangzhou Xiaoce Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Xiaoce Technology Co ltd filed Critical Hangzhou Xiaoce Technology Co ltd
Priority to CN202410282142.5A priority Critical patent/CN117874654B/zh
Publication of CN117874654A publication Critical patent/CN117874654A/zh
Application granted granted Critical
Publication of CN117874654B publication Critical patent/CN117874654B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于随机森林算法的风险监控方法及系统,涉及交易风险监控技术领域,该方法包括:遍历风险监控因子,对目标用户进行信息采集,生成失信比波动曲线、交易数波动曲线、好评比波动曲线和年利润波动曲线;对目标用户同行进行信息采集,生成失信比均值波动曲线、交易数均值波动曲线、好评比均值波动曲线和年利润均值波动曲线;通过风控评价模型进行分析,生成失信比评分、交易数评分、好评比评分和稳定性评分,生成目标风险系数。本发明解决了现有技术中传统的交易风险评估方法不够客观全面,导致风险监控效果差的技术问题,基于随机森林算法和风险监控因子进行客观风险评估,达到了提高风险监控水平的技术效果。

Description

基于随机森林算法的风险监控方法及系统
技术领域
本发明涉及交易风险监控技术领域,具体涉及基于随机森林算法的风险监控方法及系统。
背景技术
风险监控是风险管理过程中的一个关键环节,涉及对交易中可能存在的风险进行持续的监视、评估和控制,以确保风险在可控范围内,而交易风险评估能够确定风险的大小、可能性和影响,从而制定相应的风险管理策略,以降低风险带来的损失并提高交易的成功率。
但传统的交易风险评估方法依赖于主观评断,由于个体获得信息的片面性,导致所得风险评估结果的客观性较差。
发明内容
本申请提供了基于随机森林算法的风险监控方法及系统,用于解决现有技术中传统的交易风险评估方法不够客观全面,风险监控效果差的技术问题。
本申请的第一个方面,提供了基于随机森林算法的风险监控方法,所述方法包括:配置风险监控因子,其中,所述风险监控因子包括失信比因子、交易数因子、好评比因子和年利润因子;遍历所述失信比因子、所述交易数因子、所述好评比因子和所述年利润因子,对目标用户进行信息采集,生成失信比波动曲线、交易数波动曲线、好评比波动曲线和年利润波动曲线;对目标用户同行进行信息采集,生成失信比均值波动曲线、交易数均值波动曲线、好评比均值波动曲线和年利润均值波动曲线;通过风控评价模型,对所述失信比波动曲线、所述交易数波动曲线、所述好评比波动曲线、所述年利润波动曲线、所述失信比均值波动曲线、所述交易数均值波动曲线、所述好评比均值波动曲线和所述年利润均值波动曲线进行分析,生成失信比评分、交易数评分、好评比评分和稳定性评分,其中,所述风控评价模型基于随机森林算法构建;遍历所述失信比因子、所述交易数因子、所述好评比因子和所述年利润因子进行权重分布,生成因子权重分布结果;根据所述因子权重分布结果,对所述失信比评分、所述交易数评分、所述好评比评分和所述稳定性评分进行评价,生成目标风险系数发送至客户端。
本申请的第二个方面,提供了基于随机森林算法的风险监控系统,所述系统包括:风险监控因子配置模块,所述风险监控因子配置模块用于配置风险监控因子,其中,所述风险监控因子包括失信比因子、交易数因子、好评比因子和年利润因子;用户信息采集模块,所述用户信息采集模块用于遍历所述失信比因子、所述交易数因子、所述好评比因子和所述年利润因子,对目标用户进行信息采集,生成失信比波动曲线、交易数波动曲线、好评比波动曲线和年利润波动曲线;用户同行信息采集模块,所述用户同行信息采集模块用于对目标用户同行进行信息采集,生成失信比均值波动曲线、交易数均值波动曲线、好评比均值波动曲线和年利润均值波动曲线;风控评价模块,所述风控评价模块用于通过风控评价模型,对所述失信比波动曲线、所述交易数波动曲线、所述好评比波动曲线、所述年利润波动曲线、所述失信比均值波动曲线、所述交易数均值波动曲线、所述好评比均值波动曲线和所述年利润均值波动曲线进行分析,生成失信比评分、交易数评分、好评比评分和稳定性评分,其中,所述风控评价模型基于随机森林算法构建;因子权重分布结果生成模块,所述因子权重分布结果生成模块用于遍历所述失信比因子、所述交易数因子、所述好评比因子和所述年利润因子进行权重分布,生成因子权重分布结果;目标风险系数生成模块,所述目标风险系数生成模块用于根据所述因子权重分布结果,对所述失信比评分、所述交易数评分、所述好评比评分和所述稳定性评分进行评价,生成目标风险系数发送至客户端。
本申请中提供的一个或多个技术方案,至少具有如下技术效果或优点:
本申请提供的基于随机森林算法的风险监控方法,涉及交易风险监控技术领域,通过遍历风险监控因子,对目标用户进行信息采集,生成多个波动曲线;对目标用户同行进行信息采集,生成多个均值波动曲线;通过风控评价模型对多个波动曲线和多个均值波动曲线进行分析,生成多个评分,权重评价后生成目标风险系数,解决了现有技术中传统的交易风险评估方法不够客观全面,导致风险监控效果差的技术问题,通过基于随机森林算法和风险监控因子进行客观风险评估,实现了提高风险监控水平的技术效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍,显而易见的,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的基于随机森林算法的风险监控方法流程示意图;
图2为本申请实施例提供的基于随机森林算法的风险监控方法中对目标用户进行信息采集的流程示意图;
图3为本申请实施例提供的基于随机森林算法的风险监控方法中通过风控评价模型进行风控评价的流程示意图;
图4为本申请实施例提供的基于随机森林算法的风险监控系统结构示意图。
附图标记说明:风险监控因子配置模块11,用户信息采集模块12,用户同行信息采集模块13,风控评价模块14,因子权重分布结果生成模块15,目标风险系数生成模块16。
具体实施方式
本申请提供了基于随机森林算法的风险监控方法,用于解决现有技术中传统的交易风险评估方法不够客观全面,导致风险监控效果差的技术问题。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整的描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请的说明书及上述附图中的术语“第一”“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块。
实施例一
如图1所示,本申请提供了基于随机森林算法的风险监控方法,所述方法包括:
P10:配置风险监控因子,其中,所述风险监控因子包括失信比因子、交易数因子、好评比因子和年利润因子;
可选的,根据交易风险监控经验,配置用于进行风险监控的风险监控因子,所述风险监控因子包括失信比因子、交易数因子、好评比因子和年利润因子,其中,所述失信比因子是指在预设的历史时段内,各个交易方或各类型交易的失信交易数量占总交易数量的比值,可以通过分析历史交易记录、信用评级和相关信用信息来评估失信比,较高的失信比意味着更高的交易风险。
所述交易数因子是指在预设时间内的交易的数量,与交易的活跃度和潜在风险暴露程度相关。所述好评比因子是指交易受到好评的比例,可反映交易的质量和客户满意度,通过分析客户评价、投诉和满意度调查等信息,可以评估所述好评比因子。所述年利润因子是评估企业健康状况和盈利能力的重要指标,较低的年利润可能意味着较高的经济风险和财务压力。将各项风险监控因子数据在受信任的平台中进行共享,可作为各个交易参与方的风险评估参考数据,提高交易的便捷性和透明度。
P20:遍历所述失信比因子、所述交易数因子、所述好评比因子和所述年利润因子,对目标用户进行信息采集,生成失信比波动曲线、交易数波动曲线、好评比波动曲线和年利润波动曲线;
进一步的,如图2所示,本申请实施例步骤P20还包括:
P21:配置信息采集时域,其中,所述信息采集时域至少包括当前年份之前的连续5年,不足5年时数据补零;
P22:根据所述信息采集时域,通过风控共享平台检索所述目标用户的交易记录信息,获得所述失信比波动曲线和所述交易数波动曲线;
P23:根据所述信息采集时域,通过风控共享平台检索所述目标用户的交易评价信息,获得所述好评比波动曲线,其中,好评为五星评价机制,三星以上视为好评;
P24:根据所述信息采集时域,获得所述目标用户的公示年报信息,获得所述年利润波动曲线。
其中,所述交易数均值波动曲线、所述好评比均值波动曲线和所述年利润均值波动曲线的信息采集时区为所述信息采集时域。
应当理解的是,配置信息采集时域,也就是进行历史交易信息采集的时间区间,并且所述信息采集时域至少包括当前年份之前的连续5年,不足5年时数据补零,进一步的,按照所述信息采集时域,遍历所述失信比因子、所述交易数因子、所述好评比因子和所述年利润因子,对目标用户进行信息采集。
具体的,首先根据所述信息采集时域,通过风控共享平台检索所述目标用户的交易记录信息,所述风控共享平台为经过各交易参与方允许的数据共享平台,可以是本申请的系统,也可以是受信任的其它大数据平台,其中包含多项历史交易数据、失信比数据等,通过检索所述目标用户的交易记录信息,获得目标用户在过去5年内,每年的失信比数据和每年的交易数,并根据每年的失信比数据和每年的交易数,绘制所述失信比波动曲线和所述交易数波动曲线。所述失信比波动曲线可以反映过去5年各交易方的失信比变化情况,进而反映其发展趋势。
同样的,采用上述方法,按照所述信息采集时域,通过风控共享平台检索所述目标用户的交易评价信息,包括获取目标用户在过去5年内的好评数据,其中,好评为五星评价机制,三星以上即视为好评,并逐年计算好评比,根据每年的好评比数据绘制所述好评比波动曲线。进一步的,按照所述信息采集时域,采集所述目标用户过去五年的公示年报信息,并绘制所述年利润波动曲线。
P30:对目标用户同行进行信息采集,生成失信比均值波动曲线、交易数均值波动曲线、好评比均值波动曲线和年利润均值波动曲线;
在本申请一种可能的实施例中,参照上述对目标用户进行信息采集的方法,对目标用户同行进行信息采集,所述目标用户同行即与目标用户处于同一行业的交易用户,可按照所述信息采集时域,采集多个同行用户在过去五年内的交易记录信息、交易评价信息和公示年报信息,并获得多组失信比、交易数、好评比和年利润数据,进而按照数据类型进行均值计算,得到每年的失信比均值、交易数均值、好评比均值和年利润均值,进而绘制生成失信比均值波动曲线、交易数均值波动曲线、好评比均值波动曲线和年利润均值波动曲线,可以反映目标用户所在行业的各项监控因子的综合变化情况。
P40:通过风控评价模型,对所述失信比波动曲线、所述交易数波动曲线、所述好评比波动曲线、所述年利润波动曲线、所述失信比均值波动曲线、所述交易数均值波动曲线、所述好评比均值波动曲线和所述年利润均值波动曲线进行分析,生成失信比评分、交易数评分、好评比评分和稳定性评分,其中,所述风控评价模型基于随机森林算法构建;
具体的,首先基于随机森林算法构建风控评价模型,所述随机森林算法是一种基于决策树的集成学习算法,通过自助法重采样技术,从原始训练样本集中有放回地重复随机抽取样本生成新的训练样本集合,然后用这些新样本集合训练多棵决策树,组成随机森林,随机森林的每棵树都是独立的,它的输出类别是由个别树输出的类别的众数而定。当有新数据输入时,每棵树都会给出自己的分类结果,然后随机森林算法将这些结果汇总,选择出现次数最多的分类作为最终的输出。
使用所述风控评价模型,对所述失信比波动曲线、所述交易数波动曲线、所述好评比波动曲线、所述年利润波动曲线、所述失信比均值波动曲线、所述交易数均值波动曲线、所述好评比均值波动曲线和所述年利润均值波动曲线进行分析评分,得到所述目标用户的失信比评分、交易数评分、好评比评分和稳定性评分,可反映目标用户的信用水平、交易量水平、好评率水平和收益稳定性。
其中,所述风控评价模型的构建,还包括:
P41a:采集失信比特征曲线记录集、第一曲线时域波动特征标识集、第一曲线点集数值特征标识集和失信比评分标识信息集,基于随机森林算法构建失信比评分通道;
P42a:采集交易数特征曲线记录集、第二曲线时域波动特征标识集、第二曲线点集数值特征标识集和交易数评分标识信息集,基于随机森林算法构建交易数评分通道;
P43a:采集好评比特征曲线记录集、第三曲线时域波动特征标识集、第三曲线点集数值特征标识集和好评比评分标识信息集,基于随机森林算法构建好评比评分通道;
P44a:采集年利润特征曲线记录集、第四曲线时域波动特征标识集、第四曲线点集数值特征标识集和年利润评分标识信息集,基于随机森林算法构建年利润评分通道;
P45a:将所述失信比评分通道、所述交易数评分通道、所述好评比评分通道和所述年利润评分通道作为独立节点并行部署,生成所述风控评价模型;
P46a:其中,时域波动特征至少包括曲线斜率、曲线爬升趋势、曲线下降趋势,曲线点集数值特征至少包括集中趋势评价值。
可选的,通过风控共享平台检索进行样本数据采集,包含采集不同类别的特征曲线,以及不同类别的特征曲线对应的时域波动特征、曲线点集数值特征、评分标识等,来作为构建所述风控评价模型的训练数据,所述时域波动特征至少包括曲线斜率、曲线爬升趋势、曲线下降趋势等波动特征,可反映所述目标用户自身的交易评分变化是提高还是下降,所述曲线点集数值特征至少包括集中趋势评价值,可反映行业整体的综合交易评分,所述集中趋势评价值可以是曲线上各点的平均数、中位数或众数等,可反映数据的分布情况和集中程度。
首先,采集失信比特征曲线记录集、第一曲线时域波动特征标识集、第一曲线点集数值特征标识集和失信比评分标识信息集,其中,所述第一曲线时域波动特征标识是指对所述失信比特征曲线记录集中的曲线的波动特征标识,所述第一曲线点集数值特征标识集和失信比评分标识信息对应所述失信比特征曲线记录集的点集数值特征和失信比评分。以所述失信比特征曲线记录集、第一曲线时域波动特征标识集、第一曲线点集数值特征标识集和失信比评分标识信息集作为训练数据,结合随机森林算法进行训练,构建失信比评分通道。
同理,采集交易数特征曲线记录集、第二曲线时域波动特征标识集、第二曲线点集数值特征标识集和交易数评分标识信息集作为训练数据,并基于随机森林算法训练得到交易数评分通道。采集好评比特征曲线记录集、第三曲线时域波动特征标识集、第三曲线点集数值特征标识集和好评比评分标识信息集作为训练数据,训练得到好评比评分通道。采集年利润特征曲线记录集、第四曲线时域波动特征标识集、第四曲线点集数值特征标识集和年利润评分标识信息集作为训练数据,训练得到年利润评分通道。
最后将所述失信比评分通道、所述交易数评分通道、所述好评比评分通道和所述年利润评分通道作为独立节点并行部署,得到所述风控评价模型。
进一步的,本申请实施例步骤P41a还包括:
P41a-1:以所述失信比特征曲线记录集、所述交易数特征曲线记录集、所述好评比特征曲线记录集和所述年利润特征曲线记录集为输入数据,以所述第一曲线时域波动特征标识集直到所述第四曲线时域波动特征标识集,以及所述第一曲线点集数值特征标识集直到所述第四曲线点集数值特征标识集为监督数据,对卷积神经网络进行配置,生成曲线特征提取通道;
P41a-2:以所述第一曲线时域波动特征标识集和所述第一曲线点集数值特征标识集为输入数据,以所述失信比评分标识信息集为监督数据,基于随机森林算法构建特征处理通道;
P41a-3:将所述曲线特征提取通道和所述特征处理通道进行流水线合并,生成所述失信比评分通道。
示例性的,分别以所述失信比特征曲线记录集、所述交易数特征曲线记录集、所述好评比特征曲线记录集和所述年利润特征曲线记录集为输入数据,以所述第一曲线时域波动特征标识集直到所述第四曲线时域波动特征标识集,以及所述第一曲线点集数值特征标识集直到所述第四曲线点集数值特征标识集为监督数据,对卷积神经网络进行有监督训练,直至输出数据与监督数据的一致性达到预设要求,得到曲线特征提取通道,所述曲线特征提取通道可用来进行各曲线的时域波动特征和曲线点集数值特征的提取。
进一步的,以所述第一曲线时域波动特征标识集和所述第一曲线点集数值特征标识集为输入数据,以所述失信比评分标识信息集为监督数据,基于随机森林算法进行决策树训练,并根据训练得到的多个决策树组成特征处理通道,所述特征处理通道可用来根据所述曲线特征提取通道提取的失信比曲线特征,进行失信比评分,判断目标用户的交易信用情况。将所述曲线特征提取通道和所述特征处理通道进行流水线合并,共同组成所述失信比评分通道。
进一步的,本申请实施例步骤P41a-2还包括:
P41a-21:将所述第一曲线时域波动特征标识集、所述第一曲线点集数值特征标识集和所述失信比评分标识信息集设为训练数据集;
P41a-22:将所述训练数据集划分为k等份,获得k份训练数据集;
P41a-23:对所述k份训练数据集进行有放回随机抽取k次,获得第一训练数据集;
P41a-24:执行M周期抽取,获得所述第一训练数据集、第二训练数据集直到第M训练数据集;
P41a-25:根据所述第一训练数据集训练第一决策树,直到根据所述第M训练数据集训练第M决策树;
P41a-26:融合所述第一决策树直到所述第M决策树,获得所述特征处理通道,其中,所述特征处理通道的输出为所述第一决策树直到所述第M决策树的输出的集中趋势计算值。
具体的,基于有监督训练方法,以所述第一曲线时域波动特征标识集、所述第一曲线点集数值特征标识集和所述失信比评分标识信息集作为训练数据集,并根据数据量大小,按照一定比例将所述训练数据集划分为k等份,获得k份训练数据集。进一步的,对所述k份训练数据集进行有放回随机抽取k次,获得第一训练数据集,所述第一训练数据集内可能包含抽取到的重复的数据集。
同理,进行M周期的抽取,获得所述第一训练数据集、第二训练数据集直到第M训练数据集,并使用所述第一训练数据集训练第一决策树,使用第二训练数据集训练第二决策树,以此类推,直到使用所述第M训练数据集训练第M决策树。最后融合所述第一决策树直到所述第M决策树,获得所述特征处理通道,所述特征处理通道的输出为所述第一决策树直到所述第M决策树的输出的集中趋势计算值,也就是多个决策树输出的多个失信比评分的集中趋势计算值,可反映失信比评分的集中趋势。
进一步的,如图3所示,本申请实施例步骤P40还包括:
P41:计算所述失信比波动曲线和所述失信比均值波动曲线的同时域比值,获得失信比特征曲线;
P42:计算所述交易数均值波动曲线和所述交易数波动曲线的同时域比值,获得交易数特征曲线;
P43:计算所述好评比均值波动曲线和所述好评比波动曲线的同时域比值,获得好评比特征曲线;
P44:计算所述年利润均值波动曲线和所述年利润波动曲线的同时域比值,获得年利润特征曲线;
P45:通过所述风控评价模型,对所述失信比特征曲线、所述交易数特征曲线、所述好评比特征曲线和所述年利润特征曲线进行分析,获得所述失信比评分、所述交易数评分、所述好评比评分和所述稳定性评分。
应当理解的是,基于所述信息采集时域,计算所述失信比波动曲线和所述失信比均值波动曲线的同时域比值,也就是计算同一年的目标用户的失信比与同行业失信比均值的比值,并根据每一年的比值生成失信比特征曲线,所述失信比特征曲线可反映目标用户的失信比在整个行业内的平均水平,若比值大于1,说明目标用户的失信比高于行业水平,其信用风险较高,相反,若比值小于1,则说明目标用户的信用风险低于行业平均水平,安全性较高。
同理,参照上述方法,计算所述交易数均值波动曲线和所述交易数波动曲线的同时域比值,获得交易数特征曲线,计算所述好评比均值波动曲线和所述好评比波动曲线的同时域比值,获得好评比特征曲线,计算所述年利润均值波动曲线和所述年利润波动曲线的同时域比值,获得年利润特征曲线。
进一步的,通过所述风控评价模型的所述失信比评分通道、所述交易数评分通道、所述好评比评分通道和所述年利润评分通道,分别对所述失信比特征曲线、所述交易数特征曲线、所述好评比特征曲线和所述年利润特征曲线进行特征提取和特征处理,得到所述失信比评分、所述交易数评分、所述好评比评分和所述稳定性评分,可反映目标用户的信用水平、交易量水平、好评率水平和收益稳定性。
P50:遍历所述失信比因子、所述交易数因子、所述好评比因子和所述年利润因子进行权重分布,生成因子权重分布结果;
可选的,根据当前交易的需求侧重点,如对交易方信用、交易活跃度、好评率以及交易收益的重视程度,结合行业风险评估经验,遍历所述失信比因子、所述交易数因子、所述好评比因子和所述年利润因子进行权重分布,设定各风险监控因子的权重系数,例如设置为3:2:2:3,生成因子权重分布结果。
P60:根据所述因子权重分布结果,对所述失信比评分、所述交易数评分、所述好评比评分和所述稳定性评分进行评价,生成目标风险系数发送至客户端。
具体的,按照所述因子权重分布结果,将所述失信比评分、所述交易数评分、所述好评比评分和所述稳定性评分进行加权平均计算,得到目标风险系数,也就是待交易的目标用户的综合风险系数,将所述目标风险系数发送至客户端,为本次交易提供风险控制参考。
综上所述,本申请实施例至少具有如下技术效果:
本申请通过遍历风险监控因子,对目标用户进行信息采集,生成多个波动曲线;对目标用户同行进行信息采集,生成多个均值波动曲线;通过风控评价模型对多个波动曲线和多个均值波动曲线进行分析,生成多个评分,权重评价后生成目标风险系数。
通过基于随机森林算法和风险监控因子进行客观风险评估,达到了提高风险监控水平的技术效果。
实施例二
基于与前述实施例中基于随机森林算法的风险监控方法相同的发明构思,如图4所示,本申请提供了基于随机森林算法的风险监控系统,本申请实施例中的系统与方法实施例基于同样的发明构思。其中,所述系统包括:
风险监控因子配置模块11,所述风险监控因子配置模块11用于配置风险监控因子,其中,所述风险监控因子包括失信比因子、交易数因子、好评比因子和年利润因子;
用户信息采集模块12,所述用户信息采集模块12用于遍历所述失信比因子、所述交易数因子、所述好评比因子和所述年利润因子,对目标用户进行信息采集,生成失信比波动曲线、交易数波动曲线、好评比波动曲线和年利润波动曲线;
用户同行信息采集模块13,所述用户同行信息采集模块13用于对目标用户同行进行信息采集,生成失信比均值波动曲线、交易数均值波动曲线、好评比均值波动曲线和年利润均值波动曲线;
风控评价模块14,所述风控评价模块14用于通过风控评价模型,对所述失信比波动曲线、所述交易数波动曲线、所述好评比波动曲线、所述年利润波动曲线、所述失信比均值波动曲线、所述交易数均值波动曲线、所述好评比均值波动曲线和所述年利润均值波动曲线进行分析,生成失信比评分、交易数评分、好评比评分和稳定性评分,其中,所述风控评价模型基于随机森林算法构建;
因子权重分布结果生成模块15,所述因子权重分布结果生成模块15用于遍历所述失信比因子、所述交易数因子、所述好评比因子和所述年利润因子进行权重分布,生成因子权重分布结果;
目标风险系数生成模块16,所述目标风险系数生成模块16用于根据所述因子权重分布结果,对所述失信比评分、所述交易数评分、所述好评比评分和所述稳定性评分进行评价,生成目标风险系数发送至客户端。
进一步的,所述用户信息采集模块12还用于执行以下步骤:
配置信息采集时域,其中,所述信息采集时域至少包括当前年份之前的连续5年,不足5年时数据补零;
根据所述信息采集时域,通过风控共享平台检索所述目标用户的交易记录信息,获得所述失信比波动曲线和所述交易数波动曲线;
根据所述信息采集时域,通过风控共享平台检索所述目标用户的交易评价信息,获得所述好评比波动曲线,其中,好评为五星评价机制,三星以上视为好评;
根据所述信息采集时域,获得所述目标用户的公示年报信息,获得所述年利润波动曲线。
进一步的,所述风控评价模块14还用于执行以下步骤:
计算所述失信比波动曲线和所述失信比均值波动曲线的同时域比值,获得失信比特征曲线;
计算所述交易数均值波动曲线和所述交易数波动曲线的同时域比值,获得交易数特征曲线;
计算所述好评比均值波动曲线和所述好评比波动曲线的同时域比值,获得好评比特征曲线;
计算所述年利润均值波动曲线和所述年利润波动曲线的同时域比值,获得年利润特征曲线;
通过所述风控评价模型,对所述失信比特征曲线、所述交易数特征曲线、所述好评比特征曲线和所述年利润特征曲线进行分析,获得所述失信比评分、所述交易数评分、所述好评比评分和所述稳定性评分。
进一步的,所述风控评价模块14还用于执行以下步骤:
采集失信比特征曲线记录集、第一曲线时域波动特征标识集、第一曲线点集数值特征标识集和失信比评分标识信息集,基于随机森林算法构建失信比评分通道;
采集交易数特征曲线记录集、第二曲线时域波动特征标识集、第二曲线点集数值特征标识集和交易数评分标识信息集,基于随机森林算法构建交易数评分通道;
采集好评比特征曲线记录集、第三曲线时域波动特征标识集、第三曲线点集数值特征标识集和好评比评分标识信息集,基于随机森林算法构建好评比评分通道;
采集年利润特征曲线记录集、第四曲线时域波动特征标识集、第四曲线点集数值特征标识集和年利润评分标识信息集,基于随机森林算法构建年利润评分通道;
将所述失信比评分通道、所述交易数评分通道、所述好评比评分通道和所述年利润评分通道作为独立节点并行部署,生成所述风控评价模型;
其中,时域波动特征至少包括曲线斜率、曲线爬升趋势、曲线下降趋势,曲线点集数值特征至少包括集中趋势评价值。
进一步的,所述风控评价模块14还用于执行以下步骤:
以所述失信比特征曲线记录集、所述交易数特征曲线记录集、所述好评比特征曲线记录集和所述年利润特征曲线记录集为输入数据,以所述第一曲线时域波动特征标识集直到所述第四曲线时域波动特征标识集,以及所述第一曲线点集数值特征标识集直到所述第四曲线点集数值特征标识集为监督数据,对卷积神经网络进行配置,生成曲线特征提取通道;
以所述第一曲线时域波动特征标识集和所述第一曲线点集数值特征标识集为输入数据,以所述失信比评分标识信息集为监督数据,基于随机森林算法构建特征处理通道;
将所述曲线特征提取通道和所述特征处理通道进行流水线合并,生成所述失信比评分通道。
进一步的,所述风控评价模块14还用于执行以下步骤:
将所述第一曲线时域波动特征标识集、所述第一曲线点集数值特征标识集和所述失信比评分标识信息集设为训练数据集;
将所述训练数据集划分为k等份,获得k份训练数据集;
对所述k份训练数据集进行有放回随机抽取k次,获得第一训练数据集;
执行M周期抽取,获得所述第一训练数据集、第二训练数据集直到第M训练数据集;
根据所述第一训练数据集训练第一决策树,直到根据所述第M训练数据集训练第M决策树;
融合所述第一决策树直到所述第M决策树,获得所述特征处理通道,其中,所述特征处理通道的输出为所述第一决策树直到所述第M决策树的输出的集中趋势计算值。
需要说明的是,上述本申请实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
本说明书和附图仅仅是本申请的示例性说明,且视为已覆盖本申请范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的范围。这样,倘若本申请的这些修改和变型属于本申请及其等同技术的范围之内,则本申请意图包括这些改动和变形在内。

Claims (8)

1.基于随机森林算法的风险监控方法,其特征在于,包括:
配置风险监控因子,其中,所述风险监控因子包括失信比因子、交易数因子、好评比因子和年利润因子;
遍历所述失信比因子、所述交易数因子、所述好评比因子和所述年利润因子,对目标用户进行信息采集,生成失信比波动曲线、交易数波动曲线、好评比波动曲线和年利润波动曲线;
对目标用户同行进行信息采集,生成失信比均值波动曲线、交易数均值波动曲线、好评比均值波动曲线和年利润均值波动曲线;
通过风控评价模型,对所述失信比波动曲线、所述交易数波动曲线、所述好评比波动曲线、所述年利润波动曲线、所述失信比均值波动曲线、所述交易数均值波动曲线、所述好评比均值波动曲线和所述年利润均值波动曲线进行分析,生成失信比评分、交易数评分、好评比评分和稳定性评分,其中,所述风控评价模型基于随机森林算法构建;
遍历所述失信比因子、所述交易数因子、所述好评比因子和所述年利润因子进行权重分布,生成因子权重分布结果;
根据所述因子权重分布结果,对所述失信比评分、所述交易数评分、所述好评比评分和所述稳定性评分进行评价,生成目标风险系数发送至客户端。
2.如权利要求1所述的方法,其特征在于,遍历所述失信比因子、所述交易数因子、所述好评比因子和所述年利润因子,对目标用户进行信息采集,生成失信比波动曲线、交易数波动曲线、好评比波动曲线和年利润波动曲线,包括:
配置信息采集时域,其中,所述信息采集时域至少包括当前年份之前的连续5年,不足5年时数据补零;
根据所述信息采集时域,通过风控共享平台检索所述目标用户的交易记录信息,获得所述失信比波动曲线和所述交易数波动曲线;
根据所述信息采集时域,通过风控共享平台检索所述目标用户的交易评价信息,获得所述好评比波动曲线,其中,好评为五星评价机制,三星以上视为好评;
根据所述信息采集时域,获得所述目标用户的公示年报信息,获得所述年利润波动曲线。
3.如权利要求2所述的方法,其特征在于,所述交易数均值波动曲线、所述好评比均值波动曲线和所述年利润均值波动曲线的信息采集时区为所述信息采集时域。
4.如权利要求1所述的方法,其特征在于,通过风控评价模型,对所述失信比波动曲线、所述交易数波动曲线、所述好评比波动曲线、所述年利润波动曲线、所述失信比均值波动曲线、所述交易数均值波动曲线、所述好评比均值波动曲线和所述年利润均值波动曲线进行分析,生成失信比评分、交易数评分、好评比评分和稳定性评分,其中,所述风控评价模型基于随机森林算法构建,包括:
计算所述失信比波动曲线和所述失信比均值波动曲线的同时域比值,获得失信比特征曲线;
计算所述交易数均值波动曲线和所述交易数波动曲线的同时域比值,获得交易数特征曲线;
计算所述好评比均值波动曲线和所述好评比波动曲线的同时域比值,获得好评比特征曲线;
计算所述年利润均值波动曲线和所述年利润波动曲线的同时域比值,获得年利润特征曲线;
通过所述风控评价模型,对所述失信比特征曲线、所述交易数特征曲线、所述好评比特征曲线和所述年利润特征曲线进行分析,获得所述失信比评分、所述交易数评分、所述好评比评分和所述稳定性评分。
5.如权利要求4所述的方法,其特征在于,所述风控评价模型基于随机森林算法构建,包括:
采集失信比特征曲线记录集、第一曲线时域波动特征标识集、第一曲线点集数值特征标识集和失信比评分标识信息集,基于随机森林算法构建失信比评分通道;
采集交易数特征曲线记录集、第二曲线时域波动特征标识集、第二曲线点集数值特征标识集和交易数评分标识信息集,基于随机森林算法构建交易数评分通道;
采集好评比特征曲线记录集、第三曲线时域波动特征标识集、第三曲线点集数值特征标识集和好评比评分标识信息集,基于随机森林算法构建好评比评分通道;
采集年利润特征曲线记录集、第四曲线时域波动特征标识集、第四曲线点集数值特征标识集和年利润评分标识信息集,基于随机森林算法构建年利润评分通道;
将所述失信比评分通道、所述交易数评分通道、所述好评比评分通道和所述年利润评分通道作为独立节点并行部署,生成所述风控评价模型;
其中,时域波动特征至少包括曲线斜率、曲线爬升趋势、曲线下降趋势,曲线点集数值特征至少包括集中趋势评价值。
6.如权利要求5所述的方法,其特征在于,采集失信比特征曲线记录集、第一曲线时域波动特征标识集、第一曲线点集数值特征标识集和失信比评分标识信息集,基于随机森林算法构建失信比评分通道,包括:
以所述失信比特征曲线记录集、所述交易数特征曲线记录集、所述好评比特征曲线记录集和所述年利润特征曲线记录集为输入数据,以所述第一曲线时域波动特征标识集直到所述第四曲线时域波动特征标识集,以及所述第一曲线点集数值特征标识集直到所述第四曲线点集数值特征标识集为监督数据,对卷积神经网络进行配置,生成曲线特征提取通道;
以所述第一曲线时域波动特征标识集和所述第一曲线点集数值特征标识集为输入数据,以所述失信比评分标识信息集为监督数据,基于随机森林算法构建特征处理通道;
将所述曲线特征提取通道和所述特征处理通道进行流水线合并,生成所述失信比评分通道。
7.如权利要求6所述的方法,其特征在于,以所述第一曲线时域波动特征标识集和所述第一曲线点集数值特征标识集为输入数据,以所述失信比评分标识信息集为监督数据,基于随机森林算法构建特征处理通道,包括:
将所述第一曲线时域波动特征标识集、所述第一曲线点集数值特征标识集和所述失信比评分标识信息集设为训练数据集;
将所述训练数据集划分为k等份,获得k份训练数据集;
对所述k份训练数据集进行有放回随机抽取k次,获得第一训练数据集;
执行M周期抽取,获得所述第一训练数据集、第二训练数据集直到第M训练数据集;
根据所述第一训练数据集训练第一决策树,直到根据所述第M训练数据集训练第M决策树;
融合所述第一决策树直到所述第M决策树,获得所述特征处理通道,其中,所述特征处理通道的输出为所述第一决策树直到所述第M决策树的输出的集中趋势计算值。
8.基于随机森林算法的风险监控系统,其特征在于,所述系统包括:
风险监控因子配置模块,所述风险监控因子配置模块用于配置风险监控因子,其中,所述风险监控因子包括失信比因子、交易数因子、好评比因子和年利润因子;
用户信息采集模块,所述用户信息采集模块用于遍历所述失信比因子、所述交易数因子、所述好评比因子和所述年利润因子,对目标用户进行信息采集,生成失信比波动曲线、交易数波动曲线、好评比波动曲线和年利润波动曲线;
用户同行信息采集模块,所述用户同行信息采集模块用于对目标用户同行进行信息采集,生成失信比均值波动曲线、交易数均值波动曲线、好评比均值波动曲线和年利润均值波动曲线;
风控评价模块,所述风控评价模块用于通过风控评价模型,对所述失信比波动曲线、所述交易数波动曲线、所述好评比波动曲线、所述年利润波动曲线、所述失信比均值波动曲线、所述交易数均值波动曲线、所述好评比均值波动曲线和所述年利润均值波动曲线进行分析,生成失信比评分、交易数评分、好评比评分和稳定性评分,其中,所述风控评价模型基于随机森林算法构建;
因子权重分布结果生成模块,所述因子权重分布结果生成模块用于遍历所述失信比因子、所述交易数因子、所述好评比因子和所述年利润因子进行权重分布,生成因子权重分布结果;
目标风险系数生成模块,所述目标风险系数生成模块用于根据所述因子权重分布结果,对所述失信比评分、所述交易数评分、所述好评比评分和所述稳定性评分进行评价,生成目标风险系数发送至客户端。
CN202410282142.5A 2024-03-13 2024-03-13 基于随机森林算法的风险监控方法及系统 Active CN117874654B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410282142.5A CN117874654B (zh) 2024-03-13 2024-03-13 基于随机森林算法的风险监控方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410282142.5A CN117874654B (zh) 2024-03-13 2024-03-13 基于随机森林算法的风险监控方法及系统

Publications (2)

Publication Number Publication Date
CN117874654A true CN117874654A (zh) 2024-04-12
CN117874654B CN117874654B (zh) 2024-05-24

Family

ID=90585039

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410282142.5A Active CN117874654B (zh) 2024-03-13 2024-03-13 基于随机森林算法的风险监控方法及系统

Country Status (1)

Country Link
CN (1) CN117874654B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110334737A (zh) * 2019-06-04 2019-10-15 阿里巴巴集团控股有限公司 一种基于随机森林的客户风险指标筛选的方法和系统
CN111833172A (zh) * 2020-05-25 2020-10-27 百维金科(上海)信息科技有限公司 一种基于孤立森林的消费信贷欺诈行为检测方法及其系统
CN112037009A (zh) * 2020-08-06 2020-12-04 百维金科(上海)信息科技有限公司 一种基于随机森林算法的消费信贷场景的风险评估方法
CN113726558A (zh) * 2021-08-09 2021-11-30 国网福建省电力有限公司 基于随机森林算法的网络设备流量预测系统
CN114022269A (zh) * 2021-10-28 2022-02-08 江苏未至科技股份有限公司 一种公共信用领域企业信用风险评估方法
WO2022246843A1 (zh) * 2021-05-28 2022-12-01 京东方科技集团股份有限公司 软件项目的风险评估方法、装置、计算机设备、存储介质
CN116051268A (zh) * 2023-01-17 2023-05-02 江西财经大学 个人信用评价方法、系统、可读存储介质及计算机设备
WO2023070293A1 (zh) * 2021-10-26 2023-05-04 大连理工大学 一种工业副产煤气系统长期调度方法
CN116427915A (zh) * 2023-02-27 2023-07-14 东北石油大学三亚海洋油气研究院 基于随机森林的常规测井曲线裂缝密度预测方法及系统
CN116681291A (zh) * 2023-08-02 2023-09-01 杭州小策科技有限公司 一种基于集成模型的风控预测方法及系统
CN117035983A (zh) * 2023-07-07 2023-11-10 中国工商银行股份有限公司 信贷风险等级的确定方法、装置、存储介质及电子设备

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110334737A (zh) * 2019-06-04 2019-10-15 阿里巴巴集团控股有限公司 一种基于随机森林的客户风险指标筛选的方法和系统
CN111833172A (zh) * 2020-05-25 2020-10-27 百维金科(上海)信息科技有限公司 一种基于孤立森林的消费信贷欺诈行为检测方法及其系统
CN112037009A (zh) * 2020-08-06 2020-12-04 百维金科(上海)信息科技有限公司 一种基于随机森林算法的消费信贷场景的风险评估方法
WO2022246843A1 (zh) * 2021-05-28 2022-12-01 京东方科技集团股份有限公司 软件项目的风险评估方法、装置、计算机设备、存储介质
CN113726558A (zh) * 2021-08-09 2021-11-30 国网福建省电力有限公司 基于随机森林算法的网络设备流量预测系统
WO2023070293A1 (zh) * 2021-10-26 2023-05-04 大连理工大学 一种工业副产煤气系统长期调度方法
CN114022269A (zh) * 2021-10-28 2022-02-08 江苏未至科技股份有限公司 一种公共信用领域企业信用风险评估方法
CN116051268A (zh) * 2023-01-17 2023-05-02 江西财经大学 个人信用评价方法、系统、可读存储介质及计算机设备
CN116427915A (zh) * 2023-02-27 2023-07-14 东北石油大学三亚海洋油气研究院 基于随机森林的常规测井曲线裂缝密度预测方法及系统
CN117035983A (zh) * 2023-07-07 2023-11-10 中国工商银行股份有限公司 信贷风险等级的确定方法、装置、存储介质及电子设备
CN116681291A (zh) * 2023-08-02 2023-09-01 杭州小策科技有限公司 一种基于集成模型的风控预测方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ZILI WANG 等: "Balanced Random Forest Model is More Suitable for Wildfire Risk Assessment", IGARSS 2022 - 2022 IEEE INTERNATIONAL GEOSCIENCE AND REMOTE SENSING SYMPOSIUM, 31 December 2022 (2022-12-31) *
单联香;鲜涛;尹彦;: "电子商务信用评分方法研究", 世界标准化与质量管理, no. 12, 16 December 2007 (2007-12-16) *
杨霞霞;苏锋;黄戌霞;: "基于改进随机森林算法的不平衡数据分类方法研究", 网络安全技术与应用, no. 10, 15 October 2020 (2020-10-15) *
马晓君;董碧滢;王常欣;: "一种基于PSO优化加权随机森林算法的上市公司信用评级模型设计", 数量经济技术经济研究, no. 12, 5 December 2019 (2019-12-05) *

Also Published As

Publication number Publication date
CN117874654B (zh) 2024-05-24

Similar Documents

Publication Publication Date Title
CN107609708B (zh) 一种基于手机游戏商店的用户流失预测方法及系统
CN108665159A (zh) 一种风险评估方法、装置、终端设备及存储介质
CN106952159B (zh) 一种不动产抵押品风险控制方法、系统及存储介质
CN110334737A (zh) 一种基于随机森林的客户风险指标筛选的方法和系统
CN110263827B (zh) 基于交易规律识别的异常交易检测方法及装置
CN108228706A (zh) 用于识别异常交易社团的方法和装置
CN110675243A (zh) 一种融合机器学习的信贷预测逾期方法及系统
CN104881783A (zh) 电子银行账户欺诈行为及风险检测方法与系统
CN112700324A (zh) 基于CatBoost与受限玻尔兹曼机结合的用户借贷违约预测方法
CN108629379A (zh) 一种个人征信评估方法及系统
CN112487291A (zh) 一种基于大数据的个性化新闻推荐方法及装置
CN114154672A (zh) 一种用于客户流失预测的数据挖掘方法
CN114021612A (zh) 一种新型个人信用评估方法及系统
TWI662809B (zh) 影像串流服務的障礙定位系統及維運方法
CN113450158A (zh) 银行活动信息推送方法及装置
CN117874654B (zh) 基于随机森林算法的风险监控方法及系统
CN116883070A (zh) 一种银行代发薪资客户流失预警方法
CN112686446A (zh) 一种面向机器学习可解释性的信贷违约预测方法及系统
CN107480703A (zh) 交易故障检测方法及装置
KR102400500B1 (ko) 인공지능 기반의 운동신용평가정보 제공 시스템
KR102499182B1 (ko) 인공지능을 이용한 가계대출 사기/부실 상시감사지원시스템
CN117350730A (zh) 一种用于金融交易监管的机器学习算法筛查方法
CN114880663A (zh) 一种基于异常检测的黑产作弊识别方法和系统
CN113449923A (zh) 一种多模型标的物行情预测方法和装置
CN111951099A (zh) 一种信用卡发卡模型及其运用方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant