CN115147203A

CN115147203A - 基于大数据的金融风险智能分析方法

Info

Publication number: CN115147203A
Application number: CN202210646882.3A
Authority: CN
Inventors: 师相龙; 邱怡果
Original assignee: Nanjing Jinwei Chengrong Technology Development Co ltd
Current assignee: Alpha Time Technology Shenzhen Co ltd
Priority date: 2022-06-08
Filing date: 2022-06-08
Publication date: 2022-10-04
Anticipated expiration: 2042-06-08
Also published as: CN115147203B

Abstract

本发明公开了一种基于大数据的金融风险智能分析方法，涉及人工智能技术领域。该方法包括：获取多个客户的借贷历史数据，经分析得到借贷历史数据的投影值和高斯值；通过投影值和高斯值的差值，确定借贷历史数据为异常数据；获取每个异常数据对应的单个客户，并确定单个客户的异常值和风险值；设置风险阈值，根据单个客户的风险值与风险阈值的对比，对单个客户中风险客户和特殊群体客户进行区分，由此完成所述金融风险智能分析。本发明通过对借贷历史数据中风险客户和特殊群体客户的区分，在降低了银行借贷风险的同时，避免了特殊群体客户的流失。

Description

基于大数据的金融风险智能分析方法

技术领域

本发明涉及人工智能技术领域，具体涉及一种基于大数据的金融风险智能分析方法。

背景技术

申贷方在进行贷款申请时，银行需要对于申贷方的申贷请求进行风险评估，以防止申贷方逾期进而导致银行坏账，无法收回借贷资金。

在对申贷人资料进行审核时，银行需要结合客户借贷历史数据对其进行风险评判，银行采用客户借贷历史数据进行分析评判时，需要对客户借贷历史数据进行清洗处理，以得到高质量数据。由于银行存在特殊群体客户，在对客户借贷历史数据进行清洗的过程中，由于没有对风险客户和特殊群体客户进行区分，往往会清除一些特殊群体客户，无法实现对借贷风险的有效处理，同时也导致了特殊群体客户的流失。

发明内容

本发明的主要目的是提供一种基于大数据的金融风险智能分析方法，以解决相关技术中由于没有对风险客户和特殊群体客户进行区分，导致无法实现对借贷风险的有效处理和特殊群体客户的流失的技术问题。有鉴于此，本发明通过以下方案予以实现：

一种基于大数据的金融风险智能分析方法，包括以下步骤：

获取多个客户的借贷历史数据；

根据所述借贷历史数据分析得到所述借贷历史数据的投影值；

将每个所述投影值拟合成高斯模型，得到每个所述投影值的高斯值；

通过所述投影值和高斯值的差值获取多个离群点，每个所述离群点对应的借贷历史数据为异常数据；

获取每个所述异常数据对应的单个客户，根据每个所述单个客户的借贷历史数据分析得到借贷历史数据的投影值；根据所述单个客户的投影值及每两条借贷历史数据之间的时间间隔值，确定所述单个客户的异常值；

根据所述单个客户的异常值和借贷时间，确定所述单个客户的风险值；

设置风险阈值，根据所述单个客户的风险值与所述风险阈值的对比，对多个所述单个客户中风险客户和特殊群体客户进行区分，由此完成所述金融风险智能分析。

优选地，所述借贷历史数据的投影值通过以下步骤获取：

将所述多个客户的借贷历史数据转化为多个结构化数据，再将所述多个结构化数据输入到PCA算法中，得到多个主成分方向，选取所述多个主成分方向对应特征值最大的主成分方向作为第一主成分坐标轴；

将单次所述借贷历史数据投影在所述第一主成分坐标轴上，得到单次所述借贷历史数据在所述第一主成分坐标轴上的投影值；所述投影值为所述借贷历史数据的投影值。

更优选地，所述异常数据通过以下步骤获取：

对所述投影值进行次数统计，得到统计结果，并对所述统计结果采用多高斯混合模型拟合成高斯模型；

将每个所述投影值按从小到大的顺序进行排序，并将每个所述投影值的序号带入所述高斯模型中，得到所述投影值和对应序号的高斯值的差值；

设定阈值，当所述投影值和高斯值的差值大于所述阈值时，则所述投影值和高斯值的差值为离群点，所述离群点对应的所述借贷历史数据为异常数据。

更优选地，所述阈值为10，当所述投影值和高斯值的差值大于10时，则所述投影值和高斯值的差值为离群点，所述离群点对应的所述借贷历史数据为异常数据。

优选地，所述单个客户的异常值通过下式得到：

其中：cx_j为单个客户的异常值；T_ji为第j个客户第i个借贷历史数据的投影值；T_j(i-1)为第j个客户第i个借贷历史数据的上一个数据的投影值；G_n为第j个单个客户每两条借贷数据之间的时间间隔值。

更优选地，所述单个客户的风险值通过下式得到：

其中：yc_j为第j个单个客户的风险值；σ_j为第j个单个客户所有异常值差值的方差值；A_t为第j个客户第t个借贷历史数据时间与当前分析时间的差值；T_jt为第j个客户第t个借贷历史数据的投影值。

更优选地，所述第j个单个客户所有异常值差值的方差值σ_j，通过如下步骤获取：

按照时间顺序将所述单个客户的异常值作差取绝对值；对全部所述绝对值求取方差值，从而得到所述单个客户所有异常值差值的方差值σ_j。

优选地，当所述单个客户的风险值大于所述风险阈值时，所述单个客户为风险客户；当所述单个客户的风险值小于所述风险阈值时，所述单个客户为特殊群体客户。

更优选地，所述风险阈值为5.5，当所述单个客户的风险值大于5.5时，所述单个客户为风险客户；当所述单个客户的风险值小于5.5时，所述单个客户为特殊群体客户。

与现有技术相比，本发明的有益效果是：

本发明利用借贷历史数据的投影值和高斯值的差值来找离群点，离群点对应的借贷历史数据为异常数据；获取异常数据对应的单个客户；通过对单个客户进行异常值和风险值分析，并根据风险阈值和风险值的对比，完成了对银行借贷历史数据中风险客户和特殊群体客户的区分；本发明在降低了银行借贷风险的同时，避免了特殊群体客户的流失。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例1和实施例2中金融风险智能分析方法的流程示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1

本实施例提供了一种基于大数据的金融风险智能分析方法，如图1所示，包括如下步骤：

S1，获取多个客户的借贷历史数据，经分析得到所述借贷历史数据的投影值；将每个所述投影值拟合成高斯模型，得到每个所述投影值的高斯值；

S2，获取所述投影值和所述高斯值的差值，设置阈值，当所述投影值和高斯值的差值大于所述阈值时，则所述投影值和高斯值的差值为离群点，所述离群点对应的所述借贷历史数据为异常数据；

S3，获取每个所述异常数据对应的单个客户，根据所述单个客户借贷历史数据的投影值和每两条借贷历史数据之间的时间间隔值，确定所述单个客户的异常值；并根据所述单个客户的异常值和借贷历史时间，确定所述单个客户的风险值；

S4，设置风险阈值，当所述单个客户的风险值大于所述风险阈值时，所述单个客户为风险客户；当所述单个客户的风险值小于所述风险阈值时，所述单个客户为特殊群体客户。

实施例2

S1，获取银行多个客户的借贷历史数据，将所述借贷历史数据转化为结构化数据并输入到主成分分析(PCA)算法中，得到多个主成分方向；根据输入数列的指标个数，得到对应个数的主成分方向，选取各主成分方向对应特征值最大的主成分方向作为第一主成分坐标轴；将单次的借贷历史数据投影在主成分分析(PCA)算法中第一主成分坐标轴上，到单次的借贷历史数据在第一主成分坐标轴上的投影值T_i；

S2，对所有单次的借贷历史数据在第一主成分坐标轴上的投影值T_i进行次数统计，得到统计结果，并采用多高斯混合模型运算，拟合成高斯模型；然后，将所有单次的借贷历史数据在第一主成分坐标轴上的投影值T_i按从小到大的顺序进行排序，并将每个所述投影值T_i的序号带入所述高斯模型对应的函数中，得到所述投影值和对应序号的高斯值的差值c_i；设定阈值r来找到离群点，找到离群点后，所述离群点对应的银行借贷数据为异常数据；

在本实施例中，设置高斯混合模型的个数值为30，实施者可根据具体实施场景进行调整；所述阈值r为一个超参数，可由实施者根据具体实施场景进行调整，本实施例设置阈值r为10；当投影值和高斯值的差值c_i大于10时，则认为所述投影值和高斯值的差值c_i为离群点，即所述离群点对应的银行借贷数据为异常数据；

S3，获取每个所述异常数据对应的单个客户，则所述单个客户的异常值通过下式得到：

其中：cx_j为单个客户的异常值；T_ji为第j个客户第i个借贷历史数据的投影值；T_j(i-1)为第j个客户第i个借贷历史数据的上一个数据的投影值；G_n为第j个单个客户每两条借贷数据之间的时间间隔值；

所述单个客户的风险值通过下式得到：

其中：yc_j为第j个单个客户的风险值；σ_j为第j个单个客户所有异常值差值的方差值；A_t为第j个客户第t个借贷历史数据时间与当前分析时间的差值；T_jt为第j个客户第t个借贷历史数据的投影值；

上式中，所述第j个单个客户所有异常值差值的方差值σ_j，通过如下步骤获取：按照时间顺序将所述单个客户的异常值作差取绝对值；对全部所述绝对值求取方差值，从而得到所述单个客户所有异常值差值的方差值σ_j；

所述单个客户所有异常值差值的方差值越大，则所述单个客户所有相邻两条借贷历史数据越不集中，即所述单个客户所有相邻两条借贷历史数据之间的异常值越大；

上式中，

表示当前第j个单个客户总体异常值的分布，将各借贷历史数据的A_t×T_jt累加得到当前总体异常值的分布；其中n为第j个单个客户借贷历史数据的个数，t为第j个单个客户第t个借贷历史数据；A_t表示第j个单个客户第t个借贷历史数据时间与当前时间值的差值；T_jt表示第j个单个客户第t个借贷历史数据的投影值，所以第j个单个客户总体异常值的值越大，则当前单个客户风险程度越高；

将σ_j与

相乘得到当前单个客户风险值yc_j，是因为异常值变化越不稳定，且异常值总体分布偏大，则单个客户为风险客户的可能性就越大，如果异常值变化相对稳定，则是风险客户的可能性就越小，所以当单个客户所有借贷历史数据的异常值yc_j越大，相应的，异常数据中是风险客户可能性就越大；

S4，设置风险阈值ycr，本实施例设置风险阈值ycr为5.5，具体值可由实施者根据具体实施场景进行调整；当所述第j个单个客户的风险值yc_j大于5.5时，则认为当前客户为风险客户；当所述第j个单个客户的风险值yc_j小于5.5时，则认为当前客户为特殊群体客户；由此完成金融风险智能分析。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于大数据的金融风险智能分析方法，其特征在于，包括以下步骤：

获取多个客户的借贷历史数据；

2.根据权利要求1所述的基于大数据的金融风险智能分析方法，其特征在于，所述借贷历史数据的投影值通过以下步骤获取：

3.根据权利要求2所述的基于大数据的金融风险智能分析方法，其特征在于，所述异常数据通过以下步骤获取：

4.根据权利要3所述的基于大数据的金融风险智能分析方法，其特征在于，所述阈值为10，当所述投影值和高斯值的差值大于10时，则所述投影值和高斯值的差值为离群点，所述离群点对应的所述借贷历史数据为异常数据。

5.根据权利要求1所述的基于大数据的金融风险智能分析方法，其特征在于，所述单个客户的异常值通过下式得到：

6.根据权利要求5所述的基于大数据的金融风险智能分析方法，其特征在于，所述单个客户的风险值通过下式得到：

7.根据权利要求6所述的基于大数据的金融风险智能分析方法，其特征在于，所述第j个单个客户所有异常值差值的方差值σ_j，通过如下步骤获取：

按照时间顺序将所述单个客户的异常值作差取绝对值；

对全部所述绝对值求取方差值，从而得到所述单个客户所有异常值差值的方差值σ_j。

8.根据权利要求1所述的基于大数据的金融风险智能分析方法，其特征在于，当所述单个客户的风险值大于所述风险阈值时，所述单个客户为风险客户；当所述单个客户的风险值小于所述风险阈值时，所述单个客户为特殊群体客户。

9.根据权利要求8所述的基于大数据的金融风险智能分析方法，其特征在于，所述风险阈值为5.5，当所述单个客户的风险值大于5.5时，所述单个客户为风险客户；当所述单个客户的风险值小于5.5时，所述单个客户为特殊群体客户。