CN115147203A - 基于大数据的金融风险智能分析方法 - Google Patents

基于大数据的金融风险智能分析方法 Download PDF

Info

Publication number
CN115147203A
CN115147203A CN202210646882.3A CN202210646882A CN115147203A CN 115147203 A CN115147203 A CN 115147203A CN 202210646882 A CN202210646882 A CN 202210646882A CN 115147203 A CN115147203 A CN 115147203A
Authority
CN
China
Prior art keywords
value
data
risk
loan
client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210646882.3A
Other languages
English (en)
Other versions
CN115147203B (zh
Inventor
师相龙
邱怡果
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alpha Time Technology Shenzhen Co ltd
Original Assignee
Nanjing Jinwei Chengrong Technology Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Jinwei Chengrong Technology Development Co ltd filed Critical Nanjing Jinwei Chengrong Technology Development Co ltd
Priority to CN202210646882.3A priority Critical patent/CN115147203B/zh
Publication of CN115147203A publication Critical patent/CN115147203A/zh
Application granted granted Critical
Publication of CN115147203B publication Critical patent/CN115147203B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种基于大数据的金融风险智能分析方法,涉及人工智能技术领域。该方法包括:获取多个客户的借贷历史数据,经分析得到借贷历史数据的投影值和高斯值;通过投影值和高斯值的差值,确定借贷历史数据为异常数据;获取每个异常数据对应的单个客户,并确定单个客户的异常值和风险值;设置风险阈值,根据单个客户的风险值与风险阈值的对比,对单个客户中风险客户和特殊群体客户进行区分,由此完成所述金融风险智能分析。本发明通过对借贷历史数据中风险客户和特殊群体客户的区分,在降低了银行借贷风险的同时,避免了特殊群体客户的流失。

Description

基于大数据的金融风险智能分析方法
技术领域
本发明涉及人工智能技术领域,具体涉及一种基于大数据的金融风险智能分析方法。
背景技术
申贷方在进行贷款申请时,银行需要对于申贷方的申贷请求进行风险评估,以防止申贷方逾期进而导致银行坏账,无法收回借贷资金。
在对申贷人资料进行审核时,银行需要结合客户借贷历史数据对其进行风险评判,银行采用客户借贷历史数据进行分析评判时,需要对客户借贷历史数据进行清洗处理,以得到高质量数据。由于银行存在特殊群体客户,在对客户借贷历史数据进行清洗的过程中,由于没有对风险客户和特殊群体客户进行区分,往往会清除一些特殊群体客户,无法实现对借贷风险的有效处理,同时也导致了特殊群体客户的流失。
发明内容
本发明的主要目的是提供一种基于大数据的金融风险智能分析方法,以解决相关技术中由于没有对风险客户和特殊群体客户进行区分,导致无法实现对借贷风险的有效处理和特殊群体客户的流失的技术问题。有鉴于此,本发明通过以下方案予以实现:
一种基于大数据的金融风险智能分析方法,包括以下步骤:
获取多个客户的借贷历史数据;
根据所述借贷历史数据分析得到所述借贷历史数据的投影值;
将每个所述投影值拟合成高斯模型,得到每个所述投影值的高斯值;
通过所述投影值和高斯值的差值获取多个离群点,每个所述离群点对应的借贷历史数据为异常数据;
获取每个所述异常数据对应的单个客户,根据每个所述单个客户的借贷历史数据分析得到借贷历史数据的投影值;根据所述单个客户的投影值及每两条借贷历史数据之间的时间间隔值,确定所述单个客户的异常值;
根据所述单个客户的异常值和借贷时间,确定所述单个客户的风险值;
设置风险阈值,根据所述单个客户的风险值与所述风险阈值的对比,对多个所述单个客户中风险客户和特殊群体客户进行区分,由此完成所述金融风险智能分析。
优选地,所述借贷历史数据的投影值通过以下步骤获取:
将所述多个客户的借贷历史数据转化为多个结构化数据,再将所述多个结构化数据输入到PCA算法中,得到多个主成分方向,选取所述多个主成分方向对应特征值最大的主成分方向作为第一主成分坐标轴;
将单次所述借贷历史数据投影在所述第一主成分坐标轴上,得到单次所述借贷历史数据在所述第一主成分坐标轴上的投影值;所述投影值为所述借贷历史数据的投影值。
更优选地,所述异常数据通过以下步骤获取:
对所述投影值进行次数统计,得到统计结果,并对所述统计结果采用多高斯混合模型拟合成高斯模型;
将每个所述投影值按从小到大的顺序进行排序,并将每个所述投影值的序号带入所述高斯模型中,得到所述投影值和对应序号的高斯值的差值;
设定阈值,当所述投影值和高斯值的差值大于所述阈值时,则所述投影值和高斯值的差值为离群点,所述离群点对应的所述借贷历史数据为异常数据。
更优选地,所述阈值为10,当所述投影值和高斯值的差值大于10时,则所述投影值和高斯值的差值为离群点,所述离群点对应的所述借贷历史数据为异常数据。
优选地,所述单个客户的异常值通过下式得到:
Figure BDA0003684393420000031
其中:cxj为单个客户的异常值;Tji为第j个客户第i个借贷历史数据的投影值;Tj(i-1)为第j个客户第i个借贷历史数据的上一个数据的投影值;Gn为第j个单个客户每两条借贷数据之间的时间间隔值。
更优选地,所述单个客户的风险值通过下式得到:
Figure BDA0003684393420000032
其中:ycj为第j个单个客户的风险值;σj为第j个单个客户所有异常值差值的方差值;At为第j个客户第t个借贷历史数据时间与当前分析时间的差值;Tjt为第j个客户第t个借贷历史数据的投影值。
更优选地,所述第j个单个客户所有异常值差值的方差值σj,通过如下步骤获取:
按照时间顺序将所述单个客户的异常值作差取绝对值;对全部所述绝对值求取方差值,从而得到所述单个客户所有异常值差值的方差值σj
优选地,当所述单个客户的风险值大于所述风险阈值时,所述单个客户为风险客户;当所述单个客户的风险值小于所述风险阈值时,所述单个客户为特殊群体客户。
更优选地,所述风险阈值为5.5,当所述单个客户的风险值大于5.5时,所述单个客户为风险客户;当所述单个客户的风险值小于5.5时,所述单个客户为特殊群体客户。
与现有技术相比,本发明的有益效果是:
本发明利用借贷历史数据的投影值和高斯值的差值来找离群点,离群点对应的借贷历史数据为异常数据;获取异常数据对应的单个客户;通过对单个客户进行异常值和风险值分析,并根据风险阈值和风险值的对比,完成了对银行借贷历史数据中风险客户和特殊群体客户的区分;本发明在降低了银行借贷风险的同时,避免了特殊群体客户的流失。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1和实施例2中金融风险智能分析方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
本实施例提供了一种基于大数据的金融风险智能分析方法,如图1所示,包括如下步骤:
S1,获取多个客户的借贷历史数据,经分析得到所述借贷历史数据的投影值;将每个所述投影值拟合成高斯模型,得到每个所述投影值的高斯值;
S2,获取所述投影值和所述高斯值的差值,设置阈值,当所述投影值和高斯值的差值大于所述阈值时,则所述投影值和高斯值的差值为离群点,所述离群点对应的所述借贷历史数据为异常数据;
S3,获取每个所述异常数据对应的单个客户,根据所述单个客户借贷历史数据的投影值和每两条借贷历史数据之间的时间间隔值,确定所述单个客户的异常值;并根据所述单个客户的异常值和借贷历史时间,确定所述单个客户的风险值;
S4,设置风险阈值,当所述单个客户的风险值大于所述风险阈值时,所述单个客户为风险客户;当所述单个客户的风险值小于所述风险阈值时,所述单个客户为特殊群体客户。
实施例2
本实施例提供了一种基于大数据的金融风险智能分析方法,如图1所示,包括如下步骤:
S1,获取银行多个客户的借贷历史数据,将所述借贷历史数据转化为结构化数据并输入到主成分分析(PCA)算法中,得到多个主成分方向;根据输入数列的指标个数,得到对应个数的主成分方向,选取各主成分方向对应特征值最大的主成分方向作为第一主成分坐标轴;将单次的借贷历史数据投影在主成分分析(PCA)算法中第一主成分坐标轴上,到单次的借贷历史数据在第一主成分坐标轴上的投影值Ti
S2,对所有单次的借贷历史数据在第一主成分坐标轴上的投影值Ti进行次数统计,得到统计结果,并采用多高斯混合模型运算,拟合成高斯模型;然后,将所有单次的借贷历史数据在第一主成分坐标轴上的投影值Ti按从小到大的顺序进行排序,并将每个所述投影值Ti的序号带入所述高斯模型对应的函数中,得到所述投影值和对应序号的高斯值的差值ci;设定阈值r来找到离群点,找到离群点后,所述离群点对应的银行借贷数据为异常数据;
在本实施例中,设置高斯混合模型的个数值为30,实施者可根据具体实施场景进行调整;所述阈值r为一个超参数,可由实施者根据具体实施场景进行调整,本实施例设置阈值r为10;当投影值和高斯值的差值ci大于10时,则认为所述投影值和高斯值的差值ci为离群点,即所述离群点对应的银行借贷数据为异常数据;
S3,获取每个所述异常数据对应的单个客户,则所述单个客户的异常值通过下式得到:
Figure BDA0003684393420000071
其中:cxj为单个客户的异常值;Tji为第j个客户第i个借贷历史数据的投影值;Tj(i-1)为第j个客户第i个借贷历史数据的上一个数据的投影值;Gn为第j个单个客户每两条借贷数据之间的时间间隔值;
所述单个客户的风险值通过下式得到:
Figure BDA0003684393420000072
其中:ycj为第j个单个客户的风险值;σj为第j个单个客户所有异常值差值的方差值;At为第j个客户第t个借贷历史数据时间与当前分析时间的差值;Tjt为第j个客户第t个借贷历史数据的投影值;
上式中,所述第j个单个客户所有异常值差值的方差值σj,通过如下步骤获取:按照时间顺序将所述单个客户的异常值作差取绝对值;对全部所述绝对值求取方差值,从而得到所述单个客户所有异常值差值的方差值σj
所述单个客户所有异常值差值的方差值越大,则所述单个客户所有相邻两条借贷历史数据越不集中,即所述单个客户所有相邻两条借贷历史数据之间的异常值越大;
上式中,
Figure BDA0003684393420000073
表示当前第j个单个客户总体异常值的分布,将各借贷历史数据的At×Tjt累加得到当前总体异常值的分布;其中n为第j个单个客户借贷历史数据的个数,t为第j个单个客户第t个借贷历史数据;At表示第j个单个客户第t个借贷历史数据时间与当前时间值的差值;Tjt表示第j个单个客户第t个借贷历史数据的投影值,所以第j个单个客户总体异常值的值越大,则当前单个客户风险程度越高;
将σj
Figure BDA0003684393420000081
相乘得到当前单个客户风险值ycj,是因为异常值变化越不稳定,且异常值总体分布偏大,则单个客户为风险客户的可能性就越大,如果异常值变化相对稳定,则是风险客户的可能性就越小,所以当单个客户所有借贷历史数据的异常值ycj越大,相应的,异常数据中是风险客户可能性就越大;
S4,设置风险阈值ycr,本实施例设置风险阈值ycr为5.5,具体值可由实施者根据具体实施场景进行调整;当所述第j个单个客户的风险值ycj大于5.5时,则认为当前客户为风险客户;当所述第j个单个客户的风险值ycj小于5.5时,则认为当前客户为特殊群体客户;由此完成金融风险智能分析。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种基于大数据的金融风险智能分析方法,其特征在于,包括以下步骤:
获取多个客户的借贷历史数据;
根据所述借贷历史数据分析得到所述借贷历史数据的投影值;
将每个所述投影值拟合成高斯模型,得到每个所述投影值的高斯值;
通过所述投影值和高斯值的差值获取多个离群点,每个所述离群点对应的借贷历史数据为异常数据;
获取每个所述异常数据对应的单个客户,根据每个所述单个客户的借贷历史数据分析得到借贷历史数据的投影值;根据所述单个客户的投影值及每两条借贷历史数据之间的时间间隔值,确定所述单个客户的异常值;
根据所述单个客户的异常值和借贷时间,确定所述单个客户的风险值;
设置风险阈值,根据所述单个客户的风险值与所述风险阈值的对比,对多个所述单个客户中风险客户和特殊群体客户进行区分,由此完成所述金融风险智能分析。
2.根据权利要求1所述的基于大数据的金融风险智能分析方法,其特征在于,所述借贷历史数据的投影值通过以下步骤获取:
将所述多个客户的借贷历史数据转化为多个结构化数据,再将所述多个结构化数据输入到PCA算法中,得到多个主成分方向,选取所述多个主成分方向对应特征值最大的主成分方向作为第一主成分坐标轴;
将单次所述借贷历史数据投影在所述第一主成分坐标轴上,得到单次所述借贷历史数据在所述第一主成分坐标轴上的投影值;所述投影值为所述借贷历史数据的投影值。
3.根据权利要求2所述的基于大数据的金融风险智能分析方法,其特征在于,所述异常数据通过以下步骤获取:
对所述投影值进行次数统计,得到统计结果,并对所述统计结果采用多高斯混合模型拟合成高斯模型;
将每个所述投影值按从小到大的顺序进行排序,并将每个所述投影值的序号带入所述高斯模型中,得到所述投影值和对应序号的高斯值的差值;
设定阈值,当所述投影值和高斯值的差值大于所述阈值时,则所述投影值和高斯值的差值为离群点,所述离群点对应的所述借贷历史数据为异常数据。
4.根据权利要3所述的基于大数据的金融风险智能分析方法,其特征在于,所述阈值为10,当所述投影值和高斯值的差值大于10时,则所述投影值和高斯值的差值为离群点,所述离群点对应的所述借贷历史数据为异常数据。
5.根据权利要求1所述的基于大数据的金融风险智能分析方法,其特征在于,所述单个客户的异常值通过下式得到:
Figure FDA0003684393410000021
其中:cxj为单个客户的异常值;Tji为第j个客户第i个借贷历史数据的投影值;Tj(i-1)为第j个客户第i个借贷历史数据的上一个数据的投影值;Gn为第j个单个客户每两条借贷数据之间的时间间隔值。
6.根据权利要求5所述的基于大数据的金融风险智能分析方法,其特征在于,所述单个客户的风险值通过下式得到:
Figure FDA0003684393410000031
其中:ycj为第j个单个客户的风险值;σj为第j个单个客户所有异常值差值的方差值;At为第j个客户第t个借贷历史数据时间与当前分析时间的差值;Tjt为第j个客户第t个借贷历史数据的投影值。
7.根据权利要求6所述的基于大数据的金融风险智能分析方法,其特征在于,所述第j个单个客户所有异常值差值的方差值σj,通过如下步骤获取:
按照时间顺序将所述单个客户的异常值作差取绝对值;
对全部所述绝对值求取方差值,从而得到所述单个客户所有异常值差值的方差值σj
8.根据权利要求1所述的基于大数据的金融风险智能分析方法,其特征在于,当所述单个客户的风险值大于所述风险阈值时,所述单个客户为风险客户;当所述单个客户的风险值小于所述风险阈值时,所述单个客户为特殊群体客户。
9.根据权利要求8所述的基于大数据的金融风险智能分析方法,其特征在于,所述风险阈值为5.5,当所述单个客户的风险值大于5.5时,所述单个客户为风险客户;当所述单个客户的风险值小于5.5时,所述单个客户为特殊群体客户。
CN202210646882.3A 2022-06-08 2022-06-08 基于大数据的金融风险分析方法 Active CN115147203B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210646882.3A CN115147203B (zh) 2022-06-08 2022-06-08 基于大数据的金融风险分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210646882.3A CN115147203B (zh) 2022-06-08 2022-06-08 基于大数据的金融风险分析方法

Publications (2)

Publication Number Publication Date
CN115147203A true CN115147203A (zh) 2022-10-04
CN115147203B CN115147203B (zh) 2024-03-15

Family

ID=83407668

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210646882.3A Active CN115147203B (zh) 2022-06-08 2022-06-08 基于大数据的金融风险分析方法

Country Status (1)

Country Link
CN (1) CN115147203B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130338927A1 (en) * 2012-06-15 2013-12-19 Krishnan Kumaran Seismic Anomaly Detection Using Double-Windowed Statistical Analysis
CN108229542A (zh) * 2017-12-21 2018-06-29 中智诚征信有限公司 一种基于时序分析技术的循环借贷信用风险监测方法
CN109308225A (zh) * 2017-07-28 2019-02-05 上海中兴软件有限责任公司 一种虚拟机异常检测方法、装置、设备及存储介质
WO2019237492A1 (zh) * 2018-06-13 2019-12-19 山东科技大学 一种基于半监督学习的异常用电用户检测方法
US20210334656A1 (en) * 2018-09-05 2021-10-28 Sartorius Stedim Data Analytics Ab Computer-implemented method, computer program product and system for anomaly detection and/or predictive maintenance
CN114553473A (zh) * 2022-01-05 2022-05-27 云南电网有限责任公司信息中心 一种基于登录ip和登陆时间的异常登陆行为检测系统和方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130338927A1 (en) * 2012-06-15 2013-12-19 Krishnan Kumaran Seismic Anomaly Detection Using Double-Windowed Statistical Analysis
CN109308225A (zh) * 2017-07-28 2019-02-05 上海中兴软件有限责任公司 一种虚拟机异常检测方法、装置、设备及存储介质
CN108229542A (zh) * 2017-12-21 2018-06-29 中智诚征信有限公司 一种基于时序分析技术的循环借贷信用风险监测方法
WO2019237492A1 (zh) * 2018-06-13 2019-12-19 山东科技大学 一种基于半监督学习的异常用电用户检测方法
US20210334656A1 (en) * 2018-09-05 2021-10-28 Sartorius Stedim Data Analytics Ab Computer-implemented method, computer program product and system for anomaly detection and/or predictive maintenance
CN114553473A (zh) * 2022-01-05 2022-05-27 云南电网有限责任公司信息中心 一种基于登录ip和登陆时间的异常登陆行为检测系统和方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HOVSEPYAN, S 等: "Kalman Filter for Predictive Maintenance and Anomaly Detection", 《22ND INTERNATIONAL CARPATHIAN CONTROL CONFERENCE (ICCC)》 *
曹志新: "多维数据中基于密度的离群点检测算法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Also Published As

Publication number Publication date
CN115147203B (zh) 2024-03-15

Similar Documents

Publication Publication Date Title
CN105095238A (zh) 用于检测欺诈交易的决策树生成方法
CA2931624A1 (en) Systems and methods for event detection and diagnosis
Mao et al. Minimax rates and efficient algorithms for noisy sorting
CN111782491B (zh) 一种磁盘故障预测方法、装置、设备及存储介质
CN114915478B (zh) 基于多代理的分布式关联分析的智慧园区工控系统网络攻击场景识别方法、系统及存储介质
CN111079539A (zh) 一种基于异常追踪的视频异常行为检测方法
CN113177640B (zh) 一种离散异步事件数据增强方法
Solanki et al. Non-colluding attacks identification in distributed computing
Barchid et al. Bina-rep event frames: A simple and effective representation for event-based cameras
CN115147203A (zh) 基于大数据的金融风险智能分析方法
JP4121061B2 (ja) 類識別装置及び類識別方法
CN112149052B (zh) 一种基于plr-dtw的日负荷曲线聚类方法
James et al. A machine learning attack on illegal trading
CN110706254B (zh) 一种目标跟踪模板自适应更新方法
CN113835947A (zh) 一种基于异常识别结果确定异常原因的方法和系统
CN109360099A (zh) 一种基于k-近邻算法的金融反欺诈方法
CN115859198A (zh) 一种扬尘监测数据异常检测方法
Gajendran et al. Chromosome counting via digital image analysis
KR101484761B1 (ko) 위기 경보 신호를 이용하여 산업 위기를 예측하는 방법 및 그 장치
CN112488228A (zh) 面向风控系统数据补全的双向聚类方法
CN113435309B (zh) 一种基于行向量网格分类的水稻秧苗行识别方法
TW202133089A (zh) 最佳化驅動決策之方法及其電腦程式產品
CN112614069B (zh) 人脸图片降维模糊预处理方法
CN116309350B (zh) 人脸检测方法及系统
CN111652662B (zh) 一种信息处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20240201

Address after: 518000 702, floor 7, block B, Chuang Lingtong science and technology building, Fubao community, Fubao street, Futian District, Shenzhen, Guangdong

Applicant after: Alpha time technology (Shenzhen) Co.,Ltd.

Country or region after: China

Address before: Room 605-3, Building A, Longgang Science and Technology Park, No. 1 Hengyuan Road, Economic and Technological Development Zone, Nanjing City, Jiangsu Province, 210000

Applicant before: Nanjing Jinwei Chengrong Technology Development Co.,Ltd.

Country or region before: China

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant