CN112348656A - 一种基于ba-wnn的个人贷款信用评分方法 - Google Patents
一种基于ba-wnn的个人贷款信用评分方法 Download PDFInfo
- Publication number
- CN112348656A CN112348656A CN202011049257.8A CN202011049257A CN112348656A CN 112348656 A CN112348656 A CN 112348656A CN 202011049257 A CN202011049257 A CN 202011049257A CN 112348656 A CN112348656 A CN 112348656A
- Authority
- CN
- China
- Prior art keywords
- neural network
- data
- training
- wnn
- credit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013077 scoring method Methods 0.000 title claims abstract description 8
- 238000013528 artificial neural network Methods 0.000 claims abstract description 87
- 238000012549 training Methods 0.000 claims abstract description 62
- 210000002569 neuron Anatomy 0.000 claims abstract description 22
- 238000012360 testing method Methods 0.000 claims abstract description 17
- 238000012545 processing Methods 0.000 claims abstract description 16
- 238000010606 normalization Methods 0.000 claims abstract description 8
- 238000000034 method Methods 0.000 claims description 31
- 241000288673 Chiroptera Species 0.000 claims description 11
- 238000013519 translation Methods 0.000 claims description 10
- 230000005284 excitation Effects 0.000 claims description 9
- 238000011156 evaluation Methods 0.000 claims description 8
- 230000002068 genetic effect Effects 0.000 claims description 8
- 239000002245 particle Substances 0.000 claims description 8
- 238000013475 authorization Methods 0.000 claims description 6
- 238000011478 gradient descent method Methods 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 230000001133 acceleration Effects 0.000 claims description 3
- 238000011835 investigation Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 abstract description 6
- 201000004569 Blindness Diseases 0.000 abstract description 3
- 238000004458 analytical method Methods 0.000 abstract description 3
- 238000013461 design Methods 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 18
- 230000006399 behavior Effects 0.000 description 14
- 238000005457 optimization Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 4
- 238000011157 data evaluation Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 210000004205 output neuron Anatomy 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/148—Wavelet transforms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Finance (AREA)
- Human Resources & Organizations (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Game Theory and Decision Science (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Technology Law (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Entrepreneurship & Innovation (AREA)
Abstract
本发明公开了一种基于BA‑WNN的个人贷款信用评分方法,包括以下步骤:S1.根据互联网金融平台所获取客户的信息选择影响信用评分的参数,构建建模样本集;S2.对建模样本集进行归一化处理后切分训练集和测试集,切分训练集和测试集;S3.依据训练集初始化网络参数,包括输入层、隐含层和输出层的神经元数,构建小波神经网络;S4.初始化蝙蝠算法,使用训练样本应用蝙蝠算法优化小波神经网络参数并训练优化后的小波神经网络,得到BA‑WNN的预测模型;本发明与其他神经网络相比,小波神经网络不仅具有小波变换的局部分析特性和神经网络自主学习、自适应能力,能够避免BP神经网络等结构设计上的盲目性,具有网络结构简单、收敛速度快、精度高等优点。
Description
技术领域
本发明属于互联网金融行业的风控技术领域,具体涉及一种基于BA-WNN的个人贷款信用评分方法。
背景技术
近年来在互联网金融信用评估方面,人工神经网络模型具有很大的优势,它在预测、发现和总结金融变量结构不依赖于特定的假设。目前在信用评估应用中大多采用的是BP神经网络、RBF神经网络和Elman回归神经网络,或者基于这三种网络的一些改进。然而,这三种神经网络在处理数据进行预测时存在各种不足:BP神经网络是基于梯度下降算法的,存在局部极小、鲁棒性不高等缺陷;RBF神经网络属于静态前馈网络,对处理动态时间建模问题存在不足;Elman神经网络是一种局部的循环网络,存在隐含单元多、收敛速度慢、训练时间长等缺点。
小波神经网络(Wavelet Neural Network,WNN)是将小波变换和神经网络理论结合起来的一种神经网络,框架是基于BP神经网络构建的,用非线性小波基取代通常的神经元非线性激励函数(如Sigmoid函数),把小波变换与神经网络有机地结合起来,使小波神经网络完全继承了小波变换的优良时频局部化特性和神经网络的自学习特性,实现了强非线性逼近能力,解决了传统的神经网络预测模型精度差、稳定性低等问题。
但由于小波神经网络和BP神经网络一样,通过梯度下降法沿着局部改善的方向逐步改善网络参数,易陷入局部极值,并且网络的收敛速度慢,考虑采用智能优化算法对小波神经网络的初始权重进行寻优。近年来,提出了遗传算法、粒子群算法、蚁群算法等来解决参数寻优问题,但在目标问题的性质、参数调整、计算时间等方面还存在一些局限性,如遗传算法对初始种群的选择有一定的依赖性,粒子群算法对最大速度选取和加权因子的设定较困难,蚁群算法对参数选取和设定较困难,且都存在容易陷入局部最优、收敛速度慢等缺点。如何使用优化算法得到WNN合适的参数成为研究的重点与难点。
发明内容
本发明的目的在于提供一种基于BA-WNN的个人贷款信用评分方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于BA-WNN的个人贷款信用评分方法,包括以下步骤:
S1.根据互联网金融平台所获取客户的信息选择影响信用评分的参数,构建建模样本集;
S2.对建模样本集进行归一化处理后切分训练集和测试集,切分训练集和测试集;
S3.依据训练集初始化网络参数,构建小波神经网络;
S4.初始化蝙蝠算法,使用训练样本应用蝙蝠算法优化小波神经网络参数并训练优化后的小波神经网络,得到BA-WNN的预测模型;
S5.将测试样本应用于基于BA-WNN的预测模型,对测试样本进行分类完成信用评分;
S6.采用优化后的WNN模型对测试集样本数据进行预测,得到模型的预测精度,以均方根误差为指标,与遗传算法、粒子群算法优化的WNN模型的进行对比;
S7.将BA-WNN的个人贷款信用评分模型部署至申请平台输出实时申请信用评分,并定期将有表现数据输入到模型训练。
优选的,所述S1中构建建模样本集具体为:从互联网金融平台后端根据贷后表现选取一定比例和数量正常还款和逾期客户作为建模样本,采集样本客户账户注册申请时的个人基本信息、监测软件中获取操作行为埋点数据。
优选的,所述客户账户注册申请时的个人基本信息包括:手机号、学历、婚姻状况、工作单位、住址、联系人信息、征信报告获取的个人基本信息、信用交易信息、公共信息、特别记录数据。
优选的,所述埋点数据包括埋点时采集的设备行为数据和日志数据,所述设备行为数据包括:登录本平台的次数、点击次数、点击频率、输入总耗时及平均耗时、手机号数据、GPS位置、MAC地址、IP地址数据、地理信息申请频次、IP的申请频次、设备电量占比、陀螺仪的平均加速度;所述日志数据包括:7天内登录次数、首次点击到申请授信时长、一天内最多的session数、申请授信前一周的行为统计、移动互联网行为数据、贷款APP内行为数据、信贷历史、运营商数据在内的全域多维度大数据。
优选的,所述S3中训练集初始化网络参数构建小波神经网络,所述小波神经网络的框架是基于BP神经网络构建的,用小波激励函数替换sigmoid函数,并通过平移因子和伸缩因子构造小波基,具体包括以下步骤:
S31.确定小波神经网络结构;
S32.选择训练方法和激励函数;
S33.隐含层输出;
S34.计算网络输出层的模型预测结果公式;
S35.采用快速梯度下降法初步训练模型。
优选的,所述S3中网络参数包括输入层、隐含层和输出层的神经元数。
优选的,所述S4中的蝙蝠算法以训练集上产生的误差作为蝙蝠算法的适应度函数,通过蝙蝠个体的位置更新获取超级蝙蝠的位置,并将位置进行解码,从而方便得到初始化小波神经网络参数。
优选的,所述S6中采用均方根误差指标来分析预测结果,如果误差超过允许的范围,则重新进行训练,如果误差在允许的范围内,则BA-WNN神经网络训练合格。
优选的,所述S7中将BA-WNN的个人贷款信用评分模型部署至申请平台输出实时申请信用评分用于实现申请客户的实时审批,所述S7中定期将有表现数据输入到模型训练用于实现模型的在线更新。
本发明还提供一种基于BA-WNN的个人贷款信用评分系统,其特征在于:包括以下模块:样本获取模块、数据处理模块、网络训练模块、信用评分模块和训练模块;
所述样本获取模块,用于获取包括个人申请信息、操作行为埋点数据和贷后还款表现等信用评价数据作为建模样本;
所述数据处理模块:用于获取的数据样本特征提取,进行包括数据缺失补全、异常值处理和归一化;
所述网络训练模块:用于初始化小波神经网络参数,利用训练样本采用蝙蝠算法优化的小波神经网络训练得到预测模型;
所述信用评分模块:用于当获取到待检测个人信用评价数据输入训练后小波神经网络预测模型得到信用评分;
所述训练模块包含编码单元、搜索单元和解码单元,所述编码单元用于依据历史数据对每个蝙蝠的位置进行编码,每个所述蝙蝠的位置与小波神经网络参数一一对应;所述搜索单元用于对小波神经网络预设控制参数进行初始化,并依据所述初始化的控制参数以及相应的搜索方法从蝙蝠群中找到超级蝙蝠;所述解码单元,用于获取所述超级蝙蝠的位置,并将所述位置进行解码得到初始化小波神经网络参数。
与现有技术相比,本发明的有益效果是:
(1)与其他神经网络相比,小波神经网络不仅具有小波变换的局部分析特性和神经网络自主学习、自适应能力,能够避免BP神经网络等结构设计上的盲目性,具有网络结构简单、收敛速度快、精度高等优点;
(2)相比较于粒子群算法和遗传算法,蝙蝠算法可以实现动态控制局部搜索和全局搜索间的相互转换过程,具有参数配置少、全局搜索能力强、并行程度高和鲁棒性强等优点;
(3)利用蝙蝠算法得到的初始化小波神经网络参数训练个人贷款信用数据评估预测时,可以提高收敛速度和预测精度,适合当前金融行业大数据风控的要求。
附图说明
图1为本发明的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
请参阅图1,本发明提供一种技术方案:一种基于BA-WNN的个人贷款信用评分方法,包括以下步骤:
S1.根据互联网金融平台所获取客户的信息选择影响信用评分的参数,构建建模样本集;
S2.对建模样本集进行归一化处理后切分训练集和测试集,切分训练集和测试集;
S3.依据训练集初始化网络参数,构建小波神经网络;
S4.初始化蝙蝠算法,使用训练样本应用蝙蝠算法优化小波神经网络参数并训练优化后的小波神经网络,得到BA-WNN的预测模型;
S5.将测试样本应用于基于BA-WNN的预测模型,对测试样本进行分类完成信用评分;
S6.采用优化后的WNN模型对测试集样本数据进行预测,得到模型的预测精度,以均方根误差为指标,与遗传算法、粒子群算法优化的WNN模型的进行对比;
S7.将BA-WNN的个人贷款信用评分模型部署至申请平台输出实时申请信用评分,并定期将有表现数据输入到模型训练。
本实施例中,优选的,S1中构建建模样本集具体为:从互联网金融平台后端根据贷后表现选取一定比例和数量正常还款和逾期客户作为建模样本,采集样本客户账户注册申请时的个人基本信息、监测软件中获取操作行为埋点数据。
本实施例中,优选的,客户账户注册申请时的个人基本信息包括:手机号、学历、婚姻状况、工作单位、住址、联系人信息、征信报告获取的个人基本信息、信用交易信息、公共信息、特别记录数据。
本实施例中,优选的,埋点数据包括埋点时采集的设备行为数据和日志数据,设备行为数据包括:登录本平台的次数、点击次数、点击频率、输入总耗时及平均耗时、手机号数据、GPS位置、MAC地址、IP地址数据、地理信息申请频次、IP的申请频次、设备电量占比、陀螺仪的平均加速度;日志数据包括:7天内登录次数、首次点击到申请授信时长、一天内最多的session数、申请授信前一周的行为统计、移动互联网行为数据、贷款APP内行为数据、信贷历史、运营商数据在内的全域多维度大数据。
本实施例中,优选的,S3中训练集初始化网络参数构建小波神经网络,小波神经网络的框架是基于BP神经网络构建的,用小波激励函数替换sigmoid函数,并通过平移因子和伸缩因子构造小波基,具体包括以下步骤:
S31.确定小波神经网络结构
假设输入层的神经元个数为m个,隐含层小波神经元的个数为n,而输出层神经元个数为l,输入样本为Xn,输出为Y,输入层与隐含层神经元的连接权值为wkj,而输出层与隐含层神经元的连接权值为wji,第j个隐含层神经元的伸缩平移系数分别为aj和bj。
在进行小波神经网络模型学习训练之前,需要先确定网络结构输入层、输出层和隐含层的相关参数,小波神径网络的输入层和输出层一般根据实际工程情况确定,输入层神经元个数依据样本的数量确定,输出层神经元数一般为1;隐含层层数一般确定为一层,隐含层的神经元数可根据以下经验公式确定:
其中,n为隐含层神经元数,m、l分别为输入层、输出层神经元数,a通常取1~10。
S32.选择训练方法和激励函数
小波神径网络通过激励函数进行结构层各神经元的权值传递,选择Morlet小波函数作为隐含层的激励函数,隐含层的小波神经元采用Morlet小波作为基函数ψ公式如下:
其中,a、b是隐含层神经元的伸缩平移系数。
S33.隐含层输出
通过前向计算得到隐含层第j个小波神经元的输出h为
其中,wji是输出层与隐含层神经元的连接权值,aj和bj是第j个隐含层神经元的伸缩平移系数。
S34.计算网络输出层的模型预测结果公式:
其中,w是隐含层与输出层权值,h是隐含层的单元输出。
小波神经网络的输出神经元神经元采用Sigmoid函数,即f(x)=1/(1+e-x),则最终的模型预测结果公式:
S35.采用快速梯度下降法初步训练模型
定义模型的预测误差为:
其中,T为训练样本的个数,YP表示第P个样本的实测数据,yP表示第P个样本的预测数据。
将训练数据输入网络,利用训练好的网络计算出预测值和预测值与期望输出值的误差,判断误差是否符合要求,如果符合要求,则输出预测值和误差,否则依据误差修正网络权值和小波函数参数,不断进行网络训练,直至误差符合要求;对输出的预测值进行反归一化处理得到最终预测值.
本实施例中,优选的,S3中网络参数包括输入层、隐含层和输出层的神经元数。
本实施例中,优选的,S4中的蝙蝠算法以训练集上产生的误差作为蝙蝠算法的适应度函数,通过蝙蝠个体的位置更新获取超级蝙蝠的位置,并将位置进行解码,从而方便得到初始化小波神经网络参数;
初始种群包括:输入层到隐含层的连接权值wij,隐含层到输出层的连接权值wjk,伸缩因子aj以及平移因子bj;对初始种群进行初始化编码;计算初始种群中每个个体的适应度,并判断每个个体的适应度是否满足终止条件:若是,输出优化后的种群;若否,顺次按照选择概率、交叉概率、变异概率选择当代种群中的新个体,并插入上一代种群中,以形成新一代种群,计算新一代种群中每个个体的适应度,直至每个个体的适应度满足终止条件为止,输出优化后的种群;将优化后的种群进行解码,得到优化后的连接权值wij、连接权值wjk、伸缩因子aj、平移因子bj。
具体的,由于蝙蝠种群中每个蝙蝠的位置与网络参数一一对应,所以当找到超级蝙蝠后,对超级蝙蝠的位置进行解码即可得到初始化小波神经网络参数。
步骤1:初始化参数及蝙蝠位置,即初始化蝙蝠算法中蝙蝠种群数量D,初始迭代次数t=1,蝙蝠算法最大迭代次数tmax,蝙蝠发出的脉冲(超声波)频率f,最大脉冲声音强度S,最大脉冲频度R0,脉冲声音强度衰减系数λ,脉冲频度增加系数δ,使用二进制编码标记特征组合并随机初始化蝙蝠个体位置xi(i=1,2,…,D)和速度vi=1,2,…,D),种群的位置分别WNN输入层到隐含层的连接权值wij、隐含层到输出层的连接权值wjk、伸缩因子aj以及平移因子bj相对应;
步骤2:按下列公式调整蝙蝠脉冲频率fi,更新蝙蝠飞行速度vi及位置xi,寻找当前最优蝙蝠个体,飞行速度vi及位置xi的更新公式如下:
fi=fmin+(fmax-fmin)*h
其中,分别为t代和t+1代第i只蝙蝠所处的位置,分别为t代和t+1代第i只蝙蝠的飞行速度;fi为第i只蝙蝠的脉冲频率,fmax、fmin各为蝙蝠脉冲频率的最大值、最小值;h为0~1区间均匀分布随机数;xbest为当前全局最优位置;
步骤3:产生随机数r1,若r1>Ri,则从当前种群中选取最优解,且在最优解附近随机产生一个局部解,此时蝙蝠的新位置xnew为:
xnew=xold+τSt
其中,τ为[-1,1]范围的随机数,St代表蝙蝠种群同一时间段内响度平均值;
步骤4:建立适应度函数
以预测输出和期望输出之间的均方误差和作为个体适应度函数,计算方式如下:
其中,T为蝙蝠种群数量,YP表示第P个样本的实测数据,yP表示第P个样本的预测数据。
步骤5:产生随机数r2,若r2<Si且均方误差J(xi)<J(x0),按照规则增大Ri且减小Si,即蝙蝠减小发射的超声波脉冲响度,同时增加声波脉冲发射次数,即:
步骤6:对蝙蝠个体按适应度J(xi)进行评估,寻找并记录当前位置最佳蝙蝠个体,不断迭代得到全局最优解下的适应度值Sbest满足Sbest<ε或者迭代次数到达tmax,则迭代结束,程序终止,进行步骤4-7;否则,则继续迭代并转到4-2;
步骤7:输出最后蝙蝠个体全局最优位置解码得到WNN优化后的输入层到隐含层的连接权值wij、隐含层到输出层的连接权值wjk、伸缩因子aj以及平移因子bj;
步骤8:将WNN优化后的参数进行训练得到BA-WNN的个人贷款信用评分模型。
本实施例中,优选的,S6中采用均方根误差指标来分析预测结果,如果误差超过允许的范围,则重新进行训练,如果误差在允许的范围内,则BA-WNN神经网络训练合格,均方根误差公式如下:
在本实施例中,除了均方误差(MSE)外,还可以平均绝对误差(MAE)和相关系数(ρ)等指标对模型预测性能进行评估,计算公式如下:
为检验BA-WNN的个人贷款信用评分模型的优越性,选择粒子群优化算法(PSO)的PSO-WNN和遗传算法(GA)的GA-WNN作为对比模型,BA-WNN参数设置为:蝙蝠个体数量N=30,最大脉冲音量A0=1,最大脉冲率R0=1,搜索脉冲频率f的范围[0,1],音量的衰减系数α=0.5,搜索频率的增强系数γ=0.5,搜索精度ε=0.0001或最大迭代次数tmax=200;PSO-WNN参数设置为:粒子数群规模为10,参数局部搜索能力c1=2,全局搜索能力c2=2,迭代次数为200;GA-WNN参数设为:种群数量为20,交叉概率为0.90,变异概率为0.015,进化代数为200。实验结果表明,BP-WNN算法的预测误差平均降低了35.92%,预测所需的时间平均降低了54.52%
本实施例中,优选的,S7中将BA-WNN的个人贷款信用评分模型部署至申请平台输出实时申请信用评分用于实现申请客户的实时审批,S7中定期将有表现数据输入到模型训练用于实现模型的在线更新。
实施例2
一种基于BA-WNN的个人贷款信用评分系统,包括以下模块:样本获取模块、数据处理模块、网络训练模块、信用评分模块和训练模块;
所述样本获取模块,用于获取包括个人申请信息、操作行为埋点数据和贷后还款表现等信用评价数据作为建模样本;
所述数据处理模块:用于获取的数据样本特征提取,进行包括数据缺失补全、异常值处理和归一化;
所述网络训练模块:用于初始化小波神经网络参数,利用训练样本采用蝙蝠算法优化的小波神经网络训练得到预测模型;
所述信用评分模块:用于当获取到待检测个人信用评价数据输入训练后小波神经网络预测模型得到信用评分;
所述训练模块包含编码单元、搜索单元和解码单元,所述编码单元用于依据历史数据对每个蝙蝠的位置进行编码,每个所述蝙蝠的位置与小波神经网络参数一一对应;所述搜索单元用于对小波神经网络预设控制参数进行初始化,并依据所述初始化的控制参数以及相应的搜索方法从蝙蝠群中找到超级蝙蝠;所述解码单元,用于获取所述超级蝙蝠的位置,并将所述位置进行解码得到初始化小波神经网络参数。
本发明与其他神经网络相比,小波神经网络不仅具有小波变换的局部分析特性和神经网络自主学习、自适应能力,能够避免BP神经网络等结构设计上的盲目性,具有网络结构简单、收敛速度快、精度高等优点;相比较于粒子群算法和遗传算法,蝙蝠算法可以实现动态控制局部搜索和全局搜索间的相互转换过程,具有参数配置少、全局搜索能力强、并行程度高和鲁棒性强等优点;利用蝙蝠算法得到的初始化小波神经网络参数训练个人贷款信用数据评估预测时,可以提高收敛速度和预测精度,适合当前金融行业大数据风控的要求。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (10)
1.一种基于BA-WNN的个人贷款信用评分方法,其特征在于,包括以下步骤:
S1.根据互联网金融平台所获取客户的信息选择影响信用评分的参数,构建建模样本集;
S2.对建模样本集进行归一化处理后切分训练集和测试集,切分训练集和测试集;
S3.依据训练集初始化网络参数,构建小波神经网络;
S4.初始化蝙蝠算法,使用训练样本应用蝙蝠算法优化小波神经网络参数并训练优化后的小波神经网络,得到BA-WNN的预测模型;
S5.将测试样本应用于基于BA-WNN的预测模型,对测试样本进行分类完成信用评分;
S6.采用优化后的WNN模型对测试集样本数据进行预测,得到模型的预测精度,以均方根误差为指标,与遗传算法、粒子群算法优化的WNN模型的进行对比;
S7.将BA-WNN的个人贷款信用评分模型部署至申请平台输出实时申请信用评分,并定期将有表现数据输入到模型训练。
2.根据权利要求1所述的一种基于BA-WNN的个人贷款信用评分方法,其特征在于:所述S1中构建建模样本集具体为:从互联网金融平台后端根据贷后表现选取一定比例和数量正常还款和逾期客户作为建模样本,采集样本客户账户注册申请时的个人基本信息、监测软件中获取操作行为埋点数据。
3.根据权利要求2所述的一种基于BA-WNN的个人贷款信用评分方法,其特征在于:所述客户账户注册申请时的个人基本信息包括:手机号、学历、婚姻状况、工作单位、住址、联系人信息、征信报告获取的个人基本信息、信用交易信息、公共信息、特别记录数据。
4.根据权利要求2所述的一种基于BA-WNN的个人贷款信用评分方法,其特征在于:所述埋点数据包括埋点时采集的设备行为数据和日志数据,所述设备行为数据包括:登录本平台的次数、点击次数、点击频率、输入总耗时及平均耗时、手机号数据、GPS位置、MAC地址、IP地址数据、地理信息申请频次、IP的申请频次、设备电量占比、陀螺仪的平均加速度;所述日志数据包括:7天内登录次数、首次点击到申请授信时长、一天内最多的session数、申请授信前一周的行为统计、移动互联网行为数据、贷款APP内行为数据、信贷历史、运营商数据在内的全域多维度大数据。
5.根据权利要求1所述的一种基于BA-WNN的个人贷款信用评分方法,其特征在于:所述S3中训练集初始化网络参数构建小波神经网络,所述小波神经网络的框架是基于BP神经网络构建的,用小波激励函数替换sigmoid函数,并通过平移因子和伸缩因子构造小波基,具体包括以下步骤:
S31.确定小波神经网络结构;
S32.选择训练方法和激励函数;
S33.隐含层输出;
S34.计算网络输出层的模型预测结果公式;
S35.采用快速梯度下降法初步训练模型。
6.根据权利要求1所述的一种基于BA-WNN的个人贷款信用评分方法,其特征在于:所述S3中网络参数包括输入层、隐含层和输出层的神经元数。
7.根据权利要求1所述的一种基于BA-WNN的个人贷款信用评分方法,其特征在于:所述S4中的蝙蝠算法以训练集上产生的误差作为蝙蝠算法的适应度函数,通过蝙蝠个体的位置更新获取超级蝙蝠的位置,并将位置进行解码,从而方便得到初始化小波神经网络参数。
8.根据权利要求1所述的一种基于BA-WNN的个人贷款信用评分方法,其特征在于:所述S6中采用均方根误差指标来分析预测结果,如果误差超过允许的范围,则重新进行训练,如果误差在允许的范围内,则BA-WNN神经网络训练合格。
9.根据权利要求1所述的一种基于BA-WNN的个人贷款信用评分方法,其特征在于:所述S7中将BA-WNN的个人贷款信用评分模型部署至申请平台输出实时申请信用评分用于实现申请客户的实时审批,所述S7中定期将有表现数据输入到模型训练用于实现模型的在线更新。
10.一种基于BA-WNN的个人贷款信用评分系统,其特征在于:包括以下模块:样本获取模块、数据处理模块、网络训练模块、信用评分模块和训练模块;
所述样本获取模块,用于获取包括个人申请信息、操作行为埋点数据和贷后还款表现等信用评价数据作为建模样本;
所述数据处理模块:用于获取的数据样本特征提取,进行包括数据缺失补全、异常值处理和归一化;
所述网络训练模块:用于初始化小波神经网络参数,利用训练样本采用蝙蝠算法优化的小波神经网络训练得到预测模型;
所述信用评分模块:用于当获取到待检测个人信用评价数据输入训练后小波神经网络预测模型得到信用评分;
所述训练模块包含编码单元、搜索单元和解码单元,所述编码单元用于依据历史数据对每个蝙蝠的位置进行编码,每个所述蝙蝠的位置与与小波神经网络参数一一对应;所述搜索单元用于对小波神经网络预设控制参数进行初始化,并依据所述初始化的控制参数以及相应的搜索方法从蝙蝠群中找到超级蝙蝠;所述解码单元,用于获取所述超级蝙蝠的位置,并将所述位置进行解码得到初始化小波神经网络参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011049257.8A CN112348656A (zh) | 2020-09-29 | 2020-09-29 | 一种基于ba-wnn的个人贷款信用评分方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011049257.8A CN112348656A (zh) | 2020-09-29 | 2020-09-29 | 一种基于ba-wnn的个人贷款信用评分方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112348656A true CN112348656A (zh) | 2021-02-09 |
Family
ID=74361289
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011049257.8A Pending CN112348656A (zh) | 2020-09-29 | 2020-09-29 | 一种基于ba-wnn的个人贷款信用评分方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112348656A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113393316A (zh) * | 2021-06-10 | 2021-09-14 | 罗忠明 | 基于海量大数据、核心算法的贷款全过程精准风控及管理系统 |
CN114493826A (zh) * | 2021-12-22 | 2022-05-13 | 四川新网银行股份有限公司 | 一种基于神经网络的个人征信评分方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104680233A (zh) * | 2014-10-28 | 2015-06-03 | 芜湖杰诺瑞汽车电器系统有限公司 | 基于小波神经网络的发动机故障诊断方法 |
CN105354371A (zh) * | 2015-10-21 | 2016-02-24 | 江苏省电力公司 | 基于ga-wnn的输变电工程造价预测方法 |
CN107103397A (zh) * | 2017-06-26 | 2017-08-29 | 广东工业大学 | 一种基于蝙蝠算法的交通流预测方法、装置及系统 |
CN107292453A (zh) * | 2017-07-24 | 2017-10-24 | 国网江苏省电力公司电力科学研究院 | 一种基于集成经验模态分解与深度信念网络的短期风功率预测方法 |
CN108089099A (zh) * | 2017-12-18 | 2018-05-29 | 广东电网有限责任公司佛山供电局 | 基于深度置信网络的配电网故障的诊断方法 |
CN109067427A (zh) * | 2018-08-16 | 2018-12-21 | 北京科技大学 | 一种基于优化型小波神经网络的跳频序列预测方法 |
CN109146209A (zh) * | 2018-11-02 | 2019-01-04 | 清华大学 | 基于遗传算法小波神经网络的机床主轴热误差预测方法 |
CN109818775A (zh) * | 2018-12-14 | 2019-05-28 | 南昌大学 | 基于自适应微分进化算法优化小波神经网络的短期网络流量预测方法 |
CN111507422A (zh) * | 2020-04-24 | 2020-08-07 | 西安工程大学 | 基于cqfpa-wnn的变压器故障诊断方法 |
-
2020
- 2020-09-29 CN CN202011049257.8A patent/CN112348656A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104680233A (zh) * | 2014-10-28 | 2015-06-03 | 芜湖杰诺瑞汽车电器系统有限公司 | 基于小波神经网络的发动机故障诊断方法 |
CN105354371A (zh) * | 2015-10-21 | 2016-02-24 | 江苏省电力公司 | 基于ga-wnn的输变电工程造价预测方法 |
CN107103397A (zh) * | 2017-06-26 | 2017-08-29 | 广东工业大学 | 一种基于蝙蝠算法的交通流预测方法、装置及系统 |
CN107292453A (zh) * | 2017-07-24 | 2017-10-24 | 国网江苏省电力公司电力科学研究院 | 一种基于集成经验模态分解与深度信念网络的短期风功率预测方法 |
CN108089099A (zh) * | 2017-12-18 | 2018-05-29 | 广东电网有限责任公司佛山供电局 | 基于深度置信网络的配电网故障的诊断方法 |
CN109067427A (zh) * | 2018-08-16 | 2018-12-21 | 北京科技大学 | 一种基于优化型小波神经网络的跳频序列预测方法 |
CN109146209A (zh) * | 2018-11-02 | 2019-01-04 | 清华大学 | 基于遗传算法小波神经网络的机床主轴热误差预测方法 |
CN109818775A (zh) * | 2018-12-14 | 2019-05-28 | 南昌大学 | 基于自适应微分进化算法优化小波神经网络的短期网络流量预测方法 |
CN111507422A (zh) * | 2020-04-24 | 2020-08-07 | 西安工程大学 | 基于cqfpa-wnn的变压器故障诊断方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113393316A (zh) * | 2021-06-10 | 2021-09-14 | 罗忠明 | 基于海量大数据、核心算法的贷款全过程精准风控及管理系统 |
CN114493826A (zh) * | 2021-12-22 | 2022-05-13 | 四川新网银行股份有限公司 | 一种基于神经网络的个人征信评分方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112581263A (zh) | 一种基于灰狼算法优化广义回归神经网络的信用评估方法 | |
CN108900346B (zh) | 基于lstm网络的无线网络流量预测方法 | |
Qin et al. | A dual-stage attention-based recurrent neural network for time series prediction | |
CN106453293B (zh) | 一种基于改进bpnn的网络安全态势预测方法 | |
CN108009674A (zh) | 基于cnn和lstm融合神经网络的空气pm2.5浓度预测方法 | |
CN109376913A (zh) | 降水量的预测方法及装置 | |
CN112308288A (zh) | 一种基于粒子群优化lssvm的违约用户概率预测方法 | |
CN112215446A (zh) | 一种基于神经网络的单位动态火灾风险评估方法 | |
CN112634018A (zh) | 一种基于蚁群算法优化循环神经网络的逾期监控方法 | |
CN113538125A (zh) | 一种基于萤火虫算法优化Hopfield神经网络的风险评级方法 | |
CN107273974B (zh) | 一种安全应急处置评价体系构建方法及系统 | |
CN112365885B (zh) | 唤醒模型的训练方法、装置和计算机设备 | |
CN112581264A (zh) | 一种基于蝗虫算法优化mlp神经网络的信用风险预测方法 | |
CN112037011A (zh) | 一种基于foa-rbf神经网络的信用评分方法 | |
CN113379536A (zh) | 一种基于引力搜索算法优化递归神经网络的违约概率预测方法 | |
CN112529685A (zh) | 一种基于bas-fnn的贷款用户信用评级方法及系统 | |
CN111310902A (zh) | 神经网络模型的训练方法、边坡位移预测方法及相关装置 | |
CN112348656A (zh) | 一种基于ba-wnn的个人贷款信用评分方法 | |
CN112348655A (zh) | 一种基于afsa-elm的信用评估方法 | |
CN109768989A (zh) | 基于lahp-igfnn的网络安全态势评估模型 | |
CN112634019A (zh) | 基于细菌觅食算法优化灰色神经网络的违约概率预测方法 | |
CN108364098B (zh) | 一种天气特征对用户签到影响的度量方法 | |
CN111210089A (zh) | 基于kalman滤波的门控循环单元神经网络的股票价格预测方法 | |
CN109598381A (zh) | 一种基于状态频率记忆神经网络的短时交通流预测方法 | |
CN114897204A (zh) | 一种海上风电场短期风速预测方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210209 |