CN112348655A - 一种基于afsa-elm的信用评估方法 - Google Patents
一种基于afsa-elm的信用评估方法 Download PDFInfo
- Publication number
- CN112348655A CN112348655A CN202011047318.7A CN202011047318A CN112348655A CN 112348655 A CN112348655 A CN 112348655A CN 202011047318 A CN202011047318 A CN 202011047318A CN 112348655 A CN112348655 A CN 112348655A
- Authority
- CN
- China
- Prior art keywords
- elm
- model
- output
- afsa
- artificial fish
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 22
- 238000012549 training Methods 0.000 claims abstract description 64
- 238000000034 method Methods 0.000 claims abstract description 32
- 238000013528 artificial neural network Methods 0.000 claims abstract description 26
- 238000012360 testing method Methods 0.000 claims abstract description 17
- 238000010606 normalization Methods 0.000 claims abstract description 16
- 238000012545 processing Methods 0.000 claims abstract description 14
- 241000251468 Actinopterygii Species 0.000 claims description 71
- 230000000007 visual effect Effects 0.000 claims description 37
- 235000013305 food Nutrition 0.000 claims description 21
- 239000011159 matrix material Substances 0.000 claims description 21
- 238000005457 optimization Methods 0.000 claims description 14
- 230000002068 genetic effect Effects 0.000 claims description 11
- 239000002245 particle Substances 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 11
- 238000011160 research Methods 0.000 claims description 5
- 230000014509 gene expression Effects 0.000 claims description 4
- 230000001133 acceleration Effects 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 3
- 230000002431 foraging effect Effects 0.000 claims description 3
- 244000144980 herd Species 0.000 claims description 3
- 238000011835 investigation Methods 0.000 claims description 3
- 238000003062 neural network model Methods 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 230000006399 behavior Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 6
- 230000007547 defect Effects 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 206010033799 Paralysis Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Finance (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Accounting & Taxation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于AFSA‑ELM的信用评估方法;其中的方法包括:根据互联网金融平台所获取客户的信息选择影响信用评分的参数构建建模样本集;对建模样本集进行归一化处理后切分训练集和测试集;构建前馈神经网络,采用ELM对前馈神经网络进行训练建模,获取神经网络参数;利用AFSA算法对ELM训练构建的模型进行ELM的隐层权值w和阈值b进行优化,将最优个体给ELM模型赋值,完成模型的建立;在测试集上验证预测模型的准确率;将优化后的ELM模型部署至申请平台对实时申请客户信用评估。本发明利用AFSA算法对ELM模型自动优化获得最优权重和阈值,提高了模型的收敛速度和稳定性,所建立的信用预测模型具有很高的预测精度和鲁棒性能。
Description
技术领域
本发明属于互联网金融行业的风控技术领域,具体涉及一种基于AFSA-ELM的信用评估方法。
背景技术
近年来在互联网金融信用评估方面,人工神经网络已经被证明是表现不错的研究模型。目前在信用评估应用中大多采用的是BP神经网络、RBF神经网络和Elman回归神经网络,或者基于这三种网络的一些改进。然而,这三种神经网络在处理数据进行预测时存在各种不足:BP神经网络是基于梯度下降算法的,存在局部极小、鲁棒性不高等缺陷;RBF神经网络属于静态前馈网络,对处理动态时间建模问题存在不足;Elman神经网络是一种局部的循环网络,存在隐含神经元多、收敛速度慢、训练时间长等缺点。
极限学习机(Extreme Learning Machine,ELM)是一种新型单隐层前馈神经网络,相比于采用其他的神经网络,不需要基于梯度的学习算法一样通过迭代反复调整更新网络的输入层与隐层间的连接权值及隐层节点的阈值,训练前只需要设置合适的隐层节点数,通过利用Moore-Penrose广义逆求解网络权重,可以随机产生输入层与隐层间的连接权值及隐层节点的阈值完成整个网络的训练。ELM以其设置参数少、泛化能力强、训练速度快等优点成为研究的热点,非常适用于金融行业的信用评估。
但是传统ELM随机产生输入层到隐层连接权值和隐层阈值的初始值,容易陷入局部最小值,不易获得最优ELM模型进行预测,现有技术使用遗传算法、粒子群算法、蚁群算法等群集智能优化算法来优化ELM初始连接权值和隐层阈值,但遗传算法对初始种群的选择有一定的依赖性,粒子群算法对最大速度选取和加权因子的设定较困难,蚁群算法对参数选取和设定较困难,且都存在容易陷入局部最优、收敛速度慢等缺点,现有技术存在着各种各样的问题。
如授权公告号为CN111160752A所公开的信用评估方法,其虽然实现了操作方便、省力,且数据实时性好,但是并未解决现有检测方式过于单一,未经过多种计算得出不准确的结论,容易陷入死循环瘫痪,精准度不高的问题,为此我们提出一种基于AFSA-ELM的信用评估方法。
发明内容
本发明的目的在于提供一种基于AFSA-ELM的信用评估方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于AFSA-ELM的信用评估方法,包括有以下步骤:
S1:根据互联网金融平台所获取客户的信息选择影响信用评分的参数,构建建模样本集;
S2:对建模样本集进行归一化处理后切分训练集和测试集,切分训练集和测试集;
S3:根据训练集构建ELM模型,初始化神经网络参数,包括各层的节点个数、连接权值和阈值;
S4:在训练集上利用AFSA算法对ELM的隐层权值和阈值进行优化,将最优个体给ELM模型赋值,完成模型的建立;
S5:采用优化后的ELM模型对测试集进行预测后验证模型的准确率,以均方根误差为指标,与遗传算法、粒子群算法优化的ELM模型的进行对比;
S6:将AFSA-ELM的信用评分模型部署至申请平台输出实时申请信用评分,实现申请客户的实时审批,并定期将有表现数据输入到模型训练,实现模型的在线更新。
优选的,所述S1中从互联网金融平台后端根据贷后表现选取相同数量正常还款和逾期客户作为建模样本,采集样本客户账户注册申请时的个人基本信息、监测软件中获取操作行为埋点数据。
优选的,所述个人基本信息包括有手机号、学历、婚姻状况、工作单位、住址、联系人信息,征信报告获取的个人基本信息、信用交易信息、公共信息、特别记录数据;所述埋点数据包括有埋点时采集的设备行为数据和日志数据,其中设备行为数据包括有登录本平台的次数、点击次数、点击频率、输入总耗时及平均耗时、手机号数据、GPS位置、MAC地址、IP地址数据、地理信息申请频次、IP的申请频次、设备电量占比、陀螺仪的平均加速度,所述日志数据包括有7天内登录次数、首次点击到申请授信时长、一天内最多的session数、申请授信前一周的行为统计;并且合规要求下,不限于获取移动互联网行为数据、贷款APP内行为数据、信贷历史、运营商数据在内的全域多维度大数据。
优选的,所述S2中利用最大最小法将特征值中选出的有用的字段进行归一化处理,把所有数据都转化为[0,1]之间的数值,取消各维数据间的数量级差别,采用离差(Min-Max)标准化法来对数值归一化处理将其映射到[0,1]区间,Min-Max标准化的公式如下:
其中x'是归一化后的值,xmin是特征中的最小值,xmax是特征中的最大值,x为特征的初始值,再对归一化后的数据集根据申请时间按照7:3比例切分为训练集和测试集。
优选的,所述S3中在根据所述根据训练集构建ELM模型,初始化神经网络参数,所述ELM是一种单隐层前向神经网络,通过利用Moore-Penrose广义逆求解网络权重,可以随机产生输入层与隐层间的连接权值及隐层节点的阈值,在训练过程中无需调整,只需要设置隐层节点的个数,便可以获得唯一的最优解,ELM具有网络结构简单,学习速度快,泛化性能好等优点。
优选的,所述ELM的训练可分为以下几个步骤:
S31:确定神经网络模型的输入层、输出层及隐层的结构,
给定N个不同样本的集合N={(xi,yi)|i=1,2,…,N;xi∈Rn;yi∈Rm},根据研究,隐层节点个数n和输入、输出节点个数存在以下关系:
其中m、l分别为ELM输入、输出节点的个数,a为常数,通常取1~10;
S32、给定训练集T={(x1,y1),…,(xj,yj),…,(xn,yn)},其中,xj∈Rn,yj∈R,j=1,…,N,xj是一个n维向量;包括n个隐层节点的输出矩阵的计算公式为:
H=g(WXT+b)
其中,输入层与所述隐层由权值W连接,隐层与输出层由权值β连接,b为隐层节点的阈值,W、β、b表达式如下:
S33:求解隐层到输出层的连接权重
神经网络的输出值为:
P=(HTβ)
其中,β是隐层到输出层的权值矩阵,H是隐层节点的输出矩阵,
对于给定的训练输出样本Y=(y1,y2,…,yn),用输出样本替代网络输出值,则权值矩阵β求解公式如下:
其解为:
其中,(HT)+表示转置矩阵HT的Moore-Penrose广义逆;
则具有n个隐层节点的ELM输出可表示为:
其中,wj=[w1j,w2j,…,wnj]为连接第j个隐层节点的输入权值向量;bj为第j个隐层节点的阈值;βj=[βj1,βj2,…,βjm]T为连接第j个隐层节点的输出权值向量;wj·xi为wj与xi的内积;g(·)为隐层节点的激活函数。
优选的,所述S4中利用AFSA为ELM寻找最优的初始输入层权值矩阵W和隐层阈值矩阵b,可以提高ELM模型的拟合精度,获取最优ELM模型,基于AFSA优化ELM的步骤包括:
S41:将ELM的初始权值W和阈值b赋给人工鱼群算法参数
将训练数据输入ELM,再将ELM的初始权值W和阈值b作为人工鱼群算法的参数,随机产生人工鱼的初始群体:选取N条人工鱼构成人工鱼群,其中每个人工鱼都是D维向量,包括代表ELM的输入权值ωij、输出权值ωio、输入节点阈值bki和输出节点阈值bko;
S42:人工鱼群的位置寻优
设置某一条人工鱼的当前位置向量X和在某一时刻视点所在的位置向量当前位置向量该人工鱼的视野范围为visual,若视点处的食物浓度高于当前位置的食物浓度,则向视点方向移动一步,到达位置Xnext;若视点处的食物浓度不比当前位置的食物浓度高,则返回继续寻找视野内的其他位置,直到到达位置Xnext,该过程可以表示为:
xi=xi+visual·r,i=1,2,…,n
其中,r为[-1,1]之间均匀分布的随机数,visual是人工鱼的视野范围,Step是人工鱼的步长;
S43:定义人工鱼群的食物浓度
将ELM的均方误差的倒数作为人工鱼群的食物浓度,也就是适应度函数,计算公式如下:
S44:全局寻优确定ELM初始权值W和阈值b
各代人工鱼的状态根据它的状态函数随觅食、聚群变化而变化,不断迭代直至达到最大迭代次数,对迭代过程中采用十折交叉验证法计算预测结果的均方误差,食物浓度函数不再增加时,根据全局最优确定ELM初始权值W和阈值b,得到基于AFSA-ELM的信用评估预测模型。
优选的,所述S5中将以均方根误差为指标,与遗传算法、粒子群算法、蚁群算法优化的ELM模型的进行对比,预测值和真实值之间的均方根误差计算公式如下:
其中,RMSE是预测值和真实值的均方根误差,n是输出训练样本的个数,i表示输出训练样本的序号,yi是第i个输出训练样本的预测值,y′i是第i个输出训练样本的实际值。
优选的,所述S6中将AFSA-ELM的信用评分模型部署至申请平台输出实时申请信用评分,实现申请客户的实时审批,并定期将有表现数据输入到模型训练,实现模型的在线更新。
优选的,所述S42中引入引入调整因子g(k),k=1,2,…,n,调整第k+1和第k次视野和步长的关系,调整因子g(k)计算公式如下:
其中,g(k)为调整因子,值域为[0,1],m为调整因子的调整幅度,k为当前迭代次数,n为迭代总次数,
g(k)随着迭代次数的增加,对视野内的食物状态了解越全面,逐步减小人工鱼群的视野和步长,在最优解附近区域后进行精细搜索,由全局搜索逐步演化为局部搜索,提高局部搜索能力,能加快算法的收敛速度和精确度,
通过加入调整因子,改进人工鱼群的视野范围和步长,调整方式如下式:
其中,visualk+1和visualk分别为第k+1和第k次搜索视野,Stepk+1和Stepk分别为第k+1和第k次搜索步长,visualmin为视野最小值、Stepmin为步长最小值,g(k)为调整因子。
与现有技术相比,本发明的有益效果是:
(1)相比于采用其他的神经网络,ELM网络参数无需全部进行调整,连接权值和隐层节点的阈值不需要反复迭代进行调整更新,网络的学习速度、泛化能力、预测精度均有所提升;
(2)相比遗传算法、粒子群算法、蚁群算法等优化算法,人工鱼群算法可以克服寻优过程中产生的方向性差和容易陷入僵局的问题,又可以求得真正的全局最值,收敛速度快;
(3)AFSA-ELM具有泛化能力强,预测精度高的特点,非常适合互联网金融平台信用评估。
附图说明
图1为本发明的步骤结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明提供一种技术方案:一种基于AFSA-ELM的信用评估方法,包括有以下步骤:
S1:根据互联网金融平台所获取客户的信息选择影响信用评分的参数,构建建模样本集;
S2:对建模样本集进行归一化处理后切分训练集和测试集,切分训练集和测试集;
S3:根据训练集构建ELM模型,初始化神经网络参数,包括各层的节点个数、连接权值和阈值;
S4:在训练集上利用AFSA算法对ELM的隐层权值和阈值进行优化,将最优个体给ELM模型赋值,完成模型的建立;
S5:采用优化后的ELM模型对测试集进行预测后验证模型的准确率,以均方根误差为指标,与遗传算法、粒子群算法优化的ELM模型的进行对比;
S6:将AFSA-ELM的信用评分模型部署至申请平台输出实时申请信用评分,实现申请客户的实时审批,并定期将有表现数据输入到模型训练,实现模型的在线更新。
为了实现对模型建设,选取数据参数,本实施例中,优选的,所述S1中从互联网金融平台后端根据贷后表现选取相同数量正常还款和逾期客户作为建模样本,采集样本客户账户注册申请时的个人基本信息、监测软件中获取操作行为埋点数据。
为了提高数据信息的准确性,本实施例中,优选的,所述个人基本信息包括有手机号、学历、婚姻状况、工作单位、住址、联系人信息,征信报告获取的个人基本信息、信用交易信息、公共信息、特别记录数据;所述埋点数据包括有埋点时采集的设备行为数据和日志数据,其中设备行为数据包括有登录本平台的次数、点击次数、点击频率、输入总耗时及平均耗时、手机号数据、GPS位置、MAC地址、IP地址数据、地理信息申请频次、IP的申请频次、设备电量占比、陀螺仪的平均加速度,所述日志数据包括有7天内登录次数、首次点击到申请授信时长、一天内最多的session数、申请授信前一周的行为统计;并且合规要求下,不限于获取移动互联网行为数据、贷款APP内行为数据、信贷历史、运营商数据在内的全域多维度大数据。
为了将数据信息进行归一化处理,本实施例中,优选的,所述S2中利用最大最小法将特征值中选出的有用的字段进行归一化处理,把所有数据都转化为[0,1]之间的数值,取消各维数据间的数量级差别,采用离差(Min-Max)标准化法来对数值归一化处理将其映射到[0,1]区间,有效地消除了原变量因量纲不同和数值差异太大而带来的影响,实现了建模数据特征的提取,Min-Max标准化的公式如下:
其中x'是归一化后的值,xmin是特征中的最小值,xmax是特征中的最大值,x为特征的初始值,
对归一化后的数据集根据申请时间按照7:3比例切分为训练集和测试集。
为了实现对ELM模型进行建设,本实施例中,优选的,所述S3中在根据所述根据训练集构建ELM模型,初始化神经网络参数,所述ELM(extreme learning machine,极限学习机)是一种单隐层前向神经网络,通过利用Moore-Penrose广义逆求解网络权重,可以随机产生输入层与隐层间的连接权值及隐层节点的阈值,在训练过程中无需调整,只需要设置隐层节点的个数,便可以获得唯一的最优解,具有网络结构简单,学习速度快,泛化性能好等优点。
所述ELM的训练可分为以下几个步骤:
S31:确定神经网络模型的输入层、输出层及隐层的结构,
给定N个不同样本的集合N={(xi,yi)|i=1,2,…,N;xi∈Rn;yi∈Rm},根据研究,隐层节点个数n和输入、输出节点数存在以下关系:
其中m、l分别为ELM输入、输出节点的个数,a为常数,通常取1~10;
S32、给定训练集T={(x1,y1),…,(xj,yj),…,(xn,yn)},其中,xj∈Rn,yj∈R,j=1,…,N,xj是一个n维向量;包括n个隐层节点的输出矩阵的计算公式为:
H=g(WXT+b)
其中,输入层与所述隐层由权值W连接,隐层与输出层由权值β连接,b为隐层节点的阈值,W、β、b表达式如下:
S33:解参数隐层到输出层的连接权重
神经网络的输出值为:
P=(HTβ)
其中,β是隐层到输出层的权值矩阵,H是隐层节点的输出矩阵,
对于给定的训练输出样本Y=(y1,y2,…,yn),用输出样本替代网络输出值,则权值矩阵β求解公式如下:
其解为:
其中,(HT)+表示转置矩阵HT的Moore-Penrose广义逆;
则具有n个隐层节点的ELM输出可表示为:
其中,wj=[w1j,w2j,…,wnj]为连接第j个隐层节点的输入权值向量;bj为第j个隐层节点的阈值;βj=[βj1,βj2,…,βjm]T为连接第j个隐层节点的输出权值向量;wj·xi为wj与xi的内积;g(·)为隐层节点的激活函数。
为了实现提高ELM模型的拟合精度,获取最优ELM模型,本实施例中,优选的,所述S4中利用AFSA为ELM寻找最优的初始输入层权值矩阵W和隐层阈值矩阵b,可以提高ELM模型的拟合精度,获取最优ELM模型,基于AFSA优化ELM的步骤包括:
S41:将ELM的初始权值W和阈值b赋给人工鱼群算法参数
将训练数据输入ELM,再将ELM的初始权值W和阈值b作为人工鱼群算法的参数,随机产生人工鱼的初始群体:选取N条人工鱼构成人工鱼群,其中每个人工鱼都是D维向量,包括代表ELM的输入权值ωij、输出权值ωio、输入节点阈值bki和输出节点阈值bko;
S42:人工鱼群的位置寻优
设置某一条人工鱼的当前位置向量X和在某一时刻视点所在的位置向量当前位置向量该人工鱼的视野范围为visual,若视点处的食物浓度高于当前位置的食物浓度,则向视点方向移动一步,到达位置Xnext;若视点处的食物浓度不比当前位置的食物浓度高,则返回继续寻找视野内的其他位置,直到到达位置Xnext,该过程可以表示为:
xi=xi+visual·r,i=1,2,…,n
其中,r为[-1,1]之间均匀分布的随机数,visual是人工鱼的视野范围,Step是人工鱼的步长;
S43:定义人工鱼群的食物浓度
将ELM的均方误差的倒数作为人工鱼群的食物浓度,也就是适应度函数,计算公式如下:
S44:全局寻优确定ELM初始权值W和阈值b
各代人工鱼的状态根据它的状态函数随觅食、聚群变化而变化,不断迭代直至达到最大迭代次数,对迭代过程中采用十折交叉验证法计算预测结果的均方误差,食物浓度函数不再增加时,根据全局最优确定ELM初始权值W和阈值b,得到基于AFSA-ELM的信用评估预测模型。
为了实现对预测值和真实值之间进行计算,本实施例中,优选的,所述S5中将以均方根误差为指标,与遗传算法、粒子群算法、蚁群算法优化的ELM模型的进行对比,预测值和真实值之间的均方根误差计算公式如下:
其中,RMSE是预测值和真实值之间的均方根误差,n是输出训练样本的个数,i表示输出训练样本的序号,yi是第i个输出训练样本的预测值,y′i是第i个输出训练样本的实际值。
为检验AFSA-ELM的优越性,选择粒子群优化算法(PSO)的PSO-ELM和遗传算法(GA)的GA-ELM作为对比模型。AFSA-ELM参数设置为:人工鱼的数目k为10,试探次数为50,拥挤因子δ为0.5,人工鱼的步长Step为1.5,迭代次数n为200,初始人工鱼的视野范围为visual为3;PSO-ELM参数设置为:粒子数群规模为10,参数局部搜索能力c1=2,全局搜索能力c2=2,迭代次数为200;GA-ELM参数设为:种群数量为20,交叉概率为0.90,变异概率为0.015,进化代数为200。实验结果表明,AFSA-ELM优化得最优权重和阈值后模型正确识别率能够高于PSO-ELM和GA-ELM,说明AFSA-ELM具有实际应用价值
为了实现对申请客户的快速检测,本实施例中,优选的,所述S6中将AFSA-ELM的信用评分模型部署至申请平台输出实时申请信用评分,实现申请客户的实时审批,并定期将有表现数据输入到模型训练,实现模型的在线更新。
为了提高人工鱼群的算法的精准度,本实施例中,优选的,所述S42中引入引入调整因子g(k),k=1,2,…,n,调整第k+1和第k次视野和步长的关系,调整因子g(k)计算公式如下:
其中,g(k)为调整因子,值域为[0,1],m为调整因子的调整幅度,k为当前迭代次数,n为迭代总次数。
g(k)随着迭代次数的增加,对视野内的食物状态了解越全面,逐步减小人工鱼群的视野和步长,在最优解附近区域后进行精细搜索,由全局搜索逐步演化为局部搜索,提高局部搜索能力,能加快算法的收敛速度和精确度。
通过加入调整因子,改进人工鱼群的视野范围和步长,调整方式如下式:
其中,visualk+1和visualk分别为第k+1和第k次搜索视野,Stepk+1和Stepk分别为第k+1和第k次搜索步长,visualmin为视野最小值、Stepmin为步长最小值,g(k)为调整因子。
另一方面,本发明还提供一种基于AFSA-ELM神经网络的信用评估系统,包括以下单元:
样本获取单元,用于获取包括个人信用评价数据及评价结果的建模样本集;
数据处理单元,用于对建模样本集缺失补全、异常值处理和归一化等处理;
网络构建单元,用于初始化ELM网络参数,构建ELM预测模型;
网络训练单元,用于利用AFSA算法对ELM模型优化权重和阈值;
信用评估单元,用于获取到待检测个人信用评价数据输入训练后ELM预测模型得到信用评分。
本发明的工作原理及使用流程:
第一步:根据互联网金融平台所获取客户的信息选择影响信用评分的参数,构建建模样本集;
第二步:对建模样本集进行归一化处理后切分训练集和测试集,切分训练集和测试集;
第三步:根据训练集构建ELM模型,初始化神经网络参数,包括各层的节点个数、连接权值和阈值;
第四步:在训练集上利用AFSA算法对ELM的隐层权值和阈值进行优化,将最优个体给ELM模型赋值,完成模型的建立;
第五步:采用优化后的ELM模型对测试集进行预测后验证模型的准确率,以均方根误差为指标,与遗传算法、粒子群算法优化的ELM模型的进行对比;
第六步:将AFSA-ELM的信用评分模型部署至申请平台输出实时申请信用评分,实现申请客户的实时审批,并定期将有表现数据输入到模型训练,实现模型的在线更新。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (10)
1.一种基于AFSA-ELM的信用评估方法,其特征在于:包括有以下步骤:
S1:根据互联网金融平台所获取客户的信息选择影响信用评分的参数,构建建模样本集;
S2:对建模样本集进行归一化处理后切分训练集和测试集,切分训练集和测试集;
S3:根据训练集构建ELM模型,初始化神经网络参数,包括各层的节点个数、连接权值和阈值;
S4:在训练集上利用AFSA算法对ELM的隐层权值和阈值进行优化,将最优个体给ELM模型赋值,完成模型的建立;
S5:采用优化后的ELM模型对测试集进行预测后验证模型的准确率,以均方根误差为指标,与遗传算法、粒子群算法优化的ELM模型的进行对比;
S6:将AFSA-ELM的信用评分模型部署至申请平台输出实时申请信用评分,实现申请客户的实时审批,并定期将有表现数据输入到模型训练,实现模型的在线更新。
2.根据权利要求1所述的一种基于AFSA-ELM的信用评估方法,其特征在于:所述S1中从互联网金融平台后端根据贷后表现选取相同数量正常还款和逾期客户作为建模样本,采集样本客户账户注册申请时的个人基本信息、监测软件中获取操作行为埋点数据。
3.根据权利要求2所述的一种基于AFSA-ELM的信用评估方法,其特征在于:所述个人基本信息包括有手机号、学历、婚姻状况、工作单位、住址、联系人信息,征信报告获取的个人基本信息、信用交易信息、公共信息、特别记录数据;所述埋点数据包括有埋点时采集的设备行为数据和日志数据,其中设备行为数据包括有登录本平台的次数、点击次数、点击频率、输入总耗时及平均耗时、手机号数据、GPS位置、MAC地址、IP地址数据、地理信息申请频次、IP的申请频次、设备电量占比、陀螺仪的平均加速度,所述日志数据包括有7天内登录次数、首次点击到申请授信时长、一天内最多的session数、申请授信前一周的行为统计;并且合规要求下,不限于获取移动互联网行为数据、贷款APP内行为数据、信贷历史、运营商数据在内的全域多维度大数据。
5.根据权利要求1所述的一种基于AFSA-ELM的信用评估方法,其特征在于:所述S3中在根据所述根据训练集构建ELM模型,初始化神经网络参数,所述ELM是一种单隐层前向神经网络,通过利用Moore-Penrose广义逆求解网络权重,随机产生输入层与隐层间的连接权值及隐层节点的阈值,在训练过程中无需调整,只需要设置隐层节点的个数,便可以获得唯一的最优解,ELM具有网络结构简单,学习速度快,泛化性能好等优点。
6.根据权利要求5所述的一种基于AFSA-ELM的信用评估方法,其特征在于:所述ELM的训练可分为以下几个步骤:
S31:确定神经网络模型的输入层、输出层及隐层的结构,
给定N个不同样本的集合N={(xi,yi)|i=1,2,…,N;xi∈Rn;yi∈Rm},根据研究,隐层节点个数n和输入、输出节点个数存在以下关系:
其中,m、l分别为ELM输入、输出节点的个数,a为常数,通常取1~10;
S32、给定训练集T={(x1,y1),…,(xj,yj),…,(xn,yn)},其中,xj∈Rn,yj∈R,j=1,…,N,xj是一个n维向量;具有n个隐层节点的输出矩阵H的表达式为:
H=g(WXT+b)
其中,输入层与所述隐层由权值W连接,隐层与输出层由权值β连接,b为隐层节点的阈值,W、β、b表达式如下:
S33:求解隐层到输出层的连接权重
神经网络的输出值为:
P=(HTβ)
其中,β是隐层到输出层的权值矩阵,H是隐层节点的输出矩阵,
对于给定的训练输出样本Y=(y1,y2,…,yn),用输出样本替代网络输出值,则权值矩阵β求解公式如下:
其解为:
其中,(HT)+表示转置矩阵HT的Moore-Penrose广义逆;
则具有n个隐层节点的ELM输出可表示为:
其中,wj=[w1j,w2j,…,wnj]为连接第j个隐层节点的输入权值向量;bj为第j个隐层节点的阈值;βj=[βj1,βj2,…,βjm]T为连接第j个隐层节点的输出权值向量;wj·xi为wj与xi的内积;g(x)为隐层节点的激活函数。
7.根据权利要求1所述的一种基于AFSA-ELM的信用评估方法,其特征在于:所述S4中利用AFSA算法优化ELM的初始输入层权值矩阵W和隐层阈值矩阵b,提高ELM模型的拟合精度,获取最优ELM模型,基于AFSA优化ELM的步骤包括:
S41:将ELM的初始权值W和阈值b赋给人工鱼群算法参数
将训练数据输入ELM,再将ELM的初始权值W和阈值b作为人工鱼群算法的参数,随机产生人工鱼的初始群体:选取N条人工鱼构成人工鱼群,其中每个人工鱼都是D维向量,包括代表ELM的输入权值ωij、输出权值ωio、输入节点阈值bki和输出节点阈值bko;
S42:人工鱼群的位置寻优
设置某一条人工鱼的当前位置向量X和在某一时刻视点所在的位置向量当前位置向量该人工鱼的视野范围为visual,若视点处的食物浓度高于当前位置的食物浓度,则向视点方向移动一步,到达位置Xnext;若视点处的食物浓度不比当前位置的食物浓度高,则返回继续寻找视野内的其他位置,直到到达位置Xnext,该过程可以表示为:
xi=xi+visual·r,i=1,2,…,n
其中,r为[-1,1]之间均匀分布的随机数,visual是人工鱼的视野范围,Step是人工鱼的步长;
S43:定义人工鱼群的食物浓度
将ELM的均方误差的倒数作为人工鱼群的食物浓度,也就是适应度函数,计算公式如下:
S44:全局寻优确定ELM初始权值W和阈值b
各代人工鱼的状态根据它的状态函数随觅食、聚群变化而变化,不断迭代直至达到最大迭代次数,对迭代过程中采用十折交叉验证法计算预测结果的均方误差,食物浓度函数不再增加时,根据全局最优确定ELM初始权值W和阈值b,得到基于AFSA-ELM的信用评估预测模型。
9.根据权利要求1所述的一种基于AFSA-ELM的信用评估方法,其特征在于:所述S6中将AFSA-ELM的信用评分模型部署至申请平台输出实时申请信用评分,实现申请客户的实时审批,并定期将有表现数据输入到模型训练,实现模型的在线更新。
10.根据权利要求7所述的一种基于AFSA-ELM的信用评估方法,其特征在于:所述S42中引入引入调整因子g(k),k=1,2,…,n,调整第k+1和第k次视野和步长的关系,调整因子g(k)计算公式如下:
其中,g(k)为调整因子,值域为[0,1],m为调整因子的调整幅度,k为当前迭代次数,n为迭代总次数,
g(k)随着迭代次数的增加,对视野内的食物状态了解越全面,逐步减小人工鱼群的视野和步长,在最优解附近区域后进行精细搜索,由全局搜索逐步演化为局部搜索,提高局部搜索能力,能加快算法的收敛速度和精确度;
通过加入调整因子,改进人工鱼群的视野范围和步长,调整方式如下式:
其中,visualk+1和visualk分别为第k+1和第k次搜索视野,Stepk+1和Stepk分别为第k+1和第k次搜索步长,visualmin为视野最小值、Stepmin为步长最小值,g(k)为调整因子。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011047318.7A CN112348655A (zh) | 2020-09-29 | 2020-09-29 | 一种基于afsa-elm的信用评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011047318.7A CN112348655A (zh) | 2020-09-29 | 2020-09-29 | 一种基于afsa-elm的信用评估方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112348655A true CN112348655A (zh) | 2021-02-09 |
Family
ID=74361268
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011047318.7A Pending CN112348655A (zh) | 2020-09-29 | 2020-09-29 | 一种基于afsa-elm的信用评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112348655A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113268913A (zh) * | 2021-06-24 | 2021-08-17 | 广州鼎泰智慧能源科技有限公司 | 一种基于pso-elm算法的智能建筑空调冷机系统运行优化方法 |
CN113922366A (zh) * | 2021-10-08 | 2022-01-11 | 广东电网有限责任公司广州供电局 | 一种电力系统等值惯性常数辨识方法及其相关装置 |
CN114626304A (zh) * | 2022-03-21 | 2022-06-14 | 齐鲁工业大学 | 一种矿浆铜品位在线预测软测量建模方法 |
CN116910449A (zh) * | 2023-07-12 | 2023-10-20 | 上海虹港数据信息有限公司 | 一种人工智能算力的运算应用平台 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105160437A (zh) * | 2015-09-25 | 2015-12-16 | 国网浙江省电力公司 | 基于极限学习机的负荷模型预测方法 |
CN105243259A (zh) * | 2015-09-02 | 2016-01-13 | 上海大学 | 基于极限学习机的脉动风速快速预测方法 |
CN106786499A (zh) * | 2016-11-10 | 2017-05-31 | 南京信息工程大学 | 基于改进afsa优化elm的短期风电功率预测方法 |
CN109818798A (zh) * | 2019-02-19 | 2019-05-28 | 上海海事大学 | 一种融合kpca和elm的无线传感器网络入侵检测系统及方法 |
CN109886097A (zh) * | 2019-01-10 | 2019-06-14 | 杭州电子科技大学 | 一种基于人工鱼群优化h-elm的疲劳驾驶检测方法 |
CN110175707A (zh) * | 2019-05-13 | 2019-08-27 | 东南大学 | 基于数据继承思想的电力系统暂态频率预测模型更新方法 |
-
2020
- 2020-09-29 CN CN202011047318.7A patent/CN112348655A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105243259A (zh) * | 2015-09-02 | 2016-01-13 | 上海大学 | 基于极限学习机的脉动风速快速预测方法 |
CN105160437A (zh) * | 2015-09-25 | 2015-12-16 | 国网浙江省电力公司 | 基于极限学习机的负荷模型预测方法 |
CN106786499A (zh) * | 2016-11-10 | 2017-05-31 | 南京信息工程大学 | 基于改进afsa优化elm的短期风电功率预测方法 |
CN109886097A (zh) * | 2019-01-10 | 2019-06-14 | 杭州电子科技大学 | 一种基于人工鱼群优化h-elm的疲劳驾驶检测方法 |
CN109818798A (zh) * | 2019-02-19 | 2019-05-28 | 上海海事大学 | 一种融合kpca和elm的无线传感器网络入侵检测系统及方法 |
CN110175707A (zh) * | 2019-05-13 | 2019-08-27 | 东南大学 | 基于数据继承思想的电力系统暂态频率预测模型更新方法 |
Non-Patent Citations (2)
Title |
---|
QQ_26091271: ""BP神经网络(经验公式)"", 《HTTPS://BLOG.CSDN.NET/QQ_26091271/ARTICLE/DETAILS/74852633》 * |
思绪无限: ""极限学习机(ELM)从原理到程序实现"", 《HTTPS://BLOG.CSDN.NET/QQ_32892383/ARTICLE/DETAILS/90760481》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113268913A (zh) * | 2021-06-24 | 2021-08-17 | 广州鼎泰智慧能源科技有限公司 | 一种基于pso-elm算法的智能建筑空调冷机系统运行优化方法 |
CN113268913B (zh) * | 2021-06-24 | 2022-02-11 | 广州鼎泰智慧能源科技有限公司 | 一种基于pso-elm算法的智能建筑空调冷机系统运行优化方法 |
CN113922366A (zh) * | 2021-10-08 | 2022-01-11 | 广东电网有限责任公司广州供电局 | 一种电力系统等值惯性常数辨识方法及其相关装置 |
CN114626304A (zh) * | 2022-03-21 | 2022-06-14 | 齐鲁工业大学 | 一种矿浆铜品位在线预测软测量建模方法 |
CN114626304B (zh) * | 2022-03-21 | 2024-02-27 | 齐鲁工业大学 | 一种矿浆铜品位在线预测软测量建模方法 |
CN116910449A (zh) * | 2023-07-12 | 2023-10-20 | 上海虹港数据信息有限公司 | 一种人工智能算力的运算应用平台 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112348655A (zh) | 一种基于afsa-elm的信用评估方法 | |
CN112581263A (zh) | 一种基于灰狼算法优化广义回归神经网络的信用评估方法 | |
CN112037012A (zh) | 一种基于pso-bp神经网络的互联网金融信用评价方法 | |
CN112581262A (zh) | 一种基于鲸鱼算法优化lvq神经网络的欺诈行为检测方法 | |
CN112037011A (zh) | 一种基于foa-rbf神经网络的信用评分方法 | |
Messaoudi et al. | A multi-objective bat algorithm for community detection on dynamic social networks | |
CN110084610B (zh) | 一种基于孪生神经网络的网络交易欺诈检测系统 | |
CN102651088B (zh) | 基于A_Kohonen神经网络的恶意代码分类方法 | |
CN113379536A (zh) | 一种基于引力搜索算法优化递归神经网络的违约概率预测方法 | |
CN112529685A (zh) | 一种基于bas-fnn的贷款用户信用评级方法及系统 | |
CN112215446A (zh) | 一种基于神经网络的单位动态火灾风险评估方法 | |
CN112529683A (zh) | 一种基于cs-pnn的客户信贷风险的评估方法及系统 | |
CN113239638A (zh) | 一种基于蜻蜓算法优化多核支持向量机的逾期风险预测方法 | |
CN110472840A (zh) | 一种基于神经网络技术的农业水利调度方法及系统 | |
CN112581264A (zh) | 一种基于蝗虫算法优化mlp神经网络的信用风险预测方法 | |
CN113407864A (zh) | 一种基于混合注意力网络的群组推荐方法 | |
WO2023207013A1 (zh) | 一种基于图嵌入的关系图谱关键人员分析方法及系统 | |
CN111988786B (zh) | 一种基于高维多目标分解算法的传感器网络覆盖方法及系统 | |
CN115660147A (zh) | 一种基于传播路径间与传播路径内影响力建模的信息传播预测方法及系统 | |
CN116415177A (zh) | 一种基于极限学习机的分类器参数辨识方法 | |
CN116362329A (zh) | 一种融合参数优化的集群联邦学习方法及设备 | |
CN114708479B (zh) | 一种基于图结构和特征的自适应防御方法 | |
CN110109005B (zh) | 一种基于序贯测试的模拟电路故障测试方法 | |
CN117893807B (zh) | 基于知识蒸馏的联邦自监督对比学习图像分类系统及方法 | |
CN110852435A (zh) | 一种基于神经进化计算模型 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210209 |