CN112348655A - 一种基于afsa-elm的信用评估方法 - Google Patents

一种基于afsa-elm的信用评估方法 Download PDF

Info

Publication number
CN112348655A
CN112348655A CN202011047318.7A CN202011047318A CN112348655A CN 112348655 A CN112348655 A CN 112348655A CN 202011047318 A CN202011047318 A CN 202011047318A CN 112348655 A CN112348655 A CN 112348655A
Authority
CN
China
Prior art keywords
elm
model
output
afsa
artificial fish
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011047318.7A
Other languages
English (en)
Inventor
江远强
李兰
韩璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baiweijinke Shanghai Information Technology Co ltd
Original Assignee
Baiweijinke Shanghai Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baiweijinke Shanghai Information Technology Co ltd filed Critical Baiweijinke Shanghai Information Technology Co ltd
Priority to CN202011047318.7A priority Critical patent/CN112348655A/zh
Publication of CN112348655A publication Critical patent/CN112348655A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Finance (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Accounting & Taxation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于AFSA‑ELM的信用评估方法;其中的方法包括:根据互联网金融平台所获取客户的信息选择影响信用评分的参数构建建模样本集;对建模样本集进行归一化处理后切分训练集和测试集;构建前馈神经网络,采用ELM对前馈神经网络进行训练建模,获取神经网络参数;利用AFSA算法对ELM训练构建的模型进行ELM的隐层权值w和阈值b进行优化,将最优个体给ELM模型赋值,完成模型的建立;在测试集上验证预测模型的准确率;将优化后的ELM模型部署至申请平台对实时申请客户信用评估。本发明利用AFSA算法对ELM模型自动优化获得最优权重和阈值,提高了模型的收敛速度和稳定性,所建立的信用预测模型具有很高的预测精度和鲁棒性能。

Description

一种基于AFSA-ELM的信用评估方法
技术领域
本发明属于互联网金融行业的风控技术领域,具体涉及一种基于AFSA-ELM的信用评估方法。
背景技术
近年来在互联网金融信用评估方面,人工神经网络已经被证明是表现不错的研究模型。目前在信用评估应用中大多采用的是BP神经网络、RBF神经网络和Elman回归神经网络,或者基于这三种网络的一些改进。然而,这三种神经网络在处理数据进行预测时存在各种不足:BP神经网络是基于梯度下降算法的,存在局部极小、鲁棒性不高等缺陷;RBF神经网络属于静态前馈网络,对处理动态时间建模问题存在不足;Elman神经网络是一种局部的循环网络,存在隐含神经元多、收敛速度慢、训练时间长等缺点。
极限学习机(Extreme Learning Machine,ELM)是一种新型单隐层前馈神经网络,相比于采用其他的神经网络,不需要基于梯度的学习算法一样通过迭代反复调整更新网络的输入层与隐层间的连接权值及隐层节点的阈值,训练前只需要设置合适的隐层节点数,通过利用Moore-Penrose广义逆求解网络权重,可以随机产生输入层与隐层间的连接权值及隐层节点的阈值完成整个网络的训练。ELM以其设置参数少、泛化能力强、训练速度快等优点成为研究的热点,非常适用于金融行业的信用评估。
但是传统ELM随机产生输入层到隐层连接权值和隐层阈值的初始值,容易陷入局部最小值,不易获得最优ELM模型进行预测,现有技术使用遗传算法、粒子群算法、蚁群算法等群集智能优化算法来优化ELM初始连接权值和隐层阈值,但遗传算法对初始种群的选择有一定的依赖性,粒子群算法对最大速度选取和加权因子的设定较困难,蚁群算法对参数选取和设定较困难,且都存在容易陷入局部最优、收敛速度慢等缺点,现有技术存在着各种各样的问题。
如授权公告号为CN111160752A所公开的信用评估方法,其虽然实现了操作方便、省力,且数据实时性好,但是并未解决现有检测方式过于单一,未经过多种计算得出不准确的结论,容易陷入死循环瘫痪,精准度不高的问题,为此我们提出一种基于AFSA-ELM的信用评估方法。
发明内容
本发明的目的在于提供一种基于AFSA-ELM的信用评估方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于AFSA-ELM的信用评估方法,包括有以下步骤:
S1:根据互联网金融平台所获取客户的信息选择影响信用评分的参数,构建建模样本集;
S2:对建模样本集进行归一化处理后切分训练集和测试集,切分训练集和测试集;
S3:根据训练集构建ELM模型,初始化神经网络参数,包括各层的节点个数、连接权值和阈值;
S4:在训练集上利用AFSA算法对ELM的隐层权值和阈值进行优化,将最优个体给ELM模型赋值,完成模型的建立;
S5:采用优化后的ELM模型对测试集进行预测后验证模型的准确率,以均方根误差为指标,与遗传算法、粒子群算法优化的ELM模型的进行对比;
S6:将AFSA-ELM的信用评分模型部署至申请平台输出实时申请信用评分,实现申请客户的实时审批,并定期将有表现数据输入到模型训练,实现模型的在线更新。
优选的,所述S1中从互联网金融平台后端根据贷后表现选取相同数量正常还款和逾期客户作为建模样本,采集样本客户账户注册申请时的个人基本信息、监测软件中获取操作行为埋点数据。
优选的,所述个人基本信息包括有手机号、学历、婚姻状况、工作单位、住址、联系人信息,征信报告获取的个人基本信息、信用交易信息、公共信息、特别记录数据;所述埋点数据包括有埋点时采集的设备行为数据和日志数据,其中设备行为数据包括有登录本平台的次数、点击次数、点击频率、输入总耗时及平均耗时、手机号数据、GPS位置、MAC地址、IP地址数据、地理信息申请频次、IP的申请频次、设备电量占比、陀螺仪的平均加速度,所述日志数据包括有7天内登录次数、首次点击到申请授信时长、一天内最多的session数、申请授信前一周的行为统计;并且合规要求下,不限于获取移动互联网行为数据、贷款APP内行为数据、信贷历史、运营商数据在内的全域多维度大数据。
优选的,所述S2中利用最大最小法将特征值中选出的有用的字段进行归一化处理,把所有数据都转化为[0,1]之间的数值,取消各维数据间的数量级差别,采用离差(Min-Max)标准化法来对数值归一化处理将其映射到[0,1]区间,Min-Max标准化的公式如下:
Figure BDA0002708400990000031
其中x'是归一化后的值,xmin是特征中的最小值,xmax是特征中的最大值,x为特征的初始值,再对归一化后的数据集根据申请时间按照7:3比例切分为训练集和测试集。
优选的,所述S3中在根据所述根据训练集构建ELM模型,初始化神经网络参数,所述ELM是一种单隐层前向神经网络,通过利用Moore-Penrose广义逆求解网络权重,可以随机产生输入层与隐层间的连接权值及隐层节点的阈值,在训练过程中无需调整,只需要设置隐层节点的个数,便可以获得唯一的最优解,ELM具有网络结构简单,学习速度快,泛化性能好等优点。
优选的,所述ELM的训练可分为以下几个步骤:
S31:确定神经网络模型的输入层、输出层及隐层的结构,
给定N个不同样本的集合N={(xi,yi)|i=1,2,…,N;xi∈Rn;yi∈Rm},根据研究,隐层节点个数n和输入、输出节点个数存在以下关系:
Figure BDA0002708400990000041
其中m、l分别为ELM输入、输出节点的个数,a为常数,通常取1~10;
S32、给定训练集T={(x1,y1),…,(xj,yj),…,(xn,yn)},其中,xj∈Rn,yj∈R,j=1,…,N,xj是一个n维向量;包括n个隐层节点的输出矩阵的计算公式为:
H=g(WXT+b)
其中,输入层与所述隐层由权值W连接,隐层与输出层由权值β连接,b为隐层节点的阈值,W、β、b表达式如下:
Figure BDA0002708400990000042
S33:求解隐层到输出层的连接权重
神经网络的输出值为:
P=(HTβ)
其中,β是隐层到输出层的权值矩阵,H是隐层节点的输出矩阵,
对于给定的训练输出样本Y=(y1,y2,…,yn),用输出样本替代网络输出值,则权值矩阵β求解公式如下:
Figure BDA0002708400990000043
其解为:
Figure BDA0002708400990000044
其中,(HT)+表示转置矩阵HT的Moore-Penrose广义逆;
则具有n个隐层节点的ELM输出可表示为:
Figure BDA0002708400990000051
其中,wj=[w1j,w2j,…,wnj]为连接第j个隐层节点的输入权值向量;bj为第j个隐层节点的阈值;βj=[βj1j2,…,βjm]T为连接第j个隐层节点的输出权值向量;wj·xi为wj与xi的内积;g(·)为隐层节点的激活函数。
优选的,所述S4中利用AFSA为ELM寻找最优的初始输入层权值矩阵W和隐层阈值矩阵b,可以提高ELM模型的拟合精度,获取最优ELM模型,基于AFSA优化ELM的步骤包括:
S41:将ELM的初始权值W和阈值b赋给人工鱼群算法参数
将训练数据输入ELM,再将ELM的初始权值W和阈值b作为人工鱼群算法的参数,随机产生人工鱼的初始群体:选取N条人工鱼构成人工鱼群,其中每个人工鱼都是D维向量,包括代表ELM的输入权值ωij、输出权值ωio、输入节点阈值bki和输出节点阈值bko
S42:人工鱼群的位置寻优
设置某一条人工鱼的当前位置向量X和在某一时刻视点所在的位置向量
Figure BDA0002708400990000052
当前位置向量该人工鱼的视野范围为visual,若视点处的食物浓度高于当前位置的食物浓度,则向视点方向移动一步,到达位置Xnext;若视点处的食物浓度不比当前位置的食物浓度高,则返回继续寻找视野内的其他位置,直到到达位置Xnext,该过程可以表示为:
xi=xi+visual·r,i=1,2,…,n
Figure BDA0002708400990000053
其中,r为[-1,1]之间均匀分布的随机数,visual是人工鱼的视野范围,Step是人工鱼的步长;
S43:定义人工鱼群的食物浓度
将ELM的均方误差的倒数作为人工鱼群的食物浓度,也就是适应度函数,计算公式如下:
Figure BDA0002708400990000061
其中,fitness为人工鱼当前位置的食物浓度,N为人工鱼群的人工鱼样本总数,R为输出节点数,
Figure BDA0002708400990000062
为输出节点s在样本p作用时输出,Ys p为在样本p作用时输出节点s的目标值;
S44:全局寻优确定ELM初始权值W和阈值b
各代人工鱼的状态根据它的状态函数随觅食、聚群变化而变化,不断迭代直至达到最大迭代次数,对迭代过程中采用十折交叉验证法计算预测结果的均方误差,食物浓度函数不再增加时,根据全局最优确定ELM初始权值W和阈值b,得到基于AFSA-ELM的信用评估预测模型。
优选的,所述S5中将以均方根误差为指标,与遗传算法、粒子群算法、蚁群算法优化的ELM模型的进行对比,预测值和真实值之间的均方根误差计算公式如下:
Figure BDA0002708400990000063
其中,RMSE是预测值和真实值的均方根误差,n是输出训练样本的个数,i表示输出训练样本的序号,yi是第i个输出训练样本的预测值,y′i是第i个输出训练样本的实际值。
优选的,所述S6中将AFSA-ELM的信用评分模型部署至申请平台输出实时申请信用评分,实现申请客户的实时审批,并定期将有表现数据输入到模型训练,实现模型的在线更新。
优选的,所述S42中引入引入调整因子g(k),k=1,2,…,n,调整第k+1和第k次视野和步长的关系,调整因子g(k)计算公式如下:
Figure BDA0002708400990000071
其中,g(k)为调整因子,值域为[0,1],m为调整因子的调整幅度,k为当前迭代次数,n为迭代总次数,
g(k)随着迭代次数的增加,对视野内的食物状态了解越全面,逐步减小人工鱼群的视野和步长,在最优解附近区域后进行精细搜索,由全局搜索逐步演化为局部搜索,提高局部搜索能力,能加快算法的收敛速度和精确度,
通过加入调整因子,改进人工鱼群的视野范围和步长,调整方式如下式:
Figure BDA0002708400990000072
其中,visualk+1和visualk分别为第k+1和第k次搜索视野,Stepk+1和Stepk分别为第k+1和第k次搜索步长,visualmin为视野最小值、Stepmin为步长最小值,g(k)为调整因子。
与现有技术相比,本发明的有益效果是:
(1)相比于采用其他的神经网络,ELM网络参数无需全部进行调整,连接权值和隐层节点的阈值不需要反复迭代进行调整更新,网络的学习速度、泛化能力、预测精度均有所提升;
(2)相比遗传算法、粒子群算法、蚁群算法等优化算法,人工鱼群算法可以克服寻优过程中产生的方向性差和容易陷入僵局的问题,又可以求得真正的全局最值,收敛速度快;
(3)AFSA-ELM具有泛化能力强,预测精度高的特点,非常适合互联网金融平台信用评估。
附图说明
图1为本发明的步骤结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明提供一种技术方案:一种基于AFSA-ELM的信用评估方法,包括有以下步骤:
S1:根据互联网金融平台所获取客户的信息选择影响信用评分的参数,构建建模样本集;
S2:对建模样本集进行归一化处理后切分训练集和测试集,切分训练集和测试集;
S3:根据训练集构建ELM模型,初始化神经网络参数,包括各层的节点个数、连接权值和阈值;
S4:在训练集上利用AFSA算法对ELM的隐层权值和阈值进行优化,将最优个体给ELM模型赋值,完成模型的建立;
S5:采用优化后的ELM模型对测试集进行预测后验证模型的准确率,以均方根误差为指标,与遗传算法、粒子群算法优化的ELM模型的进行对比;
S6:将AFSA-ELM的信用评分模型部署至申请平台输出实时申请信用评分,实现申请客户的实时审批,并定期将有表现数据输入到模型训练,实现模型的在线更新。
为了实现对模型建设,选取数据参数,本实施例中,优选的,所述S1中从互联网金融平台后端根据贷后表现选取相同数量正常还款和逾期客户作为建模样本,采集样本客户账户注册申请时的个人基本信息、监测软件中获取操作行为埋点数据。
为了提高数据信息的准确性,本实施例中,优选的,所述个人基本信息包括有手机号、学历、婚姻状况、工作单位、住址、联系人信息,征信报告获取的个人基本信息、信用交易信息、公共信息、特别记录数据;所述埋点数据包括有埋点时采集的设备行为数据和日志数据,其中设备行为数据包括有登录本平台的次数、点击次数、点击频率、输入总耗时及平均耗时、手机号数据、GPS位置、MAC地址、IP地址数据、地理信息申请频次、IP的申请频次、设备电量占比、陀螺仪的平均加速度,所述日志数据包括有7天内登录次数、首次点击到申请授信时长、一天内最多的session数、申请授信前一周的行为统计;并且合规要求下,不限于获取移动互联网行为数据、贷款APP内行为数据、信贷历史、运营商数据在内的全域多维度大数据。
为了将数据信息进行归一化处理,本实施例中,优选的,所述S2中利用最大最小法将特征值中选出的有用的字段进行归一化处理,把所有数据都转化为[0,1]之间的数值,取消各维数据间的数量级差别,采用离差(Min-Max)标准化法来对数值归一化处理将其映射到[0,1]区间,有效地消除了原变量因量纲不同和数值差异太大而带来的影响,实现了建模数据特征的提取,Min-Max标准化的公式如下:
Figure BDA0002708400990000091
其中x'是归一化后的值,xmin是特征中的最小值,xmax是特征中的最大值,x为特征的初始值,
对归一化后的数据集根据申请时间按照7:3比例切分为训练集和测试集。
为了实现对ELM模型进行建设,本实施例中,优选的,所述S3中在根据所述根据训练集构建ELM模型,初始化神经网络参数,所述ELM(extreme learning machine,极限学习机)是一种单隐层前向神经网络,通过利用Moore-Penrose广义逆求解网络权重,可以随机产生输入层与隐层间的连接权值及隐层节点的阈值,在训练过程中无需调整,只需要设置隐层节点的个数,便可以获得唯一的最优解,具有网络结构简单,学习速度快,泛化性能好等优点。
所述ELM的训练可分为以下几个步骤:
S31:确定神经网络模型的输入层、输出层及隐层的结构,
给定N个不同样本的集合N={(xi,yi)|i=1,2,…,N;xi∈Rn;yi∈Rm},根据研究,隐层节点个数n和输入、输出节点数存在以下关系:
Figure BDA0002708400990000101
其中m、l分别为ELM输入、输出节点的个数,a为常数,通常取1~10;
S32、给定训练集T={(x1,y1),…,(xj,yj),…,(xn,yn)},其中,xj∈Rn,yj∈R,j=1,…,N,xj是一个n维向量;包括n个隐层节点的输出矩阵的计算公式为:
H=g(WXT+b)
其中,输入层与所述隐层由权值W连接,隐层与输出层由权值β连接,b为隐层节点的阈值,W、β、b表达式如下:
Figure BDA0002708400990000102
S33:解参数隐层到输出层的连接权重
神经网络的输出值为:
P=(HTβ)
其中,β是隐层到输出层的权值矩阵,H是隐层节点的输出矩阵,
对于给定的训练输出样本Y=(y1,y2,…,yn),用输出样本替代网络输出值,则权值矩阵β求解公式如下:
Figure BDA0002708400990000103
其解为:
Figure BDA0002708400990000111
其中,(HT)+表示转置矩阵HT的Moore-Penrose广义逆;
则具有n个隐层节点的ELM输出可表示为:
Figure BDA0002708400990000112
其中,wj=[w1j,w2j,…,wnj]为连接第j个隐层节点的输入权值向量;bj为第j个隐层节点的阈值;βj=[βj1j2,…,βjm]T为连接第j个隐层节点的输出权值向量;wj·xi为wj与xi的内积;g(·)为隐层节点的激活函数。
为了实现提高ELM模型的拟合精度,获取最优ELM模型,本实施例中,优选的,所述S4中利用AFSA为ELM寻找最优的初始输入层权值矩阵W和隐层阈值矩阵b,可以提高ELM模型的拟合精度,获取最优ELM模型,基于AFSA优化ELM的步骤包括:
S41:将ELM的初始权值W和阈值b赋给人工鱼群算法参数
将训练数据输入ELM,再将ELM的初始权值W和阈值b作为人工鱼群算法的参数,随机产生人工鱼的初始群体:选取N条人工鱼构成人工鱼群,其中每个人工鱼都是D维向量,包括代表ELM的输入权值ωij、输出权值ωio、输入节点阈值bki和输出节点阈值bko
S42:人工鱼群的位置寻优
设置某一条人工鱼的当前位置向量X和在某一时刻视点所在的位置向量
Figure BDA0002708400990000113
当前位置向量该人工鱼的视野范围为visual,若视点处的食物浓度高于当前位置的食物浓度,则向视点方向移动一步,到达位置Xnext;若视点处的食物浓度不比当前位置的食物浓度高,则返回继续寻找视野内的其他位置,直到到达位置Xnext,该过程可以表示为:
xi=xi+visual·r,i=1,2,…,n
Figure BDA0002708400990000114
其中,r为[-1,1]之间均匀分布的随机数,visual是人工鱼的视野范围,Step是人工鱼的步长;
S43:定义人工鱼群的食物浓度
将ELM的均方误差的倒数作为人工鱼群的食物浓度,也就是适应度函数,计算公式如下:
Figure BDA0002708400990000121
其中,fitness为人工鱼当前位置的食物浓度,N为人工鱼群的人工鱼样本总数,R为输出节点数,
Figure BDA0002708400990000122
为输出节点s在样本p作用时输出,Ys p为在样本p作用时输出节点s的目标值;
S44:全局寻优确定ELM初始权值W和阈值b
各代人工鱼的状态根据它的状态函数随觅食、聚群变化而变化,不断迭代直至达到最大迭代次数,对迭代过程中采用十折交叉验证法计算预测结果的均方误差,食物浓度函数不再增加时,根据全局最优确定ELM初始权值W和阈值b,得到基于AFSA-ELM的信用评估预测模型。
为了实现对预测值和真实值之间进行计算,本实施例中,优选的,所述S5中将以均方根误差为指标,与遗传算法、粒子群算法、蚁群算法优化的ELM模型的进行对比,预测值和真实值之间的均方根误差计算公式如下:
Figure BDA0002708400990000123
其中,RMSE是预测值和真实值之间的均方根误差,n是输出训练样本的个数,i表示输出训练样本的序号,yi是第i个输出训练样本的预测值,y′i是第i个输出训练样本的实际值。
为检验AFSA-ELM的优越性,选择粒子群优化算法(PSO)的PSO-ELM和遗传算法(GA)的GA-ELM作为对比模型。AFSA-ELM参数设置为:人工鱼的数目k为10,试探次数为50,拥挤因子δ为0.5,人工鱼的步长Step为1.5,迭代次数n为200,初始人工鱼的视野范围为visual为3;PSO-ELM参数设置为:粒子数群规模为10,参数局部搜索能力c1=2,全局搜索能力c2=2,迭代次数为200;GA-ELM参数设为:种群数量为20,交叉概率为0.90,变异概率为0.015,进化代数为200。实验结果表明,AFSA-ELM优化得最优权重和阈值后模型正确识别率能够高于PSO-ELM和GA-ELM,说明AFSA-ELM具有实际应用价值
为了实现对申请客户的快速检测,本实施例中,优选的,所述S6中将AFSA-ELM的信用评分模型部署至申请平台输出实时申请信用评分,实现申请客户的实时审批,并定期将有表现数据输入到模型训练,实现模型的在线更新。
为了提高人工鱼群的算法的精准度,本实施例中,优选的,所述S42中引入引入调整因子g(k),k=1,2,…,n,调整第k+1和第k次视野和步长的关系,调整因子g(k)计算公式如下:
Figure BDA0002708400990000131
其中,g(k)为调整因子,值域为[0,1],m为调整因子的调整幅度,k为当前迭代次数,n为迭代总次数。
g(k)随着迭代次数的增加,对视野内的食物状态了解越全面,逐步减小人工鱼群的视野和步长,在最优解附近区域后进行精细搜索,由全局搜索逐步演化为局部搜索,提高局部搜索能力,能加快算法的收敛速度和精确度。
通过加入调整因子,改进人工鱼群的视野范围和步长,调整方式如下式:
Figure BDA0002708400990000132
其中,visualk+1和visualk分别为第k+1和第k次搜索视野,Stepk+1和Stepk分别为第k+1和第k次搜索步长,visualmin为视野最小值、Stepmin为步长最小值,g(k)为调整因子。
另一方面,本发明还提供一种基于AFSA-ELM神经网络的信用评估系统,包括以下单元:
样本获取单元,用于获取包括个人信用评价数据及评价结果的建模样本集;
数据处理单元,用于对建模样本集缺失补全、异常值处理和归一化等处理;
网络构建单元,用于初始化ELM网络参数,构建ELM预测模型;
网络训练单元,用于利用AFSA算法对ELM模型优化权重和阈值;
信用评估单元,用于获取到待检测个人信用评价数据输入训练后ELM预测模型得到信用评分。
本发明的工作原理及使用流程:
第一步:根据互联网金融平台所获取客户的信息选择影响信用评分的参数,构建建模样本集;
第二步:对建模样本集进行归一化处理后切分训练集和测试集,切分训练集和测试集;
第三步:根据训练集构建ELM模型,初始化神经网络参数,包括各层的节点个数、连接权值和阈值;
第四步:在训练集上利用AFSA算法对ELM的隐层权值和阈值进行优化,将最优个体给ELM模型赋值,完成模型的建立;
第五步:采用优化后的ELM模型对测试集进行预测后验证模型的准确率,以均方根误差为指标,与遗传算法、粒子群算法优化的ELM模型的进行对比;
第六步:将AFSA-ELM的信用评分模型部署至申请平台输出实时申请信用评分,实现申请客户的实时审批,并定期将有表现数据输入到模型训练,实现模型的在线更新。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (10)

1.一种基于AFSA-ELM的信用评估方法,其特征在于:包括有以下步骤:
S1:根据互联网金融平台所获取客户的信息选择影响信用评分的参数,构建建模样本集;
S2:对建模样本集进行归一化处理后切分训练集和测试集,切分训练集和测试集;
S3:根据训练集构建ELM模型,初始化神经网络参数,包括各层的节点个数、连接权值和阈值;
S4:在训练集上利用AFSA算法对ELM的隐层权值和阈值进行优化,将最优个体给ELM模型赋值,完成模型的建立;
S5:采用优化后的ELM模型对测试集进行预测后验证模型的准确率,以均方根误差为指标,与遗传算法、粒子群算法优化的ELM模型的进行对比;
S6:将AFSA-ELM的信用评分模型部署至申请平台输出实时申请信用评分,实现申请客户的实时审批,并定期将有表现数据输入到模型训练,实现模型的在线更新。
2.根据权利要求1所述的一种基于AFSA-ELM的信用评估方法,其特征在于:所述S1中从互联网金融平台后端根据贷后表现选取相同数量正常还款和逾期客户作为建模样本,采集样本客户账户注册申请时的个人基本信息、监测软件中获取操作行为埋点数据。
3.根据权利要求2所述的一种基于AFSA-ELM的信用评估方法,其特征在于:所述个人基本信息包括有手机号、学历、婚姻状况、工作单位、住址、联系人信息,征信报告获取的个人基本信息、信用交易信息、公共信息、特别记录数据;所述埋点数据包括有埋点时采集的设备行为数据和日志数据,其中设备行为数据包括有登录本平台的次数、点击次数、点击频率、输入总耗时及平均耗时、手机号数据、GPS位置、MAC地址、IP地址数据、地理信息申请频次、IP的申请频次、设备电量占比、陀螺仪的平均加速度,所述日志数据包括有7天内登录次数、首次点击到申请授信时长、一天内最多的session数、申请授信前一周的行为统计;并且合规要求下,不限于获取移动互联网行为数据、贷款APP内行为数据、信贷历史、运营商数据在内的全域多维度大数据。
4.根据权利要求1所述的一种基于AFSA-ELM的信用评估方法,其特征在于:所述S2中利用最大最小法将特征值中选出的有用的字段进行归一化处理,把所有数据都转化为[0,1]之间的数值,取消各维数据间的数量级差别,采用离差(Min-Max)标准化法来对数值归一化处理将其映射到[0,1]区间,Min-Max标准化的公式如下:
Figure FDA0002708400980000021
其中,x'是归一化后的值,xmin是特征中的最小值,xmax是特征中的最大值,x为特征的初始值。
对归一化后的数据集根据申请时间按照7:3比例切分为训练集和测试集。
5.根据权利要求1所述的一种基于AFSA-ELM的信用评估方法,其特征在于:所述S3中在根据所述根据训练集构建ELM模型,初始化神经网络参数,所述ELM是一种单隐层前向神经网络,通过利用Moore-Penrose广义逆求解网络权重,随机产生输入层与隐层间的连接权值及隐层节点的阈值,在训练过程中无需调整,只需要设置隐层节点的个数,便可以获得唯一的最优解,ELM具有网络结构简单,学习速度快,泛化性能好等优点。
6.根据权利要求5所述的一种基于AFSA-ELM的信用评估方法,其特征在于:所述ELM的训练可分为以下几个步骤:
S31:确定神经网络模型的输入层、输出层及隐层的结构,
给定N个不同样本的集合N={(xi,yi)|i=1,2,…,N;xi∈Rn;yi∈Rm},根据研究,隐层节点个数n和输入、输出节点个数存在以下关系:
Figure FDA0002708400980000031
其中,m、l分别为ELM输入、输出节点的个数,a为常数,通常取1~10;
S32、给定训练集T={(x1,y1),…,(xj,yj),…,(xn,yn)},其中,xj∈Rn,yj∈R,j=1,…,N,xj是一个n维向量;具有n个隐层节点的输出矩阵H的表达式为:
H=g(WXT+b)
其中,输入层与所述隐层由权值W连接,隐层与输出层由权值β连接,b为隐层节点的阈值,W、β、b表达式如下:
Figure FDA0002708400980000032
S33:求解隐层到输出层的连接权重
神经网络的输出值为:
P=(HTβ)
其中,β是隐层到输出层的权值矩阵,H是隐层节点的输出矩阵,
对于给定的训练输出样本Y=(y1,y2,…,yn),用输出样本替代网络输出值,则权值矩阵β求解公式如下:
Figure FDA0002708400980000033
其解为:
Figure FDA0002708400980000034
其中,(HT)+表示转置矩阵HT的Moore-Penrose广义逆;
则具有n个隐层节点的ELM输出可表示为:
Figure FDA0002708400980000035
其中,wj=[w1j,w2j,…,wnj]为连接第j个隐层节点的输入权值向量;bj为第j个隐层节点的阈值;βj=[βj1j2,…,βjm]T为连接第j个隐层节点的输出权值向量;wj·xi为wj与xi的内积;g(x)为隐层节点的激活函数。
7.根据权利要求1所述的一种基于AFSA-ELM的信用评估方法,其特征在于:所述S4中利用AFSA算法优化ELM的初始输入层权值矩阵W和隐层阈值矩阵b,提高ELM模型的拟合精度,获取最优ELM模型,基于AFSA优化ELM的步骤包括:
S41:将ELM的初始权值W和阈值b赋给人工鱼群算法参数
将训练数据输入ELM,再将ELM的初始权值W和阈值b作为人工鱼群算法的参数,随机产生人工鱼的初始群体:选取N条人工鱼构成人工鱼群,其中每个人工鱼都是D维向量,包括代表ELM的输入权值ωij、输出权值ωio、输入节点阈值bki和输出节点阈值bko
S42:人工鱼群的位置寻优
设置某一条人工鱼的当前位置向量X和在某一时刻视点所在的位置向量
Figure FDA0002708400980000041
当前位置向量该人工鱼的视野范围为visual,若视点处的食物浓度高于当前位置的食物浓度,则向视点方向移动一步,到达位置Xnext;若视点处的食物浓度不比当前位置的食物浓度高,则返回继续寻找视野内的其他位置,直到到达位置Xnext,该过程可以表示为:
xi=xi+visual·r,i=1,2,…,n
Figure FDA0002708400980000042
其中,r为[-1,1]之间均匀分布的随机数,visual是人工鱼的视野范围,Step是人工鱼的步长;
S43:定义人工鱼群的食物浓度
将ELM的均方误差的倒数作为人工鱼群的食物浓度,也就是适应度函数,计算公式如下:
Figure FDA0002708400980000051
其中,fitness为人工鱼当前位置的食物浓度,N为人工鱼群的人工鱼样本总数,R为输出节点数,
Figure FDA0002708400980000052
为输出节点s在样本p作用时输出,Ys p为在样本p作用时输出节点s的目标值;
S44:全局寻优确定ELM初始权值W和阈值b
各代人工鱼的状态根据它的状态函数随觅食、聚群变化而变化,不断迭代直至达到最大迭代次数,对迭代过程中采用十折交叉验证法计算预测结果的均方误差,食物浓度函数不再增加时,根据全局最优确定ELM初始权值W和阈值b,得到基于AFSA-ELM的信用评估预测模型。
8.根据权利要求1所述的一种基于AFSA-ELM的信用评估方法,其特征在于:所述S5中将以均方根误差为指标,与遗传算法、粒子群算法、蚁群算法优化的ELM模型的进行对比,预测值和真实值之间的均方根误差计算公式如下:
Figure FDA0002708400980000053
其中,RMSE是预测值和真实值之间的均方根误差,n是输出训练样本的个数,i表示输出训练样本的序号,yi是第i个输出训练样本的预测值,yi′是第i个输出训练样本的实际值。
9.根据权利要求1所述的一种基于AFSA-ELM的信用评估方法,其特征在于:所述S6中将AFSA-ELM的信用评分模型部署至申请平台输出实时申请信用评分,实现申请客户的实时审批,并定期将有表现数据输入到模型训练,实现模型的在线更新。
10.根据权利要求7所述的一种基于AFSA-ELM的信用评估方法,其特征在于:所述S42中引入引入调整因子g(k),k=1,2,…,n,调整第k+1和第k次视野和步长的关系,调整因子g(k)计算公式如下:
Figure FDA0002708400980000061
其中,g(k)为调整因子,值域为[0,1],m为调整因子的调整幅度,k为当前迭代次数,n为迭代总次数,
g(k)随着迭代次数的增加,对视野内的食物状态了解越全面,逐步减小人工鱼群的视野和步长,在最优解附近区域后进行精细搜索,由全局搜索逐步演化为局部搜索,提高局部搜索能力,能加快算法的收敛速度和精确度;
通过加入调整因子,改进人工鱼群的视野范围和步长,调整方式如下式:
Figure FDA0002708400980000062
其中,visualk+1和visualk分别为第k+1和第k次搜索视野,Stepk+1和Stepk分别为第k+1和第k次搜索步长,visualmin为视野最小值、Stepmin为步长最小值,g(k)为调整因子。
CN202011047318.7A 2020-09-29 2020-09-29 一种基于afsa-elm的信用评估方法 Pending CN112348655A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011047318.7A CN112348655A (zh) 2020-09-29 2020-09-29 一种基于afsa-elm的信用评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011047318.7A CN112348655A (zh) 2020-09-29 2020-09-29 一种基于afsa-elm的信用评估方法

Publications (1)

Publication Number Publication Date
CN112348655A true CN112348655A (zh) 2021-02-09

Family

ID=74361268

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011047318.7A Pending CN112348655A (zh) 2020-09-29 2020-09-29 一种基于afsa-elm的信用评估方法

Country Status (1)

Country Link
CN (1) CN112348655A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113268913A (zh) * 2021-06-24 2021-08-17 广州鼎泰智慧能源科技有限公司 一种基于pso-elm算法的智能建筑空调冷机系统运行优化方法
CN113922366A (zh) * 2021-10-08 2022-01-11 广东电网有限责任公司广州供电局 一种电力系统等值惯性常数辨识方法及其相关装置
CN114626304A (zh) * 2022-03-21 2022-06-14 齐鲁工业大学 一种矿浆铜品位在线预测软测量建模方法
CN116910449A (zh) * 2023-07-12 2023-10-20 上海虹港数据信息有限公司 一种人工智能算力的运算应用平台

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105160437A (zh) * 2015-09-25 2015-12-16 国网浙江省电力公司 基于极限学习机的负荷模型预测方法
CN105243259A (zh) * 2015-09-02 2016-01-13 上海大学 基于极限学习机的脉动风速快速预测方法
CN106786499A (zh) * 2016-11-10 2017-05-31 南京信息工程大学 基于改进afsa优化elm的短期风电功率预测方法
CN109818798A (zh) * 2019-02-19 2019-05-28 上海海事大学 一种融合kpca和elm的无线传感器网络入侵检测系统及方法
CN109886097A (zh) * 2019-01-10 2019-06-14 杭州电子科技大学 一种基于人工鱼群优化h-elm的疲劳驾驶检测方法
CN110175707A (zh) * 2019-05-13 2019-08-27 东南大学 基于数据继承思想的电力系统暂态频率预测模型更新方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105243259A (zh) * 2015-09-02 2016-01-13 上海大学 基于极限学习机的脉动风速快速预测方法
CN105160437A (zh) * 2015-09-25 2015-12-16 国网浙江省电力公司 基于极限学习机的负荷模型预测方法
CN106786499A (zh) * 2016-11-10 2017-05-31 南京信息工程大学 基于改进afsa优化elm的短期风电功率预测方法
CN109886097A (zh) * 2019-01-10 2019-06-14 杭州电子科技大学 一种基于人工鱼群优化h-elm的疲劳驾驶检测方法
CN109818798A (zh) * 2019-02-19 2019-05-28 上海海事大学 一种融合kpca和elm的无线传感器网络入侵检测系统及方法
CN110175707A (zh) * 2019-05-13 2019-08-27 东南大学 基于数据继承思想的电力系统暂态频率预测模型更新方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
QQ_26091271: ""BP神经网络(经验公式)"", 《HTTPS://BLOG.CSDN.NET/QQ_26091271/ARTICLE/DETAILS/74852633》 *
思绪无限: ""极限学习机(ELM)从原理到程序实现"", 《HTTPS://BLOG.CSDN.NET/QQ_32892383/ARTICLE/DETAILS/90760481》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113268913A (zh) * 2021-06-24 2021-08-17 广州鼎泰智慧能源科技有限公司 一种基于pso-elm算法的智能建筑空调冷机系统运行优化方法
CN113268913B (zh) * 2021-06-24 2022-02-11 广州鼎泰智慧能源科技有限公司 一种基于pso-elm算法的智能建筑空调冷机系统运行优化方法
CN113922366A (zh) * 2021-10-08 2022-01-11 广东电网有限责任公司广州供电局 一种电力系统等值惯性常数辨识方法及其相关装置
CN114626304A (zh) * 2022-03-21 2022-06-14 齐鲁工业大学 一种矿浆铜品位在线预测软测量建模方法
CN114626304B (zh) * 2022-03-21 2024-02-27 齐鲁工业大学 一种矿浆铜品位在线预测软测量建模方法
CN116910449A (zh) * 2023-07-12 2023-10-20 上海虹港数据信息有限公司 一种人工智能算力的运算应用平台

Similar Documents

Publication Publication Date Title
CN112348655A (zh) 一种基于afsa-elm的信用评估方法
CN112581263A (zh) 一种基于灰狼算法优化广义回归神经网络的信用评估方法
CN112037012A (zh) 一种基于pso-bp神经网络的互联网金融信用评价方法
CN112581262A (zh) 一种基于鲸鱼算法优化lvq神经网络的欺诈行为检测方法
CN112037011A (zh) 一种基于foa-rbf神经网络的信用评分方法
Messaoudi et al. A multi-objective bat algorithm for community detection on dynamic social networks
CN110084610B (zh) 一种基于孪生神经网络的网络交易欺诈检测系统
CN102651088B (zh) 基于A_Kohonen神经网络的恶意代码分类方法
CN113379536A (zh) 一种基于引力搜索算法优化递归神经网络的违约概率预测方法
CN112529685A (zh) 一种基于bas-fnn的贷款用户信用评级方法及系统
CN112215446A (zh) 一种基于神经网络的单位动态火灾风险评估方法
CN112529683A (zh) 一种基于cs-pnn的客户信贷风险的评估方法及系统
CN113239638A (zh) 一种基于蜻蜓算法优化多核支持向量机的逾期风险预测方法
CN110472840A (zh) 一种基于神经网络技术的农业水利调度方法及系统
CN112581264A (zh) 一种基于蝗虫算法优化mlp神经网络的信用风险预测方法
CN113407864A (zh) 一种基于混合注意力网络的群组推荐方法
WO2023207013A1 (zh) 一种基于图嵌入的关系图谱关键人员分析方法及系统
CN111988786B (zh) 一种基于高维多目标分解算法的传感器网络覆盖方法及系统
CN115660147A (zh) 一种基于传播路径间与传播路径内影响力建模的信息传播预测方法及系统
CN116415177A (zh) 一种基于极限学习机的分类器参数辨识方法
CN116362329A (zh) 一种融合参数优化的集群联邦学习方法及设备
CN114708479B (zh) 一种基于图结构和特征的自适应防御方法
CN110109005B (zh) 一种基于序贯测试的模拟电路故障测试方法
CN117893807B (zh) 基于知识蒸馏的联邦自监督对比学习图像分类系统及方法
CN110852435A (zh) 一种基于神经进化计算模型

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210209