CN112634019A - 基于细菌觅食算法优化灰色神经网络的违约概率预测方法 - Google Patents

基于细菌觅食算法优化灰色神经网络的违约概率预测方法 Download PDF

Info

Publication number
CN112634019A
CN112634019A CN202011536762.5A CN202011536762A CN112634019A CN 112634019 A CN112634019 A CN 112634019A CN 202011536762 A CN202011536762 A CN 202011536762A CN 112634019 A CN112634019 A CN 112634019A
Authority
CN
China
Prior art keywords
neural network
data
bacteria
model
grey
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011536762.5A
Other languages
English (en)
Inventor
江远强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baiweijinke Shanghai Information Technology Co ltd
Original Assignee
Baiweijinke Shanghai Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baiweijinke Shanghai Information Technology Co ltd filed Critical Baiweijinke Shanghai Information Technology Co ltd
Priority to CN202011536762.5A priority Critical patent/CN112634019A/zh
Publication of CN112634019A publication Critical patent/CN112634019A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Human Resources & Organizations (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Technology Law (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于细菌觅食算法优化灰色神经网络的违约概率预测方法,包括以下的步骤:首先,选取有还款或逾期表现的客户作为建模样本,获取客户信用数据;对信用数据进行预处理,随机切分训练集和测试集;根据建模样本的数据特征构建灰色神经网络拓扑结构,确定网络的参数,初始化灰色神经网络的权值和偏置;构建灰色神经网络的权值偏置与细菌觅食算法的映射关系,通过细菌觅食算法得到最优权值和偏置,并使用训练集对灰色神经网络进行训练;本发明利用细菌觅食算法确定了循环神经网络最优的权值和偏置,加快了神经网络的收敛速度,并提高了预测模型的准度,可满足互联网金融信用实时评估的需求。

Description

基于细菌觅食算法优化灰色神经网络的违约概率预测方法
技术领域
本发明涉及互联网金融行业的风控技术领域,具体为基于细菌觅食算法优化灰色神经网络的违约概率预测方法。
背景技术
随着互联网金融的发展,消费信贷业务不断扩展,对贷款申请人的违约概率预测的重要性日益加强。违约概率分析是对信贷申请者的准确信用评估可帮助信贷平台有效规避违约概率。
近年来,逻辑回归、贝叶斯网络、支持向量机和决策树等机器学习算法都被应用于个人违约概率分析,但这些传统的算法预测精度有限。贝叶斯网络等方法多依赖于专家经验,带有主观性;SVM算法借助二次规划,适用于小样本、高维模式识别,在大规模样本中难以实施;BP神经网络具有较强的非线性拟合能力,但其精度依赖于大规模样本,因此,对基于细菌觅食算法优化灰色神经网络的违约概率预测方法的需求日益增长。
灰色神经网络(Grey Neural Network,GNN)是一种融合灰色模型和BP神经网络的混合模型,思路是将将灰色模型微分方程的解映射到BP神经网络,然后通过神经网络的训练得到微分方程的系数,进而使用该微分方程进行数据预测。灰色神经网络结合了灰色模型有效处理小样本量,弱化系统随机性的能力与BP神经网络具有的自我学习、非线性映射的拟合能力,具有所需样本量小、学习能力强、容错性好、鲁棒性和预测精度高等优点。
但灰色神经网络的初始权值和偏置存在很大的随机化,网络在训练时容易陷入局部最优,无法进一步进行调整相关参数,导致模型收敛速度慢、预测精度不高和稳定性差等问题。目前对灰色神经网络初始参数的选择较为广泛的智能优化算法主要有遗传算法、粒子群算法、蚁群算法等,但都有其各自的局限性和不足。如何确定灰色神经网络的最佳初始权值和阀值,是提高灰色神经网络性能的关键,因此,针对上述问题提出基于细菌觅食算法优化灰色神经网络的违约概率预测方法。
发明内容
本发明的目的在于提供基于细菌觅食算法优化灰色神经网络的违约概率预测方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于细菌觅食算法优化灰色神经网络的违约概率预测方法,包括以下六个步骤:
S1、采集一定比例数量的正常和逾期还款客户作为建模样本,并采集建模样本的客户账户注册个人基本信息、监测软件中获取操作行为埋点数据作为信用数据,还款表现做标签化处理;
S2、数据预处理,对信用数据进行信息提取、预处理和归一化,去除不规则数据和填补缺失数据,将数据组按照7:3比例随机划分为训练集和测试集;
S3、根据建模样本的数据特征,构建灰色神经网络拓扑结构,确定网络的参数,初始化灰色神经网络的权值和偏置;
S4、构建灰色神经网络的权值偏置与细菌觅食算法的映射关系,通过细菌觅食算法得到最优权值和偏置赋给灰色神经网络,使用训练集对灰色神经网络进行训练;
S5、将测试集输入训练好的灰色神经网络模型进行测试,验证模型的准确性,并以模型精度评价指标与遗传算法、粒子群算法优化的模型进行对比与评价;
S6、将灰色神经网络模型部署至申请平台,获取实时申请客户的数据并将作为待测样本导入预测模型中输出违约概率预测结果,实现申请客户的实时审批,并定期将有表现数据输入到模型训练,实现模型的在线更新。
优选的,在S1中,从互联网金融平台后端根据贷后表现选取一定比例和数量正常还款和逾期客户作为建模样本,采集样本客户账户注册申请时的个人基本信息、监测软件中获取操作行为埋点数据。其中用户的个人申请信息包括:手机号、学历、婚姻状况、工作单位、住址、联系人信息;所述埋点数据包括埋点时采集的设备行为数据和日志数据,其中设备行为数据包括:登录本平台的次数、点击次数、点击频率、输入总耗时及平均耗时、手机号数据、GPS位置、MAC地址、IP地址数据、地理信息申请频次、IP的申请频次、设备电量占比、陀螺仪的平均加速度,另外日志数据包括:7天内登录次数、首次点击到申请授信时长、一天内最多的session数、申请授信前一周的行为统计等。另外在合规要求下,不限于获取移动互联网行为数据、贷款APP内行为数据、信贷历史、运营商数据在内的全域多维度大数据。
优选的,在S2中,首先,结合常识和统计学规律对于原始数据进行预处理,剔除错误数据;其次,由于神经网络复杂,网络对于输入数据比较敏感以及输入数据有着不同的单位和取值范围,各神经网络的激活函数、学习规则不同,在进行灰色神经网络模型预测前,需先对数据进行归一化处理,计算公式如下:
Figure BDA0002853290220000031
其中,xmax为样本数据中的最大值;xmin为样本数据中的最小值;归一化后结果
Figure BDA0002853290220000032
的取值范围为[-1,1]。
优选的,在S3中,灰色神经网络(Grey Neural Network,GNN)是一种融合灰色模型和BP神经网络的混合模型,思路是将色模型微分方程的解映射到BP神经网络,当网络收敛时,从训练好的网络中提取出相应的连接权值系数,计算相应的系数a和bi(i=1,2,…,n-1)从而得到一个白化的微分方程,进而利用此微分方程对系统进行数据预测。具体步骤如下:
S31、确定灰色神经网络的拓扑结构,初始化灰色神经网络的权值和偏置
根据选定的训练样本,构建灰色神经网络模型,初始灰色神经网络结构,确定输入维数、隐含层层数与神经元个数、输出维数,以此算出需要优化的权值和偏置的数目,确定输入层到隐含层的激活函数,输出层传递函数。
本专利将灰色模型的输出序列作为神经网络的输入序列,即串联方式。设原始数据序列为:
X(0)={x(0)(1),x(0)(2),…,x(0)(n)}
X(0)经过累加生成后得到新的数据序列X(1),此时X(1)呈指数增长,数据序列的分布规律经变换后变强,可通过微分方程、函数预测或进行数据拟合。
S32、建立灰色神经网络模型的微分方程
若记X(0)为x(t),X(1)为y(t),其预测结果用z(t)表示,将累加生成的数列建立微分方程,得到n个参数对应的灰色神经网络模型的微分方程:
Figure BDA0002853290220000041
其中,y1为输出参数;y2,y3,…,yn为输入参数;a,b1,…,bn-1为微分方程的系数,可根据训练样本对微分方程的系数a,b1,b2,…,bn-1进行初始化赋值。
预测结果用z(t)表示为:
Figure BDA0002853290220000042
令:
Figure BDA0002853290220000043
其中,y2(t),…,yn(t)为输入到网络中建立模型关于时间的一系列变化参数;
则预测结果可由上式推出:
Figure BDA0002853290220000044
S33、微分方程映射到BP神经网络
将上式映射到一个BP神经网络中,就得到一个具有n个输入,1个输出的灰色神经网络,所述的灰色神经网络分为4层:LA、LB、LC、LD分别为输入层、隐含层1、隐含层2、输出层。
Figure BDA0002853290220000051
根据微分方程的初始化系数a,b1,…,bn-1计算μ12,…,μn-1
则神经网络的各初始权值可表示为:
ω11=a;
ω21=-y1(0);ω22=u1;ω23=u2;…;ω2n=un-1
ω31=ω32=…=ω3n=1+e-at
其中,ω11表示LA层到LB层的连接权值;ω212223,…,ω2n表示LB层到LC层的连接权值;ω3132,…,ω3n表示LC层到LD层的连接权值;y1为最终预测值。
根据a、μ12,…,μn-1可计算得到网络的连接权值ω2223,…,ω2n、ω3132,…,ω3n
S34、网络输出
对每一输入序列(t,y(t)),t=1,2,3,…,n,计算每层输出:
LA输出:a=ω11t
LB输出:
Figure BDA0002853290220000052
LC输出:c1=bω21,c2=y2(t)bω22,c3=y3(t)bω23,…,cn=yn(t)bω2n
LD输出,即网络输出:
Figure BDA0002853290220000053
其中,θ表示LD层输出节点的偏置,表示为:
θ=(1+e-at)(d-y1(0))
S35、调整权值和偏置
计算网络预测输出与期望输出的误差:
LD层误差:δ=(d-y1(t))2
LC层误差:
Figure BDA0002853290220000061
LB层误差:
Figure BDA0002853290220000062
然后,根据误差调整权值和偏置:
调整LB到LC的权值:
w21=-y1(0),w22=w221δ2b,…,w2n=w2nn-1δnb
其中,μi表示第二层与第三层的第i+1个节点之间权值调节系数;
调整LA到LB的连接权值:
w11=w11-atδn+1
调整LD层输出节点的偏置θ:
Figure BDA0002853290220000063
S36、判断LD层误差δ是否大于预设的期望误差值,若大于,则返回S32,继续训练,否则训练结束;将待检测数据输入到已经训练好的灰色神经网络中,得到LD层的输出,即是预测值。
但灰色神经网络的初始权值和偏置存在很大的随机化,网络在训练时容易陷入局部最优,无法进一步进行调整相关参数,导致模型收敛速度慢、预测精度不高和稳定性差等问题。目前对灰色神经网络初始参数的选择较为广泛的智能优化算法主要有遗传算法、粒子群算法、蚁群算法等,但都有其各自的局限性和不足。如何确定灰色神经网络的最佳初始权值和阀值,是提高灰色神经网络性能的关键。因灰色神经网络的初始权值与偏置由a,b1,…,bn-1等n个参数确定,即优化a,bi模型参数即可优化灰色神经网络的连接权值和偏置。
优选的,在S4中,细菌觅食算法(Bacterial Foraging Optimization,BFO)是模拟大肠杆菌觅食行为的一种智能优化算法,其基本原理是根据大肠杆菌本身的纤毛和细菌间的相互影响来完成信息交换,通过趋化、繁殖和迁移操作使细菌向营养浓度较高的地方移动,达到寻找食物(参数最优解)的目的。
初始细菌觅食算法参数,随机生成灰色神经网络各个结点连接的权值和节点偏置,并对生成的各个灰色神经网络进行编码,使之对应于细菌觅食算法中的细菌个体,最终形成算法的初始群体,初始群体形成之后对群体中每个个体进行寻优处理,最终输出当前最优个体。具体步骤如下:
S41、初始化细菌算法参数,与灰色神经网络参数编码映射
设置细菌群体数目S,趋化循环约定次数Nc、繁殖循环约定次数Nre、迁徙操作循环约定次数Ned、迁移概率Ped、趋化过程中的步长sp、最大前进步数Ns,以及种群细菌之间传递信号的影响值Jcc中的4个参数。
根据样本的输入输出数据确定灰色神经网络的结构,以及待白化参数a和bi(i=1,2,…,n-1),从而确定每个细菌的编码方式个体编码形式为Bi=(a,b1,b2,…,bn-1),n为每个样本的维度。
S42、趋化行为
在趋化过程中,细菌是通过翻转和游动两个基本动作向食物密集区靠近的,翻转是指细菌改变方向并移动单位步长的动作,细菌翻转后若适应值得到改善,则继续沿该方向移动若干步,直到适应值不再改善或者达到规定偏置为止,这一过程即为游动。细菌的每一次趋化活动可以表示成:
Xi(j+1,k,l)=Xi(j,k,l)+R×sp×φ(i)
Figure BDA0002853290220000071
其中,Xi(j,k,l)代表第i细菌在第j次趋化行为、第k次繁殖行为及第l次迁徙行为时所处的位置;φ(i)表示细菌随机翻转的方向;Xrand(j,k,l)为当前个体Xi(j,k,l)领域内的一个随机位置;R为[0,1]内的随机数;sp为任意方向翻滚的步长。
合理的选择步长sp可以提高算法的收敛速度,本专利利用高斯分布来动态调整从而提高算法的邻域搜索能力:
Sp=0.01·|Gauss|·(SU-SL)
其中,Gauss(·)是由均值为零的高斯概率分布函数产生的随机数;SU和SL表示搜索空间的上下限。
通过趋化行为,细菌在任意方向进行交替翻滚和游动搜寻食物,使得每个细菌在其自身邻域内进行搜索,可获得连续局部寻优的能力。
S43、繁殖活动
当整体细菌的趋向运动结束后,进入繁殖阶段,繁殖阶段遵循自然界“优胜劣汰,适者生存”的原则,将一个生命周期内每个细菌的适应值累加和作为细菌的能量Jhealth(i),细菌的能量函数表达式如下:
Figure BDA0002853290220000081
其中,J为能量函数;Nc为最大趋向次数;第i细菌在第j次趋化行为、第k次繁殖行为及第l次迁徙行为。
将所有S个细菌按照能量Jhealth(i)由高到低进行排序,能量较高的前Sr=S/2个细菌保留下来,并且其中每一个细菌复制成两个细菌,子细菌拥有和母细菌相同的位置及步长特征;能量较低的后Sr=S/2个细菌死亡。繁殖过程结束后,细菌总数保持不变。通过繁殖活动可加快细菌的寻优速度。
S44、迁移活动
繁殖活动结束后,细菌开始进行迁徙活动,迁移活动模拟了细菌随水流迁移到新环境的生物现象。在生命周期内已获得能量大小进行概率迁移,能量大的迁移概率小,能量小的迁移概率大,迁移概率采用轮盘赌选择机制。
给定迁徙概率Ped,对某个体细菌产生[0,1]的随机数r,若r<Ped,则该个体细菌死亡,并随机产生一个新细菌取代当前细菌;否则,该个体保持不变,转向下一个个体,直到遍历完种群中所有的个体为止。
迁移活动提高了细菌算法后期的细菌群体多样性,有利于跳出局部最优解和寻找全局最优解,使算法具有较好的收敛性。
S45、确定适应度函数
确定灰色神经网络的输出数据与该测试数据组对应的目标输出之间的均方误差为细菌觅食算法的适应度函数,适应度函数表达式如下:
Figure BDA0002853290220000091
其中,S为样本量;m为神经网络输出节点数;yj为第j个节点的输出预测值;oj为第j个节点的实际输出值。
S46、重复迭代
不断执行趋向行为、繁殖行为和迁移行为,当执行次数均达到预定次数后,则满足终止条件,对完成三种行为评估后剩下的细菌进行适应度值的比较,选出适应度值最大的细菌。
S47、训练灰色神经网络
将适应度最高解个体进行反向解码,得到灰色神经网络参数(a,b1,b2,…,bn-1)的值,随之得到灰色神经网络的初始权值和阀值。然后将训练样本输入训练调整灰色神经网络的权值和偏置,直到达到最大迭代次数或小于给定误差。
优选的,在S5中,将测试集输入训练好的灰色神经网络模型进行测试,验证模型的预测精度,若未达到设定预测精度则重新计算灰色神经网络的初始连接权值和初始隐藏层偏置,并再次进行预测,如此反复迭代,直至达到精度要求,输出最优的灰色神经网络违约概率预测模型。
优选的,在S5中,为了评价模型预测能力及模型的稳定性,以预测样本的平均相对误差百分比(MREP),平均绝对误差(MAE)评判模型的性能并进行对比。平均相对误差百分比(MREP)及平均绝对误差(MAE)的计算公式如下:
Figure BDA0002853290220000101
Figure BDA0002853290220000102
其中,n为预测样本的个数,y′i为相应模型的预测结果,yi为样本实际输出结果。
对比遗传算法和粒子群算法优化的模型可以看出,细菌觅食算法优化后灰色神经网络模型计算的RMSE和MAE更低,预测模型的准确性和稳定性更高。
优选的,在S6中,将灰色神经网络模型部署至申请平台,获取实时申请客户的数据并将作为待测样本导入预测模型中输出违约概率预测结果,实现申请客户的实时审批,并定期将有表现数据输入到模型训练,实现模型的在线更新。
与现有技术相比,本发明的有益效果是:
1、本发明中,相对于BP、RBF和SOM神经网络神经网络,灰色神经网络结合了灰色模型有效处理小样本量,弱化系统随机性的能力与BP神经网络具有的自我学习、非线性映射的拟合能力,具有所需样本量小、学习能力强、容错性好、鲁棒性和预测精度高等优点。
2、本发明中,与其他智能优化算法相比,细菌觅食算法具有群体智能算法并行搜索、易跳出局部极小值等优点,具有收敛速度快且在进行优化过程中不需要优化对象梯度信息的特点。
3、本发明中,本发明采用细菌觅食算法优化灰色神经网络,克服了目前常用方法中预测精度不高和效率不好的缺点,可以有效避免计算量大、耗时长、需要的训练样本个数多、输出的预测结果容易陷入局部最小从而预报精度不高等问题。
附图说明
图1为本发明流程图。
具体实施方式
请参阅图1,本发明提供一种技术方案:
基于细菌觅食算法优化灰色神经网络的违约概率预测方法,包括以下六个步骤:
S1、采集一定比例数量的正常和逾期还款客户作为建模样本,并采集建模样本的客户账户注册个人基本信息、监测软件中获取操作行为埋点数据作为信用数据,还款表现做标签化处理;
S2、数据预处理,对信用数据进行信息提取、预处理和归一化,去除不规则数据和填补缺失数据,将数据组按照7:3比例随机划分为训练集和测试集;
S3、根据建模样本的数据特征,构建灰色神经网络拓扑结构,确定网络的参数,初始化灰色神经网络的权值和偏置;
S4、构建灰色神经网络的权值偏置与细菌觅食算法的映射关系,通过细菌觅食算法得到最优权值和偏置赋给灰色神经网络,使用训练集对灰色神经网络进行训练;
S5、将测试集输入训练好的灰色神经网络模型进行测试,验证模型的准确性,并以模型精度评价指标与遗传算法、粒子群算法优化的模型进行对比与评价;
S6、将灰色神经网络模型部署至申请平台,获取实时申请客户的数据并将作为待测样本导入预测模型中输出违约概率预测结果,实现申请客户的实时审批,并定期将有表现数据输入到模型训练,实现模型的在线更新。
在S1中,从互联网金融平台后端根据贷后表现选取一定比例和数量正常还款和逾期客户作为建模样本,采集样本客户账户注册申请时的个人基本信息、监测软件中获取操作行为埋点数据。其中用户的个人申请信息包括:手机号、学历、婚姻状况、工作单位、住址、联系人信息;所述埋点数据包括埋点时采集的设备行为数据和日志数据,其中设备行为数据包括:登录本平台的次数、点击次数、点击频率、输入总耗时及平均耗时、手机号数据、GPS位置、MAC地址、IP地址数据、地理信息申请频次、IP的申请频次、设备电量占比、陀螺仪的平均加速度,另外日志数据包括:7天内登录次数、首次点击到申请授信时长、一天内最多的session数、申请授信前一周的行为统计等。另外在合规要求下,不限于获取移动互联网行为数据、贷款APP内行为数据、信贷历史、运营商数据在内的全域多维度大数据。
在S2中,首先,结合常识和统计学规律对于原始数据进行预处理,剔除错误数据;其次,由于神经网络复杂,网络对于输入数据比较敏感以及输入数据有着不同的单位和取值范围,各神经网络的激活函数、学习规则不同,在进行灰色神经网络模型预测前,需先对数据进行归一化处理,计算公式如下:
Figure BDA0002853290220000121
其中,xmax为样本数据中的最大值;xmin为样本数据中的最小值;归一化后结果
Figure BDA0002853290220000122
的取值范围为[-1,1]。
在S3中,灰色神经网络(Grey Neural Network,GNN)是一种融合灰色模型和BP神经网络的混合模型,思路是将色模型微分方程的解映射到BP神经网络,当网络收敛时,从训练好的网络中提取出相应的连接权值系数,计算相应的系数a和bi(i=1,2,…,n-1)从而得到一个白化的微分方程,进而利用此微分方程对系统进行数据预测。具体步骤如下:
S31、确定灰色神经网络的拓扑结构,初始化灰色神经网络的权值和偏置
根据选定的训练样本,构建灰色神经网络模型,初始灰色神经网络结构,确定输入维数、隐含层层数与神经元个数、输出维数,以此算出需要优化的权值和偏置的数目,确定输入层到隐含层的激活函数,输出层传递函数。
本专利将灰色模型的输出序列作为神经网络的输入序列,即串联方式。设原始数据序列为:
X(0)={x(0)(1),x(0)(2),…,x(0)(n)}
X(0)经过累加生成后得到新的数据序列X(1),此时X(1)呈指数增长,数据序列的分布规律经变换后变强,可通过微分方程、函数预测或进行数据拟合。
S32、建立灰色神经网络模型的微分方程
若记X(0)为x(t),X(1)为y(t),其预测结果用z(t)表示,将累加生成的数列建立微分方程,得到n个参数对应的灰色神经网络模型的微分方程:
Figure BDA0002853290220000131
其中,y1为输出参数;y2,y3,…,yn为输入参数;a,b1,…,bn-1为微分方程的系数,可根据训练样本对微分方程的系数a,b1,b2,…,bn-1进行初始化赋值。
预测结果用z(t)表示为:
Figure BDA0002853290220000132
令:
Figure BDA0002853290220000133
其中,y2(t),…,yn(t)为输入到网络中建立模型关于时间的一系列变化参数;
则预测结果可由上式推出:
Figure BDA0002853290220000134
S33、微分方程映射到BP神经网络
将上式映射到一个BP神经网络中,就得到一个具有n个输入,1个输出的灰色神经网络,所述的灰色神经网络分为4层:LA、LB、LC、LD分别为输入层、隐含层1、隐含层2、输出层。
Figure BDA0002853290220000141
根据微分方程的初始化系数a,b1,…,bn-1计算μ12,…,μn-1
则神经网络的各初始权值可表示为:
ω11=a;
ω21=-y1(0);ω22=u1;ω23=u2;…;ω2n=un-1
ω31=ω32=…=ω3n=1+e-at
其中,ω11表示LA层到LB层的连接权值;ω212223,…,ω2n表示LB层到LC层的连接权值;ω3132,…,ω3n表示LC层到LD层的连接权值;y1为最终预测值。
根据a、μ12,…,μn-1可得到网络的连接权值ω2223,…,ω2n、ω3132,…,ω3n进行计算。
S34、网络输出
对每一输入序列(t,y(t)),t=1,2,3,…,n,计算每层输出:
LA输出:a=ω11t
LB输出:
Figure BDA0002853290220000142
LC输出:c1=bω21,c2=y2(t)bω22,c3=y3(t)bω23,…,cn=yn(t)bω2n
LD输出,即网络输出:
Figure BDA0002853290220000143
其中,θ表示LD层输出节点的偏置,表示为:
θ=(1+e-at)(d-y1(0))
S35、调整权值和偏置
计算网络预测输出与期望输出的误差:
LD层误差:δ=(d-y1(t))2
LC层误差:
Figure BDA0002853290220000151
LB层误差:
Figure BDA0002853290220000152
根据误差调整权值和偏置:
调整LB到LC的权值:
w21=-y1(0),w22=w221δ2b,…,w2n=w2nn-1δnb
其中,μi表示第二层与第三层的第i+1个节点之间权值调节系数;
调整LA到LB的连接权值:
w11=w11-atδn+1
调整LD层输出节点的偏置θ:
Figure BDA0002853290220000153
S36、判断LD层误差δ是否大于预设的期望误差值,若大于,则返回S32,继续训练,否则训练结束;将待检测数据输入到已经训练好的灰色神经网络中,得到LD层的输出,即是预测值。
但灰色神经网络的初始权值和偏置存在很大的随机化,网络在训练时容易陷入局部最优,无法进一步进行调整相关参数,导致模型收敛速度慢、预测精度不高和稳定性差等问题。目前对灰色神经网络初始参数的选择较为广泛的智能优化算法主要有遗传算法、粒子群算法、蚁群算法等,但都有其各自的局限性和不足。如何确定灰色神经网络的最佳初始权值和阀值,是提高灰色神经网络性能的关键。因灰色神经网络的初始权值与偏置由a,b1,…,bn-1等n个参数确定,即优化a,bi模型参数即可优化灰色神经网络的连接权值和偏置。
在S4中,细菌觅食算法(Bacterial Foraging Optimization,BFO)是模拟大肠杆菌觅食行为的一种智能优化算法,其基本原理是根据大肠杆菌本身的纤毛和细菌间的相互影响来完成信息交换,通过趋化、繁殖和迁移操作使细菌向营养浓度较高的地方移动,达到寻找食物(参数最优解)的目的。
初始细菌觅食算法参数,随机生成灰色神经网络各个结点连接的权值和节点偏置,并对生成的各个灰色神经网络进行编码,使之对应于细菌觅食算法中的细菌个体,最终形成算法的初始群体,初始群体形成之后对群体中每个个体进行寻优处理,最终输出当前最优个体。具体步骤如下:
S41、初始化细菌算法参数,与灰色神经网络参数编码映射
设置细菌群体数目S,趋化循环约定次数Nc、繁殖循环约定次数Nre、迁徙操作循环约定次数Ned、迁移概率Ped、趋化过程中的步长sp、最大前进步数Ns,以及种群细菌之间传递信号的影响值Jcc中的4个参数。
根据样本的输入输出数据确定灰色神经网络的结构,以及待白化参数a和bi(i=1,2,…,n-1),从而确定每个细菌的编码方式个体编码形式为Bi=(a,b1,b2,…,bn-1),n为每个样本的维度;
S42、趋化行为
在趋化过程中,细菌是通过翻转和游动两个基本动作向食物密集区靠近的,翻转是指细菌改变方向并移动单位步长的动作,细菌翻转后若适应值得到改善,则继续沿该方向移动若干步,直到适应值不再改善或者达到规定偏置为止,这一过程即为游动。细菌的每一次趋化活动可以表示成:
Xi(j+1,k,l)=Xi(j,k,l)+R×sp×φ(i)
Figure BDA0002853290220000161
其中,Xi(j,k,l)代表第i细菌在第j次趋化行为、第k次繁殖行为及第l次迁徙行为时所处的位置;φ(i)表示细菌随机翻转的方向;Xrand(j,k,l)为当前个体Xi(j,k,l)领域内的一个随机位置;R为[0,1]内的随机数;sp为任意方向翻滚的步长。
合理的选择步长sp可以提高算法的收敛速度,本专利利用高斯分布来动态调整从而提高算法的邻域搜索能力:
Sp=0.01·|Gauss|·(SU-SL)
其中,Gauss(·)是由均值为零的高斯概率分布函数产生的随机数;SU和SL表示搜索空间的上下限。
通过趋化行为,细菌在任意方向进行交替翻滚和游动搜寻食物,使得每个细菌在其自身邻域内进行搜索,可获得连续局部寻优的能力。
S43、繁殖活动
当整体细菌的趋向运动结束后,进入繁殖阶段,繁殖阶段遵循自然界“优胜劣汰,适者生存”的原则,将一个生命周期内每个细菌的适应值累加和作为细菌的能量Jhealth(i),细菌的能量函数表达式如下:
Figure BDA0002853290220000171
其中,J为能量函数;Nc为最大趋向次数;第i细菌在第j次趋化行为、第k次繁殖行为及第l次迁徙行为。
将所有S个细菌按照能量Jhealth(i)由高到低进行排序,能量较高的前Sr=S/2个细菌保留下来,并且其中每一个细菌复制成两个细菌,子细菌拥有和母细菌相同的位置及步长特征;能量较低的后Sr=S/2个细菌死亡。繁殖过程结束后,细菌总数保持不变。通过繁殖活动可加快细菌的寻优速度。
S44、迁移活动
繁殖活动结束后,细菌开始进行迁徙活动,迁移活动模拟了细菌随水流迁移到新环境的生物现象。在生命周期内已获得能量大小进行概率迁移,能量大的迁移概率小,能量小的迁移概率大,迁移概率采用轮盘赌选择机制。
给定迁徙概率Ped,对某个体细菌产生[0,1]的随机数r,若r<Ped,则该个体细菌死亡,并随机产生一个新细菌取代当前细菌;否则,该个体保持不变,转向下一个个体,直到遍历完种群中所有的个体为止。
迁移活动提高了细菌算法后期的细菌群体多样性,有利于跳出局部最优解和寻找全局最优解,使算法具有较好的收敛性。
S45、确定适应度函数
确定灰色神经网络的输出数据与该测试数据组对应的目标输出之间的均方误差为细菌觅食算法的适应度函数,适应度函数表达式如下:
Figure BDA0002853290220000181
其中,S为样本量;m为神经网络输出节点数;yj为第j个节点的输出预测值;oj为第j个节点的实际输出值。
S46、重复迭代
不断执行趋向行为、繁殖行为和迁移行为,当执行次数均达到预定次数后,则满足终止条件,对完成三种行为评估后剩下的细菌进行适应度值的比较,选出适应度值最大的细菌。
S47、训练灰色神经网络
将适应度最高解个体进行反向解码,得到灰色神经网络参数(a,b1,b2,…,bn-1)的值,随之得到灰色神经网络的初始权值和阀值。然后将训练样本输入训练调整灰色神经网络的权值和偏置,直到达到最大迭代次数或小于给定误差,有利于输出符合精度的预测结果。
在S5中,将测试集输入训练好的灰色神经网络模型进行测试,验证模型的预测精度,若未达到设定预测精度则重新计算灰色神经网络的初始连接权值和初始隐藏层偏置,并再次进行预测,如此反复迭代,直至达到精度要求,输出最优的灰色神经网络违约概率预测模型,这种设置通过迭代方式提升精确度。
在S5中,为了评价模型预测能力及模型的稳定性,以预测样本的平均相对误差百分比(MREP),平均绝对误差(MAE)评判模型的性能并进行对比。平均相对误差百分比(MREP)及平均绝对误差(MAE)的计算公式如下:
Figure BDA0002853290220000191
Figure BDA0002853290220000192
其中,n为预测样本的个数,y′i为相应模型的预测结果,yi为样本实际输出结果。
对比遗传算法和粒子群算法优化的模型可以看出,细菌觅食算法优化后灰色神经网络模型计算的RMSE和MAE更低,预测模型的准确性和稳定性更高。
在S6中,将灰色神经网络模型部署至申请平台,获取实时申请客户的数据并将作为待测样本导入预测模型中输出违约概率预测结果,实现申请客户的实时审批,并定期将有表现数据输入到模型训练,实现模型的在线更新。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实例的说明只是用于帮助理解本发明的方法及其核心思想。以上所述仅是本发明的优选实施方式,应当指出,由于文字表达的有限性,而客观上存在无限的具体结构,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进、润饰或变化,也可以将上述技术特征以适当的方式进行组合;这些改进润饰、变化或组合,或未经改进将发明的构思和技术方案直接应用于其它场合的,均应视为本发明的保护范围。

Claims (8)

1.一种基于细菌觅食算法优化灰色神经网络的违约概率预测方法,其特征在于,包括以下六个步骤:
S1、采集一定比例数量的正常和逾期还款客户作为建模样本,并采集建模样本的客户账户注册个人基本信息、监测软件中获取操作行为埋点数据作为信用数据,还款表现做标签化处理;
S2、数据预处理,对信用数据进行信息提取、预处理和归一化,去除不规则数据和填补缺失数据,将数据组按照7:3比例随机划分为训练集和测试集;
S3、根据建模样本的数据特征,构建灰色神经网络拓扑结构,确定网络的参数,初始化灰色神经网络的权值和偏置;
S4、构建灰色神经网络的权值偏置与细菌觅食算法的映射关系,通过细菌觅食算法得到最优权值和偏置赋给灰色神经网络,使用训练集对灰色神经网络进行训练;
S5、将测试集输入训练好的灰色神经网络模型进行测试,验证模型的准确性,并以模型精度评价指标与遗传算法、粒子群算法优化的模型进行对比与评价;
S6、将灰色神经网络模型部署至申请平台,获取实时申请客户的数据并将作为待测样本导入预测模型中输出违约概率预测结果,实现申请客户的实时审批,并定期将有表现数据输入到模型训练,实现模型的在线更新。
2.根据权利要求1所述的基于细菌觅食算法优化灰色神经网络的违约概率预测方法,其特征在于,在S1中,从互联网金融平台后端根据贷后表现选取一定比例和数量正常还款和逾期客户作为建模样本,采集样本客户账户注册申请时的个人基本信息、监测软件中获取操作行为埋点数据。其中用户的个人申请信息包括:手机号、学历、婚姻状况、工作单位、住址、联系人信息;所述埋点数据包括埋点时采集的设备行为数据和日志数据,其中设备行为数据包括:登录本平台的次数、点击次数、点击频率、输入总耗时及平均耗时、手机号数据、GPS位置、MAC地址、IP地址数据、地理信息申请频次、IP的申请频次、设备电量占比、陀螺仪的平均加速度,另外日志数据包括:7天内登录次数、首次点击到申请授信时长、一天内最多的session数、申请授信前一周的行为统计等。另外在合规要求下,不限于获取移动互联网行为数据、贷款APP内行为数据、信贷历史、运营商数据在内的全域多维度大数据。
3.根据权利要求1所述的基于细菌觅食算法优化灰色神经网络的违约概率预测方法,其特征在于,在S2中,首先,结合常识和统计学规律对于原始数据进行预处理,剔除错误数据;其次,由于神经网络复杂,网络对于输入数据比较敏感以及输入数据有着不同的单位和取值范围,各神经网络的激活函数、学习规则不同,在进行灰色神经网络模型预测前,需先对数据进行归一化处理,计算公式如下:
Figure FDA0002853290210000021
其中,xmax为样本数据中的最大值;xmin为样本数据中的最小值;归一化后结果
Figure FDA0002853290210000022
的取值范围为[-1,1]。
4.根据权利要求1所述的基于细菌觅食算法优化灰色神经网络的违约概率预测方法,其特征在于,在S3中,灰色神经网络(GreyNeuralNetwork,GNN)是一种融合灰色模型和BP神经网络的混合模型,思路是将色模型微分方程的解映射到BP神经网络,当网络收敛时,从训练好的网络中提取出相应的连接权值系数,计算相应的系数a和bi(i=1,2,…,n-1)从而得到一个白化的微分方程,进而利用此微分方程对系统进行数据预测。具体步骤如下:
S31、确定灰色神经网络的拓扑结构,初始化灰色神经网络的权值和偏置
根据选定的训练样本,构建灰色神经网络模型,初始灰色神经网络结构,确定输入维数、隐含层层数与神经元个数、输出维数,以此算出需要优化的权值和偏置的数目,确定输入层到隐含层的激活函数,输出层传递函数。
本专利将灰色模型的输出序列作为神经网络的输入序列,即串联方式。设原始数据序列为:
X(0)={x(0)(1),x(0)(2),…,x(0)(n)}
X(0)经过累加生成后得到新的数据序列X(1),此时X(1)呈指数增长,数据序列的分布规律经变换后变强,可通过微分方程、函数预测或进行数据拟合。
S32、建立灰色神经网络模型的微分方程
若记X(0)为x(t),X(1)为y(t),其预测结果用z(t)表示,将累加生成的数列建立微分方程,得到n个参数对应的灰色神经网络模型的微分方程:
Figure FDA0002853290210000031
其中,y1为输出参数;y2,y3,…,yn为输入参数;a,b1,…,bn-1为微分方程的系数,可根据训练样本对微分方程的系数a,b1,b2,…,bn-1进行初始化赋值。
预测结果用z(t)表示为:
Figure FDA0002853290210000032
令:
Figure FDA0002853290210000033
其中,y2(t),…,yn(t)为输入到网络中建立模型关于时间的一系列变化参数;
则预测结果可由上式推出:
Figure FDA0002853290210000034
S33、微分方程映射到BP神经网络
将上式映射到一个BP神经网络中,就得到一个具有n个输入,1个输出的灰色神经网络,所述的灰色神经网络分为4层:LA、LB、LC、LD分别为输入层、隐含层1、隐含层2、输出层。
Figure FDA0002853290210000041
根据微分方程的初始化系数a,b1,…,bn-1计算μ12,…,μn-1
则神经网络的各初始权值可表示为:
ω11=a;
ω21=-y1(0);ω22=u1;ω23=u2;…;ω2n=un-1
ω31=ω32=…=ω3n=1+e-at
其中,ω11表示LA层到LB层的连接权值;ω212223,…,ω2n表示LB层到LC层的连接权值;ω3132,…,ω3n表示LC层到LD层的连接权值;y1为最终预测值。
根据a、μ12,…,μn-1可计算得到网络的连接权值ω2223,…,ω2n、ω3132,…,ω3n
S34、网络输出
对每一输入序列(t,y(t)),t=1,2,3,…,n,计算每层输出:
LA输出:a=ω11t
LB输出:
Figure FDA0002853290210000042
LC输出:c1=bω21,c2=y2(t)bω22,c3=y3(t)bω23,…,cn=yn(t)bω2n
LD输出,即网络输出:
Figure FDA0002853290210000043
其中,θ表示LD层输出节点的偏置,表示为:
θ=(1+e-at)(d-y1(0))
S35、调整权值和偏置
计算网络预测输出与期望输出的误差:
LD层误差:δ=(d-y1(t))2
LC层误差:
Figure FDA0002853290210000051
LB层误差:
Figure FDA0002853290210000052
然后,根据误差调整权值和偏置:
调整LB到LC的权值:
w21=-y1(0),w22=w221δ2b,…,w2n=w2nn-1δnb
其中,μi表示第二层与第三层的第i+1个节点之间权值调节系数;
调整LA到LB的连接权值:
w11=w11-atδn+1
调整LD层输出节点的偏置θ:
Figure FDA0002853290210000053
S36、判断LD层误差δ是否大于预设的期望误差值,若大于,则返回S32,继续训练,否则训练结束。将待检测数据输入到已经训练好的灰色神经网络中,得到LD层的输出,即是预测值。
但灰色神经网络的初始权值和偏置存在很大的随机化,网络在训练时容易陷入局部最优,无法进一步进行调整相关参数,导致模型收敛速度慢、预测精度不高和稳定性差等问题。目前对灰色神经网络初始参数的选择较为广泛的智能优化算法主要有遗传算法、粒子群算法、蚁群算法等,但都有其各自的局限性和不足。如何确定灰色神经网络的最佳初始权值和阀值,是提高灰色神经网络性能的关键。因灰色神经网络的初始权值与偏置由a,b1,…,bn-1等n个参数确定,即优化a,bi模型参数即可优化灰色神经网络的连接权值和偏置。
5.根据权利要求1所述的基于细菌觅食算法优化灰色神经网络的违约概率预测方法,其特征在于,在S4中,细菌觅食算法(Bacterial Foraging Optimization,BFO)是模拟大肠杆菌觅食行为的一种智能优化算法,其基本原理是根据大肠杆菌本身的纤毛和细菌间的相互影响来完成信息交换,通过趋化、繁殖和迁移操作使细菌向营养浓度较高的地方移动,达到寻找食物(参数最优解)的目的。
初始细菌觅食算法参数,随机生成灰色神经网络各个结点连接的权值和节点偏置,并对生成的各个灰色神经网络进行编码,使之对应于细菌觅食算法中的细菌个体,最终形成算法的初始群体,初始群体形成之后对群体中每个个体进行寻优处理,最终输出当前最优个体。具体步骤如下:
S41、初始化细菌算法参数,与灰色神经网络参数编码映射
设置细菌群体数目S,趋化循环约定次数Nc、繁殖循环约定次数Nre、迁徙操作循环约定次数Ned、迁移概率Ped、趋化过程中的步长sp、最大前进步数Ns,以及种群细菌之间传递信号的影响值Jcc中的4个参数。
根据样本的输入输出数据确定灰色神经网络的结构,以及待白化参数a和bi(i=1,2,…,n-1),从而确定每个细菌的编码方式个体编码形式为Bi=(a,b1,b2,…,bn-1),n为每个样本的维度;
S42、趋化行为
在趋化过程中,细菌是通过翻转和游动两个基本动作向食物密集区靠近的,翻转是指细菌改变方向并移动单位步长的动作,细菌翻转后若适应值得到改善,则继续沿该方向移动若干步,直到适应值不再改善或者达到规定偏置为止,这一过程即为游动。细菌的每一次趋化活动可以表示成:
Xi(j+1,k,l)=Xi(j,k,l)+R×sp×φ(i)
Figure FDA0002853290210000061
其中,Xi(j,k,l)代表第i细菌在第j次趋化行为、第k次繁殖行为及第l次迁徙行为时所处的位置;φ(i)表示细菌随机翻转的方向;Xrand(j,k,l)为当前个体Xi(j,k,l)领域内的一个随机位置;R为[0,1]内的随机数;sp为任意方向翻滚的步长。
合理的选择步长sp可以提高算法的收敛速度,本专利利用高斯分布来动态调整从而提高算法的邻域搜索能力:
Sp=0.01·|Gauss|·(SU-SL)
其中,Gauss(·)是由均值为零的高斯概率分布函数产生的随机数;SU和SL表示搜索空间的上下限。
通过趋化行为,细菌在任意方向进行交替翻滚和游动搜寻食物,使得每个细菌在其自身邻域内进行搜索,可获得连续局部寻优的能力。
S43、繁殖活动
当整体细菌的趋向运动结束后,进入繁殖阶段,繁殖阶段遵循自然界“优胜劣汰,适者生存”的原则,将一个生命周期内每个细菌的适应值累加和作为细菌的能量Jhealth(i),细菌的能量函数表达式如下:
Figure FDA0002853290210000071
其中,J为能量函数;Nc为最大趋向次数;第i细菌在第j次趋化行为、第k次繁殖行为及第l次迁徙行为。
将所有S个细菌按照能量Jhealth(i)由高到低进行排序,能量较高的前Sr=S/2个细菌保留下来,并且其中每一个细菌复制成两个细菌,子细菌拥有和母细菌相同的位置及步长特征;能量较低的后Sr=S/2个细菌死亡。繁殖过程结束后,细菌总数保持不变。通过繁殖活动可加快细菌的寻优速度。
S44、迁移活动
繁殖活动结束后,细菌开始进行迁徙活动,迁移活动模拟了细菌随水流迁移到新环境的生物现象。在生命周期内已获得能量大小进行概率迁移,能量大的迁移概率小,能量小的迁移概率大,迁移概率采用轮盘赌选择机制。
给定迁徙概率Ped,对某个体细菌产生[0,1]的随机数r,若r<Ped,则该个体细菌死亡,并随机产生一个新细菌取代当前细菌;否则,该个体保持不变,转向下一个个体,直到遍历完种群中所有的个体为止。
迁移活动提高了细菌算法后期的细菌群体多样性,有利于跳出局部最优解和寻找全局最优解,使算法具有较好的收敛性。
S45、确定适应度函数
确定灰色神经网络的输出数据与该测试数据组对应的目标输出之间的均方误差为细菌觅食算法的适应度函数,适应度函数表达式如下:
Figure FDA0002853290210000081
其中,S为样本量;m为神经网络输出节点数;yj为第j个节点的输出预测值;oj为第j个节点的实际输出值。
S46、重复迭代
不断执行趋向行为、繁殖行为和迁移行为,当执行次数均达到预定次数后,则满足终止条件,对完成三种行为评估后剩下的细菌进行适应度值的比较,选出适应度值最大的细菌。
S47、训练灰色神经网络
将适应度值最高的个体进行反向解码,得到灰色神经网络参数(a,b1,b2,…,bn-1)的值,随之得到灰色神经网络的初始权值和阀值。然后将训练样本输入训练调整灰色神经网络的权值和偏置,直到达到最大迭代次数或小于给定误差。
6.根据权利要求1所述的基于细菌觅食算法优化灰色神经网络的违约概率预测方法,其特征在于,在S5中,将测试集输入训练好的灰色神经网络模型进行测试,验证模型的预测精度,若未达到设定预测精度则重新计算灰色神经网络的初始连接权值和初始隐藏层偏置,并再次进行预测,如此反复迭代,直至达到精度要求,输出最优的灰色神经网络违约概率预测模型。
7.根据权利要求1所述的基于细菌觅食算法优化灰色神经网络的违约概率预测方法,其特征在于,在S5中,为了评价模型预测能力及模型的稳定性,以预测样本的平均相对误差百分比(MREP),平均绝对误差(MAE)评判模型的性能并进行对比。平均相对误差百分比(MREP)及平均绝对误差(MAE)的计算公式如下:
Figure FDA0002853290210000091
Figure FDA0002853290210000092
其中,n为预测样本的个数,y′i为相应模型的预测结果,yi为样本实际输出结果。
对比遗传算法和粒子群算法优化的模型可以看出,细菌觅食算法优化后灰色神经网络模型计算的RMSE和MAE更低,预测模型的准确性和稳定性更高。
8.根据权利要求1所述的基于细菌觅食算法优化灰色神经网络的违约概率预测方法,其特征在于,在S6中,将灰色神经网络模型部署至申请平台,获取实时申请客户的数据并将作为待测样本导入预测模型中输出违约概率预测结果,实现申请客户的实时审批,并定期将有表现数据输入到模型训练,实现模型的在线更新。
CN202011536762.5A 2020-12-23 2020-12-23 基于细菌觅食算法优化灰色神经网络的违约概率预测方法 Pending CN112634019A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011536762.5A CN112634019A (zh) 2020-12-23 2020-12-23 基于细菌觅食算法优化灰色神经网络的违约概率预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011536762.5A CN112634019A (zh) 2020-12-23 2020-12-23 基于细菌觅食算法优化灰色神经网络的违约概率预测方法

Publications (1)

Publication Number Publication Date
CN112634019A true CN112634019A (zh) 2021-04-09

Family

ID=75321475

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011536762.5A Pending CN112634019A (zh) 2020-12-23 2020-12-23 基于细菌觅食算法优化灰色神经网络的违约概率预测方法

Country Status (1)

Country Link
CN (1) CN112634019A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113379536A (zh) * 2021-06-29 2021-09-10 百维金科(上海)信息科技有限公司 一种基于引力搜索算法优化递归神经网络的违约概率预测方法
CN113538125A (zh) * 2021-06-29 2021-10-22 百维金科(上海)信息科技有限公司 一种基于萤火虫算法优化Hopfield神经网络的风险评级方法
CN113642624A (zh) * 2021-08-05 2021-11-12 厦门大学 移动通信网络故障的智能诊断方法及装置
CN116761179A (zh) * 2023-07-14 2023-09-15 青岛科技大学 基于轻量化MS-Net的移动TAS-EH系统安全通信性能智能预测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150254766A1 (en) * 2014-03-05 2015-09-10 Marc Abramowitz System and method for generating a dynamic credit risk rating for a debt security
CN105095587A (zh) * 2015-08-04 2015-11-25 莆田学院 基于细菌觅食算法的微生物发酵优化方法
CN105321000A (zh) * 2015-11-06 2016-02-10 重庆科技学院 基于bp神经网络与mobfoa算法的铝电解工艺参数优化方法
CN109948771A (zh) * 2019-03-25 2019-06-28 西北大学 一种基于细菌觅食优化bp神经网络的态势评估算法
CN112037012A (zh) * 2020-08-14 2020-12-04 百维金科(上海)信息科技有限公司 一种基于pso-bp神经网络的互联网金融信用评价方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150254766A1 (en) * 2014-03-05 2015-09-10 Marc Abramowitz System and method for generating a dynamic credit risk rating for a debt security
CN105095587A (zh) * 2015-08-04 2015-11-25 莆田学院 基于细菌觅食算法的微生物发酵优化方法
CN105321000A (zh) * 2015-11-06 2016-02-10 重庆科技学院 基于bp神经网络与mobfoa算法的铝电解工艺参数优化方法
CN109948771A (zh) * 2019-03-25 2019-06-28 西北大学 一种基于细菌觅食优化bp神经网络的态势评估算法
CN112037012A (zh) * 2020-08-14 2020-12-04 百维金科(上海)信息科技有限公司 一种基于pso-bp神经网络的互联网金融信用评价方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
刘丽丽: "改进的细菌觅食算法", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 *
周雅兰: "细菌觅食优化算法的研究与应用", 《计算机工程与应用》 *
王小川等: "《MATLAB神经网络43个案例分析》", 31 August 2013, 北京航天航空大学出版社 *
许国根等: "《最优化方法及其MATLAB实现》", 31 July 2018, 北京航空航天大学出版社 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113379536A (zh) * 2021-06-29 2021-09-10 百维金科(上海)信息科技有限公司 一种基于引力搜索算法优化递归神经网络的违约概率预测方法
CN113538125A (zh) * 2021-06-29 2021-10-22 百维金科(上海)信息科技有限公司 一种基于萤火虫算法优化Hopfield神经网络的风险评级方法
CN113642624A (zh) * 2021-08-05 2021-11-12 厦门大学 移动通信网络故障的智能诊断方法及装置
CN116761179A (zh) * 2023-07-14 2023-09-15 青岛科技大学 基于轻量化MS-Net的移动TAS-EH系统安全通信性能智能预测方法
CN116761179B (zh) * 2023-07-14 2024-04-30 青岛科技大学 基于轻量化MS-Net的移动发射天线选择和能量收集TAS-EH系统安全通信性能智能预测方法

Similar Documents

Publication Publication Date Title
Han et al. A survey on metaheuristic optimization for random single-hidden layer feedforward neural network
CN112634019A (zh) 基于细菌觅食算法优化灰色神经网络的违约概率预测方法
Chandra Competition and collaboration in cooperative coevolution of Elman recurrent neural networks for time-series prediction
CN106411896B (zh) 基于apde-rbf神经网络的网络安全态势预测方法
Harpham et al. A review of genetic algorithms applied to training radial basis function networks
CN112581263A (zh) 一种基于灰狼算法优化广义回归神经网络的信用评估方法
CN113538125A (zh) 一种基于萤火虫算法优化Hopfield神经网络的风险评级方法
Jiang et al. Design of structural modular neural networks with genetic algorithm
CN110363286A (zh) 神经网络模型的生成方法及装置
CN112581262A (zh) 一种基于鲸鱼算法优化lvq神经网络的欺诈行为检测方法
CN112581264A (zh) 一种基于蝗虫算法优化mlp神经网络的信用风险预测方法
CN114373101A (zh) 基于进化策略的神经网络架构搜索的图像分类方法
CN112163671A (zh) 一种新能源场景生成方法及系统
Hu et al. Adaptive exploration strategy with multi-attribute decision-making for reinforcement learning
Valdez et al. Parallel genetic algorithms for optimization of Modular Neural Networks in pattern recognition
CN113379536A (zh) 一种基于引力搜索算法优化递归神经网络的违约概率预测方法
CN109408896A (zh) 一种污水厌氧处理产气量多元智能实时监控方法
Lizhe et al. BP network model optimized by adaptive genetic algorithms and the application on quality evaluation for class teaching
de Souza et al. Applying correlation to enhance boosting technique using genetic programming as base learner
CN115906959A (zh) 基于de-bp算法的神经网络模型的参数训练方法
CN112132259B (zh) 神经网络模型输入参量降维方法及计算机可读存储介质
CN111414927A (zh) 一种海水水质评价的方法
Chandra Multi-objective cooperative neuro-evolution of recurrent neural networks for time series prediction
Hung et al. The partial solutions consideration based self-adaptive evolutionary algorithm: A learning structure of neuro-fuzzy networks
CN112348656A (zh) 一种基于ba-wnn的个人贷款信用评分方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210409