CN112529685A - 一种基于bas-fnn的贷款用户信用评级方法及系统 - Google Patents

一种基于bas-fnn的贷款用户信用评级方法及系统 Download PDF

Info

Publication number
CN112529685A
CN112529685A CN202011358348.XA CN202011358348A CN112529685A CN 112529685 A CN112529685 A CN 112529685A CN 202011358348 A CN202011358348 A CN 202011358348A CN 112529685 A CN112529685 A CN 112529685A
Authority
CN
China
Prior art keywords
layer
data
longicorn
fuzzy
fnn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011358348.XA
Other languages
English (en)
Inventor
江远强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baiweijinke Shanghai Information Technology Co ltd
Original Assignee
Baiweijinke Shanghai Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baiweijinke Shanghai Information Technology Co ltd filed Critical Baiweijinke Shanghai Information Technology Co ltd
Priority to CN202011358348.XA priority Critical patent/CN112529685A/zh
Publication of CN112529685A publication Critical patent/CN112529685A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/043Architecture, e.g. interconnection topology based on fuzzy logic, fuzzy membership or fuzzy inference, e.g. adaptive neuro-fuzzy inference systems [ANFIS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Automation & Control Theory (AREA)
  • Computational Mathematics (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及互联网金融行业的风控技术领域,尤其为一种基于BAS‑FNN的贷款用户信用评级方法及系统,与其他神经网络相比,模糊神经网络汇集了模糊理论与神经网络的优点,集学习、联想、识别、自适应及模糊信息处理于一体,具有计算简便、容错能力强、处理信息范围大、学习速度快、收敛速度快、稳定性好、精度高等优点;与遗传算法、粒子群算法、蚁群算法和果蝇算法等诸多智能优化算法相比,天牛须算法在未知函数的具体形式和梯度信息的条件下即能自动寻求最优结果,优化时只需要一个个体,运算量小,可以大大提高运行效率;用天牛须算法优化的模糊神经网络模型解决了传统模糊神经网络稳定性差、训练时间长、收敛速度慢、随机初始化易陷入局部最优的问题。

Description

一种基于BAS-FNN的贷款用户信用评级方法及系统
技术领域
本发明属于互联网金融行业的风控技术领域,具体提供一种天牛须(BAS)算法优化模糊神经网络(FNN)的信用风险预测方法和系统。
背景技术
近年来在互联网金融信用评估方面,人工神经网络(ArtificialNeuralNetwork,ANN)已经被证明是表现不错的研究模型。人工神经网络是模模仿大脑的信息处理模型,通过并行神经网络的建模来实现非线性模型的拟合,具备自学习能力和联系存储能力,人工干涉较少,精度较高。目前在信用评估应用中大多采用的是BP神经网络、RBF神经网络。然而,这两种神经网络在处理数据进行预测时存在各种不足:BP神经网络是基于梯度下降算法的,存在局部极小、鲁棒性不高等缺陷;RBF神经网络属于静态前馈网络,对处理动态时间建模问题存在不足,不能满足金融信用评估需要。
模糊神经网络(FuzzyNeuralNetwork,FNN)由模糊逻辑和神经网络结合而成,既有神经网络的大规模并行处理能力、自学习能力和自适应能力,又可以处理模糊信息,完成模糊推理功能,性能优越,在应用于系统建模和预测等方面具有特别的优势。
但FNN的常规学习方法是BP算法,BP算法对网络的参数非常敏感,容易陷入局部极值、收敛速度慢等无法克服的缺陷,其中模糊化层的初始隶属度函数中心m和隶属度函数宽度b、去模糊化层与输出层之间的连接权值w等参数等对系统性能存在很大影响。针对于参数优化问题,现有常见的有遗传算法(GA)、粒子群算法(PSO)、蚁群算法(ACO)和果蝇算法(FOA)等,但它们在目标问题的性质、参数调整、计算时间等方面还存在一些局限性。如何寻找一种计算精度高,抗干扰能力强,模型结构自动更新和优化,推广性能好的模糊神经网络与群智能寻优的方法,成为一个研究的重点。
发明内容
本发明的目的在于提供一种基于BAS-FNN的贷款用户信用评级方法及系统,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于BAS-FNN的贷款用户信用评级方法及系统,包括步骤:
S1:构造样本数据,从互联网金融平台后端根据贷后表现选取一定比例和数量正常还款和逾期客户作为建模样本,采集样本客户账户注册申请时的个人基本信息、监测软件中获取操作行为埋点数据;
S2:将采集到的数据进行数据清洗,去除数据异常点,补齐数据缺失点,并对数据进行归一化处理,获取归一化处理结果信息,并按照7:3的比例切分成训练集和测试集;
S3:构建模糊神经网络,初定模糊神经网络结构及参数;
S4:在训练集样本上利用BAS算法对FNN模型进行参数优化得到BAS-FNN预测模型;
S5:将用于测试验证的数据导入已经训练完成的优化模型中进行测试,通过均方根误差对其进行评价,来验证该优化模型的优劣并得到优化完成后的系统模型;
S6:将离线训练后的BAS-FNN模型部署至申请平台,将线上实时申请用户数据归一化后对用户信用评级。
优选的,在S1中,从互联网金融平台后端根据贷后表现选取一定比例和数量正常还款和逾期客户作为建模样本,采集样本客户账户注册申请时的个人基本信息、监测软件中获取操作行为埋点数据。其中用户的个人申请信息包括:手机号、学历、婚姻状况、工作单位、住址、联系人信息,征信报告获取的个人基本信息、信用交易信息、公共信息、特别记录数据;所述埋点数据包括埋点时采集的设备行为数据和日志数据,其中设备行为数据包括:登录本平台的次数、点击次数、点击频率、输入总耗时及平均耗时、手机号数据、GPS位置、MAC地址、IP地址数据、地理信息申请频次、IP的申请频次、设备电量占比、陀螺仪的平均加速度,另外日志数据包括:7天内登录次数、首次点击到申请授信时长、一天内最多的session数、申请授信前一周的行为统计等。另外在合规要求下,不限于获取移动互联网行为数据、贷款APP内行为数据、信贷历史、运营商数据在内的全域多维度大数据。
优选的,在S2中,在神经网络输入量中,由于各个输入量的单位不同,其数量级相差较大;若采用直接输入量输入,则会使得神经元训练饱和,因此在输入训练之前,必须对数据进行归一化处理,通过归一化处理将数据转化到神经网络模型接受的(0,1)范围的数据值,归一化的计算公式如下:
Figure BDA0002803289120000031
其中,
Figure BDA0002803289120000032
为归一化后的数据,Dmax为训练样本集的最大值,Dmin为训练样本集的最小值,Di为数据本身。
将归一化后的训练样本重构,分别得到输入矩阵X和对应的输出矩Y,并根据申请时间按照比例7:3切分为训练集和测试集。
优选的,在S3中,所构建的模糊神经网络包括五层,由输入至输出分别为输入层、模糊化层、模糊推理层、去模糊化层和输出层,具体如下:
步骤3-1:输入层
第一层是输入层,本层的每个节点分别与每个输入量xi连接,作用是将输入变量X=[x1,x2,…,xk]T传递到第二层,输入层神经元个数N1与输入变量个数k相同,即N1=k;
步骤3-2:模糊化层
第二层为模糊化层,该层每一个节点将输入层的输入向量通过隶属度函数进行转化,实现输入变量的模糊化处理和模糊概念的定量描述,该层是用来计算每个输入变量的隶属度,选用高斯函数作为模型的隶属度函数,输入变量xi的隶属度μij表示如下:
Figure BDA0002803289120000041
其中,i=1,2,…,k,j=1,2,…,mi,mi为第i个输入输入量xi的模糊集分割数,mij为隶属度函数中心,即第i个输入节点数据到本层第j个模糊神经元非线性变换的连接权;bij为隶属度函数宽度,控制本层第j个模糊神经元非线性变化范围的参数;输入变量的模糊子集完全由参数mij和bij决定。
模糊化层的节点数
Figure BDA0002803289120000042
步骤3-3:模糊推理层
第三层为模糊推理层,该层每个神经元代表一条模糊规则,隶属度输入代表规则的前件,推理采用模糊蕴含乘积推理计算每条模糊规则的适用度,该层采用隶属度的乘积作为每条规则的相关适用度vj,计算公式如下:
Figure BDA0002803289120000043
其中,uij表示第i个输入输入量xi的第j个隶属度,j1=1,2,…,m1,j2=1,2,…,m2,…,jk=1,2,…,mk,j=1,2,…,m,模糊推理层节点数
Figure BDA0002803289120000044
步骤3-4:去模糊化层
第四层为去模糊化层,该层进行去模糊化操作,计算所有规则的输出之后,并进行归一化处理,计算公式如下:
Figure BDA0002803289120000045
其中,j=1,2,…,m,去模糊化层节点数N4=N3
步骤3-5:输出层
第五层为输出层,输出层也相当于模糊逻辑中的反模糊化器,实现的是解模糊化计算,该层节点与所有第四层的规则节点连接,并将第四层规则适用度作为第四层与第五层的连接权值,得出模糊神经网络的输出结果为:
Figure BDA0002803289120000051
其中,yi表示第五层第i个节点的输出值,i=1,2,…,n;wij表示第四层第j个节点对第五层第i个节点的输入值,即连接权值。
优选的,在S3所述模糊神经网络的常规学习方法是BP算法,但BP算法具有对初始权向量非常敏感,需要对初始参数进行优化,需要优化的参数有:第二层中隶属度函数中心m、隶属度函数宽度b、第四层与第五层之间的连接权值w。
优选的,在S4中,采用天牛须算法对模糊神经网络的隶属度函数中心m、隶属度函数宽度b、第四层与第五层之间的连接权值w进行寻优,构建BAS-FNN分类器,具体步骤如下:
步骤4-1:初始化天牛参数
初始化天牛参数,天牛质心到两须的距离d0,初始迭代次数t=0,最大迭代次数t=tmax,天牛个体在k维解空间中的位置为X=(x1,x2,…,xk),位置向量x的元素是模糊化层的初始隶属度函数中心m和隶属度函数宽度b、去模糊化层与输出层之间的连接权值w的组合,即x={w,m,b};
步骤4-2:创建天牛须朝向的随机向量
天牛初始位置x0设置为大小在[-1,1]之间的k维随机向量,由于天牛头的朝向随机,所以生成随机k维单位向量来表示天牛左须指向右须的向量做归一化处理,计算公式如下:
Figure BDA0002803289120000052
其中,rands(k,1)表示为生成k维的随机函数,为了方便计算,一般取右须为天牛的朝向,k为空间维数。
步骤4-3:创建天牛左右须空间坐标
天牛左右两条须的位置表达式为:
Figure BDA0002803289120000061
其中,t=0,1,...,tmax是迭代次数,,Xrt、Xlt分别为天牛的右须和左须第t次迭代时的位置坐标,d0为两须之间的距离,
Figure BDA0002803289120000062
是步骤4-2天牛左须指向右须的随机向量;
步骤4-4:确定适应度函数f(·)
数据的平均绝对误差(MAE)可以更好地反映预测值与实际值的误差,设定测试样本MAE作为适应度评价函数,计算公式如下:
Figure BDA0002803289120000063
其中,N为训练样本数,
Figure BDA0002803289120000064
和yi分别表示第i个样本预测输出和实际输出;
计算适应度函数初始值f(x0),当前最小的适应度记为fbest,天牛须搜索方向应朝向适应度函数值较小,即误差较小的一方搜索;
步骤4-5:设置步长因子δ
步长因子用于控制天牛须的搜索能力,合适的步长因子可以避免陷入局部最优解。本实施例采用线性递减权值策略确保搜索的精度,计算公式如下:
dt=eta_d·dt-1
δt=eta_δ·δt-1
其中,dt、δt分别表示第t次迭代时两须的距离和步长;eta_d为两须距离的衰减系数;eta_δ为两须步长的衰减系数,取值可根据实际应用场景灵活选择。本实施例,通过反复试验的方法最终确定初始步长δ=3,最大迭代次数tmax=100,衰减系数eta=0.95。
步骤4-6:确定左右须气味强度
更新下一步天牛个体位置,得到的xt+1不断与当前的最优位置xbest迭代更新,使天牛个体位置逐渐逼近最优目标,从而找到最优解,位置更新公式如下:
Figure BDA0002803289120000071
其中,xt表示第t次天牛的位置;δt是第t次迭代时天牛的移动步长;f(xlt)、f(xrt)分别是天牛左右须的适应度值;sign(·)为符号函数,确定天牛的下一步移动方向,sign()函数表达式为:
Figure BDA0002803289120000072
步骤4-7:得到BAS-FNN预测模型
调整天牛坐标位置,将当前适应度函数值与当前最小的fbest比较,将最优解更新为xbest和fbest,调整步长更新天牛坐标,判断迭代次数是否达到设置的最大迭代次数或者当前位置的适应度函数值是否达到设定最小值阀值,如果满足条件,迭代停止条件,得到最优解xbest和fbest,由于xbest={w,m,b}best,由xbest得到模糊神经网络最优的模糊化层的初始隶属度函数中心m和隶属度函数宽度b、去模糊化层与输出层之间的连接权值w,得到BAS-FNN预测模型。
优选的,在S5中,采用均方根误差指标来分析预测结果,如果误差较大,则重新进行训练,如果误差在允许的范围内,则BAS-FNN预测模型训练合格,均方根误差公式如下:
Figure BDA0002803289120000073
其中,σMSE为均方根误差,N为预测样本数,y(i)为网络序列的真实值,
Figure BDA0002803289120000081
为网络序列的预测结果。
优选的,将BAS算法优化FNN的信用评级模型部署至申请平台输出实时申请信用风险等级,实现申请客户的实时审批,并定期将有表现数据输入到模型训练,实现模型的在线更新。
优选的,一种基于BAS-FNN的贷款用户信用评级系统包括以下几个单元:
样本获取单元:用于获取包括个人申请信息、操作行为埋点数据和贷后还款表现作为评价结果的训练样本;
数据处理单元:对采集的数据特征提取,进行包括数据缺失补全、异常值处理和归一化;
参数优化单元:设置BAS算法相关参数并与FNN模型相结合优化的神经网络的参数,得到BAS-FNN的贷款用户信用评级预测模型;
模型训练单元:将参数优化的FNN模型在训练集上训练及在测试集上验证;
预测单元:用于训练完成的FNN模型对在线申请客户进行信用风险等级评估预测。
与现有技术相比,本发明的有益效果是:
1、本发明中,与其他神经网络相比,模糊神经网络汇集了模糊理论与神经网络的优点,集学习、联想、识别、自适应及模糊信息处理于一体,具有计算简便、容错能力强、处理信息范围大、学习速度快、收敛速度快、稳定性好、精度高等优点。
2、本发明中,与遗传算法、粒子群算法、蚁群算法和果蝇算法等诸多智能优化算法相比,天牛须算法在未知函数的具体形式和梯度信息的条件下即能自动寻求最优结果,优化时只需要一个个体,运算量小,可以大大提高运行效率。
3、本发明中,用天牛须算法优化的模糊神经网络模型解决了模糊神经网络稳定性差、训练时间长、收敛速度慢、随机初始化易陷入局部最优的问题。
附图说明
图1为本发明流程图。
具体实施方式
实施例1:
请参阅图1,本发明提供一种技术方案:
一种基于BAS-FNN的贷款用户信用评级方法及系统,包括步骤:
S1:构造样本数据,从互联网金融平台后端根据贷后表现选取一定比例和数量正常还款和逾期客户作为建模样本,采集样本客户账户注册申请时的个人基本信息、监测软件中获取操作行为埋点数据;
S2:将采集到的数据进行数据清洗,去除数据异常点,补齐数据缺失点,并对数据进行归一化处理,获取归一化处理结果信息,并按照7:3的比例切分成训练集和测试集;
S3:构建模糊神经网络,初定模糊神经网络结构及参数;
S4:在训练集样本上利用天牛须算法对模糊神经网络进行参数优化得到BAS-FNN预测模型;
S5:将用于测试验证的数据导入已经训练完成的优化模型中进行测试,通过均方根误差对其进行评价,来验证该优化模型的优劣并得到优化完成后的系统模型;
S6:将离线训练后的BAS-FNN模型部署至申请平台,将线上实时申请用户数据归一化后对用户信用评级。
在S1中,从互联网金融平台后端根据贷后表现选取一定比例和数量正常还款和逾期客户作为建模样本,采集样本客户账户注册申请时的个人基本信息、监测软件中获取操作行为埋点数据。其中用户的个人申请信息包括:手机号、学历、婚姻状况、工作单位、住址、联系人信息,征信报告获取的个人基本信息、信用交易信息、公共信息、特别记录数据;所述埋点数据包括埋点时采集的设备行为数据和日志数据,其中设备行为数据包括:登录本平台的次数、点击次数、点击频率、输入总耗时及平均耗时、手机号数据、GPS位置、MAC地址、IP地址数据、地理信息申请频次、IP的申请频次、设备电量占比、陀螺仪的平均加速度,另外日志数据包括:7天内登录次数、首次点击到申请授信时长、一天内最多的session数、申请授信前一周的行为统计等。另外在合规要求下,不限于获取移动互联网行为数据、贷款APP内行为数据、信贷历史、运营商数据在内的全域多维度大数据,这种设置有利于收集客户多方面的数据,便于后续分析,
在S2中,在神经网络输入量中,由于各个输入量的单位不同,其数量级相差较大,若采用直接输入量输入,则会使得神经元训练饱和,因此在输入训练之前,必须对数据进行归一化处理,通过归一化处理将数据转化到神经网络模型接受的(0,1)范围的数据值,归一化的计算公式如下:
Figure BDA0002803289120000101
其中,
Figure BDA0002803289120000102
为归一化后的数据,Dmax为训练样本集的最大值,Dmin为训练样本集的最小值,Di为数据本身。
将归一化后的训练样本重构,分别得到输入矩阵X和对应的输出矩Y,并根据申请时间按照比例7:3切分为训练集和测试集,这种设置有利于验证系统的精确性,
在S3中,所构建的模糊神经网络包括五层,由输入至输出分别为输入层、模糊化层、模糊推理层、去模糊化层和输出层,具体如下:
步骤3-1:输入层
第一层是输入层,本层的每个节点分别与每个输入量xi连接,作用是将输入变量X=[x1,x2,…,xk]T传递到第二层,输入层神经元个数N1与输入变量个数k相同,即N1=k;
步骤3-2:模糊化层
第二层为模糊化层,该层每一个节点将输入层的输入向量通过隶属度函数进行转化,实现输入变量的模糊化处理和模糊概念的定量描述,该层是用来计算每个输入变量的隶属度,选用高斯函数作为模型的隶属度函数,输入变量xi的隶属度μij表示如下:
Figure BDA0002803289120000111
其中,i=1,2,…,k,j=1,2,…,mi,mi为第i个输入输入量xi的模糊集分割数,mij为隶属度函数中心,即第i个输入节点数据到本层第j个模糊神经元非线性变换的连接权;bij为隶属度函数宽度,控制本层第j个模糊神经元非线性变化范围的参数;输入变量的模糊子集完全由参数mij和bij决定。
模糊化层的节点数
Figure BDA0002803289120000112
步骤3-3:模糊推理层
第三层为模糊推理层,该层每个神经元代表一条模糊规则,隶属度输入代表规则的前件,推理采用模糊蕴含乘积推理计算每条模糊规则的适用度,该层采用隶属度的乘积作为每条规则的相关适用度vj,计算公式如下:
Figure BDA0002803289120000113
其中,uij表示第i个输入输入量xi的第j个隶属度;j1=1,2,…,m1,j2=1,2,…,m2,…,jk=1,2,…,mk,j=1,2,…,m;模糊推理层节点数
Figure BDA0002803289120000114
步骤3-4:去模糊化层
第四层为去模糊化层,该层进行去模糊化操作,计算所有规则的输出之后,并进行归一化处理,计算公式如下:
Figure BDA0002803289120000121
其中,j=1,2,…,m;去模糊化层节点数N4=N3
步骤3-5:输出层
第五层为输出层,输出层也相当于模糊逻辑中的反模糊化器,实现的是解模糊化计算,该层节点与所有第四层的规则节点连接,并将第四层规则适用度作为第四层与第五层的连接权值,得出模糊神经网络的输出结果为:
Figure BDA0002803289120000122
其中,yi表示第五层第i个节点的输出值,i=1,2,…,n;wij表示第四层第j个节点对第五层第i个节点的输入值,即连接权值,这种设置有能够将推论所得到的模糊值转换为明确的控制讯号,减少人为判断,
在S3所述模糊神经网络的常规学习方法是BP算法,但BP算法具有对初始权向量非常敏感、容易陷入局部极值、收敛速度慢等缺陷,在模糊神经网络训练之前需要优化初始参数,需要优化的参数有:第二层中隶属度函数中心m、隶属度函数宽度b、第四层与第五层之间的连接权值w,这种设置提出了BP算法的局限性,并提出了优化的可能性,
在S4中,采用天牛须算法对模糊神经网络的隶属度函数中心m、隶属度函数宽度b、第四层与第五层之间的连接权值w进行寻优,构建BAS-FNN分类器,具体步骤如下:
步骤4-1:初始化天牛参数
初始化天牛参数,天牛质心到两须的距离d0,初始迭代次数t=0,最大迭代次数t=tmax,天牛个体在k维解空间中的位置为X=(x1,x2,…,xk),位置向量x的元素是模糊化层的初始隶属度函数中心m和隶属度函数宽度b、去模糊化层与输出层之间的连接权值w的组合,即x={w,m,b};
步骤4-2:创建天牛须朝向的随机向量
天牛初始位置x0设置为大小在[-1,1]之间的k维随机向量,由于天牛头的朝向随机,所以生成随机k维单位向量来表示天牛左须指向右须的向量做归一化处理,计算公式如下:
Figure BDA0002803289120000131
其中,rands(k,1)表示为生成k维的随机函数,为了方便,计算一般取右须为天牛的朝向,k为空间维数。
步骤4-3:创建天牛左右须空间坐标
天牛左右两条须的位置表达式为:
Figure BDA0002803289120000132
其中,t=0,1,...,tmax是迭代次数;Xrt、Xlt分别为天牛的右须和左须第t次迭代时的位置坐标;d0为两须之间的距离;
Figure BDA0002803289120000135
是步骤4-2天牛左须指向右须的随机向量;
步骤4-4:确定适应度函数f(·)
数据的平均绝对误差(MAE)可以更好地反映预测值与实际值的误差,设定测试样本MAE作为适应度评价函数,计算公式如下:
Figure BDA0002803289120000133
其中,N为训练样本数,
Figure BDA0002803289120000134
和yi分别表示第i个样本预测输出和实际输出;
计算适应度函数初始值f(x0),当前最小的适应度记为fbest,天牛须搜索方向应朝向适应度函数值较小,即误差较小的一方搜索;
步骤4-5:设置步长因子δ
步长因子用于控制天牛须的搜索能力,合适的步长因子可以避免陷入局部最优解。本实施例采用线性递减权值策略确保搜索的精度,计算公式如下:
dt=eta_d·dt-1
δt=eta_δ·δt-1
其中,dt、δt分别表示第t次迭代时两须的距离和步长;eta_d为两须距离的衰减系数;eta_δ为两须步长的衰减系数,取值可根据实际应用场景灵活选择。本实施例,通过反复试验的方法最终确定初始步长δ=3,最大迭代次数tmax=100,衰减系数eta=0.95。
步骤4-6:确定左右须气味强度
更新下一步天牛个体位置,得到的xt+1不断与当前的最优位置xbest迭代更新,使天牛个体位置逐渐逼近最优目标,从而找到最优解,位置更新公式如下:
Figure BDA0002803289120000141
其中,xt表示第t次天牛的位置;δt是第t次迭代时天牛的移动步长;f(xlt)、f(xrt)分别是天牛左右须的适应度值;sign(·)为符号函数,确定天牛的下一步移动方向,sign()函数表达式为:
Figure BDA0002803289120000142
步骤4-7:得到BAS-FNN预测模型
调整天牛坐标位置,将当前适应度函数值与当前最小的fbest比较,将最优解更新为xbest和fbest,调整步长更新天牛坐标,判断迭代次数是否达到设置的最大迭代次数或者当前位置的适应度函数值是否达到设定最小值阀值,如果满足条件,迭代停止条件,得到最优解xbest和fbest,由于xbest={w,m,b}best,由xbest得到FNN网络最优的模糊化层的初始隶属度函数中心m和隶属度函数宽度b、去模糊化层与输出层之间的连接权值w,得到BAS-FNN预测模型,这种设置通过天牛算法将BP算法的缺点补足,
在S5中,采用均方根误差指标来分析预测结果,如果误差较大,则重新进行训练,如果误差在允许的范围内,则BAS-FNN预测模型训练合格,均方根误差公式如下:
Figure BDA0002803289120000151
其中,σMSE为均方根误差,N为预测样本数,y(i)为网络序列的真实值,
Figure BDA0002803289120000152
为网络序列的预测结果,这种设置有利于加强分析预测结果的准确性,
将BAS算法优化FNN的信用评级模型部署至申请平台输出实时申请信用风险等级,实现申请客户的实时审批,并定期将有表现数据输入到模型训练,实现模型的在线更新,这种设置有利于实时更新,减少新的风险因素对风险等级评定系统的稳定性干扰,
一种基于BAS-FNN的贷款用户信用评级系统包括以下几个单元:
样本获取单元:用于获取包括个人申请信息、操作行为埋点数据和贷后还款表现作为评价结果的训练样本;
数据处理单元:对采集的数据特征提取,进行包括数据缺失补全、异常值处理和归一化;
参数优化单元:设置BAS算法相关参数并与FNN模型相结合优化的神经网络的参数,得到BAS-FNN的贷款用户信用评级预测模型;
模型训练单元:将参数优化的FNN模型在训练集上训练及在测试集上验证;
预测单元:用于训练完成的FNN模型对在线申请客户进行信用风险等级评估预测,这种设置能够智能化地对在线申请客户评判信用风险,减少诈骗的现象。
工作流程:本发明中,包括步骤:
S1:构造样本数据,从互联网金融平台后端根据贷后表现选取一定比例和数量正常还款和逾期客户作为建模样本,采集样本客户账户注册申请时的个人基本信息、监测软件中获取操作行为埋点数据;
S2:将采集到的数据进行数据清洗,去除数据异常点,补齐数据缺失点,并对数据进行归一化处理,获取归一化处理结果信息,并按照7:3的比例切分成训练集和测试集;
S3:构建模糊神经网络,初定模糊神经网络结构及参数;
S4:在训练集样本上利用天牛须算法对模糊神经网络进行参数优化得到BAS-FNN预测模型;
S5:将用于测试验证的数据导入已经训练完成的优化模型中进行测试,通过均方根误差对其进行评价,来验证该优化模型的优劣并得到优化完成后的系统模型;
S6:将离线训练后的BAS-FNN模型部署至申请平台,将线上实时申请用户数据归一化后对用户信用评级,
通过S1-S6步骤实现了通过人工智能对用户的输入进行大数据分析,系统自我验证结果的准确性并不断修正,实现精准判断用户信用风险等级。
实施例2与实施例1相同部分不在赘述,不同之处是:在S1中,从互联网金融平台后端根据贷后表现选取一定比例和数量正常还款和逾期客户作为建模样本,采集样本客户账户注册申请时的个人基本信息、监测软件中获取操作行为埋点数据。其中用户的个人申请信息包括:手机号、学历、婚姻状况、工作单位、住址、联系人信息,征信报告获取的个人基本信息、信用交易信息、公共信息、特别记录数据;所述埋点数据包括埋点时采集的设备行为数据和日志数据,其中设备行为数据包括:登录本平台的次数、点击次数、点击频率、输入总耗时及平均耗时、手机号数据、GPS位置、MAC地址、IP地址数据、地理信息申请频次、IP的申请频次、设备电量占比、陀螺仪的平均加速度,另外日志数据包括:7天内登录次数、首次点击到申请授信时长、一天内最多的session数、申请授信前一周的行为统计等。另外在合规要求下,不限于获取移动互联网行为数据、贷款APP内行为数据、信贷历史、运营商数据在内的全域多维度大数据,这种设置有利于收集客户多方面的数据,便于后续分析,
在S2中,在神经网络输入量中,由于各个输入量的单位不同,其数量级相差较大,若采用直接输入量输入,则会使得神经元训练饱和,因此在输入训练之前,必须对数据进行归一化处理,通过归一化处理将数据转化到神经网络模型接受的(0,1)范围的数据值,归一化的计算公式如下:
Figure BDA0002803289120000171
其中,
Figure BDA0002803289120000172
为归一化后的数据,Dmax为训练样本集的最大值,Dmin为训练样本集的最小值,Di为数据本身。
将归一化后的训练样本重构,分别得到输入矩阵X和对应的输出矩Y,并根据申请时间按照比例7:3切分为训练集和测试集,这种设置有利于验证系统的精确性,
在S3中,所构建的模糊神经网络包括五层,由输入至输出分别为输入层、模糊化层、模糊推理层、去模糊化层和输出层,具体如下:
步骤3-1:输入层
第一层是输入层,本层的每个节点分别与每个输入量xi连接,作用是将输入变量X=[x1,x2,…,xk]T传递到第二层,输入层神经元个数N1与输入变量个数k相同,即N1=k。
步骤3-2:模糊化层
第二层为模糊化层,该层每一个节点将输入层的输入向量通过隶属度函数进行转化,实现输入变量的模糊化处理和模糊概念的定量描述,该层是用来计算每个输入变量的隶属度,选用高斯函数作为模型的隶属度函数,输入变量xi的隶属度μij表示如下:
Figure BDA0002803289120000181
其中,i=1,2,…,k,j=1,2,…,mi,mi为第i个输入输入量xi的模糊集分割数,mij为隶属度函数中心,即第i个输入节点数据到本层第j个模糊神经元非线性变换的连接权;bij为隶属度函数宽度,控制本层第j个模糊神经元非线性变化范围的参数;输入变量的模糊子集完全由参数mij和bij决定。
模糊化层的节点数
Figure BDA0002803289120000182
步骤3-3:模糊推理层
第三层为模糊推理层,该层每个神经元代表一条模糊规则,隶属度输入代表规则的前件,推理采用模糊蕴含乘积推理计算每条模糊规则的适用度,该层采用隶属度的乘积作为每条规则的相关适用度vj,计算公式如下:
Figure BDA0002803289120000183
其中,uij表示第i个输入输入量xi的第j个隶属度,j1=1,2,…,m1,j2=1,2,…,m2,…,jk=1,2,…,mk,j=1,2,…,m,模糊推理层节点数
Figure BDA0002803289120000184
步骤3-4:去模糊化层
第四层为去模糊化层,该层进行去模糊化操作,计算所有规则的输出之后,并进行归一化处理,计算公式如下:
Figure BDA0002803289120000191
其中,j=1,2,…,m,去模糊化层节点数N4=N3
步骤3-5:输出层
第五层为输出层,输出层也相当于模糊逻辑中的反模糊化器,实现的是解模糊化计算,该层节点与所有第四层的规则节点连接,并将第四层规则适用度作为第四层与第五层的连接权值,得出模糊神经网络的输出结果为:
Figure BDA0002803289120000192
其中,yi表示第五层第i个节点的输出值,i=1,2,…,n;wij表示第四层第j个节点对第五层第i个节点的输入值,即连接权值,这种设置有能够将推论所得到的模糊值转换为明确的控制讯号,减少人为判断,
在S3所述模糊神经网络的常规学习方法是BP算法,但BP算法具有对初始权向量非常敏感,需要对初始参数进行优化,需要优化的参数有:第二层中隶属度函数中心m、隶属度函数宽度b、第四层与第五层之间的连接权值w,这种设置提出了BP算法的局限性,并提出了优化的可能性,
在S4中,采用天牛须算法对模糊神经网络的隶属度函数中心m、隶属度函数宽度b、第四层与第五层之间的连接权值w进行寻优,构建BAS-FNN分类器,具体步骤如下:
步骤4-1:初始化天牛参数
初始化天牛参数,天牛质心到两须的距离d0,初始迭代次数t=0,最大迭代次数t=tmax,天牛个体在k维解空间中的位置为X=(x1,x2,…,xk),位置向量x的元素是模糊化层的初始隶属度函数中心m和隶属度函数宽度b、去模糊化层与输出层之间的连接权值w组合,即x={w,m,b};
步骤4-2:创建天牛须朝向的随机向量
天牛初始位置x0设置为大小在[-1,1]之间的k维随机向量,由于天牛头的朝向随机,所以生成随机k维单位向量来表示天牛左须指向右须的向量做归一化处理,计算公式如下:
Figure BDA0002803289120000201
其中,rands(k,1)表示为生成k维的随机函数,为了方便计算,一般取右须为天牛的朝向,k为空间维数。
步骤4-3:创建天牛左右须空间坐标
天牛左右两条须的位置表达式为:
Figure BDA0002803289120000202
其中,t=0,1,...,tmax是迭代次数;Xrt、Xlt分别为天牛的右须和左须第t次迭代时的位置坐标;d0为两须之间的距离;
Figure BDA0002803289120000203
是步骤4-2天牛左须指向右须的随机向量;
步骤4-4:确定适应度函数f(·)
数据的平均绝对误差(MAE)可以更好地反映预测值与实际值的误差,设定测试样本MAE作为适应度评价函数,计算公式如下:
Figure BDA0002803289120000204
其中,N为训练样本数,
Figure BDA0002803289120000205
和yi分别表示第i个样本预测输出和实际输出;
计算适应度函数初始值f(x0),当前最小的适应度记为fbest,天牛须搜索方向应朝向适应度函数值较小,即误差较小的一方搜索;
步骤4-5:设置步长因子δ
步长因子用于控制天牛须的搜索能力,合适的步长因子可以避免陷入局部最优解。本实施例采用线性递减权值策略确保搜索的精度,计算公式如下:
dt=eta_d·dt-1
δt=eta_δ·δt-1
其中,dt、δt分别表示第t次迭代时两须的距离和步长;eta_d为两须距离的衰减系数;eta_δ为两须步长的衰减系数,取值可根据实际应用场景灵活选择。本实施例,通过反复试验的方法最终确定初始步长δ=3,最大迭代次数tmax=100,衰减系数eta=0.95。
步骤4-6:确定左右须气味强度
更新下一步天牛个体位置,得到的xt+1不断与当前的最优位置xbest迭代更新,使天牛个体位置逐渐逼近最优目标,从而找到最优解,位置更新公式如下:
Figure BDA0002803289120000211
其中,xt表示第t次天牛的位置;δt是第t次迭代时天牛的移动步长;f(xlt)、f(xrt)分别是天牛左右须的适应度值;sign(·)为符号函数,确定天牛的下一步移动方向,sign()函数表达式为:
Figure BDA0002803289120000212
步骤4-7:得到BAS-FNN预测模型
调整天牛坐标位置,将当前适应度函数值与当前最小的fbest比较,将最优解更新为xbest和fbest,调整步长更新天牛坐标,判断迭代次数是否达到设置的最大迭代次数或者当前位置的适应度函数值是否达到设定最小值阀值,如果满足条件,迭代停止条件,得到最优解xbest和fbest,由于xbest={w,m,b}best,由xbest得到模糊神经网络最优的模糊化层的初始隶属度函数中心m和隶属度函数宽度b、去模糊化层与输出层之间的连接权值w,得到BAS-FNN预测模型,这种设置通过天牛算法将BP算法的缺点补足,
在S5中,采用均方根误差指标来分析预测结果,如果误差较大,则重新进行训练,如果误差在允许的范围内,则BAS-FNN预测模型训练合格,均方根误差公式如下:
Figure BDA0002803289120000221
其中,σMSE为均方根误差,N为预测样本数,y(i)为网络序列的真实值,
Figure BDA0002803289120000222
为网络序列的预测结果,这种设置有利于加强分析预测结果的准确性,
将BAS算法优化FNN的信用评级模型部署至申请平台输出实时申请信用风险等级,实现申请客户的实时审批,并定期将有表现数据输入到模型训练,实现模型的在线更新,这种设置有利于实时更新,减少新的风险因素对风险等级评定系统的稳定性干扰,
一种基于BAS-FNN的贷款用户信用评级系统包括以下几个单元:
样本获取单元:用于获取包括个人申请信息、操作行为埋点数据和贷后还款表现作为评价结果的训练样本;
数据处理单元:对采集的数据特征提取,进行包括数据缺失补全、异常值处理和归一化;
参数优化单元:设置BAS算法相关参数并与FNN模型相结合优化的神经网络的参数,得到BAS-FNN的贷款用户信用评级预测模型;
模型训练单元:将参数优化的FNN模型在训练集上训练及在测试集上验证;
预测单元:用于训练完成的FNN模型对在线申请客户进行信用风险等级评估预测,这种设置能够智能化地对在线申请客户评判信用风险,减少诈骗的现象。
与其他神经网络相比,模糊神经网络汇集了模糊理论与神经网络的优点,集学习、联想、识别、自适应及模糊信息处理于一体,具有计算简便、容错能力强、处理信息范围大、学习速度快、收敛速度快、稳定性好、精度高等优点;与遗传算法、粒子群算法、蚁群算法和果蝇算法等诸多智能优化算法相比,天牛须算法在未知函数的具体形式和梯度信息的条件下即能自动寻求最优结果,优化时只需要一个个体,运算量小,可以大大提高运行效率;用模糊神经网络天牛须算法优化的模糊神经网络模型解决了模糊神经网络稳定性差、训练时间长、收敛速度慢、随机初始化易陷入局部最优的问题
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实例的说明只是用于帮助理解本发明的方法及其核心思想。以上所述仅是本发明的优选实施方式,应当指出,由于文字表达的有限性,而客观上存在无限的具体结构,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进、润饰或变化,也可以将上述技术特征以适当的方式进行组合;这些改进润饰、变化或组合,或未经改进将发明的构思和技术方案直接应用于其它场合的,均应视为本发明的保护范围。

Claims (9)

1.一种基于BAS-FNN的贷款用户信用评级方法及系统,其特征在于:包括步骤:
S1:构造样本数据,从互联网金融平台后端根据贷后表现选取一定比例和数量正常还款和逾期客户作为建模样本,采集样本客户账户注册申请时的个人基本信息、监测软件中获取操作行为埋点数据;
S2:将采集到的数据进行数据清洗,去除数据异常点,补齐数据缺失点,并对数据进行归一化处理,获取归一化处理结果信息,并按照7:3的比例切分成训练集和测试集;
S3:构建模糊神经网络,初定模糊神经网络结构及参数;
S4:在训练集样本上利用天牛须算法对模糊神经网络模型进行参数优化得到BAS-FNN预测模型;
S5:将用于测试验证的数据导入已经训练完成的优化模型中进行测试,通过均方根误差对其进行评价,来验证该优化模型的优劣并得到优化完成后的系统模型;
S6:将离线训练后的BAS-FNN模型部署至申请平台,将线上实时申请用户数据归一化后对用户信用评级。
2.根据权利要求1所述的一种基于BAS-FNN的贷款用户信用评级方法及系统,其特征在于:在S1中,从互联网金融平台后端根据贷后表现选取一定比例和数量正常还款和逾期客户作为建模样本,采集样本客户账户注册申请时的个人基本信息、监测软件中获取操作行为埋点数据。其中用户的个人申请信息包括:手机号、学历、婚姻状况、工作单位、住址、联系人信息,征信报告获取的个人基本信息、信用交易信息、公共信息、特别记录数据;所述埋点数据包括埋点时采集的设备行为数据和日志数据,其中设备行为数据包括:登录本平台的次数、点击次数、点击频率、输入总耗时及平均耗时、手机号数据、GPS位置、MAC地址、IP地址数据、地理信息申请频次、IP的申请频次、设备电量占比、陀螺仪的平均加速度,另外日志数据包括:7天内登录次数、首次点击到申请授信时长、一天内最多的session数、申请授信前一周的行为统计等。另外在合规要求下,不限于获取移动互联网行为数据、贷款APP内行为数据、信贷历史、运营商数据在内的全域多维度大数据。
3.根据权利要求1所述的一种基于BAS-FNN的贷款用户信用评级方法及系统,其特征在于:在S2中,在神经网络输入量中,由于各个输入量的单位不同,其数量级相差较大;若采用直接输入量输入,则会使得神经元训练饱和,因此在输入训练之前,必须对数据进行归一化处理,通过归一化处理将数据转化到神经网络模型接受的(0,1)范围的数据值,归一化的计算公式如下:
Figure FDA0002803289110000021
其中,
Figure FDA0002803289110000022
为归一化后的数据,Dmax为训练样本集的最大值,Dmin为训练样本集的最小值,Di为数据本身。
将归一化后的训练样本重构,分别得到输入矩阵X和对应的输出矩Y,并根据申请时间按照比例7:3切分为训练集和测试集。
4.根据权利要求1所述的一种基于BAS-FNN的贷款用户信用评级方法及系统,其特征在于:在S3中,所构建的模糊神经网络包括五层,由输入至输出分别为输入层、模糊化层、模糊推理层、去模糊化层和输出层,具体如下:
步骤3-1:输入层
第一层是输入层,本层的每个节点分别与每个输入量xi连接,作用是将输入变量X=[x1,x2,…,xk]T传递到第二层,输入层神经元个数N1与输入变量个数k相同,即N1=k;
步骤3-2:模糊化层
第二层为模糊化层,该层每一个节点将输入层的输入向量通过隶属度函数进行转化,实现输入变量的模糊化处理和模糊概念的定量描述,该层是用来计算每个输入变量的隶属度,选用高斯函数作为模型的隶属度函数,输入变量xi的隶属度μij表示如下:
Figure FDA0002803289110000031
其中,i=1,2,…,k,j=1,2,…,mi,mi为第i个输入输入量xi的模糊集分割数;mij为隶属度函数中心,是第i个输入节点数据到本层第j个模糊神经元非线性变换的连接权;bij为隶属度函数宽度,控制本层第j个模糊神经元非线性变化范围的参数;输入变量的模糊子集完全由参数mij和bij决定。
模糊化层的节点数
Figure FDA0002803289110000032
步骤3-3:模糊推理层
第三层为模糊推理层,该层每个神经元代表一条模糊规则,隶属度输入代表规则的前件,推理采用模糊蕴含乘积推理计算每条模糊规则的适用度,该层采用隶属度的乘积作为每条规则的相关适用度vj,计算公式如下:
Figure FDA0002803289110000033
其中,uij表示第i个输入输入量xi的第j个隶属度,j1=1,2,…,m1,j2=1,2,…,m2,…,jk=1,2,…,mk,j=1,2,…,m;模糊推理层节点数
Figure FDA0002803289110000034
步骤3-4:去模糊化层
第四层为去模糊化层,该层进行去模糊化操作,计算所有规则的输出之后,并进行归一化处理,计算公式如下:
Figure FDA0002803289110000035
其中,j=1,2,…,m;去模糊化层节点数N4=N3
步骤3-5:输出层
第五层为输出层,输出层也相当于模糊逻辑中的反模糊化器,实现的是解模糊化计算,该层节点与所有第四层的规则节点连接,并将第四层规则适用度作为第四层与第五层的连接权值,得出模糊神经网络的输出结果为:
Figure FDA0002803289110000041
其中,yi表示第五层第i个节点的输出值,i=1,2,…,n;wij表示第四层第j个节点对第五层第i个节点的输入值,即连接权值。
5.根据权利要求1所述的一种基于BAS-FNN的贷款用户信用评级方法及系统,其特征在于:在S3所述模糊神经网络的常规学习方法是BP算法,但BP算法具有对初始权向量非常敏感,需要对初始参数进行优化,需要优化的参数有:第二层中隶属度函数中心m、隶属度函数宽度b、第四层与第五层之间的连接权值w。
6.根据权利要求1所述的一种基于BAS-FNN的贷款用户信用评级方法及系统,其特征在于:在S4中,采用天牛须算法对模糊神经网络的隶属度函数中心m、隶属度函数宽度b、第四层与第五层之间的连接权值w进行寻优,构建BAS-FNN分类器,具体步骤如下:
步骤4-1:初始化天牛参数
初始化天牛参数,天牛质心到两须的距离d0,初始迭代次数t=0,最大迭代次数t=tmax,天牛个体在k维解空间中的位置为X=(x1,x2,…,xk),位置向量x的元素是模糊化层的初始隶属度函数中心m和隶属度函数宽度b、去模糊化层与输出层之间的连接权值w的组合,即x={w,m,b};
步骤4-2:创建天牛须朝向的随机向量
天牛初始位置x0设置为大小在[-1,1]之间的k维随机向量,由于天牛头的朝向随机,所以生成随机k维单位向量来表示天牛左须指向右须的向量做归一化处理,计算公式如下:
Figure FDA0002803289110000042
其中,rands(k,1)表示为生成k维的随机函数,为了方便计算,一般取右须为天牛的朝向,k为空间维数。
步骤4-3:创建天牛左右须空间坐标
天牛左右两条须的位置表达式为:
Figure FDA0002803289110000051
其中,t=0,1,…,tmax是迭代次数,Xrt、Xlt分别为天牛的右须和左须第t次迭代时的位置坐标,d0为两须之间的距离,
Figure FDA0002803289110000052
是步骤4-2天牛左须指向右须的随机向量;
步骤4-4:确定适应度函数f(·)
数据的平均绝对误差(MAE)可以更好地反映预测值与实际值的误差,设定测试样本MAE作为适应度评价函数,计算公式如下:
Figure FDA0002803289110000053
其中,N为训练样本数,
Figure FDA0002803289110000054
和yi分别表示第i个样本预测输出和实际输出;
计算适应度函数初始值f(x0),当前最小的适应度记为fbest,天牛须搜索方向应朝向适应度函数值较小,即误差较小的一方移动;
步骤4-5:设置步长因子δ
步长因子用于控制天牛须的搜索能力,合适的步长因子可以避免陷入局部最优解。本实施例采用线性递减权值策略确保搜索的精度,计算公式如下:
dt=eta_d·dt-1
δt=eta_δ·δt-1
其中,dt、δt分别表示第t次迭代时两须的距离和步长;eta_d为两须距离的衰减系数;eta_δ为两须步长的衰减系数,取值可根据实际应用场景灵活选择。本实施例,通过反复试验的方法最终确定初始步长δ=3,最大迭代次数tmax=100,衰减系数eta=0.95。
步骤4-6:确定左右须气味强度
更新下一步天牛个体位置,得到的xt+1不断与当前的最优位置xbest迭代更新,使天牛个体位置逐渐逼近最优目标,从而找到最优解,位置更新公式如下:
Figure FDA0002803289110000061
其中,xt表示第t次天牛的位置;δt是第t次迭代时天牛的移动步长,f(xlt)、f(xrt)分别是天牛左右须的适应度值;sign(·)为符号函数,确定天牛的下一步移动方向,sign()函数表达式为:
Figure FDA0002803289110000062
步骤4-7:得到BAS-FNN预测模型
调整天牛坐标位置,将当前适应度函数值与当前最小的fbest比较,将最优解更新为xbest和fbest,调整步长更新天牛坐标,判断迭代次数是否达到设置的最大迭代次数或者当前位置的适应度函数值是否达到设定最小值阀值,如果满足条件,迭代停止条件,得到最优解xbest和fbest,由于xbest={w,m,b}best,由xbest得到模糊神经网络最优的模糊化层的初始隶属度函数中心m和隶属度函数宽度b、去模糊化层与输出层之间的连接权值w,得到BAS-FNN预测模型。
7.根据权利要求1所述的一种基于BAS-FNN的贷款用户信用评级方法及系统,其特征在于:在S5中,采用均方根误差指标来分析预测结果,如果误差较大,则重新进行训练,如果误差在允许的范围内,则BAS-FNN预测模型训练合格,均方根误差公式如下:
Figure FDA0002803289110000071
其中,σMSE为均方根误差,N为预测样本数,y(i)为网络序列的真实值,
Figure FDA0002803289110000072
为网络序列的预测结果。
8.根据权利要求1所述的一种基于BAS-FNN的贷款用户信用评级方法及系统,在S6中,将BAS算法优化FNN的信用评级模型部署至申请平台输出实时申请信用风险等级,实现申请客户的实时审批,并定期将有表现数据输入到模型训练,实现模型的在线更新。
9.根据权利要求1所述的一种基于BAS-FNN的贷款用户信用评级方法及系统,其特征在于:一种基于BAS-FNN的贷款用户信用评级系统包括以下几个单元:
样本获取单元:用于获取包括个人申请信息、操作行为埋点数据和贷后还款表现作为评价结果的训练样本;
数据处理单元:对采集的数据特征提取,进行包括数据缺失补全、异常值处理和归一化;
参数优化单元:设置BAS算法相关参数并与FNN模型相结合优化的神经网络的参数,得到BAS-FNN的贷款用户信用评级预测模型;
模型训练单元:将参数优化的FNN模型在训练集上训练及在测试集上验证;
预测单元:用于训练完成的FNN模型对在线申请客户进行信用风险等级评估预测。
CN202011358348.XA 2020-11-27 2020-11-27 一种基于bas-fnn的贷款用户信用评级方法及系统 Pending CN112529685A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011358348.XA CN112529685A (zh) 2020-11-27 2020-11-27 一种基于bas-fnn的贷款用户信用评级方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011358348.XA CN112529685A (zh) 2020-11-27 2020-11-27 一种基于bas-fnn的贷款用户信用评级方法及系统

Publications (1)

Publication Number Publication Date
CN112529685A true CN112529685A (zh) 2021-03-19

Family

ID=74994306

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011358348.XA Pending CN112529685A (zh) 2020-11-27 2020-11-27 一种基于bas-fnn的贷款用户信用评级方法及系统

Country Status (1)

Country Link
CN (1) CN112529685A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113111579A (zh) * 2021-04-02 2021-07-13 华北电力大学(保定) 一种自适应天牛须优化神经网络的锂电池等效电路模型参数辨识方法
CN113256274A (zh) * 2021-07-14 2021-08-13 支付宝(杭州)信息技术有限公司 基于专家系统的业务处理方法及装置
CN114004339A (zh) * 2021-11-12 2022-02-01 广东海洋大学 一种基于宽度学习的城市照明系统调节方法、装置和存储介质
CN114711033A (zh) * 2022-04-27 2022-07-08 北京良安科技有限公司 一种粮仓内环流系统
CN114818320A (zh) * 2022-04-25 2022-07-29 珠江水利委员会珠江水利科学研究院 一种巨型河网水动力数学模型率定方法、系统及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109166022A (zh) * 2018-08-01 2019-01-08 浪潮通用软件有限公司 基于模糊神经网络和遗传算法的筛选方法
CN110570042A (zh) * 2019-09-16 2019-12-13 燕山大学 一种短期电动汽车充电负荷预测方法及系统
CN110579714A (zh) * 2019-07-26 2019-12-17 西安科技大学 一种基于BAS优化ElmanNN-AH法电池SOC双态切换估算方法
CN111222976A (zh) * 2019-12-16 2020-06-02 北京淇瑀信息科技有限公司 一种基于双方网络图数据的风险预测方法、装置和电子设备
CN111367961A (zh) * 2020-02-27 2020-07-03 西安交通大学 基于图卷积神经网络的时序数据事件预测方法、系统及其应用

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109166022A (zh) * 2018-08-01 2019-01-08 浪潮通用软件有限公司 基于模糊神经网络和遗传算法的筛选方法
CN110579714A (zh) * 2019-07-26 2019-12-17 西安科技大学 一种基于BAS优化ElmanNN-AH法电池SOC双态切换估算方法
CN110570042A (zh) * 2019-09-16 2019-12-13 燕山大学 一种短期电动汽车充电负荷预测方法及系统
CN111222976A (zh) * 2019-12-16 2020-06-02 北京淇瑀信息科技有限公司 一种基于双方网络图数据的风险预测方法、装置和电子设备
CN111367961A (zh) * 2020-02-27 2020-07-03 西安交通大学 基于图卷积神经网络的时序数据事件预测方法、系统及其应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
李延锋: ""基于FNN的新汶矿业集团绩效评价研究"", 《中国优秀博硕士学位论文全文数据库(硕士) 经济与管理科学辑》, 15 April 2014 (2014-04-15), pages 152 - 703 *
李明富,凌艳,曹勇: "" 基于BAS-TSFNN的水质监测方法研究"", 《湘潭大学自然科学》, vol. 40, no. 3, 30 June 2018 (2018-06-30), pages 100 - 103 *
闵倩倩: ""采用芝麻信用分的消费金融风险评估方法比较研究-基于ZYS公司数据分析"", 《中国优秀博硕士学位论文全文数据库(硕士) 经济与科学辑》, 15 August 2020 (2020-08-15), pages 157 - 127 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113111579A (zh) * 2021-04-02 2021-07-13 华北电力大学(保定) 一种自适应天牛须优化神经网络的锂电池等效电路模型参数辨识方法
CN113111579B (zh) * 2021-04-02 2022-09-09 华北电力大学(保定) 一种自适应天牛须优化神经网络的锂电池等效电路模型参数辨识方法
CN113256274A (zh) * 2021-07-14 2021-08-13 支付宝(杭州)信息技术有限公司 基于专家系统的业务处理方法及装置
CN113256274B (zh) * 2021-07-14 2022-02-25 支付宝(杭州)信息技术有限公司 基于专家系统的业务处理方法及装置
CN114004339A (zh) * 2021-11-12 2022-02-01 广东海洋大学 一种基于宽度学习的城市照明系统调节方法、装置和存储介质
CN114004339B (zh) * 2021-11-12 2024-05-03 广东海洋大学 一种基于宽度学习的城市照明系统调节方法、装置和存储介质
CN114818320A (zh) * 2022-04-25 2022-07-29 珠江水利委员会珠江水利科学研究院 一种巨型河网水动力数学模型率定方法、系统及存储介质
CN114818320B (zh) * 2022-04-25 2022-11-08 珠江水利委员会珠江水利科学研究院 一种巨型河网水动力数学模型率定方法、系统及存储介质
CN114711033A (zh) * 2022-04-27 2022-07-08 北京良安科技有限公司 一种粮仓内环流系统
CN114711033B (zh) * 2022-04-27 2023-03-14 北京良安科技有限公司 一种粮仓内环流系统

Similar Documents

Publication Publication Date Title
CN112529685A (zh) 一种基于bas-fnn的贷款用户信用评级方法及系统
CN112037012A (zh) 一种基于pso-bp神经网络的互联网金融信用评价方法
CN112581263A (zh) 一种基于灰狼算法优化广义回归神经网络的信用评估方法
CN106874581B (zh) 一种基于bp神经网络模型的建筑空调能耗预测方法
CN110084610B (zh) 一种基于孪生神经网络的网络交易欺诈检测系统
CN109145516B (zh) 一种基于改进型极限学习机的模拟电路故障识别方法
CN112308288A (zh) 一种基于粒子群优化lssvm的违约用户概率预测方法
CN112634018A (zh) 一种基于蚁群算法优化循环神经网络的逾期监控方法
CN110650153B (zh) 一种基于聚焦损失深度神经网络的工控网络入侵检测方法
CN112529683A (zh) 一种基于cs-pnn的客户信贷风险的评估方法及系统
CN112037011A (zh) 一种基于foa-rbf神经网络的信用评分方法
CN106656357B (zh) 一种工频通信信道状态评估系统和方法
CN112215446A (zh) 一种基于神经网络的单位动态火灾风险评估方法
CN112581264A (zh) 一种基于蝗虫算法优化mlp神经网络的信用风险预测方法
CN113225346A (zh) 一种基于机器学习的网络运维态势评估方法
CN112348655A (zh) 一种基于afsa-elm的信用评估方法
CN113239638A (zh) 一种基于蜻蜓算法优化多核支持向量机的逾期风险预测方法
CN112504682A (zh) 基于粒子群优化算法的底盘发动机故障诊断方法及系统
Karlov et al. Application of high-speed algorithms for training neural networks for forecasting financial markets
CN111967308A (zh) 一种在线路面不平度辨识方法及系统
CN113379536A (zh) 一种基于引力搜索算法优化递归神经网络的违约概率预测方法
CN117370766A (zh) 一种基于深度学习的卫星任务规划方案评估方法
CN116303786B (zh) 一种基于多维数据融合算法的区块链金融大数据管理系统
CN112348656A (zh) 一种基于ba-wnn的个人贷款信用评分方法
CN110109005B (zh) 一种基于序贯测试的模拟电路故障测试方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210319