CN113487403A - 一种信用风险评估系统、方法、设备及介质 - Google Patents

一种信用风险评估系统、方法、设备及介质 Download PDF

Info

Publication number
CN113487403A
CN113487403A CN202110726751.1A CN202110726751A CN113487403A CN 113487403 A CN113487403 A CN 113487403A CN 202110726751 A CN202110726751 A CN 202110726751A CN 113487403 A CN113487403 A CN 113487403A
Authority
CN
China
Prior art keywords
user
credit
risk assessment
neural network
credit risk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110726751.1A
Other languages
English (en)
Inventor
江远强
李兰
李晓萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baiweijinke Shanghai Information Technology Co ltd
Original Assignee
Baiweijinke Shanghai Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baiweijinke Shanghai Information Technology Co ltd filed Critical Baiweijinke Shanghai Information Technology Co ltd
Priority to CN202110726751.1A priority Critical patent/CN113487403A/zh
Publication of CN113487403A publication Critical patent/CN113487403A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Business, Economics & Management (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Evolutionary Biology (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种信用风险评估系统、方法、设备及介质,包括用户端和服务端;所述用户端用于发起信用风险评估请求,所述服务端包括数据采集模块、样本数据库、风险评估模块和更新模块;所述数据采集模块,用于采集用户的征信特征信息X;所述样本数据库,用于存储用户样本数据;所述风险评估模块,用于根据用户的征信特征信息X评估用户的信用风险结果Y;所述更新模块,用于定期根据所述样本数据库中的用户样本数据对所述信用风险评估模型进行更新。本发明基于深度学习得到的神经网络模型评估用户的信用风险结果,相比传统固定规则的计算评估,评估效果更好,输出的信用风险结果参考性很强。

Description

一种信用风险评估系统、方法、设备及介质
技术领域
本发明属于互联网金融技术领域,尤其涉及一种信用风险评估系统、方法、设备及介质。
背景技术
近年来随着互联网金融的快速发展以及互联网所沉淀的行为数据呈现爆炸式的增长,依托于海量数据,互联网贷款业务量逐年增加。这使得用户信用风险评估变得非常必要,但目前为止的信用风险评估都是依托预定规则计算得出的,输出的信用风险结果参考性不强。
发明内容
本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种信用风险评估策略,基于深度学习得到的神经网络模型评估用户的信用风险结果,相比传统固定规则的计算评估,评估效果更好,输出的信用风险结果参考性很强。
本发明第一方面公开了一种信用风险评估系统,包括用户端和服务端;所述用户端用于发起信用风险评估请求,所述服务端包括数据采集模块、样本数据库、风险评估模块和更新模块;
所述数据采集模块,用于根据用户端发起的信用风险评估请求,以当下时间点为参考,采集用户当下时间点之前E1个月内产生的征信特征信息X,以及从当下时间点开始随时间推移持续采集用户新产生的征信特征信息X,并将对应用户采集到的所有征信特征信息作为用户样本数据发送至样本数据库存储;
所述样本数据库,用于存储用户样本数据;
所述风险评估模块,用于根据用户的征信特征信息X评估用户的信用风险结果Y;
所述风险评估模块根据对应用户的征信特征信息X评估用户的信用风险结果时包括以下步骤:
步骤1、调取E1个月内的征信特征信息X;
步骤2、将调取的E1个月内的征信特征信息X输入预设的信用风险评估模型Y=F1(X),预测用户当下时间点之后E2个月内的信用风险结果Y,Y=0或1,当Y=0时,代表用户低风险,当Y=1时,代表用户高风险;
步骤3、输出预测的信用风险结果Y;
所述更新模块,用于定期根据所述样本数据库中的用户样本数据对所述信用风险评估模型Y=F1(X)进行更新。
上述信用风险评估系统,所述信用风险评估模型Y=F1(X)通过以下方法生成或更新:
Step1、生成新的训练集样本和测试集样本,以及构建脊波神经网络模型;
Step2、初始化脊波神经网络模型的初始参数,所述初始参数包括连接隐藏层神经元节点和输出层神经元节点的权重w、激活函数中的尺度参数a、激活函数中的方向参数u和激活函数中的位置参数b;将训练集样本的征信特征信息X作为脊波神经网络模型的输入,将训练集样本的信用风险结果Y作为脊波神经网络模型的输出,训练脊波神经网络模型;训练完成后进入到下一步;
Step3、采用多元宇宙算法优化训练后的脊波神经网络模型的初始参数;然后进入到下一步;
Step4、利用测试集样本对优化后的脊波神经网络模型进行误差测试,若测试通过,则进入下一步;若测试不通过,则重新执行Step1-Step3;
Step5、以优化后的脊波神经网络模型为信用风险评估模型,并输出该信用风险评估模型。
上述信用风险评估系统,所述训练集样本和测试集样本通过以下步骤生成:
Step1-1、从所述样本数据库中抽取多个用户样本数据中一个时间段内的所有信息,然后进入下一步;
Step1-2、取所述时间段中的一个时间点作为观察点;将所述时间段中在观察点之前的时期设定为观察期,将所述时间段中在观察点之后的时期设定为表现期;然后进入下一步;
Step1-3、取在观察期内的信息为对应用户的历史征信特征信息X’;取在表现期内的信息中对应用户的逾期表现信息为高风险表现结果Y’;表现期内的信息中存在逾期时,高风险表现结果Y’=1,表现期内的信息中不存在逾期时,高风险表现结果Y’=0,然后进入下一步;
Step1-4、将每个用户样本数据对应的历史征信特征信息X’和高风险表现结果Y’构建为一条预用样本数据;对预用样本数据进行缺失值处理、异常值剔除和归一化处理;然后进入下一步;
Step1-5、将多个所述预用样本数据中的一部分设定为训练集样本,另一部分设定为测试集样本。
上述信用风险评估系统,Step3中多元宇宙算法优化脊波神经网络模型的初始参数时,多元宇宙算法的旅行距离率
Figure BDA0003138952410000031
l为多元宇宙算法优化执行时的当前迭代次数,L为多元宇宙算法优化执行时的最大迭代次数,Q为常数,满足2000<Q<10000;
执行所述多元宇宙算法在每次迭代时,子代宇宙满足:
Figure BDA0003138952410000032
Figure BDA0003138952410000033
为第i个子代宇宙的第j个参数;
Figure BDA0003138952410000034
为根据轮盘机制选择的第k个父代宇宙的第j个参数;r2、r3和r4分别是在[0,1]之间的随机数;Xj为当下最好宇宙的第j个参数;lbj,ubj为第j个变量的下边界和上边界;WEP为虫洞存在概率;ω为加权学习因子,且其值随迭代次数l增加而递减,ω∈[0,1],且满足:
Figure BDA0003138952410000041
本发明第二方面公开了一种信用风险评估方法,包括以下步骤:
步骤1、获取用户发起的风险评估请求;
步骤2、根据用户端发起的信用风险评估请求,以当下时间点为参考,采集用户当下时间点之前E1个月内产生的征信特征信息X,以及从当下时间点开始随时间推移持续采集用户新产生的征信特征信息X,并将对应用户采集到的所有征信特征信息作为用户样本数据发送至样本数据库存储;
步骤3、根据用户的征信特征信息X评估用户的信用风险结果Y;具体包括:
步骤3-1、调取E1个月内的征信特征信息X;
步骤3-2、将调取的E1个月内的征信特征信息X输入预设的信用风险评估模型Y=F1(X),预测用户当下时间点之后E2个月内的信用风险结果Y,Y=0或1,当Y=0时,代表用户低风险,当Y=1时,代表用户高风险;
步骤3-3、输出预测的信用风险结果Y;
所述信用风险评估模型Y=F1(X)定期根据预设样本数据库中的样本数据进行更新。
上述信用风险评估系统,所述信用风险评估模型Y=F1(X)通过以下方法生成或更新:
Step1、生成新的训练集样本和测试集样本,以及构建脊波神经网络模型;
Step2、初始化脊波神经网络模型的初始参数,所述初始参数包括连接隐藏层神经元节点和输出层神经元节点的权重w、激活函数中的尺度参数a、激活函数中的方向参数u和激活函数中的位置参数b;将训练集样本的征信特征信息X作为脊波神经网络模型的输入,将训练集样本的信用风险结果Y作为脊波神经网络模型的输出,训练脊波神经网络模型;训练完成后进入到下一步;
Step3、采用多元宇宙算法优化训练后的脊波神经网络模型的初始参数;然后进入到下一步;
Step4、利用测试集样本对优化后的脊波神经网络模型进行误差测试,若测试通过,则进入下一步;若测试不通过,则重新执行Step1-Step3;
Step5、以优化后的脊波神经网络模型为信用风险评估模型,并输出该信用风险评估模型。
上述信用风险评估系统,所述训练集样本和测试集样本通过以下步骤生成:
Step1-1、从所述样本数据库中抽取多个用户样本数据中一个时间段内的所有信息,然后进入下一步;
Step1-2、取所述时间段中的一个时间点作为观察点;将所述时间段中在观察点之前的时期设定为观察期,将所述时间段中在观察点之后的时期设定为表现期;然后进入下一步;
Step1-3、取在观察期内的信息为对应用户的历史征信特征信息X’;取在表现期内的信息中对应用户的逾期表现信息为高风险表现结果Y’;表现期内的信息中存在逾期时,高风险表现结果Y’=1,表现期内的信息中不存在逾期时,高风险表现结果Y’=0,然后进入下一步;
Step1-4、将每个用户样本数据对应的历史征信特征信息X’和高风险表现结果Y’构建为一条预用样本数据;对预用样本数据进行缺失值处理、异常值剔除和归一化处理;然后进入下一步;
Step1-5、将多个所述预用样本数据中的一部分设定为训练集样本,另一部分设定为测试集样本。
上述信用风险评估系统,Step3中多元宇宙算法优化脊波神经网络模型的初始参数时,多元宇宙算法的旅行距离率
Figure BDA0003138952410000051
l为多元宇宙算法优化执行时的当前迭代次数,L为多元宇宙算法优化执行时的最大迭代次数,Q为常数,满足2000<Q<10000;
执行所述多元宇宙算法在每次迭代时,子代宇宙满足:
Figure BDA0003138952410000061
Figure BDA0003138952410000062
为第i个子代宇宙的第j个参数;
Figure BDA0003138952410000063
为根据轮盘机制选择的第k个父代宇宙的第j个参数;r2、r3和r4分别是在[0,1]之间的随机数;Xj为当下最好宇宙的第j个参数;lbj,ubj为第j个变量的下边界和上边界;WEP为虫洞存在概率;ω为加权学习因子,且其值随迭代次数l增加而递减,ω∈[0,1],且满足:
Figure BDA0003138952410000064
本发明第三方面提供一种电子设备,包括:存储器和处理器,所述处理器和所述存储器连接;
所述存储器用于存储程序;
所述处理器调用存储于所述存储器中的程序,以执行上述第二方面所述方法和/或结合第二方面所述方法的任一种可能的信用风险评估方法。
本发明第四方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被计算机运行时执行第二方面所述方法和/或结合第二方面所述方法的任一种可能的信用风险评估方法。
本发明与现有技术相比具有以下优点:本发明通过利用用户的信用风险评估请求,采集用户E1个月内的征信特征信息X,并基于征信特征信息X利用信用风险评估模型Y=F1(X)评估用户的信用风险结果Y;相比传统固定规则的计算评估,基于深度学习得到的神经网络模型评估用户的信用风险结果,评估效果更好,输出的信用风险结果参考性很强。风险评估模型Y=F1(X)建模或更新所用的用户样本数据需要足够多,并且还需要不断的有新的用户样本数据加入,这样才能保持风险评估模型Y=F1(X)的表现效果优良,本发明通过将采集到的征信特征信息X可以作为用户样本数据存储,用于后期更新所述信用风险评估模型Y=F1(X)使用,定期更新信用风险评估模型Y=F1(X),能够保持风险评估模型Y=F1(X)的表现效果优良。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为本发明实施例1的系统模块框图。
图2为本发明评估用户的信用风险结果时的方法流程图。
图3为本发明信用风险评估模型生成或更新时的方法流程图。
图4为本发明实施例2的方法流程图。
具体实施方式
实施例1
如图1所示,一种信用风险评估系统,包括用户端100和服务端200;所述用户端100用于发起信用风险评估请求,所述服务端200包括数据采集模块201、样本数据库202、风险评估模块203和更新模块204;
所述数据采集模块201,用于根据用户端100发起的信用风险评估请求,以当下时间点为参考,采集用户当下时间点之前E1个月内产生的征信特征信息X,以及从当下时间点开始随时间推移持续采集用户新产生的征信特征信息X,并将对应用户采集到的所有征信特征信息作为用户样本数据发送至样本数据库202存储;
所述样本数据库202,用于存储用户样本数据;
所述风险评估模块203,用于根据用户的征信特征信息X评估用户的信用风险结果Y;
如图2所示,所述风险评估模块203根据对应用户的征信特征信息X评估用户的信用风险结果时包括以下步骤:
步骤1、调取E1个月内的征信特征信息X;
步骤2、将调取的E1个月内的征信特征信息X输入预设的信用风险评估模型Y=F1(X),预测用户当下时间点之后E2个月内的信用风险结果Y,Y=0或1,当Y=0时,代表用户低风险,当Y=1时,代表用户高风险;
步骤3、输出预测的信用风险结果Y;
所述更新模块204,用于定期根据所述样本数据库202中的用户样本数据对所述信用风险评估模型Y=F1(X)进行更新。
需要说明的是,所述征信特征信息X包括用户在申请贷款时的注册信息、用户历史借贷行为关联信息、外部系统中的征信关联信息等。实际实施时,所述用户的征信特征信息X可根据实际情况而定。用户在申请贷款时的注册信息如婚姻状况、年龄、性别、个人收入、申请评分卡分数等;用户历史借贷行为关联信息指能够反映用户的还款能力和还款意愿的信息,如借款产品利率、借款期限、历史申请次数、申请金额、被拒次数、近期是否申请、最大高风险天数、最小高风险天数、贷款余额、高风险金额、提前还款次数、提款次数、提款总金额、提款金额占授信金额占比、历史违约次数、历史违约金额、违约时间间隔等;外部系统中的征信关联信息指在合规或经过客户授权下,从多方面外部系统中取得的征信关联数据,如用户在风险欺诈类软件、大数据评分类软件、多头借贷类软件、手机在网时长和状态统计类软件、司法信息类软件、工商信息类软件、电信消费记录类等软件中的征信信息等。
如图3所示,本实施例中,所述信用风险评估模型Y=F1(X)通过以下方法生成或更新:
Step1、生成新的训练集样本和测试集样本,以及构建脊波神经网络模型;
需要说明的是,脊波神经网络模型(Ridegelet Neural Network,RNN)是脊波核函数和前向网络组成的,脊波核函数在小波核函数中加入方向向量构成的脊波核函数是对小波函数的改进,相对于小波网络来讲,脊波神经网络模型具有更强的非线性映射能力和更好的表征高维奇异性(线、面奇异)的性能。
脊波神经网络模型其结构与传统的前馈型神经网络相近,由输入层、隐含层和输出层构成;
Step2、初始化脊波神经网络模型的初始参数,所述初始参数包括连接隐藏层神经元节点和输出层神经元节点的权重w、激活函数中的尺度参数a、激活函数中的方向参数u和激活函数中的位置参数b;将训练集样本的征信特征信息X作为脊波神经网络模型的输入,将训练集样本的信用风险结果Y作为脊波神经网络模型的输出,训练脊波神经网络模型;训练完成后进入到下一步;
需要说明的是,脊波神经网络模型的非线性映射能力体现在权重w和激活函数上,而激活函数的特性主要由函数的尺度、方向和位置,即脊波参数变量h=(a,u,b)确定,脊波神经网络模型和传统神经网络一样,受初始参数影响,从数据点中任意选取脊波函数参数构造出来的脊波神经网络模型的,易陷入局部最优、反复震荡等问题,导致收敛速度慢和精度低,故本发明采用多元宇宙算法优化训练后的脊波神经网络模型的初始参数,以避免此问题的出现;
对所述脊波神经网络模型训练时,采用梯度下降算法进行模型训练,当迭代次数到达规定次数,若损失函数收敛,则训练完成;若损失函数未收敛,则继续迭代直至收敛;
进一步需要说明的是,本实施例中,损失函数为
Figure BDA0003138952410000091
其中N表示脊波神经网络模型输出的预测值的数量,yi表示训练数据的真实值,yi’表示训练数据在脊波神经网络模型输出的预测值。
Step3、采用多元宇宙算法优化训练后的脊波神经网络模型的初始参数;然后进入到下一步;
需要说明的是,采用多元宇宙算法优化训练后的脊波神经网络模型的初始参数的过程,是在训练完成得到的权重w和脊波参数变量h=(a,u,b)基础上寻找损失函数MAE所能达到更小值的过程,即寻找最小MAEmin=f2(w,h)时的w和h;
具体地,所述多元宇宙算法执行时,随机生成在空间D中初始化宇宙种群,随机初始化n个宇宙的位置,依据每个宇宙个体间的距离自动设置宇宙上边界及下边界对应脊波神经网络模型初始参数变量区间[lbj,ubj];宇宙个体Ui=[xi 1,xi 2,…,xi m,xi d-2,xi d-1,xi d],(i=1,2,…,n),d是初始参数(变量)的个数,每个宇宙个体Ui中[xi 1,xi 2,…,xi m]为脊波神经网络模型中各个隐藏层神经元节点和输出层神经元节点的权重w;[xi d-2,xi d-1,xi d]为激活函数中的尺度参数a、激活函数中的方向参数u和激活函数中的位置参数b;设多元宇宙算法执行时,最大迭代次数为L,当前迭代次数为l;
初始化后宇宙矩阵如下:
Figure BDA0003138952410000101
然后开始执行多元宇宙算法迭代计算MAE=f2(w,h),寻找MAEmin=f2(w,h)时的w和h;
进一步需要说明的是,由于多元宇宙算法需要通过虫洞的随机性来保证宇宙的稳定性和多样性;所以,多元宇宙算法中设置一个适合的旅行距离率TDR可以使算法更易找到最优个体,有利于全局寻优;标准多元宇宙算法中TDR值下降速度较慢,会导致旅行距离增加的问题;为了在一定程度上对多元宇宙算法的性能进行提升,本发明将TDR的下降速度增大,使TDR以指数函数方式下降,本实施例中多元宇宙算法的旅行距离率
Figure BDA0003138952410000102
l为多元宇宙算法执行时的当前迭代次数,L为多元宇宙算法执行时的最大迭代次数,Q为常数,满足2000<Q<10000;优选Q=5000;
在传统多元宇宙算法迭代前期,虫洞存在概率WEP以较大概率小于随机数r2,且当前最优宇宙Ubest通常远离全局最优解,过于继承Ubest信息势必会导致宇宙种群过快趋于同化而不利于种群保持多样性,在迭代后期,宇宙种群代间信息继承的累积效应使得宇宙个体高度同化且差异性小,此时轮盘赌机制搜寻白洞出现的位置
Figure BDA0003138952410000103
学习的有效信息(信息熵)较少且难以显著改善算法局部开采能力,因此,为保证宇宙种群多样性并拓宽单一宇宙继承的有限搜索域,通过引入加权学习因子ω保证子代宇宙同时继承最优宇宙(或自身)和轮盘赌宇宙的位置信息并生成新宇宙种群,故本实施例中,执行所述多元宇宙算法在每次迭代时,子代宇宙满足:
Figure BDA0003138952410000111
Figure BDA0003138952410000112
为第i个子代宇宙的第j个参数;
Figure BDA0003138952410000113
为根据轮盘机制选择的第k个父代宇宙的第j个参数;r2、r3和r4分别是在[0,1]之间的随机数;Xj为当下最好宇宙的第j个参数;lbj,ubj为第j个变量的下边界和上边界;WEP为虫洞存在概率;ω为加权学习因子,且其值随迭代次数l增加而递减,ω∈[0,1],且满足:
Figure BDA0003138952410000114
Step4、利用测试集样本对优化后的脊波神经网络模型进行误差测试,若测试通过,则进入下一步;若测试不通过,则重新执行Step1-Step3;
需要说明的是,误差测试时,引入混淆矩阵统计测试结果如下所示:
Figure BDA0003138952410000115
TP:客户本身是高风险,模型判断为高风险;
TN:客户本身是低风险,模型判断为低风险;
FN:客户本身是高风险,模型判断为低风险;
FP:客户本身是低风险,模型判断为高风险;
计算脊波神经网络的召回率、准确率和F1值;当召回率、准确率和F1值均达到预设标准阈值时,预设标准阈值可自行定义;本实施例中预设标准阈值=0.5,则认为测试通过;
召回率(recall):recall=TP/(TP+FN),体现预测正确的高风险人占预测高风险人全部的比例;
准确率(Precision):precision=TP/(TP+FP),体现预测正确的高风险人占实际高风险人的比例;
F1:F1=2*(precision*recall)/(recall+precision),体现精确率和召回率的调和平均数,同时兼顾了预测模型的准确率和召回率;
为了验证改进后的多元宇宙算法优化脊波神经网络的优越性,分别用原始脊波神经网络RNN,以及遗传算法(GA)优化、粒子群算法(PSO)优化、多元宇宙算法(MVO)与改进多元宇宙算法(IMVO)优化脊波神经网络的性能对比得到RNN、GA-RNN、PSO-RNN、MVO-RNN和IMVO-RNN中,4种优化算法的参数设置:遗传算法(GA)的交叉概率为0.8,变异概率为0.05;粒子群算法(PSO)最大速度值为0.5,最小速度值为-0.5,速度更新的两个参数都为1.49445;MVO和IMVO算法宇宙数n=5,最大迭代次数L=150,虫洞存在概率WEPmin=0.2,虫洞存在最大概率WEPmax=1,测试结果如下:
Figure BDA0003138952410000121
如上表可见,改进后的多元宇宙算法IMVO在实验中都获得了比GA、PSO和MVO更高的Precision、Recall和F1值,表现出极好的搜索能力和稳定性;
Step5、以优化后的脊波神经网络模型为信用风险评估模型,并输出该信用风险评估模型。
本实施例中,所述训练集样本和测试集样本通过以下步骤生成:
Step1-1、从所述样本数据库中抽取多个用户样本数据中一个时间段内的所有信息,然后进入下一步;
需要说明的是,训练集样本和测试集样本的生成所需的信息选取,如果距离当下时间太长,选取的信息反映的用户样本特性与当前的新增用户差异较大,容易导致训练出的模型预测当前用户效果不佳,而如果距离当下时间较短,近期用户的表征信息会不够充分,故在Step1-2中定义观察期和表现期,观察期可看做建模所需信息横跨的历史区间,表现期则为模型预测的时间长度;
Step1-2、取所述时间段中的一个时间点作为观察点;将所述时间段中在观察点之前的时期设定为观察期,将所述时间段中在观察点之后的时期设定为表现期;然后进入下一步;
本实施例中,观察期取值为6—24个月,表现期为3—12个月,表现期从执行Step1-1时的时间点向前推算;
Step1-3、取在观察期内的信息为对应用户的历史征信特征信息X’;取在表现期内的信息中对应用户的逾期表现信息为高风险表现结果Y’;表现期内的信息中存在逾期时,高风险表现结果Y’=1,表现期内的信息中不存在逾期时,高风险表现结果Y’=0,然后进入下一步;
Step1-4、将每个用户样本数据对应的历史征信特征信息X’和高风险表现结果Y’构建为一条预用样本数据;对预用样本数据进行缺失值处理、异常值剔除和归一化处理;然后进入下一步;
Step1-5、将多个所述预用样本数据中的一部分设定为训练集样本,另一部分设定为测试集样本。所述训练集样本的数量和测试集样本的数量比例为7∶3。
需要说明的是,与其他传统的神经网络模型相比,脊波神经网络采用脊波函数作为网络模型隐含层中神经元的激励函数,更具方向选择性,能够使网络包含更多的维数信息,从而很好地处理更高维度的数据信息,对非线性高维函数的逼近有比较好的效果;
另外,相比遗传和粒子群等优化算法,多元宇宙算法能够有效平衡全局寻优与局部搜索之间的关系,具有较好的收敛精度、鲁棒性能和全局寻优能力;改进的多元宇宙算法通过选择适合的旅行距离率TDR,采用横向个体更新策略寻找更广的新个体潜在位置,保证宇宙种群多样性,使得最终收敛逼近于最优解;采用改进多元宇宙优化算对脊波神经网络的参数进行优化,将提高脊波神经网络的收敛速度和学习能力,具有规模小、学习和泛化能力强、网络可控性好等优点。
实施例2
如图4所示,一种信用风险评估方法,包括以下步骤:
步骤1、获取用户发起的风险评估请求;
步骤2、根据用户端发起的信用风险评估请求,以当下时间点为参考,采集用户当下时间点之前E1个月内产生的征信特征信息X,以及从当下时间点开始随时间推移持续采集用户新产生的征信特征信息X,并将对应用户采集到的所有征信特征信息作为用户样本数据发送至样本数据库存储;
步骤3、根据用户的征信特征信息X评估用户的信用风险结果Y;具体包括:
步骤3-1、调取E1个月内的征信特征信息X;
步骤3-2、将调取的E1个月内的征信特征信息X输入预设的信用风险评估模型Y=F1(X),预测用户当下时间点之后E2个月内的信用风险结果Y,Y=0或1,当Y=0时,代表用户低风险,当Y=1时,代表用户高风险;
步骤3-3、输出预测的信用风险结果Y;
所述信用风险评估模型Y=F1(X)定期根据预设样本数据库中的样本数据进行更新。
需要说明的是,所述征信特征信息X包括用户在申请贷款时的注册信息、用户历史借贷行为关联信息、外部系统中的征信关联信息等。实际实施时,所述用户的征信特征信息X可根据实际情况而定。用户在申请贷款时的注册信息如婚姻状况、年龄、性别、个人收入、申请评分卡分数等;用户历史借贷行为关联信息指能够反映用户的还款能力和还款意愿的信息,如借款产品利率、借款期限、历史申请次数、申请金额、被拒次数、近期是否申请、最大高风险天数、最小高风险天数、贷款余额、高风险金额、提前还款次数、提款次数、提款总金额、提款金额占授信金额占比、历史违约次数、历史违约金额、违约时间间隔等;外部系统中的征信关联信息指在合规或经过客户授权下,从多方面外部系统中取得的征信关联数据,如用户在风险欺诈类软件、大数据评分类软件、多头借贷类软件、手机在网时长和状态统计类软件、司法信息类软件、工商信息类软件、电信消费记录类等软件中的征信信息等。
如图3所示,本实施例中,所述信用风险评估模型Y=F1(X)通过以下方法生成或更新:
Step1、生成新的训练集样本和测试集样本,以及构建脊波神经网络模型;
需要说明的是,脊波神经网络模型(Ridegelet Neural Network,RNN)是脊波核函数和前向网络组成的,脊波核函数在小波核函数中加入方向向量构成的脊波核函数是对小波函数的改进,相对于小波网络来讲,脊波神经网络模型具有更强的非线性映射能力和更好的表征高维奇异性(线、面奇异)的性能。
脊波神经网络模型其结构与传统的前馈型神经网络相近,由输入层、隐含层和输出层构成;
Step2、初始化脊波神经网络模型的初始参数,所述初始参数包括连接隐藏层神经元节点和输出层神经元节点的权重w、激活函数中的尺度参数a、激活函数中的方向参数u和激活函数中的位置参数b;将训练集样本的征信特征信息X作为脊波神经网络模型的输入,将训练集样本的信用风险结果Y作为脊波神经网络模型的输出,训练脊波神经网络模型;训练完成后进入到下一步;
需要说明的是,脊波神经网络模型的非线性映射能力体现在权重w和激活函数上,而激活函数的特性主要由函数的尺度、方向和位置,即脊波参数变量h=(a,u,b)确定,脊波神经网络模型和传统神经网络一样,受初始参数影响,从数据点中任意选取脊波函数参数构造出来的脊波神经网络模型的,易陷入局部最优、反复震荡等问题,导致收敛速度慢和精度低,故本发明采用多元宇宙算法优化训练后的脊波神经网络模型的初始参数,以避免此问题的出现;
对所述脊波神经网络模型训练时,采用梯度下降算法进行模型训练,当迭代次数到达规定次数,若损失函数收敛,则训练完成;若损失函数未收敛,则继续迭代直至收敛;
进一步需要说明的是,本实施例中,损失函数为
Figure BDA0003138952410000161
其中N表示脊波神经网络模型输出的预测值的数量,yi表示训练数据的真实值,yi’表示训练数据在脊波神经网络模型输出的预测值。
Step3、采用多元宇宙算法优化训练后的脊波神经网络模型的初始参数;然后进入到下一步;
需要说明的是,采用多元宇宙算法优化训练后的脊波神经网络模型的初始参数的过程,是在训练完成得到的权重w和脊波参数变量h=(a,u,b)基础上寻找损失函数MAE所能达到更小值的过程,即寻找最小MAEmin=f2(w,h)时的w和h;
具体地,所述多元宇宙算法执行时,随机生成在空间D中初始化宇宙种群,随机初始化n个宇宙的位置,依据每个宇宙个体间的距离自动设置宇宙上边界及下边界对应脊波神经网络模型初始参数变量区间[lbj,ubj];宇宙个体Ui=[xi 1,xi 2,…,xi m,xi d-2,xi d-1,xi d],(i=1,2,…,n),d是初始参数(变量)的个数,每个宇宙个体Ui中[xi 1,xi 2,…,xi m]为脊波神经网络模型中各个隐藏层神经元节点和输出层神经元节点的权重w;[xi d-2,xi d-1,xi d]为激活函数中的尺度参数a、激活函数中的方向参数u和激活函数中的位置参数b;设多元宇宙算法执行时,最大迭代次数为L,当前迭代次数为l;
初始化后宇宙矩阵如下:
Figure BDA0003138952410000171
然后开始执行多元宇宙算法迭代计算MAE=f2(w,h),寻找MAEmin=f2(w,h)时的w和h;
进一步需要说明的是,由于多元宇宙算法需要通过虫洞的随机性来保证宇宙的稳定性和多样性;所以,多元宇宙算法中设置一个适合的旅行距离率TDR可以使算法更易找到最优个体,有利于全局寻优;标准多元宇宙算法中TDR值下降速度较慢,会导致旅行距离增加的问题;为了在一定程度上对多元宇宙算法的性能进行提升,本发明将TDR的下降速度增大,使TDR以指数函数方式下降,本实施例中多元宇宙算法的旅行距离率
Figure BDA0003138952410000172
l为多元宇宙算法执行时的当前迭代次数,L为多元宇宙算法执行时的最大迭代次数,Q为常数,满足2000<Q<10000;优选Q=5000;
在传统多元宇宙算法迭代前期,虫洞存在概率WEP以较大概率小于随机数r2,且当前最优宇宙Ubest通常远离全局最优解,过于继承Ubest信息势必会导致宇宙种群过快趋于同化而不利于种群保持多样性,在迭代后期,宇宙种群代间信息继承的累积效应使得宇宙个体高度同化且差异性小,此时轮盘赌机制搜寻白洞出现的位置
Figure BDA0003138952410000176
学习的有效信息(信息熵)较少且难以显著改善算法局部开采能力,因此,为保证宇宙种群多样性并拓宽单一宇宙继承的有限搜索域,通过引入加权学习因子ω保证子代宇宙同时继承最优宇宙(或自身)和轮盘赌宇宙的位置信息并生成新宇宙种群,故本实施例中,执行所述多元宇宙算法在每次迭代时,子代宇宙满足:
Figure BDA0003138952410000173
Figure BDA0003138952410000174
为第i个子代宇宙的第j个参数;
Figure BDA0003138952410000175
为根据轮盘机制选择的第k个父代宇宙的第j个参数;r2、r3和r4分别是在[0,1]之间的随机数;Xj为当下最好宇宙的第j个参数;lbj,ubj为第j个变量的下边界和上边界;WEP为虫洞存在概率;ω为加权学习因子,且其值随迭代次数l增加而递减,ω∈[0,1],且满足:
Figure BDA0003138952410000181
Step4、利用测试集样本对优化后的脊波神经网络模型进行误差测试,若测试通过,则进入下一步;若测试不通过,则重新执行Step1-Step3;
需要说明的是,误差测试时,引入混淆矩阵统计测试结果如下所示:
Figure BDA0003138952410000182
TP:客户本身是高风险,模型判断为高风险;
TN:客户本身是低风险,模型判断为低风险;
FN:客户本身是高风险,模型判断为低风险;
FP:客户本身是低风险,模型判断为高风险;
计算脊波神经网络的召回率、准确率和F1值;当召回率、准确率和F1值均达到预设标准阈值时,预设标准阈值可自行定义;本实施例中预设标准阈值=0.5,则认为测试通过;
召回率(recall):recall=TP/(TP+FN),体现预测正确的高风险人占预测高风险人全部的比例;
准确率(Precision):precision=TP/(TP+FP),体现预测正确的高风险人占实际高风险人的比例;
F1:F1=2*(precision*recall)/(recall+precision),体现精确率和召回率的调和平均数,同时兼顾了预测模型的准确率和召回率;
为了验证改进后的多元宇宙算法优化脊波神经网络的优越性,分别用原始脊波神经网络RNN,以及遗传算法(GA)优化、粒子群算法(PSO)优化、多元宇宙算法(MVO)与改进多元宇宙算法(IMVO)优化脊波神经网络的性能对比得到RNN、GA-RNN、PSO-RNN、MVO-RNN和IMVO-RNN中,4种优化算法的参数设置:遗传算法(GA)的交叉概率为0.8,变异概率为0.05;粒子群算法(PSO)最大速度值为0.5,最小速度值为-0.5,速度更新的两个参数都为1.49445;MVO和IMVO算法宇宙数n=5,最大迭代次数L=150,虫洞存在概率WEPmin=0.2,虫洞存在最大概率WEPmax=1,测试结果如下:
Figure BDA0003138952410000191
如上表可见,改进后的多元宇宙算法IMVO在实验中都获得了比GA、PSO和MVO更高的Precision、Recall和F1值,表现出极好的搜索能力和稳定性;
Step5、以优化后的脊波神经网络模型为信用风险评估模型,并输出该信用风险评估模型。
本实施例中,所述训练集样本和测试集样本通过以下步骤生成:
Step1-1、从所述样本数据库中抽取多个用户样本数据中一个时间段内的所有信息,然后进入下一步;
需要说明的是,训练集样本和测试集样本的生成所需的信息选取,如果距离当下时间太长,选取的信息反映的用户样本特性与当前的新增用户差异较大,容易导致训练出的模型预测当前用户效果不佳,而如果距离当下时间较短,近期用户的表征信息会不够充分,故在Step1-2中定义观察期和表现期,观察期可看做建模所需信息横跨的历史区间,表现期则为模型预测的时间长度;
Step1-2、取所述时间段中的一个时间点作为观察点;将所述时间段中在观察点之前的时期设定为观察期,将所述时间段中在观察点之后的时期设定为表现期;然后进入下一步;
本实施例中,观察期取值为6—24个月,表现期为3—12个月,表现期从执行Step1-1时的时间点向前推算;
Step1-3、取在观察期内的信息为对应用户的历史征信特征信息X’;取在表现期内的信息中对应用户的逾期表现信息为高风险表现结果Y’;表现期内的信息中存在逾期时,高风险表现结果Y’=1,表现期内的信息中不存在逾期时,高风险表现结果Y’=0,然后进入下一步;
Step1-4、将每个用户样本数据对应的历史征信特征信息X’和高风险表现结果Y’构建为一条预用样本数据;对预用样本数据进行缺失值处理、异常值剔除和归一化处理;然后进入下一步;
Step1-5、将多个所述预用样本数据中的一部分设定为训练集样本,另一部分设定为测试集样本。所述训练集样本的数量和测试集样本的数量比例为7∶3。
需要说明的是,与其他传统的神经网络模型相比,脊波神经网络采用脊波函数作为网络模型隐含层中神经元的激励函数,更具方向选择性,能够使网络包含更多的维数信息,从而很好地处理更高维度的数据信息,对非线性高维函数的逼近有比较好的效果;
另外,相比遗传和粒子群等优化算法,多元宇宙算法能够有效平衡全局寻优与局部搜索之间的关系,具有较好的收敛精度、鲁棒性能和全局寻优能力;改进的多元宇宙算法通过选择适合的旅行距离率TDR,采用横向个体更新策略寻找更广的新个体潜在位置,保证宇宙种群多样性,使得最终收敛逼近于最优解;采用改进多元宇宙优化算对脊波神经网络的参数进行优化,将提高脊波神经网络的收敛速度和学习能力,具有规模小、学习和泛化能力强、网络可控性好等优点。
需要说明的是,本实施例与实施例1中对应的部分实现原理及产生的技术效果相同,为了简要描述,未提及和详细说明的部分,可参考实施例1中相应的内容。
实施例3
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被计算机运行时执行上述实施例2中所述信用风险评估方法。
实施例4
一种电子设备,包括:存储器和处理器,所述处理器和所述存储器连接;
所述存储器用于存储程序;
所述处理器调用存储于所述存储器中的程序,以执行如实施例2中所述信用风险评估方法。
需要说明的是,所述电子设备,可以是,但不限于个人电脑(personal computer,PC)、平板电脑、移动上网设备(mobile internet device,MID)等设备。
应当注意的是,处理器、存储器以及其他可能出现于电子设备的组件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,处理器、存储器以及其他可能出现的组件相互之间可通过一条或多条通讯总线或信号线实现电性连接。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统和方法,也可以通过其它的方式实现。以上所描述的系统实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,笔记本电脑,服务器,手机,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅是本发明的较佳实施例,并非对本发明作任何限制,凡是根据本发明技术实质对以上实施例所作的任何简单修改、变更以及等效结构变化,均仍属于本发明技术方案的保护范围内。

Claims (10)

1.一种信用风险评估系统,其特征在于,包括用户端和服务端;所述用户端用于发起信用风险评估请求,所述服务端包括数据采集模块、样本数据库、风险评估模块和更新模块;
所述数据采集模块,用于根据用户端发起的信用风险评估请求,以当下时间点为参考,采集用户当下时间点之前E1个月内产生的征信特征信息X,以及从当下时间点开始随时间推移持续采集用户新产生的征信特征信息X,并将对应用户采集到的所有征信特征信息作为用户样本数据发送至样本数据库存储;
所述样本数据库,用于存储用户样本数据;
所述风险评估模块,用于根据用户的征信特征信息X评估用户的信用风险结果Y;
所述风险评估模块根据对应用户的征信特征信息X评估用户的信用风险结果时包括以下步骤:
步骤1、调取E1个月内的征信特征信息X;
步骤2、将调取的E1个月内的征信特征信息X输入预设的信用风险评估模型Y=F1(X),预测用户当下时间点之后E2个月内的信用风险结果Y,Y=0或1,当Y=0时,代表用户低风险,当Y=1时,代表用户高风险;
步骤3、输出预测的信用风险结果Y;
所述更新模块,用于定期根据所述样本数据库中的用户样本数据对所述信用风险评估模型Y=F1(X)进行更新。
2.按照权利要求1所述的一种信用风险评估系统,其特征在于,所述信用风险评估模型Y=F1(X)通过以下方法生成或更新:
Step1、生成新的训练集样本和测试集样本,以及构建脊波神经网络模型;
Step2、初始化脊波神经网络模型的初始参数,所述初始参数包括连接隐藏层神经元节点和输出层神经元节点的权重w、激活函数中的尺度参数a、激活函数中的方向参数u和激活函数中的位置参数b;将训练集样本的征信特征信息X作为脊波神经网络模型的输入,将训练集样本的信用风险结果Y作为脊波神经网络模型的输出,训练脊波神经网络模型;训练完成后进入到下一步;
Step3、采用多元宇宙算法优化训练后的脊波神经网络模型的初始参数;然后进入到下一步;
Step4、利用测试集样本对优化后的脊波神经网络模型进行误差测试,若测试通过,则进入下一步;若测试不通过,则重新执行Step1-Step3;
Step5、以优化后的脊波神经网络模型为信用风险评估模型,并输出该信用风险评估模型。
3.按照权利要求2所述的一种信用风险评估系统,其特征在于,所述训练集样本和测试集样本通过以下步骤生成:
Step1-1、从所述样本数据库中抽取多个用户样本数据中一个时间段内的所有信息,然后进入下一步;
Step1-2、取所述时间段中的一个时间点作为观察点;将所述时间段中在观察点之前的时期设定为观察期,将所述时间段中在观察点之后的时期设定为表现期;然后进入下一步;
Step1-3、取在观察期内的信息为对应用户的历史征信特征信息X’;取在表现期内的信息中对应用户的逾期表现信息为高风险表现结果Y’;表现期内的信息中存在逾期时,高风险表现结果Y’=1,表现期内的信息中不存在逾期时,高风险表现结果Y’=0,然后进入下一步;
Step1-4、将每个用户样本数据对应的历史征信特征信息X’和高风险表现结果Y’构建为一条预用样本数据;对预用样本数据进行缺失值处理、异常值剔除和归一化处理;然后进入下一步;
Step1-5、将多个所述预用样本数据中的一部分设定为训练集样本,另一部分设定为测试集样本。
4.按照权利要求3所述的一种信用风险评估系统,其特征在于,Step3中多元宇宙算法优化脊波神经网络模型的初始参数时,多元宇宙算法的旅行距离率
Figure FDA0003138952400000031
l为多元宇宙算法优化执行时的当前迭代次数,L为多元宇宙算法优化执行时的最大迭代次数,Q为常数,满足2000<Q<10000;
执行所述多元宇宙算法在每次迭代时,子代宇宙满足:
Figure FDA0003138952400000032
Figure FDA0003138952400000033
为第i个子代宇宙的第j个参数;
Figure FDA0003138952400000034
为根据轮盘机制选择的第k个父代宇宙的第j个参数;r2、r3和r4分别是在[0,1]之间的随机数;Xj为当下最好宇宙的第j个参数;lbj,ubj为第j个变量的下边界和上边界;WEP为虫洞存在概率;ω为加权学习因子,且其值随迭代次数l增加而递减,ω∈[0,1],且满足:
Figure FDA0003138952400000035
5.一种信用风险评估方法,其特征在于,包括以下步骤:
步骤1、获取用户发起的风险评估请求;
步骤2、根据用户端发起的信用风险评估请求,以当下时间点为参考,采集用户当下时间点之前E1个月内产生的征信特征信息X,以及从当下时间点开始随时间推移持续采集用户新产生的征信特征信息X,并将对应用户采集到的所有征信特征信息作为用户样本数据发送至样本数据库存储;
步骤3、根据用户的征信特征信息X评估用户的信用风险结果Y;具体包括:
步骤3-1、调取E1个月内的征信特征信息X;
步骤3-2、将调取的E1个月内的征信特征信息X输入预设的信用风险评估模型Y=F1(X),预测用户当下时间点之后E2个月内的信用风险结果Y,Y=0或1,当Y=0时,代表用户低风险,当Y=1时,代表用户高风险;
步骤3-3、输出预测的信用风险结果Y;
所述信用风险评估模型Y=F1(X)定期根据预设样本数据库中的样本数据进行更新。
6.按照权利要求5所述的一种信用风险评估系统,其特征在于,所述信用风险评估模型Y=F1(X)通过以下方法生成或更新:
Step1、生成新的训练集样本和测试集样本,以及构建脊波神经网络模型;
Step2、初始化脊波神经网络模型的初始参数,所述初始参数包括连接隐藏层神经元节点和输出层神经元节点的权重w、激活函数中的尺度参数a、激活函数中的方向参数u和激活函数中的位置参数b;将训练集样本的征信特征信息X作为脊波神经网络模型的输入,将训练集样本的信用风险结果Y作为脊波神经网络模型的输出,训练脊波神经网络模型;训练完成后进入到下一步;
Step3、采用多元宇宙算法优化训练后的脊波神经网络模型的初始参数;然后进入到下一步;
Step4、利用测试集样本对优化后的脊波神经网络模型进行误差测试,若测试通过,则进入下一步;若测试不通过,则重新执行Step1-Step3;
Step5、以优化后的脊波神经网络模型为信用风险评估模型,并输出该信用风险评估模型。
7.按照权利要求6所述的一种信用风险评估系统,其特征在于,所述训练集样本和测试集样本通过以下步骤生成:
Step1-1、从所述样本数据库中抽取多个用户样本数据中一个时间段内的所有信息,然后进入下一步;
Step1-2、取所述时间段中的一个时间点作为观察点;将所述时间段中在观察点之前的时期设定为观察期,将所述时间段中在观察点之后的时期设定为表现期;然后进入下一步;
Step1-3、取在观察期内的信息为对应用户的历史征信特征信息X’;取在表现期内的信息中对应用户的逾期表现信息为高风险表现结果Y’;表现期内的信息中存在逾期时,高风险表现结果Y’=1,表现期内的信息中不存在逾期时,高风险表现结果Y’=0,然后进入下一步;
Step1-4、将每个用户样本数据对应的历史征信特征信息X’和高风险表现结果Y’构建为一条预用样本数据;对预用样本数据进行缺失值处理、异常值剔除和归一化处理;然后进入下一步;
Step1-5、将多个所述预用样本数据中的一部分设定为训练集样本,另一部分设定为测试集样本。
8.按照权利要求7所述的一种信用风险评估系统,其特征在于,Step3中多元宇宙算法优化脊波神经网络模型的初始参数时,多元宇宙算法的旅行距离率
Figure FDA0003138952400000051
l为多元宇宙算法优化执行时的当前迭代次数,L为多元宇宙算法优化执行时的最大迭代次数,Q为常数,满足2000<Q<10000;
执行所述多元宇宙算法在每次迭代时,子代宇宙满足:
Figure FDA0003138952400000052
Figure FDA0003138952400000053
为第i个子代宇宙的第j个参数;
Figure FDA0003138952400000054
为根据轮盘机制选择的第k个父代宇宙的第j个参数;r2、r3和r4分别是在[0,1]之间的随机数;Xj为当下最好宇宙的第j个参数;lbj,ubj为第j个变量的下边界和上边界;WEP为虫洞存在概率;ω为加权学习因子,且其值随迭代次数l增加而递减,ω∈[0,1],且满足:
Figure FDA0003138952400000055
9.一种电子设备,其特征在于,包括:存储器和处理器,所述处理器和所述存储器连接;
所述存储器用于存储程序;
所述处理器调用存储于所述存储器中的程序,以执行如权利要求5-8中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被计算机运行时执行如权利要求5-8中任一项所述的方法。
CN202110726751.1A 2021-06-29 2021-06-29 一种信用风险评估系统、方法、设备及介质 Pending CN113487403A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110726751.1A CN113487403A (zh) 2021-06-29 2021-06-29 一种信用风险评估系统、方法、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110726751.1A CN113487403A (zh) 2021-06-29 2021-06-29 一种信用风险评估系统、方法、设备及介质

Publications (1)

Publication Number Publication Date
CN113487403A true CN113487403A (zh) 2021-10-08

Family

ID=77936736

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110726751.1A Pending CN113487403A (zh) 2021-06-29 2021-06-29 一种信用风险评估系统、方法、设备及介质

Country Status (1)

Country Link
CN (1) CN113487403A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114037311A (zh) * 2021-11-17 2022-02-11 北京中百信信息技术股份有限公司 一种信息系统工程监理项目风险评估方法
CN116452320A (zh) * 2023-04-12 2023-07-18 西南财经大学 一种基于持续学习的信用风险预测方法
CN117350615A (zh) * 2023-09-18 2024-01-05 嘉兴环洋电商物流服务有限公司 一种国际物流轨迹追踪系统及方法
CN117557361A (zh) * 2023-11-10 2024-02-13 纬创软件(武汉)有限公司 基于数据分析的用户信用风险评估方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107481135A (zh) * 2017-08-16 2017-12-15 广东工业大学 一种基于bp神经网络的个人信用评价方法及系统
CN108399453A (zh) * 2018-01-24 2018-08-14 国家电网公司 一种电力客户信用等级评价方法和装置
CN110610412A (zh) * 2019-09-02 2019-12-24 深圳中兴飞贷金融科技有限公司 信用风险评估方法和装置、存储介质和电子设备
CN112930545A (zh) * 2019-02-19 2021-06-08 算话智能科技有限公司 信用评估的系统和方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107481135A (zh) * 2017-08-16 2017-12-15 广东工业大学 一种基于bp神经网络的个人信用评价方法及系统
CN108399453A (zh) * 2018-01-24 2018-08-14 国家电网公司 一种电力客户信用等级评价方法和装置
CN112930545A (zh) * 2019-02-19 2021-06-08 算话智能科技有限公司 信用评估的系统和方法
CN110610412A (zh) * 2019-09-02 2019-12-24 深圳中兴飞贷金融科技有限公司 信用风险评估方法和装置、存储介质和电子设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
张刚林: "进化优化脊波网络及其应用", 《武汉理工大学学报》 *
聂颖: "多元宇宙优化算法改进 SVM 参数", 《辽宁工程技术大学学报(自然科学版)》 *
赵世杰: "耦合横纵向个体更新策略的改进MVO算法", 《控制与决策》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114037311A (zh) * 2021-11-17 2022-02-11 北京中百信信息技术股份有限公司 一种信息系统工程监理项目风险评估方法
CN114037311B (zh) * 2021-11-17 2022-06-03 北京中百信信息技术股份有限公司 一种信息系统工程监理项目风险评估方法
CN116452320A (zh) * 2023-04-12 2023-07-18 西南财经大学 一种基于持续学习的信用风险预测方法
CN116452320B (zh) * 2023-04-12 2024-04-30 西南财经大学 一种基于持续学习的信用风险预测方法
CN117350615A (zh) * 2023-09-18 2024-01-05 嘉兴环洋电商物流服务有限公司 一种国际物流轨迹追踪系统及方法
CN117350615B (zh) * 2023-09-18 2024-04-19 嘉兴环洋电商物流服务有限公司 一种国际物流轨迹追踪系统及方法
CN117557361A (zh) * 2023-11-10 2024-02-13 纬创软件(武汉)有限公司 基于数据分析的用户信用风险评估方法及系统
CN117557361B (zh) * 2023-11-10 2024-04-26 纬创软件(武汉)有限公司 基于数据分析的用户信用风险评估方法及系统

Similar Documents

Publication Publication Date Title
CN113487403A (zh) 一种信用风险评估系统、方法、设备及介质
CN110084610B (zh) 一种基于孪生神经网络的网络交易欺诈检测系统
CN112037012A (zh) 一种基于pso-bp神经网络的互联网金融信用评价方法
CN112581263A (zh) 一种基于灰狼算法优化广义回归神经网络的信用评估方法
CN112001788B (zh) 一种基于rf-dbscan算法的信用卡违约欺诈识别方法
CN112308288A (zh) 一种基于粒子群优化lssvm的违约用户概率预测方法
CN110222838B (zh) 文档排序方法、装置、电子设备及存储介质
Sun et al. Boosting ant colony optimization via solution prediction and machine learning
Zhou et al. Personal credit default prediction model based on convolution neural network
CN113344438A (zh) 对贷中行为进行监控的贷款系统、监控方法、设备及介质
CN116055175A (zh) 联合对称不确定性和超参数优化神经网络的入侵检测方法
Ponmalar et al. Hybrid Whale Tabu algorithm optimized convolutional neural network architecture for intrusion detection in big data
CN115577259A (zh) 高压直流输电系统故障选极方法、装置和计算机设备
CN115396212A (zh) 检测模型的训练方法、装置、计算机设备和存储介质
Nadu An Intrusion Detection System Using a Machine Learning Approach in IOT-based Smart Cities
Zhu et al. Loan default prediction based on convolutional neural network and LightGBM
US11972335B2 (en) System and method for improving classification in adversarial machine learning
CN117785993A (zh) 图模式的挖掘方法及装置
CN117010480A (zh) 模型训练方法、装置、设备、存储介质及程序产品
CN113177078B (zh) 基于条件生成模型的近似查询处理算法
CN114332480A (zh) 图数据分类模型训练方法、装置、设备及存储介质
CN113554510A (zh) 一种贷款用户违约实时监控系统
CN111125541A (zh) 面向多用户的可持续多云服务组合的获取方法
Rodin Growing small businesses using software system for intellectual analysis of financial performance
Gao Financial Loan Default Risk Prediction Based on Big Data Analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20211008