CN113554510A - 一种贷款用户违约实时监控系统 - Google Patents
一种贷款用户违约实时监控系统 Download PDFInfo
- Publication number
- CN113554510A CN113554510A CN202110894633.1A CN202110894633A CN113554510A CN 113554510 A CN113554510 A CN 113554510A CN 202110894633 A CN202110894633 A CN 202110894633A CN 113554510 A CN113554510 A CN 113554510A
- Authority
- CN
- China
- Prior art keywords
- user
- loan
- default
- data
- lending
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 26
- 230000000977 initiatory effect Effects 0.000 claims abstract description 4
- 241000196324 Embryophyta Species 0.000 claims description 39
- 238000012360 testing method Methods 0.000 claims description 22
- 238000004422 calculation algorithm Methods 0.000 claims description 21
- 238000012549 training Methods 0.000 claims description 19
- 238000000034 method Methods 0.000 claims description 18
- 238000005457 optimization Methods 0.000 claims description 15
- 238000007781 pre-processing Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 12
- 238000011835 investigation Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 7
- 230000035945 sensitivity Effects 0.000 claims description 6
- 230000002159 abnormal effect Effects 0.000 claims description 5
- 238000002790 cross-validation Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 44
- 230000006399 behavior Effects 0.000 description 17
- 238000013507 mapping Methods 0.000 description 7
- 238000009792 diffusion process Methods 0.000 description 4
- 238000010845 search algorithm Methods 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 4
- 238000013475 authorization Methods 0.000 description 3
- 230000009977 dual effect Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 230000002860 competitive effect Effects 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000001172 regenerating effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 206010036590 Premature baby Diseases 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013524 data verification Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Strategic Management (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Business, Economics & Management (AREA)
- Computing Systems (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Biomedical Technology (AREA)
- Accounting & Taxation (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Technology Law (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physiology (AREA)
- Genetics & Genomics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种客户违约实时监控系统,包括贷款用户端、服务端和出借用户端,所述贷款用户端和出借用户端均和服务端通信;所述贷款用户端,用于发起贷款申请请求向服务端;所述服务端,用于在接收到贷款申请请求后,根据贷款申请请求拟定智能合约发向贷款用户端;所述出借用户端,还用于在接收到智能合约后,进行签署或退回;所述服务端,在收到所述出借用户端签署的智能合约后,执行贷款操作;在所述服务端将智能合约发送至出借用户端时,对所述贷款用户端的贷款用户执行违约概率预测,并将预测结果同步发送至出借用户端。本发明能够及时的对贷款用户的违约概率进行预测,并在发生违约是直接执行智能合约,可以有效的降低贷款风险。
Description
技术领域
本发明属于人工智能技术领域,尤其涉及一种贷款用户违约实时监控系统。
背景技术
随着互联网金融的发展,越来越多的人开始在网络上进行贷款操作,网络贷款为的主要是便捷性和快捷性,但若如传统线下贷款一样,进行材料提供和材料审核,势必会让贷款进度变慢。而若不进行有效的资料审核,势必会给贷款操作带来巨大的坏账风险。
发明内容
本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种贷款用户违约实时监控系统,能够及时的对贷款用户的违约概率进行预测,并在发生违约是直接执行智能合约,可以有效的降低贷款风险。
为解决上述技术问题,本发明采用的技术方案是:一种客户违约实时监控系统,包括贷款用户端、服务端和出借用户端,所述贷款用户端和出借用户端均和服务端通信;
所述贷款用户端,用于发起贷款申请请求向服务端;
所述服务端,用于在接收到贷款申请请求后,根据贷款申请请求拟定智能合约发向贷款用户端;
所述贷款用户端,还用于在接收到智能合约后,进行签署或退回;
所述服务端,在收到所述贷款用户端签署的智能合约后,将智能合约发送至出借用户端;
所述出借用户端,还用于在接收到智能合约后,进行签署或退回;
所述服务端,在收到所述出借用户端签署的智能合约后,执行贷款操作;
在所述服务端将智能合约发送至出借用户端时,对所述贷款用户端的贷款用户执行违约概率预测,并将预测结果同步发送至出借用户端;
所述服务端,还用于在所述贷款用户出现违约情况时,根据智能合约中的条款进行执行违约惩罚操作。
上述贷款用户违约实时监控系统,所述服务端执行违约概率预测,包括以下步骤:
步骤1、调取贷款用户在贷款用户端注册时的个人基本信息和在贷款用户端操作时的行为数据;
步骤2、基于个人基本信息查询并抽取个人征信数据;
步骤3、对个人征信数据和行为数据预处理,生成用户特征数据;
步骤4、将用户特征数据输入预设的违约概率预测模型中,输出预测的用户违约概率。
上述贷款用户违约实时监控系统,所述服务端,用于周期性的重新生成违约概率预测模型。
上述贷款用户违约实时监控系统,所述服务端重新生成违约概率预测模型,包括以下步骤:
Step1、从数据库中抽取若干用户的样本数据,所述样本数据包括基于用户的个人征信数据和行为数据预处理生成的用户特征数据和用户实际违约数据;
Step2、将若干样本数据随机分配,生成训练数据集和测试数据集;
Step3、采用训练数据集对SVR模型进行训练;
Step4、采用测试数据集,对训练完成的SVR模型进行测试,若测试通过,则进入下一步,若测试未通过,则进入Step2;
Step5、将测试通过后的SVR模型作为违约概率预测模型。
上述贷款用户违约实时监控系统,对SVR模型进行训练时,输入为用户特征数据,输出为基于用户实际违约数据得到的违约概率数据,所述用户实际违约数据为实际违约天数a,违约概率数据为a%。
上述贷款用户违约实时监控系统,对SVR模型进行训练时,采用五折交叉验证法进行参数寻优。
上述贷款用户违约实时监控系统,对SVR模型进行训练时,利用杂草优化算法对SVR模型中的模型参数进行优化,所述模型参数包括:误差敏感系数ε、惩罚函数C和核函数的宽度参数σ。
上述贷款用户违约实时监控系统,利用杂草优化算法对SVR模型中的模型参数进行优化时,随机产生若干杂草个体,每个杂草个体对应一组模型参数;对SVR模型中的模型参数进行优化的过程,是寻找最优杂草个体的过程;随机产生若干杂草个体时,包括以下步骤:
在d维空间中随机产生一个d维向量Y1=(y1,y2,…,yd)作为第一个杂草个体,其中yi∈[-1,1],1≤i≤d;
根据yi=r-2yi-yi 3对所述d维向量Y逐维进行M-1次迭代,产生其余M-1个杂草个体;其中,yi∈[-1,1],i=(0,1,…,M)为杂草个体序列,M≤d;r为随机数。
上述贷款用户违约实时监控系统,Step1中对样本数据的预处理包括:根据用户的个人征信数据筛选出用户实际违约数据,并将用户实际违约数据产生前的所有个人征信数据和行为数据作为用户特征数据。
上述贷款用户违约实时监控系统,Step1中对样本数据的预处理还包括:对采集的个人征信数据进行缺失值处理、异常值处理和标准化处理。
本发明与现有技术相比具有以下优点:本发明能够在贷款前及时的对贷款用户的违约概率进行预测,并在发生违约是直接执行智能合约,可以有效的降低贷款风险。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为本发明的系统架构图。
具体实施方式
如图1所示,一种客户违约实时监控系统,包括贷款用户端1、服务端2和出借用户端3,所述贷款用户端1和出借用户端3均和服务端2通信;
所述贷款用户端1,用于发起贷款申请请求向服务端2;
所述服务端2,用于在接收到贷款申请请求后,根据贷款申请请求拟定智能合约发向贷款用户端1;
所述贷款用户端1,还用于在接收到智能合约后,进行签署或退回;
所述服务端2,在收到所述贷款用户端1签署的智能合约后,将智能合约发送至出借用户端3;
所述出借用户端3,还用于在接收到智能合约后,进行签署或退回;
所述服务端2,在收到所述出借用户端3签署的智能合约后,执行贷款操作;
在所述服务端2将智能合约发送至出借用户端3时,对所述贷款用户端1的贷款用户执行违约概率预测,并将预测结果同步发送至出借用户端3;
所述服务端2,还用于在所述贷款用户出现违约情况时,根据智能合约中的条款进行执行违约惩罚操作。
本实施例中,所述出借用户端3为银行放贷人员使用的用户端;所述智能合约指当被触发时,可自动执行的合约,例如使用债券抵押贷款,当贷款用户违约后,可直接将债券所有权转到银行名下。
实际使用时,贷款用户只需在贷款用户端1进行简单的操作发起贷款申请请求,而通过服务端2对贷款用户执行违约概率预测,可以让出借用户端3的放贷人员不需要复杂的分析即可得到一个参考,来决定是否进行放贷,从而在保证贷款操作效率的前提下,依旧能够降低违约风险。
本实施例中,所述服务端2执行违约概率预测,包括以下步骤:
步骤1、调取贷款用户在贷款用户端1注册时的个人基本信息和在贷款用户端1操作时的行为数据;
需要说明的是,个人基本信息如:姓名、年龄、身份证号、征信查询授权指令等等;行为数据包括埋点时采集的设备行为数据和日志数据,其中设备行为数据包括:登录本平台的次数、点击次数、点击频率、输入总耗时及平均耗时、手机号数据、GPS位置、MAC地址、IP地址数据、LBS、WIF数据、地理信息申请频次、IP的申请频次、设备电量占比、陀螺仪的平均加速度,另外日志数据包括:7天内登录次数、首次点击到申请授信时长、一天内最多的session数、申请授信前一周的行为统计等获取历史上用户注册、登录、身份信息提交等用户APP端操作事件,根据各个历史用户操作事件追踪该用户的历史用户行为轨迹,以及历史用户行为轨迹数据等。
步骤2、基于个人基本信息查询并抽取个人征信数据;
需要说明的是,个人征信数据包括个人消费数据、收入数据,还包括如信用卡通过率、贷款通过率、贷款查询次数、多头借贷数据等;
步骤3、对个人征信数据和行为数据预处理,生成用户特征数据;
需要说明的是,此处对个人征信数据和行为数据预处理,是指对个人征信数据和行为数据执行特征标记操作,可采用分类器进行标记;
步骤4、将用户特征数据输入预设的违约概率预测模型中,输出预测的用户违约概率。
需要说明的是,违约概率预测模型为神经网络模型,本实施例中采用支持向量回归机,即SVR模型。
本实施例中,所述服务端2,用于周期性的重新生成违约概率预测模型。
本实施例中,所述服务端2重新生成违约概率预测模型,包括以下步骤:
Step1、从数据库中抽取若干用户的样本数据,所述样本数据包括基于用户的个人征信数据和行为数据预处理生成的用户特征数据和用户实际违约数据;
需要说明的是,Step1中对样本数据的预处理包括:根据用户的个人征信数据筛选出用户实际违约数据,并将用户实际违约数据产生前的所有个人征信数据和行为数据作为用户特征数据。
需要说明的是,Step1中对样本数据的预处理还包括:对采集的个人征信数据进行缺失值处理、异常值处理和标准化处理。
所述缺失值处理包括判断所述个人征信数据中的数据缺失状态,若大于缺失阈值则采用随机森林算法填补缺失数据;若小于缺失阈值则采用均值法对缺失数据进行填补,对离散非数值型属性进行one-hot编码,得到预处理结果;
异常值处理指删除数据值异常的数据,例如数据值过大或过小的数据。
所述标准化处理常见的方法有最大最小标准化和Zsocre标准化。本申请采用的是最大最小标准化,表达式如下:
Step2、将若干样本数据随机分配,生成训练数据集和测试数据集;
需要说明的是,此处采用7:3的比例,生成训练数据集和测试数据集;
Step3、采用训练数据集对SVR模型进行训练;
需要说明的是,SVR模型指支持向量回归机(Support Vector Regression,SVR)是在支持向量机(Support Vector Machine,SVM)基础上发展起来的非线性回归算法。与SVM一样,SVR的目标也是寻找空间中的最优超平面,但是与SVM不同,SVM所找到的是能将样本分割的超平面,而SVR找到的是能准确预测样本分布的超平面。SVR通过构建非线性映射,将原始数据集映射至高位甚至无穷维的一个新的特征空间中,不敏感损失函数的引入替代了SVM高维空间中的内积运算,免去了在高维空间计算复杂的点积运算;
SVR模型具有较好的推广能力和非线性处理能力,尤其在处理高维数据时,能有效地解决“维数灾难”问题,能够较好地解决小样本、非线性、高维数和局部极小点等实际问题,并成功应用于分类、回归、时间序列预测等领域;
此处假定有训练数据集T={(xi,yi)}={(x1,y1),(x2,y2),…,(xn,yn)},xi∈Rm代表输入空间的一个样本,m为训练数据的维数,yi∈R是该样本对应的输出值,为对应的信用评分值,i=1,…,n是样本数;SVR模型首先将输入向量通过一个非线性映射φ(x)映射到一个高维Hilbert特征空间,然后在高维特征空间中构造优化超平面,进行线性回归,线性回归函数表现形式为:
f(x)=wTφ(x)+b
其中,w∈Rm为权值向量;φ(x)为非线性映射函数;b为阈值。
SVR模型的训练需要最小化权值w和b阈值,|yi-f(xi)|为真实数据与输出数据的差值,为了使SVR模型保持较好的稀疏性,定义不敏感损失函数ε>0,当|yi-f(xi)|>ε时计算损失。通过引入不敏感损失函数使误差得到控制;对于代价函数的风险最小化求解,可以通过最小化欧几里得范数来实现;从而问题转化为一个凸优化问题,得到代价函数:
根据结构风险最小化准则,引入松弛变量ξi和ξ*i以处理ε不能估计的数据,因此SVR转变为求解以下目标函数的最小化的问题;对于代价函数的风险最小化求解,可以转化为目标函数:
s.t.yi-<w,φ(x)>-b≤w+ξi i=1,2,…,n
其中,||w||2为Euclidean范数,用来描述函数f的复杂度;C>为惩罚系数,用于平衡算法复杂度与样本误差之间的权重,对样本中超出误差ε的惩罚度进行控制;yi∈R为输出样本,i=1,…,n是样本数;ξi和ξ*i为松弛变量;
为解决上述凸优化问题,引入拉格朗日乘子αi、α*i≥0,构造拉格朗日函数,求导使得函数最小;再化为其对偶形式,从而求得支持向量非线性回归函数,经对偶转换得到的回归函数的表达式为:
其中,xi、x分别为训练集和测试集的特征向量,i=1,2,…,n为样本数;αi、α*i为拉格朗日乘子;φ(x)为非线性映射函数;b为阈值;<φ(xi),φ(x>是映射函数的点积;
由于非线性函数φ(x)未知,而特征空间的维数很高(甚至无穷),因此权值向量w难以求得,为了解决这个问题,利用对偶原理和拉格朗日函数引入核函数k(xi,x)代替上述表达式中映射函数的点积<φ(xi),φ(x>,可以实现低维空间向高维空间的精确映射,从而较好地解决多因素非线性预测问题;
引入核函数后的回归函数的表达式为:
其中,xi、x分别为训练集和测试集的特征向量;αi、α*i为拉格朗日乘子;k(xi,x)为核函数;b为阈值。
核函数k(xi,x)的选取对支持向量回归机分析影响很大,常用的核函数主要有线性函数、多项式函数、sigmoid函数和径向基函数(RBF函数)。相比其他核函数,RBF函数只需要确定一个参数:核函数的宽度,具有复杂度低、预测误差小、拟合精度高、非线性逼近能力强等优点,故本专利采用RBF函数作为核函数,RBF核函数表达式如下:
其中,xi、x分别为训练集和测试集的特征向量;σ为核函数的宽度。
SVR模型中,误差敏感系数ε是样本数据不敏感区域的宽度,取值大小影响回归模型的精度,若数值过小,则回归精度较高,得不到好的推广能力;若过大模型简单,导致学习精度不够;惩罚函数C反映了算法对超出ε的样本数据的惩罚程度,若C取值过大,易导致模型的泛化能力变差,C取值较小,易使ε不敏感,使得训练误差变大;核函数的宽度参数σ控制了函数的径向作用范围,反映了训练集分布特征,进而决定局部领域的带宽;
SVR模型中参数误差敏感系数ε、惩罚函数C、核函数的宽度参数σ组合(ε,C,σ)的值的选择影响预测的精度,若参数选取不当,将会导致SVR模型的过学习或欠学习现象。所以需要建立优化的预测模型就需要选取最优的参数组合来最小化实际值和预测值之间的误差;
Step4、采用测试数据集,对训练完成的SVR模型进行测试,若测试通过,则进入下一步,若测试未通过,则进入Step2;
Step5、将测试通过后的SVR模型作为违约概率预测模型。
本实施例中,对SVR模型进行训练时,输入为用户特征数据,输出为基于用户实际违约数据得到的违约概率数据,所述用户实际违约数据为实际违约天数a,违约概率数据为a%。
需要说明的是,实际中违约天数越长,越说明诚信度越低,越容易在以后再次出现违约,故基于违约天数得到违约概率数据为a%,是一个比较简单准确的数据。
本实施例中,对SVR模型进行训练时,采用五折交叉验证法进行参数寻优。
本实施例中,对SVR模型进行训练时,利用杂草优化算法对SVR模型中的模型参数进行优化,所述模型参数包括:误差敏感系数ε、惩罚函数C和核函数的宽度参数σ。
本实施例中,利用杂草优化算法对SVR模型中的模型参数进行优化时,随机产生若干杂草个体,每个杂草个体对应一组模型参数;对SVR模型中的模型参数进行优化的过程,是寻找最优杂草个体的过程;随机产生若干杂草个体时,包括以下步骤:
在d维空间中随机产生一个d维向量Y1=(y1,y2,…,yd)作为第一个杂草个体,其中yi∈[-1,1],1≤i≤d;
根据yi=r-2yi-yi 3对所述d维向量Y逐维进行M-1次迭代,产生其余M-1个杂草个体;其中,yi∈[-1,1],i=(0,1,…,M)为杂草个体序列,M≤d;r为随机数。
需要说明的是,杂草优化算法(Invasive Weed Optimization,IWO)主要模拟杂草的扩散、繁殖、生长和竞争行为的一种元启发式搜索算法,以群体中优秀个体来指导种群的进化,以正态分布动态改变标准差的方式将由优秀个体产生的子代个体叠加在父代个体周围,通过种子的空间扩散、生长、繁殖和竞争消亡,同时采用子父代竞争排斥机制,最大限度保留有用信息,避免早熟和陷入局部最优。
杂草优化算法包括:种群初始化、生长繁殖、空间扩散和竞争淘汰四个步骤,多次重复生长繁殖、空间扩散和竞争淘汰直至达到停止准则,即可输出最优解。
本实施例中,通过将杂草优化算法的种群初始化进行改进,解决了传统的杂草优化算法的随机产生杂草的初始位置有可能会导致位置分布不均匀的问题。
为了评价训练后的SVR模型预测能力及模型的稳定性,验证杂草搜索算法优化支持向量回归机的优越性,分别用原始支持向量回归机、遗传算法(GA)、粒子群算法(PSO)、杂草搜索算法(IWO)和改进后的杂草搜索算法(IIWO)来优化支持向量回归机的性能对比,采用准确率(precision)、召回率(recall)以及F1分数(F1score)等指标来衡量模型的性能。
所述准确率(precision)为预测准确违约概率样本数与预测违约概率样本数的百分比;召回率(recall)为预测准确违约概率样本数与实际违约概率样本数的百分比;F1分数(F1score)是统计学中用来衡量二分类模型精确度的一种指标,它同时兼顾了用户流失预测模型的准确率和召回率,可以看作是准确率和召回率的一种加权平均。
各元启发式智能算法GA-SVR,PSO-SVR,IWO-SVR和改进IWO-SVR中,种群的最大迭代次数为200,种群规模为20,惩罚参数C范围(0,100],核参数σ范围(0,100]、误差敏感系数ε范围(0,1];设置遗传算法(GA)的交叉概率为0.8,变异概率为0.05。粒子群算法(PSO)更新速度c1取1.49445,更新速度c2取0.5,粒子最大速度取0.5,最小速度取-0.5;杂草算法(IWO)和改进的杂草算法(IIWO)参数:初始种群大小P=5,最大迭代次数itermax=200,问题的求解维数dim=29~125,最大种群数量Pmax=500,最大种子数seedmax=5,最小种子数seedmin=0,初始标准差σinit=0.1,最终标准差σfin=0.001。各个模型性能结果如下:
改进的IWO实验都获得了比GA和PSO更高的Precision、Recall和F1-Score值,表现出改进杂草算法具有极好的搜索能力和稳定性。
以上所述,仅是本发明的较佳实施例,并非对本发明作任何限制,凡是根据本发明技术实质对以上实施例所作的任何简单修改、变更以及等效结构变化,均仍属于本发明技术方案的保护范围内。
Claims (10)
1.一种客户违约实时监控系统,其特征在于,包括贷款用户端、服务端和出借用户端,所述贷款用户端和出借用户端均和服务端通信;
所述贷款用户端,用于发起贷款申请请求向服务端;
所述服务端,用于在接收到贷款申请请求后,根据贷款申请请求拟定智能合约发向贷款用户端;
所述贷款用户端,还用于在接收到智能合约后,进行签署或退回;
所述服务端,在收到所述贷款用户端签署的智能合约后,将智能合约发送至出借用户端;
所述出借用户端,还用于在接收到智能合约后,进行签署或退回;
所述服务端,在收到所述出借用户端签署的智能合约后,执行贷款操作;
在所述服务端将智能合约发送至出借用户端时,对所述贷款用户端的贷款用户执行违约概率预测,并将预测结果同步发送至出借用户端;
所述服务端,还用于在所述贷款用户出现违约情况时,根据智能合约中的条款进行执行违约惩罚操作。
2.按照权利要求1所述的一种贷款用户违约实时监控系统,其特征在于,所述服务端执行违约概率预测,包括以下步骤:
步骤1、调取贷款用户在贷款用户端注册时的个人基本信息和在贷款用户端操作时的行为数据;
步骤2、基于个人基本信息查询并抽取个人征信数据;
步骤3、对个人征信数据和行为数据预处理,生成用户特征数据;
步骤4、将用户特征数据输入预设的违约概率预测模型中,输出预测的用户违约概率。
3.按照权利要求2所述的一种贷款用户违约实时监控系统,其特征在于,所述服务端,用于周期性的重新生成违约概率预测模型。
4.按照权利要求3所述的一种贷款用户违约实时监控系统,其特征在于,所述服务端重新生成违约概率预测模型,包括以下步骤:
Step1、从数据库中抽取若干用户的样本数据,所述样本数据包括基于用户的个人征信数据和行为数据预处理生成的用户特征数据和用户实际违约数据;
Step2、将若干样本数据随机分配,生成训练数据集和测试数据集;
Step3、采用训练数据集对SVR模型进行训练;
Step4、采用测试数据集,对训练完成的SVR模型进行测试,若测试通过,则进入下一步,若测试未通过,则进入Step2;
Step5、将测试通过后的SVR模型作为违约概率预测模型。
5.按照权利要求4所述的一种贷款用户违约实时监控系统,其特征在于,对SVR模型进行训练时,输入为用户特征数据,输出为基于用户实际违约数据得到的违约概率数据,所述用户实际违约数据为实际违约天数a,违约概率数据为a%。
6.按照权利要求5所述的一种贷款用户违约实时监控系统,其特征在于,对SVR模型进行训练时,采用五折交叉验证法进行参数寻优。
7.按照权利要求6所述的一种贷款用户违约实时监控系统,其特征在于,对SVR模型进行训练时,利用杂草优化算法对SVR模型中的模型参数进行优化,所述模型参数包括:误差敏感系数ε、惩罚函数C和核函数的宽度参数σ。
8.按照权利要求7所述的一种贷款用户违约实时监控系统,其特征在于,利用杂草优化算法对SVR模型中的模型参数进行优化时,随机产生若干杂草个体,每个杂草个体对应一组模型参数;对SVR模型中的模型参数进行优化的过程,是寻找最优杂草个体的过程;随机产生若干杂草个体时,包括以下步骤:
在d维空间中随机产生一个d维向量Y1=(y1,y2,…,yd)作为第一个杂草个体,其中yi∈[-1,1],1≤i≤d;
根据yi=r-2yi-yi 3对所述d维向量Y逐维进行M-1次迭代,产生其余M-1个杂草个体;其中,yi∈[-1,1],i=(0,1,…,M)为杂草个体序列,M≤d;r为随机数。
9.按照权利要求4所述的一种贷款用户违约实时监控系统,其特征在于,Step1中对样本数据的预处理包括:根据用户的个人征信数据筛选出用户实际违约数据,并将用户实际违约数据产生前的所有个人征信数据和行为数据作为用户特征数据。
10.按照权利要求9所述的一种贷款用户违约实时监控系统,其特征在于,Step1中对样本数据的预处理还包括:对采集的个人征信数据进行缺失值处理、异常值处理和标准化处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110894633.1A CN113554510A (zh) | 2021-08-05 | 2021-08-05 | 一种贷款用户违约实时监控系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110894633.1A CN113554510A (zh) | 2021-08-05 | 2021-08-05 | 一种贷款用户违约实时监控系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113554510A true CN113554510A (zh) | 2021-10-26 |
Family
ID=78105295
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110894633.1A Pending CN113554510A (zh) | 2021-08-05 | 2021-08-05 | 一种贷款用户违约实时监控系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113554510A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113971605A (zh) * | 2021-10-28 | 2022-01-25 | 中国银行股份有限公司 | 贷款风险降低方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108475393A (zh) * | 2016-01-27 | 2018-08-31 | 华为技术有限公司 | 通过合成特征和梯度提升决策树进行预测的系统和方法 |
CN108810914A (zh) * | 2018-05-08 | 2018-11-13 | 苏州工业职业技术学院 | 基于改进杂草算法的wsn节点分布优化方法 |
CN110175908A (zh) * | 2019-05-05 | 2019-08-27 | 湖南大学 | 一种进口增值税融资方法及装置 |
CN110998641A (zh) * | 2017-07-05 | 2020-04-10 | 瑞皮欧国际经济特区公司 | 基于智能合约的信贷网络 |
CN111324862A (zh) * | 2020-02-10 | 2020-06-23 | 深圳华策辉弘科技有限公司 | 贷中行为监控的方法及系统 |
US20200265512A1 (en) * | 2019-02-20 | 2020-08-20 | HSIP, Inc. | System, method and computer program for underwriting and processing of loans using machine learning |
CN112308288A (zh) * | 2020-09-29 | 2021-02-02 | 百维金科(上海)信息科技有限公司 | 一种基于粒子群优化lssvm的违约用户概率预测方法 |
-
2021
- 2021-08-05 CN CN202110894633.1A patent/CN113554510A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108475393A (zh) * | 2016-01-27 | 2018-08-31 | 华为技术有限公司 | 通过合成特征和梯度提升决策树进行预测的系统和方法 |
CN110998641A (zh) * | 2017-07-05 | 2020-04-10 | 瑞皮欧国际经济特区公司 | 基于智能合约的信贷网络 |
CN108810914A (zh) * | 2018-05-08 | 2018-11-13 | 苏州工业职业技术学院 | 基于改进杂草算法的wsn节点分布优化方法 |
US20200265512A1 (en) * | 2019-02-20 | 2020-08-20 | HSIP, Inc. | System, method and computer program for underwriting and processing of loans using machine learning |
CN110175908A (zh) * | 2019-05-05 | 2019-08-27 | 湖南大学 | 一种进口增值税融资方法及装置 |
CN111324862A (zh) * | 2020-02-10 | 2020-06-23 | 深圳华策辉弘科技有限公司 | 贷中行为监控的方法及系统 |
CN112308288A (zh) * | 2020-09-29 | 2021-02-02 | 百维金科(上海)信息科技有限公司 | 一种基于粒子群优化lssvm的违约用户概率预测方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113971605A (zh) * | 2021-10-28 | 2022-01-25 | 中国银行股份有限公司 | 贷款风险降低方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112949837B (zh) | 一种基于可信网络的目标识别联邦深度学习方法 | |
CN110009479B (zh) | 信用评价方法及装置、存储介质、计算机设备 | |
CN108648074B (zh) | 基于支持向量机的贷款评估方法、装置及设备 | |
CN112738034B (zh) | 一种基于垂直联邦学习的区块链钓鱼节点检测方法 | |
CN112053223A (zh) | 一种基于ga-svm算法的互联网金融欺诈行为检测方法 | |
Wang et al. | Research on personal credit risk evaluation based on XGBoost | |
CN112037011A (zh) | 一种基于foa-rbf神经网络的信用评分方法 | |
CN115994226B (zh) | 基于联邦学习的聚类模型训练系统及方法 | |
CN113239638A (zh) | 一种基于蜻蜓算法优化多核支持向量机的逾期风险预测方法 | |
CN112529685A (zh) | 一种基于bas-fnn的贷款用户信用评级方法及系统 | |
CN117150416B (zh) | 一种工业互联网异常节点的检测方法、系统、介质及设备 | |
Hu et al. | pRNN: A recurrent neural network based approach for customer churn prediction in telecommunication sector | |
CN111461231A (zh) | 一种短信息的发送控制方法、装置及存储介质 | |
CN112348655A (zh) | 一种基于afsa-elm的信用评估方法 | |
CN115238588A (zh) | 图数据处理方法、风险预测模型训练方法及装置 | |
Sawant et al. | Study of Data Mining Techniques used for Financial Data Analysis | |
CN111275485A (zh) | 基于大数据分析的电网客户等级划分方法、系统、计算机设备及存储介质 | |
CN113554510A (zh) | 一种贷款用户违约实时监控系统 | |
Zhou | Data mining for individual consumer credit default prediction under e-commence context: a comparative study | |
CN110855474B (zh) | Kqi数据的网络特征提取方法、装置、设备及存储介质 | |
Dash et al. | Designing an efficient predictor model using PSNN and crow search based optimization technique for gold price prediction | |
Xiong et al. | L-RBF: A customer churn prediction model based on lasso+ RBF | |
CN114265954B (zh) | 基于位置与结构信息的图表示学习方法 | |
CN117033997A (zh) | 数据切分方法、装置、电子设备和介质 | |
Zhu et al. | Short‐Term Load Forecasting Based on Gaussian Process Regression with Density Peak Clustering and Information Sharing Antlion Optimizer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20211026 |
|
RJ01 | Rejection of invention patent application after publication |