CN110930237B - 一种基于sagwo算法的中小企业信用预测分类方法 - Google Patents
一种基于sagwo算法的中小企业信用预测分类方法 Download PDFInfo
- Publication number
- CN110930237B CN110930237B CN201911000849.8A CN201911000849A CN110930237B CN 110930237 B CN110930237 B CN 110930237B CN 201911000849 A CN201911000849 A CN 201911000849A CN 110930237 B CN110930237 B CN 110930237B
- Authority
- CN
- China
- Prior art keywords
- wolf
- follows
- credit
- max
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 241000282461 Canis lupus Species 0.000 claims abstract description 78
- 238000012706 support-vector machine Methods 0.000 claims abstract description 7
- 238000012360 testing method Methods 0.000 claims description 27
- 238000004364 calculation method Methods 0.000 claims description 25
- 238000012549 training Methods 0.000 claims description 24
- 239000013598 vector Substances 0.000 claims description 23
- 238000010606 normalization Methods 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 7
- 241000282421 Canidae Species 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 4
- 230000006978 adaptation Effects 0.000 claims description 3
- 238000006073 displacement reaction Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000002922 simulated annealing Methods 0.000 abstract description 5
- 238000013145 classification model Methods 0.000 abstract description 3
- 230000004927 fusion Effects 0.000 abstract 1
- 238000011161 development Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005251 gamma ray Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Evolutionary Computation (AREA)
- Finance (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Technology Law (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Development Economics (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于数据分类领域,具体涉及一种基于SAGWO算法的中小企业信用预测分类方法;利用征信机构或网络公开的中小企业信用数据集,采用一种基于模拟退火思想融合灰狼算法改进支持向量机模型的方法;首先,引入模拟退火思想,使灰狼算法在现有性能的基础上更好地排除局部最优解,获得更好的全局收敛性,以提高灰狼算法的全局和局部搜索能力,从而利用改进的支持向量机模型对中小企业信用样本进行数据分类,使优化过的模型进一步提高中小企业信用的分类准确率,同时也提高了支持向量机分类模型的效率。
Description
技术领域
本发明属于数据分类领域,具体涉及一种基于SAGWO算法的中小企业信用预测分类方法。
背景技术
我国民营中小企业自改革开放以来大力驱动经济发展,已经成为我国在技术创新方面的中流砥柱,然而它们自身的发展主要受到融资难的问题,而造成融资难的重要原因就是信用贷款问题。面对银行对中小企业不合理的信用预测分类设置,建立一套健全的中小企业信用预测分类方法是亟待解决的问题。因此通过使用数据挖掘技术中的重要方法支持向量机,将模拟退火思想融合灰狼算法,进行支持向量机优化,提出并构建更加高效的分类模型,不仅可以完善传统的中小企业信用预测分类方法,而且可以给灰狼算法的发展提供一种新的思路,对于进一步优化SVM模型的发展是非常具有意义的。
发明内容
针对上述存在的问题,本发明提出一种基于SAGWO算法的中小企业信用预测分类方法,以提高中小企业信用预测分类的准确率。
为实现上述目的,本发明具体技术方案如下:一种基于SAGWO算法的中小企业信用预测分类方法,包括以下步骤:
1)通过征信机构采集中小企业信用数据样本,构建初始信用数据样本集D,记为D={d1,d2,d3,...,dn},di表示D中第i个信用数据样本,每一个信用数据样本包括L个特征数据,记为di={di1,di2,...,diL},dij表示初始信用数据样本集D中的第 i个信用数据样本的第j个特征数据;
2)依次对初始信用数据样本集D中的特征数据进行数据预处理,构建数据处理后的信用数据样本集D';
3)构建训练集Dexe和测试集Dtest,其中训练集Dexe的构造方法为:
Dexe={(d1',y1),(d2',y2),...,(dp',yi)},di'∈D',yi∈{-1,1},
测试集Dtest的构造方法为:
Dtest={(d1',y1),(d2',y2),...,(dq',yi)},di'∈D',yi∈{-1,1},
其中,yi表示对应的信用数据样本构成的集合的类别,yi=-1、yi=1分别代表信用数据样本类别为坏企业和好企业;
4)将训练集Dexe导入支持向量机SVM,构建基于SAGWO算法的参数寻优模型,训练得到惩罚参数C及核函数参数γ;
5)将测试样本集Dtest导入训练好的SVM模型(含最优参数C及γ)中构建最终预测模型,根据决策函数sgn得到测试样本分类结果及每一分类对应的预测值,预测值f(x)计算公式如下:
其中,ai为拉格朗日系数,yi∈{1,-1}为训练样本集对应分类的标签,为径向基函数,xi(i=1...m)为训练样本集,xj(j=1...n) 为测试样本集,γ为核参数,b为预设的阈值;
6)根据预测值f(x)输出企业分类结果,若预测值f(x)=1,代表企业分类结果为好企业,若f(x)=-1,代表企业分类结果为坏企业。
进一步的,上述步骤2)中,构建信用数据样本集D',包括以下步骤:
2.1)利用部分填补缺失值法对初始信用数据样本集D中的特征数据进行数据清理;
2.2)利用直接赋值法对初始信用数据样本集D中的特征数据进行数据赋值;
2.3)利用最大最小归一化方法对初始信用数据样本集D中的特征数据进行数据归一化,归一化计算公式如下:
其中,dij'是第i个信用数据样本的第j个特征数据的归一化结果,min dij和 maxdij分别是dij的极小值和极大值;
2.4)利用dij'构建信用数据样本集D',记为:D'={d1',d2',d3',...,dn'},di'表示D' 中第i个信用数据样本,表示为di'={di1',di2',...,diL'}。
进一步的,上述步骤4)包括如下步骤:
4.1)初始GWO算法的参数,所述参数包括灰狼种群规模Q、最大迭代次数tmax、控制参数a、扰动因子G、收敛因子A以及SVM参数组合(C、γ)的取值范围;
4.2)初始化灰狼种群,随机生成Q个灰狼个体位置Xi,记为Xi=(Ci,γi),其中,所述Ci生成公式为:
Ci=(Cmax-Cmin)×r+Cmin
式中,i∈(1,N)为灰狼个体,r为[0,1]之间的随机小数,Cmin为C的最小值,Cmax为C的最大值;所述γi生成公式为:
γi=(γmax-γmin)×r+γmin,(i=1,2,...,n)
式中,i∈(1,N),r为[0,1]之间的随机小数,γmin为γ的最小值,γmax为γ的最大值;
4.3)计算SA算法的参数初始温度Te,计算公式如下:
其中,fmax(Xi)、fmin(Xi)分别为初始Q个可行解(灰狼个体位置)中对应的最大和最小综合最优化SVM目标函数值,e为自然底数,pini∈(0,1)为初始控制接受概率;
4.4)计算每个灰狼位置Xi的适应度值F(Xi),计算公式如下:
其中,为SVM训练样本分类准确度,right为正确分类样本数,total为总训练样本数,α是[0,1]的随机数,β=1-α,Cm为数据特征向量总数,R 是被选择的特征向量数量;
4.5)降序排列F(Xi),选取前三个作为Xα、Xβ、Xδ的适应度值,其中α狼为最优解、β狼为次优解、δ狼为次次优解;
4.6)按步骤4.1.2)、步骤4.1.3)、步骤4.1.4)中公式分别重新计算控制参数a、扰动因子G、收敛因子A;
4.7)计算其余灰狼i与Xα、Xβ、Xδ之间的距离Dα、Dβ、Dδ,灰狼i与α狼的距离Dα计算公式如下:
Dα=|G1·Xα-Xi|
其中,Xα为α狼的位置,G1为随机向量,Xi为当前灰狼i的位置;灰狼i与β狼的距离Dβ计算公式如下:
Dβ=|G2·Xβ-Xi|
其中,Xβ为β狼的位置,G2为随机向量,Xi为当前灰狼i的位置;灰狼i与δ狼的距离Dδ计算公式如下:
Dδ=|G3·Xδ-Xi|
其中,Xδ为δ狼的位置,G3为随机向量,Xi为当前灰狼i的位置;
4.8)计算灰狼i的新位置Xi'并按步骤4.4)更新其适应度值得到Fi',Xi'计算公式如下:
其中,X1=Xα-A1·(Dα),X2=Xβ-A2·(Dβ),X3=Xδ-A3·(Dδ)分别为灰狼i与α、β、δ狼之间的位移,t为当前迭代次数;
4.9)采用Metropolis准则计算旧位置Xi适应度值Fi更新为新位置Xi'适应度值Fi'的接受概率p,接受概率p计算公式如下:
其中,Te为绝对初始温度,k为Boltzmann常数,p为小于1的位置概率,在 (0,1)区间生成随机数s,判断s是否小于p,若是则接受并保存灰狼i的新位置Xi',否则不接受并保存旧位置Xi;
4.10)退温,温度更新公式如下:
其中,Te为初始温度,e为自然底数,t为当前迭代次数,tmax为最大迭代次数;
4.11)判断当前迭代次数是否达到最大迭代次数tmax,若是则输出α狼的位置 Xα,即得到模型的最优惩罚参数C及最优核函数参数γ,否则转至步骤4.4)。
进一步的,上述步骤4.1)中所述控制参数a,计算公式如下:
其中,amax为a的最大取值,amin为a的最小取值,t为当前迭代次数,tmax为最大迭代次数;
所述扰动因子G,计算公式如下:
G=2·r1
其中,r1为[0,1]之间的随机向量;
所述收敛因子A,计算公式如下:
A=2a·r2-a
其中,r2为[0,1]之间的随机向量;
所述惩罚参数C范围设定如下:
C∈[Cmin,Cmax]
其中,Cmin为C的最小值,Cmax为C的最大值;
所述核函数参数γ范围设定如下:
γ∈[γmin,γmax]
其中,γmin为γ的最小值,γmax为γ的最大值。
本发明的有益效果在于提升灰狼算法的寻优性能问题,引入模拟退火思想SA 并改进相关公式使灰狼算法GWO能跳出局部最优解的缺陷,使GWO在现有性能的基础上更好地排除局部最优解,获得更好的全局收敛性,进而提高了群智能优化算法的收敛速度和精度,使得改进后的SAGWO-SVM模型更高效地进行数据分类,应用于更好的中小企业信用预测分类。
附图说明
图1是中小企业信用预测分类方法流程图。
图2是中小企业信用预测分类模型图。
图3是基于模拟退火算法的改进灰狼算法的流程图。
具体实施方式
下面结合附图以及具体实施例对本发明作进一步的说明,需要指出的是,下面仅以一种最优化的技术方案对本发明的技术方案以及设计原理进行详细阐述,但本发明的保护范围并不限于此。
所述实施例为本发明的优选的实施方式,但本发明并不限于上述实施方式,在不背离本发明的实质内容的情况下,本领域技术人员能够做出的任何显而易见的改进、替换或变型均属于本发明的保护范围。
一种基于SAGWO算法的中小企业信用预测分类方法,其流程图如图1所示,其模型图如图2所示,包括如下步骤:
1)通过征信机构采集中小企业信用数据样本,构建初始信用数据样本集D,记为D={d1,d2,d3,...,dn},di表示D中第i个信用数据样本,每一个信用数据样本包括L个特征数据,记为di={di1,di2,...,diL};
本发明具体实施例中,L=34,第i个信用数据样本为di={di1,di2,...,di34},dij为第i个信用数据样本的第j个特征属性,其中,di1代表第i个信用数据样本的近N 个月财务报表数据、di2代表报表日期、di3代表负债总额、di4代表资产负债率、di5代表代表流动比率、di6现金比率、di7代表净利润增长率、di8代表电费金额、di9代表水费金额、di10代表近6个月平均使用额度、di11代表贷记卡账户数、di12代表住房贷款笔数、di13代表贷款逾期笔数、di14代表最高逾期金额、di15代表最长逾期月数、di16代表逾期账户数、di17代表客户合作时间、di18代表企业历史交易笔数、di19代表客户历史交易总金额、di20代表近6个月交易金额、di21代表信贷平台历史交易笔数、di22代表信贷平台历史贷款发放金额、di23代表信贷平台历史逾期次数、 di24代表信贷平台历史逾期金额、di25代表信贷平台近3个月交易金额、di26代表企业年限、di27代表是否税务信用百强企业、di28代表纳税信用评级、di29代表3 年内个人是否进入执行失信黑名单、di30代表3年内企业是否进入执行失信黑名单、 di31代表企业有无在诉或被执行记录、di32代表法人/股东有无在诉及被执行记录、 di33代表行业口碑、di34代表关系紧密程度;
2)依次对初始信用数据样本集D中的特征数据进行数据预处理,构建数据处理后的信用数据样本集D',包括以下步骤:
2.1)利用部分填补缺失值法对初始信用数据样本集D中的特征数据进行数据清理;
2.2)利用直接赋值法对初始信用数据样本集D中的特征数据进行数据赋值;
2.3)利用最大最小归一化方法对初始信用数据样本集D中的特征数据进行数据归一化,归一化计算公式如下:
其中,dij是第i个信用数据样本的第j个特征数据,dij'是第i个信用数据样本的第j个特征数据的归一化结果,min dij和max dij分别是dij的极小值和极大值;
2.4)利用归一化后的数据dij'构建信用数据样本集D',记为: D'={d1',d2',d3',...,dn'},di'表示D'中第i个信用数据样本,本发明具体实施例中,每个信用数据样本包含34个特征数据,表示为di'={di1',di2',...,di34'},dij'为第i个对象的第j个特征属性;
3)构建训练集Dexe和测试集Dtest,其中训练集Dexe的构造方法为:
Dexe={(d1',y1),(d2',y2),...,(dp',yi)},di'∈D',yi∈{-1,1},
测试集Dtest的构造方法为:
Dtest={(d1',y1),(d2',y2),...,(dq',yi)},di'∈D',yi∈{-1,1},
其中,di'代表特征向量集D'中对应的信用数据样本,yi表示对应的信用数据样本构成的集合的类别,yi=-1、yi=1分别代表信用数据样本类别为坏企业和好企业;
4)将训练集Dexe导入支持向量机SVM,构建基于SAGWO算法的参数寻优模型,训练得到惩罚参数C及核函数参数γ,SAGWO算法流程图如图3所示,包括以下步骤:
4.1)初始GWO算法的参数,包括如下步骤:
4.1.1)初始化灰狼种群规模Q、最大迭代次数tmax;
4.1.2)计算控制参数a,计算公式如下:
其中,amax为a的最大取值,amin为a的最小取值,t为当前迭代次数,tmax为最大迭代次数;
4.1.3)计算扰动因子G,计算公式如下:
G=2·r1
其中,r1为[0,1]之间的随机向量;
4.1.4)计算收敛因子A,计算公式如下:
A=2a·r2-a
其中,r2为[0,1]之间的随机向量;
4.1.5)设定SVM参数组合(C、γ)的取值范围,惩罚参数C范围设定如下:
C∈[Cmin,Cmax]
其中,Cmin为C的最小值,Cmax为C的最大值;核函数参数γ范围设定如下:
γ∈[γmin,γmax]
其中,γmin为γ的最小值,γmax为γ的最大值;
4.2)初始化灰狼种群,包括如下步骤:随机生成Q个灰狼个体位置Xi,记为 Xi=(Ci,γi),Ci生成公式为:
Ci=(Cmax-Cmin)×r+Cmin
其中,i∈(1,N)为灰狼个体,r为[0,1]之间的随机小数,Cmin为C的最小值,Cmax为C的最大值;γi生成公式为:
γi=(γmax-γmin)×r+γmin,(i=1,2,...,n)
其中,i∈(1,N),r为[0,1]之间的随机小数,γmin为γ的最小值,γmax为γ的最大值;
4.3)计算SA算法的参数初始温度Te,计算公式如下:
其中,fmax(Xi)、fmin(Xi)分别为初始Q个可行解(灰狼个体位置)中对应的最大和最小综合最优化SVM目标函数值,e为自然底数,pini∈(0,1)为初始控制接受概率;
4.4)计算每个灰狼位置Xi的适应度值F(Xi),计算公式如下:
其中,为SVM训练样本分类准确度,right为正确分类样本数,total为总训练样本数,α是[0,1]的随机数,β=1-α,Cm为数据特征向量总数,R 是被选择的特征向量数量;
4.5)降序排列F(Xi),选取前三个作为Xα、Xβ、Xδ的适应度值,其中α狼为最优解、β狼为次优解、δ狼为次次优解;
4.6)按步骤4.1.2)、步骤4.1.3)、步骤4.1.4)中公式分别重新计算控制参数a、扰动因子G、收敛因子A;
4.7)计算其余灰狼i与Xα、Xβ、Xδ之间的距离Dα、Dβ、Dδ,灰狼i与α狼的距离Dα计算公式如下:
Dα=|G1·Xα-Xi|
其中,Xα为α狼的位置,G1为随机向量,Xi为当前灰狼i的位置;灰狼i与β狼的距离Dβ计算公式如下:
Dβ=|G2·Xβ-Xi|
其中,Xβ为β狼的位置,G2为随机向量,Xi为当前灰狼i的位置;灰狼i与δ狼的距离Dδ计算公式如下:
Dδ=|G3·Xδ-Xi|
其中,Xδ为δ狼的位置,G3为随机向量,Xi为当前灰狼i的位置;
4.8)计算灰狼i的新位置Xi'并按步骤4.4)更新其适应度值得到Fi',Xi'计算公式如下:
其中,X1=Xα-A1·(Dα),X2=Xβ-A2·(Dβ),X3=Xδ-A3·(Dδ)分别为灰狼i与α、β、δ狼之间的位移,t为当前迭代次数;
4.9)采用Metropolis准则计算旧位置Xi适应度值Fi更新为新位置Xi'适应度值Fi'的接受概率p,接受概率p计算公式如下:
其中,Te为绝对初始温度,k为Boltzmann常数,p为小于1的位置概率,在 (0,1)区间生成随机数s,判断s是否小于p,若是则接受并保存灰狼i的新位置Xi',否则不接受并保存旧位置Xi;
4.10)退温,温度更新公式如下:
其中,Te为初始温度,e为自然底数,t为当前迭代次数,tmax为最大迭代次数;
4.11)判断当前迭代次数是否达到最大迭代次数tmax,若是则算法结束并输出α狼的位置Xα,即得到模型的最优惩罚参数C及最优核函数参数γ,否则转至步骤4.4);
5)将测试样本集Dtest导入训练好的SVM模型(含最优参数C及γ)中构建最终预测模型,根据决策函数sgn得到测试样本分类结果及每一分类对应的预测值,预测值f(x)计算公式如下:
其中,ai为拉格朗日系数,yi∈{1,-1}为训练样本集对应分类的标签,为径向基函数,xi(i=1...m)为训练样本集,xj(j=1...n) 为测试样本集,γ为核参数,b为预设的阈值;
6)根据预测值f(x)输出企业分类结果,若预测值f(x)=1,代表企业分类结果为好企业,若f(x)=-1,代表企业分类结果为坏企业。
Claims (3)
1.一种基于SAGWO算法的中小企业信用预测分类方法,包括以下步骤:
1)通过征信机构采集中小企业信用数据样本,构建初始信用数据样本集D,记为D={d1,d2,d3,...,nd,di表示D中第i个信用数据样本,每一个信用数据样本包括L个特征数据,记为di={di1,di2,...,diL},dij表示初始信用数据样本集D中的第i个信用数据样本的第j个特征数据;
2)依次对初始信用数据样本集D中的特征数据进行数据预处理,构建数据处理后的信用数据样本集D';
3)构建训练集Dexe和测试集Dtest,所述训练集Dexe的构造方法为:
Dexe={(d1',y1),(d2',y2),...,(dp',yi)},di'∈D',yi∈{-1,1},
所述测试集Dtest的构造方法为:
Dtest={(d1',y1),(d2',y2),...,(dq',yi)},di'∈D',yi∈{-1,1},
其中,yi表示对应的信用数据样本构成的集合的类别,yi=-1、yi=1分别代表信用数据样本类别为坏企业和好企业;
4)将训练集Dexe导入支持向量机SVM,构建基于SAGWO算法的参数寻优模型,训练得到惩罚参数C及核函数参数γ;
所述步骤4)包括如下步骤:
4.1)初始GWO算法的参数,所述参数包括灰狼种群规模Q、最大迭代次数tmax、控制参数a、扰动因子G、收敛因子A以及SVM参数组合(C、γ)的取值范围;
4.2)初始化灰狼种群,随机生成Q个灰狼个体位置Xi,记为Xi=(Ci,γi),所述Ci生成公式为:
Ci=(Cmax-Cmin)×r+Cmin
其中,i∈(1,N)为灰狼个体,r为[0,1]之间的随机小数,Cmin为C的最小值,Cmax为C的最大值;所述γi生成公式为:
γi=(γmax-γmin)×r+γmin,(i=1,2,...,n)
其中,i∈(1,N),r为[0,1]之间的随机小数,γmin为γ的最小值,γmax为γ的最大值;
4.3)计算SA算法的参数初始温度Te,计算公式如下:
其中,fmax(Xi)、fmin(Xi)分别为初始Q个可行解中对应的最大和最小综合最优化SVM目标函数值,e为自然底数,pini∈(0,1)为初始控制接受概率;
4.4)计算每个灰狼位置Xi的适应度值F(Xi),计算公式如下:
其中,为SVM训练样本分类准确度,right为正确分类样本数,total为总训练样本数,α是[0,1]的随机数,β=1-α,Cm为数据特征向量总数,R是被选择的特征向量数量;
4.5)降序排列F(Xi),选取前三个作为Xα、Xβ、Xδ的适应度值,其中α狼为最优解、β狼为次优解、δ狼为次次优解;
4.6)按步骤4.1.2)、步骤4.1.3)、步骤4.1.4)中公式分别重新计算控制参数a、扰动因子G、收敛因子A;
4.7)计算其余灰狼i与Xα、Xβ、Xδ之间的距离Dα、Dβ、Dδ,所述灰狼i与α狼的距离Dα计算公式如下:
Dα=|G1·Xα-Xi|
其中,Xα为α狼的位置,G1为随机向量,Xi为当前灰狼i的位置;
所述灰狼i与β狼的距离Dβ计算公式如下:
Dβ=|G2·Xβ-Xi|
其中,Xβ为β狼的位置,G2为随机向量,Xi为当前灰狼i的位置;
所述灰狼i与δ狼的距离Dδ计算公式如下:
Dδ=|G3·Xδ-Xi|
其中,Xδ为δ狼的位置,G3为随机向量,Xi为当前灰狼i的位置;
4.8)计算灰狼i的新位置Xi'并按步骤4.4)更新其适应度值得到Fi',所述Xi'计算公式如下:
其中,X1=Xα-A1·(Dα),X2=Xβ-A2·(Dβ),X3=Xδ-A3·(Dδ)分别为灰狼i与α、β、δ狼之间的位移,t为当前迭代次数;
4.9)采用Metropolis准则计算旧位置Xi适应度值Fi更新为新位置Xi'适应度值Fi'的接受概率p,所述接受概率p计算公式如下:
其中,Te为绝对初始温度,k为Boltzmann常数,p为小于1的位置概率,在(0,1)区间生成随机数s,判断s是否小于p,若是则接受并保存灰狼i的新位置Xi',否则不接受并保存旧位置Xi;
4.10)退温,温度更新公式如下:
其中,Te为初始温度,e为自然底数,t为当前迭代次数,tmax为最大迭代次数;
4.11)判断当前迭代次数是否达到最大迭代次数tmax,若是则输出α狼的位置Xα,即得到模型的最优惩罚参数C及最优核函数参数γ,否则转至步骤4.4);
5)将测试样本集Dtest导入训练好的SVM模型中构建最终预测模型,根据决策函数sgn得到测试样本分类结果及每一分类对应的预测值,预测值f(x)计算公式如下:
其中,ai为拉格朗日系数,yi∈{1,-1}为训练样本集对应分类的标签,为径向基函数,xi(i=1...m)为训练样本集,xj(j=1...n)为测试样本集,γ为核参数,b为预设的阈值;
6)根据预测值f(x)输出企业分类结果,若预测值f(x)=1,代表企业分类结果为好企业,若f(x)=-1,代表企业分类结果为坏企业。
2.如权利要求1所述的基于SAGWO算法的中小企业信用预测分类方法,其特征在于所述步骤2)中,构建信用数据样本集D'包括以下步骤:
2.1)利用部分填补缺失值法对初始信用数据样本集D中的特征数据进行数据清理;
2.2)利用直接赋值法对初始信用数据样本集D中的特征数据进行数据赋值;
2.3)利用最大最小归一化方法对初始信用数据样本集D中的特征数据进行数据归一化,归一化计算公式如下:
其中,dij'是第i个信用数据样本的第j个特征数据的归一化结果,min dij和max dij分别是dij的极小值和极大值;
2.4)利用dij'构建信用数据样本集D',记为:D'={d1',d2',d3',...,dn'},di'表示D'中第i个信用数据样本,表示为di'={di1',di2',...,diL'}。
3.如权利要求1所述的基于SAGWO算法的中小企业信用预测分类方法,其特征在于所述步骤4.1)中所述控制参数a,计算公式如下:
其中,amax为a的最大取值,amin为a的最小取值,t为当前迭代次数,tmax为最大迭代次数;
所述扰动因子G,计算公式如下:
G=2r1
其中,r1为[0,1]之间的随机向量;
所述收敛因子A,计算公式如下:
A=2a·r2-a
其中,r2为[0,1]之间的随机向量;
所述惩罚参数C范围设定如下:
C∈[Cmin,Cmax]
其中,Cmin为C的最小值,Cmax为C的最大值;
所述核函数参数γ范围设定如下:
γ∈[γmin,γmax]
其中,γmin为γ的最小值,γmax为γ的最大值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911000849.8A CN110930237B (zh) | 2019-10-21 | 2019-10-21 | 一种基于sagwo算法的中小企业信用预测分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911000849.8A CN110930237B (zh) | 2019-10-21 | 2019-10-21 | 一种基于sagwo算法的中小企业信用预测分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110930237A CN110930237A (zh) | 2020-03-27 |
CN110930237B true CN110930237B (zh) | 2023-07-21 |
Family
ID=69849379
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911000849.8A Active CN110930237B (zh) | 2019-10-21 | 2019-10-21 | 一种基于sagwo算法的中小企业信用预测分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110930237B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116681435A (zh) * | 2023-01-03 | 2023-09-01 | 黑龙江圣轨科技有限公司 | 一种基于区块链的网络数据安全监测系统及方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060212386A1 (en) * | 2005-03-15 | 2006-09-21 | Willey Dawn M | Credit scoring method and system |
CN102005003A (zh) * | 2010-11-17 | 2011-04-06 | 苏州德融嘉信信用管理技术有限公司 | 基于信用评级工作系统的企业信息数据维护方法 |
CN105719073A (zh) * | 2016-01-18 | 2016-06-29 | 苏州汇誉通数据科技有限公司 | 一种企业信用评价系统及方法 |
CN106022517A (zh) * | 2016-05-17 | 2016-10-12 | 温州大学 | 一种基于核极限学习机的风险预测的方法和装置 |
CN106355192B (zh) * | 2016-08-16 | 2019-12-31 | 温州大学 | 一种基于混沌灰狼优化的支持向量机方法 |
CN110345392B (zh) * | 2019-07-16 | 2021-01-12 | 辽宁石油化工大学 | 输油管道漏点的定位方法及装置 |
-
2019
- 2019-10-21 CN CN201911000849.8A patent/CN110930237B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN110930237A (zh) | 2020-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020063690A1 (zh) | 一种电力系统预测的方法和装置 | |
US7395235B2 (en) | Strategy independent optimization of multi objective functions | |
US7536348B2 (en) | Enhancing delinquent debt collection using statistical models of debt historical information and account events | |
CN110599336B (zh) | 一种金融产品购买预测方法及系统 | |
Chung et al. | Bankruptcy prediction using cerebellar model neural networks | |
Voican | Credit Card Fraud Detection using Deep Learning Techniques. | |
JPWO2020075771A1 (ja) | 計画装置、計画方法、および計画プログラム | |
AU2020377394B2 (en) | Hierarchical deep neural network forecasting of cashflows with linear algebraic constraints | |
CN111210332A (zh) | 贷后管理策略生成方法、装置及电子设备 | |
Bhandari et al. | An artificial intelligence ATM forecasting system for hybrid neural networks | |
Chatterjee et al. | Stock volatility prediction using time series and deep learning approach | |
Stankovic et al. | Forecasting ethereum price by tuned long short-term memory model | |
Li et al. | Application of genetic optimization algorithm in financial portfolio problem | |
CN110930237B (zh) | 一种基于sagwo算法的中小企业信用预测分类方法 | |
WO2007073063A1 (en) | Method of technology valuation | |
US11636536B2 (en) | Systems and methods for automating pricing desk operation | |
CN110807543A (zh) | 一种基于群决策智能搜索的投资组合优化方法和装置 | |
CN116611911A (zh) | 基于支持向量机的信用风险预测方法及装置 | |
CN113240359B (zh) | 一种应对外界重大变动的需求预测方法 | |
Botha et al. | The loss optimisation of loan recovery decision times using forecast cash flows | |
CN111340281B (zh) | 预测模型训练方法及装置 | |
Ying et al. | DeepBonds: A Deep Learning Approach to Predicting United States Treasury Yield | |
CN111276229A (zh) | 一种基于深度置信网络的门诊量预测方法及系统 | |
CN117591985B (zh) | 一种基于数据处理的大数据聚合分析方法及系统 | |
Fedorov et al. | The Analysis of Countries’ Investment Attractiveness Indicators Using Neural Networks Trained on the Adam and WCO Methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240104 Address after: Room 801, 85 Kefeng Road, Huangpu District, Guangzhou City, Guangdong Province Patentee after: Guangzhou Dayu Chuangfu Technology Co.,Ltd. Address before: 212013 No. 301, Xuefu Road, Zhenjiang, Jiangsu Patentee before: JIANGSU University |