CN109242671A - 一种基于多视角不完整数据的信贷违约预测方法及系统 - Google Patents
一种基于多视角不完整数据的信贷违约预测方法及系统 Download PDFInfo
- Publication number
- CN109242671A CN109242671A CN201810997190.7A CN201810997190A CN109242671A CN 109242671 A CN109242671 A CN 109242671A CN 201810997190 A CN201810997190 A CN 201810997190A CN 109242671 A CN109242671 A CN 109242671A
- Authority
- CN
- China
- Prior art keywords
- matrix
- view
- credit
- objective function
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000007812 deficiency Effects 0.000 title abstract 4
- 239000011159 matrix material Substances 0.000 claims abstract description 156
- 239000013598 vector Substances 0.000 claims abstract description 39
- 230000000007 visual effect Effects 0.000 claims abstract description 15
- 230000006870 function Effects 0.000 claims description 50
- 238000005457 optimization Methods 0.000 claims description 24
- 230000006399 behavior Effects 0.000 claims description 8
- 239000008186 active pharmaceutical agent Substances 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000009795 derivation Methods 0.000 claims description 3
- 230000004927 fusion Effects 0.000 abstract description 7
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Business, Economics & Management (AREA)
- Technology Law (AREA)
- Evolutionary Biology (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Algebra (AREA)
- Development Economics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于多视角不完整数据的信贷违约预测方法,包括:S1、对收集的信贷信息样本中缺失的属性数据进行填充,获得完整的输入矩阵;S2、基于完整的输入矩阵构建多视角融合的第一目标函数,并最小化第一目标函数,获得最优的属性视角隶属度矩阵;S3、构建预测过程中的第二目标函数,并最小化第二目标函数,获得最优的视角权重向量;S4、输入待预测的用户信贷信息,并基于最优的属性视角隶属度矩阵和视角权重向量,对用户信贷违约概率进行预测。相应的,本发明还公开了一种基于多视角不完整数据的信贷违约预测系统。采用本发明实施例,能够更好地融合缺失视角的不完整数据,提高预测准确率。
Description
技术领域
本发明涉及信息技术领域,尤其涉及一种基于多视角不完整数据的信贷违约预测方法及系统。
背景技术
随着互联网的发展,互联网技术的发展对金融领域造成的冲击将越来越大,金融的轻应用、碎片化属性将越发明显,从传统借贷到P2P平台、再从小额借贷平台,无不体现了一个趋势,占中国企业总数97%以上的小微企业的借贷需求正在逐步被发现,而且越来越受到重视。小微企业固定资产规模小、资产结构中可抵押物比例小、抗风险能力弱、业务不稳定等特点,使其很难申请到抵押贷款和信用贷款。为开发这个新兴市场,人们提出根据客户行为轨迹预测其未来的还贷能力,降低信贷客户违约的风险。例如,可以通过第三方渠道获取用户的历史贷款信息、是否进入银行黑名单、是否有信息不匹配、是否电信欠费、是否属于法院被执行人、以及每家快递公司所体现的该客户接收快递次数等数据,这相当于从不同每个视角探看用户行为,从而能更精准地判断用户的履约可能。然而,这些第三方渠道的数据收集源,都只能得到少量信息,因此数据集会有大量的缺失值。因此,这就衍生出一个挑战,即基于缺失视角的数据预测。
这是一个多视角的数据融合问题,传统的方法多视角融合一般用于图像处理技术,要求先有小部分完整数据作为训练,然后根据训练出的模型,对缺失视角的数据进行处理,得出补全后的数据。但是,在基于客户行为轨迹的小额信贷审批场景下,通常通过各种渠道收集了很多视角的信息。然而,收集到的用户行为轨迹多是不完整的,即使单个视角数据,也无法找到一份完整的数据样本。因此,首要的任务是对缺失数据进行填补。传统的缺失数据补全方法,或是基于整个属性的统计值(如均值)为所在属性的缺失数据赋值,或是基于相似样本在该属性上的统计值进行赋值。只是,前者过于简略,会降低后续步骤的预测准确性,而后者则不可行,因为样本集中缺失数据过多,甚至无法找到一对可计算相似度的样本。因此,传统的信贷违约预测准确率低下。
发明内容
本发明实施例提出一种基于多视角不完整数据的信贷违约预测方法及系统,能够更好地融合缺失视角的不完整数据,提高预测准确率。
本发明实施例提供一种基于多视角不完整数据的信贷违约预测方法,包括:
S1、收集信贷信息样本,并对收集的信贷信息样本中缺失的属性数据进行填充,获得完整的输入矩阵;
S2、基于所述完整的输入矩阵构建多视角融合的第一目标函数,并最小化所述第一目标函数,获得最优的属性视角隶属度矩阵;
S3、基于所述完整的输入矩阵和所述最优的属性视角隶属度矩阵构建预测过程中的第二目标函数,并最小化所述第二目标函数,获得最优的视角权重向量;
S4、输入待预测的用户信贷信息,并基于所述最优的属性视角隶属度矩阵和所述最优的视角权重向量,对用户信贷违约概率进行预测。
进一步地,所述信贷信息样本包括信贷用户填写的个人信息以及贷款审核方从第三方渠道取得的用户信用信息和用户行为轨迹信息;
所述输入矩阵为X,其中NS是样本数量,DS是属性数。
进一步地,所述S1具体包括:
收集信贷信息样本,并根据所述信贷信息样本构建输入矩阵X;
构建与所述输入矩阵X形状相同的空值指示符矩阵I;
根据空值指示符矩阵I对输入矩阵X中缺失的属性数据进行填充,获得完整的输入矩阵X。
进一步地,所述空值指示符矩阵
所述完整的输入矩阵
进一步地,所述S2具体包括:
构建对角矩阵D,
设置属性视角隶属度矩阵A和样本视角隶属度矩阵U;其中, K为视角数;
基于所述完整的输入矩阵X、所述对角矩阵D、控制参数α、所述属性视角隶属度矩阵A和样本视角隶属度矩阵U构建多视角融合的第一目标函数L;
优化所述属性视角隶属度矩阵A和样本视角隶属度矩阵U,以最小化所述第一目标函数,获得最优的属性视角隶属度矩阵A*;
其中,所述第一目标函数的最小化公式为:
进一步地,所述样本视角隶属度矩阵U的优化公式为:
H(U)=2(ADTDAT)
其中,U值是基于上一次的U值迭代计算得出的,H(U)是L对U求偏导后关于U的海森矩阵,λ为学习率。
进一步地,所述属性视角隶属度矩阵A中每个值的优化公式为:
H(Ai,j)=2Di,j 2(UTU)i,j;
其中,Aij为A在第i行第j列上的值,H(Aij)是L对A求偏导后关于Aij的海森矩阵,θ为学习率。
进一步地,所述S3具体包括:
对所述信贷信息样本的还贷情况进行标记,将出现逾期未还贷这一情况的信贷信息样本标记为1,否则标记为0,以构建标签数据Y,
设置视角权重向量V,
基于所述完整的输入矩阵X、所述对角矩阵D、所述最优的属性视角隶属度矩阵A*、所述标签数据Y、学习率ρ和所述视角权重向量V构建预测过程中的第二目标函数M;
优化所述视角权重向量V,以最小化所述第二目标函数M,获得最优的视角权重向量;
其中,所述第二目标函数M的最小化公式为:
进一步地,所述视角权重向量V的优化公式为:
H(V)=2PTP;
其中,V值是基于上一次的V值迭代计算得到的,H(V)是M对V求偏导后关于V的海森矩阵,Onek是长度为K的全1向量。
相应的,本发明实施例提供一种基于多视角不完整数据的信贷违约预测系统,能够上述基于多视角不完整数据的信贷违约预测方法的所有流程,所述系统包括:
填充模块,用于收集信贷信息样本,并对收集的信贷信息样本中缺失的属性数据进行填充,获得完整的输入矩阵;
第一优化模块,用于基于所述完整的输入矩阵构建多视角融合的第一目标函数,并最小化所述第一目标函数,获得最优的属性视角隶属度矩阵;
第二优化模块,用于基于所述完整的输入矩阵和所述最优的属性视角隶属度矩阵构建预测过程中的第二目标函数,并最小化所述第二目标函数,获得最优的视角权重向量;以及,
预测模块,用于输入待预测的用户信贷信息,并基于所述最优的属性视角隶属度矩阵和所述最优的视角权重向量,对用户信贷违约概率进行预测。
实施本发明实施例,具有如下有益效果:
先对收集的信贷信息样本中缺失的属性数据进行简单填充,获得完整的输入矩阵,然后对完整的输入矩阵进行多视角融合,抵消掉填充信息对模型精确度的影响,同时,优化属性视角隶属度矩阵和视角权重向量,以支持对视角缺失数据的预测,提高用户信贷违约预测的准确性。
附图说明
图1是本发明提供的基于多视角不完整数据的信贷违约预测方法的一个实施例的流程示意图;
图2是本发明提供的基于多视角不完整数据的信贷违约预测方法中信贷信息样本的示意图;
图3是本发明提供的基于多视角不完整数据的信贷违约预测系统的一个实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,是本发明提供的基于多视角不完整数据的信贷违约预测方法的一个实施例的流程示意图,包括:
S1、收集信贷信息样本,并对收集的信贷信息样本中缺失的属性数据进行填充,获得完整的输入矩阵;
S2、基于所述完整的输入矩阵构建多视角融合的第一目标函数,并最小化所述第一目标函数,获得最优的属性视角隶属度矩阵;
S3、基于所述完整的输入矩阵和所述最优的属性视角隶属度矩阵构建预测过程中的第二目标函数,并最小化所述第二目标函数,获得最优的视角权重向量;
S4、输入待预测的用户信贷信息,并基于所述最优的属性视角隶属度矩阵和所述最优的视角权重向量,对用户信贷违约概率进行预测。
需要说明的是,在对用户信贷违约预测的过程中,先构建预测模型,即收集不同用户的信贷信息样本,通过简单的方法给信贷信息样本中缺失的属性数据赋初值,并根据补全数据后的信贷信息样本构建完整的输入矩阵,然后采用非负矩阵分解算法,对完整的输入矩阵进行多视角融合。由于完整的输入矩阵中的部分数据是人工补全的,因此完整的输入矩阵需要抵消掉补全信息对预测模型精确度的影响。最小化多视角融合的第一目标函数,以优化属性视角隶属度矩阵,进而最小化预测过程的第二目标函数,以优化视角权重向量,根据最优的属性视角隶属度矩阵和最优的视角权重向量即可构建预测模型。在输入数据缺失的用户信贷信息时,即可根据预测模型对用户信贷违约概率进行预测。本实施列将基于多视角不完整数据的信贷违约预测技术转为一个优化问题,以支持对视角缺失数据的预测,有效提高预测准确率。
优选地,所述信贷信息样本包括信贷用户填写的个人信息以及贷款审核方从第三方渠道取得的用户信用信息和用户行为轨迹信息。
所述输入矩阵为X,其中NS是样本数量,DS是属性数,即不同渠道所收集信息的维度数之和。
进一步地,所述S1具体包括:
收集信贷信息样本,并根据所述信贷信息样本构建输入矩阵X;
构建与所述输入矩阵X形状相同的空值指示符矩阵I;
根据空值指示符矩阵I对输入矩阵X中缺失的属性数据进行填充,获得完整的输入矩阵X。
需要说明的是,输入矩阵X由用户申请贷款时所填入的个人信息和贷款审核方从第三方渠道取得的用户信用信息和用户行为轨迹信息等构成,例如,用户年龄、是否首次贷款、是否有担保、是否已婚、收入范围、收集信息是否匹配、是否在黑名单中、身份证是否匹配等等,如图2所示。若输入矩阵X中由缺失的属性数据,则通过空值指示符矩阵I进行填充。
空值指示符矩阵I的形状和输入矩阵X一样。令I中包含的样本数为Ns、属性数为Ds,若Xij不为空,则Iij=1,否则Iij=0。
具体地,所述空值指示符矩阵
基于空值指示符矩阵I对输入矩阵X进行填充后,获得补全后的完整的输入矩阵X。
具体地,所述完整的输入矩阵
进一步地,所述S2具体包括:
构建对角矩阵D,
设置属性视角隶属度矩阵A和样本视角隶属度矩阵U;其中, K为视角数;
基于所述完整的输入矩阵X、所述对角矩阵D、控制参数α、所述属性视角隶属度矩阵A和样本视角隶属度矩阵U构建多视角融合的第一目标函数L;
优化所述属性视角隶属度矩阵A和样本视角隶属度矩阵U,以最小化所述第一目标函数,获得最优的属性视角隶属度矩阵A*;
其中,所述第一目标函数的最小化公式为:
需要说明的是,采用非负矩阵分解算法,对完整的输入矩阵X进行多视角融合,令X与UA的距离最小,最小化多视角融合的第一目标函数L时,需考虑将(X-UA)乘以D进行最小化,而非仅是(X-UA),以抵消输入矩阵X中补全信息对模型精确度的影响。
在第一目标函数L中,对角矩阵D表示属性的缺失值比例,视角数K由用户根据经验确定,||||1表示矩阵的l1范数,||||F表示矩阵的Frobenius范数。
进一步地,所述样本视角隶属度矩阵U的优化公式为:
H(U)=2(ADTDAT);
其中,U值是基于上一次的U值迭代计算得出的,H(U)是L对U求偏导后关于U的海森矩阵,λ为学习率。
需要说明的是,在优化过程中,采用近端梯度下降法(Proximal GradientDescent,PGD)进行优化,具体地,令基于U的迭代规则如上述优化公式所示。在U的优化公式中,abs()函数是对矩阵中的每个值求绝对值,以保证非负,学习率λ可通过Wolfe-Powell准则确定。
进一步地,所述属性视角隶属度矩阵A的优化公式为:
H(Ai,j)=2Di,j 2(UTU)i,j;
其中,Aij是矩阵A在第i行第j列的项,由于对A取二阶导的时候,得到的结果是U和D的乘积组合,但U和D无法直接进行矩阵相乘,故此处对A的每个值进行更新,H(Aij)是L对A求偏导后关于Aij的海森矩阵,θ为学习率。
需要说明的是,令基于A的迭代规则如上述优化公式所示。在A的优化公式中,学习率θ可通过Wolfe-Powell准则确定。
本实施例基于第一目标函数L的最小化公式、A的优化公式和U的优化公式对U和A的值进行迭代,直至收敛,获得最优的属性视角隶属度矩阵A*。
进一步地,所述S3具体包括:
对所述信贷信息样本的还贷情况进行标记,将出现逾期未还贷这一情况的信贷信息样本标记为1,否则标记为0,以构建标签数据Y,
设置视角权重向量V,
基于所述完整的输入矩阵X、所述对角矩阵D、所述最优的属性视角隶属度矩阵A*、所述标签数据Y、学习率ρ和所述视角权重向量V构建预测过程中的第二目标函数M;
优化所述视角权重向量V,以最小化所述第二目标函数M,获得最优的视角权重向量;
其中,所述第二目标函数M的最小化公式为:
需要说明的是,标签数据Y表示信贷信息样本中的贷款是否出现逾期未还的现象,类别由0(无逾期未还)、1(出现逾期未还)两类构成,如图2所示。由于完整的输入矩阵X、所述对角矩阵D、所述最优的属性视角隶属度矩阵A*皆已知,令P=XDA*,从而根据P、V、Y、ρ构建预测过程中的第二目标函数M,其中,ρ可通过Wolfe-Powell准则确定。
进一步地,所述视角权重向量V的优化公式为:
H(V)=2PTP;
其中,V值是基于上一次的V值迭代计算得到的,H(V)是M对V求偏导后关于V的海森矩阵,Onek是长度为K的全1向量。
需要说明的是,令基于V的迭代规则如上述优化公式所示,基于第二目标函数M和V的优化公式对V的值进行迭代,直至收敛,获得最优的视角权重向量。
进一步地,在步骤S4中,当输入新数据,即待预测的用户信贷信息时,基于求得的最优的视角权重向量和最优的属性视角隶属度矩阵,对新数据进行预测,计算用户信贷违约概率,以便对信贷风险进行管控。
本发明提供的基于多视角不完整数据的信贷违约预测方法,能够通过机器学习的算法,减少人工填入缺失数据的预处理工作量,另外,通过得到最优的属性视角隶属度矩阵(A)和视角权重向量(V),与专家的经验进行对比,从而引入人工的直觉性判断,支持专家知识的介入,提高信贷预测的准确性。
相应的,本发明还提供一种基于多视角不完整数据的信贷违约预测系统,能够实现上述基于多视角不完整数据的信贷违约预测方法的所有流程。
参见图3,是本发明提供的基于多视角不完整数据的信贷违约预测系统的一个实施例的结构示意图,包括:
填充模块1,用于收集信贷信息样本,并对收集的信贷信息样本中缺失的属性数据进行填充,获得完整的输入矩阵;
第一优化模块2,用于基于所述完整的输入矩阵构建多视角融合的第一目标函数,并最小化所述第一目标函数,获得最优的属性视角隶属度矩阵;
第二优化模块3,用于基于所述完整的输入矩阵和所述最优的属性视角隶属度矩阵构建预测过程中的第二目标函数,并最小化所述第二目标函数,获得最优的视角权重向量;以及,
预测模块4,用于输入待预测的用户信贷信息,并基于所述最优的属性视角隶属度矩阵和所述最优的视角权重向量,对用户信贷违约概率进行预测。
本发明提供的基于多视角不完整数据的信贷违约预测系统,能够通过机器学习的算法,减少人工填入缺失数据的预处理工作量,另外,通过得到最优的属性视角隶属度矩阵(A)和视角权重向量(V),与专家的经验进行对比,从而引入人工的直觉性判断,支持专家知识的介入,提高信贷预测的准确性。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (10)
1.一种基于多视角不完整数据的信贷违约预测方法,其特征在于,包括:
S1、收集信贷信息样本,并对收集的信贷信息样本中缺失的属性数据进行填充,获得完整的输入矩阵;
S2、基于所述完整的输入矩阵构建多视角融合的第一目标函数,并最小化所述第一目标函数,获得最优的属性视角隶属度矩阵;
S3、基于所述完整的输入矩阵和所述最优的属性视角隶属度矩阵构建预测过程中的第二目标函数,并最小化所述第二目标函数,获得最优的视角权重向量;
S4、输入待预测的用户信贷信息,并基于所述最优的属性视角隶属度矩阵和所述最优的视角权重向量,对用户信贷违约概率进行预测。
2.如权利要求1所述的基于多视角不完整数据的信贷违约预测方法,其特征在于,所述信贷信息样本包括信贷用户填写的个人信息以及贷款审核方从第三方渠道取得的用户信用信息和用户行为轨迹信息;
所述输入矩阵为X,其中NS是样本数量,DS是属性数。
3.如权利要求2所述的基于多视角不完整数据的信贷违约预测方法,其特征在于,所述S1具体包括:
收集信贷信息样本,并根据所述信贷信息样本构建输入矩阵X;
构建与所述输入矩阵X形状相同的空值指示符矩阵I;
根据空值指示符矩阵I对输入矩阵X中缺失的属性数据进行填充,获得完整的输入矩阵X。
4.如权利要求3所述的基于多视角不完整数据的信贷违约预测方法,其特征在于,所述空值指示符矩阵
所述完整的输入矩阵
5.如权利要求2所述的基于多视角不完整数据的信贷违约预测方法,其特征在于,所述S2具体包括:
构建对角矩阵D,
设置属性视角隶属度矩阵A和样本视角隶属度矩阵U;其中, K为视角数;
基于所述完整的输入矩阵X、所述对角矩阵D、控制参数α、所述属性视角隶属度矩阵A和样本视角隶属度矩阵U构建多视角融合的第一目标函数L;
优化所述属性视角隶属度矩阵A和样本视角隶属度矩阵U,以最小化所述第一目标函数,获得最优的属性视角隶属度矩阵A*;
其中,所述第一目标函数的最小化公式为:
6.如权利要求5所述的基于多视角不完整数据的信贷违约预测方法,其特征在于,所述样本视角隶属度矩阵U的优化公式为:
H(U)=2(ADTDAT);
其中,U值是基于上一次的U值迭代计算得出的,H(U)是L对U求偏导后关于U的海森矩阵,λ为学习率。
7.如权利要求5所述的基于多视角不完整数据的信贷违约预测方法,其特征在于,所述属性视角隶属度矩阵A的优化公式为:
H(Ai,j)=2Di,j 2(UTU)i,j;
其中,Ai,j表示A在第i行第j列位置的项,H(Aij)是L对A求偏导后关于Aij的海森矩阵,θ为学习率。
8.如权利要求5所述的基于多视角不完整数据的信贷违约预测方法,其特征在于,所述S3具体包括:
对所述信贷信息样本的还贷情况进行标记,将出现逾期未还贷这一情况的信贷信息样本标记为1,否则标记为0,以构建标签数据Y,
设置视角权重向量V,
基于所述完整的输入矩阵X、所述对角矩阵D、所述最优的属性视角隶属度矩阵A*、所述标签数据Y、学习率ρ和所述视角权重向量V构建预测过程中的第二目标函数M;
优化所述视角权重向量V,以最小化所述第二目标函数M,获得最优的视角权重向量;
其中,所述第二目标函数M的最小化公式为:
9.如权利要求8所述的基于多视角不完整数据的信贷违约预测方法,其特征在于,所述视角权重向量V的优化公式为:
H(V)=2PTP;
其中,V值是基于上一次的V值迭代计算得到的,H(V)是M对V求偏导后关于V的海森矩阵,Onek是长度为K的全1向量。
10.一种基于多视角不完整数据的信贷违约预测系统,能够实现如权利要求1至9任一项所述的基于多视角不完整数据的信贷违约预测方法,其特征在于,所述系统包括:
填充模块,用于收集信贷信息样本,并对收集的信贷信息样本中缺失的属性数据进行填充,获得完整的输入矩阵;
第一优化模块,用于基于所述完整的输入矩阵构建多视角融合的第一目标函数,并最小化所述第一目标函数,获得最优的属性视角隶属度矩阵;
第二优化模块,用于基于所述完整的输入矩阵和所述最优的属性视角隶属度矩阵构建预测过程中的第二目标函数,并最小化所述第二目标函数,获得最优的视角权重向量;以及,
预测模块,用于输入待预测的用户信贷信息,并基于所述最优的属性视角隶属度矩阵和所述最优的视角权重向量,对用户信贷违约概率进行预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810997190.7A CN109242671B (zh) | 2018-08-29 | 2018-08-29 | 一种基于多视角不完整数据的信贷违约预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810997190.7A CN109242671B (zh) | 2018-08-29 | 2018-08-29 | 一种基于多视角不完整数据的信贷违约预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109242671A true CN109242671A (zh) | 2019-01-18 |
CN109242671B CN109242671B (zh) | 2020-09-29 |
Family
ID=65068884
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810997190.7A Active CN109242671B (zh) | 2018-08-29 | 2018-08-29 | 一种基于多视角不完整数据的信贷违约预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109242671B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111368254A (zh) * | 2020-03-02 | 2020-07-03 | 西安邮电大学 | 多流形正则化非负矩阵分解的多视角数据缺失补全方法 |
CN112054891A (zh) * | 2020-08-09 | 2020-12-08 | 中信银行股份有限公司 | 基于区块链的共有用户确定方法、电子设备及存储介质 |
CN113792185A (zh) * | 2021-07-30 | 2021-12-14 | 中国电子产品可靠性与环境试验研究所((工业和信息化部电子第五研究所)(中国赛宝实验室)) | 估计缺失信号方法、装置、计算机设备和存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106097095A (zh) * | 2016-06-08 | 2016-11-09 | 腾讯科技(深圳)有限公司 | 确定信用的方法及装置 |
CN106127262A (zh) * | 2016-06-29 | 2016-11-16 | 海南大学 | 一种属性缺失数据集的聚类方法 |
US20170193598A1 (en) * | 2015-12-31 | 2017-07-06 | International Business Machines Corporation | Post-lending credit management |
CN107767144A (zh) * | 2017-10-31 | 2018-03-06 | 吴晶妹 | 一种信用评价方法和装置 |
CN107945003A (zh) * | 2016-12-30 | 2018-04-20 | 上海壹账通金融科技有限公司 | 信用评估方法及装置 |
CN108335200A (zh) * | 2018-05-03 | 2018-07-27 | 湖南大学 | 一种基于特征选取的信用评级方法 |
-
2018
- 2018-08-29 CN CN201810997190.7A patent/CN109242671B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170193598A1 (en) * | 2015-12-31 | 2017-07-06 | International Business Machines Corporation | Post-lending credit management |
CN106097095A (zh) * | 2016-06-08 | 2016-11-09 | 腾讯科技(深圳)有限公司 | 确定信用的方法及装置 |
CN106127262A (zh) * | 2016-06-29 | 2016-11-16 | 海南大学 | 一种属性缺失数据集的聚类方法 |
CN107945003A (zh) * | 2016-12-30 | 2018-04-20 | 上海壹账通金融科技有限公司 | 信用评估方法及装置 |
CN107767144A (zh) * | 2017-10-31 | 2018-03-06 | 吴晶妹 | 一种信用评价方法和装置 |
CN108335200A (zh) * | 2018-05-03 | 2018-07-27 | 湖南大学 | 一种基于特征选取的信用评级方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111368254A (zh) * | 2020-03-02 | 2020-07-03 | 西安邮电大学 | 多流形正则化非负矩阵分解的多视角数据缺失补全方法 |
CN111368254B (zh) * | 2020-03-02 | 2023-04-07 | 西安邮电大学 | 多流形正则化非负矩阵分解的多视角数据缺失补全方法 |
CN112054891A (zh) * | 2020-08-09 | 2020-12-08 | 中信银行股份有限公司 | 基于区块链的共有用户确定方法、电子设备及存储介质 |
CN112054891B (zh) * | 2020-08-09 | 2022-10-25 | 中信银行股份有限公司 | 基于区块链的共有用户确定方法、电子设备及存储介质 |
CN113792185A (zh) * | 2021-07-30 | 2021-12-14 | 中国电子产品可靠性与环境试验研究所((工业和信息化部电子第五研究所)(中国赛宝实验室)) | 估计缺失信号方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109242671B (zh) | 2020-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109255506B (zh) | 一种基于大数据的互联网金融用户贷款逾期预测方法 | |
CN113468227B (zh) | 基于图神经网络的信息推荐方法、系统、设备和存储介质 | |
CN108345587B (zh) | 一种评论的真实性检测方法与系统 | |
CN109242671B (zh) | 一种基于多视角不完整数据的信贷违约预测方法及系统 | |
CN108280757A (zh) | 用户信用评估方法及装置 | |
CN109300050A (zh) | 基于用户画像的保险推送方法、装置及存储介质 | |
CN109766454A (zh) | 一种投资者分类方法、装置、设备及介质 | |
CN107807914A (zh) | 情感倾向的识别方法、对象分类方法及数据处理系统 | |
CN110349179B (zh) | 一种基于多适配器的可见光红外视觉跟踪方法及装置 | |
CN112395979A (zh) | 基于图像的健康状态识别方法、装置、设备及存储介质 | |
CN111523678A (zh) | 业务的处理方法、装置、设备及存储介质 | |
CN110110610B (zh) | 一种用于短视频的事件检测方法 | |
CN111563481A (zh) | 一种银行柜面业务智能授权方法及装置 | |
CN112861662A (zh) | 基于人脸和交互文本的目标对象行为预测方法及相关设备 | |
CN112836750A (zh) | 一种系统资源分配方法、装置及设备 | |
Speakman et al. | Three population covariate shift for mobile phone-based credit scoring | |
CN111275447A (zh) | 基于自动化特征工程的在线网络支付欺诈检测系统 | |
CN114549131B (zh) | 一种基于图像自动报价系统及方法 | |
CN116128339A (zh) | 客户信用评估方法及装置、存储介质及电子设备 | |
CN116308615A (zh) | 产品推荐方法、装置、电子设备及存储介质 | |
CN114529399A (zh) | 用户数据处理方法、装置、计算机设备和存储介质 | |
CN113052512A (zh) | 风险预测方法、装置和电子设备 | |
CN115937565A (zh) | 基于自适应l-bfgs算法的高光谱图像分类方法 | |
CN113298447A (zh) | 基于数据处理的融资租赁管理系统 | |
CN114548620A (zh) | 物流准时保业务推荐方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP02 | Change in the address of a patent holder | ||
CP02 | Change in the address of a patent holder |
Address after: Unit 1202 and 1203, building B21, phase III, software park, Jimei District, Xiamen City, Fujian Province Patentee after: XIAMEN QIXING TONGLIAN TECHNOLOGY Co.,Ltd. Address before: 361000 B402 two of Lu Ling Road, Siming District, Xiamen, Fujian, two Patentee before: XIAMEN QIXING TONGLIAN TECHNOLOGY Co.,Ltd. |