CN110310199A - 借贷风险预测模型的构建方法、系统及借贷风险预测方法 - Google Patents

借贷风险预测模型的构建方法、系统及借贷风险预测方法 Download PDF

Info

Publication number
CN110310199A
CN110310199A CN201910567548.7A CN201910567548A CN110310199A CN 110310199 A CN110310199 A CN 110310199A CN 201910567548 A CN201910567548 A CN 201910567548A CN 110310199 A CN110310199 A CN 110310199A
Authority
CN
China
Prior art keywords
network
moment
debt
credit risk
loan application
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910567548.7A
Other languages
English (en)
Other versions
CN110310199B (zh
Inventor
李君浩
胡宏辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Lake Information Technology Co Ltd
Original Assignee
Shanghai Lake Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Lake Information Technology Co Ltd filed Critical Shanghai Lake Information Technology Co Ltd
Priority to CN201910567548.7A priority Critical patent/CN110310199B/zh
Publication of CN110310199A publication Critical patent/CN110310199A/zh
Application granted granted Critical
Publication of CN110310199B publication Critical patent/CN110310199B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开一种借贷风险预测模型的构建方法、系统及借贷风险预测方法,属于计算机技术领域。模型构建方法包括:获取预设的带有时刻分类标签的训练样本集合;构建包括生成网络和判别网络的初始对抗学习网络;根据第一时刻的借贷申请信息和第二时刻的借贷申请信息输入至生成网络生成的借贷风险结果和第一时刻的借贷风险标签、第二时刻的借贷风险标签,根据生成网络生成的借贷风险结果输入至判别网络得到的时刻分类结果和时刻分类标签,对生成网络及判别网络进行训练,将训练后的生成网络确定为借贷风险预测模型。本发明通过两个阶段的数据建立一个模型,使得该模型能够应用到不同的阶段,模型效果评估简单、模型维护成本较小、模型迭代较为方便。

Description

借贷风险预测模型的构建方法、系统及借贷风险预测方法
技术领域
本发明属于计算机技术领域,尤其涉及一种借贷风险预测模型的构建方法、系统及借贷风险预测方法。
背景技术
在风险业务场景中,一般存在两个时间节点。当用户填写相关信息后,系统自动对用户信用额度评估,给出合适的信用额度,这个阶段称为第一审批时刻,用户有了额度后,可以在平台进行申请借款,这个阶段称为第二审批时刻。一般来说,两个阶段存在一定的时间差异,在这段时间差内用户的信息可能会发生变化,比如用户在当前平台戳额后,又向其他平台申请了借款等,因此第二审批时刻的信息比第一审批时刻更为丰富。因此,利用机器学习模型尽量消除这个两个阶段带来的差异,显得很重要。传统的方法是分别利用这两个阶段的数据建立模型,应用在相应的阶段,然而两阶段的方法维护成本过高,模型效果评估需要分析各个模型的贡献,需要投入较大的人力成本,不方便后续的模型迭代。
发明内容
为了解决现有技术的问题,本发明提出了一种借贷风险预测模型的构建方法、系统及借贷风险预测方法,本发明的借贷风险预测模型克服了传统技术中分别利用两个阶段的数据建立模型导致的模型效果评估复杂、模型维护成本过大、模型迭代不方便等问题。
本发明实施例提供的具体技术方案如下:
第一方面,本发明提供一种借贷风险预测模型的构建方法,所述方法包括:
获取预设的带有时刻分类标签的训练样本集合;所述训练样本集合包括第一时刻的样本数据和第二时刻的样本数据;所述第一时刻的样本数据包括第一时刻的借贷申请信息和第一时刻的借贷风险标签,所述第二时刻的样本数据包括第二时刻的借贷申请信息和第二时刻的借贷风险标签;
构建包括生成网络和判别网络的初始对抗学习网络;
根据所述第一时刻的借贷申请信息和第二时刻的借贷申请信息输入至所述生成网络生成的借贷风险结果和所述第一时刻的借贷风险标签、第二时刻的借贷风险标签,根据所述生成网络生成的借贷风险结果输入至所述判别网络得到的时刻分类结果和输入所述生成网络的借贷申请信息对应的时刻分类标签,对所述生成网络及判别网络进行训练,将训练后的生成网络确定为借贷风险预测模型。
在一些实施例中,构建包括生成网络和判别网络的初始对抗学习网络具体包括:
根据所述第二时刻的样本数据,训练得到一生成网络;
在所述生成网络中衍生一判别网络,形成初始对抗学习网络。
在一些实施例中,根据所述第二时刻的样本数据,训练得到一生成网络具体包括:
将所述第二时刻的借贷申请信息输入至一生成网络中,得到借贷风险结果;
将所述借贷风险结果和所述第二时刻的借贷风险标签输入至交叉熵损失函数,得到一损失值,根据所述损失值,对所述生成网络进行更新。
在一些实施例中,根据所述第一时刻的借贷申请信息和第二时刻的借贷申请信息输入至所述生成网络生成的借贷风险结果和所述第一时刻的借贷风险标签、第二时刻的借贷风险标签,根据所述生成网络生成的借贷风险结果输入至所述判别网络得到的时刻分类结果和输入所述生成网络的借贷申请信息对应的时刻分类标签,对所述生成网络及判别网络进行训练具体包括:
将所述第一时刻的借贷申请信息和第二时刻的借贷申请信息输入至所述生成网络生成的借贷风险结果和所述第一时刻的借贷风险标签、第二时刻的借贷风险标签输入至第一交叉熵损失函数,得到第一损失值;
将所述生成网络生成的借贷风险结果输入至所述判别网络得到的时刻分类结果和输入所述生成网络的借贷申请信息对应的时刻分类标签输入至第二交叉熵损失函数,得到第二损失值;
将所述第一损失值和第二损失值进行加权求和生成输出结果,根据所述输出结果,对所述生成网络与判别网络进行训练,生成最优生成网络、最优判别网络。
在一些实施例中,所述方法还包括:
所述生成网络及判别网络的最后一层为Softmax逻辑回归层,用于将数据压缩至(0,1)之间。
第二方面,本发明提供一种借贷风险预测模型的构建系统,所述系统包括:
样本构建模块,用于获取预设的带有时刻分类标签的训练样本集合;所述训练样本集合包括第一时刻的样本数据和第二时刻的样本数据;所述第一时刻的样本数据包括第一时刻的借贷申请信息和第一时刻的借贷风险标签,所述第二时刻的样本数据包括第二时刻的借贷申请信息和第二时刻的借贷风险标签;
对抗网络生成模块,用于构建包括生成网络和判别网络的初始对抗学习网络;
对抗网络训练模块,用于根据所述第一时刻的借贷申请信息和第二时刻的借贷申请信息输入至所述生成网络生成的借贷风险结果和所述第一时刻的借贷风险标签、第二时刻的借贷风险标签,根据所述生成网络生成的借贷风险结果输入至所述判别网络得到的时刻分类结果和输入所述生成网络的借贷申请信息对应的时刻分类标签,对所述生成网络及判别网络进行训练,将训练后的生成网络确定为借贷风险预测模型。
在一些实施例中,所述对抗网络生成模块具体包括:
主网络构建模块,用于根据所述第二时刻的样本数据,训练得到一生成网络;
子网络构建模块,用于在所述生成网络中衍生一判别网络,形成初始对抗学习网络。
在一些实施例中,所述主网络构建模块具体包括:
主网络生成模块,用于将所述第二时刻的借贷申请信息输入至一生成网络中,得到借贷风险结果;
主网络更新模块,用于将所述借贷风险结果和所述第二时刻的借贷风险标签输入至交叉熵损失函数,得到一损失值,根据所述损失值,对所述生成网络进行更新。
在一些实施例中,所述对抗网络训练模块具体包括:
主网络预测模块,用于将所述第一时刻的借贷申请信息和第二时刻的借贷申请信息输入至所述生成网络生成的借贷风险结果和所述第一时刻的借贷风险标签、第二时刻的借贷风险标签输入至第一交叉熵损失函数,得到第一损失值;
子网络预测模块,用于将所述生成网络生成的借贷风险结果输入至所述判别网络得到的时刻分类结果和输入所述生成网络的借贷申请信息对应的时刻分类标签判别网络输入至第二交叉熵损失函数,得到第二损失值;
对抗学习模块,用于将所述第一损失值和第二损失值进行加权求和生成输出结果,根据所述输出结果,对所述生成网络与判别网络进行训练,生成最优生成网络、最优判别网络。
在一些实施例中,所述生成网络及判别网络的最后一层为Softmax逻辑回归层,用于将数据压缩至(0,1)之间。
第三方面,本发明提供一种借贷风险预测方法,所述方法包括:
将获取的用户的第一时刻的个人数据、第二时刻的个人数据输入至所述借贷风险预测模型中,得到关于用户当前借贷行为的预测结果。
在一些实施例中,所述方法还包括:
当所述预测结果小于预设值时,生成借贷成功的通知;当所述信用预测结果大于预设值时,生成借贷失败的通知。
本发明实施例具有如下有益效果:
本发明提出了一种借贷风险预测模型的构建方法、系统及信用预测方法,基于两个阶段的数据以及对抗学习的思想构建借贷风险预测模型,利用该模型解决两阶段信息不一致带来的性能衰减问题。首先,先利用信息丰富的第二审批时刻的样本数据训练一个主网络,记录主网络对于第二审批时刻样本数据的预测结果;随后,在主网络中增加一个子网络,用于区分样本数据来源于第一阶段,还是第二阶段,基于对抗学习的思想对主网络和子网络进行微调,在训练过程中,主网络部分生成的特征能够使得子网络犯错误的概率增大,子网络为了减少犯错误的概率需要修正网络参数,由此形成相互对抗,最终使得主网络学习到的特征与数据来源于哪个阶段无关,可以提取本质的数据特征,从而解决多阶段信息不一致带来的模型性能衰减问题。
此外,通过两个阶段的数据建立一个模型,使得该模型能够应用到不同的阶段,克服了传统技术中分别利用两个阶段的数据建立模型导致的模型效果评估复杂、模型维护成本过大、模型迭代不方便等问题。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是一个实施例中一种借贷风险预测模型的构建方法的流程示意图;
图2是一个实施例中构建包括生成网络和判别网络的初始对抗学习网络步骤的流程示意图;
图3是一个实施例中根据第二时刻的样本数据,训练得到一生成网络步骤的流程示意图;
图4是一个实施例中根据第一时刻的借贷申请信息和第二时刻的借贷申请信息输入至生成网络生成的借贷风险结果和第一时刻的借贷风险标签、第二时刻的借贷风险标签,根据生成网络生成的借贷风险结果输入至判别网络得到的时刻分类结果和输入生成网络的借贷申请信息对应的时刻分类标签,对生成网络及判别网络进行训练步骤的流程示意图;
图5是一个实施例中一种借贷风险预测模型的构建系统的结构框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明利用两个阶段的数据,基于对抗学习的思想,构建包括主网络和子网络的对抗学习网络;在训练过程中,主网络部分生成的特征能够使得子网络犯错误的概率增大,子网络为了减少犯错误的概率需要修正网络参数,由此形成相互对抗,最终使得主网络学习到的特征与数据来源于哪个阶段无关,可以提取本质的数据特征,从而解决多阶段信息不一致带来的模型性能衰减问题。
如图1所示,一种借贷风险预测模型的构建方法,包括如下步骤:
S101、获取预设的带有时刻分类标签的训练样本集合;训练样本集合包括第一时刻的样本数据和第二时刻的样本数据;第一时刻的样本数据包括第一时刻的借贷申请信息和第一时刻的借贷风险标签,第二时刻的样本数据包括第二时刻的借贷申请信息和第二时刻的借贷风险标签。
其中,第一时刻为信用额度评估时刻,第二时刻为借款审批时刻。
借贷申请信息包括:用户个人信息、借款信息。
用户个人信息包括但不限于:工作区域、工作行业、公司规模、工作年限、收入、房车产信息;
借款信息包括但不限于:借款金额、借款利率、借款期限、本次借款距上次借款的间隔时间、借款用途、历史借款次数、逾期次数、在其他平台的借款次数、借款金额、逾期次数等。
本方案中,第一时刻的借贷风险标签和第二时刻的借贷风险标签相同,都用于对用户的信用进行评价。在借款过程中,用户是否逾期还款、是否存在违约情况是判断用户信用是否良好的重要指标,因此,在本实施例中,选择用户是否逾期还款作为第一时刻和第二时刻的借贷风险标签。
将借贷风险标签用符号yi表示,yi=0表示用户会逾期还款,yi=1表示用户不会逾期还款。
S102、构建包括生成网络和判别网络的初始对抗学习网络。
其中,生成网络和判别网络都为深度神经网络。生成网络用于预测得到用户的借贷风险结果,判别网络用于预测得到生成网络生成的借贷风险结果来源于哪个时间段。
通过构建初始对抗学习网络,可以使得生成网络生成的特征与样本数据来源于哪个阶段无关,从而可以提取本质的数据特征,从而解决多阶段信息不一致带来的模型性能衰减问题。
S103、根据第一时刻的借贷申请信息和第二时刻的借贷申请信息输入至生成网络生成的借贷风险结果和第一时刻的借贷风险标签、第二时刻的借贷风险标签,根据生成网络生成的借贷风险结果输入至判别网络得到的时刻分类结果和输入生成网络的借贷申请信息对应的时刻分类标签,对生成网络及判别网络进行训练,将训练后的生成网络确定为借贷风险预测模型。
具体的,将第一时刻的样本数据用(x′i,yi)表示,其中,x′i为第一时刻的借贷申请信息,yi为第一时刻的借贷风险标签;将第二时刻的样本数据用(xi,yi)表示,其中,xi为第二时刻的借贷申请信息,yi为第二时刻的借贷风险标签。
其中,生成网络接收第一时刻的借贷申请信息x′i和第二时刻的借贷申请信息xi之后,预测得到借贷风险结果pi。pi=0表示用户会逾期还款,pi=1表示用户不会逾期还款,将借贷风险结果pi输入至判别网络中,预测得到时刻分类结果zi。通过借贷风险结果pi和第一时刻、第二时刻的借贷风险标签yi,时刻分类结果zi和与输入生成网络的借贷申请信息对应的时刻分类标签Zi,生成网络和判别网络相互对抗学习,进行更新,更新后的生成网络为借贷风险预测模型。
在对抗学习过程中,生成网络生成的借贷风险结果pi能够使得判别网络犯错误的概率增大,而判别网络为了使得时刻分类结果zi准确会需修正其网络参数,两个网络通过相互对抗,形成一个博弈过程,最终使得生成网络生成的输出信息与数据来源于哪个阶段无关,提取本质的数据特征,从而能够解决多阶段信息不一致带来的模型性能衰减问题。
在其中一个实施例中,如图2所示,上述构建包括生成网络和判别网络的初始对抗学习网络可以包括如下步骤:
S201、根据第二时刻的样本数据,训练得到一生成网络。
其中,由于第二时刻为借款审批时刻,此时用户的信息与第一时刻相比可能会发生改变,由此,第二时刻用户的信息更加丰富。利用第二时刻的样本数据训练得到一生成网络,有利于节省后期生成网络的训练时间。由于第一时刻、第二时刻样本数据差异并不是很大,因此,通过使用第二时刻的样本数据建立的生成网络作为下一阶段的基础网络,在具体使用时只需对生成网络进行微调即可,而无需使用大量的样本数据重新训练。
S202、在生成网络中衍生一判别网络,形成初始对抗学习网络。
具体的,将生成网络的输出信息作为判别网络的输入信息,判别网络对生成网络的输入信息进行预测,形成初始对抗学习网络。
在其中一个实施例中,如图3所示,上述根据第二时刻的样本数据,训练得到一生成网络可以包括如下步骤:
S301、将第二时刻的借贷申请信息输入至一生成网络中,得到借贷风险结果。
具体的,该步骤包括:
S3011、构建一生成网络,确定生成网络的代价函数。
其中,代价函数为交叉熵代价函数。代价函数用来衡量生成网络的预测值与实际值的差值,从而对生成网络进行参数修正。
S3012、将第二时刻的借贷申请信息输入至生成网络中,得到借贷风险结果。
具体的,将第二时刻的借贷申请信息xi输入到生成网络中,得到借贷风险结果pi
S302、将借贷风险结果和第二时刻的借贷风险标签输入至交叉熵损失函数,得到一损失值,根据损失值,对生成网络进行更新。
具体的,将借贷风险结果pi和第二时刻的借贷风险标签yi输入到交叉熵损失函数中,得到一损失值,根据损失值,对生成网络进行更新。
其中,在更新时,选择梯度下降法作为更新算法,根据损失值、利用梯度下降法对生成网络中的每个参数进行更新。
在其中一个实施例中,如图4所示,上述根据第一时刻的借贷申请信息和第二时刻的借贷申请信息输入至生成网络生成的借贷风险结果和第一时刻的借贷风险标签、第二时刻的借贷风险标签,根据生成网络生成的借贷风险结果输入至判别网络得到的时刻分类结果和时刻分类标签,对生成网络及判别网络进行训练可以包括如下步骤:
S401、将第一时刻的借贷申请信息和第二时刻的借贷申请信息输入至生成网络生成的借贷风险结果和第一时刻的借贷风险标签、第二时刻的借贷风险标签输入至第一交叉熵损失函数,得到第一损失值。
在对生成网络、判别网络训练时,如果预测值与实际值的误差越大,那么在反向传播训练的过程中,各种参数调整的幅度就要更大,从而使训练更快收敛。如果使用二次代价函数进行训练,当误差越大时,参数调整的幅度更小,训练缓慢。因此,本实施例中,选用交叉熵损失函数作为代价函数,可以加快生成网络、判别网络的训练速度。
具体的,该步骤为:
将第一时刻的借贷申请信息x′i和第二时刻的借贷申请信息xi中输入至生成网络中,生成网络预测得到借贷风险结果pi,借贷风险结果pi和借贷风险标签yi输入至第一交叉熵损失函数中,得到第一损失值L1
第一交叉熵损失函数为:
其中,L1为损失值,x为样本,x=x′i+xi,yi表示借贷风险标签,pi表示借贷风险结果,i表示样本总数。
S402、将生成网络生成的借贷风险结果输入至判别网络得到的时刻分类结果和输入生成网络的借贷申请信息对应的时刻分类标签输入至第二交叉熵损失函数,得到第二损失值。
将生成预测得到借贷风险结果pi作为判别网络的输入信息,判别网络根据输入信息预测得到时刻分类结果zi,时刻分类结果zi和与输入生成网络的借贷申请信息对应的时刻分类标签Zi输入至第二交叉熵损失函数中,得到第二损失值L2
第二交叉熵损失函数为:
其中,L2为损失值;pi为样本,即借贷风险结果;Zi表示时刻分类标签,zi表示时刻分类结果,i表示样本总数。
S403、将第一损失值和第二损失值进行加权求和生成输出结果,根据输出结果,对生成网络与判别网络进行训练,生成最优生成网络、最优判别网络。
其中,输出结果为L,L=L1+aL2;a为加权系数。将输出结果L反向传播到生成网络与判别网络中,使得生成网络参数进行微调、判别网络参数进行更新。
在其中一个实施例中,上述生成网络与判别网络的最后一层为Softmax逻辑回归层,用于将数据压缩至(0,1)之间。
Softmax逻辑回归层被添加在生成网络与判别网络的输出层,对输出的值归一化为概率值,从而为后续网络优化过程提供度量。
Softmax函数接收一个N维向量作为输入,然后把每一维的值转换成(0,1)之间的一个实数,它的公式如下面所示:
其中,Vi是分类器前级输出单元的输出;i表示类别索引,总的类别个数为C。Si表示的是当前元素的指数与所有元素指数和的比值。Softmax可以实现将全连接层的输出映射成一个概率的分布。
在一些实施例中,如图5所示,提供一种借贷风险预测模型的构建系统,系统包括:
样本构建模块51,用于获取预设的带有时刻分类标签的训练样本集合;训练样本集合包括第一时刻的样本数据和第二时刻的样本数据;第一时刻的样本数据包括第一时刻的借贷申请信息和第一时刻的借贷风险标签,第二时刻的样本数据包括第二时刻的借贷申请信息和第二时刻的借贷风险标签。
对抗网络生成模块52,用于构建包括生成网络和判别网络的初始对抗学习网络。
对抗网络训练模型53,用于根据第一时刻的借贷申请信息和第二时刻的借贷申请信息输入至生成网络生成的借贷风险结果和第一时刻的借贷风险标签、第二时刻的借贷风险标签,根据生成网络生成的借贷风险结果输入至判别网络生成的时刻分类结果和输入生成网络的借贷申请信息对应的时刻分类标签,对生成网络及判别网络进行训练,将训练后的生成网络确定为借贷风险预测模型。
本发明系统中,生成网络生成的输出信息能够使得判别网络犯错误的概率增大,而判别网络为了使得类别预测结果准确会需修正其网络参数,从而两个网络通过相互对抗,形成一个博弈过程,最终使得生成网络生成的输出信息与数据来源于哪个阶段无关,提取本质的数据特征,从而能够解决多阶段信息不一致带来的模型性能衰减。
在其中一个实施例中,上述对抗网络生成模块52具体包括:
主网络构建模块521,用于根据第二时刻的样本数据,训练得到一生成网络;
子网络构建模块522,用于在生成网络中衍生一判别网络,形成初始对抗学习网络。
在其中一个实施例中,上述主网络构建模块521具体包括:
主网络生成模块5211,用于将第二时刻的借贷申请信息输入至一生成网络中,得到借贷风险结果;
主网络更新模块5212,用于将借贷风险结果和第二时刻的借贷风险标签输入至交叉熵损失函数,得到一损失值,根据损失值,对生成网络进行更新。
在其中一个实施例中,上述对抗网络训练模型53具体包括:
主网络预测模块531,用于将第一时刻的借贷申请信息和第二时刻的借贷申请信息输入至生成网络生成的借贷风险结果和第一时刻的借贷风险标签、第二时刻的借贷风险标签生成网络输入至第一交叉熵损失函数,得到第一损失值;
子网络预测模块532,用于将生成网络生成的借贷风险结果输入至判别网络得到的时刻分类结果和输入生成网络的借贷申请信息对应的时刻分类标签判别网络输入至第二交叉熵损失函数,得到第二损失值;
对抗学习模块533,用于将第一损失值和第二损失值进行加权求和生成输出结果,根据输出结果,对生成网络生成网络与判别网络判别网络进行训练,生成最优生成网络、最优判别网络。
在其中一个实施例中,上述生成网络及判别网络的最后一层为softmax逻辑回归层,用于将数据压缩至(0,1)之间。
在一些实施例中,提供一种借贷风险预测方法,方法包括:
S601、将获取的用户的第一时刻的个人数据、第二时刻的个人数据输入至借贷风险预测模型中,得到关于用户当前借贷行为的预测结果。
其中,用户的个人数据包括:用户个人信息、借款信息。
用户个人信息包括但不限于:工作区域、工作行业、公司规模、工作年限、收入、房车产信息;
借款信息包括但不限于:借款金额、借款利率、借款期限、本次借款距上次借款的间隔时间、借款用途、历史借款次数、逾期次数、在其他平台的借款次数、借款金额、逾期次数等。
在其中一个实施例中,上述借贷风险预测方法还包括:
S701、当预测结果小于预设值时,生成借贷成功的通知;当信用预测结果大于预设值时,生成借贷失败的通知。
本实施例中,将预设值设置为0.5,当信用预测结果小于0.5时,生成借贷成功的通知;当信用预测结果大于0.5时,生成借贷失败的通知。
应该理解的是,虽然图1-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
尽管已描述了本发明实施例中的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例中范围的所有变更和修改。另外,上述实施例提供的借贷风险预测模型的构建系统、借贷风险预测方法与借贷风险预测模型的构建方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种借贷风险预测模型的构建方法,其特征在于,所述方法包括:
获取预设的带有时刻分类标签的训练样本集合;所述训练样本集合包括第一时刻的样本数据和第二时刻的样本数据;所述第一时刻的样本数据包括第一时刻的借贷申请信息和第一时刻的借贷风险标签,所述第二时刻的样本数据包括第二时刻的借贷申请信息和第二时刻的借贷风险标签;
构建包括生成网络和判别网络的初始对抗学习网络;
根据所述第一时刻的借贷申请信息和第二时刻的借贷申请信息输入至所述生成网络生成的借贷风险结果和所述第一时刻的借贷风险标签、第二时刻的借贷风险标签,根据所述生成网络生成的借贷风险结果输入至所述判别网络得到的时刻分类结果和输入所述生成网络的借贷申请信息对应的时刻分类标签,对所述生成网络及判别网络进行训练,将训练后的生成网络确定为借贷风险预测模型。
2.根据权利要求1所述的方法,其特征在于,构建包括生成网络和判别网络的初始对抗学习网络具体包括:
根据所述第二时刻的样本数据,训练得到一生成网络;
在所述生成网络中衍生一判别网络,形成初始对抗学习网络。
3.根据权利要求2所述的方法,其特征在于,根据所述第二时刻的样本数据,训练得到一生成网络具体包括:
将所述第二时刻的借贷申请信息输入至一生成网络中,得到借贷风险结果;
将所述借贷风险结果和所述第二时刻的借贷风险标签输入至交叉熵损失函数,得到一损失值,根据所述损失值,对所述生成网络进行更新。
4.根据权利要求1所述的方法,其特征在于,根据所述第一时刻的借贷申请信息和第二时刻的借贷申请信息输入至所述生成网络生成的借贷风险结果和所述第一时刻的借贷风险标签、第二时刻的借贷风险标签,根据所述生成网络生成的借贷风险结果输入至所述判别网络得到的时刻分类结果和输入所述生成网络的借贷申请信息对应的时刻分类标签,对所述生成网络及判别网络进行训练具体包括:
将所述第一时刻的借贷申请信息和第二时刻的借贷申请信息输入至所述生成网络生成的借贷风险结果和所述第一时刻的借贷风险标签、第二时刻的借贷风险标签输入至第一交叉熵损失函数,得到第一损失值;
将所述生成网络生成的借贷风险结果输入至所述判别网络得到的时刻分类结果和输入所述生成网络的借贷申请信息对应的时刻分类标签输入至第二交叉熵损失函数,得到第二损失值;
将所述第一损失值和第二损失值进行加权求和生成输出结果,根据所述输出结果,对所述生成网络与判别网络进行训练,生成最优生成网络、最优判别网络。
5.一种借贷风险预测模型的构建系统,其特征在于,所述系统包括:
样本构建模块,用于获取预设的带有时刻分类标签的训练样本集合;所述训练样本集合包括第一时刻的样本数据和第二时刻的样本数据;所述第一时刻的样本数据包括第一时刻的借贷申请信息和第一时刻的借贷风险标签,所述第二时刻的样本数据包括第二时刻的借贷申请信息和第二时刻的借贷风险标签;
对抗网络生成模块,用于构建包括生成网络和判别网络的初始对抗学习网络;
对抗网络训练模块,用于根据所述第一时刻的借贷申请信息和第二时刻的借贷申请信息输入至所述生成网络生成的借贷风险结果和所述第一时刻的借贷风险标签、第二时刻的借贷风险标签,根据所述生成网络生成的借贷风险结果输入至所述判别网络得到的时刻分类结果和输入所述生成网络的借贷申请信息对应的时刻分类标签,对所述生成网络及判别网络进行训练,将训练后的生成网络确定为借贷风险预测模型。
6.根据权利要求5所述的系统,其特征在于,所述对抗网络生成模块具体包括:
主网络构建模块,用于根据所述第二时刻的样本数据,训练得到一生成网络;
子网络构建模块,用于在所述生成网络中衍生一判别网络,形成初始对抗学习网络。
7.根据权利要求6所述的系统,其特征在于,所述主网络构建模块具体包括:
主网络生成模块,用于将所述第二时刻的借贷申请信息输入至一生成网络中,得到借贷风险结果;
主网络更新模块,用于将所述借贷风险结果和所述第二时刻的借贷风险标签输入至交叉熵损失函数,得到一损失值,根据所述损失值,对所述生成网络进行更新。
8.根据权利要求5所述的系统,其特征在于,所述对抗网络训练模块具体包括:
主网络预测模块,用于将所述第一时刻的借贷申请信息和第二时刻的借贷申请信息输入至所述生成网络生成的借贷风险结果和所述第一时刻的借贷风险标签、第二时刻的借贷风险标签生成网络输入至第一交叉熵损失函数,得到第一损失值;
子网络预测模块,用于将所述生成网络生成的借贷风险结果输入至所述判别网络得到的时刻分类结果和输入所述生成网络的借贷申请信息对应的时刻分类标签输入至第二交叉熵损失函数,得到第二损失值;
对抗学习模块,用于将所述第一损失值和第二损失值进行加权求和生成输出结果,根据所述输出结果,对所述生成网络与判别网络进行训练,生成最优生成网络、最优判别网络。
9.一种基于权利要求1~4任意一项所述的借贷风险预测模型的构建方法的借贷风险预测方法,其特征在于,所述方法包括:
将获取的用户的第一时刻的个人数据、第二时刻的个人数据输入至所述借贷风险预测模型中,得到关于用户当前借贷行为的预测结果。
10.一种基于权利要求9所述的方法,其特征在于,所述方法还包括:
当所述预测结果小于预设值时,生成借贷成功的通知;当所述信用预测结果大于预设值时,生成借贷失败的通知。
CN201910567548.7A 2019-06-27 2019-06-27 借贷风险预测模型的构建方法、系统及借贷风险预测方法 Active CN110310199B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910567548.7A CN110310199B (zh) 2019-06-27 2019-06-27 借贷风险预测模型的构建方法、系统及借贷风险预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910567548.7A CN110310199B (zh) 2019-06-27 2019-06-27 借贷风险预测模型的构建方法、系统及借贷风险预测方法

Publications (2)

Publication Number Publication Date
CN110310199A true CN110310199A (zh) 2019-10-08
CN110310199B CN110310199B (zh) 2022-03-18

Family

ID=68077768

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910567548.7A Active CN110310199B (zh) 2019-06-27 2019-06-27 借贷风险预测模型的构建方法、系统及借贷风险预测方法

Country Status (1)

Country Link
CN (1) CN110310199B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111382930A (zh) * 2020-02-27 2020-07-07 西安交通大学 一种面向时序数据的风险预测方法及系统
CN111681091A (zh) * 2020-08-12 2020-09-18 腾讯科技(深圳)有限公司 基于时间域信息的金融风险预测方法、装置及存储介质
CN113283578A (zh) * 2021-04-14 2021-08-20 南京大学 一种基于标记风险控制的数据去噪方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8775291B1 (en) * 2008-03-31 2014-07-08 Trans Union Llc Systems and methods for enrichment of data relating to consumer credit collateralized debt and real property and utilization of same to maximize risk prediction
US20150269668A1 (en) * 2014-03-21 2015-09-24 Xerox Corporation Voting mechanism and multi-model feature selection to aid for loan risk prediction
CN106779755A (zh) * 2016-12-31 2017-05-31 湖南文沥征信数据服务有限公司 一种网络电商借贷风险评估方法及模型
CN107194413A (zh) * 2017-04-24 2017-09-22 东北大学 一种基于多特征融合的判别型级联外观模型的目标匹配方法
CN107945024A (zh) * 2017-12-12 2018-04-20 厦门市美亚柏科信息股份有限公司 识别互联网金融借贷企业经营异常的方法、终端设备及存储介质
CN107993140A (zh) * 2017-11-22 2018-05-04 深圳市耐飞科技有限公司 一种个人信贷风险评估方法及系统
CN109255506A (zh) * 2018-11-22 2019-01-22 重庆邮电大学 一种基于大数据的互联网金融用户贷款逾期预测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8775291B1 (en) * 2008-03-31 2014-07-08 Trans Union Llc Systems and methods for enrichment of data relating to consumer credit collateralized debt and real property and utilization of same to maximize risk prediction
US20150269668A1 (en) * 2014-03-21 2015-09-24 Xerox Corporation Voting mechanism and multi-model feature selection to aid for loan risk prediction
CN106779755A (zh) * 2016-12-31 2017-05-31 湖南文沥征信数据服务有限公司 一种网络电商借贷风险评估方法及模型
CN107194413A (zh) * 2017-04-24 2017-09-22 东北大学 一种基于多特征融合的判别型级联外观模型的目标匹配方法
CN107993140A (zh) * 2017-11-22 2018-05-04 深圳市耐飞科技有限公司 一种个人信贷风险评估方法及系统
CN107945024A (zh) * 2017-12-12 2018-04-20 厦门市美亚柏科信息股份有限公司 识别互联网金融借贷企业经营异常的方法、终端设备及存储介质
CN109255506A (zh) * 2018-11-22 2019-01-22 重庆邮电大学 一种基于大数据的互联网金融用户贷款逾期预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
韩冬: "人工智能在医学影像中的研究与应用", 《大数据》 *
魏炜: "影像组学技术研究进展及其在结直肠癌中的临床应用", 《中国生物医学工程学报》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111382930A (zh) * 2020-02-27 2020-07-07 西安交通大学 一种面向时序数据的风险预测方法及系统
CN111382930B (zh) * 2020-02-27 2022-08-16 西安交通大学 一种面向时序数据的风险预测方法及系统
CN111681091A (zh) * 2020-08-12 2020-09-18 腾讯科技(深圳)有限公司 基于时间域信息的金融风险预测方法、装置及存储介质
CN111681091B (zh) * 2020-08-12 2020-11-27 腾讯科技(深圳)有限公司 基于时间域信息的金融风险预测方法、装置及存储介质
CN113283578A (zh) * 2021-04-14 2021-08-20 南京大学 一种基于标记风险控制的数据去噪方法

Also Published As

Publication number Publication date
CN110310199B (zh) 2022-03-18

Similar Documents

Publication Publication Date Title
CN110310199A (zh) 借贷风险预测模型的构建方法、系统及借贷风险预测方法
CN106021377A (zh) 计算机实现的信息处理方法及装置
CN108664893A (zh) 一种人脸检测方法及存储介质
CN111292195A (zh) 风险账户的识别方法及装置
CN108734338A (zh) 基于lstm模型的信用风险预测方法及装置
CN106097043B (zh) 一种信用数据的处理方法及服务器
CN110298321A (zh) 基于深度学习图像分类的道路阻断信息提取
CN110378699A (zh) 一种交易反欺诈方法、装置及系统
CN108921051A (zh) 基于循环神经网络注意力模型的行人属性识别网络及技术
CN108537671A (zh) 一种交易风险评估方法及系统
CN109242149A (zh) 一种基于教育数据挖掘的学生成绩早期预警方法及系统
CN109034194A (zh) 基于特征分化的交易欺诈行为深度检测方法
CN110287316A (zh) 一种告警分类方法、装置、电子设备及存储介质
CN110413838A (zh) 一种无监督视频摘要模型及其建立方法
CN108388969A (zh) 基于个人行为时序特征的内部威胁人物风险预测方法
CN110322342A (zh) 借贷风险预测模型的构建方法、系统及借贷风险预测方法
CN107808246A (zh) 征信数据的智能评估方法及系统
CN107025598A (zh) 一种基于极限学习机的个人信用风险评估方法
CN107453921A (zh) 基于非线性神经网络的智慧城市系统人工智能评价方法
CN113330462A (zh) 使用软最近邻损失的神经网络训练
CN113269540A (zh) 专家系统的更新方法、业务处理方法及装置
CN113240506A (zh) 一种基于无监督领域自适应的金融风控冷启动建模方法
CN113158835A (zh) 一种基于深度学习的交通事故智能检测方法
CN108492049A (zh) 一种基于逻辑回归的p2p平台运营风险评估的系统
CN108711100A (zh) 一种基于神经网络的p2p平台运营风险评估的系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant