CN116151961A - 信用风险预测方法、电子设备及可读存储介质 - Google Patents
信用风险预测方法、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN116151961A CN116151961A CN202310189917.XA CN202310189917A CN116151961A CN 116151961 A CN116151961 A CN 116151961A CN 202310189917 A CN202310189917 A CN 202310189917A CN 116151961 A CN116151961 A CN 116151961A
- Authority
- CN
- China
- Prior art keywords
- historical behavior
- risk prediction
- data set
- fusion
- credit risk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 85
- 230000004927 fusion Effects 0.000 claims abstract description 127
- 238000013058 risk prediction model Methods 0.000 claims abstract description 50
- 230000006399 behavior Effects 0.000 claims description 234
- 239000011159 matrix material Substances 0.000 claims description 109
- 238000012549 training Methods 0.000 claims description 51
- 238000000354 decomposition reaction Methods 0.000 claims description 43
- 238000012545 processing Methods 0.000 claims description 22
- 230000010354 integration Effects 0.000 claims description 13
- 238000012417 linear regression Methods 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 5
- 238000013499 data model Methods 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 8
- 238000004590 computer program Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 6
- 230000009467 reduction Effects 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种信用风险预测方法、电子设备及可读存储介质,应用于金融科技技术领域,所述信用风险预测方法包括:获取用户的历史行为数据集,其中,所述历史行为数据集至少来源于两种数据源;将所述历史行为数据集整合为历史行为融合数据;根据所述历史行为融合数据和风险预测模型,对所述用户进行信用风险预测,得到风险预测结果。本申请解决了无法兼顾用户信用风险的预测准确度和预测效率的技术问题。
Description
技术领域
本申请涉及金融科技(Fintech)的人工智能技术领域,尤其涉及一种信用风险预测方法、电子设备及可读存储介质。
背景技术
随着金融科技,尤其是互联网科技金融的不断发展,越来越多的技术(如分布式、人工智能等)应用在金融领域,但金融业也对技术提出了更高的要求,如对金融业对用户的信用水平也有更高的要求。
目前,为了评估用户的信用水平,通常根据用户的历史行为数据集和风险预测模型,对用户的信用风险进行预测,为了提高用户的信用风险的预测准确度,历史行为数据集通常来源于多个渠道和多个数据源,而模型对大量多维的历史行为数据集进行处理时,由于处理复杂度较高,容易出现处理用时较长甚至无法处理的情况,因此,无法兼顾用户信用风险的预测准确度和预测效率。
发明内容
本申请的主要目的在于提供一种信用风险预测方法、电子设备及可读存储介质,旨在解决现有技术中无法兼顾用户信用风险的预测准确度和预测效率的技术问题。
为实现上述目的,本申请提供一种信用风险预测方法,所述信用风险预测方法包括:
获取用户的历史行为数据集,其中,所述历史行为数据集至少来源于两种数据源;
将所述历史行为数据集整合为历史行为融合数据;
根据所述历史行为融合数据和风险预测模型,对所述用户进行信用风险预测,得到风险预测结果。
可选地,所述将所述历史行为数据集整合为历史行为融合数据的步骤包括:
确定所述历史行为数据集中来源于各所述数据源的各变量对应的变量融合系数;
根据各所述变量融合系数,将各所述变量整合为历史行为融合数据。
可选地,所述确定所述历史行为数据集中来源于各所述数据源的各变量对应的变量融合系数的步骤包括:
对所述历史行为数据集进行分解得到分解矩阵;
根据所述历史行为数据集和所述分解矩阵,确定所述历史行为数据集中来源于各所述数据源的各变量对应的变量融合系数。
可选地,所述分解矩阵包括结果矩阵和系数矩阵,
所述对所述历史行为数据集进行分解得到分解矩阵的步骤包括:
通过预设矩阵分解法对所述历史行为数据集进行分解得到结果矩阵和系数矩阵,其中,所述结果矩阵和所述系数矩阵为非负矩阵。
可选地,所述分解矩阵包括结果矩阵,
所述根据所述历史行为数据集和所述分解矩阵,确定所述历史行为数据集中来源于各所述数据源的各变量对应的变量融合系数的步骤包括:
将所述历史行为数据集作为回归模型输入值,将所述结果矩阵作为所述回归模型输入值对应的输入标签;
根据所述回归模型输入值和所述输入标签,通过多元线性回归模型拟合得到所述历史行为数据集中来源于各所述数据源的各变量对应的变量融合系数。
可选地,所述根据各所述变量融合系数,将各所述变量整合为历史行为融合数据的步骤包括:
确定各所述变量与各自对应的各所述变量融合系数两两之间的乘积;
将各所述乘积整合为历史行为融合数据。
可选地,在所述根据所述历史行为融合数据和风险预测模型,对所述用户进行信用风险预测,得到风险预测结果的步骤之前,还包括:
获取训练行为数据集和所述训练行为数据集对应的真实标签,其中,所述训练行为数据集至少来源于两种数据源;
将所述训练行为数据集整合为训练行为融合数据;
根据所述训练行为融合数据和所述真实标签,对待训练风险预测模型进行迭代优化,得到风险预测模型。
为实现上述目的,本申请还提供一种信用风险预测装置,所述信用风险预测装置包括:
获取模块,用于获取用户的历史行为数据集,其中,所述历史行为数据集至少来源于两种数据源;
整合模块,用于将所述历史行为数据集整合为历史行为融合数据;
预测模块,用于根据所述历史行为融合数据和风险预测模型,对所述用户进行信用风险预测,得到风险预测结果。
可选地,所述整合模块还用于:
确定所述历史行为数据集中来源于各所述数据源的各变量对应的变量融合系数;
根据各所述变量融合系数,将各所述变量整合为历史行为融合数据。
可选地,所述整合模块还用于:
对所述历史行为数据集进行分解得到分解矩阵;
根据所述历史行为数据集和所述分解矩阵,确定所述历史行为数据集中来源于各所述数据源的各变量对应的变量融合系数。
可选地,所述分解矩阵包括结果矩阵和系数矩阵,所述整合模块还用于:
通过预设矩阵分解法对所述历史行为数据集进行分解得到结果矩阵和系数矩阵,其中,所述结果矩阵和所述系数矩阵为非负矩阵。
可选地,所述分解矩阵包括结果矩阵,所述整合模块还用于:
将所述历史行为数据集作为回归模型输入值,将所述结果矩阵作为所述回归模型输入值对应的输入标签;
根据所述回归模型输入值和所述输入标签,通过多元线性回归模型拟合得到所述历史行为数据集中来源于各所述数据源的各变量对应的变量融合系数。
可选地,所述整合模块还用于:
确定各所述变量与各自对应的各所述变量融合系数两两之间的乘积;
将各所述乘积整合为历史行为融合数据。
可选地,在所述根据所述历史行为融合数据和风险预测模型,对所述用户进行信用风险预测,得到风险预测结果的步骤之前,所述信用风险预测装置还用于:
获取训练行为数据集和所述训练行为数据集对应的真实标签,其中,所述训练行为数据集至少来源于两种数据源;
将所述训练行为数据集整合为训练行为融合数据;
根据所述训练行为融合数据和所述真实标签,对待训练风险预测模型进行迭代优化,得到风险预测模型。
本申请还提供一种电子设备,所述电子设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的所述信用风险预测方法的程序,所述信用风险预测方法的程序被处理器执行时可实现如上述的信用风险预测方法的步骤。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有实现信用风险预测方法的程序,所述信用风险预测方法的程序被处理器执行时实现如上述的信用风险预测方法的步骤。
本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的信用风险预测方法的步骤。
本申请提供了一种信用风险预测方法、电子设备及可读存储介质,相比于根据用户的历史行为数据集和风险预测模型,对用户的信用风险进行预测的方法,本申请通过获取用户的历史行为数据集,其中,所述历史行为数据集至少来源于两种数据源;将所述历史行为数据集整合为历史行为融合数据;根据所述历史行为融合数据和风险预测模型,对所述用户进行信用风险预测,得到风险预测结果,通过将至少来源于两种数据源的历史行为数据集,也即,大量多维的历史行为数据集整合为历史行为融合数据,历史行为融合数据为包含历史行为数据集信息的融合数据,而历史行为融合数据为风险预测模型的输入数据,因此降低了风险预测模型输入数据的复杂度,以及,提高了风险预测模型的预测准确度,进而降低了模型处理的复杂度,避免了模型直接对大量多维的历史行为数据集进行处理时容易出现处理用时过长甚至无法处理情况的技术缺陷,所以提高了用户信用风险的预测效率,进而在保证用户信用风险的高预测准确度下,提高了用户信用风险的预测效率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请信用风险预测方法第一实施例的流程示意图;
图2为本申请信用风险预测方法涉及的一场景下的历史行为数据集的矩阵分解示意图;
图3为本申请信用风险预测方法涉及的另一场景下的历史行为数据集的矩阵分解示意图;
图4为本申请信用风险预测方法涉及的一场景下的变量融合系数拟合方法;
图5为本申请信用风险预测方法涉及的装置结构示意图;
图6为本申请实施例中信用风险预测方法涉及的硬件运行环境的设备结构示意图。
本申请目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其它实施例,均属于本申请保护的范围。
实施例一
本申请实施例提供一种信用风险预测方法,在本申请信用风险预测方法的第一实施例中,参照图1,所述信用风险预测方法包括:
步骤S10,获取用户的历史行为数据集,其中,所述历史行为数据集至少来源于两种数据源;
在本实施例中,需要说明的是,所述用户的数量可以为一个,也可以为多个,所述历史行为数据为用户在上一时间步的行为数据,所述时间步可以设置为周期性提取的时间周期,所述历史行为数据的数据数量为多个,所述数据源可以为银行来源,也可以为社交软件来源,还可以为出行软件来源等其他来源。
示例性地,步骤S10包括:从至少两个数据源中获取用户在上一时间步的行为数据,得到历史行为数据集,其中,所述时间步可以为一个月,也可以为一年,也可以为三年;所述时间步可以为评判用户的信用风险行为最佳的评判时间经验值,也可以为用户信用风险评判方自行设置;所述历史行为数据可以为同一个用户的多个时间段的行为数据,也可以为不同用户的多个时间段的行为数据,还可以为不同用户的同一时间段的行为数据。
步骤S20,将所述历史行为数据集整合为历史行为融合数据;
作为一种示例,步骤S20包括:对所述历史行为数据集进行特征提取,得到来源于各所述数据源的特征信息;对各所述特征信息进行特征融合得到融合特征信息;将所述融合特征信息作为所述历史行为融合数据。
作为一种示例,步骤S20包括:获取所述历史行为数据集中各数据之间的数据关系,根据所述数据关系,将所述历史数据集整合为历史行为融合数据,其中,所述数据关系可以由各所述数据对应的数据类型确定,也可以由各所述数据对应的数据属性确定,还可以由各所述数据对应的数据特征确定。
作为一种示例,步骤S20包括:对所述历史行为数据集进行数据降维得到降维矩阵,根据所述降维矩阵,将所述历史行为数据集整合为历史行为融合数据。
步骤S30,根据所述历史行为融合数据和风险预测模型,对所述用户进行信用风险预测,得到风险预测结果。
在本实施例中,需要说明的是,所述风险预测模型可以为评分卡模型,也可以为树模型,还可以为深度学习模型。
示例性地,步骤S30包括:对所述历史行为融合数据进行特征提取,得到历史行为融合特征;通过风险预测模型将所述历史行为融合特征映射为所述用户对应的风险预测结果。
其中,在步骤S20中,所述将所述历史行为数据集整合为历史行为融合数据的步骤包括:
步骤S21,确定所述历史行为数据集中来源于各所述数据源的各变量对应的变量融合系数;
可以理解的是,来源于不同数据源的同一变量之间可能存在线性关系,因此,作为一种示例,步骤S21包括:获取所述历史行为数据集中来源于各所述数据源的各变量之间的线性关系;根据所述线性关系,生成所述历史行为数据集中来源于各所述数据源的各变量对应的变量融合系数。
作为一种示例,步骤S21包括:获取所述历史行为数据集中来源于各所述数据源的各变量两两之间的欧式距离,根据各所述欧式距离,生成所述历史行为数据集中来源于各所述数据源的各变量对应的变量融合系数。
作为一种示例,步骤S21包括:获取所述历史行为数据集中来源于各所述数据源的各变量两两之间的余弦距离,根据各所述余弦距离,生成所述历史行为数据集中来源于各所述数据源的各变量对应的变量融合系数。
步骤S22,根据各所述变量融合系数,将各所述变量整合为历史行为融合数据。
示例性地,步骤S22包括:根据各所述变量融合系数,通过预设融合算法将各所述变量整合为历史行为融合数据。
通过将历史行为数据集中来源于不同数据源的变量对应的变量融合系数,将历史行为数据集进行降维得到历史行为融合数据,实现了保留历史行为数据集中来源于不同数据源的变量之间的线性关系和历史行为数据集的数据降维之间的均衡,进而降低了模型处理的复杂度以及保留了历史行为数据集的数据丰富度,而历史行为融合数据为风险预测模型的输入数据,因此降低了风险预测模型输入数据的复杂度以及提高了风险预测模型的预测准确度。
其中,在步骤S21中,所述确定所述历史行为数据集中来源于各所述数据源的各变量对应的变量融合系数的步骤包括:
步骤A10,对所述历史行为数据集进行分解得到分解矩阵;
步骤A20,根据所述历史行为数据集和所述分解矩阵,确定所述历史行为数据集中来源于各所述数据源的各变量对应的变量融合系数。
作为一种示例,步骤A10至步骤A20包括:对所述历史行为数据集进行特征值分解,得到分解矩阵;根据所述历史行为数据集和所述分解矩阵,确定所述历史行为数据集中来源于各所述数据源的各变量对应的变量融合系数。
其中,在步骤A10中,所述分解矩阵包括结果矩阵和系数矩阵,所述对所述历史行为数据集进行分解得到分解矩阵的步骤包括:
步骤A11,通过预设矩阵分解法对所述历史行为数据集进行分解得到结果矩阵和系数矩阵,其中,所述结果矩阵和所述系数矩阵为非负矩阵。
可以理解的是,在采用上述矩阵分解法时,由于对于来源于不同数据源的同一变量,各个数据源的同一变量之间可能存在互为共线性关系或者互为负相关性,而同一变量的不同的线性关系对于模型具有不同的解释性质(例如,来源于数据源1的变量X的线性系数为正,也即,对于模型具有符合风险解释的性质,来源于数据源2的变量X的线性系数为负,也即,对于模型具有不符合风险解释的性质,来源于数据源3的变量X的线性系数为0,也即,对于模型具有无作用的性质),因此,容易出现历史行为数据集中部分数据来源的变量对于模型预测结果的贡献度较低或者没有贡献,甚至对于模型预测结果存在反作用的情况,进而导致用户信用风险的预测准确度较低。
为克服上述缺陷,作为一种示例,步骤A11包括:获取预设矩阵分解法,通过预设矩阵分解法将所述历史行为数据集分解为预设数据维度的结果矩阵和一维的系数矩阵,其中,所述预设数据维度与所述历史行为数据集来源的数据源数量一致,所述预设矩阵分解法为(Non-negative Matrix Factorization,非负矩阵分解算法)。
作为一种示例,参照图2,图2为本申请信用风险预测方法涉及的一场景下的历史行为数据集的矩阵分解示意图,图2包括:非负的历史行为数据集(图示的矩阵V)、非负的结果矩阵(图示的矩阵W)和非负的系数矩阵(图示的矩阵H),通过预设矩阵分解法将预设数据数量(图示的m)以及预设数据维度(图示的n)的历史行为数据集分解为维度为预设数据数量以及数据数量为目标维度(图示的r)对应的数量的结果矩阵和数据数量为预设数据维度对应的数量和目标维度的系数矩阵。
作为一种示例,参照图3,图3为本申请信用风险预测方法涉及的另一场景下的历史行为数据集的矩阵分解示意图,图3包括:数据数量为M的历史行为数据集(图示的x_1_1、x_2_1、x_3_1、...、x_n_1)、结果矩阵(图示的竖向放置的矩阵)和系数矩阵(图示的横向放置的矩阵)。通过预设矩阵分解法将数据数量为M的历史行为数据分解为维度为M、数据数量为1的结果矩阵和1维的数据数量为N的矩阵。
其中,在步骤A20中,所述分解矩阵包括结果矩阵,所述根据所述历史行为数据集和所述分解矩阵,确定所述历史行为数据集中来源于各所述数据源的各变量对应的变量融合系数的步骤包括:
步骤A21,将所述历史行为数据集作为回归模型输入值,将所述结果矩阵作为所述回归模型输入值对应的输入标签;
步骤A22,根据所述回归模型输入值和所述输入标签,通过多元线性回归模型拟合得到所述历史行为数据集中来源于各所述数据源的各变量对应的变量融合系数。
示例性地,步骤A21至步骤A22包括:将所述历史行为数据集作为回归模型输入值,也即,输入x,将所述结果矩阵作为所述回归模型输入值对应的输入标签,也即,输入标签y;通过将所述输入x和所述输入标签y代入多元线性回归模型,得到所述历史行为数据集中来源于各所述数据源的各变量对应的变量融合系数。
作为一种示例,参照图4,图4为本申请信用风险预测方法涉及的一场景下的变量融合系数拟合方法,图4包括:数据数量为M的历史行为数据集(图示的由x_1_1、x_2_1、x_3_1、...、x_n_1构成的矩阵V)、结果矩阵(图示的M×1矩阵W)和来源于各所述数据源的各变量对应的变量融合系数(图示的N×1矩阵),通过将历史行为数据集作为X,将结果矩阵作为Y,通过多元回归模型求解得到来源于各所述数据源的各变量对应的变量融合系数。
本申请实施例提供了一种信用风险预测方法,相比于根据用户的历史行为数据集和风险预测模型,对用户的信用风险进行预测的方法,本申请实施例通过获取用户的历史行为数据集,其中,所述历史行为数据集至少来源于两种数据源;将所述历史行为数据集整合为历史行为融合数据;根据所述历史行为融合数据和风险预测模型,对所述用户进行信用风险预测,得到风险预测结果,通过将大量多维的历史行为数据集整合为历史行为融合数据,降低了模型处理的复杂度,从而避免了模型对大量多维的历史行为数据集进行处理时,由于处理复杂度较高,容易出现处理用时较长甚至无法处理情况的技术缺陷,进而在保证用户信用风险的高预测准确度下,提高了用户信用风险的预测效率。
实施例二
进一步地,基于本申请第一实施例,在本申请另一实施例中,与上述实施例一相同或相似的内容,可以参考上文介绍,后续不再赘述。在此基础上,其中,在步骤S22中,所述根据各所述变量融合系数,将各所述变量整合为历史行为融合数据的步骤包括:
步骤B10,确定各所述变量与各自对应的各所述变量融合系数两两之间的乘积;
步骤B20,将各所述乘积整合为历史行为融合数据。
示例性地,步骤B10至步骤B20包括:确定各所述变量与各自对应的各所述变量融合系数两两之间的乘积,将各所述乘积相加得到所述历史行为融合数据,例如,历史行为数据集包括变量X,来源于数据源1的变量X对应的融合系数为0.2,来源于数据2的变量X对应的融合系数为0.4,来源于数据3的变量X对应的融合系数为0.4,那么历史行为融合数据为0.2X+0.4X+0.4X。
其中,在步骤S30中,在所述根据所述历史行为融合数据和风险预测模型,对所述用户进行信用风险预测,得到风险预测结果的步骤之前,还包括:
步骤C10,获取训练行为数据集和所述训练行为数据集对应的真实标签,其中,所述训练行为数据集至少来源于两种数据源;
步骤C20,将所述训练行为数据集整合为训练行为融合数据;
步骤C30,根据所述训练行为融合数据和所述真实标签,对待训练风险预测模型进行迭代优化,得到风险预测模型。
可以理解的是,在对待训练风险预测模型时,为提高训练好的风险预测模型的预测准确度,用于训练待训练风险预测模型的训练行为数据集通常来源于多个渠道和多个数据源,而模型根据大量多维的历史行为数据集进行训练处理时,由于处理复杂度较高,容易出现处理用时较长甚至无法处理的情况,因此,无法兼顾信用风险预测模型的预测准确度和模型训练效率。
示例性地,步骤C10至步骤C30包括:获取训练行为数据集和所述训练行为数据集对应的真实标签,其中,所述训练行为数据集至少来源于两种数据源;将所述训练行为数据集整合为训练行为融合数据;通过待训练风险预测模型将所述训练行为融合数据映射为所述训练行为数据集对应的训练风险预测结果;依据所述训练风险预测结果与所述真实标签之间的差异度,计算所述待训练风险预测模型对应的模型损失,进而判断所述模型损失是否收敛,若所述模型损失收敛,则将所述待训练风险预测模型作为所述风险预测模型,若所述模型损失未收敛,则基于所述模型损失计算的梯度,通过预设模型更新方法更新所述待训练风险预测模型,并返回执行步骤:获取训练行为数据集和所述训练行为数据集对应的真实标签,其中,所述训练行为数据集至少来源于两种数据源,其中,所述预设模型更新方法包括梯度下降法和梯度上升法等。
其中,所述将所述训练行为数据集整合为训练行为融合数据可参照上述步骤S20、步骤S21至步骤S22、步骤A10至步骤A20、步骤A11以及步骤A21至步骤A22的具体实施方式,在此不作赘述。
通过将大量多维的训练行为数据集整合为训练行为融合数据,降低了模型训练的复杂度,从而避免了模型根据大量多维的历史行为数据集进行训练处理时,由于处理复杂度较高,容易出现处理用时较长甚至无法处理情况的技术缺陷,进而在保证信用风险预测模型的预测准确度下,提高了信用风险预测模型的模型训练效率。
本申请实施例提供了一种信用风险预测方法,本申请实施例通过确定各所述变量与各自对应的各所述变量融合系数两两之间的乘积;将各所述乘积整合为历史行为融合数据,从而将历史行为数据集降维的同时保留了数据复杂度,历史行为融合数据为风险预测模型的输入数据,因此降低了风险预测模型输入数据的复杂度以及提高了风险预测模型的预测准确度。
实施例三
本申请实施例还提供一种信用风险预测装置,参照图5,所述信用风险预测装置包括:
获取模块,用于获取用户的历史行为数据集,其中,所述历史行为数据集至少来源于两种数据源;
整合模块,用于将所述历史行为数据集整合为历史行为融合数据;
预测模块,用于根据所述历史行为融合数据和风险预测模型,对所述用户进行信用风险预测,得到风险预测结果。
可选地,所述整合模块还用于:
确定所述历史行为数据集中来源于各所述数据源的各变量对应的变量融合系数;
根据各所述变量融合系数,将各所述变量整合为历史行为融合数据。
可选地,所述整合模块还用于:
对所述历史行为数据集进行分解得到分解矩阵;
根据所述历史行为数据集和所述分解矩阵,确定所述历史行为数据集中来源于各所述数据源的各变量对应的变量融合系数。
可选地,所述分解矩阵包括结果矩阵和系数矩阵,所述整合模块还用于:
通过预设矩阵分解法对所述历史行为数据集进行分解得到结果矩阵和系数矩阵,其中,所述结果矩阵和所述系数矩阵为非负矩阵。
可选地,所述分解矩阵包括结果矩阵,所述整合模块还用于:
将所述历史行为数据集作为回归模型输入值,将所述结果矩阵作为所述回归模型输入值对应的输入标签;
根据所述回归模型输入值和所述输入标签,通过多元线性回归模型拟合得到所述历史行为数据集中来源于各所述数据源的各变量对应的变量融合系数。
可选地,所述整合模块还用于:
确定各所述变量与各自对应的各所述变量融合系数两两之间的乘积;
将各所述乘积整合为历史行为融合数据。
可选地,在所述根据所述历史行为融合数据和风险预测模型,对所述用户进行信用风险预测,得到风险预测结果的步骤之前,所述信用风险预测装置还用于:
获取训练行为数据集和所述训练行为数据集对应的真实标签,其中,所述训练行为数据集至少来源于两种数据源;
将所述训练行为数据集整合为训练行为融合数据;
根据所述训练行为融合数据和所述真实标签,对待训练风险预测模型进行迭代优化,得到风险预测模型。
本申请提供的信用风险预测装置,采用上述实施例中的信用风险预测方法,解决了无法兼顾用户信用风险的预测准确度和预测效率的技术问题。与现有技术相比,本申请实施例提供的信用风险预测装置的有益效果与上述实施例提供的信用风险预测方法的有益效果相同,且该信用风险预测装置中的其他技术特征与上述实施例方法公开的特征相同,在此不做赘述。
实施例四
本申请实施例提供一种电子设备,所述电子设备包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述实施例中的信用风险预测方法。
下面参考图6,其示出了适于用来实现本公开实施例的电子设备的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(Personal Digital Assistant,个人数字助理)、PAD(平板电脑)、PMP(Portable MediaPlayer,便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图6示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图6所示,电子设备可以包括处理装置(例如中央处理器、图形处理器等),其可以根据存储在ROM(Read-Only Memory,只读存储器)中的程序或者从存储装置加载到RAM(Random Access Memory,随机访问存储器)中的程序而执行各种适当的动作和处理。在RAM中,还存储有电子设备操作所需的各种程序和数据。处理装置、ROM以及RAM通过总线彼此相连。输入/输出(I/O)接口也连接至总线。
通常,以下系统可以连接至I/O接口:包括例如触摸屏、触摸板、键盘、鼠标、图像传感器、麦克风、加速度计、陀螺仪等的输入装置;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置;包括例如磁带、硬盘等的存储装置;以及通信装置。通信装置可以允许电子设备与其他设备进行无线或有线通信以交换数据。虽然图中示出了具有各种系统的电子设备,但是应理解的是,并不要求实施或具备所有示出的系统。可以替代地实施或具备更多或更少的系统。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置从网络上被下载和安装,或者从存储装置被安装,或者从ROM被安装。在该计算机程序被处理装置执行时,执行本公开实施例的方法中限定的上述功能。
本申请提供的电子设备,采用上述实施例中的信用风险预测方法,解决了无法兼顾用户信用风险的预测准确度和预测效率的技术问题。与现有技术相比,本申请实施例提供的电子设备的有益效果与上述实施例提供的信用风险预测方法的有益效果相同,且该电子设备中的其他技术特征与上述实施例方法公开的特征相同,在此不做赘述。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式的描述中,具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
实施例五
本实施例提供一种计算机可读存储介质,具有存储在其上的计算机可读程序指令,计算机可读程序指令用于执行上述实施例中的信用风险预测方法的方法。
本申请实施例提供的计算机可读存储介质例如可以是U盘,但不限于电、磁、光、电磁、红外线、或半导体的系统、系统或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、RAM、ROM、EPROM(Erasable Programmable Read Only Memory,可擦式可编程只读存储器)或闪存、光纤、CD-ROM(compact disc read-only memory,便携式紧凑磁盘只读存储器)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、系统或者器件使用或者与其结合使用。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(Radio Frequency,射频)等等,或者上述的任意合适的组合。
上述计算机可读存储介质可以是电子设备中所包含的;也可以是单独存在,而未装配入电子设备中。
上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被电子设备执行时,使得电子设备:获取用户的历史行为数据集,其中,所述历史行为数据集至少来源于两种数据源;将所述历史行为数据集整合为历史行为融合数据;根据所述历史行为融合数据和风险预测模型,对所述用户进行信用风险预测,得到风险预测结果。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括LAN(LocalArea Network,局域网)或WAN(Wide Area Network,广域网)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块的名称在某种情况下并不构成对该单元本身的限定。
本申请提供的计算机可读存储介质,存储有用于执行上述信用风险预测方法的计算机可读程序指令,解决了无法兼顾用户信用风险的预测准确度和预测效率的技术问题。与现有技术相比,本申请实施例提供的计算机可读存储介质的有益效果与上述实施提供的信用风险预测方法的有益效果相同,在此不做赘述。
实施例六
本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的信用风险预测方法的步骤。
本申请提供的计算机程序产品解决了无法兼顾用户信用风险的预测准确度和预测效率的技术问题。与现有技术相比,本申请实施例提供的计算机程序产品的有益效果与上述实施例提供的信用风险预测方法的有益效果相同,在此不做赘述。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利处理范围内。
Claims (10)
1.一种信用风险预测方法,其特征在于,所述信用风险预测方法包括:
获取用户的历史行为数据集,其中,所述历史行为数据集至少来源于两种数据源;
将所述历史行为数据集整合为历史行为融合数据;
根据所述历史行为融合数据和风险预测模型,对所述用户进行信用风险预测,得到风险预测结果。
2.如权利要求1所述信用风险预测方法,其特征在于,所述将所述历史行为数据集整合为历史行为融合数据的步骤包括:
确定所述历史行为数据集中来源于各所述数据源的各变量对应的变量融合系数;
根据各所述变量融合系数,将各所述变量整合为历史行为融合数据。
3.如权利要求2所述信用风险预测方法,其特征在于,所述确定所述历史行为数据集中来源于各所述数据源的各变量对应的变量融合系数的步骤包括:
对所述历史行为数据集进行分解得到分解矩阵;
根据所述历史行为数据集和所述分解矩阵,确定所述历史行为数据集中来源于各所述数据源的各变量对应的变量融合系数。
4.如权利要求3所述信用风险预测方法,其特征在于,所述分解矩阵包括结果矩阵和系数矩阵,
所述对所述历史行为数据集进行分解得到分解矩阵的步骤包括:
通过预设矩阵分解法对所述历史行为数据集进行分解得到结果矩阵和系数矩阵,其中,所述结果矩阵和所述系数矩阵为非负矩阵。
5.如权利要求3所述信用风险预测方法,其特征在于,所述分解矩阵包括结果矩阵,
所述根据所述历史行为数据集和所述分解矩阵,确定所述历史行为数据集中来源于各所述数据源的各变量对应的变量融合系数的步骤包括:
将所述历史行为数据集作为回归模型输入值,将所述结果矩阵作为所述回归模型输入值对应的输入标签;
根据所述回归模型输入值和所述输入标签,通过多元线性回归模型拟合得到所述历史行为数据集中来源于各所述数据源的各变量对应的变量融合系数。
6.如权利要求2所述信用风险预测方法,其特征在于,所述根据各所述变量融合系数,将各所述变量整合为历史行为融合数据的步骤包括:
确定各所述变量与各自对应的各所述变量融合系数两两之间的乘积;
将各所述乘积整合为历史行为融合数据。
7.如权利要求1所述信用风险预测方法,其特征在于,在所述根据所述历史行为融合数据和风险预测模型,对所述用户进行信用风险预测,得到风险预测结果的步骤之前,还包括:
获取训练行为数据集和所述训练行为数据集对应的真实标签,其中,所述训练行为数据集至少来源于两种数据源;
将所述训练行为数据集整合为训练行为融合数据;
根据所述训练行为融合数据和所述真实标签,对待训练风险预测模型进行迭代优化,得到风险预测模型。
8.一种信用风险预测装置,其特征在于,所述信用风险预测装置包括:
获取模块,用于获取用户的历史行为数据集,其中,所述历史行为数据集至少来源于两种数据源;
整合模块,用于将所述历史行为数据集整合为历史行为融合数据;
预测模块,用于根据所述历史行为融合数据和风险预测模型,对所述用户进行信用风险预测,得到风险预测结果。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至7中任一项所述的信用风险预测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有实现信用风险预测方法的程序,所述实现信用风险预测方法的程序被处理器执行以实现如权利要求1至7中任一项所述信用风险预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310189917.XA CN116151961A (zh) | 2023-02-22 | 2023-02-22 | 信用风险预测方法、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310189917.XA CN116151961A (zh) | 2023-02-22 | 2023-02-22 | 信用风险预测方法、电子设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116151961A true CN116151961A (zh) | 2023-05-23 |
Family
ID=86338931
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310189917.XA Pending CN116151961A (zh) | 2023-02-22 | 2023-02-22 | 信用风险预测方法、电子设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116151961A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116823451A (zh) * | 2023-08-10 | 2023-09-29 | 杭银消费金融股份有限公司 | 一种信贷风险控制方法与系统 |
-
2023
- 2023-02-22 CN CN202310189917.XA patent/CN116151961A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116823451A (zh) * | 2023-08-10 | 2023-09-29 | 杭银消费金融股份有限公司 | 一种信贷风险控制方法与系统 |
CN116823451B (zh) * | 2023-08-10 | 2024-03-26 | 杭银消费金融股份有限公司 | 一种信贷风险控制方法与系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102342604B1 (ko) | 뉴럴 네트워크 생성 방법 및 장치 | |
CN111381909A (zh) | 一种页面展示方法、装置、终端设备及存储介质 | |
CN116151961A (zh) | 信用风险预测方法、电子设备及可读存储介质 | |
US20200265025A1 (en) | Methods and systems for mapping flattened structure to relationship preserving hierarchical structure | |
CN116028868B (zh) | 设备故障分类方法、装置、电子设备及可读存储介质 | |
CN116563007A (zh) | 授信信用风险预测方法、电子设备及可读存储介质 | |
CN114647721A (zh) | 教育智能机器人控制方法、设备及介质 | |
CN115620851A (zh) | 数据校验方法、装置、电子设备及可读存储介质 | |
US20150170068A1 (en) | Determining analysis recommendations based on data analysis context | |
CN116416018A (zh) | 内容输出方法、装置、计算机可读介质及电子设备 | |
CN110222777B (zh) | 图像特征的处理方法、装置、电子设备及存储介质 | |
CN109657126B (zh) | 答案生成方法、装置、设备和介质 | |
CN114020774A (zh) | 多轮问答语句的处理方法、装置、设备及存储介质 | |
CN109857838B (zh) | 用于生成信息的方法和装置 | |
CN109086328B (zh) | 一种上下位关系的确定方法、装置、服务器及存储介质 | |
CN108984680B (zh) | 一种信息推荐方法、装置、服务器及存储介质 | |
CN111049988A (zh) | 移动设备的亲密度预测方法、系统、设备及存储介质 | |
CN115168478B (zh) | 数据类型转换方法、电子设备及可读存储介质 | |
CN110990528A (zh) | 一种问答方法、装置及电子设备 | |
Profitlich et al. | Interactivity and transparency in medical risk assessment with supersparse linear integer models | |
CN113515937B (zh) | 词嵌入模型处理方法及装置 | |
CN111680112B (zh) | 一种数据分析方法及装置 | |
US10996945B1 (en) | Splitting programs into distributed parts | |
CN117633536A (zh) | 模型训练优化方法、电子设备及计算机可读存储介质 | |
CN111694755B (zh) | 应用程序测试方法、装置、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |