CN115953031A

CN115953031A - 风险预测模型的训练方法及装置、计算机可读存储介质

Info

Publication number: CN115953031A
Application number: CN202310132757.5A
Authority: CN
Inventors: 范昊; 杨恺; 李娴; 郑邦祺; 黄志翔
Original assignee: Jingdong Technology Holding Co Ltd
Current assignee: Jingdong Technology Holding Co Ltd
Priority date: 2023-02-09
Filing date: 2023-02-09
Publication date: 2023-04-11

Abstract

本公开涉及风险预测模型的训练方法及装置、计算机可读存储介质，涉及人工智能领域。风险预测模型的训练方法包括：获取多个训练样本，其中，每个训练样本包括风险标签和用户特征，多个训练样本中至少一个训练样本的风险标签包括在第一时间窗口生成的第一风险标签和在第二时间窗口生成的第二风险标签，第一时间窗口的长度大于第二时间窗口的长度；针对每个训练样本，根据用户特征，利用风险预测模型生成风险预测结果；根据多个训练样本的风险预测结果和对应的风险标签，训练风险预测模型。根据本公开的风险预测模型的训练方法，能够同时提高风险预测模型在长期风险预测和短期风险预测上的准确率。

Description

风险预测模型的训练方法及装置、计算机可读存储介质

技术领域

本公开涉及互联网技术领域，特别涉及风险预测模型的训练方法、风险预测方法及装置、电子设备、计算机可读存储介质。

背景技术

随着互联网和通信技术的高速发展，传统的风险控制方式已逐渐不能支撑风险预测需求，而互联网技术对多维度、大量数据的智能处理，批量标准化的执行流程，更能贴合信息发展时代风险控制的发展要求。在互联网技术领域中，通过建立各种风险预测模型，学习用户的行为模式，挖掘海量数据中存在的价值，进而达到合理规避风险的目的。

互联网中的风险是指：用户未能履行约定契约中的义务，而造成损失的风险。相关技术中，通过建立风险预测模型，从用户特征中学习规律，预测用户是否存在违约风险，从而对用户进行风险控制和风险提示，规避用户违约的风险。

发明内容

根据本公开的第一方面，提供了一种风险预测模型的训练方法，包括：

获取多个训练样本，其中，每个训练样本包括风险标签和用户特征，多个训练样本中至少一个训练样本的风险标签包括在第一时间窗口生成的第一风险标签和在第二时间窗口生成的第二风险标签，第一时间窗口的长度大于第二时间窗口的长度；

针对每个训练样本，根据用户特征，利用风险预测模型生成风险预测结果，其中，所述至少一个训练样本的风险预测结果包括第一风险标签对应的第一风险预测任务的预测结果和第二风险标签对应的第二风险预测任务的预测结果；

根据多个训练样本的风险预测结果和对应的风险标签，训练风险预测模型。

在一些实施例中，根据多个训练样本的风险预测结果和对应的风险标签，训练风险预测模型，包括：

对于所述至少一个训练样本中的每个训练样本，根据第一风险标签、第二风险标签、第一风险预测任务的预测结果和第二风险预测任务的预测结果，计算所述至少一个训练样本中的每个训练样本的损失函数；

根据多个训练样本的损失函数，训练风险预测模型。

在一些实施例中，对于所述至少一个训练样本中的每个训练样本，根据第一风险标签、第二风险标签、第一风险预测任务的预测结果和第二风险预测任务的预测结果，计算所述至少一个训练样本中的每个训练样本的损失函数，包括：

对于所述至少一个训练样本中的每个训练样本，根据第一风险标签和第一风险预测任务的预测结果，计算所述至少一个训练样本中的每个训练样本的第一损失函数；

对于所述至少一个训练样本中的每个训练样本，根据第二风险标签和第二风险预测任务的预测结果，计算所述至少一个训练样本中的每个训练样本的第二损失函数；

根据所述至少一个训练样本中的每个训练样本的第一损失函数和第二损失函数，计算所述至少一个训练样本中的每个训练样本的损失函数。

在一些实施例中，根据所述至少一个训练样本中的每个训练样本的第一损失函数和第二损失函数，计算所述至少一个训练样本中的每个训练样本的损失函数，包括：

根据所述至少一个训练样本中的每个训练样本的第一损失函数和第二损失函数之和，计算所述至少一个训练样本中的每个训练样本的损失函数。

在一些实施例中，所述至少一个训练样本的用户特征在指定时间提取，第一时间窗口为从指定时间到第一时间的时间窗口，第二时间窗口为从指定时间到第二时间的时间窗口。

在一些实施例中，风险预测模型的训练方法还包括以下至少一项：

用默认值填充用户特征中的缺失值；

用均值填充法填充用户特征中的缺失值；

用就近补齐法填充用户特征中的缺失值；

用最近邻法填充用户特征中的缺失值；

用多重插补法填充用户特征中的缺失值。

在一些实施例中，风险预测模型的训练方法还包括筛除以下至少一种用户特征：

缺失率大于第一阈值的用户特征；

对训练样本的区分度低于第二阈值的用户特征；

方差大于第三阈值的用户特征。

在一些实施例中，风险预测模型的训练方法还包括：

对用户特征进行离散化处理。

在一些实施例中，风险预测模型的训练方法还包括：

利用验证样本，验证风险预测模型，其中，验证样本与训练样本生成的时间不同。

在一些实施例中，风险预测模型为多任务深度神经网络模型或树模型。

根据本公开的第二方面，提供了一种风险预测方法，包括：

根据目标用户的用户特征，利用风险预测模型生成对目标用户的风险预测结果，其中，风险预测模型根据本公开任一实施例所述的风险预测模型的训练方法训练得到。

根据本公开的第三方面，提供了一种风险预测模型的训练装置，包括：

获取模块，获取多个训练样本，其中，每个训练样本包括风险标签和用户特征，多个训练样本中至少一个训练样本的风险标签包括在第一时间窗口生成的第一风险标签和在第二时间窗口生成的第二风险标签，第一时间窗口的长度大于第二时间窗口的长度；

生成模块，针对每个训练样本，根据用户特征，利用风险预测模型生成风险预测结果，其中，所述至少一个训练样本的风险预测结果包括第一风险标签对应的第一风险预测任务的预测结果和第二风险标签对应的第二风险预测任务的预测结果；

训练模块，根据多个训练样本的风险预测结果和对应的风险标签，训练风险预测模型。

根据本公开的第四方面，提供了一种风险预测装置，包括：生成模块，被配置为根据目标用户的用户特征，利用风险预测模型生成对目标用户的风险预测结果，其中，风险预测模型根据本公开任一实施例所述的风险预测模型的训练装置训练得到。

根据本公开的第五方面，提供了一种电子设备，包括：

存储器；以及

耦接至所述存储器的处理器，所述处理器被配置为基于存储在所述存储器的指令，执行根据本公开任一实施例所述的风险预测模型的训练方法，或根据本公开任一实施例所述的风险预测方法。

根据本公开的第六方面，提供了一种计算机可读存储介质，其上存储有计算机程序指令，该指令被处理器执行时，实现根据本公开任一实施例所述的风险预测模型的训练方法，或根据本公开任一实施例所述的风险预测方法。

附图说明

构成说明书的一部分的附图描述了本公开的实施例，并且连同说明书一起用于解释本公开的原理。

参照附图，根据下面的详细描述，可以更加清楚地理解本公开，其中：

图1示出根据本公开一些实施例的风险预测模型的训练方法的流程图；

图2示出根据本公开一些实施例的风险预测标签和用户特征的构造方法；

图3示出根据本公开一些实施例的数据预处理方法；

图4示出根据本公开一些实施例的利用风险预测结果训练风险预测模型的流程图；

图5示出根据本公开一些实施例的计算损失函数的方法；

图6示出根据本公开一些实施例的风险预测模型的训练装置的框图；

图7示出根据本公开另一些实施例的电子设备的框图；

图8示出用于实现本公开一些实施例的计算机系统的框图。

具体实施方式

现在将参照附图来详细描述本公开的各种示例性实施例。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。

同时，应当明白，为了便于描述，附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本公开及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为说明书的一部分。

在这里示出和讨论的所有示例中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它示例可以具有不同的值。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

相关技术中，在建立风控模型时，每个用户作为一个样本，将用户申请的时间作为观察点，在观察点之前的一段时间窗口，作为观察期，用来在观察期中提取用户的行为表现数据，构造样本的特征X。

从观察点之后到表现点的时间窗口，作为表现期。表现期是对观察点上用户的表现进行监控的时间周期，根据用户在这段时间窗口内的的表现，将风险标签Y分类成“0”和“1”。“0”和“1”表示用户未来会不会出现违约、失联等。相较于观察点而言，表现期是未来时间，风险标签的获取需要等待数月以上的时间，表现期长的样本数量更少。因此，标签Y存在一定的滞后性，存在延迟反馈现象。

使用表现期越长的标签建模，用户的行为能够充分表现出来，用户的违约风险暴露得更加充分，但可以使用到的样本越少，影响模型的训练效果和准确率。使用表现期越短的风险标签建模，虽然能使用到的样本更多，但是短表现期的标签并不能充分暴露用户的长期违约风险，因此训练出的模型不能很好地学习用户的行为模式，对用户的长期违约行为的可能性预测不够准确，造成损失。

在选取样本训练模型时，难以在样本的完整性和样本的质量之间保持平衡。

此外，采用某一个标签训练出的模型，只能预测用户在该标签对应的风险上面的表现，但是不具备泛化性。

本公开提供了一种风险预测模型的训练方法、风险预测方法及装置、电子设备、计算机可读存储介质，能够同时提高风险预测模型在长期风险预测和短期风险预测上的准确率。

图1示出根据本公开一些实施例的风险预测模型的训练方法的流程图。

如图1所示，风险预测模型的训练方法包括步骤S1-步骤S3。在一些实施例中，风险预测模型的训练方法由风险预测模型的训练装置执行。

在步骤S1中，获取多个训练样本，其中，每个训练样本包括风险标签和用户特征，多个训练样本中至少一个训练样本的风险标签包括在第一时间窗口生成的第一风险标签和在第二时间窗口生成的第二风险标签，第一时间窗口的长度大于第二时间窗口的长度。

图2示出根据本公开一些实施例的风险预测标签和用户特征的构造方法。

如图2所示，至少一个训练样本的用户特征在指定时间提取，第一时间窗口为从指定时间到第一时间的时间窗口，第二时间窗口为从指定时间到第二时间的时间窗口。

指定时间(即，观察点)之前的一段时间是观察期，位于时间轴左侧，是用于观察用户特征的时间区间。例如，在指定时间，提取在观察期产生的用户特征。

本领域技术人员应当知晓，指定时间可以是一个时间区间，也就是用户提交申请的时间，在该时间区间提交申请的用户构成用于建模的样本。

观察点之后的一段时间窗口用于生成风险标签。根据本公开的一些实施例，用于训练模型的样本中，部分训练样本同时拥有多个不同长度时间窗口生成的标签。例如，训练样本A同时具有第一风险标签Y₁和第二风险标签Y₂。Y₁和Y₂分别用于表示不同类型的第一风险和第二风险是否发生，也就是说，第一风险标签和第二风险标签分别对应不同的风险预测任务。例如，第一风险为该用户违约90天，第二风险为违约30天。Y₁取值1和0分别表示第一风险是否发生，Y₂取值1和0分别表示第二风险是否发生。第一风险标签Y₁对应第一时间窗口(表现期)，也就是从指定时间到第一时间的时间区间，其长度为T₁。第二风险标签Y₂对应的第二时间窗口(表现期)，也就是从指定时间到第二时间的时间区间，其长度为T₂，T₁>T₂。

一个训练样本同时能够有不止两个风险标签，例如，有Y₁，Y₂，Y₃，……Y_N等多个标签，本公开对此不做限制。

另外，还有一些训练样本能够仅拥有一个风险标签。例如，用于训练模型的样本的集合(训练集)还包括训练样本B和D，训练样本B有风险标签Y₃，训练样本C有风险标签Y₄，Y₃对应的时间窗口长度大于Y₄的时间窗口Y₄。即，训练样本的集合包括具有长短不同的风险标签的训练样本。

在步骤S2中，利用风险预测模型，针对每个训练样本，根据用户特征，生成风险预测结果，其中，至少一个训练样本的风险预测结果包括第一风险标签对应的第一风险预测任务的预测结果和第二风险标签对应的第二风险预测任务的预测结果。

例如，将所有样本输入到模型之中，得到样本的每个风险标签对应的预测结果。

如果一个样本有多个标签，则生成多个标签对应的多个任务的多个预测结果，至少一个训练样本的风险预测结果包括第一风险标签对应的第一风险预测任务的预测结果和第二风险标签对应的第二风险预测任务的预测结果。训练样本A同时具有第一风险标签Y₁和第二风险标签Y₂，则生成对应的第一风险预测任务的预测结果p₁和第二风险标签p₂。

第一风险标签和第二风险标签分别对应不同的风险预测任务。风险预测模型能够同时学习第一风险标签对应的第一风险预测任务和第二风险标签对应的第二风险预测任务，得到在多个风险预测目标上的整体最优解。与使用只具有一个标签的训练样本训练单任务模型相比，在风险预测模型中使用多任务学习技术具有以下优点：

(1)由于多个(不同长度的时间窗口生成的)风险标签对应的多个风险预测任务之间具有一定的相关性，并且具有各自的噪声，因此多任务学习能够实现隐式的数据增强；

(2)多任务学习能够帮助风险预测模型将注意力集中在重要的用户特征和风险预测任务上，其他风险预测任务为这些重要用户特征的相关性或不相关性提供额外的证据，增强模型针对每个风险预测任务的学习效果；

(3)能够令风险预测模型学习通用化的用户特征表征，起到隐式正则的作用。

在训练模型之前，对训练集进行预处理，能够提高模型的预测效率。图3示出根据本公开一些实施例的数据预处理方法。

如图3所示，数据预处理包括数据准备、特征处理和特征工程等。

特征处理包括缺失值处理、特征筛选和数据划分等。下面介绍根据本公开一些实施例的特征处理的方法。

在一些实施例中，风险预测模型还包括以下至少一项：用默认值填充用户特征中的缺失值；用均值填充法填充用户特征中的缺失值；用就近补齐法填充用户特征中的缺失值；

用最近邻法填充用户特征中的缺失值；用多重插补法填充用户特征中的缺失值。

例如，将对于训练集、验证集中的样本，如果样本的多个特征中，部分特征的值缺失，则用默认值填充缺失特征值，对于标签中的缺失值予以保留，不做修改。此外，除了用默认值填充缺失值，还可以采用特殊值填充、平均值填充、热卡(就近补齐)法、最近邻法、多重插补法、模型预测等方法处理缺失值。

在一些实施例中，风险预测模型的训练方法还包括筛除以下至少一种用户特征：缺失率大于第一阈值的用户特征；对训练样本的区分度低于第二阈值的用户特征；方差大于第三阈值的用户特征。

例如，对训练样本和/或验证样本的多个特征进行特征筛选处理。将缺失率较高的特征和/或方差较大的不稳定特征排除。还能够排除失效的特征，也就是对训练样本的区分度低于第二阈值的用户特征，例如，取值恒定的恒一特征。其中，区分度是评估一个特征对用户的区分能力的指标。通过把单特征当做风险预测模型的输入，使用AUC(Area UnderCurve，曲线下面积)，KS(Kolmogorov-Smirnov，洛伦兹曲线)，IV(Information Value，信息价值)，来计算特征的区分度。

此外，采取特征降维方法，例如PCA(principal component analysis，主成分分析)等，也能实现对有效特征的筛选。

在划分训练样本时，将训练样本按照一定比例，随机划分为训练集(train)和测试集(test)，保留验证样本不进行划分，其中，训练集用来训练模型，测试集用来监督模型的训练过程，防止过拟合，验证集用来评估模型的性能。

在一些实施例中，风险预测模型的训练方法还包括：对用户特征进行离散化处理。例如，对特征(例如连续特征、多分类特征)，进行分箱离散化处理。

通过对特征进行离散化处理，能够促进模型的快速迭代，降低模型过拟合的风险，提高模型的稳定性。

此外，在特征工程中，还对训练集中的类别特征，进行独热(onehot)编码，得到嵌入向量；对连续特征进行数据标准化(例如，数据归一化)、对数(log)变换等处理，得到稠密向量。对验证样本，也做类似的处理。

在用户特征中，可能存在不相关的特征，特征之间也可能相互依赖，本公开通过特征处理，能够更加灵活地处理数据。

在步骤S3中，根据多个训练样本的风险预测结果和对应的风险标签，训练风险预测模型。

例如，对于每个训练样本，根据训练样本的风险预测结果和样本的标签，能够计算训练样本的损失函数。根据所有训练样本的损失函数，求解损失函数最小值对应的模型参数，以更新模型参数，训练风险预测模型。

在一些实施例中，风险预测模型为Multi-TaskDNN(Multi-Task Deep NeuralNetworks，多任务深度神经网络模型)或树模型等多任务预测模型。

如果风险预测模型采用树结构的模型，则采用加法模型和分步计算的原理，不断迭代建立新的树，直到达到模型停止训练的条件。

如果采用多任务深度神经网络模型，则在训练过程中更新迭代模型的参数，模型可以训练若干轮(epoch)，其中每个epoch在上一个epoch的基础上进行训练。神经网络模型训练时会采取梯度下降+反向传播的方式进行训练，并对待优化参数进行更新。在优化时可以针对具体任务类型调整优化方式，例如梯度下降、随机梯度下降、小批量(minibatch)梯度下降、动量(Momentum)随机梯度下降、Adagrad(adaptive gradient，自适应梯度)法、Adam(adaptive moment estimation，自适应矩估计)法等。

损失函数采用交叉熵损失函数、0-1损失函数、Hinge(合页)损失函数、指数损失函数、对数损失函数等。

在模型训练完成后，采取Auc、召回率(Recall)、平衡F分数(F1)、KS等评价指标对模型进行评估。

图4示出根据本公开一些实施例的利用风险预测结果训练风险预测模型的流程图。

如图4所示，利用风险预测结果训练风险预测模型包括步骤S31-S32。

在步骤S31中，对于至少一个训练样本中的每个训练样本，根据第一风险标签、第二风险标签、第一风险预测任务的预测结果和第二风险预测任务的预测结果，计算至少一个训练样本中的每个训练样本的损失函数。

在步骤S32中，根据多个训练样本的损失函数，训练风险预测模型。

例如，如果训练样本A同时包括第一风险标签Y₁和第二风险标签Y₂，则将训练样本A的特征输入模型中，能得到对第一风险是否发生的预测结果p₁和对第一风险是否发生的预测结果p₂。根据Y₁、Y₂、p₁、p₂，计算训练样本A的损失函数。

如果训练样本B仅包括一个风险标签(例如，第一风险标签Y₁)，将训练样本A的特征输入模型中，则只需要根据Y₁和p₁，计算训练训练样本A的损失函数。

在一些实施例中，对于至少一个训练样本中的每个训练样本，根据第一风险标签、第二风险标签、第一风险预测任务的预测结果和第二风险预测任务的预测结果，计算至少一个训练样本中的每个训练样本的损失函数，包括：对于至少一个训练样本中的每个训练样本，根据第一风险标签和第一风险预测任务的预测结果，计算至少一个训练样本中的每个训练样本的第一损失函数；对于至少一个训练样本中的每个训练样本，根据第二风险标签和第二风险预测任务的预测结果，计算至少一个训练样本中的每个训练样本的第二损失函数；根据至少一个训练样本中的每个训练样本的第一损失函数和第二损失函数，计算至少一个训练样本中的每个训练样本的损失函数。

例如，根据Y₁和p₁，计算训练样本A的第一损失函数L₁，根据Y₂和p₂，计算训练样本A的第二损失函数L₂，根据第一损失函数和第二损失函数，计算训练样本A最终的损失函数。

在一些实施例中，根据至少一个训练样本中的每个训练样本的第一损失函数和第二损失函数，计算至少一个训练样本中的每个训练样本的损失函数，包括：根据至少一个训练样本中的每个训练样本的第一损失函数和第二损失函数之和，计算至少一个训练样本中的每个训练样本的损失函数。

例如，训练样本A最终的损失函数是L₁+L2。

风险预测模型能够有不止有两个风险预测任务，相应地，一个训练样本也能够有不止两个风险标签。下面以多任务神经网络模型为例，介绍在有N个风险预测任务的情况下，如何实现模型的训练。

图5示出根据本公开一些实施例的计算损失函数的方法。

对于N个风险预测任务，其对应的风险标签为Y＝{Y₁,Y₂…Y_N}。由于相对于用户特征来说，标签具有滞后性，可能出现部分标签缺失的情况，所以不是每个训练样本都能具有所有的风险标签，即，一个训练样本的任意一个风险标签可以是空值。

风险预测模型对N个任务的风险预测结果为P＝{p₁,p₂…p_N}。

对于任意一个训练样本，遍历训练样本的所有风险标签，如果当前风险标签Y_i为空值，则跳过，否则，根据Y_i和p_i，计算该训练样本在第i个任务上的损失函数Loss_i。对该训练样本的所有损失函数求和，得到该训练样本的总损失函数。其中，训练样本在第i个任务上的损失函数Loss_i可以是交叉熵损失函数。

在一些实施例中，利用验证样本，验证风险预测模型，其中，验证样本与训练样本生成的时间不同。例如，在数据库中指定时间作为观察点，并确定时间窗口，生成训练集和跨时间验证集。其中，训练集用于模型的训练，验证集用于评估模型的性能。

验证样本是OOT(Out of Time，跨时间)验证样本，能够用于模拟评估模型上线应用后的效果。OOT验证样本的标签生成的时间与训练样本的标签生成的时间生成的时间不同，因此，OOT验证样本与训练样本生成的时间不同。例如，训练样本是根据今年数据产生的样本，验证样本是根据去年数据产生的样本。训练样本和验证样本的风险标签对应的时间窗口不重叠。利用跨时间的验证样本，验证模型，能够保证模型的稳定性，提高模型的泛化能力。

在使用测试样本对模型进行测试和/或使用验证样本对模型进行验证时，计算损失函数的方法与训练过程类似，此处不再赘述。

根据本公开的风险预测模型的训练方法，通过获取多个训练样本，利用风险预测模型，针对每个训练样本，根据用户特征，生成风险预测结果，然后根据多个训练样本的风险预测结果和对应的风险标签，训练风险预测模型，利用部分训练样本的第一风险标签和第二风险标签，同时在多个任务上训练风险预测模型，获取在第一风险预测任务和第二风险预测任务上的预测结果。

风险预测模型既学习长期风险与用户特征之间的关系，减少风险标签延迟反馈现象对长期风险预测的影响；又能够利用到更多的新鲜训练样本，在学习到短期风险与用户特征之间的关系的同时，增加可用的训练样本数量。此外，第一风险预测任务和第二风险预测任务之间具有一定的相关性，并且具有各自的噪声，这种风险预测模型同时在多个风险预测任务上训练的方法能够实现数据增强。因此，训练得到的风险预测模型在长期风险预测和短期风险预测上，都能够有更高的准确率。

此外，根据本公开的风险预测模型的训练方法训练得到的风险预测模型，能够同时预测多个风险预测任务，泛化性更好。

本公开提供了一种风险预测方法，包括：根据目标用户的用户特征，利用风险预测模型生成对目标用户的风险预测结果，其中，风险预测模型根据本公开任一实施例所述的风险预测模型的训练方法训练得到。在一些实施例中，风险预测方法由风险预测装置执行。

其中，目标用户可以是任何需要评估其违约风险的用户。在训练完成风险预测模型后，根据目标用户的用户特征，利用风险预测模型，能够根据需要，生成第一风险预测任务的预测结果和/或第二风险标签对应的第二风险预测任务的预测结果，从而判断目标用户在未来的第一时间窗口是否会违约和/或在第二时间窗口是否会违约。其中，用户特征在指定时间提取，第一时间窗口为从指定时间到第一时间的时间窗口，第二时间窗口为从指定时间到第二时间的时间窗口。

图6示出根据本公开一些实施例的风险预测模型的训练装置的框图。

如图6所示，风险预测模型的训练装置6包括获取模块61、生成模块62和训练模块63。

获取模块61，被配置为获取多个训练样本，其中，每个训练样本包括风险标签和用户特征，多个训练样本中至少一个训练样本的风险标签包括在第一时间窗口生成的第一风险标签和在第二时间窗口生成的第二风险标签，第一时间窗口的长度大于第二时间窗口的长度，例如执行如图6所示的步骤S1。

生成模块62，被配置为针对每个训练样本，根据用户特征，利用风险预测模型生成风险预测结果，其中，至少一个训练样本的风险预测结果包括第一风险标签对应的第一风险预测任务的预测结果和第二风险标签对应的第二风险预测任务的预测结果，例如执行如图6所示的步骤S2。

训练模块63，被配置为根据多个训练样本的风险预测结果和对应的风险标签，训练风险预测模型，例如执行如图6所示的步骤S3。

本公开提供了一种风险预测装置，包括生成模块。其中，生成模块被配置为根据目标用户的用户特征，利用风险预测模型生成对目标用户的风险预测结果，其中，风险预测模型根据本公开任一实施例所述的风险预测模型的训练装置训练得到。

图7示出根据本公开另一些实施例的电子设备的框图。

如图7所示，电子设备7包括存储器71；以及耦接至该存储器71的处理器72，存储器71用于存储执行风险预测模型的训练方法。处理器72被配置为基于存储在存储器71中的指令，执行本公开中任意一些实施例中的风险预测模型的训练方法。

根据本公开一些实施例的风险预测模型的训练装置和/或电子设备，利用部分训练样本的第一风险标签和第二风险标签，同时在多个任务上训练风险预测模型，获取在第一风险预测任务和第二风险预测任务上的预测结果，既学习长期风险与用户特征之间的关系，减少风险标签延迟反馈现象对长期风险预测的影响，又能够利用到更多的新鲜训练样本，在学习到短期风险与用户特征之间的关系的同时，增加可用的训练样本数量，实现数据增强。因此，训练得到的风险预测模型在长期风险预测和短期风险预测上，都能够有更高的准确率。

图8示出用于实现本公开一些实施例的计算机系统的框图。

如图8所示，计算机系统80可以通用计算设备的形式表现。计算机系统80包括存储器810、处理器820和连接不同系统组件的总线800。

存储器810例如可以包括系统存储器、非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(Boot Loader)以及其他程序等。系统存储器可以包括易失性存储介质，例如随机存取存储器(RAM)和/或高速缓存存储器。非易失性存储介质例如存储有执行本公开中任意一些实施例中的风险预测模型的训练方法的指令。非易失性存储介质包括但不限于磁盘存储器、光学存储器、闪存等。

处理器820可以用通用处理器、数字信号处理器(DSP)、应用专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑设备、分立门或晶体管等分立硬件组件方式来实现。相应地，诸如判断模块和确定模块的每个模块，可以通过中央处理器(CPU)运行存储器中执行相应步骤的指令来实现，也可以通过执行相应步骤的专用电路来实现。

总线800可以使用多种总线结构中的任意总线结构。例如，总线结构包括但不限于工业标准体系结构(ISA)总线、微通道体系结构(MCA)总线、外围组件互连(PCI)总线。

计算机系统80还可以包括输入输出接口830、网络接口840、存储接口850等。这些接口830、840、850以及存储器810和处理器820之间可以通过总线800连接。输入输出接口830可以为显示器、鼠标、键盘等输入输出设备提供连接接口。网络接口840为各种联网设备提供连接接口。存储接口850为软盘、U盘、SD卡等外部存储设备提供连接接口。

这里，参照根据本公开实施例的方法、装置和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解，流程图和/或框图的每个框以及各框的组合，都可以由计算机可读程序指令实现。

这些计算机可读程序指令可提供到通用计算机、专用计算机或其他可编程装置的处理器，以产生一个机器，使得通过处理器执行指令产生实现在流程图和/或框图中一个或多个框中指定的功能的装置。

这些计算机可读程序指令也可读存储在计算机可读存储器中，这些指令使得计算机以特定方式工作，从而产生一个制造品，包括实现在流程图和/或框图中一个或多个框中指定的功能的指令。

本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。

通过上述实施例中的风险预测模型的训练方法、风险预测方法及装置、电子设备、计算机可读存储介质，提高了风险预测模型在长期风险预测和短期风险预测上的准确率。

至此，已经详细描述了根据本公开的风险预测模型的训练方法及装置、计算机可读存储介质。为了避免遮蔽本公开的构思，没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述，完全可以明白如何实施这里公开的技术方案。

Claims

1.一种风险预测模型的训练方法，包括：

2.根据权利要求1所述的风险预测模型的训练方法，其中，根据多个训练样本的风险预测结果和对应的风险标签，训练风险预测模型，包括：

根据多个训练样本的损失函数，训练风险预测模型。

3.根据权利要求2所述的风险预测模型的训练方法，其中，对于所述至少一个训练样本中的每个训练样本，根据第一风险标签、第二风险标签、第一风险预测任务的预测结果和第二风险预测任务的预测结果，计算所述至少一个训练样本中的每个训练样本的损失函数，包括：

4.根据权利要求3所述的风险预测模型的训练方法，其中，根据所述至少一个训练样本中的每个训练样本的第一损失函数和第二损失函数，计算所述至少一个训练样本中的每个训练样本的损失函数，包括：

5.根据权利要求1至4任一项所述的风险预测模型的训练方法，其中，所述至少一个训练样本的用户特征在指定时间提取，第一时间窗口为从指定时间到第一时间的时间窗口，第二时间窗口为从指定时间到第二时间的时间窗口。

6.根据权利要求1至4任一项所述的风险预测模型的训练方法，还包括以下至少一项：

用默认值填充用户特征中的缺失值；

用均值填充法填充用户特征中的缺失值；

用就近补齐法填充用户特征中的缺失值；

用最近邻法填充用户特征中的缺失值；

用多重插补法填充用户特征中的缺失值。

7.根据权利要求1至4任一项所述的风险预测模型的训练方法，还包括筛除以下至少一种用户特征：

缺失率大于第一阈值的用户特征；

对训练样本的区分度低于第二阈值的用户特征；

方差大于第三阈值的用户特征。

8.根据权利要求1至4任一项所述的风险预测模型的训练方法，还包括：

对用户特征进行离散化处理。

9.根据权利要求1至4任一项所述的风险预测模型的训练方法，还包括：

10.根据权利要求1至4任一项所述的风险预测模型的训练方法，其中，风险预测模型为多任务深度神经网络模型或树模型。

11.一种风险预测方法，包括：

根据目标用户的用户特征，利用风险预测模型生成对目标用户的风险预测结果，其中，风险预测模型根据权利要求1-10任一项所述的风险预测模型的训练方法训练得到。

12.一种风险预测模型的训练装置，包括：

13.一种风险预测装置，包括：

生成模块，被配置为根据目标用户的用户特征，利用风险预测模型生成对目标用户的风险预测结果，其中，风险预测模型利用根据权利要求12所述的风险预测模型的训练装置训练得到。

14.一种电子设备，包括：

存储器；以及

耦接至所述存储器的处理器，所述处理器被配置为基于存储在所述存储器的指令，执行根据权利要求1至10任一项所述的风险预测模型的训练方法，或根据权利要求1 1所述的风险预测方法。

15.一种计算机可读存储介质，其上存储有计算机程序指令，该指令被处理器执行时，实现根据权利要求1至10任一项所述的风险预测模型的训练方法，或根据权利要求1 1所述的风险预测方法。