CN111582651A

CN111582651A - 用户风险分析模型训练方法、装置及电子设备

Info

Publication number: CN111582651A
Application number: CN202010277977.3A
Authority: CN
Inventors: 李恒奎
Original assignee: Shanghai Qiyu Information Technology Co ltd
Current assignee: Shanghai Qiyu Information Technology Co ltd
Priority date: 2020-04-09
Filing date: 2020-04-09
Publication date: 2020-08-25

Abstract

本公开涉及一种用户风险分析模型训练方法、装置、电子设备及计算机可读介质。该方法包括：获取用户数据，所述用户数据包括基础数据和行为数据；基于所述基础数据和所述行为数据为所述用户数据确定标签，所述标签包括正向标签和负向标签；基于所述标签对所述用户数据进行样本扩容处理，生成样本数据；通过所述样本数据对预设机器学习模型进行训练，生成用户风险分析模型，所述预设机器学习模型为带有改进函数的机器学习模型。本公开涉及的用户风险分析模型训练方法、装置、电子设备及计算机可读介质，能够提高机器学习模型的训练效果，增加机器学习模型计算的准确率，进而生成快速高效的用户风险分析模型。

Description

用户风险分析模型训练方法、装置及电子设备

技术领域

本公开涉及计算机信息处理领域，具体而言，涉及一种用户风险分析模型训练方法、装置、电子设备及计算机可读介质。

背景技术

通常情况下机器学习模型需要对正样本(好样本)和负样本(坏样本)进行学习，正样本是正确分类出的类别所对应的样本，负样本原则上可以选取任何不是正确类别的其他样本。但是对于金融领域或者其他领域而言，正样本的选取是较容易的，比如在金融领域，用户金融风险分析的时候，可将未有过逾期的用户作为正样本，将已经违约的用户作为机器学习模型训练的负样本，但是对于正样本而言，负样本的数量是极少的，这种情况下产生的样本是不均衡的样本。

不均衡的样本，即数据集中存在某一类样本，其数量远多于或远少于其他类样本，从而导致一些机器学习模型失效的问题。例如逻辑回归即不适合处理类别不平衡问题，例如逻辑回归在欺诈检测问题中，因为绝大多数样本都为正常样本，欺诈样本很少，逻辑回归算法会倾向于把大多数样本判定为正常样本，这样能达到很高的准确率，但是达不到很高的召回率，这种不均衡的样本会给机器学习模型训练引入很多误差数据，最终可能导致训练出来的模型效果不够理想。

因此，需要一种新的用户风险分析模型训练方法、装置、电子设备及计算机可读介质。

在所述背景技术部分公开的上述信息仅用于加强对本公开的背景的理解，因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

有鉴于此，本公开提供一种用户风险分析模型训练方法、装置、电子设备及计算机可读介质，能够提高机器学习模型的训练效果，增加机器学习模型计算的准确率，进而生成快速高效的用户风险分析模型。

本公开的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本公开的实践而习得。

根据本公开的一方面，提出一种用户风险分析模型训练方法，该方法包括：获取用户数据，所述用户数据包括基础数据和行为数据；基于所述基础数据和所述行为数据为所述用户数据确定标签，所述标签包括正向标签和负向标签；基于所述标签对所述用户数据进行样本扩容处理，生成样本数据；通过所述样本数据对预设机器学习模型进行训练，生成用户风险分析模型，所述预设机器学习模型为带有改进函数的机器学习模型。

可选地，还包括：将当前用户数据输入所述用户风险分析模型中，生成所述当前用户数据的风险概率。

可选地，基于所述基础数据和所述行为数据为所述用户数据确定标签，所述标签包括正向标签和负向标签，包括：通过所述风险策略集合对所述基础数据和所述行为数据进行判定；为满足风控策略集合的用户数据确定正向标签；为不满足风控策略集合的用户数据确定负向标签。

可选地，基于所述标签对所述用户数据进行样本扩容处理，生成样本数据，包括：通过近邻算法对带有负向标签的用户数据进行样本扩容处理以生成所述样本数据；和/或通过生成对抗网络模型对带有负向标签的用户数据进行样本扩容处理以生成所述样本数据；和/或通过标签传播算法对带有负向标签的用户数据进行样本扩容处理以生成所述样本数据。

可选地，通过所述样本数据对预设机器学习模型进行训练，生成用户风险分析模型，包括：基于FOCAL LOSS损失函数生成极端梯度提升决策树模型；以及通过所述样本数据对所述极端梯度提升决策树模型进行训练以生成所述用户风险分析模型。

可选地，函数单元，还用于在平衡交叉熵损失函数上设置抑制参数生成所述FOCALLOSS损失函数。

可选地，FL(p_t)＝-α_t(1-p_t)^γlog(p_t)其中，F1为FOCAL LOSS损失函数；α_t为抑制参数；p_t为所述样本数据经过机器学习模型中sigmoid激活函数后的输出数据；γ为调节参数，γ∈[0，5]。

可选地，在所述样本数据经过机器学习模型中sigmoid激活函数后的输出数据的样本标签为正向标签时，p_t为概率p；在所述样本数据经过机器学习模型中sigmoid激活函数后的输出数据的样本标签为负向标签时，p_t为概率1-p；其中，p∈(1，0)。

可选地，通过所述样本数据对所述极端梯度提升决策树模型进行训练以生成所述用户风险分析模型，包括：将所述样本数据输入所述极端梯度提升决策树模型；所述极端梯度提升决策树模型中的改进函数基于样本数据的标签为所述样本数据分配权重；所述极端梯度提升决策树模型基于所述权重进行训练以生成所述用户风险分析模型。

可选地，所述极端梯度提升决策树模型中的改进函数基于样本数据的标签为所述样本数据分配权重，包括：所述极端梯度提升决策树模型中的改进函数为带有正向标签的样本数分配第一权重；以及所述极端梯度提升决策树模型中的改进函数为带有负向标签的样本数分配第二权重；其中，所述第二权重大于所述第一权重。

可选地，通过近邻算法对带有负向标签的用户数据进行样本扩容处理以生成所述样本数据，包括：通过近邻算法为带有负向标签的用户数据生成采样数据；以及通过所述采样数据和所述用户数据生成所述样本数据。

可选地，通过生成对抗网络模型对带有负向标签的用户数据进行样本扩容处理以生成所述样本数据，包括：通过带有标签的用户数据对生成对抗网络模型进行训练，获取样本生成模型；通过所述样本生成模型生成带有负向标签的虚拟数据；以及通过所述虚拟数据和所述用户数据生成所述样本数据。

可选地，通过标签传播算法对带有负向标签的用户数据进行样本扩容处理以生成所述样本数据，包括：通过用户数据之间的相似度建立用户图谱，所述用户图谱中的节点为用户，边为用户之间的相似度关系；基于标签传播算法为所述用户图谱中部分的用户重新分配正向标签或负向标签；以及通过负向标签的用户和所述用户数据生成所述样本数据。

根据本公开的一方面，提出一种用户风险分析模型训练装置，该装置包括：数据模块，用于获取用户数据，所述用户数据包括基础数据和行为数据；标签模块，用于基于所述基础数据和所述行为数据为所述用户数据确定标签，所述标签包括正向标签和负向标签；扩容模块，用于基于所述标签对所述用户数据进行样本扩容处理，生成样本数据；训练模块，用于通过所述样本数据对预设机器学习模型进行训练，生成用户风险分析模型，所述预设机器学习模型为带有改进函数的机器学习模型。

可选地，还包括：概率模块，用于将当前用户数据输入所述用户风险分析模型中，生成所述当前用户数据的风险概率。

可选地，所述标签模块，包括：判定单元，用于通过所述风险策略集合对所述基础数据和所述行为数据进行判定；为满足风控策略集合的用户数据确定正向标签；为不满足风控策略集合的用户数据确定负向标签。

可选地，所述扩容模块，包括：第一单元，用于通过近邻算法对带有负向标签的用户数据进行样本扩容处理以生成所述样本数据；和/或第二单元，用于通过生成对抗网络模型对带有负向标签的用户数据进行样本扩容处理以生成所述样本数据；和/或第三单元，用于通过标签传播算法对带有负向标签的用户数据进行样本扩容处理以生成所述样本数据。

可选地，所述训练模块，包括：函数单元，用于基于FOCAL LOSS损失函数生成极端梯度提升决策树模型；以及训练单元，用于通过所述样本数据对所述极端梯度提升决策树模型进行训练以生成所述用户风险分析模型。

可选地，所述训练单元，包括：输入子单元，用于将所述样本数据输入所述极端梯度提升决策树模型；权重子单元，用于所述极端梯度提升决策树模型中的改进函数基于样本数据的标签为所述样本数据分配权重；训练子单元，用于所述极端梯度提升决策树模型基于所述权重进行训练以生成所述用户风险分析模型。

可选地，所述权重子单元，还用于所述极端梯度提升决策树模型中的改进函数为带有正向标签的样本数分配第一权重；以及所述极端梯度提升决策树模型中的改进函数为带有负向标签的样本数分配第二权重；其中，所述第二权重大于所述第一权重。

可选地，所述第一单元，包括：采样子单元，用于通过近邻算法为带有负向标签的用户数据生成采样数据；通过所述采样数据和所述用户数据生成所述样本数据。

可选地，所述第二单元，包括：网络子单元，用于通过带有标签的用户数据对生成对抗网络模型进行训练，获取样本生成模型；虚拟子单元，用于通过所述样本生成模型生成带有负向标签的虚拟数据；以及通过所述虚拟数据和所述用户数据生成所述样本数据。

可选地，所述第三单元，包括：图谱子单元，用于通过用户数据之间的相似度建立用户图谱，所述用户图谱中的节点为用户，边为用户之间的相似度关系；分配子单元，用于基于标签传播算法为所述用户图谱中部分的用户重新分配正向标签或负向标签；以及通过负向标签的用户和所述用户数据生成所述样本数据。

根据本公开的一方面，提出一种电子设备，该电子设备包括：一个或多个处理器；存储装置，用于存储一个或多个程序；当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器实现如上文的方法。

根据本公开的一方面，提出一种计算机可读介质，其上存储有计算机程序，该程序被处理器执行时实现如上文中的方法。

根据本公开的用户风险分析模型训练方法、装置、电子设备及计算机可读介质，获取用户数据，所述用户数据包括基础数据和行为数据；基于所述基础数据和所述行为数据为所述用户数据确定标签，所述标签包括正向标签和负向标签；基于所述标签对所述用户数据进行样本扩容处理，生成样本数据；通过所述样本数据对预设机器学习模型进行训练，生成用户风险分析模型，所述预设机器学习模型为带有改进函数的机器学习模型的方式，能够提高机器学习模型的训练效果，增加机器学习模型计算的准确率，进而生成快速高效的用户风险分析模型。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性的，并不能限制本公开。

附图说明

通过参照附图详细描述其示例实施例，本公开的上述和其它目标、特征及优点将变得更加显而易见。下面描述的附图仅仅是本公开的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据一示例性实施例示出的一种用户风险分析模型训练方法的流程图。

图2是根据一示例性实施例示出的一种用户风险分析模型训练方法的流程图。

图3是根据另一示例性实施例示出的一种用户风险分析模型训练方法的流程图。

图4是根据另一示例性实施例示出的一种用户风险分析模型训练方法的流程图。

图5是根据另一示例性实施例示出的一种用户风险分析模型训练方法的流程图。

图6是根据一示例性实施例示出的一种用户风险分析模型训练装置的框图。

图7是根据一示例性实施例示出的一种电子设备的框图。

图8是根据一示例性实施例示出的一种计算机可读介质的框图。

具体实施方式

现在将参考附图更全面地描述示例实施例。然而，示例实施例能够以多种形式实施，且不应被理解为限于在此阐述的实施例；相反，提供这些实施例使得本公开将全面和完整，并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。

此外，所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中，提供许多具体细节从而给出对本公开的实施例的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而没有特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。

附图中所示的方框图仅仅是功能实体，不一定必须与物理上独立的实体相对应。即，可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

附图中所示的流程图仅是示例性说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解，而有的操作/步骤可以合并或部分合并，因此实际执行的顺序有可能根据实际情况改变。

应理解，虽然本文中可能使用术语第一、第二、第三等来描述各种组件，但这些组件不应受这些术语限制。这些术语乃用以区分一组件与另一组件。因此，下文论述的第一组件可称为第二组件而不偏离本公开概念的教示。如本文中所使用，术语“及/或”包括相关联的列出项目中的任一个及一或多者的所有组合。

本领域技术人员可以理解，附图只是示例实施例的示意图，附图中的模块或流程并不一定是实施本公开所必须的，因此不能用于限制本公开的保护范围。

图1是根据一示例性实施例示出的一种用户风险分析模型训练方法的流程图。用户风险分析模型训练方法10至少包括步骤S102至S108。

如图1所示，在S102中，获取用户数据，所述用户数据包括基础数据和行为数据。

其中，用户数据中的基础数据可为用户在金融网络平台上注册登记的基本信息，具体可包括性别、年龄、职业、爱好等等。行为数据可包括用户在金融网络平台上产生的行为，具体可包括借款行为，还款行为、借款时间、还款时间等等。

在S104中，基于所述基础数据和所述行为数据为所述用户数据确定标签，所述标签包括正向标签和负向标签。包括：通过所述风险策略集合对所述基础数据和所述行为数据进行判定；为满足风控策略集合的用户数据确定正向标签；为不满足风控策略集合的用户数据确定负向标签。

可获取某金融网站上已注册的用户数据，为了进行更准确的计算，可为在某金融网站上已经注册且进行过借款活动的用户，可依据用户的金融特征或者违约特征为用户分配标签，具体可例如：违约用户和未违约用户，可为在网时间1年以上的未违约用户指定正向标签，为所有已经违约的用户指定所述向标签。

在S106中，基于所述标签对所述用户数据进行样本扩容处理，生成样本数据。包括：通过近邻算法对带有负向标签的用户数据进行样本扩容处理以生成所述样本数据；和/或通过生成对抗网络模型对带有负向标签的用户数据进行样本扩容处理以生成所述样本数据；和/或通过标签传播算法对带有负向标签的用户数据进行样本扩容处理以生成所述样本数据。

“基于所述标签对所述用户数据进行样本扩容处理，生成样本数据”的详细内容将在图3，4，5对应的实施例中进行具体描述。

在S108中，通过所述样本数据对预设机器学习模型进行训练，生成用户风险分析模型，所述预设机器学习模型为带有改进函数的机器学习模型。包括：基于FOCAL LOSS损失函数生成极端梯度提升决策树模型；以及通过所述样本数据对所述极端梯度提升决策树模型进行训练以生成所述用户风险分析模型。

其中，本公开中的FOCAL LOSS损失函数是在交叉熵损失函数(cross_entropy_loss)前加上权重，让模型去注重学习更加难以学习的样本，对于数据不均衡问题来说是去学习占比较少的样本，从而在一定程度上解决类别不均衡问题。

在一个实施例中，还包括：将当前用户数据输入所述用户风险分析模型中，生成所述当前用户数据的风险概率。

在本案例中，将xgboost(eXtreme Gradient Boosting)中的二分类目标函数”binary：logistic”修改为focal loss函数，然后将样本划分为训练集(Training Data)和测试集(Testing Data)进行建模，然后与二分类目标函数“binary：logistic”进行对比。

结果显示使用二分类目标函数“binary：logistic”时，训练集上AUC为0.689，测试集上AUC为0.657；使用focal loss目标函数时，训练集上AUC为0.694，测试集上AUC为0.663；因此，使用focal loss目标函数后，模型效果有一定的提升。

其中，AUC是ROC(接受者操作特征曲线)曲线下方面积。ROC曲线是根据一系列不同的二分类方式(分界值或决定阈)，以真阳性率(敏感性)为纵坐标，假阳性率(1-特异性)为横坐标绘制的曲线。AUC的大小是衡量二分类模型优劣的一种评价指标，表示预测的正例排在负例前面的概率。

根据本公开的用户风险分析模型训练方法，获取用户数据，所述用户数据包括基础数据和行为数据；基于所述基础数据和所述行为数据为所述用户数据确定标签，所述标签包括正向标签和负向标签；基于所述标签对所述用户数据进行样本扩容处理，生成样本数据；通过所述样本数据对预设机器学习模型进行训练，生成用户风险分析模型，所述预设机器学习模型为带有改进函数的机器学习模型的方式，能够提高机器学习模型的训练效果，增加机器学习模型计算的准确率，进而生成快速高效的用户风险分析模型。

应清楚地理解，本公开描述了如何形成和使用特定示例，但本公开的原理不限于这些示例的任何细节。相反，基于本公开公开的内容的教导，这些原理能够应用于许多其它实施例。

图2是根据另一示例性实施例示出的一种用户风险分析模型训练方法的流程图。图2所示的流程是对图1所示的流程中S108“通过所述样本数据对预设机器学习模型进行训练，生成用户风险分析模型”的详细描述。

如图2所示，在S202中，基于FOCAL LOSS损失函数生成极端梯度提升决策树模型。

在一个实施例中，可例如在平衡交叉熵损失函数上设置抑制参数生成所述FOCALLOSS损失函数。

所述FOCAL LOSS损失函数，可为如下形式：

FL(pt)＝-αt(1-pt)γlog(pt)

其中，Fl为FOCAL LOSS损失函数；αt为抑制参数；pt为所述样本数据经过机器学习模型中sigmoid激活函数后的输出数据；γ为调节参数，γ∈[0，5]。

其中，在所述样本数据经过机器学习模型中sigmoid激活函数后的输出数据的样本标签为正向标签时，pt为概率p；在所述样本数据经过机器学习模型中sigmoid激活函数后的输出数据的样本标签为负向标签时，pt为概率1-p；其中，p∈(1，0)。

其中权超参数αt主要解决好坏样本不均衡的问题，即当好样本越多时，给它的权重越小，这样就可以降低好样本的影响。超参数γ主要解决难易样本不平衡问题，易分样本的p_t往往接近1，那么(1-p_t)^γ值会比较小，因此样本的损失会得到抑制，相反难分样本的损失会得到放大，从而使难分样本更容易学习。

值得一提的是，在本公开的实施例中，可将p设置为0.1，γ设置为2，αt设置为0.1，以取得用户风险模型的最佳计算效果。

在S204中，将所述样本数据输入所述极端梯度提升决策树模型。

在S206中，所述极端梯度提升决策树模型中的改进函数为带有正向标签的样本数分配第一权重。第一权重可例如为概率p。

在S208中，所述极端梯度提升决策树模型中的改进函数为带有负向标签的样本数分配第二权重。其中，所述第二权重大于所述第一权重。第二权重可例如为概率1-p

在S210中，所述极端梯度提升决策树模型基于所述权重进行训练以生成所述用户风险分析模型。

如上文所述，在金融的风控领域中，常常面临好坏样本不均衡问题，在坏样本较少的情况下，这个问题尤为突出。本公开主要说明了一下几种方法以期解决此问题：

常用SMOTE算法关注的是所有的少数类样本，这就可能会导致产生次优的决策函数从而造成过拟合和高方差。如果先对原始样本进行筛选再采样，在某种程度上可以减轻过拟合现象，从而使模型更加稳定。

本公开使用LPA这种基于图的半监督算法，对拒绝样本进行拒绝推断，进一步扩增坏样本数来进行建模

本公开使用GAN算法，通过GAN来生成坏样本从而达到数据扩增的目的。

在进行二分类时，xgboost常用的目标函数为”binary：logistic”，本质是对数损失函数；本公开使用机器学习中目标检测任务中常用的focal loss作为xgboost的损失函数，从而在一定程度上减轻样本不均衡对模型的影响。

下面借助于具体的实施例进行详细描述。

图3是根据另一示例性实施例示出的一种用户风险分析模型训练方法的流程图。图3所示的流程是对图2所示的流程中S106“基于所述标签对所述用户数据进行样本扩容处理，生成样本数据”的详细描述。

如图3所示，在S302中，通过近邻算法为带有负向标签的用户数据生成采样数据。可包括：将用户数据输入SMOTE采样模型中；确定带有负向标签的用户数据；以及通过近邻算法基于带有负向标签的用户数据生成采样样本以生成所述采样数据集合。

更进一步的，通过近邻算法基于带有负向标签的用户数据生成采样样本以生成所述采样数据集合，包括：确定带有负向标签的用户数据的K个近邻样本，K为大于1的整数；从K个近邻样本中随机选取N个近邻样本，N为大于1的整数；对N个近邻样本进行线性差值以生成采样样本。

在s304中，通过所述采样数据和所述用户数据生成所述样本数据。采样数据集合中包含的是对当前少数样本进行采样生成的其他少数样本，将通过采样生成的负样本和当前已有的样本数据集合进行合并，以生成样本数据集合。新生成的目标样本数据集合中包含的负样本数较原有的样本集合中的样本数多。

图4是根据另一示例性实施例示出的一种用户风险分析模型训练方法的流程图。图4所示的流程是对图2所示的流程中S106“基于所述标签对所述用户数据进行样本扩容处理，生成样本数据”的详细描述。

如图4所示，在S402中，通过带有标签的用户数据对生成对抗网络模型进行训练，获取样本生成模型。生成对抗网络(GAN)是一种数据的生成式模型，它主要是通过两个神经网络之间的类似游戏竞争来动态学习生成与来自给定训练数据集的实际数据无法区分的假实例。GAN主要以深度神经网络的形式存在。给定一组训练数据，GAN可以学会估计数据的底层概率分布。然后可以根据学到的概率分布生成原始训练数据集中没有出现过的样本。在本公开中，可利用生成对抗网络的这一特性，生成少数类样本。

在S404中，通过所述样本生成模型生成带有负向标签的虚拟数据。更进一步的，通过归一化处理后的所述第一用户数据对生成对抗网络模型进行训练以获取样本生成模型，包括：通过归一化处理后的所述第一用户数据对生成对抗网络模型中的样本网络进行训练；在训练满足条件时，生成初始样本生成模型；通过所述初始样本生成模型产生初始样本；通过生成对抗网络模型中的判别网络对所述初始样本进行有效性判断；以及当所述初始样本有效时，生成所述样本生成模型。

在S406中，通过所述虚拟数据和所述用户数据生成所述样本数据。可通过所述样本生成模型中的生成样本网络生成虚拟用户数据；通过所述样本生成模型中的判别网络判定所述虚拟用户数据是否为有效数据；通过有效的虚拟用户数据生成所述带有负向标签的第二用户数据。

图5是根据另一示例性实施例示出的一种用户风险分析模型训练方法的流程图。图5所示的流程是对图2所示的流程中S106“基于所述标签对所述用户数据进行样本扩容处理，生成样本数据”的详细描述。

如图5所示，在S502中，通过用户数据之间的相似度建立用户图谱，所述用户图谱中的节点为用户，边为用户之间的相似度关系。相似度可例如为余弦相似性比较，是通过计算两个向量的夹角余弦值来评估他们的相似度。余弦相似度将向量根据坐标值，绘制到多维向量空间中。

还包括：基于所述多个相似度构建相似度矩阵；以及通过所述相似度矩阵生成所述用户图谱。

在S504中，基于标签传播算法为所述用户图谱中部分的用户重新分配正向标签或负向标签。

可由为某金融网站上已注册的用户数据，为了进行更准确的计算，可为在某金融网站上已经注册且进行过借款活动的用户，可依据用户的金融特征或者违约特征为用户分配标签，具体可例如：违约用户和未违约用户和未知用户，可为在网时间1年以上的未违约用户指定正向标签，为所有已经违约的用户指定所述负向标签，其他用户指定未知标签。

通过用户之间的相似度确定用户图谱中边的权重；根据所述权重确定用户图谱中用户之间的传播概率；基于所述传播概率为所述用户图谱中未知标签的用户分配正向标签或负向标签。

在S506中，通过负向标签的用户和所述用户数据生成所述样本数据。带有负向标签的用户可为本公开在背景中所描述的少数用户，通过标签传播算法，相当于是将未知标签的用户也做了预估，提取出潜在的负向标签用户以作为负样本用户进行后续的模型训练。在一个实施例中，潜在的负向标签用户可为潜在的违约用户。

本公开通过稳定性SMOTE采样、LPA拒绝推断采样，GAN生成样本以及改变xgboost目标函数的方法，探索了在建模过程中如何处理样本不均衡的问题。通过实证分析发现，本公开中的方法对于模型的AUC和KS都有一定的提升，其中采样的方式相对于改变损失函数方法对于提升模型更为明显。因此，在后续的建模工作中，针对样本不均衡问题可以根据实际情况因地制宜的采用上述方法，来解决样本不均衡问题，从而开发出满足业务需要的模型和客户风险评分，有效支撑了业务的开展和风险的管理。

值得一提的是，上述方案是解决样本不均衡问题技术方案的一部分，例如鉴于LPA的不稳定、随机性强的特点，可以使用SPLA等改进算法替代，同时对于拒绝推断部分还可以使用其它一些半监督算法如半监督逻辑回归、TSVM等算法进行下探比较结果。而对于GAN来说，它试图在两个相悖的项中寻找平衡，这就导致GAN算法不容易收敛，可以尝试使用EWGAN、WGAN等算法来改进。

本领域技术人员可以理解实现上述实施例的全部或部分步骤被实现为由CPU执行的计算机程序。在该计算机程序被CPU执行时，执行本公开提供的上述方法所限定的上述功能。所述的程序可以存储于一种计算机可读存储介质中，该存储介质可以是只读存储器，磁盘或光盘等。

此外，需要注意的是，上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明，而不是限制目的。易于理解，上述附图所示的处理并不表明或限制这些处理的时间顺序。另外，也易于理解，这些处理可以是例如在多个模块中同步或异步执行的。

下述为本公开装置实施例，可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节，请参照本公开方法实施例。

图6是根据另一示例性实施例示出的一种用户风险分析模型训练装置的框图。如图6所示，用户风险分析模型训练装置60包括：数据模块602，标签模块604，扩容模块606，训练模块608，概率模块610。

数据模块602用于获取用户数据，所述用户数据包括基础数据和行为数据；

标签模块604用于基于所述基础数据和所述行为数据为所述用户数据确定标签，所述标签包括正向标签和负向标签；所述标签模块604包括：判定单元，用于通过所述风险策略集合对所述基础数据和所述行为数据进行判定；为满足风控策略集合的用户数据确定正向标签；为不满足风控策略集合的用户数据确定负向标签。

扩容模块606用于基于所述标签对所述用户数据进行样本扩容处理，生成样本数据；所述扩容模块606包括：第一单元，用于通过近邻算法对带有负向标签的用户数据进行样本扩容处理以生成所述样本数据；和/或第二单元，用于通过生成对抗网络模型对带有负向标签的用户数据进行样本扩容处理以生成所述样本数据；和/或第三单元，用于通过标签传播算法对带有负向标签的用户数据进行样本扩容处理以生成所述样本数据。

训练模块608用于通过所述样本数据对预设机器学习模型进行训练，生成用户风险分析模型，所述预设机器学习模型为带有改进函数的机器学习模型。所述训练模块608包括：函数单元，用于基于FOCAL LOSS损失函数生成极端梯度提升决策树模型；以及训练单元，用于通过所述样本数据对所述极端梯度提升决策树模型进行训练以生成所述用户风险分析模型。所述训练单元，包括：输入子单元，用于将所述样本数据输入所述极端梯度提升决策树模型；权重子单元，用于所述极端梯度提升决策树模型中的改进函数基于样本数据的标签为所述样本数据分配权重；所述权重子单元，还用于所述极端梯度提升决策树模型中的改进函数为带有正向标签的样本数分配第一权重；以及所述极端梯度提升决策树模型中的改进函数为带有负向标签的样本数分配第二权重；其中，所述第二权重大于所述第一权重。训练子单元，用于所述极端梯度提升决策树模型基于所述权重进行训练以生成所述用户风险分析模型。

概率模块610用于将当前用户数据输入所述用户风险分析模型中，生成所述当前用户数据的风险概率。

根据本公开的用户风险分析模型训练装置，获取用户数据，所述用户数据包括基础数据和行为数据；基于所述基础数据和所述行为数据为所述用户数据确定标签，所述标签包括正向标签和负向标签；基于所述标签对所述用户数据进行样本扩容处理，生成样本数据；通过所述样本数据对预设机器学习模型进行训练，生成用户风险分析模型，所述预设机器学习模型为带有改进函数的机器学习模型的方式，能够提高机器学习模型的训练效果，增加机器学习模型计算的准确率，进而生成快速高效的用户风险分析模型。

图7是根据一示例性实施例示出的一种电子设备的框图。

下面参照图7来描述根据本公开的这种实施方式的电子设备700。图7显示的电子设备700仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图7所示，电子设备700以通用计算设备的形式表现。电子设备700的组件可以包括但不限于：至少一个处理单元710、至少一个存储单元720、连接不同系统组件(包括存储单元720和处理单元710)的总线730、显示单元740等。

其中，所述存储单元存储有程序代码，所述程序代码可以被所述处理单元710执行，使得所述处理单元710执行本说明书上述电子处方流转处理方法部分中描述的根据本公开各种示例性实施方式的步骤。例如，所述处理单元710可以执行如图1，图2，图3，图4，图5中所示的步骤。

所述存储单元720可以包括易失性存储单元形式的可读介质，例如随机存取存储单元(RAM)7201和/或高速缓存存储单元7202，还可以进一步包括只读存储单元(ROM)7203。

所述存储单元720还可以包括具有一组(至少一个)程序模块7205的程序/实用工具7204，这样的程序模块7205包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线730可以为表示几类总线结构中的一种或多种，包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备700也可以与一个或多个外部设备700’(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与该电子设备700交互的设备通信，和/或与使得该电子设备700能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口750进行。并且，电子设备700还可以通过网络适配器760与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。网络适配器760可以通过总线730与电子设备700的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备700使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，如图8所示，根据本公开实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本公开实施方式的上述方法。

所述软件产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该设备执行时，使得该计算机可读介质实现如下功能：获取用户数据，所述用户数据包括基础数据和行为数据；基于所述基础数据和所述行为数据为所述用户数据确定标签，所述标签包括正向标签和负向标签；基于所述标签对所述用户数据进行样本扩容处理，生成样本数据；通过所述样本数据对预设机器学习模型进行训练，生成用户风险分析模型，所述预设机器学习模型为带有改进函数的机器学习模型。

本领域技术人员可以理解上述各模块可以按照实施例的描述分布于装置中，也可以进行相应变化唯一不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块，也可以进一步拆分成多个子模块。

以上具体地示出和描述了本公开的示例性实施例。应可理解的是，本公开不限于这里描述的详细结构、设置方式或实现方法；相反，本公开意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效设置。

Claims

1.一种用户风险分析模型训练方法，其特征在于，包括：

获取用户数据，所述用户数据包括基础数据和行为数据；

基于所述基础数据和所述行为数据为所述用户数据确定标签，所述标签包括正向标签和负向标签；

基于所述标签对所述用户数据进行样本扩容处理，生成样本数据；

通过所述样本数据对预设机器学习模型进行训练，生成用户风险分析模型，所述预设机器学习模型为带有改进函数的机器学习模型。

2.如权利要求1所述的方法，其特征在于，还包括：

将当前用户数据输入所述用户风险分析模型中，生成所述当前用户数据的风险概率。

3.如权利要求1-2中任一所述的方法，其特征在于，基于所述基础数据和所述行为数据为所述用户数据确定标签，所述标签包括正向标签和负向标签，包括：

通过所述风险策略集合对所述基础数据和所述行为数据进行判定；

为满足风控策略集合的用户数据确定正向标签；

为不满足风控策略集合的用户数据确定负向标签。

4.如权利要求1-3中任一所述的方法，其特征在于，基于所述标签对所述用户数据进行样本扩容处理，生成样本数据，包括：

通过近邻算法对带有负向标签的用户数据进行样本扩容处理以生成所述样本数据；和/或

通过生成对抗网络模型对带有负向标签的用户数据进行样本扩容处理以生成所述样本数据；和/或

通过标签传播算法对带有负向标签的用户数据进行样本扩容处理以生成所述样本数据。

5.如权利要求1-4中任一所述的方法，其特征在于，通过所述样本数据对预设机器学习模型进行训练，生成用户风险分析模型，包括：

基于FOCAL LOSS损失函数生成极端梯度提升决策树模型；以及

通过所述样本数据对所述极端梯度提升决策树模型进行训练以生成所述用户风险分析模型。

6.如权利要求1-5中任一所述的方法，其特征在于，还包括：

在平衡交叉熵损失函数上设置抑制参数生成所述FOCAL LOSS损失函数。

7.如权利要求1-6中任一所述的方法，其特征在于，所述FOCAL LOSS损失函数，包括：

FL(pt)＝-αt(1-pt)γlog(pt)

8.一种用户风险分析模型训练装置，其特征在于，包括：

数据模块，用于获取用户数据，所述用户数据包括基础数据和行为数据；

标签模块，用于基于所述基础数据和所述行为数据为所述用户数据确定标签，所述标签包括正向标签和负向标签；

扩容模块，用于基于所述标签对所述用户数据进行样本扩容处理，生成样本数据；

训练模块，用于通过所述样本数据对预设机器学习模型进行训练，生成用户风险分析模型，所述预设机器学习模型为带有改进函数的机器学习模型。

9.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。

10.一种计算机可读介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。