CN111310931A

CN111310931A - 参数生成方法、装置、计算机设备及存储介质

Info

Publication number: CN111310931A
Application number: CN202010080724.7A
Authority: CN
Inventors: 李京昊; 陈鹏程; 陈金辉; 朱晨; 杨情; 刘扬; 庞云蔚; 陈立新
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2020-02-05
Filing date: 2020-02-05
Publication date: 2020-06-19

Abstract

本申请是关于一种参数生成方法、装置、设备及存储介质，涉及机器学习技术领域。该方法包括：获取预测用户的用户特征；将预测用户的用户特征输入评价参数预测模型，获得评价参数预测模型输出的评价参数预测结果；评价参数预测模型是通过对N个基模型依次进行训练得到的，且N个基模型中的第i个基模型是通过样本用户的用户特征、样本用户在连续i个周期内的行为数据对应的评价标签、以及基模型中的前i‑1个基模型训练获得的；根据评价参数预测结果生成预测用户的评价参数。本申请实施例提供的模型能够更好的适应业务环境随着时间的变化，从而能够提高评价参数预测的准确性。

Description

参数生成方法、装置、计算机设备及存储介质

技术领域

本申请涉及机器学习技术领域，特别涉及一种参数生成方法、装置、计算机设备及存储介质。

背景技术

在网络应用技术中，常使用特定的评价参数预测模型来对网络中的用户进行建模及评估。

在相关技术中，在评价参数预测模型过程中，需要定义样本的表现期。比如设定表现期为N个周期，这代表需要观察用户N个周期内行为数据，若用户发生指定行为，比如严重逾期，则为黑样本，否则为白样本。通过用户N个周期的行为数据对应的评价标签，以及用户的特征信息训练机器学习模型，用于后续构建评价参数预测模型。

上述建模方案建立的评价参数预测模型无法利用仅有1至N个表现期的样本，这样构建的模型很可能无法适应快速发展的业务环境，存在严重的滞后问题，导致评价参数预测模型预测出的评价参数的准确性不高。

发明内容

本申请实施例提供了一种参数生成方法、装置、计算机设备及存储介质，可以提高通过模型预测出的用户的评价参数的准确性，该技术方案如下：

一方面，提供了一种参数生成方法，所述方法包括：

获取预测用户的用户特征；所述用户特征包括属性字段、位置字段以及账号字段中的至少一种；

将所述预测用户的用户特征输入评价参数预测模型，获得所述评价参数预测模型输出的评价参数预测结果；所述评价参数预测模型是通过对N个基模型依次进行训练得到的，且所述N个基模型中的第i个基模型是通过样本用户的用户特征、所述样本用户在连续i个周期内的行为数据对应的评价标签、以及所述基模型中的前i-1个基模型训练获得的；N和i为整数，N≥2，N≥i≥2；

根据所述评价参数预测结果生成所述预测用户的评价参数。

可选的，所述基模型是基于树的机器学习模型；所述评价参数预测模型包括所述N个基模型；

所述将所述用户特征输入评价参数预测模型，获得所述评价参数预测模型输出的评价参数预测结果，包括：

将所述预测用户的用户特征分别输入所述N个基模型，获得所述N个基模型分别对所述预测用户的用户特征的输出结果；所述N个基模型分别对所述预测用户的用户特征的输出结果是所述N个基模型分别输出的概率值，所述概率值用于表示所述预测用户存在信用风险的概率；

将所述N个基模型分别输出的概率值的和获取为所述评价参数预测结果。

可选的，所述获取预测用户的用户特征之前，还包括：

在对所述第i个基模型进行训练时，获取已经训练完成的所述前i-1个基模型分别对所述样本用户的用户特征进行处理输出的第一概率值；

获取所述样本用户在所述连续i个周期中的行为数据对应的，所述样本用户在所述连续i个周期中存在指定行为的第二概率值；

将所述第一概率值减去所述第二概率值得到所述样本用户在连续i个周期内的评价参数标注结果；

根据所述样本用户的用户特征，以及所述样本用户在连续i个周期内的评价参数标注结果训练所述第i个基模型。

可选的，所述基模型是逻辑回归模型；所述第i个基模型中包含i个模型参数，且所述i个模型参数中的前i-1个模型参数是所述第i-1个基模型中的模型参数；所述评价参数预测模型包括所述N个基模型中的最后一个基模型；

将所述预测用户的用户特征输入所述N个基模型中的最后一个基模型，获得所述最后一个基模型对所述预测用户的用户特征的输出结果；

根据所述最后一个基模型对所述预测用户的用户特征的输出结果，获得所述评价参数预测结果。

可选的，所述根据所述最后一个基模型对所述预测用户的用户特征的输出结果，获得所述评价参数预测结果，包括：

将所述最后一个基模型对所述预测用户的用户特征的输出结果中的对数几率，获取为所述评价参数预测结果。

可选的，所述获取预测用户的用户特征之前，还包括：

在对所述第i个基模型进行训练时，获取已经训练完成的所述第i-1个基模型中的模型参数；

将所述第i-1个基模型中的模型参数作为所述第i个基模型中的前i-1个模型参数，根据所述样本用户的用户特征，以及所述样本用户在所述连续i个周期内的行为数据对应的评价标签对所述第i个基模型进行训练，以优化所述第i个基模型中的第i个模型参数。

可选的，所述评价参数是信用风险参数，所述评价标签为信用标签。

可选的，所述预测用户的信用风险参数，是所述预测用户的N周期信用评分A卡的分值。

一方面，提供了一种参数生成装置，该装置包括：

用户特征获取模块，用于获取预测用户的用户特征；所述用户特征包括属性字段、位置字段以及账号字段中的至少一种；

输入模块，用于将所述预测用户的用户特征输入评价参数预测模型，获得所述评价参数预测模型输出的评价参数预测结果；所述评价参数预测模型是通过对N个基模型依次进行训练得到的，且所述N个基模型中的第i个基模型是通过样本用户的用户特征、所述样本用户在连续i个周期内的行为数据对应的评价标签、以及所述基模型中的前i-1个基模型训练获得的；N和i为整数，N≥2，N≥i≥2；

参数生成模块，用于根据所述评价参数预测结果生成所述预测用户的评价参数。

所述输入模块，包括：

第一输入单元，用于将所述预测用户的用户特征分别输入所述N个基模型，获得所述N个基模型分别对所述预测用户的用户特征的输出结果；所述N个基模型分别对所述预测用户的用户特征的输出结果是所述N个基模型分别输出的概率值，所述概率值用于表示所述预测用户存在信用风险的概率；

第一结果获得单元，用于将所述N个基模型分别输出的概率值的和获取为所述评价参数预测结果。

可选的，所述装置还包括：

第一概率值获取模块，用于在所述用户特征获取模块获取预测用户的用户特征之前，在对所述第i个基模型进行训练时，获取已经训练完成的所述前i-1个基模型分别对所述样本用户的用户特征进行处理输出的第一概率值；

第二概率值获取模块，用于获取所述样本用户在所述连续i个周期中的行为数据对应的，所述样本用户在所述连续i个周期中存在指定行为的第二概率值；

标注结果获取模块，用于将所述第一概率值减去所述第二概率值得到所述样本用户在连续i个周期内的评价参数标注结果；

第一训练模块，用于根据所述样本用户的用户特征，以及所述样本用户在连续i个周期内的评价参数标注结果训练所述第i个基模型。

所述输入模块，包括：

第二输入单元，用于将所述预测用户的用户特征输入所述N个基模型中的最后一个基模型，获得所述最后一个基模型对所述预测用户的用户特征的输出结果；

第二结果获得单元，用于根据所述最后一个基模型对所述预测用户的用户特征的输出结果，获得所述评价参数预测结果。

可选的，所述第二结果获得单元，用于将所述最后一个基模型对所述预测用户的用户特征的输出结果中的对数几率，获取为所述评价参数预测结果。

可选的，所述装置还包括：

模型参数获取模块，用于在所述用户特征获取模块获取预测用户的用户特征之前，在对所述第i个基模型进行训练时，获取已经训练完成的所述第i-1个基模型中的模型参数；

第二训练模块，用于将所述第i-1个基模型中的模型参数作为所述第i个基模型中的前i-1个模型参数，根据所述样本用户的用户特征，以及所述样本用户在所述连续i个周期内的行为数据对应的评价标签对所述第i个基模型进行训练，以优化所述第i个基模型中的第i个模型参数。

一方面，提供了一种计算机设备，该计算机设备包含处理器和存储器，存储器中存储由至少一条指令、至少一段程序、代码集或指令集，至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述参数生成方法。

一方面，提供了一种计算机可读存储介质，该存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述参数生成方法。

本申请提供的技术方案可以包括以下有益效果：

通过从第1个基模型开始依次训练N个基模型，并基于该N个基模型得到评价参数预测模型，其中，在训练第i个基模型时，通过样本用户在连续i个周期内的行为数据对应的评价标签、以及所述基模型中的前i-1个基模型训练得到该第i个基模型，由于各个基模型对应的样本的周期数不同，因此，最终得到的评价参数预测模型是一个融合了各种不同周期数的样本的模型，相对于只根据N个周期数样本训练得到的模型来说，本申请实施例提供的模型能够更好的适应业务环境随着时间的变化，从而能够提高评价参数预测的准确性。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本申请。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。

图1是根据一示例性实施例示出的一种模型训练及参数生成框架图；

图2是根据一示例性实施例实施例示出的一种参数生成设备的软件架构图；

图3是本申请一个示例性的实施例提供的模型训练及参数生成方法的流程示意图；

图4是本申请一个示例性的实施例提供的模型训练及参数生成方法的流程示意图；

图5是根据一示例性实施例示出的一种参数生成装置的结构方框图；

图6是根据一示例性实施例示出的计算机设备的结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

应当理解的是，在本文中提及的“若干个”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

本申请提供一种用户的评价参数的生成方法，可以通过机器学习的方法准确预测用户的评价参数。为了便于理解，下面对本申请涉及的几个名词进行解释。

1)评价参数

在本申请各个实施例中，评价参数可以是指服务商对用户进行评价，以实现用户筛选或者分级的参数。可选的，上述评价参数可以包括且不限于信用风险、匹配度等等。

2)信用风险

信用风险又称违约风险，是指借款人、证券发行人或交易对方因种种原因，不愿或无力履行合同条件而构成违约，致使银行、投资者或交易对方遭受损失的可能性。即受信人不能履行还本付息的责任而使授信人的预期收益与实际收益发生偏离的可能性，其是金融风险的主要类型。

3)信用评分卡

信用对于人们来说是一个比较抽象的概念，因此业内通常使用量化的方式来更直观的表现信用，而分数是一种有效的量化方式，通过分数的高低可以来衡量风险概率，分数越高代表信用越好。而信用评分卡就是通过大数据的统计分析，根据用户的各种资料信息，对用户信用进行评估(打分)。根据信用评级的不同，可以分为四种评分卡：

a)申请评分卡(A卡)

b)行为评分卡(B卡)

c)催收评分卡(C卡)

d)欺诈评分卡(F卡)

上述信用评分卡是一种以分数的形式来衡量风险几率的手段，也是对未来一段时间内违约、逾期、失联概率的预测，一般来说，一个用户的信用评分卡的分值越高，代表其风险越低。

通常来说，A卡一般可做贷款0-1年的信用分析，B卡则是在申请人有了一定行为后，有了较大数据进行的分析，一般为3-5年，C卡则对数据要求更大，需加入催收后客户反应等属性数据，其中每种评分卡的模型都可能会不一样。在A卡中常用的有逻辑回归模型，层次分析法(Analytic Hierarchy Process，AHP)等，而在后面两种信用评分卡中，常使用多因素逻辑回归模型。

4)违约

在个人借贷的场景下，根据新的巴塞尔二资本协议对“违约”的定义，一般受信人逾期90天未履行还款责任，则可以算作违约。

本申请实施例的方案包括模型训练阶段和参数生成阶段。图1是根据一示例性实施例示出的一种模型训练及参数生成框架图。如图1所示，在模型训练阶段，模型训练设备110通过不同周期数的样本用户的行为数据，以及样本用户的用户特征，训练得到机器学习模型，在参数生成阶段，参数生成设备120根据训练好的机器学习模型以及输入的预测用户的用户特征得到评价参数预测结果，并进一步得到预测用户的评价参数。

其中，上述模型训练设备110和参数生成设备120可以是具有机器学习能力的计算机设备，比如，该计算机设备可以是个人电脑、服务器以及移动工作站等。

可选的，上述模型训练设备110和参数生成设备120可以是同一个设备，或者，模型训练设备110和参数生成设备120也可以是不同的设备。并且，当模型训练设备110和参数生成设备120是不同的设备时，模型训练设备110和参数生成设备120可以是同一类型的设备，比如模型训练设备110和参数生成设备120可以都是个人电脑；或者，模型训练设备110和参数生成设备120也可以是不同类型的设备，比如模型训练设备110可以是服务器，而参数生成设备120可以是提供参数生成服务的服务器等。本申请实施例对于模型训练设备110和参数生成设备120的具体类型不做限定。

图2是根据一示例性实施例实施例示出的一种参数生成设备的软件架构图。如图2所示，参数生成设备可以是上述图1中的参数生成设备120，该参数生成设备中包含机器学习模型20(即评价参数预测模型)，参数生成设备120首先获取预测用户的用户特征，然后将该预测用户的用户特征输入评价参数预测模型，获得评价参数预测模型输出的参数生成预测结果，再根据参数生成预测结果生成所述预测用户的参数生成。

其中，上述评价参数预测模型由模型训练设备(比如图1中的模型训练设备110)训练的得到。在本申请实施例中，模型训练设备可以通过对N个基模型依次进行训练，以得到上述评价参数预测模型，并且，上述N个基模型的中的第i个基模型是通过样本用户的用户特征、以及该样本用户在连续i个周期内的行为数据对应的评价标签，以及该基模型中的前i-1个基模型训练得到的。其中，N和i为整数，N≥2，N≥i≥2。

也就是说，在模型训练过程中，开始时使用1个表现期的样本开始建模，构建第一个基模型，之后不断增加表现期，结合新的表现期下的标签y(即评价标签)和前面已经构建好的基模型的预测结果，作为新的y构建新的基模型，直到最长表现期的基模型构建完毕(即直到构建N个基模型)，通过上述模型最终得到的预测结果是基于所有基模型的联合预测值。

可选的，该评价参数是信用风险参数，该评价标签为信用标签。

综上所述，本申请所示的方案，通过模型训练设备从第1个基模型开始依次训练N个基模型，并基于该N个基模型得到评价参数预测模型，其中，在训练第i个基模型时，通过样本用户在连续i个周期内的行为数据对应的评价标签、以及该基模型中的前i-1个基模型训练得到该第i个基模型，由于各个基模型对应的样本的周期数不同，因此，最终得到的评价参数预测模型是一个融合了各种不同周期数的样本的模型，相对于只根据N个周期数样本训练得到的模型来说，本申请实施例提供的模型能够更好的适应业务环境随着时间的变化，从而能够提高评价参数预测的准确性。

在一种可能的实现方式中，上述模型训练过程中的训练集组织与训练的基本框架流程可以如下：

步骤1，输入训练集D，假设需要训练N个基模型，则训练集D中各个样本用户能够观察到的最长表现期为N，最短表现期为1，设总共有M个样本。

步骤2，将训练集根据不同表现期划分为N个子训练集。N个训练子集的说明如下：

D¹：由所有满足1个表现期的样本组成，样本数量为M¹，M¹＝M。也就说，每个样本用户的第一个表现期可以构成一个样本。

在D¹中，每个样本用户的标签

代表第i个样本用户的第1个表现期，

代表黑样本(比如，在金融风控领域可以代表存在严重逾期)、

代表白样本(在金融风控领域可以代表不存在严重逾期)。

D²：由所有满足2个表现期的样本组成，样本数量为M²，M²<M¹。每个用户的标签

代表第i个用户2个表现期。

其中，在D¹中，每个样本用户的标签

代表第i个样本用户的前2个表现期。类似的，

代表黑样本、

代表白样本。

其中，D¹和D²会有重叠的样本用户，重叠的样本用户的标签可能是

也可能是

这是由于样本用户在1个表现期时为白样本，但是在2个表现期时可能转变为黑样本(比如，在金融风控领域表示该用户第一个账单正常还款，但是第二个账单发生了严重逾期)导致的。

按照上述逻辑构建D³至D^N。

步骤3，使用D¹训练子集构建第一个基模型，预测结果为

其中

代表第i个用户在第一个基模型中的预测结果。

步骤4，使用D²训练子集，并基于第一个基模型和当前训练子集的标签，共同构建第二个基模型。

重复进行步骤4，每次都使用前一个基模型和当前样本集的标签共同构建新的基模型。

步骤5，结合所有训练好的N个基模型，得到最终的提升模型，即上述评价参数测模型。

在本申请实施例中，对应不同的评价需求的场景，上述基模型的类型以及根据基模型得到的评价参数预测模型也可以不同。

比如，在可解释性要求不高的场景下，上述基模型可以使用基于树的机器学习模型，比如XGBoost模型或者其它树模型。而在对于可解释性要求较高的场景，比如金融信用风险评估场景中，上述基模型可以使用逻辑回归(LogisticRegression，LR)模型等。本申请后续实施例将分别对这两种情况下的模型训练及评价参数生成过程进行介绍。

请参考图3，其示出了本申请一个示例性的实施例提供的模型训练及参数生成方法的流程示意图。该方法可以用于计算机设备，比如上述图1所示的模型训练设备110以及参数生成设备120中。以上述基模型是基于树的机器学习模型为例，如图3所示，该模型训练方法可以包括以下步骤：

步骤301，模型训练设备获取N个训练子集，该N个训练子集中的第i个训练子集中包含样本用户的用户特征，以及样本用户在连续i个周期内的行为数据所对应的评价标签。

其中，上述行为数据的数据类型可以是开发人员预先设置的，能够表示用户的评价高低(比如信用高低)的数据，比如，以上述数据是可以表示用户的信用的数据为例，上述行为数据可以包括用户的贷款以及还款数据，例如贷款金额、还款金额、贷款时间、还款时间等等。

可选的，该用户特征包括属性字段、位置字段以及账号字段中的至少一种，比如，用户特征中的属性字段可以包括用户的年龄、性别、职业、兴趣爱好等，位置字段可以包括地区等，账号字段可以包括用户的社交账号等。

模型训练设备获取上述N个训练子集的过程，可以参考上述训练子集D¹至D^N的过程，此处不再赘述。

在获得N个训练子集之后，模型训练设备即可以通过该N个训练子集依次训练N个基于树的基模型。

在本申请实施例中，上述基于树的基模型对输入的用户特征的输出结果可以是一个概率值，该概率值用于表示对应的用户存在指定行为的概率，比如，该该概率值可以表示对应的用户存在信用风险的概率。

步骤302，模型训练设备根据N个训练子集中的第1个训练子集训练第1个基于树的基模型。

以上述第一个训练子集为上述训练子集D¹为例，在本申请实施例中，假设上述基模型是XGBoost模型，模型训练设备可以使用训练子集D¹中的样本用户的用户特征作为输入，以样本用户在1个表现期内的行为数据的评价标签(，比如信用标签，对应上述

)作为目标，训练第1个XGBoost基模型。

步骤303，模型训练设备在对第i个基模型进行训练时，获取已经训练完成的前i-1个基模型分别对样本用户的用户特征进行处理输出的第一概率值。

在本申请实施例中，对于训练子集Dⁱ中的某一个样本用户，假设为样本用户1，模型训练设备可以获取该样本用户1的用户特征，然后将样本用户1的用户特征分别输入到前i-1个基模型中(由于本申请中N个基模型是依次训练的，因此，在训练第i个基模型时，前i-1个基模型已经训练完成)，获得该前i-1个基模型对该样本用户1的分别预测出的第一概率值，即前i-1个基模型分别输出的，该样本用户1存在指定行为，比如存在信用风险的概率值。

其中，上述第一概率值中可以包含前i-1个基模型分别输出的概率值，或者，也可以说该第一概率值是上述前i-1个基模型分别输出的概率值之和。可选的，该第一概率值越大，表示存在指定行为的概率越高，例如，表示用户存在信用风险的可能性越高。

步骤304，模型训练设备获取样本用户在连续i个周期中的行为数据对应的，该样本用户在连续i个周期中存在指定行为的第二概率值。

其中，这里的第二概率值，可以是上述训练子集Dⁱ中的样本用户1在连续i个表现期内的行为数据的评价标签。

步骤305，模型训练设备将第一概率值减去第二概率值得到样本用户在连续i个周期内的评价标签。

在本申请实施例中，模型训练设备可以使用样本用户1在i个表现期内的评价标签，减去前i-1个模型各自的预测结果，得到本次训练所使用的标签。

步骤306，模型训练设备根据所样本用户的用户特征，以及样本用户在连续i个周期内的评价标签训练第i个基模型。

以基模型是XGBoost模型，行为数据是用户账单为例，在上述步骤中，模型训练设备首先以1个账单的标签为y，构建第一个XGBoost基模型，预测值为pre1。

然后以2个账单的标签减去pre1得到的残差为y，构建第二个XGBoost基模型，预测值为pre2。

然后再以3个账单的标签减去pre1再减去pre2得到的残差为y，构建第三个XGBoost基模型，预测值为pre3。

以此类推，直到构建完第N个XGBoost基模型为止。

步骤307，在训练完成第N个基模型之后，模型训练设备构建包含上述N个基模型的评价参数预测模型。

在本申请实施例中，模型训练设备在训练完成第N个基模型之后，即可以构建一个评价参数预测模型，该评价参数预测模型可以由上述N个基模型并联获得。之后，模型训练设备可以将该评价参数预测模型提供给参数生成设备。

步骤308，参数生成设备获取预测用户的用户特征。

其中，以参数生成设备是对外提供信用分析服务的服务器为例，信用系统获取到预测用户的用户特征后，可以将预测用户的用户特征通过参数生成设备对外提供的接口发送给参数生成设备，相应的，参数生成设备通过该接口接收该预测用户的用户特征。

步骤309，参数生成设备将预测用户的用户特征输入评价参数预测模型，获得评价参数预测模型输出的评价参数预测结果。

在本申请实施例中，参数生成设备可以将预测用户的用户特征分别输入上述N个基模型，获得上述N个基模型分别对预测用户的用户特征的输出结果；然后再根据该N个基模型分别对预测用户的用户特征的输出结果获得上述评价参数预测结果。

其中，参数生成设备可以将上述N个基模型分别输出的概率值的和获取为上述评价参数预测结果。

比如，参数生成设备将预测用户的用户特征输入评价参数预测模型后，该预测用户的用户特征可以分别被输入到上述N个基模型中，由N个基模型分别输出一个输出结果，即N个基模型分别预测得到的，该预测用户存在指定行为，比如存在信用风险的概率，然后，参数生成设备将上述N个基模型分别输出的概率之和(即pre1+pre2+…+preN)作为最终的评价参数预测结果。

步骤310，参数生成设备根据评价参数预测结果生成预测用户的评价参数。

在本申请实施例中，参数生成设备可以直接将上述N个基模型分别输出的概率之和，作为预测用户的评价参数。

或者，参数生成设备也可以将上述N个基模型分别输出的概率之和，转化为对应的预测用户的评价参数。

或者，参数生成设备也可以通过上述N个基模型分别输出的概率之和，结合其它信息综合得到上述预测用户的评价参数。

可选的，本申请实施例中预测用户的评价参数，可以是该预测用户的长周期(比如N周期)信用评分A卡的分值。

综上所述，本申请所示的方案，通过模型训练设备从第1个基模型开始依次训练N个基于树的基模型，并基于该N个基模型得到评价参数预测模型，其中，在训练第i个基模型时，通过样本用户在连续i个周期内的行为数据对应的评价标签、以及该基模型中的前i-1个基模型分别对样本用户的用户特征的输出结果，训练得到该第i个基模型，由于各个基模型对应的样本的周期数不同，因此，最终得到的评价参数预测模型是一个融合了各种不同周期数的样本的模型，相对于只根据N个周期数样本训练得到的模型来说，本申请实施例提供的模型能够更好的适应业务环境随着时间的变化，从而能够提高评价参数预测的准确性。

请参考图4，其示出了本申请一个示例性的实施例提供的模型训练及参数生成方法的流程示意图。该方法可以用于计算机设备，比如上述图1所示的模型训练设备110以及参数生成设备120中。以上述基模型是LR模型为例，如图4所示，该方法可以包括以下步骤：

步骤401，模型训练设备获取N个训练子集，该N个训练子集中的第i个训练子集中包含样本用户的用户特征，以及样本用户在连续i个周期内的行为数据所对应的评价标签。

该步骤可以参考上述图1所示实施例中的步骤301下的描述，此处不再赘述。

在获得N个训练子集之后，模型训练设备即可以通过该N个训练子集依次训练N个LR基模型。

在本申请实施例中，上述LR基模型对输入的用户特征的输出结果可以是一个求对数几率的归一化值的结果，该对数几率用于表示对应的用户存在指定行为，比如存在信用风险的概率。

步骤402，模型训练设备根据N个训练子集中的第1个训练子集训练第1个LR基模型。

以上述第一个训练子集为上述训练子集D¹为例，在本申请实施例中，模型训练设备可以使用训练子集D¹中的样本用户的用户特征作为输入，以样本用户在1个表现期内的行为数据的评价标签(对应上述

)作为目标，训练第1个LR模型中的模型参数。

比如，第1个LR模型的模型公式如下述公式所示：

其中，x为输入数据，即上述用户特征，w₁是第1个基模型中的模型参数。

在训练第1个基模型的过程中，以样本用户的用户特征为输入，以样本用户在1个表现期内的评价标签为y，训练上述模型中的w₁，使得输入样本用户的用户特征后，模型输出结果逼近该样本用户在1个表现期内的评价标签。

步骤403，模型训练设备在对第i个基模型进行训练时，获取已经训练完成的第i-1个基模型中的模型参数。

在本申请实施例中，第i个基模型中包含i个模型参数，且该i个模型参数中的前i-1个模型参数是第i-1个基模型中的模型参数。

比如，第i个LR模型的模型公式如下述公式所示：

其中，w₁至w_i-1是第i-1个LR模型中的模型参数，相比于第i-1个LR模型，该第i个LR模型中增加一个模型参数w_i。在训练过程中，模型训练设备在构建第i个LR模型时，可以直接获取第i-1个基模型中的模型参数，作为第i个基模型中的w₁至w_i-1。

步骤404，模型训练设备将第i-1个基模型中的模型参数作为第i个基模型中的前i-1个模型参数，根据样本用户的用户特征，以及样本用户在连续i个周期内的行为数据对应的评价标签对第i个基模型进行训练，以优化第i个基模型中的第i个模型参数。

其中，在本申请实施例中，模型训练设备对第i个基模型进行训练的过程中，可以保持w₁至w_i-1不变，以样本用户的用户特征为输入，以样本用户在i个表现期内的评价标签为y，训练上述模型中的w_i，使得输入样本用户的用户特征后，模型输出结果逼近该样本用户在i个表现期内的评价标签。

以行为数据是用户账单为例，在上述步骤中，模型训练设备首先以1个账单的标签为y，构建第一个LR基模型，预测值为：

然后模型训练设备以2个账单的标签为y，构建第二个LR基模型，预测值为：

这相当于在优化第二个LR模型时，w₁*x+w₂*x是对数几率，在这里实现加法提升，其中，w₂是该轮学习中需要更新的参数。

以此类推，直到构建完第N个LR基模型，预测结果为：

步骤405，在训练完成第N个基模型之后，模型训练设备构建包含上述第N个基模型的评价参数预测模型。

在本申请实施例中，模型训练设备在训练完成第N个基模型之后，即可以构建一个评价参数预测模型，该评价参数预测模型可以包含上述N个基模型中的最后一个基模型。

步骤406，参数生成设备获取预测用户的用户特征。

其中，该步骤可以参考上述图3所示实施例中的步骤307下的描述，此处不再赘述。

步骤407，参数生成设备将预测用户的用户特征输入评价参数预测模型，获得评价参数预测模型输出的评价参数预测结果。

在本申请实施例中，参数生成设备可以将预测用户的用户特征输入上述N个基模型中的最后一个基模型，获得该最后一个基模型对预测用户的用户特征的输出结果；根据最后一个基模型对预测用户的用户特征的输出结果，获得该评价参数预测结果。

可选的，参数生成设备可以将上述最后一个基模型对预测用户的用户特征的输出结果中的对数几率，获取为上述评价参数预测结果。

比如，参数生成设备将预测用户的用户特征输入评价参数预测模型后，该预测用户的用户特征可以被输入到上述N个基模型中的最后一个基模型中，由该最后一个基模型输出一个输出结果，即上述第N个基模型的预测结果公式所示的输出结果，并将其中的对数几率(即w₁*x+w₂*x+…+w_N*x)获取为最终的评价参数预测结果。

步骤408，参数生成设备根据评价参数预测结果生成预测用户的评价参数。

在本申请实施例中，信用分析设备可以直接将上述第N个基模型输出的对数几率，作为预测用户的评价参数。

或者，信用分析设备也可以将上述第N个基模型分别输出的对数几率，转化为对应的预测用户的评价参数。

或者，信用分析设备也可以通过上述第N个基模型分别输出的对数几率，结合其它信息综合得到上述预测用户的评价参数。

综上所述，本申请所示的方案，通过模型训练设备从第1个基模型开始依次训练N个LR基模型，并基于该N个基模型得到评价参数预测模型，其中，在训练第i个基模型时，通过样本用户在连续i个周期内的行为数据对应的评价标签、以及第i-1个基模型中的i-1个模型参数，训练得到该第i个基模型中的第i个模型参数，由于各个基模型对应的样本的周期数不同，因此，最终得到的评价参数预测模型是一个融合了各种不同周期数的样本的模型，相对于只根据N个周期数样本训练得到的模型来说，本申请实施例提供的模型能够更好的适应业务环境随着时间的变化，从而能够提高评价参数预测的准确性。

本申请上述实施例所示的方案，可以以用于在样本的表现存在时序动态变化情况的建模场景下，利用提升算法的思想解决样本不新鲜的问题，大大减弱模型的滞后性。并且能够学习到用户标签的时序动态变化的规律，从而得到更加更加稳定、更加符合当前业务环境的模型。上述方案具有以下有点：

1、能够解决时序动态化标签场景下样本过度滞后的问题。

2、能够学习到用户标签的时序动态变化的规律。

3、具有很好的可扩展性，基模型可以根据应用场景和具体需求选择逻辑回归模型、树模型等各类模型。

图5是根据一示例性实施例示出的一种参数生成装置的结构方框图。该参数生成装置可以通过硬件或者软硬结合的方式实现为计算机设备的全部或者部分，以执行图3或图4所示实施例中的全部或者部分步骤。该参数生成装置可以包括：

用户特征获取模块501，用于获取预测用户的用户特征；所述用户特征包括属性字段、位置字段以及账号字段中的至少一种；

输入模块502，用于将所述预测用户的用户特征输入评价参数预测模型，获得所述评价参数预测模型输出的评价参数预测结果；所述评价参数预测模型是通过对N个基模型依次进行训练得到的，且所述N个基模型中的第i个基模型是通过样本用户的用户特征、所述样本用户在连续i个周期内的行为数据对应的评价标签、以及所述基模型中的前i-1个基模型训练获得的；N和i为整数，N≥2，N≥i≥2；

参数生成模块503，用于根据所述评价参数预测结果生成所述预测用户的评价参数。

所述输入模块502，包括：

可选的，所述装置还包括：

所述输入模块502，包括：

可选的，所述装置还包括：

综上所述，本申请所示的方案，通过模型训练设备从第1个基模型开始依次训练N个基模型，并基于该N个基模型得到评价参数预测模型，其中，在训练第i个基模型时，通过样本用户在连续i个周期内的行为数据对应的评价标签、以及所述基模型中的前i-1个基模型训练得到该第i个基模型，由于各个基模型对应的样本的周期数不同，因此，最终得到的评价参数预测模型是一个融合了各种不同周期数的样本的模型，相对于只根据N个周期数样本训练得到的模型来说，本申请实施例提供的模型能够更好的适应业务环境随着时间的变化，从而能够提高评价参数预测的准确性。

图6是根据一示例性实施例示出的一种计算机设备的结构示意图。该计算机设备可以实现为上述图1所示实施例中的模型训练设备110或者信用评分设备120；或者，也可以实现为上述模型训练设备110或者信用评分设备120的结合。

所述计算机设备600包括中央处理单元(Central Processing Unit，CPU)601、包括随机存取存储器(Random Access Memory，RAM)602和只读存储器(Read-Only Memory，ROM)603的系统存储器604，以及连接系统存储器604和中央处理单元601的系统总线605。所述计算机设备600还包括帮助计算机内的各个器件之间传输信息的基本输入/输出(Input/Output，I/O)系统606，和用于存储操作系统613、应用程序614和其他程序模块615的大容量存储设备607。

所述基本输入/输出系统606包括有用于显示信息的显示器608和用于用户输入信息的诸如鼠标、键盘之类的输入设备609。其中所述显示器608和输入设备609都通过连接到系统总线605的输入输出控制器610连接到中央处理单元601。所述基本输入/输出系统606还可以包括输入输出控制器610以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地，输入输出控制器610还提供输出到显示屏、打印机或其他类型的输出设备。

所述大容量存储设备607通过连接到系统总线605的大容量存储控制器(未示出)连接到中央处理单元601。所述大容量存储设备607及其相关联的计算机可读介质为计算机设备600提供非易失性存储。也就是说，所述大容量存储设备607可以包括诸如硬盘或者紧凑型光盘只读储存器(Compact Disc Read-Only Memory，CD-ROM)驱动器之类的计算机可读介质(未示出)。

不失一般性，所述计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、可擦除可编程只读存储器(Erasable Programmable Read Only Memory，EPROM)、带电可擦可编程只读存储器(Electrically Erasable Programmable read only memory，EEPROM)、闪存或其他固态存储其技术、CD-ROM、数字通用光盘(Digital Versatile Disc，DVD)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然，本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的系统存储器604和大容量存储设备607可以统称为存储器。

计算机设备600可以通过连接在所述系统总线605上的网络接口单元611连接到互联网或者其它网络设备。

所述存储器还包括一个或者一个以上的程序，所述一个或者一个以上程序存储于存储器中，中央处理器601通过执行该一个或一个以上程序来实现图3或图4所示的方法中的全部或者部分步骤。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括计算机程序(指令)的存储器，上述程序(指令)可由计算机设备的处理器执行以完成本申请各个实施例所示的方法的全部或者部分步骤。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本申请的真正范围和精神由下面的权利要求指出。

应当理解的是，本申请并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims

1.一种参数生成方法，其特征在于，所述方法包括：

根据所述评价参数预测结果生成所述预测用户的评价参数。

2.根据权利要求1所述的方法，其特征在于，所述基模型是基于树的机器学习模型；所述评价参数预测模型包括所述N个基模型；

3.根据权利要求2所述的方法，其特征在于，所述获取预测用户的用户特征之前，还包括：

4.根据权利要求1所述的方法，其特征在于，所述基模型是逻辑回归模型；所述第i个基模型中包含i个模型参数，且所述i个模型参数中的前i-1个模型参数是所述第i-1个基模型中的模型参数；所述评价参数预测模型包括所述N个基模型中的最后一个基模型；

5.根据权利要求4所述的方法，其特征在于，所述根据所述最后一个基模型对所述预测用户的用户特征的输出结果，获得所述评价参数预测结果，包括：

6.根据权利要求4所述的方法，其特征在于，所述获取预测用户的用户特征之前，还包括：

7.根据权利要求1至6任一所述的方法，其特征在于，所述评价参数是信用风险参数，所述评价标签为信用标签。

8.根据权利要求7所述的方法，其特征在于，所述预测用户的信用风险参数，是所述预测用户的N周期信用评分A卡的分值。

9.一种参数生成装置，其特征在于，所述装置包括：

10.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器中存储有程序，所述程序由所述处理器执行以实现如权利要求1至8任一所述的参数生成方法。

11.一种计算机可读存储介质，其特征在于，所述存储介质中存储有指令，所述指令由计算机设备的处理器执行以实现如权利要求1至8任一所述的参数生成方法。