CN111539490B

CN111539490B - 一种业务模型训练方法和装置

Info

Publication number: CN111539490B
Application number: CN202010566083.6A
Authority: CN
Inventors: 张雅淋
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2020-06-19
Filing date: 2020-06-19
Publication date: 2020-10-16
Anticipated expiration: 2040-06-19
Also published as: CN111539490A; CN112348099A

Abstract

本说明书实施例提供了一种业务模型训练方法和装置，所述业务模型包括n个分类模型和与所述n个分类模型分别对应的n个转换模型，其中n为大于1的自然数，所述方法包括：获取第一训练样本，所述第一训练样本包括业务对象的特征数据和业务对象的标签值；通过所述n个转换模型，将所述特征数据转换为n个不同的转换数据；生成n个不同的第二训练样本，每个第二训练样本中包括所述n个不同的转换数据中的一个转换数据和所述标签值；以各个所述第二训练样本分别训练所述n个分类模型中对应的分类模型。

Description

一种业务模型训练方法和装置

技术领域

本说明书实施例涉及机器学习技术领域，更具体地，涉及一种业务模型训练方法和装置。

背景技术

在互联网的应用场景中，每天会有大量的数据需要分析，而机器学习作为一种技术手段，正在越来越多的场景中发挥着作用。对于给定的任务，为取得良好的部署效果，可通过集成学习来集成多个不同的分类模型，而提升整体的集成模型的泛化性能。对于集成学习而言，有两个关键的因素需要考虑：其一是单个分类模型的准确率（accuracy），其二是分类模型间的多样性（diversity），只有做到“好而不同”，才有利于整体的集成模型取得更好的效果。然而，目前的方法中，获得多样性的主要办法是通过采集训练样本获得多个不同的训练样本集，来训练集成模型中的各个分类模型。

因此，需要一种更有效的业务模型训练方案。

发明内容

本说明书实施例旨在提供一种更有效的业务模型训练方案，以解决现有技术中的不足。

为实现上述目的，本说明书一个方面提供一种由计算机执行的业务模型训练方法，所述业务模型包括n个分类模型和与所述n个分类模型分别对应的n个转换模型，其中n为大于1的自然数，所述方法包括：

获取第一训练样本，所述第一训练样本包括业务对象的特征数据和业务对象的标签值；

通过所述n个转换模型，将所述特征数据转换为n个不同的转换数据；

生成n个不同的第二训练样本，每个第二训练样本中包括所述n个不同的转换数据中的一个转换数据和所述标签值；

以各个所述第二训练样本分别训练所述n个分类模型中对应的分类模型。

在一种实施方式中，将所述特征数据转换为n个不同的转换数据包括，通过以下任一模型将所述特征数据映射为映射数据：随机映射模型、独立成分分析模型、主成分分析模型、维度变换模型。

在一种实施方式中，将所述特征数据转换为n个不同的转换数据还包括，在将所述特征数据映射为映射数据之后，将所述映射数据与所述特征数据拼接，以获取转换数据。

在一种实施方式中，将所述特征数据转换为n个不同的转换数据还包括，将所述特征数据转换为维度减少的转换数据。

在一种实施方式中，所述业务对象为以下任一对象：用户、商户、商品、交易。

本说明书另一方面提供一种部署于计算机中的业务模型训练装置，所述业务模型包括n个分类模型和与所述n个分类模型分别对应的n个转换模型，其中n为大于1的自然数，所述装置包括：

获取单元，配置为，获取第一训练样本，所述第一训练样本包括业务对象的特征数据和业务对象的标签值；

转换单元，配置为，通过所述n个转换模型，将所述特征数据转换为n个不同的转换数据；

生成单元，配置为，生成n个不同的第二训练样本，每个第二训练样本中包括所述n个不同的转换数据中的一个转换数据和所述标签值；

训练单元，配置为，以各个所述第二训练样本分别训练所述n个分类模型中对应的分类模型。

在一种实施方式中，所述转换单元包括，映射子单元，配置为，通过以下任一模型将所述特征数据映射为映射数据：随机映射模型、独立成分分析模型、主成分分析模型、维度变换模型。

在一种实施方式中，所述转换单元还包括，拼接子单元，配置为，在将所述特征数据映射为映射数据之后，将所述映射数据与所述特征数据拼接，以获取转换数据。

在一种实施方式中，所述转换单元还配置为，将所述特征数据转换为维度减少的转换数据。

本说明书另一方面提供一种通过业务模型处理业务数据的方法，所述业务模型包括n个分类模型和与所述n个分类模型分别对应的n个转换模型，其中，所述业务数据为业务对象的特征数据，n为大于1的自然数，所述方法包括：

通过所述n个转换模型，将所述业务数据转换为n个不同的转换数据；

将各个所述转换数据分别输入所述n个分类模型中的对应的分类模型，以从所述n个分类模型分别输出对所述业务对象的初始分类结果；

基于从所述n个分类模型分别输出的对所述业务对象的初始分类结果，确定对所述业务对象的分类结果。

本说明书另一方面提供一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行上述任一项方法。

本说明书另一方面提供一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现上述任一项方法。

通过根据本说明书实施例的业务模型训练方法，通过在作为集成模型的业务模型中增加转换模型以对特征数据进行转换，大大提高了业务模型中的分类模型的多样性，从而使得整体的模型效果更好，另外，通过使用转换模型对特征数据进行降维，提高了业务模型的计算效率。

附图说明

通过结合附图描述本说明书实施例，可以使得本说明书实施例更加清楚：

图1示出根据本说明书实施例的业务模型100的结构示意图；

图2示出根据本说明书实施例的一种由计算机执行的业务模型训练方法流程图；

图3示出根据本说明书实施例的一种通过业务模型处理业务数据的方法流程图；

图4示出通过业务模型100预测业务对象的分类结果的过程示意图；

图5示出根据本说明书实施例的一种部署于计算机中的业务模型训练装置500。

具体实施方式

下面将结合附图描述本说明书实施例。

图1示出根据本说明书实施例的业务模型100的结构示意图。如图1中所示，业务模型100为一种集成模型，其中包括多个分类模型，图1中示意示出第一分类模型111、第二分类模型112和第三分类模型113。所述业务模型100中还包括与多个分类模型分别对应的多个转换模型，图1中示意示出第一转换模型121、第二转换模型122和第三转换模型123。另外，业务模型100中还包括确定单元13，确定单元13用于基于各个分类模型的输出确定业务模型100的输出。所述业务模型100例如用于预测用户的消费水平，也就是说，所述业务模型100的输出值用于预测用户的消费水平，例如，该输出值对应于低水平、中水平、高水平中的一个。

为了训练这样的业务模型100，首先获取与多个用户分别对应的训练样本集，该训练样本集中包括多个第一训练样本，例如包括第一训练样本（X,y），其中，X为该第一训练样本对应的用户的特征数据，该特征数据X中例如包括用户的性别、年龄、工作、历史交易数据等数据，y为该第一训练样本对应的用户的标签值，该标签值指示该用户的标定的消费水平。在获取第一训练样本（X,y）之后，将X分别输入第一转换模型121、第二转换模型122和第三转换模型123。第一转换模型121、第二转换模型122和第三转换模型123分别对X进行数据转换，从而分别生成转换数据X₁-X₃，从而可基于转换数据X₁-X₃分别生成第二训练样本（X₁,y）、（X₂,y）和（X₃,y）。之后，可使用第二训练样本（X₁,y）训练第一分类模型111，使用第二训练样本（X₂,y）训练第二分类模型112，使用第二训练样本（X₃,y）训练第三分类模型113。在对所述训练样本集中的多个第一训练样本分别进行上述处理以获取相应的多组第二训练样本，并使用每组第二训练样本中的三个第二训练样本分别训练第一分类模型111、第二分类模型112和第三分类模型113之后，完成对业务模型100的训练过程。

在对业务模型100训练完成之后，可通过业务模型100进行对用户的消费水平的预测（图1中未示出）。其中，在将用户的特征数据输入业务模型100之后，与上述训练过程类似地，首先通过第一转换模型121、第二转换模型122和第三转换模型123分别将用户的特征数据转换为不同的转换数据；然后使用第一分类模型111、第二分类模型112和第三分类模型113中相应的分类模型基于用户的转换数据分别预测对用户的初始分类结果，并将该初始分类结果输出给确定单元13；最后，确定单元13基于第一分类模型111、第二分类模型112和第三分类模型113的输出，确定对用户的分类结果。

通过上文参考图1的描述可以看出，在根据本说明书实施例的对业务模型100的训练过程中，通过对采集的一个第一训练样本进行数据转换，可以仅通过一个第一训练样本获取用于分别训练多个分类模型的多个第二训练样本，而不需要相对于多个分类模型分别采集多个训练样本，也不需要相对于多个分类模型从N个训练样本中获取多个不同的训练样本集，从而在保证各个分类模型的多样性的同时，减少了采集训练样本的工作量。

可以理解，上文参考图1的描述仅仅是示意性的，而不是限制性的。例如，所述业务模型不限于预测用户的分类结果，而可以用于预测各种业务对象的分类，所述业务对象例如还包括商户、交易、商品、影视作品、书籍等各种对象，对此不作限定。

下面将详细描述上述训练业务模型100和使用业务模型100进行预测的过程。

图2示出根据本说明书实施例的一种由计算机执行的业务模型训练方法流程图，所述业务模型包括n个分类模型和与所述n个分类模型分别对应的n个转换模型，其中n为大于1的自然数，所述方法包括：

步骤S202，获取第一训练样本，所述第一训练样本包括业务对象的特征数据和业务对象的标签值；

步骤S204，通过所述n个转换模型，将所述特征数据转换为n个不同的转换数据；

步骤S206，生成n个不同的第二训练样本，每个第二训练样本中包括所述n个不同的转换数据中的一个转换数据和所述标签值；

步骤S208，以各个所述第二训练样本分别训练所述n个分类模型中对应的分类模型。

首先，在步骤S202，获取第一训练样本，所述第一训练样本包括业务对象的特征数据和业务对象的标签值。

如上文所述，所述业务对象例如为用户，则可通过采集用户的特征数据X，并对用户的分类标定标签值y，从而获取与该用户对应的第一训练样本（X,y）。特征数据X中例如包括用户的性别、年龄、工作、历史交易数据等数据，标签值y例如用于指示该用户的标定的消费水平,y的值例如可以为1，2或者3，其中，1指示消费水平为低水平，2指示消费水平为中水平，3指示消费水平为高水平。可以理解，这里对业务对象、特征数据X和标签值y的描述仅仅是示例性的，而不用于限制本说明书实施例的范围。

在步骤S204，通过所述n个转换模型，将所述特征数据转换为n个不同的转换数据。

所述n个转换模型对应于对特征数据的n个不同的转换方式（或者数据变换公式）。假设用户的特征数据X包括d个特征的特征值，则可以将X表示为行向量（x₁,x₂…x_d）。

在一种实施方式中，所述n个转换模型对应于n个不同的映射矩阵W_i，其中，映射矩阵W_i为d行p列的矩阵，i可取值1到n中任一个值，n≥2。映射矩阵W_i可以通过多种方式确定。例如，映射矩阵W_i可以为随机矩阵，其各个矩阵元分别为相互独立且具有相同分布的各个随机变量。假设d=3，p=2，则映射矩阵W_i可以为如下面的公式（1）所示的由随机变量f_ij（x）（i=1,2,3，j=1,2）组成的矩阵：

（1）

其中每个f_ij（x）为独立同分布的随机变量，对于每个f_ij（x），可独立地获取在预定范围内的x的随机值，例如，在[0,1]内的随机值，然后通过f_ij（x）函数计算f_ij（x）的值，从而获得映射矩阵W_i的每个矩阵元。例如，f_ij（x）满足期望值为0、方差为1的高斯分布。即，f_ij（x）~N（0，1）。或者，f_ij（x）为预定范围（例如[-1,1]）内的随机值。或者f_ij（x）可以为离散型随机变量，例如，f_ij（x）满足分别以

、

的概率取值-1、0、1的分布等等。

映射矩阵W_i还可以为通过独立成分分析（ICA）算法或主成分分析算法（PCA）确定的矩阵，或者映射矩阵W_i还可以为维度变换矩阵，即通过映射矩阵W_i将d维的行向量X变换为不同维度（即p维）的空间中的向量。

在通过上述任一种方法分别确定n个不同的映射矩阵W_i之后，可通过如下的公式（2）计算n个映射数据X_i’，其中i在[1,n]中取值：

X_i’=XW_i （2），

从而可将通过公式（2）获取的n个映射数据X_i’作为n个转换数据X_i。

在该实施方式中，如果特征数据X的维度d较大，可将映射矩阵W_i的列数p设置为小于d，从而起到对特征数据X进行降维的作用，从而在后续模型训练和模型预测中可起到提高计算效率的作用。

在一种实施方式中，在如上文所述计算n个映射数据X_i’之后，可通过如下的公式（3）生成n个转换数据X_i：

X_i=[X_i’X] （3），

其中，公式（3）表示，通过将每个映射数据X_i’与X拼接到一起，从而生成对应的转换数据X_i，该生成的转换数据X_i具有d+p个维度，由于转换数据X_i中包括原始的特征数据X，因此，通过以包括各个转换数据X_i的训练样本来分别训练各个分类模型，可获得更好的效果。

在步骤S206，生成n个不同的第二训练样本，每个第二训练样本中包括所述n个不同的转换数据中的一个转换数据和所述标签值。

在如上文所述生成n个转换数据X_i之后，可以以各个转换数据X_i作为第二训练样本的特征数据，以上述与特征数据X对应的标签值作为各个第二训练样本的标签值，也就是说，基于一个第一训练样本（X，y）,生成了n个不同的第二训练样本（X_i，y）。例如，如图1中所示，通过第一转换模型121、第二转换模型122和第三转换模型123对特征数据X的转换，分别生成第二训练样本（X₁，y）、（X₂，y）和（X₃，y）。

在步骤S208，以各个所述第二训练样本分别训练所述n个分类模型中对应的分类模型。

所述n个分类模型可以具有相同模型结构，或者可以具有不同模型结构，例如，每个分类模型可以为以下任一种模型：树模型、神经网络模型、随机森林模型等等，对此不作限定。

如图1中所示，第一转换模型121与第一分类模型111相对应，因此，将包括通过第一转换模型121对特征数据X进行转换获取的X₁的第二训练样本（X₁，y）用于训练第一分类模型111，类似地，将通过第二转换模型122获取的第二训练样本（X₂，y）用于训练第二分类模型112，将通过第三转换模型123获取的第二训练样本（X₃，y）用于训练第三分类模型113。所述训练方法可以为各种模型优化方法，如梯度下降法等。在基于多个第一训练样本如上文所述对各个分类模型进行多次训练之后，从而可完成对各个分类模型的训练，即完成对业务模型100的训练。

图3示出根据本说明书实施例的一种通过业务模型处理业务数据的方法流程图，所述业务模型包括n个分类模型和与所述n个分类模型分别对应的n个转换模型，其中，所述业务数据为业务对象的特征数据，n为大于1的自然数，所述方法包括：

步骤S302，通过所述n个转换模型，将所述业务数据转换为n个不同的转换数据；

步骤S304，将各个所述转换数据分别输入所述n个分类模型中的对应的分类模型，以从所述n个分类模型分别输出对所述业务对象的初始分类结果；

步骤S306，基于从所述n个分类模型分别输出的对所述业务对象的初始分类结果，确定对所述业务对象的分类结果。

首先，步骤S302，通过所述n个转换模型，将所述业务数据转换为n个不同的转换数据。

图4示出通过业务模型100预测业务对象的分类结果的过程示意图。如上文所述，所述业务对象例如为用户，所述分类结果例如用于预测用户的消费水平。如图4中所示，在获取待预测的用户的特征数据Z之后，将特征数据Z分别输入第一转换模型121、第二转换模型122和第三转换模型123。从而第一转换模型121、第二转换模型122和第三转换模型123将特征数据Z分别转换为转换数据Z₁-Z₃，并将其输入相应的分类模型。其中，所述特征数据Z与上述特征数据X包括相同的特征维度，该转换过程与上文中对特征数据X的转换过程相同,例如，Z₁=ZW₁,或者Z₁=[ZW₁,Z],其中W₁为第一转换模型121中的映射矩阵。

在步骤S304，将各个所述转换数据分别输入所述n个分类模型中的对应的分类模型中，以从所述n个分类模型分别输出对所述业务对象的初始分类结果。

在第一转换模型121、第二转换模型122和第三转换模型123分别向第一分类模型111、第二分类模型112和第三分类模型113输入转换数据Z₁-Z₃之后，第一分类模型111、第二分类模型112和第三分类模型113分别基于输入其的转换数据Z₁-Z₃输出对用户的初始分类结果y₁-y₃。所述初始分类结果y₁-y₃分别可以为1、2、3中的一个值，以用于预测用户的不同消费水平。

在步骤S306，基于从所述n个分类模型分别输出的对所述业务对象的初始分类结果，确定对所述业务对象的分类结果。

如图4所示，第一分类模型111、第二分类模型112和第三分类模型113在分别输出初始分类结果y₁-y₃之后，分别将初始分类结果y₁-y₃传输给确定单元13，确定单元13根据预定决策算法来确定用户的分类结果y’。例如，确定单元13可计算初始分类结果y₁-y₃的平均值，并基于该平均值确定分类结果y’，或者，确定单元13可基于取多数票的方法，将初始分类结果y₁-y₃中出现次数最多的值确定为分类结果y’。

图5示出根据本说明书实施例的一种部署于计算机中的业务模型训练装置500，所述业务模型包括n个分类模型和与所述n个分类模型分别对应的n个转换模型，其中n为大于1的自然数，所述装置500包括：

获取单元51，配置为，获取第一训练样本，所述第一训练样本包括业务对象的特征数据和业务对象的标签值；

转换单元52，配置为，通过所述n个转换模型，将所述特征数据转换为n个不同的转换数据；

生成单元53，配置为，生成n个不同的第二训练样本，每个第二训练样本中包括所述n个不同的转换数据中的一个转换数据和所述标签值；

训练单元54，配置为，以各个所述第二训练样本分别训练所述n个分类模型中对应的分类模型。

在一种实施方式中，所述转换单元52包括，映射子单元521，配置为，通过以下任一模型将所述特征数据映射为映射数据：随机映射模型、独立成分分析模型、主成分分析模型、维度变换模型。

在一种实施方式中，所述转换单元52还包括，拼接子单元522，配置为，在将所述特征数据映射为映射数据之后，将所述映射数据与所述特征数据拼接，以获取转换数据。

在一种实施方式中，所述转换单元52还配置为，将所述特征数据转换为维度减少的转换数据。

需要理解，本文中的“第一”，“第二”等描述，仅仅为了描述的简单而对相似概念进行区分，并不具有其他限定作用。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本领域普通技术人员应该还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。本领域普通技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。其中，软件模块可以置于随机存储器（RAM）、内存、只读存储器（ROM）、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

以上所述的具体实施方式，对本说明书实施例的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本说明书实施例的具体实施方式而已，并不用于限定本说明书实施例的保护范围，凡在本说明书实施例的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本说明书实施例的保护范围之内。

Claims

1.一种业务模型训练方法，所述方法由计算机执行，所述业务模型包括n个分类模型和与所述n个分类模型分别对应的n个转换模型，其中n为大于1的自然数，所述业务模型用于预测用户的消费水平，所述方法包括：

获取第一训练样本，所述第一训练样本包括用户的特征数据和用户的标签值，该标签值指示该用户的标定的消费水平；

2.根据权利要求1所述的方法，其中，将所述特征数据转换为n个不同的转换数据包括，通过以下任一模型将所述特征数据映射为映射数据：随机映射模型、独立成分分析模型、主成分分析模型、维度变换模型。

3.根据权利要求2所述的方法，其中，将所述特征数据转换为n个不同的转换数据还包括，在将所述特征数据映射为映射数据之后，将所述映射数据与所述特征数据拼接，以获取转换数据。

4.根据权利要求1或2所述的方法，其中，将所述特征数据转换为n个不同的转换数据还包括，将所述特征数据转换为维度减少的转换数据。

5.一种业务模型训练装置，所述装置部署于计算机中，所述业务模型包括n个分类模型和与所述n个分类模型分别对应的n个转换模型，其中n为大于1的自然数，所述业务模型用于预测用户的消费水平，所述装置包括：

获取单元，配置为，获取第一训练样本，所述第一训练样本包括用户的特征数据和用户的标签值，该标签值指示该用户的标定的消费水平；

6.根据权利要求5所述的装置，其中，所述转换单元包括，映射子单元，配置为，通过以下任一模型将所述特征数据映射为映射数据：随机映射模型、独立成分分析模型、主成分分析模型、维度变换模型。

7.根据权利要求6所述的装置，其中，所述转换单元还包括，拼接子单元，配置为，在将所述特征数据映射为映射数据之后，将所述映射数据与所述特征数据拼接，以获取转换数据。

8.根据权利要求5或6所述的装置，其中，所述转换单元还配置为，将所述特征数据转换为维度减少的转换数据。

9.一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行权利要求1-5中任一项的所述的方法。

10.一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现权利要求1-5中任一项所述的方法。