CN110390041B

CN110390041B - 在线学习方法及装置、计算机可读存储介质

Info

Publication number: CN110390041B
Application number: CN201910591330.5A
Authority: CN
Inventors: 李君浩; 李铁铮
Original assignee: Shanghai Shanghu Information Technology Co ltd
Current assignee: Shanghai Shanghu Information Technology Co ltd
Priority date: 2019-07-02
Filing date: 2019-07-02
Publication date: 2022-05-20
Anticipated expiration: 2039-07-02
Also published as: CN110390041A

Abstract

一种在线学习方法及装置、计算机可读存储介质，包括：获取线上业务数据，所述线上业务数据包括用户特征，其中，所述用户特征包括以下至少一种：用户的属性信息、用户的操作行为信息；采用分析模型对所述线上业务数据进行分析，得到预设参数的分析结果，其中，所述分析模型采用梯度提升决策树算法及深度神经网络模型算法构建得到；基于所述线上业务数据对所述分析模型进行定期更新或者实时更新。采用上述方案，能够实现在线学习，并提高在线学习结果的准确度。

Description

在线学习方法及装置、计算机可读存储介质

技术领域

本发明实施例涉及在线学习技术领域，尤其涉及一种在线学习方法及装置、计算机可读存储介质。

背景技术

互联网广告以及搜索推荐等业务场景中，通常采用机器学习模型进行分类。目前，通常采用的机器学习模型为梯度提升决策树模型(Gradient Boosting Decision Tree，GBDT)。在互联网业务中，每时每刻都会产生大量的新的数据样本、客群属性可能发生变化，客户习惯偏好也可能发生变化等，为了能够快速捕捉到上述变化，需要机器学习模型能够快速迭代，具备在线学习能力。

然而，对于采用GBDT模型的互联网广告以及搜索推荐等业务场景而言，由于GBDT模型无法进行在线学习，在互联网广告以及搜索推荐等业务场景中，使用GBDT模型进行业务处理所得到的结果的准确度较低。

发明内容

本发明实施例解决的技术问题是在互联网广告以及搜索推荐等业务场景中，使用GBDT模型进行业务处理所得到的结果的准确度较低。

为解决上述技术问题，本发明实施例提供一种在线学习方法，包括：获取线上业务数据，所述线上业务数据包括用户特征，其中，所述用户特征包括以下至少一种：用户的属性信息、用户的操作行为信息；采用分析模型对所述线上业务数据进行分析，得到预设参数的分析结果，其中，所述分析模型采用梯度提升决策树算法及深度神经网络模型算法构建得到；基于所述线上业务数据对所述分析模型进行定期更新或者实时更新。

可选的，采用如下方式构建所述分析模型：获取训练样本集中的每个训练样本分别对应的用户特征，以及所述每个训练样本对应的标签；将所述每个训练样本分别对应的用户特征输入至梯度提升决策树模型中，采用所述梯度提升决策树中的每个决策树分别对每个训练样本进行分类，记录所述每个训练样本在所述每个决策树中落入的叶子节点的位置；对所述每个训练样本在所述每个决策树中落入的叶子节点的位置进行编码，生成所述每个训练样本在所述每个决策树中的分类信息；基于所述每个训练样本分别对应的用户特征、所述每个决策树的叶子节点的数目、所述每个训练样本在所述每个决策树中的分类信息，采用深度神经网络算法为每个决策树构建一一对应的深度神经网络模型；将所述每个训练样本分别对应的用户特征，分别输入至所述每个决策树一一对应的深度神经网络模型中，得到所述每个深度神经网络模型对所述每个训练样本的分类结果；基于所述每个深度神经网络模型对所述每个训练样本的分类结果，采用所述深度神经网络算法，结合所述每个训练样本对应的标签，训练得到所述分析模型。

可选的，所述采用深度神经网络算法为每个决策树构建一一对应的深度神经网络模型，包括：基于所述每个训练样本分别对应的用户特征，第i个决策树的叶子节点的数目，采用深度神经网络算法搭建初步的深度神经网络模型；将所述每个训练样本分别对应的用户特征以及所述每个训练样本在所述第i个决策树中的分类信息输入至所述初步的深度神经网络模型中，对所述初步的深度神经网络模型进行分类学习；当所述初步的深度神经网络模型的输出结果与所述第i个决策树的分类结果的差异满足设定范围时，训练得到所述第i个决策树对应的深度神经网络模型，其中，1≤i≤P，P为所述梯度提升决策树模型中的决策树的总数目。

可选的，所述基于所述线上业务数据对所述分析模型进行定期更新，包括：按照预设周期，获取预设时长内的线上业务数据；采用所述预设时长内的线上业务数据，定期对所述分析模型进行更新。

本发明实施例提供一种在线学习装置，包括：获取单元，适于获取线上业务数据，所述线上业务数据包括用户特征，其中，所述用户特征包括以下至少一种：用户的属性信息、用户的操作行为信息；分析单元，适于采用分析模型对所述线上业务数据进行分析，得到预设参数的分析结果，其中，所述分析模型采用梯度提升决策树算法及深度神经网络模型算法构建得到；更新单元，适于基于所述线上业务数据对所述分析模型进行定期更新或者实时更新。

可选的，所述在线学习装置还包括：模型构建单元，适于采用如下方式构建所述分析模型：获取训练样本集中的每个训练样本分别对应的用户特征，以及所述每个训练样本对应的标签；将所述每个训练样本分别对应的用户特征输入至梯度提升决策树模型中，采用所述梯度提升决策树中的每个决策树分别对每个训练样本进行分类，记录所述每个训练样本在所述每个决策树中落入的叶子节点的位置；对所述每个训练样本在所述每个决策树中落入的叶子节点的位置进行编码，生成所述每个训练样本在所述每个决策树中的分类信息；基于所述每个训练样本分别对应的用户特征、所述每个决策树的叶子节点的数目、所述每个训练样本在所述每个决策树中的分类信息，采用深度神经网络算法为每个决策树构建一一对应的深度神经网络模型；将所述每个训练样本分别对应的用户特征，分别输入至所述每个决策树一一对应的深度神经网络模型中，得到所述每个深度神经网络模型对所述每个训练样本的分类结果；基于所述每个深度神经网络模型对所述每个训练样本的分类结果，采用所述深度神经网络算法，结合所述每个训练样本对应的标签，训练得到所述分析模型。

可选的，所述模型构建单元，适于基于所述每个训练样本分别对应的用户特征，第i个决策树的叶子节点的数目，采用深度神经网络算法搭建初步的深度神经网络模型；将所述每个训练样本分别对应的用户特征以及所述每个训练样本在所述第i个决策树中的分类信息输入至所述初步的深度神经网络模型中，对所述初步的深度神经网络模型进行分类学习；当所述初步的深度神经网络模型的输出结果与所述第i个决策树的分类结果的差异满足设定范围时，训练得到所述第i个决策树对应的深度神经网络模型，其中，1≤i≤P， P为所述梯度提升决策树模型中的决策树的总数目。

可选的，所述更新单元，适于按照预设周期，获取预设时长内的线上业务数据；采用所述预设时长内的线上业务数据，定期对所述分析模型进行更新。

本发明实施例还提供一种在线学习装置，包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的计算机指令，所述处理器运行所述计算机指令时执行上述任一的在线学习方法的步骤。

本发明实施例还提供一种计算机可读存储介质，计算机可读存储介质为非易失性存储介质或非瞬态存储介质，其上存储有计算机指令，所述计算机指令运行时执行上述任一的在线学习方法的步骤。

与现有技术相比，本发明实施例的技术方案具有以下有益效果：

进行在线学习的分析模型采用梯度提升决策树算法及深度神经网络模型算法构建得到，由于深度神经网络模型具有可以自动基于所输入的线上业务数据进行模型更新的特点，因此可以实现在线学习。此外，基于GBDT算法构建的模型具有可解释性及准确度较高的特点，从而基于GBDT算法及深度神经网络模型算法构建得到的分析模型可以在兼顾在线学习结果的可解释性的同时，提高分析模型的在线学习结果的准确度，提高分析模型的鲁棒性。

附图说明

图1是本发明实施例中的一种在线学习方法的流程图；

图2是本发明实施例中的一种分析模型的构建流程图；

图3是本发明实施例中的一种在线学习装置的结构示意图。

具体实施方式

如上所述，在互联网业务中，每时每刻都会产生大量的新的数据样本、客群属性可能发生变化，客户习惯偏好也可能发生变化等，为了能够快速捕捉到上述变化，需要机器学习模型能够快速迭代，具备在线学习能力。然而，对于采用GBDT模型的互联网广告以及搜索推荐等业务场景而言，由于GBDT 模型无法进行在线学习，在互联网广告以及搜索推荐等业务场景中，使用 GBDT模型进行业务处理所得到的结果的准确度较低。

在本发明实施例中，进行在线学习的分析模型采用梯度提升决策树算法及深度神经网络模型算法构建得到，由于深度神经网络模型具有可以自动基于所输入的线上业务数据进行模型更新的特点，因此可以实现在线学习。此外，基于GBDT算法构建的模型具有可解释性及准确度较高的特点，从而基于GBDT算法及深度神经网络模型算法构建得到的分析模型可以在兼顾在线学习结果的可解释性的同时，提高分析模型的在线学习结果的准确度，提高分析模型的鲁棒性。

为使本发明实施例的上述目的、特征和有益效果能够更为明显易懂，下面结合附图对本发明的具体实施例做详细的说明。

参照图1，给出了本发明实施例中的一种在线学习方法的流程图。具体可以包括如下步骤：

步骤11，获取线上业务数据。

在具体实施中，在互联网业务中，当用户操作执行操作时，会产生对应的线上业务数据。

在本发明实施中，线上业务数据可以包括用户特征。用户特征可以包括用户的属性信息以及用户的操作行为信息中的至少一种。用户的属性信息可以包括：用户的年龄、性别、职业等。用户的操作行为信息可以为用户的历史操作记录。例如，用户打开一个应用软件，当用户点击应用软件上的操作按键时，会产生对应的操作行为信息。

步骤12，采用分析模型对所述线上业务数据进行分析，得到预设参数的分析结果。

在具体实施中，可以将获取到的线上业务数据输入至分析模型中，采用分析模型进行线上业务数据进行分析，得到预设参数的分析结果。根据互联网业务类型的不同，对应的预设参数不同。例如，对于互联网线上信贷业务，预设参数可以为用户的逾期概率，线上业务数据可以包括用户在贷款应用软件中对应用软件的操作信息，如与了解贷款条款相关的操作行为、与了解帮助条款相关的操作行为、与了解贷款产品相关的操作行为、用户的职业、用户的收入等，根据线上业务数据可以通过分析模型，预测用户的预期概率。又如，对于互联网广告业务，预设参数可以为用户点击广告的概率。可以理解的是，根据实际业务场景需要选取预设参数，此处不再一一举例。

在具体实施中，分析模型可以采用梯度提升决策树算法及深度神经网络模型算法构建得到。参照图2，给出的本发明实施例中的一种分析模型的训练流程图，分析模型的训练流程可以包括如下步骤：

步骤21，获取训练样本集中的每个训练样本分别对应的用户特征，以及所述每个训练样本对应的标签。

在具体实施中，可以获取训练样本集中的每个训练样本分别对应的用户特征，每个训练样本均存在对应的标签。

在本发明实施例中，在不同的业务场景中，每个训练样本对应的标签不同。例如，在互联网广告业务中，每个训练样本对应的标签可以为广告点击率标签{0，1}，其中1表示训练样本对应的用户点击广告，0表示训练样本对应的用户未点击广告。又如，在互联网信贷业务中，每个训练样本对应的标签可以为用户的逾期标签{0，1}，其中1表示训练样本对应的用户逾期，0表示训练样本对应的用户未逾期。

例如，训练样本集包括m个训练样本，每个训练样本对应的n个用户特征可以采用矩阵表示，记为X＝[x1，x2，…，xn]，m个样本的标签可以记为 Y＝[y1，y2，…，ym]。

步骤22，采用所述梯度提升决策树中的每个决策树分别对每个训练样本进行分类，记录所述每个训练样本在所述每个决策树中落入的叶子节点的位置。

在具体实施中，基于训练样本集以及每个训练样本的用户特征，采用梯度提升决策树算法进行模型训练，得到梯度提升决策树模型。梯度提升决策树模型中的决策树的总数目为P，每个决策树均存在对应数目C的叶子节点。例如，第Ti棵决策树的叶子节点的数目为Ci。不同的决策树对应的叶子节点的数目可以相同，也可以不同。

分别将每个样本对应的用户特征输入至每个决策树中进行分类，记录每个训练样本在每个决策树中落入的叶子节点的位置。

步骤23，所述每个训练样本在所述每个决策树中落入的叶子节点的位置进行编码，生成所述每个训练样本在所述每个决策树中的分类信息。

在具体实施中，可以为每个决策树中的叶子节点一一进行编码，不同的叶子节点的编码唯一，生成每个样本在每个决策树中的分类信息。

在本发明实施例中，可以采用独热编码(One-Hot Encoding)，对每个样本在每个决策树中的叶子节点的落入位置进行编码，得到每个样本在每个决策树中的分类信息。例如，第1个决策树具有4个叶子节点，训练样本Xi落入第3个叶子节点，编码为0010。又如，第P个决策树具有5个叶子节点，训练样本Xi落入第5个叶子节点，编码为000001。

步骤24，基于所述每个训练样本分别对应的用户特征、所述每个决策树的叶子节点的数目、所述每个训练样本在所述每个决策树中的分类信息，采用深度神经网络算法为每个决策树构建一一对应的深度神经网络模型。

在具体实施中，需要采用深度神经网络算法为每个决策树构建一一对应的深度神经网络模型，下面以第i个决策树对应的深度神经网络模型的构建过程为例进行说明：

在本发明实施例中，可以基于所述每个训练样本分别对应的用户特征，第i个决策树的叶子节点的数目，采用深度神经网络算法搭建初步的深度神经网络模型。将每个训练样本分别对应的用户特征以及每个训练样本在第i个决策树中的分类信息输入至初步的深度神经网络模型中，对初步的深度神经网络模型进行分类学习；将初步的深度神经网络模型的输出结果与第i个决策树的分类结果进行比对，当初步的深度神经网络模型的输出结果与第i个决策树的分类结果的差异满足设定范围时，训练得到第i个决策树对应的深度神经网络模型，第i个决策树对应的深度神经网络模型的训练过程也即是对搭建的初步的深度神经网络模型的模型参数拟合的过程，其中，1≤i≤P，P为梯度提升决策树模型中的决策树的总数目，分别训练得到每个决策树分别对应的深度神经网络模型，P个决策树对应存在P个深度神经网络模型。

步骤25，将所述每个训练样本分别对应的用户特征，分别输入至所述每个决策树一一对应的深度神经网络模型中，得到所述每个深度神经网络模型对所述每个训练样本的分类结果。

在得到每个决策树分别一一对应的深度神经网络模型之后，可以将每个训练样本分别输入至每个深度神经网络模型进行分类，得到每个深度神经网络模型分别对每个训练样本的分类结果。由于每个深度神经网络模型均是依据对应的决策树训练而来，依次训练得到的深度神经网络模型具备解释性强以及准确性高的优点。

步骤26，基于所述每个深度神经网络模型对所述每个训练样本的分类结果，采用所述深度神经网络算法，结合所述每个训练样本对应的标签，训练得到所述分析模型。

在具体实施中，在得到每个深度神经网络模型对每个训练样本的分类结果之后，可以采用所述深度神经网络算法，基于每个深度神经网络模型对所述每个训练样本的分类结果并结合每个训练样本对应的标签，训练得到分析模型。

在本发明实施例中，将m个训练样本的用户特征分别依次输入至P个深度神经网络模型中进行分类，将P个深度神经网络模型的输出结果依次进行拼接，生成新的特征向量X’＝[O1，O2，…，OP]，O1为第1个深度神经网络模型的输出结果，O2为第2个深度神经网络模型的输出结果，OP为第P个深度神经网络模型的输出结果。采用深度神经网络算法构建一个新的深度神经网络模型，将P个深度神经网络模型的输出结果X’＝[O1，O2，…，OP]输入至新的深度神经网络模型中，并根据m个训练样本的标签Y＝[y1，y2，…， ym]，对新的深度神经网络模型进行训练，得到分析模型。对新的深度神经网络模型进行训练得到分析模型的过程，也即是结合m个训练样本的标签 Y＝[y1，y2，…，ym]对新的深度神经网络模型的模型参数进行拟合调整的过程，直至新的深度神经网络模型的输出结果与m个训练样本的标签Y＝[y1， y2，…，ym]的误差满足要求，也即得到分析模型。

在具体实施中，训练得到分析模型之后，可以将分析模型部署到对应的线上业务环境中，采用分析模型可以对线上业务数据进行分析，得到预设参数的分析结果。

步骤13，基于所述线上业务数据对所述分析模型进行定期更新或者实时更新。

在具体实施中，在互联网业务中，每时每刻都会产生大量的新的线上业务数据，随着新的线上业务数据的产生，客群属性或者客户的偏好也会发生相应的变化，为了能够快速捕捉到变化，在本发明实施例中，可以基于线上业务数据对分析模型进行定期更新或者实时更新，实现在线学习。

在本发明一实施例中，可以按照预设周期，定期获取预设时长内的线上业务数据，采用预设时长内的线上业务数据，定期对分析模型进行更新。

由上述方案可知，进行在线学习的分析模型采用梯度提升决策树算法及深度神经网络模型算法构建得到，由于深度神经网络模型具有可以自动基于所输入的线上业务数据进行模型更新的特点，因此可以实现在线学习。此外，基于GBDT算法构建的模型具有可解释性及准确度较高的特点，从而基于 GBDT算法及深度神经网络模型算法构建得到的分析模型可以在兼顾在线学习结果的可解释性的同时，提高分析模型的在线学习结果的准确度，提高分析模型的鲁棒性。

在本发明实施例中，分析模型是基于梯度提升决策树算法构建的梯度提升决策树模型，并采用深度神经网络算法对梯度提升决策树模型进行再次拟合所得到，从而分析模型具有梯度提升决策树的可解释性的同时还具有深度神经网络模型可以在线学习的优点，可以利用所产生的新样本对分析模型更新，无须重新拉取历史数据，由于新样本的数量通常小于历史数据的数量，从而可以避免新样本被历史数据稀释，提高更新后的分析模型对新样本的敏感度，便于快速捕捉到新样本的变化。

此外，由于分析模型的更新无须重新训练，相对现有技术中采用GBDT 模型是需要采用新样本以及历史样本重新训练模型，重新训练模型的周期长，因此本发明实施例提供的分析模型可以实现快速迭代的需要。

为了便于本领域技术人员更好的理解和实现本发明实施例，本发明实施例还提供一种在线学习装置。

参照图3，给出了本发明实施例中的一种在线学习装置的结构示意图。在线学习装置30可以包括：获取单元31、分析单元32及更新单元33，其中：

获取单元31，适于获取线上业务数据，所述线上业务数据包括用户特征，其中，所述用户特征包括以下至少一种：用户的属性信息、用户的操作行为信息；

分析单元32，适于采用分析模型对所述线上业务数据进行分析，得到预设参数的分析结果，其中，所述分析模型采用梯度提升决策树算法及深度神经网络模型算法构建得到；

更新单元33，适于基于所述线上业务数据对所述分析模型进行定期更新或者实时更新。

在具体实施中，所述在线学习装置30还可以包括：模型构建单元(图3 未示出)，适于采用如下方式构建所述分析模型：获取训练样本集中的每个训练样本分别对应的用户特征，以及所述每个训练样本对应的标签；将所述每个训练样本分别对应的用户特征输入至梯度提升决策树模型中，采用所述梯度提升决策树中的每个决策树分别对每个训练样本进行分类，记录所述每个训练样本在所述每个决策树中落入的叶子节点的位置；对所述每个训练样本在所述每个决策树中落入的叶子节点的位置进行编码，生成所述每个训练样本在所述每个决策树中的分类信息；基于所述每个训练样本分别对应的用户特征、所述每个决策树的叶子节点的数目、所述每个训练样本在所述每个决策树中的分类信息，采用深度神经网络算法为每个决策树构建一一对应的深度神经网络模型；将所述每个训练样本分别对应的用户特征，分别输入至所述每个决策树一一对应的深度神经网络模型中，得到所述每个深度神经网络模型对所述每个训练样本的分类结果；基于所述每个深度神经网络模型对所述每个训练样本的分类结果，采用所述深度神经网络算法，结合所述每个训练样本对应的标签，训练得到所述分析模型。

在具体实施中，所述模型构建单元，可以适于基于所述每个训练样本分别对应的用户特征，第i个决策树的叶子节点的数目，采用深度神经网络算法搭建初步的深度神经网络模型；将所述每个训练样本分别对应的用户特征以及所述每个训练样本在所述第i个决策树中的分类信息输入至所述初步的深度神经网络模型中，对所述初步的深度神经网络模型进行分类学习；当所述初步的深度神经网络模型的输出结果与所述第i个决策树的分类结果的差异满足设定范围时，训练得到所述第i个决策树对应的深度神经网络模型，其中，1≤i≤P，P为所述梯度提升决策树模型中的决策树的总数目。

在具体实施中，所述更新单元33，适于按照预设周期，获取预设时长内的线上业务数据；采用所述预设时长内的线上业务数据，定期对所述分析模型进行更新。

在具体实施中，在线学习装置30的工作原理及工作流程，可以参考本发明上述实施例提高的在线学习方法中的描述，此处不再赘述。

本发明实施例还提供一种在线学习装置，包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的计算机指令，所述处理器运行所述计算机指令时执行本发明实施例提供的上述任一种在线学习方法中的描述。

本发明实施例提供一种计算机可读存储介质，计算机可读存储介质为非易失性存储介质或非瞬态存储介质，其上存储有计算机指令，所述计算机指令运行时执行本发明实施例提供的上述任一种在线学习方法中的描述。

需要说明的是，上述涉及到个人隐私的信息，都需要事先获得当事人的授权和许可，仅在获得当事人的授权前提下进行相关操作，而且仅在当事人许可的范围内进行使用。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于任一计算机可读存储介质中，存储介质可以包括：ROM、RAM、磁盘或光盘等。

虽然本发明披露如上，但本发明并非限定于此。任何本领域技术人员，在不脱离本发明的精神和范围内，均可作各种更动与修改，因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims

1.一种在线学习方法，其特征在于，包括：

获取线上业务数据，所述线上业务数据包括用户特征，其中，所述用户特征包括以下至少一种：用户的属性信息、用户的操作行为信息；

采用分析模型对所述线上业务数据进行分析，得到预设参数的分析结果，其中，所述分析模型采用梯度提升决策树算法及深度神经网络模型算法构建得到；

基于所述线上业务数据对所述分析模型进行定期更新或者实时更新；

其中，采用如下方式构建所述分析模型：

获取训练样本集中的每个训练样本分别对应的用户特征，以及所述每个训练样本对应的标签；

将所述每个训练样本分别对应的用户特征输入至梯度提升决策树模型中，采用所述梯度提升决策树中的每个决策树分别对每个训练样本进行分类，记录所述每个训练样本在所述每个决策树中落入的叶子节点的位置；

对所述每个训练样本在所述每个决策树中落入的叶子节点的位置进行编码，生成所述每个训练样本在所述每个决策树中的分类信息；

基于所述每个训练样本分别对应的用户特征、所述每个决策树的叶子节点的数目、所述每个训练样本在所述每个决策树中的分类信息，采用深度神经网络算法为每个决策树构建一一对应的深度神经网络模型；

将所述每个训练样本分别对应的用户特征，分别输入至所述每个决策树一一对应的深度神经网络模型中，得到每个深度神经网络模型对所述每个训练样本的分类结果；

基于所述每个深度神经网络模型对所述每个训练样本的分类结果，采用所述深度神经网络算法，结合所述每个训练样本对应的标签，训练得到所述分析模型。

2.根据权利要求1所述的在线学习方法，其特征在于，所述采用深度神经网络算法为每个决策树构建一一对应的深度神经网络模型，包括：

基于所述每个训练样本分别对应的用户特征，第i个决策树的叶子节点的数目，采用深度神经网络算法搭建初步的深度神经网络模型；

将所述每个训练样本分别对应的用户特征以及所述每个训练样本在所述第i个决策树中的分类信息输入至所述初步的深度神经网络模型中，对所述初步的深度神经网络模型进行分类学习；

当所述初步的深度神经网络模型的输出结果与所述第i个决策树的分类结果的差异满足设定范围时，训练得到所述第i个决策树对应的深度神经网络模型，其中，1≤i≤P，P为所述梯度提升决策树模型中的决策树的总数目。

3.根据权利要求1～2任一项所述的在线学习方法，其特征在于，所述基于所述线上业务数据对所述分析模型进行定期更新，包括：

按照预设周期，获取预设时长内的线上业务数据；

采用所述预设时长内的线上业务数据，定期对所述分析模型进行更新。

4.一种在线学习装置，其特征在于，包括：

获取单元，适于获取线上业务数据，所述线上业务数据包括用户特征，其中，所述用户特征包括以下至少一种：用户的属性信息、用户的操作行为信息；

分析单元，适于采用分析模型对所述线上业务数据进行分析，得到预设参数的分析结果，其中，所述分析模型采用梯度提升决策树算法及深度神经网络模型算法构建得到；

更新单元，适于基于所述线上业务数据对所述分析模型进行定期更新或者实时更新；

其中，还包括：模型构建单元，适于采用如下方式构建所述分析模型：获取训练样本集中的每个训练样本分别对应的用户特征，以及所述每个训练样本对应的标签；将所述每个训练样本分别对应的用户特征输入至梯度提升决策树模型中，采用所述梯度提升决策树中的每个决策树分别对每个训练样本进行分类，记录所述每个训练样本在所述每个决策树中落入的叶子节点的位置；对所述每个训练样本在所述每个决策树中落入的叶子节点的位置进行编码，生成所述每个训练样本在所述每个决策树中的分类信息；基于所述每个训练样本分别对应的用户特征、所述每个决策树的叶子节点的数目、所述每个训练样本在所述每个决策树中的分类信息，采用深度神经网络算法为每个决策树构建一一对应的深度神经网络模型；将所述每个训练样本分别对应的用户特征，分别输入至所述每个决策树一一对应的深度神经网络模型中，得到每个深度神经网络模型对所述每个训练样本的分类结果；基于所述每个深度神经网络模型对所述每个训练样本的分类结果，采用所述深度神经网络算法，结合所述每个训练样本对应的标签，训练得到所述分析模型。

5.根据权利要求4所述的在线学习装置，其特征在于，所述模型构建单元，适于基于所述每个训练样本分别对应的用户特征，第i个决策树的叶子节点的数目，采用深度神经网络算法搭建初步的深度神经网络模型；将所述每个训练样本分别对应的用户特征以及所述每个训练样本在所述第i个决策树中的分类信息输入至所述初步的深度神经网络模型中，对所述初步的深度神经网络模型进行分类学习；当所述初步的深度神经网络模型的输出结果与所述第i个决策树的分类结果的差异满足设定范围时，训练得到所述第i个决策树对应的深度神经网络模型，其中，1≤i≤P，P为所述梯度提升决策树模型中的决策树的总数目。

6.根据权利要求4～5任一项所述的在线学习装置，其特征在于，所述更新单元，适于按照预设周期，获取预设时长内的线上业务数据；采用所述预设时长内的线上业务数据，定期对所述分析模型进行更新。

7.一种在线学习装置，包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的计算机指令，其特征在于，所述处理器运行所述计算机指令时执行权利要求1至3任一项所述的在线学习方法的步骤。

8.一种计算机可读存储介质，计算机可读存储介质为非易失性存储介质或非瞬态存储介质，其上存储有计算机指令，其特征在于，所述计算机指令被处理器运行时执行权利要求1至3中任一项所述的在线学习方法的步骤。