CN112036641B

CN112036641B - 基于人工智能的留存预测方法、装置、计算机设备及介质

Info

Publication number: CN112036641B
Application number: CN202010898938.5A
Authority: CN
Inventors: 张巧丽; 林荣吉
Original assignee: Ping An Life Insurance Company of China Ltd
Current assignee: Ping An Life Insurance Company of China Ltd
Priority date: 2020-08-31
Filing date: 2020-08-31
Publication date: 2024-05-14
Anticipated expiration: 2040-08-31
Also published as: CN112036641A

Abstract

本发明涉及人工智能技术领域，提供一种基于人工智能的留存预测方法、装置、计算机设备及介质，包括：对全量样本进行分箱处理得到多个分箱特征值；从全量样本中选取多个批样本并根据多个分箱特征值计算每个批样本的布尔矩阵；初始化树模型并采用第一遗忘机制基于当前批样本的样本标识向量更新树模型中节点的样本统计量；采用第二遗忘机制基于当前批样本的样本标识向量及对应的布尔矩阵计算当前批样本的信息增益矩阵；根据当前批样本的信息增益矩阵更新当前最优特征及最优特征的特征值；基于当前最优特征及最优特征的特征值迭代训练树模型得到留存预测模型；使用留存预测模型预测待测用户的留存时长。本发明能够提高代理人留存预测的准确率。

Description

基于人工智能的留存预测方法、装置、计算机设备及介质

技术领域

本发明涉及人工智能技术领域，具体涉及一种基于人工智能的留存预测方法、装置、计算机设备及介质。

背景技术

在互联网系统中，准代理人在入司前的一系列环节的表现(例如EPASS考试、AI面谈、新人体验、职岗培训)可以为预测该代理人入司后的留存考核提供很多有价值的预测特征。

树模型是天然的分类模型，具有可处理非线性特征、对数值型特征的数值大小不敏感、能处理缺省值问题、模型可解释性强等优点。

发明人在实现本发明的过程中发现，互联网系统中的数据的特征分布以及数据与目标变量的映射关系会随着时间发生迁移，而树模型不能实现在线更新学习，导致使用树模型在跨时间的留存预测场景中无法进行实时更新，因而将树模型应用在互联网系统中进行代理人留存预测时准确率较低。

发明内容

鉴于以上内容，有必要提出一种基于人工智能的留存预测方法、装置、计算机设备及介质，能够提高代理人留存预测的准确率。

本发明的第一方面提供一种基于人工智能的留存预测方法，所述方法包括：

对全量样本进行分箱处理得到多个分箱特征值；

从所述全量样本中选取多个批样本，并根据所述多个分箱特征值计算每个批样本的布尔矩阵；

初始化树模型，并采用第一遗忘机制基于当前批样本的样本标识向量更新所述树模型中节点的样本统计量；

采用第二遗忘机制基于所述当前批样本的样本标识向量及对应的布尔矩阵计算所述当前批样本的信息增益矩阵；

根据所述当前批样本的信息增益矩阵更新当前最优特征及所述当前最优特征的特征值；

基于所述当前最优特征及所述当前最优特征的特征值迭代训练所述树模型得到留存预测模型；

使用所述留存预测模型基于待测用户的样本数据进行预测得到所述待测用户的留存时长。

根据本发明的一个可选的实施例，所述采用第一遗忘机制基于当前批样本的样本标识向量更新所述树模型中节点的样本统计量包括：

判断所述节点是否为根节点；

当所述节点为根节点，设置所述当前批样本的样本标识向量为第一标识向量，其中，所述第一标识向量中的元素值均为1；

当所述节点不为根节点时，设置所述当前批样本的样本标识向量为第二标识向量，其中，所述第二标识向量中的元素值包括0和1，1代表所述样本由所述根节点分配给所述节点，0代表所述样本由所述根节点分配给其他节点；

确定所述当前批样本之前的每一个批样本相对于所述当前批样本的相对批次，根据所述相对批次与预设第一系数计算所述批次对应的批样本的统计量的第一乘积；

根据所述当前批样本的统计量与所述当前批样本之前的每一个批样本对应的第一乘积更新所述当前批样本的统计量。

根据本发明的一个可选的实施例，所述根据所述多个分箱特征值计算每个批样本的布尔矩阵包括：

对于任意一个批样本，采用预设计算模型计算所述任意一个批样本中的每个样本与每个分箱特征值的第一布尔矩阵；

将每个样本对应的多个第一布尔矩阵进行连接得到第二布尔矩阵，作为所述样本的布尔矩阵；

将所述任意一个批样本对应的多个第二布尔矩阵进行连接得到第三布尔矩阵，作为所述任意一个批样本的布尔矩阵。

根据本发明的一个可选的实施例，所述预设计算模型为：其中，X为样本的特征值，A为分箱特征值，T为样本在该特征值下的最小特征值，/>为向下取整函数。

根据本发明的一个可选的实施例，在根据所述当前批样本的信息增益矩阵更新当前最优特征及所述当前最优特征的特征值之前，所述方法还包括：

获取与所述当前最优特征对应的历史最优特征；

获取所述历史最优特征的特征值；

计算所述当前最优特征的特征值与所述历史最优特征的特征值之间的信息增益差值；

判断信息增益差值是否小于预设差值阈值；

当所述信息增益差值小于所述预设差值阈值时，将所述历史最优特征作为所述当前最优特征，所述历史最优特征的特征值作为所述当前最优特征的特征值。

根据本发明的一个可选的实施例，所述对全量样本进行分箱处理得到多个分箱特征值包括：

采用预设分箱数对全量样本进行分箱处理得到多个分裂点；

将所述多个分裂点作为多个分箱特征值。

根据本发明的一个可选的实施例，所述基于所述当前最优特征及所述当前最优特征的特征值迭代训练所述树模型得到留存预测模型包括：

获取所述树模型输出的预测值；

计算所述预测值与对应的样本的真实值之间的预测误差；

判断所述预测误差是否小于预设误差阈值；

当所述预测误差大于所述预设误差阈值时，从所述全量样本中重新选取多个批样本，并重新训练所述留存预测模型，直至所述预测误差小于预设误差阈值，停止训练所述留存预测模型。

本发明的第二方面提供一种基于人工智能的留存预测装置，所述装置包括：

分箱处理模块，用于对全量样本进行分箱处理得到多个分箱特征值；

布尔计算模块，用于从所述全量样本中选取多个批样本，并根据所述多个分箱特征值计算每个批样本的布尔矩阵；

第一遗忘模块，用于初始化树模型，并采用第一遗忘机制基于当前批样本的样本标识向量更新所述树模型中节点的样本统计量；

第二遗忘模块，用于采用第二遗忘机制基于所述当前批样本的样本标识向量及对应的布尔矩阵计算所述当前批样本的信息增益矩阵；

特征更新模块，用于根据所述当前批样本的信息增益矩阵更新当前最优特征及所述当前最优特征的特征值；

模型训练模块，用于基于所述当前最优特征及所述当前最优特征的特征值迭代训练所述树模型得到留存预测模型；

留存预测模块，用于使用所述留存预测模型基于待测用户的样本数据进行预测得到所述待测用户的留存时长。

本发明的第二方面提供一种计算机设备，所述计算机设备包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现所述的基于人工智能的留存预测方法。

本发明的第四方面提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现所述的基于人工智能的留存预测方法。

综上所述，本发明所述的基于人工智能的留存预测方法、装置、计算机设备及介质，采用批样本的思想，实现了将树模型应用于互联网中进行流式学习的功能，实现了基于流式计算的流式决策树，利用矩阵计算的方式实现特征选择，基于矩阵计算的运算速度较快，从而计算提升了树模型的训练和预测效率；基于批样本的学习思想，不仅可以应对巨量数据的学习场景，还使得训练出的树模型具有非线性学习优点和在线学习功能，从而能够实现在线更新，提高代理人留存预测的准确率。

附图说明

图1是本发明实施例一提供的基于人工智能的留存预测方法的流程图。

图2是本发明实施例二提供的基于人工智能的留存预测装置的结构图。

图3是本发明实施例三提供的计算机设备的结构示意图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施例对本发明进行详细描述。需要说明的是，在不冲突的情况下，本发明的实施例及实施例中的特征可以相互组合。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本发明。

基于人工智能的留存预测方法由计算机设备执行，相应地，基于人工智能的留存预测装置运行于计算机设备中。

图1是本发明实施例一提供的基于人工智能的留存预测方法的流程图。所述基于人工智能的留存预测方法具体包括以下步骤，根据不同的需求，该流程图中步骤的顺序可以改变，某些可以省略。

S11，对全量样本进行分箱处理得到多个分箱特征值。

其中，所述全量样本包括多个对象的特征数据。其中，所述对象对应有标签。

本实施例中，所述全量样本包括的对象为代理人，则所述特征数据为代理人在入司申请前的行为数据，例如，每日点击率等。所述标签为代理人的留存标签，例如，留存3月，留存6月，留存12月。

所述分箱数用以对全量样本进行分箱处理时确定出多个最佳的分裂点，使得大量的连续性数值变为少量的离散型数值，减少数据量，提升树模型的训练速度和效率。示例性的，设置分箱数为6，则需要确定5个最佳分裂点，得到5个分箱特征值。

在一个可选的实施例中，所述对全量样本进行分箱处理得到多个分箱特征值包括：

采用预设分箱数对全量样本进行分箱处理得到多个分裂点；

将所述多个分裂点作为多个分箱特征值。

该可选的实施例中，可以预先根据经验值设置分箱数。由于分箱数越大，后续训练得到的留存预测模型的复杂度将会越大；分箱数越小，训练得到的留存预测模型的复杂度将会越小。为了降低留存预测模型的复杂度，提高训练留存预测模型的效率，设置一个较小的分箱数。示例性的，假设全量样本的数量为20万，则可以设置分箱数为6。

对全量样本按照从大到小或者从小到大进行排序，将排序后的全量样本进行等频分箱处理，或者卡方分箱、等距分箱，使得每个分箱中的样本的数量相同或者任意两个分箱中的样本的数量的差值在预设范围内。

S12，从所述全量样本中选取多个批样本，并根据所述多个分箱特征值计算每个批样本的布尔矩阵。

可以从所述全量样本中随机且有放回的选取多个批样本，随机且有放回的选取方式能够使得选取的批样本相对于全量样本而言，具有相同的分布，从而确保选取的批样本的稳定性。

在一个可选的实施例中，所述根据所述多个分箱特征值计算每个批样本的布尔矩阵包括：

示例性的，假设从10万个样本中随机且有放回的选取20批样本，每批样本中包括3K个样本，每个样本包括4K的维度，则每个批样本对应的布尔矩阵是一个3K*4K*6的张量，且所述布尔(Boole)矩阵中的元素值只取0或1，故Boole矩阵又称0-1矩阵。

在一个可选的实施例中，所述预设计算模型为如下所示：其中，X为样本的特征值，A为分箱特征值，T为样本在该特征值下的最小特征值。当某个样本的某个特征值大于分箱特征值时，P＝1，当某个样本的某个特征值小于分箱特征值时，P＝0。/>为向下取整函数。

通过预设计算模型计算任意一个批样本的布尔矩阵，替代了传统方式中的判断功能，计算过程更为简单直接；此外，使用预设计算模型计算布尔矩阵是本发明实现流式树模型的根本。

S13，初始化树模型，并采用第一遗忘机制基于当前批样本的样本标识向量更新所述树模型中节点的样本统计量。

本实施例中，在对树模型进行初始化时，设置多个超参数。所述多个超参数可以包括：节点样本统计量的衰减系数、学习率等。所述树模型可以包括：梯度提升决策树(Gradient boosting deision tree，GBDT)、极端梯度提升(eXtreme Gradient Boosting，XGBoost)、分类和回归树(Classification And Regression Tree，CART)等。

在完成树模型的初始化之后，使用第一个批样本训练初始化的树模型得到第一数模型，再使用第二个批样本训练所述第一树模型得到第二树模型，接着使用第三个批样本训练所述第二树模型得到第三树模型，以此类推，直到使用最后一个批样本进训练。

在一个可选的实施例中，所述采用第一遗忘机制基于当前批样本的样本标识向量更新所述树模型中节点的样本统计量包括：

判断所述节点是否为根节点；

各个父节点具有对应的分裂特征、分裂值，其中分裂特征为上述多个当前特征中的某一个特征。以某个父节点为例，其对应的分裂特征和分裂值分别表示为x(1)和v1，对于某个当前样本，该样本对应于分裂特征x(1)的特征值若小于v1，则被划分到左叶子节点，该样本对应于分裂特征x(1)的特征值若大于v1，则被划分到右叶子节点。

相对于现有技术，根节点在分裂特征时，左右叶子节点仅能获知自身的样本信息，而无法得知对方节点的样本信息。本发明通过设置包括0和1的样本标识向量，能够使得左右子节点均获知对方节点所分配的样本信息，实现了全局信息的共享。

示例性的，假设第一系数为0.9，当前批样本的批次为4，则第1批次的批样本对应的第一乘积为第1批次的批样本的统计量*0.9³，第2批次的批样本对应的第一乘积为第2批次的批样本的统计量*0.9²，第3批次的批样本对应的第一乘积为第3批次的批样本的统计量*0.9¹，将这3次批样本的第一乘积与当前批样本的统计量进行加权求和，作为所述当前批样本的最新的统计量。

通过相对批次与预设第一系数计算当前批样本之前的批样本的第一乘积，实现了对当前批样本之前的批样本的遗忘，减弱了当前批样本之前的批样本的统计量的影响，使得树模型始终重点学习当前批样本的样本信息。

S14，采用第二遗忘机制基于所述当前批样本的样本标识向量及对应的布尔矩阵计算所述当前批样本的信息增益矩阵。

分裂增益是在重构树模型的训练过程中，从多个候选特征中选取分裂特征及选取对应的分裂值时确定的。在一个具体的实施例中，上述重构树模型为CART分类树模型，则其中父节点对应的分裂增益通常是通过计算信息增益比而得到。另一个具体的实施例中，上述重构树模型为GBDT或XGBoost树模型，则其中父节点对应的分裂增益通常是通过计算基尼系数而得到。

在一个可选的实施例中，所述采用第二遗忘机制基于所述当前批样本的样本标识向量及对应的布尔矩阵计算所述当前批样本的信息增益矩阵的过程同采用第一遗忘机制基于当前批样本的样本标识向量更新所述树模型中节点的样本统计量的过程，本发明在此不再详细阐述。

S15，根据所述当前批样本的信息增益矩阵更新当前最优特征及所述当前最优特征的特征值。

将信息增益矩阵中最大的值对应的特征确定当前最优特征，获取当前最优特征的特征值。

在一个可选的实施例中，在根据所述当前批样本的信息增益矩阵更新当前最优特征及所述当前最优特征的特征值之前，所述方法还包括：

获取与所述当前最优特征对应的历史最优特征；

获取所述历史最优特征的特征值；

判断信息增益差值是否小于预设差值阈值；

该可选的实施例中，可以从当前批样本之前的所有批样本对应的信息增益矩阵中获取最大的值对应的特征和所述特征的特征值作为历史最优特征和特征值。当前最优特征的特征值与所述历史最优特征的特征值的信息增益差值大于预设差值阈值，表明当前最优特征的特征值的震荡不稳定，需要对当前最优特征的特征值进行更新；当前最优特征的特征值与所述历史最优特征的特征值的信息增益差值小于预设差值阈值，表明当前最优特征的特征值的震荡较稳定，不需要对当前最优特征的特征值进行更新。

S16，基于所述当前最优特征及所述当前最优特征的特征值迭代训练所述树模型得到留存预测模型。

在一个可选的实施例中，所述基于当前最优特征及所述当前最优特征的特征值迭代训练所述树模型得到留存预测模型包括：

获取所述树模型输出的预测值；

计算所述预测值与对应的样本的真实值之间的预测误差；

判断所述预测误差是否小于预设误差阈值；

该可选的实施例中，对于积累了一定目标标签的新样本，可以使用留存预测模型对新样本进行预测，基于预测值计算预测误差。当预测误差较大(大于预设误差阈值)时，则开启自动更新模式，基于加入了新样本的全量样本重新训练树模型。

应当理解的是，若所述节点为叶子节点，则结束此树分支的学习；若所述节点为非叶子节点，则其子叶节点的学习更新过程重复上述步骤S13至S16，直至整棵树更新完。若当前树不为最后一棵树，则之前所有树输出的和与目标值的残差作为下一棵树的训练目标，重复上述步骤S13至S16，直至树模型训练结束。

在一个可选的实施例中，所述全量样本包括的对象为用户时，可以利用利用本发明所述的方法训练用户分类模型或用户打分模型。所述用户分类模型可以为风险等级预测模型或人群类别预测模型。所述用户打分模型可以为账户安全分数预测模型或用户营销价值预测模型。

在一个可选的实施例中，所述全量样本包括的对象为商品时，可以利用利用本发明所述的方法训练商品分类模型或商品打分模型。所述商品分类模型可以为商品受众预测模型或商品热门等级预测模型。

S17，使用所述留存预测模型基于待测用户的样本数据进行预测得到所述待测用户的留存时长。

将待测用户的样本数据输入所述留存预测模型中进行预测，通过所述留存预测模型输出预测值，所述预测值作为所述待测用户的留存时长。

在一个可选的实施例中，在通过所述留存预测模型预测出所述待测用户的留存时长之后，还可以获取所述待测用户的真实留存时长，并计算预测的留存时长与真实的留存时长之间的预测误差。判断所述预测误差是否小于预设误差阈值，当所述预测误差大于所述预设误差阈值时，将所述待测用户的样本数据作为一个新样本加入所述全量样本中，并重新训练所述留存预测模型。

现有技术中，由于留存预测模型的训练集和预测集有3个月的时间间隔，因此特征分布差异较大，而利用本发明所述的方法可实现实时更新，使得留存预测模型总是在学习最新样本的信息，自启动更新代替了模型逐月迭代的模式，提高了模型预测精度和模型迭代的效率。对于积累了一定目标标签的新样本，可以使用留存预测模型对新样本进行预测，基于预测值计算预测误差。当预测误差较大(大于预设误差阈值)时，则开启自动更新模式，基于加入了新样本的全量样本重新训练树模型以此来更新留存预测模型。

本发明采用批样本的思想，实现了将树模型应用于互联网中进行流式学习的功能，实现了基于流式计算的流式决策树，利用矩阵计算的方式实现特征选择，基于矩阵计算的运算速度较快，从而计算提升了树模型的训练和预测效率；基于批样本的学习思想，不仅可以应对巨量数据的学习场景，还使得训练出的树模型具有非线性学习优点和在线学习功能，从而能够实现在线更新，提高代理人留存预测的准确率。

需要强调的是，为进一步保证上述留存预测模型的私密性和安全性，上述留存预测模型可存储于区块链的节点中。

在一些实施例中，所述基于人工智能的留存预测装置20可以包括多个由计算机程序段所组成的功能模块。所述基于人工智能的留存预测装置20中的各个程序段的计算机程序可以存储于计算机设备的存储器中，并由至少一个处理器所执行，以执行(详见图1描述)基于人工智能的留存预测的功能。

本实施例中，所述基于人工智能的留存预测装置20根据其所执行的功能，可以被划分为多个功能模块。所述功能模块可以包括：分箱处理模块201、布尔计算模块202、第一遗忘模块203、第二遗忘模块204、特征更新模块205、增益计算模块206、模型训练模块207及留存预测模块208。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段，其存储在存储器中。在本实施例中，关于各模块的功能将在后续的实施例中详述。

所述分箱处理模块201，用于对全量样本进行分箱处理得到多个分箱特征值。

在一个可选的实施例中，所述分箱处理模块201对全量样本进行分箱处理得到多个分箱特征值包括：

采用预设分箱数对全量样本进行分箱处理得到多个分裂点；

将所述多个分裂点作为多个分箱特征值。

所述布尔计算模块202，用于从所述全量样本中选取多个批样本，并根据所述多个分箱特征值计算每个批样本的布尔矩阵。

在一个可选的实施例中，所述布尔计算模块202根据所述多个分箱特征值计算每个批样本的布尔矩阵包括：

所述第一遗忘模块203，用于初始化树模型，并采用第一遗忘机制基于当前批样本的样本标识向量更新所述树模型中节点的样本统计量。

在一个可选的实施例中，所述第一遗忘模块203采用第一遗忘机制基于当前批样本的样本标识向量更新所述树模型中节点的样本统计量包括：

判断所述节点是否为根节点；

所述第二遗忘模块204，用于采用第二遗忘机制基于所述当前批样本的样本标识向量及对应的布尔矩阵计算所述当前批样本的信息增益矩阵。

所述特征更新模块205，用于根据所述当前批样本的信息增益矩阵更新当前最优特征及所述当前最优特征的特征值。

所述增益计算模块206，用于在根据所述当前批样本的信息增益矩阵更新当前最优特征及所述当前最优特征的特征值之前，获取与所述当前最优特征对应的历史最优特征；获取所述历史最优特征的特征值；计算所述当前最优特征的特征值与所述历史最优特征的特征值之间的信息增益差值；判断信息增益差值是否小于预设差值阈值。

所述特征更新模块205，还用于当所述信息增益差值小于所述预设差值阈值时，将所述历史最优特征作为所述当前最优特征，所述历史最优特征的特征值作为所述当前最优特征的特征值。

所述模型训练模块207，用于基于所述当前最优特征及所述当前最优特征的特征值迭代训练所述树模型得到留存预测模型。

在一个可选的实施例中，所述模型训练模块207基于当前最优特征及所述当前最优特征的特征值迭代训练所述树模型得到留存预测模型包括：

获取所述树模型输出的预测值；

计算所述预测值与对应的样本的真实值之间的预测误差；

判断所述预测误差是否小于预设误差阈值；

应当理解的是，若所述节点为叶子节点，则结束此树分支的学习；若所述节点为非叶子节点，则其子叶节点的学习更新过程重复上述过程，直至整棵树更新完。若当前树不为最后一棵树，则之前所有树输出的和与目标值的残差作为下一棵树的训练目标，重复上述过程，直至树模型训练结束。

所述留存预测模块208，用于使用所述留存预测模型基于待测用户的样本数据进行预测得到所述待测用户的留存时长。

参阅图3所示，为本发明实施例三提供的计算机设备的结构示意图。在本发明较佳实施例中，所述计算机设备3包括存储器31、至少一个处理器32、至少一条通信总线33及收发器34。

本领域技术人员应该了解，图3示出的计算机设备的结构并不构成本发明实施例的限定，既可以是总线型结构，也可以是星形结构，所述计算机设备3还可以包括比图示更多或更少的其他硬件或者软件，或者不同的部件布置。

在一些实施例中，所述计算机设备3是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的计算机设备，其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。所述计算机设备3还可包括客户设备，所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品，例如，个人计算机、平板电脑、智能手机、数码相机等。

需要说明的是，所述计算机设备3仅为举例，其他现有的或今后可能出现的电子产品如可适应于本发明，也应包含在本发明的保护范围以内，并以引用方式包含于此。

在一些实施例中，所述存储器31中存储有计算机程序，所述计算机程序被所述至少一个处理器32执行时实现如所述的基于人工智能的留存预测方法中的全部或者部分步骤。所述存储器31包括只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable Read-Only Memory，PROM)、可擦除可编程只读存储器(ErasableProgrammable Read-Only Memory，EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory，OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(CompactDisc Read-Only Memory，CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

进一步地，所述计算机可读存储介质可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序等；存储数据区可存储根据区块链节点的使用所创建的数据等。

本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

在一些实施例中，所述至少一个处理器32是所述计算机设备3的控制核心(Control Unit)，利用各种接口和线路连接整个计算机设备3的各个部件，通过运行或执行存储在所述存储器31内的程序或者模块，以及调用存储在所述存储器31内的数据，以执行计算机设备3的各种功能和处理数据。例如，所述至少一个处理器32执行所述存储器中存储的计算机程序时实现本发明实施例中所述的基于人工智能的留存预测方法的全部或者部分步骤；或者实现基于人工智能的留存预测装置的全部或者部分功能。所述至少一个处理器32可以由集成电路组成，例如可以由单个封装的集成电路所组成，也可以是由多个相同功能或不同功能封装的集成电路所组成，包括一个或者多个中央处理器(CentralProcessing unit，CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。

在一些实施例中，所述至少一条通信总线33被设置为实现所述存储器31以及所述至少一个处理器32等之间的连接通信。

尽管未示出，所述计算机设备3还可以包括给各个部件供电的电源(比如电池)，优选的，电源可以通过电源管理装置与所述至少一个处理器32逻辑相连，从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述计算机设备3还可以包括多种传感器、蓝牙模块、Wi-Fi模块等，在此不再赘述。

上述以软件功能模块的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，计算机设备，或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分。

在本发明所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，既可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或，单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

最后应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或等同替换，而不脱离本发明技术方案的精神和范围。

Claims

1.一种基于人工智能的留存预测方法，其特征在于，所述方法包括：

对全量样本进行分箱处理得到多个分箱特征值；

初始化树模型，并采用第一遗忘机制基于当前批样本的样本标识向量更新所述树模型中节点的样本统计量，包括判断所述节点是否为根节点；当所述节点为根节点，设置所述当前批样本的样本标识向量为第一标识向量，其中，所述第一标识向量中的元素值均为1；当所述节点不为根节点时，设置所述当前批样本的样本标识向量为第二标识向量，其中，所述第二标识向量中的元素值包括0和1，1代表所述样本由所述根节点分配给所述节点，0代表所述样本由所述根节点分配给其他节点；确定所述当前批样本之前的每一个批样本相对于所述当前批样本的相对批次，根据所述相对批次与预设第一系数计算所述批次对应的批样本的统计量的第一乘积；根据所述当前批样本的统计量与所述当前批样本之前的每一个批样本对应的第一乘积更新所述当前批样本的统计量；

2.如权利要求1所述的基于人工智能的留存预测方法，其特征在于，所述根据所述多个分箱特征值计算每个批样本的布尔矩阵包括：

3.如权利要求2所述的基于人工智能的留存预测方法，其特征在于，所述预设计算模型为：，其中，X为样本的特征值，A为分箱特征值，T为样本在该特征值下的最小特征值。

4.如权利要求1所述的基于人工智能的留存预测方法，其特征在于，在根据所述当前批样本的信息增益矩阵更新当前最优特征及所述当前最优特征的特征值之前，所述方法还包括：

获取与所述当前最优特征对应的历史最优特征；

获取所述历史最优特征的特征值；

判断信息增益差值是否小于预设差值阈值；

5.如权利要求1至4中任意一项所述的基于人工智能的留存预测方法，其特征在于，所述对全量样本进行分箱处理得到多个分箱特征值包括：

采用预设分箱数对全量样本进行分箱处理得到多个分裂点；

将所述多个分裂点作为多个分箱特征值。

6.如权利要求1至4中任意一项所述的基于人工智能的留存预测方法，其特征在于，所述基于所述当前最优特征及所述当前最优特征的特征值迭代训练所述树模型得到留存预测模型包括：

获取所述树模型输出的预测值；

计算所述预测值与对应的样本的真实值之间的预测误差；

判断所述预测误差是否小于预设误差阈值；

7.一种基于人工智能的留存预测装置，其特征在于，所述装置包括：

第一遗忘模块，用于初始化树模型，并采用第一遗忘机制基于当前批样本的样本标识向量更新所述树模型中节点的样本统计量，包括判断所述节点是否为根节点；当所述节点为根节点，设置所述当前批样本的样本标识向量为第一标识向量，其中，所述第一标识向量中的元素值均为1；当所述节点不为根节点时，设置所述当前批样本的样本标识向量为第二标识向量，其中，所述第二标识向量中的元素值包括0和1，1代表所述样本由所述根节点分配给所述节点，0代表所述样本由所述根节点分配给其他节点；确定所述当前批样本之前的每一个批样本相对于所述当前批样本的相对批次，根据所述相对批次与预设第一系数计算所述批次对应的批样本的统计量的第一乘积；根据所述当前批样本的统计量与所述当前批样本之前的每一个批样本对应的第一乘积更新所述当前批样本的统计量；

8.一种计算机设备，其特征在于，所述计算机设备包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求1至6中任意一项所述的基于人工智能的留存预测方法。

9.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6中任意一项所述的基于人工智能的留存预测方法。