CN110909888A

CN110909888A - 泛型决策树构建方法、装置、设备及可读存储介质

Info

Publication number: CN110909888A
Application number: CN201911177708.3A
Authority: CN
Inventors: 李诗琦; 黄启军; 唐兴兴
Original assignee: WeBank Co Ltd
Current assignee: WeBank Co Ltd
Priority date: 2019-11-25
Filing date: 2019-11-25
Publication date: 2020-03-24

Abstract

本申请公开了一种泛型决策树构建方法、装置、设备和可读存储介质，所述泛型决策树构建方法包括：获取待构建决策树，并判断所述待构建决策树的待拆分节点是否可拆分，若所述待拆分节点可拆分，则获取所述待拆分节点对应的特征变量，并基于预设变量选择规则对所述特征变量进行选择，获得拆分变量，获取所述待拆分节点对应的拆分模型，并基于所述拆分模型对所述拆分变量进行拆分，以生成所述拆分变量对应的孩子节点，若所述待拆分节点不可拆分，则将所述待拆分节点作为所述泛型决策树的叶子节点。本申请解决了决策树模型计算效率低和灵活性差的技术问题。

Description

泛型决策树构建方法、装置、设备及可读存储介质

技术领域

本申请涉及金融科技(Fintech)的人工智能技术领域，尤其涉及一种泛型决策树构建方法、装置、设备及可读存储介质。

背景技术

随着金融科技，尤其是互联网科技金融的不断发展，越来越多的技术(如分布式、区块链Blockchain、人工智能等)应用在金融领域，但金融业也对技术提出了更高的要求，如对金融业对应待办事项的分发也有更高的要求。

随着计算机软件和人工智能的不断发展，机器学习建模的应用也越来越广泛，其中，决策树模型是一种被广泛使用的机器学习模型，目前，常用的决策树模型包括单颗决策树、梯度提升树和随机森林树，其中，单颗决策树模型的节点拆分规则通常是按照某种增益计算方式对所有特征进行计算，取增益最大的那个变量作为拆分规则，常见的规则有gini增益、entropy增益、卡方等，但是所述拆分规则每次拆分仅能使用一个特征，进而导致限制了算法效果，浪费了其他特征计算结果，且其计算规则往往限定于几种公式，缺乏灵活性，而对于梯度提升树和随机森林树，其算法效果好于单棵决策树，但是其计算量远远大于单颗决策树，进而导致其计算量过大，且无法像单颗决策树一样可以针对单个节点进行交互式建模，失去了决策树模型的灵活性，所以，现有技术中存在决策树模型计算效率低和灵活性差的技术问题。

发明内容

本申请的主要目的在于提供一种泛型决策树构建方法、装置、设备和可读存储介质，旨在解决现有技术中决策树模型计算效率低和灵活性差的技术问题。

为实现上述目的，本申请实施例提供一种泛型决策树构建方法，所述泛型决策树构建方法应用于泛型决策树构建设备，所述泛型决策树构建方法包括：

获取待构建决策树，并判断所述待构建决策树的待拆分节点是否可拆分；

若所述待拆分节点可拆分，则获取所述待拆分节点对应的特征变量，并基于预设变量选择规则对所述特征变量进行选择，获得拆分变量；

获取所述待拆分节点对应的拆分模型，并基于所述拆分模型对所述拆分变量进行拆分，以生成所述拆分变量对应的孩子节点；

若所述待拆分节点不可拆分，则将所述待拆分节点作为所述泛型决策树的叶子节点。

可选地，所述拆分模型包括单个训练模型，

所述基于所述拆分模型对所述拆分变量进行拆分，以生成所述拆分变量对应的孩子节点的步骤包括：

将所述拆分变量输入所述单个训练模型，以对所述单个训练模型进行训练，获得第一模型训练结果；

基于所述第一模型训练结果，对所述拆分变量进行拆分，获得拆分结果；

基于所述拆分结果，生成所述拆分变量对应的所述孩子节点。

可选地，所述拆分模型包括多个训练模型，

将所述拆分变量输入各所述训练模型，以对各所述训练模型进行训练，获得第二模型训练结果；

基于各所述第二模型训练结果，筛选各所述训练模型中的最优训练模型；

基于所述最优训练模型对应的最优模型训练结果，对所述拆分变量进行拆分，获得最优拆分结果；

基于所述最优拆分结果，生成所述拆分变量对应的所述孩子节点。

可选地，所述孩子节点包括左孩子节点和右孩子节点，所述拆分变量包括一个或者多个选择特征变量，

所述基于所述最优拆分结果，生成所述待拆分节点对应的所述孩子节点的步骤包括：

基于所述最优拆分结果，判断各所述选择特征变量的类型；

若存在所述选择特征变量属于第一类型变量，则生成所述第一类型变量对应的左孩子节点；

若存在所述选择特征变量属于第二类型变量，则生成所述第二类型变量对应的右孩子节点。

可选地，所述若所述待拆分节点不可拆分，则将所述待拆分节点作为所述泛型决策树的叶子节点的步骤之后包括：

对所述孩子节点进行是否可拆分的判断，以对可拆分的所述孩子节点进行拆分直至所述待构建决策树中的所有节点不可再拆分，获得初始泛型决策树；

对所述初始泛型决策树进行剪枝处理，获得所述泛型决策树。

可选地，所述获取待构建决策树的步骤之后包括：

当检测到用户输入的第一选择指令，选择所述待构建决策树的待进行交互式拆分的选择节点；

判断所述选择节点是否属于叶子节点类型，若所述选择节点不属于所述叶子节点类型，则对所述选择节点进行剪枝处理，以将所述选择节点作为所述待构建决策树的叶子节点；

若所述选择节点属于所述叶子节点类型，则基于所述用户的第二选择指令，对所述选择节点执行相对应的拆分操作，获得拆分结果；

基于所述拆分结果，生成所述选择节点对应的孩子节点。

可选地，所述第二选择指令包括第一类型指令、第二类型指令和第三类型指令，

所述基于所述用户的第二选择指令，选择相对应的拆分操作的步骤包括：

判断所述第二选择指令的类型，若所述第二选择指令为所述第一类型指令，则重新选择所述拆分变量，并对所述拆分模型进行重新训练，以对所述选择节点进行拆分；

若所述第二选择指令为所述第二类型指令，则导入专家规则作为所述拆分模型，并对所述拆分模型进行训练，以对所述选择节点进行拆分；

若所述第二选择指令为所述第三类型指令，则导入训练模型作为所述拆分模型，并对所述拆分模型进行训练，以对所述选择节点进行拆分。

本申请还提供一种泛型决策树构建装置，所述泛型决策树构建装置应用于泛型决策树构建设备，所述泛型决策树构建装置包括：

第一判断模块，用于所述获取待构建决策树，并判断所述待构建决策树的待拆分节点是否可拆分；

变量选择模块，用于所述若所述待拆分节点可拆分，则获取所述待拆分节点对应的特征变量，并基于预设变量选择规则对所述特征变量进行选择，获得拆分变量；

拆分模块，用于所述获取所述待拆分节点对应的拆分模型，并基于所述拆分模型对所述拆分变量进行拆分，以生成所述拆分变量对应的孩子节点；

第二判断模块，用于所述若所述待拆分节点不可拆分，则将所述待拆分节点作为所述泛型决策树的叶子节点。

可选地，所述拆分模块包括：

第一训练单元，用于所述将所述拆分变量输入所述单个训练模型，以对所述单个训练模型进行训练，获得第一模型训练结果；

第一拆分单元，用于所述基于所述第一模型训练结果，对所述拆分变量进行拆分，获得拆分结果；

第一判断单元，用于所述基于所述拆分结果，生成所述拆分变量对应的所述孩子节点。

可选地，所述拆分模块还包括：

第二训练单元，用于所述将所述拆分变量输入各所述训练模型，以对各所述训练模型进行训练，获得第二模型训练结果；

筛选单元，用于所述基于各所述第二模型训练结果，筛选各所述训练模型中的最优训练模型；

第二拆分单元，用于所述基于所述最优训练模型对应的最优模型训练结果，对所述拆分变量进行拆分，获得最优拆分结果；

生成单元，用于所述基于所述最优拆分结果，生成所述拆分变量对应的所述孩子节点。

可选地，所述第二拆分单元包括：

判断子单元，用于所述基于所述最优拆分结果，判断各所述选择特征变量的类型；

第一生成子单元，用于所述若存在所述选择特征变量属于第一类型变量，则生成所述第一类型变量对应的左孩子节点；

第二生成子单元，用于所述若存在所述选择特征变量属于第二类型变量，则生成所述第二类型变量对应的右孩子节点。

可选地，所述泛型决策树构建装置还包括：

获取模块，用于所述对所述孩子节点进行是否可拆分的判断，以对可拆分的所述孩子节点进行拆分直至所述待构建决策树中的所有节点不可再拆分，获得初始泛型决策树；

剪枝模块，用于所述对所述初始泛型决策树进行剪枝处理，获得所述泛型决策树。

可选地，所述泛型决策树构建装置还包括：

选择模块，用于所述当检测到用户输入的第一选择指令，选择所述待构建决策树的待进行交互式拆分的选择节点；

第三判断模块，用于所述判断所述选择节点是否属于叶子节点类型，若所述选择节点不属于所述叶子节点类型，则对所述选择节点进行剪枝处理，以将所述选择节点作为所述待构建决策树的叶子节点；

第四判断模块，用于所述若所述选择节点属于所述叶子节点类型，则基于所述用户的第二选择指令，对所述选择节点执行相对应的拆分操作，获得拆分结果；

生成模块，用于所述基于所述拆分结果，生成所述选择节点对应的孩子节点。

可选地，所述第四判断模块还包括：

第一拆分单元，用于所述判断所述第二选择指令的类型，若所述第二选择指令为所述第一类型指令，则重新选择所述拆分变量，并对所述拆分模型进行重新训练，以对所述选择节点进行拆分；

第二拆分单元，用于所述若所述第二选择指令为所述第二类型指令，则导入专家规则作为所述拆分模型，并对所述拆分模型进行训练，以对所述选择节点进行拆分；

第三拆分单元，用于所述若所述第二选择指令为所述第三类型指令，则导入训练模型作为所述拆分模型，并对所述拆分模型进行训练，以对所述选择节点进行拆分。

本申请还提供一种泛型决策树构建设备，所述泛型决策树构建设备包括：存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的所述泛型决策树构建方法的程序，所述泛型决策树构建方法的程序被处理器执行时可实现如上述的泛型决策树构建方法的步骤。

本申请还提供一种可读存储介质，所述可读存储介质上存储有实现泛型决策树构建方法的程序，所述泛型决策树构建方法的程序被处理器执行时实现如上述的泛型决策树构建方法的步骤。

本申请通过获取待构建决策树，并判断所述待构建决策树的待拆分节点是否可拆分，进而若所述待拆分节点可拆分，则获取所述待拆分节点对应的特征变量，并基于预设变量选择规则对所述特征变量进行选择，获得拆分变量，进而获取所述待拆分节点对应的拆分模型，并基于所述拆分模型对所述拆分变量进行拆分，以生成所述拆分变量对应的孩子节点，进一步地，若所述待拆分节点不可拆分，则将所述待拆分节点作为所述泛型决策树的叶子节点。也即，本申请提供了一种泛型决策树的构建方法，若所述待拆分节点可拆分，则通过获取所述待拆分节点对应的特征变量，并基于预设变量选择规则对所述特征变量进行选择，获得拆分变量，进而基于所述拆分模型对所述拆分变量进行拆分，以生成所述拆分变量对应的孩子节点，进而以对决策模型树的拆分规则进行泛化，其中，所述拆分模型并不限定与机器学习模型，也即，所述拆分模型可为神经网络、人工规则、逻辑回归等多种拆分规则模型，所以，所述本申请中的泛型决策树具有泛型的效果，若所述待拆分节点不可拆分，则将所述待拆分节点作为所述泛型决策树的叶子节点，进而获得所述泛型决策树的叶子节点和孩子节点，且本申请中的拆分变量并不限定于单个拆分变量，可实现同时对多个拆分变量进行拆分，提高了决策树模型的灵活性，所以，本申请中泛型决策树达到了提高算法效果的目的，避免了决策树模型在每次拆分时节点仅能使用一个特征和其计算规则往往限定于几种公式的情况发生，且本申请中决策树模型计算仅仅需要一颗决策树即可，减少了计算量，提高了决策树模型的计算效率，所以，本申请解决了现有技术中决策树模型计算效率低和灵活性差的技术问题。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请泛型决策树构建方法第一实施例的流程示意图；

图2为本申请泛型决策树构建方法中对所述泛型决策树的某个节点进行拆分的示意图；

图3为本申请泛型决策树构建方法第二实施例的流程示意图；

图4为本申请泛型决策树构建方法中第二实施例结合第一实施例进行泛型决策树构建的流程示意图；

图5为本申请泛型决策树构建方法第三实施例的流程示意图；

图6为本申请泛型决策树构建方法中泛型决策树交互式构建的流程示意图；

图7为本申请实施例方案涉及的硬件运行环境的设备结构示意图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请实施例提供一种泛型决策树构建方法，所述泛型决策树构建方法应用于泛型决策树构建设备，在本申请泛型决策树构建方法的第一实施例中，参照图1，所述泛型决策树构建方法包括：

步骤S10，获取待构建决策树，并判断所述待构建决策树的待拆分节点是否可拆分；

在本实施例中，需要说明的是，所述待构建决策树包括只有一个根节点的决策树和已经进行过一定次数的拆分的决策树，其中，所述一定次数包括一次或者多次，且进行过一定次数的拆分的决策树包括多个待拆分节点，其中，若所述待构建决策树存在已经进行过拆分且具有孩子节点的待拆分节点，则由用户或者建模人员选择是否删除所述待拆分节点的孩子节点，以对所述待拆分节点进行重新拆分，所述泛型决策树指的是将拆分规则泛化的决策树模型，所述拆分规则包括单个变量的取值划分、机器学习模型和人工规则等，且所述泛型决策树的每个节点进行拆分时使用的拆分模型可以不统一，例如有的节点可以使用神经网络，有的节点使用逻辑回归，有点则使用人工规则等，也即，所述泛型决策树为一种多模型或专家规则融合在一棵树当中的决策树模型，如图2所示为对所述泛型决策树的某个节点进行拆分的示意图，其中，所述“拆分模型”为拆分规则，所述父节点为待拆分节点，所述孩子节点为对所述父节点进行拆分而获得的节点。

获取待构建决策树，并判断所述待构建决策树的待拆分节点是否可拆分，具体地，获取待构建决策树，并判断所述待构建决策树的待拆分节点是否达到预设条件，若所述待拆分节点达到了预设条件，则所述拆分节点不可拆分，若所述待拆分节点未达到预设条件，则所述拆分节点可拆分，其中，所述预设条件包括所述拆分节点中的拆分变量全部属于同一规则变量、其他人工设定规则等条件，其中，所述人工设定规则包括最小样本数、最小类别数等。

步骤S20，若所述待拆分节点可拆分，则获取所述待拆分节点对应的特征变量，并基于预设变量选择规则对所述特征变量进行选择，获得拆分变量；

在本实施例中，需要说明的是，所述特征变量与所述待拆分节点相关联，例如，所述特征变量可存储于所述待拆分节点中或者所述特征变量的存储地址存储于所述待拆分节点中，所述拆分变量指的是所述待拆分节点本次拆分所需的特征变量，其中，所述特征变量中包括一个或者多个变量。

若所述待拆分节点可拆分，则获取所述待拆分节点对应的特征变量，并基于预设变量选择规则对所述特征变量进行选择，获得拆分变量，具体地，若所述待拆分节点可拆分，则提取所述待拆分节点对应的特征变量，并基于预设变量选择规则在所述特征变量中选取变量作为所述拆分变量，其中，所述预设变量选择规则可由用户或者建模人员自行设定，例如，设定所述特征变量的取值范围等。

步骤S30，获取所述待拆分节点对应的拆分模型，并基于所述拆分模型对所述拆分变量进行拆分，以生成所述拆分变量对应的孩子节点；

在本实施例中，需要说明的是，所述拆分模型包括一个或者多个训练模型，所述训练模型包括神经网络模型、逻辑回归模型和人工规则等模型，且所述拆分模型可使用预设的固定模型，也可进行随机选择。

获取所述待拆分节点对应的拆分模型，并基于所述拆分模型对所述拆分变量进行拆分，以生成所述拆分变量对应的孩子节点，具体地，获取所述待拆分节点对应的拆分模型，并将所述拆分变量输入所述拆分模型进行训练，获得模型训练结果，并基于所述模型训练结果，对所述拆分变量进行拆分，以生成所述孩子节点，例如，假设，所述拆分模型为样本分类模型，所述拆分变量为客户的样本数据，所述孩子节点包括左孩子节点和右孩子节点，其中，所述客户分为第一类用户和第二类用户，进而将所述拆分变量输入所述样本分类模型进行训练，以对客户进行分类，以判断各所述客户是第一类用户还是第二类用户，也即，对所述拆分变量进行拆分，将属于第一类用户对应的拆分变量归为A类拆分变量，将属于第二类用户对应的拆分变量归为B类拆分变量，进而对应所述A类拆分变量生成左孩子节点，对应B类拆分变量生成右孩子节点。

其中，在步骤S30中，所述拆分模型包括单个训练模型，

步骤S31，将所述拆分变量输入所述单个训练模型，以对所述单个训练模型进行训练，获得第一模型训练结果；

在本实施例中，需要说明的是，需要说明的是，所述单个训练模型包括神经网络模型、逻辑回归模型和人工规则等，所述第一模型训练结果包括对所述拆分变量进行拆分的拆分参数。

步骤S32，基于所述第一模型训练结果，对所述拆分变量进行拆分，获得拆分结果；

在本实施例中，基于所述第一模型训练结果，对所述拆分变量进行拆分，获得拆分结果，具体地，基于所述第一模型训练结果中的拆分参数，对所述拆分变量进行拆分，获得拆分结果，其中，所述拆分结果即为对所述拆分变量进行分类的分类结果，例如，假设所述拆分模型为样本分类模型，所述拆分变量为客户的样本数据，其中，所述客户分为第一类用户和第二类用户，进而将所述拆分变量输入所述样本分类模型进行训练，以对每一样本数据进行分类，以判断各所述样本数据是属于第一类用户还是第二类用户，也即，对所述拆分变量进行拆分，将属于第一类用户对应的拆分变量归为A类拆分变量，将属于第二类用户对应的拆分变量归为B类拆分变量，则所述A类拆分变量和所述B类拆分变量即为所述拆分结果。

步骤S33，基于所述拆分结果，生成所述拆分变量对应的所述孩子节点。

在本实施例中，需要说明的是，所述孩子节点包括左孩子节点和右孩子节点，所述拆分变量包括第一类型拆分变量和第二类型拆分变量。

基于所述拆分结果，生成所述拆分变量对应的所述孩子节点，具体地，基于所述拆分结果中对所述拆分变量的分类，获得第一类型拆分变量和第二类型拆分变量，并基于所述第一类型拆分变量，生成相对应的左孩子节点，基于所述第二类型拆分变量，生成相对应的右孩子节点。

步骤S40，若所述待拆分节点不可拆分，则将所述待拆分节点作为所述泛型决策树的叶子节点。

在本实施例中，若所述待拆分节点不可拆分，则将所述待拆分节点作为所述泛型决策树的叶子节点，具体地，若所述拆分节点达到预设条件，则所述拆分节点不可拆分，其中，所述预设条件包括所述拆分节点中的拆分变量全部属于同一规则变量、其他人工设定规则等条件，其中，所述人工设定规则包括最小样本数、最小类别数等，进而直接将所述待拆分节点作为所述泛型决策树的叶子节点，其中，所述叶子节点指的是决策树中没有孩子节点的节点。

其中，所述若所述待拆分节点不可拆分，则将所述待拆分节点作为所述泛型决策树的叶子节点的步骤之后包括：

步骤S50，对所述孩子节点进行是否可拆分的判断，以对可拆分的所述孩子节点进行拆分直至所述待构建决策树中的所有节点不可再拆分，获得初始泛型决策树；

在本实施例中，对所述孩子节点进行是否可拆分的判断，以对可拆分的所述孩子节点进行拆分直至所述待构建决策树中的所有节点不可再拆分，获得初始泛型决策树，具体地，将所述孩子节点作为待拆分节点，对所述孩子节点进行步骤S10至步骤S40的过程，直至所述待构建决策树中的所有节点均不可再拆分，获得初始泛型决策树。

步骤S60，对所述初始泛型决策树进行剪枝处理，获得所述泛型决策树。

在本实施例中，需要说明的是，由于所述泛型决策树在生成过程中可能存在数据过拟合现象，例如拆分变量中的噪音或孤立点使得待拆分节点的拆分反映拆分变量异常，从而会降低利用所述泛型决策树进行分类的准确性，因此，需要采用预设决策树剪枝算法检测和去除异常节点分枝，其中，例如可采用CART算法的后剪枝方法在已构建的泛型决策树模型基础上，通过删除节点分支来剪去树节点。

对所述初始泛型决策树进行剪枝处理，获得所述泛型决策树，具体地，通过预设决策树剪枝算法检测并去除拆分变量异常的节点对应的决策树分枝，获得所述泛型决策树。

本实施例通过获取待构建决策树，并判断所述待构建决策树的待拆分节点是否可拆分，进而若所述待拆分节点可拆分，则获取所述待拆分节点对应的特征变量，并基于预设变量选择规则对所述特征变量进行选择，获得拆分变量，进而获取所述待拆分节点对应的拆分模型，并基于所述拆分模型对所述拆分变量进行拆分，以生成所述拆分变量对应的孩子节点，进一步地，若所述待拆分节点不可拆分，则将所述待拆分节点作为所述泛型决策树的叶子节点。也即，本实施例提供了一种泛型决策树的构建方法，若所述待拆分节点可拆分，则通过获取所述待拆分节点对应的特征变量，并基于预设变量选择规则对所述特征变量进行选择，获得拆分变量，进而基于所述拆分模型对所述拆分变量进行拆分，以生成所述拆分变量对应的孩子节点，进而以对决策模型树的拆分规则进行泛化，其中，所述拆分模型并不限定与机器学习模型，也即，所述拆分模型可为神经网络、人工规则、逻辑回归等多种拆分规则模型，所以，所述本实施例中的泛型决策树具有泛型的效果，若所述待拆分节点不可拆分，则将所述待拆分节点作为所述泛型决策树的叶子节点，进而获得所述泛型决策树的叶子节点和孩子节点，且本实施例中的拆分变量并不限定于单个拆分变量，可实现同时对多个拆分变量进行拆分，提高了决策树模型的灵活性，所以，本实施例中泛型决策树达到了提高算法效果的目的，避免了决策树模型在每次拆分时节点仅能使用一个特征和其计算规则往往限定于几种公式的情况发生，且本实施例中决策树模型计算仅仅需要一颗决策树即可，减少了计算量，提高了决策树模型的计算效率，所以，本实施例解决了现有技术中决策树模型计算效率低和灵活性差的技术问题。

进一步地，参照图3，基于本申请中第一实施例，在泛型决策树构建方法的另一实施例中，所述拆分模型包括多个训练模型，

步骤A10，将所述拆分变量输入各所述训练模型，以对各所述训练模型进行训练，获得第二模型训练结果；

在本实施例中，需要说明的是，所述训练模型包括神经网络模型、逻辑回归模型和人工规则等。

步骤A20，基于各所述第二模型训练结果，筛选各所述训练模型中的最优训练模型；

在本实施例中，基于各所述第二模型训练结果，筛选各所述训练模型中的最优训练模型，具体地，计算各所述第二模型训练结果与各所述第二模型训练结果相对应的实际观察值之间的模型误差，并挑选出模型误差最小的训练模型作为所述最优训练模型。

步骤A30，基于所述最优训练模型对应的最优模型训练结果，对所述拆分变量进行拆分，获得最优拆分结果；

在本实施例中，基于所述最优训练模型对应的最优模型训练结果，对所述拆分变量进行拆分，获得最优拆分结果，具体地，基于所述最优训练模型对应的最优模型训练结果，对所述拆分变量进行拆分，获得最优拆分结果，其中，所述最优拆分结果即为对所述拆分变量进行分类的最优分类结果，例如，假设所述最优拆分模型为图像分类模型，所述拆分变量为多张输入图像，进而将所述拆分变量输入所述图像分类模型进行训练，以对所述输入图像进行识别和分类，以判断所述输入图像是否属于网页图像，也即，对所述拆分变量进行拆分，将属于网页图像的输入图像归为A类拆分变量，将不属于网页图像对应的拆分变量归为B类拆分变量，则所述A类拆分变量和所述B类拆分变量即为所述最优拆分结果。

步骤A40，基于所述最优拆分结果，生成所述拆分变量对应的所述孩子节点。

基于所述最优拆分结果，生成所述拆分变量对应的所述孩子节点，具体地，基于所述最优拆分结果中对所述拆分变量的最优分类结果，获取第一类型拆分变量和第二类型拆分变量，并基于所述第一类型拆分变量，生成相对应的左孩子节点，基于所述第二类型拆分变量，生成相对应的右孩子节点，如图4所示为本实施例结合第一实施例的泛型决策树构建方法的流程示意图。

其中，所述孩子节点包括左孩子节点和右孩子节点，所述拆分变量包括一个或者多个选择特征变量，

步骤A41，基于所述最优拆分结果，判断各所述选择特征变量的类型；

在本实施例中，需要说明的是，所述孩子节点包括左孩子节点和右孩子节点，所述拆分变量包括一个或者多个选择特征变量。

基于所述最优拆分结果，判断各所述选择特征变量的类型，具体地，基于所述最优拆分结果中的拆分参数，判断各所述选择特征变量的类型，其中，所述拆分参数包括模型误差、模型预测结果等，例如，假设所述选择特征变量包括用于进行银行客户分类的样本分类模型训练和用于图像分类模型训练的变量，若所述拆分模型为图像分类模型，则将所述选择特征变量输入所述图像分类模型中进行模型训练，获得模型训练结果及训练误差，则将训练误差在预设范围内的变量划分为所述用于进行图像分类模型训练的变量，将训练误差不在预设范围内的变量划分为所述用于进行样本分类模型训练的变量，进一步地，对于所述用于进行样本分类模型训练的变量和所述用于进行图像分类模型训练的变量在泛型决策树的下一节点还可使用其他拆分模型继续进行拆分。

步骤A42，若存在所述选择特征变量属于第一类型变量，则生成所述第一类型变量对应的左孩子节点；

在本实施例中，需要说明的是所述选择特征变量包括所述第一类型变量和所述第二类型变量表明所述选择特征变量存在不同类且可进行拆分的两种类型变量。

若存在所述选择特征变量属于第一类型变量，则生成所述第一类型变量对应的左孩子节点，具体地，若存在所述选择特征变量属于第一类型变量，则生成所述第一类型变量对应的左孩子节点，并将所述第一类型变量存储于所述左孩子节点或者将所述第一类型变量的存储地址存储于所述左孩子节点。

步骤A43，若存在所述选择特征变量属于第二类型变量，则生成所述第二类型变量对应的右孩子节点。

在本实施例中，若存在所述选择特征变量属于第二类型变量，则生成所述第二类型变量对应的右孩子节点，具体地，若存在所述选择特征变量属于第二类型变量，则生成所述第二类型变量对应的右孩子节点，并将所述第二类型变量存储于所述右孩子节点或者将所述第二类型变量的存储地址存储于所述右孩子节点。

本实施例通过将所述拆分变量输入各所述训练模型，以对各所述训练模型进行训练，获得第二模型训练结果，进而基于各所述第二模型训练结果，筛选各所述训练模型中的最优训练模型，进而基于所述最优训练模型对应的最优模型训练结果，对所述拆分变量进行拆分，获得最优拆分结果，进而基于所述最优拆分结果，生成所述拆分变量对应的所述孩子节点。也即，本实施例提供了一种基于多个拆分模型的泛型决策树的孩子节点的获取方法，以将所述拆分变量输入各所述训练模型，以对各所述训练模型进行训练，获得第二模型训练结果，进而基于各所述第二模型训练结果，筛选各所述训练模型中的最优训练模型，也即，首先进行最优训练模型的获取，进而基于所述最优训练模型的最优训练结果，对所述拆分变量进行分类，以生成所述孩子节点，所以，本实施例通过筛选最优训练模型对所述拆分变量进行拆分，达到了比单个训练模型更优的拆分效果，实现了对所述拆分变量的最优拆分，进而提高了拆分效率，避免了由于训练模型存在误差而导致拆分变量数据异常的情况发生，所以，为解决现有技术中决策树模型计算效率低和灵活性差的技术问题奠定了基础。

进一步地，参照图5，基于本申请中第一实施例和第二实施例，在泛型决策树构建方法的另一实施例中，所述获取待构建决策树的步骤之后包括：

步骤B10，当检测到用户输入的第一选择指令，选择所述待构建决策树的待进行交互式拆分的选择节点；

在本实施例中，需要说明的是，所述第一选择指令包括鼠标输入指令、键盘输入指令等指令。

当检测到用户输入的第一选择指令，选择所述待构建决策树的待进行交互式拆分的选择节点，具体地，基于用户输入的第一选择指令，在所述待构建决策树中选择所述第一选择指令对应的待进行交互式拆分的选择节点。

步骤B20，判断所述选择节点是否属于叶子节点类型，若所述选择节点不属于所述叶子节点类型，则对所述选择节点进行剪枝处理，以将所述选择节点作为所述待构建决策树的叶子节点；

在本实施例中，判断所述选择节点是否属于叶子节点类型，若所述选择节点不属于所述叶子节点类型，则对所述选择节点进行剪枝处理，以将所述选择节点作为所述待构建决策树的叶子节点，具体地，判断所述选择节点是否具备叶子节点属性，也即，判断所述选择节点是否具有孩子节点，进而若所述选择节点不属于所述叶子节点类型，则对所述选择节点进行剪枝处理，以将所述选择节点的孩子节点所在分枝删除，进而将所述选择节点转化为所述待构建决策树的叶子节点，以将所述选择节点作为待拆分节点等待进行相对应的拆分操作。

步骤B30，若所述选择节点属于所述叶子节点类型，则基于所述用户的第二选择指令，对所述选择节点执行相对应的拆分操作，获得拆分结果；

在本实施例中，需要说明的是，所述拆分操作指的对所述拆分变量进行分类的操作。

若所述选择节点属于所述叶子节点类型，则基于所述用户的第二选择指令，对所述选择节点执行相对应的拆分操作，获得拆分结果，具体地，若所述节点属于所述叶子节点类型，则将所述选择节点作为待拆分节点，并基于所述用户的第二选择指令，选择所述第二选择指令对应的拆分操作，以基于所述拆分操作对所述拆分变量进行拆分，获得拆分结果。

其中，在步骤B30中，所述第二选择指令包括第一类型指令、第二类型指令和第三类型指令，

步骤B31，判断所述第二选择指令的类型，若所述第二选择指令为所述第一类型指令，则重新选择所述拆分变量，并对所述拆分模型进行重新训练，以对所述选择节点进行拆分；

在本实施例中，需要说明的是，所述第一类型指令对应的拆分操作为重新选择所述拆分变量，并对所述拆分模型进行重新训练。

判断所述第二选择指令的类型，若所述第二选择指令为所述第一类型指令，则重新选择所述拆分变量，并对所述拆分模型进行重新训练，以对所述选择节点进行拆分，具体地，判断所述第二选择指令的类型，若所述第二选择指令为所述第一类型指令，则基于所述第一类型指令，重新选择所述拆分变量，并将所述拆分变量输入所述拆分模型中进行重新训练，获得模型训练结果，进而基于所述模型训练结果，对所述选择节点进行拆分，也即，对所述拆分变量进行分类。

步骤B32，若所述第二选择指令为所述第二类型指令，则导入专家规则作为所述拆分模型，并对所述拆分模型进行训练，以对所述选择节点进行拆分；

在本实施例中，需要说明的是，所述第二类型指令对应的拆分操作为导入专家规则作为所述拆分模型，并对所述拆分模型进行训练，其中，导入专家规则的方式包括以SQL(Structured Query Language，结构化查询语言)的方式导入，所述专家规则属于人工规则。

若所述第二选择指令为所述第二类型指令，则导入专家规则作为所述拆分模型，并对所述拆分模型进行训练，以对所述选择节点进行拆分，具体地，若所述第二选择指令为所述第二类型指令，则导入专家规则作为所述拆分模型，并将所述拆分变量输入所述拆分模型中进行重新训练，获得模型训练结果，进而基于所述模型训练结果，对所述选择节点进行拆分，也即，对所述拆分变量进行分类。

步骤B33，若所述第二选择指令为所述第三类型指令，则导入训练模型作为所述拆分模型，并对所述拆分模型进行训练，以对所述选择节点进行拆分。

在本实施例中，所述第三类型指令对应的拆分操作为导入训练模型作为所述拆分模型，并对所述拆分模型进行训练，所述训练模型包括已经训练好的机器学习模型。

若所述第二选择指令为所述第三类型指令，则导入训练模型作为所述拆分模型，并对所述拆分模型进行训练，以对所述选择节点进行拆分，具体地，若所述第二选择指令为所述第三类型指令，则导入训练模型作为所述拆分模型，并将所述拆分变量输入所述拆分模型中进行重新训练，获得模型训练结果，进而基于所述模型训练结果，对所述选择节点进行拆分，也即，对所述拆分变量进行分类。

步骤B40，基于所述拆分结果，生成所述选择节点对应的孩子节点。

基于所述拆分结果，生成所述选择节点对应的孩子节点，具体地，基于所述拆分结果中对所述拆分变量的分类结果，获取第一类型拆分变量和第二类型拆分变量，并基于所述第一类型拆分变量，生成相对应的左孩子节点，基于所述第二类型拆分变量，生成相对应的右孩子节点，如图6所示为本实施例中泛型决策树交互式构建的流程示意图。

本实施例通过当检测到用户输入的第一选择指令，选择所述待构建决策树的待进行交互式拆分的选择节点，进而判断所述选择节点是否属于叶子节点类型，若所述选择节点不属于所述叶子节点类型，则对所述选择节点进行剪枝处理，以将所述选择节点作为所述待构建决策树的叶子节点，若所述选择节点属于所述叶子节点类型，则基于所述用户的第二选择指令，对所述选择节点执行相对应的拆分操作，获得拆分结果，进而基于所述拆分结果，生成所述选择节点对应的孩子节点。也即，本实施例提供了一种基于人机交互构建泛型决策树的方法，以当检测到用户输入的第一选择指令，选择所述待构建决策树的待进行交互式拆分的选择节点，进而进行所述选择节点是否为叶子节点的判断，若所述选择节点不为所述叶子节点，则进行对所述选择节点的剪枝处理，以将所述选择节点转化为所述待构建决策树的所述叶子节点，若所述节点为所述叶子节点，则基于所述用户的第二选择指令，进行相对应的拆分操作的选择，其中，所述拆分操作包括重新选择拆分变量并重新进行拆分模型的训练、导入专家规则作为拆分模型以进行拆分模型的训练和导致已经训练好的机器学习模型作为拆分模型以进行拆分模型的训练等，所以，本实施例实现了将拆分规则的泛化的目的，进而极大程度上提高了所述泛化决策树的灵活性，并且可通过人机交互的方式选择最合适的拆分模型对所述拆分变量进行拆分，避免了计算资源的浪费，提高了所述泛型决策树的计算效率，进一步地，进而基于所述拆分结果，生成所述选择节点对应的孩子节点，进而为构建所述泛型决策树奠定了基础，所以，本实施例为解决现有技术中决策树模型计算效率低和灵活性差的技术问题奠定了基础。

参照图7，图7是本申请实施例方案涉及的硬件运行环境的设备结构示意图。

如图7所示，该泛型决策树构建设备可以包括：处理器1001，例如CPU，存储器1005，通信总线1002。其中，通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。

可选地，该泛型决策树构建设备还可以包括矩形用户接口、网络接口、摄像头、RF(Radio Frequency，射频)电路，传感器、音频电路、WiFi模块等等。矩形用户接口可以包括显示屏(Display)、输入子模块比如键盘(Keyboard)，可选矩形用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。

本领域技术人员可以理解，图7中示出的泛型决策树构建设备结构并不构成对泛型决策树构建设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图7所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及泛型决策树构建程序。操作系统是管理和控制泛型决策树构建设备硬件和软件资源的程序，支持泛型决策树构建程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信，以及与泛型决策树构建系统中其它硬件和软件之间通信。

在图7所示的泛型决策树构建设备中，处理器1001用于执行存储器1005中存储的泛型决策树构建程序，实现上述任一项所述的泛型决策树构建方法的步骤。

本申请泛型决策树构建设备具体实施方式与上述泛型决策树构建方法各实施例基本相同，在此不再赘述。

本申请实施例还提供一种泛型决策树构建装置，所述泛型决策树构建装置包括：

可选地，所述拆分模块包括：

可选地，所述拆分模块还包括：

可选地，所述第二拆分单元包括：

可选地，所述泛型决策树构建装置还包括：

可选地，所述第四判断模块还包括：

本申请泛型决策树构建装置的具体实施方式与上述泛型决策树构建方法各实施例基本相同，在此不再赘述。

本申请实施例提供了一种可读存储介质，所述可读存储介质存储有一个或者一个以上程序，所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的泛型决策树构建方法的步骤。

本申请可读存储介质具体实施方式与上述泛型决策树构建方法各实施例基本相同，在此不再赘述。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利处理范围内。

Claims

1.一种泛型决策树构建方法，其特征在于，所述泛型决策树构建方法包括：

2.如权利要求1所述泛型决策树构建方法，其特征在于，所述拆分模型包括单个训练模型，

3.如权利要求1所述泛型决策树构建方法，其特征在于，所述拆分模型包括多个训练模型，

4.如权利要求3所述泛型决策树构建方法，其特征在于，所述孩子节点包括左孩子节点和右孩子节点，所述拆分变量包括一个或者多个选择特征变量，

基于所述最优拆分结果，判断各所述选择特征变量的类型；

5.如权利要求1所述泛型决策树构建方法，其特征在于，所述若所述待拆分节点不可拆分，则将所述待拆分节点作为所述泛型决策树的叶子节点的步骤之后包括：

6.如权利要求1所述泛型决策树构建方法，其特征在于，所述获取待构建决策树的步骤之后包括：

基于所述拆分结果，生成所述选择节点对应的孩子节点。

7.如权利要求6所述泛型决策树构建方法，其特征在于，所述第二选择指令包括第一类型指令、第二类型指令和第三类型指令，

8.一种泛型决策树构建装置，其特征在于，所述泛型决策树构建装置应用于泛型决策树构建设备，所述泛型决策树构建装置包括：

9.一种泛型决策树构建设备，其特征在于，所述泛型决策树构建设备包括：存储器、处理器以及存储在存储器上的用于实现所述泛型决策树构建方法的程序，

所述存储器用于存储实现泛型决策树构建方法的程序；

所述处理器用于执行实现所述泛型决策树构建方法的程序，以实现如权利要求1至7中任一项所述泛型决策树构建方法的步骤。

10.一种可读存储介质，其特征在于，所述可读存储介质上存储有实现泛型决策树构建方法的程序，所述实现泛型决策树构建方法的程序被处理器执行以实现如权利要求1至7中任一项所述泛型决策树构建方法的步骤。