CN111476372A

CN111476372A - 一种机器学习模型结果的内在解释方法

Info

Publication number: CN111476372A
Application number: CN202010270477.7A
Authority: CN
Inventors: 孙兆悦
Original assignee: Shenzhen Suoxinda Data Technology Co ltd
Current assignee: Shenzhen Suoxinda Data Technology Co ltd
Priority date: 2020-04-08
Filing date: 2020-04-08
Publication date: 2020-07-31

Abstract

一种机器学习模型结果的内在解释方法，涉及数据分析领域，解决现有机器学习模型本身缺乏解释性的问题，包括以下步骤：S1，对输入的数据进行清洗和预处理；对输入的数据进行一致性检查，删除错误数据和无效数据，并进行缺失值填充；将分类变量转化为数值型变量；S2，对输入的数据进行内在可解释神经网络模型建模；S3，获取模型的全局解释和局部解释；S4，根据全局解释和局部解释，判断模型预测结果是否与实际业务相符，从而达到解释机器学习模型结果的目的；同时结合模型精准度指标，进一步提升模型的预测准确程度。解决了现有机器学习模型无法对预测结果解释的问题。

Description

一种机器学习模型结果的内在解释方法

技术领域

本发明涉及数据分析领域，具体涉及模型搭建以及对模型预测结果的解释和分析。

背景技术

数据分析过程中最重要的环节之一是建立高精度模型进行预测。随着人工智能领域的不断发展，业界和学界普遍开始采用机器学习模型来提升预测精度。然而，机器学习模型往往由于内部结构复杂，无法对输出结果给出明确计算路径和过程，不能反映出特征变量与结果之间的逻辑关系，从而导致预测结果不可解释，影响预测的可信度和准确性。同时，由于模型透明性被限制，人类无法依赖模型做出准确决策与判断。

发明内容

本发明的目的是针对现有机器学习模型本身缺乏解释性的问题，提出一种新的内在解释法来提升模型的可解释性。该方法通过构建广义线性模型和神经网络模型，实现了对模型预测结果的全局解释和局部解释，能够反映出特征变量对样本总体以及单个样本个体的影响，从而提升了模型的透明度和可信度。

为了解决本发明所提出的问题，采用的技术方案为：一种机器学习模型结果的内在解释方法，其特征在于：包括以下步骤：

S1，对输入的数据进行清洗和预处理；对输入的数据进行一致性检查，删除错误数据和无效数据，并进行缺失值填充；将分类变量转化为数值型变量；

S2，对输入的数据进行内在可解释神经网络模型建模；

S3，获取模型的全局解释和局部解释；

S4，根据全局解释和局部解释，判断模型预测结果是否与实际业务相符，从而达到解释机器学习模型结果的目的；同时结合模型精准度指标，进一步提升模型的预测准确程度。

作为本发明进一步限定的技术方案有：

所述步骤S2包括以下步骤：

1)搭建一个内在可解释神经网络模型：模型表达式为：f(x)＝μ+β₁h₁(x₁)+β₂h₂(x₂)+…+β_ph_p(x_p)。其中{x₁,x₂,x₃,…,x_p}表示共有p个特征变量输入模型；h_i(x_i)表示岭回归函数，每个岭回归函数通过一个子神经网络训练而成；μ表示模型的常数项，{β₁,β₂,β₃,…,β_p}表示岭回归函数对应的系数大小。

2)将p维样本数据集X＝[X₁,X₂,X₃,....,X_p]输入内在可解释神经网络模型中进行训练，其中每一个特征变量z_i分别进入一个子神经网络训练得出岭回归函数h_i(x_i)，同时计算出模型中涉及到的参数，包括常数项μ，系数β。

所述步骤S3包括：

1)获取模型的全局解释：通过可解释神经网络模型，输出针对样本总体的特征变量与响应变量之间的函数关系图，该函数关系包括线性关系和非线性关系两种。同时输出特征变量的取值分布直方图。

2)获取模型的局部解释：选取一个目标样本，将该样本的取值输入已训练好的可解释神经网络模型中，计算出样本的预测值以及每个特征变量对结果的贡献程度，并输出每个特征变量的得分及条形图。

所述步骤S4包括：

1)通过分析全局解释，可获知基于样本总体，每个特征变量对结果影响的重要程度。特征变量重要性可用于筛选重要特征，进一步提高模型精度。同时，通过与实际业务场景相结合，可判断模型是否准确以及它的可信程度。

2)通过分析局部解释，可获知对于单个样本，每个特征变量对其预测结果的影响程度,从而达到对不同个体结果进行个性化解释的目的。

本发明采用上述技术方案，具有以下增益效果：该方法通过训练可解释神经网络模型来达到提升模型可解释性的目的。本发明解决了现有机器学习模型无法对预测结果解释的问题，显著增强了模型的透明度，提高了模型预测的准确性和可信度。其次，本发明简化了数据预处理流程，仅需进行缺失值填充，提升了数据分析的效率。最后，本发明实现了高精度、高解释性的双平衡，显著增强了模型的普适性。

附图说明

图1为本发明一种机器学习模型结果的内在解释方法。

具体实施方式

下面对本方案结合附图进行详细说明。

如图1所示，分发明一种机器学习模型结果的内在解释方法，具体包括以下步骤：

S1，对数据进行清洗和预处理。对数据进行一致性检查，删除错误数据和无效数据，并进行缺失值填充。将分类变量转化为数值型变量。

S2，对输入的数据进行内在可解释神经网络模型建模；

具体包括以下主要步骤：

1)搭建一个内在可解释神经网络模型：模型表达式为f(x)＝μ+β₁h₁(x₁)+β₂h₂(x₂)+…+β_ph_p(x_p)。其中{x₁,x₂,x₃,…,x_p}表示共有p个特征变量输入模型；h_i(x_i)表示岭回归函数，每个岭回归函数通过一个子神经网络训练而成；μ表示模型的常数项，{β₁,β₂,β₃,…,β_p}表示岭回归函数对应的系数大小。

将p维样本数据集X＝[X₁,X₂,X₃,....,X_p]输入内在可解释神经网络模型中进行训练，其中每一个特征变量x_i分别进入一个子神经网络训练得出岭回归函数h_i(x_i)，同时计算出模型中涉及到的参数，包括常数项μ，系数β。

S3，获取模型的全局解释和局部解释；

通过构建广义线性模型和神经网络模型，实现了对模型预测结果的全局解释和局部解释，能够反映出特征变量对样本总体以及单个样本个体的影响，从而提升了模型的透明度和可信度。获取模型的全局解释和局部解释具体方法如下：

S4，对全局解释和局部解释进行分析，判断模型预测结果是否与实际业务相符，从而达到解释机器学习模型结果的目的。同时结合模型精准度指标，进一步提升模型的预测准确程度。具体方法包括：

解决了现有机器学习模型无法对预测结果解释的问题，显著增强了模型的透明度，提高了模型预测的准确性和可信度。简化了数据预处理流程，仅需进行缺失值填充，提升了数据分析的效率。实现了高精度、高解释性的双平衡，显著增强了模型的普适性。

Claims

1.一种机器学习模型结果的内在解释方法，其特征在于，包括以下步骤：

S2，对输入的数据进行内在可解释神经网络模型建模；

S3，获取模型的全局解释和局部解释；

2.根据权利要求1所述的一种机器学习模型结果的内在解释方法，其特征在于，所述步骤S2包括以下步骤：

1)搭建一个内在可解释神经网络模型：模型表达式为f(x)＝μ+β₁h₁(x₁)+β₂h₂(x₂)+…+β_ph_p(x_p)；其中{x₁,x₂,x₃,…,x_p}表示共有p个特征变量输入模型；h_i(x_i)表示岭回归函数，每个岭回归函数通过一个子神经网络训练而成；μ表示模型的常数项，{β₁,β₂,β₃,…,β_p}表示岭回归函数对应的系数大小；

2)将p维样本数据集X＝[X₁,X₂,X₃,....,X_p]输入内在可解释神经网络模型中进行训练，其中每一个特征变量x_i分别进入一个子神经网络训练得出岭回归函数h_i(x_i)，同时计算出模型中涉及到的参数，包括常数项μ，系数β。

3.根据权利要求1所述的一种机器学习模型结果的内在解释方法，其特征在于，所述步骤S3包括：

1)获取模型的全局解释：通过可解释神经网络模型，输出针对样本总体的特征变量与响应变量之间的函数关系图，该函数关系包括线性关系和非线性关系两种；同时输出特征变量的取值分布直方图；

4.根据权利要求1所述的一种机器学习模型结果的内在解释方法，其特征在于，所述步骤S4包括：

1)通过分析全局解释，获知基于样本总体，每个特征变量对结果影响的重要程度；特征变量重要性用于筛选重要特征，进一步提高模型精度；同时，通过与实际业务场景相结合，判断模型是否准确以及它的可信程度；

2)通过分析局部解释，获知对于单个样本，每个特征变量对其预测结果的影响程度,从而达到对不同个体结果进行个性化解释的目的。