CN111461420A

CN111461420A - 模型预测结果的解释方法和装置

Info

Publication number: CN111461420A
Application number: CN202010225065.1A
Authority: CN
Inventors: 方军鹏; 唐才智
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2020-03-26
Filing date: 2020-03-26
Publication date: 2020-07-28

Abstract

说明书披露一种模型预测结果的解释方法和装置。所述方法包括：获取目标模型的输入数据和对应的输入数据预测结果；基于所述输入数据和所述目标模型的样本集进行数据增强，生成若干能够表征所述输入数据的虚拟正样本和虚拟负样本；针对每个特征维度，计算该特征维度下所述虚拟正样本和所述虚拟负样本的可分离度；筛选可分离度满足预定条件的特征作为解释特征；针对每个解释特征，判断所述输入数据的特征值是否匹配该解释特征的解释条件；将匹配所述解释条件的解释特征及其特征值确定为所述输入数据预测结果的解释。

Description

模型预测结果的解释方法和装置

技术领域

本说明书涉及人工智能技术领域，尤其涉及一种模型预测结果的解释方法和装置。

背景技术

随着人工智能技术的发展，机器学习在零售、医疗、金融、自动驾驶等领域均有着广泛的应用。然而，很多机器学习模型类似于“黑盒”，输入数据后可输出结果，但却不具有解释性，用户无法了解其内部的决策机制，无法满足业务场景的需求。

发明内容

有鉴于此，本说明书提供一种模型预测结果的解释方法和装置。

具体地，本说明书是通过如下技术方案实现的：

一种模型预测结果的解释方法，包括：

获取目标模型的输入数据和对应的输入数据预测结果；

基于所述输入数据和所述目标模型的样本集进行数据增强，生成若干能够表征所述输入数据的虚拟正样本和虚拟负样本；

针对每个特征维度，计算该特征维度下所述虚拟正样本和所述虚拟负样本的可分离度；

筛选可分离度满足预定条件的特征作为解释特征；

针对每个解释特征，判断所述输入数据的特征值是否匹配该解释特征的解释条件；

将匹配所述解释条件的解释特征及其特征值确定为所述输入数据预测结果的解释。

一种模型预测结果的解释装置，包括：

数据获取单元，获取目标模型的输入数据和对应的输入数据预测结果；

数据增强单元，基于所述输入数据和所述目标模型的样本集进行数据增强，生成若干能够表征所述输入数据的虚拟正样本和虚拟负样本；

分离度计算单元，针对每个特征维度，计算该特征维度下所述虚拟正样本和所述虚拟负样本的可分离度；

特征筛选单元，筛选可分离度满足预定条件的特征作为解释特征；

条件匹配单元，针对每个解释特征，判断所述输入数据的特征值是否匹配该解释特征的解释条件；

结果解释单元，将匹配所述解释条件的解释特征及其特征值确定为所述输入数据预测结果的解释。

一种模型预测结果的解释装置，包括：

处理器；

用于存储机器可执行指令的存储器；

其中，通过读取并执行所述存储器存储的与模型预测结果的解释逻辑对应的机器可执行指令，所述处理器被促使：

获取目标模型的输入数据和对应的输入数据预测结果；

筛选可分离度满足预定条件的特征作为解释特征；

本说明书基于输入数据和目标模型的样本集进行数据增强，生成能够表征所述输入数据的虚拟样本，然后计算每个特征维度下虚拟正样本和虚拟负样本的可分离度，采用可分离度来表征该特征对目标模型预测结果的影响程度，进而筛选出对预测结果影响较大的若干解释特征，再将输入数据中匹配解释条件的解释特征及其特征值作为输入数据预测结果的解释，从而实现对模型预测结果的解释，满足业务场景的需求，并且本说明书的方案无需对模型进行改动，也不会影响模型的性能。

附图说明

图1是本说明书一示例性实施例示出的一种模型预测结果的解释方法的流程示意图。

图2是本说明书一示例性实施例示出的另一种模型预测结果的解释方法的流程示意图。

图3是本说明书一示例性实施例示出的一种能够表征输入数据的虚拟正样本和虚拟负样本的生成方法的流程示意图。

图4是本说明书一示例性实施例示出的一种风险预测模型预测结果的解释方法的流程示意图。

图5是本说明书一示例性实施例示出的一种用于模型预测结果的解释装置的一结构示意图。

图6是本说明书一示例性实施例示出的一种模型预测结果的解释装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。

在本说明书使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本说明书。在本说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本说明书可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本说明书范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

本说明书提供一种模型预测结果的解释方案，可先获取目标模型的输入数据和对应的输入数据预测结果，然后基于所述输入数据和所述目标模型的样本集，生成若干能够表征所述输入数据的虚拟正样本和虚拟负样本，计算每个特征维度下所述虚拟正样本和所述虚拟负样本的可分离度，筛选可分离度满足预定条件的特征作为解释特征，将满足解释条件的解释特征及其特征值确定为所述输入数据预测结果的解释，实现模型预测结果的解释。

图1和图2是本说明书一示例性实施例示出的模型预测结果的解释方法的流程示意图。

请参考图1和图2，所述模型预测结果的解释方法可包括以下步骤：

步骤102，获取目标模型的输入数据和对应的输入数据预测结果。

在本实施例中，所述目标模型可以是二分类模型，例如线性模型、决策树等，本说明书对此不作特殊限制。

在本实施例中，所述输入数据为实体对象的特征数据，所述输入数据预测结果为与所述实体对象相关的分类结果。

例如，在风险预测场景中，实体对象可为用户，所述输入数据为用户特征数据，可以为年龄、职业、年收入、借贷还款逾期次数等，所述用户的分类结果可以为“该用户有风险”或“该用户没有风险”。

又例如，在心脏病诊断场景中，实体对象可为用户，所述输入数据为用户特征数据，可以为年龄、血压、血糖、血脂、心率等，所述用户的分类结果可以为“该用户是心脏病患者”或“该用户不是心脏病患者”。

在本实施例中，在获取到输入数据预测结果后，可以先判断所述输入数据预测结果是否为预定的待解释预测结果，若是，则执行步骤104。若否，则结束流程。

所述待解释预测结果根据应用场景需求而设置。

以风险预测场景为例，假设预定的待解释预测结果为“用户有风险”，获取输入数据预测结果后，判断所述输入数据预测结果是否为“用户有风险”，如果是则继续执行下述步骤104。

当然，在其他例子中，也可以不设置所述输入数据预测结果，即对所有的输入数据预测结果进行解释，本说明书对此不作特殊限制。

步骤104，基于所述输入数据和所述目标模型的样本集进行数据增强，生成若干能够表征所述输入数据的虚拟正样本和虚拟负样本。

请参考图3，上述基于所述输入数据和所述目标模型的样本集进行数据增强的过程可包括如下步骤：

步骤1041，在所述目标模型的样本集中找出所述输入数据的若干邻近正样本和若干邻近负样本。

在本实施例中，所述正样本和所述负样本是类别标签相反的两类样本。例如，在风险预测场景中，可将无风险的用户作为正样本，将有风险的用户作为负样本。又例如，在心脏病诊断场景中，可将没有心脏病的用户作为正样本，将患有心脏病的用户作为负样本。

当然，在风险预测场景中，也可将无风险的用户作为负样本，将有风险的用户作为正样本。在心脏病诊断场景中，也可将没有心脏病的用户作为负样本，将患有心脏病的用户作为正样本。本说明书对此不作特殊限制。

在本实施例中，可先计算所述输入数据与所述目标模型的样本集中各样本的相似度。然后针对样本集中的正样本，按照相似度从小到大的顺序，选取第一数量的正样本作为所述邻近正样本；针对样本集中的负样本，按照相似度从小到大的顺序，选取第二数量的负样本作为所述邻近负样本。

所述相似度反映了所述输入数据与所述目标模型的样本集中各样本在距离上接近或远离程度：所述相似度越大则所述距离越远离，说明所述输入数据与所述样本差异越大；所述相似度越小则所述距离越接近，说明所述输入数据与所述样本差异越小，所述样本能够在一定程度上表征所述输入数据。

在本实施例中，所述相似度可采用欧式距离、汉明距离、余弦相似度等方法计算，本说明书对此不作特殊限制。

所述第一数量和所述第二数量分别为大于等于1的自然数，所述第一数量与所述第二数量可以相同也可以不同，本说明书对此不作特殊限制。

举例来说，可以采用欧式距离计算所述输入数据与所述目标模型的样本集中各样本的相似度，针对正样本，按照相似度从小到大的顺序，选取前100个正样本作为所述邻近正样本；针对负样本，按照相似度从小到大的顺序，选取前100个负样本作为所述邻近负样本。

步骤1042，基于所述输入数据、所述若干邻近正样本和所述若干邻近负样本进行数据增强，得到若干具有虚拟标签的虚拟样本。

在本实施例中，所述数据增强可以采用mixup(混合)算法等，本说明书对此不作特殊限制。

mixup算法是从数据集中随机抽取两条数据，将两条数据及其对应标签分别进行线性加权求和得到一条具有新标签的新数据，公式如下：

其中，i、j为数据编号，x_i和x_j是从数据集中随机抽取的两条数据，y_i是x_i的标签，y_j是x_j的标签，λ表示权重且λ∈[0,1]，

表示生成的新数据，

表示生成的新数据

的新标签。

在本实施例中，所述权重λ可在大于0到小于1的数值范围内按照一定步长遍历取值，根据变化的权重λ可生成更多的新样本。

在其他例子中，权重λ也可为一个固定的值，或多个固定的值，本说明书对此不作特殊限制。

在本实施例中，所述权重λ按照一定步长遍历取值，基于mixup算法，每个邻近正样本分别与每个邻近负样本进行数据增强，得到若干新样本，我们将这些新样本称为虚拟样本；以及，当所述输入数据预测结果是正向时，将所述输入数据分别与每个邻近负样本进行数据增强，得到若干虚拟样本；当所述输入数据预测结果是负向时，将所述输入数据分别与每个邻近正样本进行数据增强，得到若干虚拟样本。在生成的所述虚拟样本中，具有正向虚拟标签的虚拟样本为虚拟正样本，具有负向虚拟标签的虚拟样本为虚拟负样本。

举例来说，假设有100个邻近正样本和100个邻近负样本，λ初始值是0.1，λ最大值是0.9，步长取值为0.1，那么λ按照步长0.1遍历取值得到0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9。

所述邻近正样本中任一邻近正样本(x_p,y_p)与所述邻近负样本中任一邻近负样本(x_n,y_n)，基于mixup算法，权重λ从0.1按照0.1步长遍历到0.9，可生成1*1*9，共9个虚拟样本。

具体来说，当权重λ＝0.1时，基于mixup算法生成第一个虚拟样本

公式如下：

当权重λ＝0.2时，基于mixup算法生成第二个虚拟样本

公式如下：

当权重λ分别取值为0.3、0.4、0.5、0.6、0.7、0.8、0.9时，参考上述算法，可生成对应的虚拟样本，本说明书在此不再一一赘述。

因此，100个邻近正样本和100个邻近负样本，其中，每个邻近正样本分别与每个邻近负样本基于mixup算法进行数据增强，权重λ从0.1按照0.1步长遍历到0.9，可生成100*100*9，共90000个虚拟样本。

当所述输入数据预测结果是正向时，将所述输入数据分别与每个邻近负样本进行数据增强，增强算法与上述算法类似，本说明书在此不再一一赘述。

当所述输入数据预测结果是负向时，将所述输入数据分别与每个邻近正样本进行数据增强，增强算法与上述算法类似，本说明书在此不再一一赘述。

以风险预测场景为例，将“无风险”的用户作为正样本，“有风险”的用户作为负样本。假设，待解释预测结果是“有风险”，即对“有风险”的预测结果进行解释，用户的分类结果是“有风险”。在进行数据增强时，可将该用户的特征数据分别与每个“无风险”的邻近正样本用户的特征数据进行数据增强。

本说明书基于输入数据和目标模型的样本集进行数据增强，生成若干虚拟样本，使得所述虚拟样本中包含输入数据的特征，避免数据失真的问题。

并且，生成虚拟样本的权重λ在大于0到小于1的数值范围内按照一定步长遍历取值，不仅能够生成更多的虚拟样本，还能使虚拟样本随着权重λ的变化逐步靠近决策边界。

步骤1043，针对每个虚拟样本，将所述虚拟样本输入所述目标模型，得到对应的虚拟样本预测结果。

步骤1044，计算所述虚拟样本的虚拟样本预测结果和虚拟标签之间的差异。

步骤1045，筛选出差异满足预定差异条件的虚拟样本，作为能够表征所述输入数据的虚拟样本。

在本实施例中，所述差异可以为所述虚拟样本的虚拟样本预测结果与虚拟标签之间的差值。所述预定差异条件，可以为所述差异小于等于预设阈值。

举例来说，假设正样本的标签值大于等于0.5，负样本的标签值小于0.5，所述预设阈值为0.05。将一个虚拟标签值为0.6的虚拟样本输入所述目标模型中，得到所述虚拟样本预测结果为0.58，所述虚拟样本的虚拟样本预测结果和虚拟标签之间的差异为|0.58-0.6|＝0.02，差异值0.02小于预设阈值0.05，满足预定差异条件。因此，该虚拟样本可作为能够表征所述输入数据的虚拟样本。又由于该虚拟样本的虚拟标签值大于0.5，是正向虚拟标签，因此该虚拟样本为虚拟正样本。

所述虚拟样本的虚拟样本预测结果和虚拟标签之间的差异满足预设条件，保证了所述虚拟样本既符合目标模型的预测结果，又不会偏离决策边界，进而可用这些虚拟样本来表征输入数据。

步骤106，针对每个特征维度，计算该特征维度下所述虚拟正样本和所述虚拟负样本的可分离度。

在本实施例中，可针对每个特征维度，计算该特征维度下能够表征所述输入数据的虚拟正样本和虚拟负样本之间的类间距离，计算该特征维度下能够表征所述输入数据的各虚拟正样本之间的第一类内距离和各虚拟负样本之间的第二类内距离，然后根据所述类间距离、所述第一类内距离和所述第二类内距离计算该特征维度下所述虚拟正样本和所述虚拟负样本的可分离度。

举例来说，假设前述步骤104中生成3个能够表征所述输入数据的虚拟正样本和3个能够表征所述输入数据的虚拟负样本，每个虚拟样本具有10个维度的特征。3个虚拟正样本的第一维度特征分别为P₁、P₂、P₃，3个虚拟负样本的第一维度特征分别为N₁、N₂、N₃。

针对第一个特征维度，所述类间距离是每个虚拟正样本与每个虚拟负样本之间的差异之和，计算公式为：

S_b1＝(P₁-N₁)+(P₁-N₂)+(P₁-N₃)+(P₂-N₁)+(P₂-N₂)+(P₂-N₃)+(P₃-N₁)+(P₃-N₂)+(P₃-N₃)

所述类间距离S_b1越大说明，在第一个特征维度下，所述虚拟正样本与所述虚拟负样本之间越远离、越容易区分开。

针对第一个特征维度，所述虚拟正样本的类内距离是各虚拟正样本之间的差异之和，计算公式为：

S_w1＝(P₁-P₂)+(P₁-P₃)+(P₂-P₃)

所述虚拟正样本的类内距离S_w1越小说明，在第一个特征维度下，虚拟正样本内部之间越聚集、紧凑。

针对第一个特征维度，所述虚拟负样本的类内距离是各虚拟负样本之间的差异之和，计算公式为：

S_w2＝(N₁-N₂)+(N₁-N₃)+(N₂-N₃)

所述虚拟负样本的类内距离S_w2越小说明，在第一个特征维度下，虚拟负样本内部之间越聚集、紧凑。

针对第一个特征维度，利用所述类间距离S_b1除以所述第一类内距离S_w1与所述第二类内距离S_w2之和，来计算该维度下所述虚拟正样本和所述虚拟负样本的可分离度，计算公式为：

其他第二到第十个特征维度下，所述可分离度的计算与上述算法类似，本说明书在此不再一一赘述。

步骤108，筛选可分离度满足预定条件的特征作为解释特征。

在本说明书中，前述步骤1045中筛选出的虚拟样本能够表征所述输入数据，但这些虚拟样本的标签中有正向标签，也有负向标签，我们要筛选出导致标签不同的特征，作为解释特征。

在进行解释特征的筛选时，我们希望相同标签的虚拟样本之间尽可能紧凑，不同标签的虚拟样本之间尽可能远离，这个特点可通过前述特征的可分离度来表示。所述可分离度越大，可则说明该特征维度下，所述虚拟正样本和虚拟负样本的类间距离越大，和/或，相同标签的虚拟样本之间的类内距离越小。

在本实施例中，可按照可分离度从大到小的顺序对所述特征进行排序，然后筛选满足预定条件的特征作为解释特征，预定条件可为可分离度排在前N位，N为大于等于1的自然数，本说明书对此不作特殊限制，例如将可分离度排在前5位的特征作为解释特征。

步骤110，针对每个解释特征，判断所述输入数据的特征值是否匹配该解释特征的解释条件；

步骤112，将匹配所述解释条件的解释特征及其特征值确定为所述输入数据预测结果的解释。

在本实施例中，可预先为各个特征设置解释条件，针对所述输入数据，可判断解释特征的特征值是否满足所述解释条件，若满足解释条件，可将匹配解释条件的解释特征及其特征值作为所述输入数据预测结果的解释。

举例来说，假设前述步骤108中为输入数据预测结果确定的解释特征为A和B，特征A的特征值为100，特征B的特征值为-1。

特征A的解释条件是特征值大于80，特征B的解释条件是特征值大于0。

根据判断可知，特征A的特征值匹配其解释条件，而特征B的特征值未匹配其解释条件，因此，可将特征A的特征值100作为输入数据预测结果的解释，即目标模型输出输入数据预测结果的原因是输入数据特征A的特征值是100。

在本实施例中，通过判断解释特征的特征值是否匹配所述解释条件，来确定输入数据预测结果的解释，保证了所述解释的合理性，提升了用户的业务体验。

下面以目标模型为风险预测模型，该风险预测模型应用于金融领域的套现风险预测为例，描述本说明书的实现过程。

请参考图4，风险预测模型预测结果的解释方法可包括以下步骤：

步骤402，获取风险预测模型的输入数据和对应的风险预测结果。

在本实施例中，以申请银行贷款为例，用户可在线提交银行贷款申请请求，银行可将用户数据等作为输入数据，输入已训练的风险预测模型，得到所述风险预测模型输出的预测结果。

所述用户数据可包括用户性别、年龄、所在地、职业、年收入、借贷还款逾期次数等多维度特征数据，具体可参考所述风险预测模型的样本特征，本说明书对此不作特殊限制。

所述风险预测模型的预测结果可以为“该用户有风险”或“该用户无风险”。

步骤404，判断所述风险预测结果是否为“该用户有风险”。

基于前述步骤402，在获取到所述风险预测结果后，判断所述风险预测结果是否为“该用户有风险”。

若是，则执行步骤406，给出“该用户有风险”的预测解释。

若否，则无需对“该用户无风险”的结果进行解释，可结束本实施例的后续流程，执行无风险对应的业务流程，例如发放贷款等。

步骤406，基于所述输入数据和所述风险预测模型的样本集进行数据增强，生成若干能够表征所述输入数据的虚拟正样本和虚拟负样本。

在本实施例中，可采用前述图3所示实施例中示出的虚拟样本生成方案，生成若干能够表征所述输入数据的虚拟正样本和虚拟负样本，本实施例在此不再一一赘述。

步骤408，针对每个特征维度，计算所述该特征维度下所述虚拟正样本和所述虚拟负样本的可分离度。

在本实施例中，可针对每个特征维度，计算该特征维度下，前述步骤406中生成的能够表征所述输入数据的虚拟正样本和虚拟负样本之间的类间距离，计算该特征维度下能够表征所述输入数据的所述虚拟正样本的第一类内距离和所述虚拟负样本的第二类内距离，然后根据所述类间距离、所述第一类内距离和所述第二类内距离计算该特征维度下所述虚拟正样本和所述虚拟负样本的可分离度。

步骤410，筛选可分离度满足预定条件的特征作为解释特征。

在本实施例中，可按照可分离度从大到小的顺序对所述特征进行排序，然后筛选满足预定条件的特征作为解释特征。

步骤412，针对每个解释特征，判断所述输入数据的特征值是否匹配该解释特征的解释条件。

步骤414，将匹配所述解释条件的解释特征及其特征值确定为所述有风险预测结果的解释。

在本实施例中，可预先为每个特征设置解释条件，解释条件通常匹配该特征下存在风险的特征值。

例如，以特征是用户的借贷还款逾期次数为例，一般而言，若借贷还款逾期次数高于某个阈值，可认为该用户的信用情况较差，可能存在套现风险，进而可将借贷还款逾期次数这个特征的解释条件设置为借贷还款逾期次数高于所述阈值。

在本实施例中，基于前述步骤410中确定的解释特征，可依次判断输入数据的每个解释特征值是否匹配对应解释特征的解释条件。

若匹配，则可说明该解释特征值对风险预测模型输出“该用户有风险”的预测结果起到了重要作用，进而可将所有可以匹配解释条件的解释特征及其特征值返回给银行，银行进而可以返回给用户，作为拒绝向用户发放贷款的理由。

若不匹配，则可说明该解释特征值对风险预测模型输出有风险的预测结果未起到任何作用，因此可以忽略该解释特征及其特征值。

举例来说，假设输入数据具有5个特征，分别为：年龄、性别、职业、年收入、借贷还款逾期次数，所述输入数据特征相应的特征值分别为：年龄25周岁、性别男、自由职业、年收入10000元、借贷还款逾期次数为5次，所述输入数据预测结果为“该用户有风险”。

在步骤410中为所述输入数据确定的3个解释特征，分别为年龄、年收入和借贷还款逾期次数。假设其中，年龄的解释条件为大于60周岁，年收入的解释条件为小于20000元，借贷还款逾期次数的解释条件为大于3次。

分别判断解释特征的特征值是否匹配该解释特征的解释条件。在本例中，解释特征年收入和借贷还款逾期次数的特征值均匹配其相应的解释条件，可将年收入10000元，借贷还款逾期次数5次作为前述输入预测结果“该用户有风险”的解释返回给银行，银行进而可以拒绝该用户的贷款申请请求，并将这两点作为解释返回给用户，进而提升用户的业务体验。

与前述模型预测结果的解释方法的实施例相对应，本说明书还提供了模型预测结果的解释装置的实施例。

本说明书模型预测结果的解释装置的实施例可以应用在服务器上。装置实施例可以通过软件实现，也可以通过硬件或者软硬件结合的方式实现。以软件实现为例，作为一个逻辑意义上的装置，是通过其所在服务器的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言，如图5所示，为本说明书模型预测结果的解释装置所在服务器的一种硬件结构图，除了图5所示的处理器、内存、网络接口、以及非易失性存储器之外，实施例中装置所在的服务器通常根据该服务器的实际功能，还可以包括其他硬件，对此不再赘述。

请参考图6，所述模型预测结果的解释装置500可以应用在前述图5所示的服务器中，包括有：数据获取单元501、数据增强单元502、分离度计算单元503、特征筛选单元504、条件匹配单元505以及结果解释单元506。

其中，数据单元501，获取目标模型的输入数据和对应的输入数据预测结果；

数据增强单元502，基于所述输入数据和所述目标模型的样本集进行数据增强，生成若干能够表征所述输入数据的虚拟正样本和虚拟负样本；

分离度计算单元503，针对每个特征维度，计算该特征维度下所述虚拟正样本和所述虚拟负样本的可分离度；

特征筛选单元504，筛选可分离度满足预定条件的特征作为解释特征；

条件匹配单元505，针对每个解释特征，判断所述输入数据的特征值是否匹配该解释特征的解释条件；

结果解释单元506，将匹配所述解释条件的解释特征及其特征值确定为所述输入数据预测结果的解释。

可选的，所述数据增强单元502：

在所述目标模型的样本集中找出所述输入数据的若干邻近正样本和若干邻近负样本；

基于所述输入数据、所述若干邻近正样本和所述若干邻近负样本进行数据增强，得到若干虚拟样本，所述虚拟样本具有虚拟标签；

针对每个虚拟样本，将所述虚拟样本输入所述目标模型，得到对应的虚拟样本预测结果；

计算所述虚拟样本的虚拟样本预测结果和虚拟标签之间的差异；

筛选出差异满足预定差异条件的虚拟样本，作为能够表征所述输入数据的虚拟样本；

其中，具有正向虚拟标签的虚拟样本为虚拟正样本，具有负向虚拟标签的虚拟样本为虚拟负样本。

可选的，所述数据增强单元502：

计算所述输入数据和所述样本集中各样本的相似度；

针对正样本，按照相似度从小到大的顺序，选取第一数量的正样本，作为所述邻近正样本；

针对负样本，按照相似度从小到大的顺序，选取第二数量的负样本，作为所述邻近负样本。

可选的，所述数据增强单元502：

针对每个邻近正样本，对所述邻近正样本与每个邻近负样本分别进行数据增强，得到若干虚拟样本；以及

当所述输入数据预测结果是正向时，将所述输入数据分别与每个邻近负样本进行数据增强，得到若干虚拟样本；

当所述输入数据预测结果是负向时，将所述输入数据分别与每个邻近正样本进行数据增强，得到若干虚拟样本。

可选的，所述分离度计算单元503：

针对每个特征维度，计算该特征维度下所述虚拟正样本和所述虚拟负样本之间的类间距离；

计算该特征维度下所述虚拟正样本的第一类内距离；

计算该特征维度下所述虚拟负样本的第二类内距离；

根据所述类间距离、所述第一类内距离和所述第二类内距离计算该特征维度下所述虚拟正样本和所述虚拟负样本的可分离度。

可选的，所述特征筛选单元504：

将各维度特征按照可分离度从大到小的顺序排列，顺次选取排列在先的预设数量的特征作为所述解释特征。

可选的，所述数据增强单元502：

判断所述输入数据预测结果是否为预定的待解释预测结果；

若是，则执行数据增强的步骤。

可选的，所述输入数据为实体对象的特征数据；

所述输入数据预测结果为与所述实体对象相关的分类结果。

上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程，在此不再赘述。

对于装置实施例而言，由于其基本对应于方法实施例，所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机，计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。

与前述模型预测结果的解释方法的实施例相对应，本说明书还提供一种模型预测结果的解释装置，该装置包括：处理器以及用于存储机器可执行指令的存储器。其中，处理器和存储器通常借由内部总线相互连接。在其他可能的实现方式中，所述设备还可能包括外部接口，以能够与其他设备或者部件进行通信。

在本实施例中，通过读取并执行所述存储器存储的与模型预测结果的解释逻辑对应的机器可执行指令，所述处理器被促使：

获取目标模型的输入数据和对应的输入数据预测结果；

筛选可分离度满足预定条件的特征作为解释特征；

可选的，在基于所述输入数据和所述目标模型的样本集进行数据增强，生成若干能够表征所述输入数据的虚拟正样本和虚拟负样本时，所述处理器被促使：

可选的，所述在所述目标模型的样本集中找出所述输入数据的若干邻近正样本和若干邻近负样本时，所述处理器被促使：

计算所述输入数据和所述样本集中各样本的相似度；

可选的，所述在基于所述输入数据、所述若干邻近正样本和所述若干邻近负样本进行数据增强，得到若干虚拟样本时，所述处理器被促使：

可选的，针对每个特征维度，在计算所述该特征维度下所述虚拟正样本和所述虚拟负样本的可分离度时，所述处理器被促使：

计算该特征维度下所述虚拟正样本的第一类内距离；

计算该特征维度下所述虚拟负样本的第二类内距离；

可选的，所述在筛选可分离度满足预定条件的特征作为解释特征时，所述处理器被促使：

可选的，所述处理器还被促使：

判断所述输入数据预测结果是否为预定的待解释预测结果；

若是，则执行数据增强的步骤。

所述输入数据为实体对象的特征数据；

所述输入数据预测结果为与所述实体对象相关的分类结果。

与前述模型预测结果的解释方法的实施例相对应，本说明书还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，该程序被处理器执行时实现以下步骤：

一种模型预测结果的解释方法，包括：

获取目标模型的输入数据和对应的输入数据预测结果；

筛选可分离度满足预定条件的特征作为解释特征；

可选的，基于所述输入数据和所述目标模型的样本集进行数据增强，生成若干能够表征所述输入数据的虚拟正样本和虚拟负样本，包括：

可选的，所述在所述目标模型的样本集中找出所述输入数据的若干邻近正样本和若干邻近负样本，包括：

计算所述输入数据和所述样本集中各样本的相似度；

可选的，所述基于所述输入数据、所述若干邻近正样本和所述若干邻近负样本进行数据增强，得到若干虚拟样本，包括：

可选的，针对每个特征维度，计算所述该特征维度下所述虚拟正样本和所述虚拟负样本的可分离度，包括：

计算该特征维度下所述虚拟正样本的第一类内距离；

计算该特征维度下所述虚拟负样本的第二类内距离；

可选的，所述筛选可分离度满足预定条件的特征作为解释特征，包括：

可选的，还包括：

判断所述输入数据预测结果是否为预定的待解释预测结果；

若是，则执行数据增强的步骤。

可选的，所述输入数据为实体对象的特征数据；

所述输入数据预测结果为与所述实体对象相关的分类结果。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

以上所述仅为本说明书的较佳实施例而已，并不用以限制本说明书，凡在本说明书的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本说明书保护的范围之内。

Claims

1.一种模型预测结果的解释方法，包括：

获取目标模型的输入数据和对应的输入数据预测结果；

筛选可分离度满足预定条件的特征作为解释特征；

2.根据权利要求1所述的方法，基于所述输入数据和所述目标模型的样本集进行数据增强，生成若干能够表征所述输入数据的虚拟正样本和虚拟负样本，包括：

3.根据权利要求2所述的方法，所述在所述目标模型的样本集中找出所述输入数据的若干邻近正样本和若干邻近负样本，包括：

计算所述输入数据和所述样本集中各样本的相似度；

4.根据权利要求2所述的方法，所述基于所述输入数据、所述若干邻近正样本和所述若干邻近负样本进行数据增强，得到若干虚拟样本，包括：

5.根据权利要求1所述的方法，针对每个特征维度，计算该特征维度下所述虚拟正样本和所述虚拟负样本的可分离度，包括：

计算该特征维度下所述虚拟正样本的第一类内距离；

计算该特征维度下所述虚拟负样本的第二类内距离；

6.根据权利要求1所述的方法，所述筛选可分离度满足预定条件的特征作为解释特征，包括：

7.根据权利要求1所述的方法，还包括：

判断所述输入数据预测结果是否为预定的待解释预测结果；

若是，则执行数据增强的步骤。

8.根据权利要求1所述的方法，

所述输入数据为实体对象的特征数据；

所述输入数据预测结果为与所述实体对象相关的分类结果。

9.一种模型预测结果的解释装置，包括：

10.根据权利要求9所述的装置，所述数据增强单元：

11.根据权利要求10所述的装置，所述数据增强单元：

计算所述输入数据和所述样本集中各样本的相似度；

12.根据权利要求10所述的装置，所述数据增强单元：

13.根据权利要求9所述的装置，所述分离度计算单元：

计算该特征维度下所述虚拟正样本的第一类内距离；

计算该特征维度下所述虚拟负样本的第二类内距离；

14.根据权利要求9所述的装置，所述特征筛选单元：

15.根据权利要求9所述的装置，

所述数据增强单元，判断所述输入数据预测结果是否为预定的待解释预测结果；若是，则执行数据增强的步骤。

16.根据权利要求9所述的装置，

所述输入数据为实体对象的特征数据；

所述输入数据预测结果为与所述实体对象相关的分类结果。

17.一种模型预测结果的解释装置，包括：

处理器；

用于存储机器可执行指令的存储器；

获取目标模型的输入数据和对应的输入数据预测结果；

筛选可分离度满足预定条件的特征作为解释特征；