CN113779257A

CN113779257A - 文本分类模型的解析方法、装置、设备、介质及产品

Info

Publication number: CN113779257A
Application number: CN202111146671.5A
Authority: CN
Inventors: 孙沁田; 王伟烽; 张钧波
Original assignee: Jingdong City Beijing Digital Technology Co Ltd
Current assignee: Jingdong City Beijing Digital Technology Co Ltd
Priority date: 2021-09-28
Filing date: 2021-09-28
Publication date: 2021-12-10

Abstract

本发明实施例提供一种文本分类模型的解析方法、装置、设备、介质及产品，该方法包括：获取目标文本分类模型和至少一个目标文本样本，目标文本分类模型为训练后的文本分类模型；确定各目标文本样本对应的分类类别；对各目标文本样本分别进行分词处理，并采用预设的可解释算法计算各目标文本样本每种分词在对应分类类别中的贡献值；根据贡献值对目标文本分类模型进行解析，以获得解析结果。本发明实施例能够细致解析出目标文本分类模型的分类原理和依据，使得解析的结果更加全面和准确，有效对目标文本分类模型进行调优。并且无需人工解析，提高了解析的效率。

Description

文本分类模型的解析方法、装置、设备、介质及产品

技术领域

本发明实施例涉及人工智能技术领域，尤其涉及一种文本分类模型的解析方法、装置、设备、介质及产品。

背景技术

随着人工智能技术的发展，采用文本分类模型对文本进行分类的应用场景也不断丰富。为了保证文本分类模型分类结果有较高的分类性能，需要对训练后的文本分类模型进行解析。

现有技术中，在对训练后的文本分类模型进行解析时，主要有基于简单的分类结果指标对文本分类模型进行解析的方法，或人工对分类结果和训练样本进行观察和简单统计进而对文本分类模型进行解析的方法。

在实现本发明过程中，发明人发现现有技术中至少存在如下问题：基于简单的分类结果指标对文本分类模型进行解析的方法无法对文本分类模型进行更加细致的分析。而人工解析的方法耗时耗力，解析效率较低，并且容易出现疏漏，解析的结果并不全面准确，所以并不能有效地对训练后的文本分类模型进行调优。

发明内容

本发明实施例提供一种文本分类模型的解析方法、装置、设备、介质及产品，用以解决现有技术中无法对文本分类模型进行更加细致的分析及耗时耗力，并且容易出现疏漏，解析的结果并不全面准确，所以并不能有效地对训练后的文本分类模型进行调优的技术问题。

第一方面，本发明实施例提供一种文本分类模型的解析方法，包括：

获取目标文本分类模型和至少一个目标文本样本，所述目标文本分类模型为训练后的文本分类模型；

确定各目标文本样本对应的分类类别；

对各所述目标文本样本分别进行分词处理，并采用预设的可解释算法计算各所述目标文本样本每种分词在对应分类类别中的贡献值；

根据所述贡献值对所述目标文本分类模型进行解析，以获得解析结果。

第二方面，本发明实施例提供一种文本分类模型的解析装置，包括：

获取模块，用于获取目标文本分类模型和至少一个目标文本样本，所述目标文本分类模型为训练后的文本分类模型；

确定模块，用于确定各目标文本样本对应的分类类别；

计算模块，用于对各所述目标文本样本分别进行分词处理，并采用预设的可解释算法计算各所述目标文本样本每种分词在对应分类类别中的贡献值；

解析模块，用于根据所述贡献值对所述目标文本分类模型进行解析，以获得解析结果。

第三方面，本发明实施例提供电子设备，包括：至少一个处理器及存储器；

所述存储器存储计算机执行指令；

所述至少一个处理器执行所述存储器存储的计算机执行指令，使得所述至少一个处理器执行如第一方面所述的方法。

第四方面，本发明实施例提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如第一方面所述的方法。

第五方面，本发明实施例提供一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现第一方面所述的方法。

本发明实施例提供的文本分类模型的解析方法、装置、设备、介质及产品，通过获取目标文本分类模型和至少一个目标文本样本，目标文本分类模型为训练后的文本分类模型；确定各目标文本样本对应的分类类别；对各目标文本样本分别进行分词处理，并采用预设的可解释算法计算各目标文本样本每种分词在对应分类类别中的贡献值；根据贡献值对目标文本分类模型进行解析，以获得解析结果。由于预设的可解释算法能够计算各目标文本样本每种分词在对应分类类别中的贡献值，贡献值能够从目标文本样本中分词的维度对目标文本分类模型进行更加细致的解析，所以能够细致解析出目标文本分类模型的分类原理和依据，使得解析的结果更加全面和准确，有效对目标文本分类模型进行调优。并且无需人工解析，提高了解析的效率。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1是可以实现本发明实施例的文本分类模型的解析方法的一种应用场景图；

图2是本发明一实施例提供的文本分类模型的解析方法的流程示意图；

图3是本发明另一实施例提供的文本分类模型的解析方法的流程示意图；

图4是本发明另一实施例提供的文本分类模型的解析方法中预设的可解释模型计算贡献值对应的结果示例图；

图5是本发明又一实施例提供的文本分类模型的解析方法的流程示意图；

图6a是本发明又一实施例提供的文本分类模型的解析方法中贡献解析值直方图的一个示意图；

图6b是本发明又一实施例提供的文本分类模型的解析方法中贡献解析值直方图的另一个示意图；

图7是本发明再一实施例提供的文本分类模型的解析方法的流程示意图；

图8是本发明还一实施例提供的文本分类模型的解析方法的流程示意图；

图9是本发明还一实施例提供的文本分类模型的解析方法的流程示意图；

图10是本发明再一实施例提供的文本分类模型的解析方法的流程示意图；

图11是本发明一实施例提供的文本分类模型的解析装置的结构示意图；

图12是用来实现本发明实施例的文本分类模型的解析方法的电子设备的结构示意图；

图13是用来实现本发明实施例的文本分类模型的解析方法的电子设备的框图。

通过上述附图，已示出本公开明确的实施例，后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围，而是通过参考特定实施例为本领域技术人员说明本公开的概念。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

为了清楚理解本发明的技术方案，首先对现有技术的方案进行详细介绍。

现有技术中，在对训练后的文本分类模型进行解析时，基于简单的分类结果指标对文本分类模型进行解析。一般获取分类结果指标包括：分类精度，各个类别的准确度及召回率。由于分类结果指标只能粗略地反映训练后的文本分类模型的表现。所以并不能进行更加细致的分析。难以找到隐藏的错误推断方式。

而人工对分类结果和训练样本进行观察和简单统计进而对文本分类模型进行解析的方法，在进行观察和简单统计时，难以系统地发现训练后的文本分类模型推断的特点。并且只能大致得出哪些类型的文本样本容易出错，容易出现疏漏，并且耗时耗力。

所以现有的对训练后的文本分类模型进行解析的方法，解析结果并不全面准确，解析效率较低，进而无法有效地对训练后的文本分类模型进行调优。

所以在面对现有技术的技术问题时，发明人通过创造性的研究后发现，在“可解释人工智能”领域，可解释算法可有效的对各种机器学习模型进行解析。所以可将预设的可解释算法应用在文本分类模型中。具体可计算每个分类后的目标文本样本中每种分词在对应分类类别中的贡献值。进而根据贡献值对目标文本分类模型进行解析，以获得解析结果。

所以发明人基于上述的创造性发现，提出了本发明实施例的技术方案。下面对本发明实施例提供的文本分类模型的解析方法的应用场景进行介绍。

本实施例提供的文本分类模型的解析方法可应用在对文本样本进行分类的各种应用场景中。如在智能客户的应用场景中，事件分拨处理的应用场景中。具体地，如图1所示，在电子设备1中存储有训练后的目标文本分类模型和目标文本样本，采用本实施例提供的文本分类模型的解析方法对目标文本分类模型进行解析，获得解析结果后，将解析结果发送给用户终端2，以使用户终端对解析结果进行显示。由用户根据解析结果确定目标文本样本中出现的问题，触发用户终端向电子设备1发送目标文本样本的调整指令，电子设备1对目标文本样本进行调整后，采用调整后的目标文本样本对目标文本分类模型继续进行训练，直到获得训练至收敛的文本分类模型。训练至收敛的目标文本分类模型是调优后的文本分类模型，并且具有较强的稳健性。

在具体应用场景中，电子设备3将待处理的文本样本发送给电子设备1，电子设备1对待处理的文本样本进行分类，获得分类结果后，按照分类结果中的类别发送给对应的处理设备4。如在智能客户的应用场景中，对待处理的文本样本进行分类，获得分类结果后，按照分类结果中的类别，将待处理的文本样本发送给对应的客服终端，以由客服对待处理的文本样本对应的客服问题进行处理。又如在事件分拨处理的应用场景中，对待处理的文本样本进行分类，获得分类结果后，按照分类结果中的类别，将待处理的文本样本发送给对应的事后处理服务器，由事后处理机构对待处理的文本样本对应的事件进行处理。

可以理解的是，本发明实施例提供的文本分类模型的解析方法还可以应用在其他应用场景中，本实施例中对此不作限定。

下面以具体地实施例对本发明的技术方案以及本发明的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图，对本发明的实施例进行描述。

实施例一

图2是本发明一实施例提供的文本分类模型的解析方法的流程示意图，如图2所示，本实施例提供的文本分类模型的解析方法的执行主体为文本分类模型的解析装置，该文本分类模型的解析装置可位于电子设备中。则本实施例提供的文本分类模型的解析方法包括以下步骤：

步骤101，获取目标文本分类模型和至少一个目标文本样本，目标文本分类模型为训练后的文本分类模型。

其中，目标文本分类模型为训练后的文本分类模型。目标文本分类模型是需要进行解析的文本分类模型。目标文本分类模型的类型不作限定。如可以为词频-逆向文件频率分类模型(英文为：term frequency–inverse document frequency，简称为：TF-IDF)、词向量分类模型(英文为：word2vec)、双向编码器分类模型(英文为：Bidirectional EncoderRepresentation from Transformers，简称：BERT)。

其中，目标文本样本可以为对目标文本分类模型进行训练的训练样本，或者对目标文本样本进行测试的测试样本，本实施例中对此不作限定。

步骤102，确定各目标文本样本对应的分类类别。

本实施例中，若目标文本样本为训练样本，则由于目标文本分类模型为采用训练样本对预设的文本分类模型进行训练后的文本分类模型。则获取对文本分类模型进行训练后的训练样本的分类结果中的分类类别，作为各目标文本样本对应的分类类别。

本实施例中，若目标文本样本为测试样本，则将测试样本输入到目标文本分类模型中，采用目标文本分类样本对目标文本样本进行分类，以获得分类结果。在分类结果中获取各目标文本样本对应的分类类别。

步骤103，对各目标文本样本分别进行分词处理，并采用预设的可解释算法计算各目标文本样本每种分词在对应分类类别中的贡献值。

本实施例中，采用预设的分词算法对每个目标文本样本进行分词处理，获得每个目标文本样本对应的分词结果。其中，在每个目标文本样本对应的分词结果中包括多种分词。将每个目标文本样本对应多种分词输入到预设的可解释算法中，预设的可解释算法计算每种分词在对应分类类别中的贡献值。

其中，预设的可解释算法可以为夏普利加法解释算法(英文为：Shapley AdditiveexPlanation，简称：SHAP)或局部可解释性算法(简称：LIME)，或其他可解释算法，本实施例中对此不作限定。

步骤104，根据贡献值对目标文本分类模型进行解析，以获得解析结果。

本实施例中，可根据贡献值对目标文本样本进行多种维度的统计，确定目标文本样本中哪些分词对分类时的贡献大，哪些分词的贡献小，以根据贡献值对目标文本分类模型进行解析，获得解析结果。

其中，解析结果可以采用图表的形式，或其他形式，本实施例中对此不作限定。

可以理解的是，在解析结果中，还可包括分类精度，各分类类别的准确度及召回率，以更加全面地对目标文本分类模型进行解析。

本实施例提供的文本分类模型的解析方法，通过获取目标文本分类模型和至少一个目标文本样本，目标文本分类模型为训练后的文本分类模型；确定各目标文本样本对应的分类类别；对各目标文本样本分别进行分词处理，并采用预设的可解释算法计算各目标文本样本每种分词在对应分类类别中的贡献值；根据贡献值对目标文本分类模型进行解析，以获得解析结果。由于预设的可解释算法能够计算各目标文本样本每种分词在对应分类类别中的贡献值，贡献值能够从目标文本样本中分词的维度对目标文本分类模型进行更加细致的解析，所以能够细致解析出目标文本分类模型的分类原理和依据，使得解析的结果更加全面和准确，有效对目标文本分类模型进行调优。并且无需人工解析，提高了解析的效率。

实施例二

图3是本发明另一实施例提供的文本分类模型的解析方法的流程示意图，如图3所示，本实施例提供的文本分类模型的解析方法，是在实施例一提供的文本分类模型的解析方法的基础上，对步骤103中采用预设的可解释算法计算各目标文本样本每种分词在对应分类类别中的贡献值的进一步细化，则本实施例提供的文本分类模型的解析方法包括以下步骤：

步骤1031，将每个目标文本样本中的多种分词分别作为输入特征输入到可解释算法中。

其中，可对每个目标文本样本中的多种分词分别进行矢量化处理，每种分词作为输入特征输入到可解释算法中。

其中，可解释算法中具有对应的模型表达式。输入特征作为输入量输入到可解释算法对应的模型表达式中。

其中，可解释算法对应的模型表达式为式(1)所示：

其中，F代表多中分词组成的输入特征i的集合,|F|为F的维度。S为从F中抽取出来的多种输入特征组合，构成的子集。|S|为S的维度。

代表所有不包含输入特征i的输入特征集合。φ_i代表输入特征i的贡献值，f代表目标文本分类模型。f_S(x_S)表示只利用特征子集S计算出来的输入特征平均值。f_S∪{I}(x_S∪{I})表示在特征子集S的基础上，加上特征i，计算出来的输入特征平均值。

表示在特征子集S下，对于包含特征i和不包含特征i的情况下，输入特征取值之差的权重。

步骤1032，采用可解释算法计算每个输入特征在对应分类类别中的贡献值。

本实施例中，采用可解释算法对应的模型表达式计算每个输入特征在对应分类类别中的贡献值。其中，某些输入特征在对应分类类别中的贡献值为正值，表示正向贡献值。某些输入特征在对应分类类别中的贡献值为负值，表示负向贡献值。

如图4所示，在将一个目标文本样本进行分词后，采用可解释算法计算每个输入特征在对应分类类别中的贡献值。其中，分词“充满希望的”。“感觉到”、“唤醒”以及其他分词对应的输入特征确定出的贡献值为正向贡献值。而“腐朽的”、“希望”、“贪婪的”、“感觉”、“错误的”、“夺取”确定出的贡献值为负向贡献值。

步骤1033，计算每个输入特征在对应分类类别中的贡献值的绝对值。

步骤1034，将各贡献值的绝对值确定为各分词在对应分类类别中的贡献值。

本实施例中，由于某些输入特征在对应分类类别中的贡献值为正值，某些输入特征在对应分类类别中的贡献值为负值，所以计算每个输入特征在对应分类类别中的贡献值的绝对值。进而确定出各分词在对应分类类别中的贡献值。

其中，分词对应的贡献值越大，说明该分词对应的目标文本样本在进行分类时，该分词在对应分类类别中所作出的贡献越大。反之，分词对应的贡献值越小，说明该分词对应的目标文本样本在进行分类时，该分词在对应分类类别中所作出的贡献越小。

实施例三

图5是本发明又一实施例提供的文本分类模型的解析方法的流程示意图，如图5所示，本实施提供的文本分类模型的解析方法在上述任意一个实施例提供的文本分类模型的解析方法的基础上，在步骤104之前，还包括了按照分类类别对目标文本样本进行分组，以获得多个类别样本集的步骤，并且步骤104包括了以下步骤：

步骤1041，针对各类别样本集中的目标文本样本，根据贡献值确定每种分词在对应分类类别中的第一贡献解析值。

本实施例中，按照每个分类类别，将目标文本样本进行分组，每组目标文本样本构成一个的类别样本集。

其中，第一贡献解析值是在每种分词在对应类别样本集中确定出来的贡献解析值。

可选地，本实施例中，步骤1041包括以下步骤：

步骤1041a，针对各类别样本集中的目标文本样本，计算每种分词的贡献总值或贡献平均值。

步骤1041b，将贡献总值或贡献平均值确定为对应分词的第一贡献解析值。

本实施例中，由于每个目标文本样本，均确定出每种分词在对应类别中的贡献值。所以可计算出在类别样本集中每种分词在对应类别中的贡献值的总和作为贡献总值或计算出在类别样本集中每种分词在对应类别中的贡献值的平均值作为贡献平均值。由于贡献总值和贡献平均值能够反映每种分词在对应类别样本集的类别中的整体贡献，可作为对目标文本分类模型进行解析时的贡献值，所以将贡献总值或贡献平均值确定为对应分词的第一贡献解析值。

步骤1042，按照第一贡献解析值，对每个分类类别的分词进行排序，形成多个分类类别对应的第一分词贡献解析值排序表。

其中，按照第一贡献解析值对每个分类类别的分词进行排序后形成的排序表为第一分词贡献解析值排序表。

步骤1043，将第一分词贡献解析值排序表确定为解析结果。

具体地，可对每个分类类别的分词按照第一贡献解析值由大到小的顺序进行排序，确定出每个分类类别对应的第一分词贡献解析排序子表，将每个第一分词贡献解析排序子表进行合并，获得多个分类类别对应的第一分词贡献解析值排序表。

示例性的，如表1所示，例如分类类别为“南A大学附属医院”和“南A市交通运输局”，在第一分词贡献解析值排序表中，从上至下显示出“南A大学附属医院”对应的第一贡献解析值由大到小对应的分词前两个分别为“医院”、“复工”。从上至下显示“南A市交通运输局”对应的第一贡献解析值由大到小对应的分词前两个分别为“公交车”、“肺炎”。

表1：第一分词贡献解析值排序示意表

本实施例提供的文本分类模型的解析方法，在根据贡献值对目标文本分类模型进行解析，以获得解析结果时，针对各类别样本集中的目标文本样本，根据贡献值确定每种分词在对应分类类别中的第一贡献解析值；按照第一贡献解析值，对每个分类类别的分词进行排序，形成多个分类类别对应的第一分词贡献解析值排序表；将第一分词贡献解析值排序表确定为解析结果。能够以分类类别为维度，确定出在各类别样本集中每种分词的第一贡献解析值，进而确定出第一分词贡献解析值排序表，准确对目标文本分类模型进行解析。

可选地，本实施例提供的文本分类模型的解析方法，在步骤1042之后，还包括以下步骤：

步骤1044，根据每个分类类别中排序后的分词与对应第一贡献解析值的映射关系，生成各分类类别中每种分词的贡献解析值直方图。

步骤1045，将贡献解析值直方图确定为解析结果。

本实施例中，为了对每个分类类别中每种分词的第一贡献解析值进行更形象化的表达，将根据每个分类类别中排序后的分词与对应第一贡献解析值的映射关系，生成各分类类别中每种分词的贡献解析值直方图。将贡献解析值直方图也作为解析结果。

其中，如图6a和如图6b所示，以分类类别为“南A大学附属医院”和“南A市交通运输局”为例进行说明。在贡献解析值直方图中能够按照每种分词的第一贡献解析值的大小顺序，依次展示每种分词对应的第一贡献解析值。在图6a中，按照每种分词的第一贡献解析值的大小顺序，依次展示的是“医院”、“复工”、“南A”“附属”等。在图6b中，按照每种分词的第一贡献解析值的大小顺序，依次展示的是“公交车”、“南A”、“肺炎”等。

实施例四

图7是本发明再一实施例提供的文本分类模型的解析方法的流程示意图，如图7所示，本实施例提供的文本分类模型的解析方法，是在实施例一至实施例三任意一个实施例提供的文本分类模型的解析方法的基础上，对步骤104的进一步细化，本实施例中，按照分类类别对目标文本样本进行分组，以获得多个类别样本集之后，还包括按照分类正确结果和分类错误结果，将每个类别样本集划分为正确类别样本集和错误类别样本集的步骤。相应地，步骤104包括以下步骤：

步骤104a，针对各正确类别样本集中的目标文本样本，根据贡献值确定每种分词在对应正确分类类别中的第二贡献解析值。

其中，第二贡献解析值是在每种分词在对应正确类别样本集中确定出来的贡献解析值。

本实施例中，在每个类别样本集中，既有分类正确的目标文本样本，又有分类错误的目标文本样本，所以继续对每个类别样本集继续进行分类，划分为正确类别样本集和错误类别样本集。针对每个正确类别样本集中的目标文本样本，可计算出在正确类别样本集中每种分词在对应正确类别中的贡献值的总和作为贡献总值或计算出在正确类别样本集中每种分词在对应正确类别中的贡献值的平均值作为贡献平均值。由于贡献总值和贡献平均值能够反映每种分词在对应正确类别样本集对应的类别中的整体贡献，可作为对目标文本分类模型进行解析时的贡献值，所以将贡献总值或贡献平均值确定为对应分词的第二贡献解析值。

步骤104b，按照第二贡献解析值，对每个正确分类类别的分词进行排序，形成多个正确分类类别对应的第二分词贡献解析值排序表。

步骤104c，将第二分词贡献解析值排序表确定为解析结果。

其中，按照第二贡献解析值对每个正确分类类别的分词进行排序后形成的排序表为第二分词贡献解析值排序表。

具体地，可对每个正确分类类别的分词按照第二贡献解析值由大到小的顺序进行排序，确定出每个分类类别对应的第二分词贡献解析排序子表，将每个第二分词贡献解析排序子表进行合并，获得多个分类类别对应的第二分词贡献解析值排序表。

本实施例提供的文本分类模型的解析方法，在根据贡献值对目标文本分类模型进行解析，以获得解析结果时，针对各正确类别样本集中的目标文本样本，根据贡献值确定每种分词在对应正确分类类别中的第二贡献解析值，按照第二贡献解析值，对每个正确分类类别的分词进行排序，形成多个正确分类类别对应的第二分词贡献解析值排序表，将第二分词贡献解析值排序表确定为解析结果。能够以正确分类类别为维度，确定出在各正确类别样本集中每种分词的第二贡献解析值，进而确定出第二分词贡献解析值排序表，准确对目标文本分类模型进行解析，能够有效解析出目标文本分类模型的优势，进而有效对目标文本分类模型进行调优。

实施例五

图8是本发明还一实施例提供的文本分类模型的解析方法的流程示意图，如图8所示，本实施例提供的文本分类模型的解析方法在上述实施例四提供的文本分类模型的解析方法的基础上，步骤104还包括以下步骤：

步骤104A，针对各错误类别样本集中的目标文本样本，根据贡献值确定每种分词在对应错误分类类别中的第三贡献解析值。

其中，第三贡献解析值是在每种分词在对应错误类别样本集中确定出来的贡献解析值。

本实施例中，对每个类别样本集继续进行分类，划分为正确类别样本集和错误类别样本集后，针对每个错误类别样本集中的目标文本样本，可计算出在错误类别样本集中每种分词在对应错误类别中的贡献值的总和作为贡献总值或计算出在错误类别样本集中每种分词在对应错误类别中的贡献值的平均值作为贡献平均值。由于贡献总值和贡献平均值能够反映每种分词在对应错误类别样本集对应的类别中的整体贡献，可作为对目标文本分类模型进行解析时的贡献值，所以将贡献总值或贡献平均值确定为对应分词的第三贡献解析值。

步骤104B，按照第三贡献解析值，对每个错误分类类别的分词进行排序，形成多个错误分类类别对应的第三分词贡献解析值排序表。

步骤104C，将第三分词贡献解析值排序表确定为解析结果。

本实施例中，步骤104B和步骤104C的实现方式与本发明实施例四中的步骤104b和步骤104c的实现方式类似，在此不再一一赘述。

本实施例提供的文本分类模型的解析方法，根据贡献值对目标文本分类模型进行解析，以获得解析结果时，针对各错误类别样本集中的目标文本样本，根据贡献值确定每种分词在对应错误分类类别中的第三贡献解析值；按照第三贡献解析值，对每个错误分类类别的分词进行排序，形成多个错误分类类别对应的第三分词贡献解析值排序表；将第三分词贡献解析值排序表确定为解析结果。能够以错误分类类别为维度，确定出在各错误类别样本集中每种分词的第三贡献解析值，进而确定出第三分词贡献解析值排序表，准确对目标文本分类模型进行解析，能够有效解析出目标文本分类模型的劣势，进而有效对目标文本分类模型进行调优。

实施例六

图9是本发明还一实施例提供的文本分类模型的解析方法的流程示意图，如图9所示，本实施例提供的文本分类模型的解析方法在上述任意一个实施例提供的文本分类模型的解析方法的基础上，在采用预设的可解释算法计算各目标文本样本每种分词在对应分类类别中的贡献值之后，还包括以下步骤：

步骤201，将每个目标文本样本中的分词按照贡献值由大到小进行排序。

步骤202，确定出排序在前面的多个目标分词，并将目标文本样本中的目标分词进行标注。

具体地，本实施例中，在每种应用场景下以及对文本分类模型调优时，针对每个目标文本样本中多种分词，每种分词对应的贡献值不同，后续对每种分词的关注度也不同。所以将每个目标文本样本中的分词按照贡献值由大到小进行排序。则排序在前面的分词贡献值大于排序在后面的贡献词。确定出排序在前面的多个目标分词组作为需要关注的目标分词，并将目标文本样本中的目标分词进行标注，以提示多关注目标分词，进而对目标文本样本进行处理或对文本分类模型进行调优。

其中，在将目标文本样本中的目标分词进行标注时，可将目标分词以高亮的进行标注，或将目标分词以区别于其他分词的颜色进行显示，或将目标分词框出来，本实施例中对此不作限定。

本实施例提供的文本分类模型的解析方法，在采用预设的可解释算法计算各目标文本样本每种分词在对应分类类别中的贡献值之后，将每个目标文本样本中的分词按照贡献值由大到小进行排序，确定出排序在前面的多个目标分词，并将目标文本样本中的目标分词进行标注。能够在每种应用场景下以及对文本分类模型调优时，基于标注出的目标分词，对目标文本样本进行处理或对文本分类模型进行调优。

实施例七

图10是本发明再一实施例提供的文本分类模型的解析方法的流程示意图，如图10所示，本实施例提供的文本分类模型的解析方法，在上述任意一个实施例提供的文本分类模型的解析方法的基础上，还包括以下步骤：

步骤301，将解析结果发送给用户终端，以使用户终端对解析结果进行显示。

本实施例中，可将第一分词贡献解析值排序表以及对应的贡献解析值直方图、第二分词贡献解析值排序表以及对应的贡献解析值直方图、第三分词贡献解析值排序表以及对应的贡献解析值直方图发送给用户终端，以使用户终端显示各排序表及贡献解析值直方图，并使用户对目标文本样本进行调整。

其中，在对目标文本样本进行调整时，可基于解析结果删除某些干扰的分词，或增加与分类结果有较强关联的目标文本样本等。本实施例中对目标文本样本的调整方式不作限定。

示例性地，如图6a和图6b所示，分词“南A”对目标文本分类模型进行分类时，有干扰的作用，所以删除“南A”这个干扰分词。

步骤302，接收用户终端发送的目标文本样本的调整指令。

本实施例中，用户通过用户终端对目标文本样本进行调整之后，通过用户终端触发目标文本样本的调整指令，用户终端将目标文本样本的调整指令发送给电子设备，电子设备接收到用户终端发送的目标文本样本的调整指令。

步骤303，根据调整指令对目标文本样本进行调整。

本实施例中，在目标文本样本的调整指令中，具有需要调整的目标文本样本的标识信息及具体的调整内容。根据需要调整的目标文本样本的标识信息及具体的调整内容对目标文本样本进行调整。

步骤304，采用调整后的目标文本样本对目标文本分类模型进行训练。

本实施例中，将调整后的目标文本样本输入到目标文本分类模型中，对目标文本分类模型进行训练，直到目标文本分类模型训练至收敛为止。

其中，目标文本分类模型是否收敛的条件不做限定。如使损失函数达到最小，迭代的次数达到预设迭代次数等。

本实施例提供的文本分类模型的解析方法，通过将解析结果发送给用户终端，以使用户终端对解析结果进行显示；接收用户终端发送的目标文本样本的调整指令；根据调整指令对目标文本样本进行调整；采用调整后的目标文本样本对目标文本分类模型进行训练。由于解析结果是根据贡献值确定出的目标分类模型的解析结果，所以能够细致解析出目标文本分类模型的分类原理和依据，使得解析的结果更加全面和准确，有效对目标文本分类模型进行调优。并且无需人工解析，提高了解析的效率。

实施例八

图11是本发明一实施例提供的文本分类模型的解析装置的结构示意图，如图11所示，本实施例提供的文本分类模型的解析装置40位于电子设备中，包括：获取模块41，确定模块42，计算模块43及解析模块44。

其中，获取模块41，用于获取目标文本分类模型和至少一个目标文本样本，目标文本分类模型为训练后的文本分类模型。确定模块42，用于确定各目标文本样本对应的分类类别。计算模块43，用于对各目标文本样本分别进行分词处理，并采用预设的可解释算法计算各目标文本样本每种分词在对应分类类别中的贡献值。解析模块44，用于根据贡献值对目标文本分类模型进行解析，以获得解析结果。

本实施例提供的文本分类模型的解析装置可以执行图2所示方法实施例的技术方案，其实现原理和技术效果与图2所示方法实施例类似，在此不再一一赘述。

可选地，计算模块43，在采用预设的可解释算法计算各目标文本样本每种分词在对应分类类别中的贡献值时，具体用于：

将每个目标文本样本中的多种分词分别作为输入特征输入到可解释算法中；采用可解释算法计算每个输入特征在对应分类类别中的贡献值；计算每个输入特征在对应分类类别中的贡献值的绝对值；将各贡献值的绝对值确定为各分词在对应分类类别中的贡献值。

可选地，本实施例提供的文本分类模型的解析装置还包括：样本分组模块，用于按照分类类别对目标文本样本进行分组，以获得多个类别样本集。

相应地，解析模块44，具体用于针对各类别样本集中的目标文本样本，根据贡献值确定每种分词在对应分类类别中的第一贡献解析值；按照第一贡献解析值，对每个分类类别的分词进行排序，形成多个分类类别对应的第一分词贡献解析值排序表；将第一分词贡献解析值排序表确定为解析结果。

可选地，解析模块44，在针对各类别样本集中的目标文本样本，确定每种分词在对应分类类别中的第一贡献解析值时，具体用于：

针对各类别样本集中的目标文本样本，计算每种分词的贡献总值或贡献平均值；将贡献总值或贡献平均值确定为对应分词的第一贡献解析值。

可选地，解析模块44，在按照第一贡献解析值，对每个分类类别的分词进行排序，形成多个分类类别对应的第一分词贡献解析值排序表之后，还用于：

根据每个分类类别中排序后的分词与对应第一贡献解析值的映射关系，生成各分类类别中每种分词的贡献解析值直方图；将贡献解析值直方图确定为解析结果。

可选地，样本分组模块，在按照分类类别对目标文本样本进行分组，以获得多个类别样本集之后，还用于：

按照分类正确结果和分类错误结果，将每个类别样本集划分为正确类别样本集和错误类别样本集。

可选地，解析模块44，具体用于：

针对各正确类别样本集中的目标文本样本，根据贡献值确定每种分词在对应正确分类类别中的第二贡献解析值；按照第二贡献解析值，对每个正确分类类别的分词进行排序，形成多个正确分类类别对应的第二分词贡献解析值排序表；将第二分词贡献解析值排序表确定为解析结果。

可选地，解析模块44，具体用于：

针对各错误类别样本集中的目标文本样本，根据贡献值确定每种分词在对应错误分类类别中的第三贡献解析值；按照第三贡献解析值，对每个错误分类类别的分词进行排序，形成多个错误分类类别对应的第三分词贡献解析值排序表；将第三分词贡献解析值排序表确定为解析结果。

可选地，本实施例提供的文本分类模型的解析装置还包括标注模块，用于将每个目标文本样本中的分词按照贡献值由大到小进行排序；确定出排序在前面的多个目标分词，并将目标文本样本中的目标分词进行标注。

可选地，本实施例提供的文本分类模型的解析装置还包括：发送模块，接收模块，调整模块和训练模块。

其中，发送模块，用于将解析结果发送给用户终端，以使用户终端对解析结果进行显示。接收模块，用于接收用户终端发送的目标文本样本的调整指令。调整模块，用于根据调整指令对目标文本样本进行调整。训练模块，用于采用调整后的目标文本样本对目标文本分类模型进行训练。

本实施例提供的文本分类模型的解析装置可以执行图3、图5、图7-图10所示方法实施例的技术方案，其实现原理和技术效果与图3、图5、图7-图10所示方法实施例类似，在此不再一一赘述。

实施例九

图12是用来实现本发明实施例的文本分类模型的解析方法的电子设备的结构示意图，如图12所示，本实施例提供的电子设备50包括：至少一个处理器52及存储器51；

存储器51存储计算机执行指令；

至少一个处理器52执行存储器存储的计算机执行指令，使得至少一个处理器执行如任意一个实施例提供的方法。

实施例十

图13是用来实现本发明实施例的文本分类模型的解析方法的电子设备的框图，如图13所示，本实施例提供的电子设备600可以包括以下一个或多个组件：处理组件602，存储器604，电源组件606，多媒体组件608，音频组件610，输入/输出(I/O)接口612，传感器组件614，以及通信组件616。

处理组件602通常控制服务器600的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件602可以包括一个或多个处理器620来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件602可以包括一个或多个模块，便于处理组件602和其他组件之间的交互。例如，处理组件602可以包括多媒体模块，以方便多媒体组件608和处理组件602之间的交互。

存储器604被配置为存储各种类型的数据以支持在服务器600的操作。这些数据的示例包括用于在服务器600上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器604可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件606为服务器600的各种组件提供电力。电源组件606可以包括电源管理系统，一个或多个电源，及其他与为服务器600生成、管理和分配电力相关联的组件。

多媒体组件608包括在服务器600和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件608包括一个前置摄像头和/或后置摄像头。当服务器600处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件610被配置为输出和/或输入音频信号。例如，音频组件610包括一个麦克风(MIC)，当服务器600处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器604或经由通信组件616发送。在一些实施例中，音频组件610还包括一个扬声器，用于输出音频信号。

I/O接口612为处理组件602和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件614包括一个或多个传感器，用于为服务器600提供各个方面的状态评估。例如，传感器组件614可以检测到服务器600的打开/关闭状态，组件的相对定位，例如组件为服务器600的显示器和小键盘，传感器组件614还可以检测服务器600或服务器600一个组件的位置改变，用户与服务器600接触的存在或不存在，服务器600方位或加速/减速和服务器600的温度变化。传感器组件614可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件614还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件614还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件616被配置为便于服务器600和其他设备之间有线或无线方式的通信。服务器600可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信组件616经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，通信组件616还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，服务器600可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器604，上述指令可由服务器600的处理器620执行以完成上述方法。例如，非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质，当该存储介质中的指令由服务器的处理器执行时，使得终端设备能够执行上述服务器的流程编排的更新方法。

在示例性实施例中，还提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行上述任意一个实施例提供的方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本发明旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求书指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。

Claims

1.一种文本分类模型的解析方法，其特征在于，包括：

确定各目标文本样本对应的分类类别；

2.根据权利要求1所述的方法，其特征在于，所述采用预设的可解释算法计算各所述目标文本样本每种分词在对应分类类别中的贡献值，包括：

将每个目标文本样本中的多种分词分别作为输入特征输入到可解释算法中；

采用所述可解释算法计算每个输入特征在对应分类类别中的贡献值；

计算每个输入特征在对应分类类别中的贡献值的绝对值；

将各所述贡献值的绝对值确定为各分词在对应分类类别中的贡献值。

3.根据权利要求1所述的方法，其特征在于，所述根据所述贡献值对所述目标文本分类模型进行解析，以获得解析结果之前，还包括：

按照所述分类类别对所述目标文本样本进行分组，以获得多个类别样本集；

所述根据所述贡献值对所述目标文本分类模型进行解析，以获得解析结果，包括：

针对各类别样本集中的目标文本样本，根据所述贡献值确定每种分词在对应分类类别中的第一贡献解析值；

按照第一贡献解析值，对每个分类类别的分词进行排序，形成多个分类类别对应的第一分词贡献解析值排序表；

将所述第一分词贡献解析值排序表确定为解析结果。

4.根据权利要求3所述的方法，其特征在于，所述针对各类别样本集中的目标文本样本，确定每种分词在对应分类类别中的第一贡献解析值，包括：

针对各类别样本集中的目标文本样本，计算每种分词的贡献总值或贡献平均值；

将所述贡献总值或贡献平均值确定为对应分词的第一贡献解析值。

5.根据权利要求3所述的方法，其特征在于，所述按照第一贡献解析值，对每个分类类别的分词进行排序，形成多个分类类别对应的第一分词贡献解析值排序表之后，还包括：

根据每个分类类别中排序后的分词与对应第一贡献解析值的映射关系，生成各分类类别中每种分词的贡献解析值直方图；

将所述贡献解析值直方图确定为解析结果。

6.根据权利要求3所述的方法，其特征在于，所述按照所述分类类别对所述目标文本样本进行分组，以获得多个类别样本集之后，还包括：

7.根据权利要求6所述的方法，其特征在于，所述根据所述贡献值对所述目标文本分类模型进行解析，以获得解析结果，包括：

针对各正确类别样本集中的目标文本样本，根据所述贡献值确定每种分词在对应正确分类类别中的第二贡献解析值；

按照第二贡献解析值，对每个正确分类类别的分词进行排序，形成多个正确分类类别对应的第二分词贡献解析值排序表；

将所述第二分词贡献解析值排序表确定为解析结果。

8.根据权利要求6所述的方法，其特征在于，所述根据所述贡献值对所述目标文本分类模型进行解析，以获得解析结果，包括：

针对各错误类别样本集中的目标文本样本，根据所述贡献值确定每种分词在对应错误分类类别中的第三贡献解析值；

按照第三贡献解析值，对每个错误分类类别的分词进行排序，形成多个错误分类类别对应的第三分词贡献解析值排序表；

将所述第三分词贡献解析值排序表确定为解析结果。

9.根据权利要求1-8任一项所述的方法，其特征在于，所述采用预设的可解释算法计算各所述目标文本样本每种分词在对应分类类别中的贡献值之后，还包括：

将每个目标文本样本中的分词按照所述贡献值由大到小进行排序；

确定出排序在前面的多个目标分词，并将目标文本样本中的目标分词进行标注。

10.根据权利要求1-8任一项所述的方法，其特征在于，还包括：

将所述解析结果发送给用户终端，以使用户终端对所述解析结果进行显示；

接收用户终端发送的目标文本样本的调整指令；

根据所述调整指令对目标文本样本进行调整；

采用调整后的目标文本样本对所述目标文本分类模型进行训练。

11.一种文本分类模型的解析装置，其特征在于，包括：

确定模块，用于确定各目标文本样本对应的分类类别；

12.一种电子设备，其特征在于，包括：至少一个处理器及存储器；

所述存储器存储计算机执行指令；

所述至少一个处理器执行所述存储器存储的计算机执行指令，使得所述至少一个处理器执行如权利要求1-10任一项所述的方法。

13.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如权利要求1-10任一项所述的方法。

14.一种计算机程序产品，包括计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1-10任一项所述的方法。