WO2020073531A1

WO2020073531A1 - 文本分类模型的更新训练方法、装置及设备

Info

Publication number: WO2020073531A1
Application number: PCT/CN2018/125250
Authority: WO
Inventors: 许开河; 杨坤; 王少军; 肖京
Original assignee: 平安科技（深圳）有限公司
Priority date: 2018-10-12
Filing date: 2018-12-29
Publication date: 2020-04-16
Also published as: CN109241288A

Abstract

一种文本分类模型的更新训练方法、装置及设备，文本分类模型包括语义提取层和分类层，在新增知识点前，根据原有知识点的样本数据完成语义提取层和分类层的训练，所述方法包括：获取新增知识点对应的样本文本以及对样本文本进行标注的标注标签（S110）；通过根据样本数据完成训练的语义提取层构建样本文本的特征向量（S130）；根据样本文本的特征向量以及样本文本对应的标注标签进行分类层的更新训练，以实现文本分类模型的更新训练（S150）。在需要对文本分类模型进行更新训练时，仅进行分类层的更新训练，从而可以大幅缩短文本分类模型更新训练的时间，实现文本分类模型的及时更新。

Description

文本分类模型的更新训练方法、装置及设备

技术领域

本申请要求2018年10月12日递交、发明名称为“文本分类模型的更新训练方法、装置及设备”的中国专利申请CN201811192187.4的优先权，在此通过引用将其全部内容合并于此。

本公开涉及人工智能技术领域，特别涉及一种文本分类模型的更新训练方法、装置及设备。

背景技术

现有客服机器人问答系统中的文本分类模型，在客服机器人的知识库新增新产品相关的知识点或者新增热点问题相关的知识点后，需要对文本分类模型进行重新训练，一般重新训练一个文本分类模型需要很长的时间，从而导致文本分类模型更新不及时，客服机器人无法回答新增知识点相关的问题。

所以由于文本分类模型训练时间长导致文本分类模型更新不及时的问题还有待解决。

技术问题

为了解决相关技术中存在的问题，本公开提供了一种文本分类模型的更新训练方法及装置。

技术解决方案

一种文本分类模型的更新训练方法，所述文本分类模型包括语义提取层和分类层，在新增知识点前，根据原有知识点的样本数据完成所述语义提取层和所述分类层的训练，所述文本分类模型的更新训练方法包括：

获取新增知识点对应的样本文本以及对所述样本文本进行标注的标注标签；

通过根据所述样本数据完成训练的所述语义提取层构建所述样本文本的特征向量；

根据所述样本文本的特征向量以及所述样本文本对应的标注标签进行所述分类层的更新训练，以实现所述文本分类模型的更新训练。

一种文本分类模型的更新训练装置，所述文本分类模型包括语义提取层和分类层，在新增知识点前，根据原有知识点的样本数据完成所述语义提取层和所述分类层的训练，所述文本分类模型的更新训练装置包括：

获取模块，被配置为：获取新增知识点对应的样本文本以及对所述样本文本进行标注的标注标签；

特征向量构建模块，被配置为：通过根据所述样本数据完成训练的所述语义提取层构建所述样本文本的特征向量；

更新训练模块，被配置为：根据所述样本文本的特征向量以及所述样本文本对应的标注标签进行所述分类层的更新训练，以实现所述文本分类模型的更新训练。

在一实施例中，所述特征向量构建模块包括：

分词单元，被配置为：通过根据原有知识点的样本数据完成训练的所述语义提取层对所述样本文本进行分词；

特征向量构建单元，被配置为：根据所述样本文本中的每个词对应的编码以及每个词的语义权重构建所述样本文本的特征向量。

在一实施例中，所述装置还包括：

分类标签补充模块，被配置为：根据所述样本文本对应的标注标签补充所述分类层的分类标签；

分类标签集合更新模块，被配置为：根据所补充的分类标签更新所述分类层的分类标签集合。

在一实施例中，所述更新训练模块包括：

分类标签预测单元，被配置为：利用所述分类层根据所述样本文本的特征向量预测得到所述样本文本所对应的分类标签；

判断单元，被配置为：进行所得到的所述分类标签与所述样本文本所对应标注标签的一致性判断；

调整单元，被配置为：如果不一致，调整所述分类层的参数直至所得到的所述分类标签与所述标注标签一致。

在一实施例中，分类标签预测单元包括：

概率预测单元，被配置为：利用所述分类层根据所述特征向量预测得到所述特征向量对应于更新后的所述分类标签集合中每一分类标签的概率；

分类标签确定单元，被配置为：遍历所述每一分类标签的概率，以最大概率值所对应的分类标签作为所述样本文本对应的分类标签。

在一实施例中，所述装置还包括：

分类测试模块，被配置为：通过更新后的所述文本分类模型对若干测试样本进行分类；

分类精度计算模块，被配置为：根据分类结果计算得到更新训练后的所述文本分类模型对所述若干测试样本的分类精度；

更新训练结束模块，被配置为：如果所述分类精度达到指定精度，结束所述文本分类模型的更新训练。

一种文本分类模型的更新训练设备，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为以上所述的方法。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以上所述的方法。

有益效果

通过本申请的技术方案，在文本分类模型已根据原有知识点的样本数据进行训练的基础上，在需要对文本分类模型进行更新训练时，仅进行分类层的更新训练，实现文本分类模型的更新训练，从而可以大幅缩短文本分类模型更新训练的时间，实现文本分类模型的及时更新，进而人工智能技术领域中的客服机器人等可以及时用于进行新增知识点相关问题的回复。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并于说明书一起用于解释本申请的原理。

图1是根据本公开所涉及的实施环境的示意图；

图2是根据一示例性实施例示出的一种服务器的框图；

图3是根据一示例性实施例示出的一种文本分类模型的更新训练方法的流程图；

图4是图3所示实施例的步骤S130的流程图；

图5是是图3所示实施例的步骤S150之前步骤的流程图；

图6是图3所示实施例的步骤S150的流程图；

图7是图6所示实施例的步骤S151的流程图；

图8是图3所示实施例的步骤S150之后步骤的流程图；

图9是根据一示例性实施例示出的一种文本分类模型的更新训练装置的框图；

图10是根据一示例性实施例示出的一种文本分类模型的更新训练设备的框图。

本发明的实施方式

这里将详细地对示例性实施例执行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

图1是根据本公开所涉及的实施环境的示意图。该实施环境包括：服务器200和至少一个终端100。

其中终端100可以是智能手机、平板电脑、笔记本电脑、台式电脑等可以与服务器200建立网络连接且可以运行客户端的电子设备，在此不进行具体限定。终端100与服务器200之间预先建立了无线或者有线的网络连接，从而，通过在终端100上运行的客户端实现终端100与服务器200进行交互。

基于服务器200与终端100之间的交互，服务器200便可以获取到用户在终端100上输入的样本文本，然后构建该样本文本的特征向量、对特征向量进行分类预测实现文本分类模型的更新训练等。终端100可以接收服务器200所返回的针对样本文本的分类标签。

应当说明的是，本公开文本分类方法，不限于在服务器200中部署相应的处理逻辑，其也可以是部署于其它机器中的处理逻辑。例如，在具备计算能力的终端设备中部署进行文本分类模型的更新训练的处理逻辑等。

图2是根据一示例性实施例示出的一种服务器的框图。具有此硬件结构的服务器可用于进行文本分类模型的更新训练而部署在图1所示的实施环境中。

需要说明的是，该服务器只是一个适配于本公开的示例，不能认为是提供了对本公开使用范围的任何限制。该服务器也不能解释为需要依赖于或者必须具有图2中示出的示例性的服务器200中的一个或者多个组件。

该服务器的硬件结构可因配置或者性能的不同而产生较大的差异，如图2所示，服务器200包括：电源210、接口230、至少一存储器250、以及至少一中央处理器（CPU, Central Processing Units）270。

其中，电源210用于为服务器200上的各硬件设备提供工作电压。

接口230包括至少一有线或无线网络接口231、至少一串并转换接口233、至少一输入输出接口235以及至少一USB接口237等，用于与外部设备通信，例如与终端100进行数据传输。

存储器250作为资源存储的载体，可以是只读存储器、随机存储器、磁盘或者光盘等，其上所存储的资源包括操作系统251、应用程序253及数据255等，存储方式可以是短暂存储或者永久存储。其中，操作系统251用于管理与控制服务器200上的各硬件设备以及应用程序253，以实现中央处理器270对海量数据255的计算与处理，其可以是Windows ServerTM、Mac OS XTM、UnixTM、LinuxTM、FreeBSDTM等。应用程序253是基于操作系统251之上完成至少一项特定工作的计算机程序，其可以包括至少一模块（图2中未示出），每个模块都可以分别包含有对服务器200的一系列计算机可读指令。数据255可以是存储于磁盘中的样本数据等。

中央处理器270可以包括一个或多个以上的处理器，并设置为通过总线与存储器250通信，用于运算与处理存储器250中的海量数据255。

如上面所详细描述的，适用本公开的服务器200将通过中央处理器270读取存储器250中存储的一系列计算机可读指令的形式来完成文本分类模型的更新训练。

在示例性实施例中，服务器200可以被一个或多个应用专用集成电路（Application Specific Integrated Circuit ，简称ASIC）、数字信号处理器、数字信号处理设备、可编程逻辑器件、现场可编程门阵列、控制器、微控制器、微处理器或其他电子元件实现，用于执行下述文本分类方法。因此，实现本公开并不限于任何特定硬件电路、软件以及两者的组合。

图3是根据一示例性实施例示出的一种文本分类模型的更新训练方法的流程图。该文本分类模型的更新训练方法可以图1所示实施环境的服务器200执行。在图3所示实施例中，文本分类模型包括语义提取层和分类层，在新增知识点前，根据原有知识点的样本数据完成语义提取层和分类层的训练，该文本分类模型的更新训练方法包括以下步骤：

步骤S110，获取新增知识点对应的样本文本以及对样本文本进行标注的标注标签。

本申请的文本分类模型是通过神经网络构建的，其中文本分类模型可以通过卷积神经网络（CNN）、循环神经网络（RNN）等可以进行文本分类的神经网络构建，也可以通过多种类型的神经网络组合而成，在此不进行具体限定。

在根据原有知识点的样本数据完成语义提取层和分类层的训练后，通过该训练，确定了语义提取层和分类层的参数，从而该文本分类模型可以实现对原有知识点相关的问题进行分类，即语义提取层可以构建文本的特征向量，分类层可以基于文本的特征向量对文本进行分类。

在文本分类模型根据原有知识点的样本数据完成训练后，该原有知识点的样本数据构成了该文本分类模型的数据库。针对在不同应用场景的文本分类模型，样本数据不同，相应的文本分类模型的数据库也不相同。

其中新增知识点可以是文本分类模型的数据库中未包含的知识点，或者是针对原有数据库中的知识点进行修改的知识点，在此不进行具体限定。针对新增知识点，需要利用新增知识点的样本文本以及对样本文本进行标注的标注标签进行文本分类模型的更新训练。

举例来说，例如应用于保险领域的客服机器人中的文本分类模型，新增知识点可以是所开发的新保险业务，相对应的，新增知识点的样本文本即为与该新保险业务相关的问题，例如该保险办理流程、办理材料、办理条件、理赔流程等相关问题；新增知识点还可以是原有保险理赔流程变更，相对应的，新增知识点的样本文本即为与该变更的保险理赔流程相关的问题。从而，在进行文本分类模型的更新训练之后，客服机器人可以针对用户所提出关于新增知识点的问题进行分类，进而根据分类结果搜索答案并向用户呈现所搜索的答案。

样本文本的标注标签是通过人工对该样本文本进行分类得到的标签，在具体实施例中，可以通过人工对样本文本进行标注得到标注标签，并保存标注的标注标签。

步骤S130，通过根据样本数据完成训练的语义提取层构建样本文本的特征向量。

由上文叙述可知，在语义提取层根据样本数据完成训练之后，语义提取层的参数确定，在步骤S130中，根据所确定参数的语义提取层构建样本文本的特征向量。而在之后的步骤中，不需要再调整语义提取层的参数，即不进行语义提取层的更新训练。

特别是人工智能技术领域中的客服机器人，由于在客服机器人进行线上服务前，应用大量的样本数据训练客服机器人的文本分类模型，文本分类模型的语义提取层构建文本的特征向量的功能完善。所以，在经过线上服务前的训练之后，新增知识点时，语义提取层也可以构建文本的特征向量。

在一示例性实施例中，如图4所示，步骤S130包括：

步骤S131，通过根据原有知识点的样本数据完成训练的语义提取层对样本文本进行分词。

步骤S132，根据样本文本中的每个词对应的编码以及每个词的语义权重构建样本文本的特征向量。

对样本文本进行分词即将样本文本分割成若干个顺序排列的词组。分词可以采用分词算法进行，例如可以采用基于字符串匹配的分词算法、基于理解的分词算法或基于统计的分词算法等，在此不进行具体限定。

在根据原有知识点的样本数据完成文本分类模型的训练之后，通过样本数据构建了该文本分类模型的数据库，该数据库中包括根据样本数据所构建的词典，词典中包括了样本数据中所包含的词对应的编码，以及词所对应的语义权重。

词所对应的语义权重用于表征在样本文本中，该词对样本文本语义的贡献程度。例如在“办理平安车主卡的流程有哪些”这文本中，根据步骤S131得到的分词结果为“办理^平安^车主卡^的^流程^有^哪些”，“的”“有”“哪些”这三个词对该文本的语义贡献程度不大，从而该三个词在该文本中所对应的语义权重小一些，而“办理”“平安”“车主卡”“流程”这四个词对该文本语义的贡献程度更大，从而该四个词所在该样本文本中语义权重也相对较大。当然每个词对应的编码以及对应的语义权重是训练之后确定的，在本申请中即根据原有知识点的样本数据完成语义提取层的训练后确定的。当然，样本数据量越大，词典越完善，词典中词所对应的编码以及词的语义权重也更完善，从而语义提取层构建文本的特征向量的功能也越完善。

在完成分词后，根据每个词对应的编码以及每个词对应的语义权重即可构建该样本文本的特征向量。在具体实施例中，一般用数字表示词所对应的编码，而且用实数表示词所对应的权重，从而所构建的输入文本的特征向量为实数向量。

步骤S150，根据样本文本的特征向量以及样本文本对应的标注标签进行分类层的更新训练，以实现文本分类模型的更新训练。

对分类层进行更新训练即在更新训练过程中调整分类层的参数。在根据样本文本的特征向量以及样本文本对应的标注标签进行分类层的更新训练后，文本分类模型可以针对新增知识点相关的文本输出该文本对应的分类标签，即实现了文本分类模型的更新训练。

通过本申请的技术方案，在文本分类模型根据原有知识点的样本数据进行充分训练的基础上，语义提取层构建文本的特征向量的功能完善。在需要对文本分类模型进行更新训练时，仅进行分类层的更新训练，并利用原语义提取层构建样本文本的特征向量，而不进行原语义提取层的更新训练，从而可以大幅缩短文本分类模型的更新训练时间，实现文本分类模型的及时更新。

特别是人工智能技术领域的客服机器人中，在客服机器人进行线上服务前，客服机器人的文本分类模型的样本数据动辄几十万条，样本数据量大，训练时间长，文本分类模型的语义提取层构建文本的特征向量的功能十分完善。从而在文本分类模型需要进行更新训练时，仅进行分类层的更新训练，而不进行语义提取层的更新训练，大幅缩短了文本分类模型的更新训练时间，而且保证了在更新训练后文本分类模型对原有知识点、新增知识点相关文本的分类精度。特别是在新增知识点相对于原有知识点的量较少，而又需要进行文本分类模型的更新训练时，通过本申请的技术方案，可以实现文本分类模型的及时更新，而且也可以保证文本分类模型的分类精度。

在一示例性实施例中，如图5所示，在步骤S150之前还包括：

步骤S010，根据样本文本对应的标注标签补充分类层的分类标签。

步骤S030，根据所补充的分类标签更新分类层的分类标签集合。

分类标签集合中包括了分类层可输出的全部分类标签。一个标注标签对应于分类层的一个分类标签，在新增知识点时，由于原有知识点中不包括新增知识点的样本文本，当然也无法对新增知识点的样本文本进行正确分类。根据样本文本对应的标注标签补充分类层的分类标签，并更新分类层的分类标签集合后，从而在根据样本文本进行分类层的更新训练时，可以从更新后的分类标签集合中确定样本文本的分类标签。

在一示例性实施例中，如图6所示，步骤S150包括：

步骤S151，利用分类层根据样本文本的特征向量预测得到样本文本所对应的分类标签。

步骤S152，进行所得到的分类标签与样本文本所对应标注标签的一致性判断。

步骤S153，如果不一致，调整分类层的参数直至所得到的分类标签与标注标签一致。

文本分类模型的训练即在训练过程中调整文本分类模型的参数，使文本分类模型输出的分类标签与人工进行标注的标注标签一致。如果两者一致，不需要调整文本分类模型的参数，如果不一致，则调整文本分类模型的参数直至两者一致。在本申请的技术方案中，通过文本分类模型更新训练时，调整分类层的参数使样本文本的分类标签与标注标签一致。

在具体实施例中，如果通过分类层得到的分类标签与样本文本所对应标注标签一致，则用下一样本文本进行文本分类模型的更新训练。

在现有技术中，不管是文本分类模型的初次训练还是更新训练，都是语义提取层和分类层均进行训练，即训练过程中，如果分类层所输出样本文本的分类标签与样本文本的标注标签不一致，则调整语义提取层和分类层的参数，直到二者一致。

由于在文本分类模型中，语义提取层的神经网络结构更复杂，运算过程更复杂、运算量更大，在调整了语义提取层的参数后，语义提取层需要根据调整后的参数重新经过运算构建文本的特征向量，所以训练文本分类模型的时间长。

而在本申请中，仅调整分类层的参数，相当于仅对分类层进行更新训练，从而可以大幅缩短文本分类模型更新训练的时间。

在实际测试中，利用四个公开数据集做测试，ag_news, Dbpedia, Yahoo!Answer和平安银行FAQ知识库。在四个数据集上通过实验对比，采用本申请的文本分类模型的更新训练方法所用的训练时间缩短为全文本分类模型重新训练所花费时间的1/10。

在一示例性实施例中，如图7所示，步骤S151包括：

步骤S210，利用分类层根据特征向量预测得到特征向量对应于更新后的分类标签集合中每一分类标签的概率。

步骤S230，遍历每一分类标签的概率，以最大概率值所对应的分类标签作为样本文本对应的分类标签。

在一示例性实施例中，如图8所示，步骤S150之后还包括：

步骤S171，通过更新后的所述文本分类模型对若干测试样本进行分类。

步骤S172，根据分类结果计算得到更新训练后的所述文本分类模型对所述若干测试样本的分类精度。

步骤S173，如果分类精度达到指定精度，结束文本分类模型的更新训练。

其中步骤S171-173用于测试更新训练后文本分类模型的分类精度。其中测试样本可以包括原有知识点相关的文本和/或新增知识点相关的文本，优选包括原有知识点的文本和新增知识点的文本。并对测试样本进行标注。在步骤S172中，将文本分类模型对每一测试样本输出的分类标签与每一测试样本的标注进行对比，如果两者一致，则认为分类准确，如果不一致，则认为分类错误，计算分类准确的测试样本数量占总测试样本的比例，该比例即为更新后的文本分类模型对若干测试样本的分类精度。

如果分类精度达到指定精度，则结束文本分类模型的更新训练，如果分类精度未达到指定精度，则重复步骤S110、S130、S150继续进行文本分类模型的更新训练。

下述为本公开装置实施例，可以用于执行本公开上述服务器200执行的文本分类模型的更新训练方法实施例。对于本公开装置实施例中未披露的细节，请参照本公开文本分类模型的更新训练方法实施例。

图9是根据一示例性实施例示出的一种文本分类模型的更新训练装置的框图，该文本分类模型的更新训练可以用于图1所示实施环境的服务器200中，执行以上任一实施例中的文本分类模型的更新训练方法的全部或者部分步骤。如图9所示，该文本分类模型的更新训练装置包括但不限于：获取模块110、特征向量构建模块130以及更新训练模块150，其中该文本分类模型包括语义提取层和分类层，在新增知识点前，根据原有知识点的样本数据完成语义提取层和分类层的训练，该装置包括：

获取模块110，被配置为：获取新增知识点对应的样本文本以及对样本文本进行标注的标注标签。

特征向量构建模块130，该模块与获取模块110连接，被配置为：通过根据样本数据完成训练的语义提取层构建样本文本的特征向量。

更新训练模块150，该模块与特征向量构建模块130连接，被配置为：根据样本文本的特征向量以及样本文本对应的标注标签进行分类层的更新训练，以实现文本分类模型的更新训练。

在一实施例中，特征向量构建模块130包括：

分词单元，被配置为：通过根据原有知识点的样本数据完成训练的语义提取层对样本文本进行分词。

特征向量构建单元，被配置为：根据样本文本中的每个词对应的编码以及每个词的语义权重构建样本文本的特征向量。

在一实施例中，文本分类模型的更新训练装置还包括：

分类标签补充模块，被配置为：根据样本文本对应的标注标签补充分类层的分类标签。

分类标签集合更新模块，被配置为：根据所补充的分类标签更新分类层的分类标签集合。

在一实施例中，更新训练模块150包括：

分类标签预测单元，被配置为：利用分类层根据样本文本的特征向量预测得到样本文本所对应的分类标签，更新后的分类标签集合包括样本文本所对应的分类标签。

判断单元，被配置为：进行所得到的分类标签与样本文本所对应标注标签的一致性判断。

调整单元，被配置为：如果不一致，调整分类层的参数直至所得到的分类标签与标注标签一致。

在一实施例中，分类标签预测单元包括：

概率预测单元，被配置为：利用分类层根据特征向量预测得到特征向量对应于更新后的分类标签集合中每一分类标签的概率。

分类标签确定单元，被配置为：遍历每一分类标签的概率，以最大概率值所对应的分类标签作为样本文本对应的分类标签。

在一实施例中，文本分类模型的更新训练装置还包括：

分类测试模块，被配置为：通过更新后的所述文本分类模型对若干测试样本进行分类。

分类精度计算模块，被配置为：根据分类结果计算得到更新训练后的所述文本分类模型对所述若干测试样本的分类精度。

更新训练结束模块，被配置为：如果分类精度达到指定精度，结束分类模型的更新训练。

上述装置中各个模块/单元的功能和作用的实现过程具体详见上述文本分类模型的更新训练方法中对应步骤的实现过程，在此不再赘述。

可以理解，这些模块/单元可以通过硬件、软件、或二者结合来实现。当以硬件方式实现时，这些模块可以实施为一个或多个硬件模块，例如一个或多个专用集成电路。当以软件方式实现时，这些模块可以实施为在一个或多个处理器上执行的一个或多个计算机程序，例如图2的中央处理器270所执行的存储在存储器250中的程序。

可选的，本公开还提供一种文本分类模型的更新训练设备，该文本分类设备可以是图1所示实施环境的服务器200，执行以上文本分类模型的更新训练方法实施例中的全部或者部分步骤。如图10所示，该文本分类模型的更新训练设备包括：

处理器1001；

用于存储处理器1001可执行指令的存储器1002；

其中，处理器1001被配置为以上文本分类模型的更新训练方法任一实施例中的全部或者部分步骤，可执行指令可以是计算机可读指令，处理器1001在执行时，可以通过通讯总线/数据线1003从存储器1002中读取计算机可读指令。

该实施例中的设备的处理器执行操作的具体方式已经在有关该文本分类模型的更新训练方法的实施例中执行了详细描述，此处将不做详细阐述说明。

在示例性实施例中，还提供了一种计算机可读存储介质，例如可以为包括指令的临时性和非临时性计算机可读存储介质。该存储介质可以是包括指令的存储器250，上述指令可由服务器200的中央处理器270执行以完成上述文本分类模型的更新训练方法。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围执行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

一种文本分类模型的更新训练方法，所述文本分类模型包括语义提取层和分类层，在新增知识点前，根据原有知识点的样本数据完成所述语义提取层和所述分类层的训练，其中，包括：

获取新增知识点对应的样本文本以及对所述样本文本进行标注的标注标签；

通过根据所述样本数据完成训练的所述语义提取层构建所述样本文本的特征向量；

根据所述样本文本的特征向量以及所述样本文本对应的标注标签进行所述分类层的更新训练，以实现所述文本分类模型的更新训练。
根据权利要求1所述的方法，其中，所述通过根据所述样本数据完成训练的所述语义提取层构建所述样本文本的特征向量，包括：

通过根据原有知识点的样本数据完成训练的所述语义提取层对所述样本文本进行分词；

根据所述样本文本中的每个词对应的编码以及每个词的语义权重构建所述样本文本的特征向量。
根据权利要求1或2所述的方法，其中，所述根据所述样本文本的特征向量以及所述样本文本对应的标注标签进行所述分类层的更新训练，以实现所述文本分类模型的更新训练之前，还包括：

根据所述样本文本对应的标注标签补充所述分类层的分类标签；

根据所补充的分类标签更新所述分类层的分类标签集合。
根据权利要求3所述的方法，其中，所述根据所述样本文本的特征向量以及所述样本文本对应的标注标签进行所述分类层的更新训练，以实现所述文本分类模型的更新训练，包括：

利用所述分类层根据所述样本文本的特征向量预测得到所述样本文本所对应的分类标签；

进行所得到的所述分类标签与所述样本文本所对应标注标签的一致性判断；

如果不一致，调整所述分类层的参数直至所得到的所述分类标签与所述标注标签一致。
根据权利要求4所述的方法，其中，所述利用所述分类层根据所述样本文本的特征向量预测得到所述样本文本所对应的分类标签，包括：

利用所述分类层根据所述特征向量预测得到所述特征向量对应于更新后的所述分类标签集合中每一分类标签的概率；

遍历所述每一分类标签的概率，以最大概率值所对应的分类标签作为所述样本文本对应的分类标签。
根据权利要求1至5中任一项所述的方法，其中，根据所述新增样本的特征向量以及所述新增样本对应的标注进行所述分类层的更新训练之后，还包括：

通过更新后的所述文本分类模型对若干测试样本进行分类；

根据分类结果计算得到更新训练后的所述文本分类模型对所述若干测试样本的分类精度；

如果所述分类精度达到指定精度，结束所述文本分类模型的更新训练。
一种文本分类模型的更新训练装置，所述文本分类模型包括语义提取层和分类层，在新增知识点前，根据原有知识点的样本数据完成所述语义提取层和所述分类层的训练，其中，包括：

获取模块，被配置为：获取新增知识点对应的样本文本以及对所述样本文本进行标注的标注标签；

特征向量构建模块，被配置为：通过根据所述样本数据完成训练的所述语义提取层构建所述样本文本的特征向量；

更新训练模块，被配置为：根据所述样本文本的特征向量以及所述样本文本对应的标注标签进行所述分类层的更新训练，以实现所述文本分类模型的更新训练。
根据权利要求7所述的装置，其中，所述特征向量构建模块包括：

分词单元，被配置为：通过根据原有知识点的样本数据完成训练的所述语义提取层对所述样本文本进行分词；

特征向量构建单元，被配置为：根据所述样本文本中的每个词对应的编码以及每个词的语义权重构建所述样本文本的特征向量。
根据权利要求7或8所述的装置，其中，所述装置还包括：

分类标签补充模块，被配置为：根据所述样本文本对应的标注标签补充所述分类层的分类标签；

分类标签集合更新模块，被配置为：根据所补充的分类标签更新所述分类层的分类标签集合。
根据权利要求9所述的装置，其中，所述更新训练模块包括：

分类标签预测单元，被配置为：利用所述分类层根据所述样本文本的特征向量预测得到所述样本文本所对应的分类标签；

判断单元，被配置为：进行所得到的所述分类标签与所述样本文本所对应标注标签的一致性判断；

调整单元，被配置为：如果判断单元判断所得到的所述分类标签与所述样本文本所对应标注标签不一致，调整所述分类层的参数直至所得到的所述分类标签与所述标注标签一致。
根据权利要求10所述的装置，其中，所述分类标签预测单元包括：

概率预测单元，被配置为：利用所述分类层根据所述特征向量预测得到所述特征向量对应于更新后的所述分类标签集合中每一分类标签的概率；

分类标签确定单元，被配置为：遍历所述每一分类标签的概率，以最大概率值所对应的分类标签作为所述样本文本对应的分类标签。
根据权利要求7至11中任一项所述的方法，其中，所述装置还包括：

分类测试模块，被配置为：通过更新后的所述文本分类模型对若干测试样本进行分类；

分类精度计算模块，被配置为：根据分类结果计算得到更新训练后的所述文本分类模型对所述若干测试样本的分类精度；

更新训练结束模块，被配置为：如果所述分类精度达到指定精度，结束所述文本分类模型的更新训练。
一种文本分类模型的更新训练设备，所述文本分类模型包括语义提取层和分类层，在新增知识点前，根据原有知识点的样本数据完成所述语义提取层和所述分类层的训练，其中，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为以下步骤：

获取新增知识点对应的样本文本以及对所述样本文本进行标注的标注标签；

通过根据所述样本数据完成训练的所述语义提取层构建所述样本文本的特征向量；

根据所述样本文本的特征向量以及所述样本文本对应的标注标签进行所述分类层的更新训练，以实现所述文本分类模型的更新训练。
根据权利要求13所述的设备，其中，在所述通过根据所述样本数据完成训练的所述语义提取层构建所述样本文本的特征向量步骤中，所述处理器执行以下步骤：

通过根据原有知识点的样本数据完成训练的所述语义提取层对所述样本文本进行分词；

根据所述样本文本中的每个词对应的编码以及每个词的语义权重构建所述样本文本的特征向量。
根据权利要求13或14所述的设备，其中，在所述根据所述样本文本的特征向量以及所述样本文本对应的标注标签进行所述分类层的更新训练，以实现所述文本分类模型的更新训练步骤之前，所述处理器还执行以下步骤：

根据所述样本文本对应的标注标签补充所述分类层的分类标签；

根据所补充的分类标签更新所述分类层的分类标签集合。
根据权利要求15所述的设备，其中，在所述根据所述样本文本的特征向量以及所述样本文本对应的标注标签进行所述分类层的更新训练，以实现所述文本分类模型的更新训练步骤中，所述处理器执行以下步骤：

利用所述分类层根据所述样本文本的特征向量预测得到所述样本文本所对应的分类标签；

进行所得到的所述分类标签与所述样本文本所对应标注标签的一致性判断；

如果不一致，调整所述分类层的参数直至所得到的所述分类标签与所述标注标签一致。
根据权利要求16所述的方法，其中，在利用所述分类层根据所述样本文本的特征向量预测得到所述样本文本所对应的分类标签的步骤中，所述处理器执行以下步骤：

利用所述分类层根据所述特征向量预测得到所述特征向量对应于更新后的所述分类标签集合中每一分类标签的概率；

遍历所述每一分类标签的概率，以最大概率值所对应的分类标签作为所述样本文本对应的分类标签。
根据权利要求13至17中任一项所述的设备，其中，在根据所述新增样本的特征向量以及所述新增样本对应的标注进行所述分类层的更新训练步骤之后之后，所述处理器还执行以下步骤：

通过更新后的所述文本分类模型对若干测试样本进行分类；

根据分类结果计算得到更新训练后的所述文本分类模型对所述若干测试样本的分类精度；

如果所述分类精度达到指定精度，结束所述文本分类模型的更新训练。
一种计算机可读存储介质，其上存储有计算机程序，其中，所述计算机程序由处理器执行以下步骤：

获取新增知识点对应的样本文本以及对所述样本文本进行标注的标注标签；

通过根据所述样本数据完成训练的所述语义提取层构建所述样本文本的特征向量；

根据所述样本文本的特征向量以及所述样本文本对应的标注标签进行所述分类层的更新训练，以实现所述文本分类模型的更新训练；

其中，所述文本分类模型包括语义提取层和分类层，在新增知识点前，根据原有知识点的样本数据完成所述语义提取层和所述分类层的训练。
根据权利要求1所述的计算机可读存储介质，其中，在通过根据所述样本数据完成训练的所述语义提取层构建所述样本文本的特征向量步骤中，所述处理器执行以下步骤：

通过根据原有知识点的样本数据完成训练的所述语义提取层对所述样本文本进行分词；

根据所述样本文本中的每个词对应的编码以及每个词的语义权重构建所述样本文本的特征向量。
根据权利要求19或20所述的计算机可读存储介质，其中，在根据所述样本文本的特征向量以及所述样本文本对应的标注标签进行所述分类层的更新训练，以实现所述文本分类模型的更新训练步骤之前，所述处理器还执行以下步骤：

根据所述样本文本对应的标注标签补充所述分类层的分类标签；

根据所补充的分类标签更新所述分类层的分类标签集合。
根据权利要求21所述的计算机可读存储介质，其中，在根据所述样本文本的特征向量以及所述样本文本对应的标注标签进行所述分类层的更新训练，以实现所述文本分类模型的更新训练步骤中，所述处理器执行以下步骤：

利用所述分类层根据所述样本文本的特征向量预测得到所述样本文本所对应的分类标签；

进行所得到的所述分类标签与所述样本文本所对应标注标签的一致性判断；

如果不一致，调整所述分类层的参数直至所得到的所述分类标签与所述标注标签一致。
根据权利要求22所述的计算机可读存储介质，其中，在利用所述分类层根据所述样本文本的特征向量预测得到所述样本文本所对应的分类标签步骤中，所述处理器执行以下步骤：

利用所述分类层根据所述特征向量预测得到所述特征向量对应于更新后的所述分类标签集合中每一分类标签的概率；

遍历所述每一分类标签的概率，以最大概率值所对应的分类标签作为所述样本文本对应的分类标签。
根据权利要求19至23中任一项所述的计算机可读存储介质，其中，在根据所述新增样本的特征向量以及所述新增样本对应的标注进行所述分类层的更新训练步骤之后，所述处理器还执行以下步骤：

通过更新后的所述文本分类模型对若干测试样本进行分类；

根据分类结果计算得到更新训练后的所述文本分类模型对所述若干测试样本的分类精度；

如果所述分类精度达到指定精度，结束所述文本分类模型的更新训练。