CN112560506B

CN112560506B - 文本语义解析方法、装置、终端设备及存储介质

Info

Publication number: CN112560506B
Application number: CN202011496641.2A
Authority: CN
Inventors: 谭维
Original assignee: Ping An Life Insurance Company of China Ltd
Current assignee: Ping An Life Insurance Company of China Ltd
Priority date: 2020-12-17
Filing date: 2020-12-17
Publication date: 2023-07-25
Anticipated expiration: 2040-12-17
Also published as: CN112560506A

Abstract

本申请适用于人工智能技术领域，提供了一种文本语义解析方法、装置、终端设备及存储介质，方法包括：获取当前时刻下的对话文本和当前时刻之前的历史文本；提取对话文本中多个文本分词的词特征和历史文本的文本特征；按照正向分词顺序，分别将词特征和文本特征输入至记忆网络模型中，得到多个文本分词分别对应的正向融合特征；按照反向分词顺序，分别将多个词特征和文本特征输入至记忆网络模型中，得到多个文本分词分别对应的反向融合特征；将正向融合特征和反向融合特征输入至语义识别网络模型中，识别对话文本的文本语义。采用上述方法对对话文本的正向融合特征反向融合特征进行文本语义识别，可提高对对话文本中文本语义识别的准确性。

Description

文本语义解析方法、装置、终端设备及存储介质

技术领域

本申请属于人工智能技术领域，尤其涉及一种文本语义解析方法、装置、终端设备及存储介质。

背景技术

现有技术中，在用户与智能终端之间的多轮对话中，智能终端对用户输入的文本进行语义解析，均是针对文本本身，其并没有利用多轮对话的特性。即并没有结合当前文本之前的对话上下文，对当前文本进行语义解析。另外，对当前文本进行解析时，也只是根据当前文本中各个文本词的词顺序，对当前文本中的每个文本词进行处理。然而，智能终端只根据当前文本的词顺序对当前文本进行特征处理，而后对当前文本进行语义解析时，其识别当前文本的文本语义准确率低。

发明内容

本申请实施例提供了一种文本语义解析方法、装置、终端设备及存储介质，可以解决智能终端只根据当前文本的词顺序对当前文本进行特征处理，而后对当前文本进行语义解析时，其识别当前文本的文本语义准确率低的问题。

第一方面，本申请实施例提供了一种文本语义解析方法，包括：

获取当前时刻下的对话文本，以及获取所述当前时刻之前的历史文本；

提取所述对话文本中多个文本分词的词特征，以及提取所述历史文本的文本特征；

按照所述多个文本分词中初始分词至结束分词的正向分词顺序，分别将所述多个文本分词的词特征和所述历史文本的文本特征输入至记忆网络模型中，得到分别与所述多个文本分词一一对应的正向融合特征；

按照所述多个文本分词中结束分词至初始分词的反向分词顺序，分别将所述多个文本分词的词特征和所述历史文本的文本特征输入至所述记忆网络模型中，得到分别与所述多个文本分词一一对应的反向融合特征；

将所述正向融合特征和所述反向融合特征输入至语义识别网络模型中，识别得到所述对话文本的文本语义。

在一实施例中，所述提取所述对话文本中多个文本分词的词特征，包括：

对所述对话文本进行分词，得到多个文本分词，其中，每个文本分词为所述对话文本中的一个字符；

分别提取每个文本分词的词特征。

在一实施例中，所述按照所述多个文本分词中初始分词至结束分词的正向分词顺序，分别将所述多个文本分词的词特征和所述历史文本的文本特征输入至记忆网络模型中，得到分别与所述多个文本分词一一对应的正向融合特征，包括：

按照所述正向分词顺序，逐个提取每个文本分词的词特征，并获取所述当前文本分词的正向相邻融合特征；

将所述当前文本分词的词特征、所述历史文本的文本特征以及所述当前文本分词的正向相邻融合特征，输入至所述记忆网络模型中进行特征处理，得到所述当前文本分词的正向融合特征，以此得到分别与所述多个文本分词一一对应的正向融合特征；其中，任一文本分词的所述正向相邻融合特征为相邻的前一文本分词的所述正向融合特征。

在一实施例中，所述记忆网络模型包括两个输入门，每个输入门分别用于输入一个特征数据；

所述将所述当前文本分词的词特征、所述历史文本的文本特征以及所述当前文本分词的正向相邻融合特征，输入至所述记忆网络模型中进行特征处理，得到所述当前文本分词的正向融合特征，包括：

将所述当前文本分词的词特征，拼接在所述历史文本的文本特征之后，得到所述当前文本分词的拼接特征；

将所述拼接特征和所述当前文本分词的正向相邻融合特征，分别输入至所述记忆网络模型的所述输入门中进行特征处理，得到所述当前文本分词的正向融合特征。

在一实施例中，所述将所述正向融合特征和所述反向融合特征输入至语义识别网络模型中，识别得到所述对话文本的文本语义，包括：

从分别与所述多个文本分词一一对应的正向融合特征中，确定所述结束分词的正向融合特征；以及，从分别与所述多个文本分词一一对应的反向融合特征中，确定所述初始分词的反向融合特征；

将所述结束分词的正向融合特征和所述初始分词的反向融合特征输入至语义识别网络模型中，识别得到所述对话文本的文本语义。

在一实施例中，所述文本语义解析方法，还包括：

分别将与所述多个文本分词一一对应的拼接特征，输入至分类器中进行命名实体识别，得到与所述多个文本分词一一对应的标注类别；

根据所述标注类别输出目标实体词，所述目标实体词为所述对话文本中的关键信息。

在一实施例中，所述标注类别包括开始类别、中间类别和其它类别；

所述根据所述标注类别输出目标实体词，包括：

确定多个标注类别中，所述开始类别对应的开始文本分词；

确定处于所述开始文本分词之后，与所述开始文本分词相邻且连续的多个中间类别对应的中间文本分词；

将所述开始文本分词以及所述中间文本分词，作为目标实体词。

第二方面，本申请实施例提供了一种文本语义解析装置，包括：

获取模块，用于获取当前时刻下的对话文本，以及获取所述当前时刻之前的历史文本；

提取模块，用于提取所述对话文本中多个文本分词的词特征，以及提取所述历史文本的文本特征；

第一处理模块，用于按照所述多个文本分词中初始分词至结束分词的正向分词顺序，分别将所述多个文本分词的词特征和所述历史文本的文本特征输入至记忆网络模型中，得到分别与所述多个文本分词一一对应的正向融合特征；

第二处理模块，用于按照所述多个文本分词中结束分词至初始分词的反向分词顺序，分别将所述多个文本分词的词特征和所述历史文本的文本特征输入至所述记忆网络模型中，得到分别与所述多个文本分词一一对应的反向融合特征；

识别模块，用于将所述正向融合特征和所述反向融合特征输入至语义识别网络模型中，识别得到所述对话文本的文本语义。

第三方面，本申请实施例提供了一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上述第一方面任一项所述的方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如上述第一方面任一项所述的方法。

第五方面，本申请实施例提供了一种计算机程序产品，当计算机程序产品在终端设备上运行时，使得终端设备执行上述第一方面中任一项所述的方法。

在本实施例中，对于提取到的当前对话文本的多个文本分词，依照多个文本分词的正向分词顺序，将当前对话文本的每个文本分词的词特征与历史文本的文本特征同时输入记忆网络模型中进行特征处理，得到正向融合特征。进而，得到的正向融合特征还包含了历史文本对当前对话文本的语义影响因素。另外，还可根据反向分词顺序，得到每个文本分词的词特征与历史文本的文本特征结合的反向融合特征。基于此，语义识别网络模型在根据正向融合特征和反向融合特征对对话文本进行文本语义识别时，可提高对对话文本的文本语义识别的准确性。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一实施例提供的一种文本语义解析方法的实现流程图；

图2是本申请一实施例提供的一种文本语义解析方法的S102的一种实现方式示意图；

图3是本申请一实施例提供的一种文本语义解析方法的S103的一种实现方式示意图；

图4是本申请一实施例提供的一种文本语义解析方法中的模型结构处理过程示意图；

图5是本申请一实施例提供的一种文本语义解析方法的S1032的一种实现方式示意图；

图6是本申请一实施例提供的一种文本语义解析方法的S105的一种实现方式示意图；

图7是本申请另一实施例提供的一种文本语义解析方法的实现流程图；

图8是本申请一实施例提供的一种文本语义解析方法的S107的一种实现方式示意图；

图9是本申请实施例提供的一种文本语义解析装置的结构框图；

图10是本申请实施例提供的一种终端设备的结构框图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本申请实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本申请的描述。

应当理解，当在本申请说明书和所附权利要求书中使用时，术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

本申请实施例提供的文本语义解析方法可以应用于手机、平板电脑、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer，UMPC)、上网本等终端设备上，本申请实施例对终端设备的具体类型不作任何限制。

图1示出了本发明实施例提供的文本语义解析方法的实现流程图，详述如下：

S101、获取当前时刻下的对话文本，以及获取所述当前时刻之前的历史文本。

在应用中，上述对话文本为用户在当前时刻下所说的文本，也可以为终端设备回复用户的文本，对此不作限定。而历史文本则为当前时刻之前，用户与终端设备之间进行交互的文本。其中，用户与终端设备之间进行交互，可以为用户通过语音、文字输入装置(键盘)输入文字信息等方式与终端设备交互。示例性的，终端设备可根据输入的语音(语音转换技术将语音转换为文本)，或对输入的文字信息进行特征识别后，回复用户的输入信息。以此，生成用户与终端设备之间进行交互的历史文本。

在其他应用中，用户与终端设备之间的历史文本也可以为预先存储在终端设备内部的文本。终端设备可在指定存储路径下获取该历史文本，并将当前时刻进行处理的语句作为对话文本，将处于对话文本之前的所有语句均作为当前时刻之前的历史文本。或者，指定存储路径下的历史文本中，每条语句均预先标记有对应的文本时刻，终端设备将当前时刻正在处理的语句作为对话文本，并根据对话文本的文本时刻，将处于对话文本的文本时刻之前的所有语句，均作为当前时刻之前的历史文本，对此不作限定。

S102、提取所述对话文本中多个文本分词的词特征，以及提取所述历史文本的文本特征。

在应用中，上述文本分词的词特征可以理解为向量数据，其可被终端设备进行识别。上述提取文本分词的词特征可以采用嵌入(Embedding)方式进行特征提取。其中，Embedding为把高维原始数据(图像，句子)映射到低维流形，使得高维的原始数据被映射到低维流形之后变得可分，而这个映射就叫嵌入(Embedding)。比如Word Embedding，即为把单词组成的句子映射到一个表征向量进行表示。

具体的，可在终端设备内部预设设置词向量库，终端设备获取多个已有的历史文本，并统计已有的历史文本中每个词的出现次数，并根据出现次数对每个词进行排序，将每个词依照顺序写入词向量库中。以此，生成的词向量库中包含的每个词均有唯一的顺序号。进而，在提取文本分词的词特征时，可在词向量库中确定与文本分词一致的词，以及确定该词的顺序号，并将顺序号作为该文本分词的词特征。对应的，历史文本也可看成是由多个词组成的文本，因此，也可根据上述方式提取历史文本的文本特征。示例性的，对于当前对话文本为“你可以去黄山”，对应的词向量数据可分别为[123，635，766，330，415，397]。可以理解的是，在其他示例中，黄山可作为一个整体的文本分词，因此，可以使用一个词特征进行表示。而在本实施例中，是将对话文本中的每个字符，对应为一个分词进行处理。基于此，可认为提取到历史文本的文本特征为：h＝(h1，h2，h3，…，hm)。其中，hi(1≤i≤m)是一个实数，其表示为上述对话文本中的第i个文本分词的词特征，m可以理解为对话文本共有m个分词。即提取到的文本特征h可认为是一个实数域稠密向量。

S103、按照所述多个文本分词中初始分词至结束分词的正向分词顺序，分别将所述多个文本分词的词特征和所述历史文本的文本特征输入至记忆网络模型中，得到分别与所述多个文本分词一一对应的正向融合特征。

在应用中，上述对话文本可以为一句话，也可以为一段话。因此，可认为每个文本分词在对话文本中均具有相应的分词顺序，使每个文本分词可以连成一段对话文本。上述正向分词顺序可认为是从对话文本中的第一个文本分词(初始分词)至最后一个文本分词(结束分词)的顺序。可以理解的是，终端设备在获取到每个文本分词的词特征之后，依据正向分词顺序最先处理的文本分词应为初始分词。因此，可先将初始分词的词特征和文本特征输入至记忆网络模型中，得到初始分词的正向融合特征。之后，以此得到其余文本分词的正向融合特征。需要说明的是，上述记忆网络模型为双向长短期记忆网络模型(Bi-LSTM模型)。

S104、按照所述多个文本分词中结束分词至初始分词的反向分词顺序，分别将所述多个文本分词的词特征和所述历史文本的文本特征输入至所述记忆网络模型中，得到分别与所述多个文本分词一一对应的反向融合特征。

在应用中，上述反向分词顺序可认为是从对话文本中的最后一个文本分词(结束分词)至第一个文本分词(初始分词)的顺序。可以理解的是，上述反向融合特征的处理过程具体与S104中的正向融合特征类似，具体可参照上述S104中描述内容，对此不再进行描述。

S105、将所述正向融合特征和所述反向融合特征输入至语义识别网络模型中，识别得到所述对话文本的文本语义。

在应用中，将正向融合特征和反向融合特征输入至语义识别网络模型中，识别对话文本的文本语义，可以为基于因子分解机的神经网络(Factorization Machinesupported Neural Network，FNN)模型识别正向融合特征和反向融合特征，得到对话文本的文本语义。或者，可以为通过卷积神经网络(Convolutional Neural Networks，CNN)模型识别正向融合特征和反向融合特征得到对话文本的文本语义。其中，上述文本语义包括但不限于疑问、建议、惊讶等语义，对此不作限定。

具体的，在本实施例中，语义识别网络模型可为FNN模型，其中，FNN模型使用因子分解机作为底层。具体的，在对FNN模型进行训练时，每个训练样本的样本特征可预先采用因子分解机模型(Factorization Machine FM)进行处理得到，并可基于深度神经网络使用嵌入向量(Deep Neural Networks，DNN)进行训练，其训练开销低，且收敛快。

在应用中，上述语义识别模型在根据正向融合特征和反向融合特征识别对话文本的文本语义时，可以为根据所有正向融合特征和所有反向融合特征进行语义识别，也可以为只根据结束分词的正向融合特征以及初始分词的反向融合特征进行语义识别，对此不作限定。

需要说明的是，本实施例中的Bi-LSTM模型为双向模型，正向融合特征可认为通过正向的Bi-LSTM模型学习到的特征，可认为该正向融合特征可表示对话文本中句法方面的特征。而通过反向的Bi-LSTM模型学习到的反向融合特征，可认为其更倾向于学习对话文本中词义方面的相关特征。因此，在本实施例中，语义识别网络模型同时根据正向融合特征和反向融合特征对对话文本进行文本语义识别时，可使得语义识别网络模型根据对话文本中的词义信息、句法信息、上下文相关的语义信息等综合信息进行文本语义识别，从而提高对对话文本的文本语义识别的准确性。

请参照图2，在一具体实施例中，S102提取所述对话文本中多个文本分词的词特征，还包括如下子步骤S1021-S1022，详述如下：

S1021、对所述对话文本进行分词，得到多个文本分词，其中，每个文本分词为所述对话文本中的一个字符。

S1022、分别提取每个文本分词的词特征。

在应用中，上述对对话文本进行分词可以为将对话文本中每个字符均作为一个分词，得到文本分词。也可以为预先设置包含多个分词的分词库，将对话文本中的各个字符与分词库中的分词进行比较，将与分词库中的分词一致的文本词作为文本分词，对此不作限定。本实施例中，上述对对话文本进行分词，可认为是以字符为单位进行分词，即对话文本中每个字符即为一个文本分词。以此，可得到多个文本分词，进而可分别提取每个文本分词的词特征。

请参照图3，在一具体实施例中，S103按照所述多个文本分词中初始分词至结束分词的正向分词顺序，分别将所述多个文本分词的词特征和所述历史文本的文本特征输入至记忆网络模型中，得到分别与所述多个文本分词一一对应的正向融合特征，还包括如下子步骤S1031-S1032，详述如下：

S1031、按照所述正向分词顺序，逐个提取每个文本分词的词特征，并获取所述当前文本分词的正向相邻融合特征。

S1032、将所述当前文本分词的词特征、所述历史文本的文本特征以及所述当前文本分词的正向相邻融合特征，输入至所述记忆网络模型中进行特征处理，得到所述当前文本分词的正向融合特征，以此得到分别与所述多个文本分词一一对应的正向融合特征；其中，任一文本分词的所述正向相邻融合特征为相邻的前一文本分词的所述正向融合特征。

在应用中，上述正向相邻融合特征以在S1032中说明，其为相邻的前一文本分词的正向融合特征。上述正融合特征为根据当前文本分词的词特征、历史文本的文本特征以及当前文本分词的正向相邻融合特征，进行特征处理后得到。即可认为对于当前文本分词的正向融合特征来讲，其融合了正向相邻融合特征的特征因素在内，而正向相邻融合特征包含了当前文本分词之前的多个文本分词的特征因素在内。

具体可参照图4，因第一文本分词(初始分词)作为当前文本分词时，其不具有当前文本分词之前的相邻文本分词。因此，对于“你”字，其记忆网络模型的输入为历史文本的文本特征h，以及“你”的文本分词的词特征，经过特征处理后即可得到“你”的正向融合特征。而对于“可”字，其记忆网络模型输入包括历史文本的文本特征h、“可”的文本分词的词特征，以及“你”字横向传输箭头表示的正向融合特征(该“你”字的正向融合特征即为“可”字的正向相邻融合特征)。基于此，经过特征处理后即可得到“可”字的正向融合特征。以此类推，可得到每个文本分词的正向融合特征。需要说明的是，从图4可看出，其正向相邻融合特征的传输箭头从“你”字一直指向“山”字。因此，可认为对于输入“山”字的正向相邻融合特征，其正向相邻融合特征包含了从“你”字到“黄”字的特征因素在内。即基于该正向相邻融合特征、历史文本的文本特征、“山”字的词特征，进行特征处理后得到的“山”字的正向融合特征，其包含了当前对话文本的所有文本分词的词特征信息。进一步的，可认为以此得到的正向融合特征可以充分表示当前对话文本的特征信息，进而提高语义识别网络模型对当前对话文本进行语义识别的准确性。

需要说明的是，上述反向融合特征即为按照反向分词顺序，逐个提取每个文本分词的词特征，并获取所述当前文本分词的反向相邻融合特征；将当前文本分词的词特征、历史文本的文本特征以及当前文本分词的反向相邻融合特征，输入至记忆网络模型中进行特征处理，得到当前文本分词的反向融合特征，以此得到分别与多个文本分词一一对应的反向融合特征；其中，任一文本分词的反向相邻融合特征为相邻的前一文本分词(例如，对于反向分词顺序而言，图4中“山”字的反向融合特征为“黄”字的反向相邻融合特征)的反向融合特征。其反向融合特征的处理过程具体与正向融合特征的处理过程类似，对此不再进行详细描述。

请参照图5，在一具体实施例中，所述记忆网络模型包括两个输入门，每个输入门分别用于输入一个特征数据；S1032将所述当前文本分词的词特征、所述历史文本的文本特征以及所述当前文本分词的正向相邻融合特征，输入至所述记忆网络模型中进行特征处理，得到所述当前文本分词的正向融合特征，还包括如下子步骤S10321-S10322，详述如下：

S10321、将所述当前文本分词的词特征，拼接在所述历史文本的文本特征之后，得到所述当前文本分词的拼接特征。

S10322、将所述拼接特征和所述当前文本分词的正向相邻融合特征，分别输入至所述记忆网络模型的所述输入门中进行特征处理，得到所述当前文本分词的正向融合特征。

在应用中，上述Bi-LSTM模型主要是通过上一轮残留下来的信息(正向相邻融合特征或反向相邻融合特征)和当前获取到的信息(文本特征和词特征)共同决定当前输出的信息(正向融合特征或反向融合特征)。然而，需要说明的是，在将文本分词的词特征、历史文本的文本特征和当前文本分词之前的正向相邻融合特征输入至正向的Bi-LSTM模型时，因Bi-LSTM模型中传递信息的输入门只有两个。因此，对于上述三个特征数据，需将当前时刻下的文本分词的词特征、历史文本的文本特征进行向量拼接后，作为一个拼接特征输入其中一个输入门，以及将正向相邻融合特征作为另一个输入门中的输入。需要说明的是，在获取每个文本分词的反向融合特征时，其也需对文本分词的词特征、历史文本的文本特征进行向量拼接，得到拼接特征，对此不再进行详细说明。

在应用中，上述已说明将当前对话文本按照字或者按照词进行切分，在得到切分后的文本分词后使用embedding技术将其转换为向量。假设字/词的embedding向量的维度n，文本特征的维度为m，则拼接后的拼接特征的维度则为m+n。例如，其拼接特征可以为：H＝(h1，h2，h3，…，hm，N1，N2，…，Nn)，其中，H为拼接后的多维特征。可以理解的是，在其他应用中，也可以将文本特征拼接在词特征之后，得到拼接特征，并将其输入至Bi-LSTM模型进行特征处理，对此不作限定。

请参照图6，在一具体实施例中，S105将所述正向融合特征和所述反向融合特征输入至语义识别网络模型中，识别得到所述对话文本的文本语义，还包括如下子步骤S1051-S1052，详述如下：

S1051、从分别与所述多个文本分词一一对应的正向融合特征中，确定所述结束分词的正向融合特征；以及，从分别与所述多个文本分词一一对应的反向融合特征中，确定所述初始分词的反向融合特征。

S1052、将所述结束分词的正向融合特征和所述初始分词的反向融合特征输入至语义识别网络模型中，识别得到所述对话文本的文本语义。

在应用中，在S1032的示例中已说明，图4中正向相邻融合特征的传输箭头从“你”字一直指向“山”字。因此，可认为对于输入“山”字的正向相邻融合特征，其正向相邻融合特征包含了从“你”字到“黄”字的特征因素。即可认为对于正向分词顺序，结束分词的正向融合特征也包含了当前对话文本中各个文本分词的特征信息。基于此，也可认为对于反向分词顺序，初始分词的反向融合特征也包含了当前对话文本中各个文本分词的特征信息。因此，上述语义识别网络模型可以只为根据结束分词的正向融合特征以及初始分词的反向融合特征进行语义识别。

可以理解的是，在本实施例中，语义识别网络模型可只通过结束分词的正向融合特征和初始分词的反向融合特征，进行文本语义识别。从而，可使语义识别网络模型在保证对对话文本的文本语义进行准确识别的基础上，减少输入语义识别网络模型的特征数据(例如，不必将每个文本分词的正向融合特征以及反向融合特征均作为特征数据进行输入)，提高语义识别网络模型识别对话文本的文本语义的时间。

请参照图7，在一具体实施例中，所述文本语义解析方法，还包括如下步骤S106-S107，详述如下：

S106、分别将与所述多个文本分词一一对应的拼接特征，输入至分类器中进行命名实体识别，得到与所述多个文本分词一一对应的标注类别。

在应用中，上述命名实体包括但不限于人名，地名，组织机构名，药物，时间等实体。上述已说明拼接特征为将文本分词的词特征和文本特征结合后得到，对此不在进行说明。

在应用中，上述分类器包括但不限于softmax分类器和sigmoid分类器。其中，在进行命名实体识别时，softmax分类器可以根据输入的词义特征，预测出其属于每一类命名实体的概率值。之后，可根据每一类命名实体对应的概率值大小，将概率值最大对应的命名实体类别作为该文本分词的命名实体类别。可以理解的是，因命名实体类别具有多类，因此可使用softmax作为分类器。具体的，softmax分类器可以预测文本分词属于每一类命名实体类别的概率。相比于使用sigmoid分类器对命名实体类别进行预测时，只能得到具体属于哪一类命名实体类别的概率，其更适用于二分类的分类模型。

S107、根据所述标注类别输出目标实体词，所述目标实体词为所述对话文本中的关键信息。

在应用中，上述标注类别具体可为BIO标注类别。其中，BIO标注类别可将每个元素(每个文本分词)标注为“B-X”、“I-X”或者“O”。其中，“B-X”表示该元素(文本分词)属于B类型，并且该元素属于目标实体词的开头分词；“I-X”表示该元素(文本分词)属于I类型，并且该元素属于目标实体词的中间分词，“O”表示该元素(文本分词)不属于任何类型。

示例性的，对当前对话文本“你可以去黄山”进行识别后，可得到标注依次为：O(你)、O(可)、O(以)、O(去)、B-(黄)、I-(山)。即可将B对应标注的元素“黄”，和I对应标注的元素“山”作为目标实体词，并进行输出。若出现两个实体名词，例如，“你可以去黄山，或者华山”，其可得到的标注依次为：O(你)、O(可)、O(以)、O(去)、B-(黄)、I-(山)、O(或)、O(者)、B-(华)、I-(山)。此时，可输出有两个被标注的实体名词，即黄山以及华山均为目标实体词。

请参照图8，在一具体实施例中，所述标注类别包括开始类别、中间类别和其它类别；S107根据所述标注类别输出目标实体词，还包括如下步骤S1071-S1073，详述如下：

S1071、确定多个标注类别中，所述开始类别对应的开始文本分词。

S1072、确定处于所述开始文本分词之后，与所述开始文本分词相邻且连续的多个中间类别对应的中间文本分词。

S1073、将所述开始文本分词以及所述中间文本分词，作为目标实体词。

在应用中，上述S107已说明标注类别为BIO标注类别，且将“B”表示为开始类别，“I”表示为中间类别，以及“O”表示为其它类别。另外，上述已说明将“B”和“I”对应的文本分词作为目标实体词，具体可参照上述描述，对此不再进行说明。

在一实施例中，本申请实施例提供一种文本语义解析装置的结构框图。具体的，请参阅图9，图9是本申请实施例提供的一种文本语义解析装置的结构框图。本实施例中文本语义解析装置包括的各模块用于执行图1至图3、图5至图8对应的实施例中的各步骤。具体请参阅图1至图3、图5至图8以及图1至图3、图5至图8所对应的实施例中的相关描述。为了便于说明，仅示出了与本实施例相关的部分。参照图9，文本语义解析装置900包括：获取模块910、提取模块920、第一处理模块930、第二处理模块940以及识别模块950，其中：

获取模块910，用于获取当前时刻下的对话文本，以及获取所述当前时刻之前的历史文本。

提取模块920，用于提取所述对话文本中多个文本分词的词特征，以及提取所述历史文本的文本特征。

第一处理模块930，用于按照所述多个文本分词中初始分词至结束分词的正向分词顺序，分别将所述多个文本分词的词特征和所述历史文本的文本特征输入至记忆网络模型中，得到分别与所述多个文本分词一一对应的正向融合特征。

第二处理模块940，用于按照所述多个文本分词中结束分词至初始分词的反向分词顺序，分别将所述多个文本分词的词特征和所述历史文本的文本特征输入至所述记忆网络模型中，得到分别与所述多个文本分词一一对应的反向融合特征。

识别模块950，用于将所述正向融合特征和所述反向融合特征输入至语义识别网络模型中，识别得到所述对话文本的文本语义。

在一实施例中，提取模块920还用于：

分别提取每个文本分词的词特征。

在一实施例中，第一处理模块930还用于：

在一实施例中，所述记忆网络模型包括两个输入门，每个输入门分别用于输入一个特征数据；第一处理模块930还用于：

在一实施例中，识别模块950还用于：

在一实施例中，文本语义解析装置还包括如下模块：

输入模块，用于分别将与所述多个文本分词一一对应的拼接特征，输入至分类器中进行命名实体识别，得到与所述多个文本分词一一对应的标注类别。

输出模块，用于根据所述标注类别输出目标实体词，所述目标实体词为所述对话文本中的关键信息。

在一实施例中，所述标注类别包括开始类别、中间类别和其它类别；输出模块还用于：

确定多个标注类别中，所述开始类别对应的开始文本分词；

应当理解的是，图9示出的文本语义解析装置的结构框图中，各单元/模块用于执行图1至图3、图5至图8对应的实施例中的各步骤，而对于图1至图3、图5至图8对应的实施例中的各步骤已在上述实施例中进行详细解释，具体请参阅图1至图3、图5至图8以及图1至图3、图5至图8所对应的实施例中的相关描述，此处不再赘述。

图10是本申请另一实施例提供的一种终端设备的结构框图。如图10所示，该实施例的终端设备1000包括：处理器1010、存储器1020以及存储在存储器1020中并可在处理器1010运行的计算机程序1030，例如文本语义解析方法的程序。处理器1010执行计算机程序1030时实现上述各个文本语义解析方法各实施例中的步骤，例如图1所示的S101至S105。或者，处理器1010执行计算机程序1030时实现上述图9对应的实施例中各模块的功能，例如，图9所示的模块910至950的功能，具体请参阅图9对应的实施例中的相关描述。

示例性的，计算机程序1030可以被分割成一个或多个单元，一个或者多个单元被存储在存储器1020中，并由处理器1010执行，以完成本申请。一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述计算机程序1030在终端设备1000中的执行过程。例如，计算机程序1030可以被分割成获取模块、提取模块、第一处理模块、第二处理模块以及识别模块，各模块具体功能可参阅图9对应的实施例中的相关描述。

终端设备可包括，但不仅限于，处理器1010、存储器1020。本领域技术人员可以理解，图10仅仅是终端设备1000的示例，并不构成对终端设备1000的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如终端设备还可以包括输入输出设备、网络接入设备、总线等。

所称处理器1010可以是中央处理单元，还可以是其他通用处理器、数字信号处理器、专用集成电路、现成可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器1020可以是终端设备1000的内部存储单元，例如终端设备1000的硬盘或内存。存储器1020也可以是终端设备1000的外部存储设备，例如终端设备1000上配备的插接式硬盘，智能存储卡，闪存卡等。进一步地，存储器1020还可以既包括终端设备1000的内部存储单元也包括外部存储设备。

以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

1.一种文本语义解析方法，其特征在于，包括：

按照所述多个文本分词中初始分词至结束分词的正向分词顺序，分别将所述多个文本分词的词特征和所述历史文本的文本特征输入至记忆网络模型中，得到分别与所述多个文本分词一一对应的正向融合特征；所述记忆网络模型包括两个输入门，每个输入门分别用于输入一个特征数据；

将所述正向融合特征和所述反向融合特征输入至语义识别网络模型中，识别得到所述对话文本的文本语义；

所述提取所述对话文本中多个文本分词的词特征，包括：

对所述对话文本进行分词，得到多个文本分词，其中，每个文本分词为所述对话文本中的一个字符；分别提取每个文本分词的词特征；

所述按照所述多个文本分词中初始分词至结束分词的正向分词顺序，分别将所述多个文本分词的词特征和所述历史文本的文本特征输入至记忆网络模型中，得到分别与所述多个文本分词一一对应的正向融合特征，包括：

按照所述正向分词顺序，逐个提取每个文本分词的词特征，并获取当前文本分词的正向相邻融合特征；将所述当前文本分词的词特征、所述历史文本的文本特征以及所述当前文本分词的正向相邻融合特征，输入至所述记忆网络模型中进行特征处理，得到所述当前文本分词的正向融合特征，以此得到分别与所述多个文本分词一一对应的正向融合特征；其中，任一文本分词的所述正向相邻融合特征为相邻的前一文本分词的所述正向融合特征；

将所述当前文本分词的词特征，拼接在所述历史文本的文本特征之后，得到所述当前文本分词的拼接特征；将所述拼接特征和所述当前文本分词的正向相邻融合特征，分别输入至所述记忆网络模型的所述输入门中进行特征处理，得到所述当前文本分词的正向融合特征；

所述方法，还包括：

2.如权利要求1所述的文本语义解析方法，其特征在于，所述将所述正向融合特征和所述反向融合特征输入至语义识别网络模型中，识别得到所述对话文本的文本语义，包括：

3.如权利要求1所述的文本语义解析方法，其特征在于，所述标注类别包括开始类别、中间类别和其它类别；

所述根据所述标注类别输出目标实体词，包括：

确定多个标注类别中，所述开始类别对应的开始文本分词；

4.一种文本语义解析装置，其特征在于，包括：

第一处理模块，用于按照所述多个文本分词中初始分词至结束分词的正向分词顺序，分别将所述多个文本分词的词特征和所述历史文本的文本特征输入至记忆网络模型中，得到分别与所述多个文本分词一一对应的正向融合特征；所述记忆网络模型包括两个输入门，每个输入门分别用于输入一个特征数据；

识别模块，用于将所述正向融合特征和所述反向融合特征输入至语义识别网络模型中，识别得到所述对话文本的文本语义；

所述提取模块还用于：

所述第一处理模块还用于：

所述装置，还包括：

输入模块，用于分别将与所述多个文本分词一一对应的拼接特征，输入至分类器中进行命名实体识别，得到与所述多个文本分词一一对应的标注类别；

5.一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至3任一项所述的方法。

6.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至3任一项所述的方法。