WO2020107765A1

WO2020107765A1 - 语句分析处理方法、装置、设备以及计算机可读存储介质

Info

Publication number: WO2020107765A1
Application number: PCT/CN2019/081282
Authority: WO
Inventors: 汤耀华; 莫凯翔; 张超; 徐倩; 杨强
Original assignee: 深圳前海微众银行股份有限公司
Priority date: 2018-11-30
Filing date: 2019-04-03
Publication date: 2020-06-04
Also published as: CN109597993B; CN109597993A

Abstract

一种语句分析处理方法、装置、计算机可读存储介质，所述方法包括：获取源领域大样本数据集上的预训练模型，并将预训练模型迁移学习到目标领域（S10）；在所述目标领域内，获取所述预训练模型中预设问句的各语句特征，并对各所述语句特征进行语义分析，以确定所述预设问句对应的各不同意图（S20）；获取各所述意图在预训练模型中的意图相似性分，在所述各意图相似性分中确定最高意图相似性分（S30）；获取所述预训练模型中的各词槽，确定各所述词槽在预训练模型中的词槽相似性分，在各所述词槽相似性分中确定最高词槽相似性分（S40）；获取所述最高意图相似性分对应的最终意图和最高词槽相似性分对应的最终词槽，并输出所述最终意图和所述最终词槽(S50)。该方法能够在模型迁移到新领域的同时，也能快速学习并执行口语理解任务。

Description

语句分析处理方法、装置、设备以及计算机可读存储介质

本申请要求于2018年11月30日提交中国专利局、申请号为201811464437.5、发明名称为“语句分析处理方法、装置、设备以及计算机可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在申请中。

技术领域

本申请涉及迁移学习技术领域，尤其涉及一种语句分析处理方法、装置、设备以及计算机可读存储介质。

背景技术

人工智能对话机器人中的口语理解模型能够起到帮助机器人理解用户意图的关键性作用。随着人工智能对话机器人被广泛的使用，比如亚马逊的Alexa，微软的小冰机器人以及苹果的siri。机器人的口语理解能力显得尤为重要，不仅需要能够理解用户的常见需求场景，还需要不断的扩展机器人的理解能力到新的用户需求场景。对于新的用户需求场景的支持一般需要收集和标注数据，而目前采用的技术方案一般是规则匹配或者是增加训练数据。这个过程既耗时又耗钱，而且需要专业的标注团队。因此，在某个有大量数据的场景下学习了口语理解模型之后，对于新的场景领域，因为只有少量的样本或者零样本而不能快速学习并执行口语理解任务成为目前亟待解决的技术问题。

发明内容

本申请的主要目的在于提供一种激光打标的填充方法、激光打标装置、设备和计算机存储介质，旨在解决模型迁移到新领域后，因为只有少量的样本或者零样本而不能快速学习并执行口语理解任务的技术问题。

为实现上述目的，本申请提供一种语句分析处理方法，所述语句分析处理方法包括以下步骤：

获取源领域大样本数据集上的预训练模型，并将所述预训练模型迁移学习到目标领域；

在所述目标领域内，获取所述预训练模型中预设问句的各语句特征，并对各所述语句特征进行语义分析，以确定所述预设问句对应的各不同意图；

获取各所述意图在预训练模型中的意图相似性分，并在各所述意图相似性分中确定最高意图相似性分；

获取所述预训练模型中的各词槽，确定各所述词槽在预训练模型中的词槽相似性分，并在各所述词槽相似性分中确定最高词槽相似性分；

获取所述最高意图相似性分对应的最终意图和所述最高词槽相似性分对应的最终词槽，并输出所述最高意图和所述最终词槽。

此外，为实现上述目的，本申请还提供一种语句分析处理装置，所述语句分析处理装置包括：

迁移模块，用于获取源领域大样本数据集上的预训练模型，并将所述预训练模型迁移学习到目标领域；

确定模块，用于在所述目标领域内，获取所述预训练模型中预设问句的各语句特征，并对各所述语句特征进行语义分析，以确定所述预设问句对应的各不同意图；

第一获取模块，用于获取各所述意图在预训练模型中的意图相似性分，并在各所述意图相似性分中确定最高意图相似性分；

第二获取模块，用于获取所述预训练模型中的各词槽，确定各所述词槽在预训练模型中的词槽相似性分，并在各所述词槽相似性分中确定最高词槽相似性分；

输出模块，用于获取所述最高意图相似性分对应的最终意图和所述最高词槽相似性分对应的最终词槽，并输出所述最高意图和所述最终词槽。

此外，为实现上述目的，本申请还提供一种移动终端；

所述移动终端包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机可读指令，其中：所述计算机可读指令被所述处理器执行时实现如上所述的语句分析处理方法的步骤。

此外，为实现上述目的，本申请还提供一种计算机可读存储介质；所述计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如上述的语句分析处理方法的步骤。

在本实施例中，通过计算意图的相似性分和词槽的相似性分的方式来替代原理模型中的简单分类模型，可以很好的解决从源领域迁移到目标领域的问题，并且当模型从源领域迁移到目标领域后，不需要用户重新设计规划，具有可扩展性，也不需要重新增加训练数据，从而节约了人工成本，解决了模型迁移到新领域后，因为只有少量的样本或者零样本而不能快速学习并执行口语理解任务的技术问题。

附图说明

图1是本申请实施例方案涉及的硬件运行环境的终端\装置结构示意图；

图2为本申请语句分析处理方法第一实施例的流程示意图；

图3为本申请语句分析处理方法第二实施例的流程示意图；

图4为本申请语句分析处理装置的功能模块示意图；

图5为本申请语句分析处理方法的模型网络结构图。

本申请目的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

如图1所示，图1是本申请实施例方案涉及的硬件运行环境的终端结构示意图。本申请实施例终端为语句分析处理设备。

如图1所示，该终端可以包括：处理器1001，例如CPU，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏（Display）、输入单元比如键盘（Keyboard），可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口（如WI-FI接口）。存储器1005可以是高速RAM存储器，也可以是稳定的存储器（non-volatile memory），例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

可选地，终端还可以包括摄像头、RF（Radio Frequency，射频）电路，传感器、音频电路、WiFi模块等等。其中，传感器比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示屏的亮度，接近传感器可在终端设备移动到耳边时，关闭显示屏和/或背光。当然，终端设备还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

本领域技术人员可以理解，图1示出的终端结构并不构成对终端的限定，可以包括比图示更多或更少的部件，或组合某些部件，或不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及计算机可读指令。

在图1所示的终端中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接客户端（用户端），与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的计算机可读指令，并执行本申请实施例提供的语句分析处理方法。

参照图2，本申请提供一种语句分析处理方法，在语句分析处理方法一实施例中，语句分析处理方法包括以下步骤：

步骤S10，获取源领域大样本数据集上的预训练模型，并将所述预训练模型迁移学习到目标领域；

源领域是成熟的应用场景，具有大量的标注数据用来训练各个模型。目标领域是新的应用场景，只存在少量或者根本没有标注数据。迁移学习是把在原领域已训练好的模型参数通过某种方式来分享给新的目标领域的模型来帮助新模型训练。在源领域大样本数据集上进行预设数量的模型训练，并从这些模型中选择一个在该数据集上表现最优异的模型作为预训练模型，然后再将此预训练模型迁移到目标领域小样本场景中，并在目标领域小样本场景下，搜集部分用户问句，再根据用户问句设计意图/词槽框架，组织人员根据框架标注数据。其中，在不同的场景下使用的预训练模型架构是一样的，只是将预训练的模型在标注的小样本数据上做调整。而在调整的过程中是将大样本模型的参数全部拿来初始化小样本模型的参数，然后在新场景小样本标注数据上做训练微调。并当在目标领域小样本场景下，对预训练模型训练成功获取到小样本模型后，会将其交互给实际用户使用，在用户使用过程中会不断搜集问句，并扩大训练集，再用扩大的数据集提升此小样本模型。

步骤S20，在所述目标领域内，获取所述预训练模型中预设问句的各语句特征，并对各所述语句特征进行语义分析，以确定所述预设问句对应的各不同意图；

意图是指我们识别用户这句表达具体是想做什么，具体来说意图是一个分类器，将用户需求划分为某个类型。例如：“我要定北京到上海的机票”这句话是用户表达他的需求，这个可以被定义为“告知”意图；“机票都有几点的？”这句话表示用户在询问机票信息，这个可以被定义为“请求”意图。在目标领域小样本场景下，当从预训练模型中获取到预设问句后，还需要获取组成预设问句的句子单词，或者是中文词组等。然后在预训练模型中的Embeddings层（嵌入层）中将输入的句子单词替换成相应的word embedding（嵌入单词），再通过预训练模型中的common representation层（公用特征提取层）中的双向LSTM网络架构来提取各个语句特征，再对这些语句特征进行语义分析，从而确定各个不同的意图，需要说明的是，在现实应用中，每个意图都是由几个词语表述的，比如“确认购买”。其中，LSTM（Long Short-Term Memory）是长短期记忆网络，是一种时间递归神经网络，适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。

步骤S30，获取各所述意图在预训练模型中的意图相似性分，并在各所述意图相似性分中确定最高意图相似性分；

在预训练模型中的Intent task（意图任务）层中，使用双向LSTM层将common representation层得到的特征作进一步地抽象，然后再将该双向LSTM每个方向的最后一个状态拼接起来，记为h^intent。我们的预训练模型里面将每个意图名（intent name）的表述词语通过semantic network转换成类似embedding一样固定长度的语义向量，然后拿该语义向量与h^intent做双线性运算，以得到该意图的意图相似性分，由于每个意图都是采用相同的方法获取到意图对应的意图相似性分，因此，可以通过将各个意图相似性分进行大小比较，以得到分值最高的最高意图相似性分。并为辅助理解本申请的semantic network的架构和双线性运算，下面进行举例说明。

例如，假设有意图名sn_i=（w₁，w₂...w_n）, Semantic network先将每个单词替换成相应的word embedding：E（w_i）。然后使用一层DNN（Deep Neural Network，深度神经网络）网络将E（w_i）做非线性映射得到该单词的语义向量，最后把所有n个词的语义向量做平均得到该意图名的语义向量。双线性运算将两个输入向量V1和V2做如下矩阵运算：score=v^T ₁Wv₂，得到两个向量的相似性打分。

步骤S40，获取所述预训练模型中的各词槽，确定各所述词槽在预训练模型中的词槽相似性分，并在各所述词槽相似性分中确定最高词槽相似性分；

词槽是针对用户表达中关键信息的定义，例如在订机票的表达中，我们的槽位有“起飞时间、起始地、目的地”，这三个关键信息需要被识别出来。在获取预训练模型中的各词槽，并确定各词槽对应的词槽相似性分时，需要先在预训练模型中的Slot task(词槽任务)层确定当前位置的状态，具体来说就是在每个输入位置上将common representation层的双向LSTM和Intent task层的双向LSTM的状态拼接起来作为当前位置的状态，记t时刻的状态为h_t ^slot。同意图名一样，我们将每个词槽名（slot name）的表述词语也使用semantic network转换成语义向量r_i ^slotname。同时第i个词槽可能有多个取值，每个取值同样可以通过semantic network转换成语义向量，记第j个取值的语义向量为r_i，j^slotvalue。需要说明的是，所有取值的打分做归一化处理之后同对应取值的语义向量做加权平均，得到整个词槽取值的语义向量r_i ^slotvalue。再用r_i ^slotvalue与h_t ^slot做二次线性运算，得到该词槽的取值的相似性打分。词槽名的相似性打分和词槽取值的相似性打分相加得到该词槽和当前位置的状态h_t ^slot总相似性打分，即词槽相似性分。然后在各个词槽相似性分中确定最高词槽相似性分。

步骤S50，获取所述最高意图相似性分对应的最终意图和所述最高词槽相似性分对应的最终词槽，并输出所述最终意图和所述最终词槽。

在预训练模型中，将最高意图相似性分对应的意图作为最终意图，将最高词槽相似性分对应的词槽作为最终词槽，然后再输出此最终词槽和最终意图。并为辅助理解本申请的预训练模型结构流程，下面进行举例说明。

例如，如图5所示，该模型分为Embeddings层（嵌入层），Common Representation层（公用特征提取层），Intent Task（意图任务）层和Slot task（词槽任务）层。其中，Embeddings层将输入的句子单词替换成相应的word embedding，如W₀，W_t，W_T+1等。而Common Representation层，Intent Task层和Slot task层均是采用双向LSTM网络架构。在Intent Task层中使用双向LSTM层将common representation层得到的特征作进一步地抽象，然后再将该双向LSTM每个方向的最后一个状态拼接起来，记为h^intent ，再将h^intent和各个意图如Intent1(意图1)、Intent2（意图2）、Intent3（意图3）进行Semantic Similarity（相似性比较），获取相似性最大的值，即Softmax，然后再将相似性最大的意图进行输出即图中的τ。而输出最终词槽也是先确定当前位置的状态，记t时刻的状态为h_t ^slot，通过Slot Value 1（槽值1）、Slot Value 2（槽值2），一直到Slot Value n（槽值n）和h_t ^slot进行相似性比较，即图中的Semantic Similarity（相似性比较），Attention（注意力），需要对所有取值的相似性打分做归一化处理之后同对应取值的语义向量做加权平均，得到整个词槽取值的语义向量r_i ^slotvalue。再用r_i ^slotvalue与h_t ^slot做二次线性运算，得到该词槽的取值的相似性打分。与此同时也需要将各个slot name（词槽名）和h_t ^slot进行相似性比较，以获取词槽名的相似性打分。词槽名的相似性打分和词槽取值的相似性打分相加得到该词槽和当前位置的状态h_t ^slot总相似性打分。然后在各个词槽相似性分中确定最高词槽相似性分并进行输出即到图中的St。

进一步地，在本申请第一实施例的基础上，提出了本申请语句分析处理方法的第二实施例，本实施例是本申请第一实施例的步骤S30，获取各所述意图在预训练模型中的意图相似性分，并在各所述意图相似性分中确定最高意图相似性分的步骤的细化，参照图3，包括：

步骤S31，获取所述预训练模型中的第一状态向量；

步骤S32，获取各所述意图对应的意图名语义向量，并计算各所述意图名语义向量和第一状态向量之间的意图相似性分；

第一状态向量可以是在模型中的Intent task层，使用双向LSTM层将common representation层得到的特征作进一步地抽象，然后再将该双向LSTM每个方向的最后一个状态拼接起来后的状态向量。意图名即意图的表述词语。当获取到预训练模型中的第一状态向量后，还需要再次获取各个意图对应的意图名语义向量，然后再对意图名语义向量和第一状态向量做二次线性运算，从而得到该意图相似性分。并且由于每个意图都有一个与该意图对应的意图相似性分，获取的方法也基本相同，因此，可以所有的意图相似性分。

步骤S33，对各所述意图相似性分进行比较，以获取各所述意图相似性分中的最高意图相似性分。

当获取到每个意图的意图相似性分时，还需要对每个意图相似性分进行大小比较，已确定分数最高的意图相似性分，并将其作为最高意图相似性分。需要说明的是，每个意图相似性分都需要和其它的意图相似性分进行比较。

在本实施例中，通过确定各个意图名语义向量和第一状态向量之间的相似性分来确定哪个意图的相似性分最高，从而保证了确定用户意图的准确性。

具体地，获取各所述意图对应的意图名语义向量的步骤，包括：

步骤S321，获取所述意图中的各语句信息，并确定各所述语句信息对应的语句语义向量；

获取意图对应的意图名语义向量需要先获取该意图中的所有语句信息，并确定各个语句信息对应的语句语义向量。例如，假设有假设有意图名sn_i=（w₁，w₂...w_n）, Semantic network先将每个单词替换成相应的word embedding: E（w_i）。然后使用一层DNN（Deep Neural Network，深度神经网络）网络将E（w_i）做非线性映射得到该单词的语义向量。

步骤S322，获取各所述语句向量的平均向量值，并将所述平均向量值作为所述意图名语义向量。

当在模型中获取各个语句向量后，还需要确定各个语句向量的平均值，即平均向量值，并将此平均向量值作为意图名语义向量。

在本实施例中，通过确定意图中所有的语句信息对应的语句语义向量，并取其平均值作为意图名语义向量，从而提高了检测意图相似性的准确性。

进一步地，在本申请第一实施例至第二实施例任意一个的基础上，提出了本申请语句分析处理方法的第三实施例，本实施例是本申请第一实施例的步骤S40，获取所述预训练模型中的各词槽，确定各所述词槽在预训练模型中的词槽相似性分的步骤的细化，包括：

步骤S41，获取所述预训练模型中的各词槽；

步骤S42，获取所述词槽的词槽名和整体词槽取值，并确定所述词槽名的第一相似性分和所述整体词槽取值的第二相似性分；

第一相似性分可以是词槽名和当前位置状态之间的相似性分。第二相似性分可以是整体词槽取值和当前位置状态之间的相似性分。在现实应用中，词槽一般是由一个或者多个词语表述的，比如“食物”，而且一般每个词槽都会有一些可能的取值，比如“食物”这个词槽，可以很容易的得到可能出现的取值：“蛋糕”，“苹果”，“烤羊腿”等。在预训练模型中通过对预设问句进行分析，来确定可能出现的各个词槽，然后确定词槽的词槽名和整体词槽取值，并确定词槽名对应的词槽名语义向量和整体词槽取值对应的取值语义向量，并在Intent task层中的每个输入位置上将common representation层的双向LSTM和Intent task层的双向LSTM的状态拼接起来作为当前位置的状态，即状态向量，然后在用词槽名语义向量和状态向量做二次线性运算，得到词槽名对应的第一相似性分，在用取值语义向量和状态向量做二次线性运算，得到整体词槽取值对应的第二相似性分。例如，当词槽中有三个词槽向量A1，A2，A3时，这三个向量分别跟当前状态向量做运算分别得到一个分值，然后三个分值归一化之后变成C1，C2，C3，然后A1*C1+A2*C2+A3*C3就是整个词槽取值的语义向量。其中，词槽名即是槽位的名字，槽位的表述词语。整体词槽取值可以是与各个词槽取值值均相关的一个词槽取值。

步骤S43，并根据所述第一相似性分和所述第二相似性分的和值确定所述词槽的词槽相似性分。

当获取到第一相似性分和第二相似性分后，还需要将词槽名对应的第一相似性分和整体词槽取值对应的第二相似性分相加以得到其和值，并将其和值作为该词槽和当前位置的词槽相似性分。

在本实施例中，通过确定词槽名的第一相似性和整体词槽取值的第二相似性，来确定词槽的词槽相似性，从而提高了确定词槽相似性的准确性。

具体地，确定所述词槽名的第一相似性分和所述整体词槽取值的第二相似性分的步骤，包括：

步骤S421，获取所述预训练模型中的当前位置状态，并确定所述当前位置状态的第二状态向量；

在预训练模型中的Intent task层中的每个输入位置上将common representation层的双向LSTM和Intent task层的双向LSTM的状态拼接起来作为当前位置的状态，即第二状态向量。

步骤S422，获取所述词槽名对应的词槽名语义向量，并确定所述词槽名语义向量和所述第二状态向量之间的第一相似性分；

对于词槽名的词槽名语义向量可以通过该预设模型中的一层DNN网络将词槽名做非线性运算来得到该词槽名语义向量，然后再将词槽名语义向量和第二状态向量做二次线性运算得到第一相似性分。

步骤S423，获取所述整体词槽取值对应的取值语义向量，并确定所述取值语义向量和所述第二状态向量之间的第二相似性分。

获取整体词槽取值对应的语义向量可以先计算词槽中的每个词槽取值的语义向量，再确定这些语义向量的相似性分，并对这些相似性分做归一化处理之后同对应的词槽取值的语义向量做加权平均，从而得到整体词槽取值对应的取值语义向量，再将取值语义向量和第二状态向量做二次线性运算以得到第二相似性分。

在本实施例中，通过确定预训练模型中的当前位置状态，来确定词槽名的第一相似性和整体词槽取值的第二相似性，从而保证了系统中的词槽是否为用户所需要的，提高了用户的使用体验感。

具体地，获取所述整体词槽取值对应的取值语义向量的步骤，包括：

步骤A10，获取所述词槽中的各子词槽取值，并确定所述各子词槽取值对应的子取值语义向量；

子词槽取值可以是词槽中的任意一个词槽取值。获取词槽中的所有子词槽取值，并通过该预设模型中的一层DNN网络将子词槽取值做非线性运算来得到子词槽取值对应的子取值语义向量。

步骤A11，计算所述子取值向量和所述第二状态向量之间的第三相似性分，并获取所述第三相似性分和所述子取值向量之间的向量乘积；

第三相似性分可以是任意一个词槽取值和当前位置状态之间的相似性分。通过二次线性运算来计算子取值向量和状态向量之间的第三相似性分，再确定第三相似性分和子取值向量之间的向量乘积。

步骤A12，获取各所述子词槽取值对应的向量乘积，并将各所述向量乘积相加以获取所述整体词槽取值对应的取值语义向量。

获取各个子词槽取值对应的向量乘积，然后再将所有的向量乘积相加以得到其和值，最后将和值作为整体词槽取值对应的取值语义向量。

在本实施例中，通过根据所有子词槽取值来确定整体词槽取值对应的取值语义向量，从而保证了取值语义向量和词槽中的所有词槽取值都相关，保证了取值语义向量的准确性，提高了用户的体验感。

具体地，获取所述预训练模型中的各词槽的步骤，包括：

步骤S411，获取所述预训练模型中的预设问句；

步骤S412，在所述目标领域内对所述预设问句进行语义分析，以确定所述预训练模型中的各词槽。

在预训练模型中，由于每个预设问句需要用到的词槽都不相同，因此需要获取预训练模型中的预设问句，并对此预设问句进行语义分析，从而来确定预训练模型中的各个词槽。例如，当对预设问句进行语义分析时，发现需要与食物相关的东西时，此时词槽名即可以为食物，而词槽中的各个词槽则可以为蛋糕、苹果、烤羊腿等。

在本实施例中，通过根据目标领域下的预设问句来确定预训练模型中的各词槽，从而保证了各个词槽和预设问句相关，避免了无关词槽占据词槽空间，节约了资源，提高了用户的使用体验感。

此外，参照图4，本申请实施例还提出一种语句分析处理装置，所述语句分析处理装置包括：

可选地，所述第一获取模块，还用于：

获取所述预训练模型中的第一状态向量；

获取各所述意图对应的意图名语义向量，并计算各所述意图名语义向量和第一状态向量之间的意图相似性分；

对各所述意图相似性分进行比较，以获取各所述意图相似性分中的最高意图相似性分。

可选地，所述第一获取模块，还用于：

获取所述意图中的各语句信息，并确定各所述语句信息对应的语句语义向量；

获取各所述语句向量的平均向量值，并将所述平均向量值作为所述意图名语义向量。

可选地，所述第二获取模块，还用于：

获取所述预训练模型中的各词槽；

获取所述词槽的词槽名和整体词槽取值，并确定所述词槽名的第一相似性分和所述整体词槽取值的第二相似性分；

并根据所述第一相似性分和所述第二相似性分的和值确定所述词槽的词槽相似性分。

可选地，所述第二获取模块，还用于：

获取所述预训练模型中的当前位置状态，并确定所述当前位置状态的第二状态向量；

获取所述词槽名对应的词槽名语义向量，并确定所述词槽名语义向量和所述第二状态向量之间的第一相似性分；

获取所述整体词槽取值对应的取值语义向量，并确定所述取值语义向量和所述第二状态向量之间的第二相似性分。

可选地，所述第二获取模块，还用于：

获取所述词槽中的各子词槽取值，并确定所述各子词槽取值对应的子取值语义向量；

计算所述子取值向量和所述第二状态向量之间的第三相似性分，并获取所述第三相似性分和所述子取值向量之间的向量乘积；

获取各所述子词槽取值对应的向量乘积，并将各所述向量乘积相加以获取所述整体词槽取值对应的取值语义向量。

可选地，所述第二获取模块，还用于：

获取所述预训练模型中的预设问句；

在所述目标领域内对所述预设问句进行语义分析，以确定所述预训练模型中的各词槽。

其中，语句分析处理装置的各个功能模块实现的步骤可参照本申请语句分析处理方法的各个实施例，此处不再赘述。

此外，本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质可以为非易失性可读存储介质。

本申请计算机可读存储介质上存储有计算机可读指令，其中所述计算机可读指令被处理器执行时，实现如上述的语句分析处理方法的步骤。

其中，该计算机可读指令被执行时所实现的方法可参照本申请语句分析处理方法的各个实施例，此处不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种语句分析处理方法，其特征在于，所述语句分析处理方法包括以下步骤：

获取源领域大样本数据集上的预训练模型，并将所述预训练模型迁移学习到目标领域；

在所述目标领域内，获取所述预训练模型中预设问句的各语句特征，并对各所述语句特征进行语义分析，以确定所述预设问句对应的各不同意图；

获取各所述意图在预训练模型中的意图相似性分，并在各所述意图相似性分中确定最高意图相似性分；

获取所述预训练模型中的各词槽，确定各所述词槽在训练模型中的词槽相似性分，并在各所述词槽相似性分中确定最高词槽相似性分；

获取所述最高意图相似性分对应的最终意图和所述最高词槽相似性分对应的最终词槽，并输出所述最高意图和所述最终词槽。
如权利要求1所述的语句分析处理方法，其特征在于，所述获取各所述意图在预训练模型中的意图相似性分，并在各所述意图相似性分中确定最高意图相似性分的步骤，包括：

获取所述预训练模型中的第一状态向量；

获取各所述意图对应的意图名语义向量，并计算各所述意图名语义向量和第一状态向量之间的意图相似性分；

对各所述意图相似性分进行比较，以获取各所述意图相似性分中的最高意图相似性分。
如权利要求2所述的语句分析处理方法，其特征在于，所述获取各所述意图对应的意图名语义向量的步骤，包括：

获取所述意图中的各语句信息，并确定各所述语句信息对应的语句语义向量；

获取各所述语句向量的平均向量值，并将所述平均向量值作为所述意图名语义向量。
如权利要求1所述的语句分析处理方法，其特征在于，所述获取所述预训练模型中的各词槽，确定各所述词槽在训练模型中的词槽相似性分的步骤，包括：

获取所述预训练模型中的各词槽；

获取所述词槽的词槽名和整体词槽取值，并确定所述词槽名的第一相似性分和所述整体词槽取值的第二相似性分；

根据所述第一相似性分和所述第二相似性分的和值确定所述词槽的词槽相似性分。
如权利要求4所述的语句分析处理方法，其特征在于，所述确定所述词槽名的第一相似性分和所述整体词槽取值的第二相似性分的步骤，包括：

获取所述预训练模型中的当前位置状态，并确定所述当前位置状态的第二状态向量；

获取所述词槽名对应的词槽名语义向量，并确定所述词槽名语义向量和所述第二状态向量之间的第一相似性分；

获取所述整体词槽取值对应的取值语义向量，并确定所述取值语义向量和所述第二状态向量之间的第二相似性分。
如权利要求5所述的语句分析处理方法，其特征在于，所述获取所述整体词槽取值对应的取值语义向量的步骤，包括：

获取所述词槽中的各子词槽取值，并确定所述各子词槽取值对应的子取值语义向量；

计算所述子取值向量和所述第二状态向量之间的第三相似性分，并获取所述第三相似性分和所述子取值向量之间的向量乘积；

获取各所述子词槽取值对应的向量乘积，并将各所述向量乘积相加以获取所述整体词槽取值对应的取值语义向量。
如权利要求4所述的语句分析处理方法，其特征在于，所述获取所述预训练模型中的各词槽的步骤，包括：

获取所述预训练模型中的预设问句；

在所述目标领域内对所述预设问句进行语义分析，以确定所述预训练模型中的各词槽。
一种语句分析处理装置，其特征在于，所述语句分析处理装置包括：

迁移模块，用于获取源领域大样本数据集上的预训练模型，并将所述预训练模型迁移学习到目标领域；

确定模块，用于在所述目标领域内，获取所述预训练模型中预设问句的各语句特征，并对各所述语句特征进行语义分析，以确定所述预设问句对应的各不同意图；

第一获取模块，用于获取各所述意图在预训练模型中的意图相似性分，并在各所述意图相似性分中确定最高意图相似性分；

第二获取模块，用于获取所述预训练模型中的各词槽，确定各所述词槽在预训练模型中的词槽相似性分，并在各所述词槽相似性分中确定最高词槽相似性分；

输出模块，用于获取所述最高意图相似性分对应的最终意图和所述最高词槽相似性分对应的最终词槽，并输出所述最高意图和所述最终词槽。
一种语句分析处理设备，其特征在于，所述语句分析处理设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机可读指令，其中所述计算机可读指令被所述处理器执行时实现如下步骤：

获取源领域大样本数据集上的预训练模型，并将所述预训练模型迁移学习到目标领域；

在所述目标领域内，获取所述预训练模型中预设问句的各语句特征，并对各所述语句特征进行语义分析，以确定所述预设问句对应的各不同意图；

获取各所述意图在预训练模型中的意图相似性分，并在各所述意图相似性分中确定最高意图相似性分；

获取所述预训练模型中的各词槽，确定各所述词槽在训练模型中的词槽相似性分，并在各所述词槽相似性分中确定最高词槽相似性分；

获取所述最高意图相似性分对应的最终意图和所述最高词槽相似性分对应的最终词槽，并输出所述最高意图和所述最终词槽。
如权利要求9所述的语句分析处理设备，其特征在于，所述获取各所述意图在预训练模型中的意图相似性分，并在各所述意图相似性分中确定最高意图相似性分的步骤，包括：

获取所述预训练模型中的第一状态向量；

获取各所述意图对应的意图名语义向量，并计算各所述意图名语义向量和第一状态向量之间的意图相似性分；

对各所述意图相似性分进行比较，以获取各所述意图相似性分中的最高意图相似性分。
如权利要求10所述的语句分析处理设备，其特征在于，所述获取各所述意图对应的意图名语义向量的步骤，包括：

获取所述意图中的各语句信息，并确定各所述语句信息对应的语句语义向量；

获取各所述语句向量的平均向量值，并将所述平均向量值作为所述意图名语义向量。
如权利要求9所述的语句分析处理设备，其特征在于，所述获取所述预训练模型中的各词槽，确定各所述词槽在训练模型中的词槽相似性分的步骤，包括：

获取所述预训练模型中的各词槽；

获取所述词槽的词槽名和整体词槽取值，并确定所述词槽名的第一相似性分和所述整体词槽取值的第二相似性分；

根据所述第一相似性分和所述第二相似性分的和值确定所述词槽的词槽相似性分。
如权利要求12所述的语句分析处理设备，其特征在于，所述确定所述词槽名的第一相似性分和所述整体词槽取值的第二相似性分的步骤，包括：

获取所述预训练模型中的当前位置状态，并确定所述当前位置状态的第二状态向量；

获取所述词槽名对应的词槽名语义向量，并确定所述词槽名语义向量和所述第二状态向量之间的第一相似性分；

获取所述整体词槽取值对应的取值语义向量，并确定所述取值语义向量和所述第二状态向量之间的第二相似性分。
如权利要求13所述的语句分析处理设备，其特征在于，所述获取所述整体词槽取值对应的取值语义向量的步骤，包括：

获取所述词槽中的各子词槽取值，并确定所述各子词槽取值对应的子取值语义向量；

计算所述子取值向量和所述第二状态向量之间的第三相似性分，并获取所述第三相似性分和所述子取值向量之间的向量乘积；

获取各所述子词槽取值对应的向量乘积，并将各所述向量乘积相加以获取所述整体词槽取值对应的取值语义向量。
如权利要求12所述的语句分析处理设备，其特征在于，所述获取所述预训练模型中的各词槽的步骤，包括：

获取所述预训练模型中的预设问句；

在所述目标领域内对所述预设问句进行语义分析，以确定所述预训练模型中的各词槽。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时，实现如下步骤：

获取源领域大样本数据集上的预训练模型，并将所述预训练模型迁移学习到目标领域；

在所述目标领域内，获取所述预训练模型中预设问句的各语句特征，并对各所述语句特征进行语义分析，以确定所述预设问句对应的各不同意图；

获取各所述意图在预训练模型中的意图相似性分，并在各所述意图相似性分中确定最高意图相似性分；

获取所述预训练模型中的各词槽，确定各所述词槽在训练模型中的词槽相似性分，并在各所述词槽相似性分中确定最高词槽相似性分；

获取所述最高意图相似性分对应的最终意图和所述最高词槽相似性分对应的最终词槽，并输出所述最高意图和所述最终词槽。
如权利要求16所述的计算机可读存储介质，其特征在于，所述获取各所述意图在预训练模型中的意图相似性分，并在各所述意图相似性分中确定最高意图相似性分的步骤，包括：

获取所述预训练模型中的第一状态向量；

获取各所述意图对应的意图名语义向量，并计算各所述意图名语义向量和第一状态向量之间的意图相似性分；

对各所述意图相似性分进行比较，以获取各所述意图相似性分中的最高意图相似性分。
如权利要求17所述的计算机可读存储介质，其特征在于，所述获取各所述意图对应的意图名语义向量的步骤，包括：

获取所述意图中的各语句信息，并确定各所述语句信息对应的语句语义向量；

获取各所述语句向量的平均向量值，并将所述平均向量值作为所述意图名语义向量。
如权利要求16所述的计算机可读存储介质，其特征在于，所述获取所述预训练模型中的各词槽，确定各所述词槽在训练模型中的词槽相似性分的步骤，包括：

获取所述预训练模型中的各词槽；

获取所述词槽的词槽名和整体词槽取值，并确定所述词槽名的第一相似性分和所述整体词槽取值的第二相似性分；

根据所述第一相似性分和所述第二相似性分的和值确定所述词槽的词槽相似性分。
如权利要求19所述的计算机可读存储介质，其特征在于，所述确定所述词槽名的第一相似性分和所述整体词槽取值的第二相似性分的步骤，包括：

获取所述预训练模型中的当前位置状态，并确定所述当前位置状态的第二状态向量；

获取所述词槽名对应的词槽名语义向量，并确定所述词槽名语义向量和所述第二状态向量之间的第一相似性分；

获取所述整体词槽取值对应的取值语义向量，并确定所述取值语义向量和所述第二状态向量之间的第二相似性分。