CN112163074A

CN112163074A - 用户意图识别方法、装置、可读存储介质及电子设备

Info

Publication number: CN112163074A
Application number: CN202010955627.8A
Authority: CN
Inventors: 陈见耸; 张伟波; 杨帆
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2020-09-11
Filing date: 2020-09-11
Publication date: 2021-01-01

Abstract

本公开涉及一种用户意图识别方法、装置、可读存储介质及电子设备。方法包括：获取待识别的目标文本；将目标文本输入至意图识别模型，以得到目标意图识别层输出的第一意图识别结果，其中，目标意图识别层是从意图识别模型中的多个意图识别层中确定的与目标文本所属的目标场景相匹配的意图识别层；根据第一意图识别结果，确定目标文本对应的目标用户意图。这样，在对目标场景下的目标文本进行识别时，无需再训练针对该场景的意图识别模型，确保了用户意图识别的及时性，提高了用户意图识别的效率。并且，由于所确定的第一意图识别结果较为准确，因此，基于该较为准确的第一意图识别结果，可以准确地识别出目标文本对应的目标用户意图。

Description

用户意图识别方法、装置、可读存储介质及电子设备

技术领域

本公开涉及计算机技术领域，具体地，涉及一种用户意图识别方法、装置、可读存储介质及电子设备。

背景技术

较多企业存在大量与客户、配送运力对话交流的需求，其中，很多需求都是简单重复性的工作，比如向用户告知补贴额度调整、促销活动等。如果用人工来完成这些工作，就需要大量的人力，成本较高。因此，智能机器人的应用越来越普遍。采用智能机器人的方式，利用人工智能技术代替人工，可以降低成本。其中，智能机器人的核心是意图识别，通过分析用户意图来了解用户想询问的具体内容，再给出相应的答案或做出相应的操作。

通常情况下，不同场景下的同一文本所对应的用户意图相差较大，因此，相关技术中，多是针对不同的场景，利用该场景下的语料训练不同的意图识别模型，进而利用该场景对应的意图识别模型识别该场景下的文本对应的用户意图。这样，在一个新的场景下进行识别意图时，需要先训练该场景下的意图识别模型，即，需要收集语料、标注以及模型训练三个过程，而在一个新的场景下需花费较多时间才能收集到较多语料，以满足训练要求，这就限制了用户意图识别的及时性，导致用户意图识别的效率较低。

发明内容

本公开的目的是提供一种用户意图识别方法、装置、可读存储介质及电子设备，以提高用户意图识别的效率。

为了实现上述目的，本公开第一方面提供一种用户意图识别方法，包括：

获取待识别的目标文本；

将所述目标文本输入至意图识别模型，以得到目标意图识别层输出的第一意图识别结果，其中，所述目标意图识别层是从所述意图识别模型中的多个意图识别层中确定的与所述目标文本所属的目标场景相匹配的意图识别层；

根据所述第一意图识别结果，确定所述目标文本对应的目标用户意图。

可选地，所述目标意图识别层通过以下方式确定：

获取所述目标场景下的测试文本以及所述测试文本对应的用户意图；

将所述测试文本输入至所述意图识别模型，以得到所述多个意图识别层输出的多个意图识别结果；

确定每一所述意图识别层输出的所述意图识别结果与所述测试文本对应的用户意图相似度；

将所述相似度最高的意图识别层确定为目标意图识别层。

可选地，所述多个意图识别层包括至少一个场景意图识别层，并且各场景意图识别层对应不同场景；所述目标意图识别层还通过以下方式确定：

在至少一个所述场景意图识别层中，确定是否存在与所述目标场景对应的场景意图识别层；

在确定存在与所述目标场景对应的场景意图识别层的情况下，将与所述目标场景对应的场景意图识别层确定为所述目标意图识别层；或者

在确定不存在与所述目标场景对应的场景意图识别层的情况下，再执行所述获取所述目标场景下的测试文本，以及所述测试文本对应的用户意图的步骤。

可选地，所述意图识别模型还包括特征提取层，所述将所述测试文本输入至所述意图识别模型，以得到所述多个意图识别层输出的多个意图识别结果，包括：

将所述测试文本输入至所述特征提取层，以得到所述特征提取层输出的特征向量；

将所述特征向量分别输入所述多个意图识别层，以得到所述多个意图识别层输出的多个意图识别结果。

可选地，所述意图识别模型还包括特征提取层，所述多个意图识别层包括通用意图识别层和至少一个场景意图识别层；所述意图识别模型通过以下方式获得：

获取不同场景下的训练样本以及所述训练样本对应的用户意图；

针对每一场景，将所述场景下的所述训练样本作为所述意图识别模型的输入，将所述训练样本对应的用户意图分别作为所述意图识别模型中的所述场景对应的场景意图识别层和所述通用意图识别层的输出，对所述特征提取层、所述场景对应的场景意图识别层和所述通用意图识别层进行训练。

可选地，所述根据所述第一意图识别结果，确定所述目标文本应的目标用户意图，包括：

在所述第一意图识别结果表征识别出用户意图的情况下，将所述第一意图识别结果表征的用户意图，确定为所述目标文本对应的目标用户意图；或者

在所述第一意图识别结果表征未识别出用户意图的情况下，根据所述目标文本和所述目标场景对应的语料库，确定所述目标文本的第二意图识别结果，其中，所述语料库存储有所述目标场景下的多条文本和每条文本各自对应的用户意图；

在所述第二意图识别结果表征识别出用户意图的情况下，将所述第二意图识别结果表征的用户意图，确定为所述目标文本对应的目标用户意图。

可选地，所述方法还包括：

在所述第二意图识别结果表征未识别出用户意图的情况下，接收用户输入的所述目标文本对应的目标用户意图；

将所述目标文本和所述目标用户意图关联存储在所述语料库中。

本公开第二方面提供一种用户意图识别装置，包括：

第一获取模块，用于获取待识别的目标文本；

第一输入模块，用于将所述目标文本输入至意图识别模型，以得到目标意图识别层输出的第一意图识别结果，其中，所述目标意图识别层是从所述意图识别模型中的多个意图识别层中确定的与所述目标文本所属的目标场景相匹配的意图识别层；

第一确定模块，用于根据所述第一意图识别结果，确定所述目标文本对应的目标用户意图。

可选地，所述装置还包括：

第二获取模块，用于获取所述目标场景下的测试文本以及所述测试文本对应的用户意图；

第二输入模块，用于将所述测试文本输入至所述意图识别模型，以得到所述多个意图识别层输出的多个意图识别结果；

第二确定模块，用于确定每一所述意图识别层输出的所述意图识别结果与所述测试文本对应的用户意图相似度；

第三确定模块，用于将所述相似度最高的意图识别层确定为目标意图识别层。

可选地，所述多个意图识别层包括至少一个场景意图识别层，并且各场景意图识别层对应不同场景；所述装置还包括：

第四确定模块，用于在至少一个所述场景意图识别层中，确定是否存在与所述目标场景对应的场景意图识别层；

第五确定模块，用于在确定存在与所述目标场景对应的场景意图识别层的情况下，将与所述目标场景对应的场景意图识别层确定为所述目标意图识别层；或者

驱动模块，用于在确定不存在与所述目标场景对应的场景意图识别层的情况下，驱动所述第二获取模块执行所述获取所述目标场景下的测试文本，以及所述测试文本对应的用户意图的步骤。

可选地，述意图识别模型还包括特征提取层，所述第二输入模块包括：

第一输入子模块，用于本将所述测试文本输入至所述特征提取层，以得到所述特征提取层输出的特征向量；

第二输入子模块，用于将所述特征向量分别输入所述多个意图识别层，以得到所述多个意图识别层输出的多个意图识别结果。

可选地，所述意图识别模型还包括特征提取层，所述多个意图识别层包括通用意图识别层和至少一个场景意图识别层；所述装置还包括：

第三获取模块，用于获取不同场景下的训练样本以及所述训练样本对应的用户意图；

训练模块，用于针对每一场景，将所述场景下的所述训练样本作为所述意图识别模型的输入，将所述训练样本对应的用户意图分别作为所述意图识别模型中的所述场景对应的场景意图识别层和所述通用意图识别层的输出，对所述特征提取层、所述场景对应的场景意图识别层和所述通用意图识别层进行训练。

可选地，所述第一确定模块包括：

第一确定子模块，用于在所述第一意图识别结果表征识别出用户意图的情况下，将所述第一意图识别结果表征的用户意图，确定为所述目标文本对应的目标用户意图；或者

第二确定子模块，用于在所述第一意图识别结果表征未识别出用户意图的情况下，根据所述目标文本和所述目标场景对应的语料库，确定所述目标文本的第二意图识别结果，其中，所述语料库存储有所述目标场景下的多条文本和每条文本各自对应的用户意图；

第三确定子模块，用于在所述第二意图识别结果表征识别出用户意图的情况下，将所述第二意图识别结果表征的用户意图，确定为所述目标文本对应的目标用户意图。

本公开第三方面还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本公开第一方面所提供的所述方法的步骤。

本公开第四方面还提供一种电子设备，包括：

存储器，其上存储有计算机程序；

处理器，用于执行所述存储器中的所述计算机程序，以实现本公开第一方面所提供的所述方法的步骤。

通过上述技术方案，首先，在意图识别模型中的多个意图识别层中确定与目标文本所属的目标场景相匹配的目标意图识别层，之后，在将该目标文本输入至意图识别模型时，可以根据该目标意图识别层输出的第一意图识别结果，确定目标文本对应的目标用户意图。这样，在对目标场景下的目标文本进行识别时，无需再训练针对该场景的意图识别模型，确保了用户意图识别的及时性，提高了用户意图识别的效率。并且，由于所确定的第一意图识别结果较为准确，因此，基于该较为准确的第一意图识别结果，可以准确地识别出目标文本对应的目标用户意图。

本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

附图是用来提供对本公开的进一步理解，并且构成说明书的一部分，与下面的具体实施方式一起用于解释本公开，但并不构成对本公开的限制。在附图中：

图1是根据一示例性实施例示出的一种用户意图识别方法的流程图。

图2是根据一示例性实施例示出的一种确定目标意图识别层方法的流程图。

图3是根据一示例性实施例示出的一种意图识别模型的示意图。

图4是根据一示例性实施例示出的另一种确定目标意图识别层方法的流程图。

图5是根据一示例性实施例示出的一种训练意图识别模型的方法的流程图。

图6是根据一示例性实施例示出的一种用户意图识别装置的框图。

图7是根据一示例性实施例示出的一种电子设备的框图。

图8是根据一示例性实施例示出的一种电子设备的框图。

具体实施方式

以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是，此处所描述的具体实施方式仅用于说明和解释本公开，并不用于限制本公开。

图1是根据一示例性实施例示出的一种用户意图识别方法的流程图。如图1所示，该方法可以包括以下步骤。

在步骤101中，获取待识别的目标文本。

其中，目标文本可以是用户编辑的文本信息，也可以是用户发出的语音信息，还可以是用户做出的肢体动作信息，例如，点头信息、手势信息等。本公开对此不作具体限定。

值得说明的是，在一些特殊场景下，用户做出的肢体动作信息也可以作为目标文本。例如，智能机器人询问“是否点单”，当用户做出“点头”动作时，智能机器人可连续采集用户的图像信息，并利用图像识别技术识别出用户的“点头”动作，进而获取到的目标文本即为“可以”或者“是”等等。

在步骤102中，将目标文本输入至意图识别模型，以得到目标意图识别层输出的第一意图识别结果。

其中，意图识别模型是基于多任务学习预先训练得到的，且训练后的意图识别模型包括可以多个意图识别层。步骤102中的目标意图识别层是从该多个意图识别层中预先确定的与目标文本所属的目标场景相匹配的意图识别层。也即是，在多个意图识别层中确定出与该目标文本所属的目标场景相匹配的意图识别层，并将该意图识别层作为目标意图识别层。之后，在将目标文本输入至意图识别模型时，该目标意图识别层输出的意图识别结果较为准确。其中，该第一意图识别结果可以用于指示是否识别出用户意图，以及，在指示识别出用户意图的情况下，该第一意图识别结果还可以表征意图识别模型识别出的目标文本对应的用户意图。

值得说明的是，在实际应用中，目标文本通常为用户输入的文本，存在大量的口语词、重叠词等表述，导致意图识别模型不容易识别。因此，在一种可能的实施方式中，在将目标文本输入至意图识别模型之前，可先对该目标文本进行预处理，以去除这些口语化的表述，得到较为规整的文本，以便于意图识别模型识别。此外，预处理可以为分词处理等。采用相关技术中分词处理方式对目标文本进行分词。通过预处理，可以将目标文本分割为多个字符串，为后续的用户意图识别作基础分割。

在步骤103中，根据第一意图识别结果，确定目标文本对应的目标用户意图。

如上所述，目标意图识别层与目标文本所属的目标场景较为匹配，因此，目标意图识别层输出的意图识别结果较为符合该目标场景，也即是，该第一意图识别结果较为准确，如此，基于该较为准确的第一意图识别结果，可以准确地识别出目标文本对应的目标用户意图。

采用上述技术方案，首先，在意图识别模型中的多个意图识别层中确定与目标文本所属的目标场景相匹配的目标意图识别层，之后，在将该目标文本输入至意图识别模型时，可以根据该目标意图识别层输出的第一意图识别结果，确定目标文本对应的目标用户意图。这样，在对目标场景下的目标文本进行识别时，无需再训练针对该场景的意图识别模型，确保了用户意图识别的及时性，提高了用户意图识别的效率。并且，由于所确定的第一意图识别结果较为准确，因此，基于该较为准确的第一意图识别结果，可以准确地识别出目标文本对应的目标用户意图。

为了便于本领域技术人员更好的理解本公开所提供的用户意图识别方法，下面以一个完整的实施例对该用户意图识别方法进行详细说明。

首先，对目标意图识别层的确定方式进行说明。图2是根据一示例性实施例示出的一种确定目标意图识别层方法的流程图。如图2所示，该方法可以包括以下步骤。

在步骤201中，获取目标场景下的测试文本以及测试文本对应的用户意图。

在本公开中，为了确定与目标场景相匹配的目标意图识别层，需要预先收集该目标场景下的一部分文本，以及，该文本对应的用户意图，并将该文本作为测试文本。其中，测试文本对应的用户意图可以是用户人工标注出的用户意图。例如，测试文本“加入购物车”对应的用户意图为加入购物车；测试文本“帮我结账吧”对应的用户意图为下单；测试文本“确认支付”对应的用户意图为付钱等等。

在步骤202中，将测试文本输入至意图识别模型，以得到多个意图识别层输出的多个意图识别结果。

如上所述，意图识别模型是基于多任务学习方式确定的，在该意图识别模型中可以包括多个意图识别层。如此，在将测试样本输入至意图识别模型之后，该意图识别模型中的多个意图识别层分别输出意图识别结果。假设该意图识别模型包括四个意图识别层，分别为意图识别层A、意图识别层B、意图识别层C和意图识别层D。这样，在将测试文本输入该意图识别模型之后，可得到意图识别层A、意图识别层B、意图识别层C和意图识别层D分别输出的意图识别结果A、意图识别结果B、意图识别结果C和意图识别结果D。

在一种实施例中，意图识别模型还可以包括特征提取层，上述步骤202的具体实施方式可以包括：

将测试文本输入至特征提取层，以得到特征提取层输出的特征向量。其中，可以采用相关技术对测试文本进行特征提取。

将特征向量分别输入多个意图识别层，以得到多个意图识别层输出的多个意图识别结果。

示例地，如图3所示，该意图识别模型包括一个特征提取层和四个意图识别层。首先，将测试文本输入至特征提取层，以对该测试文本进行特征提取得到特征向量。之后，特征提取层将所提取到的特征向量分别输入至意图识别层A、意图识别层B、意图识别层C和意图识别层D，以得到意图识别层A、意图识别层B、意图识别层C和意图识别层D分别输出的意图识别结果。

在步骤203中，确定每一意图识别层输出的意图识别结果与测试文本对应的用户意图相似度。

在步骤204中，将相似度最高的意图识别层确定为目标意图识别层。

通常情况下，测试文本的数量为几百条。例如，该测试文本为100条，则在将该100条测试文本输入意图识别模型之后，每一意图识别层均会输出100个意图识别结果，然后，确定每一意图识别层输出的意图识别结果与测试文本对应的用户意图相似度。

示例地，针对每一意图识别层，可以根据该意图识别层输出的100个意图识别结果和该100条测试文本各自对应的意图识别结果，确定该意图识别层的识别准确度。其中，识别准确度越高表征该意图识别层输出的意图识别结果与测试文本对应的用户意图相似度越高，识别准确度越低表征该意图识别层输出的意图识别结果与测试文本对应的用户意图相似度越低。例如，计算得到的意图识别层A、意图识别层B、意图识别层C和意图识别层D的识别准确度分别为90％、85％、88％和70％，意图识别层A的识别准确度最高，则将意图识别层A确定为与目标场景相匹配的目标意图识别层。

需要说明的是，获取测试文本的目的是为了确定出与目标场景相匹配的目标意图识别层，通常情况下，无需获取较多数量的测试文本。例如，所获取的测试文本的数量可以为100、200等等。而训练模型所需训练样本的数量较大，通常需要几万条训练样本。因此，相较于现有技术中训练该目标场景对应的意图识别模型的方式，采用测试文本确定目标意图识别层的方式，所获取的文本数量较少，并且，还节省了训练过程，保证用户意图识别的及时性。

采用上述技术方式，由于是基于目标场景下的测试样本确定与该目标场景相匹配的目标意图识别层，如此，该目标意图识别层在一定程度上可以准确地识别出该目标场景下的文本对应的用户意图，即，提高了对用户意图识别的准确度，并且，无需收集目标场景下较多的文本，提高了用户意图识别的效率。

此外，在实际应用中，可能训练有某一场景对应的场景意图识别层，因此，在一种可能的实施例中，该多个意图识别层包括至少一个场景意图识别层，并且该场景意图识别层对应不同的场景。如图4所示，该确定目标意图识别层方法还可以包括以下步骤。

在步骤401中，在至少一个场景意图识别层中，确定是否存在与目标场景对应的场景意图识别层。

示例地，可以针对不同的场景训练该场景对应的场景意图识别层，并将该场景与该场景意图识别层关联。例如，意图识别层A、意图识别层B、意图识别层C均为场景意图识别层，且，意图识别层A与场景A关联、意图识别层B与场景B关联、意图识别层C与场景C关联。如此，在确定出目标文本所属的目标场景之后，在场景意图识别层中，确定是否存在与该目标场景对应的场景意图识别层。示例地，若目标场景为场景A，则确定存在与该目标场景对应的场景意图识别层，若目标场景为场景D，则确定不存在与该目标场景对应的场景意图识别层。以及，在确定存在与目标场景对应的场景意图识别层的情况下，执行步骤402。

在步骤402中，将与目标场景对应的场景意图识别层确定为目标意图识别层。例如，目标场景为场景A，则可以将与场景A关联的意图识别层A确定为目标意图识别层。

在确定不存在与目标场景对应的场景意图识别层的情况下，执行图2中的步骤201至步骤204。其中，已在图2中对步骤201至步骤204的具体实施方式进行了详细描述，此处不再赘述。

采用上述技术方式，在确定存在与目标场景对应的场景意图识别层的情况下，将与目标场景对应的场景意图识别层确定为目标意图识别层，进一步确保对用户意图识别的及时性。在确定不存在的情况下，根据目标场景下的测试样本确定与该目标场景相匹配的目标意图识别层，提高了对用户意图识别的准确度。

下面对上述所使用的意图识别模型的训练方式进行说明。图5是根据一示例性实施例示出的一种训练意图识别模型的方法的流程图。如图5所示，该训练方法可以包括以下步骤。

在步骤501中，获取不同场景下的训练样本以及训练样本对应的用户意图。

在步骤502中，针对每一场景，将场景下的训练样本作为意图识别模型的输入，将训练样本对应的用户意图分别作为意图识别模型中的场景对应的场景意图识别层和通用意图识别层的输出，对特征提取层、场景对应的场景意图识别层和通用意图识别层进行训练。

在本公开中，意图识别模型可以包括特征提取层和多个意图识别层，并且，该多个意图识别层包括通用意图识别层和至少一个场景意图识别层。示例地，如图6所示，该意图识别模型包括一个特征提取层、三个场景意图识别层(例如，场景意图识别层1、场景意图识别层2和场景意图识别层3)和一个通用意图识别层。

首先，分别获取场景1、场景2和场景3下的文本以及文本对应的用户意图，将该文本作为训练样本。之后，将场景i(i取值范围为[1，3])下的训练样本，输入至意图识别模型，可得到场景意图识别层1至场景意图识别层3、以及通用意图识别层输出的意图识别结果。但是，由于当前仅需对特征提取层、场景意图识别层i和通用意图识别层进行训练，因此，仅需获取场景意图识别层i和通用意图识别层输出的意图识别结果即可。在获取到场景意图识别层i和通用意图识别层输出的意图识别结果之后，将该输出的意图识别结果与场景i下的训练样本对应的用户意图进行比较，计算误差(误差函数可以采用sofmax)，分别记为loss_i和loss_general。将loss_i和loss_general相加得到总误差loss，根据总误差loss，对场景意图识别层i、通用意图识别层以及特征提取层进行反向传播，以对场景意图识别层i、通用意图识别层以及特征提取层进行训练。

按照上述方式对意图识别模型进行训练，既可以得到与单个场景对应的场景意图识别层，也可以得到利用不同场景下的文本训练的通用意图识别层。这样，既可以利用场景意图识别层准确识别其对应场景下的文本对应的用户意图，还可以通过通用意图识别层粗粒度的识别不同场景下的文本对应的用户意图。

在实际应用中，根据用户意图的通用性，通常会将用户意图识别分为通用意图识别和场景相关意图识别。其中，通用意图是从众多的任务场景中抽取的共有的意图，比如“肯定意图”、“否定意图”等。例如，可以利用上述训练的意图识别模型识别新场景下的文本对应的用户意图，以实现对目标文本的通用意图的识别。但是，可能会出现因未预先训练该目标文本所属的目标场景对应的场景意图识别层而导致无法识别出用户意图的情况，因此，在本公开中，根据第一意图识别结果，确定所述目标文本应的目标用户意图的可以进一步包括：

在第一意图识别结果表征识别出用户意图的情况下，将第一意图识别结果表征的用户意图，确定为目标文本对应的目标用户意图。若通过意图识别模型能够识别出该目标文本对应的用户意图，则目标意图识别层识别出的用户意图即为目标用户意图。

在第一意图识别结果表征未识别出用户意图的情况下，根据目标文本和目标场景对应的语料库，确定目标文本的第二意图识别结果，其中，语料库存储有目标场景下的多条文本和每条文本各自对应的用户意图。

在第二意图识别结果表征识别出用户意图的情况下，将第二意图识别结果表征的用户意图，确定为所述目标文本对应的目标用户意图。

由于不同场景下文本对应的用户意图的差别较大，因此，在目标意图识别层未识别出用户意图之后，需从目标场景对应的语料库中确定第二意图识别结果。示例地，针对目标场景下的每类用户意图均收集少量所对应的文本，并对语料库中的每条文本建立倒排索引，例如，对每条文本进行分词，对文本中出现的每个词建立其与文本的索引关系。

接着，从语料库中检索与目标文本相关的候选文本。例如，对目标文本进行分词，基于语料库中的倒排索引召回与目标文本有公共词的文本(以下称为召回文本)，并计算目标文本与召回文本之间的相似度(例如jaccard相似度)，基于所计算的相似度，选取相似度最高的前K个召回文本作为候选文本。

之后，对候选文本和目标文本进行相似度排序。例如，将候选文本和目标文本均表示为向量形式，计算目标文本的向量和每一候选文本的向量的余弦相似度，并根据余弦相似度对候选文本进行排序。若余弦相似度的最大值大于或等于预设阈值，则认为余弦相似度最大的候选文本与目标文本相似，则所确定的目标文本的第二意图识别结果表征识别出用户意图，且第二意图识别结果表征的用户意图即为该候选文本对应的用户意图，该候选文本对应的用户意图即为目标文本对应的目标用户意图。若余弦相似度的最大值仍小于预设阈值，则认为候选文本与目标文本均不相似，则所确定的目标文本的第二意图识别结果表征未识别出用户意图。

此外，为了丰富语料库中存储的文本，在本公开中，在第二意图识别结果表征未识别出用户意图的情况下，还可以获取用户输入的目标文本对应的目标用户意图。例如，在未识别出目标文本对应的目标用户意图的情况下，用户可人工标注该目标用户意图，并将该目标用户意图发送给执行该方法的电子设备或服务器，如此，该电子设备或服务器可接收用户输入的目标文本对应的目标用户意图，并将该目标文本和目标用户意图关联存储在语料库中，以便后续根据该语料库确定其他文本对应的用户意图。

采用上述技术方案，在对新场景下的文本进行用户意图识别时，无需收集该新场景下较多语料即可实现用户意图识别，提高了用户意图识别的效率。

基于同一发明构思，本公开还提供一种用户意图识别装置。图6是根据一示例性实施例示出的一种用户意图识别装置的框图。如图6所示，该用户意图识别装置600可以包括：

第一获取模块601，用于获取待识别的目标文本；

第一输入模块602，用于将所述目标文本输入至意图识别模型，以得到目标意图识别层输出的第一意图识别结果，其中，所述目标意图识别层是从所述意图识别模型中的多个意图识别层中确定的与所述目标文本所属的目标场景相匹配的意图识别层；

第一确定模块603，用于根据所述第一意图识别结果，确定所述目标文本对应的目标用户意图。

可选地，所述装置还可以包括：

可选地，所述多个意图识别层包括至少一个场景意图识别层，并且各场景意图识别层对应不同场景；所述装置还可以包括：

可选地，述意图识别模型还包括特征提取层，所述第二输入模块可以包括：

可选地，所述意图识别模型还包括特征提取层，所述多个意图识别层包括通用意图识别层和至少一个场景意图识别层；所述装置还可以包括：

可选地，所述第一确定模块可以包括：

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图7是根据一示例性实施例示出的一种电子设备的框图。如图7所示，该电子设备700可以包括：处理器701，存储器702。该电子设备700还可以包括多媒体组件703，输入/输出(I/O)接口704，以及通信组件705中的一者或多者。

其中，处理器701用于控制该电子设备700的整体操作，以完成上述的用户意图识别方法中的全部或部分步骤。存储器702用于存储各种类型的数据以支持在该电子设备700的操作，这些数据例如可以包括用于在该电子设备700上操作的任何应用程序或方法的指令，以及应用程序相关的数据，例如联系人数据、收发的消息、图片、音频、视频等等。该存储器702可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，例如静态随机存取存储器(Static Random Access Memory，简称SRAM)，电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，简称EEPROM)，可擦除可编程只读存储器(Erasable Programmable Read-Only Memory，简称EPROM)，可编程只读存储器(Programmable Read-Only Memory，简称PROM)，只读存储器(Read-Only Memory，简称ROM)，磁存储器，快闪存储器，磁盘或光盘。多媒体组件703可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏，音频组件用于输出和/或输入音频信号。例如，音频组件可以包括一个麦克风，麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器702或通过通信组件705发送。音频组件还包括至少一个扬声器，用于输出音频信号。I/O接口704为处理器701和其他接口模块之间提供接口，上述其他接口模块可以是键盘，鼠标，按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件705用于该电子设备700与其他设备之间进行有线或无线通信。无线通信，例如Wi-Fi，蓝牙，近场通信(Near FieldCommunication，简称NFC)，2G、3G、4G、NB-IOT、eMTC、或其他5G等等，或它们中的一种或几种的组合，在此不做限定。因此相应的该通信组件705可以包括：Wi-Fi模块，蓝牙模块，NFC模块等等。

在一示例性实施例中，电子设备700可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit，简称ASIC)、数字信号处理器(DigitalSignal Processor，简称DSP)、数字信号处理设备(Digital Signal Processing Device，简称DSPD)、可编程逻辑器件(Programmable Logic Device，简称PLD)、现场可编程门阵列(Field Programmable Gate Array，简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述的用户意图识别方法。

在另一示例性实施例中，还提供了一种包括程序指令的计算机可读存储介质，该程序指令被处理器执行时实现上述的用户意图识别方法的步骤。例如，该计算机可读存储介质可以为上述包括程序指令的存储器702，上述程序指令可由电子设备700的处理器701执行以完成上述的用户意图识别方法。

图8是根据一示例性实施例示出的一种电子设备的框图。例如，电子设备800可以被提供为一服务器。参照图8，电子设备800包括处理器822，其数量可以为一个或多个，以及存储器832，用于存储可由处理器822执行的计算机程序。存储器832中存储的计算机程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理器822可以被配置为执行该计算机程序，以执行上述的用户意图识别方法。

另外，电子设备800还可以包括电源组件826和通信组件850，该电源组件826可以被配置为执行电子设备800的电源管理，该通信组件850可以被配置为实现电子设备800的通信，例如，有线或无线通信。此外，该电子设备800还可以包括输入/输出(I/O)接口858。电子设备800可以操作基于存储在存储器832的操作系统，例如Windows Server^TM，Mac OSX^TM，Unix^TM，Linux^TM等等。

在另一示例性实施例中，还提供了一种包括程序指令的计算机可读存储介质，该程序指令被处理器执行时实现上述的用户意图识别方法的步骤。例如，该计算机可读存储介质可以为上述包括程序指令的存储器832，上述程序指令可由电子设备800的处理器822执行以完成上述的用户意图识别方法。

在另一示例性实施例中，还提供一种计算机程序产品，该计算机程序产品包含能够由可编程的装置执行的计算机程序，该计算机程序具有当由该可编程的装置执行时用于执行上述的用户意图识别方法的代码部分。

以上结合附图详细描述了本公开的优选实施方式，但是，本公开并不限于上述实施方式中的具体细节，在本公开的技术构思范围内，可以对本公开的技术方案进行多种简单变型，这些简单变型均属于本公开的保护范围。

另外需要说明的是，在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合。为了避免不必要的重复，本公开对各种可能的组合方式不再另行说明。

此外，本公开的各种不同的实施方式之间也可以进行任意组合，只要其不违背本公开的思想，其同样应当视为本公开所公开的内容。

Claims

1.一种用户意图识别方法，其特征在于，包括：

获取待识别的目标文本；

2.根据权利要求1所述的方法，其特征在于，所述目标意图识别层通过以下方式确定：

将所述相似度最高的意图识别层确定为目标意图识别层。

3.根据权利要求2所述的方法，其特征在于，所述多个意图识别层包括至少一个场景意图识别层，并且各场景意图识别层对应不同场景；所述目标意图识别层还通过以下方式确定：

4.根据权利要求2或3所述的方法，其特征在于，所述意图识别模型还包括特征提取层，所述将所述测试文本输入至所述意图识别模型，以得到所述多个意图识别层输出的多个意图识别结果，包括：

5.根据权利要求1所述的方法，其特征在于，所述意图识别模型还包括特征提取层，所述多个意图识别层包括通用意图识别层和至少一个场景意图识别层；所述意图识别模型通过以下方式获得：

6.根据权利要求1所述的方法，其特征在于，所述根据所述第一意图识别结果，确定所述目标文本应的目标用户意图，包括：

7.根据权利要求6所述的方法，其特征在于，所述方法还包括：

8.一种用户意图识别装置，其特征在于，包括：

第一获取模块，用于获取待识别的目标文本；

输入模块，用于将所述目标文本输入至意图识别模型，以得到目标意图识别层输出的第一意图识别结果，其中，所述目标意图识别层是从所述意图识别模型中的多个意图识别层中确定的与所述目标文本所属的目标场景相匹配的意图识别层；

第一确定模块，用于根据所述第一意图识别结果，确定所述目标文本应的目标用户意图。

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1-7中任一项所述方法的步骤。

10.一种电子设备，其特征在于，包括：

存储器，其上存储有计算机程序；

处理器，用于执行所述存储器中的所述计算机程序，以实现权利要求1-7中任一项所述方法的步骤。