CN109697282B

CN109697282B - 一种语句的用户意图识别方法和装置

Info

Publication number: CN109697282B
Application number: CN201710987004.7A
Authority: CN
Inventors: 胡于响
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2017-10-20
Filing date: 2017-10-20
Publication date: 2023-06-06
Anticipated expiration: 2037-10-20
Also published as: US20200250378A1; JP2020537777A; US11551007B2; TW201935273A; CN109697282A; WO2019076286A1

Abstract

本申请实施例公开了一种语句的用户意图识别方法，该方法包括当需要确定待分析语句的用户意图时，可以从该待分析语句所在人机交互会话中确定出该待分析语句的至少一条历史语句，由于人机交互一般具有一定的连续性，故人机交互会话中历史语句的内容可能与待分析语句的内容相关，结合待分析语句的句向量和至少一条历史语句的句向量确定出的历史向量中可以包括历史语句中相关内容，这些内容可以与待分析语句的内容有一定关联，若结合该历史向量确定待分析语句的用户意图，该历史向量包括的与该待分析语句相关的内容可以作为额外的确定依据，进而可以提高确定待分析语句用户意图的准确性。本申请实施例还公开了一种语句的用户意图识别装置。

Description

一种语句的用户意图识别方法和装置

技术领域

本申请涉及数据处理领域，特别是涉及一种语句的用户意图识别方法和装置。

背景技术

随着人工智能技术的发展，机器通过对人类语言的分析，可以识别语句的含义，实现与用户的语言交互。

问答场景属于一种典型的交互场景，机器可以对用户的提问进行针对性的答复。在答复前，机器需要能够识别出提问的用户意图，以及该提问的具体含义才能够准确的给出该问题的答案。

传统方式中，针对用户的提问，机器主要将该提问中包括的文字作为识别该提问用户意图的依据，但是有些情况下识别出的用户意图并不准确，导致给出的答案可能并不符合用户意图，降低了用户体验。

发明内容

为了解决上述技术问题，本申请提供了一种语句的用户意图识别方法，解决了传统的识别方法中准确率较低的问题，提高了用户体验。

本申请实施例公开了如下技术方案：

第一方面，本申请实施例公开了一种语句的用户意图识别方法，应用于人机交互会话中，人机交互会话中包括多条语句，该方法包括：

从多条语句中获取待分析语句，以及待分析语句对应的至少一条历史语句，至少一条历史语句为在人机交互会话中先于待分析语句出现的语句；

根据待分析语句的句向量和至少一条历史语句的句向量确定出待分析语句的历史向量，历史向量中包括至少一条历史语句中与待分析语句相关的信息；

根据历史向量确定待分析语句的用户意图。

可选的，待分析语句包括多条，多条待分析语句为多条语句中在交互顺序下的最后多条语句。

可选的，至少一条历史语句与待分析语句间的语句间隔少于预设阈值。

可选的，当至少一条历史语句包括多条时，多条历史语句包括第一历史语句和第二历史语句，根据待分析语句的句向量和至少一条历史语句的句向量确定出待分析语句的历史向量，包括：

根据待分析语句的句向量、第一历史语句的句向量和第二历史语句的句向量确定出第一历史语句相对于待分析语句的语义相似度，以及第二历史语句相对于待分析语句的语义相似度；

确定出第一历史语句和第二历史语句在人机交互会话中与待分析语句的出现位置关系；

根据第一历史语句的语义相似度、第二历史语句的语义相似度、第一历史语句的出现位置关系和第二历史语句的出现位置关系确定出待分析语句的历史向量。

可选的，根据历史向量确定待分析语句的用户意图，包括：

根据历史向量和待分析语句的句向量确定出待分析语句的融合向量；

根据融合向量确定出待分析语句的用户意图。

可选的，根据历史向量和待分析语句的句向量确定出待分析语句的融合向量包括：

对历史向量和待分析语句的句向量进行加权求和，得到待分析语句的融合向量。

可选的，根据融合向量确定出待分析语句的用户意图，包括：

将融合向量映射到预设的多个用户意图上；

根据在多个用户意图上的映射结果，从多个用户意图中确定出待分析语句的用户意图。

可选的，待分析语句包括至少一个分词，在根据待分析语句的句向量和多条历史语句的句向量确定出待分析语句的历史向量之后，该方法还包括：

确定第一分词的词向量，第一分词为至少一个分词中的一个；

根据历史向量和第一分词的词向量确定出第一分词的融合词向量；

根据第一分词的融合词向量确定出第一分词的实体类型。

可选的，当待分析语句包括多个分词时，根据第一分词的融合词向量确定出第一分词的实体类型，包括：

根据第一分词的融合词向量、第二分词的融合词向量和预先学习的实体类型依赖关系确定出第一分词的实体类型，第二分词为多个分词中的一个。

第二方面，本申请实施例公开了一种语句的用户意图识别装置，应用于人机交互会话中，人机交互会话中包括多条语句，该装置包括获取单元、第一确定单元和第二确定单元，其中：

获取单元，用于从多条语句中获取待分析语句，以及待分析语句对应的至少一条历史语句，至少一条历史语句为在人机交互会话中先于待分析语句出现的语句；

第一确定单元，用于根据待分析语句的句向量和至少一条历史语句的句向量确定出待分析语句的历史向量，历史向量中包括至少一条历史语句中与待分析语句相关的信息；

第二确定单元，用于根据历史向量确定待分析语句的用户意图。

可选的，第一确定单元包括语义相似度确定子单元、位置关系确定子单元和历史向量确定子单元，其中：

语义相似度确定子单元，用于当至少一条历史语句包括多条时，多条历史语句包括第一历史语句和第二历史语句，根据待分析语句的句向量、第一历史语句的句向量和第二历史语句的句向量确定出第一历史语句相对于待分析语句的语义相似度，以及第二历史语句相对于待分析语句的语义相似度；

位置关系确定子单元，用于确定出第一历史语句和第二历史语句在人机交互会话中与待分析语句的出现位置关系；

历史向量确定子单元，用于根据第一历史语句的语义相似度、第二历史语句的语义相似度、第一历史语句的出现位置关系和第二历史语句的出现位置关系确定出待分析语句的历史向量。

可选的，第二确定单元包括融合向量确定子单元和用户意图确定子单元，其中：

融合向量确定子单元，用于根据历史向量和待分析语句的句向量确定出待分析语句的融合向量；

用户意图确定子单元，用于根据融合向量确定出待分析语句的用户意图。

可选的，融合向量确定子单元具体用于：

可选的，用户意图确定子单元包括映射子单元和确定子单元，其中：

映射子单元，用于将融合向量映射到预设的多个用户意图上；

确定子单元，用于根据在多个用户意图上的映射结果，从多个用户意图中确定出待分析语句的用户意图。

可选的，该装置还包括第三确定单元、第四确定单元和第五确定单元，其中：

第三确定单元，用于确定第一分词的词向量，第一分词为至少一个分词中的一个；

第四确定单元，用于根据历史向量和第一分词的词向量确定出第一分词的融合词向量；

第五确定单元，用于根据第一分词的融合词向量确定出第一分词的实体类型。

可选的，第五确定单元具体用于：当待分析语句包括多个分词时，根据第一分词的融合词向量、第二分词的词向量和预先学习的实体类型依赖关系确定出第一分词的实体类型，第二分词为多个分词中的一个。

第三方面，本申请实施例公开了一种用于识别语句的用户意图的设备，应用于人机交互会话中，人机交互会话中包括多条语句，设备包括处理器和存储器，其中：

存储器，用于存储程序代码，并将程序代码传输给处理器；

处理器，用于根据程序代码中的指令执行以下方法：

根据历史向量确定待分析语句的用户意图。

可选的，处理器用于根据程序代码中的指令执行以下方法：

根据融合向量确定出待分析语句的用户意图。

可选的，处理器用于根据程序代码中的指令执行以下方法：

将融合向量映射到预设的多个用户意图上；

可选的，处理器还用于根据程序代码中的指令执行以下方法：

根据第一分词的融合词向量确定出第一分词的实体类型。

第四方面，本申请实施例公开了一种存储介质，该存储介质用于存储程序代码，程序代码用于执行本申请实施例第一方面提供的语句的用户意图方法。

第五方面，本申请实施例公开了一种包括指令的计算机程序产品，当其在计算机上运行时，使得计算机执行本申请实施例第一方面提供的语句的用户意图识别方法。

由上述技术方案可以看出，当需要确定待分析语句的用户意图时，可以从该待分析语句所在人机交互会话中确定出该待分析语句的至少一条历史语句，并由于人机交互一般具有一定的连续性，故人机交互会话中历史语句的内容可能与待分析语句的内容相关，那么结合待分析语句的句向量和至少一条历史语句的句向量确定出的历史向量中可以包括历史语句中相关内容，这些内容可以与待分析语句的内容有一定关联，若结合该历史向量确定待分析语句的用户意图，该历史向量包括的与该待分析语句相关的内容可以作为额外的确定依据，较多的确定依据可以提高确定待分析语句用户意图的准确性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种语句的用户意图识别方法的流程图；

图2为本申请实施例提供的一种根据融合向量确定用户意图的示意图；

图3为本申请实施例提供的一种语句的用户意图识别方法的方法流程图；

图4为本申请实施例提供的一种待分析语句的分词类型标注方法的流程图；

图5为本申请实施例提供的一种实现语句的用户意图识别的程序模块图；

图6为本申请实施例提供的一种实现语句的用户识别以及实体标注的程序模块图；

图7为本申请实施例提供的一种历史记忆组件的结构示意图；

图8为本申请实施例提供的一种当前语句处理组件的结构示意图；

图9为本申请实施例提供的一种实体标注组件的结构示意图；

图10为本申请实施例提供的一种语句的用户意图识别装置的结构图；

图11为本申请实施例提供的一种用于识别语句的用户意图的设备的结构图。

具体实施方式

下面结合附图，对本申请的实施例进行描述。

当前，人工智能技术正在如火如荼地发展，已经越来越多地应用到日常生活。例如，用户通过与苹果手机的siri、微软的聊天机器人小冰等进行会话，可以实现天气查询、位置导航、音乐播放、问题咨询等。除了应用到日常生活，将人工智能技术应用到工作中，也是一大发展趋势。使用机器人代替传统人力，例如，物流领域使用机器人实现包裹分拣，可以有效减少人力成本，而且方便企业管理。人工智能将会像工业时代的蒸汽机、信息时代的计算机一样，给社会带来深刻的变革，给人类生活带来崭新的变化。

人工智能的一个核心，即是人机交互技术。人区别于机器的最重要的一点就是人可以独立的思考，而机器是机械的，那么人工智能的目的即在于让机器可以像人一样思考。基于机器可以思考的前提，机器可以理解人的意图，并对人的意图作出响应，即实现了人和机器的交互，简称人机交互。因此，人机交互的发展依赖于对用户意图识别的准确性的提高。

传统的用户意图识别是通过对用户当前的语句结合固定的句式，进行分析实现的。由于人类语言的灵活和多变，采用这种方法得到的用户意图，往往与用户的实际意图不符，例如，如下场景(其中，Q表示用户提问，A表示机器回答)：

Q1、请问明天乌鲁木齐的天气如何？

A1、xxx

Q2、那后天呢？

A2、xxx

Q3、那上海呢？

A3、xxx

在该轮对话中，机器需要识别每一个Q的意图，也就是用户希望通过Q中的内容表达什么，目的是什么。显然第二个及第三个Q的意图，根据传统的方法，是难以获得准确的结果的，需要结合历史信息才能准确判断意图。以Q3为例说明，传统方式中，若要获取待分析语句“那上海呢”的意图，一般可以根据该待分析语句的内容进行分析然而根据该待分析语句并不足以准确确定出该待分析语句的意图是什么，有可能得到的意图是上海的天气如何，也可以是上海有哪些景点，显然与该待分析语句的实际意图“上海后天的天气如何”有或多或少的区别。如果机器根据采用传统方式确定的意图进行回复，回复的内容显然与用户想要了解的内容不符，造成了不好的用户体验。

因此，本申请实施例提供了一种语句的用户意图识别方法和装置，当需要确定待分析语句的用户意图时，可以从该待分析语句所在人机交互会话中确定出该待分析语句的至少一条历史语句，并由于人机交互一般具有一定的连续性，故人机交互会话中历史语句的内容可能与待分析语句的内容相关，那么结合待分析语句的句向量和至少一条历史语句的句向量确定出的历史向量中可以包括历史语句中相关内容，这些内容可以与待分析语句的内容有一定关联，若结合该历史向量确定待分析语句的用户意图，该历史向量包括的与该待分析语句相关的内容可以作为额外的确定依据，较多的确定依据可以提高确定待分析语句用户意图的准确性。

本申请实施例主要应用于循环神经网络(Recurrent Neural Networks，RNN)中，通过RNN可以确定出语句的句向量。其中，本申请实施例中提到的语句可以包括一个或多个字符，根据不同的语言形式或语种，可以有多种不同的字符形式及字符组合方式。而一条语句的句向量为通过向量化的形式得到的携带了这条语句中所有词的信息的向量。举例说明，假设输入一条分好词的语句，该语句有n个分词，在经过RNN后，有n个输出向量r₁……r_n-1、r_n分别对应所述的n个分词，所述输出向量可以作为该分词的词向量。由于RNN的记忆性，第i个分词的输出向量r_i包含了该分词之前所有分词即r₁、……r_i-1的信息，那么，最后一个分词的输出向量应当包含了该语句中所有分词的信息，因而，最后一个分词的输出向量r_n可以作为该句子的句向量。

在确定一条语句也就是待分析语句的用户意图时，本申请实施例采用了结合至少一条历史语句的句向量的方式确定待分析语句的用户意图，这里的历史语句是相对于待分析用户意图的待分析语句确定出的。其中，待分析语句是机器需要确定出用户意图的语句，一般情况下，待分析语句为人机交互会话中由用户最新输入的语句，是需要机器回复、响应的语句，在机器回复较慢的情况下，待分析语句也可以是用户输入语句中未被机器回复的一条语句。待分析语句可以为一条，也可以为多条。当待分析语句为多条时，多条待分析语句可以为多条语句中在交互顺序下的最后多条语句。需要注意的是，在本申请实施例中出现的机器并不限定为传统意义上的一台机器，还可以是能够实现交互功能的软件，或者部署了该软件的终端、服务器等。

待分析语句和该待分析语句对应的历史语句均出现在同一个人机交互会话中，在这个人机交互会话中，人机交互是一个持续的过程，而历史语句属于先于待分析语句出现在该人机交互会话中的语句，且历史语句和待分析语句均属于用户输入的语句。例如上述的Q1→A1、Q2→A2、Q3→A3的例子中，若机器需要分析Q2的用户意图，那么Q1可以作为Q2的历史语句，若机器需要分析Q3的用户意图，那么Q1和Q2可以作为Q3的历史语句。

实施例一

接下来结合附图详细说明本申请实施例提供的语句的用户意图识别方法。图1为本申请实施例提供的一种语句的用户意图识别方法的方法流程图，所述方法包括：

S101：从所述多条语句中获取待分析语句，以及所述待分析语句对应的至少一条历史语句，所述至少一条历史语句为在所述人机交互会话中先于所述待分析语句出现的语句。

以上多条语句处于同一个人机交互会话中，均是由用户输入的。本申请实施例并不限定输入的方式，例如可以是用户通过键盘等输入设备手动录入的，也可以是用户通过语音输入后由机器识别出的，如语音助手siri中，需首先对语音的含义进行解析，将语音转换为文字，进而识别用户意图。鉴于语音解析并非本申请所要解决的技术问题，本申请实施例均以文字形式的语句为例，来说明本申请中用户意图识别的技术方案。

在上述查询天气的应用场景中，假如使用传统方式确定待分析语句，一般可以结合待分析语句本身的语法结构或者语义等确定该待分析语句的用户意图。，若待分析语句为Q3“那上海呢”，机器可以根据Q3本身的语法结构和语义分析Q3的用户意图，显然Q3中包含的内容难以让机器准确的确定出Q3的用户意图。因此，在本申请实施例中，可以结合待分析语句及其对应的历史语句确定待分析语句的用户意图。通过结合至少一条历史语句确定待分析语句的用户意图，可以减少多轮对话中，由于用户输入信息的不完整和省略，导致待分析语句的用户意图识别不准确的情况出现。

但是，在不同的应用场景中，往往对于历史语句条数的需求有所不同。例如，在购物网站如淘宝或京东商城中，往往会设置有客服机器人，以便于在人工客服繁忙的时候，替代人工客服回答一些询问频率较高的问题，如“如何退货？”、“是否包邮”等，由于这种类型的问题往往独立性比较高，一般2～3轮以内会话可以结束当前讨论的话题，因而在这种应用场景中，可以设置待分析语句前2条用户输入的语句为该待分析语句对应的历史语句。当然，在其他的应用场景中，如果人机交互会话中用户输入的语句较多，若需要确定待分析语句的历史语句，可以指定向前回溯语句的数量，比如5句，则该待分析语句之前的5句用户输入的语句可以作为该待分析语句的历史语句，而更前的语句可以忽略。指定回溯语句的数量可以缩减历史语句的数量，有效降低后续历史语句关联计算的复杂程度，提升计算效率，从而更快、更准确地识别户用户意图，并对用户意图做出快速且准确的响应，带来更好的用户体验。

历史语句的数量可以根据具体的应用场景自行定义，当然历史语句数量的设定也对识别的结果产生一定影响，因此在不同的应用场景中，历史语句的数量可以是固定的，也可以是变化的，例如随着语境的变化而变化。历史语句的数量可以是预先设定的，也可以通过不断地进行训练，得到优化的历史语句数量，使得在该应用场景中，识别准确度进一步提高。

可以理解，不同位置的历史语句也会对待分析语句的用户意图识别产生一定的影响。在语义相同或相近的情况下，距离较近的历史语句对分析语句的用户意图识别影响较大，距离较远的历史语句对分析语句的用户意图识别影响较小。当历史语句的位置远到一定程度，该历史语句对待分析语句的用户意图识别的影响可以忽略不计。该位置的历史语句与待分析语句间的语句间隔可以设置为预设阈值。在本申请实施例一种可能的实现方式中，为了提高用户意图识别准确率，可以设置至少一条历史语句与待分析语句间的语句间隔少于预设阈值。其中，预设阈值可以根据经验进行设定。S102：根据所述待分析语句的句向量和所述至少一条历史语句的句向量确定出所述待分析语句的历史向量。

所述历史向量是根据待分析语句的句向量和至少一条历史语句的句向量计算得到的一个向量，可以视为对应于待分析语句和历史语句的句向量，历史向量包含的信息不仅可以体现出至少一条历史语句与待分析语句相关的信息，也还可以一定程度上体现出待分析语句的信息。

本申请对于历史向量的计算过程并未做限定，历史向量的计算可以是将待分析语句的句向量和历史语句的句向量相加，也可以是其他计算方式。例如待分析语句的句向量是m_n，历史语句的句向量分别是m₁-m_n-1，则历史向量可以是二者相加，结果为m₁+…m_n-1+m_n。

S103：根据所述历史向量确定所述待分析语句的用户意图。

由于历史向量中携带的信息可以体现待分析语句的信息，也可以体现出至少一条历史语句与该待分析语句相关的信息，故若机器通过该历史向量确定该待分析语句的用户意图，可以有更多的且有效的可参考信息，使得对待分析语句的用户意图识别更为准确。在多轮对话中，基于用户意图更准确的基础，机器可对用户输入的待分析语句做出更精准的响应，给用户带来更好的体验。

在本申请实施例中，如何根据所述历史向量确定所述分析语句的用户意图不做限定。一般情况下，用户意图的种类是有限的，也是可以预先总结得到的。那么在根据历史向量确定待分析语句的用户意图时，可以通过一定规则将历史向量映射到预先获取的多种用户意图上，若某一种用户意图在映射中得分或分类最高，那么可以将这种用户意图作为该待分析语句的用户意图。

针对S103，由于历史向量中并不能完全体现出待分析语句的信息，故为了能够更准确的确定出待分析语句的用户意图，本申请实施例还提供了一种可选的实施方式。在本实施方式中，可以先根据历史向量和待分析语句的句向量确定出待分析语句的融合向量，再根据该融合向量确定待分析语句的用户意图。例如历史向量为h，当前待分析语句的句向量为u，可对历史向量h和待分析语句的句向量u进行融合，得到融合向量o，融合的方式可以是简单地将两个向量相加，或者根据对意图识别的影响分别赋予一个权重进行加权求和，也可以是其他的融合方式。在本申请实施例中，为了便于理解，以将两个向量相加的方式进行说明，即o＝h+u。得到融合向量后，可以通过一定规则将融合向量映射到预先获取的多种用户意图上，若某一种用户意图在映射中得分或分类最高，那么可以将这种用户意图作为该待分析语句的用户意图。

下面结合图2，对通过融合向量映射得到用户意图进行介绍。

在图2中融合向量有两个，分别为o₁和o₂。其中针对待分析语句1计算出的融合向量为o₁，针对待分析语句2计算出的融合向量为o₂，预先获取的可能的用户意图有n种，分别以x₁、x₂……x_n表示，机器将o₁和o₂分别映射到这n种用户意图上，得到各种用户意图的分数，o₁和o₂对应各种用户意图的分数分别为b₁₁、b₁₂……b_1n和b₂₁、b₂₂……b_2n，其中分数值最高的意图即为待分析语句的用户意图。需要说明的是，融合向量向预先获取的不同用户意图映射可以有不同的权值，该权值可以通过对机器进行训练得到。

意图获取模块中有多个意图类别，分别用x₁、x₂……x_n进行表示。映射模块将o₁和o₂分别映射到x₁、x₂……x_n上，并得到x₁、x₂……x_n的分数，意图获取模块选取其中分数最大的即为当前语句的意图，例如针对o₁的映射，x2的分数最大时，x2即为待分析语句1的用户意图。

上述实施例通过对待分析语句和至少一条历史语句的句向量进行计算，确定待分析语句的历史向量，根据待分析语句的历史向量确定用户意图。相较于现有技术，该方法充分考虑了历史语句携带的与待分析语句相关的信息，使得用户意图的识别更为准确。

需要说明的是，在S102中，需要根据所述待分析语句的句向量和至少一条历史语句的句向量确定所述待分析语句的历史向量。在计算时，需要考虑到不同历史语句与待分析语句的相关程度。其中，不仅需要考虑到历史语句与待分析语句间的语义相似度，也需要考虑到历史语句在人机交互会话中与待分析语句间的距离。

一般来说，在人机交互过程中，交互的内容可以包括针对一个话题的持续过程，由于在讨论同一个话题，用户输入的语句都可以与该话题相关，且先后输入的语句之间也可以具有一定的相关性，故讨论同一个话题的语句之间的语义相似度一般会较高。而且，由于正常交互一般具有连贯性，但连贯性并不会持续很长，故一般与待分析语句较近的历史语句和该待分析语句更为相关，更有可能是在讨论同一件事情或同一个话题，而与待分析语句较远的历史语句有可能与该待分析语句的相关性很低，很可能该历史语句是在讨论不同的事情或不同的话题。

所以在人机交互会话中离待分析语句更近的历史语句在意图识别上会有更大的影响。当然，也不能完全只考虑历史语句与待分析语句的位置关系，需要在确定待分析语句的用户意图时综合历史语句与待分析语句间的语义相似度一起考量，可以获得更准确的意图识别。由此可以避免在确定待分析语句时，将与该待分析语句相距较远、但语义相似性很高的历史语句作为确定该待分析语句用户意图的主要参考，因为毕竟这种距离待分析语句较远的历史语句有可能与该待分析语句在讨论不同的事情或不同的话题，如果将该历史语句作为确定该待分析语句用户意图的主要参考的话，确定出的用户意图有可能与该待分析语句的实际用户意图不符。下面结合具体场景，举例说明：

Q1:请问明天乌鲁木齐天气如何？

A1：xxx。

Q2:那后天呢？

A2：xxx。

Q3:杭州有哪些景点？

A3：xxx。

Q4:那上海呢？

A4：xxx。

假设待分析语句为Q4“那上海呢”，Q1-Q3为Q4的历史语句。由于这三个历史语句中可以确定出2个用户意图，一个是查询景点，一个是查询天气，可能都与Q4有关联，如果不考虑位置关系，即查询景点的历史文句出现的与待分析语句更近，很有可能错误地将查询天气识别为Q4的意图。

考虑到历史语句的位置关系对用户意图识别的影响，针对S102，本申请实施例提供了一种根据待分析语句的句向量和历史语句的句向量确定待分析语句的历史向量的方式。

下面结合图3，对本申请实施例根据待分析语句的句向量和历史语句的句向量确定历史向量的方法进行介绍。历史语句的数量可以为一条，也可以为多条，根据待分析语句的句向量和一条历史语句的句向量确定历史向量的方式与根据待分析语句的句向量和多条历史语句的句向量确定历史向量的方式类似。下面主要对根据待分析语句的句向量和多条历史语句的句向量确定历史向量的方式进行介绍，历史语句的数量为一条时，可以参照历史语句数量为多条时的方法，这里不再赘述。

所述多条历史语句包括第一历史语句和第二历史语句，在该实施例中以第一历史语句和第二历史语句举例说明，但不限于第一历史语句和第二历史语句，该方法包括：

S301：根据所述待分析语句的句向量、所述第一历史语句的句向量和所述第二历史语句的句向量确定出所述第一历史语句相对于所述待分析语句的语义相似度，以及所述第二历史语句相对于所述待分析语句的相似度。

所述语义相似度是一个从语义角度表征两条语句间关联程度的概念。例如，第一历史语句相对于所述待分析语句的语义相似度的高低，即表示从语义角度上，第一历史语句与待分析语句的关联程度上的高低，该语义相似度可以通过所述第一历史语句的句向量和所述待分析语句的句向量确定。

本申请实施例对所述第一历史语句、第二历史语句相对于所述待分析语句的语义相似度的确定方式并未限定，一个可行的实施方式是找出多条历史语句关于待分析语句的关联程度的分布。

例如，所述待分析语句的句向量为u，历史语句的句向量为m_i，具体到本申请实施例，第一历史语句、第二历史语句的句向量可以分别为m₁、m₂，历史语句相对于待分析语句的语义相似度为p_i，可得到一个历史语句相对于待分析语句语义相似度的分布，即pi＝softmax(m_iu^T)，m_iu^T表示历史语句的句向量与当前待分析语句的句向量的内积。其中，T在这里表示转置的意思，u^T表示句向量转置后的向量，即将原来的行向量形式转化为列向量的形式。softmax函数的作用是归一化，使得

其中归一化的作用是为了更直观地显示语义相似度的结果，在本申请其他实施例中，也可以不进行归一化，即，语义相似度的另一个分布为p_i＝m_iu^T，是否进行归一化，并不影响本申请实施例的实现。

计算语义相似度的一个优选实施方案是选择python的numpy包或者Java的Jama包进行m_iu^T的矩阵计算，其中，python和Java均是一种程序语言，numpy包和Jama包为对应的程序语言下的进行向量或矩阵运算的类的集合。然后可以调用softmax函数进行归一化处理，p_i值越大，表示历史语句i与待分析语句的关联程度越高，历史语句i与待分析语句在语义上越相似，反之，p_i值越小，表示历史语句i与待分析语句的关联程度越低，历史语句i与待分析语句越不相似。

通过历史语句的句向量与待分析语句的句向量的内积计算语义相似度，一方面充分考虑了历史信息，对各个历史语句的句向量可以同步计算，另一方面内积的矩阵计算可以直接调用函数实现，实现过程比较简单，提升了计算效率，可以快速得到语义相似的结果。

S302：根据所述第一历史语句的相似度、第二历史语句的相似度、第一历史语句出现的位置关系和第二历史语句出现的位置关系确定出所述待分析语句的历史向量。

所述位置关系可以用来表征历史语句与待分析语句在人机交互会话中的距离远近，从位置关系角度考虑，与待分析语句越近的历史语句，对用户意图识别的影响越大。结合位置关系计算历史向量，可以使用户意图识别的结果更为准确，如果忽略历史语句的位置关系，当历史语句中有两个以上语义相似度相当的历史语句时，可能会导致用户意图识别的准确性降低。

位置关系可以通过多种方式来体现，可以是当前的历史语句与待分析语句的行数的差值，也可以是其他的表现形式，位置关系的体现方式并不影响本申请实施例的实现。

一种可行的体现位置关系的实施方式是，以pos_i表示第i个历史语句在人机交互会话中相对于待分析语句的位置，q_i表示位置关系，q_i＝softmax(pos_i)。当然，也可以不进行归一化，归一化进行与否并不影响本申请实施例的实现。举例说明，在查询乌鲁木齐天气的场景中，“请问/明天/乌鲁/木齐/天气/如何”为第一个历史问句，pos₁＝0，依此类推，第二个、第三个历史语句中，pos₂＝1，pos₃＝2，依据q_i＝softmax(pos_i)进行计算，可得到q₁＝0.09，q₂＝0.24，q₃＝0.67。从这个例子可以看出，历史语句距离待分析语句越近，位置关系的权重越高。本申请实施例中并不限定如何设置pos_i的数值，只要能够体现历史语句与待分析语句间的位置关系即可。

根据所述第一历史语句的相似度、第二历史语句的相似度、第一历史语句出现的位置关系和第二历史语句出现的位置关系确定出所述待分析语句的历史向量。本申请对所述确定历史向量过程不做限定，可以是所述语句的语义相似度与所述的位置关系相加，也可以是所述语句的语义相似度与所述的位置关系相乘，或者是其他的计算方式。

一种可行的计算历史向量的实施方式是，对历史语句相对于待分析语句的相似度和该历史语句对应位置关系取平均值，作为所述历史语句句向量的系数。为了方便表述及后续引用，该系数用ɑ_i表示，历史语句m_i对于待分析语句u的语义相似度为p_i，位置关系为q_i，则历史语句的句向量m_i的系数ɑ_i＝(p_i+q_i)/2，然后将对该历史向量m_i及其系数ɑ_i的乘积进行求和，得到历史向量，以h表示所述历史向量，可得到历史向量计算公式如下：

历史语句的句向量的系数需结合语义相似度和位置关系进行计算，仅仅考虑语义相似度或仅仅考虑位置关系，都会导致用户意图识别不准确的情况出现。忽略位置关系，当所述会话中有至少2个语义相似度相当的历史语句时，如果将距离待分析语句较远的历史语句作为主要参考依据的话，确定出的用户意图很可能与用户实际意图不符。忽略语义相似度，仅考虑位置关系，将距离待分析语句更近的历史语句作为主要参考依据，若该距离更近的历史语句与待分析语句在语义上相似度较低，很可能导致确定的用户意图与用户实际意图不符。因此，在计算历史向量时应充分考虑历史语句相对于待分析语句的语义相似度和位置关系，即应当根据历史语句相对于待分析语句的语义相似度和位置关系确定历史语句的句向量的系数。应当明确的是，历史向量h实际是对各个历史语句的句向量所包含的有用信息的浓缩，权重越大，即ɑ_i越大的历史语句的句向量对整个历史向量的影响越大，而历史向量直接影响着用户意图识别的结果，因此系数ɑ_i的精确计算显得尤为重要。

在本申请其他实施方式中，也可以不采用均值计算，可以对语义相似度和位置关系分别赋予一个权重并进行求和，也可以是相乘，或者是其他的计算方式，历史语句的句向量的系数的计算方式并不影响本申请实施例的实现。取平均值是为了便于计算，具体到实际的应用场景中，可以根据场景的特点，建立相适应的数学模型，并定义不同的参数。该参数也可以是预先设定的，也可以是经过反复的训练和优化得到。通过训练和优化得到的参数，可以使历史向量计算的更为准确，进而提高用户意图识别的准确度，从而给用户带来更好的体验。

上述实施例通过结合历史语句相对于待分析语句的语义相似度和位置关系计算历史向量，并根据所述历史向量确定所述用户意图，降低了仅考虑语义相似度或位置关系导致得到的用户意图与用户实际意图不符的风险，使得用户意图识别更为准确，机器可以根据更准确的意图，作出精准的响应，给用户带来更好的体验。

实施例二

在本实施例中，将主要针对如何对语句中的分词进行实体标注进行说明。本实施例中的方案可以基于实施例一的基础上实施，也可以在确定出待分析语句的历史向量之后实施。

在本申请实施例中，为了作出准确的应答，除了要识别用户的意图，还要对用户提问中的实体进行识别并标注，具体到上述查询天气的应用场景，实体标注如下表：

请问

明天

乌鲁

木齐

的

天气

如何

O

B-Day

I-Place

O

表一

表中第一行为对语句进行分词，第二行为标注，BIO体系中，B标识实体开始，I标识实体中部，O无意义。对上述实体进行标注后，可做出类似如下的回应：

Q1、请问明天乌鲁木齐的天气如何？

A1、明天乌鲁木齐多云转晴，气温12到20度。

Q2、那后天呢？

A2、后天乌鲁木齐阴天，气温12到18度。

Q3、那上海呢？

A3、后天上海小雨，气温15度到17度。

显然上述实体标注，也需要结合历史语句的语义，否则无法准确回答Q2和Q3。

除了需要考虑历史语句语义，还要考虑其位置关系，不同位置的历史语句可能产生不同的结果。考虑如下场景：

Q、赵薇演过什么电影？

A、……

Q、那周杰伦呢？

Q、许嵩唱过什么歌？

A、……

Q、那周杰伦呢？

这两轮多轮对话中，均有“那周杰伦呢？”，如果不考虑历史信息，将完全不知道该怎么标注“周杰伦”这个词，但如果考虑了历史信息，同时结合历史信息的位置，模型则能很清楚的把第一个周杰伦标注为B-Actor，第二个标注为B-Singer。如果不考虑位置，则有可能将第二轮对话中的周杰伦错误地标注为B-Actor。

基于与用户意图识别相同的理由，未结合历史语句语义以及历史语句的位置信息，导致传统方式的实体标注准确率也相对较低。除此之外，由于意图识别和实体标注是分开进行，无法共享资源，也无法同步进行意图识别和实体标注，使得机器需要花费双倍的时间分别进行意图识别和实体标注，导致资源浪费、效率低下。

考虑到实体标注在多轮会话中响应用户意图的作用，本申请另外一个实施例提供了一种根据待分析语句的句向量和所述多条历史语句的句向量确定待分析语句的历史向量之后，确定待分析语句中分词的实体类型的方法。

下面结合图4，对本申请实施例确定待分析语句的分词的实体类型进行介绍，所述确定待分析语句的分词的实体类型，所述待分析语句包括至少一个分词，为方便后续引用以及对方案进行介绍，以第一分词的实体类型确定进行说明，第一分词为所述至少一个分词中的一个，与其他分词之间不存在顺序关系，其他分词的实体类型确定过程与第一分词相同，不再赘述。在通过S102确定出待分析语句的历史向量之后，该方法包括：

S401：确定第一分词的词向量。

因此，标注语句中包含分词的实体类型前，首先需要将语句分解得到至少一个分词。所述分词可以是有含义的实体，也可以是无含义的辅助词。而分词是一个相对抽象的概念，机器理解相对比较困难，故将分词转化为一个机器可以理解的概念是非常有必要的。所述机器可以理解的概念可以是词向量，一个分词的词向量是以向量的形式对该分词进行转换得到的，它包含了该分词的所有信息，或者，当该分词所在语句中，在该分词前还有其他分词，那么该分词的词向量除了包含该分词的所有信息外，还可以包含该其他分词的所有信息。

在本申请实施例中，词向量可以是分词通过RNN编码得到的，由于RNN的记忆性，语句的最后一个分词包含了前面所有分词的信息，最后一个分词的词向量可以作为该语句的句向量。具体而言，若当前待分析语句中有n个分词，n为大于等于1的正整数，经过RNN编码可得到词向量c₁、c₂……c_n。

在对分词进行RNN编码之前，可以先将分词进行编码，将分词映射到固定维度的空间，在该空间内，相近含义的分词距离较近，可以更好地表达语义。在本申请实施例中，采用的是Word2vec编码方式，也可以采用其他编码方式如one-hot编码，编码方式并不影响本申请实施例的实施。

S402：根据所述历史向量和所述第一分词的词向量确定出所述第一分词的融合词向量。

所述历史向量即S102和/或S202的向量中所述的历史向量，所述历史向量的获取方式与第一实施例和第二实施例相同，这里不再赘述；所述第一分词的词向量即S401中的词向量；所述融合词向量即对当前词向量所携带的信息与历史向量所携带的信息进行整合得到的一个新的向量，其中，对历史向量携带信息和当前词向量携带信息进行整合可以理解为聚合有效的可参考信息，剔除无关信息。

所述融合是一个将历史向量与当前词向量的信息进行整合的过程，融合的方式是多样的，本申请对此不做限定，可以是将向量相加进行融合，也可以通过向量的内积或者矩阵的方式进行融合，也可以是其他对信息进行整合的方式，融合的方式并不影响本申请实施例的实现。

确定融合向量的作用在于整合历史向量和当前词向量所携带的信息，以便于结合历史信息对当前分词，即第一分词进行分类，或者说确定实体类型，避免现有技术中只考虑本句，不结合上下文对分词进行标注产生的准确率较低的问题。另一方面，融合词向量是根据历史向量计算的，而历史向量在用户意图的识别过程中已经计算过，在确定实体类型时可以直接使用，实现了资源共享。此外，用户意图识别和实体类型标注的过程互不干扰，可以同步进行，提升了计算效率，缩短了响应用户的时间，使得用户体验效果更佳。

举例说明，当前待分析语句共有3个分词，所述分词的词向量分别为c₁、c₂、c₃，历史向量为h，所述3个分词对应的融合向量可以是c₁+h、c₂+h、c₃+h。融合词向量的过程可以与用户意图识别过程中融合向量的过程同步进行，从而提升计算效率。当然，例子中的融合词向量是为了方便讲述，进行简单的相加得到的一个融合词向量。具体到实际应用中，可根据不同应用场景，建立不同的融合模型，以便得到更为准确的融合词向量，进而更准确地确定分词实体类型。

S403：根据所述第一分词的融合词向量确定出所述第一分词的实体类型。

根据所述第一分词的融合词向量确定出所述第一分词的实体类型可以视为在多个实体类型中，结合融合词向量携带的信息，确定与所述第一分词关联程度最高的实体类型。所述关联程度可以是结合了词义和位置关系得到的关联程度。

通过所述融合词向量确定所述第一分词的实体类型的作用在于结合融合词向量中的历史信息，可以更准确地确定分词的实体类型，以克服现有技术中，未结合上下文导致的对实体类型错误地标注的缺点。

具体到本申请实施例，可以将融合词向量通过映射模块，映射到不同的实体类型模块上，并得到各个实体类型模块的分数，其中分数最高的模块的实体类型即为所述第一分词的实体类型。确定所述第一分词的实体类型的方式并不局限于映射，也可以采用其他方式确定实体类型，确定方式并不影响本申请实施例的实现。

举例说明，一个分词的融合词向量为o₁＝c₁+h，预先获取的可能的实体类型有n种，分别以x₁、x₂……x_n表示，例如可以包括B-day，B-place，B-singer等。机器将融合词向量o₁映射到这n种实体类型上，得到各种实体类型的分数，o₁对应各种实体类型的分数分别为b₁₁、b₁₂……b_1n，对各种实体类型的分数分别进行求和，其中分数值最高的实体类型即为该分词的实体类型。

S403中从多个实体类型中确定一个实体类型的工作量相对较大，在具有多个分词的语句中，这里以包括第一分词和第二分词的语句为例，若所述第一分词在第二分词之后，所述第二分词的类型为O,表示无含义的意思，那么根据“O后面肯定是O或者B，不可能是I”这样的依赖关系，排除了第一分词类型为I的状况，如果仍然按照步骤S303则浪费了不必要的时间，还有可能得出错误的结果，降低了效率。

为了克服具有多个分词的语句中因忽略了分词之间的实体类型的依赖关系导致实体类型识别准确率以及效率较低的问题，可以对S403做出如下改进：

根据所述第一分词的融合词向量、第二分词的融合词向量和预先学习的实体类型依赖关系确定出第一分词的实体类型。

根据融合词向量确定实体类型实质上是一个结合融合词向量从多个实体类型中选择与所述分词关联程度最高的实体类型的过程。那么，根据预先学习的实体类型依赖关系，则可以先降低选择的范围，减少了计算量，降低了模型的复杂程度，提升了效率，进而可以进一步缩短响应时间，带来更好的用户体验。3秒钟和10分钟的响应时间给用户带来的体验显然存在巨大的差异，因此增加实体类型依赖关系，对确定实体类型有很大的提升。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述程序包括与所述方法步骤相对应的功能模块，该程序在执行时，执行包括上述方法实施例的步骤。

所述程序可以包括如图5所示的词编码模块501、历史记忆组件502、当前语句处理组件503、关联计算组件504、意图识别组件505，为了进行实体标注，还可以增加实体标注组件。当然，在本申请其他的实施方式中也可采用其他的功能模块执行上述方法实施例的步骤，本申请对此不做限定。

所述词编码模块主要对语句的分词进行编码，以便于历史记忆组件和当前语句处理组件对编码后的分词进行RNN编码，分别得到历史语句的句向量和待分析语句的句向量。其中，历史记忆组件还可以指定向前回溯语句的数量，在待分析语句所在的会话中，用户输入语句较多时，指定回溯数量，例如指定回溯数量为5句，那么待分析语句之前的5句作为待分析语句的历史语句，5句以前的语句将被忽略，不进行RNN编码，历史语句数量的减少可有效降低历史向量计算的复杂程度，从而提升计算效率。关键计算组件，一方面，根据历史记忆组件中的历史语句的句向量和当前语句处理组件的待分析语句的句向量得到历史语句与待分析语句的语义相似度，另一方面对各历史语句的位置进行编码，得到位置权重，将所述语义相似度和所述位置权重进行融合得到历史向量。为了更直观的显示历史向量，还可以对历史向量进行归一化。所述关联计算组件实际上在执行步骤S102或步骤S201+S202。所述意图识别组件根据关联计算组件中的历史向量和当前语句处理中的待分析语句的句向量，从多个意图中识别出当前待分析语句的用户意图，即执行所述步骤S103。

为了实现实体标注功能，该程序还可以在上述基础上增加实体标注组件。如图6所示，实体标注组件606分别与关联计算组件504和当前语句处理组件503相连，关联计算组件504输出的历史向量以及当前语句处理组件503输出的词向量可以作为实体标注组件606的输入。

下面结合图7对历史记忆组件进行描述，历史记忆组件结构如下：

历史记忆组件主要分为3个模块，包括：历史语句输入模块、编码器模块、句向量输出模块。将待分析语句的历史语句输入到历史语句输入模块，编码器对历史问句进行RNN编码，句向量输出模块将编码器编码后得到的句向量输出。

下面以查询天气的应用场景为例，对历史记忆组块进行说明：

首先，输入历史语句：

s1：请问明天乌鲁木齐天气如何？

s2：那后天呢？

s3：杭州有哪些景点？

其次，编码器RNN Memory Encoder对输入的历史问句进行编码，得到各历史问句的输出向量m1，m2，m3；

最后，句向量输出模块输出历史语句的句向量m1，m2，m3。

下面结合图8对当前语句处理组件进行描述，当前语句处理组件结构如下：

当前语句处理组件主要分为3个模块，包括：当前语句输入模块、编码器模块、词向量输出模块。将已经分词的待分析语句输入到当前语句输入模块，编码器模块对当前语句，即待分析语句进行循环神经网络编码，得到各分词对应的词向量，其中最后一个词向量即为当前语句的句向量。

下面以查询天气中的语句“那上海呢”为例，对当前语句处理模块进行说明：

首先，输入已经分好词的当前语句：

那/上海/呢？

其次，编码器对输入模块中的分词进行循环神经网络编码，得到各分词对应的词向量，即c1，c2，c3；

最后，输出模块将当前语句中各分词对应的词向量进行输出，需要说明的是，c3也是该语句的句向量。

下面对意图识别组件进行描述：

意图识别组件主要分为3个模块，包括输入模块、映射模块、意图获取模块。输入模块中输入携带有当前语句历史信息的融合向量，融合向量经过投射模块后，映射到意图获取模块中的各个类别上，意图获取模块根据各个类别的分数进行判断，并确认用户意图。其中，映射模块为意图识别组件的核心模块，,下面结合图2对映射模块进行介绍。

举例说明，图2中有两个融合向量，分别为o₁和o₂。意图获取模块中有多个类别，分别用x1、x2……xn进行表示。映射模块将o₁、o₂分别映射到x1、x2……xn上，并得到x1、x2……xn的分数，意图获取模块选取其中分数最大的即为当前语句的意图，例如针对融合向量o1，x2的分数最大时，x2即为该待分析语句的用户意图。

所述实体标注组件实际上在执行步骤S302和S303，步骤S301是由当前语句处理组件执行的。所述实体标注组件根据当前语句处理组件中的词向量与关联计算组件中的历史向量，得到融合词向量，进而根据融合词向量确定分词的实体类型。

下面结合图9对实体标注组件进行描述，实体标注组件结构如下：

实体标注组件主要分为，包括当前语句输入模块、编码器模块、词向量输出模块、融合词向量模块、全连接模块、CRF模块、实体标注模块。当前语句输入模块输入的是已经分好词的当前语句，当前语句输入模块、编码器模块、词向量输出模块与当前语句处理组件可共用，融合词向量模块将词向量和历史向量进行融合，得到融合词向量。全连接模块对融合词向量的特征进行组合，组合后的特征进入CRF模块，学习全局特征与标注结果之间的网络影响，即实体之间的依赖关系，例如“O后面肯定是O或者B，不可能是I”，并输出各个词最终的一个标注得分，系统选择一个最高得分的标注作为当前词的最终标注。

基于上述实施例提供的语句的用户意图识别方法，本申请实施例还提供了一种语句的用户意图识别装置，应用于人机交互会话中，人机交互会话中包括多条语句，该装置包括获取单元1001、第一确定单元1002和第二确定单元1003，其中：

获取单元1001，用于从多条语句中获取待分析语句，以及待分析语句对应的至少一条历史语句，至少一条历史语句为在人机交互会话中先于待分析语句出现的语句；

第一确定单元1002，用于根据待分析语句的句向量和至少一条历史语句的句向量确定出待分析语句的历史向量，历史向量中包括至少一条历史语句中与待分析语句相关的信息；

第二确定单元1003，用于根据历史向量确定待分析语句的用户意图。

可选的，第一确定单元1002包括语义相似度确定子单元、位置关系确定子单元和历史向量确定子单元，其中：

可选的，第二确定单元1003包括融合向量确定子单元和用户意图确定子单元，其中：

可选的，融合向量确定子单元具体用于：

上面从模块化功能实体的角度对本申请实施例中的语句的用户意图识别装置进行了描述，本申请实施例还提供了一种用于识别语句的用户意图的设备，下面从硬件处理的角度对本申请实施例中的用于识别语句的用户意图的设备行描述。

图11所示为本申请实施例提供的一种用于识别语句的用户意图的设备，应用于人机交互会话中，人机交互会话中包括多条语句。请参照图11，该设备1100包括处理器1102和存储器1101，其中：

存储器1101，用于存储程序代码，并将程序代码传输给处理器；

处理器1102，用于根据程序代码中的指令执行以下方法：

根据历史向量确定待分析语句的用户意图。

可选的，处理器1102用于根据程序代码中的指令执行以下方法：

根据融合向量确定出待分析语句的用户意图。

将融合向量映射到预设的多个用户意图上；

可选的，处理器1102还用于根据程序代码中的指令执行以下方法：

根据第一分词的融合词向量确定出第一分词的实体类型。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。

所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于设备及系统实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的设备及系统实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述，仅为本申请的一种具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应该以权利要求的保护范围为准。

Claims

1.一种语句的用户意图识别方法，其特征在于，应用于人机交互会话中，所述人机交互会话中包括多条语句，所述方法包括：

从所述多条语句中获取待分析语句，以及所述待分析语句对应的至少一条历史语句，所述至少一条历史语句为在所述人机交互会话中先于所述待分析语句出现的语句；

根据所述待分析语句的句向量和所述至少一条历史语句的句向量确定出所述待分析语句的历史向量，所述历史向量中包括所述至少一条历史语句中与所述待分析语句相关的信息；其中，所述历史向量根据历史语句与待分析语句间的语义相似度，以及历史语句在人机交互会话中与待分析语句间的距离确定；所述历史向量还携带有待分析语句的信息；

根据所述历史向量确定所述待分析语句的用户意图。

2.根据权利要求1所述的方法，其特征在于，所述待分析语句包括多条，所述多条待分析语句为所述多条语句中在交互顺序下的最后多条语句。

3.根据权利要求1所述的方法，其特征在于，所述至少一条历史语句与所述待分析语句间的语句间隔少于预设阈值。

4.根据权利要求1所述的方法，其特征在于，当所述至少一条历史语句包括多条时，所述多条历史语句包括第一历史语句和第二历史语句，所述根据所述待分析语句的句向量和所述至少一条历史语句的句向量确定出所述待分析语句的历史向量，包括：

根据所述待分析语句的句向量、所述第一历史语句的句向量和所述第二历史语句的句向量确定出所述第一历史语句相对于所述待分析语句的语义相似度，以及所述第二历史语句相对于所述待分析语句的语义相似度；

确定出所述第一历史语句和第二历史语句在所述人机交互会话中与所述待分析语句的出现位置关系；

根据所述第一历史语句的语义相似度、第二历史语句的语义相似度、第一历史语句的出现位置关系和第二历史语句的出现位置关系确定出所述待分析语句的历史向量。

5.根据权利要求1-4任意一项所述的方法，其特征在于，所述根据所述历史向量确定所述待分析语句的用户意图，包括：

根据所述历史向量和所述待分析语句的句向量确定出所述待分析语句的融合向量；

根据所述融合向量确定出所述待分析语句的用户意图。

6.根据权利要求5所述的方法，其特征在于，所述根据所述历史向量和所述待分析语句的句向量确定出所述待分析语句的融合向量包括：

对所述历史向量和所述待分析语句的句向量进行加权求和，得到所述待分析语句的融合向量。

7.根据权利要求5所述的方法，其特征在于，所述根据所述融合向量确定出所述待分析语句的用户意图，包括：

将所述融合向量映射到预设的多个用户意图上；

根据在所述多个用户意图上的映射结果，从所述多个用户意图中确定出所述待分析语句的用户意图。

8.根据权利要求1所述的方法，其特征在于，所述待分析语句包括至少一个分词，在根据所述待分析语句的句向量和所述多条历史语句的句向量确定出所述待分析语句的历史向量之后，所述方法还包括：

确定第一分词的词向量，所述第一分词为所述至少一个分词中的一个；

根据所述历史向量和所述第一分词的词向量确定出所述第一分词的融合词向量；

根据所述第一分词的融合词向量确定出所述第一分词的实体类型。

9.根据权利要求8所述的方法，其特征在于，当所述待分析语句包括多个分词时，所述根据所述第一分词的融合词向量确定出所述第一分词的实体类型，包括：

根据所述第一分词的融合词向量、第二分词的融合词向量和预先学习的实体类型依赖关系确定出所述第一分词的实体类型，所述第二分词为所述多个分词中的一个。

10.一种语句的用户意图识别装置，其特征在于，应用于人机交互会话中，所述人机交互会话中包括多条语句，所述装置包括获取单元、第一确定单元和第二确定单元，其中：

所述获取单元，用于从所述多条语句中获取待分析语句，以及所述待分析语句对应的至少一条历史语句，所述至少一条历史语句为在所述人机交互会话中先于所述待分析语句出现的语句；

所述第一确定单元，用于根据所述待分析语句的句向量和所述至少一条历史语句的句向量确定出所述待分析语句的历史向量，所述历史向量中包括所述至少一条历史语句中与所述待分析语句相关的信息；其中，所述历史向量根据历史语句与待分析语句间的语义相似度，以及历史语句在人机交互会话中与待分析语句间的距离确定；所述历史向量还携带有待分析语句的信息；

所述第二确定单元，用于根据所述历史向量确定所述待分析语句的用户意图。

11.一种用于识别语句的用户意图的设备，其特征在于，应用于人机交互会话中，所述人机交互会话中包括多条语句，所述设备包括处理器和存储器，其中：

所述存储器，用于存储程序代码，并将所述程序代码传输给所述处理器；

所述处理器，用于根据所述程序代码中的指令执行以下方法：

根据所述历史向量确定所述待分析语句的用户意图。

12.一种存储介质，其特征在于，所述存储介质用于存储程序代码，所述程序代码用于执行权利要求1至9任意一项所述的语句的用户意图方法。

13.一种包括指令的计算机程序产品，当其在计算机上运行时，使得所述计算机执行权利要求1至9任意一项所述的语句的用户意图识别方法。